| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
漢字コードって何?
by Akira Kato
September 28, 2003
アスキー・コード表
文字コードとは? コンピュータの内部では文字を数値として扱います。例えば、上のアスキー・コード表によると、'A' という文字には16進法の上位の桁の4、それに下位の桁の1が割り当てられています。つまり16進法で41と表されます。 これを10進法に直すと、4x16+1=65 となり、65と言うことになります。 小文字の'b'には上位の桁の6、それに下位の桁の2が割り当てられています。つまり16進法で62と表されます。 これを10進法に直すと、6x16+2=98 となり、98という値を得ます。 なぜ16進法で表記するかというと、コンピューターが2進法で計算している事と関係しています。つまり、1と0だけを使って計算しているわけです。 4ビット(1バイトの半分)で表現できる最大値が16になります。人間にとっては2進法よりも16進法のほうが便利なので、16進法を採用しているわけです。 上の表は文字をコンピューターに分かるようにコードとして表現する一つの方法で、アスキーと呼ばれているコードです。 英語では ASCII(American Standard Code for Infomation Interchange) と書かれます。 アルファベットや数字などのいわゆる半角文字を1バイト(8ビット)で表す方法です。 アスキーの他に、文字をコード化する方法として次のようなものがあります。
漢字コードとは? アスキー・コードで漢字が表現できるだろうか? つまり、日本語で使われている当用漢字だけでも、1800以上ありますから上の表には入りきりません。最低でも2バイト(16ビット)を必要とします。 この、漢字を含む文字をコード化するのに必要な多バイト系のコードを漢字コードと呼びます。 実際にはひらかな、カタカナ、全角英数字も含まれるので漢字コードという呼び名は適切ではありません。 いずれにしても、漢字コードと言った場合には多バイト系のコードを用いることになり、使い方やその構成が複雑になります。
JIS漢字コードとは? 日本の文字コード規格は、日本規格協会が選定し、 日本工業規格(いわゆるJIS規格)の一つとして公布されました。 正式には「7ビット及び8ビットの2バイト情報交換用符号化漢字集合」と呼ばれています。 最初は、「JIS C 6226」 として制定されましたが、JISの情報部門の新設に伴い、「JIS X 0208」 に規格番号が移動しました。 1978年に公布され、最初は6,802字の文字表で出発しました。これ以降のJIS漢字コードの母胎となっています。 全ての文字に「区点番号」が振られており、俗に「旧JIS漢字」と呼ばれています。 それから数度改定が行われ、そのつど文字が増えています。
シフトJIS漢字コードとは? MS-DOS、Windows、Macintoshなどで用いられている漢字コードです。マイクロソフト社が提唱したもので、「MS漢字コード」とも呼ばれています。 MS-DOSでは0xA1~0xDFがすでに半角カタカナの領域として使用されていたため、この領域、およびDELコードに対応する0x7Fの領域を避けるように、 JISコードを巧みにシフトさせたものになっています。このような理由で“シフト”JISと呼ばれているわけです。
EUC漢字コードとは? Extended Unix Code の略で、UNIX系ワークステーションで広く用いられている形式です。 UI(Unix International)が SVR4 のリリースと同時に発表した MNLS(Multi-National Language Supplement)が定めました。
Unicode漢字コードとは? 日本語の漢字も中国語の漢字も区別なく、一括に扱ってしまおうというものです。ISO10646などで定義されています。 ただし、従来のJISコードとの互換性が無く、変換するには、すべての漢字コードを含むかなり大きな変換表が必要になります。 ユニコードにはまだいろいろな問題はありますが、世界的レベルで、文字コードを統一すると言う理念で開発されたものです。 従って、ゆくゆくは、ユニコードが他のコードにとって変わってゆくだろうと思われます。しかし、現在のところ、日本ではあまり普及していません。 ユニコードについてもっと詳しく知りたい場合には、このページ (ユニコードって何?) を読んでください。
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||