Google
A revolving earth (earthani.gif--64x64) Beaverland Net
ビーバーランド・ネット
 

 

 

Beaverland HTML Made Easy! logo (html01.gif--140x160)

 

JavaScript Made Easy! logo (javascrt.gif--140x360)

 

Revised brand-new Japanese ancient history logo (jhist02.gif--140x300)

 

Beaverland Net English slangs not found in a dictionary logo (slangs.gif--140x260)

 

Beaverland Japonica banner (japonic3.gif--140x360)

 

Study in Canada Home Page logo (homepg.gif--160x160)

  1. 出願
  2. 学費・生活費
  3. ビザ
  4. 渡航準備
  5. バンク–バ–
    に留学しよう!
  6. BC州の教育
  7. カナダの教育
  8. 私立高校願書
    の一例 (生徒用)
  9. 私立高校願書
    の一例 (両親用)
  10. 大学入学案内
  11. 私立高校
    入学案内
  12. 全寮制私立高校
    入学案内
  13. 全寮制私立高校
    授業料
  14. 公立高校
    入学案内
  15. バンク–バ–
    公立高校
    2002 / 2003年度
    入学要項
    及び授業料
  16. 語学専門学校
    授業料一覧表
  17. バンク–バ–案内
  18. 御意見・御質問コ–ナ–
  19. 帰国子女の受け入れ
  20. BC州の官公庁
    市町村・大学・高校へのリンク
  21. 留学生のための銀行利用法
  22. 高校生1000人に留学補助

onstore.gif (140x93)

beavbook.gif (120x160)

beavcomp.gif (120x160)

beavmovi.gif (120x160)

beavgift.gif (120x160)

beavtrav.gif (120x160)

 
漢字コードって何?
September 28, 2003

 

アスキー・コード表

 

上位4ビット (16進数の上位の桁)
0 1 2 3 4 5 6 7






 





0 NUL DLE SP 0@ P ` p
1 SOH DC1 ! 1 A Q a q
2 STX DC2 " 2 B R b r
3 ETX DC3 # 3 C S c s
4 EOT DC4 $ 4 D T d t
5 ENQ NAK % 5 E U e u
6 ACK SYN & 6 F V f v
7 BEL ETB ' 7 G W g w
8 BS CAN ( 8 H X h x
9 HT EM ) 9 I Y i y
A NL SUB * : J Z j z
B VT ESC + ; K [ k {
C NP FS , < L \ l |
D CR GS - = M ] m }
E SO RS . > N ^ n ~
F SI US / ? O _ o DEL

 

文字コードとは?

コンピュータの内部では文字を数値として扱います。例えば、上のアスキー・コード表によると、'A' という文字には16進法の上位の桁の4、それに下位の桁の1が割り当てられています。つまり16進法で41と表されます。 これを10進法に直すと、4x16+1=65 となり、65と言うことになります。

小文字の'b'には上位の桁の6、それに下位の桁の2が割り当てられています。つまり16進法で62と表されます。 これを10進法に直すと、6x16+2=98 となり、98という値を得ます。

なぜ16進法で表記するかというと、コンピューターが2進法で計算している事と関係しています。つまり、1と0だけを使って計算しているわけです。 4ビット(1バイトの半分)で表現できる最大値が16になります。人間にとっては2進法よりも16進法のほうが便利なので、16進法を採用しているわけです。

上の表は文字をコンピューターに分かるようにコードとして表現する一つの方法で、アスキーと呼ばれているコードです。 英語では ASCII(American Standard Code for Infomation Interchange) と書かれます。 アルファベットや数字などのいわゆる半角文字を1バイト(8ビット)で表す方法です。

アスキーの他に、文字をコード化する方法として次のようなものがあります。

  • JISコード ... 電子メール転送などに使用
  • シフトJIS ... 主に日本語版のWindowsやMacintoshで使用
  • EUC ... 主にUNIXで使用
  • Unicode ... 文字コードを世界的に統一しようとと言う試みで開発されたコードですが、日本ではまだ普及していません。

 

漢字コードとは?

アスキー・コードで漢字が表現できるだろうか?
これは理論的に言って無理なんですね。1バイトでは、上の表を見ても分かるように、表現できる文字の数が少なすぎるわけです。 現在使われている表は128文字を表しています。まだ書き込まれていないところをコードで埋めたとしても、最大256文字までです。

つまり、日本語で使われている当用漢字だけでも、1800以上ありますから上の表には入りきりません。最低でも2バイト(16ビット)を必要とします。 この、漢字を含む文字をコード化するのに必要な多バイト系のコードを漢字コードと呼びます。 実際にはひらかな、カタカナ、全角英数字も含まれるので漢字コードという呼び名は適切ではありません。

いずれにしても、漢字コードと言った場合には多バイト系のコードを用いることになり、使い方やその構成が複雑になります。

 

JIS漢字コードとは?

日本の文字コード規格は、日本規格協会が選定し、 日本工業規格(いわゆるJIS規格)の一つとして公布されました。

正式には「7ビット及び8ビットの2バイト情報交換用符号化漢字集合」と呼ばれています。 最初は、「JIS C 6226」 として制定されましたが、JISの情報部門の新設に伴い、「JIS X 0208」 に規格番号が移動しました。

1978年に公布され、最初は6,802字の文字表で出発しました。これ以降のJIS漢字コードの母胎となっています。 全ての文字に「区点番号」が振られており、俗に「旧JIS漢字」と呼ばれています。

それから数度改定が行われ、そのつど文字が増えています。

 

シフトJIS漢字コードとは?

MS-DOS、Windows、Macintoshなどで用いられている漢字コードです。マイクロソフト社が提唱したもので、「MS漢字コード」とも呼ばれています。

MS-DOSでは0xA1~0xDFがすでに半角カタカナの領域として使用されていたため、この領域、およびDELコードに対応する0x7Fの領域を避けるように、 JISコードを巧みにシフトさせたものになっています。このような理由で“シフト”JISと呼ばれているわけです。

 

EUC漢字コードとは?

Extended Unix Code の略で、UNIX系ワークステーションで広く用いられている形式です。 UI(Unix International)が SVR4 のリリースと同時に発表した MNLS(Multi-National Language Supplement)が定めました。

 

Unicode漢字コードとは?

日本語の漢字も中国語の漢字も区別なく、一括に扱ってしまおうというものです。ISO10646などで定義されています。 ただし、従来のJISコードとの互換性が無く、変換するには、すべての漢字コードを含むかなり大きな変換表が必要になります。

ユニコードにはまだいろいろな問題はありますが、世界的レベルで、文字コードを統一すると言う理念で開発されたものです。 従って、ゆくゆくは、ユニコードが他のコードにとって変わってゆくだろうと思われます。しかし、現在のところ、日本ではあまり普及していません。

ユニコードについてもっと詳しく知りたい場合には、このページ  (ユニコードって何?) を読んでください。

 

Related Links

Betty (bettysm3.gif--111x357)

筆者紹介
Akira Kato (kato.jpg--180x135)
  • 日本とカナダの大学で教育を受ける。
  • 横浜にある大手の電器メーカーでコンピューターのソフトウエアの開発に従事する。
  • カナダのノースウエスト隼州政府・財務省に勤務する。
  • バンクーバーのランガラ・カレッジおよびサレーのクワンテレン・カレッジで講師を勤める。
  • ヨーロッパ、東南アジア、中国、北米を幅広く旅行する。
  • 現在、経営コンサルタント、フリーランス・ライターとして活躍している。



御意見・御感想
とても良い 良い まあまあ 良くない 最低

お名前:
Email アドレス:
御感想を書いて下さい。



Amazon Electronics Bargain Corner (amazbagn.gif--550x280)

Laughing Matters, but true stories

笑ってください、
でもこれ嘘のようなホントの話し。

Laughing matters, but true stories logo (mandog.gif--400x275)
inserted by FC2 system