ユニコードを説明するには、まずエンコーディングについて分かっていなければならないのですが、このことについては、すでに書きました。
まだ読んでいないのでしたら、簡潔に書きましたから、このリンク(そもそも、エンコーディングって何?)をクリックして見てください。新しいページが開きます。
このページに戻るには、新しいページをクローズしてください。
簡単に言うと、エンコーディングは、文字をコンピューター画面に表示するためにコード化することです。しかしコード化するにも、いろいろな方法があるわけで、暗号を作るのと同じように、ひと通りではありません。
ユニコードは、何百とあるそのコード化方法の一つというわけです。たとえば
『名』
という文字はユニコードで何と表されるのだろうか?それを知りたい場合には、あなたが使っているお気に入りのワープロを使えばすぐに分かります。
まず、マウスで画面上の文字を選びます。上のピクチャーで
で示された『名』をピックアップします。
そのつぎにで示されたLをクリックします。
そうすると上に示したようなインフォメーション・ボックスが飛び出します。
『名』はユニコードで540D 、Shift-JISで 96BC 、JISコードで 4C3Eというように表されるわけです。ところで、これらのコードは16進法で書かれるのが普通です。
わたしのワープロには、上のようなボタンはありませんが。。。
それはお気の毒です。お金を払って買ったとしたら、なおのことお気の毒です。
このワープロは無料で誰でも使えます。もちろん使用期限にも限りはありません。
“JWPce 1.42” Siteにアクセスすると、プログラムをダウンロードすることができます。
すぐにでも使うことができます。日本人が作ったのではありませんが、いいワープロです。
でも、どうしてユニコードなの?
なぜコードを知る必要があるの?
ユニコードを知っていると、とても重宝します。たとえば、上に書き込んだ丸に1、丸に2、それと虫めがねは、ユニコード番号を知っていれば、簡単に、ページへ書き入れることができます。その部分を下に示しました。
上のピクチャーで
<span style="font-family:wingdings;font-size:20pt;"></span>で示された『名』をピックアップします。
そのつぎに<span style="font-family:wingdings;font-size:20pt;">‚</span>で示された<span
style="font-family:webdings;font-size:25pt;">L</span>をクリックします。
どうしたら特殊な文字の
コードが分るの?
残念ながら上のワープロでは、一部の特殊な文字を除いて、ここに示した特別文字は捜し出せません。
上に示した特殊文字は、ウィンドーズのキャラクター・マップから探し出したものです。
キャラクター・マップはアクセサリーの中のシステムズ・トゥールの中に入っています。とても便利で、コードを書くのが面倒であれば、コピーボタンを押すと、クリップボードへコピーすることができ、それを、例えばグラフィクス・プログラムを開いて、そこへ貼り付けることもできます。しかしプログラムがクリップボードへアクセスできなければ、この機能は使えません。
この機能を持ったエディターを使えば、いちいちコードを書かずに、ウェブページの中へ貼り付けることもできます。ここで使っているワープロは、残念ながら、そういう機能を持っていません。そういう場合には、上に示したように、コードを書き込まねばなりません。ピクチャーのいちばん下のところに、ユニコードで表したコードが表示されます。
0x81の初めの0xは16進法であることを示しています。10進法で書くと、上に示したコードは次のようになります。
上のピクチャーで
<span style="font-family:wingdings;font-size:20pt;"></span>で示された『名』をピックアップします。
そのつぎに<span style="font-family:wingdings;font-size:20pt;">‚</span>で示された<span
style="font-family:webdings;font-size:25pt;">L</span>をクリックします。
&#はHTML(HyperText Markup Language)では、キャラクター・エンティティー(Character Entity)、つまり、ブラウザーに文字であることを教えるための記号です。
wingdingsというのはフォント名です。フォントって何?とよく分らない場合は、このリンク(エンコーディングって何?)をクリックすると、説明とフォントのいくつかの例を示す所へ連れて行ってくれます。新しいページが開きますから、戻るには、そのページを閉じてください。
虫めがねの例を次に示します。
要するに、他のエンコーディングと比べると、ユニコードには上の例に示したような使い方ができるわけで、有用価値があるというわけです。
漢字を英語の文章の中に挿入する時など非常に便利です。ただし、漢字を表現するフォントを持っていない人には、見ることができません。
その場合、代りに空白の正方形が現われます。同じ理由で、wingdingsやwebdingsのフォントが付いていなければ、
上に示したような特殊文字を見ることができません。その場合には、それに相当する英数字が現われます。
しかし、もともとユニコードというのは、上に述べたような便利さのために考え出されたのではなく、
実は『文字化け』を解消するために作られた比較的新しい規格です。1993年に発売されたWindows NT 3.1に採用されました。
そんなわけで、新しいとはいえ、できてから10年程になるわけです。
従来は、それぞれの言語に特有なエンコーディングがほとんどでした。それで、同じコードを他の言語で使った場合には、
文字化けが起こってしまうわけです。言語の違いによって文字化けを防ぐために、
アルファベットから漢字まで世界中の文字をカバーしたコード体系を作りあげれば、
文字化けが無くなるだろうという発想で考え出されたのがユニコードです。
もちろんコードには限りがありますから、日本の漢字と中国の漢字と韓国の漢字の中で、同じものは1個のコードで済ますというようなことをしたために、それぞれの国から、「意味が違う漢字を一緒にするな!」とクレームが出ていたり、
また、ユニコードから洩れた文字は一体どうするのか?差別じゃないか!というような
批判も出ており、まだ様々な問題があります。
しかし、アイデアそのものは、的を得ているので徐々に浸透しています。おそらく、21世紀はユニコードが主導的な位置を占めることになるでしょう。ただし、まだまだ日本では普及が遅れているようです。そのため、メールを送信する時に、ユニコードを使うと、ユニコードを使っていない相手には文字化けのメールが届くことになります。
文字化けを無くすためのユニコードで,、文字化けが起こるということが、実は、北米と日本のメールのやり取りで、かなり起きているようです。
実際、私がエンコーディングを書き始めたのも、この文字化けが
きっかけでした。ユニコードにちゃんと対応しているオペレーテンィグ・システムはまだそう多くはありません。Windows NT、WINDOWS 2000、 WINDOWS XTぐらいではないでしょうか。そういうわけですから、ユニコードを使う時には、相手も使っていることを確かめた方がよいかもしれません。