【文字化けとは】

 意図していなくても意味不明なメールを送ってしまったり受け取ったりすることがあります。ちょっとした注意で防ぐこともできますので、正しい理解が必要です。
 受信したメールやホームページの日本語が一部または全部において正しく読めない(日本語として判別できない)状態を「文字化け」していると表現します。
 問題となるケースには日本語がデコードできない、日本語の文字コードが異なる、機種依存文字が混ざっている場合が考えられます。

 コンピュータは全てのデータをデジタル信号でやりとりします。どの言語で書かれた文章でもすべて0と1の数字(2進数)に置き換えて通信しています。
 日本語の文字も暗号のように2進数に置き換えられているのです。そのため、2進数から正しく日本語に戻せない場合、これがデコードできない状態と言うことになり、文字化けが発生します。
 これは受信するコンピュータに日本語のフォントや表示機能がない場合や、インターネットでメールやホームページなどのデータを中継するサーバーで文字が欠けたりする場合があります。

 次に日本語の各文字について2進数で表現するためのコードが割り当てられています。実際にはこれを短く表記するために16進数(0〜9,A〜F)で表現しています。
 さて、この暗号表ともいうべきコード表が1つではないのです。時代と共にJISコード(ジス:通産省の規定する日本工業規格)やシフトJIS、Unicode(ユニコード)など複数のコード表が存在しています。
 そのためデコードの際にコード表を間違うと文字化けが発生するのです。
 一般的にはシフトJISを使うのですが、通常は各ソフトが自動的にコードを選択して送ったり受信したりしています。ブラウザでは、受信後にコードを切り換えることができます。

 機種依存文字の場合、同じ日本語コードを使っていても、メーカーによってコード表の一部に違いがあるために問題が生じます。
 これは機種依存文字は使わないという原則を守っていれば文字化けは発生しないのです。
 このケースについては次項で詳しく解説します。


戻る