KAYO NEWS
華陽ニュース
不定期配信 マウスちゃんとメモリ主任のIT1年生45
情報の重要性が増す昨今、弊社では情報セキュリティについて、その意義や情報を共有する取り組みを続けています。
担当チームが社内向けにまとめた資料などを基に、軽い読み物を不定期でお届けできればと思いますので、ご笑覧頂ければ幸いでございます。
「うーん・・・」
「どうしたんですか、イーさん?」
パソコンの画面を見ながらうなるイーさんに、マウスちゃんが声を掛けます。
「昔の営業の先輩が残してくれたお客様に関する覚書を開いたんだけど、文字化けしてるところがあって。」
「テキストファイルですね。」
「お客様から『前にやってる仕事だから前回通りで』って頼まれたんだけど、肝心なところが読めないんだよね。」
「ちなみに手配の締め切りはいつまでなんですか?」
「今日の午前中。」
「今、11時ですけど・・・」
「・・・・・・」
「それならいったんこちらで開いて、ここを切り替えてはどうでしょうか?」
困った2人が駆け込んだのは、いつもの通り、メモリ主任のところ。期待に違わず、あっさりと解決してくれます。
「読めるようになった!有難うございます、メモリ主任。」
「いえ。お役に立てて何よりです。」
「テキストファイルって、普通に開けばちゃんと読めるものだと思っていました。違うんですね。」
「昔のものだと、テキストの保存形式が今のものとは違う場合があるのですよ。」
「形式?保存するアプリは同じなのに、形式が違う場合があるんですか?」
「はい。・・・お2人は、『文字コード』という言葉を聞かれたことはありますか?」
「文字コード?」
「ご存じの通り、コンピューターはすべてを『0』と『1』という数字の並びとして処理します。例えばキーボードなどで『あ』を入力すると、『あ、という文字を表示させなさい』という命令文が『0』『1』の数値の列としてコンピューターに伝えられて処理され、『あ』という文字が表示される、という流れです。」
「なるほど。」
「この処理を行うためには、『あ』『い』といった、一文字一文字に対応した数値が必要になります。この、文字ごとに割り当てられた数値のことを『文字コード』と呼ぶのですよ。」
「例えば、「01」なら『あ』、「02」・・・じゃなくて「10」なら『い』っていう感じですか?」
「端的に言うとそうですね。ただ、この文字コードですが、全てのシステムで同じというわけではありません。」
「え?」
「例えば、アルファベットや数字を表すのに適した、基本的な文字コードの一つに『ASCII』というものがあります。文字を表す7ビットとチェックのための1ビットで構成された8ビット、つまり1バイトで構成される、初期につくられた文字コードなのですが、欠点があるのはわかりますか?」
「欠点、ですか?」
「私、分かります!2の7乗、つまり、128個の文字にしか対応していないってことですね!」
「その通りです。例えば、常用漢字だけでも2,000字程度はある日本語には向いていない文字コードというわけです。そのため、日本語に対応した『S‐JIS』と呼ばれる文字コードがASCIIをもとにつくられました。他にも、IBM社がつくった『EBCDIC』、UNIXで使われる『EUC』など、さまざまなシステムや言語に対応する文字コードがそれぞれにつくられ、システムごとに文字コードを切り替えなくてはいけないという事態が生じることになったのです。」
「えっと、あるシステムでは「01」が『あ』だけど、別のシステムでは「01」に『A』が割り当てられていて、ここを切り替えてやらないと『あ』って表示したいのに『A』って表示される、つまり、文字化けが起こる、という感じなんですね。」
「文字コードがバラバラだと面倒だな~って思った人はいなかったんですか?」
「そう思った方が多かったのでしょうね。世界統一の文字コードをつくろうという機運が高まって、コンピューターメーカーを中心とする業界団体が策定したのが『Unicode』という文字コードです。同時期に同じことを考えていたISOの規格と統合されて『UCS』という文字集合になり、さらにそれをコンピューターが使える形に符号化する方式として『UTF』という規定が標準化されました。UTFにもいくつか方式があるのですが、そのなかでも『UTF‐8』という方式が一般的です。ただ、今回のファイルは古いため、別の形式で保存されていたようですね。」
「あれ?でも今回はファイルが古いだけで、先輩が作成された時も、僕が開いた時も、同じソフトを使っていると思うんですが。それでも形式が違うんですか?」
「先ほど説明した『S‐JIS』に近いもので『ANSI』という文字コードがあるのですが、OSやそのバージョンによっては、テキストエディターの最初の設定がこの『ANSI』を採用している場合があるのですよ。おそらくこのテキストファイルがつくられた環境がそうなっていたのではないでしょうか。」
環境依存文字には特に注意した方が良いですよ、という言葉を背に、営業部の席に戻った2人。
「このファイル、そんなに古いものなんですか?」
とマウスちゃんがイーさんに聞きます。
「少なくとも10年以上は前。だって、これつくったの、エスさんだもん。」
「あの、わが社の伝説の営業パーソン・・・!まだテキストファイルが残してあるんですね。」
「エスさんは本当にすごい方だったから、情報が古びてないんだよね。」
「10年以上後になっても役立つ情報ってすごいですね。・・・あ、じゃあ、イーさんも環境依存文字には注意しないと、ですね。」
「どうして?」
「もちろん、10年後の後輩がイーさんのファイルをちゃんと読めるようにです。そのころにはイーさんが『伝説の営業パーソン』かもしれないじゃないですか。」
「それはないよ・・・・・・」
苦笑いしながら仕事に戻るイーさんを見ながら、そんなこともないと思うんだけどな、という言葉を飲み込むマウスちゃんなのでした。