視点

もう「外字」で困ることはない

2012/01/26 16:41

週刊BCN 2012年01月23日vol.1416掲載

 文字をコンピュータで扱うためには、それぞれの文字に異なるコード番号を割り当てると同時に、その文字を表示・印刷するためのフォントを必要とする。コンピュータ間でデータを交換することを考えると、この文字コードは標準化されていることが望ましい。このため日本工業規格(JIS)で漢字コードが決められている。このJIS漢字コードでは、常用漢字2136文字を含む約1万の漢字がコード化されている。「外字(がいじ)」とは、こうした標準文字セットに含まれていない漢字をいう。外字は姓名や地名に多い。例えば、「わたなべ」の「べ」は常用漢字では「辺」だが、JIS漢字コードでは「邉」と「邊」が登録されている。これ以外にも数多くの「べ」が存在する。「さいとう」の「さい」や「たかはし」の「たか」も外字が多い。

 人の姓名を扱う自治体の住民記録システムや法務省所管の戸籍では、無数にある外字をコード化せざるをえない。かつては、自治体ごとに、あるいはシステムごとに、必要となった外字に未使用の適当なコードを割り振っていた。当然のことながら、この方法では電子化に余計なコストがかかるし、システム間でデータを交換するとその外字が表示されなかったり、別の漢字になってしまったりする。これが「外字問題」である。

 最近、ようやくこの外字問題解消の道筋がみえてきた。10年ほど前、地方自治体の住民記録システムに接続する「住民基本台帳ネットワークシステム」構築のために、比較的よく使われる外字がコード化され、「住民基本台帳ネットワーク統一文字」(約2万1000字)に組み入れられた。さらに2004年には、法務省によって、戸籍のオンライン化のために「戸籍統一文字」(約5万6000字)が整備された。そして昨年、IPAの国際標準推進センターが、戸籍統一文字を含む5万8712文字について、国際標準に準拠したコードと文字フォントを公開したのである。

 この行政機関向けの文字情報基盤を利用すれば、国と地方自治体の行政機関はもちろん、民間企業も情報システムをシームレスに連携させることが可能となる。また、一度コード化すれば、書き間違いで生まれてしまった異体字(実際は誤字)を正字に修正することも容易になる。もちろん、既存システムにすぐに組み込まれることにはならないが、30年あまりIT業界を悩ませてきた問題が解決に向けて動き出すことは間違いない。実に朗報である。
  • 1

関連記事

ダイナコムウェア、法務省指定の人名用漢字をすべて収録した外字フォントセット

IPA、OSSを自治体の実務現場に導入する実証実験、松江市など5件を採択

<脱レガシーの道標 IT新改革戦略を読む>【第3部】連載第9回 自治体で脱PCの動きが加速