文字コードの概要

読み: もじこーど

文字コードとは、コンピューターがすべての文章を処理する際に参照する、個々の文字に割り当てられた表現のことである。

コンピューター上では、ソフトウェア文字コードを読み取り、解釈することによって文字・文章を画面に表示できるようにしている。アルファベット表記の言語圏においては、文字数も少ないため1バイトの文字コードで表現することが可能であったが、日本語や中国語などの漢字を使用する言語や韓国語などのハングル文字を使用する言語では、文字数が多いため1バイトの文字コードを2つ組み合わせて1文字を表現する2バイト文字コードを使用することになる。1バイト文字コードとしてはASCII文字コードが世界標準とされているが、2バイト文字コードは各国で独自の文字コードがとられている場合が多い。

日本の漢字コードには、JISコードやシフトJISコードが使われている。ローカルな文字コードは互換性に脆く、文字コードを解釈できないコンピューター上では文字化けが発生してしまう。そのため、世界各国で使用する文字コードを共通にすべく考案されたのがUnicodeである。

2014年03月05日 更新


最近見た用語