Character set (文字コード)

文字コードは、コンピューターに文字 (文字、数字、区切り記号、空白文字などを含む) を理解させるための符号化システムです。

各国では個別の言語が使用されているため、日本語の漢字 JIS コード (例えば Shift-JIS, EUC-JP など)、繁体字中国語の Big5、ロシア語の KOI8-R などのように独自の文字コードを開発しました。しかし、全世界の言語に対応するために、次第に Unicode が最も利用される文字コードになりました。

文字コードが誤って使用すると (例えば、Big5 でエンコードされた記事に Unicode を使用すると)、壊れた文字ばかりが表示されることがあり、これは文字化けと呼ばれます。