日本語用の漢字文字やかな文字、記号類を情報交換で用いるための文字集合を規定する工業規格の一つ。版ごとに、規格名が少しずつ違っている。
第1水準漢字2,965文字、第2水準漢字3,390文字を中心として、ひらがな、カタカナ、各種記号や、ギリシャ文字、キリル文字などの非漢字524字を含め、合計6,879文字(JIS X 0208:1997)が収められている。
いわゆる日本語の文字コードにおいて最も普及しているもので、日本語の文字をコンピュータで扱う際の、最も基本的なものとなっている。従って、JIS X 0208で規定されている文字は、全てのコンピュータで読むことができる。
現在は、旧規格も含めて4版ある。
表中の「タグ」は、TrueTypeフォントにおいて字形を識別するために使われるIDである。
参考までに、JIS X 0212(補助漢字)と、JIS X 0213を併記した。
| 漢字 | 非漢字 | タグ | |||||
|---|---|---|---|---|---|---|---|
| 第1水準 | 第2水準 | 補助漢字 | 第3水準 | 第4水準 | |||
| JIS C 6226-1978 | 2,965字 | 3,384字 | 453字 | jp78 | |||
| JIS C 6226-1983 | 2,965字 | 3,388字 | 524字 | jp83 | |||
| JIS X 0208-1983 | |||||||
| JIS X 0208-1990 | 2,965字 | 3,390字 | 524字 | jp90 | |||
| JIS X 0212-1990 | 5,801字 | 266字 | hojo | ||||
| JIS X 0208:1997 | 2,965字 | 3,390字 | 524字 | ||||
| JIS X 0213:2000 | 2,965字 | 3,390字 | 1,249字 | 2,436字 | 1,183字 | ||
| JIS X 0213:2004 | 2,965字 | 3,390字 | 1,259字 | 2,436字 | 1,183字 | jp04 | |
JIS C 6226-1983(後のJIS X 0208-1983)と、JIS X 0208-1990の二種類が登録されている。
1983年版は、ISO-IR 87として登録されている。
ISO-IR 87のISO/IEC 2022におけるエスケープシーケンスは次のとおり。
1990年版は、ISO-IR 168として登録されている。
ISO-IR 168のISO/IEC 2022におけるエスケープシーケンスは次のとおり。
差は僅かであるので、終端文字はそのままで、更新シーケンス(ESC 2/6 4/0)が追加された。
この文字集合(CCS)を用いた代表的な符号化方法(CES)は、次の通りである。