日本語用の漢字文字やかな文字、記号類を情報交換で用いるための文字集合を規定する工業規格の一つ。7ビット及び8ビットの2バイト情報交換用符号化拡張漢字集合。
JIS X 0213は、それまで使われてきたJIS X 0208の後継として作られた仕様である。
JIS漢字表は誕生当初より、「字形そのもの」は定めていない。正字、略字等で字形の差異が僅かな字は原則として同じ文字とし、同じ一つの番号を与えている。これを「包摂」と呼んでいる。
しかし、JIS X 0213制定時に基準の適用を若干ゆるめ、さらに改訂版制定時には文部科学省の諮問機関である国語審議会により「印刷標準字体」の採用が決定されたため、JIS X 0213は、例示字体に印刷標準字体を採用した。
かくして、JIS X 0208との互換性は一部損なわれており、JIS C 6226→JIS X 0208の際の問題が再び発生している。
長く使われたJIS X 0208で規定される6,879文字を拡張し、これと同時に運用可能な規格として作られた。
具体的には、JIS X 0208の第1水準漢字、第2水準漢字の計6,879文字と同時に使える、第3水準漢字1,259字・第4水準漢字2,436字の漢字と、各種の記号を含む非漢字など659字、合計4,354文字(JIS X 0213:2004)、総合計11,233文字が収められている文字集合(CCS)の規格である。
この規格は符号化方法(CES)としてシフトJIS及びEUC-JPを重視しており、シフトJISのJIS X 0208及びEUC-JPのJIS X 0208、JIS X 0212と衝突しない区に文字を配置するように配慮されているため、シフトJISおよびEUC-JP双方のCESにおいて完全に同居することが可能である。
当初はシフトJISの半角カタカナ領域を廃止し、そこを2バイト文字の先頭バイトに割り当てる、更に2バイト文字のコードレンジの最後の値を0xfcから0xfeに拡張、という考え方があり、当初予定されていた文字数は非常に多かったが、互換性などの問題のため最終的には両案とも棄却された。
それでも、第4水準領域がWindowsの外字領域と重複するなどの理由からかMicrosoft Windows 2000やMicrosoft Windows XPでは採用が見送られ、Windows Vistaから対応されることになった。
JIS X 0213には、第一面と第二面の2面が存在する。
第一面は、初版と改訂版で仕様が異なるため、それぞれ別に登録されている。
初版(JIS X 0213:2000)の第一面は、ISO-IR 228として登録されている。
ISO-IR 228のISO/IEC 2022におけるエスケープシーケンスは次のとおり。
改訂版(JIS X 0213:2004)の第一面は、ISO-IR 233として登録されている。
ISO-IR 233のISO/IEC 2022におけるエスケープシーケンスは次のとおり。
初版・改訂版ともに第二面は、ISO-IR 229として登録されている。
ISO-IR 229のISO/IEC 2022におけるエスケープシーケンスは次のとおり。
JIS X 0208で規定される6,879文字を拡張し、これと同時に運用可能な第3水準漢字1,249字、第4水準漢字2,436字、非漢字659字(計4,344字)を含む11,223文字を規定する規格として作られた。
JIS X 0208の漢字表を飲み込んだ目的は、漢字の包摂基準が異なるためである。
例えば、JIS X 0208では「鴎」「鷗」の2字は包摂されており、同じ18区10点で指示される。但し、JIS X 0208の仕様範囲内では、相互を区別する機械的方法は存在しない。
対してJIS X 0213は包摂基準変更により、「鴎」は1面18区10点、「鷗」は1面94区69点となった。包摂範囲内での区別方法がないのは同様だが、事実上、異体字が文字コードのレベルで分割されたことになる。
つまり、JIS X 0208とJIS X 0213では18区10点という符号の指す範囲が異なっているため、JIS X 0208の文字範囲もJIS X 0213として収載されることになった。
JIS X 0213の最初の改訂版である。
JIS X 0213:2000との違いは、主として「印刷標準字体」への対応関係である。
これに加え、2面93区27点に対応するUCSが、U+9B1DからU+9B1Cに変更されている。これは非互換の変更なので注意が必要である。
例示字形の変更は「印刷標準字体」への変更で、いわゆる康熙字典の字形への変更である。JIS規格としては、この変更は包摂基準範囲内だとしているが、JIS C 6226-1978からJIS X 0208-1983への字形変更の混乱を再び呼ぶことが懸念されている。
ここで変更された文字は、次の168字である。1字を除き、第1水準と第2水準の漢字である。
逢芦飴溢茨鰯淫迂厩噂餌襖迦牙廻恢晦蟹葛鞄釜翰翫徽祇汲灸笈
卿饗僅喰櫛屑粂祁隙倦捲牽鍵諺巷梗膏鵠甑叉榊薩鯖錆鮫餐杓灼
酋楯薯藷哨鞘杖蝕訊逗摺撰煎煽穿箭詮噌遡揃遜腿蛸辿樽歎註瀦
捗槌鎚辻挺鄭擢溺兎堵屠賭瀞遁謎灘楢禰牌這秤駁箸叛挽誹樋稗
逼謬豹廟瀕斧蔽瞥蔑篇娩鞭庖蓬鱒迄儲餅籾爺鑓愈猷漣煉簾榔屢
冤叟咬嘲囀徘扁棘橙狡甕甦疼祟竈筵篝腱艘芒虔蜃蠅訝靄靱騙鴉
また、左の漢字に対する右の異体字10字が新規に追加されている。
| 従来の字形 | 追加された字形 | ||||
|---|---|---|---|---|---|
| 字 | JIS X 0213 | UCS | 字 | JIS X 0213 | UCS |
| 倶 | 1-22-70 | U+5036 | 俱 | 1-14-1 | U+4FF1 |
| 剥 | 1-39-77 | U+5265 | 剝 | 1-15-94 | U+525D |
| 叱 | 1-28-24 | U+53F1 | 𠮟 | 1-47-52 | U+20B9F |
| 呑 | 1-38-61 | U+5451 | 吞 | 1-47-94 | U+541E |
| 嘘 | 1-17-19 | U+5618 | 噓 | 1-84-7 | U+5653 |
| 妍 | 1-53-11 | U+598D | 姸 | 1-94-90 | U+59F8 |
| 屏 | 1-54-2 | U+5C4F | 屛 | 1-94-91 | U+5C5B |
| 并 | 1-54-85 | U+5E76 | 幷 | 1-94-92 | U+5E77 |
| 痩 | 1-33-73 | U+75E9 | 瘦 | 1-94-93 | U+7626 |
| 繋 | 1-23-50 | U+7E4B | 繫 | 1-94-94 | U+7E6B |
瘦・繫の2字はJIS X 0212に存在しながら、JIS X 0213にはなかった字である。
叱に対する異体字𠮟(U+20B9F)はCJK Ideograph Extension Bにある文字で、対応する環境でないと正常に表示できない。