2バイト文字

読み:にバイトもじ
外語:double byte character
品詞:名詞

英語のASCII文字が1バイトであるのに対して、日本語などの漢字文字や仮名文字、ハングルのように2バイトで構成される文字のこと。

日本語のパソコンで多く使われているシフトJISというエンコードでは、英数文字と一部のカナが1バイト、漢字やひらがな・カタカナが2バイトになっているため、日本語文字を単に2バイト文字と呼ばれた。

2バイト文字は1バイト文字の倍幅で表示されるところから、2バイト文字を全角、1バイト文字をその半分の半角とも呼ばれた。これは、シフトJIS自体がそのように設計されたためであり、バイト数と半角全角が一致したのは偶然ではない。

しかし、この表現は当然エンコードに依存しており、今ではもはや適切な表現とは言えない。実際にUnicodeUTF-16ではほぼ全ての文字が1バイト(16ビット)で、UTF-8では漢字やかなは概ね3バイトで表現されている。

そして、これは使用するフォントに依存する。プロポーショナルフォントを使用した場合、文字により幅が異なってくるので、バイト数と文字の幅は必ずしも一致しない。