ASCII

読み:アスキー
外語:ASCII: American Standard Code for Information Interchange 英語 , Aski/o エスペラント
発音:ǽski 英語
品詞:固有名詞

英語用として広く使われている文字コード。コンピューターにおいてはASCIIおよびこの上位互換が最も良く使われている。

目次

1963(昭和38)年6月17日に、American Standards Association(ASA、後のANSI)により策定された「ASA X3.4-1963」を起源とする。この符号は英子文字がない、制御文字が違うなど現在のものとは趣を異にする仕様である。

後に「USAS X3.4-1967」に改訂され、現行仕様とほぼ同等となった。

翌年に「ANSI X3.4-1968」として僅かに改訂され、この1968が現在の世界的な標準となっている。

ASCIIはその後「ANSI X3.4-1986」となり、更に「ANSI INCITS 4-1986」と規格番号が変更されている。

集合

ASCIIは7ビットの文字集合である。この中に大小のラテン文字や数字、記号類、そして制御文字が収録されており、ASCIIは「情報交換用米国標準符号」という意味を持っている。

この仕様は広く普及し、国際標準ISO/IEC 646(当初はISO 646)の元となった。

更に、8ビットの文字集合であるISO/IEC 8859(当初はISO 8859)はASCIIの仕様を維持し、ASCIIでは使用されていない文字番号128番以降に新たな文字を追加した集合として規定され、ヨーロッパなどラテン文字圏を中心に広く使われるようになった。西欧ではこのうち、ISO-8859-1が一般化している。

また、Unicodeも、文字番号0から127まではASCIIと全く同じに作られている。文字番号128から255まではISO-8859-1と全く同じで、西欧の処理系には都合良く設計されている。

CCS/CES

当時は、文字集合(CCS)と符号化方法(CES)の区別がなかった。

ASCIIにおいては、文字集合の文字番号がそのまま符号として用いられる。

ASCIIの符号範囲は、次のようになっている。

符号範囲(16進)内容
0x00‐0x1f制御文字
0x20空白
0x21‐0x7e図形文字
0x7f制御文字

ASCIIの符号名としては、「US-ASCII」がよく使われている。

制御文字集合

ASCIIには、全部で33文字の制御文字が存在する。

制御文字は画面に表示したり印字したりするための文字ではなく、プリンターやモニターに何らかの制御を与えるために用意されたものである。

この仕様も現在のような高性能なコンピューターではなく当時の状況を色濃く反映しているのが特徴で、特にデータ記録に使われた紙テープ(パンチテープ)の影響が垣間見える。

文字番号127は2進数で1111111で、DEL(Delete、削除)の文字として使われる。これは元々、その場所のデータが消去されていることを意味した。紙テープは穴を空けてデータを記録するが、穴は空けるだけで埋めることができない(つまり上書きが出来ない)ので、7桁の全桁に穴を空けてデータの削除とした。

同様に文字番号0は2進数で0000000で、NUL(Null、空)の文字として使われる。これも紙テープにおいて、情報が無い=空を意味するのが由来である。また同時に、DELの場合と同様だが逆に、1を0にすることで情報を削除するような機構にも対応可能なようになっている。

それ以外は任意で決められたと見られるが、結果として先頭の0x00‐0x1fが制御文字の範囲となった。これは現在、ISO-646 C0制御コードとして、制御コードの代表となっている。

図形文字集合

ASCIIには、全部で95文字の図形文字(空白を含む)が存在する。

基本的な記号類に加え、アラビア数字、ラテンアルファベットの大文字と小文字が収録されている。

現在使われているパーソナルコンピューター用のキーボードでは、このASCIIにある図形文字は何らかの方法で直接入力可能なように設計されている。

制御文字集合も、図形文字集合のうち@から始まる32文字(0x40‐0x5f)をCtrlキーと共に押すことで64(0x40)を減じた制御文字を入力可能にしている実装が多い(実装依存)。そしてこれを、"^"を付けて記述する習慣がある(例: 0x00なら、^@)。

ASCII文字集合

 上位3ビット
0-1-2-3-4-5-6-7-
-0NULDLESPC0@P`p
-1SOHDC1!1AQaq
-2STXDC2"2BRbr
-3ETXDC3#3CScs
-4EOTDC4$4DTdt
-5ENQNAK%5EUeu
-6ACKSYN&6FVfv
-7BELETB'7GWgw
-8BSCAN(8HXhx
-9HTEM)9IYiy
-ALFSUB*:JZjz
-BVTESC+;K[k{
-CFFFS,<L\l|
-DCRGS-=M]m}
-ESORS.>N^n~
-FSIUS/?O_oDEL

日本語のJIS X 0201環境では0x5c(5/12)は円マークが表示されるが、実際のASCIIではバックスラッシュ(\)である。

用語の所属
文字コード
関連する用語
US-ASCII
ISO/IEC 646
JIS X 0201
ISO-8859-1
Unicode
AA (アート)
ASCIIZ

コメントなどを投稿するフォームは、日本語対応時のみ表示されます


KisoDic通信用語の基礎知識検索システム WDIC Explorer Version 7.04a (27-May-2022)
Search System : Copyright © Mirai corporation
Dictionary : Copyright © WDIC Creators club