JISCII

JIS X 0201

[3] ISO/IEC646の版であるラテン文字用図形文字集合と、 JIS 独自の片仮名用図形文字集合が定義されている。

本項は歴史的事項を説明しています。本項の内容の一部または全部は、現在の状況とは異なるかもしれません。

(なお本項の内容の一部または全部は、互換性または歴史的連続性のために現在も有効な場合もあります。しかし新たに利用することは避けるべきです。)

目次

  1. ラテン文字用図形文字集合
    1. 怪しい文字の名前
  2. 片仮名用図形文字集合
  3. 符号化表現
    1. 符号拡張法
  4. 文脈
  5. コードページ
  6. 点字
  7. 独自の拡張
  8. 比較
  9. 歴史
  10. メモ

ラテン文字用図形文字集合#

[6] ラテン文字用図形文字集合は、 ISO/IEC 646の版です。

[20] 円問題

[21] JIS X 0201 自身以外の利用: JIS X 0208, JIS X 0213, 各種シフトJIS, 各種ISO-2022-JP/7ビットJIS一族

怪しい文字の名前#

片仮名用図形文字集合#

[7] 片仮名用図形文字集合は、 片仮名文字集合です。

[8] 半角文字で実装されることが多く、俗に半角カナと呼ばれました。

[10] JIS X 0208:1997 附属書5表1, JIS X 0213:2000 附属書5表1 に JIS X 0201 の片仮名用図形文字集合の代替名称 の規定があります。 シフトJISに関する定義に関係する規定があります。 代替名称, シフトJIS

[11] Very old fj.kanji discussion 573/622, , https://ie.u-ryukyu.ac.jp/~kono/fj/fj.kanji/573.html#start

[22] JIS X 0201 自身以外の利用: JIS X 0208, JIS X 0213, 各種シフトJIS, 各種日本語EUC, 各種ISO-2022-JP変種

[23] Unicode には符号位置順そのままで半角片仮名として収録されている。

[25] 終端バイトOCR-K にも流用されています。

[33] ISO-IR 13 の登録内容は JIS X 0201:1997 と微妙に違います。 当時の JIS X 0201 はどうだったのでしょう?

[41] 23_2.pdf, https://www.jstage.jst.go.jp/article/johokanri/23/1/23_2/_pdf#page=5

[42] >>41 の濁点も ISO-IR と同じような字形。 .になっている。

[43] 字形問題はOCRフォントも参照。

[45] T.52JIS X 0201 を参照せず、同じ終端バイトで同等のものを規定しています。 例示字形は独自のもので、一般的な半角カナに近いものに見えます。 #page=37 に規定。 #page=87 符号表

符号化表現#

[12] JIS X 0201:1997 は4つの符号化文字集合を定めています。

[13] ラテン文字用7ビット符号

[14] 片仮名用7ビット符号

[15] ラテン文字・片仮名用7ビット符号

[24] JIS X 0201:1997 のラテン文字・片仮名用8ビット符号 JIS X 0201:1997 6.4:

(名無しさん [sage] 2005-08-26 11:56:23 +00:00)

[16] ラテン文字・片仮名用8ビット符号

[17] 重ね打ち可能

[18] 片仮名用7ビット符号なんて使ってるところある(あった)んですかね?

符号拡張法#

JIS X 0202

[19] 指示シーケンス終端バイトの登録前先走り問題 指示シーケンス, JUNETコード

文脈#

[4] 現在では単独で使われることはまずありません。

[5] シフトJISの1バイト部分としてよく使われていました。 Unicode 化の進展で使われることは稀になってきています。

[9] ISO-2022-JPEUC-JP で一部として使われました。

コードページ#

[56] CP00895X - CP00895.pdf, , https://public.dhe.ibm.com/software/globalization/gcoc/attachments/CP00895.pdf

[58] CP00896X - CP00896.pdf, , https://public.dhe.ibm.com/software/globalization/gcoc/attachments/CP00896.pdf

[54] CP00897X - CP00897.pdf, , https://public.dhe.ibm.com/software/globalization/gcoc/attachments/CP00897.pdf

[63] CP01042X - CP01042.pdf, , https://public.dhe.ibm.com/software/globalization/gcoc/attachments/CP01042.pdf

[68] Wayback Machine, https://web.archive.org/web/20150708055629/http://www-03.ibm.com/systems/resources/systems_i_software_globalization_pdf_cp01086z.pdf

[66] Wayback Machine, https://web.archive.org/web/20150708052353/http://www-03.ibm.com/systems/resources/systems_i_software_globalization_pdf_cp01139z.pdf

[62] JIS X 0201 - Wikipedia, , https://en.wikipedia.org/wiki/JIS_X_0201#IBM's_implementations

点字#

点字の文字コード

独自の拡張#

[38] シフトJISも参照。

比較#

[46] 伝統的な日本文字コードいわゆるJISコード日本語EUCシフトJIS の3体系があります。 これらのいずれもが何らかの形で JIS X 0201 と関わりを持ちます。

[47] 3体系とも ASCII または JIS X 0201 ラテン文字用図形文字集合を使います。

[48] いわゆるJISコードではどちらも使えますが、区別できる実装は多くありません。 (数少ない区別可能な実装の1つが Emacs (Mule) なので、 初期の利用者数でみれば区別されることも多かったのですが。)

[49] EUCシフトJISではどちらかを選ぶことになり、 前者では ASCII、後者では JIS X 0201 が定義上は正しいのですが、 そうでない実装もあります。また、表示の実装と Unicode への変換の実装が異なることもあります。 現在ではシフトJISであっても ASCII であるかのように変換される実装がほとんどすべてですが、 表示は揺れています。

[50] シフトJIS では JIS X 0201 片仮名用図形文字集合は基本的な構成要素であり、 符号構造自体が JIS X 02018ビット符号の拡張となっています。 一方でいわゆるJISコード日本語EUCでは必ずしも実装されておらず、 軋轢のもとでした。そうでなくても表示されなかったり、 JIS X 0208仮名に変換されたりすることがあります。

[51] ICUaix-JISX0201.1976_0-4.3.6, aix-JISX0201.1976_GR-4.3.6 は、 7/14U+203E ではなく U+00AF ¯ に変換します。 JIS X 0201:1997 とは矛盾しています。

[52] Encoding Standardiso-2022-jp-katakana.txt は、 片仮名用図形文字集合から片仮名 (全角カタカナ) への変換表です。 JIS X 0201:1997 規格本体に整合する使い方です。

[53] しかし他の JIS X 0201 の変換表やシフトJIS日本語EUCの変換表やいわゆるJISコードの実装の多くは、 >>52 とは違って半角カタカナに対応付けています。 JIS X 0201:1997 規格本体には整合しませんが、 JIS X 0208:1997 附属書で定められた代替名称には整合します。 (単体の JIS X 0201ISO-2022-JP での代替名称の利用は、 規格に定めのない使い方です。)

[57] CP895 >>56CP903 >>60, >>61, >>62JIS X 0201 ラテン文字用図形文字集合7ビット符号と同等です。

[59] CP896 >>58JIS X 0201 片仮名用図形文字集合7ビット符号に加え、 0x60 から5文字追加しています。 \~ も含まれます。

[67] CP1139 >>66JIS X 02018ビット符号と同等です。

[55] CP897 >>54>>67OEMコードページ等の要領で C0図形文字を割り当てています。 CP1086 >>68 はそれとよく似ていますが、少し違います。

[64] CP1041>>55 に更に記号を追加したものです。 >>59 の追加文字ですが、符号位置は異なります。

[65] CP1042>>57 に更に記号を追加したものです。 >>64 の追加に近いですが、一部異なります。 互換性はありません。

[69] この他 ICU に含まれる JIS X 0201シフトJISの変換表には追加文字等が微妙に違うものがいくつかあります。

[70] MacJapaneseICUwindows-10001-2000 は、 いくつか追加しています。 IBM のものと互換性はありません。

[26] Casio character set の一種に、 JIS X 0201 の空きや制御文字の領域に独自の文字を追加したものがあります。 0xA0NBSP もあります。 0xEF\ があります。 >>27

[28] Sharp pocket computer character sets の一種に、 JIS X 0201 の空きや制御文字の領域に独自の文字を追加したものがあります。 0xA0NBSP もあります。

歴史#

[44] 制定。

メモ#

[32] 16ビット符号での利用例: JIS X 0207 の実装事例参照