JUNETコード
[1] JUNETの手引き暫定第2版は見たことがないので、以下すべて
第1版のはなしです。
JUNET の手引きのうち、次の節が文字コードについて具体的に
触れています。
- 2.5 メールの文字コード
- 3.4.2 記事の文字コード
- 4.4.2 メールとニュースにおける漢字の取り扱い
- 6.3 JUNET での漢字の取り扱い
このうち、6.3 が JUNET での議論による合意をまとめたもので、
他はメイルやニュースの使い方の解説の一部です。
この漢字コード協約 (convention) は、規定というほど強く
はっきりしたものではなくて、細かい点については手引きのもの
で確定ではなくて、議論が続けられていたみたいです。
- JUNET でのメイルやニュースなどの通信のための符号
- 内部 (local) での使用を強制しない
- 情報交換の当事者間の合意があればこれは強制されない
- JUNET ではこの符号以外の伝達は保証されない
- 海外との情報交換をも考慮して、 ISO の規格に適合した7ビットの符号とする。
- 使用できる文字集合は、
- ASCII (ESC ( B)
- JIS X 0201 roman (ESC ( J)
- JIS X 0208-1978 (ESC $ @)
- JIS X 0208-1983 (ESC $ B)
- JIS にない文字は使用しない
- 罫線素片は使わない方が良い
- 第2水準が使えない人がいるのを考慮するのがよい
- JIS X 0201 片仮名は使用しない
- 制御文字
- ファイルの最後には改行を入れる
- ファイルの最後は ASCII または JIS X 0201 roman の状態にする
- 改行の前に ASCII または JIS X 0201 roman の状態にするのが望ましい
- TAB, BS, SP の前に ASCII または JIS X 0201 roman の状態にするのが望ましい
- 実装は JIS X 0208 状態でも制御文字や SP が使えるべき
- 制御文字では、 ESC, 改行, TAB などの伝達が保証される
- 手引きの他の部分から考えて、「など」には FF や BS が該当すると思われ。
- 一行は 255 bytes を超えてはいけない (エスケープ列を含む)
- 表示時 (ESC, TAB, BS の処理後の状態, JIS X 0208 は2文字と考える) に70〜76文字以下であるのが望ましい
これらの条件には、絶対 (MUST) なものと推奨 (SHOULD)
なものがまじってます。 (いくつかは MAY です。)