[1] 用字系を同定するための札、 用字系札とかいうものです。
RFC 3036 の言語札や ISO 3166 の国名符号・
地域符号のように、書字体系を識別します。ここで、
用字(系)
あるいは書字体系
とは、
広く文字・記号の使い方の体系
と緩く定義します。
(その意味では script
というより orthography
に近いかもしれませんが、そうすると規範の存在を示唆するようなニュアンスがあります。)
[2] RFC 3066 の規定する言語札のように、複数の部分札を
HYPHEN-MINUS
で結んだものを用字系札とします。
大文字・小文字の区別は一切しません。
script-tag := primary-subtag *("-" subtag)
primary-subtag := 1*8ALPHA
subtag := 1*(ALPHA / DIGIT) ;; 8文字以下を推奨。
primary-subtag
) は、
次のように規定します。s
である場合の第3部分札は、
次の通り規定します。s
の場合、
第2部分札はここで規定されているものとします。[15] 使用する値は >>2- の規定に従っていれば登録する必要はないが、相互通信性の確保のためにここに登録することが望ましい。
用字系札 | ISO 15924 数値符号 | 用字名 (日本語) | 用字名 (英語) | 状態 |
Arab | 160 | Arabic | 2004-05-01 ISO 登録 | |
Armn | 230 | Armenian | 2004-05-01 ISO 登録 | |
auto | 自動 | |||
Bali | 360 | Balinese | 2004-05-29 ISO 登録 | |
Batk | 365 | Batak | 2004-05-01 ISO 登録 | |
Beng | 325 | Bengali | 2004-05-01 ISO 登録 | |
Blis | 550 | Blissymbols | 2004-05-01 ISO 登録 | |
Bopo | 285 | Bopomofo | 2004-05-01 ISO 登録 | |
Brah | 300 | Brahmi | 2004-05-01 ISO 登録 | |
Brai | 570 | Braille | 2004-05-01 ISO 登録 | |
Brai-ja | 日本語用6点点字 | |||
Bugi | 367 | Buginese | 2004-05-01 ISO 登録 |
Buhd | 372 | Buhid | 2004-05-01 ISO 登録 | |
Cans | 440 | Unified Canadian Aboriginal Syllabics | 2004-05-29 ISO 登録 | |
Cham | 358 | Cham | 2004-05-01 ISO 登録 | |
Cher | 445 | Cherokee | 2004-05-01 ISO 登録 | |
Cirt | 291 | Cirth | 2004-05-01 ISO 登録 | |
Copt | 204 | Coptic | 2004-05-29 ISO 登録 | |
Cprt | 403 | Cypriot | 2004-05-01 ISO 登録 | |
Cyrl | 220 | Cyrillic;2004-05-01 ISO 登録 | ||
Cyrs | 221 | Cyrillic (Old Church Slavonic variant) | 2004-05-01 ISO 登録 | |
Deva | 315 | Devanagari (Nagari) | 2004-05-01 ISO 登録 | |
Dsrt | 250 | Deseret (Mormon) | 2004-05-01 ISO 登録 | |
Egyd | 070 | Egyptian demotic | 2004-05-01 ISO 登録 | |
Egyh | 060 | Egyptian hieratic | 2004-05-01 ISO 登録 | |
Egyp | 050 | Egyptian hieroglyphs | 2004-05-01 ISO 登録 | |
Ethi | 430 | Ethiopic (Ge‘ez) | 2004-10-25 ISO 登録 | |
Geor | 240 | Georgian (Mkhedruli) | 2004-05-29 ISO 登録 | |
Geok | 241 | Khutsuri (Asomtavruli and Khutsuri) | 2004-10-25 ISO 登録 | |
Glag | 225 | Glagolitic | 2004-05-01 ISO 登録 | |
Goth | 206 | Gothic | 2004-05-01 ISO 登録 | |
Grek | 200 | Greek | 2004-05-01 ISO 登録 | |
Gujr | 320 | Gujarati | 2004-05-01 ISO 登録 | |
Guru | 310 | Gurmukhi | 2004-05-01 ISO 登録 | |
Hang | 286 | Hangul (Hangŭl, Hangeul) | 2004-05-29 ISO 登録 | |
Hani | 500 | Han (Hanzi, Kanji, Hanja) | 2004-05-01 ISO 登録 | |
Hani-CN-simp | 簡体字 (中共) | |||
Hani-kambun | 漢文 | |||
Hani-kambun-JP | 和様漢文 | |||
Hani-kangxi | 康煕字典体 | |||
Hani-trad | 伝統字 (繁体字) | Han (Simplified variant) | 時代遅れ ->Hant | |
Hano | 371 | Hanunoo (Hanunóo) | 2004-05-29 ISO 登録 | |
Hans | 501 | Han (Simplified variant) | 2004-05-29 ISO 登録 | |
Hant | 502 | Han (Traditional variant) | 2004-05-29 ISO 登録 | |
Hebr | 125 | Hebrew | 2004-05-01 ISO 登録 | |
Hira | 410 | Hiragana | 2004-05-01 ISO 登録 | |
Hmng | 450 | Pahawh Hmong | 2004-05-01 ISO 登録 | |
Hrkt | 412 | (alias for Hiragana + Katakana) | 2004-05-01 ISO 登録 | |
Hung | 176 | Old Hungarian | 2004-05-01 ISO 登録 | |
Inds | 610 | Indus (Harappan) | 2004-05-01 ISO 登録 | |
inherit | 継承 | |||
Ital | 210 | Old Italic (Etruscan, Oscan, etc.) | 2004-05-29 ISO 登録 | |
Jpan-JP-educate-n | 日本語文字/n (1〜6) 年生までに習う漢字 | |||
Jpan-JP-educate-n-YYYY | 日本語文字/n (1〜6) 年生までに習う漢字 (YYYY 年に改訂された教育漢字の表) | |||
Jpan-JP-jouyou-gendai | 日本語文字/常用漢字表 (1981年)・現代仮名遣い | |||
Jpan-JP-touyou-gendai | 日本語文字/当用漢字表・現代仮名遣い | |||
Jpan-kambun | 漢文 (書き下し文) | |||
Jpan-kouki | いわゆる康煕字典体 | |||
Jpan-old | 日本語文字/旧字旧仮名 | 時代遅れ ->Jpan-trad | ||
Jpan-old-kana | 日本語文字/歴史的仮名遣 | |||
Jpan-trad | 日本語文字/旧字旧仮名 | |||
Java | 361 | Javanese | 2004-05-29 ISO 登録 | |
Kali | 357 | Kayah Li | 2004-05-01 ISO 登録 | |
Kana | 411 | Katakana | 2004-05-01 ISO 登録 | |
Kana-ainu | 片仮名/アイヌ語 | |||
Khar | 305 | Kharoshthi | 2004-05-29 ISO 登録 | |
Khmr | 355 | Khmer | 2004-05-29 ISO 登録 | |
Knda | 345 | Kannada | 2004-05-29 ISO 登録 | |
Laoo | 356 | Lao | 2004-05-01 ISO 登録 | |
Latf | 217 | Latin (Fraktur variant) | 2004-05-01 ISO 登録 | |
Latg | 216 | Latin (Gaelic variant) | 2004-05-01 ISO 登録 | |
Latn | 215 | Latin | 2004-05-01 ISO 登録 | |
Latn-ainu | ラテン文字/アイヌ語 | |||
Latn-ja | 羅馬字 | |||
Latn-ja-hebon | ヘボン式羅馬字 | |||
Latn-ja-nihon | 日本式羅馬字 | |||
Lepc | 335 | Lepcha (Róng) | 2004-05-01 ISO 登録 | |
Limb | 336 | Limbu | 2004-05-29 ISO 登録 | |
Lina | 400 | Linear A | 2004-05-01 ISO 登録 | |
Linb | 401 | Linear B | 2004-05-29 ISO 登録 | |
Mand | 140 | Mandaean | 2004-05-29 ISO 登録 | |
Maya | 090 | Mayan hieroglyphs | 2004-05-01 ISO 登録 | |
Mero | 100 | Meroitic | 2004-05-01 ISO 登録 | |
Mlym | 347 | Malayalam | 2004-05-01 ISO 登録 | |
Mong | 145 | Mongolian | 2004-05-01 ISO 登録 | |
Mymr | 350 | Myanmar (Burmese) | 2004-05-01 ISO 登録 | |
Nkoo | 165 | N’Ko | 2004-10-25 ISO 登録 | |
none | 指定なし | |||
Ogam | 212 | Ogham | 2004-05-01 ISO 登録 | |
Orkh | 175 | Orkhon | 2004-05-01 ISO 登録 | |
Orya | 327 | Oriya | 2004-05-01 ISO 登録 | |
Osma | 260 | Osmanya | 2004-05-01 ISO 登録 | |
Perm | 227 | Old Permic | 2004-05-01 ISO 登録 | |
Phag | 331 | Phags-pa | 2004-05-29 ISO 登録 | |
Phnx | 115 | Phoenician | 2004-05-01 ISO 登録 | |
Plrd | 282 | Pollard Phonetic | 2004-05-01 ISO 登録 | |
Qaaa | 900 | Reserved for private use (start) | 2004-05-29 ISO 登録 | |
Qabx | 949 | Reserved for private use (end) | 2004-05-29 ISO 登録 | |
Roro | 620 | Rongorongo | 2004-05-01 ISO 登録 | |
Runr | 211 | Runic | 2004-05-01 ISO 登録 | |
Sara | 292 | Sarati | 2004-05-29 ISO 登録 | |
Shaw | 281 | Shavian (Shaw) | 2004-05-01 ISO 登録 | |
Sinh | 348 | Sinhala | 2004-05-01 ISO 登録 | |
Sylo | 316 | Syloti Nagri | 2004-05-29 ISO 登録 | |
Syrc | 135 | ;Syriac | 2004-05-01 ISO 登録 | |
Syre | 138 | Syriac (Estrangelo variant) | 2004-05-01 ISO 登録 | |
Syrj | 137 | Syriac (Western variant) | 2004-05-01 ISO 登録 | |
Syrn | 136 | Syriac (Eastern variant) | 2004-05-01 ISO 登録 | |
Tagb | 373 | Tagbanwa | 2004-05-01 ISO 登録 | |
Tale | 353 | Tai Le | 2004-10-25 ISO 登録 | |
Talu | 354 | New Tai Lue | 2004-10-25 ISO 登録 | |
Taml | 346 | Tamil | 2004-05-01 ISO 登録 | |
Telu | 340 | Telugu | 2004-05-01 ISO 登録 | |
Teng | 290 | Tengwar | 2004-05-01 ISO 登録 | |
Tfng | 120 | Tifinagh (Berber) | 2004-05-01 ISO 登録 | |
Tglg | 370 | Tagalog | 2004-05-01 ISO 登録 | |
Thaa | 170 | Thaana | 2004-05-01 ISO 登録 | |
Thai | 352 | Thai | 2004-05-01 ISO 登録 | |
Tibt | 330 | Tibetan | 004-05-01 ISO 登録 | |
Ugar | 040 | Ugaritic | 2004-05-01 ISO 登録 | |
Vaii | 470 | Vai | 2004-05-01 ISO 登録 | |
Visp | 280 | Visible Speech | 2004-05-01 ISO 登録 | |
Xpeo | 030 | Old Persian | 2004-05-01 ISO 登録 | |
Xsux | 020 | Cuneiform | 2004-05-01 ISO 登録 | |
Yiii | 460 | Yi | 2004-05-01 ISO 登録 | |
Zxxx | 997 | Code for unwritten languages | 2004-05-01 ISO 登録 | |
Zyyy | 998 | Code for undetermined script | 2004-05-29 ISO 登録 | |
Zzzz | 999 | Code for uncoded script | 2004-05-01 ISO 登録 |
[19] 言語札との併用方法は使用する規格に依存する。以下に例を示す。
[20] 1つの表記体系としての用字系の組み合わせは1つの用字系札とする (>>14) が、単なる用字系の混在の指定方法はプロトコルによる。例:
[26]
他にも用字系の符号体系がいくつもあります。
[33]
似たようなもので ScriptLangTag
があります。
ja
;script="Japn-JP-educate-2
"; q=1, ja
;script="Hira
"; q=0.9, ja
; q=0.8 とか出来たらいいよなぁ。Kana
= Kata
+ Hira
とかにすればよかったのに、
Hrkt
= Kana
+ Hira
にさせてしまうなんて、何考えてるんだ?言語札-script-用字系札
とつなげて使うのはどうですか? こうすれば、 (用字系札の小札が8文字以内である限りは) 合法的に利用できます。かなり冗長にはなりますが。Hani-kangxi
, 「いわゆる康煕字典体」 Hani-kouki
なんてどうでしょう。後者の日本用字系版 Jpan-kouki
は明治時代の出版物の用字系とか。x-script
にしておいたほうが。