[4]
香港の繁体字表記中文には言語タグ
zh-HK
,
澳門の繁体字表記中文には言語タグ
zh-MO
が使われます。
[6]
繁体字表記の中文全般を表す言語タグ zh-Hant
が使われることもあります。
[28]
伝統字と明示した台湾華語を表す言語タグ zh-Hant-TW
が使われることもあります。
>>12, >>64
[54]
繁体字と明示した香港の中文を表す言語タグ
zh-Hant-HK
が使われることもあります。
>>52, >>12, >>64
[68]
繁体字と明示した澳門の中文を表す言語タグ
zh-Hant-MO
が使われることもあります。
>>12, >>64
[1]
中華人民共和国の簡体字表記中文には言語タグ
zh-CN
が使われます。
[2]
マレーシアの簡体字表記中文には言語タグ
zh-MY
,
シンガポールの簡体字表記中文には言語タグ
zh-SG
が使われます。
[7]
簡体字表記の中文全般を表す言語タグ zh-Hans
が使われることがあります。
[29]
簡体字と明示した中華人民共和国の中文を表す言語タグ
zh-Hans-CN
が使われることがあります。
>>12, >>64
[66]
簡体字と明示したシンガポールの中文を表す言語タグ
zh-Hans-SG
が使われることがあります。
>>12, >>64
[71]
zh-CN
/ zh-TW
のような国符号を用いた区別と、
zh-Hans
/ zh-Hant
のような用字系符号を用いた区別の2系統
(とその組み合わせ)
があります。
[72] 元来 POSIX locale や言語タグで用いられていたのは国符号の系統でした。
[73] その後用字系符号の系統が記述可能になりました。 するとそちらを推す人達が表れました。しかし国符号の系統がなくなるわけではなく、 どちらも混在する混沌の時代となりました。
[75]
zh-Hans
/ zh-Hant
は使う文字の違いだけを表しています。
[76] ところが実際に中華人民共和国と中華民国で使われている言語の違いは、 文字の違いだけではありません。政治制度に起因する違いや情報分野等の新語の違いなど、 「2つの中国」として経過した数十年間で言語を構成する語彙にも多くの違いが生じています。
[77] 両者の自動変換のソフトウェアもありますが、 単なる文字の変換に留まらない複雑な変換処理を実装していて、 それでも完璧ではありません。
[78] また、中華民国、中華人民共和国香港特別行政区、中華人民共和国澳門特別行政区の文字も同じ繁体字とまとめられますが、 それらは完全に同じではありません。 3地それぞれの常用漢字制度、書体標準、文字コード規格があります。 それを踏まえて別のフォント製品が提供される場合もあります。 言語も、広東語、英語、ポルトガル語の影響の度合いが3地で異なります。
[79]
従って国符号の系統で zh-CN
, zh-TW
, zh-HK
, zh-MO
などと区別する方が適切とも考えられます。
[70] >>69 「正式のよう」と述べていますが、根拠は何も示されていません。
[74] どちらかが「正式」ということはなく、どちらを使うのも自由 (状況に応じて判断するべき) です。
[87] Xユーザーのnetsisさん: 「iOS:地域は日本、言語を台湾にするとpreferredLanguagesは"zh-Hant-JP" Android:地域関係なく、言語を台湾にするとtoLanguageTagは"zh-TW" Appleは言語に設定した地域情報を入れるのは重要なことなのかな? iOSで英語とかは方言ある国ごとに言語選べてGoogle式なの、よくわからないなぁ。」 / X, , https://twitter.com/netsis_jenomoto/status/1447222043691212812
[88] Use proper BCP 47 language tag for Chinese · Issue #25134 · mdn/content · GitHub, https://github.com/mdn/content/issues/25134
[14]
特に区別の必要ないとき zh
が使われることもあります。
[18] 古典中文、いわゆる漢文の言語タグは実は難題です。 漢文は前近代東アジアの共通言語だったため、 各国で様々に受容されていて、必ずしも「古典中文」という1つの言語ではなく、 各地の言語とも融合しています。
[19] 例えば現代日本でも学校教育で学習する訓読文は、 古典中文である白文に返り点等を付加して日本語として読めるようにしたものです。 書き下し文は訓読文を機械的に変形して日本語により近づけたものです。 これらは日本語であるともいえますし、そうとは断言できないともいえます。
[20] また、前近代日本で非常に幅広く用いられた変体漢文は、 古典中文を模して大陸の母語話者の書く文章に近い形に整えられたものもあれば、 仮名が多く混じって日本語的性質が相当に強いものまで、 様々な形態のものが知られています。
[23]
訓点のない白文、しかも古代支那で書かれた文章でも、
現代においては表記面で国によって差が生じています。
台湾では康熙字典体に近い伝統字で印刷され、
中華人民共和国では簡体字または新字形の繁体字で印刷され、
日本では新字体で印刷されます。
表面的な字体の差に過ぎないとはいっても、
芸
や机
や弁
や着
のように国・言語ごとに字種の区切り方に変化が生じているところでは、
現代の国・言語に引きづられてテキストが変化することになります。
[24] 従って「各「言語Xの文脈内に置かれた漢文」はその言語Xの文章を構成する一部であるから、 「漢文」という独立した言語の文章が言語Xの文章内に埋め込まれているのではなく、 その言語Xの一部を構成しているのだ」という考え方も成立します。
[102]
その考え方を採るなら、 lzh
や zh
ではなく X
の言語タグを使うことになります。
[103] 現実問題としても専門家以外は文章途中で言語タグを一々細かく切り替えて運用するのは無理で、 周囲の文章の言語タグが適用された状態になることが極めて普通です。
[25] 日本語としての漢文の言語タグについては、日本語言語タグを参照。
[65]
lzh-CN
が使われることがあります。
>>64
[26] Category:文言文 - 维基词典,自由的多语言词典, , https://zh.wiktionary.org/wiki/Category:%E6%96%87%E8%A8%80%E6%96%87
[27] >>26 にはこれが何なのか説明がなくよくわかりませんが、 言語タグ風の識別子が付けられた分類が示されています。
文言文 (lzh) ├──── 前古典漢語 (lzh-pre) E ├───┬ 官話漢文 (lzh-cmn) E │ └──── 臺灣漢文 (lzh-cmn-TW) E ├──── 廣東漢文 (lzh-yue) E ├──── 朝鮮漢文 (lzh-KO) E ├──── 漢文 (lzh-lit) E ├──── 臺山漢文 (lzh-tai) E ├──── 詞 (lzh-cii) E └──── 越南漢文 (lzh-VI) E
[50] 規格が二転三転したこともあって過去にはいろいろな言語タグがありました。
zh-amoy
,
zho-amoy
,
chi-amoy
zh-canton
,
zho-canton
,
chi-canton
zh-chaozhou
,
zho-chaozhou
,
chi-chaozhou
zh-fukien
,
zho-fukien
,
chi-fukien
zh-fuzhou
,
zho-fuzhou
,
chi-fuzhou
zh-gan
zh-guoyu
zh-hainan
,
zho-hainan
,
chi-hainan
zh-hakka
,
zho-hakka
,
i-hak
,
chi-hakka
zh-mandarin
,zh-min
,
zh-min-nan
zh-wuu
zh-CN-wu
,
zho-CN-wu
,
chi-CN-wu
zh-xiang
zh-yue
zh-yunnan
,
zho-yunnan
,
chi-yunnan
x-Nise-Chinese
>>112[56] IETF言語タグのプロファイル規格のうち LMT と EIDR language code はこれらの表現のどれを選ぶか(だけ)が違っています。
[55] ISO 639-6 にもいくつか4文字符号が用意されていました。 >>98
ISO 639-3: sazo
としていますが、
sazo
は
ISO 639-3
の言語符号ではありません。
[97] >>94 は Xiangnan Tuhua language、 >>95 は湘南土話と説明しています。
[99]
sazo
は ISO 639-6 で Tuhua に割り当てられていました。 >>98
湘南土話を指すとされます。 >>100
[92] Wp/ltc - Incubator Plus 2.0, , https://incubator.miraheze.org/wiki/Wp/ltc
[93] >>92 中古漢語の ISO 639-3 言語符号 ltc
が使われています。
[80] こういうのも記述したい
[53]
中文ローマ字表記を言語タグ
zh-Latn
で表すことがあります。
>>52
[31]
>>30 では言語タグ zh-Latn-x-pinyin
が拼音表記用として例示されています。
[58] Multilingual names - OpenStreetMap Wiki, https://wiki.openstreetmap.org/wiki/Multilingual_names#China
Romanization/Transliteration system defined code Pinyin romanization zh-Latn-pinyin Tongyong Pinyin romanization zh-Latn-tongyong Wade-Giles romanization zh-Latn-wadegile Jyutping Cantonese Romanization yue-Latn-jyutping
bo-Latn-pinyin
bo-Latn-wylie
mnc-Latn-moellendorff
[59] Multilingual names - OpenStreetMap Wiki, https://wiki.openstreetmap.org/wiki/Multilingual_names#Taiwan
Or use name:zh-Latn-pinyin=*, name:zh-Latn-tongyong=*, name:zh-Latn-wadegile=*
[91] に
Former official transcription standard for Mandarin Chinese in Taiwan.
[61]
注音字母表記の中文の言語タグ zh-Bopo
があります。
>>60
[11] 維基百科 (Wikipedia) は中文版として1つにまとまっていますが、各ページに
... の6バージョンの切り替えがついていて、同じ記事が変換して表示されるようになっています。
[12] ソースを見ると、
<link rel="alternate" hreflang="zh" href="/zh/Wikipedia:%E9%A6%96%E9%A1%B5"/> <link rel="alternate" hreflang="zh-Hans" href="/zh-hans/Wikipedia:%E9%A6%96%E9%A1%B5"/> <link rel="alternate" hreflang="zh-Hant" href="/zh-hant/Wikipedia:%E9%A6%96%E9%A1%B5"/> <link rel="alternate" hreflang="zh-Hans-CN" href="/zh-cn/Wikipedia:%E9%A6%96%E9%A1%B5"/> <link rel="alternate" hreflang="zh-Hant-HK" href="/zh-hk/Wikipedia:%E9%A6%96%E9%A1%B5"/> <link rel="alternate" hreflang="zh-Hant-MO" href="/zh-mo/Wikipedia:%E9%A6%96%E9%A1%B5"/> <link rel="alternate" hreflang="zh-Hans-MY" href="/zh-my/Wikipedia:%E9%A6%96%E9%A1%B5"/> <link rel="alternate" hreflang="zh-Hans-SG" href="/zh-sg/Wikipedia:%E9%A6%96%E9%A1%B5"/> <link rel="alternate" hreflang="zh-Hant-TW" href="/zh-tw/Wikipedia:%E9%A6%96%E9%A1%B5"/> <link rel="alternate" hreflang="x-default" href="/wiki/Wikipedia:%E9%A6%96%E9%A1%B5"/>
... とそれ以外にも地域指定なしの URL が存在しています。 hans, hant を選ぶと、 地域なしの简体、繁體のバージョンが表示されます。 (地域指定ありのバージョンとの違いは不明。)
[16] 中国語版ウィキペディア - Wikipedia ( 版) http://ja.wikipedia.org/wiki/%E4%B8%AD%E5%9B%BD%E8%AA%9E%E7%89%88%E3%82%A6%E3%82%A3%E3%82%AD%E3%83%9A%E3%83%87%E3%82%A3%E3%82%A2#.E7.B9.81.E4.BD.93.E5.AD.97.E3.81.A8.E7.B0.A1.E4.BD.93.E5.AD.97.E3.81.AE.E8.87.AA.E5.8B.95.E5.A4.89.E6.8F.9B
[15] Automatic conversion between simplified and traditional Chinese - Meta ( 版) http://meta.wikimedia.org/wiki/Automatic_conversion_between_simplified_and_traditional_Chinese
zh
の解釈[85]
Chrome は zh-TW
等の他の区分に当てはまらない zh
系の言語タグを zh-CN
扱いするようにみえます。
[63]
OpenType には ISO 639 zho
に関係するものとして次の言語系タグがあります。
>>104
ZHH
Chinese, Traditional, Hong Kong SARZHP
Chinese, PhoneticZHS
Chinese, SimplifiedZHT
Chinese, TraditionalZHTM
Chinese, Traditional, Macao SAR[419] OpenType の用字系タグで中文と関係が深いもの:
[21] ポケモンWiki:会議室/議事録/2019 - ポケモンWiki, , https://wiki.xn--rckteqa2e.com/wiki/%E3%83%9D%E3%82%B1%E3%83%A2%E3%83%B3Wiki:%E4%BC%9A%E8%AD%B0%E5%AE%A4/%E8%AD%B0%E4%BA%8B%E9%8C%B2/2019#%E3%83%9D%E3%82%B1%E3%83%A2%E3%83%B3%E3%81%AE%E4%B8%AD%E5%9B%BD%E8%AA%9E%E5%90%8D%E3%81%AE%E8%A1%A8%E7%A4%BA
[22] 中国語ウェブサイトの言語コード指定(lang属性) | 国際ウェブマーケティングのエクスポート・ジャパン, https://www.export-japan.co.jp/blog/%E4%B8%AD%E5%9B%BD%E8%AA%9E%E3%82%A6%E3%82%A7%E3%83%96%E3%82%B5%E3%82%A4%E3%83%88%E3%81%AE%E8%A8%80%E8%AA%9E%E3%82%B3%E3%83%BC%E3%83%89%E6%8C%87%E5%AE%9A%EF%BC%88lang%E5%B1%9E%E6%80%A7%EF%BC%89/
Chinese zh 中国語 (中国) zh-CN 中国語 (香港特別行政区) zh-HK 中国語 (中華人民共和国マカオ特別行政区) zh-MO 中国語 (シンガポール) zh-SG 中国語 (台湾) zh-TW 簡体中国語 zh-Hans 簡体字中国語 (中国) zh-Hans-CN 簡体字中国語 (シンガポール) zh-Hans-SG 中国語 (繁体字) zh-Hant 繁体字中国語 (中国) zh-Hant-CN 繁体中国語 (香港特別行政区) zh-Hant-HK 繁体中国語 (マカオ特別行政区) zh-Hant-MO 繁体字中国語 (台湾) zh-Hant-TW 中国語 (文語) lzh 中国語 (文語、中国) lzh-CN
zh-classical
を使っています。この部分は言語タグのことが多いですが、zh-classical
は言語タグではありません。 >>8