chi-canton

chi-canton

[5] 中文 (中国語) を表す言語タグzh です。

繁体字中文

[3] 台湾華語には言語タグ zh-TW が使われます。

[4] 香港繁体字表記中文には言語タグ zh-HK, 澳門繁体字表記中文には言語タグ zh-MO が使われます。

[6] 繁体字表記の中文全般を表す言語タグ zh-Hant が使われることもあります。

[28] 伝統字と明示した台湾華語を表す言語タグ zh-Hant-TW が使われることもあります。 >>12, >>64

[54] 繁体字と明示した香港中文を表す言語タグ zh-Hant-HK が使われることもあります。 >>52, >>12, >>64

[68] 繁体字と明示した澳門中文を表す言語タグ zh-Hant-MO が使われることもあります。 >>12, >>64

[89] 中華人民共和国繁体字表記中文言語タグ zh-Hant-CN で表せます。

簡体字中文

[1] 中華人民共和国簡体字表記中文には言語タグ zh-CN が使われます。

[2] マレーシア簡体字表記中文には言語タグ zh-MY, シンガポール簡体字表記中文には言語タグ zh-SG が使われます。

[7] 簡体字表記の中文全般を表す言語タグ zh-Hans が使われることがあります。

[29] 簡体字と明示した中華人民共和国中文を表す言語タグ zh-Hans-CN が使われることがあります。 >>12, >>64

[66] 簡体字と明示したシンガポール中文を表す言語タグ zh-Hans-SG が使われることがあります。 >>12, >>64

[67] 簡体字と明示したマレーシア中文を表す言語タグ zh-Hans-MY が使われることがあります。 >>12

用字系 vs 地域

[71] zh-CN / zh-TW のような国符号を用いた区別と、 zh-Hans / zh-Hant のような用字系符号を用いた区別の2系統 (とその組み合わせ) があります。

[72] 元来 POSIX locale言語タグで用いられていたのは国符号の系統でした。

[73] その後用字系符号の系統が記述可能になりました。 するとそちらを推す人達が表れました。しかし国符号の系統がなくなるわけではなく、 どちらも混在する混沌の時代となりました。

[75] zh-Hans / zh-Hant は使う文字の違いだけを表しています。

[76] ところが実際に中華人民共和国中華民国で使われている言語の違いは、 文字の違いだけではありません。政治制度に起因する違いや情報分野等の新語の違いなど、 「2つの中国」として経過した数十年間で言語を構成する語彙にも多くの違いが生じています。

[77] 両者の自動変換のソフトウェアもありますが、 単なる文字の変換に留まらない複雑な変換処理を実装していて、 それでも完璧ではありません。

[78] また、中華民国中華人民共和国香港特別行政区中華人民共和国澳門特別行政区の文字も同じ繁体字とまとめられますが、 それらは完全に同じではありません。 3地それぞれの常用漢字制度、書体標準、文字コード規格があります。 それを踏まえて別のフォント製品が提供される場合もあります。 言語も、広東語英語ポルトガル語の影響の度合いが3地で異なります。

[79] 従って国符号の系統で zh-CN, zh-TW, zh-HK, zh-MO などと区別する方が適切とも考えられます。

[69] ZH-hantという言語コードはなんのためにありますか? - ... - Yahoo!知恵袋, LY Corporation, https://detail.chiebukuro.yahoo.co.jp/qa/question_detail/q11174173021

言語コードとしては 「ZH-hans」 のほうが正式のようです。

[70] >>69 「正式のよう」と述べていますが、根拠は何も示されていません。

[74] どちらかが「正式」ということはなく、どちらを使うのも自由 (状況に応じて判断するべき) です。

[87] Xユーザーのnetsisさん: 「iOS:地域は日本、言語を台湾にするとpreferredLanguagesは"zh-Hant-JP" Android:地域関係なく、言語を台湾にするとtoLanguageTagは"zh-TW" Appleは言語に設定した地域情報を入れるのは重要なことなのかな? iOSで英語とかは方言ある国ごとに言語選べてGoogle式なの、よくわからないなぁ。」 / X, , https://twitter.com/netsis_jenomoto/status/1447222043691212812

[88] Use proper BCP 47 language tag for Chinese · Issue #25134 · mdn/content · GitHub, https://github.com/mdn/content/issues/25134

古典中文

[10] 古典中文を表す言語タグlzh です。

[13] lzh はたまに使われています。 >>9

[14] 特に区別の必要ないとき zh が使われることもあります。

[17] Wikipedia文言版はサブドメインzh-classical を使っています。この部分は言語タグのことが多いですが、 zh-classical言語タグではありません。 >>8

[18] 古典中文、いわゆる漢文言語タグは実は難題です。 漢文は前近代東アジアの共通言語だったため、 各国で様々に受容されていて、必ずしも「古典中文」という1つの言語ではなく、 各地の言語とも融合しています。

[19] 例えば現代日本でも学校教育で学習する訓読文は、 古典中文である白文返り点等を付加して日本語として読めるようにしたものです。 書き下し文訓読文を機械的に変形して日本語により近づけたものです。 これらは日本語であるともいえますし、そうとは断言できないともいえます。

[20] また、前近代日本で非常に幅広く用いられた変体漢文は、 古典中文を模して大陸の母語話者の書く文章に近い形に整えられたものもあれば、 仮名が多く混じって日本語的性質が相当に強いものまで、 様々な形態のものが知られています。

[23] 訓点のない白文、しかも古代支那で書かれた文章でも、 現代においては表記面でによって差が生じています。 台湾では康熙字典体に近い伝統字で印刷され、 中華人民共和国では簡体字または新字形繁体字で印刷され、 日本では新字体で印刷されます。 表面的な字体の差に過ぎないとはいっても、 のように言語ごとに字種の区切り方に変化が生じているところでは、 現代の言語に引きづられてテキストが変化することになります。

[90] 句読点も各国で異なります。

[24] 従って「各「言語Xの文脈内に置かれた漢文」はその言語Xの文章を構成する一部であるから、 「漢文」という独立した言語の文章が言語Xの文章内に埋め込まれているのではなく、 その言語Xの一部を構成しているのだ」という考え方も成立します。

[102] その考え方を採るなら、 lzhzh ではなく X言語タグを使うことになります。

[103] 現実問題としても専門家以外は文章途中で言語タグを一々細かく切り替えて運用するのは無理で、 周囲の文章の言語タグが適用された状態になることが極めて普通です。

[25] 日本語としての漢文言語タグについては、日本語言語タグを参照。

[65] lzh-CN が使われることがあります。 >>64


[26] Category:文言文 - 维基词典,自由的多语言词典, , https://zh.wiktionary.org/wiki/Category:%E6%96%87%E8%A8%80%E6%96%87

[27] >>26 にはこれが何なのか説明がなくよくわかりませんが、 言語タグ風の識別子が付けられた分類が示されています。

    文言文 (lzh)
        ├──── 前古典漢語 (lzh-pre) E
        ├───┬ 官話漢文 (lzh-cmn) E
            │   └──── 臺灣漢文 (lzh-cmn-TW) E
        ├──── 廣東漢文 (lzh-yue) E
        ├──── 朝鮮漢文 (lzh-KO) E
        ├──── 漢文 (lzh-lit) E
        ├──── 臺山漢文 (lzh-tai) E
        ├──── 詞 (lzh-cii) E
        └──── 越南漢文 (lzh-VI) E

地域言語

[50] 規格が二転三転したこともあって過去にはいろいろな言語タグがありました。


[56] IETF言語タグプロファイル規格のうち LMTEIDR language code はこれらの表現のどれを選ぶか(だけ)が違っています。


[55] ISO 639-6 にもいくつか4文字符号が用意されていました。 >>98


[96] >>94

ISO 639-3: sazo

としていますが、 sazoISO 639-3言語符号ではありません

[97] >>94 は Xiangnan Tuhua language、 >>95湘南土話と説明しています。

[101] 記事は女書表記が使われています。

[99] sazoISO 639-6 で Tuhua に割り当てられていました。 >>98 湘南土話を指すとされます。 >>100


[51] 日本人による変体漢文偽中国語については日本語言語タグ参照。

その他の歴史的中文

[92] Wp/ltc - Incubator Plus 2.0, , https://incubator.miraheze.org/wiki/Wp/ltc

[93] >>92 中古漢語ISO 639-3 言語符号 ltc が使われています。

[80] こういうのも記述したい

ラテン文字表記

[53] 中文ローマ字表記を言語タグ zh-Latn で表すことがあります。 >>52

[31] >>30 では言語タグ zh-Latn-x-pinyin拼音表記用として例示されています。

[52] 地図作成 - 地図作成 - HERE Developer, , https://jp.developer.here.com/documentation/geojson-map-components-cartography/data_spec_guide/common/globals.html#languagebcp47

"zh" 、 "zh-CN" 、 "zh-hans" 、 "zh-Hans-CN" 、 "zh-Hant" 、 "zh-Hant-HK" 、 "zh-Hant-TW" 、 "zh-HK" 、 "zh-Latn" 、 "zh-TW" 、 "zxx-x-iat"

[58] Multilingual names - OpenStreetMap Wiki, https://wiki.openstreetmap.org/wiki/Multilingual_names#China

Romanization/Transliteration systemdefined code
Pinyin romanizationzh-Latn-pinyin
Tongyong Pinyin romanizationzh-Latn-tongyong
Wade-Giles romanizationzh-Latn-wadegile
Jyutping Cantonese Romanizationyue-Latn-jyutping

bo-Latn-pinyin

bo-Latn-wylie

mnc-Latn-moellendorff

[59] Multilingual names - OpenStreetMap Wiki, https://wiki.openstreetmap.org/wiki/Multilingual_names#Taiwan

Or use name:zh-Latn-pinyin=*, name:zh-Latn-tongyong=*, name:zh-Latn-wadegile=*

[91]

Former official transcription standard for Mandarin Chinese in Taiwan.

として tongyong (接頭辞: zh-latn) が登録されました。

注音符号表記

[61] 注音字母表記の中文言語タグ zh-Bopo があります。 >>60

[62] 漢字および注音字母表記の中文言語タグ zh-Hanb があります。 >>60

[63] Bopo はともかく Hanb が必要な場面があるのかは謎です。 Jpan 式の仮名漢字混じり (文中で仮名漢字を使い分ける) ではなくルビ付き (漢字注音符号を明記する) を表したいときなら Hanb が便利でしょうか?

中文版Wikipediaの中国語

[11] 維基百科 (Wikipedia) は中文版として1つにまとまっていますが、各ページに

... の6バージョンの切り替えがついていて、同じ記事が変換して表示されるようになっています。

[12] ソースを見ると、

<link rel="alternate" hreflang="zh" href="/zh/Wikipedia:%E9%A6%96%E9%A1%B5"/>
<link rel="alternate" hreflang="zh-Hans" href="/zh-hans/Wikipedia:%E9%A6%96%E9%A1%B5"/>
<link rel="alternate" hreflang="zh-Hant" href="/zh-hant/Wikipedia:%E9%A6%96%E9%A1%B5"/>
<link rel="alternate" hreflang="zh-Hans-CN" href="/zh-cn/Wikipedia:%E9%A6%96%E9%A1%B5"/>
<link rel="alternate" hreflang="zh-Hant-HK" href="/zh-hk/Wikipedia:%E9%A6%96%E9%A1%B5"/>
<link rel="alternate" hreflang="zh-Hant-MO" href="/zh-mo/Wikipedia:%E9%A6%96%E9%A1%B5"/>
<link rel="alternate" hreflang="zh-Hans-MY" href="/zh-my/Wikipedia:%E9%A6%96%E9%A1%B5"/>
<link rel="alternate" hreflang="zh-Hans-SG" href="/zh-sg/Wikipedia:%E9%A6%96%E9%A1%B5"/>
<link rel="alternate" hreflang="zh-Hant-TW" href="/zh-tw/Wikipedia:%E9%A6%96%E9%A1%B5"/>
<link rel="alternate" hreflang="x-default" href="/wiki/Wikipedia:%E9%A6%96%E9%A1%B5"/>

... とそれ以外にも地域指定なしの URL が存在しています。 hans, hant を選ぶと、 地域なしの简体、繁體のバージョンが表示されます。 (地域指定ありのバージョンとの違いは不明。)

[16] 中国語版ウィキペディア - Wikipedia ( 版) http://ja.wikipedia.org/wiki/%E4%B8%AD%E5%9B%BD%E8%AA%9E%E7%89%88%E3%82%A6%E3%82%A3%E3%82%AD%E3%83%9A%E3%83%87%E3%82%A3%E3%82%A2#.E7.B9.81.E4.BD.93.E5.AD.97.E3.81.A8.E7.B0.A1.E4.BD.93.E5.AD.97.E3.81.AE.E8.87.AA.E5.8B.95.E5.A4.89.E6.8F.9B

[15] Automatic conversion between simplified and traditional Chinese - Meta ( 版) http://meta.wikimedia.org/wiki/Automatic_conversion_between_simplified_and_traditional_Chinese

zh の解釈

[85] Chromezh-TW 等の他の区分に当てはまらない zh 系の言語タグzh-CN 扱いするようにみえます。

[86] Firefox はそんな単純ではないようにみえ、要検証です。

一致判定

[57] 同じ意味の言語タグがたくさんあるので、一致判定演算はかなり複雑になります。 言語タグの一致

メモ

[105] OpenType には ISO 639 zho に関係するものとして次の言語系タグがあります。 >>104

[419] OpenType用字系タグ中文と関係が深いもの:


[21] ポケモンWiki:会議室/議事録/2019 - ポケモンWiki, , https://wiki.xn--rckteqa2e.com/wiki/%E3%83%9D%E3%82%B1%E3%83%A2%E3%83%B3Wiki:%E4%BC%9A%E8%AD%B0%E5%AE%A4/%E8%AD%B0%E4%BA%8B%E9%8C%B2/2019#%E3%83%9D%E3%82%B1%E3%83%A2%E3%83%B3%E3%81%AE%E4%B8%AD%E5%9B%BD%E8%AA%9E%E5%90%8D%E3%81%AE%E8%A1%A8%E7%A4%BA

[22] 中国語ウェブサイトの言語コード指定(lang属性) | 国際ウェブマーケティングのエクスポート・ジャパン, https://www.export-japan.co.jp/blog/%E4%B8%AD%E5%9B%BD%E8%AA%9E%E3%82%A6%E3%82%A7%E3%83%96%E3%82%B5%E3%82%A4%E3%83%88%E3%81%AE%E8%A8%80%E8%AA%9E%E3%82%B3%E3%83%BC%E3%83%89%E6%8C%87%E5%AE%9A%EF%BC%88lang%E5%B1%9E%E6%80%A7%EF%BC%89/

[64] イマーシブ リーダーの言語サポート - Azure AI services | Microsoft Learn, rwallerms, https://learn.microsoft.com/ja-jp/azure/ai-services/immersive-reader/language-support
Chinesezh
中国語 (中国)zh-CN
中国語 (香港特別行政区)zh-HK
中国語 (中華人民共和国マカオ特別行政区)zh-MO
中国語 (シンガポール)zh-SG
中国語 (台湾)zh-TW
簡体中国語zh-Hans
簡体字中国語 (中国)zh-Hans-CN
簡体字中国語 (シンガポール)zh-Hans-SG
中国語 (繁体字)zh-Hant
繁体字中国語 (中国)zh-Hant-CN
繁体中国語 (香港特別行政区)zh-Hant-HK
繁体中国語 (マカオ特別行政区)zh-Hant-MO
繁体字中国語 (台湾)zh-Hant-TW
中国語 (文語)lzh
中国語 (文語、中国)lzh-CN