言語情報

言語符号 (一般)

[1] 言語符号 (language code) は、一般に言語を識別するための符号を言います。 通常はラテン文字数字などの短い文字列によって言語を表すものを言います。

言語符号体系

[11] 言語符号体系

[8] ロケール識別子, 用字系符号も参照。

[9] Country, region, and language codes - Microsoft Support, https://support.microsoft.com/en-us/topic/country-region-and-language-codes-add36afe-804a-44f1-ae68-cfb9c9b72f8b

[10] >>9 IETF言語タグに似ているがそうとは明記されていないし、 zh-chs などは独自。

[12] Verify > Verify の言語 | Vonage API Developer, https://developer.vonage.com/ja/verify/guides/verify-languages

[13] >>12 IETF言語タグに似ているがそうとは明記されていない。

[17] GitHub - dmort27/epitran: A tool for transcribing orthographic text as IPA (International Phonetic Alphabet), https://github.com/dmort27/epitran#transliteration-languagescript-pairs

[18] ISO language codes | Andiamo! The Language Professionals, https://www.andiamo.co.uk/resources/iso-language-codes/

Here is a list of the most common ISO language codes, conforming to the ISO 639-1 standard, complete with two letter country codes where relevant.

[19] >>18 いかにも ISO 639言語符号の一覧であるかのような表ですが、 この説明の通り、独自の拡張が加わっています。 例えば ar は掲載がないかわりに

Arabic (Algeria)ar-dz

などがあり、 en

Englishen
English (Australia)en-au

など en-* がいくつかあったりします。この会社の独自の基準で細かく分割したものだけ掲載したり、 全体と細かい分割を両方掲載したりしていると思われます。

[21] この表をVimeoのドキュメントが「標準言語コードのリスト」として参照しています。 >>20 この表の会社は

Andiamo! Language Services Ltd is a professional language services provider offering high quality, accurate translations.

と自己紹介していて >>18、一見 Vimeoとは無関係ですが、 もしかして業務上関係あったりするのでしょうか?

[22] Incubator Plus 2.0, , https://incubator.miraheze.org/wiki/Main_Page

[23] >>22 Wikipedia 系統のウィキを新しい言語で実験的に創始するプロジェクトで、 いろいろな言語とその符号が並んでいます。個別ページを開くと ISO 639-3 という欄にその符号が提示されていたりします。 しかし実際に ISO 639-3符号であることもあれば、そうでないこともあり、3文字符号ですらないことまであります。

[24] 関連: 日本語言語タグ, 中文言語タグ

言語情報の記述

言語指定

言語情報の利用

言語指定, 言語情報

関連

用字系符号, 国符号

メモ

[14] CLACode_SRI/sys_disc.md at conla · CL-KIITA/CLACode_SRI · GitHub, https://github.com/CL-KIITA/CLACode_SRI/blob/conla/docs/spec/sys_disc.md

[15] INBUDS Technical Notes, , https://web.archive.org/web/20030406153700/http://www.inbuds.net/jpn/tech.html

論文の論述部分・地の文で主として使用されている言語(引用文献や論題、用語などの言語ではない)。ISO 3166 Code3で表現する。

例: JPN

注・本来ならばISO 639に基づく言語コードを用いるべきだろうが、INBUDS設計当初に国別コードであるISO 3166を用いると決まったので、現在のところそれを踏襲している。

[16] INBUDS Technical Notes, , https://www.inbuds.net/jpn/tech.html

論文の論述部分・地の文で主として使用されている言語(引用文献や論題、用語などの言語ではない)。ISO 639(3文字コード)で表記する。ISO 639 についてはこちらを参照。(複数候補がある場合は左端を採用)

例: jpn

注)古いデータで未修正の箇所では、2文字コードで表記されている。