Internationalized Domain Names

Internationalized Domain Names

[1] IDN (Internationalized Domain Name国際化ドメイン名) は、 文字集合ASCII から Unicode に拡大したドメイン名です。

[51] IDNA2003 では ASCII文字のみのドメイン名IDN に含んでいましたが、 IDNA2008 では非ASCII文字またはPunycodeを含むものだけを IDN と呼んでいます。

[13] IDN の利用方法は IDNA として定義されています。 IDNPunycode によって符号化 (ASCII文字に転写) することによって、 DNS をはじめとする各種のプロトコルで利用することができます。

仕様書

定義

IDNA2003 における定義

[11]

An "internationalized domain name" (IDN) is a domain name in which every label is an internationalized label. This implies that every ASCII domain name is an IDN (which implies that it is possible for a name to be an IDN without it containing any non-ASCII characters). This document does not attempt to define an "internationalized host name". Just as has been the case with ASCII names, some DNS zone administrators may impose restrictions, beyond those imposed by DNS or IDNA, on the characters or strings that may be registered as labels in their zones. Such restrictions have no impact on the syntax or semantics of DNS protocol messages; a query for a name that matches no records will yield the same response regardless of the reason why it is not in the zone. Clients issuing queries or interpreting responses cannot be assumed to have any knowledge of zone-specific restrictions or conventions. >>16

[23] RFC 3490 2.

国際化ドメイン名 (こくさいかどめいんめい) (internationalized domain name) (IDN) は、 各名札国際化名札であるドメイン名です。 すべての ASCII ドメイン名IDN です (つまり、非ASCII文字を含んでいない名前IDN となり得ます)。 この文書国際化ホスト名 (こくさいかほすとめい) (internationalized host name) は定義しようとしません。 ASCII名前の場合同様、 DNS 領域管理者DNSIDNA の制約以上の制約を領域中に名札として登録できる文字文字列に課しても構いません。 そのような制約は DNS プロトコルメッセージ構文意味には影響しません。 どの記録にも一致しない名前への照会は、 なぜそれが領域中に存在しないのかの理由如何を問わず、 同じ応答を得ることになります。 照会を発行したり、応答を解釈したりするクライアント領域特有の制限や慣習についての知識を有すると仮定することはできません。

IDNA2008 における定義

[41]

An "internationalized domain name" (IDN) is a domain name that contains at least one A-label or U-label, but that otherwise may contain any mixture of NR-LDH labels, A-labels, or U-labels. Just as has been the case with ASCII names, some DNS zone administrators may impose restrictions, beyond those imposed by DNS or IDNA, on the characters or strings that may be registered as labels in their zones. Because of the diversity of characters that can be used in a U-label and the confusion they might cause, such restrictions are mandatory for IDN registries and zones even though the particular restrictions are not part of these specifications (the issue is discussed in more detail in Section 4.3 of the Protocol document [RFC5891]. Because these restrictions, commonly known as "registry restrictions", only affect what can be registered and not lookup processing, they have no effect on the syntax or semantics of DNS protocol messages; a query for a name that matches no records will yield the same response regardless of the reason why it is not in the zone. Clients issuing queries or interpreting responses cannot be assumed to have any knowledge of zone-specific restrictions or conventions. See the section on registration policy in the Rationale document [RFC5894] for additional discussion. >>43

処理モデル

[40] ドメイン名スロットの項を参照。

比較

[25] 2つのラベルは、

... 両者が一致する場合に、等価 (equivalent) です。 >>17

[27] 2つのラベル比較では、 両者が等価である場合、その場合に限って、一致 (match) するとして扱わなければなりません>>17

[26] 2つの名前比較では、ラベル分離子が何であるかに関わらず、 対応するラベルがそれぞれ一致していれば、その場合に限って、一致 (match) するとして扱わなければなりません>>17

レンダリング

[8] IDN-enabled TLDs

[71] IDN Display Algorithm - MozillaWiki ( ( 版)) https://wiki.mozilla.org/IDN_Display_Algorithm

[22] network.IDN.blacklist_chars

[20] IDN in Google Chrome - The Chromium Projects ( 版) https://www.chromium.org/developers/design-documents/idn-in-google-chrome

言語との関係

[58] ドメイン名言語における単語を元に構成されていたりしますが、必ずしも自然言語文ではなく、 むしろ mnemonics >>62, >>61 であります。そのため必ずしも正書法上好ましい表記ができなくて構いませんし >>62言語タグのようなものを付与もしません >>61DNS言語とは独立した全世界的なものであり、言語のような文脈に依存した情報により限定するのはふさわしくない >>62 と考えられています。

歴史

[88] RFC 2825 - A Tangled Web: Issues of I18N, Domain Names, and the Other Internet protocols, , https://tools.ietf.org/html/rfc2825

[89] RFC Errata Report » RFC Editor, https://www.rfc-editor.org/errata_search.php?rfc=2825

ACE

IDN 表示による脆弱性

[55] 前々から薄々気づかれてはいましたが、 Unicode には似た文字が沢山あり、 また怪しい句読点制御文字の類も色々あり、 IDN の表示がフィッシング的な意味での脆弱性をもたらすことになりました。

[56] この問題は2005年頃に世界的に大きく取り上げられ、 IDN 対応を進めていた Webブラウザーが表示をAラベルのままとするなどの対策が取られました。

[57] この問題は IETFIESGIABICANN などでも重視され、 Unicode の版の問題なとと合わせて RFC 4960 を経て IDNA2008 へとつながります。

運用ガイドラインから IDNA 改訂へ

[53] IESG Statement on IDN http://www.ietf.org/iesg/statement/idn.html

[34] ICANN | Guidelines for the Implementation of Internationalized Domain Names http://www.icann.org/en/general/idn-guidelines-20jun03.htm

[54] ICANN | Guidelines for the Implementation of Internationalized Domain Names, Draft Version 2.0 http://www.icann.org/en/general/idn-guidelines-20sep05.htm

[52] RFC 4690 - Review and Recommendations for Internationalized Domain Names (IDNs) http://tools.ietf.org/html/rfc4690

再び UTF-8 (2011)

[68] IDN に関する IAB の見解を記したこの文書では、 Punycode ベースの IDNA よりも UTF-8 ベースの方法の利点を改めて検討するべきだと指摘しています。

それによると、 IDNA は既存のライブラリーへの変更を行わずにアプリケーションのみで IDN に対応しようと試みていますが、実際には

... といった状況になっています。

[69] なお、非ASCII文字については大文字・小文字区別ありで、 ASCII の部分だけ大文字・小文字不区別となっています。しかし一部の実装は非ASCII文字についても大文字・小文字不区別となっているため、 問題となっていると指摘されています。

参考

[3] スラッシュドット ジャパン | 国際化ドメイン名対応Webブラウザにアドレス詐称の懸念 http://slashdot.jp/security/05/02/08/0515249.shtml?topic=74

アルファベットの 'a' の代わりにキリル文字の 'а' を使うなど、信頼されているサイトのURLに使われている文字に字形の似た別の文字を使うことで、アドレスバーなどのURL表示を信頼されているサイトのURLのように見せかけることができるという点。

予定通りこういう問題がでてきたわけですが。 (名無しさん 2005-02-08 12:05:48 +00:00)

[4] Bug 4279 - IDNを含むURL表示のセキュリティ問題(U+2215を含むドメイン名) http://bugzilla.mozilla.gr.jp/show_bug.cgi?id=4279 (名無しさん [sage])

[5] ヘサヤ大墨堂、日本語ドメイン「ぢ.jp」を申請 http://internet.watch.impress.co.jp/www/article/2003/0401/uocchi/hesaya.htm (名無しさん [sage])

[6] RFC 4185 National and Local Characters for DNS Top Level Domain (TLD) Names urn:ietf:rfc:4185 (名無しさん 2005-10-20 02:16:46 +00:00)

[7] スラッシュドット ジャパン | 中国が独自に漢字TLDを開始? http://slashdot.jp/articles/06/03/03/0023222.shtml (名無しさん 2006-03-03 01:57:28 +00:00)

[9] 貓朋狗友鳥事人家 ( 版) http://cats--dogs.blogspot.com/

「--」

[10] ICANN | First IDN ccTLDs Requests Successfully Pass String Evaluation ( 版) http://icann.org/en/announcements/announcement-21jan10-en.htm

[28] Internationalized Domain Names (IDN) Support in Mozilla Browsers - MDC Doc Center ( ( 版)) https://developer.mozilla.org/ja/Internationalized_Domain_Names_(IDN)_Support_in_Mozilla_Browsers

[29] ブラウザからの日本語ドメイン名アクセス確認用サービスの提供について / JPRS ( ( 版)) http://jprs.jp/info/notice/030630.html

[30] 日本語ドメイン名Webサイトへのアクセス ( ( 版)) http://jdna.jp/jdn/browsers/

[31] 日本語JPドメイン名のRFC準拠に伴う移行について / JPRS ( ( 版)) http://jprs.jp/info/notice/ace-transition.html

[32] 【レポート】国際化ドメインプレフィックス確定の持つ意味 | ネット | マイコミジャーナル ( (Mainichi Communications Inc. 著, 版)) http://journal.mycom.co.jp/news/2003/02/17/14.html

[33] ICANN | Deployment of Internationalized Domain Names ( ( 版)) http://www.icann.org/en/announcements/announcement-20jun03.htm

[35] 国際化ドメイン名 ( ( 版)) http://www.nic.ad.jp/ja/dom/idn.html

[36] 国際化.orgドメイン名延命 - スラッシュドット・ジャパン ( ( 版)) http://slashdot.jp/it/article.pl?sid=04/01/19/1543238

[38] Changes to IDN in IE7 to now allow mixing of scripts - IEBlog - Site Home - MSDN Blogs ( ( 版)) http://blogs.msdn.com/b/ie/archive/2006/07/31/684337.aspx

[39] Valid character tables for IDNs per TLD ( ( 版)) http://tldchk.berlios.de/

[63] RFC 5992 - Internationalized Domain Names Registration and Administration Guidelines for European Languages Using Cyrillic ( ( 版)) http://tools.ietf.org/html/rfc5992

[70] IDNS Common Glossary - IUCG - Internet Users Contributing Group ( ( 版)) http://iucg.org/wiki/IDNS_Common_Glossary

[73] draft-davies-idntables-08 - Representing Label Generation Rulesets using XML ( ( 版)) https://tools.ietf.org/html/draft-davies-idntables-08

[74] 国際化.orgドメインが2/1で一括消去されることに | スラッシュドット・ジャパン ( ( 版)) http://slashdot.jp/story/04/01/13/1651232/%E5%9B%BD%E9%9A%9B%E5%8C%96.org%E3%83%89%E3%83%A1%E3%82%A4%E3%83%B3%E3%81%8C21%E3%81%A7%E4%B8%80%E6%8B%AC%E6%B6%88%E5%8E%BB%E3%81%95%E3%82%8C%E3%82%8B%E3%81%93%E3%81%A8%E3%81%AB

[75] .comと.netで国際化されたドメイン名が利用可能に | スラッシュドット・ジャパン ( ( 版)) http://slashdot.jp/story/03/12/16/1356256/.com%E3%81%A8.net%E3%81%A7%E5%9B%BD%E9%9A%9B%E5%8C%96%E3%81%95%E3%82%8C%E3%81%9F%E3%83%89%E3%83%A1%E3%82%A4%E3%83%B3%E5%90%8D%E3%81%8C%E5%88%A9%E7%94%A8%E5%8F%AF%E8%83%BD%E3%81%AB

[76] !JP 汎用JPドメイン名登録等に関する技術細則 ( ( 版)) http://jprs.jp/doc/rule/saisoku-1-wideusejp.html

[18] ( 版) http://pi.cr.yp.to/

[19] daniel.haxx.se » curl, smiley-URLs and libc ( 版) http://daniel.haxx.se/blog/2015/02/24/curl-smiley-urls-and-libc/

[21] Resources - ICANN ( 著, 版) https://www.icann.org/resources/pages/idn-guidelines-2003-06-20-en

[24] International Domain Name Support in Internet Explorer 7 ( 版) https://msdn.microsoft.com/en-us/library/bb250505(VS.85).aspx

[37] フロントページ - JGPWiki ( 版) http://j-gp.jp/

「日本語生成パネル(Japanese Generation Panel; JGP)」 は、DNS (Domain Name System)のルートゾーンにおける日本語の新gTLD (New generic Top Level Domain)の文字列が従うべきルールを検討し、ICANN (The Internet Corporation for Assigned Names and Numbers)に対して提案を行うことを目的としたパネルです。

[64] 国際化ドメイン名(IDN)でマルチバイト文字を含め最長何文字のラベルを作れるのか - Qiita ( 版) http://qiita.com/hnw/items/35e6ffce58961c1280a1

[65] RFC 4290 - Suggested Practices for Registration of Internationalized Domain Names (IDN) () https://tools.ietf.org/html/rfc4290

[66] RFC 4713 - Registration and Administration Recommendations for Chinese Domain Names () https://tools.ietf.org/html/rfc4713

[72] SUPPORTING THE ARABIC LANGUAGE IN DOMAIN NAMES () http://arabic-domains.org/docs/NIC-docs/SupportingArabicDomainNmaes.pdf

[77] Googleとは無関係の「ɢoogle.com」というサイトが確認される | スラド IT () https://it.srad.jp/story/16/11/24/0434203/

[78] This Phishing Attack is Almost Impossible to Detect On Chrome, Firefox and Opera (Mohit Kumar著, ) http://thehackernews.com/2017/04/unicode-Punycode-phishing-attack.html

аррӏе.com

[79] ChromeとFirefoxのホモグラフ攻撃対策を迂回する方法 | スラド IT () https://it.srad.jp/story/17/04/21/0447206/

[80] RFC 7483 - JSON Responses for the Registration Data Access Protocol (RDAP) () https://tools.ietf.org/html/rfc7483#section-3

Unicode names: Textual representations of DNS names where one or

more of the labels are U-labels as described by

[RFC5890]. Trailing periods are optional.

[81] IDN-enabled TLDs — Mozilla () https://www.mozilla.org/en-US/about/governance/policies/security-group/tld-idn/

[82] IDN Display Algorithm - MozillaWiki () https://wiki.mozilla.org/IDN_Display_Algorithm

[83] Welcome To ThaiURL.com : Thai Domain Name Registration () https://web.archive.org/web/20010822041021/http://www.thaiurl.com:80/

[84] Welcome To ThaiURL.com : Thai Domain Name Registration () https://web.archive.org/web/20010520194101/http://www.thainame.com:80/

[85] IROIRO 2000a () https://web.archive.org/web/20010714194835/http://www.asahi-net.or.jp:80/~ez3k-msym/iroiro00a.htm

タイではすでに(専用のソフトウェアによって), タイ語でドメイン名をつけるのが普通になっているそうだ。 Thainame.com や Thaiurl.com といったポータルサイトはこれを利用している。

[86] CNS 14838

[87] 定期預金 金利比較|口コミ人気ランキング<2021年2月> (, ) https://xn----1eujk4t7btdb7179dbgh70ec72amh8ab1n42ay002bx7ja3941a.com/lp.html?gclid=Cj0KCQiAvbiBBhD-ARIsAGM48byqFGdfLpmmV_DvHdmUoCwtZese4z5CL5hBAC9nxCs3aL_mDkNakH0aApRYEALw_wcB

連絡先:mail@xn----1eujk4t7btdb7179dbgh70ec72amh8ab1n42ay002bx7ja3941a.com

[90] rfc4185 () https://datatracker.ietf.org/doc/html/rfc4185

[91] RFC 4290: Suggested Practices for Registration of Internationalized Domain Names (IDN) () https://www.rfc-editor.org/rfc/rfc4290.html

[92] RFC Errata Report » RFC Editor () https://www.rfc-editor.org/errata/rfc4290

[93] 日本語LGR提案書(v0.15)の概要 - JGPWiki () https://j-gp.jp/%E6%97%A5%E6%9C%AC%E8%AA%9ELGR%E6%8F%90%E6%A1%88%E6%9B%B8%28v0.15%29%E3%81%AE%E6%A6%82%E8%A6%81

[94] 帯状疱疹予防.jp|帯状疱疹の原因から症状・予防について, , https://taijouhoushin-yobou.jp/

[95] >>94 このサイトの title に「帯状疱疹予防.jp」、 ロゴに「 () (たい) () (じょう) () (ほう) () (しん) 予防.jp」。 でも IDN じゃないじゃん、と思って https://帯状疱疹予防.jp にアクセスしてみると、 >>94リダイレクトされる。 同じところが日本語ドメイン名も持っているようだ。

[96] それにしてもドメイン名傍点振り仮名傍点はともかく振り仮名ドメイン名に使えないのはおかしい。 (どうやって入力するんだ?という疑問があるが、それが疑問になってしまう現状がすべておかしい。) ASCII だけじゃだめだ、世界各地のネイティブな文字文化をドメイン名に使えるようにしろ、 というなら振り仮名縦書き返り点もちゃんと書けるようにしろ、 という話になってもおかしくないはずなのに、誰も言い出さないのが謎。

[97] JPRS さん、 JPNIC さん、 あなたに向けて語りかけています。聞こえていますか。 国を背負って独占事業を請け負っている特権事業者だから、儲かること以外もちゃんとやってください。