* TCVN 5773

[1] 
[DFN[TCVN 5773:1993]]
[CITE[Information technology. Nom 16-bit standard coded set for information interchange]]。

[8] 
[[TCVN 5773:1993]]
([DFN[NSCII]] - Nom Standard Code for Information Interchange [SRC[>>11]])
は、2357文字の[[字喃]]を含む[[符号化文字集合]]。

[9] 
[[ハノイ]]の国立社会科学センター字喃研究所が中心となって制定されたらしい。
[[UCS]] [[CJK統合漢字]]の [[V]] 欄の [Q[0]] はこの規格の符号とされている。

[15] 
[[Unicode Consortium]] の[[ウェブサイト]]で
[CITE[TCVN-NSCII Stack 1.0]]
という [[HyperCard]] [[スタック]]
([[カード型データベース]])
のファイルが配布されています。
[SRC[>>3]]

[16] 
これが [[TCVN 5773]] 
の文字データベースらしいのです [SRC[>>11]] が、
果たして今 [[HyperCard]] データベースを表示する方法があるのかどうか。
同じと思われるファイルが [[Internet Archive]]
にも所蔵されています [SRC[>>4]] が、
こちらもファイル変換されていないオリジナルで、内容は確認のしようがありません。

[17] 
[[NSCII]] は16ビットの[[符号化文字集合]]。 [SRC[>>11]]

[18] 
[[HyperCard]] には2357カードあって、
それが
[[NSCII]]
[[字喃]]と対応しているとのことです。 [SRC[>>11]]

[12] 
[[ISO/IEC 10646]]‐1:1993 の [[BMP]] を基にして、
1775文字の字喃を (V+A000〜V+A6EE) 追加しています。 [SRC[>>1, >>11]]
その差分が [[BMP]] の既存の文字
([[CJK統合漢字]]のみ?)
と思われます。

[13] 
字喃の典拠は Nguyen Quang Xy and Vu Van Kinh の [CITE[Tu dien chu Nom]] 
(字喃辞典, Nom Dictionary; 1971年) だそうだ [SRC[>>1, >>11]]。

[30] 
[TIME[1992-03-22]]に
[DFN[[CITE[Nôm Proper Code Table]]]]
([DFN[NPCT]])
がまとめられました。
[SRC[>>33]]

[34] 
[[NPCT]] は [[ISO/IEC 10646]] と [[Unicode]] に対する追加要求として[[字喃]]を列挙したものでした。
N0001 から N2403 まで十進数が振られていました。
[[字形]]は手書き、その他も手書きの修正が入って、
N2401 と N2402 は手書きで追加されたものでした。
[SRC[>>33]]

[35] 
このときの [[Unicode]] 向け説明資料に既に[[結合文字]]「个」の説明がある 
[SRC[>>33 #page=4]]
のに注意したいです。これが [[Unicode]] に追加されるまで、
なぜかそれから二十年程要しました。
[SEE[ [[Vietnamese reading mark]] ]]

[38] 
[TIME[1993-05-03]]に
TCVN/TC1 Subcommittee for Standardization of Nôm Codes
によって
[DFN[NPCT 2.0]]
が
Nôm Standard Codes for Information Interchange
の
Draft 1.0 
([DFN[TCVN-NSCII-Draft-1.0]])
として採択されました。
[SRC[>>37]]

;; [39] 2.0 は未発見でウェブ上にあるか不明。
内外の専門家37人に配布されたとのこと [SRC[>>37]]。

[31] 
[TIME[1993-08-22]]に改訂されて 
[DFN[NPCT 2.1]]
となりました。
[SRC[>>37]]
そして [[NPCT]] V2.1 が 
[[TCVN 5773:1993]]
となりました。
[SRC[>>26]]

[87] 
[DFN[TCVN 5773-1993]] のごく一部のページが >>86 にあります。
[[英語]]で書かれているようですが、
原文なのでしょうか。それとも英訳版なのでしょうか。

[88] [[NPCT 2.1]] と同じように [CODE[U+]] / [CODE[V+]] と[[例示字形]]、
[[越南語国語表記]]が並んでいます。

[REFS[
- [86] [CITE[Proposal to Encode Two Vietnamese Alternate Reading Marks - 17373-viet-alt-reading-marks.pdf]], [TIME[2017-10-13T21:31:47.000Z]], [TIME[2022-11-09T12:39:37.183Z]] <https://www.unicode.org/L2/L2017/17373-viet-alt-reading-marks.pdf#page=10>
]REFS]

[41] 
[[NPCT 2.1]]
は当時の
[[CJK統合漢字]]にあるものは [CODE[[[U+]][VAR[hhhh]]]]
の[[符号位置]]、
ないものは
[CODE[[[V+]][VAR[hhhh]]]]
を割り振っていました。
表の掲載順に、 [[CJK統合漢字]]を除いて連番になっていました。
[[文字]]は低品質の[[ビットマップフォント]]のようですが、
一応デジタルデータになっていました。
[SRC[>>26]]

[42] 
个など2文字が[[結合マーク]]と明記されている
[SRC[>>26 #page=1]] ことがやはり注目されます。
[SEE[ [[Vietnamese reading mark]] ]]

[43] 
2.0 と比べると符号やグリフの変更があったとする一覧があります。
[SRC[>>26]]

;; [40] [[NPCT 2.1]] の [[PDF]] [SRC[>>26]] は文字画像以外はテキストデータ。
おそらくワープロか何かの元データを後年になって [[PDF]] 化したものでしょう。
どの程度原形を保っているのか不明。


[19] 
[[HyperCard]] カードには、
[[グリフ]],
[[Quoc ngu]] 表記 ([[TCVN-5712:1993]] 表現),
[[文字符号]]が表示されています。 [SRC[>>11]]

[20] 
[[文字符号]]は、
[[Unicode]] の [CODE[[[U+]][VAR[hhhh]]]]
または独自の
[CODE[[[V+]][VARR[hhhh]]]]
です。
他の [ASIS[[[CJKV]]]] 規格にあれば、それも示されています。
[SRC[>>11]]


[59] 
この [DFN[V+]] 符号は、 [[Unicode]] の [CODE[U+]] と一応区別はされていますが、
当時 [[Unicode]] の未割当領域だった 
[ [CODE[U+A000]], [CODE[U+A6EE]] ]
に割り振って提案したものでした。
実際にはその後別の [[Unicode]] [[符号点]]に割り振られ、
[CODE[V+]] が使っていた領域は[[漢字]]ではないものが割り当てられています。
[SRC[>>26]]

;; [60] 他の事例は[[Unicode非互換割当]]参照

[14] 
[TIME[西暦1998年][1998]]に誤りが見つかって修正要求が出された [SRC[>>2]]。

[21] 
[[HyperCard]] データベースにその誤りが関係しているのか不明ですが、
ファイルの[[タイムスタンプ]]は[TIME[2001-02-27]]なので、
影響があれば修正後でしょうか。

[REFS[
-
[33] 
[CITE[draft_npct_19920322.pdf]], [TIME[2008-12-03T22:04:43.000Z]], [TIME[2022-11-08T13:45:54.700Z]] <https://cs.nyu.edu/~nhan/draft_npct_19920322.pdf>
-
[37] 
[CITE[npct-2.1.pdf]], [TIME[2001-08-22T13:54:44.000Z]], [TIME[2022-11-08T14:13:45.670Z]] <https://cs.nyu.edu/~nhan/npct-2.1.pdf>
-[1] ISO/IEC JTC1/[[SC2]]/WG2/[[IRG]] N403
-[2] ISO/IEC JTC1/[[SC2]]/WG2/IRG N451
-
[3] [CITE[Index of /Public/MAPPINGS/OBSOLETE/EASTASIA/TCVN]], [TIME[2022-10-16T13:10:33.000Z]] <https://www.unicode.org/Public/MAPPINGS/OBSOLETE/EASTASIA/TCVN/>
--
[11] 
[TIME[2001-02-27T18:50:00.000Z]], [TIME[2022-11-07T11:42:28.647Z]] <https://www.unicode.org/Public/MAPPINGS/OBSOLETE/EASTASIA/TCVN/ReadMe.txt>
-
[4] [CITE@en[[[TCVN-NSCII]] Stack, version 1.0 : James Do, TCVN/TC1 : Free Download, Borrow, and Streaming : Internet Archive]], [TIME[2022-10-16T13:11:45.000Z]] <https://archive.org/details/hypercard_tcvn-nscii-stack-version-10>
]REFS]

- [48] [[Unicode Consortium]] 謹製の変換表
(Macintosh HyperCard 2.1 形式 — もっと使いやすい形式にしろよ)
<http://www.unicode.org/Public/MAPPINGS/OBSOLETE/EASTASIA/TCVN/>


[23] 
[[TCVN 5773:1993]]
は
[[TCVN 8271-2:2009]]
によって置き換えられたとされます。
[SEE[ [[TCVN 8271-2:2009]] ]]

;; [24] 
[[TCVN 5773:1993]]
にあった [[CJK統合漢字]]の出典としての情報が
[[TCVN 8271-2:2009]]
に含まれているのかは不明.


[58] 
その後の調査によると [[NPCT 2.1]] と [[CJK統合漢字]]の [[V0]]
で[[字形]]が異なるもの、出典 [[V0]] として掲載されていないもの、
[[CJK統合漢字]]から漏れているものが多数あるようです。
[SRC[>>26]]

[REFS[
- [26] [CITE[IRGN2429_V0-SourceCorrections.pdf]], [TIME[2020-03-09T06:17:27.000Z]], [TIME[2022-11-08T13:34:44.965Z]] <https://appsrv.cse.cuhk.edu.hk/~irg/irg/irg53/IRGN2429_V0-SourceCorrections.pdf>
-- [27] [CITE[IRGN2429R_V0SourceCorrections.pdf]], [TIME[2020-06-23T10:11:50.000Z]], [TIME[2022-11-08T13:34:56.959Z]] <https://appsrv.cse.cuhk.edu.hk/~irg/irg/irg53/IRGN2429R_V0SourceCorrections.pdf>
-- [28] [CITE[20234-v0-src-corr-irgn2429r.pdf]], [TIME[2020-09-21T13:37:38.000Z]], [TIME[2022-11-08T13:35:04.706Z]] <https://www.unicode.org/L2/L2020/20234-v0-src-corr-irgn2429r.pdf>
-- [29] >>26 の改訂が >>27 = >>28
]REFS]

-*-*-

[61] 
[[CJK統合漢字]]の出典 [[V0]] [[TCVN 5773:1993]]
は [[94[SUP[2]]集合]]の形式になっていますが、
[[NPCT 2.1]] には 
[CODE[U+]] / [CODE[V+]] の [[Unicode]] [[符号位置]]しか掲載されていません。
[[TCVN 5773:1993]]
も同様らしいです。
[SRC[>>26]]

[62] 
[[NPCT 2.1]] の一覧表の掲載位置から [[V0]] へは計算式で変換できます。
[SRC[>>26]]
つまり [[V0]] は [[NPCT 2.1]] の一覧表の順番で [[94[SUP[2]]文字集合]]の
16区から41区に配置したもののようです。


[89] 
[[Unicode 3.0]] の [[Unihan]] の [[V0]] はおかしなことになっていました。
[[V1]] の [[TCVN 6056:1995]] が当時は[[94[SUP[2]]集合]]の1区から並べられていた
(>>74) のと同じように、
[[CJK統合漢字]] [[URO]] に対応する [[V0]] は1区から並べられていたようです [SRC[>>69]]。
しかし[[CJK統合漢字]]拡張Aに対応する [[V1]] は16区から並べられていたようです
[SRC[>>69]]。
その後のもの [SRC[>>78]] と比較すると、
拡張A部分はほぼ同じで、現在の [[Unihan]] ともほぼ同じなのですが、
[[URO]] 部分は16区分変更されています。

;; [158] なお当時の [[Unihan]] の注釈では [[V0]] と [[V1]] のことを [[V1]] と [[V2]]
と書いていました。

[90] 1区始まりの領域と16区始まりの領域は重なるので、 
[[Unicode 3.0]] の [[Unihan]] には

>
[PRE[
U+34ED  kIRG_VSource    0-304E
]PRE]
>[SNIP[]]
>
[PRE[
U+7A6D  kIRG_VSource    0-304E
]PRE]

のような重複が出てきます。 [SRC[>>69]]



[66] 
[[Unicode]] 式 (の [CODE[V+]]),
[[ISO/IEC 2022]] 式 [[V0]]
とも、
[[符号表]]以外に[[文字符号]]としての実利用例があるかは不明。

* TCVN 6056

[44] 
[DFN[TCVN 6056:1995]]
[CITE[Information technology. Nom 16-bit standard code for information interchange. Han Nom character]]

[64] [[CJK統合漢字]]の出典 [DFN[V1]]

[49] [[94[SUP[2]]文字集合]]の42区1点〜77区21点に字漢 (漢字) が3311文字らしい。

;; [63] つまり [[V0]] とは重ならないように続きに配置されています。

- [46] 文字集合 (PDF)
<ftp://ftp.oreilly.com/pub/examples/nutshell/cjkv/AppO/tcvn6056.pdf>
([[CJKV]] 本の附録)
-- [47] 消滅確認 [TIME[2022-11-09T08:24:01.900Z]]
-- [65] 
[[Arphic Technology]]
の
[CITE[MingTiEGV-Medium]]
[[フォント]]で再現した一覧表。
- [45] 文字集合 ([[Big5]]) <http://www.sungwh.freeserve.co.uk/flux/tcvnbig5.htm>
-- [50] 移転確認 [TIME[2022-11-09T08:25:23.900Z]]
-- [51] [CITE[TCVN 6056:1995 in Big5 encoding]], [TIME[2022-11-09T08:25:03.000Z]] <https://dylansung.tripod.com/flux/tcvnbig5.htm>
--- [57] 出典は >>46 とのこと
- [52] [[UCS]] との対応 <http://www.unicode.org/Public/>
から、 [[Unihan.txt]]
- [53] UCS との対応 <http://www.cse.cuhk.edu.hk/~irg/>
から、 10646 の Code Chart または normative annex
の CJK source ファイル
- [54] ISO/IEC JTC1/SC2/WG2/IRG N403
- [55] ISO/IEC JTC1/SC2/WG2/IRG N451

[56] 
いくつか誤りがあって1998年に修正要求がなされたらしい。

[72] 
[TIME[西暦1996年][1996]]の時点で、
[[IRG]] の写像と
[[TCVN]] 側の写像で違いがあって、
[[IRG]] のものには、ずれや欠落があると指摘されていました。
[SRC[>>71]]

[73] 
それには誤りとは別に符号化についても言及があります。
[[TCVN 6056:1995]]
は、[[文字]]を
[ [N[1]], [N[3349]] ]
の[[十進数]]で識別しているようです。
[SRC[>>71]]

[74] 
そして [[IRG]] は 1-2121 から始まる [[94[SUP[2]]集合]]の1区から配置した[[符号]]を使っていますが、
42区からの配置に変更することが提案されていました。
どちらも十進数をそのまま順に割り振ったもののようです。
[SRC[>>71 (対照表あり)]]

[75] 
[[Unicode 3.0]] の [[Unihan]] の [[IRG]] 出典Vは、
1-2121 などこの旧 [[IRG]] 符号らしきものが示されています。
[SRC[>>69]]

[76] 
現在の [[Unihan]] の [[IRG]] 出典Vは、 V1-4A21
などこの提案による変更後の符号が示されています。
>>46 もそれと同じです。

[77] 
これらからすると
[[TCVN 6056:1995]]
には出典 V に使われているような [[ISO/IEC 2022]]
式の符号は書かれていないように読めます。


[67] 
いずれの方式も[[文字符号]]としての実利用例があるかは不明。

[160] 
[[Unicode 3.0]] [[Unihan]] の V1 は補正してもいくつか現行文字集合とずれています。
数か所に挿入、削除があるようです。

[REFS[
- [70] 
[CITE[[[IRG]] Document Index - IRGN301- IRGN400]], [TIME[2022-11-09T11:46:29.000Z]] <https://appsrv.cse.cuhk.edu.hk/~irg/n0301-0400.html>
-- [71] N398: [CITE[TCVN 6056:1995 mapping errors]],
[[Ken Lunde]],
Mon, 28 Oct 1996 11:41:38 PST
--- [171] 
[CITE@ja[n0398-VSourceMappingErrors.pdf]], [TIME[2024-09-23T00:04:36.000Z]], [TIME[2024-10-08T10:48:59.963Z]] <https://www.unicode.org/irg/docs/n0398-VSourceMappingErrors.pdf>


]REFS]

* CJK統合漢字の出典V

[81] 
現在の [[Unihan]] は、出典 [DFN[V]] を

- V0 TCVN 5773:1993
- V1 TCVN 6056:1995
- V2 VHN 01:1998
- V3 [ASIS[VHN 02: 1998]]
- V4 [I[Kho Chữ Hán Nôm Mã Hoá]] (Hán Nôm Coded Character Repertoire), Hà Nội, 2007
- VN Vietnamese horizontal extensions; the value is its code point

と説明しています。
[SRC[>>80]]

[68] 
[[Unihan]] は [[Unicode 3.0]] で初めて出典 V を掲載するようになりました。
そのファイルには

> 
[PRE[
#                       V1      TCVN 5773:1993
#                       V2      TCVN 6056:1995
]PRE]

とありましたが、ファイルの中身はこれと合っておらず、
0- と 1- が使われていました。
[SRC[>>69]]

[79] 
それより新しい [[Unihan]] には

>
[PRE[
#			V0	TCVN 5773:1993
#			V1	VHN 01:1998
#			V2	VHN 02:1998
#			V3	TCVN 6056:1995
]PRE]

と書かれているものもあります。
ところがファイルの中身を見ると 
V1 は [[TCVN 6056]] のようです。 
[SRC[>>78]]

[REFS[
-[69] [TIME[2001-02-27T09:25:50.000Z]], [TIME[2022-11-09T10:03:20.959Z]] <https://www.unicode.org/Public/3.0-Update/Unihan-3.txt>
- 
[78] 
[TIME[2004-01-30T19:08:05.000Z]], [TIME[2022-11-09T12:08:11.748Z]] <https://www.unicode.org/Public/4.0-Update1/Unihan-4.0.1.txt>
- [80] 
[CITE@en-us[[[UAX #38]]: Unicode Han Database (Unihan)]], [TIME[2022-09-12T17:16:37.000Z]], [TIME[2022-11-09T12:10:01.948Z]] <https://www.unicode.org/reports/tr38/#kIRG_VSource>

]REFS]

-*-*-



[25] 
V 典拠

- 1 VHN 01:1998
- 2 VHN 02:1998

というものは実在するのか? 例によって嘘規格? 
(Vietnamese Han & Nom かなにかの略だと藁える)


[82] 
[[V2]] 
は [[V1]] の続きで 
V2-6E[VAR[hh]] から始まりますが、 
V2-91[VAR[hh]]
まで、 [[94[SUP[2]]集合]]を超えて続いています。

[83] 
[[V3]]
は続きではなく
V3-30[VAR[hh]]
から始まって
V3-39[VAR[hh]]
まで続いています。

[84] 
[[V4]]
は少し離れて
V4-40[VAR[hh]]
から
V4-58[VAR[hh]]
まで続いています。

[85] 
なぜ [[V2]] だけ[[94[SUP[2]]集合]]から逸脱しているのか謎です。


[FIG(data)[ [134] [[文字関係]]

:key: [DFN[[CODE[unihan:kIRG_VSource]]]]
:desc:
[[Unihan]] [CODE[kIRG_VSource]] ([CODE[V0]], [CODE[VN]])。

]FIG]

[FIG(data)[ [142] [[文字関係]]

:key: [DFN[[CODE[unihan:kIRG_VSource:1]]]]
:desc:
[[Unihan]] [CODE[kIRG_VSource]] ([CODE[V1]])。

]FIG]

[FIG(data)[ [143] [[文字関係]]

:key: [DFN[[CODE[unihan:kIRG_VSource:2]]]]
:desc:
[[Unihan]] [CODE[kIRG_VSource]] ([CODE[V2]])。

]FIG]

[FIG(data)[ [144] [[文字関係]]

:key: [DFN[[CODE[unihan:kIRG_VSource:3]]]]
:desc:
[[Unihan]] [CODE[kIRG_VSource]] ([CODE[V3]])。

]FIG]

[FIG(data)[ [145] [[文字関係]]

:key: [DFN[[CODE[unihan:kIRG_VSource:4]]]]
:desc:
[[Unihan]] [CODE[kIRG_VSource]] ([CODE[V4]])。

]FIG]

[FIG(data)[ [161] [[文字関係]]

:key: [DFN[[CODE[unihan15:kIRG_VSource]]]]
:desc:
[[Unicode]] 15.0
[[Unihan]] [CODE[kIRG_VSource]] ([CODE[V0]], [CODE[VN]])。

]FIG]

[FIG(data)[ [162] [[文字関係]]

:key: [DFN[[CODE[unihan15:kIRG_VSource:1]]]]
:desc:
[[Unicode]] 15.0
[[Unihan]] [CODE[kIRG_VSource]] ([CODE[V1]])。

]FIG]

[FIG(data)[ [163] [[文字関係]]

:key: [DFN[[CODE[unihan15:kIRG_VSource:2]]]]
:desc:
[[Unicode]] 15.0
[[Unihan]] [CODE[kIRG_VSource]] ([CODE[V2]])。

]FIG]

[FIG(data)[ [164] [[文字関係]]

:key: [DFN[[CODE[unihan15:kIRG_VSource:3]]]]
:desc:
[[Unicode]] 15.0
[[Unihan]] [CODE[kIRG_VSource]] ([CODE[V3]])。

]FIG]

[FIG(data)[ [165] [[文字関係]]

:key: [DFN[[CODE[unihan15:kIRG_VSource:4]]]]
:desc:
[[Unicode]] 15.0
[[Unihan]] [CODE[kIRG_VSource]] ([CODE[V4]])。

]FIG]

[FIG(data)[ [157] [[文字関係]]

:key: [DFN[[CODE[unihan3.0:kIRG_VSource:0]]]]
:desc:
[[Unicode 3.0]]
[[Unihan]] [CODE[kIRG_VSource]] 0。
:datanote:
現行文字集合 (>>89) への補正後。

]FIG]


** 出典VやV字形の変更

[154] 
[CITE[L2/22-247 (CJK & Unihan Group Recommendations for UTC #173 Meeting) - 22247-cjk-unihan-group-utc173.pdf]], [TIME[2022-11-02T22:09:04.000Z]], [TIME[2023-10-22T10:44:54.172Z]] <https://www.unicode.org/L2/L2022/22247-cjk-unihan-group-utc173.pdf#page=43>

[155] >>154
U+237C3 の変更 ([[Unicode]] 15.0 → 15.1)

[[Unicode]] 5.2 とも微妙に違う。

[156] >>154
U+5098 の変更 ([[Unicode]] 15.0 → 15.1)

[166] 
>>156 この U+5098 / U+20302 の件、
V1-4B79 は [[ISO/IEC 10646-1:2000]] から 2003 までの [[V字形]]は
[[T字形]]ど完全同一字形で、
その後 [[Unicode]] 5.2 との間に独自字形に差し替えられたときに現 U+20302 [[V字形]]に変わり、
[[Unicode]] 15.0 まではそのままだったところ、
[[Unicode]] 15.1 はその[[V字形]]と V1-4B79 は
U+20302 
に移封され、
新しく
U+5098 に
VN-05098 と新字形が入った、という経緯。


[151] [CITE[IRGN2556RVSourceGlyphAndCodeUpdates.pages - 22259-irgn2556-vsource-updates.pdf]], [TIME[2022-10-24T13:44:37.000Z]], [TIME[2023-09-28T05:10:15.499Z]] <https://www.unicode.org/L2/L2022/22259-irgn2556-vsource-updates.pdf>

[150] [CITE@ja[ノート:u27350 - GlyphWiki]], [TIME[2023-09-28T05:09:37.000Z]] <https://glyphwiki.org/wiki/Talk:u27350>

[152] 
[[Unicode 5.1]]
と現行字形が違う例:
U+20059

[153] [CITE[IRGN2197.pdf]], [TIME[2017-03-22T03:41:05.000Z]], [TIME[2023-10-06T05:55:52.897Z]] <https://appsrv.cse.cuhk.edu.hk/~irg/irg/irg48/IRGN2197.pdf>

[159] 
[CITE[IRGN2651 - 23242-irgn2651-glyph-chg-21128.pdf]], [TIME[2023-10-17T17:06:45.000Z]], [TIME[2023-10-23T02:47:24.048Z]] <https://www.unicode.org/L2/L2023/23242-irgn2651-glyph-chg-21128.pdf>

U+21128

[167] 
U+2BF45 の V は [[Unicode]] 15.0 とそれ以後で字形変更、
新字形は [[Unicode]] 5.2 の U+22B31 の V字形。


[168] [CITE@en[目前並不會特地增收喃字 · Issue #58 · ichitenfont/I.Ming · GitHub]], [TIME[2023-10-30T13:03:14.000Z]] <https://github.com/ichitenfont/I.Ming/issues/58>

[169] >>168 Vの出典とV字形の字形差

[172] 
[CC[U+235F1]]

- [173] [CITE@ja[ISO/IEC 10646:20124 7th Edition Committee Draft (en) - 24265-cd-7th-10646.pdf]], [TIME[2024-11-11T17:05:15.000Z]], [TIME[2024-11-12T09:15:30.723Z]] <https://www.unicode.org/L2/L2024/24265-cd-7th-10646.pdf#page=3296>

>>173 は [[UCS2003]] 字形が誤字形だとするが、 [[UCS2003]] 
字形などという概念はこの版ではもう廃止されていて存在しない。
UCS2003字形として示されたものは [[Unicode]] 13 のV字形と同じ。
V字形として示されたものは [[Unicode]] 5.2 の V字形と同じ。
[[Unicode]] 13, 15, >>173 のV字形は [[UCS2003]] 字形と骨組みとして同じ。
>>173 の画像は古い符号表のスクショだろうが、
旧V字形と[[UCS2003]]字形が共存していた版があったということか。
[[Unicode]] 5.2 と [[Unicode]] 13 の間のどれかか。

[174] 
[CC[U+28599]]

>>173 #page=3297 はV字形を誤統合とするが、そのV字形は
[[Unicode]] 13, 15 とも違う。 13 より前のどれかの版では誤統合だったのを
V字形側を変更することで解決したということか。

[175] 
[CITE@ja[IRGN2776 - n2776-VSourceChanges.pdf]], [TIME[2024-12-31T05:47:30.000Z]], [TIME[2025-01-02T09:14:28.927Z]] <https://www.unicode.org/irg/docs/n2776-VSourceChanges.pdf>


* [CITE[Kho Chữ Hán Nôm Mã Hoá]] と [CITE[Nôm Na Tống]] フォント

[6] 
[[出典V]]で使われている
[DFN[[CITE[Nôm Na Tống]]]]
[[フォント]]は
[[MITライセンス]]で公開されています。
[SRC[>>5]]


[92] 
[TIME[西暦1999年][1999]]に
[DFN[Vietnamese Nôm Preservation Foundation]] ([DFN[VNPF]])
が設立された後に開発されてきた
[DFN[Kho Chữ Hán Nôm Mã Hoá]]
([DFN[Hán-Nôm Coded Character Repertoire]])
および[[フォント]]
[DFN[[CITE[Nôm Na Tống Light]]]]
は、
[TIME[西暦2006年][2006]]の
[CITE[Kho Chữ Hán Nôm Mã Hoá]]
の出版で一旦完成したのだそうです。
[SRC[>>7]]

[93] 
そしてそれ以後も[[フォント]]開発を継続しつつ [[IRG]] とも協調して
[[CJK統合漢字]]の[[越南]]典拠を拡張しているようです。
[SRC[>>7]]
[[Unicode]] の[[符号表]]がいつからこのフォントになったのか不明ですが、
[TIME[西暦2006年][2006]]以後なのでしょうか。

[94] 
[[Unihan]] は典拠 [DFN[V4]] を[TIME[西暦[ASIS[2007]]年][2007]]の 
[CITE[Kho Chữ Hán Nôm Mã Hoá]] 
だとしています。
[SRC[>>80]]

[98] 
>>97 に 
[CITE[Hán-Nôm Coded Character Repertoire]]
のごく一部が引用されていますが、
[[字形]]に対して当時の [[Unicode]] にあるものは [CODE[[[U+]][VAR[hhhh]]]]、
ないものは 
[CODE[[[V+]]6[VAR[hhhh]]]]
と
[CODE[V04-[VAR[hhhh]]]]
の符号が示されているようです。

[99] 
[TIME[2007-08-15]]の
[CITE[Kho chữ Hán Nôm Mã hoá]]
掲載の文字と[[越南語国語表記]]の対照表が
[CITE[[[漢字データベースプロジェクト]]]]
で公開されています。
このデータファイルでは [[Unicode]] にない文字は
[[IDS]]
で表現され、
[CODE[V+]]
または [CODE[V04-]]
の符号が示されています。
[SRC[>>96]]

;; [101] [[IDS]] の一部は[[私用域]]。 [[CDP外字]]?

[102] 
>>98 ではすべての[[非Unicode文字]]に [CODE[V+]] と [CODE[V04-]] が割り振られていますが、
>>99 では両方があるのはごく一部だけで、ほとんどはどちらか一方だけです。
原書ではどうなっているのでしょう?

[103] 
[[ISO/IEC 10646:2003]]/Amd.5 の [[V4]]
と 
[CITE[Kho chữ Hán Nôm Mã hoá]]
の [CODE[V04-]]
は
8文字が一致しないそうです。
[SRC[>>96]]

[105] 
>>104
で文字を検索して情報を見ることができます。
例えば

>
,Unicode 	,U+2cc8a
,TCVN Code 	,V4-5735
,Kho chữ Hán Nôm 	,V+632BF

のように表示されます。

[106] ここで [DFN[TCVN Code]] が [[CJK統合漢字]]の典拠Vと同じもののようです。
V0 から V4 までのほか [[VN]] も確認できます。
典拠Vがないとこの欄は出てきません。

[107] 
[[Kho chữ Hán Nôm]] は
[CITE[Kho chữ Hán Nôm Mã hoá]]
の [CODE[V+]]
があれば表示されるようです。
[[TCVN Code]] が [[V4]] のものもあれば、
[[TCVN Code]] が表示されないものもあります。

[109] 
>>99
に示された符号を検索してみると、 [CODE[V04-]] で示されたものには
[CODE[V4-]] も [CODE[V+]] もあり、
[CODE[V+]] で示されたものには [CODE[V+]] しかありません。
>>99 の対照表では原典に [CODE[V04-]] が記載されていればそちらを優先して書いているのでしょうか。

[108] 
なお、
[[TCVN 5773]]
の 
[CODE[V+]]
符号は検索しても何も見つかりませんし、
対応する正式な [[Unicode]]
で表示しても表に [CODE[V+]] 符号はありません。
[CODE[V+]] を [CODE[U+]] に置き換えても何も見つかりません。
[[TCVN 5773]]
の
[CODE[V+]]
はもうまったく使われていないのでしょうか。

[110] 
中には

>
,Unicode 	,U+f063d*
,Kho chữ Hán Nôm 	,V+60691

のように [[Unicode]] が U+F[VAR[hhhh]] の[[私用文字]]のものもあります。
[CODE[*]] 印は将来の [[Unicode]] 候補だと注釈があります。

[111] 
[CITE[Nôm Na Tống]]
は[[越南語国語表記]]用の[[ラテン文字]]等の[[非漢字]]と、
[[CJK統合漢字]]や[[CJK互換漢字]]の一部を実装しています。

[112] 加えて、
[[私用文字]]
[ [CODE[U+F0000]], [CODE[U+F2388]] ]
が定義されています。

[113] [[私用文字]]は[[ウェブサイト]]で検索できるものと同じようです。

[114] [[TCVN Code]] が [[VN]]
になるものもありますが、

>
,Unicode 	,U+f0000*
,TCVN Code 	,VN-F0000
,Kho chữ Hán Nôm 	,V+60000


のようになっています。 [[Unicode]] では [[VN]] は[[水平拡張]]を表すことになっていて
(>>81)、[[私用文字]]の[[水平拡張]]では意味が通じず、
こちらの [[VN]] がどういう符号なのか不明です。

[135] 
[[Unihan]] の [[IRG]] 出典の [[VN]] も [[CJK統合漢字]]とこの [[PUA]] 分が混じっています。

[128] 
>>114 see >>127

[115] [[TCVN Code]] 欄も [[Kho chữ Hán Nôm]] 欄も表示されない

>
,Unicode 	,U+f2388*

のような例もあります。


[117] 
[[フォント]]の
[CODE[U+F1DAB]]
が
[[Unicode]] の
[CODE[U+200C9]]
であると発見された報告があります。
報告を受けて
[CODE[U+200C9]]
に
[CODE[U+F1DAB]]
と同じグリフデータが設定されたようです。
[SRC[>>116]]
([[フォント]]内に別[[グリフ]]として同字形が重複して入っています。)

[118] 
報告内の [[URL]] と[[画面写真]]によると、変更前は
<http://nomfoundation.org/common/nom_details.php?codepoint=f1dab>
で

>
,Unicode,U+f1dab*
,Kho chữ Hán Nôm ,V+6EF98

と表示されていたようです。 [SRC[>>116]]
しかし現在そのページは表示できません。
[CODE[U+200C9]]
で検索すると、

>
,Unicode 	,U+200c9

だけが表示されます。
[CODE[U+F1DAB]]
や
[CODE[V+6EF98]]
の情報は表示されなくなっています。

[119] 
では
[CODE[U+F1DAB]]
の情報がデータベースから消されたのかというと、そうでもないらしく、
符号「F1DAB」で検索すると
[CODE[U+200C9]]
のページが表示されます。旧符号を知っていれば新符号を知ることはできるようです。
ただし [CODE[V+6EF98]]
では検索もできません。

[123] 
[[フォント]]側は、このような変更はあっても、履歴をぱっと見た感じ、
[[私用文字]]の削除や移動のような[[非互換変更]]は行われていないようです。


[120] 
[[フォント]]中の[[私用文字]]のいくつかは、
[[CJK統合漢字]] + [[Vietnamese alternate reading mark]]
の
[CODE[ccmp]] 
でもアクセスできます。
[SEE[ [[Vietnamese alternate reading mark]] ]]

[122] 
[[フォント]]中の[[私用文字]]のいくつかは、
[[IVS]]
でもアクセスできます。
[SRC[>>121]]
多数の [[IVS]] が定義されていますが、しかし現時点では [[IVC]] に登録されていません。
今後登録する予定があるのかは不明です。

[125] 
>>124 で[[私用文字]]の[[ローマ字入力]]用[[辞書]]データが配布されています
([[ライセンス]]不明)。
[[私用文字]]
[ [CODE[U+F0000]], [CODE[U+F2388]] ]
の範囲 (9097符号位置) ですが、
6262個分のデータが入っています。


[FIG(data)[ [146] [[文字関係]]

:key: [DFN[[CODE[cjkvi:ids:V4]]]]
:desc:
[[漢字データベースプロジェクト]]
[CODE[cjkvi-data/nom_qn.txt]]
より注釈の [CODE[V04]] 
[[符号]]から[[IDS]]へ。


]FIG]

[FIG(data)[ [147] [[文字関係]]

:key: [DFN[[CODE[cjkvi:nom_qn:#]]]]
:desc:
[[漢字データベースプロジェクト]]
[CODE[cjkvi-data/nom_qn.txt]]
の[[文字]]より注釈の[[符号]] ([CODE[V+]]) へ。


]FIG]

[FIG(data)[ [148] [[文字関係]]

:key: [DFN[[CODE[cjkvi:nom_qn:#:V4]]]]
:desc:
[[漢字データベースプロジェクト]]
[CODE[cjkvi-data/nom_qn.txt]]
の[[文字]]より注釈の[[符号]] ([CODE[V04]]) へ。


]FIG]


[REFS[
- [91] [CITE[null]], [TIME[2022-11-09T13:41:43.000Z]] <http://www.nomfoundation.org/nom-tools/Nom-Font?uiLang=vn>
-- [7] [CITE[null]], [TIME[2022-11-07T03:21:19.000Z]] <http://www.nomfoundation.org/nom-tools/Nom-Font?uiLang=en>
- [5] [CITE@en[GitHub - nomfoundation/font: Source for [[NomNaTong]]-regular Vietnamese chữ Nôm font.]], [TIME[2022-11-07T03:16:59.000Z]] <https://github.com/nomfoundation/font>
- [96] [CITE@ja[[[字喃]](チュノム)に関する情報]], [TIME[2010-05-16T03:18:48.000Z]], [TIME[2022-11-09T13:57:10.997Z]] <https://kanji-database.sourceforge.net/chunom.html>
-- [100] [CITE@en[[[cjkvi]]-data/nom_qn.txt at master · cjkvi/cjkvi-data · GitHub]], [TIME[2022-11-09T14:00:55.000Z]] <https://github.com/cjkvi/cjkvi-data/blob/master/nom_qn.txt>
-- [95] [CITE@ja[グループ-ノート:字喃 - [[GlyphWiki]]]], [TIME[2022-11-09T13:56:48.000Z]] <https://glyphwiki.org/wiki/Group-talk:%E5%AD%97%E5%96%83>
- [97] [CITE[[[IRG]]N2443_3B3F_disunify.pdf]], [TIME[2020-12-22T13:49:34.000Z]], [TIME[2022-11-09T13:57:25.822Z]] <https://appsrv.cse.cuhk.edu.hk/~irg/irg/irg53/IRGN2443_3B3F_disunify.pdf#page=3>
-[104] 
[CITE[Another Nôm Lookup Tool[BR[]] based on Unicode]],
[TIME[2022-11-09T14:14:13.000Z]] <http://www.nomfoundation.org/nom-tools/Nom-Lookup-Tool/Nom-Lookup-Tool?uiLang=en>
- [116] [CITE@en[F1DAB should be mapped to 200C9 · Issue #12 · nomfoundation/font · [[GitHub]]]], [TIME[2022-11-12T05:13:42.000Z]] <https://github.com/nomfoundation/font/issues/12>
- [121] [CITE@en[font/UnicodeVariationSequences.txt at master · nomfoundation/font · [[GitHub]]]], [TIME[2022-11-12T05:29:02.000Z]] <https://github.com/nomfoundation/font/blob/master/src/UnicodeVariationSequences.txt>
- [124] 
[CITE@en[[[GitHub]] - Hulenkius/NNTPUA_cangjie5: 喃那宋私用區字符的倉頡五代編碼收入 Cangjie for Nom Na Tong PUA]], [TIME[2022-11-12T05:36:34.000Z]] <https://github.com/Hulenkius/NNTPUA_cangjie5>


]REFS]



[126] 
[CODE[V+]] 符号は、現在見つかっているものはすべて [CODE[V+6[VAR[hhhh]]]]
の形式です。これは [[Unicode]] の未使用の領域 ([[私用域]]ではない)
を表しているのでしょうか?
書籍やデータベース以外で利用されることがあるのかは不明です。
[[機械可読]]な変換表も見当たらず、
配布されている[[フォント]]もこの符号は使っていません。

[133] 
この [CODE[V+]] は、旧フォントで [ [CODE[U+60000]], [CODE[U+63FFF]] ]
に割り当てられていたものなのだそうです。
[SRC[>>129, >>130, >>131, >>132]]

[REFS[

- [129] [CITE[The mapping table between Quoc Ngu - Nôm - Unicode]], [TIME[2023-07-10T06:00:24.000Z]], [TIME[2012-05-17T11:18:09.674Z]] <https://web.archive.org/web/20120517111637/http://nomfoundation.org/nom-project/Han-Nom-coded-Characters/The-mapping-table-between-Quoc-Ngu-Nom-Unicode>
-- 1ページ目のみ [[Internet Archive]] 所蔵
- [130] [CITE[The mapping table between Unicode - Nôm - Quoc Ngu]], [TIME[2023-07-10T06:00:43.000Z]], [TIME[2013-05-14T13:08:50.485Z]] <https://web.archive.org/web/20130514130651/http://nomfoundation.org/nom-project/Han-Nom-coded-Characters/The-mapping-table-between-Unicode-Nom-Quoc-Ngu>
-- 1ページ目のみ [[Internet Archive]] 所蔵
- [131] [CITE@ja[グループ:VNPF外字 - GlyphWiki]], [TIME[2023-07-10T06:01:08.000Z]] <https://glyphwiki.org/wiki/Group:VNPF%e5%a4%96%e5%ad%97>
- [132] [CITE@ja[グループ-ノート:VNPF外字 - GlyphWiki]], [TIME[2023-07-10T06:01:16.000Z]] <https://glyphwiki.org/wiki/Group-talk:VNPF%e5%a4%96%e5%ad%97>

]REFS]


[136] [CITE@en[Version 5.06, fixed issues 20, 21, 22, 23, 24. Added glyphs from QMTĐ…]], [[lcollinsnflx]], [TIME[2023-07-14 04:42:12 +09:00]], [TIME[2023-07-30T12:35:54.000Z]] <https://github.com/nomfoundation/font/commit/10c78eaadc898794687213cf1127c73f86a1c5a4>

[137] 
>>136 この変更で [[IVS]] が登録済みの他の [[IVC]] のものを流用するように変更されているようだけど (従来のファイル内容との互換性も気にせずずらしているらしい)、合っているのだろうか???

- [138] 
<https://raw.githubusercontent.com/nomfoundation/font/668578cbff736f3c4e3854ea56e2f309e0a518a9/src/UnicodeVariationSequences.txt>
- [139] 
<https://raw.githubusercontent.com/nomfoundation/font/06838db0f1ad960adb7659072ba67c45e10b6d75/src/UnicodeVariationSequences.txt>
- [140] 
<https://raw.githubusercontent.com/nomfoundation/font/10c78eaadc898794687213cf1127c73f86a1c5a4/src/UnicodeVariationSequences.txt>

[141] >>138 >>139 間はただの追加

[149] ところで[[漢喃復活委員会フォント]]は新旧どちらともまた違った[[IVS]]を使っています。


[170] 
[CITE@ja[IRGN2631-Vietnam - IRGN2631-Vietnam.pdf]], [TIME[2023-10-12T23:25:31.000Z]], [TIME[2024-01-26T05:15:49.398Z]] <https://appsrv.cse.cuhk.edu.hk/~irg/irg/irg61/IRGN2631-Vietnam.pdf>


* PUA 文字の実利用例

- [176] [CITE@en[bực: difference between revisions - Wiktionary, the free dictionary]], [TIME[2025-11-03T07:56:27.000Z]], [TIME[2025-11-04T14:23:57.871Z]] <https://en.wiktionary.org/w/index.php?title=b%E1%BB%B1c&diff=83533822&oldid=49706833>
-- [177] [CITE@ja[「bực」の版間の差分 - ウィクショナリー日本語版]], [TIME[2025-11-01T10:14:29.000Z]], [TIME[2025-11-04T14:24:04.662Z]] <https://ja.wiktionary.org/w/index.php?title=b%E1%BB%B1c&diff=prev&oldid=2107647>
--- [178] [CITE@ja[利用者・トーク:M-30722 - ウィクショナリー日本語版]], [TIME[2025-10-21T00:47:05.000Z]], [TIME[2025-11-04T14:24:31.446Z]] <https://ja.wiktionary.org/wiki/%E5%88%A9%E7%94%A8%E8%80%85%E3%83%BB%E3%83%88%E3%83%BC%E3%82%AF:M-30722#%E7%A7%81%E7%94%A8%E9%9D%A2%E3%81%AE%E5%AD%97>

[179] 
[CITE@ja[Xユーザーの𫇰國音之字さん: 「𬛩住滝建德 Nằm trọ sông Kiến Đức 瀾𤌋邊船豆𣷷滝 鄭念𣈜最客𢞂𥉫 𡗶連𣘃濕同空敻 𦝄𠇍𠊛𧵆渃朗󰮁 Làn khói bên thuyền đậu bến sông, Chạnh niềm ngày tối khách buồn trông. Trời liền cây thấp đồng không quạnh, Trăng mấy người gần nước lặng trong. 宿建德江 &lt;孟浩然&gt;」 / X]], [TIME[午前6:24 · 2025年12月19日][2025-12-18T21:24:25.000Z]], [TIME[2025-12-22T09:22:03.000Z]] <https://x.com/mun_ghion/status/2001765518471291093>



* メモ

- [10] <http://www.tcvn.gov.vn/>

[36] [CITE[Microsoft Word - PhmemNom-u+.rtf - PhanMemChuNom.pdf]], [TIME[2001-07-09T20:27:25.000Z]], [TIME[2022-11-08T13:56:56.113Z]] <https://cs.nyu.edu/~nhan/PhanMemChuNom.pdf>

[22] [CITE[Microsoft PowerPoint - Computing in Vietnamese 0.99IMUGweb.ppt - VietComputing.pdf]], [TIME[2015-01-18T17:51:58.000Z]], [TIME[2022-11-08T09:30:23.936Z]] <http://www.imug.org/presentations/VietComputing.pdf#page=20>

[32] [CITE[VietNhan_day_chu_Nom.pdf]], [TIME[2020-02-03T23:19:59.000Z]], [TIME[2022-11-08T13:39:45.164Z]] <http://nomfoundation.org/Conf2006/VietNhan_day_chu_Nom.pdf>

[127] [CITE[IRG N2490 - IRGN2490VSourceChanges.pdf]], [TIME[2021-04-27T00:31:29.000Z]], [TIME[2023-02-27T01:48:06.859Z]] <https://appsrv.cse.cuhk.edu.hk/~irg/irg/irg56/IRGN2490VSourceChanges.pdf>
