[103] 文字情報基盤は、平成時代に日本政府が整備した行政用漢字データベースです。
[252] 文字情報基盤では各「文字図形」に名前がつけられていて、 MJ文字図形名と呼ばれています。
[253]
MJ文字図形名は
MJ000001
のように
MJ
から始まり、
6桁固定長の数字列が続きます。
[255] ほとんどは大文字で表されますが、 IPAmj明朝のグリフ名は小文字になっています。 (グリフ名は小文字表記のことが多いためでしょう。)
[256] 欠番がちらほらあります。一度公表されたものが改正で削除されたことはないと思われるので、 開発過程で除去されたか、グループ分けなどの理由で空き領域が生じたのでしょうかね。
[257]
MJ文字図形名と表される「文字図形」の関係は、
開発初期に非互換変更がされた (>>224) 後は変わっていない (追加のみの) ようです。
重複が判明しても削除はされていません。
従って安定した識別子として利用してよさそうです。
[43] CJK統合漢字に出典 J で採録されている Unicode符号点であっても, 文字情報基盤に含まれてないこともあります。
[100] 文字情報基盤を出典に Unicode に追加された文字は Unihan で出典Jの JMJ となっています。
[105] MJ文字情報一覧 | 一般社団法人 文字情報技術促進協議会, https://moji.or.jp/mojikiban/mjlist/
[106] >>105 の「実装したUCS」欄が入っているのが IPAmj明朝の
cmap
で Unicode符号点と関連付けられているMJ文字図形
(デフォルトグリフ)
です。
下記の優先順位により決定した。
- 常用漢字表に掲載されている字形
- 人名用漢字別表(戸籍法施行規則別表第二漢字の表)に掲載されている字形
- 住民基本台帳ネットワークシステム統一文字コードと対応するUCSが一致する字形
- JIS X 0213:2012に掲載されている例示字形
- UCSのJ欄(日本提案の字体)に掲載されている例示字形
- 法務省告示第582号別表1に掲載されている字形
- 康煕字典体
- 「市区町村が使用する外字の実態調査http://www.soumu.go.jp/main_sosiki/jichi_gyousei/c-gyousei/lg-cloud/02kiban07_03000021.html」の出現頻度
[109] これによって JIS X 0213 の例示字形 (= UCS の J欄字形) と違いが生じているのが >>108 の 1. から3. で、 >>102 に一覧表があります。
[110] 4. の JIS X 0213:2012 より 3. の住基統一文字が優先された結果 JIS X 0213:2000 の字形に近くなり、しかしそれより 1. と 2. が優先された結果 JIS X 0213:2004 の字形に近くなる、つまり JIS X 0213 の大部分は JIS2004 ベース、 3. 該当部分だけ JIS90 ベースになっているらしい。難しい。
[124] 文字情報基盤整備事業IVD/IVS, Information-technology Promotion Agency, Japan., https://warp.ndl.go.jp/info:ndljp/pid/8198317/ossipedia.ipa.go.jp/ipamjfont/faq/ivs_ivd.html
[402]
人名用漢字はかなり高い優先順位ですが、
戸籍統一文字と文字情報基盤の字形差12組では人名用漢字と違う字形になっているようです。
[12]
2014-05-16
版で新規追加。
[13]
2017-12-12
版で更に追加。
[14]
Hanyo-Denshi
の実質的な後継となっています (が >>37 >>38 に注意)。
[31] MJ037229, MJ040579, MJ042077 は Unicode との対応関係が存在しない。
[74] グループ:文字情報基盤-符号化されていない文字 - GlyphWiki, https://glyphwiki.org/wiki/Group:%e6%96%87%e5%ad%97%e6%83%85%e5%a0%b1%e5%9f%ba%e7%9b%a4-%e7%ac%a6%e5%8f%b7%e5%8c%96%e3%81%95%e3%82%8c%e3%81%a6%e3%81%84%e3%81%aa%e3%81%84%e6%96%87%e5%ad%97
[279] かつて文字情報基盤に含まれていたものの、 字形の変更 (>>226 >>275) によって含まれなくなった結果、 Unicode符号位置でもIVSでも表せない旧MJ文字図形がいくつかあります。
[40]
文字情報基盤に含まれる
Hanyo-Denshi
と
Moji_Joho
の
IVS
は、1つの Unicode符号点に複数の文字情報基盤の文字図形が対応するときに登録することにしていたようです。
1つのUnicode符号点に1つだけしか文字図形が対応しないときは
IVS はまったく使われていません。
(このパターンも結構多い。)
[42]
この方針が理由で
Hanyo-Denshi
の
IVS があっても使われない (>>37) ケースもあるみたいです。
[281] ほとんどのMJ文字図形はIPAmj明朝でIVSのみ、またはIVSとその基底文字で実装されています。 例外はCJK互換漢字に対応するものです。 もっと稀な例外として、 >>280 の
[273] 「漢字施策」欄に「常用漢字」とあるものが2136文字あって、 平成22年の常用漢字表に含まれるものを表すようです。 (併記された旧字体は含まず。)
[274] 「漢字施策」欄に「人名用漢字」とあるものが863あって、 現時点で最新の人名用漢字として定められたものを表すようです。 (新字体・旧字体の区別なし。)
[35]
Hanyo-Denshi
と
Moji_Joho
の関係性は、
ウェブ検索するといろいろ出てくるのですけれども、
制定過程のものも混ざっていてどれが最終状態に対するものなのかよくわからんです。
文字情報基盤の開発完了より前におかしいといわれているところは、
すでに修正済みだったりするみたいです。すべて対処されているのかはわかりません。
[37]
Moji_Joho
は
Hanyo-Denshi
で登録済みの IVS を共有再利用していますが、
Moji_Joho
が
Hanyo-Denshi
をすべて含んでいるわけではないみたいです。
(>>42 にも注意。)
また、事務局としては、文字情報基盤が公式に汎用電子の成果物を継承したうえで進め
られていることもあり、Hanyo-Denshi コレクションについても、可能な限りその成果 を継承することが望ましいと考えている。
[350] 20131008_4k_s2_1.pdf, https://warp.ndl.go.jp/info:ndljp/pid/11177851/mojikiban.ipa.go.jp/contents/pdf/2013/20131008_4k_s2_1.pdf
[356]
汎用電子の実質的な後継新版が文字情報基盤であり、
文字コードとしてみると
Hanyo-Denshi
IVS
の改訂版が
Moji_Joho
IVS
であるとの観点でいえば、
次のように分類できます。
Hanyo-Denshi
IVS として規定され、
Moji_Joho
IVS として改正され、
実質的な字形変更はないものHanyo-Denshi
IVS として規定され、
Moji_Joho
IVS として改正され、
視認可能な字形変更があったものHanyo-Denshi
IVS として規定されたものの、
Moji_Joho
IVS に含まれず、
実質的な字形変更がないものが新たな
Moji_Joho
IVS として規定され、
事実上の移動となったものHanyo-Denshi
IVS として規定され、
Moji_Joho
IVS に含まれず、
事実上の削除となったものMoji_Joho
IVS でまったく新たに追加されたもの[363]
Moji_Joho
IVS がない
Hanyo-Denshi
IVS
固有のものを基底文字の
Unicode符号位置でみると:
Moji_Joho
IVS が1つ以上残り、
削除された Hanyo-Denshi
IVS があるもの: IVS 543 個[38]
Moji_Joho
と
Hanyo-Denshi
が
IVS
を共有しているのに両者の登録字形が異なっている事例も発見されています。
>>36
[39] そもそも汎用電子は平成明朝、 文字情報基盤はIPAmj明朝なのですから、 厳密にいえば字形はすべて違うはずです。 ここで「異なっている」というのは人の目に判別できる違いがあるけど文字情報基盤は違わないと判断したもの、 ということになりますね。
[348] 平成明朝とIPAmj明朝は細かい点画の接触の有無レベルの設計方針がかなり違っているらしく、 細部まで含めれば相当数の違いがあるようです。
[349] 比較的大きな字形差もいくつか発見されています。
[36] Ken Lunde 小林剣さんはTwitterを使っています: 「@henryfhchan @wtnelson @IPAjp Another observation is that the representative glyph for <U+7BF3,U+E0101> in the Moji_Joho and Hanyo-Denshi IVD collections don’t match, in terms of stroke-touching. The one of the latter matches what is in the code charts. https://t.co/GGiR7NAIcJ」 / Twitter, 午前6:00 · 2018年1月21日 , https://twitter.com/ken_lunde/status/954820851798437888
[34] ノート:u9055-j - GlyphWiki, https://glyphwiki.org/wiki/Talk:u9055-j
[351] U+4E47 U+E0101 (JB1618 / MJ006381) は >>350 で字形差があると指摘されつつも流用可能と判定されています。
[115] 文字情報基盤 文字情報一覧表 Ver.001.01 項目一覧, Information-technology Promotion Agency, Japan., https://warp.ndl.go.jp/info:ndljp/pid/3196417/ossipedia.ipa.go.jp/ipamjfont/mjmojiichiran/hanrei.html
汎用電子整理番号 汎用電子情報交換環境整備プログラムの漢字情報テーブルにおけるレコードの通し番号。 平成明朝 平成明朝体グリフのグリフ名。平成明朝体グリフは汎用電子情報交換環境整備プログラムの文字グリフ作業委員会にて制作されたものである。
[116] >>115 昔の文字情報基盤にはこのような汎用電子・平成明朝との対応情報が入っていたらしい。 その後文字情報基盤からこの情報は消えて、変更も多いので、 今の文字情報基盤とこの情報がどの程度整合しているのかは不明。
[258] 同じ平成明朝のグリフ名が複数のMJ文字図形に対応付けられている例が散見されます。 文字情報基盤の改定で重複が増える形で改められたものも多いので、 誤りではなく意図的にそうしていたと思われます。 汎用電子側の基準では統一され、文字情報基盤側の基準では区別されるようなときでしょうか?
文字情報基盤ではさまざま
な理由(主として総務省からの要請)によって、異なる文字図形として追加作り 分けしたものがある。そのため、文字情報一覧表では、複数の MJ 文字図形が同一 の平成明朝名グリフに対応している場合がある。
[313] >>307 「作り分け」のためMJ文字図形バージョンが 1 と 1.1 があるとき 1 が平成明朝に近いのが原則というようなことが >>305 では書かれている。 がいつもそうなるわけではなく、 >>312 は U+914D (配) の例を挙げていて、
のうち平成明朝 JA3959 に近いのは MJ026441 とされる。
[314] 同じような例が U+696F (楯)
で平成明朝 JA2961 = HG1630 に近いのは MJ014231 と思われる。 Hanyo-Denshi IVD U+914D U+E0102 = JA2961 >>315 も昔の URO 符号表 >>316 も MJ014231 に近い。 この字形は JIS X 0213:2004 で変更されていて、 変更後の規格票字形、 現行 URO 符号表の字形 >>317 は MJ014230 に近い。
[318] 楯は右上のノと十の違いもあって更にややこしい。
jx1-2004-3d5d
(十は MJ014230 に近い) ははっきりノと十が離れているj83-3d5d
= u696f-ue0101
= aj1-13460
は
IPAex明朝に近いj90-3d5d
= u696f-ue0105
= u696f-ue0102
=
u696f-ue0100
= jx1-2000-3d5d
= juki-696f
=
jmj-014231
= aj1-02407
は
MJ014231 に近いkoseki-171270
= u696f-ue0104
= juki-b34c
= jmj-014230
(十は MJ014230 に近い)
はノと十が接しそうで少し離れている[352] 「非」のように視認できる字形差がある部分字形で、 文字情報基盤ではときにはどちらの部分字形を使った字形もあるにも関わらず、 特定の字形については一方しかない場合もあって、 しかも JIS X 0212 や JIS X 0213 とは一致しない字形しか文字情報基盤にはない、 というパターンもたまにあります。 例えば U+5298 U+E0101 の JB1954 (JIS X 0212 19-54, JIS X 0213 2-3-32) と MJ007619 がそうです。 (>>350 に注記があるので意図的です。)
[353] 視認できる字形差がないにも関わらず、 汎用電子と文字情報基盤で別の IVS が登録されているものも、 少なからずあります。 例えば:
[354] PRI259_NAOI_0305.pdf, , http://www.unicode.org/ivd/pri/pri259/PRI259_NAOI_0305.pdf
[355] >>354 には字形差がないのに新規の IVS を登録しようとしたものの指摘がありますが、 そのまま新規登録されたものが多いようです。既存のものではいけない理由が何かあったのでしょうか。
[336] >>335 #page=1 MJ006381 と JD0109S = JB1618 で視認できる字形差 (横線の傾き) があるのに同じ IVS を流用している例
[337] >>335 #page=2 関連: U+5298 の U+E0101, U+E0102 のどちらも「非」の左下の字形差 >>339, >338。 JIS X 0212, JIS X 0213, 汎用電子の字形と MJ の字形が違う。
[409] <U+9A4A, U+E0103> は JTBFE9S かつ MJ028801、 <U+9A4A, U+E0104> は MJ068073 ですが、 JTBFE9S と MJ068073 が同等の字形に見えます。
[260] 一覧表 Ver.005.01 には Hanyo-Denshi IVS 欄があって Moji_Joho IVS 欄がないものがいくつかあります。 そのほとんどは現行 Moji_Joho IVS に含まれる IVS です。 当時はまだ含まれていなかったのかもしれません (未確認)。
[261] 唯一、 MJ068065 の HD IVS 欄が 83B5_E0103 ということになっていますが、 現在は MJ IVS <U+83B5, U+E0104> に対応することになっています。 Ver.005.01 では 83B5_E0103 がもう1つあって、 MJ022047 の HD IVS 欄と MJ IVS 欄の両方が 83B5_E0103 になっていました。 MJ068065 の方は誤りだったのでしょうか。
[262] MJ IVS 欄と HD IVS 欄の両方があるとき、ほとんどは同じ値ですが、 一致しないのが1つだけあります。 MJ026439 の MJ IVS は 914D_E0105 で HD IVS は 914D_E0102 です。 XML 版でも Excel 版でもこうなっています。 現在の MJ にある & MJ IVC に含まれるのは U+E0105 だけ。 HD IVC に含まれるのは U+E0102 だけ。
[264] この他に MJ IVS 欄だけあるもの、どちらもないものは多数あります。
[270]
Ver.005.01 には「X0212」欄と「平成明朝」欄があって、
「平成明朝」の JB
から始まるものは JIS X 0212
の例示字形関係のグリフのはずなので、
両者の区点番号は一致すると予想されるところです。
[271] 実際大部分はそうですが、 「X0212」欄に区点位置があるのに「平成明朝」欄に JB グリフがないもの、 「平成明朝」欄に JB グリフがあるのに「X0212」欄が空欄のものがあります。
[272] 先述の通り複数のMJ文字図形に同じ「平成明朝」のこともあるのですが、 うち一方の「X0212」が「平成明朝」の区点位置と一致し、 他方は JB グリフでないこともあります。
[343] 整理番号があるのに平成明朝が空欄がいくつかあるのはどういうことなんでしょう?
[344] 同じ平成明朝グリフ名なのに整理番号が違うのがいくつかあるのはどういうことなんでしょう?
[419] IPAmj明朝がサポートしていないIVS - 帰ってきた💫Unicode刑事〔デカ〕リターンズ, https://moji-memo.hatenablog.jp/entry/20130918/1379495792
[420] CJK拡張F1/F2候補とIVS - 帰ってきた💫Unicode刑事〔デカ〕リターンズ, https://moji-memo.hatenablog.jp/entry/20130917/1379395975
[183] 一覧表本体:
[216] バージョン番号の付け方が独特ですが、IPAフォント以来の伝統みたいです。 (ファイル差替でバージョン番号が変わらないのも困った伝統。)
[206] ver.001.01 時点で「更新履歴」欄には変更情報がかなり入っています。 もっと前の版があったのでしょうか。公開されていないものかもしれません。
[259] Ver.005.01 の説明には
- 対応するHanyo-DenshiコレクションIVS
- Unicode ConsortiumのIVD Version 2010-11-14のHanyo-Denshiコレクションに対応する文字についは、IVSを記した。
とありますが、 XML 版にはそれに相当するのが
実装したHanyo-DenshiIVS
要素になっていて、
XML Schema
では
Unicode ConsortiumのIVD Version 2010-11-14のHanyo-Denshiコレクションにより実装したIVSを 記した。 MJ文字情報一覧表 項目一覧の「対応するHanyo-DenshiコレクションIVS」に対応する。
と説明されています。 (この他の項目も XML 版では微妙に表現が違います。)
[240] 「MJ文字図形バージョン」は変更のあった版を表しているらしい?
[244] Ver.001.01 時点、
[243] Ver.006.01 時点、
[242]
当初の「SVG図形バージョン」で 1.0
だったものがいつの間にか 1
に変わってるな...
[245]
Ver.001.01 の最大が MJ060385 (当時のバージョン: 1.0
)。
そこからしばらく欠番で、その次が MJ067952 (現時点のバージョン: 2
)。
そこからが追加漢字の領域で、
現時点での最大は MJ068101 (現時点のバージョン: 5.2
)。
[246]
追加漢字の領域にあるにも関わらず現時点のバージョンが 1
のもの:
[247]
>>246 は Ver.005.01 での追加。この周辺の領域はバージョンが 4.1
でも Ver.005.01 での追加だったりするものがちらほら。
[249] >>193 の頃は CSV の配布がなくなっていますが、 XML の配布ファイルに XML から CSV に変換する XSLTスタイルシートが入っています。 それなら最初から CSV で配布してくれてもよさそうなものですが。 迷走ぶりが現れています。
[8] 「準備中」や 404
が多発してるんだが...
移管するならちゃんと準備してからにしてくれんかね?
[16] 移管で議事録が探せなくなったとか、 API を使っていた外部サービスが動かなくなったとか、 被害報告多数でみんな困ってそう。 何考えて運営しとるんやろな
[17] 民間団体に go.jp ドメイン使わせるわけにいかないとかなんかな。 それにしたって Web サーバーを動かすのに必要な情報を全部渡して、 元のサイト構造とシステムが動く状態にしろよと。。。
[18] 政府が税金で整備した公的データベースを民営化して、あとは知りませんってのはどうなんだ。
[26] Excel ファイル内に文字図形の URL が書いてあったのが、 移管で全部移管案内 HTML ページに置き換わって意味をなさなくなってる。
[27] 移管後1年経っても新バージョンが公開されない、 気づいていないのかやる気が無いのか。
[28] そもそも URL を変更するな、どうしても変更せざるを得ないならリダイレクトしろ。 Webサイト運営の基本中の基本くらいきちんとしろよ。
[50] 今やドメインごと消滅www 移管案内にすらたどり着けないのひどすぎるなwwww
[29] 税金で作ったデータベースを大事に使っていこう、 先人から受け継いだ文化遺産を次代に引き継ごう、 という意志が全く無いのかね?
[51] 民間でも (さすがに会社なくなったところはあれだけど) 多サービス展開してるところは旧ドメインから新ドメインへの引き継ぎちゃんとやってるんだよなあ。 畳んだサービスも案内ページは恒久的に置いてある。 終了サーバーが何十個、何百個あろうと案内HTMLページ各1枚くらいなら静的サーバーを1組置いとけば余裕で捌けるんだから、 跡地をどうするかっていうのはデジタル庁あたりで巻き取ってしっかりやってくれんもんかねえ。
[19] 文字情報基盤の民間移行 | 政府CIOポータル, https://cio.go.jp/node/2708
民間の創意工夫の中で発展し加速していくことが期待されています。
[20] 1年経ちましたが何か進展はありましたか・・・(小声)
[21] 初速が0なら加速しても0だから・・・(震え声)
[30] 初速が負なら逆行もあり得るな!
更に、もっと発展していくためにはゴシック体も作りたいとか、実装の仕組みであるIVSを推進するとか民間が機動的に行ったほうが良い面もあります。
いやー異世界のMJは進んでますなー 民間の力すげー
[55] 民間で機動的に事業を進めた結果、
と誇らしい成果が出ていますよね! って令和の nihonLinux かよ!!
[59] 信託譲渡契約とやらがそのまま生きてるってことは、 政府もこれを見て民間の創意工夫すげー進化が加速してるぜーって思ってるってことでしょ?
[60] 政府機関は法令に基づき設置されて国民のためになる事業をすることが期待されてるのでしょう? でもこの民間団体はそのような義務もない、どこかの誰かが勝手に設置した機関なのでしょ? だからもう文字情報基盤事業が国民にとって有益なアウトプットを提供してくれることは期待してはいけないのかもよ。 どこかの事業予定に会員専用フォントを提供する的なこと書いてた気が。
[62] 脱●したらトイレが詰まったやましゅうおじさんさんはTwitterを使っています: 「文字情報基盤の検索システム、文字情報技術促進協議会に信託譲渡されたわけだが、めちゃくちゃ使いづらくなっとる。(個人の感想です)#文字情報基盤」 / Twitter, , https://twitter.com/yamashu44/status/1380149854794440706
[63] もりやまもりたろう@先祖探しさんはTwitterを使っています: 「@yamashu44 SVG情報は公開しないとその団体に言われました。。。」 / Twitter, , https://twitter.com/morishi_37/status/1563315063410552838
[88] あーリンク切れしまくりで情報探すの面倒すぎるーーーーーーーーーーーーーーー
[111] IPAexフォントの変更履歴も消滅したまま放置されてる。ひどいなあ。
ここを指しているリンクに誤りがあったようです。検索してみるのはいかがですか ?
とか喧嘩売ってるんかと。 翻訳でこのノリのことはよくあるけどここ日本語サイトだろ...
[113]
そんで IPA の本体サイトも令和5年のリニューアルでウェブサイト崩壊炎上事件を起こして
(
[418] MJフォント保守環境 - Session1_津田様資料_MJフォント保守環境構築1.pdf, , https://moji.or.jp/wp-content/uploads/2024/04/Session1_%E6%B4%A5%E7%94%B0%E6%A7%98%E8%B3%87%E6%96%99_MJ%E3%83%95%E3%82%A9%E3%83%B3%E3%83%88%E4%BF%9D%E5%AE%88%E7%92%B0%E5%A2%83%E6%A7%8B%E7%AF%891.pdf
[69] 資料追加の公式アナウンスが見つからないが...
[204] >>203 どこから参照されてるファイルかわからんけどGoogle検索で出てきたやつ
[375] >>368 資料追加 (>>69) 前に >>61 からリンクされてたファイル。 調べてないが >>66 に後から公開されたファイルとおそらく同じ。
[376] >>71 >>70 精査してないがおそらく中身は >>66 で公開されたファイルと同じ (送り状が追加されるなど微妙に違う)。
[394] DAM2:2023 符号表で水平拡張と同時に行われた変更 (現在までの判明分)
[401] DAM2:2023 U+FA25 の JMJ-030234 と IPAmj明朝の MJ030234 が違うのどういうことなん?
[407] L2/23-237 (CJK & Unihan Group Recommendations for UTC #177 Meeting) - 23237-cjk-unihan-group-utc177.pdf, , https://www.unicode.org/L2/L2023/23237-cjk-unihan-group-utc177.pdf#page=4
[300] >>299 この時点で水平拡張することは決議されているにも関わらず、 なぜか実施されないまま移管されてしまった。
[98] SC 2 専門委員会 (符号化文字集合) | IPSJ/ITSCJ 情報処理学会 情報規格調査会, https://itscj.ipsj.or.jp/committee-activities/report/SC2-2021.html
今後の活動としては,電子行政システム用に用いられる人名漢字等約6万文字の漢字が,今後デジタル庁が進める政府のデジタル政策において重要な役割を果たすことを鑑みて,そこで定義されている文字図形を対応する10646規格のCJK統合漢字符号表の符号位置(J欄)に追加(いわゆる”水平拡張”)する活動を始める予定である.
[367] 令和3年になってようやく、これから始めると。蕎麦屋の出前かよ。 デジタル庁で重要なのになぜかデジタル庁でも IPA でもなく JSC2 がやるのがほんと謎。
[377] >>61 の公開レビューはその期間が始まる前に既に >>71 >>70 で WG2 に提出されている。 >>61 には公開レビュー終了後に結果を発表すると書いてあるが、 その気配すら見せないまま、既に Unicode Consortium のウェブサイト内 WG2 ページの ISO/IEC 10646 PDAM2:2023 符号表には反映されている。 公開レビューで何か重要な指摘があったとしても、 それに対応する気が最初からなかったのではないかと疑わざるを得ないスケジュール感ではなかろうか。
[378] >>67 >>69 こんな調子だったらしいしもともとそんなやる気ないんでしょ
頂いた個々のコメントに関しては、CITPCの文字情報基盤委員会及びJSC2において検討し、その結果を、当ホームページに掲載するとともに適宜ISO/IEC JTC 1/SC 2での規格化議論へ反映していきます。
頂いた個々のコメントに関しては、CITPCの文字情報基盤委員会及びJSC2において検討し、その結果を、当ホームページに掲載するとともに適宜ISO/IEC JTC 1/SC 2での規格化議論へ反映していきます。
もう1年になるけど音沙汰ないのどうなってるんだろうね? やる気あるのかな?
[423] できないなら最初からやるっていわなければいいのに
[369] >>368 では44組の変更予定が提示されているが、 >>203 では75組を検討しそのうち44組が変更予定としている。
[370] >>203 は46番の変更先が45番と同じになっている。 >>368 は正しい。
[187] <4D6963726F736F667420506F776572506F696E74202D2081798E9197BF34817A95B68E9A8FEE95F18AEE94D58C9F93A28FF38BB52E70707478> - 20130925handout4.pdf, , https://imi.go.jp/contents/2013/09/20130925handout4.pdf#page=20
[188] >>61 で UCS を変更すると言っている MJ006392 は、 >>187
で UCS の誤りを認めながらも変更しないという対応を取っていたものである。
かわりに U+215E4
に新たなMJ文字図形名を追加するとしていたが、
それはされなかった。
[311]
更に遡ると >>310 で U+215E4
に変更すると判断されている。
(が Hanyo-Denshi IVD を優先するためこの判断は撤回されていたらしい。)
[346] >>347 U+FA25 の JMJ 字形、現行 IPAmj明朝字形となんか違わない?
[371] 44組のうちの大部分が拡張Bで変更先が CNS 11643 出典の文字だというのも、 拡張Bが低品質で混乱していた時代と汎用電子の開発の時期がかぶるのと無関係でないのだろうぬ
[372] 44組のうち既存の出典Jまたは今回水平拡張追加の既存のデフォルトグリフに衝突しないものは、 すべてそのまま DAM2:2023 符号表に反映されているようです。
[411] n5241-repertoire-CDAM2.3.pdf, , https://www.unicode.org/wg2/docs/n5241-repertoire-CDAM2.3.pdf#page=2
[413] 24016-n5245-pdam20-3-doc.pdf, , https://www.unicode.org/L2/L2024/24016-n5245-pdam20-3-doc.pdf#page=5
[427] Issues about JMJ Horizontal Extension - n2722-JSourceIssues.pdf, , https://www.unicode.org/irg/docs/n2722-JSourceIssues.pdf
[424] XユーザーのThe Unicode Consortiumさん: 「Although Unicode Version 16.0 does not include any new CJK Unified Ideographs, Japanese “Moji Jōhō Kiban” source references have been added to over 36,000 existing CJK Unified Ideographs → https://t.co/7sxDI0lPC4 #文字情報基盤 #Unicode16 https://t.co/KwRZJznJSf」 / X, , https://x.com/unicode/status/1833113037454065780
[425] ところで MJ の所管団体は何の発表もしないの?????
[426] >>422 募集した意見についても放置プレイ継続中?????
[428] SC 2 専門委員会 (符号化文字集合) | 情報規格調査会, https://itscj.ipsj.or.jp/committee-activities/report/SC2-2022.html
[429] SC 2 専門委員会 (符号化文字集合) | 情報規格調査会, https://itscj.ipsj.or.jp/committee-activities/report/SC2-2023.html
[430] Unicode が改正されようがデジタル庁が何か出そうが JSC2 が報告を公表しようが全く動揺せず何の談話も発表しない毅然とした姿勢を貫くなんたら協議会、 促進してるなーーーー
[431] L2/24-227 (CJK & Unihan Working Group Recommendations for UTC #181 Meeting) - 24227-cjk-unihan-wg-utc181.pdf, , https://www.unicode.org/L2/L2024/24227-cjk-unihan-wg-utc181.pdf#page=15
[208] 利用しやすいライセンスで助かります。
[45] グループ-ノート:tsuruki-work-test - GlyphWiki, https://glyphwiki.org/wiki/Group-talk:tsuruki-work-test
urn:mojikiban:
mjdc:要素情報一覧 version="005.01" issued="2017-02-08" xmlns:mjdc="urn:mojikiban:ipa:go:jp:mjdc"
[389] mojikiban-uwg-20110811-shiryou.pdf, https://warp.ndl.go.jp/info:ndljp/pid/8328423/mojikiban.ipa.go.jp/pdf/iinkai/2011/uwg/mojikiban-uwg-20110811-shiryou.pdf
[390] 20110811_1u_a.pdf, https://warp.ndl.go.jp/info:ndljp/pid/8781339/mojikiban.ipa.go.jp/wp-content/uploads/pdf/2011/20110811_1u_a.pdf
[386] <4D6963726F736F667420576F7264202D2032303131303730318F4390B38DCF94C581798E9197BF8250817A88CF88F596BC95EB2E646F6378> - 20110802_1t_s2.pdf, https://warp.ndl.go.jp/info:ndljp/pid/8781339/mojikiban.ipa.go.jp/wp-content/uploads/pdf/2011/20110802_1t_s2.pdf
[387] 20110802_1t_a.pdf, https://warp.ndl.go.jp/info:ndljp/pid/8781339/mojikiban.ipa.go.jp/wp-content/uploads/pdf/2011/20110802_1t_a.pdf
[118] >>117 親玉の経産省からしてサイトから消してるんだからそりゃあ IPA も真似するよなあwwww
[123] 20111129_Setsumeikai_Sendai.pdf, https://warp.ndl.go.jp/info:ndljp/pid/3196417/ossipedia.ipa.go.jp/ipamjfont/20111129_Setsumeikai_Sendai.pdf
[94] 制定過程の議事録は IPA のサイトにありましたが、文字情報基盤事業の移管のときに消えてなくなったようです(?)。
[95] Internet Archive には一部しかありませんが、 WARP にはかなりあります >>93。 (全部あるのかは不明。)
[93] 2010年度 文字情報基盤推進委員会 開催状況 | 文字情報基盤整備事業, https://warp.ndl.go.jp/info:ndljp/pid/8406166/mojikiban.ipa.go.jp/1264.html
[114] 文字情報基盤整備事業 トップページ, Information-technology Promotion Agency, Japan., https://warp.ndl.go.jp/info:ndljp/pid/3196417/ossipedia.ipa.go.jp/ipamjfont/
[130] Microsoft Word - Web実証実験111219-a-strip.docx - 20111221_5t_s2.pdf, https://warp.ndl.go.jp/info:ndljp/pid/8781339/mojikiban.ipa.go.jp/wp-content/uploads/pdf/2011/20111221_5t_s2.pdf
[345] 000041671.pdf, , https://www.ipa.go.jp/about/cdk3vs0000002ymn-att/000041671.pdf#page=142
[3] 事業概要 | 文字情報基盤整備事業 ( ()) http://mojikiban.ipa.go.jp/3646.html
[73] グループ:関連字-検証 - GlyphWiki, https://glyphwiki.org/wiki/Group:%e9%96%a2%e9%80%a3%e5%ad%97-%e6%a4%9c%e8%a8%bc
MJ文字情報一覧表Ver.004.01の「対応するUCS」とGlyphWikiの関連字を照合したところ,以下の字については字形から見てより適当と思われる符号位置にGlyphWikiの関連字を設定しています。今後の精査が必要と考えられます。 --2014年11月21日(金) 18:53
[77] Unihan & Moji Jōhō Kiban Project: The Tip of the Iceberg, , https://ccjktype.fonts.adobe.com/2018/01/unihan-mj-iceberg.html
[5] 文字情報基盤整備事業 | 一般社団法人 文字情報技術促進協議会, , https://moji.or.jp/mojikiban/
[6] MJ文字情報一覧 | 一般社団法人 文字情報技術促進協議会, , https://moji.or.jp/mojikiban/mjlist/
[7] MJ縮退マップ | 一般社団法人 文字情報技術促進協議会, , https://moji.or.jp/mojikiban/map/
[10] MJ文字情報検索システム | 独立行政法人 情報処理推進機構 - IPA, , https://mojikiban.ipa.go.jp/search/home
[22] Google Spreadsheet で開けない...
[23] なんでデータベースを Excel ファイルで配布するんだよ、 CSV にしろよ...
[24] 政府CIO真面目に仕事しろよ!
[25] 旧バージョンにはXML版があったらしいが移管してそれもなくなった。 (最新バージョンは移管前から Excel only だったらしい。)
[64] vol_22_29-34.pdf, , http://www.jinbun-db.com/journal/pdf/vol_22_29-34.pdf
[32] ユニコードとの許諾契約 | 一般社団法人 文字情報技術促進協議会, https://moji.or.jp/2022/06/07/%e3%83%a6%e3%83%8b%e3%82%b3%e3%83%bc%e3%83%89%e3%81%a8%e3%81%ae%e8%a8%b1%e8%ab%be%e5%a5%91%e7%b4%84/
[44] 🌻𑖨𑖿𑖧𑖳𑖭𑖸さんはTwitterを使っています: 「MJ文字情報一覧表は、公開されているOpen XML形式では大漢和の索引番号から枝番や補巻の情報が落ちていて、壊れている。文字情報基盤検索システムで検索すると、正しい索引番号が出てくるみたいだけど」 / Twitter, , https://twitter.com/mandel59/status/1579159328896045056
[104] 公開データと運用データベースは元データが違うってコト?
[46] 情報学広場:情報処理学会電子図書館, <情報処理学会>, https://ipsj.ixsq.nii.ac.jp/ej/?action=pages_view_main&active_action=repository_view_main_item_detail&item_id=176213&item_no=1&page_id=13&block_id=8
[48] Microsoft Word - 㕒溶ㆂ込ㆿ20210203₢㕂㕒ㅞㇹㇿ溶込㕂鎤票DBæł´æŒ°å›“_910+0909åº§éŁ·ã…»ä¼ıéŁ·ã…¬ã‡¯å¾„ï¼›ã•’ç²¾æ»_0909-1ã•‚_è³⁄挎2-2ä½‘æ°‚è¨Ÿé„²ã‡·ã‡¹ã…ƒã…€æ¨ŽæºŒä»Łæ§Ÿæł¸æ¡‹ï¼‹æº¶è¾¼ï¼›++(1)9.26 .docx - 000706675.pdf, , https://www.soumu.go.jp/main_content/000706675.pdf#page=438
住民記録システムで用いるデータの文字セット(※1)は JIS X 0213:2012、 文字コードは ISO/IEC 10646:2017(※2、※3)、通信インタフェースの文字 符号化方式は UTF-16 とすること。ただし、氏名、旧氏、通称、世帯主、住所、 方書、転入前住所、本籍及び筆頭者の項目(以下「氏名等」という。)の文字 セットについては、「文字情報基盤」として整備された文字全てが利用できる よう(※4)、JIS X 0213:2012 及び ISO/IEC 10646:2017 附属書 A(※3)に 規定されている以下の組とすること。
・ 390 MOJI-JOHO-KIBAN IDEOGRAPHS-2016
・1042 KANA SUPPLEMENT のうち、U+1B001~U+1B0FF
・1115 KANA EXTENDED-A
※1 字形を含む。以下同じ。
※2 Amd.1:2019 及び Amd.2:2019 による追補後のもの。以下同じ。
※3 ISO/IEC 10646:2017 に準拠した JIS X 0221:2020 の発効後は、「ISO/IEC 10646:2017」を「JIS X 0221:2020」に置き換えるる。
※4 そのため、UTF-16 においてサロゲートペア(ISO/IEC 10646 の文字符号 化方式の UTF-16 で用いられる4バイトで1文字を表す符号化拡張方法) 又は IVS(字形選択子/漢字字形指示列)への対応が必要となる文字への 対応も必須とする。
EUC 等によるデータ出力(ディスプレイや紙等への出力及び XML 形式や CSV 形式、PDF 形式でのファイル出力等)の際は、「MJ 文字集合」と約1万文字の JIS X 0213(JIS 第1水準~第4水準)の文字(「JIS 文字集合」)との結びつ きを整理した「MJ 縮退マップ」を活用した縮退変換にも対応すること。この 場合、JIS X 0213 に準拠したフォントを用いた出力に対応できること。
文字情報基盤文字によるデータにおいて(なお書きによる経過措置におい ては、物理的又は仮想的な文字情報基盤文字によるデータ及び変換可能文字 によるデータにおいて)、ISO/IEC 10646 の私用領域に外字を定義でき、これ らの外字が住民記録システム上から利用できること。
[53] 1014_moji_guidebook.pdf, , https://cio.go.jp/sites/default/files/uploads/documents/1014_moji_guidebook.pdf
[72] IPAmj明朝を Windows と Android と Apple に標準搭載させるだけであとは時間が解決してくれる問題領域はわりと広いような気がするんだが、、、
[416] ChromeOS、Android における日本語環境の改善 vol.2 | Google Cloud 公式ブログ, https://cloud.google.com/blog/ja/products/gcp/improvement-of-japanese-environment-on-chromeos-and-android/
このたび、ChromeOS 言語パック機能がリリースされたことにより、日本語を選択した環境ではこのフォントがインストールできるようになりました。
[417] これはいいニュース。 ChromeOS だけでなくAndroidも頼むよ...
[102] グループ-ノート:MJ文字情報 - GlyphWiki, https://glyphwiki.org/wiki/Group-talk:MJ%e6%96%87%e5%ad%97%e6%83%85%e5%a0%b1
[75] グループ:文字情報基盤について - GlyphWiki, https://glyphwiki.org/wiki/Group:%e6%96%87%e5%ad%97%e6%83%85%e5%a0%b1%e5%9f%ba%e7%9b%a4%e3%81%ab%e3%81%a4%e3%81%84%e3%81%a6
[76] グループ:文字情報基盤-検証 - GlyphWiki, https://glyphwiki.org/wiki/Group:%e6%96%87%e5%ad%97%e6%83%85%e5%a0%b1%e5%9f%ba%e7%9b%a4-%e6%a4%9c%e8%a8%bc
[96] Microsoft Word - 第1回会議次第.doc - 20100928_1P_a.pdf, https://warp.ndl.go.jp/info:ndljp/pid/8406166/mojikiban.ipa.go.jp/wp-content/uploads/pdf/2010/20100928_1P_a.pdf#page=12
行政機関のみならず企業や個人が、 本事業終了後も将来にわたり自由に利用できるオープンで無料の利用 権を包括的に提供すること。 また、 将来の文字等の改定に備え、 文字改変の権利を国に包括的に付与するこ と。
[97] >>96 平成明朝体の権利が複雑で使い物にならない反省を踏まえ、しかも事業終了後のことまで考えた立派な方針を開始当初は掲げていた。すばらしい。 なお現状
[366] MJ045853 MJ013575 は同じに見えるけど...?
JIS X 0213 は同じなのに UCS が違うという難儀なことになってる?
[393] MJ013840 MJ013841 どう見ても同じだけど情報は違う。同形異字らしい。 X0213 の値と対応するUCSの値は同じ、 X0212 の値があるのは MJ013840 だけ。
[403] 利用者:ziyang - GlyphWiki, https://glyphwiki.org/wiki/User:ziyang に挙げられている(ほぼ)同形字:
[410] JARIB 出典で Unicode に入ってるのに文字情報基盤にない文字あるのどういうことなの。 民間では使うけど行政では使わない、理屈の上ではあり得るのかもしれないけど。
[412] 一般社団法人文字情報技術促進協議会, https://moji.or.jp/
『MJ文字情報一覧表 Ver.006.02』をリリースしました。(2024/01/17)