文字情報基盤

文字情報基盤整備事業

[103] 文字情報基盤は、平成時代日本政府が整備した行政漢字データベースです。

MJ文字図形名

[252] 文字情報基盤では各「文字図形」に名前がつけられていて、 MJ文字図形名と呼ばれています。

[253] MJ文字図形名MJ000001 のように MJ から始まり、 6桁固定長の数字列が続きます。

[254] 将来これ以外の形式が使われないと保証されているのかはわかりません。

[255] ほとんどは大文字で表されますが、 IPAmj明朝グリフ名小文字になっています。 (グリフ名小文字表記のことが多いためでしょう。)

[256] 欠番がちらほらあります。一度公表されたものが改正で削除されたことはないと思われるので、 開発過程で除去されたか、グループ分けなどの理由で空き領域が生じたのでしょうかね。

[257] MJ文字図形名と表される「文字図形」の関係は、 開発初期に非互換変更がされた (>>224) 後は変わっていない (追加のみの) ようです。 重複が判明しても削除はされていません。 従って安定した識別子として利用してよさそうです。

[277] その後も少なくても平成26年に字形変更や入れ替え (>>275) があったそうです。

Unicode との関係

[43] CJK統合漢字に出典 J で採録されている Unicode符号点であっても, 文字情報基盤に含まれてないこともあります。

[100] 文字情報基盤を出典に Unicode に追加された文字Unihan出典JJMJ となっています。

[278] すべてのMJ文字図形出典Jとして登録されているわけではありません。

UCS 実装する文字図形の選択

[105] MJ文字情報一覧 | 一般社団法人 文字情報技術促進協議会, https://moji.or.jp/mojikiban/mjlist/

[106] >>105 の「実装したUCS」欄が入っているのが IPAmj明朝cmapUnicode符号点と関連付けられているMJ文字図形 (デフォルトグリフ) です。

[108] >>105

下記の優先順位により決定した。

  1. 常用漢字表に掲載されている字形
  2. 人名用漢字別表(戸籍法施行規則別表第二漢字の表)に掲載されている字形
  3. 住民基本台帳ネットワークシステム統一文字コードと対応するUCSが一致する字形
  4. JIS X 0213:2012に掲載されている例示字形
  5. UCSのJ欄(日本提案の字体)に掲載されている例示字形
  6. 法務省告示第582号別表1に掲載されている字形
  7. 康煕字典体
  8. 「市区町村が使用する外字の実態調査http://www.soumu.go.jp/main_sosiki/jichi_gyousei/c-gyousei/lg-cloud/02kiban07_03000021.html」の出現頻度

[109] これによって JIS X 0213例示字形 (= UCSJ欄字形) と違いが生じているのが >>108 の 1. から3. で、 >>102 に一覧表があります。

[110] 4. の JIS X 0213:2012 より 3. の住基統一文字が優先された結果 JIS X 0213:2000字形に近くなり、しかしそれより 1. と 2. が優先された結果 JIS X 0213:2004字形に近くなる、つまり JIS X 0213 の大部分は JIS2004 ベース、 3. 該当部分だけ JIS90 ベースになっているらしい。難しい。

[124] 文字情報基盤整備事業IVD/IVS, Information-technology Promotion Agency, Japan., https://warp.ndl.go.jp/info:ndljp/pid/8198317/ossipedia.ipa.go.jp/ipamjfont/faq/ivs_ivd.html

[402] 人名用漢字はかなり高い優先順位ですが、 戸籍統一文字文字情報基盤の字形差12組では人名用漢字と違う字形になっているようです。 人名用漢字

IVS

[2] Moji_Joho

[12] 2014-05-16 版で新規追加。

[13] 2017-12-12 版で更に追加。

[11] IVD 登録については IVC 参照。

[14] Hanyo-Denshi の実質的な後継となっています (が >>37 >>38 に注意)。

[15] IPAmj明朝が実装しています。

[107] 文字関係
key
ivd:Moji_Joho
desc
IVD に登録された IVS からMJ文字図形へ。
[99] 文字関係
key
ivd:Hanyo-Denshi/ivd:Moji_Joho
desc
ivd:Hanyo-Denshi または ivd:Moji_Joho
datanote
1to1:ivd:Hanyo-Denshi/ivd:Moji_Joho のみ表示。 Hanyo-Denshi または Moji_Joho の一方でのみ利用されていることを示す。

登録手続き関連

IVS

特殊ケース

[31] MJ037229, MJ040579, MJ042077 は Unicode との対応関係が存在しない。

[74] グループ:文字情報基盤-符号化されていない文字 - GlyphWiki, https://glyphwiki.org/wiki/Group:%e6%96%87%e5%ad%97%e6%83%85%e5%a0%b1%e5%9f%ba%e7%9b%a4-%e7%ac%a6%e5%8f%b7%e5%8c%96%e3%81%95%e3%82%8c%e3%81%a6%e3%81%84%e3%81%aa%e3%81%84%e6%96%87%e5%ad%97

[279] かつて文字情報基盤に含まれていたものの、 字形の変更 (>>226 >>275) によって含まれなくなった結果、 Unicode符号位置でもIVSでも表せない旧MJ文字図形がいくつかあります。

[40] 文字情報基盤に含まれる Hanyo-DenshiMoji_JohoIVS は、1つの Unicode符号点に複数の文字情報基盤の文字図形が対応するときに登録することにしていたようです。 1つのUnicode符号点に1つだけしか文字図形が対応しないときは IVS はまったく使われていません。 (このパターンも結構多い。)

[41] この点は Adobe-Japan1Adobe-Japan1 のすべての漢字に対応する IVS を含んでいるのと方針が違います。

[42] この方針が理由で Hanyo-DenshiIVS があっても使われない (>>37) ケースもあるみたいです。

[281] ほとんどのMJ文字図形IPAmj明朝IVSのみ、またはIVSとその基底文字で実装されています。 例外はCJK互換漢字に対応するものです。 もっと稀な例外として、 >>280

  • U+2B9E4
  • U+535A U+E010B

のように IVS とその基底文字以外の CJK統合漢字が実装している例があります。

[289] 注音字母

常用漢字等との関係

[273] 「漢字施策」欄に「常用漢字」とあるものが2136文字あって、 平成22年の常用漢字表に含まれるものを表すようです。 (併記された旧字体は含まず。)

[274] 「漢字施策」欄に「人名用漢字」とあるものが863あって、 現時点で最新の人名用漢字として定められたものを表すようです。 (新字体旧字体の区別なし。)

汎用電子との関係

[35] Hanyo-DenshiMoji_Joho の関係性は、 ウェブ検索するといろいろ出てくるのですけれども、 制定過程のものも混ざっていてどれが最終状態に対するものなのかよくわからんです。 文字情報基盤の開発完了より前におかしいといわれているところは、 すでに修正済みだったりするみたいです。すべて対処されているのかはわかりません。

[33] 汎用電子も参照。

[37] Moji_JohoHanyo-Denshi で登録済みの IVS を共有再利用していますが、 Moji_JohoHanyo-Denshi をすべて含んでいるわけではないみたいです。 (>>42 にも注意。)

[306] >>305

また、事務局としては、文字情報基盤が公式に汎用電子の成果物を継承したうえで進め られていることもあり、Hanyo-Denshi コレクションについても、可能な限りその成果 を継承することが望ましいと考えている。

[350] 20131008_4k_s2_1.pdf, https://warp.ndl.go.jp/info:ndljp/pid/11177851/mojikiban.ipa.go.jp/contents/pdf/2013/20131008_4k_s2_1.pdf

[356] 汎用電子の実質的な後継新版が文字情報基盤であり、 文字コードとしてみると Hanyo-Denshi IVS の改訂版が Moji_Joho IVS であるとの観点でいえば、 次のように分類できます。

[363] Moji_Joho IVS がない Hanyo-Denshi IVS 固有のものを基底文字Unicode符号位置でみると:


[38] Moji_JohoHanyo-DenshiIVS を共有しているのに両者の登録字形が異なっている事例も発見されています。 >>36

[39] そもそも汎用電子平成明朝文字情報基盤IPAmj明朝なのですから、 厳密にいえば字形はすべて違うはずです。 ここで「異なっている」というのは人の目に判別できる違いがあるけど文字情報基盤は違わないと判断したもの、 ということになりますね。

[54] IVD の立場としては、そういうこともあるので IVC の登録者がまったく無関係なら勝手に再利用はさせない感じになっているみたいで IVC 汎用電子文字情報基盤はどちらも日本政府の事業なので、 日本政府が同じというなら同じでいいよ、ということだと思われます。 ですので、これは不具合でもなんでもない、仕様だと思われます。

[348] 平成明朝IPAmj明朝は細かい点画の接触の有無レベルの設計方針がかなり違っているらしく、 細部まで含めれば相当数の違いがあるようです。

[349] 比較的大きな字形差もいくつか発見されています。

[36] Ken Lunde 小林剣さんはTwitterを使っています: 「@henryfhchan @wtnelson @IPAjp Another observation is that the representative glyph for <U+7BF3,U+E0101> in the Moji_Joho and Hanyo-Denshi IVD collections don’t match, in terms of stroke-touching. The one of the latter matches what is in the code charts. https://t.co/GGiR7NAIcJ」 / Twitter, 午前6:00 · 2018年1月21日 , https://twitter.com/ken_lunde/status/954820851798437888

[34] ノート:u9055-j - GlyphWiki, https://glyphwiki.org/wiki/Talk:u9055-j

[351] U+4E47 U+E0101 (JB1618 / MJ006381) は >>350 で字形差があると指摘されつつも流用可能と判定されています。


[115] 文字情報基盤 文字情報一覧表 Ver.001.01 項目一覧, Information-technology Promotion Agency, Japan., https://warp.ndl.go.jp/info:ndljp/pid/3196417/ossipedia.ipa.go.jp/ipamjfont/mjmojiichiran/hanrei.html

汎用電子整理番号汎用電子情報交換環境整備プログラムの漢字情報テーブルにおけるレコードの通し番号。
平成明朝平成明朝体グリフのグリフ名。平成明朝体グリフは汎用電子情報交換環境整備プログラムの文字グリフ作業委員会にて制作されたものである。

[116] >>115 昔の文字情報基盤にはこのような汎用電子平成明朝との対応情報が入っていたらしい。 その後文字情報基盤からこの情報は消えて、変更も多いので、 今の文字情報基盤とこの情報がどの程度整合しているのかは不明。

[258] 同じ平成明朝グリフ名が複数のMJ文字図形に対応付けられている例が散見されます。 文字情報基盤の改定で重複が増える形で改められたものも多いので、 誤りではなく意図的にそうしていたと思われます。 汎用電子側の基準では統一され、文字情報基盤側の基準では区別されるようなときでしょうか?

[307] >>305

文字情報基盤ではさまざま な理由(主として総務省からの要請)によって、異なる文字図形として追加作り 分けしたものがある。そのため、文字情報一覧表では、複数の MJ 文字図形が同一 の平成明朝名グリフに対応している場合がある。

[313] >>307 「作り分け」のためMJ文字図形バージョンが 1 と 1.1 があるとき 1 が平成明朝に近いのが原則というようなことが >>305 では書かれている。 がいつもそうなるわけではなく、 >>312 は U+914D (配) の例を挙げていて、

のうち平成明朝 JA3959 に近いのは MJ026441 とされる。

[314] 同じような例が U+696F (楯)

で平成明朝 JA2961 = HG1630 に近いのは MJ014231 と思われる。 Hanyo-Denshi IVD U+914D U+E0102 = JA2961 >>315 も昔の URO 符号表 >>316 も MJ014231 に近い。 この字形は JIS X 0213:2004 で変更されていて、 変更後の規格票字形、 現行 URO 符号表の字形 >>317 は MJ014230 に近い。

[318] 楯は右上のノと十の違いもあって更にややこしい。

[328] IPAex明朝IPAmj明朝とも JIS X 0213 とも違うというのがまた。。。

[352] 「非」のように視認できる字形差がある部分字形で、 文字情報基盤ではときにはどちらの部分字形を使った字形もあるにも関わらず、 特定の字形については一方しかない場合もあって、 しかも JIS X 0212JIS X 0213 とは一致しない字形しか文字情報基盤にはない、 というパターンもたまにあります。 例えば U+5298 U+E0101 の JB1954 (JIS X 0212 19-54, JIS X 0213 2-3-32) と MJ007619 がそうです。 (>>350 に注記があるので意図的です。)

[353] 視認できる字形差がないにも関わらず、 汎用電子文字情報基盤で別の IVS が登録されているものも、 少なからずあります。 例えば:

[354] PRI259_NAOI_0305.pdf, , http://www.unicode.org/ivd/pri/pri259/PRI259_NAOI_0305.pdf

[355] >>354 には字形差がないのに新規の IVS を登録しようとしたものの指摘がありますが、 そのまま新規登録されたものが多いようです。既存のものではいけない理由が何かあったのでしょうか。

[336] >>335 #page=1 MJ006381 と JD0109S = JB1618 で視認できる字形差 (横線の傾き) があるのに同じ IVS を流用している例

[337] >>335 #page=2 関連: U+5298 の U+E0101, U+E0102 のどちらも「非」の左下の字形差 >>339, >338JIS X 0212, JIS X 0213, 汎用電子の字形と MJ の字形が違う。

[409] <U+9A4A, U+E0103> は JTBFE9S かつ MJ028801、 <U+9A4A, U+E0104> は MJ068073 ですが、 JTBFE9S と MJ068073 が同等の字形に見えます。


[260] 一覧表 Ver.005.01 には Hanyo-Denshi IVS 欄があって Moji_Joho IVS 欄がないものがいくつかあります。 そのほとんどは現行 Moji_Joho IVS に含まれる IVS です。 当時はまだ含まれていなかったのかもしれません (未確認)。

[261] 唯一、 MJ068065 の HD IVS 欄が 83B5_E0103 ということになっていますが、 現在は MJ IVS <U+83B5, U+E0104> に対応することになっています。 Ver.005.01 では 83B5_E0103 がもう1つあって、 MJ022047 の HD IVS 欄と MJ IVS 欄の両方が 83B5_E0103 になっていました。 MJ068065 の方は誤りだったのでしょうか。

[262] MJ IVS 欄と HD IVS 欄の両方があるとき、ほとんどは同じ値ですが、 一致しないのが1つだけあります。 MJ026439 の MJ IVS は 914D_E0105 で HD IVS は 914D_E0102 です。 XML 版でも Excel 版でもこうなっています。 現在の MJ にある & MJ IVC に含まれるのは U+E0105 だけ。 HD IVC に含まれるのは U+E0102 だけ。

[263] XML 版では HD IVS 欄は IPAmj明朝に「実装した」 と書かれていますが、当時の IPAmj明朝で U+E0102 が実装されていたのかは未確認。

[264] この他に MJ IVS 欄だけあるもの、どちらもないものは多数あります。


[270] Ver.005.01 には「X0212」欄と「平成明朝」欄があって、 「平成明朝」の JB から始まるものは JIS X 0212例示字形関係のグリフのはずなので、 両者の区点番号は一致すると予想されるところです。

[271] 実際大部分はそうですが、 「X0212」欄に区点位置があるのに「平成明朝」欄に JB グリフがないもの、 「平成明朝」欄に JB グリフがあるのに「X0212」欄が空欄のものがあります。

[272] 先述の通り複数のMJ文字図形に同じ「平成明朝」のこともあるのですが、 うち一方の「X0212」が「平成明朝」の区点位置と一致し、 他方は JB グリフでないこともあります。


[343] 整理番号があるのに平成明朝が空欄がいくつかあるのはどういうことなんでしょう?

[344] 同じ平成明朝グリフ名なのに整理番号が違うのがいくつかあるのはどういうことなんでしょう?

[405] 文字関係
key
mj:moved
desc
ほぼ同等の例示字形を持つ汎用電子 IVS (文字情報基盤 IVS と共有されていないもの。) から文字情報基盤 IVS へ。
[406] 文字関係
key
mj:shared:equiv
desc
IVS を共有しほぼ同等の例示字形を持つ汎用電子平成明朝グリフからMJ文字図形へ。
[408] 文字関係
key
mj:shared:similar
desc
IVS を共有し例示字形に違いがある汎用電子平成明朝グリフからMJ文字図形へ。

開発過程

[183] 一覧表本体:

[184] 変体仮名:

[282] その他の非漢字: IPAmj明朝

[186] 縮退: MJ縮退マップ

[185] フォント: IPAmj明朝


[216] バージョン番号の付け方が独特ですが、IPAフォント以来の伝統みたいです。 (ファイル差替でバージョン番号が変わらないのも困った伝統。)

[206] ver.001.01 時点で「更新履歴」欄には変更情報がかなり入っています。 もっと前の版があったのでしょうか。公開されていないものかもしれません。

[209] 文字情報一覧表の「項目」
n
項目
001.01
ver.001.01
002.01
ver.002.01
002.02
ver.002.02
003.01
ver.003.01
004.01
Ver.004.01
004.02
Ver.004.02
004.03
Ver.004.03
005.01
Ver.005.01
005.02
Ver.005.02
006.01
Ver.006.01
n
図形
006.01
n
font
006.01
n
MJ文字図形名
001.01
002.01
002.02
003.01
004.01
004.02
004.03
005.01
005.02
006.01
n
対応するUCS
001.01
002.01
002.02
003.01
004.01
004.02
004.03
005.01
005.02
006.01
n
UCS対応カテゴリー
001.01
UCS対応カテゴリ: A1, A2, A3, A4, B, C
002.01
A1, A2, A3, A4, B, C
002.02
A1, A2, A3, A4, B, C
003.01
A1, A2, A3, A4, B, E, F
004.01
A, B, F
004.02
A, B, F
004.03
A, B, F
005.01
A, B, F
005.02
A, U
n
実装したUCS
001.01
UCS実装
002.01
UCS実装
002.02
UCS実装
003.01
004.01
004.02
004.03
005.01
005.02
006.01
n
IVS
001.01
002.01
002.02
n
実装したIVS
001.01
IVS実装
002.01
IVS実装
002.02
IVS実装
003.01
n
実装したMoji_JohoコレクションIVS
004.01
004.02
004.03
005.01
005.02
006.01
n
対応するHanyo-DenshiコレクションIVS
004.01
004.02
004.03
005.01
n
実装したSVS
004.01
004.02
004.03
005.01
005.02
006.01
n
戸籍統一文字番号
001.01
002.01
002.02
003.01
004.01
004.02
004.03
005.01
005.02
006.01
n
住基ネット統一文字コード
001.01
002.01
002.02
003.01
004.01
004.02
004.03
005.01
005.02
006.01
n
入管正字コード
003.01
004.01
004.02
004.03
005.01
005.02
006.01
n
入管外字コード
002.01
002.02
003.01
004.01
004.02
004.03
005.01
005.02
006.01
n
漢字施策
001.01
002.01
002.02
003.01
004.01
004.02
004.03
005.01
005.02
006.01
n
対応する互換漢字
003.01
004.01
004.02
004.03
005.01
005.02
006.01
n
X0213
001.01
002.01
002.02
003.01
004.01
004.02
004.03
005.01
005.02
006.01
n
JIS X0213 包摂連番
001.01
002.01
002.02
003.01
004.01
004.02
004.03
005.01
005.02
006.01
n
JIS X0213 包摂区分
001.01
002.01
002.02
003.01
004.01
004.02
004.03
005.01
005.02
006.01
n
X0212
001.01
002.01
002.02
003.01
004.01
004.02
004.03
005.01
005.02
006.01
n
MJ文字図形バージョン
001.01
SVG図形バージョン
002.01
SVG図形バージョン
002.02
003.01
004.01
004.02
004.03
005.01
005.02
006.01
n
登記統一文字番号(参考)
001.01
002.01
002.02
003.01
004.01
004.02
004.03
005.01
005.02
006.01
n
部首(参考)
001.01
部首
002.01
002.02
003.01
004.01
004.02
004.03
005.01
005.02
006.01
n
内画数(参考)
001.01
内画数
002.01
002.02
003.01
004.01
004.02
004.03
005.01
005.02
006.01
n
総画数(参考)
001.01
総画数
002.01
002.02
003.01
004.01
004.02
004.03
005.01
005.02
006.01
n
読み(参考)
001.01
002.01
002.02
003.01
004.01
004.02
004.03
005.01
005.02
006.01
n
大漢和
001.01
002.01
002.02
003.01
004.01
004.02
004.03
005.01
005.02
006.01
n
日本語漢字辞典
003.01
004.01
004.02
004.03
005.01
005.02
006.01
n
新大字典
004.01
004.02
004.03
005.01
005.02
006.01
n
大字源
004.01
004.02
004.03
005.01
005.02
006.01
n
大漢語林
005.01
005.02
006.01
n
汎用電子整理番号(参考)
001.01
汎用電子整理番号
002.01
002.02
003.01
004.01
004.02
004.03
n
平成明朝(参考)
001.01
平成明朝
002.01
002.02
003.01
004.01
004.02
004.03
005.01
n
更新履歴
001.01
002.01
002.02
003.01
004.01
004.02
004.03
005.01
005.02
006.01
n
備考
005.01
005.02
006.01

[259] Ver.005.01 の説明には

対応するHanyo-DenshiコレクションIVS
Unicode ConsortiumのIVD Version 2010-11-14のHanyo-Denshiコレクションに対応する文字についは、IVSを記した。

とありますが、 XML 版にはそれに相当するのが 実装したHanyo-DenshiIVS 要素になっていて、 XML Schema では

                                                                        Unicode ConsortiumのIVD Version 2010-11-14のHanyo-Denshiコレクションにより実装したIVSを
記した。
                                                                        MJ文字情報一覧表 項目一覧の「対応するHanyo-DenshiコレクションIVS」に対応する。

と説明されています。 (この他の項目も XML 版では微妙に表現が違います。)

[240] 「MJ文字図形バージョン」は変更のあった版を表しているらしい?

[244] Ver.001.01 時点、

[243] Ver.006.01 時点、

[242] 当初の「SVG図形バージョン」で 1.0 だったものがいつの間にか 1 に変わってるな...

[245] Ver.001.01 の最大が MJ060385 (当時のバージョン: 1.0)。 そこからしばらく欠番で、その次が MJ067952 (現時点のバージョン: 2)。 そこからが追加漢字の領域で、 現時点での最大は MJ068101 (現時点のバージョン: 5.2)。

[246] 追加漢字の領域にあるにも関わらず現時点のバージョンが 1 のもの:

[247] >>246 は Ver.005.01 での追加。この周辺の領域はバージョンが 4.1 でも Ver.005.01 での追加だったりするものがちらほら。

[249] >>193 の頃は CSV の配布がなくなっていますが、 XML の配布ファイルに XML から CSV に変換する XSLTスタイルシートが入っています。 それなら最初から CSV で配布してくれてもよさそうなものですが。 迷走ぶりが現れています。

移管

[4] 「文字情報基盤」成果物をIPAから移管 | 一般社団法人 文字情報技術促進協議会 (, ) https://moji.or.jp/2020/08/25/release20200825/

今般、文字情報基盤整備事業の成果物である、文字情報一覧表、フォント等の管理・活用をIPAからCITPCが引き継ぐことになりました。これら成果物の今後の保守、公開および活用促進について、CITPCが主導し、主体的に活動していくこととなります。

[8] 「準備中」や 404 が多発してるんだが... 移管するならちゃんと準備してからにしてくれんかね?

[16] 移管で議事録が探せなくなったとか、 API を使っていた外部サービスが動かなくなったとか、 被害報告多数でみんな困ってそう。 何考えて運営しとるんやろな

[17] 民間団体に go.jp ドメイン使わせるわけにいかないとかなんかな。 それにしたって Web サーバーを動かすのに必要な情報を全部渡して、 元のサイト構造とシステムが動く状態にしろよと。。。

[18] 政府が税金で整備した公的データベースを民営化して、あとは知りませんってのはどうなんだ。

[26] Excel ファイル内に文字図形の URL が書いてあったのが、 移管で全部移管案内 HTML ページに置き換わって意味をなさなくなってる。

[27] 移管後1年経っても新バージョンが公開されない、 気づいていないのかやる気が無いのか。

[28] そもそも URL を変更するな、どうしても変更せざるを得ないならリダイレクトしろ。 Webサイト運営の基本中の基本くらいきちんとしろよ。

[50] 今やドメインごと消滅www 移管案内にすらたどり着けないのひどすぎるなwwww

[29] 税金で作ったデータベースを大事に使っていこう、 先人から受け継いだ文化遺産を次代に引き継ごう、 という意志が全く無いのかね?

[51] 民間でも (さすがに会社なくなったところはあれだけど) 多サービス展開してるところは旧ドメインから新ドメインへの引き継ぎちゃんとやってるんだよなあ。 畳んだサービスも案内ページは恒久的に置いてある。 終了サーバーが何十個、何百個あろうと案内HTMLページ各1枚くらいなら静的サーバーを1組置いとけば余裕で捌けるんだから、 跡地をどうするかっていうのはデジタル庁あたりで巻き取ってしっかりやってくれんもんかねえ。

[19] 文字情報基盤の民間移行 | 政府CIOポータル, https://cio.go.jp/node/2708

民間の創意工夫の中で発展し加速していくことが期待されています。

[20] 1年経ちましたが何か進展はありましたか・・・(小声)

[21] 初速が0なら加速しても0だから・・・(震え声)

[30] 初速が負なら逆行もあり得るな!

[52] >>19

更に、もっと発展していくためにはゴシック体も作りたいとか、実装の仕組みであるIVSを推進するとか民間が機動的に行ったほうが良い面もあります。

いやー異世界のMJは進んでますなー 民間の力すげー

[55] 民間で機動的に事業を進めた結果、

と誇らしい成果が出ていますよね! って令和nihonLinux かよ!!

[59] 信託譲渡契約とやらがそのまま生きてるってことは、 政府もこれを見て民間の創意工夫すげー進化が加速してるぜーって思ってるってことでしょ?

[60] 政府機関は法令に基づき設置されて国民のためになる事業をすることが期待されてるのでしょう? でもこの民間団体はそのような義務もない、どこかの誰かが勝手に設置した機関なのでしょ? だからもう文字情報基盤事業が国民にとって有益なアウトプットを提供してくれることは期待してはいけないのかもよ。 どこかの事業予定に会員専用フォントを提供する的なこと書いてた気が。

[62] 脱●したらトイレが詰まったやましゅうおじさんさんはTwitterを使っています: 「文字情報基盤の検索システム、文字情報技術促進協議会に信託譲渡されたわけだが、めちゃくちゃ使いづらくなっとる。(個人の感想です)#文字情報基盤」 / Twitter, , https://twitter.com/yamashu44/status/1380149854794440706

[63] もりやまもりたろう@先祖探しさんはTwitterを使っています: 「@yamashu44 SVG情報は公開しないとその団体に言われました。。。」 / Twitter, , https://twitter.com/morishi_37/status/1563315063410552838

[88] あーリンク切れしまくりで情報探すの面倒すぎるーーーーーーーーーーーーーーー

[111] IPAexフォントの変更履歴も消滅したまま放置されてる。ひどいなあ。

[112] 404 ページなのだが

ここを指しているリンクに誤りがあったようです。検索してみるのはいかがですか ?

とか喧嘩売ってるんかと。 翻訳でこのノリのことはよくあるけどここ日本語サイトだろ...

[113] そんで IPA の本体サイトも令和5年のリニューアルでウェブサイト崩壊炎上事件を起こして ( IPA ) 未だに完全復旧されてないからそっちに載ってた情報も消えちゃってるしどうなってるんだよ。

令和5年の改正案

[69] 資料追加の公式アナウンスが見つからないが...

[204] >>203 どこから参照されてるファイルかわからんけどGoogle検索で出てきたやつ

[375] >>368 資料追加 (>>69) 前に >>61 からリンクされてたファイル。 調べてないが >>66 に後から公開されたファイルとおそらく同じ。

[376] >>71 >>70 精査してないがおそらく中身は >>66 で公開されたファイルと同じ (送り状が追加されるなど微妙に違う)。

[394] DAM2:2023 符号表水平拡張と同時に行われた変更 (現在までの判明分)

[401] DAM2:2023 U+FA25 の JMJ-030234 と IPAmj明朝の MJ030234 が違うのどういうことなん?

[407] L2/23-237 (CJK & Unihan Group Recommendations for UTC #177 Meeting) - 23237-cjk-unihan-group-utc177.pdf, , https://www.unicode.org/L2/L2023/23237-cjk-unihan-group-utc177.pdf#page=4


[300] >>299 この時点で水平拡張することは決議されているにも関わらず、 なぜか実施されないまま移管されてしまった。

[98] SC 2 専門委員会 (符号化文字集合) | IPSJ/ITSCJ 情報処理学会 情報規格調査会, https://itscj.ipsj.or.jp/committee-activities/report/SC2-2021.html

今後の活動としては,電子行政システム用に用いられる人名漢字等約6万文字の漢字が,今後デジタル庁が進める政府のデジタル政策において重要な役割を果たすことを鑑みて,そこで定義されている文字図形を対応する10646規格のCJK統合漢字符号表の符号位置(J欄)に追加(いわゆる”水平拡張”)する活動を始める予定である.

[367] 令和3年になってようやく、これから始めると。蕎麦屋の出前かよ。 デジタル庁で重要なのになぜかデジタル庁でも IPA でもなく JSC2 がやるのがほんと謎。

[369] >>368 では44組の変更予定が提示されているが、 >>203 では75組を検討しそのうち44組が変更予定としている。

[370] >>203 は46番の変更先が45番と同じになっている。 >>368 は正しい。

[377] >>61公開レビューはその期間が始まる前に既に >>71 >>70WG2 に提出されている。 >>61 には公開レビュー終了後に結果を発表すると書いてあるが、 その気配すら見せないまま、既に Unicode Consortium のウェブサイト内 WG2 ページの ISO/IEC 10646 PDAM2:2023 符号表には反映されている。 公開レビューで何か重要な指摘があったとしても、 それに対応する気が最初からなかったのではないかと疑わざるを得ないスケジュール感ではなかろうか。

[378] >>67 >>69 こんな調子だったらしいしもともとそんなやる気ないんでしょ

[187] <4D6963726F736F667420506F776572506F696E74202D2081798E9197BF34817A95B68E9A8FEE95F18AEE94D58C9F93A28FF38BB52E70707478> - 20130925handout4.pdf, , https://imi.go.jp/contents/2013/09/20130925handout4.pdf#page=20

[188] >>61 で UCS を変更すると言っている MJ006392 は、 >>187 で UCS の誤りを認めながらも変更しないという対応を取っていたものである。 かわりに U+215E4 に新たなMJ文字図形名を追加するとしていたが、 それはされなかった。

[311] 更に遡ると >>310U+215E4 に変更すると判断されている。 (が Hanyo-Denshi IVD を優先するためこの判断は撤回されていたらしい。)

[346] >>347 U+FA25 の JMJ 字形、現行 IPAmj明朝字形となんか違わない?

[371] 44組のうちの大部分が拡張Bで変更先が CNS 11643 出典の文字だというのも、 拡張Bが低品質で混乱していた時代と汎用電子の開発の時期がかぶるのと無関係でないのだろうぬ

[372] 44組のうち既存の出典Jまたは今回水平拡張追加の既存のデフォルトグリフに衝突しないものは、 すべてそのまま DAM2:2023 符号表に反映されているようです。

[411] n5241-repertoire-CDAM2.3.pdf, , https://www.unicode.org/wg2/docs/n5241-repertoire-CDAM2.3.pdf#page=2

[413] 24016-n5245-pdam20-3-doc.pdf, , https://www.unicode.org/L2/L2024/24016-n5245-pdam20-3-doc.pdf#page=5

MJ文字情報一覧表

[207] ライセンスは CC BY-SA 2.1。

[208] 利用しやすいライセンスで助かります。

MJ縮退マップ

MJ縮退マップ

変体仮名

[45] グループ-ノート:tsuruki-work-test - GlyphWiki, https://glyphwiki.org/wiki/Group-talk:tsuruki-work-test

変体仮名

Adobe-Japan1 との対応関係

汎用電子

URN NID urn:mojikiban:

[49]

mjdc:要素情報一覧 version="005.01" issued="2017-02-08" xmlns:mjdc="urn:mojikiban:ipa:go:jp:mjdc"

拡張

[90] IPAmjPUPフォント

[47] MJ+

文字関係

[83] 文字関係
key
mj:対応するUCS
desc
MJ文字情報一覧表本体の「対応するUCS」、 MJ文字情報一覧表 変体仮名編の「UCS符号位置」「UCS」、 IPAmj明朝 非漢字の「対応するUCS」「対応UCS」。
[82] 文字関係
key
mj:実装したUCS
desc
MJ文字情報一覧表本体の「実装したUCS」、 IPAmj明朝 非漢字の「UCS実装」および「合成列」。
[265] 文字関係
key
mj:実装したMoji_JohoコレクションIVS
desc
MJ文字情報一覧表本体の「実装したMoji_JohoコレクションIVS」。
[266] 文字関係
key
mj00501:実装したMoji_JohoコレクションIVS
desc
MJ文字情報一覧表本体 (Ver.005.01) の「実装したMoji_JohoコレクションIVS」。
[267] 文字関係
key
mj00501:対応するHanyo-DenshiコレクションIVS
desc
MJ文字情報一覧表本体 (Ver.005.01) の「対応するHanyo-DenshiコレクションIVS」。
[78] 文字関係
key
mj:JIS包摂規準・UCS統合規則
[79] 文字関係
key
mj:X0213
desc
MJ文字情報一覧表本体の「X0213」 (「X0213 包摂区分」が「0」のもの)、 IPAmj明朝 非漢字の「JIS X 0213」。
[89] 文字関係
key
mj:X0213:2
desc
MJ文字情報一覧表本体の「X0213」 (「X0213 包摂区分」が「2」のもの)。
[80] 文字関係
key
mj:住基ネット統一文字コード
[81] 文字関係
key
mj:入管正字コード
[84] 文字関係
key
mj:戸籍統一文字番号
desc
MJ文字情報一覧表本体の「戸籍統一文字番号」、 MJ文字情報一覧表 変体仮名編の「戸籍統一文字番号」、 IPAmj明朝 非漢字の「戸籍統一文字番号(参考)」。
[85] 文字関係
key
mj:登記統一文字番号
desc
MJ文字情報一覧表本体の「登記統一文字番号(参考)」、 IPAmj明朝 非漢字の「登記統一文字番号(参考)」。
datanote
mj:戸籍統一文字番号 と重複するものは省略した。
[86] 文字関係
key
mj:戸籍統一文字:同一
desc
MJ文字情報一覧表本体の「備考」において戸籍統一文字で字形・字義が同一と説明されているもの。
[87] 文字関係
key
mj:新しいMJ文字図形名
desc
MJ文字情報一覧表本体の「備考」において「新しいMJ文字図形名」として参照されているもの。
[101] 文字関係
key
mj:大漢和
desc
MJ文字情報一覧表本体の「大漢和」。 (大漢和辞典)
[268] 文字関係
key
mj00101:大漢和
desc
MJ文字情報一覧表本体 (Ver.001.01) の「大漢和」。 (大漢和辞典)
[269] 文字関係
key
mj00101:大漢和
desc
MJ文字情報一覧表本体 (Ver.001.01) の「大漢和」 (# 付きの値)。 (大漢和辞典)
[251] 文字関係
key
mj00101:平成明朝
desc
MJ文字情報一覧表 Ver.001.01 の「平成明朝」。
[250] 文字関係
key
mj00501:平成明朝
desc
MJ文字情報一覧表 Ver.005.01 の「平成明朝」。
[248] 文字関係
key
mj:version
desc
MJ文字図形の版。

歴史

[389] mojikiban-uwg-20110811-shiryou.pdf, https://warp.ndl.go.jp/info:ndljp/pid/8328423/mojikiban.ipa.go.jp/pdf/iinkai/2011/uwg/mojikiban-uwg-20110811-shiryou.pdf

[390] 20110811_1u_a.pdf, https://warp.ndl.go.jp/info:ndljp/pid/8781339/mojikiban.ipa.go.jp/wp-content/uploads/pdf/2011/20110811_1u_a.pdf

[386] <4D6963726F736F667420576F7264202D2032303131303730318F4390B38DCF94C581798E9197BF8250817A88CF88F596BC95EB2E646F6378> - 20110802_1t_s2.pdf, https://warp.ndl.go.jp/info:ndljp/pid/8781339/mojikiban.ipa.go.jp/wp-content/uploads/pdf/2011/20110802_1t_s2.pdf

[387] 20110802_1t_a.pdf, https://warp.ndl.go.jp/info:ndljp/pid/8781339/mojikiban.ipa.go.jp/wp-content/uploads/pdf/2011/20110802_1t_a.pdf

[118] >>117 親玉の経産省からしてサイトから消してるんだからそりゃあ IPA も真似するよなあwwww

[123] 20111129_Setsumeikai_Sendai.pdf, https://warp.ndl.go.jp/info:ndljp/pid/3196417/ossipedia.ipa.go.jp/ipamjfont/20111129_Setsumeikai_Sendai.pdf

[94] 制定過程の議事録は IPA のサイトにありましたが、文字情報基盤事業の移管のときに消えてなくなったようです(?)。

[95] Internet Archive には一部しかありませんが、 WARP にはかなりあります >>93。 (全部あるのかは不明。)

[93] 2010年度 文字情報基盤推進委員会 開催状況 | 文字情報基盤整備事業, https://warp.ndl.go.jp/info:ndljp/pid/8406166/mojikiban.ipa.go.jp/1264.html

[114] 文字情報基盤整備事業 トップページ, Information-technology Promotion Agency, Japan., https://warp.ndl.go.jp/info:ndljp/pid/3196417/ossipedia.ipa.go.jp/ipamjfont/

[130] Microsoft Word - Web実証実験111219-a-strip.docx - 20111221_5t_s2.pdf, https://warp.ndl.go.jp/info:ndljp/pid/8781339/mojikiban.ipa.go.jp/wp-content/uploads/pdf/2011/20111221_5t_s2.pdf

[345] 000041671.pdf, , https://www.ipa.go.jp/about/cdk3vs0000002ymn-att/000041671.pdf#page=142

関連

住基ネット統一文字

メモ

[3] 事業概要 | 文字情報基盤整備事業 ( ()) http://mojikiban.ipa.go.jp/3646.html

[73] グループ:関連字-検証 - GlyphWiki, https://glyphwiki.org/wiki/Group:%e9%96%a2%e9%80%a3%e5%ad%97-%e6%a4%9c%e8%a8%bc

MJ文字情報一覧表Ver.004.01の「対応するUCS」とGlyphWikiの関連字を照合したところ,以下の字については字形から見てより適当と思われる符号位置にGlyphWikiの関連字を設定しています。今後の精査が必要と考えられます。 --2014年11月21日(金) 18:53

[77] Unihan & Moji Jōhō Kiban Project: The Tip of the Iceberg, , https://ccjktype.fonts.adobe.com/2018/01/unihan-mj-iceberg.html

[5] 文字情報基盤整備事業 | 一般社団法人 文字情報技術促進協議会, , https://moji.or.jp/mojikiban/

[6] MJ文字情報一覧 | 一般社団法人 文字情報技術促進協議会, , https://moji.or.jp/mojikiban/mjlist/

[7] MJ縮退マップ | 一般社団法人 文字情報技術促進協議会, , https://moji.or.jp/mojikiban/map/

[9] IPAmj明朝

[10] MJ文字情報検索システム | 独立行政法人 情報処理推進機構 - IPA, , https://mojikiban.ipa.go.jp/search/home

[22] Google Spreadsheet で開けない...

[23] なんでデータベースを Excel ファイルで配布するんだよ、 CSV にしろよ...

[24] 政府CIO真面目に仕事しろよ!

[25] 旧バージョンにはXML版があったらしいが移管してそれもなくなった。 (最新バージョンは移管前から Excel only だったらしい。)

[64] vol_22_29-34.pdf, , http://www.jinbun-db.com/journal/pdf/vol_22_29-34.pdf

[65] >>64 これはもうない

[32] ユニコードとの許諾契約 | 一般社団法人 文字情報技術促進協議会, https://moji.or.jp/2022/06/07/%e3%83%a6%e3%83%8b%e3%82%b3%e3%83%bc%e3%83%89%e3%81%a8%e3%81%ae%e8%a8%b1%e8%ab%be%e5%a5%91%e7%b4%84/

[44] 🌻𑖨𑖿𑖧𑖳𑖭𑖸さんはTwitterを使っています: 「MJ文字情報一覧表は、公開されているOpen XML形式では大漢和の索引番号から枝番や補巻の情報が落ちていて、壊れている。文字情報基盤検索システムで検索すると、正しい索引番号が出てくるみたいだけど」 / Twitter, , https://twitter.com/mandel59/status/1579159328896045056

[104] 公開データと運用データベースは元データが違うってコト?

[46] 情報学広場:情報処理学会電子図書館, <情報処理学会>, https://ipsj.ixsq.nii.ac.jp/ej/?action=pages_view_main&active_action=repository_view_main_item_detail&item_id=176213&item_no=1&page_id=13&block_id=8

[48] Microsoft Word - 㕒溶ㆂ込ㆿ20210203₢㕂㕒ㅞㇹㇿ溶込㕂鎤票DBæł´æŒ°å›“_910+0909åº§éŁ·ã…»ä¼ıéŁ·ã…¬ã‡¯å¾„ï¼›ã•’ç²¾æŸ»_0909-1ã•‚_è³⁄挎2-2ä½‘æ°‚è¨Ÿé„²ã‡·ã‡¹ã…ƒã…€æ¨ŽæºŒä»Łæ§Ÿæł¸æ¡‹ï¼‹æº¶è¾¼ï¼›++(1)9.26 .docx - 000706675.pdf, , https://www.soumu.go.jp/main_content/000706675.pdf#page=438

住民記録システムで用いるデータの文字セット(※1)は JIS X 0213:2012、 文字コードは ISO/IEC 10646:2017(※2、※3)、通信インタフェースの文字 符号化方式は UTF-16 とすること。ただし、氏名、旧氏、通称、世帯主、住所、 方書、転入前住所、本籍及び筆頭者の項目(以下「氏名等」という。)の文字 セットについては、「文字情報基盤」として整備された文字全てが利用できる よう(※4)、JIS X 0213:2012 及び ISO/IEC 10646:2017 附属書 A(※3)に 規定されている以下の組とすること。

・ 390 MOJI-JOHO-KIBAN IDEOGRAPHS-2016

・1042 KANA SUPPLEMENT のうち、U+1B001~U+1B0FF

・1115 KANA EXTENDED-A

※1 字形を含む。以下同じ。

※2 Amd.1:2019 及び Amd.2:2019 による追補後のもの。以下同じ。

※3 ISO/IEC 10646:2017 に準拠した JIS X 0221:2020 の発効後は、「ISO/IEC 10646:2017」を「JIS X 0221:2020」に置き換えるる。

※4 そのため、UTF-16 においてサロゲートペア(ISO/IEC 10646 の文字符号 化方式の UTF-16 で用いられる4バイトで1文字を表す符号化拡張方法) 又は IVS(字形選択子/漢字字形指示列)への対応が必要となる文字への 対応も必須とする。

EUC 等によるデータ出力(ディスプレイや紙等への出力及び XML 形式や CSV 形式、PDF 形式でのファイル出力等)の際は、「MJ 文字集合」と約1万文字の JIS X 0213(JIS 第1水準~第4水準)の文字(「JIS 文字集合」)との結びつ きを整理した「MJ 縮退マップ」を活用した縮退変換にも対応すること。この 場合、JIS X 0213 に準拠したフォントを用いた出力に対応できること。

文字情報基盤文字によるデータにおいて(なお書きによる経過措置におい ては、物理的又は仮想的な文字情報基盤文字によるデータ及び変換可能文字 によるデータにおいて)、ISO/IEC 10646 の私用領域に外字を定義でき、これ らの外字が住民記録システム上から利用できること。

[53] 1014_moji_guidebook.pdf, , https://cio.go.jp/sites/default/files/uploads/documents/1014_moji_guidebook.pdf

[72] IPAmj明朝WindowsAndroidApple に標準搭載させるだけであとは時間が解決してくれる問題領域はわりと広いような気がするんだが、、、

[416] ChromeOS、Android における日本語環境の改善 vol.2 | Google Cloud 公式ブログ, https://cloud.google.com/blog/ja/products/gcp/improvement-of-japanese-environment-on-chromeos-and-android/

このたび、ChromeOS 言語パック機能がリリースされたことにより、日本語を選択した環境ではこのフォントがインストールできるようになりました。

[417] これはいいニュース。 ChromeOS だけでなくAndroidも頼むよ...

[102] グループ-ノート:MJ文字情報 - GlyphWiki, https://glyphwiki.org/wiki/Group-talk:MJ%e6%96%87%e5%ad%97%e6%83%85%e5%a0%b1

[75] グループ:文字情報基盤について - GlyphWiki, https://glyphwiki.org/wiki/Group:%e6%96%87%e5%ad%97%e6%83%85%e5%a0%b1%e5%9f%ba%e7%9b%a4%e3%81%ab%e3%81%a4%e3%81%84%e3%81%a6

[76] グループ:文字情報基盤-検証 - GlyphWiki, https://glyphwiki.org/wiki/Group:%e6%96%87%e5%ad%97%e6%83%85%e5%a0%b1%e5%9f%ba%e7%9b%a4-%e6%a4%9c%e8%a8%bc

[96] Microsoft Word - 第1回会議次第.doc - 20100928_1P_a.pdf, https://warp.ndl.go.jp/info:ndljp/pid/8406166/mojikiban.ipa.go.jp/wp-content/uploads/pdf/2010/20100928_1P_a.pdf#page=12

行政機関のみならず企業や個人が、 本事業終了後も将来にわたり自由に利用できるオープンで無料の利用 権を包括的に提供すること。 また、 将来の文字等の改定に備え、 文字改変の権利を国に包括的に付与するこ と。

[97] >>96 平成明朝体の権利が複雑で使い物にならない反省を踏まえ、しかも事業終了後のことまで考えた立派な方針を開始当初は掲げていた。すばらしい。 なお現状

[366] MJ045853 MJ013575 は同じに見えるけど...?

JIS X 0213 は同じなのに UCS が違うという難儀なことになってる?

[393] MJ013840 MJ013841 どう見ても同じだけど情報は違う。同形異字らしい。 X0213 の値と対応するUCSの値は同じ、 X0212 の値があるのは MJ013840 だけ。

[403] 利用者:ziyang - GlyphWiki, https://glyphwiki.org/wiki/User:ziyang に挙げられている(ほぼ)同形字:

[410] JARIB 出典で Unicode に入ってるのに文字情報基盤にない文字あるのどういうことなの。 民間では使うけど行政では使わない、理屈の上ではあり得るのかもしれないけど。

[412] 一般社団法人文字情報技術促進協議会, https://moji.or.jp/

『MJ文字情報一覧表 Ver.006.02』をリリースしました。(2024/01/17)