nta:JIS縮退マップ:コード変換

登記統一文字

登記統一文字

[12] 登記統一文字 - Wikipedia, , https://ja.wikipedia.org/wiki/%E7%99%BB%E8%A8%98%E7%B5%B1%E4%B8%80%E6%96%87%E5%AD%97

[13] LEGALブログ(リーガル社員のここだけの話): 「登記統一文字」とはなにか, http://legal.blogat.jp/legal_blog/2015/07/post-7a32.html

[14] グループ:登記統一文字の一覧 - GlyphWiki, https://glyphwiki.org/wiki/Group:%E7%99%BB%E8%A8%98%E7%B5%B1%E4%B8%80%E6%96%87%E5%AD%97%E3%81%AE%E4%B8%80%E8%A6%A7

汎用電子情報交換環境整備プログラム成果報告書別冊 のindex.csvから輸出したものです。上記ページから字形の確認もできます。(要Internet Explorer&Djvu Plug-in)。Djvuファイルは、0001.djvu〜5563.djvu に格納されています。

[31] グループ:CodeChart-登記統一文字01 - GlyphWiki, https://glyphwiki.org/wiki/Group:CodeChart-%e7%99%bb%e8%a8%98%e7%b5%b1%e4%b8%80%e6%96%87%e5%ad%9701

戸籍統一文字との関係

[62] 戸籍統一文字も参照。

[37] グループ:文字情報基盤について - GlyphWiki, https://glyphwiki.org/wiki/Group:%e6%96%87%e5%ad%97%e6%83%85%e5%a0%b1%e5%9f%ba%e7%9b%a4%e3%81%ab%e3%81%a4%e3%81%84%e3%81%a6

登記統一文字は戸籍統一文字をすべて含み,00の後に6桁(10進法)の戸籍統一文字番号をつけて,8桁(10進法)の登記統一文字番号とします。戸籍統一文字にない登記統一文字(登記固有文字,と呼ばれる)の番号は上2桁が01となり,戸籍統一文字とは区別されます。 登記固有文字が新しく戸籍統一文字となった場合には,新しい戸籍統一番号がつけられ,それを下6桁にもつ登記統一文字番号は以前のものとは違います。

文字情報基盤との関係

[53] 文字情報基盤には「登記統一文字番号(参考)」として文字情報基盤文字登記統一文字との関係が示されています。

[54] 登記固有文字文字情報基盤に含まれるものと、含まれないものがあります。

[55] >>38

[63] >>68 >>69

非漢字

[66] 戸籍統一文字登記統一文字には非漢字も含まれています。

[67] 法務省戸籍統一文字情報ウェブサイトでは戸籍統一文字の情報を表示でき、 シフトJISUnicode との関係も閲覧できます。

[68] 文字情報基盤登記統一文字縮退マップには戸籍統一文字を含む登記統一文字UnicodeJIS X 0213 の関係が含まれています。 (>>57)

[69] IPAmj明朝の非漢字データファイルには IPAmj明朝グリフ名 (Adobe-Japan1 CID) と戸籍統一文字登記統一文字の関係があります。 ただしIPAmj明朝収録文字に限られます。

[70] おおむね JIS X 0208 相当が戸籍統一文字にあり、 JIS X 0213 相当が登記固有文字のようですが、例外も多い >>71 ようです。 他に変体仮名が多数あります。

[71] 20131211_5k_a.pdf, https://warp.ndl.go.jp/info:ndljp/pid/11177851/mojikiban.ipa.go.jp/contents/pdf/2013/20131211_5k_a.pdf#page=10

登記ねっと外字

縮退

縮退

[5] 基本3情報ダウンロード|国税庁法人番号公表サイト () http://www.houjin-bangou.nta.go.jp/download/index.html#delivery

登記統一文字集合からJIS第一~第四水準への縮退は、IPA(独立行政法人情報処理推進機構)で公開している「MJ縮退マップ(一意な変換表)」及び「登記統一文字縮退マップ」を活用している。この「MJ縮退マップ」は、「文字情報の標準化と活用」の一環として文字情報基盤で整備された約6万の文字を、日本工業規格(JIS)で規定された約1万の文字へ対応付ける(代替させる)ための「縮退対応」を整理したものです。

[8] Microsoft PowerPoint - 【資料3】縮退マップについて-20150925.pptx - 20150925_5.pdf, , https://moji.or.jp/wp-content/mojikiban/2015/09/20150925_5.pdf#page=7

登記統一文字から文字情報基盤への縮退

[38] 登記統一文字縮退マップは、 文字情報基盤本体に含まれない登記統一文字から JIS X 0213文字への縮退マップです。 >>44

[46] 「2015-09-30」 () 付の「Ver.1.0.0」が公開された後、 更新されていないようです。その時点での登記統一文字との対応関係のみで、 それ以後は放置されています。

[56] それ以前でもすべてに対応関係があるわけではなさそうです。

[47] 文字情報基盤本体とは違って非漢字JIS X 0213 との対応関係が示されています。

[57] JIS X 0208 相当と思われる非漢字には戸籍統一文字相当の番号が付いています。 戸籍統一文字非漢字との対応関係を示す表としても使えるものと思われます。

[48] 縮退マップJSON データの形式はMJ本体の縮退マップとほぼ同じです。

[51] クリエイティブ・コモンズ 表示 - 継承 2.1 日本 ライセンスで提供されています。 >>44

[45] >>7

  • 登記統一文字縮退マップVer.1.0.0ファイル一式 [zip形式, 43kByte]
  • 登記統一文字縮退マップVer.1.0.0 [json形式, 0.5MByte]
  • 登記統一文字縮退マップスキーマVer.1.0.0 [json形式, 6kByte]

[9] >>44

MJ文字情報一覧表で整備されている文字情報基盤の文字(MJ文字集合)には包含されない登記統一文字に固有な文字約1万文字について,約1万文字のJIS X 0213(JIS第1水準~第4水準)の文字との対応関係を見出す際の参考として使われることを目的としたものです。活用にあたっては,MJ縮退マップ並びに縮退マップ利用ガイドをご覧ください。

[52] 文字関係
key
mj:非漢字
desc
登記統一文字縮退マップ非漢字 へ。 戸籍統一文字共通部分を含む。

[58] 登記統一文字縮退マップから一意な選択と称して、 MJ縮退マップから一意な選択と同様に縮退先を1つに絞った表も提供されています。 なぜかMJ縮退マップから一意な選択と違って 「モジラボ」 という格下の扱いになっています。

[61] ファイル中には

		"cc:license":"http://creativecommons.org/licenses/by-sa/2.1/jp/",

とあって >>60CC で利用可能とされています。

登記統一文字から JIS への縮退

MJ縮退マップ

JIS X 0213 から JIS X 0208 への縮退

[11] 基本3情報ダウンロード|国税庁法人番号公表サイト () http://www.houjin-bangou.nta.go.jp/download/index.html#delivery

このサイトで法人の商号又は名称、所在地の情報にJIS第三・第四水準の文字が含まれている場合、利用者が使用するパソコン・タブレット・スマートフォンの環境により、入力や表示ができないといった問題が生じることがあるため、約1万文字のJIS X 0213(JIS第一~第四水準)とJIS X 0208(JIS第一・第二水準)の文字との対応関係を整理したものです。

なお、縮退先がない文字は、「_」に変換(置換)しています。

[6] 基本3情報ダウンロード|国税庁法人番号公表サイト, , https://www.houjin-bangou.nta.go.jp/download/

法人の商号及び所在地には、JIS第一・第二水準以外の文字が使用されている場合があります。 このサイトでは、利用者のシステムで二次活用が容易にできるよう、該当する文字をJIS第一~第四水準の文字及びJIS第一・第二水準の文字に縮退し、データを提供しています。

なお、該当文字の登記記録等における表記を確認したい場合、該当する法人を検索し、検索結果に表示される「外字」ボタンをクリックすることにより、該当文字の登記記録等における表記が画面に表示されます。

また、ダウンロードファイルで提供するイメージIDを利用し、該当文字の登記記録等の表記を確認することもできます。ダウンロードファイルから取得したイメージIDを次のURLの後に続けて入力し、アクセスしてください。

外字確認用URLhttps://www.houjin-bangou.nta.go.jp/image?imageid=

国税庁はJIS縮退マップ(JIS第一~第四水準からJIS第一・第二水準への変換表)を公開しています。利用に際しては国税庁の著作物であることを明記してください。

JIS縮退マップとは

このサイトで法人の商号又は名称、所在地の情報にJIS第三・第四水準の文字が含まれている場合、利用者が使用するパソコン・タブレット・スマートフォンの環境により、入力や表示ができないといった問題が生じることがあるため、約1万文字のJIS X 0213(JIS第一~第四水準)とJIS X 0208(JIS第一・第二水準)の文字との対応関係を整理したものです。

なお、縮退先がない文字は、「_(アンダーバー)」に置き換えしています。

<参考>

登記統一文字集合からJIS第一~第四水準への縮退は、一般社団法人文字情報技術促進協議会で公開している「MJ縮退マップ(一意な変換表)」及び「登記統一文字縮退マップ」を活用しています。この「MJ縮退マップ」は、「文字情報の標準化と活用」の一環として文字情報基盤で整備された約6万の文字を、日本産業規格(JIS)で規定された約1万の文字へ対応付ける(代替させる)ための「縮退対応」を整理したものです。

[40] 文字関係
key
nta:JIS縮退マップ:コード変換
desc
国税庁JIS縮退マップの 「変換元の文字」から「コード変換」欄への変換。 「面区点コード」から「面区点コード」へ、および 「Unicode」から「Unicode」へ。
[10] 文字関係
key
nta:JIS縮退マップ:文字列変換
desc
国税庁JIS縮退マップの 「変換元の文字」から「文字列変換」欄への変換。 「面区点コード」から「面区点コード」の連結へ、および 「Unicode」から「Unicode」の連結へ。
[39] 文字関係
key
nta:JIS縮退マップ:類似字形
desc
国税庁JIS縮退マップの「備考」欄に「類似字形」と記述された符号位置から 「変換元の文字」の「Unicode」への関係。

[41] JIS縮退マップは、 日本政府国税庁が運営するウェブサイト 国税庁法人番号公表サイト において

このサイトでは、JIS縮退マップを公開しています。利用に際しては国税庁の著作物であることを明記してください。

との説明付きで公開されています >>6

[43] また、当該ページ >>6 下部には 「サイト利用規約」 と表記されたリンクがあり、そのリンク先ページ >>42 によれば、 サイト上の情報は原則として政府標準利用規約が適用されます。 JIS縮退マップがここから除外される旨の記述は見当たりませんから、 JIS縮退マップは同規約に従って利用できるものと解釈できます。

関連

[4] 戸籍統一文字, 汎用電子情報交換環境整備プログラム, 文字情報基盤, MJ縮退マップ

メモ

[1] 土地家屋調査士支援システム 表+ 登記・供託オンライン申請システム切替(H28.3.22)対応 改訂内容説明書 - 20160318_shirusu_autoupdate.pdf, , https://www.nikon-trimble.co.jp/pdf/news/20160318_shirusu_autoupdate.pdf

[22] 「登記ねっと供託ねっと申請用総合ソフト」の外字コード | yasuokaの日記 | スラド, https://srad.jp/~yasuoka/journal/620814/

[23] Tsukasa #01 (5x vaccinated)さんはTwitterを使っています: 「法人番号公表サイトの全件データより抽出した外字のうち、JIS第1~第4水準に縮退されなかった漢字類の切り出し画像。一応明らかな非漢字は排除したが変体仮名の類や屋号は残っていそう。全 490 画像。(cc:@sarasvati635) https://t.co/36KNngGFmy」 / Twitter, , https://twitter.com/a4lg/status/925240743479844865

[25] 不明瞭な登記統一文字 : ~今日はこんなことがありました~(livedoor本店), http://masablog.livedoor.biz/archives/52190021.html

[28] spinda-kkmrさんはTwitterを使っています: 「登記統一文字のうち、上2桁が00のものは戸籍統一文字と重なるので、とりあえずは上2桁が01のものを優先して作成するほうがよいと思います。 #glyphwiki」 / Twitter, , https://twitter.com/spinda_kkmr/status/126433389602537472

[29] 登記ねっと外字コードと呼ばれているものと >>2 の符号は同じものらしい?

[30] 登記統一文字コードと呼ばれているものは (01 から始まるものは) 16進数になおすといかにも PUP のような符号位置が得られるものの、 >>29 とは一致しない。

[32] グループ:prefix-tokinet - GlyphWiki, , https://glyphwiki.org/wiki/Group:prefix-tokinet

[33] https://web.archive.org/web/20230702053357/https://doc-08-cc-docs.googleusercontent.com/docs/securesc/ha0ro937gcuc7l7deffksulhg5h7mbp1/ct4st73e2b5n1scek8er7e1erb033tk0/1688276025000/01423394582229128357/*/1mKXvUF1tjM15awRU_NWHPHrpkV-oLBQJ?e=download&uuid=17fab14f-46b7-45e3-870c-86c6d244acbd

[35] ひめ@女体化したい人生だった🌟C102日曜東ピ41aさんはTwitterを使っています: 「@界隈各位 登記ねっとで得られた登記固有文字のうち、「住所外字」と推定される登記ねっと外字コードE3xx~E4xxの291字について、これまでの調査で得た地名用例をまとめてみました(稀少地名漢字リスト未掲載の地名含む)。 空欄部分の地名用例ください!!!!! https://t.co/uwb4OieZMp」 / Twitter, , https://twitter.com/sarasvati635/status/1314150723500732418

[36] 本店の表示の中のハイフンと全角マイナス記号 -, https://www.rabbit-office.jp/2019/05/28/%E6%9C%AC%E5%BA%97%E3%81%AE%E8%A1%A8%E7%A4%BA%E3%81%AE%E4%B8%AD%E3%81%AE%E3%83%8F%E3%82%A4%E3%83%95%E3%83%B3%E3%81%A8%E5%85%A8%E8%A7%92%E3%83%9E%E3%82%A4%E3%83%8A%E3%82%B9%E8%A8%98%E5%8F%B7/

[64] 橡Taro9-030819・公表用/★⑤刷新 - 000010742.pdf, , https://www.moj.go.jp/content/000010742.pdf

[65] ひめ@女体化したい人生だった🌟C102日曜東ピ41aさんはTwitterを使っています: 「@界隈各位 登記ねっとで得られた登記固有文字のうち、「住所外字」と推定される登記ねっと外字コードE3xx~E4xxの291字について、これまでの調査で得た地名用例をまとめてみました(稀少地名漢字リスト未掲載の地名含む)。 空欄部分の地名用例ください!!!!! https://t.co/uwb4OieZMp」 / X, , https://twitter.com/sarasvati635/status/1314150723500732418