[7] ここでいう合字は、文字列を全角1文字分のスペースに詰め込むという程度の意味です。
[8] かつての日本の文字コード規格や、 現在世界的に使われているUnicodeに、 近現代の日本の元号の元号合字が符号化されています。
U+337E
SQUARE ERA NAME MEIZI
ÈRE MEIJI DISPOSÉ EN CARRÉ
方形紀元名稱明治
(㍾
)SQUARE ERA NAME MEIZI
全角元号明治U+337D
SQUARE ERA NAME TAISYOU
ÈRE TAÏCHÔ DISPOSÉ EN CARRÉ
方形紀元名稱大正
(㍽
)SQUARE ERA NAME TAISYOU
全角元号大正U+337C
SQUARE ERA NAME SYOUWA
ÈRE CHÔWA DISPOSÉ EN CARRÉ
方形紀元名稱昭和
(㍼
)SQUARE ERA NAME SYOUWA
全角元号昭和U+337B
SQUARE ERA NAME HEISEI
ÈRE HEISEI DISPOSÉ EN CARRÉ
方形紀元名稱平󠄃成
(㍻
)SQUARE ERA NAME HEISEI
全角元号平成[186] 明治以後の3元号は、 昭和時代にワープロ等の便宜のため全角文字1つ分で表現するための専用の符号位置が与えられました。
[8013] [8022] シフトJISへの NEC の拡張 (NEC特殊文字) はマイクロソフト標準キャラクタセットに取り入れられ事実上の標準となりました (#13)。 JIS X 0213 もマイクロソフト標準キャラクタセットと同じ符号位置にこれらを割り当てました (#22)。 他に eucJP-open にも取り込まれました。
[87]
[8023]
EBCDIC
(IBM CCSID 1399 (#23)、KEIS)
にも明治から令和までがあります。
[88] [8021] MacJapanese にもありましたが、 NEC とは異なる符号位置でした (#21)。
[8003]
平成までは、
Unicode (Age
= 1.1
)
にも割り当てられました (#3)。
令和は改元が決まった時点で符号位置が予約され、
改元直後に
Unicode
が改訂されました。
[13] 明治から平成までは実は Unicode 1.0 にも既に含まれていました。 (文字の名前が違うなど、 Unicode 1.1 とそれ以降とは違いもあります。)
[12] TRONコードには Unicode と JIS X 0213 の2組ある?
[8011] [8012] Adobe 製品で使われる Adobe-Japan1 でも CID が割り振られています (#11: 横書き、#12: 縦書き)。 昭和までの横書きは Adobe-Japan1-0、 平成の横書きは Adobe-Japan1-1、 平成までの縦書きは Adobe-Japan1-4、 令和は Adobe-Japan1-7 で追加されました。
[328] これらは現在では需要もなくなり、ほとんど見かけなくなりました。 次に改元があっても、新たな文字が追加される可能性は低いとも思われていました。 しかし平成から令和への改元において、 依然として元号を符号位置1つで表現する古いシステムが残存していることから、 Unicode に新しい符号位置が割り当てられることとなりました。 とはいえ今後の新規元号への文字コードの割当がいつまで続くか不明であり、 新規システムでは採用するべきではありません。
[11] なお、文字コードとしてではなく、 元号名を (スペースの関係で) 全角1文字に収めて表示するという行為には、 技術的に避けるべき理由は特にありません。 ただ、そのような表現はあまり一般的ではなく、 見づらく美しくないという理由から避けるべきかもしれません。
[50] 元号は東アジアで長年使われ続けた日時システムで、ある種の文化遺産ともいわれます。 それが現行の紀年法として現在も運用され続けている事実は、日本という国の文化的財産であり、 人類史レベルの無形文化財でもあります。 それを昭和時代の最新技術である計算機システムに搭載するために作られた元号合字は、 たとえそれが現在の技術的視点から好ましからざるものとみなされるにせよ、 計算機における日本語処理、日本文化対応の技術史上の一つの遺産として、やはり貴重なものというべきでしょう。
[51] 今後使われることが減り改元で新規に追加されることがなくなる日が来るとしても、 既存の元号合字は日本語計算機の黎明期の様を伝える記念碑としての役目を担い続けることになるのでしょう。
[28] 文字数の節約のためなのか、 Twitter では元号合字を使っている人がたまにいます。
[156] 拾萬字鏡さんはTwitterを使っています 「私が知り得る限りの最初期の用例 「鴫」:正倉院文書『越前国司解』(763年) 「榊」:岩清水文書5『宮寺縁事抄宇佐部』(889年) 「畑」:『夫木和歌抄』(1310年頃) 「峠」:『大塔物語』(1466年写) 「枠」:『地方竹馬集』(1689年) 「俥」:㍾5年11月14日付「東京日日新聞」(1872年)」 / Twitter (午前10:00 · 2021年8月11日 , ) https://twitter.com/JUMANJIKYO/status/1425260838856712195
[24] 平成明朝体W3に「㍻」が収録されたのは、いつなのか | yasuokaの日記 | スラド, https://srad.jp/~yasuoka/journal/616965/
[19] U+337B「㍻」は、いつUnicodeに収録されたのか | yasuokaの日記 | スラド, https://srad.jp/~yasuoka/journal/616945
[136] 小熊善之さんはTwitterを使っています: 「昭和の時代のJIPSに「㍻」がないことを確認した土曜日だった。(当たり前だろ) https://t.co/PUszSEbyby」 / Twitter () https://twitter.com/0guma/status/1084041871666556928
[137] 小熊善之さんはTwitterを使っています: 「@tsaka1 それにしても、この時点のJIPSで㍾・㍽・㍼の次の区点番号が埋められていて、改元が全く意識されていなかったことがよく分かる。Unicodeに至る元号合字の諸問題の引き金を引いたという点で、NECには有罪判決を申し渡したい気分でいっぱいである。」 / Twitter () https://twitter.com/0guma/status/1084091907507011585
[33] Updates required for new Japanese era (imperial calendar) - plans for handling? () http://unicode.org/pipermail/cldr-users/2016-October/000525.html
We agree reserving a code point for the new era would be prudent.
Recommendation: We recommend the UTC reserve U+32FF in the Enclosed CJK Letters and Months
block for the new era name. When the official decision from Japan is made, the slot will be available for
encoding the new character, in time for Unicode 12.0.
[154-A15] Action Item for Ken Whistler: Add U+32FF to the pipeline with the required status.
[154-A16] Action Item for Ken Lunde: Reply to Tet Orita on the new Japanese era name.
B.4.1 New Japanese Era
Discussion. UTC took no action at this time.
[21] 新たな元号はJIS X 0213に入るのか | yasuokaの日記 | スラド, https://srad.jp/~yasuoka/journal/605052/
[17] JIS X 0221:2020 は附属書JB(参考)で、国際規格で作業中と断りつつ令和合字を紹介しています。 タイムリーに改定された The Unicode Standard に対して、 機動力に欠ける ISO/IEC 10646 とそれに束縛される JIS X 0221 が実効性を喪失していることが窺い知れます。
[26] 17429-sc2-n4577-japan-new-era.pdf, , https://www.unicode.org/L2/L2017/17429-sc2-n4577-japan-new-era.pdf
[27] null, , https://www.unicode.org/L2/L2018/18220-u121planning.txt
[25] Microsoft Word - Annoucement_Japanese_new_era_name.docx - 19094-japan-era-name.pdf, , https://www.unicode.org/L2/L2019/19094-japan-era-name.pdf
[41] Microsoft Word - IRGN2367Japan_AR_IRG52.docx - n2367-JapanActivityReport.pdf, , https://www.unicode.org/irg/docs/n2367-JapanActivityReport.pdf#page=2
最近では、2019 年 5 月より施行された新元号の合字「㋿」(U+32FF) が新しい Unicode 文字として追加されており、旧来より運用されている、例えば Visual Basic 6.0 で開発されたアプリケーションのように Unicode 非対応のアプリケーションで、この合字を使用できないというお問い合わせを非常に多数いただいております。
[16] だんぼーだよ📦さんはTwitterを使っています: 「@BrainOfKeios 「令和だけ合字が化ける原因を教えてほしい」という問い合わせなので、お客様そこは既に認識された上での話です。」 / Twitter, , https://twitter.com/Liliaceae/status/1143840040499306497
[139] やっぱりシフトJISで必要とするアプリケーションはあったんだな。 (MS は知ってて敢えて無視したのではないか。)
[42] >>138 改元後に急に問い合わせが増えてびっくりみたいな聞こえ方がするけど絶対そんなはずないよな
[52] VB6 は開発環境がサポート終了になって十数年経つものの、実行環境は Windows 11 にも同梱され続けているらしい。そして業界ではもうやめろと言われながらも実際には VB6 製アプリケーションが多数稼働を続けているらしい。 MS は当然その実態を把握しているはずだし、 >>138 のように問い合わせに反応して情報を公開したりもしている。
[53]
実行環境を提供し続けるなら CP932 にも㋿
を追加してあげてもよかったのでは。
VB6 以外にも同様の事情の古いプログラムはまだあちこちで動いているのかもしれないし。
[54] こういうのこそ所管の経済産業省が音頭取って JIS X 0213 のどっかの空きに割り当てます、 って仕切らないとだめだったんだよなあ。
[30] >>29 「日本」が日本の誰を指しているのか不明。 >>31 の文脈からすると日本の誰でも良さそうだが、 >>29 のMSだかIBMだかの顧客は普通に考えれば日本国内の日本人だから、 >>29 の日本は日本の政府サイドを指すのか? しかし >>26 の通り JSC2 は改元日時決定の1週間後には SC2 に要望を送付しているので、 日本が要望していないというのは難しい。
[38] MS や IBM は顧客の要望を当然聞くだろう。顧客なんだから。 それを集約したのが「日本の要望」になったのではないのか。 それとも MS や IBM が JSC2 を無視して Unicode Consortium に追加させたといいたいのか。でも議事録によると追加が決まったのは JSC2 の要望があってから >>34 >>36。改元日取りの正式決定以前から UTC は把握しているが静観している >>37。
[39] JSC2 の中の人も㋿
が追加されたのは自分達の手柄だと主張しているけど?
>>1162
[1162] CA1965 - 新元号と文字コードの国際標準を巡って / 小林龍生 | カレントアウェアネス・ポータル () https://current.ndl.go.jp/ca1965
[40]
ところで >>1162 は㋿
が追加されたのは自分達の手柄、
令
に関する通知の発出は経済産業省偉い、
っていってるけど JIS X 0221 も JSC2 と経済産業省の管轄だよね?
なんでそれに一言も触れてないの?
Unicode がタイムリーに更新されたのに JIS X 0221 が全然放置プレイなの、
>>1162 の記事の趣旨と真逆じゃん???
いいこと書いたなら悪いところも正直に書いておこうよ?
[49] 実効性があるのは Unicode だけで JIS X 0221 は国内の政治的事情のための形式的なものだから間に合わなくても別に構わない、 ってことがバレちゃうから書かなかったのかな、って変に勘ぐっちゃうよね。 でもよく考えると政治的な道具として使われるものこそ、改元日にちゃんと間に合わせた方が良かったんじゃないのかな。 政治的にすら存在価値が実は無いってこと露呈しちゃってない??
[43] 一般的なフォントは、そのフォントの標準の字形をそのまま半角サイズにした字形の組み合わせとしています。