漢数字

漢数字

[8] 漢数字は、漢字数字です。

仕様書

記数法

[62] 93651301_01.pdf, , https://www.bunka.go.jp/seisaku/bunkashingikai/kokugo/hokoku/pdf/93651301_01.pdf#page=28

位取り記数法

漢数字の位取り記数法

[38] , 廿


[48] 50

[49] zihai-001820 (册) - GlyphWiki, https://glyphwiki.org/wiki/zihai-001820

and

[44] 「十又二」 「十有三」

[80] までに成立したとされる 宮寺縁事抄 に収録された 住吉縁起 (明朝体翻刻) は、 古い時代に , 弍󠄂, 弎󠄂, 亖弋, 二三弋 が使われたようなことが書かれています。 >>74, >>83

[81] >>74が出てくるのが不審ですが、誤植か誤翻刻でしょうか。

[84] >>83 だとなので、誤植のようです。

[82] 住吉大社に関係する縁起の1本にあるものだといい、 言うまでもなく怪しげな説ですが、鎌倉時代初期、もしかすると平安時代末期頃 ( 宮寺縁事抄 ) にはそのような説が唱えられていたということなのでしょう。 二中歴の古代年号の項

[87] 宗像大菩薩御縁起にも同じ一節があります。 >>86 こちらは鎌倉時代末期から南北朝時代の写本とされます。

[50] 拾萬字鏡🐦さんはTwitterを使っています: 「弌、弍、弎、…?? https://t.co/v5yGDNmH28」 / X, , https://twitter.com/JUMANJIKYO/status/842894496232747008

, , 弎, 亖弋 (楷書)

処理

[11] 漢数字の構文解析 (parse a CJK number) アルゴリズム >>10 により、漢数字文字列数値に変換できます。

文字コード

[40] ほとんどの文字コード体系では漢数字漢字一般と区別していません。

[41] 珍しい例として CCCII には漢字と別に漢数字があります。

[42] は例外で、日本語系の文字コードでは非漢字扱いになっています。 中文系の文字コードでは漢数字を使わずに全角欧州数字0 を使います。

[43] 中文系の文字コードでは 10, 20, 30 が蘇州号碼として用意されています。 横線型の 1, 2, 3 はなく漢数字と (= 一般の漢字と) 共用とされています。 蘇州号碼

実装

[45] wakaba/perl-number-cjk, https://github.com/wakaba/perl-number-cjk

テストデータ

[33] data-chars/cjk-numbers.json at master · manakai/data-chars, https://github.com/manakai/data-chars/blob/master/data/tests/cjk-numbers.json

関連

蘇州号碼

メモ

[1] 漢数字 - Wikipedia ( 版) https://ja.wikipedia.org/wiki/%E6%BC%A2%E6%95%B0%E5%AD%97

[2] 大字 (数字) - Wikipedia ( 版) https://ja.wikipedia.org/wiki/%E5%A4%A7%E5%AD%97_(%E6%95%B0%E5%AD%97)

[3] 命数法 - Wikipedia ( 版) https://ja.wikipedia.org/wiki/%E5%91%BD%E6%95%B0%E6%B3%95

[5] Character set "漢数字" ( 版) https://chars.suikawiki.org/set/%24numbers%3ACJK-number-char

[6] 法令番号 - Wikipedia ( 版) https://ja.wikipedia.org/wiki/%E6%B3%95%E4%BB%A4%E7%95%AA%E5%8F%B7

縦書き環境では漢数字であるが、行政での方式(例:百七十五)と異なり、簡素な方式(例:一七五)が用いられる

[7] 1.無電台(新設増設報告)関係 真茹無電台ハ別項(10.)ニアリ/分割1 (28ページ アジア歴史資料センター | Japan Center for Asian Historical Records著, ) https://www.jacar.archives.go.jp/aj/meta/image_B10074937500

[9] Support for Japanese numbers · Issue #639 · MenoData/Time4J () https://github.com/MenoData/Time4J/issues/639

[12] 千円単位の書き方!1000千円や3000千円は? [一般事務で働く・転職する] All About () https://allabout.co.jp/gm/gc/295828/

[13] 大至急教えて下さい!!10百万円と資本金に記入されているんで... - Yahoo!知恵袋 () https://detail.chiebukuro.yahoo.co.jp/qa/question_detail/q1020597170

[14] () http://www.heiwado.jp/ir/img_61pdf_all/year_05.pdf

40億37百万円減少

[15] () http://nakashima-s.co.jp/wp-content/uploads/2016/08/b53398e7a45e7195d6b6874ac937d947.pdf

【資本金】 1,000万円

【売上高】 1,324百万円(2015年決算)

[16] 会社概要 | SCSK株式会社 () https://www.scsk.jp/corp/outline.html

資本金

21,152百万円

売上高

336,654百万円(2018年3月期 連結)

営業利益

34,602百万円(2018年3月期 連結)

[17] () http://www.moe.gov.cn/ewebeditor/uploadfile/2015/01/13/20150113091154536.pdf

[18] CLDR: #4473 (Add Suzhou and counting rod numbering systems) – CLDR () https://unicode.org/cldr/trac/ticket/4473

[19] 大字 (数字) - Wikipedia () https://ja.wikipedia.org/wiki/%E5%A4%A7%E5%AD%97_(%E6%95%B0%E5%AD%97)

[20] 「⿰氵𣎽」、 「氵https://glyphwiki.org/wiki/zihai-000617」 (「柒」の伝統的楷書体 解説字体辞典 普及版 pp.14-15)

[21] GB/T 15835

[22] 『吸血鬼すぐ死ぬ』人気投票の投票数が「20潤2溝400億3187万2259無量大数1158不可思議9994那由他7923阿僧祇5925恒河沙3394極17載227正5013澗7636溝3129穣701杼8436垓3237京5482兆1365億2080万2682票」も集まって笑う人達。全ての原因は悪ふざけ投票システム - Togetter () https://togetter.com/li/1552370

[23] 使わぬ外字に歴史あり - ことばマガジン:朝日新聞デジタル (The Asahi Shimbun Company著, ) http://www.asahi.com/special/kotoba/archive2015/moji/2012061700005.html

[24] 続・使わぬ外字に歴史あり - ことばマガジン:朝日新聞デジタル (The Asahi Shimbun Company著, ) http://www.asahi.com/special/kotoba/archive2015/moji/2012070200007.html

[25] 和歌山県条例の形式を左横書きに改正する条例 (, ) https://www.pref.wakayama.lg.jp/prefg/010100/reiki/reiki_honbun/k501RG00001382.html

[26] (, ) https://www.bunka.go.jp/kokugo_nihongo/sisaku/joho/joho/kijun/sanko/koyobun/pdf/yoryo_ver02.pdf

[27] 朝日字体の時代 20 - ことばマガジン:朝日新聞デジタル (The Asahi Shimbun Company, ) http://www.asahi.com/special/kotoba/archive2015/moji/2014122500001.html

[28] 090905.pdf, , https://www.nhk.or.jp/bunken/summary/research/report/2009_09/090905.pdf

[29] 興味深い調査だけど分析に日本の伝統が云々と入ってくるあたりはちょっと怪しい。 「平成20年」だけでなく「平成21年」も調査するべきだったろう (「二十」と「二〇」の違いと「二十」と「二一」の違いは若干性質が異なる)。

[30] 姿形書換字(1) (, ) http://gattin.world.coocan.jp/kanji/sikeika.htm

[31] 第136回 幼稚園と文字 | 漢字の現在(笹原 宏之) | 三省堂 ことばのコラム () https://dictionary.sanseido-publ.co.jp/column/kanji_genzai136

金文には、「五」までその方式があったと解読する人もいた。琉球では、独特な数字が編み出され、使用されていた時期があったが、もっと横線をたくさん書き、一目では何本あるのか分からないものもあった。さらに中国では、「万(萬)」という姓を書くように頼まれた者が、「一」を下へ下へと500本くらいまで重ねて書いたところで時間切れになって音を上げたという笑い話もあることを知った。

[32] 拾萬字鏡さんはTwitterを使っています 「「五十」の用例見つけた https://t.co/zxIDGsuKMa」 / Twitter, 午後3:30 · 2020年6月9日 , https://twitter.com/JUMANJIKYO/status/1270241898205073409

[34] 数字の表記を考える, , http://www5d.biglobe.ne.jp/Jusl/Bunsyo/Suujihyouki.html

[35] >>34

このパソコンで金額表記をしようとする場合,「23456」と入力すると,辞書機能で「23,456」と位取りをして自動変換されるが,まず「2万3456円」とは変換されない。表計算ソフトで金額を入力しても,自動的に万進法で表示されることはない。パソコンは,基本的に千進法を数字の呼称単位とする欧米式思考の産物だからである。

これは現状認識としては正しいと思いますが、悲しいことですよね。 昔は日本語入力システムを作っていたのは全員日本人だったから、 (それが米国の技術に憧れた技術者だったとしてもみんながみんな) 「欧米式思考」に侵されていたとは思いたくない。 実際のところ平成初期くらいは日本語入力システムもその周辺環境も、 今よりもっと多様性があったような。 表計算は「欧米式思考」かもしれないけれども、 昔は4桁区切りに設定できる製品もあった気がするし、 今の製品がどうなのかはしらんけど、それができてこそのロケール。 できないのは技術者の怠慢でしかない。

ここに挙げられた問題も、他のいろいろな問題も、結局は日本の技術者が日本の文化にちゃんと向き合ってこなかったり、 日本人が製品選択時にそこを検討基準に入れてこなかったり、 という小さな怠慢の積み重ねで、未だに未解決のままに残されていたり、 「欧米式思考」に押しつぶされたりしちゃったのですよね、、、

[36] 拼音正词法基本规则, Mark Swofford, , http://www.pinyin.info/rules/pinyinrules_simp.html#x4.6

[37] 22111-unihan-numeric-updates.pdf, , https://www.unicode.org/L2/L2022/22111-unihan-numeric-updates.pdf

[47] 田中けい🇺🇦🇯🇵さんはTwitterを使っています: 「ATMで45千円おろしたら全部千円札で出てきた。。。45千という入力のせいですかね?」 / Twitter, , https://twitter.com/TANAKA_Kei/status/1670243060188590081

[51] 数字表記で4苦8苦|コトバのゲンバ(中日新聞校閲部), https://note.com/kotoba_no_genba/n/n5a53ab17d335?sub_rt=share_pw

2023年9月に、中日新聞は数字の基礎表記を漢数字から洋数字に改めました。

最近では福島民報が2022年9月に「新聞制作システムの更新に伴い」洋数字に変更。中部圏では伊勢新聞が、自社記事は漢数字、通信社の配信記事は洋数字で併存させるという形式を採っています。

[55] 最近の新聞社は右に倣えで大新聞や通信社が変えたらすぐ真似するというイメージ(偏見)があったけど、 意外とそうでないところもあったのね。

[56] でも縦書きと相性が悪い欧州数字に切り替えるところが多くて、漢数字に戻すところがないってのがなんともまあ。 自分で考えることをしないで猿真似ばかり。

[52] >>51

毎日新聞社校閲グループの平山泉さんは、雑誌のインタビューにこう答えています。

「(注・1996年の洋数字化の)当初は洋数字と決めていました。けれど、第一次、第二次世界大戦は戦争のレベルとして別格で、3次、4次と繰り返されることは決してあってはならない、という強い意見が社内から出て、漢数字に変更したんです。言葉にはそうした思い入れも反映されるんだ、と実感しました。ちなみに、第1次中東戦争などは洋数字で書きます」

雑誌「クロワッサン」(2018年6月25日号)

[53] また毎日新聞か。毎日新聞は言葉遣いのイデオロギー汚染がひどすぎる。 毎日新聞

[54] こんな言い方すると中東戦争は繰り返してもいいのかってクソリプしてくるやつ絶対いるはずだけど何て返してるんだろうね?

[57] RosettaDoc300_Sinosphere.pdf, , https://occhann.jp/Documents/RosettaDoc300_Sinosphere.pdf

[58] Xユーザーの治田 洗礫さん: 「昭和28(1953)年の社会科地図帳(帝国書院)に載っていた「#警察」の地図。警察・防衛の組織が過渡期だった時期にて、現在からは想像が及びにくいが、警察組織に #自治体警察署 と #国家地方警察署 があって混在していたり、実質的には準軍事組織である #警察予備隊 についても描かれている。 https://t.co/eA2k2Af6Ss」 / X, , https://twitter.com/Harita_arayshi/status/1778417607319896276/photo/1

[59] >>58 漢数字のことを「日本数字」といっている。

「アラビア数字」の記述や地名は左横書きなのに「日本数字」の記述は縦書きなのもおもしろい点。

[60] 令和6年の東京都知事選挙では漢数字改良公約の1つに掲げる候補が出現しました。 当選の可能性や公約への賛否はともかくとして、 今この時代に文字改良が政治的課題に挙げられるというのは大変興味深い現象です。

[61] 平成16年度e-Bookに関する標準化調査研究成果報告書 - h16_hyoujunka_nihonkikakukyoukai-11.pdf, , https://hojo.keirin-autorace.or.jp/seikabutu/seika/16nx_/bhu_/w_/h16_hyoujunka_nihonkikakukyoukai-11.pdf#page=135

[65] >>63 明確な処理モデルの規定もないのに「桁溢れするかも」という謎の基準で勝手に取捨選択する情報ファイル、使い道あると思う?

[66] この特性値は恒久的にこの値以下であることが保証されます、みたいな規定がないのに気分次第で いつ勝手に増やされるか減らされるかわからない、って怖くて使えないじゃん。

[67] そもそも数字って文脈がない数値価だけあっても使えないんだよな。。。 この文字特性の使い道は謎すぎるよな。

[68] Python"一億万".isnumeric() 実行したらになるけど誰がどう嬉しいんだろうねこれ。

[69] Python 3.13 から「兆」が 10 の 6 乗になっている - マグマグ (起動音), https://shmug.hatenablog.com/entry/2024/12/03/000000

Python 3.13 から unicodedata.numeric("兆") の結果が変わったのは、Unicode 15.1 で「兆」(U+5146) の kPrimaryNumeric が変更されたためです。参考までに、Unicode 15.05 と Unicode 15.16 での Unihan データベースで「兆」の扱いを掲載しておきます。

バージョンkPrimaryNumericNumeric_Value
15.010000000000001000000000000
15.11000000 10000000000001000000

[70] この kPrimaryNumeric は何か使い道あるのかな。せめてどの系列におけるはこの数値価、みたいな区別の情報がないと、ただ並べただけだと役に立たないゴミデータじゃない?

[71] ウェブ検索でいっぱい引っかかる Unihan の文字特性を並べただけのゴミサイトの情報が充実してうわーすごーい!っていうくらいしかメリットなくない?