[1] [DFN[LetterDigits]] は、“[[普通]]”の[[文字]]や[[数字]]を表します。

* 仕様書

[REFS[
- [2] [CITE@en[[[RFC 5892]] - The Unicode Code Points and Internationalized Domain Names for Applications (IDNA)]] ([TIME[2011-02-05 04:10:56 +09:00]] 版) <https://tools.ietf.org/html/rfc5892#section-2.1>
- [12] 
[CITE@en[[[RFC 7564]] - PRECIS Framework: Preparation, Enforcement, and Comparison of Internationalized Strings in Application Protocols]], [TIME[2024-07-07T03:00:43.000Z]] <https://datatracker.ietf.org/doc/html/rfc7564#section-9.1>
- [14] 
[CITE@en[[[RFC 7564]] - PRECIS Framework: Preparation, Enforcement, and Comparison of Internationalized Strings in Application Protocols]], [TIME[2024-07-07T04:09:13.000Z]] <https://datatracker.ietf.org/doc/html/rfc7564#section-9.18>


]REFS]


* 定義

[3] [[General_Category]] が次のいずれかである[[文字]]は [[LetterDigits]] です [SRC[>>2]]。

[FIG(middle list)[ [11] [[LetterDigits]]
- [4] [[Ll]] ([[Lowercase_Letter]])
- [5] [[Lu]] ([[Uppercase_Letter]])
- [6] [[Lo]] ([[Other_Letter]])
- [7] [[Nd]] ([[Decimal_Number]])
- [8] [[Lm]] ([[Modifier_Letter]])
- [9] [[Mn]] ([[Nonspacing_Mark]])
- [10] [[Mc]] ([[Spacing_Mark]])
]FIG]

[13] [[PRECIS]] でもこのまま使われています。 [SRC[>>12]]

-*-*-

[15] 
[[PRECIS]] の[[文字カテゴリー]]
[DFN[[CODE[OtherLetterDigits]]]]
は、
「伝統的」な[[[RUBYB[文字][letter]]][letter]]と[[[RUBYB[数字][digit]]][digit]]とは異なる[[文字]]と[[数字]]を表します。
[SRC[>>14]]

[16] 
[[OtherLetterDigits]]
は、
[CODE[General_Category]]
が
[CODE[Lt]],
[CODE[Nl]],
[CODE[No]],
[CODE[Me]]
の[[文字]]の[[集合]]です。
[SRC[>>14]]

[REFS[

- [17] [CITE@en[Character set "[[OtherLetterDigits]]"]], [TIME[2024-07-07T04:12:20.000Z]] <https://chars.suikawiki.org/set/%24rfc7564%3AOtherLetterDigits>
-- 最新
- [18] [CITE@en[Character set "[[OtherLetterDigits]]"]], [TIME[2024-07-07T04:12:37.000Z]] <https://chars.suikawiki.org/set/%24rfc7564-6.3.0%3AOtherLetterDigits>
-- [[Unicode]] 6.3.0 時点

]REFS]


* メモ

[19] [[IDNA]] や [[PRECIS]] のいう「普通」「伝統的」「[RUBYB[文字][letter]]」「数字」
はかなり直感と乖離していて問題があります。

[20] 
まず、 [CODE[LetterDigits]] には[[結合文字]]が多く含まれています。
これはアクセント付きラテン文字のようなものを考えるとある種当然ともいえるのですが、
問題となるのは [CODE[LetterDigits]] が[[文字列]]ではなく[[文字]]の[[集合]]であるにも関わらず、
[[結合文字]]を含み、それを「「普通」の文字や数字」と称していることです。

[21] 
「「「普通」の文字や数字」の列」だけを認めるつもりで [CODE[LetterDigits]] 
を使うと、「[[結合文字]]だけの列」のようなものを認めてしまうことになりますから、
流用時は要注意です。

[22] 
[CODE[OtherLetterDigits]] 
を眺めるとこれは確かに「普通」ではないなと思わせる記号的なものなどが並んでいますが、
中に混じってなぜ「普通」でないことにされているのか疑問なものも混ざっています。
[[丸付き文字]]を作るための結合用の丸や四角なども混ざっています。

[23] 
従ってほとんどの用途において [CODE[LetterDigits]] も [CODE[OtherLetterDigits]]
も[[帯に短し襷に長し]]な印象があります。
[[IDN]] や [[PRECIS]] 以外では使うべきではないでしょう。


