* ARIB STD-B3 の文字符号化


[65] [[ARIB STD-B3]] [SRC[#page=21]]

[[ISO/IEC 2022]] (っぽい) [[8ビット符号]]

- [[C0]]  >>67
- [CODE(charname)@en[SP]] : すべて背景色
- [CODE(charname)@en[DEL]] : すべて前景色
- [[C1]]  >>67
- [N[4/2]] : [[JIS X 0208-1990]] (相当) + [[ARIB外字]]
-- [[ノンスペーシング文字]] 1区13点-18点、2区94点 後続文字と合成表示する
-- 符号表あり
-- [87] #page=172 に説明あり
- [N[4/10]] : [[JIS X 0201]] [[ラテン文字用図形文字集合]] (相当)
- [N[3/0]] : [[平仮名]] ([[94集合]]、[[例示字形]]は[[全角]])
- [N[3/1]] : [[片仮名]] ([[94集合]]、[[例示字形]]は[[全角]])
- [N[3/2]] : モザイク集合A ([[94集合]])
- [N[3/3]] : モザイク集合B ([[94集合]])
- [N[3/4]] : モザイク集合C ([[94集合]], [[ノンスペーシング]])
- [N[3/5]] : モザイク集合D ([[94集合]], [[ノンスペーシング]])
- [N[7/0]] : マクロ集合 ([[94集合]])
- [N[4/0]] : [[DRCS]]-0 ([[94[SUP[2]]集合]])
- [N[4/1]] ... [N[4/15]] : [[DRCS]]-1 ... [[DRCS]]-15 ([[94集合]])
- [[指示列]], [[固定シフト]], [[単独シフト]]

[66] マクロの既定値はおそらく
>>63
と同じ (要検証)


-*-*-

[68] [[ARIB STD-B3]] [SRC[#page=92]]

[[地名]]記述用

- [[JIS X 0201]]-1976
-- [CODE[SO]] で切り替え
- [[JIS X 0208-1983]]
-- [CODE[SI]] で切り替え
-- 先頭での初期値
-- 先頭では [CODE[SI]] を使わない
- 末尾ではどちらの状態でもよい

-*-*-

[69] [[ARIB STD-B3]] [SRC[#page=150]]

[[ルビ]]符号

- [70] [[漢字仮名混じり文]]に含まれる特定の文字列の読みを表す表音文字列である[[ルビ]]の記述に使う。
-- [71] 普通名詞または固有名詞の単語にふる。
-- [76] [CODE(charname)@en[SCP]] [N[8/12]] :
ルビ開始 (Start of Characters to be Pronounced)
-- [77] [CODE(charname)@en[ECP]] [N[8/13]] :
ルビ終了 (End of Characters to be Pronounced)
- [73] [[GL]] 片仮名集合
-- [ [N[7/9]], [N[7/14]] ] は次を除き未定義
--- [N[7/9]] ー 長音 : 長音化する読みを指定
--- [N[7/10]] 。 ポーズ付きアクセント句区切り : ポーズを付与したアクセント句の句切り
--- [N[7/12]] 」 アクセント : アクセントの位置を示す
--- [N[7/14]] ・ アクセント句区切り : アクセント句の区切りを表す
- [72] 1回のルビに「・」と「。」は合計高々1つ
- [74] 「」」は1つのアクセント句に高々1つ
- [75] アクセント型0型 (平板型) のときアクセント記号なし

[78] 利用例 #page=151

- [79] 大井南 オ」ーイ・ミナミ
- [80] 生麦交差点蓬莱橋ビル ナマムギコーサ」テン。ホーラバシビ」ル
- [82] 0型 (平板型): とーきょー
- [83] 1型 (頭高型): ち」ば
- [84] 2型 (n型 = 中高型): かな」がわ

[81] 当面は」・で対応できると思われるが複合語 >>80 
のようにポーズで聞きやすいことが在るので今後のため。も用意した、らしいです。

[85] プロトコルの構造 (DU = データユニット) を使って

- 本文DU : SCP 戸田 ECP
- ルビDU : ヘタ
- 本文DU : 交差点で渋滞

のように記述します。 [SRC[#page=153]] 

;; [86] この書き方でなぜ SCP, ECP が要るのか謎。

;; [143] >>86 どこから始まるか指定したいから SCP は要りそう。 ECP はなんでだろうね。

* ARIB STD-B5 の文字符号化


[16] [[ARIB STD-B5]] PDF p.49 文字信号

[22] [[ISO/IEC 2022]] (っぽい) [[8ビット符号]]

- [17] [[C0]] [SEE[ [[ARIB STD-B24]] ]]
- [CODE(charname)@en[SP]]
- [CODE(charname)@en[DEL]]
- [18] [[C1]] [SEE[ [[ARIB STD-B24]] ]]
- [5] [VAR[F1]] = [N[4/2]] : [[JIS C 6226-1983]] 非漢字および第1水準 (相当)
-- [6] [[ノンスペーシング文字]] 1区13点-18点、2区94点 後続文字と合成表示する
- [7] [VAR[F2]] = [N[4/10]] : [[JIS X 0201]] [[ラテン文字用図形文字集合]] (相当)
- [8] [VAR[F3]] = [N[3/0]] : [[平仮名]] ([[94集合]])
- [9] [VAR[F4]] = [N[3/1]] : [[片仮名]] ([[94集合]])
- [10] [VAR[F9]] = [N[7/0]] : マクロ集合 ([[94集合]])

[11] マクロ集合:

- [12] [N[6/0]] = 
[CODE(charname)@en[ESC]] [N[2/4]] [VAR[F1]] 
[CODE(charname)@en[ESC]] [N[2/9]] [VAR[F2]]
[CODE(charname)@en[ESC]] [N[2/10]] [VAR[F3]]
[CODE(charname)@en[ESC]] [N[2/11]] [N[2/0]] [VAR[F9]] 
[CODE(charname)@en[LS0]]
[CODE(charname)@en[ESC]] [N[7/13]]
- [13] [N[6/1]] = 
[CODE(charname)@en[ESC]] [N[2/4]] [VAR[F1]] 
[CODE(charname)@en[ESC]] [N[2/9]] [VAR[F4]]
[CODE(charname)@en[ESC]] [N[2/10]] [VAR[F3]]
[CODE(charname)@en[ESC]] [N[2/11]] [N[2/0]] [VAR[F9]] 
[CODE(charname)@en[LS0]]
[CODE(charname)@en[ESC]] [N[7/13]]
- [14] [N[6/14]] = 
[CODE(charname)@en[ESC]] [N[2/8]] [VAR[F4]] 
[CODE(charname)@en[ESC]] [N[2/9]] [VAR[F3]]
[CODE(charname)@en[ESC]] [N[2/10]] [VAR[F2]]
[CODE(charname)@en[ESC]] [N[2/11]] [N[2/0]] [VAR[F9]] 
[CODE(charname)@en[LS0]]
[CODE(charname)@en[ESC]] [N[7/13]]
- [15] その他 = なし


* ARIB STD-B24 の文字符号化

- [123] [CITE[Data Coding and Transmission Specifications for Digital Broadcasting ARIB STANDARD - 6-STD-B24v5_0-1p3-E1.pdf]], [TIME[2021-09-29T18:13:17.000Z]], [TIME[2022-10-15T12:39:55.242Z]] <https://www.arib.or.jp/english/html/overview/doc/6-STD-B24v5_0-1p3-E1.pdf#page=51>,
#page=142
- [122] [CITE[Data Coding and Transmission Specification for Digital Broadcasting ARIB STANDARD - 6-STD-B24v5_1-1p3-E2.pdf]], [TIME[2021-09-29T18:13:18.000Z]], [TIME[2022-10-15T13:15:36.476Z]] <https://www.arib.or.jp/english/html/overview/doc/6-STD-B24v5_1-1p3-E2.pdf#page=51>,
#page=142
- [124] [CITE[Data Coding and Transmission Specification for Digital Broadcasting - 6-STD-B24v5_2-1p3-E1.pdf]], [TIME[2021-09-29T18:13:18.000Z]], [TIME[2022-10-15T13:25:19.551Z]] <https://www.arib.or.jp/english/html/overview/doc/6-STD-B24v5_2-1p3-E1.pdf#page=52>,
#page=143
- [125] [CITE[Data Coding and Transmission Specification for Digital Broadcasting ARIB STANDARD - 6-STD-B24v6_2-1p3-E1.pdf]], [TIME[2021-09-29T18:13:18.000Z]], [TIME[2022-10-15T13:26:38.148Z]] <http://www.arib.or.jp/english/html/overview/doc/6-STD-B24v6_2-1p3-E1.pdf#page=51>,
#page=154
- [126] [CITE[Data Coding and Transmission Specification for Digital Broadcasting ARIB STANDARD - 6-STD-B24v6_4-1p3-E1.pdf]], [TIME[2021-09-29T18:13:18.000Z]], [TIME[2022-10-15T13:46:01.618Z]] <https://www.arib.or.jp/english/html/overview/doc/6-STD-B24v6_4-1p3-E1.pdf#page=51>,
#page=154

[19] [[ARIB STD-B24]] 第一編 第2部 PDF p.56 文字符号化

- [20] [[ARIB STD-B5]] [[8ビット符号]] ([[ISO/IEC 2022]] っぽいやつ) の拡張
- [21] [[C0]]
- [CODE(charname)@en[SPACE]]
- [CODE(charname)@en[DELETE]]
- [[C1]]
- [25] [VAR[F1]] = [N[4/2]] = 漢字系集合
-- [26] [[JIS X 0208:1990]] 相当
--- [41] 1区13点から18点、2区94点は[[ノンスペーシング文字]]
-- [27] 90区 - 94区 [[ARIB外字]]
- [28] 英数集合
-- [42] [[JIS X 0201]] [[ラテン文字用図形文字集合]]相当
-- [49] [VAR[F2]] = [N[4/10]] = 英数
-- [50] [N[3/6]] = プロポーショナル英数
- [29] 平仮名集合
-- [43] [VAR[F3]] = [N[3/0]] = 平仮名
-- [51] [N[3/7]] = プロポーショナル平仮名
- [30] 片仮名集合
-- [44] [VAR[F4]] = [N[3/1]] = 片仮名
-- [52] [N[3/8]] = プロポーショナル片仮名
-- [53] [N[4/9]] = [[JIS X 0201]] [[片仮名][片仮名用図形文字集合]]
- [31] モザイク集合
-- [45] [VAR[F5]] = [N[3/2]] = モザイクA
-- [46] [VAR[F6]] = [N[3/3]] = モザイクB
-- [47] [VAR[F7]] = [N[3/4]] = モザイクC [[ノンスペーシング文字]]
-- [48] [VAR[F8]] = [N[3/5]] = モザイクD [[ノンスペーシング文字]]
- [32] 外字符号集合
-- [33] [[94集合]] [VAR[F10]] = [N[4/1]] DRCS-1 - [VAR[F24]] = [N[4/15]] DRCS-15
-- [34] [[94[SUP[2]]集合]] [N[4/0]] = DRCS-0
- [35] [VAR[F9]] = [N[7/0]] = マクロ符号集合
- [36] [N[3/9]] = JIS互換漢字1面集合 = 次のいずれか:
-- [38] [[JIS X 0213:2004]] 第1面
-- [39] >>27 1区から84区
- [37] [N[3/10]] = JIS互換漢字2面集合 = [[JIS X 0213:2004]] 第2面
- [40] [N[3/11]] = 追加記号集合
-- [54] >>27




[55] 
マクロ符号は [[C1集合]]の[[制御文字]]
[CODE(charname)@en[MACRO]]
で定義できる。

- [56] [CODE(charname)@en[MACRO]] ([N[9/5]]) [VAR[P]] [VAR[MC]] [VAR[macro]] [CODE(charname)@en[MACRO]] [N[4/15]]
-- [57] [VAR[P]] = [N[4/0]] = マクロ定義の開始 
-- [58] [VAR[P]] = [N[4/1]] = マクロ定義の開始 + 1回実行
-- [59] [VAR[MC]] = マクロ文番号 ∈ [ [N[2/1]], [N[7/14]] ]
-- [60] [VAR[macro]] = マクロ文

[61] 
登録できるマクロ文に制限があるのか不明。

[63] 既定値:

- 6/0 ESC 02/4 F1 ESC 02/9 F2 ESC 02/10 F3 ESC 02/11 02/0 F9 LS0 ESC 07/13
- 6/1 ESC 02/4 F1 ESC 02/9 F4 ESC 02/10 F3 ESC 02/11 02/0 F9 LS0 ESC 07/13
- 6/2 ESC 02/4 F1 ESC 02/9 02/0 F10 ESC 02/10 F3 ESC 02/11 02/0 F9 LS0 ESC 07/13
- 6/3 ESC 02/8 F5 ESC 02/9 F7 ESC 02/10 F8 ESC 02/11 02/0 F9 LS0 ESC 07/13
- 6/4 ESC 02/8 F5 ESC 02/9 F6 ESC 02/10 F8 ESC 02/11 02/0 F9 LS0 ESC 07/13
- 6/5 ESC 02/8 F5 ESC 02/9 02/0 F10 ESC 02/10 F8 ESC 02/11 02/0 F9 LS0 ESC 07/13
- 6/6 ESC 02/8 02/0 F10 ESC 02/9 02/0 F11 ESC 02/10 02/0 F12 ESC 02/11 02/0 F9 LS0 ESC 07/13
- 6/7 ESC 02/8 02/0 F13 ESC 02/9 02/0 F14 ESC 02/10 02/0 F15 ESC 02/11 02/0 F9 LS0 ESC 07/13
- 6/8 ESC 02/8 02/0 F16 ESC 02/9 02/0 F17 ESC 02/10 02/0 F18 ESC 02/11 02/0 F9 LS0 ESC 07/13
- 6/9 ESC 02/8 02/0 F19 ESC 02/9 02/0 F20 ESC 02/10 02/0 F21 ESC 02/11 02/0 F9 LS0 ESC 07/13
- 6/10 ESC 02/8 02/0 F22 ESC 02/9 02/0 F23 ESC 02/10 02/0 F24 ESC 02/11 02/0 F9 LS0 ESC 07/13
- 6/11 ESC 02/4 F1 ESC 02/9 02/0 F11 ESC 02/10 F3 ESC 02/11 02/0 F9 LS0 ESC 07/13
- 6/12 ESC 02/4 F1 ESC 02/9 02/0 F12 ESC 02/10 F3 ESC 02/11 02/0 F9 LS0 ESC 07/13
- 6/13 ESC 02/4 F1 ESC 02/9 02/0 F13 ESC 02/10 F3 ESC 02/11 02/0 F9 LS0 ESC 07/13
- 6/14 ESC 02/8 F4 ESC 02/9 F3 ESC 02/10 F2 ESC 02/11 02/0 F9 LS0 ESC 07/13
- 6/15 ESC 02/8 F2 ESC 02/9 F5 ESC 02/10 02/0 F10 ESC 02/11 02/0 F9 LS0 ESC 07/13


[62] [[C0]], [[C1]] の[[制御文字]] (括弧内は [[ARIB STD-B5]] になかったもの):

- 0/0 NUL [0/7 BEL] 0/8 APB 
- 0/9 APF [0/10 APD] [0/11 APU] 0/12 CS 0/13 APR 0/14 LS1 0/15 LS0
- [1/6 PAPF]
- [1/8 CAN] 1/9 SS2 1/11 ESC [1/12 APS] 1/13 SS3 1/14 RS 1/15 US
- 8/0 BKF 8/1 RDF 8/2 GRF 8/3 YLF 8/4 BLF 8/5 MGF 8/6 CNF 8/7 WHF
- 8/8 SSZ 8/9 MSZ 8/10 NSZ 8/11 SZX
- 9/0 COL [9/1 FLC] [9/2 CDC] 9/3 POL [9/4 WMM] 9/5 MACR[O] [9/7 HLC]
- 9/8 RPC 9/9 SPL 9/10 STL 9/11 CSI 9/13 TIME

[67] [[ARIB STD-B3]] #page=41 では:

- 0: NUL SOH - ETX EOT - - - APB APF APD APU CS APR LS1 LS0
- 1: - - - - - - PAPF ETB - SS2 - ESC APS SS3 RS US
- 8: BKF RDF GRF YLF BLF MGF CNF WHF SSZ MSZ NSZ SZX - - - - 
- 9: COL FLC CDC POL WMM MACRO - HLC RPC SPL STL CSI - TIME - -

[N[8/12]], [N[8/13]] >>76, >>77

[64] [[Videotex]] の Data Syntax I も参照。

[135] >>126 U+EC00 からの領域が [[DRCS]] に対応付けられている.


[148] [CITE@ja[OPERATIONAL GUIDELINES FOR DIGITAL TERRESTRIAL TELEVISION BROADCASTING ARIB TECHNICAL REPORT - 8-TR-B14v6_7-2p5-E1.pdf]], [TIME[2021-09-29T18:13:21.000Z]], [TIME[2025-03-04T10:59:08.411Z]] <https://www.arib.or.jp/english/html/overview/doc/8-TR-B14v6_7-2p5-E1.pdf#page=121>



[147] 
[CITE@ja[OPERATIONAL GUIDELINES FOR DIGITAL TERRESTRIAL TELEVISION BROADCASTING ARIB TECHNICAL REPORT - 8-TR-B14v6_7-3p5-E1.pdf]], [TIME[2021-09-29T18:13:21.000Z]], [TIME[2025-03-04T10:49:04.336Z]] <https://www.arib.or.jp/english/html/overview/doc/8-TR-B14v6_7-3p5-E1.pdf#page=100>


* ARIB 外字

[23] [[ARIB STD-B24]]

[118] [CITE[Data Coding and Transmission Specification for Digital Broadcasting ARIB STANDARD - 6-STD-B24v6_2-1p3-E1.pdf]], [TIME[2021-09-29T18:13:18.000Z]], [TIME[2022-10-15T11:43:42.662Z]] <http://www.arib.or.jp/english/html/overview/doc/6-STD-B24v6_2-1p3-E1.pdf#page=119>

[119] >>118 /119 [[ARIB外字]]と[[Unicode]]の対応が書いてあります。

[120] >>118 /123 旧版の [[PUA]] との対応も書いてあります。

[139] >>118 /128 [[JIS X 0213]] の[[文字]]のうち [[Unicode]] 2面に当たるものについて、
[[PUA]] との対応が書いてあります。

[138] 
>>139
[CC[U+E7F4]] 
がなぜか
1-47-52
と
2-81-61 
の異なる2つの[[文字]]に対応付けられています。


[141] >>142 に似て非なる [[PUA]] との対応関係があります。
>>142 は 2-81-36 [CC[U+E7F3]] までで終わっていて、
2-81-61 以降がありません。そのため
[CC[U+E7F4]] 
は
1-47-52
だけです。




[1] [CITE[ARIB TR-B39]]
([TIME[2016-07-25 17:01:00 +09:00]])
<http://www.arib.or.jp/english/html/overview/doc/4-TR-B39v1_0-1p4.pdf#page=367>

[3] [[ARIB STD-B62]]

[111] 
[CITE[Data Coding and Transmission Specification for Digital Broadcasting - 6-STD-B24v5_2-1p3-E1.pdf]], [TIME[2021-09-29T18:13:18.000Z]], [TIME[2022-10-15T12:13:53.529Z]] <https://www.arib.or.jp/english/html/overview/doc/6-STD-B24v5_2-1p3-E1.pdf#page=120>


[24] [CITE[MULTIMEDIA CODING SPECIFICATION FOR DIGITAL BROADCASTING (SECOND GENERATION) ARIB STANDARD - 6-STD-B62v1_2-1p2-E1.pdf]], [TIME[2021-09-29T18:13:19.000Z]], [TIME[2022-10-15T07:43:45.487Z]] <https://www.arib.or.jp/english/html/overview/doc/6-STD-B62v1_2-1p2-E1.pdf#page=45>

[2] [CITE@ja[[[Windows 7]] でひっそり追加されていた和文フォント - しろもじメモランダム]], [TIME[2022-09-29T11:49:29.000Z]] <https://shiromoji.hatenablog.jp/entry/20090519/1242741379>

>
-    Windows TV 丸ゴシック & Windows TV P丸ゴシック
-    Windows TV 太丸ゴシック & Windows TV P太丸ゴシック
-    Windows TV ゴシック & Windows TV Pゴシック

>Unicode にまだ収録されていない文字は、こんな感じでPUA/シフトJISの外字領域に割り当てられている。


[4] [CITE@ja[[[ARIB外字]] - Wikipedia]], [TIME[2022-10-01T06:45:07.000Z]], [TIME[2022-10-15T07:27:54.684Z]] <https://ja.wikipedia.org/wiki/ARIB%E5%A4%96%E5%AD%97>

[89] [CITE@ja[ARIB外字の追加記号一覧 - Wikipedia]], [TIME[2022-09-30T07:54:28.000Z]], [TIME[2022-10-15T09:22:21.595Z]] <https://ja.wikipedia.org/wiki/ARIB%E5%A4%96%E5%AD%97%E3%81%AE%E8%BF%BD%E5%8A%A0%E8%A8%98%E5%8F%B7%E4%B8%80%E8%A6%A7>

-[94] [CITE@ja[お姫様さんはTwitterを使っています: 「arib外字 - unicode変換テーブル出来た。前半手動部分多いからミスってるかも。見所は92面のファックスと94面の数字のカオスな並びですね。 https://t.co/NFBDHtk293」 / Twitter]], [TIME[午後4:29 · 2013年7月31日][2013-07-31T07:29:56.000Z]], [TIME[2022-10-15T06:15:19.000Z]] <https://twitter.com/philomel202/status/362475199158951936>
-- [95] [CITE@en[arib.txt · GitHub]], [TIME[2022-10-15T09:35:10.000Z]] <https://gist.github.com/philopon/6120017>



[88] 関連記事:
[[元号合字]],
[[小書き漢字]]

[90] [CITE@ja[ARIB外字をVLCで表示するには - 名有りさんの日記]], [TIME[2022-10-15T09:25:13.000Z]] <https://naari.hatenablog.com/entry/2020/12/25/035924>

[91] [CITE@en[GitHub - nkoriyama/vlc-aribsub: 日本のデジタル放送のMPEG-TSの字幕表示に対応したVLC]], [TIME[2022-10-15T09:27:06.000Z]] <https://github.com/nkoriyama/vlc-aribsub>

[92] [CITE@en[TVCaptionMod2/TVCaptionMod2_Readme.txt at master · xtne6f/TVCaptionMod2 · GitHub]], [TIME[2022-10-15T09:28:26.000Z]] <https://github.com/xtne6f/TVCaptionMod2/blob/master/TVCaptionMod2_Readme.txt>

[[ARIB外字]]対応フォントとの対応表がある。

[102] 
[CITE@en[ecma35lib/pict_arib.txt at master · harjitmoe/ecma35lib · GitHub]], [TIME[2022-10-15T09:43:54.000Z]] <https://github.com/harjitmoe/ecma35lib/blob/master/ecma35/data/multibyte/mbmaps/Custom/pict_arib.txt>

90区から94区の [[Unicode]] 対応表。

[[小書き漢字]]は通常の[[漢字]]に対応付けられている。


* DRCS

- [145] 
[CITE@en[GitHub - nkoriyama/vlc-aribsub: 日本のデジタル放送のMPEG-TSの字幕表示に対応したVLC]], [TIME[2025-03-04T10:13:43.000Z]] <https://github.com/nkoriyama/vlc-aribsub>
- [144] 
[CITE@ja[ARIB外字をVLCで表示するには - 名有りさんの日記]], [TIME[2025-03-04T10:11:41.000Z]] <https://naari.hatenablog.com/entry/2020/12/25/035924>

[146] >>144 によると[CH[薩󠄁]] ([[旧字体]]) のようなものも [[DRCS]]
で送られてきているらしい。

* Unicode 標準化

[98] [[Unicode]] への初期[[絵文字]]追加時に、[[ガラケー]]と一致するものは符号位置が示されていた。


-[97] [CITE[Google Standard Unicode Emoji Mapping - 08080-emoji-proposal.pdf]], [TIME[2008-01-30T18:40:55.000Z]], [TIME[2022-10-15T09:37:56.334Z]] <http://unicode.org/L2/L2008/08080-emoji-proposal.pdf>
-[100] [CITE[Emoji Symbols: Background Data - 09027r2-emoji-backgrnd.pdf]], [TIME[2009-09-21T23:28:51.000Z]], [TIME[2022-10-15T09:39:31.228Z]] <https://www.unicode.org/L2/L2009/09027r2-emoji-backgrnd.pdf>


[104] [CITE@en[emoji4unicode/arib.ucm at master · google/emoji4unicode · GitHub]], [TIME[2022-10-15T09:50:17.000Z]] <https://github.com/google/emoji4unicode/blob/master/data/arib/arib.ucm>

[103] [CITE@ja[Unicode Symbols - ARIB-Unicode Mapping Table]], [TIME[2022-10-15T09:47:07.000Z]] <https://sites.google.com/site/unicodesymbols/Home/japanese-tv-symbols/arib-unicode-mapping-table>


[99] [[Unihan]] - [[ARIB外字]]出典で追加された[[漢字]]は J 欄に対応が書かれている。
(あまりない)

[101] [CITE[n3468.pdf]], [TIME[2008-04-23T20:15:08.000Z]], [TIME[2022-10-15T09:39:56.035Z]] <https://www.unicode.org/wg2/docs/n3468.pdf>

[137] [CITE[Wayback Machine]], [TIME[2023-07-30T02:15:20.000Z]] <https://web.archive.org/web/20150104014059/http://appsrv.cse.cuhk.edu.hk/~irg/irg/irg29/IRGN1347_wg2n3318-ARIB_CJK.pdf>

* ARIB STD-B62

[113] [[ARIB STD-B62]]

- [128] [CITE[MULTIMEDIA CODING SPECIFICATION FOR DIGITAL BROADCASTING (SECOND GENERATION) ARIB STANDARD - 6-STD-B62v1_2-1p2-E1.pdf]], [TIME[2021-09-29T18:13:19.000Z]], [TIME[2022-10-16T02:41:53.871Z]] <https://www.arib.or.jp/english/html/overview/doc/6-STD-B62v1_2-1p2-E1.pdf#page=45>
-
[134] 
[CITE[MULTIMEDIA CODING SPECIFICATION FOR DIGITAL BROADCASTING (SECOND GENERATION) ARIB STANDARD - 6-STD-B62v1_6-1p2-E1.pdf]], [TIME[2021-09-29T18:13:19.000Z]], [TIME[2022-10-16T02:59:10.065Z]] <https://www.arib.or.jp/english/html/overview/doc/6-STD-B62v1_6-1p2-E1.pdf#page=43>
- [132] 
[CITE[MULTIMEDIA CODING SPECIFICATION FOR DIGITAL BROADCASTING (SECOND GENERATION) ARIB STANDARD - 6-STD-B62v1_7-1p2-E1.pdf]], [TIME[2021-09-29T18:13:19.000Z]], [TIME[2022-10-16T02:56:07.237Z]] <https://www.arib.or.jp/english/html/overview/doc/6-STD-B62v1_7-1p2-E1.pdf#page=43>
- [127] [CITE[MULTIMEDIA CODING SPECIFICATION FOR DIGITAL BROADCASTING (SECOND GENERATION) ARIB STANDARD - 6-STD-B62v2_1-1p2-E1.pdf]], [TIME[2021-09-29T18:13:20.000Z]], [TIME[2022-10-16T02:41:27.272Z]] <https://www.arib.or.jp/english/html/overview/doc/6-STD-B62v2_1-1p2-E1.pdf#page=45>
- [130] [CITE[MULTIMEDIA CODING SPECIFICATION FOR DIGITAL BROADCASTING (SECOND GENERATION) ARIB STANDARD - 6-STD-B62v2_2-1p2-E1.pdf]], [TIME[2021-09-29T18:13:20.000Z]], [TIME[2022-10-16T02:46:22.104Z]] <https://www.arib.or.jp/english/html/overview/doc/6-STD-B62v2_2-1p2-E1.pdf#page=45> 

[117] >>24 [[ARIB外字]]の一部と [[Unicode]] の対応が書いてあります。


[129] 
>>134 #page=62,
>>132 #page=62,
>>128 #page=64 追加文字 ([[Unicode]] のみ)

[131] >>130 #page=65 「㋿」も追加

[133] >>134, >>132 [[UCS]] の部分集合が定義されている。


[114] [CITE[MULTIMEDIA CODING SPECIFICATION FOR DIGITAL BROADCASTING (SECOND GENERATION) ARIB STANDARD - 6-STD-B62v1_2-1p2-E1.pdf]], [TIME[2021-09-29T18:13:19.000Z]], [TIME[2022-10-15T07:43:45.487Z]] <https://www.arib.or.jp/english/html/overview/doc/6-STD-B62v1_2-1p2-E1.pdf#page=63>

[142] 
>>114
[[JIS X 0213:2004]] と [[ARIB外字]]のうち [[BMP]] 1文字で表せないものが
[[PUA]] に割り当てられている。

[121] >>118 にあるのと同じっぽい

[140] >>121 と思いきや何かおかしい >>141

[115] 従来規格の [[ISO/IEC 2022]] 系[[文字コード]]は使わなくなって
[[Unicode]] ベースになっているにも関わらず、
対応する[[文字集合]]の規定に何故か [[ISO/IEC 2022]] 
系[[文字コード]]が引き続き使われ続けているせいで、
ところどころおかしなわかるようなわからないようなことが書いてあるみたいです。

[116] 関連記事:
[[半角カタカナ]],
[[OVER LINE]],
[[代替名称]]

* Unicode PUA

[FIG(quote)[
[FIGCAPTION[
[16] ([TIME[2010-09-30 17:02:10 +09:00]] 版)
<http://www.arib.or.jp/english/html/overview/doc/2-STD-B24v5_1-1p3.pdf#page=156>
]FIGCAPTION]

> DRCS の文字は、基本多言語面の私用領域に対応付ける。
>  私用領域の利用にあたっては、DRCS は EC 区 00 点から順次用いることとする。

]FIG]

-*-*-

[105] 
[CITE[[[にしき的フォント]]]]
:
[[ARIB外字]]を出典とする文字を [[PUA]] に収録。互換性はなし。


[149] [CITE@ja[Microsoft Word - ARIB外字仕様書 - AFSARIBR-Map.pdf]], [TIME[2019-05-10T06:39:44.000Z]], [TIME[2025-06-24T03:29:12.299Z]] <https://www.fontucom.com/pdf/AFSARIBR-Map.pdf#page=5>

>
[LEFT[
86 区 22 点の【角󠄄】は ARIB 規格の[BR[]]
ARIB STD-B24 6.3 では Unicode 【89D2】と[BR[]]
定義されていますが,JIS 第一水準の【角】[BR[]]
と Unicode が競合しておりますので当フォン[BR[]]
トでは ARIB 外字【角󠄄】を UnicodeE000 に定[BR[]]
義しております。
]LEFT]


* メモ


[25] 追加文字にばかり目が行きがちですが、
[[JIS X 0208]] [[非漢字]]が[[現在位置の前進を伴わない文字]]に置き換えられている点にも注意。



[93] [CITE[■とある言語の開発記録II / ARIBにまともな資料を求めるのは間違っているだろうか]], [TIME[2022-10-15T09:33:21.000Z]] <https://charatsoft.sakura.ne.jp/develop/toaru2/index.php?did=4>

[96] [CITE[ariblib と DRCS (2012-11-18)]], [TIME[2020-04-11T13:59:22.000Z]], [TIME[2022-10-15T09:36:26.165Z]] <https://txqz.net/memo/2012-1118-1434.html>



[106] [CITE@ja[グループ:ARIB追加漢字 - GlyphWiki]], [TIME[2022-10-15T10:04:25.000Z]] <https://glyphwiki.org/wiki/Group:ARIB%E8%BF%BD%E5%8A%A0%E6%BC%A2%E5%AD%97>

- [108] [CITE@ja[rpls Viewer Web 版 | Electronic Information Research Laboratory]], [TIME[2022-10-15T11:01:22.000Z]] <https://www.minagi.jp/2018/09/24/rplsviewerweb/>
-- [107] [CITE@ja[rpls Viewer for Webをバージョンアップしました(1.1.0) | Electronic Information Research Laboratory]], [TIME[2022-10-15T11:00:53.000Z]] <https://www.minagi.jp/2019/05/01/rplsviewerweb-1-1-0/>
-- [109] [CITE[null]], [TIME[2021-05-04T10:28:19.000Z]], [TIME[2022-10-15T11:01:32.355Z]] <https://www.minagi.jp/apps/util/textdecoder-1.1.2.js>

[110] [CITE@ja[がらくた置き場 - TvRockスレ @ ウィキ - atwiki(アットウィキ)]], [TIME[2022-10-15T11:08:06.000Z]] <https://w.atwiki.jp/tvrock/pages/26.html>



[112] 
[CITE@ja[ARIB STD-B24用iconv(gconv)モジュール - PukiWiki]], [TIME[2022-10-15T11:13:08.000Z]] <https://www.minkycute.homeip.net/pukiwiki/index.php?ARIB%20STD-B24%E7%94%A8iconv%28gconv%29%E3%83%A2%E3%82%B8%E3%83%A5%E3%83%BC%E3%83%AB>

[[ARIB]] の文字コードや
「ETSI EN300-468 Table00」 ([[DVB]])
から 
[[Unicode]] の変換が実装されている (ソースコードあり, [[GPL]]).



[136] [CITE@en[GitHub - hunamizawa/AribB24.DotNet: "ARIB STD-B24 8-bit Character Code" decoder for .NET Standard]], [TIME[2022-10-29T05:06:00.000Z]] <https://github.com/hunamizawa/AribB24.DotNet>

>[SNIP[]]実際に ARIB STD-B24 8単位符号 でエンコードされたバイト列や、それを扱う家電製品の動作を調べると、次のようなルールが見えてきます。
>
=    [CODE[__&&[&&__MSZ__&&]&&__]] の後に続く文字は、すべて半角文字として表示する。
=    [CODE[[NSZ__&&]&&__]] の後に続く文字は、すべて全角文字として表示する。
=    初期状態では [CODE[[NSZ__&&]&&__]] が指示されているものとする。

