ARIBの文字コード

ARIBの文字コード

ARIB STD-B3 の文字符号化

[65] ARIB STD-B3 #page=21

ISO/IEC 2022 (っぽい) 8ビット符号

[66] マクロの既定値はおそらく >>63 と同じ (要検証)


[68] ARIB STD-B3 #page=92

地名記述用


[69] ARIB STD-B3 #page=150

ルビ符号

[78] 利用例 #page=151

[81] 当面は」・で対応できると思われるが複合語 >>80 のようにポーズで聞きやすいことが在るので今後のため。も用意した、らしいです。

[85] プロトコルの構造 (DU = データユニット) を使って

のように記述します。 #page=153

[86] この書き方でなぜ SCP, ECP が要るのか謎。

ARIB STD-B5 の文字符号化

[16] ARIB STD-B5 PDF p.49 文字信号

[22] ISO/IEC 2022 (っぽい) 8ビット符号

[11] マクロ集合:

ARIB STD-B24 の文字符号化

[19] ARIB STD-B24 第一編 第2部 PDF p.56 文字符号化

[55] マクロ符号は C1集合制御文字 MACRO で定義できる。

[61] 登録できるマクロ文に制限があるのか不明。

[63] 既定値:

[62] C0, C1制御文字 (括弧内は ARIB STD-B5 になかったもの):

[67] ARIB STD-B3 #page=41 では:

8/12, 8/13 >>76, >>77

[64] Videotex の Data Syntax I も参照。

[135] >>126 U+EC00 からの領域が DRCS に対応付けられている.

ARIB 外字

[23] ARIB STD-B24

[118] Data Coding and Transmission Specification for Digital Broadcasting ARIB STANDARD - 6-STD-B24v6_2-1p3-E1.pdf, , http://www.arib.or.jp/english/html/overview/doc/6-STD-B24v6_2-1p3-E1.pdf#page=119

[119] >>118 ARIB外字Unicodeの対応が書いてあります。

[120] 旧版の PUA との対応も書いてあります。

[1] ARIB TR-B39 () http://www.arib.or.jp/english/html/overview/doc/4-TR-B39v1_0-1p4.pdf#page=367

[3] ARIB STD-B62

[111] Data Coding and Transmission Specification for Digital Broadcasting - 6-STD-B24v5_2-1p3-E1.pdf, , https://www.arib.or.jp/english/html/overview/doc/6-STD-B24v5_2-1p3-E1.pdf#page=120

[24] MULTIMEDIA CODING SPECIFICATION FOR DIGITAL BROADCASTING (SECOND GENERATION) ARIB STANDARD - 6-STD-B62v1_2-1p2-E1.pdf, , https://www.arib.or.jp/english/html/overview/doc/6-STD-B62v1_2-1p2-E1.pdf#page=45

[2] Windows 7 でひっそり追加されていた和文フォント - しろもじメモランダム, https://shiromoji.hatenablog.jp/entry/20090519/1242741379

  • Windows TV 丸ゴシック & Windows TV P丸ゴシック
  • Windows TV 太丸ゴシック & Windows TV P太丸ゴシック
  • Windows TV ゴシック & Windows TV Pゴシック

Unicode にまだ収録されていない文字は、こんな感じでPUA/シフトJISの外字領域に割り当てられている。

[4] ARIB外字 - Wikipedia, , https://ja.wikipedia.org/wiki/ARIB%E5%A4%96%E5%AD%97

[89] ARIB外字の追加記号一覧 - Wikipedia, , https://ja.wikipedia.org/wiki/ARIB%E5%A4%96%E5%AD%97%E3%81%AE%E8%BF%BD%E5%8A%A0%E8%A8%98%E5%8F%B7%E4%B8%80%E8%A6%A7

[88] 関連記事: 元号合字, 小書き漢字

[90] ARIB外字をVLCで表示するには - 名有りさんの日記, https://naari.hatenablog.com/entry/2020/12/25/035924

[91] GitHub - nkoriyama/vlc-aribsub: 日本のデジタル放送のMPEG-TSの字幕表示に対応したVLC, https://github.com/nkoriyama/vlc-aribsub

[92] TVCaptionMod2/TVCaptionMod2_Readme.txt at master · xtne6f/TVCaptionMod2 · GitHub, https://github.com/xtne6f/TVCaptionMod2/blob/master/TVCaptionMod2_Readme.txt

ARIB外字対応フォントとの対応表がある。

[102] ecma35lib/pict_arib.txt at master · harjitmoe/ecma35lib · GitHub, https://github.com/harjitmoe/ecma35lib/blob/master/ecma35/data/multibyte/mbmaps/Custom/pict_arib.txt

90区から94区の Unicode 対応表。

小書き漢字は通常の漢字に対応付けられている。

Unicode 標準化

[98] Unicode への初期絵文字追加時に、ガラケーと一致するものは符号位置が示されていた。

[104] emoji4unicode/arib.ucm at master · google/emoji4unicode · GitHub, https://github.com/google/emoji4unicode/blob/master/data/arib/arib.ucm

[103] Unicode Symbols - ARIB-Unicode Mapping Table, https://sites.google.com/site/unicodesymbols/Home/japanese-tv-symbols/arib-unicode-mapping-table

[99] Unihan - ARIB外字出典で追加された漢字は J 欄に対応が書かれている。 (あまりない)

[101] n3468.pdf, , https://www.unicode.org/wg2/docs/n3468.pdf

[137] Wayback Machine, https://web.archive.org/web/20150104014059/http://appsrv.cse.cuhk.edu.hk/~irg/irg/irg29/IRGN1347_wg2n3318-ARIB_CJK.pdf

ARIB STD-B62

[113] ARIB STD-B62

[117] >>24 ARIB外字の一部と Unicode の対応が書いてあります。

[129] >>134 #page=62, >>132 #page=62, >>128 #page=64 追加文字 (Unicode のみ)

[131] >>130 #page=65 「㋿」も追加

[133] >>134, >>132 UCS の部分集合が定義されている。

[114] MULTIMEDIA CODING SPECIFICATION FOR DIGITAL BROADCASTING (SECOND GENERATION) ARIB STANDARD - 6-STD-B62v1_2-1p2-E1.pdf, , https://www.arib.or.jp/english/html/overview/doc/6-STD-B62v1_2-1p2-E1.pdf#page=63

JIS X 0213:2004 のうち BMP 1文字で表せないものが PUA に割り当てられている。

[121] >>118 にあるのと同じっぽい

[115] 従来規格の ISO/IEC 2022文字コードは使わなくなって Unicode ベースになっているにも関わらず、 対応する文字集合の規定に何故か ISO/IEC 2022文字コードが引き続き使われ続けているせいで、 ところどころおかしなわかるようなわからないようなことが書いてあるみたいです。

[116] 関連記事: 半角カタカナ, OVER LINE, 代替名称

Unicode PUA

[16] ( 版) http://www.arib.or.jp/english/html/overview/doc/2-STD-B24v5_1-1p3.pdf#page=156

DRCS の文字は、基本多言語面の私用領域に対応付ける。

私用領域の利用にあたっては、DRCS は EC 区 00 点から順次用いることとする。


[105] にしき的フォント: ARIB外字を出典とする文字を PUA に収録。互換性はなし。

メモ

[25] 追加文字にばかり目が行きがちですが、 JIS X 0208 非漢字現在位置の前進を伴わない文字に置き換えられている点にも注意。

[93] ■とある言語の開発記録II / ARIBにまともな資料を求めるのは間違っているだろうか, https://charatsoft.sakura.ne.jp/develop/toaru2/index.php?did=4

[96] ariblib と DRCS (2012-11-18), , https://txqz.net/memo/2012-1118-1434.html

[106] グループ:ARIB追加漢字 - GlyphWiki, https://glyphwiki.org/wiki/Group:ARIB%E8%BF%BD%E5%8A%A0%E6%BC%A2%E5%AD%97

[110] がらくた置き場 - TvRockスレ @ ウィキ - atwiki(アットウィキ), https://w.atwiki.jp/tvrock/pages/26.html

[112] ARIB STD-B24用iconv(gconv)モジュール - PukiWiki, https://www.minkycute.homeip.net/pukiwiki/index.php?ARIB%20STD-B24%E7%94%A8iconv%28gconv%29%E3%83%A2%E3%82%B8%E3%83%A5%E3%83%BC%E3%83%AB

ARIB の文字コードや 「ETSI EN300-468 Table00」 (DVB) から Unicode の変換が実装されている (ソースコードあり, GPL).

[136] GitHub - hunamizawa/AribB24.DotNet: "ARIB STD-B24 8-bit Character Code" decoder for .NET Standard, https://github.com/hunamizawa/AribB24.DotNet

実際に ARIB STD-B24 8単位符号 でエンコードされたバイト列や、それを扱う家電製品の動作を調べると、次のようなルールが見えてきます。

  1. [MSZ] の後に続く文字は、すべて半角文字として表示する。
  2. [NSZ] の後に続く文字は、すべて全角文字として表示する。
  3. 初期状態では [NSZ] が指示されているものとする。