Binary-Ordered Compression for Unicode

BOCU

[1] Binary-Ordered Compression for Unicode (Unicode 用バイナリ順圧縮)

SCSU みたいなもんだけど、照合順が UTF-32/UTF-8 とおんなじ、らしい。 (照合順ってのはもちろん、 U-00000000〜U-7FFFFFFF の順に並べたやつです。(そんなにこだわる必要あるんかな?))

仕様書

BOCU-1

[5] BOCU-1 は、 MIME text/*媒体型で使える BOCU

IANA 名

"BOCU-1" (See IANAREG)

実装

[6] Encode::BOCU1 - search.cpan.org ( 版) http://search.cpan.org/dist/Encode-BOCU1/lib/Encode/BOCU1.pm

[7] PDIC辞書形式仕様書 ( 版) http://webcache.googleusercontent.com/search?q=cache:PBcTj8D8lcwJ:homepage3.nifty.com/TaN/unicode/pdicu-dic.doc

[4] PDIC形式 | 人工言語学 Wiki | Fandom, , https://conlinguistics.fandom.com/ja/wiki/PDIC%E5%BD%A2%E5%BC%8F

使われている文字コードは Win32 版では Shift_JIS が、Unicode 版では BOCU-1 である。

参考

参考

[3] この当時ですら、 UTF-8 以外に MIME でこの種の文字コードの必要性があったのか甚だ疑問ですが・・・。