Unicode帝国主義

Unicode帝国主義

[3] 文字標準化高度に政治的で、 Unicode もまたその例に漏れません。

[1] Unicode と政治と文化

[2] 関連: 政治的に正しいデータ構造, ASCII帝国主義, 言語差別

[4] Unicode Consortium 参加企業等が欧米東アジアの市場で展開していた製品が採用していた文字コード文字は、 Unicode が設定した設計上の原理に合わないものも互換性文字表現形のような位置付けで BMP に詰め込まれていますが、 それらの企業が本格的に進出しなかった南アジア東南アジア中央アジアあたりで使われていた地元の文字コードはほとんど無視されました。

[5] Unicode印度系文字に相当に複雑な仕組みを採用したこともあり、 それらへの対応は遅れに遅れた上に、既存の文字コードからのデータ変換も相当に複雑で、 欧米の大手企業製品は実装していません。 Internet Archive に残る当時の Webサイトはほとんどが読めないなど、 文化資産の継承という面でも深刻な打撃を受けています。

[29] 最近はゲバ文字と通称される略字Unicode に追加するのはおかしいと政治的理由から主張する人が Twitter に湧いてきていたり。 CJK統合漢字

[30] この現象は長い厄介な歴史的背景があってデータ構造側に侵食してきているという事案。

  1. [32] 極右旧字旧仮名を使いがち
  2. [33] 極左ゲバ文字といわれる略字を使っていた
  3. [35] 古い難しい表記を使うのは右翼、省略された中華人民共和国みもある表記を使うのは左翼というイメージが広まった
    • [36] この段階で政治的背景なしに旧表記を愛好し続ける一般人も、 利便性から略字を使っているだけの一般人も、風評被害を受け始めている
  4. [37] 左翼にはいわゆる親中派が含まれるので、 簡体字を使うのは売国的思想背景があると攻撃されるようになる
  5. [40] 次第に攻撃対象が拡大され、新字体の印刷字形から離れたもの (古くからある楷書の伝統的字形を含む) が叩かれるようになる
    • [44] 反政府的な人は自民党政治家の文字が誤字で教養がないと叩く
    • [45] ネトウヨ極左活動家の文字が誤字や簡体字で外国人だ、スパイだと叩く
    • [53] こうした攻撃が成立するのは、新字体への字形統一 (均質化) が進んで旧表記も伝統的楷書字形も略字も社会から消えつつあるのが背景なので、 グラデーション的多様性の喪失が更なる分断を促しているともとれる

[51] 坊主憎けりゃで、いつの間にか文字が敵味方判定の材料にすり替わっているし、 その判定基準もガバガバで事実関係はどうでもよくなっている。

[67] >>66 Unicode Consortium沿ドニエストル通貨記号を追加していいか SC2 にお伺いを立てるの巻。普段は余程のことがない限り UTCSC2 がそれぞれ独立して決定するものの互いに矛盾する決定はしないという体制ができあがっているものの、 政治的に繊細かつ前例もない問題故、 UTC が勝手に決定すると参加国家の代表団で組織される ISO/IEC 側が荒れて面倒なことになりそうでこうなったのだろう。

[68] >>66 この件は技術的には問題がないが政治的には問題がある、というケースで前例がないと言っているが、 このケースには適用できない類例はいくつかあって