[18] universalchardet は、文字の出現頻度の統計データを元にバイト列の文字コードを判定する手法とその実装です。
[17] 本家 Mozilla の C++ の実装の他、各言語への移植版が存在しています。
[20] 次に示すのは独立した実装ではなく、他の実装のラッパーとして機能するものです。
[10] UNIVCHARDET 自体は1実装に過ぎず、何らかの標準でも、標準によって義務付けられた実装でもありませんが、 Web Applications 1.0 は文字符号化の決定算法の中で出現頻度分析に基づく推定の利用を認めており、 その具体例として >>1 を挙げています。
[9] HTML documents misinterpreted by charset sniffer を参照してください。