OCR

OCR

[3] OCR は、 画像から文字列を得る操作です。

[1] Official Google Data APIs Blog: Import Scans or Go Multilingual ( 版) http://googledataapis.blogspot.com/2009/09/import-scans-or-go-multilingual.html

[2] Comodo、OCRの誤認識により一部ドメインで正規所有者以外がSSL証明書を取得できる状態だった | スラド セキュリティ () http://security.srad.jp/story/16/10/23/0225240/

[4] OCR書体

[5] 古典籍資料のOCRテキスト化実験 | NDLラボ, , https://lab.ndl.go.jp/data_set/r4ocr/r4_koten/

[6] GitHub - chineseocr/darknet-ocr: darknet text detect and darknet cnn ocr, https://github.com/chineseocr/darknet-ocr

[7] >>6 精度はそれほどでもないとのこと。


[8] 近代雑誌OCR学習用データセット | 近代雑誌データセット, , http://codh.rois.ac.jp/modern-magazine/dataset/

[10] >>8 によれば CC BY で提供されています。

[11] の座標と文字列データが XML ファイルに入っています。 サイズの大きな XML ファイルですが、テキストファイルとしての1行に画像データ内の1行の情報が入っているので、 行指向ファイルとして処理できます。


[9] GitHub - ndl-lab/pdmocrdataset-part2: OCR処理プログラム研究開発事業において作成されたOCR学習用データセット, https://github.com/ndl-lab/pdmocrdataset-part2