自分用メモ

今年から本気だす

29 「TesseractでOCR」

Kinectで文字認識出来たら面白いじゃんとかふと思い立ち、
OCRで良さげなライブラリは無いかと探した結果、
Tesseractにたどり着きました。テッセラクトと読むらしい。

Windows環境だとインストールは割と簡単。

tesseract-ocr
http://code.google.com/p/tesseract-ocr/

の [Downloads] から最新のexeを落としてきて、インストールすれば良い。

使い方は、コマンドプロンプト

tesseract.exe test.tif output

と入力すれば良い。

こんな、何の変哲もないバーコードも。

コマンド1つ叩くだけで、

文字列として取得することができます。
あとはこの文字列を使って何なりとしてください。

今後は日本語がどれくらい読み取れるか、
Kinectなどを活用して何かできたらなぁと思っています。

# Windows8で管理者実行の仕様が微妙に変わっていてハマりました。