Optical Character Recognition(OCR)

この手のものはたくさんありますが、

ここではtesseract-ocrを認識エンジンとして使ってみます。

tesseract-ocrはオープンソースの中では、比較的認識率の高いエンジンです。

日本語等は使えません、アルファベットのみ対応しています。

もともとHPのコードでしたが、HPがOCR事業から撤退したため長らく「お蔵入り」

していたのをGoogleが引き継いで、オープンソースとして公開しています。

古いコードをベースにしているので、少々古典的なアルゴリズムを使っているかも。

(別途でOpenCVのようなComputerVisionをつかったOCRも試してみます。-- basicOCR)

tesseract-ocr


ご注意
WebOCRをご使用いただきありがとうございます。
昨今、使用状況を確認してみますと、かなりハードな要求が多いと思われます。
市販の認識エンジンとは比較になりませんのでご注意ください。
tesseract-ocrは素のままで実行しています(トレーニングデータはまだ作ってません)。
以下にサンプルを用意しました。この程度と認識された上でご使用ください。
サンプル
Web OCR

Web OCRのトレーニングについて

basicOCR
付録


トップページ| サイトマップ|

Web OCR



tesseract-ocrを使った文字認識


Web OCR

初期画面はこんな感じ。





参照する文字画像はJPEG形式です。

例えばこんな画像。





参照が完了すると、即認識を開始します。





結果はこんな感じ。

上のフィールドに認識結果、

下のフィールドに翻訳結果が入ります。

翻訳は、GoogleのAjax Language APIを使っています。









TOP

Web OCRのトレーニングについて



認識率向上には、tesseract-ocr用にトレーニングデータをつくる必要があります。

このページを参照

to be continued.

TOP

サンプル

4つのサンプルを用意しました。下の画像をダウンロードして、お使いください。

使用上のご注意にもなっています。


サンプル 1

サンプル 2

サンプル 3

上の画像からノイズを省いたもの
サンプル 4


TOP

basicOCR

検索エンジンから、オリジナルサイトを見つけにくくなってますね。
C++のソースは以下からダウンロードできます。

basicOCR

TOP

付録

資料1

TOP



スポンサー リンク
スポンサー リンク
スポンサー リンク