ブログ、ホームページ作成に役に立つ情報、フリーソフト情報、企業や個人のIT活用を支援する為のパソコン講座を掲載します。

Sponsored Links

Google製エンジンを搭載したフリーのOCRソフト「Softi FreeOCR」v1.5が、リリースされました。
「OCR」とは、スキャナから、書籍や画像ファイルを読み込んで、文字部分をテキスト文字列に変換してくれるソフトの事です。

現在のところ日本語の読み取りには対応していなそうです。 ちょっと残念です。
海外の英語の書籍を翻訳したい場合に利用する
WEBシステムの解説書(Google等の)から、サンプルソースをテキスト文字列としてコピーしたい場合にも活用できそうだ。

対応OS
・Windows XP、Vistaで確認済み。
・「mac」版はありませんので、文中の下に記載した「webサービス版 OCR」で、お試し下さい。

ダウンロードは下記のサイトより。
http://softi.co.uk/freeocr.htm

本ソフトは英語のほか、フランス語、イタリア語、オランダ語、スペイン語、ドイツ語の認識に対応しているが、英語以外の言語を利用する場合は、下記URLにあるGoogleのWebサイトから、言語ファイルをダウンロードしておく必要があります。
tesseract-ocr - Google Code(各言語ファイルのダウンロードページ)
http://code.google.com/p/tesseract-ocr/

機能概要
OCRエンジンは、Googleが昨年オープンソースとして公開した「Tesseract」を搭載している。シンプルな画面構成で、OCRソフトを利用したことのないユーザーでも手軽に利用できるのが特長。

使い方
・書籍をスキャナーから読み込む場合は、象物をスキャナーにセットして[Scan]ボタンをクリックする。
・ダイアログ上で、DPI値を200/300のいずれかに指定して、ダイアログ上の[Scan]ボタンを押す。
・スキャンが完了したら、あとは[Start OCR]ボタンをクリックする。
・文字情報の認識が終わると、画面右側で変換されたテキスト文字列をプレビューできる。
・ここでは範囲選択した文字列を[Ctrl]+[C]キーでクリップボードへコピーできるほか、全文をテキストファイルとして保存することが可能。

更新情報
2008年10月 現在 「Softi FreeOCR」v2.4 になっています。



WEBサービス版 OCR
コメントを頂いた会社のサービスを紹介します。
WEB上から「OCR」が使用できるサービスは、初めてではないでしょうか。

できたて、ほやほやらしく、私も知りませんでした。
「WEB OCR 協同ネットワークス」となっていましたが、「about US」が準備中のため会社の詳細は2007/8/9(木)現在、不明です。
http://www.web-ocr.net/

WEB OCR 無料体験版サービスページ」から有料版の機能限定で無料で使用することが可能です。
・下記のサイトからどうぞ。
 http://210.189.105.187/free/

 2007年10月現在、理由は不明ですが、利用できない状態になっています。
 2008年10月現在、利用可能です。


関連情報>2007年11月
PDFビューワー「クセロReader ZERO」v1.5.0.4リリース(OCR処理機能を追加)
  


関連タグ : OCR,