Sponsored Links
「OCR」とは、スキャナから、書籍や画像ファイルを読み込んで、文字部分をテキスト文字列に変換してくれるソフトの事です。
現在のところ日本語の読み取りには対応していなそうです。 ちょっと残念です。
海外の英語の書籍を翻訳したい場合に利用する
WEBシステムの解説書(Google等の)から、サンプルソースをテキスト文字列としてコピーしたい場合にも活用できそうだ。
<対応OS>
・Windows XP、Vistaで確認済み。
・「mac」版はありませんので、文中の下に記載した「webサービス版 OCR」で、お試し下さい。
ダウンロードは下記のサイトより。
http://softi.co.uk/freeocr.htm
本ソフトは英語のほか、フランス語、イタリア語、オランダ語、スペイン語、ドイツ語の認識に対応しているが、英語以外の言語を利用する場合は、下記URLにあるGoogleのWebサイトから、言語ファイルをダウンロードしておく必要があります。
tesseract-ocr - Google Code(各言語ファイルのダウンロードページ)
http://code.google.com/p/tesseract-ocr/
<機能概要>
OCRエンジンは、Googleが昨年オープンソースとして公開した「Tesseract」を搭載している。シンプルな画面構成で、OCRソフトを利用したことのないユーザーでも手軽に利用できるのが特長。
<使い方>
・書籍をスキャナーから読み込む場合は、象物をスキャナーにセットして[Scan]ボタンをクリックする。
・ダイアログ上で、DPI値を200/300のいずれかに指定して、ダイアログ上の[Scan]ボタンを押す。
・スキャンが完了したら、あとは[Start OCR]ボタンをクリックする。
・文字情報の認識が終わると、画面右側で変換されたテキスト文字列をプレビューできる。
・ここでは範囲選択した文字列を[Ctrl]+[C]キーでクリップボードへコピーできるほか、全文をテキストファイルとして保存することが可能。
−更新情報−
2008年10月 現在 「Softi FreeOCR」v2.4 になっています。
<WEBサービス版 OCR>
コメントを頂いた会社のサービスを紹介します。
WEB上から「OCR」が使用できるサービスは、初めてではないでしょうか。
できたて、ほやほやらしく、私も知りませんでした。
「WEB OCR 協同ネットワークス」となっていましたが、「about US」が準備中のため会社の詳細は2007/8/9(木)現在、不明です。
http://www.web-ocr.net/
「WEB OCR 無料体験版サービスページ」から有料版の機能限定で無料で使用することが可能です。
・下記のサイトからどうぞ。
http://210.189.105.187/free/ 2007年10月現在、理由は不明ですが、利用できない状態になっています。
2008年10月現在、利用可能です。
<関連情報>2007年11月
PDFビューワー「クセロReader ZERO」v1.5.0.4リリース(OCR処理機能を追加)
関連タグ : OCR,
この記事にトラックバックする(FC2ブログユーザー)

