これを書いているヒト

ラベル OCR の投稿を表示しています。 すべての投稿を表示
ラベル OCR の投稿を表示しています。 すべての投稿を表示

2016年10月27日木曜日

これでもFreeだ 識字率高い! Online OCR

photo credit: swanksalot FineReader working via photopin (license)

pdfのカタログをデーターベースに~、という事案発生。せめてtxtファイルで欲しいよ。
と、いうことでOCRにかけます。



Free Online OCR - convert scanned PDF and images to Word, JPEG to Word

中国語、日本語、韓国語を含む46カ国語をサポート







手順 1. 読み込ませたいファイルをアップロード
    2. ファイルに使われている言語と、出力形式をセレクト
  
   コンバート前にキャプチャコード入力
    3. コンバート!

今回罫線入りのデザインだったのでExcelで出力させてみました。
Excelアイコンからファイルをダウンロード




オリジナルが英語だということを差し引いても、なかなかの精度でございます。

オリジナルのPDFカタログ


OCR後のExcelファイル

難点はpdfを1枚1枚アップロードする必要があるくらいかな?
単発の仕事なら十分な機能だと思います。

では、また。


Related Posts Plugin for WordPress, Blogger...