これを書いているヒト

2016年10月27日木曜日

これでもFreeだ 識字率高い! Online OCR

photo credit: swanksalot FineReader working via photopin (license)

pdfのカタログをデーターベースに~、という事案発生。せめてtxtファイルで欲しいよ。
と、いうことでOCRにかけます。



Free Online OCR - convert scanned PDF and images to Word, JPEG to Word

中国語、日本語、韓国語を含む46カ国語をサポート







手順 1. 読み込ませたいファイルをアップロード
    2. ファイルに使われている言語と、出力形式をセレクト
  
   コンバート前にキャプチャコード入力
    3. コンバート!

今回罫線入りのデザインだったのでExcelで出力させてみました。
Excelアイコンからファイルをダウンロード




オリジナルが英語だということを差し引いても、なかなかの精度でございます。

オリジナルのPDFカタログ


OCR後のExcelファイル

難点はpdfを1枚1枚アップロードする必要があるくらいかな?
単発の仕事なら十分な機能だと思います。

では、また。


0 コメント :

コメントを投稿

Related Posts Plugin for WordPress, Blogger...