photo credit: swanksalot FineReader working via photopin (license) |
pdfのカタログをデーターベースに~、という事案発生。せめてtxtファイルで欲しいよ。
と、いうことでOCRにかけます。
中国語、日本語、韓国語を含む46カ国語をサポート
手順 1. 読み込ませたいファイルをアップロード
2. ファイルに使われている言語と、出力形式をセレクト
コンバート前にキャプチャコード入力
3. コンバート!
今回罫線入りのデザインだったのでExcelで出力させてみました。
Excelアイコンからファイルをダウンロード
オリジナルが英語だということを差し引いても、なかなかの精度でございます。
オリジナルのPDFカタログ |
OCR後のExcelファイル |
難点はpdfを1枚1枚アップロードする必要があるくらいかな?
単発の仕事なら十分な機能だと思います。
では、また。
0 コメント :
コメントを投稿