これを書いているヒト

2016年10月27日木曜日

これでもFreeだ 識字率高い! Online OCR

photo credit: swanksalot FineReader working via photopin (license)

pdfのカタログをデーターベースに~、という事案発生。せめてtxtファイルで欲しいよ。
と、いうことでOCRにかけます。



Free Online OCR - convert scanned PDF and images to Word, JPEG to Word

中国語、日本語、韓国語を含む46カ国語をサポート







手順 1. 読み込ませたいファイルをアップロード
    2. ファイルに使われている言語と、出力形式をセレクト
  
   コンバート前にキャプチャコード入力
    3. コンバート!

今回罫線入りのデザインだったのでExcelで出力させてみました。
Excelアイコンからファイルをダウンロード




オリジナルが英語だということを差し引いても、なかなかの精度でございます。

オリジナルのPDFカタログ


OCR後のExcelファイル

難点はpdfを1枚1枚アップロードする必要があるくらいかな?
単発の仕事なら十分な機能だと思います。

では、また。


2016年10月25日火曜日

【ODBC Driver Manager】 指定されたDSNには、ドライバーとアプリケーションとのアーキテクチャの不一致が含まれています...を解消する



64bitのWindows7にODBCドライバ入れて、MySQLとつなごうとしたらエラーが起きたそうな。
ふつう「ドライバ」ときたらOSにあわせるのが基本だが、このケースはアプリケーション側に照準をあわせる。
32bitで動かすアプリケーションなら、ODBC側も32bitドライバでなければ「アーキテクチャの不一致」エラーを起こす。


64bit OS上でODBCの32bitドライバを通す方法は、下記に詳しい
ODBC 接続のアプリケーション実行時にエラーが発生する - Windows - Project Group







泣きつかれて「ああ、案外知られてないんだな」と思ったので、書き残しておく。

では、また。
Related Posts Plugin for WordPress, Blogger...