ScanSnap S1500のテキスト認識した場合としない場合のファイルサイズの比較をしてみました。 #scansnap

Twitterで問い合わせを受けたScanSnap S1500でテキスト認識した場合としなかった場合のファイルサイズの比較をしてみました。

ScanSnap Manager上で検索可能なPDFにしますにチェックを入れると、OCR機能が働きPDFに読み取られた文字がテキスト情報として埋めこまれます

Test_r

テキスト認識させたPDFファイルの方は下のようにカーソルで文字を選ぶことが出来、テキストが埋めこまれている事が分かります。

Test2_r

テキスト認識させたところを一部コピーしてみると

平成15年8月31日(日)までに新編規に「フレッツ"ADSLモアⅡ(24Mタイププ))」 『マ可 111 お申し込みいただくと、ご利用|龍開始から最大3カ月間、月額龍利用|龍料、 /deIl/ ADSLモデム・スブリッ夕タのレンタル料が無料でご利用いただけますb

正直なところ認識精度は決して高くないですが、キーワード検索とかにならそれなりに使えるという感じですね。

 

ファイルサイズは、テキスト認識しなかった場合は413KBで、テキスト認識した場合は417KBとほんのちょっとファイルサイズが大きくなっただけでした。

Test3

日本語1文字分が2B(バイト)なんで、文字が数百、数千文字あってもファイルサイズはそんなに大きくならないのでしょうね

 

それぞれのファイルをアップしましたので、気になる方はご自分で比較してみてください。 

「テキスト認識したPDFファイル」をダウンロード

テキスト認識しなかったPDFファイル」をダウンロード

 

僕はどうせかうなら、圧倒的にスピードが速いS1500をオススメします

S1300はちょっと中途半端な感じがしちゃうのですよね

もしくは1枚づつしかスキャン出来ませんが、コンパクトで持ち歩きも出来るし、USBからの電力だけで駆動出来るS1100

ちなみに僕はS1500とS1100の2台を持っています。

前へ

WiMAXの新しいモバイルルーターURoad-8000を数日間使ってみた感じのまとめとWM3500Rとの比較 #uqwimax

次へ

WiMAXの感度が劇的に向上するという「インテル® PROSet/Wireless WiMAX接続ユーティリティー ver6.5のインストール方法 #uqwimax