2018年01月09日
紙書類のデータをExcelで分析、OCRソフト「本格読取5」が1,780円!
ソースネクストeSHOPにて、紙の資料をスキャナで取り込みテキストデータ化、Word や Excel で編集することが可能になる「本格読取5」が15日(月)まで1,780円で提供されます。標準価格でも申し分ない精度ですが、半額以下となれば古いOCRソフトのリプレイスにも適当かと思います。肝心のOCRエンジンはパナソニック社製、バージョンアップの度に強化されていて高精度の読み取りが可能にしています。強化された部分は主に約75万語の辞書の方で、誤認識を大幅に減らしています。
この価格で画面上の文字を何でもテキスト化する「瞬間テキスト」、「本格読取 おまかせ名刺管理3」も搭載収録されているので、お得度は高いです。
ここ数年のOCRソフトは表組みや写真レイアウトもそのまま読み込んでくれるので、費用組の場合はExcelに書き出して自動表組作成、通常文書の写真・文字・背景の各領域も直接抽出しWordで編集などということができ、手間がかからなくなりました。
ただ、誤認識など減ったとは言え、背景の上にテキストが載った文書や、シンプルすぎるただの住宅平面図を表と認識したりすることはまだまだあります。これは利用者が注意さえしていれば、さほどのデメリットではないので、気にしなくてもいいかとは思います。
辞書が強化されたことのメリットは、どう見てもつぶれているような文字でも、一部がしっかり読み取れれば高確率で正しいテキストを出してくれます。かすれ文字やアンダーラインの文字認識も向上しています。デジカメ、スマホで撮影したテキストデータでも認識します。特にデジカメでプレゼンのプロジェクター投影画像を斜めに撮影したものに関しても、普通の長方形に補正してから認識しますので、わざわざ画像編集ソフトを介する手間がなくて楽です。あと、傾いた画像を自動補正する機能、手動でノイズ除去、画像回転、トリミング補正をしてから認識させて精度を上げることも可能です。
搭載されている「瞬間テキスト」は単体で購入すると1,980円(上のリンク先)ですので、そのソフト込みの「本格読取5」を購入する方が安くなります。このソフトは、画像や動画に含まれる文字をテキスト化したいとき、画像ベースの PDF からテキストを抽出するときには有効です。
特別収録されている「本格読取 おまかせ名刺管理3」は名刺をスキャナで取り込んで、自動でデータ化、ビジネス住所録を作成するソフトですが、単体で購入すると1,980円(上のリンク先)になりますので、このソフトが必要な方も「本格読取5」を購入する方が安くなります。
個人的に助かっているのはTWAINとは無縁な「ScanSnapからのデータ取り込み」に対応していることで、私のように常用スキャナといえば ScanSnap という者にとってはツボになる機能でした(特に S1100 から読込はストレスを感じません)。もちろん、普通のTWAIN規格対応したスキャナ(もしくは複合機)、例えばキヤノン CanoScan / PIXUS MP、エプソン GT / PM シリーズなどなら問題なく使えます。
Windows 専用ソフトではありますが(対応は Windows7、8.1、10 各32ビット/64ビット版)、数回使うだけでも元は取れてしまいます。受け取った年賀状を読み取って住所録作成の際などにも活用できますね。
タグ:ソースネクスト
この記事へのトラックバックURL
https://fanblogs.jp/tb/7178373
※ブログオーナーが承認したトラックバックのみ表示されます。
※言及リンクのないトラックバックは受信されません。
この記事へのトラックバック