実運用レベル認識率99.3%(数字)を達成

  弊社のホームページ上で公開しております「リモートデモ」で、実際にお客様に記入して頂いたデータの認識率を集計したところ、FAX-OCRという悪条件にも関わらず、エントリーエース補正レベル7での数字のみフィールドにて99.3%という、OCRメーカーの公表値に肉薄する結果を得ることができました。

  通常「認識率」といえば、メーカーがOCRの性能が最大に発揮できる状態での性能評価を示す値であり、実際の運用レベルでは、その状態を維持することが困難であり認識率は大幅に低下します。

認識テスト方法の違い

 

一般のOCRメーカーテスト

弊社のテスト

記入者


メーカの社員または、依頼された人



弊社のホームページをご覧になった一般の方々


文字の書き方


メーカー独自の文字の書き方を熟知



ほとんどの方々がOCR特有の文字の書き方を知らないと思われる


読込み解像度


300×300DPI以上



200×100DPI(一部200×200DPI)


OCR用紙を取り込んだデータの質
(汚れ)


きちんとメンテナンスされたスキャナを用いるので、汚れなどの混入はない



FAX機器の汚れなどにより、多少の汚れが混入している。汚れにより、未記入フィールドに何らかの文字が変換された場合も誤認識とする


OCR用紙を取り込んだデータの質
(傾き)


正しい操作で取込まれるため発生しない



多少傾いているものが多い


OCR用紙を取り込んだデータの質
(縮尺・位置ズレ)


スキャナの精度が高いので、原寸で取込まれる。また、位置のズレはない



ほとんどのものが、縦方向に縮んでいる。また、位置もランダムにズレている


マッチングエラー


事実上発生しない。仮に発生した場合はテストから除外



発生した場合は、記入された文字すべてを誤認識したものとする


<注意>
  弊社でのリモートデモデータからは、正しく読まないことを期待し意識的に崩した文字や、数字しか読めないフィールドに数字以外の文字を記載したデータは除外し、OCRの知識のない担当者が、文字枠の中に丁寧に書いてあるもののみを抽出しました。また、明らかに送信ミスで、用紙データが切れているもの等も除外してあります。


高認識の理由、メディアドライブ社製OCR+独自補正機能

  エントリーエースが非常に高い認識率を実現した理由は、OCRエンジンに日本一の認識率を誇るメディアドライブ社製OCRエンジンを採用している事が最大の理由ではありますが、実運用レベル特にFAX-OCRでは、OCRエンジンの性能を出し切る事は不可能であり、同様にメディアドライブ社製OCRエンジンを採用したFAX-OCRシステムでも、メーカー間で認識率は大幅に異なります。

  エントリーエースでは、独自のイメージ補正機能により、OCRエンジンの性能を最大限に発揮させる事に成功しました。

  このイメージ補正機能は認識率と大きな関係があり、同じ入力データを用い補正レベルを変化させた場合に認識率は大きく変化します。

 
マッチングエラー数

  弊社リモートデモシステムをご利用になられたお客様からお送り頂いたデータを、エントリーエース最新補正機能のレベル毎にOCR処理を行い、OCR処理できなかった用紙の枚数です。

  他社製FAX-OCR製品の多くはエントリーエースの補正レベル0〜3に相当します。(弊社調べ)

補正レベルと認識精度

  弊社リモートデモシステムをご利用になられたお客様からお送り頂いたデータを、エントリーエース最新補正機能のレベル毎にOCR処理を行い、誤認識された文字数です。

  他社製FAX-OCR製品の多くはエントリーエースの補正レベル0〜3に相当します(弊社調べ)ので、ご利用頻度の高い数字の誤認識文字修正量は、半分以下になる事が期待できます。

    <ご注意>
  • マッチングエラーが発生した用紙は、すべての文字を誤認識したものとして扱っています。
  • 弊社リモートデモシステムの特性上、お客様が正常に読めないケースの確認を行ったと思われる文字は除外し、人目で判断できる文字のみを対象としています。

  • (枠からはみ出た文字や、乱筆文字も対象となっております)

 

 


株式会社エー・シー・イー