今週のキーワード

「AI OCR」はOCRと何が違う? 認識率が向上する仕組みとは

2022/08/23 09:00

週刊BCN 2022年08月22日vol.1935掲載

 AIを活用したOCR (Optical Character Recognition)。画像やPDFデータなどからテキストを抽出、認識し、デジタルデータへの変換を行うOCRとAIを組み合わせた技術で、文字認識や認識範囲特定の精度向上を図ることができ、業務の効率化が期待できる。RPAとの相性もよく、連携することでデータの読み取り、変換から入力までの一元的な実行にも対応する。


 AI OCRとOCRの違いは、文字通りAI技術の搭載の有無にある。OCRのデータ変換では、文字がどのような線で構成されているかを見つけ出し、特徴と合う文字を探す作業が内部で行われている。そのため、規定のパターンでしか文字が識別できなかった。一方、AI OCRでは既存のロジックに加えて、機械学習やディープラーニングによって文字の補正結果を学習させ、その反復で認識率を向上させている。この特性を生かし、他の言語や業界用語、手書き文字への対応もできるという。

 文字認識のほかにも、読み取りの位置や項目の自動抽出まで行うことができ、事前の設計や定義という作業が不要となる。AIによる精度向上を受け、OCR市場は急速に拡大している。SaaS型を中心に、さまざまなベンダーがAI OCRを取り入れたソリューションを提供しており、競争が激化する中で、さらなる機能強化が期待される。
(大向琴音)
  • 1