全3022文字

紙に書かれた情報をデータ化するOCR(光学的文字認識)技術が、AIによって進化する。範囲をあらかじめ指定しなくても必要項目を読み取れるようになり、手書き文字にも対応。高い技術を持つスタートアップが次々参入し、使いやすさや認識精度を競っている。

様式の異なる請求書でも、必要な情報を自動的に読み取って整理する
●AI-OCRを使った紙文書のデータ化の概略

 毎週、取引先から何百枚もの紙の請求書が届く。社名や金額、明細など内容に大きな違いはないが、文書の形式は多種多様。社員が1枚ずつ確認し、パソコンに手入力する必要がある──。

 IT活用が叫ばれ、電子メールが普及した今でも、多くの日本企業は紙文書との格闘を続けている。RPA(ロボティック・プロセス・オートメーション)を導入して定型業務を自動化しようと思っても、入力したい情報がデジタル化されていなければ、その前段階で止まってしまう。手書きのサインや押印は、情報システムの大敵だ。