AI-OCR「DEEP READ」から全文検索型の非定型認識サービスの一般向けAPI提供開始
AI-OCR「DEEP READ」から全文検索型の非定型認識サービスの一般向けAPI提供開始
株式会社 EduLab
株式会社EduLab(エデュラボ、本社:東京都渋谷区、代表取締役社長兼CEO:廣實 学、以下「EduLab」)は、2018年1月18日に提供を開始したAIを活用した手書き文字データ化サービス「DEEP READ」(AI-OCR)において、全文検索型の非定型認識サービスの一般向けAPI提供を開始することをお知らせいたします。
取り組みの背景
EduLabが2018年1月18日に提供を開始した「DEEP READ」は、AIを利用することで従来型のOCRの課題であった手書き文字を高精度で認識することができるようになりました。ただし、「DEEP READ」が認識できる帳票は主に申込書などの定型帳票(※)に限られ、発行者ごとにフォーマットが異なる領収書のような非定型帳票(※)の認識は個別対応という課題がありました。
定型帳票の認識では、文書毎に事前にテンプレートとして設定された読取範囲の文字を認識します。そのため、文書中のどこに文字が記載されているか決まっていない非定型帳票の認識は利用者様ごとに対応が必要でした。しかし、世の中には同じ帳票種類であっても作成者ごとに異なるような非定型帳票が多く存在します。このため非定型帳票の汎用的な認識サービスの展開は、文字のデータ化サービスを提供するAI-OCRベンダーとして喫緊の課題であると認識しております。
この課題を解決するために、EduLabでは非定型文字認識エンジンの開発を進めてまいりました。途中、「DEEP READ」では2020年にオリックス生命保険株式会社様において「給付金請求ウェブサービス」の導入、同年末には個別対応を前提とした非定型帳票の認識機能の追加等を実施してまいりましたが、この度、非定型帳票の認識に対応した全文検索型の非定型帳票認識サービスの一般向けAPI提供を開始することになりました。
(※)定型帳票:各項目の記載個所(座標)が決まっている帳票、非定型帳票:各項目の記載個所が決まっていない帳票
取り組みの概要
「DEEP READ」の全文検索型の非定型帳票認識サービスでは、定型帳票の認識に必要な事前のテンプレート設定なしに対象文書の認識をすることで、文書中の文字列を自動で判断し、全ての文字列とその座標を出力することができます。結果として、文書中の全ての文字列をデータ化しておくことが可能となります。また、認識結果の全ての文字列から必要な文字列を抽出する処理を行うことで、文書に記載されている内容から業務に必要な文字列のみをデータ化することができるようになります。
このサービスを利用することにより、文書中の記載内容の人手による入力が不要になり、利用者は認識結果の確認・修正及び必要なデータの抽出に集中できるようになります。ひいては業務の効率化、作業負荷の削減が可能になります。
「DEEP READ」の全文検索型の非定型帳票認識サービスはAPIでの提供となり、認識結果はJSON形式で出力されます。このため当面はJSONのデータ処理に詳しいシステム開発者等のプロフェッショナルユースを見込んでおります。
EduLabグループでは、今後も非定型文字認識エンジンの開発を進め、より一層社会のニーズに合う機能の充実を図ってまいります。
販売価格については、担当の営業員、またはこちらの お問合せフォーム よりお問合せください。
DEEP READについて
DEEP READはディープラーニングに基づくAI(人工知能)を活用した、AI-OCRサービスで、活字のみならず手書き文字も瞬時にデジタル化することが可能です。業務効率化やデータベースの有効活用といった観点から、紙データのデジタル化に対する需要は年々拡大している一方で、従来型の「OCR(光学的文字認識)」技術では、活字についてはデジタル化できるものの、手書き文字の認識精度は低いという課題がありました。DEEP READは研究開発を経て、業界トップレベルとなる9割以上の精度でのデジタル化を可能にし、金融業界などの企業や医療機関、学校法人などに幅広くご活用いただいています。
サービスの詳細はこちら:https://www.edulab-inc.com/deepread/jp/
株式会社EduLabについて
EdTech(教育×テクノロジー)分野における新事業の開発・投資、教育ITソリューション・プラットフォームの提供、次世代教育の支援、スクールマネジメントなど、最新のラーニングサイエンスをベースに次世代の教育ソリューションを実現します。東京、シアトル、ボストン、ニューヨーク、ダブリン、シンガポール、香港、北京、上海、プネ等を拠点として展開しています。