GPT-4を活用し、AI-OCR「DEEP READ」に機能追加
GPT-4を活用し、AI-OCR「DEEP READ」に機能追加
~あらゆる種類の書類から必要な情報をAIが自動抽出、企業のDXを推進~
株式会社 EduLab
株式会社EduLab(エデュラボ、本社:東京都渋谷区、代表取締役社長兼CEO:廣實 学、以下「EduLab」)は、手書き文字の読み取りも可能なOCRサービス「DEEP READ」(AI-OCR)において、GPT-4を組み合わせた機能を追加したことをお知らせいたします。
GPT-4と独自の文字認識技術を組み合わせ、書類管理のDXを推進
当社グループは、高精度文字認識(OCR)サービス「DEEP READ」を、2018年1月より提供しております。「DEEP READ」では、AIを活用することにより、従来型のOCRの課題であった手書き文字も高精度で認識することが可能です。
これまで、保険・金融業界やBPO事業者、学校法人など、様々な企業・団体様に、書類管理業務のDXの一環としてご活用いただいております。
この度、当社独自のAI文字認識技術に加え、「Chat GPT」にも搭載されるAIの大規模言語モデル「GPT-4」を組み合わせた新機能を「DEEP READ」に追加いたしました。
主な改善点として、①キーワードを指定するとAIが情報を自動抽出すること、また②あらゆる種類の書類に対応することが挙げられます。なお、日本マイクロソフト社の「Azure OpenAI Service」を活用することで、高度なセキュリティでデータを保護いたします。
改善点① AIが書類の意味を理解し、必要なデータを自動で抽出
これまで当社が提供してきたAI-OCR技術では、活字や手書きの書類を瞬時にデジタル化することは可能であるものの、フォーマットの決まっていない非定型書類の場合、読み取ったデータから必要な情報を検索し、抽出する作業はお客様に行っていただく必要がありました。
「DEEP READ」の新機能では、「GPT-4」の強みを活かすことで、書類に書かれた文字の意味をAIが理解します。これにより、最初にキーワードを指定すると、読み取ったデータの中から必要な情報を自動で抽出することが可能となりました。
また、AIが文書中の言葉の意味を理解することで、表記の揺れなどにも対応。例えば、契約書や請求書等の書類から「金額」に関するデータを抽出したい場合、書類に「金額」と明記されていなくても、AIが該当する記載を自動で抽出するほか、「名前」と「氏名」、「所在地」と「住所」など、書類によって項目名が異なる場合でも、AIが自動で判別して必要なデータを抽出・登録します。
改善点② 従来のOCRでは読み取りが難しかった種類の書類にも対応
多くの企業様がOCRで読み取る書類には、書類のフォーマットが予め定まっている「定型帳票」と、個社ごとや案件ごとにフォーマットが異なる「非定型帳票」があり、このうち、フォーマットが定まっていない非定型帳票に対する柔軟な対応が課題となっていました。
また、たとえば経理業務における請求書や注文書のデジタル化といった、特定の業務の効率化に特化したOCRは存在するものの、様々な業務で汎用的に活用できるOCRは多くありませんでした。
こうした課題に応え、AI-OCR「DEEP READ」では、業務内容や書類の種類を問わず、あらゆる書類のデジタル化が可能となりました。
会社独自の業務帳票など、従来のOCRでは読み取りが難しい書類の取り扱いが多く、デジタル化を諦めていた企業様にも広くご利用いただけるようになります。
なお、これまで「DEEP READ」で提供してきたOCR機能が基盤となるため、活字だけではなく、手書きの書類や、活字と手書きが混ざった書類でも、瞬時にデジタル化します。
Azure OpenAI Serviceの活用で、高度なセキュリティを確保
契約書などの機密情報を読み取る際には、情報漏洩につながる可能性がある等、セキュリティ上の懸念が指摘されますが、当社グループでは、日本マイクロソフト社が提供する「Azure OpenAI Service」のAPIを活用することで、顧客のデータを高度なセキュリティで保護いたします。
詳細については、こちらの お問合せフォーム よりお問合せください。
業績への影響について
本件による今期業績に与える影響は、現時点では軽微であると見込んでおります。今後、業績への重大な影響が認められる場合には速やかにお知らせいたします。
DEEP READについて
DEEP READはディープラーニングに基づくAI(人工知能)を活用した、AI-OCRサービスで、活字のみならず手書き文字も瞬時にデジタル化することが可能です。業務効率化やデータベースの有効活用といった観点から、紙データのデジタル化に対する需要は年々拡大している一方で、従来型の「OCR(光学的文字認識)」技術では、活字についてはデジタル化できるものの、手書き文字の認識精度は低いという課題がありました。DEEP READは研究開発を経て、業界トップレベルとなる9割以上の精度でのデジタル化を可能にし、金融業界などの企業や医療機関、学校法人などに幅広くご活用いただいています。
サービスの詳細はこちら: https://www.edulab-inc.com/deepread/jp
株式会社EduLabについて
EdTech(教育×テクノロジー)分野における新事業の開発・投資、教育ITソリューション・プラットフォームの提供、次世代教育の支援、スクールマネジメントなど、最新のラーニングサイエンスをベースに次世代の教育ソリューションを実現します。