1. 活用深度学习人工智能(AI)技术 实现地址、人名等手写多文字(日语)93.5%的高识别率
  1. 活用深度学习人工智能(AI)技术 实现地址、人名等手写多文字(日语)93.5%的高识别率

活用深度学习人工智能(AI)技术 实现地址、人名等手写多文字(日语)93.5%的高识别率

活用深度学习人工智能(AI)技术 实现地址、人名等手写多文字(日语)93.5%的高识别率

2017年9月6日
EduLab有限公司

开展Edtech(教育科技)项目的有限公司EduLab(总部位于东京都港区,公司总裁兼CEO为高村淳一,以下简称EduLab集团),于2015年开始展开以深度学习技术为基础的手写文字识别技术的研发项目,至2016年6月手写文字(日语)的识别率达到业界最高水平,实现98.66%的文字识别率。当时,可识别文字仅限写在文字栏内的手写单字(日语)。即这一成果之后,开发工作持续进行,在更接近实际的解答用纸中实现对无文字栏的住所、姓名等手写多文字的识别率达到93.5%。(识别率指,与人工读取结果一致的比率。检证精准度的对象数据约35000件。)

图1:单字与多字的读取示意图

图1:单字与多字的读取示意图

研发背景

随着日本教育领域对课题解决力度的重视,入学考试、国家及各地区的学习水平调查、各种能力水平考试等各类考试中记述类的解答方式也在加速增多。由于记述类的问题需要人工评分,评分花费的时间、评分费用的增大是面临的一个大问题。
在这样的背景下,我公司开始了以提高评分效率为目标的手写文字数据化的检讨。答题卡上书写的内容通过人工的输入转化为数据很难大幅度缩短时间。另外,利用以往的OCR(Optical character recognition:光学文字识别)技术,扫描答题卡将其内容数据化,不光存在输入栏的制约,同时无法识别的比率也经常发生,考试评分的精准度很难得到确保。
因此本公司,运用以深层学习为基础的人工智能技术开始了对高精准度手写文字识别技术的研究与开发,并于2016年在手写单字(日语)方面实现98.66%的识别率。
http://edulab-inc.com/press-release/20160706.html

多文字识别技术的特征

2016年时,手写单子识别技术存在以下几个问题。
单个文字读取的精准度很高,但部首,偏旁等多个结构组合在一起成为一个汉字是日语的一个特性,在此基础上多字的识别精准度就变的很低。在识别多文字时,经常出现错误的将一个文字分解进行识别的现象。

图2:多文字识别的错误识别示意图

图2:多文字识别的错误识别示意图

由此,我们开始研讨能够像人工阅读汉字一样可以同时读入多个汉字,统一显示结果数据的方法,并成功开发能够正确识别多文字的新型手写文字识别技术。同时,通过新技术,改善了对多文字的逐一准确分解识别的过程。

图3:现在的多文字识别

图3:现在的多文字识别

开发中,我们收集大量日语的地址、姓名、单词等手写多文字的数据,利用人工智能(AI)技术进行研究的结果,手字多文字的地址识别精准度达到93.5%。(识别率指,与人工读取结果一致的比率。检证精准度的对象数据约35000件。)
以下是手字地址数据和文字识别结果的例子示意图。下例中的多文字地址数据被准确无误地识别出来(文字识别精准度100%)。

图4:手写地址数据和利用本公司文字识别技术的识别结果示意图

图4:手写地址数据和利用本公司文字识别技术的识别结果示意图

今后的计划

此项技术不仅仅适用于地址,在人名、一般文件、业界特殊化文件等方面也可适用。因此,通过数据收集以及对人工智能(AI)的反复研习,之后将继续进行实验、开发。此外,计划利用云端技术将其软件化,希望将来能为有需要的各个领域团队提供能够轻松运用的环境。

图5:云端软件画面示意图

图5:云端软件画面示意图

为使手字文字识别技术的精准度得到提升,我公司将继续以深度学习为基础进行研发。此外,为实现手写考试解答内容文本数据化之后的自动评分技术,以及评分和评分过程的效率化、自动化,我们将推进以人工智能(AI)技术为基础的研发。

关于EduLab有限公司

EduLab集团致力于Edtech领域的新型业务开发、投资,教育行业信息技术解决方案的提供,下一代教育的支援,学校管理等,并以最新的教育科技为基础,解决下一代的教育中存在的问题。EduLab集团在东京、西雅图、新加坡、香港、北京、上海、班加罗尔、浦那等地设有办事处。