节省1000万元人力成本!百度OCR文字识别术,打掉了票据手工录入的“饭碗”

栏目:在线教育  时间:2022-12-05
手机版

  如果电脑或手机有一双“眼睛”,它能将我们看到的文字,自动完成电子版录入,从一定程度上看,确实会提高不少工作效率。OCR就是这样一种技术,它可以将我们看到的各种印刷体文字,经过扫描识别转移到电脑上。如今,它广泛应用于上传财务票据、身份验证、拍照识别等领域。

  10月31日,百度大脑开放日OCR文字识别专场在上海举行。在现场,百度AI技术生态部产品经理详细介绍了百度大脑最新开放能力,百度视觉技术部技术经理韩钧宇深入分享了百度大脑OCR文字识别方向的最新技术与趋势。

  

  OCR文字识别是什么?

  其实,在20世纪早期,国外科学家就提出了,利用技术对文字进行识别的想法。在AI技术研究上,它的出现是最早的。

  据了解,IBM是最早对印刷体汉字识别研究,1966年IBM发表文章称,成功识别了1000个印刷体汉字。

  在外行看来,文字识别有什么难的?但要让计算机“看懂”,这其中有很多深层的技术难题。如,商品上背景复杂的艺术字体;一张字很多的纸,也会影响识别速度;表格、网络图片、街景中的文字如何识别......

  

  半个多世纪过去,技术水平已今非昔比。据百度视觉技术部技术经理韩钧宇介绍,“百度OCR文字识别算法通用中英文字符识别,准确率可达95%以上,支持文档,随拍,网图,街景,商品,手写等常见文字场景;支持中,英,日,韩,法,德,意等20多种语种;还支持云端,嵌入式,私有化等请求部署方式。”

  以前,要完成这些文字识别,可能需要五、六个环节,如今,借助AI深度学习,基于数据系统驱动,就能进行文字识别。

  

  图/百度视觉技术部技术经理韩钧宇

  这里面的主要思路是:将文字检测任务做拟人化的表达,首先,检测出文字初步的区域;其次,做一个精细的四边形;再通过任意多边形的表达,从而实现精细的文字区域检测。

  OCR文字识别可以用来做什么?

  那么,OCR技术能在什么行业应用呢?

  据了解,目前,它的行业应用还集中于财税票据,身份验证、审核、教育、保险、交通和拍照翻译场景等。

  

  设想一个场景,当你在给孩子辅导作业,遇到棘手的难题,不再需要打字,而是将题目拍下来,就能搜出题目所对应的答案,是多么省时的一件事,而这正是运用了OCR技术。

  另外,在交通监管上,OCR技术也起了不小的作用。以系安全带为例,现在的计算机视觉识别系统7×24小时都在工作,当计算机发现违法行为,立即就能识别车牌加车型,并自动记录。

  

  据百度视觉技术部技术经理韩钧宇介绍, 未来,OCR技术的行业应用趋势将向综合方案和定制平台两个方向发展。

  教育、医疗、交通、财税等场景,都已实现通用化的综合解决方案,而iOCR自定义模板文字识别和垂类OCR模型训练平台等定制平台,将针对更丰富的客户需求满足个性定制。

  AI在保险行业大有前景

  此次专场,百度大脑还请来了其重要合作伙伴华夏保险公司上海分公司。

  

  图/华夏保险上海分公司新技术应用处经理於维佳

  众所周知,由于保险行业的特殊性使然,上传票据报销的环节,手工录入往往繁琐且效率低。在运用百度OCR技术后,避免了手工录入发票信息出错率高、效率低等行业痛点;同时还能节约成本、提升财务报销业务流程效率,年节省人力等成本核算达到约1000万元。

  据华夏保险上海分公司总经理万斌先生表示,“其实AI技术在保险行业的应用还属于初级阶段,未来还有很大的想象空间,华夏保险与百度大脑合作开发票据系统算是个很好的尝试。”

  

  图/华夏保险上海分公司总经理万斌

  据了解,华夏保险上海分公司基于百度大脑OCR技术开发并部署“智能票据识别系统”后,在公司“双创评选”中脱颖而出,得到了公司总部的认可,并通过内部交易市场将上海分公司的这一技术买断,并推广至全国各分公司。

  在万斌先生看来,截至目前,人工智能在保险行业的应用,都是零散的碎片化尝试。未来,或许会有整套的人工智能解决方案应用于保险行业。

  AI的发展,让不同行业逐步走上了智能化升级之路,保险行业只是其中之一,可以预见百度大脑的OCR技术仍大有可为之处。

上一篇:东营市2016年度“十佳美德少年”事迹简介
下一篇:网络写手一天码上万字 根据订阅量与网站分成

最近更新在线教育