从结构化OCR识别看AI对产业的影响
我认为AI对产业的影响是颠覆性的,将从根本上改变原来的产业流程、产业逻辑。
我最近在搞国家以旧换新的项目。就3C品类而言,政府要求销售企业上传商品外包装上的SN、IMEI_1、IMEI_2信息(SN是商品的唯一标识;IMEI则是国际移动设备识别码,设备能装几个手机卡就有几个IMEI)。那么怎么便捷的帮助末端配送人员准确高效的上传SN等信息,就是摆在我面前的一个重大问题。
根据我当时的知识结构,备选方案有三个:
- 第一是完全人工录入,但效率低易出错,不到万不得已绝不选择此方案;
- 第二,通过扫描外包装图片上的条形码+正则匹配的形式读取信息,如果存在信息没有条形码的则需要人手工补录(不少都存在,所以效率也不高);
- 第三,通过OCR识别来获取信息。这个方案的主要问题点就是OCR得到的文字是非结构化的,需要通过切词来获取SN和IMEI,不可控因素较大。
综上,如果OCR已经进化到可以智能识别结构化数据了,那么OCR才是最佳选择。了解过的人都知道,最开始OCR仅限于特定证件和票据的识别时才能获取结构化的数据,比如身份证、银行卡。但是手机外包装图片是一个标准化程度并非很高的数据,因此获取结构化的结果是有难度的,但万一呢?于是我打开了珍藏多年的阿里云、腾讯云和百度云。
阿里云有两个产品能满足业务的诉求。第一个产品是通用票证抽取,随便上传一张图片,系统会自动抽取其结构化的数据,见图一。第二个产品是OCR文档自学习里面的单证票据信息抽取,通过样本标注+模型训练之后,可针对性的提取图片里的信息,图提介绍见图二。
腾讯云则提供了一个智能结构化识别的产品,和阿里的通用票据抽取本质上是一个东西。
百度也有一个产品叫做智能结构化,但效果感人,请看图四(阿里、腾讯、百度我都是用的同一张图片进行的测试)。
最终,我们公司决定将从阿里的通用票据抽取和腾讯的智能结构化里面进行二选一,来提升末端配送人员录入信息的准确性。
这个例子只是AI在数据采集环节的一个例子,还有数据加工处理、数据推算、智能决策等等。前些年腾讯一直在喊产业互联网,那么下一阶段我认为是AI重构产业链!能用好AI的人才,将会在这一阶段领导行业大步向前。
发布时间:2025年2月23日 21:46
分类:行业思考
标签:
其他
作者:五行缺土
微信扫码接收最新分享:
