AIOCR自动开发平台能做什么?实现过程及优势浅析

先说说什么是OCR文字识别?

OCR(optical character recognition)文字识别是指对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。

AIOCR自动开发平台能做什么?实现过程及优势浅析

在模版开发、优化和服务上线过程中,传统OCR识别技术需要大量人工优化操作,目前通过AIOCR自动学习平台,可以很好降低日常人工开发耗时的步骤,支持自动执行,以提高开发效率,OCR识别效率。

图片标签数据自动生成:

模版开发后,如果需要追加评估或者训练数据,通过打开自动标注选项,平台会为这些图片自动生成标注数据,以加快后续标注数据纠正、审核的过程。

模型优化数据自动增强:

图片数据完成标注后进行模型优化,平台自动基于训练数据进行增强操作,从灰度处理、角度旋转、长宽调整、随机虚化、透视变换、随机切割、Gamma调整等,以提供模型的鲁棒性。

模型训练过程自动完成:

模型训练过程全自动,包括训练、验证和测试集分配、数据动态变换、优化参数自动调整等,以获取最好的收敛效率和效果。

模型评估报告自动生成:

训练完成后,自动对测试数据进行预测、生成详尽的评估报告,并在图形界面展现出来。

图片表格区域自动探测:

被预测图片中表格的行数是变化的,平台提供自动探测表格区域,以保证对表格区域的精准预测并格式化输出;一张预测图片中可以有多个表格区域。

AIOCR自动开发平台能做什么?实现过程及优势浅析_第1张图片

AIOCR自动开发平台

内容字段配对自动识别:

内容字段与定位字段的智能匹配是影响输出效果的关键,除了精确匹配之外,平台还支持了多种智能模糊匹配策略,以确保在定位字段字迹模糊情况下能配对正确。

模型服务发布一键触发:

当模型达到上线要求,只需要点击1次鼠标,就可以完成模型上线,提供对外服务的能力。

模型后置处理代码自动调用:

平台提供模型预测后处理规则开发的用户交互界面(Python语言开发环境),在对新图片预测后,自动调用该后置处理代码,来优化最终预测输出结果。

AIOCR自动开发平台能做什么?实现过程及优势浅析_第2张图片

模型服务对外通过RESTFul API进行调用,并提供各种语言调用模型服务的示例代码

AIOCR自动学习平台支持场景广,可以识别多行业的表票单据,工程文档,文本文字内容如:

金融业

银行回单、承兑汇票、对账单、银行流水、贷记凭证、结算业务委托、进账单、税单、支票、特种转账借方凭证、保单、审批单、授权书。

政府、制造业、物流业

采购订单、入/出库单、报关单、运输单、付款申请单、日常工作审核表、产品表面文字识别、工程图纸。

医疗业:

体检报告、各类检验报告、住院清单。

积累的OCR模型开发经验,同时平台提供模型的持续优化能力:

财务报销全票种模型服务

各类卡、证影像模型服务

财务三类报表的模型服务

医疗报销发票的模型服务

医疗住院清单的模型服务

文档、合同对比模型服务

各政府公文识别模型服务

文档全文识别的模型服务

各类文档、票据定制开发

技术支持:可沟通了解项目及其适用的解决方案

你可能感兴趣的