CN109325557B

CN109325557B - 基于计算机视觉图像识别的数据智能采集方法

Info

Publication number: CN109325557B
Application number: CN201811051032.9A
Authority: CN
Inventors: 张海峰; 张勇
Original assignee: Sichuan Zhenghu Wisdom Technology Co Ltd
Current assignee: Sichuan Zhenghu Wisdom Technology Co Ltd
Priority date: 2018-09-10
Filing date: 2018-09-10
Publication date: 2019-07-16
Anticipated expiration: 2038-09-10
Also published as: CN109325557A

Abstract

本发明公开基于计算机视觉图像识别的数据智能采集方法，包括：S1、将业务记录内容分类，选取数值类和判断类；S2、设定判断类定义规则，并将其与位置信息保存在数据库中；设定数值类定义规则，并将其与位置信息保存在数据库中；将每个产品的唯一标识符和标识符区域的位置信息保存在数据中；S3、在判断类的标记区域、数值类的标记区域标记结果，在标识符的标记区域内标记标识符；S4、实时图像采集，并记录图像采集时间点；S5、对图像中的业务记录内容和结果进行AI识别；S6、将标记结果转换为业务数据。本发明颠覆传统行业数据采集的思维模式，增强企业数字化管理能力，赋能传统行业，加快其转型升级，加速人工智能实用化进程。

Description

基于计算机视觉图像识别的数据智能采集方法

技术领域

本发明属于计算机软件领域，具体涉及基于计算机视觉图像识别的数据智能采集方法。

背景技术

文字识别技术：光学字符识别(OCR)是针对印刷体字符，采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件，并通过识别软件将图像中的文字转换成文本格式，供文字处理软件进一步编辑加工的技术。该项技术主要用于印刷体纸质文档扫描(例如扫描仪或数码相机)识别转化为计算机文字和手写体文字识别，其中手写体文字识别应用于手机、平板和手写板上实时识别。技术缺陷如下：

工商、生产制造型企业在生产现场管理过程中存在大量数据需要手工进行记录，不同岗位有固定格式的数据记录纸质文档，采用传统的OCR文字识别的方式自动抓取文字并转化为业务数据方面，存在拒识率、误识率高等问题。由于识别准确率不高，导致该项技术无法在企业生产经营中得到广泛应用，其主要原因如下：

第一、相同格式的纸质文档记录工具不同，造成文字线条粗细、颜色不同、字迹深浅都存在差异，造成识别率较低；

第二、不同工作人员的书写习惯不一致，导致记录文字规整、潦草程度不一致，造成文字无法识别；

第三、针对同一格式的纸质文档，不同人员不同时间点，记录的起始位置不同，传统的文字识别技术无法辨别记录发生变化的时间点和内容，造成无法准确记录业务发生的时间和该时间段记录的业务数据。

发明内容

为了解决现有技术存在的上述问题，本发明目的在于提供基于计算机视觉图像识别的数据智能采集方法。本发明的智能数据采集方法应用于农牧业、工商企业生产现场原始数据的计算机视觉图像识别自动采集，按照业务规则自动抓取图像指定区域标记颜色涂抹，再通过标识预定义规则转换为相应的业务数据，并将清理、转换后的业务数据通过接口的方式与企业内外部系统进行对接。

本发明所采用的技术方案为：

利用计算机视觉处理技术，通过携带高清摄像头的设备(手机、Pad等)，实时抓取生产现场按照业务规则预制的纸质或其他材质记录卡上二维码、条码和标记结果(勾选或涂抹)的图片，利用图像识别算法和深度学习技术标记并识别二维码、条码、勾选或涂抹区域，再按照记录卡区域与业务结果对应关系的预定义规则，结合图像抓取时间(自定义采集时间频次、间隔)，将勾选或涂抹位置转换为业务数据，系统再依据业务逻辑对数据进行效验后自动进入管理系统或对外进行结果输出。记录数据可以通过手机、Pad或Web端实时查询业务数据。

基于计算机视觉图像识别的数据智能采集方法，包括如下步骤：

S1、梳理业务记录内容，将业务记录内容按标识符、数值类、判断类和字符类进行分类，选取数值类和判断类；

S2、将判断类的标记区域划分为多个空白格子，定义每个格子所代表的内容，即判断类定义规则，并将其与第一位置信息保存在数据库中；

数值类的标记区域划分多个空白格子，依据数值结果范围，设计满足数值的不同量级数字组合方式，并按照量级规则排列在各空白格子内，即数值类定义规则，并将其与第二位置信息保存在数据库中；

将每个产品的唯一标识符和标识符区域的第三位置信息保存在数据中；

S3、在判断类的标记区域的空白格子标记结果；在数值类的标记区域的数字标记结果；在标识符的标记区域内标记标识符；

S4、通过现场固定或者移动的图像采集设备对记录卡进行实时图像采集，并记录图像采集时间点；

S5、对图像中的业务记录内容和结果进行AI识别；

S6、将标记结果转换为业务数据。

具体地，所述标识符包括二维码和条码的一种或两种。

进一步地，所述步骤S2中，所述第一位置信息包括判断类的标记区域在记录卡中的位置信息和各空白格子在记录卡中的位置信息；所述第二位置信息包括数值类的标记区域在记录卡中的位置信息和各数字在记录卡中的位置信息；所述第三位置信息包括标识符区域的在记录卡中的位置信息。

再进一步地，所述步骤S3中，在判断类的标记区域标记的方式为涂抹或勾选；在数值类的标记区域标记的方式为通过预定的计算规则涂抹或勾选单个或多个数字；在标识符的标记区域内标记的方式为粘贴。

将业务记录内容和结果转换为计算机能够自动处理的格式。

再进一步地，所述图像采集设备包括摄像设备和智能移动终端的一种或两种。

在图像采集过程中，图像采集的范围需覆盖整张记录卡，具体通过如下方式实现：

在记录卡的四个边角还设有界定符号，在图像采集过程中，图像采集设备覆盖该四个界定符号时，则表示覆盖整张记录卡。

再进一步地，所述步骤S5的具体实现方式包括：

S51、通过四个界定符号来判断有效区域和方向，对图像中的记录卡有效区域和方向进行定位；

S52、在记录卡中查找标记结果并通过AI系统识别标记结果，先进行阴影识别，然后与保存在数据库中的位置信息匹配。

再进一步地，图像采集过程中，每抓取一次并识别后自动与前一次的识别结果进行对比，差异部分作为新增内容进行提交。

再进一步地，所述步骤S6的具体实现方式包括：将所有标记结果从图像采集时间点和标记位置两个维度的信息叠加进行业务数据转换，结合数据库中保存的判断类定义规则、数值类定义规则和标识符，将标记结果转换为业务数据。

数据智能采集方法包括步骤：AI系统通过API接口提交业务数据至业务管理系统。工作人员、管理人员可实时查询数据，并对数据二次复核确保完全无误。

AI系统将业务数据通过API接口传递给企业业务管理系统前，对业务数据的合理性、准确性、错误数据等问题进行检查，如果存在涂抹不规范、错误或遮挡等情况，AI系统自动报警，提示业务人员及时更正，如果正确无误，AI系统将数据上传至服务器。

本发明的有益效果为：

本发明颠覆传统行业数据采集的思维模式，打破传统数字、字符录入的方式，借鉴计算机系统0、1的运行原理，有效简化了操作人员数据录入符号的多样性，通过规范录入环节极大奠定了机器智能化自动化处理的基础。同时，大幅度减少了一线操作人员的工作量和难度，提升工作效率和生产效益。

本发明增强企业数字化管理能力，赋能传统行业，加快其转型升级，针对传统工业、农牧企业，生产管理过程中大量原始数据的采集是企业转型为数字管理的最大阻碍。现有纯手工、部分环节电脑录入等方式，方式原始、工作量大、效率低、准确率不高等诸多问题，严重影响企业经营管理分析和决策。据统计工商企业生产一线产生的数据主要为数字类，因此通过本专利能够解决生产一线原始数据录入、采集问题。

本发明加速人工智能实用化进程，采用AI图像智能识别技术，相较传统OCR应用范围广，有助于AI人工智能在传统行业的推广和应用，尤其是工业化、智能化程度非常落后的农牧行业，对提升行业整体科学技术应用水平，加速人工智能产品实用化、民用化，从而反向促进人工智能技术的向前发展。

附图说明

图1是本发明-实施例记录卡的结构示意图。

图2是本发明-实施例记录卡的界定符号的结构示意图。

图中：A-判断类；B-数值类；C-二维码类；D-字符类。

具体实施方式

下面结合附图及具体实施例对本发明作进一步阐述。

实施例：

如图1-2所示，本实施例的基于计算机视觉图像识别的数据智能采集方法，包括如下步骤：

第一步、梳理业务记录内容，将业务记录内容按标识符、数值类、判断类和字符类进行分类，选取数值类和判断类。

字符类用于辅助现场及时查看信息，使用传统OCR识别的方式进行处理。

其中，标识符包括二维码和条码的一种或两种。

说明案例：农牧行业种猪饲养过程中种猪记录卡，其他行业、企业都可采用此模式进行设计和应用。对记录卡业务记录内容进行如下分类，如图1所示：

判断类：后备发情次数、发情、免疫执行、背膘测定日期、返情、流产、空怀。

数值类：配种评分、胎次、健仔、弱仔、畸形、新死、陈死、木乃伊、产仔窝重、断奶、断奶窝重、背膘测定。

二维码：种母猪、本次与配公猪二维码。

字符类：品种、出生日期、出生地、配种日期、预产期。

第二步、将判断类的标记区域划分为多个空白格子，定义每个格子所代表的内容，简称判断类定义规则，并将其与判断类的标记区域在记录卡中的位置信息和各空白格子在记录卡中的位置信息保存在数据库中；

数值类的标记区域划分多个空白格子，依据数值结果范围，设计满足数值的不同量级数字组合方式，并按照量级规则排列在各空白格子内，简称数值类定义规则，并将其与数值类的标记区域在记录卡中的位置信息和各数字在记录卡中的位置信息保存在数据库中；

将每个产品的唯一标识符和标识符区域在记录卡中的位置信息保存在数据中。

第三步、在判断类的标记区域的空白格子标记结果；在数值类的标记区域的数字标记结果；在标识符的标记区域内标记标识符。

将业务记录内容和结果转换为计算机能够自动处理的格式。

具体地，在判断类的标记区域标记的方式为涂抹或勾选；在数值类的标记区域标记的方式为通过预定的计算规则涂抹或勾选单个或多个数字；在标识符的标记区域内标记的方式为粘贴。

第四步、通过现场固定或者移动的图像采集设备对记录卡进行实时图像采集，并记录图像采集时间点。

其中，图像采集设备包括摄像设备、智能移动终端(手机、ipad)。在图像采集过程中，图像采集的范围需覆盖整张记录卡。

具体地，在记录卡的四个边角还设有界定符号，在图像采集过程中，图像采集设备覆盖该四个界定符号时，则表示覆盖整张记录卡。

第五步、对图像中的业务记录内容和结果进行AI识别。

首先，对图像中的记录卡有效区域和方向进行定位。具体是通过四个界定符号来判断有效区域和方向，如图2所示。

然后，在记录卡中查找标记结果并通过AI系统识别标记结果，先进行阴影识别，然后与保存在数据库中的位置信息匹配。

位置信息包括判断类的标记区域在记录卡中的位置信息和各空白格子在记录卡中的位置信息、数值类的标记区域在记录卡中的位置信息和各数字在记录卡中的位置信息，标识符区域的在记录卡中的位置信息。

图像采集过程中，每抓取一次并识别后自动与前一次的识别结果进行对比，差异部分作为新增内容进行提交。

第六步、将标记结果转换为业务数据。

将所有标记结果从图像采集时间点和标记位置两个维度的信息叠加进行业务数据转换，结合数据库中保存的判断类定义规则、数值类定义规则和标识符，将标记结果转换为业务数据。

采用深度学习技术，实现了标记到数据的转换。

第七步、业务数据校验。

第八步、提交业务数据至业务系统接口。

AI系统将接收的业务数据通过API接口的方式提交至业务管理系统，工作人员、管理人员可实时查询数据，并对数据二次复核确保完全无误。

本发明不局限于上述可选实施方式，任何人在本发明的启示下都可得出其他各种形式的产品，但不论在其形状或结构上作任何变化，凡是落入本发明权利要求界定范围内的技术方案。

Claims

1.基于计算机视觉图像识别的数据智能采集方法，其特征在于：包括如下步骤：

S2、将判断类的标记区域划分为多个空白格子，定义每个格子所代表的内容，即判断类定义规则，并将其与判断类的标记区域在记录卡中的位置信息和各空白格子在记录卡中的位置信息保存在数据库中；

数值类的标记区域划分多个空白格子，依据数值结果范围，设计满足数值的不同量级数字组合方式，并按照量级规则排列在各空白格子内，即数值类定义规则，并将其与数值类的标记区域在记录卡中的位置信息和各数字在记录卡中的位置信息保存在数据库中；

将每个产品的唯一标识符和标识符区域的标识符区域在记录卡中的位置信息保存在数据中；

S5、对图像中的业务记录内容和结果进行AI识别；

S6、将标记结果转换为业务数据；

所述步骤S5的具体实现方式包括：

S52、在记录卡中查找标记结果并通过AI系统识别标记结果，先进行阴影识别，然后与保存在数据库中的位置信息匹配；

所述步骤S6的具体实现方式包括：将所有标记结果从图像采集时间点和标记位置两个维度的信息叠加进行业务数据转换，结合数据库中保存的判断类定义规则、数值类定义规则和标识符，将标记结果转换为业务数据。

2.根据权利要求1所述的基于计算机视觉图像识别的数据智能采集方法，其特征在于：所述标识符包括二维码和条码的一种或两种。

3.根据权利要求1所述的基于计算机视觉图像识别的数据智能采集方法，其特征在于：所述步骤S3中，在判断类的标记区域标记的方式为涂抹或勾选；在数值类的标记区域标记的方式为通过预定的计算规则涂抹或勾选单个或多个数字；在标识符的标记区域内标记的方式为粘贴。

4.根据权利要求1所述的基于计算机视觉图像识别的数据智能采集方法，其特征在于：所述图像采集设备包括摄像设备和智能移动终端的一种或两种。

5.根据权利要求1所述的基于计算机视觉图像识别的数据智能采集方法，其特征在于：在图像采集过程中，图像采集的范围需覆盖整张记录卡，具体通过如下方式实现：

6.根据权利要求5所述的基于计算机视觉图像识别的数据智能采集方法，其特征在于：图像采集过程中，每抓取一次并识别后自动与前一次的识别结果进行对比，差异部分作为新增内容进行提交。

7.根据权利要求6所述的基于计算机视觉图像识别的数据智能采集方法，其特征在于：数据智能采集方法还包括步骤：通过API接口提交业务数据至业务管理系统。