CN109325557B - 基于计算机视觉图像识别的数据智能采集方法 - Google Patents

基于计算机视觉图像识别的数据智能采集方法 Download PDF

Info

Publication number
CN109325557B
CN109325557B CN201811051032.9A CN201811051032A CN109325557B CN 109325557 B CN109325557 B CN 109325557B CN 201811051032 A CN201811051032 A CN 201811051032A CN 109325557 B CN109325557 B CN 109325557B
Authority
CN
China
Prior art keywords
class
identifier
numerical value
registration card
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811051032.9A
Other languages
English (en)
Other versions
CN109325557A (zh
Inventor
张海峰
张勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan Zhenghu Wisdom Technology Co Ltd
Original Assignee
Sichuan Zhenghu Wisdom Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan Zhenghu Wisdom Technology Co Ltd filed Critical Sichuan Zhenghu Wisdom Technology Co Ltd
Priority to CN201811051032.9A priority Critical patent/CN109325557B/zh
Publication of CN109325557A publication Critical patent/CN109325557A/zh
Application granted granted Critical
Publication of CN109325557B publication Critical patent/CN109325557B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06KGRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
    • G06K17/00Methods or arrangements for effecting co-operative working between equipments covered by two or more of main groups G06K1/00 - G06K15/00, e.g. automatic card files incorporating conveying and reading operations
    • G06K17/0022Methods or arrangements for effecting co-operative working between equipments covered by two or more of main groups G06K1/00 - G06K15/00, e.g. automatic card files incorporating conveying and reading operations arrangements or provisious for transferring data to distant stations, e.g. from a sensing device

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)
  • Character Discrimination (AREA)

Abstract

本发明公开基于计算机视觉图像识别的数据智能采集方法,包括:S1、将业务记录内容分类,选取数值类和判断类;S2、设定判断类定义规则,并将其与位置信息保存在数据库中;设定数值类定义规则,并将其与位置信息保存在数据库中;将每个产品的唯一标识符和标识符区域的位置信息保存在数据中;S3、在判断类的标记区域、数值类的标记区域标记结果,在标识符的标记区域内标记标识符;S4、实时图像采集,并记录图像采集时间点;S5、对图像中的业务记录内容和结果进行AI识别;S6、将标记结果转换为业务数据。本发明颠覆传统行业数据采集的思维模式,增强企业数字化管理能力,赋能传统行业,加快其转型升级,加速人工智能实用化进程。

Description

基于计算机视觉图像识别的数据智能采集方法
技术领域
本发明属于计算机软件领域,具体涉及基于计算机视觉图像识别的数据智能采集方法。
背景技术
文字识别技术:光学字符识别(OCR)是针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。该项技术主要用于印刷体纸质文档扫描(例如扫描仪或数码相机)识别转化为计算机文字和手写体文字识别,其中手写体文字识别应用于手机、平板和手写板上实时识别。技术缺陷如下:
工商、生产制造型企业在生产现场管理过程中存在大量数据需要手工进行记录,不同岗位有固定格式的数据记录纸质文档,采用传统的OCR文字识别的方式自动抓取文字并转化为业务数据方面,存在拒识率、误识率高等问题。由于识别准确率不高,导致该项技术无法在企业生产经营中得到广泛应用,其主要原因如下:
第一、相同格式的纸质文档记录工具不同,造成文字线条粗细、颜色不同、字迹深浅都存在差异,造成识别率较低;
第二、不同工作人员的书写习惯不一致,导致记录文字规整、潦草程度不一致,造成文字无法识别;
第三、针对同一格式的纸质文档,不同人员不同时间点,记录的起始位置不同,传统的文字识别技术无法辨别记录发生变化的时间点和内容,造成无法准确记录业务发生的时间和该时间段记录的业务数据。
发明内容
为了解决现有技术存在的上述问题,本发明目的在于提供基于计算机视觉图像识别的数据智能采集方法。本发明的智能数据采集方法应用于农牧业、工商企业生产现场原始数据的计算机视觉图像识别自动采集,按照业务规则自动抓取图像指定区域标记颜色涂抹,再通过标识预定义规则转换为相应的业务数据,并将清理、转换后的业务数据通过接口的方式与企业内外部系统进行对接。
本发明所采用的技术方案为:
利用计算机视觉处理技术,通过携带高清摄像头的设备(手机、Pad等),实时抓取生产现场按照业务规则预制的纸质或其他材质记录卡上二维码、条码和标记结果(勾选或涂抹)的图片,利用图像识别算法和深度学习技术标记并识别二维码、条码、勾选或涂抹区域,再按照记录卡区域与业务结果对应关系的预定义规则,结合图像抓取时间(自定义采集时间频次、间隔),将勾选或涂抹位置转换为业务数据,系统再依据业务逻辑对数据进行效验后自动进入管理系统或对外进行结果输出。记录数据可以通过手机、Pad或Web端实时查询业务数据。
基于计算机视觉图像识别的数据智能采集方法,包括如下步骤:
S1、梳理业务记录内容,将业务记录内容按标识符、数值类、判断类和字符类进行分类,选取数值类和判断类;
S2、将判断类的标记区域划分为多个空白格子,定义每个格子所代表的内容,即判断类定义规则,并将其与第一位置信息保存在数据库中;
数值类的标记区域划分多个空白格子,依据数值结果范围,设计满足数值的不同量级数字组合方式,并按照量级规则排列在各空白格子内,即数值类定义规则,并将其与第二位置信息保存在数据库中;
将每个产品的唯一标识符和标识符区域的第三位置信息保存在数据中;
S3、在判断类的标记区域的空白格子标记结果;在数值类的标记区域的数字标记结果;在标识符的标记区域内标记标识符;
S4、通过现场固定或者移动的图像采集设备对记录卡进行实时图像采集,并记录图像采集时间点;
S5、对图像中的业务记录内容和结果进行AI识别;
S6、将标记结果转换为业务数据。
具体地,所述标识符包括二维码和条码的一种或两种。
进一步地,所述步骤S2中,所述第一位置信息包括判断类的标记区域在记录卡中的位置信息和各空白格子在记录卡中的位置信息;所述第二位置信息包括数值类的标记区域在记录卡中的位置信息和各数字在记录卡中的位置信息;所述第三位置信息包括标识符区域的在记录卡中的位置信息。
再进一步地,所述步骤S3中,在判断类的标记区域标记的方式为涂抹或勾选;在数值类的标记区域标记的方式为通过预定的计算规则涂抹或勾选单个或多个数字;在标识符的标记区域内标记的方式为粘贴。
将业务记录内容和结果转换为计算机能够自动处理的格式。
再进一步地,所述图像采集设备包括摄像设备和智能移动终端的一种或两种。
在图像采集过程中,图像采集的范围需覆盖整张记录卡,具体通过如下方式实现:
在记录卡的四个边角还设有界定符号,在图像采集过程中,图像采集设备覆盖该四个界定符号时,则表示覆盖整张记录卡。
再进一步地,所述步骤S5的具体实现方式包括:
S51、通过四个界定符号来判断有效区域和方向,对图像中的记录卡有效区域和方向进行定位;
S52、在记录卡中查找标记结果并通过AI系统识别标记结果,先进行阴影识别,然后与保存在数据库中的位置信息匹配。
再进一步地,图像采集过程中,每抓取一次并识别后自动与前一次的识别结果进行对比,差异部分作为新增内容进行提交。
再进一步地,所述步骤S6的具体实现方式包括:将所有标记结果从图像采集时间点和标记位置两个维度的信息叠加进行业务数据转换,结合数据库中保存的判断类定义规则、数值类定义规则和标识符,将标记结果转换为业务数据。
数据智能采集方法包括步骤:AI系统通过API接口提交业务数据至业务管理系统。工作人员、管理人员可实时查询数据,并对数据二次复核确保完全无误。
AI系统将业务数据通过API接口传递给企业业务管理系统前,对业务数据的合理性、准确性、错误数据等问题进行检查,如果存在涂抹不规范、错误或遮挡等情况,AI系统自动报警,提示业务人员及时更正,如果正确无误,AI系统将数据上传至服务器。
本发明的有益效果为:
本发明颠覆传统行业数据采集的思维模式,打破传统数字、字符录入的方式,借鉴计算机系统0、1的运行原理,有效简化了操作人员数据录入符号的多样性,通过规范录入环节极大奠定了机器智能化自动化处理的基础。同时,大幅度减少了一线操作人员的工作量和难度,提升工作效率和生产效益。
本发明增强企业数字化管理能力,赋能传统行业,加快其转型升级,针对传统工业、农牧企业,生产管理过程中大量原始数据的采集是企业转型为数字管理的最大阻碍。现有纯手工、部分环节电脑录入等方式,方式原始、工作量大、效率低、准确率不高等诸多问题,严重影响企业经营管理分析和决策。据统计工商企业生产一线产生的数据主要为数字类,因此通过本专利能够解决生产一线原始数据录入、采集问题。
本发明加速人工智能实用化进程,采用AI图像智能识别技术,相较传统OCR应用范围广,有助于AI人工智能在传统行业的推广和应用,尤其是工业化、智能化程度非常落后的农牧行业,对提升行业整体科学技术应用水平,加速人工智能产品实用化、民用化,从而反向促进人工智能技术的向前发展。
附图说明
图1是本发明-实施例记录卡的结构示意图。
图2是本发明-实施例记录卡的界定符号的结构示意图。
图中:A-判断类;B-数值类;C-二维码类;D-字符类。
具体实施方式
下面结合附图及具体实施例对本发明作进一步阐述。
实施例:
如图1-2所示,本实施例的基于计算机视觉图像识别的数据智能采集方法,包括如下步骤:
第一步、梳理业务记录内容,将业务记录内容按标识符、数值类、判断类和字符类进行分类,选取数值类和判断类。
字符类用于辅助现场及时查看信息,使用传统OCR识别的方式进行处理。
其中,标识符包括二维码和条码的一种或两种。
说明案例:农牧行业种猪饲养过程中种猪记录卡,其他行业、企业都可采用此模式进行设计和应用。对记录卡业务记录内容进行如下分类,如图1所示:
判断类:后备发情次数、发情、免疫执行、背膘测定日期、返情、流产、空怀。
数值类:配种评分、胎次、健仔、弱仔、畸形、新死、陈死、木乃伊、产仔窝重、断奶、断奶窝重、背膘测定。
二维码:种母猪、本次与配公猪二维码。
字符类:品种、出生日期、出生地、配种日期、预产期。
第二步、将判断类的标记区域划分为多个空白格子,定义每个格子所代表的内容,简称判断类定义规则,并将其与判断类的标记区域在记录卡中的位置信息和各空白格子在记录卡中的位置信息保存在数据库中;
数值类的标记区域划分多个空白格子,依据数值结果范围,设计满足数值的不同量级数字组合方式,并按照量级规则排列在各空白格子内,简称数值类定义规则,并将其与数值类的标记区域在记录卡中的位置信息和各数字在记录卡中的位置信息保存在数据库中;
将每个产品的唯一标识符和标识符区域在记录卡中的位置信息保存在数据中。
第三步、在判断类的标记区域的空白格子标记结果;在数值类的标记区域的数字标记结果;在标识符的标记区域内标记标识符。
将业务记录内容和结果转换为计算机能够自动处理的格式。
具体地,在判断类的标记区域标记的方式为涂抹或勾选;在数值类的标记区域标记的方式为通过预定的计算规则涂抹或勾选单个或多个数字;在标识符的标记区域内标记的方式为粘贴。
第四步、通过现场固定或者移动的图像采集设备对记录卡进行实时图像采集,并记录图像采集时间点。
其中,图像采集设备包括摄像设备、智能移动终端(手机、ipad)。在图像采集过程中,图像采集的范围需覆盖整张记录卡。
具体地,在记录卡的四个边角还设有界定符号,在图像采集过程中,图像采集设备覆盖该四个界定符号时,则表示覆盖整张记录卡。
第五步、对图像中的业务记录内容和结果进行AI识别。
首先,对图像中的记录卡有效区域和方向进行定位。具体是通过四个界定符号来判断有效区域和方向,如图2所示。
然后,在记录卡中查找标记结果并通过AI系统识别标记结果,先进行阴影识别,然后与保存在数据库中的位置信息匹配。
位置信息包括判断类的标记区域在记录卡中的位置信息和各空白格子在记录卡中的位置信息、数值类的标记区域在记录卡中的位置信息和各数字在记录卡中的位置信息,标识符区域的在记录卡中的位置信息。
图像采集过程中,每抓取一次并识别后自动与前一次的识别结果进行对比,差异部分作为新增内容进行提交。
第六步、将标记结果转换为业务数据。
将所有标记结果从图像采集时间点和标记位置两个维度的信息叠加进行业务数据转换,结合数据库中保存的判断类定义规则、数值类定义规则和标识符,将标记结果转换为业务数据。
采用深度学习技术,实现了标记到数据的转换。
第七步、业务数据校验。
AI系统将业务数据通过API接口传递给企业业务管理系统前,对业务数据的合理性、准确性、错误数据等问题进行检查,如果存在涂抹不规范、错误或遮挡等情况,AI系统自动报警,提示业务人员及时更正,如果正确无误,AI系统将数据上传至服务器。
第八步、提交业务数据至业务系统接口。
AI系统将接收的业务数据通过API接口的方式提交至业务管理系统,工作人员、管理人员可实时查询数据,并对数据二次复核确保完全无误。
本发明不局限于上述可选实施方式,任何人在本发明的启示下都可得出其他各种形式的产品,但不论在其形状或结构上作任何变化,凡是落入本发明权利要求界定范围内的技术方案。

Claims (7)

1.基于计算机视觉图像识别的数据智能采集方法,其特征在于:包括如下步骤:
S1、梳理业务记录内容,将业务记录内容按标识符、数值类、判断类和字符类进行分类,选取数值类和判断类;
S2、将判断类的标记区域划分为多个空白格子,定义每个格子所代表的内容,即判断类定义规则,并将其与判断类的标记区域在记录卡中的位置信息和各空白格子在记录卡中的位置信息保存在数据库中;
数值类的标记区域划分多个空白格子,依据数值结果范围,设计满足数值的不同量级数字组合方式,并按照量级规则排列在各空白格子内,即数值类定义规则,并将其与数值类的标记区域在记录卡中的位置信息和各数字在记录卡中的位置信息保存在数据库中;
将每个产品的唯一标识符和标识符区域的标识符区域在记录卡中的位置信息保存在数据中;
S3、在判断类的标记区域的空白格子标记结果;在数值类的标记区域的数字标记结果;在标识符的标记区域内标记标识符;
S4、通过现场固定或者移动的图像采集设备对记录卡进行实时图像采集,并记录图像采集时间点;
S5、对图像中的业务记录内容和结果进行AI识别;
S6、将标记结果转换为业务数据;
所述步骤S5的具体实现方式包括:
S51、通过四个界定符号来判断有效区域和方向,对图像中的记录卡有效区域和方向进行定位;
S52、在记录卡中查找标记结果并通过AI系统识别标记结果,先进行阴影识别,然后与保存在数据库中的位置信息匹配;
所述步骤S6的具体实现方式包括:将所有标记结果从图像采集时间点和标记位置两个维度的信息叠加进行业务数据转换,结合数据库中保存的判断类定义规则、数值类定义规则和标识符,将标记结果转换为业务数据。
2.根据权利要求1所述的基于计算机视觉图像识别的数据智能采集方法,其特征在于:所述标识符包括二维码和条码的一种或两种。
3.根据权利要求1所述的基于计算机视觉图像识别的数据智能采集方法,其特征在于:所述步骤S3中,在判断类的标记区域标记的方式为涂抹或勾选;在数值类的标记区域标记的方式为通过预定的计算规则涂抹或勾选单个或多个数字;在标识符的标记区域内标记的方式为粘贴。
4.根据权利要求1所述的基于计算机视觉图像识别的数据智能采集方法,其特征在于:所述图像采集设备包括摄像设备和智能移动终端的一种或两种。
5.根据权利要求1所述的基于计算机视觉图像识别的数据智能采集方法,其特征在于:在图像采集过程中,图像采集的范围需覆盖整张记录卡,具体通过如下方式实现:
在记录卡的四个边角还设有界定符号,在图像采集过程中,图像采集设备覆盖该四个界定符号时,则表示覆盖整张记录卡。
6.根据权利要求5所述的基于计算机视觉图像识别的数据智能采集方法,其特征在于:图像采集过程中,每抓取一次并识别后自动与前一次的识别结果进行对比,差异部分作为新增内容进行提交。
7.根据权利要求6所述的基于计算机视觉图像识别的数据智能采集方法,其特征在于:数据智能采集方法还包括步骤:通过API接口提交业务数据至业务管理系统。
CN201811051032.9A 2018-09-10 2018-09-10 基于计算机视觉图像识别的数据智能采集方法 Active CN109325557B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811051032.9A CN109325557B (zh) 2018-09-10 2018-09-10 基于计算机视觉图像识别的数据智能采集方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811051032.9A CN109325557B (zh) 2018-09-10 2018-09-10 基于计算机视觉图像识别的数据智能采集方法

Publications (2)

Publication Number Publication Date
CN109325557A CN109325557A (zh) 2019-02-12
CN109325557B true CN109325557B (zh) 2019-07-16

Family

ID=65264869

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811051032.9A Active CN109325557B (zh) 2018-09-10 2018-09-10 基于计算机视觉图像识别的数据智能采集方法

Country Status (1)

Country Link
CN (1) CN109325557B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114037096A (zh) * 2021-10-29 2022-02-11 河南格林循环电子废弃物处置有限公司 一种家电自动识别并标记的装置及其使用方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101923643B (zh) * 2010-08-11 2012-11-21 中科院成都信息技术有限公司 通用表格识别方法
CN104881641A (zh) * 2015-05-18 2015-09-02 上海交通大学 基于移动设备的问卷和表格数字化识别方法及系统
CN106845467A (zh) * 2016-12-14 2017-06-13 北京航天测控技术有限公司 基于光学字符识别技术的航空维修工卡工作内容识别方法
JP2017215661A (ja) * 2016-05-30 2017-12-07 キヤノン株式会社 画像処理装置、及びその制御方法ならびにコンピュータプログラム
CN107862303A (zh) * 2017-11-30 2018-03-30 平安科技(深圳)有限公司 表格类图像的信息识别方法、电子装置及可读存储介质
CN108345882A (zh) * 2018-02-11 2018-07-31 北京百度网讯科技有限公司 用于图像识别的方法、装置、设备和计算机可读存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7324691B2 (en) * 2003-09-24 2008-01-29 Microsoft Corporation System and method for shape recognition of hand-drawn objects
CN102156691B (zh) * 2010-09-28 2013-02-20 北京大学深圳研究生院 记录手工填写纸质表格信息的方法及装置
TWI550519B (zh) * 2015-05-27 2016-09-21 仁寶電腦工業股份有限公司 圖表繪製方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101923643B (zh) * 2010-08-11 2012-11-21 中科院成都信息技术有限公司 通用表格识别方法
CN104881641A (zh) * 2015-05-18 2015-09-02 上海交通大学 基于移动设备的问卷和表格数字化识别方法及系统
JP2017215661A (ja) * 2016-05-30 2017-12-07 キヤノン株式会社 画像処理装置、及びその制御方法ならびにコンピュータプログラム
CN106845467A (zh) * 2016-12-14 2017-06-13 北京航天测控技术有限公司 基于光学字符识别技术的航空维修工卡工作内容识别方法
CN107862303A (zh) * 2017-11-30 2018-03-30 平安科技(深圳)有限公司 表格类图像的信息识别方法、电子装置及可读存储介质
CN108345882A (zh) * 2018-02-11 2018-07-31 北京百度网讯科技有限公司 用于图像识别的方法、装置、设备和计算机可读存储介质

Also Published As

Publication number Publication date
CN109325557A (zh) 2019-02-12

Similar Documents

Publication Publication Date Title
CN109840519B (zh) 一种自适应的智能单据识别录入装置及其使用方法
CN109389275B (zh) 一种图像标注方法和装置
Siddiqui et al. Rethinking semantic segmentation for table structure recognition in documents
CN110472524B (zh) 基于深度学习的发票信息管理方法、系统和可读介质
CN110135231A (zh) 动物面部识别方法、装置、计算机设备和存储介质
CN107808154B (zh) 提取收银票据信息的方法和装置
CN108460418B (zh) 一种基于文字识别与语义分析的发票分类方法
CN106845467B (zh) 基于光学字符识别技术的航空维修工卡工作内容识别方法
US20230215125A1 (en) Data identification method and apparatus
CN114049624A (zh) 一种基于机器视觉的船舶舱室智能检测方法及系统
CN110929032B (zh) 一种软件系统的用户需求处理系统及处理方法
CN109325557B (zh) 基于计算机视觉图像识别的数据智能采集方法
CN108764210A (zh) 一种基于参照物的猪重识别的方法及系统
CN111160374B (zh) 一种基于机器学习的颜色识别方法及系统、装置
Su et al. AIoT-cloud-integrated smart livestock surveillance via assembling deep networks with considering robustness and semantics availability
CN111047731A (zh) 一种基于ar技术的电信机房巡检方法及系统
CN116543327A (zh) 作业人员工种识别的方法、装置、计算机设备及存储介质
CN115984968A (zh) 一种学生时空动作识别方法、装置、终端设备及介质
CN109919153A (zh) 基于手写识别人工智能技术的自动单据录入系统及方法
CN107045635A (zh) 一种网上阅卷系统的试卷图像分页分题处理方法
CN106326882A (zh) 一种基于图像质量评估技术的指纹识别系统及方法
CN110956366A (zh) 一种装维质检中分光器施工一致性检验方法
CN115309941B (zh) 一种基于ai的智能标签检索方法及系统
CN113128251A (zh) 一种鱼脸特征检测算法
CN112558554A (zh) 任务追踪方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant