CN113486892A - 基于智能手机图像识别的生产信息采集方法及系统 - Google Patents

基于智能手机图像识别的生产信息采集方法及系统 Download PDF

Info

Publication number
CN113486892A
CN113486892A CN202110755054.9A CN202110755054A CN113486892A CN 113486892 A CN113486892 A CN 113486892A CN 202110755054 A CN202110755054 A CN 202110755054A CN 113486892 A CN113486892 A CN 113486892A
Authority
CN
China
Prior art keywords
image
display frame
identified
characters
display screen
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110755054.9A
Other languages
English (en)
Other versions
CN113486892B (zh
Inventor
庞哈利
张银萍
刘沛灼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northeastern University China
Original Assignee
Northeastern University China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northeastern University China filed Critical Northeastern University China
Priority to CN202110755054.9A priority Critical patent/CN113486892B/zh
Publication of CN113486892A publication Critical patent/CN113486892A/zh
Application granted granted Critical
Publication of CN113486892B publication Critical patent/CN113486892B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/13Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/90Determination of colour characteristics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10024Color image

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本发明提供一种基于智能手机图像识别的生产信息采集方法及系统,通过智能手机拍摄生产机器附带控制终端显示屏的图像,并裁剪出显示屏所在的图像区域;在显示屏图像区域中提取出显示框、显示框标签的外部轮廓;提取出显示框标签的文字,提取出显示框中显示的颜色或文字,并在智能手机页面进行显示;将识别并人工检查确认后的显示框标签的文字以及对应显示框显示的颜色或文字传输到服务器,本发明方法基于智能手机开发信息采集系统,提高了数据采集的及时性和准确性,减少了上传的数据量,降低了对网络通讯质量的要求,满足生产实际中简捷、高效、易于实施的需求。

Description

基于智能手机图像识别的生产信息采集方法及系统
技术领域
本发明属于图像处理与文字识别技术领域,具体涉及一种基于智能手机图像识别的生产信息采集方法及系统。
背景技术
在离散制造企业的生产车间中存在很多独立运行的非联网加工机器,这些机器本身自带控制装置(单元),通过控制装置(单元)的操作终端显示屏进行控制指令设置和机器运转情况监视。生产机器附带控制单元的操作终端显示屏可包含多个区域,每个区域又可包含多个数据项显示框,分别是机器运行状态数据,机器生产的实绩数据,各数据项显示框由文字释义的显示框标签进行标识,其一般形式如图2所示。
制造执行系统(MES)要求对车间生产机器的运行状况和生产实绩状况进行监视,但由于某些生产机器的控制装置(单元)未联入企业网络,对机器运行状况和生产实绩信息的采集往往只能通过人工记录的方式进行。这不仅增加了机器操作人员的额外工作量、无法保证采集数据的速度和准确度,同时也难以完成对制造车间机器运行与作业状态信息进行存储和统一监视。
中国专利“CN11659645A一种数字仪表字符识别方法”提供了一种基于数字仪表字符识别方法,应用于数字仪表数据的自动获取及仪表监控系统,此专利通过连通域数目或质心坐标对数码管显示的数字进行识别。所述的技术方案适用于数码管识别而非屏幕识别,并且在光照等因素造成预处理后的图像连通域发生改变的情况下,识别效果降低。
中国专利“CN109508714B一种低成本多通道实时数字仪表盘视觉识别方法及系统”提供了一种多通道数字仪表盘的识别方法与系统,对于多个数码管构成的仪表盘进行视觉识别,包括:对数字区域进行配置;对数码管区域和小数点信息进行配置;子区域识别,子区域后处理;数字识别模型训练,更新和测试等。所述方法是对由多数码管构成的仪表盘进行识别而非对屏幕进行识别,且采用的方法是基于神经网络进行识别。
中国专利“CN110298352A一种香烟包装机检测装置的屏幕数据的提取装置及方法”提供了一种香烟包装机检测装置的屏幕数据的提取装置及方法,包括图像捕捉模块、图像处理模块和数字识别模块。该专利通过图像捕捉模块定期捕捉香烟包装机检测装置控制器上的屏幕图像,通过图像处理模块对图像处理,然后通过数字识别模块对处理后的图像中的数字进行识别并导出,实现不同厂家产品自动提取数字信息。此发明是通过图像捕捉模块来捕捉屏幕图像而不是智能手机采集,该专利的识别对象只有数字,通过设置水平直线和垂直直线的数量及位置,根据数字与直线的交叉点个数来实现数字识别。
中国专利“CN107665348B一种变电站数字仪表的数字识别方法和装置”提供了一种变电站数字仪表的数字识别方法和装置。该方法和装置应用于对变电站进行巡检的电子设备,具体为对变电站的数字仪表的待识别图像进行粗定位,得到待识别图像的中的数字感兴趣区域。对数字感兴趣图像进行精确定位,得到多个分割区域。对多个分割区域进行识别,最终得到数字仪表的正确读数。本发明方法采集的图像中只有一个计数器,即数据项单一,处理流程是先粗定位数字感兴趣区域,然后精准定位数字区域并分割各个数字,最后基于SVM分类器识别。
中国专利“CN108460344A屏幕中的动态区域智能识别系统及智能识别方法”提供了一种屏幕中的动态区域智能识别系统及智能识别方法,其系统包括:视频采集装置,用于采集机台显示器的视频图像;图片获取装置,用于获取批量图片并发送给动态区域位置检测模块;动态区域位置检测模块,用于识别动态区域位置并将区域位置数据发送至类型识别模块;类型识别模块,用于识别动态区域数据类型,并将动态区域位置数据和数据类型作为模板发送至数据库;数据库用于存储模板信息,便于后续查询和调用。所述方法是对屏幕中动态区域位置及类型的识别。
中国专利“CN111198644A智能终端的屏幕操作的识别方法及系统”提供了一种智能终端的屏幕操作的识别方法及系统。在智能终端的屏幕下方设置若干个距离检测模块,获取每个距离检测模块与屏幕上的每个坐标信息的对应关系;当目标对象在进行隔空操作时,通过不同的距离检测模块检测到不同的目标对象并分别获取每个目标对象与屏幕之间的距离信息;距离检测模块检测的目标对象在屏幕上的目标坐标信息和距离检测模块对应的坐标信息一一对应;根据目标坐标信息和距离信息识别出每个目标对象的隔空操作在屏幕上的操作行为。此发明是对操作行为动作进行识别。
以上专利均未涉及通过智能手机进行拍照和进行图像处理及文字识别的内容。
发明内容
针对生产过程中非联网生产机器进行人工记录数据不仅增加额外的工作量且难以保证数据采集的及时性和准确性的问题,本发明提供了一种通过对离散制造业中的非联网生产机器的控制终端显示屏进行拍照,并采用图像处理与文字识别的技术手段,提取屏幕显示的机器运行状态和生产实绩信息,再通过无线通讯方式传递至企业服务器,以便对现场生产作业情况进行存储和统一监控管理的方法和系统。
一种基于智能手机图像识别的生产信息采集方法,通过智能手机拍摄生产机器附带控制终端显示屏的图像,并裁剪出显示屏所在的图像区域;在显示屏图像区域中提取出显示框、显示框标签的外部轮廓;提取出显示框标签的文字,提取出显示框中显示的颜色或文字,并在智能手机页面进行显示;将识别并人工检查确认后的显示框标签的文字以及对应显示框显示的颜色或文字传输到服务器,包括:
步骤1:初始化设置,通过智能手机获取生产机器附带控制终端显示屏工作状态下的显示屏图像,提取显示屏所在图像区域的背景色以及待识别显示框标签的文字颜色、待识别显示框的背景色、待识别显示框中文字的颜色,作为待识别图像特征的预设对比色;
步骤2:图像采集,拍摄生产机器附带控制终端显示屏的屏幕图像作为待识别图像,对待识别图像进行预处理,裁剪出待识别图像中的显示屏区域;
步骤3:查找显示屏区域中所有待识别显示框的外部轮廓;
步骤4:查找显示屏区域中所有待识别显示框标签的外部轮廓;
步骤5:将查找到的显示框标签的外部轮廓的坐标与所对应的显示框的外部轮廓的坐标一一对应;
步骤6:分割出所有的显示框标签和显示框;
步骤7:将分割出的显示框标签的图像区域进行灰度化,调用库函数Tesseract的API接口对灰度化处理后图像进行识别,得到显示框标签的文字;
步骤8:提取与显示框标签对应的显示框中显示的颜色或文字;
步骤9:将识别到的显示框标签的文字以及对应显示框中显示的颜色或文字显示到手机屏幕页面;
步骤10:检查手机屏幕页面所显示的显示框标签的文字以及对应显示框中显示的颜色或文字与拍摄的显示屏图像内容是否相同,如果相同,确认提交数据,通过无线网络传输并存储至服务器的数据库中,如果不同,提示用户重新拍摄。
所述步骤1包括:
步骤1.1:通过智能手机对生产机器附带的控制终端显示屏拍照,获取整个显示屏的屏幕图像;
步骤1.2:提取显示屏图像区域的背景色,以及显示屏图像区域中待识别显示框标签的文字颜色、待识别显示框的背景色、待识别显示框中文字的颜色,作为待识别图像特征的预设对比色。
所述步骤2包括:
步骤2.1:拍摄生产机器附带控制终端显示屏的屏幕图像作为待识别图像;
步骤2.2:将待识别图像转换为HSV颜色空间;
步骤2.3:过滤掉待识别图像中除显示屏图像区域的背景色之外的其它颜色;
步骤2.4:对过滤掉其它颜色之后的图像进行膨胀操作;
步骤2.5:对膨胀操作后的图像通过中值滤波去除图像中的噪点;
步骤2.6:对噪点去除后的图像进行边缘检测,并提取出图像内部的所有轮廓;
步骤2.7:在提取到的所有轮廓中找到面积最大的轮廓,然后进行多边拟合得到显示屏的近似轮廓;
步骤2.8:对得到的显示屏的近似轮廓进行轮廓检测,如果检测到显示屏的近似轮廓的角点数为四个,则说明当前处理的待识别图像合格,继续执行步骤2.9;如果检测到的角点数不是四个,则说明当前处理的待识别图像不合格,提示用户重新拍摄,执行步骤2.1;
步骤2.9:对显示屏的近似轮廓的四个角点所对应的图像区域进行四点透视变换,切割出显示屏区域。
所述步骤3包括:
步骤3.1:将显示屏区域的图像转换成HSV颜色空间;
步骤3.2:过滤掉显示屏区域图像中除待识别显示框的背景色之外的其它颜色;
步骤3.3:对过滤掉其它颜色之后的图像进行平滑处理;
步骤3.4:对平滑处理后的图像进行边缘检测,并提取出图像内部的所有轮廓;
步骤3.5:获取每个轮廓的左上角坐标和轮廓的宽、高;
步骤3.6:根据左上角坐标和轮廓的宽、高画出每个轮廓的最大外接矩形;
步骤3.7:检测每个最大外接矩形轮廓的角点数,有四个角点数的轮廓即为查找到的显示屏区域中的显示框的外部轮廓。
所述步骤4包括:
步骤4.1:以显示框标签所对应的显示框的外部轮廓的高构成的正方形为移动单位,以显示框的外部轮廓的左侧边为起点,以移动单位为步长向左移动;
步骤4.2:每移动一次检测移动单位内是否有待识别显示框标签文字的颜色,将第一个找到的有待识别显示框标签文字颜色的移动单位的右侧边作为显示框标签外部轮廓右侧边;
步骤4.3:继续向左侧水平方向移动,当检测到移动单位内的颜色不包含有待识别显示框标签文字的颜色时,将移动单位的右侧边作为显示框标签外部轮廓的左侧边;如果向左移动过程中,移动到显示屏区域左侧的轮廓线时检测到移动单位内一直有待识别显示框标签文字的颜色,则让显示屏区域左侧的轮廓线作为显示框标签外部轮廓的左侧边;
步骤4.4:将显示框标签外部轮廓的左侧边与显示框标签外部轮廓右侧边构成的矩形作为显示框标签所在的外部轮廓。
所述步骤6包括:
步骤6.1:对每个显示框的外部轮廓所对应的图像区域进行四点透视变换,切割出每个显示框所在的图像区域Qi
步骤6.2:对每个显示框标签的外部轮廓所对应的图像区域进行四点透视变换,切割出每个显示框标签所在的图像区域Pi
所述步骤8中,如果显示框中没有预设的待识别显示框中文字的颜色,则对显示框进行颜色的提取,包括:
步骤8.1.1:将分割后的图像区域Qi由RGB颜色空间转换成HSV颜色空间,在HSV颜色空间对图像做直方图均衡化处理,过滤掉除待识别显示框的背景色外的其它颜色,得到图像区域Qi的二值图像;
步骤8.1.2:计算二值图像中白色区域的面积si,并比较面积si与图像区域Qi面积之间的大小;
步骤8.1.3:如果面积si达到图像区域Qi面积的q%及以上,提取出待识别显示框的背景色;
步骤8.1.4:将显示框标签的文字以及对应显示框中显示的颜色一一对应存储。
所述步骤8中,如果显示框中有预设的待识别显示框中文字的颜色,则对显示框进行文字的提取,包括:
步骤8.2.1:首先对分割后的图像区域Qi进行闭运算,然后通过在每个局部最大像素之间除以255来执行增益调整,将增益调整后的像素值控制在值域区间[0,255],得出各点的新像素值;
步骤8.2.2:将新像素值下的图像进行灰度化处理;
步骤8.2.3:将灰度化处理后的图像进行归一化处理;
步骤8.2.4:将归一化处理后的图像进行二值化处理得到二值图像;
步骤8.2.5:调用库函数Tesseract的API接口对二值图像进行识别,得到表达的文字;
步骤8.2.6:将显示框标签的文字以及对应显示框中的文字一一对应存储。
一种实现基于智能手机图像识别的生产信息采集方法的信息采集系统,包括:登录模块、初始化配置模块、图像采集模块、图像处理与识别模块、数据传输模块;
所述登录模块用于用户登录,连接服务器;
所述初始化模块用于初始化设置,实现对显示屏图像的背景色以及待识别特征的颜色或背景色的提取,作为待识别图像特征的预设对比色;
所述图像采集模块用于对生产机器附带的控制终端显示屏进行拍照并保存图像;
所述图像处理与识别模块用于对图像进行处理,识别出图像中显示框标签的文字以及对应显示框所显示的颜色或文字;
所述数据传输模块用于对识别出的显示框标签文字以及对应显示框所显示的颜色或文字与显示屏图像进行人工对比判断,如果正确,则通过无线网络传输到服务器的数据库中存储;否则,提示用户重新进行拍摄。
本发明的有益效果是:
本发明提出了一种基于智能手机图像识别的生产信息采集方法,通过对离散制造业中的非联网生产机器的控制终端显示屏进行拍照,并采用图像处理与文字识别的技术手段,提取屏幕显示的机器运行状态和生产实绩信息,再通过无线通讯方式传输至企业服务器进行存储,在识别时不需将一个数据项分割为多个字符来分别识别;与人工采集数据相比,本发明实现了非联网生产机器的运行状况和生产实绩信息的自动化采集,提高了数据采集的及时性和准确性。
附图说明
图1为本发明中基于智能手机图像识别的生产信息采集方法流程图;
图2为本发明实施例中生产机器的控制终端显示屏内容示意图;
图3为本发明实施例中采集到的显示屏图像;
图4为本发明实施例中对图3中的显示屏图像裁剪后的显示屏区域图像;
图5为本发明实施例中显示框的提取结果图;
图6为本发明实施例中显示框标签的提取结果图;
图7为本发明实施例中显示框图像处理结果图;
图8为本发明中所述采集系统的系统框图。
具体实施方式
下面结合附图和具体实施实例对发明做进一步说明。本发明通过对离散制造业中的非联网生产机器的控制终端显示屏进行拍照,并采用图像处理与文字识别的技术手段,提取屏幕显示的机器运行状态和生产实绩信息,基于OpenCV库通过编程实现图像处理与文字识别。提供了一种通过智能手机对非联网生产机器附带控制终端显示屏进行图像采集、处理和识别的技术方案,将屏幕显示的机器运行状态和生产实绩数据提取出来,再通过无线通讯方式传递至企业服务器的方法和系统。图2给出了一幅生产机器的控制终端显示屏的内容示意图,本发明所述的显示框标签是指通过文字显示的标签,例如实际生产中常用的显示框标签有:设定速度、实际速度、设定长度、实际长度、运行状态等;显示框是指显示框标签所对应的显示框,显示框中的内容可以是文字(比如是具体设定的速度值、当前时刻的实际速度值、设定的长度值、当前时刻的实际长度值),也可以是表示运行状态的颜色(比如设备当前状态为运行时颜色为绿色,如果设备停止时颜色为红色),本发明需要将显示框标签所表达的文字提取出来,同时将其对应的显示框中显示的颜色或文字提取出来。
如图1所示,一种基于智能手机图像识别的生产信息采集方法,通过智能手机拍摄生产机器附带控制终端显示屏的图像,并裁剪出显示屏所在的图像区域;在显示屏图像区域中提取出显示框、显示框标签的外部轮廓;提取出显示框标签的文字,提取出显示框中显示的颜色或文字,并在智能手机页面进行显示;将识别并人工检查确认后的显示框标签的文字以及对应显示框显示的颜色或文字传输到服务器,具体包括如下步骤:
步骤1:初始化设置,通过智能手机获取生产机器附带控制终端显示屏工作状态下的显示屏图像,并提取显示屏所在图像区域的背景色以及待识别显示框标签的文字颜色、待识别显示框的背景色、待识别显示框中文字的颜色,作为待识别图像特征的预设对比色;包括:
步骤1.1:通过智能手机对生产机器附带的控制终端显示屏拍照,获取整个显示屏的屏幕图像,如图3所示;
步骤1.2:人工提取显示屏图像区域的背景色,以及显示屏图像区域中待识别显示框标签的文字颜色、待识别显示框的背景色、待识别显示框中文字的颜色,作为待识别图像特征的预设对比色,并存入数组,建立后续图像处理和识别的判定依据;
步骤2:图像采集,拍摄生产机器附带控制终端显示屏的屏幕图像作为待识别图像,对待识别图像进行预处理,裁剪出待识别图像中的显示屏区域;包括:
步骤2.1:智能手机拍摄生产机器附带控制终端显示屏的屏幕图像作为待识别图像;
步骤2.2:将待识别图像通过cvtColor函数转换为色调、饱和度、明度(简称HSV)颜色空间;
步骤2.3:根据预设的显示屏图像区域的背景色,通过inRange函数过滤掉待识别图像中除显示屏图像区域背景色之外的其它颜色,即将显示屏区域图像的像素值变为255,其它区域图像的像素值变为0;
步骤2.4:对过滤掉其它颜色之后的图像通过dilate函数进行膨胀操作,使显示屏轮廓更明显,便于分割显示屏区域;
步骤2.5:对膨胀操作后的图像通过medianBlur函数实现中值滤波操作去除图像中的噪点;
步骤2.6:对噪点去除后的图像采用Canny算法进行边缘检测,并利用findContours函数提取出图像内部的所有轮廓;
步骤2.7:通过contourArea函数计算提取到的所有轮廓的面积,找到面积最大的轮廓,然后通过approxPolyDP函数对面积最大的轮廓进行多边拟合得到显示屏的近似轮廓;
步骤2.8:对得到的显示屏的近似轮廓进行轮廓检测,通过len函数获取显示屏的近似轮廓的角点数,如果检测到显示屏的近似轮廓的角点数为四个,则返回这四个角点作为显示屏区域的四个顶点,继续执行步骤2.9;如果检测到的角点数不是四个,则说明当前处理的待识别图像不合格,提示用户重新拍摄,执行步骤2.1;
步骤2.9:对显示屏的近似轮廓的四个角点所对应的图像区域通过four_point_transform方法进行四点透视变换,切割出显示屏区域,最后提取到的显示屏区域的图像如图4所示;
步骤3:查找显示屏区域中所有待识别显示框的外部轮廓;包括:
步骤3.1:将显示屏区域的图像通过cvtColor函数转换成HSV颜色空间;
步骤3.2:通过inRange函数过滤掉显示屏区域图像中除待识别显示框的背景色之外的其它颜色;
步骤3.3:对过滤掉其它颜色之后的图像通过medianBlur函数进行平滑处理;
步骤3.4:对平滑处理后的图像通过Canny算法进行边缘检测,并利用findContours函数提取出图像内部的所有轮廓;
步骤3.5:通过boundingRect方法找到每个轮廓的左上角坐标和轮廓宽、高;
步骤3.6:根据显示屏区域图像生成两个宽、高相同的黑色图A、B,根据左上角坐标和轮廓的宽、高利用rectangle函数在黑色图A上画出每个轮廓的最大外接矩形;
步骤3.7:对每个轮廓的最大外接矩形的轮廓点通过approxPolyDP函数做多边拟合处理,根据多边拟合处理得到的角点通过polylines函数在黑色图B上绘制轮廓,判断黑色图B中的每个轮廓是否有四个角点,返回有四个角点的轮廓的坐标,即为查找到的显示屏区域中的显示框的外部轮廓的坐标。
步骤4:查找显示屏区域中所有待识别显示框标签的外部轮廓;包括:
步骤4.1:通过boundingRect方法找到显示框外部轮廓的左上角坐标和轮廓宽、高,以显示框标签所对应的显示框的外部轮廓的高构成的正方形为移动单位,以显示框的外部轮廓的左侧边为起点,以移动单位为步长向左移动;
步骤4.2:每移动一次检测移动单位内是否有待识别显示框标签文字的颜色,将第一个找到的有待识别显示框标签文字颜色的移动单位的右侧边作为显示框标签外部轮廓右侧边;
检测移动单位内是否有待识别显示框标签文字的颜色,具体描述为:
通过four_point_transform方法根据移动单位的轮廓的坐标对显示屏区域图像进行四点透视变换,切割出该移动单位所在区域的图像,通过cvtColor函数将切割出的移动单位所在区域的图像转换成HSV颜色空间,使用inRange函数过滤掉除待识别显示框标签的文字颜色之外的颜色,再利用Canny算法进行边缘检测,通过findContours函数查找移动单位所在区域的图像中的轮廓数,如果轮廓数不为0,表示移动单位所在的图像区域有显示框标签;如果轮廓数为0,表示移动单位所在的图像区域没有显示框标签;
步骤4.3:继续向左侧水平方向移动,当检测到移动单位内的颜色不包含有待识别显示框标签文字的颜色时,将移动单位的右侧边作为显示框标签外部轮廓的左侧边;如果向左移动过程中,移动到显示屏区域左侧的轮廓线时检测到移动单位内一直有待识别显示框标签文字的颜色,则让显示屏区域左侧的轮廓线作为显示框标签外部轮廓的左侧边;
判断是否移动到显示屏区域左侧的轮廓线,具体描述为:
通过boundingRect方法找到每个显示框外部轮廓的左上角坐标和轮廓宽、高,用显示框外部轮廓的左上角横坐标大小除以显示框外部轮廓的高度,获取显示框外部轮廓左侧移动单位的个数,将移动单位的个数作为对每个显示框查找对应显示框标签时for循环的次数,即移动单位向左移动的次数,最后一次移动到显示屏区域左侧的轮廓线;
步骤4.4:将显示框标签外部轮廓的左侧边与显示框标签外部轮廓右侧边构成的矩形作为显示框标签所在的外部轮廓。
步骤5:将查找到的显示框标签的外部轮廓的坐标与所对应的显示框的外部轮廓的坐标以数组的形式一一对应存储;
步骤6:分割出所有的显示框标签和显示框;包括:
步骤6.1:根据每个显示框的外部轮廓的坐标,对显示框的外部轮廓所对应的图像区域通过four_point_transform方法进行四点透视变换,切割出每个显示框所在的图像区域Qi,切割结果如图5所示,并将图像的文件名保存在数组中;
步骤6.2:根据每个显示框标签的外部轮廓的坐标,对每个显示框标签的外部轮廓所对应的图像区域通过four_point_transform方法进行四点透视变换,切割出每个显示框标签所在的图像区域Pi,切割结果如图6所示,并将图像的文件名保存在数组中;
步骤7:将分割出的显示框标签的图像区域进行灰度化,调用库函数Tesseract的应用程序接口(简称API接口)对灰度化处理后图像进行识别,得到显示框标签的文字;
步骤8:提取与显示框标签所对应的显示框中显示的颜色或文字;如果显示框中没有预设的待识别显示框中文字的颜色,则对显示框进行颜色的提取,包括:
步骤8.1.1:将分割后的图像区域Qi由红色、绿色、蓝色(简称RGB)颜色空间转换成HSV颜色空间,在HSV颜色空间通过equalizeHist函数对图像做直方图均衡化处理,通过inRange函数进行颜色检测,过滤掉除待识别显示框的背景色外的其它颜色,得到图像区域Qi的二值图像;
步骤8.1.2:通过contourArea方法计算二值图像中白色区域的面积si,并比较面积si与图像区域Qi面积之间的大小;
步骤8.1.3:如果面积si达到图像区域Qi面积的70%及以上,提取出待识别显示框的背景色;
步骤8.1.4:将显示框标签的文字以及对应显示框中显示的颜色一一对应存储;
如果显示框中有预设的待识别显示框中文字的颜色,则对显示框进行文字的提取,包括:
步骤8.2.1:首先对显示框标签所在的图像区域Pi通过morphologyEx函数进行闭运算,然后通过numpy中where()函数在每个局部最大像素之间除以255来执行增益调整,通过numpy中clip函数将增益调整后的像素值控制在值域区间[0,255],得出各点的新像素值;
步骤8.2.2:将新像素值下的图像通过cvtColor函数进行灰度化处理;
步骤8.2.3:将灰度化处理后的图像通过normalize方法进行归一化处理;
步骤8.2.4:将归一化处理后的图像使用numpy中uint8类型存储图像,基于threshold函数进行二值化处理得到二值图像如图7所示,其中threshold函数的阈值通过大津法获得;
步骤8.2.5:调用库函数Tesseract的API接口对二值图像进行识别,得到表达的文字;
步骤8.2.6:将显示框标签的文字以及对应显示框中的文字一一对应存储;
步骤9:将识别到的显示框标签的文字以及对应显示框中显示的颜色或文字在手机屏幕页面进行显示,最后提取得到的所有显示框标签以及对应显示框中的内容如表1所示;
步骤10:人工检查手机屏幕页面所显示的显示框标签的文字以及对应显示框中显示的颜色或文字与拍摄的显示屏图像内容是否相同,如果相同,确认提交数据,通过无线网络传输并存储至服务器的数据库中,如果不同,提示用户重新拍摄。
如图8所示,一种实现基于智能手机图像识别的生产信息采集方法的信息采集系统,该系统运行在智能手机上,包括:登录模块、初始化配置模块、图像采集模块、图像处理与识别模块、数据传输模块;
所述登录模块用于用户登录,连接服务器;
所述初始化模块用于初始化设置,实现对显示屏图像的背景色以及待识别特征的颜色或背景色的提取,作为待识别图像特征的预设对比色;
所述图像采集模块用于对生产机器附带的控制终端显示屏进行拍照并保存图像;
所述图像处理与识别模块用于对图像进行处理,识别出图像中显示框标签的文字以及对应显示框所显示的颜色或文字;
所述数据传输模块用于对识别出的显示框标签文字以及对应显示框所显示的颜色或文字与显示屏图像进行人工对比判断,如果正确,则通过无线网络传输到服务器的数据库中存储;否则,提示用户重新进行拍摄。
表1显示框标签以及对应显示框中的文字
显示框标签 显示框文字
设定速度 1444.8
实际速度 2300.0
设定长度 0.0
实际长度 1.5
运行状态 绿色

Claims (10)

1.一种基于智能手机图像识别的生产信息采集方法,其特征在于,通过智能手机拍摄生产机器附带控制终端显示屏的图像,并裁剪出显示屏所在的图像区域;在显示屏图像区域中提取出显示框、显示框标签的外部轮廓;提取出显示框标签的文字,提取出显示框中显示的颜色或文字,并在智能手机页面进行显示;将识别并人工检查确认后的显示框标签的文字以及对应显示框显示的颜色或文字传输到服务器。
2.根据权利要求1所述的一种基于智能手机图像识别的生产信息采集方法,其特征在于,包括:
步骤1:初始化设置,通过智能手机获取生产机器附带控制终端显示屏工作状态下的显示屏图像,提取显示屏所在图像区域的背景色以及待识别显示框标签的文字颜色、待识别显示框的背景色、待识别显示框中文字的颜色,作为待识别图像特征的预设对比色;
步骤2:图像采集,拍摄生产机器附带控制终端显示屏的屏幕图像作为待识别图像,对待识别图像进行预处理,裁剪出待识别图像中的显示屏区域;
步骤3:查找显示屏区域中所有待识别显示框的外部轮廓;
步骤4:查找显示屏区域中所有待识别显示框标签的外部轮廓;
步骤5:将查找到的显示框标签的外部轮廓的坐标与所对应的显示框的外部轮廓的坐标一一对应;
步骤6:分割出所有的显示框标签和显示框;
步骤7:将分割出的显示框标签的图像区域进行灰度化,调用库函数Tesseract的API接口对灰度化处理后图像进行识别,得到显示框标签的文字;
步骤8:提取与显示框标签对应的显示框中显示的颜色或文字;
步骤9:将识别到的显示框标签的文字以及对应显示框中显示的颜色或文字显示到手机屏幕页面;
步骤10:检查手机屏幕页面所显示的显示框标签的文字以及对应显示框中显示的颜色或文字与拍摄的显示屏图像内容是否相同,如果相同,确认提交数据,通过无线网络传输并存储至服务器的数据库中,如果不同,提示用户重新拍摄。
3.根据权利要求2所述的一种基于智能手机图像识别的生产信息采集方法,其特征在于,所述步骤1包括:
步骤1.1:通过智能手机对生产机器附带的控制终端显示屏拍照,获取整个显示屏的屏幕图像;
步骤1.2:提取显示屏图像区域的背景色,以及显示屏图像区域中待识别显示框标签的文字颜色、待识别显示框的背景色、待识别显示框中文字的颜色,作为待识别图像特征的预设对比色。
4.根据权利要求2所述的一种基于智能手机图像识别的生产信息采集方法,其特征在于,所述步骤2包括:
步骤2.1:拍摄生产机器附带控制终端显示屏的屏幕图像作为待识别图像;
步骤2.2:将待识别图像转换为HSV颜色空间;
步骤2.3:过滤掉待识别图像中除显示屏图像区域的背景色之外的其它颜色;
步骤2.4:对过滤掉其它颜色之后的图像进行膨胀操作;
步骤2.5:对膨胀操作后的图像通过中值滤波去除图像中的噪点;
步骤2.6:对噪点去除后的图像进行边缘检测,并提取出图像内部的所有轮廓;
步骤2.7:在提取到的所有轮廓中找到面积最大的轮廓,然后进行多边拟合得到显示屏的近似轮廓;
步骤2.8:对得到的显示屏的近似轮廓进行轮廓检测,如果检测到显示屏的近似轮廓的角点数为四个,则说明当前处理的待识别图像合格,继续执行步骤2.9;如果检测到的角点数不是四个,则说明当前处理的待识别图像不合格,提示用户重新拍摄,执行步骤2.1;
步骤2.9:对显示屏的近似轮廓的四个角点所对应的图像区域进行四点透视变换,切割出显示屏区域。
5.根据权利要求2所述的一种基于智能手机图像识别的生产信息采集方法,其特征在于,所述步骤3包括:
步骤3.1:将显示屏区域的图像转换成HSV颜色空间;
步骤3.2:过滤掉显示屏区域图像中除待识别显示框的背景色之外的其它颜色;
步骤3.3:对过滤掉其它颜色之后的图像进行平滑处理;
步骤3.4:对平滑处理后的图像进行边缘检测,并提取出图像内部的所有轮廓;
步骤3.5:获取每个轮廓的左上角坐标和轮廓的宽、高;
步骤3.6:根据左上角坐标和轮廓的宽、高画出每个轮廓的最大外接矩形;
步骤3.7:检测每个最大外接矩形轮廓的角点数,有四个角点数的轮廓即为查找到的显示屏区域中的显示框的外部轮廓。
6.根据权利要求2所述的一种基于智能手机图像识别的生产信息采集方法,其特征在于,所述步骤4包括:
步骤4.1:以显示框标签所对应的显示框的外部轮廓的高构成的正方形为移动单位,以显示框的外部轮廓的左侧边为起点,以移动单位为步长向左移动;
步骤4.2:每移动一次检测移动单位内是否有待识别显示框标签文字的颜色,将第一个找到的有待识别显示框标签文字颜色的移动单位的右侧边作为显示框标签外部轮廓右侧边;
步骤4.3:继续向左侧水平方向移动,当检测到移动单位内的颜色不包含有待识别显示框标签文字的颜色时,将移动单位的右侧边作为显示框标签外部轮廓的左侧边;如果向左移动过程中,移动到显示屏区域左侧的轮廓线时检测到移动单位内一直有待识别显示框标签文字的颜色,则让显示屏区域左侧的轮廓线作为显示框标签外部轮廓的左侧边;
步骤4.4:将显示框标签外部轮廓的左侧边与显示框标签外部轮廓右侧边构成的矩形作为显示框标签所在的外部轮廓。
7.根据权利要求2所述的一种基于智能手机图像识别的生产信息采集方法,其特征在于,所述步骤6包括:
步骤6.1:对每个显示框的外部轮廓所对应的图像区域进行四点透视变换,切割出每个显示框所在的图像区域Qi
步骤6.2:对每个显示框标签的外部轮廓所对应的图像区域进行四点透视变换,切割出每个显示框标签所在的图像区域Pi
8.根据权利要求2所述的一种基于智能手机图像识别的生产信息采集方法,其特征在于,所述步骤8中,如果显示框中没有预设的待识别显示框中文字的颜色,则对显示框进行颜色的提取,包括:
步骤8.1.1:将分割后的图像区域Qi由RGB颜色空间转换成HSV颜色空间,在HSV颜色空间对图像做直方图均衡化处理,过滤掉除待识别显示框的背景色外的其它颜色,得到图像区域Qi的二值图像;
步骤8.1.2:计算二值图像中白色区域的面积si,并比较面积si与图像区域Qi面积之间的大小;
步骤8.1.3:如果面积si达到图像区域Qi面积的q%及以上,提取出待识别显示框的背景色;
步骤8.1.4:将显示框标签的文字以及对应显示框中显示的颜色一一对应存储。
9.据权利要求2所述的一种基于智能手机图像识别的生产信息采集方法,其特征在于,所述步骤8中,如果显示框中有预设的待识别显示框中文字的颜色,则对显示框进行文字的提取,包括:
步骤8.2.1:首先对分割后的图像区域Qi进行闭运算,然后通过在每个局部最大像素之间除以255来执行增益调整,将增益调整后的像素值控制在值域区间[0,255],得出各点的新像素值;
步骤8.2.2:将新像素值下的图像进行灰度化处理;
步骤8.2.3:将灰度化处理后的图像进行归一化处理;
步骤8.2.4:将归一化处理后的图像进行二值化处理得到二值图像;
步骤8.2.5:调用库函数Tesseract的API接口对二值图像进行识别,得到表达的文字;
步骤8.2.6:将显示框标签的文字以及对应显示框中的文字一一对应存储。
10.一种实现权利要求1~9所述的基于智能手机图像识别的生产信息采集方法的信息采集系统,其特征在于,该系统运行在智能手机上,包括:登录模块、初始化配置模块、图像采集模块、图像处理与识别模块、数据传输模块;
所述登录模块用于用户登录,连接服务器;
所述初始化模块用于初始化设置,实现对显示屏图像的背景色以及待识别特征的颜色或背景色的提取,作为待识别图像特征的预设对比色;
所述图像采集模块用于对生产机器附带的控制终端显示屏进行拍照并保存图像;
所述图像处理与识别模块用于对图像进行处理,识别出图像中显示框标签的文字以及对应显示框所显示的颜色或文字;
所述数据传输模块用于对识别出的显示框标签文字以及对应显示框所显示的颜色或文字与显示屏图像进行人工对比判断,如果正确,则通过无线网络传输到服务器的数据库中存储;否则,提示用户重新进行拍摄。
CN202110755054.9A 2021-07-02 2021-07-02 基于智能手机图像识别的生产信息采集方法及系统 Active CN113486892B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110755054.9A CN113486892B (zh) 2021-07-02 2021-07-02 基于智能手机图像识别的生产信息采集方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110755054.9A CN113486892B (zh) 2021-07-02 2021-07-02 基于智能手机图像识别的生产信息采集方法及系统

Publications (2)

Publication Number Publication Date
CN113486892A true CN113486892A (zh) 2021-10-08
CN113486892B CN113486892B (zh) 2023-11-28

Family

ID=77940675

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110755054.9A Active CN113486892B (zh) 2021-07-02 2021-07-02 基于智能手机图像识别的生产信息采集方法及系统

Country Status (1)

Country Link
CN (1) CN113486892B (zh)

Citations (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050022644A (ko) * 2003-08-29 2005-03-08 (주)아이미디어아이앤씨 정보 표시용 이미지 태그 및 그 인식 방법과 장치
JP2007086945A (ja) * 2005-09-21 2007-04-05 Ricoh Co Ltd 画像処理装置、画像処理方法及び該方法を実行するための画像処理プログラムを格納したコンピュータ読み取り可能な記録媒体
CN106228159A (zh) * 2016-07-29 2016-12-14 深圳友讯达科技股份有限公司 一种基于图像识别的计量表抄表装置及其方法
CN107665348A (zh) * 2017-09-26 2018-02-06 山东鲁能智能技术有限公司 一种变电站数字仪表的数字识别方法和装置
KR20180086776A (ko) * 2017-01-23 2018-08-01 한국과학기술연구원 태깅 어플리케이션을 이용하여 식물 식별 정보를 태깅 및 분석하는 방법, 이를 실행하는 휴대용 스마트 기기 및 이를 포함하는 식물 생육정보 분석 시스템
CN108460344A (zh) * 2018-02-07 2018-08-28 北京工业大数据创新中心有限公司 屏幕中的动态区域智能识别系统及智能识别方法
CN109447169A (zh) * 2018-11-02 2019-03-08 北京旷视科技有限公司 图像处理方法及其模型的训练方法、装置和电子系统
CN109508714A (zh) * 2018-08-23 2019-03-22 广州市心鉴智控科技有限公司 一种低成本多通道实时数字仪表盘视觉识别方法及系统
CN110070524A (zh) * 2019-04-03 2019-07-30 北京东舟技术股份有限公司 一种智能终端面板视觉故障检测系统
CN110097046A (zh) * 2019-03-11 2019-08-06 上海肇观电子科技有限公司 一种文字检测方法及装置、设备和计算机可读存储介质
CN110119741A (zh) * 2019-04-08 2019-08-13 浙江大学宁波理工学院 一种有背景的卡证图像信息识别方法
CN110298352A (zh) * 2019-06-28 2019-10-01 浙江中烟工业有限责任公司 一种香烟包装机检测装置的屏幕数据的提取装置及方法
CN110659645A (zh) * 2019-08-05 2020-01-07 沈阳工业大学 一种数字仪表字符识别方法
CN110717397A (zh) * 2019-09-11 2020-01-21 中国海洋大学 一种基于手机相机的在线翻译系统
CN110767292A (zh) * 2019-10-12 2020-02-07 腾讯科技(深圳)有限公司 病理编号识别方法、信息识别方法、装置及信息识别系统
CN111198644A (zh) * 2018-11-16 2020-05-26 西安易朴通讯技术有限公司 智能终端的屏幕操作的识别方法及系统
CN111399638A (zh) * 2020-02-29 2020-07-10 浙江工业大学 一种盲用电脑及适配于盲用电脑的智能手机辅助控制方法
CN111860687A (zh) * 2020-07-31 2020-10-30 中国铁塔股份有限公司 一种图像识别方法、装置、电子设备和存储介质
CN111881913A (zh) * 2019-07-05 2020-11-03 深圳数字生命研究院 图像识别方法及装置、存储介质和处理器
CN112419802A (zh) * 2020-11-25 2021-02-26 上海体育学院 基于多维度立体成像技术的体育虚拟教学指导系统
WO2021051604A1 (zh) * 2019-09-19 2021-03-25 平安科技(深圳)有限公司 Osd的文字区域的识别方法、装置及存储介质
WO2021077863A1 (zh) * 2019-10-25 2021-04-29 华为技术有限公司 终端消息处理方法及其图像识别方法、装置、介质和系统
CN112861850A (zh) * 2021-01-07 2021-05-28 北京三缘聚科技有限公司 一种实现移动终端近距离提取文字的方法及系统

Patent Citations (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050022644A (ko) * 2003-08-29 2005-03-08 (주)아이미디어아이앤씨 정보 표시용 이미지 태그 및 그 인식 방법과 장치
JP2007086945A (ja) * 2005-09-21 2007-04-05 Ricoh Co Ltd 画像処理装置、画像処理方法及び該方法を実行するための画像処理プログラムを格納したコンピュータ読み取り可能な記録媒体
CN106228159A (zh) * 2016-07-29 2016-12-14 深圳友讯达科技股份有限公司 一种基于图像识别的计量表抄表装置及其方法
KR20180086776A (ko) * 2017-01-23 2018-08-01 한국과학기술연구원 태깅 어플리케이션을 이용하여 식물 식별 정보를 태깅 및 분석하는 방법, 이를 실행하는 휴대용 스마트 기기 및 이를 포함하는 식물 생육정보 분석 시스템
CN107665348A (zh) * 2017-09-26 2018-02-06 山东鲁能智能技术有限公司 一种变电站数字仪表的数字识别方法和装置
CN108460344A (zh) * 2018-02-07 2018-08-28 北京工业大数据创新中心有限公司 屏幕中的动态区域智能识别系统及智能识别方法
CN109508714A (zh) * 2018-08-23 2019-03-22 广州市心鉴智控科技有限公司 一种低成本多通道实时数字仪表盘视觉识别方法及系统
CN109447169A (zh) * 2018-11-02 2019-03-08 北京旷视科技有限公司 图像处理方法及其模型的训练方法、装置和电子系统
CN111198644A (zh) * 2018-11-16 2020-05-26 西安易朴通讯技术有限公司 智能终端的屏幕操作的识别方法及系统
CN110097046A (zh) * 2019-03-11 2019-08-06 上海肇观电子科技有限公司 一种文字检测方法及装置、设备和计算机可读存储介质
CN110070524A (zh) * 2019-04-03 2019-07-30 北京东舟技术股份有限公司 一种智能终端面板视觉故障检测系统
CN110119741A (zh) * 2019-04-08 2019-08-13 浙江大学宁波理工学院 一种有背景的卡证图像信息识别方法
CN110298352A (zh) * 2019-06-28 2019-10-01 浙江中烟工业有限责任公司 一种香烟包装机检测装置的屏幕数据的提取装置及方法
CN111881913A (zh) * 2019-07-05 2020-11-03 深圳数字生命研究院 图像识别方法及装置、存储介质和处理器
CN110659645A (zh) * 2019-08-05 2020-01-07 沈阳工业大学 一种数字仪表字符识别方法
CN110717397A (zh) * 2019-09-11 2020-01-21 中国海洋大学 一种基于手机相机的在线翻译系统
WO2021051604A1 (zh) * 2019-09-19 2021-03-25 平安科技(深圳)有限公司 Osd的文字区域的识别方法、装置及存储介质
CN110767292A (zh) * 2019-10-12 2020-02-07 腾讯科技(深圳)有限公司 病理编号识别方法、信息识别方法、装置及信息识别系统
WO2021077863A1 (zh) * 2019-10-25 2021-04-29 华为技术有限公司 终端消息处理方法及其图像识别方法、装置、介质和系统
CN111399638A (zh) * 2020-02-29 2020-07-10 浙江工业大学 一种盲用电脑及适配于盲用电脑的智能手机辅助控制方法
CN111860687A (zh) * 2020-07-31 2020-10-30 中国铁塔股份有限公司 一种图像识别方法、装置、电子设备和存储介质
CN112419802A (zh) * 2020-11-25 2021-02-26 上海体育学院 基于多维度立体成像技术的体育虚拟教学指导系统
CN112861850A (zh) * 2021-01-07 2021-05-28 北京三缘聚科技有限公司 一种实现移动终端近距离提取文字的方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
LI Y等: "Implementation of telephone number recognition inexpress list based on tesseract-OCR", ELECTIONIC TEST, pages 1 - 7 *
郑昌庭;王俊;郑克;: "基于图像识别的变电站巡检机器人仪表识别研究", 工业仪表与自动化装置, no. 05, pages 61 - 65 *

Also Published As

Publication number Publication date
CN113486892B (zh) 2023-11-28

Similar Documents

Publication Publication Date Title
CN109785316B (zh) 一种芯片表观缺陷检测方法
CN109409355B (zh) 一种新型变压器铭牌识别的方法及装置
CN104715239B (zh) 一种基于去雾处理和权重分块的车辆颜色识别方法
CN110309806B (zh) 一种基于视频图像处理的手势识别系统及其方法
CN101697196A (zh) 摄像机铭牌序列号数字识别系统及方法
CN110569774B (zh) 基于图像处理与模式识别的折线图图像自动数字化方法
CN103295009B (zh) 基于笔画分解的车牌字符识别方法
CN108460344A (zh) 屏幕中的动态区域智能识别系统及智能识别方法
CN112883881B (zh) 一种条状农产品无序分拣方法及装置
CN114049499A (zh) 用于连续轮廓的目标对象检测方法、设备及存储介质
CN110929562A (zh) 一种基于改进Hough变换的答题卡识别方法
CN109726777A (zh) 基于互联网的pcb外观检测系统及检测方法
CN108345867A (zh) 面向智能家居场景的手势识别方法
CN111339906A (zh) 一种图像处理设备和图像处理系统
CN115100657A (zh) 电气cad图纸扫描图的字符与带宽度的线条识别方法
CN109086643B (zh) 一种基于机器视觉的彩盒标签检测方法及系统
CN113145473A (zh) 一种水果智能分拣系统及方法
CN110135274B (zh) 一种基于人脸识别的人流量统计方法
CN113486892B (zh) 基于智能手机图像识别的生产信息采集方法及系统
CN112528740A (zh) 一种压板状态识别方法
CN111738264A (zh) 一种机房设备显示面板数据的智能采集方法
CN113705487B (zh) 精密工件识别及工艺参数关联系统以及识别方法
CN114627463A (zh) 一种基于机器识别的非接触式配电数据识别方法
CN111242121B (zh) 一种基于svm的对联智能分拣方法及存储介质
CN108549855A (zh) 面向智能家居场景的实时人形检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant