CN117079290A

CN117079290A - 一种基于产品标签信息的图像识别方法

Info

Publication number: CN117079290A
Application number: CN202310920691.6A
Authority: CN
Inventors: 刘瑞欣; 何伟锋; 秦雷; 臧东情; 张卫东; 汪士清; 王洪福; 刘鑫; 李佳
Original assignee: Beijing Aerospace Propulsion Institute
Current assignee: Beijing Aerospace Propulsion Institute
Priority date: 2023-07-25
Filing date: 2023-07-25
Publication date: 2023-11-17

Abstract

本发明涉及一种基于产品标签信息的图像识别方法，包括：获取同一批次产品的标签图像；对标签图像进行预处理；以任意一张标签图像作为参考图，创建用户感兴趣的标签内容所对应的属性部分作为模板；匹配模板，得到剩余标签图像的匹配区域；在剩余标签图像中定位出标签图像匹配区域；进而定位出标签图像ROI区域；对该ROI内的信息进行字符分割、字符识别；对字符进行后处理并上传。本发明方法适合多种标签类型，可识别任意用户感兴趣的标签内容，且在任何拍摄角度均能准确定位和识别产品信息。实现了自动、快速和准确地对产品标签信息的录入，极大提升了现场工作效率、提高录入信息的准确率。

Description

一种基于产品标签信息的图像识别方法

技术领域

本发明属于图像识别与机器视觉技术领域，涉及一种基于产品标签信息的图像识别方法。

背景技术

随着图像处理和机器视觉技术的高速发展，给产品试验领域带来了新的发展方向。目前，产品数据信息录入的工作越来越多，产品图号等关键信息都需要人手工抄录、工作效率低下，容易出现错录和漏录等情况。且由于数据存储在纸质文件上，无法对相关数据进行统一有效管理，影响试验工作的高效开展。

专利CN 109190630.A提出一种字符识别方法，通过获取待识别图像，将该图像进行二值化处理，之后，分为若干单字符图像，最后对单字符图像输入字符识别模型进行识别。提出的方法能够对常见汉字进行全面覆盖，对当前存在的身份证识别效果良好。但是该种方法只适用于模板固定、背景字体大小等均一致的字符识别过程中，对标签本身的限制较多，不具有通用性。

专利CN 105956590.A涉及一种票据的字符识别方法和字符识别系统，包括以下步骤：利用用户终端获取待识别票据的图像，并上传至服务器；服务器包括基本识别库和扩展识别库；首先调用基本识别库，根据识别错误率决定图像存储到哪一存储区域，对错误率较高的，对图像进行扩展字符识别。该种方法解决了超市小票打印的不确定因素导致的识别困难，可以根据识别准确性扩展字符库，提升了票据识别的准确率。但是对于拍摄角度的要求较高，对于任意拍摄角度得到的票据图像，识别的准确性低。

以上两种方法适用于不同的应用场景。在试验过程中对于产品标签的信息的识别，标签的类型多变，但是拍摄场景相对固定，影响图片成像的不可控因素较少。由此，结合产品标签类型和试验过程的特点，需要设计一种适用于绝大多数产品标签信息图像识别的方法，且不受试验拍摄过程角度的不确定性影响，实现在任意拍照角度准确识别字符。

发明内容

本发明解决的技术问题是：克服现有技术的不足，提出一种基于产品标签信息的图像识别方法，适用于绝大多数产品标签，且能够根据用户需求灵活设置模板，由此识别感兴趣的信息；此外，结合试验拍摄过程角度的不确定性，实现在任意拍照角度准确识别字符。

本发明解决技术的方案是：一种基于产品标签信息的图像识别方法，包括以下步骤：S1、获取同一批次产品的标签图像；

S2、对标签图像进行对比度处理；

S3、创建模板：以任意一张标签图像作为参考图，所述模板为参考图中截取出的一个矩形图像块，模板所包含的图像信息为用户感兴趣的标签内容所对应的属性名称；

S4、在进行对比度处理后的剩余的标签图像中匹配模板，找到剩余标签图像中与模板所包含的图像信息相同的区域，记为匹配区域；

S5、在剩余标签图像中定位出标签图像匹配区域；

S6、按照已知的属性名称与对应的标签内容之间的相对位置关系，对标签图像匹配区域的顶点坐标进行相应的坐标计算，得到所述标签内容的各顶点坐标，定位出标签图像ROI区域；

S7、提取标签图像ROI区域内的字符，若ROI区域内的字符在值域范围内，进入S8，否则更换更高清晰度的产品标签，进行对比度处理后进入S4；

S8、按照设定的字符长度、宽度、字符的间距，对ROI区域内的字符进行分割；

S9、利用机器视觉识别方法对分割后的字符进行字符识别；

S10、对识别到的字符按照存储格式要求统一上传至记录系统，完成产品标签信息的图像识别。

进一步的，S2所述对标签图像进行对比度处理，具体为：

使用分量法进行灰度处理：对真彩图中R、G、B这三个颜色通道，提取其中一个颜色通道的分量进行灰度化；

使用灰度变换法在空间域对灰度化的标签图像进行像素处理，将被处理图像I的每个像素点的灰度值按照相同的计算方法进行缩小，以增强被处理图像I的对比度，得到进行对比度处理之后的标签图像F。

进一步的，使用灰度变换法进行处理的计算方法为：

其中，I(i，j)为被处理图像I在像素点(i，j)的灰度值，F(i，j)为进行对比度处理之后的标签图像F在像素点(i，j)的灰度值，a为被处理图像I中的最小灰度值，b为被处理图像I中的最大灰度值，c为预设的进行对比度处理之后的标签图像F中的最小灰度值，d为预设的进行对比度处理之后的标签图像F中的最大灰度值。

进一步的，S3所述创建模板包括手动创建模板的方式：

将对比度处理后的标签图像，利用LabVIEW软件中的截取图像功能手动勾选用户感兴趣的标签内容所对应的属性名称所在区域，截取出的矩形图像块作为模板并存储；

模板为标签的部分内容，如果预览的信息无误，则确定创建模板成功；否则，重新创建模板。

进一步的，S4所述在进行对比度处理后的标签图像中匹配模板，具体为：

采用低差异抽样算法进行基于外形特征的几何匹配过程，包括模板的边缘曲线和几何特征提取与排序，模板所包含的图像信息外形特征的提取，完成模板特征学习；

将模板所包含的图像信息存入文件，将该批次产品标签图像和模板文件中的图像信息进行模板特征关联映射，得到匹配度；当该批次产品标签图像的某个区域与相对应的模板文件匹配度超过阈值时，匹配成功，找到了标签图像中与模板所包含的图像信息相同的区域。

进一步的，S5所述在剩余标签图像中定位出标签图像匹配区域，具体为：

根据匹配到的模板的长度、宽度，得到模板表示的矩形图像块的大小；

以模板表示的矩形图像块在参考图中左上顶点为坐标原点O、沿矩形图像块边沿向下方向为y轴建立间接坐标系，x轴与y轴垂直，得到参考坐标系Oxy；

以剩余标签图像中匹配区域的左上顶点为坐标原点O’，沿匹配区域边沿向下方向为y’轴建立间接坐标系，x’轴与y’轴垂直，得到标签坐标系O’x’y’；

按照标签坐标系O’x’y’由参考坐标系Oxy先顺时针旋转θ角度，再将坐标系原点沿x方向平移x₀，沿y方向平移y₀得到，则坐标转换关系如下：

x’＝(x-x₀)cosθ+(y-y₀)sinθ

y’＝(x-x₀)sinθ-(y-y₀)cosθ

其中，(x₀，y₀)为标签坐标系坐标原点O’在参考坐标系下的坐标，(x，y)为参考坐标系中的点，(x’，y’)为标签坐标系中的点；

根据模板表示的矩形图像块的大小和确定的坐标转换关系，计算出剩余标签图像中匹配区域各顶点在参考坐标系下的坐标。

进一步的，S6所述得到所述标签内容的各顶点坐标，具体为：

将属性名称某一顶点与对应的标签内容左上顶点之间的相对位置关系、标签内容区域的长度、宽度作为外部输入，将标签图像匹配区域的对应顶点按照所述相对位置关系进行平移计算，得到标签内容区域的左上顶点坐标；

根据标签内容区域的长度、宽度对标签内容区域的左上顶点坐标进行坐标加法计算，得到所述标签内容的各顶点坐标。

进一步的，S9利用机器视觉识别方法对分割后的字符进行字符识别，具体包括：

S91、获取同类别的标签图像信息，建立样本库；

S92、获取样本库中的字符特征，以不同字符特征为输入，以字符值为输出，建立每个字符的训练模型；

S93、将所有字符的训练模型集成为训练集进行训练，当满足训练次数和或识别准确率要求时，训练完成，将训练结果输入训练好的训练集，得到字符库并保存为文件；

S94、调用S93生成的文件读取字符库的训练信息，与分割后的字符进行匹配，并设定识别字符的参数，包括字符识别得分值；

S95、当算法输出的字符匹配度不低于设定的字符识别得分值，输出对应的字符值，完成字符识别；否则，输出空白字符。

进一步的，S93所述将所有字符的训练模型集成为训练集，设置的参数包括阈值化处理参数，形态学处理参数和字符最小像素属性信息。

本发明与现有技术相比的有益效果是：

(1)本发明与现有技术相比，通过采集拍摄系统和产品信息处理分析终端来实现，实现实时拍照并动态识别标签信息的功能，利用组合图像处理方法，使产品标签的字符和背景区域对比度大幅提高。

(2)本发明提出的方法与现有技术相比，具有普适性，能够根据用户需求灵活设置模板，由此识别感兴趣的信息，可对包含属性和内容的大部分标签类型进行准确、有效的识别。

(3)本发明提出的方法与现有技术相比，通过仿射变换处理，可实现在任意拍照角度准确定位并识别标签信息，角度范围包含0°～360°，极大地提升了操作的便利程度和自动化程度。

(4)本发明提出的方法与现有技术相比，能够满足试验录入信息的特殊性和专用性，可自行实现对专用信息的字符库训练。

附图说明

图1为本发明实施例图像识别方法所涉及的系统架构图；

图2为本发明实施例图像识别方法的流程图；

图3是本发明实施例图像识别方法所涉及的仿射变换原理图。

具体实施方式

下面结合实施例对本发明作进一步阐述。

图1中，为本发明所提出的方法所涉及的系统架构图。光学传感器将外部场景(产品的零件标签)转换为电信号，在经过图像采集设备转换为图像数据流，通过以太网将产品信息上传至产品处理分析终端进行分析和处理，最后通过机器视觉软件发布控制指令，将相关信息上传至记录系统。

实施例1

S1、将待识别的同一批次产品进行整理，确定该批次产品标签的类型，并存入产品信息处理分析终端。

S2、试验人员开始录入产品信息，利用采集拍摄系统对产品的标签界面进行拍摄，得到同一批次产品的标签图像。

S3、产品信息处理分析终端对拍摄得到的图像进行色彩和对比度预处理，使拍摄的产品标签画面清晰、对比度明显。

进行色彩和对比度预处理具体为：

S31、使用分量法进行灰度处理：对真彩图中R、G、B这三个颜色通道，提取其中一个颜色通道(比如R颜色通道)的分量进行灰度化；

S32、使用灰度变换法在空间域对灰度化的标签图像进行像素处理，将被处理图像I的每个像素点的灰度值按照相同的计算方法进行缩小，以增强被处理图像I的对比度，得到进行对比度处理之后的标签图像F。具体计算方法为：

其中，I(i，j)为被处理图像I在像素点(i，j)的灰度值，F(i，j)为进行对比度处理之后的标签图像F在像素点(i，j)的灰度值，a为被处理图像I中的最小灰度值，b为被处理图像I中的最大灰度值，c为预设的进行对比度处理之后的标签图像F中的最小灰度值，d为预设的进行对比度处理之后的标签图像F中的最大灰度值。设置不同的c，d值可以将图像的灰度值进行变换。

S4、根据用户需求手动创建模板：以任意一张标签图像作为参考图，所述模板为参考图中截取出的一个矩形图像块，模板所包含的图像信息为用户感兴趣的标签内容所对应的属性名称。

举例说明用户感兴趣的标签内容：产品生产日期包含的具体的年月日数字，对应的属性名称为：“产品日期”这四个字。

其中，所述手动创建模板的方式具体为：

将对比度处理后的标签图像，利用LabVIEW软件中的截取图像功能手动勾选用户感兴趣的标签内容所对应的属性名称所在区域，截取出的矩形图像块作为模板并存储。

S5、此步骤涉及和用户交互，判断创建模板是否成功：用户手动创建模板后，模板为标签的部分内容，若模板预览信息无误，则提示创建模板成功，进入S6，否则进入S4重新创建模板。

S6、在进行对比度处理后的剩余的标签图像中匹配模板，找到剩余的标签图像中与模板所包含的图像信息相同的区域，记为匹配区域。

匹配模板具体为：采用低差异抽样算法(Low Discrepancy Sampling)进行基于外形特征的几何匹配过程，包括模板的边缘曲线和几何特征提取与排序，模板所包含的图像信息外形特征的提取，完成模板特征学习；

S7、在剩余标签图像中定位出标签图像匹配区域：以模板表示的矩形图像块在参考图中的左上顶点为原点，以过原点的两条边为坐标轴建立参考坐标系，以剩余标签图像中匹配区域的左上顶点为原点，以过原点的两条边为坐标轴建立标签坐标系，进行参考坐标系到标签坐标系的坐标变换，得到剩余标签图像中匹配区域左上顶点在参考坐标系下的坐标，根据模板的长度、宽度，计算出剩余标签图像匹配区域各顶点在参考坐标系下的的坐标。

图3是本发明所提出的方法所涉及的坐标变换原理图，其基本原理介绍如下：

首先，根据匹配到的模板的长度、宽度，得到模板表示的矩形图像块的大小；

然后，以模板表示的矩形图像块在参考图中左上顶点为坐标原点O、沿矩形图像块边沿向下方向为y轴建立间接坐标系，x轴与y轴垂直，得到参考坐标系Oxy；

x’＝(x-x₀)cosθ+(y-y₀)sinθ

y’＝(x-x₀)sinθ-(y-y₀)cosθ

根据矩形图像块的大小和确定的坐标转换关系，计算出剩余标签图像中匹配区域的各顶点坐标。

本实施例中，用户感兴趣的标签内容所在区域称为ROI区域(Region OfInterest)，在标签图像中匹配出与模板所包含的图像信息相同的区域，即找到标签图像中ROI区域对应的属性名称所在位置。

接下来，按照已知的属性名称与对应的标签内容之间的相对位置关系，对标签图像匹配区域的顶点坐标进行相应的坐标计算，得到所述标签内容的各顶点坐标，定位出标签图像ROI区域。

本发明所述标签包括属性名称和内容部分，包括但不限于以下情况的产品标签类型：

内容部分位于属性名称的下方，或者内容部分位于属性名称的右方。

在一个实施例中，将属性名称右下顶点与对应的标签内容左上顶点之间的相对位置关系、标签内容区域的长度、宽度作为外部输入，将标签图像匹配区域的右下顶点按照所述相对位置关系进行平移计算，得到标签内容区域的左上顶点坐标；然后，根据标签内容区域的长度、宽度对标签内容区域的左上顶点坐标进行坐标加法计算，得到所述标签内容的各顶点坐标。

程序中，自动计算并记录ROI区域相对参考坐标系的位置信息，该信息不随拍摄角度发生变化，当产品标签类型固定，该位置信息也随之固定。因此，依据ROI区域与参考坐标系之间的转换关系，无论对用于检测的零件标签进行平移或旋转，对用于检测的ROI做同样的变换，都能确保关键信息相对于特征的位置不变。

S8、定位出标签图像的ROI区域后，提取标签图像ROI区域内的字符，若ROI区域内的字符在值域范围内，不进行提示，直接进入S9；如果字符不在值域范围内，则会显示空白字符，需要更换更高清晰度的产品标签，进行对比度处理后回到S6；或者人工手动输入待识别产品的属性信息，然后进入S9。

S9、截取S8识别的ROI区域，为字符识别做准备。

S10、按照预先的设定值，包括字符长度、宽度、字符的间距等，对ROI区域内的字符进行分割。

S11、利用机器视觉识别方法(Optical Character Recognition，OCR)，对分割后的字符进行字符识别；具体包括以下步骤：

S111、获取同类别的标签图像信息，建立样本库；

S112、获取样本库中的字符特征，以不同字符特征为输入，以字符值为输出，建立每个字符的训练模型；

S113、设置阈值化处理参数、形态学处理参数和字符最小像素属性信息，用于将所有字符的训练模型集成为训练集，使用训练集进行训练，当满足训练次数和或识别准确率要求时，训练完成，将训练结果输入训练好的训练集，得到字符库并保存为文件；

S114、调用S113生成的文件读取字符库的训练信息，与分割后的字符进行匹配，并设定识别字符的参数，包括字符识别得分值；

S115、当算法输出的字符匹配度不低于设定的字符识别得分值，输出对应的字符值，完成字符识别；否则，输出空白字符。

S12、对识别到的字符按照存储格式要求进行后处理(例如：截取识别到的全部字符中的特定位数)，并统一上传至记录系统。

S13、完成产品标签信息的图像识别。

本发明提出的基于产品标签信息的图像识别方法，适用于绝大多数产品标签，且能够根据用户需求灵活设置模板，由此识别感兴趣的信息；此外，结合试验拍摄过程角度的不确定性，实现了在任意拍照角度准确识别字符。

本发明虽然已以较佳实施例公开如上，但其并不是用来限定本发明，任何本领域技术人员在不脱离本发明的精神和范围内，都可以利用上述揭示的方法和技术内容对本发明技术方案做出可能的变动和修改，因此，凡是未脱离本发明技术方案的内容，依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化及修饰，均属于本发明技术方案的保护范围。

Claims

1.一种基于产品标签信息的图像识别方法，其特征在于，包括以下步骤：

S1、获取同一批次产品的标签图像；

S2、对标签图像进行对比度处理；

S5、在剩余标签图像中定位出标签图像匹配区域；

S9、利用机器视觉识别方法对分割后的字符进行字符识别；

2.根据权利要求1所述的一种基于产品标签信息的图像识别方法，其特征在于，S2所述对标签图像进行对比度处理，具体为：

3.根据权利要求2所述的一种基于产品标签信息的图像识别方法，其特征在于，使用灰度变换法进行处理的计算方法为：

4.根据权利要求1所述的一种基于产品标签信息的图像识别方法，其特征在于，S3所述创建模板包括手动创建模板的方式：

5.根据权利要求1所述的一种基于产品标签信息的图像识别方法，其特征在于，S4所述在进行对比度处理后的标签图像中匹配模板，具体为：

6.根据权利要求1所述的一种基于产品标签信息的图像识别方法，其特征在于，S5所述在剩余标签图像中定位出标签图像匹配区域，具体为：

x′＝(x-x₀)cosθ+(y-y₀)sinθ

y′＝(x-x₀)sinθ-(y-y₀)cosθ

7.根据权利要求1所述的一种基于产品标签信息的图像识别方法，其特征在于，S6所述得到所述标签内容的各顶点坐标，具体为：

8.根据权利要求1所述的一种基于产品标签信息的图像识别方法，其特征在于，S9利用机器视觉识别方法对分割后的字符进行字符识别，具体包括：

S91、获取同类别的标签图像信息，建立样本库；

9.根据权利要求8所述的一种基于产品标签信息的图像识别方法，其特征在于，S93所述将所有字符的训练模型集成为训练集，设置的参数包括阈值化处理参数，形态学处理参数和字符最小像素属性信息。