CN110705362B

CN110705362B - 一种字印分析方法和装置

Info

Publication number: CN110705362B
Application number: CN201910842477.7A
Authority: CN
Inventors: 解月江; 陈魏然; 陆和平; 丁名晓; 梁砚啸; 王露荻
Original assignee: Daotech Technology Co ltd
Current assignee: Daotech Technology Co ltd
Priority date: 2019-09-06
Filing date: 2019-09-06
Publication date: 2022-12-09
Anticipated expiration: 2039-09-06
Also published as: CN110705362A

Abstract

本发明公开了一种字印分析方法和装置，所述方法包括：建立字段检测模型和字符检测模型；调用字段检测模型，对字印图像中的字段进行检测和识别，得到字段检测结果；根据字段检测结果得到字印图像和字段图像；调用字符检测模型，对字段图像进行检测，得到字符检测结果；对字符检测结果进行后处理，得到字符区域和字符精细分割结果；结合字符区域，对字印图像进行预处理，得到预处理后的字印图像；结合预处理后的字印图像和所述字符精细分割结果，提取字符的特征，实现对字印的分析。本发明提供的字印分析方法和装置，可以提高字印分析的准确性。

Description

一种字印分析方法和装置

技术领域

本发明涉及信息处理技术领域，特别是指一种字印分析方法和装置。

背景技术

根据国家标准，黄金、铂金、等首饰上需要刻印符合国家标准的字印内容。通常，完整的字印包括公司印、成色印及工厂印。其中，公司印一般为公司名称或者公司名称缩写，例如：CTF、GSKA等；成色印用于表示该饰品的材质及成色，例如：足金999、PT950等；工厂印用于表示该饰品的加工工厂或者生产地，例如：A、B等。

首饰字印瑕疵检测是指对戒指、手镯等环状饰品内侧的字印进行检测并判断出字印内容是否有误，字符是否存在模糊、残缺等瑕疵。字印的字符分割和处理效果会对后续特征值的计算产生直接影响，进而影响瑕疵判定结果的准确性，因此字符分割和处理对字印瑕疵检测整体而言至关重要。

发明内容

有鉴于此，本发明的目的在于提出一种字印分析方法和装置，可以实现对不同款式字印字符的准确分割，并在分割的基础上有效地去除干扰。

基于上述目的，本发明的第一个方面，提供了一种字印分析方法，包括：

建立字段检测模型和字符检测模型；

调用所述字段检测模型，对所述字印图像中的字段进行检测和识别，得到字段检测结果；

根据所述字段检测结果得到字印图像和字段图像；

调用所述字符检测模型，对所述字段图像进行检测，得到字符检测结果；

对所述字符检测结果进行后处理，得到字符区域和字符精细分割结果；

结合所述字符区域，对所述字印图像进行预处理，得到预处理后的所述字印图像；

结合所述预处理后的字印图像和所述字符精细分割结果，提取所述字符的特征，实现对所述字印的分析。

可选的，所述建立字段检测模型和字符检测模型包括：

收集载体图像并对所述载体图像中的字段进行标注，并将对应的字段标注信息作为字段训练集；

根据所述字段标注信息从所述载体图像中裁剪出字段图像，并按照字段类型对所述字段图像进行归类；

对所述字段图像中的单个字符进行标注，并将对应的字符标注信息作为字符训练集；

基于所述字段训练集和所述字符训练集建立深度学习网络，经迭代学习训练，分别得到字段检测模型和字符检测模型。

可选的，所述根据所述字段检测结果得到字印图像和字段图像，包括：

根据所述字段检测结果，计算字段区域的最小外接矩形，将所述最小外接矩形的坐标作为字段坐标，得到字段位置；

根据所述字段坐标，依次确定所述字段的类别，进而判断所述字段的字印是否倒置；

若倒置，将金饰图像旋转180度，同时对字段坐标进行坐标变换；

计算多个所述字段区域的最上方、最下方、最左方和最右方的边界值；

根据所述最上方、最下方、最左方和最右方的边界值，确定字印坐标；

根据所述字印坐标确定字印位置。

根据所述字印位置和字段位置分别对所述字印和字段进行裁剪，得到相应的字印图像和字段图像。

可选的，所述根据所述最上方、最下方、最左方和最右方的边界值，确定字印坐标，还包括：

分别按照既定的外扩值对所述最上方、最下方、最左方和最右方的边界值进行外扩；

将外扩后的所述边界值与所述载体图像的界限值进行比较；若所述外扩后的边界值大于所述载体图像的界限值，以所述载体图像的界限值作为所述字印坐标；若所述外扩后的边界值小于所述载体图像的界限值，以所述外扩后的边界值作为所述字印坐标。

可选的，所述既定的外扩值为5～10个像素。

可选的，所述后处理包括对所述字符检测结果进行误检去除和精细分割；

所述误检去除包括：

计算所述字符检测结果中字符区域的特征值；

将所述特征值和预设阈值进行比较，若所述特征值不满足所述预设阈值，剔除不满足所述预设阈值的所述字符区域；若所述特征值满足所述预设阈值，保留所述字符区域。

可选的，所述误检去除还包括：

比较所述字符的检出数与所述字符的预设数；若所述检出数大于所述预设数，则存在误检；

计算检出的所述字符区域的面积，并根据所述面积对所述字符区域进行排序，保留所述面积最大的所述字符区域，去除误检的所述字符区域。

可选的，所述特征值包括字符区域面积、字符区域像素点数、字符区域最小外接矩形的长度和宽度。

可选的，所述精细分割包括：

根据字段内容，判断所述字段中是否存在相邻且相同的字符；

若存在所述相邻且相同的字符，根据已分割的字符宽度判断所述相邻且相同的字符是否存在未分割情况；

若存在所述未分割情况，计算单个字符的宽度，并根据所述单个字符的宽度计算所述字符区域中的字符坐标。

可选的，采用等分原则计算所述单个字符的宽度，所述采用等分原则计算所述单个字符的宽度，包括：

将未分割的所述字符区域的宽度除以所述字符区域中的字符数量，进而得到所述单个字符的宽度。

可选的，所述结合所述字符区域，对所述字印图像进行预处理，得到预处理后的所述字印图像，包括：

根据所述后处理后的所述字符区域的位置坐标，创建所述字符区域的二值图像，所述字符区域的二值图像与所述字印图像大小一致；

对所述字印图像进行中值滤波；

将中值滤波后的所述字印图像由RGB颜色空间转换为Lab颜色空间；

对所述Lab颜色空间中L通道的所述字印图像进行直方图拉伸，得到增强的所述字印图像；

对增强后的所述字印图像进行自适应阈值处理，得到字印的二值图像；

将所述字印的二值图像与所述字符区域的二值图像进行相与运算，去除所述字印二值图像中的噪声，得到去噪后的字印二值图像。

可选的，所述结合所述预处理后的字印图像和所述字符精细分割结果，提取所述字符的特征，实现对所述字印的分析，包括：

根据所述L通道的所述字印图像和所述字符区域的二值图像，计算所述字符区域的灰度特征；

根据所述L通道的所述字印图像和所述去噪后的字印二值图像，计算所述字符的前景灰度特征；

根据所述去噪后的字印二值图像及所述字符精细分割结果，计算所述字符的前景特征及几何特征。

本发明的第二个方面，提供了一种字印分析装置，包括：

模型创建模块，用于建立字段检测模型和字符检测模型；

检测模块，用于：

调用所述字段检测模型，对所述字印图像中的字段进行检测和识别，得到字段检测结果；根据所述字段检测结果得到字印图像和字段图像；调用所述字符检测模型，对所述字段图像进行检测，得到字符检测结果；

后处理模块，用于对所述字符检测结果进行后处理，得到字符区域和字符精细分割结果；

预处理模块，用于结合所述字符区域，对所述字印图像进行预处理，得到预处理后的所述字印图像；

特征提取模块，用于结合所述预处理后的字印图像和所述字符精细分割结果，提取所述字符的特征，实现对所述字印的分析。

可选的，所述模型创建模块还用于：

可选的，所述检测模块还用于：

根据所述字印坐标确定字印位置。

可选的，所述检测模块还用于：

可选的，所述后处理模块还用于：

计算所述字符检测结果中字符区域的特征值；

可选的，所述后处理模块还用于：

可选的，所述预处理模块还用于：

对所述字印图像进行中值滤波；

可选的，所述特征提取模块还用于：

从上面所述可以看出，本发明提供的字印分析方法和装置，通过调用预训练的字段检测模型和字符检测模型，得到字段信息和字符信息，并将字符进行后处理得到字符区域和字符精细分割结果；对字印区域进行预处理以去除噪声区域，结合预处理后的字印区域和字符精细分割结果，提取字符的特征，实现对字印的准确分析。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种字印分析方法的流程示意图；

图2为本发明实施例提供的一种字印分析方法的建立字段检测模型和字符检测模型阶段流程示意图；

图3为本发明实施例提供的一种字印分析装置的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白，以下结合具体实施例，并参照附图，对本发明进一步详细说明。

发明人发现，目前首饰字印具有以下特点：(1)字印字印多位于环状饰品内侧，实际采集图像中的字印往往存在倾斜、畸变及光照不均等情况；(2)字印品款式众多，可达上百种，不同类型字印的字符大小各异、粗细不同、深浅不一；(3)当字印内侧为抛光面，成像过程中产生的倒影会对字印处理产生干扰。

因此为了解决上述问题，本发明实施例提供了一种字印分析方法，参考图1所示，包括：

步骤101：建立字段检测模型和字符检测模型；

步骤102：调用所述字段检测模型，对所述字印图像中的字段进行检测和识别，得到字段检测结果；

步骤103：根据所述字段检测结果得到字印图像和字段图像；

步骤104：调用所述字符检测模型，对所述字段图像进行检测，得到字符检测结果；

步骤105：对所述字符检测结果进行后处理，得到字符区域和字符精细分割结果；

步骤106：结合所述字符区域，对所述字印图像进行预处理，得到预处理后的所述字印图像；

步骤107：结合所述预处理后的字印图像和所述字符精细分割结果，提取所述字符的特征，实现对所述字印的分析。

从上述实施例可以看出，本发明提供的字印分析方法，通过调用预训练的字段检测模型和字符检测模型，分别对字印图像中的字段及字段中的字符进行检测和识别，并将识别的结果进行误检去除和精细分割，能够在准确提取字符前景的同时有效排除噪声干扰，为后续字符特征提取提供可靠保障，提高字印分析的准确性。

本发明实施例中，所述的字印分析方法不仅适用于金饰品的字印图像，还适用于银饰品、木制品等其他材质的字印图像；以及对印制在工业仪器、日用品等其他常规物品上的字印图像。需要说明的是，根据国家标准，银、黄金、铂金、等首饰上需要刻印符合国家标准的字印内容。通常，完整的字印包括公司印、成色印及工厂印。为了更好地进行阐述，本方案均以“CTF足金999A”为示例进行解释说明，这个字印包括四个字段，分别为“CTF”、“足金”、“999”以及“A”；第一字段“CTF”包括字符“C”、“T”、“F”，第二字段“足金”包括字符“足”和“金”，第三字段“999”包括字符“9”、“9”和“9”，第四字段包括字符“A”。

在一些可选的实施方式中，步骤101中，所述建立字段检测模型和字符检测模型包括如下步骤：

参考图2所示，为本发明实施例提供的建立字段检测模型和字符检测模型阶段流程示意图，所述建立字段检测模型和字符检测模型包括：

步骤1011：收集载体图像并对所述载体图像中的字段进行标注，将对应的字段标注信息作为字段训练集。需要说明的是，这里收集的载体图像为成像清晰且包含完整金饰的图像，其中，金饰上的字印完整，不存在残缺、模糊、脏污等问题。可选的，上述字段标注信息分别为“ctf”、“gold”、“999”、“other”，分别对应字段“CTF”、“足金”、“999”、“A”。

需要说明的是，由于所述字印分析方法除了适用于首饰之外，还适用于其他物体，故上述载体图像也不仅局限于首饰图像，还可以理解为任何印制有待分析字印的物体的图像。

步骤1012：根据所述字段标注信息从所述载体图像中裁剪出字段图像，并按照字段类型对所述字段图像进行归类；对所述字段图像中的单个字符进行标注，并将对应的字符标注信息作为字符训练集。可选的，字段“ctf”标注的字符标签为“c”、“t”、“f”，分别对应字符“C”“T”“F”；字段“gold”标注的字符标签为“zu”、“jin”，分别对应“足金”、字段“999”标注的字符标签统一为“9”。需要说明的是，由于字段“other”类别繁多，因此不进行字符检测，将字段检测结果作为最终的字符检测结果。

步骤1013：基于所述字段训练集和所述字符训练集建立深度学习网络，经迭代学习训练，分别得到字段检测模型和字符检测模型。进入步骤102。

在一些可选的实施方式中，步骤103中，根据所述字段检测结果得到字印图像和字段图像，包括：

根据所述最上方、最下方、最左方和最右方的边界值，确定字印坐标。在一些可选的实施方式中，所述根据所述最上方、最下方、最左方和最右方的边界值，确定字印坐标，具体包括：

将外扩后的所述边界值与所述载体图像的界限值进行比较；若所述外扩后的边界值大于所述载体图像的界限值，以所述载体图像的界限值作为所述字印坐标；若所述外扩后的边界值小于所述载体图像的界限值，以所述外扩后的边界值作为所述字印坐标。可选的，所述既定的外扩值为5～10个像素。

根据所述字印坐标确定字印位置。

需要说明的是，在成像时，金饰的摆放不区分反正，因此字印可能存在倒置情况，虽然这并不会对字符分割和处理产生影响，但会对字符特征的提取产生极大影响。例如，字符“T”上半部和下半部前景点比值大于1，但倒置时，该值小于1。因此，可以根据各字段坐标，依次确定字段类别，若字段类别依次为“ctf”、“gold”、“999”、“other”，则字印正常，保持原字段坐标不变；若字段类别依次为“other”、“999”、“gold”、“ctf”，则字印倒置，将金饰图像旋转180度，同时对字段坐标进行变换。

在一些可选的实施方式中，步骤105中，所述后处理包括对所述字符检测结果进行误检去除和精细分割。需要说明的是，调用深度学习模型检测字符时，必然会产生一些像素级误检，故需要对误检区域进行去除。同时，由于采用的字符检测模型为基于语义分割的深度学习模型，无法区分邻近的两个相同字符，当字段中存在邻近且相同字符时，可能会检为同一区域。如字段“999”中的字符“9”，多数情况下检出的三个“9”的字符区域连成一片，需对字符进一步精细分割。

可选的，所述误检去除包括：

计算所述字符检测结果中字符区域的特征值；

将所述特征值和预设阈值进行比较，若所述特征值不满足所述预设阈值，剔除不满足所述预设阈值的所述字符区域；若所述特征值满足所述预设阈值，保留所述字符区域。可选的，所述特征值包括字符区域面积、字符区域像素点数、字符区域最小外界矩形的长度和宽度。当所选取的特征值为字符区域最小外接矩形的长度和宽度时，得到最小外接矩形的宽度W和高度H即为字符的宽度和高度，将W和H分别和预设阈值thr_W和thr_H进行比较，若W小于thr_W或H小于thr_H，则剔除该误检区域；反之，保留该结果区域。可选的，上述预设阈值thr_W和thr_H均为15-20。需要说明的是，这一步的误检去除为小区域误检去除，目的是剔除小区域误检。

可选的，所述误检去除还包括：

计算检出的所述字符区域的面积，并根据所述面积对所述字符区域进行排序，保留所述面积最大的所述字符区域，去除误检的所述字符区域。需要说明的是，这一步的误检去除为二次误检去除，目的是剔除剩余误检区域。

在一些可选的实施方式中，所述精细分割包括：

步骤106：结合所述字符区域，对所述字印图像进行预处理，得到预处理后的所述字印图像。需要说明的是，字符分割结果仅分割出了单个字符区域，要提取字符的前、背景特征及灰度特征等需要对字印图像进行预处理，得到字印二值图像。由于金饰字印图像存在噪声、光照不均匀等问题，为此结合所述检出字符区域对字印图像进行预处理。

在一些可选的实施方式中，步骤106中，所述预处理过程包括：

对所述字印图像进行中值滤波，可选的，所述中值滤波器尺寸为3。

将中值滤波后的所述字印图像由RGB颜色空间转换为Lab颜色空间。

对所述Lab颜色空间中L通道的所述字印图像进行直方图拉伸，得到增强的所述字印图像；可选的，进行上述直方图拉伸时采用字符区域的二值图像作为掩膜(mask)图，因为在调用函数算法时考虑对字符区域的二值图像的前景区域做拉伸，其拉伸效果更好。需要说明的是，所述掩膜的过程，即用选定的图像、图形或物体，对处理的图像进行遮挡，来控制图像处理的区域或处理过程。

对增强后的所述字印图像进行自适应阈值处理，得到字印的二值图像；可选的，所述自适应阈值处理时邻域块大小为51，偏移值调整量为5。

在一些可选的实施方式中，步骤107中，所述结合所述预处理后的字印图像和所述字符精细分割结果，提取所述字符的特征，实现对所述字印的分析，具体包括：

本发明实施例提供的字印分析方法不仅能够对金饰字符进行准确分割，还实现了对字印的增强和去噪。该方法对噪声、光照不均、字印倾斜等具有较强的鲁棒性，能够有效保证后续字符特征的稳定性、准确性和可靠性，可使瑕疵检测准确率提高约10％。需要说明的是，本发明实施例提供的字印分析方法不仅适用于对首饰字印的分析，还适用于对印制在工业仪器、日用品等其他常规物品上的字印进行精确分析。

本发明的第二个方面，提供了字印分析装置的一个实施例，参考图3所示，所述字印分析装置包括：

模型创建模块201，用于建立字段检测模型和字符检测模型；

检测模块202，用于：

后处理模块203，用于对所述字符检测结果进行后处理，得到字符区域和字符精细分割结果；

预处理模块204，用于结合所述字符区域，对所述字印图像进行预处理，得到预处理后的所述字印图像；

特征提取模块205，用于结合所述预处理后的字印图像和所述字符精细分割结果，提取所述字符的特征，实现对所述字印的分析。

在一些可选的实施方式中，所述模型创建模块201还用于：

在一些可选的实施方式中，所述检测模块还用于：

根据所述字印坐标确定字印位置。

在一些可选的实施方式中，所述检测模块还用于：

在一些可选的实施方式中，所述后处理模块还用于：

计算所述字符检测结果中字符区域的特征值；

在一些可选的实施方式中，所述后处理模块还用于：

在一些可选的实施方式中，所述预处理模块还用于：

对所述字印图像进行中值滤波；

在一些可选的实施方式中，所述特征提取模块还用于：

上述实施例的装置用于实现前述实施例中相应的方法，并且具有相应的方法实施例的有益效果，在此不再赘述。

所属领域的普通技术人员应当理解：以上任何实施例的讨论仅为示例性的，并非旨在暗示本公开的范围(包括权利要求)被限于这些例子，例如，本发明不仅可以适用于首饰字印中的缺陷检测，还可以适用于其他产品的表面缺陷检测，且可检出的缺陷类型也不局限于所述缺陷类型；在本发明的思路下，以上实施例或者不同实施例中的技术特征之间也可以进行组合，步骤可以以任意顺序实现，并存在如上所述的本发明的不同方面的许多其它变化，为了简明它们没有在细节中提供。

本发明的实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此，凡在本发明的精神和原则之内，所做的任何省略、修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种字印分析方法，其特征在于，包括：

建立字段检测模型和字符检测模型；

调用所述字段检测模型，对金饰的字印图像中的字段进行检测和识别，得到字段检测结果；

根据所述字段检测结果得到所述金饰的字印图像和字段图像；其中包括：根据所述字段检测结果，计算字段区域的最小外接矩形，将所述最小外接矩形的坐标作为字段坐标，得到字段位置；

根据所述最上方、最下方、最左方和最右方的边界值，确定字印坐标；其中包括：分别按照既定的外扩值对所述最上方、最下方、最左方和最右方的边界值进行外扩；

将外扩后的所述边界值与载体图像的界限值进行比较；若所述外扩后的边界值大于所述载体图像的界限值，以所述载体图像的界限值作为所述字印坐标；若所述外扩后的边界值小于所述载体图像的界限值，以所述外扩后的边界值作为所述字印坐标；

根据所述字印坐标确定字印位置；

根据所述字印位置和字段位置分别对所述字印和字段进行裁剪，得到相应的字印图像和字段图像；

2.根据权利要求1所述的字印分析方法，其特征在于，所述建立字段检测模型和字符检测模型包括：

3.根据权利要求1所述的字印分析方法，其特征在于，所述既定的外扩值为5～10个像素。

4.根据权利要求1所述的字印分析方法，其特征在于，所述后处理包括对所述字符检测结果进行误检去除和精细分割；

所述误检去除包括：

计算所述字符检测结果中字符区域的特征值；

5.根据权利要求4所述的字印分析方法，其特征在于，所述误检去除还包括：

6.根据权利要求4所述的字印分析方法，其特征在于，所述特征值包括字符区域面积、字符区域像素点数、字符区域最小外界矩形的长度和宽度。

7.根据权利要求4所述的字印分析方法，其特征在于，所述精细分割包括：

8.根据权利要求7所述的字印分析方法，其特征在于，采用等分原则计算所述单个字符的宽度，所述采用等分原则计算所述单个字符的宽度，包括：

9.根据权利要求1所述的字印分析方法，其特征在于，所述结合所述字符区域，对所述字印图像进行预处理，得到预处理后的所述字印图像，包括：

对所述字印图像进行中值滤波；

10.根据权利要求9所述的字印分析方法，其特征在于，所述结合所述预处理后的字印图像和所述字符精细分割结果，提取所述字符的特征，实现对所述字印的分析，包括：

11.一种字印分析装置，其特征在于，包括：

模型创建模块，用于建立字段检测模型和字符检测模型；

检测模块，用于：

根据所述字印坐标确定字印位置；

12.根据权利要求11所述的字印分析装置，其特征在于，所述模型创建模块还用于：

13.根据权利要求11所述的字印分析装置，其特征在于，所述后处理模块还用于：

计算所述字符检测结果中字符区域的特征值；

14.根据权利要求13所述的字印分析装置，其特征在于，所述后处理模块还用于：

15.根据权利要求13所述的字印分析装置，其特征在于，所述后处理模块还用于：

16.根据权利要求11所述的字印分析装置，其特征在于，所述预处理模块还用于：

对所述字印图像进行中值滤波；

17.根据权利要求16所述的字印分析装置，其特征在于，所述特征提取模块还用于：