CN113763389B

CN113763389B - 一种基于多主体检测分割的图像识别方法

Info

Publication number: CN113763389B
Application number: CN202110972079.4A
Authority: CN
Inventors: 鲁良; 曹旭; 陈迁明; 戚培珍; 管成毅
Original assignee: Shenzhen Qianhai Aikefeng Information Technology Co ltd
Current assignee: Shenzhen Qianhai Aikefeng Information Technology Co ltd
Priority date: 2021-08-24
Filing date: 2021-08-24
Publication date: 2022-06-14
Anticipated expiration: 2041-08-24
Also published as: CN113763389A

Abstract

本发明涉及图像识别领域，具体公开了一种基于多主体检测分割的图像识别方法，包括收集样本；将样本导入到标注工具中并对样本进行标注；进行样本检测模型训练；对模型进行调整优化；对模型进行调试，若模型通过调试则进行下一步，若没有通过则返回样本中进行标注，完善样本；对图像进行检测，根据检测结果进行图像分割，对分割得到的各主体图像进行特征数据提取；对提取后的特征数据进行编写过滤和匹配算法，进行优化与调试，并将优化后的数据进行聚合，返回多主体图像的多特征数据。本发明对多主体的图像进行分割后提取特征数据，解决了含有多种主体图片的特征数据不能直接提取的问题，能够充分提取多主体图片中的特征数据，操作方便、数据准确。

Description

一种基于多主体检测分割的图像识别方法

技术领域

本发明涉及图像识别领域。

背景技术

随着互联网技术与社交网络的发展，图片成为了互联网信息交流的主要媒介，其原因在于图片不受语言和地域的影响，所以可以逐渐的取代繁琐的文字，但随着图片应用的越来越广泛，难题也随之出现，但用文字记载信息时，人们可以通过搜索关键词找到需要的内容，但当用图片记载信息时，往往无法通过关键词对图片中的内容进行检索，从而影响了人们中图片中找到关键内容的效率，在这种情况下，图像识别技术就显得尤为重要了。现有的图像识别的技术已经非常成熟，开源的印刷体识别OCR模型(PaddleOCR)基本上可以解决大部分数场景的图像识别，但对于像含有多种主体的图片来说，要从中获取相应的特征数据，直接识别是不可能解决的。针对上述存在的问题，研究设计一种新型的基于多主体检测分割的图像识别方法，克服现有图像识别技术中所存在的问题是十分必要的。

发明内容

为了解决现有的多主体图像的多特征识别技术存在的问题，本发明提供了一种基于多主体检测分割的图像识别方法。

本发明为实现上述目的所采用的技术方案是：一种基于多主体检测分割的图像识别方法，包括如下步骤：

S1：构建图像检测模型，获取主体信息；

S2：对多主体图像进行检测获取主体信息，根据所述主体信息进行图像分割，获得多个主体图像；

S3：对所述主体图像进行图像识别，提取所述主体图像的特征数据；

S4：对提取后的特征数据进行编写过滤和匹配算法，进行优化与调试，确认所述特征数据过滤与匹配算法；

S5：聚合优化后的特征数据，返回所述多主体图像的多特征数据。

优选的，步骤S3中对分割后的主体图像进行PaddleOCR识别，提取所述主体图像的特征数据；所述特征数据包括：主体位置信息、像素信息、主体大小、主体颜色。

优选的，步骤S4包括以下步骤：

S401：对提取后的特征数据进行编写过滤和匹配算法；

S402：算法优化，提升图像特征数据处理的精度；

S403：算法调试，确认特征数据的处理结果是否达到预设要求，若通过则进行S404，若调试没有通过则返回S402；

S404：确认所述特征数据过滤与匹配算法。

优选的，所述步骤S5中将优化后的数据进行聚合，包括分类和聚合两个步骤，其中分类步骤包括了按照主体对图像的多特征识别数据进行分类，聚合步骤的结果是得到多个按主体分类的特征数据集合。

优选的，所述步骤S5，包括按照主体对图像的多特征识别数据进行分类，获取每个主体的多特征数据。

优选的，所述步骤S5，包括返回多主体图像中特定主体的多特征数据。

优选的，所述步骤S5，包括按照主体分类返回多主体图像中所有主体的多特征数据。

优选的，所述步骤S5返回的多特征数据包括：主体位置信息、主体大小、像素信息、颜色信息。

优选的，步骤S1包括如下步骤：

S101：收集样本，构建样本集合；

S102：将样本导入到标记工具中并对样本进行标注；

S103：进行样本检测模型训练；

S104：对模型进行调整优化；

S105：对模型进行调试，若模型通过调试则进行S101，若没有通过则返回S102在样本中进行标注，完善样本。

优选的，所述步骤S101中，收集至少3000张不同环境下的图片作为样本，并按照训练的算法命名规则进行图片的存放以及其映射文件。

优选的，所述步骤S102中，按照样本的分类进行主体标注，标注信息包括：位置信息、像素信息、主体大小、颜色信息；所述标注工具包括labelImg和labelme，若样本存在的主体超过五个，则增大样本数量，并采用线上标注工具ModelArts进行多人分配标注。

优选的，所述步骤S103中，采用YOLO、RETINANET或两种相结合的预置算法，进行检测模型训练。

优选的，所述步骤S104中，模型调整优化包括以下步骤：

S1041：超参调优；

S1042：模型修剪；

S1043：模型量化；

S1044：模型转化。

优选的，所述步骤S105中，所述标注工具包括：labelImg、labelme和ModelArts。

本发明的一种基于多主体检测分割的图像识别方法，通过对多主体的图像进行分割后提取特征数据，解决了含有多种主体图片的特征数据不能直接提取的问题，本发明能够充分提取多主体图片中的特征数据，且方法简单、操作方便、数据准确。

附图说明

图1是一实施例提供的一种基于多主体检测分割的图像识别方法的流程示意图；

图2是一实施例提供的一种基于多主体检测分割的图像识别方法的流程示意图；

图3是一实施例提供的一种基于多主体检测分割的图像识别方法的流程示意图；

图4是一实施例提供的一种基于多主体检测分割的图像识别方法的流程示意图。

具体实施方式

下面结合附图和实施例对本发明实施例作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释本发明实施例，而非对本发明实施例的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本发明实施例相关的步骤而非全部步骤。

实施例一

本实施例提供了一种基于多主体检测分割的图像识别方法如图1所示，包括如下步骤：

S1：构建图像检测模型，获取主体信息。获取的主体信息包括：主体位置信息、像素信息、主体大小、主体颜色。

S2：对多主体图像进行检测获取主体信息，根据所述主体信息进行图像分割，获得多个主体图像。优选的，按照主体的位置信息和主体大小进行主体图像的分割，获得每个主体的图像，方便后续特征数据的识别。

S3：对所述主体图像进行图像识别，提取所述主体图像的特征数据。优选的，对分割后的主体图像进行PaddleOCR识别，提取所述主体图像的特征数据；所述特征数据包括：主体位置信息、像素信息、主体大小、主体颜色。

S4：对提取后的特征数据进行编写过滤和匹配算法，进行优化与调试，确认所述特征数据过滤与匹配算法。通过对特征数据处理算法进行优化与调试，获得更加精确的多主体图像的多特征数据，提升图像识别的精度。

S5：聚合优化后的特征数据，返回所述多主体图像的多特征数据。优选的，返回特定主体的多特征数据，多特征数据包括：主体位置信息、像素信息、主体大小、主体颜色。

实施例二：

本实施例提供的一种基于多主体检测分割的图像识别方法如图2所示，包括如下步骤：

优选的，步骤S4包括以下步骤：

S401：对提取后的特征数据进行编写过滤和匹配算法；

S402：算法优化，提升图像特征数据处理的精度；

S404：确认所述特征数据过滤与匹配算法。

实施例三：

本实施例提供的一种基于多主体检测分割的图像识别方法如图3所示，包括如下步骤：

S1：构建图像检测模型，获取主体信息；包括：

S101：收集样本，收集3000张不同环境下的图片作为样本，并按照训练的算法命名规则进行图片的存放以及其映射文件，尽可能收集不同类别的样本，各式各样的样本越多，训练出的模型就越完美，收集的图片样本可以包括风景图片、几何图片、人物图片、动物图片或者文字图片等，构建样本集合。

S102：将样本导入到标记工具中并对样本进行标注，标注工具可以为labelImg，这一步可能需要投入大量的人力去完成标注，也可以编写算法利用机器进行自动化标注，这样可以保证标注的准确与迅速，在标注过程中需要确定统一的标注标准，以便保证标注内容的一致性，标注的内容可以包括主体的位置、大小、像素和颜色等；

S103：进行样本检测模型训练，采用YOLO、RETINANET或两种相结合的预置算法，进行检测模型训练，进行训练时，可以改变样本图片的颜色、明暗和角度等；

S104：对模型进行调整优化，；

S105：对模型进行调试，若模型通过调试则进行S101，若没有通过则返回S02在样本中进行标注，完善样本，标注工具可以为labelImg。

优选的，获取的主体信息包括：主体位置信息、像素信息、主体大小、主体颜色。

实施例四

本实施例提供了一种基于多主体检测分割的图像识别方法，包括如下步骤：

S5：聚合优化后的特征数据，返回所述多主体图像的多特征数据。优选的，返回特定主体的多特征数据，多特征数据包括：主体位置信息、像素信息、主体大小、主体颜色。优选的，所述步骤S5，包括按照主体对图像的多特征识别数据进行分类，获取每个主体的多特征数据。

实施例五

本实施例提供的一种基于多主体检测分割的图像识别方法，包括如下步骤：

S1：构建图像检测模型，获取主体信息；包括：

S101：收集样本；收集4000张不同环境下的图片作为样本，并按照训练的算法命名规则进行图片的存放以及其映射文件，尽可能收集不同类别的样本，各式各样的样本越多，训练出的模型就越完美，收集的图片样本可以包括风景图片、几何图片、人物图片、动物图片或者文字图片等，构建样本集合；

S102：将样本导入到标注工具中并对样本进行标注；标注工具可以为labelme，这一步需要投入大量的人力去完成标注，这样可以保证标注的准确与迅速，也可以编写算法利用机器进行自动化标注，在标注过程中需要确定统一的标注标准，以便保证标注内容的一致性，标注的内容可以包括主体的位置、大小、像素和颜色等。

S103：进行样本检测模型训练；采用YOLO、RETINANET或两种相结合的预置算法，进行检测模型训练，进行训练时，可以改变样本图片的颜色、明暗和角度等。

S104：对模型进行调整优化，模型调整优化可以包括以下步骤：

S1041：超参调优，可以利用计算公式预测各项参数的最优范围，并进行参数试验，确定最优的参数数值；

S1042：模型修剪，根据参数的调试结果对模型进行进一步的优化，简化计算过程，提升检测模型的计算效率；

S1043：模型量化，对模型进行量化处理，为后续的样本检测提供参考；

S1044：模型转化，确定本次调整与优化后的检测模型。

S105：对模型进行调试，若模型通过调试则进行S101，若没有通过则返回S102在样本中进行标注，完善样本；标注工具可以为labelme，可以结合步骤S1044中的模型，可以在各个框架下进行调试。

实施例六

本实施例提供的一种基于多主体检测分割的图像识别方法如图4所示，包括如下步骤：

S1：构建图像检测模型，获取主体信息；包括：

S1044：模型转化，确定本次调整与优化后的检测模型。

优选的，步骤S4包括以下步骤：

S401：对提取后的特征数据进行编写过滤和匹配算法；

S402：算法优化，提升图像特征数据处理的精度；

S404：确认所述特征数据过滤与匹配算法。

实施例七

S1：构建图像检测模型，获取主体信息；包括：

S101：收集样本。收集5000张不同环境下的图片作为样本，并按照训练的算法命名规则进行图片的存放以及其映射文件，尽可能收集不同类别的样本，各式各样的样本越多，训练出的模型就越完美，收集的图片样本可以包括风景图片、几何图片、人物图片、动物图片或者文字图片等，构建样本集合；

S102：将样本导入到标注工具中并对样本进行标注；按照样本的分类进行主体标注，若样本存在的主体超过五个，则增大样本数量，并采用线上标注工具ModelArts进行多人分配标注，这一步需要投入大量的人力去完成标注可以保证标注的准确与迅速，同时也可以预先确定样本的标注标准，并编写运行算法利用机器进行自动化标注，这样有利于提升样本标注的速度，标注的内容可以包括主体的位置、大小、像素和颜色等；

S103：进行样本检测模型训练，可以采用YOLO、RETINANET或两种相结合的预置算法，进行检测模型训练，并对模型检测训练效果进行验证，提升样本检测的精准度，进行训练时，可以改变样本图片的颜色、明暗和角度等；

S1044：模型转化，确定本次调整与优化后的检测模型。

S105：对模型进行调试，若模型通过调试则进行S101，若没有通过则返回S102在样本中进行标注，完善样本；标注工具可以为ModelArts，可以结合步骤S1044中的模型，可以在各个框架下进行调试。其中，模型调试的标准可以是图像各主体分割的精准程度、边缘模糊度等，对模型吊事结果进行统一标准的评价。

优选的，步骤S4包括以下步骤：

S401：对提取后的特征数据进行编写过滤和匹配算法；

S402：算法优化，提升图像特征数据处理的精度；

S404：确认所述特征数据过滤与匹配算法。

优选的，返回特定主体的多特征数据，多特征数据包括：主体位置信息、像素信息、主体大小、主体颜色。

本发明的实施例是为了示例和描述起见而给出的，只是为了解释本发明实施例的原理，而并不是无遗漏的或者将本发明限于所公开的形式，很多修改和变化对于本领域的普通技术人员而言是显而易见的，因此本实施例的描述不能以任何方式解释为对本发明实施例保护范围的限制。基于此处的解释，本领域的技术人员不需要付出创造性的劳动即可联想到本发明实施例的其它具体实施方式都将落入本发明实施例的保护范围之内。

Claims

1.一种基于多主体检测分割的图像识别方法，其特征在于，包括如下步骤：

S101：收集样本，构建样本集合；

S102：将样本导入到标记工具中并对样本中主体按照样本的分类进行主体标注，标注信息包括：位置信息、像素信息、主体大小、颜色信息，用于获取主体信息；

S103：采用YOLO、RETINANET或两种相结合的预置算法进行样本检测模型训练，提升获取主体信息的精度；

S104：对模型进行调整优化；

S105：对模型进行调试，若模型通过调试则进行S101，若没有通过则返回S102在样本中进行标注，完善样本；

2.根据权利要求1所述的一种基于多主体检测分割的图像识别方法，其特征在于，所述步骤S3中对分割后的主体图像进行PaddleOCR识别，提取所述主体图像的特征数据；所述特征数据包括：主体位置信息、像素信息、主体大小、主体颜色。

3.根据权利要求1所述的一种基于多主体检测分割的图像识别方法，其特征在于，所述步骤S4包括以下步骤：

S401：对提取后的特征数据进行编写过滤和匹配算法；

S402：算法优化，提升图像特征数据处理的精度；

S403：算法调试，若通过则进行S404，若调试没有通过则返回S402；

S404：确认所述特征数据过滤与匹配算法。

4.根据权利要求3所述的一种基于多主体检测分割的图像识别方法，其特征在于，所述步骤S5，包括按照主体对图像的多特征识别数据进行分类，获取每个主体的多特征数据。

5.根据权利要求3所述的一种基于多主体检测分割的图像识别方法，其特征在于，所述步骤S5，包括返回多主体图像中特定主体的多特征数据。

6.根据权利要求3所述的一种基于多主体检测分割的图像识别方法，其特征在于，所述步骤S5，包括按照主体分类返回多主体图像中所有主体的多特征数据。

7.根据权利要求1所述的一种基于多主体检测分割的图像识别方法，其特征在于，所述步骤S101中，收集至少3000张不同环境下的图片作为样本，并按照训练的算法命名规则进行图片的存放以及其映射文件。

8.根据权利要求1所述的一种基于多主体检测分割的图像识别方法，其特征在于，所述标记工具包括labelImg和labelme，若样本存在的主体超过五个，则增大样本数量，并采用线上标注工具ModelArts进行多人分配标注。

9.根据权利要求1所述的一种基于多主体检测分割的图像识别方法，其特征在于，所述步骤S104中，模型调整优化包括以下步骤：

S1041：超参调优；

S1042：模型修剪；

S1043：模型量化；

S1044：模型转化。