CN113763389B - 一种基于多主体检测分割的图像识别方法 - Google Patents
一种基于多主体检测分割的图像识别方法 Download PDFInfo
- Publication number
- CN113763389B CN113763389B CN202110972079.4A CN202110972079A CN113763389B CN 113763389 B CN113763389 B CN 113763389B CN 202110972079 A CN202110972079 A CN 202110972079A CN 113763389 B CN113763389 B CN 113763389B
- Authority
- CN
- China
- Prior art keywords
- subject
- image
- feature data
- model
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及图像识别领域,具体公开了一种基于多主体检测分割的图像识别方法,包括收集样本;将样本导入到标注工具中并对样本进行标注;进行样本检测模型训练;对模型进行调整优化;对模型进行调试,若模型通过调试则进行下一步,若没有通过则返回样本中进行标注,完善样本;对图像进行检测,根据检测结果进行图像分割,对分割得到的各主体图像进行特征数据提取;对提取后的特征数据进行编写过滤和匹配算法,进行优化与调试,并将优化后的数据进行聚合,返回多主体图像的多特征数据。本发明对多主体的图像进行分割后提取特征数据,解决了含有多种主体图片的特征数据不能直接提取的问题,能够充分提取多主体图片中的特征数据,操作方便、数据准确。
Description
技术领域
本发明涉及图像识别领域。
背景技术
随着互联网技术与社交网络的发展,图片成为了互联网信息交流的主要媒介,其原因在于图片不受语言和地域的影响,所以可以逐渐的取代繁琐的文字,但随着图片应用的越来越广泛,难题也随之出现,但用文字记载信息时,人们可以通过搜索关键词找到需要的内容,但当用图片记载信息时,往往无法通过关键词对图片中的内容进行检索,从而影响了人们中图片中找到关键内容的效率,在这种情况下,图像识别技术就显得尤为重要了。现有的图像识别的技术已经非常成熟,开源的印刷体识别OCR模型(PaddleOCR)基本上可以解决大部分数场景的图像识别,但对于像含有多种主体的图片来说,要从中获取相应的特征数据,直接识别是不可能解决的。针对上述存在的问题,研究设计一种新型的基于多主体检测分割的图像识别方法,克服现有图像识别技术中所存在的问题是十分必要的。
发明内容
为了解决现有的多主体图像的多特征识别技术存在的问题,本发明提供了一种基于多主体检测分割的图像识别方法。
本发明为实现上述目的所采用的技术方案是:一种基于多主体检测分割的图像识别方法,包括如下步骤:
S1:构建图像检测模型,获取主体信息;
S2:对多主体图像进行检测获取主体信息,根据所述主体信息进行图像分割,获得多个主体图像;
S3:对所述主体图像进行图像识别,提取所述主体图像的特征数据;
S4:对提取后的特征数据进行编写过滤和匹配算法,进行优化与调试,确认所述特征数据过滤与匹配算法;
S5:聚合优化后的特征数据,返回所述多主体图像的多特征数据。
优选的,步骤S3中对分割后的主体图像进行PaddleOCR识别,提取所述主体图像的特征数据;所述特征数据包括:主体位置信息、像素信息、主体大小、主体颜色。
优选的,步骤S4包括以下步骤:
S401:对提取后的特征数据进行编写过滤和匹配算法;
S402:算法优化,提升图像特征数据处理的精度;
S403:算法调试,确认特征数据的处理结果是否达到预设要求,若通过则进行S404,若调试没有通过则返回S402;
S404:确认所述特征数据过滤与匹配算法。
优选的,所述步骤S5中将优化后的数据进行聚合,包括分类和聚合两个步骤,其中分类步骤包括了按照主体对图像的多特征识别数据进行分类,聚合步骤的结果是得到多个按主体分类的特征数据集合。
优选的,所述步骤S5,包括按照主体对图像的多特征识别数据进行分类,获取每个主体的多特征数据。
优选的,所述步骤S5,包括返回多主体图像中特定主体的多特征数据。
优选的,所述步骤S5,包括按照主体分类返回多主体图像中所有主体的多特征数据。
优选的,所述步骤S5返回的多特征数据包括:主体位置信息、主体大小、像素信息、颜色信息。
优选的,步骤S1包括如下步骤:
S101:收集样本,构建样本集合;
S102:将样本导入到标记工具中并对样本进行标注;
S103:进行样本检测模型训练;
S104:对模型进行调整优化;
S105:对模型进行调试,若模型通过调试则进行S101,若没有通过则返回S102在样本中进行标注,完善样本。
优选的,所述步骤S101中,收集至少3000张不同环境下的图片作为样本,并按照训练的算法命名规则进行图片的存放以及其映射文件。
优选的,所述步骤S102中,按照样本的分类进行主体标注,标注信息包括:位置信息、像素信息、主体大小、颜色信息;所述标注工具包括labelImg和labelme,若样本存在的主体超过五个,则增大样本数量,并采用线上标注工具ModelArts进行多人分配标注。
优选的,所述步骤S103中,采用YOLO、RETINANET或两种相结合的预置算法,进行检测模型训练。
优选的,所述步骤S104中,模型调整优化包括以下步骤:
S1041:超参调优;
S1042:模型修剪;
S1043:模型量化;
S1044:模型转化。
优选的,所述步骤S105中,所述标注工具包括:labelImg、labelme和ModelArts。
本发明的一种基于多主体检测分割的图像识别方法,通过对多主体的图像进行分割后提取特征数据,解决了含有多种主体图片的特征数据不能直接提取的问题,本发明能够充分提取多主体图片中的特征数据,且方法简单、操作方便、数据准确。
附图说明
图1是一实施例提供的一种基于多主体检测分割的图像识别方法的流程示意图;
图2是一实施例提供的一种基于多主体检测分割的图像识别方法的流程示意图;
图3是一实施例提供的一种基于多主体检测分割的图像识别方法的流程示意图;
图4是一实施例提供的一种基于多主体检测分割的图像识别方法的流程示意图。
具体实施方式
下面结合附图和实施例对本发明实施例作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明实施例,而非对本发明实施例的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明实施例相关的步骤而非全部步骤。
实施例一
本实施例提供了一种基于多主体检测分割的图像识别方法如图1所示,包括如下步骤:
S1:构建图像检测模型,获取主体信息。获取的主体信息包括:主体位置信息、像素信息、主体大小、主体颜色。
S2:对多主体图像进行检测获取主体信息,根据所述主体信息进行图像分割,获得多个主体图像。优选的,按照主体的位置信息和主体大小进行主体图像的分割,获得每个主体的图像,方便后续特征数据的识别。
S3:对所述主体图像进行图像识别,提取所述主体图像的特征数据。优选的,对分割后的主体图像进行PaddleOCR识别,提取所述主体图像的特征数据;所述特征数据包括:主体位置信息、像素信息、主体大小、主体颜色。
S4:对提取后的特征数据进行编写过滤和匹配算法,进行优化与调试,确认所述特征数据过滤与匹配算法。通过对特征数据处理算法进行优化与调试,获得更加精确的多主体图像的多特征数据,提升图像识别的精度。
S5:聚合优化后的特征数据,返回所述多主体图像的多特征数据。优选的,返回特定主体的多特征数据,多特征数据包括:主体位置信息、像素信息、主体大小、主体颜色。
实施例二:
本实施例提供的一种基于多主体检测分割的图像识别方法如图2所示,包括如下步骤:
S1:构建图像检测模型,获取主体信息。获取的主体信息包括:主体位置信息、像素信息、主体大小、主体颜色。
S2:对多主体图像进行检测获取主体信息,根据所述主体信息进行图像分割,获得多个主体图像。优选的,按照主体的位置信息和主体大小进行主体图像的分割,获得每个主体的图像,方便后续特征数据的识别。
S3:对所述主体图像进行图像识别,提取所述主体图像的特征数据。优选的,对分割后的主体图像进行PaddleOCR识别,提取所述主体图像的特征数据;所述特征数据包括:主体位置信息、像素信息、主体大小、主体颜色。
S4:对提取后的特征数据进行编写过滤和匹配算法,进行优化与调试,确认所述特征数据过滤与匹配算法。通过对特征数据处理算法进行优化与调试,获得更加精确的多主体图像的多特征数据,提升图像识别的精度。
优选的,步骤S4包括以下步骤:
S401:对提取后的特征数据进行编写过滤和匹配算法;
S402:算法优化,提升图像特征数据处理的精度;
S403:算法调试,确认特征数据的处理结果是否达到预设要求,若通过则进行S404,若调试没有通过则返回S402;
S404:确认所述特征数据过滤与匹配算法。
S5:聚合优化后的特征数据,返回所述多主体图像的多特征数据。优选的,返回特定主体的多特征数据,多特征数据包括:主体位置信息、像素信息、主体大小、主体颜色。
优选的,所述步骤S5中将优化后的数据进行聚合,包括分类和聚合两个步骤,其中分类步骤包括了按照主体对图像的多特征识别数据进行分类,聚合步骤的结果是得到多个按主体分类的特征数据集合。
实施例三:
本实施例提供的一种基于多主体检测分割的图像识别方法如图3所示,包括如下步骤:
S1:构建图像检测模型,获取主体信息;包括:
S101:收集样本,收集3000张不同环境下的图片作为样本,并按照训练的算法命名规则进行图片的存放以及其映射文件,尽可能收集不同类别的样本,各式各样的样本越多,训练出的模型就越完美,收集的图片样本可以包括风景图片、几何图片、人物图片、动物图片或者文字图片等,构建样本集合。
S102:将样本导入到标记工具中并对样本进行标注,标注工具可以为labelImg,这一步可能需要投入大量的人力去完成标注,也可以编写算法利用机器进行自动化标注,这样可以保证标注的准确与迅速,在标注过程中需要确定统一的标注标准,以便保证标注内容的一致性,标注的内容可以包括主体的位置、大小、像素和颜色等;
S103:进行样本检测模型训练,采用YOLO、RETINANET或两种相结合的预置算法,进行检测模型训练,进行训练时,可以改变样本图片的颜色、明暗和角度等;
S104:对模型进行调整优化,;
S105:对模型进行调试,若模型通过调试则进行S101,若没有通过则返回S02在样本中进行标注,完善样本,标注工具可以为labelImg。
优选的,获取的主体信息包括:主体位置信息、像素信息、主体大小、主体颜色。
S2:对多主体图像进行检测获取主体信息,根据所述主体信息进行图像分割,获得多个主体图像。优选的,按照主体的位置信息和主体大小进行主体图像的分割,获得每个主体的图像,方便后续特征数据的识别。
S3:对所述主体图像进行图像识别,提取所述主体图像的特征数据。优选的,对分割后的主体图像进行PaddleOCR识别,提取所述主体图像的特征数据;所述特征数据包括:主体位置信息、像素信息、主体大小、主体颜色。
S4:对提取后的特征数据进行编写过滤和匹配算法,进行优化与调试,确认所述特征数据过滤与匹配算法。通过对特征数据处理算法进行优化与调试,获得更加精确的多主体图像的多特征数据,提升图像识别的精度。
S5:聚合优化后的特征数据,返回所述多主体图像的多特征数据。优选的,返回特定主体的多特征数据,多特征数据包括:主体位置信息、像素信息、主体大小、主体颜色。
优选的,所述步骤S5中将优化后的数据进行聚合,包括分类和聚合两个步骤,其中分类步骤包括了按照主体对图像的多特征识别数据进行分类,聚合步骤的结果是得到多个按主体分类的特征数据集合。
实施例四
本实施例提供了一种基于多主体检测分割的图像识别方法,包括如下步骤:
S1:构建图像检测模型,获取主体信息。获取的主体信息包括:主体位置信息、像素信息、主体大小、主体颜色。
S2:对多主体图像进行检测获取主体信息,根据所述主体信息进行图像分割,获得多个主体图像。优选的,按照主体的位置信息和主体大小进行主体图像的分割,获得每个主体的图像,方便后续特征数据的识别。
S3:对所述主体图像进行图像识别,提取所述主体图像的特征数据。优选的,对分割后的主体图像进行PaddleOCR识别,提取所述主体图像的特征数据;所述特征数据包括:主体位置信息、像素信息、主体大小、主体颜色。
S4:对提取后的特征数据进行编写过滤和匹配算法,进行优化与调试,确认所述特征数据过滤与匹配算法。通过对特征数据处理算法进行优化与调试,获得更加精确的多主体图像的多特征数据,提升图像识别的精度。
S5:聚合优化后的特征数据,返回所述多主体图像的多特征数据。优选的,返回特定主体的多特征数据,多特征数据包括:主体位置信息、像素信息、主体大小、主体颜色。优选的,所述步骤S5,包括按照主体对图像的多特征识别数据进行分类,获取每个主体的多特征数据。
优选的,所述步骤S5,包括返回多主体图像中特定主体的多特征数据。
优选的,所述步骤S5,包括按照主体分类返回多主体图像中所有主体的多特征数据。
实施例五
本实施例提供的一种基于多主体检测分割的图像识别方法,包括如下步骤:
S1:构建图像检测模型,获取主体信息;包括:
S101:收集样本;收集4000张不同环境下的图片作为样本,并按照训练的算法命名规则进行图片的存放以及其映射文件,尽可能收集不同类别的样本,各式各样的样本越多,训练出的模型就越完美,收集的图片样本可以包括风景图片、几何图片、人物图片、动物图片或者文字图片等,构建样本集合;
S102:将样本导入到标注工具中并对样本进行标注;标注工具可以为labelme,这一步需要投入大量的人力去完成标注,这样可以保证标注的准确与迅速,也可以编写算法利用机器进行自动化标注,在标注过程中需要确定统一的标注标准,以便保证标注内容的一致性,标注的内容可以包括主体的位置、大小、像素和颜色等。
S103:进行样本检测模型训练;采用YOLO、RETINANET或两种相结合的预置算法,进行检测模型训练,进行训练时,可以改变样本图片的颜色、明暗和角度等。
S104:对模型进行调整优化,模型调整优化可以包括以下步骤:
S1041:超参调优,可以利用计算公式预测各项参数的最优范围,并进行参数试验,确定最优的参数数值;
S1042:模型修剪,根据参数的调试结果对模型进行进一步的优化,简化计算过程,提升检测模型的计算效率;
S1043:模型量化,对模型进行量化处理,为后续的样本检测提供参考;
S1044:模型转化,确定本次调整与优化后的检测模型。
S105:对模型进行调试,若模型通过调试则进行S101,若没有通过则返回S102在样本中进行标注,完善样本;标注工具可以为labelme,可以结合步骤S1044中的模型,可以在各个框架下进行调试。
S2:对多主体图像进行检测获取主体信息,根据所述主体信息进行图像分割,获得多个主体图像。优选的,按照主体的位置信息和主体大小进行主体图像的分割,获得每个主体的图像,方便后续特征数据的识别。
S3:对所述主体图像进行图像识别,提取所述主体图像的特征数据。优选的,对分割后的主体图像进行PaddleOCR识别,提取所述主体图像的特征数据;所述特征数据包括:主体位置信息、像素信息、主体大小、主体颜色。
S4:对提取后的特征数据进行编写过滤和匹配算法,进行优化与调试,确认所述特征数据过滤与匹配算法。通过对特征数据处理算法进行优化与调试,获得更加精确的多主体图像的多特征数据,提升图像识别的精度。
S5:聚合优化后的特征数据,返回所述多主体图像的多特征数据。优选的,返回特定主体的多特征数据,多特征数据包括:主体位置信息、像素信息、主体大小、主体颜色。
优选的,所述步骤S5中将优化后的数据进行聚合,包括分类和聚合两个步骤,其中分类步骤包括了按照主体对图像的多特征识别数据进行分类,聚合步骤的结果是得到多个按主体分类的特征数据集合。
实施例六
本实施例提供的一种基于多主体检测分割的图像识别方法如图4所示,包括如下步骤:
S1:构建图像检测模型,获取主体信息;包括:
S101:收集样本;收集4000张不同环境下的图片作为样本,并按照训练的算法命名规则进行图片的存放以及其映射文件,尽可能收集不同类别的样本,各式各样的样本越多,训练出的模型就越完美,收集的图片样本可以包括风景图片、几何图片、人物图片、动物图片或者文字图片等,构建样本集合;
S102:将样本导入到标注工具中并对样本进行标注;标注工具可以为labelme,这一步需要投入大量的人力去完成标注,这样可以保证标注的准确与迅速,也可以编写算法利用机器进行自动化标注,在标注过程中需要确定统一的标注标准,以便保证标注内容的一致性,标注的内容可以包括主体的位置、大小、像素和颜色等。
S103:进行样本检测模型训练;采用YOLO、RETINANET或两种相结合的预置算法,进行检测模型训练,进行训练时,可以改变样本图片的颜色、明暗和角度等。
S104:对模型进行调整优化,模型调整优化可以包括以下步骤:
S1041:超参调优,可以利用计算公式预测各项参数的最优范围,并进行参数试验,确定最优的参数数值;
S1042:模型修剪,根据参数的调试结果对模型进行进一步的优化,简化计算过程,提升检测模型的计算效率;
S1043:模型量化,对模型进行量化处理,为后续的样本检测提供参考;
S1044:模型转化,确定本次调整与优化后的检测模型。
S105:对模型进行调试,若模型通过调试则进行S101,若没有通过则返回S102在样本中进行标注,完善样本;标注工具可以为labelme,可以结合步骤S1044中的模型,可以在各个框架下进行调试。
S2:对多主体图像进行检测获取主体信息,根据所述主体信息进行图像分割,获得多个主体图像。优选的,按照主体的位置信息和主体大小进行主体图像的分割,获得每个主体的图像,方便后续特征数据的识别。
S3:对所述主体图像进行图像识别,提取所述主体图像的特征数据。优选的,对分割后的主体图像进行PaddleOCR识别,提取所述主体图像的特征数据;所述特征数据包括:主体位置信息、像素信息、主体大小、主体颜色。
S4:对提取后的特征数据进行编写过滤和匹配算法,进行优化与调试,确认所述特征数据过滤与匹配算法。通过对特征数据处理算法进行优化与调试,获得更加精确的多主体图像的多特征数据,提升图像识别的精度。
优选的,步骤S4包括以下步骤:
S401:对提取后的特征数据进行编写过滤和匹配算法;
S402:算法优化,提升图像特征数据处理的精度;
S403:算法调试,确认特征数据的处理结果是否达到预设要求,若通过则进行S404,若调试没有通过则返回S402;
S404:确认所述特征数据过滤与匹配算法。
S5:聚合优化后的特征数据,返回所述多主体图像的多特征数据。优选的,返回特定主体的多特征数据,多特征数据包括:主体位置信息、像素信息、主体大小、主体颜色。
优选的,所述步骤S5中将优化后的数据进行聚合,包括分类和聚合两个步骤,其中分类步骤包括了按照主体对图像的多特征识别数据进行分类,聚合步骤的结果是得到多个按主体分类的特征数据集合。
实施例七
本实施例提供的一种基于多主体检测分割的图像识别方法,包括如下步骤:
S1:构建图像检测模型,获取主体信息;包括:
S101:收集样本。收集5000张不同环境下的图片作为样本,并按照训练的算法命名规则进行图片的存放以及其映射文件,尽可能收集不同类别的样本,各式各样的样本越多,训练出的模型就越完美,收集的图片样本可以包括风景图片、几何图片、人物图片、动物图片或者文字图片等,构建样本集合;
S102:将样本导入到标注工具中并对样本进行标注;按照样本的分类进行主体标注,若样本存在的主体超过五个,则增大样本数量,并采用线上标注工具ModelArts进行多人分配标注,这一步需要投入大量的人力去完成标注可以保证标注的准确与迅速,同时也可以预先确定样本的标注标准,并编写运行算法利用机器进行自动化标注,这样有利于提升样本标注的速度,标注的内容可以包括主体的位置、大小、像素和颜色等;
S103:进行样本检测模型训练,可以采用YOLO、RETINANET或两种相结合的预置算法,进行检测模型训练,并对模型检测训练效果进行验证,提升样本检测的精准度,进行训练时,可以改变样本图片的颜色、明暗和角度等;
S104:对模型进行调整优化,模型调整优化可以包括以下步骤:
S1041:超参调优,可以利用计算公式预测各项参数的最优范围,并进行参数试验,确定最优的参数数值;
S1042:模型修剪,根据参数的调试结果对模型进行进一步的优化,简化计算过程,提升检测模型的计算效率;
S1043:模型量化,对模型进行量化处理,为后续的样本检测提供参考;
S1044:模型转化,确定本次调整与优化后的检测模型。
S105:对模型进行调试,若模型通过调试则进行S101,若没有通过则返回S102在样本中进行标注,完善样本;标注工具可以为ModelArts,可以结合步骤S1044中的模型,可以在各个框架下进行调试。其中,模型调试的标准可以是图像各主体分割的精准程度、边缘模糊度等,对模型吊事结果进行统一标准的评价。
S2:对多主体图像进行检测获取主体信息,根据所述主体信息进行图像分割,获得多个主体图像。优选的,按照主体的位置信息和主体大小进行主体图像的分割,获得每个主体的图像,方便后续特征数据的识别。
S3:对所述主体图像进行图像识别,提取所述主体图像的特征数据。优选的,对分割后的主体图像进行PaddleOCR识别,提取所述主体图像的特征数据;所述特征数据包括:主体位置信息、像素信息、主体大小、主体颜色。
S4:对提取后的特征数据进行编写过滤和匹配算法,进行优化与调试,确认所述特征数据过滤与匹配算法。通过对特征数据处理算法进行优化与调试,获得更加精确的多主体图像的多特征数据,提升图像识别的精度。
优选的,步骤S4包括以下步骤:
S401:对提取后的特征数据进行编写过滤和匹配算法;
S402:算法优化,提升图像特征数据处理的精度;
S403:算法调试,确认特征数据的处理结果是否达到预设要求,若通过则进行S404,若调试没有通过则返回S402;
S404:确认所述特征数据过滤与匹配算法。
S5:聚合优化后的特征数据,返回所述多主体图像的多特征数据。
优选的,返回特定主体的多特征数据,多特征数据包括:主体位置信息、像素信息、主体大小、主体颜色。
优选的,所述步骤S5,包括返回多主体图像中特定主体的多特征数据。
优选的,所述步骤S5,包括按照主体分类返回多主体图像中所有主体的多特征数据。
本发明的实施例是为了示例和描述起见而给出的,只是为了解释本发明实施例的原理,而并不是无遗漏的或者将本发明限于所公开的形式,很多修改和变化对于本领域的普通技术人员而言是显而易见的,因此本实施例的描述不能以任何方式解释为对本发明实施例保护范围的限制。基于此处的解释,本领域的技术人员不需要付出创造性的劳动即可联想到本发明实施例的其它具体实施方式都将落入本发明实施例的保护范围之内。
Claims (9)
1.一种基于多主体检测分割的图像识别方法,其特征在于,包括如下步骤:
S101:收集样本,构建样本集合;
S102:将样本导入到标记工具中并对样本中主体按照样本的分类进行主体标注,标注信息包括:位置信息、像素信息、主体大小、颜色信息,用于获取主体信息;
S103:采用YOLO、RETINANET或两种相结合的预置算法进行样本检测模型训练,提升获取主体信息的精度;
S104:对模型进行调整优化;
S105:对模型进行调试,若模型通过调试则进行S101,若没有通过则返回S102在样本中进行标注,完善样本;
S2:对多主体图像进行检测获取主体信息,根据所述主体信息进行图像分割,获得多个主体图像;
S3:对所述主体图像进行图像识别,提取所述主体图像的特征数据;
S4:对提取后的特征数据进行编写过滤和匹配算法,进行优化与调试,确认所述特征数据过滤与匹配算法;
S5:聚合优化后的特征数据,返回所述多主体图像的多特征数据。
2.根据权利要求1所述的一种基于多主体检测分割的图像识别方法,其特征在于,所述步骤S3中对分割后的主体图像进行PaddleOCR识别,提取所述主体图像的特征数据;所述特征数据包括:主体位置信息、像素信息、主体大小、主体颜色。
3.根据权利要求1所述的一种基于多主体检测分割的图像识别方法,其特征在于,所述步骤S4包括以下步骤:
S401:对提取后的特征数据进行编写过滤和匹配算法;
S402:算法优化,提升图像特征数据处理的精度;
S403:算法调试,若通过则进行S404,若调试没有通过则返回S402;
S404:确认所述特征数据过滤与匹配算法。
4.根据权利要求3所述的一种基于多主体检测分割的图像识别方法,其特征在于,所述步骤S5,包括按照主体对图像的多特征识别数据进行分类,获取每个主体的多特征数据。
5.根据权利要求3所述的一种基于多主体检测分割的图像识别方法,其特征在于,所述步骤S5,包括返回多主体图像中特定主体的多特征数据。
6.根据权利要求3所述的一种基于多主体检测分割的图像识别方法,其特征在于,所述步骤S5,包括按照主体分类返回多主体图像中所有主体的多特征数据。
7.根据权利要求1所述的一种基于多主体检测分割的图像识别方法,其特征在于,所述步骤S101中,收集至少3000张不同环境下的图片作为样本,并按照训练的算法命名规则进行图片的存放以及其映射文件。
8.根据权利要求1所述的一种基于多主体检测分割的图像识别方法,其特征在于,所述标记 工具包括labelImg和labelme,若样本存在的主体超过五个,则增大样本数量,并采用线上标注工具ModelArts进行多人分配标注。
9.根据权利要求1所述的一种基于多主体检测分割的图像识别方法,其特征在于,所述步骤S104中,模型调整优化包括以下步骤:
S1041:超参调优;
S1042:模型修剪;
S1043:模型量化;
S1044:模型转化。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110972079.4A CN113763389B (zh) | 2021-08-24 | 2021-08-24 | 一种基于多主体检测分割的图像识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110972079.4A CN113763389B (zh) | 2021-08-24 | 2021-08-24 | 一种基于多主体检测分割的图像识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113763389A CN113763389A (zh) | 2021-12-07 |
CN113763389B true CN113763389B (zh) | 2022-06-14 |
Family
ID=78790910
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110972079.4A Active CN113763389B (zh) | 2021-08-24 | 2021-08-24 | 一种基于多主体检测分割的图像识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113763389B (zh) |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110570435B (zh) * | 2018-09-10 | 2020-06-26 | 阿里巴巴集团控股有限公司 | 用于对车辆损伤图像进行损伤分割的方法及装置 |
CN109670532B (zh) * | 2018-11-23 | 2022-12-09 | 腾讯医疗健康(深圳)有限公司 | 生物体器官组织图像的异常识别方法、装置及系统 |
CN109934305A (zh) * | 2019-04-01 | 2019-06-25 | 成都大学 | 基于图像识别模型的图像识别方法及装置 |
CN110969166A (zh) * | 2019-12-04 | 2020-04-07 | 国网智能科技股份有限公司 | 一种巡检场景下小目标识别方法和系统 |
CN111709349B (zh) * | 2020-06-11 | 2023-12-01 | 杭州尚尚签网络科技有限公司 | 一种针对带表格合同的ocr识别方法 |
CN112528738A (zh) * | 2020-11-06 | 2021-03-19 | 广东电网有限责任公司中山供电局 | 一种人工智能图像识别模型优化方法及系统 |
CN112434794A (zh) * | 2020-11-30 | 2021-03-02 | 国电南瑞科技股份有限公司 | 一种基于深度学习的计算机视觉数据集半自动标注方法及系统 |
CN113111869B (zh) * | 2021-04-06 | 2022-12-09 | 上海交通大学 | 提取文字图片及其描述的方法和系统 |
CN113239854B (zh) * | 2021-05-27 | 2023-12-19 | 北京环境特性研究所 | 一种基于深度学习的船舶身份识别方法及系统 |
-
2021
- 2021-08-24 CN CN202110972079.4A patent/CN113763389B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN113763389A (zh) | 2021-12-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111881913A (zh) | 图像识别方法及装置、存储介质和处理器 | |
CN109378052B (zh) | 图像标注的预处理方法及系统 | |
CN108509988B (zh) | 一种试卷分数自动统计方法、装置、电子设备及存储介质 | |
CN108805196A (zh) | 用于图像识别的自动增量学习方法 | |
CN114066848B (zh) | 一种fpca外观缺陷视觉检测系统 | |
CN111476754B (zh) | 一种骨髓细胞影像人工智能辅助分级诊断系统及方法 | |
CN102565074B (zh) | 小张清分机疑似缺陷产品图像复检系统及方法 | |
CN110807775A (zh) | 基于人工智能的中医舌像分割装置、方法及存储介质 | |
CN108664970A (zh) | 一种快速目标检测方法、电子设备、存储介质及系统 | |
CN108009567A (zh) | 一种结合图像颜色及hog和svm的粪便性状的自动辨别方法 | |
CN114663904A (zh) | 一种pdf文档布局检测方法、装置、设备及介质 | |
CN112464925A (zh) | 基于机器学习的移动端开户资料银行信息自动提取方法 | |
CN116740723A (zh) | 一种基于开源Paddle框架的PDF文档识别方法 | |
CN109213886A (zh) | 基于图像分割和模糊模式识别的图像检索方法及系统 | |
CN111932639A (zh) | 一种基于卷积神经网络的不均衡缺陷样本的检测方法 | |
CN113019993B (zh) | 一种籽棉的杂质分类识别方法及系统 | |
CN113763389B (zh) | 一种基于多主体检测分割的图像识别方法 | |
CN112101336A (zh) | 一种基于计算机视觉的智能数据采集方式 | |
CN110377640A (zh) | 一种基于深度学习投票统计方法 | |
CN113192022A (zh) | 基于深度学习的病原孢子识别计数方法和装置 | |
CN109657684A (zh) | 一种基于弱监督学习的图像语义解析方法 | |
CN113128251A (zh) | 一种鱼脸特征检测算法 | |
CN113536014B (zh) | 一种融合容器信息的菜品信息检索方法 | |
CN111652258A (zh) | 一种图像分类数据标注质量评估方法 | |
TWI695343B (zh) | 用於偵測移動物件之自動標註方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |