CN113177498B - 基于物体真实大小和物体特征的图像识别方法和装置 - Google Patents

基于物体真实大小和物体特征的图像识别方法和装置 Download PDF

Info

Publication number
CN113177498B
CN113177498B CN202110506312.XA CN202110506312A CN113177498B CN 113177498 B CN113177498 B CN 113177498B CN 202110506312 A CN202110506312 A CN 202110506312A CN 113177498 B CN113177498 B CN 113177498B
Authority
CN
China
Prior art keywords
image
label
category
size
recognized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110506312.XA
Other languages
English (en)
Other versions
CN113177498A (zh
Inventor
戴琼海
李晓飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN202110506312.XA priority Critical patent/CN113177498B/zh
Publication of CN113177498A publication Critical patent/CN113177498A/zh
Application granted granted Critical
Publication of CN113177498B publication Critical patent/CN113177498B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Analysis (AREA)

Abstract

本申请提出了一种基于物体真实大小和物体特征的图像识别方法,涉及计算机图像识别技术领域,其中,该方法包括:获取测试集和标签集,测试集包括待识别图像,标签集中包括预存的各物体类别标签,与拍摄距离范围和物体在图像中大小范围之间的对应关系;根据对待识别图像进行图像识别后生成的多个类别标签和标签集,从多个类别标签中确定待识别图像的真实类别标签;根据真实匹配类别标签生成待识别图像的识别结果,并输出识别结果。本发明可以排除匹配类别标签集中物体大小不相符的物体类别,大大缩小匹配类别的范围,提高图像识别的准确率;解决在一张多类别共存的图片或者场景中将图像识别算法的注意力集中在要求识别的物体类别上的技术问题。

Description

基于物体真实大小和物体特征的图像识别方法和装置
技术领域
本申请涉及计算机图像识别技术领域,尤其涉及一种基于物体真实大小和物体特征的图像识别方法和计算机设备。
背景技术
目前,人工智能领域的图像识别方法主要基于物体的形状和纹理等外观特征,比如目前经典的AlexNet、VGG、GoogleNet、ResNet、DenseNet等图像分类算法;有些基于物体所处的背景、场景等一些上下文语义信息,比如DeepLab系列模型、RefineNet、金字塔场景稀疏网络语义分割模型(PSPNet)、生成对抗网络模型(GAN)等。现有的图像识别算法无法区分汽机和汽机模型、老虎和老虎玩具等这类物体特征高度相似但物体真实大小有明显区别的图像,无法在一张多类别共存的图片或者场景中将图像识别算法的注意力集中在我们要求识别的物体类别上。
根据眼睛进化史、人类视觉识别常识和视觉系统神经网络的研究可知,物体在真实物理世界中的大小(物体真实大小)是人类识别物体的重要依据。物体真实大小的识别是一个由背侧视觉通路、腹侧视觉通路、顶叶皮质区域等脑区参与的自动识别的过程。目前人工智能领域还没有报道基于物体真实大小的图像识别方法。
发明内容
本申请旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本申请的第一个目的在于提出一种基于物体真实大小和物体特征的图像识别方法,解决了现有方法无法区分物体特征高度相似但物体真实大小有明显区别的图像的技术问题,同时解决了在识别一张多类别共存的图片或者场景时将图像识别算法的注意力集中在要求识别的物体类别上的技术问题,实现了根据物体真实大小排除匹配类别标签集中物体大小不相符的物体类别,大大缩小匹配类别的范围,提高图像识别的准确率的目的。
本申请的第二个目的在于提出一种计算机设备。
本申请的第三个目的在于提出一种非临时性计算机可读存储介质。
为达上述目的,本申请第一方面实施例提出了一种基于物体真实大小和物体特征的图像识别方法,包括:S1、获取测试集和标签集,测试集包括待识别图像,标签集中包括预存的各物体类别标签,与拍摄距离范围和物体在图像中大小范围之间的对应关系;S2、根据对待识别图像进行图像识别后生成的多个类别标签和标签集,从多个类别标签中确定待识别图像的真实类别标签;S3、根据真实匹配类别标签生成待识别图像的识别结果,并输出识别结果。
可选地,在本申请的一个实施例中,步骤S2包括:
S211、对待识别图像中的物体进行识别,根据物体类别获取待识别图像对应的多个类别标签,并获取多个类别标签中每个类别标签对应的匹配概率;
S212、按照匹配概率从大到小的顺序从多个类别标签中提取第一个类别标签;
S213、根据提取的类别标签从标签集中确定与提取的类别标签对应的物体类别标签,并将待识别图像的拍摄距离与确定的物体类别标签对应的拍摄距离范围进行比较,判断待识别图像的拍摄距离是否在拍摄距离范围内;
S214、如果待识别图像的拍摄距离在拍摄距离范围内,则进一步将待识别图像的物体在图像中大小与确定的物体类别标签对应的物体在图像中大小范围进行比较,判断待识别图像的物体在图像中大小是否在物体在图像中大小范围内;
S215、如果待识别图像的物体在图像中大小在物体在图像中大小范围内,则将确定的物体类别标签作为待识别图像的真实类别标签。
可选地,在本申请的一个实施例中,在步骤S213之后,识别方法还包括:
如果待识别图像的拍摄距离不在拍摄距离范围内,则从多个类别标签中提取第二个类别标签,并根据提取的第二个类别标签重复进行上述步骤S213-215;
在步骤S214之后,识别方法还包括:
如果待识别图像的物体在图像中大小不在物体在图像中大小范围内,则从多个类别标签中提取第二个类别标签,并根据提取的第二个类别标签重复进行上述步骤S213-215。
可选地,在本申请的一个实施例中,步骤S2包括:
S221、将待识别图像的拍摄距离和物体在图像中大小与标签集中的拍摄距离范围和物体在图像中大小范围进行比较,判断待识别图像的拍摄距离和物体在图像中大小所属的拍摄距离范围和物体在图像中大小范围;
S222、获取所属的拍摄距离范围和物体在图像中大小范围对应的物体类别标签,根据物体类别标签和拍摄距离范围和物体在图像中大小范围对应的物体类别标签生成子标签集;
S223、对待识别图像中的物体进行识别,根据物体类别获取待识别图像对应的多个类别标签,并获取多个类别标签中每个类别标签对应的匹配概率;
S224、按照匹配概率从大到小的顺序从多个类别标签中提取第一个类别标签;
S225、判断提取的类别标签是否与子标签集中的物体类别标签匹配;
S226、如果提取的类别标签与子标签集中的物体类别标签匹配,则将匹配的物体类别标签确定为待识别图像的真实类别标签。
可选地,在本申请的一个实施例中,在步骤S224之后,识别方法还包括:
如果提取的类别标签与子标签集中的物体类别标签不匹配,则从多个类别标签中提取第二个类别标签,并根据提取的第二个类别标签重复进行上述步骤S225-226。
可选地,在本申请的一个实施例中,标签集中各物体类别标签与拍摄距离范围和物体在图像中大小范围之间的对应关系,是预先由人工计算并标注的,或者,通过各物体的拍摄距离和图像中大小实时测量得到的。
可选地,在本申请的一个实施例中,物体在图像中大小通过物体在图像中的高度和宽度表示。
可选地,在本申请的一个实施例中,物体在图像中的高度通过物体在图像中的高度与图像高度的比值表示,物体在图像中的宽度通过物体在图像中的宽度与图像宽度的比值表示。
为达上述目的,本发明第二方面实施例提出了一种计算机设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述基于物体真实大小和物体特征的图像识别方法。
为了实现上述目的,本发明第三方面实施例提出了一种非临时性计算机可读存储介质,当所述存储介质中的指令由处理器被执行时,能够执行基于物体真实大小和物体特征的图像识别方法。
本申请实施例的基于物体真实大小和物体特征的图像识别方法、计算机设备和非临时性计算机可读存储介质,解决了区分物体特征高度相似但物体真实大小有明显区别的图像的技术问题,同时解决了在识别一张多类别共存的图片或者场景时将图像识别算法的注意力集中在要求识别的物体类别上的技术问题,并且根据物体真实大小排除匹配类别标签集中物体大小不相符的物体类别,从而大大缩小了匹配类别的范围,提高了图像识别的准确率。
本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本申请实施例一所提供的一种基于物体真实大小和物体特征的图像识别方法的流程图;
图2a为本申请实施例的基于物体真实大小和物体特征的图像识别方法一的流程图;
图2b为本申请实施例的基于物体真实大小和物体特征的图像识别方法二的流程图;
图3为本申请实施例的基于物体真实大小和物体特征的图像识别方法的实验流程图;
图4a为本申请实施例的基于物体真实大小和物体特征的图像识别方法的自制图像训练集;
图4b为本申请实施例的基于物体真实大小和物体特征的图像识别方法的自制图像测试集;
图4c为本申请实施例的基于物体真实大小和物体特征的图像识别方法的自制图像标签集。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。
下面参考附图描述本申请实施例的基于物体真实大小和物体特征的图像识别方法和装置。
图1为本申请实施例一所提供的一种基于物体真实大小和物体特征的图像识别方法的流程图。
如图1所示,该基于物体真实大小和物体特征的图像识别方法包括以下步骤:
步骤101,获取测试集和标签集,测试集包括待识别图像,标签集中包括预存的各物体类别标签,与拍摄距离范围和物体在图像中大小范围之间的对应关系;
步骤102,根据对待识别图像进行图像识别后生成的多个类别标签和标签集,从多个类别标签中确定待识别图像的真实类别标签;
步骤103,根据真实匹配类别标签生成待识别图像的识别结果,并输出识别结果。
本申请实施例的基于物体真实大小和物体特征的图像识别方法,通过S1、获取测试集和标签集,测试集包括待识别图像,标签集中包括预存的各物体类别标签,与拍摄距离范围和物体在图像中大小范围之间的对应关系;S2、根据对待识别图像进行图像识别后生成的多个类别标签和标签集,从多个类别标签中确定待识别图像的真实类别标签;S3、根据真实匹配类别标签生成待识别图像的识别结果,并输出识别结果。由此,能够解决区分物体特征高度相似但物体真实大小有明显区别的图像的技术问题,同时解决在识别一张多类别共存的图片或者场景时将图像识别算法的注意力集中在要求识别的物体类别上的技术问题,并且实现根据物体真实大小排除匹配类别标签集中物体大小不相符的物体类别,从而大大缩小匹配类别的范围,提高图像识别的准确率。
进一步地,在本申请实施例中,步骤S2包括:
S211、对待识别图像中的物体进行识别,根据物体类别获取待识别图像对应的多个类别标签,并获取多个类别标签中每个类别标签对应的匹配概率;
S212、按照匹配概率从大到小的顺序从多个类别标签中提取第一个类别标签;
S213、根据提取的类别标签从标签集中确定与提取的类别标签对应的物体类别标签,并将待识别图像的拍摄距离与确定的物体类别标签对应的拍摄距离范围进行比较,判断待识别图像的拍摄距离是否在拍摄距离范围内;
S214、如果待识别图像的拍摄距离在拍摄距离范围内,则进一步将待识别图像的物体在图像中大小与确定的物体类别标签对应的物体在图像中大小范围进行比较,判断待识别图像的物体在图像中大小是否在物体在图像中大小范围内;
S215、如果待识别图像的物体在图像中大小在物体在图像中大小范围内,则将确定的物体类别标签作为待识别图像的真实类别标签。
将测试集中标注有物体的拍摄距离和物体在图片中大小的待识别图像输入到基于物体特征的图像识别算法中;当到达算法的输出层时,并不是像现有的图像识别方法一样将匹配概率最大的类别标签作为识别结果输出,而是先将输出层内的匹配类别标签按照匹配概率从大到小排列,然后按照匹配概率大小从大到小逐个提取匹配类别标签,然后在标签集中找到这个匹配类别标签对应的拍摄距离范围和物体在图片中大小范围;然后将待识别图像的拍摄距离与这个匹配类别标签对应的拍摄距离范围比较,判断待识别图像的拍摄距离是否在这个匹配类别标签对应的拍摄距离范围内:如果是,那么就进入下一步的物体在图片中大小的判断,如果否,那么就返回到提取匹配类别标签这一步,提取下一个匹配类别标签进行以上步骤的操作;当判断结果为是,当进入物体在图片中大小的判断时,将待识别图像的物体在图片中的大小与提取出的这个匹配类别标签对应的物体在图片中的大小范围进行比较,判断待识别图像的物体在图片中的大小是否在这个匹配类别标签对应的物体在图片中的大小范围内:如果是,那么就将这个匹配类别标签作为输出结果,如果否,那么就返回到提取匹配类别标签这一步,提取下一个匹配类别标签进行以上步骤的操作。此方法中物体的拍摄距离和物体在图片中大小的判断顺序可以互换。
进一步地,在本申请实施例中,在步骤S213之后,识别方法还包括:
如果待识别图像的拍摄距离不在拍摄距离范围内,则从多个类别标签中提取第二个类别标签,并根据提取的第二个类别标签重复进行上述步骤S213-215;
在步骤S214之后,识别方法还包括:
如果待识别图像的物体在图像中大小不在物体在图像中大小范围内,则从多个类别标签中提取第二个类别标签,并根据提取的第二个类别标签重复进行上述步骤S213-215。
将输出层内的匹配类别标签按照匹配概率从大到小排列,按照匹配概率大小从大到小逐个提取匹配类别标签,在标签集中找到这个匹配类别标签对应的拍摄距离范围和物体在图片中大小范围;然后将待识别图像的拍摄距离与这个匹配类别标签对应的拍摄距离范围比较,判断待识别图像的拍摄距离是否在这个匹配类别标签对应的拍摄距离范围内:如果是,那么就进入下一步的物体在图片中大小的判断,如果否,那么就返回到提取匹配类别标签这一步,提取下一个匹配类别标签进行以上步骤的操作;当判断结果为是,当进入物体在图片中大小的判断时,将待识别图像的物体在图片中的大小与提取出的这个匹配类别标签对应的物体在图片中的大小范围进行比较,判断待识别图像的物体在图片中的大小是否在这个匹配类别标签对应的物体在图片中的大小范围内:如果是,那么就将这个匹配类别标签作为输出结果,如果否,那么就返回到提取匹配类别标签这一步,提取下一个匹配类别标签进行以上步骤的操作。
进一步地,在本申请实施例中,步骤S2包括:
S221、将待识别图像的拍摄距离和物体在图像中大小与标签集中的拍摄距离范围和物体在图像中大小范围进行比较,判断待识别图像的拍摄距离和物体在图像中大小所属的拍摄距离范围和物体在图像中大小范围;
S222、获取所属的拍摄距离范围和物体在图像中大小范围对应的物体类别标签,根据物体类别标签和拍摄距离范围和物体在图像中大小范围对应的物体类别标签生成子标签集;
S223、对待识别图像中的物体进行识别,根据物体类别获取待识别图像对应的多个类别标签,并获取多个类别标签中每个类别标签对应的匹配概率;
S224、按照匹配概率从大到小的顺序从多个类别标签中提取第一个类别标签;
S225、判断提取的类别标签是否与子标签集中的物体类别标签匹配;
S226、如果提取的类别标签与子标签集中的物体类别标签匹配,则将匹配的物体类别标签确定为待识别图像的真实类别标签。
将测试集中待识别图像的拍摄距离和物体在图片中大小与标签集中各类别标签的拍摄距离范围和物体在图片中大小范围进行比较,判断待识别图像的拍摄距离和物体在图片中的大小在标签集中哪些类别标签的拍摄距离范围和物体在图片中大小范围之内,将标签集中满足包含关系的这些类别标签组成新的子标签集作为基于物体特征的图像识别算法的匹配类别标签集;然后将测试集中待识别图像输入到基于物体特征的图像识别算法中,当到达算法的输出层时,并不是像现有的图像识别方法一样将匹配概率最大的类别标签作为识别结果输出,而是先将输出层内的匹配类别标签按照匹配概率从大到小排列,然后按照匹配概率大小从大到小逐个提取匹配类别标签,判断提取出的匹配类别标签是否在新的子标签集中,如果是,那么就输出此匹配类别标签作为识别结果输出,如果否,那么就返回到提取匹配类别标签这一步,提取下一个匹配类别标签进行以上操作,直到提取出的匹配类别标签在子标签集中,并输出识别结果。
进一步地,在本申请实施例中,在步骤S224之后,识别方法还包括:
如果提取的类别标签与子标签集中的物体类别标签不匹配,则从多个类别标签中提取第二个类别标签,并根据提取的第二个类别标签重复进行上述步骤S225-226。
将输出层内的匹配类别标签按照匹配概率从大到小排列,然后按照匹配概率大小从大到小逐个提取匹配类别标签,判断提取出的匹配类别标签是否在新的子标签集中,如果是,那么就输出此匹配类别标签作为识别结果输出,如果否,那么就返回到提取匹配类别标签这一步,提取下一个匹配类别标签进行以上操作,直到提取出的匹配类别标签在子标签集中,并输出识别结果。
进一步地,在本申请实施例中,标签集中各物体类别标签与拍摄距离范围和物体在图像中大小范围之间的对应关系,是预先由人工计算并标注的,或者,通过各物体的拍摄距离和图像中大小实时测量得到的。
使用的图像数据集的测试集中物体的真实大小和标签集中各物体类别的真实大小范围可提前由人工计算并标注出,也可在实际应用中通过距离和大小测量方法实时测量。
进一步地,在本申请实施例中,物体在图像中大小通过物体在图像中的高度和宽度表示。
进一步地,在本申请实施例中,物体在图像中的高度通过物体在图像中的高度与图像高度的比值表示,物体在图像中的宽度通过物体在图像中的宽度与图像宽度的比值表示。
图2a为本申请实施例的基于物体真实大小和物体特征的图像识别方法一的流程图。
如图2a所示,该基于物体真实大小和物体特征的图像识别方法一,先进行物体特征识别,再进行物体真实大小识别,包括:标注拍摄距离和物体在图片中大小待识别图像;输入到基于物体特征的图像识别算法中;将输出层内的匹配类别标签按照匹配概率从大到小排列;按照匹配概率大小从大到小逐个提取匹配类别标签;根据提取的标签,从标签集中找出对应标签的拍摄距离范围,并与待识别图像的拍摄距离比较;判断待识别图像的拍摄距离是否在提取出的标签对应的拍摄距离范围内;若是,根据提取的标签,从标签集中找出对应标签的物体在图片中大小范围,并与待识别图像的物体在图片中大小比较,若否,返回到提取匹配类别标签这一步,提取下一个匹配类别标签进行以上步骤的操作;判断待识别图像的物体在图片中的大小是否在提取出的标签对应的物体在图片中的大小范围内,若是,输出此标签作为识别结果,若否,那返回到提取匹配类别标签这一步,提取下一个匹配类别标签进行以上步骤的操作。
图2b为本申请实施例的基于物体真实大小和物体特征的图像识别方法二的流程图。
如图2b所示,该基于物体真实大小和物体特征的图像识别方法二,先进行物体真实大小识别,再进行物体特征识别,包括:标注拍摄距离范围和物体在图片中大小范围的标签集;判断待识别图像的拍摄距离和物体在图片中的大小包含在标签集中哪些标签的拍摄距离范围和物体在图片中大小范围之内,将满足包含关系的这些标签组成新的子标签集;标注拍摄距离范围和物体在图片中大小范围的待识别图像;输入基于物体特征的图像识别算法;将输出层内的匹配类别标签按照匹配概率从大到小排列;按照匹配概率大小从大到小逐个提取匹配类别标签;将提取出的匹配标签与子标签集进行比较,判断提取出的匹配标签是否在新的子标签集中;若是,输出此标签作为识别结果,若否,返回到提取匹配标签这一步,提取下一个匹配标签进行以上操作,直到提取出的匹配标签在子标签集中。
图3为本申请实施例的基于物体真实大小和物体特征的图像识别方法的实验流程图。
如图3所示,为测试基于物体真实大小和物体特征的图像识别方法的有效性,进行图像识别实验,包括:通过将测试集中每张待识别图像中物体在图片上的大小调整为相同大小,从而只需标注每张待识别图像中物体的拍摄距离即可;标签集中每个类别标签只需标注物体的拍摄距离范围;测试集中待识别图像的拍摄距离和标签集中各物体类别的拍摄距离范围均提前由人工计算得到。采用PyTorch自带的使用ImageNet数据集预训练过的Alexnet分类算法作为基于物体特征的图像识别方法,使用自制图像数据集中的训练集训练此Alexnet分类算法得到训练后的AlexNet图像识别算法。进行测试集中待识别图像识别时,首先判断测试集中待识别图像的拍摄距离包含在标签集中哪些标签的拍摄距离范围内,然后将这些标签组成新的子标签集;然后将待识别图像输入到训练后的AlexNet算法,当到达算法的输出层——Softmax层时,将层内的匹配类别标签按照匹配概率从大到小排列,然后按照匹配概率从大到小依次提取匹配类别标签,判断提取出的匹配类别标签是否在子标签集中,如果是,那么就输出此类别标签作为输出结果,如果否,那么就返回到提取匹配类别标签这一步,提取下一个匹配类别标签进行判别操作,直到提取出的匹配类别标签在子标签集中,并输出识别结果。
表一为本发明实验方案的结果。结果表明,经过10次测试实验,不使用本发明的方法,采用AlexNet图像识别算法得到的测试集准确率的平均值仅仅为71.0%;使用本发明的方法后测试集准确率的平均值大大提高到93.6%,大约提高了22.6%。
Figure BDA0003058574830000091
表一
图4a为本申请实施例的基于物体真实大小和物体特征的图像识别方法的自制图像训练集。
如图4a所示,该基于物体真实大小和物体特征的图像识别方法的自制图像训练集中的图片不标定物体真实大小。
图4b为本申请实施例的基于物体真实大小和物体特征的图像识别方法的自制图像测试集。
如图4b所示,标注物体的拍摄距离的测试集中,每张图片的名称中下划线“_”后面的数字即为图片中待识别物体对应的拍摄距离,测试集中由于每张图片中物体的高度或者宽度和图片的高度或者宽度几乎一样大,因此只需标注物体的拍摄距离,即可实现物体的拍摄距离和物体在图片中大小的同时标注。
图4c为本申请实施例的基于物体真实大小和物体特征的图像识别方法的自制图像标签集。
如图4c所示,该基于物体真实大小和物体特征的图像识别方法的自制图像标签集,主要标注物体拍摄距离范围。
为了实现上述实施例,本发明还提出了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时,实现上述施例的基于物体真实大小和物体特征的图像识别方法。
为了实现上述实施例,本发明还提出了一种非临时性计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述实施例的基于物体真实大小和物体特征的图像识别方法。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (8)

1.一种基于物体真实大小和物体特征的图像识别方法,其特征在于,包括以下步骤:
S1、获取测试集和标签集,所述测试集包括待识别图像,所述标签集中包括预存的各物体类别标签,与拍摄距离范围和物体在图像中大小范围之间的对应关系;
S2、根据对所述待识别图像进行图像识别后生成的多个类别标签和所述标签集,从多个类别标签中确定所述待识别图像的真实类别标签;
S3、根据所述真实类别标签生成所述待识别图像的识别结果,并输出所述识别结果;
其中,所述步骤S2包括步骤S211-步骤S215:
S211、对所述待识别图像中的物体进行识别,根据物体类别获取所述待识别图像对应的多个类别标签,并获取所述多个类别标签中每个类别标签对应的匹配概率;
S212、按照所述匹配概率从大到小的顺序从所述多个类别标签中提取第一个类别标签;
S213、根据提取的类别标签从所述标签集中确定与提取的类别标签对应的物体类别标签,并将所述待识别图像的拍摄距离与确定的物体类别标签对应的拍摄距离范围进行比较,判断所述待识别图像的拍摄距离是否在拍摄距离范围内;
S214、如果所述待识别图像的拍摄距离在拍摄距离范围内,则进一步将所述待识别图像的物体在图像中大小与确定的物体类别标签对应的物体在图像中大小范围进行比较,判断所述待识别图像的物体在图像中大小是否在物体在图像中大小范围内;
S215、如果所述待识别图像的物体在图像中大小在物体在图像中大小范围内,则将确定的物体类别标签作为所述待识别图像的真实类别标签;或者
所述步骤S2包括步骤S221-步骤S226:
S221、将所述待识别图像的拍摄距离和物体在图像中大小与所述标签集中的拍摄距离范围和物体在图像中大小范围进行比较,判断所述待识别图像的拍摄距离和物体在图像中大小所属的拍摄距离范围和物体在图像中大小范围;
S222、获取所属的拍摄距离范围和物体在图像中大小范围对应的物体类别标签,根据物体类别标签和拍摄距离范围和物体在图像中大小范围对应的物体类别标签生成子标签集;
S223、对所述待识别图像中的物体进行识别,根据物体类别获取所述待识别图像对应的多个类别标签,并获取所述多个类别标签中每个类别标签对应的匹配概率;
S224、按照所述匹配概率从大到小的顺序从所述多个类别标签中提取第一个类别标签;
S225、判断提取的类别标签是否与所述子标签集中的物体类别标签匹配;
S226、如果提取的类别标签与所述子标签集中的物体类别标签匹配,则将匹配的物体类别标签确定为所述待识别图像的真实类别标签。
2.如权利要求1所述的识别方法,其特征在于,在所述步骤S213之后,所述识别方法还包括:
如果所述待识别图像的拍摄距离不在拍摄距离范围内,则从所述多个类别标签中提取第二个类别标签,并根据提取的第二个类别标签重复进行上述步骤S213-215;
在所述步骤S214之后,所述识别方法还包括:
如果所述待识别图像的物体在图像中大小不在物体在图像中大小范围内,则从所述多个类别标签中提取第二个类别标签,并根据提取的第二个类别标签重复进行上述步骤S213-215。
3.如权利要求1所述的识别方法,其特征在于,在所述步骤S224之后,所述识别方法还包括:
如果提取的类别标签与所述子标签集中的物体类别标签不匹配,则从所述多个类别标签中提取第二个类别标签,并根据提取的第二个类别标签重复进行上述步骤S225-226。
4.如权利要求1-3任一项所述的识别方法,其特征在于,所述标签集中各物体类别标签与拍摄距离范围和物体在图像中大小范围之间的对应关系,是预先由人工计算并标注的,或者,通过各物体的拍摄距离和图像中大小实时测量得到的。
5.如权利要求1-3任一项所述的识别方法,其特征在于,所述物体在图像中大小通过物体在图像中的高度和宽度表示。
6.如权利要求5所述的识别方法,其特征在于,所述物体在图像中的高度通过所述物体在图像中的高度与图像高度的比值表示,所述物体在图像中的宽度通过所述物体在图像中的宽度与图像宽度的比值表示。
7.一种计算机设备,其特征在于,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如权利要求1-6中任一项所述的基于物体真实大小和物体特征的图像识别方法。
8.一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-6中任一项所述的基于物体真实大小和物体特征的图像识别方法。
CN202110506312.XA 2021-05-10 2021-05-10 基于物体真实大小和物体特征的图像识别方法和装置 Active CN113177498B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110506312.XA CN113177498B (zh) 2021-05-10 2021-05-10 基于物体真实大小和物体特征的图像识别方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110506312.XA CN113177498B (zh) 2021-05-10 2021-05-10 基于物体真实大小和物体特征的图像识别方法和装置

Publications (2)

Publication Number Publication Date
CN113177498A CN113177498A (zh) 2021-07-27
CN113177498B true CN113177498B (zh) 2022-08-09

Family

ID=76928585

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110506312.XA Active CN113177498B (zh) 2021-05-10 2021-05-10 基于物体真实大小和物体特征的图像识别方法和装置

Country Status (1)

Country Link
CN (1) CN113177498B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105354307A (zh) * 2015-11-06 2016-02-24 腾讯科技(深圳)有限公司 一种图像内容识别方法及装置
WO2017215351A1 (zh) * 2016-06-15 2017-12-21 珠海格力电器股份有限公司 摄像装置识别范围的调整方法及装置
WO2019233394A1 (zh) * 2018-06-08 2019-12-12 Oppo广东移动通信有限公司 图像处理方法和装置、存储介质、电子设备

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109711481B (zh) * 2019-01-02 2021-09-10 京东方艺云科技有限公司 用于画作多标签识别的神经网络、相关方法、介质和设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105354307A (zh) * 2015-11-06 2016-02-24 腾讯科技(深圳)有限公司 一种图像内容识别方法及装置
WO2017215351A1 (zh) * 2016-06-15 2017-12-21 珠海格力电器股份有限公司 摄像装置识别范围的调整方法及装置
WO2019233394A1 (zh) * 2018-06-08 2019-12-12 Oppo广东移动通信有限公司 图像处理方法和装置、存储介质、电子设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
A New Benchmark for Vison-Based Cyclist Detection;Xiaofei Li et al.;《IEEE Xplore》;20160808;全文 *
基于条件随机场的多标签图像分类识别方法;王莉等;《计算机仿真》;20200815(第08期);全文 *

Also Published As

Publication number Publication date
CN113177498A (zh) 2021-07-27

Similar Documents

Publication Publication Date Title
CN111178197B (zh) 基于Mask R-CNN和Soft-NMS融合的群养粘连猪实例分割方法
CN110543892A (zh) 一种基于多层随机森林的零部件识别方法
EP3654248A1 (en) Verification of classification decisions in convolutional neural networks
CN109002755B (zh) 基于人脸图像的年龄估计模型构建方法及估计方法
EP3596655B1 (en) Method and apparatus for analysing an image
CN106408037A (zh) 图像识别方法及装置
CN107967442A (zh) 一种基于无监督学习和深层网络的指静脉识别方法及系统
US20230419170A1 (en) System and method for efficient machine learning
Wang et al. Hand-drawn electronic component recognition using deep learning algorithm
CN109522970A (zh) 图像分类方法、装置及系统
CN111968124A (zh) 基于半监督语义分割的肩部肌骨超声结构分割方法
CN117893839B (zh) 一种基于图注意力机制的多标记分类方法及系统
CN111444816A (zh) 一种基于Faster RCNN的多尺度密集行人检测方法
CN113673340B (zh) 一种害虫种类图像识别方法及系统
CN113177498B (zh) 基于物体真实大小和物体特征的图像识别方法和装置
Chawla et al. Classification of computer generated images from photographic images using convolutional neural networks
CN115937492B (zh) 一种基于特征识别的变电设备红外图像识别方法
CN108985294B (zh) 一种轮胎模具图片的定位方法、装置、设备及存储介质
Kumuda et al. Human fingernail segmentation
Calefati et al. Reading meter numbers in the wild
CN114792436A (zh) 人脸深度图像质量评价方法及系统、电子设备及存储介质
Pramadi et al. Flowers identification using first-order feature extraction and multi-SVM Classifier
CN115115892B (zh) 一种基于生成模型与判别分类模型的图像半监督分类方法
KR102418476B1 (ko) 2차원 이미지 데이터와 3차원 뎁스 데이터를 이용하여 차량 번호판의 판독과 위조와 오염 여부의 판단을 정밀하게 수행하는 주차관제시스템의 운영방법
Sapkota et al. Aiimds: An integrated framework of automatic idiopathic inflammatory myopathy diagnosis for muscle

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant