CN113012189A - 图像识别方法、装置、计算机设备和存储介质 - Google Patents

图像识别方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN113012189A
CN113012189A CN202110348870.8A CN202110348870A CN113012189A CN 113012189 A CN113012189 A CN 113012189A CN 202110348870 A CN202110348870 A CN 202110348870A CN 113012189 A CN113012189 A CN 113012189A
Authority
CN
China
Prior art keywords
image
region
identified
target
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110348870.8A
Other languages
English (en)
Inventor
林晓帆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Insta360 Innovation Technology Co Ltd
Original Assignee
Insta360 Innovation Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Insta360 Innovation Technology Co Ltd filed Critical Insta360 Innovation Technology Co Ltd
Priority to CN202110348870.8A priority Critical patent/CN113012189A/zh
Publication of CN113012189A publication Critical patent/CN113012189A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/194Segmentation; Edge detection involving foreground-background segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10024Color image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20092Interactive image processing based on input by user
    • G06T2207/20104Interactive definition of region of interest [ROI]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本申请涉及一种图像识别方法、装置、计算机设备和存储介质,适用于计算机技术领域。所述方法包括:从待识别的图像中截取待识别区域图像,待识别区域图像包括感兴趣对象;对待识别区域图像中的第一前景区域和第一背景区域分别进行标注,其中,第一前景区域的标注信息与第一背景区域的标注信息互不相同;将标注后的待识别区域图像输入至预设神经网络模型,获取预设神经网络模型输出的第一特征信息;根据第一特征信息确定待识别区域图像包括的感兴趣对象是否为目标对象。采用本方法能够提高图像识别的准备率。

Description

图像识别方法、装置、计算机设备和存储介质
技术领域
本申请涉及计算机技术领域,特别是涉及一种图像识别方法、装置、计算机设备和存储介质。
背景技术
随着计算机技术水平的飞速发展,图像识别技术越来越成熟。例如可以利用深度学习模型识别图像中的人或者动物,还可以利用深度学习模型对图像进分类。此外,在一些场景中,可能需要在海量的图像中筛选出包括某个人或者某个物的图像,如果利用人工筛选需要花费大量的时间和精力。为了节省人力和时间成本,可以利用深度学习模型从众多张图像中筛选出包括目标物体(例如某个人或者某个物)的图像。
在现有方法中,通常获取目标图像中的目标区域图像,其中,目标区域图像中包括目标物体。然后把目标区域图像输入神经网络模型,得到目标区域图像对应的目标特征信息。利用上述相同的方法,获取待识别图像中的待识别区域图像,其中,待识别区域图像中包括待识别物体,将待识别区域图像输入神经网络模型,得到待识别矩形图像对应的第一特征信息,根据第一特征信息与目标特征信息确定待识别区域中包括的待识别物体是否为目标物体。
上述方法,由于第一特征信息中不只是包括待识别物体的特征信息,且目标特征信息中也不只是包括目标物体的特征信息,因此,因为存在其他信息的干扰,可能存在由于第一特征信息与目标特征信息不准确,导致待识别区域图像识别不准确,比如不同目标物体有相同背景信息时,会导致识别出现错误。
发明内容
基于此,有必要针对上述技术问题,提供一种图像识别方法、装置、计算机设备和存储介质,能够提高对图像识别的准确率。
第一方面,提供了一种图像识别方法,该方法包括:从待识别的图像中截取待识别区域图像,待识别区域图像包括感兴趣对象;对待识别区域图像中的第一前景区域和第一背景区域分别进行标注,其中,第一前景区域的标注信息与第一背景区域的标注信息互不相同;将标注后的待识别区域图像输入至预设神经网络模型,获取预设神经网络模型输出的第一特征信息;根据第一特征信息确定待识别区域图像包括的感兴趣对象是否为目标对象。
在其中一个实施例中,对待识别区域图像中的第一前景区域和第一背景区域分别进行标注,包括:获取第一前景区域对应的第一标注信息,并将第一标注信息添加至第一前景区域包括的各像素的像素值中;获取第一背景区域对应的第二标注信息,并将第二标注信息添加至第一背景区域包括的各像素的像素值中。
在其中一个实施例中,上述方法还包括:在待识别区域图像中确定第一前景区域和第一背景区域相邻的过渡区域;对过渡区域进行标注,其中,过渡区域的标注信息与第一前景区域的标注信息和第一背景区域的标注信息均不相同。
在其中一个实施例中,标注信息为数值,过渡区域的标注信息的大小位于第一前景区域的标注信息的大小和第一背景区域的标注信息的大小之间。
在其中一个实施例中,根据第一特征信息确定待识别区域图像包括的感兴趣对象是否为目标对象,包括:从目标图像中截取目标区域图像,目标区域图像包括目标对象;对目标区域图像中的第二前景区域和第二背景区域分别进行标注,其中,第二前景区域的标注信息与第一前景区域的标注信息相同,第二背景区域的标注信息与第一背景区域的标注信息相同;将标注后的目标区域图像输入至预设神经网络模型,获取预设神经网络模型输出的目标特征信息;根据第一特征信息以及目标特征信息确定待识别区域图像包括的感兴趣对象是否为目标对象。
在其中一个实施例中,根据第一特征信息以及目标特征信息确定待识别区域图像包括的感兴趣对象是否为目标对象,包括:获取第一特征信息与目标特征信息之间的相似度;若相似度大于预设相似度阈值,则确定待识别区域图像包括的感兴趣对象为目标对象;
若相似度小于等于预设相似度阈值,则确定待识别区域图像包括的感兴趣对象不为目标对象。
在其中一个实施例中,从待识别的图像中截取待识别区域图像,包括:将待识别的图像输入至目标检测模型,得到目标检测模型输出的感兴趣对象的位置信息;基于位置信息,在待识别的图像中截取待识别区域图像。
在其中一个实施例中,预设神经网络模型的训练过程为:获取训练样本图像集,训练样本图像集包括多个训练样本图像,各训练样本图像包括目标对象、训练样本图像对应的标注信息以及特征信息;基于训练样本图像集对未经训练的神经网络模型进行训练,得到预设神经网络模型。
第二方面,提供了一种图像识别装置,该装置包括:
截取模块,用于从待识别的图像中截取待识别区域图像,待识别区域图像包括感兴趣对象;
第一标注模块,用于对待识别区域图像中的第一前景区域和第一背景区域分别进行标注,其中,第一前景区域的标注信息与第一背景区域的标注信息互不相同;
输入模块,用于将标注后的待识别区域图像输入至预设神经网络模型,获取预设神经网络模型输出的第一特征信息。
第一确定模块,用于根据第一特征信息确定待识别区域图像包括的感兴趣对象是否为目标对象。
在其中一个实施例中,上述第一标注模块,具体用于获取第一前景区域对应的第一标注信息,并将第一标注信息添加至第一前景区域包括的各像素的像素值中;获取第一背景区域对应的第二标注信息,并将第二标注信息添加至第一背景区域包括的各像素的像素值中。
在其中一个实施例中,上述图像识别装置,还包括:
第二确定模块:在待识别区域图像中确定第一前景区域和第一背景区域相邻的过渡区域;
第二标注模块:对过渡区域进行标注,其中,过渡区域的标注信息与第一前景区域的标注信息和第一背景区域的标注信息均不相同。
在其中一个实施例中,上述标注信息为数值,过渡区域的标注信息的大小位于第一前景区域的标注信息的大小和第一背景区域的标注信息的大小之间。
在其中一个实施例中,上述第一确定模块,具体用于从目标图像中截取目标区域图像,目标区域图像包括目标对象;对目标区域图像中的第二前景区域和第二背景区域分别进行标注,其中,第二前景区域的标注信息与第一前景区域的标注信息相同,第二背景区域的标注信息与第一背景区域的标注信息相同;将标注后的目标区域图像输入至预设神经网络模型,获取预设神经网络模型输出的目标特征信息;根据第一特征信息以及目标特征信息确定待识别区域图像包括的感兴趣对象是否为目标对象。
在其中一个实施例中,上述第一确定模块,具体用于获取第一特征信息与目标特征信息之间的相似度;若相似度大于预设相似度阈值,则确定待识别区域图像包括的感兴趣对象为目标对象;若相似度小于等于预设相似度阈值,则确定待识别区域图像包括的感兴趣对象不为目标对象。
在其中一个实施例中,上述截取模块,具体用于将待识别的图像输入至目标检测模型,得到目标检测模型输出的感兴趣对象的位置信息;基于位置信息,在待识别的图像中截取待识别区域图像。
在其中一个实施例中,上述图像识别装置,还包括:
获取模块,用于获取训练样本图像集,训练样本图像集包括多个训练样本图像,各训练样本图像包括目标对象、训练样本图像对应的标注信息以及特征信息;
训练模块,用于基于训练样本图像集对未经训练的神经网络模型进行训练,得到预设神经网络模型。
第三方面,提供了一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现如上述第一方面任一的方法。
一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现如上述第一方面任一的方法。
上述图像识别方法、装置、计算机设备和存储介质,从待识别的图像中截取待识别区域图像,待识别区域图像包括感兴趣对象;对待识别区域图像中的第一前景区域和第一背景区域分别进行标注,其中,第一前景区域的标注信息与第一背景区域的标注信息互不相同;将标注后的待识别区域图像输入至预设神经网络模型,获取预设神经网络模型输出的第一特征信息;根据第一特征信息确定待识别区域图像包括的感兴趣对象是否为目标对象。上述方法中,从待识别的图像中截取包括感兴趣对象的待识别区域图像,并对待识别区域图像中的第一前景区域和第一背景区域分别进行标注。从而可以将待识别区域图像中的第一前景区域与第一背景区域进行区分。将标注后的待识别区域图像输入至预设神经网络模型,使得预设神经网络模型对待识别区域图像进行识别,从中获取到第一前景区域,并输出只包括第一前景区域的特征的第一特征信息。由于第一特征信息中只包括第一前景区域的特征,从而根据第一特征信息确定待识别区域图像包括的感兴趣对象是否为目标对象时,得到的结果更加准确,从而提高了对待识别区域图像进行识别的准备性,最终提高了对于待识别的图像进行识别的准确性。
附图说明
图1为一个实施例中图像识别方法的流程示意图;
图2为一个实施例中图像识别方法的流程示意图;
图3为一个实施例中图像识别步骤的流程示意图;
图4为另一个实施例中图像识别方法的流程示意图;
图5为另一个实施例中图像识别方法的流程示意图;
图6为另一个实施例中图像识别方法的流程示意图;
图7为另一个实施例中图像识别方法的流程示意图;
图8为另一个实施例中图像识别方法的流程示意图;
图9为一个实施例中图像识别方法装置的结构框图;
图10为一个实施例中图像识别方法装置的结构框图;
图11为一个实施例中图像识别方法装置的结构框图;
图12为一个实施例中计算机设备为服务器时的内部结构图;
图13为一个实施例中计算机设备为终端时的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
需要说明的是,本申请实施例提供的图像识别方法,其执行主体可以是图像识别的装置,该图像识别的装置可以通过软件、硬件或者软硬件结合的方式实现成为计算机设备的部分或者全部,其中,该计算机设备可以是服务器或者终端,其中,本申请实施例中的服务器可以为一台服务器,也可以为由多台服务器组成的服务器集群,本申请实施例中的终端可以是智能手机、个人电脑、平板电脑、可穿戴设备、儿童故事机以及智能机器人等其他智能硬件设备。下述方法实施例中,均以执行主体是计算机设备为例来进行说明。
在本申请一个实施例中,如图1所示,提供了一种图像识别方法,以该方法应用于图1中的计算机设备为例进行说明,包括以下步骤:
步骤101,计算机设备从待识别的图像中截取待识别区域图像。
其中,待识别区域图像包括感兴趣对象。可选的,感兴趣对象可以是一个人、也可以是一个动物,还可以是一个建筑物,本申请实施例对感兴趣对象不做具体限定。
具体地,计算机设备可以接收其他设备发送的待识别的图像,也可以从计算机设备的数据库中提取到待识别的图像。计算机设备在获取到待识别的图像之后,可以根据待识别的图像中感兴趣对象的位置,对待识别的图像进行截取,得到待识别区域图像。
可选的,计算机设备可以将待识别区域图像截取为一个矩形,也可以将待识别区域图像截取为一个圆形,本申请实施例对待识别区域图像的形状不做具体限定。
步骤102,计算机设备对待识别区域图像中的第一前景区域和第一背景区域分别进行标注。
其中,第一前景区域的标注信息与第一背景区域的标注信息互不相同
具体地,计算机设备可以利用预设的语义分割算法对待识别区域图像进行语义分割,从而识别出待识别区域图像中的第一前景区域和第一背景区域。计算机设备可以对待识别区域图像中的第一前景区域和第一背景区域分别进行标注。
可选的,计算机设备可以将待识别区域图像中的第一前景区域对应的各个像素标注为255,第一背景区域对应的各个像素标注为0,从而区分待识别区域图像中的第一前景区域和第一背景区域。
可选的,计算机设备还可以将待识别区域图像中的第一前景区域对应的各个像素标注为1,第一背景区域对应的各个像素标注为0,从而区分待识别区域图像中的第一前景区域和第一背景区域。
步骤103,计算机设备将标注后的待识别区域图像输入至预设神经网络模型,获取预设神经网络模型输出的第一特征信息。
具体地,计算机设备可以将标注后的待识别区域图像输入至预设神经网络模型,其中,预设神经网络模型可以是卷积神经网络的模型进行改进得到的。其中,卷积神经网络模型可以是YOLO(You Only Look Once,你只看一次)、R-CNN(Region-basedConvolutional Neural Networks,基于区域的卷积神经网络)、SSD(Single ShotMultiBox,单发多框)以及Mask R-CNN(Mask Region-based Convolutional NeuralNetworks,带掩码的基于区域的卷积神经网络)等中的一种。本申请实施例对于预设神经网络模型不做具体限定。
计算机设备将标注后的待识别区域图像输入至预设神经网络模型之后,预设神经网络模型对待识别区域图像进行识别,从中获取到第一前景区域,并输出只包括第一前景区域特征的第一特征信息。其中,第一特征信息可以是特征向量,也可以是特征矩阵。
步骤104,计算机设备根据第一特征信息确定待识别区域图像包括的感兴趣对象是否为目标对象。
具体地,计算机设备根据预设神经网络模型输出的只包括第一前景区域的特征的第一特征信息,确定待识别区域图像中包括的感兴趣对象是否为目标对象。
上述图像识别方法中,计算机设备从待识别的图像中截取待识别区域图像,并对待识别区域图像中的第一前景区域和第一背景区域分别进行标注。计算机设备将标注后的待识别区域图像输入至预设神经网络模型,获取预设神经网络模型输出的第一特征信息,并根据第一特征信息确定待识别区域图像包括的感兴趣对象是否为目标对象。上述方法中,从待识别的图像中截取包括感兴趣对象的待识别区域图像,并对待识别区域图像中的第一前景区域和第一背景区域分别进行标注。从而可以将待识别区域图像中的第一前景区域与第一背景区域进行区分。将标注后的待识别区域图像输入至预设神经网络模型,使得预设神经网络模型对待识别区域图像进行识别,从中获取到第一前景区域,并输出只包括第一前景区域特征的第一特征信息。由于第一特征信息中只包括第一前景区域特征,从而根据第一特征信息确定待识别区域图像包括的感兴趣对象是否为目标对象时,得到的结果更加准确,从而提高了对待识别区域图像进行识别的准备性,最终提高了对于待识别的图像进行识别的准确性。
在本申请一种可选的实现方式中,如图2所示,上述步骤102“计算机设备对待识别区域图像中的第一前景区域和第一背景区域分别进行标注”,可以包括以下步骤:
步骤201,计算机设备获取第一前景区域对应的第一标注信息,并将第一标注信息添加至第一前景区域包括的各像素的像素值中。
具体地,计算机设备在确定了待识别区域图像中的第一前景区域,并对第一前景区域进行标注之后,获取第一前景区域各像素对应的第一标注信息。可选的,第一前景区域各像素对应的第一标注信息可以是1,第一前景区域各像素对应的第一标注信息也可以是255。计算机设备将第一前景区域各像素对应的第一标注信息添加至第一前景区域包括的各像素的像素值中。其中,第一前景区域包括的各像素的像素值可以包括第一前景区域包括的各像素对应的RGB像素值,计算机设备将第一前景区域对应的第一标注信息添加至第一前景区域包括的各像素的对应的RGB像素值之后,得到第一前景区域包括的各像素的对应的RGBA像素值。其中,RGBA是代表Red(红色)Green(绿色)Blue(蓝色)和Alpha(希腊字母表的第1个字母)的色彩空间。其中,Alpha的数值可以各个像素对应的标注信息。例如,某一个像素为第一前景区域对应的像素,且第一前景区域各像素对应的第一标注信息为255,则将该像素对应的Alpha的数值为255。
步骤202,计算机设备获取第一背景区域对应的第二标注信息,并将第二标注信息添加至第一背景区域包括的各像素的像素值中。
可选的,计算机设备在确定了待识别区域图像中的第一背景区域,并对第一背景区域进行标注之后,获取第一背景区域各像素对应的第二标注信息。进一步的,当第一前景区域各像素对应的标注信息为1的情况下,第一背景区域各像素对应的第二标注信息为0,对于第一前景区域和背景区域的过渡边缘区域的像素可以使用0-1之间的数值进行标注。
可选的,当第一前景区域各像素对应的标注信息为255的情况下,第一背景区域各像素对应的第二标注信息为0,对于第一前景区域和背景区域的过渡边缘区域的像素可以使用0-255之间的数值进行标注。
计算机设备将第一背景区域各像素对应的第二标注信息添加至第一背景区域包括的各像素的像素值中。其中,第一背景区域包括的各像素的像素值可以包括第一背景区域包括的各像素对应的RGB像素值,计算机设备将第一背景区域各像素对应的第二标注信息添加至第一背景区域包括的各像素的对应的RGB像素值之后,得到第一背景区域包括的各像素的对应的RGBA像素值。其中,RGBA是代表Red(红色)Green(绿色)Blue(蓝色)和Alpha的色彩空间。其中,Alpha的数值可以表示各个像素对应的标注信息。例如,某一个像素为第一背景区域对应的像素,且第一背景区域对应各像素的第二标注信息为0,则将该像素对应的Alpha的数值为0。
在本申请实施例中,计算机设备获取第一前景区域各像素对应的第一标注信息,并将第一标注信息添加至第一前景区域包括的各像素的像素值中,并获取第一背景区域各像素对应的第二标注信息,并将第二标注信息添加至第一背景区域包括的各像素的像素值中。从而使得计算机设备可以根据待识别区域图像包括的各像素的像素值,确定待识别区域图像中的第一前景区域和第一背景区域,有利于提高对待识别区域图像识别的准确性。
在本申请一种可选的实现方式中,如图3所示,上述图像识别方法还可以包括以下步骤:
步骤301,计算机设备在待识别区域图像中确定第一前景区域和第一背景区域相邻的过渡区域。
具体地,计算机设备可以根据待识别图像中第一前景区域各像素对应的第一标注信息以及第一背景区域各像素对应的第二标注信息确定第一前景区域和第一背景区域相邻的过渡区域。
示例性的,假设待识别区域图像中的第一前景区域各像素对应的第一标注信息为255,第一背景区域各像素对应的第二标注信息为0。若一个像素的标注信息为0,与这个像素相邻的像素的标注信息为255,则确定这个两个像素为第一前景区域和第一背景区域相邻的过渡区域。
步骤302,计算机设备对过渡区域进行标注。
其中,过渡区域的标注信息与第一前景区域的标注信息和第一背景区域的标注信息均不相同。标注信息为数值,过渡区域的标注信息的大小位于第一前景区域的标注信息的大小和第一背景区域的标注信息的大小之间。
具体地,为了避免因为过渡区域识别错误,导致预设神经网络输出的第一特征信息不准确,需要降低过渡区域的权重。因此,计算机设备在确定了第一前景区域和第一背景区域相邻的过渡区域之后,可以对过渡区域进行标注。
可选的,计算机设备可以利用模糊算法对过渡区域进行模糊处理,降低过渡区域的权重。其中,模糊算法可以为高斯模糊算法、方框模糊算法、双重模糊算法、散景模糊算法、移轴模糊算法、光圈模糊算法、粒状模糊算法、径向模糊算法以及方向模糊算法等多种模糊算法中的任意一种。
示例性的,在待识别区域图像中的第一前景各像素区域对应的第一标注信息为255,第一背景区域各像素对应的第二标注信息为0时,计算机设备可以利用模糊算法将过渡区域对应的各个像素标注为0-255之间的数值,然后将过渡区域各个像素经模糊处理后的数值作为对应像素的标注信息。例如,模糊处理之前,过渡区域中的一个像素对应的标注信息为255,经过模糊处理之后,该像素对应的标注信息为200。
进一步的,在待识别区域图像中的第一前景区域各像素对应的第一标注信息为255,第一背景区域各像素对应的第二标注信息为0时,计算机设备利用模糊算法将过渡区域对应的各个像素标注为0-255之间的数值之后,还可以对待识别区域图像中的各个像素对应的像素值进行归一化处理,计算机设备将各个像素对应的标注信息除以标注信息中的最大值,即255,归一化处理后的待识别区域各个像素对应的标注信息为0-1之间的数值。
在本申请实施例中,计算机设备在待识别区域图像中确定第一前景区域和第一背景区域相邻的过渡区域,并对过渡区域进行标注。降低了过渡区域的权重,避免了因为过渡区域识别错误,导致预设神经网络模型输出的第一特征信息不准确,从而导致对待识别区域图像识别不准确。
在本申请一种可选的实现方式中,如图4所示,上述步骤104“计算机设备根据第一特征信息确定待识别区域图像包括的感兴趣对象是否为目标对象”,可以包括以下步骤:
步骤401,计算机设备从目标图像中截取目标区域图像,目标区域图像包括目标对象。
具体地,计算机设备可以接收其他设备发送的目标图像,也可以从计算机设备的数据库中提取到目标图像。计算机设备在获取到目标图像之后,可以利用目标检测模型识别目标图像中的目标对象,并确定目标对象的位置。计算机设备可以根据目标图像中包括的目标对象的位置,对目标图像进行截取,得到目标区域图像。
可选的,计算机设备可以将目标区域图像截取为一个矩形,也可以将目标区域图像截取为一个圆形,本申请实施例对目标区域图像的形状不做具体限定。
步骤402,计算机设备对目标区域图像中的第二前景区域和第二背景区域分别进行标注。
其中,第二前景区域的标注信息与第一前景区域的标注信息相同,第二背景区域的标注信息与第一背景区域的标注信息相同。
具体地,计算机设备可以利用预设的语义分割算法对目标区域图像进行语义分割,从而识别出目标区域图像中的第二前景区域和第二背景区域。计算机设备可以对目标区域图像中的第二前景区域和第二背景区域分别进行标注。
可选的,在将待识别区域图像中的第一前景区域对应的各个像素标注为255的情况下,计算机设备将目标区域图像中的第二前景区域对应的各个像素也标注为255。在将待识别区域图像中的第一背景区域对应的各个像素标注为0的情况下,计算机设备将目标区域图像中的第二背景区域对应的各个像素也标注为0,从而区分目标区域图像中的第二前景区域和第二背景区域。
可选的,在将待识别区域图像中的第一前景区域对应的各个像素标注为1的情况下,计算机设备将目标区域图像中的第二前景区域对应的各个像素也标注为1。在将待识别区域图像中的第一背景区域对应的各个像素标注为0的情况下,计算机设备将目标区域图像中的第二背景区域对应的各个像素也标注为0,从而区分待识别区域图像中的第二前景区域和第二背景区域。
步骤403,计算机设备将标注后的目标区域图像输入至预设神经网络模型,获取预设神经网络模型输出的目标特征信息。
具体地,计算机设备可以将标注后的目标区域图像输入至预设神经网络模型,其中,预设神经网络模型可以是卷积神经网络的模型进行改进得到的。
计算机设备将标注后的目标区域图像输入至预设神经网络模型之后,预设神经网络模型对目标区域图像进行识别,从中获取到目标区域图像中的第二前景区域,并输出只包括第二前景区域特征的目标特征信息。
步骤404,计算机设备根据第一特征信息以及目标特征信息确定待识别区域图像包括的感兴趣对象是否为目标对象。
具体地,在获取到第一特征信息以及目标特征信息之后,计算机设备可以将第一特征信息和目标特征信息进行对比,根据第一特征信息和目标特征信息的对比结果,确定待识别区域图像包括的感兴趣对象是否为目标对象。
在本申请实施例中,计算机设备从目标图像中截取目标区域图像,目标区域图像包括目标对象,并对目标区域图像中的第二前景区域和第二背景区域分别进行标注。计算机设备将标注后的目标区域图像输入至预设神经网络模型,获取预设神经网络模型输出的目标特征信息,并根据第一特征信息以及目标特征信息确定待识别区域图像包括的感兴趣对象是否为目标对象。上述方法中,计算机设备对目标区域图像中的第二前景区域和第二背景区域分别进行标注,从而以将目标区域图像中的第二前景区域与第二背景区域进行区分。将标注后的目标区域图像输入至预设神经网络模型,使得预设神经网络模型对目标区域图像进行识别,从中获取到第二前景区域,并输出只包括第二前景区域特征的目标特征信息。并根据对第一特征信息与目标特征信息确定待识别区域图像包括的感兴趣对象是否为目标对象,使得得到的识别结果更加准确,从而提高了对待识别区域图像进行识别的准备性,最终提高了对于待识别的图像进行识别的准确性。
在本申请一种可选的实现方式中,如图5所示,步骤404“计算机设备根据第一特征信息以及目标特征信息确定待识别区域图像包括的感兴趣对象是否为目标对象”,可以包括以下步骤:
步骤501,计算机设备获取第一特征信息与目标特征信息之间的相似度。若相似度大于预设相似度阈值,则执行步骤502;若相似度小于等于预设相似度阈值,则步骤503。
步骤502,计算机设备确定待识别区域图像包括的感兴趣对象为目标对象。
步骤503,计算机设备确定待识别区域图像包括的感兴趣对象不为目标对象。
具体地,计算机设备可以通过计算第一特征信息和目标特征信息之间的欧氏距离或者余弦距离,确定第一特征信息与目标特征信息之间的相似度。计算机设备在确定了第一特征信息与目标特征信息之间的相似度之后,可以与预设相似度阈值进行比较。若相似度大于预设相似度阈值,则说明第一特征信息对应的待识别区域图像中的待识别物体与目标特征对应的目标区域图像中的目标对象十分相似,计算机设备确定待识别区域图像包括的感兴趣对象为目标对象;若相似度小于等于预设相似度阈值,则说明第一特征信息对应的待识别区域图像中的待识别物体与目标特征对应的目标区域图像中的目标对象不相似,计算机设备确定待识别区域图像包括的感兴趣对象不为目标对象。
在本申请实施例中,计算机设备获取第一特征信息与目标特征信息之间的相似度。若相似度大于预设相似度阈值,则计算机设备确定待识别区域图像包括的感兴趣对象为目标对象;若相似度小于等于预设相似度阈值,则计算机设备确定待识别区域图像包括的感兴趣对象不为目标对象。因此,使得计算机设备可以根据第一特征信息与目标特征信息之间的相似度,准确快速地确定待识别区域图像包括的感兴趣对象是否为目标对象,从而提高了图像识别的准确率。
在本申请一个可选的实现方式中,如图6所示,上述步骤101“计算机设备从待识别的图像中截取待识别区域图像”,可以包括以下步骤:
步骤601,计算机设备将待识别的图像输入至目标检测模型,得到目标检测模型输出的感兴趣对象的位置信息。
具体地,计算机设备可以将待识别的图像输入至目标检测模型。其中,目标检测模型可以是基于手工特征的模型,例如DPM(Deformable Parts Model,可变形零件,目标检测模型也可以是基于卷积神经网络的模型,例如YOLO(You Only Look Once,你只看一次)、R-CNN(Region-based Convolutional Neural Networks,基于区域的卷积神经网络)、SSD(Single Shot MultiBox,单发多框)以及Mask R-CNN(Mask Region-based ConvolutionalNeural Networks,带掩码的基于区域的卷积神经网络)等。本申请实施例对于目标检测模型不做具体限定。
计算机设备可以将待识别的图像输入至目标检测模型之后,目标检测模型对待识别的图像进行特征提取,从待识别的图像中识别出感兴趣对象,并确定感兴趣对象的位置信息。其中,目标检测模型识别出的感兴趣对象可以是一个,也可以是多个,本申请实施例对待识别的图像中的感兴趣对象的数量不做限定。
步骤602,计算机设备基于位置信息,在待识别的图像中截取待识别区域图像。
具体地,在确定了感兴趣对象的位置信息之后,计算机设备可以基于感兴趣对象的位置信息,将感兴趣对象在待识别的图像中标注出来。其中,可选的,可以利用矩形框将感兴趣对象框出,计算机设备根据框出感兴趣对象的矩形框截取待识别区域图像。
在本申请实施例中,计算机设备将待识别的图像输入至目标检测模型,得到目标检测模型输出的感兴趣对象的位置信息,并基于位置信息,在待识别的图像中截取待识别区域图像。使得待识别区域图像中的感兴趣对象的占比更大,避免因为感兴趣图像在待识别区域图像中的占比较小,导致对待识别区域图像的识别不准确。从而提高了对待识别区域图像进行识别的准确性。
在本申请一个可选的实现方式中,如图7所示,上述预设神经网络模型的训练过程可以包括以下步骤:
步骤701,计算机设备获取训练样本图像集。
其中,训练样本图像集包括多个训练样本图像,各训练样本图像包括目标对象、训练样本图像对应的标注信息以及特征信息。
具体地,计算机设备接收其他设备发送的包括目标对象的多张图像,也可以在数据库中提取包括目标对象的多张图像。计算机设备可以利用语义分割算法对包括目标对象的多张图像进行语义分割,从而确定多张图像中的目标对象区域以及背景区域。计算机设备基于多张图像中的目标对象区域以及背景区域,对多张图像进行标注,生成标注后的多张图像,然后获取标注后的多张图像对应的特征信息,从而生成训练样本图像集。
步骤702,计算机设备基于训练样本图像集对未经训练的神经网络模型进行训练,得到预设神经网络模型。
具体地,计算机设备将训练样本图像集输入至未经训练的神经网络模型,对未经训练的神经网络模型进行训练,得到预设神经网络模型。
其中,上述预设神经网络模型在训练时,可以选择Adam优化器对预设神经网络模型进行优化,从而可以使预设神经网络模型能够快速收敛,并具有很好的泛化能力。
在上述利用Adam优化器对预设神经网络模型进行优化时,也可以为优化器设置一个学习率,在这里可以采用学习率范围测试(LR Range Test)的技术选择最佳学习率,并设置给优化器。该测试技术的学习率选择过程为:首先将学习率设置为一个很小的值,接着将预设神经网络模型和训练样本图像集数据简单的迭代几次,每次迭代完成后增加学习率,并记录每次的训练损失(loss),然后绘制LR Range Test图,一般理想的LR Range Test图包含三个区域:第一个区域学习率太小损失基本不变,第二个区域损失减小收敛很快,最后一个区域学习率太大以至于损失开始发散,那么可以将LR Range Test图中的最低点所对应的学习率作为最佳学习率,并将该最佳学习率作为Adam优化器的初始学习率,设置给优化器。
在本申请实施例中,计算机设备获取训练样本图像集,并基于训练样本图像集对未经训练的神经网络模型进行训练,得到预设神经网络模型。上述预设神经网络利用训练样本图像集训练得到,使得得到的预设神经网络模型更加准确,从而提高了图像识别的准确性。
为了更好的说明本申请的提供的图像识别方法,本申请提供一种图像识别方法的整体流程方面进行解释说明的实施例,如图8所示,该方法包括:
步骤801,计算机设备获取训练样本图像集。
步骤802,计算机设备基于训练样本图像集对未经训练的神经网络模型进行训练,得到预设神经网络模型。
步骤803,计算机设备将待识别的图像输入至目标检测模型,得到目标检测模型输出的感兴趣对象的位置信息。
步骤804,计算机设备基于位置信息,在待识别的图像中截取待识别区域图像。
步骤805,计算机设备获取第一前景区域对应的第一标注信息,并将第一标注信息添加至第一前景区域包括的各像素的像素值中。
步骤806,计算机设备获取第一背景区域对应的第二标注信息,并将第二标注信息添加至第一背景区域包括的各像素的像素值中。
步骤807,计算机设备在待识别区域图像中确定第一前景区域和第一背景区域相邻的过渡区域。
步骤808,计算机设备对过渡区域进行标注。
步骤809,计算机设备将标注后的待识别区域图像输入至预设神经网络模型,获取预设神经网络模型输出的第一特征信息。
步骤810,计算机设备从目标图像中截取目标区域图像,目标区域图像包括目标对象。
步骤811,计算机设备对目标区域图像中的第二前景区域和第二背景区域分别进行标注。
步骤812,计算机设备将标注后的目标区域图像输入至预设神经网络模型,获取预设神经网络模型输出的目标特征信息。
步骤813,计算机设备获取第一特征信息与目标特征信息之间的相似度。若相似度大于预设相似度阈值,则执行步骤814;若相似度小于等于预设相似度阈值,则步骤815。
步骤814,计算机设备确定待识别区域图像包括的感兴趣对象为目标对象。
步骤815,计算机设备确定待识别区域图像包括的感兴趣对象不为目标对象。
应该理解的是,虽然图1-8的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1-8中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
在本申请一个实施例中,如图9所示,提供了一种图像识别装置900,包括:截取模块901、第一标注模块902、输入模块903和第一确定模块904,其中:
截取模块901,用于从待识别的图像中截取待识别区域图像,待识别区域图像包括感兴趣对象;
第一标注模块902,用于对待识别区域图像中的第一前景区域和第一背景区域分别进行标注,其中,第一前景区域的标注信息与第一背景区域的标注信息互不相同;
输入模块903,用于将标注后的待识别区域图像输入至预设神经网络模型,获取预设神经网络模型输出的第一特征信息。
第一确定模块904,用于根据第一特征信息确定待识别区域图像包括的感兴趣对象是否为目标对象。
在其中一个实施例中,上述第一标注模块902,具体用于获取第一前景区域对应的第一标注信息,并将第一标注信息添加至第一前景区域包括的各像素的像素值中;获取第一背景区域对应的第二标注信息,并将第二标注信息添加至第一背景区域包括的各像素的像素值中。
在其中一个实施例中,如图10所示,上述图像识别装置900,还包括:
第二确定模块905:在待识别区域图像中确定第一前景区域和第一背景区域相邻的过渡区域;
第二标注模块906:对过渡区域进行标注,其中,过渡区域的标注信息与第一前景区域的标注信息和第一背景区域的标注信息均不相同。
在其中一个实施例中,上述标注信息为数值,过渡区域的标注信息的大小位于第一前景区域的标注信息的大小和第一背景区域的标注信息的大小之间。
在其中一个实施例中,上述第一确定模块904,具体用于从目标图像中截取目标区域图像,目标区域图像包括目标对象;对目标区域图像中的第二前景区域和第二背景区域分别进行标注,其中,第二前景区域的标注信息与第一前景区域的标注信息相同,第二背景区域的标注信息与第一背景区域的标注信息相同;将标注后的目标区域图像输入至预设神经网络模型,获取预设神经网络模型输出的目标特征信息;根据第一特征信息以及目标特征信息确定待识别区域图像包括的感兴趣对象是否为目标对象。
在其中一个实施例中,上述第一确定模块904,具体用于获取第一特征信息与目标特征信息之间的相似度;若相似度大于预设相似度阈值,则确定待识别区域图像包括的感兴趣对象为目标对象;若相似度小于等于预设相似度阈值,则确定待识别区域图像包括的感兴趣对象不为目标对象。
在其中一个实施例中,上述截取模块901,具体用于将待识别的图像输入至目标检测模型,得到目标检测模型输出的感兴趣对象的位置信息;基于位置信息,在待识别的图像中截取待识别区域图像。
在其中一个实施例中,如图11所示,上述图像识别装置900,还包括:
获取模块907,用于获取训练样本图像集,训练样本图像集包括多个训练样本图像,各训练样本图像包括目标对象、训练样本图像对应的标注信息以及特征信息;
训练模块908,用于基于训练样本图像集对未经训练的神经网络模型进行训练,得到预设神经网络模型。
关于图像识别装置的具体限定可以参见上文中对于图像识别方法的限定,在此不再赘述。上述图像识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,当该计算机设备为服务器时,其内部结构图可以如图12所示。该服务器包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储图像识别数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种图像识别方法。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,当该计算机设备为终端时,其内部结构图可以如图13所示。该终端包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、运营商网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种图像识别方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图12和图13中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在本申请一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:从待识别的图像中截取待识别区域图像,待识别区域图像包括感兴趣对象;对待识别区域图像中的第一前景区域和第一背景区域分别进行标注,其中,第一前景区域的标注信息与第一背景区域的标注信息互不相同;将标注后的待识别区域图像输入至预设神经网络模型,获取预设神经网络模型输出的第一特征信息;根据第一特征信息确定待识别区域图像包括的感兴趣对象是否为目标对象。
在本申请一个实施例中,处理器执行计算机程序时还实现以下步骤:获取第一前景区域对应的第一标注信息,并将第一标注信息添加至第一前景区域包括的各像素的像素值中;获取第一背景区域对应的第二标注信息,并将第二标注信息添加至第一背景区域包括的各像素的像素值中。
在本申请一个实施例中,处理器执行计算机程序时还实现以下步骤:在待识别区域图像中确定第一前景区域和第一背景区域相邻的过渡区域;对过渡区域进行标注,其中,过渡区域的标注信息与第一前景区域的标注信息和第一背景区域的标注信息均不相同。
在本申请一个实施例中,处理器执行计算机程序时还实现以下步骤:标注信息为数值,过渡区域的标注信息的大小位于第一前景区域的标注信息的大小和第一背景区域的标注信息的大小之间。
在本申请一个实施例中,处理器执行计算机程序时还实现以下步骤:从目标图像中截取目标区域图像,目标区域图像包括目标对象;对目标区域图像中的第二前景区域和第二背景区域分别进行标注,其中,第二前景区域的标注信息与第一前景区域的标注信息相同,第二背景区域的标注信息与第一背景区域的标注信息相同;将标注后的目标区域图像输入至预设神经网络模型,获取预设神经网络模型输出的目标特征信息;根据第一特征信息以及目标特征信息确定待识别区域图像包括的感兴趣对象是否为目标对象。
在本申请一个实施例中,处理器执行计算机程序时还实现以下步骤:获取第一特征信息与目标特征信息之间的相似度;若相似度大于预设相似度阈值,则确定待识别区域图像包括的感兴趣对象为目标对象;
若相似度小于等于预设相似度阈值,则确定待识别区域图像包括的感兴趣对象不为目标对象。
在本申请一个实施例中,处理器执行计算机程序时还实现以下步骤:将待识别的图像输入至目标检测模型,得到目标检测模型输出的感兴趣对象的位置信息;基于位置信息,在待识别的图像中截取待识别区域图像。
在本申请一个实施例中,处理器执行计算机程序时还实现以下步骤:获取训练样本图像集,训练样本图像集包括多个训练样本图像,各训练样本图像包括目标对象、训练样本图像对应的标注信息以及特征信息;基于训练样本图像集对未经训练的神经网络模型进行训练,得到预设神经网络模型。
在本申请一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:从待识别的图像中截取待识别区域图像,待识别区域图像包括感兴趣对象;对待识别区域图像中的第一前景区域和第一背景区域分别进行标注,其中,第一前景区域的标注信息与第一背景区域的标注信息互不相同;将标注后的待识别区域图像输入至预设神经网络模型,获取预设神经网络模型输出的第一特征信息;根据第一特征信息确定待识别区域图像包括的感兴趣对象是否为目标对象。
在本申请一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取第一前景区域对应的第一标注信息,并将第一标注信息添加至第一前景区域包括的各像素的像素值中;获取第一背景区域对应的第二标注信息,并将第二标注信息添加至第一背景区域包括的各像素的像素值中。
在本申请一个实施例中,计算机程序被处理器执行时还实现以下步骤:在待识别区域图像中确定第一前景区域和第一背景区域相邻的过渡区域;对过渡区域进行标注,其中,过渡区域的标注信息与第一前景区域的标注信息和第一背景区域的标注信息均不相同。
在本申请一个实施例中,计算机程序被处理器执行时还实现以下步骤:标注信息为数值,过渡区域的标注信息的大小位于第一前景区域的标注信息的大小和第一背景区域的标注信息的大小之间。
在本申请一个实施例中,计算机程序被处理器执行时还实现以下步骤:从目标图像中截取目标区域图像,目标区域图像包括目标对象;对目标区域图像中的第二前景区域和第二背景区域分别进行标注,其中,第二前景区域的标注信息与第一前景区域的标注信息相同,第二背景区域的标注信息与第一背景区域的标注信息相同;将标注后的目标区域图像输入至预设神经网络模型,获取预设神经网络模型输出的目标特征信息;根据第一特征信息以及目标特征信息确定待识别区域图像包括的感兴趣对象是否为目标对象。
在本申请一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取第一特征信息与目标特征信息之间的相似度;若相似度大于预设相似度阈值,则确定待识别区域图像包括的感兴趣对象为目标对象;
若相似度小于等于预设相似度阈值,则确定待识别区域图像包括的感兴趣对象不为目标对象。
在本申请一个实施例中,计算机程序被处理器执行时还实现以下步骤:将待识别的图像输入至目标检测模型,得到目标检测模型输出的感兴趣对象的位置信息;基于位置信息,在待识别的图像中截取待识别区域图像。
在本申请一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取训练样本图像集,训练样本图像集包括多个训练样本图像,各训练样本图像包括目标对象、训练样本图像对应的标注信息以及特征信息;基于训练样本图像集对未经训练的神经网络模型进行训练,得到预设神经网络模型。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (11)

1.一种图像识别方法,其特征在于,所述方法包括:
从待识别的图像中截取待识别区域图像,所述待识别区域图像包括感兴趣对象;
对所述待识别区域图像中的第一前景区域和第一背景区域分别进行标注,其中,所述第一前景区域的标注信息与所述第一背景区域的标注信息互不相同;
将标注后的待识别区域图像输入至预设神经网络模型,获取所述预设神经网络模型输出的第一特征信息;
根据所述第一特征信息确定所述待识别区域图像包括的所述感兴趣对象是否为目标对象。
2.根据权利要求1所述的方法,其特征在于,所述对所述待识别区域图像中的第一前景区域和第一背景区域分别进行标注,包括:
获取所述第一前景区域对应的第一标注信息,并将所述第一标注信息添加至所述第一前景区域包括的各像素的像素值中;
获取所述第一背景区域对应的第二标注信息,并将所述第二标注信息添加至所述第一背景区域包括的各像素的像素值中。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在所述待识别区域图像中确定所述第一前景区域和所述第一背景区域相邻的过渡区域;
对所述过渡区域进行标注,其中,所述过渡区域的标注信息与所述第一前景区域的标注信息和所述第一背景区域的标注信息均不相同。
4.根据权利要求3所述的方法,其特征在于,所述标注信息为数值,所述过渡区域的标注信息的大小位于所述第一前景区域的标注信息的大小和所述第一背景区域的标注信息的大小之间。
5.根据权利要求1所述的方法,其特征在于,所述根据所述第一特征信息确定所述待识别区域图像包括的感兴趣对象是否为目标对象,包括:
从目标图像中截取目标区域图像,所述目标区域图像包括所述目标对象;
对所述目标区域图像中的第二前景区域和第二背景区域分别进行标注,其中,所述第二前景区域的标注信息与所述第一前景区域的标注信息相同,所述第二背景区域的标注信息与所述第一背景区域的标注信息相同;
将标注后的目标区域图像输入至所述预设神经网络模型,获取所述预设神经网络模型输出的目标特征信息;
根据所述第一特征信息以及所述目标特征信息确定所述待识别区域图像包括的所述感兴趣对象是否为所述目标对象。
6.根据权利要求5所述的方法,其特征在于,所述根据所述第一特征信息以及所述目标特征信息确定所述待识别区域图像包括的感兴趣对象是否为所述目标对象,包括:
获取所述第一特征信息与所述目标特征信息之间的相似度;
若所述相似度大于预设相似度阈值,则确定所述待识别区域图像包括的感兴趣对象为所述目标对象;
若所述相似度小于等于所述预设相似度阈值,则确定所述待识别区域图像包括的感兴趣对象不为所述目标对象。
7.根据权利要求1所述的方法,其特征在于,所述从待识别的图像中截取待识别区域图像,包括:
将所述待识别的图像输入至目标检测模型,得到所述目标检测模型输出的所述感兴趣对象的位置信息;
基于所述位置信息,在所述待识别的图像中截取所述待识别区域图像。
8.根据权利要求1所述的方法,其特征在于,所述预设神经网络模型的训练过程为:
获取训练样本图像集,所述训练样本图像集包括多个训练样本图像,各所述训练样本图像包括所述目标对象、所述训练样本图像对应的标注信息以及特征信息;
基于所述训练样本图像集对未经训练的神经网络模型进行训练,得到所述预设神经网络模型。
9.一种图像识别装置,其特征在于,所述装置包括:
截取模块,用于从待识别的图像中截取待识别区域图像,所述待识别区域图像包括感兴趣对象;
第一标注模块,用于对所述待识别区域图像中的第一前景区域和第一背景区域分别进行标注,其中,所述第一前景区域的标注信息与所述第一背景区域的标注信息互不相同;
输入模块,用于将标注后的待识别区域图像输入至预设神经网络模型,获取所述预设神经网络模型输出的第一特征信息;
第一确定模块,用于根据所述第一特征信息确定所述待识别区域图像包括的感兴趣对象是否为目标对象。
10.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至8中任一项所述的方法的步骤。
11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至8中任一项所述的方法的步骤。
CN202110348870.8A 2021-03-31 2021-03-31 图像识别方法、装置、计算机设备和存储介质 Pending CN113012189A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110348870.8A CN113012189A (zh) 2021-03-31 2021-03-31 图像识别方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110348870.8A CN113012189A (zh) 2021-03-31 2021-03-31 图像识别方法、装置、计算机设备和存储介质

Publications (1)

Publication Number Publication Date
CN113012189A true CN113012189A (zh) 2021-06-22

Family

ID=76387537

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110348870.8A Pending CN113012189A (zh) 2021-03-31 2021-03-31 图像识别方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN113012189A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113837236A (zh) * 2021-08-31 2021-12-24 广东智媒云图科技股份有限公司 图像中目标对象的识别方法、装置、终端设备及存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103049763A (zh) * 2012-12-07 2013-04-17 华中科技大学 一种基于上下文约束的目标识别方法
CN107145908A (zh) * 2017-05-08 2017-09-08 江南大学 一种基于r‑fcn的小目标检测方法
CN110427868A (zh) * 2019-07-30 2019-11-08 上海工程技术大学 一种行人重识别中的特征提取方法
CN110569769A (zh) * 2019-08-29 2019-12-13 浙江大搜车软件技术有限公司 图像识别方法、装置、计算机设备和存储介质
WO2020015470A1 (zh) * 2018-07-16 2020-01-23 Oppo广东移动通信有限公司 图像处理方法、装置、移动终端及计算机可读存储介质
CN110837848A (zh) * 2019-10-14 2020-02-25 迩言(上海)科技有限公司 一种特征像素图像识别方法及系统
CN111242905A (zh) * 2020-01-06 2020-06-05 科大讯飞(苏州)科技有限公司 一种x光样本图像的生成方法、生成设备和存储装置
CN111259889A (zh) * 2020-01-17 2020-06-09 平安医疗健康管理股份有限公司 图像文本识别方法、装置、计算机设备及计算机存储介质
CN111523390A (zh) * 2020-03-25 2020-08-11 杭州易现先进科技有限公司 一种图像识别的方法及增强现实ar图标识别的系统

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103049763A (zh) * 2012-12-07 2013-04-17 华中科技大学 一种基于上下文约束的目标识别方法
CN107145908A (zh) * 2017-05-08 2017-09-08 江南大学 一种基于r‑fcn的小目标检测方法
WO2020015470A1 (zh) * 2018-07-16 2020-01-23 Oppo广东移动通信有限公司 图像处理方法、装置、移动终端及计算机可读存储介质
CN110427868A (zh) * 2019-07-30 2019-11-08 上海工程技术大学 一种行人重识别中的特征提取方法
CN110569769A (zh) * 2019-08-29 2019-12-13 浙江大搜车软件技术有限公司 图像识别方法、装置、计算机设备和存储介质
CN110837848A (zh) * 2019-10-14 2020-02-25 迩言(上海)科技有限公司 一种特征像素图像识别方法及系统
CN111242905A (zh) * 2020-01-06 2020-06-05 科大讯飞(苏州)科技有限公司 一种x光样本图像的生成方法、生成设备和存储装置
CN111259889A (zh) * 2020-01-17 2020-06-09 平安医疗健康管理股份有限公司 图像文本识别方法、装置、计算机设备及计算机存储介质
CN111523390A (zh) * 2020-03-25 2020-08-11 杭州易现先进科技有限公司 一种图像识别的方法及增强现实ar图标识别的系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113837236A (zh) * 2021-08-31 2021-12-24 广东智媒云图科技股份有限公司 图像中目标对象的识别方法、装置、终端设备及存储介质

Similar Documents

Publication Publication Date Title
WO2019232853A1 (zh) 中文模型训练、中文图像识别方法、装置、设备及介质
US9367766B2 (en) Text line detection in images
US9349076B1 (en) Template-based target object detection in an image
US20210295114A1 (en) Method and apparatus for extracting structured data from image, and device
Tian et al. Learning complementary saliency priors for foreground object segmentation in complex scenes
CN111310800B (zh) 图像分类模型生成方法、装置、计算机设备和存储介质
CN111292377B (zh) 目标检测方法、装置、计算机设备和存储介质
CN112001932B (zh) 人脸识别方法、装置、计算机设备和存储介质
CN109285105A (zh) 水印检测方法、装置、计算机设备和存储介质
CN107886082B (zh) 图像中数学公式检测方法、装置、计算机设备及存储介质
CN110889437B (zh) 一种图像处理方法、装置、电子设备及存储介质
US11893773B2 (en) Finger vein comparison method, computer equipment, and storage medium
Geng et al. An improved helmet detection method for YOLOv3 on an unbalanced dataset
CN113034514A (zh) 天空区域分割方法、装置、计算机设备和存储介质
Huo et al. Semisupervised learning based on a novel iterative optimization model for saliency detection
CN112766275B (zh) 印章文字识别方法、装置、计算机设备和存储介质
CN112966687B (zh) 图像分割模型训练方法、装置及通信设备
CN113012189A (zh) 图像识别方法、装置、计算机设备和存储介质
CN113780116A (zh) 发票分类方法、装置、计算机设备和存储介质
CN113505763B (zh) 关键点检测方法、装置、电子设备及存储介质
CN112509052B (zh) 黄斑中心凹的检测方法、装置、计算机设备和存储介质
CN115272682A (zh) 目标对象检测方法、目标检测模型的训练方法及电子设备
CN113128496B (zh) 一种从图像中提取结构化数据的方法、装置和设备
CN111428553B (zh) 人脸色素斑识别方法、装置、计算机设备和存储介质
CN114677578A (zh) 确定训练样本数据的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination