CN112036516A - 一种图像处理方法、装置、电子设备和存储介质 - Google Patents

一种图像处理方法、装置、电子设备和存储介质 Download PDF

Info

Publication number
CN112036516A
CN112036516A CN202011216609.4A CN202011216609A CN112036516A CN 112036516 A CN112036516 A CN 112036516A CN 202011216609 A CN202011216609 A CN 202011216609A CN 112036516 A CN112036516 A CN 112036516A
Authority
CN
China
Prior art keywords
information
determining
sample image
image
image processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011216609.4A
Other languages
English (en)
Inventor
白亚龙
张炜
梅涛
周伯文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Century Trading Co Ltd
Beijing Wodong Tianjun Information Technology Co Ltd
Original Assignee
Beijing Jingdong Century Trading Co Ltd
Beijing Wodong Tianjun Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Century Trading Co Ltd, Beijing Wodong Tianjun Information Technology Co Ltd filed Critical Beijing Jingdong Century Trading Co Ltd
Priority to CN202011216609.4A priority Critical patent/CN112036516A/zh
Publication of CN112036516A publication Critical patent/CN112036516A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)

Abstract

本发明实施例公开了一种图像处理方法、装置、电子设备和存储介质,该方法包括:获取待处理的目标图像;将目标图像输入至图像处理网络模型中,根据图像处理网络模型的输出,确定目标图像对应的目标处理结果;其中,图像处理网络模型是预先根据样本图像和预设空间结构预测模型训练获得的,预设空间结构预测模型是用于预测样本图像中的两个特征点之间的相对位置信息。通过本发明实施例的技术方案,可以提高图像处理的准确率。

Description

一种图像处理方法、装置、电子设备和存储介质
技术领域
本发明实施例涉及计算机技术,尤其涉及一种图像处理方法、装置、电子设备和存储介质。
背景技术
随着深度学习技术的快速发展,可以利用基于深度学习的图像处理网络模型对图像进行快速处理,比如,对图像中的物体进行识别、检测和分割等。
通常,在使用图像处理网络模型之前,需要对图像处理网络模型进行有监督学习或者无监督学习的模型训练,使得训练后的图像处理网络模型可以准确地进行图像处理操作。目前,图像处理网络模型的训练目标在于学习高质量的图像视觉特征表征,或者定位图像中具有明显视觉判别意义的关键区域,以提高精细物体识别的准确率。
然而,现有技术中至少存在如下问题:
现有的图像处理网络模型的训练仅是关注于物体视觉特征或者判别性区域视觉特征的学习。而在实际应用中,由于各类物体的外观、形态变化多样,图形背景信息复杂等情况,使得一些物体具有相似的视觉特征,从而在利用现有训练方式获得的图像处理网络模型识别这些视觉相似的物体时,会存在误判的情况,降低了图像处理的准确率。
发明内容
本发明实施例提供了一种图像处理方法、装置、电子设备和存储介质,以提高图像处理的准确率。
第一方面,本发明实施例提供了一种图像处理方法,包括:
获取待处理的目标图像;
将所述目标图像输入至图像处理网络模型中,根据所述图像处理网络模型的输出,确定所述目标图像对应的目标处理结果;
其中,所述图像处理网络模型是预先根据样本图像和预设空间结构预测模型训练获得的,所述预设空间结构预测模型是用于预测所述样本图像中的两个特征点之间的相对位置信息。
第二方面,本发明实施例还提供了一种图像处理装置,包括:
目标图像获取模块,用于获取待处理的目标图像;
目标处理结果确定模块,用于将所述目标图像输入至图像处理网络模型中,根据所述图像处理网络模型的输出,确定所述目标图像对应的目标处理结果;
其中,所述图像处理网络模型是预先根据样本图像和预设空间结构预测模型训练获得的,所述预设空间结构预测模型是用于预测所述样本图像中的两个特征点之间的相对位置信息。
第三方面,本发明实施例还提供了一种电子设备,所述电子设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明任意实施例所提供的图像处理方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明任意实施例所提供的图像处理方法。
上述发明中的实施例具有如下优点或有益效果:
通过设置可以用于预测样本图像中的两个特征点之间的相对位置信息的预设空间结构预测模型,并利用该预设空间结构预测模型对图像处理网络模型进行训练,从而可以强化图像处理网络模型对图像中的物体空间结构的学习和认知,使得训练后的图像处理网络模型在处理图像时不仅关注于视觉特征,还可以关注于物体空间结构信息,从而获得更加准确的图像处理结果,提高了图像处理的准确率。
附图说明
图1是本发明实施例一提供的一种图像处理方法的流程图;
图2是本发明实施例二提供的一种图像处理方法中所使用的图像处理网络模型的训练操作的流程图;
图3是本发明实施例二所涉及的一种图像处理网络模型的训练过程的示例;
图4是本发明实施例三提供的一种图像处理方法中所使用的图像处理网络模型的训练操作的流程图;
图5是本发明实施例四提供的一种图像处理装置的结构示意图;
图6是本发明实施例五提供的一种电子设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例一提供的一种图像处理方法的流程图,本实施例可适用于利用图像处理网络模型对图像进行处理的情况,尤其是可以用于对图像中的物体进行识别、检测和分割等场景。该方法可以由图像处理装置来执行,该装置可以由软件和/或硬件的方式来实现,集成于具有图像处理功能的设备中。如图1所示,该方法具体包括以下步骤:
S110、获取待处理的目标图像。
其中,目标图像可以是用于进行物体识别、目标检测或者图像分割的待处理图像。物体识别可以是用于识别出目标图像中的物体是哪种物体。目标检测可以是用于检测目标图像中的目标物体所在位置。图像分割可以是将目标图像中的目标物体所在区域分割出来,比如将目标图像中的目标物体所在区域进行高亮显示。
S120、将目标图像输入至图像处理网络模型中,根据图像处理网络模型的输出,确定目标图像对应的目标处理结果;其中,图像处理网络模型是预先根据样本图像和预设空间结构预测模型训练获得的,预设空间结构预测模型是用于预测样本图像中的两个特征点之间的相对位置信息。
其中,图像处理网络模型可以是预先基于业务处理需求,构建的深度卷积神经网络模型DCNN(Deep Convolutional Neural Network)。例如,图像处理网络模型可以是用于进行物体识别、目标检测或者图像分割的网络模型。本实施例可以利用现有的用于实现物体识别、目标检测或者图像分割的网络结构进行设置图像处理网络模型。目标处理结果可以是图像处理网络模型输出的,与业务处理需求相匹配的结果信息。例如,若图像处理网络模型用于进行物体识别,则相应的目标处理结果可以是所识别出的物体类别。预设空间结构预测模型是预先构建出的,可以用于预测出样本图像中的任意两个特征点之间的相对位置信息的卷积神经网络模型,以便学习物体空间结构信息。相对位置信息可以是指在直角坐标系下或者极坐标系下表征出的两个特征点之间的相对位置关系。样本图像中的特征点可以是指样本图像对应的特征图中的每个位置点,其可以对应于样本图像中的子区域。
具体地,在利用图像处理网络模型处理目标图像之前,可以利用预设空间结构预测模型对图像处理网络模型进行训练,使得图像处理网络模型在学习视觉特征信息的同时,也可以学习和认知物体空间结构信息,从而训练后的图像处理网络模型在处理目标图像时不仅关注于视觉特征信息,还会关注于物体空间结构信息,从而对视觉相似的物体可以进行更加准确地识别和检测,大大降低了误判概率,提高了图像处理的准确率。
本实施例的技术方案,通过设置可以用于预测样本图像中的两个特征点之间的相对位置信息的预设空间结构预测模型,并利用该预设空间结构预测模型对图像处理网络模型进行训练,从而可以强化图像处理网络模型对图像中的物体空间结构的学习和认知,使得训练后的图像处理网络模型在处理图像时不仅关注于视觉特征,还可以关注于物体空间结构信息,从而获得更加准确的图像处理结果,提高了图像处理的准确率。
在上述技术方案的基础上,图像处理网络模型的训练过程可以包括如下步骤S131-S136:
S131、将样本图像输入至图像处理网络模型中的特征提取子模型中,根据特征提取子模型的输出,确定样本图像对应的第一特征信息。
其中,图像处理网络模型中通常存在用于提取图像特征的特征提取子模型。特征提取子模型可以是一种卷积神经网络模型。第一特征信息可以包括样本图像中的每个特征点的特征信息,其可以利用特征矩阵的形式进行表征。
具体地,将样本图像输入至特征提取子模型中进行特征提取,并将提取出的第一特征信息进行输出,从而基于特征提取子模型的输出,获得样本图像对应的第一特征信息。
需要说明的是,图像处理网络模型所需要的样本图像为多个,每个样本图像均可以通过执行步骤S131-S136的方式对图像处理网络模型进行训练。
S132、将第一特征信息输入至预设空间结构预测模型中,根据预设空间结构预测模型的输出,确定样本图像中的每个非参考特征点相对于参考特征点的预测相对位置信息,其中,非参考特征点是指样本图像中除参考特征点之外的其他特征点。
其中,参考特征点可以是样本图像对应的特征图中最具有参考价值的特征点。例如,可以将位于物体内部最显著的特征点作为参考特征点。非参考特征点可以是指特征图中除参考特征点之外的其他特征点。本实施例中的参考特征点可以为一个,非参考特征点可以为多个。
具体地,将第一特征信息输入至预设空间结构预测模型中,使得预设空间结构预测模型基于第一特征信息对样本图像中的每个非参考特征点相对于参考特征点的相对位置信息进行预测,并将预测出的相对位置信息进行输出,从而根据预设空间结构预测模型的输出,可以获得每个非参考特征点相对于参考特征点的预测相对位置信息。
示例性地,预设空间结构预测模型可以包括:预设特征筛选子模型和预设位置坐标预测子模型。其中,预设特征筛选子模型可以是用于从第一特征信息中筛选出与目标物体空间结构相关联的第二特征信息的卷积神经网络模型。目标物体可以是指目标图像中的待识别物体。预设位置坐标预测子模型可以是用于预测出非参考特征点相对于参考特征点的相对位置信息的卷积神经网络模型。其中,第二特征信息可以包括特征图中的每个特征点的空间结构特征信息,其可以利用一个尺寸为N×N×C特征矩阵进行表征。其中,N×N是指特征图的大小,C是指通道数。
示例性地,S132可以包括:将第一特征信息输入至预设特征筛选子模型中,根据预设特征筛选子模型的输出,确定与目标物体空间结构相关联的第二特征信息;确定样本图像中的参考特征点;根据参考特征点、第二特征信息和预设位置坐标预测模型,确定样本图像中的每个非参考特征点相对于参考特征点的预测相对位置信息。
具体地,将第一特征信息输入至预设特征筛选子模型中,以使预设特征筛选子模型从第一特征信息中筛选出与目标物体空间结构相关联的第二特征信息,并将第二特征信息进行输出,从而根据预设特征筛选子模型的输出,可以获得第二特征信息。本实施例可以将第二特征信息中的特征响应值最大的特征点确定为样本图像中的参考特征点,第二特征信息中的其他特征点作为非参考特征点。从第二特征信息中可以获得参考特征点对应的参考特征信息以及每个非参考特征点对应的非参考特征信息,并将每个非参考特征点对应的非参考特征信息均与参考特征点对应的参考特征信息进行拼接操作,并将拼接后的非参考特征信息和参考特征信息输入至预设位置坐标预测模型中,以使预设位置坐标预测模型基于非参考特征信息和参考特征信息预测出非参考特征点相对于参考特征点的相对位置信息并进行输出,从而基于预设位置坐标预测模型的输出可以获得每个非参考特征点相对于参考特征点的预测相对位置信息。本实施例通过基于预设特征筛选子模型和预设位置坐标预测子模型,可以准确地预测出每个非参考特征点相对于参考特征点的预测相对位置信息,从而提高对物体空间结构认知的准确性,进一步提高训练效果。
S133、将第一特征信息输入至图像处理网络模型中的图像处理子模型中,根据的图像处理子模型的输出,确定样本图像对应的样本处理结果。
具体地,将图像处理网络模型中的特征提取子模型输出的第一特征信息输入至图像处理子模型中,以使图像处理子模型基于第一特征信息进行图像处理,并将图像处理结果进行输出,从而可以基于图像处理子模型的输出,获得样本图像对应的样本处理结果。
S134、根据样本图像中的每个非参考特征点相对于参考特征点的预测相对位置信息和标准相对位置信息,确定样本图像对应的第一训练误差。
其中,标准相对位置信息可以是预先基于样本图像确定出的非参考特征点相对于参考特征点的实际相对位置信息。第一训练误差可以用于表征预测相对位置信息与标准相对位置信息之间的偏差。本实施例可以将预测相对位置信息与标准相对位置信息之间的差值的平方值确定为样本图像对应的第一训练误差,从而可以衡量出图像处理网络模型对物体空间结构的认知情况。
S135、根据样本图像对应的样本处理结果和标准处理结果,确定样本图像对应的第二训练误差。
其中,标准处理结果可以是指预先标注的样本图像的实际处理结果。第二训练误差可以用于表征样本图像的样本处理结果与标准处理结果之间的偏差。本实施例可以利用现有的图像处理损失函数表征出样本图像对应的第二训练误差。
S136、将第一训练误差和第二训练误差达到收敛条件作为训练目标,对图像处理网络模型进行训练。
具体地,可以基于第一训练误差和第二训练误差检测当前是否达到收敛条件,比如第一训练误差与第二训练误差的误差之和是否小于预设误差或误差变化是否趋于稳定,或者当前的迭代次数是否等于预设次数。若检测出当前达到收敛条件,比如第一训练误差与第二训练误差的误差之和小于预设误差或误差变化趋于稳定,或者当前的迭代次数等于预设次数,表明图像处理网络模型训练完成,此时可以停止迭代训练。若检测出当前未达到收敛条件,则可以将第一训练误差与第二训练误差均反向传播至图像处理网络模型和预设空间结构预测模型中,调整图像处理网络模型和预设空间结构预测模型中的网络参数,直到达到收敛条件为止。通过基于第一训练误差和第二训练误差共同指导图像处理网络模型的训练,即对图像处理网络模型和预设空间结构预测模型进行同时训练的方式,可以迫使图像处理网络模型强化对图像中的物体内部结构的认知能力,也就是说,可以迫使图像处理网络模型中的特征提取子模型学习到更多的关于物体内部结构的信息,从而输出具备物体空间结构表征能力的第一特征信息,使得训练后的图像处理网络模型可以在处理图像时不仅关注于视觉特征,还可以关注于物体空间结构信息,从而获得更加准确的图像处理结果,提高了图像处理的准确率。
实施例二
图2为本发明实施例二提供的一种图像处理方法中所使用的图像处理网络模型的训练操作的流程图,本实施例在上述各实施例的基础上,预设空间结构预测模型除了包括预设特征筛选子模型和预设位置坐标预测子模型之外,还包括预设物体区域提取子模型,并对步骤“确定样本图像中的参考特征点”进行了进一步优化。在此基础上,还可以进一步对步骤“根据参考特征点、第二特征信息和预设位置坐标预测模型,确定样本图像中的每个非参考特征点相对于参考特征点的预测相对位置信息”进行优化。其中与上述各实施例相同或相应的术语的解释在此不再赘述。
参见图2,本实施例提供的一种图像处理方法中所使用的图像处理网络模型的训练操作具体包括以下步骤:
S210、将样本图像输入至图像处理网络模型中的特征提取子模型中,根据特征提取子模型的输出,确定样本图像对应的第一特征信息。
示例性地,图3给出了一种图像处理网络模型的训练过程的示例。图3中的图像处理网络模型可以是用于进行物体识别,以便预测出物体所属类别的网络模型。如图3所示,将样本图像I输入至图像处理网络模型中的特征提取子模型(如①所示)中,根据特征提取子模型的输出,获得样本图像对应的第一特征信息f(I)。
S220、将第一特征信息输入至预设特征筛选子模型中,根据预设特征筛选子模型的输出,确定与目标物体空间结构相关联的第二特征信息。
具体地,如图3所示,将第一特征信息f(I)输入至预设特征筛选子模型(如②所示)中,根据预设特征筛选子模型的输出,可以获得与目标物体空间结构相关联的第二特征信息h(I),其为一个尺寸为7×7×C的特征矩阵。图3中的每个白色立方标注的特征向量对应特征图中的一个特征点,即样本图像中的一个子区域。
S230、将第一特征信息输入至预设物体区域提取子模型中,根据预设物体区域提取子模型的输出,获得用于表征目标物品所在图像区域的第三特征信息。
其中,预设物体区域提取子模型可以是用于提取样本图像中具有判别意义的关键区域(目标物品所在图像区域)的卷积神经网络模型。具体地,如图3所示,将第一特征信息f(I)输入至预设物体区域提取子模型(如③所示)中,以使预设物体区域提取子模型从第一特征信息f(I)中提取出特征响应值大于预设阈值的显著区域,并基于显著区域的特征信息获得样本图像对应的第三特征信息m'(I)。第三特征信息m'(I)可以包括每个特征点对应的特征响应值,并且当某个特征点位于物体内部时,该特征点对应的特征响应值为大于零的数值,当某个特征点位于物体外部时,该特征点对应的特征响应值等于零。通过利用预设物体区域提取子模型,可以提取出样本图像中的关键区域,以便后续可以仅专注于关键区域的有用信息,无需考虑无用信息,进而提高处理效率和处理准确度。
S240、将第三特征信息作为权重,与第二特征信息进行相乘,获得第四特征信息。
具体地,如图3中的④所示,可以将第三特征信息m'(I)作为权重,与第二特征信息h(I)进行相乘,也就是将同一特征点对应的第三特征信息和第四特征信息进行相乘,获得第四特征信息h'(I)。本实施例通过相乘方式将第三特征信息m'(I)作用到第二特征信息h(I),从而可以将样本图像中与目标物体无关的信息(如第四特征信息h'(I)中的白色立方标注的特征向量)可以被忽略掉,使得后续可以仅专注于物体内部信息(如第四特征信息h'(I)中的深色立方标注的特征向量)的学习。
S250、根据第四特征信息,确定样本图像中的参考特征点。
具体地,如图3所示,可以将第四特征信息h'(I)中的特征响应值不为零的一个特征点作为参考特征点,也就是将位于物体内部的一个特征点作为参考特征点。
示例性地,S250可以包括:将第四特征信息中的特征响应值最大的特征点确定为参考特征点。具体地,对于第四特征信息h'(I)而言,若特征点对应的特征响应值越大,则该特征点位于物体内部的概率就越大,从而可以将特征响应值最大的特征点确定为参考特征点,以便保证所选取的参考特征点位于物体内部,进而保证物体空间结构学习的准确性。
S260、根据参考特征点、第四特征信息和预设位置坐标预测模型,确定样本图像中的每个非参考特征点相对于参考特征点的预测相对位置信息。
具体地,通过基于第三特征信息m'(I)作用后获得的第四特征信息,可以更准确简洁地表征出每个非参考特征点和参考特征点的特征信息,从而使得预设位置坐标预测模型可以基于第四特征信息更加便捷地确定出每个非参考特征点相对于参考特征点的预测相对位置信息,提高了训练效率。
示例性地,S260可以包括:基于第四特征信息,获取参考特征点对应的参考特征信息和样本图像中的每个非参考点对应的非参考特征信息;将每个非参考特征信息与参考特征信息输入至预设位置坐标预测模型中,根据预设位置坐标预测模型的输出,确定每个非参考特征点相对于参考特征点的预测相对位置信息。
具体地,如图3所示,从第四特征信息中可以获得参考特征点对应的参考特征信息(即第四特征信息中的参考特征点对应的特征向量)以及每个非参考特征点对应的非参考特征信息(即第四特征信息中的非参考特征点对应的特征向量),并可以将每个非参考特征点对应的非参考特征信息均与参考特征点对应的参考特征信息进行拼接操作,并将拼接后的非参考特征信息和参考特征信息输入至预设位置坐标预测模型(如⑤所示)中,以使预设位置坐标预测模型基于非参考特征信息和参考特征信息更加快速地预测出非参考特征点相对于参考特征点的相对位置信息并进行输出,从而基于预设位置坐标预测模型的输出可以获得每个非参考特征点相对于参考特征点的预测相对位置信息,进而提高了训练效率。
S270、将第一特征信息输入至图像处理网络模型中的图像处理子模型中,根据的图像处理子模型的输出,确定样本图像对应的样本处理结果。
具体地,如图3所示,将第一特征信息f(I)输入至图像处理网络模型中的图像处理子模型(如⑦所示)中,根据的图像处理子模型的输出,获得样本图像对应的样本处理结果,即物体类别预测结果。
S280、根据样本图像中的每个非参考特征点相对于参考特征点的预测相对位置信息和标准相对位置信息,确定样本图像对应的第一训练误差。
S290、根据样本图像对应的样本处理结果和标准处理结果,确定样本图像对应的第二训练误差。
S291、将第一训练误差和第二训练误差达到收敛条件作为训练目标,对图像处理网络模型进行训练。
示例性地,如图3所示,在获得每个非参考特征点对应的预测相对位置信息后,可以对预测相对位置信息分布进行回归(如⑥所示),即最小化预测相对位置信息与标准相对位置信息之间的差异,从而可以迫使图像处理网络模型强化对图像中物体内部结构的认知能力,使得训练后的图像处理网络模型可以更加准确地进行图像处理,提高图像处理准确率。
本实施例的技术方案,通过在预设空间结构预测模型中设置预设物体区域提取子模型,并利用预设物体区域提取子模型提取出样本图像中的关键区域,从而在训练过程中可以仅专注于关键区域的有用信息,无需考虑无用信息,进一步进而提高图像处理效率和准确率。
实施例三
图4为本发明实施例三提供的一种图像处理方法中所使用的图像处理网络模型的训练操作的流程图,本实施例在上述各实施例的基础上,预设空间结构预测模型可以用于预测样本图像中的非参考特征点相对于参考特征点的极坐标信息,以便利用极坐标形式表征物体空间结构信息,从而更加鲁棒地学习物体空间结构信息。其中与上述各实施例相同或相应的术语的解释在此不再赘述。
参见图4,本实施例提供的一种图像处理方法中所使用的图像处理网络模型的训练操作具体包括以下步骤:
S410、将样本图像输入至图像处理网络模型中的特征提取子模型中,根据特征提取子模型的输出,确定样本图像对应的第一特征信息。
S420、将第一特征信息输入至预设空间结构预测模型中,根据预设空间结构预测模型的输出,确定样本图像中的每个非参考特征点相对于参考特征点的预测极坐标信息。
其中,预测极坐标信息可以包括非参考特征点相对于参考特征点的预测相对距离和预测偏移角度。
具体地,可以在极坐标系下表征出相对位置信息,使得预设空间结构预测模型可以预测出样本图像中的非参考特征点相对于参考特征点的预测极坐标信息。通过预测极坐标信息可以避免因图像中的目标物体发生旋转而导致空间结构信息学习不准确的情况,使得图像处理网络模型在认知物体内部结构时可以保证旋转不变形,进而提高训练效果和图像处理的鲁棒性。
S430、将第一特征信息输入至图像处理网络模型中的图像处理子模型中,根据的图像处理子模型的输出,确定样本图像对应的样本处理结果。
S440、根据参考特征点在样本图像中的直角坐标信息和每个非参考特征点在样本图像中的直角坐标信息,确定每个非参考特征点相对于参考特征点的标准极坐标信息。
其中,标准极坐标信息可以包括非参考特征点相对于参考特征点的标准相对距离和标准偏移角度。
具体地,可以基于样本图像对应的第二特征信息,获得参考特征点
Figure 529133DEST_PATH_IMAGE001
在整个样本 图像特征表示矩阵h(I)中的直角坐标信息,并记作
Figure 795029DEST_PATH_IMAGE002
,以及每个非参考特征点
Figure 997340DEST_PATH_IMAGE003
在整 个样本图像特征表示矩阵h(I)中的直角坐标信息,并记作
Figure 639674DEST_PATH_IMAGE004
。示例性地,可以通过如下 公式确定出非参考特征点相对于参考特征点的标准极坐标信息
Figure 243831DEST_PATH_IMAGE005
Figure 946208DEST_PATH_IMAGE006
Figure 511181DEST_PATH_IMAGE007
其中,
Figure 81840DEST_PATH_IMAGE008
是指非参考特征点
Figure 415869DEST_PATH_IMAGE003
到参考特征点
Figure 151132DEST_PATH_IMAGE001
的标准相对距离,其取值范围为:
Figure 203401DEST_PATH_IMAGE009
Figure 187538DEST_PATH_IMAGE010
是在以水平方向为基准方式时,非参考特征点
Figure 31866DEST_PATH_IMAGE003
到参考特征点
Figure 810466DEST_PATH_IMAGE001
的标 准偏移角度。
Figure 615611DEST_PATH_IMAGE011
是指样本图像对应的特征图的尺寸。对于图3而言,
Figure 528072DEST_PATH_IMAGE011
等于7。通过除以
Figure 836694DEST_PATH_IMAGE012
的方式,可以对标准相对距离和标准偏移角度进行归一化,以便更加准确地处理不同尺寸 的样本图像,进而提高训练效果。
S450、根据样本图像中的每个非参考特征点相对于参考特征点的预测极坐标信息和标准极坐标信息,确定样本图像对应的第一训练误差。
具体地,可以将非参考特征点相对于参考特征点的预测极坐标信息
Figure 51774DEST_PATH_IMAGE013
与标 准极坐标信息
Figure 937691DEST_PATH_IMAGE005
的差值的平方根确定为样本图像对应的第一训练误差。
示例性地,S450可以包括:根据样本图像中的每个非参考特征点相对于参考特征点的预测相对距离和标准相对距离,确定样本图像对应的相对距离训练误差;根据样本图像中的每个非参考特征点相对于参考特征点的预测偏移角度和标准偏移角度,确定每个非参考特征点对应的偏移角度差;根据各个偏移角度差,确定平均偏移角度差;根据每个非参考特征点对应的偏移角度差和平均偏移角度差,确定样本图像对应的偏移角度训练误差。
具体地,可以将非参考特征点相对于参考特征点的预测相对距离
Figure 529209DEST_PATH_IMAGE014
与标准相对 距离
Figure 957916DEST_PATH_IMAGE008
的差值的平方根确定为样本图像对应的相对距离训练误差
Figure 202953DEST_PATH_IMAGE015
。本实施例可以利 用偏移角度差
Figure 982690DEST_PATH_IMAGE016
限制角度偏差的取值范围,并利用偏移角度分布的方差作为损失函数, 使得图像处理网络模型在认知物体内部结构时满足旋转不变性。通过对各个偏移角度差进 行取平均,获得平均偏移角度差,并将每个非参考特征点对应的偏移角度差与平均偏移角 度差的差值的平方根确定为样本图像对应的偏移角度训练误差
Figure 971375DEST_PATH_IMAGE017
,从而可以保证物体旋 转不变性。
例如,在预设空间结构预测模型中设置预设物体区域提取子模型进行训练时,相 对距离训练误差
Figure 254589DEST_PATH_IMAGE015
和偏移角度训练误差
Figure 811472DEST_PATH_IMAGE017
可以通过如下公式进行确定:
Figure 937560DEST_PATH_IMAGE018
Figure 870881DEST_PATH_IMAGE019
Figure 743022DEST_PATH_IMAGE020
其中,
Figure 861019DEST_PATH_IMAGE021
表示样本图像
Figure 349769DEST_PATH_IMAGE022
的集合。
Figure 555623DEST_PATH_IMAGE023
是指非参考特征点
Figure 940992DEST_PATH_IMAGE003
对应的第三特征信息;
Figure 839678DEST_PATH_IMAGE011
是指样本图像对应的特征图的尺寸;
Figure 550145DEST_PATH_IMAGE016
是指非参考特征点
Figure 949903DEST_PATH_IMAGE003
对应的偏移角度差;
Figure 62215DEST_PATH_IMAGE024
是指平均偏移角度差。本实施例可以通过除以
Figure 131802DEST_PATH_IMAGE025
的方式,对相对距离训练误差
Figure 719778DEST_PATH_IMAGE015
和偏移角度训练误差
Figure 267434DEST_PATH_IMAGE017
进行归一化,以避免样本图像中的目标物体所占图像区域大小不 同时而导致空间结构学习不准确的情况,进而提高训练效果。
示例性地,根据样本图像中的每个非参考特征点相对于参考特征点的预测偏移角度和标准偏移角度,确定每个非参考特征点对应的偏移角度差,可以包括:
若非参考特征点相对于参考特征点的预测偏移角度大于或等于相应的标准偏移角度,则将该非参考特征点相对于参考特征点的预测偏移角度减去相应的标准偏移角度,获得的差值确定为该非参考特征点对应的偏移角度差;若非参考特征点相对于参考特征点的预测偏移角度小于相应的标准偏移角度,则将该非参考特征点相对于参考特征点的预测偏移角度减去相应的标准偏移角度,并对获得的差值加1,获得的相加结果确定为该非参考特征点对应的偏移角度差。
例如,可以通过如下公式确定每个非参考特征点
Figure 499833DEST_PATH_IMAGE003
对应的偏移角度差
Figure 599376DEST_PATH_IMAGE016
Figure 550014DEST_PATH_IMAGE026
具体地,通过利用偏移角度差
Figure 25995DEST_PATH_IMAGE016
可以限制角度偏差的取值范围,以便保证旋转不变 性,提高模型训练效果。
S460、根据样本图像对应的样本处理结果和标准处理结果,确定样本图像对应的第二训练误差。
S470、将第一训练误差和第二训练误差达到收敛条件作为训练目标,对图像处理网络模型进行训练。
本实施例的技术方案,通过利用极坐标形式进行物体空间结构信息的学习,可以避免因图像中的目标物体发生旋转而导致空间结构信息学习不准确的情况,使得图像处理网络模型在认知物体内部结构时可以保证旋转不变形,进而提高模型训练效果和图像处理的鲁棒性。
以下是本发明实施例提供的图像处理装置的实施例,该装置与上述各实施例的图像处理方法属于同一个发明构思,在图像处理装置的实施例中未详尽描述的细节内容,可以参考上述图像处理方法的实施例。
实施例四
图5为本发明实施例四提供的一种图像处理装置的结构示意图,本实施例可适用于利用图像处理网络模型对图像进行处理的情况,该装置具体可以包括:目标图像获取模块510和目标处理结果确定模块520。
其中,目标图像获取模块510,用于获取待处理的目标图像;目标处理结果确定模块520,用于将目标图像输入至图像处理网络模型中,根据图像处理网络模型的输出,确定目标图像对应的目标处理结果;其中,图像处理网络模型是预先根据样本图像和预设空间结构预测模型训练获得的,预设空间结构预测模型是用于预测样本图像中的两个特征点之间的相对位置信息。
可选地,该装置还包括:图像处理网络模型训练模块包括:
第一特征信息确定单元,用于将样本图像输入至图像处理网络模型中的特征提取子模型中,根据特征提取子模型的输出,确定样本图像对应的第一特征信息;
预测相对位置信息确定单元,用于将第一特征信息输入至预设空间结构预测模型中,根据预设空间结构预测模型的输出,确定样本图像中的每个非参考特征点相对于参考特征点的预测相对位置信息,其中,非参考特征点是指样本图像中除参考特征点之外的其他特征点;
样本处理结果确定单元,用于将第一特征信息输入至图像处理网络模型中的图像处理子模型中,根据的图像处理子模型的输出,确定样本图像对应的样本处理结果;
第一训练误差确定单元,用于根据样本图像中的每个非参考特征点相对于参考特征点的预测相对位置信息和标准相对位置信息,确定样本图像对应的第一训练误差;
第二训练误差确定单元,用于根据样本图像对应的样本处理结果和标准处理结果,确定样本图像对应的第二训练误差;
模型训练单元,用于将第一训练误差和第二训练误差达到收敛条件作为训练目标,对图像处理网络模型进行训练。
可选地,预设空间结构预测模型包括:预设特征筛选子模型和预设位置坐标预测子模型;预测相对位置信息确定单元,包括:
第二特征信息确定子单元,用于将第一特征信息输入至预设特征筛选子模型中,根据预设特征筛选子模型的输出,确定与目标物体空间结构相关联的第二特征信息;
参考特征点确定子单元,用于确定样本图像中的参考特征点;
预测相对位置信息确定子单元,用于根据参考特征点、第二特征信息和预设位置坐标预测模型,确定样本图像中的每个非参考特征点相对于参考特征点的预测相对位置信息。
可选地,预设空间结构预测模型还包括:预设物体区域提取子模型;参考特征点确定子单元,具体用于:
将第一特征信息输入至预设物体区域提取子模型中,根据预设物体区域提取子模型的输出,获得用于表征目标物品所在图像区域的第三特征信息;将第三特征信息作为权重,与第二特征信息进行相乘,获得第四特征信息;根据第四特征信息,确定样本图像中的参考特征点。
可选地,参考特征点确定子单元,还具体用于:将第四特征信息中的特征响应值最大的特征点确定为参考特征点。
可选地,预测相对位置信息确定子单元,具体用于:根据参考特征点、第四特征信息和预设位置坐标预测模型,确定样本图像中的每个非参考特征点相对于参考特征点的预测相对位置信息。
可选地,预测相对位置信息确定子单元,还具体用于:
基于第四特征信息,获取参考特征点对应的参考特征信息和样本图像中的每个非参考点对应的非参考特征信息;将每个非参考特征信息与参考特征信息输入至预设位置坐标预测模型中,根据预设位置坐标预测模型的输出,确定每个非参考特征点相对于参考特征点的预测相对位置信息。
可选地,预测相对位置信息确定单元,具体用于:将第一特征信息输入至预设空间结构预测模型中,根据预设空间结构预测模型的输出,确定样本图像中的每个非参考特征点相对于参考特征点的预测极坐标信息;
第一训练误差确定单元,具体用于:根据参考特征点在样本图像中的直角坐标信息和每个非参考特征点在样本图像中的直角坐标信息,确定每个非参考特征点相对于参考特征点的标准极坐标信息;根据样本图像中的每个非参考特征点相对于参考特征点的预测极坐标信息和标准极坐标信息,确定样本图像对应的第一训练误差。
可选地,第一训练误差确定单元,包括:
相对距离训练误差确定子单元,用于根据样本图像中的每个非参考特征点相对于参考特征点的预测相对距离和标准相对距离,确定样本图像对应的相对距离训练误差;
偏移角度差确定子单元,用于根据样本图像中的每个非参考特征点相对于参考特征点的预测偏移角度和标准偏移角度,确定每个非参考特征点对应的偏移角度差;
平均偏移角度差确定子单元,用于根据各个偏移角度差,确定平均偏移角度差;
偏移角度训练误差确定子单元,用于根据每个非参考特征点对应的偏移角度差和平均偏移角度差,确定样本图像对应的偏移角度训练误差。
可选地,偏移角度差确定子单元,具体用于:若非参考特征点相对于参考特征点的预测偏移角度大于或等于相应的标准偏移角度,则将该非参考特征点相对于参考特征点的预测偏移角度减去相应的标准偏移角度,获得的差值确定为该非参考特征点对应的偏移角度差;若非参考特征点相对于参考特征点的预测偏移角度小于相应的标准偏移角度,则将该非参考特征点相对于参考特征点的预测偏移角度减去相应的标准偏移角度,并对获得的差值加1,获得的相加结果确定为该非参考特征点对应的偏移角度差。
本发明实施例所提供的图像处理装置可执行本发明任意实施例所提供的图像处理方法,具备执行图像处理方法相应的功能模块和有益效果。
值得注意的是,上述图像处理装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
实施例五
图6为本发明实施例五提供的一种电子设备的结构示意图。图6示出了适于用来实现本发明实施方式的示例性电子设备12的框图。图6显示的电子设备12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图6所示,电子设备12以通用计算电子设备的形式表现。电子设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
电子设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被电子设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。电子设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图6未显示,通常称为“硬盘驱动器”)。尽管图6中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM, DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。系统存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如系统存储器28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
电子设备12也可以与一个或多个外部电子设备14(例如键盘、指向电子设备、显示器24等)通信,还可与一个或者多个使得用户能与该电子设备12交互的电子设备通信,和/或与使得该电子设备12能与一个或多个其它计算电子设备进行通信的任何电子设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,电子设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与电子设备12的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备12使用其它硬件和/或软件模块,包括但不限于:微代码、电子设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元16通过运行存储在系统存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现本发实施例所提供的一种图像处理方法步骤,该方法包括:
获取待处理的目标图像;
将目标图像输入至图像处理网络模型中,根据图像处理网络模型的输出,确定目标图像对应的目标处理结果;
其中,图像处理网络模型是预先根据样本图像和预设空间结构预测模型训练获得的,预设空间结构预测模型是用于预测样本图像中的两个特征点之间的相对位置信息。
当然,本领域技术人员可以理解,处理器还可以实现本发明任意实施例所提供的图像处理方法的技术方案。
实施例六
本实施例提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明任意实施例所提供的图像处理方法步骤,该方法包括:
获取待处理的目标图像;
将目标图像输入至图像处理网络模型中,根据图像处理网络模型的输出,确定目标图像对应的目标处理结果;
其中,图像处理网络模型是预先根据样本图像和预设空间结构预测模型训练获得的,预设空间结构预测模型是用于预测样本图像中的两个特征点之间的相对位置信息。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于:电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
本领域普通技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个计算装置上,或者分布在多个计算装置所组成的网络上,可选地,他们可以用计算机装置可执行的程序代码来实现,从而可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件的结合。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (13)

1.一种图像处理方法,其特征在于,包括:
获取待处理的目标图像;
将所述目标图像输入至图像处理网络模型中,根据所述图像处理网络模型的输出,确定所述目标图像对应的目标处理结果;
其中,所述图像处理网络模型是预先根据样本图像和预设空间结构预测模型训练获得的,所述预设空间结构预测模型是用于预测所述样本图像中的两个特征点之间的相对位置信息。
2.根据权利要求1所述的方法,其特征在于,所述图像处理网络模型的训练过程,包括:
将样本图像输入至图像处理网络模型中的特征提取子模型中,根据所述特征提取子模型的输出,确定所述样本图像对应的第一特征信息;
将所述第一特征信息输入至预设空间结构预测模型中,根据所述预设空间结构预测模型的输出,确定所述样本图像中的每个非参考特征点相对于参考特征点的预测相对位置信息,其中,所述非参考特征点是指所述样本图像中除所述参考特征点之外的其他特征点;
将所述第一特征信息输入至所述图像处理网络模型中的图像处理子模型中,根据所述的图像处理子模型的输出,确定所述样本图像对应的样本处理结果;
根据所述样本图像中的每个非参考特征点相对于参考特征点的预测相对位置信息和标准相对位置信息,确定所述样本图像对应的第一训练误差;
根据所述样本图像对应的样本处理结果和标准处理结果,确定所述样本图像对应的第二训练误差;
将所述第一训练误差和所述第二训练误差达到收敛条件作为训练目标,对所述图像处理网络模型进行训练。
3.根据权利要求2所述的方法,其特征在于,所述预设空间结构预测模型包括:预设特征筛选子模型和预设位置坐标预测子模型;
所述将所述第一特征信息输入至预设空间结构预测模型中,根据所述预设空间结构预测模型的输出,确定所述样本图像中的每个非参考特征点相对于参考特征点的预测相对位置信息,包括:
将所述第一特征信息输入至所述预设特征筛选子模型中,根据所述预设特征筛选子模型的输出,确定与目标物体空间结构相关联的第二特征信息;
确定所述样本图像中的参考特征点;
根据所述参考特征点、所述第二特征信息和所述预设位置坐标预测模型,确定所述样本图像中的每个非参考特征点相对于所述参考特征点的预测相对位置信息。
4.根据权利要求3所述的方法,其特征在于,所述预设空间结构预测模型还包括:预设物体区域提取子模型;
所述确定所述样本图像中的参考特征点,包括:
将所述第一特征信息输入至所述预设物体区域提取子模型中,根据所述预设物体区域提取子模型的输出,获得用于表征目标物品所在图像区域的第三特征信息;
将所述第三特征信息作为权重,与所述第二特征信息进行相乘,获得第四特征信息;
根据所述第四特征信息,确定所述样本图像中的参考特征点。
5.根据权利要求4所述的方法,其特征在于,根据所述第四特征信息,确定所述样本图像中的参考特征点,包括:
将所述第四特征信息中的特征响应值最大的特征点确定为参考特征点。
6.根据权利要求4所述的方法,其特征在于,根据所述参考特征点、所述第二特征信息和所述预设位置坐标预测模型,确定所述样本图像中的每个非参考特征点相对于所述参考特征点的预测相对位置信息,包括:
根据所述参考特征点、所述第四特征信息和所述预设位置坐标预测模型,确定所述样本图像中的每个非参考特征点相对于所述参考特征点的预测相对位置信息。
7.根据权利要求6所述的方法,其特征在于,根据所述参考特征点、所述第四特征信息和所述预设位置坐标预测模型,确定所述样本图像中的每个非参考特征点相对于所述参考特征点的预测相对位置信息,包括:
基于所述第四特征信息,获取所述参考特征点对应的参考特征信息和所述样本图像中的每个非参考点对应的非参考特征信息;
将每个所述非参考特征信息与所述参考特征信息输入至所述预设位置坐标预测模型中,根据所述预设位置坐标预测模型的输出,确定每个非参考特征点相对于所述参考特征点的预测相对位置信息。
8.根据权利要求2所述的方法,其特征在于,将所述第一特征信息输入至预设空间结构预测模型中,根据所述预设空间结构预测模型的输出,确定所述样本图像中的每个非参考特征点相对于参考特征点的预测相对位置信息,包括:
将所述第一特征信息输入至预设空间结构预测模型中,根据所述预设空间结构预测模型的输出,确定所述样本图像中的每个非参考特征点相对于参考特征点的预测极坐标信息;
所述根据所述样本图像中的每个非参考特征点相对于参考特征点的预测相对位置信息和标准相对位置信息,确定所述样本图像对应的第一训练误差,包括:
根据所述参考特征点在所述样本图像中的直角坐标信息和每个非参考特征点在所述样本图像中的直角坐标信息,确定每个非参考特征点相对于参考特征点的标准极坐标信息;
根据所述样本图像中的每个非参考特征点相对于参考特征点的预测极坐标信息和标准极坐标信息,确定所述样本图像对应的第一训练误差。
9.根据权利要求8所述的方法,其特征在于,根据所述样本图像中的每个非参考特征点相对于参考特征点的预测极坐标信息和标准极坐标信息,确定所述样本图像对应的第一训练误差,包括:
根据所述样本图像中的每个非参考特征点相对于参考特征点的预测相对距离和标准相对距离,确定所述样本图像对应的相对距离训练误差;
根据所述样本图像中的每个非参考特征点相对于参考特征点的预测偏移角度和标准偏移角度,确定每个非参考特征点对应的偏移角度差;
根据各个所述偏移角度差,确定平均偏移角度差;
根据每个非参考特征点对应的偏移角度差和所述平均偏移角度差,确定所述样本图像对应的偏移角度训练误差。
10.根据权利要求9所述的方法,其特征在于,根据所述样本图像中的每个非参考特征点相对于参考特征点的预测偏移角度和标准偏移角度,确定每个非参考特征点对应的偏移角度差,包括:
若非参考特征点相对于参考特征点的预测偏移角度大于或等于相应的标准偏移角度,则将该非参考特征点相对于参考特征点的预测偏移角度减去相应的标准偏移角度,获得的差值确定为该非参考特征点对应的偏移角度差;
若非参考特征点相对于参考特征点的预测偏移角度小于相应的标准偏移角度,则将该非参考特征点相对于参考特征点的预测偏移角度减去相应的标准偏移角度,并对获得的差值加1,获得的相加结果确定为该非参考特征点对应的偏移角度差。
11.一种图像处理装置,其特征在于,包括:
目标图像获取模块,用于获取待处理的目标图像;
目标处理结果确定模块,用于将所述目标图像输入至图像处理网络模型中,根据所述图像处理网络模型的输出,确定所述目标图像对应的目标处理结果;
其中,所述图像处理网络模型是预先根据样本图像和预设空间结构预测模型训练获得的,所述预设空间结构预测模型是用于预测所述样本图像中的两个特征点之间的相对位置信息。
12.一种电子设备,其特征在于,所述电子设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-10中任一所述的图像处理方法。
13.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-10中任一所述的图像处理方法。
CN202011216609.4A 2020-11-04 2020-11-04 一种图像处理方法、装置、电子设备和存储介质 Pending CN112036516A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011216609.4A CN112036516A (zh) 2020-11-04 2020-11-04 一种图像处理方法、装置、电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011216609.4A CN112036516A (zh) 2020-11-04 2020-11-04 一种图像处理方法、装置、电子设备和存储介质

Publications (1)

Publication Number Publication Date
CN112036516A true CN112036516A (zh) 2020-12-04

Family

ID=73572843

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011216609.4A Pending CN112036516A (zh) 2020-11-04 2020-11-04 一种图像处理方法、装置、电子设备和存储介质

Country Status (1)

Country Link
CN (1) CN112036516A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113052240A (zh) * 2021-03-26 2021-06-29 北京达佳互联信息技术有限公司 图像处理模型的确定方法、装置、设备及存储介质
CN114418868A (zh) * 2021-12-21 2022-04-29 云南联合视觉科技有限公司 图像增强方法、装置、服务器及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108830139A (zh) * 2018-04-27 2018-11-16 北京市商汤科技开发有限公司 人体关键点的深度前后关系预测方法、装置、介质及设备
CN109508681A (zh) * 2018-11-20 2019-03-22 北京京东尚科信息技术有限公司 生成人体关键点检测模型的方法和装置
CN110796230A (zh) * 2018-08-02 2020-02-14 株式会社理光 卷积神经网络的训练及使用方法、设备及存储介质
CN111488977A (zh) * 2019-01-25 2020-08-04 北京地平线机器人技术研发有限公司 神经网络模型训练方法和装置
CN111696130A (zh) * 2019-03-12 2020-09-22 北京京东尚科信息技术有限公司 目标跟踪方法、目标跟踪装置及计算机可读存储介质
CN111797893A (zh) * 2020-05-26 2020-10-20 华为技术有限公司 一种神经网络的训练方法、图像分类系统及相关设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108830139A (zh) * 2018-04-27 2018-11-16 北京市商汤科技开发有限公司 人体关键点的深度前后关系预测方法、装置、介质及设备
CN110796230A (zh) * 2018-08-02 2020-02-14 株式会社理光 卷积神经网络的训练及使用方法、设备及存储介质
CN109508681A (zh) * 2018-11-20 2019-03-22 北京京东尚科信息技术有限公司 生成人体关键点检测模型的方法和装置
CN111488977A (zh) * 2019-01-25 2020-08-04 北京地平线机器人技术研发有限公司 神经网络模型训练方法和装置
CN111696130A (zh) * 2019-03-12 2020-09-22 北京京东尚科信息技术有限公司 目标跟踪方法、目标跟踪装置及计算机可读存储介质
CN111797893A (zh) * 2020-05-26 2020-10-20 华为技术有限公司 一种神经网络的训练方法、图像分类系统及相关设备

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113052240A (zh) * 2021-03-26 2021-06-29 北京达佳互联信息技术有限公司 图像处理模型的确定方法、装置、设备及存储介质
CN113052240B (zh) * 2021-03-26 2024-03-05 北京达佳互联信息技术有限公司 图像处理模型的确定方法、装置、设备及存储介质
CN114418868A (zh) * 2021-12-21 2022-04-29 云南联合视觉科技有限公司 图像增强方法、装置、服务器及存储介质

Similar Documents

Publication Publication Date Title
US10983596B2 (en) Gesture recognition method, device, electronic device, and storage medium
CN112016638B (zh) 一种钢筋簇的识别方法、装置、设备及存储介质
CN110335313B (zh) 音频采集设备定位方法及装置、说话人识别方法及系统
CN112036516A (zh) 一种图像处理方法、装置、电子设备和存储介质
CN111124920A (zh) 设备性能测试方法、装置及电子设备
CN111124863B (zh) 智能设备性能测试方法、装置及智能设备
CN113506288A (zh) 基于transform注意力机制的肺结节检测方法及装置
CN111819567A (zh) 使用语义特征来匹配图像的方法和装置
CN109934185B (zh) 数据处理方法及装置、介质和计算设备
CN112857746A (zh) 一种灯光检测仪的追踪方法、装置、电子设备及存储介质
CN117058421A (zh) 基于多头模型的图像检测关键点方法、系统、平台及介质
CN110796108A (zh) 一种人脸质量检测的方法、装置、设备及存储介质
CN111124862B (zh) 智能设备性能测试方法、装置及智能设备
CN114399791A (zh) 一种行人检测方法、装置、设备和介质
CN110516024B (zh) 地图搜索结果展现方法、装置、设备和存储介质
CN113807416A (zh) 一种模型训练方法、装置、电子设备以及存储介质
CN114067145A (zh) 无源分光器检测方法、装置、设备及介质
CN113902890A (zh) 用于视觉概念检测的自监督数据增强方法、系统、设备
CN112559340A (zh) 一种画面测试方法、装置、设备及存储介质
CN112559342A (zh) 一种画面测试图像的获取方法、装置、设备及存储介质
CN112036465A (zh) 图像识别方法、装置、设备及存储介质
CN113450351B (zh) 分割模型训练方法、图像分割方法、装置、设备及介质
CN111753625B (zh) 一种行人检测方法、装置、设备及介质
CN112380981B (zh) 人脸关键点的检测方法、装置、存储介质及电子设备
CN116797858A (zh) 图像识别模型的训练方法、图像识别方法及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20201204