CN115294332B - 一种图像处理方法、装置、设备和存储介质 - Google Patents

一种图像处理方法、装置、设备和存储介质 Download PDF

Info

Publication number
CN115294332B
CN115294332B CN202211224366.8A CN202211224366A CN115294332B CN 115294332 B CN115294332 B CN 115294332B CN 202211224366 A CN202211224366 A CN 202211224366A CN 115294332 B CN115294332 B CN 115294332B
Authority
CN
China
Prior art keywords
prediction
determining
image processing
image
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211224366.8A
Other languages
English (en)
Other versions
CN115294332A (zh
Inventor
李林超
何林阳
王威
周凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Zhuoyun Intelligent Technology Co ltd
Original Assignee
Zhejiang Zhuoyun Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Zhuoyun Intelligent Technology Co ltd filed Critical Zhejiang Zhuoyun Intelligent Technology Co ltd
Priority to CN202211224366.8A priority Critical patent/CN115294332B/zh
Publication of CN115294332A publication Critical patent/CN115294332A/zh
Application granted granted Critical
Publication of CN115294332B publication Critical patent/CN115294332B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • G06V10/245Aligning, centring, orientation detection or correction of the image by locating a pattern; Special marks for positioning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/761Proximity, similarity or dissimilarity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种图像处理方法、装置、设备和存储介质,包括:采用至少两种图像处理算法,确定样本图像的预处理图像,根据预处理图像,确定样本图像中候选物的特征预测信息,根据特征预测信息确定样本图像的预测框,根据预测框和标定框的匹配结果从候选物中确定目标物,并确定预测框和标定框之间的相似分值;采用蒸馏算法,根据相似分值,分别对各图像处理算法进行分类蒸馏差异计算,确定各图像处理算法之间的预测结果差异值;从预测框中筛选出包含有目标物的预测区域,对预测区域进行卷积操作,确定蒸馏损失;根据预测结果差异值和蒸馏损失,对各图像处理算法的参数进行调整,以获得目标检测模型。提高了目标检测模型的图像处理效率。

Description

一种图像处理方法、装置、设备和存储介质
技术领域
本发明实施例涉及计算机领域,尤其涉及一种图像处理方法、装置、设备和存储介质。
背景技术
随着深度学习发展,用于对X光图像进行图像处理的目标检测模型的检测性能不断的提高,但是随着目标检测模型中包含的图像处理算法的深度增加,对于目标检测模型的训练越来越复杂,且训练获得的目标检测模型的推理速度不断变慢,导致对X光图像进行图像处理的效率较低。同时,对运行目标检测模型的智能硬件设备的要求不断提高。因此,如何在保证X光图像处理精度的同时,提高目标检测模型对X光图像的图像处理效率,是需要解决的问题。
发明内容
本发明提供了一种图像处理方法、装置、设备和存储介质,可以在保证图像处理精度的同时,提高目标检测模型对待检测图像的图像处理效率。
根据本发明的一方面,提供了一种图像处理方法,包括:
采用至少两种图像处理算法,确定样本图像的预处理图像,根据所述预处理图像,确定所述样本图像中候选物的特征预测信息,根据所述特征预测信息确定所述样本图像的预测框,根据所述预测框和标定框的匹配结果从所述候选物中确定目标物,并确定所述预测框和所述标定框之间的相似分值;
采用蒸馏算法,根据所述相似分值,分别对各图像处理算法进行分类蒸馏差异计算,确定各图像处理算法之间的预测结果差异值;
从所述预测框中筛选出包含有所述目标物的预测区域,对所述预测区域进行卷积操作,确定蒸馏损失;
根据所述预测结果差异值和所述蒸馏损失,对各图像处理算法的参数进行调整,以获得目标检测模型;所述目标检测模型用于对待检测图像进行图像处理。
根据本发明的另一方面,提供了一种图像处理装置,该装置包括:
预测框确定模块,采用至少两种图像处理算法,确定样本图像的预处理图像,根据所述预处理图像,确定所述样本图像中候选物的特征预测信息,根据所述特征预测信息确定所述样本图像的预测框,根据所述预测框和标定框的匹配结果从所述候选物中确定目标物,并确定所述预测框和所述标定框之间的相似分值;
预测差异值确定模块,用于采用蒸馏算法,根据所述相似分值,分别对各图像处理算法进行分类蒸馏差异计算,确定各图像处理算法之间的预测结果差异值;
蒸馏损失确定模块,用于从所述预测框中筛选出包含有所述目标物的预测区域,对所述预测区域进行卷积操作,确定蒸馏损失;
目标检测模型获取模块,根据所述预测结果差异值和所述蒸馏损失,对各图像处理算法的参数进行调整,以获得目标检测模型;所述目标检测模型用于对待检测图像进行图像处理。
根据本发明的另一方面,提供了一种电子设备,所述电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例所述的图像处理方法。
根据本发明的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本发明任一实施例所述的图像处理方法。
本发明实施例的技术方案,采用至少两种图像处理算法,确定样本图像的预处理图像,根据预处理图像,确定候选物的特征预测信息,根据特征预测信息确定样本图像的预测框,根据预测框和标定框的匹配结果从候选物中确定目标物,并确定预测框和标定框之间的相似分值;采用蒸馏算法,根据相似分值,分别对各图像处理算法进行分类蒸馏差异计算,确定各图像处理算法之间的预测结果差异值;从预测框中筛选出包含有目标物的预测区域,对预测区域进行卷积操作,确定蒸馏损失;根据预测结果差异值和蒸馏损失,对各图像处理算法的参数进行调整,以获得目标检测模型;目标检测模型用于对待检测图像进行图像处理。解决了采用不同图像处理算法对X光图像进行图像预处理和特征提取时,得到的图像预处理结果和特征提取结果不同,从而使得在采用图像处理算法对X光图像进行图像处理时,直接通过X光图像的训练集对图像处理算法进行训练,无法实现不同图像处理算法提取出的X光图像的图像特征之间的差异进行挖掘,导致对X光图像的图像处理效率和图像处理精确度低的问题。上述方案,实现了基于蒸馏算法对X光图像的图像处理算法进行改进,以实现不同的图像处理算法之间的互相指导学习,获取用于对X光图像进行图像处理的目标检测模型,提高了目标检测模型的鲁棒性。采用目标检测模型对X光图像进行图像处理,可以提高图像处理效率和图像处理的准确性。
应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例一提供的一种图像处理方法的流程图;
图2为本发明实施例二提供的一种图像处理方法的流程图;
图3为本发明实施例三提供的一种图像处理方法的流程图;
图4为本发明实施例四提供的一种图像处理装置的结构示意图;
图5为本发明实施例五提供的一种电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语 “候选”和“目标”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“等”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例一
图1为本发明实施例一提供了一种图像处理方法的流程图,本实施例可适用于采用目标检测模型对待检测图像进行图像处理的情况,尤其适用于基于蒸馏算法,确定对待检测图像进行图像处理的目标检测模型,并用目标检测模型对待检测图像进行图像处理的情况。该方法可以由图像处理装置来执行,该图像处理装置可以采用硬件和/或软件的形式实现,该图像处理装置可配置于电子设备中。如图1所示,该方法包括:
S110、采用至少两种图像处理算法,确定样本图像的预处理图像,根据预处理图像,确定样本图像中候选物的特征预测信息,根据特征预测信息确定样本图像的预测框,根据预测框和标定框的匹配结果从候选物中确定目标物,并确定预测框和标定框之间的相似分值。
在本实施例中,样本图像为X光图像。X光图像是指通过X光对物体进行扫描拍摄后获取到的图像。候选物是指某一区域中可以被X光扫描并可以被检测到的物体,例如候选物可以是包裹内的物体。候选物的特征预测信息包括候选物的位置预测信息和候选物的类别预测信息。标定框是指动作捕捉软件计算出的X光图像所对应的准确空间位置。X光图像的预测框是指通过图像处理算法预测获得的X光扫描拍摄图像的空间位置。预处理图像是指X光图像中的候选物对应的扫描区域的图像。候选物的特征预测信息是指通过图像处理算法对样本图像进行图像处理确定的样本图像中候选物的位置预测信息和类别预测信息。图像处理算法可以是任意图像预处理算法或图像特征提取算法。
例如,在物流领域,可以采用X光扫描拍摄包裹,以获得包裹的X光图像,并采用图像处理算法,对包裹的X光图像进行数据增强、背景拷贝和像素融合等操作进行特征提取,从包裹的X光图像中提取出预处理图像,以保留包裹内部的候选物的共同特征信息,丰富背景噪音。
预处理图像为包裹内部装载物体的扫描图像,包裹内部装载物体即为候选物。可以通过图像处理算法对预处理图像进行分析,以确定包裹内部装载物体的具体位置信息和类别信息,以根据图像分析结果,确定包裹内部的候选物中是否存在违禁品。
具体的,获取图像训练集,采用至少两种图像处理算法对图像训练集中作为样本图像的X光图像进行图像预处理,得到X光图像的预处理图像,图像预处理是指在图像分析中,对输入图像进行特征抽取、分割和匹配前所进行的处理。图像预处理的主要目的是消除X光图像中无关的信息,恢复X光图像中有用的真实信息,增强有关信息的可检测性和最大限度地简化数据,从而改进特征抽取、图像分割、匹配和识别的可靠性。图像预处理后获取的预处理图像的图像背景信息可能发生变化,但图像前景的文本信息和语义信息基本不变。采用至少两种图像处理算法,分别经过各图像处理算法的主干网络、瓶颈层和检测头对预处理图像进行特征提取,以确定样本图像中候选物的特征预测信息。其中,主干网络可以是深度残差网络,由神经网络构成的图像处理算法的图像处理效果与神经网络的层数有关,通常越深的神经网络构成的图像处理算法效果越好,训练难度也就越大。深度残差网络可以克服深度神经网络学习率低和训练难度大的问题。一般在深度较高的神经网络中设置瓶颈层,可以用于减少深度较高的神经网络的计算量。检测头主要用于对X光图像中的候选物的位置信息和类别信息进行预测,以获得候选物的位置预测信息和候选物的类别预测信息。
对预处理图像进行特征提取,确定候选物的特征预测信息,候选物的特征预测信息包括候选物的位置预测信息和候选物的类别预测信息。根据动作捕捉软件计算出的X光扫描图像的标定框,特征预测信息中的位置预测信息确定X光图像的预测框。可以将标定框和预测框的交集面积与标定框和预测框并集面积的比值作为预测框和标定框之间的相似分值。
示例性的,可以通过如下子步骤确定预测框和标定框之间的相似分值:
S1101、根据预处理图像,确定样本图像中候选物的特征预测信息,根据特征预测信息确定样本图像的预测框,对预测框和标定框进行交并比计算,确定交集和并集面积比例。
具体的,分别获得各图像处理算法根据预处理图像确定的候选物的特征预测信息,从特征预测信息中获取候选物的位置预测信息。根据候选物的位置预测信息确定作为样本图像的X光图像的预测框。对预测框和标定框进行交并比计算,确定交集和并集面积比例。交集和并集面积比例即为交并比,交并比的计算公式如公式(1)所示:
Figure 999493DEST_PATH_IMAGE001
(1)
其中,IOU为交并比。
Figure 916633DEST_PATH_IMAGE002
为标定框和预测框的交集面积。 area标定框为标定框的面积。area预测框为预测框的面积。
S1102、根据交集和并集面积比例确定标定框和预测框之间是否存在位置匹配目标。
具体的,可以根据实际需要设定比例阈值。若交并比大于比例阈值,则确定标定框和预测框之间存在位置匹配目标;若交并比小于或等于比例阈值,则确定标定框和预测框之间不存在位置匹配目标。在本实施例中,比例阈值可以是0.5。
S1103、若是,则将标定框中的位置匹配目标和预测框中的位置匹配目标进行类别匹配,根据匹配结果确定标定框和预测框中的位置匹配目标是否为同类目标。
其中,若标定框中的位置匹配目标和预测框中的位置匹配目标的种类相同,则该位置匹配目标为同类目标。
具体的,若交并比大于比例阈值,则确定标定框和预测框之间存在位置匹配目标,再进一步的根据特征预测信息确定预测框中位置匹配目标对应的候选物的类别预测信息。基于预测框中位置匹配目标对应的候选物的类别预测信息,以及标定框中的位置匹配目标对应的类别预测信息,将标定框中的位置匹配目标和预测框中的位置匹配目标进行类别匹配,以根据类别匹配结果,确定标定框和预测框中的位置匹配目标是否为同类目标。
S1104、若是,则确定预测框中的位置匹配目标为目标物,根据特征预测信息确定预测框的类别预测分值,将类别预测分值与交集和并集面积比例的乘积作为预测框与标定框之间的相似分值。
其中,目标物可以是X光扫描到的包裹内的违禁品。
具体的,若标定框和预测框中的位置匹配目标为同类目标,则确定预测框中的位置匹配目标为目标物。将预标定框中目标物所对应的特征预测信息占总特征预测信息的比例作为正确预测信息比例,可以将正确预测信息比例作为预测框的类别预测分值,也可以根据预先规定的类别预测分值的计算方式,基于正确预测信息比例计算预测框的类别预测分值。将类别预测分值与交并比的乘积作为预测框与标定框之间的相似分值。
可以理解的是,根据候选物的特征预测信息确定X光图像的预测框,并计算预测框和标定框的交并比,根据交并比判断预测框和标定框之间是否存在位置信息匹配的位置匹配目标;若存在,则判断标定框中的位置匹配目标和预测框中的位置匹配目标的类型是否一致,在位置匹配目标的类型一致的情况下,根据类别预测分值和交并比计算预测框和标定框之间的相似分值。在计算预测框和标定框之间的相似分值之前,根据特征预测信息确定预测框和标定框之间的位置匹配目标,以及预测框的位置匹配目标和标定框的位置匹配目标之间的类别一致性,可以提高相似分值的计算精度。
S120、采用蒸馏算法,根据相似分值,分别对各图像处理算法进行分类蒸馏差异计算,确定各图像处理算法之间的预测结果差异值。
其中,蒸馏算法可以把复杂的神经网络模型组成的图像处理算法进行简化处理。
具体的,可以采用蒸馏算法,根据预测框和标定框之间的相似分值,根据预设的分类蒸馏差异计算公式,分别对各图像处理算法进行分类蒸馏差异计算,将各图像处理算法对应的分类蒸馏差异计算的计算结果,作为各图像处理算法之间的预测结果差异值。
S130、从预测框中筛选出包含有目标物的预测区域,对预测区域进行卷积操作,确定蒸馏损失。
具体的,从各图像处理算法对应的预测框中确定包含有目标物的预测框。将包含有目标物的预测框作为目标框,并将目标框反向投射到目标框对应的图像处理算法的瓶颈层,通过瓶颈层对目标框进行处理,以从目标框中筛选出包含有目标物的候选区域。
在确定候选区域后,还可以判断目标框所对应的X光图像的图像预处理方式。若目标框所对应的X光图像在图像预处理的过程中存在改变目标物坐标的操作,则需要进一步对瓶颈层中目标框中筛选出的包含有目标物的候选区域进行反图像预处理操作,将反图像预处理操作后的候选区域作为包含有目标物的预测区域。
若目标框所对应的X光图像在图像预处理的过程中不存在改变目标物坐标的操作,则将候选区域作为预测区域。
在确定预测区域后,瓶颈层对预测区域进行卷积操作,保证各预测区域的尺寸一致,各预测区域的尺寸包括各预测区域的长、宽和高。并根据卷积操作结果,确定蒸馏算法在对各图像处理算法进行分类蒸馏差异计算时的蒸馏损失。
S140、根据预测结果差异值和蒸馏损失,对各图像处理算法的参数进行调整,以获得目标检测模型;目标检测模型用于对待检测图像进行图像处理。
其中,目标检测模型包括参数调整后的各图像处理算法和蒸馏算法。待检测图像为待处理的X光图像。
具体的,根据预测结果差异值和蒸馏损失值,计算各图像处理算法的模型损失,根据各图像处理算法的模型损失,分别对各图像处理算法的参数进行调整,以使各图像处理算法的模型损失小于预设的损失阈值。根据参数调整后的各图像处理算法和蒸馏算法,确定用于对X光图像进行图像处理的目标检测模型。采用目标检测模型对待处理的X光图像进行图像处理,以确定待处理的X光图像中是否存在目标物。
示例性的,可以通过如下子步骤获取目标检测模型:
S1401、根据预测结果差异值和蒸馏损失,确定各图像处理算法的模型损失。
具体的,可以预先规定各图像处理算法的模型损失计算方式,根据预测结果差异值和蒸馏损失,通过模型损失计算方式计算各图像处理算法的模型损失。
示例性的,各图像处理算法的模型损失的获取方式可以是:确定各图像处理算法的目标检测分类损失和回归损失;对各图像处理算法对应的预测结果差异值、蒸馏损失、目标检测分类损失和回归损失求和,确定各图像处理算法的模型损失。
其中,在用于目标检测中的图像处理算法中,损失函数主要分为两大类,一类是求目标类别的分类损失函数,即目标检测分类损失;另一类是求目标位置的信息的回归损失函数,即回归损失。
具体的,获取各图像处理算法的分类损失函数和回归损失函数,以确定各图像处理算法对应的目标检测分类损失和回归损失。对各图像处理算法对应的预测结果差异值、蒸馏损失、目标检测分类损失和回归损失求和,确定各图像处理算法的模型损失。
Figure 398168DEST_PATH_IMAGE003
(2)
其中,Loss模型n为第n个图像处理算法的模型损失;若目标检测模型中包含m个图像 处理算法,则1≤n≤m,m和n均为整数。
Figure 793377DEST_PATH_IMAGE004
为第n个图像处理算法的目标检测分类损 失。
Figure 279853DEST_PATH_IMAGE005
为第n个图像处理算法的回归损失。
Figure 102316DEST_PATH_IMAGE006
为第n个图像处理算法的预 测结果差异值。
Figure 369349DEST_PATH_IMAGE007
为第n个图像处理算法的蒸馏损失。
在计算各图像处理算法的模型损失时,充分考虑各图像处理算法的目标检测分类损失和回归损失对模型损失的影响,根据各图像处理算法对应的预测结果差异值、蒸馏损失、目标检测分类损失和回归损失求和,确定各图像处理算法的模型损失,可以提高模型损失的计算精度。
S1402、根据各图像处理算法的模型损失和预设的模型损失条件,对各图像处理算法的参数进行调整,以获得目标检测模型。
具体的,根据各图像处理算法的模型损失,对各图像处理算法的参数进行调整,以使调整后的各图像处理算法均满足预设的模型损失条件。预设的模型损失条件可以是模型损失小于损失阈值,且保持稳定。损失阈值可以根据实际需要进行设置。根据参数调整后的各图像处理算法和蒸馏算法,确定用于对待检测图像进行图像处理的目标检测模型。在本实施例中,待检测图像为X光图像。
可以理解的是,根据各图像处理算法的模型损失和预设的模型损失条件,对各图像处理算法的参数进行调整,可以通过参数调整后的图像处理算法构建出满足预设的模型损失条件的目标检测模型。上述方案,可以提高目标检测模型的鲁棒性,采用目标检测模型对待检测图像进行图像处理,可以提高待检测图像的图像处理效率和图像处理精度。
本实施例提供的技术方案,采用至少两种图像处理算法,确定样本图像的预处理图像,根据预处理图像,确定样本图像中候选物的特征预测信息,根据特征预测信息确定样本图像的预测框,根据预测框和标定框的匹配结果从候选物中确定目标物,并确定预测框和标定框之间的相似分值;采用蒸馏算法,根据相似分值,分别对各图像处理算法进行分类蒸馏差异计算,确定各图像处理算法之间的预测结果差异值;从预测框中筛选出包含有目标物的预测区域,对预测区域进行卷积操作,确定蒸馏损失;根据预测结果差异值和蒸馏损失,对各图像处理算法的参数进行调整,以获得目标检测模型;目标检测模型用于对待检测图像进行图像处理。解决了采用不同图像处理算法对X光图像进行图像预处理和特征提取时,得到的图像预处理结果和特征提取结果不同,从而使得在采用图像处理算法对X光图像进行图像处理时,直接通过X光图像的训练集对图像处理算法进行训练,无法实现不同图像处理算法提取出的X光图像的图像特征之间的差异进行挖掘,导致对X光图像的图像处理效率和图像处理精确度低的问题。上述方案,实现了基于蒸馏算法对X光图像的图像处理算法进行改进,以实现不同的图像处理算法之间的互相指导学习,获取用于对X光图像进行图像处理的目标检测模型,提高了目标检测模型的鲁棒性。采用目标检测模型对X光图像进行图像处理,可以提高图像处理效率和图像处理的准确性。
实施例二
图2为本发明实施例二提供的一种图像处理方法的流程图,本实施例在上述实施例的基础上进行了优化,给出了一种采用蒸馏算法,根据相似分值,分别对各图像处理算法进行分类蒸馏差异计算,确定各图像处理算法之间的预测结果差异值的优选实施方案。具体的,如图2所示,该方法包括:
S210、采用至少两种图像处理算法,确定样本图像的预处理图像,根据预处理图像,确定样本图像中候选物的特征预测信息,根据特征预测信息确定样本图像的预测框,根据预测框和标定框的匹配结果从候选物中确定目标物,并确定预测框和标定框之间的相似分值。
S220、从预测框中提取出目标物对应的相似图像,对相似图像进行二分类处理,确定相似图像的二分类图像。
其中,二分类处理是指可以将相似图像中的像素点分为两个类别,每个像素点属于两个类别中的一个,类别标签为0或1,二分类图像中0为背景,1为前景。
具体的,确定预测框和标定框的重合部分,从预测框的重合部分中确定目标物,目标物在预测框中的图像即为相似图像。可以采用sigmoid操作对相似图像进行二分类处理,根据二分类处理结果确定相似图像的二分类图像。
S230、采用蒸馏算法,根据二分类图像和相似分值,对各图像处理算法进行分类蒸馏差异计算,确定各图像处理算法之间的预测结果差异值。
具体的,根据二分类图像分别确定各图像处理算法获取的目标物的目标物预测个数,将目标物预测个数和相似分值作为蒸馏算法的输入参数,以通过蒸馏算法,对各图像处理算法进行分类蒸馏差异计算,根据蒸馏算法的输出数据确定各图像处理算法之间的预测结果差异值。
示例性的,可以通过如下子步骤确定各图像处理算法之间的预测结果差异值:
S2301、根据二分类图像确定各图像处理算法获取的目标物预测总数,确定目标物预测总数与预测结果总数之间的预测数量比。
具体的,根据二分类图像确定各图像处理算法获取的目标物的预测个数,将各图像处理算法获取的目标物的预测个数相加,确定目标物预测总数。同时,确定各图像处理算法对X光图像进行图像处理,获取的特征预测信息的个数,将特征预测信息的个数之和作为预测结果总数。计算目标物预测总数和预测结果总数之间的预测数量比。
S2302、采用蒸馏算法,根据预测数量比和相似分值,对各图像处理算法进行分类蒸馏差异计算,确定各图像处理算法之间的预测结果差异值。
具体的,将预测数量比和相似分值作为蒸馏算法的输入数据,采用蒸馏算法,对各图像处理算法进行分类蒸馏差异计算,根据蒸馏算法的输出数据确定各图像处理算法之间的预测结果差异值。
示例性的,若图像处理算法的个数为两个,即第一算法和第二算法,则预测结果差异值的计算公式如公式(3)和公式(4)所示:
Figure 505932DEST_PATH_IMAGE008
(3)
Figure 174811DEST_PATH_IMAGE009
(4)
其中,
Figure 168175DEST_PATH_IMAGE010
为第一算法的预测结果差异值。
Figure 125767DEST_PATH_IMAGE011
为预测数量比;
Figure 862778DEST_PATH_IMAGE012
为目标物预测总数;
Figure 386164DEST_PATH_IMAGE013
为预测结果总数。Pi为第一算法第i个目标物所对 应的预测框与标定框之间的相似度。Qi为第二算法第i个目标物所对应的预测框与标定框 之间的相似度。i为正整数。
根据预测类别个数比和相似分值,对各图像处理算法进行分类蒸馏差异计算,可以获得更加准确的预测结果差异值。
S240、从预测框中筛选出包含有目标物的预测区域,对预测区域进行卷积操作,确定蒸馏损失。
S250、根据预测结果差异值和蒸馏损失,对各图像处理算法的参数进行调整,以获得目标检测模型;目标检测模型用于对待检测图像进行图像处理。
本实施例的技术方案,在根据样本图像的特征预测信息确定样本图像的预测框,并确定预测框和标定框之间的相似分值后,通过对预测框中相似分值对应的相似图像进行二分类处理,获取相似图像的二分类图像,再根据相似分值和相似图像的二分类图像,对各图像处理算法进行分类蒸馏差异计算,确定各图像处理算法之间的预测结果差异值;从预测框中筛选出包含有目标物的预测区域,对预测区域进行卷积操作,确定蒸馏损失;根据预测结果差异值和蒸馏损失,对各图像处理算法的参数进行调整,以获得用于对待检测图像进行图像处理的目标检测模型。上述方案,可以有效的消除相似图像中的背景噪音,提高获取的各图像处理算法之间的预测结果差异值的准确性,从而提高目标检测模型的训练精度,在通过目标检测模型对X光图像进行图像处理时,可以获得更加精确的图像处理结果。
实施例三
图3为本发明实施例三提供的一种图像处理方法的流程图,本实施例在上述实施例的基础上进行了优化,给出了一种从预测框中筛选出包含有目标物的预测区域,对预测区域进行卷积操作,确定蒸馏损失的优选实施方式。具体的,如图3所示,该方法包括:
S310、采用至少两种图像处理算法,确定样本图像的预处理图像,根据预处理图像,确定样本图像中候选物的特征预测信息,根据特征预测信息确定样本图像的预测框,根据预测框和标定框的匹配结果从候选物中确定目标物,并确定预测框和标定框之间的相似分值。
S320、采用蒸馏算法,根据相似分值,分别对各图像处理算法进行分类蒸馏差异计算,确定各图像处理算法之间的预测结果差异值。
S330、从预测框中筛选出包含有目标物的预测区域,并从预测区域中提取出区域信息,根据区域信息,确定预测区域中的背景与前景之间的区域通道,确定区域通道之间的通道相关性,并根据通道相关性确定相关性差值。
其中,区域信息包括预测区域中每一像素点的景深值。
具体的,从预测框中筛选出包含有目标物的预测区域,可以通过对预测区域进行卷积操作,从预测区域中提取出区域信息,根据区域信息获取预测区域中每一像素点的景深值,可以根据景深值区分预测区域中的背景和前景。根据区域通道算法,确定预测区域中的背景与前景的各区域通道相关性,两两计算各区域通道相关性的相关性差值。相关性差值的计算公式如公式(5)所示:
Figure 989577DEST_PATH_IMAGE014
(5)
其中,0≤c≤C且0≤l≤C,
Figure 231202DEST_PATH_IMAGE015
其中,LossCov为相关性差值。l表示第l个相关性通道。Cov为图像处理算法中两个区域通道之间的相关系数。Channelc表示第c个相关性通道对应的预测区域;Channel l 表示第l个相关性通道对应的预测区域。
S340、对预测区域进行卷积操作,根据区域通道,确定各图像处理算法所对应的目标物之间的特征差值。
具体的,对预测区域进行卷积操作,可以根据区域通道,确定各图像处理算法的卷积层的特征差值,将各图像处理算法的卷积层的特征差值作为各图像处理算法所对应的目标物之间的特征差值。特征差值的计算公式如公式(6)所示:
Figure 709588DEST_PATH_IMAGE016
(6)
其中,W表示预测区域的宽;H表示预测区域的高;C表示预测区域中背景和前景之间的区域通道。Feature表示预测区域。
S350、根据特征差值和相关性差值,确定蒸馏损失。
具体的,蒸馏损失的计算公式如公式(7)所示:
Figure 353059DEST_PATH_IMAGE017
(7)
其中,Wc和Wf为超参,在本实施例中,Wc和Wf均可设为0.05。
S360、根据预测结果差异值和蒸馏损失,对各图像处理算法的参数进行调整,以获得目标检测模型;目标检测模型用于对待检测图像进行图像处理。
本实施例的技术方案,提供了一种确定蒸馏损失的优选实时方案。在确定蒸馏损失时,首先从预测区域中提取出区域信息,根据区域信息,确定预测区域中的背景与前景之间的区域通道相关性,并得到区域通道相关性的相关性差值;再对预测框中包含有目标物的预测区域进行卷积操作,以获取各图像处理算法确定出的目标物之间的特征差值;根据特征差值和相关性差值,确定蒸馏损失。上述方案,在确定蒸馏损失时,考虑到了预测区域中的背景与前景之间的区域通道相关性。在采用蒸馏算法对分别对各图像处理算法进行分类蒸馏差异计算时,也会对区域通道相关性进行蒸馏差异计算,因此根据特征差值和区域通道相关性的相关性差值确定蒸馏损失,可以提高计算蒸馏损失的精确性,从而使得在根据预测结果差异值和蒸馏损失对各图像处理算法的参数进行调整,以获得用于对待检测图像进行图像处理的目标检测模型时,可以提高目标检测模型的训练精度,在通过目标检测模型对待检测图像进行图像处理时,可以获得更加精确的图像处理结果。
实施例四
图4为本发明实施例四提供的一种图像处理装置的结构示意图。本实施例可适用于采用目标检测模型对待检测图像进行图像处理的情况。如图4所示,该图像处理装置包括:预测框确定模块410、预测差异值确定模块420、蒸馏损失确定模块430和目标检测模型获取模块440。
其中,预测框确定模块410,用于采用至少两种图像处理算法,确定样本图像的预处理图像,根据预处理图像,确定样本图像中候选物的特征预测信息,根据特征预测信息确定样本图像的预测框,根据预测框和标定框的匹配结果从候选物中确定目标物,并确定预测框和标定框之间的相似分值;
预测差异值确定模块420,用于采用蒸馏算法,根据相似分值,分别对各图像处理算法进行分类蒸馏差异计算,确定各图像处理算法之间的预测结果差异值;
蒸馏损失确定模块430,用于从预测框中筛选出包含有目标物的预测区域,对预测区域进行卷积操作,确定蒸馏损失;
目标检测模型获取模块440,用于根据预测结果差异值和蒸馏损失,对各图像处理算法的参数进行调整,以获得目标检测模型;目标检测模型用于对待检测图像进行图像处理。
本实施例提供的技术方案,采用至少两种图像处理算法,确定样本图像的预处理图像,根据预处理图像,确定样本图像中候选物的特征预测信息,根据特征预测信息确定样本图像的预测框,根据预测框和标定框的匹配结果从候选物中确定目标物,并确定预测框和标定框之间的相似分值;采用蒸馏算法,根据相似分值,分别对各图像处理算法进行分类蒸馏差异计算,确定各图像处理算法之间的预测结果差异值;从预测框中筛选出包含有目标物的预测区域,对预测区域进行卷积操作,确定蒸馏损失;根据预测结果差异值和蒸馏损失,对各图像处理算法的参数进行调整,以获得目标检测模型;目标检测模型用于对待检测图像进行图像处理
示例性的,预测差异值确定模块420包括:
二分类图像确定单元,用于从预测框中提取出目标物对应的相似图像,对相似图像进行二分类处理,确定相似图像的二分类图像;
预测差异值计算单元,用于采用蒸馏算法,根据二分类图像和相似分值,对各图像处理算法进行分类蒸馏差异计算,确定各图像处理算法之间的预测结果差异值。
示例性的,预测差异值计算单元具体用于:
根据二分类图像确定各图像处理算法获取的目标物预测总数,确定目标物预测总数与预测结果总数之间的预测数量比;
采用蒸馏算法,根据预测数量比和相似分值,对各图像处理算法进行分类蒸馏差异计算,确定各图像处理算法之间的预测结果差异值。
示例性的,蒸馏损失确定模块430,具体用于:
从预测框中筛选出包含有目标物的预测区域,并从预测区域中提取出区域信息,根据区域信息,确定预测区域中的背景与前景之间的区域通道,确定区域通道之间的通道相关性,并根据通道相关性确定相关性差值;
对预测区域进行卷积操作,根据区域通道,确定各图像处理算法所对应的目标物之间的特征差值;
根据特征差值和相关性差值,确定蒸馏损失。
示例性的,预测框确定模块410,具体用于:
根据预处理图像,确定候选物的特征预测信息,根据特征预测信息确定样本图像的预测框,对预测框和标定框进行交并比计算,确定交集和并集面积比例;
根据交集和并集面积比例确定标定框和预测框之间是否存在位置匹配目标;
若是,则将标定框中的位置匹配目标和预测框中的位置匹配目标进行类别匹配,根据匹配结果确定标定框和预测框中的位置匹配目标是否为同类目标;
若是,则确定预测框中的位置匹配目标为目标物,根据特征预测信息确定预测框的类别预测分值,将类别预测分值与交集和并集面积比例的乘积作为预测框与标定框之间的相似分值。
示例性的,目标检测模型获取模块440包括:
模型损失确定单元,用于根据预测结果差异值和蒸馏损失,确定各图像处理算法的模型损失;
目标检测模型确定单元,用于根据各图像处理算法的模型损失和预设的模型损失条件,对各图像处理算法的参数进行调整,以获得目标检测模型。
示例性的,模型损失确定单元具体用于:
确定各图像处理算法的目标检测分类损失和回归损失;
对各图像处理算法对应的预测结果差异值、蒸馏损失、目标检测分类损失和回归损失求和,确定各图像处理算法的模型损失。
本实施例提供的图像处理装置可适用于上述任意实施例提供的图像处理方法,具备相应的功能和有益效果。
实施例五
图5示出了可以用来实施本发明的实施例的电子设备10的结构示意图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本发明的实现。
如图5所示,电子设备10包括至少一个处理器11,以及与至少一个处理器11通信连接的存储器,如只读存储器(ROM)12、随机访问存储器(RAM)13等,其中,存储器存储有可被至少一个处理器执行的计算机程序,处理器11可以根据存储在只读存储器(ROM)12中的计算机程序或者从存储单元18加载到随机访问存储器(RAM)13中的计算机程序,来执行各种适当的动作和处理。在RAM 13中,还可存储电子设备10操作所需的各种程序和数据。处理器11、ROM 12以及RAM 13通过总线14彼此相连。输入/输出(I/O)接口15也连接至总线14。
电子设备10中的多个部件连接至I/O接口15,包括:输入单元16,例如键盘、鼠标等;输出单元17,例如各种类型的显示器、扬声器等;存储单元18,例如磁盘、光盘等;以及通信单元19,例如网卡、调制解调器、无线通信收发机等。通信单元19允许电子设备10通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
处理器11可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器11的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。处理器11执行上文所描述的各个方法和处理,例如图像处理方法。
在一些实施例中,图像处理方法可被实现为计算机程序,其被有形地包含于计算机可读存储介质,例如存储单元18。在一些实施例中,计算机程序的部分或者全部可以经由ROM 12和/或通信单元19而被载入和/或安装到电子设备10上。当计算机程序加载到RAM 13并由处理器11执行时,可以执行上文描述的图像处理方法的一个或多个步骤。备选地,在其他实施例中,处理器11可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行图像处理方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本发明的方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本发明的上下文中,计算机可读存储介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。备选地,计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在电子设备上实施此处描述的系统和技术,该电子设备具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、区块链网络和互联网。
计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务中,存在的管理难度大,业务扩展性弱的缺陷。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发明中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本发明的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

Claims (8)

1.一种图像处理方法,其特征在于,包括:
采用至少两种图像处理算法,确定样本图像的预处理图像,根据所述预处理图像,确定所述样本图像中候选物的特征预测信息,根据所述特征预测信息确定所述样本图像的预测框,根据所述预测框和标定框的匹配结果从所述候选物中确定目标物,并确定所述预测框和所述标定框之间的相似分值;
从所述预测框中提取出所述目标物对应的相似图像,对所述相似图像进行二分类处理,确定所述相似图像的二分类图像;
根据所述二分类图像确定各图像处理算法获取的目标物预测总数,确定所述目标物预测总数与预测结果总数之间的预测数量比;
采用蒸馏算法,根据所述预测数量比和所述相似分值,对各图像处理算法进行分类蒸馏差异计算,确定各图像处理算法之间的预测结果差异值;
从所述预测框中筛选出包含有所述目标物的预测区域,对所述预测区域进行卷积操作,确定蒸馏损失;
根据所述预测结果差异值和所述蒸馏损失,对各图像处理算法的参数进行调整,以获得目标检测模型;所述目标检测模型用于对待检测图像进行图像处理。
2.根据权利要求1所述的方法,其特征在于,从所述预测框中筛选出包含有所述目标物的预测区域,对所述预测区域进行卷积操作,确定蒸馏损失,包括:
从所述预测框中筛选出包含有所述目标物的预测区域,并从所述预测区域中提取出区域信息,根据所述区域信息,确定所述预测区域中的背景与前景之间的区域通道,确定所述区域通道之间的通道相关性,并根据所述通道相关性确定相关性差值;
对所述预测区域进行卷积操作,根据所述区域通道,确定各图像处理算法所对应的目标物之间的特征差值;
根据所述特征差值和所述相关性差值,确定蒸馏损失。
3.根据权利要求1所述的方法,其特征在于,根据所述预处理图像,确定所述样本图像中候选物的特征预测信息,根据所述特征预测信息确定所述样本图像的预测框,根据所述预测框和标定框的匹配结果从所述候选物中确定目标物,并确定所述预测框和所述标定框之间的相似分值预处理图像,包括:
根据所述预处理图像,确定所述样本图像中候选物的特征预测信息,根据所述特征预测信息确定所述样本图像的预测框,对所述预测框和标定框进行交并比计算,确定交集和并集面积比例;
根据所述交集和并集面积比例确定所述标定框和所述预测框之间是否存在位置匹配目标;
若是,则将所述标定框中的位置匹配目标和所述预测框中的位置匹配目标进行类别匹配,根据匹配结果确定所述标定框和所述预测框中的位置匹配目标是否为同类目标;
若是,则确定所述预测框中的位置匹配目标为目标物,根据所述特征预测信息确定所述预测框的类别预测分值,将所述类别预测分值与所述交集和并集面积比例的乘积作为所述预测框与所述标定框之间的相似分值。
4.根据权利要求1所述的方法,其特征在于,根据所述预测结果差异值和所述蒸馏损失,对各图像处理算法的参数进行调整,以获得目标检测模型,包括:
根据所述预测结果差异值和所述蒸馏损失,确定各图像处理算法的模型损失;
根据各图像处理算法的模型损失和预设的模型损失条件,对各图像处理算法的参数进行调整,以获得目标检测模型。
5.根据权利要求4所述的方法,其特征在于,根据所述预测结果差异值和所述蒸馏损失,确定各图像处理算法的模型损失,包括:
确定各图像处理算法的目标检测分类损失和回归损失;
对各图像处理算法对应的预测结果差异值、蒸馏损失、目标检测分类损失和回归损失求和,确定各图像处理算法的模型损失。
6.一种图像处理装置,其特征在于,包括:
预测框确定模块,采用至少两种图像处理算法,确定样本图像的预处理图像,根据所述预处理图像,确定所述样本图像中候选物的特征预测信息,根据所述特征预测信息确定所述样本图像的预测框,根据所述预测框和标定框的匹配结果从所述候选物中确定目标物,并确定所述预测框和所述标定框之间的相似分值;
预测差异值确定模块,所述预测差异值确定模块包括二分类图像确定单元和预测差异值计算单元;其中,所述二分类图像确定单元,用于从所述预测框中提取出所述目标物对应的相似图像,对所述相似图像进行二分类处理,确定所述相似图像的二分类图像;所述预测差异值计算单元,用于根据所述二分类图像确定各图像处理算法获取的目标物预测总数,确定所述目标物预测总数与预测结果总数之间的预测数量比;采用蒸馏算法,根据所述预测数量比和所述相似分值,对各图像处理算法进行分类蒸馏差异计算,确定各图像处理算法之间的预测结果差异值;
蒸馏损失确定模块,用于从所述预测框中筛选出包含有所述目标物的预测区域,对所述预测区域进行卷积操作,确定蒸馏损失;
目标检测模型获取模块,根据所述预测结果差异值和所述蒸馏损失,对各图像处理算法的参数进行调整,以获得目标检测模型;所述目标检测模型用于对待检测图像进行图像处理。
7.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-5中任一项所述的图像处理方法。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求1-5中任一项所述的图像处理方法。
CN202211224366.8A 2022-10-09 2022-10-09 一种图像处理方法、装置、设备和存储介质 Active CN115294332B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211224366.8A CN115294332B (zh) 2022-10-09 2022-10-09 一种图像处理方法、装置、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211224366.8A CN115294332B (zh) 2022-10-09 2022-10-09 一种图像处理方法、装置、设备和存储介质

Publications (2)

Publication Number Publication Date
CN115294332A CN115294332A (zh) 2022-11-04
CN115294332B true CN115294332B (zh) 2023-01-17

Family

ID=83833152

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211224366.8A Active CN115294332B (zh) 2022-10-09 2022-10-09 一种图像处理方法、装置、设备和存储介质

Country Status (1)

Country Link
CN (1) CN115294332B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116071608B (zh) * 2023-03-16 2023-06-06 浙江啄云智能科技有限公司 目标检测方法、装置、设备和存储介质
CN117115568B (zh) * 2023-10-24 2024-01-16 浙江啄云智能科技有限公司 数据筛选方法、装置、设备及存储介质
CN117934972B (zh) * 2024-03-21 2024-05-28 贵州万德科技有限公司 一种辣椒加工用图像筛选方法及其筛选系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111950329A (zh) * 2019-05-16 2020-11-17 长沙智能驾驶研究院有限公司 目标检测及模型训练方法、装置、计算机设备和存储介质
WO2021023202A1 (zh) * 2019-08-07 2021-02-11 交叉信息核心技术研究院(西安)有限公司 一种卷积神经网络的自蒸馏训练方法、设备和可伸缩动态预测方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112288086B (zh) * 2020-10-30 2022-11-25 北京市商汤科技开发有限公司 一种神经网络的训练方法、装置以及计算机设备
CN112906502B (zh) * 2021-01-29 2023-08-01 北京百度网讯科技有限公司 目标检测模型的训练方法、装置、设备以及存储介质
CN113920307A (zh) * 2021-09-29 2022-01-11 北京百度网讯科技有限公司 模型的训练方法、装置、设备、存储介质及图像检测方法
CN114898165A (zh) * 2022-06-20 2022-08-12 哈尔滨工业大学 一种基于模型通道剪裁的深度学习知识蒸馏方法
CN115147687A (zh) * 2022-07-07 2022-10-04 浙江啄云智能科技有限公司 学生模型训练方法、装置、设备及存储介质
CN115082920B (zh) * 2022-08-16 2022-11-04 北京百度网讯科技有限公司 深度学习模型的训练方法、图像处理方法和装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111950329A (zh) * 2019-05-16 2020-11-17 长沙智能驾驶研究院有限公司 目标检测及模型训练方法、装置、计算机设备和存储介质
WO2021023202A1 (zh) * 2019-08-07 2021-02-11 交叉信息核心技术研究院(西安)有限公司 一种卷积神经网络的自蒸馏训练方法、设备和可伸缩动态预测方法

Also Published As

Publication number Publication date
CN115294332A (zh) 2022-11-04

Similar Documents

Publication Publication Date Title
US11436739B2 (en) Method, apparatus, and storage medium for processing video image
CN115294332B (zh) 一种图像处理方法、装置、设备和存储介质
CN113657390B (zh) 文本检测模型的训练方法和检测文本方法、装置和设备
CN114463586A (zh) 图像识别模型的训练与图像识别方法、装置、设备和介质
CN113971751A (zh) 训练特征提取模型、检测相似图像的方法和装置
CN113139543A (zh) 目标对象检测模型的训练方法、目标对象检测方法和设备
CN113239807B (zh) 训练票据识别模型和票据识别的方法和装置
CN115861462B (zh) 图像生成模型的训练方法、装置、电子设备及存储介质
CN114898111B (zh) 预训练模型生成方法和装置、目标检测方法和装置
CN113643260A (zh) 用于检测图像质量的方法、装置、设备、介质和产品
CN115471476A (zh) 一种部件缺陷检测方法、装置、设备及介质
CN114495101A (zh) 文本检测方法、文本检测网络的训练方法及装置
CN116758280A (zh) 目标检测方法、装置、设备以及存储介质
CN114724144B (zh) 文本识别方法、模型的训练方法、装置、设备及介质
CN116109874A (zh) 一种检测方法、装置、电子设备和存储介质
CN116935368A (zh) 深度学习模型训练方法、文本行检测方法、装置及设备
CN115761698A (zh) 一种目标检测方法、装置、设备及存储介质
CN115861809A (zh) 杆状物检测及其模型的训练方法、装置、电子设备、介质
CN115359322A (zh) 一种目标检测模型训练方法、装置、设备和存储介质
CN113936158A (zh) 一种标签匹配方法及装置
CN114549904A (zh) 视觉处理及模型训练方法、设备、存储介质及程序产品
CN113763313A (zh) 文本图像的质量检测方法、装置、介质及电子设备
CN112861940A (zh) 双目视差估计方法、模型训练方法以及相关设备
CN114037865B (zh) 图像处理方法、装置、设备、存储介质和程序产品
CN114202728B (zh) 一种视频检测方法、装置、电子设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant