CN117437624B - 违禁品检测方法、装置及电子设备 - Google Patents

违禁品检测方法、装置及电子设备 Download PDF

Info

Publication number
CN117437624B
CN117437624B CN202311764986.5A CN202311764986A CN117437624B CN 117437624 B CN117437624 B CN 117437624B CN 202311764986 A CN202311764986 A CN 202311764986A CN 117437624 B CN117437624 B CN 117437624B
Authority
CN
China
Prior art keywords
visual angle
image
characteristic
view
angle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311764986.5A
Other languages
English (en)
Other versions
CN117437624A (zh
Inventor
李林超
权家新
周凯
田彦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Zhuoyun Intelligent Technology Co ltd
Original Assignee
Zhejiang Zhuoyun Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Zhuoyun Intelligent Technology Co ltd filed Critical Zhejiang Zhuoyun Intelligent Technology Co ltd
Priority to CN202311764986.5A priority Critical patent/CN117437624B/zh
Publication of CN117437624A publication Critical patent/CN117437624A/zh
Application granted granted Critical
Publication of CN117437624B publication Critical patent/CN117437624B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/42Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • G06V10/443Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
    • G06V10/449Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
    • G06V10/451Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
    • G06V10/454Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/761Proximity, similarity or dissimilarity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/80Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
    • G06V10/806Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/05Recognition of patterns representing particular kinds of hidden objects, e.g. weapons, explosives, drugs

Abstract

本发明公开了一种违禁品检测方法、装置及电子设备,涉及安检技术领域,包括:获取目标包裹的第一视角图像和第二视角图像;计算第一视角图像和第二视角图像之间的相似度;若相似度大于或等于预设的相似度阈值,则确定第一视角特征和第二视角特征之间的公共视角特征,并采用公共视角特征、第一视角特征和第二视角特征,对目标包裹进行违禁品检测。通过对第一视角图像和第二视角图像进行相似度匹配,利用相似度较大的第一视角图像和第二视角图像进行特征融合得到的融合特征进行违禁品检测,可以提高检测准确性。公共视角特征是由两个不同视角公共作用得到的,利用公共视角特征进行违禁品检测,可以提高检测识别能力。

Description

违禁品检测方法、装置及电子设备
技术领域
本发明涉及安检技术领域,尤其涉及一种违禁品检测方法、装置及电子设备。
背景技术
随着人们对安全要求的提高,在地铁、海关、港口等场所一般会配备X射线安检机,以检测出包裹中的危险或者禁止携带入内的物品。
相关技术中,可以基于单视角进行X射线违禁品检测。但是,根据X射线投射的原理,单视角图像只能显示一个视角的映射,致使有些违禁品产生较严重的变化。如一把水平放置的刀,在垂直的视角看,显示的是刀,但在水平角度看,可能就是一条线。因此单视角映射具有一定的局限性,致使X射线违禁品检测质量较差。
发明内容
本发明提供了一种违禁品检测方法、装置及电子设备,以提高X射线违禁品检测质量。
根据本发明的一方面,提供了一种违禁品检测方法,包括:
获取目标包裹的第一视角图像和第二视角图像;
计算第一视角图像和第二视角图像之间的相似度;
若相似度大于或等于预设的相似度阈值,则确定第一视角特征和第二视角特征之间的公共视角特征,并采用所述公共视角特征、第一视角特征和第二视角特征,对目标包裹进行违禁品检测;
其中,所述第一视角特征通过对所述第一视角图像进行特征提取得到,所述第二视角特征通过对所述第二视角图像进行特征提取得到。
根据本发明的另一方面,提供了一种违禁品检测装置,包括:
获取单元,用于获取目标包裹的第一视角图像和第二视角图像;
匹配单元,用于计算第一视角图像和第二视角图像之间的相似度;
检测单元,用于若相似度大于或等于预设的相似度阈值,则确定第一视角特征和第二视角特征之间的公共视角特征,并采用所述公共视角特征、第一视角特征和第二视角特征,对目标包裹进行违禁品检测;
其中,所述第一视角特征通过对所述第一视角图像进行特征提取得到,所述第二视角特征通过对所述第二视角图像进行特征提取得到。
根据本发明的另一方面,提供了一种电子设备,所述电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例所述的违禁品检测方法。
根据本发明的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本发明任一实施例所述的违禁品检测方法。
本发明实施例的技术方案,一方面,通过对第一视角图像和第二视角图像进行相似度匹配,利用相似度较大的第一视角图像和第二视角图像进行特征融合得到的融合特征进行违禁品检测,可以提高检测准确性。另一方面,可以提取第一视角特征和第二视角特征的公共视角特征,公共视角特征是由两个不同视角公共作用得到的,因此利用公共视角特征进行违禁品检测,可以提高检测识别能力。
应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例一提供的一种违禁品检测方法的流程图;
图2是根据本发明实施例二提供的一种违禁品检测方法的流程图;
图3是根据本发明实施例三提供的一种违禁品检测方法的原理图;
图4是根据本发明实施例三提供的一种X射线双光源设置位置示意图;
图5是根据本发明实施例四提供的一种违禁品检测装置的结构示意图;
图6是实现本发明实施例的违禁品检测方法的电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“目标”、“原始”、“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例一
图1是根据本发明实施例一提供的一种违禁品检测方法的流程图,本实施例可适用于违禁品检测场景,该方法可以由电子设备来执行。如图1所示,该方法包括:
步骤101,获取目标包裹的第一视角图像和第二视角图像。
第一视角图像和第二视角图像是目标包裹通过不同视角获取的图像。第一视角和第二视角的视角方向不同,本申请对第一视角和第二视角的视角方向不做限制。第一视角图像和第二视角图像可以为X光图像。
步骤102,计算第一视角图像和第二视角图像之间的相似度。
具体的,计算相似度的方法包括如下至少一种:欧氏距离、余弦相似度、杰卡德(Jaccard)相似度、基于深度学习的图像相似度计算方法等。其中,欧氏距离是计算两个向量之间的距离的一种方法,可以用于计算两张图像的相似度;余弦相似度是通过计算两个向量的夹角余弦值来判断它们的相似程度;Jaccard相似度是根据两张图像共同出现的像素点数量和总像素数量的比例来计算相似度。基于深度学习的图像相似度计算方法,如使用卷积神经网络(CNN)进行特征提取和匹配,以及使用循环神经网络(RNN)对序列数据进行处理等方法。
步骤103,若相似度大于或等于预设的相似度阈值,则确定第一视角特征和第二视角特征之间的公共视角特征,并采用公共视角特征、第一视角特征和第二视角特征,对目标包裹进行违禁品检测;其中,第一视角特征通过对第一视角图像进行特征提取得到,第二视角特征通过对第二视角图像进行特征提取得到。
具体的,可以将第一视角图像和第二视角图像之间的相似度与预先设置的相似度阈值进行比对,若相似度大于或等于预先设置的相似度阈值,则可以确定第一视角图像和第二视角图像较为相似,两张图像较为相似时进行两张图像的特征融合得到融合特征,利用该融合特征对目标包裹进行违禁品检测得到的检测结果更为准确。因此,若确定相似度大于或等于预先设置的相似度阈值,则可以提取第一视角特征和第二视角特征之间公共作用的公共视角特征,公共视角特征是由两个不同视角公共作用得到的,并采用公共视角特征、第一视角特征和第二视角特征,对目标包裹进行违禁品检测。
本发明实施例提供的技术方案,一方面,通过对第一视角图像和第二视角图像进行相似度匹配,利用相似度较大的第一视角图像和第二视角图像进行特征融合得到的融合特征进行违禁品检测,可以提高检测准确性。另一方面,可以提取第一视角特征和第二视角特征的公共视角特征,公共视角特征是由两个不同视角公共作用得到的,因此利用公共视角特征进行违禁品检测,可以提高检测识别能力。
实施例二
图2是根据本发明实施例二提供的一种违禁品检测方法的流程图,本实施例细化了实施例一中的步骤102和步骤103,并增加了若相似度小于相似度阈值的特征。如图2所示,该方法包括:
步骤201,获取目标包裹的第一视角图像和第二视角图像。
在一种可实现方式中,第一视角和第二视角之间的夹角为锐角。
为了保证违禁品检测质量,可以设置第一视角和第二视角之间的夹角为锐角。
步骤202,对第一视角图像进行特征提取得到第一视角特征,并对第二视角图像进行特征提取得到第二视角特征。
具体的,可以利用深度学习方法对第一视角图像进行特征提取得到第一视角特征,并对第二视角图像进行特征提取得到第二视角特征。其中,深度学习方法例如使用卷积神经网络进行特征提取。
步骤203,对第一视角特征做全卷积操作,得到第一局部信息特征图;并对第一视角特征做多头注意力操作,得到第一全局信息特征图;对第二视角特征做全卷积操作,得到第二局部信息特征图;并对第二视角特征做多头注意力操作,得到第二全局信息特征图。
对第一视角特征做全卷积操作,得到具有局部信息的感兴趣特征图,即第一局部信息特征图,并对第一视角特征做多头注意力操作,得到的第一全局信息特征图具有上下文语义相关的特征向量。
同理,对第二视角特征做全卷积操作,得到具有局部信息的感兴趣特征图,即第二局部信息特征图,并对第二视角特征做多头注意力操作,得到的第二全局信息特征图具有上下文语义相关的特征向量。
步骤204,根据第一局部信息特征图、第一全局信息特征图、第二局部信息特征图以及第二全局信息特征图,确定第一视角图像和第二视角图像之间的相似度。
可以根据第一局部信息特征图、第一全局信息特征图、第二局部信息特征图以及第二全局信息特征图,确定第一视角图像和第二视角图像之间的相似度。对第一视角图像和第二视角图像分别在局部和全局特征层面进行比较,可以提高相似度计算的准确性。
具体的,步骤204之后可以执行步骤205,或者步骤207。
步骤205,若相似度大于或等于预设的相似度阈值,则对第一视角特征和第二视角特征进行点乘,得到公共视角特征;并对第一视角特征和第二视角特征进行求和,得到原始视角特征。
将不同视角的特征图进行点乘得到的特征图,即公共视角特征,是由两个不同视角共同作用得到的,在反向传输时,受到不同视角的影响,导致对本视角得到的残损或因角度问题的目标识别具有较高的识别能力。
将不同视角的特征图进行相加,可以保留视角原始信息,得到的原始视角特征具有相对独立性,在反向传输时,互不干扰。
在一种可实现方式中,根据预设的图像模板,对第一视角图像进行图像转换处理,得到第一转换图像;并对第二视角图像进行图像转换处理,得到第二转换图像。
其中,预设的图像模板具有预先设置的图像视角以及图像尺寸等。可以根据坐标转换算法,利用训练图像集,预先训练一个转换模型,转换模型可以将待处理图像处理成预设的图像模板样式。利用该转换模型对第一视角图像进行图像转换处理,得到第一转换图像,并对第二视角图像进行图像转换处理,得到第二转换图像。
对第一转换图像进行特征提取,得到第一视角特征;并对第二转换图像进行特征提取,得到第二视角特征。
具体的,可以利用深度学习方法对第一转换图像进行特征提取得到第一视角特征,并对第二转换图像进行特征提取得到第二视角特征。其中,深度学习方法例如使用卷积神经网络进行特征提取。
先根据预设的图像模板将第一视角图像处理为第一转换图像,并将第二视角图像处理为第二转换图像,再根据第一转换图像和第二转换图像进行特征提取以及特征融合,利于特征融合,并可以提高根据融合特征进行目标包裹违禁品检测的识别能力和检测准确性。
在一种可实现方式中,预设的图像模板根据第一视角和第二视角之间的辅助视角确定。
可以将第一视角和第二视角的角平分线上的视角作为第一视角和第二视角之间的辅助视角。可以预先设置图像模板的视角为该辅助视角。将辅助视角作为图像模板的视角,有助于第一转换图像和第二转换图像的特征融合,进而可以提高根据融合特征进行目标包裹违禁品检测的识别能力和检测准确性。具体的,该辅助视角可以为第一视角和第二视角之间的中间视角。
步骤206,叠加公共视角特征和原始视角特征,得到叠加后的特征;并采用叠加后的特征对目标包裹进行违禁品检测。
叠加后的特征即具有两个不同视角共同作用的特征,又具有原视角的原始信息,因此利用叠加后的特征对目标包裹进行违禁品检测可以提高检测识别能力。
步骤207,若相似度小于相似度阈值,则根据第一视角特征确定目标包裹的第一预测结果,并根据第二视角特征确定目标包裹的第二预测结果。
其中,预测结果可以包括违禁品框、违禁品框的坐标以及违禁品种类。
具体的,可以利用检测头对第一视角特征进行处理,确定目标包裹的第一预测结果。利用检测头对第二视角特征进行处理,确定目标包裹的第二预测结果。
步骤208,根据第一预测结果和第二预测结果,确定目标包裹的违禁品检测结果。
具体的,可以将第一预测结果和第二预测结果之间的合集中去掉重复的违禁品目标,得到目标包裹的违禁品检测结果。
在一种可实现方式中,根据预设的图像模板,对第一预测结果进行转换处理,得到第一转换结果;并对第二预测结果进行转换处理,得到第二转换结果。
具体的,可以利用预设的图像模板,对第一预测结果包括的违禁品框进行坐标转换,得到第一转换结果,并对第二预测结果包括的违禁品框进行坐标转换,得到第二转换结果。
根据第一转换结果和第二转换结果,确定目标包裹的违禁品检测结果。
具体的,可以将第一转换结果和第二转换结果之间的合集中去掉重复的违禁品目标,得到目标包裹的违禁品检测结果。
先将第一预测结果和第二预测结果进行转换处理,转换到同一图像模板下,得到第一转换结果和第二转换结果,再利用第一转换结果和第二转换结果,确定目标包裹的违禁品检测结果,可以提高检测的准确性。
若确定第一视角图像和第二视角图像之间的相似度小于相似度阈值,则表明第一视角图像和第二视角图像之间的相似度较低,在相似度较低时,使用特征融合的方法对目标包裹进行违禁品检测的检测准确性较低。因此,本方案在相似度较低时,根据第一视角图像和第二视角图像分别进行目标包裹的违禁品检测,再结合两个预测结果,确定目标包裹的违禁品检测结果,可以提高检测准确性。
实施例三
本申请还针对X射线安检机具体提供了一种违禁品检测方法。图3是根据本发明实施例三提供的一种违禁品检测方法的原理图。参考图3,首先,将光源1的图像和光源2的图像通过特征匹配的方式进行相似度判断。如果两张图像相似度大于或等于相似度阈值,该阈值比如可以设置为0.6,将Img1和Img2这两张图像进行坐标转换处理,将图像转换到图像模板,将两张图像输入主干网络(backbone)进行特征提取,对主干网络输出的特征图分别做相加(Add)和点乘(Dot)操作,通过concat拼接,然后通过检测头(Det),得到候选框,对候选框做非极大值抑制(Non-Maximum Suppression,NMS)处理,得到预测目标,将预测目标分别采用坐标转换方法,映射回对应的图像中;否则,两张图像进行常规检测,将检测结果通过坐标转换,分别映射到光源1和光源2的X射线图像中,然后在各自图像中做NMS操作。
该方法具体过程如下:
(1)获取目标包裹的第一视角图像和第二视角图像。
具体的,可以预先设置两个光源的位置,通过这两个光源获取目标包裹的第一视角图像和第二视角图像。两个光源射出的延长线的夹角不能超过90度,参考图4,A表示光源1,B表示光源2,∠ACB为两个光源射出的延长线的夹角。
(2)将第一视角图像和第二视角图像进行特征匹配,即计算第一视角图像和第二视角图像之间的相似度。
首先,分别对第一视角图像和第二视角图像进行特征提取,对提取的特征分别做全卷积操作和多头注意力操作,公式如下所示:
(1)
(2)
其中,表示图像通过主干网络提取的特征;FCN表示全卷积操作;表示对提取的特征做全卷积操作得到的特征值;Transformer表示多头注意力操作;/>表示对提取的特征做多头注意力操作得到的特征值。
公式(1)对主干网络输出的特征图进行全卷积操作,得到具有局部信息的感兴趣特征图。
公式(2)对主干网络进行多头注意力操作,得到的特征图具有上下文语义相关的特征向量。
特征匹配公式如下所示:
(3)
其中,表示目标包裹的第一视角图像和第二视角图像之间的相似度值;/>为参数;/>为参数;/>表示对第一视角图像提取的特征做全卷积操作得到的特征值;表示对第二视角图像提取的特征做全卷积操作得到的特征值;表示对第一视角图像提取的特征做多头注意力操作得到的特征值;表示对第二视角图像提取的特征做多头注意力操作得到的特征值。
公式(3)分别在局部和全局特征层面进行比较,从公式和实验上得出,同一个包裹在相差角度在90°以内,角度越近,全局特征值越大,但由于违禁品摆放角度问题,可能存在局部特征差异大,因此本方案在全局特征值的基础上增加局部特征值差异比较。
(3)对相似性进行比较,如果相似性大于等于相似度阈值,从而实现特征融合进行违禁品检测方法,否则采用目标特征融合方法。
(4)当相似性小于相似度阈值时,可以利用预先训练好的检测模型进行检测,具体处理方式为:
1)将第一视角图像和第二视角图像进行尺度缩放,缩放到预设的模版图像尺寸,具体缩放方法如下:首先进行白边补充,与图像模板保持相同的尺寸比例,最后对图像进行缩放。
2)将第一视角图像和第二视角图像分别输入到主干网络以及检测头,得到候选目标。
3)利用预先训练的坐标转换模型对两个视角的候选目标进行处理,得到对应的图像的违禁品坐标。
具体的,可以在第一视角和第二视角的基础上增加辅助视角,并对这三种视角进行关键点标注。其中,辅助视角一般选择的是第一视角和第二视角之间的角平分线上的视角,参考图4,本方案以俯视视角为例。可以分别训练4个坐标转换模型,包括第一视角和俯视视角之间的坐标转换模型;第二视角和俯视视角之间的坐标转换模型,俯视视角和第一视角之间的坐标转换模型以及俯视视角和第二视角之间的坐标转换模型。
坐标转换模型的具体训练方法如下所示:
首先,对图像进行补充白边操作,其原因为X射线图像的空白部分为白色;
然后,待转换X射线图像和目标保持图像尺寸比例一致,对图像进行缩放和关键点的坐标转换;
接着对图像进行编码,依据编码的特征点对图像进行解码,得到转换后的图像的坐标;
最后,依据转换后关键点坐标和俯视角图像关键点坐标进行比较,计算关键点坐标损失,公式如下式所示:
(4)
其中,表示第i张图像转换后的关键点坐标;/>表示第i张图像的目标关键点坐标;/>表示图像转换后的关键点坐标和目标关键点坐标之间的关键点坐标损失;M表示图像数量。
4)对违禁品坐标做NMS处理,得到辅助视角X射线图像中的目标违禁品和相应的坐标。
5)利用坐标转换模型对辅助视角X射线图像进行处理,将辅助视角违禁品坐标重新映射到第一视角和第二视角的X射线图像上。
(5)当相似性大于或等于相似度阈值时,可以利用预先训练好的检测模型进行检测,具体处理方式为:
1)利用坐标转换模型对同一包裹的第一视角图像和第二视角图像分别进行处理,得到第一转换图像和第二转换图像。
2)将第一转换图像和第二转换图像尺度缩放至预设尺寸。
3)将第一转换图像和第二转换图像分别输入相同的主干网络,得到主干网络特征图。
4)将不同视角的特征图分别做相加和点乘操作,如公式(5),(6):
(5)
(6)
(7)
(8)
(9)
(10)
其中,和/>分别表示同一包裹的第一视角图像的第一视角特征图和第二视角图像的第二视角特征图;/>表示将第一视角特征图和第二视角特征图相加之后的值;/>表示将第一视角特征图和第二视角特征图点乘之后的值。
公式(5)将不同视角的特征图进行相加,保留视角原始信息,得到的特征图具有相对独立性,在反向传播时,互不干扰。
公式(6)将不同视角的特征图进行点乘,得到特征图是由两个不同视角共同作用得到的,在反向传播时,受到不同视角的影响,导致目标检测模型对本视角得到的残损或因角度问题的目标具有较高的识别能力。
5)将公式(5),(6)得到的特征图通过维度进行叠加,得到既具有目标本视角的特征信息,又具有不同视角的特征信息,加大模型对非违禁品和违禁品的学习,提高模型的鲁棒性和准确率。
6)将叠加的特征图输入到检测头,进行预测,得到检测结果。
具体的,检测模型的训练过程如下所示:
1)训练集采样器修改:修改目前训练集图像采样的采样器,实现一次采样,分别提取同一包裹两个不同视角的图像,一次训练提取的图像为2N,N表示包裹的数量。其中,同一包裹两个不同视角的图像可以分别称为第一视角图像和第二视角图像。
2)计算两张图像之间的相似度。
计算相似度的公式如下所示:
(11)
其中,表示第i个包裹的图像和第j个包裹的图像之间的相似度值;/>为参数;/>为参数;/>表示对第i个包裹的图像的提取的特征做全卷积操作得到的特征值;/>对第j个包裹的图像的提取的特征做全卷积操作得到的特征值;表示对第i个包裹的图像的提取的特征做多头注意力操作得到的特征值;表示对第j个包裹的图像的提取的特征做多头注意力操作得到的特征值;N表示包裹的总数量。
公式(11)表示匹配算法的损失计算,分别在局部特征和全局序列进行监督,使匹配算法在实例和语义两种不同特征进行匹配。
3)若相似度大于或等于预设的相似度阈值,表明两张图像为同一包裹的不同视角图像,即第一视角图像和第二视角图像,则继续执行如下步骤。
4)利用坐标转换模型对同一包裹的第一视角图像和第二视角图像进行处理,得到图像角度变换后的图像,即第一转换图像和第二转换图像。
5)将第一转换图像和第二转换图像进行尺度缩放,至预设尺寸。
6)将第一转换图像和第二转换图像分别输入相同的主干网络,得到主干网络特征图。
7)将不同视角图像的特征图分别做相加和点乘操作,通过维度进行叠加,得到既具有目标本视角的特征信息,又具有不同视角的特征信息,加大模型对非违禁品和违禁品的学习,提高模型的鲁棒性和准确率。
8)将叠加的特征图输入到检测头,进行预测。
9)将违禁品的预测结果与转换后的标注目标进行损失计算,如公式(12),公式(13):
(12)
(13)
其中,表示第一视角的目标坐标转换后的值;/>表示第二视角的目标坐标转换后的值;/>表示转换后的标注目标;/>表示违禁品的预测结果即检测头的结果;/>表示违禁品的预测结果与转换后的标注目标之间的总损失;/>表示违禁品的预测结果与转换后的标注目标之间的类别损失;/>表示违禁品的预测结果与转换后的标注目标之间的检测框损失。
公式(12)将不同视角的目标进行坐标转换,然后进行IOU操作,对重叠的违禁品目标进行删除,对没有重叠的违禁品目标进行保留。
公式(13)将检测头的结果与公式(12)处理后的结果在类别和检测框做损失,然后反向传播。
10)重复上述操作,直至达到收敛条件,模型停止训练。
本方案具有如下优点:
1)设置两个射线光源,可以弥补单视角映射图像的缺陷。
2)在全局和局部特征进行图像匹配,既可以得到整张图像上下文的相似性,又可以得到像素间明显分界性相似性。
3)对相似性比较高的图像进行语义特征融合操作,通过设计检测模型,在检测模型中增加坐标转换,将两个图像缩放到对应的角度上,实现两个光源图像进行特征融合,进一步实现违禁品的坐标重新映射到两张图像上,从而提高检测准确性。
4)对相似性比较差的图像进行目标融合操作,将图像分别输入到两个检测模型,得到检测结果,将检测结果通过坐标转换,分别映射到两个不同光源生成的X射线图像上,最终弥补了单视角图像映射缺陷,从而提高检测准确性。
实施例四
图5是根据本发明实施例四提供的一种违禁品检测装置的结构示意图。如图5所示,该装置500包括:
获取单元510,用于获取目标包裹的第一视角图像和第二视角图像;
匹配单元520,用于计算第一视角图像和第二视角图像之间的相似度;
检测单元530,用于若相似度大于或等于预设的相似度阈值,则确定第一视角特征和第二视角特征之间的公共视角特征,并采用公共视角特征、第一视角特征和第二视角特征,对目标包裹进行违禁品检测;
其中,第一视角特征通过对第一视角图像进行特征提取得到,第二视角特征通过对第二视角图像进行特征提取得到。
检测单元530,具体用于对第一视角特征和第二视角特征进行点乘,得到公共视角特征;
对第一视角特征和第二视角特征进行求和,得到原始视角特征;
叠加公共视角特征和原始视角特征,得到叠加后的特征;并采用叠加后的特征对目标包裹进行违禁品检测。
检测单元530,具体用于根据预设的图像模板,对第一视角图像进行图像转换处理,得到第一转换图像;并对第二视角图像进行图像转换处理,得到第二转换图像;
对第一转换图像进行特征提取,得到第一视角特征;并对第二转换图像进行特征提取,得到第二视角特征。
在一种可实现方式中,预设的图像模板根据第一视角和第二视角之间的辅助视角确定。
检测单元530,还用于若相似度小于相似度阈值,则根据第一视角特征确定目标包裹的第一预测结果,并根据第二视角特征确定目标包裹的第二预测结果;
根据第一预测结果和第二预测结果,确定目标包裹的违禁品检测结果。
检测单元530,具体用于根据预设的图像模板,对第一预测结果进行转换处理,得到第一转换结果;并对第二预测结果进行转换处理,得到第二转换结果;
根据第一转换结果和第二转换结果,确定目标包裹的违禁品检测结果。
匹配单元520,具体用于对第一视角图像进行特征提取得到第一视角特征,并对第二视角图像进行特征提取得到第二视角特征;
对第一视角特征做全卷积操作,得到第一局部信息特征图;并对第一视角特征做多头注意力操作,得到第一全局信息特征图;
对第二视角特征做全卷积操作,得到第二局部信息特征图;并对第二视角特征做多头注意力操作,得到第二全局信息特征图;
根据第一局部信息特征图、第一全局信息特征图、第二局部信息特征图以及第二全局信息特征图,确定第一视角图像和第二视角图像之间的相似度。
在一种可实现方式中,第一视角和第二视角之间的夹角为锐角。
本发明实施例所提供的违禁品检测装置可执行本发明任意实施例所提供的违禁品检测方法,具备执行违禁品检测方法相应的功能模块和有益效果。
实施例五
图6示出了可以用来实施本发明的实施例的电子设备10的结构示意图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本发明的实现。
如图6所示,电子设备10包括至少一个处理器11,以及与至少一个处理器11通信连接的存储器,如只读存储器(ROM)12、随机访问存储器(RAM)13等,其中,存储器存储有可被至少一个处理器执行的计算机程序,处理器11可以根据存储在只读存储器(ROM)12中的计算机程序或者从存储单元18加载到随机访问存储器(RAM)13中的计算机程序,来执行各种适当的动作和处理。在RAM 13中,还可存储电子设备10操作所需的各种程序和数据。处理器11、ROM 12以及RAM 13通过总线14彼此相连。输入/输出(I/O)接口15也连接至总线14。
电子设备10中的多个部件连接至I/O接口15,包括:输入单元16,例如键盘、鼠标等;输出单元17,例如各种类型的显示器、扬声器等;存储单元18,例如磁盘、光盘等;以及通信单元19,例如网卡、调制解调器、无线通信收发机等。通信单元19允许电子设备10通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
处理器11可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器11的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。处理器11执行上文所描述的各个方法和处理,例如违禁品检测方法。
在一些实施例中,上述任一种违禁品检测方法可被实现为计算机程序,其被有形地包含于计算机可读存储介质,例如存储单元18。在一些实施例中,计算机程序的部分或者全部可以经由ROM 12和/或通信单元19而被载入和/或安装到电子设备10上。当计算机程序加载到RAM 13并由处理器11执行时,可以执行上文描述的任一种违禁品检测方法的一个或多个步骤。备选地,在其他实施例中,处理器11可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行上述任一种违禁品检测方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本发明的方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本发明的上下文中,计算机可读存储介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。备选地,计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在电子设备上实施此处描述的系统和技术,该电子设备具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、区块链网络和互联网。
计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务中,存在的管理难度大,业务扩展性弱的缺陷。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发明中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本发明的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

Claims (10)

1.一种违禁品检测方法,其特征在于,包括:
获取目标包裹的第一视角图像和第二视角图像;
计算第一视角图像和第二视角图像之间的相似度;
若相似度大于或等于预设的相似度阈值,则确定第一视角特征和第二视角特征之间的公共视角特征,并采用所述公共视角特征、第一视角特征和第二视角特征,对目标包裹进行违禁品检测;
其中,所述第一视角特征通过对所述第一视角图像进行特征提取得到,所述第二视角特征通过对所述第二视角图像进行特征提取得到;
所述计算第一视角图像和第二视角图像之间的相似度,包括:
对所述第一视角特征做全卷积操作,得到第一局部信息特征图;并对所述第一视角特征做多头注意力操作,得到第一全局信息特征图;
对第二视角特征做全卷积操作,得到第二局部信息特征图;并对第二视角特征做多头注意力操作,得到第二全局信息特征图;
根据第一局部信息特征图、第一全局信息特征图、第二局部信息特征图以及第二全局信息特征图,确定第一视角图像和第二视角图像之间的相似度。
2.根据权利要求1所述的方法,其特征在于,所述确定第一视角特征和第二视角特征之间的公共视角特征,并采用所述公共视角特征、第一视角特征和第二视角特征,对目标包裹进行违禁品检测,包括:
对所述第一视角特征和所述第二视角特征进行点乘,得到公共视角特征;
对所述第一视角特征和所述第二视角特征进行求和,得到原始视角特征;
叠加公共视角特征和原始视角特征,得到叠加后的特征;并采用叠加后的特征对目标包裹进行违禁品检测。
3.根据权利要求1所述的方法,其特征在于,所述第一视角特征通过对所述第一视角图像进行特征提取得到,所述第二视角特征通过对所述第二视角图像进行特征提取得到,包括:
根据预设的图像模板,对第一视角图像进行图像转换处理,得到第一转换图像;并对第二视角图像进行图像转换处理,得到第二转换图像;
对第一转换图像进行特征提取,得到第一视角特征;并对第二转换图像进行特征提取,得到第二视角特征。
4.根据权利要求3所述的方法,其特征在于,所述预设的图像模板根据第一视角和第二视角之间的辅助视角确定。
5.根据权利要求1所述的方法,其特征在于,还包括:
若相似度小于相似度阈值,则根据第一视角特征确定目标包裹的第一预测结果,并根据第二视角特征确定目标包裹的第二预测结果;
根据第一预测结果和第二预测结果,确定目标包裹的违禁品检测结果。
6.根据权利要求5所述的方法,其特征在于,所述根据第一预测结果和第二预测结果,确定目标包裹的违禁品检测结果,包括:
根据预设的图像模板,对第一预测结果进行转换处理,得到第一转换结果;并对第二预测结果进行转换处理,得到第二转换结果;
根据第一转换结果和第二转换结果,确定目标包裹的违禁品检测结果。
7.根据权利要求1所述的方法,其特征在于,第一视角和第二视角之间的夹角为锐角。
8.一种违禁品检测装置,其特征在于,包括:
获取单元,用于获取目标包裹的第一视角图像和第二视角图像;
匹配单元,用于计算第一视角图像和第二视角图像之间的相似度;
检测单元,用于若相似度大于或等于预设的相似度阈值,则确定第一视角特征和第二视角特征之间的公共视角特征,并采用所述公共视角特征、第一视角特征和第二视角特征,对目标包裹进行违禁品检测;
其中,所述第一视角特征通过对所述第一视角图像进行特征提取得到,所述第二视角特征通过对所述第二视角图像进行特征提取得到;
所述匹配单元,具体用于对所述第一视角特征做全卷积操作,得到第一局部信息特征图;并对所述第一视角特征做多头注意力操作,得到第一全局信息特征图;
对第二视角特征做全卷积操作,得到第二局部信息特征图;并对第二视角特征做多头注意力操作,得到第二全局信息特征图;
根据第一局部信息特征图、第一全局信息特征图、第二局部信息特征图以及第二全局信息特征图,确定第一视角图像和第二视角图像之间的相似度。
9.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7中任一项所述的一种违禁品检测方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求1-7中任一项所述的一种违禁品检测方法。
CN202311764986.5A 2023-12-21 2023-12-21 违禁品检测方法、装置及电子设备 Active CN117437624B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311764986.5A CN117437624B (zh) 2023-12-21 2023-12-21 违禁品检测方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311764986.5A CN117437624B (zh) 2023-12-21 2023-12-21 违禁品检测方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN117437624A CN117437624A (zh) 2024-01-23
CN117437624B true CN117437624B (zh) 2024-03-08

Family

ID=89558639

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311764986.5A Active CN117437624B (zh) 2023-12-21 2023-12-21 违禁品检测方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN117437624B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0852717B1 (en) * 1995-09-26 2003-08-27 L-3 Communications Security & Detection Systems Corporation Delaware Detecting contraband by employing interactive multiprobe tomography
EP1766549A2 (en) * 2004-05-28 2007-03-28 Itt Manufacturing Enterprises, Inc. Method and apparatus for recognizing an object within an image
CN105784733A (zh) * 2015-01-26 2016-07-20 公安部第研究所 一种通道式双视角x射线安全检查装置
CN112215266A (zh) * 2020-09-25 2021-01-12 华东师范大学 一种基于小样本学习的x光图像违禁物品检测方法
CN113344946A (zh) * 2021-05-31 2021-09-03 北京邮电大学 基于机器学习的安检图像违禁品检测方法、装置及介质
CN116385957A (zh) * 2023-03-06 2023-07-04 中国科学院重庆绿色智能技术研究院 一种x光图像违禁品检测方法、装置、设备及介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10643332B2 (en) * 2018-03-29 2020-05-05 Uveye Ltd. Method of vehicle image comparison and system thereof

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0852717B1 (en) * 1995-09-26 2003-08-27 L-3 Communications Security & Detection Systems Corporation Delaware Detecting contraband by employing interactive multiprobe tomography
EP1766549A2 (en) * 2004-05-28 2007-03-28 Itt Manufacturing Enterprises, Inc. Method and apparatus for recognizing an object within an image
CN105784733A (zh) * 2015-01-26 2016-07-20 公安部第研究所 一种通道式双视角x射线安全检查装置
CN112215266A (zh) * 2020-09-25 2021-01-12 华东师范大学 一种基于小样本学习的x光图像违禁物品检测方法
CN113344946A (zh) * 2021-05-31 2021-09-03 北京邮电大学 基于机器学习的安检图像违禁品检测方法、装置及介质
CN116385957A (zh) * 2023-03-06 2023-07-04 中国科学院重庆绿色智能技术研究院 一种x光图像违禁品检测方法、装置、设备及介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
X射线安检设备中探测技术研究;孙丽娜;原培新;;中国测试技术;20060530(03);全文 *
基于SIFT特征和ISM的X射线图像危险品检测方法;王华君;惠晶;;计算机测量与控制;20180125(01);全文 *

Also Published As

Publication number Publication date
CN117437624A (zh) 2024-01-23

Similar Documents

Publication Publication Date Title
CN113657390B (zh) 文本检测模型的训练方法和检测文本方法、装置和设备
CN114550177B (zh) 图像处理的方法、文本识别方法及装置
CN113971751A (zh) 训练特征提取模型、检测相似图像的方法和装置
WO2022227770A1 (zh) 目标对象检测模型的训练方法、目标对象检测方法和设备
EP3734496A1 (en) Image analysis method and apparatus, and electronic device and readable storage medium
CN113205041B (zh) 结构化信息提取方法、装置、设备和存储介质
CN113591566A (zh) 图像识别模型的训练方法、装置、电子设备和存储介质
CN113378712B (zh) 物体检测模型的训练方法、图像检测方法及其装置
CN115861462B (zh) 图像生成模型的训练方法、装置、电子设备及存储介质
CN113780098A (zh) 文字识别方法、装置、电子设备以及存储介质
KR20220153088A (ko) 비디오 태그 추천 모델의 트레이닝 방법 및 비디오 태그 확정 방법
CN112580666A (zh) 图像特征的提取方法、训练方法、装置、电子设备及介质
CN114511743B (zh) 检测模型训练、目标检测方法、装置、设备、介质及产品
US20230245429A1 (en) Method and apparatus for training lane line detection model, electronic device and storage medium
CN117437624B (zh) 违禁品检测方法、装置及电子设备
CN114187488B (zh) 图像处理方法、装置、设备、介质
CN114220163B (zh) 人体姿态估计方法、装置、电子设备及存储介质
US11610396B2 (en) Logo picture processing method, apparatus, device and medium
CN115457365A (zh) 一种模型的解释方法、装置、电子设备及存储介质
CN113936158A (zh) 一种标签匹配方法及装置
CN114093006A (zh) 活体人脸检测模型的训练方法、装置、设备以及存储介质
CN113903071A (zh) 人脸识别方法、装置、电子设备和存储介质
CN113139486A (zh) 用于处理图像的方法、装置、设备以及存储介质
CN111862030A (zh) 一种人脸合成图检测方法、装置、电子设备及存储介质
CN114863473B (zh) 一种人体关键点检测方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant