CN113312970A - 目标物体识别方法、装置、计算机设备和存储介质 - Google Patents
目标物体识别方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN113312970A CN113312970A CN202110451132.6A CN202110451132A CN113312970A CN 113312970 A CN113312970 A CN 113312970A CN 202110451132 A CN202110451132 A CN 202110451132A CN 113312970 A CN113312970 A CN 113312970A
- Authority
- CN
- China
- Prior art keywords
- target object
- target
- dimensional
- dimensional image
- position information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T15/00—3D [Three Dimensional] image rendering
- G06T15/005—General purpose rendering architectures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T17/00—Three dimensional [3D] modelling, e.g. data description of 3D objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computer Graphics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Life Sciences & Earth Sciences (AREA)
- Geometry (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
本申请涉及一种目标物体识别方法、装置、计算机设备和存储介质。所述方法包括:获取扫描数据;根据所述扫描数据进行三维重建得到目标三维图像;将所述目标三维图像输入至三维目标检测算法模型进行检测,得到所述目标物体的位置信息及所述目标物体的类别;所述三维目标检测算法模型用于根据输入的所述目标三维图像标记出所述目标物体并输出所述目标物体的类别。采用本方法能够结合目标物体的三维特征,得到目标物体的位置信息及类别,使得识别准确度不受待测物体之间相互遮挡问题的影响,并且对于根据物质材料特性不易区分的待测物体也能够准确地识别。
Description
技术领域
本申请涉及目标检测技术领域,特别是涉及一种目标物体识别方法、装置、计算机设备和存储介质。
背景技术
近年来,3D成像在工业和消费者应用中变得重要,技术人员利用3D成像技术研发出三维扫描仪、3D相机等设备广泛应用于各行各业。其中,安检CT(Computed Tomography,电子计算机断层扫描)的3D成像广泛应用于机场的航空安全检查。
传统安检领域中,对包裹中违禁品识别主要靠基于2D图像的DR(Digitalradiography,数字X线摄影)设备;即使是使用三维的CT设备,在物质识别时主要是靠计算物质的电子密度和有效原子序数来进行的。
然而,基于2D图像的违禁品识别存在被扫描行李物品之间相互遮挡问题,对操作员通过投影图像来发现违禁物品(如液体,枪支,刀具等)造成一定影响;使用三维的CT设备时,对于根据物质材料特性不易区分的违禁物品,如刀、枪,需要依靠人工对三维图像进行缩放、旋转或颜色变换等操作进行辅助判别,其准确性容易受到操作员工作状态的影响。
发明内容
基于此,有必要针对上述技术问题,提供一种能够自行判别目标物体的位置信息和类别的目标物体识别方法、装置、计算机设备和存储介质。
为了实现上述目的,一方面,本申请提供了一种目标物体识别方法,所述方法包括:
获取扫描数据;
根据所述扫描数据进行三维重建得到目标三维图像;
将所述目标三维图像输入至三维目标检测算法模型进行检测,得到所述目标物体的位置信息及所述目标物体的类别;所述三维目标检测算法模型用于根据输入的所述目标三维图像标记出所述目标物体并输出所述目标物体的类别。
在其中一个实施例中,所述将所述目标三维图像输入至三维目标检测算法模型进行检测,得到所述目标物体的位置信息及所述目标物体的类别,包括:
将所述目标三维图像输入至三维目标检测算法模型,提取多尺度特征;
对所述多尺度特征分别进行处理,得到所述目标物体的位置信息及所述目标物体的类别。
在其中一个实施例中,所述将所述目标三维图像输入至三维目标检测算法模型,提取多尺度特征,包括:
对所述目标三维图像依次进行预设层数的下采样处理得到多个第一特征;
获取最后一层下采样得到的第一特征进行处理得到最后一层对应的第二特征;
对最后一层对应的所述第二特征进行上采样处理得到当前层对应的中间特征;
根据所述中间特征以及对应层数的第一特征计算得到当前层对应的第二特征;
将所述当前层作为上一层,所述下一层作为当前层;
对所述上一层对应的第二特征进行上采样处理得到当前层对应的中间特征,并继续根据所述中间特征以及对应层数的第一特征计算得到当前层对应的第二特征,直至所有的层数处理完成;
将所得到的各个层对应的第二特征作为多尺度特征。
在其中一个实施例中,所述对所述多尺度特征分别进行处理,得到所述目标物体的位置信息及所述目标物体的类别,包括:
基于所述多尺度特征,获取所述目标物体的位置信息,以输出3D预测框及所述目标物体的类别。
本申请还提供了一种目标物体识别方法,所述方法包括:
获取扫描数据;
根据上述任一实施例中所述的目标物体识别方法得到目标物体的位置信息及所述目标物体的类别;
根据所述扫描数据确定每个位置的属性信息;
将所述目标物体的位置信息所对应的属性信息与违禁品表进行对比,以确定所述目标物体是否存在违禁品。
上述目标物体识别方法,通过将目标物体的位置信息与违禁品表进行对比,实现目标物体是否为违禁品的自动判别。
在其中一个实施例中,所述根据所述扫描数据进行三维重建得到目标三维图像,包括:
将所述扫描数据转换为对应的数字信号;
对所述数字信号进行处理得到至少一幅二维图像以及每幅二维图像中每个位置的属性信息;
根据所述属性信息对所述二维图像进行渲染得到二维伪色彩图像;
将所得到的二维伪色彩图像进行合并处理得到目标三维图像。
在其中一个实施例中,所述根据所述扫描数据确定每个位置的属性信息,包括:
获取三维重建过程中所得到的每个位置的属性信息。
在其中一个实施例中,所述属性信息包括物质电子密度及有效原子序数。
在其中一个实施例中,所述将所述目标物体的位置信息所对应的属性信息与违禁品表进行对比,以确定所述目标物体是否存在违禁品,包括:
将所述目标物体的位置信息所对应的物质电子密度及有效原子序数,与违禁品表中的物质电子密度及有效原子序数进行对比;
所述将所述目标物体的位置信息所对应的属性信息与违禁品表进行对比,以确定所述目标物体是否存在违禁品之后,还包括:
若目标物体的位置信息所对应的物质电子密度及有效原子序数与所述违禁品表对应,则判定所述目标物体包括违禁品;
若目标物体的位置信息所对应的物质电子密度及有效原子序数与所述违禁品表没有对应,则判定所述目标物体不包括违禁品。
本申请还提供了一种目标物体识别装置,所述目标物体识别装置包括:
扫描模块,用于获取所述目标物体的初始图像;
处理模块,用于根据所述扫描数据进行三维重建得到目标三维图像,得到重建后的目标三维图像,并将所述目标三维图像输入至三维目标检测算法模型进行检测,得到所述目标物体的位置信息及所述目标物体的类别。
本申请还提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一个实施例中所述的方法的步骤。
本申请还提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现上述任一个实施例中所述的方法的步骤。
上述目标物体识别方法、装置、计算机设备和存储介质,通过对目标物体的扫描数据进行三维重建,并将所得的目标三维图像经由三维目标检测算法模型进行检测,在目标物体的识别过程中,能够结合目标物体的三维特征,得到目标物体的位置信息及类别,使得识别准确度不受待测物体之间相互遮挡问题的影响,并且对于根据物质材料特性不易区分的待测物体也能够准确地识别。
附图说明
图1为本申请其中一个实施例中目标物体识别方法的应用环境图;
图2为本申请其中一个实施例中目标物体识别方法的流程示意图;
图3为本申请其中一个实施例中目标物体识别方法的步骤S204的流程示意图;
图4为本申请其中一个实施例中目标物体识别方法的步骤S206的流程示意图;
图5为本申请其中一个实施例中目标物体识别方法的步骤S402的流程示意图;
图6为本申请其中一个实施例中三维目标检测算法模型的结构示意图;
图7为本申请另一个实施例中目标物体识别方法的流程示意图;
图8为本申请再一个实施例中目标物体识别方法的流程示意图。
附图标记说明:
102-扫描设备,104-终端。
具体实施方式
为了便于理解本申请,下面将参照相关附图对本申请进行更全面的描述。附图中给出了本申请的首选实施例。但是,本申请可以以许多不同的形式来实现,并不限于本文所描述的实施例。相反地,提供这些实施例的目的是使对本申请的公开内容更加透彻全面。
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中在本申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请。
本申请提供的目标物体识别方法,可以应用于如图1所示的应用环境中。其中,扫描设备102可以通过网络或硬件与终端104相连接。其中,扫描设备102可以是任意一种成像设备,例如该成像设备可以为CT(Computed Tomography,电子计算机断层扫描);终端104可以包括但不仅限于计算机。具体地,终端104与扫描设备102相连接,以读取扫描设备102扫描得到的扫描数据。
请参阅图2,本申请提供了一种目标物体识别方法,包括以下步骤:
S202:获取扫描数据。
具体地,扫描数据可以是对目标物体进行扫描得到的数字信号。终端可以采用任意一种成像设备对目标物体进行扫描。
可选地,终端在获取到扫描数据后,可以对扫描数据进行预处理,以为后续三维重建奠定基础。
S204:根据扫描数据进行三维重建得到目标三维图像。
具体地,终端在根据扫描数据进行三维重建时,先根据扫描数据得到各个断层的预设类型的二维图像,并基于扫描数据获取该二维图像中每个像素点的属性信息,通过每个像素点的属性信息分别对各个断层的预设类型的二维图像进行渲染,最后将各个断层的渲染后的二维图像合并以得到目标三维图像。
其中,断层可以包括X-Y断层、Y-Z断层以及X-Z断层。可选地,可以分别得到该些断层对应的灰度图,并从扫描数据中获取灰度图中的每个像素点的物质电子密度和有效原子序数,这样可以根据有效原子序数对灰度图进行渲染得到二维伪彩色图像,最后根据二维伪彩色图像合成以得到目标三维图像。
可选地,可以通过调用开源的库函数来根据二维伪彩色图像合成以得到目标三维图像。
S206:将目标三维图像输入至三维目标检测算法模型进行检测,得到目标物体的位置信息及目标物体的类别。
其中,三维目标检测算法模型用于根据输入的目标三维图像标记出目标物体并输出目标物体的类别。
目标物体的位置信息是指目标物体在显示图像中的位置,其可以通过3D预测框的形式进行标注。
目标物体的类别则是预先设定的类别,其可以包括危险品和非危险品,危险品类别下还可以继续划分,危险品类别可以包括但不仅限于管制刀具、爆炸物品、烟火制品、枪支等等。
终端将目标三维图像输入至三维目标检测算法模型中,三维目标检测算法模型提取目标三维图像的多尺度特征,以识别出目标三维图像中存在目标的位置,并通过3D预测框进行标注,同时识别3D预测框中目标物体的类别。
上述目标物体识别方法,通过对目标物体的扫描数据进行三维重建,并将所得的目标三维图像经由三维目标检测算法模型进行检测,在目标物体的识别过程中,能够结合目标物体的三维特征,得到目标物体的位置信息及类别,使得识别准确度不受待测物体之间相互遮挡问题的影响,并且对于根据物质材料特性不易区分的待测物体也能够准确地识别。
在其中一个实施例中,如图3所示,步骤S204可以包括以下步骤:
S302:将扫描数据转换为对应的数字信号。
具体地,扫描数据可以是扫描设备对目标物体进行扫描得到的光信号,扫描设备可以先将扫描得到的光信号转换为电信号,最后转换为数字信号。数字信号可以包括高能和低能数据。
可选地,扫描设备将扫描数据转换为对应的数字信号后,将数字信号发送至终端。
S304:对数字信号进行处理得到至少一幅二维图像以及每幅二维图像中每个位置的属性信息。
具体地,终端在获取到数字信号后,对数字信号进行处理以得到至少一幅二维图像以及每幅二维图像中每个位置的属性信息。
可选地,终端可以在获取到数字信号后,先根据数字信号得到各个断层的预设类型的二维图像,并基于数字信号获取该二维图像中每个像素点的属性信息。
可选地,终端可以从数字信号中得到灰度图,以及灰度图中的每个像素点的物质电子密度和有效原子序数。
S306:根据属性信息对二维图像进行渲染得到二维伪色彩图像。
具体地,属性信息可以包括有效原子序数。终端可以根据有效原子序数对灰度图进行渲染得到二维伪彩色图像。
S308:将所得到的二维伪色彩图像进行合并处理得到目标三维图像。
可选地,终端可以通过调用开源的库函数来根据二维伪彩色图像合成以得到目标三维图像。
上述目标物体识别方法,通过对扫描数据进行处理,得到能够输入至三维目标检测算法模型进行检测的目标三维图像,将在二维图像目标检测领域的广泛使用的模型扩展至三维目标检测领域,使得在目标物体的识别过程中,能够结合目标物体的三维特征,得到目标物体的位置信息及类别。
在其中一个实施例中,如图4所示,步骤S206可以包括以下步骤:
S402:将目标三维图像输入至三维目标检测算法模型,提取多尺度特征。
具体地,终端可以将目标三维图像输入至三维目标检测算法模型中,并提取多尺度特征。该多尺度特征可以是三维目标检测算法模型输出的特征体。
图5为本申请实施例提供的提取多尺度特征的方法流程图,本实施例涉及的是终端将目标三维图像输入至三维目标检测算法模型,提取多尺度特征的过程,在上述实施例的基础上,步骤S402可以包括以下步骤:
S502:对目标三维图像依次进行预设层数的下采样处理得到多个第一特征。
可选地,预设层数可以为大于等于2的任意层数,例如2、4、6或8等等;具体地,本实施例中预设层数为5层。
S504:获取最后一层下采样得到的第一特征进行处理得到最后一层对应的第二特征。
S506:对最后一层对应的第二特征进行上采样处理得到当前层对应的中间特征。
S508:根据中间特征以及对应层数的第一特征计算得到当前层对应的第二特征。
S510:将当前层作为上一层,下一层作为当前层。
S512:对上一层对应的第二特征进行上采样处理得到当前层对应的中间特征,并继续根据中间特征以及对应层数的第一特征计算得到当前层对应的第二特征,直至所有的层数处理完成。
具体地,如图6所示,左侧的{C2,C3,C4,C5,C6}分别表示5个卷积层conv2,conv3,conv4、conv5和conv6输出的第一特征;C2-C6对应的自顶向下的第二特征记为P2-P6。
可选地,最高层次的第二特征P6可以由输入C6的一个步长为1,卷积核大小为3的三维卷积层生成的,第二特征P5是对P6进行上采样,然后与C5为输入的三维卷积层的输出之和,以此类推,分别计算第二特征P4、P3和P2,至此所有的层数处理完成。
S514:将所得到的各个层对应的第二特征作为多尺度特征。
在其中一个实施例中,三维目标检测算法模型可以包括一个由ResNet实现的FPN(Feature Pyramid Networks,特征金字塔卷积神经网络)以及一个由3D卷积层实现的3D边框回归与分类模块。
S404:对多尺度特征分别进行处理,得到目标物体的位置信息及目标物体的类别。
在其中一个实施例中,步骤S404可以包括以下步骤:
基于多尺度特征,获取目标物体的位置信息,以输出3D预测框及目标物体的类别。
具体地,终端可以根据该多尺度特征识别出目标三维图像中存在目标的位置,并通过3D预测框进行标注,同时识别3D预测框中目标物体的类别。
上述目标物体识别方法,利用三维目标检测算法模型,得到目标物体的位置信息及目标物体的类别,使得该方法的识别准确度不受待测物体之间相互遮挡问题的影响,识别可靠性高。
请继续参阅图6,在其中一个实施例中,对于FPN的每一第二特征P2-P6都有两个分支,分类(class)和回归(box)。其中,回归分支的输出是3D预测框。
上述实施例中的三维目标检测算法模型,以根据扫描数据进行三维重建得到的目标三维图像作为输入,输出目标物体的位置信息及目标物体的类别,提高了目标物体识别的准确性。尤其是当目标物体是由多种物质构成,如枪或笔记本等等,这些物体依靠三维目标检测算法模型去识别能够更加简便准确。
在其中一个实施例中,在某一位置输出的通道维度为6×A,6表示三维空间与类别无关的坐标信息,A表示每个位置预定义的先验框(anchor)的数量,所有的先验框尺寸是根据对原始数据人工标注框的聚类形成的。分类分支输出的通道维度为K×A,K为要预测的类别数量。交叉熵损失函数和smooth L1范数损失函数分别用于进行分类和回归计算。训练时,先验框与标注框(ground truth)的交并比(IOU)大于0.5为正样本,小于0.4为负样本,否则忽略。
请参阅图7,本申请还提供了一种目标物体识别方法,包括以下步骤:
S702:获取扫描数据。
S704:根据上述任意一个实施例中所述的目标物体识别方法得到目标物体的位置信息及目标物体的类别。
具体地,获取扫描数据以及目标物体识别方法的具体步骤请参阅上述内容,此处不再赘述。
S706:根据扫描数据确定每个位置的属性信息;
具体地,终端可以根据扫描数据,获取三维重建过程中所得到的每个位置的属性信息。
可选地,属性信息可以包括但不仅限于物质电子密度和/或有效原子序数。
S708:将目标物体的位置信息所对应的属性信息与违禁品表进行对比,以确定目标物体是否存在违禁品。
具体地,如图8所示,终端可以将目标物体的位置信息所对应的物质电子密度及有效原子序数,与违禁品表中的物质电子密度及有效原子序数进行对比。
上述目标物体识别方法,通过将目标物体的位置信息与违禁品表进行对比,实现目标物体是否为违禁品的自动判别。上述目标物体识别方法通过将目标三维图像输入至三维目标检测算法模型进行检测,得到目标物体的位置信息及目标物体的类别,然后根据三维目标检测算法模型输出的目标物体的位置信息所对应的属性信息与违禁品表进行对比,使得对违禁品的判定更加准确,能一定程度上避免因操作员经验、疲劳、单调和注意力集中等导致的漏检问题。尤其是当违禁品是由多种物质构成时(例如:枪或笔记本),通过三维目标检测算法模型进行识别,能够更加简便准确。并且,乘客在进行包裹过检时,不需要取出电子设备和液体。
请继续参阅图8,本实施例涉及的是终端判断目标物体是否存在违禁品的过程。在上述实施例的基础上,步骤S708之后该方法还可以包括以下步骤:
S710:若目标物体的位置信息所对应的物质电子密度及有效原子序数与违禁品表对应,则判定目标物体包括违禁品。
S712:若目标物体的位置信息所对应的物质电子密度及有效原子序数与违禁品表没有对应,则判定目标物体不包括违禁品。
由于上述任意一个实施例中所述的目标物体识别方法是通过三维目标检测算法模型进行检测的,因此上述目标物体识别方法对于三维特征比较近似的目标物体,可以将目标物体的位置信息所对应的物质电子密度及有效原子序数与违禁品表中的物质电子密度及有效原子序数进行对比,以此判断目标物体是否是违禁品。上述目标物体识别方法,能够对三维特征比较近似的目标物体进行是否为违禁品的判定和比较,使得对违禁品的判定更加准确,乘客在进行包裹过检时也无需额外取出电子设备和液体。
应该理解的是,虽然图2至5、图7及图8的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2至5、图7及图8中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
本申请还提供了一种目标物体识别装置,该目标物体识别装置包括:
扫描模块,用于获取目标物体的初始图像;
处理模块,用于根据扫描数据进行三维重建得到目标三维图像,并将目标三维图像输入至三维目标检测算法模型进行检测,得到目标物体的位置信息及目标物体的类别。
在其中一个实施例中,处理模块还可以用于将目标三维图像输入至三维目标检测算法模型,提取多尺度特征,并对多尺度特征分别进行处理,得到目标物体的位置信息及所述目标物体的类别。
在其中一个实施例中,处理模块还可以用于对目标三维图像依次进行预设层数的下采样处理得到多个第一特征;获取最后一层下采样得到的第一特征进行处理得到最后一层对应的第二特征;对最后一层对应的所述第二特征进行上采样处理得到当前层对应的中间特征;根据中间特征以及对应层数的第一特征计算得到当前层对应的第二特征;将当前层作为上一层,所述下一层作为当前层;对上一层对应的第二特征进行上采样处理得到当前层对应的中间特征,并继续根据中间特征以及对应层数的第一特征计算得到当前层对应的第二特征,直至所有的层数处理完成;将所得到的各个层对应的第二特征作为多尺度特征。
在其中一个实施例中,处理模块还用于基于多尺度特征,获取目标物体的位置信息,以输出3D预测框及目标物体的类别。
上述目标物体识别装置,能够对目标物体的扫描数据进行三维重建,并将所得的目标三维图像经由三维目标检测算法模型进行检测,在目标物体的识别过程中,能够结合目标物体的三维特征,得到目标物体的位置信息及类别,使得该目标物体识别装置的准确度不受待测物体之间相互遮挡问题的影响,并且对于根据物质材料特性不易区分的待测物体也能够准确地识别。
在其中一个实施例中,该目标物体识别装置可以包括:
扫描模块,用于获取目标物体的初始图像;
处理模块,用于根据上述任意一个实施例中提供的目标物体识别方法得到目标物体的位置信息及所述目标物体的类别,根据扫描数据确定每个位置的属性信息,并将目标物体的位置信息所对应的属性信息与违禁品表进行对比,以确定目标物体是否存在违禁品。
上述目标物体识别装置,能够通过将目标物体的位置信息与违禁品表进行对比,实现目标物体是否为违禁品的自动判别。上述目标物体识别装置通过将目标三维图像输入至三维目标检测算法模型进行检测,得到目标物体的位置信息及目标物体的类别,然后根据三维目标检测算法模型输出的目标物体的位置信息所对应的属性信息与违禁品表进行对比,使得对违禁品的判定更加准确,能一定程度上避免因操作员经验、疲劳、单调和注意力集中等导致的漏检问题。尤其是当违禁品是由多种物质构成时(例如:枪或笔记本),通过三维目标检测算法模型进行识别,能够更加简便准确。并且,乘客在进行包裹过检时,不需要取出电子设备和液体。
关于目标物体识别装置的具体限定可以参见上文中对于目标物体识别方法的限定,在此不再赘述。上述目标物体识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在其中一个实施例中,提供了一种计算机设备,该计算机设备可以是终端。该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、运营商网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现上述任意一个方法实施例中的目标物体识别的步骤。
在其中一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
获取扫描数据;根据扫描数据进行三维重建得到目标三维图像;将目标三维图像输入至三维目标检测算法模型进行检测,得到目标物体的位置信息及目标物体的类别。
在其中一个实施例中,处理器执行计算机程序时还实现以下步骤:
将目标三维图像输入至三维目标检测算法模型,提取多尺度特征;对多尺度特征分别进行处理,得到目标物体的位置信息及目标物体的类别。
在其中一个实施例中,处理器执行计算机程序时还实现以下步骤:
对目标三维图像依次进行预设层数的下采样处理得到多个第一特征;获取最后一层下采样得到的第一特征进行处理得到最后一层对应的第二特征;对最后一层对应的第二特征进行上采样处理得到当前层对应的中间特征;根据中间特征以及对应层数的第一特征计算得到当前层对应的第二特征;将当前层作为上一层,下一层作为当前层;对上一层对应的第二特征进行上采样处理得到当前层对应的中间特征,并继续根据中间特征以及对应层数的第一特征计算得到当前层对应的第二特征,直至所有的层数处理完成;将所得到的各个层对应的第二特征作为多尺度特征。
在其中一个实施例中,处理器执行计算机程序时还实现以下步骤:
基于多尺度特征,获取目标物体的位置信息,以输出3D预测框及目标物体的类别。
在其中一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
获取扫描数据;根据上述任意一个实施例中提供的目标物体识别方法得到目标物体的位置信息及目标物体的类别;根据扫描数据确定每个位置的属性信息;将所述目标物体的位置信息所对应的属性信息与违禁品表进行对比,以确定目标物体是否存在违禁品。
在其中一个实施例中,处理器执行计算机程序时还实现以下步骤:
获取三维重建过程中所得到的每个位置的属性信息。
在其中一个实施例中,处理器执行计算机程序时还实现以下步骤:
将目标物体的位置信息所对应的物质电子密度及有效原子序数,与违禁品表中的物质电子密度及有效原子序数进行对比。
在其中一个实施例中,处理器执行计算机程序时还实现以下步骤:
将目标物体的位置信息所对应的属性信息与违禁品表进行对比,以确定目标物体是否存在违禁品,若目标物体的位置信息所对应的物质电子密度及有效原子序数与所述违禁品表对应,则判定目标物体包括违禁品;若目标物体的位置信息所对应的物质电子密度及有效原子序数与所述违禁品表没有对应,则判定目标物体不包括违禁品。
本申请还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述任意一个方法实施例中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (12)
1.一种目标物体识别方法,其特征在于,所述方法包括:
获取扫描数据;
根据所述扫描数据进行三维重建得到目标三维图像;
将所述目标三维图像输入至三维目标检测算法模型进行检测,得到所述目标物体的位置信息及所述目标物体的类别;所述三维目标检测算法模型用于根据输入的所述目标三维图像标记出所述目标物体并输出所述目标物体的类别。
2.根据权利要求1所述的方法,其特征在于,所述将所述目标三维图像输入至三维目标检测算法模型进行检测,得到所述目标物体的位置信息及所述目标物体的类别,包括:
将所述目标三维图像输入至三维目标检测算法模型,提取多尺度特征;
对所述多尺度特征分别进行处理,得到所述目标物体的位置信息及所述目标物体的类别。
3.根据权利要求2所述的方法,其特征在于,所述将所述目标三维图像输入至三维目标检测算法模型,提取多尺度特征,包括:
对所述目标三维图像依次进行预设层数的下采样处理得到多个第一特征;
获取最后一层下采样得到的第一特征进行处理得到最后一层对应的第二特征;
对最后一层对应的所述第二特征进行上采样处理得到当前层对应的中间特征;
根据所述中间特征以及对应层数的第一特征计算得到当前层对应的第二特征;
将所述当前层作为上一层,所述下一层作为当前层;
对所述上一层对应的第二特征进行上采样处理得到当前层对应的中间特征,并继续根据所述中间特征以及对应层数的第一特征计算得到当前层对应的第二特征,直至所有的层数处理完成;
将所得到的各个层对应的第二特征作为多尺度特征。
4.根据权利要求2所述的方法,其特征在于,所述对所述多尺度特征分别进行处理,得到所述目标物体的位置信息及所述目标物体的类别,包括:
基于所述多尺度特征,获取所述目标物体的位置信息,以输出3D预测框及所述目标物体的类别。
5.一种目标物体识别方法,其特征在于,所述方法包括:
获取扫描数据;
根据权利要求1至4任意一项所述的目标物体识别方法得到目标物体的位置信息及所述目标物体的类别;
根据所述扫描数据确定每个位置的属性信息;
将所述目标物体的位置信息所对应的属性信息与违禁品表进行对比,以确定所述目标物体是否存在违禁品。
6.根据权利要求5所述的方法,其特征在于,所述根据所述扫描数据进行三维重建得到目标三维图像,包括:
将所述扫描数据转换为对应的数字信号;
对所述数字信号进行处理得到至少一幅二维图像以及每幅二维图像中每个位置的属性信息;
根据所述属性信息对所述二维图像进行渲染得到二维伪色彩图像;
将所得到的二维伪色彩图像进行合并处理得到目标三维图像。
7.根据权利要求5所述的方法,其特征在于,所述根据所述扫描数据确定每个位置的属性信息,包括:
获取三维重建过程中所得到的每个位置的属性信息。
8.根据权利要求7所述的方法,其特征在于,所述属性信息包括物质电子密度及有效原子序数。
9.根据权利要求8所述的方法,其特征在于,所述将所述目标物体的位置信息所对应的属性信息与违禁品表进行对比,以确定所述目标物体是否存在违禁品,包括:
将所述目标物体的位置信息所对应的物质电子密度及有效原子序数,与违禁品表中的物质电子密度及有效原子序数进行对比;
所述将所述目标物体的位置信息所对应的属性信息与违禁品表进行对比,以确定所述目标物体是否存在违禁品之后,还包括:
若目标物体的位置信息所对应的物质电子密度及有效原子序数与所述违禁品表对应,则判定所述目标物体包括违禁品;
若目标物体的位置信息所对应的物质电子密度及有效原子序数与所述违禁品表没有对应,则判定所述目标物体不包括违禁品。
10.一种目标物体识别装置,其特征在于,所述目标物体识别装置包括:
扫描模块,用于获取所述目标物体的初始图像;
处理模块,用于根据所述扫描数据进行三维重建得到目标三维图像,并将所述目标三维图像输入至三维目标检测算法模型进行检测,得到所述目标物体的位置信息及所述目标物体的类别。
11.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现权利要求1至9中任一项所述的方法的步骤。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至9中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110451132.6A CN113312970A (zh) | 2021-04-26 | 2021-04-26 | 目标物体识别方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110451132.6A CN113312970A (zh) | 2021-04-26 | 2021-04-26 | 目标物体识别方法、装置、计算机设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113312970A true CN113312970A (zh) | 2021-08-27 |
Family
ID=77371057
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110451132.6A Pending CN113312970A (zh) | 2021-04-26 | 2021-04-26 | 目标物体识别方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113312970A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114581769A (zh) * | 2022-01-19 | 2022-06-03 | 西南交通大学 | 一种基于无监督聚类的在建房屋识别方法 |
-
2021
- 2021-04-26 CN CN202110451132.6A patent/CN113312970A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114581769A (zh) * | 2022-01-19 | 2022-06-03 | 西南交通大学 | 一种基于无监督聚类的在建房屋识别方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109410218B (zh) | 用于生成车辆损伤信息的方法和装置 | |
US11106930B2 (en) | Classifying compartments at security checkpoints by detecting a shape of an object | |
WO2020033900A1 (en) | Systems and methods for image processing | |
KR101930940B1 (ko) | 영상 분석 장치 및 방법 | |
CN113139543B (zh) | 目标对象检测模型的训练方法、目标对象检测方法和设备 | |
CN111985466A (zh) | 一种集装箱危险品标志识别方法 | |
JP7212247B2 (ja) | 目標検出プログラム、目標検出装置、及び目標検出方法 | |
CN114429637B (zh) | 一种文档分类方法、装置、设备及存储介质 | |
CN115019182A (zh) | 遥感图像目标细粒度识别方法、系统、设备及存储介质 | |
CN116092096A (zh) | 用于检验申报信息真实性的方法、系统、设备及介质 | |
CN112381107A (zh) | 基于深度学习的物品x光检测方法、装置和计算机设备 | |
CN113312970A (zh) | 目标物体识别方法、装置、计算机设备和存储介质 | |
CN116759326B (zh) | 芯片外观检测方法、装置、设备及存储介质 | |
CN113792623A (zh) | 安检ct目标物识别方法和装置 | |
KR102158967B1 (ko) | 영상 분석 장치, 영상 분석 방법 및 기록 매체 | |
CN111583417A (zh) | 一种图像语义和场景几何联合约束的室内vr场景构建的方法、装置、电子设备和介质 | |
CN114663711B (zh) | 一种面向x光安检场景的危险品检测方法及装置 | |
CN110023990B (zh) | 利用配准检测违法物品 | |
CN115861922A (zh) | 一种稀疏烟火检测方法、装置、计算机设备及存储介质 | |
CN114792300B (zh) | 一种基于多尺度注意力x光断针检测方法 | |
CN112884755B (zh) | 违禁品的检测方法及装置 | |
CN114445363A (zh) | 基于多模态数据注意力模型实现危险品识别的系统、方法、装置、处理器及其存储介质 | |
US20210256296A1 (en) | Object identification system and computer-implemented method | |
CN114596485A (zh) | 危险品检测方法和装置 | |
CN114078204A (zh) | 目标检测方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20211220 Address after: 200135 room 304, building 3, No. 336, Tianjiao Road, Lingang xinpian District, China (Shanghai) pilot Free Trade Zone, Pudong New Area, Shanghai Applicant after: Shanghai Wuying Technology Co.,Ltd. Address before: 200135 building C, No.888, Huanhu West 2nd Road, Lingang New District, China (Shanghai) pilot Free Trade Zone, Pudong New Area, Shanghai Applicant before: Shanghai high tech Industrial Development Co.,Ltd. |