CN114419570A - 一种点云数据识别方法、装置、电子设备及存储介质 - Google Patents

一种点云数据识别方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN114419570A
CN114419570A CN202210308663.4A CN202210308663A CN114419570A CN 114419570 A CN114419570 A CN 114419570A CN 202210308663 A CN202210308663 A CN 202210308663A CN 114419570 A CN114419570 A CN 114419570A
Authority
CN
China
Prior art keywords
data
point cloud
local
network
features
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210308663.4A
Other languages
English (en)
Other versions
CN114419570B (zh
Inventor
詹景麟
刘铁军
张晶威
刘丹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202210308663.4A priority Critical patent/CN114419570B/zh
Publication of CN114419570A publication Critical patent/CN114419570A/zh
Priority to PCT/CN2023/081972 priority patent/WO2023185494A1/zh
Application granted granted Critical
Publication of CN114419570B publication Critical patent/CN114419570B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供一种点云数据识别方法、装置、电子设备及存储介质,方法包括:获取单帧点云数据,并将单帧点云数据分割为预设数量的局部数据;将局部数据并行输入至预设数量的PointNet++网络中,以使PointNet++网络提取局部数据对应的局部特征;将所有局部数据输入至ViT网络中,以使ViT网络提取单帧点云数据的全局特征;融合局部特征和全局特征得到融合特征,并利用融合特征对单帧点云数据进行类型识别;结合PointNet++网络和ViT网络进行点云数据的识别任务,能够有效提取点云数据的全局特征,并能够很好地综合点云数据的全局特征及局部特征,进而可有效提升点云数据的感知及识别效果。

Description

一种点云数据识别方法、装置、电子设备及存储介质
技术领域
本发明涉及模式识别领域,特别涉及一种点云数据识别方法、装置、电子设备及计算机可读存储介质。
背景技术
相比于传统摄像头所提供的二维图像数据,激光雷达所提供的点云数据可包含三维深度信息,且可排除光线条件的干扰,能够有效提升无人驾驶系统的感知性能,因此在无人驾驶领域中,常使用点云数据执行目标识别任务。相关技术中,点云数据识别算法在全局特征的提取方面存在不足,且无法有效综合点云数据中的全局特征及局部特征,进而难以取得较好的感知效果。
发明内容
本发明的目的是提供一种点云数据识别方法、装置、电子设备及计算机可读存储介质,可结合PointNet++网络和ViT网络进行点云数据的识别任务,能够有效提取点云数据的全局特征,并能够很好地综合点云数据的全局特征及局部特征,进而可有效提升点云数据的感知及识别效果。
为解决上述技术问题,本发明提供一种点云数据识别方法,包括:
获取单帧点云数据,并将所述单帧点云数据分割为预设数量的局部数据;
将所述局部数据并行输入至所述预设数量的PointNet++网络中,以使所述PointNet++网络提取所述局部数据对应的局部特征;
将所有所述局部数据输入至ViT网络中,以使所述ViT网络提取所述单帧点云数据的全局特征;
融合所述局部特征和所述全局特征得到融合特征,并利用所述融合特征对所述单帧点云数据进行类型识别。
可选地,所述将所述单帧点云数据分割为预设数量的局部数据,包括:
利用K均值算法将所述单帧点云数据中的数据点划分至所述预设数量的数据簇中,得到所述局部数据;
对每一所述局部数据包含的数据点数量进行统计;
若所述数据点数量大于预设数据点数量,则对所述数据点数量对应的目标局部数据中的数据点进行随机移除,直至移除后的数据点数量等于所述预设数据点数量;
若所述数据点数量小于所述预设数据点数量,则在所述目标局部数据中增加新数据点,直至增加后的数据点数量等于所述预设数据点数量。
可选地,所述在所述目标局部数据中增加新数据点,包括:
利用插值法及所述目标局部数据中的数据点生成所述新数据点,并将所述新数据点添加至所述目标局部数据中。
可选地,所述融合所述局部特征和所述全局特征得到融合特征,包括:
将所述局部特征对应的局部特征向量与所述全局特征对应的全局特征向量进行拼接,得到所述融合特征。
可选地,所述PointNet++网络提取所述局部数据对应的局部特征,包括:
所述PointNet++网络利用预训练的转换矩阵对接收到的局部数据进行对齐,并提取对齐后的局部数据的局部特征。
可选地,在获取单帧点云数据之前,还包括:
获取点云训练集,并随机初始化所述PointNet++网络、所述ViT网络及所述类型识别过程中所需使用的模型权重;所述点云训练集中的单帧点云训练数据标注有对应的实际分类;
将所述点云训练集中的每一所述单帧点云训练数据分割为所述预设数量的局部训练数据;
将所述单帧点云训练数据对应的局部训练数据输入至所述PointNet++网络和所述ViT网络,并对所述PointNet++网络和所述ViT网络的输出结果进行融合,得到所述单帧点云训练数据的融合特征;
利用所述单帧点云训练数据的融合特征对所述单帧点云训练数据进行类型识别,并利用得到的预测分类及所述单帧点云训练数据的实际分类计算损失值;
利用梯度下降法及所述损失值对所述模型权重进行迭代更新,并进入将所述单帧点云训练数据对应的局部训练数据输入至所述PointNet++网络和所述ViT网络的步骤,直至迭代次数到达预设上限或所述损失值小于预设阈值。
本发明还提供一种点云数据识别装置,包括:
获取及分割模块,用于获取单帧点云数据,并将所述单帧点云数据分割为预设数量的局部数据;
第一输入模块,用于将所述局部数据并行输入至所述预设数量的PointNet++网络中,以使所述PointNet++网络提取所述局部数据对应的局部特征;
第二输入模块,用于将所有所述局部数据输入至ViT网络中,以使所述ViT网络提取所述单帧点云数据的全局特征;
融合及识别模块,用于融合所述局部特征和所述全局特征得到融合特征,并利用所述融合特征对所述单帧点云数据进行类型识别。
可选地,所述获取及分割模块,包括:
划分子模块,用于利用K均值算法将所述单帧点云数据中的数据点划分至所述预设数量的数据簇中,得到所述局部数据;
统计子模块,用于对每一所述局部数据包含的数据点数量进行统计;
移除子模块,用于若所述数据点数量大于预设数据点数量,则对所述数据点数量对应的目标局部数据中的数据点进行随机移除,直至移除后的数据点数量等于所述预设数据点数量;
增加子模块,用于若所述数据点数量小于所述预设数据点数量,则在所述目标局部数据中增加新数据点,直至增加后的数据点数量等于所述预设数据点数量。
本发明还提供一种电子设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如上述所述的点云数据识别方法。
本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机可执行指令,所述计算机可执行指令被处理器加载并执行时,实现如上述所述的点云数据识别方法。
本发明提供一种点云数据识别方法,包括:获取单帧点云数据,并将所述单帧点云数据分割为预设数量的局部数据;将所述局部数据并行输入至所述预设数量的PointNet++网络中,以使所述PointNet++网络提取所述局部数据对应的局部特征;将所有所述局部数据输入至ViT网络中,以使所述ViT网络提取所述单帧点云数据的全局特征;融合所述局部特征和所述全局特征得到融合特征,并利用所述融合特征对所述单帧点云数据进行类型识别。
可见,本发明会综合PointNet++网络和ViT网络进行点云数据的识别任务,在得到单帧点云数据时,会首先将该数据划分为预设数量的局部数据,并且并行输入至对应的PointNet++网络中进行局部特征提取,这是由于该网络在局部感知效果上具有性能优势,且可有效提升显卡内存利用率;此外,本发明还会将所有局部数据输入至ViT网络中,以提取单帧点云数据的全局特征,这是由于ViT网络具有自注意力机制,在提取点云数据全局特征方面具有性能优势;进一步,本发明会将得到的局部特征和全局特征进行融合,并利用融合后的融合特征对单帧点云数据进行类型识别,不仅能够弥补现有方式难以有效提取点云数据全局特征的缺陷,同时还很好地综合了点云数据的全局特征及局部特征,进而能够有效提升点云数据的感知及识别效果。本发明还提供一种点云数据识别装置、电子设备及计算机可读存储介质,具有上述有益效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例所提供的一种点云数据识别方法的流程图;
图2为本发明实施例所提供的一种神经网络整体框架图;
图3为本发明实施例所提供的一种点云数据识别装置的结构框图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
相关技术中,点云数据识别算法在全局特征的提取方面存在不足,且无法有效综合点云数据中的全局特征及局部特征,进而难以取得较好的感知效果。有鉴于此,本发明提供一种点云数据识别方法,可结合PointNet++网络和ViT网络进行点云数据的识别任务,能够有效提取点云数据的全局特征,并能够很好地综合点云数据的全局特征及局部特征,进而可有效提升点云数据的感知及识别效果。请参考图1,图1为本发明实施例所提供的一种点云数据识别方法的流程图,该方法可以包括:
S101、获取单帧点云数据,并将单帧点云数据分割为预设数量的局部数据。
需要说明的是,本发明实施例并不限定单帧点云数据的具体采集设备,例如可采用机械旋转式激光雷达、混合式激光雷达或固态激光雷达进行采集;本发明实施例也不限定单帧点云数据中包含的数据点数量及其他采集参数,可根据实际应用需求进行设定。
进一步,在本发明实施例中,为了对单帧点云数据中的局部特征进行有效提取,需要首先将单帧点云数据进行分割,得到预设数量的局部数据,其中预设数量可根据实际应用需求进行设定。需要说明的是,本发明实施例并不限定分割单帧点云数据的具体方式,例如可预先在单帧点云数据中划分出预设数量的预设区域,并依照该预设区域对单帧点云数据进行分割;当然也可以采用聚类的方式,将单帧点云数据中的数据点划分至预设数量的数据簇中,进而将这些数据簇设置为局部数据。在本发明实施例中,为避免特殊分割方式对识别的影响,同时为避免预设区域对神经网络局部特征捕捉能力的限制,可采用上述聚类的方式对单帧点云数据进行分割,以采用自适应的方式进行局部数据提取。需要说明的是,本发明实施例并不限定具体的聚类方式,例如可采用K均值(K-Means)、均值偏移聚类算法等,可依照实际应用需求进行设定。考虑到K均值是较为常用的聚类算法,因此在本发明实施例中将采用K均值对单帧点云数据进行分割。
进一步,需要指出的是,神经网络通常只能输入结构规范的数据,换而言之,可被神经网络接收的局部数据应当包含固定数量的数据点。然而,在采用聚类算法对单帧点云数据进行分割之后,得到的局部数据所包含的数据点数量并不固定,因此在完成分割之后,还需要对局部数据中的数据点进行移除或增加,以确保单帧点云数据对应的局部数据均可被神经网络处理。
在一种可能的情况中,将单帧点云数据分割为预设数量的局部数据,可以包括:
步骤11:利用K均值算法将单帧点云数据中的数据点划分至预设数量的数据簇中,得到局部数据;
步骤12:对每一局部数据包含的数据点数量进行统计;
步骤13:若数据点数量大于预设数据点数量,则对数据点数量对应的目标局部数据中的数据点进行随机移除,直至移除后的数据点数量等于预设数据点数量;
步骤14:若数据点数量小于预设数据点数量,则在目标局部数据中增加新数据点,直至增加后的数据点数量等于预设数据点数量。
需要说明的是,本发明实施例并不限定K均值算法的具体步骤,例如可包含聚类中心初始化、距离计算、点集确定及聚类中心迭代更新等步骤,可参考K均值的相关技术;本发明也不限定预设数据点数量的具体数值,可根据实际应用需求进行设定。
值得指出的是,当数据点数量大于预设数据点数量时,本发明实施例将会对局部数据中的数据点进行随机移除,能够有效减少因数据点移除而对局部特征造成的损失。
进一步,需要说明的是,本发明实施例并不限定当数据点数量小于预设数据点数量时,向局部数据中增加新数据点的方式,例如可不断向局部数据中填充零值(即无效数据);当然也可以采用插值法,对局部数据中原有的数据点进行插值得到新数据点,并将新数据点添加至局部数据中。在本发明实施例中,为避免新增数据对局部数据原有特征的影响,可采用插值法对局部数据进行扩充。
在一种可能的情况中,在目标局部数据中增加新数据点,可以包括:
步骤21:利用插值法及目标局部数据中的数据点生成新数据点,并将新数据点添加至目标局部数据中。
S102、将局部数据并行输入至预设数量的PointNet++网络中,以使PointNet++网络提取局部数据对应的局部特征。
在本发明实施例中,局部数据首先被并行输入至预设数量的PointNet++网络中进行特征提取,其中PointNet++网络是一种用于提取三维点云特征的神经网络,具有较强的局部特征提取性能。为便于理解,请参考图2,图2为本发明实施例所提供的一种神经网络整体框架图。从图中可知,局部数据与PointNet++网络之间的对应关系为一对一,即N’组局部数据再被并行输入至PointNet++模块之后,将被N’组PointNet++网络处理得到N’组局部特征。需要说明的是,本发明实施例并不限定PointNet++网络的具体结构,例如可包含MLP层(多层感知机)、池化层(Pooling)等,也不限定该网络各层的具体功能,可参考PointNet++网络的相关技术。
进一步,在进行局部特征提取之前,PointNet++网络可对局部数据进行数据对齐操作。具体的,可预先构建一个小型子网络,并训练得到一个转换矩阵,通过该转换矩阵确保点云数据在3D空间内的仿射变换不变性,即数据经过平移、旋转等操作不影响该神经网络对于环境的感知能力。
在一种可能的情况中,PointNet++网络提取局部数据对应的局部特征,可以包括:
步骤31:PointNet++网络利用预训练的转换矩阵对接收到的局部数据进行对齐,并提取对齐后的局部数据的局部特征。
在完成数据对齐后,PointNet++网络便可将局部数据传输至MLP层,通过数据的多级线性和非线性变换对点云数据进行特征提取,将原始数据的表达从几何空间转换为语义空间,通过再一次的数据对齐和MLP操作,进一步抽象底层特征,最终经过数据的池化处理,获得该局部点云数据的高级特征表达形式,即得到局部特征。
S103、将所有局部数据输入至ViT网络中,以使ViT网络提取单帧点云数据的全局特征。
本发明实施例进一步会将单帧点云数据对应的所有局部数据输入至ViT网络中,以提取单帧点云数据的全局特征,其中ViT(Vision Transformer,视觉转换器)是一种基于自注意力体系的图像识别神经网络,其结构可参考图2,例如可包含归一化层、多头自注意力层及MLP层。该网络在处理局部数据的过程中,依据自注意力分数加权引入其他局部区域数据的影响,从而有利于该网络结构的全局特征捕获。需要说明的是,本发明实施例并不限定ViT网络各层的具体功能,可参考ViT网络的相关技术。应当指出的是,与局部特征不同,ViT网络仅会为单帧点云数据生成一份全局特征。
S104、融合局部特征和全局特征得到融合特征,并利用融合特征对单帧点云数据进行类型识别。
在得到局部特征及全局特征后,本发明实施例将对这两个特征进行融合得到融合特征,并利用融合特征进行类型识别。由于本发明实施例可利用更多特征信息对点云数据进行类型识别,因此能够有效提升点云数据的识别准确率。需要说明的是,本发明实施例并不限定如何对局部特征和全局特征进行融合,考虑到特征通常采用向量的形式进行表示,因此在本发明实施例中,可将局部特征对应的局部特征向量与全局特征对应的全局特征向量进行拼接,以得到融合特征。
在一种可能的情况中,融合局部特征和全局特征得到融合特征,可以包括:
步骤41:将局部特征对应的局部特征向量与全局特征对应的全局特征向量进行拼接,得到融合特征。
进一步,需要说明的是,本发明实施例并不限定具体的类型识别过程,也不限定单帧点云数据具体对应的预设类型,可根据实际应用需求进行设定。
基于上述实施例,本发明会综合PointNet++网络和ViT网络进行点云数据的识别任务,在得到单帧点云数据时,会首先将该数据划分为预设数量的局部数据,并且并行输入至对应的PointNet++网络中进行局部特征提取,这是由于该网络在局部感知效果上具有性能优势,且可有效提升显卡内存利用率;此外,本发明还会将所有局部数据输入至ViT网络中,以提取单帧点云数据的全局特征,这是由于ViT网络具有自注意力机制,在提取点云数据全局特征方面具有性能优势;进一步,本发明会将得到的局部特征和全局特征进行融合,并利用融合后的融合特征对单帧点云数据进行类型识别,不仅能够弥补现有方式难以有效提取点云数据全局特征的缺陷,同时还很好地综合了点云数据的全局特征及局部特征,进而能够有效提升点云数据的感知及识别效果。
基于上述实施例,下面将对上述网络的训练方式进行介绍。在一种可能的情况中,在获取单帧点云数据之前,还可以包括:
S201、获取点云训练集,并随机初始化PointNet++网络、ViT网络及类型识别过程中所需使用的模型权重;点云训练集中的单帧点云训练数据标注有对应的实际分类。
需要说明的是,本发明实施例并不限定点云训练集可包含的单帧点云训练数据的数量,也不限定这些单帧点云训练数据的采集时间、场景、反射率数值等,可根据实际应用需求进行设定。本发明实施例也不限定具体的实际分类,同样可根据实际应用需求进行设定。为方便训练集生成,在实际应用中,点云训练集还可按照预设比例从点云数据集中划分出来,例如将经过标注的点云数据拆分为训练集和测试集。以最简单的留出法为例,通过随机不放回采样的方式将4/5的数据用于训练,剩余1/5的数据用于测试。当然,具体的预设比例可依照实际应用需求进行设定。
进一步,本发明实施例并不限定PointNet++网络、ViT网络及类型识别过程中所需使用的模型权重,可参考相关技术。为启动训练过程,本发明实施例预先对这些模型权重进行了随机初始化,以随机设置这些模型权重的数值。
S202、将点云训练集中的每一单帧点云训练数据分割为预设数量的局部训练数据。
S203、将单帧点云训练数据对应的局部训练数据输入至PointNet++网络和ViT网络,并对PointNet++网络和ViT网络的输出结果进行融合,得到单帧点云训练数据的融合特征。
需要说明的是,对步骤S202、S203的描述与对步骤S101至S103的描述一致,可参考上述实施例,此处不再赘述。
S204、利用单帧点云训练数据的融合特征对单帧点云训练数据进行类型识别,并利用得到的预测分类及单帧点云训练数据的实际分类计算损失值。
为便于说明,下面将以特定分类数量进行介绍。在一种可能的情况中,假定预设的实际分类数量为4个,将神经网络的输出结果中第m帧点云数据第i个点在第k个类别的得分表示为
Figure 441626DEST_PATH_IMAGE001
,通过softmax函数将该分数映射到一个0~1区间的数值,将神经网络的输出结果转化为第m帧点云数据第i个点在第k个类别的概率
Figure 64369DEST_PATH_IMAGE002
Figure 399404DEST_PATH_IMAGE003
(式1)
其中
Figure 158413DEST_PATH_IMAGE004
表示指数函数。点云训练集包含的点云数据样本数为
Figure 553491DEST_PATH_IMAGE005
,第m帧点云数据中包含的数据点个数为
Figure 460267DEST_PATH_IMAGE006
个,则定义损失函数L为:
Figure 54453DEST_PATH_IMAGE007
(式2)
其中,
Figure 651656DEST_PATH_IMAGE008
为一个符号函数,若第m帧点云数据第i个点在第k个类别与其真实的类别(即实际类别
Figure 892669DEST_PATH_IMAGE009
)相同时,则该符号函数的函数值为1,否则为0。利用上述损失函数L及单帧点云训练数据的预测分类和实际分类,便可计算出本轮训练中网络的损失值。
S205、利用梯度下降法及损失值对模型权重进行迭代更新,并进入将单帧点云训练数据对应的局部训练数据输入至PointNet++网络和ViT网络的步骤,直至迭代次数到达预设上限或损失值小于预设阈值。
具体的,可采用梯度下降优化算法(GradientDescent)对神经网络进行迭代训练,并按照如下公式对参数进行迭代优化,其中
Figure 21162DEST_PATH_IMAGE010
表示第t轮的模型权重,
Figure 448732DEST_PATH_IMAGE011
表示超参数,
Figure 962759DEST_PATH_IMAGE012
表示损失函数L的梯度值。
Figure 715952DEST_PATH_IMAGE013
(式3)
进一步,可以理解的是,迭代训练应当设置退出条件。在本发明实施例中,上述迭代训练可在迭代次数到达预设上限或是损失值小于预设阈值时退出。本发明实施例并不限定具体的预设上限和预设阈值,可根据实际应用需求进行设定。
在完成训练之后,还可利用测试数据集对神经网络的识别效果进行验证。具体的,设测试集中包含的点云数据样本数为
Figure 597320DEST_PATH_IMAGE014
,其中第m帧点云数据第i个点在第k个类别的概率
Figure 359740DEST_PATH_IMAGE015
,取
Figure 993852DEST_PATH_IMAGE015
最大值对应的k为第m帧点云数据第i个点的预测类别
Figure 917946DEST_PATH_IMAGE016
,对应的人工标注真实类别为
Figure 286610DEST_PATH_IMAGE017
,则定义预测准确率accuracy为:
Figure 587142DEST_PATH_IMAGE018
(式4)
其中,
Figure 606919DEST_PATH_IMAGE019
为一个符号函数,当
Figure 701914DEST_PATH_IMAGE020
时函数值为1,否则为0。
下面对本发明实施例提供的点云数据识别装置、电子设备及存储介质进行介绍,下文描述的点云数据识别装置、电子设备及存储介质与上文描述的点云数据识别方法可相互对应参照。
请参考图3,图3为本发明实施例所提供的一种点云数据识别装置的结构框图,该装置可以包括:
获取及分割模块301,用于获取单帧点云数据,并将单帧点云数据分割为预设数量的局部数据;
第一输入模块302,用于将局部数据并行输入至预设数量的PointNet++网络中,以使PointNet++网络提取局部数据对应的局部特征;
第二输入模块303,用于将所有局部数据输入至ViT网络中,以使ViT网络提取单帧点云数据的全局特征;
融合及识别模块304,用于融合局部特征和全局特征得到融合特征,并利用融合特征对单帧点云数据进行类型识别。
可选地,获取及分割模块301,可以包括:
划分子模块,用于利用K均值算法将单帧点云数据中的数据点划分至预设数量的数据簇中,得到局部数据;
统计子模块,用于对每一局部数据包含的数据点数量进行统计;
移除子模块,用于若数据点数量大于预设数据点数量,则对数据点数量对应的目标局部数据中的数据点进行随机移除,直至移除后的数据点数量等于预设数据点数量;
增加子模块,用于若数据点数量小于预设数据点数量,则在目标局部数据中增加新数据点,直至增加后的数据点数量等于预设数据点数量。
可选地,增加子模块,可以包括:
插值单元,用于利用插值法及目标局部数据中的数据点生成新数据点,并将新数据点添加至目标局部数据中。
可选地,融合及识别模块304,可以包括:
融合子模块,用于将局部特征对应的局部特征向量与全局特征对应的全局特征向量进行拼接,得到融合特征。
可选地,第一输入模块302,可以包括:
PointNet++训练模块,用于PointNet++网络利用预训练的转换矩阵对接收到的局部数据进行对齐,并提取对齐后的局部数据的局部特征。
可选地,该装置还可以包括:
训练初始化模块,用于获取点云训练集,并随机初始化PointNet++网络、ViT网络及类型识别过程中所需使用的模型权重;点云训练集中的单帧点云训练数据标注有对应的实际分类;
训练数据分割模块,用于将点云训练集中的每一单帧点云训练数据分割为预设数量的局部训练数据;
训练数据输入模块,用于将单帧点云训练数据对应的局部训练数据输入至PointNet++网络和ViT网络,并对PointNet++网络和ViT网络的输出结果进行融合,得到单帧点云训练数据的融合特征;
识别及损失值计算模块,用于利用单帧点云训练数据的融合特征对单帧点云训练数据进行类型识别,并利用得到的预测分类及单帧点云训练数据的实际分类计算损失值;
更新模块,用于利用梯度下降法及损失值对模型权重进行迭代更新,并进入将单帧点云训练数据对应的局部训练数据输入至PointNet++网络和ViT网络的步骤,直至迭代次数到达预设上限或损失值小于预设阈值。
本发明实施例还提供一种电子设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行计算机程序时实现如上述的点云数据识别方法的步骤。
由于电子设备部分的实施例与点云数据识别方法部分的实施例相互对应,因此电子设备部分的实施例请参见点云数据识别方法部分的实施例的描述,这里不再赘述。
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现上述任意实施例的点云数据识别方法的步骤。
由于计算机可读存储介质部分的实施例与点云数据识别方法部分的实施例相互对应,因此存储介质部分的实施例请参见点云数据识别方法部分的实施例的描述,这里不再赘述。
说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上对本发明所提供的一种点云数据识别方法、装置、电子设备及计算机可读存储介质进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

Claims (10)

1.一种点云数据识别方法,其特征在于,包括:
获取单帧点云数据,并将所述单帧点云数据分割为预设数量的局部数据;
将所述局部数据并行输入至所述预设数量的PointNet++网络中,以使所述PointNet++网络提取所述局部数据对应的局部特征;
将所有所述局部数据输入至ViT网络中,以使所述ViT网络提取所述单帧点云数据的全局特征;
融合所述局部特征和所述全局特征得到融合特征,并利用所述融合特征对所述单帧点云数据进行类型识别。
2.根据权利要求1所述的点云数据识别方法,其特征在于,所述将所述单帧点云数据分割为预设数量的局部数据,包括:
利用K均值算法将所述单帧点云数据中的数据点划分至所述预设数量的数据簇中,得到所述局部数据;
对每一所述局部数据包含的数据点数量进行统计;
若所述数据点数量大于预设数据点数量,则对所述数据点数量对应的目标局部数据中的数据点进行随机移除,直至移除后的数据点数量等于所述预设数据点数量;
若所述数据点数量小于所述预设数据点数量,则在所述目标局部数据中增加新数据点,直至增加后的数据点数量等于所述预设数据点数量。
3.根据权利要求2所述的点云数据识别方法,其特征在于,所述在所述目标局部数据中增加新数据点,包括:
利用插值法及所述目标局部数据中的数据点生成所述新数据点,并将所述新数据点添加至所述目标局部数据中。
4.根据权利要求1所述的点云数据识别方法,其特征在于,所述融合所述局部特征和所述全局特征得到融合特征,包括:
将所述局部特征对应的局部特征向量与所述全局特征对应的全局特征向量进行拼接,得到所述融合特征。
5.根据权利要求1所述的点云数据识别方法,其特征在于,所述PointNet++网络提取所述局部数据对应的局部特征,包括:
所述PointNet++网络利用预训练的转换矩阵对接收到的局部数据进行对齐,并提取对齐后的局部数据的局部特征。
6.根据权利要求1至5任一项所述的点云数据识别方法,其特征在于,在获取单帧点云数据之前,还包括:
获取点云训练集,并随机初始化所述PointNet++网络、所述ViT网络及所述类型识别过程中所需使用的模型权重;所述点云训练集中的单帧点云训练数据标注有对应的实际分类;
将所述点云训练集中的每一所述单帧点云训练数据分割为所述预设数量的局部训练数据;
将所述单帧点云训练数据对应的局部训练数据输入至所述PointNet++网络和所述ViT网络,并对所述PointNet++网络和所述ViT网络的输出结果进行融合,得到所述单帧点云训练数据的融合特征;
利用所述单帧点云训练数据的融合特征对所述单帧点云训练数据进行类型识别,并利用得到的预测分类及所述单帧点云训练数据的实际分类计算损失值;
利用梯度下降法及所述损失值对所述模型权重进行迭代更新,并进入将所述单帧点云训练数据对应的局部训练数据输入至所述PointNet++网络和所述ViT网络的步骤,直至迭代次数到达预设上限或所述损失值小于预设阈值。
7.一种点云数据识别装置,其特征在于,包括:
获取及分割模块,用于获取单帧点云数据,并将所述单帧点云数据分割为预设数量的局部数据;
第一输入模块,用于将所述局部数据并行输入至所述预设数量的PointNet++网络中,以使所述PointNet++网络提取所述局部数据对应的局部特征;
第二输入模块,用于将所有所述局部数据输入至ViT网络中,以使所述ViT网络提取所述单帧点云数据的全局特征;
融合及识别模块,用于融合所述局部特征和所述全局特征得到融合特征,并利用所述融合特征对所述单帧点云数据进行类型识别。
8.根据权利要求7所述的点云数据识别装置,其特征在于,所述获取及分割模块,包括:
划分子模块,用于利用K均值算法将所述单帧点云数据中的数据点划分至所述预设数量的数据簇中,得到所述局部数据;
统计子模块,用于对每一所述局部数据包含的数据点数量进行统计;
移除子模块,用于若所述数据点数量大于预设数据点数量,则对所述数据点数量对应的目标局部数据中的数据点进行随机移除,直至移除后的数据点数量等于所述预设数据点数量;
增加子模块,用于若所述数据点数量小于所述预设数据点数量,则在所述目标局部数据中增加新数据点,直至增加后的数据点数量等于所述预设数据点数量。
9.一种电子设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至6任一项所述的点云数据识别方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机可执行指令,所述计算机可执行指令被处理器加载并执行时,实现如权利要求1至6任一项所述的点云数据识别方法。
CN202210308663.4A 2022-03-28 2022-03-28 一种点云数据识别方法、装置、电子设备及存储介质 Active CN114419570B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202210308663.4A CN114419570B (zh) 2022-03-28 2022-03-28 一种点云数据识别方法、装置、电子设备及存储介质
PCT/CN2023/081972 WO2023185494A1 (zh) 2022-03-28 2023-03-16 一种点云数据识别方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210308663.4A CN114419570B (zh) 2022-03-28 2022-03-28 一种点云数据识别方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN114419570A true CN114419570A (zh) 2022-04-29
CN114419570B CN114419570B (zh) 2023-04-07

Family

ID=81263029

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210308663.4A Active CN114419570B (zh) 2022-03-28 2022-03-28 一种点云数据识别方法、装置、电子设备及存储介质

Country Status (2)

Country Link
CN (1) CN114419570B (zh)
WO (1) WO2023185494A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115311274A (zh) * 2022-10-11 2022-11-08 四川路桥华东建设有限责任公司 一种基于空间变换自注意力模块的焊缝检测方法及系统
CN116523979A (zh) * 2023-04-24 2023-08-01 北京长木谷医疗科技股份有限公司 基于深度学习的点云配准方法、装置及电子设备
CN116824188A (zh) * 2023-06-05 2023-09-29 腾晖科技建筑智能(深圳)有限公司 一种基于多神经网络集成学习的吊物类型识别方法及系统
WO2023185494A1 (zh) * 2022-03-28 2023-10-05 苏州浪潮智能科技有限公司 一种点云数据识别方法、装置、电子设备及存储介质

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117649530B (zh) * 2024-01-30 2024-04-23 武汉理工大学 基于语义级拓扑结构的点云特征提取方法、系统及设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111489358A (zh) * 2020-03-18 2020-08-04 华中科技大学 一种基于深度学习的三维点云语义分割方法
CN111680542A (zh) * 2020-04-17 2020-09-18 东南大学 基于多尺度特征提取和Pointnet神经网络的钢卷点云识别与分类方法
CN113239981A (zh) * 2021-04-23 2021-08-10 中国科学院大学 局部特征耦合全局表征的图像分类方法
CN113378792A (zh) * 2021-07-09 2021-09-10 合肥工业大学 融合全局和局部信息的弱监督宫颈细胞图像分析方法
US20210365741A1 (en) * 2019-05-08 2021-11-25 Tencent Technology (Shenzhen) Company Limited Image classification method, computer-readable storage medium, and computer device
US20220036564A1 (en) * 2020-08-03 2022-02-03 Korea Advanced Institute Of Science And Technology Method of classifying lesion of chest x-ray radiograph based on data normalization and local patch and apparatus thereof
CN114170411A (zh) * 2021-12-06 2022-03-11 国能大渡河大岗山发电有限公司 一种融合多尺度信息的图片情感识别方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111950467B (zh) * 2020-08-14 2021-06-25 清华大学 基于注意力机制的融合网络车道线检测方法及终端设备
CN112488210A (zh) * 2020-12-02 2021-03-12 北京工业大学 一种基于图卷积神经网络的三维点云自动分类方法
CN112907602B (zh) * 2021-01-28 2022-07-19 中北大学 一种基于改进k-近邻算法的三维场景点云分割方法
CN114419570B (zh) * 2022-03-28 2023-04-07 苏州浪潮智能科技有限公司 一种点云数据识别方法、装置、电子设备及存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210365741A1 (en) * 2019-05-08 2021-11-25 Tencent Technology (Shenzhen) Company Limited Image classification method, computer-readable storage medium, and computer device
CN111489358A (zh) * 2020-03-18 2020-08-04 华中科技大学 一种基于深度学习的三维点云语义分割方法
CN111680542A (zh) * 2020-04-17 2020-09-18 东南大学 基于多尺度特征提取和Pointnet神经网络的钢卷点云识别与分类方法
US20220036564A1 (en) * 2020-08-03 2022-02-03 Korea Advanced Institute Of Science And Technology Method of classifying lesion of chest x-ray radiograph based on data normalization and local patch and apparatus thereof
CN113239981A (zh) * 2021-04-23 2021-08-10 中国科学院大学 局部特征耦合全局表征的图像分类方法
CN113378792A (zh) * 2021-07-09 2021-09-10 合肥工业大学 融合全局和局部信息的弱监督宫颈细胞图像分析方法
CN114170411A (zh) * 2021-12-06 2022-03-11 国能大渡河大岗山发电有限公司 一种融合多尺度信息的图片情感识别方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023185494A1 (zh) * 2022-03-28 2023-10-05 苏州浪潮智能科技有限公司 一种点云数据识别方法、装置、电子设备及存储介质
CN115311274A (zh) * 2022-10-11 2022-11-08 四川路桥华东建设有限责任公司 一种基于空间变换自注意力模块的焊缝检测方法及系统
CN116523979A (zh) * 2023-04-24 2023-08-01 北京长木谷医疗科技股份有限公司 基于深度学习的点云配准方法、装置及电子设备
CN116523979B (zh) * 2023-04-24 2024-01-30 北京长木谷医疗科技股份有限公司 基于深度学习的点云配准方法、装置及电子设备
CN116824188A (zh) * 2023-06-05 2023-09-29 腾晖科技建筑智能(深圳)有限公司 一种基于多神经网络集成学习的吊物类型识别方法及系统
CN116824188B (zh) * 2023-06-05 2024-04-09 腾晖科技建筑智能(深圳)有限公司 一种基于多神经网络集成学习的吊物类型识别方法及系统

Also Published As

Publication number Publication date
CN114419570B (zh) 2023-04-07
WO2023185494A1 (zh) 2023-10-05

Similar Documents

Publication Publication Date Title
CN114419570B (zh) 一种点云数据识别方法、装置、电子设备及存储介质
CN111652217B (zh) 文本检测方法、装置、电子设备及计算机存储介质
CN109190752B (zh) 基于深度学习的全局特征和局部特征的图像语义分割方法
JP7425147B2 (ja) 画像処理方法、テキスト認識方法及び装置
CN113570029A (zh) 获取神经网络模型的方法、图像处理方法及装置
CN110852327A (zh) 图像处理方法、装置、电子设备及存储介质
CN111652181B (zh) 目标跟踪方法、装置及电子设备
CN111179270A (zh) 基于注意力机制的图像共分割方法和装置
CN115019135A (zh) 模型训练、目标检测方法、装置、电子设备及存储介质
CN114581710A (zh) 图像识别方法、装置、设备、可读存储介质及程序产品
CN115546549A (zh) 点云分类模型构建方法、点云分类方法、装置及设备
CN115035347A (zh) 图片识别方法、装置及电子设备
CN114724021A (zh) 一种数据的识别方法、装置、存储介质及电子装置
CN113223011B (zh) 基于引导网络和全连接条件随机场的小样本图像分割方法
CN112668675B (zh) 一种图像处理方法、装置、计算机设备及存储介质
CN114266901A (zh) 文档轮廓提取模型构建方法、装置、设备及可读存储介质
CN114913330B (zh) 点云部件分割方法、装置、电子设备与存储介质
CN117036843A (zh) 目标检测模型训练方法、目标检测方法和装置
CN113537249A (zh) 图像的确定方法、装置、存储介质及电子装置
CN111814865A (zh) 一种图像识别方法、装置、设备及存储介质
CN111738069A (zh) 人脸检测方法、装置、电子设备及存储介质
CN111179283A (zh) 图像语义分割方法及装置、存储介质
CN116778534B (zh) 图像处理方法、装置、设备和介质
CN116071625B (zh) 深度学习模型的训练方法、目标检测方法及装置
CN115049895B (zh) 一种图像属性识别方法、属性识别模型训练方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant