CN109558838B - 一种物体识别方法及系统 - Google Patents

一种物体识别方法及系统 Download PDF

Info

Publication number
CN109558838B
CN109558838B CN201811442246.9A CN201811442246A CN109558838B CN 109558838 B CN109558838 B CN 109558838B CN 201811442246 A CN201811442246 A CN 201811442246A CN 109558838 B CN109558838 B CN 109558838B
Authority
CN
China
Prior art keywords
probability value
data
identified
identification
inputting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811442246.9A
Other languages
English (en)
Other versions
CN109558838A (zh
Inventor
张海强
李世明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingwei Hirain Tech Co Ltd
Original Assignee
Beijing Jingwei Hirain Tech Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingwei Hirain Tech Co Ltd filed Critical Beijing Jingwei Hirain Tech Co Ltd
Priority to CN201811442246.9A priority Critical patent/CN109558838B/zh
Publication of CN109558838A publication Critical patent/CN109558838A/zh
Application granted granted Critical
Publication of CN109558838B publication Critical patent/CN109558838B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • G06V20/13Satellite images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2431Multiple classes

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Astronomy & Astrophysics (AREA)
  • Remote Sensing (AREA)
  • Multimedia (AREA)
  • Traffic Control Systems (AREA)
  • Optical Radar Systems And Details Thereof (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供一种物体识别方法及系统,该方法包括:实时获取扫描待识别物体所产生的列数据,并将列数据逐一输入预先建立的识别模型。在识别模型中对获取到的列数据进行识别,获取由基于列数据得到的待识别物体属于预设的多种物体类别中每一物体类别的概率值,确定概率值最大或者概率值大于阈值的物体类别作为待识别物体的物体类别,识别模型基于样本数据训练神经网络模型获得。在本发明提供的方案中,通过实时获取扫描待识别物体所产生的列数据,并将列数据逐一输入预先建立的识别模型进行识别,获取由基于列数据得到的待识别物体的物体类别,不需要缓存一整帧激光点云数据后再进行物体识别,能降低占用的内存资源、缩短识别延迟时间和处理时间。

Description

一种物体识别方法及系统
技术领域
本发明涉及人工智能技术领域,具体涉及一种物体识别方法及系统。
背景技术
随着科学技术的发展,人工智能领域逐渐成为各行各业研究的重点领域。其中,物体识别是人工智能的一个重要领域,即利用计算机对采集到的图像进行处理、分析和理解,以识别各种不同模式的目标和对象。
目前现有的物体识别技术中,在进行物体识别之前,首先激光雷达旋转一周扫描待识别物体,采集一帧完整的激光点云数据,并存储于缓存中。然后基于整帧激光点云数据进行物体识别。但一方面,由于激光雷达旋转一周需要的时间较长,因此在识别物体时存在较长的时间延迟。另一方面,由于一整帧激光点云数据的数据量较大,因此在处理和缓存一整帧激光点云数据时,需要较长的处理时间和较大的内存资源。
因此,现有的物体识别技术存在识别延迟时间长、处理时间长和占用的内存资源多等问题。
发明内容
有鉴于此,本发明实施例提供一种物体识别方法及系统,以解决现有的物体识别技术存在识别延迟时间长、处理时间长和占用的内存资源多等问题。
为实现上述目的,本发明实施例提供如下技术方案:
本发明实施例第一方面公开了一种物体识别方法,所述方法包括:
实时获取扫描待识别物体所产生的列数据,并将所述列数据逐一输入预先建立的识别模型;
在所述识别模型中对获取到的列数据进行识别,获取由基于所述列数据得到的所述待识别物体属于预设的多种物体类别中每一物体类别的概率值,确定概率值最大或者概率值大于阈值的物体类别作为所述待识别物体的物体类别,所述识别模型基于样本数据训练神经网络模型获得。
可选的,所述实时获取扫描所述待识别物体所产生的列数据,并将所述列数据逐一输入预先建立的识别模型,包括:
利用激光雷达沿逆时针方向或顺时针方向实时扫描所述待识别物体,生成已扫描部分所对应的一条列数据,并将所述列数据逐一输入预先建立的识别模型。
可选的,所述实时获取扫描所述待识别物体所产生的列数据,并将所述列数据逐一输入预先建立的识别模型,包括:
利用激光雷达沿逆时针方向或顺时针方向实时扫描所述待识别物体,生成已扫描部分所对应的一条列数据并缓存;
每缓存b条列数据后,将所述b条列数据构成列数据集合逐一输入预先建立的识别模型,b为大于1小于n的整数,n为利用所述激光雷达扫描所述待识别物体所产生的列数据的总数量。
可选的,所述识别模型基于样本数据训练神经网络模型获得的过程,包括:
将所述样本数据输入预先构建好的神经网络模型中进行识别,获取所述样本数据对应的物体类别属于预设的多种物体类别中每一物体类别的概率值,确定概率值最大或者概率值大于阈值的物体类别为所述样本数据对应的物体类别识别结果;
基于损失函数,计算所述样本数据对应的物体类别识别结果与所述样本数据对应的真实物体类别之间的误差;
判断所述误差是否小于阈值;
若是,确定所述样本数据对应的物体类别识别结果为最终识别结果;
若否,基于所述误差,对所述神经网络模型的权重进行调整,并基于调整后的权重和所述样本数据再次训练得到所述样本数据对应的物体类别识别结果,直至所述误差小于阈值,确定最后一次训练得到的所述样本数据对应的物体类别识别结果为最终识别结果;
基于所述神经网络模型计算所述最终识别结果所使用的权重,建立所述识别模型。
可选的,所述在所述识别模型中对获取到的列数据进行识别,获取由基于所述列数据得到的所述待识别物体属于预设的多种物体类别中每一物体类别的概率值,确定概率值最大或者概率值大于阈值的物体类别作为所述待识别物体的物体类别,包括:
针对每一条列数据,将所述列数据输入所述识别模型的特征提取层,得到第一特征向量;
将所述第一特征向量输入所述识别模型的时序记忆层,得到第二特征向量,其中,所述时序记忆层中的网络单元cell为长短期记忆网络LSTM或者GRU;
将所述第二特征向量输入所述识别模型的全连接层,得到第三特征向量;
将所述第三特征向量输入所述识别模型的输出层中进行处理,得到维度为m的列向量,所述列向量至少包括所述待识别物体属于预设的a种物体类别中每一物体类别的概率值,m为正整数,a为小于等于m的正整数;
在所述输出层中,获取所述待识别物体属于所述预设的a种物体类别中概率值最大或者概率值大于阈值的物体类别,直至在所述输出层中获取由n条列数据得到的N个所述概率值最大或者概率值大于阈值的物体类别,N为大于等于n的正整数,n为所述激光雷达扫描所述待识别物体产生的列数据的数量;
将所述N个物体类别中概率值最大的物体类别作为所述待识别物体的物体类别。
可选的,所述在所述识别模型中对获取到的列数据进行识别,获取由基于所述列数据得到的所述待识别物体属于预设的多种物体类别中每一物体类别的概率值,确定概率值最大或者概率值大于阈值的物体类别作为所述待识别物体的物体类别,包括:
将所述由b条列数据组成的列数据集合输入所述识别模型的特征提取层,得到第一特征矩阵;
将所述第一特征矩阵输入所述识别模型的时序记忆层,得到第二特征矩阵,其中,所述时序记忆层中的网络单元cell为长短期记忆网络LSTM或者GRU;
将所述第二特征矩阵输入所述识别模型的全连接层,得到第三特征矩阵;
将所述第三特征矩阵输入所述识别模型的输出层中进行处理得到维度为m*b的矩阵,所述维度为m*b的矩阵中的每一列向量至少包括所述待识别物体属于预设的a种物体类别中每一物体类别的概率值,m为正整数,a为小于等于m的正整数;
在所述输出层中,基于所述维度为m*b的矩阵,从每列向量中获取所述待识别物体属于所述预设的a种物体类别中概率值最大或者概率值大于阈值的物体类别,得到B个物体类别,B为大于等于b的正整数;
将所述B个物体类别中概率值最大的物体类别作为所述待识别物体的物体类别。
本发明实施例第二方面公开了一种物体识别系统,所述系统包括:
接收单元,用于实时获取扫描待识别物体所产生的列数据,并将所述列数据逐一输入预先建立的识别模型;
识别单元,用于在所述识别模型中对获取到的列数据进行识别,获取由基于所述列数据得到的所述待识别物体属于预设的多种物体类别中每一物体类别的概率值,确定概率值最大或者概率值大于阈值的物体类别作为所述待识别物体的物体类别,所述识别模型基于样本数据训练神经网络模型获得。
可选的,所述接收单元包括:
扫描模块,用于利用激光雷达沿逆时针方向或顺时针方向实时扫描所述待识别物体,生成已扫描部分所对应的一条列数据;
发送模块,用于将所述列数据逐一输入预先建立的识别模型;
缓存模块,用于缓存所述列数据,每缓存b条列数据后,将所述b条列数据构成列数据集合逐一输入预先建立的识别模型,b为大于1小于n的整数,n为利用所述激光雷达扫描所述待识别物体所产生的列数据的总数量。
可选的,所述识别单元包括:
第一特征提取模块,用于针对每一条列数据,将所述列数据输入所述识别模型的特征提取层,得到第一特征向量;
第一时序记忆模块,用于将所述第一特征向量输入所述识别模型的时序记忆层,得到第二特征向量,其中,所述时序记忆层中的网络单元cell为长短期记忆网络LSTM或者GRU;
第一全连接模块,用于将所述第二特征向量输入所述识别模型的全连接层,得到第三特征向量;
第一处理模块,用于将所述第三特征向量输入所述识别模型的输出层中进行处理,得到维度为m的列向量,所述列向量至少包括所述待识别物体属于预设的a种物体类别中每一物体类别的概率值,m为正整数,a为小于等于m的正整数;
第一获取模块,用于在所述输出层中,获取所述待识别物体属于所述预设的a种物体类别中概率值最大或者概率值大于阈值的物体类别,直至在所述输出层中获取由n条列数据得到的N个所述概率值最大或者概率值大于阈值的物体类别,N为大于等于n的正整数,n为所述激光雷达扫描所述待识别物体产生的列数据的数量;
第一输出模块,用于将所述N个物体类别中概率值最大的物体类别作为所述待识别物体的物体类别。
可选的,所述识别单元包括:
第二特征提取模块,用于将所述由b条列数据组成的列数据集合输入所述识别模型的特征提取层,得到第一特征矩阵;
第二时序记忆模块,用于将所述第一特征矩阵输入所述识别模型的时序记忆层,得到第二特征矩阵,其中,所述时序记忆层中的网络单元cell为长短期记忆网络LSTM或者GRU;
第二全连接模块,用于将所述第二特征矩阵输入所述识别模型的全连接层,得到第三特征矩阵;
第二处理模块,用于将所述第三特征矩阵输入所述识别模型的输出层中进行处理得到维度为m*b的矩阵,所述维度为m*b的矩阵中的每一列向量至少包括所述待识别物体属于预设的a种物体类别中每一物体类别的概率值,m为正整数,a为小于等于m的正整数;
第二获取模块,用于在所述输出层中,基于所述维度为m*b的矩阵,从每列向量中获取所述待识别物体属于所述预设的a种物体类别中概率值最大或者概率值大于阈值的物体类别,得到B个物体类别,B为大于等于b的正整数;
第二输出模块,用于将所述B个物体类别中概率值最大的物体类别作为所述待识别物体的物体类别。
基于上述本发明实施例提供的一种物体识别方法及系统,所述方法包括:实时获取扫描待识别物体所产生的列数据,并将列数据逐一输入预先建立的识别模型。在识别模型中对获取到的列数据进行识别,获取由基于列数据得到的待识别物体属于预设的多种物体类别中每一物体类别的概率值,确定概率值最大或者概率值大于阈值的物体类别作为待识别物体的物体类别,识别模型基于样本数据训练神经网络模型获得。在本发明提供的方案中,通过实时获取扫描待识别物体所产生的列数据,并将列数据逐一输入预先建立的识别模型进行识别,获取由基于列数据得到的待识别物体的物体类别,不需要缓存一整帧激光点云数据后再进行物体识别,能降低占用的内存资源、缩短识别延迟时间和处理时间。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的一种物体识别方法的流程图;
图2为本发明实施例提供的基于样本数据训练神经网络模型获得识别模型的流程图;
图3为本发明实施例提供的获取待识别物体的物体类型的流程图;
图4为本发明实施例提供的获取待识别物体的物体类型的流程图;
图5为本发明实施例提供识别模型的结构示意图;
图6为本发明实施例提供的一种物体识别系统的结构框图;
图7为本发明实施例提供的一种物体识别系统的结构框图;
图8为本发明实施例提供的一种物体识别系统的结构框图;
图9为本发明实施例提供的一种物体识别系统的结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本申请中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
由背景技术可知,目前现有的物体识别技术中,在进行物体识别之前,首先激光雷达旋转一周扫描待识别物体,采集一帧完整的激光点云数据,并存储于缓存中。然后基于整帧激光点云数据进行物体识别。但一方面,由于激光雷达旋转一周需要的时间较长,因此在识别物体时存在较长的时间延迟。另一方面,由于一整帧激光点云数据的数据量较大,因此,现有的物体识别技术存在识别延迟时间长、处理时间长和占用的内存资源多等问题。
因此,本发明实施例提供了一种物体识别方法及系统,通过实时获取扫描待识别物体所产生的列数据,并将列数据逐一输入预先建立的识别模型进行识别,获取由基于列数据得到的待识别物体的物体类别,不需要缓存一整帧激光点云数据后再进行物体识别,能降低占用的内存资源、缩短识别延迟时间和处理时间。
参考图1,示出了本发明实施例提供的一种物体识别方法的流程图,所述方法包括以下步骤:
步骤S101:实时获取扫描待识别物体所产生的列数据,并将所述列数据逐一输入预先建立的识别模型。
在具体实现步骤S101的过程中,利用激光雷达沿逆时针方向或顺时针方向实时扫描所述待识别物体,生成已扫描部分所对应的一条列数据。将所述列数据逐一输入预先建立的识别模型。或者,预先缓存所述列数据,每缓存b条列数据后,将由所述b条列数据组成的列数据集合逐一输入预先建立的识别模型,b为大于1小于n的整数,n为利用所述激光雷达扫描所述待识别物体所产生的列数据的总数量。n的具体数值根据激光雷达的型号获得。
需要说明的是,激光雷达在发送所述列数据之前,所述激光雷达需要在当前位置完成对待识别物体的收发和测距,即激光雷达向待识别物体发射雷达信号,然后接收待识别物体反射回来的信号,从而获取待识别物体的距离信息。
需要说明的是,列数据为一帧激光点云数据中一列独立的完整的数据包,列数据的传输方式由技术人员根据实际情况进行选择。上述涉及到的获取列数据的设备包括但不仅限于激光雷达。
步骤S102:在所述识别模型中对获取到的列数据进行识别,获取由基于所述列数据得到的所述待识别物体属于预设的多种物体类别中每一物体类别的概率值,确定概率值最大或者概率值大于阈值的物体类别作为所述待识别物体的物体类别。
在具体实现步骤S102的过程中,所述识别模型基于样本数据训练神经网络模型获得。预先设置所述识别模型能识别的物体类别的个数,比如设置所述识别模型能识别的物体类别为行人、车辆、建筑等物体类型。采用预设的编码方式对所述识别模型的输出结果进行编码,使所述列数据在所述识别模型中的识别结果以概率值的形式输出。
需要说明的是,在获取由基于所述列数据得到的所述待识别物体属于预设的多种物体类别中每一物体类别的概率值时,可能会出现概率值相等且最大的或者概率值大于阈值的多个物体类别,具体如何确定所述待识别物体的物体类别由技术人员根据实际情况进行设置。
需要说明的是,在识别模型中预先设置逻辑判断规则,将重复的物体识别结果或者不合理的物体识别结果删除。具体的判断规则由技术人员根据实际情况进行设置。
为更好解释说明如何确定所述待识别物体的物体类别,下面通过过程A1-A2进行举例说明:
假设预先设置识别模型能识别的物体类型有10种,分别用a1-a10进行表示。
A1、将待识别物体的列数据输入所述识别模型中,得到所述待识别物体分别为a1-a10的概率,若采用softmax方式对所述a1-a10进行编码,则所述待识别物体分别为a1-a10的概率之和为1,假设这10个概率值中最大的物体类别为a2,则确定所述待识别物体的物体类型为a2。
A2、将待识别物体的列数据输入所述识别模型中,得到所述待识别物体分别为a1-a10的概率,若采用sigmoid方式对所述a1-a10进行编码,则所述待识别物体分别为a1-a10的概率都为0到1,假设预先设置概率阈值为0.8,这10个概率中大于0.8的只有a1,则确定所述待识别物体的物体类型为a1。
需要说明的是,上述过程A1-A2涉及的内容仅用于举例说明,具体能识别的物体类别、输出结果的编码方式和概率阈值等由技术人员根据实际情况进行设置。
在本发明实施例中,通过实时获取扫描待识别物体所产生的列数据,并将列数据逐一输入预先建立的识别模型进行识别,获取由基于列数据得到的待识别物体的物体类别,不需要缓存一整帧激光点云数据后再进行物体识别,能降低占用的内存资源、缩短识别延迟时间和处理时间。
上述图1公开的步骤S102中涉及到的基于样本数据训练神经网络模型获得识别模型的过程,参考图2,示出了基于样本数据训练神经网络模型获得识别模型的流程图,包括以下步骤:
步骤S201:将所述样本数据输入预先构建好的神经网络模型中进行识别,获取所述样本数据对应的物体类别属于预设的多种物体类别中每一物体类别的概率值,确定概率值最大或者概率值大于阈值的物体类别为所述样本数据对应的物体类别识别结果。
在具体实现步骤S201的过程中,预先对样本数据中的物体的真实物体类别进行标注。选择长短时记忆循环神经网络(long short-trem memory recurrent neuralnetworks,LSTM-RNN)作为训练使用的神经网络模型。
需要说明的是,所述样本数据的选择和标注、神经网络模型的选择由技术人员根据实际情况进行设置。
步骤S202:基于损失函数,计算所述样本数据对应的物体类别识别结果与所述样本数据对应的真实物体类别之间的误差。
在具体实现步骤S102的过程中,通过损失函数公式(1)计算所述样本数据对应的物体类别识别结果与所述样本数据对应的真实物体类别之间的误差loss。其中,所述样本数据对应的真实物体类别为预先标记好的。
损失函数公式(1)为:
loss=λ(1-IOU)+β(1-Prob_class) (1)
在所述公式(1)中,λ、β为预先设置的权重参数,IOU(intersection over union)是识别的物体立体框和真实物体立体框的交集与并集的比值,(1-IOU)用于量化对样本数据的预测位置和真实位置的差距损失。Prob_class用于表示识别样本数据属于某种物体类别的概率与样本数据的真实物体类别的差距。
需要说明的是,上述涉及到的损失函数包括但不仅限于公式(1)示出的内容,具体的损失函数的设置由技术人员根据实际情况进行设置,在这就不一一赘述。
步骤S203:判断所述误差是否小于阈值。若是,则执行步骤S204,若否,则执行步骤S205。
在具体实现步骤S203的过程中,具体的阈值由技术人员根据实际情况进行设置。
步骤S204:确定所述样本数据对应的物体类别识别结果为最终识别结果。执行步骤S206。
步骤S205:基于所述误差,对所述神经网络模型的权重进行调整,并基于调整后的权重和所述样本数据再次训练得到所述样本数据对应的物体类别识别结果,直至所述误差小于阈值,确定最后一次训练得到的所述样本数据对应的物体类别识别结果为最终识别结果。
在具体实现步骤S205的过程中,基于样本数据不断的训练所述神经网络,直至所述神经网络得到的识别结果与样本数据对应的真实结果之间的误差小于阈值。
步骤S206:基于所述神经网络模型计算所述最终识别结果所使用的权重,建立所述识别模型。
可选的,在具体应用所述识别模型时,可根据识别待识别物体得到的结果和所述待识别物体对应的真实物体类别,实时更新所述识别模型的权重,不断完善并提高所述识别模型的识别精度。具体的更新方式由技术人员根据实际情况进行设置。
在本发明实施例中,通过实时获取扫描待识别物体所产生的列数据,并将列数据逐一输入预先建立的识别模型进行识别,获取由基于列数据得到的待识别物体的物体类别,不需要缓存一整帧激光点云数据后再进行物体识别,能降低占用的内存资源、缩短识别延迟时间和处理时间。
上述图1公开的步骤S102中涉及到的获取待识别物体的物体类型的过程,参考图3,示出了本发明实施例提供的获取待识别物体的物体类型的流程图,包括以下步骤:
步骤S301:针对每一条列数据,将所述列数据输入所述识别模型的特征提取层,得到第一特征向量。
在具体实现步骤S301的过程中,将一条列数据输入所述识别模型的特征提取层中,提取所述一条列数据携带的特征数据,得到维度为预设数值的列向量。
需要说明的是,所述预设数值包括但不限于512或256,具体数值由技术人员根据实际情况进行设置。
步骤S302:将所述第一特征向量输入所述识别模型的时序记忆层,得到第二特征向量。
在具体实现步骤S302的过程中,所述时序记忆层中的网络单元为长短期记忆网络LSTM或者GRU(Gated Recurrent Unit),所述网络单元的大小为预先设置,所述时序记忆层中的网络单元采用双向的2层网络结构。在将所述列数据在所述时序记忆层中进行处理后,时序记忆层中的网络单元会提取并记忆所述列数据携带的特征数据。当下一条列数据输入所述时序记忆层中时,结合预先记忆的上一条列数据的特征数据进行处理。具体记忆的特征数据类型由技术人员根据实际情况进行设置。
需要说明的是,所述时序记忆层中的网络单元和网络单元的结构由技术人员根据实际情况进行设置。
需要说明的是,LSTM是一种时间递归神经网络,用于处理和预测时间序列中间隔和延迟相对较长的重要事件,LSTM包括输入门、遗忘门和输出门。当一条信息进入LSTM时,根据预设规则判断信息是否有用,留下符合规则的信息,通过遗忘门遗忘不符合规则的信息。GRU是LSTM的一种变体,包括更新门和重置门,具体使用效果与LSTM类似。
步骤S303:将所述第二特征向量输入所述识别模型的全连接层,得到第三特征向量。
步骤S304:将所述第三特征向量输入所述识别模型的输出层中进行处理,得到维度为m的列向量,所述列向量至少包括所述待识别物体属于预设的a种物体类别中每一物体类别的概率值。
在具体实现步骤S304的过程中,m为正整数,a为小于等于m的正整数。所述维度为m的列向量包括所述待识别物体的三维坐标值、所述待识别物体的宽度、高度和长度等。所述维度为m的列向量具体包含的数据由技术人员根据实际情况进行说明。为更好的说明所述维度为m的列向量包含的数据,下面通过举例说明:
假设将待识别物体的一条列数据输入所述识别模型中,得到了维度为30的列向量[x,y,z,w,h,l,yaw,pitch,roll,cls1,cls2,…cls21],其中所述维度为30的列向量包含所述待识别物体的三维坐标值:[x,y,z]、所待识别物体的宽度、高度和长度:[w,h,l]、所述待识别物体的姿态数据[yaw,pitch,roll]、所述待识别物体为可识别的21种物体类别中每一物体类别的概率[cls1,cls2,…cls21]。所述待识别物体的姿态为物体的旋转角度、旋转方式和方向。
步骤S305:在所述输出层中,获取所述待识别物体属于所述预设的a种物体类别中概率值最大或者概率值大于阈值的物体类别,直至在所述输出层中获取由n条列数据得到的N个所述概率值最大或者概率值大于阈值的物体类别。
在具体实现步骤S305的过程中,N为大于等于n的正整数,n为所述激光雷达扫描所述待识别物体产生的列数据的数量。所述待识别物体的每一条列数据都经过所述识别模型的处理,每一条列数据都得到一个所述待识别物体属于所述预设的a种物体类别中概率值最大或者概率值大于阈值的物体类别,直到所述识别模型将所述待识别物体对应的最后一条列数据处理完成。即得到N个所述概率值最大或者概率值大于阈值的物体类别。
步骤S306:将所述N个物体类别中概率值最大的物体类别作为所述待识别物体的物体类别。
为更好的解释说明如何通过所述识别模型对所述待识别物体进行识别,获得识别结果,下面通过过程B1-B4进行举例说明:
假设待识别物体对应的列数据有3条,识别模型可以识别的物体种类有3种,分别为b1、b2和b3。获取所述待识别物体属于所述预设的3种物体类别中概率值最大的物体类别。
B1、将第一条列数据输入识别模型中进行识别,获得待识别物体为识别模型可以识别的物体种类中每一种的概率为:[b1=0.2,b2=0.3,b3=0.5]。获取b3=0.5。
B2、将第二条列数据输入识别模型中进行识别,获得待识别物体为识别模型可以识别的物体种类中每一种的概率为:[b1=0.1,b2=0.6,b3=0.3]。获取b2=0.6。
B3、将第三条列数据输入识别模型中进行识别,获得待识别物体为识别模型可以识别的物体种类中每一种的概率为:[b1=0.1,b2=0.8,b3=0.1]。获取b2=0.8。
B4、根据三条列数据获得的三个物体类别b3=0.5,b2=0.6和b2=0.8。确定所述待识别物体为b2。
需要说明的是,上述过程B1-B4中涉及的内容仅用于举例说明,具体的获取待识别物体的物体类型的方式由技术人员根据实际情况进行设置。
在本发明实施例中,通过实时获取扫描待识别物体所产生的列数据,并将列数据逐一输入预先建立的识别模型进行识别,获取由基于列数据得到的待识别物体的物体类别,不需要缓存一整帧激光点云数据后再进行物体识别,能降低占用的内存资源、缩短识别延迟时间和处理时间。
上述图1公开的步骤S102中涉及到的获取待识别物体的物体类型的过程,参考图4,示出了本发明实施例提供的获取待识别物体的物体类型的流程图,包括以下步骤:
步骤S401:将所述由b条列数据组成的列数据集合输入所述识别模型的特征提取层,得到第一特征矩阵。
在具体实现步骤S401的过程中,所述列数据集合包含的列数据可以满足所述识别模型成功识别所述待识别物体的最低要求。将所述列数据集合输入所述识别模型的特征提取层中,得到512*b的特征矩阵。
需要说明的是上述涉及到的特征矩阵的行数仅是用于举例说明,所述特征矩阵的行数和b的取值由技术人员根据实际情况进行设置。
步骤S402:将所述第一特征矩阵输入所述识别模型的时序记忆层,得到第二特征矩阵。
在具体实现步骤S402的过程中,所述时序记忆层中的网络单元cell为长短期记忆网络LSTM或者GRU,具体内容参见上述本发明实施例图3公开的步骤S302相对应的内容,在这就不一一赘述。
步骤S403:将所述第二特征矩阵输入所述识别模型的全连接层,得到第三特征矩阵。
在具体实现步骤S403的过程中,具体内容参见上述本发明实施例图3公开的步骤S303相对应的内容,在这就不一一赘述。
步骤S404:将所述第三特征矩阵输入所述识别模型的输出层中进行处理得到维度为m*b的矩阵,所述维度为m*b的矩阵中的每一列向量至少包括所述待识别物体属于预设的a种物体类别中每一物体类别的概率值。
在具体实现步骤S404的过程中,m为正整数,a为小于等于m的正整数。具体内容参见上述本发明实施例图3公开的步骤S304相对应的内容,在这就不一一赘述。
步骤S405:在所述输出层中,基于所述维度为m*b的矩阵,从每列向量中获取所述待识别物体属于所述预设的a种物体类别中概率值最大或者概率值大于阈值的物体类别,得到B个物体类别。
在具体实现步骤S405的过程中,B为大于等于b的正整数。具体内容参见上述本发明实施例图3公开的步骤S305相对应的内容,在这就不一一赘述。
步骤S406:将所述B个物体类别中概率值最大的物体类别作为所述待识别物体的物体类别。
在具体实现步骤S406的过程中,B为大于等于b的正整数,具体内容参见上述本发明实施例图3公开的步骤S306相对应的内容,在这就不一一赘述。
为更好的解释说明将所述列数据集合输入所述识别模型中进行识别得到待识别物体的类型,下面通过过程C1-C3进行举例说明:
假设预先待识别物体对应的列数据有4条,但是识别模型只需要其中2条就可以将所述待识别物体的物体类型识别出来。识别模型可以识别的物体种类有3种,分别为b1、b2和b3。获取所述待识别物体属于所述预设的3种物体类别中概率值最大的物体类别。
C1、缓存接收到的待识别物体的前两条列数据,将由两条列数据构成的列数据集合输入所述待识别模型中,所述列数据集合中每一条列数据都对应获得待识别物体为识别模型可以识别的物体种类中每一种的概率向量,两条概率向量构成的矩阵为:
Figure BDA0001884957180000151
C2、从所述矩阵中可以获取每一列向量中所述待识别物体属于物体类别b1-b3中概率值最大的物体类别分别为:b2=0.5和b2=0.6。
C3、将b2作为待识别物体的物体类别。
需要说明的是,上述过程C1-C3中涉及的内容仅用于举例说明,具体的获取待识别物体的物体类型的方式由技术人员根据实际情况进行设置。
在本发明实施例中,通过实时获取扫描待识别物体所产生的列数据,并将列数据逐一输入预先建立的识别模型进行识别,获取由基于列数据得到的待识别物体的物体类别,不需要缓存一整帧激光点云数据后再进行物体识别,能降低占用的内存资源、缩短识别延迟时间和处理时间。
参考图5,示出了本发明实施例提供的识别模型的结构示意图,包括输入层、特征提取层、时序记忆层、全连接层和输出层。在所述识别模型中,n为所述待识别物体对应的列数据的数量。
需要说明的是,图5中示出的内容仅仅是用于举例说明,识别模型的具体构成由技术人员根据实际情况进行设置。
在本发明实施例中,通过实时获取扫描待识别物体所产生的列数据,并将列数据逐一输入预先建立的识别模型进行识别,获取由基于列数据得到的待识别物体的物体类别,不需要缓存一整帧激光点云数据后再进行物体识别,能降低占用的内存资源、缩短识别延迟时间和处理时间。
与上述本发明实施例提供的一种物体识别方法相对应,参考图6,本发明实施例还提供了一种物体识别系统的结构框图,所述系统包括:接收单元601和识别单元602。
接收单元601,用于实时获取扫描待识别物体所产生的列数据,并将所述列数据逐一输入预先建立的识别模型。具体内容参见上述本发明实施例图1公开的步骤S101相对应的内容。
识别单元602,用于在所述识别模型中对获取到的列数据进行识别,获取由基于所述列数据得到的所述待识别物体属于预设的多种物体类别中每一物体类别的概率值,确定概率值最大或者概率值大于阈值的物体类别作为所述待识别物体的物体类别,所述识别模型基于样本数据训练神经网络模型获得。具体内容参见上述本发明实施例图1公开的步骤S102相对应的内容。
在本发明实施例中,通过实时获取扫描待识别物体所产生的列数据,并将列数据逐一输入预先建立的识别模型进行识别,获取由基于列数据得到的待识别物体的物体类别,不需要缓存一整帧激光点云数据后再进行物体识别,能降低占用的内存资源、缩短识别延迟时间和处理时间。
参考图7,示出了本发明实施例提供的一种物体识别系统的结构框图,所述接收单元601包括:扫描模块6011、发送模块6012和缓存模块6013。
扫描模块6011,用于利用激光雷达沿逆时针方向或顺时针方向实时扫描所述待识别物体,生成已扫描部分所对应的一条列数据。
发送模块6012,用于将所述列数据逐一输入预先建立的识别模型。
缓存模块6013,用于缓存所述列数据,每缓存b条列数据后,将所述b条列数据构成列数据集合逐一输入预先建立的识别模型,b为大于1小于n的整数,n为利用所述激光雷达扫描所述待识别物体所产生的列数据的总数量。
在本发明实施例中,通过实时获取扫描待识别物体所产生的列数据,并将列数据逐一输入预先建立的识别模型进行识别,获取由基于列数据得到的待识别物体的物体类别,不需要缓存一整帧激光点云数据后再进行物体识别,能降低占用的内存资源、缩短识别延迟时间和处理时间。
参考图8,示出了本发明实施例提供的一种物体识别系统的结构框图,所述识别单元602包括:第一特征提取模块6021、第一时序记忆模块6022、第一全连接模块6023、第一处理模块6024、第一获取模块6025和第一输出模块6026。
第一特征提取模块6021,用于针对每一条列数据,将所述列数据输入所述识别模型的特征提取层,得到第一特征向量。具体内容参见上述本发明实施例图3公开的步骤S301相对应的内容。
第一时序记忆模块6022,用于将所述第一特征向量输入所述识别模型的时序记忆层,得到第二特征向量,其中,所述时序记忆层中的网络单元cell为长短期记忆网络LSTM或者GRU。具体内容参见上述本发明实施例图3公开的步骤S302相对应的内容。
第一全连接模块6023,用于将所述第二特征向量输入所述识别模型的全连接层,得到第三特征向量。具体内容参见上述本发明实施例图3公开的步骤S303相对应的内容。
第一处理模块6024,用于将所述第三特征向量输入所述识别模型的输出层中进行处理,得到维度为m的列向量,所述列向量至少包括所述待识别物体属于预设的a种物体类别中每一物体类别的概率值,m为正整数,a为小于等于m的正整数。具体内容参见上述本发明实施例图3公开的步骤S304相对应的内容。
第一获取模块6025,用于在所述输出层中,获取所述待识别物体属于所述预设的a种物体类别中概率值最大或者概率值大于阈值的物体类别,直至在所述输出层中获取由n条列数据得到的N个所述概率值最大或者概率值大于阈值的物体类别,N为大于等于n的正整数,n为所述激光雷达扫描所述待识别物体产生的列数据的数量。具体内容参见上述本发明实施例图3公开的步骤S305相对应的内容。
第一输出模块6026,用于将所述N个物体类别中概率值最大的物体类别作为所述待识别物体的物体类别。具体内容参见上述本发明实施例图3公开的步骤S306相对应的内容。
在本发明实施例中,通过实时获取扫描待识别物体所产生的列数据,并将列数据逐一输入预先建立的识别模型进行识别,获取由基于列数据得到的待识别物体的物体类别,不需要缓存一整帧激光点云数据后再进行物体识别,能降低占用的内存资源、缩短识别延迟时间和处理时间。
优选的,参考图9,示出了本发明实施例提供的一种物体识别系统的结构框图,所述识别单元602包括:第二特征提取模块6027、第二时序记忆模块6028、第二全连接模块6029、第二处理模块60210、第二获取模块60211和第二输出模块60212。
第二特征提取模块6027,用于将所述由b条列数据组成的列数据集合输入所述识别模型的特征提取层,得到第一特征矩阵。具体内容参见上述本发明实施例图4公开的步骤S401相对应的内容。
第二时序记忆模块6028,用于将所述第一特征矩阵输入所述识别模型的时序记忆层,得到第二特征矩阵,其中,所述时序记忆层中的网络单元cell为长短期记忆网络LSTM或者GRU。具体内容参见上述本发明实施例图4公开的步骤S402相对应的内容。
第二全连接模块6029,用于将所述第二特征矩阵输入所述识别模型的全连接层,得到第三特征矩阵。具体内容参见上述本发明实施例图4公开的步骤S403相对应的内容。
第二处理模块60210,用于将所述第三特征矩阵输入所述识别模型的输出层中进行处理得到维度为m*b的矩阵,所述维度为m*b的矩阵中的每一列向量至少包括所述待识别物体属于预设的a种物体类别中每一物体类别的概率值,m为正整数,a为小于等于m的正整数。具体内容参见上述本发明实施例图4公开的步骤S404相对应的内容。
第二获取模块60211,用于在所述输出层中,基于所述维度为m*b的矩阵,从每列向量中获取所述待识别物体属于所述预设的a种物体类别中概率值最大或者概率值大于阈值的物体类别,得到B个物体类别,B为大于等于b的正整数。具体内容参见上述本发明实施例图4公开的步骤S405相对应的内容。
第二输出模块60212,用于将所述B个物体类别中概率值最大的物体类别作为所述待识别物体的物体类别。具体内容参见上述本发明实施例图4公开的步骤S406相对应的内容。
综上所述,本发明提供一种物体识别方法及系统,该方法包括:实时获取扫描待识别物体所产生的列数据,并将列数据逐一输入预先建立的识别模型。在识别模型中对获取到的列数据进行识别,获取由基于列数据得到的待识别物体属于预设的多种物体类别中每一物体类别的概率值,确定概率值最大或者概率值大于阈值的物体类别作为待识别物体的物体类别,识别模型基于样本数据训练神经网络模型获得。在本发明提供的方案中,通过实时获取扫描待识别物体所产生的列数据,并将列数据逐一输入预先建立的识别模型进行识别,获取由基于列数据得到的待识别物体的物体类别,不需要缓存一整帧激光点云数据后再进行物体识别,能降低占用的内存资源、缩短识别延迟时间和处理时间。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的系统及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种物体识别方法,其特征在于,所述方法包括:
实时获取扫描待识别物体所产生的列数据,并将所述列数据逐一输入预先建立的识别模型,所述列数据为一帧激光点云数据中一列独立的完整的数据包;
在所述识别模型中对获取到的列数据进行识别,获取由基于所述列数据得到的所述待识别物体属于预设的多种物体类别中每一物体类别的概率值,确定概率值最大或者概率值大于阈值的物体类别作为所述待识别物体的物体类别,其中,所述识别模型基于样本数据训练神经网络模型获得,采用预设的编码方式对所述识别模型的输出结果进行编码,使所述列数据在所述识别模型中的识别结果以概率值的形式输出。
2.根据权利要求1所述的方法,其特征在于,所述实时获取扫描所述待识别物体所产生的列数据,并将所述列数据逐一输入预先建立的识别模型,包括:
利用激光雷达沿逆时针方向或顺时针方向实时扫描所述待识别物体,生成已扫描部分所对应的一条列数据,并将所述列数据逐一输入预先建立的识别模型。
3.根据权利要求1所述的方法,其特征在于,所述实时获取扫描所述待识别物体所产生的列数据,并将所述列数据逐一输入预先建立的识别模型,包括:
利用激光雷达沿逆时针方向或顺时针方向实时扫描所述待识别物体,生成已扫描部分所对应的一条列数据并缓存;
每缓存b条列数据后,将所述b条列数据构成列数据集合逐一输入预先建立的识别模型,b为大于1小于n的整数,n为利用所述激光雷达扫描所述待识别物体所产生的列数据的总数量。
4.根据权利要求1所述的方法,其特征在于,所述识别模型基于样本数据训练神经网络模型获得的过程,包括:
将所述样本数据输入预先构建好的神经网络模型中进行识别,获取所述样本数据对应的物体类别属于预设的多种物体类别中每一物体类别的概率值,确定概率值最大或者概率值大于阈值的物体类别为所述样本数据对应的物体类别识别结果;
基于损失函数,计算所述样本数据对应的物体类别识别结果与所述样本数据对应的真实物体类别之间的误差;
判断所述误差是否小于阈值;
若是,确定所述样本数据对应的物体类别识别结果为最终识别结果;
若否,基于所述误差,对所述神经网络模型的权重进行调整,并基于调整后的权重和所述样本数据再次训练得到所述样本数据对应的物体类别识别结果,直至所述误差小于阈值,确定最后一次训练得到的所述样本数据对应的物体类别识别结果为最终识别结果;
基于所述神经网络模型计算所述最终识别结果所使用的权重,建立所述识别模型。
5.根据权利要求2所述的方法,其特征在于,所述在所述识别模型中对获取到的列数据进行识别,获取由基于所述列数据得到的所述待识别物体属于预设的多种物体类别中每一物体类别的概率值,确定概率值最大或者概率值大于阈值的物体类别作为所述待识别物体的物体类别,包括:
针对每一条列数据,将所述列数据输入所述识别模型的特征提取层,得到第一特征向量;
将所述第一特征向量输入所述识别模型的时序记忆层,得到第二特征向量,其中,所述时序记忆层中的网络单元cell为长短期记忆网络LSTM或者GRU;
将所述第二特征向量输入所述识别模型的全连接层,得到第三特征向量;
将所述第三特征向量输入所述识别模型的输出层中进行处理,得到维度为m的列向量,所述列向量至少包括所述待识别物体属于预设的a种物体类别中每一物体类别的概率值,m为正整数,a为小于等于m的正整数;
在所述输出层中,获取所述待识别物体属于所述预设的a种物体类别中概率值最大或者概率值大于阈值的物体类别,直至在所述输出层中获取由n条列数据得到的N个所述概率值最大或者概率值大于阈值的物体类别,N为大于等于n的正整数,n为所述激光雷达扫描所述待识别物体产生的列数据的数量;
将所述N个物体类别中概率值最大的物体类别作为所述待识别物体的物体类别。
6.根据权利要求3所述的方法,其特征在于,所述在所述识别模型中对获取到的列数据进行识别,获取由基于所述列数据得到的所述待识别物体属于预设的多种物体类别中每一物体类别的概率值,确定概率值最大或者概率值大于阈值的物体类别作为所述待识别物体的物体类别,包括:
将所述由b条列数据组成的列数据集合输入所述识别模型的特征提取层,得到第一特征矩阵;
将所述第一特征矩阵输入所述识别模型的时序记忆层,得到第二特征矩阵,其中,所述时序记忆层中的网络单元cell为长短期记忆网络LSTM或者GRU;
将所述第二特征矩阵输入所述识别模型的全连接层,得到第三特征矩阵;
将所述第三特征矩阵输入所述识别模型的输出层中进行处理得到维度为m*b的矩阵,所述维度为m*b的矩阵中的每一列向量至少包括所述待识别物体属于预设的a种物体类别中每一物体类别的概率值,m为正整数,a为小于等于m的正整数;
在所述输出层中,基于所述维度为m*b的矩阵,从每列向量中获取所述待识别物体属于所述预设的a种物体类别中概率值最大或者概率值大于阈值的物体类别,得到B个物体类别,B为大于等于b的正整数;
将所述B个物体类别中概率值最大的物体类别作为所述待识别物体的物体类别。
7.一种物体识别系统,其特征在于,所述系统包括:
接收单元,用于实时获取扫描待识别物体所产生的列数据,并将所述列数据逐一输入预先建立的识别模型,所述列数据为一帧激光点云数据中一列独立的完整的数据包;
识别单元,用于在所述识别模型中对获取到的列数据进行识别,获取由基于所述列数据得到的所述待识别物体属于预设的多种物体类别中每一物体类别的概率值,确定概率值最大或者概率值大于阈值的物体类别作为所述待识别物体的物体类别,其中,所述识别模型基于样本数据训练神经网络模型获得,采用预设的编码方式对所述识别模型的输出结果进行编码,使所述列数据在所述识别模型中的识别结果以概率值的形式输出。
8.根据权利要求7所述的系统,其特征在于,所述接收单元包括:
扫描模块,用于利用激光雷达沿逆时针方向或顺时针方向实时扫描所述待识别物体,生成已扫描部分所对应的一条列数据;
发送模块,用于将所述列数据逐一输入预先建立的识别模型;
缓存模块,用于缓存所述列数据,每缓存b条列数据后,将所述b条列数据构成列数据集合逐一输入预先建立的识别模型,b为大于1小于n的整数,n为利用所述激光雷达扫描所述待识别物体所产生的列数据的总数量。
9.根据权利要求8所述的系统,其特征在于,所述识别单元包括:
第一特征提取模块,用于针对每一条列数据,将所述列数据输入所述识别模型的特征提取层,得到第一特征向量;
第一时序记忆模块,用于将所述第一特征向量输入所述识别模型的时序记忆层,得到第二特征向量,其中,所述时序记忆层中的网络单元cell为长短期记忆网络LSTM或者GRU;
第一全连接模块,用于将所述第二特征向量输入所述识别模型的全连接层,得到第三特征向量;
第一处理模块,用于将所述第三特征向量输入所述识别模型的输出层中进行处理,得到维度为m的列向量,所述列向量至少包括所述待识别物体属于预设的a种物体类别中每一物体类别的概率值,m为正整数,a为小于等于m的正整数;
第一获取模块,用于在所述输出层中,获取所述待识别物体属于所述预设的a种物体类别中概率值最大或者概率值大于阈值的物体类别,直至在所述输出层中获取由n条列数据得到的N个所述概率值最大或者概率值大于阈值的物体类别,N为大于等于n的正整数,n为所述激光雷达扫描所述待识别物体产生的列数据的数量;
第一输出模块,用于将所述N个物体类别中概率值最大的物体类别作为所述待识别物体的物体类别。
10.根据权利要求8所述的系统,其特征在于,所述识别单元包括:
第二特征提取模块,用于将所述由b条列数据组成的列数据集合输入所述识别模型的特征提取层,得到第一特征矩阵;
第二时序记忆模块,用于将所述第一特征矩阵输入所述识别模型的时序记忆层,得到第二特征矩阵,其中,所述时序记忆层中的网络单元cell为长短期记忆网络LSTM或者GRU;
第二全连接模块,用于将所述第二特征矩阵输入所述识别模型的全连接层,得到第三特征矩阵;
第二处理模块,用于将所述第三特征矩阵输入所述识别模型的输出层中进行处理得到维度为m*b的矩阵,所述维度为m*b的矩阵中的每一列向量至少包括所述待识别物体属于预设的a种物体类别中每一物体类别的概率值,m为正整数,a为小于等于m的正整数;
第二获取模块,用于在所述输出层中,基于所述维度为m*b的矩阵,从每列向量中获取所述待识别物体属于所述预设的a种物体类别中概率值最大或者概率值大于阈值的物体类别,得到B个物体类别,B为大于等于b的正整数;
第二输出模块,用于将所述B个物体类别中概率值最大的物体类别作为所述待识别物体的物体类别。
CN201811442246.9A 2018-11-29 2018-11-29 一种物体识别方法及系统 Active CN109558838B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811442246.9A CN109558838B (zh) 2018-11-29 2018-11-29 一种物体识别方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811442246.9A CN109558838B (zh) 2018-11-29 2018-11-29 一种物体识别方法及系统

Publications (2)

Publication Number Publication Date
CN109558838A CN109558838A (zh) 2019-04-02
CN109558838B true CN109558838B (zh) 2021-02-02

Family

ID=65867880

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811442246.9A Active CN109558838B (zh) 2018-11-29 2018-11-29 一种物体识别方法及系统

Country Status (1)

Country Link
CN (1) CN109558838B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113051969A (zh) * 2019-12-26 2021-06-29 深圳市超捷通讯有限公司 物件识别模型训练方法及车载装置
CN111259958B (zh) * 2020-01-15 2024-04-16 北京市商汤科技开发有限公司 物体识别方法及装置、存储介质
CN111310765A (zh) * 2020-02-14 2020-06-19 北京经纬恒润科技有限公司 激光点云语义分割方法和装置
CN111339876B (zh) * 2020-02-19 2023-09-01 北京百度网讯科技有限公司 用于识别场景中各区域类型的方法和装置
CN111709479B (zh) * 2020-06-17 2022-05-10 广东工业大学 一种图像分类方法和装置
WO2022217522A1 (zh) * 2021-04-14 2022-10-20 深圳市大疆创新科技有限公司 目标感知方法、装置、探测系统、可移动平台及存储介质
CN115630289B (zh) * 2022-12-21 2023-09-26 白杨时代(北京)科技有限公司 一种基于证据理论的目标识别方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107539160A (zh) * 2017-09-29 2018-01-05 深圳悉罗机器人有限公司 充电桩及其识别方法、智能移动机器人
CN107826115A (zh) * 2017-10-26 2018-03-23 杨晓艳 一种汽车识别方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103854320B (zh) * 2012-12-05 2016-06-22 上海海事大学 基于激光雷达的车型自动识别方法
CN106127153B (zh) * 2016-06-24 2019-03-05 南京林业大学 车载激光扫描点云数据的交通标牌识别方法
US10528321B2 (en) * 2016-12-07 2020-01-07 Microsoft Technology Licensing, Llc Block floating point for neural network implementations
CN108229287B (zh) * 2017-05-31 2020-05-22 北京市商汤科技开发有限公司 图像识别方法和装置、电子设备和计算机存储介质
CN107392109A (zh) * 2017-06-27 2017-11-24 南京邮电大学 一种基于深度神经网络的新生儿疼痛表情识别方法
CN107807971A (zh) * 2017-10-18 2018-03-16 北京信息科技大学 一种自动图像语义描述方法
CN108710818A (zh) * 2018-03-09 2018-10-26 唐义 一种基于三维激光雷达的人数实时监测统计系统及方法
CN108416065B (zh) * 2018-03-28 2021-08-31 复旦大学 基于层级神经网络的图像-句子描述生成系统及方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107539160A (zh) * 2017-09-29 2018-01-05 深圳悉罗机器人有限公司 充电桩及其识别方法、智能移动机器人
CN107826115A (zh) * 2017-10-26 2018-03-23 杨晓艳 一种汽车识别方法

Also Published As

Publication number Publication date
CN109558838A (zh) 2019-04-02

Similar Documents

Publication Publication Date Title
CN109558838B (zh) 一种物体识别方法及系统
CN111127513B (zh) 一种多目标跟踪方法
CN109978893B (zh) 图像语义分割网络的训练方法、装置、设备及存储介质
CN112052787B (zh) 基于人工智能的目标检测方法、装置及电子设备
CN109087510B (zh) 交通监测方法及装置
CN110929577A (zh) 一种基于YOLOv3的轻量级框架改进的目标识别方法
CN109558823B (zh) 一种以图搜图的车辆识别方法及系统
CN110378297B (zh) 基于深度学习的遥感图像目标检测方法、装置、及存储介质
CN114419878B (zh) 城市路网全域交通状态预测的方法、电子装置和存储介质
CN113139052B (zh) 基于图神经网络特征聚合的谣言检测方法及装置
CN115546519B (zh) 一种提取伪图像特征的图像和毫米波雷达目标的匹配方法
CN109948635A (zh) 一种基于激光扫描的目标识别方法及装置
CN110852358A (zh) 一种基于深度学习的车辆类型判别方法
CN114120299A (zh) 信息获取方法、装置、存储介质及设备
CN114842285A (zh) 路侧泊位号码识别方法以及装置
CN117037006B (zh) 一种高续航能力的无人机跟踪方法
CN112215188A (zh) 交警姿态识别方法、装置、设备及存储介质
CN115856874A (zh) 毫米波雷达点云降噪方法、装置、设备及存储介质
CN116091964A (zh) 高位视频场景解析方法以及系统
CN114943873A (zh) 一种工地人员异常行为分类方法及装置
CN115880654A (zh) 车辆变道的风险评估方法、装置、计算机设备和存储介质
CN115115680A (zh) 图像处理方法、装置、设备以及存储介质
CN114519791A (zh) 车牌字符识别方法以及装置
Fatkhulin et al. Analysis of the Basic Image Generation Methods by Neural Networks
CN112787882A (zh) 一种物联网边缘流量预测方法、装置及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 4 / F, building 1, No.14 Jiuxianqiao Road, Chaoyang District, Beijing 100020

Applicant after: Beijing Jingwei Hengrun Technology Co., Ltd

Address before: 8 / F, block B, No. 11, Anxiang Beili, Chaoyang District, Beijing 100101

Applicant before: Beijing Jingwei HiRain Technologies Co.,Ltd.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant