CN112241748A - 一种基于多源信息熵差异性的数据降维方法及装置 - Google Patents

一种基于多源信息熵差异性的数据降维方法及装置 Download PDF

Info

Publication number
CN112241748A
CN112241748A CN201910641487.4A CN201910641487A CN112241748A CN 112241748 A CN112241748 A CN 112241748A CN 201910641487 A CN201910641487 A CN 201910641487A CN 112241748 A CN112241748 A CN 112241748A
Authority
CN
China
Prior art keywords
feature
characteristic
matrix
information entropy
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910641487.4A
Other languages
English (en)
Inventor
王振男
连陈帆
钟国旗
刘前飞
高翔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Automobile Group Co Ltd
Original Assignee
Guangzhou Automobile Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Automobile Group Co Ltd filed Critical Guangzhou Automobile Group Co Ltd
Priority to CN201910641487.4A priority Critical patent/CN112241748A/zh
Publication of CN112241748A publication Critical patent/CN112241748A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods

Abstract

本发明提供一种基于多源信息熵差异性的数据降维方法及装置,所述方法包括提取特征数据集合,特征数据集合包括每一车辆的特征数据样本,每一特征数据样本包括多个特征矩阵,每一特征矩阵包括多个特征向量;在每一车辆的特征数据样本的多个特征矩阵中,统计每一特征向量为相同数据的概率并计算每一特征向量所属特征矩阵的信息熵;根据每一车辆的同一特征矩阵的信息熵,计算特征矩阵的信息熵集合的均值;根据特征矩阵的信息熵集合的均值和信息熵集合计算特征矩阵的信息熵集合的方差;比较信息熵集合的方差和阈值;当信息熵集合的方差小于阈值时,删除每一车辆的特征矩阵。通过本发明,解决了现有数据维度增加、处理效率低且有大量无用信息问题。

Description

一种基于多源信息熵差异性的数据降维方法及装置
技术领域
本发明涉及汽车技术领域,尤其涉及一种基于多源信息熵差异性的数据降维方法及装置。
背景技术
环境感知技术是智能汽车的关键技术之一,是智能汽车实现自主决策、路径规划等功能的基础。智能驾驶汽车环境感知系统常用的传感器包括激光雷达、摄像头、毫米波雷达及超声波雷达等。每种传感器适用场景和作用范围不同,多传感器融合可实现感知数据上的互补,如激光雷达可生成大范围的高精度三维环境的点云,但其点云数据比较稀疏且无法应用于雨雪雾等恶劣天气,毫米波和超声波雷达可弥补这一缺点但相应的作用范围较短,精度较低。因此智能汽车环境感知系统需充分调用多个传感器,对多个传感器的数据进行合理分配和使用,把在时间或者空间上冗杂的信息进行精简或者将互补的信息按照某种准则进行组合,从而得到被测对象的一致性解释,输出最终可靠的外界环境描述,进而提高决策系统的准确性。
使用多个传感器会使得待处理的信息数据维度剧增、处理效率降低且信息中会有大量冗杂或矛盾的信息。
发明内容
本发明所要解决的技术问题在于,提供一种基于多源信息熵差异性的数据降维方法及装置,降低多个传感器获取信息数据的维度,提升处理效率并删除冗杂或矛盾的信息。
本发明提供的一种基于多源信息熵差异性的数据降维方法,所述方法包括:
在从每一车辆的多个传感器同一时刻获取的数据中提取特征数据集合,所述特征数据集合包括每一车辆的特征数据样本,每一特征数据样本包括多个特征矩阵,每一特征矩阵包括多个特征向量。
在每一车辆的所述特征数据样本的多个特征矩阵中,统计每一特征向量与其它特征矩阵中同一位的特征向量为相同数据的概率;
根据所述每一特征向量与其它特征矩阵中同一位的特征向量为相同数据的概率,计算所述每一特征向量所属特征矩阵的信息熵;
根据每一车辆的同一特征矩阵的信息熵,计算所述特征矩阵的信息熵集合的均值;
根据所述特征矩阵的信息熵集合的均值、所述每一车辆的同一特征矩阵的信息熵集合计算所述特征矩阵的信息熵集合的方差;
比较所述特征矩阵的信息熵集合的方差和预设特征阈值;
当所述特征矩阵的信息熵集合的方差小于所述预设特征阈值时,删除所述每一车辆的所述特征矩阵,形成降维的每一特征数据样本。
进一步地,所述特征数据集合为X={x1,x2,...,xN},所述N为车辆的数量,所述xN为第N辆车的特征数据样本;其中每一特征数据样本包括多个特征矩阵,表示为
Figure BDA0002132034900000021
所述
Figure BDA0002132034900000022
为第i辆车的第d个传感器所采集到的一个特征矩阵;每一特征矩阵表示为
Figure BDA0002132034900000023
所述
Figure BDA0002132034900000024
为所述特征矩阵,
Figure BDA0002132034900000025
为特征向量,m为每一特征矩阵所包含特征向量的数量。
进一步地,根据所述每一特征向量与其它特征矩阵中同一位的特征向量为相同数据的概率,计算所述每一特征向量所属特征矩阵的信息熵的计算公式具体为:
Figure BDA0002132034900000026
其中,所述每一特征矩阵
Figure BDA0002132034900000027
的信息熵为
Figure BDA0002132034900000028
所述
Figure BDA0002132034900000029
为每一特征向量与其它特征矩阵中同一位的特征向量为相同数据的概率。
进一步地,根据每一车辆的同一特征矩阵的信息熵,计算所述特征矩阵的信息熵集合的均值的步骤通过下述公式:
Figure BDA00021320349000000210
其中,
Figure BDA00021320349000000211
为所述特征矩阵的信息熵集合,所述M为特征矩阵的信息熵集合的均值。
进一步地,根据所述特征矩阵的信息熵集合的均值、所述每一车辆的同一特征矩阵的信息熵集合计算所述特征矩阵的信息熵集合的方差的步骤具体采用下述公式来计算所述特征矩阵的信息熵集合的方差:
Figure BDA0002132034900000031
其中,
Figure BDA0002132034900000032
为所述特征矩阵的信息熵集合的方差。
进一步地,比较所述特征矩阵的信息熵集合的方差和预设特征阈值之前还包括如下步骤:
利用所述多个传感器获取天气信息、时间信息和工况信息;
根据所述天气信息、时间信息和工况信息,选取与所述天气信息和工况信息对应的预设特征阈值。
进一步地,所述方法还包括如下步骤:
当所述特征矩阵的信息熵集合的方差大于或等于所述预设特征阈值时,保留所述每一车辆的所述特征矩阵。
本发明提供的一种适用于车辆传感器信号的滤波装置,所述装置包括:
第一获取单元,用于从每一车辆的多个传感器同一时刻获取的数据提取特征数据集合,所述特征数据集合包括每一车辆的特征数据样本,每一特征数据样本包括多个特征矩阵,每一特征矩阵包括多个特征向量;
统计单元,用于在每一车辆的所述特征数据样本的多个特征矩阵中,统计每一特征向量与其它特征矩阵中同一位的特征向量为相同数据的概率;
第一计算单元,用于根据所述每一特征向量与其它特征矩阵中同一位的特征向量为相同数据的概率,计算所述每一特征向量所属特征矩阵的信息熵;
第二计算单元,用于根据每一车辆的同一特征矩阵的信息熵,计算所述特征矩阵的信息熵集合的均值;
第三计算单元,用于根据所述特征矩阵的信息熵集合的均值、所述每一车辆的同一特征矩阵的信息熵集合计算所述特征矩阵的信息熵集合的方差;
运算单元,用于比较所述特征矩阵的信息熵集合的方差和预设特征阈值;
处理单元,用于当所述特征矩阵的信息熵集合的方差小于所述预设特征阈值时,删除所述每一车辆的所述特征矩阵,形成降维的每一特征数据样本。
进一步地,所述装置还包括:
第二获取单元,利用所述多个传感器获取天气信息和工况信息;
选择单元,用于根据所述天气信息和工况信息,选取与所述天气信息和工况信息对应的预设特征阈值。
进一步地,所述处理单元还用于当所述特征矩阵的信息熵集合的方差大于或等于所述预设特征阈值时,保留所述每一车辆的所述特征矩阵。
实施本发明,具有如下有益效果:
通过本发明,计算特征矩阵的信息熵,并且根据信息熵的均值和信息熵求取均值,通过均值与预设阈值进行大小比较,挑选出均值大于预设阈值保留,将均值小于或等于预设阈值删除,即保留数据中区别较大的特征,又将无用的冗余数据删除;解决了现有的问题待处理的信息数据维度剧增、处理效率降低且信息中有大量冗杂或矛盾的信息。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的基于多源信息熵差异性的数据降维方法的流程图。
图2是本发明实施例提供的基于多源信息熵差异性的数据降维方法的具体案例运算流程图。
图3是本发明实施例提供的基于多源信息熵差异性的数据降维装置的结构图。
具体实施方式
本专利核心内容为通过运算挑选出多维数据中的冗余数据删除,并保留原有数据的特征,以下结合附图和实施例对该具体实施方式做进一步说明。
下面将详细描述本发明提供的基于多源信息熵差异性的数据降维方法及装置的实施例。
如图1所示,本发明实施例提供了基于多源信息熵差异性的数据降维方法,所述方法包括:
步骤S11、在从每一车辆的多个传感器同一时刻获取的数据中提取特征数据集合,所述特征数据集合包括每一车辆的特征数据样本,每一特征数据样本包括多个特征矩阵,每一特征矩阵包括多个特征向量。
具体地,所述特征数据集合为X={x1,x2,...,xN},所述N为车辆的数量,所述xN为第N辆车的特征数据样本,其中每一特征数据样本包括多个特征矩阵,表示为
Figure BDA0002132034900000051
所述
Figure BDA0002132034900000052
为第i辆车的第d个传感器所采集到的一个特征矩阵,每一特征矩阵表示为
Figure BDA0002132034900000053
所述
Figure BDA0002132034900000054
为所述特征矩阵,
Figure BDA0002132034900000055
为特征向量,m为每一特征矩阵所包含特征向量的数量。
需要说明的是,在无人驾驶车辆的环境感知系统中,需采集相机、激光雷达、毫米波雷达等多个传感器的数据;特征数据集合X={x1,x2,...,xN}相当于多辆车辆的多个传感器获取的数据,xN为第N辆车的特征数据样本,其中每一特征数据样本包括多个特征矩阵,每一特征矩阵可以理解为一个传感器所采集到的一个特征矩阵,例如特征数据样本
Figure BDA0002132034900000056
Figure BDA0002132034900000057
为第i辆车的第d个传感器所采集到的一个特征矩阵,每一特征矩阵表示为
Figure BDA0002132034900000058
Figure BDA0002132034900000059
为特征向量,特征向量可以是坐标、方向等信息。
步骤S12、在每一车辆的所述特征数据样本的多个特征矩阵,统计每一特征向量与其它特征矩阵中同一位的特征向量为相同数据的概率。
需要说明的是,假定每辆车上有8个传感器,需要统计每一特征向量
Figure BDA00021320349000000510
与其它特征矩阵中同一位的特征向量为相同数据的概率,例如要统计第一辆车的第一个传感器获取的特征向量
Figure BDA00021320349000000511
其他七个传感器获取的特征向量
Figure BDA00021320349000000512
与所述第一个传感器获取的特征向量
Figure BDA00021320349000000513
属于同一位的特征向量,则将第一辆车的每个传感器获取的特征向量
Figure BDA00021320349000000514
列出来,用与待统计特征向量为相同数据的特征向量
Figure BDA0002132034900000061
数量比上传感器的数量,既可以得到每一特征向量为相同数据的概率;假定8个传感器,分别获得8个特征矩阵,8个特征矩阵中特征向量
Figure BDA0002132034900000062
分别为001、010、000、010、001、001、111、001,则第1个特征矩阵中
Figure BDA0002132034900000063
的数据为001,出现相同的次数为4次,出现概率为4/8;第2个特征矩阵中
Figure BDA0002132034900000064
的数据为010,出现相同的次数为2次,出现概率为2/8;第3个特征矩阵中
Figure BDA0002132034900000065
的数据为000,出现相同的次数为1次,出现概率为1/8;其他特征矩阵中
Figure BDA0002132034900000066
同样的方法可以计算获得。
步骤S13、根据所述每一特征向量与其它特征矩阵中同一位的特征向量为相同数据的概率,计算所述每一特征向量所属特征矩阵的信息熵。
具体地,实现步骤S13的公式具体为
Figure BDA0002132034900000067
所述每一特征矩阵
Figure BDA0002132034900000068
的信息熵为
Figure BDA0002132034900000069
所述
Figure BDA00021320349000000610
为每一特征向量与其它特征矩阵中同一位的特征向量为相同数据的概率。
需要说明的是,信息熵是用来衡量一个随机变量出现的期望值,代表了排除冗余后的平均信息量。当信息熵用于特征时,如果一个特征的信息熵越大,说明其能提供更多的信息;反之如果一个特征的信息熵越小,说明其能提供的信息有限。
步骤S14、根据每一车辆的同一特征矩阵的信息熵,计算所述特征矩阵的信息熵集合的均值。
具体地,实现步骤S14公式具体为
Figure BDA00021320349000000611
Figure BDA00021320349000000612
为所述特征矩阵的信息熵集合,所述M为特征矩阵的信息熵集合的均值。
步骤S15、根据所述特征矩阵的信息熵集合的均值、所述每一车辆的同一特征矩阵的信息熵集合计算所述特征矩阵的信息熵集合的方差。
具体地,实现步骤S15公式具体为
Figure BDA0002132034900000071
Figure BDA0002132034900000072
为所述特征矩阵的信息熵集合的方差。
需要说明的是,方差可用来衡量一组数据的离散程度,方差越大表明特征在样本间的差异性越大,方差大的特征可直接区分样本空间。
步骤S16、比较所述特征矩阵的信息熵集合的方差和预设特征阈值。
需要说明的是,由于方差代表的是数据的平均波动程度,避免了比较绝对差对数据大小敏感的缺点,故只需在所有样本间设置一个固定的阈值就可以区分所有特征。阈值的大小决定了特征选取的数量和质量,因而需要通过反复实验的方法选取一个合理的预设特征阈值。
进一步需要说明的是,实际驾驶场景中存在着复杂多样的天气(晴天、雨天、雪天等)、时间(日间、夜间等)和工况(市区普通道路、环路、高速路等),而不同的传感器对于不同的天气和工况表现出不同的效果和特点,比如激光雷达探测距离较远、能获取大范围内物体的高精度三维信息,但无法应用于雨雪雾等恶劣天气;毫米波雷达和超声波雷达对恶劣天气的适用能力更强,却存在探测距离近、精度较低等缺点;而摄像头虽然具有较高的分辨率但受环境光的限制比较大。因此为获取足够有效的信息,在不同场景下对不同的传感器需具有不同的置信度。在天气良好的日间,由于摄像头的成像信息更加丰富,更有利于进行各类识别分类,因此具有更高的置信度;在夜间进行驾驶时,黑暗的环境限制了摄像头的应用,但激光雷达却不易受光线条件的影响,仍表现出不错的效果,所以激光雷达在夜间能提供更为有效的信息;而在雨雪雾等恶劣天气下,由于毫米波雷达穿透烟雾的能力更强,其置信度会相对更高。因此在不同的驾驶场景下,分类算法对于不同传感器数据的依赖性存在显著不同。基于上述特点,本发明在不同驾驶场景下进行大量的实验和参数调校,从而针对不同天气、不同时间和不同工况调校出相应的最优预设特征阈值,车辆可以根据实时获取的天气信息、时间信息和工况信息选择对应的预设特征阈值。
进一步地,所述步骤S16之前还包括:
利用所述多个传感器获取天气信息、时间信息和工况信息;
根据所述天气信息、时间信息和工况信息,选取与所述天气信息、时间信息和工况信息对应的预设特征阈值。
步骤S17、当所述特征矩阵的信息熵集合的方差小于所述预设特征阈值时,删除所述每一车辆的所述特征矩阵,形成降维的每一特征数据样本。
需要说明的是,方差衡量的是特征对样本分类的重要程度,通过设置合理的阈值,并将不同场景下的特征信息熵方差与相应的阈值进行比较,可以筛选出差异性大的特征子集,实现特征的有效降维。如果特征信息熵方差大于阈值,说明该特征在各样本间差异性较大,可以较好的区分各类样本则保留该特征。如果特征信息熵方差小于阈值,说明该特征不能有效的分类样本则舍弃该特征。
进一步地,所述方法还包括:
当所述特征矩阵的信息熵集合的方差大于或等于所述预设特征阈值时,保留所述每一车辆的所述特征矩阵。
如图2所示,本发明实施例提供了基于多源信息熵差异性的数据降维方法的具体案例,获取到了包括多个样本的特征数据集合,计算得到信息熵如图中所示,然后针对信息熵集合计算平均值,基于信息熵和信息熵的均值计算信息熵集合的方差,比较方差与预设阈值,筛选出方差较大的特征,其余方差较小的特征被删除,达到了降低数据维度的效果。
如图3所示,本发明实施例提供了基于多源信息熵差异性的数据降维装置,所述装置包括:
第一获取单元31,用于从每一车辆的多个传感器同一时刻获取的数据提取特征数据集合,所述特征数据集合包括每一车辆的特征数据样本,每一特征数据样本包括多个特征矩阵,每一特征矩阵包括多个特征向量;
统计单元32,用于在每一车辆的所述特征数据样本的多个特征矩阵中,统计每一特征向量与其它特征矩阵中同一位的特征向量为相同数据的概率;
第一计算单元33,用于根据所述每一特征向量与其它特征矩阵中同一位的特征向量为相同数据的概率,计算所述每一特征向量所属特征矩阵的信息熵;
第二计算单元34,用于根据每一车辆的同一特征矩阵的信息熵,计算所述特征矩阵的信息熵集合的均值;
第三计算单元35,用于根据所述特征矩阵的信息熵集合的均值、所述每一车辆的同一特征矩阵的信息熵集合计算所述特征矩阵的信息熵集合的方差;
运算单元36,用于比较所述特征矩阵的信息熵集合的方差和预设特征阈值;
处理单元37,用于当所述特征矩阵的信息熵集合的方差小于所述预设特征阈值时,删除所述每一车辆的所述特征矩阵,形成降维的每一特征数据样本。
进一步地,所述装置还包括:
第二获取单元,利用所述多个传感器获取天气信息和工况信息;
选择单元,用于根据所述天气信息和工况信息,选取与所述天气信息和工况信息对应的预设特征阈值。
进一步地,所述处理单元37还用于当所述特征矩阵的信息熵集合的方差大于或等于所述预设特征阈值时,保留所述每一车辆的所述特征矩阵。
实施本发明,具有如下有益效果:
通过本发明,计算特征矩阵的信息熵,并且根据信息熵的均值和信息熵求取均值,通过均值与预设阈值进行大小比较,挑选出均值大于预设阈值保留,将均值小于或等于预设阈值删除,即保留数据中区别较大的特征,又将无用的冗余数据删除;解决了现有的问题待处理的信息数据维度剧增、处理效率降低且信息中有大量冗杂或矛盾的信息。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

Claims (10)

1.一种基于多源信息熵差异性的数据降维方法,其特征在于,所述方法包括:
S11、在从每一车辆的多个传感器同一时刻获取的数据中提取特征数据集合,所述特征数据集合包括每一车辆的特征数据样本,每一特征数据样本包括多个特征矩阵,每一特征矩阵包括多个特征向量;
S12、在每一车辆的所述特征数据样本的多个特征矩阵中,统计每一特征向量与其它特征矩阵中同一位的特征向量为相同数据的概率;
S13、根据所述每一特征向量与其它特征矩阵中同一位的特征向量为相同数据的概率,计算所述每一特征向量所属特征矩阵的信息熵;
S14、根据每一车辆的同一特征矩阵的信息熵,计算所述特征矩阵的信息熵集合的均值;
S15、根据所述特征矩阵的信息熵集合的均值、所述每一车辆的同一特征矩阵的信息熵集合计算所述特征矩阵的信息熵集合的方差;
S16、比较所述特征矩阵的信息熵集合的方差和预设特征阈值;
S17、当所述特征矩阵的信息熵集合的方差小于所述预设特征阈值时,删除所述每一车辆的所述特征矩阵,形成降维的每一特征数据样本。
2.如权利要求1所述的方法,其特征在于,所述特征数据集合为X={x1,x2,...,xN},所述N为车辆的数量,所述xN为第N辆车的特征数据样本;其中每一特征数据样本包括多个特征矩阵,表示为
Figure FDA0002132034890000011
所述
Figure FDA0002132034890000012
为第i辆车的第d个传感器所采集到的一个特征矩阵;每一特征矩阵表示为
Figure FDA0002132034890000013
所述
Figure FDA0002132034890000014
为所述特征矩阵,
Figure FDA0002132034890000015
为特征向量,m为每一特征矩阵所包含特征向量的数量。
3.如权利要求2所述的方法,其特征在于,实现步骤S13的方法具体为通过下述公式计算所述每一特征向量所属特征矩阵的信息熵:
Figure FDA0002132034890000021
其中,所述每一特征矩阵
Figure FDA0002132034890000022
的信息熵为
Figure FDA0002132034890000023
所述
Figure FDA0002132034890000024
为每一特征向量与其它特征矩阵中同一位的特征向量为相同数据的概率。
4.如权利要求3所述的方法,其特征在于,在所述步骤S14中具体采用下述公式来计算所述特征矩阵的信息熵集合的均值:
Figure FDA0002132034890000025
其中,
Figure FDA0002132034890000026
为所述特征矩阵的信息熵集合,所述M为特征矩阵的信息熵集合的均值。
5.如权利要求4所述的方法,其特征在于,在所述步骤S15中具体采用下述公式来计算所述特征矩阵的信息熵集合的方差:
Figure FDA0002132034890000027
其中,
Figure FDA0002132034890000028
为所述特征矩阵的信息熵集合的方差。
6.如权利要求1所述的方法,其特征在于,所述步骤S16之前还包括如下步骤:
利用所述多个传感器获取天气信息、时间信息和工况信息;
根据所述天气信息、时间信息和工况信息,选取与所述天气信息和工况信息对应的预设特征阈值。
7.如权利要求1所述的方法,其特征在于,所述方法还包括如下步骤:
当所述特征矩阵的信息熵集合的方差大于或等于所述预设特征阈值时,保留所述每一车辆的所述特征矩阵。
8.一种基于多源信息熵差异性的数据降维装置,其特征在于,所述装置包括:
第一获取单元,用于从每一车辆的多个传感器同一时刻获取的数据提取特征数据集合,所述特征数据集合包括每一车辆的特征数据样本,每一特征数据样本包括多个特征矩阵,每一特征矩阵包括多个特征向量;
统计单元,用于在每一车辆的所述特征数据样本的多个特征矩阵中,统计每一特征向量与其它特征矩阵中同一位的特征向量为相同数据的概率;
第一计算单元,用于根据所述每一特征向量与其它特征矩阵中同一位的特征向量为相同数据的概率,计算所述每一特征向量所属特征矩阵的信息熵;
第二计算单元,用于根据每一车辆的同一特征矩阵的信息熵,计算所述特征矩阵的信息熵集合的均值;
第三计算单元,用于根据所述特征矩阵的信息熵集合的均值、所述每一车辆的同一特征矩阵的信息熵集合计算所述特征矩阵的信息熵集合的方差;
运算单元,用于比较所述特征矩阵的信息熵集合的方差和预设特征阈值;
处理单元,用于当所述特征矩阵的信息熵集合的方差小于所述预设特征阈值时,删除所述每一车辆的所述特征矩阵,形成降维的每一特征数据样本。
9.如权利要求8所述的装置,其特征在于,所述装置还包括:
第二获取单元,利用所述多个传感器获取天气信息和工况信息;
选择单元,用于根据所述天气信息和工况信息,选取与所述天气信息和工况信息对应的预设特征阈值。
10.如权利要求8所述的装置,其特征在于,所述处理单元还用于当所述特征矩阵的信息熵集合的方差大于或等于所述预设特征阈值时,保留所述每一车辆的所述特征矩阵。
CN201910641487.4A 2019-07-16 2019-07-16 一种基于多源信息熵差异性的数据降维方法及装置 Pending CN112241748A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910641487.4A CN112241748A (zh) 2019-07-16 2019-07-16 一种基于多源信息熵差异性的数据降维方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910641487.4A CN112241748A (zh) 2019-07-16 2019-07-16 一种基于多源信息熵差异性的数据降维方法及装置

Publications (1)

Publication Number Publication Date
CN112241748A true CN112241748A (zh) 2021-01-19

Family

ID=74167144

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910641487.4A Pending CN112241748A (zh) 2019-07-16 2019-07-16 一种基于多源信息熵差异性的数据降维方法及装置

Country Status (1)

Country Link
CN (1) CN112241748A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116873689A (zh) * 2023-09-06 2023-10-13 江苏省特种设备安全监督检验研究院 电梯检验数据分析方法、装置、设备及存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102938069A (zh) * 2012-06-13 2013-02-20 北京师范大学 一种基于信息熵的纯净和混合像元自动划分方法
CN105512104A (zh) * 2015-12-02 2016-04-20 上海智臻智能网络科技股份有限公司 词典降维方法及装置、信息分类方法及装置
CN106407363A (zh) * 2016-09-08 2017-02-15 电子科技大学 一种基于信息熵的超高维数据降维算法
WO2018039216A1 (en) * 2016-08-22 2018-03-01 Iris International, Inc. System and method of classification of biological particles
CN108280415A (zh) * 2018-01-17 2018-07-13 武汉理工大学 基于智能移动终端的驾驶行为识别方法
CN108537288A (zh) * 2018-04-19 2018-09-14 辽宁大学 一种基于互信息的实时特征提取方法
CN109241231A (zh) * 2018-09-07 2019-01-18 武汉中海庭数据技术有限公司 高精度地图数据的预处理装置及方法
CN109446476A (zh) * 2018-09-27 2019-03-08 清华大学 一种多模式传感器信息解耦方法
US10467743B1 (en) * 2016-11-18 2019-11-05 Shenzhen Intellifusion Technologies Co., Ltd. Image processing method, terminal and storage medium

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102938069A (zh) * 2012-06-13 2013-02-20 北京师范大学 一种基于信息熵的纯净和混合像元自动划分方法
CN105512104A (zh) * 2015-12-02 2016-04-20 上海智臻智能网络科技股份有限公司 词典降维方法及装置、信息分类方法及装置
WO2018039216A1 (en) * 2016-08-22 2018-03-01 Iris International, Inc. System and method of classification of biological particles
CN106407363A (zh) * 2016-09-08 2017-02-15 电子科技大学 一种基于信息熵的超高维数据降维算法
US10467743B1 (en) * 2016-11-18 2019-11-05 Shenzhen Intellifusion Technologies Co., Ltd. Image processing method, terminal and storage medium
CN108280415A (zh) * 2018-01-17 2018-07-13 武汉理工大学 基于智能移动终端的驾驶行为识别方法
CN108537288A (zh) * 2018-04-19 2018-09-14 辽宁大学 一种基于互信息的实时特征提取方法
CN109241231A (zh) * 2018-09-07 2019-01-18 武汉中海庭数据技术有限公司 高精度地图数据的预处理装置及方法
CN109446476A (zh) * 2018-09-27 2019-03-08 清华大学 一种多模式传感器信息解耦方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
LIYING FANG等: "Feature selection method based on mutual information and class separability for dimension reduction in multidimensional time series for clinical data", 《BIOMEDICAL SIGNAL PROCESSING AND CONTROL》, vol. 21, pages 82 - 89 *
何兴高等: "基于信息熵的高维稀疏大数据降维算法研究", 《电子科技大学学报》, vol. 47, no. 2, pages 235 - 241 *
李蝉娟: "高维数据降维处理关键技术研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》, no. 02, pages 138 - 1087 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116873689A (zh) * 2023-09-06 2023-10-13 江苏省特种设备安全监督检验研究院 电梯检验数据分析方法、装置、设备及存储介质
CN116873689B (zh) * 2023-09-06 2024-01-02 江苏省特种设备安全监督检验研究院 电梯检验数据分析方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
US11594036B2 (en) Advanced driver-assistance system (ADAS) operation utilizing algorithmic skyline detection
Xia et al. ResNet15: weather recognition on traffic road with deep convolutional neural network
KR20200092842A (ko) 멀티 카메라 시스템 내의 더블 임베딩 구성을 이용하여 도로 이용자 이벤트를 검출하기 위해 이용될 세그먼테이션 성능 향상을 위한 학습 방법 및 학습 장치 그리고 이를 이용한 테스팅 방법 및 테스팅 장치
CN111340151B (zh) 一种用于辅助车辆自动驾驶的天气现象识别系统和方法
CN113076773A (zh) 目标检测聚类方法、系统、计算机设备及可读存储介质
CN110866926B (zh) 一种红外遥感图像快速精细海陆分割方法
CN113887349A (zh) 一种基于图像和点云融合网络的道路区域图像识别方法
Seeger et al. Towards road type classification with occupancy grids
TWI497449B (zh) 非監督式調適方法與應用其之影像自動分類方法
CN112149476A (zh) 目标检测方法、装置、设备和存储介质
CN114763997A (zh) 车辆采集到的雷达点云数据的处理方法、装置及电子设备
CN112633120A (zh) 一种基于半监督学习的智能路侧感知系统及模型训练方法
CN112241748A (zh) 一种基于多源信息熵差异性的数据降维方法及装置
CN116258940A (zh) 一种多尺度特征及自适应权重的小目标检测方法
DE102022128763A1 (de) Detektion von fahrzeugsensorverdeckung
CN116503709A (zh) 一种基于改进YOLOv5的雾霾天气下车辆检测方法
CN112699711A (zh) 车道线检测方法、装置、存储介质及电子设备
CN113970734A (zh) 路侧多线激光雷达降雪噪点去除方法、装置及设备
CN116664833A (zh) 一种提高目标重识别模型能力的方法和目标重识别方法
CN116434056A (zh) 一种基于雷视融合的目标识别方法、系统及电子设备
CN116740840A (zh) 一种行车记录仪用视频预警系统
CN116243273A (zh) 一种光子计数激光雷达数据滤波方法及装置
CN115909285A (zh) 一种雷达和视频信号融合的车辆跟踪方法
Khasanova et al. Image denoising for video surveillance cameras based on deep learning techniques
CN113610143A (zh) 一种点云噪点的分类方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination