CN114978579A - 一种信息处理方法、异常检测装置、介质及车载控制器 - Google Patents
一种信息处理方法、异常检测装置、介质及车载控制器 Download PDFInfo
- Publication number
- CN114978579A CN114978579A CN202210365993.7A CN202210365993A CN114978579A CN 114978579 A CN114978579 A CN 114978579A CN 202210365993 A CN202210365993 A CN 202210365993A CN 114978579 A CN114978579 A CN 114978579A
- Authority
- CN
- China
- Prior art keywords
- abnormal
- training
- data
- value
- vehicle
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/14—Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
- H04L63/1408—Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic by monitoring network traffic
- H04L63/1416—Event detection, e.g. attack signature detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/088—Non-supervised learning, e.g. competitive learning
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/14—Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
- H04L63/1408—Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic by monitoring network traffic
- H04L63/1425—Traffic logging, e.g. anomaly detection
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Computer Security & Cryptography (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Computer Networks & Wireless Communication (AREA)
- Computer Hardware Design (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medical Informatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Testing And Monitoring For Control Systems (AREA)
Abstract
本发明属于智能车技术领域,尤其涉及一种信息处理方法、异常检测装置、介质及车载控制器;通过采集车辆行驶信息并构造机器学习训练集和测试集数据,进而通过LSTM神经网络自回归训练其模型,并使用预训练后的神经网络提取特征向量;进一步在采用无监督学习方法获得异常分值的评估后,给出了异常信息的判定流程;由于该方法可以揭示物理信号之间的相关性、时序性并发现未知类型的异常过程,有利于改进车联网场景下相关装置、存储介质、车载控制器等的信息安全和异常监测能力,提高特征向量的表达效果;其中,本发明实施例公开的方法和相关产品可提升异常检测的F1分值,并在保证精度的前提下,获得更高的检出率。
Description
技术领域
本发明属于智能车技术领域,尤其涉及一种信息处理方法、异常检测装置、介质及车载控制器。
背景技术
伴随着物联网,特别是车联网技术的深入应用,智能车的网络安全问题日渐凸显。但由于车辆网络自身的特点,其网络攻击样本的获取成为制约车联网异常检测能力的一个关键因素。
目前,基于人工规则的检测方法,由于样本空间规模的限制,对于未知的攻击类型,尚不具备检测能力。
此外,基于人工智能AI(Artificial Intelligence)的应用,虽可进行相关特征向量的提取,但也受限于自编码器的结构,其特征向量的维度必须小于输入向量的维度,否则编码器将失效;同时,由于特征向量的维度较小,还可能导致原有数据信息的损失,不利于下游的分类任务。
发明内容
本发明实施例公开了一种信息处理方法,包括信息采集步骤、模型构造步骤、特征提取步骤、异常检测步骤。其中,信息采集步骤获取车辆行驶信息,成为相关方法得以实施的基础步骤,相关信息也将成为相关方法所处理的主要内容。
具体地,车辆运行信息可包括方向盘转角、发动机转速、左前轮车速、右前轮车速、左后轮车速、右后轮车速、整车车速至少之一。
进一步地,通过构造测试集数据和训练集数据,为后续的信息提取做准备;其中,测试集数据为车辆行驶信息按时间顺序在单独一段时间内的数据,训练集为车辆行驶信息中上述测试集以外的数据。
进一步地,模型构造步骤可转换上述车辆行驶信息的数据格式和/或数据结构,将不同采样间隔的数据对齐到同一时间序列;并使用机器学习算法预训练得到模型数据。
进一步地,特征提取步骤通过获取由模型构造步骤得到的模型数据,提取车辆行驶信息的特征向量;并获取特征向量的异常分值;其中,异常分值为训练集中根据预设规则比较获得的边界值或特异值。
进一步地,在异常检测步骤根据预设的精度或灵敏度要求选取异常阈值,若异常分值超过异常阈值,则输出异常标志或启动相关的处置过程。
进一步地,可使用极小极大归一化方法对训练集进行预处理,同时对测试集使用训练集的预处理参数进行预处理。
具体地,可在模型构造步骤采用第一自回归训练,以预设的时间窗大小提取原始数据获得第一自回归序列,并在每个第一自回归序列的最后添加一个时刻,并以该时刻表示第一自回归序列终结;紧接着,以第一自回归序列为输入完成第一自回归训练。
进一步地,第一自回归训练可采用LSTM长短期记忆神经网络完成预训练;采用第一自回归序列作为LSTM神经网络的输入;通过获取LSTM神经网络的第一训练维度;其中,第一训练维度等于车辆运行信息待处理信息或采集信号的个数。
进一步地,LSTM神经网络全连接层中神经元的个数等于第一训练维度;LSTM神经网络的损失函数采用平均绝对误差MAE进行约束;其异常分值采用无监督学习过程获得;该无监督学习方法可包括最近邻居Nearest Neighbor算法。
具体地,提取LSTM神经网络单元中单元状态的第一终值向量,并将第一终值向量作为下游任务的输入。
具体地,车辆行驶信息可采集自车内通信总线,包括CAN、Ethernet、Flexray;该信息处理方法还包括将车内总线标准下的数据转换为10进制数据;其中,上述时间序列的间隔为预设的第一周期;该第一周期在预设的阶段内为固定值,该第一周期预设的不同取值包括0.02秒;将车辆行驶信息在该第一周期内出现的最后一次作为车辆行驶信息在第一周期内的值;在最近邻居Nearest Neighbor算法中采用欧式距离进行定量评估。
进一步地,通过选择训练集中正常样本异常分值最大的值作为第一异常阈值或采用异常样本的构造过程来确定第一异常阈值,进而为异常判定提供参考。
具体地,在异常样本中,欺骗攻击Spoofing类型的第一类异常样本包括Sine攻击样本、Line攻击样本、阶跃攻击样本。
若一段时间内随机选取1个攻击信号,则Sine攻击在攻击信号初始值上附加一个按正弦波周期变化的值,并随机选取周期和幅值;Line攻击在攻击信号的初始值上附加一个偏移量,该偏移量以一个随机的斜率递增或递减;阶跃攻击则将攻击信号固定在一个随机值。
进一步地,可构造混合数据集;其中,混合数据集由正常样本和异常样本构成,异常样本替换同时刻的原始样本或正常样本;提取混合数据集中正常序列所占的第一正常比例值;其中,异常序列为至少包含1个异常时刻的时间窗;按第一正常比例值选取具备预设占比的异常分值,并将该异常分值中的最大值作为第一异常阈值。
若采用异常样本的构造过程确定第一异常阈值,则可选取阶跃攻击进行异常样本的构造,将信号固定在其取值范围的边界处;经异常监测获取的异常分值均高于正常序列的异常分值;此时,即可选取异常序列里异常分值最低的异常分值为第一异常阈值。
本发明实施例公开的异常检测装置,包括信息采集单元、模型构造单元、特征提取单元、异常检测单元。
其信息采集单元获取车辆行驶信息,该车辆运行信息包括方向盘转角、发动机转速、左前轮车速、右前轮车速、左后轮车速、右后轮车速、整车车速至少之一。
进一步地,通过构造测试集数据和训练集数据,其中,测试集数据为车辆行驶信息按时间顺序在单独一段时间内的数据,训练集为车辆行驶信息中测试集以外的数据。
进一步地,模型构造单元转换车辆行驶信息的数据格式和/或数据结构,将不同采样间隔的数据对齐到同一时间序列;并使用机器学习算法预训练得到模型数据。
进一步地,特征提取单元获取模型构造单元得到的模型数据,提取车辆行驶信息的特征向量;并获取特征向量的异常分值,该异常分值为训练集中根据预设规则比较获得的边界值或特异值。
进一步地,异常检测单元根据预设的精度或灵敏度要求选取异常阈值,若异常分值超过异常阈值,则输出异常标志或启动相关的处置过程。
进一步地,预训练可使用极小极大归一化方法对训练集进行预处理,同时对测试集使用训练集的预处理参数进行预处理。
进一步地,模型构造单元可采用第一自回归训练,以预设的时间窗大小提取原始数据获得第一自回归序列,并在每个第一自回归序列的最后添加一个时刻,并以该时刻表示第一自回归序列终结;再以该第一自回归序列为输入完成第一自回归训练。
进一步地,第一自回归训练可采用LSTM长短期记忆神经网络完成预训练;采用第一自回归序列作为LSTM神经网络的输入;获取LSTM神经网络的第一训练维度,其第一训练维度等于车辆运行信息待处理信息或采集信号的个数。
具体地,LSTM神经网络全连接层中神经元的个数等于第一训练维度;其中,LSTM神经网络的损失函数可采用平均绝对误差MAE进行约束;异常分值可采用无监督学习过程获得;该无监督学习方法包括最近邻居Nearest Neighbor算法。
进一步地,可提取LSTM神经网络单元中单元状态的第一终值向量,并将第一终值向量作为下游任务的输入。
具体地,车辆行驶信息可采集自车内通信总线,包括CAN、Ethernet、Flexray;该信息处理方法还包括将车内总线标准下的数据转换为10进制数据;其中,上述时间序列的间隔为预设的第一周期;该第一周期在预设的阶段内为固定值,该第一周期预设的不同取值包括0.02秒;将车辆行驶信息在该第一周期内出现的最后一次作为车辆行驶信息在第一周期内的值;在最近邻居Nearest Neighbor算法中可采用欧式距离进行定量评估。
进一步地,可选择训练集中正常样本异常分值最大的值作为第一异常阈值或还可采用异常样本的构造过程确定第一异常阈值;该异常样本包括欺骗攻击Spoofing类型的第一类异常样本;该第一类异常样本包括Sine攻击样本、Line攻击样本、阶跃攻击样本。
具体地,若一段时间内随机选取1个攻击信号,则Sine攻击在攻击信号初始值上附加一个按正弦波周期变化的值,并随机选取周期和幅值;Line攻击在攻击信号的初始值上附加一个偏移量,该偏移量以一个随机的斜率递增或递减;阶跃攻击将攻击信号固定在一个随机值。
进一步地,构造混合数据集;其中,该混合数据集由正常样本和异常样本构成,异常样本替换同时刻的原始样本或正常样本;提取混合数据集中正常序列所占的第一正常比例值;其中,异常序列为至少包含1个异常时刻的时间窗。
进一步地,按第一正常比例值选取具备预设占比的异常分值,并将异常分值中的最大值作为第一异常阈值。
具体地,若采用异常样本的构造过程确定第一异常阈值,则可选取阶跃攻击进行异常样本的构造,将信号固定在其取值范围的边界处;经异常监测获取的异常分值均高于正常序列的异常分值;选取异常序列里异常分值最低的异常分值为第一异常阈值,即可完成相关的判定过程。
本发明实施例进一步公开了一种计算机存储介质及车载控制器;其中,该介质包括用于存储计算机程序的存储介质本体,其计算机程序在被微处理器执行时,可实现本发明实施例所公开的任一信息处理方法。
进一步地,上述车载控制器与本发明方法及装置采用了同样的发明内容,在不同的产品中实现了相关信息的处理和异常监测,以下不再赘述。
与现有车辆网关、车载控制器中基于规则的异常检测模块相比,本发明可以弥补基于规则检测方法的缺陷,挖掘物理信号之间的相关性、时序性,发现未知类型的异常。
对于规则检测不出来的异常样本,本发明在保证精度的情况下可大幅提高召回率(即检出率),减少对异常的漏报。
本发明实施例公开的方法是一种基于规则和机器学习的联合检测方法,能更好、更及时地发现异常、发现网络入侵、保护车主的人身安全。
与现有其它机器学习技术相比,本发明使用不同类型的预训练任务,提高了特征向量的表达能力,进而有助于提升异常检测的F1分值,在保证精度的前提下能获得更高的召回率。
需要说明的是,在本文中采用的“第一”、“第二”等类似的语汇,仅仅是为了描述技术方案中的各组成要素,并不构成对技术方案的限定,也不能理解为对相应要素重要性的指示或暗示;带有“第一”、“第二”等类似语汇的要素,表示在对应技术方案中,该要素至少包含一个。
附图说明
为了更加清晰地说明本发明的技术方案,利于对本发明的技术效果、技术特征和目的进一步理解,下面结合附图对本发明进行详细的描述,附图构成说明书的必要组成部分,与本发明的实施例一并用于说明本发明的技术方案,但并不构成对本发明的限制。
附图中的同一标号代表相同的部件,具体地:
图1为本发明实施例信息处理方法流程图;
图2为本发明方法实施例自回归训练示意图;
图3为本发明实施例异常监测流程图;
图4为本发明方法实施例流程及输入输出信息示意图;
图5为本发明装置及相关产品结构及输入输出信息示意图;
图6为本发明存储介质及车载控制器组成结构示意图;
图7为本发明方法及相关产品实施例LSTM计算过程部分公式。
其中:
001-信息处理装置,003-存储介质,005-网关,007-车载控制器,009-车辆;
011-信息采集单元,022-模型构造单元,033-特征提取单元,044-异常检测单元;
111-信息采集步骤,
222-模型构造步骤,232-LSTM单元,242-全连接层,252-损失函数;
333-特征提取步骤,343-无监督模型,353-异常分值求解;
444-异常检测步骤,454-阈值判别;
555-车辆行驶信息,
666-检测判别信息,676-异常标志输出,686-正常标志输出。
具体实施方式
下面结合附图和实施例,对本发明作进一步的详细说明。当然,下列描述的具体实施例只是为了解释本发明的技术方案,而不是对本发明的限定。此外,实施例或附图中表述的部分,也仅仅是本发明相关部分的举例说明,而不是本发明的全部。
如图1所示,本发明实施例公开了一种信息处理方法,包括信息采集步骤111、模型构造步骤222、特征提取步骤333、异常检测步骤444。
信息采集步骤111获取车辆行驶信息555,即方向盘转角、发动机转速、左前轮车速、右前轮车速、左后轮车速、右后轮车速、整车车速至少之一;但本方法并不限于以上信息的处理,对于可采集到的任何车辆信息,本方法仍将适用。
具体地,通过构造测试集数据和训练集数据,以机器学习的方法来探测未知的特征信息;其中,测试集数据为车辆行驶信息555按时间顺序在单独一段时间内的数据,训练集为车辆行驶信息555中测试集以外的数据。
具体地,模型构造步骤222转换车辆行驶信息555的数据格式和/或数据结构,将不同采样间隔的数据对齐到同一时间序列;并使用机器学习算法预训练得到模型数据。
进一步地,特征提取步骤333获取模型构造步骤222得到的模型数据,提取车辆行驶信息555的特征向量;并获取特征向量的异常分值,该异常分值为训练集中根据预设规则比较获得的边界值或特异值。
进一步地,异常检测步骤444根据预设的精度或灵敏度要求选取异常阈值,若异常分值超过异常阈值,则输出异常标志或启动相关的处置过程。
具体地,预训练可使用极小极大归一化方法对训练集进行预处理,同时对测试集使用训练集的预处理参数进行预处理。
进一步的,模型构造步骤222可采用第一自回归训练,以预设的时间窗大小提取原始数据获得第一自回归序列,并在每个第一自回归序列的最后添加一个时刻,并以该时刻表示第一自回归序列终结;再以第一自回归序列为输入完成第一自回归训练。
进一步地,第一自回归训练采用LSTM长短期记忆神经网络完成预训练;采用第一自回归序列作为LSTM神经网络的输入;进而获取LSTM神经网络的第一训练维度,该第一训练维度等于车辆运行信息555待处理信息或采集信号的个数。
例如,选取时间窗为10个采样点,将原始数据按时间窗大小提取每个序列,并且在每个序列的最后再添加一个时刻表示序列结束;其中,按时间窗提取的一个序列维度是(10,7),其中7是采集的信号个数;用于表示序列结束的向量维度是(1,7),其元素值全部为-1;添加到之前的序列后,维度是(11,7);每个序列作为神经网络的输入。
其中,标签是每个序列下一时刻的7个信号,即方向盘转角、发动机转速、左前轮车速、右前轮车速、左后轮车速、右后轮车速、整车车速的量值;神经网络输出的维度是(7)。
此时,神经网络的结构是输入先经过1个LSTM单元,其中隐藏状态的维度可根据自回归训练效果任意设置,如100;同时,该自回归任务的维度不受以上维度的限制。
具体地,如图2、图3,LSTM神经网络全连接层242中神经元的个数等于第一训练维度;LSTM神经网络的损失函数252采用平均绝对误差MAE进行约束;异常分值353采用无监督学习过程获得;其无监督学习方法包括最近邻居Nearest Neighbor算法。
进一步地,提取LSTM神经网络单元中单元状态的第一终值向量,并将该第一终值向量作为下游任务的输入。
具体地,车辆行驶信息555可采集自车内通信总线,包括CAN、Ethernet、Flexray;信息处理方法还包括将车内总线标准下的数据转换为10进制数据;其中,时间序列的间隔为预设的第一周期;该第一周期在预设的阶段内为固定值,该第一周期预设的不同取值包括0.02秒;将车辆行驶信息555在第一周期内出现的最后一次作为车辆行驶信息555在第一周期内的值;此外,最近邻居Nearest Neighbor算法中可采用欧式距离进行定量评估。
如图7,本发明实施例的LSTM单元的计算过程,使用预训练后的神经网络提取特征向量;将每个序列输入到神经网络后,提取LSTM单元中的单元状态Ct的最终值,将这个向量作为下游任务的输入。
进一步地,选择单元状态是因为其变化较缓,而隐藏状态ht随当前时刻的输入变化较大;由于单元状态的取值范围没有限制,因此再次对训练集序列的单元状态进行极小极大值归一化;测试集得到的单元状态则使用训练集的预处理参数进行预处理。
其中,阈值的选取根据需求进行调整。例如,想要保证精度为100%,则选择训练集中正常样本异常分最大的值作为阈值;如果异常分超过该阈值才会被判断为异常。
这种保证精度的需求来自于车辆信号,由于物理信号相对于计算机网络信号会有更多的传感器噪音,如果阈值较低很容易产出大量误报。
进一步地,选择训练集中正常样本异常分值最大的值作为第一异常阈值或采用异常样本的构造过程确定第一异常阈值。
其中,异常样本包括欺骗攻击Spoofing类型的第一类异常样本;该第一类异常样本包括Sine攻击样本、Line攻击样本、阶跃攻击样本。
若一段时间内随机选取1个攻击信号,则Sine攻击在攻击信号初始值上附加一个按正弦波周期变化的值,并随机选取周期和幅值;Line攻击在攻击信号的初始值上附加一个偏移量,该偏移量以一个随机的斜率递增或递减;阶跃攻击将攻击信号固定在一个随机值。
进一步地,构造混合数据集;其中,该混合数据集由正常样本和异常样本构成,异常样本替换同时刻的原始样本或正常样本;提取混合数据集中正常序列所占的第一正常比例值;其中,异常序列为至少包含1个异常时刻的时间窗;按第一正常比例值选取具备预设占比的异常分值,并将异常分值中的最大值作为第一异常阈值。
若采用异常样本的构造过程确定第一异常阈值,则选取阶跃攻击进行异常样本的构造,将信号固定在其取值范围的边界处;经异常监测获取的异常分值均高于正常序列的异常分值;选取异常序列里异常分值最低的异常分值为第一异常阈值。
上述过程中,用构造的攻击样本替换同时刻原始正常样本,形成同时包含正常样本和异常样本的数据集;定义至少包含1个异常时刻的时间窗为一个异常序列;这样数据集经过提取时间窗后就包含正常序列和异常序列,统计出正常序列的比例p。
对数据集进行预处理、提取特征向量、异常检测;将所得的异常分值从小到大排序;按比例p选取较小部分的异常分值,将选取部分中异常分值的最大值作为阈值;这种方法虽然不能保证100%的精度,但可以获得更平衡的精度和召回率。
若想保证100%的精度,如上所述,可以在构造攻击时只构造非常明显的异常信号,例如阶跃攻击中将信号固定在其取值范围的边界处;这样的异常序列会被异常检测模型给出较高的异常分,全部高于正常序列的异常分;随后选取异常序列里异常分的最低值作为阈值;在检测模型对构造的数据集全部判断正确的前提下,这种方式比选择正常序列里最高的异常分作为阈值的方式更能保证100%的精度。
如图5、图6,本发明实施例还公开了一种异常检测装置001,包括信息采集单元011、模型构造单元022、特征提取单元033、异常检测单元044。
其中,信息采集单元011获取车辆行驶信息555,该车辆运行信息555通常包括方向盘转角、发动机转速、左前轮车速、右前轮车速、左后轮车速、右后轮车速、整车车速至少之一。
进一步地,需要构造测试集数据和训练集数据,其中,测试集数据为车辆行驶信息555按时间顺序在单独一段时间内的数据,训练集为车辆行驶信息555中测试集以外的数据。
进一步地,模型构造单元022转换车辆行驶信息555的数据格式和/或数据结构,将不同采样间隔的数据对齐到同一时间序列;并使用机器学习算法预训练得到模型数据。
进一步地,特征提取单元033获取模型构造单元022得到的模型数据,提取车辆行驶信息555的特征向量;并获取特征向量的异常分值,该异常分值为训练集中根据预设规则比较获得的边界值或特异值。
进一步地,异常检测单元044根据预设的精度或灵敏度要求选取异常阈值,若异常分值超过异常阈值,则输出异常标志或启动相关的处置过程。
具体地,预训练可使用极小极大归一化方法对训练集进行预处理,同时对测试集使用训练集的预处理参数进行预处理。
进一步地,模型构造单元022采用第一自回归训练,以预设的时间窗大小提取原始数据获得第一自回归序列,并在每个第一自回归序列的最后添加一个时刻,并以该时刻表示第一自回归序列终结;以该第一自回归序列为输入完成第一自回归训练。
具体地,如图2、图3,第一自回归训练可采用LSTM长短期记忆神经网络完成预训练;并采用第一自回归序列作为LSTM神经网络的输入。
进一步地,获取LSTM神经网络的第一训练维度,该第一训练维度等于车辆运行信息555待处理信息或采集信号的个数。
具体地,如图2、图3,LSTM神经网络全连接层242中神经元的个数等于第一训练维度;LSTM神经网络的损失函数252采用平均绝对误差MAE进行约束;异常分值353采用无监督学习过程获得;该无监督学习方法可采用最近邻居Nearest Neighbor算法。
进一步地,提取LSTM神经网络单元中单元状态的第一终值向量,并将第一终值向量作为下游任务的输入。
具体地,车辆行驶信息555可采集自车内通信总线,包括CAN、Ethernet、Flexray;信息处理方法还包括将车内总线标准下的数据转换为10进制数据;其中,时间序列的间隔为预设的第一周期;该第一周期在预设的阶段内为固定值,该第一周期预设的不同取值包括0.02秒;将车辆行驶信息555在第一周期内出现的最后一次作为车辆行驶信息555在第一周期内的值;最近邻居Nearest Neighbor算法中可采用欧式距离进行定量评估。
进一步地,可选择训练集中正常样本异常分值最大的值作为第一异常阈值或采用异常样本的构造过程确定第一异常阈值;其异常样本包括欺骗攻击Spoofing类型的第一类异常样本;该第一类异常样本包括Sine攻击样本、Line攻击样本、阶跃攻击样本。
若一段时间内随机选取1个攻击信号,则Sine攻击在攻击信号初始值上附加一个按正弦波周期变化的值,并随机选取周期和幅值;Line攻击在攻击信号的初始值上附加一个偏移量,该偏移量则以一个随机的斜率递增或递减;此外,阶跃攻击将攻击信号固定在一个随机值。
进一步地,构造混合数据集;其中,混合数据集由正常样本和异常样本构成,异常样本替换同时刻的原始样本或所述正常样本。
具体地,提取混合数据集中正常序列所占的第一正常比例值;其中,异常序列为至少包含1个异常时刻的时间窗;按第一正常比例值选取具备预设占比的异常分值,并将异常分值中的最大值作为第一异常阈值。
进一步地,若采用异常样本的构造过程确定第一异常阈值,当选取阶跃攻击进行异常样本的构造时,将信号固定在其取值范围的边界处;经异常监测获取的异常分值均高于正常序列的异常分值;选取异常序列里异常分值最低的异常分值为第一异常阈值。
进一步地,如图6所示,本发明实施公开了一种计算机存储介质003,用于存储计算机程序;当计算机程序在被微处理器执行时,即可实现本发明实施例所公开的任一信息处理方法;此外,车载网关005和车载域控制器007也可依照同样的发明构思实现,其具体过程不再赘述。
需要说明的是,上述实施例仅是为了更清楚地说明本发明的技术方案,本领域技术人员可以理解,本发明的实施方式不限于以上内容,基于上述内容所进行的明显变化、替换或替代,均不超出本发明技术方案涵盖的范围;在不脱离本发明构思的情况下,其它实施方式也将落入本发明的范围。
Claims (16)
1.一种信息处理方法,其特征在于,包括:信息采集步骤(111)、模型构造步骤(222)、特征提取步骤(333)、异常检测步骤(444);
所述信息采集步骤(111)获取车辆行驶信息(555),所述车辆运行信息(555)包括方向盘转角、发动机转速、左前轮车速、右前轮车速、左后轮车速、右后轮车速、整车车速至少之一;构造测试集数据和训练集数据,其中,所述测试集数据为所述车辆行驶信息(555)按时间顺序在单独一段时间内的数据,所述训练集为所述车辆行驶信息(555)中所述测试集以外的数据;
所述模型构造步骤(222)转换所述车辆行驶信息(555)的数据格式和/或数据结构,将不同采样间隔的数据对齐到同一时间序列;并使用机器学习算法预训练得到模型数据;
所述特征提取步骤(333)获取所述模型构造步骤(222)得到的所述模型数据,提取所述车辆行驶信息(555)的特征向量;并获取所述特征向量的异常分值,所述异常分值为所述训练集中根据预设规则比较获得的边界值或特异值;
所述异常检测步骤(444)根据预设的精度或灵敏度要求选取异常阈值,若所述异常分值超过所述异常阈值,则输出异常标志或启动相关的处置过程。
2.如权利要求1所述的方法,其中:
所述预训练使用极小极大归一化方法对所述训练集进行预处理,同时对所述测试集使用所述训练集的预处理参数进行预处理。
3.如权利要求1或2所述的方法,其中:
所述模型构造步骤(222)采用第一自回归训练,以预设的时间窗大小提取原始数据获得第一自回归序列,并在每个所述第一自回归序列的最后添加一个时刻,并以所述时刻表示所述第一自回归序列终结;以所述第一自回归序列为输入完成所述第一自回归训练。
4.如权利要求3所述的方法,其中:
所述第一自回归训练采用LSTM长短期记忆神经网络完成预训练;采用所述第一自回归序列作为所述LSTM神经网络的输入;获取所述LSTM神经网络的第一训练维度,所述第一训练维度等于所述车辆运行信息(555)待处理信息或采集信号的个数。
5.如权利要求4所述的方法,其中:
所述LSTM神经网络全连接层(242)中神经元的个数等于所述第一训练维度;所述LSTM神经网络的损失函数(252)采用平均绝对误差MAE进行约束;所述异常分值(353)采用无监督学习过程获得;所述无监督学习方法包括最近邻居Nearest Neighbor算法;
提取所述LSTM神经网络单元中单元状态的第一终值向量,并将所述第一终值向量作为下游任务的输入。
6.如权利要求4或5所述的方法,其中:
所述车辆行驶信息(555)来自车内总线,所述车内总线包括CAN、Ethernet、Flexray;
所述信息处理方法还包括:将所述车内总线标准下的数据转换为10进制数据;其中,所述时间序列的间隔为预设的第一周期;所述第一周期在预设的阶段内为固定值,所述第一周期预设的不同取值包括0.02秒;将所述车辆行驶信息(555)在所述第一周期内出现的最后一次作为所述车辆行驶信息(555)在所述第一周期内的值;
所述最近邻居Nearest Neighbor算法中采用欧式距离进行定量评估。
7.如权利要求4或5所述的方法,其中:
选择所述训练集中正常样本异常分值最大的值作为第一异常阈值或采用异常样本的构造过程确定所述第一异常阈值;
所述异常样本包括欺骗攻击Spoofing类型的第一类异常样本;所述第一类异常样本包括Sine攻击样本、Line攻击样本、阶跃攻击样本;
若一段时间内随机选取1个攻击信号,则所述Sine攻击,在所述攻击信号初始值上附加一个按正弦波周期变化的值,并随机选取周期和幅值;所述Line攻击在所述攻击信号的初始值上附加一个偏移量,所述偏移量以一个随机的斜率递增或递减;所述阶跃攻击将所述攻击信号固定在一个随机值;
构造混合数据集;其中,所述混合数据集由正常样本和所述异常样本构成,所述异常样本替换同时刻的原始样本或所述正常样本;提取所述混合数据集中正常序列所占的第一正常比例值;其中,所述异常序列为至少包含1个异常时刻的时间窗;按所述第一正常比例值选取具备预设占比的异常分值,并将所述异常分值中的最大值作为第一异常阈值。
8.如权利要求7所述的方法,其中:
若采用异常样本的构造过程确定所述第一异常阈值,则选取所述阶跃攻击进行异常样本的构造,将信号固定在其取值范围的边界处;经异常监测获取的所述异常分值均高于所述正常序列的所述异常分值;选取所述异常序列里所述异常分值最低的所述异常分值为所述第一异常阈值。
9.一种异常检测装置,包括:
信息采集单元(011)、模型构造单元(022)、特征提取单元(033)、异常检测单元(044);
所述信息采集单元(011)获取车辆行驶信息(555),所述车辆运行信息(555)包括方向盘转角、发动机转速、左前轮车速、右前轮车速、左后轮车速、右后轮车速、整车车速至少之一;构造测试集数据和训练集数据,其中,所述测试集数据为所述车辆行驶信息(555)按时间顺序在单独一段时间内的数据,所述训练集为所述车辆行驶信息(555)中所述测试集以外的数据;
所述模型构造单元(022)转换所述车辆行驶信息(555)的数据格式和/或数据结构,将不同采样间隔的数据对齐到同一时间序列;并使用机器学习算法预训练得到模型数据;
所述特征提取单元(033)获取模型构造单元(022)得到的所述模型数据,提取所述车辆行驶信息(555)的特征向量;并获取所述特征向量的异常分值,所述异常分值为所述训练集中根据预设规则比较获得的边界值或特异值;
所述异常检测单元(044)根据预设的精度或灵敏度要求选取异常阈值,若所述异常分值超过所述异常阈值,则输出异常标志或启动相关的处置过程。
10.如权利要求9所述的装置,其中:
所述预训练使用极小极大归一化方法对所述训练集进行预处理,同时对所述测试集使用所述训练集的预处理参数进行预处理;
所述模型构造单元(022)采用第一自回归训练,以预设的时间窗大小提取原始数据获得第一自回归序列,并在每个所述第一自回归序列的最后添加一个时刻,并以所述时刻表示所述第一自回归序列终结;以所述第一自回归序列为输入完成所述第一自回归训练。
11.如权利要求10所述的装置,其中:
所述第一自回归训练采用LSTM长短期记忆神经网络完成预训练;采用所述第一自回归序列作为所述LSTM神经网络的输入;
获取所述LSTM神经网络的第一训练维度,所述第一训练维度等于所述车辆运行信息(555)待处理信息或采集信号的个数;
所述LSTM神经网络全连接层(242)中神经元的个数等于所述第一训练维度;所述LSTM神经网络的损失函数(252)采用平均绝对误差MAE进行约束;所述异常分值(353)采用无监督学习过程获得;所述无监督学习方法包括最近邻居Nearest Neighbor算法;
提取所述LSTM神经网络单元中单元状态的第一终值向量,并将所述第一终值向量作为下游任务的输入。
12.如权利要求11所述的装置,其中:
所述车辆行驶信息(555)来自车内总线,所述车内总线包括CAN、Ethernet、Flexray;
所述信息处理方法还包括:将所述车内总线标准下的数据转换为10进制数据;其中,所述时间序列的间隔为预设的第一周期;所述第一周期在预设的阶段内为固定值,所述第一周期预设的不同取值包括0.02秒;将所述车辆行驶信息(555)在所述第一周期内出现的最后一次作为所述车辆行驶信息(555)在所述第一周期内的值;所述最近邻居NearestNeighbor算法中采用欧式距离进行定量评估。
13.如权利要求11所述的装置,其中:
选择所述训练集中正常样本异常分值最大的值作为第一异常阈值或采用异常样本的构造过程确定所述第一异常阈值;所述异常样本包括欺骗攻击Spoofing类型的第一类异常样本;所述第一类异常样本包括Sine攻击样本、Line攻击样本、阶跃攻击样本;
若一段时间内随机选取1个攻击信号,则所述Sine攻击,在所述攻击信号初始值上附加一个按正弦波周期变化的值,并随机选取周期和幅值;所述Line攻击在所述攻击信号的初始值上附加一个偏移量,所述偏移量以一个随机的斜率递增或递减;所述阶跃攻击将所述攻击信号固定在一个随机值;
构造混合数据集;其中,所述混合数据集由正常样本和所述异常样本构成,所述异常样本替换同时刻的原始样本或所述正常样本;
提取所述混合数据集中正常序列所占的第一正常比例值;其中,所述异常序列为至少包含1个异常时刻的时间窗;按所述第一正常比例值选取具备预设占比的异常分值,并将所述异常分值中的最大值作为第一异常阈值。
14.如权利要求13所述的装置,其中:
若采用异常样本的构造过程确定所述第一异常阈值,则选取所述阶跃攻击进行异常样本的构造,将信号固定在其取值范围的边界处;经异常监测获取的所述异常分值均高于所述正常序列的所述异常分值;选取所述异常序列里所述异常分值最低的所述异常分值为所述第一异常阈值。
15.一种计算机存储介质,包括:
用于存储计算机程序的存储介质本体;所述计算机程序在被微处理器执行时,实现如权利要求1至8所述的任一信息处理方法。
16.一种车载控制器,包括:
如权利要求9至14所述的任一装置;和/或如权利要求15所述的存储介质。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210365993.7A CN114978579A (zh) | 2022-04-08 | 2022-04-08 | 一种信息处理方法、异常检测装置、介质及车载控制器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210365993.7A CN114978579A (zh) | 2022-04-08 | 2022-04-08 | 一种信息处理方法、异常检测装置、介质及车载控制器 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114978579A true CN114978579A (zh) | 2022-08-30 |
Family
ID=82976532
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210365993.7A Pending CN114978579A (zh) | 2022-04-08 | 2022-04-08 | 一种信息处理方法、异常检测装置、介质及车载控制器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114978579A (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106650505A (zh) * | 2016-12-28 | 2017-05-10 | 北京奇虎科技有限公司 | 一种车辆攻击检测方法和装置 |
CN110149345A (zh) * | 2019-06-11 | 2019-08-20 | 北京航空航天大学 | 一种基于报文序列预测的车载网络入侵检测方法 |
CN110275508A (zh) * | 2019-05-08 | 2019-09-24 | 西安电子科技大学 | 车载can总线网络异常检测方法及系统 |
CN111600905A (zh) * | 2020-06-01 | 2020-08-28 | 广州鹄志信息咨询有限公司 | 一种基于物联网异常检测方法 |
US20210097438A1 (en) * | 2019-10-01 | 2021-04-01 | Kabushiki Kaisha Toshiba | Anomaly detection device, anomaly detection method, and anomaly detection program |
CN113255750A (zh) * | 2021-05-17 | 2021-08-13 | 安徽大学 | 一种基于深度学习的vcc车辆攻击检测方法 |
CN114244603A (zh) * | 2021-12-15 | 2022-03-25 | 中国电信股份有限公司 | 异常检测及对比嵌入模型训练、检测方法、装置及介质 |
-
2022
- 2022-04-08 CN CN202210365993.7A patent/CN114978579A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106650505A (zh) * | 2016-12-28 | 2017-05-10 | 北京奇虎科技有限公司 | 一种车辆攻击检测方法和装置 |
CN110275508A (zh) * | 2019-05-08 | 2019-09-24 | 西安电子科技大学 | 车载can总线网络异常检测方法及系统 |
CN110149345A (zh) * | 2019-06-11 | 2019-08-20 | 北京航空航天大学 | 一种基于报文序列预测的车载网络入侵检测方法 |
US20210097438A1 (en) * | 2019-10-01 | 2021-04-01 | Kabushiki Kaisha Toshiba | Anomaly detection device, anomaly detection method, and anomaly detection program |
CN111600905A (zh) * | 2020-06-01 | 2020-08-28 | 广州鹄志信息咨询有限公司 | 一种基于物联网异常检测方法 |
CN113255750A (zh) * | 2021-05-17 | 2021-08-13 | 安徽大学 | 一种基于深度学习的vcc车辆攻击检测方法 |
CN114244603A (zh) * | 2021-12-15 | 2022-03-25 | 中国电信股份有限公司 | 异常检测及对比嵌入模型训练、检测方法、装置及介质 |
Non-Patent Citations (2)
Title |
---|
ZADID KHAN; MASHRUR CHOWDHURY; MHAFUZUL ISLAM; CHIN-YA HUANG; MIZANUR RAHMAN GLENN DEPARTMENT OF CIVIL ENGINEERING, CLEMSON UNIVER: "Long Short-Term Memory Neural Network-Based Attack Detection Model for In-Vehicle Network Security", 《 IEEE SENSORS LETTERS ( VOLUME: 4, ISSUE: 6, JUNE 2020)》 * |
李闯: "车载网络CAN总线报文异常检测技术研究", 《中国优秀硕士学位论文全文数据库》 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114048568B (zh) | 一种基于多源迁移融合收缩框架的旋转机械故障诊断方法 | |
CN111562108A (zh) | 一种基于cnn和fcmc的滚动轴承智能故障诊断方法 | |
CN111698258A (zh) | 一种基于WiFi的环境入侵检测方法和系统 | |
CN113221759A (zh) | 基于异常检测模型的道路遗撒识别方法以及装置 | |
CN115294615A (zh) | 一种基于机器学习的射频指纹识别方法 | |
CN111431937A (zh) | 工业网络异常流量的检测方法及系统 | |
CN112016597B (zh) | 一种机器学习中基于贝叶斯不平衡度量的深度采样方法 | |
CN114157469A (zh) | 一种基于域对抗神经网络的车载网络变种攻击入侵检测方法及系统 | |
CN114978579A (zh) | 一种信息处理方法、异常检测装置、介质及车载控制器 | |
Kang et al. | A transfer learning based abnormal can bus message detection system | |
Astapov et al. | Military vehicle acoustic pattern identification by distributed ground sensors | |
CN116668099A (zh) | 一种基于深度神经网络的车载can总线入侵检测方法及系统 | |
CN115792615A (zh) | 一种永磁同步电机传感器故障诊断方法和系统 | |
US20220343158A1 (en) | Method, device, and computer program for creating training data in a vehicle | |
CN110766035A (zh) | 一种轴承单一故障智能检测方法 | |
CN115718890A (zh) | 驾驶行为预测方法、装置、电子设备及存储介质 | |
JPH08315265A (ja) | ドップラーマイクロ波センサ | |
CN112419304B (zh) | 一种面向一维数据的多阶段目标检测方法及装置 | |
CN113159127A (zh) | 一种基于改进的生成对抗网络的凹版印刷机导向辊故障智能诊断方法 | |
CN112016539B (zh) | 信号识别方法、装置、电子设备与存储介质 | |
CN114781448A (zh) | 一种轴承故障特征提取方法、系统、介质以及设备 | |
CN114244596A (zh) | 基于htm的车载can网络异常检测方法和系统 | |
CN109506936B (zh) | 基于流向图和非朴素贝叶斯推理的轴承故障程度识别方法 | |
CN113505817A (zh) | 不均衡数据下轴承故障诊断模型样本自适应加权训练方法 | |
CN111814836A (zh) | 基于类不平衡算法的车辆行驶行为检测方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |