CN116501444B - 智能网联汽车域控制器虚拟机异常云边协同监测和恢复系统及方法 - Google Patents

智能网联汽车域控制器虚拟机异常云边协同监测和恢复系统及方法 Download PDF

Info

Publication number
CN116501444B
CN116501444B CN202310479985.XA CN202310479985A CN116501444B CN 116501444 B CN116501444 B CN 116501444B CN 202310479985 A CN202310479985 A CN 202310479985A CN 116501444 B CN116501444 B CN 116501444B
Authority
CN
China
Prior art keywords
abnormal
virtual machine
model
unknown
sample data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310479985.XA
Other languages
English (en)
Other versions
CN116501444A (zh
Inventor
杨波
黄浩平
王时龙
许林
张正萍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University
Seres Group Co Ltd
Chongqing Seres New Energy Automobile Design Institute Co Ltd
Original Assignee
Chongqing University
Seres Group Co Ltd
Chongqing Seres New Energy Automobile Design Institute Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University, Seres Group Co Ltd, Chongqing Seres New Energy Automobile Design Institute Co Ltd filed Critical Chongqing University
Priority to CN202310479985.XA priority Critical patent/CN116501444B/zh
Publication of CN116501444A publication Critical patent/CN116501444A/zh
Application granted granted Critical
Publication of CN116501444B publication Critical patent/CN116501444B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0495Quantised networks; Sparse networks; Compressed networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/45591Monitoring or debugging support

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

本发明公开了一种智能网联汽车域控制器虚拟机异常云边协同监测和恢复系统,包括边缘端和云端;边缘端包括:状态实时监控模块,用于采集虚拟机关联设备的健康状态向量作为样本数据并对虚拟机异常进行修复;异常自我监测模块,包括孤立森林模型和轻量化神经网络模型;云端包括:未知故障挖掘模块,包括未知异常类划分模型和模型校正模块;自主学习提升模块,用于在得到异常修复方案后结合历史修复方案对该异常修复方案进行评估和改进,改进后的异常修复方案被传输至状态实时监控模块以提升异常修复能力。本发明还公开了有一种智能网联汽车域控制器虚拟机异常云边协同监测和恢复方法。

Description

智能网联汽车域控制器虚拟机异常云边协同监测和恢复系统 及方法
技术领域
本发明属于虚拟机异常处理技术领域,具体的为一种智能网联汽车域控制器虚拟机异常云边协同监测和恢复系统及方法。
背景技术
智能网联汽车域控制器虚拟环境下的虚拟机具备业务范围广、功能结构复杂、车载软件众多等特点,给虚拟机异常监控和恢复带来了巨大的挑战。传统虚拟机异常监控和恢复方法多采用虚拟机自省技术、虚拟机迁移技术和增量检查点技术等相结合的方式执行虚拟机异常监测和恢复任务,此类方法通过连续监控虚拟机内存管理单元、构建虚拟到物理内存映射和监测物理机硬件状态变化等方式获得各qvm进程信息用于分析虚拟机运行状态并对故障风险进行预测,该过程未综合考虑服务的复杂性和采集数据的多样性,存在误报率高、准确率低等问题,且只能针对由硬件环境不稳定和已知原因所造成的故障进行恢复,无法应对未知种类故障所引发的问题,难以满足虚拟环境下多虚拟机复杂系统高可靠性、高可用性协同运行的需求。传统虚拟机异常监控和恢复方法的不足主要集中于以下两个方面:
一方面,虚拟机的服务类型呈现出多样性、异构性等特点,难以充分分析复杂服务和多样性数据之间关联机制,造成虚拟机异常监测和恢复方法精度低;
另一方面,多虚拟机复杂系统中异常具备随机性、不确定性等特点,无法识别未知种类故障并解决其所引发的问题,使得虚拟机异常监测和恢复方法泛化性差。
发明内容
有鉴于此,本发明的目的在于提供一种智能网联汽车域控制器虚拟机异常云边协同监测和恢复系统及方法,综合考虑了虚拟机服务的复杂性和异常数据的多样性,可实现虚拟机异常实时监控和快速恢复,保障了多虚拟机复杂系统服务的可靠性,在智能网联汽车域控制器上具备重要的现实意义和良好的应用前景。
为达到上述目的,本发明提供如下技术方案:
本发明首先提出了一种智能网联汽车域控制器虚拟机异常云边协同监测和恢复系统,包括边缘端和云端;
所述边缘端包括:
状态实时监控模块,用于采集虚拟机关联设备的健康状态向量作为样本数据并根据异常类型对虚拟机异常进行修复;
异常自我监测模块,包括孤立森林模型和轻量化神经网络模型;所述孤立森林模型用于识别样本数据为已知异常样本数据或未知异常样本数据;所述轻量化神经网络模型用于确定已知异常样本数据的异常类型值;
所述云端包括:
未知故障挖掘模块,包括未知异常类划分模型和模型校正模块;所述未知异常类划分模型结合小波聚类和欧氏距离以对未知异常样本数据划分类别并赋予新的异常类型值;所述模型校正模块应用增量学习方法建立所述轻量化神经网络模型的校正模型以更新所述轻量化神经网络模型;
自主学习提升模块,用于在得到异常修复方案后结合历史修复方案对该异常修复方案进行评估和改进,改进后的异常修复方案被传输至所述状态实时监控模块以提升异常修复能力。
进一步,所述孤立森林模型用于对样本数据集D进行随机分割,得到给定样本数为n时树的平均路径长度值为:
其中,C(n)表示树的平均路径长度值;H(n)估计值为ln(n)+0.5772156649;
每一个虚拟机关联设备健康状态向量X的异常得分值为:
其中,S(x,n)表示异常得分值;x表示健康状态向量X中的样本;E(h(x))表示样本x在n个样本数据建立的孤立森林模型中的路径长度期望值。
进一步,所述轻量化神经网络模型的原理为:
将样本数据集D随机划分为多个batch并逐一送入所述轻量化神经网络模型中进行前向传播计算,输入k层第j个神经元的值为:
其中,表示输入k层第j个神经元的值;/>表示k-1层第i个神经元与k层第j个神经元之间的连接权值;/>表示k-1层第i个神经元的输出;/>表示k层第j个神经元的阈值;
隐含层第j个神经元的输出值为:
其中,bj表示隐含层第j个神经元的输出值;表示隐含层的激活函数;m表示k-1层神经元数量;s表示k层神经元数量
轻量化神经网络模型的最终预测输出值为:
其中,yk表示轻量化神经网络模型的最终预测输出值;f2(x)=x,表示输出层的激活函数;n表示样本数据集的大小。
进一步,所述状态实时监控模块内建立有多级异常处理机制对虚拟机异常进行实时修复,当所述异常自我监测模块得到所述异常类型值后,所述异常类型值被反馈到所述状态实时监控模块以触发所述多级异常处理机制,所述多级异常处理机制根据故障类型判断异常所处级别,再采取针对性方案措施对虚拟机异常进行修复。
进一步,所述未知异常类划分模型的原理为:当存在未知异常数据集时,使用未知异常数据集优化小波聚类模型,求解最优网格量化尺度值K和小波分解尺度nub D两个参数,获得未知异常类的各类特征中心,结合欧氏距离对未知异常样本数据进行类划分。
进一步,最优网格量化尺度值K的求解方法为:通过经验公式计算初始量化值k,并依据公式K=k+level对量化值k进行分解尺度递增处理,统计分析各k值对应的显著网格和空单元相数量,得到最优量化尺度值K;其中,n表示输入的数据量;d表示数据维数;level表示网格分解尺度。
进一步,小波分解尺度nub D的求解方法为:设置不同分解尺度nub d并运行小波变换,采用8-connection相连定义判断网格单元的相似性,建立查找表对小波变换前后数据对象、网格以及类进行定位,统计分析不同分解尺度nub d的聚类效果nub S,得到最优小波分解尺度值nub D。
进一步,所述模型校正模块包括注意力通道和并列的第一网络、第二网络,所述第一网络用于保留原有知识,所述第二网络用于进行前向计算以及误差反向传播以学习新知识;所述注意力通道用于融合原有知识和新知识并输出所述轻量化神经网络模型的校正模型。
本发明还提出了一种智能网联汽车域控制器虚拟机异常云边协同监测和恢复方法,包括如下步骤:
步骤一:利用状态实时监控模块采集虚拟机关联设备的健康状态向量X(t)=(xi,…,xN)作为待分析的样本数据;
步骤二:将样本数据输入异常自我监测模块内,利用孤立森林模型判断样本数据是否为已知异常样本数据:若是,则将样本数据传入轻量化神经网络模型确定已知异常样本数据的异常类型值,执行步骤三;若否,则样本数据为未知异常样本数据,执行步骤四;
步骤三:将已知异常样本数据的异常类型值输入状态实时监控模块以对虚拟机异常进行修复;
步骤四:调用状态实时监控模块中已有异常处理方案对未知异常进行尝试性修复,并保存未知异常样本数据;
步骤五:将未知异常数据传输至未知故障挖掘模块,采用未知异常类划分模型对未知异常样本数据划分类别并赋予新的异常类型值,将未知异常样本数据及赋予的新的异常类型值保存至未知异常数据集中;
步骤六:将未知异常数据集输入模型校正模块,应用增量学习方法建立校正模型,并将校正模型传输至异常自我监测模块以更新轻量化神经网络模型;将未知异常数据集输入自主学习提升模块以优化虚拟机异常的恢复方案,并将优化结果下传至状态实时监控模块中以提升异常修复能力。
本发明的有益效果在于:
本发明的智能网联汽车域控制器虚拟机异常云边协同监测和恢复系统,在边缘端建立状态实时监控模块和包括孤立森林模型、轻量化神经网络模型的异常自我监测模块,能够实时预测虚拟机的异常类型并进行针对性处理;在云端构建未知故障挖掘模块和自主学习提升模块,未知故障挖掘模块包括未知异常类划分模型和模型校正模块,未知异常类划分模型结合小波聚类和欧氏距离以对未知异常样本数据划分类别并赋予新的异常类型值,模型校正模块应用增量学习方法建立校正模型以更新所述轻量化神经网络模型;自主学习提升模块能够对虚拟机上传的未知异常的数据和健康参数进行学习,挖掘出完备的异常修复方案并下传到边缘端,更新补充其多级异常处理机制,即对异常修复方案进行评估和改进以提升异常修复能力。综上,本发明的智能网联汽车域控制器虚拟机异常云边协同监测和恢复系统综合考虑了虚拟机服务的复杂性和异常数据的多样性,能解决当前虚拟机异常监控和修复系统所存在的准确率低等问题,可实现虚拟机异常实时监控和快速恢复,保障了多虚拟机复杂系统服务的可靠性,在智能网联汽车域控制器上具备重要的现实意义和良好的应用前景。
附图说明
为了使本发明的目的、技术方案和有益效果更加清楚,本发明提供如下附图进行说明:
图1为本发明的智能网联汽车域控制器虚拟机异常云边协同监测和恢复系统的原理框图;
图2为本发明的边端虚拟机异常自我监测模块的未知异常识别原理图;
图3为本发明的云端虚拟机未知异常挖掘模块的轻量化异常预测网络校正原理框图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步说明,以使本领域的技术人员可以更好的理解本发明并能予以实施,但所举实施例不作为对本发明的限定。
如图1所示,本实施例的智能网联汽车域控制器虚拟机异常云边协同监测和恢复系统,包括边缘端和云端。具体的,边缘端包括状态实时监控模块和异常自我监测模块;云端包括未知故障挖掘模块和自主学习提升模块。
1、状态实时监控模块
状态实时监控模块,用于采集虚拟机关联设备的健康状态向量作为样本数据并根据异常类型对虚拟机异常进行修复。在采集虚拟机关联设备的健康状态向量前,获取智能网联汽车域控制器虚拟环境下的硬件资源、物理设备、Hypervisor、qvm进程、虚拟机、GuestOS以及应用服务等各部分的运行机制、关键性能指标和相关设计参数。在系统及模型训练过程中,结合域控制器和虚拟化软件平台,进行不同工作负荷下虚拟机的运行状态实验,在实验过程中实时监测虚拟机、CPU、内存、硬盘等的状态信息,并根据虚拟化系统运行机制和相关参数配置情况,向虚拟化系统中添加各种随机异常设置以模拟虚拟机可能出现的异常,然后根据实时监测信息可以得到一个表征虚拟机关联设备的健康状态向量X=(xi,…,xN)以及一个虚拟机工作状态值y。假设总共进行了N次虚拟机运行状态观测实验,其中第j次监测得到的数据为(Xj,yj),则所有N次虚拟机运行状态实验得到的数据集为D={(Xj,yj),0<j<N}。
针对虚拟机的各类异常情况,状态实时监控模块内建立多级异常处理机制对虚拟机异常进行实时修复,该机制定义了对异常的捕获、处理、保存、跟踪等一整套流程,可对虚拟机的任务级(EL0)、分区级(EL1)、系统级(EL2)、硬件级(EL3)等各个级别异常进行个性化处理。在通过异常自我监测模块获得了虚拟机的异常类型和异常类型值之后,异常类型值被反馈到状态实时监控模块,触发其中的多级异常处理机制,多级异常处理机制根据故障类型判断异常所处级别,再采取针对性方案措施对虚拟机异常进行修复。
2、异常自我监测模块
本实施例的异常自我监测模块包括孤立森林模型和轻量化神经网络模型。
2.1、孤立森林模型(Isolation Forest模型)
孤立森林模型用于识别样本数据为已知异常样本数据或未知异常样本数据。为了保证虚拟机异常能被准确恢复,使用Isolation Forest模型来识别未知异常,以避免未知异常数据导入轻量化神经网络模型并做出错误识别。孤立森林模型的结构如图2所示。Isolation Forest模型是一种无监督异常检测模型,可以仅使用正样本进行构建,其中心思想是容易被孤立的样本就是异常样本,并使用基于路径长度的异常得分来精确评估样本的异常程度。使用孤立森林模型用于对样本数据集D进行随机分割,直到Isolation Tree达到停止生长的条件,并采用子采样方法降低swamping和masking对分割过程的干扰。依据Isolation Forest构建结果可得到给定样本数为n时树的平均路径长度值为:
其中,C(n)表示树的平均路径长度值;H(n)估计值为ln(n)+0.5772156649;
每一个虚拟机关联设备健康状态向量X的异常得分值为:
其中,S(x,n)表示异常得分值;x表示健康状态向量X中的样本;E(h(x))表示样本x在n个样本数据建立的孤立森林模型中的路径长度期望值。
结合数据集D和Isolation Forest所计算的对应样本异常得分值,确定一个符合虚拟机未知异常识别的异常得分阈值。通过Isolation Forest对虚拟机关联设备的健康状态向量X进行未知异常处理后,就可以将其导入轻量化异常预测神经网络进行虚拟机异常类型识别处理。
2.2、轻量化神经网络模型
轻量化神经网络模型用于确定已知异常样本数据的异常类型值。轻量化异常预测神经网络采用了Dropout来增加网络的稀疏性、特征重激活模块来增加网络的非线性、以及遗传算法优化网络初始连接权值和阈值来避免陷入局部最优问题,确保其可将虚拟机关联设备的健康状态向量X精确转变为虚拟机异常类型值y。将上述轻量化神经网络模型在获得的虚拟机运行状态数据集D上进行优化。具体过程为将轻量化神经网络模型部署在单GPU计算环境中,将样本数据集D随机划分为多个batch并逐一送入轻量化神经网络模型中进行前向传播计算,输入k层第j个神经元的值为:
其中,表示输入k层第j个神经元的值;/>表示k-1层第i个神经元与k层第j个神经元之间的连接权值;/>表示k-1层第i个神经元的输出;/>表示k层第j个神经元的阈值;
隐含层第j个神经元的输出值为:
其中,bj表示隐含层第j个神经元的输出值;表示隐含层的激活函数;m表示k-1层神经元数量;s表示k层神经元数量
轻量化神经网络模型的最终预测输出值为:
其中,yk表示轻量化神经网络模型的最终预测输出值;f2(x)=x,表示输出层的激活函数;n表示样本数据集的大小。
将轻量化神经网络模型的输出值与真实值的差值作为损失值,通过反向传播算法对损失值进行反向传播并计算各网络参数的损失梯度,再通过Adam梯度优化器更新整个网络的所有可训练参数以不断降低损失,使得轻量化神经网络模型的输出结果不断接近数据集D。模型优化完成后,保存整个轻量化神经网络模型,用于构建后续的云边协同模型。
3、未知故障挖掘模块
未知故障挖掘模块包括未知异常类划分模型和模型校正模块。
3.1、未知异常类划分模型
未知异常类划分模型结合小波聚类和欧氏距离以对未知异常样本数据划分类别并赋予新的异常类型值。未知异常类划分模型的原理为:当存在未知异常数据集时,使用未知异常数据集优化小波聚类模型,求解最优网格量化尺度值K和小波分解尺度nub D两个参数,获得未知异常类的各类特征中心,结合欧氏距离对未知异常样本数据进行类划分。
具体的,最优网格量化尺度值K的求解方法为:通过经验公式计算初始量化值k,并依据公式K=k+level对量化值k进行分解尺度递增处理,统计分析各k值对应的显著网格和空单元相数量,得到最优量化尺度值K;其中,n表示输入的数据量;d表示数据维数;level表示网格分解尺度。
小波分解尺度nub D的求解方法为:设置不同分解尺度nub d并运行小波变换,采用8-connection相连定义判断网格单元的相似性,建立查找表对小波变换前后数据对象、网格以及类进行定位,统计分析不同分解尺度nub d的聚类效果nub S,得到最优小波分解尺度值nub D。
结合小波聚类模型结果和欧氏距离就可以对未知异常进行准确的类划分。当未知异常类划分模型输出处理后的未知异常数据或已知异常的特征分布发生较显著变化后,在不损失原轻量化神经网络模型性能的前提下,应用增量学习方法建立原轻量化神经网络模型的校正模型。
3.2、模型校正模块
模型校正模块应用增量学习方法建立轻量化神经网络模型的校正模型以更新轻量化神经网络模型。具体的,如图3所示,模型校正模块包括注意力通道和并列的第一网络、第二网络。为避免梯度反向传播时已有知识和新知识产生冲突,将第一网络冻结以用于保留原有知识,第二网络正常进行前向计算以及误差反向传播以学习新知识;注意力通道用于融合原有知识和新知识并输出轻量化神经网络模型的校正模型。第一网络、第二网络均代表一个先前训练的轻量化异常预测神经网络。
4、自主学习提升模块
自主学习提升模块用于在得到异常修复方案后结合历史修复方案对该异常修复方案进行评估和改进,改进后的异常修复方案被传输至状态实时监控模块以提升异常修复能力。由于未知异常的产生、异常发生场景的不断丰富、虚拟环境复杂度的提升等原因,虚拟机异常的修复方案需要及时的补充、完善以及提高。挖掘的各类虚拟机异常特征和Q-Learning模型优化虚拟机异常的恢复方案,优化过程中采用搜索评价与引导的策略提升效率,并建立可分层学习架构,再引入李雅普诺夫函数提升其稳定性。此外,该模块在得到对应异常的修复方案后,可结合历史修复方案对此修复方案进行评估和改进,得到一个更具针对性、更精确合理的修复方案,并将其传到状态实时监控模块中,进一步提升多级异常处理机制的异常恢复能力。
下面结合本实施例上述智能网联汽车域控制器虚拟机异常云边协同监测和恢复系统,对本实施例的智能网联汽车域控制器虚拟机异常云边协同监测和恢复方法的具体实施方式进行详细说明。
本实施例的智能网联汽车域控制器虚拟机异常云边协同监测和恢复方法,包括如下步骤:
步骤一:利用状态实时监控模块采集虚拟机关联设备的健康状态向量X(t)=(xi,…,xN)作为待分析的样本数据;
步骤二:将样本数据输入异常自我监测模块内,利用孤立森林模型判断样本数据是否为已知异常样本数据:若是,则将样本数据传入轻量化神经网络模型确定已知异常样本数据的异常类型值,执行步骤三;若否,则样本数据为未知异常样本数据,执行步骤四;
步骤三:将已知异常样本数据的异常类型值输入状态实时监控模块以对虚拟机异常进行修复;
步骤四:调用状态实时监控模块中已有异常处理方案对未知异常进行尝试性修复,并保存未知异常样本数据;
步骤五:将未知异常数据传输至未知故障挖掘模块,采用未知异常类划分模型对未知异常样本数据划分类别并赋予新的异常类型值,将未知异常样本数据及赋予的新的异常类型值保存至未知异常数据集中;
步骤六:将未知异常数据集输入模型校正模块,应用增量学习方法建立校正模型,并将校正模型传输至异常自我监测模块以更新轻量化神经网络模型;将未知异常数据集输入自主学习提升模块以优化虚拟机异常的恢复方案,并将优化结果下传至状态实时监控模块中以提升异常修复能力。
重复上述过程,可以实现云边协同的智能网联汽车域控制器虚拟机异常实时监测和自修复系统的闭环运行。
以上所述实施例仅是为充分说明本发明而所举的较佳的实施例,本发明的保护范围不限于此。本技术领域的技术人员在本发明基础上所作的等同替代或变换,均在本发明的保护范围之内。本发明的保护范围以权利要求书为准。

Claims (9)

1.一种智能网联汽车域控制器虚拟机异常云边协同监测和恢复系统,其特征在于:包括边缘端和云端;
所述边缘端包括:
状态实时监控模块,用于采集虚拟机关联设备的健康状态向量作为样本数据并根据异常类型对虚拟机异常进行修复;
异常自我监测模块,包括孤立森林模型和轻量化神经网络模型;所述孤立森林模型用于识别样本数据为已知异常样本数据或未知异常样本数据;所述轻量化神经网络模型用于确定已知异常样本数据的异常类型值;
所述云端包括:
未知故障挖掘模块,包括未知异常类划分模型和模型校正模块;所述未知异常类划分模型结合小波聚类和欧氏距离以对未知异常样本数据划分类别并赋予新的异常类型值;所述模型校正模块应用增量学习方法建立所述轻量化神经网络模型的校正模型以更新所述轻量化神经网络模型;
自主学习提升模块,用于在得到异常修复方案后结合历史修复方案对该异常修复方案进行评估和改进,改进后的异常修复方案被传输至所述状态实时监控模块以提升异常修复能力。
2.根据权利要求1所述的智能网联汽车域控制器虚拟机异常云边协同监测和恢复系统,其特征在于:所述孤立森林模型用于对样本数据集D进行随机分割,得到给定样本数为n时树的平均路径长度值为:
其中,C(n)表示树的平均路径长度值;H(n)估计值为ln(n)+0.5772156649;
每一个虚拟机关联设备健康状态向量X的异常得分值为:
其中,S(x,n)表示异常得分值;x表示健康状态向量X中的样本;E(h(x))表示样本x在n个样本数据建立的孤立森林模型中的路径长度期望值。
3.根据权利要求1所述的智能网联汽车域控制器虚拟机异常云边协同监测和恢复系统,其特征在于:所述轻量化神经网络模型的原理为:
将样本数据集D随机划分为多个batch并逐一送入所述轻量化神经网络模型中进行前向传播计算,输入k层第j个神经元的值为:
其中,表示输入k层第j个神经元的值;/>表示k-1层第i个神经元与k层第j个神经元之间的连接权值;/>表示k-1层第i个神经元的输出;/>表示k层第j个神经元的阈值;
隐含层第j个神经元的输出值为:
其中,bj表示隐含层第j个神经元的输出值;表示隐含层的激活函数;m表示k-1层神经元数量;s表示k层神经元数量;
轻量化神经网络模型的最终预测输出值为:
其中,yk表示轻量化神经网络模型的最终预测输出值;f2(x)=x,表示输出层的激活函数;n表示样本数据集的大小。
4.根据权利要求1所述的智能网联汽车域控制器虚拟机异常云边协同监测和恢复系统,其特征在于:所述状态实时监控模块内建立有多级异常处理机制对虚拟机异常进行实时修复,当所述异常自我监测模块得到所述异常类型值后,所述异常类型值被反馈到所述状态实时监控模块以触发所述多级异常处理机制,所述多级异常处理机制根据故障类型判断异常所处级别,再采取针对性方案措施对虚拟机异常进行修复。
5.根据权利要求1所述的智能网联汽车域控制器虚拟机异常云边协同监测和恢复系统,其特征在于:所述未知异常类划分模型的原理为:当存在未知异常数据集时,使用未知异常数据集优化小波聚类模型,求解最优网格量化尺度值K和小波分解尺度nub_D两个参数,获得未知异常类的各类特征中心,结合欧氏距离对未知异常样本数据进行类划分。
6.根据权利要求5所述的智能网联汽车域控制器虚拟机异常云边协同监测和恢复系统,其特征在于:最优网格量化尺度值K的求解方法为:通过经验公式计算初始量化值k,并依据公式K=k+level对量化值k进行分解尺度递增处理,统计分析各k值对应的显著网格和空单元相数量,得到最优量化尺度值K;其中,n表示输入的数据量;d表示数据维数;level表示网格分解尺度。
7.根据权利要求5所述的智能网联汽车域控制器虚拟机异常云边协同监测和恢复系统,其特征在于:小波分解尺度nub_D的求解方法为:设置不同分解尺度nub_d并运行小波变换,采用8-connection相连定义判断网格单元的相似性,建立查找表对小波变换前后数据对象、网格以及类进行定位,统计分析不同分解尺度nub_d的聚类效果nub_S,得到最优小波分解尺度值nub_D。
8.根据权利要求1所述的智能网联汽车域控制器虚拟机异常云边协同监测和恢复系统,其特征在于:所述模型校正模块包括注意力通道和并列的第一网络、第二网络,所述第一网络用于保留原有知识,所述第二网络用于进行前向计算以及误差反向传播以学习新知识;所述注意力通道用于融合原有知识和新知识并输出所述轻量化神经网络模型的校正模型。
9.一种智能网联汽车域控制器虚拟机异常云边协同监测和恢复方法,其特征在于:包括如下步骤:
步骤一:利用状态实时监控模块采集虚拟机关联设备的健康状态向量X(t)=(xi,…,xN)作为待分析的样本数据;
步骤二:将样本数据输入异常自我监测模块内,利用孤立森林模型判断样本数据是否为已知异常样本数据:若是,则将样本数据传入轻量化神经网络模型确定已知异常样本数据的异常类型值,执行步骤三;若否,则样本数据为未知异常样本数据,执行步骤四;
步骤三:将已知异常样本数据的异常类型值输入状态实时监控模块以对虚拟机异常进行修复;
步骤四:调用状态实时监控模块中已有异常处理方案对未知异常进行尝试性修复,并保存未知异常样本数据;
步骤五:将未知异常数据传输至未知故障挖掘模块,采用未知异常类划分模型对未知异常样本数据划分类别并赋予新的异常类型值,将未知异常样本数据及赋予的新的异常类型值保存至未知异常数据集中;
步骤六:将未知异常数据集输入模型校正模块,应用增量学习方法建立校正模型,并将校正模型传输至异常自我监测模块以更新轻量化神经网络模型;将未知异常数据集输入自主学习提升模块以优化虚拟机异常的恢复方案,并将优化结果下传至状态实时监控模块中以提升异常修复能力。
CN202310479985.XA 2023-04-28 2023-04-28 智能网联汽车域控制器虚拟机异常云边协同监测和恢复系统及方法 Active CN116501444B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310479985.XA CN116501444B (zh) 2023-04-28 2023-04-28 智能网联汽车域控制器虚拟机异常云边协同监测和恢复系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310479985.XA CN116501444B (zh) 2023-04-28 2023-04-28 智能网联汽车域控制器虚拟机异常云边协同监测和恢复系统及方法

Publications (2)

Publication Number Publication Date
CN116501444A CN116501444A (zh) 2023-07-28
CN116501444B true CN116501444B (zh) 2024-02-27

Family

ID=87322671

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310479985.XA Active CN116501444B (zh) 2023-04-28 2023-04-28 智能网联汽车域控制器虚拟机异常云边协同监测和恢复系统及方法

Country Status (1)

Country Link
CN (1) CN116501444B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117032881A (zh) * 2023-07-31 2023-11-10 广东保伦电子股份有限公司 一种虚拟机异常检测和恢复的方法、装置及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108776683A (zh) * 2018-06-01 2018-11-09 广东电网有限责任公司 一种基于孤立森林算法和神经网络的电力运维数据清洗方法
CN110796175A (zh) * 2019-09-30 2020-02-14 武汉大学 一种基于轻量卷积神经网络的脑电数据的在线分类方法
CN111131304A (zh) * 2019-12-31 2020-05-08 嘉兴学院 面向云平台大规模虚拟机细粒度异常行为检测方法和系统
CN111800299A (zh) * 2020-07-08 2020-10-20 广州市品高软件股份有限公司 一种边缘云的运营维护系统及其方法
CN112541533A (zh) * 2020-12-07 2021-03-23 阜阳师范大学 一种基于神经网络与特征融合的改装车识别方法
CN112765236A (zh) * 2021-01-22 2021-05-07 武汉斗鱼鱼乐网络科技有限公司 自适应异常设备挖掘方法、存储介质、设备及系统
CN115099335A (zh) * 2022-06-23 2022-09-23 广东电网有限责任公司广州供电局 多源异构数据的异常辨识和特征筛选方法、系统
CN115225536A (zh) * 2022-06-17 2022-10-21 上海仪电(集团)有限公司中央研究院 一种基于无监督学习的虚拟机异常检测方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11347594B2 (en) * 2019-11-26 2022-05-31 International Business Machines Corporation Inter-processor communications fault handling in high performance computing networks

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108776683A (zh) * 2018-06-01 2018-11-09 广东电网有限责任公司 一种基于孤立森林算法和神经网络的电力运维数据清洗方法
CN110796175A (zh) * 2019-09-30 2020-02-14 武汉大学 一种基于轻量卷积神经网络的脑电数据的在线分类方法
CN111131304A (zh) * 2019-12-31 2020-05-08 嘉兴学院 面向云平台大规模虚拟机细粒度异常行为检测方法和系统
CN111800299A (zh) * 2020-07-08 2020-10-20 广州市品高软件股份有限公司 一种边缘云的运营维护系统及其方法
CN112541533A (zh) * 2020-12-07 2021-03-23 阜阳师范大学 一种基于神经网络与特征融合的改装车识别方法
CN112765236A (zh) * 2021-01-22 2021-05-07 武汉斗鱼鱼乐网络科技有限公司 自适应异常设备挖掘方法、存储介质、设备及系统
CN115225536A (zh) * 2022-06-17 2022-10-21 上海仪电(集团)有限公司中央研究院 一种基于无监督学习的虚拟机异常检测方法及系统
CN115099335A (zh) * 2022-06-23 2022-09-23 广东电网有限责任公司广州供电局 多源异构数据的异常辨识和特征筛选方法、系统

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Marcel Wallschläger等.Anomaly Detection for Black Box Services in Edge Clouds Using Packet Size Distribution.《2018 IEEE 7th International Conference on Cloud Networking (CloudNet)》.2018,1-6. *
孟飒.大规模云计算系统的可靠性建模及优化研究.《中国博士学位论文全文数据库信息科技辑》.2022,I137-5. *
李柯辛.基于LSTM的云平台故障预测方法研究.《中国优秀硕士学位论文全文数据库信息科技辑》.2022,I139-145. *
申敬飞.面向容器环境的宿主入侵检测方法研究.《中国优秀硕士学位论文全文数据库信息科技辑》.2023,I139-31. *

Also Published As

Publication number Publication date
CN116501444A (zh) 2023-07-28

Similar Documents

Publication Publication Date Title
CN109858390B (zh) 基于端到端时空图学习神经网络的人体骨架行为识别方法
Lu et al. Detecting anomaly in big data system logs using convolutional neural network
Fei et al. CPS data streams analytics based on machine learning for Cloud and Fog Computing: A survey
CN107817787B (zh) 一种基于机器学习的智能产线机械手故障诊断方法
Dai et al. Deeptrend: A deep hierarchical neural network for traffic flow prediction
US20220351019A1 (en) Adaptive Search Method and Apparatus for Neural Network
Zhao et al. Local similarity imputation based on fast clustering for incomplete data in cyber-physical systems
Yang et al. IoT data analytics in dynamic environments: From an automated machine learning perspective
CN113435509B (zh) 基于元学习的小样本场景分类识别方法及系统
Du et al. GAN-based anomaly detection for multivariate time series using polluted training set
CN110298374B (zh) 一种基于深度学习的驾驶轨迹能耗分析方法和装置
CN116501444B (zh) 智能网联汽车域控制器虚拟机异常云边协同监测和恢复系统及方法
CN113139600A (zh) 基于联邦学习的智能电网设备异常检测方法和系统
Yin et al. Parallel implementing improved k-means applied for image retrieval and anomaly detection
CN111222689A (zh) 基于多尺度时间特征的lstm负荷预测方法、介质及电子装置
CN112464233A (zh) 一种云平台上基于rnn的恶意软件检测方法
Gupta et al. A supervised deep learning framework for proactive anomaly detection in cloud workloads
CN114118138A (zh) 一种基于多标签领域自适应模型的轴承复合故障诊断方法
CN117156442A (zh) 基于5g网络的云数据安全保护方法及系统
Tian et al. Spatio-temporal position prediction model for mobile users based on LSTM
Wu et al. Research on network intrusion detection technology based on machine learning
Yan et al. TL-CNN-IDS: transfer learning-based intrusion detection system using convolutional neural network
Zhu et al. Hierarchical reinforcement learning based on KNN classification algorithms
Liu et al. An incremental broad learning approach for semi-supervised classification
Li et al. Class imbalanced fault diagnosis via combining K-means clustering algorithm with generative adversarial networks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant