CN114742316A - 超速预测方法、装置、存储介质及电子装置 - Google Patents
超速预测方法、装置、存储介质及电子装置 Download PDFInfo
- Publication number
- CN114742316A CN114742316A CN202210482898.5A CN202210482898A CN114742316A CN 114742316 A CN114742316 A CN 114742316A CN 202210482898 A CN202210482898 A CN 202210482898A CN 114742316 A CN114742316 A CN 114742316A
- Authority
- CN
- China
- Prior art keywords
- data
- feature
- overspeed
- sample
- characteristic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/15—Correlation function computation including computation of convolution operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/60—Other road transportation technologies with climate change mitigation effect
- Y02T10/72—Electric energy management in electromobility
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Pure & Applied Mathematics (AREA)
- Software Systems (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Business, Economics & Management (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Algebra (AREA)
- Operations Research (AREA)
- Databases & Information Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Economics (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Probability & Statistics with Applications (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
Abstract
本发明公开了一种超速预测方法、装置、存储介质及电子装置。其中,该方法包括获取第一数据,对第一数据进行预处理,得到第二数据,其中,第二数据包括第一历史数据和第一实时数据;对第二数据进行特征提取,得到第一特征,其中,第一特征包括第一历史特征和第一实时特征;对第一历史特征进行样本划分,得到第一样本,其中,第一样本包括训练集;通过训练集对第一模型进行训练,得到目标模型;将第一实时特征输入到目标模型进行预测,得到预测结果,其中,预测结果用于确定目标车辆在第一时间段内是否存在电机超速行为。本发明解决了相关技术的无法结合车辆实时工况,提前对电机超速行为进行预测的技术问题。
Description
技术领域
本发明涉及车辆技术领域,具体而言,涉及一种超速预测方法、装置、存储介质及电子装置。
背景技术
随着环境问题日益显著,新能源车辆的发展受到了广泛关注。驱动电机是新能源车辆的主要驱动部件,它能够将电能和机械能相互转化,为车辆提供充足的动力,电机的运行直接影响着车辆的运行。
在车辆行驶过程中,车辆负载短时间内降低、电机低压信号线插头松动等原因都可能导致电机出现超速故障,进而导致电机控制器的功率管被高压击穿而损坏。目前为了解决上述问题,会根据电机自身的物理特性,给电机定义一个超速阈值,从而判断电机是否超速,但该方法无法提前预测电机是否存在潜在的超速行为,不能为控制电机预留足够时间。
发明内容
本发明实施例提供了一种超速预测方法、装置、存储介质及电子装置,以至少解决相关技术的无法结合车辆实时工况,提前对电机超速行为进行预测的技术问题。
根据本发明其中一实施例,提供了一种超速预测方法,该方法包括:
获取第一数据,对第一数据进行预处理,得到第二数据,其中,第二数据包括第一历史数据和第一实时数据,第一历史数据为所有车辆历史行驶过程中的数据,第一实时数据为目标车辆当前行驶过程中的数据;对第二数据进行特征提取,得到第一特征,其中,第一特征包括第一历史特征和第一实时特征;对第一历史特征进行样本划分,得到第一样本,其中,第一样本包括训练集;通过训练集对第一模型进行训练,得到目标模型;将第一实时特征输入到目标模型进行预测,得到预测结果,其中,预测结果用于确定目标车辆在第一时间段内是否存在电机超速行为。
可选地,第一数据进行预处理,得到第二数据包括:对第一数据中的无效值进行处理,得到第三数据,其中,第一数据包括车辆的运转数据和状态数据,运转数据包括车辆的电机温度、电机转速、行驶速度和电机电流,状态数据包括车辆的充电状态、耗电状态、启动状态和熄火状态;根据偏移量对第三数据进行计算,得到第二数据。
可选地,对第二数据进行特征提取,得到第一特征包括:通过滑动窗口对第二数据进行特征提取,得到第二特征,其中,第二特征包括平均车速、平均行驶车速、正加速度平均值、负加速度平均值、速度方差、加速度方差、惯性方差、加速时间比例、减速时间比例、最大加速度、最小加速度、惯性最小值、惯性最大值、电机输出扭矩平均值和电机输出扭矩最大值;根据皮尔逊(Pearson)相关系数对第二特征进行特征相关性分析,得到第一特征。
可选地,第二特征包括多个特征变量,所述根据皮尔逊(Pearson)相关系数对第二特征进行特征相关性分析,得到第一特征包括:计算多个特征变量中任意两个特征变量的第一皮尔逊相关系数;响应于第一皮尔逊相关系数的绝对值大于等于第一阈值,保留任意两个特征变量中的其中一个特征变量,得到第一特征。
可选地,对第一历史特征进行样本划分,得到第一样本包括:根据电机的超速阈值,从第一历史特征中选取电机的第一样本,其中,第一样本包括超速正样本和超速负样本。
可选地,通过训练集对第一模型进行训练,得到目标模型包括:根据轻度梯度提升机(LightGBM)算法建立第一模型,通过训练集对第一模型进行训练,得到目标模型。
可选地,第一样本还包括验证集,该方法还包括:通过目标模型对验证集进行验证。
根据本发明其中一实施例,还提供了一种超速预测装置,包括:
获取模块,获取模块用于获取第一数据,对第一数据进行预处理,得到第二数据,其中,第二数据包括第一历史数据和第一实时数据,第一历史数据为所有车辆历史行驶过程中的数据,第一实时数据为目标车辆当前行驶过程中的数据;特征模块,特征模块用于对第二数据进行特征提取,得到第一特征,其中,第一特征包括第一历史特征和第一实时特征;样本模块,样本模块用于对第一历史特征进行样本划分,得到第一样本,其中,第一样本包括训练集;训练模块,训练模块用于通过训练集对第一模型进行训练,得到目标模型;预测模块,预测模块用于将第一实时特征输入到目标模型进行预测,得到预测结果,其中,预测结果用于确定目标车辆在第一时间段内是否存在电机超速行为。
可选地,获取模块还用于对第一数据中的无效值进行处理,得到第三数据,其中,第一数据包括车辆的运转数据和状态数据,运转数据包括车辆的电机温度、电机转速、行驶速度和电机电流,状态数据包括车辆的充电状态、耗电状态、启动状态和熄火状态;根据偏移量对第三数据进行计算,得到第二数据。
可选地,特征模块还用于通过滑动窗口对第二数据进行特征提取,得到第二特征,其中,第二特征包括平均车速、平均行驶车速、正加速度平均值、负加速度平均值、速度方差、加速度方差、惯性方差、加速时间比例、减速时间比例、最大加速度、最小加速度、惯性最小值、惯性最大值、电机输出扭矩平均值和电机输出扭矩最大值;根据皮尔逊(Pearson)相关系数对第二特征进行特征相关性分析,得到第一特征。
可选地,第二特征包括多个特征变量,特征模块还用于计算多个特征变量中任意两个特征变量的第一皮尔逊相关系数;响应于第一皮尔逊相关系数的绝对值大于等于第一阈值,保留任意两个特征变量中的其中一个特征变量,得到第一特征。
可选地,样本模块还用于根据电机的超速阈值,从第一历史特征中选取电机的第一样本,其中,第一样本包括超速正样本和超速负样本。
可选地,训练模块还用于根据轻度梯度提升机(LightGBM)算法建立第一模型,通过训练集对第一模型进行训练,得到目标模型。
可选地,第一样本还包括验证集,预测模块还用于通过目标模型对验证集进行验证。
根据本发明其中一实施例,还提供了一种计算机可读存储介质,存储介质中存储有计算机程序,其中,计算机程序被设置为在计算机或处理器上运行时,执行上述任一项中的超速预测方法。
根据本发明其中一实施例,还提供了一种电子装置,包括存储器和处理器,存储器中存储有计算机程序,处理器被设置为运行计算机程序以执行上述任一项中的超速预测方法。
在本发明实施例中,通过获取车联网的历史数据和目标车辆的实时数据,对获取的数据进行预处理与特征提取,得到第一历史特征和第一实时特征,再对第一历史特征进行样本划分,得到包括训练集的第一样本,通过训练集对第一模型进行训练,得到目标模型,将第一实时特征输入到目标模型进行预测,即能够得到用于确定目标车辆在第一时间段内是否存在电机超速行为的预测结果。采用上述方法,通过对车联网的历史数据进行处理和训练,得到能够准确提前预测车辆电机是否存在超速行为的目标模型,再通过目标模型,以及对目标车辆的实时数据进行处理得到的实时特征,能够实现针对车辆的不同工况进行提前超速预测,从而为电机控制预留足够时间,减小了对电机及相关控制器的损害,有效地对电机进行了保护,进而解决了相关技术的无法结合车辆实时工况,提前对电机超速行为进行预测的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明其中一实施例的超速预测方法的流程图;
图2是根据本发明其中一实施例的超速预测方法的流程图;
图3是根据本发明其中一实施例的超速预测装置的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本发明其中一实施例,提供了一种超速预测方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
该方法实施例可以在包含存储器和处理器的电子装置、类似的控制装置或者系统中执行。以电子装置为例,电子装置可以包括一个或多个处理器和用于存储数据的存储器。可选地,上述电子装置还可以包括用于通信功能的通信设备以及显示设备。本领域普通技术人员可以理解,上述结构描述仅为示意,其并不对上述电子装置的结构造成限定。例如,电子装置还可包括比上述结构描述更多或者更少的组件,或者具有与上述结构描述不同的配置。
处理器可以包括一个或多个处理单元。例如:处理器可以包括中央处理器(central processing unit,CPU)、图形处理器(graphics processing unit,GPU)、数字信号处理(digital signal processing,DSP)芯片、微处理器(microcontroller unit,MCU)、可编程逻辑器件(field-programmable gate array,FPGA)、神经网络处理器(neural-network processing unit,NPU)、张量处理器(tensor processing unit,TPU)、人工智能(artificial intelligent,AI)类型处理器等的处理装置。其中,不同的处理单元可以是独立的部件,也可以集成在一个或多个处理器中。在一些实例中,电子装置也可以包括一个或多个处理器。
存储器可用于存储计算机程序,例如存储本发明实施例中的超速预测方法对应的计算机程序,处理器通过运行存储在存储器内的计算机程序,从而实现上述的超速预测方法。存储器可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至电子装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
通信设备用于经由一个网络接收或者发送数据。上述的网络具体实例可包括移动终端的通信供应商提供的无线网络。在一个实例中,通信设备包括一个网络适配器(network interface controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,通信设备可以为射频(radio frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
显示设备可以例如触摸屏式的液晶显示器(liquid crystal display,LCD)和触摸显示器(也被称为“触摸屏”或“触摸显示屏”)。该液晶显示器可使得用户能够与移动终端的用户界面进行交互。在一些实施例中,上述移动终端具有图形用户界面(graphical userinterface,GUI),用户可以通过触摸触敏表面上的手指接触和/或手势来与GUI进行人机交互,此处的人机交互功能可选的包括如下交互:创建网页、绘图、文字处理、制作电子文档、游戏、视频会议、即时通信、收发电子邮件、通话界面、播放数字视频、播放数字音乐和/或网络浏览等、用于执行上述人机交互功能的可执行指令被配置/存储在一个或多个处理器可执行的计算机程序产品或可读存储介质中。
在本实施例中提供了一种运行于电子装置的超速预测方法,图1是根据本发明其中一实施例的超速预测方法的流程图,如图1所示,该流程包括如下步骤:
步骤S101、获取第一数据,对第一数据进行预处理,得到第二数据。
其中,第二数据包括第一历史数据和第一实时数据,第一历史数据为所有车辆历史行驶过程中的数据,第一实时数据为目标车辆当前行驶过程中的数据。
获取第一数据,具体为获取车联网中的所有车辆的历史行驶数据,以及获取待进行超速预测的目标车辆的当前行驶数据。获取到的第一数据均为基于时间序列的流式数据,可以理解为按照时间顺序排列的时序数据。
对第一数据进行预处理,得到预处理后的第二数据,可以看出,第二数据也包括对车联网中的所有车辆的历史行驶数据进行预处理后,得到的第一历史数据,以及对待进行超速预测的目标车辆的当前行驶数据进行预处理后,得到的第一实时数据。
步骤S102、对第二数据进行特征提取,得到第一特征。
其中,第一特征包括第一历史特征和第一实时特征。
对预处理后的第二数据进行特征提取,可以理解为将第二数据中作用相同的特征进行适当的删减,减少进行后续处理的特征,从而减少系统占用,提高后续模型训练的速度,减少模型训练的时间。
示例性的,对第二数据中的第一历史数据进行特征提取,得到第一历史特征,对第二数据中的第一实时数据进行特征提取,得到第一实时特征。
步骤S103、对第一历史特征进行样本划分,得到第一样本。
其中,第一样本包括训练集,训练集用于确定目标模型。
对第一历史特征进行样本划分,将有价值的、有效的样本选取出来,得到第一样本,从而进一步提高后续模型训练的速度,减少模型训练的时间。
步骤S104、通过训练集对第一模型进行训练,得到目标模型。
其中,第一模型为根据轻度梯度提升机(light gradient boosting machine,LightGBM)算法建立的模型。
由于电机超速预测属于分类问题,可以基于回归(logist ic)、前馈神经网络(multilayer layerperceptron,MLP)和lightGBM等机器学习算法进行建模,通过对上述算法模型的综合效果进行对比,由于LightGBM算法的预测精度非常高,模型鲁棒性强,且无需对数据进行调整编码,可以处理各种类型的数据,因此本发明选择基于LightGBM(决策树算法为弱学习器的分布式梯度提升框架)的模型进行建模,从而对电机超速进行预测。
示例性的,将训练集的特征代入到第一模型进行训练,得到能够准确进行超速预测的目标模型。
步骤S105、将第一实时特征输入到目标模型进行预测,得到预测结果。
其中,预测结果用于确定目标车辆在第一时间段内是否存在电机超速行为,第一时间段为未来一段时间内,可以理解为在目标车辆当前时刻之后的一段时间内。
目标模型训练完成后,将获取到的目标车辆的实时行驶数据进行处理后,得到的第一实时特征输入到目标模型上进行预测,从而能够得到目标车辆的实时预测结果,准确确定出目标车辆在未来一段时间是否存在电机超速行为。
通过上述步骤,通过获取车联网的历史数据和目标车辆的实时数据,对获取的数据进行预处理与特征提取,得到第一历史特征和第一实时特征,再对第一历史特征进行样本划分,得到包括训练集的第一样本,通过训练集对第一模型进行训练,得到目标模型,将第一实时特征输入到目标模型进行预测,即能够得到用于确定目标车辆在第一时间段内是否存在电机超速行为的预测结果。采用上述方法,通过对车联网的历史数据进行处理和训练,得到能够准确提前预测车辆电机是否存在超速行为的目标模型,再通过目标模型,以及对目标车辆的实时数据进行处理得到的实时特征,能够实现针对车辆的不同工况进行提前超速预测,从而为电机控制预留足够时间,减小了对电机及相关控制器的损害,有效地对电机进行了保护,进而解决了相关技术的无法结合车辆实时工况,提前对电机超速行为进行预测的技术问题。
可选地,在步骤S101中,对第一数据进行预处理,得到第二数据可以包括以下执行步骤:
步骤S101a、对第一数据中的无效值进行处理,得到第三数据。
其中,第一数据包括车辆的运转数据和状态数据,运转数据包括车辆的电机温度、电机转速、行驶速度和电机电流等连续数据。状态数据包括车辆的充电状态、耗电状态、启动状态和熄火状态等离散数据。
对第一数据中的无效值进行处理,可以理解为对第一数据进行清洗。第一数据中的无效值例如可以包括第一数据字段中的一些异常值、空值和重复值,示例性的,对异常值和重复值进行判断并删除,将删除后的空值根据前后数据进行插值补充,确保第一数据能够按照时间顺序排列完整。此外,还可以对第一数据中的加密值进行解密,从而复原数据,保证第一数据的连续性。因此,得到的第三数据也为时序数据。
步骤S101b、根据偏移量对第三数据进行计算,得到第二数据。
其中,不同的数据所对应的偏移量不同,可以理解为不同的数据根据偏移量进行转化的方式不同。
将第三数据根据偏移量进行转化,转化为真实数据,对转化后的数据进行整合,得到第二数据。示例性的,可将预处理得到的第二数据保存为pickle文件。
可选地,在步骤S102中,对第二数据进行特征提取,得到第一特征可以包括以下执行步骤:
步骤S102a、通过滑动窗口对第二数据进行特征提取,得到第二特征。
其中,第二特征包括平均车速、平均行驶车速、正加速度平均值、负加速度平均值、速度方差、加速度方差、惯性(速度乘以加速度)方差、加速时间比例、减速时间比例、最大加速度、最小加速度、惯性最小值、惯性最大值、电机输出扭矩平均值和电机输出扭矩最大值。
通过滑动窗口对第二数据进行特征提取时,滑动窗口大小和滑动步长可以根据第二数据的时间序列特征和数据总量确定,可以理解为根据第二数据的数据采集频率和数据总量来确定。
步骤S102b、根据皮尔逊(Pearson)相关系数对第二特征进行特征相关性分析,得到第一特征。
在进行模型训练时,会出现特征不同但起到的作用相同的情况,例如特征A和特征B在进行模型训练时起到的作用相同,因此为了减少进行模型训练的时间,可以仅保留特征A和特征B中的其中一个特征。
因此根据Pearson相关系数对第二特征中的多个特征变量进行特征相关性分析,Pearson相关系数用于反映变量之间的线性关系,即根据Pearson相关系数对第二特征中的多个特征变量进行特征共线性判断,从而对第二特征进行适当的删减,得到第一特征。
可选地,第二特征包括多个特征变量,在步骤S102b中,根据皮尔逊(Pearson)相关系数对第二特征进行特征相关性分析,得到第一特征可以包括以下执行步骤:
步骤S102b1、计算多个特征变量中任意两个特征变量的第一皮尔逊相关系数。
示例性的,假设两个特征变量分别为X=(X1,X2,...,Xn)和Y=(Y1,Y2,...,Yn),则Pearson相关系数r可以表示为:
其中,X1为第一个时间采样点处的特征,X2为第二个时间采样点处的特征,以此类推。
步骤S102b2、响应于第一皮尔逊相关系数的绝对值大于等于第一阈值,保留任意两个特征变量中的其中一个特征变量,得到第一特征。
Pearson相关系数r的取值介于-1和+1之间,若取值为-1或+1,则表明两个特征变量有直接的线性关系,若取值为0,则表明两个特征变量没有线性关系。本发明中,响应于第一皮尔逊相关系数的绝对值大于等于第一阈值,则保留任意两个特征变量中的其中一个特征变量,得到第一特征。
示例性的,第一阈值例如可以为0.8,对特征A和特征B计算Pearson相关系数r,若|r|≥0.8,则保留特征A和特征B中的其中一个特征。
可选地,在步骤S103中,对第一历史特征进行样本划分,得到第一样本可以包括以下执行步骤:
步骤S103a、根据电机的超速阈值,从第一历史特征中选取电机的第一样本。
其中,第一样本包括超速正样本和超速负样本。
根据目标车辆的电机的超速阈值,从第一历史特征中选取临近电机超速前h个滑动窗口提取的特征,以及电机超速后的所有滑动窗口提取的特征,作为电机超速的正样本,即超速正样本,数据标注为1,其中,h根据实际情况和经验确定。同时,将其他滑动窗口提取的特征作为电机的超速负样本,即超速负样本,按照超速负样本:超速正样本为1:n的比例从其他滑动窗口中提取超速负样本,数据标注为0,n取值由实际情况和经验确定,通常n为大于1的整数。将提取的超速正样本和超速负样本进行合并,构成模型训练所需的全部样本,即第一样本。
将第一样本按照一定比例进行划分,划分出训练集。例如,按照8:2的比例划分训练集和验证集。
可选地,在步骤S104中,通过训练集对第一模型进行训练,得到目标模型可以包括以下执行步骤:
步骤S104a、根据轻度梯度提升机(LightGBM)算法建立第一模型,通过训练集对第一模型进行训练,得到目标模型。
其中,通过训练集对第一模型进行训练包括进行基于梯度的单面采样和互斥特征合并。基于梯度的单面采样是保留大于梯度阈值的特征,即保留具有较大梯度的特征,基于梯度的单面采样是为了保留对计算信息增益的贡献比较大的、更加需要训练的特征。互斥特征合并是将大于维度阈值的互斥稀疏特征合并,即将高维的互斥稀疏特征合并,从而大大减少特征数量来提高训练速度。
示例性的,将训练集的特征代入到根据LightGBM算法建立的第一模型中,进行基于梯度的单面采样和互斥特征合并,得到能够准确进行超速预测的目标模型。
可选地,第一样本还包括验证集,该流程还包括以下执行步骤:
步骤S106、通过目标模型对验证集进行验证。
步骤S103a对第一样本按照一定比例进行划分时,还会划分出验证集,通过目标模型对验证集进行验证,能够确定出得到的目标模型的准确率、召回率和精确率。
具体地,上述步骤S101-步骤S106可以参见图2所示,为根据本发明其中一实施例的超速预测方法的流程图。首先获取车联网的历史数据和目标车辆实时数据,对获取到的数据进行删除、插值以及解密等预处理,再将预处理之后得到的数据通过滑动窗口和pearson相关系数进行特征提取,得到第一历史特征和第一实时特征。将第一历史特征进行正、负样本划分,得到包括训练集和验证集的第一样本。再通过训练集对LightGBM算法建立的第一模型进行训练,得到目标模型。最后在目标模型的基础上对验证集进行验证,确定目标模型的准确率,以及对第一实时特征进行预测,从而确定目标车辆的电机在未来一段时间内是否会出现电机超速行为。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
在本实施例中还提供了一种超速预测装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图3是根据本发明其中一实施例的超速预测装置的结构框图,如图3所示,以超速预测装置300进行示例,该装置包括:获取模块301,用于获取第一数据,对第一数据进行预处理,得到第二数据,其中,第二数据包括第一历史数据和第一实时数据,第一历史数据为所有车辆历史行驶过程中的数据,第一实时数据为目标车辆当前行驶过程中的数据;特征模块302,用于对第二数据进行特征提取,得到第一特征,其中,第一特征包括第一历史特征和第一实时特征;样本模块303,用于对第一历史特征进行样本划分,得到第一样本,其中,第一样本包括训练集;训练模块304,用于通过训练集对第一模型进行训练,得到目标模型;预测模块305,用于将第一实时特征输入到目标模型进行预测,得到预测结果,其中,预测结果用于确定目标车辆在第一时间段内是否存在电机超速行为。
可选地,获取模块303还用于对第一数据中的无效值进行处理,得到第三数据,其中,第一数据包括车辆的运转数据和状态数据,运转数据包括车辆的电机温度、电机转速、行驶速度和电机电流,状态数据包括车辆的充电状态、耗电状态、启动状态和熄火状态;根据偏移量对第三数据进行计算,得到第二数据。
可选地,特征模块302还用于通过滑动窗口对第二数据进行特征提取,得到第二特征,其中,第二特征包括平均车速、平均行驶车速、正加速度平均值、负加速度平均值、速度方差、加速度方差、惯性方差、加速时间比例、减速时间比例、最大加速度、最小加速度、惯性最小值、惯性最大值、电机输出扭矩平均值和电机输出扭矩最大值;根据皮尔逊(Pearson)相关系数对第二特征进行特征相关性分析,得到第一特征。
可选地,第二特征包括多个特征变量,特征模块302还用于计算多个特征变量中任意两个特征变量的第一皮尔逊相关系数;响应于第一皮尔逊相关系数的绝对值大于等于第一阈值,保留任意两个特征变量中的其中一个特征变量,得到第一特征。
可选地,样本模块303还用于根据电机的超速阈值,从第一历史特征中选取电机的第一样本,其中,第一样本包括超速正样本和超速负样本。
可选地,训练模块304还用于根据轻度梯度提升机(LightGBM)算法建立第一模型,通过训练集对第一模型进行训练,得到目标模型。
可选地,第一样本还包括验证集,预测模块305还用于通过目标模型对验证集进行验证。
需要说明的是,上述各个模块是可以通过软件或硬件来实现的,对于后者,可以通过以下方式实现,但不限于此:上述模块均位于同一处理器中;或者,上述各个模块以任意组合的形式分别位于不同的处理器中。
本发明的实施例还提供了一种计算机可读存储介质,该存储介质中存储有计算机程序,其中,该计算机程序被设置为在计算机或处理器上运行时,执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述计算机可读存储介质可以被设置为存储用于执行以下步骤的计算机程序:
步骤S1、获取第一数据,对第一数据进行预处理,得到第二数据;
步骤S2、对第二数据进行特征提取,得到第一特征;
步骤S3、对第一历史特征进行样本划分,得到第一样本;
步骤S4、通过训练集对第一模型进行训练,得到目标模型;
步骤S5、将第一实时特征输入到目标模型进行预测,得到预测结果。
可选地,在本实施例中,上述非易失性存储介质可以包括但不限于:U盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。
本发明的实施例还提供了一种电子装置,包括存储器和处理器,存储器中存储有计算机程序,处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述电子装置中的处理器可以被设置为运行计算机程序以执行以下步骤:
步骤S1、获取第一数据,对第一数据进行预处理,得到第二数据;
步骤S2、对第二数据进行特征提取,得到第一特征;
步骤S3、对第一历史特征进行样本划分,得到第一样本;
步骤S4、通过训练集对第一模型进行训练,得到目标模型;
步骤S5、将第一实时特征输入到目标模型进行预测,得到预测结果。
可选地,本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,本实施例在此不再赘述。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (10)
1.一种超速预测方法,其特征在于,所述方法包括:
获取第一数据,对所述第一数据进行预处理,得到第二数据,其中,所述第二数据包括第一历史数据和第一实时数据,所述第一历史数据为所有车辆历史行驶过程中的数据,所述第一实时数据为目标车辆当前行驶过程中的数据;
对所述第二数据进行特征提取,得到第一特征,其中,所述第一特征包括第一历史特征和第一实时特征;
对所述第一历史特征进行样本划分,得到第一样本,其中,所述第一样本包括训练集;
通过所述训练集对第一模型进行训练,得到目标模型;
将所述第一实时特征输入到所述目标模型进行预测,得到预测结果,其中,所述预测结果用于确定所述目标车辆在第一时间段内是否存在电机超速行为。
2.根据权利要求1所述的方法,其特征在于,所述对所述第一数据进行预处理,得到第二数据包括:
对所述第一数据中的无效值进行处理,得到第三数据,其中,所述第一数据包括所述车辆的运转数据和状态数据,所述运转数据包括所述车辆的电机温度、电机转速、行驶速度和电机电流,所述状态数据包括所述车辆的充电状态、耗电状态、启动状态和熄火状态;
根据偏移量对所述第三数据进行计算,得到第二数据。
3.根据权利要求1或2所述的方法,其特征在于,所述对所述第二数据进行特征提取,得到第一特征包括:
通过滑动窗口对所述第二数据进行特征提取,得到第二特征,其中,所述第二特征包括平均车速、平均行驶车速、正加速度平均值、负加速度平均值、速度方差、加速度方差、惯性方差、加速时间比例、减速时间比例、最大加速度、最小加速度、惯性最小值、惯性最大值、电机输出扭矩平均值和电机输出扭矩最大值;
根据皮尔逊(Pearson)相关系数对所述第二特征进行特征相关性分析,得到第一特征。
4.根据权利要求3所述的方法,其特征在于,所述第二特征包括多个特征变量,所述根据皮尔逊(Pearson)相关系数对所述第二特征进行特征相关性分析,得到第一特征包括:
计算所述多个特征变量中任意两个特征变量的第一皮尔逊相关系数;
响应于所述第一皮尔逊相关系数的绝对值大于等于第一阈值,保留所述任意两个特征变量中的其中一个特征变量,得到第一特征。
5.根据权利要求1或2所述的方法,其特征在于,所述对所述第一历史特征进行样本划分,得到第一样本包括:
根据电机的超速阈值,从所述第一历史特征中选取所述电机的第一样本,其中,所述第一样本包括超速正样本和超速负样本。
6.根据权利要求1或2所述的方法,其特征在于,所述通过所述训练集对第一模型进行训练,得到目标模型包括:
根据轻度梯度提升机(LightGBM)算法建立所述第一模型,通过所述训练集对所述第一模型进行训练,得到所述目标模型。
7.根据权利要求1或2所述的方法,其特征在于,所述第一样本还包括验证集,所述方法还包括:
通过所述目标模型对所述验证集进行验证。
8.一种超速预测装置,其特征在于,所述装置包括:
获取模块,所述获取模块用于获取第一数据,对所述第一数据进行预处理,得到第二数据,其中,所述第二数据包括第一历史数据和第一实时数据,所述第一历史数据为所有车辆历史行驶过程中的数据,所述第一实时数据为目标车辆当前行驶过程中的数据;
特征模块,所述特征模块用于对所述第二数据进行特征提取,得到第一特征,其中,所述第一特征包括第一历史特征和第一实时特征;
样本模块,所述样本模块用于对所述第一历史特征进行样本划分,得到第一样本,其中,所述第一样本包括训练集;
训练模块,所述训练模块用于通过所述训练集对第一模型进行训练,得到目标模型;
预测模块,所述预测模块用于将所述第一实时特征输入到所述目标模型进行预测,得到预测结果,其中,所述预测结果用于确定所述目标车辆在第一时间段内是否存在电机超速行为。
9.一种计算机可读存储介质,其特征在于,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为在计算机或处理器上运行时,执行上述权利要求1至7任一项中所述的超速预测方法。
10.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述权利要求1至7任一项中所述的超速预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210482898.5A CN114742316A (zh) | 2022-05-05 | 2022-05-05 | 超速预测方法、装置、存储介质及电子装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210482898.5A CN114742316A (zh) | 2022-05-05 | 2022-05-05 | 超速预测方法、装置、存储介质及电子装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114742316A true CN114742316A (zh) | 2022-07-12 |
Family
ID=82286682
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210482898.5A Pending CN114742316A (zh) | 2022-05-05 | 2022-05-05 | 超速预测方法、装置、存储介质及电子装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114742316A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024078339A1 (zh) * | 2022-10-09 | 2024-04-18 | 蔚来动力科技(合肥)有限公司 | 基于车辆历史数据的故障预测方法、系统和存储介质 |
-
2022
- 2022-05-05 CN CN202210482898.5A patent/CN114742316A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024078339A1 (zh) * | 2022-10-09 | 2024-04-18 | 蔚来动力科技(合肥)有限公司 | 基于车辆历史数据的故障预测方法、系统和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110020620B (zh) | 一种大姿态下的人脸识别方法、装置及设备 | |
US20200202449A1 (en) | Risk identification model building and risk identification | |
CN107609598A (zh) | 图像鉴别模型训练方法、装置及可读存储介质 | |
CN112418292B (zh) | 一种图像质量评价的方法、装置、计算机设备及存储介质 | |
CN111125519B (zh) | 用户行为预测方法、装置、电子设备以及存储介质 | |
CN110705719A (zh) | 执行自动机器学习的方法和装置 | |
CN114494815B (zh) | 神经网络训练方法、目标检测方法、装置、设备和介质 | |
CN115114439B (zh) | 多任务模型推理、多任务信息处理的方法和装置 | |
CN111369299A (zh) | 识别的方法、装置、设备及计算机可读存储介质 | |
CN111178507A (zh) | 图谱卷积神经网络数据处理方法及装置 | |
CN114492831A (zh) | 联邦学习模型的生成方法及其装置 | |
CN116485475A (zh) | 基于边缘计算的物联网广告系统、方法及装置 | |
CN110658905A (zh) | 设备运行状态的预警方法、预警系统及预警装置 | |
CN114742316A (zh) | 超速预测方法、装置、存储介质及电子装置 | |
CN115221396A (zh) | 基于人工智能的信息推荐方法、装置及电子设备 | |
CN112634158A (zh) | 人脸图像恢复方法、装置、计算机设备及存储介质 | |
CN114549728A (zh) | 图像处理模型的训练方法、图像处理方法、装置及介质 | |
CN111652282B (zh) | 基于大数据的用户偏好分析方法、装置及电子设备 | |
CN111199454B (zh) | 实时用户转化评估方法、装置及电子设备 | |
CN116862580A (zh) | 短信触达时间预测方法、装置、计算机设备及存储介质 | |
CN116681614A (zh) | 基于增强图像清晰度的视频处理方法和装置、电子设备 | |
CN114241411B (zh) | 基于目标检测的计数模型处理方法、装置及计算机设备 | |
CN113240323B (zh) | 基于机器学习的水平评测方法、装置及相关设备 | |
CN114841267A (zh) | 实时预测方法、装置、电子设备及计算机程序产品 | |
CN113095722A (zh) | Atm取缔确定方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |