CN111242364A - 基于神经网络的车辆故障和舒适度预测方法、装置、终端及介质 - Google Patents

基于神经网络的车辆故障和舒适度预测方法、装置、终端及介质 Download PDF

Info

Publication number
CN111242364A
CN111242364A CN202010016114.0A CN202010016114A CN111242364A CN 111242364 A CN111242364 A CN 111242364A CN 202010016114 A CN202010016114 A CN 202010016114A CN 111242364 A CN111242364 A CN 111242364A
Authority
CN
China
Prior art keywords
vehicle
comfort
data
prediction
fault
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010016114.0A
Other languages
English (en)
Inventor
杨磊
黄茗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Junzheng Network Technology Co Ltd
Original Assignee
Shanghai Junzheng Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Junzheng Network Technology Co Ltd filed Critical Shanghai Junzheng Network Technology Co Ltd
Priority to CN202010016114.0A priority Critical patent/CN111242364A/zh
Publication of CN111242364A publication Critical patent/CN111242364A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/20Administration of product repair or maintenance

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了基于神经网络的车辆故障和舒适度预测方法、装置、终端及介质,其包括:基于样本车辆的原始数据,获取关联于车辆故障和舒适度的多个特征数据;对特征数据进行特征处理后生成对应的数值特征数据;将数值特征数据按照预设比例划分为训练集和测试集,以分别用于训练和测试一神经网络模型;其中,所述神经网络模型包括一特征提取模块和两个预测训练模块;特征提取模块用于提取故障特征和舒适度特征;两个预测训练模块分别用于分别输出故障预测结果和舒适度预测结果。本发明将深度学习方法引入到共享车辆实际业务中,大大降低了试错成本和运营成本,有效提高共享车辆整体质量和售后服务。

Description

基于神经网络的车辆故障和舒适度预测方法、装置、终端及 介质
技术领域
本发明涉及车辆技术领域,尤其涉及基于神经网络的车辆故障和舒适度预测方法、装置、终端及介质。
背景技术
随着互联网技术的发展,在全国各个大、中型城市兴起的共享单车几乎随处可见。但随着共享单车的投放增长和单车业务的日趋成熟,与崭新的共享单车相比,早期投放的共享单车难免有或轻或重的受损。例如海边气候造成金属腐蚀、遭到破坏者的蓄意破坏等诸多因素,共享单车的车座、车把、车链条受损现象屡见不鲜,单车舒适度受到严重影响。
若采用全面大量维修骑行不舒适单车的方案,将不可避免地耗时耗力,维修成本过高,而若只维修故障严重的单车,又会使得车辆质量持续下降。这种现象使得售后人员面临降低维修成本、运营成本与提高单车质量保证单车舒适度的双重矛盾。
因此,究竟应该在单车处于何种健康程度时着手维修,又该如何定义健康程度,究竟怎样质量的单车需要维修,又该给维修人员制定怎样的目标,这些都是本领域亟需解决的难题。
现有的判断单车是否有故障的常用方法是对用户报障进行算法筛选,保留用户报障中确有故障的车辆,派单给维修人员维修,并结合运维人员扫街检查单车故障。但是,这种报障方法的报障精度低,误报率高,无法判断单车的具体故障,而且仍需耗费大量的人力。
现有的判断单车舒适度的常用方法是采用用户订单进行分析,检索出短时间内多次短时换骑车,则认为该车辆为故障车辆,并派单给维修人员。这种分析方法的预测准确率虽高,但只能在故障发生一段时间后才能得到分析结果并通知维修人员,问题的发现和解决都缺乏实时性,较为滞后。
因此,现有的单车故障判断方法和单车舒适度判断方法,都有较多不足之处,运维人员工作量大,问题车暴露滞后等超高成本和运营限制等缺陷。因此,本领域亟需一种能实现及时准确预测车辆硬件故障以及舒适与否,并协助运维维修人员定位故障车的解决方案。
发明内容
有鉴于现有技术的上述缺陷,本发明所要解决的技术问题是现有的车辆故障判断方法和车辆舒适度判断方法,都有较多不足之处,运维人员工作量大,问题车暴露滞后等超高成本和运营限制等缺陷。
为实现上述目的,本发明的第一方面提供了一种基于神经网络的车辆故障和舒适度预测方法,其包括:基于样本车辆的原始数据,获取关联于车辆故障和舒适度的多个特征数据;对所述特征数据进行特征处理后生成对应的数值特征数据;将所述数值特征数据按照预设比例划分为训练集和测试集,以分别训练和测试一用于预测车辆故障和舒适度的神经网络模型;其中,所述神经网络模型包括一特征提取模块和两个预测训练模块;特征提取模块供故障预测任务和舒适度预测任务共享使用,用于提取故障特征和舒适度特征;两个预测训练模块分别供故障预测任务和舒适度预测任务独占使用,用于分别输出故障预测结果和舒适度预测结果。
在本发明第一方面的较佳实施方式中,所述关联于车辆故障和舒适度的多个特征数据包括如下特征数据中的任意一种或多种的组合:车辆在预设时段内的订单数量特征数据、车辆总投放时长特征数据、车辆骑行总里程特征数据、车辆在预设时段内的开锁失败错误码特征数据、车辆在预设时段内的订单平均骑行时长特征数据、预设时段内周围用户活跃等级特征数据、天气特征数据、车辆在预设时段内基于定位信息的Geohash网格中平均每小时车辆的数量特征数据、距离最近一次车辆维修的时间特征数据。
在本发明第一方面的另一较佳实施方式中,所述方法包括:对所述样本车辆进行标签标记;其中,所述样本车辆所标记的标签包括故障标签和舒适度标签;所述故障标签用于标记样本车辆是否故障,所述舒适度标签用于标记样本车辆是否舒适。
在本发明第一方面的另一较佳实施方式中,对所故障标签的标记方式包括:对在预设时段内有维修标记的样本车辆标记为故障;对在所述预设时段内没有维修标记且有报障的样本车辆标记为故障;对在所述预设时段内没有维修标记且无报障的样本车辆标记为未故障。
在本发明第一方面的另一较佳实施方式中,对所舒适度标签的标记方式包括:根据短时换车订单对样本车辆的舒适度进行判断结果,并基于判断的结果对该样本车辆进行舒适度标签的标记。
在本发明第一方面的另一较佳实施方式中,所述对所述特征数据进行特征处理后生成对应的数值特征数据,其包括:对所述特征数据中的类别特征数据进行独热编码处理和特征嵌入处理后生成对应的数值特征数据;对所述特征数据中的数值特征数据不作处理。
在本发明第一方面的另一较佳实施方式中,所述特征提取模块包括LSTM神经网络和/或GRU神经网络。
在本发明第一方面的另一较佳实施方式中,所述预测训练模块包括:XGB模块,以提取出的特征数据为输入,并输出对应的第一分类结果;将其中得分大于预设分值的分类结果归为第一类别特征,其余归为第二类别特征;LGB模块,以提取出的特征数据和所述第二类别特征为输入,并输出对应的第二分类结果;Bagging模块,以XGB模块输出的第一分类结果和LGB模块输出的第二分类结果为输入,并为第一分类结果和第二分类结果赋予预设权重后进行加权计算,以得到最终分类结果。
为实现上述目的,本发明的第二方面提供一种基于神经网络的车辆故障和舒适度预测装置,其包括:数据获取模块,用于基于样本车辆的原始数据,获取关联于车辆故障和舒适度的多个特征数据;特征处理模块,用于对特征数据进行特征处理后生成对应的数值特征数据;网络模型模块,用于将所述数值特征数据按照预设比例划分为训练集和测试集,以分别训练和测试一用于预测车辆故障和舒适度的神经网络模型;其中,所述神经网络模型包括一特征提取模块和两个预测训练模块;特征提取模块供故障预测任务和舒适度预测任务共享使用,用于提取故障特征和舒适度特征;两个预测训练模块分别供故障预测任务和舒适度预测任务独占使用,用于分别输出故障预测结果和舒适度预测结果。
为实现上述目的,本发明的第三方面提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现本发明第一方面中所述基于神经网络的车辆故障和舒适度预测方法。
为实现上述目的,本发明的第四方面提供一种电子终端,其包括:处理器及存储器;所述存储器用于存储计算机程序,所述处理器用于执行所述存储器存储的计算机程序,以使所述终端执行本发明第一方面中所述基于神经网络的车辆故障和舒适度预测方法。
本发明提供的方法、装置、终端、系统、及存储介质,具有以下技术效果:本发明将深度学习方法引入到共享车辆实际业务中,在预测过程中充分考虑了适用于车辆质量和舒适度的多个影响因素,大大降低了试错成本和运营成本,有效提高共享车辆整体质量和售后服务。
以下将结合附图对本发明的构思、具体结构及产生的技术效果作进一步说明,以充分地了解本发明的目的、特征和效果。
附图说明
图1是本发明的一实施例中的车辆故障和舒适度预测方法的流程示意图。
图2是本发明的一实施例中的车辆故障和舒适度预测的整体架构示意图。
图3A是本发明的一实施例中的LSTM网络模型的结构示意图。
图3B是本发明的一实施例中的LSTM网络模型的结构示意图。
图4是本发明的一实施例中的预测训练模块的结构示意图。
图5是本发明的一实施例中的车辆故障和舒适度预测装置的结构示意图。
图6是本发明的一实施例中的电子终端的结构示意图。
具体实施方式
以下参考说明书附图介绍本发明的多个优选实施例,使其技术内容更加清楚和便于理解。本发明可以通过许多不同形式的实施例来得以体现,本发明的保护范围并非仅限于文中提到的实施例。
在附图中,结构相同的部件以相同数字标号表示,各处结构或功能相似的组件以相似数字标号表示。附图所示的每一组件的尺寸和厚度是任意示出的,本发明并没有限定每个组件的尺寸和厚度。为了使图示更清晰,附图中有些地方适当夸大了部件的厚度。
需要说明的是,在下述描述中,参考附图,附图描述了本申请的若干实施例。另外,如同在本文中所使用的,单数形式“一”、“一个”和“该”旨在也包括复数形式,除非上下文中有相反的指示。应当进一步理解,术语“包含”、“包括”表明存在所述的特征、操作、元件、组件、项目、种类、和/或组,但不排除一个或多个其他特征、操作、元件、组件、项目、种类、和/或组的存在、出现或添加。此处使用的术语“或”和“和/或”被解释为包括性的,或意味着任一个或任何组合。因此,“A、B或C”或者“A、B和/或C”意味着“以下任一个:A;B;C;A和B;A和C;B和C;A、B和C”。仅当元件、功能或操作的组合在某些方式下内在地互相排斥时,才会出现该定义的例外。
在车辆技术领域,应在车辆处于何种健康程度时着手维修,如何定义健康程度,又该给运维维修人员制定怎样的目标,这些都是本技术领域尚未解决的技术问题。
在现有技术中,已有方法来判断车辆是否有故障以及车辆舒适与否。在判断车辆是否有故障方面,常用的方法是对用户报障进行算法筛选,保留用户报障中确有故障的车辆,派单给维修人员进行维修,并结合运维人员扫街检查车辆故障。在判断车辆舒适度方面,常用的方法是采用用户订单进行分析,检索出短时间内多次短时换骑的车辆订单,即短时间内结束一辆可能有故障的车辆订单并且开启下一个车辆订单,例如一车辆在一段时间内被多位用户三分钟内结束使用,则可确认该车辆是故障车辆,因此派单给维修人员进行维修。
然,无论是上述用于判断车辆是否有故障的方法,还是用于判断车辆舒适与否的方法,都尚存明显的不足之处。
在用于判断车辆是否有故障的方法中,受到用户报障格式不规范的影响,报障精度低,误报率高,基本无法判断车辆具体故障类型。而经筛选后能准确预测车辆故障后所保留的准确报障数量太少,在实际应用时还需结合运维维修人员扫街搜索故障车辆,当街检查车辆质量,人工利用先验知识进行判断,耗时耗力。
进一步的,人工利用先验知识进行判断会导致很多问题,例如:若依赖于相关工作人员自身的业务能力来进行判断,那么该人员的个人知识和认知度等主观因素将直接决定了收益;人工判断难以捕捉特征与特征之间、特征与收益之间深层次之间的关联关系。
在用于判断车辆舒适与否的方法中,虽有较高的预测准确率,但基于订单的判断方法需在订单发生后经算法计算后方能得到预测结果,这就导致问题的发现和解决都缺乏实时性,严重滞后。
有鉴于此,本发明提供基于神经网络的车辆故障和舒适度预测方法、装置、终端及介质,旨在将深度学习方法引入共享车辆的实际业务中,充分考虑了适用于车辆硬件质量的多种因素,降低试错和运营成本,大大提高共享车辆的整体质量和售后服务。
为了使本发明的目的、技术方案及优点更加清楚明白,通过下述实施例并结合相应的附图,对本发明实施例中的技术方案的进一步详细说明。应理解的是,此处所描述的具体实施例仅用以解释本发明,并不用于限定发明。
实施例一
如图1所示,展示了本发明一实施例中的基于神经网络的车辆故障和舒适度预测方法的流程示意图。本实施例中基于神经网络的车辆故障和舒适度预测方法主要包括步骤S11~S13。
为便于本领域技术人员更好地理解本实施例的整体架构,现结合图2来进行详细的解释与说明。该架构图自下而上可分为三大模块:特征处理模块21、特征提取部分模块22以及预测训练模块23。
特征处理模块21用于对所述特征数据进行特征处理后生成数值特征数据,具体是对输入的类别特征数据分别进行独热编码(One-Hot)处理和特征嵌入(Embedding)处理后得到对应的数值特征数据,而对输入的数值特征数据则不作处理即可使用。
特征提取部分模块22包括一个共享层LSTM,输入特征处理后的数值特征数据。该共享层供故障预测任务和舒适度预测任务共享使用,用于提取故障特征和舒适度特征。
预测训练模块23包括两个独占层,分别供故障预测任务和舒适度预测任务单独使用,用于做预测训练,从而分别输出是否故障的预测以及是否舒适的预测。
以上,对特征处理模块21、特征提取部分模块22以及预测训练模块23的基本功能做了简单的描述;以下,将结合所述基于神经网络的车辆故障和舒适度预测方法的各流程步骤对上述这些模块做进一步的说明。
步骤S11:基于样本车辆的原始数据,获取关联于车辆故障和舒适度的多个特征数据。
在本实施例较佳的实现方式中,选取目标区域内的非失联车辆作为样本车辆,选取这些样本车辆的使用数据(例如可从共享车辆的工单记录中获取使用数据)作为所述原始数据。举例来说,可选取A城市作为目标区域,将A城市所有20万辆共享车辆中的所有非失联车辆在过去30天内的使用数据,以天为时间单位,计算出关联于车辆故障和舒适度的特征数据。
在本实施例较佳的实现方式中,所述关联于车辆故障和舒适度的特征数据包括但不限于:车辆在预设时段内的订单数量特征数据、车辆总投放时长特征数据、车辆骑行总里程特征数据、车辆在预设时段内的开锁失败错误码特征数据、车辆在预设时段内的订单平均骑行时长特征数据、预设时段内周围用户活跃等级特征数据、天气特征数据(如天气晴朗状况或者天气温湿度等)、车辆在预设时段内基于定位信息的Geohash网格中平均每小时车辆的数量特征数据以及距离最近一次车辆维修的时间特征数据;其中,Geohash网格是一种对经纬度地址的编码,用于唯一标识该地址在地图上的物理位置。
需说明的是,各特征数据中选取的预设时段可按照实际应用场景设定和调整,例如可选择一天、一周或一月等来作为该预设时段。以一天作为预设时段为例,选取的预设时段内的车辆使用数据包括:车辆在一天内的订单数量特征数据、车辆在一天内的开锁失败错误码特征数据、车辆在一天内的订单平均骑行时长特征数据以及车辆在一天内基于定位信息的geohash网格中平均每小时车辆的数量特征数据等等,本实施例不作限定。
另外应理解的是,本发明中所述的车辆包括但不限于车辆、助力车或者电动车等等,本实施例不作限定。
在本实施例较佳的实现方式中,所述方法还包括对样本车辆进行标签标记;其中,所述样本车辆所标记的标签包括故障标签和舒适度标签;所述故障标签用于标记样本车辆是否,所述舒适度标签用于标记样本车辆是否舒适。
所述故障标签的打标方式包括:对在预设时段内有维修标记的样本车辆标记为故障;对在所述预设时段内没有维修标记且有报障的样本车辆标记为故障;对在所述预设时段内没有维修标记且无报障的样本车辆标记为未故障。
举例来说,对当天有维修标记的共享车辆记为1;对当天没有维修标记的共享车辆需进行再分类,经用户报障为故障类型的样本车辆标记为1,未经用户报障的样本车辆标记为0。
所述舒适度标签的打标方式包括:根据短时换车订单对样本车辆的舒适度判断结果,对该样本车辆进行舒适度标签的标记。
举例来说,基于短时换骑和短时订单判断为不舒适的样本车辆标记为1,基于短时换骑和短时订单判断为舒适的样本车辆标记为0,以此形成模型训练的原始数据标签。
需说明的是,本实施例的训练集是带有标签的数据集,本发明并不需要人工进行数据打标,而是借鉴了现有方法,一种是基于统计的方法采用用户订单进行分析,检索出短时间内多次短时换骑车;另一种是对用户报障进行算法筛选,保留用户报障中确有故障的车辆,由此实现了高效且低成本的打标。
步骤S12:对所述特征数据进行特征处理后生成对应的数值特征数据。
具体来说,特征数据具体可分为数值特征数据和类别特征数据,数值特征数据无需进行特征处理即可直接使用,类别特征数据需转换为对应的数值特征数据后方可使用。
其中,所述数值特征数据例如是车辆在一天内的订单数量特征数据或者车辆在一天内的订单平均骑行时长特征数据等等;所述类别特征数据例是天气特征数据或者车辆在一天内的开锁失败错误码特征数据等等。
进一步的,将类别特征数据转换成数值特征数据的特征处理步骤包括:
首先,对类别特征数据进行独热编码(One-Hot)处理,即使用N位状态寄存器对N个状态进行编码,每个状态都有它独立的寄存器位,并且在任意时候其中只有一位有效。
其次,对独热编码(One-Hot)处理后的数据再进行特征嵌入(Embedding)处理,用于将过于稀疏,过度占用资源的特征转换为固定尺寸的稠密向量。在对类别特征数据进行独热编码(One-Hot)处理和特征嵌入(Embedding)处理后可作为数值特征使用。
步骤S13:将所述数值特征数据按照预设比例划分为训练集和测试集,以分别训练和测试一用于预测车辆故障和舒适度的神经网络模型;其中,所述神经网络模型包括一特征提取模块和两个预测训练模块;特征提取模块供故障预测任务和舒适度预测任务共享使用,用于提取故障特征和舒适度特征;两个预测训练模块分别供故障预测任务和舒适度预测任务独占使用,用于分别输出故障预测结果和舒适度预测结果。
在本实施例较佳的实现方式中,利用网格搜索算法和交叉验证法来获得规定范围内最优的参数组合,以利于模型的训练和验证。网格搜索算法是指定参数值的一种调优方法,在参数列表中进行穷举搜索,对每种情况进行训练,找到最优的参数。交叉验证法是将原始数据(datashet)进行分组,一部分作为训练集来对分类器进行训练,另一部分作为验证集来测试训练得到的模型,以此来作为评价分类器的性能指标。
在本实施例较佳的实现方式中,将样本车辆在一段时间内(例如1个月)的样本数据按照时间线7∶3进行划分,以将样本数据分为训练集和测试集。应理解的是,上述这种划分方式仅作参考而非限定。
在本实施例较佳的实现方式中,所述特征提取模块包括LSTM神经网络和/或GRU神经网络。LSTM(Long Short-Term Memory)神经网络是长短时记忆网络,是RNN神经网络的一种变形,即在RNN神经网络的基础上在隐藏层中的各神经单元中增加记忆单元,从而使时间序列上的记忆信息可控。GRU(Gated Recurrent Unit)神经网络是LSTM神经网络的变种,它只有两个门函数,更新门和重置门。
通常而言,LSTM神经网络的结构如图3A所示,包括输入层、若干隐藏层和输出层。LSTM神经网络具有“记忆性”的原因在于不同“时间点”之间的网络存在连接,而不是单个时间点处的网络存在前馈或者反馈,也即如图3A所示的各隐藏层之间有虚线箭头进行连接,其中的虚线箭头代表按照时间步序列进行神经单元之间的跳转连接。
进一步的,如图3B所展示的LSTM神经网络的结构示意图,网络的隐藏层包括遗忘门31、输入门32以及输出门33。LSTM神经网络每次在隐藏层各单元间传递时通过输入门32、遗忘门31和输出门33来控制输入值、记忆值和输出值,从而使RNN网络具备了长期记忆功能。
为便于本领域技术人员理解,下文以三层LSTM神经网络为例来进行相应的解释与说明。
第一层LSTM接收输入数据的整体数据维度为(N,24,8),其中N代表每次输入网络训练的特征条数,24代表时间步长(timestep),8为特征维度(data_dim)。
需说明的是,时间步长(timesteps)和特征维度(data_dim)是用于衡量输入数据的数据量及其所包含的历史信息长短的指标。数据量太大会导致计算复杂,神经网络的训练速度较慢;数据量太小又容易导致数据包含的历史信息太短,难以反映出周期规律。本实施例中优选时间步长(timesteps)为24,每一小时为时间节点,特征维度(data_dim)为8,以快速训练神经网络,但应理解本实施例中的参数仅为优选而不是对本发明的限制。
第二层LSTM以数值特征数据和第一层LSTM的输出数据作为其输入数据。
第三层LSTM以数值特征数据、第一层LSTM的输出数据以及第二层LSTM的输出数据作为其输入数据,与传统模型仅以上一层LSTM的输出数据作为当前层LSTM的输入数据所不同的是,本实施例的模型不仅仅是上一层LSTM的输出数据,还将上上层LSTM的输出数据以及原始数据都作为当前层的输入数据,以更好地进行特征提取。
优选的,LSTM神经网络采用损失函数来度量模型输出的预测值与实际值之间的差距。损失函数包括分类损失函数和回归损失函数;分类损失函数例如是对数损失函数(logloss)、focal loss损失函数、相对熵损失函数、Hinge损失函数等;回归损失函数例如是Mean Square Error损失函数、Mean Absolute Error损失函数、Log cosh损失函数等,本实施例不作限定。
在本实施例较佳的实现方式中,预测训练模块包括XGB模块、LGB模块和Bagging模块。其中,XGB模块是在GBDT的基础上对提升算法(Boosting算法)进行的改进,采用回归树作为内部决策树。提升算法(Boosting算法)是一种可用来减小监督式学习中偏差的机器学习算法。LGB模块(Lightgbm)是一个快速的,分布式的,高性能的基于决策树算法的梯度提升框架。Bagging模块用于对输入数据进行Bagging算法计算,Bagging算法可通过结合几个模型降低泛化误差,通过降低结果的方法来避免拟合的发生。
XGB模块、LGB模块和Bagging模块之间的协作流程如图4所示,预测训练模块的训练步骤如下:
步骤1)XGB模块以提取出的特征数据为输入,并输出对应的第一分类结果;将其中得分大于预设分值的分类结果归为第一类别特征,其余归为第二类别特征。
具体的,原始特征(特征1、特征2、特征3、特征4……特征n)输入XGB模块,产生对应的分类结果,并将这些分类结果中分数大于0.5的作为一个类别,小于或等于0.5的作为新类别特征(记为“特征n+1”)。
步骤2)LGB模块以提取出的特征数据和所述第二类别特征为输入,并输出对应的第二分类结果。
具体的,原始特征(特征1、特征2、特征3、特征4……特征n)以及由XGB模块输出的新类别特征(特征n+1)输入LGB模块训练得到一个新的分类结果。
步骤3)Bagging模块以XGB模块输出的第一分类结果和LGB模块输出的第二分类结果为输入,并为第一分类结果和第二分类结果赋予预设权重后进行加权计算,以得到最终分类结果。
具体的,将XGB模块和LGB模块的输出作为Bagging模块的输入做bagging处理,处理的方式为:对XGB模块的输出数据和LGB模块的输出数据分别赋予预设权重后进行加权计算,从而得到最终分类结果。举例来说,对XGB模块的输出数据和LGB模块的输出数据分别赋予0.5的权重,那么Bagging计算方式为(0.5*XGB+0.5*LGB),据此算出最终分类结果。
进一步的,分类结果的判断是根据计算所得的分类结果分数与预设阈值的比较结果来进行故障预测和舒适度预测。例如关于故障预测,若故障预测的分类结果分数大于预设分数阈值(如0.5),则代表当前车辆需要维修;若故障预测的分类结果分数小于或等于预设分数阈值,则代表当前车辆不需要维修。再例如关于舒适度预测,过舒适度预测的分类结果分数大于预设分数阈值(例如也为0.5),则代表当前车辆骑行舒适;若舒适度预测的分类结果分数小于或等于预设分数阈值,则代表当前车辆骑行不舒服。
需说明的是,本实施例中用于故障预测的预设分数阈值和用于舒适度预测的预设分数阈值可依实际场景而定,且两者可相同也可不同,本实施例不作限定。
由上述内容可知,本实施例所提供的基于神经网络的车辆故障和舒适度预测方法,将深度学习方法引入到共享车辆实际业务中,在预测过程中充分考虑了适用于车辆质量和舒适度的多个影响因素,大大降低了试错成本和运营成本,有效提高共享车辆整体质量和售后服务。
实施例二
如图5所示,展示了本发明一实施例中基于神经网络的车辆故障和舒适度预测装置的结构示意图。本实施例的车辆故障和舒适度预测装置包括数据获取模块51、特征处理模块52以及网络模型模块53。
数据获取模块51用于基于样本车辆的原始数据,获取关联于车辆故障和舒适度的多个特征数据;特征处理模块52用于对特征数据进行特征处理后生成对应的数值特征数据;网络模型模块53用于将所述数值特征数据按照预设比例划分为训练集和测试集,以分别训练和测试一用于预测车辆故障和舒适度的神经网络模型;其中,所述神经网络模型包括一特征提取模块和两个预测训练模块;特征提取模块供故障预测任务和舒适度预测任务共享使用,用于提取故障特征和舒适度特征;两个预测训练模块分别供故障预测任务和舒适度预测任务独占使用,用于分别输出故障预测结果和舒适度预测结果。
需说明的是,本实施例中基于神经网络的车辆故障和舒适度预测装置的实施方式,与上文实施例一种基于神经网络的车辆故障和舒适度预测方法的实施方式类似,故不再赘述。
应理解的是,以上装置的各个模块的划分仅仅是一种逻辑功能的划分,实际实现时可以全部或部分集成到一个物理实体上,也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现;也可以全部以硬件的形式实现;还可以部分模块通过处理元件调用软件的形式实现,部分模块通过硬件的形式实现。例如,网络模型模块模块可以为单独设立的处理元件,也可以集成在上述装置的某一个芯片中实现,此外,也可以以程序代码的形式存储于上述装置的存储器中,由上述装置的某一个处理元件调用并执行以上网络模型模块的功能。其它模块的实现与之类似。此外这些模块全部或部分可以集成在一起,也可以独立实现。这里所述的处理元件可以是一种集成电路,具有信号的处理能力。在实现过程中,上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。
例如,以上这些模块可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(Application Specific Integrated Circuit,简称ASIC),或,一个或多个微处理器(digital signal processor,简称DSP),或,一个或者多个现场可编程门阵列(Field Programmable Gate Array,简称FPGA)等。再如,当以上某个模块通过处理元件调度程序代码的形式实现时,该处理元件可以是通用处理器,例如中央处理器(Central Processing Unit,简称CPU)或其它可以调用程序代码的处理器。再如,这些模块可以集成在一起,以片上系统(system-on-a-chip,简称SOC)的形式实现。
实施例三
如图6所示,展示了本发明一实施例中的电子终端的结构示意图。本实施例的电子终端包括:处理器61、存储器62、通信器63;存储器62通过系统总线与处理器61和通信器63连接并完成相互间的通信,存储器62用于存储计算机程序,通信器63用于和其他设备进行通信,处理器61用于运行计算机程序,使电子终端执行如上基于神经网络的车辆故障和舒适度预测方法的各个步骤。
上述提到的系统总线可以是外设部件互连标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该系统总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。通信接口用于实现数据库访问装置与其他设备(例如客户端、读写库和只读库)之间的通信。存储器可能包含随机存取存储器(Random Access Memory,简称RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
实施例四
本实施例提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述基于神经网络的车辆故障和舒适度预测方法。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过计算机程序相关的硬件来完成。前述的计算机程序可以存储于一计算机可读存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
综上所述,本申请提供基于神经网络的车辆故障和舒适度预测方法、装置、终端及介质,本发明将深度学习方法引入到共享车辆实际业务中,在预测过程中充分考虑了适用于车辆质量和舒适度的多个影响因素,大大降低了试错成本和运营成本,有效提高共享车辆整体质量和售后服务。所以,本申请有效克服了现有技术中的种种缺点而具高度产业利用价值。
以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。

Claims (13)

1.一种基于神经网络的车辆故障和舒适度预测方法,其特征在于,包括:
基于样本车辆的原始数据,获取关联于车辆故障和舒适度的多个特征数据;
对所述特征数据进行特征处理后生成对应的数值特征数据;
将所述数值特征数据按照预设比例划分为训练集和测试集,以分别训练和测试一用于预测车辆故障和舒适度的神经网络模型;
其中,所述神经网络模型包括一特征提取模块和两个预测训练模块;所述特征提取模块供故障预测任务和舒适度预测任务共享使用,用于提取故障特征和舒适度特征;所述两个预测训练模块分别供故障预测任务和舒适度预测任务独占使用,用于分别输出故障预测结果和舒适度预测结果。
2.如权利要求1所述的方法,其特征在于,所述关联于车辆故障和舒适度的多个特征数据包括如下特征数据中的任意一种或多种的组合:
车辆在预设时段内的订单数量特征数据、车辆总投放时长特征数据、车辆骑行总里程特征数据、车辆在预设时段内的开锁失败错误码特征数据、车辆在预设时段内的订单平均骑行时长特征数据、预设时段内周围用户活跃等级特征数据、天气特征数据、车辆在预设时段内基于定位信息的Geohash网格中平均每小时车辆的数量特征数据、距离最近一次车辆维修的时间特征数据。
3.如权利要求1所述的方法,其特征在于,包括:
对所述样本车辆进行标签标记;
其中,所述样本车辆所标记的标签包括故障标签和舒适度标签;所述故障标签用于标记样本车辆是否故障,所述舒适度标签用于标记样本车辆是否舒适。
4.如权利要求3所述的方法,其特征在于,对所故障标签的标记方式包括:
对在预设时段内有维修标记的样本车辆标记为故障;
对在所述预设时段内没有维修标记且有报障的样本车辆标记为故障;
对在所述预设时段内没有维修标记且无报障的样本车辆标记为未故障。
5.如权利要求3所述的方法,其特征在于,对所舒适度标签的标记方式包括:
根据短时换车订单对样本车辆的舒适度进行判断,并基于判断的结果对该样本车辆进行舒适度标签的标记。
6.如权利要求1所述的方法,其特征在于,所述对所述特征数据进行特征处理后生成对应的数值特征数据,包括:
对所述特征数据中的类别特征数据进行独热编码处理和特征嵌入处理后生成对应的数值特征数据;
对所述特征数据中的数值特征数据不作处理。
7.如权利要求1所述的方法,其特征在于,所述特征提取模块包括LSTM神经网络和/或GRU神经网络。
8.如权利要求1所述的方法,其特征在于,所述预测训练模块包括:
XGB模块,以提取出的特征数据为输入,并输出对应的第一分类结果;将其中得分大于预设分值的分类结果归为第一类别特征,其余归为第二类别特征;
LGB模块,以提取出的特征数据和所述第二类别特征为输入,并输出对应的第二分类结果;
Bagging模块,以XGB模块输出的第一分类结果和LGB模块输出的第二分类结果为输入,并为第一分类结果和第二分类结果赋予预设权重后进行加权计算,以得到最终分类结果。
9.一种基于神经网络的车辆故障和舒适度预测装置,其特征在于,包括:
数据获取模块,用于基于样本车辆的原始数据,获取关联于车辆故障和舒适度的多个特征数据;
特征处理模块,用于对所述特征数据进行特征处理后生成对应的数值特征数据;
网络模型模块,用于将所述数值特征数据按照预设比例划分为训练集和测试集,以分别训练和测试一用于预测车辆故障和舒适度的神经网络模型;其中,所述神经网络模型包括一特征提取模块和两个预测训练模块;特征提取模块供故障预测任务和舒适度预测任务共享使用,用于提取故障特征和舒适度特征;两个预测训练模块分别供故障预测任务和舒适度预测任务独占使用,用于分别输出故障预测结果和舒适度预测结果。
10.如权利要求9所述的装置,其特征在于,所述特征提取模块包括LSTM神经网络和/或GRU神经网络。
11.如权利要求9所述的装置,其特征在于,所述预测训练模块包括:
XGB模块,以提取出的特征数据为输入,并输出对应的第一分类结果;将其中得分大于预设分值的分类结果归为第一类别特征,其余归为第二类别特征;
LGB模块,以提取出的特征数据和所述第二类别特征为输入,并输出对应的第二分类结果;
Bagging模块,以XGB模块输出的第一分类结果和LGB模块输出的第二分类结果为输入,并为第一分类结果和第二分类结果赋予预设权重后进行加权计算,以得到最终分类结果。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-8中任一项所述基于神经网络的车辆故障和舒适度预测方法。
13.一种电子终端,其特征在于,包括:处理器及存储器;
所述存储器用于存储计算机程序;
所述处理器用于执行所述存储器存储的计算机程序,以使所述终端执行如权利要求1-8中任一项所述基于神经网络的车辆故障和舒适度预测方法。
CN202010016114.0A 2020-01-07 2020-01-07 基于神经网络的车辆故障和舒适度预测方法、装置、终端及介质 Pending CN111242364A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010016114.0A CN111242364A (zh) 2020-01-07 2020-01-07 基于神经网络的车辆故障和舒适度预测方法、装置、终端及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010016114.0A CN111242364A (zh) 2020-01-07 2020-01-07 基于神经网络的车辆故障和舒适度预测方法、装置、终端及介质

Publications (1)

Publication Number Publication Date
CN111242364A true CN111242364A (zh) 2020-06-05

Family

ID=70866210

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010016114.0A Pending CN111242364A (zh) 2020-01-07 2020-01-07 基于神经网络的车辆故障和舒适度预测方法、装置、终端及介质

Country Status (1)

Country Link
CN (1) CN111242364A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111695680A (zh) * 2020-06-15 2020-09-22 北京百度网讯科技有限公司 成绩预测方法、成绩预测模型训练方法、装置及电子设备
CN111881980A (zh) * 2020-07-29 2020-11-03 上海钧正网络科技有限公司 一种车辆故障检测方法、装置、计算机设备和存储介质
CN112529104A (zh) * 2020-12-23 2021-03-19 东软睿驰汽车技术(沈阳)有限公司 一种车辆故障预测模型生成方法、故障预测方法及装置
CN113610354A (zh) * 2021-07-15 2021-11-05 北京淇瑀信息科技有限公司 第三方平台用户的策略分配方法、装置及电子设备
CN113823040A (zh) * 2020-06-19 2021-12-21 中国移动通信集团福建有限公司 共享单车的管理方法及系统
CN113886712A (zh) * 2021-11-04 2022-01-04 杭州以诺行汽车科技股份有限公司 基于erp的人工智能汽车维修推荐方法、系统和存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102507221A (zh) * 2011-10-12 2012-06-20 北京交通大学 列车车体舒适度的预测方法
CN109872014A (zh) * 2019-03-29 2019-06-11 永安行科技股份有限公司 氢能源助力自行车日使用量和故障情况的预测方法
CN110070183A (zh) * 2019-03-11 2019-07-30 中国科学院信息工程研究所 一种弱标注数据的神经网络模型训练方法及装置
CN110363306A (zh) * 2018-04-04 2019-10-22 韩巧珍 共享单车故障诊断方法
CN110414716A (zh) * 2019-07-03 2019-11-05 北京科技大学 一种基于LightGBM的企业失信概率预测方法及系统
CN110516818A (zh) * 2019-05-13 2019-11-29 南京江行联加智能科技有限公司 一种基于集成学习技术的高维度数据预测方法
CN110569904A (zh) * 2019-09-10 2019-12-13 福建榕基软件股份有限公司 机器学习模型的构建方法及计算机可读存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102507221A (zh) * 2011-10-12 2012-06-20 北京交通大学 列车车体舒适度的预测方法
CN110363306A (zh) * 2018-04-04 2019-10-22 韩巧珍 共享单车故障诊断方法
CN110070183A (zh) * 2019-03-11 2019-07-30 中国科学院信息工程研究所 一种弱标注数据的神经网络模型训练方法及装置
CN109872014A (zh) * 2019-03-29 2019-06-11 永安行科技股份有限公司 氢能源助力自行车日使用量和故障情况的预测方法
CN110516818A (zh) * 2019-05-13 2019-11-29 南京江行联加智能科技有限公司 一种基于集成学习技术的高维度数据预测方法
CN110414716A (zh) * 2019-07-03 2019-11-05 北京科技大学 一种基于LightGBM的企业失信概率预测方法及系统
CN110569904A (zh) * 2019-09-10 2019-12-13 福建榕基软件股份有限公司 机器学习模型的构建方法及计算机可读存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
时中朝: "基于朴素贝叶斯分类器的公共自行车系统故障诊断方法", 《中国机械工程》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111695680A (zh) * 2020-06-15 2020-09-22 北京百度网讯科技有限公司 成绩预测方法、成绩预测模型训练方法、装置及电子设备
CN111695680B (zh) * 2020-06-15 2023-11-10 北京百度网讯科技有限公司 成绩预测方法、成绩预测模型训练方法、装置及电子设备
CN113823040A (zh) * 2020-06-19 2021-12-21 中国移动通信集团福建有限公司 共享单车的管理方法及系统
CN111881980A (zh) * 2020-07-29 2020-11-03 上海钧正网络科技有限公司 一种车辆故障检测方法、装置、计算机设备和存储介质
CN112529104A (zh) * 2020-12-23 2021-03-19 东软睿驰汽车技术(沈阳)有限公司 一种车辆故障预测模型生成方法、故障预测方法及装置
CN113610354A (zh) * 2021-07-15 2021-11-05 北京淇瑀信息科技有限公司 第三方平台用户的策略分配方法、装置及电子设备
CN113886712A (zh) * 2021-11-04 2022-01-04 杭州以诺行汽车科技股份有限公司 基于erp的人工智能汽车维修推荐方法、系统和存储介质

Similar Documents

Publication Publication Date Title
CN111242364A (zh) 基于神经网络的车辆故障和舒适度预测方法、装置、终端及介质
CN110686633B (zh) 一种滑坡位移预测方法、装置及电子设备
CN111176953B (zh) 一种异常检测及其模型训练方法、计算机设备和存储介质
CN110555477A (zh) 一种市政设施故障预测方法及装置
CN111833594B (zh) 车流量预测方法、装置、电子设备及存储介质
CN110569166A (zh) 异常检测方法、装置、电子设备及介质
CN116843071B (zh) 一种用于智慧港口的运输网络运行指数预测方法及装置
CN114418175A (zh) 一种人员管理方法、装置、电子设备及存储介质
CN112418939A (zh) 基于神经网络挖掘房价时空关联性以预测房价的方法
CN116187552A (zh) 异常检测方法、计算设备及计算机存储介质
CN114881343A (zh) 基于特征选择的电力系统短期负荷预测方法及装置
CN116307641A (zh) 一种面向数字化电厂的资源协同调度管理方法及系统
CN113825165B (zh) 基于时间图网络的5g切片网络拥塞预警方法及装置
CN116541128A (zh) 一种负载调节方法、装置、计算设备、及存储介质
CN116185797A (zh) 预测服务器资源饱和度的方法、装置及存储介质
CN116108976A (zh) 一种超短期风速预测方法
CN116132103A (zh) 一种网络安全态势监测方法、装置、电子设备和存储介质
CN116264575A (zh) 边缘节点调度方法、装置、计算设备及存储介质
CN114116528B (zh) 一种内存访问地址预测方法、装置、存储介质及电子设备
CN114281808A (zh) 一种交通大数据清洗方法、装置、设备及可读存储介质
CN112256735A (zh) 一种用电监测方法、装置、计算机设备和存储介质
CN112395167A (zh) 一种作业故障预测方法、装置及电子设备
CN106888237A (zh) 一种数据调度方法及系统
CN113807556A (zh) 一种旅游指标预测方法、装置、设备及介质
CN117058888B (zh) 一种交通大数据处理方法及其系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200605