CN110738574A - 数据预测方法、装置、设备及存储介质 - Google Patents
数据预测方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN110738574A CN110738574A CN201910847223.4A CN201910847223A CN110738574A CN 110738574 A CN110738574 A CN 110738574A CN 201910847223 A CN201910847223 A CN 201910847223A CN 110738574 A CN110738574 A CN 110738574A
- Authority
- CN
- China
- Prior art keywords
- data
- user
- information
- prediction
- driving
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 230000006399 behavior Effects 0.000 claims description 90
- 230000015654 memory Effects 0.000 claims description 23
- 230000001133 acceleration Effects 0.000 claims description 14
- 238000012545 processing Methods 0.000 claims description 11
- 238000012549 training Methods 0.000 claims description 5
- 230000006835 compression Effects 0.000 claims description 3
- 238000007906 compression Methods 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 3
- 238000013135 deep learning Methods 0.000 abstract description 7
- 238000004891 communication Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000004913 activation Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 230000007787 long-term memory Effects 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000006403 short-term memory Effects 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 238000010191 image analysis Methods 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 230000003542 behavioural effect Effects 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/08—Insurance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Accounting & Taxation (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Data Mining & Analysis (AREA)
- Tourism & Hospitality (AREA)
- Artificial Intelligence (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Technology Law (AREA)
- Game Theory and Decision Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明公开了一种基于深度学习的数据预测方法、装置、设备及存储介质,所述方法包括:获取当前用户的用户身份数据以及用户驾驶行为数据;对所述用户驾驶行为数据进行深度学习,得到所述当前用户的参考预测数据;提取所述待处理驾驶数据中的用户身份数据,根据所述用户身份数据按照预设规则调整所述参考预测数据;根据所述用户驾驶行为数据对所述当前用户进行评分,获得评分结果,根据所述评分结果和调整后的参考预测数据,得到所述当前用户的目标数据,从而提高数据预测的针对性。
Description
技术领域
本发明涉及数据处理领域,尤其涉及一种数据预测方法、装置、设备及存储介质。
背景技术
基于驾驶行为的保险赔付率UBI(Usage Based Insurance),作为大数据时代的新型保险,近年来吸引了业界的广泛兴趣。UBI的理论基础是行为表现较安全的驾驶人员应该获得保费优惠,保费取决于实际时间、地点、具体方式或者这些指标的综合考量。
目前市场上关于UBI计算的研究主要采用计算赔付率信息的公式,但是现有的计算赔付率信息的方法和公式太过单一,从而出现性质差异较大的驾驶行为对应同一种赔付率,导致赔付率的计算缺乏针对性,适用性较差。
发明内容
本发明的主要目的在于提出一种数据预测方法、装置、设备及存储介质,旨在提高数据预测的针对性。
为实现上述目的,本发明提供一种数据预测方法,所述数据预测方法包括以下步骤:
获取当前用户的待处理驾驶数据,其中,所述待处理驾驶数据包括用户身份数据以及用户驾驶行为数据;
提取所述待处理驾驶数据中的用户驾驶行为数据,对所述用户驾驶行为数据采用数据预测模型进行预测,得到所述当前用户的参考预测数据;
提取所述待处理驾驶数据中的用户身份数据,根据所述用户身份数据按照预设规则调整所述参考预测数据;
根据所述用户驾驶行为数据对所述当前用户进行评分,获得评分结果,根据所述评分结果和调整后的参考预测数据,得到所述当前用户的目标数据。
优选地,所述提取所述待处理驾驶数据中的用户驾驶行为数据,对所述用户驾驶行为数据采用数据预测模型进行预测,得到所述当前用户的参考预测数据的步骤,包括:
提取所述待处理驾驶数据中的用户驾驶行为数据,将所述用户驾驶行为数据与预设关键字信息进行比较;
查找所述用户驾驶行为数据中与所述预设关键字信息相关的目标驾驶行为数据,将查找到的目标驾驶行为数据作为参考数据;
将所述参考数据采用数据预测模型进行预测,得到所述当前用户的参考预测数据。
优选地,所述将所述参考数据采用数据预测模型进行预测,得到所述当前用户的参考预测数据的步骤,包括:
根据所述参考数据构建层级网络信息,查找所述层级网络信息之间的各种关键字组合信息;
根据所述关键字的预设等级信息进行组合,将组合后的关键字信息作为当前驾驶特征信息;
将所述当前驾驶特征信息采用数据预测模型进行预测,得到所述当前用户的参考预测数据。
优选地,所述将所述当前驾驶特征信息采用数据预测模型进行预测,得到所述当前用户的参考预测数据之前,所述方法还包括:
获取预设原始长短期记忆网络模型,将所述预设原始长短期记忆网络模型作为参考数据预测模型的初始层;
按照时间序列提取历史驾驶特征信息,根据所述历史驶特征信息对所述预设原始长短期记忆网络模型进行训练,得到参考数据预测模型;
将所述参考数据预测模型中的历史驾驶特征信息进行合并;
获取当前压缩层的数据维度信息,根据所述数据维度信息对合并后的历史驾驶特征信息进行压缩,将压缩历史驾驶特征信息后的参考数据预测模型作为所述数据预测模型。
优选地,所述提取所述待处理驾驶数据中的用户身份数据,根据所述用户身份数据按照预设规则调整所述参考预测数据的步骤,包括:
提取所述待处理驾驶数据中的用户身份数据,查找所述用户身份数据中的用户年龄信息以及历史出险数量信息;
根据所述用户年龄信息以及历史出险数量信息判断所述用户年龄信息以及历史出险数量信息所处的区间信息;
根据所述区间信息在预设关系映射表中查找对应的调整比例信息,根据所述调整比例信息对所述参考预测数据进行调整。
优选地,所述根据所述用户驾驶行为数据对所述当前用户进行评分,获得评分结果,根据所述评分结果和调整后的参考预测数据,得到所述当前用户的目标数据的步骤,包括:
提取所述待处理驾驶数据中的用户驾驶行为数据,其中,所述用户驾驶行包括急刹车数据、急加速数据、急减速数据以及急转弯数据中至少一项;
统计所述急刹车数据、急加速数据、急减速数据以及急转弯数据中对应的数量信息;
获取所述急刹车数据、急加速数据、急减速数据以及急转弯数据对应的权重信息;
根据所述数量信息以及权重信息对所述当前用户进行评分,根据评分结果和调整后的参考预测数据得到所述当前用户的目标数据。
优选地,所述根据所述数量信息以及权重信息对所述当前用户进行评分,根据评分结果和调整后的参考预测数据得到所述当前用户的目标数据的步骤,包括:
获取预设总分值,根据所述数量信息以及权重信息得到所述当前用户的扣除分数值;
在所述预设总分值的基础上减去所述扣除分数值得到所述当前用户的目标分数值;
将所述目标分数值作为所述当前用户的评分值,根据所述评分值的大小与所述调整比值的对应关系查找到目标调整值;
根据所述目标调整值对调整后的参考预测数据进行调整得到所述当前用户的目标数据。
此外,为实现上述目的,本发明还提出一种数据预测装置,所述数据预测装置包括:
获取模块,用于获取当前用户的待处理驾驶数据,其中,所述待处理驾驶数据包括用户身份数据以及用户驾驶行为数据;
提取模块,用于提取所述待处理驾驶数据中的用户驾驶行为数据,对所述用户驾驶行为数据采用数据预测模型进行预测,得到所述当前用户的参考预测数据;
调整模块,用于提取所述待处理驾驶数据中的用户身份数据,根据所述用户身份数据按照预设规则调整所述参考预测数据;
评分模块,用于根据所述用户驾驶行为数据对所述当前用户进行评分,获得评分结果,根据所述评分结果和调整后的参考预测数据,得到所述当前用户的目标数据。
此外,为实现上述目的,本发明还提出一种数据预测设备,所述数据预测设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的数据预测程序,所述数据预测程序配置为实现如上所述的数据预测方法的步骤。
此外,为实现上述目的,本发明还提出一种存储介质,所述存储介质上存储有数据预测程序,所述数据预测程序被处理器执行时实现如上文所述的数据预测方法的步骤。
本发明提出的数据预测方法,通过获取当前用户的待处理驾驶数据,其中,所述待处理驾驶数据包括用户身份数据以及用户驾驶行为数据;提取所述待处理驾驶数据中的用户驾驶行为数据,对所述用户驾驶行为数据采用数据预测模型进行预测,得到所述当前用户的参考预测数据;提取所述待处理驾驶数据中的用户身份数据,根据所述用户身份数据按照预设规则调整所述参考预测数据;根据所述用户驾驶行为数据对所述当前用户进行评分,获得评分结果,根据所述评分结果和调整后的参考预测数据,得到所述当前用户的目标数据,通过数据预测模型进行预测,并结合用户身份数据以及评分机制对保险赔付率进行调整,可针对不同的驾驶行为得到不同的赔付率,得到的赔付率具有一定的针对性,体现了方案的科学性和实用性。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的设备结构示意图;
图2为本发明数据预测方法第一实施例的流程示意图;
图3为本发明数据预测方法第二实施例的流程示意图;
图4为本发明数据预测方法一实施例数据预测模型的结构示意图;
图5为本发明数据预测方法第三实施例的流程示意图;
图6为本发明数据预测装置第一实施例的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
参照图1,图1为本发明实施例方案涉及的硬件运行环境的设备结构示意图。
如图1所示,该设备可以包括:处理器1001,例如CPU,通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如按键,可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatilememory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的设备结构并不构成对设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及数据预测程序。
在图1所示的设备中,网络接口1004主要用于连接外网,与其他网络设备进行数据通信;用户接口1003主要用于连接用户设备,与设备进行数据通信;本发明设备通过处理器1001调用存储器1005中存储的数据预测程序,并执行本发明实施例提供的数据预测的实施方法。
基于上述硬件结构,提出本发明数据预测方法实施例。
参照图2,图2为本发明数据预测方法第一实施例的流程示意图。
在第一实施例中,所述数据预测方法包括以下步骤:
步骤S10,获取当前用户的待处理驾驶数据,其中,所述待处理驾驶数据包括用户身份数据以及用户驾驶行为数据。
需要说明的是,本实施例的执行主体可为数据预测装置,还可为配置为进行数据预测的服务器,还可为其他设备,本实施例对此不作限制,在本实施例中,以数据预测装置为例进行说明。
需要说明的是,在本实施例中,可通过当前用户的移动终端,例如手机等设备上安装有采集用户驾驶数据的应用程序,通过所述应用程序采集用户的驾驶数据,还可通过安装在当前用户的车辆上的终端设备采集用户的驾驶数据,例如车载单元(On board Unit,OBU)等,还可通过其他可实现相同功能的终端,本实施例对此不作限制。
在本实施例中,所述用户身份数据包括用户的年龄、职业、驾龄等信息,还包括用户的驾驶信息,例如是否有违反交通规则的信息,从而可对用户进行提前判断,提高数据预测的准确性,所述用户驾驶行为数据包括驾驶行为中的急刹车、急加速、急减速、急转弯、行驶里程、出行时间以及超速次数等,还可包括其他行为信息,本实施例对此不作限制,其中,所述数据预测包括保险赔付率的预测。
步骤S20,提取所述待处理驾驶数据中的用户驾驶行为数据,对所述用户驾驶行为数据采用数据预测模型进行预测,得到所述当前用户的参考预测数据。
在具体实现中,通过长短期记忆网络进行深度学习,从而实现对用户保险赔付率的预测,其中所述长短期记忆网络(Long Short-Term Memory,LSTM),是一种时间递归神经网络,适合于处理和预测时间序列中间隔和延迟相对较长的重要事件,LSTM已经在科技领域有了多种应用,基于LSTM的系统可以学习翻译语言、控制机器人、图像分析、文档摘要、语音识别图像识别、手写识别、控制聊天机器人、预测疾病、点击率和股票、合成音乐等等任务,由于LSTM网络模型基于深度学习直接对用户的数据进行学习,实现对用户行为的有效判断,而无需通过长时间的机器学习获取有效的行为特征,从而达到提高预测效率的目的。
步骤S30,提取所述待处理驾驶数据中的用户身份数据,根据所述用户身份数据按照预设规则调整所述参考预测数据。
可以理解的是,所述预设规则可为按照年龄对用户进行评估,还可通过用户的驾驶信息对用户进行评估,所述参考预测数据可为基于当前用户的历史保险赔付率的基础上进行调整的预测信息,例如在当前用户的年龄达到60岁以上时,可将当前用户的保险赔付率费用在历史保险赔付率费用的基础上上调10%,或者在当前用户在出险或者违反交通规则的情况下,将当前用户的保险赔付率费用在历史保险赔付率费用的基础上上调10%,从而提高数据预测的准确性。
步骤S40,根据所述用户驾驶行为数据对所述当前用户进行评分,获得评分结果,根据所述评分结果和调整后的参考预测数据,得到所述当前用户的目标数据。
在本实施例中,通过深度学习对用户的保险赔付率进行预测,得到参考预测数据,还可通过结果对用户的驾驶行为进行评分,根据评分结果对参考预测数据进行调整,从而进一步提高数据预测的准确性。
在具体实现中,通过用户的驾驶行为进行评分,例如出现急刹的特征信息时,则在基础分的基础上减去10分,并根据得分范围与调整比值的对应的关系,得到当前用户的目标保险赔付率的定价,例如计算出当前用户的得分为85分时,根据对应关系85-95分的调整比值为5%,从而得到当前用户的调整比值为5%,根据调整结果与第二步骤中的调整比值进行综合计算,从而得到所述当前用户的目标数据,从而达到提高数据预测的目的。
本实施例通过上述方案,通过获取当前用户的待处理驾驶数据,其中,所述待处理驾驶数据包括用户身份数据以及用户驾驶行为数据;提取所述待处理驾驶数据中的用户驾驶行为数据,对所述用户驾驶行为数据采用数据预测模型进行预测,得到所述当前用户的参考预测数据;提取所述待处理驾驶数据中的用户身份数据,根据所述用户身份数据按照预设规则调整所述参考预测数据;根据所述用户驾驶行为数据对所述当前用户进行评分,获得评分结果,根据所述评分结果和调整后的参考预测数据,得到所述当前用户的目标数据,通过数据预测模型进行预测,并结合用户身份数据以及评分机制对保险赔付率进行调整,可针对不同的驾驶行为得到不同的赔付率,得到的赔付率具有一定的针对性,体现了方案的科学性和实用性。
在一实施例中,如图3所示,基于第一实施例提出本发明数据预测方法第二实施例,在本实施例中,所述步骤S20的步骤,包括:
步骤S201,提取所述待处理驾驶数据中的用户驾驶行为数据,将所述用户驾驶行为数据与预设关键字信息进行比较。
需要说明的是,所述预设关键字信息为与保险赔付率相关的元素信息,例如平均时速以及刹车次数等,通过将所述用户驾驶行为数据与预设关键字信息进行比较,从而可更有效地提取出所述用户驾驶行为数据中的有效信息,实现对用户保险赔付率的预测。
步骤S202,查找所述用户驾驶行为数据中与所述预设关键字信息相关的目标驾驶行为数据,将查找到的目标驾驶行为数据作为参考数据。
可以理解的是,通过提取出所述用户驾驶行为数据中的有效信息,将所述有效信息作为所述用户驾驶行为数据中的参考数据,其中,所述参考数据可为具有关系网络的参考数据,从而获取参考数据中各个元素的关系信息。
步骤S203,将所述参考数据采用数据预测模型进行预测,得到所述当前用户的参考预测数据。
在一实施例中,所述步骤S203的步骤,包括:
步骤S204,根据所述参考数据构建层级网络信息,查找所述层级网络信息之间的各种关键字组合信息。
需要说明的是,获取待处理驾驶数据,根据所述待处理驾驶数据预测所述用户驾驶行为数据中与保险赔付率相关的元素信息,根据所述元素信息构建层级网络信息,并找出所述层级网络信息之间的各种组合。
步骤S205,根据所述关键字的预设等级信息进行组合,将组合后的关键字信息作为当前驾驶特征信息。
在构建层级网络信息之后,确定所述组合中的目标组合,将所述目标组合作为所述当前驾驶特征信息,例如首先尽可能找到与保险赔付率相关的各种元素,例如速度、开车时间信息,这些速度、开车时间就是底层的特征(Low-level features),这是第一步;然后下一步,对这些元素特征进行组合,就可以得到急刹车、急加速、急减速、急转弯等等,它们就是中间层特征(Mid-level features),这就是上面写的第二步;最后对急刹车、急加速、急减速、急转弯进行组合,就可以组成各种各样的驾驶行为的特征信息,也就是高层特征(High-level features),这个时候可以识别出或者分类出各种用户驾驶行为数据中的当前驾驶特征信息。
步骤S206,将所述当前驾驶特征信息采用数据预测模型进行预测,得到所述当前用户的参考预测数据。
在一实施例中,所述步骤S206之前,所述方法还包括:
步骤S207,获取预设原始长短期记忆网络模型,将所述预设原始长短期记忆网络模型作为参考数据预测模型的初始层。
在本实施例中,所述参考数据预测模型采用四层处理层进行处理,其中,初始层采用两层LSTM用不同的时间步提取不同的时间序列特征,第二层采用concatenate层对LSTM输出合并,第三层和第四层采用Dense层减少模型参数。
步骤S208,按照时间序列提取历史驾驶特征信息,根据所述历史驾驶特征信息对所述预设原始长短期记忆网络模型进行训练,得到参考数据预测模型。
在具体实现中,采用两层LSTM用不同的时间步提取不同的时间序列特征,采用concatenate层对LSTM输出合并,经过两层Dense输出结果,LSTM层是对全局信息建模,可以依赖历史信息来推断未来信息,即充分利用驾驶人员的历史行车数据来构建特征集,微调LSTM时间步获取不同的时间序列特征,丰富特征处理方式,经过Dense层减少模型参数,加快模型训练速度。
如图4,输入驾驶行为数据,抽样1分钟的驾驶行为数据包括用户身份信息、时间、经纬度、方向、海拔、速度、电话状态,输出保险赔付率,从而通过深度学习实现对用户行为的预测。
步骤S209,将所述参考数据预测模型中的历史驾驶特征信息进行合并。
在本实施例中,通过函数concatenate,主要功能为将多个字符文本或单元格中的数据连接在一起,显示在一个单元格中,使用格式为concatenate(Text1,Text2…),其中Text1、Text2等为需要连接的字符文本或引用的单元格,例如在C14单元格中输入公式:=CONCATENATE(A14,"@",B14,".com"),确认后,即可将A14单元格中字符、@、B14单元格中的字符和.com连接成一个整体,显示在C14单元格中。
步骤S210,获取当前压缩层的数据维度信息,根据所述数据维度信息对合并后的历史驾驶特征信息进行压缩,将压缩历史驾驶特征信息后的参考数据预测模型作为所述数据预测模型。
在具体实现中,Dense层为常用的全连接层,所实现的运算是output=activation(dot(input,kernel)+bias),其中activation是逐元素计算的激活函数,kernel是本层的权值矩阵,bias为偏置向量,只有当use_bias=True才会添加。如果本层的输入数据的维度大于2,则会先被压为与kernel相匹配的大小。
本实施例提供的方案,通过采用LSTM用不同的时间步提取不同的时间序列特征,并采用concatenate层对LSTM输出合并,经过两层Dense输出结果,从而减少模型参数,加快模型训练速度。
在一实施例中,如图5所示,基于第一实施例或第二实施例提出本发明数据预测方法第三实施例,在本实施例中,基于第一实施例进行说明,所述步骤S30的步骤,包括:
提取所述待处理驾驶数据中的用户身份数据,查找所述用户身份数据中的用户年龄信息以及历史出险数量信息。
需要说明的是,由于对于不同年龄用户的出险几率不多,对于年龄较大的用户相比较于年龄较轻的用户的出险几率较好,并且在统计用户一段时间内的出险次数比较多的情况下,对于这类用户的出险几率也较好,可通过对用户进行分析,从而提高数据预测的准确性。
根据所述用户年龄信息以及历史出险数量信息判断所述用户年龄信息以及历史出险数量信息所处的区间信息,根据所述区间信息在预设关系映射表中查找对应的调整比例信息,根据所述调整比例信息对所述参考预测数据进行调整。
在具体实现中,首先通过设置年龄范围与调整比值的对应关系,例如年龄在50-55岁之间对应的保险赔付率的调整为5%,年龄在55-60岁之间对应的保险赔付率的调整为10%,通过获取当前用户的身份信息,根据所述身份信息在所述对应关系中查找对应的调整比值信息,根据所述调整比值信息实现对当前用户的初步预测,从而更有针对性地实现对不同用户的有效预测。
为了提高处理效率,设定多个区间信息,例如50-55岁之间以及55-60岁之间,还可为其他区间信息,本实施例对此不作限制。
在一实施例中,所述步骤S40的步骤,包括:
步骤S401,提取所述待处理驾驶数据中的用户驾驶行为数据,其中,所述用户驾驶行包括急刹车数据、急加速数据、急减速数据以及急转弯数据中至少一项。
需要说明的是,用户驾驶行为数据包括每日四急(急刹车、急加速、急减速、急转弯)次数、行驶里程、出行时间、超速次数等数据,可根据用户的这些危险的驾驶行为预测用户的出险几率。
步骤S402,统计所述急刹车数据、急加速数据、急减速数据以及急转弯数据中对应的数量信息。
在本实施例中,可通过对所述急刹车数据、急加速数据、急减速数据以及急转弯数据进行统计,得到各个驾驶行为对应的数量信息,例如每日中出现急刹车10次以及急加速12次等。
步骤S403,获取所述急刹车数据、急加速数据、急减速数据以及急转弯数据对应的权重信息。
可以理解的是,对于不同的驾驶行为对应的风险等级也并不相同,通过对各个不同的驾驶行为设定相应的权重信息,从而提高对数据预测的准确性。
步骤S404,根据所述数量信息以及权重信息对所述当前用户进行评分,根据评分结果和调整后的参考预测数据得到所述当前用户的目标数据。
在一实施例中,所述步骤S404的步骤,包括:
获取预设总分值,根据所述数量信息以及权重信息得到所述当前用户的扣除分数值。
在本实施例中,将所述预设总分值设定为100分,在获取到相应的危险驾驶行为时在所述预设总分值的基础上进行倒扣的方式进行处理,其中,所述预设总分值还可为起其他数值,本实施例对此不作限制,所述预设总分值还可根据用户的需求进行灵活调整。
在具体实现中,在所述预设总分值的基础上减去所述扣除分数值得到所述当前用户的目标分数值,将所述目标分数值作为所述当前用户的评分值,根据所述评分值的大小与所述调整比值的对应关系查找到目标调整值,根据所述目标调整值对调整后的参考预测数据进行调整得到所述当前用户的目标数据,例如计算出所述扣除分数值为10分时,在所述预设总分值的基础上减去所述扣除分数值得到所述当前用户的目标分数值为90分,根据对应关系90分对应的调整值为3%,从而将调整后的参考预测数据提高3%得到的保险赔付率作为最终的保险赔付率。
本实施例提供的方案,通过评分的方式对当前用户进行评分,根据评分结果调整保险赔付率,从而进一步提高数据预测的准确性。
本发明进一步提供一种数据预测装置。
参照图6,图6为本发明数据预测装置第一实施例的功能模块示意图。
本发明数据预测装置第一实施例中,该数据预测装置包括:
获取模块10,用于获取当前用户的待处理驾驶数据,其中,所述待处理驾驶数据包括用户身份数据以及用户驾驶行为数据。
需要说明的是,本实施例的执行主体可为数据预测装置,还可为配置为进行数据预测的服务器,还可为其他设备,本实施例对此不作限制,在本实施例中,以数据预测装置为例进行说明。
需要说明的是,在本实施例中,可通过当前用户的移动终端,例如手机等设备上安装有采集用户驾驶数据的应用程序,通过所述应用程序采集用户的驾驶数据,还可通过安装在当前用户的车辆上的终端设备采集用户的驾驶数据,例如车载单元等,还可通过其他可实现相同功能的终端,本实施例对此不作限制。
在本实施例中,所述用户身份数据包括用户的年龄、职业、驾龄等信息,还包括用户的驾驶信息,例如是否有违反交通规则的信息,从而可对用户进行提前判断,提高数据预测的准确性,所述用户驾驶行为数据包括驾驶行为中的急刹车、急加速、急减速、急转弯、行驶里程、出行时间以及超速次数等,还可包括其他行为信息,本实施例对此不作限制。
提取模块20,用于提取所述待处理驾驶数据中的用户驾驶行为数据,对所述用户驾驶行为数据采用数据预测模型进行预测,得到所述当前用户的参考预测数据。
在具体实现中,通过长短期记忆网络进行深度学习,从而实现对用户保险赔付率的预测,其中所述长短期记忆网络,是一种时间递归神经网络,适合于处理和预测时间序列中间隔和延迟相对较长的重要事件,LSTM已经在科技领域有了多种应用,基于LSTM的系统可以学习翻译语言、控制机器人、图像分析、文档摘要、语音识别图像识别、手写识别、控制聊天机器人、预测疾病、点击率和股票、合成音乐等等任务,由于LSTM网络模型基于深度学习直接对用户的数据进行学习,实现对用户行为的有效判断,而无需通过长时间的机器学习获取有效的行为特征,从而达到提高预测效率的目的。
调整模块30,用于提取所述待处理驾驶数据中的用户身份数据,根据所述用户身份数据按照预设规则调整所述参考预测数据。
可以理解的是,所述预设规则可为按照年龄对用户进行评估,还可通过用户的驾驶信息对用户进行评估,所述参考预测数据可为基于当前用户的历史保险赔付率的基础上进行调整的预测信息,例如在当前用户的年龄达到60岁以上时,可将当前用户的保险赔付率费用在历史保险赔付率费用的基础上上调10%,或者在当前用户在出险或者违反交通规则的情况下,将当前用户的保险赔付率费用在历史保险赔付率费用的基础上上调10%,从而提高数据预测的准确性。
评分模块40,用于根据所述用户驾驶行为数据对所述当前用户进行评分,获得评分结果,根据所述评分结果和调整后的参考预测数据,得到所述当前用户的目标数据。
在本实施例中,通过深度学习对用户的保险赔付率进行预测,得到参考预测数据,还可通过结果对用户的驾驶行为进行评分,根据评分结果对参考预测数据进行调整,从而进一步提高数据预测的准确性。
在具体实现中,通过用户的驾驶行为进行评分,例如出现急刹的特征信息时,则在基础分的基础上减去10分,并根据得分范围与调整比值的对应的关系,得到当前用户的目标保险赔付率的定价,例如计算出当前用户的得分为85分时,根据对应关系85-95分的调整比值为5%,从而得到当前用户的调整比值为5%,根据调整结果与第二步骤中的调整比值进行综合计算,从而得到所述当前用户的目标数据,从而达到提高数据预测的目的。
本实施例通过上述方案,通过获取当前用户的待处理驾驶数据,其中,所述待处理驾驶数据包括用户身份数据以及用户驾驶行为数据;提取所述待处理驾驶数据中的用户驾驶行为数据,对所述用户驾驶行为数据采用数据预测模型进行预测,得到所述当前用户的参考预测数据;提取所述待处理驾驶数据中的用户身份数据,根据所述用户身份数据按照预设规则调整所述参考预测数据;根据所述用户驾驶行为数据对所述当前用户进行评分,获得评分结果,根据所述评分结果和调整后的参考预测数据,得到所述当前用户的目标数据,通过数据预测模型进行预测,并结合用户身份数据以及评分机制对保险赔付率进行调整,可针对不同的驾驶行为得到不同的赔付率,得到的赔付率具有一定的针对性,体现了方案的科学性和实用性。
此外,为实现上述目的,本发明还提出一种数据预测设备,所述数据预测设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的数据预测程序,所述数据预测程序配置为实现如上文所述的数据预测方法的步骤。
此外,本发明实施例还提出一种存储介质,所述存储介质上存储有数据预测程序,所述数据预测程序被处理器执行如上文所述的数据预测方法的步骤。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个计算机可读存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台智能终端设备(可以是手机,计算机,终端设备,空调器,或者网络终端设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种数据预测方法,其特征在于,所述数据预测方法包括:
获取当前用户的待处理驾驶数据,其中,所述待处理驾驶数据包括用户身份数据以及用户驾驶行为数据;
提取所述待处理驾驶数据中的用户驾驶行为数据,对所述用户驾驶行为数据采用数据预测模型进行预测,得到所述当前用户的参考预测数据;
提取所述待处理驾驶数据中的用户身份数据,根据所述用户身份数据按照预设规则调整所述参考预测数据;
根据所述用户驾驶行为数据对所述当前用户进行评分,获得评分结果,根据所述评分结果和调整后的参考预测数据,得到所述当前用户的目标数据。
2.如权利要求1所述的数据预测方法,其特征在于,所述提取所述待处理驾驶数据中的用户驾驶行为数据,对所述用户驾驶行为数据采用数据预测模型进行预测,得到所述当前用户的参考预测数据的步骤,包括:
提取所述待处理驾驶数据中的用户驾驶行为数据,将所述用户驾驶行为数据与预设关键字信息进行比较;
查找所述用户驾驶行为数据中与所述预设关键字信息相关的目标驾驶行为数据,将查找到的目标驾驶行为数据作为参考数据;
将所述参考数据采用数据预测模型进行预测,得到所述当前用户的参考预测数据。
3.如权利要求2所述的数据预测方法,其特征在于,所述将所述参考数据采用数据预测模型进行预测,得到所述当前用户的参考预测数据的步骤,包括:
根据所述参考数据构建层级网络信息,查找所述层级网络信息之间的各种关键字组合信息;
根据所述关键字的预设等级信息进行组合,将组合后的关键字信息作为当前驾驶特征信息;
将所述当前驾驶特征信息采用数据预测模型进行预测,得到所述当前用户的参考预测数据。
4.如权利要求3所述的数据预测方法,其特征在于,所述将所述当前驾驶特征信息采用数据预测模型进行预测,得到所述当前用户的参考预测数据之前,所述方法还包括:
获取预设原始长短期记忆网络模型,将所述预设原始长短期记忆网络模型作为参考数据预测模型的初始层;
按照时间序列提取历史驾驶特征信息,根据所述历史驶特征信息对所述预设原始长短期记忆网络模型进行训练,得到参考数据预测模型;
将所述参考数据预测模型中的历史驾驶特征信息进行合并;
获取当前压缩层的数据维度信息,根据所述数据维度信息对合并后的历史驾驶特征信息进行压缩,将压缩历史驾驶特征信息后的参考数据预测模型作为所述数据预测模型。
5.如权利要求1至4中任一项所述的数据预测方法,其特征在于,所述提取所述待处理驾驶数据中的用户身份数据,根据所述用户身份数据按照预设规则调整所述参考预测数据的步骤,包括:
提取所述待处理驾驶数据中的用户身份数据,查找所述用户身份数据中的用户年龄信息以及历史出险数量信息;
根据所述用户年龄信息以及历史出险数量信息判断所述用户年龄信息以及历史出险数量信息所处的区间信息;
根据所述区间信息在预设关系映射表中查找对应的调整比例信息,根据所述调整比例信息对所述参考预测数据进行调整。
6.如权利要求1至4中任一项所述的数据预测方法,其特征在于,所述根据所述用户驾驶行为数据对所述当前用户进行评分,获得评分结果,根据所述评分结果和调整后的参考预测数据,得到所述当前用户的目标数据的步骤,包括:
提取所述待处理驾驶数据中的用户驾驶行为数据,其中,所述用户驾驶行包括急刹车数据、急加速数据、急减速数据以及急转弯数据中至少一项;
统计所述急刹车数据、急加速数据、急减速数据以及急转弯数据中对应的数量信息;
获取所述急刹车数据、急加速数据、急减速数据以及急转弯数据对应的权重信息;
根据所述数量信息以及权重信息对所述当前用户进行评分,根据评分结果和调整后的参考预测数据得到所述当前用户的目标数据。
7.如权利要求6所述的数据预测方法,其特征在于,所述根据所述数量信息以及权重信息对所述当前用户进行评分,根据评分结果和调整后的参考预测数据得到所述当前用户的目标数据的步骤,包括:
获取预设总分值,根据所述数量信息以及权重信息得到所述当前用户的扣除分数值;
在所述预设总分值的基础上减去所述扣除分数值得到所述当前用户的目标分数值;
将所述目标分数值作为所述当前用户的评分值,根据所述评分值的大小与所述调整比值的对应关系查找到目标调整值;
根据所述目标调整值对调整后的参考预测数据进行调整得到所述当前用户的目标数据。
8.一种数据预测装置,其特征在于,所述数据预测装置包括:
获取模块,用于获取当前用户的待处理驾驶数据,其中,所述待处理驾驶数据包括用户身份数据以及用户驾驶行为数据;
提取模块,用于提取所述待处理驾驶数据中的用户驾驶行为数据,对所述用户驾驶行为数据采用数据预测模型进行预测,得到所述当前用户的参考预测数据;
调整模块,用于提取所述待处理驾驶数据中的用户身份数据,根据所述用户身份数据按照预设规则调整所述参考预测数据;
评分模块,用于根据所述用户驾驶行为数据对所述当前用户进行评分,获得评分结果,根据所述评分结果和调整后的参考预测数据,得到所述当前用户的目标数据。
9.一种数据预测设备,其特征在于,所述数据预测设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的数据预测程序,所述数据预测程序配置为实现如权利要求1至7中任一项所述的数据预测方法的步骤。
10.一种存储介质,其特征在于,所述存储介质上存储有数据预测程序,所述数据预测程序被处理器执行时实现如权利要求1至7中任一项所述的数据预测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910847223.4A CN110738574A (zh) | 2019-09-06 | 2019-09-06 | 数据预测方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910847223.4A CN110738574A (zh) | 2019-09-06 | 2019-09-06 | 数据预测方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110738574A true CN110738574A (zh) | 2020-01-31 |
Family
ID=69267725
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910847223.4A Pending CN110738574A (zh) | 2019-09-06 | 2019-09-06 | 数据预测方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110738574A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111523766A (zh) * | 2020-03-27 | 2020-08-11 | 中国平安财产保险股份有限公司 | 驾驶风险评估方法、装置、电子设备及可读存储介质 |
CN111582589A (zh) * | 2020-05-12 | 2020-08-25 | 上海新共赢信息科技有限公司 | 一种租车出险预测方法、装置、设备及存储介质 |
CN112061136A (zh) * | 2020-08-26 | 2020-12-11 | 西北工业大学 | 基于长短期记忆网络的司机驾驶行为自动化分析方法 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1378136A (zh) * | 2001-03-27 | 2002-11-06 | 株式会社日立制作所 | 汽车保险内容制定系统、汽车保险费制定系统和汽车保险费征收系统 |
US20080126138A1 (en) * | 2006-11-24 | 2008-05-29 | Eagle Insurance Agency, Inc. | System and method for presenting insurance offers |
US20150187014A1 (en) * | 2013-12-31 | 2015-07-02 | Hartford Fire Insurance Company | System and method for expectation based processing |
CN106447139A (zh) * | 2016-12-06 | 2017-02-22 | 北京中交兴路信息科技有限公司 | 一种基于车辆驾驶行为的保险精算方法及装置 |
CN107292528A (zh) * | 2017-06-30 | 2017-10-24 | 阿里巴巴集团控股有限公司 | 车险风险预测方法、装置及服务器 |
CN108765020A (zh) * | 2018-02-07 | 2018-11-06 | 上海小娜汽车技术有限公司 | 一种基于前装车联网全量车辆的ubi定价系统 |
CN109118055A (zh) * | 2018-07-19 | 2019-01-01 | 众安信息技术服务有限公司 | 一种驾驶行为评分方法及装置 |
CN109325705A (zh) * | 2018-10-11 | 2019-02-12 | 北京三驰惯性科技股份有限公司 | 一种基于惯性融合技术的驾驶习惯评分方法及系统 |
CN109658272A (zh) * | 2018-12-26 | 2019-04-19 | 江苏数慧信息科技有限公司 | 驾驶行为评价系统及基于驾驶行为的保险定价系统 |
CN111247565A (zh) * | 2017-09-06 | 2020-06-05 | 瑞士再保险有限公司 | 用于移动远程信息处理装置的电子日志记录和跟踪识别系统及其对应方法 |
-
2019
- 2019-09-06 CN CN201910847223.4A patent/CN110738574A/zh active Pending
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1378136A (zh) * | 2001-03-27 | 2002-11-06 | 株式会社日立制作所 | 汽车保险内容制定系统、汽车保险费制定系统和汽车保险费征收系统 |
US20080126138A1 (en) * | 2006-11-24 | 2008-05-29 | Eagle Insurance Agency, Inc. | System and method for presenting insurance offers |
US20150187014A1 (en) * | 2013-12-31 | 2015-07-02 | Hartford Fire Insurance Company | System and method for expectation based processing |
CN106447139A (zh) * | 2016-12-06 | 2017-02-22 | 北京中交兴路信息科技有限公司 | 一种基于车辆驾驶行为的保险精算方法及装置 |
CN107292528A (zh) * | 2017-06-30 | 2017-10-24 | 阿里巴巴集团控股有限公司 | 车险风险预测方法、装置及服务器 |
CN111247565A (zh) * | 2017-09-06 | 2020-06-05 | 瑞士再保险有限公司 | 用于移动远程信息处理装置的电子日志记录和跟踪识别系统及其对应方法 |
CN108765020A (zh) * | 2018-02-07 | 2018-11-06 | 上海小娜汽车技术有限公司 | 一种基于前装车联网全量车辆的ubi定价系统 |
CN109118055A (zh) * | 2018-07-19 | 2019-01-01 | 众安信息技术服务有限公司 | 一种驾驶行为评分方法及装置 |
CN109325705A (zh) * | 2018-10-11 | 2019-02-12 | 北京三驰惯性科技股份有限公司 | 一种基于惯性融合技术的驾驶习惯评分方法及系统 |
CN109658272A (zh) * | 2018-12-26 | 2019-04-19 | 江苏数慧信息科技有限公司 | 驾驶行为评价系统及基于驾驶行为的保险定价系统 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111523766A (zh) * | 2020-03-27 | 2020-08-11 | 中国平安财产保险股份有限公司 | 驾驶风险评估方法、装置、电子设备及可读存储介质 |
CN111582589A (zh) * | 2020-05-12 | 2020-08-25 | 上海新共赢信息科技有限公司 | 一种租车出险预测方法、装置、设备及存储介质 |
CN112061136A (zh) * | 2020-08-26 | 2020-12-11 | 西北工业大学 | 基于长短期记忆网络的司机驾驶行为自动化分析方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210103823A1 (en) | Training neural networks using a variational information bottleneck | |
EP3385919B1 (en) | Method of processing passage record and device | |
US10657581B2 (en) | Methods and systems for order processing | |
KR20230026961A (ko) | 장애물 이동 궤적의 예측 방법, 장치 및 자율 운전 차량 | |
CN110738574A (zh) | 数据预测方法、装置、设备及存储介质 | |
CN109388674B (zh) | 数据处理方法、装置、设备及可读存储介质 | |
CN108885623A (zh) | 基于知识图谱的语意分析系统及方法 | |
CN112235327A (zh) | 异常日志检测方法、装置、设备和计算机可读存储介质 | |
JP2014502754A (ja) | インターネットにおける有害情報の遮断方法と装置 | |
CN108182240B (zh) | 兴趣点新增率预测模型训练及预测方法、装置及存储介质 | |
CN110309504B (zh) | 基于分词的文本处理方法、装置、设备及存储介质 | |
CN112182645A (zh) | 一种针对目的地预测的可量化隐私保护方法、设备及介质 | |
CN113961765A (zh) | 基于神经网络模型的搜索方法、装置、设备和介质 | |
CN116416778A (zh) | 一种区域安全风险评估方法、系统、装置及存储介质 | |
CN112818262A (zh) | 基于用户数据的地图poi搜索方法、系统、设备及介质 | |
CN117271754B (zh) | 数据检索方法、装置及设备 | |
CN116992294B (zh) | 卫星测控训练评估方法、装置、设备及存储介质 | |
CN112734142A (zh) | 基于深度学习的资源学习路径规划方法及装置 | |
CN110704614A (zh) | 对应用中的用户群类型进行预测的信息处理方法及装置 | |
CN114490986B (zh) | 计算机实施的数据挖掘方法、装置、电子设备及存储介质 | |
CN111078972B (zh) | 提问行为数据的获取方法、装置和服务器 | |
Zhong et al. | Finite mixture survival model for examining the variability of urban arterial travel time for buses, passenger cars and taxis | |
CN113961811A (zh) | 基于事件图谱的话术推荐方法、装置、设备及介质 | |
CN111261165A (zh) | 车站名称识别方法、装置、设备及存储介质 | |
CN110766288A (zh) | 理赔查勘员的分配方法和装置、电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |