CN111959518A - 数据处理方法、装置及设备 - Google Patents

数据处理方法、装置及设备 Download PDF

Info

Publication number
CN111959518A
CN111959518A CN202010819432.0A CN202010819432A CN111959518A CN 111959518 A CN111959518 A CN 111959518A CN 202010819432 A CN202010819432 A CN 202010819432A CN 111959518 A CN111959518 A CN 111959518A
Authority
CN
China
Prior art keywords
risk
driver
data
characteristic data
driving
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010819432.0A
Other languages
English (en)
Inventor
郭峰
谷育萱
邓新伟
史量
钱晨
毛慧颖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Didi Infinity Technology and Development Co Ltd
Original Assignee
Beijing Didi Infinity Technology and Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Didi Infinity Technology and Development Co Ltd filed Critical Beijing Didi Infinity Technology and Development Co Ltd
Priority to CN202010819432.0A priority Critical patent/CN111959518A/zh
Publication of CN111959518A publication Critical patent/CN111959518A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W40/00Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models
    • B60W40/08Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models related to drivers or passengers
    • B60W40/09Driving style or behaviour
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W50/00Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W50/00Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
    • B60W2050/0001Details of the control system
    • B60W2050/0019Control system elements or transfer functions
    • B60W2050/0028Mathematical models, e.g. for simulation
    • B60W2050/0029Mathematical model of the driver

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Automation & Control Theory (AREA)
  • Transportation (AREA)
  • Mechanical Engineering (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Human Computer Interaction (AREA)
  • Medical Informatics (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Traffic Control Systems (AREA)

Abstract

本公开的实施例提供一种数据处理方法、装置及设备。该方法包括:获取第一驾驶员的特征数据,特征数据中包括多种类型的驾驶特征对应的数据,通过预测模型对特征数据进行处理,得到第一驾驶员的第一危险度,进而,根据所述特征数据、所述预测模型以及所述第一危险度,确定出多种类型的驾驶特征各自对应的第二危险度。可见,本公开实施例的方法不仅可以基于驾驶员的特征数据,预测得到第一驾驶员的第一危险度,并且,还可以进一步对该预测结果进行解释,确定出各个类型的驾驶特征各自对应的第二风险度,使得对驾驶员危险度的预测结果更加精细化。

Description

数据处理方法、装置及设备
技术领域
本公开的实施例涉及信息处理技术领域,尤其涉及一种数据处理方法、装置及设备。
背景技术
随着机动车数量的不断增加,道路交通事故的数量也越来越多。
为了降低道路交通事故的发生率,目前可以对驾驶员的驾驶行为进行检测,例如,在检测到驾驶员未系安全带,或者检测到驾驶员超速驾驶时,对驾驶员进行提醒。
然而,上述现有技术只能针对检测到的某种危险驾驶行为进行提醒,无法识别出驾驶员的危险程度。
发明内容
本公开的实施例提供一种数据处理方法、装置及设备,用以识别驾驶员的危险程度。
第一方面,本公开的实施例提供一种数据处理方法,包括:
获取第一驾驶员的特征数据,所述特征数据包括多种类型的驾驶特征对应的数据;
通过预测模型对所述特征数据进行处理,得到所述第一驾驶员的第一危险度;
根据所述特征数据、所述预测模型以及所述第一危险度,确定所述多种类型的驾驶特征各自对应的第二危险度。
第二方面,本公开的实施例提供一种数据处理装置,包括:
获取模块,用于获取第一驾驶员的特征数据,所述特征数据包括多种类型的驾驶特征对应的数据;
预测模块,用于通过预测模型对所述特征数据进行处理,得到所述第一驾驶员的第一危险度;
解释模块,用于根据所述特征数据、所述预测模型以及所述第一危险度,确定所述多种类型的驾驶特征各自对应的第二危险度。
第三方面,本公开的实施例提供一种电子设备,包括:存储器和处理器,所述存储器用于存储计算机程序,所述处理器运行所述计算机程序执行如第一方面任一项所述的方法。
第四方面,本公开的实施例提供一种计算机可读存储介质,所述计算机可读存储介质包括计算机程序,所述计算机程序被处理器执行时实现如第一方面任一项所述的方法。
本公开的实施例提供的数据处理方法、装置及设备,该方法包括:获取第一驾驶员的特征数据,特征数据中包括多种类型的驾驶特征对应的数据,通过预测模型对特征数据进行处理,得到第一驾驶员的第一危险度,进而,根据所述特征数据、所述预测模型以及所述第一危险度,确定出多种类型的驾驶特征各自对应的第二危险度。可见,本公开实施例的方法不仅可以基于驾驶员的特征数据,预测得到第一驾驶员的第一危险度,并且,还可以进一步对该预测结果进行解释,确定出各个类型的驾驶特征各自对应的第二风险度,使得预测结果更加精细化。这样,根据精细化的预测结果,可以对第一驾驶员进行针对性的指导或教育,从而降低未来发生交通事故的可能性。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1为本公开的实施例适用的一种系统架构的示意图;
图2为本公开的一个实施例提供的数据处理方法的流程示意图;
图3为本公开的另一个实施例提供的数据处理方法的流程示意图;
图4为图3所示实施例对应的数据处理过程的示意图;
图5为本公开的一个实施例提供的预测模型的训练方法的流程示意图;
图6为本公开的一个实施例提供的数据处理装置的结构示意图;
图7为本公开的另一个实施例提供的数据处理装置的结构示意图;
图8为本公开的一个实施例提供的电子设备的结构示意图。
通过上述附图,已示出本公开明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本公开构思的范围,而是通过参考特定实施例为本领域技术人员说明本公开的概念。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
下面结合图1对本公开的实施例可能适用的系统架构进行介绍。图1为本公开的实施例适用的一种系统架构的示意图。如图1所示,系统架构1000可以包括终端设备1001、1002、1003,网络1004和服务器1005。应该理解,图1中的终端设备、网络和服务器的数目或类型仅仅是示意性的。根据实现需要,可以具有任意数目或类型的终端设备、网络和服务器。
网络1004用于在终端设备1001、1002、1003和服务器1005之间提供通信链路的介质。网络1004可以包括各种连接类型,例如:有线通信链路、无线通信链路或者光纤电缆等等。
终端设备1001、1002、1003可以通过网络1004与服务器1005进行交互,以接收或者发送信息等。终端设备1001、1002、1003可以是各种电子设备,包括但不限于:智能手机、平板电脑、智能穿戴设备、车载设备以及个人数字助理等。
服务器1005可以是提供各种服务的服务器。服务器可以对接收到的数据进行存储、分析等处理,也可以向终端设备或其他服务器发送控制命令或者请求等。服务器可以响应于用户终端设备的服务请求而提供服务。可以理解,一个服务器可以提供一种或者多种服务,同一种服务也可以由多个服务器来提供。服务器还可以是云端服务器。
一种可能的应用场景中,图1所示的系统架构可以应用于网约车应用场景中。具体的,驾驶员携带终端设备驾驶车辆行驶。该过程中,终端设备可以与服务器进行交互。例如,终端设备可以向服务器上报当前位置信息,或者,向服务器请求订单信息,或者,向服务器上报订单执行情况,或者,采集驾驶员的驾驶行为并向服务器上报,等。服务器可以对终端设备的移动轨迹进行监控,或者,向终端设备下发控制指令,或者,对终端设备上报的信息进行存储、分析、统计,等。
目前,为了降低道路交通事故的发生率,可以对驾驶员的驾驶行为进行检测,例如,在检测到驾驶员未系安全带,或者检测到驾驶员超速驾驶时,对驾驶员进行提醒。然而,上述现有技术只能针对检测到的某种危险驾驶行为进行提醒,无法识别出驾驶员的危险程度。
为了解决上述问题,本公开的实施例提供一种数据处理方法,获取第一驾驶员的特征数据,特征数据中包括多种类型的驾驶特征对应的数据,通过预测模型对特征数据进行处理,得到第一驾驶员的第一危险度,进而,根据所述特征数据、所述预测模型以及所述第一危险度,确定出多种类型的驾驶特征各自对应的第二危险度。可见,本公开实施例的方法不仅可以基于驾驶员的特征数据,确定出驾驶员的第一危险度,并且,还可以进一步对该预测结果进行解释,确定出各个类型的驾驶特征各自对应的第二风险度,使得预测结果更加精细化。这样,根据精细化的预测结果,可以对第一驾驶员进行针对性的指导或教育,从而降低未来发生交通事故的可能性。
下面以具体地实施例对本公开的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
图2为本公开的一个实施例提供的数据处理方法的流程示意图。本实施例的方法可以由图1中的服务器执行。如图2所示,本实施例的方法包括:
S201:获取第一驾驶员的特征数据,所述特征数据包括多种类型的驾驶特征对应的数据。
其中,第一驾驶员为待进行风险度预测的驾驶员。第一驾驶员的特征数据可以是指第一驾驶员对应的历史驾驶数据,或者说,第一驾驶员的特征数据可以从第一驾驶员对应的历史驾驶数据中提取得到。示例性的,从数据库中获取第一驾驶员最近3个月的历史驾驶数据,从该历史驾驶数据中提取出特征数据。
本实施例的特征数据中包括多种类型的驾驶特征对应的数据。其中,每种类型的驾驶特征对应了一种造成交通事故的直接或者间接因素。例如,多种类型的驾驶特征包括但不限于:年龄、驾龄、车龄、驾驶速度、驾驶行为等。
S202:通过预测模型对所述特征数据进行处理,得到所述第一驾驶员的第一危险度。
其中,第一危险度可以是指第一驾驶员行车驾驶的危险程度。换句话说,第一危险度可用于指示第一驾驶员在未来预设时长内发生交通事故的频率。示例性的,第一危险度可以采用未来预设时长内的百万公里事故数来表示。比如某个驾驶员的第一危险度为3,则说明该驾驶员在未来预设时长内的百万公里事故数为3。
本实施例中,采用预测模型对第一驾驶员的特征数据进行预测,得到第一驾驶员的第一危险度。示例性的,将特征数据输入预测模型中,根据预测模型的输出结果确定出第一驾驶员的第一危险度。
其中,预测模型可以是基于机器学习算法事先训练得到的模型。预测模型的结构可以有多种,例如,可以采用线性模型,或者非线性模型。
需要说明的是,本实施例对于预测模型的训练过程不作限定。一种可能的训练方式可以参见后续实施例的详细描述。
本实施例中,由于预测模型对第一驾驶员的第一危险度进行预测时,考虑了多种类型的驾驶特征,使得预测结果更加准确,即,预测结果能够从整体上反映第一驾驶员的危险程度,或者说,能够从整体上反映第一驾驶员在未来预设时长内发生交通事故的频率。进而,基于该预测结果,可以对第一驾驶员进行指导和教育,从而可以降低未来发生交通事故的可能性。
S203:根据所述特征数据、所述预测模型以及所述第一危险度,确定所述多种类型的驾驶特征各自对应的第二危险度。
在S202的基础上,本实施例还进一步根据特征数据、预测模型以及第一危险度,确定出多种类型的驾驶特征各自对应的第二危险度。其中,每种类型的驾驶特征对应的第二危险度用于指示该类型的驾驶特征对所述第一危险度的贡献值。
本实施例中,第二危险度用于对第一危险度进行解释,即,确定出每种类型的驾驶特征在多大程度上导致了第一危险度,亦即,每种类型的驾驶特征对第一危险度的贡献值是多少。
其中,每个类型的驾驶特征对应的第二危险度可以为正值或者负值。当为正值时,说明该类型的驾驶特征对第一危险度为正影响,即该类型的驾驶特征使得驾驶员的第一危险度增大。当为负值时,说明该类型的驾驶特征对第一危险度为负影响,即该类型的驾驶特征使得驾驶员的第一危险度减小。
进一步的,根据各个类型的驾驶特征对应的第二危险度,可以确定出哪种/哪些类型的驾驶特征对第一危险度的贡献较大,则可以将这种/这些类型的驾驶特征提醒给用户,使得用户可以改变这些驾驶特征。例如,若预测结果显示下面两个驾驶特征“使用手机”、“未系安全带”对第一危险度的贡献值较大,则用户可以重点从这两个驾驶特征上进行改变,从而降低驾驶危险度,避免发生交通事故。
本实施例提供的数据处理方法,包括:获取第一驾驶员的特征数据,特征数据中包括多种类型的驾驶特征对应的数据,通过预测模型对特征数据进行处理,得到第一驾驶员的第一危险度,进而,根据所述特征数据、所述预测模型以及所述第一危险度,确定出多种类型的驾驶特征各自对应的第二危险度。可见,本公开实施例的方法不仅可以基于驾驶员的特征数据,预测得到第一驾驶员的第一危险度,并且,还可以进一步对该预测结果进行解释,确定出各个类型的驾驶特征各自对应的第二风险度,使得预测结果更加精细化。这样,根据精细化的预测结果,可以对第一驾驶员进行针对性的指导或教育,从而降低未来发生交通事故的可能性。
图3为本公开的另一个实施例提供的数据处理方法的流程示意图。图4为图3所示实施例对应的数据处理过程的示意图。本实施例对图2所示的实施例进行细化。如图3和图4所示,本实施例的方法包括:
S301:根据第一驾驶员的历史驾驶数据,获取多种维度的特征数据,其中,每种维度的特征数据包括至少一种类型的驾驶特征对应的数据。
其中,所述多种维度包括下述维度中的至少两种:属性维度、业务维度、事故维度、驾驶行为维度。每种维度的特征数据中可以包括一种或者多种类型的驾驶特征对应的数据。
示例性的,属性维度的特征数据是指用于记录驾驶员的静态属性的特征数据。属性维度的特征数据可以包括但不限于下述类型中的一种或者多种:性别、年龄、驾龄、所在城市、车龄等。
业务维度的特征数据是指用于记录驾驶员对业务订单执行情况的特征数据。业务维度的特征数据可以包括但不限于下述类型中的一种或者多种:完成订单数量、订单的评价信息、订单的投诉信息等。
事故维度的特征数据是指用于记录驾驶员发生交通事故情况的特征数据。事故维度的特征数据可以包括但不限于下述类型中的一种或者多种:交通事故的数量、交通事故的类型、交通事故的等级、交通事故的责任归属等。
驾驶行为维度的特征数据是指用于记录驾驶员驾驶行为的特征数据,可以通过终端设备对驾驶行为进行采集,并上报到服务器。驾驶行为维度的特征数据可以包括但不限于下述类型中的一种或者多种:驾驶速度、是否系安全带、是否使用手机、是否双手离开方向盘等。
S302:对所述多种维度的特征数据进行预处理,以使所述预处理后的特征数据满足预设分布。
其中,上述预处理的过程可以包括但不限于:(1)对各种维度的特征数据进行脏数据清洗,例如:填补缺失值、纠正异常值或无效值、删除重复值等。(2)对各维度的特征数据进行变换或规约,例如,对数据进行归一化处理、开平方根处理等。经过上述预处理过程之后,使得各个维度的特征数据满足预设分布(例如正态分布),从而便于预测模型的后续处理过程。
S303:将所述预处理后的特征数据输入所述预测模型,根据所述预测模型的输出结果得到所述第一驾驶员的第一危险度。
本实施例中,为了便于后续步骤对预测结果的解释,预测模型可以采用线性预测模型。
可选的,所述预测模型为广义线性模型(Generalized Linear Model,GLM)模型。具体的,可以基于多种分布类型构建得到广义线性模型,包括但不限于:两项分布、正态分布、伽马分布、泊松分布等。
可选的,所述预测模型为基于泊松分布的GLM模型。所述预测模型以上述多种类型的驾驶特征作为自变量,以第一危险度作为因变量。由于实际应用中,交通事故的发生为极小概率事件,而泊松分布适用于预测极小概率事件发生的频率,因此,本实施例中采用基于泊松分布的GLM模型能够保证预测结果的准确性。
本实施例中,基于多种维度的特征数据对第一驾驶员进行预测,使得预测得到的第一危险度更加准确。
S304:将所述特征数据、所述预测模型以及所述第一危险度输入解释模型,获取所述解释模型的输出结果,并根据所述输出结果确定所述多种类型的驾驶特征各自对应的第二危险度。
本实施例中,解释模型用于对预测模型的预测结果进行解释。
可选的,所述解释模型为SHAP(SHapley Additive exPlanation)模型。SHAP的基本思想源自于合作博弈论中的Shapley值思想:n个人合作,创造了v(N)的价值,如何对所创造的价值进行分配。引用到数学模型中,SHAP的基本思想可以理解为:计算一个特征加入到模型时的边际贡献,然后考虑到该特征在所有的特征序列的情况下不同的边际贡献,即为一个特征对当前样本预测结果的贡献值。
示例性的,本实施例中预测模型采用基于泊松分布的GLM模型,假设预测模型基于第一驾驶员的特征数据,预测得到第一驾驶员在未来预设时长内的百万公里事故数为3。进一步的,将第一驾驶员的特征数据、基于泊松分布的GLM模型、以及上述预测结果输入至SHAP模型中,SHAP模型对GLM模型的预测结果进行解释,从而确定出各个类型的驾驶特征对上述百万公里事故数的贡献程度。
本实施例中,第一危险度与第二危险度之间的关系可以采用下式表示。
Y=Y0+f(x1)+f(x2)+…+f(xn)
其中,Y表示第一驾驶员的第一危险度。Y0表示所有驾驶员的基准危险度,可以通过对所有驾驶员的危险度进行统计取平均值得到。x1、x2、...、xn表示多种类型的驾驶特征,f(xn)表示驾驶特征xn对应的第二危险度。
可见,所述多个类型的驾驶特征对应的第二危险度之和等于第一危险度与基准危险度之间的差值。
举例说明,假设第一驾驶员的第一危险度为3(即在未来预设时长内的百万公里事故数为3),所有驾驶员基准危险度为2,则第一驾驶员的第一危险度与基准危险度相比,百万公里事故数增加了1。通过本实施例的解释模型,可以将增加的百万公里事故数分配到多个类型的驾驶特征上,即,确定出多个类型的驾驶特征分别对上述增加的百万公里事故数的贡献程度。
S305:根据所述第一危险度以及所述多种类型的驾驶特征各自对应的第二危险度,生成展示信息,并对所述展示信息进行展示。
示例性的,可以根据第一危险度以及多种类型的驾驶特征各自对应的第二危险度,生成多种可视化的展示信息,例如:可以是文字形式,还可以是图表形式,或者其他形式。进而,可以对展示信息进行展示。
可选的,当本实施例的方法由服务器执行时,还可以将上述展示信息发送给第一驾驶员的终端设备,使得第一驾驶员可以直观了解到自己的危险度,并且还可以直观了解到各种类型的驾驶特征是如何导致了该危险度,从而对第一驾驶员的后续驾驶提供针对性的指导,避免交通事故的发生。
上述实施例描述了对第一驾驶员的危险度进行预测和解释的过程。在上述任一实施例的基础上,还可以对多个驾驶员的危险度进行综合分析。
示例性的,针对某个驾驶员群体,可以找出该群体内第二危险度均较高的驾驶特征,从而确定出该群体内的各种类型的驾驶特征的重要性。进而,可以根据该重要性对该群体内的驾驶员进行针对性的指导或教育。
进一步的,还可以将不同群体的驾驶特征的重要性进行对比,例如,将两个不同城市的驾驶特征的重要性进行对比,便可以知道不同城市更应该关注的驾驶特征的异同。
本公开实施例的方法不仅可以基于驾驶员的特征数据,预测得到第一驾驶员的第一危险度,并且,还可以进一步对该预测结果进行解释,确定出各个类型的驾驶特征各自对应的第二风险度,使得预测结果更加精细化。这样,根据精细化的预测结果,可以对第一驾驶员进行针对性的指导或教育,从而降低未来发生交通事故的可能性。
图5为本公开的一个实施例提供的预测模型的训练方法的流程示意图。如图5所示,本实施例的方法,包括:
S501:获取多个第二驾驶员在第一历史时间段内的特征数据,以及在第二历史时间段内的事故数据,所述第二历史时间段位于所述第一历史时间段之后。
S502:将每个第二驾驶员在第一历史时间段内的特征数据作为训练样本,并根据该第二驾驶员在第二历史时间段内的事故数据,确定所述训练样本的标签。
S503:根据所述训练样本以及所述标签,对待训练的预测模型进行有监督的训练,得到训练后的所述预测模型。
其中,第二驾驶员为待训练的驾驶员。每个第二驾驶员在第一历史时间段内的特征数据,与上述实施例中第一驾驶员的特征数据相同,可以包括多个维度的特征数据,每个维度的特征数据中可以包括至少一种类型的驾驶特征对应的数据。具体获取方式可以参见上述实施例的描述,此处不作赘述。
每个驾驶员在第二历史时间段内的事故数据,可以包括该驾驶员在第二历史时间段内发生的交通事故的次数、等级、责任归属等。
示例性的,假设当前时刻为7月份,则可以获取多个第二驾驶员在1-3月份的特征数据,并分别获取这些第二驾驶员在4-6月份的事故数据。将每个第二驾驶员在1-3月份的特征数据作为训练样本,并根据其在4-6月份的事故数据对训练样本进行标注,得到训练数据的标签。例如,标签可以表示该训练样本在4-6月份的百万公里事故数。
这样,根据得到的多个训练样本和每个训练样本的标签,对待训练的预测模型进行有监督的训练,得到训练后的预测模型。
示例性的,当预测模型采用基于泊松分布的GLM模型时,可以将训练样本的特征数据作为自变量,将训练样本的标签作为因变量进行建模并训练,得到训练后的GLM模型。这样,训练后的GLM模型可以基于驾驶员的特征数据进行预测,得到该驾驶员在未来预设时长内的百万公里事故数。
图6为本公开的一个实施例提供的数据处理装置的结构示意图。本实施例的装置可以为软件和/或硬件的形式。如图6所示,本实施例提供的数据处理装置10,可以包括:获取模块11、预测模块12和解释模块13。
获取模块11,用于获取第一驾驶员的特征数据,所述特征数据包括多种类型的驾驶特征对应的数据;
预测模块12,用于通过预测模型对所述特征数据进行处理,得到所述第一驾驶员的第一危险度;
解释模块13,用于根据所述特征数据、所述预测模型以及所述第一危险度,确定所述多种类型的驾驶特征各自对应的第二危险度。
一种可能的实现方式中,所述解释模块13具体用于:
将所述特征数据、所述预测模型以及所述第一危险度输入解释模型,获取所述解释模型的输出结果;
根据所述输出结果,确定所述多种类型的驾驶特征各自对应的第二危险度。
一种可能的实现方式中,所述第一危险度用于指示所述第一驾驶员在未来预设时长内发生交通事故的频率;每种类型的驾驶特征对应的第二危险度用于指示该类型的驾驶特征对所述第一危险度的贡献值。
图7为本公开的另一个实施例提供的数据处理装置的结构示意图。在图6所示装置的基础上,本实施例提供的数据处理装置10,还可以包括:展示模块14。
展示模块14,用于根据所述第一危险度以及所述多种类型的驾驶特征各自对应的第二危险度,生成展示信息;并对所述展示信息进行展示。
一种可能的实现方式中,所述获取模块11具体用于:
根据所述第一驾驶员的历史驾驶数据,获取多种维度的特征数据;其中,每种维度的特征数据包括至少一种类型的所述驾驶特征对应的数据,所述多种维度包括下述维度中的至少两种:属性维度、业务维度、事故维度、驾驶行为维度。
一种可能的实现方式中,所述预测模块12具体用于:
对所述多种维度的特征数据进行预处理,以使所述预处理后的特征数据满足预设分布;
将所述预处理后的特征数据输入所述预测模型,根据所述预测模型的输出结果得到所述第一驾驶员的第一危险度。
一种可能的实现方式中,所述预测模型是通过如下训练方法得到的:
获取多个第二驾驶员在第一历史时间段内的特征数据,以及在第二历史时间段内的事故数据,所述第二历史时间段位于所述第一历史时间段之后;
将每个第二驾驶员在第一历史时间段内的特征数据作为训练样本,并根据该第二驾驶员在第二历史时间段内的事故数据,确定所述训练样本的标签;
根据所述训练样本以及所述标签,对待训练的预测模型进行有监督的训练,得到训练后的所述预测模型。
一种可能的实现方式中,所述预测模型为广义线性模型GLM,所述解释模型为SHAP模型。
本实施例提供的数据处理装置,可用于执行上述任一方法实施例中的技术方案,其实现原理和技术效果类似,此处不作赘述。
图8为本公开的一个实施例提供的电子设备的结构示意图。该电子设备可以作为服务器。如图8所示,本实施例的电子设备20,包括:处理器21以及存储器22;其中,存储器22,用于存储计算机程序;处理器21,用于执行存储器中存储的计算机程序,以实现上述实施例中的数据处理方法。具体可以参见前述方法实施例中的相关描述。
可选地,存储器22既可以是独立的,也可以跟处理器21集成在一起。
当所述存储器22是独立于处理器21之外的器件时,所述电子设备20还可以包括:总线23,用于连接所述存储器22和处理器21。
可选的,电子设备20还可以包括通信部件24,用于与终端设备或者其他服务器进行通信。
本实施例提供的电子设备,可用于执行上述任一方法实施例中的技术方案,其实现原理和技术效果类似,本实施例此处不再赘述。
本公开实施例还提供一种计算机可读存储介质,所述计算机可读存储介质包括计算机程序,所述计算机程序用于实现如上任一方法实施例中的技术方案。
本公开实施例还提供一种芯片,包括:存储器、处理器以及计算机程序,所述计算机程序存储在所述存储器中,所述处理器运行所述计算机程序执行上述任一方法实施例中的技术方案。
在本公开所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。例如,以上所描述的设备实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本公开各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个单元中。上述模块成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能模块的形式实现的集成的模块,可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(英文:processor)执行本公开各个实施例所述方法的部分步骤。
应理解,上述处理器可以是中央处理单元(英文:Central Processing Unit,简称:CPU),还可以是其他通用处理器、数字信号处理器(英文:Digital Signal Processor,简称:DSP)、专用集成电路(英文:Application Specific Integrated Circuit,简称:ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合申请所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
存储器可能包含高速RAM存储器,也可能还包括非易失性存储NVM,例如至少一个磁盘存储器,还可以为U盘、移动硬盘、只读存储器、磁盘或光盘等。
总线可以是工业标准体系结构(Industry Standard Architecture,ISA)总线、外部设备互连(Peripheral Component,PCI)总线或扩展工业标准体系结构(ExtendedIndustry Standard Architecture,EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,本公开附图中的总线并不限定仅有一根总线或一种类型的总线。
上述存储介质可以是由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。存储介质可以是通用或专用计算机能够存取的任何可用介质。
一种示例性的存储介质耦合至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于专用集成电路(Application Specific Integrated Circuits,简称:ASIC)中。当然,处理器和存储介质也可以作为分立组件存在于电子设备或主控设备中。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求书指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求书来限制。

Claims (18)

1.一种数据处理方法,其特征在于,包括:
获取第一驾驶员的特征数据,所述特征数据包括多种类型的驾驶特征对应的数据;
通过预测模型对所述特征数据进行处理,得到所述第一驾驶员的第一危险度;
根据所述特征数据、所述预测模型以及所述第一危险度,确定所述多种类型的驾驶特征各自对应的第二危险度。
2.根据权利要求1所述的方法,其特征在于,根据所述特征数据、所述预测模型以及所述第一危险度,确定所述多种类型的驾驶特征各自对应的第二危险度,包括:
将所述特征数据、所述预测模型以及所述第一危险度输入解释模型,获取所述解释模型的输出结果;
根据所述输出结果,确定所述多种类型的驾驶特征各自对应的第二危险度。
3.根据权利要求2所述的方法,其特征在于,所述第一危险度用于指示所述第一驾驶员在未来预设时长内发生交通事故的频率;每种类型的驾驶特征对应的第二危险度用于指示该类型的驾驶特征对所述第一危险度的贡献值。
4.根据权利要求3所述的方法,其特征在于,根据所述特征数据、所述预测模型以及所述第一危险度,确定所述多种类型的驾驶特征各自对应的第二危险度之后,还包括:
根据所述第一危险度以及所述多种类型的驾驶特征各自对应的第二危险度,生成展示信息;
对所述展示信息进行展示。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述获取第一驾驶员的特征数据,包括:
根据所述第一驾驶员的历史驾驶数据,获取多种维度的特征数据;其中,每种维度的特征数据包括至少一种类型的所述驾驶特征对应的数据,所述多种维度包括下述维度中的至少两种:属性维度、业务维度、事故维度、驾驶行为维度。
6.根据权利要求5所述的方法,其特征在于,通过预测模型对所述特征数据进行处理,得到所述第一驾驶员的第一危险度,包括:
对所述多种维度的特征数据进行预处理,以使所述预处理后的特征数据满足预设分布;
将所述预处理后的特征数据输入所述预测模型,根据所述预测模型的输出结果得到所述第一驾驶员的第一危险度。
7.根据权利要求1至4任一项所述的方法,其特征在于,所述预测模型是通过如下训练方法得到的:
获取多个第二驾驶员在第一历史时间段内的特征数据,以及在第二历史时间段内的事故数据,所述第二历史时间段位于所述第一历史时间段之后;
将每个第二驾驶员在第一历史时间段内的特征数据作为训练样本,并根据该第二驾驶员在第二历史时间段内的事故数据,确定所述训练样本的标签;
根据所述训练样本以及所述标签,对待训练的预测模型进行有监督的训练,得到训练后的所述预测模型。
8.根据权利要求2至4任一项所述的方法,其特征在于,所述预测模型为广义线性模型GLM,所述解释模型为SHAP模型。
9.一种数据处理装置,其特征在于,包括:
获取模块,用于获取第一驾驶员的特征数据,所述特征数据包括多种类型的驾驶特征对应的数据;
预测模块,用于通过预测模型对所述特征数据进行处理,得到所述第一驾驶员的第一危险度;
解释模块,用于根据所述特征数据、所述预测模型以及所述第一危险度,确定所述多种类型的驾驶特征各自对应的第二危险度。
10.根据权利要求9所述的装置,其特征在于,所述解释模块具体用于:
将所述特征数据、所述预测模型以及所述第一危险度输入解释模型,获取所述解释模型的输出结果;
根据所述输出结果,确定所述多种类型的驾驶特征各自对应的第二危险度。
11.根据权利要求10所述的装置,其特征在于,所述第一危险度用于指示所述第一驾驶员在未来预设时长内发生交通事故的频率;每种类型的驾驶特征对应的第二危险度用于指示该类型的驾驶特征对所述第一危险度的贡献值。
12.根据权利要求11所述的装置,其特征在于,所述装置还包括:
展示模块,用于根据所述第一危险度以及所述多种类型的驾驶特征各自对应的第二危险度,生成展示信息;并对所述展示信息进行展示。
13.根据权利要求9至12任一项所述的装置,其特征在于,所述获取模块具体用于:
根据所述第一驾驶员的历史驾驶数据,获取多种维度的特征数据;其中,每种维度的特征数据包括至少一种类型的所述驾驶特征对应的数据,所述多种维度包括下述维度中的至少两种:属性维度、业务维度、事故维度、驾驶行为维度。
14.根据权利要求13所述的装置,其特征在于,所述预测模块具体用于:
对所述多种维度的特征数据进行预处理,以使所述预处理后的特征数据满足预设分布;
将所述预处理后的特征数据输入所述预测模型,根据所述预测模型的输出结果得到所述第一驾驶员的第一危险度。
15.根据权利要求9至12任一项所述的装置,其特征在于,所述预测模型是通过如下训练方法得到的:
获取多个第二驾驶员在第一历史时间段内的特征数据,以及在第二历史时间段内的事故数据,所述第二历史时间段位于所述第一历史时间段之后;
将每个第二驾驶员在第一历史时间段内的特征数据作为训练样本,并根据该第二驾驶员在第二历史时间段内的事故数据,确定所述训练样本的标签;
根据所述训练样本以及所述标签,对待训练的预测模型进行有监督的训练,得到训练后的所述预测模型。
16.根据权利要求10至12任一项所述的装置,其特征在于,所述预测模型为广义线性模型GLM,所述解释模型为SHAP模型。
17.一种电子设备,其特征在于,包括:存储器和处理器,所述存储器用于存储计算机程序,所述处理器运行所述计算机程序执行如权利要求1至8任一项所述的方法。
18.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括计算机程序,所述计算机程序被处理器执行时实现如权利要求1至8任一项所述的方法。
CN202010819432.0A 2020-08-14 2020-08-14 数据处理方法、装置及设备 Pending CN111959518A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010819432.0A CN111959518A (zh) 2020-08-14 2020-08-14 数据处理方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010819432.0A CN111959518A (zh) 2020-08-14 2020-08-14 数据处理方法、装置及设备

Publications (1)

Publication Number Publication Date
CN111959518A true CN111959518A (zh) 2020-11-20

Family

ID=73366126

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010819432.0A Pending CN111959518A (zh) 2020-08-14 2020-08-14 数据处理方法、装置及设备

Country Status (1)

Country Link
CN (1) CN111959518A (zh)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002260146A (ja) * 2001-03-02 2002-09-13 Toyota Central Res & Dev Lab Inc 運転者危険認知特性記憶方法、運転者危険度演算装置、運転能力診断・評価装置、及び車両用予防安全装置
JP2011210095A (ja) * 2010-03-30 2011-10-20 Toyota Motor Corp 運転支援装置
CN106240571A (zh) * 2016-08-03 2016-12-21 东软集团股份有限公司 驾驶行为分析方法和装置
CN106585635A (zh) * 2016-11-25 2017-04-26 东软集团股份有限公司 驾驶行为评分方法和装置
CN106952002A (zh) * 2017-04-05 2017-07-14 南京人人保网络技术有限公司 基于驾驶行为的驾驶风险评估方法及装置
CN110288096A (zh) * 2019-06-28 2019-09-27 江苏满运软件科技有限公司 预测模型训练及预测方法、装置、电子设备、存储介质
CN111144718A (zh) * 2019-12-12 2020-05-12 支付宝(杭州)信息技术有限公司 基于私有数据保护的风险决策方法、装置、系统及设备
CN111164660A (zh) * 2017-10-06 2020-05-15 索尼公司 信息处理装置、信息处理方法和程序
CN111160473A (zh) * 2019-12-30 2020-05-15 深圳前海微众银行股份有限公司 一种分类标签的特征挖掘方法及装置
CN111325353A (zh) * 2020-02-28 2020-06-23 深圳前海微众银行股份有限公司 训练数据集的贡献度计算方法、装置、设备及存储介质
US20200249671A1 (en) * 2019-01-31 2020-08-06 StradVision, Inc. Learning method and learning device for providing functional safety by warning driver about potential dangerous situation by using explainable ai which verifies detection processes of autonomous driving network, and testing method and testing device using the same

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002260146A (ja) * 2001-03-02 2002-09-13 Toyota Central Res & Dev Lab Inc 運転者危険認知特性記憶方法、運転者危険度演算装置、運転能力診断・評価装置、及び車両用予防安全装置
JP2011210095A (ja) * 2010-03-30 2011-10-20 Toyota Motor Corp 運転支援装置
CN106240571A (zh) * 2016-08-03 2016-12-21 东软集团股份有限公司 驾驶行为分析方法和装置
CN106585635A (zh) * 2016-11-25 2017-04-26 东软集团股份有限公司 驾驶行为评分方法和装置
CN106952002A (zh) * 2017-04-05 2017-07-14 南京人人保网络技术有限公司 基于驾驶行为的驾驶风险评估方法及装置
CN111164660A (zh) * 2017-10-06 2020-05-15 索尼公司 信息处理装置、信息处理方法和程序
US20200249671A1 (en) * 2019-01-31 2020-08-06 StradVision, Inc. Learning method and learning device for providing functional safety by warning driver about potential dangerous situation by using explainable ai which verifies detection processes of autonomous driving network, and testing method and testing device using the same
CN110288096A (zh) * 2019-06-28 2019-09-27 江苏满运软件科技有限公司 预测模型训练及预测方法、装置、电子设备、存储介质
CN111144718A (zh) * 2019-12-12 2020-05-12 支付宝(杭州)信息技术有限公司 基于私有数据保护的风险决策方法、装置、系统及设备
CN111160473A (zh) * 2019-12-30 2020-05-15 深圳前海微众银行股份有限公司 一种分类标签的特征挖掘方法及装置
CN111325353A (zh) * 2020-02-28 2020-06-23 深圳前海微众银行股份有限公司 训练数据集的贡献度计算方法、装置、设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
何龙: "《深入理解XGBoost 高效机器学习算法与进阶》", 31 January 2020, 机械工业出版社 *

Similar Documents

Publication Publication Date Title
US11164238B1 (en) Cross selling recommendation engine
US10078871B2 (en) Systems and methods to identify and profile a vehicle operator
Eling et al. The impact of telematics on the insurability of risks
CN107862339B (zh) 用于输出信息的方法和装置
CN112990294B (zh) 行为判别模型的训练方法、装置、电子设备及存储介质
WO2011094428A1 (en) Evaluating statistical significance of test statistics using placebo actions
US12038294B2 (en) Machine learning platform for dynamic device and sensor quality evaluation
CN111260484A (zh) 一种人伤识别的数据处理方法、装置、服务器及系统
US12131377B2 (en) Heuristic credit risk assessment engine
CN113423063A (zh) 基于车载t-box的车辆监控方法、装置、车辆及介质
CN111582589A (zh) 一种租车出险预测方法、装置、设备及存储介质
US20240257264A1 (en) Systems and methods to remotely monitor machine usage
Jiang et al. Auto Insurance Pricing Using Telematics Data: Application of a Hidden Markov Model
CN112508692A (zh) 基于卷积神经网络的资源回收风险预测方法、装置和电子设备
CN111959518A (zh) 数据处理方法、装置及设备
CN111861757A (zh) 一种融资匹配方法、系统、设备和存储介质
CN116934505A (zh) 车险理赔风险识别方法、装置、设备及存储介质
US12106617B2 (en) Method and system for auto generating automotive data quality marker
CN115797084A (zh) 基于车主驾驶行为的投保定价指导方法及其相关设备
CN111127057A (zh) 一种多维用户画像恢复方法
CN116615772A (zh) 生成驾驶建议的方法、装置、设备和存储介质
EP2608002A1 (en) Method for determining a reading speed of a section of an electronic content
CN115619572A (zh) 车险报价方法、装置、设备及存储介质
CN114662005A (zh) 用户行为轨迹的消息推送方法、装置、设备及存储介质
CN114662794A (zh) 企业违约风险的预测方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20201120