CN113096405B - 预测模型的构建方法、车辆事故预测方法及装置 - Google Patents

预测模型的构建方法、车辆事故预测方法及装置 Download PDF

Info

Publication number
CN113096405B
CN113096405B CN202110644958.4A CN202110644958A CN113096405B CN 113096405 B CN113096405 B CN 113096405B CN 202110644958 A CN202110644958 A CN 202110644958A CN 113096405 B CN113096405 B CN 113096405B
Authority
CN
China
Prior art keywords
data
determining
training set
vehicle
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110644958.4A
Other languages
English (en)
Other versions
CN113096405A (zh
Inventor
徐显杰
付成祥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin Soterea Automotive Technology Co Ltd
Zhejiang Suoto Ruian Technology Group Co Ltd
Original Assignee
Tianjin Soterea Automotive Technology Co Ltd
Zhejiang Suoto Ruian Technology Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin Soterea Automotive Technology Co Ltd, Zhejiang Suoto Ruian Technology Group Co Ltd filed Critical Tianjin Soterea Automotive Technology Co Ltd
Priority to CN202110644958.4A priority Critical patent/CN113096405B/zh
Publication of CN113096405A publication Critical patent/CN113096405A/zh
Application granted granted Critical
Publication of CN113096405B publication Critical patent/CN113096405B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing
    • G08G1/0129Traffic data processing for creating historical data or processing based on historical data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • G06Q50/40
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing
    • G08G1/0133Traffic data processing for classifying traffic situation
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0137Measuring and analyzing of parameters relative to traffic conditions for specific applications
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Abstract

本发明涉及一种预测模型的构建方法、车辆事故预测方法及装置。该构建方法包括以下步骤:根据第一数据,确定仅包含核心特征的训练集;所述第一数据为历史事故记录信息中,第一设定时间内的司机行为信息、车辆行驶信息、车辆报警信息和环境信息;采用仅包含核心特征的训练集对聚类分析模型进行训练;根据车辆事故的预测结果,优化聚类分析模型,确定优化后的聚类分析模型为预测模型;其中,所述车辆事故的预测结果是所述训练后的聚类分析模型对第二数据进行预测得到。该方法综合考量了事故发生前的多种信息,并通过采用车辆事故的预测的方式,优化聚类分析模型,使得所构建的预测模型精准可靠,对于各种复杂情况下的潜在事故均能有效预测。

Description

预测模型的构建方法、车辆事故预测方法及装置
技术领域
本发明涉及智能交通控制领域,具体而言,涉及一种预测模型的构建方法、车辆事故预测方法及装置。
背景技术
随着社会的发展,交通设施愈加发达,人们的出行需求也不断提高,但是随之而来的交通安全问题也越来越多。传统的车辆事故预防措施包括被动安全系统与主动安全系统,然而无论是主动安全系统还是被动安全系统,其对事故发生的介入均较晚,均无法对事故进行有效预测。随着科技的不断进步以及人们对车辆功能需求的不断增加,开发一种可进行事故预测的预防式安全系统变得越来越紧迫。
有鉴于此,特提出本发明。
发明内容
本发明的目的在于提供一种预测模型的构建方法、车辆事故预测方法及装置,以实现对车辆事故进行准确预测的效果。
为了实现上述目的,本发明采用以下技术方案:
第一方面,本发明提供了一种预测模型的构建方法,包括以下步骤:
根据第一数据,确定仅包含核心特征的训练集;所述第一数据为历史事故记录信息中,第一设定时间内的司机行为信息、车辆行驶信息、车辆报警信息和环境信息;
采用仅包含核心特征的训练集对聚类分析模型进行训练;
根据车辆事故的预测结果,优化聚类分析模型,确定优化后的聚类分析模型为预测模型;
其中,所述车辆事故的预测结果是所述训练后的聚类分析模型对第二数据进行预测得到,所述第二数据为第二设定时间内的司机行为信息、车辆行驶信息、车辆报警信息和环境信息。
作为进一步优选的技术方案,所述根据第一数据,确定仅包含核心特征的训练集,包括:
根据第一数据与第一因素,确定第三数据;所述第一因素用于将第一数据中的各个特征的数值处理为处于同一量纲下的数值;
根据第三数据,确定包含所有特征的训练集;
根据包含所有特征的训练集,确定仅包含核心特征的训练集。
作为进一步优选的技术方案,所述根据第三数据,确定包含所有特征的训练集,包括:
根据第三数据和数据标准化处理方式,确定包含所有特征的训练集。
作为进一步优选的技术方案,所述根据包含所有特征的训练集,确定仅包含核心特征的训练集,包括:
采用包含所有特征的训练集对随机森林模型进行训练,确定所有特征的权重,根据所述权重,确定车辆事故相关特征;
对所述车辆事故相关特征进行特征降维,确定仅包含核心特征的训练集。
作为进一步优选的技术方案,在所述采用仅包含核心特征的训练集对聚类分析模型进行训练之后,还包括:
采用验证集对训练后的聚类分析模型进行验证,所述验证集为第四数据,所述第四数据为所述第一数据经特征降维得到的数据。
第二方面,本发明提供了一种车辆事故预测方法,包括以下步骤:
对待测试数据进行特征降维,确定测试集;所述待测试数据为待测试时间段内的司机行为信息、车辆行驶信息、车辆报警信息和环境信息;
根据所述测试集和上述的预测模型的构建方法得到的预测模型,确定车辆事故预测结果。
第三方面,本发明提供了一种预测模型的构建装置,包括:
仅包含核心特征的训练集确定模块,用于根据第一数据,确定仅包含核心特征的训练集;所述第一数据为历史事故记录信息中,第一设定时间内的司机行为信息、车辆行驶信息、车辆报警信息和环境信息;
聚类分析模型训练模块,用于采用仅包含核心特征的训练集对聚类分析模型进行训练;
预测模型确定模块,用于根据车辆事故的预测结果,优化聚类分析模型,确定优化后的聚类分析模型为预测模型;其中,所述车辆事故的预测结果是所述训练后的聚类分析模型对第二数据进行预测得到,所述第二数据为第二设定时间内的司机行为信息、车辆行驶信息、车辆报警信息和环境信息。
第四方面,本发明提供了一种车辆事故预测装置,包括:
测试集确定模块,用于对待测试数据进行特征降维,确定测试集;所述待测试数据为待测试时间段内的司机行为信息、车辆行驶信息、车辆报警信息和环境信息;
车辆事故预测结果输出模块,用于根据所述测试集和上述的预测模型的构建方法得到的预测模型,确定车辆事故预测结果。
第五方面,本发明提供了一种电子设备,包括:
至少一个处理器,以及与所述至少一个处理器通信连接的存储器;
其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述预测模型的构建方法或车辆事故预测方法。
第六方面,本发明提供了一种计算机可读介质,所述介质上存储有计算机指令,所述计算机指令用于使所述计算机执行上述的预测模型的构建方法或车辆事故预测方法。
与现有技术相比,本发明的有益效果为:
本发明提供的预测模型的构建方法中首先根据历史事故记录信息中第一设定时间内的司机行为信息、车辆行驶信息、车辆报警信息和环境信息,确定仅包含核心特征的训练集,以上各个信息全面,因而有利于对事故发生前的多种特征进行综合考量,进而有利于提高预测模型的可靠性;再采用仅包含核心特征的训练集对聚类分析模型进行训练,本方法中的各个数据信息大多属于不同的类型,聚类分析模型可对各个不同类型的数据信息进行可靠的分类,并训练出可对车辆事故进行预测的聚类分析模型;最后通过采用车辆事故的预测的方式,优化聚类分析模型,确定优化后的聚类分析模型为预测模型,可在真实场景中有效提高预测模型的准确性。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本实施例提供的一种预测模型的构建方法的流程图;
图2是本实施例提供的另一种预测模型的构建方法的流程图;
图3是本实施例提供的另一种预测模型的构建方法的流程图;
图4是本实施例提供的一种车辆事故预测方法的流程图;
图5是本实施例提供的一种预测模型的构建装置的结构示意图;
图6是本实施例提供的一种车辆事故预测装置的结构示意图;
图7是本实施例提供的电子设备的结构示意图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
图1是本实施例提供的预测模型的构建方法的流程图,本实施例适用于构建车辆事故预测模型,也适用于构建与车辆事故相关的其他预测模型(如事故发生后人员伤亡预测模型)。该方法可以由预测模型的构建装置来执行,该装置可以由软件和/或硬件构成,并一般集成在电子设备中。
参见图1,该预测模型的构建方法包括以下步骤:
S110、根据第一数据,确定仅包含核心特征的训练集;所述第一数据为历史事故记录信息中,第一设定时间内的司机行为信息、车辆行驶信息、车辆报警信息和环境信息。
其中,上述“历史事故记录信息”是指车辆历史阶段所发生的事故的记录信息,其来源于车主自行上报的事故记录信息和保险公司上报的事故记录信息。
上述“第一设定时间”是指事故发生前的一定时间内,例如3~5天。
上述“司机行为信息”是指车辆在行驶过程中发生的与司机行为有关的信息,例如眨眼、闭眼、打哈欠、接打电话、急加速操作、急减速操作、急转弯操作等。
上述“车辆行驶信息”是指与车辆行驶有关的信息,例如车辆急加速、车辆急减速、车辆急转弯、车辆跟车距离过近等。
上述“车辆报警信息”是指车辆在行驶过程中发出的报警信息,例如前车碰撞报警、车辆偏离报警、疲劳驾驶报警等。
上述“环境信息”是指车辆行驶时所处环境的信息,例如天气、行人、车辆、隔离带、障碍物等。
上述“仅包含核心特征的训练集”是指仅保留了核心特征的训练集,其中核心特征是指在历史事故记录信息中所出现的所有特征中,出现的百分比超出设定百分比的特征,这些特征对事故发生的影响较大,也就是说在这些特征出现时,发生事故的可能性很大。
具体的,所述根据第一数据,确定仅包含核心特征的训练集,包括:获取第一数据的所有特征中,出现百分比超出设定百分比的特征,将仅包含这些特征的事故的集合作为仅包含核心特征的训练集。
S120、采用所述仅包含核心特征的训练集对聚类分析模型进行训练。
上述“聚类分析模型”是指将物理或抽象对象的集合分组为由类似的对象组成的多个类的分析过程的模型,例如GMM(Gaussian Mixed Model,高斯混合模型)或K-means(K均值)模型。
本发明的发明人经过大量的试验发现,对聚类分析模型进行训练最终得到的预测模型的准确性是最高的,其他模型的准确性均比较低。对于采用仅包含核心特征的训练集对聚类分析模型进行训练采用本领域可实现的任意一种即可,本实施例对此不做特别限制。
S130、根据车辆事故的预测结果,优化聚类分析模型,确定优化后的聚类分析模型为预测模型。
其中,所述车辆事故的预测结果是所述训练后的聚类分析模型对第二数据进行预测得到,所述第二数据为第二设定时间内的司机行为信息、车辆行驶信息、车辆报警信息和环境信息。
上述“第二设定时间”是指车辆事故预测前的一定时间,例如3~5天。
上述司机行为信息、车辆行驶信息、车辆报警信息和环境信息与前述相同,此处不再赘述。
本步骤根据车辆事故的预测结果,对聚类分析模型进行了相应的优化,由此提高预测模型的精度。
具体的,根据车辆事故的预测结果,优化聚类分析模型,确定优化后的聚类分析模型为预测模型,包括:
将第二数据输入到训练后的聚类分析模型中,验证该模型输出的预测结果与真实发生的事故的匹配程度;然后调整聚类分析模型的参数,再次输入第二数据,选取匹配程度最高的参数所对应的模型为预测模型。
例如,若聚类分析模型采用K-means模型,则以上步骤包括:
将第二数据输入到训练后的K-means模型中,训练后的K-means模型输出预测结果,以及SSE(Sum of Square due to Error,误差平方和)、SC(Silhouette Cofficient,轮廓系数)、精准率(或称为查准率)和召回率(或称为查全率)。其中,SSE越小,说明模型越精准;SC越接近于1,说明模型越精准;精准率越高,说明模型越精准;查全率越高,说明模型越精准。以上SSE、SC、精准率和召回率是训练后的K-means模型自动输出的。
上述SSE是通过计算当前迭代得到的中心位置到各自中心点簇(该中心点簇是模型自动识别出来的)的欧式距离总和进行SSE计算,SSE越小表示当前的分类效果越好,该指标用于表征每个簇内部样本的紧密程度。
调整K-means模型的参数(K值),再次输入第二数据,选取匹配程度最高的参数所对应的模型为预测模型。在选取匹配程度最高的参数所对应的模型时,以提高精准率为主,综合考虑召回率、SSE和SC,如果模型精准率、召回率、SSE和SC均较好,则说明该参数对应的模型的匹配程度高,最终选取匹配程度最高的参数所对应的模型为预测模型。
上述预测模型的构建方法中首先根据历史事故记录信息中第一设定时间内的司机行为信息、车辆行驶信息、车辆报警信息和环境信息,确定仅包含核心特征的训练集,以上各个信息全面,因而有利于对事故发生前的多种特征进行综合考量,进而有利于提高预测模型的可靠性;再采用仅包含核心特征的训练集对聚类分析模型进行训练,本方法中的各个数据信息大多属于不同的类型,聚类分析模型可对各个不同类型的数据信息进行可靠的分类,并训练出可对车辆事故进行预测的聚类分析模型;最后通过采用车辆事故的预测的方式,优化聚类分析模型,确定优化后的聚类分析模型为预测模型,可在真实场景中有效提高预测模型的准确性。
图2提供了本实施例另一种预测模型的构建方法的流程图,本方法对上述实施例中S110进行了进一步优化,该方法包括以下步骤:
S111、根据第一数据与第一因素,确定第三数据;所述第一因素用于将第一数据中的各个特征的数值处理为处于同一量纲下的数值。
上述第一因素例如为里程或行驶时间。
具体的,所述根据第一数据与第一因素,确定第三数据,包括:
统计百公里里程内第一数据中各个特征发生的次数,确定第三数据;
或统计1个月内第一数据中各个特征发生的次数,确定第三数据。
S112、根据第三数据,确定包含所有特征的训练集。
其中,所有特征是指历史事故记录信息中所出现的全部特征。
具体的,所述根据第三数据,确定包含所有特征的训练集,包括:
去除第三数据中的异常点,得到包含所有特征的训练集。
优选地,所述根据第三数据,确定包含所有特征的训练集,包括:
对第三数据进行标准化处理,确定包含所有特征的训练集。
数据标准化处理方式是指将数据按比例缩放,使之落到一个较小的特定空间中,本实施例对数据标准化处理的具体方式不做特别限制,采用本领域可实现的即可,例如离差标准化、正规化或均一化等。本优选方式将第三数据进行标准化处理之后,可使仅包含核心特征的训练集整体更加规范,有利于进一步提高预测模型的精度。
根据包含所有特征的训练集,确定仅包含核心特征的训练集。
可选地,所述根据包含所有特征的训练集,确定仅包含核心特征的训练集,包括:对包含所有特征的训练集进行特征筛选,得到仅包含核心特征的训练集。
上述“特征筛选”是指对设定时间内的司机行为信息、车辆行驶信息、车辆报警信息和环境信息中的特征进行筛选,以将其中的无效或冗余特征排除,把有用的核心特征保留作为模型训练数据。
其中“特征”是指司机行为信息中的司机行为特征、车辆行驶信息中的车辆行驶特征、车辆报警信息中的车辆报警特征和环境信息中的环境特征。
具体的,对包含所有特征的训练集进行特征筛选,得到仅包含核心特征的训练集,包括:
采用单变量特征选择的方法对包含所有特征的训练集进行特征筛选,确定包含所有特征的训练集中各个特征的距离相关系数;根据所述距离相关系数,确定仅包含核心特征的训练集。
该方式采用单变量特征选择的方法进行特征筛选,方法成熟简便。此外,还可采用去掉取值变化小的特征方法或正则化模型来进行特征筛选,均可实现相应效果。
可选地,所述根据包含所有特征的训练集,确定仅包含核心特征的训练集,包括:采用所述包含所有特征的训练集对神经网络模型进行训练,确定所有特征的权重,根据所述权重,确定车辆事故相关特征;对所述车辆事故相关特征进行特征降维,确定所述仅包含核心特征的训练集。
优选地,根据包含所有特征的训练集,确定仅包含核心特征的训练集包括:S1131、采用所述包含所有特征的训练集对随机森林模型进行训练,确定所有特征的权重,根据所述权重,确定车辆事故相关特征。
其中,“所有特征的权重”是指训练集中每个特征的权重。
根据所述权重,确定车辆事故相关特征,包括:提取权重为设定百分比以上的特征,确定该特征为车辆事故相关特征。
本步骤采用随机森林模型对包含所有特征的训练集进行训练,随机森林模型采用集成算法,精度和准确性高,通过其Gini指数(基尼指数)可得出各个特征的权重。本步骤从所有特征中选取出权重在设定百分比以上的特征,并认定该特征为车辆事故相关特征,以上相关特征的权重相对较高,说明其与车辆事故的发生的相关性较大。
S1132、对所述车辆事故相关特征进行特征降维,确定仅包含核心特征的训练集。
上述“特征降维”是指减少特征的个数,以只保留占比在设定百分比以上且独立的特征。
本实施例对具体的特征降维方式不做特别限制,采用本领域可实现的即可,例如通过采用特征选择-过滤式-低方差过滤的方式或特征选择-过滤式-相关系数的方式。优选地,采用PCA(Principal Component Analysis,主成分分析)算法进行特征降维。
S120、采用所述仅包含核心特征的训练集对聚类分析模型进行训练。
S130、根据车辆事故的预测结果,优化聚类分析模型,确定优化后的聚类分析模型为预测模型。
S120和S130与上述实施例中的相同,此处不再赘述。
本实施例通过采用随机森林模型训练,确定出车辆事故相关特征,再经特征降维后得到仅包含核心特征的训练集,该方式可减少运算,提高计算效率,同时提高预测模型的精度。
图3提供了本实施例另一种预测模型的构建方法的流程图,本方法在上述实施例的基础上进一步增加了步骤,该方法包括以下步骤:
S111、根据第一数据与第一因素,确定第三数据;所述第一因素用于将第一数据中的各个特征的数值处理为处于同一量纲下的数值。
S112、根据第三数据,确定包含所有特征的训练集。
S1131、采用所述包含所有特征的训练集对随机森林模型进行训练,确定所有特征的权重,根据所述权重,确定车辆事故相关特征。
S1132、对所述车辆事故相关特征进行特征降维,确定仅包含核心特征的训练集。
S120、采用仅包含核心特征的训练集对聚类分析模型进行训练。
S140、采用验证集对训练后的聚类分析模型进行验证,所述验证集为第四数据,所述第四数据为所述第一数据经特征降维得到的数据。
本步骤采用验证集对训练后的聚类分析模型进行了验证,从而在真实预测前即可提高模型的精确性。需要说明的是,本步骤可不仅对历史车辆事故中的某一次进行预测,优选对多次历史车辆事故进行预测,即本步骤可循环进行,在实际预测中不断修正优化模型,由此提高预测模型的精确性。
S130、根据车辆事故的预测结果,优化聚类分析模型,确定优化后的聚类分析模型为预测模型。
本实施例增加了对训练后的聚类分析模型进行验证的步骤,进一步提高了预测模型的精确性。
图4是本实施例提供的一种车辆事故预测方法的流程图,本实施例适用于在车辆行驶过程中对车辆事故进行预测,也适用于对车辆事故相关的其他事件进行预测(如事故发生后人员伤亡的预测)。该方法可以由车辆事故预测装置来执行,该装置可以由软件和/或硬件构成,并一般集成在电子设备中。
参见图1,该车辆事故预测方法包括以下步骤:
S210、对待测试数据进行特征降维,确定测试集;所述待测试数据为待测试时间段内的司机行为信息、车辆行驶信息、车辆报警信息和环境信息。
上述“待测试时间段”是指本次预测前的一定时间,例如3~5天。
上述司机行为信息、车辆行驶信息、车辆报警信息和环境信息与前述实施例中的相同,此处不再赘述。
S220、根据所述测试集和上述的预测模型的构建方法得到的预测模型,确定车辆事故预测结果。
该方法直接对待测试数据进行特征降维,特征降维的方式与前述实施例中相同,得到测试集,然后根据和上述实施例得到的预测模型(例如将测试集输入到上述预测模型中,由预测模型输出预测结果),确定车辆事故预测结果,由此准确发现潜在的危险情况,给予司机相应的提醒,避免事故发生。该预测结果可以采用屏幕显示、警报音、语音或座椅震动等多种形式给出。
图5是本实施例提供的一种预测模型的构建装置,包括:
仅包含核心特征的训练集确定模块101,用于根据第一数据,确定仅包含核心特征的训练集;所述第一数据为历史事故记录信息中,第一设定时间内的司机行为信息、车辆行驶信息、车辆报警信息和环境信息。
聚类分析模型训练模块102,用于采用所述仅包含核心特征的训练集对聚类分析模型进行训练。
预测模型确定模块103,用于根据车辆事故的预测结果,优化聚类分析模型,确定优化后的聚类分析模型为预测模型;其中,所述车辆事故的预测结果是所述训练后的聚类分析模型对第二数据进行预测得到,所述第二数据为第二设定时间内的司机行为信息、车辆行驶信息、车辆报警信息和环境信息。
可选的,所述仅包含核心特征的训练集确定模块101包括:
第三数据确定单元,用于根据第一数据与第一因素,确定第三数据;所述第一因素用于将第一数据中的各个特征的数值处理为处于同一量纲下的数值;
包含所有特征的训练集确定单元,用于根据第三数据,确定包含所有特征的训练集;
仅包含核心特征的训练集确定单元,用于根据所述包含所有特征的训练集,确定所述仅包含核心特征的训练集。
可选的,所述仅包含核心特征的训练集确定单元包括:
车辆事故相关特征确定组,用于采用所述包含所有特征的训练集对随机森林模型进行训练,确定所有特征的权重,根据所述权重,确定车辆事故相关特征;
仅包含核心特征的训练集确定组,用于对所述车辆事故相关特征进行特征降维,确定仅包含核心特征的训练集。
可选的,所述装置还包括验证模块,用于在所述采用仅包含核心特征的训练集对聚类分析模型进行训练之后,采用验证集对训练后的聚类分析模型进行验证,所述验证集为第四数据,所述第四数据为所述第一数据经特征降维得到的数据。
本实施例用于执行上述实施例的预测模型的构建方法,因而至少具有与该方法相对应的功能模块和有益效果。
图6是本实施例提供的一种车辆事故预测装置,包括:
测试集确定模块201,用于对待测试数据进行特征降维,确定测试集;所述待测试数据为待测试时间段内的司机行为信息、车辆行驶信息、车辆报警信息和环境信息。
车辆事故预测结果输出模块202,用于根据所述测试集和上述实施例的预测模型的构建方法得到的预测模型,确定车辆事故预测结果。
本实施例用于执行上述实施例的车辆事故预测方法,因而至少具有与该方法相对应的功能模块和有益效果。
图7是本实施例提供的一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述的预测模型的构建方法或车辆事故预测方法。该电子设备中的至少一个处理器能够执行上述方法,因而至少具有与上述方法相同的优势。
可选地,该电子设备中还包括用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI(Graphical UserInterface,图形用户界面)的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图7中以一个处理器301为例。
存储器302作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的预测模型的构建方法对应的程序指令/模块(例如,预测模型的构建装置中的仅包含核心特征的训练集确定模块101、聚类分析模型训练模块102和预测模型确定模块103)或本发明实施例中车辆事故预测方法对应的程序指令/模块。处理器301通过运行存储在存储器302中的软件程序、指令以及模块,从而执行设备的各种功能应用以及数据处理,即实现上述的预测模型的构建方法或车辆事故预测方法。
存储器302可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器302可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器302可进一步包括相对于处理器301远程设置的存储器,这些远程存储器可以通过网络连接至设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
该电子设备还可以包括:输入装置303和输出装置304。处理器301、存储器302、输入装置303和输出装置304可以通过总线或者其他方式连接,图7中以通过总线连接为例。
输入装置303可接收输入的数字或字符信息,输出装置304可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
本实施例还提供了一种计算机可读介质,所述介质上存储有计算机指令,所述计算机指令用于使所述计算机执行上述的预测模型的构建方法或车辆事故预测方法。该计算机可读介质上的计算机指令用于使计算机执行上述方法,因而至少具有与上述方法相同的优势。
本发明中的计算机可读介质,可以采用一个或多个计算机可读的介质的任意组合。介质可以是计算机可读信号介质或者计算机可读存储介质。介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、电线、光缆、RF(Radio Frequency,射频)等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
应该理解的是,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。

Claims (8)

1.一种预测模型的构建方法,其特征在于,包括以下步骤:
根据第一数据,确定仅包含核心特征的训练集;所述第一数据为历史事故记录信息中,第一设定时间内的司机行为信息、车辆行驶信息、车辆报警信息和环境信息;
采用所述仅包含核心特征的训练集对聚类分析模型进行训练;
根据车辆事故的预测结果,优化聚类分析模型,确定优化后的聚类分析模型为预测模型;
其中,所述车辆事故的预测结果是所述训练后的聚类分析模型对第二数据进行预测得到,所述第二数据为第二设定时间内的司机行为信息、车辆行驶信息、车辆报警信息和环境信息;
所述核心特征是指在历史事故记录信息中所出现的所有特征中,出现的百分比超出设定百分比的特征;
所述根据第一数据,确定仅包含核心特征的训练集,包括:
根据第一数据与第一因素,确定第三数据;所述第一因素用于将第一数据中的各个特征的数值处理为处于同一量纲下的数值;
根据第三数据,确定包含所有特征的训练集;
根据所述包含所有特征的训练集,确定所述仅包含核心特征的训练集;
所述根据所述包含所有特征的训练集,确定所述仅包含核心特征的训练集,包括:
采用所述包含所有特征的训练集对随机森林模型进行训练,确定所有特征的权重,根据所述权重,确定车辆事故相关特征;
对所述车辆事故相关特征进行特征降维,确定所述仅包含核心特征的训练集。
2.根据权利要求1所述的预测模型的构建方法,其特征在于,所述根据第三数据,确定包含所有特征的训练集,包括:
对第三数据进行标准化处理,确定所述包含所有特征的训练集。
3.根据权利要求1或2所述的预测模型的构建方法,其特征在于,在所述采用所述仅包含核心特征的训练集对聚类分析模型进行训练之后,还包括:
采用验证集对训练后的聚类分析模型进行验证,所述验证集为第四数据,所述第四数据为所述第一数据经特征降维得到的数据。
4.一种车辆事故预测方法,其特征在于,包括以下步骤:
对待测试数据进行特征降维,确定测试集;所述待测试数据为待测试时间段内的司机行为信息、车辆行驶信息、车辆报警信息和环境信息;
根据所述测试集和权利要求1-3任一项所述的预测模型的构建方法得到的预测模型,确定车辆事故预测结果。
5.一种预测模型的构建装置,其特征在于,包括:
仅包含核心特征的训练集确定模块,用于根据第一数据,确定仅包含核心特征的训练集;所述第一数据为历史事故记录信息中,第一设定时间内的司机行为信息、车辆行驶信息、车辆报警信息和环境信息;
聚类分析模型训练模块,用于采用所述仅包含核心特征的训练集对聚类分析模型进行训练;
预测模型确定模块,用于根据车辆事故的预测结果,优化聚类分析模型,确定优化后的聚类分析模型为预测模型;其中,所述车辆事故的预测结果是所述训练后的聚类分析模型对第二数据进行预测得到,所述第二数据为第二设定时间内的司机行为信息、车辆行驶信息、车辆报警信息和环境信息;
所述核心特征是指在历史事故记录信息中所出现的所有特征中,出现的百分比超出设定百分比的特征;
所述根据第一数据,确定仅包含核心特征的训练集,包括:
根据第一数据与第一因素,确定第三数据;所述第一因素用于将第一数据中的各个特征的数值处理为处于同一量纲下的数值;
根据第三数据,确定包含所有特征的训练集;
根据所述包含所有特征的训练集,确定所述仅包含核心特征的训练集;
所述根据所述包含所有特征的训练集,确定所述仅包含核心特征的训练集,包括:
采用所述包含所有特征的训练集对随机森林模型进行训练,确定所有特征的权重,根据所述权重,确定车辆事故相关特征;
对所述车辆事故相关特征进行特征降维,确定所述仅包含核心特征的训练集。
6.一种车辆事故预测装置,其特征在于,包括:
测试集确定模块,用于对待测试数据进行特征降维,确定测试集;所述待测试数据为待测试时间段内的司机行为信息、车辆行驶信息、车辆报警信息和环境信息;
车辆事故预测结果输出模块,用于根据所述测试集和权利要求1-3任一项所述的预测模型的构建方法得到的预测模型,确定车辆事故预测结果。
7.一种电子设备,其特征在于,包括:
至少一个处理器,以及与所述至少一个处理器通信连接的存储器;
其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-3任一项所述的预测模型的构建方法或权利要求4所述的车辆事故预测方法。
8.一种计算机可读介质,其特征在于,所述介质上存储有计算机指令,所述计算机指令用于使所述计算机执行权利要求1-3任一项所述的预测模型的构建方法或权利要求4所述的车辆事故预测方法。
CN202110644958.4A 2021-06-10 2021-06-10 预测模型的构建方法、车辆事故预测方法及装置 Active CN113096405B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110644958.4A CN113096405B (zh) 2021-06-10 2021-06-10 预测模型的构建方法、车辆事故预测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110644958.4A CN113096405B (zh) 2021-06-10 2021-06-10 预测模型的构建方法、车辆事故预测方法及装置

Publications (2)

Publication Number Publication Date
CN113096405A CN113096405A (zh) 2021-07-09
CN113096405B true CN113096405B (zh) 2021-09-03

Family

ID=76665982

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110644958.4A Active CN113096405B (zh) 2021-06-10 2021-06-10 预测模型的构建方法、车辆事故预测方法及装置

Country Status (1)

Country Link
CN (1) CN113096405B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114155476B (zh) * 2022-02-07 2022-07-05 天津所托瑞安汽车科技有限公司 Aeb有效避免事故场景识别方法、装置、设备及介质

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4569798B2 (ja) * 2001-07-30 2010-10-27 マツダ株式会社 車両事故解析装置
CN106203626A (zh) * 2016-06-30 2016-12-07 北京奇虎科技有限公司 汽车驾驶行为检测方法及装置、汽车
CN106991510A (zh) * 2017-05-31 2017-07-28 福建江夏学院 一种基于时空分布特征预测城市交通事故的方法
CN107958269A (zh) * 2017-11-28 2018-04-24 江苏大学 一种基于隐马尔可夫模型的行车危险度预测方法
CN108154681A (zh) * 2016-12-06 2018-06-12 杭州海康威视数字技术股份有限公司 发生交通事故的风险预测方法、装置及系统
CN108510126A (zh) * 2018-04-11 2018-09-07 南京邮电大学 一种基于pca和bp神经网络的交通事故预测方法
CN109840612A (zh) * 2018-07-24 2019-06-04 上海赢科信息技术有限公司 用户驾驶行为分析方法及系统
CN109840660A (zh) * 2017-11-29 2019-06-04 北京四维图新科技股份有限公司 一种车辆特征数据处理方法及车辆风险预测模型训练方法
CN110070642A (zh) * 2019-03-22 2019-07-30 天津大学 一种基于深度学习的交通事故责任评估方法及装置
CN110276370A (zh) * 2019-05-05 2019-09-24 南京理工大学 一种基于随机森林的道路交通事故风险因素分析方法
CN110807930A (zh) * 2019-11-07 2020-02-18 中国联合网络通信集团有限公司 危险车辆预警方法及装置
CN111291916A (zh) * 2018-12-10 2020-06-16 北京嘀嘀无限科技发展有限公司 驾驶行为安全性预测方法、装置、电子设备及存储介质
CN112435462A (zh) * 2020-10-16 2021-03-02 同盾控股有限公司 短时交通流量预测的方法、系统、电子装置和存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101711028B1 (ko) * 2012-05-04 2017-03-13 한국전자통신연구원 클러스터링 기법을 이용한 차량 이상상태 모니터링 장치 및 그 방법
EP3481661A4 (en) * 2016-07-05 2020-03-11 Nauto, Inc. AUTOMATIC DRIVER IDENTIFICATION SYSTEM AND METHOD
CN110021147A (zh) * 2019-05-07 2019-07-16 四川九洲视讯科技有限责任公司 一种基于机器学习和数值标定的疲劳驾驶检测方法
US11625624B2 (en) * 2019-09-24 2023-04-11 Ford Global Technologies, Llc Vehicle-to-everything (V2X)-based real-time vehicular incident risk prediction
CN111452619B (zh) * 2020-01-22 2021-09-14 北京理工大学 电动车辆在线能耗预测方法及系统

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4569798B2 (ja) * 2001-07-30 2010-10-27 マツダ株式会社 車両事故解析装置
CN106203626A (zh) * 2016-06-30 2016-12-07 北京奇虎科技有限公司 汽车驾驶行为检测方法及装置、汽车
CN108154681A (zh) * 2016-12-06 2018-06-12 杭州海康威视数字技术股份有限公司 发生交通事故的风险预测方法、装置及系统
CN106991510A (zh) * 2017-05-31 2017-07-28 福建江夏学院 一种基于时空分布特征预测城市交通事故的方法
CN107958269A (zh) * 2017-11-28 2018-04-24 江苏大学 一种基于隐马尔可夫模型的行车危险度预测方法
CN109840660A (zh) * 2017-11-29 2019-06-04 北京四维图新科技股份有限公司 一种车辆特征数据处理方法及车辆风险预测模型训练方法
CN108510126A (zh) * 2018-04-11 2018-09-07 南京邮电大学 一种基于pca和bp神经网络的交通事故预测方法
CN109840612A (zh) * 2018-07-24 2019-06-04 上海赢科信息技术有限公司 用户驾驶行为分析方法及系统
CN111291916A (zh) * 2018-12-10 2020-06-16 北京嘀嘀无限科技发展有限公司 驾驶行为安全性预测方法、装置、电子设备及存储介质
CN110070642A (zh) * 2019-03-22 2019-07-30 天津大学 一种基于深度学习的交通事故责任评估方法及装置
CN110276370A (zh) * 2019-05-05 2019-09-24 南京理工大学 一种基于随机森林的道路交通事故风险因素分析方法
CN110807930A (zh) * 2019-11-07 2020-02-18 中国联合网络通信集团有限公司 危险车辆预警方法及装置
CN112435462A (zh) * 2020-10-16 2021-03-02 同盾控股有限公司 短时交通流量预测的方法、系统、电子装置和存储介质

Also Published As

Publication number Publication date
CN113096405A (zh) 2021-07-09

Similar Documents

Publication Publication Date Title
US11878720B2 (en) Method and system for risk modeling in autonomous vehicles
US10703381B2 (en) Intelligent vehicle action decisions
CN112700072B (zh) 交通状况预测方法、电子设备和存储介质
US20190101914A1 (en) Data Processing System with Machine Learning Engine for Providing Driving Data Analysis and Vehicle Control Functions
US20200184591A1 (en) System and Methods for Analyzing Roadside Assistance Service of Vehicles in Real Time
WO2019213177A1 (en) Vehicle telematic assistive apparatus and system
CN108182515B (zh) 智能规则引擎规则输出方法、设备及计算机可读存储介质
US20210107495A1 (en) Methods and systems for determining users' driving habits and pushing service information
CN110599353A (zh) 一种车辆出险和赔付率预测方法、装置、设备及介质
CN111951560B (zh) 服务异常检测方法、训练服务异常检测模型的方法和训练声音模型的方法
US11741763B2 (en) Systems and methods for system generated damage analysis
JP2021509978A (ja) 運転行為評価方法、装置及びコンピュータが読み取り可能な記憶媒体
CN115861983A (zh) 用于机械设备的智能化管理系统及其方法
CN113096405B (zh) 预测模型的构建方法、车辆事故预测方法及装置
CN111027859B (zh) 基于机动车状态监控数据挖掘的驾驶风险防范方法及系统
CN116385185A (zh) 一种车险评估辅助方法、装置、计算机设备及存储介质
CN115545276A (zh) 网约车异常订单的接单率预测方法及系统
Wang et al. Prediction-based reachability analysis for collision risk assessment on highways
CN115169996A (zh) 道路风险确定方法、设备和存储介质
CN114355793A (zh) 用于车辆仿真评测的自动驾驶规划模型的训练方法及装置
CN116567719B (zh) 数据传输方法、车载系统、设备和存储介质
US20240133702A1 (en) Method and system for selectively initiating actions in accordance with a driver risk analysis
CN115345247B (zh) 模型训练和公路轴载确定方法、装置、设备及介质
EP4312177A1 (en) Vehicle identification number modeling for telematics
CN116011800A (zh) 一种交通事件预警的方法及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant