CN109409430B - 交通事故数据智能分析与综合应用系统 - Google Patents

交通事故数据智能分析与综合应用系统 Download PDF

Info

Publication number
CN109409430B
CN109409430B CN201811264351.8A CN201811264351A CN109409430B CN 109409430 B CN109409430 B CN 109409430B CN 201811264351 A CN201811264351 A CN 201811264351A CN 109409430 B CN109409430 B CN 109409430B
Authority
CN
China
Prior art keywords
data
attribute
analysis
module
factor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811264351.8A
Other languages
English (en)
Other versions
CN109409430A (zh
Inventor
刘林
饶欢
陈凝
吕伟韬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Zhitong Traffic Technology Co ltd
Original Assignee
Jiangsu Zhitong Traffic Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Zhitong Traffic Technology Co ltd filed Critical Jiangsu Zhitong Traffic Technology Co ltd
Priority to CN201811264351.8A priority Critical patent/CN109409430B/zh
Publication of CN109409430A publication Critical patent/CN109409430A/zh
Priority to PCT/CN2019/113477 priority patent/WO2020083400A1/zh
Application granted granted Critical
Publication of CN109409430B publication Critical patent/CN109409430B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种交通事故数据智能分析与综合应用系统,包括数据对接模块、挖掘处理模块、交互模块、地图模块和数据分析模块,挖掘处理模块依据数据对接模块提取的交通事故数据,由交通事故数据因子重要度分析模型驱动数据处理,得到属性因子集合元素的重要度;数据分析模块接收交互模块的属性因子选择结果,以属性因子为数据分析角度,通过事故数据分析方式提供针对性地数据分析结果;该系统基于原始交通事故数据进行属性因子的重要度分析,配置了缺失数据估计策略,能够有效应对交通事故不同数据源提供的属性因子不一致的情况;从而从用户选择的样本数据中提取出带有交通事故重要信息的属性因子,并输出了定量化的重要度指标。

Description

交通事故数据智能分析与综合应用系统
技术领域
本发明涉及一种交通事故数据智能分析与综合应用系统。
背景技术
传统的交通事故数据应用方式比较单一,大多为定期的数据报表汇报,报表统计维度也较为固定,主要是根据管理经验中确定统计维度。
但事实上,交通事故记录数据包含了事故相关的人、车、路、环境等众多属性数据,除了常用的统计维度以外,还能够从大量数据中提取出更多有价值的信息,其中一点就是对属性特征与事故的关联性的分析,挖掘属性特征中携带的事故相关信息量。从目前的研究成果与应用现状来看,对于事故属性的分析在构建安全评价体系时多有体现,例如中国专利CN201610529822.8《一种基于人-车-路-货多风险源的货运安全评价模型》中采用了事故树方法对重要属性进行了筛选,但这种方法缺乏对属性定量化地标定;中国专利CN201410129672.2《一种道路交通安全评估方法及系统》也未明确事故属性的因子载荷确定方式。
属性因子的重要度是进行有针对性的事故数据分析应用的基础,而当前尚缺乏能够实现定量化属性因子重要度分析的方法;另一方面,在进行交通事故数据管理应用时手段也较为单一,大多忽略了对数据深层特征以及关联结论的挖掘。
发明内容
鉴于上述现状问题,本发明的目的是提供一种交通事故数据智能分析与综合应用系统解决现有技术中存在的当前尚缺乏能够实现定量化属性因子重要度分析的方法,在进行交通事故数据管理应用时手段也较为单一,大多忽略了对数据深层特征以及关联结论的挖掘的问题。
该种交通事故数据智能分析与综合应用系统,实现以数据为驱动的交通事故属性因子重要度提取,引导用户在进行事故数据分析应用时主动关注与事故发生结果密切相关的属性因子并由此展开深度分析,改变传统的固定式数据报表统计的应用模式,为交通安全的治理工作提供更具有针对性的信息与结论。
本发明的技术解决方案是:
一种交通事故数据智能分析与综合应用系统,包括数据对接模块、挖掘处理模块、交互模块、地图模块和数据分析模块,
数据对接模块:从交通事故数据库中提取指定条件的交通事故数据,并将提取的交通事故数据发送给数据对接模块;
挖掘处理模块:依据数据对接模块提取的交通事故数据,由交通事故数据因子重要度分析模型驱动数据处理,得到属性因子集合元素的重要度;
交互模块:接收挖掘处理模块得到的属性因子集合以及重要度,并结合属性因子所属维度以及重要度数值大小进行可视化显示;还包括日期时间选择控件、属性因子选择控件;将已设置的时间传输至数据对接模块,选中的属性因子传输至数据分析模块,并接收数据分析模块的分析结果,以专用控件进行内容展示;
数据分析模块:接收交互模块的属性因子选择结果,以属性因子为数据分析角度,通过事故数据分析方式提供针对性地数据分析结果给交互模块与地图模块;
地图模块:包含地理信息数据,支持地图操作;与交互模块协同实现前端交互操作,并将数据分析模块输出的结果进行可视化呈现;还包括区域自定义工具,通过绘图设置目标区域,并将划定的区域空间坐标范围传输至数据对接模块。
进一步地,挖掘处理模块中,交通事故数据因子重要度分析模型驱动数据处理,得到属性因子集合元素的重要度,具体为,构建交通事故数据属性因子集合,配置缺失信息补全策略,根据属性因子级别以及数据缺失情况对属性因子进行缺失信息估计,在此基础上量化分析并输出属性因子集合元素的重要度。
进一步地,挖掘处理模块中交通事故数据因子重要度分析模型进行数据处理分析具体为:
S1、确定交通事故数据一级属性维度;
S2、根据交通事故数据的具体字段确定一级属性的二级属性集合,该属性集合为交通事故样本数据中二级属性因子全集,集合元素个数为NL(2);对二级属性因子进行三级拆解,获得三级属性因子全集,集合元素个数为NL(3),其中三级拆解根据二级属性因子的具体取值确定,离散属性变量即根据该变量的取值范围确定三级属性因子组成,连续属性则进行离散转换,再确定其三级属性因子组成;
S3、分别对二级属性因子全集、三级属性因子全集进行样本数据的分组合并,获得二级分组数量GN(2)及每组的样本量samplesize(2)、三级分组数量GN-(3)及每组的样本量samplesize(3);对于任一分组G(level)i,其属性因子包括步骤S2中的该级别全部属性以及样本量samplesize(level)i,其中level表征属性因子级别;
S4、检测分组G(level)i属性因子数据是否存在缺失的情况,若不存在则转入步骤S5;否则,配置缺失信息补全策略,根据属性因子级别以及数据缺失情况对属性因子进行缺失信息估计;
S5、基于分组合并数据构建随机森林回归模型,计算属性因子重要度。
进一步地,步骤S4具体为,
S41、序号j=1;
S42、检测属性因子aj是否存在数据缺失的情况,若存在,则计算其数据缺失率rj=mj/GN(level),mi为缺失该属性因子的分组数,level的取值根据aj的属性级别确定,进入步骤S43;否则进入步骤S44;
S43、若ri∈[thl,thu],则通过随机森林方法补充缺失信息,其中thl、thu分别为上下限阈值;
若ri∈[0,thl),则在后续分析中放弃该属性因子;
若ri∈(thu,1],则由统计值M进行缺失估计,统计值M在众数、平均数中选择;
S44、j<NL(level)是否成立?若成立,则j=j+1,回到步骤S42循环处理;若不成立,则检测是否仍存在带有缺失值的属性因子,若是则返回步骤S41循环处理,否则结束缺失估计流程。
进一步地,步骤S43中,通过随机森林方法补充缺失信息,具体为,在不存在缺失的样本分组中划分训练集与测试集,由训练集拟合缺失值属性因子与其他属性因子的关系,根据经由测试集测试通过的随机森林,对该分组后数据进行缺失补全,即将其他属性因子输入随机森林,输出的分类结果作为该属性因子的估计值。
进一步地,步骤S5具体为,随机森林回归模型中的决策树数量为NT,对于每一颗树使用袋外数据计算袋外误差error1;随机对袋外数据所有样本的属性因子at进行噪声干扰,计算袋外误差error2;属性因子at的重要度D(ak)=∑|error1-error2|/NT。
进一步地,数据对接模块中,指定条件指用户通过交互模块设置的时间范围以及通过地图模块设置的空间范围条件。
进一步地,数据分析模块采用的数据分析方式包括因素分析、对应分析、关联分析、定制报表。
进一步地,数据分析模块中,
因素分析:提取含有选中属性因子的所有数据样本,进行时间、空间维度的指标统计;
对应分析:以全部样本进行对应分析处理生成对应分析结论集合,包含对应分析二维散点图、属性因子对应分析结论,并从中提取含有选中属性因子的所有结论;
关联分析:以全部样本进行关联分析处理生成关联分析结论集合,包含关联关系以及提升度;根据接收到的条件属性因子、结果属性因子,提取条件、结果中包含对应属性因子的关联分析结论;
定制报表:根据接收到的若干属性因子,进行数据统计。
本发明的有益效果是:
一、该种交通事故数据智能分析与综合应用系统,基于原始交通事故数据进行属性因子的重要度分析,配置了缺失数据估计策略,能够有效应对交通事故不同数据源提供的属性因子不一致的情况;从而从用户选择的样本数据中提取出带有交通事故重要信息的属性因子,并输出了定量化的重要度指标。
二、该种交通事故数据智能分析与综合应用系统,对原始交通事故记录进行处理,提取出与交通事故发生结果具有较强相关性的属性因子,并提供可量化的属性因子重要度指标,进而向交通安全管理者提供重点关注属性因子信息,在此基础上实现针对性强且多样化的交通事故数据分析,对于实施主动式的交通安全管理具有现实指导意义。
三、该种交通事故数据智能分析与综合应用系统,重要度分析的结果直接应用到系统中,实现了灵活的事故属性因子筛选功能,用户可以属性因子重要度为依据,进行分析维度以及统计属性的筛选,事故数据分析更具针对性。
四、本发明的交通事故数据智能分析与综合应用系统,事故数据分析模块提供了多种数据分析方式,能够提供多种数据分析结论。
附图说明
图1是本发明实施例交通事故数据智能分析与综合应用系统的说明示意图。
图2是实施例交通事故数据因子重要度分析模型的数据处理分析的流程示意图。
具体实施方式
下面结合附图详细说明本发明的优选实施例。
实施例
一种交通事故数据智能分析与综合应用系统,如图1,包含数据对接模块、挖掘处理模块、交互模块、地图模块、数据分析模块。
数据对接模块:从数据库中提取指定条件的交通事故数据;指定条件是指用户通过交互模块设置的时间范围以及通过地图模块设置的空间范围条件。
挖掘处理模块:由交通事故数据因子重要度分析模型驱动数据处理,其处理数据来源于数据对接模块;其中交通事故数据因子重要度分析模型,构建交通事故数据属性因子集合,配置缺失信息补全策略,根据属性因子级别以及数据缺失情况对属性因子进行缺失信息估计,在此基础上量化分析并输出属性因子集合元素的重要度。
交互模块:接收辅助决策处理引擎的属性因子集合以及重要度,并结合属性因子所属维度以及重要度数值大小进行可视化显示;还包括日期时间选择控件、属性因子选择控件;该模块将已设置的时间传输至数据对接模块,选中的属性因子传输至数据分析模块,并接收数据分析模块的分析结果,以专用控件进行内容展示;该模块还接收数据分析模块的分析结果,以专用控件进行内容展示。
数据分析模块:接收属性因子选择结果,以属性因子为数据分析角度,通过多种事故数据分析方式提供针对性地数据分析结果;数据分析方式包括因素分析、对应分析、关联分析、定制报表等。
地图模块:包含地理信息数据,支持地图操作;与交互模块协同实现系统的前端交互操作,并将数据分析模块输出的结果进行可视化呈现;还包括区域自定义工具,通过绘图设置目标区域;该模块并将划定的区域空间坐标范围传输至数据对接模块。
实施例的挖掘处理模块中,交通事故数据因子重要度分析模型的数据处理分析,具体为:
S1、确定交通事故数据一级属性维度:人员维度、车辆维度、道路维度、环境维度。
S2、根据交通事故数据的具体字段确定一级属性的二级属性集合,该属性集合为交通事故样本数据中二级属性因子全集,集合元素个数为NL(2);对二级属性因子进行三级拆解,获得三级属性因子全集,集合元素个数为NL(3),其中三级拆解根据二级属性因子的具体取值确定,离散属性变量即根据该变量的取值范围确定三级属性因子组成,连续属性则进行离散转换,再确定其三级属性因子组成。
在实施例中,一般事故的原始记录中可提取的人员维度对应的二级属性包括性别、年龄、国籍、户口性质、职业、驾龄;简易事故的原始记录中可提取的人员维度对应的二级属性包括性别、年龄。由此确定人员属性的二级属性集合元素为性别、年龄、国籍、户口性质、职业、驾龄。对于性别二级属性,其三级属性因子为男性、女性;年龄二级属性为连续变量,通过分段聚合拆解出三级变量。
S3、分别对二级属性因子全集、三级属性因子全集进行样本数据的分组合并,获得二级分组数量GN(2)及每组的样本量samplesize(2)、三级分组数量GN-(3)及每组的样本量samplesize(3)。
对于任一分组G(level)i,其属性因子包括S2中的该级别全部属性以及样本量samplesize(level)i;其中level表征属性因子级别,取值为2、3。
在实施例中,人员维度下的二级分组合并结果如下表所示:
Figure BDA0001842537180000061
Figure BDA0001842537180000071
在分组G(4)、G(6)、G(8)、G(9)、G(11)、G(12)、G(13)、G(14)、G(15)、G(16)、G(17)、G(18)、G(20)中均存在缺失数据的属性因子(△标示)。
S4、检测G(level)i属性因子数据是否存在缺失的情况,若不存在则转入步骤S5,否则,配置缺失信息补全策略,根据属性因子级别以及数据缺失情况对属性因子进行缺失信息估计;具体为:
S41、序号j=1;
S42、检测属性因子aj是否存在数据缺失的情况,若存在,则计算其数据缺失率rj=mj/GN(level),mi为缺失该属性因子的分组数,level的取值根据aj的属性级别确定;否则进入步骤S44;
S43、若ri∈[thl,thu],则通过随机森林方法补充缺失信息,其中thl、thu分别为上下限阈值;具体地,在不存在缺失的样本分组中划分训练集与测试集,由训练集拟合缺失值属性因子与其他属性因子的关系,根据经由测试集测试通过的随机森林,对该分组后数据进行缺失补全,即将其他属性因子输入随机森林,输出的分类结果作为该属性因子的估计值;
若ri∈[0,thl),则在后续分析中放弃该属性因子;
若ri∈(thu,1],则由统计值M进行缺失估计,统计值M在众数、平均数中选择;
S44、j<NL(level)是否成立?若成立,则j=j+1,回到S42循环处理;若不成立,则检测是否仍存在带有缺失值的属性因子,若是则返回S41循环处理,柔则结束缺失估计流程。
S5、基于分组合并数据构建随机森林回归模型,计算属性因子重要度;具体地,随机森林回归模型中的决策树数量为NT,对于每一颗树使用袋外数据计算袋外误差error1;随机对袋外数据所有样本的属性因子at进行噪声干扰,计算袋外误差error2;属性因子at的重要度D(ak)=∑|error1-error2|/NT。
实施例中,人员维度的二级属性因子重要度分析结果如下表:
Figure BDA0001842537180000081
数据分析模块中的因素分析,提取含有选中属性因子的所有数据样本,进行时间、空间维度的指标统计,其中指标包括事故总数、涉案人数、涉案车辆数、受伤人数、死亡人数、财产损失。
时间维度指标统计即按不同时间间隔长度(日、周、月、季、年)进行指标统计,分析结果由交互模块以统计图、统计报表呈现;空间维度指标统计,以事故发生位置坐标进行指标数据的空间汇集,分析结果由地图模块驱动,通过叠加展示图层呈现,叠加图层包括散点、热力图、聚合图、统计图等。
数据分析模块中的对应分析,以全部样本进行对应分析处理生成对应分析结论集合,包含对应分析二维散点图、属性因子对应分析结论,并从中提取含有选中属性因子的所有结论;输出结果由交互模块调用专用控件进行展示。
数据分析模块中的关联分析,以全部样本进行关联分析处理生成关联分析结论集合,包含关联关系以及提升度;根据接收到的条件属性因子、结果属性因子,提取条件、结果中包含对应属性因子的关联分析结论;输出结果由交互模块调用专用控件进行展示。
若数据分析模块在因素分析时,接收的属性因子为单个,进行单因素分析;若为多个,则进行多因素分析。
数据分析模块中的定制报表,根据接收到的若干属性因子,进行数据统计。
实施例的交互模块中,在展示对应分析结果时,以专用图形、文本控件展示对应分析二维散点图以及对应分析结论;展示关联分析结果时,以专用图形、文本控件展示属性因子的关联关系、提升度数据等;展示定制报表结果时,以表格空间展示事故数据统计结果,表头内容为选定的属性因子。
该种交通事故数据智能分析与综合应用系统的数据处理流程为:
用户通过交互模块的前端界面,在时间选择控件中设置起始日期、结束日期,在地图模块驱动的电子地图前端界面中,可通过绘图工具选定目标区域,也可通过查询筛选插件选择具体的行政区划、道路名、路段名。通过数据对接模块从数据库中调取时间区间以及空间范围内的交通事故原始数据。该模块还设置了默认时空范围,若用户未设置则按默认时空范围进行数据调取。
数据对接模块调取的原始数据通过挖掘处理模块进行处理,挖掘处理模块输出该时空范围内交通事故数据的分析属性因子以及重要度。
交互模块提供的前端界面中,其包含的筛选查询插件中的内容即为挖掘处理模块处理输出的属性因子、重要度指标,属性因子根据人员维度、车辆维度、道路维度、环境维度进行分类,在各类别下属性因子根据重要度指标数值大小进行排序。
用户在前端界面中,可查看各维度下属性因子及重要度指标,并选取一个或多个属性因子进行因素分析、对应分析、关联分析、定制报表统计;并在前端界面中查看分析结果与结论信息;并可将分析结果以.pdf、.doc等文件格式导出系统保存至本地。
实施例的交通事故数据智能分析与综合应用系统,基于原始交通事故数据进行属性因子的重要度分析,配置了缺失数据估计策略,能够有效应对交通事故不同数据源提供的属性因子不一致的情况;从而从用户选择的样本数据中提取出带有交通事故重要信息的属性因子,并输出了定量化的重要度指标。
该种交通事故数据智能分析与综合应用系统,重要度分析的结果直接应用到系统中,实现了灵活的事故属性因子筛选功能,用户可以属性因子重要度为依据,进行分析维度以及统计属性的筛选,事故数据分析更具针对性。
实施例的交通事故数据智能分析与综合应用系统,事故数据分析模块提供了多种数据分析方式,能够提供多种数据分析结论。实施例系统能够提供可量化的交通事故属性因子重要度指标;交通事故数据分析方式与结果呈现方式多样,数据统计报表表头亦可自主灵活定制。

Claims (7)

1.一种交通事故数据智能分析与综合应用系统,其特征在于:包括数据对接模块、挖掘处理模块、交互模块、地图模块和数据分析模块,
数据对接模块:从交通事故数据库中提取指定条件的交通事故数据,并将提取的交通事故数据发送给数据对接模块;
挖掘处理模块:依据数据对接模块提取的交通事故数据,由交通事故数据因子重要度分析模型驱动数据处理,得到属性因子集合元素的重要度;具体为,构建交通事故数据属性因子集合,配置缺失信息补全策略,根据属性因子级别以及数据缺失情况对属性因子进行缺失信息估计,在此基础上量化分析并输出属性因子集合元素的重要度;挖掘处理模块中交通事故数据因子重要度分析模型进行数据处理分析具体为:
S1、确定交通事故数据一级属性维度;
S2、根据交通事故数据的具体字段确定一级属性的二级属性集合,该属性集合为交通事故样本数据中二级属性因子全集,集合元素个数为NL(2);对二级属性因子进行三级拆解,获得三级属性因子全集,集合元素个数为NL(3),其中三级拆解根据二级属性因子的具体取值确定,离散属性变量即根据该变量的取值范围确定三级属性因子组成,连续属性则进行离散转换,再确定其三级属性因子组成;
S3、分别对二级属性因子全集、三级属性因子全集进行样本数据的分组合并,获得二级分组数量GN(2)及每组的样本量samplesize(2)、三级分组数量GN(3)及每组的样本量samplesize(3);对于任一分组G(level)i,其属性因子包括步骤S2中的该级别全部属性以及样本量samplesize(level)i,其中level表征属性因子级别;
S4、检测分组G(level)i属性因子数据是否存在缺失的情况,若不存在则转入步骤S5;否则,配置缺失信息补全策略,根据属性因子级别以及数据缺失情况对属性因子进行缺失信息估计;
S5、基于分组合并数据构建随机森林回归模型,计算属性因子重要度;
交互模块:接收挖掘处理模块得到的属性因子集合以及重要度,并结合属性因子所属维度以及重要度数值大小进行可视化显示;还包括日期时间选择控件、属性因子选择控件;将已设置的时间传输至数据对接模块,选中的属性因子传输至数据分析模块,并接收数据分析模块的分析结果,以专用控件进行内容展示;
数据分析模块:接收交互模块的属性因子选择结果,以属性因子为数据分析角度,通过事故数据分析方式提供针对性地数据分析结果给交互模块与地图模块;
地图模块:包含地理信息数据,支持地图操作;与交互模块协同实现前端交互操作,并将数据分析模块输出的结果进行可视化呈现;还包括区域自定义工具,通过绘图设置目标区域,并将划定的区域空间坐标范围传输至数据对接模块。
2.如权利要求1所述的交通事故数据智能分析与综合应用系统,其特征在于:步骤S4具体为,
S41、序号j=1;
S42、检测属性因子aj是否存在数据缺失的情况,若存在,则计算其数据缺失率rj=mj/GN(level),mi为缺失该属性因子的分组数,level的取值根据aj的属性级别确定,进入步骤S43;否则进入步骤S44;
S43、若ri∈[thl,thu],则通过随机森林方法补充缺失信息,其中thl、thu分别为上下限阈值;
若ri∈[0,thl),则在后续分析中放弃该属性因子;
若ri∈(thu,1],则由统计值M进行缺失估计,统计值M在众数、平均数中选择;
S44、j<NL(level)是否成立,若成立,则j=j+1,回到步骤S42循环处理;若不成立,则检测是否仍存在带有缺失值的属性因子,若是则返回步骤S41循环处理,否则结束缺失估计流程。
3.如权利要求2所述的交通事故数据智能分析与综合应用系统,其特征在于:步骤S43中,通过随机森林方法补充缺失信息,具体为,在不存在缺失的样本分组中划分训练集与测试集,由训练集拟合缺失值属性因子与其他属性因子的关系,根据经由测试集测试通过的随机森林,对该分组后数据进行缺失补全,即将其他属性因子输入随机森林,输出的分类结果作为该属性因子的估计值。
4.如权利要求1所述的交通事故数据智能分析与综合应用系统,其特征在于:步骤S5具体为,随机森林回归模型中的决策树数量为NT,对于每一颗树使用袋外数据计算袋外误差error1;随机对袋外数据所有样本的属性因子at进行噪声干扰,计算袋外误差error2;属性因子at的重要度D(ak)=∑|error1-error2|/NT。
5.如权利要求1-3任一项所述的交通事故数据智能分析与综合应用系统,其特征在于:数据对接模块中,指定条件指用户通过交互模块设置的时间范围以及通过地图模块设置的空间范围条件。
6.如权利要求1-3任一项所述的交通事故数据智能分析与综合应用系统,其特征在于:数据分析模块采用的数据分析方式包括因素分析、对应分析、关联分析、定制报表。
7.如权利要求6所述的交通事故数据智能分析与综合应用系统,其特征在于:数据分析模块中,
因素分析:提取含有选中属性因子的所有数据样本,进行时间、空间维度的指标统计;
对应分析:以全部样本进行对应分析处理生成对应分析结论集合,包含对应分析二维散点图、属性因子对应分析结论,并从中提取含有选中属性因子的所有结论;
关联分析:以全部样本进行关联分析处理生成关联分析结论集合,包含关联关系以及提升度;根据接收到的条件属性因子、结果属性因子,提取条件、结果中包含对应属性因子的关联分析结论;
定制报表:根据接收到的若干属性因子,进行数据统计。
CN201811264351.8A 2018-10-26 2018-10-26 交通事故数据智能分析与综合应用系统 Active CN109409430B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201811264351.8A CN109409430B (zh) 2018-10-26 2018-10-26 交通事故数据智能分析与综合应用系统
PCT/CN2019/113477 WO2020083400A1 (zh) 2018-10-26 2019-10-26 交通事故数据智能分析与综合应用系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811264351.8A CN109409430B (zh) 2018-10-26 2018-10-26 交通事故数据智能分析与综合应用系统

Publications (2)

Publication Number Publication Date
CN109409430A CN109409430A (zh) 2019-03-01
CN109409430B true CN109409430B (zh) 2021-07-13

Family

ID=65469405

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811264351.8A Active CN109409430B (zh) 2018-10-26 2018-10-26 交通事故数据智能分析与综合应用系统

Country Status (2)

Country Link
CN (1) CN109409430B (zh)
WO (1) WO2020083400A1 (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109409430B (zh) * 2018-10-26 2021-07-13 江苏智通交通科技有限公司 交通事故数据智能分析与综合应用系统
CN110471917B (zh) * 2019-07-10 2021-01-15 北京交通大学 一种基于历史数据挖掘的海关报关单智能填报方法
CN110491121B (zh) * 2019-07-26 2022-04-05 同济大学 一种异质性交通事故致因分析方法及设备
CN111666971A (zh) * 2020-04-27 2020-09-15 深圳壹账通智能科技有限公司 基于位置定位的事件识别方法、装置、设备及存储介质
CN112365939B (zh) * 2020-10-14 2023-04-07 山东大学 一种基于医疗健康大数据的数据治理方法及系统
CN112288585B (zh) * 2020-11-20 2024-05-28 中国人寿保险股份有限公司 保险业务精算数据处理方法、装置及电子设备
CN113627079A (zh) * 2021-07-27 2021-11-09 中国海洋石油集团有限公司 一种面向海上石油钻井的深度可迁移多因子事故预警方法及系统
CN117455745B (zh) * 2023-12-26 2024-03-19 四川省大数据技术服务中心 基于多维融合数据分析的公共安全事件感知方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103886507A (zh) * 2013-12-31 2014-06-25 北京交通大学 应急预案数字化生成方法
CN106126328A (zh) * 2016-06-24 2016-11-16 同济大学 一种基于事件分类的交通元数据管理方法及系统
CN108242149A (zh) * 2018-03-16 2018-07-03 成都智达万应科技有限公司 一种基于交通数据的大数据分析方法
CN108417033A (zh) * 2018-03-23 2018-08-17 四川高路交通信息工程有限公司 基于多维因素的高速路交通事故分析预测方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101334933B (zh) * 2007-06-28 2012-04-04 日电(中国)有限公司 路况信息处理设备及其方法和路况信息集成装置及其方法
CN106202895B (zh) * 2016-07-02 2019-03-29 北京工业大学 基于感知重要度的交通出行意向行为数据分析方法
CN108596409B (zh) * 2018-07-16 2021-07-20 江苏智通交通科技有限公司 提升交通危险人员事故风险预测精度的方法
CN109409430B (zh) * 2018-10-26 2021-07-13 江苏智通交通科技有限公司 交通事故数据智能分析与综合应用系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103886507A (zh) * 2013-12-31 2014-06-25 北京交通大学 应急预案数字化生成方法
CN106126328A (zh) * 2016-06-24 2016-11-16 同济大学 一种基于事件分类的交通元数据管理方法及系统
CN108242149A (zh) * 2018-03-16 2018-07-03 成都智达万应科技有限公司 一种基于交通数据的大数据分析方法
CN108417033A (zh) * 2018-03-23 2018-08-17 四川高路交通信息工程有限公司 基于多维因素的高速路交通事故分析预测方法

Also Published As

Publication number Publication date
WO2020083400A1 (zh) 2020-04-30
CN109409430A (zh) 2019-03-01

Similar Documents

Publication Publication Date Title
CN109409430B (zh) 交通事故数据智能分析与综合应用系统
CN108182489B (zh) 一种基于在线学习行为分析的个性化学习推荐方法
CN107657267B (zh) 产品潜在用户挖掘方法及装置
CN111400366B (zh) 一种基于CatBoost模型的交互式门诊量预测可视分析方法及系统
Fadzil et al. Management accounting change: ABC adoption and implementation
CN104123592A (zh) 银行后台tps交易事件趋势预测方法及系统
CN107885857B (zh) 一种搜索结果页用户行为模式挖掘方法、装置及系统
WO2024067387A1 (zh) 基于特征变量评分的用户画像生成方法,设备、汽车及存储介质
WO2020108219A1 (zh) 基于交通安全风险的群体划分与差异性分析方法及系统
CN112101769A (zh) 供应链风险管理系统
WO2021103401A1 (zh) 数据对象分类方法、装置、计算机设备和存储介质
Huisman et al. Software for statistical analysis of social networks
CN111461949A (zh) 基于大数据的社区矫正方案智能生成系统
CN117291770A (zh) 教学效果的可视化用户数据评定方法及系统
CN109918544B (zh) 基于粗糙集的职务犯罪社会关系网络智能分析方法及系统
US11775144B2 (en) Place-based semantic similarity platform
CN116703346A (zh) 一种基于大数据和人工智能的考勤管理系统及管理方法
US20060136290A1 (en) Method for administrating and analyzing work place monitoring data
US20070016540A1 (en) Intelligent multimedia user interfaces for intelligence analysis
CN113393169B (zh) 基于大数据技术的金融行业交易系统性能指标分析方法
TW201501067A (zh) 量刑方法及系統
US20230401615A1 (en) Optimization system and optimization method
CN112966890B (zh) 一种用于企业员工监督的智能分析系统及方法
KR102365429B1 (ko) 불성실응답자를 판별하는 인공지능을 이용한 온라인 모바일 설문조사 플랫폼
Guillen et al. Gender entrepreneurship in Latin America: does the institutional system matter?

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 211106 19 Su Yuan Avenue, Jiangning economic and Technological Development Zone, Nanjing, Jiangsu

Applicant after: JIANGSU ZHITONG TRAFFIC TECHNOLOGY Co.,Ltd.

Address before: 210006, Qinhuai District, Jiangsu, Nanjing should be 388 days street, Chenguang 1865 Technology Creative Industry Park E10 building on the third floor

Applicant before: JIANGSU ZHITONG TRAFFIC TECHNOLOGY Co.,Ltd.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant