CN104616066B - 一种行车用量数据的采集方法及系统 - Google Patents
一种行车用量数据的采集方法及系统 Download PDFInfo
- Publication number
- CN104616066B CN104616066B CN201310541217.9A CN201310541217A CN104616066B CN 104616066 B CN104616066 B CN 104616066B CN 201310541217 A CN201310541217 A CN 201310541217A CN 104616066 B CN104616066 B CN 104616066B
- Authority
- CN
- China
- Prior art keywords
- dosage
- driving
- data
- model
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 230000006855 networking Effects 0.000 claims abstract description 51
- 239000003795 chemical substances by application Substances 0.000 claims description 40
- 230000008569 process Effects 0.000 claims description 20
- 238000000605 extraction Methods 0.000 claims description 10
- 238000007781 pre-processing Methods 0.000 claims description 9
- 238000012545 processing Methods 0.000 claims description 9
- 238000005201 scrubbing Methods 0.000 claims description 9
- 239000002552 dosage form Substances 0.000 claims description 3
- 238000004458 analytical method Methods 0.000 abstract description 11
- 238000007726 management method Methods 0.000 description 13
- 238000005516 engineering process Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 5
- 230000007613 environmental effect Effects 0.000 description 5
- 241001269238 Data Species 0.000 description 3
- 206010039203 Road traffic accident Diseases 0.000 description 3
- 230000005611 electricity Effects 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 230000019771 cognition Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 239000002356 single layer Substances 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000009412 basement excavation Methods 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 210000001520 comb Anatomy 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000010410 layer Substances 0.000 description 1
- 230000035800 maturation Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000004171 remote diagnosis Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
- G06Q10/047—Optimisation of routes or paths, e.g. travelling salesman problem
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Game Theory and Decision Science (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Traffic Control Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种行车用量数据的采集方法及系统,包括:基于“人、车和路”三类信息主体发送的车联网原始数据,建立用量模型,该用量模型包括不同信息主体的不同项目所对应的行车用量关联规则;根据所建立的用量模型将“人、车和路”三类信息主体发送的车联网原始数据,进行关联采集。因此,本发明提供的方法及系统对车联网中的数据资源集中采集并分析,对分析后的数据资源优化利用。
Description
技术领域
本发明涉及车联网技术领域,特别涉及一种行车用量数据的采集方法及系统。
背景技术
随着车联网相关技术的不断成熟,传感器技术、移动通信技术、大数据技术和智能计算技术等均开始与车联网产业深度融合。在市场需求的带动下,车联网的Telemaitcs终端设备有望迎来爆发式的增长,其中,Telemaitcs指应用无线通信技术的车载电脑系统,从而为运营商开拓数据服务模式带来可观的增值收入和持续增长的机遇。区别于传统的智能交通系统(ITS,Intelligent Transport System),车联网更注重车与车、车与路、车与人之间的交互通信,可以说车联网的出现重新定义车辆交通运行方式。
数据采集是实现对车辆交通运行方式优化和资源有效利用的重要基础和前提。由于车联网数据特征本身是错综复杂、分门别类而且属性各异的。因此,如何以“人、车、路”三类信息为主体的资源数据有效采集,从而满足车联网产业各方对这些资源数据在业务和服务日益增长且强劲多变的需求就显得尤为重要。该领域的研究尚处于起步阶段,很多问题都没有得到解决。
目前,车联网数据的采集,重点关注如车辆内部信息、车辆外部信息或交通环境信息。车厂、Telemaitcs服务商(TSP,Telematics Service Provider)和商业车队等行业的系统主要关注车辆内外部信息的采集,通过提取车辆行驶参数和系统数据保证车辆行驶安全、规避道路拥塞及提高出行舒适度;而城市交通管部门更关注对交通环境信息的采集,通过对交通环境状态和参数分析,实现对城市交通状况的整体分析和调控,而无法实现对车联网资源的统一调配和管理。
经归纳整理,可以得知,车联网资源需求主要为:
1)车辆内外部信息的数据采集:针对车厂和TSP,通过对车辆行驶过程的状态数据的采集,这些状态数据包括:行驶速度、轨迹、位置、发动机信息、车载自动诊断系统(OBD,On-Board Digamostics)等的采集,为后期提供诸如远程诊断、道路救援及事故报警灯服务。针对商业车队,将所采用的上述车辆行驶过程的状态数据发送到监控中心,以满足监控中心对车辆信息全面掌控的需求。
2)城市交通环境信息的数据采集;针对交通管理部门的需求,采集的数据类型主要包括浮动车、摄像头、地感线圈、微波或信号等设备的工作状态数据,用以实现对城市整体交通路况、车流量和交通事故信息的监控和判定。
目前的车联网领域对信息采集的方法和系统虽然已经较为成熟,但是要实现对“人-车-路”三类信息主体的资源进行优化利用,仍然存在一些难题:首先,单一对车辆内外部信息或对环境信息的数据采集,是面向各自功能和场景的单一架构,数据存在较大片面性;其次,对车内外信息的数据采集的解决方法,并未充分考虑各数据主体间的关联关系,采集范围缺乏针对性,数据冗余严重;最后,并未考虑对车辆交通运行方式后续优化和分析,从而无法完成车联网相关资源的优化利用。
发明内容
有鉴于此,本发明提供一种行车用量数据的采集方法,该方法能够对车联网中的数据资源集中采集并分析,对分析后的数据资源优化利用。
本发明还提供一种行车用量数据的采集系统,该装置能够对车联网中的数据资源集中采集并分析,对分析后的数据资源优化利用。
为达到上述目的,本发明实施的技术方案具体是这样实现的:
一种行车用量数据的采集方法,该方法包括:
基于“人、车和路”三类信息主体提供的车联网原始数据,建立用量模型,该用量模型包括不同信息主体的不同项目所对应的行车用量关联规则;
根据所建立的用量模型将“人、车和路”三类信息主体提供的车联网原始数据,进行关联采集。
所述建立用量模型的过程为:
根据车联网原始数据生成行车用量的影响属性集合;
对行车用量的影响属性集合进行包括数据清理和格式化处理的预处理过程;
基于预处理后的行车用量的影响属性集合建立行车用量的概念层次树;
对行车用量的概念层次树中的每一概念层计算得到频繁项集,得到行车用量的关联规则;
基于行车用量的关联规则确定所对应的不同信息主体的不同项目,建立用量模型。
所述建立行车用量的概念层次树为:
基于预处理后的行车用量的影响属性集合中的每一级属性集合,从概念层次树的根部开始,从顶部向下,将每一级属性集合形成每一概念层,形成行车用量的概念层次树。
所述每一概念层计算得到频繁项集为:
每一概念层计算得到该概念层的项集;
设置设定支持度阈值和/或设置置信度阈值后,对每一概念层计算得到该概念层的项集,判断该概念层的项集的支持度或/和置信度是否大于等于设定支持度阈值和/或设置置信度阈值,如果是,则作为频繁项集;
将所有频繁项集作为行车用量的关联规则。
一种行车用量数据的采集系统,该系统包括:提取单元、存储单元、用量模单元及关联采集单元,其中,
提取单元,用于获取车联网原始数据,得到行车用量的影响属性集合存储在存储单元中;
存储单元,用于存储行车用量的影响属性集合;
用量模型单元,用于根据存储单元存储的行车用量的影响属性集合建立用量模型,该用量模型包括不同信息主体的不同项目所对应的行车用量关联规则;
关联采集单元,用于根据用量模型,关联采集车联网原始数据。
所述用量模型单元还包括预处理单元、建立行车用量的概念层次树单元、行车用量的关联规则生成单元及用量模型生成单元,其中,
预处理单元,用于对存储单元存储的行车用量的影响属性集合进行包括数据清理和格式化处理的预处理过程;
建立行车用量的概念层次树单元,用于基于预处理后的行车用量的影响属性集合建立行车用量的概念层次树;
行车用量的关联规则生成单元,用于对行车用量的概念层次树中的每一概念层计算得到频繁项集,得到行车用量的关联规则;
用量模型生成单元,用于基于行车用量的关联规则建立用量模型,该用量模型包括不同信息主体的不同项目所对应的行车用量关联规则。
由上述方案可以看出,本发明提供的方法及系统基于“人、车和路”三类信息主体发送的车联网原始数据,建立用量模型,该用量模型包括不同信息主体的不同项目所对应的行车用量关联规则;根据所建立的用量模型将“人、车和路”三类信息主体发送的车联网原始数据,进行关联采集。由于本发明在采集过程中,是根据所建立的用量模型进行采集,该用量模型为不同信息主体的不同项目所对应的行车用量关联规则,所以避免了单一对车辆内外部信息或对环境信息的数据采集;而且在设置用量模型时,是基于“人、车和路”三类信息主体发送的具备关联性的车联网原始数据设置的,充分考虑各数据主体间的关联关系,采集范围有针对性,采集数据简单,有利于后续分析和通过改进用量模型优化。因此,本发明提供的系统及方法可以对车联网中的数据资源集中采集并分析,对分析后的数据资源优化利用。
附图说明
图1为本发明实施例提供的“人-车-路”信息主体间的关联关系结构示意图;
图2为本发明实施例提供的行车用量数据的采集过程示意图;
图3为本发明实施例提供的行车用量数据的采集方法流程图;
图4为本发明提供的多维多层的行车用量的概念层次树结构示意图;
图5为本发明实施例提供的关联规则提取方法流程图;
图6为本发明实施例提供的面向行车用量数据的采集方法实施例的具体流程图;
图7为本发明实施例提供的行车用量管理系统的结构示意图;
图8为本发明实施例提供的关联采集具体例子过程示意图。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚明白,以下参照附图并举实施例,对本发明作进一步详细说明。
为了解决本发明提供的方案,本发明提供了基于“人-车-路”三维主体间的关联数据模型,并提出了“行车用量”的概念。
行车用量,用量是使用量的简称,是一种对资源使用的行为计量,而用量管理规则则是对使用量的管理。从单一维度说,最熟悉的通过电表对电力使用的行为进行计量管理就是用量管理的一个实例。如果将电力使用的行为扩展到以时间维度进行计量,通过掌握电力使用量随时间的变化关系,进而调节定价和市场供需关系,可以达到对电力资源供给和使用的优化,即苏伟的阶梯定价策略。可见,基于用量管理的模型设计资源供给和使用资源的行为,两者之间的关系可以采用多维空间描述,描述的空间维度越高,可以用于资源配置的变量越多,受益空间越大。在这里,行车用量是车联网平台中通过建立多方契约关系实现产业协同的重要数据概念,其资源涉及多个行为主体,比如车主、车厂、交通管理及保险等,针对车主而言,其对资源的使用行为又包括:车的折旧、交通事故的损失、车险保费的支出、违章罚款和处罚等,随着资源项的增加,可以为行车用量带来新的语义和新的功能,进而为车联网产业中的更多受益者服务。
用量模型,车联网产业内的不同产业主体,因为不同的经营目标,关心行车过程中不同的参数。因此,提供给这些不同主体的所需行车用量的过程,就是将行车用量通过一定的数据处理在相应信息主体需求空间进行数据投影的过程,而这个数据模型即为用量模型。举一个例子说明,比如:对于公安交通管理局,其主要职责包括道路交通管理控制和交通安全安保,获取道路交通事故的行车用量,则成为以公安交通管理局为主体的需求投影;对于保险公司,其从减少事故赔付率、降低投保风险及赚取盈利出发,提取投保车量驾驶评估的行车用量,则成为以保险公司为主体的需求投影;对于车主,其从保障车辆行驶安全、规避道路拥塞为主要诉求,获取交通通行能力的行车用量,则成为以车为主体的需求投影。
“人-车-路”信息主体间的关联关系
图1为本发明实施例提供的“人-车-路”信息主体间的关联关系结构示意图,该图形成了包含四个界面且彼此影响的闭环关系结构图,其中,
人-车界面,即驾驶行为协同,涉及的信息主体为人和车,包括驾驶人通过加速踏板、制动和转向盘,操纵方向,控制行车速度,实现对车辆的控制;
人-路界面,即交通信息匹配协同,涉及的信息主体为人和路,包括驾驶人在行驶过程中根据掌握车辆、道路及交通变化特征,不断作出正确的判断与反应,以适应道路环境的变化;
车-路界面,即车辆行驶协同,涉及的信息主体为车和路,包括通过车车、车路信息交互和共享,实现车辆和道路基础设施之间协同与配合;
人-车-路界面,即交通行为协同,涉及的信息主体为人、车和路,包括在驾驶人控制车量按着预定目标,按照交通规则运行的动态过程中,同时车辆也受到道路和环境状况的影响,共同完成交通行为事件。
本发明按照图1所述的关联关系,采用图2所示的行车用量数据的采集过程示意图,进行行车用量数据的采集,具体的说:
第一步骤,获取车联网原始数据,该车联网原始数据由“人、车和路”三类信息主体提供;
第二步骤,根据车联网原始数据生成行车用量的影响属性集合;
第三步骤,对行车用量的影响属性集合进行包括数据清理和格式化处理的预处理过程;
第四步骤,基于预处理后的行车用量的影响属性集合建立行车用量的概念层次树;
第五步骤,对行车用量的概念层次树中的每一概念层计算得到频繁项集,得到行车用量的关联规则;
第六步骤,建立用量模型,该用量模型包括不同信息主体的不同项目所对应的行车用量关联规则;
第七步骤,根据所建立的用量模型对车联网原始数据进行关联采集。
图3为本发明实施例提供的行车用量数据的采集方法流程图,其具体步骤为:
步骤301、基于“人、车和路”三类信息主体提供的车联网原始数据,建立用量模型,该用量模型包括不同信息主体的不同项目所对应的行车用量关联规则;
步骤302、根据所建立的用量模型将“人、车和路”三类信息主体提供的车联网原始数据,进行关联采集。
在图3中,如何建立该用量模型,以及如何根据所建立的该用量模型进行关联采集,是实现本发明的关键所在,以下进行详细说明。
建立该用量模型分为:数据准备阶段、数据预处理阶段、建立行车用量的概念层次树阶段、行车用量的关联规则提取阶段、关联数据建模阶段和关联采集阶段。
数据准备阶段
将“人-车-路”三类信息主体提供的车联网原始数据,该数据实际可以为车联网基础原始数据,生成行车用量的影响属性集合,传送给本发明提供的用量关系管理的存储系统。原始数据如车辆信息、环境信息、互联网信息和行业渠道信息等。当提供车辆信息时,通过汽车感知技术等提供;当提供环境信息时,通过交通感知技术等采集城市及道路等相关数据;当提供互联网信息时,通过互联网技术得到用户及业务等相关数据;当提供行业信息时,通过相关行业的传统方式和渠道采集地理及业务等数据。原始数据提供方式、原始数据、所采用的技术手段及对应的形成用量的属性集合如表一所述:
表一
数据预处理阶段
数据预处理阶段包括数据清理和格式化处理,其中的数据清理主要是行车用量的影响属性集合的有效性,过滤其中的非法数据或无效数据;格式化处理是为了便于计算和处理,格式化数据,对数值类型的数据离散化处理,对非数据类型的数据信息代码标识,最终得到预处理的行车用量的属性集合,该属性集合为格式化记录集合。
在进行格式化时,如果行车用量的影响属性集合中的车辆速度是数值类型数据,则可以进行离散化处理:A,0~5公里/小时;B,5~40公里/小时;C,40~80公里/小时;D,80~120公里/小时;E,120公里/小时及以上;如果行车用量的影响属性集合中的拥堵信息为非数据情况,则进行统一标识:CT,畅通;HM,缓慢;YD,拥堵,GZ,管制。
建立车行用量的概念层次树阶段
基于预处理的行车用量的影响属性集合中各个属性值和概念依据的抽象程度不同,构建图4所示的多维多层的行车用量的概念层次树结构,形成基于预处理的行车用量的影响属性集合的行车用量的概念层次树。
如图4所示的行车用量的概念层次树结构,根部节点定义为行车用量属性(PDU,Property of Driving Usage),用来表示行车用量中相关联的驾驶员、车辆、道路、天气和时间的状态,及交通行为时间的特点。其中D(Driver)为驾驶员属性、V(Vehicle)为车辆属性、R(Road)为道路属性、W(Weather)为天气属性、T(Time)为时间属性、E(Event)为交通行为事件属性。每一级属性还可以继续往下分,比如车辆属性可以报考本质属性、引擎状态和驾驶状态等。
在行车用量的概念层次树的基础上进行关联规则提取,可指定维的某一层参与关联分析,而其他层次不参与,则将多维多层的模型挖掘简化为多维单层的模型的挖掘。
关联规则提取阶段
由行车用量的概念层次树的顶部,即PDU开始,自上而下地逐步扩展到较低的更特定的概念层,针对每个概念层的概念集合计算其频繁项集并累加计数,直到不能再找到频繁项集为止,最终得到关联规则。
图5为本发明实施例提供的关联规则提取方法流程图,其具体步骤为:
步骤501、提取行车用量的概念层次树的单层第n维数据;
步骤502、设置k=1;L=φ;
步骤503、得到1项候选集C1和频繁项集L1;
步骤504、设置R=R+1;
在本步骤中,R表示关联规则;
步骤505、从频繁项集Lk-1得到k项候选集Ck;
步骤506、从候选集Ck得到k项频繁项集Lk;
步骤507、判断LK-1<>φ,如果是,则执行步骤508;如果否,则返回步骤504继续执行;
步骤508、生成频繁项集L;
步骤509、根据频繁项集L得到行车用量的关联规则R。
在这里,行车用量的关联规则可以由支持度P(AUB)和/或置信度P(BIA)来体现,对于某一项集,如果其支持度和/或置信度大于等于给定的支持度阈值和/或置信度阈值,则确定该项集为频繁项集。
关联数据建模阶段
根据行车用量的关联规则建立相应的用量模型,该用量模型包括为不同信息主体的不同项目所对应的行车用量的关联规则。例如针对车主的需求投影,梳理出对个人驾驶车辆安全的影响因素,如表二所示,其中前件表示影响因素,后件表示考虑因素:
前件 | 后件 | 支持度 | 置信度 |
路面 | 驾驶安全 | 50.7% | 43.7% |
天气 | 驾驶安全 | 30% | 46% |
驾龄 | 驾驶安全 | 60% | 73% |
拥堵情况 | 驾驶安全 | 9% | 11% |
....... | ...... | ....... | ........ |
表二
假定针对个人驾驶车辆安全的影响因素的关联最小支持度阈值为50%,则由上表可分析得出路面(50.7%)和驾龄(60%)两项因素满足要求,则可建立用量模型为:个人驾驶的行车用量的关联规则为路面和驾龄。
关联采集阶段
根据得到的用量模型中的行车用量的关联规则对应的不同信息主体的不同项目,进行关联采集,在保证数据分析需要的基础上,达到减少数据冗余的目的。按照表二的示例,分析出在人-车-路三类信息主体的资源数据中,针对个人驾驶作为行车用量的分析,仅有路面和驾龄是影响较高的因子,因此在个人驾驶这个项目下,只关联采集路面和驾龄两个影响属性集合后,存储。
图6为本发明实施例提供的面向行车用量数据的采集方法实施例的具体流程图,其具体步骤为:
步骤601、行车用量管理系统获取车联网原始数据,该车联网原始数据由“人、车和路”三类信息主体提供;
步骤602、行车用量管理系统根据车联网原始数据生成行车用量的影响属性集合;
步骤603、行车用量管理系统对行车用量的影响属性集合进行包括数据清理和格式化处理的预处理过程;
步骤604、行车用量管理系统基于预处理后的行车用量的影响属性集合建立行车用量的概念层次树;
步骤605、行车用量管理系统对行车用量的概念层次树中的每一概念层计算得到频繁项集;
步骤606、行车用量管理系统建立用量模型,该用量模型包括不同信息主体的不同项目所对应的行车用量关联规则;
步骤607、行车用量管理系统根据所建立的用量模型对车联网原始数据进行关联采集。
图7为本发明实施例提供的行车用量管理系统的结构示意图,包括:提取单元、存储单元、用量模单元及关联采集单元,其中,
提取单元,用于获取车联网原始数据,得到行车用量的影响属性集合存储在存储单元中;
存储单元,用于存储行车用量的影响属性集合;
用量模型单元,用于根据存储单元存储的行车用量的影响属性集合建立用量模型,该用量模型包括不同信息主体的不同项目所对应的行车用量关联规则;
关联采集单元,用于根据用量模型,关联采集车联网原始数据。
具体地,用量模型单元还包括:预处理单元、建立行车用量的概念层次树单元、行车用量的关联规则生成单元及用量模型生成单元,其中,
预处理单元,用于对存储单元存储的行车用量的影响属性集合进行包括数据清理和格式化处理的预处理过程;
建立行车用量的概念层次树单元,用于基于预处理后的行车用量的影响属性集合建立行车用量的概念层次树;
行车用量的关联规则生成单元,用于对行车用量的概念层次树中的每一概念层计算得到频繁项集,得到行车用量的关联规则;
用量模型生成单元,用于基于行车用量的关联规则建立用量模型,该用量模型包括不同信息主体的不同项目所对应的行车用量关联规则。
举一个具体例子说明本发明实施例提供的方案
在某一交通事件中,甲驾驶车辆A行驶至X路,因甲未按安全车速行驶且突然变道,与乙驾驶的车辆B前后相撞。经过关联规则提取及关联数据建模阶段,得知在这一交通事件中,满足最小置信度和支持度的阈值要求的频繁项集包含人(甲、乙)、车(A车、B车)以及路(X路),而丙、丁、C车和Y路等属于无关联的信息主体。因此,针对这一交通事件,可采用如图8所示的关联采集具体例子过程示意图,而对无关联或关联较小的噪声数据则可有效过滤。
从本发明提供的系统及方法可以看出,本发明充分考虑了针对行车用量进行有效的计量的需求,实现对车联网相关资源的优化采集和利用。本发明定义了用量模型,以及基于用量模型采集数据的关联采集方式、聚合方式和需求投影方式,满足行车用量资源的计量需求。
本发明适用场景和实例包括以下车联网应用:Telematics、智能交通系统、用户行为分析及资源使用计量等,可满足现有车联网终端、行业应用和未来扩展的需求。
以上举较佳实施例,对本发明的目的、技术方案和优点进行了进一步详细说明,所应理解的是,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (4)
1.一种行车用量数据的采集方法,其特征在于,该方法包括:
基于“人、车和路”三类信息主体提供的车联网原始数据,建立用量模型,该用量模型包括不同信息主体的不同项目所对应的行车用量关联规则;
根据所建立的用量模型将“人、车和路”三类信息主体提供的车联网原始数据,进行关联采集;
所述建立用量模型的过程为:
根据车联网原始数据生成行车用量的影响属性集合;
对行车用量的影响属性集合进行包括数据清理和格式化处理的预处理过程;
基于预处理后的行车用量的影响属性集合建立行车用量的概念层次树;
对行车用量的概念层次树中的每一概念层计算得到频繁项集,得到行车用量的关联规则;
基于行车用量的关联规则确定所对应的不同信息主体的不同项目,建立用量模型。
2.如权利要求1所述的方法,其特征在于,所述建立行车用量的概念层次树为:
基于预处理后的行车用量的影响属性集合中的每一级属性集合,从概念层次树的根部开始,从顶部向下,将每一级属性集合形成每一概念层,形成行车用量的概念层次树。
3.如权利要求1所述的方法,其特征在于,所述每一概念层计算得到频繁项集为:
每一概念层计算得到该概念层的项集;
设置设定支持度阈值和/或设置置信度阈值后,对每一概念层计算得到该概念层的项集,判断该概念层的项集的支持度或/和置信度是否大于等于设定支持度阈值和/或设置置信度阈值,如果是,则作为频繁项集;
将所有频繁项集作为行车用量的关联规则。
4.一种行车用量数据的采集系统,其特征在于,该系统包括:提取单元、存储单元、用量模单元及关联采集单元,其中,
提取单元,用于获取车联网原始数据,得到行车用量的影响属性集合存储在存储单元中;
存储单元,用于存储行车用量的影响属性集合;
用量模型单元,用于根据存储单元存储的行车用量的影响属性集合建立用量模型,该用量模型包括不同信息主体的不同项目所对应的行车用量关联规则;
关联采集单元,用于根据用量模型,关联采集车联网原始数据;
所述用量模型单元还包括预处理单元、建立行车用量的概念层次树单元、行车用量的关联规则生成单元及用量模型生成单元,其中,
预处理单元,用于对存储单元存储的行车用量的影响属性集合进行包括数据清理和格式化处理的预处理过程;
建立行车用量的概念层次树单元,用于基于预处理后的行车用量的影响属性集合建立行车用量的概念层次树;
行车用量的关联规则生成单元,用于对行车用量的概念层次树中的每一概念层计算得到频繁项集,得到行车用量的关联规则;
用量模型生成单元,用于基于行车用量的关联规则建立用量模型,该用量模型包括不同信息主体的不同项目所对应的行车用量关联规则。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310541217.9A CN104616066B (zh) | 2013-11-05 | 2013-11-05 | 一种行车用量数据的采集方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310541217.9A CN104616066B (zh) | 2013-11-05 | 2013-11-05 | 一种行车用量数据的采集方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104616066A CN104616066A (zh) | 2015-05-13 |
CN104616066B true CN104616066B (zh) | 2018-08-17 |
Family
ID=53150502
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310541217.9A Active CN104616066B (zh) | 2013-11-05 | 2013-11-05 | 一种行车用量数据的采集方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104616066B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110784845B (zh) * | 2019-09-12 | 2021-07-16 | 腾讯科技(深圳)有限公司 | 一种基于车联网的属性数据的平衡方法、装置、电子设备及存储介质 |
CN111127876B (zh) * | 2019-11-18 | 2021-11-05 | 腾讯科技(深圳)有限公司 | 车联网的信息提取方法及装置 |
CN116756992B (zh) * | 2023-07-07 | 2024-02-23 | 北京海澍科技有限公司 | 具有语义层的车路协同系统建模方法及设备 |
-
2013
- 2013-11-05 CN CN201310541217.9A patent/CN104616066B/zh active Active
Non-Patent Citations (1)
Title |
---|
车联网环境下交通信息采集与处理方法研究;周户星;《中国博士学位论文全文数据库工程科技Ⅱ辑》;20130815;第C034-563页 * |
Also Published As
Publication number | Publication date |
---|---|
CN104616066A (zh) | 2015-05-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wu et al. | Energy-optimal speed control for electric vehicles on signalized arterials | |
CN104157139B (zh) | 一种交通拥堵预测方法及可视化方法 | |
Yao et al. | Comparison of electric vehicle’s energy consumption factors for different road types | |
Yan et al. | Quantifying and analyzing traffic emission reductions from ridesharing: A case study of Shanghai | |
CN103440764A (zh) | 一种基于车辆自动识别数据的城市路网车辆出行路径重构方法 | |
Li et al. | Prediction of electric bus energy consumption with stochastic speed profile generation modelling and data driven method based on real-world big data | |
DE102014224090A1 (de) | Planung für multimodale strecke | |
Liu et al. | Multi-scale urban passenger transportation CO2 emission calculation platform for smart mobility management | |
CN110836675B (zh) | 一种基于决策树的自动驾驶搜索决策方法 | |
CN102087788A (zh) | 基于浮动车车速置信度的交通状态参数估计方法 | |
CN102592453A (zh) | 一种基于时间窗口的实时交通状况判别方法 | |
CN105528498B (zh) | 网联智能电动车辆一体化建模与集成控制方法 | |
CN103456167B (zh) | 基于关键区域的良好驾驶技术参数获取方法 | |
CN104580327A (zh) | 基于3g网络的车联网智能终端及其实现方法 | |
CN112766591A (zh) | 共享单车调度方法 | |
CN110807917A (zh) | 一种基于云计算的高速公路智能安防系统 | |
CN105427001A (zh) | 地区中小学校校车最优路线与配置方法 | |
Fang et al. | Online power management strategy for plug-in hybrid electric vehicles based on deep reinforcement learning and driving cycle reconstruction | |
CN104616066B (zh) | 一种行车用量数据的采集方法及系统 | |
CN112508228A (zh) | 一种驾驶行为风险预测方法及系统 | |
CN104574096A (zh) | 基于3g通讯技术的网商平台物联网智能设备系统 | |
Kong et al. | The method and application of big data mining for mobile trajectory of taxi based on MapReduce | |
CN114997493A (zh) | 一种高速公路车辆碳排放量预测方法及系统 | |
CN109034593B (zh) | 一种拼车优先管控策略实施效益评价方法 | |
CN116071209A (zh) | 一种路侧停车场碳排放量计算方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |