CN116110222A - 基于大数据的车辆应用场景分析方法 - Google Patents
基于大数据的车辆应用场景分析方法 Download PDFInfo
- Publication number
- CN116110222A CN116110222A CN202211509540.3A CN202211509540A CN116110222A CN 116110222 A CN116110222 A CN 116110222A CN 202211509540 A CN202211509540 A CN 202211509540A CN 116110222 A CN116110222 A CN 116110222A
- Authority
- CN
- China
- Prior art keywords
- vehicle
- scene
- characteristic
- result
- steps
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 17
- 238000000513 principal component analysis Methods 0.000 claims abstract description 10
- 238000011835 investigation Methods 0.000 claims abstract description 9
- 238000007621 cluster analysis Methods 0.000 claims abstract description 4
- 238000012795 verification Methods 0.000 claims abstract description 4
- 238000009826 distribution Methods 0.000 claims description 16
- 230000000694 effects Effects 0.000 claims description 11
- 238000004364 calculation method Methods 0.000 claims description 10
- 238000006243 chemical reaction Methods 0.000 claims description 8
- 239000011159 matrix material Substances 0.000 claims description 8
- 238000005070 sampling Methods 0.000 claims description 8
- 238000004140 cleaning Methods 0.000 claims description 7
- 238000011160 research Methods 0.000 claims description 7
- 238000011156 evaluation Methods 0.000 claims description 4
- 238000010606 normalization Methods 0.000 claims description 4
- 238000004422 calculation algorithm Methods 0.000 claims description 3
- 230000006855 networking Effects 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 3
- 230000001502 supplementing effect Effects 0.000 claims description 3
- 238000012356 Product development Methods 0.000 abstract description 10
- 238000013139 quantization Methods 0.000 abstract description 3
- 238000000034 method Methods 0.000 description 13
- 230000002159 abnormal effect Effects 0.000 description 5
- 230000002776 aggregation Effects 0.000 description 5
- 238000004220 aggregation Methods 0.000 description 5
- 238000013461 design Methods 0.000 description 4
- 230000003993 interaction Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 239000004576 sand Substances 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 239000003245 coal Substances 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 206010039203 Road traffic accident Diseases 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000010705 motor oil Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 239000004575 stone Substances 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 238000002759 z-score normalization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0125—Traffic data processing
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0137—Measuring and analyzing of parameters relative to traffic conditions for specific applications
Landscapes
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及基于大数据的车辆应用场景分析方法,其特征在于:包含以下步骤:进行车型锁定操作,获得每辆车的运营数据;进行特征字段调研;进行特征数据计算;进行主成分分析;进行聚类分析;进行分类车辆特征统计;进行场景识别;进行终端验证;输出场景库。本发明提取不同场景之间不同特征,实现场景的参数化定义,为产品开发提供量化边界;解决了现有技术无法精准识别不同场景工况的差异的问题;可以说明不同场景对产品开发的具体量化要求,且不限于提供定性约束。
Description
技术领域
本发明涉及汽车动力性经济性仿真计算技术领域,具体地涉及基于大数据的车辆应用场景分析方法。
背景技术
应用场景是用户使用车辆的边界,定义用户场景是产品开发过程的源头,源头定义错误会导致整个产品开发方向走偏,因此,精准定义用户使用场景是开发出满足客户需求产品的核心。
目前,根据星云互联、德赛西威、金溢科技、北邮、华为、信通院、四维图新、长安汽车、中国移动、百度等三十余家单位起草的,历时一年半研究制定并发布的标准《合作式智能运输系统车用通信系统应用层及应用数据交互标准第二阶段》,将车辆的应用场景划分为了6大类:安全类、信息服务类、效率类、交通管理类、智能驾驶类、综合类,具体来说:
1.安全类,具体包括:
(1)感知数据共享。车辆和路侧单元RSU利用自身搭载摄像头、雷达等传感器等感知设备,探测周围其他交通参与者/道路异常情况,然后在V2X的支持下共享给周围的车辆,减少因为视距限制而出现的交通事故。
(2)协作式变道。车辆行驶过程中若想要变道,把自身的行驶意图通过V2X发送给周围车辆和路侧RSU,相关车辆接收到信息后做出调整,保证其安全完成变道。
(3)弱势群体安全通行。行人通过其无线通信设备与车辆进行通信,进行潜在的碰撞风险预警。
2.信息服务类,具体包括:
(1)差分数据服务。利用V2X交互实现车辆定位精度。
(2)车站路径引导服务。RSU在停车场、加油站、高速服务区等地方给进入的车辆提供位置服务信息。
3.效率类
协作式优先车辆(包括警车、消防车、救护车、工程抢险车、事故勘查车等)通行,未来也可以基于该场景提供差异化行车服务。智能交通系统调度交通资源针对优先车辆采取提前预留车道、封闭道路或切换信号灯等方式,让优先车辆在安全高效的情况下到达目的地,开启绿色通道。
4.交通管理类
数据采集,路侧设备RSU通过接收通信范围内车辆发送的信息(包括行驶状态、驾驶意图以及感知信息等)。
5.智能驾驶类
协作式车辆编队管理。由手动驾驶或者自动驾驶的头车带领,其后由若干自动驾驶车辆组成,呈一个队列的行驶形态前进,车队成员保持一定的车距以及稳定的车速,在有序行驶的状态下巡航。
6.综合类,具体包括:
(1)安全+效率场景。在高速公路或快速道路入口匝道处,路侧单元(RSU)获取周围车辆运行信息和行驶意图,发送车辆引导信息,协调匝道和主路汇入车道车辆,引导匝道车辆安全、高效的汇入主路。
(2)安全+效率场景,交叉路口协作式通行。向RSU发送车辆行驶信息,RSU根据车辆行驶信息、目标交叉路口的信号灯信息、其他车辆上报的行驶信息、以及路侧感知信息,适用于路口通行。
(3)效率+交通管理场景。针对交叉口的拥堵问题,通过交叉口处的动态划分车道功能可以实现对交叉口进口道的空间资源进行实时地合理分配。
(4)效率+信息服务场景。车辆行进到城市道路或高速公路的收费区域时,车辆接收路侧发布的收费信息,并通过车路交互完成缴费业务。收费站点部署V2XRSU设备,连接后台收费系统,车辆安装V2XOBU设备,当车辆进入收费区域,完成相互身份认证后,自动执行收费操作
现有方案是通过市场调研、用户问卷等形式得到用户场景的主观描述,对部分用户和区域市场的调研以及对用户意见的主观理解无法客户片面性和理解偏差问题。
现有技术也有少数采用人机交互的方式来适配车辆与应用场景,但不能解决根本问题。
典型如申请号为CN202210711810.2,名称为“一种车辆应用场景处理方法、装置、设备和存储介质”的中国发明专利申请,其公布了如下技术特征:
1.在确定具有车辆应用场景创建需求的情况下,展示车辆应用场景设计界面;其中,所述车辆应用场景设计界面包括车辆可选组件展示区和操作区;根据对所述车辆可选组件展示区内车辆可选组件的操作,确定目标组件,并将所述目标组件置于所述操作区;根据对所述操作区内目标组件的配置操作,生成车辆应用场景的应用逻辑;根据所述车辆应用场景的应用逻辑,生成车辆应用场景。
2.根据对所述操作区内目标组件的配置操作,确定所述操作区内目标组件的应用配置信息,以及所述操作区内目标组件之间的应用关系信息;根据所述应用配置信息和所述应用关系信息,生成车辆应用场景的应用逻辑。
3.根据对所述车辆可选组件展示区内车辆可选组件的拖拽操作,确定目标组件。
4.根据对所述车辆可选组件展示区内车辆可选组件的操作,确定目标组件,包括:对车辆可选组件进行更新,并在所述车辆可选组件展示区内展示更新后的车辆可选组件;根据对更新后的车辆可选组件的操作,确定目标组件。
5.获取应用场景使用请求;根据所述应用场景使用请求,从可选应用场景中选择目标应用场景。
6.根据实际场景需求,对所述目标应用场景的应用逻辑进行调整。
7.向云端上传所述车辆应用场景,以供其他车辆使用所述车辆应用场景。
8.还包含界面展示模块,用于在确定具有车辆应用场景创建需求的情况下,展示车辆应用场景设计界面;其中,所述车辆应用场景设计界面包括车辆可选组件展示区和操作区;目标组件确定模块,用于根据对所述车辆可选组件展示区内车辆可选组件的操作,确定目标组件,并将所述目标组件置于所述操作区;应用逻辑确定模块,用于根据对所述操作区内目标组件的配置操作,生成车辆应用场景的应用逻辑;车辆应用场景确定模块,用于根据所述车辆应用场景的应用逻辑,生成车辆应用场景。
现有技术的缺陷在于:
1.对部分用户和区域市场的调研以及对用户意见的主观理解无法客户片面性和理解偏差问题;
2.市场调研无法提供产品研发需求的量化边界。
发明内容
本发明针对上述问题,提供基于大数据的车辆应用场景分析方法,其目的在于提取不同场景之间不同特征,实现场景的参数化定义,为产品开发提供量化边界;解决了现有技术无法精准识别不同场景工况的差异的问题;可以说明不同场景对产品开发的具体量化要求,且不限于提供定性约束。
为解决上述问题,本发明提供的技术方案为:
一种基于大数据的车辆应用场景分析方法,包含以下步骤:
S100.进行车型锁定操作,获得每辆车的运营数据;
S200.进行特征字段调研;
S300.进行特征数据计算;
S400.进行主成分分析;
S500.进行聚类分析;
S600.进行分类车辆特征统计;
S700.进行场景识别;
S800.进行终端验证;
S900.输出场景库。
优选地,S100具体包含以下步骤:
S110.确定需要进行场景划分的车辆的在用车型和车辆清单;
S120.根据所述车辆清单从车联网平台逐一导出每辆车的所述运营数据;
S130.输出所述运营数据,作为S100的结果。
优选地,S200具体包含以下步骤:
S210.通过市场调研,获取的不同场景下的场景要素的差异点;然后通过所述差异点,确定特征字段;所述特征字段包含直接特征和间接特征;
S220.对所述特征字段进行识别,然后将所述特征字段分为所述直接特征和所述间接特征;
S230.对所述特征字段进行拆分,得到拆分后的特征参数值;
S240.输出所述S220~S240得到的所有的特征参数值,作为S200的结果。
优选地,S300具体包含以下步骤:
S310.按人工预设的采样频率和采样窗口,获取每辆车的原始数据;
然后进行数据清洗操作;
S320.根据所述特征参数的定义与所述原始数据,进行特征参数值计算操作;S330.进行特征参数值计算操作,作为S300的结果。
优选地,S400具体包含以下步骤:
S410.进行结果清洗操作;
S420.进行归一化处理操作;
S430.调用主成分分析算法进行样本向量特征值计算和特征向量计算;然后按照特征向量矩阵进行主成分坐标转换操作;
S440.输出进行所述主成分坐标转换操作后的所述特征向量矩阵,作为S400的结果。
优选地,S500具体包含以下步骤:
S510.进行动态聚类操作,得到不同的聚类效果;
S520.进行聚类评价操作,得到最合适的聚类数;
S530.按照所述最合适的聚类数,再进行所述动态聚类操作;
S540.根据轮廓系数筛选下四分位以上的样本点;去掉所述四分位以下的离群点后,计算聚类中心;
S550.输出划分好的类,作为S500的结果。
优选地,S600具体包含以下步骤:
S610.根据S500中所述划分好的类,对每一个类所包含的车辆进行总体特征分布统计操作,得到总体特征、总体特征分布和不同类之间的特征差异;
S620.输出所述总体特征、所述总体特征分布和所述特征差异,作为S600的结果。
优选地,S700具体包含以下步骤:
S710.从每个类中,随机选取人工预设个数的底盘号;然后查询每个所述底盘号对应的车辆当月的运营路线;
S720.根据每类车辆的所述运营路线及统计特征判断车辆运营场景;
S730.将所述车辆运营场景与应用场景定义对比,判断每一类车辆与输入的所述应用场景的对应关系;
S740.对于经过S730无法判断每一类车辆与输入的所述应用场景的对应关系的情况,补充特征,然后进行二次聚类操作。
优选地,S800具体包含以下步骤:
S810.根据每个所述底盘号对应的登记的电话号码,回访驾驶员,确认所述车辆运营场景,根据回访记录与S600所述应用场景的分类特征进行对比,判断场景识别是否正确;
S820.根据回访结果,做出如下操作:
如果回访结果确认所述车辆运营场景与所述应用场景的所述对应关系是正确的,则执行S900;
否则,返回并再次执行S500。
优选地,S900具体包含以下步骤:
S910.将识别出的所述对应关系的所述车辆运营场景与所述应用场景进行车辆运营特征统计,得到统计结果;所述统计结果包含典型值、参考值和诊断值;S920.将对应的所述统计结果填入到对应调研得到的应用场景清单中;
S930.将所有的所述车辆运营场景参数化,然后汇总在一起形成场景库;
S940.输出所述场景库,作为本发明的最终结果。
本发明与现有技术对比,具有以下优点:
1.由于本发明将市场上运营的车辆按照应用场景的不同进行划分,从而提取不同场景之间不同特征,实现场景的参数化定义,为产品开发提供量化边界;
2.由于本发明抛弃了传统的根据用途的场景定义方法,从而解决了现有技术无法精准识别不同场景工况的差异的问题;
3.由于本发明抛弃了传统的根据用途的场景定义方法,从而可以说明不同场景对产品开发的具体量化要求,且不限于提供定性约束。
附图说明
图1为本发明具体实施例的方法流程示意图;
图2为本发明具体实施例的主成分分析示意图;
图3a为本发明具体实施例的2类效果示意图;
图3b为本发明具体实施例的3类效果示意图;
图3c为本发明具体实施例的4类效果示意图;
图3d为本发明具体实施例的5类效果示意图;
图4为本发明具体实施例的手肘图示意图;
图5为本发明具体实施例的总体特征分布及特征差异示意图。
具体实施方式
下面结合具体实施例,进一步阐明本发明,应理解这些实施例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。
需要事先说明的是,本发明的原理在于:基于当前车载Tbox设备采集的用户运营数据进行特征的提取和聚类分析,得到不同的簇,因不同的簇内样本(车辆)具有相同的运营特征,可以视为一类,即为同一应用场景,同一应用场景内车辆共同特征进行参数化计算作为场景的特征。
如图1所示,一种基于大数据的车辆应用场景分析方法,其特征在于:包含以下步骤:
S100.进行车型锁定操作,获得每辆车的运营数据。
本具体实施例中,S100具体包含以下步骤:
S110.确定需要进行场景划分的车辆的在用车型和车辆清单。
S120.根据车辆清单从车联网平台逐一导出每辆车的运营数据。
S130.输出运营数据,作为S100的结果。
S200.进行特征字段调研。
本具体实施例中,S200具体包含以下步骤:
S210.通过市场调研,获取的不同场景下的场景要素的差异点;然后通过差异点,确定特征字段;特征字段包含直接特征和间接特征。
S220.对特征字段进行识别,然后将特征字段分为直接特征和间接特征。
本具体实施例中,在场景“资源运输-货-车货总重”中,场景要素微超砂石料的“车货总重”与其他相比为“复合超载”,因为其他均为“49t以内”,从而识别此场景要素为直接特征。
本具体实施例中,在场景“车(工况)-常用车速”中,场景要素资源运输与其他(煤炭、危险品等)不同,从而因此此场景要素为直接特征。
本具体实施例中,砂石料运输为重去空回,空满载比例为50%,从而识别场景要素空满载比例为间接特征。
需要说明的是,识别出来的直接特征和间接特征有一定的区别,即直接特征是不需要转化的特征,可以直接使用;例如载重49t,作为直接特征可以直接使用49作为特征值;而相对应的,间接特征需要转化才能使用;例如间接特征如为重去空回,空满载比例为1:1,则空满载比例为间接特征,特征参数值为1,这个过程就是一步转化过程。
本具体实施例中,将差异点“车货总重”转化为特征参数值“最大总重”。
S230.对特征字段进行拆分,得到拆分后的特征参数值。
本具体实施例中,将场景“车(工况)-常用车速”的特征参数值按区间进行拆分,按不同区间进行计算,而常用车速本身不参与计算。
S240.输出S220~S240得到的所有的特征参数值,作为S200的结果。
S300.进行特征数据计算。
本具体实施例中,S300具体包含以下步骤:
S310.按人工预设的采样频率和采样窗口,获取每辆车的原始数据。
本具体实施例中,通过每辆车的底盘号,在tsp平台查询每辆车的原始数据。
本具体实施例中,采样频率为1HZ。
本具体实施例中,采样窗口为近一个月。
然后进行数据清洗操作。
需要说明的是,数据清洗操作的作用在于:将完整性不足数据删除,且将异常数据修正或删除。
需要说明的是,对于异常数据,修正的情况相对较少,而大量异常数据则是需要进行删除。
本具体实施例中,“累计启停次数”通过“车速”与“油门”计算得到,车速为0开始,下一秒大于0且油门踏板开度大于10视为1次起步。
S320.根据特征参数的定义与原始数据,进行特征参数值计算操作;
S330.进行特征参数值计算操作,作为S300的结果。
本具体实施例中,常规车速按照车速区间进行切分;其中,车速区间包括区间0 -30KM。
S400.进行主成分分析。
本具体实施例中,S400具体包含以下步骤:
S410.进行结果清洗操作。
本具体实施例中,对于满足月运营里程>400,或1%<怠速时长占比<80%的条件的数据保留,其余数据删除。
S420.进行归一化处理操作;
需要说明的是,归一化处理操作的目的在于消除量纲带来的影响。
本具体实施例中,采用Z-score标准化,按式(1)表达:
需要说明的是,Z-Score通过式(1)将两组或多组数据转化为无单位的Z-Score分值,使得数据标准统一化,提高了数据可比性,削弱了数据解释性。
S430.调用主成分分析算法进行样本向量特征值计算和特征向量计算;然后按照特征向量矩阵进行主成分坐标转换操作。
如图2所示,需要说明的是,主成分分析,英文为Principal Component Analysis,PCA,是一种统计方法,通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量叫主成分。
如图2所示的二维变量,需要说明的是,样本在x和y方向上的分布相近,经过坐标系旋转(正交变换),在新的坐标系上,样本点在新坐标系x^轴上的投影长度明显大于y^,新坐标x^可认为是主成分。
S440.输出进行主成分坐标转换操作后的特征向量矩阵,作为S400的结果。
S500.进行聚类分析。
本具体实施例中,S500具体包含以下步骤:
S510.进行动态聚类操作,得到不同的聚类效果。
需要说明的是,动态聚类是在无法确定聚类数量的情况下,计算不同类的聚类效果。
如图3a~3d所示,依次为2-5类效果。
需要说明的是,图3a~3d中,每个点代表一个样本,x、y轴数值代表不同的特征参数值,不同颜色表示不同类。
S520.进行聚类评价操作,得到最合适的聚类数。
如图4所示,本具体实施例中,根据手肘图确定最合适的聚类数。
需要说明的是,手肘法的核心指标是SSE(sum of the squared errors,误差平方和),按下式表达:
其中:Ci是第i个簇;p是Ci中的样本点;mi是Ci的质心(Ci中所有样本的均值);SSE是所有样本的聚类误差,代表了聚类效果的好坏。
需要说明的是,手肘法的核心思想是:随着聚类数k的增大,样本划分会更加精细,每个簇的聚合程度会逐渐提高,那么误差平方和SSE自然会逐渐变小。并且,当k小于真实聚类数时,由于k的增大会大幅增加每个簇的聚合程度,故SSE的下降幅度会很大,而当k到达真实聚类数时,再增加k所得到的聚合程度回报会迅速变小,所以SSE的下降幅度会骤减,然后随着k值的继续增大而趋于平缓,也就是说SSE和k的关系图是一个手肘的形状,而这个肘部对应的k值就是数据的真实聚类数。
本具体实施例中,确定最合适的聚类数的原则为:根据拐点确定最合适的聚类数。
需要说明的是,图4中的拐点为4。
S530.按照最合适的聚类数,再进行动态聚类操作。
本具体实施例中,最合适的聚类数k=4。
S540.根据轮廓系数筛选下四分位以上的样本点;去掉四分位以下的离群点后,计算聚类中心。
需要说明的是,轮廓系数(Silhouette Coefficient),是聚类效果好坏的一种评价方式,对于一个样本点i来说:
计算ai=average(i到所有它属于的簇中其它点的距离);
计算bi=min(i到某一不包含它的簇内的所有点的平均距离);
那么i的轮廓系数Si就按式(2)表达:
可见轮廓系数的值是介于[-1,1],越趋近于1代表内聚度和分离度都相对较优。
将所有点的轮廓系数求平均,就是该聚类结果总的轮廓系数。
ai:i到同一簇内其他点不相似程度的平均值
bi:i到其他簇的平均不相似程度的最小值
S550.输出划分好的类,作为S500的结果。
S600.进行分类车辆特征统计。
本具体实施例中,S600具体包含以下步骤:
S610.根据S500中划分好的类,对每一个类所包含的车辆进行总体特征分布统计操作,得到总体特征、总体特征分布和不同类之间的特征差异;
本具体实施例中,每一个类所包含的车辆按照特征参数值进行总体特征分布。
如图5所示,本具体实施例中,统计形式包括但不局限于箱线图、柱状图、密度分布图等,主要体现不同类之间的特征差异。
S620.输出总体特征、总体特征分布和特征差异,作为S600的结果。
S700.进行场景识别。
本具体实施例中,场景识别的原理在于:根据不同类之间的特征差异,结合市场调研对每类场景的定性描述初判每类车辆属于哪种场景,给每辆车贴上场景标签。
本具体实施例中,S700具体包含以下步骤:
S710.从每个类中,随机选取人工预设个数的底盘号;然后查询每个底盘号对应的车辆当月的运营路线。
本具体实施例中,人工预设个数为5个。
本具体实施例中,在tsp平台查询每个底盘号对应的车辆当月的运营路线。
S720.根据每类车辆的运营路线及统计特征判断车辆运营场景。
本具体实施例中,对于砂石料场景:单程运距<200KM,常用车速40-50,城市周边运输、国道为主。
本具体实施例中,对于煤炭专线:集中在陕西、山西,单程运距700-1000KM,高速为主。
S730.将车辆运营场景与应用场景定义对比,判断每一类车辆与输入的应用场景的对应关系。
S740.对于经过S730无法判断每一类车辆与输入的应用场景的对应关系的情况,补充特征,然后进行二次聚类操作。
需要说明的是,S740也叫例外处理,因为实际工况、环境非常复杂,总有无法一次性对应的情形出现,因此需要有一个兜底的技术方案,避免发生遗漏或错误。
S800.进行终端验证。
本具体实施例中,S800具体包含以下步骤:
S810.根据每个底盘号对应的登记的电话号码,回访驾驶员,确认车辆运营场景,根据回访记录特征与S600应用场景的分类特征进行对比,判断场景识别是否正确;
S820.根据回访与应用场景的对应关系。
本具体实施例中,车辆运营场景有如下三种:
(1)统计数据月用户货物类型;
(2)道路类型(国道高速占比);
(3)典型路线(起始地目的地)。
本具体实施例中,选择用户原则为:随机抽样10个。
本具体实施例中,回访问题包括但不限于:统计数据月用户货物类型;道路类型(国道高速占比);典型路线(起始地目的地)。
S820.根据回访结果,做出如下操作:
如果回访结果确认车辆运营场景与应用场景的对应关系是正确的,则执行S900。
否则,返回并再次执行S500。
S900.输出场景库。
本具体实施例中,S900具体包含以下步骤:
S910.将识别出的对应关系的车辆运营场景与应用场景进行车辆运营特征统计,得到统计结果;统计结果包含典型值、参考值和诊断值。
本具体实施例中,典型值为开发边界;
本具体实施例中,参考值作为产品开发的基准;
本具体实施例中,诊断值作为在用产品状态的说明。
本具体实施例中,怠速占比、车速分布、月运营里程等为典型值。
本具体实施例中,档位分布、转速分布等与行为相关的为参考值。
本具体实施例中,水温、机油温、进气温度等发动机运行边界为诊断值。
S920.将对应的统计结果填入到对应调研得到的应用场景清单中。
S930.将所有的车辆运营场景参数化,然后汇总在一起形成场景库。
S940.输出场景库,作为本发明的最终结果。
在上述的详细描述中,各种特征一起组合在单个的实施方案中,以简化本公开。不应该将这种公开方法解释为反映了这样的意图,即,所要求保护的主题的实施方案需要比清楚地在每个权利要求中所陈述的特征更多的特征。相反,如所附的权利要求书所反映的那样,本发明处于比所公开的单个实施方案的全部特征少的状态。因此,所附的权利要求书特此清楚地被并入详细描述中,其中每项权利要求独自作为本发明单独的优选实施方案。
为使本领域内的任何技术人员能够实现或者使用本发明,上面对所公开实施例进行了描述。对于本领域技术人员来说;这些实施例的各种修改方式都是显而易见的,并且本文定义的一般原理也可以在不脱离本公开的精神和保护范围的基础上适用于其它实施例。因此,本公开并不限于本文给出的实施例,而是与本申请公开的原理和新颖性特征的最广范围相一致。
上文的描述包括一个或多个实施例的举例。当然,为了描述上述实施例而描述部件或方法的所有可能的结合是不可能的,但是本领域普通技术人员应该认识到,各个实施例可以做进一步的组合和排列。因此,本文中描述的实施例旨在涵盖落入所附权利要求书的保护范围内的所有这样的改变、修改和变型。此外,就说明书或权利要求书中使用的术语“包含”,该词的涵盖方式类似于术语“包括”,就如同“包括,”在权利要求中用作衔接词所解释的那样。此外,使用在权利要求书的说明书中的任何一个术语“或”是要表示“非排它性的或者”。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于大数据的车辆应用场景分析方法,其特征在于:包含以下步骤:
S100.进行车型锁定操作,获得每辆车的运营数据;
S200.进行特征字段调研;
S300.进行特征数据计算;
S400.进行主成分分析;
S500.进行聚类分析;
S600.进行分类车辆特征统计;
S700.进行场景识别;
S800.进行终端验证;
S900.输出场景库。
2.根据权利要求1所述的基于大数据的车辆应用场景分析方法,其特征在于:S100具体包含以下步骤:
S110.确定需要进行场景划分的车辆的在用车型和车辆清单;
S120.根据所述车辆清单从车联网平台逐一导出每辆车的所述运营数据;
S130.输出所述运营数据,作为S100的结果。
3.根据权利要求2所述的基于大数据的车辆应用场景分析方法,其特征在于:S200具体包含以下步骤:
S210.通过市场调研,获取的不同场景下的场景要素的差异点;然后通过所述差异点,确定特征字段;所述特征字段包含直接特征和间接特征;
S220.对所述特征字段进行识别,然后将所述特征字段分为所述直接特征和所述间接特征;
S230.对所述特征字段进行拆分,得到拆分后的特征参数值;
S240.输出所述S220~S240得到的所有的特征参数值,作为S200的结果。
4.根据权利要求3所述的基于大数据的车辆应用场景分析方法,其特征在于:S300具体包含以下步骤:
S310.按人工预设的采样频率和采样窗口,获取每辆车的原始数据;
然后进行数据清洗操作;
S320.根据所述特征参数的定义与所述原始数据,进行特征参数值计算操作;
S330.进行特征参数值计算操作,作为S300的结果。
5.根据权利要求4所述的基于大数据的车辆应用场景分析方法,其特征在于:S400具体包含以下步骤:
S410.进行结果清洗操作;
S420.进行归一化处理操作;
S430.调用主成分分析算法进行样本向量特征值计算和特征向量计算;然后按照特征向量矩阵进行主成分坐标转换操作;
S440.输出进行所述主成分坐标转换操作后的所述特征向量矩阵,作为S400的结果。
6.根据权利要求5所述的基于大数据的车辆应用场景分析方法,其特征在于:S500具体包含以下步骤:
S510.进行动态聚类操作,得到不同的聚类效果;
S520.进行聚类评价操作,得到最合适的聚类数;
S530.按照所述最合适的聚类数,再进行所述动态聚类操作;
S540.根据轮廓系数筛选下四分位以上的样本点;去掉所述四分位以下的离群点后,计算聚类中心;
S550.输出划分好的类,作为S500的结果。
7.根据权利要求6所述的基于大数据的车辆应用场景分析方法,其特征在于:S600具体包含以下步骤:
S610.根据S500中所述划分好的类,对每一个类所包含的车辆进行总体特征分布统计操作,得到总体特征、总体特征分布和不同类之间的特征差异;
S620.输出所述总体特征、所述总体特征分布和所述特征差异,作为S600的结果。
8.根据权利要求7所述的基于大数据的车辆应用场景分析方法,其特征在于:S700具体包含以下步骤:
S710.从每个类中,随机选取人工预设个数的底盘号;然后查询每个所述底盘号对应的车辆当月的运营路线;
S720.根据每类车辆的所述运营路线及统计特征判断车辆运营场景;
S730.将所述车辆运营场景与应用场景定义对比,判断每一类车辆与输入的所述应用场景的对应关系;
S740.对于经过S730无法判断每一类车辆与输入的所述应用场景的对应关系的情况,补充特征,然后进行二次聚类操作。
9.根据权利要求8所述的基于大数据的车辆应用场景分析方法,其特征在于:S800具体包含以下步骤:
S810.根据每个所述底盘号对应的登记的电话号码,回访驾驶员,确认所述车辆运营场景,根据回访记录与S600所述应用场景的分类特征进行对比,判断场景识别是否正确;
S820.根据回访结果,做出如下操作:
如果回访结果确认所述车辆运营场景与所述应用场景的所述对应关系是正确的,则执行S900;
否则,返回并再次执行S500。
10.根据权利要求9所述的基于大数据的车辆应用场景分析方法,其特征在于:S900具体包含以下步骤:
S910.将识别出的所述对应关系的所述车辆运营场景与所述应用场景进行车辆运营特征统计,得到统计结果;所述统计结果包含典型值、参考值和诊断值;
S920.将对应的所述统计结果填入到对应调研得到的应用场景清单中;
S930.将所有的所述车辆运营场景参数化,然后汇总在一起形成场景库;
S940.输出所述场景库,作为本发明的最终结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211509540.3A CN116110222A (zh) | 2022-11-29 | 2022-11-29 | 基于大数据的车辆应用场景分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211509540.3A CN116110222A (zh) | 2022-11-29 | 2022-11-29 | 基于大数据的车辆应用场景分析方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116110222A true CN116110222A (zh) | 2023-05-12 |
Family
ID=86260557
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211509540.3A Pending CN116110222A (zh) | 2022-11-29 | 2022-11-29 | 基于大数据的车辆应用场景分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116110222A (zh) |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104463241A (zh) * | 2014-10-31 | 2015-03-25 | 北京理工大学 | 一种智能交通监控系统中的车辆类型识别方法 |
CN110296708A (zh) * | 2019-07-01 | 2019-10-01 | 百度在线网络技术(北京)有限公司 | 运营路线规划方法、装置及存储介质 |
CN110516746A (zh) * | 2019-08-29 | 2019-11-29 | 吉林大学 | 一种基于无标签数据的驾驶员跟车行为风格分类方法 |
CN111144015A (zh) * | 2019-12-30 | 2020-05-12 | 吉林大学 | 一种自动驾驶汽车虚拟场景库构建方法 |
CN111626366A (zh) * | 2020-05-28 | 2020-09-04 | 南京航空航天大学 | 基于运行特征的区域扇区场景相似识别方法 |
CN112036297A (zh) * | 2020-08-28 | 2020-12-04 | 长安大学 | 基于网联车辆驾驶数据的典型与极限场景划分与提取方法 |
CN113343881A (zh) * | 2021-06-21 | 2021-09-03 | 浪潮云信息技术股份公司 | 基于深度学习的车辆品牌型号细粒度分类系统及方法 |
WO2022027873A1 (zh) * | 2020-08-05 | 2022-02-10 | 智慧互通科技有限公司 | 基于多模态信息融合的车辆再识别方法及装置 |
CN114331568A (zh) * | 2022-03-04 | 2022-04-12 | 中汽信息科技(天津)有限公司 | 基于车联网的商用车细分市场识别方法、设备和介质 |
CN114399164A (zh) * | 2021-12-17 | 2022-04-26 | 东风柳州汽车有限公司 | 一种汽车配置需求分析方法 |
CN114899459A (zh) * | 2022-05-12 | 2022-08-12 | 北京亿华通科技股份有限公司 | 一种用于燃料电池发动机的运维控制方法及装置 |
CN115092165A (zh) * | 2022-06-24 | 2022-09-23 | 吉林大学 | 一种基于聚类模型的不同循环工况下驾驶员风格辨识方法 |
WO2022199500A1 (zh) * | 2021-03-22 | 2022-09-29 | 华为技术有限公司 | 一种模型训练方法、场景识别方法及相关设备 |
-
2022
- 2022-11-29 CN CN202211509540.3A patent/CN116110222A/zh active Pending
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104463241A (zh) * | 2014-10-31 | 2015-03-25 | 北京理工大学 | 一种智能交通监控系统中的车辆类型识别方法 |
CN110296708A (zh) * | 2019-07-01 | 2019-10-01 | 百度在线网络技术(北京)有限公司 | 运营路线规划方法、装置及存储介质 |
CN110516746A (zh) * | 2019-08-29 | 2019-11-29 | 吉林大学 | 一种基于无标签数据的驾驶员跟车行为风格分类方法 |
CN111144015A (zh) * | 2019-12-30 | 2020-05-12 | 吉林大学 | 一种自动驾驶汽车虚拟场景库构建方法 |
CN111626366A (zh) * | 2020-05-28 | 2020-09-04 | 南京航空航天大学 | 基于运行特征的区域扇区场景相似识别方法 |
WO2022027873A1 (zh) * | 2020-08-05 | 2022-02-10 | 智慧互通科技有限公司 | 基于多模态信息融合的车辆再识别方法及装置 |
CN112036297A (zh) * | 2020-08-28 | 2020-12-04 | 长安大学 | 基于网联车辆驾驶数据的典型与极限场景划分与提取方法 |
WO2022199500A1 (zh) * | 2021-03-22 | 2022-09-29 | 华为技术有限公司 | 一种模型训练方法、场景识别方法及相关设备 |
CN113343881A (zh) * | 2021-06-21 | 2021-09-03 | 浪潮云信息技术股份公司 | 基于深度学习的车辆品牌型号细粒度分类系统及方法 |
CN114399164A (zh) * | 2021-12-17 | 2022-04-26 | 东风柳州汽车有限公司 | 一种汽车配置需求分析方法 |
CN114331568A (zh) * | 2022-03-04 | 2022-04-12 | 中汽信息科技(天津)有限公司 | 基于车联网的商用车细分市场识别方法、设备和介质 |
CN114899459A (zh) * | 2022-05-12 | 2022-08-12 | 北京亿华通科技股份有限公司 | 一种用于燃料电池发动机的运维控制方法及装置 |
CN115092165A (zh) * | 2022-06-24 | 2022-09-23 | 吉林大学 | 一种基于聚类模型的不同循环工况下驾驶员风格辨识方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107067722B (zh) | 一种车辆行驶工况构建方法 | |
US9919715B2 (en) | Vehicle mode scheduling with learned user preferences | |
US20220299324A1 (en) | Accident fault detection based on multiple sensor devices | |
Förster et al. | Data-driven identification of characteristic real-driving cycles based on k-means clustering and mixed-integer optimization | |
CN111354193B (zh) | 一种基于5g通信的高速公路车辆异常行为预警系统 | |
EP2428944A1 (en) | Driving management system and method | |
CN111565361A (zh) | 基于v2v的车辆紧急制动预警系统的测试方法及测试系统 | |
CN103050013B (zh) | 基于车联网技术的车辆分级限速监控方法及其装置 | |
CN113155173B (zh) | 感知性能评测方法、装置、电子装置和存储介质 | |
CN109885639B (zh) | 可视化的出租车上下车特征分析方法 | |
CN110044639A (zh) | 一种基于实车运行大数据平台的细分市场商用车md-vtd系统 | |
CN105869402B (zh) | 基于多类型浮动车数据的高速公路路段速度修正方法 | |
CN109493606B (zh) | 一种高速公路上违停车辆的识别方法及系统 | |
US10937103B1 (en) | Machine learning based accident assessment | |
CN111402586A (zh) | 基于车联网的公路气象环境预报预警控制系统和方法 | |
CN110610153A (zh) | 一种用于自动驾驶的车道识别方法及系统 | |
CN108665084B (zh) | 一种对驾驶风险的预测方法及系统 | |
CN112907955A (zh) | 一种基于信息融合的车路协同系统的评价方法 | |
CN113553548B (zh) | 一种基于车联网大数据的实际运行工况VSPBin划分方法 | |
CN114912689A (zh) | 基于地图网格索引和xgboost的超限车辆目的地预测方法及系统 | |
Rosero et al. | Assessing on-road emissions from urban buses in different traffic congestion scenarios by integrating real-world driving, traffic, and emissions data | |
CN116110222A (zh) | 基于大数据的车辆应用场景分析方法 | |
Vieira et al. | Public transport occupancy estimation using WLAN probing and mathematical modeling | |
CN115497306A (zh) | 一种基于gis数据的速度区间权重计算方法 | |
CN115938155A (zh) | 一种路侧停车位的智能检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |