CN118132627A - 一种基于大数据分析技术的车型置信度解决方法 - Google Patents
一种基于大数据分析技术的车型置信度解决方法 Download PDFInfo
- Publication number
- CN118132627A CN118132627A CN202410556184.3A CN202410556184A CN118132627A CN 118132627 A CN118132627 A CN 118132627A CN 202410556184 A CN202410556184 A CN 202410556184A CN 118132627 A CN118132627 A CN 118132627A
- Authority
- CN
- China
- Prior art keywords
- data
- vehicle
- vehicle type
- weight
- auditing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 22
- 238000005516 engineering process Methods 0.000 title claims abstract description 18
- 238000007405 data analysis Methods 0.000 title claims abstract description 17
- 238000004458 analytical method Methods 0.000 claims abstract description 51
- 238000004140 cleaning Methods 0.000 claims abstract description 5
- 239000003086 colorant Substances 0.000 claims description 11
- 230000009286 beneficial effect Effects 0.000 abstract 1
- 238000012550 audit Methods 0.000 description 13
- 238000004364 calculation method Methods 0.000 description 3
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于大数据分析技术的车型置信度解决方法,包括以下步骤:步骤S1:利用Sqoop对收费通行数据、稽核数据、发行数据、入口治超等数据进行汇聚、清洗形成车型分析的原始数据存储到Hive数据仓库中;步骤S2:对以上各维度数据进行车型初步分析,选取关键字段形成初步分析记录表;步骤S3:利用初步分析记录表中的数据进行二次分析,通过初始置信度和最终数据权重进行混合运算得出最终车型置信度。本发明涉及电子信息技术技术领域,本发明的有益效果是,是通过对已固化的各维度的车型相关数据进行全面的收集和汇聚,并分析形成可供车型置信度分析的中间结果数据,最终通过混合运算的方式形成车型置信度结果数据。
Description
技术领域
本发明涉及电子信息技术领域,特别是一种基于大数据分析技术的车型置信度解决方法。
背景技术
目前在车型置信度的解决方案里主要以图像识别的方案为主,即通过建设特定角度的抓拍设备,对抓拍的图像和视频进行分析,从而得出车型和置信度。该方案的缺点首先是需要进行硬件设备的安装部署,如果有些应用场景无法安装抓拍设备,则该方案将无法实施;其次该方案对设备的安装角度等环境要求较高,如果环境不良将影响识别的准确度;再次该方案需要较大的资金投入,对于低成本项目将不具有适用性;最后该方案是基于图像分析识别,其识别的速度一般在300ms左右,其速度相对较慢。
发明内容
本发明的目的是为了解决上述问题,设计了一种基于大数据分析技术的车型置信度解决方法。
实现上述目的本发明的技术方案为,一种基于大数据分析技术的车型置信度解决方法,包括以下步骤:
步骤S1:利用Sqoop对收费通行数据、稽核数据、发行数据、入口治超、省界门架车型识别数据进行汇聚、清洗形成车型分析的原始数据存储到Hive数据仓库中;
步骤S2:对以上各维度数据进行车型初步分析统计,选取关键字段形成初步分析记录表;
步骤S3:利用初步分析记录表中的数据进行二次分析,通过初始置信度和最终数据权重进行混合运算得出最终车型置信度。
所述步骤S1中:发行数据将最新在用发行数据的车牌号、颜色、车型、发行日期、车种、等字段进行摘取并存储到步骤S2中的初步分析记录表中,并标记来源为发行数据,事件日期为发行日期,初始置信度从数据字典获取发行数据的初始置信度,该数据每辆车只有一条。
所述步骤S1中:将稽核数据中最新车辆稽核记录的车牌号、颜色、车型、稽核日期、车种等字段进行摘取并存储到步骤S2中的初步分析记录表中,并标记来源为稽核数据,事件日期为稽核日期,初始置信度从数据字典获取稽核数据的初始置信度,该数据每辆车只有一条。
所述步骤S1中:将通行数据中近三年内的近期的20条通行记录按车牌号、颜色、车型、车种进行分组查询,该车不同车型、车种的通行次数占比作为初始置信度,事件日期为最近一次通行日期,将此次查询数据结果存储到步骤S2中的初步分析记录表中,来源记录为通行数据。
所述步骤S1中:将入口治超数据中近三年内的近期的20条通行记录按车牌号、颜色、车型、车种进行分组查询,该车不同车型、车种的通行次数占比作为初始置信度,事件日期为最近一次通行日期,将此次查询数据结果存储到步骤S2中的初步分析记录表中,来源记录为入口治超数据。
所述步骤S1中:将车型识别数据中最新一条数据的车牌号、颜色、车型、稽核日期、车种等字段进行摘取并存储到步骤S2中的初步分析记录表中,初始置信度为设备的车型识别可信度字段值,记录来源为车型识别,事件日期为此次通行日期。
所述步骤S3中:判断车辆是否有稽核数据,如果有稽核数据则获取权重字典表中的稽核权重记为稽核数据的最终权重,如果没有则将稽核初始权重值加到通行数据权重上。
所述步骤S3中:判断车辆是否有发行数据,如果有发行数据则获取权重字典表中的发行权重记为发行数据的最终权重,如果没有则将发行初始权重值加到通行数据权重上;判断车辆是否有车型识别数据,如果有车型识别数据则获取权重字典表中的车型识别权重记为车型识别数据的最终权重,如果没有则将车型识别初始权重值加到通行数据权重上。
所述步骤S3中:判断车辆是否有入口治超数据,如果有入口治超数据则获取权重字典表中的入口治超权重记为入口治超数据的最终权重,如果没有则将入口治超初始权重值加到通行数据权重上。
所述步骤S3中:最终得到的累加后的通行数据权重为通行数据的最终权重;用每辆车不同数据来源的初始置信度乘以最终权重的值再相加,得到该车辆的最终车型置信度。
利用本发明的技术方案制作的一种基于大数据分析技术的车型置信度解决方法,是通过对已固化的各维度的车型相关数据进行全面的收集和汇聚,并进行必要的数据清洗形成可供车型置信度分析的中间结果数据,对该数据进行进一步的初始置信度计算、置信权重分配并进行整合计算的分析,形成车型置信度结果数据,该数据可以同时数据接口服务调取,为收费车道判型、无人化车道收费提供切实可行的数据支撑。该解决方案从大数据分析技术出发,利用业务数据的规律进行多维分析,得出车型置信度,对于无车牌识别设备的场景也可以应用,因此方案的应用不受物理环境的影响,而且成本更低。由于系统是后台分析后的结果数据作为数据服务的基础,因此数据结果调取的速度非常快,可达到100ms以内,整个数据调取速度提升至少3倍以上。
附图说明
图1是本发明所述一种基于大数据分析技术的车型置信度解决方法的结构示意图;
具体实施方式
下面结合附图对本发明进行具体描述,如图1所示,一种基于大数据分析技术的车型置信度解决方法,包括以下步骤:步骤S1:利用Sqoop对收费通行数据、稽核数据、发行数据、入口治超、省界门架车型识别数据进行汇聚、清洗形成车型分析的原始数据存储到Hive数据仓库中;步骤S2:对以上各维度数据进行车型初步分析统计,选取关键字段形成初步分析记录表;步骤S3:利用初步分析记录表中的数据进行二次分析,通过初始置信度和最终数据权重进行混合运算得出最终车型置信度,所述步骤S1中:发行数据将最新在用发行数据的车牌号、颜色、车型、发行日期、车种、等字段进行摘取并存储到步骤S2中的初步分析记录表中,并标记来源为发行数据,事件日期为发行日期,初始置信度从数据字典获取发行数据的初始置信度,该数据每辆车只有一条,所述步骤S1中:将稽核数据中最新车辆稽核记录的车牌号、颜色、车型、稽核日期、车种等字段进行摘取并存储到步骤S2中的初步分析记录表中,并标记来源为稽核数据,事件日期为稽核日期,初始置信度从数据字典获取稽核数据的初始置信度,该数据每辆车只有一条,所述步骤S1中:将通行数据中近三年内的近期的20条通行记录按车牌号、颜色、车型、车种进行分组查询,该车不同车型、车种的通行次数占比作为初始置信度,事件日期为最近一次通行日期,将此次查询数据结果存储到步骤S2中的初步分析记录表中,来源记录为通行数据。所述步骤S1中:将入口治超数据中近三年内的近期的20条通行记录按车牌号、颜色、车型、车种进行分组查询,该车不同车型、车种的通行次数占比作为初始置信度,事件日期为最近一次通行日期,将此次查询数据结果存储到步骤S2中的初步分析记录表中,来源记录为入口治超数据。所述步骤S1中:将车型识别数据中最新一条数据的车牌号、颜色、车型、稽核日期、车种等字段进行摘取并存储到步骤S2中的初步分析记录表中,初始置信度为设备的车型识别可信度字段值,记录来源为车型识别,事件日期为此次通行日期,所述步骤S3中:判断车辆是否有稽核数据,如果有稽核数据则获取权重字典表中的稽核权重记为稽核数据的最终权重,如果没有则将稽核初始权重值加到通行数据权重上。所述步骤S3中:判断车辆是否有发行数据,如果有发行数据则获取权重字典表中的发行权重记为发行数据的最终权重,如果没有则将发行初始权重值加到通行数据权重上;判断车辆是否有车型识别数据,如果有车型识别数据则获取权重字典表中的车型识别权重记为车型识别数据的最终权重,如果没有则将车型识别初始权重值加到通行数据权重上。所述步骤S3中:判断车辆是否有入口治超数据,如果有入口治超数据则获取权重字典表中的入口治超权重记为入口治超数据的最终权重,如果没有则将入口治超初始权重值加到通行数据权重上。所述步骤S3中:最终得到的累加后的通行数据权重为通行数据的最终权重;用每辆车不同数据来源的初始置信度乘以最终权重的值再相加,得到该车辆的最终车型置信度。
本实施方案的特点为,初始置信度确定规则的技术方法、权重浮动规则的技术方法、最终权重的确定的规则方法、最终车型置信度通过初始置信度和最终权重进行混合计算的技术方法。
在本实施方案中,第一步利用Sqoop对收费通行数据、稽核数据、发行数据、入口治超、省界门架车型识别数据进行汇聚、清洗形成车型分析的原始数据存储到Hive数据仓库中,然后对以上各维度数据进行车型初步分析统计,选取关键字段形成初步分析记录表。具体方式是发行数据将最新在用发行数据的车牌号、颜色、车型、发行日期、车种、等字段进行摘取并存储到初步分析记录表中,并标记来源为发行数据,事件日期为发行日期,初始置信度从数据字典获取发行数据的初始置信度(该置信度通过对发行数据中的可明确车型的数据占比获得,牵引车、集装箱车为非可明确车型数据),该数据每辆车只有一条;将稽核数据中最新车辆稽核记录的车牌号、颜色、车型、稽核日期、车种等字段进行摘取并存储到初步分析记录表中,并标记来源为稽核数据,事件日期为稽核日期,初始置信度从数据字典获取稽核数据的初始置信度(该置信度为稽核数据中同一车辆有且只有一种车型的车辆占比获得),该数据每辆车只有一条;将通行数据中近三年内的近期的20条通行记录按车牌号、颜色、车型、车种进行分组查询,该车不同车型、车种的通行次数占比作为初始置信度,事件日期为最近一次通行日期,将此次查询数据结果存储到初步分析记录表中,来源记录为通行数据;将入口治超数据中近三年内的近期的20条通行记录按车牌号、颜色、车型、车种进行分组查询,该车不同车型、车种的通行次数占比作为初始置信度,事件日期为最近一次通行日期,将此次查询数据结果存储到初步分析记录表中,来源记录为入口治超数据;将车型识别数据中最新一条数据的车牌号、颜色、车型、稽核日期、车种等字段进行摘取并存储到初步分析记录表中,初始置信度为设备的车型识别可信度字段值,记录来源为车型识别,事件日期为此次通行日期;至此完整的初步分析记录表数据已完成分析。
第二步利用初步分析记录表中的数据进行二次分析,通过初始置信度和最终数据权重进行混合运算得出最终车型置信度。具体方式是判断车辆是否有稽核数据,如果有稽核数据则获取权重字典表(该表中的初始权重根据经验分配确定)中的稽核权重记为稽核数据的最终权重,如果没有则将稽核初始权重值加到通行数据权重上;判断车辆是否有发行数据,如果有发行数据则获取权重字典表中的发行权重记为发行数据的最终权重,如果没有则将发行初始权重值加到通行数据权重上;判断车辆是否有车型识别数据,如果有车型识别数据则获取权重字典表中的车型识别权重记为车型识别数据的最终权重,如果没有则将车型识别初始权重值加到通行数据权重上;判断车辆是否有入口治超数据,如果有入口治超数据则获取权重字典表中的入口治超权重记为入口治超数据的最终权重,如果没有则将入口治超初始权重值加到通行数据权重上;最终得到的累加后的通行数据权重为通行数据的最终权重;用每辆车不同数据来源的初始置信度乘以最终权重的值再相加,得到该车辆的最终车型置信度。
上述技术方案仅体现了本发明技术方案的优选技术方案,本技术领域的技术人员对其中某些部分所可能做出的一些变动均体现了本发明的原理,属于本发明的保护范围之内。
Claims (7)
1.一种基于大数据分析技术的车型置信度解决方法,其特征在于,包括以下步骤:
步骤S1:利用Sqoop对收费通行数据、稽核数据、发行数据、入口治超、省界门架车型识别数据进行汇聚、清洗形成车型分析的原始数据存储到Hive数据仓库中;
步骤S2:对以上各维度数据进行车型初步分析统计,选取关键字段形成初步分析记录表;
步骤S3:利用初步分析记录表中的数据进行二次分析,通过初始置信度和最终数据权重进行混合运算得出最终车型置信度;
判断车辆是否有稽核数据,如果有稽核数据则获取权重字典表中的稽核权重记为稽核数据的最终权重,如果没有则将稽核初始权重值加到通行数据权重上;
判断车辆是否有发行数据,如果有发行数据则获取权重字典表中的发行权重记为发行数据的最终权重,如果没有则将发行初始权重值加到通行数据权重上;判断车辆是否有车型识别数据,如果有车型识别数据则获取权重字典表中的车型识别权重记为车型识别数据的最终权重,如果没有则将车型识别初始权重值加到通行数据权重上;
判断车辆是否有入口治超数据,如果有入口治超数据则获取权重字典表中的入口治超权重记为入口治超数据的最终权重,如果没有则将入口治超初始权重值加到通行数据权重上。
2.根据权利要求1所述的一种基于大数据分析技术的车型置信度解决方法,其特征在于,所述步骤S1中:发行数据将最新在用发行数据的车牌号、颜色、车型、发行日期、车种字段进行摘取并存储到步骤S2中的初步分析记录表中,并标记来源为发行数据,事件日期为发行日期,初始置信度从数据字典获取发行数据的初始置信度,该数据每辆车只有一条。
3.根据权利要求1所述的一种基于大数据分析技术的车型置信度解决方法,其特征在于,所述步骤S1中:将稽核数据中最新车辆稽核记录的车牌号、颜色、车型、稽核日期、车种字段进行摘取并存储到步骤S2中的初步分析记录表中,并标记来源为稽核数据,事件日期为稽核日期,初始置信度从数据字典获取稽核数据的初始置信度,该数据每辆车只有一条。
4.根据权利要求1所述的一种基于大数据分析技术的车型置信度解决方法,其特征在于,所述步骤S1中:将通行数据中近三年内的近期的20条通行记录按车牌号、颜色、车型、车种进行分组查询,该车不同车型、车种的通行次数占比作为初始置信度,事件日期为最近一次通行日期,将此次查询数据结果存储到步骤S2中的初步分析记录表中,来源记录为通行数据。
5.根据权利要求1所述的一种基于大数据分析技术的车型置信度解决方法,其特征在于,所述步骤S1中:将入口治超数据中近三年内的近期的20条通行记录按车牌号、颜色、车型、车种进行分组查询,该车不同车型、车种的通行次数占比作为初始置信度,事件日期为最近一次通行日期,将此次查询数据结果存储到步骤S2中的初步分析记录表中,来源记录为入口治超数据。
6.根据权利要求1所述的一种基于大数据分析技术的车型置信度解决方法,其特征在于,所述步骤S1中:将车型识别数据中最新一条数据的车牌号、颜色、车型、稽核日期、车种字段进行摘取并存储到步骤S2中的初步分析记录表中,初始置信度为设备的车型识别可信度字段值,记录来源为车型识别,事件日期为此次通行日期。
7.根据权利要求1所述的一种基于大数据分析技术的车型置信度解决方法,其特征在于,所述步骤S3中:最终得到的累加后的通行数据权重为通行数据的最终权重;用每辆车不同数据来源的初始置信度乘以最终权重的值再相加,得到该车辆的最终车型置信度。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410556184.3A CN118132627B (zh) | 2024-05-07 | 一种基于大数据分析技术的车型置信度解决方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410556184.3A CN118132627B (zh) | 2024-05-07 | 一种基于大数据分析技术的车型置信度解决方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN118132627A true CN118132627A (zh) | 2024-06-04 |
CN118132627B CN118132627B (zh) | 2024-07-09 |
Family
ID=
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190228593A1 (en) * | 2016-02-18 | 2019-07-25 | South China University Of Technology | Toll road network traffic information collection and guidance system based on route identification system |
CN111783638A (zh) * | 2020-06-30 | 2020-10-16 | 山东鼎高信息技术有限公司 | 一种检测车辆轮轴数及车型识别的系统、方法 |
CN113869196A (zh) * | 2021-09-27 | 2021-12-31 | 中远海运科技股份有限公司 | 一种基于激光点云数据多特征分析的车型分类方法及装置 |
CN116129655A (zh) * | 2022-12-01 | 2023-05-16 | 西安航天三沃机电设备有限责任公司 | 一种应用于治超非现场执法系统的车辆信息匹配方法 |
CN116543242A (zh) * | 2023-07-07 | 2023-08-04 | 北京千方科技股份有限公司 | 基于高速收费数据的车型检测方法、装置、设备及介质 |
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190228593A1 (en) * | 2016-02-18 | 2019-07-25 | South China University Of Technology | Toll road network traffic information collection and guidance system based on route identification system |
CN111783638A (zh) * | 2020-06-30 | 2020-10-16 | 山东鼎高信息技术有限公司 | 一种检测车辆轮轴数及车型识别的系统、方法 |
CN113869196A (zh) * | 2021-09-27 | 2021-12-31 | 中远海运科技股份有限公司 | 一种基于激光点云数据多特征分析的车型分类方法及装置 |
CN116129655A (zh) * | 2022-12-01 | 2023-05-16 | 西安航天三沃机电设备有限责任公司 | 一种应用于治超非现场执法系统的车辆信息匹配方法 |
CN116543242A (zh) * | 2023-07-07 | 2023-08-04 | 北京千方科技股份有限公司 | 基于高速收费数据的车型检测方法、装置、设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108765976B (zh) | 路侧平行停车信息管理系统及方法 | |
CN101281593B (zh) | 智能视频监控事件检索方法及系统 | |
CN110660222B (zh) | 一种智能环保道路黑烟车辆电子抓拍系统 | |
CN110334111B (zh) | 一种多维轨迹分析方法及装置 | |
CN101587643B (zh) | 一种套牌车的识别方法 | |
CN106528865A (zh) | 一种快速精准的交通大数据清洗方法 | |
CN104766479A (zh) | 基于超高频射频与视频图像双识别匹配的汽车身份识别方法及装置 | |
CN109118766A (zh) | 一种基于交通卡口的同行车辆判别方法及装置 | |
CN101848377A (zh) | 一种基于云计算及海量视频检索的多视频录入装置智能联动的装置和方法 | |
CN111949701B (zh) | 一种基于轨迹相似度的移动对象出行规律分析方法及装置 | |
CN105046959B (zh) | 基于双窗口滑动匹配机制的城市道路行程时间提取方法 | |
CN109949569A (zh) | 一种交通违法数据审核系统及其实现方法 | |
CN112770265B (zh) | 一种行人身份信息获取方法、系统、服务器和存储介质 | |
CN102103609A (zh) | 一种信息检索方法及系统 | |
CN112233421A (zh) | 一种基于机器视觉的城市智慧交通监控智能系统 | |
CN114267180B (zh) | 一种基于计算机视觉的停车管理方法及系统 | |
CN113470369B (zh) | 一种基于多维度信息判断套牌车辆真实号牌的方法及系统 | |
CN114023076B (zh) | 一种基于多源异构数据的特定车辆追踪方法 | |
CN118132627B (zh) | 一种基于大数据分析技术的车型置信度解决方法 | |
CN112637548B (zh) | 一种基于摄像机的信息关联预警方法及装置 | |
CN118132627A (zh) | 一种基于大数据分析技术的车型置信度解决方法 | |
CN110796760B (zh) | 交通事故证据收集方法、车载终端、服务器及系统 | |
CN112528901A (zh) | 一种基于大数据的车辆聚集告警方法及系统 | |
CN114564521A (zh) | 一种基于聚类算法确定农机工作时间段的方法及系统 | |
CN114005186A (zh) | 一种车牌识别方法、装置及停车管理系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |