CN112711585A - 一种基于大数据技术的高速公路绿通车信用管理系统 - Google Patents

一种基于大数据技术的高速公路绿通车信用管理系统 Download PDF

Info

Publication number
CN112711585A
CN112711585A CN202110038539.6A CN202110038539A CN112711585A CN 112711585 A CN112711585 A CN 112711585A CN 202110038539 A CN202110038539 A CN 202110038539A CN 112711585 A CN112711585 A CN 112711585A
Authority
CN
China
Prior art keywords
data
green traffic
highway
credit
green
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110038539.6A
Other languages
English (en)
Other versions
CN112711585B (zh
Inventor
陈娇娜
张翔
陈学娜
马力
李道峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian Shiyou University
Original Assignee
Xian Shiyou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian Shiyou University filed Critical Xian Shiyou University
Priority to CN202110038539.6A priority Critical patent/CN112711585B/zh
Publication of CN112711585A publication Critical patent/CN112711585A/zh
Application granted granted Critical
Publication of CN112711585B publication Critical patent/CN112711585B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/254Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/02Reservations, e.g. for tickets, services or events
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/03Data mining

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Tourism & Hospitality (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Educational Administration (AREA)
  • Mathematical Physics (AREA)
  • Operations Research (AREA)
  • Software Systems (AREA)
  • Fuzzy Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Primary Health Care (AREA)
  • General Health & Medical Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种基于大数据技术的高速公路绿通车信用管理系统;包括数据采集层、数据分析层和数据展示层;所述数据采集层:将数据相结合,形成高速公路绿通车大数据,构建基础数据源;所述数据分析层:提取各数据源中研究所需字段、数据预处理、基于数据驱动的高速公路信用评价模型分析、高速公路绿通车用户信用管理;所述数据展现层:面对不同的用户,查询相应的统计分析结果,并进行不同业务角色之间的信息交流和共享。本发明系统便携式查验终端对绿通车辆进行稽查业务信息记录;基于多源数据融合和数据驱动算法的高速公路绿通车信用评价方法,多个业务系统的黑名单共享;高速公路绿通车信用管理、用户问卷测试、用户反馈评价。

Description

一种基于大数据技术的高速公路绿通车信用管理系统
技术领域
本发明属于智能公交领域;尤其涉及一种基于大数据技术的高速公路绿通车信用管理系统。
背景技术
高速公路绿色通道(简称绿通)是装运鲜活农产品的车辆专用通道。按照规定,鲜活农产品运输车辆整车或合法混装指定鲜活农产品不超过核定载重或车厢容积20%,并且超载不超过5%的车辆属于合法的“绿通车”,予以减免通行费。鲜活农产品是指新鲜蔬菜、水果、鲜活水产品、活的禽畜、新鲜的肉蛋奶,马铃薯、甘薯、鲜玉米、鲜花生。而这些物品的深加工以及花草苗木、粮食等不属于鲜活农产品范围,不能享受绿色通道运输政策。
随着信息技术发展,目前出现了采用便携式查验终端对绿通车辆进行查验登记,主要采用便携式设备与内窥镜等相结合,进行电子化登记,在提高检验效率,增加数据完整性、降低统计工作量方面有显著效果,是人工查验的一种信息化辅助手段。
目前绝大多数收费站对绿通车都实行到站登记查验,并且对所有车辆全部查验、逢车必查,收费站工作人员需对每辆进站的绿通车均需无区别化仔细查验。一部分收费站采用移动终端或预约服务平台可以对到站查验车辆进行便捷的信息记录,但是缺乏对绿通车司机或绿通车用户的信用等级管理。良好信用记录的绿通车司机在实际过站稽查业务中没有明显的便利性,不利于绿通车司机对政策的学习和对自己信用记录的维护。与此同时,部分司机由于对绿通车免费政策的不熟悉或者未能及时了解政策要求的变化,易造成“非主观性假冒绿通车”。现有的技术手段对绿通车信用管理方法尚存不足。
发明内容
本发明的目的是提供了一种基于大数据技术的高速公路绿通车信用管理系统。
本发明是通过以下技术方案实现的:
本发明涉及一种基于大数据技术的高速公路绿通车信用管理系统,包括数据采集层、数据分析层和数据展示层;
其中,
所述数据采集层:将收费站绿通车稽查业务数据、绿通车预约APP用户数据、高速公路收费数据、路政数据、交警数据相结合,形成高速公路绿通车大数据,构建高速公路绿通车信用管理系统的基础数据源;
所述数据分析层:由高速公路绿通车信息管理系统构成,具体研究步骤为提取各数据源中研究所需字段、数据预处理、基于数据驱动的高速公路信用评价模型分析、高速公路绿通车用户信用管理;
所述数据展现层:面对不同的用户,包括高速公路运营管理部门和绿通车用户,查询相应的统计分析结果,并进行不同业务角色之间的信息交流和共享。
优选地,所述数据采集层中,所述收费站绿通车稽查业务数据主要记录本次运输车辆通行的绿通车辆登记信息、货物信息、稽查班次、人员信息;所述收费站绿通车稽查业务数据的研究所需字段包括:车牌号、车牌颜色、车辆类型、预约状态、货厢类型、运单类型、查验结果、查验时间、金额、运输货物、入口称重、出口称重、出口车道、班长、站长、收费员、外勤、复核人、验货人。以此分析影响绿通车过站查验不合格的影响因素和作用规律。
优选地,所述数据采集层中,所述绿通车预约APP用户数据为记录绿通车预约APP用户的基本信息和使用情况;所述绿通车预约APP用户数据的研究所需字段为使用天数(天)、用户使用频次、用户历史信用记录。
优选地,所述数据采集层中,所述高速公路收费数据、路政数据和交警数据为辅助信息,其研究所需字段为绿通车辆或司机在路网运行中其他相关领域的黑名单记录。
优选地,所述数据分析层中,所述提取各数据源中研究所需字段具体为:对高速公路绿通车大数据进行集成,提取研究所需的数据字段。
优选地,所述数据分析层中,所述预处理包括:数据清洗、数据集成、数据变换和数据规约。
所述数据分析层中,同时结合研究目标,设计数据库表结构及其字段,以保证海量样本条件下数据查询和分析的效率。数据挖掘需要的数据通常来源不全相同;
所述数据集成是指将多个不同的数据源合并存放于同一个数据存储中的操作。
所述数据变换指结合挖掘任务或挖掘算法的需要,将数据转换成特定的、规范化的形式。可以根据已有的属性集构造出新的属性。通常,对完整的大数据集进行数据挖掘必然耗费很长时间或者进行复杂的分析计算。
所述数据规约是指在保障数据完整性的前提下产生更小的新的数据集。
所述数据清洗就是将原始数据集中的重复数据、噪声数据等与研究目标无关的数据进行筛选和删除。剔除异常数据,包括缺失数据、错误数据等。
其中,该阶段对研究字段中的类型数据,例如车牌颜色、车辆类型、预约状态、货厢类型、运单类型、查验结果等字段进行数字编码,便于后续计算。
优选地,所述数据分析层中,所述基于数据驱动的高速公路信用评价模型分析具体为基于Logistic回归分析的高速公路信用评价模型进行分析。
所述基于Logistic回归分析的高速公路信用评价模型,具体分析过程为:
A、由于本研究所选绿通车大数据属性较多,部分属性通过特征工程获得,各属性间可能存在严重的共线性问题,会导致各属性对绿通车信用评价结果的不可靠。因此,在进行Logistic回归分析前,需要对绿通车大数据属性做共线性诊断。检验方法主要有:相关系数、容忍度(Tolerance)和方差膨胀系数(Variance inflation factor,VIF)、特征根(Eigenvalue)、条件指数(Condition Idex);利用相关系数、容忍度、方差膨胀因子、特征根、条件指数对共线性诊断进行综合判断,对存在验证共线性关系的属性进行筛选,消除共线性影响。
变量间的相关系数矩阵:如果相关系数超过0.9的变量在分析时将会存在共线性问题。在0.8以上可能会有问题。但这种方法只能对共线性作初步的判断,并不全面。
单样本Kolmogorov-Smirnov是检验某单一样本是否服从假设的特定分布。针对连续变量,分别采用单样本Kolmogorov-Smirnov检验,检验单个独立样本是否符合正态分布。相关系数常见有两类,分别是Pearson和Spearman。具体使用场景如下表1所示。根据单样本检验结论,选用相应的相关系数描述。
表1
系数 使用场景
Pearson 定量数据,数据满足正态性时
Spearman 定量数据,数据不满足正态性时
容忍度的值界于0至1之间,当容忍度值较小时,表示此自变量与其他自变量之间存在共线性。容忍度(Tolerance)的计算公式如下:
以属性为因变量、其他属性为自变量做线性回归,获得决定系数。当该属性与其他属性存在严重的共线性问题时,≈1,TOL≈0。容忍度TOL的计算公式如下:
TOL=1-R2
方差膨胀系数是容忍度的倒数,VIF越大,表示自变量的容忍度越小,越有共线性问题。通常以10作为判断边界。当VIF<10,不存在多重共线性;当10≤VIF<100,存在较强的多重共线性;当VIF≥100,存在严重多重共线性。方差膨胀因子VIF的计算公式如下:
Figure BDA0002894446000000061
特征根:在各属性值构成的矩阵中,当列向量间存在共线性问题时,矩阵至少有一个特征根接近于零,接近零的特征根数量相当于存在的共线性关系数量。该方法实际上就是对自变量进行主成分分析,如果相当多维度的特征根等于0,则可能有比较严重的共线性。
条件指数:条件指数为矩阵的最大特征根与其他各特征根之比的算术平方根。各特征根值越小,条件指数越大,共线性问题越严重。当某些维度的该指标数值大于30时,则能存在共线性。条件指数计算公式如下:
Figure BDA0002894446000000062
式中:λmax为最大特征根;j为属性的特征根;为属性的条件指数。
根据诊断结果,保留重要属性、剔除次要属性,解决共线性问题。
B、定义因变量信用等级:对信用等级进行sange等级的划分,分别包括:优良、中等、较差。研究重点关注信用等级较小的情况,因此以第一组为参考组。
C、模型拟合优度检验:基于绿通车大数据各属性的关联性检验结果,将符合Logistic回归模型要求的属性选入模型,采用最大似然估计法结合梯度下降法进行模型系数的计算。利用似然比检验、Homer-Lemeshow检验、Cox&Snell R2检验等方法检验模型的有效性。当模型的有效性符合预期时,根据模型系数结果,使用发生比、优势比概念解释模型结果,并构建回归方程。
D、Logistic回归模型的系数计算:Logistic模型使用最大似然估计法进行模型系数的计算,最大似然估计法是一种基于最大似然原理的统计方法,通过数学模型以最大概率再现样本数据的方式进行参数估计。最大似然估计法首先建立似然函数,对似然函数取对数,对对数似然函数进行求导获得似然方程,求解似然方程进行参数估计。
Logistic回归模型公式为:
Figure BDA0002894446000000071
Figure BDA0002894446000000072
G3=0(对照组)
其中,α1表示Logistic模型G1的拟合截距,α2表示Logistic模型G2的拟合截距,Xi表示第i个特征向量,βi表示特征向量Xi的权重。
E、Logistic回归模型的结果解释。当模型的有效性符合预期时,通过最大似然估计法计算获得的模型系数结果包括截距和系数,可以通过发生比、优势比、回归方程进行结果解释。
为事件的发生比,在本研究中为绿通车信用等级较差情况的发生比。
影响量又称为优势比(OR),表示当其他条件不变,绿通车属性X导致绿通车信用等级较差情况发生的概率始终保持eβ倍。
F、基于Logistic回归模型的高速公路绿通车信用等级评价与分析。运用待过站查验的绿通车属性和历史记录,评价该绿通车信用等级,并对本次过站的信用等级进行概率预测,预判是否需要进行重点查验。
优选地,所述数据分析层中,所述高速公路绿通车用户信用管理由运营管理单位或工作人员对不同绿通车信用评价等级执行相应的检验流程;对于信用等级优良的用户,可以缩短过站查验时间;对于信用等级较差的用户进行重点稽查,并在该软件系统对用户进行强制性问卷测试,辅助其对绿通车政策的学习;对于信用等级中等的用户,分析其信用评级等级的制约因素,通过该系统形成分析报告和评价结果,帮助该类用户维护其信用评级等级;对于信用等级较差用户频发的收费站,督促收费站对绿通车司机积极开展业务宣传或培训。
优选地,所述数据展现层中,所述高速公路运营管理部门的系统功能模块包括:组织机构与权限管理、绿色通道管理运行分析报表、高速公路其他业务黑名单管理、绿通车信用黑名单管理、绿通车用户信用评价分析、收费站服务评价分析、绿通车查验业务分析与规划、交流与咨询。
其中,
所述组织机构与权限管理:添加、修改、删除、查询路网运营的分公司、路段、收费站的用户,为不同用户分配相应权限和账号。
所述绿色通道管理运行分析报表:对历史不同分公司、收费站的绿通车管理运行情况进行统计分析,形成相应的报表。
所述高速公路其他业务黑名单管理:接入高速公路其他业务黑名单数据,可以对不同业务系统黑名单进行查询、添加、修改和删除等操作。
所述绿通车信用黑名单管理:利用绿通车信用评价等级模型对绿通车用户的信用等级进行评价,对评价结果为“较差”的用户列入黑名单,评价结果与用户实时共享。可以对黑名单进行查询、修改、添加、删除、统计分析。
所述绿通车用户信用评价分析:输入绿通车用户属性,对该用户在不同场景下通过收费站过站查验的信用等级进行预判,以便工作人员有针对性重点查验。
所述收费站服务评价分析:由绿通车用户对过站查验的收费站进行满意度评价,并对结果进行统计分析。
所述绿通车查验业务分析与规划:基于不同用户的绿通车信用评价结果,对不同用户执行相应的系统权限操作,促进用户对绿通车信用等级的维护。对于信用评级等级较差的用户,强制性进行问卷测验。对于信用评级等级较差用户数量多的收费站,加强政策宣传和业务培训。
所述交流与咨询:提供绿通车司机与收费站查验人员之间的沟通和交流,回复用户的咨询问题。
优选地,所述数据展现层中,所述绿通车用户的系统功能模块包括:用户信息管理、绿通车信用评级等级、绿通车免费政策查询、绿通车问卷测试、绿通车过站查验服务评价、交流与咨询;
其中,
所述用户信息管理:查询用户权限,修改和管理用户的基本信息。
所述绿通车信用评级等级:查询账号相应的绿通车信用评级等级。
所述绿通车免费政策查询:输入关键字,对绿通车免费政策、政策变化、执行进行等政策或新闻进行重新。
所述绿通车问卷测试:通过问卷测试的方式,检验自身政策学习效果,促进信用等级的维护和提升。
所述绿通车过站查验服务评价:对本次通行收费站的过站查验业务执行中规范性、满意度等方面进行评价。
所述交流与咨询:提供绿通车司机与收费站查验人员之间的沟通和交流,对有疑惑的问题向工作人员进行咨询,与其他绿通车用户交流心得。
本发明采用数据融合、数据驱动算法、用户问卷测验、服务评价的手段,从数据来源、评价方法、评价维度、评价结果的运用方面,促进提升绿通车过站查验业务效率和服务质量。一方面,对于路网管理部门和工作人员而言,能够对过站车辆进行科学合理的差异化查验,进而提升查验效率、减少收费站拥堵时间,有指导的促进绿通车用户维护其信用等级,并对信用污点或信用等级不良的用户重点稽查以降低假绿通车造成的经济损失。另一方面,对于绿通车用户而言,能够通过该系统,测验对绿通车政策掌握程度、维护自身信用等级、咨询不理解的政策细节,有利于绿通车司机按照政策标准的装载和运输货物。整体而言,提高收费站绿通车查验业务效率、促进绿通车用户的服务满意度。
本发明具有以下优点:
(1)本发明通过该系统管理单位能够及时了解绿通车司机的历史过站稽查情况,对绿通车用户的信用等级进行评价,进而能够有针对性、有目的的对不同的绿通车辆进行稽查,提高稽查效率,加强用户对绿通政策的理解。
(2)本发明系统可以实现绿通车司机利用本发明系统及时了解自身信用评级等级,并通过政策答疑、问卷测试等方法,促进自身的信用等级提升,并且可以对过站稽查班组的稽查业务流程、服务态度、政策传达等方面进行评价,促进稽查业务的服务质量提升。
(3)本发明提供运营管理单位与绿通车司机之间的信息共享平台,能够有效提高绿通车稽查业务的对象选择,对信用等级低的用户进行重点稽查,以防“假绿通”逃费;同时,利用绿通车司机的参与性,有效避免司机对政策理解的偏差造成非主观“假绿通”现象。
附图说明
图1是本发明基于大数据技术的高速公路绿通车信用管理系统的框架图;
图2为本发明所涉及的功能模块框架图。
具体实施方式
下面结合具体实施例对本发明进行详细说明。应当指出的是,以下的实施实例只是对本发明的进一步说明,但本发明的保护范围并不限于以下实施例。
实施例
本实施例涉及一种基于大数据技术的高速公路绿通车信用管理系统,见图1所示:包括数据采集层、数据分析层和数据展示层;
其中,
所述数据采集层:将收费站绿通车稽查业务数据、绿通车预约APP用户数据、高速公路收费数据、路政数据、交警数据相结合,形成高速公路绿通车大数据,构建高速公路绿通车信用管理系统的基础数据源;
所述数据分析层:由高速公路绿通车信息管理系统构成,具体研究步骤为提取各数据源中研究所需字段、数据预处理、基于数据驱动的高速公路信用评价模型分析、高速公路绿通车用户信用管理;
所述数据展现层:面对不同的用户,包括高速公路运营管理部门和绿通车用户,查询相应的统计分析结果,并进行不同业务角色之间的信息交流和共享。
优选地,所述数据采集层中,所述收费站绿通车稽查业务数据主要记录本次运输车辆通行的绿通车辆登记信息、货物信息、稽查班次、人员信息;所述收费站绿通车稽查业务数据的研究所需字段包括:车牌号、车牌颜色、车辆类型、预约状态、货厢类型、运单类型、查验结果、查验时间、金额、运输货物、入口称重、出口称重、出口车道、班长、站长、收费员、外勤、复核人、验货人。以此分析影响绿通车过站查验不合格的影响因素和作用规律。
优选地,所述数据采集层中,所述绿通车预约APP用户数据为记录绿通车预约APP用户的基本信息和使用情况;所述绿通车预约APP用户数据的研究所需字段为使用天数(天)、用户使用频次、用户历史信用记录。
优选地,所述数据采集层中,所述高速公路收费数据、路政数据和交警数据为辅助信息,其研究所需字段为绿通车辆或司机在路网运行中其他相关领域的黑名单记录。
优选地,所述数据分析层中,所述提取各数据源中研究所需字段具体为:对高速公路绿通车大数据进行集成,提取研究所需的数据字段。
优选地,所述数据分析层中,所述预处理包括:数据清洗、数据集成、数据变换和数据规约。
所述数据分析层中,同时结合研究目标,设计数据库表结构及其字段,以保证海量样本条件下数据查询和分析的效率。数据挖掘需要的数据通常来源不全相同;
所述数据集成是指将多个不同的数据源合并存放于同一个数据存储中的操作。
所述数据变换指结合挖掘任务或挖掘算法的需要,将数据转换成特定的、规范化的形式。可以根据已有的属性集构造出新的属性。通常,对完整的大数据集进行数据挖掘必然耗费很长时间或者进行复杂的分析计算。
所述数据规约是指在保障数据完整性的前提下产生更小的新的数据集。
所述数据清洗就是将原始数据集中的重复数据、噪声数据等与研究目标无关的数据进行筛选和删除。剔除异常数据,包括缺失数据、错误数据等。
其中,该阶段对研究字段中的类型数据,例如车牌颜色、车辆类型、预约状态、货厢类型、运单类型、查验结果等字段进行数字编码,便于后续计算。
优选地,所述数据分析层中,所述基于数据驱动的高速公路信用评价模型分析具体为基于Logistic回归分析的高速公路信用评价模型进行分析。
所述基于Logistic回归分析的高速公路信用评价模型,具体分析过程为:
A、由于本研究所选绿通车大数据属性较多,部分属性通过特征工程获得,各属性间可能存在严重的共线性问题,会导致各属性对绿通车信用评价结果的不可靠。因此,在进行Logistic回归分析前,需要对绿通车大数据属性做共线性诊断。检验方法主要有:相关系数、容忍度(Tolerance)和方差膨胀系数(Variance inflation factor,VIF)、特征根(Eigenvalue)、条件指数(Condition Idex)。本研究利用相关系数、容忍度、方差膨胀因子、特征根、条件指数对共线性诊断进行综合判断,对存在验证共线性关系的属性进行筛选,消除共线性影响。
变量间的相关系数矩阵:如果相关系数超过0.9的变量在分析时将会存在共线性问题。在0.8以上可能会有问题。但这种方法只能对共线性作初步的判断,并不全面。
单样本Kolmogorov-Smirnov是检验某单一样本是否服从假设的特定分布。针对连续变量,分别采用单样本Kolmogorov-Smirnov检验,检验单个独立样本是否符合正态分布。相关系数常见有两类,分别是Pearson和Spearman。具体使用场景如下表1所示。根据单样本检验结论,选用相应的相关系数描述。
表1
系数 使用场景
Pearson 定量数据,数据满足正态性时
Spearman 定量数据,数据不满足正态性时
容忍度的值界于0至1之间,当容忍度值较小时,表示此自变量与其他自变量之间存在共线性。容忍度(Tolerance)的计算公式如下:
以属性为因变量、其他属性为自变量做线性回归,获得决定系数。当该属性与其他属性存在严重的共线性问题时,≈1,TOL≈0。容忍度TOL的计算公式如下:
TOL=1-R2
方差膨胀系数是容忍度的倒数,VIF越大,表示自变量的容忍度越小,越有共线性问题。通常以10作为判断边界。当VIF<10,不存在多重共线性;当10≤VIF<100,存在较强的多重共线性;当VIF≥100,存在严重多重共线性。方差膨胀因子VIF的计算公式如下:
Figure BDA0002894446000000161
特征根:在各属性值构成的矩阵中,当列向量间存在共线性问题时,矩阵至少有一个特征根接近于零,接近零的特征根数量相当于存在的共线性关系数量。该方法实际上就是对自变量进行主成分分析,如果相当多维度的特征根等于0,则可能有比较严重的共线性。
条件指数:条件指数为矩阵的最大特征根与其他各特征根之比的算术平方根。各特征根值越小,条件指数越大,共线性问题越严重。当某些维度的该指标数值大于30时,则能存在共线性。条件指数计算公式如下:
Figure BDA0002894446000000162
式中:λmax为最大特征根;j为属性的特征根;为属性的条件指数。
根据诊断结果,保留重要属性、剔除次要属性,解决共线性问题。
B、定义因变量信用等级:对信用等级进行sange等级的划分,分别包括:优良、中等、较差。研究重点关注信用等级较小的情况,因此以第一组为参考组。
C、模型拟合优度检验:基于绿通车大数据各属性的关联性检验结果,将符合Logistic回归模型要求的属性选入模型,采用最大似然估计法结合梯度下降法进行模型系数的计算。利用似然比检验、Homer-Lemeshow检验、Cox&Snell R2检验等方法检验模型的有效性。当模型的有效性符合预期时,根据模型系数结果,使用发生比、优势比概念解释模型结果,并构建回归方程。
D、Logistic回归模型的系数计算:Logistic模型使用最大似然估计法进行模型系数的计算,最大似然估计法是一种基于最大似然原理的统计方法,通过数学模型以最大概率再现样本数据的方式进行参数估计。最大似然估计法首先建立似然函数,对似然函数取对数,对对数似然函数进行求导获得似然方程,求解似然方程进行参数估计。
Logistic回归模型公式为:
Figure BDA0002894446000000171
Figure BDA0002894446000000172
G3=0(对照组)
E、Logistic回归模型的结果解释。当模型的有效性符合预期时,通过最大似然估计法计算获得的模型系数结果包括截距和系数,可以通过发生比、优势比、回归方程进行结果解释。
为事件的发生比,在本研究中为绿通车信用等级较差情况的发生比。
影响量又称为优势比(OR),表示当其他条件不变,绿通车属性X导致绿通车信用等级较差情况发生的概率始终保持eβ倍。
F、基于Logistic回归模型的高速公路绿通车信用等级评价与分析。运用待过站查验的绿通车属性和历史记录,评价该绿通车信用等级,并对本次过站的信用等级进行概率预测,预判是否需要进行重点查验。
优选地,所述数据分析层中,所述高速公路绿通车用户信用管理由运营管理单位或工作人员对不同绿通车信用评价等级执行相应的检验流程;对于信用等级优良的用户,可以缩短过站查验时间;对于信用等级较差的用户进行重点稽查,并在该软件系统对用户进行强制性问卷测试,辅助其对绿通车政策的学习;对于信用等级中等的用户,分析其信用评级等级的制约因素,通过该系统形成分析报告和评价结果,帮助该类用户维护其信用评级等级;对于信用等级较差用户频发的收费站,督促收费站对绿通车司机积极开展业务宣传或培训。
优选地,所述数据展现层中,所述高速公路运营管理部门的系统功能模块包括:见图2所示:组织机构与权限管理、绿色通道管理运行分析报表、高速公路其他业务黑名单管理、绿通车信用黑名单管理、绿通车用户信用评价分析、收费站服务评价分析、绿通车查验业务分析与规划、交流与咨询。
其中,
所述组织机构与权限管理:添加、修改、删除、查询路网运营的分公司、路段、收费站的用户,为不同用户分配相应权限和账号。
所述绿色通道管理运行分析报表:对历史不同分公司、收费站的绿通车管理运行情况进行统计分析,形成相应的报表。
所述高速公路其他业务黑名单管理:接入高速公路其他业务黑名单数据,可以对不同业务系统黑名单进行查询、添加、修改和删除等操作。
所述绿通车信用黑名单管理:利用绿通车信用评价等级模型对绿通车用户的信用等级进行评价,对评价结果为“较差”的用户列入黑名单,评价结果与用户实时共享。可以对黑名单进行查询、修改、添加、删除、统计分析。
所述绿通车用户信用评价分析:输入绿通车用户属性,对该用户在不同场景下通过收费站过站查验的信用等级进行预判,以便工作人员有针对性重点查验。
所述收费站服务评价分析:由绿通车用户对过站查验的收费站进行满意度评价,并对结果进行统计分析。
所述绿通车查验业务分析与规划:基于不同用户的绿通车信用评价结果,对不同用户执行相应的系统权限操作,促进用户对绿通车信用等级的维护。对于信用评级等级较差的用户,强制性进行问卷测验。对于信用评级等级较差用户数量多的收费站,加强政策宣传和业务培训。
所述交流与咨询:提供绿通车司机与收费站查验人员之间的沟通和交流,回复用户的咨询问题。
优选地,所述数据展现层中,所述绿通车用户的系统功能模块包括:见图2所示:用户信息管理、绿通车信用评级等级、绿通车免费政策查询、绿通车问卷测试、绿通车过站查验服务评价、交流与咨询;
其中,
所述用户信息管理:查询用户权限,修改和管理用户的基本信息。
所述绿通车信用评级等级:查询账号相应的绿通车信用评级等级。
所述绿通车免费政策查询:输入关键字,对绿通车免费政策、政策变化、执行进行等政策或新闻进行重新。
所述绿通车问卷测试:通过问卷测试的方式,检验自身政策学习效果,促进信用等级的维护和提升。
所述绿通车过站查验服务评价:对本次通行收费站的过站查验业务执行中规范性、满意度等方面进行评价。
所述交流与咨询:提供绿通车司机与收费站查验人员之间的沟通和交流,对有疑惑的问题向工作人员进行咨询,与其他绿通车用户交流心得。
本发明采用数据融合、数据驱动算法、用户问卷测验、服务评价的手段,从数据来源、评价方法、评价维度、评价结果的运用方面,促进提升绿通车过站查验业务效率和服务质量。一方面,对于路网管理部门和工作人员而言,能够对过站车辆进行科学合理的差异化查验,进而提升查验效率、减少收费站拥堵时间,有指导的促进绿通车用户维护其信用等级,并对信用污点或信用等级不良的用户重点稽查以降低假绿通车造成的经济损失。另一方面,对于绿通车用户而言,能够通过该系统,测验对绿通车政策掌握程度、维护自身信用等级、咨询不理解的政策细节,有利于绿通车司机按照政策标准的装载和运输货物。整体而言,提高收费站绿通车查验业务效率、促进绿通车用户的服务满意度。
与现有技术相比,本发明具有以下优点:本发明通过该系统管理单位能够及时了解绿通车司机的历史过站稽查情况,对绿通车用户的信用等级进行评价,进而能够有针对性、有目的的对不同的绿通车辆进行稽查,提高稽查效率,加强用户对绿通政策的理解。本发明系统可以实现绿通车司机利用本发明系统及时了解自身信用评级等级,并通过政策答疑、问卷测试等方法,促进自身的信用等级提升,并且可以对过站稽查班组的稽查业务流程、服务态度、政策传达等方面进行评价,促进稽查业务的服务质量提升。本发明提供运营管理单位与绿通车司机之间的信息共享平台,能够有效提高绿通车稽查业务的对象选择,对信用等级低的用户进行重点稽查,以防“假绿通”逃费;同时,利用绿通车司机的参与性,有效避免司机对政策理解的偏差造成非主观“假绿通”现象。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变形或修改,这并不影响本发明的实质。

Claims (10)

1.一种基于大数据技术的高速公路绿通车信用管理系统,其特征在于,包括数据采集层、数据分析层和数据展示层;
其中,
所述数据采集层:将收费站绿通车稽查业务数据、绿通车预约APP用户数据、高速公路收费数据、路政数据、交警数据相结合,形成高速公路绿通车大数据,构建高速公路绿通车信用管理系统的基础数据源;
所述数据分析层:由高速公路绿通车信息管理系统构成;所述数据分析层的具体步骤为:提取各数据源中研究所需字段、数据预处理、基于数据驱动的高速公路信用评价模型分析、高速公路绿通车用户信用管理;
所述数据展现层:面对不同用户,包括高速公路运营管理部门和绿通车用户,查询相应的统计分析结果,并进行不同业务角色之间的信息交流和共享。
2.如权利要求1所述的基于大数据技术的高速公路绿通车信用管理系统,其特征在于,所述收费站绿通车稽查业务数据主要记录本次运输车辆通行的绿通车辆登记信息、货物信息、稽查班次、人员信息;所述收费站绿通车稽查业务数据的研究所需字段包括:车牌号、车牌颜色、车辆类型、预约状态、货厢类型、运单类型、查验结果、查验时间、金额、运输货物、入口称重、出口称重、出口车道、班长、站长、收费员、外勤、复核人、验货人。
3.如权利要求1所述的基于大数据技术的高速公路绿通车信用管理系统,其特征在于,所述绿通车预约APP用户数据为记录绿通车预约APP用户的基本信息和使用情况;所述绿通车预约APP用户数据的研究所需字段为使用天数、用户使用频次、用户历史信用记录。
4.如权利要求1所述的基于大数据技术的高速公路绿通车信用管理系统,其特征在于,所述高速公路收费数据、路政数据和交警数据为辅助信息,其研究所需字段为绿通车辆或司机在路网运行中其他相关领域的黑名单记录。
5.如权利要求1所述的基于大数据技术的高速公路绿通车信用管理系统,其特征在于,所述数据分析层中,所述提取各数据源中研究所需字段具体为:对高速公路绿通车大数据进行集成,提取研究所需的数据字段。
6.如权利要求1所述的基于大数据技术的高速公路绿通车信用管理系统,其特征在于,所述数据分析层中,所述预处理包括:数据清洗、数据集成、数据变换和数据规约。
7.如权利要求1所述的基于大数据技术的高速公路绿通车信用管理系统,其特征在于,所述数据分析层中,所述基于数据驱动的高速公路信用评价模型分析具体为基于Logistic回归分析的高速公路信用评价模型进行分析。
8.如权利要求1所述的基于大数据技术的高速公路绿通车信用管理系统,其特征在于,所述数据分析层中,所述高速公路绿通车用户信用管理由运营管理单位或工作人员对不同绿通车信用评价等级执行相应的检验流程。
9.如权利要求1所述的基于大数据技术的高速公路绿通车信用管理系统,其特征在于,所述数据展现层中,所述高速公路运营管理部门的系统功能模块包括:组织机构与权限管理、绿色通道管理运行分析报表、高速公路其他业务黑名单管理、绿通车信用黑名单管理、绿通车用户信用评价分析、收费站服务评价分析、绿通车查验业务分析与规划、交流与咨询。
10.如权利要求1所述的基于大数据技术的高速公路绿通车信用管理系统,其特征在于,所述数据展现层中,所述绿通车用户的系统功能模块包括:用户信息管理、绿通车信用评级等级、绿通车免费政策查询、绿通车问卷测试、绿通车过站查验服务评价、交流与咨询。
CN202110038539.6A 2021-01-12 2021-01-12 一种基于大数据技术的高速公路绿通车信用管理系统 Active CN112711585B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110038539.6A CN112711585B (zh) 2021-01-12 2021-01-12 一种基于大数据技术的高速公路绿通车信用管理系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110038539.6A CN112711585B (zh) 2021-01-12 2021-01-12 一种基于大数据技术的高速公路绿通车信用管理系统

Publications (2)

Publication Number Publication Date
CN112711585A true CN112711585A (zh) 2021-04-27
CN112711585B CN112711585B (zh) 2024-02-02

Family

ID=75548868

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110038539.6A Active CN112711585B (zh) 2021-01-12 2021-01-12 一种基于大数据技术的高速公路绿通车信用管理系统

Country Status (1)

Country Link
CN (1) CN112711585B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114155742A (zh) * 2021-11-23 2022-03-08 同济大学 一种网联车纵向行车风险评估和预警方法
CN116452092A (zh) * 2023-05-17 2023-07-18 河北高速集团物流有限公司 一种用于高速公路货车绿通免检的管理系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150244820A1 (en) * 2014-02-26 2015-08-27 Verto Analytics Oy Measurement of multi-screen internet user profiles, transactional behaviors and structure of user population through a hybrid census and user based measurement methodology
CN110415369A (zh) * 2019-07-26 2019-11-05 石家庄汉邦科技有限公司 一种基于大数据分析研判的绿通车辆查验方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150244820A1 (en) * 2014-02-26 2015-08-27 Verto Analytics Oy Measurement of multi-screen internet user profiles, transactional behaviors and structure of user population through a hybrid census and user based measurement methodology
CN110415369A (zh) * 2019-07-26 2019-11-05 石家庄汉邦科技有限公司 一种基于大数据分析研判的绿通车辆查验方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
雷毅: "基于大数据绿通车快速抽检系统的设计与实现", 中国交通信息化, no. 09 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114155742A (zh) * 2021-11-23 2022-03-08 同济大学 一种网联车纵向行车风险评估和预警方法
CN116452092A (zh) * 2023-05-17 2023-07-18 河北高速集团物流有限公司 一种用于高速公路货车绿通免检的管理系统
CN116452092B (zh) * 2023-05-17 2023-10-13 河北高速集团物流有限公司 一种用于高速公路货车绿通免检的管理系统

Also Published As

Publication number Publication date
CN112711585B (zh) 2024-02-02

Similar Documents

Publication Publication Date Title
CN112711585A (zh) 一种基于大数据技术的高速公路绿通车信用管理系统
Wagner Exports, foreign direct investments and productivity: Are services firms different?
CN108280795A (zh) 基于动态数据库的高速公路绿色通道异常车辆的筛选方法
Campagna et al. Data collection framework for understanding UFT within city logistics solutions
Sharman et al. Multilevel modelling of commercial vehicle inter-arrival duration using GPS data
CN106982251A (zh) 基于移动设备的勘查项目野外工作数据上报方法及系统
GC Britto et al. Intergenerational mobility in the land of inequality
Inegbedion et al. A model of vehicle replacement time with overloading cost constraint
Kiba-Janiak Opportunities and threats for city logistics development from a local authority perspective
CN116542631A (zh) 一种分布式架构企业信息管理系统
Simpson et al. Modeling trucking industry perspective on the adoption of connected and autonomous trucks
Li Workers, unions, and takeovers
Ramadhan et al. e-Livestock as a New Paradigm in e-Government
Knight et al. Log truck transportation challenges and innovative solutions: evaluating the perspectives of truck drivers, logging business owners, and foresters
Düzgün Investigation of the criteria affecting the decision of use of drone technology in the logistics sector by DEMATEL method
CN114881801A (zh) 基于知识图谱的集团股权穿透传导方法和系统
Arba'ah et al. Information & Technology Audit of E-Government Using Cobit a Literature Review
Citir et al. Evaluating the impact of overweight trucks on rigid pavement performance using AASHTOWare pavement ME design
CN113379211A (zh) 基于区块链的物流信息平台违约风险管控系统及方法
CN112906993A (zh) 一种高速公路绿通车过站查验时间预测方法
Ellis et al. Exploratory data analysis of economic census products: Methods and results
Bryce Consideration of information loss in the transportation asset management process
Zhang Optimization of freight truck driver scheduling based on operation cost model for Less-Than-Truckload (LTL) transportation
CN114595267A (zh) 一种基于大数据技术的高速公路绿通车查验属性优选方法
Zhu Integration of commercial vehicle GPS and roadside intercept survey data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant