CN105260932A - 一种交通安全隐性因子的信用评分方法 - Google Patents

一种交通安全隐性因子的信用评分方法 Download PDF

Info

Publication number
CN105260932A
CN105260932A CN201510645731.6A CN201510645731A CN105260932A CN 105260932 A CN105260932 A CN 105260932A CN 201510645731 A CN201510645731 A CN 201510645731A CN 105260932 A CN105260932 A CN 105260932A
Authority
CN
China
Prior art keywords
factor
recessive
traffic safety
credit
driver
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510645731.6A
Other languages
English (en)
Inventor
蔡建伟
潘之杰
陈安
吴朝晖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN201510645731.6A priority Critical patent/CN105260932A/zh
Publication of CN105260932A publication Critical patent/CN105260932A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Traffic Control Systems (AREA)

Abstract

本发明公开了一种交通安全隐性因子的信用评分方法,所述方法包括以下步骤:(1)采集交通安全隐性因子所对应的数据源,搭建由交通安全隐性因子所组成的数据库,作为交通安全隐性因子的信用评分的输入数据;(2)根据IV的值对影响交通安全的隐性因子进行选取,然后基于WOE编码,对选取的隐性因子进行单因子信用评分;(3)基于熵理论对隐性因子的单因子信用评分的权重进行确定;(4)综合步骤(2)和(3)的分析结果,得到交通安全隐性因子的信用评分。本发明所提供的交通安全隐性因子的信用评分可以为汽车保险公司提供可靠的交通安全信用评分,为汽车保险公司提供决策依据。

Description

一种交通安全隐性因子的信用评分方法
技术领域
本发明涉及智慧交通领域范畴,尤其是涉及一种交通安全隐性因子的信用评分方法。
背景技术
随着个人消费信贷的发展,个人信用评分技术被高度重视,个人信用评分被广泛的应用在消费信贷领域。FICO(费埃哲)作为信用评分的先驱,是由美国个人消费信用评估公司开发出的一种个人信用评级法,已经得到社会广泛接受。FICO评分关注客户的信用偿还历史、信用账号数、使用信用的年限、正在使用的信用类型、新开立的信用账户,由此来计算信用评分。随着大数据时代的来临,互联网金融行业的征信产品正在慢慢改变着征信业的格局。芝麻信用基于阿里巴巴的电商交易数据和蚂蚁金服的互联网金融数据,通过对海量信息数据进行综合处理的和评估,帮助社会形成完整的信用体系,真正实现“让守信者畅通无阻,让失信者寸步难行”。
交通安全是困扰城市的主要问题之一。目前中国的道路交通安全形势严峻,每年道路交通安全事故伤亡人数超过20万人。信用评分定量评估个人信用风险,反映个人客户的信用状况,为商业银行的信贷提供可靠的依据,由此来限制个人客户的商业违约行为。
发明内容
本发明所要解决的技术问题是提供一种交通安全隐性因子的信用评分方法,为车辆保险企业提供决策依据,更重要的在于建立整个社会的交通安全信用体系。
为此,本发明采用以下技术方案:
一种交通安全隐性因子的信用评分方法,所述方法包括以下步骤:
(1)采集交通安全隐性因子所对应的数据源,搭建由交通安全隐性因子所组成的数据库,作为交通安全隐性因子的信用评分的输入数据;
(2)根据IV的值对影响交通安全的隐性因子进行选取,然后基于WOE编码,对选取的隐性因子进行单因子信用评分;
(3)基于熵理论对隐性因子的单因子信用评分的权重进行确定;
(4)综合步骤(2)和(3)的分析结果,得到交通安全隐性因子的信用评分。
进一步地,所述交通安全隐性因子包括人为方面因素、车辆方面因素和道路方面因素。
进一步地,所述人为方面因素包括年龄、性别、驾驶年龄、受教育程度、个人年收入和籍贯。
进一步地,所述车辆方面因素包括车辆类型、车辆使用年龄、车辆价格和车辆生产产地。
进一步地,所述道路方面因素包括车辆行驶总里程和车辆在不同类型城市道路的行驶总里程。
进一步地,步骤(2)中,影响交通安全的隐性因子的选取包括如下步骤:
(a)隐性因子值的区间划分
首先,假设Yi表示第i个驾驶员在最近一年内的交通违章情况,Yi=0表示第i个驾驶员在最近一年内没有交通违章行为,称为好驾驶员,反之Yi=1表示第i个驾驶员在最近一年内具有交通违章行为,称为坏驾驶员;
其次,随机变量X表示m个驾驶员隐性因子值的集合,xi表示第i个驾驶员的隐性因子值。将X划分成N个区间,即找到合理的分割点x(s)(s=1,2,…,N-1);Gs、Bs分别表示第s个区间好、坏驾驶员的个数,G,B表示好、坏驾驶员总的个数;
根据WOE定义:
WOE s = l n ( ( G s G ) / ( B s B ) )
上述分点x(s)的选择需要保证WOEs(s=1,2,…,N-1)是单调的,且各区间样本分布的均匀,每个区间样本数量占总样本数量的5%~30%;
(b)影响交通安全的隐性因子的选取
根据IV定义:
I V = Σ s = 1 N ( G s G - B s B ) * WOE s
根据IV的值对影响交通安全的隐性因子进行选取,选取IV>=0.1的影响交通安全的隐性因子作为后续影响交通安全隐性因子的单因子信用评分的隐性因子。
进一步地,选取的影响交通安全隐性因子的单因子信用评分包括:
根据IV的值对影响交通安全的隐性因子进行选取之后,需要对影响交通安全的隐性因子进行单因子信用评分,
影响交通安全信用的隐性因子的单因子信用评分卡函数为:
r i = 600 * log i t ( WOE s ) + 300 = 600 * B * G s B * G s + B s * G + 300
其中,ri为第i个驾驶员交通安全的单因子信用评分值,x(s-1)≤xi≤x(s) log i t ( t ) = 1 1 + e - t .
进一步地,步骤(3)中,基于熵理论对隐性因子值的权重进行确定:
基于步骤(2)中根据IV的值选取的影响交通安全的隐性因子,假设选取了n个隐性因子,有m个驾驶员,组成驾驶员的隐性因子的单因子信用评分矩阵R=(rij)m*n;其中,rij表示第i个驾驶员第j个隐性因子的单因子信用评分;基于熵理论,隐性因子的单因子信用评分的权重确定步骤如下:
(i)数据标准化处理
h i j = r i j - r min r max - r min
其中,rmin=mini{rij};rmin=maxi{rij};i=1,2,…,m;j=1,2,…,n;
(ii)计算第i个驾驶员第j个指标的比重
r i j ′ = r i j Σ i = 1 m r i j
(iii)隐性因子的单因子信用评分的信息熵值e和信息效用值d的计算
根据信息熵定义,第j个隐性因子的单因子信用评分的信息熵值如下:
其中K为常数,K=1/ln(m);
因此,第j个隐性因子的单因子信用评分的信息效用值dj=1-ej
(iv)计算评价隐性因子的单因子信用评分的权重系数
ω j = d j Σ j = 1 n d j
其中,ωj为第j个隐性因子的单因子信用评分的权重。
进一步地,所述的步骤(4)中得到的隐性因子交通安全信用评分credit如下:
credit i = Σ j = 1 n ω j * r i j
其中,其中crediti表示第i个驾驶员隐性因子评分值,n为影响交通安全信用的隐性因子数量,rij为第i个驾驶员第j个影响交通安全信用隐性因子的单因子信用评分值,ωj表示第j个隐性因子的单因子信用评分的权重。
本发明具有以下有益技术效果:
(1)交通安全隐性因子的信用评分综合考虑影响交通安全信用的隐性因子,客观地反映出驾驶员的交通安全信用;
(2)交通安全隐性因子的信用评分所需要采集的驾驶员信息,都可以很方便的收集到,保证了实施的可行性;
(3)交通安全隐性因子的信用评分中的隐性因子集合支持动态扩展,随着时间的推移,隐性因子不断的完善和更新,可以更加全面地反映出驾驶员的交通安全信用;
(4)基于交通安全隐性因子的信用评分可以为汽车保险公司提供可靠的交通安全信用评分,为汽车保险公司提供决策依据。
具体实施方式
为了更为具体地描述本发明,下面结合具体实施方式对本发明的技术方案进行详细说明。
本发明提供一种交通安全隐性因子的信用评分方法,所述方法包括以下步骤:
步骤1:采集交通安全隐性因子所对应的数据源,搭建由交通安全隐性因子所组成的数据库,作为交通安全隐性因子的信用评分的输入数据;
具体地,影响交通安全信用的隐性因素,包括以下三个方面:
<1>人为方面因素(年龄、性别、驾驶年龄、受教育程度、个人年收入、籍贯);
<2>车辆方面因素(车辆类型、车辆使用年龄、车辆价格、车辆生产产地);
<3>道路方面因素(车辆行驶总里程、车辆在不同类型城市道路(快速路、主干道、次干路、支路)的行驶总里程);
隐性因子数据库包含如下属性:驾驶员车牌号(主键)、年龄、性别、驾驶年龄、受教育程度、个人年收入、籍贯、车辆类型、车辆使用年龄、车辆所属品牌。其中,受教育程度包含小学、初中、高中、本科、研究生和博士;籍贯包含23个省、5个自治区、4个直辖市、以及香港、澳门2个特别行政区;车辆类型包含《机动车行驶证》上的所有车辆类型,例如:摩托车、轿车、客车等;车辆生产产地包含中国、日本、美国、德国等。
步骤2:根据IV的值对影响交通安全的隐性因子进行选取,然后基于WOE编码,对选取的隐性因子进行单因子信用评分;
影响交通安全的隐性因子的选取包括如下步骤:
(a)隐性因子值的区间划分
首先,假设Yi表示第i个驾驶员在最近一年内的交通违章情况,Yi=0表示第i个驾驶员在最近一年内没有交通违章行为,称为好驾驶员,反之Yi=1表示第i个驾驶员在最近一年内具有交通违章行为,称为坏驾驶员;
其次,随机变量X表示m个驾驶员隐性因子值的集合,xi表示第i个驾驶员的隐性因子值。将X划分成N个区间,即找到合理的分割点x(s)(s=1,2,…,N-1);Gs、Bs分别表示第s个区间好、坏驾驶员的个数,G,B表示好、坏驾驶员总的个数;
根据WOE定义:
WOE s = l n ( ( G s G ) / ( B s B ) )
上述分点x(s)的选择需要保证WOEs(s=1,2,…,N-1)是单调的,且各区间样本分布的均匀,每个区间样本数量占总样本数量的5%~30%;
(b)影响交通安全的隐性因子的选取
根据IV定义:
I V = &Sigma; s = 1 N ( G s G - B s B ) * WOE s
根据IV的值对影响交通安全的隐性因子进行选取,选取IV>=0.1的影响交通安全的隐性因子作为后续影响交通安全隐性因子的单因子信用评分的隐性因子。
选取的影响交通安全隐性因子的单因子信用评分包括:
根据IV的值对影响交通安全的隐性因子进行选取之后,需要对影响交通安全的隐性因子进行单因子信用评分,
影响交通安全信用的隐性因子的单因子信用评分卡函数为:
r i = 600 * log i t ( WOE s ) + 300 = 600 * B * G s B * G s + B s * G + 300
其中,ri为第i个驾驶员交通安全的单因子信用评分值,x(s-1)≤xi≤x(s) log i t ( t ) = 1 1 + e - t .
步骤3:基于熵理论对隐性因子的单因子信用评分的权重进行确定;
基于步骤(2)中根据IV的值选取的影响交通安全的隐性因子,假设选取了n个隐性因子,有m个驾驶员,组成驾驶员的隐性因子的单因子信用评分矩阵R=(rij)m*n;其中,rij表示第i个驾驶员第j个隐性因子的单因子信用评分;基于熵理论,隐性因子的单因子信用评分的权重确定步骤如下:
(i)数据标准化处理
h i j = r i j - r m i n r m a x - r m i n
其中,rmin=mini{rij};rmin=maxi{rij};i=1,2,…,m;j=1,2,…,n;
(ii)计算第i个驾驶员第j个指标的比重
r i j &prime; = r i j &Sigma; i = 1 m r i j
(iii)隐性因子的单因子信用评分的信息熵值e和信息效用值d的计算
根据信息熵定义,第j个隐性因子的单因子信用评分的信息熵值如下:
其中K为常数,K=1/ln(m);
因此,第j个隐性因子的单因子信用评分的信息效用值dj=1-ej
(iv)计算评价隐性因子的单因子信用评分的权重系数
&omega; j = d j &Sigma; j = 1 n d j
其中,ωj为第j个隐性因子的单因子信用评分的权重。
步骤4:综合步骤(2)和(3)的分析结果,得到交通安全隐性因子的信用评分;
得到的隐性因子交通安全信用评分credit如下:
credit i = &Sigma; j = 1 n &omega; j * r i j
其中,其中crediti表示第i个驾驶员隐性因子评分值,n为影响交通安全信用的隐性因子数量,rij为第i个驾驶员第j个影响交通安全信用隐性因子的单因子信用评分值,ωj表示第j个隐性因子的单因子信用评分的权重。
综合上述的归一化权重和隐性因子的单因子信用评分,本发明的交通安全隐性因子的信用评分的分值范围在300-900之间。
上述具体实施方式用来解释说明本发明,仅为本发明的优选实施例而已,而不是对本发明进行限制,在本发明的精神和权利要求的保护范围内,对本发明作出的任何修改、等同替换、改进等,都落入本发明的保护范围。

Claims (9)

1.一种交通安全隐性因子的信用评分方法,其特征在于,所述方法包括以下步骤:
(1)采集交通安全隐性因子所对应的数据源,搭建由交通安全隐性因子所组成的数据库,作为交通安全隐性因子的信用评分的输入数据;
(2)根据IV的值对影响交通安全的隐性因子进行选取,然后基于WOE编码,对选取的隐性因子进行单因子信用评分;
(3)基于熵理论对隐性因子的单因子信用评分的权重进行确定;
(4)综合步骤(2)和(3)的分析结果,得到交通安全隐性因子的信用评分。
2.根据权利要求1所述的一种交通安全隐性因子的信用评分方法,其特征在于,所述交通安全隐性因子包括人为方面因素、车辆方面因素和道路方面因素。
3.根据权利要求2所述的一种交通安全隐性因子的信用评分方法,其特征在于,所述人为方面因素包括年龄、性别、驾驶年龄、受教育程度、个人年收入和籍贯。
4.根据权利要求2所述的一种交通安全隐性因子的信用评分方法,其特征在于,所述车辆方面因素包括车辆类型、车辆使用年龄、车辆价格和车辆生产产地。
5.根据权利要求2所述的一种交通安全隐性因子的信用评分方法,其特征在于,所述道路方面因素包括车辆行驶总里程和车辆在不同类型城市道路的行驶总里程。
6.根据权利要求1所述的一种交通安全隐性因子的信用评分方法,其特征在于,步骤(2)中,影响交通安全的隐性因子的选取包括如下步骤:
(a)隐性因子值的区间划分
首先,假设Yi表示第i个驾驶员在最近一年内的交通违章情况,Yi=0表示第i个驾驶员在最近一年内没有交通违章行为,称为好驾驶员,反之Yi=1表示第i个驾驶员在最近一年内具有交通违章行为,称为坏驾驶员;
其次,随机变量X表示m个驾驶员隐性因子值的集合,xi表示第i个驾驶员的隐性因子值。将X划分成N个区间,即找到合理的分割点x(s)(s=1,2,…,N-1);Gs、Bs分别表示第s个区间好、坏驾驶员的个数,G,B表示好、坏驾驶员总的个数;
根据WOE定义:
WOE s = l n ( ( G s G ) / ( B s B ) )
上述分点x(s)的选择需要保证WOEs(s=1,2,…,N-1)是单调的,且各区间样本分布的均匀,每个区间样本数量占总样本数量的5%~30%;
(b)影响交通安全的隐性因子的选取
根据IV定义:
I V = &Sigma; s = 1 N ( G s G - B s B ) * WOE s
根据IV的值对影响交通安全的隐性因子进行选取,选取IV>=0.1的影响交通安全的隐性因子作为后续影响交通安全隐性因子的单因子信用评分的隐性因子。
7.根据权利要求6所述的一种交通安全隐性因子的信用评分方法,其特征在于,选取的影响交通安全隐性因子的单因子信用评分包括:
根据IV的值对影响交通安全的隐性因子进行选取之后,需要对影响交通安全的隐性因子进行单因子信用评分,
影响交通安全信用的隐性因子的单因子信用评分卡函数为:
r i = 600 * l o g i t ( WOE S ) + 300 = 600 * B * G s B * G s + B s * G + 300
其中,ri为第i个驾驶员交通安全的单因子信用评分值,x(s-1)≤xi≤x(s)
8.根据权利要求1所述的一种交通安全隐性因子的信用评分方法,其特征在于,步骤(3)中,基于熵理论对隐性因子值的权重进行确定:
基于步骤(2)中根据IV的值选取的影响交通安全的隐性因子,假设选取了n个隐性因子,有m个驾驶员,组成驾驶员的隐性因子的单因子信用评分矩阵R=(rij)m*n;其中,rij表示第i个驾驶员第j个隐性因子的单因子信用评分;基于熵理论,隐性因子的单因子信用评分的权重确定步骤如下:
(i)数据标准化处理
h i j = r i j - r m i n r m a x - r m i n
其中,rmin=mini{rij};rmin=maxi{rij};i=1,2,…,m;j=1,2,…,n;
(ii)计算第i个驾驶员第j个指标的比重
r i j &prime; = r i j &Sigma; i = 1 m r i j
(iii)隐性因子的单因子信用评分的信息熵值e和信息效用值d的计算
根据信息熵定义,第j个隐性因子的单因子信用评分的信息熵值如下:
其中K为常数,K=1/ln(m);
因此,第j个隐性因子的单因子信用评分的信息效用值dj=1-ej
(iv)计算评价隐性因子的单因子信用评分的权重系数
&omega; j = d j &Sigma; j = 1 n d j
其中,ωj为第j个隐性因子的单因子信用评分的权重。
9.根据权利要求所述1所述的一种交通安全隐性因子的信用评分方法,其特征在于,所述的步骤(4)中得到的隐性因子交通安全信用评分credit如下:
credit i = &Sigma; j = 1 n &omega; j * r i j
其中,其中crediti表示第i个驾驶员隐性因子评分值,n为影响交通安全信用的隐性因子数量,rij为第i个驾驶员第j个影响交通安全信用隐性因子的单因子信用评分值,ωj表示第j个隐性因子的单因子信用评分的权重。
CN201510645731.6A 2015-10-09 2015-10-09 一种交通安全隐性因子的信用评分方法 Pending CN105260932A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510645731.6A CN105260932A (zh) 2015-10-09 2015-10-09 一种交通安全隐性因子的信用评分方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510645731.6A CN105260932A (zh) 2015-10-09 2015-10-09 一种交通安全隐性因子的信用评分方法

Publications (1)

Publication Number Publication Date
CN105260932A true CN105260932A (zh) 2016-01-20

Family

ID=55100607

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510645731.6A Pending CN105260932A (zh) 2015-10-09 2015-10-09 一种交通安全隐性因子的信用评分方法

Country Status (1)

Country Link
CN (1) CN105260932A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105868907A (zh) * 2016-03-29 2016-08-17 北京小米移动软件有限公司 驾驶安全性的检测方法及装置
CN107038332A (zh) * 2017-01-03 2017-08-11 阿里巴巴集团控股有限公司 一种对象选择方法和装置
CN109285065A (zh) * 2018-08-24 2019-01-29 苏宁消费金融有限公司 一种基于样条插值的信用评分方法
CN109416823A (zh) * 2017-04-18 2019-03-01 北京嘀嘀无限科技发展有限公司 用于确定司机安全分的系统和方法
CN118194034A (zh) * 2024-03-13 2024-06-14 曙光云计算集团股份有限公司 预测模型的训练方法、装置、计算机设备、介质和产品

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105868907A (zh) * 2016-03-29 2016-08-17 北京小米移动软件有限公司 驾驶安全性的检测方法及装置
CN107038332A (zh) * 2017-01-03 2017-08-11 阿里巴巴集团控股有限公司 一种对象选择方法和装置
CN109416823A (zh) * 2017-04-18 2019-03-01 北京嘀嘀无限科技发展有限公司 用于确定司机安全分的系统和方法
US11279368B2 (en) 2017-04-18 2022-03-22 Beijing Didi Infinity Technology And Development Co., Ltd. System and method for determining safety score of driver
CN109285065A (zh) * 2018-08-24 2019-01-29 苏宁消费金融有限公司 一种基于样条插值的信用评分方法
CN118194034A (zh) * 2024-03-13 2024-06-14 曙光云计算集团股份有限公司 预测模型的训练方法、装置、计算机设备、介质和产品

Similar Documents

Publication Publication Date Title
Sovacool et al. Pleasure or profit? Surveying the purchasing intentions of potential electric vehicle adopters in China
Ou et al. Intensity and daily pattern of passenger vehicle use by region and class in China: estimation and implications for energy use and electrification
Wu et al. Economic development, demographic characteristics, road network and traffic accidents in Zhongshan, China: gradient boosting decision tree model
Potoglou et al. Factors associated with urban non-fatal road-accident severity
Seyedalizadeh Ganji et al. Measuring the road safety performance of Iranian provinces: a double-frontier DEA model and evidential reasoning approach
Wang et al. Professional drivers’ views on risky driving behaviors and accident liability: a questionnaire survey in Xining, China
CN105260932A (zh) 一种交通安全隐性因子的信用评分方法
Greene et al. What is the evidence concerning the gap between on-road and Environmental Protection Agency fuel economy ratings?
Nolan et al. Identifying and measuring public policy goals: ISTEA and the US bus transit industry
CN107203945A (zh) 车险分级评估方法及装置
CN112508622A (zh) 基于改进云模型的出租车服务水平评价系统及评价方法
Gross Case–control analysis in highway safety: Accounting for sites with multiple crashes
CN111815141A (zh) 获取互通式立交运行风险评估模型的方法及风险评估方法
Banihashemi Effect of horizontal curves on urban arterial crashes
Babaee et al. A new approach for index construction: The case of the road user behavior index
WO2024212370A1 (zh) 商用车风险的分析方法
Mi et al. Prediction on transaction amounts of China’s CBEC with improved GM (1, 1) models based on the principle of new information priority
Cheng et al. Analysis of technological innovation on provincial green development levels of logistics industry in China
Zhang et al. Examining the causal effects of distracted driving on crash injury severities
CN106780049B (zh) 一种车辆金融授信方法及装置
Garber The impact of red light cameras (photo-red enforcement) on crashes in Virginia.
Melendez et al. Geographically based hydrogen consumer demand and infrastructure analysis
Airi Understanding How Infrastructure Bill Dollars Affect Your Community
Mustapha et al. Association of Road User Intrapersonal Behaviours to Road Signs Compliance and Their Relationship to Road Traffic Accidents in Nigeria: A Pilot Study
Sime et al. Road load based model for vehicle repair and maintenance cost estimation

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20160120

RJ01 Rejection of invention patent application after publication