CN110532296A - 一种基于政府开放数据的市民信用积分评估系统 - Google Patents

一种基于政府开放数据的市民信用积分评估系统 Download PDF

Info

Publication number
CN110532296A
CN110532296A CN201910667481.4A CN201910667481A CN110532296A CN 110532296 A CN110532296 A CN 110532296A CN 201910667481 A CN201910667481 A CN 201910667481A CN 110532296 A CN110532296 A CN 110532296A
Authority
CN
China
Prior art keywords
data
citizen
credit
follows
fuzzy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910667481.4A
Other languages
English (en)
Inventor
张小花
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui Dike Digital Gold Technology Co Ltd
Original Assignee
Anhui Dike Digital Gold Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui Dike Digital Gold Technology Co Ltd filed Critical Anhui Dike Digital Gold Technology Co Ltd
Priority to CN201910667481.4A priority Critical patent/CN110532296A/zh
Publication of CN110532296A publication Critical patent/CN110532296A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/254Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof

Abstract

本发明公开了一种基于政府开放数据的市民信用积分评估系统,包括数据获取模块、数据分析单元、模型库、处理器、显示单元、管理单元和存储单元;所述数据获取单元用于获取市民的基础数据,基础数据包括身份特征、消费能力、信用历史、资质荣誉;身份特征为性别、年龄、身份证地址、学籍学历;前三项根据身份证获得,最后一项根据手机端补充信息;本发明采用的模型训练的准确率达到99%左右,避免了专家打分法的主观性,让算法去学习数据之间的关系。通过信用评价等级构建信用通行证,为市民提供民生信用服务,为市民生活的方方面面提供便利;而且评分规则更完善,简单有效,易于实用。

Description

一种基于政府开放数据的市民信用积分评估系统
技术领域
本发明属信用评估领域,涉及市民信用评估技术,具体是一种基于政府开 放数据的市民信用积分评估系统。
背景技术
征信体系是市场经济的国家级金融基础设施,对降低交易成本、管理信用 风险、促进信贷市场的健康发展起到了不可替代的作用。社会信用体系建设是 我国经济社会发展重要的影响因素之一。城市是我国经济活动和社会发展的基 础,是社会信用体系建设的主体。规范、引导和推动地方政府创建国家级社会 信用体系建设示范城市,完善我国社会信用体系架构,建设“信用强国”,提升 经济增长质量和效率。自2015年中国人民银行通知八家民营征信机构准备个人 征信业务以来,很多大数据公司、金融机构纷纷尝试个人征信业务。国内的征 信业刚刚起步,现有征信系统虽然已经有个基本的框架,但覆盖的人群和服务 还是有限。
为了更好的评价市民的信用积分,现提出一种解决方案。
发明内容
本发明的目的在于提供一种基于政府开放数据的市民信用积分评估系统。
本发明的目的可以通过以下技术方案实现:
一种基于政府开放数据的市民信用积分评估系统,包括数据获取模块、数 据分析单元、模型库、处理器、显示单元、管理单元和存储单元;
其中,所述数据获取单元用于获取市民的基础数据,基础数据包括身份特 征、消费能力、信用历史、资质荣誉;
其中,身份特征为性别、年龄、身份证地址、学籍学历;前三项根据身份 证获得,最后一项根据手机端补充信息;
消费能力:社保缴费基数、工资基数、公积金月汇缴额、公积金余额、车 辆登记年限;
信用历史:授权应用个数,根据APP中的信用服务授权情况、信用服务连 续履约次数、信用服务失信次数;
资质荣誉:红名单类型个数、黑名单类型个数,具体为红黑名单根据网站;
所述基础数据借助数据获取模块从政府数据库自动获取,并对基础数据进 行量化处理,量化处理具体步骤为:
步骤一:挑选出本身为数值型数据,借助数值替代该数据;
步骤二:针对事定性数据,借助预先分类的分类号来表示;
步骤三:得到基础数据经过处理后的量化数据;
所述数据获取模块用于将量化数据传输到数据分析单元,所述数据分析单 元用于结合模型库内存储的AHP层次分析法和lightgbm算法对基础数据进行相 关处理,具体处理步骤为:
步骤一:初始化模型,利用AHP层次分析法对各个指标赋予相应权重;具 体模糊AHP层次分析法方法:
S1:建立递阶层次结构模型,将决策问题分为目标层、准则层和指标层; 目标层为市民信用积分,准则层为身份特征和消费能力;指标层为量化数据;
S2:构造模糊判断矩阵;具体为将同一层次各因素对所属上一层次某因素 的重要性进行比较,评定各因素的相对重要性,通过对这些影响因素之间的两 两比较确定一个重要性分值,填入矩阵,就构成了模糊判断矩阵;
S3:层次单排序及其一致性检验;层次单排序就是计算准则层某个指标所 包含的所有指标层各子指标相对于准则层指标的相对重要性权重,具体计算步 骤如下:首先计算判断矩阵每一行元素的和,设上述判断矩阵中的重要性分值 为bij,表示为因素i的具体指标j;参数α,α=(n-1)/2;则能得到重要性 权重wi;
S4:进行层次总排序;根据得到的权重,设置市民的总分为1000分,再用 基础分乘以相应的权重,得到每项子指标该有的总分;
再利用打分规则进行基础评分体系;打分规则具体为用户预先设置的每项 数据对应评分;得到每个市民的基础评分;
步骤二:利用初始模型积累训练样本,应用大数据的方法,建立特征工程; 特征工程指代码中原始数据的处理,具体为:原始数据中根据身份证号码,转 化成性别字段中的1:男,2:女,转换成数值型变量,同理其他字段;
对空值进行填充,异常值进行删除,进行相关性检验,找到和信用积分相 关性较大的指标,剔除掉多重共线性的自变量;
步骤三:从市民数据中抽取经过特征工程处理后的特征数据形成市民特征 工程;
步骤四:对数据进行清洗加工后,采用lightgbm算法得到市民信用值;
所述处理器用于将市民信用值传输到存储单元进行实时存储,所述管理单 元用于用户录入各个指标对应的相应权重。
进一步地,模糊AHP层次分析法方法步骤S2中的模糊判断矩阵为:
模糊一致判断矩阵一为:
模糊一致判断矩阵二为:
同理对剩下U2、U3、U4、U5进行处理。
进一步地,模糊AHP层次分析法方法步骤S3中Wi计算方法为:
U1相对于U的权重w1的计算为:
按照以上计算步骤,层次单排序的计算结果如下:
根据模糊一致判断矩阵一计算出来的准则层各指标相对于目标层的相 对重要性权重为:W=[w1,w2,w3,w4,w5]T
根据模糊一致判断矩阵二,3,4,5,6计算出来的指标层各指标相对于所属准 则层的相对重要性权重分别为:W1=[w11,w12,w13,w14,w15]T,同理计算W2、 W3、W4、W5
本发明的有益效果:
本发明采用的模型训练的准确率达到99%左右,避免了专家打分法的主观性, 让算法去学习数据之间的关系。通过信用评价等级构建信用通行证,为市民提 供民生信用服务,为市民生活的方方面面提供便利;而且评分规则更完善,简 单有效,易于实用。
附图说明
为了便于本领域技术人员理解,下面结合附图对本发明作进一步的说明。
图1为本发明的系统框图;
图2为本发明给市民各项评分的示例。
具体实施方式
如图1所示,一种基于政府开放数据的市民信用积分评估系统,包括数据 获取模块、数据分析单元、模型库、处理器、显示单元、管理单元和存储单元;
其中,所述数据获取单元用于获取市民的基础数据,基础数据包括身份特 征、消费能力、社交人脉、信用历史、资质荣誉;
其中,身份特征:性别、年龄、身份证地址、学籍学历;前三项根据身份 证获得,最后一项根据手机端补充信息;
消费能力:社保缴费基数、工资基数、公积金月汇缴额、公积金余额、车 辆登记年限、车辆国产还是进口;
社交人脉:社保参保状态、单位性质,具体特征值为:1:国家机关公务员、 事业单位员工,2:金融机构员工,3:优质公用事业单位,如邮政、电力、电 信、报业、广播电视、民航、机场等,4:一般国有企业、私营企业员工、个体 户、专业人员,5:无法判断;根据政府提供的市民单位名称判断社保实际缴费 月数、公积金账户状态,公积金账户状态具体特征值为1:开户,2:正常,3: 封存,4:销户;公积金个人缴存比例、公积金单位与个人缴存比例、公积金汇 缴年限;
信用历史:授权应用个数,根据APP中的信用服务授权情况、信用服务连 续履约次数、信用服务失信次数
资质荣誉:红名单类型个数、黑名单类型个数,具体为红黑名单根据网站 比如信用中国公示名单;
所述基础数据借助数据获取模块从政府数据库自动获取,并对基础数据进 行量化处理,量化处理具体步骤为:
步骤一:挑选出本身为数值型数据,借助数值替代该数据;
步骤二:针对是定性数据,借助预先分类的分类号来表示;
步骤三:得到基础数据经过处理后的量化数据;
所述数据获取模块用于将量化数据传输到数据分析单元,所述数据分析单 元用于结合模型库内存储的AHP层次分析法和lightgbm算法对基础数据进行相 关处理,具体处理步骤为:
步骤一:初始化模型,利用AHP层次分析法对各个指标赋予相应权重;具 体模糊AHP层次分析法方法:
S1:建立递阶层次结构模型
将决策问题分为三个层次,如下:
S2:构造模糊判断矩阵;具体为将同一层次各因素对所属上一层次某因素 的重要性进行比较,评定各因素的相对重要性,通过对这些影响因素之间的两 两比较确定一个重要性分值,填入矩阵,就构成了模糊判断矩阵;模糊判断矩 阵中的填入的分值一般按照如下所示的0.1-0.9标识法,具体为:
其中,模糊判断矩阵包括模糊一致判断矩阵一和模糊一致判断矩阵二,具 体为:
模糊一致判断矩阵一为:
模糊一致判断矩阵二为:
同理对剩下U2、U3、U4、U5进行处理;
S3:层次单排序及其一致性检验;层次单排序就是计算准则层某个指标所 包含的所有指标层各子指标相对于准则层指标的相对重要性权重,具体计算步 骤如下:首先计算判断矩阵每一行元素的和,设上述判断矩阵中的重要性分值 为bij,表示为因素i的具体指标j;参数α,α=(n-1)/2;则能得到重要性 权重wi;则有:
U1相对于U的权重w1的计算为:
按照以上计算步骤,层次单排序的计算结果如下:
根据模糊一致判断矩阵一计算出来的准则层各指标相对于目标层的相对重 要性权重为:W=[w1,w2,w3,w4,w5]T
根据模糊一致判断矩阵二,3,4,5,6计算出来的指标层各指标相对于所属准 则层的相对重要性权重分别为:W1=[w11,w12,w13,w14,w15]T,同理计算W2、 W3、W4、W5
根据得到的权重,设置市民的总分为1000分,再用基础分乘以相应的权重, 得到每项子指标该有的总分;
再利用打分规则进行基础评分体系;打分规则具体为用户预先设置的每项 数据对应评分,具体可参考图2;得到每个市民的基础评分;
步骤二:利用初始模型积累训练样本,应用大数据的方法,建立特征工程; 特征工程指代码中原始数据的处理,比如:原始数据中根据身份证号码,转化 成性别字段中的1:男,2:女,转换成数值型变量,同理其他字段;
当出现空值异常值时,进行相关性检验,找到和信用积分相关性较大的指 标,剔除掉多重共线性的自变量;
步骤三:从市民数据中抽取经过特征工程处理后的特征数据形成市民特征 工程;
步骤四:对数据进行清洗加工后,采用lightgbm算法得到市民信用值;
所述处理器用于将市民信用值传输到存储单元进行实时存储,所述管理单 元用于用户录入各个指标对应的相应权重。
本发明采用的模型训练的准确率达到99%左右,避免了专家打分法的主观性, 让算法去学习数据之间的关系。通过信用评价等级构建信用通行证,为市民提 供民生信用服务,为市民生活的方方面面提供便利;而且评分规则更完善,简 单有效,易于实用;主要表现的应用场景有:在信用乘车,在乘坐公交车时, 公交扫码先享后付,信用良好的市民可享受一定金额的“先乘车,后付款”、信 用骑车、信用借阅、信用医疗等,后期将不断拓展,包括在政务、公共服务等 场景提供便利服务。
以上内容仅仅是对本发明结构所作的举例和说明,所属本技术领域的技术 人员对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代, 只要不偏离发明的结构或者超越本权利要求书所定义的范围,均应属于本发明 的保护范围。

Claims (3)

1.一种基于政府开放数据的市民信用积分评估系统,其特征在于,包括数据获取模块、数据分析单元、模型库、处理器、显示单元、管理单元和存储单元;
其中,所述数据获取单元用于获取市民的基础数据,基础数据包括身份特征、消费能力、信用历史、资质荣誉;
其中,身份特征为性别、年龄、身份证地址、学籍学历;前三项根据身份证获得,最后一项根据手机端补充信息;
消费能力:社保缴费基数、工资基数、公积金月汇缴额、公积金余额、车辆登记年限;
信用历史:授权应用个数,根据APP中的信用服务授权情况、信用服务连续履约次数、信用服务失信次数;
资质荣誉:红名单类型个数、黑名单类型个数,具体为红黑名单根据网站;
所述基础数据借助数据获取模块从政府数据库自动获取,并对基础数据进行量化处理,量化处理具体步骤为:
步骤一:挑选出本身为数值型数据,借助数值替代该数据;
步骤二:针对事定性数据,借助预先分类的分类号来表示;
步骤三:得到基础数据经过处理后的量化数据;
所述数据获取模块用于将量化数据传输到数据分析单元,所述数据分析单元用于结合模型库内存储的AHP层次分析法和lightgbm算法对基础数据进行相关处理,具体处理步骤为:
步骤一:初始化模型,利用AHP层次分析法对各个指标赋予相应权重;具体模糊AHP层次分析法方法:
S1:建立递阶层次结构模型,将决策问题分为目标层、准则层和指标层;目标层为市民信用积分,准则层为身份特征和消费能力;指标层为量化数据;
S2:构造模糊判断矩阵;具体为将同一层次各因素对所属上一层次某因素的重要性进行比较,评定各因素的相对重要性,通过对这些影响因素之间的两两比较确定一个重要性分值,填入矩阵,就构成了模糊判断矩阵;
S3:层次单排序及其一致性检验;层次单排序就是计算准则层某个指标所包含的所有指标层各子指标相对于准则层指标的相对重要性权重,具体计算步骤如下:首先计算判断矩阵每一行元素的和,设上述判断矩阵中的重要性分值为bij,表示为因素i的具体指标j;参数α,α=(n-1)/2;则能得到重要性权重wi;
S4:进行层次总排序;根据得到的权重,设置市民的总分为1000分,再用基础分乘以相应的权重,得到每项子指标该有的总分;
再利用打分规则进行基础评分体系;打分规则具体为用户预先设置的每项数据对应评分;得到每个市民的基础评分;
步骤二:利用初始模型积累训练样本,应用大数据的方法,建立特征工程;特征工程指代码中原始数据的处理,具体为:原始数据中根据身份证号码,转化成性别字段中的1:男,2:女,转换成数值型变量,同理其他字段;
对空值进行填充,异常值进行删除,进行相关性检验,找到和信用积分相关性较大的指标,剔除掉多重共线性的自变量;
步骤三:从市民数据中抽取经过特征工程处理后的特征数据形成市民特征工程;
步骤四:对数据进行清洗加工后,采用lightgbm算法得到市民信用值;
所述处理器用于将市民信用值传输到存储单元进行实时存储,所述管理单元用于用户录入各个指标对应的相应权重。
2.根据权利要求1所述的一种基于政府开放数据的市民信用积分评估系统,其特征在于,模糊AHP层次分析法方法步骤S2中的模糊判断矩阵为:
模糊一致判断矩阵一:
模糊一致判断矩阵二:
同理对剩下U2、U3、U4、U5进行处理。
3.根据权利要求1所述的一种基于政府开放数据的市民信用积分评估系统,其特征在于,模糊AHP层次分析法方法步骤S3中Wi计算方法为:
U1相对于U的权重w1的计算为:
按照以上计算步骤,层次单排序的计算结果如下:
根据模糊一致判断矩阵一计算出来的准则层各指标相对于目标层的相对重要性权重为:W=[w1,w2,w3,w4,w5]T
根据模糊一致判断矩阵二,3,4,5,6计算出来的指标层各指标相对于所属准则层的相对重要性权重分别为:W1=[w11,w12,w13,w14,w15]T,同理计算W2、W3、W4、W5
CN201910667481.4A 2019-07-23 2019-07-23 一种基于政府开放数据的市民信用积分评估系统 Pending CN110532296A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910667481.4A CN110532296A (zh) 2019-07-23 2019-07-23 一种基于政府开放数据的市民信用积分评估系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910667481.4A CN110532296A (zh) 2019-07-23 2019-07-23 一种基于政府开放数据的市民信用积分评估系统

Publications (1)

Publication Number Publication Date
CN110532296A true CN110532296A (zh) 2019-12-03

Family

ID=68660672

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910667481.4A Pending CN110532296A (zh) 2019-07-23 2019-07-23 一种基于政府开放数据的市民信用积分评估系统

Country Status (1)

Country Link
CN (1) CN110532296A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111460260A (zh) * 2020-03-31 2020-07-28 上海智芝全智能科技有限公司 多类型数据的数据处理系统、方法及介质
CN113762519A (zh) * 2020-06-03 2021-12-07 杭州海康威视数字技术股份有限公司 一种数据清洗方法、装置及设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111460260A (zh) * 2020-03-31 2020-07-28 上海智芝全智能科技有限公司 多类型数据的数据处理系统、方法及介质
CN113762519A (zh) * 2020-06-03 2021-12-07 杭州海康威视数字技术股份有限公司 一种数据清洗方法、装置及设备

Similar Documents

Publication Publication Date Title
Münz et al. The costs and benefits of European immigration
Van de Walle The static and dynamic incidence of Vietnam's public safety net
CN108596443A (zh) 一种基于多维度数据的用电客户信用等级评价方法
CN110288259B (zh) 一种智慧城市监督服务方法及其平台
CN111489254A (zh) 基于历史信用大数据的信贷风险评估智能引擎系统
Ouda Towards a practical accounting approach for heritage assets: An alternative reporting model for the NPM practices
CN110532296A (zh) 一种基于政府开放数据的市民信用积分评估系统
Poole Multinational spillovers through worker turnover
Ajibola et al. Green economy: The role of estate surveyors and valuer
Kleynhans et al. Spatial economic development in South Africa: An overview and evaluation of the platinum spatial development initiative
Khasanah Equivalence of Islamic Financial Literation Index with Islamic Financial Inclusion Index in The Islamic Banking Sector: A Case Study of DIY Society
Shah et al. Pakistan migration report 2020
Bakari The Role of Information and Communication Technology (ICT) in Payroll Operations for Polytechnics in Nigeria
Diehlmann et al. A novel approach to include social costs in humanitarian objective functions
Poulton A land use evaluation technique for decision makers
Li Study on the Personal Credit Risk Evaluation based on Improved Fuzzy AHP Comprehensive Evaluation Method
Zvarych et al. Formation Of Infrastructural Factors Of Economic Development Of The Region
Manhas Role of Indian Post (post office) in financial inclusion
LI et al. An AHP Evaluation Approach for Financial Ecological Environment of Scientific & Technological Small-Medium Enterprises—A Case Study in South Central China
Wang Measuring Changes in Chinese Banking Productivity and Profitability
Baskar Application of book-keeping in small medium enterprises (SMES)
Bawa et al. Financial inclusion and its determinants: The case of Goa
Arianto et al. Fiscal Decentralization: Reformulation of the General Allocation Funds (GAF) Policy for Archipelagic Provinces in Indonesia
Undaresta et al. Implementation of Groundwater Tax Collection Based on Regional Regulation Number 10 of 2010 concerning Regional Taxes in Tangerang Regency
Berg et al. Complementary Currencies of the Environmentally Friendly Payment Systems

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20191203