CN110532296A - 一种基于政府开放数据的市民信用积分评估系统 - Google Patents
一种基于政府开放数据的市民信用积分评估系统 Download PDFInfo
- Publication number
- CN110532296A CN110532296A CN201910667481.4A CN201910667481A CN110532296A CN 110532296 A CN110532296 A CN 110532296A CN 201910667481 A CN201910667481 A CN 201910667481A CN 110532296 A CN110532296 A CN 110532296A
- Authority
- CN
- China
- Prior art keywords
- data
- citizen
- credit
- follows
- fuzzy
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/254—Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Software Systems (AREA)
- Fuzzy Systems (AREA)
- Quality & Reliability (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Computational Linguistics (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于政府开放数据的市民信用积分评估系统,包括数据获取模块、数据分析单元、模型库、处理器、显示单元、管理单元和存储单元;所述数据获取单元用于获取市民的基础数据,基础数据包括身份特征、消费能力、信用历史、资质荣誉;身份特征为性别、年龄、身份证地址、学籍学历;前三项根据身份证获得,最后一项根据手机端补充信息;本发明采用的模型训练的准确率达到99%左右,避免了专家打分法的主观性,让算法去学习数据之间的关系。通过信用评价等级构建信用通行证,为市民提供民生信用服务,为市民生活的方方面面提供便利;而且评分规则更完善,简单有效,易于实用。
Description
技术领域
本发明属信用评估领域,涉及市民信用评估技术,具体是一种基于政府开 放数据的市民信用积分评估系统。
背景技术
征信体系是市场经济的国家级金融基础设施,对降低交易成本、管理信用 风险、促进信贷市场的健康发展起到了不可替代的作用。社会信用体系建设是 我国经济社会发展重要的影响因素之一。城市是我国经济活动和社会发展的基 础,是社会信用体系建设的主体。规范、引导和推动地方政府创建国家级社会 信用体系建设示范城市,完善我国社会信用体系架构,建设“信用强国”,提升 经济增长质量和效率。自2015年中国人民银行通知八家民营征信机构准备个人 征信业务以来,很多大数据公司、金融机构纷纷尝试个人征信业务。国内的征 信业刚刚起步,现有征信系统虽然已经有个基本的框架,但覆盖的人群和服务 还是有限。
为了更好的评价市民的信用积分,现提出一种解决方案。
发明内容
本发明的目的在于提供一种基于政府开放数据的市民信用积分评估系统。
本发明的目的可以通过以下技术方案实现:
一种基于政府开放数据的市民信用积分评估系统,包括数据获取模块、数 据分析单元、模型库、处理器、显示单元、管理单元和存储单元;
其中,所述数据获取单元用于获取市民的基础数据,基础数据包括身份特 征、消费能力、信用历史、资质荣誉;
其中,身份特征为性别、年龄、身份证地址、学籍学历;前三项根据身份 证获得,最后一项根据手机端补充信息;
消费能力:社保缴费基数、工资基数、公积金月汇缴额、公积金余额、车 辆登记年限;
信用历史:授权应用个数,根据APP中的信用服务授权情况、信用服务连 续履约次数、信用服务失信次数;
资质荣誉:红名单类型个数、黑名单类型个数,具体为红黑名单根据网站;
所述基础数据借助数据获取模块从政府数据库自动获取,并对基础数据进 行量化处理,量化处理具体步骤为:
步骤一:挑选出本身为数值型数据,借助数值替代该数据;
步骤二:针对事定性数据,借助预先分类的分类号来表示;
步骤三:得到基础数据经过处理后的量化数据;
所述数据获取模块用于将量化数据传输到数据分析单元,所述数据分析单 元用于结合模型库内存储的AHP层次分析法和lightgbm算法对基础数据进行相 关处理,具体处理步骤为:
步骤一:初始化模型,利用AHP层次分析法对各个指标赋予相应权重;具 体模糊AHP层次分析法方法:
S1:建立递阶层次结构模型,将决策问题分为目标层、准则层和指标层; 目标层为市民信用积分,准则层为身份特征和消费能力;指标层为量化数据;
S2:构造模糊判断矩阵;具体为将同一层次各因素对所属上一层次某因素 的重要性进行比较,评定各因素的相对重要性,通过对这些影响因素之间的两 两比较确定一个重要性分值,填入矩阵,就构成了模糊判断矩阵;
S3:层次单排序及其一致性检验;层次单排序就是计算准则层某个指标所 包含的所有指标层各子指标相对于准则层指标的相对重要性权重,具体计算步 骤如下:首先计算判断矩阵每一行元素的和,设上述判断矩阵中的重要性分值 为bij,表示为因素i的具体指标j;参数α,α=(n-1)/2;则能得到重要性 权重wi;
S4:进行层次总排序;根据得到的权重,设置市民的总分为1000分,再用 基础分乘以相应的权重,得到每项子指标该有的总分;
再利用打分规则进行基础评分体系;打分规则具体为用户预先设置的每项 数据对应评分;得到每个市民的基础评分;
步骤二:利用初始模型积累训练样本,应用大数据的方法,建立特征工程; 特征工程指代码中原始数据的处理,具体为:原始数据中根据身份证号码,转 化成性别字段中的1:男,2:女,转换成数值型变量,同理其他字段;
对空值进行填充,异常值进行删除,进行相关性检验,找到和信用积分相 关性较大的指标,剔除掉多重共线性的自变量;
步骤三:从市民数据中抽取经过特征工程处理后的特征数据形成市民特征 工程;
步骤四:对数据进行清洗加工后,采用lightgbm算法得到市民信用值;
所述处理器用于将市民信用值传输到存储单元进行实时存储,所述管理单 元用于用户录入各个指标对应的相应权重。
进一步地,模糊AHP层次分析法方法步骤S2中的模糊判断矩阵为:
模糊一致判断矩阵一为:
模糊一致判断矩阵二为:
同理对剩下U2、U3、U4、U5进行处理。
进一步地,模糊AHP层次分析法方法步骤S3中Wi计算方法为:
U1相对于U的权重w1的计算为:
按照以上计算步骤,层次单排序的计算结果如下:
根据模糊一致判断矩阵一计算出来的准则层各指标相对于目标层的相 对重要性权重为:W=[w1,w2,w3,w4,w5]T;
根据模糊一致判断矩阵二,3,4,5,6计算出来的指标层各指标相对于所属准 则层的相对重要性权重分别为:W1=[w11,w12,w13,w14,w15]T,同理计算W2、 W3、W4、W5。
本发明的有益效果:
本发明采用的模型训练的准确率达到99%左右,避免了专家打分法的主观性, 让算法去学习数据之间的关系。通过信用评价等级构建信用通行证,为市民提 供民生信用服务,为市民生活的方方面面提供便利;而且评分规则更完善,简 单有效,易于实用。
附图说明
为了便于本领域技术人员理解,下面结合附图对本发明作进一步的说明。
图1为本发明的系统框图;
图2为本发明给市民各项评分的示例。
具体实施方式
如图1所示,一种基于政府开放数据的市民信用积分评估系统,包括数据 获取模块、数据分析单元、模型库、处理器、显示单元、管理单元和存储单元;
其中,所述数据获取单元用于获取市民的基础数据,基础数据包括身份特 征、消费能力、社交人脉、信用历史、资质荣誉;
其中,身份特征:性别、年龄、身份证地址、学籍学历;前三项根据身份 证获得,最后一项根据手机端补充信息;
消费能力:社保缴费基数、工资基数、公积金月汇缴额、公积金余额、车 辆登记年限、车辆国产还是进口;
社交人脉:社保参保状态、单位性质,具体特征值为:1:国家机关公务员、 事业单位员工,2:金融机构员工,3:优质公用事业单位,如邮政、电力、电 信、报业、广播电视、民航、机场等,4:一般国有企业、私营企业员工、个体 户、专业人员,5:无法判断;根据政府提供的市民单位名称判断社保实际缴费 月数、公积金账户状态,公积金账户状态具体特征值为1:开户,2:正常,3: 封存,4:销户;公积金个人缴存比例、公积金单位与个人缴存比例、公积金汇 缴年限;
信用历史:授权应用个数,根据APP中的信用服务授权情况、信用服务连 续履约次数、信用服务失信次数
资质荣誉:红名单类型个数、黑名单类型个数,具体为红黑名单根据网站 比如信用中国公示名单;
所述基础数据借助数据获取模块从政府数据库自动获取,并对基础数据进 行量化处理,量化处理具体步骤为:
步骤一:挑选出本身为数值型数据,借助数值替代该数据;
步骤二:针对是定性数据,借助预先分类的分类号来表示;
步骤三:得到基础数据经过处理后的量化数据;
所述数据获取模块用于将量化数据传输到数据分析单元,所述数据分析单 元用于结合模型库内存储的AHP层次分析法和lightgbm算法对基础数据进行相 关处理,具体处理步骤为:
步骤一:初始化模型,利用AHP层次分析法对各个指标赋予相应权重;具 体模糊AHP层次分析法方法:
S1:建立递阶层次结构模型
将决策问题分为三个层次,如下:
S2:构造模糊判断矩阵;具体为将同一层次各因素对所属上一层次某因素 的重要性进行比较,评定各因素的相对重要性,通过对这些影响因素之间的两 两比较确定一个重要性分值,填入矩阵,就构成了模糊判断矩阵;模糊判断矩 阵中的填入的分值一般按照如下所示的0.1-0.9标识法,具体为:
其中,模糊判断矩阵包括模糊一致判断矩阵一和模糊一致判断矩阵二,具 体为:
模糊一致判断矩阵一为:
模糊一致判断矩阵二为:
同理对剩下U2、U3、U4、U5进行处理;
S3:层次单排序及其一致性检验;层次单排序就是计算准则层某个指标所 包含的所有指标层各子指标相对于准则层指标的相对重要性权重,具体计算步 骤如下:首先计算判断矩阵每一行元素的和,设上述判断矩阵中的重要性分值 为bij,表示为因素i的具体指标j;参数α,α=(n-1)/2;则能得到重要性 权重wi;则有:
U1相对于U的权重w1的计算为:
按照以上计算步骤,层次单排序的计算结果如下:
根据模糊一致判断矩阵一计算出来的准则层各指标相对于目标层的相对重 要性权重为:W=[w1,w2,w3,w4,w5]T;
根据模糊一致判断矩阵二,3,4,5,6计算出来的指标层各指标相对于所属准 则层的相对重要性权重分别为:W1=[w11,w12,w13,w14,w15]T,同理计算W2、 W3、W4、W5;
根据得到的权重,设置市民的总分为1000分,再用基础分乘以相应的权重, 得到每项子指标该有的总分;
再利用打分规则进行基础评分体系;打分规则具体为用户预先设置的每项 数据对应评分,具体可参考图2;得到每个市民的基础评分;
步骤二:利用初始模型积累训练样本,应用大数据的方法,建立特征工程; 特征工程指代码中原始数据的处理,比如:原始数据中根据身份证号码,转化 成性别字段中的1:男,2:女,转换成数值型变量,同理其他字段;
当出现空值异常值时,进行相关性检验,找到和信用积分相关性较大的指 标,剔除掉多重共线性的自变量;
步骤三:从市民数据中抽取经过特征工程处理后的特征数据形成市民特征 工程;
步骤四:对数据进行清洗加工后,采用lightgbm算法得到市民信用值;
所述处理器用于将市民信用值传输到存储单元进行实时存储,所述管理单 元用于用户录入各个指标对应的相应权重。
本发明采用的模型训练的准确率达到99%左右,避免了专家打分法的主观性, 让算法去学习数据之间的关系。通过信用评价等级构建信用通行证,为市民提 供民生信用服务,为市民生活的方方面面提供便利;而且评分规则更完善,简 单有效,易于实用;主要表现的应用场景有:在信用乘车,在乘坐公交车时, 公交扫码先享后付,信用良好的市民可享受一定金额的“先乘车,后付款”、信 用骑车、信用借阅、信用医疗等,后期将不断拓展,包括在政务、公共服务等 场景提供便利服务。
以上内容仅仅是对本发明结构所作的举例和说明,所属本技术领域的技术 人员对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代, 只要不偏离发明的结构或者超越本权利要求书所定义的范围,均应属于本发明 的保护范围。
Claims (3)
1.一种基于政府开放数据的市民信用积分评估系统,其特征在于,包括数据获取模块、数据分析单元、模型库、处理器、显示单元、管理单元和存储单元;
其中,所述数据获取单元用于获取市民的基础数据,基础数据包括身份特征、消费能力、信用历史、资质荣誉;
其中,身份特征为性别、年龄、身份证地址、学籍学历;前三项根据身份证获得,最后一项根据手机端补充信息;
消费能力:社保缴费基数、工资基数、公积金月汇缴额、公积金余额、车辆登记年限;
信用历史:授权应用个数,根据APP中的信用服务授权情况、信用服务连续履约次数、信用服务失信次数;
资质荣誉:红名单类型个数、黑名单类型个数,具体为红黑名单根据网站;
所述基础数据借助数据获取模块从政府数据库自动获取,并对基础数据进行量化处理,量化处理具体步骤为:
步骤一:挑选出本身为数值型数据,借助数值替代该数据;
步骤二:针对事定性数据,借助预先分类的分类号来表示;
步骤三:得到基础数据经过处理后的量化数据;
所述数据获取模块用于将量化数据传输到数据分析单元,所述数据分析单元用于结合模型库内存储的AHP层次分析法和lightgbm算法对基础数据进行相关处理,具体处理步骤为:
步骤一:初始化模型,利用AHP层次分析法对各个指标赋予相应权重;具体模糊AHP层次分析法方法:
S1:建立递阶层次结构模型,将决策问题分为目标层、准则层和指标层;目标层为市民信用积分,准则层为身份特征和消费能力;指标层为量化数据;
S2:构造模糊判断矩阵;具体为将同一层次各因素对所属上一层次某因素的重要性进行比较,评定各因素的相对重要性,通过对这些影响因素之间的两两比较确定一个重要性分值,填入矩阵,就构成了模糊判断矩阵;
S3:层次单排序及其一致性检验;层次单排序就是计算准则层某个指标所包含的所有指标层各子指标相对于准则层指标的相对重要性权重,具体计算步骤如下:首先计算判断矩阵每一行元素的和,设上述判断矩阵中的重要性分值为bij,表示为因素i的具体指标j;参数α,α=(n-1)/2;则能得到重要性权重wi;
S4:进行层次总排序;根据得到的权重,设置市民的总分为1000分,再用基础分乘以相应的权重,得到每项子指标该有的总分;
再利用打分规则进行基础评分体系;打分规则具体为用户预先设置的每项数据对应评分;得到每个市民的基础评分;
步骤二:利用初始模型积累训练样本,应用大数据的方法,建立特征工程;特征工程指代码中原始数据的处理,具体为:原始数据中根据身份证号码,转化成性别字段中的1:男,2:女,转换成数值型变量,同理其他字段;
对空值进行填充,异常值进行删除,进行相关性检验,找到和信用积分相关性较大的指标,剔除掉多重共线性的自变量;
步骤三:从市民数据中抽取经过特征工程处理后的特征数据形成市民特征工程;
步骤四:对数据进行清洗加工后,采用lightgbm算法得到市民信用值;
所述处理器用于将市民信用值传输到存储单元进行实时存储,所述管理单元用于用户录入各个指标对应的相应权重。
2.根据权利要求1所述的一种基于政府开放数据的市民信用积分评估系统,其特征在于,模糊AHP层次分析法方法步骤S2中的模糊判断矩阵为:
模糊一致判断矩阵一:
模糊一致判断矩阵二:
同理对剩下U2、U3、U4、U5进行处理。
3.根据权利要求1所述的一种基于政府开放数据的市民信用积分评估系统,其特征在于,模糊AHP层次分析法方法步骤S3中Wi计算方法为:
U1相对于U的权重w1的计算为:
按照以上计算步骤,层次单排序的计算结果如下:
根据模糊一致判断矩阵一计算出来的准则层各指标相对于目标层的相对重要性权重为:W=[w1,w2,w3,w4,w5]T;
根据模糊一致判断矩阵二,3,4,5,6计算出来的指标层各指标相对于所属准则层的相对重要性权重分别为:W1=[w11,w12,w13,w14,w15]T,同理计算W2、W3、W4、W5。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910667481.4A CN110532296A (zh) | 2019-07-23 | 2019-07-23 | 一种基于政府开放数据的市民信用积分评估系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910667481.4A CN110532296A (zh) | 2019-07-23 | 2019-07-23 | 一种基于政府开放数据的市民信用积分评估系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110532296A true CN110532296A (zh) | 2019-12-03 |
Family
ID=68660672
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910667481.4A Pending CN110532296A (zh) | 2019-07-23 | 2019-07-23 | 一种基于政府开放数据的市民信用积分评估系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110532296A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111460260A (zh) * | 2020-03-31 | 2020-07-28 | 上海智芝全智能科技有限公司 | 多类型数据的数据处理系统、方法及介质 |
CN113762519A (zh) * | 2020-06-03 | 2021-12-07 | 杭州海康威视数字技术股份有限公司 | 一种数据清洗方法、装置及设备 |
-
2019
- 2019-07-23 CN CN201910667481.4A patent/CN110532296A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111460260A (zh) * | 2020-03-31 | 2020-07-28 | 上海智芝全智能科技有限公司 | 多类型数据的数据处理系统、方法及介质 |
CN113762519A (zh) * | 2020-06-03 | 2021-12-07 | 杭州海康威视数字技术股份有限公司 | 一种数据清洗方法、装置及设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Münz et al. | The costs and benefits of European immigration | |
Chakrabarty | Financial inclusion: issues in measurement and analysis | |
CN108596443A (zh) | 一种基于多维度数据的用电客户信用等级评价方法 | |
Ouda | Towards a practical accounting approach for heritage assets: an alternative reporting model for the NPM practices | |
CN110532296A (zh) | 一种基于政府开放数据的市民信用积分评估系统 | |
Poole | Multinational spillovers through worker turnover | |
Pilehvar | Investigating the relationship between informal economy and competitiveness in Iran’s metropolises | |
Ajibola et al. | Green economy: The role of estate surveyors and valuer | |
Emery et al. | Does e-procurement matter for economic growth? Subnational evidence from Australia | |
Davies et al. | A 2009 social accounting matrix (SAM) for South Africa | |
Kleynhans et al. | Spatial economic development in South Africa: An overview and evaluation of the platinum spatial development initiative | |
Khasanah | Equivalence of Islamic Financial Literation Index with Islamic Financial Inclusion Index in The Islamic Banking Sector: A Case Study of DIY Society | |
Bakari | The Role of Information and Communication Technology (ICT) in Payroll Operations for Polytechnics in Nigeria | |
Li | Study on the Personal Credit Risk Evaluation based on Improved Fuzzy AHP Comprehensive Evaluation Method | |
Diehlmann et al. | A novel approach to include social costs in humanitarian objective functions | |
Poulton | A land use evaluation technique for decision makers | |
Zvarych et al. | Formation Of Infrastructural Factors Of Economic Development Of The Region | |
Rusydiana et al. | Islamic Group Lending and Financial Inclusion | |
Polukhina et al. | Approaches to regulation of the information space of the regional social and economic complex in the Russian Federation | |
LI et al. | An AHP Evaluation Approach for Financial Ecological Environment of Scientific & Technological Small-Medium Enterprises—A Case Study in South Central China | |
Manhas | Role of Indian Post (post office) in financial inclusion | |
Wang | Measuring Changes in Chinese Banking Productivity and Profitability | |
Baskar | Application of book-keeping in small medium enterprises (SMES) | |
Bawa et al. | Financial inclusion and its determinants: The case of Goa | |
Arianto et al. | Fiscal Decentralization: Reformulation of the General Allocation Funds (GAF) Policy for Archipelagic Provinces in Indonesia |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20191203 |