CN116702052B - 一种社区社会信用体系信息处理系统及方法 - Google Patents
一种社区社会信用体系信息处理系统及方法 Download PDFInfo
- Publication number
- CN116702052B CN116702052B CN202310965749.9A CN202310965749A CN116702052B CN 116702052 B CN116702052 B CN 116702052B CN 202310965749 A CN202310965749 A CN 202310965749A CN 116702052 B CN116702052 B CN 116702052B
- Authority
- CN
- China
- Prior art keywords
- movement
- community social
- population
- credit
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 30
- 230000010365 information processing Effects 0.000 title claims abstract description 16
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 26
- 210000000988 bone and bone Anatomy 0.000 claims abstract description 23
- 238000007637 random forest analysis Methods 0.000 claims abstract description 16
- 238000010845 search algorithm Methods 0.000 claims abstract description 15
- 238000003066 decision tree Methods 0.000 claims abstract description 13
- 238000007405 data analysis Methods 0.000 claims abstract description 12
- 239000000284 extract Substances 0.000 claims abstract description 8
- 238000004458 analytical method Methods 0.000 claims abstract description 7
- 238000007499 fusion processing Methods 0.000 claims abstract description 6
- 238000010276 construction Methods 0.000 claims description 7
- 238000005457 optimization Methods 0.000 claims description 5
- 238000003672 processing method Methods 0.000 claims description 3
- 241000364483 Lipeurus epsilon Species 0.000 claims 1
- 238000000605 extraction Methods 0.000 claims 1
- 238000005192 partition Methods 0.000 description 5
- 238000000638 solvent extraction Methods 0.000 description 3
- 201000004569 Blindness Diseases 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 241000167854 Bourreria succulenta Species 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 235000019693 cherries Nutrition 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Data Mining & Analysis (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Educational Administration (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Accounting & Taxation (AREA)
- General Health & Medical Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- Finance (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- Game Theory and Decision Science (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Primary Health Care (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Technology Law (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明涉及信用服务技术领域,尤其为一种社区社会信用体系信息处理系统及方法,包括:信用数据采集模块:用于采集社区社会信用数据;数据特征处理模块:用于对采集的社区社会信用数据进行特征提取处理;信用数据分析模块:用于对社区社会信用数据进行分析;信用体系搭建模块;用于基于分析结果搭建社区社会信用体系。本发明基于决策树的划分,通过随机森林算法提取信用特征数据,基于基分类器进行信用特征数据的初步分类,并基于改进白骨顶搜索算法进行基分类器权重的寻优,通过改进的白骨顶搜索算法优化提升算法的收敛性能,基于寻优获取的基分类器权重基于融合处理进行居民的信用等级划分,能够较为准确的反映社区社会信用体系评分结果。
Description
技术领域
本发明涉及信用服务技术领域,尤其是一种社区社会信用体系信息处理系统及方法。
背景技术
为了实现信用体系的建设,须从小群体先行先试,因此我们需要结合社区自身优势和资源,构建信用惠民数据,构建一套社区社会信用体系服务系统。现有技术基于樱花分评分的方式进行量化评分,但是对于各项信用评分项目的分类较少,细分程度不够,且对于个人的信用评分仅通过评分项目的严重程度进行赋分和扣分,未基于评分项目的重要程度进行综合评分,不能够准确反映信用体系评分结果。
发明内容
本发明的目的是通过提出一种社区社会信用体系信息处理系统及方法,以解决上述背景技术中提出的缺陷。
本发明采用的技术方案如下:
提供一种社区社会信用体系信息处理系统,包括:
信用数据采集模块:用于采集社区社会信用数据;
数据特征处理模块:用于对采集的社区社会信用数据进行特征提取处理;
信用数据分析模块:用于对社区社会信用数据进行分析;
信用体系搭建模块:用于基于分析结果搭建社区社会信用体系;
所述数据特征处理模块根据社区社会信用数据的类型基于决策树进行划分,并基于随机森林算法提取信用特征数据;
所述随机森林算法具体如下:
其中,表示决策树上节点/>的基尼系数,/>表示社区社会信用数据类别数量,/>表示决策树上节点/>上属于第/>类的样本所占比例,
其中,表示节点/>分枝前后的基尼系数变化量,/>、/>分别表示节点/>分枝后两个新节点上计算的基尼系数,
其中,表示社区社会信用数据/>在第/>个决策树上的重要性评分;
其中,表示社区社会信用数据/>在整个随机森林中的重要性。
作为本发明的一种优选技术方案:所述数据特征处理模块基于社区社会信用数据在随机森林中的重要性进行排序筛选提取信用特征数据。
作为本发明的一种优选技术方案:所述信用数据分析模块基于所述数据特征处理模块提取的信用特征数据的获取训练样本及训练样本对应的类别标签获得训练样本集,并基于SVM基分类器进行初步分类,将SVM基分类器的权重作为个体的位置信息,基于改进白骨顶搜索算法进行基分类器的权重寻优。
作为本发明的一种优选技术方案:所述改进白骨顶搜索算法具体如下:
基于基分类器的个数分别生成种群和反向种群/>,
其中,为第/>个种群个体的位置信息,/>为随机选取的维度,/>为搜索空间的上限,/>为搜索空间的下限,/>为点乘运算,/>为第/>个反向种群个体的位置信息,/>为/>间的随机数;
生成新的种群:
其中,为第/>个种群个体的适应度,/>为第/>个反向种群个体的适应度;
新的种群个体具有如下的三种移动方式:
个体随机移动:
其中,为第/>个新的种群个体第/>次移动后的位置,/>为第/>个新的种群个体第/>次移动的位置,/>为当前迭代次数,/>为最大迭代次数,/>为随机选取的位置;
链式移动:
其中,为第/>个新的种群个体第/>次移动的位置;
跟随群体领导者移动:
其中,为领导者个体,/>为取余运算,/>为预设领导者数量,/>为第/>个领导者个体第/>次移动的位置,/>为第/>个领导者个体第/>次移动的位置,/>为/>间的随机数,/>为全局最优位置,/>为/>间的随机数;
新的种群个体通过下式选取移动方式:
其中,为第/>个新的种群个体在第/>次移动时选择的移动方式,为第/>个新的种群个体在第/>次移动时选择的移动方式,/>为非运算,/>为随机选取,/>为第/>个新的种群个体在第/>次移动时的适应度值,/>为第/>个新的种群个体在第/>次移动时的适应度值。
作为本发明的一种优选技术方案:所述改进白骨顶搜索算法中,基于训练样本集的训练误差倒数作为适应度函数,基于改进白骨顶搜索算法信寻优获取最佳位置。
作为本发明的一种优选技术方案:所述信用数据分析模块获取最佳位置对应的SVM基分类器最佳权重后,
进行各SVM基分类器的融合处理:
其中,为社区社会信用数据的分类结果,/>为第/>个基分类器的权重,/>为第/>个基分类器的分类结果。
作为本发明的一种优选技术方案:所述信用体系搭建模块基于强分类器分类结果划分社区社会信用等级体系,对社区社会信用数据进行社区社会信用等级划分。
提供一种社区社会信用体系信息处理方法,包括如下步骤:
S1:采集社区社会信用数据;
S2:对采集的社区社会信用数据进行特征提取处理;
S3:对社区社会信用数据进行分析;
S4:基于分析结果搭建社区社会信用体系。
本发明提供的社区社会信用体系信息处理系统及方法,与现有技术相比,其有益效果有:
本发明基于决策树的划分,通过随机森林算法提取信用特征数据,基于基分类器进行信用特征数据的初步分类,并基于改进白骨顶搜索算法进行基分类器权重的寻优,通过种群和反向种群生成新的种群的方式可以对种群初始化阶段进行优化以提升算法的收敛性能,还通过添加移动方式的选取策略,可以减少移动过程的盲目性,提升算法的移动效率以及算法的收敛速度,基于寻优获取的基分类器权重基于融合处理进行居民的信用等级划分,能够较为准确的反映社区社会信用体系评分结果。
附图说明
图1为本发明优选实施例的系统框图;
图2为本发明优选实施例中方法流程图。
图中各个标记的意义为:100、信用数据采集模块;200、数据特征处理模块;300、信用数据分析模块;400、信用体系搭建模块。
具体实施方式
需要说明的是,在不冲突的情况下,本实施例中的实施例及实施例中的特征可以相互组合,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参照图1所示,本发明优选实施例提供了一种社区社会信用体系信息处理系统,包括:
信用数据采集模块100:用于采集社区社会信用数据;
数据特征处理模块200:用于对采集的社区社会信用数据进行特征提取处理;
信用数据分析模块300:用于对社区社会信用数据进行分析;
信用体系搭建模块400:用于基于分析结果搭建社区社会信用体系。
所述数据特征处理模块200根据社区社会信用数据的类型基于决策树进行划分,并基于随机森林算法提取信用特征数据。
所述随机森林算法具体如下:
其中,表示决策树上节点/>的基尼系数,/>表示社区社会信用数据类别数量,/>表示决策树上节点/>上属于第/>类的样本所占比例,
其中,表示节点/>分枝前后的基尼系数变化量,/>、/>分别表示节点/>分枝后两个新节点上计算的基尼系数,
其中,表示社区社会信用数据/>在第/>个决策树上的重要性评分;
其中,表示社区社会信用数据/>在整个随机森林中的重要性。
其中,为了保证选择节点的划分特征和划分点。本实施例采用贪心算法通过遍历每个特征和每个特征的可能划分点,选择能够最大程度地减少基尼系数的划分作为最优划分。具体为:
对于每个社区社会信用数据:
对于每个可能的划分点:
将样本数据根据和/>进行划分为两个子集:/>和/>,其中左子集包含个样本,其中属于类别/>的样本数量为/>,右子集包含/>个样本,其中属于类别的样本数量为/>;根据子集/>和/>中的样本数量/>和/>,分别计算/>和/>的基尼系数/>和/>。计算公式如下:
计算当前划分的基尼系数。
选择具有最小基尼系数的特征和划分点,即。
基于贪心算法选择能够最大程度地减少基尼系数的划分,意味着它能够有效地减少数据集的不纯度。通过选择最优划分,可以将节点的不纯度最小化,从而使得决策树的节点更加纯净。所述数据特征处理模块200基于社区社会信用数据在随机森林中的重要性进行排序筛选提取信用特征数据。
所述信用数据分析模块300基于所述数据特征处理模块200提取的信用特征数据的获取训练样本及训练样本对应的类别标签获得训练样本集,并基于SVM基分类器进行初步分类,将SVM基分类器的权重作为个体的位置信息,基于改进白骨顶搜索算法进行基分类器的权重寻优。
所述改进白骨顶搜索算法具体如下:
基于基分类器的个数分别生成种群和反向种群/>,
其中,为第/>个种群个体的位置信息,/>为随机选取的维度,/>为搜索空间的上限,/>为搜索空间的下限,/>为点乘运算,/>为第/>个反向种群个体的位置信息,/>为/>间的随机数;
生成新的种群:
其中,为第/>个种群个体的适应度,/>为第/>个反向种群个体的适应度;
新的种群个体具有如下的三种移动方式:
个体随机移动:
其中,为第/>个新的种群个体第/>次移动后的位置,/>为第/>个新的种群个体第/>次移动的位置,/>为当前迭代次数,/>为最大迭代次数,/>为随机选取的位置;
链式移动:
其中,为第/>个新的种群个体第/>次移动的位置;
跟随群体领导者移动:
其中,为领导者个体,/>为取余运算,/>为预设领导者数量,/>为第/>个领导者个体第/>次移动的位置,/>为第/>个领导者个体第/>次移动的位置,/>为/>间的随机数,/>为全局最优位置,/>为/>间的随机数;
新的种群个体通过下式选取移动方式:
其中,为第/>个新的种群个体在第/>次移动时选择的移动方式,为第/>个新的种群个体在第/>次移动时选择的移动方式,/>为非运算,/>为随机选取,/>为第/>个新的种群个体在第/>次移动时的适应度值,/>为第/>个新的种群个体在第/>次移动时的适应度值。
所述改进白骨顶搜索算法中,基于训练样本集的训练误差倒数作为适应度函数,基于改进白骨顶搜索算法信寻优获取最佳位置。
所述信用数据分析模块300获取最佳位置对应的SVM基分类器最佳权重后,
进行各SVM基分类器的融合处理:
其中,为社区社会信用数据的分类结果,/>为第/>个基分类器的权重,/>为第/>个基分类器的分类结果。
所述信用体系搭建模块400基于强分类器分类结果划分社区社会信用等级体系,对社区社会信用数据进行社区社会信用等级划分。
参照图2所示,提供一种社区社会信用体系信息处理方法,包括如下步骤:
S1:采集社区社会信用数据;
S2:对采集的社区社会信用数据进行特征提取处理;
S3:对社区社会信用数据进行分析;
S4:基于分析结果搭建社区社会信用体系。
本实施例中,通过信用数据采集模块100采集社区社会信用数据,包含100个住户。数据特征处理模块200对应100个住户搭建100棵决策树,基于随机森林算法以及基尼系数算法进行信用特征数据的选择:
其中,表示决策树上节点/>的基尼系数,/>表示社区社会信用数据类别数量,/>表示决策树上节点/>上属于第/>类的样本所占比例,
其中,表示节点/>分枝前后的基尼系数变化量,/>、/>分别表示节点/>分枝后两个新节点上计算的基尼系数,
其中,表示社区社会信用数据/>在第/>个决策树上的重要性评分;
其中,表示社区社会信用数据/>在整个随机森林中的重要性;
基于计算出的社区社会信用数据在整个随机森林中的重要性,基于重要性数值进行排序,选取排序的前60%的社区社会信用数据作为特征数据。基于特征数据获取训练样本及训练样本对应的类别标签获得训练样本集/>,并基于SVM基分类器进行初步分类,将SVM基分类器的权重作为个体的位置信息,选取训练样本集的训练误差倒数作为适应度函数,基于改进白骨顶搜索算法进行基分类器的权重寻优:
基于50个基分类器分别生成数量为50的种群和数量为50的反向种群/>,
其中,为第/>个种群个体的位置信息,/>为随机选取的维度,/>为搜索空间的上限,/>为搜索空间的下限,/>为点乘运算,/>为第/>个反向种群个体的位置信息,/>为/>间的随机数;
生成新的种群:
其中,为第/>个种群个体的适应度,/>为第/>个反向种群个体的适应度;
改进白骨顶搜索算法通过种群和反向种群生成新的种群的方式可以对种群初始化阶段进行优化以提升算法的收敛性能。
新的种群个体具有如下的三种移动方式:
以第6次移动为例:
个体随机移动:
其中,为第/>个新的种群个体第7次移动后的位置,/>为第/>个新的种群个体第6次移动的位置,/>为最大迭代次数,/>为随机选取的位置;
链式移动:
其中,为第/>个新的种群个体第6次移动的位置;
跟随群体领导者移动:
其中,为领导者个体,/>为取余运算,/>为预设领导者数量,/>为第/>个领导者个体第6次移动的位置,/>为第/>个领导者个体第7次移动的位置,/>为/>间的随机数,/>为全局最优位置,/>为/>间的随机数;
新的种群个体通过下式选取移动方式:
其中,为第/>个新的种群个体在第/>次移动时选择的移动方式,/>为第个新的种群个体在第5次移动时选择的移动方式,为非运算,/>为随机选取,/>为第/>个新的种群个体在第5次移动时的适应度值,/>为第/>个新的种群个体在第4次移动时的适应度值。
若第个新的种群个体在第5次移动时的适应度值低于第/>个新的种群个体在第4次移动时的适应度值,则延续使用第5次移动时选取的移动,方式,否则随机选取移动方式。
白骨顶搜索算法中种群个体的移动从三种移动方式中随机选取,易出现收敛速度慢、收敛精度低等问题,改进白骨顶搜索算法通过添加移动方式的选取策略,可以减少移动过程的盲目性,提升算法的移动效率以及算法的收敛速度。
信用数据分析模块300基于获取最佳位置对应的SVM基分类器最佳权重后,
进行各SVM基分类器的融合处理:
其中,为社区社会信用数据的分类结果,/>为第/>个基分类器的权重,/>为第/>个基分类器的分类结果。
信用体系搭建模块400基于强分类器分类结果划分社区社会信用等级体系,对社区社会信用数据进行社区社会信用等级划分。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。
Claims (5)
1.一种社区社会信用体系信息处理系统,其特征在于:包括:
信用数据采集模块(100):用于采集社区社会信用数据;
数据特征处理模块(200):用于对采集的社区社会信用数据进行特征提取处理;
信用数据分析模块(300):用于对社区社会信用数据进行分析;
信用体系搭建模块(400):用于基于分析结果搭建社区社会信用体系;
所述数据特征处理模块(200)根据社区社会信用数据的类型基于决策树进行划分,并基于随机森林算法提取信用特征数据;
所述随机森林算法具体如下:
其中,Gs表示决策树上节点s的基尼系数,R表示社区社会信用数据类别数量,prs表示决策树上节点s上属于第r类的样本所占比例,
ΔGks=Gs-Ga-Gb
其中,ΔGks表示节点s分枝前后的基尼系数变化量,Ga、Gb分别表示节点s分枝后两个新节点上计算的基尼系数,
其中,Gjk表示社区社会信用数据Xk在第j个决策树上的重要性评分;
其中,Gk表示社区社会信用数据Xk在整个随机森林中的重要性;
所述信用数据分析模块(300)基于所述数据特征处理模块(200)提取的信用特征数据的获取训练样本及训练样本对应的类别标签获得训练样本集P,并基于SVM基分类器进行初步分类,将SVM基分类器的权重作为个体的位置信息,基于改进白骨顶搜索算法进行基分类器的权重寻优;
所述改进白骨顶搜索算法具体如下:
基于基分类器的个数分别生成种群X和反向种群
Xi=rd*(E-L)+L
其中,Xi为第i个种群个体的位置信息,rd为随机选取的维度,E为搜索空间的上限,L为搜索空间的下限,*为点乘运算,为第i个反向种群个体的位置信息,r为[0,1]间的随机数;
生成新的种群x:
其中,f为第i个种群个体的适应度,为第i个反向种群个体的适应度;
新的种群个体具有如下的三种移动方式:
个体随机移动:
其中,为第i个新的种群个体第t+1次移动后的位置,/>为第i个新的种群个体第t次移动的位置,t为当前迭代次数,T为最大迭代次数,W为随机选取的位置;
链式移动:
其中,为第i-1个新的种群个体第t次移动的位置;
跟随群体领导者yI移动:
I=1+(i mod N)
其中,I为领导者个体,mod为取余运算,N为预设领导者数量,为第I个领导者个体第t次移动的位置,/>为第I个领导者个体第t+1次移动的位置,r0为[-1,1]间的随机数,gb为全局最优位置,r1为[0,1]间的随机数;
新的种群个体通过下式选取移动方式:
其中,为第i个新的种群个体在第l(l∈[1,T])次移动时选择的移动方式,/>为第i个新的种群个体在第l-1次移动时选择的移动方式,~为非运算,δ为随机选取,/>为第i个新的种群个体在第l-1次移动时的适应度值,/>为第i个新的种群个体在第l-2次移动时的适应度值;
所述改进白骨顶搜索算法中,基于训练样本集的训练误差倒数作为适应度函数,基于改进白骨顶搜索算法信寻优获取最佳位置。
2.根据权利要求1所述的社区社会信用体系信息处理系统,其特征在于:所述数据特征处理模块(200)基于社区社会信用数据在随机森林中的重要性进行排序筛选提取信用特征数据。
3.根据权利要求1所述的社区社会信用体系信息处理系统,其特征在于:所述信用数据分析模块(300)获取最佳位置对应的SVM基分类器最佳权重后,
进行各SVM基分类器的融合处理:
其中,Y为社区社会信用数据的分类结果,ωi为第i个基分类器的权重,gi为第i个基分类器的分类结果,M为基分类器的数量。
4.根据权利要求3所述的社区社会信用体系信息处理系统,其特征在于:所述信用体系搭建模块(400)基于强分类器分类结果划分社区社会信用等级体系,对社区社会信用数据进行社区社会信用等级划分。
5.一种社区社会信用体系信息处理方法,基于权利要求1-4任意一项所述的社区社会信用体系信息处理系统,其特征在于:包括如下步骤:
S1:采集社区社会信用数据;
S2:对采集的社区社会信用数据进行特征提取处理,提取的信用特征数据的获取训练样本及训练样本对应的类别标签获得训练样本集P,并基于SVM基分类器进行初步分类,将SVM基分类器的权重作为个体的位置信息,基于改进白骨顶搜索算法进行基分类器的权重寻优;
所述改进白骨顶搜索算法具体如下:
基于基分类器的个数分别生成种群X和反向种群
Xi=rd*(E-L)+L
其中,Xi为第i个种群个体的位置信息,rd为随机选取的维度,E为搜索空间的上限,L为搜索空间的下限,*为点乘运算,为第i个反向种群个体的位置信息,r为[0,1]间的随机数;
生成新的种群x:
其中,f为第i个种群个体的适应度,为第i个反向种群个体的适应度;
新的种群个体具有如下的三种移动方式:
个体随机移动:
其中,为第i个新的种群个体第t+1次移动后的位置,/>为第i个新的种群个体第t次移动的位置,t为当前迭代次数,T为最大迭代次数,W为随机选取的位置;
链式移动:
其中,为第i-1个新的种群个体第t次移动的位置;
跟随群体领导者yI移动:
I=1+(i mod N)
其中,I为领导者个体,mod为取余运算,N为预设领导者数量,为第I个领导者个体第t次移动的位置,/>为第I个领导者个体第t+1次移动的位置,r0为[-1,1]间的随机数,gb为全局最优位置,r1为[0,1]间的随机数;
新的种群个体通过下式选取移动方式:
其中,为第i个新的种群个体在第l(l∈[1,T])次移动时选择的移动方式,/>为第i个新的种群个体在第l-1次移动时选择的移动方式,~为非运算,δ为随机选取,/>为第i个新的种群个体在第l-1次移动时的适应度值,/>为第i个新的种群个体在第l-2次移动时的适应度值;
所述改进白骨顶搜索算法中,基于训练样本集的训练误差倒数作为适应度函数,基于改进白骨顶搜索算法信寻优获取最佳位置;
S3:对社区社会信用数据进行分析;
S4:基于分析结果搭建社区社会信用体系。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310965749.9A CN116702052B (zh) | 2023-08-02 | 2023-08-02 | 一种社区社会信用体系信息处理系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310965749.9A CN116702052B (zh) | 2023-08-02 | 2023-08-02 | 一种社区社会信用体系信息处理系统及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116702052A CN116702052A (zh) | 2023-09-05 |
CN116702052B true CN116702052B (zh) | 2023-10-27 |
Family
ID=87831462
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310965749.9A Active CN116702052B (zh) | 2023-08-02 | 2023-08-02 | 一种社区社会信用体系信息处理系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116702052B (zh) |
Citations (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102521649A (zh) * | 2011-11-17 | 2012-06-27 | 西安电子科技大学 | 基于密母计算的网络社区结构检测方法 |
CN104268629A (zh) * | 2014-09-15 | 2015-01-07 | 西安电子科技大学 | 一种基于先验信息和网络固有信息的复杂网络社区检测方法 |
CN105719073A (zh) * | 2016-01-18 | 2016-06-29 | 苏州汇誉通数据科技有限公司 | 一种企业信用评价系统及方法 |
CN106056162A (zh) * | 2016-06-07 | 2016-10-26 | 浙江大学 | 一种基于gps轨迹和交通违法记录的交通安全信用评分方法 |
CN106447489A (zh) * | 2016-09-12 | 2017-02-22 | 中山大学 | 一种基于部分堆栈融合的用户信用评估模型 |
CN108038701A (zh) * | 2018-03-20 | 2018-05-15 | 杭州恩牛网络技术有限公司 | 一种集成学习反欺诈测试方法及系统 |
CN108133272A (zh) * | 2018-01-15 | 2018-06-08 | 大连民族大学 | 一种复杂网络社区检测的方法 |
CN109325844A (zh) * | 2018-06-25 | 2019-02-12 | 南京工业大学 | 多维数据下的网贷借款人信用评价方法 |
CN110472817A (zh) * | 2019-07-03 | 2019-11-19 | 西北大学 | 一种结合深度神经网络的XGBoost集成信用评价系统及其方法 |
CN112037009A (zh) * | 2020-08-06 | 2020-12-04 | 百维金科(上海)信息科技有限公司 | 一种基于随机森林算法的消费信贷场景的风险评估方法 |
CN112396310A (zh) * | 2020-11-12 | 2021-02-23 | 上海京滴信用管理有限公司 | 一种基于机器学习的社会信用风险评估系统 |
CN112668944A (zh) * | 2021-01-26 | 2021-04-16 | 天元大数据信用管理有限公司 | 一种基于大数据征信的企业风控方法、装置、设备及介质 |
US11321697B1 (en) * | 2021-09-28 | 2022-05-03 | Step Mobile, Inc. | Financial services platform with integrated banking, credit, and P2P capabilities |
CN114638695A (zh) * | 2022-04-07 | 2022-06-17 | 中国工商银行股份有限公司 | 信用评估方法、装置、设备及介质 |
CN115421384A (zh) * | 2022-08-31 | 2022-12-02 | 燕山大学 | 基于coot算法的轨道交通车体调簧控制方法及其试验装置 |
CN115879671A (zh) * | 2022-12-05 | 2023-03-31 | 中国建设银行股份有限公司 | 一种客户信用水平评价方法和系统、电子设备、存储介质 |
CN116528252A (zh) * | 2023-05-08 | 2023-08-01 | 盐城工学院 | 一种基于改进白骨顶鸡算法的无线传感器网络覆盖优化方法 |
-
2023
- 2023-08-02 CN CN202310965749.9A patent/CN116702052B/zh active Active
Patent Citations (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102521649A (zh) * | 2011-11-17 | 2012-06-27 | 西安电子科技大学 | 基于密母计算的网络社区结构检测方法 |
CN104268629A (zh) * | 2014-09-15 | 2015-01-07 | 西安电子科技大学 | 一种基于先验信息和网络固有信息的复杂网络社区检测方法 |
CN105719073A (zh) * | 2016-01-18 | 2016-06-29 | 苏州汇誉通数据科技有限公司 | 一种企业信用评价系统及方法 |
CN106056162A (zh) * | 2016-06-07 | 2016-10-26 | 浙江大学 | 一种基于gps轨迹和交通违法记录的交通安全信用评分方法 |
CN106447489A (zh) * | 2016-09-12 | 2017-02-22 | 中山大学 | 一种基于部分堆栈融合的用户信用评估模型 |
CN108133272A (zh) * | 2018-01-15 | 2018-06-08 | 大连民族大学 | 一种复杂网络社区检测的方法 |
CN108038701A (zh) * | 2018-03-20 | 2018-05-15 | 杭州恩牛网络技术有限公司 | 一种集成学习反欺诈测试方法及系统 |
CN109325844A (zh) * | 2018-06-25 | 2019-02-12 | 南京工业大学 | 多维数据下的网贷借款人信用评价方法 |
CN110472817A (zh) * | 2019-07-03 | 2019-11-19 | 西北大学 | 一种结合深度神经网络的XGBoost集成信用评价系统及其方法 |
CN112037009A (zh) * | 2020-08-06 | 2020-12-04 | 百维金科(上海)信息科技有限公司 | 一种基于随机森林算法的消费信贷场景的风险评估方法 |
CN112396310A (zh) * | 2020-11-12 | 2021-02-23 | 上海京滴信用管理有限公司 | 一种基于机器学习的社会信用风险评估系统 |
CN112668944A (zh) * | 2021-01-26 | 2021-04-16 | 天元大数据信用管理有限公司 | 一种基于大数据征信的企业风控方法、装置、设备及介质 |
US11321697B1 (en) * | 2021-09-28 | 2022-05-03 | Step Mobile, Inc. | Financial services platform with integrated banking, credit, and P2P capabilities |
CN114638695A (zh) * | 2022-04-07 | 2022-06-17 | 中国工商银行股份有限公司 | 信用评估方法、装置、设备及介质 |
CN115421384A (zh) * | 2022-08-31 | 2022-12-02 | 燕山大学 | 基于coot算法的轨道交通车体调簧控制方法及其试验装置 |
CN115879671A (zh) * | 2022-12-05 | 2023-03-31 | 中国建设银行股份有限公司 | 一种客户信用水平评价方法和系统、电子设备、存储介质 |
CN116528252A (zh) * | 2023-05-08 | 2023-08-01 | 盐城工学院 | 一种基于改进白骨顶鸡算法的无线传感器网络覆盖优化方法 |
Non-Patent Citations (3)
Title |
---|
A new optimization method based on COOT bird natural life model;Iraj Naruei 等;《Expert Systems with Applications》;1-25 * |
ABC网贷平台风险控制系统研究;彭绍明;《中国优秀硕士学位论文全文数据库 经济与管理科学辑》;J157-89 * |
基于多策略改进的蜜獾优化算法;涂碧阳 等;《小型微型计算机系统》;1-14 * |
Also Published As
Publication number | Publication date |
---|---|
CN116702052A (zh) | 2023-09-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111198959B (zh) | 一种基于卷积神经网络的两阶段图像检索方法 | |
CN109886349B (zh) | 一种基于多模型融合的用户分类方法 | |
Pham et al. | Data clustering using the bees algorithm | |
CN110969191B (zh) | 基于相似性保持度量学习方法的青光眼患病概率预测方法 | |
CN110309888A (zh) | 一种基于分层多任务学习的图像分类方法与系统 | |
CN109948668A (zh) | 一种多模型融合方法 | |
CN110210431B (zh) | 一种基于点云语义标注和优化的点云分类方法 | |
CN107291895B (zh) | 一种快速的层次化文档查询方法 | |
CN102364498A (zh) | 一种基于多标签的图像识别方法 | |
CN109033172A (zh) | 一种深度学习与近似目标定位的图像检索方法 | |
CN113032613B (zh) | 一种基于交互注意力卷积神经网络的三维模型检索方法 | |
CN111914912B (zh) | 一种基于孪生条件对抗网络的跨域多视目标识别方法 | |
CN103886030A (zh) | 基于代价敏感决策树的信息物理融合系统数据分类方法 | |
CN104361135A (zh) | 一种图像检索方法 | |
CN111210454B (zh) | 基于并行鸽群算法的Otsu图像分割方法 | |
CN113177101A (zh) | 用户轨迹识别方法、装置、设备及存储介质 | |
Demirkesen et al. | A comparison of multiclass SVM methods for real world natural scenes | |
CN113282747B (zh) | 一种基于自动机器学习算法选择的文本分类方法 | |
CN116702052B (zh) | 一种社区社会信用体系信息处理系统及方法 | |
CN114943285B (zh) | 互联网新闻内容数据智能审核系统 | |
CN105653686A (zh) | 一种域名网址活跃度统计方法及系统 | |
CN114610941A (zh) | 基于对比学习的文物图像检索系统 | |
CN111079089B (zh) | 一种基于区间划分的基站数据异常检测方法 | |
CN111798003A (zh) | 一种基于随机森林的多视图学习算法 | |
Kavitha et al. | Machine learning paradigm towards content-based image retrieval on high-resolution satellite images |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |