CN112053167A - 基于改进的EasyEnsemble算法的供应商信用评价方法、系统及存储介质 - Google Patents
基于改进的EasyEnsemble算法的供应商信用评价方法、系统及存储介质 Download PDFInfo
- Publication number
- CN112053167A CN112053167A CN202010876393.8A CN202010876393A CN112053167A CN 112053167 A CN112053167 A CN 112053167A CN 202010876393 A CN202010876393 A CN 202010876393A CN 112053167 A CN112053167 A CN 112053167A
- Authority
- CN
- China
- Prior art keywords
- supplier
- credit
- data
- forest
- algorithm
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000011156 evaluation Methods 0.000 title claims abstract description 56
- 238000004422 calculation algorithm Methods 0.000 title claims abstract description 22
- 238000012549 training Methods 0.000 claims abstract description 34
- 238000012545 processing Methods 0.000 claims abstract description 23
- 238000000034 method Methods 0.000 claims abstract description 17
- 230000008569 process Effects 0.000 claims abstract description 12
- 238000010606 normalization Methods 0.000 claims abstract description 10
- 239000013598 vector Substances 0.000 claims description 36
- 238000007781 pre-processing Methods 0.000 claims description 12
- 238000000605 extraction Methods 0.000 claims description 9
- 238000011161 development Methods 0.000 claims description 5
- 230000006798 recombination Effects 0.000 claims description 5
- 238000005215 recombination Methods 0.000 claims description 5
- 238000005070 sampling Methods 0.000 claims description 4
- 238000007637 random forest analysis Methods 0.000 claims description 3
- 238000007636 ensemble learning method Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 5
- 230000007306 turnover Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 102100029469 WD repeat and HMG-box DNA-binding protein 1 Human genes 0.000 description 1
- 101710097421 WD repeat and HMG-box DNA-binding protein 1 Proteins 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013210 evaluation model Methods 0.000 description 1
- 230000005923 long-lasting effect Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000013068 supply chain management Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/018—Certifying business or products
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- Evolutionary Biology (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Finance (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种基于改进的EasyEnsemble算法的供应商信用评价方法、系统及存储介质,包括:采用层次分析法建立评价指标体系,获取企业相关历史数据;对企业相关历史数据进行归一化处理,将处理后的数据与供应商信用评价历史得分形成数据对形式的训练集;对训练集进行重组,形成多个训练子集;基于多个训练子集和预先构建的深度森林模型,得到多个预测结果;基于多个预测结果和预先构建的混合模型,进行混合处理,得到阈值θ;将待评价供应商输入深度森林模型,经过深度森林模型与混合模型的处理后,得到预测值,将预测值与阈值θ进行比较得出评价结果。集成学习方法有强大的表征学习的能力,能够更好地适应非线性特征,从而能够对供应商的信用表现做出更加科学准确的评价。
Description
技术领域
本发明涉及供应商信用评价技术领域,具体而言,尤其涉及一种基于改进的EasyEnsemble算法的供应商信用评价方法、系统及存储介质。
背景技术
供应链由直接或间接地履行顾客需求的各方组成,包括制造商、供应商、运输商、仓储商、零售商与顾客,供应链各个环节通过物流、信息流与资金流彼此相连。在经济全球化大潮的推动下,供应链管理能力已经成为了企业的核心竞争力之一。供应链中企业之间是协作的关系,即核心企业与相关企业的协作,如何在供应链企业间构建起坚实而长久的联系对供应链的成功非常重要。供应链合作伙伴关系的构建与维持,出于短期成本最小化的需要,要求减少供应商的数量,并使相互间的联系更紧密,因此企业会寻找和筛选出最杰出、最适合企业的合作伙伴。而组建优秀的供应商团队依赖于对供应商的信用表现进行全面、客观和准确地评估,因此供应商信用评价工作是企业组建优秀供应商团队的关键环节。
考虑到传统的供应商信用评价方法是采购部门整理结论性的相关报告,具有评选体系不健全与主观判断成分较大的缺点;而随着信息技术的快速发展,供应链的信息流中会积累大量数据,我们可以利用相关技术对这些数据进行分析。集成学习方法有强大的表征学习能力,能够更好地适应非线性特征,从而能够对供应商的信用表现做出更加科学准确的评价。
发明内容
根据上述提出的技术问题,而提供一种基于改进的EasyEnsemble算法的供应商信用评价方法、系统及存储介质。本发明针对EasyEnsemble做出改进,能够更好地适应非线性特征提升评价模型精度,从而能够帮助相关工作人员做出更加灵活准确的决策。
本发明采用的技术手段如下:
一种基于改进的EasyEnsemble算法的供应商信用评价方法,包括:
步骤S1、采用层次分析法,建立评价指标体系,获取企业相关历史数据;
步骤S2、对所述获取的企业相关历史数据进行归一化处理,并将处理后的数据与供应商信用评价历史得分形成数据对形式的训练集;
步骤S3、对所述训练集进行重组,形成多个训练子集;
步骤S4、基于所述的多个训练子集和预先构建的深度森林模型,得到多个预测结果;
步骤S5、基于所述多个预测结果和预先构建的混合模型,进行混合处理,得到阈值θ;
步骤S6、将待评价供应商输入深度森林模型,经过所述深度森林模型与混合模型的处理后,得到预测值,将预测值与所述阈值θ进行比较,若预测值大于阈值则该供应商信用良好,反之则信用不良。
进一步地,所述步骤S1中,建立的评价指标体系分为三层,分别为目标层、准则层与指标层;目标层设立为供应商的信用表现;准则层设立为衡量企业发展情况的能力;指标层则将准则层细化,包含一系列定性与定量指标;
所述获取的企业相关历史数据包括指标层的内容和供应商绩效评价表。
进一步地,所述步骤S2中,归一化处理的具体公式如下:
其中,x表示为归一化后的数据;w表示原始数据;wmin表示原始同类数据中的最小值;wmax表示原始同类数据中最大值;
所述数据对形式的训练集为(Xs,Ys),Xs代表归一化后第s个供应商的指标层数据向量,Xs维度为k,Ys代表第s个供应商在供应商绩效评价表中的企业信用分数。
进一步地,所述步骤S3具体为:
S31、将信用不良的供应商数据与信用良好的供应商数据进行区分,形成信用不良供应商子集与信用良好供应商子集;
S32、假设信用不良的供应商样本数据规模为N,信用良好的供应商样本数据规模为M;对信用良好供应商子集进行下采样,得到M/N个数据规模为N的正样本,信用不良供应商子集直接复制成负样本;
S33、在每一个所述正样本中添加负样本,形成M/N个训练子集。
进一步地,所述步骤S4中,深度森林模型包括用于特征预提取的扫描模块和用于特征提取的瀑布森林模块;
所述扫描模块包括三个扫描器向量,三个扫描器维度各不相同,从而得出三个尺寸不同的特征向量;将三个特征向量输入给对应的森林集合,森林集合包括随机树和完全随机树两种类型,每个森林集合输出子预处理向量;将三个子预处理向量进行连接,形成预处理向量;
所述瀑布森林模块共p层,每一层由两个随机树与两个完全随机树组成,每一个分类树输出一个预测结果,每一层的森林输出一个维度为4的预测向量,再将该预测向量与所述预处理向量进行拼接,再将拼接后的向量作为下一层瀑布森林的输入,最后一层随机森林直接输出预测向量中元素的平均值,作为一个预测结果,记为Oi,最终输出M/N个预测结果。
进一步地,所述步骤S5中,阈值θ的公式为:
θ=mean(O1,O2,O3,…,Oi,…,OM/N)+var(O1,O2,O3,…,Oi,…,OM/N)
其中,mean(O1,O2,O3,…,Oi,…,OM/N)为求取平均值函数,var(O1,O2,O3,…,Oi,…,OM/N为求取标准差函数。
本发明还提供了一种基于改进的EasyEnsemble算法的供应商信用评价系统,包括:
获取单元,用于采用层次分析法,建立评价指标体系,获取企业相关历史数据;
处理单元,用于对所述获取的企业相关历史数据进行归一化处理,并将处理后的数据与供应商信用评价历史得分形成数据对形式的数据集;
数据重组单元,用于对所述训练集进行重组,形成多个训练子集;
特征提取单元,用于基于所述的多个训练子集和预先构建的深度森林模型,得到多个预测结果;
混合处理单元,用于基于所述多个预测结果和预先构建的混合模型,进行混合处理,得到阈值θ;
比较单元,用于将待评价供应商输入深度森林模型,经过所述深度森林模型与混合模型的处理后,得到预测值,将预测值与所述阈值θ进行比较,若预测值大于阈值则该供应商信用良好,反之则信用不良。
本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机指令集;所述计算机指令集被处理器执行时实现上述的基于改进的EasyEnsemble算法的供应商信用评价方法。
较现有技术相比,本发明具有以下优点:
1、本发明提供的基于改进的EasyEnsemble算法的供应商信用评价方法,侧重定量分析,借助机器学习的方法,挖掘评价指标间的关联,为最终评价提供有效的定量判断依据。
2、本发明提供的基于改进的EasyEnsemble算法的供应商信用评价方法,借由层次分析法,将评价体系进行分解,最终得出指标层集合,较全面地考虑了影响供应商信用的各项因素。
3、本发明提供的基于改进的EasyEnsemble算法的供应商信用评价方法,能够更好地适应非线性特性,预测精度更高。本发明基于EasyEnsemble进行改进,将其分为三个模块:数据重组单元、深度森林模型与混合模型。数据重组单元对正样本进行下采样,能够有效地适应数据不均衡的问题,从而使模型训练效果得以提升。深度森林模型是一个大的分类树集合,可以更好地适应非线性特征。混合模型对深度森林模型的输出结果进行融合,从而达到多个分类器集成学习的效果。
基于上述理由本发明可在供应商信用评价等领域广泛推广。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做以简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明方法流程图。
图2为本发明建立的评价指标体系示意图。
图3为本发明数据重组示意图。
图4为本发明深度森林模型中扫描模块示意图。
图5为本发明深度森林模型中瀑布森林模块示意图。
图6为本发明混合模型示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
以下结合附图对本发明实施例做进一步详述。
如图1所示,本发明提供了一种基于改进的EasyEnsemble算法的供应商信用评价方法,包括:
步骤S1、采用层次分析法,建立评价指标体系,获取企业相关历史数据;
建立的评价指标体系分为三层,分别为目标层、准则层与指标层;目标层设立为供应商的信用表现,目标层集合A为{+1,-1},其中+1代表信用良好,-1代表信用不良。准则层设立为衡量企业发展情况的能力,准则层集合B为{营运能力,创新能力,成长能力,发展前景,企业素质,盈利能力,偿债能力}。指标层则将准则层细化,包含一系列定性与定量指标,指标层集合C为{研发投入强度,技术人员比重,新产品销售收入的比重,净资产增长率,净利润增长率,营业利润增长率,行业前景,产业政策,管理层素质,员工素质,企业文化及战略,净资产收益率,销售利润率,市盈率,流动比率,资产负债率,有形资产债务比率,现金流量比,现金与总资产的比,利息保障倍数,应收账款周转率,存货周转率,总资产周转率,流动资产周转率,固定资产周转率,经营活动资金流入占销售比}。
获取的企业相关历史数据包括指标层的内容和供应商绩效评价表。
步骤S2、对所述获取的企业相关历史数据进行归一化处理,并将处理后的数据与供应商信用评价历史得分形成数据对形式的训练集;
将各项历史数据采公式整理成范围在区间[0,1]的数据,归一化处理的具体公式如下:
其中,x表示为归一化后的数据;w表示原始数据;wmin表示原始同类数据中的最小值;wmax表示原始同类数据中最大值;
将归一化处理后的数据与供应商信用评价历史得分形成数据对形式的训练集为(Xs,Ys),Xs代表归一化后第s个供应商的指标层数据向量,Xs维度为k,Ys代表第s个供应商在供应商绩效评价表中的企业信用分数。
步骤S3、对所述训练集进行重组,形成多个训练子集;
由于训练集带有明显的不平衡特性,需要对训练集进行重组,具体为:
S31、将信用不良的供应商数据与信用良好的供应商数据进行区分,形成信用不良供应商子集与信用良好供应商子集;
S32、假设信用不良的供应商样本数据规模为N,信用良好的供应商样本数据规模为M(M>>N);对信用良好供应商子集进行下采样,得到M/N个数据规模为N的正样本,信用不良供应商子集直接复制成负样本;
S33、在每一个所述正样本中添加负样本,形成M/N个训练子集。
步骤S4、基于所述的多个训练子集和预先构建的深度森林模型,得到多个预测结果;
深度森林模型包括用于特征预提取的扫描模块和用于特征提取的瀑布森林模块;
所述扫描模块包括三个扫描器向量,假设三个扫描器维度分别为a,b,c,扫描时间窗均为单位长度,扫描器进行系数运算得出维度分别为k-a+1,k-b+1与k-c+1的特征向量;将三个特征向量输入给对应的森林集合,森林集合包括随机树和完全随机树两种类型,每个森林集合输出维度分别为2×(2×(k-a+1)),2×(2×(k-b+1))与2×(2×(k-c+1))的子预处理向量;将三个子预处理向量进行连接,形成维度为2×(2×(3k-a-b-c+3))的预处理向量;
所述瀑布森林模块共p层,每一层由两个随机树与两个完全随机树组成,每一个分类树输出一个预测结果,每一层的森林输出一个维度为4的预测向量,再将该预测向量与所述预处理向量进行拼接,再将拼接后的向量作为下一层瀑布森林的输入,最后一层随机森林直接输出预测向量中元素的平均值,作为一个预测结果,记为Oi,最终输出M/N个预测结果。
步骤S5、基于所述多个预测结果和预先构建的混合模型,进行混合处理,得到阈值θ;阈值θ的公式为:
θ=mean(O1,O2,O3,…,Oi,…,OM/N)+var(O1,O2,O3,…,Oi,…,OM/N)
其中,mean(O1,O2,O3,…,Oi,…,OM/N)为求取平均值函数,var(O1,O2,O3,…,Oi,…,OM/N为求取标准差函数。
步骤S6、将待评价供应商输入深度森林模型,经过所述深度森林模型与混合模型的处理后,得到预测值,将预测值与所述阈值θ进行比较,若预测值大于阈值则该供应商信用良好,反之则信用不良。
本发明实施例提供了一种基于改进的EasyEnsemble算法的供应商信用评价系统,包括:
获取单元,用于采用层次分析法,建立评价指标体系,获取企业相关历史数据;
处理单元,用于对所述获取的企业相关历史数据进行归一化处理,并将处理后的数据与供应商信用评价历史得分形成数据对形式的数据集;
数据重组单元,用于对所述训练集进行重组,形成多个训练子集;
特征提取单元,用于基于所述的多个训练子集和预先构建的深度森林模型,得到多个预测结果;
混合处理单元,用于基于所述多个预测结果和预先构建的混合模型,进行混合处理,得到阈值θ;
比较单元,用于将待评价供应商输入深度森林模型,经过所述深度森林模型与混合模型的处理后,得到预测值,将预测值与所述阈值θ进行比较,若预测值大于阈值则该供应商信用良好,反之则信用不良。
对于本发明实施例的而言,由于其与上面实施例中的相对应,所以描述的比较简单,相关相似之处请参见上面实施例中部分的说明即可,此处不再详述。
本申请实施例还公开了一种计算机可读存储介质,该计算机可读存储介质内存储有计算机指令集,计算机指令集被处理器执行时实现如上文任一实施例所提供的基于改进的EasyEnsemble算法的供应商信用评价方法。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (8)
1.一种基于改进的EasyEnsemble算法的供应商信用评价方法,其特征在于,包括:
步骤S1、采用层次分析法,建立评价指标体系,获取企业相关历史数据;
步骤S2、对所述获取的企业相关历史数据进行归一化处理,并将处理后的数据与供应商信用评价历史得分形成数据对形式的训练集;
步骤S3、对所述训练集进行重组,形成多个训练子集;
步骤S4、基于所述的多个训练子集和预先构建的深度森林模型,得到多个预测结果;
步骤S5、基于所述多个预测结果和预先构建的混合模型,进行混合处理,得到阈值θ;
步骤S6、将待评价供应商输入深度森林模型,经过所述深度森林模型与混合模型的处理后,得到预测值,将预测值与所述阈值θ进行比较,若预测值大于阈值则该供应商信用良好,反之则信用不良。
2.根据权利要求1所述的基于改进的EasyEnsemble算法的供应商信用评价方法,其特征在于,所述步骤S1中,建立的评价指标体系分为三层,分别为目标层、准则层与指标层;目标层设立为供应商的信用表现;准则层设立为衡量企业发展情况的能力;指标层则将准则层细化,包含一系列定性与定量指标;
所述获取的企业相关历史数据包括指标层的内容和供应商绩效评价表。
4.根据权利要求1所述的基于改进的EasyEnsemble算法的供应商信用评价方法,其特征在于,所述步骤S3具体为:
S31、将信用不良的供应商数据与信用良好的供应商数据进行区分,形成信用不良供应商子集与信用良好供应商子集;
S32、假设信用不良的供应商样本数据规模为N,信用良好的供应商样本数据规模为M;对信用良好供应商子集进行下采样,得到M/N个数据规模为N的正样本,信用不良供应商子集直接复制成负样本;
S33、在每一个所述正样本中添加负样本,形成M/N个训练子集。
5.根据权利要求1所述的基于改进的EasyEnsemble算法的供应商信用评价方法,其特征在于,所述步骤S4中,深度森林模型包括用于特征预提取的扫描模块和用于特征提取的瀑布森林模块;
所述扫描模块包括三个扫描器向量,三个扫描器维度各不相同,从而得出三个尺寸不同的特征向量;将三个特征向量输入给对应的森林集合,森林集合包括随机树和完全随机树两种类型,每个森林集合输出子预处理向量;将三个子预处理向量进行连接,形成预处理向量;
所述瀑布森林模块共p层,每一层由两个随机树与两个完全随机树组成,每一个分类树输出一个预测结果,每一层的森林输出一个维度为4的预测向量,再将该预测向量与所述预处理向量进行拼接,再将拼接后的向量作为下一层瀑布森林的输入,最后一层随机森林直接输出预测向量中元素的平均值,作为一个预测结果,记为Oi,最终输出M/N个预测结果。
6.根据权利要求1所述的基于改进的EasyEnsemble算法的供应商信用评价方法,其特征在于,所述步骤S5中,阈值θ的公式为:
θ=mean(O1,O2,O3,…,Oi,…,OM/N)+var(O1,O2,O3,…,Oi,…,OM/N)
其中,mean(O1,O2,O3,…,Oi,…,OM/N)为求取平均值函数,var(O1,O2,O3,…,Oi,…,OM/N为求取标准差函数。
7.一种基于改进的EasyEnsemble算法的供应商信用评价系统,其特征在于,包括:
获取单元,用于采用层次分析法,建立评价指标体系,获取企业相关历史数据;
处理单元,用于对所述获取的企业相关历史数据进行归一化处理,并将处理后的数据与供应商信用评价历史得分形成数据对形式的数据集;
数据重组单元,用于对所述训练集进行重组,形成多个训练子集;
特征提取单元,用于基于所述的多个训练子集和预先构建的深度森林模型,得到多个预测结果;
混合处理单元,用于基于所述多个预测结果和预先构建的混合模型,进行混合处理,得到阈值θ;
比较单元,用于将待评价供应商输入深度森林模型,经过所述深度森林模型与混合模型的处理后,得到预测值,将预测值与所述阈值θ进行比较,若预测值大于阈值则该供应商信用良好,反之则信用不良。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机指令集;所述计算机指令集被处理器执行时实现如权利要求1-6任一项所述的基于改进的EasyEnsemble算法的供应商信用评价方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010876393.8A CN112053167B (zh) | 2020-08-25 | 2020-08-25 | 基于改进的EasyEnsemble算法的供应商信用评价方法、系统及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010876393.8A CN112053167B (zh) | 2020-08-25 | 2020-08-25 | 基于改进的EasyEnsemble算法的供应商信用评价方法、系统及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112053167A true CN112053167A (zh) | 2020-12-08 |
CN112053167B CN112053167B (zh) | 2024-04-05 |
Family
ID=73600942
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010876393.8A Active CN112053167B (zh) | 2020-08-25 | 2020-08-25 | 基于改进的EasyEnsemble算法的供应商信用评价方法、系统及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112053167B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112561333A (zh) * | 2020-12-16 | 2021-03-26 | 珠海格力电器股份有限公司 | 一种考核数据处理方法、装置、电子设备及存储介质 |
CN114707571A (zh) * | 2022-02-24 | 2022-07-05 | 南京审计大学 | 基于增强隔离森林的信用数据异常检测方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101840534A (zh) * | 2010-01-22 | 2010-09-22 | 同济大学 | 一种集成化供应链绩效指标评价方法 |
CN108831556A (zh) * | 2018-06-24 | 2018-11-16 | 大连理工大学 | 一种连续性肾脏替代治疗过程中肝素剂量的预测方法 |
CN110060068A (zh) * | 2019-02-14 | 2019-07-26 | 阿里巴巴集团控股有限公司 | 商户评估方法、装置、电子设备及可读存储介质 |
US20190303728A1 (en) * | 2018-03-27 | 2019-10-03 | Alibaba Group Holding Limited | Risky transaction identification method and apparatus |
CN111524015A (zh) * | 2020-04-10 | 2020-08-11 | 易方达基金管理有限公司 | 训练预测模型的方法、装置、计算机设备及可读存储介质 |
-
2020
- 2020-08-25 CN CN202010876393.8A patent/CN112053167B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101840534A (zh) * | 2010-01-22 | 2010-09-22 | 同济大学 | 一种集成化供应链绩效指标评价方法 |
US20190303728A1 (en) * | 2018-03-27 | 2019-10-03 | Alibaba Group Holding Limited | Risky transaction identification method and apparatus |
CN108831556A (zh) * | 2018-06-24 | 2018-11-16 | 大连理工大学 | 一种连续性肾脏替代治疗过程中肝素剂量的预测方法 |
CN110060068A (zh) * | 2019-02-14 | 2019-07-26 | 阿里巴巴集团控股有限公司 | 商户评估方法、装置、电子设备及可读存储介质 |
CN111524015A (zh) * | 2020-04-10 | 2020-08-11 | 易方达基金管理有限公司 | 训练预测模型的方法、装置、计算机设备及可读存储介质 |
Non-Patent Citations (1)
Title |
---|
莫赞;张灿凤;魏伟;游德创;张舒;: "基于Bagging集成的个人信用风险评估方法研究", 系统工程, no. 01 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112561333A (zh) * | 2020-12-16 | 2021-03-26 | 珠海格力电器股份有限公司 | 一种考核数据处理方法、装置、电子设备及存储介质 |
CN112561333B (zh) * | 2020-12-16 | 2024-04-16 | 珠海格力电器股份有限公司 | 一种考核数据处理方法、装置、电子设备及存储介质 |
CN114707571A (zh) * | 2022-02-24 | 2022-07-05 | 南京审计大学 | 基于增强隔离森林的信用数据异常检测方法 |
CN114707571B (zh) * | 2022-02-24 | 2024-05-07 | 南京审计大学 | 基于增强隔离森林的信用数据异常检测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112053167B (zh) | 2024-04-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108564286B (zh) | 一种基于大数据征信的人工智能金融风控授信评定方法和系统 | |
CN109597936B (zh) | 一种新用户筛选系统及方法 | |
Mačerinskienė et al. | Company's intellectual capital impact on market value of Baltic countries listed enterprises | |
CN112053167A (zh) | 基于改进的EasyEnsemble算法的供应商信用评价方法、系统及存储介质 | |
Pradana et al. | Blockchain modeling for traceability information system in supply chain of coffee agroindustry | |
CN110930038A (zh) | 一种贷款需求识别方法、装置、终端及存储介质 | |
Hosseini et al. | Identifying multi-channel value co-creator groups in the banking industry | |
Georgopoulos et al. | Firm heterogeneity and performance in a turbulent economic environment: evidence from Greece | |
Hariyono et al. | The role of intellectual capital in the development of financial technology in the new normal period in Indonesia | |
CN111581222A (zh) | 业务数据的关联分析方法、装置、计算机设备及计算机存储介质 | |
CN111738822A (zh) | 审计员推荐方法及装置 | |
CN113506173A (zh) | 一种信用风险评估方法及其相关设备 | |
Dai et al. | Audit analytics: A field study of credit card after-sale service problem detection at a major bank | |
Simionescu | The competition between London companies regarding their financial performance | |
US10210530B1 (en) | Selecting a report | |
CN115953029A (zh) | 物联网企业入网评分方法、装置、计算机设备及存储介质 | |
CN115619270A (zh) | 数据资产管理方法、装置、计算机设备、存储介质 | |
Goel et al. | Machine Learning Models for Customer Relationship Management to Improve Satisfaction Rate in Banking Sector | |
CN114693428A (zh) | 数据确定方法、装置、计算机可读存储介质及电子设备 | |
CN113177733A (zh) | 基于卷积神经网络的中小微企业数据建模方法及系统 | |
Alic et al. | A model for measuring an ISO 9000 internal audit outcome | |
CN113240513A (zh) | 一种用户授信额度的确定方法和相关装置 | |
Perera et al. | Identifying interrelationships of key success factors of third-party logistics service providers | |
CN110135467A (zh) | 一种基于数据拼接的模型训练方法、装置、系统和记录介质 | |
Huang et al. | Construct intellectual capital performance model for a logistic industry |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |