CN109657721A - 一种结合模糊集和随机森林树的多类别决策方法 - Google Patents
一种结合模糊集和随机森林树的多类别决策方法 Download PDFInfo
- Publication number
- CN109657721A CN109657721A CN201811562806.4A CN201811562806A CN109657721A CN 109657721 A CN109657721 A CN 109657721A CN 201811562806 A CN201811562806 A CN 201811562806A CN 109657721 A CN109657721 A CN 109657721A
- Authority
- CN
- China
- Prior art keywords
- data
- random forest
- fuzzy
- decision
- attribute
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 238000007637 random forest analysis Methods 0.000 title claims abstract description 36
- 238000012549 training Methods 0.000 claims abstract description 34
- 238000003066 decision tree Methods 0.000 claims description 25
- 238000012360 testing method Methods 0.000 claims description 8
- 238000012545 processing Methods 0.000 claims description 7
- 238000010276 construction Methods 0.000 claims description 6
- 230000000694 effects Effects 0.000 claims description 4
- 230000002123 temporal effect Effects 0.000 claims description 4
- 230000001174 ascending effect Effects 0.000 claims description 3
- 238000011156 evaluation Methods 0.000 claims description 3
- 238000013210 evaluation model Methods 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 3
- 230000009467 reduction Effects 0.000 claims description 3
- 230000008901 benefit Effects 0.000 abstract description 5
- 230000000875 corresponding effect Effects 0.000 description 11
- 238000004422 calculation algorithm Methods 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 101001095088 Homo sapiens Melanoma antigen preferentially expressed in tumors Proteins 0.000 description 2
- 102100037020 Melanoma antigen preferentially expressed in tumors Human genes 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000012010 growth Effects 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 108010074506 Transfer Factor Proteins 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24317—Piecewise classification, i.e. whereby each classification requires several discriminant rules
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种结合模糊集和随机森林树的多类别决策方法,包括如下步骤:(1)分析和选取数据集合,初步构造训练、预测样本集,进一步说明数据标签,以及数据的标签是否被ST标记;(2)采用模糊数学的方法对训练样本数据进行模糊化表示,将二分类标记转化为多分类标记;(3)采用随机森林模型对上述已经模糊化处理的样本数据进行训练,得到训练后的随机森林模型;(4)将预测样本数据输入到训练后的随机森林模型当中,对场景应用进行决策;同时将本发明应用于企业财务风险预警,论证了本发明的实用性、有效性和科学性。本发明的显著优点为通过结合模糊集和随机森林模型将二分类决策转换成多分类决策,大大提高了预测的精度、效率、以及数据的合理性。
Description
技术领域
本发明属于多类别决策领域,具体涉及一种结合模糊集和随机森林的多类别决策方法。
背景技术
随机森林(Random Forest,RF)是数据挖掘领域中的代表算法,能够从有限的数据中挖掘出大量的信息,RF算法以Bootsrap重抽样法获取训练样本,其基本思想是构造多决策树模型,具有预测精度高、泛化误差可控、收敛速度快、调节参数少等优点,可以有效的避免过拟合现象发生,尤其适合高位数据的运算。已经有文献将RF算法与SVM和ANN算法进行了比较,证明了RF算法的优越性。目前,通过随机森林树算法对各类场景进行决策只有两类,这也是随机森林算法的不足之处。
模糊数学是一门新兴学科,它已经初步应用于模糊控制模糊识别、模糊聚类分析、模糊决策模糊评判、系统理论、信息检索等各个方面。通过模糊数学对训练样本进行模糊化表示,通过类别隶属值特征,将二分类标签转换成多分类标签,同时结合随机森林树进行多分类决策,大大提高决策精度和广度,适用于各类场景决策,这也是本发明的关键所在。
随着我国经济的快速发展,资本市场的制度也越来越完善。目前我国处于经济转型的关键时间段,也要时刻提防外部环境或者企业内部带来的财务风险,把控好风险才能使企业更好的经营。提高企业财务风险预警,是企业不断发展的必不可少的调控手段。针对如何提高财务风险预警的精度,众多的研究学者展开了长期研究和探索。同时,本发明将财务风险预警作为场景应用之一,来论证本发明的可行性、有效性和科学性。
发明内容
发明目的:本发明的目的是提供一种结合模糊集和随机森林树的多类别决策方法,提高预测精度和扩大场景适用范围。
技术方案:本发明所描述的一种结合模糊集和随机森林树的多类别决策方法步骤如下:
(1)分析和选取数据集,初步构造训练、预测样本集,进一步说明数据标签,以及数据的标签是否被ST标记。
(2)采用模糊数学的方法对训练样本数据进行模糊化表示,将二分类标记转化多分类标记,模糊表示的转化方法进一步包括如下步骤:
(21)设有A1,A2,...,Am等m个对象,每个对象具有C1,C2,...,Cn等n个属性,对象Ai关于属性Cj(j≠n)的评价值为区间[0,1],最后一个属性Cn表示的是该对象的二分类标签Y(正面标签)和N(负面标签)。因为各类指标类型都有正向指标或者负向指标之分,正向指标为越大越好,负向指标越小越好。下面以正向指标为例子进行模型的说明,负向指标在表达式中与正向指标相反。
(22)按照评价模型的需要来将模糊类数划分为s类,将对象的各个属性取值范围也划分成相应的s个模糊类。
(23)求相应属性的上下限。对于指标Cj来说,总的取值范围是[C1j,C2j,...,Cmj]。对[C1j,C2j,...,Cmj]做升序排序,依据该集合中元素所属对象的分类标签,来计算对象Ai关于属性Cj的一个效果评价值的上限和下限xij ,计算的依据是Cj所取的值中所有大于等于的所属对象的标签都为Y,所有Cj所取的值中小于xij 都为N。
(24)建立升半梯形隶属函数,对于确切数x来说,有:
(241)升半梯形分布
(25)按照(241)中的公式求出对象A1,A2,...,Am中所有属性元素的隶属值并代替原始的数据值,给所有对象新增一列属性总隶属值再依据步骤2中的方法求出属性Cn+1的上限和下限xij 属于模糊类k(k=1,2,...,s)的隶属度。其类别隶属函数为:
(251)类别隶属函数
类别隶属值特征进行上述的公式计算就可以将是二分类标签转化为多分类标签,并将该特征作为新的数据标签。
(3)采用随机森林模型对上述已经模糊化处理的样本数据进行训练,得到训练后的随机森林模型;随机森林模型的构建方法进一步说包括如下步骤:
(31)采用Bootstrap方法对已经模糊化处理的训练样本数据进行抽样,随机产生k个训练子集[S1,...,SK];采用Bootstrap方法对已降维的训练样本数据进行重抽样进一步说是对集合S中含有n个不同的样本,[x1,...,xn]有放回地从集合S中抽取一个样本,抽取n次,汇总抽取的样本形成新的集合S*;
(32)对每个子集构建对应的不减枝决策树CART1,...,CARTn,在对决策树内部节点进行分裂的过程中,是从M个属性中随机抽取m个属性作为该分裂节点的分裂属性集,其中M是训练样本的属性个数,m为大于0小于M的整数;
(33)对于测试样本X,利用每个决策树进行测试,得到对应的决策树CART1(X),...,CARTn(X),对着n个决策树的结果做投票策略,得到测试样本X对应的最终预测结果。最终的预测结果进一步表示为其中H(x)为预测输出,k为决策树的个数,hi(x)未第i个决策树的模型。
(4)将预测样本数据输入训练后的随机森林模型,对场景应用进行决策。
有益效果:与现有的技术相比较,本发明的显著优点为通过结合模糊数学和随机森林模型对场景应用进行决策,能进行多类别决策,大大提高了适用范围。同时,提高了决策的精度、效率、以及数据的合理性。模糊数学的引入,将离散特征数据值划分到相应的权值区间,在保证输入数据相对较少的同时,保留了绝大多数有效的信息,随机森林方法具有预测精度高、泛化误差可控、收敛速度快、调节参数少等优点,可有效避免过拟合现象,尤其适用于高维数据的运算。
附图说明
图1为本发明的系统架构图;
图2为随机森林预测示意图;
具体实施方式
下面结合附图对应用本发明进行财务风险预警的技术方案进行详细说明,需要说明的是,此处的说明仅仅以上市企业的财务风险预警为例,该发明适用于各类场景决策。
应用本发明进行上市企业财务的风险预警的步骤如下:
步骤(1):分析和选取最近七年沪深两市三千余家上市公司公布的企业季度财报数据,初步构造训练、预测样本集;进一步说该数据包括利润表、现金流量表、资产负债表等合计二十六维的数据,数据的标记是是否被ST标记。
步骤(2):采用模糊数学的方法对训练样本数据进行模糊化表示,将是否ST二分类标记转化为低风险(A档)、轻度风险(B档)、中度风险(C档)以及极高风险(D档),模糊表示的转化方法进一步包括如下步骤:
(1)给定M个样本,每个样本具有N维度的原始输入,输入样本数据构成M行N列矩阵,这N个维度的特征具体包括利润表、现金流量表、资产负债表中的财务指标
(2)由于财务特征之间的差异较大,为了得到更加精准的训练的模型,需要使用财务比率的计算公式将不同数值类型的财务数据标准化为统一的百分数。采用的财务比率包括但不局限于资产收益率、总资产报酬率等等。通过对上面提到的M*N的矩阵进行计算得到了M*X维度的矩阵,M代表的样本数量,X表示上面所计算出来的财务比率特征数,最后一维的数据特征为是否被ST标记。
(3)总的样本包括大约八十多个行业,不同的行业具备不同的财务比率特征。所以本文需要对着这八十多个行业通过模糊数学做相应的模糊表示,接下来以A行业为例子详细讲述模糊化表示过程。假设A行业有K条数据,那么该行业的样本矩阵大小为K*X,我们需要对每一维特征做模糊化。设样本集合表示为[S1,S2,...,SK],其中每一条样本的数据维度特征表示为[T1,T2,T3,...,TX]。我们需要分别对每一个特征做模糊计算得到相应的模糊值,以特为T1为例子,我们选取集合[S1,S2,...,SK]中所有的T1特征值对它做升序排序得到了特征集合[T11,T12,T13,...,T1X],假设该特征和财务风险负相关,也就是说该值越大财务风险的程度越低。根据排序好的特征值集合[T11,T12,T13,...,T1X],找到零界点T1w大于该值的标记都为非ST,这样就可以依据T1w把集合[T11,T12,T13,...,T1X]划分为集合[T11,T12,T13,...,T1(w-1)]和集合[T1w,...,T1X],假设集合[T11,T12,T13,...,T1(w-1)]的下限和上限分别为a1和a2,采用半梯形分布来确定隶属度,其隶属函数为:
(331)升半梯形分布
(332)降半梯形分布
通过该隶属函数就能计算出[T1,T2,T3,...,TX]每一维特征的隶属值。假设样本A通过计算后得到了该样本所有特征的隶属值[A1,A2,A3,...,AX],在该样本维度中再增加一维总隶属值,其表达式为选取总隶属值特征,设该特征的上下限分别为b1和b2,采用升梯形分布来确定其最终的隶属值,该隶属函数为:
总隶属值特征进行上述的模糊化处理就可以将是否ST二分类标记转化为低风险(A档)、轻度风险(B档)、中度风险(C档)以及极高风险(D档),并将该特征作为新的数据标记。
步骤(3):采用随机森林模型对上述已经模糊化处理的样本数据进行训练,得到训练后的随机森林模型;随机森林模型的构建方法进一步说明,包括如下步骤:
a、给定训练样本S的属性个数未M,m为大于0且小于M的整数;
b、采用Bootstrap方法对已经模糊化处理的训练样本数据进行抽样,随机产生k个训练子集[S1,...,SK];采用Bootstrap方法对已降维的训练样本数据进行重抽样进一步说是对集合S中含有n个不同的样本,[x1,...,xn]有放回地从集合S中抽取一个样本,抽取n次,汇总抽取的样本形成新的集合S*;
c、利用每个训练子集,生成对应的决策树CART1,...,CARTn,在每个非叶子节点上选择属性前,从M个属性中随机抽取m个属性作为当前节点的分裂属性集,并已这m个属性中最好的分裂方式对该节点进行分裂,在整个森林的生长过程中,m的值保持不变。
d、每棵树都完整生长,不进行减枝,直至训练完毕;
e、对于测试样本X,利用每个决策树进行测试,得到对应的决策树CART1(X),...,CARTn(X);
f、对这n个决策树的结果做投票策略,得到测试样本X对应的最终预测结果。最终的预测结果进一步表示为其中H(x)为预测输出,k为决策树的个数,hi(x)未第i个决策树的模型。
步骤(4):将预测样本数据输入训练后的随机森林模型,相应测试数据的预测,其输出即为待预测数据的财务风险等级。
分析并选取影响企业财务风险的数据如表1所示。
表1部分原始企业财务数据
原始企业财务数据具体为:2013年到2017年五千余家沪深两市上市企业公布的现金流量表、资产负债表和利润表,按季度划分总共具有货币基金、应收账款等180余特征值。从表1所示的部分财务指标中不难看出,不同的指标之间差异极大,且特征维度较高。需要使用财务比率的计算公式将不同数值类型的财务数据标准化为统一的百分数,且可以有效降低训练数据的维度,从而提高运算效率。部分财务比率指标计算公式如表2所示。
表2部分财务比率计算公式
表2详细描述了部分财务比率指标的计算公式,并且每一个指标都对财务风险具有正面或者负面的影响,下面将表1中说描述的数据按照表2的计算公式得到表3中的财务比率指标实例。
表3部分企业财务比率
分析表2和表3不难得出经过财务比率计算后得到的标准化数据,维度由处理之前的180余维降低到了22维,而且财务比率指标能够更好的描述现出该财务风险的特征,该步骤显著降低了模型规模以及模型训练运行的时间。
引入模糊数学方法对该数据进行模糊化转化,数据模糊的具体过程参考上文步骤2,下表4展示了部分数据模糊化后得到的结果。
表4部分样本模糊化结果
由表4所示,在把原始的财务数据进行模糊化表示后,就已经把一个二分类数据转化为了多分类问题,也体现出来了财务风险一个渐进的特征。采用随机森林模型对上述已经模糊化的训练样本进行训练,并采用训练好的模型进行预测。
给定训练样本S的属性个数为M,m为大于0且小于M的整数。在进行模型训练前,初始设置Ntree=30,Ntree表示决策树的个数,后续可以根据预测误差调整其大小;Mtry=log2(M+1),Mtry表示决策树分裂时候的节点数,在实验过程中不再改变。
首先采用Bootstrap方法对原始的财务数据进行抽样,通过这个过程随机产生了K个数据集合[S1,...,SK];
利用这个训练数据集合来生成相对应的决策树CART1,...,CARTn,决策树的模型定义为h(x),其中x表示输入的向量;在每个非叶子节点上选择属性前,从M个属性中随机抽取m个属性作为当前节点的分裂属性集合,并且会自动选择最好的分裂策略对该节点进行分裂。
在训练中中,每一棵决策树都会生长完全,在这个过程中不进行任何剪枝操作,一直到训练完成。
相对于用来测试用的数据X,对每一棵决策树都输入该数据进行测试,得到结果{h1(x),...,hk(x)};
在这k个结果上面采用投票策略,最后的预测结果为:其中t为第t棵决策树。
为了评价模型优劣,采用平均相对误差作为对预测的结果做分析。
(1)平均相对误差(Mean Absolute Percentage Error,MAPE)
该公式中:yf表示预测值,yt表示实际值,N表示总的训练数据量。MAPE用来评价预测值和实际值之间的偏差,该值越小,表示预测的效果越好。
为了分析本发明的预测效果,本发明将使用模糊数学处理样本和原始财务指标训练出来的模型进行预测结果的对比,部分预测结果及指标分析如表5所示。
表5预测结果对比
对表中的数据进行分析可以得知应用本发明的上市企业财务风险预测结果和实际结果基本保持一致,这也说明了本发明的可行性;对比是否采用模糊数学的预测结果可以得知,表中财务风险的特征两者基本相似,但是采用了模糊数学的模型能够把财务风险更加的细化到某一个层级,充分体现了本发明的有效性。综上所述,应用本发明可以对财务风险进行较好的预测,具备较高的工程使用价值。
Claims (6)
1.一种结合模糊集和随机森林的多类别决策方法,其特征在于包括如下步骤:
(1)分析和选取数据集,初步构造训练、预测样本集,进一步说明数据标签,以及数据的标签是否被ST标记;
(2)采用模糊数学的方法对训练样本数据进行模糊化表示,将二分类标记转化多分类标记;
(3)采用随机森林模型对上述已经降维和模糊过的数据进行训练,得到训练后的随机森林模型;
(4)将预测样本数据输入到训练后的随机森林模型当中进行场景决策。
2.根据权利要求1中所描述的一种结合模糊集和随机森林的多类别决策方法,其特征在于:步骤(1)中应用本发明进行企业财务风险预警的数据包括利润表、现金流量表、资产负债表等合计一百八十余维的数据,数据的标记是否被ST标记。
3.根据权利要求1中所描述的一种结合模糊集和随机森林的多类别决策方法,其特征在于:步骤(2)中,该述采用模糊数学对样本数据进行模糊化表示的方法包括如下步骤:
(21)设有A1,A2,...,Am等m个对象,每个对象具有C1,C2,...,Cn等n个属性,对象Ai关于属性Cj(j≠n)的评价值为区间[0,1],最后一个属性Cn表示的是该对象的二分类标签Y(正面标签)和N(负面标签),因为各类指标类型都有正向指标或者负向指标之分,正向指标为越大越好,负向指标越小越好,下面以正向指标为例子进行模型的说明,负向指标在表达式中与正向指标相反;
(22)按照评价模型的需要来将模糊类数划分为s类,将对象的各个属性取值范围也划分成相应的s个模糊类;
(23)求相应属性的上下限,对于指标Cj来说,总的取值范围是[C1j,C2j,...,Cmj],对[C1j,C2j,...,Cmj]做升序排序,依据该集合中元素所属对象的分类标签,来计算对象Ai关于属性Cj的一个效果评价值的上限和下限xij ,计算的依据是Cj所取的值中所有大于等于的所属对象的标签都为Y,所有Cj所取的值中小于xij 都为N;
(24)建立升半梯形隶属函数,对于确切数x来说,有:
(241)升半梯形分布
(25)按照(241)中的公式求出对象A1,A2,...,Am中所有属性元素的隶属值并代替原始的数据值,给所有对象新增一列属性总隶属值再依据步骤2中的方法求出属性Cn+1的上限和下限xij 属于模糊类k(k=1,2,...,s)的隶属度,其类别隶属函数为:
(251)类别隶属函数
类别隶属值特征进行上述的公式计算就可以将是二分类标签转化为多分类标签,并将该特征作为新的数据标签。
4.根据权利要求1中所描述的一种结合模糊集和随机森林的多类别决策方法,其特征在于:步骤(3)中,所述随机森林模型的创建方法包括如下步骤:
(31)采用Bootstrap方法对已经模糊化处理的训练样本数据进行抽样,随机产生k个训练子[S1,...,SK]集;
(32)对每个子集构建对应的不减枝决策CART1,...,CARTn树,在对决策树内部节点进行分裂的过程中,是从M个属性中随机抽取m个属性作为该分裂节点的分裂属性集,其中M是训练样本的属性个数,m为大于0小于M的整数;
(33)对于测试样本X,利用每个决策树进行测试,得到对应的决策树CART1(X),...,CARTn(X),对着n个决策树的结果做投票策略,得到测试样本X对应的最终预测结果。
5.根据权利要求4所述的一种结合模糊集和随机森林的多类别决策方法,其特征在于:在步骤(31)中,所用的Boosttrap方法对已经模糊化的数据进行冲去要是对集合集合S中含有n个不同的样本,[x1,...,xn]有放回地从集合S中抽取一个样本,抽取n次,汇总抽取的样本形成新的集合S*。
6.根据权利要求4所述的一种结合模糊集和随机森林的多类别决策方法,其特征在于:在步骤(33)中,所描述最终的预测结果表示为其中H(x)为预测输出,k为决策树的个数,hi(x)未第i个决策树的模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811562806.4A CN109657721A (zh) | 2018-12-20 | 2018-12-20 | 一种结合模糊集和随机森林树的多类别决策方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811562806.4A CN109657721A (zh) | 2018-12-20 | 2018-12-20 | 一种结合模糊集和随机森林树的多类别决策方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109657721A true CN109657721A (zh) | 2019-04-19 |
Family
ID=66115900
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811562806.4A Pending CN109657721A (zh) | 2018-12-20 | 2018-12-20 | 一种结合模糊集和随机森林树的多类别决策方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109657721A (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110344824A (zh) * | 2019-06-25 | 2019-10-18 | 中国矿业大学(北京) | 一种基于随机森林回归的声波曲线生成方法 |
CN110365691A (zh) * | 2019-07-22 | 2019-10-22 | 云南财经大学 | 基于深度学习的钓鱼网站判别方法及装置 |
CN111275239A (zh) * | 2019-12-20 | 2020-06-12 | 西安电子科技大学 | 一种基于多模态的网络化教学数据分析方法及系统 |
CN111783829A (zh) * | 2020-05-29 | 2020-10-16 | 广发证券股份有限公司 | 一种基于多标签学习的财务异常检测方法及装置 |
CN112036483A (zh) * | 2020-08-31 | 2020-12-04 | 中国平安人寿保险股份有限公司 | 基于AutoML的对象预测分类方法、装置、计算机设备及存储介质 |
CN112185484A (zh) * | 2020-10-13 | 2021-01-05 | 华北科技学院 | 一种基于AdaBoost模型的水质特征矿泉水分类方法 |
CN112396507A (zh) * | 2020-09-01 | 2021-02-23 | 重庆邮电大学 | 基于阴影划分的集成svm个人信用评估方法 |
CN112784556A (zh) * | 2019-11-08 | 2021-05-11 | 珠海金山办公软件有限公司 | 一种生成数据透视表值的方法及装置 |
CN113516173A (zh) * | 2021-05-27 | 2021-10-19 | 江西五十铃汽车有限公司 | 一种基于随机森林与决策树的整车静动态干涉的测评方法 |
CN113723569A (zh) * | 2021-10-13 | 2021-11-30 | 大连民族大学 | 一种新型多类支持向量机分类结果的最终决策方法 |
CN113989560A (zh) * | 2021-10-28 | 2022-01-28 | 清华大学 | 用于雷达姿势识别的在线半监督学习分类器及其分类方法 |
CN116227692A (zh) * | 2023-02-06 | 2023-06-06 | 中国科学院生态环境研究中心 | 一种农作物重金属富集风险量化方法、系统及可存储介质 |
-
2018
- 2018-12-20 CN CN201811562806.4A patent/CN109657721A/zh active Pending
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110344824A (zh) * | 2019-06-25 | 2019-10-18 | 中国矿业大学(北京) | 一种基于随机森林回归的声波曲线生成方法 |
CN110365691A (zh) * | 2019-07-22 | 2019-10-22 | 云南财经大学 | 基于深度学习的钓鱼网站判别方法及装置 |
CN110365691B (zh) * | 2019-07-22 | 2021-12-28 | 云南财经大学 | 基于深度学习的钓鱼网站判别方法及装置 |
CN112784556B (zh) * | 2019-11-08 | 2023-06-30 | 珠海金山办公软件有限公司 | 一种生成数据透视表值的方法及装置 |
CN112784556A (zh) * | 2019-11-08 | 2021-05-11 | 珠海金山办公软件有限公司 | 一种生成数据透视表值的方法及装置 |
CN111275239A (zh) * | 2019-12-20 | 2020-06-12 | 西安电子科技大学 | 一种基于多模态的网络化教学数据分析方法及系统 |
CN111275239B (zh) * | 2019-12-20 | 2023-09-29 | 西安电子科技大学 | 一种基于多模态的网络化教学数据分析方法及系统 |
CN111783829A (zh) * | 2020-05-29 | 2020-10-16 | 广发证券股份有限公司 | 一种基于多标签学习的财务异常检测方法及装置 |
CN112036483A (zh) * | 2020-08-31 | 2020-12-04 | 中国平安人寿保险股份有限公司 | 基于AutoML的对象预测分类方法、装置、计算机设备及存储介质 |
CN112036483B (zh) * | 2020-08-31 | 2024-03-15 | 中国平安人寿保险股份有限公司 | 基于AutoML的对象预测分类方法、装置、计算机设备及存储介质 |
CN112396507A (zh) * | 2020-09-01 | 2021-02-23 | 重庆邮电大学 | 基于阴影划分的集成svm个人信用评估方法 |
CN112185484A (zh) * | 2020-10-13 | 2021-01-05 | 华北科技学院 | 一种基于AdaBoost模型的水质特征矿泉水分类方法 |
CN113516173A (zh) * | 2021-05-27 | 2021-10-19 | 江西五十铃汽车有限公司 | 一种基于随机森林与决策树的整车静动态干涉的测评方法 |
CN113723569A (zh) * | 2021-10-13 | 2021-11-30 | 大连民族大学 | 一种新型多类支持向量机分类结果的最终决策方法 |
CN113989560A (zh) * | 2021-10-28 | 2022-01-28 | 清华大学 | 用于雷达姿势识别的在线半监督学习分类器及其分类方法 |
CN113989560B (zh) * | 2021-10-28 | 2024-06-18 | 清华大学 | 用于雷达姿势识别的在线半监督学习分类器及其分类方法 |
CN116227692A (zh) * | 2023-02-06 | 2023-06-06 | 中国科学院生态环境研究中心 | 一种农作物重金属富集风险量化方法、系统及可存储介质 |
CN116227692B (zh) * | 2023-02-06 | 2023-09-26 | 中国科学院生态环境研究中心 | 一种农作物重金属富集风险量化方法、系统及可存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109657721A (zh) | 一种结合模糊集和随机森林树的多类别决策方法 | |
Sebri et al. | Natural resources and income inequality: A meta-analytic review | |
Papenbrock et al. | Handling risk-on/risk-off dynamics with correlation regimes and correlation networks | |
Chen et al. | An alternative model for the analysis of detecting electronic industries earnings management using stepwise regression, random forest, and decision tree | |
Momeni et al. | Clustering stock market companies via k-means algorithm | |
Mukherjee et al. | Differential effects of trade openness on Indian manufacturing firms | |
Eklund et al. | Assessing the feasibility of self organizing maps for data mining financial information | |
CN116129189A (zh) | 一种植物病害识别方法、设备、存储介质及装置 | |
CN105741173A (zh) | 农业类公司投资价值评估方法及系统 | |
Özari et al. | Financial Performance Evaluating and Ranking Approach for Banks in Bist Sustainability Index Using Topsis and K-Means Clustering Method | |
Awad et al. | Using data mining tools to prediction of going concern on auditor opinion-empirical study in iraqi commercial | |
Lin et al. | Applying the random forest model to forecast the market reaction of start-up firms: case study of GISA equity crowdfunding platform in Taiwan | |
CN116069899B (zh) | 一种文本分析方法及系统 | |
Matsumoto et al. | Capturing corporate attributes in a new perspective through fuzzy clustering | |
Alireza et al. | Evaluation of the Financial Ratio Capability to Predict the Financial Crisis of Companies. | |
Subekti et al. | Cross-sectional machine learning approach on predicting stock return of LQ45 index | |
Shafiee et al. | Evaluation of back propagation-artificial neural network (BP-ANN) fit rate and types of vector machine algorithms in estimating the bankruptcy prediction of companies listed on tehran stock exchange | |
CN111160635A (zh) | 一种基于ReliefF算法的区域物流需求影响因素预测方法 | |
Soni et al. | Fundamental analysis of car manufacturing companies in India for 1.4. 2005 to 31.3. 2016 | |
CN116542801B (zh) | 一种财务数据分析方法及系统 | |
Trigueiros et al. | Discovering the optimal set of ratios to use in accounting-based models | |
Durica et al. | Modeling the financial distress of Slovak companies using various decision trees | |
Milleniasari et al. | Analysis Of Bankruptcy Prediction Using Springate, Zmijewski, Grover. And Altman Z-Score Models On Retail Companies Listed On The Indonesia Stock Exchange | |
Roy et al. | EVA and Traditional Performance Indicators: Evidence from NSE-Listed Computer Companies in India | |
Zhang | Predictive Modeling of Community Bank Survival Under Increasing Federal Funds Rate |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20190419 |