CN111832661A - 分类模型构建方法、装置、计算机设备及可读存储介质 - Google Patents
分类模型构建方法、装置、计算机设备及可读存储介质 Download PDFInfo
- Publication number
- CN111832661A CN111832661A CN202010740250.4A CN202010740250A CN111832661A CN 111832661 A CN111832661 A CN 111832661A CN 202010740250 A CN202010740250 A CN 202010740250A CN 111832661 A CN111832661 A CN 111832661A
- Authority
- CN
- China
- Prior art keywords
- rule
- classification model
- stock
- judgment
- result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013145 classification model Methods 0.000 title claims abstract description 110
- 238000010276 construction Methods 0.000 title claims abstract description 41
- 238000004364 calculation method Methods 0.000 claims abstract description 64
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 21
- 238000005354 coacervation Methods 0.000 claims abstract description 11
- 238000000034 method Methods 0.000 claims description 31
- 239000013598 vector Substances 0.000 claims description 20
- 238000004590 computer program Methods 0.000 claims description 9
- 230000011218 segmentation Effects 0.000 claims description 9
- 230000006870 function Effects 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 5
- 238000012549 training Methods 0.000 claims description 3
- 238000013473 artificial intelligence Methods 0.000 abstract description 3
- 230000008569 process Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000007726 management method Methods 0.000 description 4
- 238000009833 condensation Methods 0.000 description 3
- 230000005494 condensation Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000013515 script Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/02—Banking, e.g. interest calculation or account maintenance
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及人工智能技术领域,公开了一种分类模型构建方法、装置、计算机设备及可读存储介质,包括:通过凝聚层次聚类算法识别各存量规则之间的差异度,并汇总差异度低于差异阈值的存量规则生成规则集合;提取规则集合中各存量规则的判断指标和判断结果,对判断指标和判断结果去重得到规则指标和规则结果;构建以规则集合中规则结果为分类结果,以规则指标为判断因子的分类模型;根据规则集合中规则指标创建配置页面,将配置页面与规则集合对应的分类模型关联。本发明仅需调用一个分类模型即可对多个相似的存量规则对应的计算数据进行计算,极大的降低了规则使用的复杂度,解决了当前使用者很难找到准确的规则开展其当前需解决的业务的问题。
Description
技术领域
本发明涉及人工智能的智能决策技术领域,尤其涉及一种分类模型构建方法、装置、计算机设备及可读存储介质。
背景技术
人行征信报告是绝大部分金融机构都会使用到的数据源,用来对用户进行风险判断。但由于人行征信报告的报文非常复杂,且大多是明细类数据,统计类数据较少,导致了与其明细相关的规则在绝大部分传统规则引擎里实现起来非常困难,经常需要针对每一条规则来写不同的脚本,且业务人员是无法写这种类别的规则,需要开发人员来进行脚本的开发。
当规则数目增加到一定数量,使用者则需要在大量的规则中查询并调用需要的规则对数据进行处理,造成规则的查询及调用十分繁杂,导致使用者很难找到准确的规则开展其当前需解决的业务。
发明内容
本发明的目的是提供一种分类模型构建方法、装置、计算机设备及可读存储介质,用于解决现有技术存在的需要在大量的规则中查询并调用需要的规则对数据进行处理,导致使用者很难找到准确的规则开展其当前需解决的业务的问题;本申请可应用于智慧政务场景中,从而推动智慧城市的建设。
为实现上述目的,本发明提供一种分类模型构建方法,包括:
获得至少一个存量规则,通过凝聚层次聚类算法识别各所述存量规则之间的差异度,并汇总差异度低于差异阈值的存量规则生成规则集合;
提取规则集合中各存量规则的判断指标和判断结果,对所述判断指标和判断结果去重得到规则指标和规则结果;
构建以规则集合中规则结果为分类结果,以规则指标为判断因子的分类模型;
根据规则集合中规则指标创建配置页面,将所述配置页面与所述规则集合对应的分类模型关联。
上述方案中,将所述配置页面与所述规则集合对应的分类模型关联之后,还包括:
将所述配置页面发送至用户端,接收所述用户端在所述配置页面上录入的计算数据,并通过与所述配置页面关联的分类模型运算所述计算数据生成计算结果;
将所述计算结果返回至所述用户端和/或将所述计算结果上传至区块链。
上述方案中,通过凝聚层次聚类算法识别各所述存量规则之间的差异度的步骤,包括:
提取存量规则中的判断指标和判断结果,对所述判断指标和判断结果进行向量化处理获得特征向量;
通过凝聚层次聚类算法对每个存量规则的特征向量,进行两两计算,得出特征向量之间的聚类距离间距,并将所述聚类距离间距作为所述特征向量所对应的存量规则之间的差异度。
上述方案中,汇总差异度低于差异阈值的存量规则生成规则集合的步骤,包括:
获取任一存量规则作为目标规则,提取与所述目标规则与其他存量规则之间的差异度;
将差异度低于差异阈值的存量规则作为相似规则,并将其与所述目标规则汇总获得规则集合。
上述方案中,对所述判断指标和判断结果去重得到规则指标和规则结果之后,还包括:
提取规则集合中各存量规则的分类目的,其中,所述分类目的是描述存量规则分类作用的信息;
对各所述分类目的进行分词获得至少具有一个词汇的分类分词集,对所述分类分词集中的词汇去重获得分类标签。
上述方案中,构建以规则集合中规则结果为分类结果,以规则指标为判断因子的分类模型的步骤,包括:
获得初始模型,其中,所述初始模型至少包括输入层、输出层和隐藏层;
根据所述规则结果构建所述输出层,根据所述规则指标构建所述输入层;
通过所述规则集合中的存量规则训练所述初始模型的隐藏层以获得分类模型。
上述方案中,根据规则集合中规则指标创建配置页面,将所述配置页面与所述规则集合对应的分类模型关联的步骤,包括:
提取所述规则指标的元数据,将所述元数据配置在预设的弹框上;
在所述弹框上设置与所述元数据对应的输入框获得配置页面,其中,所述输入框用于记载用户端输入的计算数据;
建立所述配置页面与分类模型之间的信道,使所述配置页面与分类模型相互关联,所述分类模型通过所述信道获得配置页面记载的计算数据。
为实现上述目的,本发明还提供一种分类模型构建装置,包括:
差异识别模块,用于获得至少一个存量规则,通过凝聚层次聚类算法识别各所述存量规则之间的差异度,并汇总差异度低于差异阈值的存量规则生成规则集合;
指标结果管理模块,用于提取规则集合中各存量规则的判断指标和判断结果,对所述判断指标和判断结果去重得到规则指标和规则结果;
模型构建模块,用于构建以规则集合中规则结果为分类结果,以规则指标为判断因子的分类模型;
页面构建模块,用于根据规则集合中规则指标创建配置页面,将所述配置页面与所述规则集合对应的分类模型关联。
为实现上述目的,本发明还提供一种计算机设备,其包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述计算机设备的处理器执行所述计算机程序时实现所述分类模型构建方法的步骤。
为实现上述目的,本发明还提供一种计算机可读存储介质,所述可读存储介质上存储有计算机程序,所述可读存储介质存储的所述计算机程序被处理器执行时实现所述分类模型构建方法的步骤。
本发明提供的分类模型构建方法、装置、计算机设备及可读存储介质,通过梳理出差异度较高的存量规则,对得到的存量规则进行整理,以便于对存量规则进行统一管理,使用者无需构建新的大数据模型,极大的提高了使用者构建模型的效率和可用性;通过获得规则集合中各存量规则的判断指标和判断结果的共性,对规则集合中各存量规则的判断指标和判断结果去重得到规则指标和规则结果;通过构建以规则结果为分类结果,以规则指标为自变量的分类模型,该分类模型可对规则集合中各存量规则所对应的计算数据计算,并生成相应的计算结果,因此,使用者仅需调用一个分类模型即可对多个相似的存量规则对应的计算数据进行计算,而无需从大量的存量规则中选择需要的规则,再根据该规则运算计算数据,故通过构建所述分类模型极大的降低了规则使用的复杂度,解决了当前需要在大量的规则中查询并调用与使用者发送的计算数据相匹配的规则,导致使用者很难找到准确的规则开展其当前需解决的业务的问题;通过创建配置页面并将其与所述分类模型关联,使所述分类模型接收用户端在所述配置页面上录入的计算数据,并对所述计算数据进行计算及返回相应的计算结果,以便于用户端能够快速准确的录入计算数据,并通过适于计算所述计算数据的分类模型对其进行计算,保证了计算结果的准确度。
附图说明
图1为本发明分类模型构建方法实施例一的流程图;
图2为本发明分类模型构建方法实施例二中分类模型构建方法的环境应用示意图;
图3是本发明分类模型构建方法实施例二中分类模型构建方法的具体方法流程图;
图4为本发明分类模型构建装置实施例三的程序模块示意图;
图5为本发明计算机设备实施例四中计算机设备的硬件结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供的分类模型构建方法、装置、计算机设备及可读存储介质,适用于人工智能的智能决策技术领域,为提供一种基于差异识别模块、指标结果管理模块、模型构建模块和页面构建模块的分类模型构建方法。本发明通过凝聚层次聚类算法识别各所述存量规则之间的差异度,并汇总差异度低于差异阈值的存量规则生成规则集合;提取规则集合中各存量规则的判断指标和判断结果,对所述判断指标和判断结果去重得到规则指标和规则结果;构建以规则结果为分类结果,以规则指标为判断因子的分类模型;根据规则集合中规则指标创建配置页面,将所述配置页面与所述规则集合对应的分类模型关联。
实施例一:
请参阅图1,本实施例的一种分类模型构建方法,包括:
S1:获得至少一个存量规则,通过凝聚层次聚类算法识别各所述存量规则之间的差异度,并汇总差异度低于差异阈值的存量规则生成规则集合。
S2:提取规则集合中各存量规则的判断指标和判断结果,对所述判断指标和判断结果去重得到规则指标和规则结果。
S3:构建以规则结果为分类结果,以规则指标为判断因子的分类模型。
S4:根据规则集合中规则指标创建配置页面,将所述配置页面与所述规则集合对应的分类模型关联。
本申请通过梳理出差异度较高的存量规则,以对得到的存量规则进行整理,以便于对存量规则进行统一管理;通过获得规则集合中各存量规则的判断指标和判断结果的共性,对规则集合中各存量规则的判断指标和判断结果去重得到规则指标和规则结果;通过实现对用户端发送的数据进行自动分类,以实现自动对接收到的计算数据进行计算并输出响应的计算结果,以便于对用户端的业务需求进行快速准确的分类;通过创建配置页面并将其与所述分类模型关联,使所述分类模型接收用户端在所述配置页面上录入的计算数据,并对所述计算数据进行计算及返回相应的计算结果,以便于用户端能够快速准确的录入计算数据。
本申请可应用于智慧政务场景中,从而推动智慧城市的建设。
实施例二:
本实施例为上述实施例一的一种具体应用场景,通过本实施例,能够更加清楚、具体地阐述本发明所提供的方法。
下面,以在运行有分类模型构建方法的服务器中,提取存量规则的判断指标和判断结果,对所述判断指标和判断结果去重得到规则指标和规则结果,构建以规则结果为分类结果,以规则指标为判断因子的分类模型,以及构建配置页面为例,来对本实施例提供的方法进行具体说明。需要说明的是,本实施例只是示例性的,并不限制本发明实施例所保护的范围。
图2示意性示出了根据本申请实施例二的分类模型构建方法的环境应用示意图。
在示例性的实施例中,分类模型构建方法所在的服务器2通过网络3连接用户端4;所述认证服务器2可以通过一个或多个网络3提供服务,网络3可以包括各种网络设备,例如路由器,交换机,多路复用器,集线器,调制解调器,网桥,中继器,防火墙,代理设备和/或等等。网络3可以包括物理链路,例如同轴电缆链路,双绞线电缆链路,光纤链路,它们的组合和/或类似物。网络3可以包括无线链路,例如蜂窝链路,卫星链路,Wi-Fi链路和/或类似物;所述用户端4可为智能手机、平板电脑、笔记本电脑、台式电脑等计算机设备。
图3是本发明一个实施例提供的一种分类模型构建方法的具体方法流程图,该方法具体包括步骤S1至S5。
S1:获得至少一个存量规则,通过凝聚层次聚类算法识别各所述存量规则之间的差异度,并汇总差异度低于差异阈值的存量规则生成规则集合。
为梳理出差异度较高的存量规则,以对得到的存量规则进行整理,本步骤通过凝聚层次聚类算法识别各所述存量规则之间的差异度,及汇总差异度低于差异阈值的存量规则生成规则集合,得到的规则集合中汇总了差异度较高的存量规则,以便于对存量规则进行统一管理;其中,差异度越低说明两个存量规则之间越相似。
在一个优选的实施例中,通过凝聚层次聚类算法识别各所述存量规则之间的差异度的步骤,包括:
S101:提取存量规则中的判断指标和判断结果,对所述判断指标和判断结果进行向量化处理获得特征向量;
S102:通过凝聚层次聚类算法对每个存量规则的特征向量,进行两两计算,得出特征向量之间的聚类距离间距,并将所述聚类距离间距作为所述特征向量所对应的存量规则之间的差异度。
示例性地,获得的存量规则包括贷款高风险识别规则、贷款低风险识别规则、理财高回报投资规则、理财稳健投资规则、理财保守投资规则;
其中,贷款高风险识别规则、贷款低风险识别规则中的判断指标包括账户类型、结清状态、数字(如:逾期次数)出现次数、MONTH24中出现的数字(如:逾期次数)、贷款业务类型;
贷款高风险识别规则的判断结果为贷款高风险,贷款低风险识别规则的判断结果为贷款低风险;
理财高回报投资规则、理财稳健投资规则、理财保守投资规则的判断指标包括:账户类型、账户余额、月出账额度、月入账额度、贷款业务类型;理财高回报投资规则的判断结果为高回报投资,理财稳健投资规则的判断结果为稳健投资,理财保守投资规则的判断结果为保守投资。
提取存量规则中的判断指标和判断结果,例如:所述存量规则为贷款高风险识别规则,该规则的判断指标包括账户类型、结清状态、数字(如:逾期次数)出现次数、MONTH24中出现的数字(如:逾期次数)、贷款业务类型,该规则的判断结果为贷款高风险;
通过独热编码对所述判断指标和判断结果进行向量化处理,例如:通过对所述判断指标和判断结果进行向量化处理,账户类型的独热码为101,结清状态:201,数字出现次数:301,MONTH24中出现的数字:401,贷款业务类型:501,贷款高风险为:001,因此,获得的特征向量为“101,201,301,401,501,001”。
对理财高回报投资规则的判断指标和判断结果进行向量化处理,如:账户类型:101、账户余额:205、月出账额度:311、月入账额度:321、贷款业务类型:501,高回报投资:011;那么获得理财高回报投资规则的特征向量为“101,205,311,321,501,011”。
需要说明的是,独热编码即One-Hot编码,又称一位有效编码,其方法是使用N位状态寄存器来对N个状态进行编码,每个状态都有它独立的寄存器位,并且在任意时候,其中只有一位有效。
所述凝聚层次聚类算法(Hierarchical Agglomerative Clustering),是递归地对数据对象进行合并或者分裂,直到满足某种终止条件为止的计算机算法。根据层次的分解方式,具体有可以分为“自下而上”和“自上而下”两种方式。凝聚层次聚类的基本过程如下:将每个点作为一个簇,每一步合并两个最接近的簇。另外即使到最后,对于噪音点或是离群点也往往还是各占一簇的,除非过度合并。
凝聚层次聚类算法中聚类距离间距的计算方法有多种,主要有三种定义:
1)单链(Single-link):不同两个聚类中离得最近的两个点之间的距离,即
2)全链(Complete-link):不同两个聚类中离得最远的两个点之间的距离,即
3)平均链(Average-link):不同两个聚类中所有点对距离的平均值,即
其中,在上述公式中,c1和c2是指所述两个聚类的编号,pi和pj分别代表所述两个聚类中任一点的特征向量,n1和n2分别为所述两个聚类中点的数量。
在示例性的实施例中,设定差异阈值为4,贷款高风险识别规则特征向量为“101,201,301,401,501,001”;贷款低风险识别规则特征向量为“101,201,301,401,501,002”;理财高回报投资规则特征向量为:“101,205,311,321,501,011”;理财稳健投资规则特征向量为:“101,205,311,321,501,012”。
在一个优选的实施例中,汇总差异度低于差异阈值的存量规则生成规则集合的步骤,包括:
S111:获取任一存量规则作为目标规则,提取与所述目标规则与其他存量规则之间的差异度;
S112:将差异度低于差异阈值的存量规则作为相似规则,并将其与所述目标规则汇总获得规则集合。
示例性地,贷款高风险识别规则和贷款低风险识别规则之间的差异度较低且小于差异阈值,因此将这两个规则汇总形成规则集合;而理财高回报投资规则、理财稳健投资规则和理财保守投资规则之间的差异度较低且小于差异阈值,这三个规则汇总形成规则集合。
在示例性的实施例中,以单链为例:通过上述单链的贷款高风险识别规则和贷款低风险识别规则之间的距离为“1”,小于差异阈值“4”,故属于同一规则集合;理财高回报投资规则和理财稳健投资规则之间的距离为“1”,小于差异阈值“4”,故属于同一规则集合;
贷款高风险识别规则和理财高回报投资规则,贷款高风险识别规则和理财稳健投资规则,贷款低风险识别规则和理财高回报投资规则,贷款低风险识别规则和理财高回报投资规则之间的距离均远大于“4”,因此上述组合不属于同一规则集合。S2:提取规则集合中各存量规则的判断指标和判断结果,对所述判断指标和判断结果去重得到规则指标和规则结果。
为获得规则集合中各存量规则的判断指标和判断结果的共性,本步骤对规则集合中各存量规则的判断指标和判断结果去重得到规则指标和规则结果。
示例性地,提取规则集合中贷款高风险识别规则、贷款低风险识别规则中的判断指标并去重,得到规则指标:账户类型、结清状态、数字(如:逾期次数)出现次数、MONTH24中出现的数字(如:逾期次数)、贷款业务类型;提取规则集合中贷款高风险识别规则、贷款低风险识别规则中的判断结果并去重,得到规则结果:贷款高风险和贷款低风险。
在一个优选的实施例中,对所述判断指标和判断结果去重得到规则指标和规则结果之后,还包括:
S201:提取规则集合中各存量规则的分类目的,其中,所述分类目的是描述存量规则分类作用的信息;
S202:对各所述分类目的进行分词获得至少具有一个词汇的分类分词集,对所述分类分词集中的词汇去重获得分类标签。
示例性地,所述分类目的可为存量规则的名称或简要说明,如:征信风险规则,XXX规则简要说明等。
S3:构建以规则集合中规则结果为分类结果,以规则指标为判断因子的分类模型。
为解决当前需要在大量的规则中查询并调用与使用者发送的计算数据相匹配的规则,并通过该规则运算所述计算数据以解决当前需解决的业务,导致使用者很难找到准确的规则开展其当前需解决的业务的问题;本步骤通过构建以规则结果为分类结果,以规则指标为自变量的分类模型,该分类模型可对规则集合中各存量规则所对应的计算数据计算,并生成相应的计算结果,因此,使用者仅需调用一个分类模型即可对多个相似的存量规则对应的计算数据进行计算,而无需从大量的存量规则中选择需要的规则,再根据该规则运算计算数据,故通过构建所述分类模型极大的降低了规则使用的复杂度。
在一个优选的实施例中,构建以规则集合中规则结果为分类结果,以规则指标为判断因子的分类模型的步骤,包括:
S301:获得初始模型,其中,所述初始模型至少包括输入层、输出层和隐藏层。
S302:根据所述规则结果构建所述输出层,以实现以规则结果为分类结果的效果;根据所述规则指标构建所述输入层,实现以规则指标为判断因子的效果。
S303:通过所述规则集合中的存量规则训练所述初始模型的隐藏层以获得分类模型。
本步骤中,将所述规则集合中存量规则的判断指标录入所述输入层,所述隐藏层对所述判断指标进行运算,并使所述输出层生成输出向量,获得所述输出向量与所述判断指标对应的判断结果之间的损失值,并通过反向传播法对所述隐藏层的权值进行调节,以获得能够根据所述判断指标对所述存量规则进行分类,得到准确的判断结果的分类模型。
S4:根据规则集合中规则指标创建配置页面,将所述配置页面与所述规则集合对应的分类模型关联,使所述分类模型接收用户端在所述配置页面上录入的计算数据。
为便于用户端能够快速准确的录入计算数据,并保证适配的分类模型对所述计算数据进行计算,本步骤通过创建配置页面并将其与所述分类模型关联,使所述分类模型接收用户端在所述配置页面上录入的计算数据,并对所述计算数据进行计算及返回相应的计算结果,保证了计算结果的准确度。
在一个优选的实施例中,根据规则集合中规则指标创建配置页面,将所述配置页面与所述规则集合对应的分类模型关联的步骤,包括:
S401:提取所述规则指标的元数据,将所述元数据配置在预设的弹框上。
S402:在所述弹框上设置与所述元数据对应的输入框获得配置页面,其中,所述输入框用于记载用户端输入的计算数据。
进一步的,在弹框上设置所述规则集合的分类标签,以便于用户端能够快速准确的获取需要的配置页面。
S403:建立所述配置页面与分类模型之间的信道,使所述配置页面与分类模型相互关联,所述分类模型通过所述信道获得配置页面记载的计算数据。
其中,通过TCP或UDP建立所述信道,TCP(Transmission Control Protocol传输控制协议)是一种面向连接的、可靠的、基于字节流的传输层通信协议,由IETF的RFC 793定义。在简化的计算机网络OSI模型中,它完成第四层传输层所指定的功能,用户数据报协议(UDP)是同一层内另一个重要的传输协议。在因特网协议族(Internet protocol suite)中,TCP层是位于IP层之上,应用层之下的中间层。不同主机的应用层之间经常需要可靠的、像管道一样的连接,但是IP层不提供这样的流机制,而是提供不可靠的包交换。UDP是UserDatagram Protocol的简称,中文名是用户数据报协议,是OSI(Open SystemInterconnection,开放式系统互联)参考模型中一种无连接的传输层协议,提供面向事务的简单不可靠信息传送服务,IETF RFC 768是UDP的正式规范。所述监控系统是一种用于实时监测服务器及其数据库的硬件条件、环境状况以及运行状况的计算机设备。
S5:将所述配置页面发送至用户端,接收所述用户端在所述配置页面上录入的计算数据,并通过与所述配置页面关联的分类模型运算所述计算数据生成计算结果;将所述计算结果返回至所述用户端和/或将所述计算结果上传至区块链。
为便于从用户端获得计算数据,将配置页面发送至用户端,用户可在配置页面的输入框中输入数据以形成计算数据,将获得的计算数据通过信道发送至与所述配置页面关联的分类模型,使所述分类模型对所述计算数据进行计算获得计算结果,将所述计算结果发送至所述用户端。
需要说明的是:基于计算结果得到对应的摘要信息,具体来说,摘要信息由计算结果进行散列处理得到,比如利用sha256s算法处理得到。将摘要信息上传至区块链可保证其安全性和对用户的公正透明性。用户设备可以从区块链中下载得该摘要信息,以便查证计算结果是否被篡改。本示例所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
实施例三:
请参阅图4,本实施例的一种分类模型构建装置1,包括:
差异识别模块11,用于获得至少一个存量规则,通过凝聚层次聚类算法识别各所述存量规则之间的差异度,并汇总差异度低于差异阈值的存量规则生成规则集合;
指标结果管理模块12,用于提取规则集合中各存量规则的判断指标和判断结果,对所述判断指标和判断结果去重得到规则指标和规则结果;
模型构建模块13,用于构建以规则集合中规则结果为分类结果,以规则指标为判断因子的分类模型;
页面构建模块14,用于根据规则集合中规则指标创建配置页面,将所述配置页面与所述规则集合对应的分类模型关联。
可选的,所述分类模型构建装置1还包括:
计算模块15,用于将所述配置页面发送至用户端,接收所述用户端在所述配置页面上录入的计算数据,并将其发送至与所述配置页面关联的分类模型。
实施例四:
为实现上述目的,本发明还提供一种计算机设备,实施例三的分类模型构建装置1的组成部分可分散于不同的计算机设备中,计算机设备5可以是执行程序的智能手机、平板电脑、笔记本电脑、台式计算机、机架式服务器、刀片式服务器、塔式服务器或机柜式服务器(包括独立的服务器,或者多个应用服务器所组成的服务器集群)等。本实施例的计算机设备5至少包括但不限于:可通过系统总线相互通信连接的存储器51、处理器52,如图5所示。需要指出的是,图5仅示出了具有组件-的计算机设备,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
本实施例中,存储器51(即可读存储介质)包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,存储器51可以是计算机设备的内部存储单元,例如该计算机设备的硬盘或内存。在另一些实施例中,存储器51也可以是计算机设备的外部存储设备,例如该计算机设备上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。当然,存储器51还可以既包括计算机设备的内部存储单元也包括其外部存储设备。本实施例中,存储器51通常用于存储安装于计算机设备的操作系统和各类应用软件,例如实施例三的分类模型构建装置的程序代码等。此外,存储器51还可以用于暂时地存储已经输出或者将要输出的各类数据。
处理器52在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器52通常用于控制计算机设备的总体操作。本实施例中,处理器52用于运行存储器51中存储的程序代码或者处理数据,例如运行分类模型构建装置,以实现实施例一和实施例二的分类模型构建方法。
实施例五:
为实现上述目的,本发明还提供一种计算机可读存储介质,如闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘、服务器、App应用商城等等,其上存储有计算机程序,程序被处理器52执行时实现相应功能。本实施例的计算机可读存储介质用于存储分类模型构建装置,被处理器52执行时实现实施例一和实施例二的分类模型构建方法。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种分类模型构建方法,其特征在于,包括:
获得至少一个存量规则,通过凝聚层次聚类算法识别各所述存量规则之间的差异度,并汇总差异度低于差异阈值的存量规则生成规则集合;
提取规则集合中各存量规则的判断指标和判断结果,对所述判断指标和判断结果去重得到规则指标和规则结果;
构建以规则集合中规则结果为分类结果,以规则指标为判断因子的分类模型;
根据规则集合中规则指标创建配置页面,将所述配置页面与所述规则集合对应的分类模型关联。
2.根据权利要求1所述的分类模型构建方法,其特征在于,将所述配置页面与所述规则集合对应的分类模型关联之后,还包括:
将所述配置页面发送至用户端,接收所述用户端在所述配置页面上录入的计算数据,并通过与所述配置页面关联的分类模型运算所述计算数据生成计算结果;
将所述计算结果返回至所述用户端和/或将所述计算结果上传至区块链。
3.根据权利要求1所述的分类模型构建方法,其特征在于,通过凝聚层次聚类算法识别各所述存量规则之间的差异度的步骤,包括:
提取存量规则中的判断指标和判断结果,对所述判断指标和判断结果进行向量化处理获得特征向量;
通过凝聚层次聚类算法对每个存量规则的特征向量进行两两计算,得出特征向量之间的聚类距离间距,并将所述聚类距离间距作为所述特征向量所对应的存量规则之间的差异度。
4.根据权利要求1所述的分类模型构建方法,其特征在于,汇总差异度低于差异阈值的存量规则生成规则集合的步骤,包括:
获取任一存量规则作为目标规则,提取与所述目标规则与其他存量规则之间的差异度;
将差异度低于差异阈值的存量规则作为相似规则,并将其与所述目标规则汇总获得规则集合。
5.根据权利要求1所述的分类模型构建方法,其特征在于,对所述判断指标和判断结果去重得到规则指标和规则结果之后,还包括:
提取规则集合中各存量规则的分类目的,其中,所述分类目的是描述存量规则分类作用的信息;
对各所述分类目的进行分词获得至少具有一个词汇的分类分词集,对所述分类分词集中的词汇去重获得分类标签。
6.根据权利要求1所述的分类模型构建方法,其特征在于,构建以规则集合中规则结果为分类结果,以规则指标为判断因子的分类模型的步骤,包括:
获得初始模型,其中,所述初始模型至少包括输入层、输出层和隐藏层;
根据所述规则结果构建所述输出层,根据所述规则指标构建所述输入层;
通过所述规则集合中的存量规则训练所述初始模型的隐藏层以获得分类模型。
7.根据权利要求1所述的分类模型构建方法,其特征在于,根据规则集合中规则指标创建配置页面,将所述配置页面与所述规则集合对应的分类模型关联的步骤,包括:
提取所述规则指标的元数据,将所述元数据配置在预设的弹框上;
在所述弹框上设置与所述元数据对应的输入框获得配置页面,其中,所述输入框用于记载用户端输入的计算数据;
建立所述配置页面与分类模型之间的信道,使所述配置页面与分类模型相互关联,所述分类模型通过所述信道获得配置页面记载的计算数据。
8.一种分类模型构建装置,其特征在于,包括:
差异识别模块,用于获得至少一个存量规则,通过凝聚层次聚类算法识别各所述存量规则之间的差异度,并汇总差异度低于差异阈值的存量规则生成规则集合;
指标结果管理模块,用于提取规则集合中各存量规则的判断指标和判断结果,对所述判断指标和判断结果去重得到规则指标和规则结果;
模型构建模块,用于构建以规则集合中规则结果为分类结果,以规则指标为判断因子的分类模型;
页面构建模块,用于根据规则集合中规则指标创建配置页面,将所述配置页面与所述规则集合对应的分类模型关联。
9.一种计算机设备,其包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述计算机设备的处理器执行所述计算机程序时实现权利要求1至7任一项所述分类模型构建方法的步骤。
10.一种计算机可读存储介质,所述可读存储介质上存储有计算机程序,其特征在于,所述可读存储介质存储的所述计算机程序被处理器执行时实现权利要求1至7任一项所述分类模型构建方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010740250.4A CN111832661B (zh) | 2020-07-28 | 2020-07-28 | 分类模型构建方法、装置、计算机设备及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010740250.4A CN111832661B (zh) | 2020-07-28 | 2020-07-28 | 分类模型构建方法、装置、计算机设备及可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111832661A true CN111832661A (zh) | 2020-10-27 |
CN111832661B CN111832661B (zh) | 2024-04-02 |
Family
ID=72921075
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010740250.4A Active CN111832661B (zh) | 2020-07-28 | 2020-07-28 | 分类模型构建方法、装置、计算机设备及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111832661B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112488857A (zh) * | 2020-11-24 | 2021-03-12 | 泰康保险集团股份有限公司 | 事件识别的方法、装置、电子设备和存储介质 |
CN113449700A (zh) * | 2021-08-30 | 2021-09-28 | 腾讯科技(深圳)有限公司 | 视频分类模型的训练、视频分类方法、装置、设备及介质 |
Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110137898A1 (en) * | 2009-12-07 | 2011-06-09 | Xerox Corporation | Unstructured document classification |
EP2927824A1 (en) * | 2014-04-01 | 2015-10-07 | Kainos Evolve Limited | Computer-implemented system and method for indexing electronic documents |
CN108153894A (zh) * | 2017-12-29 | 2018-06-12 | 上海跬智信息技术有限公司 | 一种olap数据模型自动建模的方法、分类器 |
US10108695B1 (en) * | 2015-08-03 | 2018-10-23 | Amazon Technologies, Inc. | Multi-level clustering for associating semantic classifiers with content regions |
CN108830696A (zh) * | 2018-07-02 | 2018-11-16 | 平安科技(深圳)有限公司 | 征信报告解析处理方法、装置、计算机设备及存储介质 |
CN110084059A (zh) * | 2019-03-21 | 2019-08-02 | 深圳壹账通智能科技有限公司 | 一种银行系统数据配置区块链的方法、装置及计算机设备 |
KR101984937B1 (ko) * | 2018-11-28 | 2019-09-03 | 주식회사 피씨엔 | 전통문화 3d 디지털 연표 표출 시스템 |
CN110377558A (zh) * | 2019-06-14 | 2019-10-25 | 平安科技(深圳)有限公司 | 文档查询方法、装置、计算机设备和存储介质 |
CN110458595A (zh) * | 2019-06-21 | 2019-11-15 | 平安普惠企业管理有限公司 | 可配置化的规则处理方法、电子装置及计算机设备 |
CN110781298A (zh) * | 2019-09-18 | 2020-02-11 | 平安科技(深圳)有限公司 | 药品分类方法、装置、计算机设备及存储介质 |
CN110781422A (zh) * | 2019-09-18 | 2020-02-11 | 中国平安财产保险股份有限公司 | 页面配置方法、装置、计算机设备及存储介质 |
CN110941629A (zh) * | 2019-10-12 | 2020-03-31 | 中国平安财产保险股份有限公司 | 元数据处理方法、装置、设备及计算机可读存储介质 |
CN111026946A (zh) * | 2019-12-12 | 2020-04-17 | 杭州昕华信息科技有限公司 | 一种页面信息抽取方法、装置、介质及设备 |
CN111061878A (zh) * | 2019-12-12 | 2020-04-24 | 杭州昕华信息科技有限公司 | 一种页面聚类方法、装置、介质及设备 |
CN111260189A (zh) * | 2020-01-08 | 2020-06-09 | 平安银行股份有限公司 | 一种风险控制方法、装置、计算机系统及可读存储介质 |
CN111367754A (zh) * | 2020-02-14 | 2020-07-03 | 中国平安人寿保险股份有限公司 | 数据监控方法、装置、计算机设备及存储介质 |
-
2020
- 2020-07-28 CN CN202010740250.4A patent/CN111832661B/zh active Active
Patent Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110137898A1 (en) * | 2009-12-07 | 2011-06-09 | Xerox Corporation | Unstructured document classification |
EP2927824A1 (en) * | 2014-04-01 | 2015-10-07 | Kainos Evolve Limited | Computer-implemented system and method for indexing electronic documents |
US10108695B1 (en) * | 2015-08-03 | 2018-10-23 | Amazon Technologies, Inc. | Multi-level clustering for associating semantic classifiers with content regions |
CN108153894A (zh) * | 2017-12-29 | 2018-06-12 | 上海跬智信息技术有限公司 | 一种olap数据模型自动建模的方法、分类器 |
CN108830696A (zh) * | 2018-07-02 | 2018-11-16 | 平安科技(深圳)有限公司 | 征信报告解析处理方法、装置、计算机设备及存储介质 |
KR101984937B1 (ko) * | 2018-11-28 | 2019-09-03 | 주식회사 피씨엔 | 전통문화 3d 디지털 연표 표출 시스템 |
CN110084059A (zh) * | 2019-03-21 | 2019-08-02 | 深圳壹账通智能科技有限公司 | 一种银行系统数据配置区块链的方法、装置及计算机设备 |
CN110377558A (zh) * | 2019-06-14 | 2019-10-25 | 平安科技(深圳)有限公司 | 文档查询方法、装置、计算机设备和存储介质 |
CN110458595A (zh) * | 2019-06-21 | 2019-11-15 | 平安普惠企业管理有限公司 | 可配置化的规则处理方法、电子装置及计算机设备 |
CN110781298A (zh) * | 2019-09-18 | 2020-02-11 | 平安科技(深圳)有限公司 | 药品分类方法、装置、计算机设备及存储介质 |
CN110781422A (zh) * | 2019-09-18 | 2020-02-11 | 中国平安财产保险股份有限公司 | 页面配置方法、装置、计算机设备及存储介质 |
CN110941629A (zh) * | 2019-10-12 | 2020-03-31 | 中国平安财产保险股份有限公司 | 元数据处理方法、装置、设备及计算机可读存储介质 |
CN111026946A (zh) * | 2019-12-12 | 2020-04-17 | 杭州昕华信息科技有限公司 | 一种页面信息抽取方法、装置、介质及设备 |
CN111061878A (zh) * | 2019-12-12 | 2020-04-24 | 杭州昕华信息科技有限公司 | 一种页面聚类方法、装置、介质及设备 |
CN111260189A (zh) * | 2020-01-08 | 2020-06-09 | 平安银行股份有限公司 | 一种风险控制方法、装置、计算机系统及可读存储介质 |
CN111367754A (zh) * | 2020-02-14 | 2020-07-03 | 中国平安人寿保险股份有限公司 | 数据监控方法、装置、计算机设备及存储介质 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112488857A (zh) * | 2020-11-24 | 2021-03-12 | 泰康保险集团股份有限公司 | 事件识别的方法、装置、电子设备和存储介质 |
CN112488857B (zh) * | 2020-11-24 | 2023-08-22 | 泰康保险集团股份有限公司 | 事件识别的方法、装置、电子设备和存储介质 |
CN113449700A (zh) * | 2021-08-30 | 2021-09-28 | 腾讯科技(深圳)有限公司 | 视频分类模型的训练、视频分类方法、装置、设备及介质 |
CN113449700B (zh) * | 2021-08-30 | 2021-11-23 | 腾讯科技(深圳)有限公司 | 视频分类模型的训练、视频分类方法、装置、设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111832661B (zh) | 2024-04-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112148987B (zh) | 基于目标对象活跃度的消息推送方法及相关设备 | |
CN112084383A (zh) | 基于知识图谱的信息推荐方法、装置、设备及存储介质 | |
CN108376364B (zh) | 一种支付系统对账的方法、设备及终端设备 | |
CN110046929B (zh) | 一种欺诈团伙识别方法、装置、可读存储介质及终端设备 | |
CN110929525B (zh) | 一种网贷风险行为分析检测方法、装置、设备和存储介质 | |
CN111832661B (zh) | 分类模型构建方法、装置、计算机设备及可读存储介质 | |
CN113011884B (zh) | 账户特征的提取方法、装置、设备及可读存储介质 | |
WO2021217933A1 (zh) | 同质网络的社群划分方法、装置、计算机设备和存储介质 | |
CN112116436A (zh) | 一种智能推荐方法、装置、计算机设备及可读存储介质 | |
CN113379530A (zh) | 用户风险的确定方法、装置和服务器 | |
CN111723159A (zh) | 一种基于区块链的数据验证方法和装置 | |
CN112328657A (zh) | 特征衍生方法、装置、计算机设备及介质 | |
CN112231416A (zh) | 知识图谱本体更新方法、装置、计算机设备及存储介质 | |
CN116860856A (zh) | 一种财务数据处理方法、装置、计算机设备及存储介质 | |
CN112766560B (zh) | 联盟区块链网络优化方法、装置、系统和电子设备 | |
CN113902574A (zh) | 协议数据处理方法、装置、计算机设备及存储介质 | |
CN117291722A (zh) | 对象管理方法、相关设备及计算机可读介质 | |
CN112995155A (zh) | 金融异常报文识别方法及装置 | |
CN112417886A (zh) | 意图实体信息抽取方法、装置、计算机设备及存储介质 | |
CN116541792A (zh) | 一种基于图神经网络节点分类进行团伙识别的方法 | |
CN114266255B (zh) | 基于聚类模型的语料分类方法、装置、设备及存储介质 | |
CN112561538B (zh) | 风险模型创制方法、装置、计算机设备及可读存储介质 | |
CN114840872A (zh) | 秘密文本脱敏方法、装置、计算机设备及可读存储介质 | |
CN115099875A (zh) | 基于决策树模型的数据分类方法及相关设备 | |
CN113886547A (zh) | 基于人工智能的客户实时对话转接方法、装置和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |