CN115439079A - 项目分类方法及装置 - Google Patents
项目分类方法及装置 Download PDFInfo
- Publication number
- CN115439079A CN115439079A CN202210893203.2A CN202210893203A CN115439079A CN 115439079 A CN115439079 A CN 115439079A CN 202210893203 A CN202210893203 A CN 202210893203A CN 115439079 A CN115439079 A CN 115439079A
- Authority
- CN
- China
- Prior art keywords
- data
- item
- project
- classification
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/103—Workflow collaboration or project management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/30—Administration of product recycling or disposal
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Economics (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Sustainable Development (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种项目分类方法及装置,所述方法包括:确定待分类项目的项目数据;将项目数据输入至项目分类模型,得到项目分类模型输出的项目分类结果;项目分类模型基于样本项目数据及样本项目分类标签训练得到;样本项目数据是基于各历史项目数据的重要度,对各历史项目数据进行筛选得到,重要度用于表征各历史项目数据对项目分类的影响程度,历史项目数据包括外部环境数据、不良信息数据以及处置信息数据中的至少一种。本发明提供的项目分类方法及装置,不仅能够减少项目分类模型的计算量和复杂度,而且能够保证项目分类模型的检测精度,避免传统方法中依赖人工经验进行项目分类导致精度较低的问题。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种项目分类方法及装置。
背景技术
随着不良资产数量增长,项目清收工作变得越发繁重,如何对待清收的项目进行分类,成为清收条线人员的迫切需求。
传统的项目分类方法,多依赖人工经验判断待分类项目与历史项目之间的相似度,若相似度较高,则认为待分类项目与对应的历史项目属于同一类别的概率较高。然而,上述方法完全依赖人工经验,分类准确度较低。
发明内容
本发明提供一种项目分类方法及装置,用以解决现有技术中项目分类准确度较低的缺陷。
本发明提供一种项目分类方法,包括:
确定待分类项目的项目数据;
将所述项目数据输入至项目分类模型,得到所述项目分类模型输出的项目分类结果;
所述项目分类模型基于样本项目数据及样本项目分类标签训练得到;所述样本项目数据是基于各历史项目数据的重要度,对各历史项目数据进行筛选得到,所述重要度用于表征各历史项目数据对项目分类的影响程度,所述历史项目数据包括外部环境数据、不良信息数据以及处置信息数据中的至少一种。
根据本发明提供的一种项目分类方法,所述样本项目数据基于如下步骤确定:
修改任一历史项目数据,确定对应样本项目分类的变化值;
基于所述变化值,确定对应历史项目数据的重要度;
在对应历史项目数据的重要度大于第一阈值的情况下,将对应历史项目数据作为所述样本项目数据。
根据本发明提供的一种项目分类方法,所述在对应历史项目数据的重要度大于第一阈值的情况下,将对应历史项目数据作为所述样本项目数据,包括:
在对应历史项目数据的重要度大于所述第一阈值的情况下,将对应历史项目数据进行特征工程处理,并将处理后的历史项目数据作为所述样本项目数据。
根据本发明提供的一种项目分类方法,所述方法还包括:
将测试项目数据输入至所述项目分类模型,得到所述项目分类模型输出的测试分类预测结果;
基于所述测试项目数据的测试项目分类标签以及所述测试分类预测结果,确定所述项目分类模型的准确度。
根据本发明提供的一种项目分类方法,所述确定所述项目分类模型的准确度,之后还包括:
在所述准确度小于第二阈值的情况下,获取所述样本项目数据对应的校正项目数据以及样本项目分类标签对应的校正分类标签;
基于所述校正项目数据以及所述校正分类标签,更新所述项目分类模型。
根据本发明提供的一种项目分类方法,所述得到所述项目分类模型输出的项目分类结果,之后还包括:
基于所述项目分类结果,确定所述待分类项目的清收策略。
本发明还提供一种项目分类装置,包括:
确定单元,用于确定待分类项目的项目数据;
分类单元,用于将所述项目数据输入至项目分类模型,得到所述项目分类模型输出的项目分类结果;
所述项目分类模型基于样本项目数据及样本项目分类标签训练得到;所述样本项目数据是基于各历史项目数据的重要度,对各历史项目数据进行筛选得到,所述重要度用于表征各历史项目数据对项目分类的影响程度,所述历史项目数据包括外部环境数据、不良信息数据以及处置信息数据中的至少一种。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述项目分类方法。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述项目分类方法。
本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述项目分类方法。
本发明提供的项目分类方法及装置,基于各历史项目数据的重要度,对各历史项目数据进行筛选得到样本项目数据,并基于样本项目数据及样本项目分类标签,训练得到项目分类模型,不仅能够减少项目分类模型的计算量和复杂度,而且能够保证项目分类模型的检测精度,避免传统方法中依赖人工经验进行项目分类导致精度较低的问题。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的项目分类方法的流程示意图;
图2是本发明提供的项目分类装置的结构示意图;
图3是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
传统的项目分类方法,多依赖人工经验判断待分类项目与历史项目之间的相似度,若相似度较高,则认为待分类项目与对应的历史项目属于同一类别的概率较高。例如,人工经验判断待分类项目与历史项目之间的相似度基于如下公式进行判断:相似度=0.1×行业分类相似度+0.1×地区相似度+0.1×企业类型相似度+0.1×不良金额相似度+0.1×抵质押物相似度+0.1×进入不良时间相似度。然而,上述方法完全依赖人工经验,分类准确度较低。
对此,本发明提供一种项目分类方法。图1是本发明提供的项目分类方法的流程示意图,如图1所示,该方法包括如下步骤:
步骤110、确定待分类项目的项目数据。
此处,待分类项目即需要进行项目分类的项目。待分类项目的项目数据用于表征待分类项目的属性信息。
步骤120、将项目数据输入至项目分类模型,得到项目分类模型输出的项目分类结果;
项目分类模型基于样本项目数据及样本项目分类标签训练得到;样本项目数据是基于各历史项目数据的重要度,对各历史项目数据进行筛选得到,重要度用于表征各历史项目数据对项目分类的影响程度,历史项目数据包括外部环境数据、不良信息数据以及处置信息数据中的至少一种。
具体地,历史项目指已经清收完毕的项目,样本项目是从历史项目中筛选得到的。例如,历史项目中可以包括处置成功的项目和处置失败的项目,而处置失败的项目对于待分类项目的清收工作没有参照意义,从而可以选取处置成功的项目作为样本项目,以使项目分类模型能够从处置成功的项目中准确学习到项目信息,进而准确对待分类项目进行分类。
历史项目数据中包括多种不同类型的数据,如外部环境数据、不良信息数据以及处置信息数据,且不同类型数据对项目分类的影响程度不同,也就是某些类型数据对项目分类影响较大,某些类型数据对项目分类影响较小,对于影响较小的类型数据可以忽略其对项目分类的影响。
若基于所有类型数据进行训练,则得到的项目分类模型在进行分类预测时计算量较大,且计算复杂度也越高,进而需要部署的硬件成本也越高。对此,本发明实施例基于各历史项目数据的重要度,对各历史项目数据进行筛选得到样本项目数据,如可以将重要度大于阈值的历史项目数据作为样本项目数据,然后基于样本项目数据及样本项目分类标签,训练得到项目分类模型,从而不仅能够减少项目分类模型的计算量和复杂度,而且能够保证项目分类模型的检测精度。其中,样本项目分类标签可以为样本项目的处置方式,如有现金清收、财产查封处置、批量转让、以物抵债、贷款重组、贷款减免等。
此外,历史项目数据包括外部环境数据、不良信息数据以及处置信息数据中的至少一种。其中,外部环境数据用于表征行业分类、区域、企业类型等信息,不良信息数据用于表征进入不良事件、不良金额等信息,处置信息数据用于表征借款人还款能力及意愿、保证人还款能力及意愿、可供追偿底第三方还款能力及意愿、抵质押物类型、处置难点、处置价值点等信息。
本发明实施例提供的项目分类方法,基于各历史项目数据的重要度,对各历史项目数据进行筛选得到样本项目数据,并基于样本项目数据及样本项目分类标签,训练得到项目分类模型,不仅能够减少项目分类模型的计算量和复杂度,而且能够保证项目分类模型的检测精度,避免传统方法中依赖人工经验进行项目分类导致精度较低的问题。
作为一种可选实施例,项目分类模型可以采用逻辑回归模型构建得到,其中项目分类模型可以采用One-Vs-One和SOFTMAX函数:
此外,项目分类模型的损失函数如下:
其中,J(θ)表示项目分类模型的损失值,m表示样本数量,z表示θ的个数。
对上述损失函数求最优解同样可以使用如梯度下降的迭代算法,其梯度公式如下:
基于上述实施例,样本项目数据基于如下步骤确定:
修改任一历史项目数据,确定对应样本项目分类的变化值;
基于变化值,确定对应历史项目数据的重要度;
在对应历史项目数据的重要度大于第一阈值的情况下,将对应历史项目数据作为样本项目数据。
具体地,样本项目分类的变化值用于表征样本项目分类的变化程度,变化程度越大,对应的样本项目分类的变化值越大;反之,变化程度越小,对应的样本项目分类的变化值越小。
此外,变化值用于表征对应历史项目数据的重要度,变化值越大,表明对应历史项目数据对项目分类的影响程度越大,也就是对应历史项目数据的重要度越大;变化值越小,表明对应历史项目数据对项目分类的影响程度越小,也就是对应历史项目数据的重要度越小。
在对应历史项目数据的重要度大于第一阈值的情况下,表明对应历史项目数据的重要度较高,因此将对应历史项目数据作为样本项目数据,以使项目分类模型能够在训练过程中从样本项目数据中学习到影响项目分类较大的项目数据信息,进而准确对项目进行分类。
例如,修改历史项目数据A之后,样本项目的类别由M变为N;修改历史项目数据B之后,样本项目的类别不变仍为M。由此可见,修改历史项目数据A之后,样本项目的类别发生了变化,即修改历史项目数据A对应的变化值大于修改历史项目数据B对应的变化值,从而可以得到历史项目数据A的重要度大于历史项目数据B的重要度。
由此可见,本发明实施例在对应历史项目数据的重要度大于第一阈值的情况下,将对应历史项目数据作为样本项目数据,从而在基于样本项目数据及样本项目分类标签进行模型训练时,不仅能够减少项目分类模型的计算量和复杂度,而且能够保证项目分类模型的检测精度,避免传统方法中依赖人工经验进行项目分类导致精度较低的问题。
基于上述任一实施例,在对应历史项目数据的重要度大于第一阈值的情况下,将对应历史项目数据作为样本项目数据,包括:
在对应历史项目数据的重要度大于第一阈值的情况下,将对应历史项目数据进行特征工程处理,并将处理后的历史项目数据作为样本项目数据。
具体地,在对应历史项目数据的重要度大于第一阈值的情况下,表明对应历史项目数据的重要度较高,即对应历史项目数据为高价值数据,因此将对应历史项目数据进行特征工程处理,并将处理后的历史项目数据作为样本项目数据。其中,特征工程处理可以包括缺失值处理、合并变量处理、变量分箱处理、独热编码处理等。
基于上述任一实施例,项目分类方法还包括:
将测试项目数据输入至项目分类模型,得到项目分类模型输出的测试分类预测结果;
基于测试项目数据的测试项目分类标签以及测试分类预测结果,确定项目分类模型的准确度。
具体地,测试项目数据用于对项目分类模型的准确度进行测试,其可以采用与样本项目数据相同的方法获取。由于测试项目数据是进行准确度测试的,而不是对项目分类模型进行训练的,从而测试项目数据的数量小于样本项目数据的数量,如测试项目数据的数量与样本项目数据的数量之比可以为1:4。
测试项目分类标签用于表征测试项目数据对应的实际项目分类结果,测试分类预测结果用于表征项目分类模型基于测试项目数据得到的项目分类预测结果。测试项目分类标签与测试分类预测结果之间的差异越大,表明测试分类预测结果的误差越大,也即项目分类模型的准确度越低。反之,测试项目分类标签与测试分类预测结果之间的差异越小,表明测试分类预测结果的误差越小,也即项目分类模型的准确度越高。
可选地,在确定项目分类模型的准确度时,若测试项目分类标签与测试分类预测结果一致,则表明测试分类预测结果是正确的;若测试项目分类标签与测试分类预测结果不一致,则表明测试分类预测结果是错误的。接着,统计正确测试分类预测结果的数量,并基于如下公式计算得到项目分类模型的准确度:准确度=正确测试分类预测结果的数量/测试分类预测结果的总数量。
由此可见,本发明实施例基于测试项目数据,可以准确获取项目分类模型的准确度,进而后续在模型准确度较低的情况下,实现对模型的更新,以保证模型能够准确对待分类项目进行分类。
基于上述任一实施例,确定项目分类模型的准确度,之后还包括:
在准确度小于第二阈值的情况下,获取样本项目数据对应的校正项目数据以及样本项目分类标签对应的校正分类标签;
基于校正项目数据以及校正分类标签,更新项目分类模型。
具体地,在准确度小于第二阈值的情况下,表明项目分类模型的准确度较低,此时需要更新项目分类模型,以提高项目分类模型的准确度。
考虑到造成项目分类模型准确度较低的原因可能是样本项目数据和/或样本项目分类标签存在误差,因此本发明实施例在准确度小于第二阈值的情况下,获取样本项目数据对应的校正项目数据以及样本项目分类标签对应的校正分类标签,进而基于校正项目数据以及校正分类标签,更新项目分类模型,以提高项目分类模型的准确度。其中,校正项目数据是指对样本项目数据进行校正后的项目数据,校正分类标签是指对样本项目分类标签进行校正后的标签,其可以通过专家进行校正,还可以通过其它方法进行校正,本发明实施例对此不作具体限定。
由此可见,本发明实施例基于校正项目数据以及校正分类标签,更新项目分类模型,从而能够提高项目分类模型的准确度,进而使得项目分类模型能够准确对待分类项目进行分类。
基于上述任一实施例,得到项目分类模型输出的项目分类结果,之后还包括:
基于项目分类结果,确定待分类项目的清收策略。
具体地,待分类项目的清收策略指待分类项目的处置方式。项目分类结果可以为待分类项目与各样本项目的相似度,本发明实施例可以选取最大相似度对应的样本项目作为待分类项目的同类别项目,进而以样本项目对应的清收策略作为待分类项目的清收策略。
项目分类结果也可以为待分类项目对应的处置方式,如有现金清收、财产查封处置、批量转让、以物抵债、贷款重组、贷款减免等,进而基于该项目分类结果可以直接确定待分类项目的清收策略。
下面对本发明提供的项目分类装置进行描述,下文描述的项目分类装置与上文描述的项目分类方法可相互对应参照。
基于上述任一实施例,本发明还提供一种项目分类装置,如图2所示,该装置包括:
确定单元210,用于确定待分类项目的项目数据;
分类单元220,用于将所述项目数据输入至项目分类模型,得到所述项目分类模型输出的项目分类结果;
所述项目分类模型基于样本项目数据及样本项目分类标签训练得到;所述样本项目数据是基于各历史项目数据的重要度,对各历史项目数据进行筛选得到,所述重要度用于表征各历史项目数据对项目分类的影响程度,所述历史项目数据包括外部环境数据、不良信息数据以及处置信息数据中的至少一种。
本发明实施例提供的项目分类装置,基于各历史项目数据的重要度,对各历史项目数据进行筛选得到样本项目数据,并基于样本项目数据及样本项目分类标签,训练得到项目分类模型,不仅能够减少项目分类模型的计算量和复杂度,而且能够保证项目分类模型的检测精度,避免传统方法中依赖人工经验进行项目分类导致精度较低的问题。
基于上述任一实施例,所述装置还包括:
变化值确定单元,用于修改任一历史项目数据,确定对应样本项目分类的变化值;
重要度确定单元,用于基于所述变化值,确定对应历史项目数据的重要度;
样本确定单元,用于在对应历史项目数据的重要度大于第一阈值的情况下,将对应历史项目数据作为所述样本项目数据。
基于上述任一实施例,所述样本确定单元,用于:
在对应历史项目数据的重要度大于所述第一阈值的情况下,将对应历史项目数据进行特征工程处理,并将处理后的历史项目数据作为所述样本项目数据。
基于上述任一实施例,所述装置还包括:
测试单元,用于将测试项目数据输入至所述项目分类模型,得到所述项目分类模型输出的测试分类预测结果;
准确度确定单元,用于基于所述测试项目数据的测试项目分类标签以及所述测试分类预测结果,确定所述项目分类模型的准确度。
基于上述任一实施例,所述装置还包括:
校正单元,用于确定所述项目分类模型的准确度之后,在所述准确度小于第二阈值的情况下,获取所述样本项目数据对应的校正项目数据以及样本项目分类标签对应的校正分类标签;
更新单元,用于基于所述校正项目数据以及所述校正分类标签,更新所述项目分类模型。
基于上述任一实施例,所述装置还包括:
清收单元,用于得到所述项目分类模型输出的项目分类结果之后,基于所述项目分类结果,确定所述待分类项目的清收策略。
图3是本发明提供的电子设备的结构示意图,如图3所示,该电子设备可以包括:处理器(processor)310、存储器(memory)320、通信接口(Communications Interface)330和通信总线340,其中,处理器310,存储器320,通信接口330通过通信总线340完成相互间的通信。处理器310可以调用存储器320中的逻辑指令,以执行项目分类方法,该方法包括:确定待分类项目的项目数据;将所述项目数据输入至项目分类模型,得到所述项目分类模型输出的项目分类结果;所述项目分类模型基于样本项目数据及样本项目分类标签训练得到;所述样本项目数据是基于各历史项目数据的重要度,对各历史项目数据进行筛选得到,所述重要度用于表征各历史项目数据对项目分类的影响程度,所述历史项目数据包括外部环境数据、不良信息数据以及处置信息数据中的至少一种。
此外,上述的存储器320中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法所提供的项目分类方法,该方法包括:确定待分类项目的项目数据;将所述项目数据输入至项目分类模型,得到所述项目分类模型输出的项目分类结果;所述项目分类模型基于样本项目数据及样本项目分类标签训练得到;所述样本项目数据是基于各历史项目数据的重要度,对各历史项目数据进行筛选得到,所述重要度用于表征各历史项目数据对项目分类的影响程度,所述历史项目数据包括外部环境数据、不良信息数据以及处置信息数据中的至少一种。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各提供的项目分类方法,该方法包括:确定待分类项目的项目数据;将所述项目数据输入至项目分类模型,得到所述项目分类模型输出的项目分类结果;所述项目分类模型基于样本项目数据及样本项目分类标签训练得到;所述样本项目数据是基于各历史项目数据的重要度,对各历史项目数据进行筛选得到,所述重要度用于表征各历史项目数据对项目分类的影响程度,所述历史项目数据包括外部环境数据、不良信息数据以及处置信息数据中的至少一种。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种项目分类方法,其特征在于,包括:
确定待分类项目的项目数据;
将所述项目数据输入至项目分类模型,得到所述项目分类模型输出的项目分类结果;
所述项目分类模型基于样本项目数据及样本项目分类标签训练得到;所述样本项目数据是基于各历史项目数据的重要度,对各历史项目数据进行筛选得到,所述重要度用于表征各历史项目数据对项目分类的影响程度,所述历史项目数据包括外部环境数据、不良信息数据以及处置信息数据中的至少一种。
2.根据权利要求1所述的项目分类方法,其特征在于,所述样本项目数据基于如下步骤确定:
修改任一历史项目数据,确定对应样本项目分类的变化值;
基于所述变化值,确定对应历史项目数据的重要度;
在对应历史项目数据的重要度大于第一阈值的情况下,将对应历史项目数据作为所述样本项目数据。
3.根据权利要求2所述的项目分类方法,其特征在于,所述在对应历史项目数据的重要度大于第一阈值的情况下,将对应历史项目数据作为所述样本项目数据,包括:
在对应历史项目数据的重要度大于所述第一阈值的情况下,将对应历史项目数据进行特征工程处理,并将处理后的历史项目数据作为所述样本项目数据。
4.根据权利要求1至3任一项所述的项目分类方法,其特征在于,所述方法还包括:
将测试项目数据输入至所述项目分类模型,得到所述项目分类模型输出的测试分类预测结果;
基于所述测试项目数据的测试项目分类标签以及所述测试分类预测结果,确定所述项目分类模型的准确度。
5.根据权利要求4所述的项目分类方法,其特征在于,所述确定所述项目分类模型的准确度,之后还包括:
在所述准确度小于第二阈值的情况下,获取所述样本项目数据对应的校正项目数据以及样本项目分类标签对应的校正分类标签;
基于所述校正项目数据以及所述校正分类标签,更新所述项目分类模型。
6.根据权利要求1至3任一项所述的项目分类方法,其特征在于,所述得到所述项目分类模型输出的项目分类结果,之后还包括:
基于所述项目分类结果,确定所述待分类项目的清收策略。
7.一种项目分类装置,其特征在于,包括:
确定单元,用于确定待分类项目的项目数据;
分类单元,用于将所述项目数据输入至项目分类模型,得到所述项目分类模型输出的项目分类结果;
所述项目分类模型基于样本项目数据及样本项目分类标签训练得到;所述样本项目数据是基于各历史项目数据的重要度,对各历史项目数据进行筛选得到,所述重要度用于表征各历史项目数据对项目分类的影响程度,所述历史项目数据包括外部环境数据、不良信息数据以及处置信息数据中的至少一种。
8.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至6任一项所述项目分类方法。
9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述项目分类方法。
10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述项目分类方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210893203.2A CN115439079A (zh) | 2022-07-27 | 2022-07-27 | 项目分类方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210893203.2A CN115439079A (zh) | 2022-07-27 | 2022-07-27 | 项目分类方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115439079A true CN115439079A (zh) | 2022-12-06 |
Family
ID=84242604
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210893203.2A Pending CN115439079A (zh) | 2022-07-27 | 2022-07-27 | 项目分类方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115439079A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116153516A (zh) * | 2023-04-19 | 2023-05-23 | 山东中医药大学第二附属医院(山东省中西医结合医院) | 一种基于分布式计算的疾病大数据挖掘分析系统 |
-
2022
- 2022-07-27 CN CN202210893203.2A patent/CN115439079A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116153516A (zh) * | 2023-04-19 | 2023-05-23 | 山东中医药大学第二附属医院(山东省中西医结合医院) | 一种基于分布式计算的疾病大数据挖掘分析系统 |
CN116153516B (zh) * | 2023-04-19 | 2023-07-07 | 山东中医药大学第二附属医院(山东省中西医结合医院) | 一种基于分布式计算的疾病大数据挖掘分析系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2021164382A1 (zh) | 针对用户分类模型进行特征处理的方法及装置 | |
US11023720B1 (en) | Document parsing using multistage machine learning | |
CN110688536A (zh) | 一种标签预测方法、装置、设备和存储介质 | |
CN112750029A (zh) | 信用风险预测方法、装置、电子设备及存储介质 | |
CN110782349A (zh) | 一种模型训练方法和系统 | |
CN115439079A (zh) | 项目分类方法及装置 | |
CN111325344A (zh) | 评估模型解释工具的方法和装置 | |
CN114626457A (zh) | 一种目标检测方法、装置及电子设备 | |
CN114118816A (zh) | 一种风险评估方法、装置、设备及计算机存储介质 | |
CN114418236A (zh) | 信息预测方法、装置、存储介质及电子设备 | |
CN113256402A (zh) | 风险控制规则确定方法、装置和电子设备 | |
CN115187387B (zh) | 一种风险商家的识别方法及设备 | |
CN110879821A (zh) | 评分卡模型衍生标签生成方法、装置、设备及存储介质 | |
CN113516165B (zh) | 一种基于图像金字塔匹配后验的客户满意度判别方法 | |
CN117708759B (zh) | 定位企业所属产业链环节的方法及装置 | |
CN111612023A (zh) | 一种分类模型构建方法及装置 | |
CN112418652B (zh) | 一种风险识别方法及相关装置 | |
CN111709479B (zh) | 一种图像分类方法和装置 | |
CN116993188A (zh) | 维护厂商评价方法、装置、设备及存储介质 | |
CN115880056A (zh) | 不良资产回收率预测模型的训练方法及回收率预测方法 | |
CN117291708A (zh) | 一种企业信用评估方法、系统、设备和介质 | |
CN112633344A (zh) | 质检模型的训练方法、装置、设备及可读存储介质 | |
CN114065009A (zh) | 物品信息分类方法和设备 | |
CN114372815A (zh) | 潜在客户的筛选方法 | |
CN118094215A (zh) | 样本数据的平衡、模型训练、分类方法、装置与设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |