CN113887655A - 模型链回归预测方法、装置、设备及计算机存储介质 - Google Patents

模型链回归预测方法、装置、设备及计算机存储介质 Download PDF

Info

Publication number
CN113887655A
CN113887655A CN202111225136.9A CN202111225136A CN113887655A CN 113887655 A CN113887655 A CN 113887655A CN 202111225136 A CN202111225136 A CN 202111225136A CN 113887655 A CN113887655 A CN 113887655A
Authority
CN
China
Prior art keywords
sample
trained
model
classification
class
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111225136.9A
Other languages
English (en)
Inventor
谭蕴琨
陈婷
吴三平
庄伟亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
WeBank Co Ltd
Original Assignee
WeBank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by WeBank Co Ltd filed Critical WeBank Co Ltd
Priority to CN202111225136.9A priority Critical patent/CN113887655A/zh
Publication of CN113887655A publication Critical patent/CN113887655A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24317Piecewise classification, i.e. whereby each classification requires several discriminant rules
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Business, Economics & Management (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Software Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Game Theory and Decision Science (AREA)
  • Medical Informatics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

本申请公开了一种模型链回归预测方法、装置、设备及计算机存储介质,所述模型链回归预测方法包括:获取待预测样本,通过第一分类模型对所述待预测样本进行二分类预测,获得中间预测结果,其中,所述第一分类模型是基于预设类别划分的待训练样本集进行迭代训练得到的,基于所述中间预测结果和所述待预测样本,通过第二分类模型对所述待预测样本进行分类,获得目标分类结果,基于所述目标分类结果和所述待预测样本,通过回归模型对所述待预测样本进行预测,获得目标预测结果。本申请解决模型预测准确性低的技术问题。

Description

模型链回归预测方法、装置、设备及计算机存储介质
技术领域
本申请涉及金融科技(Fintech)的机器学习技术领域,尤其涉及一种模型链回归预测方法、装置、设备及计算机存储介质。
背景技术
随着金融科技,尤其是互联网科技金融的不断发展,越来越多的技术(如分布式、人工智能等)应用在金融领域,但金融业也对技术提出了更高的要求,如对金融业对应待办事项的分发也有更高的要求。
随着计算机技术的发展,机器学习的应用越来越广泛,目前,传统的机器学习方法通常是基于数据均衡情况下实现的,然而在实际应用中,由于不同类别的样本数量分布不均衡,也即当存在长尾数据样本时,直接利用回归模型进行预测会倾向于将数量少的类别样本预测为数量多的类别样本,导致预测效果较差,当前,在面对类别数据分布不均衡问题的处理通常是增加少类样本在训练集中的比例或者增加少类样本在训练过程中的权重,然而,样本比例和样本权重难以把控,进而导致模型预测准确性较低。
发明内容
本申请的主要目的在于提供一种模型链回归预测方法、装置、设备及计算机存储介质,旨在解决现有技术中的模型预测准确性低的技术问题。
为实现上述目的,本申请提供一种模型链回归预测方法,所述模型链回归预测方法包括:
获取待预测样本;
通过第一分类模型对所述待预测样本进行二分类预测,获得中间预测结果,其中,所述第一分类模型是基于预设类别划分的待训练样本集进行迭代训练得到的;
基于所述中间预测结果和所述待预测样本,通过第二分类模型对所述待预测样本进行分类,获得目标分类结果;
基于所述目标分类结果和所述待预测样本,通过回归模型对所述待预测样本进行预测,获得目标预测结果。
可选地,所述基于所述预测结果和所述待预测样本,通过第二分类模型对所述待预测样本进行分类,获得目标分类结果的步骤包括:
将所述中间预测结果和所述待预测样本进行合并,获得融合特征信息;
将所述融合特征信息输入所述第二分类模型,输出所述目标分类结果。
可选地,在所述通过第一分类模型对所述待预测样本进行二分类预测,获得中间预测结果,其中,所述第一分类模型是基于预设类别划分的待训练样本集进行迭代训练得到的步骤之前,所述模型链回归预测方法还包括:
获取待训练样本集以及待训练二分类模型,其中,所述待训练样本集包括多个待训练样本;
根据各所述样本特征信息对应的类别信息,将各所述待训练样本划分为多类别样本和少类别样本;
分别对所述多类别样本和所述少类别样本进行标记,获得多类别样本标签和类别样本标签;
通过所述待训练样本集、所述多类别样本标签和所述少类别样本标签对所述待训练二分类模型进行迭代训练优化,获得所述第一分类模型,并输出训练预测结果。
可选地,所述根据各所述样本特征信息对应的类别信息,将各所述待训练样本划分为多类别样本和少类别样本的步骤包括:
统计各所述待训练样本分别对应的类别数量;
基于所述类别数量,将各所述待训练样本按照预设划分规则进行划分,获得所述多类别样本和所述少类别样本。
可选地,在所述将所述待训练样本集、多类别样本标签和少类别样本标签对所述待训练二分类模型进行迭代训练优化,获得所述第一分类模型,并输出训练预测结果的步骤之后,所述模型链回归预测方法还包括:
获取待训练多分类模型;
将所述训练预测结果和所述待训练样本集进行合并,获得待训练融合特征集;
按照预设分类规则对各所述待训练样本进行多分类,获得各所述待训练样本的分类标签;
根据所述待训练融合特征集和各所述待训练样本对应的分类标签,对所述待训练多分类模型进行迭代训练优化,获得第二分类模型,并输出训练多分类预测结果。
可选地,所述根据所述待训练融合特征集和各所述待训练样本对应的分类标签,对所述待训练多分类模型进行迭代训练优化,获得第二分类模型的步骤包括:
将所述融合特征集输入所述待训练多分类模型,输出多分类预测结果;
根据各所述待训练样本对应的分类标签和所述多分类预测结果,确定分类模型损失;
基于所述分类模型损失计算的梯度,对所述待训练多分类模型进行迭代训练优化,获得所述第二分类模型。
可选地,在所述根据所述待训练融合特征集和各所述待训练样本对应的分类标签,对所述待训练多分类模型进行迭代训练优化,获得第二分类模型,并输出训练多分类预测结果的步骤之后,所述模型链回归预测方法还包括:
获取待训练回归模型;
将所述训练多分类预测结果和所述待训练样本集进行合并,获得待训练回归特征集;
基于所述待训练回归特征集和各所述待训练样本分别对应的类别信息,对所述待训练回归模型进行迭代训练,获得所述回归模型。
本申请还提供一种模型链回归预测装置,所述模型链回归预测装置为虚拟装置,所述模型链回归预测装置包括:
获取模块,用于获取待预测样本;
第一预测模块,用于通过第一分类模型对所述待预测样本进行二分类预测,获得中间预测结果,其中,所述第一分类模型是基于预设类别划分的待训练样本集进行迭代训练得到的;
分类模块,用于基于所述中间预测结果和所述待预测样本,通过第二分类模型对所述待预测样本进行分类,获得目标分类结果。
第二预测模块,用于基于所述目标分类结果和所述待预测样本,通过回归模型对所述待预测样本进行预测,获得目标预测结果。
本申请还提供一种模型链回归预测设备,所述模型链回归预测设备为实体设备,所述模型链回归预测设备包括:存储器、处理器以及存储在所述存储器上的模型链回归预测程序,所述模型链回归预测程序被所述处理器执行实现如上述的模型链回归预测方法的步骤。
本申请还提供一种计算机存储介质,所述计算机存储介质上存储模型链回归预测程序,所述模型链回归预测程序被处理器执行实现如上述的模型链回归预测方法的步骤。
本申请还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述的模型链回归预测方法的步骤。
本申请提供了一种模型链回归预测方法、装置、设备及计算机存储介质,相比于现有技术采用的通过增加少类样本在训练集中的比例或者增加少类样本在训练过程中的权重以提高模型对少类别样本预测的准确性的技术手段,本申请首先获取待预测样本,通过第一分类模型对所述待预测样本进行二分类预测,获得中间预测结果,其中,所述第一分类模型是基于预设类别划分的待训练样本集进行迭代训练得到的,基于所述中间预测结果和所述待预测样本,通过第二分类模型对所述待预测样本进行分类,获得目标分类结果,进一步地,基于所述目标分类结果和所述待预测样本,通过回归模型对所述待预测样本进行预测,获得目标预测结果,实现了基于模型链的预测分类方法,通过所述第一分类模型输出中间预测结果,并将所述中间预测结果加入到后续的模型预测中,以使得所述第二分类模型可以学习到所述第一分类模型输出二分类结果对应的概率,提高模型多分类结果的分类准确性,另外地,所述第一分类模型的输出和所述第二分类模型的输出不存在强相关,因此,不会出现单特征过强或者模型过拟合的情况,进而通过回归模型学习第二分类模型预测的结果,从而提高长尾类样本预测结果的准确性,克服了现有技术中通过增加少类样本在训练集中的比例或者增加少类样本在训练过程中的权重以降低模型预测分类误差,然而,样本比例和样本权重难以把控,进而导致模型分类准确性较低的技术缺陷,从而提高了模型回归预测的准确性。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域默认技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请模型链回归预测方法第一实施例的流程示意图;
图2为本申请模型链回归预测方法第二实施例的流程示意图;
图3为本申请模型链回归预测方法第三实施例的流程示意图;
图4为本申请模型链回归预测方法第三实施例的流程示意图;
图5为本申请实施例中模型链回归预测方法涉及的硬件运行环境的模型链回归预测设备结构示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。
本申请实施例提供一种模型链回归预测方法,在本申请模型链回归预测方法的第一实施例中,参照图1,所述模型链回归预测方法包括:
步骤S10,获取待预测样本;
步骤S20,通过第一分类模型对所述待预测样本进行二分类预测,获得中间预测结果,其中,所述第一分类模型是基于预设类别划分的待训练样本集进行迭代训练得到的;
在本实施例中,需要说明的是,所述第一分类模型为对所述待预测样本进行分类的二分类模型。
通过第一分类模型对所述待预测样本进行二分类预测,获得中间预测结果,其中,所述第一分类模型是基于预设类别划分的待训练样本集进行迭代训练得到的,具体地,首先将所述待训练样本集按照类别进行划分,类别数量比例多的划分别多类别样本,并将类别数量比例少的划分别少类别样本,进而将所述多类别样本和所述少类别样本打上标签,进一步地,将所述多类别样本对应的标签、所述少类别样本对应的标签以及所述待训练样本集合所述对待训练二分类模型进行迭代训练优化,以获得所述第一分类模型,进而将所述待预测样本输入所述第一分类模型中,获得中间预测结果,也即获得多类别样本和所述少类别样本分别对应的概率。
步骤S30,基于所述中间预测结果和所述待预测样本,通过第二分类模型对所述待预测样本进行分类,获得目标分类结果;
在本实施例中,需要说明的是,所述第二分类模型为对待预测样本进行多分类的多分类模型。
基于所述中间预测结果和所述待预测样本,通过第二分类模型对所述待预测样本进行分类,获得目标分类结果,具体地,将所述中间预测结果与所述待预测样本进行合并,获得融合特征信息,进而将所述融合特征信息输入所述第二分类模型,输出所述待预测样本对应的目标分类结果,在本步骤中,利用多分类模型代替回归模型,通过预测待预测样本的类别,从而减少对长尾样本预测值的误差。
其中,所述基于所述预测结果和所述待预测样本,通过第二分类模型对所述待预测样本进行分类,获得目标分类结果的步骤包括:
步骤S31,将所述中间预测结果和所述待预测样本进行合并,获得融合特征信息;
在本实施例中,将所述中间预测结果和所述待预测样本进行合并,获得融合特征信息,具体地,通过将所述第一分类模型预测的中间预测结果加入所述待预测样本中,获得所述融合特征信息。
步骤S32,将所述融合特征信息输入所述第二分类模型,输出所述目标分类结果。
在本实施例中,将所述融合特征信息输入所述第二分类模型,输出所述目标分类结果,具体地,通过所述第二分类模型对所述融合特征信息进行分类预测,获得所述目标分类结果,利用所述第一分类模型输出之间预测结果,为所述第二分类模型提供了有效信息,从而提高所述第二分类模型对所述待预测样本的分类准确性。
步骤S40,基于所述目标分类结果和所述待预测样本,通过回归模型对所述待预测样本进行预测,获得目标预测结果。
在本实施例中,需要说明的是,上述第一分类模型以及第二分类模型的预测结果和待预测样本对应真实标签具有较强的相关性,容易导致模型过拟合的情况,因此,回归模型应选择较简单的模型、限制单一变量的权重,从而防止模型对一个或多个变量过拟合。
基于所述目标分类结果和所述待预测样本,通过回归模型对所述待预测样本进行预测,获得目标预测结果,具体地,将所述目标分类结果和所述待预测样本输出所述回归模型中,以通过所诉回归模型对所述待预测样本进行预测,获得所述目标预测结果。
进一步地,在整个预测过程中,首先通过二分类模型学习样本属于头部类(多类别样本)或长尾类(少类别样本),进而通过多分类模型学习待预测样本属于的值域,最后利用回归模型学习待预测样本的具体标签值,也即,前2个模型是中间模型,学习结果作为特征输入到下一个模型中,从而使得模型能够学习到更多的有效信息。
本申请实施例提供了一种模型链回归预测方法,相比于现有技术采用的通过增加少类样本在训练集中的比例或者增加少类样本在训练过程中的权重以提高模型对少类别样本预测的准确性的技术手段,本申请实施例首先获取待预测样本,通过第一分类模型对所述待预测样本进行二分类预测,获得中间预测结果,其中,所述第一分类模型是基于预设类别划分的待训练样本集进行迭代训练得到的,基于所述中间预测结果和所述待预测样本,通过第二分类模型对所述待预测样本进行分类,获得目标分类结果,进一步地,基于所述目标分类结果和所述待预测样本,通过回归模型对所述待预测样本进行预测,获得目标预测结果,实现了基于模型链的预测分类方法,通过所述第一分类模型输出中间预测结果,并将所述中间预测结果加入到后续的模型预测中,以使得所述第二分类模型可以学习到所述第一分类模型输出二分类结果对应的概率,提高模型多分类结果的分类准确性,另外地,所述第一分类模型的输出和所述第二分类模型的输出不存在强相关,因此,不会出现单特征过强或者模型过拟合的情况,进而通过回归模型学习第二分类模型预测的结果,从而提高长尾类样本预测结果的准确性,克服了现有技术中通过增加少类样本在训练集中的比例或者增加少类样本在训练过程中的权重以降低模型预测分类误差,然而,样本比例和样本权重难以把控,进而导致模型分类准确性较低的技术缺陷,从而提高了模型回归预测的准确性。
进一步地,参照图2,基于本申请中第一实施例,在本申请的另一实施例中,在所述通过第一分类模型对所述待预测样本进行二分类预测,获得中间预测结果,其中,所述第一分类模型是基于预设类别划分的待训练样本集进行迭代训练得到的步骤之前,所述模型链回归预测方法还包括:
步骤A10,获取待训练样本集以及待训练二分类模型,其中,所述待训练样本集包括多个待训练样本;
在本实施例中,需要说明的是,获取待训练样本集包括但不限于网页、邮件、短信、论坛、微博、购物平台和新闻点评等平台的样本信息。
获取待训练样本集以及待训练二分类模型,其中,所述待训练样本集包括多个待训练样本,具体地,收集待训练样本集,其中,所述待训练样本集中的各待训练样本均有其对应的类别信息,所述类型信息为所述待训练样本对应的真实标签信息。
步骤A20,根据各所述样本特征信息对应的类别信息,将各所述待训练样本划分为多类别样本和少类别样本;
在本实施例中,需要说明的是,所述类别信息为各所述待训练样本对应的类别的标签。
根据各所述样本特征信息对应的类别信息,将各所述待训练样本划分为多类别样本和少类别样本,具体地,根据各所述样本特征信息对应的类别信息,分别统计各所述待训练样本对应的类别的数量,将类别数量多的待训练样本划分为所述多类别样本,并将所述类别数量少的各待训练样本划分为所述少类别样本。
其中,所述根据各所述样本特征信息对应的类别信息,将各所述待训练样本划分为多类别样本和少类别样本的步骤包括:
步骤A21,根据各所述样本特征信息对应的类别信息,统计各所述待训练样本对应的类别数量;
在本实施例中,需要说明的是,每一所述待训练样本对应一类别。
步骤A22,基于所述类别数量,将各所述待训练样本按照预设划分规则进行划分,获得所述多类别样本和所述少类别样本。
在本实施例中,需要说明的是,所述预设划分规则为根据数量比例将各所述待训练样本进行划分的规则。
将所述类别数量多的各待训练样本划分为所述多类别样本,并将所述类别数量少的各待训练样本划分为所述少类别样本,具体地,将所述类别数量多的各待训练样本划分为所述多类别样本,并将所述类别数量少的各待训练样本划分为所述少类别样本,例如,各待训练样本包括A类信息、B类信息和C类信息,其中,A类信息的数量为10,B类信息的数量为10,C类信息的数量为80,则将所述A类信息和B类信息共同作为所述少类别样本,将所述C类特征信息作为所述多类别样本。
步骤A30,分别对所述多类别样本和所述少类别样本进行标记,获得多类别样本标签和类别样本标签;
在本实施例中,分别对所述多类别样本和所述少类别样本进行标记,获得多类别样本标签和类别样本标签,具体地,对所述多类别样本和所述少类别样本进行标记,获得多类别样本标签和类别样本标签,例如,将所述多类别样本标记为1,将所述少类别样本标记为0。
步骤A40,通过所述待训练样本集、所述多类别样本标签和所述少类别样本标签对所述待训练二分类模型进行迭代训练优化,获得所述第一分类模型,并输出训练预测结果。
在本实施例中,通过所述待训练样本集、所述多类别样本标签和所述少类别样本标签对所述待训练二分类模型进行迭代训练优化,获得所述第一分类模型,并输出训练预测结果,具体地,将所述待训练样本集输入所述待训练二分类模型,以迭代优化所述待训练二分类模型,并判断优化后的待训练二分类模型是否满足预设训练结束条件,其中,所述预设训练结束条件包括损失函数收敛和达到最大迭代次数阈值等条件,若满足,则获得所述第一分类模型,并输出训练预测结果,若不满足,则返回执行步骤:通过所述待训练样本集、所述多类别样本标签和所述少类别样本标签对所述待训练二分类模型进行迭代训练优化。
本申请实施例提供了一种模型链回归预测方法,也即,获取待训练样本集以及待训练二分类模型,其中,所述待训练样本集包括多个待训练样本,根据各所述样本特征信息对应的类别信息,将各所述待训练样本划分为多类别样本和少类别样本,分别对所述多类别样本和少类别样本进行标记,获得多类别样本标签和类别样本标签,通过所述待训练样本集、所述多类别样本标签和所述少类别样本标签对所述待训练二分类模型进行迭代训练优化,获得所述第一分类模型,并输出训练预测结果,实现了通过将待训练样本集划分为多类别样本和少类别样本,通过所述待训练二分类模型输出多类别样本和少类别样本分别对应的概率,以根据多类别样本和少类别样本分别对应的概率加入到后续的模型预测中,提高模型多分类结果的分类准确性,为克服现有技术中通过增加少类样本在训练集中的比例或者增加少类样本在训练过程中的权重以降低模型预测分类误差,然而,样本比例和样本权重难以把控,进而导致模型预测准确性较低的技术缺陷奠定了基础。
进一步地,参照图3,基于本申请中第二实施例,在本申请的另一实施例中,在所述将所述待训练样本集、多类别样本标签和少类别样本标签对所述待训练二分类模型进行迭代训练优化,获得所述第一分类模型,并输出训练预测结果的步骤之后,所述模型链回归预测方法还包括:
步骤B10,获取待训练多分类模型;
步骤B20,将所述训练预测结果和所述待训练样本集进行合并,获得待训练融合特征集;
在本实施例中,将所述训练预测结果和所述待训练样本集进行合并,获得待训练融合特征集,具体地,根据所述第一分类模型输出的训练预测结果,其中,所述训练预测结果包括所述多类别样本对应的概率和所述少类别对应的概率,通过将所述训练预测结果加入到所述待训练样本集中,获得所述待训练融合特征集,通过在所述待训练样本集的基础上添加了多类别样本对应的概率的有效信息,以提高模型对少类别样本的分类准确率。
步骤B30,按照预设分类规则对各所述待训练样本进行多分类,获得各所述待训练样本的分类标签;
在本实施例中,需要说明的是,所述预设分类规则为根据各待训练样本对应类别信息的数量或根据该类别信息对应的各样本所占全部待训练样本的比例进行分类。
按照预设分类规则对各所述待训练样本进行多分类,获得各所述待训练样本的分类标签,具体地,根据各所述待训练样本对应的类型信息,对各所述待训练样本进行多分类,获得各所述待训练样本的分类标签,例如,各待训练样本包括A类信息、B类信息、C类信息和D类信息,其中,A类信息的数量为10,B类信息的数量为10,C类信息的数量为30,D类信息的数量为80,那么A类信息和B类信息对应的分类标签为0,C类特征信息对应的分类标签为1、D类特征信息对应的分类标签为2。
步骤B40,根据所述待训练融合特征集和各所述待训练样本对应的分类标签,对所述待训练多分类模型进行迭代训练优化,获得第二分类模型,并输出训练多分类预测结果。
在本实施例中,根据所述待训练融合特征集和各所述待训练样本对应的分类标签,对所述待训练多分类模型进行迭代训练优化,获得第二分类模型,并输出训练多分类预测结果,具体地,通过所述待训练融合特征集和各所述待训练样本对应的分类标签对所述待训练多分类模型进行迭代训练,以优化所述待训练多分类模型,并判断优化后的待训练多分类模型是否满足预设训练结束条件,若满足,则获得所述第二分类模型,并输出训练多分类预测结果,若不满足,则返回执行步骤:根据所述待训练融合特征集和各所述待训练样本对应的分类标签,对所述待训练多分类模型进行迭代训练优化,获得第二分类模型。
其中,所述根据所述待训练融合特征集和各所述待训练样本对应的分类标签,对所述待训练多分类模型进行迭代训练优化,获得第二分类模型的步骤包括:
步骤B31,将所述融合特征集输入所述待训练多分类模型,输出多分类预测结果;
在本实施例中,将所述融合特征集输入所述待训练多分类模型,输出多分类预测结果,具体地,通过所述待训练多分类模型对所述融合特征集进行预测,获得所述多分类预测结果。
步骤B32,根据各所述待训练样本对应的分类标签和所述多分类预测结果,确定分类模型损失;
在本实施例中,根据各所述待训练样本对应的分类标签和所述多分类预测结果,确定分类模型损失,具体地,基于各所述待训练样本对应的分类标签与所述多分类预测结果之间的差异度,通过预设损失函数计算所述分类模型损失。
步骤B33,基于所述分类模型损失计算的梯度,对所述待训练多分类模型进行迭代训练优化,获得所述第二分类模型。
在本实施例中,基于所述分类模型损失计算的梯度,对所述待训练多分类模型进行迭代训练优化,获得所述第二分类模型,具体地,基于所述分类模型损失计算的梯度,对所述待训练多分类模型进行迭代训练,以优化所述待训练多分类模型,并判断优化后的待训练多分类模型是否满足预设训练结束条件,若满足,则将所述待训练多分类模型作为所述第二分类模型,若不满足,则返回执行步骤:根据所述待训练融合特征集和各所述待训练样本标注的类别信息,对所述待训练多分类模型进行迭代训练优化。
本申请实施例提供了一种模型链回归预测方法,也即,获取待训练多分类模型,进而将所述训练预测结果和所述待训练样本集进行合并,获得待训练融合特征集,进一步地,按照预设分类规则对各所述待训练样本进行多分类,获得各所述待训练样本的分类标签,进而根据所述待训练融合特征集和各所述待训练样本对应的分类标签,对所述待训练多分类模型进行迭代训练优化,获得第二分类模型,并输出训练多分类预测结果,实现了通过在所述待训练样本集的基础上加上所述第一分类模型输出的二分类结果等有效信息,且所述第一分类模型输出的二分类结果和所述待训练多分类模型的输出不存在强相关而导致出现单特征过强和模型过拟合的情况,以使得迭代训练得到的第二分类模型进行分类的准确率更高,为克服现有技术中通过增加少类样本在训练集中的比例或者增加少类样本在训练过程中的权重以降低模型预测分类误差,然而,样本比例和样本权重难以把控,进而导致模型预测准确性较低的技术缺陷奠定了基础。
进一步地,参照图4,在本申请的另一实施例中,在所述根据所述待训练融合特征集和各所述待训练样本对应的分类标签,对所述待训练多分类模型进行迭代训练优化,获得第二分类模型,并输出训练多分类预测结果的步骤之后,所述模型链回归预测方法还包括:
步骤C10,获取待训练回归模型;
步骤C20,将所述训练多分类预测结果和所述待训练样本集进行合并,获得待训练回归特征集;
在本实施例,将所述训练多分类预测结果和所述待训练样本集进行合并,获得待训练回归特征集,具体地,将训练完成第二分类模型输出的训练多分类预测结果和所述待训练样本集进行合并,获得待训练回归特征集,以使得待训练回归模型能够学习到多分类模型的预测结果信息
步骤C30,基于所述待训练回归特征集和各所述待训练样本分别对应的类别信息,对所述待训练回归模型进行迭代训练,获得所述回归模型。
在本实施例中,基于所述待训练回归特征集和各所述待训练样本分别对应的类别信息,对所述待训练回归模型进行迭代训练,获得所述回归模型,具体地,将所述待训练回归特征集输入所述待训练回归模型,输出各所述待训练样本对应的训练回归预测结果,基于各所述待训练样本对应的类别信息与所述训练回归预测结果之间的差异度,通过预设损失函数计算所述回归损失,基于所述回归损失计算的梯度,对所述待训练回归模型进行迭代训练,以优化所述待训练回归模型,并判断优化后的待训练回归模型是否满足预设训练结束条件,若满足,则获得所述回归模型,若不满足,则返回执行步骤:基于所述待训练回归特征集和各所述待训练样本分别对应的类别信息,对所述待训练回归模型进行迭代训练,获得所述回归模型。
参照图5,图5是本申请实施例方案涉及的硬件运行环境的模型链回归预测设备结构示意图。
如图5所示,该模型链回归预测设备可以包括:处理器1001,例如CPU,存储器1005,通信总线1002。其中,通信总线1002用于实现处理器1001和存储器1005之间的连接通信。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储设备。
可选地,该模型链回归预测设备还可以包括矩形用户接口、网络接口、相机、RF(Radio Frequency,射频)电路,传感器、音频电路、WiFi模块等等。矩形用户接口可以包括显示屏(Display)、输入子模块比如键盘(Keyboard),可选矩形用户接口还可以包括标准的有线接口、无线接口。网络接口可选的可包括标准的有线接口、无线接口(如WIFI接口)。
本领域技术人员可以理解,图5中示出的模型链回归预测设备结构并不构成对模型链回归预测设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图5所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块以及模型链回归预测程序。操作系统是管理和控制模型链回归预测设备硬件和软件资源的程序,支持模型链回归预测程序以及其它软件和/或,程序的运行。网络通信模块用于实现存储器1005内部各组件之间的通信,以及与模型链回归预测系统中其它硬件和软件之间通信。
在图5所示的模型链回归预测设备中,处理器1001用于执行存储器1005中存储的模型链回归预测程序,实现上述任一项所述的模型链回归预测方法的步骤。
本申请模型链回归预测设备具体实施方式与上述模型链回归预测方法各实施例基本相同,在此不再赘述。
本申请还提供一种模型链回归预测装置,所述模型链回归预测装置包括:
获取模块,用于获取待预测样本;
第一预测模块,用于通过第一分类模型对所述待预测样本进行二分类预测,获得中间预测结果,其中,所述第一分类模型是基于预设类别划分的待训练样本集进行迭代训练得到的;
分类模块,用于基于所述中间预测结果和所述待预测样本,通过第二分类模型对所述待预测样本进行分类,获得目标分类结果。
第二预测模块,用于基于所述目标分类结果和所述待预测样本,通过回归模型对所述待预测样本进行预测,获得目标预测结果。
可选地,所述分类模块还用于:
将所述中间预测结果和所述待预测样本进行合并,获得融合特征信息;
将所述融合特征信息输入所述第二分类模型,输出所述目标分类结果。
可选地,所述模型链回归预测装置还用于:
获取待训练样本集以及待训练二分类模型,其中,所述待训练样本集包括多个待训练样本;
根据各所述样本特征信息对应的类别信息,将各所述待训练样本划分为多类别样本和少类别样本;
分别对所述多类别样本和所述少类别样本进行标记,获得多类别样本标签和类别样本标签;
通过所述待训练样本集、所述多类别样本标签和所述少类别样本标签对所述待训练二分类模型进行迭代训练优化,获得所述第一分类模型,并输出训练预测结果。
可选地,所述模型链回归预测装置还用于:
统计各所述待训练样本分别对应的类别数量;
基于所述类别数量,将各所述待训练样本按照预设划分规则进行划分,获得所述多类别样本和所述少类别样本。
可选地,所述模型链回归预测装置还用于:
获取待训练多分类模型;
将所述训练预测结果和所述待训练样本集进行合并,获得待训练融合特征集;
按照预设分类规则对各所述待训练样本进行多分类,获得各所述待训练样本的分类标签;
根据所述待训练融合特征集和各所述待训练样本对应的分类标签,对所述待训练多分类模型进行迭代训练优化,获得第二分类模型,并输出训练多分类预测结果。
可选地,所述模型链回归预测装置还用于:
将所述融合特征集输入所述待训练多分类模型,输出多分类预测结果;
根据各所述待训练样本对应的分类标签和所述多分类预测结果,确定分类模型损失;
基于所述分类模型损失计算的梯度,对所述待训练多分类模型进行迭代训练优化,获得所述第二分类模型。
可选地,所述模型链回归预测装置还用于:
获取待训练回归模型;
将所述训练多分类预测结果和所述待训练样本集进行合并,获得待训练回归特征集;
基于所述待训练回归特征集和各所述待训练样本分别对应的类别信息,对所述待训练回归模型进行迭代训练,获得所述回归模型。
本申请模型链回归预测装置的具体实施方式与上述模型链回归预测方法各实施例基本相同,在此不再赘述。
本申请实施例提供了一种计算机存储介质,且所述计算机存储介质存储有一个或者一个以上程序,所述一个或者一个以上程序还可被一个或者一个以上的处理器执行以用于实现上述任一项所述的模型链回归预测方法的步骤。
本申请可读存储介质具体实施方式与上述模型链回归预测方法各实施例基本相同,在此不再赘述。
本申请实施例提供了一种计算机程序产品,且所述计算机程序产品包括有一个或者一个以上计算机程序,所述一个或者一个以上计算机程序还可被一个或者一个以上的处理器执行以用于实现上述任一项所述的模型链回归预测方法的步骤。
本申请计算机程序产品具体实施方式与上述模型链回归预测方法各实施例基本相同,在此不再赘述。
以上仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利处理范围内。

Claims (10)

1.一种模型链回归预测方法,其特征在于,所述模型链回归预测方法包括:
获取待预测样本;
通过第一分类模型对所述待预测样本进行二分类预测,获得中间预测结果,其中,所述第一分类模型是基于预设类别划分的待训练样本集进行迭代训练得到的;
基于所述中间预测结果和所述待预测样本,通过第二分类模型对所述待预测样本进行分类,获得目标分类结果;
基于所述目标分类结果和所述待预测样本,通过回归模型对所述待预测样本进行预测,获得目标预测结果。
2.如权利要求1所述模型链回归预测方法,其特征在于,所述基于所述预测结果和所述待预测样本,通过第二分类模型对所述待预测样本进行分类,获得目标分类结果的步骤包括:
将所述中间预测结果和所述待预测样本进行合并,获得融合特征信息;
将所述融合特征信息输入所述第二分类模型,输出所述目标分类结果。
3.如权利要求1所述模型链回归预测方法,其特征在于,在所述通过第一分类模型对所述待预测样本进行二分类预测,获得中间预测结果,其中,所述第一分类模型是基于预设类别划分的待训练样本集进行迭代训练得到的步骤之前,所述模型链回归预测方法还包括:
获取待训练样本集以及待训练二分类模型,其中,所述待训练样本集包括多个待训练样本;
根据各所述样本特征信息对应的类别信息,将各所述待训练样本划分为多类别样本和少类别样本;
分别对所述多类别样本和所述少类别样本进行标记,获得多类别样本标签和类别样本标签;
通过所述待训练样本集、所述多类别样本标签和所述少类别样本标签对所述待训练二分类模型进行迭代训练优化,获得所述第一分类模型,并输出训练预测结果。
4.如权利要求3所述模型链回归预测方法,其特征在于,所述根据各所述样本特征信息对应的类别信息,将各所述待训练样本划分为多类别样本和少类别样本的步骤包括:
根据各所述样本特征信息对应的类别信息,统计各所述待训练样本分别对应的类别数量;
基于所述类别数量,将各所述待训练样本按照预设划分规则进行划分,获得所述多类别样本和所述少类别样本。
5.如权利要求3所述模型链回归预测方法,其特征在于,在所述将所述待训练样本集、多类别样本标签和少类别样本标签对所述待训练二分类模型进行迭代训练优化,获得所述第一分类模型,并输出训练预测结果的步骤之后,所述模型链回归预测方法还包括:
获取待训练多分类模型;
将所述训练预测结果和所述待训练样本集进行合并,获得待训练融合特征集;
按照预设分类规则对各所述待训练样本进行多分类,获得各所述待训练样本的分类标签;
根据所述待训练融合特征集和各所述待训练样本对应的分类标签,对所述待训练多分类模型进行迭代训练优化,获得第二分类模型,并输出训练多分类预测结果。
6.如权利要求5所述模型链回归预测方法,其特征在于,所述根据所述待训练融合特征集和各所述待训练样本对应的分类标签,对所述待训练多分类模型进行迭代训练优化,获得第二分类模型的步骤包括:
将所述融合特征集输入所述待训练多分类模型,输出多分类预测结果;
根据各所述待训练样本对应的分类标签和所述多分类预测结果,确定分类模型损失;
基于所述分类模型损失计算的梯度,对所述待训练多分类模型进行迭代训练优化,获得所述第二分类模型。
7.如权利要求5所述模型链回归预测方法,其特征在于,在所述根据所述待训练融合特征集和各所述待训练样本对应的分类标签,对所述待训练多分类模型进行迭代训练优化,获得第二分类模型,并输出训练多分类预测结果的步骤之后,所述模型链回归预测方法还包括:
获取待训练回归模型;
将所述训练多分类预测结果和所述待训练样本集进行合并,获得待训练回归特征集;
基于所述待训练回归特征集和各所述待训练样本分别对应的类别信息,对所述待训练回归模型进行迭代训练,获得所述回归模型。
8.一种模型链回归预测装置,其特征在于,所述模型链回归预测装置包括:
获取模块,用于获取待预测样本;
第一预测模块,用于通过第一分类模型对所述待预测样本进行二分类预测,获得中间预测结果,其中,所述第一分类模型是基于预设类别划分的待训练样本集进行迭代训练得到的;
分类模块,用于基于所述中间预测结果和所述待预测样本,通过第二分类模型对所述待预测样本进行分类,获得目标分类结果;
第二预测模块,用于基于所述目标分类结果和所述待预测样本,通过回归模型对所述待预测样本进行预测,获得目标预测结果。
9.一种模型链回归预测设备,其特征在于,所述模型链回归预测设备包括:存储器、处理器以及存储在存储器上的模型链回归预测程序,
所述模型链回归预测程序被所述处理器执行实现如权利要求1至7中任一项所述模型链回归预测方法的步骤。
10.一种计算机存储介质,其特征在于,所述计算机存储介质上存储有模型链回归预测程序,所述模型链回归预测程序被处理器执行实现如权利要求1至7中任一项所述模型链回归预测方法的步骤。
CN202111225136.9A 2021-10-21 2021-10-21 模型链回归预测方法、装置、设备及计算机存储介质 Pending CN113887655A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111225136.9A CN113887655A (zh) 2021-10-21 2021-10-21 模型链回归预测方法、装置、设备及计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111225136.9A CN113887655A (zh) 2021-10-21 2021-10-21 模型链回归预测方法、装置、设备及计算机存储介质

Publications (1)

Publication Number Publication Date
CN113887655A true CN113887655A (zh) 2022-01-04

Family

ID=79003991

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111225136.9A Pending CN113887655A (zh) 2021-10-21 2021-10-21 模型链回归预测方法、装置、设备及计算机存储介质

Country Status (1)

Country Link
CN (1) CN113887655A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114706986A (zh) * 2022-06-02 2022-07-05 苏州大学 一种多类别情感分类方法、装置以及计算机存储介质
CN117828356A (zh) * 2024-03-01 2024-04-05 天津师范大学 一项二元协同的数据平衡优化方法、系统及存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114706986A (zh) * 2022-06-02 2022-07-05 苏州大学 一种多类别情感分类方法、装置以及计算机存储介质
CN117828356A (zh) * 2024-03-01 2024-04-05 天津师范大学 一项二元协同的数据平衡优化方法、系统及存储介质
CN117828356B (zh) * 2024-03-01 2024-05-28 天津师范大学 一项二元协同的数据平衡优化方法、系统及存储介质

Similar Documents

Publication Publication Date Title
CN111160469B (zh) 一种目标检测系统的主动学习方法
CN108197652B (zh) 用于生成信息的方法和装置
CN109145828B (zh) 用于生成视频类别检测模型的方法和装置
CN109961032B (zh) 用于生成分类模型的方法和装置
CN103248705B (zh) 服务器、客户端及视频处理方法
CN113887655A (zh) 模型链回归预测方法、装置、设备及计算机存储介质
US9269055B2 (en) Data classifier using proximity graphs, edge weights, and propagation labels
CN109377508B (zh) 图像处理方法和装置
CN112905902A (zh) 面向云计算和人工智能的会话意图提取方法及系统
CN111368636A (zh) 目标分类方法、装置、计算机设备和存储介质
CN112966754B (zh) 样本筛选方法、样本筛选装置及终端设备
CN112785002A (zh) 模型构建优化方法、设备、介质及计算机程序产品
CN113378067B (zh) 基于用户挖掘的消息推荐方法、设备、介质
CN111784401A (zh) 下单率预测方法、装置、设备及可读存储介质
CN116823793A (zh) 设备缺陷检测方法、装置、电子设备和可读存储介质
CN112766402A (zh) 算法选择方法、装置和电子设备
CN111143678B (zh) 推荐系统和推荐方法
CN113140012A (zh) 图像处理方法、装置、介质及电子设备
CN111768247A (zh) 下单率预测方法、设备及可读存储介质
CN115905450A (zh) 一种基于无人机监控的水质异常溯源方法及系统
CN112801489B (zh) 诉讼案件风险检测方法、装置、设备和可读存储介质
CN113763077B (zh) 用于检测虚假交易订单的方法和装置
CN113052635A (zh) 人口属性标签预测方法、系统、计算机设备和存储介质
CN112633414A (zh) 特征选择优化方法、设备和可读存储介质
CN117455036A (zh) 多场景的任务分派方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination