分类预测方法及装置、预测模型训练方法及装置
技术领域
本公开通常涉及计算机技术领域,具体地,涉及基于预测模型来进行分类预测的方法及装置、基于预测模型来进行异常交易预测的方法及装置、用于训练预测模型的方法及装置。
背景技术
随着人工智能和机器学习技术的普及和发展,越来越多的公司开始尝试利用机器学习技术来解决业务问题,机器学习技术被普遍应用于各种任务。以分类模型为例,在诸如用户画像、异常用户发现、异常交易挖掘等任务中有着广泛的应用。与此同时,大量的数据能够被收集,为机器学习技术的使用、提升机器学习模型的性能创造了条件。
以异常交易挖掘为例,为了提高学习得到的机器学习模型在异常交易挖掘任务上的表现,目前主要有两种主要的方式。一种方式是收集更多的数据,充分利用大数据带来的收益,使得到的模型性能提升。这意味着需要更多地存储开销,更高的资源消耗和更长的训练时间。另一种方式则是提高模型的复杂度,以随机森林(random forest)或梯度提升决策树(GBDT)等模型举例,常用的办法就是增加模型中的树的数量,这也同样会带来更多的资源消耗和更长的训练时间。此外,以上的方法能够为机器学习模型带来的性能提升非常有限。
发明内容
鉴于上述,本公开提供了一种基于预测模型来进行分类预测的方法及装置、基于预测模型来进行异常交易预测的方法及装置、用于训练预测模型的方法及装置。本公开的基于预测模型来进行分类预测的方法及装置通过分阶段预测识别的方式,能够将不易于分类的预测数据利用另一预测子模型进行预测,从而能够提高分类预测的效率和准确度。本公开的用于训练预测模型的方法及装置通过将训练数据切分后训练不同阶段的预测子模型,从而能够训练出对应于不同分类预测难易程度的预测子模型,在提高预测模型的性能的同时,还能降低对预测模型的训练时间和开销。
根据本公开的一个方面,提供了一种基于预测模型来进行分类预测的方法,所述预测模型包括由至少两个预测子模型顺序级联组成的预测子模型链,所述方法包括:从所述预测子模型链中的第一预测子模型开始执行下述针对至少一个待预测样本的预测过程,直到满足预定条件:使用当前预测子模型来对当前待预测样本进行分类预测,以得到所述当前待预测样本中的各个待预测样本的预测分类结果以及对应的预测置信度;将所得到的预测置信度不低于预测置信度阈值的待预测样本的预测分类结果作为该当前预测子模型的预测分类结果输出;将所得到的预测置信度低于所述预测置信度阈值的待预测样本,作为下一预测子模型的当前待预测样本。
可选的,在一个示例中,在所述预测模型的训练过程中,所述预测子模型链中的各个预测子模型可以是利用从该预测子模型的前一预测子模型所使用的训练样本中切分出的所得到的预测分类结果的预测置信度低于所述预测置信度阈值的训练样本来训练的,其中,所得到的预测分类结果是由经过训练后的前一预测子模型对所述前一预测子模型所使用的训练样本进行预测而得出的。
可选的,在一个示例中,所述至少两个预测子模型可以包括两个预测子模型。
可选的,在一个示例中,各个预测子模型预测过程所使用的预测置信度阈值可以是与该预测子模型对应的预测置信度阈值。
可选的,在一个示例中,各个预测子模型预测过程所使用的预测置信度阈值可以是与该预测子模型的预测分类结果中的各个类别对应的预测置信度阈值。
可选的,在一个示例中,所述预测分类结果可以包括至少两个类别的预测分类结果,并且每种预测分类结果对应一个概率,以及待预测样本的预测置信度是所对应的预测子模型所输出的各种对应预测分类结果中的最大概率值。
可选的,在一个示例中,所述预测子模型可以包括下述模型中的至少一种:梯度提升决策树、随机森林模型和逻辑回归模型。
可选的,在一个示例中,所述预定条件可以包括:所得到的所有待预测样本的预测置信度都高于预测置信度阈值;或者所述预测子模型链中的所有预测子模型都完成了分类预测。
根据本公开的另一方面,还提供一种基于预测模型来进行异常交易预测的方法,所述预测模型包括由至少两个预测子模型顺序级联组成的预测子模型链,所述方法包括:从所述预测子模型链中的第一预测子模型开始执行下述针对至少一个待预测交易数据的预测过程,直到满足预定条件:使用当前预测子模型来对当前待预测交易数据进行异常交易预测,以得到所述当前待预测交易数据中的各个待预测交易数据的异常交易预测结果以及对应的预测置信度;将所得到的预测置信度不低于预测置信度阈值的当前待预测交易数据的异常交易预测结果作为该当前预测子模型的异常交易预测结果输出;将所得到的预测置信度低于所述预测置信度阈值的当前待预测交易数据,作为下一预测子模型的当前待预测交易数据。
根据本公开的另一方面,还提供一种用于训练预测模型的方法,所述预测模型包括由至少两个预测子模型顺序级联组成的预测子模型链,所述方法包括:从所述预测子模型链中的第一预测子模型开始执行下述模型训练过程,直到满足预定条件:使用当前训练样本来对当前预测子模型进行训练;使用经过训练后的当前预测子模型来对所述当前训练样本进行预测,以得到所述当前训练样本中的各个训练样本的预测分类结果以及对应的预测置信度;以及将所得到的预测置信度低于预测置信度阈值的训练样本,作为下一预测子模型训练的当前训练样本。
可选的,在一个示例中,各个预测子模型预测过程所使用的预测置信度阈值可以是与该预测子模型对应的预测置信度阈值。
可选的,在一个示例中,各个预测子模型预测过程所使用的预测置信度阈值可以是与该预测子模型的预测分类结果中的各个类别对应的预测置信度阈值。
可选的,在一个示例中,所述预定条件可以包括:所得到的所有训练样本的预测置信度都高于预测置信度阈值;或者所述预测子模型链中的所有预测子模型都完成了训练。
根据本公开的另一方面,还提供一种用于基于预测模型来进行分类预测的装置,所述预测模型包括由至少两个预测子模型顺序级联组成的预测子模型链,所述装置包括:预测单元,被配置为使用当前预测子模型对当前待预测样本进行分类预测,以得到所述当前待预测样本中的各个待预测样本的预测分类结果以及对应的预测置信度;预测结果输出单元,被配置为将所得到的预测置信度不低于预测置信度阈值的待预测样本的预测分类结果作为该当前预测子模型的预测分类结果以进行输出;以及当前待预测样本确定单元,被配置为将所得到的预测置信度低于所述预测置信度阈值的待预测样本,作为下一预测子模型的当前待预测样本。其中,所述预测单元、所述预测结果输出单元以及所述当前待预测样本确定单元被配置为从所述预测子模型链中的第一预测子模型开始循环执行针对至少一个待预测样本的预测操作,直到满足预定条件。
可选的,在一个示例中,在所述预测模型的训练过程中,所述预测子模型链中的各个预测子模型可以是利用从该预测子模型的前一预测子模型所使用的训练样本中切分出的所得到的预测分类结果的预测置信度低于所述预测置信度阈值的训练样本来训练的。其中,所得到的预测分类结果是由经过训练后的前一预测子模型对所述前一预测子模型所使用的训练样本进行预测而得出的。
可选的,在一个示例中,各个预测子模型预测过程所使用的预测置信度阈值可以是与该预测子模型对应的预测置信度阈值。
可选的,在一个示例中,各个预测子模型预测过程所使用的预测置信度阈值可以是与该预测子模型的预测分类结果中的各个类别对应的预测置信度阈值。
根据本公开的另一方面,还提供一种用于基于预测模型来进行异常交易预测的装置,所述预测模型包括由至少两个预测子模型顺序级联组成的预测子模型链,所述装置包括:预测单元,被配置为使用当前预测子模型对当前待预测交易数据进行异常交易预测,以得到所述当前待预测交易数据中的各个待预测交易数据的异常交易预测结果以及对应的预测置信度;预测结果输出单元,被配置为将所得到的预测置信度不低于预测置信度阈值的当前待预测交易数据的异常交易预测结果作为该当前预测子模型的异常交易预测结果输出;以及当前待预测交易数据确定单元,被配置为将所得到的预测置信度低于所述预测置信度阈值的当前待预测交易数据,作为下一预测子模型的当前待预测交易数据。其中,所述预测单元、所述预测结果输出单元以及所述当前待预测交易数据确定单元被配置为从所述预测子模型链中的第一预测子模型开始循环执行针对至少一个待预测交易数据的预测操作,直到满足预定条件。
根据本公开的另一方面,还提供一种用于训练预测模型的装置,所述预测模型包括由至少两个预测子模型顺序级联组成的预测子模型链,所述装置包括:训练单元,被配置为使用当前训练样本来对当前预测子模型进行训练;预测单元,被配置为使用经过训练后的当前预测子模型对所述当前训练样本进行预测,以得到所述当前训练样本中的各个训练样本的预测分类结果以及对应的预测置信度;以及当前训练样本获取单元,被配置为将所得到的预测置信度低于预测置信度阈值的训练样本,作为下一预测子模型训练的当前训练样本。其中,从所述预测子模型链中的第一预测子模型开始循环执行所述训练单元,所述预测单元和所述当前训练样本获取单元的操作,直到满足预定条件。
根据本公开的另一方面,还提供一种计算设备,包括:至少一个处理器,存储器,所述存储器存储指令,当所述指令被所述至少一个处理器执行时,使得所述至少一个处理器执行如上所述的基于预测模型来进行分类预测的方法。
根据本公开的另一方面,还提供一种非暂时性机器可读存储介质,其存储有可执行指令,所述指令当被执行时使得所述机器执行如上所述的基于预测模型来进行分类预测的方法。
根据本公开的另一方面,还提供一种计算设备,包括:至少一个处理器,存储器,所述存储器存储指令,当所述指令被所述至少一个处理器执行时,使得所述至少一个处理器执行如上所述的异常交易预测方法。
根据本公开的另一方面,还提供一种非暂时性机器可读存储介质,其存储有可执行指令,所述指令当被执行时使得所述机器执行如上所述的异常交易预测方法。
根据本公开的另一方面,还提供一种计算设备,包括:至少一个处理器,存储器,所述存储器存储指令,当所述指令被所述至少一个处理器执行时,使得所述至少一个处理器执行如上所述的用于训练预测模型的方法。
根据本公开的另一方面,还提供一种非暂时性机器可读存储介质,其存储有可执行指令,所述指令当被执行时使得所述机器执行如上所述的用于训练预测模型的方法。
利用本公开的方法和装置,通过将当前预测子模型对当前待预测样本的分类预测结果中预测置信度低于预测置信度阈值的待预测样本切分出来,以输入下一预测子模型进行分类预测,从而能够通过分阶段分类预测的方式,将不易于分类的预测样本利用另一预测子模型进行分类预测,进而能够提高分类预测的效率和准确度。此外,通过配置包括至少两个预测子模型的预测模型,能够对预测模型进行分阶段训练,从而在提高预测模型的性能的同时,还能够降低对预测模型的训练时间和开销。
利用本公开的方法和装置,在预测模型的训练过程中,从前一预测子模型所使用的训练样本中切分出预测分类结果中的预测置信度低于预测置信度阈值的训练样本,以作为下一预测子模型的训练样本,从而通过分阶段训练的方式,训练出对应于不同分类难易程度的预测样本的预测子模型。由此,不仅能降低训练时间和开销,还能提高预测模型的整体性能。
利用本公开的方法和装置,通过将预测模型配置为包括两个预测子模型,能够实现收益和开销之间的平衡的预测模型,利用该预测模型来对待预测数据进行分类预测时,或对该预测模型进行训练时,能够减少不必要的开销并节省训练或分类预测所花费的时间。
利用本公开的方法和装置,通过为每个预测子模型的分类预测结果中的每个类别或为每个预测子模型设置对应的预测置信度阈值,从而在利用预测模型进行分类预测时能够提高分类预测的精确度,在对预测模型进行训练时,能够训练出高性能的预测模型。
附图说明
通过参照下面的附图,可以实现对于本公开内容的本质和优点的进一步理解。在附图中,类似组件或特征可以具有相同的附图标记。附图是用来提供对本发明实施例的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本公开的实施例,但并不构成对本公开的实施例的限制。在附图中:
图1示出了本公开的实施例中采用的预测模型的一个示例的示意图;
图2示出了根据本公开的一个实施例的用于训练预测模型的方法的流程图;
图3示出了根据本公开的另一实施例的用于训练预测模型的方法的流程图;
图4示出了根据本公开的一个实施例的基于预测模型来进行分类预测的方法的流程图;
图5示出了根据本公开的另一实施例的基于预测模型来进行分类预测的方法的流程图;
图6示出了根据本公开的一个实施例的基于预测模型来进行异常交易预测的方法的流程图;
图7示出了根据本公开的一个实施例的用于训练预测模型的装置的结构框图;
图8示出了根据本公开的一个实施例的基于预测模型来进行分类预测的装置的结构框图;
图9示出了根据本公开的一个实施例的基于预测模型来进行异常交易预测的装置的结构框图;
图10示出了根据本公开的一个实施例的用于实现用于训练预测模型的方法的计算设备的结构框图;
图11示出了根据本公开的一个实施例的用于实现基于预测模型来进行分类预测的方法的计算设备的结构框图;
图12示出了根据本公开的一个实施例的用于实现基于预测模型来进行异常交易预测的方法的计算设备的结构框图。
具体实施方式
以下将参考示例实施方式讨论本文描述的主题。应该理解,讨论这些实施方式只是为了使得本领域技术人员能够更好地理解从而实现本文描述的主题,并非是对权利要求书中所阐述的保护范围、适用性或者示例的限制。可以在不脱离本公开内容的保护范围的情况下,对所讨论的元素的功能和排列进行改变。各个示例可以根据需要,省略、替代或者添加各种过程或组件。另外,相对一些示例所描述的特征在其它例子中也可以进行组合。
如本文中使用的,术语“包括”及其变型表示开放的术语,含义是“包括但不限于”。术语“基于”表示“至少部分地基于”。术语“一个实施例”和“一实施例”表示“至少一个实施例”。术语“另一个实施例”表示“至少一个其他实施例”。术语“第一”、“第二”等可以指代不同的或相同的对象。下面可以包括其他的定义,无论是明确的还是隐含的。除非上下文中明确地指明,否则一个术语的定义在整个说明书中是一致的。
现在结合附图来描述本公开的基于预测模型来进行分类预测的方法及装置、用于训练预测模型的方法及装置和基于预测模型来进行异常交易预测的方法及装置。
图1示出了本公开的实施例中采用的预测模型的一个示例的示意图。如图1所示,本公开的实施例所采用的预测模型包括由至少两个预测子模型组成的预测子模型链,即包括由第一预测子模型、第二预测子模型至第N预测子模型顺序级联组成的预测子模型链,即,第一预测子模型与第二预测子模型相连,第二预测子模型与第三预测子模型相连,如此循环,直到第N预测子模型。预测模型中的预测子模型的数量可以是两个以上的任意数量。各个预测子模型可以是选自于梯度提升决策树(GDBT)、随机森林模型RF和逻辑回归模型的任意一种。此外,在预测模型中的所有预测子模型可以采用同样的模型实现,也可以采用不同的模型来实现。
图2示出了根据本公开的一个实施例的用于训练预测模型的方法的流程图。
在对如图1所示的预测模型进行训练的过程中,从预测子模型链中的第一预测子模型开始执行包括块210至块260的模型训练过程,直到满足预定条件。如图2所示,在块210,使用当前训练样本来对当前预测子模型进行训练。
在对当前预测子模型进行训练后,在块220,使用经过训练后的当前预测子模型来对当前训练样本进行分类预测,以得到当前训练样本中的各个当前训练样本的预测分类结果以及对应的预测置信度。即,将当前训练样本作为待预测样本,使用经过训练后的当前预测子模型来对其进行分类预测。预测置信度表示被训练后的预测子模型对待预测样本的预测分类结果的可信程度。预测置信度高表明被训练后的预测子模型的预测分类结果是可信的,预测置信度低则表明被训练后的预测子模型的预测分类结果是不可信的。在本公开中,预测置信度通常使用概率来表示。
当前预测子模型所输出的预测分类结果可以包括两个类别的预测分类结果,也可以包括三个以上类别的预测分类结果。预测分类结果中还可以包括当前待预测样本属于各个类别的概率。每个当前待预测样本的预测置信度可以是该当前待预测样本属于各个类别的概率中的最大概率值。
确定预测分类结果的预测置信度之后,在块230,确定经过训练的当前预测子模型对当前训练样本的预测分类结果中的预测置信度是否存在不低于预测置信度阈值。
可以针对每个类别设置同样的预测置信度阈值。例如,以两个类别A、B为例,可以将类别A和类别B的预测置信度阈值均设置为90%。再例如,对于三个类别A、B、C的情形,可以将针对该三个类别的置信度阈值均设置为85%。在这种情形下,对于对应于各个类别的预测分类结果,使用相同的预测置信度阈值确定预测分类结果是否是可信的。
还可以针对不同的类别设置不同的预测置信度阈值。以三个类别A、B、C的情形为例,可以分别设置对应于这三个类别的置信度阈值,例如可以设置为对应于类别A的预测置信度阈值为80%、对应于类别B的预测置信度阈值为85%、对应于类别C的预测置信度阈值为90%。此时,如果当前待预测样本中的第一当前待预测样本(即本实施例中的第一当前训练样本)属于各个类别的概率中的概率最大值对应于类别A,则该第一当前待预测样本的预测置信度为其属于类别A的概率。如果该第一当前待预测样本的预测置信度不低于80%(即属于类别A的概率不低于80%),则可认为对该第一待预测样本的预测分类结果是可信的。如果对于被预测的当前待预测样本中的第二当前待预测样本(即本实施例中的第二当前训练样本),其属于各个类别的概率中属于类别B的概率值最大,则其属于类别B的概率为对该第二当前待预测样本的预测置信度。如果该预测置信度不低于85%,则可认为对该第二当前待预测样本的预测分类结果是可信的。
针对不同的类别设置不同的预测置信度阈值有利于提高对各个预测子模型的训练精度。此外,还可以针于每个预测子模型设置对应的预测置信度阈值。例如,可以以预测子模型的级联顺序依次降低针对各个预测子模型的预测置信度阈值。还可以针对每个预测子模型的预测分类结果的各个类别设置对应的预测置信度阈值。例如,可以以预测子模型的级联顺序依次降低针对各个预测子模型的预测分类结果对应于不同类别时的预测置信度阈值。
如果在当前预测子模型的预测分类结果中存在低于预测置信度阈值的预测置信度,则进一步在块240,确定预测模型中的所有预测子模型是否均已被训练。如果当前预测子模型的预测分类结果中的所有预测置信度均不低于预测置信度阈值,则可以结束训练过程。
如果在当前预测子模型的预测分类结果中存在低于预测置信度阈值的预测置信度,并且还存在没有被训练的预测子模型,则在块250,将所得到的预测置信度低于预测置信度阈值的训练样本,作为下一预测子模型训练的当前训练样本。以上述包括类别A、B、C的情形为例,对于第一当前待预测样本(即在该实施例中的第一当前训练样本),如果其预测分类结果的概率最大值(即属于类别A的预测置信度)低于80%,则第一当前待预测样本将被作为下一预测子模型的当前训练样本,以用于对下一预测子模型进行训练。对于第二当前待预测样本(即在该实施例中的第二当前训练样本),如果其预测分类结果的概率最大值低于85%,则第二当前待预测样本也将被切分出来以作为下一预测子模型的训练样本。
然后,在块260,将下一预测子模型作为当前预测子模型,进而再次执行上述过程。如果虽然存在低于置信度阈值的预测置信度,但是所有预测子模型均已被训练,则训练过程结束。
在将要利用预测模型进行分类预测的待预测样本中,会存在部分容易被分类的待预测样本和部分难以被分类的待预测样本。利用上述训练过程,能够使所训练的预测模型中的不同阶段的预测子模型对应于分类难易程度不同的待预测样本。由此,不仅能提高预测模型的整体性能,还能够缩短训练时间并节省训练开销。
图3示出了对包括两个预测子模型的预测模型进行训练的过程的示例。如图3所示,在对预测模型进行训练时,首先在310,将所有训练样本输入第一预测子模型,以对第一预测子模型进行训练。
当第一预测子模型被训练之后,在320,将所有训练样本作为待预测样本输入被训练后的第一预测子模型以进行分类预测,以获得第一预测子模型对所有训练样本的预测分类结果的预测置信度。
然后在330,基于所获得的预测置信度对训练样本进行切分,将预测置信度低于预测置信度阈值的训练样本从所有训练样本中切分出来。在切分之后,在340,利用切分出的训练样本(即第一预测子模型的预测分类结果中预测置信度低于预测置信度阈值的训练样本)来训练第二预测子模型。在对第二预测子模型进行训练之后,训练过程结束。
在另一示例中,如果还存在第三预测子模型,还可以将用于训练第二预测子模型的训练样本作为待预测样本输入被训练后的第二预测子模型中以进行分类预测,并继续对其预测分类结果中低于预测置信度阈值的训练样本进行切分,以用于训练第三预测子模型。
随着预测子模型数量的增加,训练时间和训练开销也会相应增加。而随着预测子模型的数量的增加,增加的训练时间和训练开销所带来模型性能收益会下降。因而从训练时间和训练开销与训练收益之间的平衡的角度考虑,可以只配置两个预测子模型。
上述实施例的训练过程中的训练样本可以包括交易数据样本。利用交易数据样本训练的预测模型可以用于异常交易预测。
图4示出了根据本公开的一个实施例的基于预测模型来进行分类预测的方法(以下称为分类预测方法)的流程图。
如图4所示,在利用预测模型进行分类预测时,可以从预测子模型链中的第一预测子模型开始执行块410至块460的针对至少一个待预测样本的分类预测过程,直到满足预定条件。预测模型可以是利用如上所述的预测模型训练方法来训练的。
如图4所示,在块410,使用当前预测子模型来对当前待预测样本进行分类预测,以得到当前待预测样本中的各个待预测样本的预测分类结果以及对应的预测置信度。
预测分类结果可以包括至少两个类别的预测分类结果,并且每种预测分类结果可以对应一个概率,待预测样本的预测置信度可以是所对应的预测子模型所输出的各个类别的预测分类结果中的最大概率值。
在块420,确定针对至少一个当前待预测样本中的各个当前待预测样本的预测分类结果中的预测置信度是否均不低于预测置信度阈值。如果当前预测子模型对所有当前待预测样本的预测置信度均不低于预测置信度阈值,则分类预测过程结束。此时,可以汇总到当前预测子模型为止的所有预测子模型的预测分类结果,以作为对所有待预测样本的预测分类结果输出。
各个预测子模型在预测过程中所使用预测置信度阈值可以与每个预测子模型的各个类别对应。例如,可以以预测子模型的级联顺序依次降低针对各个预测子模型的预测分类结果对应于不同类别时的置信度阈值。各个预测子模型在预测过程中所使用预测置信度阈值还可以与各个预测子模型对应。例如,可以以预测子模型的级联顺序依次降低针对各个预测子模型的置信度阈值。
如果各个当前待预测样本的预测分类结果中的预测置信度存在低于预测置信度阈值的预测分类结果,则在块430,将所得到的预测置信度不低于预测置信度阈值的待预测样本的预测分类结果作为该当前预测子模型的预测分类结果输出。
同时,如果各个当前待预测样本的预测分类结果中的预测置信度存在低于预测置信度阈值的预测分类结果,在块440,确定是否所有的预测子模型均已执行了分类预测。如果所有预测子模型均已执行分类预测,则分类预测过程结束。此时,无论当前预测子模型对当前待预测样本的预测置信度是否低于预测置信度阈值,均可把当前预测子模型对当前待预测样本的预测分类结果确定为预测模型对当前待预测样本的预测分类结果。然后,可以把所有预测子模型的预测分类结果汇总以作为对所有待预测样本的预测分类结果输出。
如果在各个当前待预测样本的预测分类结果中的存在低于预测置信度阈值的预测分类结果时,还存在没有执行分类预测的预测子模型,则在块450,将所得到的预测置信度低于预测置信度阈值的待预测样本,作为下一预测子模型的当前待预测样本。
然后在块460,将下一预测子模型作为当前预测子模型,并再次执行上述预测分类过程。
通过上述分类预测过程,能够利用针对不同分类预测难易程度的预测子模型来对分类预测难易程度不同的待预测样本进行分类预测,从而在进行分类预测时,在后的预测子模型仅针对难以分类预测的待预测样本进行分类预测。由此,不仅能提高预测分类结果的准确性,还能够节省分类预测的开销。
图5示出了根据一个实施例的基于包括两个预测子模型的预测模型的分类预测方法的流程图。
如图5所示,在510,将所有待预测样本输入第一预测子模型进行分类预测,以得到第一预测子模型对待预测样本的预测置信度。
然后在520,基于所得到的预测置信度,对待预测样本进行切分,将其中预测置信度低于预测置信度阈值的待预测样本切分出来。对于第一预测子模型的预测置信度不低于预测置信度阈值的待预测样本,将第一预测子模型的预测分类结果作为对该待预测样本的预测分类结果输出。
在对待预测样本进行切分之后,在530,将第一预测子模型的预测置信度低于预测置信度阈值的待预测样本输入第二预测子模型,从而利用第二预测子模型对该部分待预测样本进行再次分类预测。
在第二预测子模型执行完分类预测之后,由于两个预测子模型均已执行完分类预测,因而将第二预测子模型的预测分类结果作为由其分类预测的待预测样本的预测分类结果。进而在540,汇总第一预测子模型和第二预测子模型的预测分类结果,以作为预测模型对所有待预测样本的预测分类结果输出。
在另一示例中,如果还存在第三预测子模型,则可以将第二预测子模型的预测分类结果中,预测置信度低于预测置信度阈值的待预测样本再次切分出来,并将被切分出的待预测样本输入第三预测子模型进行分类预测。当配置有更多数量的预测子模型时,可以以该方式继续进行分类预测。
随着预测子模型数量的增加,分类预测的时间和分类预测的开销也会相应增加。而随着预测子模型的数量的增加,增加的分类预测时间和开销所带来的分类预测准确度收益会下降。因而从分类预测的时间和开销与分类预测准确度收益之间的平衡的角度考虑,可以只配置两个预测子模型。
在一个示例中,待预测样本可以是待预测交易数据,从而利用上述分类预测方法可以从待预测交易数据中识别异常交易,以实现易常交易挖掘。
图6示出了根据本公开的一个实施例的基于预测模型来进行异常交易预测的方法的流程图。
如图6所示,在利用预测模型进行异常交易预测时,可以从预测子模型链中的第一预测子模型开始执行块610至块660的针对至少一个待预测交易数据的异常交易预测过程,直到满足预定条件。预测模型可以是利用如上所述的预测模型训练方法来训练的。在训练用于异常交易预测的预测模型时,训练样本可以是交易数据样本,交易数据样本可以带有是否是异常交易的标注。在另一示例中,交易数据样本还可以被标注为风险等级,交易数据的风险等级越高,该交易数据越有可能是异常交易数据。
如图6所示,在块610,使用当前预测子模型来对当前待预测交易数据进行异常交易预测,以得到当前待预测交易数据中的各个待预测交易数据的异常交易预测结果以及对应的预测置信度。异常交易预测结果可以包括是否是异常交易或异常交易数据的风险等级。
在块620,确定针对至少一个当前待预测样本中的各个当前待预测样本的异常交易预测结果中的预测置信度是否均不低于预测置信度阈值。如果当前预测子模型对所有当前待预测样本的预测置信度均不低于预测置信度阈值,则异常交易预测过程结束。此时,可以汇总到当前预测子模型为止的所有预测子模型的异常交易预测结果,以作为对所有待预测样本的异常交易预测结果输出。
各个预测子模型在预测过程中所使用预测置信度阈值可以与每个预测子模型的各个类别对应。例如,可以以预测子模型的级联顺序依次降低针对各个预测子模型的预测分类结果对应于不同类别时的置信度阈值。各个预测子模型在预测过程中所使用预测置信度阈值还可以与各个预测子模型对应。例如,可以以预测子模型的级联顺序依次降低针对各个预测子模型的置信度阈值。
如果各个当前待预测样本的异常交易预测结果中的预测置信度存在低于预测置信度阈值的异常交易预测结果,则在块630,将所得到的预测置信度不低于预测置信度阈值的当前待预测交易数据的异常交易预测结果作为该当前预测子模型的异常交易预测结果输出。
此外,如果各个当前待预测交易数据的异常交易预测结果中的预测置信度存在低于预测置信度阈值的异常交易预测结果,在块640,确定是否所有的预测子模型均已执行了异常交易预测。如果所有预测子模型均已执行异常交易预测,则异常交易预测过程结束。此时,无论当前预测子模型对当前待预测交易数据的预测置信度是否低于预测置信度阈值,均可把当前预测子模型对当前待预测交易数据的异常交易预测结果确定为预测模型对当前待预测交易数据的异常交易预测结果。然后,可以把所有预测子模型的异常交易预测结果汇总以作为对所有待预测交易数据的异常交易预测结果输出。
如果在各个当前待预测交易数据的异常交易预测结果中的存在低于预测置信度阈值的异常交易预测结果时,还存在没有执行异常交易预测的预测子模型,则在块650,将所得到的预测置信度低于预测置信度阈值的当前待预测交易数据,作为下一预测子模型的当前待预测交易数据。
然后在块660,将下一预测子模型作为当前预测子模型,并再次执行上述异常交易预测过程。利用如上预测过程能够利用不同的预测子模型来对预测难易程度不同的待预测交易数据进行预测,从而准确地挖掘出异常交易。
图7示出了根据本公开的一个实施例的用于训练预测模型的装置(以下称为预测模型训练装置)700的结构框图。如图7所示,预测模型训练装置700包括训练单元710、预测单元720以及当前训练样本获取单元730。
训练单元710被配置为使用当前训练样本来对当前预测子模型进行训练。预测单元720配置为将当前训练样本输入到经过训练后的当前预测子模型,以得到当前训练样本中的各个训练样本的预测分类结果以及对应的预测置信度。得到预测置信度之后,当前训练样本获取单元730将所得到的预测置信度低于预测置信度阈值的训练样本,作为对下一预测子模型进行训练的当前训练样本。
在训练过程中,从预测子模型链中的第一预测子模型开始循环执行训练单元710、预测单元720和当前训练样本获取单元730的操作,直到满足预定条件。
图8示出了根据本公开的一个实施例的基于预测模型来进行分类预测的装置(以下称为分类预测装置)800的结构框图。如图8所示,分类预测装置800包括预测单元810、预测结果输出单元820以及当前待预测样本确定单元830。
预测单元810被配置为使用当前预测子模型来对当前待预测样本进行预测,以得到当前待预测样本中的各个待预测样本的预测分类结果以及对应的预测置信度。预测结果输出单元820被配置为将所得到的预测置信度不低于预测置信度阈值的待预测样本的预测分类结果作为该当前预测子模型的预测分类结果输出。当前待预测样本确定单元830被配置为将所得到的预测置信度低于预测置信度阈值的待预测样本,作为下一预测子模型的当前待预测样本。
在基于预测模型对待预测样本进行分类预测的过程中,预测单元810、预测结果输出单元820以及当前待预测样本确定单元830被配置为从预测子模型链中的第一预测子模型开始循环执行针对至少一个待预测样本的预测操作,直到满足预定条件。预定条件可以是所有待预测样本的预测置信度均不低于预测置信度阈值,或者是所有的预测子模型均已执行了分类预测操作。
图9示出了根据本公开的一个实施例的基于预测模型来进行异常交易预测的装置(以下称为异常交易预测装置)900的结构框图。如图9所示,异常交易预测装置900包括预测单元910、预测结果输出单元920以及当前待预测交易数据确定单元930。
预测单元910被配置为使用当前预测子模型来对当前待预测交易数据进行预测,以得到当前待预测交易数据中的各个待预测交易数据的异常交易预测结果以及对应的预测置信度。预测结果输出单元920被配置为将所得到的预测置信度不低于预测置信度阈值的当前待预测交易数据的异常交易预测结果作为该当前预测子模型的异常交易预测结果输出。当前待预测交易数据确定单元930被配置为将所得到的预测置信度低于预测置信度阈值的当前待预测交易数据,作为下一预测子模型的当前待预测交易数据。
在基于预测模型对待预测交易数据进行异常交易预测的过程中,预测单元910、预测结果输出单元920以及当前待预测交易数据确定单元930被配置为从预测子模型链中的第一预测子模型开始循环执行针对至少一个待预测交易数据的预测操作,直到满足预定条件。预定条件可以是所有待预测交易数据的预测置信度均不低于预测置信度阈值,或者是所有的预测子模型均已执行了异常交易预测操作。
如上参照图2到图3和图7,对根据本公开的用于训练预测模型的方法及装置的实施例进行了描述,并参照图4至图5和图8对本公开的基于预测模型来进行分类预测的方法及装置进行了描述,参照图6和图9对本公开的基于预测模型来进行异常交易预测的方法及装置进行了描述。应当理解的是,以上对于方法实施例的细节描述同样适用于装置实施例。以上的用于训练预测模型的装置、基于预测模型来进行分类预测的装置和基于预测模型来进行异常交易预测的方法及装置可以采用硬件实现,也可以采用软件或者硬件和软件的组合来实现。以软件实现为例,作为一个逻辑意义上的装置,是通过其所在设备的处理器将非易失性存储器中对应的计算机程序指令读取到内存中运行形成的。在本公开中,识别终端设备上显示的应用程序控件的装置例如可以利用计算设备实现。
图10示出了根据本公开的一个实施例的用于实现用于训练预测模型的方法的计算设备1000的结构框图。从硬件层面而言,如图10所示,为本申请提供的预测模型训练装置1040所在的计算设备1000的一种硬件结构框图,除了图10所示的处理器1010、非易失性存储器1020、内存1030、网络接口1050以及内部总线1060之外,实施例中装置所在的设备通常根据该设备的实际功能,还可以包括其他硬件,对此不再赘述。
根据该实施例,计算设备1000可以包括至少一个处理器1010,该至少一个处理器1010执行在计算机可读存储介质(即,非易失性存储器1020)中存储或编码的至少一个计算机可读指令(即,上述以软件形式实现的元素)。
在一个实施例中,在非易失性存储器1020中存储计算机可执行指令,其当执行时使得至少一个处理器1010:从预测子模型链中的第一预测子模型开始执行下述模型训练过程,直到满足预定条件:使用当前训练样本来对当前预测子模型进行训练;使用经过训练后的当前预测子模型来对当前训练样本进行预测,以得到当前训练样本中的各个训练样本的预测分类结果以及对应的预测置信度;以及将所得到的预测置信度低于预测置信度阈值的训练样本,作为下一预测子模型训练的当前训练样本。
应该理解的是,在非易失性存储器1020中存储的计算机可执行指令当执行时使得至少一个处理器1010进行本公开的各个实施例中以上结合图2-3、图7描述的各种操作和功能。
图11示出了根据本公开的一个实施例的用于实现基于预测模型来进行分类预测的方法的计算设备1100的结构框图。从硬件层面而言,如图11所示,为本申请提供的分类预测装置1140所在的计算设备1100的一种硬件结构框图,除了图11所示的处理器1110、非易失性存储器1120、内存1130、网络接口1150以及内部总线1160之外,实施例中装置所在的设备通常根据该设备的实际功能,还可以包括其他硬件,对此不再赘述。
根据该实施例,计算设备1100可以包括至少一个处理器1110,该至少一个处理器1110执行在计算机可读存储介质(即,非易失性存储器1120)中存储或编码的至少一个计算机可读指令(即,上述以软件形式实现的元素)。
在一个实施例中,在非易失性存储器1120中存储计算机可执行指令,其当执行时使得至少一个处理器1110:从预测子模型链中的第一预测子模型开始执行下述针对至少一个待预测样本的预测过程,直到满足预定条件:使用当前预测子模型来对当前待预测样本进行分类预测,以得到当前待预测样本中的各个待预测样本的预测分类结果以及对应的预测置信度;将所得到的预测置信度不低于预测置信度阈值的待预测样本的预测分类结果作为该当前预测子模型的预测分类结果输出;将所得到的预测置信度低于预测置信度阈值的待预测样本,作为下一预测子模型的当前待预测样本。
应该理解的是,在非易失性存储器1120中存储的计算机可执行指令当执行时使得至少一个处理器1110进行本公开的各个实施例中以上结合图4-5、图8描述的各种操作和功能。
图12示出了根据本公开的一个实施例的用于实现基于预测模型来进行异常交易预测的方法的计算设备1200的结构框图。从硬件层面而言,如图12所示,为本申请提供的异常交易预测装置1240所在的计算设备1200的一种硬件结构框图,除了图12所示的处理器1210、非易失性存储器1220、内存1230、网络接口1250以及内部总线1260之外,实施例中装置所在的设备通常根据该设备的实际功能,还可以包括其他硬件,对此不再赘述。
根据该实施例,计算设备1200可以包括至少一个处理器1210,该至少一个处理器1210执行在计算机可读存储介质(即,非易失性存储器1220)中存储或编码的至少一个计算机可读指令(即,上述以软件形式实现的元素)。
在一个实施例中,在非易失性存储器1220中存储计算机可执行指令,其当执行时使得至少一个处理器1210:从预测子模型链中的第一预测子模型开始执行下述针对至少一个待预测交易数据的预测过程,直到满足预定条件:使用当前预测子模型来对当前待预测交易数据进行异常交易预测,以得到当前待预测交易数据中的各个待预测交易数据的异常交易预测结果以及对应的预测置信度;将所得到的预测置信度不低于预测置信度阈值的当前待预测交易数据的异常交易预测结果作为该当前预测子模型的异常交易预测结果输出;将所得到的预测置信度低于所述预测置信度阈值的当前待预测交易数据,作为下一预测子模型的当前待预测交易数据。
应该理解的是,在非易失性存储器1220中存储的计算机可执行指令当执行时使得至少一个处理器1210进行本公开的各个实施例中以上结合图6和图9描述的各种操作和功能。
在本公开中,计算设备1000-1200可以包括但不限于:个人计算机、服务器计算机、工作站、桌面型计算机、膝上型计算机、笔记本计算机、移动计算设备、智能电话、平板计算机、蜂窝电话、个人数字助理(PDA)、手持装置、消息收发设备、可佩戴计算设备、消费电子设备等等。
根据一个实施例,提供了一种例如非暂时性机器可读介质的程序产品。非暂时性机器可读介质可以具有指令(即,上述以软件形式实现的元素),该指令当被机器执行时,使得机器执行本公开的各个实施例中以上结合图2-3和图7描述的各种操作和功能。
根据另一实施例,还提供一种例如非暂时性机器可读介质的程序产品。非暂时性机器可读介质可以具有指令(即,上述以软件形式实现的元素),该指令当被机器执行时,使得机器执行本公开的各个实施例中以上结合图4-5和图8描述的各种操作和功能。
具体地,可以提供配有可读存储介质的系统或者装置,在该可读存储介质上存储着实现上述实施例中任一实施例的功能的软件程序代码,且使该系统或者装置的计算机或处理器读出并执行存储在该可读存储介质中的指令。
根据一个实施例,提供了一种例如非暂时性机器可读介质的程序产品。非暂时性机器可读介质可以具有指令(即,上述以软件形式实现的元素),该指令当被机器执行时,使得机器执行本公开的各个实施例中以上结合图6和图9描述的各种操作和功能。
根据一个实施例,提供了一种例如非暂时性机器可读介质的程序产品。非暂时性机器可读介质可以具有指令(即,上述以软件形式实现的元素),该指令当被机器执行时,使得机器执行本公开的各个实施例中以上结合图6和图9描述的各种操作和功能。
具体地,可以提供配有可读存储介质的系统或者装置,在该可读存储介质上存储着实现上述实施例中任一实施例的功能的软件程序代码,且使该系统或者装置的计算机或处理器读出并执行存储在该可读存储介质中的指令。
在这种情况下,从可读介质读取的程序代码本身可实现上述实施例中任何一项实施例的功能,因此机器可读代码和存储机器可读代码的可读存储介质构成了本发明的一部分。
可读存储介质的实施例包括软盘、硬盘、磁光盘、光盘(如CD-ROM、CD-R、CD-RW、DVD-ROM、DVD-RAM、DVD-RW、DVD-RW)、磁带、非易失性存储卡和ROM。可选择地,可以由通信网络从服务器计算机上或云上下载程序代码。
以上结合附图阐述的具体实施方式描述了示例性实施例,但并不表示可以实现的或者落入权利要求书的保护范围的所有实施例。在整个本说明书中使用的术语“示例性”意味着“用作示例、实例或例示”,并不意味着比其它实施例“优选”或“具有优势”。出于提供对所描述技术的理解的目的,具体实施方式包括具体细节。然而,可以在没有这些具体细节的情况下实施这些技术。在一些实例中,为了避免对所描述的实施例的概念造成难以理解,公知的结构和装置以框图形式示出。
以上结合附图详细描述了本公开的实施例的可选实施方式,但是,本公开的实施例并不限于上述实施方式中的具体细节,在本公开的实施例的技术构思范围内,可以对本公开的实施例的技术方案进行多种简单变型,这些简单变型均属于本公开的实施例的保护范围。
本公开内容的上述描述被提供来使得本领域任何普通技术人员能够实现或者使用本公开内容。对于本领域普通技术人员来说,对本公开内容进行的各种修改是显而易见的,并且,也可以在不脱离本公开内容的保护范围的情况下,将本文所定义的一般性原理应用于其它变型。因此,本公开内容并不限于本文所描述的示例和设计,而是与符合本文公开的原理和新颖性特征的最广范围相一致。