CN115829755A - 交易风险的预测结果的解释方法和装置 - Google Patents
交易风险的预测结果的解释方法和装置 Download PDFInfo
- Publication number
- CN115829755A CN115829755A CN202310133681.8A CN202310133681A CN115829755A CN 115829755 A CN115829755 A CN 115829755A CN 202310133681 A CN202310133681 A CN 202310133681A CN 115829755 A CN115829755 A CN 115829755A
- Authority
- CN
- China
- Prior art keywords
- sequence
- transaction
- subsequences
- subsequence
- score
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本说明书实施例提供了一种交易风险的预测结果的解释方法和装置。该方法包括:得到时间序列;该时间序列是:由至少两个交易事件的特征按照时间顺序形成的序列;并且,该时间序列被输入机器学习模型,以使得该机器学习模型根据该时间序列输出针对交易风险的预测结果;针对时间序列中的每一种类型的交易事件的特征,确定该类型特征在用于得到所述针对交易风险的预测结果时的重要性;将所述时间序列划分为至少两个子序列;针对每一个子序列,根据所确定出的每一种交易事件的类型的特征的重要性,得到每一种类型的交易事件的特征相对于该子序列的重要性。本说明书实施例能够更好地对机器学习模型得出的交易风险预测结果进行解释。
Description
技术领域
本说明书一个或多个实施例涉及人工智能技术,尤其涉及交易风险的预测结果的解释方法和装置。
背景技术
随着人工智能技术的发展,机器学习模型已经被广泛应用于各种预测业务中。机器学习模型一般都是一个黑盒。比如某个机器学习模型要进行一项预测任务,首先向该模型输入一些已知条件(比如年龄=65,性别=女等),然后该模型根据输入进行预测,输出预测结果。
但是,机器学习模型一般只能得到最终的预测结果,至于模型内部是怎么计算的,即,输入的各项已知条件是怎么对预测结果产生影响的,各项已知条件的影响大小分别是多少,都无法知道。因此需要引入可解释性算法对机器学习模型的预测结果与相应的输入条件之间存在的因果关系进行显式表示。
但是,针对交易风险的预测,因为输入机器学习模型的是由多个交易事件的特征按照时间顺序形成的时间序列,针对输入为时间序列的情况,目前的可解释性算法无法更好地对机器学习模型得出的交易风险预测结果进行解释。
发明内容
本说明书一个或多个实施例描述了交易风险的预测结果的解释方法和装置,能够更好地对机器学习模型得出的交易风险预测结果进行解释。
根据第一方面,提供了交易风险的预测结果的解释方法,包括:
得到时间序列;该时间序列是:由至少两个交易事件的特征按照时间顺序形成的序列;并且,该时间序列被输入机器学习模型,以使得该机器学习模型根据该时间序列输出针对交易风险的预测结果;
针对时间序列中每一种类型的交易事件的特征,确定该类型特征在用于得到所述针对交易风险的预测结果时的重要性;
将所述时间序列划分为至少两个子序列;
针对每一个子序列,根据所确定出的每一种类型的交易事件的特征的重要性,得到每一种类型的交易事件的特征相对于该子序列的重要性。
其中,所述将所述时间序列划分为至少两个子序列,包括:
按照预设的时间窗口,将时间序列中属于同一个时间窗口内的各条记录划分在一个子序列中,从而得到第一数量的子序列;其中,第一数量不小于2;
或者,
根据预设的记录数量,将时间序列中每相邻的记录数量个记录划分在一个子序列中,从而得到第一数量的子序列。
所述预设的时间窗口为:根据专家经验设置的、记录之间具有相似特征的时间段;
所述预设的记录数量为:根据专家经验设置的、具有相似特征的相邻记录的个数。
其中,所述第一数量大于2;
在所述得到第一数量的子序列之后,所述将所述时间序列划分为至少两个子序列的步骤进一步包括:计算所述第一数量的子序列之间在特征分布上的相似性;以及将具有相似性的多个子序列合并为一个子序列,从而得到第二数量的子序列;其中,第二数量小于等于第一数量;
则,针对合并得到的第二数量的子序列中的每一个子序列,执行所述“根据所确定出的每一种类型的交易事件的特征的重要性,得到每一种类型的交易事件的特征相对于该子序列的重要性”的步骤。
所述计算所述第一数量的子序列之间在特征分布上的相似性以及将具有相似性的多个子序列合并为一个子序列,包括:
在第一轮计算中执行:在第一数量的子序列中的每两个相邻子序列之间设置一个待定分隔点;针对每一个待定分隔点均执行:将时间序列按照当前待定分隔点划分为两个序列对象,计算对应于该当前待定分隔点的、该两个序列对象在特征分布上的差异性分值;从第一轮计算出的各个差异性分值中选择最大的差异性分值;以及,将选择出的最大差异性分值所对应的待定分隔点更改为已定分隔点;
在后续的第M轮计算中执行:针对剩余的每一个待定分隔点均执行:将时间序列按照当前待定分隔点以及各已定分隔点划分为L个序列对象,计算该L个序列对象中每两个相邻序列对象在特征分布上的区别得分,利用计算出的M个区别得分得到对应于该当前待定分隔点的差异性分值;从第M轮计算出的对应于各个待定分隔点的各个差异性分值中选择最大的差异性分值;以及将选择出的该最大差异性分值所对应的待定分隔点更改为已定分隔点;
同时,在每一轮的计算结束后,均判断当前是否达到结束条件,如果否,则进行下一轮计算,如果是,则按照各个已定分隔点划分时间序列,从而得到第二数量的子序列。
所述利用计算出的M个区别得分得到对应于该当前待定分隔点的差异性分值,包括:
计算所述M个区别得分的平均值,将计算出的平均值作为所述对应于该当前待定分隔点的差异性分值;
或者,
针对所述M个区别得分中的每一个区别得分,均计算该区别得分对应的相邻两个序列对象的总字段长度,将该总字段长度除以时间序列的字段长度,从而得到该区别得分对应的加权值;利用M个加权值对M个区别得分进行加权平均,从而计算出该当前待定分隔点的差异性分值。
所述判断当前是否达到结束条件,包括:
判断当前是否已经完成预设轮数的计算;
或者,
判断在本轮计算中选择出的最大差异性分值是否大于预设的分数阈值。
所述交易事件的特征的重要性包括:特征的分值;
所述针对每一个子序列,根据所确定出的每一种类型的交易事件的特征的重要性,得到每一种类型的交易事件的特征相对于该子序列的重要性,包括:
针对每一种类型的交易事件的特征的分值,将该特征的分值分解到每一个子序列,从而得到该类型的交易事件的特征相对于每一个子序列的可解释性分值。
根据第二方面,提供了交易风险的预测结果的解释装置,其中,该装置包括:
时间序列获取模块,配置为得到时间序列;该时间序列是:由至少两个交易事件的特征按照时间顺序形成的序列;并且,该时间序列被输入机器学习模型,以使得该机器学习模型根据该时间序列输出针对交易风险的预测结果;
序列划分模块,配置为将所述时间序列划分为至少两个子序列;
可解释性计算模块,配置为针对时间序列中的每一种类型的交易事件的特征,确定该类型特征在用于得到所述针对交易风险的预测结果时的重要性;针对每一个子序列,根据所确定出的每一种类型的交易事件的特征的重要性,得到每一种类型的交易事件的特征相对于该子序列的重要性。
根据第三方面,提供了一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现本说明书任一实施例所述的方法。
本说明书实施例提供的交易风险的预测结果的解释方法及装置,针对由多个交易事件的特征组成的时间序列,不是以输入机器学习模型的该时间序列中的每一个特征作为一个被解释的单元,也就是说,针对时间序列这种存在较多数量的特征的模型输入,不再将数量众多的特征中的每一个特征作为一个被解释的单元,而是首先将时间序列划分为至少两个子序列,因为每一个子序列中包括一条或更多的记录,而每一条记录中都包括多个特征,因此,一个子序列中会包括交易事件的多个特征。将每一个子序列作为一个被解释的单元,即,实现子序列级别的特征归因,这样则大大降低了需要解释的单元的数量,从而降低了可解释性算法的复杂度,降低了对系统的计算资源的消耗。因此,本说明书实施例能够更好地对机器学习模型得出的交易风险预测结果进行解释。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本说明书的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本说明书一个实施例中交易风险的预测结果的解释方法的流程图。
图2是交易事件的时间序列的示意图。
图3是本说明书一个实施例中交易风险的预测结果的解释装置的结构示意图。
实施方式
在现有技术中,对交易风险的预测结果的解释方法是:针对输入机器学习模型的时间序列中的每一个特征进行可解释性计算。比如,输入的已知条件包括如下的6个特征:用户的年龄、性别、交易金额、交易时间、学历、历史转账次数。那么,在将该已知条件输入机器学习模型来预测用户的借款风险时,会得到机器学习模型输出的风险预测结果。而为了提供上述6个特征在得到该风险预测结果时的贡献值,就需要对该6个特征进行可解释性计算。
可见,在现有技术中是将输入机器学习模型中的每一个特征作为一个被解释的单元。
在对交易风险进行预测时,会将至少两个交易事件的特征按照时间顺序形成时间序列。比如将一个用户在半年内发生的多个交易行为的数据按照时间顺序形成一个时间序列,也就是说,在该时间序列中,按照时间顺序依次包括该用户在半年内进行的第一笔交易行为的数据(即第一条记录,交易行为的数据比如包括5种类型的特征:金额、发生时间、对方账户、转账途径、交易是否成功)、该用户进行的第二笔交易行为的数据即第二条记录……该用户进行的第N笔交易行为的数据即第N条记录。可见,时间序列中由于包括N条记录,每一条记录中又包括多种类型的特征,因此时间序列中包括的特征的数量较多。按照现有技术的做法,将输入机器学习模型中的每一个特征作为一个被解释的单元,那么,针对时间序列,需要解释的特征数量往往非常多,比如上述交易行为的时间序列,需要解释的特征数量为5*N个,如果N为200,则需要解释的特征的数量为5*200=1千个。而可解释性算法的复杂度是跟被解释的特征的数量相关的,此种相关性通常体现为随着数量呈指数级增长,那么,针对时间序列,将会导致可解释性算法的复杂度过高,极大地消耗系统的计算资源。
下面结合附图,对本说明书提供的方案进行描述。
首先需要说明的是,在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
图1是本说明书一个实施例中交易风险的预测结果的解释方法的流程图。该方法的执行主体为交易风险的预测结果的解释装置。可以理解,该方法也可以通过任何具有计算、处理能力的装置、设备、平台、设备集群来执行。参见图1,该方法包括:
步骤101:得到时间序列;该时间序列是:由至少两个交易事件的特征按照时间顺序形成的序列;并且,该时间序列被输入机器学习模型,以使得该机器学习模型根据该时间序列输出针对交易风险的预测结果。
步骤103:针对时间序列中的每一种类型的交易事件的特征,确定该类型特征在用于得到所述交易风险的预测结果时的重要性。
步骤105:将所述时间序列划分为至少两个子序列;每一个子序列中包括至少一条记录。
步骤107:针对每一个子序列,根据所确定出的每一种类型的交易事件的特征的重要性,得到每一种类型的交易事件的特征相对于该子序列的重要性。
根据上述图1所示的流程可以看出,在本说明书实施例中,不是以输入机器学习模型的时间序列中的每一个特征作为一个被解释的单元,也就是说,针对时间序列这种存在较多数量的特征的模型输入,不再将数量众多的特征中的每一个特征作为一个被解释的单元。在图1所示的流程中,首先将时间序列划分为至少两个子序列,因为每一个子序列中包括一条或更多的交易事件的记录,而每一条记录中都包括多个特征,因此,一个子序列中会包括多个特征。将每一个子序列作为一个被解释的单元,即,实现了子序列级别的特征归因,这样则大大降低了被解释的单元的数量,从而降低了可解释性算法的复杂度,降低了对系统的计算资源的消耗。因此,本说明书实施例能够更好地解释输入的时间序列中的特征对交易风险的预测结果的影响。
举例说明:一个时间序列中包括100条记录,每一条记录都包括了用户交易行为的10种特征。那么,在该时间序列中,总共有100*10=1000个特征。按照现有技术的做法,需要对1000个特征进行1000次可解释性计算。而在本说明书实施例中,比如将上述时间序列划分为8个子序列,100条记录分散在8个子序列中,那么本说明书实施例中只需要对该8个子序列进行8次可解释性计算。可见,本说明书实施例大大降低了被解释的单元的数量,极大地降低了可解释性算法的复杂度,降低了对系统的计算资源的消耗。
时间序列低特征维度一般要远高于常规的表格数据,这使得现有技术的可解释性算法在时间序列模型上的运行效率过低,难以投入使用,而本说明书实施例的方法则是非常适合于基于时间序列的可解释性方法。现有技术的可解释性算法输出的特征重要性是零散的、相互独立的,而对于时间序列这种特定的数据结构而言,零散的特征重要性作为解释不够直观,而本说明书实施例的方法是非常适合于基于时间序列的可解释性方法。
下面结合附图对图1所示的每一个步骤分别进行说明。
首先对于步骤101:得到时间序列;该时间序列是:由至少两个交易事件的特征按照时间顺序形成的序列;并且,该时间序列被输入机器学习模型,以使得该机器学习模型根据该时间序列输出针对交易风险的预测结果。
本说明书实施例的方法主要为针对输入为时间序列的机器学习模型的可解释性方法。时间序列被输入机器学习模型,以使得该机器学习模型根据该时间序列输出预测结果。
时间序列是按照时间发生的先后顺序,将至少两条记录排列成的数列。比如,用于对下一个交易日大盘点数的预测的时间序列;用于未来天气情况的预测的时间序列;用于下一个时刻某种商品的销量情况的预测的时间序列;用于电影票房变化情况的预测的时间序列;用户对用户交易行为的风险等级进行预测的时间序列等。
参见图2,时间序列X包括n条记录,即n个交易事件的特征:X1、X2……Xn。每一条记录对应一个交易事件,每一条记录中都包括多种特征,比如图2中所示的记录X1中包括5种类型的特征,分别为a1、b1、c1、d1、e1。参见图2,比如将一个用户在半年内发生的多个交易行为的数据形成时间序列,也就是说,在该时间序列中,按照时间顺序依次包括该用户在半年内进行的第一笔交易行为的数据(即第一条记录X1,a1、b1、c1、d1、e1是5种类型的特征的具体值)、该用户进行的第二笔交易行为的数据即第二条记录X2……该用户进行的第n笔交易行为的数据即第n条记录Xn。
接下来对于步骤103:针对时间序列中的每一种类型的交易事件的特征,确定该类型特征在用于得到所述交易风险的预测结果时的重要性。
时间序列中包括不同的记录,但是不同记录中包括的特征的类型是相同的,比如,上述记录X1至记录Xn都包括金额、发生时间、对方账户、转账途径、交易是否成功这5种类型的特征,只是不同记录中同一种类型的特征的特征值可能不同。由于在本说明书实施例中,是将子序列作为一个被解释的单元,而一个子序列中包括时间序列中所有类型的特征。因此,在本步骤103中,是要求解特征级别的重要性,即量化每一种类型的特征对模型所做预测的贡献,而不是求解每一个特征对模型所做预测的贡献。比如对于上述5种类型的特征,对于金额这种类型的特征(图2中a1、a2……an这一列特征),计算“金额”类型的特征在机器学习模型得到预测结果时的重要性;对于发生时间这种类型的特征(图2中b1、b2……bn这一列特征),计算“发生时间”类型的特征在机器学习模型得到预测结果时的重要性;对于对方账户这种类型的特征(图2中c1、c2……cn这一列特征),计算“对方账户”类型的特征在机器学习模型得到预测结果时的重要性;对于转账途径这种类型的特征(图2中d1、d2……dn这一列特征),计算“转账途径”类型的特征在机器学习模型得到预测结果时的重要性;对于交易是否成功这种类型的特征(图2中e1、e2……en这一列特征),计算“交易是否成功”类型的特征在机器学习模型得到预测结果时的重要性。
在步骤103中,可以应用SHAP(全称是SHapley Additive exPlanation)可解释方法或者其他可解释性算法计算每一种类型的特征的重要性。计算出的重要性通常体现为分数。
接下来对于步骤105:将时间序列划分为至少两个子序列。
在本说明书实施例中,考虑到在短时间内,被统计的对象的特点通常变化不大或没有变化,其特征具有相似性,因此,可以将具有相似特征的各个记录组合在一个子序列中,将该子序列即具有相似特征的各个记录作为一个被解释的单元进行可解释性计算。比如,对于用户的交易行为,通常在1个月内发生的各个交易行为可能具有相似性,比如都是通过同一种转账途径进行交易,交易的金额也往往相对接近,而超过1个月,比如在1月份的交易行为与在9月份的交易行为的特点相差较大。
本步骤105至少包括如下两种实现方式:
方式一、直接按照已有的专家经验划分子序列。
方式二、首先按照已有的专家经验初步划分时间序列,然后再根据初步划分出的各子序列的特征分布的特点,调整子序列的划分。
针对方式一,本步骤105的过程包括:
步骤A1:按照预设的时间窗口,将时间序列中属于同一个时间窗口内的各条记录划分在一个子序列中,从而得到第一数量的子序列;其中,第一数量不小于2;
步骤B1:根据预设的记录数量,将时间序列中每相邻的记录数量的记录划分在一个子序列中,从而得到第一数量的子序列;其中,第一数量不小于2。
步骤A1中,预设的时间窗口为:根据专家经验设置的、各记录之间具有相似特征的时间段。比如,当前的时间序列是针对用户交易行为的时间序列,根据经验可知,通常在1个自然月内,用户的交易行为具有相似性,而时间序列中记录1至记录3是2月份发生的,因此,可以将记录1至记录3划分在子序列1中;时间序列中记录4至记录5是另一个自然月内发生的,因此,可以将记录4至记录5划分在子序列2中,依次类推。
在步骤B1中,预设的记录数量为:根据专家经验设置的、具有相似特征的相邻记录的个数。比如,当前的时间序列是针对用户交易行为的时间序列,根据经验可知,通常用户连续3笔交易行为具有相似性,比如金额、转账途径都相同,因此,可以将时间序列中每相邻3个记录划分为一个子序列。
上述方式一是按照历史经验来划分的,而不是按照各个记录的特征的特点来划分的。而方式二可以在方式一的基础之上进一步调整,将第一数量的子序列中具有相似特征的相邻子序列合并为一个新的子序列,最终得到第二数量的子序列。可见,方式二更能体现时间序列中的特征在时间分布上的特点,按照方式二划分出的各子序列能够更加符合业务情况,更适合作为一个被解释的单元。
针对方式二,本步骤105的过程包括:
步骤105B1:按照上述方式一描述的方法,将时间序列划分为第一数量的子序列。
步骤105B3:计算第一数量的子序列之间在特征分布上的相似性;以及将具有相似性的多个子序列合并为一个新的子序列,从而得到第二数量的子序列;其中,第二数量小于等于第一数量。
在本说明书一个实施例中,可以采用“贪心”的思想实现步骤105B3,此时步骤105B3的具体实现过程包括步骤105B31、步骤105B33、步骤105B35:
步骤105B31:在第一轮计算中,执行:在第一数量的子序列中的每两个相邻子序列之间设置一个待定分隔点;针对每一个待定分隔点均执行:将时间序列按照当前待定分隔点划分为两个序列对象,计算对应于该当前待定分隔点的、该两个序列对象在特征分布上的差异性分值;从第一轮计算出的各个差异性分值中选择最大的差异性分值;以及,将选择出的最大差异性分值所对应的待定分隔点更改为已定分隔点。
步骤105B33:在后续的第M轮计算中执行:针对剩余的每一个待定分隔点均执行:将时间序列按照当前待定分隔点以及各已定分隔点划分为L个序列对象,计算该L个序列对象中每两个相邻序列对象在特征分布上的区别得分;其中,L=M+1;利用计算出的M个区别得分得到对应于该当前待定分隔点的差异性分值;从第M轮计算出的对应于各个待定分隔点的各个差异性分值中选择最大的差异性分值;以及将选择出的该最大差异性分值所对应的待定分隔点更改为已定分隔点。
在本说明书一个实施例中,在步骤105B33中,上述利用计算出的M个区别得分得到对应于该待定分隔点的差异性分值,包括:
计算所述M个区别得分的平均值,将计算出的平均值作为所述对应于该待定分隔点的差异性分值;
或者,
针对所述M个区别得分中的每一个区别得分,均计算该区别得分对应的相邻两个序列对象的总字段长度,将该总字段长度除以时间序列的字段长度,从而得到该区别得分对应的加权值;对M个区别得分进行加权平均,从而计算出该待定分隔点的差异性分值。
步骤105B35:在每一轮的计算结束后,均判断当前是否达到结束条件,如果否,则进行下一轮计算,如果是,则按照各个已定分隔点划分时间序列,从而得到第二数量的子序列。
在本说明书一个实施例中,本步骤105B35中,判断当前是否达到结束条件的实现方法包括:
判断当前是否已经完成预设轮数的计算;
或者,
判断在本轮计算中选择出的最大差异性分值是否大于预设的分数阈值。
下面举例说明上述步骤105B31、步骤105B33、步骤105B35的实现过程。
首先,通过步骤105B1的过程,即按照上述方式一描述的方法,将时间序列划分为第一数量(比如第一数量为10个)子序列。
接下来,进行多轮的合并计算中的第一轮计算。首先在10个子序列中的每两个相邻子序列之间设置一个待定分隔点,得到9个待定分隔点;针对第1个子序列与第2个子序列之间的待定分隔点1,将时间序列按照该待定分隔点1划分为两个序列对象,即第一个序列对象为第1个子序列,第二个序列对象由第2个子序列至第10个子序列组成,之后,计算该两个序列对象之间在特征分布上的差异性分值,也就是说,计算第1个子序列在特征分布上的特点,计算第2个子序列至第10个子序列共同组成的一个大的子序列在特征分布上的特点,然后计算该两个特征分布之间的差异性分值,从而得到对应于待定分隔点1的差异性分值。之后,针对第2个子序列与第3个子序列之间的待定分隔点2,将时间序列按照该待定分隔点2划分为两个序列对象,第一个序列对象由第1个子序列及第2个子序列组成,第二个序列对象由第3个子序列至第10个子序列组成,之后,计算该两个序列对象之间在特征分布上的差异性分值,也就是说,计算第1个子序列及第2个子序列共同组成的一个大的子序列在特征分布上的特点,计算第3个子序列至第10个子序列共同组成的一个大的子序列在特征分布上的特点,然后计算该两个特征分布之间的差异性分值,从而得到对应于待定分隔点2的差异性分值;以此类推,直至计算出对应于待定分隔点9的差异性分值。从对应9个待定分隔点的9个差异性分值中选择最大的差异性分值,比如选择出的是待定分隔点7对应的差异性分值。之后,将待定分隔点7更改为已定分隔点,也就是说,经过第一轮计算,可以确定出待定分隔点7是一个符合业务情况的分界点,时间序列中待定分隔点7之前的序列(第1个子序列至第7个子序列)与分隔点7之后的序列(第8个子序列至第10个子序列)在特征分布上具有明显的差异。所以,待定分隔点7更改为已定分隔点。判断当前是否达到结束条件,比如判断在本轮计算中选择出的最大差异性分值是否大于预设的分数阈值,并且判断出本轮计算中选择出的最大差异性分值不大于预设的分数阈值,则继续进行下一轮的计算。
接下来,进行多轮的合并计算中的第二轮计算。因为在第一轮计算中,已经将9个待定分隔点中的待定分隔点7更改为已定分隔点,因此,还剩余8个待定分隔点。针对剩余的8个待定分隔点,首先,针对待定分隔点1,将时间序列按照该待定分隔点1以及已经确定出的所有已定分隔点(此时只有一个已定分隔点)划分为三个序列对象,第一个序列对象为第1个子序列,第二个序列对象由第2个子序列至第7个子序列组成,第三个序列对象由第8个子序列至第10个子序列组成,之后,计算第一个序列对象与第二个序列对象之间在特征分布上的区别得分,以及计算第二个序列对象与第三个序列对象在特征分布上的区别得分,利用计算出的2个区别得分得到对应于待定分隔点1的差异性分值,比如求该2个区别得分的平均值从而得到对应于待定分隔点1的差异性分值;以此类推,直至计算出对应于待定分隔点9的差异性分值。从对应8个待定分隔点的8个差异性分值中选择最大的差异性分值,比如选择出的是待定分隔点3对应的差异性分值。之后,将待定分隔点3更改为已定分隔点,也就是说,经过第二轮计算,可以确定出待定分隔点3是一个符合业务情况的分界点。执行完第二轮的计算,则确定出两个已定分隔点。判断当前是否达到结束条件,比如判断在本轮计算中选择出的最大差异性分值是否大于预设的分数阈值,并且判断出本轮计算中选择出的最大差异性分值不大于预设的分数阈值,则继续进行下一轮的计算。
接下来,进行多轮的合并计算中的第三轮计算,可以参见上述第二轮计算的实现方法。只是在第三轮计算中,每一次都是按照一个待定分隔点及两个已定分隔点来划分时间序列。同样,第三轮计算结束后,需要判断当前是否达到结束条件。依次执行,直至达到了结束条件,比如在第4轮计算结束后达到了结束条件,那么,总共确定出4个已定分隔点,这样,针对方式二,最后将时间序列分成了第二数量即5个子序列。
至此,对应于方式二的步骤105的过程结束。
接下来对于步骤107:针对每一个子序列,根据所确定出的每一种类型的交易事件的特征的重要性,得到每一种类型的交易事件的特征相对于该子序列的重要性。
这里,如果采用方式一来实现步骤105,那么在本步骤107中,是针对第一数量的子序列中的每一个子序列,根据所确定出的每一种类型的特征的重要性,得到每一种类型的特征相对于该子序列的重要性。
如果采用方式二来实现步骤105,那么在本步骤107中,是针对第二数量的子序列中的每一个子序列,根据所确定出的每一种类型的特征的重要性,得到每一种类型的特征相对于该子序列的重要性。
在本说明书一个实施例中,特征的重要性包括:特征的分值,即通过分值来体现一种类型的特征对于得出预测结果的重要程度。此时,本步骤107的实现过程包括:针对每一种类型的特征的分值,将该类型特征的分值分解到每一个子序列,从而得到该类型的特征相对于每一个子序列的可解释性分值。比如参见图2,a1至an这一列对应的是第一种类型的特征,通过步骤103的过程得到这一列对应的特征的分值比如为30分,将该分值30分解到步骤105中划分出的每一个子序列。因此,得到时间序列中第一种类型的特征在每一个子序列中的特征分值,第二种类型的特征在每一个子序列中的特征分值,直至最后一种类型的特征在每一个子序列中的特征分值。
在本步骤107中,针对每一种类型的特征的分值,可以利用SHAP方法将该类型特征的分值分解到每一个子序列。
可见,本说明书实施例保留了SHAP与模型无关的优势,可以针对任意类型的模型预测结果提供解释,相比TimeSHAP方法仅能针对循环神经网络系列模型进行解释,具有更高的通用性。
同时,本说明书实施例的方案针对在较短时间内被统计对象比如交易行为可能具有连续性的特点,提出事件子序列维度的解释形式,可以以更精细的粒度生成特征归因结果,能够更好地帮助理解模型预测结果与输入样本间的影响关系。
在本说明书的一个实施例中,提供了一种交易风险的预测结果的解释装置,参见图3,该装置包括:
时间序列获取模块301,配置为得到时间序列;该时间序列是:由至少两个交易事件的特征按照时间顺序形成的序列;并且,该时间序列被输入机器学习模型,以使得该机器学习模型根据该时间序列输出针对交易风险的预测结果;
序列划分模块302,配置为将所述时间序列划分为至少两个子序列;
可解释性计算模块303,配置为针对时间序列中的每一种类型的交易事件的特征,确定该类型特征在用于得到所述针对交易风险的预测结果时的重要性;针对每一个子序列,根据所确定出的每一种类型的交易事件的特征的重要性,得到每一种类型的交易事件的特征相对于该子序列的重要性。
在本说明书装置的一个实施例中,序列划分模块302被配置为执行:
按照预设的时间窗口,将时间序列中属于同一个时间窗口内的各条记录划分在一个子序列中,从而得到第一数量的子序列;其中,第一数量不小于2;
或者,
根据预设的记录数量,将时间序列中每相邻的记录数量的记录划分在一个子序列中,从而得到第一数量的子序列。
在本说明书装置的一个实施例中,预设的时间窗口为:根据专家经验设置的、记录之间具有相似特征的时间段。
在本说明书装置的一个实施例中,预设的记录数量为:根据专家经验设置的、具有相似特征的相邻记录的个数。
在本说明书装置的一个实施例中,第一数量大于2;
序列划分模块302进一步被配置为执行:在得到第一数量的子序列之后,计算所述第一数量的子序列之间在特征分布上的相似性;以及将具有相似性的多个子序列合并为一个子序列,从而得到第二数量的子序列;其中,第二数量小于等于第一数量;
则可解释性计算模块303配置为执行:针对合并得到的第二数量的子序列中的每一个子序列,执行“根据所确定出的每一种类型的交易事件的特征的重要性,得到每一种类型的交易事件的特征相对于该子序列的重要性”的处理。
在本说明书装置的一个实施例中,序列划分模块302进一步被配置为执行:在第一轮计算中,执行:在第一数量的子序列中的每两个相邻子序列之间设置一个待定分隔点;针对每一个待定分隔点均执行:将时间序列按照当前待定分隔点划分为两个序列对象,计算对应于该当前待定分隔点的、该两个序列对象在特征分布上的差异性分值;从第一轮计算出的各个差异性分值中选择最大的差异性分值;以及,将选择出的最大差异性分值所对应的待定分隔点更改为已定分隔点;
在后续的第M轮计算中执行:针对剩余的每一个待定分隔点均执行:将时间序列按照当前待定分隔点以及各已定分隔点划分为L个序列对象,计算该L个序列对象中每两个相邻序列对象在特征分布上的区别得分;其中,L=M+1;利用计算出的M个区别得分得到对应于该当前待定分隔点的差异性分值;从第M轮计算出的对应于各个待定分隔点的各个差异性分值中选择最大的差异性分值;以及将选择出的该最大差异性分值所对应的待定分隔点更改为已定分隔点;
在每一轮的计算结束后,均判断当前是否达到结束条件,如果否,则进行下一轮计算,如果是,则按照各个已定分隔点划分时间序列,从而得到第二数量的子序列。
在本说明书装置的一个实施例中,序列划分模块302进一步被配置为执行:
计算所述M个区别得分的平均值,将计算出的平均值作为所述对应于该待定分隔点的差异性分值;
或者,
针对所述M个区别得分中的每一个区别得分,均计算该区别得分对应的相邻两个序列对象的总字段长度,将该总字段长度除以时间序列的字段长度,从而得到该区别得分对应的加权值;对M个区别得分进行加权平均,从而计算出该待定分隔点的差异性分值。
在本说明书装置的一个实施例中,序列划分模块302进一步被配置为执行:
通过判断当前是否已经完成预设轮数的计算,实现判断当前是否达到结束条件;
或者,
通过判断在本轮计算中选择出的最大差异性分值是否大于预设的分数阈值,实现判断当前是否达到结束条件。
特征的重要性包括:特征的分值;
在本说明书装置的一个实施例中,可解释性计算模块303被配置为执行:针对每一种类型的交易事件的特征的分值,将该特征的分值分解到每一个子序列,从而得到该类型的交易事件的特征相对于每一个子序列的可解释性分值。
需要说明的是,上述各装置通常实现于服务器端,可以分别设置于独立的服务器,也可以其中部分或全部装置的组合设置于同一服务器。该服务器可以是单个的服务器,也可以是由多个服务器组成的服务器集群,服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品。上述各装置还可以实现于具有较强计算能力的计算机终端。
本说明书一个实施例提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行说明书中任一个实施例中的方法。
本说明书一个实施例提供了一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现执行说明书中任一个实施例中的方法。
可以理解的是,本说明书实施例示意的结构并不构成对本说明书实施例的装置的具体限定。在说明书的另一些实施例中,上述装置可以包括比图示更多或者更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件、软件或者软件和硬件的组合来实现。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本领域技术人员应该可以意识到,在上述一个或多个示例中,本发明所描述的功能可以用硬件、软件、挂件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。
Claims (10)
1.交易风险的预测结果的解释方法,其中,该方法包括:
得到时间序列;该时间序列是:由至少两个交易事件的特征按照时间顺序形成的序列;并且,该时间序列被输入机器学习模型,以使得该机器学习模型根据该时间序列输出针对交易风险的预测结果;
针对时间序列中每一种类型的交易事件的特征,确定该类型特征在用于得到所述针对交易风险的预测结果时的重要性;
将所述时间序列划分为至少两个子序列;
针对每一个子序列,根据所确定出的每一种类型的交易事件的特征的重要性,得到每一种类型的交易事件的特征相对于该子序列的重要性。
2.根据权利要求1所述的方法,其中,所述将所述时间序列划分为至少两个子序列,包括:
按照预设的时间窗口,将时间序列中属于同一个时间窗口内的各条记录划分在一个子序列中,从而得到第一数量的子序列;其中,第一数量不小于2;
或者,
根据预设的记录数量,将时间序列中每相邻的记录数量个记录划分在一个子序列中,从而得到第一数量的子序列。
3.根据权利要求2所述的方法,所述预设的时间窗口为:根据专家经验设置的、记录之间具有相似特征的时间段;
所述预设的记录数量为:根据专家经验设置的、具有相似特征的相邻记录的个数。
4.根据权利要求2或3所述的方法,其中,所述第一数量大于2;
在所述得到第一数量的子序列之后,所述将所述时间序列划分为至少两个子序列的步骤进一步包括:计算所述第一数量的子序列之间在特征分布上的相似性;以及将具有相似性的多个子序列合并为一个子序列,从而得到第二数量的子序列;其中,第二数量小于等于第一数量;
则,针对合并得到的第二数量的子序列中的每一个子序列,执行所述“根据所确定出的每一种类型的交易事件的特征的重要性,得到每一种类型的交易事件的特征相对于该子序列的重要性”的步骤。
5.根据权利要求4所述的方法,所述计算所述第一数量的子序列之间在特征分布上的相似性以及将具有相似性的多个子序列合并为一个子序列,包括:
在第一轮计算中执行:在第一数量的子序列中的每两个相邻子序列之间设置一个待定分隔点;针对每一个待定分隔点均执行:将时间序列按照当前待定分隔点划分为两个序列对象,计算对应于该当前待定分隔点的、该两个序列对象在特征分布上的差异性分值;从第一轮计算出的各个差异性分值中选择最大的差异性分值;以及,将选择出的最大差异性分值所对应的待定分隔点更改为已定分隔点;
在后续的第M轮计算中执行:针对剩余的每一个待定分隔点均执行:将时间序列按照当前待定分隔点以及各已定分隔点划分为L个序列对象,计算该L个序列对象中每两个相邻序列对象在特征分布上的区别得分,利用计算出的M个区别得分得到对应于该当前待定分隔点的差异性分值;从第M轮计算出的对应于各个待定分隔点的各个差异性分值中选择最大的差异性分值;以及将选择出的该最大差异性分值所对应的待定分隔点更改为已定分隔点;
同时,在每一轮的计算结束后,均判断当前是否达到结束条件,如果否,则进行下一轮计算,如果是,则按照各个已定分隔点划分时间序列,从而得到第二数量的子序列。
6.根据权利要求5所述的方法,所述利用计算出的M个区别得分得到对应于该当前待定分隔点的差异性分值,包括:
计算所述M个区别得分的平均值,将计算出的平均值作为所述对应于该当前待定分隔点的差异性分值;
或者,
针对所述M个区别得分中的每一个区别得分,均计算该区别得分对应的相邻两个序列对象的总字段长度,将该总字段长度除以时间序列的字段长度,从而得到该区别得分对应的加权值;利用M个加权值对M个区别得分进行加权平均,从而计算出该当前待定分隔点的差异性分值。
7.根据权利要求5所述的方法,所述判断当前是否达到结束条件,包括:
判断当前是否已经完成预设轮数的计算;
或者,
判断在本轮计算中选择出的最大差异性分值是否大于预设的分数阈值。
8.根据权利要求1所述的方法,所述交易事件的特征的重要性包括:特征的分值;
所述针对每一个子序列,根据所确定出的每一种类型的交易事件的特征的重要性,得到每一种类型的交易事件的特征相对于该子序列的重要性,包括:
针对每一种类型的交易事件的特征的分值,将该特征的分值分解到每一个子序列,从而得到该类型的交易事件的特征相对于每一个子序列的可解释性分值。
9.交易风险的预测结果的解释装置,其中,该装置包括:
时间序列获取模块,配置为得到时间序列;该时间序列是:由至少两个交易事件的特征按照时间顺序形成的序列;并且,该时间序列被输入机器学习模型,以使得该机器学习模型根据该时间序列输出针对交易风险的预测结果;
序列划分模块,配置为将所述时间序列划分为至少两个子序列;
可解释性计算模块,配置为针对时间序列中的每一种类型的交易事件的特征,确定该类型特征在用于得到所述针对交易风险的预测结果时的重要性;针对每一个子序列,根据所确定出的每一种类型的交易事件的特征的重要性,得到每一种类型的交易事件的特征相对于该子序列的重要性。
10.一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现权利要求1-8中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310133681.8A CN115829755B (zh) | 2023-02-07 | 2023-02-07 | 交易风险的预测结果的解释方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310133681.8A CN115829755B (zh) | 2023-02-07 | 2023-02-07 | 交易风险的预测结果的解释方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115829755A true CN115829755A (zh) | 2023-03-21 |
CN115829755B CN115829755B (zh) | 2023-05-26 |
Family
ID=85521847
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310133681.8A Active CN115829755B (zh) | 2023-02-07 | 2023-02-07 | 交易风险的预测结果的解释方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115829755B (zh) |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111507461A (zh) * | 2020-04-13 | 2020-08-07 | 支付宝(杭州)信息技术有限公司 | 可解释性信息确定方法及装置 |
DE102020206187A1 (de) * | 2019-05-17 | 2020-11-19 | Robert Bosch Gesellschaft mit beschränkter Haftung | System und verfahren für interpretierbare sequenz- und zeitreihen-datenmodellierung |
CN112116464A (zh) * | 2020-05-21 | 2020-12-22 | 上海金融期货信息技术有限公司 | 基于事件序列频繁项集的异常交易行为分析方法和系统 |
CN113159128A (zh) * | 2021-03-24 | 2021-07-23 | 西北大学 | 一种基于快速提取shapelets的分类算法判断交通事故的方法 |
CN113762647A (zh) * | 2021-10-19 | 2021-12-07 | 咪咕文化科技有限公司 | 一种数据的预测方法、装置及设备 |
CN114004340A (zh) * | 2021-11-15 | 2022-02-01 | 南开大学 | 一种基于序列变换的循环神经网络可解释性方法、系统 |
CN114091684A (zh) * | 2021-11-05 | 2022-02-25 | 支付宝(杭州)信息技术有限公司 | 增强业务结果可解释性的方法及装置 |
CN114187009A (zh) * | 2021-12-20 | 2022-03-15 | 平安付科技服务有限公司 | 交易风险预测模型的特征解释方法、装置、设备及介质 |
CN115034788A (zh) * | 2021-03-08 | 2022-09-09 | 腾讯科技(深圳)有限公司 | 交易风险评估方法及装置、电子设备、存储介质 |
CN115099416A (zh) * | 2022-06-14 | 2022-09-23 | 中山大学 | 集成水文气象机器学习预报模型的可视化事后解释方法 |
US20220383157A1 (en) * | 2021-05-31 | 2022-12-01 | Microsoft Technology Licensing, Llc | Interpretable machine learning for data at scale |
CN115526382A (zh) * | 2022-09-09 | 2022-12-27 | 扬州大学 | 一种路网级交通流预测模型可解释性分析方法 |
-
2023
- 2023-02-07 CN CN202310133681.8A patent/CN115829755B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102020206187A1 (de) * | 2019-05-17 | 2020-11-19 | Robert Bosch Gesellschaft mit beschränkter Haftung | System und verfahren für interpretierbare sequenz- und zeitreihen-datenmodellierung |
CN111507461A (zh) * | 2020-04-13 | 2020-08-07 | 支付宝(杭州)信息技术有限公司 | 可解释性信息确定方法及装置 |
CN112116464A (zh) * | 2020-05-21 | 2020-12-22 | 上海金融期货信息技术有限公司 | 基于事件序列频繁项集的异常交易行为分析方法和系统 |
CN115034788A (zh) * | 2021-03-08 | 2022-09-09 | 腾讯科技(深圳)有限公司 | 交易风险评估方法及装置、电子设备、存储介质 |
CN113159128A (zh) * | 2021-03-24 | 2021-07-23 | 西北大学 | 一种基于快速提取shapelets的分类算法判断交通事故的方法 |
US20220383157A1 (en) * | 2021-05-31 | 2022-12-01 | Microsoft Technology Licensing, Llc | Interpretable machine learning for data at scale |
CN113762647A (zh) * | 2021-10-19 | 2021-12-07 | 咪咕文化科技有限公司 | 一种数据的预测方法、装置及设备 |
CN114091684A (zh) * | 2021-11-05 | 2022-02-25 | 支付宝(杭州)信息技术有限公司 | 增强业务结果可解释性的方法及装置 |
CN114004340A (zh) * | 2021-11-15 | 2022-02-01 | 南开大学 | 一种基于序列变换的循环神经网络可解释性方法、系统 |
CN114187009A (zh) * | 2021-12-20 | 2022-03-15 | 平安付科技服务有限公司 | 交易风险预测模型的特征解释方法、装置、设备及介质 |
CN115099416A (zh) * | 2022-06-14 | 2022-09-23 | 中山大学 | 集成水文气象机器学习预报模型的可视化事后解释方法 |
CN115526382A (zh) * | 2022-09-09 | 2022-12-27 | 扬州大学 | 一种路网级交通流预测模型可解释性分析方法 |
Non-Patent Citations (3)
Title |
---|
BORIS N. ORESHKIN ET AL: "N-BEATS: Neural basis expansion analysis for interpretable time series forecasting", 《ARXIV》 * |
曲文龙;张克君;杨炳儒;游福成;: "基于奇异事件特征聚类的时间序列符号化方法", 系统工程与电子技术 * |
陈孝文等: "基于时域融合Transformers的可解释预测模型及其应用研究", 《武汉理工大学学报(信息与管理工程版)》 * |
Also Published As
Publication number | Publication date |
---|---|
CN115829755B (zh) | 2023-05-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111709533B (zh) | 机器学习模型的分布式训练方法、装置以及计算机设备 | |
US11256990B2 (en) | Memory-efficient backpropagation through time | |
EP4053716A1 (en) | Information recommendation method, apparatus, recommendation server and storage medium | |
CN108182633B (zh) | 贷款数据处理方法、装置、计算机设备和存储介质 | |
US11295236B2 (en) | Machine learning in heterogeneous processing systems | |
US20230108469A1 (en) | Systems and methods for generating dynamic conversational responses using cluster-level collaborative filtering matrices | |
CN110264270A (zh) | 一种行为预测方法、装置、设备和存储介质 | |
CN111767455A (zh) | 一种信息推送的方法和装置 | |
US20220391672A1 (en) | Multi-task deployment method and electronic device | |
CN114626585A (zh) | 一种基于生成对抗网络的城市轨道交通短时客流预测方法 | |
CN111159481B (zh) | 图数据的边预测方法、装置及终端设备 | |
EP3745317A1 (en) | Apparatus and method for analyzing time series data based on machine learning | |
CN115145812A (zh) | 测试用例生成方法、装置、电子设备和存储介质 | |
CN114782201A (zh) | 股票推荐方法、装置、计算机设备和存储介质 | |
CN112836750A (zh) | 一种系统资源分配方法、装置及设备 | |
CN115829755A (zh) | 交易风险的预测结果的解释方法和装置 | |
CN116186603A (zh) | 异常用户的识别方法及装置、计算机存储介质、电子设备 | |
CN113822390B (zh) | 用户画像构建方法、装置、电子设备和存储介质 | |
CN109685091A (zh) | 使用贝叶斯方式的数字体验目标确定 | |
CN111325350B (zh) | 可疑组织发现系统和方法 | |
CN112927012A (zh) | 营销数据的处理方法及装置、营销模型的训练方法及装置 | |
CN112200488A (zh) | 针对业务对象的风险识别模型训练方法及装置 | |
CN112950392A (zh) | 信息展示方法、后验信息确定方法及装置及相关设备 | |
CN117539948B (zh) | 基于深度神经网络的业务数据检索方法及装置 | |
CN111159515B (zh) | 数据处理方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |