CN116051118B - 行为时序模型的分析方法及装置 - Google Patents

行为时序模型的分析方法及装置 Download PDF

Info

Publication number
CN116051118B
CN116051118B CN202310209134.3A CN202310209134A CN116051118B CN 116051118 B CN116051118 B CN 116051118B CN 202310209134 A CN202310209134 A CN 202310209134A CN 116051118 B CN116051118 B CN 116051118B
Authority
CN
China
Prior art keywords
behavior
time sequence
data set
sequence data
characteristic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310209134.3A
Other languages
English (en)
Other versions
CN116051118A (zh
Inventor
宋博文
张华杰
庄福振
张天翼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN202310209134.3A priority Critical patent/CN116051118B/zh
Publication of CN116051118A publication Critical patent/CN116051118A/zh
Application granted granted Critical
Publication of CN116051118B publication Critical patent/CN116051118B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/40Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
    • G06Q20/401Transaction verification
    • G06Q20/4016Transaction verification involving fraud or risk level assessment in transaction processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Accounting & Taxation (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Finance (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computer Security & Cryptography (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本说明书一个或多个实施例公开了一种行为时序模型的分析方法及装置。所述方法包括:将第一行为时序数据集输入预训练的风险预测模型,得到第一行为时序数据集对应的预测结果。针对各第一行为特征,将第一行为特征对应的第二行为时序数据集输入风险预测模型,得到第二行为时序数据集对应的预测结果,第二行为时序数据集中不包括第一行为特征。根据预测结果,确定N个行为特征对于风险预测模型进行风险预测的贡献信息。贡献信息包括各第一行为特征对应的特征贡献值、第一行为时序数据集中的关键行为特征与第二行为特征之间的特征交互所产生的交互贡献值以及关键行为特征对应的时序敏感值,第二行为特征与关键行为特征之间时序相邻。

Description

行为时序模型的分析方法及装置
技术领域
本说明书涉及人工智能技术领域,尤其涉及一种行为时序模型的分析方法及装置。
背景技术
目前,线上支付应用已深入人们的生活和工作中。第三方支付平台为人们带来了极大方便,但与此同时,第三方支付平台上的相关支付产品被一些人恶意利用以进行不法活动,比如诈骗等,从而为线上支付带来极大风险,如何准确及时地识别风险并做出相应管控,是风险防控人员的主要工作内容。
随着计算机技术的发展,机器学习已经在工业界取得了长足的发展以及广泛的应用,其中,深度学习技术因为其特有的信息表达能力,近几年在语音、图像、文本等领域得到了广泛的应用,有着非常高的应用渗透率。在风险防控场景中,基于用户的行为时序也有一套相应的深度学习模型体系,该套模型体系已经在多个风险防控场景中获得应用,在风险识别效率以及建模效率的提升上发挥了重要的作用。然而,随着深度学习的广泛应用,模型结构中存在的黑盒属性给后续风险运营分析带来了不小的困难。因此,如何对深度行为时序模型进行分析,减弱黑盒属性所造成的影响,是当下深度学习研究中的一个非常关键的问题。
发明内容
一方面,本说明书一个或多个实施例提供一种行为时序模型的分析,包括:将第一行为时序数据集输入预训练的风险预测模型,得到所述第一行为时序数据集对应的预测结果,所述第一行为时序数据集包括样本用户依次执行的N个行为分别对应的行为特征,所述N为大于1的整数。针对N个行为特征中的各第一行为特征,将所述第一行为特征对应的第二行为时序数据集输入所述风险预测模型,得到所述第二行为时序数据集对应的预测结果,所述第二行为时序数据集中不包括所述第一行为特征。根据所述第一行为时序数据集对应的预测结果和所述第二行为时序数据集对应的预测结果,确定所述N个行为特征对于所述风险预测模型进行风险预测的贡献信息。所述贡献信息包括:各所述第一行为特征对应的特征贡献值、所述第一行为时序数据集中的关键行为特征与第二行为特征之间的特征交互所产生的交互贡献值、以及所述关键行为特征对应的时序敏感值,所述第二行为特征与所述关键行为特征之间时序相邻。
另一方面,本说明书一个或多个实施例提供一种行为时序模型的分析方法,包括:将第一行为时序数据集输入预训练的行为时序模型,得到所述第一行为时序数据集对应的预测结果,所述第一行为时序数据集包括样本用户依次执行的N个行为分别对应的行为特征,所述N为大于1的整数。针对N个行为特征中的各第一行为特征,将所述第一行为特征对应的第二行为时序数据集输入所述行为时序模型,得到所述第二行为时序数据集对应的预测结果,所述第二行为时序数据集中不包括所述第一行为特征。根据所述第一行为时序数据集对应的预测结果和所述第二行为时序数据集对应的预测结果,确定所述N个行为特征对于所述行为时序模型进行预测的贡献信息。所述贡献信息包括:各所述第一行为特征对应的特征贡献值、所述第一行为时序数据集中的关键行为特征与第二行为特征之间的特征交互所产生的交互贡献值、以及所述关键行为特征对应的时序敏感值,所述第二行为特征与所述关键行为特征之间时序相邻。
再一方面,本说明书一个或多个实施例提供一种行为时序模型的分析装置,包括:第一预测模块,将第一行为时序数据集输入预训练的风险预测模型,得到所述第一行为时序数据集对应的预测结果,所述第一行为时序数据集包括样本用户依次执行的N个行为分别对应的行为特征,所述N为大于1的整数。第二预测模块,针对N个行为特征中的各第一行为特征,将所述第一行为特征对应的第二行为时序数据集输入所述风险预测模型,得到所述第二行为时序数据集对应的预测结果,所述第二行为时序数据集中不包括所述第一行为特征。第一确定模块,根据所述第一行为时序数据集对应的预测结果和所述第二行为时序数据集对应的预测结果,确定所述N个行为特征对于所述风险预测模型进行风险预测的贡献信息,所述贡献信息包括:各所述第一行为特征对应的特征贡献值、所述第一行为时序数据集中的关键行为特征与第二行为特征之间的特征交互所产生的交互贡献值、以及所述关键行为特征对应的时序敏感值,所述第二行为特征与所述关键行为特征之间时序相邻。
再一方面,本说明书一个或多个实施例提供一种行为时序模型的分析装置,包括:第三预测模块,将第一行为时序数据集输入预训练的行为时序模型,得到所述第一行为时序数据集对应的预测结果,所述第一行为时序数据集包括样本用户依次执行的N个行为分别对应的行为特征,所述N为大于1的整数。第四预测模块,针对N个行为特征中的各第一行为特征,将所述第一行为特征对应的第二行为时序数据集输入所述行为时序模型,得到所述第二行为时序数据集对应的第预测结果,所述第二行为时序数据集中不包括所述第一行为特征。第二确定模块,根据所述第一行为时序数据集对应的预测结果和所述第二行为时序数据集对应的预测结果,确定所述N个行为特征对于所述行为时序模型进行预测的贡献信息,所述贡献信息包括:各所述第一行为特征对应的特征贡献值、所述第一行为时序数据集中的关键行为特征与第二行为特征之间的特征交互所产生的交互贡献值、以及所述关键行为特征对应的时序敏感值,所述第二行为特征与所述关键行为特征之间时序相邻。
再一方面,本说明书一个或多个实施例提供一种行为时序模型的分析设备,包括处理器和与所述处理器电连接的存储器,所述存储器存储有计算机程序,所述处理器用于从所述存储器调用并执行所述计算机程序以实现:将第一行为时序数据集输入预训练的风险预测模型,得到所述第一行为时序数据集对应的预测结果,所述第一行为时序数据集包括样本用户依次执行的N个行为分别对应的行为特征,所述N为大于1的整数。针对N个行为特征中的各第一行为特征,将所述第一行为特征对应的第二行为时序数据集输入所述风险预测模型,得到所述第二行为时序数据集对应的预测结果,所述第二行为时序数据集中不包括所述第一行为特征。根据所述第一行为时序数据集对应的预测结果和所述第二行为时序数据集对应的预测结果,确定所述N个行为特征对于所述风险预测模型进行风险预测的贡献信息。所述贡献信息包括:各所述第一行为特征对应的特征贡献值、所述第一行为时序数据集中的关键行为特征与第二行为特征之间的特征交互所产生的交互贡献值、以及所述关键行为特征对应的时序敏感值,所述第二行为特征与所述关键行为特征之间时序相邻。
再一方面,本说明书一个或多个实施例提供一种行为时序模型的分析设备,包括处理器和与所述处理器电连接的存储器,所述存储器存储有计算机程序,所述处理器用于从所述存储器调用并执行所述计算机程序以实现:将第一行为时序数据集输入预训练的行为时序模型,得到所述第一行为时序数据集对应的预测结果,所述第一行为时序数据集包括样本用户依次执行的N个行为分别对应的行为特征,所述N为大于1的整数。针对N个行为特征中的各第一行为特征,将所述第一行为特征对应的第二行为时序数据集输入所述行为时序模型,得到所述第二行为时序数据集对应的预测结果,所述第二行为时序数据集中不包括所述第一行为特征。根据所述第一行为时序数据集对应的预测结果和所述第二行为时序数据集对应的预测结果,确定所述N个行为特征对于所述行为时序模型进行预测的贡献信息。所述贡献信息包括:各所述第一行为特征对应的特征贡献值、所述第一行为时序数据集中的关键行为特征与第二行为特征之间的特征交互所产生的交互贡献值、以及所述关键行为特征对应的时序敏感值,所述第二行为特征与所述关键行为特征之间时序相邻。
再一方面,本说明书实施例提供一种存储介质,用于存储计算机程序,所述计算机程序能够被处理器执行以实现以下流程:将第一行为时序数据集输入预训练的风险预测模型,得到所述第一行为时序数据集对应的预测结果,所述第一行为时序数据集包括样本用户依次执行的N个行为分别对应的行为特征,所述N为大于1的整数。针对N个行为特征中的各第一行为特征,将所述第一行为特征对应的第二行为时序数据集输入所述风险预测模型,得到所述第二行为时序数据集对应的预测结果,所述第二行为时序数据集中不包括所述第一行为特征。根据所述第一行为时序数据集对应的预测结果和所述第二行为时序数据集对应的预测结果,确定所述N个行为特征对于所述风险预测模型进行风险预测的贡献信息。所述贡献信息包括:各所述第一行为特征对应的特征贡献值、所述第一行为时序数据集中的关键行为特征与第二行为特征之间的特征交互所产生的交互贡献值、以及所述关键行为特征对应的时序敏感值,所述第二行为特征与所述关键行为特征之间时序相邻。
再一方面,本说明书实施例提供一种存储介质,用于存储计算机程序,所述计算机程序能够被处理器执行以实现以下流程:将第一行为时序数据集输入预训练的行为时序模型,得到所述第一行为时序数据集对应的预测结果,所述第一行为时序数据集包括样本用户依次执行的N个行为分别对应的行为特征,所述N为大于1的整数。针对N个行为特征中的各第一行为特征,将所述第一行为特征对应的第二行为时序数据集输入所述行为时序模型,得到所述第二行为时序数据集对应的预测结果,所述第二行为时序数据集中不包括所述第一行为特征。根据所述第一行为时序数据集对应的预测结果和所述第二行为时序数据集对应的预测结果,确定所述N个行为特征对于所述行为时序模型进行预测的贡献信息。所述贡献信息包括:各所述第一行为特征对应的特征贡献值、所述第一行为时序数据集中的关键行为特征与第二行为特征之间的特征交互所产生的交互贡献值、以及所述关键行为特征对应的时序敏感值,所述第二行为特征与所述关键行为特征之间时序相邻。
附图说明
为了更清楚地说明本说明书一个或多个实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书一个或多个实施例中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本说明书一实施例的一种行为时序模型的分析方法的示意性流程图;
图2是根据本说明书一实施例的一种风险检测模型的分析方法的示意性原理图;
图3是根据本说明书一实施例的一种风险检测模型的分析方法的示意性流程图;
图4是根据本说明书另一实施例的一种行为时序模型的分析方法的示意性流程图;
图5是根据本说明书一实施例的一种行为时序模型的分析装置的示意性框图;
图6是根据本说明书另一实施例的一种行为时序模型的分析装置的示意性框图;
图7是根据本说明书一实施例的一种行为时序模型的分析设备的示意性框图。
具体实施方式
本说明书一个或多个实施例提供一种行为时序模型的分析方法及装置,以解决由模型黑盒属性导致的模型分析难度大的问题。
为了使本技术领域的人员更好地理解本说明书一个或多个实施例中的技术方案,下面将结合本说明书一个或多个实施例中的附图,对本说明书一个或多个实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书一个或多个实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书一个或多个实施例保护的范围。
图1是根据本说明书一实施例的一种行为时序模型的分析方法的示意性流程图,如图1所示,该方法包括:
S102,将第一行为时序数据集输入预训练的风险预测模型,得到第一行为时序数据集对应的预测结果;第一行为时序数据集包括样本用户依次执行的N个行为分别对应的行为特征;N为大于1的整数。
其中,风险测试模型基于多个样本用户对应的样本行为时序数据集训练得到。每个样本用户对应的样本行为时序集均包括样本用户依次执行N个行为分别对应的行为特征。
以支付场景为例,样本用户为执行线上交易事件的用户,样本行为时序数据集是由样本用户执行一次线上交易事件时、依次执行的多个交易行为的行为特征组合而成的集合。例如,样本用户在执行线上交易事件时,依次执行了“扫描二维码、输入支付金额、输入密码、确认转账”这4个交易行为,每个交易行为均对应有个各自的行为特征,那么该样本用户对应的样本行为时序数据集即为由“扫描二维码、输入支付金额、输入密码、确认转账”这4个交易行为分别对应的行为特征组合而成的集合。
第一行为时序数据集对应的样本用户可以是预训练风险预测模型时所依据的样本用户,也可以是训练风险预测模型之后、重新采集到的执行特定类型事件的用户。
S104,针对N个行为特征中的各第一行为特征,将第一行为特征对应的第二行为时序数据集输入风险预测模型,得到第二行为时序数据集对应的预测结果;第二行为时序数据集中不包括第一行为特征。
其中,第一行为特征是N个行为特征中的任一个。第一行为特征对应的第二行为时序数据集即为:从第一行为时序数据集中除去第一行为特征后得到的行为时序数据集。在确定不同的贡献信息时,第一行为特征对应的第二行为时序数据集也随之不同,这一点将在后续实施例中详细说明。
可以看出,第一行为时序数据集和第二行为时序数据集的区别在于:第一行为时序数据集包括了全部的N个行为特征,而第二行为时序数据集则不包括第一行为特征,即,第二行为时序数据集仅包括N个行为特征中的部分行为特征。仍以上述线上交易事件为例,假设N个行为特征为“扫描二维码、输入支付金额、输入密码、确认转账”这4个交易行为分别对应的行为特征,第一行为特征为“输入密码”这一交易行为对应的行为特征,那么第一行为时序数据集即为由“扫描二维码、输入支付金额、输入密码、确认转账”这4个交易行为分别对应的行为特征组合而成的集合,第二行为时序数据集可以是:由“扫描二维码、输入支付金额、确认转账”这3个交易行为分别对应的行为特征组合而成的集合;或者,由“扫描二维码、确认转账”这2个交易行为分别对应的行为特征组合而成的集合;等等。
S106,根据第一行为时序数据集对应的预测结果和第二行为时序数据集对应的预测结果,确定N个行为特征对于风险预测模型进行风险预测的贡献信息;贡献信息包括:各第一行为特征对应的特征贡献值、第一行为时序数据集中的关键行为特征与第二行为特征之间的特征交互所产生的交互贡献值、以及关键行为特征对应的时序敏感值;第二行为特征与关键行为特征之间时序相邻。
其中,第一行为特征对应的特征贡献值,指的是第一行为特征本身对于风险预测模型的预测结果的贡献值,例如,第一行为特征存在与否,对于风险预测模型的预测结果会发生何种变化。
关键行为特征可包括特征贡献值较高的行为特征。第二行为特征指的是与关键行为特征之间时序相邻的行为特征,例如在由“扫描二维码、输入支付金额、输入密码、确认转账”这4个交易行为分别对应的行为特征组成的第一行为时序数据集中,若关键行为特征为交易行为“输入支付金额”对应的行为特征,则该关键行为特征对应的第二行为特征可包括“扫描二维码”对应的行为特征以及“输入密码”对应的行为特征。
关键行为特征与第二行为特征之间的特征交互所产生的交互贡献值,指的是关键行为特征与第二行为特征分别对应的行为之间会发生交互,并且这种交互会影响风险预测模型的预测结果。例如,“输入密码”和“确认转账”这两个交易行为之间存在交互(如,确认转账时需要验证输入的密码是否正确),那么该交互对于风险预测模型的预测结果的影响程度即为交互贡献值。
关键行为特征对应的时序敏感值,指的是关键行为特征在行为时序数据集(第一行为时序数据集或者第二行为时序数据集)中的时序信息对于风险预测模型的预测结果的影响。例如,在由“扫描二维码、输入支付金额、输入密码、确认转账”这4个交易行为分别对应的行为特征组成的第一行为时序数据集中,关键行为特征为交易行为“输入支付金额”对应的行为特征,且关键行为特征的时序信息为:位于第一行为时序数据集中的第二位。若将关键行为特征的时序信息进行扰动,以使关键行为特征的时序信息发生变化(如变化为位于第一行为时序数据集中的第三位),这种扰动对于风险预测模型的预测结果的影响程度即为时序敏感值。
采用本说明书一个或多个实施例的技术方案,通过将第一行为时序数据集输入预训练的风险预测模型,得到第一行为时序数据集对应的预测结果,并针对第一行为时序数据集中的每个第一行为特征,将第一行为特征对应的第二行为时序数据集输入风险预测模型,得到第二行为时序数据集对应的预测结果,其中,第二行为时序数据集中不包括第一行为特征。进而根据第一行为时序数据集对应的预测结果和第二行为时序数据集对应的预测结果,确定第一行为时序数据集中的N个行为特征对于风险预测模型进行风险预测的贡献信息。其中,贡献信息包括:各第一行为特征对应的特征贡献值、第一行为时序数据集中的关键行为特征与第二行为特征之间的特征交互所产生的交互贡献值、以及关键行为特征对应的时序敏感值,第二行为特征与关键行为特征之间时序相邻。可见,该技术方案对于预训练的风险检测模型,不仅能够分析出每个行为特征本身对于风险检测模型的预测结果的特征贡献值,同时能够分析出关键行为特征和与其时序相邻的第二行为特征之间的交互所产生的交互贡献值,以及分析出关键行为特征的时序信息所产生的的时序敏感值,从而能够更加完整地描述各行为特征的相关信息(如特征本身、特征交互或特征时序)对于风险检测模型的预测结果的影响,使得风险检测模型的可解释性更高。进一步使风险检测模型的应用价值更高,例如在风险防控场景中,利用风险检测模型的可解释性分析模型性能以及优化模型。
在一个实施例中,根据第一行为时序数据集对应的预测结果和第二行为时序数据集对应的预测结果,确定N个行为特征对于风险预测模型进行风险预测的贡献信息时,可执行为以下步骤A1-A3:
步骤A1,针对每个第一行为特征,根据第一行为时序数据集对应的预测结果和第二行为时序数据集对应的预测结果,计算第一行为特征对应的特征贡献值。
步骤A2,根据各第一行为特征分别对应的特征贡献值,确定N个行为特征中的至少一个关键行为特征。
可选地,可根据特征贡献值的大小从N个行为特征中筛选出关键行为特征。预设一个特征贡献阈值,在计算出N个行为特征中每个行为特征对应的特征贡献值之后,针对每个特征贡献值,判断特征贡献值是否大于或等于预设特征贡献阈值,若是,则确定特征贡献值对应的第一行为特征为关键行为特征;否则,确定特征贡献值对应的第一行为特征不为关键行为特征。
步骤A3,计算关键行为特征对应的交互贡献值,以及,计算关键行为特征对应的时序敏感值。
本实施例中,通过先计算出N个行为特征中每个行为特征分别对应的特征贡献值,然后基于该特征贡献值筛选出N个行为特征中的关键行为特征,进而再针对每个关键行为特征,计算关键行为特征对应的交互贡献值和时序敏感度。也就是说,对于不属于关键行为特征的其它行为特征,由于这部分行为特征对于风险检测模型的预测结果的影响程度较低,因此无需再计算这部分行为特征对应的交互贡献值和时序敏感度,从而不仅提升对风险检测模型的分析效率,且使得模型分析具备针对性、高准确性。
在一个实施例中,第一行为特征对应多个第二行为时序数据集,第二行为时序数据集属于第一行为时序数据集。在执行上述步骤A1(即计算第一行为特征对应的特征贡献值)时,可执行为以下动作:首先,针对每个第二行为时序数据集,计算第二行为时序数据集和第一行为特征的组合对应的预测结果以及第二行为时序数据集对应的预测结果之间的第一差值;其次,根据第一差值、第二行为时序数据集中包括的行为特征数量以及第一行为时序数据集中包括的行为特征数量,计算第二行为时序数据集对应的子特征贡献值;再次,对各第二行为时序数据集分别对应的子特征贡献值进行求和计算,得到第一行为特征对应的特征贡献值。
可选地,第一行为特征对应的特征贡献值的计算方式可表示为以下公式:
Figure SMS_1
上述公式中,以
Figure SMS_5
表示第一行为特征,D表示第一行为时序数据集,S表示第二行为时序数据集,u表示模型预测结果,/>
Figure SMS_11
表示第一行为时序数据集D中所包括的行为特征的数量。/>
Figure SMS_13
表示第二行为时序数据集S中包括的行为特征的数量。/>
Figure SMS_3
表示第一行为特征/>
Figure SMS_7
对应的特征贡献值,/>
Figure SMS_9
表示:第二行为时序数据集S属于第一行为时序数据集D,即第二行为时序数据集S为第一行为时序数据集D的子集,并且第二行为时序数据集S不包括第一行为特征/>
Figure SMS_12
。/>
Figure SMS_2
表示将第二行为时序数据集S输入风险检测模型后,风险检测模型输出的预测结果,即第二行为时序数据集S对应的预测结果。/>
Figure SMS_8
表示第二行为时序数据集S和第一行为特征/>
Figure SMS_14
的组合,若将第一行为特征/>
Figure SMS_15
看作一个仅包括一个元素的集合,即/>
Figure SMS_4
,则
Figure SMS_6
表示两个集合的并集。/>
Figure SMS_10
表示将第二行为时序数据集和第一行为特征的组合(即上述并集)输入风险检测模型后,风险检测模型输出的预测结果。
在计算第一行为特征对应的特征贡献值时,由于第二行为时序数据集属于第一行为时序数据集的子集、且不包括第一行为特征,因此,对于每个第一行为特征而言,通常可包括多个第二行为时序数据集。例如,第一行为时序数据集为{A,B,C,D},其中,A、B、C、D分别表示不同的行为特征。假设将A作为当前的第一行为特征,则第一行为特征对应的第二行为特征数据集可包括:{B},{C},{D},{B,C},{B,D},{C,D},{B,C,D}。显然,每个第二行为特征数据集均对应各自的预测结果。
在一个实施例中,第一行为特征对应多个第二行为时序数据集,第二行为时序数据集包括:属于第一行为时序数据集、且包括第二行为特征的第三行为时序数据集;以及,属于第一行为时序数据集、且不包括第二行为特征的第四行为时序数据集。在计算关键行为特征对应的交互贡献值时,可首先计算第三行为时序数据集对应的第一交互贡献值,以及计算第四行为时序数据集对应的第二交互贡献值。然后,根据第一交互贡献值和第二交互贡献值,确定关键行为特征对应的交互贡献值。
其中,在第一行为特征为关键行为特征的情况下,第二行为时序数据集中不包括关键行为特征。因此,第三行为时序数据集和第四行为时序数据集均不包括关键行为特征。
由于第三行为时序数据集不包括关键行为特征、且包括第二行为特征,第四行为时序数据集不包括关键行为特征、且不包括第二行为特征。因此,关键行为特征对应的交互贡献值也可理解为:在行为时序数据集中不存在第一行为特征(即关键行为特征)的情况下,行为时序数据集中是否存在第二行为特征对于风险检测模型的预测结果的影响程度。具体地,关键行为特征对应的第一交互贡献值可以理解为:在行为时序数据集中不存在第一行为特征(即关键行为特征)的情况下,行为时序数据集中存在第二行为特征对于风险检测模型的预测结果的影响程度。关键行为特征对应的第二交互贡献值可以理解为:在行为时序数据集中不存在第一行为特征(即关键行为特征)的情况下,行为时序数据集中不存在第二行为特征对于风险检测模型的预测结果的影响程度。
本实施例中,在计算第三行为时序数据集对应的第一交互贡献值时,可执行为以下步骤B1-B3:
步骤B1,针对每个第三行为时序数据集,计算第三行为时序数据集和第一行为特征的组合对应的预测结果以及第三行为时序数据集对应的预测结果之间的第二差值。
步骤B2,根据第二差值、第三行为时序数据集中包括的行为特征数量以及第一行为时序数据集中包括的行为特征数量,计算第三行为时序数据集对应的第一子交互贡献值。
步骤B3,对各第三行为时序数据集对应的第一子交互贡献值进行求和计算,得到关键行为特征对应的第一交互贡献值。
可选地,关键行为特征对应的第一交互贡献值的计算方式可表示为以下公式:
Figure SMS_16
上述公式中,以
Figure SMS_23
表示关键行为特征,/>
Figure SMS_20
表示与关键行为特征之间时序相邻的第二行为特征,D表示第一行为时序数据集,/>
Figure SMS_22
表示第三行为时序数据集,u表示模型预测结果,
Figure SMS_19
表示第一行为时序数据集D中所包括的行为特征的数量。/>
Figure SMS_26
表示第三行为时序数据集/>
Figure SMS_28
中包括的行为特征的数量。/>
Figure SMS_30
表示关键行为特征/>
Figure SMS_27
对应的第一交互贡献值,
Figure SMS_32
表示:第三行为时序数据集/>
Figure SMS_18
属于第一行为时序数据集D,即第三行为时序数据集/>
Figure SMS_25
为第一行为时序数据集D的子集,并且第三行为时序数据集/>
Figure SMS_35
包括第二行为特征/>
Figure SMS_37
。/>
Figure SMS_38
表示将第三行为时序数据集/>
Figure SMS_39
输入风险检测模型后,风险检测模型输出的预测结果,即第三行为时序数据集/>
Figure SMS_29
对应的预测结果。/>
Figure SMS_33
表示第三行为时序数据集/>
Figure SMS_34
和第一行为特征/>
Figure SMS_36
的组合,若将第一行为特征/>
Figure SMS_17
看作一个仅包括一个元素的集合,即/>
Figure SMS_21
,则
Figure SMS_24
表示两个集合的并集。/>
Figure SMS_31
表示将第三行为时序数据集和第一行为特征的组合(即上述并集)输入风险检测模型后,风险检测模型输出的预测结果。
在计算第四行为时序数据集对应的第二交互贡献值时,可执行为以下步骤C1-C3:
步骤C1,针对每个第四行为时序数据集,计算第四行为时序数据集和第一行为特征的组合对应的预测结果以及第四行为时序数据集对应的预测结果之间的第三差值。
步骤C2,根据第三差值、第四行为时序数据集中包括的行为特征数量以及第一行为时序数据集中包括的行为特征数量,计算第四行为时序数据集对应的第二子交互贡献值。
步骤C3,对各第四行为时序数据集对应的第二子交互贡献值进行求和计算,得到关键行为特征对应的第二交互贡献值。
可选地,关键行为特征对应的第二交互贡献值的计算方式可表示为以下公式:
Figure SMS_40
上述公式中,以
Figure SMS_49
表示关键行为特征,/>
Figure SMS_44
表示与关键行为特征之间时序相邻的第二行为特征,D表示第一行为时序数据集,/>
Figure SMS_46
表示第四行为时序数据集,u表示模型预测结果,
Figure SMS_52
表示第一行为时序数据集D中所包括的行为特征的数量。/>
Figure SMS_54
表示第四行为时序数据集
Figure SMS_57
中包括的行为特征的数量。/>
Figure SMS_60
表示关键行为特征/>
Figure SMS_58
对应的第二交互贡献值,
Figure SMS_62
表示:第四行为时序数据集/>
Figure SMS_41
属于第一行为时序数据集D,即第四行为时序数据集/>
Figure SMS_47
为第一行为时序数据集D的子集,并且第四行为时序数据集/>
Figure SMS_42
不包括第二行为特征/>
Figure SMS_50
。/>
Figure SMS_53
表示将第四行为时序数据集/>
Figure SMS_55
输入风险检测模型后,风险检测模型输出的预测结果,即第四行为时序数据集/>
Figure SMS_56
对应的预测结果。/>
Figure SMS_59
表示第四行为时序数据集/>
Figure SMS_61
和第一行为特征/>
Figure SMS_63
的组合,若将第一行为特征/>
Figure SMS_43
看作一个仅包括一个元素的集合,即/>
Figure SMS_45
,则
Figure SMS_48
表示两个集合的并集。/>
Figure SMS_51
表示将第四行为时序数据集和第一行为特征的组合(即上述并集)输入风险检测模型后,风险检测模型输出的预测结果。
在一个实施例中,每个关键行为特征对应有多个第二行为特征。基于此,在计算关键行为特征对应的时序敏感值时,可执行为以下步骤D1-D4:
步骤D1,针对每个关键行为特征,根据关键行为特征和各第二行为特征分别对应的时序信息,将关键行为特征和多个第二行为特征组合为第一关键行为序列。
其中,将关键行为特征和多个第二行为特征进行组合时,关键行为特征和多个第二行为特征的时序信息不变。也即,关键行为特征和各第二行为特征之间的时序关系保持不变。例如,第一行为时序数据集为{A,B,C,D},其中,A、B、C、D分别表示不同的行为特征。假设将B作为关键行为特征,则与关键行为特征B之间时序相邻的第二行为特征包括A和C。关键行为特征和多个第二行为特征组合成的第一关键行为序列即为{A,B,C}。
步骤D2,扰动第一关键行为序列中的各行为特征对应的时序信息,得到多个第二关键行为序列。
其中,扰动第一关键行为序列中的各行为特征对应的时序信息,目的是为了改变第一关键行为序列中的各行为特征之间的时序关系。由于本实施例是为了计算关键行为特征对应的时序敏感值,因此,对于第一关键行为序列进行扰动后,关键行为特征的时序信息必然会发生变化,也即,扰动方式需导致关键行为特征的时序信息发生变化。例如,对第一关键行为序列{A,B,C}进行扰动,得到以下多个第二关键行为序列:{B,A,C}、{A,C,B}。其中,第二关键行为序列{B,A,C}对应的扰动方式为:将关键行为特征B和位于其之前的第二行为特征A的时序位置进行调换。第二关键行为序列{A,C,B}对应的扰动方式为:将关键行为特征B和位于其之后的第二行为特征C的时序位置进行调换。
可选地,扰动某个关键行为特征对应的时序信息时,可以将关键行为特征和第二行为特征对应的时序位置进行调换,如上述示例中将关键行为特征B和位于其之前的第二行为特征A的时序位置进行调换。或者,可以将关键行为特征中的部分特征和第二行为特征中的部分特征进行调换,例如,将关键行为特征B表示为
Figure SMS_64
,第二行为特征A表示为
Figure SMS_65
,则可将关键行为特征B中的部分特征/>
Figure SMS_66
和第二行为特征A中的部分特征
Figure SMS_67
进行调换。
步骤D3,利用各第二关键行为序列替换第一行为时序数据集中的对应行为特征,得到各第二关键行为序列对应的第五行为时序数据集,并将第五行为时序数据集输入风险预测模型,得到第五行为时序数据集对应的预测结果。
其中,由于第一关键行为序列仅是第一行为时序数据集中的部分序列(或称之为子序列),因此为使预测结果更加准确,需要将第一关键行为序列扰动后得到的第二关键行为序列再加入至原始的第一行为时序数据集中,得到第五行为时序数据集。第一行为时序数据集中的对应行为特征的时序位置,即为第一关键行为序列在第一行为时序数据集中的时序位置。
沿用上述举例,对于第二关键行为序列{B,A,C},利用其替换第一行为时序数据集{A,B,C,D}中的对应行为特征后,可得到对应的第五行为时序数据集{B,A,C,D}。对于第二关键行为序列{A,C,B},利用其替换第一行为时序数据集{A,B,C,D}中的对应行为特征后,可得到对应的第五行为时序数据集{A,C,B,D}。
步骤D4,根据第一行为时序数据集对应的预测结果,以及各第五行为时序数据集对应的预测结果,确定关键行为特征对应的时序敏感值。
可选地,在执行步骤D4时,可先针对每个第五行为时序数据集,根据第一行为时序数据集对应的预测结果和第五行为时序数据集对应的预测结果,确定第五行为时序数据集对应的子时序敏感值。在确定出每个第五行为时序数据集分别对应的子时序敏感值之后,计算各第五行为时序数据集分别对应的子时序敏感值的均值,从而得到关键行为特征对应的时序敏感值。
其中,针对任一第五行为时序数据集,在确定第五行为时序数据集对应的子时序敏感值时,可计算第五行为时序数据集对应的预测结果和第一行为时序集对应的预测结果之间的差值(该差值为绝对值形式),并将该差值作为第五行为时序数据集对应的子时序敏感值。子时序敏感值能够反映出关键行为特征的时序信息对于风险检测模型的预测结果的影响程度,子时序敏感值越大,说明影响程度越高,反之,子时序敏感值越小,说明影响程度越低。
在一个实施例中,可将关键行为特征对应的所有第五行为时序数据集分别对应的子时序敏感值的均值,作为该关键行为特征对应的时序敏感值。在计算出第一行为时序数据集中的每个关键行为特征对应的时序敏感值之后,可对各个关键行为特征对应的时序敏感值进行均值计算,得到的均值即为第一行为时序数据集对应的时序敏感值。
在一个实施例中,可根据关键行为特征对应的时序敏感值和第一行为时序数据集对应的时序敏感值之间的大小关系,确定关键行为特征的时序信息对于风险检测模型的预测结果的影响程度。若关键行为特征对应的时序敏感值大于或等于第一行为时序数据集对应的时序敏感值,则可确定关键行为特征的时序信息对于风险检测模型的预测结果的影响程度较高。若关键行为特征对应的时序敏感值小于第一行为时序数据集对应的时序敏感值,则可确定关键行为特征的时序信息对于风险检测模型的预测结果的影响程度较低。
图2是根据本说明书一实施例的一种风险检测模型的分析方法的示意性原理图。图3是根据本说明书一实施例的一种风险检测模型的分析方法的示意性流程图。下面结合图2和图3,详细说明本申请实施例提供的风险检测模型的分析方法。如图3所示,风险检测模型的分析方法包括以下步骤:
S301,将第一行为时序数据集输入风险预测模型,得到第一行为时序数据集对应的预测结果;并且,针对第一行为时序数据集的每个行为特征,将行为特征对应的第二行为时序数据集分别输入风险预测模型,得到第二行为时序数据集对应的预测结果。
其中,每个行为特征分别对应有多个第二行为时序数据集。需要说明的是,图2中仅示例性地示出一个第二行为时序数据集,在实际应用中,需将行为特征对应的每个第二行为时序数据集分别输入风险预测模型,以确定每个第二行为时序数据集分别对应的预测结果。
S302,针对每个行为特征,根据第一行为时序数据集对应的预测结果和行为特征对应的每个第二行为时序数据集对应的预测结果,计算行为特征对应的特征贡献值。
详细的特征贡献值的计算方法已在上述实施例中说明,此处不再重复。经过这一步骤的计算,可得到第一行为时序数据集中的每个行为特征分别对应的特征贡献值。
S303,根据每个行为特征分别对应的特征贡献值,确定第一行为时序数据集中的至少一个关键行为特征。
其中,可根据特征贡献值的大小从多个行为特征中筛选出关键行为特征。预设一个特征贡献阈值,在计算出每个行为特征对应的特征贡献值之后,针对每个特征贡献值,判断特征贡献值是否大于或等于预设特征贡献阈值,若是,则确定特征贡献值对应的行为特征为关键行为特征;否则,确定特征贡献值对应的行为特征不为关键行为特征。
S304,计算关键行为特征对应的交互贡献值,以及,计算关键行为特征对应的时序敏感值。
在关键行为特征包括多个的情况下,需多次执行步骤S304。也即,对于筛选出的多个关键行为特征,需依次对每个关键行为特征,分别计算对应的交互贡献值和时序敏感值。
可见,采用本申请实施例提供的风险预测模型的技术方案,不仅能够分析出每个行为特征本身对于风险检测模型的预测结果的特征贡献值,同时能够分析出关键行为特征和与其时序相邻的第二行为特征之间的交互所产生的交互贡献值,以及分析出关键行为特征的时序信息所产生的的时序敏感值,从而能够更加完整地描述各行为特征的相关信息(如特征本身、特征交互或特征时序)对于风险检测模型的预测结果的影响,使得风险检测模型的可解释性更高。进一步使风险检测模型的应用价值更高,例如在风险防控场景中,利用风险检测模型的可解释性分析模型性能以及优化模型。
图4是根据本说明书另一实施例的一种行为时序模型的分析方法的示意性流程图,如图4所示,该方法包括:
S402,将第一行为时序数据集输入预训练的行为时序模型,得到第一行为时序数据集对应的预测结果;第一行为时序数据集包括样本用户依次执行的N个行为分别对应的行为特征;N为大于1的整数。
其中,行为时序模型基于多个样本用户对应的样本行为时序数据集训练得到。每个样本用户对应的样本行为时序集均包括样本用户依次执行N个行为分别对应的行为特征。第一行为时序数据集对应的样本用户可以是预训练行为时序模型时所依据的样本用户,也可以是训练行为时序模型之后、重新采集到的执行特定类型事件的用户。
S404,针对N个行为特征中的各第一行为特征,将第一行为特征对应的第二行为时序数据集输入行为时序模型,得到第二行为时序数据集对应的预测结果;第二行为时序数据集中不包括第一行为特征。
其中,第一行为特征是N个行为特征中的任一个。第一行为特征对应的第二行为时序数据集即为:从第一行为时序数据集中除去第一行为特征后得到的行为时序数据集。在确定不同的贡献信息时,第一行为特征对应的第二行为时序数据集也随之不同。可以看出,第一行为时序数据集和第二行为时序数据集的区别在于:第一行为时序数据集包括了全部的N个行为特征,而第二行为时序数据集则不包括第一行为特征,即,第二行为时序数据集仅包括N个行为特征中的部分行为特征。
S406,根据第一行为时序数据集对应的预测结果和第二行为时序数据集对应的预测结果,确定N个行为特征对于行为时序模型进行预测的贡献信息;贡献信息包括:各第一行为特征对应的特征贡献值、第一行为时序数据集中的关键行为特征与第二行为特征之间的特征交互所产生的交互贡献值、以及关键行为特征对应的时序敏感值;第二行为特征与关键行为特征之间时序相邻。
其中,第一行为特征对应的特征贡献值,指的是第一行为特征本身对于行为时序模型的预测结果的贡献值,例如,第一行为特征存在与否,对于行为时序模型的预测结果会发生何种变化。
关键行为特征可包括特征贡献值较高的行为特征,第二行为特征指的是与关键行为特征之间时序相邻的行为特征。关键行为特征与第二行为特征之间的特征交互所产生的交互贡献值,指的是关键行为特征与第二行为特征分别对应的行为之间会发生交互,并且这种交互会影响行为时序模型的预测结果。关键行为特征对应的时序敏感值,指的是关键行为特征在行为时序数据集(第一行为时序数据集或者第二行为时序数据集)中的时序信息对于行为时序模型的预测结果的影响。若将关键行为特征的时序信息进行扰动,以使关键行为特征的时序信息发生变化(如变化为位于第一行为时序数据集中的第三位),这种扰动对于行为时序模型的预测结果的影响程度即为时序敏感值。
采用本说明书一个或多个实施例的技术方案,通过将第一行为时序数据集输入预训练的行为时序模型,得到第一行为时序数据集对应的预测结果,并针对第一行为时序数据集中的每个第一行为特征,将第一行为特征对应的第二行为时序数据集输入行为时序模型,得到第二行为时序数据集对应的预测结果,其中,第二行为时序数据集中不包括第一行为特征。进而根据第一行为时序数据集对应的预测结果和第二行为时序数据集对应的预测结果,确定第一行为时序数据集中的N个行为特征对于行为时序模型进行预测的贡献信息。其中,贡献信息包括:各第一行为特征对应的特征贡献值、第一行为时序数据集中的关键行为特征与第二行为特征之间的特征交互所产生的交互贡献值、以及关键行为特征对应的时序敏感值,第二行为特征与关键行为特征之间时序相邻。可见,该技术方案对于预训练的行为时序模型,不仅能够分析出每个行为特征本身对于行为时序模型的预测结果的特征贡献值,同时能够分析出关键行为特征和与其时序相邻的第二行为特征之间的交互所产生的交互贡献值,以及分析出关键行为特征的时序信息所产生的的时序敏感值,从而能够更加完整地描述各行为特征的相关信息(如特征本身、特征交互或特征时序)对于行为时序模型的预测结果的影响,使得行为时序模型的可解释性更高。
综上,已经对本主题的特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作可以按照不同的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序,以实现期望的结果。在某些实施方式中,多任务处理和并行处理可以是有利的。
以上为本说明书一个或多个实施例提供的行为时序模型的分析方法,基于同样的思路,本说明书一个或多个实施例还提供一种行为时序模型的分析装置。
图5是根据本说明书一实施例的一种行为时序模型的分析装置的示意性框图。如图5所示,行为时序模型的分析装置包括:
第一预测模块51,将第一行为时序数据集输入预训练的风险预测模型,得到所述第一行为时序数据集对应的预测结果;所述第一行为时序数据集包括样本用户依次执行的N个行为分别对应的行为特征;所述N为大于1的整数;
第二预测模块52,针对N个行为特征中的各第一行为特征,将所述第一行为特征对应的第二行为时序数据集输入所述风险预测模型,得到所述第二行为时序数据集对应的预测结果;所述第二行为时序数据集中不包括所述第一行为特征;
第一确定模块53,根据所述第一行为时序数据集对应的预测结果和所述第二行为时序数据集对应的预测结果,确定所述N个行为特征对于所述风险预测模型进行风险预测的贡献信息;所述贡献信息包括:各所述第一行为特征对应的特征贡献值、所述第一行为时序数据集中的关键行为特征与第二行为特征之间的特征交互所产生的交互贡献值、以及所述关键行为特征对应的时序敏感值;所述第二行为特征与所述关键行为特征之间时序相邻。
在一个实施例中,所述第一确定模块53包括:
第一计算单元,针对每个所述第一行为特征,根据所述第一行为时序数据集对应的预测结果和所述第二行为时序数据集对应的预测结果,计算所述第一行为特征对应的特征贡献值;
第一确定单元,根据各所述第一行为特征分别对应的所述特征贡献值,确定所述N个行为特征中的至少一个关键行为特征;
第二计算单元,计算所述关键行为特征对应的所述交互贡献值,以及,计算所述关键行为特征对应的所述时序敏感值。
在一个实施例中,所述第一行为特征对应多个所述第二行为时序数据集;所述第二行为时序数据集属于所述第一行为时序数据集;
所述第一计算单元,针对每个所述第二行为时序数据集,计算所述第二行为时序数据集和所述第一行为特征的组合对应的预测结果以及所述第二行为时序数据集对应的预测结果之间的第一差值;根据所述第一差值、所述第二行为时序数据集中包括的行为特征数量以及所述第一行为时序数据集中包括的行为特征数量,计算所述第二行为时序数据集对应的子特征贡献值;对各所述第二行为时序数据集分别对应的所述子特征贡献值进行求和计算,得到所述第一行为特征对应的所述特征贡献值。
在一个实施例中,所述第一确定单元,判断所述特征贡献值是否大于或等于预设特征贡献阈值;若是,则确定所述特征贡献值对应的所述第一行为特征为所述关键行为特征。
在一个实施例中,所述第一行为特征对应多个所述第二行为时序数据集;所述第二行为时序数据集包括:属于所述第一行为时序数据集、且包括所述第二行为特征的第三行为时序数据集;以及,属于所述第一行为时序数据集、且不包括所述第二行为特征的第四行为时序数据集;
所述第二计算单元,计算所述第三行为时序数据集对应的第一交互贡献值;计算所述第四行为时序数据集对应的第二交互贡献值;根据所述第一交互贡献值和所述第二交互贡献值,确定所述关键行为特征对应的所述交互贡献值。
在一个实施例中,所述第二计算单元,针对每个所述第三行为时序数据集,计算所述第三行为时序数据集和所述第一行为特征的组合对应的预测结果以及所述第三行为时序数据集对应的预测结果之间的第二差值;根据所述第二差值、所述第三行为时序数据集中包括的行为特征数量以及所述第一行为时序数据集中包括的行为特征数量,计算所述第三行为时序数据集对应的第一子交互贡献值;对各所述第三行为时序数据集对应的所述第一子交互贡献值进行求和计算,得到所述关键行为特征对应的第一交互贡献值。
在一个实施例中,所述第二计算单元,针对每个所述第四行为时序数据集,计算所述第四行为时序数据集和所述第一行为特征的组合对应的预测结果以及所述第四行为时序数据集对应的预测结果之间的第三差值;根据所述第三差值、所述第四行为时序数据集中包括的行为特征数量以及所述第一行为时序数据集中包括的行为特征数量,计算所述第四行为时序数据集对应的第二子交互贡献值;对各所述第四行为时序数据集对应的所述第二子交互贡献值进行求和计算,得到所述关键行为特征对应的第二交互贡献值。
在一个实施例中,每个所述关键行为特征对应有多个所述第二行为特征;
所述第二计算单元,针对每个所述关键行为特征,根据所述关键行为特征和各所述第二行为特征分别对应的时序信息,将所述关键行为特征和多个所述第二行为特征组合为第一关键行为序列;扰动所述第一关键行为序列中的各行为特征对应的时序信息,得到多个第二关键行为序列;利用各所述第二关键行为序列替换所述第一行为时序数据集中的对应行为特征,得到各所述第二关键行为序列对应的第五行为时序数据集,并将所述第五行为时序数据集输入所述风险预测模型,得到所述第五行为时序数据集对应的预测结果;根据所述第一行为时序数据集对应的预测结果,以及各所述第五行为时序数据集对应的预测结果,确定所述关键行为特征对应的所述时序敏感值。
在一个实施例中,所述第二计算单元,针对每个所述第五行为时序数据集,根据所述第一行为时序数据集对应的预测结果和所述第五行为时序数据集对应的预测结果,确定所述第五行为时序数据集对应的子时序敏感值;计算各所述第五行为时序数据集分别对应的子时序敏感值的均值,得到所述关键行为特征对应的所述时序敏感值。
采用本说明书一个或多个实施例的装置,通过将第一行为时序数据集输入预训练的风险预测模型,得到第一行为时序数据集对应的预测结果,并针对第一行为时序数据集中的每个第一行为特征,将第一行为特征对应的第二行为时序数据集输入风险预测模型,得到第二行为时序数据集对应的预测结果,其中,第二行为时序数据集中不包括第一行为特征。进而根据第一行为时序数据集对应的预测结果和第二行为时序数据集对应的预测结果,确定第一行为时序数据集中的N个行为特征对于风险预测模型进行风险预测的贡献信息。其中,贡献信息包括:各第一行为特征对应的特征贡献值、第一行为时序数据集中的关键行为特征与第二行为特征之间的特征交互所产生的交互贡献值、以及关键行为特征对应的时序敏感值,第二行为特征与关键行为特征之间时序相邻。可见,该装置对于预训练的风险检测模型,不仅能够分析出每个行为特征本身对于风险检测模型的预测结果的特征贡献值,同时能够分析出关键行为特征和与其时序相邻的第二行为特征之间的交互所产生的交互贡献值,以及分析出关键行为特征的时序信息所产生的的时序敏感值,从而能够更加完整地描述各行为特征的相关信息(如特征本身、特征交互或特征时序)对于风险检测模型的预测结果的影响,使得风险检测模型的可解释性更高。进一步使风险检测模型的应用价值更高,例如在风险防控场景中,利用风险检测模型的可解释性分析模型性能以及优化模型。
本领域的技术人员应可理解,上述行为时序模型的分析装置能够用来实现前文所述的行为时序模型的分析方法,其中的细节描述应与前文方法部分描述类似,为避免繁琐,此处不另赘述。
图6是根据本说明书另一实施例的一种行为时序模型的分析装置的示意性框图。如图6所示,行为时序模型的分析装置包括:
第三预测模块61,将第一行为时序数据集输入预训练的行为时序模型,得到所述第一行为时序数据集对应的预测结果;所述第一行为时序数据集包括样本用户依次执行的N个行为分别对应的行为特征;所述N为大于1的整数;
第四预测模块62,针对N个行为特征中的各第一行为特征,将所述第一行为特征对应的第二行为时序数据集输入所述行为时序模型,得到所述第二行为时序数据集对应的预测结果;所述第二行为时序数据集中不包括所述第一行为特征;
第二确定模块63,根据所述第一行为时序数据集对应的预测结果和所述第二行为时序数据集对应的预测结果,确定所述N个行为特征对于所述行为时序模型进行预测的贡献信息;所述贡献信息包括:各所述第一行为特征对应的特征贡献值、所述第一行为时序数据集中的关键行为特征与第二行为特征之间的特征交互所产生的交互贡献值、以及所述关键行为特征对应的时序敏感值;所述第二行为特征与所述关键行为特征之间时序相邻。
采用本说明书一个或多个实施例的装置,通过将第一行为时序数据集输入预训练的行为时序模型,得到第一行为时序数据集对应的预测结果,并针对第一行为时序数据集中的每个第一行为特征,将第一行为特征对应的第二行为时序数据集输入行为时序模型,得到第二行为时序数据集对应的预测结果,其中,第二行为时序数据集中不包括第一行为特征。进而根据第一行为时序数据集对应的预测结果和第二行为时序数据集对应的预测结果,确定第一行为时序数据集中的N个行为特征对于行为时序模型进行预测的贡献信息。其中,贡献信息包括:各第一行为特征对应的特征贡献值、第一行为时序数据集中的关键行为特征与第二行为特征之间的特征交互所产生的交互贡献值、以及关键行为特征对应的时序敏感值,第二行为特征与关键行为特征之间时序相邻。可见,该装置对于预训练的行为时序模型,不仅能够分析出每个行为特征本身对于行为时序模型的预测结果的特征贡献值,同时能够分析出关键行为特征和与其时序相邻的第二行为特征之间的交互所产生的交互贡献值,以及分析出关键行为特征的时序信息所产生的的时序敏感值,从而能够更加完整地描述各行为特征的相关信息(如特征本身、特征交互或特征时序)对于行为时序模型的预测结果的影响,使得行为时序模型的可解释性更高。
本领域的技术人员应可理解,上述行为时序模型的分析装置能够用来实现前文所述的行为时序模型的分析方法,其中的细节描述应与前文方法部分描述类似,为避免繁琐,此处不另赘述。
基于同样的思路,本说明书一个或多个实施例还提供一种行为时序模型的分析设备,如图7所示。行为时序模型的分析设备可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上的处理器701和存储器702,存储器702中可以存储有一个或一个以上存储应用程序或数据。其中,存储器702可以是短暂存储或持久存储。存储在存储器702的应用程序可以包括一个或一个以上模块(图示未示出),每个模块可以包括对行为时序模型的分析设备中的一系列计算机可执行指令。更进一步地,处理器701可以设置为与存储器702通信,在行为时序模型的分析设备上执行存储器702中的一系列计算机可执行指令。行为时序模型的分析设备还可以包括一个或一个以上电源703,一个或一个以上有线或无线网络接口704,一个或一个以上输入输出接口705,一个或一个以上键盘706。
具体在本实施例中,行为时序模型的分析设备包括有存储器,以及一个或一个以上的程序,其中一个或者一个以上程序存储于存储器中,且一个或者一个以上程序可以包括一个或一个以上模块,且每个模块可以包括对行为时序模型的分析设备中的一系列计算机可执行指令,且经配置以由一个或者一个以上处理器执行该一个或者一个以上程序包含用于进行以下计算机可执行指令:
将第一行为时序数据集输入预训练的风险预测模型,得到所述第一行为时序数据集对应的预测结果;所述第一行为时序数据集包括样本用户依次执行的N个行为分别对应的行为特征;所述N为大于1的整数;
针对N个行为特征中的各第一行为特征,将所述第一行为特征对应的第二行为时序数据集输入所述风险预测模型,得到所述第二行为时序数据集对应的预测结果;所述第二行为时序数据集中不包括所述第一行为特征;
根据所述第一行为时序数据集对应的预测结果和所述第二行为时序数据集对应的预测结果,确定所述N个行为特征对于所述风险预测模型进行风险预测的贡献信息;所述贡献信息包括:各所述第一行为特征对应的特征贡献值、所述第一行为时序数据集中的关键行为特征与第二行为特征之间的特征交互所产生的交互贡献值、以及所述关键行为特征对应的时序敏感值;所述第二行为特征与所述关键行为特征之间时序相邻。
具体在另一实施例中,行为时序模型的分析设备包括有存储器,以及一个或一个以上的程序,其中一个或者一个以上程序存储于存储器中,且一个或者一个以上程序可以包括一个或一个以上模块,且每个模块可以包括对行为时序模型的分析设备中的一系列计算机可执行指令,且经配置以由一个或者一个以上处理器执行该一个或者一个以上程序包含用于进行以下计算机可执行指令:
将第一行为时序数据集输入预训练的行为时序模型,得到所述第一行为时序数据集对应的预测结果;所述第一行为时序数据集包括样本用户依次执行的N个行为分别对应的行为特征;所述N为大于1的整数;
针对N个行为特征中的各第一行为特征,将所述第一行为特征对应的第二行为时序数据集输入所述行为时序模型,得到所述第二行为时序数据集对应的预测结果;所述第二行为时序数据集中不包括所述第一行为特征;
根据所述第一行为时序数据集对应的预测结果和所述第二行为时序数据集对应的预测结果,确定所述N个行为特征对于所述行为时序模型进行预测的贡献信息;所述贡献信息包括:各所述第一行为特征对应的特征贡献值、所述第一行为时序数据集中的关键行为特征与第二行为特征之间的特征交互所产生的交互贡献值、以及所述关键行为特征对应的时序敏感值;所述第二行为特征与所述关键行为特征之间时序相邻。
本说明书一个或多个实施例还提出了一种存储介质,该存储介质存储一个或多个计算机程序,该一个或多个计算机程序包括指令,该指令当被包括多个应用程序的电子设备执行时,能够使该电子设备执行上述行为时序模型的分析方法实施例的各个过程,并具体用于执行:
将第一行为时序数据集输入预训练的风险预测模型,得到所述第一行为时序数据集对应的预测结果;所述第一行为时序数据集包括样本用户依次执行的N个行为分别对应的行为特征;所述N为大于1的整数;
针对N个行为特征中的各第一行为特征,将所述第一行为特征对应的第二行为时序数据集输入所述风险预测模型,得到所述第二行为时序数据集对应的预测结果;所述第二行为时序数据集中不包括所述第一行为特征;
根据所述第一行为时序数据集对应的预测结果和所述第二行为时序数据集对应的预测结果,确定所述N个行为特征对于所述风险预测模型进行风险预测的贡献信息;所述贡献信息包括:各所述第一行为特征对应的特征贡献值、所述第一行为时序数据集中的关键行为特征与第二行为特征之间的特征交互所产生的交互贡献值、以及所述关键行为特征对应的时序敏感值;所述第二行为特征与所述关键行为特征之间时序相邻。
本说明书一个或多个实施例还提出了一种存储介质,该存储介质存储一个或多个计算机程序,该一个或多个计算机程序包括指令,该指令当被包括多个应用程序的电子设备执行时,能够使该电子设备执行上述行为时序模型的分析方法实施例的各个过程,并具体用于执行:
将第一行为时序数据集输入预训练的行为时序模型,得到所述第一行为时序数据集对应的预测结果;所述第一行为时序数据集包括样本用户依次执行的N个行为分别对应的行为特征;所述N为大于1的整数;
针对N个行为特征中的各第一行为特征,将所述第一行为特征对应的第二行为时序数据集输入所述行为时序模型,得到所述第二行为时序数据集对应的预测结果;所述第二行为时序数据集中不包括所述第一行为特征;
根据所述第一行为时序数据集对应的预测结果和所述第二行为时序数据集对应的预测结果,确定所述N个行为特征对于所述行为时序模型进行预测的贡献信息;所述贡献信息包括:各所述第一行为特征对应的特征贡献值、所述第一行为时序数据集中的关键行为特征与第二行为特征之间的特征交互所产生的交互贡献值、以及所述关键行为特征对应的时序敏感值;所述第二行为特征与所述关键行为特征之间时序相邻。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书一个或多个实施例时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本说明书一个或多个实施例可提供为方法、系统、或计算机程序产品。因此,本说明书一个或多个实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本说明书一个或多个实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书一个或多个实施例是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本说明书一个或多个实施例可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本说明书一个或多个实施例而已,并不用于限制本说明书。对于本领域技术人员来说,本说明书一个或多个实施例可以有各种更改和变化。凡在本说明书一个或多个实施例的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书一个或多个实施例的权利要求范围之内。

Claims (16)

1.一种行为时序模型的分析方法,包括:
将第一行为时序数据集输入预训练的风险预测模型,得到所述第一行为时序数据集对应的预测结果;所述第一行为时序数据集包括样本用户依次执行的N个行为分别对应的行为特征;所述N为大于1的整数;
针对N个行为特征中的各第一行为特征,将所述第一行为特征对应的第二行为时序数据集输入所述风险预测模型,得到所述第二行为时序数据集对应的预测结果;所述第二行为时序数据集中不包括所述第一行为特征;
根据所述第一行为时序数据集对应的预测结果和所述第二行为时序数据集对应的预测结果,确定所述N个行为特征对于所述风险预测模型进行风险预测的贡献信息;所述贡献信息包括:各所述第一行为特征对应的特征贡献值、所述第一行为时序数据集中的关键行为特征与第二行为特征之间的特征交互所产生的交互贡献值、以及所述关键行为特征对应的时序敏感值;所述第二行为特征与所述关键行为特征之间时序相邻。
2.根据权利要求1所述的方法,所述根据所述第一行为时序数据集对应的预测结果和所述第二行为时序数据集对应的预测结果,确定所述N个行为特征对于所述风险预测模型进行风险预测的贡献信息,包括:
针对每个所述第一行为特征,根据所述第一行为时序数据集对应的预测结果和所述第二行为时序数据集对应的预测结果,计算所述第一行为特征对应的特征贡献值;
根据各所述第一行为特征分别对应的所述特征贡献值,确定所述N个行为特征中的至少一个关键行为特征;
计算所述关键行为特征对应的所述交互贡献值,以及,计算所述关键行为特征对应的所述时序敏感值。
3.根据权利要求2所述的方法,所述第一行为特征对应多个所述第二行为时序数据集;所述第二行为时序数据集属于所述第一行为时序数据集;
所述根据所述第一行为时序数据集对应的预测结果和所述第二行为时序数据集对应的预测结果,计算所述第一行为特征对应的特征贡献值,包括:
针对每个所述第二行为时序数据集,计算所述第二行为时序数据集和所述第一行为特征的组合对应的预测结果以及所述第二行为时序数据集对应的预测结果之间的第一差值;
根据所述第一差值、所述第二行为时序数据集中包括的行为特征数量以及所述第一行为时序数据集中包括的行为特征数量,计算所述第二行为时序数据集对应的子特征贡献值;
对各所述第二行为时序数据集分别对应的所述子特征贡献值进行求和计算,得到所述第一行为特征对应的所述特征贡献值。
4.根据权利要求2所述的方法,所述根据各所述第一行为特征分别对应的所述特征贡献值,确定所述N个行为特征中的至少一个关键行为特征,包括:
判断所述特征贡献值是否大于或等于预设特征贡献阈值;
若是,则确定所述特征贡献值对应的所述第一行为特征为所述关键行为特征。
5.根据权利要求2所述的方法,所述第一行为特征对应多个所述第二行为时序数据集;所述第二行为时序数据集包括:属于所述第一行为时序数据集、且包括所述第二行为特征的第三行为时序数据集;以及,属于所述第一行为时序数据集、且不包括所述第二行为特征的第四行为时序数据集;
所述计算所述关键行为特征对应的所述交互贡献值,包括:
计算所述第三行为时序数据集对应的第一交互贡献值;
计算所述第四行为时序数据集对应的第二交互贡献值;
根据所述第一交互贡献值和所述第二交互贡献值,确定所述关键行为特征对应的所述交互贡献值。
6.根据权利要求5所述的方法,所述计算所述第三行为时序数据集对应的第一交互贡献值,包括:
针对每个所述第三行为时序数据集,计算所述第三行为时序数据集和所述第一行为特征的组合对应的预测结果以及所述第三行为时序数据集对应的预测结果之间的第二差值;
根据所述第二差值、所述第三行为时序数据集中包括的行为特征数量以及所述第一行为时序数据集中包括的行为特征数量,计算所述第三行为时序数据集对应的第一子交互贡献值;
对各所述第三行为时序数据集对应的所述第一子交互贡献值进行求和计算,得到所述关键行为特征对应的第一交互贡献值。
7.根据权利要求5所述的方法,所述计算所述第四行为时序数据集对应的第二交互贡献值,包括:
针对每个所述第四行为时序数据集,计算所述第四行为时序数据集和所述第一行为特征的组合对应的预测结果以及所述第四行为时序数据集对应的预测结果之间的第三差值;
根据所述第三差值、所述第四行为时序数据集中包括的行为特征数量以及所述第一行为时序数据集中包括的行为特征数量,计算所述第四行为时序数据集对应的第二子交互贡献值;
对各所述第四行为时序数据集对应的所述第二子交互贡献值进行求和计算,得到所述关键行为特征对应的第二交互贡献值。
8.根据权利要求2所述的方法,每个所述关键行为特征对应有多个所述第二行为特征;
所述计算所述关键行为特征对应的所述时序敏感值,包括:
针对每个所述关键行为特征,根据所述关键行为特征和各所述第二行为特征分别对应的时序信息,将所述关键行为特征和多个所述第二行为特征组合为第一关键行为序列;
扰动所述第一关键行为序列中的各行为特征对应的时序信息,得到多个第二关键行为序列;
利用各所述第二关键行为序列替换所述第一行为时序数据集中的对应行为特征,得到各所述第二关键行为序列对应的第五行为时序数据集,并将所述第五行为时序数据集输入所述风险预测模型,得到所述第五行为时序数据集对应的预测结果;
根据所述第一行为时序数据集对应的预测结果,以及各所述第五行为时序数据集对应的预测结果,确定所述关键行为特征对应的所述时序敏感值。
9.根据权利要求8所述的方法,所述根据所述第一行为时序数据集对应的预测结果,以及各所述第五行为时序数据集对应的预测结果,确定所述关键行为特征对应的所述时序敏感值,包括:
针对每个所述第五行为时序数据集,根据所述第一行为时序数据集对应的预测结果和所述第五行为时序数据集对应的预测结果,确定所述第五行为时序数据集对应的子时序敏感值;
计算各所述第五行为时序数据集分别对应的子时序敏感值的均值,得到所述关键行为特征对应的所述时序敏感值。
10.一种行为时序模型的分析方法,包括:
将第一行为时序数据集输入预训练的行为时序模型,得到所述第一行为时序数据集对应的预测结果;所述第一行为时序数据集包括样本用户依次执行的N个行为分别对应的行为特征;所述N为大于1的整数;
针对N个行为特征中的各第一行为特征,将所述第一行为特征对应的第二行为时序数据集输入所述行为时序模型,得到所述第二行为时序数据集对应的预测结果;所述第二行为时序数据集中不包括所述第一行为特征;
根据所述第一行为时序数据集对应的预测结果和所述第二行为时序数据集对应的预测结果,确定所述N个行为特征对于所述行为时序模型进行预测的贡献信息;所述贡献信息包括:各所述第一行为特征对应的特征贡献值、所述第一行为时序数据集中的关键行为特征与第二行为特征之间的特征交互所产生的交互贡献值、以及所述关键行为特征对应的时序敏感值;所述第二行为特征与所述关键行为特征之间时序相邻。
11.一种行为时序模型的分析装置,包括:
第一预测模块,将第一行为时序数据集输入预训练的风险预测模型,得到所述第一行为时序数据集对应的预测结果;所述第一行为时序数据集包括样本用户依次执行的N个行为分别对应的行为特征;所述N为大于1的整数;
第二预测模块,针对N个行为特征中的各第一行为特征,将所述第一行为特征对应的第二行为时序数据集输入所述风险预测模型,得到所述第二行为时序数据集对应的预测结果;所述第二行为时序数据集中不包括所述第一行为特征;
第一确定模块,根据所述第一行为时序数据集对应的预测结果和所述第二行为时序数据集对应的预测结果,确定所述N个行为特征对于所述风险预测模型进行风险预测的贡献信息;所述贡献信息包括:各所述第一行为特征对应的特征贡献值、所述第一行为时序数据集中的关键行为特征与第二行为特征之间的特征交互所产生的交互贡献值、以及所述关键行为特征对应的时序敏感值;所述第二行为特征与所述关键行为特征之间时序相邻。
12.一种行为时序模型的分析装置,包括:
第三预测模块,将第一行为时序数据集输入预训练的行为时序模型,得到所述第一行为时序数据集对应的预测结果;所述第一行为时序数据集包括样本用户依次执行的N个行为分别对应的行为特征;所述N为大于1的整数;
第四预测模块,针对N个行为特征中的各第一行为特征,将所述第一行为特征对应的第二行为时序数据集输入所述行为时序模型,得到所述第二行为时序数据集对应的预测结果;所述第二行为时序数据集中不包括所述第一行为特征;
第二确定模块,根据所述第一行为时序数据集对应的预测结果和所述第二行为时序数据集对应的预测结果,确定所述N个行为特征对于所述行为时序模型进行预测的贡献信息;所述贡献信息包括:各所述第一行为特征对应的特征贡献值、所述第一行为时序数据集中的关键行为特征与第二行为特征之间的特征交互所产生的交互贡献值、以及所述关键行为特征对应的时序敏感值;所述第二行为特征与所述关键行为特征之间时序相邻。
13.一种行为时序模型的分析设备,包括处理器和与所述处理器电连接的存储器,所述存储器存储有计算机程序,所述处理器用于从所述存储器调用并执行所述计算机程序以实现:
将第一行为时序数据集输入预训练的风险预测模型,得到所述第一行为时序数据集对应的预测结果;所述第一行为时序数据集包括样本用户依次执行的N个行为分别对应的行为特征;所述N为大于1的整数;
针对N个行为特征中的各第一行为特征,将所述第一行为特征对应的第二行为时序数据集输入所述风险预测模型,得到所述第二行为时序数据集对应的预测结果;所述第二行为时序数据集中不包括所述第一行为特征;
根据所述第一行为时序数据集对应的预测结果和所述第二行为时序数据集对应的预测结果,确定所述N个行为特征对于所述风险预测模型进行风险预测的贡献信息;所述贡献信息包括:各所述第一行为特征对应的特征贡献值、所述第一行为时序数据集中的关键行为特征与第二行为特征之间的特征交互所产生的交互贡献值、以及所述关键行为特征对应的时序敏感值;所述第二行为特征与所述关键行为特征之间时序相邻。
14.一种行为时序模型的分析设备,包括处理器和与所述处理器电连接的存储器,所述存储器存储有计算机程序,所述处理器用于从所述存储器调用并执行所述计算机程序以实现:
将第一行为时序数据集输入预训练的行为时序模型,得到所述第一行为时序数据集对应的预测结果;所述第一行为时序数据集包括样本用户依次执行的N个行为分别对应的行为特征;所述N为大于1的整数;
针对N个行为特征中的各第一行为特征,将所述第一行为特征对应的第二行为时序数据集输入所述行为时序模型,得到所述第二行为时序数据集对应的预测结果;所述第二行为时序数据集中不包括所述第一行为特征;
根据所述第一行为时序数据集对应的预测结果和所述第二行为时序数据集对应的预测结果,确定所述N个行为特征对于所述行为时序模型进行预测的贡献信息;所述贡献信息包括:各所述第一行为特征对应的特征贡献值、所述第一行为时序数据集中的关键行为特征与第二行为特征之间的特征交互所产生的交互贡献值、以及所述关键行为特征对应的时序敏感值;所述第二行为特征与所述关键行为特征之间时序相邻。
15.一种存储介质,用于存储计算机程序,所述计算机程序能够被处理器执行以实现以下流程:
将第一行为时序数据集输入预训练的风险预测模型,得到所述第一行为时序数据集对应的预测结果;所述第一行为时序数据集包括样本用户依次执行的N个行为分别对应的行为特征;所述N为大于1的整数;
针对N个行为特征中的各第一行为特征,将所述第一行为特征对应的第二行为时序数据集输入所述风险预测模型,得到所述第二行为时序数据集对应的预测结果;所述第二行为时序数据集中不包括所述第一行为特征;
根据所述第一行为时序数据集对应的预测结果和所述第二行为时序数据集对应的预测结果,确定所述N个行为特征对于所述风险预测模型进行风险预测的贡献信息;所述贡献信息包括:各所述第一行为特征对应的特征贡献值、所述第一行为时序数据集中的关键行为特征与第二行为特征之间的特征交互所产生的交互贡献值、以及所述关键行为特征对应的时序敏感值;所述第二行为特征与所述关键行为特征之间时序相邻。
16.一种存储介质,用于存储计算机程序,所述计算机程序能够被处理器执行以实现以下流程:
将第一行为时序数据集输入预训练的行为时序模型,得到所述第一行为时序数据集对应的预测结果;所述第一行为时序数据集包括样本用户依次执行的N个行为分别对应的行为特征;所述N为大于1的整数;
针对N个行为特征中的各第一行为特征,将所述第一行为特征对应的第二行为时序数据集输入所述行为时序模型,得到所述第二行为时序数据集对应的预测结果;所述第二行为时序数据集中不包括所述第一行为特征;
根据所述第一行为时序数据集对应的预测结果和所述第二行为时序数据集对应的预测结果,确定所述N个行为特征对于所述行为时序模型进行预测的贡献信息;所述贡献信息包括:各所述第一行为特征对应的特征贡献值、所述第一行为时序数据集中的关键行为特征与第二行为特征之间的特征交互所产生的交互贡献值、以及所述关键行为特征对应的时序敏感值;所述第二行为特征与所述关键行为特征之间时序相邻。
CN202310209134.3A 2023-03-01 2023-03-01 行为时序模型的分析方法及装置 Active CN116051118B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310209134.3A CN116051118B (zh) 2023-03-01 2023-03-01 行为时序模型的分析方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310209134.3A CN116051118B (zh) 2023-03-01 2023-03-01 行为时序模型的分析方法及装置

Publications (2)

Publication Number Publication Date
CN116051118A CN116051118A (zh) 2023-05-02
CN116051118B true CN116051118B (zh) 2023-06-16

Family

ID=86133317

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310209134.3A Active CN116051118B (zh) 2023-03-01 2023-03-01 行为时序模型的分析方法及装置

Country Status (1)

Country Link
CN (1) CN116051118B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117131369B (zh) * 2023-10-27 2023-12-22 福建福昇消防服务集团有限公司 智慧安全管理与应急救援一体站的数据处理方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113536097A (zh) * 2020-04-14 2021-10-22 华为技术有限公司 基于自动特征分组的推荐方法及装置
CN113902159A (zh) * 2020-06-22 2022-01-07 罗伯特·博世有限公司 使用经训练的解码器模型来进行时间序列预测
CN114418120A (zh) * 2022-01-24 2022-04-29 深圳前海微众银行股份有限公司 联邦树模型的数据处理方法、装置、设备及存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11995520B2 (en) * 2019-07-24 2024-05-28 Adobe Inc. Efficiently determining local machine learning model feature contributions
US20220083873A1 (en) * 2020-09-17 2022-03-17 Novi Labs, Inc. Predictive Modeling of Well Performance Using Learning and Time-Series Techniques
CN114764627A (zh) * 2021-01-13 2022-07-19 新智数字科技有限公司 基于横向联合学习参与方的数据贡献力确定方法和装置
CN113326948A (zh) * 2021-06-01 2021-08-31 深圳前海微众银行股份有限公司 联邦学习模型的数据处理方法、装置、设备及存储介质
EP4120653A1 (en) * 2021-07-15 2023-01-18 EXFO Inc. Communication network performance and fault analysis using learning models with model interpretation

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113536097A (zh) * 2020-04-14 2021-10-22 华为技术有限公司 基于自动特征分组的推荐方法及装置
CN113902159A (zh) * 2020-06-22 2022-01-07 罗伯特·博世有限公司 使用经训练的解码器模型来进行时间序列预测
CN114418120A (zh) * 2022-01-24 2022-04-29 深圳前海微众银行股份有限公司 联邦树模型的数据处理方法、装置、设备及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"基于特征交互学习的广告点击率预测模型研究";韩永亮;《中国优秀硕士学位论文全文数据库信息科技辑》;第I140-14页 *
V. Chalasani等."Contribution-based approach for feature selection in linear programming-based models".《Smc 2000 conference proceedings. 2000 ieee international conference on systems, man and cybernetics. 'cybernetics evolving to systems, humans, organizations, and their complex interactions' (cat. no.0》.2002,第1-4页. *

Also Published As

Publication number Publication date
CN116051118A (zh) 2023-05-02

Similar Documents

Publication Publication Date Title
CN109063886B (zh) 一种异常检测方法、装置以及设备
CN114298417A (zh) 反欺诈风险评估方法、训练方法、装置及可读存储介质
CN111310784B (zh) 资源数据的处理方法及装置
CN109214193B (zh) 数据加密、机器学习模型训练方法、装置以及电子设备
CN111538869B (zh) 一种交易异常群组的检测方法、装置及设备
CN114580263A (zh) 基于知识图谱的信息系统故障预测方法及相关设备
CN112035881B (zh) 一种基于隐私保护的应用程序识别方法、装置及设备
CN116051118B (zh) 行为时序模型的分析方法及装置
CN110634030A (zh) 应用的业务指标挖掘方法、装置及设备
CN114417411A (zh) 一种端云开发系统、模型的处理方法、装置及设备
CN112966113A (zh) 一种数据的风险防控方法、装置及设备
CN111275106B (zh) 对抗样本生成方法、装置及计算机设备
CN115907970A (zh) 信贷风险识别方法、装置、电子设备及存储介质
CN115712866A (zh) 数据处理方法、装置及设备
CN115618748A (zh) 一种模型优化的方法、装置、设备及存储介质
CN114372566A (zh) 图数据的增广、图神经网络训练方法、装置以及设备
CN115408449B (zh) 一种用户行为的处理方法、装置及设备
CN115601629A (zh) 模型训练方法、图像识别方法、介质、装置和计算设备
CN116070382A (zh) 网络的风险预测方法及装置、处理器和电子设备
CN115545943A (zh) 一种图谱的处理方法、装置及设备
CN111242195B (zh) 模型、保险风控模型训练方法、装置及电子设备
Li et al. WiBB: an integrated method for quantifying the relative importance of predictive variables
CN111461904B (zh) 对象类别的分析方法及装置
CN116561735B (zh) 一种基于多认证源的互信认证方法、系统及电子设备
CN114944962B (zh) 一种数据安全防护方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant