CN113409050B - 基于用户操作判断业务风险的方法和装置 - Google Patents

基于用户操作判断业务风险的方法和装置 Download PDF

Info

Publication number
CN113409050B
CN113409050B CN202110492178.2A CN202110492178A CN113409050B CN 113409050 B CN113409050 B CN 113409050B CN 202110492178 A CN202110492178 A CN 202110492178A CN 113409050 B CN113409050 B CN 113409050B
Authority
CN
China
Prior art keywords
risk
risk prediction
service
target service
server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110492178.2A
Other languages
English (en)
Other versions
CN113409050A (zh
Inventor
张长浩
傅欣艺
周璟
傅幸
王维强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN202110492178.2A priority Critical patent/CN113409050B/zh
Publication of CN113409050A publication Critical patent/CN113409050A/zh
Application granted granted Critical
Publication of CN113409050B publication Critical patent/CN113409050B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/40Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
    • G06Q20/401Transaction verification
    • G06Q20/4016Transaction verification involving fraud or risk level assessment in transaction processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Accounting & Taxation (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Security & Cryptography (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本说明书实施例提供一种基于用户操作判断业务风险的方法和装置,方法包括:客户端接收针对目标业务的第一操作,目标业务是多种服务业务之一,第一操作是向服务端提交目标业务的业务请求之前的预定操作;响应于第一操作,在第一执行链路中,获取用户通过客户端执行的历史操作序列,将历史操作序列对应的特征序列输入预先训练的风险预测模型,得到目标业务的风险分数,将风险分数发送给服务端;在与第一执行链路并行执行的第二执行链路中,对目标业务进行继续处理,直至向服务端提交目标业务的业务请求;以使服务端根据业务请求和风险分数,判断目标业务是否具有预设类别的风险。能够确保高准确率、低耗时。

Description

基于用户操作判断业务风险的方法和装置
技术领域
本说明书一个或多个实施例涉及计算机领域,尤其涉及基于用户操作判断业务风险的方法和装置。
背景技术
当前,常常由客户端和服务端配合为用户提供服务业务。用户在使用客户端的过程中,会产生一系列的用户操作,例如,登录、修改密码、浏览特定页面等,用户操作中的反常举动预示着一定的业务风险,基于用户操作可以帮助判断目标业务是否具有业务风险。
现有技术中,在基于用户操作判断业务风险时,由于客户端性能的限制,通常都是由服务端进行的,由于客户端存在海量的数据不能实时回传,这部分数据无法在判断目标业务是否有风险的时候被有效利用,从而导致识别风险的准确率较低。
因此,希望能有改进的方案,能够在基于用户操作判断业务风险时,确保高准确率、低耗时。
发明内容
本说明书一个或多个实施例描述了一种基于用户操作判断业务风险的方法和装置,能够在基于用户操作判断业务风险时,确保高准确率、低耗时。
第一方面,提供了一种基于用户操作判断业务风险的方法,该方法由客户端执行,所述客户端提供多种服务业务,方法包括:
接收针对目标业务的第一操作,所述目标业务是所述多种服务业务之一,所述第一操作是向服务端提交所述目标业务的业务请求之前的预定操作;
响应于所述第一操作,在第一执行链路中,获取用户通过所述客户端执行的历史操作序列,将所述历史操作序列对应的特征序列输入预先训练的风险预测模型,得到所述目标业务的风险分数,将所述风险分数发送给所述服务端;
在与所述第一执行链路并行执行的第二执行链路中,对所述目标业务进行继续处理,直至向所述服务端提交所述目标业务的业务请求;以使所述服务端根据所述业务请求和所述风险分数,判断所述目标业务是否具有预设类别的风险。
在一种可能的实施方式中,所述目标业务属于支付业务,所述第一操作包括以下之一:启动收银台,展示收钱码,展示付钱码。
在一种可能的实施方式中,所述历史操作序列包括针对所述目标业务之外的业务的操作。
在一种可能的实施方式中,所述历史操作序列包括:
所述服务端能够感知的粗粒度操作和所述服务端不能够感知的细粒度操作。
进一步地,所述粗粒度操作包括:
浏览、收藏或加购;
所述细粒度操作包括:
点击、滑动或曝光。
在一种可能的实施方式中,所述特征序列对应于多项特征;所述风险预测模型包括特征提取网络;所述特征提取网络用于通过卷积处理的方式,将同一操作的不同特征对应的表征聚合,得到对应于同一操作的融合表征向量。
进一步地,所述多项特征包括以下至少一项:
访问页面、页面停留时间、距离当前的时间间隔、绝对时间、日期。
进一步地,所述风险预测模型还包括编码器和对应于多个风险预测任务的各预测网络;
所述编码器用于根据各操作分别对应的融合表征向量,通过卷积处理和自注意力机制,得到各操作分别对应的各编码向量;
所述各预测网络中的任一预测网络基于所述各编码向量与其对应的风险预测任务的权重,对所述各编码向量进行加权求和,得到目标域表征向量,根据所述目标域表征向量,确定其对应的风险预测任务的风险分数。
进一步地,所述风险预测模型采用如下方式进行训练:
采用自监督代理任务对所述特征提取网络进行预训练;
将预训练后的所述特征提取网络的参数固定,利用训练样本具有的第一风险预测任务的标签对所述编码器和第一预测网络进行训练;其中,所述第一风险预测任务为所述多个风险预测任务中的任一风险预测任务,所述第一预测网络对应于所述第一风险预测任务。
进一步地,所述自监督代理任务包括:遮蔽所述特征序列中对应于同一操作的所有特征对应的特征值,预测遮蔽的部分或全部特征的特征值。
进一步地,所述风险预测模型采用如下方式进行训练:
利用训练样本具有的第一风险预测任务的标签对所述特征提取网络、所述编码器和第一预测网络进行训练;其中,所述第一风险预测任务为所述多个风险预测任务中的任一风险预测任务,所述第一预测网络对应于所述第一风险预测任务。
第二方面,提供了一种基于用户操作判断业务风险的装置,该装置设置于客户端,所述客户端提供多种服务业务,装置包括:
接收单元,用于接收针对目标业务的第一操作,所述目标业务是所述多种服务业务之一,所述第一操作是向服务端提交所述目标业务的业务请求之前的预定操作;
第一执行单元,用于响应于所述接收单元接收的第一操作,在第一执行链路中,获取用户通过所述客户端执行的历史操作序列,将所述历史操作序列对应的特征序列输入预先训练的风险预测模型,得到所述目标业务的风险分数,将所述风险分数发送给所述服务端;
第二执行单元,用于在与所述第一执行链路并行执行的第二执行链路中,对所述目标业务进行继续处理,直至向所述服务端提交所述目标业务的业务请求;以使所述服务端根据所述业务请求和所述风险分数,判断所述目标业务是否具有预设类别的风险。
第三方面,提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行第一方面的方法。
第四方面,提供了一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现第一方面的方法。
通过本说明书实施例提供的方法和装置,首先客户端接收针对目标业务的第一操作,所述目标业务是所述多种服务业务之一,所述第一操作是向服务端提交所述目标业务的业务请求之前的预定操作;接着响应于所述第一操作,在第一执行链路中,获取用户通过所述客户端执行的历史操作序列,将所述历史操作序列对应的特征序列输入预先训练的风险预测模型,得到所述目标业务的风险分数,将所述风险分数发送给所述服务端;在与所述第一执行链路并行执行的第二执行链路中,对所述目标业务进行继续处理,直至向所述服务端提交所述目标业务的业务请求;以使所述服务端根据所述业务请求和所述风险分数,判断所述目标业务是否具有预设类别的风险。由上可见,本说明书实施例,由于确定风险分数是由客户端进行的,因此可以有效利用用户通过所述客户端执行的历史操作序列,使得确定的所述风险分数能够确保高准确率,并且在客户端向服务端提交所述目标业务的业务请求之前,就开始确定所述风险分数,从而可以利用上述接收第一操作与提交业务请求之间的时间差,在这段时间差内完成确定所述风险分数,因此可以确保低耗时。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本说明书披露的一个实施例的实施场景示意图;
图2示出根据一个实施例的基于用户操作判断业务风险的方法流程图;
图3示出根据一个实施例的特征提取网络的结构示意图;
图4示出根据一个实施例的编码器与各预测网络的结构示意图;
图5示出根据一个实施例的二阶段训练示意图;
图6示出根据一个实施例的自监督代理任务示意图;
图7示出根据一个实施例的双链路并行处理示意图;
图8示出根据一个实施例的基于用户操作判断业务风险的装置的示意性框图。
具体实施方式
下面结合附图,对本说明书提供的方案进行描述。
图1为本说明书披露的一个实施例的实施场景示意图。该实施场景涉及基于用户操作判断业务风险,由客户端执行,可以理解的是,用户在使用客户端的过程中,会产生一系列的用户操作,例如,登录、修改密码、浏览特定页面等,相比于服务端判断业务风险,本说明书实施例由客户端判断业务风险,客户端可以更广泛地利用各类用户操作的特征,有效识别用户操作中的反常举动,准确判断目标业务是否具有业务风险,例如,频繁地登录改密,大量地访问贷款或借款界面,夜间高频高危操作等反常举动都预示着一定的支付风险。掌握用户的操作行为模式,可以获得额外的信息增益,提升消费者体验和风控安全。
参照图1,以用户操作为浏览特定页面为例,用户依次浏览了首页、页面1、页面2和页面3,其中,页面1为消费信贷服务页面,可以提供先消费后付款的服务业务,页面2为全局搜索页面,提供搜索业务,页面3为小额借款页面,可以提供一定额度的预设期限内的免息借款服务业务。通过图1所示的用户的浏览途径,可以推测用户意图,从而判断目标业务是否具有业务风险,其中,目标业务可以包含在用户浏览过的页面提供的业务中,例如,目标业务为页面1所提供的业务,目标业务也可以不包含在用户浏览过的页面提供的业务中,例如,目标业务为支付业务。
图2示出根据一个实施例的基于用户操作判断业务风险的方法流程图,该方法由客户端执行,所述客户端提供多种服务业务,该方法可以基于图1所示的实施场景。如图2所示,该实施例中基于用户操作判断业务风险的方法包括以下步骤:步骤21,接收针对目标业务的第一操作,所述目标业务是所述多种服务业务之一,所述第一操作是向服务端提交所述目标业务的业务请求之前的预定操作;步骤22,响应于所述第一操作,在第一执行链路中,获取用户通过所述客户端执行的历史操作序列,将所述历史操作序列对应的特征序列输入预先训练的风险预测模型,得到所述目标业务的风险分数,将所述风险分数发送给所述服务端;步骤23,在与所述第一执行链路并行执行的第二执行链路中,对所述目标业务进行继续处理,直至向所述服务端提交所述目标业务的业务请求;以使所述服务端根据所述业务请求和所述风险分数,判断所述目标业务是否具有预设类别的风险。下面描述以上各个步骤的具体执行方式。
首先在步骤21,接收针对目标业务的第一操作,所述目标业务是所述多种服务业务之一,所述第一操作是向服务端提交所述目标业务的业务请求之前的预定操作。可以理解的是,通常地,在向服务端提交目标业务的业务请求之前,还需要一项或多项预定操作,例如,打开客户端,点击目标业务的图标,输入密码等等。
本说明书实施例,所述多种服务业务可以但不限于包括先消费后付款的服务业务、搜索业务、免息借款服务业务、支付业务等,目标业务是多种服务业务中的任意一种。
在一个示例中,所述目标业务属于支付业务,所述第一操作包括以下之一:启动收银台,展示收钱码,展示付钱码。
然后在步骤22,响应于所述第一操作,在第一执行链路中,获取用户通过所述客户端执行的历史操作序列,将所述历史操作序列对应的特征序列输入预先训练的风险预测模型,得到所述目标业务的风险分数,将所述风险分数发送给所述服务端。可以理解的是,所述历史操作序列包括的多项操作通常依照时序顺次排列,相应地,特征序列包括的多个特征值也依照时序顺次排列。
本说明书实施例,由于第一操作是向服务端提交所述目标业务的业务请求之前的预定操作,因此上述特征序列包含事中信息,事中信息即事件发生时产生的数据,从而使得风险分数的准确性更高。
在一个示例中,所述历史操作序列包括针对所述目标业务之外的业务的操作。
可以理解的是,客户端提供多种服务业务,该示例中不仅获取针对目标业务的操作,还获取针对目标业务之外的业务的操作,使得获取的信息更为全面。
在一个示例中,所述历史操作序列包括:
所述服务端能够感知的粗粒度操作和所述服务端不能够感知的细粒度操作。
进一步地,所述粗粒度操作包括:
浏览、收藏或加购;
所述细粒度操作包括:
点击、滑动或曝光。
可以理解的是,相比较于由服务端基于用户操作判断业务风险,该示例中,由客户端基于用户操作判断业务风险,可以充分利用各种类型的用户操作,包括服务端不能够感知的细粒度操作,能够全方位的感知用户意图,从而使得风险分数的准确性更高。
在一个示例中,所述特征序列对应于多项特征;所述风险预测模型包括特征提取网络;所述特征提取网络用于通过卷积处理的方式,将同一操作的不同特征对应的表征聚合,得到对应于同一操作的融合表征向量。其中,卷积处理可以通过卷积神经网络(convolutional neural networks,CNN)实现,也就是说,所述特征提取网络可以以CNN为基础。
图3示出根据一个实施例的特征提取网络的结构示意图。参照图3,S1代表历史操作序列对应于特征1的特征序列,S2代表历史操作序列对应于特征2的特征序列,S3代表历史操作序列对应于特征3的特征序列,可以理解的是,历史操作序列包括多个操作,特征序列由相应特征分别对应于各个操作的各个特征值构成,先查找各个特征值分别对应的初始表征向量,然后将对应于同一操作的各初始表征向量进行拼接,得到各操作分别对应的拼接向量,再经过CNN,得到分别对应于各操作的各融合表征向量。
进一步地,所述多项特征包括以下至少一项:
访问页面、页面停留时间、距离当前的时间间隔、绝对时间、日期。
其中,由于客户端提供多种服务业务,访问页面对应的特征值可以基于相应的页面编码和业务编码确定,例如,将页面编码和业务编码拼接,哈希之后再取模。绝对时间对应的特征值可以采用小时级别。日期的特征值可以有两种取值,用于表示是否目标业务执行的当天。
本说明书实施例,上述特征序列可以通过选取时间长度和序列长度的方式来生成,例如,选取近7天内的数据并且最大序列长度为300,当序列长度大于300时,截断超出300的部分,当序列长度小于300时,通过补零使得序列长度达到300。
本说明书实施例,采用多特征融合的方式,同时考虑访问页面类型、页面停留时间、距离支付时间差、绝对时间、日期等多维特征,区别于直接对多维特征对应表征的直接相加处理,而是通过CNN,将对应于同一操作的不同特征对应的表征聚合,从而得到融合表征向量。
进一步地,所述风险预测模型还包括编码器和对应于多个风险预测任务的各预测网络;
所述编码器用于根据各操作分别对应的融合表征向量,通过卷积处理和自注意力机制,得到各操作分别对应的各编码向量;
所述各预测网络中的任一预测网络基于所述各编码向量与其对应的风险预测任务的权重,对所述各编码向量进行加权求和,得到目标域表征向量,根据所述目标域表征向量,确定其对应的风险预测任务的风险分数。
本说明书实施例,风险预测模型可以同时针对多个风险预测任务进行预测,例如,多个风险预测任务可以分别用于预测盗用风险、欺诈风险、虚假交易风险等。
图4示出根据一个实施例的编码器与各预测网络的结构示意图。参照图4,E1、E2、E3、E4、E5、E6代表各操作分别对应的融合表征向量,此处以历史操作序列包括6项操作作为示例,实际中的操作数量通常会更多,其中,融合表征向量的来源可以为前述特征提取网络的输出,编码器先根据各操作分别对应的融合表征向量,通过卷积处理的方式,得到各中间向量,即C1、C2、C3、C4、C5、C6,再利用自注意力机制处理后得到各操作分别对应的各编码向量,即A1、A2、A3、A4、A5、A6。预测网络1对应于风险预测任务1,包括注意力层1和深度神经网络(deep neural networks,DNN)1;预测网络2对应于风险预测任务2,包括注意力层2和DNN2;预测网络3对应于风险预测任务3,包括注意力层3和DNN3;此处以3种风险预测任务作为示例,实际中风险预测任务的数量可以为2、4或5等,各预测网络中利用了注意力机制,可以基于各预测网络中的任一预测网络先基于所述各编码向量与其对应的风险预测任务的权重,对所述各编码向量进行加权求和,得到目标域表征向量,再根据所述目标域表征向量,利用DNN确定其对应的风险预测任务的风险分数。此外,还可以对各编码向量进行平均值池化,得到输出向量,后续可以将各风险预测任务分别对应的风险分数和该输出向量,一并发送给服务端,以便服务端综合判断所述目标业务是否具有预设类别的风险。
本说明书实施例,将多个风险预测任务对应为多个风险域,例如,将用于判断是否具有盗用风险的风险预测任务对应为盗用域,将用于判断是否具有欺诈风险的风险预测任务对应为欺诈域等。
由于有多个风险域,但是受限于客户端上的资源和模型耗时限制,如果同时部署多个模型,将带来严重的资源消耗,对于客户端所在的终端设备的性能是极大挑战,而且极大可能导致计算超时而无法实时得到风险分数,因此本说明书实施例将多个域的模型合并,避免串行计算带来的超时。
为了模型能够更好地兼顾各个域的性能,本说明书实施例采用了多任务学习的方式进行模型训练,此外,为了更好的利用海量的客户端数据,还可以先对模型进行预训练,然后对预训练之后的模型继续训练。
其中,多任务学习:把多个相关的任务放在一起学习,同时学习多个任务。
进一步地,所述风险预测模型采用如下方式进行训练:
采用自监督代理任务对所述特征提取网络进行预训练;
将预训练后的所述特征提取网络的参数固定,利用训练样本具有的第一风险预测任务的标签对所述编码器和第一预测网络进行训练;其中,所述第一风险预测任务为所述多个风险预测任务中的任一风险预测任务,所述第一预测网络对应于所述第一风险预测任务。
可以理解的是,自监督代理任务为自监督学习中的代理任务。其中,自监督学习:利用一组已知类别的样本调整分类器的参数,使其达到所要求性能的过程,也称为监督训练或有教师学习。代理任务:给神经网络模型自监督学习设计的一个目标,一般自定义设计。
图5示出根据一个实施例的二阶段训练示意图。参照图5,风险预测模型包括特征提取网络、编码器和多个预测网络,通过阶段一和阶段二训练风险预测模型。阶段一,采用自监督代理任务对特征提取网络进行预训练;阶段二,采用多任务学习的方式继续训练风险预测模型的编码器和多个预测网络,将预训练后的所述特征提取网络的参数固定,利用训练样本具有的第一风险预测任务的标签对所述编码器和第一预测网络进行训练;其中,所述第一风险预测任务为所述多个风险预测任务中的任一风险预测任务,所述第一预测网络对应于所述第一风险预测任务,可以理解的是,第一预测网络可以为图5中的预测网络1或预测网络2,图中仅示出2个预测网络,实际中可以有更多的预测网络,也就是说,可以有更多的风险预测任务,此外,一个训练样本可以有对应于多个风险预测任务各自的标签,例如,一个训练样本既可以有对应于风险预测任务1的标签,也可以有对应于风险预测任务2的标签。
本说明书实施例,通过上述二阶段的训练可以更好的兼顾各个风险域的性能,以及利用海量的客户端数据。
进一步地,所述自监督代理任务包括:遮蔽所述特征序列中对应于同一操作的所有特征对应的特征值,预测遮蔽的部分或全部特征的特征值。
图6示出根据一个实施例的自监督代理任务示意图。参照图6,自监督代理任务用于预测被遮蔽的特征值,例如,将操作3对应于特征1的特征值用mask替代,然后预测该特征值。对于多个特征的特征序列,具有同一个操作对应于多个特征的特征值,例如,操作3对应于特征1的特征值为X13,操作3对应于特征2的特征值为X23,操作3对应于特征3的特征值为X33,操作3对应于特征4的特征值为X43,操作3对应于特征5的特征值为X53。为了避免信息泄露,在对某一个操作的某一个特征值进行遮蔽的时候,需要将该操作对应于所有特征的特征值都进行遮蔽,例如,图6中将操作3对应于特征1至特征5的所有特征值都用于mask替代。将遮蔽后的特征序列输入特征提取网络,得到分别对应于各操作的各融合表征向量,例如,图6中γ1代表对应于操作1的融合表征向量,γ2代表对应于操作2的融合表征向量,γ3代表对应于操作3的融合表征向量,γ4代表对应于操作4的融合表征向量,根据γ3可以对被遮蔽的特征值进行预测,可以预测全部被遮蔽的特征值X13、X23、X33、X43、X53,也可以仅预测部分被遮蔽的特征值X13、X23、X33。
作为示例,特征1可以代表访问页面,特征2可以代表页面停留时间,特征3可以代表距离当前的时间间隔,特征4可以代表绝对时间,特征5可以代表日期。
除了前述二阶段训练方式之外,风险预测模型也可以有其他的训练方式,例如,可以不进行预训练,只采用多任务学习的方式进行训练。
进一步地,所述风险预测模型采用如下方式进行训练:
利用训练样本具有的第一风险预测任务的标签对所述特征提取网络、所述编码器和第一预测网络进行训练;其中,所述第一风险预测任务为所述多个风险预测任务中的任一风险预测任务,所述第一预测网络对应于所述第一风险预测任务。
最后在步骤23,在与所述第一执行链路并行执行的第二执行链路中,对所述目标业务进行继续处理,直至向所述服务端提交所述目标业务的业务请求;以使所述服务端根据所述业务请求和所述风险分数,判断所述目标业务是否具有预设类别的风险。可以理解的是,由于前述第一操作是向服务端提交所述目标业务的业务请求之前的预定操作,因此在第一操作与提交业务请求之间通常还需要一定的处理,例如,目标业务为支付业务时,通常还包括输入密码或者支付渲染等处理。
图7示出根据一个实施例的双链路并行处理示意图。参照图7,传统的风控模型是在用户完成支付时,才发起风控分析,即图中的云端分析,此时是将必要的风控特征传回给云端进行分析,而本说明书实施例需要在客户端上完成计算,如果在支付提交时去触发风险预测模型的计算,是无法赶上云端分析的;并且由于数据包大小的限制,模型计算结果无法和支付回传数据主链路一致。因此提出的方案是打分前置和回传旁路。打分前置:可以在用户唤起支付宝收银台的时候,就开始计算,在用户完成密码输入的过程中,存在1-2秒的时间,在这个时间窗口完成模型的计算。回传旁路:可以是将计算完的结果另外开辟一条远程过程调用(remote procedure call,RPC)的支路,传回给云端,在云端和其他维度的风控特征一起分析。可以理解的是,上述云端即服务端。
通过本说明书实施例提供的方法,首先客户端接收针对目标业务的第一操作,所述目标业务是所述多种服务业务之一,所述第一操作是向服务端提交所述目标业务的业务请求之前的预定操作;接着响应于所述第一操作,在第一执行链路中,获取用户通过所述客户端执行的历史操作序列,将所述历史操作序列对应的特征序列输入预先训练的风险预测模型,得到所述目标业务的风险分数,将所述风险分数发送给所述服务端;在与所述第一执行链路并行执行的第二执行链路中,对所述目标业务进行继续处理,直至向所述服务端提交所述目标业务的业务请求;以使所述服务端根据所述业务请求和所述风险分数,判断所述目标业务是否具有预设类别的风险。由上可见,本说明书实施例,由于确定风险分数是由客户端进行的,因此可以有效利用用户通过所述客户端执行的历史操作序列,使得确定的所述风险分数能够确保高准确率,并且在客户端向服务端提交所述目标业务的业务请求之前,就开始确定所述风险分数,从而可以利用上述接收第一操作与提交业务请求之间的时间差,在这段时间差内完成确定所述风险分数,因此可以确保低耗时。
根据另一方面的实施例,还提供一种基于用户操作判断业务风险的装置,该装置设置于客户端,所述客户端提供多种服务业务,该装置用于执行本说明书实施例提供的基于用户操作判断业务风险的方法。图8示出根据一个实施例的基于用户操作判断业务风险的装置的示意性框图。如图8所示,该装置800包括:
接收单元81,用于接收针对目标业务的第一操作,所述目标业务是所述多种服务业务之一,所述第一操作是向服务端提交所述目标业务的业务请求之前的预定操作;
第一执行单元82,用于响应于所述接收单元81接收的第一操作,在第一执行链路中,获取用户通过所述客户端执行的历史操作序列,将所述历史操作序列对应的特征序列输入预先训练的风险预测模型,得到所述目标业务的风险分数,将所述风险分数发送给所述服务端;
第二执行单元83,用于在与所述第一执行链路并行执行的第二执行链路中,对所述目标业务进行继续处理,直至向所述服务端提交所述目标业务的业务请求;以使所述服务端根据所述业务请求和所述风险分数,判断所述目标业务是否具有预设类别的风险。
可选地,作为一个实施例,所述目标业务属于支付业务,所述第一操作包括以下之一:启动收银台,展示收钱码,展示付钱码。
可选地,作为一个实施例,所述历史操作序列包括针对所述目标业务之外的业务的操作。
可选地,作为一个实施例,所述历史操作序列包括:
所述服务端能够感知的粗粒度操作和所述服务端不能够感知的细粒度操作。
进一步地,所述粗粒度操作包括:
浏览、收藏或加购;
所述细粒度操作包括:
点击、滑动或曝光。
可选地,作为一个实施例,所述特征序列对应于多项特征;所述风险预测模型包括特征提取网络;所述特征提取网络用于通过卷积处理的方式,将同一操作的不同特征对应的表征聚合,得到对应于同一操作的融合表征向量。
进一步地,所述多项特征包括以下至少一项:
访问页面、页面停留时间、距离当前的时间间隔、绝对时间、日期。
进一步地,所述风险预测模型还包括编码器和对应于多个风险预测任务的各预测网络;
所述编码器用于根据各操作分别对应的融合表征向量,通过卷积处理和自注意力机制,得到各操作分别对应的各编码向量;
所述各预测网络中的任一预测网络基于所述各编码向量与其对应的风险预测任务的权重,对所述各编码向量进行加权求和,得到目标域表征向量,根据所述目标域表征向量,确定其对应的风险预测任务的风险分数。
进一步地,所述风险预测模型采用如下方式进行训练:
采用自监督代理任务对所述特征提取网络进行预训练;
将预训练后的所述特征提取网络的参数固定,利用训练样本具有的第一风险预测任务的标签对所述编码器和第一预测网络进行训练;其中,所述第一风险预测任务为所述多个风险预测任务中的任一风险预测任务,所述第一预测网络对应于所述第一风险预测任务。
进一步地,所述自监督代理任务包括:遮蔽所述特征序列中对应于同一操作的所有特征对应的特征值,预测遮蔽的部分或全部特征的特征值。
进一步地,所述风险预测模型采用如下方式进行训练:
利用训练样本具有的第一风险预测任务的标签对所述特征提取网络、所述编码器和第一预测网络进行训练;其中,所述第一风险预测任务为所述多个风险预测任务中的任一风险预测任务,所述第一预测网络对应于所述第一风险预测任务。
通过本说明书实施例提供的装置,首先接收单元81接收针对目标业务的第一操作,所述目标业务是所述多种服务业务之一,所述第一操作是向服务端提交所述目标业务的业务请求之前的预定操作;接着第一执行单元82响应于所述第一操作,在第一执行链路中,获取用户通过所述客户端执行的历史操作序列,将所述历史操作序列对应的特征序列输入预先训练的风险预测模型,得到所述目标业务的风险分数,将所述风险分数发送给所述服务端;第二执行单元83在与所述第一执行链路并行执行的第二执行链路中,对所述目标业务进行继续处理,直至向所述服务端提交所述目标业务的业务请求;以使所述服务端根据所述业务请求和所述风险分数,判断所述目标业务是否具有预设类别的风险。由上可见,本说明书实施例,由于确定风险分数是由客户端进行的,因此可以有效利用用户通过所述客户端执行的历史操作序列,使得确定的所述风险分数能够确保高准确率,并且在客户端向服务端提交所述目标业务的业务请求之前,就开始确定所述风险分数,从而可以利用上述接收第一操作与提交业务请求之间的时间差,在这段时间差内完成确定所述风险分数,因此可以确保低耗时。
根据另一方面的实施例,还提供一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行结合图2所描述的方法。
根据再一方面的实施例,还提供一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现结合图2所描述的方法。
本领域技术人员应该可以意识到,在上述一个或多个示例中,本发明所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。

Claims (24)

1.一种基于用户操作判断业务风险的方法,所述方法由客户端执行,所述客户端提供多种服务业务,所述方法包括:
接收针对目标业务的第一操作,所述目标业务是所述多种服务业务之一,所述第一操作是向服务端提交所述目标业务的业务请求之前的预定操作;
响应于所述第一操作,在第一执行链路中,获取用户通过所述客户端执行的历史操作序列,将所述历史操作序列对应的特征序列输入预先训练的风险预测模型,得到所述目标业务的风险分数,将所述风险分数发送给所述服务端;
在与所述第一执行链路并行执行的第二执行链路中,对所述目标业务进行继续处理,直至向所述服务端提交所述目标业务的业务请求;以使所述服务端根据所述业务请求和所述风险分数,判断所述目标业务是否具有预设类别的风险。
2.如权利要求1所述的方法,其中,所述目标业务属于支付业务,所述第一操作包括以下之一:启动收银台,展示收钱码,展示付钱码。
3.如权利要求1所述的方法,其中,所述历史操作序列包括针对所述目标业务之外的业务的操作。
4.如权利要求1所述的方法,其中,所述历史操作序列包括:
所述服务端能够感知的粗粒度操作和所述服务端不能够感知的细粒度操作。
5.如权利要求4所述的方法,其中,所述粗粒度操作包括:
浏览、收藏或加购;
所述细粒度操作包括:
点击、滑动或曝光。
6.如权利要求1所述的方法,其中,所述特征序列对应于多项特征;所述风险预测模型包括特征提取网络;所述特征提取网络用于通过卷积处理的方式,将同一操作的不同特征对应的表征聚合,得到对应于同一操作的融合表征向量。
7.如权利要求6所述的方法,其中,所述多项特征包括以下至少一项:
访问页面、页面停留时间、距离当前的时间间隔、绝对时间、日期。
8.如权利要求6所述的方法,其中,所述风险预测模型还包括编码器和对应于多个风险预测任务的各预测网络;
所述编码器用于根据各操作分别对应的融合表征向量,通过卷积处理和自注意力机制,得到各操作分别对应的各编码向量;
所述各预测网络中的任一预测网络基于所述各编码向量与其对应的风险预测任务的权重,对所述各编码向量进行加权求和,得到目标域表征向量,根据所述目标域表征向量,确定其对应的风险预测任务的风险分数。
9.如权利要求8所述的方法,其中,所述风险预测模型采用如下方式进行训练:
采用自监督代理任务对所述特征提取网络进行预训练;
将预训练后的所述特征提取网络的参数固定,利用训练样本具有的第一风险预测任务的标签对所述编码器和第一预测网络进行训练;其中,所述第一风险预测任务为所述多个风险预测任务中的任一风险预测任务,所述第一预测网络对应于所述第一风险预测任务。
10.如权利要求9所述的方法,其中,所述自监督代理任务包括:遮蔽所述特征序列中对应于同一操作的所有特征对应的特征值,预测遮蔽的部分或全部特征的特征值。
11.如权利要求8所述的方法,其中,所述风险预测模型采用如下方式进行训练:
利用训练样本具有的第一风险预测任务的标签对所述特征提取网络、所述编码器和第一预测网络进行训练;其中,所述第一风险预测任务为所述多个风险预测任务中的任一风险预测任务,所述第一预测网络对应于所述第一风险预测任务。
12.一种基于用户操作判断业务风险的装置,所述装置设置于客户端,所述客户端提供多种服务业务,所述装置包括:
接收单元,用于接收针对目标业务的第一操作,所述目标业务是所述多种服务业务之一,所述第一操作是向服务端提交所述目标业务的业务请求之前的预定操作;
第一执行单元,用于响应于所述接收单元接收的第一操作,在第一执行链路中,获取用户通过所述客户端执行的历史操作序列,将所述历史操作序列对应的特征序列输入预先训练的风险预测模型,得到所述目标业务的风险分数,将所述风险分数发送给所述服务端;
第二执行单元,用于在与所述第一执行链路并行执行的第二执行链路中,对所述目标业务进行继续处理,直至向所述服务端提交所述目标业务的业务请求;以使所述服务端根据所述业务请求和所述风险分数,判断所述目标业务是否具有预设类别的风险。
13.如权利要求12所述的装置,其中,所述目标业务属于支付业务,所述第一操作包括以下之一:启动收银台,展示收钱码,展示付钱码。
14.如权利要求12所述的装置,其中,所述历史操作序列包括针对所述目标业务之外的业务的操作。
15.如权利要求12所述的装置,其中,所述历史操作序列包括:
所述服务端能够感知的粗粒度操作和所述服务端不能够感知的细粒度操作。
16.如权利要求15所述的装置,其中,所述粗粒度操作包括:
浏览、收藏或加购;
所述细粒度操作包括:
点击、滑动或曝光。
17.如权利要求12所述的装置,其中,所述特征序列对应于多项特征;所述风险预测模型包括特征提取网络;所述特征提取网络用于通过卷积处理的方式,将同一操作的不同特征对应的表征聚合,得到对应于同一操作的融合表征向量。
18.如权利要求17所述的装置,其中,所述多项特征包括以下至少一项:
访问页面、页面停留时间、距离当前的时间间隔、绝对时间、日期。
19.如权利要求17所述的装置,其中,所述风险预测模型还包括编码器和对应于多个风险预测任务的各预测网络;
所述编码器用于根据各操作分别对应的融合表征向量,通过卷积处理和自注意力机制,得到各操作分别对应的各编码向量;
所述各预测网络中的任一预测网络基于所述各编码向量与其对应的风险预测任务的权重,对所述各编码向量进行加权求和,得到目标域表征向量,根据所述目标域表征向量,确定其对应的风险预测任务的风险分数。
20.如权利要求19所述的装置,其中,所述风险预测模型采用如下方式进行训练:
采用自监督代理任务对所述特征提取网络进行预训练;
将预训练后的所述特征提取网络的参数固定,利用训练样本具有的第一风险预测任务的标签对所述编码器和第一预测网络进行训练;其中,所述第一风险预测任务为所述多个风险预测任务中的任一风险预测任务,所述第一预测网络对应于所述第一风险预测任务。
21.如权利要求20所述的装置,其中,所述自监督代理任务包括:遮蔽所述特征序列中对应于同一操作的所有特征对应的特征值,预测遮蔽的部分或全部特征的特征值。
22.如权利要求19所述的装置,其中,所述风险预测模型采用如下方式进行训练:
利用训练样本具有的第一风险预测任务的标签对所述特征提取网络、所述编码器和第一预测网络进行训练;其中,所述第一风险预测任务为所述多个风险预测任务中的任一风险预测任务,所述第一预测网络对应于所述第一风险预测任务。
23.一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行权利要求1-11中任一项的所述的方法。
24.一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现权利要求1-11中任一项的所述的方法。
CN202110492178.2A 2021-05-06 2021-05-06 基于用户操作判断业务风险的方法和装置 Active CN113409050B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110492178.2A CN113409050B (zh) 2021-05-06 2021-05-06 基于用户操作判断业务风险的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110492178.2A CN113409050B (zh) 2021-05-06 2021-05-06 基于用户操作判断业务风险的方法和装置

Publications (2)

Publication Number Publication Date
CN113409050A CN113409050A (zh) 2021-09-17
CN113409050B true CN113409050B (zh) 2022-05-17

Family

ID=77678046

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110492178.2A Active CN113409050B (zh) 2021-05-06 2021-05-06 基于用户操作判断业务风险的方法和装置

Country Status (1)

Country Link
CN (1) CN113409050B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114358977A (zh) * 2022-01-04 2022-04-15 拉扎斯网络科技(上海)有限公司 信息处理方法、装置、电子设备及计算机可读存储介质
CN115545720B (zh) * 2022-11-29 2023-03-10 支付宝(杭州)信息技术有限公司 一种模型训练的方法、业务风控的方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017049910A (ja) * 2015-09-04 2017-03-09 株式会社東芝 アイテム推薦システム、アイテム推薦方法およびプログラム
CN107025597A (zh) * 2016-07-20 2017-08-08 平安科技(深圳)有限公司 基于大数据的风险预测方法和装置
CN109034660A (zh) * 2018-08-22 2018-12-18 平安科技(深圳)有限公司 基于预测模型的风险控制策略的确定方法及相关装置
CN109410036A (zh) * 2018-10-09 2019-03-01 北京芯盾时代科技有限公司 一种欺诈检测模型训练方法和装置及欺诈检测方法和装置
CN111932267A (zh) * 2020-07-27 2020-11-13 中国工商银行股份有限公司 企业金融服务风险预测方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017049910A (ja) * 2015-09-04 2017-03-09 株式会社東芝 アイテム推薦システム、アイテム推薦方法およびプログラム
CN107025597A (zh) * 2016-07-20 2017-08-08 平安科技(深圳)有限公司 基于大数据的风险预测方法和装置
CN109034660A (zh) * 2018-08-22 2018-12-18 平安科技(深圳)有限公司 基于预测模型的风险控制策略的确定方法及相关装置
CN109410036A (zh) * 2018-10-09 2019-03-01 北京芯盾时代科技有限公司 一种欺诈检测模型训练方法和装置及欺诈检测方法和装置
CN111932267A (zh) * 2020-07-27 2020-11-13 中国工商银行股份有限公司 企业金融服务风险预测方法及装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
ForeTell: Facilitating doctor-patient conversation through interactive information visualization of risk prediction index;Pratibha Bhaskaran;《IEEE》;20121224;全文 *
云环境下基于贝叶斯网络的用户操作文档的行为预测;胡成祥;《新乡学院学报》;20141031;全文 *
华能国际电子商务平台运营管理创新与安全防范研究;杜月华;《中国优秀硕士学位论文全文数据库》;20160215;全文 *

Also Published As

Publication number Publication date
CN113409050A (zh) 2021-09-17

Similar Documents

Publication Publication Date Title
CN109345260B (zh) 一种异常操作行为的检测方法
WO2019196546A1 (zh) 确定业务请求事件的风险概率的方法及装置
US10509837B2 (en) Modeling actions for entity-centric search
US20210233080A1 (en) Utilizing a time-dependent graph convolutional neural network for fraudulent transaction identification
CN108596616B (zh) 用户数据真实性分析方法及装置、存储介质、电子设备
CN111737546B (zh) 确定实体业务属性的方法及装置
CN111553488B (zh) 一种针对用户行为的风险识别模型训练方法及系统
CN110827138B (zh) 一种推送信息确定方法及装置
CN113409050B (zh) 基于用户操作判断业务风险的方法和装置
CN113902473B (zh) 业务预测系统的训练方法及装置
CN112580952A (zh) 用户行为风险预测方法、装置、电子设备及存储介质
US12062051B2 (en) Systems and methods for using machine learning to predict events associated with transactions
US20190392314A1 (en) Method and device for cash advance recognition
CN110310123B (zh) 风险判断方法和装置
CN113887214B (zh) 基于人工智能的意愿推测方法、及其相关设备
CN112950291B (zh) 模型的偏差优化方法、装置、设备及计算机可读介质
US20240185230A1 (en) Machine learning intelligent gateway selection for transaction routing
CN116310382A (zh) 舆情预测方法、装置、电子设备及存储介质
CN110348190B (zh) 基于用户操作行为的用户设备归属判断方法及装置
CN114707990B (zh) 一种用户行为模式的识别方法和装置
CN111178535A (zh) 实现自动机器学习的方法和装置
CN114978616B (zh) 风险评估系统的构建方法及装置、风险评估方法及装置
US20230334307A1 (en) Training an artificial intelligence engine to predict a user likelihood of attrition
US20230334504A1 (en) Training an artificial intelligence engine to automatically generate targeted retention mechanisms in response to likelihood of attrition
US20230401416A1 (en) Leveraging multiple disparate machine learning model data outputs to generate recommendations for the next best action

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant