发明内容
有鉴于此,本说明书一个或多个实施例提供一种盗卡风险交易的识别方法和装置,以提高对盗卡风险交易的识别准确性。
具体地,本说明书一个或多个实施例是通过如下技术方案实现的:
第一方面,提供一种方法,所述方法包括:
对于一笔待识别的转账交易,获取所述转账交易中的转账卡关联的交易信息;并根据所述交易信息,构造一个交易关系网络图;
利用图嵌入graph embedding算法,得到所述交易关系网络图中的各个节点的向量化特征,所有节点的向量化特征构成对应所述转账交易的交易特征;
将所述交易特征输入预先训练的盗卡风险识别模型,输出得到所述转账交易对应的风险分值,以根据所述风险分值确定所述转账交易是否为盗卡交易。
第二方面,提供一种盗卡风险识别模型的训练方法,所述方法包括:
获取黑白样本交易数据;
对于所述黑白样本交易数据中的转账交易,计算所述转账交易对应的交易特征:获取所述转账交易中的转账卡关联的交易信息;并根据所述交易信息,构造一个交易关系网络图;利用图嵌入graph embedding算法,计算得到所述交易关系网络图中的各个节点的向量化特征,所有节点的向量化特征构成对应所述转账交易的交易特征;
使用所述黑白样本交易数据的交易特征,训练有监督的二分类模型,作为所述盗卡风险识别模型。
第三方面,提供一种盗卡风险交易的识别装置,所述装置包括:
图构造模块,用于对于一笔待识别的转账交易,获取所述转账交易中的转账卡关联的交易信息;并根据所述交易信息,构造一个交易关系网络图;
向量转化模块,用于利用图嵌入graph embedding算法,得到所述交易关系网络图中的各个节点的向量化特征,所有节点的向量化特征构成对应所述转账交易的交易特征;
模型预测模块,用于将所述交易特征输入预先训练的盗卡风险识别模型,输出得到所述转账交易对应的风险分值,以根据所述风险分值确定所述转账交易是否为盗卡交易。
第四方面,提供一种盗卡风险识别模型的训练装置,所述装置包括:
样本获取模块,用于获取黑白样本交易数据;
特征计算模块,用于对于所述黑白样本交易数据中的转账交易,计算所述转账交易对应的交易特征:获取所述转账交易中的转账卡关联的交易信息;并根据所述交易信息,构造一个交易关系网络图;利用图嵌入graph embedding算法,计算得到所述交易关系网络图中的各个节点的向量化特征,所有节点的向量化特征构成对应所述转账交易的交易特征;
模型训练模块,用于使用所述黑白样本交易数据的交易特征,训练有监督的二分类模型,作为所述盗卡风险识别模型。
第五方面,提供一种盗卡风险交易的识别设备,所述设备包括存储器、处理器,以及存储在存储器上并可在处理器上运行的计算机指令,所述处理器执行指令时实现以下步骤:
对于一笔待识别的转账交易,获取所述转账交易中的转账卡关联的交易信息;并根据所述交易信息,构造一个交易关系网络图;
利用图嵌入graph embedding算法,得到所述交易关系网络图中的各个节点的向量化特征,所有节点的向量化特征构成对应所述转账交易的交易特征;
将所述交易特征输入预先训练的盗卡风险识别模型,输出得到所述转账交易对应的风险分值,以根据所述风险分值确定所述转账交易是否为盗卡交易。
本说明书一个或多个实施例的盗卡风险交易的识别方法和装置,通过根据转账卡关联的交易信息构造关系网络图,并对该网络图进行向量化特征表示,使得可以依据客观的交易信息大数据来识别盗卡风险,从而提高了对盗卡风险交易的识别准确性。
具体实施方式
为了使本技术领域的人员更好地理解本说明书一个或多个实施例中的技术方案,下面将结合本说明书一个或多个实施例中的附图,对本说明书一个或多个实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书一个或多个实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本公开保护的范围。
本说明书至少一个实施例提供的盗卡风险交易的识别方法,是基于Graphembedding算法,将一笔待进行风险识别的转账交易,通过Graph Embedding算法计算该交易的向量化特征表示,并将该向量化特征表示输入预先训练的盗卡风险识别模型,来识别一笔转账交易是否具有盗卡交易的风险。
Graph embedding是一种图计算的方法,能够将图中的节点进行嵌入变成可计算的值或者向量。Graph embedding算法有多种,例如,包括但不限于deepwalk、node2vec、struct2vec等。对于一笔转账交易,可以按照图1所示的方法进行Graph embedding的计算,如图1所示,该方法可以包括:
在步骤100中,以所述转账交易中的转账卡为起点,获取在预定时间段内与所述转账卡具有直接或间接关联的各个交易关联元素。
举例来说:假设一笔转账交易是由卡K1向卡K2转账一定的金额。
所述的卡K1或者卡K2是该笔交易中参与的转账卡,可以在图2中表示为对应的两个节点k1和k2。并且,这两个卡是在同一笔交易中,可以在这两个节点之间设置一条连接边。
接着,卡K1绑定的支付账号是a1,卡K2绑定的支付账号是a2,如图2所示,创建两个对应上述支付账号的节点a1和a2。同时,在节点a1、a2、k1和k2之间设置图2所示的连接边,例如,节点a1和k1之间的连接边表示两者是卡和账号绑定的关系。
然后,支付账号a1运行所在的设备是t1,例如,某用户使用自己的手机,手机上安装了一个支付APP,该支付APP中注册有用户自己的支付账号a1,并且该支付账号a1中还绑定了用户的转账卡K1。所述的用户的手机即为设备t1。如图2所示,节点a1和设备t1之间的连接边表示两者是账号及其运行所在设备的关系。同理,也在节点a2及其运行所在设备t2之间设置连接边。
再者,用户在手机上网购物或者转账交易时,手机可以连接网络,例如,可以连接家里的WIFI,可以根据设备连接的网络确定设备所在的地址位置,并将该地址位置作为图2中的一个节点。例如,节点l1是设备t1所在的位置,节点l2是设备t2所在的位置。节点l1和t1之间的连接边表示设备及其所在位置的关系。同理,节点l2和t2之间也具有连接边。
还有,假设用户使用支付账号a1在进行网络购物,将会设置收货地址,该对应的收货地址d1也可以作为图2中的一个节点,并且与节点a1之间设置连接边,该连接边表示节点a1和d1之间是使用支付账号购物的收货地址的关系。
上述的转账卡、支付账号、设备、设备所在位置、收货地址,都是所述的一笔转账交易中涉及到的各个因素,这些因素可以称为“交易关联元素”。此外,该交易关联元素是以转账交易的转账卡为起点,根据“转账卡绑定的支付账号”、“支付账号运行所在的设备”等关系延伸得到,都与转账卡具有直接或间接的关联,例如,支付账号与转账卡是绑定关系,属于直接关联。而设备所在地址可以是与转账卡具有间接关联,通过设备、支付账号等才与转账卡发生关联。
还需要说明的是,交易关联元素包括但不限于上述提到的转账卡、支付账号、设备等,其他与转账交易发生关联的因素也可以作为图2中的节点,比如,操作转账交易的用户的身份信息,或者转账交易的发生时间等,不再详举。具体采用哪些交易关联元素作为节点,在实际实施中可以根据业务需求确定。此外,在确定了作为节点的交易关联元素的基础上,具体在哪些节点之间设置连接边,可以有多种方式,包括但不限于:将在同一笔交易里面发生的节点之间设置连接边,或者,将关联着同一个账户或者同一张卡的节点之间设置边,等。例如,本例子的描述中,以在具有直接关联关系且属于同一笔交易的节点之间设置连接边为例。
请继续参见图2,图2中的节点包括两种颜色,一种没有填充色,比如节点a1、节点k1等,还有一种节点具有填充色,比如,节点k3、节点a3等。这两种节点的区别是,没有填充色的节点可以是本次待识别的转账交易直接得到的各个交易关联元素,比如,根据一次交易,就可以得到本次交易关联的支付账号、设备、设备所在地址等多种因素。而具有填充色的节点可以是历史交易数据得到,比如,可以获取预定时间段内(如,距离本次交易的时间往前推一个月)的历史交易数据,根据该历史交易数据去寻找与本次交易的各个交易关联元素发生直接或间接关联的因素。
示例性的,参见图2,设备t2不仅在位置l2的地方联网,根据历史交易数据来看,曾经也在位置l3的地方联网,因此,节点t2还连接节点l3。支付账号a2绑定了不止一个转账卡,还绑定了转账卡k3,根据历史交易数据,该转账卡k3还曾经与转账卡k4发生过转账交易。而转账卡k4还绑定了支付账号a3,支付账号a3运行的设备是t3,支付账号a3在用来购物时填写过收货地址d2。
图2只是示例了部分的节点和节点间的连接边,实际上图2的规模可以更大,图中包括的节点数量也可以更多。该图2可以称为“交易关系网络图”,是根据转账交易的转账卡所关联的交易信息构造得到,所述的交易信息包括了本次交易数据和历史交易数据,交易数据包括了上述的支付账号、设备、收货地址等交易关联元素。这些交易数据可以是在转账交易执行时采集获取并存储。
由上述可以看到,根据一笔转账交易,可以将在一段时间内与该笔转账交易的转账卡具有直接或间接关联的各个交易关联元素,作为交易关系网络图的各个节点,并在具有直接关联关系且属于同一笔交易的节点之间设置连接边,从而可以得到对应该笔转账交易的交易关系网络图graph。
在步骤102中,利用graph embedding算法,得到交易关系网络图中的各个节点的向量化特征,所有节点的向量化特征构成对应转账交易的交易特征。
在构造了交易关系网络图的基础上,可以采用诸如node2vec、struct2vec等graphembedding算法进行计算,得到图中的每个节点的向量化特征表示。由于node2vec、struct2vec等是常规的算法,对其具体的计算方式不再详述。图中所有节点的向量化特征的整体构成对应转账交易的交易特征。
为了识别盗卡风险交易,可以预先训练一个盗卡风险识别模型,该模型可以是有监督的二分类模型。模型的输入可以是一笔转账交易对应的交易特征,交易特征的计算可以按照图1的流程进行,比如,由图2进行graph embedding计算得到的向量化特征,模型的输入可以是风险分值,例如,风险分值可以在0~1之间,分数越高表示越有风险。训练完成模型后,可以利用该模型来识别一笔转账交易是否具有盗卡风险。
模型的训练
模型训练时,可以获取一定数量的黑白样本交易数据,例如,黑样本交易数据可以是盗卡交易,白样本交易数据可以是非盗卡交易。该黑白样本交易数据的获得可以是根据已经报回的历史案件信息得到。
对于所述黑白样本交易数据中的转账交易,可以按照图1和图2所示的方式,计算该转账交易对应的交易特征。并使用所述黑白样本交易数据的交易特征,训练有监督的二分类模型,作为所述盗卡风险识别模型。所述的二分类模型可以包括逻辑回归、决策树、随机森林等。
在另外的至少一个实施例中,为了丰富模型训练样本的多样性,以使得模型的性能更好,对于黑白样本交易数据,可以采取一部分转账交易根据graph embedding算法计算对应的交易特征,作为模型训练的输入,另一部分转账交易可以根据历史交易行为数据统计经验特征,该经验特征是人工构造的特征,比如,基于转账卡、支付账号、设备、收货地址等至少一个维度进行统计,统计一段时间内的交易次数或交易金额等。可以将经验特征和交易特征构成一个特征池,模型训练时,这些特征池中的特征都可以作为输入来训练模型。
此外,还可以根据不断更新的交易数据,对盗卡风险识别模型进行定期的模型更新,以使得模型更加准确,模型性能更好。
模型的使用
训练好的盗卡风险识别模型可以用来识别一笔交易的盗卡风险,如图3所示,示例了至少一个实施例的盗卡风险交易的识别方法,可以包括:
在步骤300中,对于一笔待识别的转账交易,获取所述转账交易中的转账卡关联的交易信息。
例如,要识别一笔转账交易是否是盗卡交易时,可以获取所述转账交易中的转账卡关联的交易信息,包括本次交易数据和一段时间内的历史交易数据,以及根据交易数据得到的与本次转账交易中的转账卡直接或间接关联的交易关联元素以及元素之间的关系。
在步骤302中,根据所述交易信息,构造一个交易关系网络图。
本步骤可以构造一个交易关系网络图,其中,各个交易关联元素可以作为图中的各个节点,并在具有直接关联关系且属于同一笔交易的交易关联元素之间,设置节点之间的连接边。
在步骤304中,利用图嵌入graph embedding算法,得到所述交易关系网络图中的各个节点的向量化特征,所有节点的向量化特征构成对应所述转账交易的交易特征。例如,可以使用node2vec算法。
在步骤306中,将所述交易特征输入预先训练的盗卡风险识别模型,输出得到所述转账交易对应的风险分值。
本步骤中,可以将步骤304中得到的交易特征作为模型的输入,输出一个风险分值。接着,可以根据所述风险分值确定所述转账交易是否为盗卡交易,例如,可以设定一个风险分值的阈值,在风险分值越高则风险越大的情况下,当风险分值高于该阈值时,则确定本次转账交易是盗卡交易。
此外,当模型的训练使用了包括经验特征和交易特征的特征池时,模型可以支持以经验特征作为输入,也可以支持将交易特征作为输入。不仅有效通过增强特征池来提升模型准确率,而且对于新卡、新设备、新账号等转账交易也能够很好的覆盖。
为了实现上述方法,本说明书至少一个实施例还提供了一种盗卡风险交易的识别装置,如图4所示,该装置可以包括:图构造模块41、向量转化模块42和模型预测模块43。
图构造模块41,用于对于一笔待识别的转账交易,获取所述转账交易中的转账卡关联的交易信息;并根据所述交易信息,构造一个交易关系网络图;
向量转化模块42,用于利用图嵌入graph embedding算法,得到所述交易关系网络图中的各个节点的向量化特征,所有节点的向量化特征构成对应所述转账交易的交易特征;
模型预测模块43,用于将所述交易特征输入预先训练的盗卡风险识别模型,输出得到所述转账交易对应的风险分值,以根据所述风险分值确定所述转账交易是否为盗卡交易。
在一个例子中,图构造模块41,具体用于:以所述转账交易中的转账卡为起点,获取在预定时间段内与所述转账卡具有直接或间接关联的各个交易关联元素;将所述各个交易关联元素,作为所述交易关系网络图中的各个节点;在所述各个节点之间设置节点之间的连接边。
为了实现上述方法,本说明书至少一个实施例还提供了一种盗卡风险识别模型的训练装置,如图5所示,该装置可以包括:样本获取模块51、特征计算模块52和模型训练模块53。
样本获取模块51,用于获取黑白样本交易数据;
特征计算模块52,用于对于所述黑白样本交易数据中的转账交易,计算所述转账交易对应的交易特征:获取所述转账交易中的转账卡关联的交易信息;并根据所述交易信息,构造一个交易关系网络图;利用图嵌入graph embedding算法,计算得到所述交易关系网络图中的各个节点的向量化特征,所有节点的向量化特征构成对应所述转账交易的交易特征;
模型训练模块53,用于使用所述黑白样本交易数据的交易特征,训练有监督的二分类模型,作为所述盗卡风险识别模型。
上述实施例阐明的装置或模块,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机,计算机的具体形式可以是个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件收发设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任意几种设备的组合。
为了描述的方便,描述以上装置时以功能分为各种模块分别描述。当然,在实施本说明书一个或多个实施例时可以把各模块的功能在同一个或多个软件和/或硬件中实现。
上述图中所示流程中的各个步骤,其执行顺序不限制于流程图中的顺序。此外,各个步骤的描述,可以实现为软件、硬件或者其结合的形式,例如,本领域技术人员可以将其实现为软件代码的形式,可以为能够实现所述步骤对应的逻辑功能的计算机可执行指令。当其以软件的方式实现时,所述的可执行指令可以存储在存储器中,并被设备中的处理器执行。
例如,对应于上述方法,本说明书一个或多个实施例同时提供一种盗卡风险交易的识别设备。该设备可以包括处理器、存储器、以及存储在存储器上并可在处理器上运行的计算机指令,所述处理器通过执行所述指令,用于实现如下步骤:
对于一笔待识别的转账交易,获取所述转账交易中的转账卡关联的交易信息;并根据所述交易信息,构造一个交易关系网络图;
利用图嵌入graph embedding算法,得到所述交易关系网络图中的各个节点的向量化特征,所有节点的向量化特征构成对应所述转账交易的交易特征;
将所述交易特征输入预先训练的盗卡风险识别模型,输出得到所述转账交易对应的风险分值,以根据所述风险分值确定所述转账交易是否为盗卡交易。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本说明书一个或多个实施例可提供为方法、系统或计算机程序产品。因此,本说明书一个或多个实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书一个或多个实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书一个或多个实施例可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书一个或多个实施例,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于数据处理设备实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
以上所述仅为本说明书一个或多个实施例的较佳实施例而已,并不用以限制本说明书一个或多个实施例,凡在本说明书一个或多个实施例的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本说明书一个或多个实施例保护的范围之内。