CN110175850B - 一种交易信息的处理方法及装置 - Google Patents

一种交易信息的处理方法及装置 Download PDF

Info

Publication number
CN110175850B
CN110175850B CN201910392368.XA CN201910392368A CN110175850B CN 110175850 B CN110175850 B CN 110175850B CN 201910392368 A CN201910392368 A CN 201910392368A CN 110175850 B CN110175850 B CN 110175850B
Authority
CN
China
Prior art keywords
transaction
node
vector
historical
transaction information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910392368.XA
Other languages
English (en)
Other versions
CN110175850A (zh
Inventor
黄勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Unionpay Co Ltd
Original Assignee
China Unionpay Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Unionpay Co Ltd filed Critical China Unionpay Co Ltd
Priority to CN201910392368.XA priority Critical patent/CN110175850B/zh
Publication of CN110175850A publication Critical patent/CN110175850A/zh
Application granted granted Critical
Publication of CN110175850B publication Critical patent/CN110175850B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/382Payment protocols; Details thereof insuring higher security of transaction
    • G06Q20/3827Use of message hashing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/40Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
    • G06Q20/401Transaction verification

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computer Security & Cryptography (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种交易信息的处理方法及装置,其中,方法包括:获取交易信息,根据交易信息和图向量模型,确定交易信息的特征向量,根据交易评分模型和交易信息的特征向量,对交易信息进行验证,若交易信息验证不通过,则对交易信息进行异常处理。上述技术方案在对交易信息进行验证时,充分考虑交易信息中的交易关系路径,可以提高异常交易信息确定的成功率,及时对异常信息进行处理。

Description

一种交易信息的处理方法及装置
技术领域
本发明实施例涉及计算机技术领域,尤其涉及一种交易信息的处理方法及装置。
背景技术
异常交易通常指一些用户为了获利,短时间内大量使用其他人的卡进行交易,异常交易呈现出团伙性、隐蔽性等特点。
现有的异常交易检测技术中,主要通过交易信息中的交易数据进行判断,如交易金额、交易商品、交易类型(线上交易、线下交易、二维码交易和闪付交易)等。但该方式确定出异常交易信息的成功率较低,不能及时对异常信息进行处理。
发明内容
本发明实施例提供一种交易信息的处理方法及装置,用于提高异常交易信息确定的成功率,及时对异常信息进行处理。
本发明实施例提供的一种交易信息的处理方法,包括:
获取交易信息;
根据所述交易信息和图向量模型,确定所述交易信息的特征向量;所述图向量模型是根据历史交易信息中的交易关系路径进行训练学习得到的;
根据交易评分模型和所述交易信息的特征向量,对所述交易信息进行验证;所述交易评分模型是根据所述图向量模型和预设的第一神经网络模型对所述历史交易信息进行训练学习得到的;
若所述交易信息验证不通过,则对所述交易信息进行异常处理。
上述技术方案中,由于交易评分模型是根据图向量模型和预设的第一神经网络模型对历史交易信息进行训练学习得到,图向量模型是根据历史交易信息中的交易关系路径进行训练学习得到的。也就是说,交易评分模型是在图向量模型训练完成后再进一步训练学习得到的,充分考虑交易信息中的交易关系路径,可以较全面地描述出历史交易的交易关系路径中涉及到的用户、商户、设备以及三者之间的关系,更准确的判定交易信息是否验证通过,从而确定出异常信息,并进行处理。
可选的,所述根据历史交易信息中的交易关系路径进行训练学习得到所述图向量模型,包括:
获取所述历史交易信息;
根据所述历史交易信息的交易关系路径确定交易网络图;所述交易网络图包括多个节点,所述多个节点包括至少一个用户节点、至少一个商户节点和至少一个设备节点;
针对所述交易网络图中的任一个节点,对所述节点进行随机游走,获取所述节点的路径特征向量;
将所述节点的路径特征向量,输入至预设的第二神经网络模型进行训练学习,确定所述图向量模型。
上述技术方案中,根据历史交易信息中的交易关系路径确定由用户节点、商户节点、设备节点以及节点关系组成的交易网络图,并针对任一节点进行随机游走确定节点的路径特征向量,将节点的路径特征向量输入至第二神经网络模型训练得到图向量模型,该图向量模型在建立过程中充分考虑了交易关系路径,即充分考虑用户节点、商户节点、设备节点以及节点关系,以使得建立的图向量模型能够较全面的表示某节点的交易关系。
可选的,所述对所述节点进行随机游走,包括:
获取随机游走规则,所述随机游走规则包括第一比值;所述第一比值为所述交易网络图中任一节点在随机游走过程中经过第一节点的数量占经过所有节点的数量的比值;所述第一节点为商户节点或设备节点;
根据所述第一比值,对所述节点进行随机游走。
上述技术方案中,考虑到交易网络中的不同节点类型,设置交易网络中的随机游走规则,设定任一节点在随机游走过程中经过商户节点或设备节点的数量与经过所有节点的数量的比值,也可以理解为,经过商户节点或设备节点的数量与经过用户节点的数量的比值,该随机游走规则综合考虑商户、用户和设备在整个交易网络中的特点,获取到的节点特征向量更具有代表性,有利于建立具有高准确率的图向量模型。
可选的,所述根据所述图向量模型和预设的第一神经网络模型对所述历史交易信息进行训练学习得到所述交易评分模型,包括:
获取所述历史交易信息;所述历史交易信息包括历史交易数据、历史用户数据、历史交易关系路径;
对所述历史交易数据进行哈希处理,得到所述历史交易数据的交易向量;对所述历史用户数据进行哈希处理,得到所述历史用户数据的用户向量;将所述历史交易关系路径输入至所述图向量模型,得到所述历史交易关系路径的节点向量;
将所述历史交易数据的交易向量、历史用户数据的用户向量、历史交易关系路径的节点向量,组合成历史交易信息的联合特征向量,输入至所述预设的第一神经网络模型进行训练学习,确定所述交易评分模型。
上述技术方案中,综合考虑历史交易信息中的交易数据、用户数据、交易关系路径,并分别确定出交易特征向量、用户特征向量、节点特征向量,将三者组成的联合特征向量作为模型训练的输入向量对预设的第一神经网络模型进行学习训练,最终获得的交易评分模型综合考虑了交易过程中的各因素,更准确的判定交易信息是否验证通过,从而确定出异常信息,并进行处理。
可选的,所述交易信息包括交易数据、用户数据、交易关系路径;
所述根据所述交易信息和图向量模型,确定所述交易信息的特征向量,包括:
对所述交易数据进行哈希处理,得到所述交易数据的交易向量;对所述用户数据进行哈希处理,得到所述用户数据的用户向量;将所述交易关系路径输入至所述图向量模型,得到所述交易关系路径的节点向量;
将所述交易数据的交易向量、用户数据的用户向量、交易关系路径的节点向量确定为所述交易信息的特征向量。
上述技术方案中,根据交易信息中的交易数据、用户数据、交易关系路径,分别确定出交易数据的交易向量、用户数据的用户向量和交易关系路径的节点向量,将确定出的向量作为特征向量,全面考虑交易信息的各特征,从而对交易信息进行更准确的验证。
相应的,本发明实施例还提供了一种交易信息的处理装置,包括:
获取单元,用于获取交易信息;
处理单元,用于根据所述交易信息和图向量模型,确定所述交易信息的特征向量;所述图向量模型是根据历史交易信息中的交易关系路径进行训练学习得到的;根据交易评分模型和所述交易信息的特征向量,对所述交易信息进行验证;所述交易评分模型是根据所述图向量模型和预设的第一神经网络模型对所述历史交易信息进行训练学习得到的;若所述交易信息验证不通过,则对所述交易信息进行异常处理。
可选的,所述处理单元具体用于:
获取所述历史交易信息;
根据所述历史交易信息的交易关系路径确定交易网络图;所述交易网络图包括多个节点,所述多个节点包括至少一个用户节点、至少一个商户节点和至少一个设备节点;
针对所述交易网络图中的任一个节点,对所述节点进行随机游走,获取所述节点的路径特征向量;
将所述节点的路径特征向量,输入至预设的第二神经网络模型进行训练学习,确定所述图向量模型。
可选的,所述处理单元具体用于:
获取随机游走规则,所述随机游走规则包括第一比值;所述第一比值为所述交易网络图中任一节点在随机游走过程中经过第一节点的数量占经过所有节点的数量的比值;所述第一节点为商户节点或设备节点;
根据所述第一比值,对所述节点进行随机游走。
可选的,所述处理单元具体用于:
获取所述历史交易信息;所述历史交易信息包括历史交易数据、历史用户数据、历史交易关系路径;
对所述历史交易数据进行哈希处理,得到所述历史交易数据的交易向量;对所述历史用户数据进行哈希处理,得到所述历史用户数据的用户向量;将所述历史交易关系路径输入至所述图向量模型,得到所述历史交易关系路径的节点向量;
将所述历史交易数据的交易向量、历史用户数据的用户向量、历史交易关系路径的节点向量,组合成历史交易信息的联合特征向量,输入至所述预设的第一神经网络模型进行训练学习,确定所述交易评分模型。
可选的,所述交易信息包括交易数据、用户数据、交易关系路径;
所述处理单元具体用于:
对所述交易数据进行哈希处理,得到所述交易数据的交易向量;对所述用户数据进行哈希处理,得到所述用户数据的用户向量;将所述交易关系路径输入至所述图向量模型,得到所述交易关系路径的节点向量;
将所述交易数据的交易向量、用户数据的用户向量、交易关系路径的节点向量确定为所述交易信息的特征向量。
相应的,本发明实施例还提供了一种计算设备,包括:
存储器,用于存储程序指令;
处理器,用于调用所述存储器中存储的程序指令,按照获得的程序执行上述交易信息的处理方法。
相应的,本发明实施例还提供了一种计算机可读非易失性存储介质,包括计算机可读指令,当计算机读取并执行所述计算机可读指令时,使得计算机执行上述交易信息的处理方法。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种系统架构的示意图;
图2为本发明实施例提供的一种交易信息的处理方法的流程示意图;
图3为本发明实施例提供的一种交易网络的示意图;
图4为本发明实施例提供的另一种交易网络的示意图;
图5为本发明实施例提供的另一种交易信息的处理方法的流程示意图;
图6为本发明实施例提供的一种交易信息的处理装置的结构示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
图1示例性的示出了本发明实施例所适用的一种系统架构,该系统架构可以为服务器100,包括处理器110、通信接口120和存储器130。
其中,通信接口120用于与交易设备进行通信,收发该交易设备传输的交易信息,实现通信。
处理器110是服务器100的控制中心,利用各种接口和线路连接整个服务器100的各个部分,通过运行或执行存储在存储器130内的软件程序或模块,以及调用存储在存储器130内的数据,执行服务器100的各种功能和处理数据。可选地,处理器110可以包括一个或多个处理单元。
存储器130可用于存储软件程序以及模块,处理器110通过运行存储在存储器130的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器130可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据业务处理所创建的数据等。此外,存储器130可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
需要说明的是,上述图1所示的结构仅是一种示例,本发明实施例对此不做限定。
本发明实施例提供的交易信息的处理方法所适用的交易评分模型是在历史数据基础上,统计历史数据中交易数据特征、异常用户的交易行为特征、异常用户和异常商户的关联、异常数据所涉及的交易关系路径等,如表1是某营销活动中商户和设备的异常交易统计数据,很容易发现这些商户的交易金额和交易次数很有规律,且异常用户的交易行为和异常商户通常紧密关联,一些交易设备如POS机、手机POS、二维码等和多个异常用户之间存在关联交易,这表明异常交易存在规律性和社群性。
表1
设备 商户 最多出现的交易金额(元) 最多出现次数 交易总量
P1 M1 5.00 4762 4771
P2 M1 40.00 2069 2083
P3 M2 80.00 2496 2703
P4 M3 79.00 2187 2389
P5 M4 80.00 2118 2155
考虑到历史交易数据中异常交易数据的商户、用户、设备之间存在的规律,通过关注三者的交易关系路径,可以有效发现异常交易。故本发明结合历史交易数据、用户交易行为特征、交易关系路径等数据,建立符合自然规律的交易评分模型,用于评估交易信息是否通过验证。
本发明通过构建交易关联关系中的图向量模型,挖掘异常交易用户和商户。通过对商户、设备、用户构建图向量模型,考虑较全面的建模数据,构建的交易评分模型可对交易信息进行较高准确率的验证,有效发现异常交易。
基于上述描述,图2示例性的示出了本发明实施例提供的一种交易信息的处理方法的流程,该流程可以由交易信息的处理装置执行,该装置可以位于服务器中,可以是该服务器。如图2所示,该流程具体包括:
步骤201,获取交易信息。
交易信息可以包括交易数据、用户数据、交易关系路径等,交易数据指的是整个交易过程所涉及的信息,例如,交易金额、交易所在地、交易设备、交易商品等;用户数据指的是执行交易的用户的信息,例如,用户职业、用户年龄、用户行为、用户兴趣爱好、用户消费标签、用户卡信息等;交易关系路径指的是,本笔交易信息中所涉及的节点组成的路径。
本发明实施例中,在获取到交易信息后,可以对交易信息进行预先判断。可以预设规则,将明显不通过验证的数据过滤掉。预设规则可以为,预设时段内不超过最大交易笔数、交易金额不超过单笔最大交易金额等,当获取到交易信息后,可以先判断该交易信息是否通过上述预设规则的验证,若确定出该交易信息通过上述预设规则的验证,则可以确定将该交易信息进入下一步的模型检测。否则,直接确定该交易信息不通过验证,属于异常交易信息,需要针对该交易信息进行异常处理,例如将该交易信息进行报警。
对交易信息进行预先判断,可以有效识别出绝对异常的交易信息,举例来说,某银行设置优惠活动“每笔支付满10元减2元”,并预设规则为“每个账号每天仅限2次”,若某个用户为了获取利益,在一天中使用一个账号连续支付2次后,继续使用该账号进行支付,则该用户使用该账号进行第3次支付的交易信息不符合该银行的预设规则,该交易信息未通过验证,为异常交易信息,对该交易信息进行异常处理,且中断执行该笔交易。
步骤202,根据所述交易信息和图向量模型,确定所述交易信息的特征向量。
其中,图向量模型是根据历史交易信息中的交易关系路径进行训练学习得到的。在具体实施过程中,可以先获取历史交易信息,并根据历史交易信息的交易关系路径确定交易网络图,针对交易网络图中的任一个节点,对节点进行随机游走,获取节点的路径特征向量,将节点的路径特征向量,输入至预设的第二神经网络模型进行训练学习,确定图向量模型。
历史交易信息可以理解为预设时段内统计的历史交易信息,该预设时段可以根据经验进行设定,例如一个月、一周等,该历史交易信息可以为多条,每条历史交易信息对应至少两个节点,例如,历史交易信息1为“用户2向用户3转账”,涉及到用户节点2和用户节点3,则历史交易信息1的交易关系路径即为用户节点2和用户节点3组成的路径;又例如,历史交易信息2为“用户2在商户1中通过设备1发生交易”,涉及到用户节点2、商户节点1和设备节点1,则历史交易信息2的交易关系路径即为用户节点2、商户节点1和设备节点1组成的路径。
根据历史交易信息中的交易关系路径,可以确定出由用户节点、商户节点、设备节点组成的交易网络图。如图3所示,交易网络图可以包括多个节点,该多个节点包括至少一个用户节点、至少一个商户节点和至少一个设备节点。交易网络中的两个节点之间可能存在节点关系,例如,用户节点2和用户节点3之间存在转账关系、用户节点1和设备节点1之间存在交易关系、用户节点5和商户节点1之间存在控股关系等。
此外,在具体实现过程中,还可以根据历史数据中的每条历史交易信息构建三元组,例如根据历史交易信息1可以构建出三元组(用户2,转账,用户3),根据历史交易信息2可以构建出三元组(用户2,交易,设备1)、(商户1,有设备,设备1),进而根据每条历史交易信息构建的三元组,确定出由用户节点、商户节点、设备节点组成的节点关系的网络。
本发明实施例中,交易网络是基于用户、商户、设备三者之间的关系进行构建的,可以全面考虑三者之间的关系,如用户与用户之间可以存在转账关系、朋友关系、亲属关系等,商户和商户之间可以存在控股关系、合资关系等,在构建交易网络中,基于更多不同类型的关系构建网络图,可以提高交易网络在建模过程中的真实性,进一步提高交易网络中节点特征向量的真实性。
本发明实施例中,对交易网络图采用图特征向量表示算法,考虑到商户、用户和设备在整个交易网络中的不同特点,为保障节点特征向量的准确性,可以采用基于DeepWalk的随机游走算法,并预先设置随机游走的规则,定义商户节点或设备节点为第一节点,将商户节点、设备节点和用户节点区分,在随机游走过程中,设定交易网络中任一节点经过商户节点或设备节点的数量占经过总节点数量的比值,即第一比值,也就是说,需要预先获取随机游走规则,该随机游走规则可以包括第一比值,其中,该第一比值可以根据经验设定为0.7或者其它。进一步,根据随机游走规则中的第一比值,对节点进行随机游走。
在节点进行随机游走后,可以获取该节点在随机游走后的序列,并将这些序列作为该节点的路径特征向量。进一步,将整个交易网络中的所有节点进行随机游走后,确定出所有节点的路径特征向量,并将所有节点的路径特征向量,输入至预设的第二神经网络模型进行训练学习,确定图向量模型。
步骤203,根据交易评分模型和所述交易信息的特征向量,对所述交易信息进行验证。
其中,交易评分模型是根据图向量模型和预设的第一神经网络模型对历史交易信息进行训练学习得到的。
在建立交易评分模型时,可以先获取历史交易信息,历史交易信息可以包括历史交易数据、历史用户数据、历史交易关系路径。具体的,可以根据历史交易信息中的历史交易数据确定历史交易数据的交易向量;根据历史交易信息中的历史用户数据确定历史用户数据的用户向量;根据历史交易信息中历史交易关系路径确定历史交易关系路径的节点向量,也就是交易网络的节点向量。
(1)确定历史交易数据的交易向量
获取历史交易信息中的历史交易数据,如交易金额、交易所在地、交易设备、交易商品等,对该历史交易数据进行处理,如哈希编码,将字符特征因子转化为数字向量,记为Vt
(2)确定历史用户数据的用户向量
获取历史交易信息中的历史用户数据,如用户职业、用户年龄、用户行为、用户兴趣爱好、用户消费标签、用户卡信息等,对该历史用户数据进行处理,如哈希编码,将字符特征因子转化为数字向量,记为Va
(3)确定交易网络的节点向量
获取历史交易信息中的历史交易关系路径,将历史交易关系路径输入至图向量模型,得到基于历史交易网络的节点向量,记为Vn
为了更好的解释本发明实施例中确定节点特征向量,可以参照如图4所示的交易网络举例说明,其中,M代表商户节点、n代表用户节点、P代表设备节点。以用户节点n4为例,通过随机游走获取交易网络图中的关系路径特征,可以如表2示出,用户节点n4可以经过(n4,P1,M1,P2)、(n4,P2,M1,P1)等不同节点序列,将这些节点序列作为节点n4的特征表示,并用图神经网络(如GCN(Graph Convolutional Network,图卷积神经网络)、GNN(GraphNeural Networks,图神经网络))学习节点特征向量,获取用户节点n4的节点特征向量为(0.3,0.7,0.2,0.4,0.3,0.5)。本发明的GCN目标学习函数如公式(1)所示。
L≈∑(h,r,t)∈s(h′,r,t′)∈s′[γ+d(h+r,t)-d(h′+r,t′)]+……(1)
其中γ是间隔超参数,s是交易网络,(h,r,t)是这个交易网络中实际存在的三元组,s′是负例三元组组成的交易网络,(h′,r,t′)表示负例三元组。d(h+r,t)表示头实体加上关系向量和尾实体之间的欧氏距离。通过定义间隔损失函数,我们期望学习的模型能保证正实例对比负实例对距离小,这样就能保证正实例对比负实例对余弦相似度更高。通过随机梯度优化算法学习,使得目标函数L最小,从而可以获取交易网络中每个节点的向量Vn
表2
关系路径特征 节点特征向量
n4,P1,M1,P2 0.3
n4,P2,M1,P1 0.7
n4,P1,n5,P1 0.2
n4,P1,n3,P1 0.4
n4,P2,n24,P3 0.3
n4,P2,n24,P3 0.5
当然,还可以采用其他图特征向量表示算法,如node2vec、LINE(Large-scaleInformation Network Embedding,大规模网络信息嵌入)、TransE(TranslatingEmbedding)等,计算交易网络图中节点向量。
将历史交易数据的交易向量、历史用户数据的用户向量、历史交易关系路径的节点向量,组合成历史交易信息的联合特征向量,输入至预设的第一神经网络模型进行训练学习,确定交易评分模型。
在确定出历史交易数据的交易向量Vt、历史用户数据的用户向量Va、历史交易关系路径的节点向量Vn之后,可以将Vt、Va、Vn作为预设的第一神经网络模型的输入向量。当然,也可以将Vt、Va、Vn组合为联合特征向量V,联合特征向量可以表示为V=(Vt,Va,Vn),并将联合特征向量作为预设的第一神经网络模型的输入向量。
以联合特征向量作为预设的第一神经网络模型的输入向量进行下一步说明,根据有标记的历史交易信息构建多层神经网络模型,其中,有标记的历史交易信息理解为已经标记了是否为异常交易的信息。针对每条有标记的历史交易信息,确定有标记的历史交易信息对应的联合特征向量的值Vi=(Vti,Vai,Vni),并输入至预设的第一神经网络,进行模型训练学习,直至确定出交易评分模型。
进一步的,每条有标记的历史交易信息对应的联合特征向量的值Vi中,Vni代表节点特征向量,该Vni又可以包括Vn-用户i和Vn-设备i,分别代表该笔有标记的历史交易信息中用户节点的节点特征向量和设备节点的节点特征向量。
本发明实施例中,神经网络模型的输入层、隐藏层和输出层分别如公式(2)、公式(3)、公式(4)所示。
Vi=(Vti,Vai,Vni)……(2)
α(l+1)=f(αlwl+bl)……(3)
yi=±1……(4)
其中,f(αlwl+bl)采用ReLU(Rectified Linear Unit,线性整流函数),wl为第l层的学习权重,bl为偏置,αl为激活函数学习得到第l+1层的值,此外,对于不同的数据,为了能获得更好的预测结果,激活函数也可以采用softmax、sigmoid等其他激活函数,同一网络中不同层的激活函数可以不同,l的大小根据网络数据不同进行调节,通常在3-10层之间。本发明实施例中,损失函数采用对数损失函数,同样可替换为均方误差、边际损失等其他类型的损失函数。
本发明实施例中,可以基于多层神经网络模型构建交易评分模型,当然,也可以采用CNN(Convolutional Neural Network,卷积神经网络)、RNN(Recurrent NeuralNetwork,循环神经网络)、Random Forest(随机森林)、GBDT(Gradient Boosting DecisionTree,梯度提升决策树)等不同的监督学习算法进行构建。
本发明实施例中,在确定出交易评分模型之后,还可以对该交易评分模型进行评价,可以采用AUC(Area Under Curve)/F1评价,具体评价中,选用预设数量测试集,其中,测试集的数量可以是训练集的数量的1/3,例如,训练集中有标注的异常交易数据为531条,测试集中有标注的异常交易数据为172条。对比的基准方法采用未加入节点特征向量的神经网络模型,基准方法的AUC的得分为0.8749,本发明的AUC得分为0.8986,本发明相比于基准方法检测效果显著。基准方法的F1得分为0.8623,本发明的F1得分为0.9278,效果同样好于基准方法。
本技术方案中,已经详细描述了交易评分模型的建立。对获取到的交易信息进行评价时,可以根据交易信息和图向量模型,确定交易信息的特征向量,其中,交易信息包括交易数据、用户数据、交易关系路径。具体的,对交易数据进行哈希处理,得到交易数据的交易向量;对用户数据进行哈希处理,得到用户数据的用户向量;将交易关系路径输入至图向量模型,得到交易关系路径的节点向量;将交易数据的交易向量、用户数据的用户向量、交易关系路径的节点向量确定为交易信息的特征向量。将交易信息的特征向量输入至交易评分模型,确定该交易信息的评分值,并将该交易信息的评分值与预设的评分值进行比较,从而完成对交易信息的验证。
具体的,可以根据经验设定评分阈值,若评分值不大于评分阈值,则确定该交易信息通过验证,为正常交易信息;否则,确定该交易信息未通过验证,为异常交易信息。示例性的,评分阈值可以设置为0.5。
步骤204,若所述交易信息验证不通过,则对所述交易信息进行异常处理。
在确定出交易信息验证不通过后,可以对交易信息进行处理,如中断该笔交易、提示用户该笔交易为异常交易或将该笔交易反馈至相关工作人员等。
如图5所示,为本发明实施例提供的另一种交易信息的处理方法的流程示意图,基于用户和商户的历史交易行为,构建用户、交易设备、商户的交易网络,对交易网络中节点进行随机游走,构建图向量模型,并确定出节点向量;再根据用户数据确定用户向量,以及根据交易数据确定交易向量;将节点向量、交易向量和用户向量输入至预设的神经网络模型,获取到交易评分模型。该交易评分模型用于对实时获取到的交易数据进行打分,若该交易数据的评分值大于等于0.5,则确定该交易数据为正常数据,否则,确定该交易数据为异常数据,需要对该交易数据进行异常处理。此外,还可以对实时获取到的交易数据进行预设规则的验证,若通过验证,则对该交易数据进行打分,若不通过预设规则,则无需对该交易数据打分,而直接确定该交易数据为异常数据,并进行异常处理。本发明实施例中利用预设规则和交易评分模型对实时交易进行规则判断和评分,并对交易评分模型实时更新,本方案可以有效识别出异常数据。
上述技术方案中,由于交易评分模型是根据图向量模型和预设的第一神经网络模型对历史交易信息进行训练学习得到,图向量模型是根据历史交易信息中的交易关系路径进行训练学习得到的。也就是说,交易评分模型是在图向量模型训练完成后再进一步训练学习得到的,充分考虑交易信息中的交易关系路径,可以较全面地描述出历史交易的交易关系路径中涉及到的用户、商户、设备以及三者之间的关系,更准确的判定交易信息是否验证通过,从而确定出异常信息,并进行处理。
基于同一发明构思,图6示例性的示出了本发明实施例提供的一种交易信息的处理装置的结构,该装置可以执行交易信息的处理方法的流程。
该装置,包括:
获取单元601,用于获取交易信息;
处理单元602,用于根据所述交易信息和图向量模型,确定所述交易信息的特征向量;所述图向量模型是根据历史交易信息中的交易关系路径进行训练学习得到的;根据交易评分模型和所述交易信息的特征向量,对所述交易信息进行验证;所述交易评分模型是根据所述图向量模型和预设的第一神经网络模型对所述历史交易信息进行训练学习得到的;若所述交易信息验证不通过,则对所述交易信息进行异常处理。
可选的,所述处理单元602具体用于:
获取所述历史交易信息;
根据所述历史交易信息的交易关系路径确定交易网络图;所述交易网络图包括多个节点,所述多个节点包括至少一个用户节点、至少一个商户节点和至少一个设备节点;
针对所述交易网络图中的任一个节点,对所述节点进行随机游走,获取所述节点的路径特征向量;
将所述节点的路径特征向量,输入至预设的第二神经网络模型进行训练学习,确定所述图向量模型。
可选的,所述处理单元602具体用于:
获取随机游走规则,所述随机游走规则包括第一比值;所述第一比值为所述交易网络图中任一节点在随机游走过程中经过第一节点的数量占经过所有节点的数量的比值;所述第一节点为商户节点或设备节点;
根据所述第一比值,对所述节点进行随机游走。
可选的,所述处理单元602具体用于:
获取所述历史交易信息;所述历史交易信息包括历史交易数据、历史用户数据、历史交易关系路径;
对所述历史交易数据进行哈希处理,得到所述历史交易数据的交易向量;对所述历史用户数据进行哈希处理,得到所述历史用户数据的用户向量;将所述历史交易关系路径输入至所述图向量模型,得到所述历史交易关系路径的节点向量;
将所述历史交易数据的交易向量、历史用户数据的用户向量、历史交易关系路径的节点向量,组合成历史交易信息的联合特征向量,输入至所述预设的第一神经网络模型进行训练学习,确定所述交易评分模型。
可选的,其特征在于,所述交易信息包括交易数据、用户数据、交易关系路径;
所述处理单元602具体用于:
对所述交易数据进行哈希处理,得到所述交易数据的交易向量;对所述用户数据进行哈希处理,得到所述用户数据的用户向量;将所述交易关系路径输入至所述图向量模型,得到所述交易关系路径的节点向量;
将所述交易数据的交易向量、用户数据的用户向量、交易关系路径的节点向量确定为所述交易信息的特征向量。
基于同一发明构思,本发明实施例还提供了一种计算设备,包括:
存储器,用于存储程序指令;
处理器,用于调用所述存储器中存储的程序指令,按照获得的程序执行上述交易信息的处理方法。
基于同一发明构思,本发明实施例还提供了一种计算机可读非易失性存储介质,包括计算机可读指令,当计算机读取并执行所述计算机可读指令时,使得计算机执行上述交易信息的处理方法。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种交易信息的处理方法,其特征在于,包括:
获取交易信息;
根据所述交易信息和图向量模型,确定所述交易信息的特征向量;所述图向量模型是根据历史交易信息中的交易关系路径进行训练学习得到的;
根据交易评分模型和所述交易信息的特征向量,对所述交易信息进行验证;所述交易评分模型是根据所述图向量模型和预设的第一神经网络模型对所述历史交易信息进行训练学习得到的;
若所述交易信息验证不通过,则对所述交易信息进行异常处理;
所述根据历史交易信息中的交易关系路径进行训练学习得到所述图向量模型,包括:
获取所述历史交易信息;
根据所述历史交易信息的交易关系路径确定交易网络图;所述交易网络图包括多个节点,所述多个节点包括至少一个用户节点、至少一个商户节点和至少一个设备节点;
针对所述交易网络图中的任一个节点,对所述节点进行随机游走,获取所述节点的路径特征向量;
将所述节点的路径特征向量,输入至预设的第二神经网络模型进行训练学习,确定所述图向量模型。
2.如权利要求1所述的方法,其特征在于,所述对所述节点进行随机游走,包括:
获取随机游走规则,所述随机游走规则包括第一比值;所述第一比值为所述交易网络图中任一节点在随机游走过程中经过第一节点的数量占经过所有节点的数量的比值;所述第一节点为商户节点或设备节点;
根据所述第一比值,对所述节点进行随机游走。
3.如权利要求1所述的方法,其特征在于,所述根据所述图向量模型和预设的第一神经网络模型对所述历史交易信息进行训练学习得到所述交易评分模型,包括:
获取所述历史交易信息;所述历史交易信息包括历史交易数据、历史用户数据、历史交易关系路径;
对所述历史交易数据进行哈希处理,得到所述历史交易数据的交易向量;对所述历史用户数据进行哈希处理,得到所述历史用户数据的用户向量;将所述历史交易关系路径输入至所述图向量模型,得到所述历史交易关系路径的节点向量;
将所述历史交易数据的交易向量、历史用户数据的用户向量、历史交易关系路径的节点向量,组合成历史交易信息的联合特征向量,输入至所述预设的第一神经网络模型进行训练学习,确定所述交易评分模型。
4.如权利要求1至3任一项所述的方法,其特征在于,所述交易信息包括交易数据、用户数据、交易关系路径;
所述根据所述交易信息和图向量模型,确定所述交易信息的特征向量,包括:
对所述交易数据进行哈希处理,得到所述交易数据的交易向量;对所述用户数据进行哈希处理,得到所述用户数据的用户向量;将所述交易关系路径输入至所述图向量模型,得到所述交易关系路径的节点向量;
将所述交易数据的交易向量、用户数据的用户向量、交易关系路径的节点向量确定为所述交易信息的特征向量。
5.一种交易信息的处理装置,其特征在于,包括:
获取单元,用于获取交易信息;
处理单元,用于根据所述交易信息和图向量模型,确定所述交易信息的特征向量;所述图向量模型是根据历史交易信息中的交易关系路径进行训练学习得到的;根据交易评分模型和所述交易信息的特征向量,对所述交易信息进行验证;所述交易评分模型是根据所述图向量模型和预设的第一神经网络模型对所述历史交易信息进行训练学习得到的;若所述交易信息验证不通过,则对所述交易信息进行异常处理;
所述处理单元具体用于:
获取所述历史交易信息;
根据所述历史交易信息的交易关系路径确定交易网络图;所述交易网络图包括多个节点,所述多个节点包括至少一个用户节点、至少一个商户节点和至少一个设备节点;
针对所述交易网络图中的任一个节点,对所述节点进行随机游走,获取所述节点的路径特征向量;
将所述节点的路径特征向量,输入至预设的第二神经网络模型进行训练学习,确定所述图向量模型。
6.如权利要求5所述的装置,其特征在于,所述处理单元具体用于:
获取随机游走规则,所述随机游走规则包括第一比值;所述第一比值为所述交易网络图中任一节点在随机游走过程中经过第一节点的数量占经过所有节点的数量的比值;所述第一节点为商户节点或设备节点;
根据所述第一比值,对所述节点进行随机游走。
7.如权利要求5所述的装置,其特征在于,所述处理单元具体用于:
获取所述历史交易信息;所述历史交易信息包括历史交易数据、历史用户数据、历史交易关系路径;
对所述历史交易数据进行哈希处理,得到所述历史交易数据的交易向量;对所述历史用户数据进行哈希处理,得到所述历史用户数据的用户向量;将所述历史交易关系路径输入至所述图向量模型,得到所述历史交易关系路径的节点向量;
将所述历史交易数据的交易向量、历史用户数据的用户向量、历史交易关系路径的节点向量,组合成历史交易信息的联合特征向量,输入至所述预设的第一神经网络模型进行训练学习,确定所述交易评分模型。
8.如权利要求5至7任一项所述的装置,其特征在于,所述交易信息包括交易数据、用户数据、交易关系路径;
所述处理单元具体用于:
对所述交易数据进行哈希处理,得到所述交易数据的交易向量;对所述用户数据进行哈希处理,得到所述用户数据的用户向量;将所述交易关系路径输入至所述图向量模型,得到所述交易关系路径的节点向量;
将所述交易数据的交易向量、用户数据的用户向量、交易关系路径的节点向量确定为所述交易信息的特征向量。
9.一种计算设备,其特征在于,包括:
存储器,用于存储程序指令;
处理器,用于调用所述存储器中存储的程序指令,按照获得的程序执行权利要求1至4任一项所述的方法。
10.一种计算机可读非易失性存储介质,其特征在于,包括计算机可读指令,当计算机读取并执行所述计算机可读指令时,使得计算机执行如权利要求1至4任一项所述的方法。
CN201910392368.XA 2019-05-13 2019-05-13 一种交易信息的处理方法及装置 Active CN110175850B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910392368.XA CN110175850B (zh) 2019-05-13 2019-05-13 一种交易信息的处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910392368.XA CN110175850B (zh) 2019-05-13 2019-05-13 一种交易信息的处理方法及装置

Publications (2)

Publication Number Publication Date
CN110175850A CN110175850A (zh) 2019-08-27
CN110175850B true CN110175850B (zh) 2023-08-01

Family

ID=67690787

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910392368.XA Active CN110175850B (zh) 2019-05-13 2019-05-13 一种交易信息的处理方法及装置

Country Status (1)

Country Link
CN (1) CN110175850B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110852755B (zh) * 2019-11-06 2022-05-17 支付宝(杭州)信息技术有限公司 针对交易场景的用户身份识别方法和装置
CN111127208A (zh) * 2019-12-30 2020-05-08 上海金仕达软件科技有限公司 一种异常交易实时监控系统及计算方法
CN111724158B (zh) * 2020-05-25 2024-03-26 中国建设银行股份有限公司 交易路径生成方法、系统及相关计算机设备和存储介质
CN112396513B (zh) * 2020-11-27 2024-02-20 中国银联股份有限公司 一种数据处理的方法及装置
US20220245643A1 (en) * 2021-01-29 2022-08-04 Walmart Apollo, Llc Methods and apparatus for electronic detection of fraudulent transactions using machine learning processes
US11887172B2 (en) 2021-01-29 2024-01-30 Walmart Apollo, Llc Methods and apparatus for electronic detection of fraudulent transactions using machine learning processes
CN112700252B (zh) * 2021-03-25 2021-07-27 腾讯科技(深圳)有限公司 一种信息安全性检测方法、装置、电子设备和存储介质
CN113128986A (zh) * 2021-04-23 2021-07-16 中国工商银行股份有限公司 长链路交易的报错处理方法及装置
CN117408705B (zh) * 2023-12-15 2024-04-30 广州敏行数字科技有限公司 一种基于人工智能的异常检测方法及系统

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9412108B2 (en) * 2014-12-11 2016-08-09 Mastercard International Incorporated Systems and methods for fraud detection by transaction ticket size pattern
CN106447333A (zh) * 2016-11-29 2017-02-22 中国银联股份有限公司 一种欺诈交易侦测方法及服务器
CN106803168B (zh) * 2016-12-30 2021-04-16 中国银联股份有限公司 一种异常转账侦测方法和装置
CN107767262B (zh) * 2017-10-24 2020-07-28 上海点融信息科技有限责任公司 信息处理方法、装置和计算机可读存储介质
CN109118053B (zh) * 2018-07-17 2022-04-05 创新先进技术有限公司 一种盗卡风险交易的识别方法和装置
CN109165950B (zh) * 2018-08-10 2023-02-03 哈尔滨工业大学(威海) 一种基于金融时间序列特征的异常交易识别方法,设备及可读存储介质

Also Published As

Publication number Publication date
CN110175850A (zh) 2019-08-27

Similar Documents

Publication Publication Date Title
CN110175850B (zh) 一种交易信息的处理方法及装置
TWI712981B (zh) 風險辨識模型訓練方法、裝置及伺服器
WO2021147557A1 (zh) 客户画像方法、装置、计算机可读存储介质及终端设备
CN108428132B (zh) 欺诈交易识别方法、装置、服务器及存储介质
CN111695415B (zh) 图像识别方法及相关设备
CN107844784A (zh) 人脸识别方法、装置、计算机设备和可读存储介质
CN107273784A (zh) 图像模式识别装置和方法
Suryanarayana et al. Machine learning approaches for credit card fraud detection
US20200151574A1 (en) Computer-readable recording medium having stored therein learning program, learning method, and learning apparatus
CN108665156A (zh) 区块链下基于马尔科夫链的供应链选择评价方法
CN109272312A (zh) 用于交易风险实时侦测的方法和装置
CN114066421A (zh) 基于人工智能的任务催办方法、装置及电子设备
CN116993490B (zh) 一种基于人工智能的银行场景自动处理方法及系统
CN111079930B (zh) 数据集质量参数的确定方法、装置及电子设备
US11798540B2 (en) Systems and methods for dynamically updating machine learning models that provide conversational responses
CN105023041B (zh) 数据聚类方法及b2b平台客户偏好获取方法、装置
US11654366B2 (en) Computer program for performing drawing-based security authentication
Wu et al. Customer churn prediction for commercial banks using customer-value-weighted machine learning models
CN116029760A (zh) 消息推送方法、装置、计算机设备和存储介质
US11551317B2 (en) Property valuation model and visualization
CN108876444A (zh) 客户类别分析方法、装置、计算机设备和存储介质
Lee et al. A new artificial bee colony based clustering method and its application to the business failure prediction
CN112396513B (zh) 一种数据处理的方法及装置
CN115952438B (zh) 社交平台用户属性预测方法、系统、移动设备及存储介质
US11922352B1 (en) System and method for risk tracking

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant