CN111984698A - 一种信息预测方法、装置及存储介质 - Google Patents

一种信息预测方法、装置及存储介质 Download PDF

Info

Publication number
CN111984698A
CN111984698A CN202010786409.6A CN202010786409A CN111984698A CN 111984698 A CN111984698 A CN 111984698A CN 202010786409 A CN202010786409 A CN 202010786409A CN 111984698 A CN111984698 A CN 111984698A
Authority
CN
China
Prior art keywords
merchant
user
relation
node
graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010786409.6A
Other languages
English (en)
Other versions
CN111984698B (zh
Inventor
郭豪
王文刚
蔡准
孙悦
郭晓鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Trusfort Technology Co ltd
Original Assignee
Beijing Trusfort Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Trusfort Technology Co ltd filed Critical Beijing Trusfort Technology Co ltd
Priority to CN202010786409.6A priority Critical patent/CN111984698B/zh
Publication of CN111984698A publication Critical patent/CN111984698A/zh
Application granted granted Critical
Publication of CN111984698B publication Critical patent/CN111984698B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/288Entity relationship models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/40Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
    • G06Q20/401Transaction verification
    • G06Q20/4016Transaction verification involving fraud or risk level assessment in transaction processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/018Certifying business or products
    • G06Q30/0185Product, service or business identity fraud
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Fuzzy Systems (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Technology Law (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computer Security & Cryptography (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Computational Linguistics (AREA)

Abstract

本发明公开了一种信息预测方法、装置及计算机可读存储介质,首先获取交易行为数据;之后根据所述交易行为数据构建用户商户关系图;再从所构建的用户商户关系图中抽取表征用户关系信息的第一关系子图和表征商户关系信息的第二关系子图;最后分别从所述第一关系子图和所述第二关系子图中挖掘得到存在异常交易行为的用户种子集和商户种子集。

Description

一种信息预测方法、装置及存储介质
技术领域
本发明涉及互联网领域,尤其涉及一种信息预测方法、装置及计算机可读存储介质。
背景技术
随着互联网技术的发展,线下移动支付已成为人们节点主流支付手段。然而,线下移动支付在给人们带来便捷的同时,也给黑产的作案带来了很多漏洞。黑产商户与黑产用户联合作案的案例屡见不鲜,这给移动支付的风控带来了挑战。
发明内容
本发明实施例为了有效解决移动支付的风控问题,创造性地提供一种信息预测方法、装置及计算机可读存储介质。
根据本发明第一方面,提供一种信息预测方法,包括:获取交易行为数据;根据所述交易行为数据构建用户商户关系图;从所构建的用户商户关系图中抽取表征用户关系信息的第一关系子图和表征商户关系信息的第二关系子图;分别从所述第一关系子图和所述第二关系子图中挖掘得到存在异常交易行为的用户种子集和商户种子集。
根据本发明一实施方式,从所构建的用户商户关系图中抽取表征用户关系信息的第一关系子图和表征商户关系信息的第二关系子图,包括:以用户节点为主维度,以商户节点为关联维度,从所述构建的用户商户关系图中抽取表征用户关系信息的第一关系子图;以商户节点为主维度,以用户节点为关联维度,从所述构建的用户商户关系图中抽取表征商户关系信息的第二关系子图。
根据本发明一实施方式,使用图模型挖掘算法分别从所述第一关系子图和所述第二关系子图中挖掘得到存在异常交易行为的用户种子集和商户种子集。
根据本发明一实施方式,所述使用图模型挖掘算法分别从所述第一关系子图和所述第二关系子图中挖掘得到存在异常交易行为的用户种子集和商户种子集,包括:将第一关系子图中的每一个用户节点或将第二关系子图中的每一个商户节点作为中心节点,利用attention机制计算周围关联节点和中心节点的相似度权重;将周围关联节点的向量和对应的相似度权重进行加权求和,并和中心节点的向量拼接,得到用户节点或商户节点的属性特征向量;将所述用户节点或商户节点的属性特征向量输入到聚合分类模型进行预测,得到表征所述用户节点或商户节点的预测风险概率值;将所有预测风险概率值高于概率阈值的用户节点或商户节点确定为存在异常交易行为的用户种子集或商户种子集。
根据本发明一实施方式,所述方法还包括:以用户种子集中每一个用户节点出发,从所构建的用户商户关系图中通过与所述用户节点关联的商户进一步扩展得到关联用户节点,并将所述关联用户节点并入用户种子集;以商户种子集中每一个商户节点出发,从所构建的用户商户关系图中通过与所述商户节点关联的用户进一步扩展得到关联商户节点,并将所述关联商户节点并入商户种子集。
根据本发明一实施方式,所述方法还包括:以用户种子集中每一个用户节点出发,从所构建的用户商户关系图中挖掘与所述用户节点紧密关联的商户集;将所述商户种子集和所述商户集进行融合,得到最终商户种子集。
根据本发明一实施方式,将所述商户种子集和所述商户集进行融合,得到最终商户种子集,包括:确定所述商户种子集和所述商户集的交集或并集;将所确定的交集或并集,作为最终商户种子集。
根据本发明第二方面,还提供一种信息预测装置,该装置包括:获取模块,用于获取交易行为数据;构建模块,用于根据所述交易行为数据构建用户商户关系图;抽取模块,用于从所构建的用户商户关系图中抽取表征用户关系信息的第一关系子图和表征商户关系信息的第二关系子图;挖掘模块,用于分别从所述第一关系子图和所述第二关系子图中挖掘得到存在异常交易行为的用户种子集和商户种子集。
根据本发明一实施方式,所述抽取模块包括:用户抽取子模块,用于以用户节点为主维度,以商户节点为关联维度,从所述构建的用户商户关系图中抽取表征用户关系信息的第一关系子图;商户抽取子模块,用于以商户节点为主维度,以用户节点为关联维度,从所述构建的用户商户关系图中抽取表征商户关系信息的第二关系子图。
根据本发明一实施方式,所述挖掘模块具体用于,使用图模型挖掘算法分别从所述第一关系子图和所述第二关系子图中挖掘得到存在异常交易行为的用户种子集和商户种子集。
根据本发明一实施方式,所述挖掘模块包括:权重计算子模块,用于将第一关系子图中的每一个用户节点或将第二关系子图中的每一个商户节点作为中心节点,利用attention机制计算周围关联节点和中心节点的相似度权重;属性特征计算子模块,用于将周围关联节点的向量和对应的相似度权重进行加权求和,并和中心节点的向量拼接,得到用户节点或商户节点的属性特征向量;预测子模块,用于将所述用户节点或商户节点的属性特征向量输入到聚合分类模型进行预测,得到表征所述用户节点或商户节点的预测风险概率值;确定子模块,用于将所有预测风险概率值高于概率阈值的用户节点或商户节点确定为存在异常交易行为的用户种子集或商户种子集。
根据本发明一实施方式,所述装置还包括:扩展模块,用于以用户种子集中每一个用户节点出发,从所构建的用户商户关系图中通过与所述用户节点关联的商户进一步扩展得到关联用户节点,并将所述关联用户节点并入用户种子集;还用于以商户种子集中每一个商户节点出发,从所构建的用户商户关系图中通过与所述商户节点关联的用户进一步扩展得到关联商户节点,并将所述关联商户节点并入商户种子集。
根据本发明一实施方式,所述装置还包括:所述挖掘模块,还用于以用户种子集中每一个用户节点出发,从所构建的用户商户关系图中挖掘与所述用户节点紧密关联的商户集;融合模块,用于将所述商户种子集和所述商户集进行融合,得到最终商户种子集。
根据本发明一实施方式,所述融合模块,具体用于确定所述商户种子集和所述商户集的交集或并集;将所确定的交集或并集,作为最终商户种子集。
根据本发明第三方面,还提供了一种计算机可读存储介质,所述存储介质包括一组计算机可执行指令,当所述指令被执行时用于执行上述任一所述信息预测方法。
本发明实施例信息预测方法、装置及计算机可读存储介质,首先获取交易行为数据;之后根据所述交易行为数据构建用户商户关系图;再从所构建的用户商户关系图中抽取表征用户关系信息的第一关系子图和表征商户关系信息的第二关系子图;最后分别从所述第一关系子图和所述第二关系子图中挖掘得到存在异常交易行为的用户种子集和商户种子集。如此,本发明通过同时充分考虑存在异常交易行为的用户行为特性和商户行为特性,并分别从用户和商户两个角度进行挖掘建模,能够全面精准地挖掘存在异常交易行为的用户种子集(黑产种子)和商户种子集(黑产商户),从而为移动支付的风控系统提供保障。
附图说明
通过参考附图阅读下文的详细描述,本发明示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本发明的若干实施方式,其中:
在附图中,相同或对应的标号表示相同或对应的部分。
图1示出了本发明实施例信息预测方法的实现流程示意图一;
图2示出了本发明一应用实例所构建的用户商户关系图和对应的关系子图;
图3示出了本发明一应用实例基于attention机制的用户节点聚类分类模型示意图;
图4示出了本发明实施例信息预测方法的实现流程示意图二;
图5示出了本发明一应用实例用户种子集节点扩撒示意图;
图6示出了本发明实施例信息预测方法的实现流程示意图三;
图7示出了本发明实施例信息预测装置的组成结构示意图。
具体实施方式
为使本发明的目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而非全部实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
目前业内移动支付的风控系统一般使用如下两种实现方案:1)基于专家规则的方法,简称专家法,结合专家的理论和经验事先设定好风控规则,对商户侧的交易流水进行多维度的信计算,从而实现对业务活动或交易过程中的风险事件进行筛选、甄别和管理,按照预先设定好的分值处置策略进行干预操作,规则的制定又非常依赖于专家的经验,而且很难应对黑产团伙多种多样的欺诈模式,因此会造成比较大的漏报率与误报率;2)直接采用机器学习模型对商户流水业务进行建模,传统做法是直接从商户角度进行入手,以商户为中心提取商户侧的欺诈特征,并输入到后续的机器学习模型中去,这种方法忽视了用户行为在整个线下支付过程中的作用,造成了较高的漏报率。
然而,在线下商户的实际支付场景中,商户和用户联合作案特征是比较明显的,故需要统一考虑。为此,本发明实施例提供了如下所述的信息预测方法。
图1示出了本发明实施例信息预测方法的实现流程示意图一;图2示出了本发明一应用实例所构建的用户商户关系图和对应的关系子图;图3示出了本发明一应用实例基于attention机制的用户节点聚类分类模型示意图。
参考图1,本发明实施例信息预测方法包括:操作101,获取交易行为数据;操作102,根据所述交易行为数据构建用户商户关系图;操作103,从所构建的用户商户关系图中抽取表征用户关系信息的第一关系子图和表征商户关系信息的第二关系子图;操作104,分别从所述第一关系子图和所述第二关系子图中挖掘得到存在异常交易行为的用户种子集和商户种子集。
在操作101,交易行为数据一般为用户在商户的交易行为数据,也可称作交易流水数据。该交易行为数据的格式包括如下多种数据信息,如流水单,商户号,用户号,地址信息,交易金额和交易渠道标识等。
在操作102,根据一段时间之内用户在商户的交易行为数据构建用户商户关系图,即用户商户关系二部图。该用户商户关系图包括用户节点和商户节点,以及用户节点ai和商户节点bj之间发生交易行为的连线,该连线wij表示一段时间范围内用户节点ai在商户节点bj消费的次数或者消费的总金额数。
在一示例中,如图2所示,用户商户关系图左边的方框框起来的是由用户节点a1,a2,…,am表示的m各用户集合,三角形框起来的是由商户节点b1,b2…bn表示的n个商户集合。商户节点和用户节点之间连线wij表示一段时间范围内用户节点ai在商户节点bj消费的次数或者消费的总金额数。
在操作103,在生成用户商户关系图之后,以用户和商户为主维度,以另一实体为关联维度,分别从二部图中抽取用户关系子图和商户关系子图。
具体地,以用户节点为主维度,以商户节点为关联维度,从所述构建的用户商户关系图中抽取表征用户关系信息的第一关系子图;以商户节点为主维度,以用户节点为关联维度,从所述构建的用户商户关系图中抽取表征商户关系信息的第二关系子图。
以第一关系子图为例,具体抽取用户关系的策略步骤如下:1)对用户商户关系二部图进行修剪,去掉那些连线权重小于某一阈值的边;2)将所有用户节点从用户商户关系图中抽取出来;3)对于任意两个用户节点来说,如果它们之间关联了同一个或者同几个商户,就在这两个用户节点之间进行连线;4)重复第3)步骤,直到不能再添加新的边为止,直到生成表征用户关系信息的第一关系子图,即用户关系子图,如图2所示;同理,也可生成表征商户关系信息的第二关系子图,即商户关系子图。
在操作104,使用图模型挖掘算法分别从所述第一关系子图和所述第二关系子图中挖掘得到存在异常交易行为的用户种子集和商户种子集。
具体地,将第一关系子图中的每一个用户节点或将第二关系子图中的每一个商户节点作为中心节点,利用attention机制计算周围关联节点和中心节点的相似度权重;将周围关联节点的向量和对应的相似度权重进行加权求和,并和中心节点的向量拼接,得到用户节点或商户节点的属性特征向量;将所述用户节点或商户节点的属性特征向量输入到聚合分类模型进行预测,得到表征所述用户节点或商户节点的预测风险概率值;将所有预测风险概率值高于概率阈值的用户节点或商户节点确定为存在异常交易行为的用户种子集或商户种子集。
下面以如图3所示的用户节点聚合分类模型构建为例来说明使用图模型挖掘算法从所述第一关系子图中挖掘得到存在异常交易行为的用户种子集的具体流程。
步骤1,对用户关系子图中的每一个用户节点赋予一个随机的向量Vi,这个向量在后续过程中会作为模型的一部分随着模型一起训练;
步骤2,以每一个有标签的用户i为中心,根据图2中生成的用户关系子图,找出和i相关联的其他用户。在图3中就是以用户节点a1为中心节点,周围和其有关系的用户节点,即周围关联节点为a2,a3,a4,利用attention机制计算周围关联节点和中心节点的相似性权重β234,attention计算公式如下:
Figure BDA0002622137220000091
步骤3,得到了中心节点和周围关联节点的相似度权重β234后,将周围关联节点的向量和其对应权重进行加权求并和中心节点a1的向量拼接,得到中心节点a1的属性特征向量,即最终表征T1,公式如下:
Figure BDA0002622137220000092
步骤4,将得到的T1向量输入到聚合分类模型网络最后一层的神经网络中去,使用sigmoid激活函数得到最终的预测风险概率值,公式如下:
Figure BDA0002622137220000093
步骤5,对所有用户关系子图中的用户节点进行步骤2~4,对每一个节点的属性进行判断,得到所有用户节点的预测风险概率值。
步骤6,将预测风险概率高于概率阈值的用户节点判定黑色种子节点,即存在异常交易行为的用户种子集。
当然,本领域技术人员应该理解的是,在训练阶段使用交叉熵作为损失函数,公式如下:
Figure BDA0002622137220000094
其中y代表了样本真实的label值,Ti则是attention机制后的节点表征。
如此,本发明实施例通过同时充分考虑存在异常交易行为的用户行为特性和商户行为特性,并分别从用户和商户两个角度进行挖掘建模,能够全面精准地挖掘存在异常交易行为的用户种子集(黑产种子)和商户种子集(黑产商户),从而为移动支付的风控系统提供保障。
图4示出了本发明实施例信息预测方法的实现流程示意图二;图5示出了本发明一应用实例用户种子集节点扩撒示意图。
参考图4,本发明实施例信息预测方法在完成操作101~104之后,还包括:根据用户商户关系图进行种子节点扩展。具体执行如下操作流程:操作401,以用户种子集中每一个用户节点出发,从所构建的用户商户关系图中通过与所述用户节点关联的商户进一步扩展得到关联用户节点,并将所述关联用户节点并入用户种子集;操作402,以商户种子集中每一个商户节点出发,从所构建的用户商户关系图中通过与所述商户节点关联的用户进一步扩展得到关联商户节点,并将所述关联商户节点并入商户种子集。
在一应用实例中,如图5所示,在基于图3挖掘出用户种子集,即用户节点a1和用户节点a2之后,利用图2所示的用户商户关系图进行游走扩展,可以得到用户节点a1通过商户b1进一步扩展关联到用户节点a3和用户节点a4,用户节点a2通过商户b3进一步扩展关联到用户节点a6;将关联用户节点a3,a4和a6并入用户种子集。
如此,本发明实施例在基于挖掘得到的用户种子集或商户种子集中每个节点沿着用户商户关系图进行扩散,全面地识别出全局的用户种子集和商户种子集,得以覆盖多种欺诈手段,从而为移动支付的风控系统提供保障。
图6示出了本发明实施例信息预测方法的实现流程示意图三。
参考图6,本发明实施例信息预测方法在完成操作101~104或操作401~402之后,所述方法还包括:操作601,以用户种子集中每一个用户节点出发,从所构建的用户商户关系图中挖掘与所述用户节点紧密关联的商户集;操作602,将所述商户种子集和所述商户集进行融合,得到最终商户种子集。
在操作602,可以通过取交集或并集的方式来将所述商户种子集和所述商户集进行融合。具体地,确定所述商户种子集和所述商户集的交集或并集;将所确定的交集或并集,作为最终商户种子集。
如此,本发明在以用户种子集中每一个用户节点出发,从所构建的用户商户关系图中挖掘与所述用户节点紧密关联的商户集的基础上,通过取交集的方式将所述商户种子集和所述商户集进行融合,从而更加精准地挖掘得到最终商户种子集(黑产商户),或通过取并集的方式将所述商户种子集和所述商户集进行融合,从而更加全面地挖掘得到最终商户种子集(黑产商户),得以覆盖多种欺诈手段,从而为移动支付的风控系统提供保障。
同理,基于上文所述信息预测方法,本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有程序,当所述程序被处理器执行时,使得所述处理器至少执行如下所述的操作步骤:操作101,获取交易行为数据;操作102,根据所述交易行为数据构建用户商户关系图;操作103,从所构建的用户商户关系图中抽取表征用户关系信息的第一关系子图和表征商户关系信息的第二关系子图;操作104,使用图模型挖掘算法分别从所述第一关系子图和所述第二关系子图中挖掘得到存在异常交易行为的用户种子集和商户种子集。
进一步地,基于如上文所述信息预测方法,本发明实施例还提供一种信息预测装置,如图7所示,该装置70包括:获取模块701,用于获取交易行为数据;构建模块702,用于根据所述交易行为数据构建用户商户关系图;抽取模块703,用于从所构建的用户商户关系图中抽取表征用户关系信息的第一关系子图和表征商户关系信息的第二关系子图;挖掘模块704,用于分别从所述第一关系子图和所述第二关系子图中挖掘得到存在异常交易行为的用户种子集和商户种子集。
根据本发明一实施方式,抽取模块703包括:用户抽取子模块,用于以用户节点为主维度,以商户节点为关联维度,从所述构建的用户商户关系图中抽取表征用户关系信息的第一关系子图;商户抽取子模块,用于以商户节点为主维度,以用户节点为关联维度,从所述构建的用户商户关系图中抽取表征商户关系信息的第二关系子图。
根据本发明一实施方式,挖掘模块704具体用于,使用图模型挖掘算法分别从所述第一关系子图和所述第二关系子图中挖掘得到存在异常交易行为的用户种子集和商户种子集。
根据本发明一实施方式,挖掘模块704包括:权重计算子模块,用于将第一关系子图中的每一个用户节点或将第二关系子图中的每一个商户节点作为中心节点,利用attention机制计算周围关联节点和中心节点的相似度权重;属性特征计算子模块,用于将周围关联节点的向量和对应的相似度权重进行加权求和,并和中心节点的向量拼接,得到用户节点或商户节点的属性特征向量;预测子模块,用于将所述用户节点或商户节点的属性特征向量输入到聚合分类模型进行预测,得到表征所述用户节点或商户节点的预测风险概率值;确定子模块,用于将所有预测风险概率值高于概率阈值的用户节点或商户节点确定为存在异常交易行为的用户种子集或商户种子集。
根据本发明一实施方式,装置70还包括:扩展模块,用于以用户种子集中每一个用户节点出发,从所构建的用户商户关系图中通过与所述用户节点关联的商户进一步扩展得到关联用户节点,并将所述关联用户节点并入用户种子集;还用于以商户种子集中每一个商户节点出发,从所构建的用户商户关系图中通过与所述商户节点关联的用户进一步扩展得到关联商户节点,并将所述关联商户节点并入商户种子集。
根据本发明一实施方式,装置70还包括:所述挖掘模块,还用于以用户种子集中每一个用户节点出发,从所构建的用户商户关系图中挖掘与所述用户节点紧密关联的商户集;融合模块,用于将所述商户种子集和所述商户集进行融合,得到最终商户种子集。
根据本发明一实施方式,融合模块,具体用于确定所述商户种子集和所述商户集的交集或并集;将所确定的交集或并集,作为最终商户种子集。
这里需要指出的是:以上对信息预测装置实施例的描述,与前述图1至6所示的方法实施例的描述是类似的,具有同前述图1至6所示的方法实施例相似的有益效果,因此不做赘述。对于本发明信息预测装置实施例中未披露的技术细节,请参照本发明前述图1至6所示的方法实施例的描述而理解,为节约篇幅,因此不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个装置,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本发明各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以利用硬件的形式实现,也可以利用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(Read Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的介质。
或者,本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种信息预测方法,其特征在于,所述方法包括:
获取交易行为数据;
根据所述交易行为数据构建用户商户关系图;
从所构建的用户商户关系图中抽取表征用户关系信息的第一关系子图和表征商户关系信息的第二关系子图;
分别从所述第一关系子图和所述第二关系子图中挖掘得到存在异常交易行为的用户种子集和商户种子集。
2.根据权利要求1所述的方法,其特征在于,从所构建的用户商户关系图中抽取表征用户关系信息的第一关系子图和表征商户关系信息的第二关系子图,包括:
以用户节点为主维度,以商户节点为关联维度,从所述构建的用户商户关系图中抽取表征用户关系信息的第一关系子图;
以商户节点为主维度,以用户节点为关联维度,从所述构建的用户商户关系图中抽取表征商户关系信息的第二关系子图。
3.根据权利要求1所述的方法,其特征在于,使用图模型挖掘算法分别从所述第一关系子图和所述第二关系子图中挖掘得到存在异常交易行为的用户种子集和商户种子集。
4.根据权利要求3所述的方法,其特征在于,使用图模型挖掘算法分别从所述第一关系子图和所述第二关系子图中挖掘得到存在异常交易行为的用户种子集和商户种子集,包括:
将第一关系子图中的每一个用户节点或将第二关系子图中的每一个商户节点作为中心节点,利用attention机制计算周围关联节点和中心节点的相似度权重;
将周围关联节点的向量和对应的相似度权重进行加权求和,并和中心节点的向量拼接,得到用户节点或商户节点的属性特征向量;
将所述用户节点或商户节点的属性特征向量输入到聚合分类模型进行预测,得到表征所述用户节点或商户节点的预测风险概率值;
将所有预测风险概率值高于概率阈值的用户节点或商户节点确定为存在异常交易行为的用户种子集或商户种子集。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述方法还包括:
以用户种子集中每一个用户节点出发,从所构建的用户商户关系图中通过与所述用户节点关联的商户进一步扩展得到关联用户节点,并将所述关联用户节点并入用户种子集;
以商户种子集中每一个商户节点出发,从所构建的用户商户关系图中通过与所述商户节点关联的用户进一步扩展得到关联商户节点,并将所述关联商户节点并入商户种子集。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
以用户种子集中每一个用户节点出发,从所构建的用户商户关系图中挖掘与所述用户节点紧密关联的商户集;
将所述商户种子集和所述商户集进行融合,得到最终商户种子集。
7.根据权利要求6所述的方法,其特征在于,将所述商户种子集和所述商户集进行融合,得到最终商户种子集,包括:
确定所述商户种子集和所述商户集的交集或并集;
将所确定的交集或并集,作为最终商户种子集。
8.一种信息预测装置,其特征在于,该装置包括:
获取模块,用于获取交易行为数据;
构建模块,用于根据所述交易行为数据构建用户商户关系图;
抽取模块,用于从所构建的用户商户关系图中抽取表征用户关系信息的第一关系子图和表征商户关系信息的第二关系子图;
挖掘模块,用于分别从所述第一关系子图和所述第二关系子图中挖掘得到存在异常交易行为的用户种子集和商户种子集。
9.根据权利要求8所述的装置,其特征在于,所述抽取模块包括:
用户抽取子模块,用于以用户节点为主维度,以商户节点为关联维度,从所述构建的用户商户关系图中抽取表征用户关系信息的第一关系子图;
商户抽取子模块,用于以商户节点为主维度,以用户节点为关联维度,从所述构建的用户商户关系图中抽取表征商户关系信息的第二关系子图。
10.一种计算机可读存储介质,其特征在于,所述存储介质包括一组计算机可执行指令,当所述指令被执行时用于执行权利要求1至7任一项所述信息预测方法。
CN202010786409.6A 2020-08-07 2020-08-07 一种信息预测方法、装置及存储介质 Active CN111984698B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010786409.6A CN111984698B (zh) 2020-08-07 2020-08-07 一种信息预测方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010786409.6A CN111984698B (zh) 2020-08-07 2020-08-07 一种信息预测方法、装置及存储介质

Publications (2)

Publication Number Publication Date
CN111984698A true CN111984698A (zh) 2020-11-24
CN111984698B CN111984698B (zh) 2021-03-19

Family

ID=73446126

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010786409.6A Active CN111984698B (zh) 2020-08-07 2020-08-07 一种信息预测方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN111984698B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114741433A (zh) * 2022-06-09 2022-07-12 北京芯盾时代科技有限公司 一种社群挖掘方法、装置、设备及存储介质

Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009230359A (ja) * 2008-03-21 2009-10-08 Oki Electric Ind Co Ltd 監視システム、アクセス制御サーバ監視システム及び監視方法
CN101894349A (zh) * 2004-09-21 2010-11-24 陈澍 开放性多商户共享会员卡系统、终端交互方法和商户机
CN102467714A (zh) * 2010-11-04 2012-05-23 长茂科技股份有限公司 网络商圈建构方法及其系统
CN105184574A (zh) * 2015-06-30 2015-12-23 电子科技大学 一种套用商户类别码欺诈行为的检测方法
CN105335852A (zh) * 2014-06-27 2016-02-17 Sql图表有限公司 用于对欺诈性电子交易的增强型检测的系统和方法
US20170019744A1 (en) * 2015-07-14 2017-01-19 Panasonic Intellectual Property Management Co., Ltd. Monitoring system and monitoring method
CN106372956A (zh) * 2015-07-23 2017-02-01 苏宁云商集团股份有限公司 一种基于用户搜索日志进行意图实体识别的方法和系统
US20170132636A1 (en) * 2015-11-11 2017-05-11 Idm Global, Inc. Systems and methods for detecting relations between unknown merchants and merchants with a known connection to fraud
CN109815392A (zh) * 2018-12-17 2019-05-28 北京三快在线科技有限公司 场景化商家召回方法、装置、电子设备及可读存储介质
CN109919316A (zh) * 2019-03-04 2019-06-21 腾讯科技(深圳)有限公司 获取网络表示学习向量的方法、装置和设备及存储介质
CN109947865A (zh) * 2018-09-05 2019-06-28 中国银联股份有限公司 商户分类方法及商户分类系统
CN110009368A (zh) * 2018-11-01 2019-07-12 阿里巴巴集团控股有限公司 一种数据处理方法及装置、一种计算设备及存储介质
CN110490598A (zh) * 2019-08-23 2019-11-22 北京三快在线科技有限公司 异常检测方法、装置、设备及存储介质
US20200193459A1 (en) * 2018-12-14 2020-06-18 Visa International Service Association Method, System, and Computer Program Product for Generating a Classified Map
CN111340612A (zh) * 2020-02-25 2020-06-26 支付宝(杭州)信息技术有限公司 一种账户的风险识别方法、装置及电子设备
CN111340493A (zh) * 2020-03-04 2020-06-26 江苏大学 一种多维度分布式异常交易行为检测方法

Patent Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101894349A (zh) * 2004-09-21 2010-11-24 陈澍 开放性多商户共享会员卡系统、终端交互方法和商户机
JP2009230359A (ja) * 2008-03-21 2009-10-08 Oki Electric Ind Co Ltd 監視システム、アクセス制御サーバ監視システム及び監視方法
CN102467714A (zh) * 2010-11-04 2012-05-23 长茂科技股份有限公司 网络商圈建构方法及其系统
CN105335852A (zh) * 2014-06-27 2016-02-17 Sql图表有限公司 用于对欺诈性电子交易的增强型检测的系统和方法
CN105184574A (zh) * 2015-06-30 2015-12-23 电子科技大学 一种套用商户类别码欺诈行为的检测方法
US20170019744A1 (en) * 2015-07-14 2017-01-19 Panasonic Intellectual Property Management Co., Ltd. Monitoring system and monitoring method
CN106372956A (zh) * 2015-07-23 2017-02-01 苏宁云商集团股份有限公司 一种基于用户搜索日志进行意图实体识别的方法和系统
US20170132636A1 (en) * 2015-11-11 2017-05-11 Idm Global, Inc. Systems and methods for detecting relations between unknown merchants and merchants with a known connection to fraud
CN109947865A (zh) * 2018-09-05 2019-06-28 中国银联股份有限公司 商户分类方法及商户分类系统
CN110009368A (zh) * 2018-11-01 2019-07-12 阿里巴巴集团控股有限公司 一种数据处理方法及装置、一种计算设备及存储介质
US20200193459A1 (en) * 2018-12-14 2020-06-18 Visa International Service Association Method, System, and Computer Program Product for Generating a Classified Map
CN109815392A (zh) * 2018-12-17 2019-05-28 北京三快在线科技有限公司 场景化商家召回方法、装置、电子设备及可读存储介质
CN109919316A (zh) * 2019-03-04 2019-06-21 腾讯科技(深圳)有限公司 获取网络表示学习向量的方法、装置和设备及存储介质
CN110490598A (zh) * 2019-08-23 2019-11-22 北京三快在线科技有限公司 异常检测方法、装置、设备及存储介质
CN111340612A (zh) * 2020-02-25 2020-06-26 支付宝(杭州)信息技术有限公司 一种账户的风险识别方法、装置及电子设备
CN111340493A (zh) * 2020-03-04 2020-06-26 江苏大学 一种多维度分布式异常交易行为检测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
谭敏 等: "神经机器翻译的系统融合方法", 《厦门大学学报(自然科学版)》 *
邱奇志: "基于本体的学习对象发现机制的研究与应用", 《中国博士学位论文全文数据库 信息科技辑》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114741433A (zh) * 2022-06-09 2022-07-12 北京芯盾时代科技有限公司 一种社群挖掘方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN111984698B (zh) 2021-03-19

Similar Documents

Publication Publication Date Title
WO2020024716A1 (zh) 一种针对新场景的预测模型训练方法及装置
CN109558951B (zh) 一种欺诈账号检测方法、装置及其存储介质
CN102737334B (zh) 微细分定义系统
CN106355506B (zh) 一种在线社会网络中影响力最大化初始节点选取方法
CN102317962A (zh) 机器优化装置、方法和系统
CN112396189A (zh) 一种多方构建联邦学习模型的方法及装置
US11295328B2 (en) Intelligent prospect assessment
CN111008335B (zh) 一种信息处理方法、装置、设备及存储介质
CN110009365B (zh) 非正常转移电子资产的用户群体检测方法、装置和设备
CN112989059A (zh) 潜在客户识别方法及装置、设备及可读计算机存储介质
CN112214499A (zh) 图数据处理方法、装置、计算机设备和存储介质
US11823026B2 (en) Artificial intelligence system employing graph convolutional networks for analyzing multi-entity-type multi-relational data
CN110674178B (zh) 构建用户画像标签的方法及其系统
CN113609345B (zh) 目标对象关联方法和装置、计算设备以及存储介质
CN116307671A (zh) 风险预警方法、装置、计算机设备、存储介质
CN111984698B (zh) 一种信息预测方法、装置及存储介质
CN110910235A (zh) 一种基于用户关系网络的贷中异常行为检测方法
KR102585895B1 (ko) 오픈마켓에서의 키워드 마케팅 효율 증가를 위한 방법 및 시스템
CN111275480B (zh) 面向多维稀疏销售数据仓库的欺诈行为挖掘方法
KR20220155377A (ko) 계정의 식별방법, 식별장치, 전자 디바이스 및 컴퓨터 판독 가능한 매체
CN115983902B (zh) 基于用户实时事件的信息推送方法及系统
Bouzidi et al. LSTM-based automated learning with smart data to improve marketing fraud detection and financial forecasting
CA3072444A1 (en) System and method for dynamic synthesis and transient clustering of semantic attributions for feedback and adjudication
US11551317B2 (en) Property valuation model and visualization
CN115187252A (zh) 网络交易系统中欺诈行为的识别方法、服务器及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant