CN115204923A - 实体检测方法、装置、计算机设备及存储介质 - Google Patents

实体检测方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN115204923A
CN115204923A CN202110386227.4A CN202110386227A CN115204923A CN 115204923 A CN115204923 A CN 115204923A CN 202110386227 A CN202110386227 A CN 202110386227A CN 115204923 A CN115204923 A CN 115204923A
Authority
CN
China
Prior art keywords
entity
target
vector
heterogeneous
relationship
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110386227.4A
Other languages
English (en)
Inventor
丁楠
陈振兴
王美青
何晓鹏
于冲冲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jingdong Technology Holding Co Ltd
Original Assignee
Jingdong Technology Holding Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jingdong Technology Holding Co Ltd filed Critical Jingdong Technology Holding Co Ltd
Priority to CN202110386227.4A priority Critical patent/CN115204923A/zh
Publication of CN115204923A publication Critical patent/CN115204923A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0207Discounts or incentives, e.g. coupons or rebates
    • G06Q30/0225Avoiding frauds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0207Discounts or incentives, e.g. coupons or rebates
    • G06Q30/0222During e-commerce, i.e. online transactions

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例涉及一种实体检测方法、装置、计算机设备及存储介质,包括:获取待处理的第一交易数据;根据第一交易数据构建第一对象与第二对象对应的第一异构关系;从第一异构关系中提取多组第一关系序列,将第一关系序列输入至目标模型,以使目标模型输出每个第一对象对应的第一向量和每个第二对象对应的第二向量;将满足预设条件的第一向量对应的第一对象作为第一实体,以及将满足预设条件的第二向量对应的第二对象作为第二实体;将第一实体和第二实体作为第一交易数据中的目标实体集合,通过异构关系提取关联用户和商户之间的关系序列,可以精准地确定每个用户或商户的向量表示,从而可以精确地识别交易数据中存在欺诈行为的用户或商户。

Description

实体检测方法、装置、计算机设备及存储介质
技术领域
本发明实施例涉及数据处理领域,尤其涉及一种实体检测方法、装置、计算机设备及存储介质。
背景技术
电子商务正在取代原始的线下消费方式,越来越多的消费者采取在电商网站和应用上进行购物,线上购物逐渐替代线下购物,线上交易对订单的处理越来越严谨,但仍然存在一些不法人员(商家和用户)在线上交易平台上涉足欺诈行为,例如,套现、黄牛、薅羊毛、刷单等操作,影响电商平台的合法、合规的运营。
现在反欺诈识别通常采用统计分析的方式,根据业务数据和风险事件数据执行风控指标,通过该风控指标作为相应的判断规则,判断用户和商家之间的交易是否属于欺诈行为。
然而,上述方式通常依赖于经验积累以及风险发生后的风险补漏,且规则相对单一,无法实现灵活配置以及风险发生前的预警。
发明内容
鉴于此,为解决上述技术问题或部分技术问题,本发明实施例提供一种实体检测方法、装置、计算机设备及存储介质。
第一方面,本发明实施例提供一种实体检测方法,包括:
获取待处理的第一交易数据,所述第一交易数据中包含有第一对象与第二对象的交易信息;
根据所述第一交易数据构建所述第一对象与所述第二对象对应的第一异构关系;
从所述第一异构关系中提取多组第一关系序列,将所述第一关系序列输入至目标模型,以使所述目标模型输出每个所述第一对象对应的第一向量和每个所述第二对象对应的第二向量;
将满足预设条件的所述第一向量对应的第一对象作为第一实体,以及将满足预设条件的所述第二向量对应的第二对象作为第二实体;
将所述第一实体和所述第二实体作为所述第一交易数据中的目标实体集合。
在一个可能的实施方式中,所述根据所述第一交易数据构建所述第一对象与所述第二对象对应的第一异构关系,包括:
将所述第一交易数据中单边对象删除,所述单边对象包括:与所述第二对象存在小于两次关联关系的所述第一对象,或,与所述第一对象存在小于两次关联关系的所述第二对象;
从删除所述单边对象的第一交易数据中提取所述第一对象与所述第二对象之间的多组交易关系;
根据所述多组交易关系构建包含有所述第一对象和所述第二对象的第一异构关系。
在一个可能的实施方式中,所述从所述第一异构关系中提取多组第一关系序列,包括:
针对所述第一异构关系中的任一所述第一对象,以所述第一对象为起点对所述第一异构关系中的交易关系进行采样,得到一组第一关系序列,所述第一关系序列中包含有多组所述第一对象与所述第二对象的交易关系,且任一相邻的两组所述交易关系中的所述第二对象与所述第一对象存在交易关系;
以所述第一异构关系中的任一所述第一对象为首次采样,依次完成对所述第一异构关系全部第一对象为起点的采样,得到多组所述第一关系序列。
在一个可能的实施方式中,所述将满足预设条件的所述第一向量对应的第一对象作为第一实体,以及将满足预设条件的所述第二向量对应的第二对象作为第二实体,包括:
将所述第一向量与目标对象集合中任一目标对象对应的目标向量相似度大于设定阈值的第一对象作为第一实体;
将所述第二向量与所述目标对象集合中任一所述目标对象对应的目标向量相似度大于设定阈值的第二对象作为第二实体。
在一个可能的实施方式中,所述方法还包括:
从黑名单中获取目标对象,所述目标对象包括:被标注的第一对象和被标注的第二对象;
确定被标注的所述第一对象与被标注的所述第二对象对应的第二交易数据;
根据所述第二交易数据构建被标注的所述第一对象与被标注的所述第二对象对应的第二异构关系;
从所述第二异构关系中提取第二关系序列,将所述第二关系序列输入至所述目标模型,以使所述目标模型输出每个所述目标对象对应的目标向量;
根据所述目标对象以及所述目标对象对应的目标向量生成目标对象集合。
在一个可能的实施方式中,所述方法还包括:
根据目标实体集合对所述目标对象集合进行更新。
在一个可能的实施方式中,所述目标模型为:metapath2vec异构图模型。
第二方面,本发明实施例提供一种实体检测装置,包括:
获取模块,用于获取待处理的第一交易数据,所述第一交易数据中包含有第一对象与第二对象的交易信息;
构建模块,用于根据所述第一交易数据构建所述第一对象与所述第二对象对应的第一异构关系;
向量确定模块,用于从所述第一异构关系中提取多组第一关系序列,将所述第一关系序列输入至目标模型,以使所述目标模型输出每个所述第一对象对应的第一向量和每个所述第二对象对应的第二向量;
实体确定模块,用于将满足预设条件的所述第一向量对应的第一对象作为第一实体,以及将满足预设条件的所述第二向量对应的第二对象作为第二实体;
集合确定模块,将所述第一实体和所述第二实体作为所述第一交易数据中的目标实体集合。
第三方面,本发明实施例提供一种计算机设备,包括:处理器和存储器,所述处理器用于执行所述存储器中存储的实体检测程序,以实现上述第一方面中任一项所述的实体检测方法。
第四方面,本发明实施例提供一种存储介质,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现上述第一方面中任一项所述的实体检测方法。
本发明实施例提供的实体检测方案,通过获取待处理的第一交易数据,所述第一交易数据中包含有第一对象与第二对象的交易信息;根据所述第一交易数据构建所述第一对象与所述第二对象对应的第一异构关系;从所述第一异构关系中提取多组第一关系序列,将所述第一关系序列输入至目标模型,以使所述目标模型输出每个所述第一对象对应的第一向量和每个所述第二对象对应的第二向量;将满足预设条件的所述第一向量对应的第一对象作为第一实体,以及将满足预设条件的所述第二向量对应的第二对象作为第二实体;将所述第一实体和所述第二实体作为所述第一交易数据中的目标实体集合,通过分析一个用户与多个商户之间的交易行为以及一个商户与多个用户之间的交易行为,再通过异构关系提取关联用户和商户之间的关系序列,可以精准地确定每个用户或商户的向量表示,从而可以精确地识别交易数据中存在欺诈行为的用户或商户。
附图说明
图1为本发明实施例提供的一种实体检测方法的流程示意图;
图2为本发明实施例提供的一种第一异构关系的示意图;
图3为本发明实施例提供的另一种实体检测方法的流程示意图;
图4为本发明实施例涉及的从所述第一异构关系中提取多组第一关系序列的流程示意图;
图5为本发明实施例涉及的确定目标对象集合的流程示意图;
图6为本发明实施例提供的一种实体检测装置的结构示意图;
图7为本发明实施例提供的一种的计算机设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为便于对本发明实施例的理解,下面将结合附图以具体实施例做进一步的解释说明,实施例并不构成对本发明实施例的限定。
图1为本发明实施例提供的一种实体检测方法的流程示意图,如图1所示,该方法具体包括:
S11、获取待处理的第一交易数据,所述第一交易数据中包含有第一对象与第二对象的交易信息。
本发明实施例提供的实体检测方法应用于电商平台中存在欺诈行为对象的检测,该对象可以包括第一对象和第二对象,第一对象可以是商户,第二对象可以是用户,第一对象和第二对象通过在电商平台上进行交易,电商平台记录二者的交易数据,针对该交易数据进行分析,确定交易数据中存在欺诈行为的实体。
进一步地,在第二对象在电商平台上(该电商平台在第二对象侧的呈现形式可以理解为:应用程序或网页链接)进行下单后,也即第二对象在电商平台针对第一对象在电商平台上线销售的商品进行下单,电商平台获取该交易信息(以下统称:第一交易数据),在该第一交易数据中包含有第一对象与第二对象的交易信息,交易信息可以包括:第一对象的ID、第二对象的ID、交易商品的信息、交易时间以及交易金额。
在本实施例中,第一交易数据可以是电商平台预设时间段内的全部交易记录,例如,获取1h内电商平台全部的第一交易数据,该第一交易数据中包含有多个第一对象与多个第二对象之间的交易记录。
例如,用户1、用户2、用户3、用户4、用户5、用户6和用户7在商户1处下单商品1;用户1、用户2、用户3、用户4、用户5和用户8在商户2处下单商品2;用户5、用户8和用户9在商户3处下单商品3;用户6和用户8在商户4处下单商品4;用户7、用户8和用户9在商户5处下单商品5。
S12、根据所述第一交易数据构建所述第一对象与所述第二对象对应的第一异构关系。
在本实施例中对第一交易数据中的每笔交易信息进行分析,确定每笔交易信息中对应的第一对象和第二对象,再针对每笔交易数据之间第一对象或第二对象的关联关系建立第一交易数据对应的第一异构关系,该异构关系可以是由多个节点构成的关系网络,每个节点代表第一对象或第二对象。
进一步地,为便于交易关系的呈现,可以按照“用户-商户-用户-商户”的层级关系构建异构关系。
参照图2示出了本发明实施例提供的一种第一异构关系的示意图,在该第一异构关系可以分为四个层级,第一层级(用户1、用户2、用户3、用户4和用户5)、第二层级(商户1、商户2和商户3),第三层级(用户6、用户7、用户8和用户9)和第四层级(商户4和商户5)。
S13、从所述第一异构关系中提取多组第一关系序列,将所述第一关系序列输入至目标模型,以使所述目标模型输出每个所述第一对象对应的第一向量和每个所述第二对象对应的第二向量。
在本实施例中,预先训练目标模型,该目标模型用于从第一异构关系提取的第一关系序列提取出每个第一对象对应的第一向量以及第二对象对应的第二向量,目标模型可以是:metapath2vec异构图模型。
进一步地,从第一异构关系中提取多组第一关系序列,该第一关系序列可以是以第一异构关系中任一第一对象为起点,节点数为N的序列,多组第一关系序列需要包含第一异构关系中全部的第一对象和第二对象。
例如,以图2所示的第一异构关系为例,第一关系序列可以是:用户1-商户1-用户6-商户5,相应地,将该第一关系序列输入至目标模型中,目标模型的输出结果为:用户1-第一向量1;商户1-第二向量1;用户6-第一向量6;商户5-第二向量5。
S14、将满足预设条件的所述第一向量对应的第一对象作为第一实体,以及将满足预设条件的所述第二向量对应的第二对象作为第二实体。
在本发明实施例中,预先根据已被标注黑名单的第一对象和第二对象对应的向量确定相应的预设条件,并将目标模型输出的第一向量和第二向量与预设条件进行判断,将满足预设条件的第一向量对应的第一对象作为第一实体,以及将满足预设条件的第二向量对应的第二对象作为第二实体。
第一实体中的第一对象和第二实体中的第二对象与已被标注黑名单的第一对象和第二对象存在高度的类似,也即通过已有的黑名单的相似度来判断第一交易数据中是否存在欺诈行为的第一对象和第二对象。
进一步地,已被标注黑名单的第一对象和第二对象可以通过被拉黑/封号的商户或用户的电商平台账号确定。
S15、将所述第一实体和所述第二实体作为所述第一交易数据中的目标实体集合。
将由上步骤确定的第一实体和第二实体作为该第一交易数据中的目标实体即可,也即在该目标实体中的任一第一对象或第二对象存在欺诈行为,针对目标实体集合中的任一对象,在订单提交后需要对订单状态进行跟踪,以及对第一对象和第二对象之间的交易信息进行分析,在经过对订单状态跟踪和交易信息分析后,若确定该交易信息属于欺诈行为,则将该交易信息对应的第一对象和第二对象从目标实体集合中加入至黑名单中。
本发明实施例提供的实体检测方法,通过获取待处理的第一交易数据,所述第一交易数据中包含有第一对象与第二对象的交易信息;根据所述第一交易数据构建所述第一对象与所述第二对象对应的第一异构关系;从所述第一异构关系中提取多组第一关系序列,将所述第一关系序列输入至目标模型,以使所述目标模型输出每个所述第一对象对应的第一向量和每个所述第二对象对应的第二向量;将满足预设条件的所述第一向量对应的第一对象作为第一实体,以及将满足预设条件的所述第二向量对应的第二对象作为第二实体;将所述第一实体和所述第二实体作为所述第一交易数据中的目标实体集合,通过分析一个用户与多个商户之间的交易行为以及一个商户与多个用户之间的交易行为,再通过异构关系提取关联用户和商户之间的关系序列,可以精准地确定每个用户或商户的向量表示,从而可以精确地识别交易数据中存在欺诈行为的用户或商户。
图3为本发明实施例涉及的根据所述第一交易数据构建所述第一对象与所述第二对象对应的第一异构关系的流程示意图,如图3所示,具体包括:
S31、将所述第一交易数据中单边对象删除。
在本实施例中,为保证目标模型的计算效率,将第一交易数据中的单边对象删除,该单边对象包括:与所述第二对象存在小于两次关联关系的所述第一对象,或,与所述第一对象存在小于两次关联关系的所述第二对象。
例如,在该第一交易数据中用户n仅与商户n存在一次交易记录,且不存在于其它商户的交易记录,或者商户m仅仅与用户m存在一次交易记录,且不存在于其它用户的交易记录,则将该第一数据中的用户n和商户m删除(需要说明的是:商户n除与用户n存在交易记录外,还与其它用户也存在交易记录,用户m除与用户m存在交易记录外,还与其它商户也存在交易记录)。
S32、从删除所述单边对象的第一交易数据中提取所述第一对象与所述第二对象之间的多组交易关系。
S33、根据所述多组交易关系构建包含有所述第一对象和所述第二对象的第一异构关系。
在本实施中,针对删除单边数据后的第一交易数据,从中提取每组第一对象与第二对象之间的交易关系,再将多组交易关系进行聚类,以第二对象为参考,将与第二对象存在交易关系的一个或多个第一对象进行聚类(以下统一称为第一对象小组),再根据每个第一对象小组之间的交集以及每个第二对象之间的关联度对第二对象再进行聚类(以下称为第二对象小组),再根据第一对象小组和第二对象小组进行第一异构关系的构建。
例如,
以第二对象为参考,对第一对象进行聚类,得到:商户1-(用户1、用户2、用户3、用户4、用户5、用户6和用户7);商户2-(用户1、用户2、用户3、用户4、用户5和用户8);商户3-(用户5、用户8和用户9),商户4-(用户6和用户8);商户5-(用户7、用户8和用户9);
对第二对象再进行聚类,得到:(商户1、商户2和商户3)和(商户4和商户5)。
再根据(商户1、商户2和商户3)、(商户4和商户5)对(用户1、用户2、用户3、用户4、用户5、用户6和用户7)、(用户1、用户2、用户3、用户4、用户5和用户8)、(用户5、用户8和用户9)、(用户6和用户8)和(用户7、用户8和用户9)进行拆分组合,得到(用户1、用户2、用户3、用户4、用户5)和(用户7、用户8和用户9)。
由此,该第一异构关系可以包括四个层级,第一层级为:(用户1、用户2、用户3、用户4、用户5),第二层级为:(商户1、商户2和商户3),第三层级为:(用户7、用户8和用户9),第四层级为:(用户7、用户8和用户9),并在第一异构关系中采用连线的形式表示用户与商户的交易关系,并在每条连线上标注交易信息(例如,交易时间、交易金额、交易物品、支付方式等)。
本发明实施例通过异构关系的形式可以有效表征第一对象与第二对象之间的潜在关系,相比于单一地分析每笔交易记录更加准确,还可反映出第一对象和第二对象是否存在勾结关系,以及是否存在欺诈团伙。
图4为本发明实施例涉及的从所述第一异构关系中提取多组第一关系序列的流程示意图,如图4所示,具体包括:
S41、针对所述第一异构关系中的任一所述第一对象,以所述第一对象为起点对所述第一异构关系中的交易关系进行采样,得到一组第一关系序列。
在本实施例中,按照预设的规则对第一异构关系中的各节点进行采样,得到多组第一关系序列,预设的规则可以是:每个第一对象作为初始采样节点的次数,以及第一关系序列中交易记录的组数,得到的每组第一关系序列中包含有多组所述第一对象与所述第二对象的交易关系,且任一相邻的两组所述交易关系中的所述第二对象与所述第一对象存在交易关系。
S42、以所述第一异构关系中的任一所述第一对象为首次采样,依次完成对所述第一异构关系全部第一对象为起点的采样,得到多组所述第一关系序列。
选取第一异构关系中的任一第一对象(用户)为首次采样节点,按照预设的规则依次完成对该第一异构关系中全部第一对象为起点的采样,得到多组第一关系序列。
例如,以图2所示的第一异构关系为例,首次以用户1为例,每组第一关系序列中采样两组交易记录,对应的第一关系序列可以是:用户1-商户1-用户6-商户4,用户1-商户1-用户7-商户5…;
又如:首次以用户2为例,每组第一关系序列中采样三组交易记录,对应的第一关系序列可以是:用户2-商户1-用户6-商户4-用户8-商户2,用户2-商户2-用户8-商户4-用户6-商户1…。
在本发明实施例的一可选方案中,根据已被标注黑名单的第一对象和第二对象确定目标对象集合,该目标对象集合用于确定第一实体和第二实体。
图5为本发明实施例涉及的确定目标对象集合的流程示意图,如图5所示,具体包括:
S51、从黑名单中获取目标对象。
S52、确定被标注的所述第一对象与被标注的所述第二对象对应的第二交易数据。
S53、根据所述第二交易数据构建被标注的所述第一对象与被标注的所述第二对象对应的第二异构关系。
S54、从所述第二异构关系中提取第二关系序列,将所述第二关系序列输入至所述目标模型,以使所述目标模型输出每个所述目标对象对应的目标向量。
S55、根据所述目标对象以及所述目标对象对应的目标向量生成目标对象集合。
在本实施例中,针对黑名单中的目标对象,该目标对象包括:被标注的第一对象和被标注的第二对象,获取被标注的第一对象和被标注的第二对象涉及欺诈行为的交易记录,得到对应的第二交易数据。
针对第二交易数据确定每个目标对象对应的目标向量的步骤与S11-S13类似,可参照图1中的相关描述,在此,不作赘述。
根据目标模型输出的目标向量,建立目标对象和目标向量的对应关系,将全部的目标对象和目标向量构建目标对象集合。
在本发明实施例的一可选方案中,将所述第一向量与所述目标对象集合中任一目标对象对应的目标向量相似度大于设定阈值的第一对象作为第一实体;将所述第二向量与所述目标对象集合中任一目标对象对应的目标向量相似度大于设定阈值的第二对象作为第二实体。
进一步地,可采用相似度计算的形式确定第一实体和第二实体,如,采用余弦相似度计算,或,采用欧式距离计算。
Figure BDA0003013320310000121
其中,
Figure BDA0003013320310000131
为第一向量或第二向量,
Figure BDA0003013320310000132
为目标向量,ai
Figure BDA0003013320310000133
的各分量,bi
Figure BDA0003013320310000134
的各分量。
Figure BDA0003013320310000135
其中,
Figure BDA0003013320310000136
为第一向量或第二向量,
Figure BDA0003013320310000137
为目标向量,ai
Figure BDA0003013320310000138
的各分量,bi
Figure BDA0003013320310000139
的各分量。
在本发明实施例的一可选方案中,设定阈值可根据实际情况进行设定,例如,设定阈值为0.9,对此,本实施例不作具体限定。
本发明实施例提供的实体检测方案,通过获取待处理的第一交易数据,所述第一交易数据中包含有第一对象与第二对象的交易信息;根据所述第一交易数据构建所述第一对象与所述第二对象对应的第一异构关系;从所述第一异构关系中提取多组第一关系序列,将所述第一关系序列输入至目标模型,以使所述目标模型输出每个所述第一对象对应的第一向量和每个所述第二对象对应的第二向量;将满足预设条件的所述第一向量对应的第一对象作为第一实体,以及将满足预设条件的所述第二向量对应的第二对象作为第二实体;将所述第一实体和所述第二实体作为所述第一交易数据中的目标实体集合,通过分析一个用户与多个商户之间的交易行为以及一个商户与多个用户之间的交易行为,再通过异构关系提取关联用户和商户之间的关系序列,可以精准地确定每个用户或商户的向量表示,从而可以精确地识别交易数据中存在欺诈行为的用户或商户。
图6为本发明实施例提供的一种实体检测装置的结构示意图,如图6所示,该装置具体包括:
获取模块601,用于获取待处理的第一交易数据,所述第一交易数据中包含有第一对象与第二对象的交易信息;
构建模块602,用于根据所述第一交易数据构建所述第一对象与所述第二对象对应的第一异构关系;
向量确定模块603,用于从所述第一异构关系中提取多组第一关系序列,将所述第一关系序列输入至目标模型,以使所述目标模型输出每个所述第一对象对应的第一向量和每个所述第二对象对应的第二向量;
实体确定模块604,用于将满足预设条件的所述第一向量对应的第一对象作为第一实体,以及将满足预设条件的所述第二向量对应的第二对象作为第二实体;
集合确定模块605,将所述第一实体和所述第二实体作为所述第一交易数据中的目标实体集合。
本实施例提供的实体检测装置可以是如图6中所示的电子设备,可执行如图1-5中实体检测方法的所有步骤,进而实现图1-5所示实体检测方法的技术效果,具体请参照图1-5相关描述,为简洁描述,在此不作赘述。
图7为本发明实施例提供的一种的计算机设备的结构示意图,图7所示的计算机设备700包括:至少一个处理器701、存储器702、至少一个网络接口704和其他用户接口703。计算机设备700中的各个组件通过总线系统705耦合在一起。可理解,总线系统705用于实现这些组件之间的连接通信。总线系统705除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图7中将各种总线都标为总线系统705。
其中,用户接口703可以包括显示器、键盘或者点击设备(例如,鼠标,轨迹球(trackball)、触感板或者触摸屏等。
可以理解,本发明实施例中的存储器702可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(Read-Only Memory,ROM)、可编程只读存储器(Programmable ROM,PROM)、可擦除可编程只读存储器(Erasable PROM,EPROM)、电可擦除可编程只读存储器(Electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(Static RAM,SRAM)、动态随机存取存储器(Dynamic RAM,DRAM)、同步动态随机存取存储器(Synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data RateSDRAM,DDRSDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(Synch link DRAM,SLDRAM)和直接内存总线随机存取存储器(DirectRambus RAM,DRRAM)。本文描述的存储器702旨在包括但不限于这些和任意其它适合类型的存储器。
在一些实施方式中,存储器702存储了如下的元素,可执行单元或者数据结构,或者他们的子集,或者他们的扩展集:操作系统7021和应用程序7022。
其中,操作系统7021,包含各种系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务。应用程序7022,包含各种应用程序,例如媒体播放器(Media Player)、浏览器(Browser)等,用于实现各种应用业务。实现本发明实施例方法的程序可以包含在应用程序7022中。
在本发明实施例中,通过调用存储器702存储的程序或指令,具体的,可以是应用程序7022中存储的程序或指令,处理器701用于执行各方法实施例所提供的方法步骤,例如包括:
获取待处理的第一交易数据,所述第一交易数据中包含有第一对象与第二对象的交易信息;根据所述第一交易数据构建所述第一对象与所述第二对象对应的第一异构关系;从所述第一异构关系中提取多组第一关系序列,将所述第一关系序列输入至目标模型,以使所述目标模型输出每个所述第一对象对应的第一向量和每个所述第二对象对应的第二向量;将满足预设条件的所述第一向量对应的第一对象作为第一实体,以及将满足预设条件的所述第二向量对应的第二对象作为第二实体;将所述第一实体和所述第二实体作为所述第一交易数据中的目标实体集合。
在一个可能的实施方式中,将所述第一交易数据中单边对象删除,所述单边对象包括:与所述第二对象存在小于两次关联关系的所述第一对象,或,与所述第一对象存在小于两次关联关系的所述第二对象;从删除所述单边对象的第一交易数据中提取所述第一对象与所述第二对象之间的多组交易关系;根据所述多组交易关系构建包含有所述第一对象和所述第二对象的第一异构关系。
在一个可能的实施方式中,针对所述第一异构关系中的任一所述第一对象,以所述第一对象为起点对所述第一异构关系中的交易关系进行采样,得到一组第一关系序列,所述第一关系序列中包含有多组所述第一对象与所述第二对象的交易关系,且任一相邻的两组所述交易关系中的所述第二对象与所述第一对象存在交易关系;以所述第一异构关系中的任一所述第一对象为首次采样,依次完成对所述第一异构关系全部第一对象为起点的采样,得到多组所述第一关系序列。
在一个可能的实施方式中,将所述第一向量与所述目标对象集合中任一目标对象对应的目标向量相似度大于设定阈值的第一对象作为第一实体;将所述第二向量与所述目标对象集合中任一目标对象对应的目标向量相似度大于设定阈值的第二对象作为第二实体。
在一个可能的实施方式中,从黑名单中获取目标对象,所述目标对象包括:被标注的第一对象和被标注的第二对象;确定被标注的所述第一对象与被标注的所述第二对象对应的第二交易数据;根据所述第二交易数据构建被标注的所述第一对象与被标注的所述第二对象对应的第二异构关系;从所述第二异构关系中提取第二关系序列,将所述第二关系序列输入至所述目标模型,以使所述目标模型输出每个所述目标对象对应的目标向量;根据所述目标对象以及所述目标对象对应的目标向量生成目标对象集合。
在一个可能的实施方式中,根据目标实体集合对所述目标对象集合进行更新。
在一个可能的实施方式中,所述目标模型为:metapath2vec异构图模型。
上述本发明实施例揭示的方法可以应用于处理器701中,或者由处理器701实现。处理器701可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器701中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器701可以是通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(FieldProgrammable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件单元组合执行完成。软件单元可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器702,处理器701读取存储器702中的信息,结合其硬件完成上述方法的步骤。
可以理解的是,本文描述的这些实施例可以用硬件、软件、固件、中间件、微码或其组合来实现。对于硬件实现,处理单元可以实现在一个或多个专用集成电路(ApplicationSpecific Integrated Circuits,ASIC)、数字信号处理器(Digital Signal Processing,DSP)、数字信号处理设备(DSPDevice,DSPD)、可编程逻辑设备(Programmable LogicDevice,PLD)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、通用处理器、控制器、微控制器、微处理器、用于执行本申请所述功能的其它电子单元或其组合中。
对于软件实现,可通过执行本文所述功能的单元来实现本文所述的技术。软件代码可存储在存储器中并通过处理器执行。存储器可以在处理器中或在处理器外部实现。
本实施例提供的计算机设备可以是如图7中所示的计算机设备,可执行如图1-5中实体检测方法的所有步骤,进而实现图1-5所示实体检测方法的技术效果,具体请参照图1-5相关描述,为简洁描述,在此不作赘述。
本发明实施例还提供了一种存储介质(计算机可读存储介质)。这里的存储介质存储有一个或者多个程序。其中,存储介质可以包括易失性存储器,例如随机存取存储器;存储器也可以包括非易失性存储器,例如只读存储器、快闪存储器、硬盘或固态硬盘;存储器还可以包括上述种类的存储器的组合。
当存储介质中一个或者多个程序可被一个或者多个处理器执行,以实现上述在实体检测设备侧执行的实体检测方法。
所述处理器用于执行存储器中存储的实体检测程序,以实现以下在实体检测设备侧执行的实体检测方法的步骤:
获取待处理的第一交易数据,所述第一交易数据中包含有第一对象与第二对象的交易信息;根据所述第一交易数据构建所述第一对象与所述第二对象对应的第一异构关系;从所述第一异构关系中提取多组第一关系序列,将所述第一关系序列输入至目标模型,以使所述目标模型输出每个所述第一对象对应的第一向量和每个所述第二对象对应的第二向量;将满足预设条件的所述第一向量对应的第一对象作为第一实体,以及将满足预设条件的所述第二向量对应的第二对象作为第二实体;将所述第一实体和所述第二实体作为所述第一交易数据中的目标实体集合。
在一个可能的实施方式中,将所述第一交易数据中单边对象删除,所述单边对象包括:与所述第二对象存在小于两次关联关系的所述第一对象,或,与所述第一对象存在小于两次关联关系的所述第二对象;从删除所述单边对象的第一交易数据中提取所述第一对象与所述第二对象之间的多组交易关系;根据所述多组交易关系构建包含有所述第一对象和所述第二对象的第一异构关系。
在一个可能的实施方式中,针对所述第一异构关系中的任一所述第一对象,以所述第一对象为起点对所述第一异构关系中的交易关系进行采样,得到一组第一关系序列,所述第一关系序列中包含有多组所述第一对象与所述第二对象的交易关系,且任一相邻的两组所述交易关系中的所述第二对象与所述第一对象存在交易关系;以所述第一异构关系中的任一所述第一对象为首次采样,依次完成对所述第一异构关系全部第一对象为起点的采样,得到多组所述第一关系序列。
在一个可能的实施方式中,将所述第一向量与所述目标对象集合中任一目标对象对应的目标向量相似度大于设定阈值的第一对象作为第一实体;将所述第二向量与所述目标对象集合中任一目标对象对应的目标向量相似度大于设定阈值的第二对象作为第二实体。
在一个可能的实施方式中,从黑名单中获取目标对象,所述目标对象包括:被标注的第一对象和被标注的第二对象;确定被标注的所述第一对象与被标注的所述第二对象对应的第二交易数据;根据所述第二交易数据构建被标注的所述第一对象与被标注的所述第二对象对应的第二异构关系;从所述第二异构关系中提取第二关系序列,将所述第二关系序列输入至所述目标模型,以使所述目标模型输出每个所述目标对象对应的目标向量;根据所述目标对象以及所述目标对象对应的目标向量生成目标对象集合。
在一个可能的实施方式中,根据目标实体集合对所述目标对象集合进行更新。
在一个可能的实施方式中,所述目标模型为:metapath2vec异构图模型。
专业人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种实体检测方法,其特征在于,包括:
获取待处理的第一交易数据,所述第一交易数据中包含有第一对象与第二对象的交易信息;
根据所述第一交易数据构建所述第一对象与所述第二对象对应的第一异构关系;
从所述第一异构关系中提取多组第一关系序列,将所述第一关系序列输入至目标模型,以使所述目标模型输出每个所述第一对象对应的第一向量和每个所述第二对象对应的第二向量;
将满足预设条件的所述第一向量对应的第一对象作为第一实体,以及将满足预设条件的所述第二向量对应的第二对象作为第二实体;
将所述第一实体和所述第二实体作为所述第一交易数据中的目标实体集合。
2.根据权利要求1所述的方法,其特征在于,所述根据所述第一交易数据构建所述第一对象与所述第二对象对应的第一异构关系,包括:
将所述第一交易数据中单边对象删除,所述单边对象包括:与所述第二对象存在小于两次关联关系的所述第一对象,或,与所述第一对象存在小于两次关联关系的所述第二对象;
从删除所述单边对象的第一交易数据中提取所述第一对象与所述第二对象之间的多组交易关系;
根据所述多组交易关系构建包含有所述第一对象和所述第二对象的第一异构关系。
3.根据权利要求1所述的方法,其特征在于,所述从所述第一异构关系中提取多组第一关系序列,包括:
针对所述第一异构关系中的任一所述第一对象,以所述第一对象为起点对所述第一异构关系中的交易关系进行采样,得到一组第一关系序列,所述第一关系序列中包含有多组所述第一对象与所述第二对象的交易关系,且任一相邻的两组所述交易关系中的所述第二对象与所述第一对象存在交易关系;
以所述第一异构关系中的任一所述第一对象为首次采样,依次完成对所述第一异构关系全部第一对象为起点的采样,得到多组所述第一关系序列。
4.根据权利要求1所述的方法,其特征在于,所述将满足预设条件的所述第一向量对应的第一对象作为第一实体,以及将满足预设条件的所述第二向量对应的第二对象作为第二实体,包括:
将所述第一向量与目标对象集合中任一目标对象对应的目标向量相似度大于设定阈值的第一对象作为第一实体;
将所述第二向量与所述目标对象集合中任一所述目标对象对应的目标向量相似度大于设定阈值的第二对象作为第二实体。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
从黑名单中获取目标对象,所述目标对象包括:被标注的第一对象和被标注的第二对象;
确定被标注的所述第一对象与被标注的所述第二对象对应的第二交易数据;
根据所述第二交易数据构建被标注的所述第一对象与被标注的所述第二对象对应的第二异构关系;
从所述第二异构关系中提取第二关系序列,将所述第二关系序列输入至所述目标模型,以使所述目标模型输出每个所述目标对象对应的目标向量;
根据所述目标对象以及所述目标对象对应的目标向量生成目标对象集合。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
根据目标实体集合对所述目标对象集合进行更新。
7.根据权利要求1-6任一所述的方法,其特征在于,所述目标模型为:metapath2vec异构图模型。
8.一种实体检测装置,其特征在于,包括:
获取模块,用于获取待处理的第一交易数据,所述第一交易数据中包含有第一对象与第二对象的交易信息;
构建模块,用于根据所述第一交易数据构建所述第一对象与所述第二对象对应的第一异构关系;
向量确定模块,用于从所述第一异构关系中提取多组第一关系序列,将所述第一关系序列输入至目标模型,以使所述目标模型输出每个所述第一对象对应的第一向量和每个所述第二对象对应的第二向量;
实体确定模块,用于将满足预设条件的所述第一向量对应的第一对象作为第一实体,以及将满足预设条件的所述第二向量对应的第二对象作为第二实体;
集合确定模块,将所述第一实体和所述第二实体作为所述第一交易数据中的目标实体集合。
9.一种计算机设备,其特征在于,包括:处理器和存储器,所述处理器用于执行所述存储器中存储的实体检测程序,以实现权利要求1~7中任一项所述的实体检测方法。
10.一种存储介质,其特征在于,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现权利要求1~7中任一项所述的实体检测方法。
CN202110386227.4A 2021-04-09 2021-04-09 实体检测方法、装置、计算机设备及存储介质 Pending CN115204923A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110386227.4A CN115204923A (zh) 2021-04-09 2021-04-09 实体检测方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110386227.4A CN115204923A (zh) 2021-04-09 2021-04-09 实体检测方法、装置、计算机设备及存储介质

Publications (1)

Publication Number Publication Date
CN115204923A true CN115204923A (zh) 2022-10-18

Family

ID=83570312

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110386227.4A Pending CN115204923A (zh) 2021-04-09 2021-04-09 实体检测方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN115204923A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116881914A (zh) * 2023-09-06 2023-10-13 国网思极网安科技(北京)有限公司 文件系统操作处理方法、系统、设备和计算机可读介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116881914A (zh) * 2023-09-06 2023-10-13 国网思极网安科技(北京)有限公司 文件系统操作处理方法、系统、设备和计算机可读介质
CN116881914B (zh) * 2023-09-06 2023-11-28 国网思极网安科技(北京)有限公司 文件系统操作处理方法、系统、设备和计算机可读介质

Similar Documents

Publication Publication Date Title
CN109558951B (zh) 一种欺诈账号检测方法、装置及其存储介质
JP6940646B2 (ja) 情報推奨方法、情報推奨装置、機器および媒体
US20230031057A1 (en) Techniques to automatically update payment information in a compute environment
KR101879416B1 (ko) 이상 금융거래 탐지 방법 및 그 전자 장치
WO2019114412A1 (zh) 一种基于图结构模型的信用风险控制方法、装置以及设备
WO2019091177A1 (zh) 风险识别模型构建和风险识别方法、装置及设备
TW202008237A (zh) 針對新場景的預測模型訓練方法及裝置
TW201812689A (zh) 惡意地址/惡意訂單的識別系統、方法及裝置
CN111199474B (zh) 一种基于双方网络图数据的风险预测方法、装置和电子设备
JP2019525309A (ja) データリスクを制御する方法及び装置
US20240185315A1 (en) Preemptive transaction analysis
CN110135978B (zh) 用户金融风险评估方法、装置、电子设备和可读介质
CN111783039B (zh) 风险确定方法、装置、计算机系统和存储介质
WO2023123933A1 (zh) 用户的类型信息的确定方法、设备及存储介质
CN113360580A (zh) 基于知识图谱的异常事件检测方法、装置、设备及介质
CN113159934A (zh) 一种网点客流量的预测方法、系统、电子设备及存储介质
CN115204923A (zh) 实体检测方法、装置、计算机设备及存储介质
JP7170689B2 (ja) 出力装置、出力方法及び出力プログラム
CN104751234B (zh) 一种用户资产的预测方法及装置
CN116245630A (zh) 一种反欺诈检测方法、装置、电子设备及介质
Prakash et al. ATM Card Fraud Detection System Using Machine Learning Techniques
Chen et al. Robust Semi‐Supervised Manifold Learning Algorithm for Classification
KR20210023690A (ko) 컨텐츠 기여도 측정 방법 및 장치
TWI836840B (zh) 學習系統、學習方法及程式產品
CN117094032B (zh) 一种基于隐私保护的用户信息加密方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination