CN111126788A - 风险识别方法及装置和电子设备 - Google Patents

风险识别方法及装置和电子设备 Download PDF

Info

Publication number
CN111126788A
CN111126788A CN201911212256.8A CN201911212256A CN111126788A CN 111126788 A CN111126788 A CN 111126788A CN 201911212256 A CN201911212256 A CN 201911212256A CN 111126788 A CN111126788 A CN 111126788A
Authority
CN
China
Prior art keywords
order
subgraph
nodes
graph
subgraphs
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911212256.8A
Other languages
English (en)
Inventor
刘腾飞
李杨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN201911212256.8A priority Critical patent/CN111126788A/zh
Publication of CN111126788A publication Critical patent/CN111126788A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Economics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Operations Research (AREA)
  • Strategic Management (AREA)
  • Pure & Applied Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Mathematical Physics (AREA)
  • Computational Mathematics (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Game Theory and Decision Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Development Economics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Educational Administration (AREA)
  • Algebra (AREA)
  • Evolutionary Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Marketing (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本说明书实施例提供一种风险识别方法及装置和电子设备。所述方法包括:根据历史交易数据构建目标服务商的交易关系图;其中,所述交易关系图由所述目标服务商拓展的卖方节点、与所述卖方节点发生交易的买方节点构成,发生交易的卖方节点和买方节点之间通过边表示关联关系;统计所述交易关系图中至少三阶的子图的数量;其中,所述子图由相邻买方节点和卖方节点构成;根据每阶子图的数量和所有阶子图的总数量,计算所述交易关系图的子图频率分布;根据所述子图频率分布,确定所述目标服务商是否为异常服务商。

Description

风险识别方法及装置和电子设备
技术领域
本说明书实施例涉及互联网技术领域,尤其涉及一种风险识别方法及装置和电子设备。
背景技术
随着移动支付的不断发展,开通移动支付以供顾客进行扫码支付的线下商户不断增多。
移动支付运营商在进行线下推广时,一般是通过第三方的服务商来进行推广。这些服务商的主体一般是一些应用推广公司,通过自己的员工逐个接触线下的商户,说服和鼓励线下商户开通移动支付。移动支付运营商为了提高服务商的积极性,会根据服务商推广的表现兑付佣金。
发明内容
本说明书实施例提供的一种风险识别方法及装置和电子设备。
根据本说明书实施例的第一方面,提供一种风险识别方法,所述方法包括:
根据历史交易数据构建目标服务商的交易关系图;其中,所述交易关系图由所述目标服务商拓展的卖方节点、与所述卖方节点发生交易的买方节点构成,发生交易的卖方节点和买方节点之间通过边表示关联关系;
统计所述交易关系图中至少三阶的子图的数量;其中,所述子图由相邻买方节点和卖方节点构成;
根据每阶子图的数量和所有阶子图的总数量,计算所述交易关系图的子图频率分布;
根据所述子图频率分布,确定所述目标服务商是否为异常服务商。
可选的,所述根据所述子图频率分布,确定所述目标服务商是否为异常服务商,具体包括:
利用异常检查算法计算所述子图频率分布的异常分值;
在所述异常分值达到阈值时,确定所述目标服务商是否为异常服务商。
可选的,所述阈值由不同服务商的异常分值共同计算得出。
可选的,所述计算方式为计算所述不同服务商的异常分值的均值。
可选的,在所述至少三阶的子图为三阶子图和四阶子图时,根据每阶子图的数量和所有阶子图的总数量,计算所述交易关系图的子图频率分布,具体包括:
将三阶子图的数量除以三阶四阶子图的总数量,确定所述三阶子图的频率;
将四阶子图的数量除以三阶四阶子图的总数量,确定所述四阶子图的频率;
根据所述三阶子图的频率和四阶子图的频率,确定所述交易关系图的子图频率分布。
根据本说明书实施例的第二方面,提供一种风险识别装置,所述装置包括:
构建单元,根据历史交易数据构建目标服务商的交易关系图;其中,所述交易关系图由所述目标服务商拓展的卖方节点、与所述卖方节点发生交易的买方节点构成,发生交易的卖方节点和买方节点之间通过边表示关联关系;
统计单元,统计所述交易关系图中至少三阶的子图的数量;其中,所述子图由相邻买方节点和卖方节点构成;
计算单元,根据每阶子图的数量和所有阶子图的总数量,计算所述交易关系图的子图频率分布;
识别单元,根据所述子图频率分布,确定所述目标服务商是否为异常服务商。
可选的,所述识别单元,具体包括:
利用异常检查算法计算所述子图频率分布的异常分值;在所述异常分值达到阈值时,确定所述目标服务商是否为异常服务商。
可选的,所述阈值由不同服务商的异常分值共同计算得出。
可选的,所述计算方式为计算所述不同服务商的异常分值的均值。
可选的,在所述至少三阶的子图为三阶子图和四阶子图时,所述计算单元,具体包括:
将三阶子图的数量除以三阶四阶子图的总数量,确定所述三阶子图的频率;将四阶子图的数量除以三阶四阶子图的总数量,确定所述四阶子图的频率;根据所述三阶子图的频率和四阶子图的频率,确定所述交易关系图的子图频率分布。根据本说明书实施例的第三方面,提供一种电子设备,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为上述任一项风险识别方法。
附图说明
图1是本说明书一实施例提供的风险识别方法的流程图;
图2是本说明书一实施例提供的关系图的三阶至五阶子图的示意图;
图3是本说明书一实施例提供的交易关系图的三阶和四阶子图的示意图;
图4是本说明书一实施例提供的风险识别装置的硬件结构图;
图5是本说明书一实施例提供的风险识别装置的模块示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本说明书相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本说明书的一些方面相一致的装置和方法的例子。
在本说明书使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书。在本说明书和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本说明书可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
如前所述,移动支付运营商为了推广移动支付,会通过服务商来拓展使用本移动支付应用的线下商户。为了提高服务商的积极性,会根据服务商推广的表现兑付佣金。
通常,佣金的数量是与服务端拓展的商户数量,以及这些拓展的商户使用移动支付的交易数量成正比。即拓展的商户越多,商户使用移动支付的交易越多,服务商得到的佣金也越多。为此,某些服务商为了获取更多的佣金,会创建一批买家账户,利用这批买家账户制造与拓展的商户之间的虚假交易。为此,需要及时预警异常的服务商,避免推广资金的浪费。
在相关技术中,通常利用机器学习算法来识别异常的服务商,具体可以细分为使用有监督的分类模型和使用无监督的异常检测模型。
其中,使用有监督的分类模型具体方案为:预先收集若干已确定异常的服务商作为黑样本,若干已确定正常的服务商作为白样本。设计一些可以描述服务商是否异常的特征;利用所述黑白样本,训练一个可以识别异常服务商的分类模型。这种方案的实现首先需要收集正确标签的黑白样本。然而在实际中,难以获取黑样本的标签,或者黑样本的标签获取成本较高。
另外,可以采用无需黑白样本标签的无监督的异常检测模型方案。该方案实现需要资深的算法工程师在充分了解业务的情况下,人为基于业务经验设计用于描述服务商是否异常的特征;然后异常检测算法根据每个服务商中这些特征的特征值计算是否异常。可见,无监督的异常检测方案对算法工程师的要求较高,需要人为设计用于描述服务商是否异常的特征;无法提供一种通用的识别异常服务商的方案。
本说明书提供了一种风险识别方法,利用服务商拓展的卖家与买家之间的交易构建交易关系图,基于交易关系图中子图结构这个特征来准确识别异常服务商。无需额外收集标签信息,识别成功更低,更为方便;且无需特别设计业务相关的特征,对算法工程师没有特殊要求。
以下可以参考图1所示的例子介绍,该方法可以应用于风险识别的服务端,所述方法可以包括以下步骤:
步骤110:根据历史交易数据构建目标服务商的交易关系图;其中,所述交易关系图由所述目标服务商拓展的卖方节点、与所述卖方节点发生交易的买方节点构成,发生交易的卖方节点和买方节点之间通过边表示关联关系。
一般的,随着移动支付业务的发展,服务端或者服务端连接的数据库中会记录有历史交易数据。这部分历史交易数据主要包含了交易相关的数据,例如包括交易的买家、卖家、交易金额、交易时间等。
在获取到历史交易数据后,可以根据所述历史交易数据构建目标服务商的交易关系图。
一般的在数据处理中,数据实体可以被抽象为节点,数据实体之间的联系可以被抽象为边,利用这些节点和边就可以从而构建一张图(本说明书中的“图”和“网络”具有相同的意思,可以互换使用)。对应本说明书中,卖方数据可以抽象为卖方节点,买方数据可以抽象为买方节点;对于存在交易的卖方和买方之间可以通过一条无向边表示关联关系。由所述目标服务商拓展的卖方节点、与所述卖方节点发生交易的买方节点,以及这些发生交易的卖方节点和买方节点之间的边就可以构建一张交易关系图。
需要说明的是,所述历史交易数据通常包含多个服务商,本说明书可以对每个服务商单独构建交易关系图,本实施例以单个服务商的角度进行描述,因此构图只需要考虑单个服务商拓展的所有商户的所有交易。实际上服务端可以并行构建多个服务商的交易关系图;并且每个服务商的识别过程都是相同的。
步骤120:统计所述交易关系图中至少三阶的子图的数量;其中,所述子图由相邻买方节点和卖方节点构成。
交易关系图能够直观展示服务商拓展的卖家与买家之间发生的交易;但无法直接提供卖家与买家之间存在虚假交易的线索。因此,本说明书立足于交易关系图,通过交易关系图中的局部结构从另一个角度来挖掘图中蕴含的信息。
通常认为图是由边和节点构成的,但换一个视角也可以认为节点和边先构成了图中的基本结构单元,例如三角形、四边形等,然后再由这些基本结构单元构成整个图。而子图(Graphlet)就属于图的基本结构单元。
按照基本结构单元中节点的数量和各个节点的度数进行分类,如图2所示可以得到三阶、四阶、五阶总共29种Graphlet。
其中,三阶的Graphlet是指只有3个节点的连通子图。如图2中的g1和g2就是三阶的Graphlet。三阶Graphlet只有这2种。
四阶的Graphlet是指只有4个节点的连通子图。如图2中的g3-g8就是四阶的Graphlet。四阶Graphlet有6种。
五阶的Graphlet是指只有5个节点的连通子图。如图2中的g9-g29就是五阶的Graphlet。五阶Graphlet有21种。
对于一个完整大图来说,如果只考虑3个相连通的节点的构成的局部子图,那就可以统计出不同类型的三阶Graphlet的数量。同理,也可以统计出四阶、五阶Graphlet的数量。
值得一提的是,Graphlet的种类数量会随着基本结构单元包含的节点数量的增加而指数增加;例如含有5个节点的Graphlet有21个,假如允许6个节点的基本结构单元作为Graphlet,则会在原来的基础上再增加112种Graphlet。可见,节点数量的增加,即增加了判断所需的计算量,又增加了需要判断的Graphlet种类。结合以上两点,为了避免计算开销过大,计算Graphlet频率分布时,通常将5个节点及以内的基本结构单元作为Graphlet。在计算资源足够的情况下,也可以将6阶子图、7阶子图等作为需要统计的Graphlet种类。
在本说明书中,由于交易关系图是描述了买家和卖家之间交易关系的图,因而天然的存在买家节点和卖家节点这两种节点的属性,每个节点只能是买家或者卖家中的一种。再结合交易场景,由于节点属性的存在,边只可能存在于买家节点和卖家节点之间,买家节点和买家节点之间不存在边,卖家和卖家之间也不存在边。在这一前提下,所述交易关系图的子图结构与无属性节点的关系图的子图结构有所不同。
请参考图3所示的交易关系图的三阶和四阶的子图结构的示意图。其中,黑色实心圈表示买家节点,黑色空心圈表示卖家节点,买家节点和卖家节点之间的连线表示交易的边。图3中,三阶Graphlet只有a1和a2这2种。四阶Graphlet只有a3-a6这4种。相对于无属性节点关系图,Graphlet的数量显著减少。
考虑交易场景下,虚假交易涉及到的节点数量有限,不同卖方常常共用同一批买方;因此实际应用中,可以不统计高阶的Graphlet,通过统计部分低阶的Graphlet也可以识别异常的服务商。并且,越高阶的Graphlet的数量越多,统计所需计算资源也越多。为此,在一实施例中可以统计交易关系图中三阶和四阶总共6种Graphlet的数量。
在一实施例中,统计所述交易关系图中至少三阶的子图的数量,具体可以包括:
搜索所有包含3个节点的Graphlet,通过查看节点之间是否相互连接(存在边),确定搜索到的基本结构单元属于哪一种Graphlet。对于包含4个节点的Graphlet,算法利用4个节点与3个节点的Graphlet在结构上的相似性,减少了判断包含4个节点的Graphlet种类在计算上的开销。
另一种实施例中,统计所述交易关系图中至少三阶的子图的数量,可以采用Graft算法统计。该算法在引入了误差的情况下,实现了加速Graphlet的统计过程。在统计各种Graphlet出现次数的过程中,Graft算法按照一定的概率随机地选择关系图中的边,然后以这条边为中心,向附近搜索找出所有包含这条边的Graphlet。这种方法在采样时,采样得到的两条边可能属于同一个Graphlet,容易造成Graphlet的重复计数。因此算法在采样后可以对得到的Graphlet数量进行了修正。另外,有些种类的Graphlet在结构上是对称的,利用结构的对称性能够提高搜索的效率。由于一些种类的Graphlet在结构上互相相似,因此Graft算法在搜索时,利用这种相似性,可以同时搜索多个Graphlet。
步骤130:根据每阶子图的数量和所有阶子图的总数量,计算所述交易关系图的子图频率分布。
在统计出每阶子图的数量后,可以用每阶Graphlet的数量除以所有的Graphlet数量,计算出每阶Graphlet在交易关系图中出现的频率,并将其称作Graphlet频率分布(GFD,graphlet frequency distribution)。
在一实施例中,在所述至少三阶的子图为三阶子图和四阶子图时,根据每阶子图的数量和所有阶子图的总数量,计算所述交易关系图的子图频率分布,具体包括:
将三阶子图的数量除以三阶四阶子图的总数量,确定所述三阶子图的频率;
将四阶子图的数量除以三阶四阶子图的总数量,确定所述四阶子图的频率;
将所述三阶子图的频率和四阶子图的频率进行拼接,确定所述交易关系图的子图频率分布。
在一种实现中,可以使用开源工具GraphCrunch和GraphCrunch2统计出图中的Graphlet数量。这些开源工具可以自动遍历图中所有的Graphlet并且生成GFD。
本说明书中的子图频率分布也可以称为子图频率向量。
步骤140:根据所述子图频率分布,确定所述目标服务商是否为异常服务商。其中,所述异常服务商具体可以是指制造虚假交易的服务商。
由于Graphlet是交易关系图的子结构特征的反应,相当于交易关系图的指纹信息。通常的,如果一个异常服务商有意操纵一批买家账号进行交易时,可能会使用这一批买家账号去拓展的卖家那进行交易;如此,会呈现出多卖家共享同一批买家的情况。参考图3所示的例子,比如子图结构a5的占比可能会显著增加。因此,所述步骤140,具体可以包括:
如果所述子图频率分布中,预设子图结构的频率大于预设频率,则确定所述目标服务商为异常服务商。
一般的,通过比较多个服务商,如果某个服务商的子图频率分布显著的不同于其他服务商的子图频率分布,那么这个服务商也很有可能是异常的服务商。因此,所述步骤140,具体可以包括:
利用异常检查算法计算所述子图频率分布的异常分值;
在所述异常分值达到阈值时,确定所述目标服务商是否为异常服务商。
其中,所述异常检测算法可以包括Isolation forest;通过该算法可以对子图频率分布进行打分。如果打分高于阈值,认定为异常服务商,作为告警信息输出。
其中,所述阈值可以是人为预设的经验值。还可以是由不同服务商的异常分值共同计算得出。具体地,在获取到多个正常服务商的异常分值之后,可以计算这些正常服务商的异常分值的平均值。将该平均值确定为阈值。
通过上述实施例,利用服务商拓展的卖家与买家之间的交易构建交易关系图,基于交易关系图中子图结构这个特征来准确识别异常服务商。无需额外收集标签信息,识别成功更低,更为方便;且无需特别设计业务相关的特征,对算法工程师没有特殊要求。
与前述风险识别方法实施例相对应,本说明书还提供了风险识别装置的实施例。所述装置实施例可以通过软件实现,也可以通过硬件或者软硬件结合的方式实现。以软件实现为例,作为一个逻辑意义上的装置,是通过其所在设备的处理器将非易失性存储器中对应的计算机业务程序指令读取到内存中运行形成的。从硬件层面而言,如图4所示,为本说明书风险识别装置所在设备的一种硬件结构图,除了图4所示的处理器、网络接口、内存以及非易失性存储器之外,实施例中装置所在的设备通常根据风险识别实际功能,还可以包括其他硬件,对此不再赘述。
请参见图5,为本说明书一实施例提供的风险识别装置的模块图,所述装置对应了图1所示实施例,所述装置包括:
构建单元310,根据历史交易数据构建目标服务商的交易关系图;其中,所述交易关系图由所述目标服务商拓展的卖方节点、与所述卖方节点发生交易的买方节点构成,发生交易的卖方节点和买方节点之间通过边表示关联关系;
统计单元320,统计所述交易关系图中至少三阶的子图的数量;其中,所述子图由相邻买方节点和卖方节点构成;
计算单元330,根据每阶子图的数量和所有阶子图的总数量,计算所述交易关系图的子图频率分布;
识别单元340,根据所述子图频率分布,确定所述目标服务商是否为异常服务商。
可选的,所述识别单元340,具体包括:
利用异常检查算法计算所述子图频率分布的异常分值;在所述异常分值达到阈值时,确定所述目标服务商是否为异常服务商。
可选的,所述阈值由不同服务商的异常分值共同计算得出。
可选的,所述计算方式为计算所述不同服务商的异常分值的均值。
可选的,在所述至少三阶的子图为三阶子图和四阶子图时,所述计算单元330,具体包括:
将三阶子图的数量除以三阶四阶子图的总数量,确定所述三阶子图的频率;将四阶子图的数量除以三阶四阶子图的总数量,确定所述四阶子图的频率;根据所述三阶子图的频率和四阶子图的频率,确定所述交易关系图的子图频率分布。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机,计算机的具体形式可以是个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件收发设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任意几种设备的组合。
上述装置中各个单元的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本说明书方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上图5描述了风险识别装置的内部功能模块和结构示意,其实质上的执行主体可以为一种电子设备,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
根据历史交易数据构建目标服务商的交易关系图;其中,所述交易关系图由所述目标服务商拓展的卖方节点、与所述卖方节点发生交易的买方节点构成,发生交易的卖方节点和买方节点之间通过边表示关联关系;
统计所述交易关系图中至少三阶的子图的数量;其中,所述子图由相邻买方节点和卖方节点构成;
根据每阶子图的数量和所有阶子图的总数量,计算所述交易关系图的子图频率分布;
根据所述子图频率分布,确定所述目标服务商是否为异常服务商。
在上述电子设备的实施例中,应理解,该处理器可以是中央处理单元(英文:Central Processing Unit,简称:CPU),还可以是其他通用处理器、数字信号处理器(英文:Digital Signal Processor,简称:DSP)、专用集成电路(英文:Application SpecificIntegrated Circuit,简称:ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,而前述的存储器可以是只读存储器(英文:read-only memory,缩写:ROM)、随机存取存储器(英文:random access memory,简称:RAM)、快闪存储器、硬盘或者固态硬盘。结合本说明书实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于电子设备实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本领域技术人员在考虑说明书及实践这里公开的实施例后,将容易想到本说明书的其它实施方案。本说明书旨在涵盖本说明书的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本说明书的一般性原理并包括本说明书未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本说明书的真正范围和精神由下面的权利要求指出。
应当理解的是,本说明书并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本说明书的范围仅由所附的权利要求来限制。

Claims (11)

1.一种风险识别方法,所述方法包括:
根据历史交易数据构建目标服务商的交易关系图;其中,所述交易关系图由所述目标服务商拓展的卖方节点、与所述卖方节点发生交易的买方节点构成,发生交易的卖方节点和买方节点之间通过边表示关联关系;
统计所述交易关系图中至少三阶的子图的数量;其中,所述子图由相邻买方节点和卖方节点构成;
根据每阶子图的数量和所有阶子图的总数量,计算所述交易关系图的子图频率分布;
根据所述子图频率分布,确定所述目标服务商是否为异常服务商。
2.根据权利要求1所述的方法,所述根据所述子图频率分布,确定所述目标服务商是否为异常服务商,具体包括:
利用异常检查算法计算所述子图频率分布的异常分值;
在所述异常分值达到阈值时,确定所述目标服务商是否为异常服务商。
3.根据权利要求2所述的方法,所述阈值由不同服务商的异常分值共同计算得出。
4.根据权利要求3所述的方法,所述计算方式为计算所述不同服务商的异常分值的均值。
5.根据权利要求1所述的方法,在所述至少三阶的子图为三阶子图和四阶子图时,根据每阶子图的数量和所有阶子图的总数量,计算所述交易关系图的子图频率分布,具体包括:
将三阶子图的数量除以三阶四阶子图的总数量,确定所述三阶子图的频率;
将四阶子图的数量除以三阶四阶子图的总数量,确定所述四阶子图的频率;
根据所述三阶子图的频率和四阶子图的频率,确定所述交易关系图的子图频率分布。
6.一种风险识别装置,所述装置包括:
构建单元,根据历史交易数据构建目标服务商的交易关系图;其中,所述交易关系图由所述目标服务商拓展的卖方节点、与所述卖方节点发生交易的买方节点构成,发生交易的卖方节点和买方节点之间通过边表示关联关系;
统计单元,统计所述交易关系图中至少三阶的子图的数量;其中,所述子图由相邻买方节点和卖方节点构成;
计算单元,根据每阶子图的数量和所有阶子图的总数量,计算所述交易关系图的子图频率分布;
识别单元,根据所述子图频率分布,确定所述目标服务商是否为异常服务商。
7.根据权利要求6所述的装置,所述识别单元,具体包括:
利用异常检查算法计算所述子图频率分布的异常分值;在所述异常分值达到阈值时,确定所述目标服务商是否为异常服务商。
8.根据权利要求7所述的装置,所述阈值由不同服务商的异常分值共同计算得出。
9.根据权利要求8所述的装置,所述计算方式为计算所述不同服务商的异常分值的均值。
10.根据权利要求6所述的装置,在所述至少三阶的子图为三阶子图和四阶子图时,所述计算单元,具体包括:
将三阶子图的数量除以三阶四阶子图的总数量,确定所述三阶子图的频率;将四阶子图的数量除以三阶四阶子图的总数量,确定所述四阶子图的频率;根据所述三阶子图的频率和四阶子图的频率,确定所述交易关系图的子图频率分布。
11.一种电子设备,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为上述权利要求1-5中任一项所述的方法。
CN201911212256.8A 2019-12-02 2019-12-02 风险识别方法及装置和电子设备 Pending CN111126788A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911212256.8A CN111126788A (zh) 2019-12-02 2019-12-02 风险识别方法及装置和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911212256.8A CN111126788A (zh) 2019-12-02 2019-12-02 风险识别方法及装置和电子设备

Publications (1)

Publication Number Publication Date
CN111126788A true CN111126788A (zh) 2020-05-08

Family

ID=70496530

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911212256.8A Pending CN111126788A (zh) 2019-12-02 2019-12-02 风险识别方法及装置和电子设备

Country Status (1)

Country Link
CN (1) CN111126788A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112527840A (zh) * 2020-12-15 2021-03-19 航天信息股份有限公司 医药行业两票制监控方法、装置、可读介质及电子设备
CN114564525A (zh) * 2022-04-28 2022-05-31 支付宝(杭州)信息技术有限公司 基于用户交易数据挖掘用户意图的方法和装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180012159A1 (en) * 2016-07-06 2018-01-11 International Business Machines Corporation System, method, and recording medium for risk optimization through equipment, user, and site modeling
US20180103052A1 (en) * 2016-10-11 2018-04-12 Battelle Memorial Institute System and methods for automated detection, reasoning and recommendations for resilient cyber systems
CN107918905A (zh) * 2017-11-22 2018-04-17 阿里巴巴集团控股有限公司 异常交易识别方法、装置及服务器
CN109086975A (zh) * 2018-07-10 2018-12-25 阿里巴巴集团控股有限公司 一种交易风险的识别方法和装置
CN110163612A (zh) * 2019-04-02 2019-08-23 阿里巴巴集团控股有限公司 一种支付风控方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180012159A1 (en) * 2016-07-06 2018-01-11 International Business Machines Corporation System, method, and recording medium for risk optimization through equipment, user, and site modeling
US20180103052A1 (en) * 2016-10-11 2018-04-12 Battelle Memorial Institute System and methods for automated detection, reasoning and recommendations for resilient cyber systems
CN107918905A (zh) * 2017-11-22 2018-04-17 阿里巴巴集团控股有限公司 异常交易识别方法、装置及服务器
CN109086975A (zh) * 2018-07-10 2018-12-25 阿里巴巴集团控股有限公司 一种交易风险的识别方法和装置
CN110163612A (zh) * 2019-04-02 2019-08-23 阿里巴巴集团控股有限公司 一种支付风控方法及装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112527840A (zh) * 2020-12-15 2021-03-19 航天信息股份有限公司 医药行业两票制监控方法、装置、可读介质及电子设备
CN112527840B (zh) * 2020-12-15 2024-05-28 航天信息股份有限公司 医药行业两票制监控方法、装置、可读介质及电子设备
CN114564525A (zh) * 2022-04-28 2022-05-31 支付宝(杭州)信息技术有限公司 基于用户交易数据挖掘用户意图的方法和装置
CN114564525B (zh) * 2022-04-28 2022-07-29 支付宝(杭州)信息技术有限公司 基于用户交易数据挖掘用户意图的方法和装置

Similar Documents

Publication Publication Date Title
TWI673666B (zh) 資料風險控制的方法及裝置
US11636290B2 (en) Systems and methods for determining features of entities based on centrality metrics of the entities in a knowledge graph
WO2021254027A1 (zh) 一种可疑社团的识别方法、装置、存储介质和计算机设备
US20160364727A1 (en) System and method for identifying compromised accounts
CN114154588A (zh) 异常交易检测模型的训练以及异常交易检测的方法和装置
CN111814910B (zh) 异常检测方法、装置、电子设备及存储介质
US20140316960A1 (en) Merchant bank tool
CN111260368A (zh) 一种账户交易风险判断方法、装置及电子设备
CN112801498A (zh) 风险识别模型的训练方法、风险识别方法、装置及设备
CN111062642A (zh) 对象的行业风险程度识别方法、装置以及电子设备
CN111611390B (zh) 一种数据处理方法及装置
CN111126788A (zh) 风险识别方法及装置和电子设备
CN110458571B (zh) 一种信息泄露的风险识别方法、装置及设备
CN108985755B (zh) 一种账号状态识别方法、装置及服务器
CN114118816A (zh) 一种风险评估方法、装置、设备及计算机存储介质
WO2019095569A1 (zh) 基于微博财经事件的金融分析方法、应用服务器及计算机可读存储介质
US20150066773A1 (en) Claim rate black box
CN112669053A (zh) 基于销售数据的欺诈群体识别方法、装置、设备及介质
CN106326228A (zh) 评估用户的兴趣倾向的方法和装置
CN111340622A (zh) 一种异常交易集群的检测方法及装置
WO2023043937A1 (en) Model-based analysis of intellectual property collateral
CN111401959B (zh) 风险群体的预测方法、装置、计算机设备及存储介质
CN114418776A (zh) 一种数据处理方法、装置、终端设备及介质
CN112685610A (zh) 虚假注册账号识别方法及相关装置
CN111784512A (zh) 银企对账流程处理方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200508