CN111428217B - 欺诈团伙识别方法、装置、电子设备及计算机可读存储介质 - Google Patents

欺诈团伙识别方法、装置、电子设备及计算机可读存储介质 Download PDF

Info

Publication number
CN111428217B
CN111428217B CN202010282673.6A CN202010282673A CN111428217B CN 111428217 B CN111428217 B CN 111428217B CN 202010282673 A CN202010282673 A CN 202010282673A CN 111428217 B CN111428217 B CN 111428217B
Authority
CN
China
Prior art keywords
user
determining
information
identified
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010282673.6A
Other languages
English (en)
Other versions
CN111428217A (zh
Inventor
蒋菱
王恩典
陈浩
曾甜玲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Citic Bank Corp Ltd
Original Assignee
China Citic Bank Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Citic Bank Corp Ltd filed Critical China Citic Bank Corp Ltd
Priority to CN202010282673.6A priority Critical patent/CN111428217B/zh
Publication of CN111428217A publication Critical patent/CN111428217A/zh
Application granted granted Critical
Publication of CN111428217B publication Critical patent/CN111428217B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Finance (AREA)
  • Software Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Accounting & Taxation (AREA)
  • Technology Law (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Computer Hardware Design (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Storage Device Security (AREA)

Abstract

本申请提供了一种欺诈团伙识别方法、装置、电子设备及计算机可读存储介质,应用于图神经网络技术领域,其中该方法包括:通过图神经网络基于目标用户(其中目标用户为欺诈可能性较高的用户)与关联用户的设备共用图构建的邻接矩阵,确定欺诈团伙,解决了欺诈团伙的识别问题;此外,先从用户集合中确定至少一个目标用户,然后分别基于各个目标用户进行设备共享图的构建,继而进行欺诈团伙的识别,避免全局构图,减少了数据的计算量。

Description

欺诈团伙识别方法、装置、电子设备及计算机可读存储介质
技术领域
本申请涉及图神经网络技术领域,具体而言,本申请涉及一种欺诈团伙识别方法、装置、电子设备及计算机可读存储介质。
背景技术
随着我国信用卡业务的发展和发卡量的大量增长,信用卡的风险也日益凸显,信用卡坏账率呈上升走势,其中欺诈申请造成的坏账占比很大,如何有效识别这些欺诈申请成为了一个问题。
目前,信用卡欺诈申请是通过身份认证的方式实现的,即业务人员对信用卡申请人员提供的信息进行审核,如果提供的是虚假信息,则会被认定为欺诈申请。然而,现有的通过身份认证识别欺诈申请的方式,不能识别出一人冒充多人身份进行信用卡的欺诈申请情形。
发明内容
本申请提供了一种欺诈团伙识别方法、装置、电子设备及计算机可读存储介质,用于解决一人冒充多人身份的欺诈申请识别问题,本申请采用的技术方案如下:
第一方面,提供了一种欺诈团伙识别方法,该方法包括,
从用户集合中确定至少一个目标用户;
确定至少一个目标用户中任一目标用户的终端设备使用信息,以及确定终端设备的关联用户;
基于任一目标用户的终端设备使用信息以及终端设备的关联用户,确定任一目标用户与关联用户的邻接矩阵;
基于邻接矩阵以及预训练的图神经网络确定团伙信息,团伙信息包括关联用户信息;
基于确定的团伙信息通过预定的业务规则,确定团伙是否为欺诈团伙。
可选地,所述基于所述邻接矩阵以及预训练的图神经网络确定团伙信息,所述团伙信息包括关联用户信息,包括:
基于所述邻接矩阵通过预训练的图神经网络确定所述任一目标用户与所述关联用户的关联权重矩阵;
基于预定的阈值对所述关联权重矩阵进行切割,得到切割后的关联权重矩阵;
基于所述切割后的关联权重矩阵确定团伙信息。
可选地,所述从用户集合中确定至少一个目标用户,包括:
从所述用户集合中确定待识别用户,并获取待识别用户的用户相关信息;
基于所述待识别用户的用户相关信息与预训练的GBDT分类器确定所述待识别用户是否为目标用户。
可选地,所述基于所述待识别用户的用户相关信息与预训练的GBDT分类器确定所述待识别用户是否为目标用户,包括:
基于所述待识别用户的用户相关信息通过Boost-tree算法确定公共特征;
基于所述待识别用户的用户相关信息与所述公共特征,通过预训练的GBDT分类器确定待识别用户是否为目标用户。
可选地,所述基于确定的所述团伙信息通过预定的业务规则,确定所述团伙是否为欺诈团伙,包括以下至少一项:
基于所述团伙信息确定所述团伙包括的目标用户的数量,基于所述团伙包括的目标用户的数量确定所述团伙是否为欺诈团伙;
基于所述团伙信息确定所述团伙包括的用户的数量,基于所述团伙包括的用户的数量确定所述团伙是否为欺诈团伙。
第二方面,提供了一种欺诈团伙识别装置,该装置包括,
第一确定模块,用于从用户集合中确定至少一个目标用户;
第二确定模块,用于确定所述至少一个目标用户中任一目标用户的终端设备使用信息,以及确定所述终端设备的关联用户;
第三确定模块,用于基于所述任一目标用户的终端设备使用信息以及所述终端设备的关联用户,确定所述任一目标用户与所述关联用户的邻接矩阵;
第四确定模块,用于基于所述邻接矩阵以及预训练的图神经网络确定团伙信息,所述团伙信息包括关联用户信息;
第五确定模块,用于基于确定的所述团伙信息通过预定的业务规则,确定所述团伙是否为欺诈团伙。
可选地,所述第四确定模块包括:
第一确定单元,用于基于所述邻接矩阵通过预训练的图神经网络确定所述任一目标用户与所述关联用户的关联权重矩阵;
切割单元,用于基于预定的阈值对所述关联权重矩阵进行切割,得到切割后的关联权重矩阵;
第二确定单元,用于基于所述切割后的关联权重矩阵确定团伙信息。
可选地,所述第一确定模块包括:
第三确定单元,用于从所述用户集合中确定待识别用户,并获取待识别用户的用户相关信息;
第四确定单元,用于基于所述待识别用户的用户相关信息与预训练的GBDT分类器确定所述待识别用户是否为目标用户。
可选地,所述第四确定单元包括:
第一确定子单元,永不基于所述待识别用户的用户相关信息通过Boost-tree算法确定公共特征;
第二确定子单元,用于基于所述待识别用户的用户相关信息与所述公共特征,通过预训练的GBDT分类器确定待识别用户是否为目标用户。
可选地,所述第五确定模块,具体用于基于所述团伙信息确定所述团伙包括的目标用户的数量,基于所述团伙包括的目标用户的数量确定所述团伙是否为欺诈团伙;
和/或,具体用于基于所述团伙信息确定所述团伙包括的用户的数量,基于所述团伙包括的用户的数量确定所述团伙是否为欺诈团伙。
第三方面,提供了一种电子设备,该电子设备包括:
一个或多个处理器;
存储器;
一个或多个应用程序,其中一个或多个应用程序被存储在存储器中并被配置为由一个或多个处理器执行,一个或多个程序配置用于:执行第一方面所示的欺诈团伙识别方法。
第四方面,提供了一种计算机可读存储介质,计算机存储介质用于存储计算机指令,当其在计算机上运行时,使得计算机可以执行第一方面所示的欺诈团伙识别方法。
本申请提供了一种欺诈团伙识别方法、装置、电子设备及计算机可读存储介质,与现有技术通过身份认证的方式实现欺诈申请的识别相比,本申请通过从用户集合中确定至少一个目标用户,确定至少一个目标用户中任一目标用户的终端设备使用信息,以及确定终端设备的关联用户,基于任一目标用户的终端设备使用信息以及终端设备的关联用户,确定任一目标用户与关联用户的邻接矩阵,基于邻接矩阵以及预训练的图神经网络确定团伙信息,团伙信息包括关联用户信息,基于确定的团伙信息通过预定的业务规则,确定团伙是否为欺诈团伙。即本申请通过图神经网络基于目标用户(其中目标用户为欺诈可能性较高的用户)与关联用户的设备共用图构建的邻接矩阵,确定欺诈团伙,解决了欺诈团伙的识别问题;此外,先从用户集合中确定至少一个目标用户,然后分别基于各个目标用户进行设备共享图的构建,继而进行欺诈团伙的识别,避免全局构图,减少了数据的计算量。
本申请附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本申请实施例的一种欺诈团伙识别方法的流程示意图;
图2为本申请实施例的一种欺诈团伙识别装置的结构示意图;
图3为本申请实施例的一种团伙示例图;
图4为本申请实施例的一种电子设备的结构示意图;
图5为本申请实施例的正则化处理的示例图。
具体实施方式
下面详细描述本申请的实施例,各实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能解释为对本申请的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”和“该”也可包括复数形式。应该进一步理解的是,本申请的说明书中使用的措辞“包括”是指存在特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
本申请实施例提供了一种欺诈团伙识别方法,如图1所示,该方法可以包括以下步骤:
步骤S101,从用户集合中确定至少一个目标用户;
具体地,从用户集合中确定至少一个目标用户;其中,该用户集合可以为申请信用卡的用户的集合,申请贷款用户的集合,也可以是其他需要进行风控反欺诈场景下的用户集合;其中,该目标用户为欺诈风险较高的用户。
其中,用户集合可以包括用户的相关信息,该相关信息包括但不限于用户的基本信息(性别、年龄、信用卡好、持卡时间等)、用户的消费转账情况、消费地点、使用的终端设备信息(如手机、PAD等)等。
具体地,可以通过相应的信息或或数据分析方法,基于用户的相关信息,从用户集合中确定至少一个目标用户,其中,该相应的信息或或数据分析方法可以是基于大数据的分析方法、基于神经网络模型的高危用户(欺诈可能性较高的用户)识别方法等,本申请此处不做限定。
步骤S102,确定所述至少一个目标用户中任一目标用户的终端设备使用信息,以及确定所述终端设备的关联用户;
具体地,目标用户可以为多个,可以分别基于各个目标用户进行欺诈团伙的识别;
具体地,基于其中一个目标用户进行欺诈团伙识别的步骤可以包括:确定任一目标用户的终端识别使用信息,其中,该终端设备可以包括手机、PAD、可穿戴设备、POS机、PC终端以及其他能实现本申请功能的终端设备,其中,终端设备使用信息包括设备使用时长信息、使用次数信息等;
具体地,可以获取该任一目标用户使用的终端设备的其他关联用户,其中,可以基于终端识别的IMEI确定是否使用了同一终端设备。
步骤S103,基于所述任一目标用户的终端设备使用信息以及所述终端设备的关联用户,确定所述任一目标用户与所述关联用户的邻接矩阵;
具体地,基于任一目标用户与关联用户之间的设备使用信息确定所述任一目标用户与所述关联用户的邻接矩阵。
具体地,如果有任一目标用户与关联用户共用设备的情况,则邻接矩阵中对应位置的位置有对应值。对应值的大小,由用户设备共用情况决定。示例性地,用t1表示白天两用户登录设备的时长,t2表示晚上两用户登录设备的时长,时长可以均以小时为单位,q表示两用户共同登录的次数,则邻接矩阵中,对应两用户的关联由公式1给定:
具体地,基于任一目标用户与各个关联用户根据设备公共情况确定对应值,基于确定的任一目标用户与各个关联用户的对应值确定邻接矩阵。
步骤S104,基于所述邻接矩阵以及预训练的图神经网络确定团伙信息,所述团伙信息包括关联用户信息;
其中,图神经网络(Graph Neural Networks,GNN),GNN可以有效地建模系统中对象之间的关系或交互。
具体地,可以基于任一目标用户与关联用户的邻接矩阵确定团伙信息,其中团伙可以包括该任一目标用户与关联用户信息,其中关联用户可以为多个,该关联用户信息可以是从关联用户中筛选出来的与任一目标用户关联度较高的用户的信息。示例性地,确定出的团伙可以如图3所示。
步骤S105,基于确定的所述团伙信息通过预定的业务规则,确定所述团伙是否为欺诈团伙。
具体地,基于预定的业务规则根据团伙中的用户的信息判断确定出的团伙是否为欺诈团伙。
示例性地,本申请实施例的欺诈团伙识别方法应用于信用卡反欺诈领域,信用卡反欺诈,是制定风控策略的重要依据,是控制金融风险的关键。传统的反欺诈方法,将反欺诈团伙发现问题定义为一个聚类问题,基于用户都刷卡行为,消费行为等特征,使用kmeans,决策树等方法进行判断。但是,由于欺诈行为隐蔽性强,手法专业,且往往都是团伙作案,单独从用户的刷卡消费行为以及转账行为往往并不能有效的区分正常用户和诈欺用户,然而,通过调研发现,账户与账户之间的关系,账户与设备之间的关系,往往更加稳定且难以隐藏。
本申请实施例提供了一种欺诈团伙识别方法,与现有技术通过身份认证的方式实现欺诈申请的识别相比,本申请通过从用户集合中确定至少一个目标用户,确定至少一个目标用户中任一目标用户的终端设备使用信息,以及确定终端设备的关联用户,基于任一目标用户的终端设备使用信息以及终端设备的关联用户,确定任一目标用户与关联用户的邻接矩阵,基于邻接矩阵以及预训练的图神经网络确定团伙信息,团伙信息包括关联用户信息,基于确定的团伙信息通过预定的业务规则,确定团伙是否为欺诈团伙。即本申请通过图神经网络基于目标用户(其中目标用户为欺诈可能性较高的用户)与关联用户的设备共用图构建的邻接矩阵,确定欺诈团伙,解决了欺诈团伙的识别问题;此外,先从用户集合中确定至少一个目标用户,然后分别基于各个目标用户进行设备共享图的构建,继而进行欺诈团伙的识别,避免全局构图,减少了数据的计算量。
本申请实施例提供了一种可能的实现方式,步骤S104包括:
步骤S1041(图中未示出),基于所述邻接矩阵通过预训练的图神经网络确定所述任一目标用户与所述关联用户的关联权重矩阵;
步骤S1042(图中未示出),基于预定的阈值对所述关联权重矩阵进行切割,得到切割后的关联权重矩阵;
步骤S1043(图中未示出),基于所述切割后的关联权重矩阵确定团伙信息。
本申请实施例,解决了如何通过图神经网络确定团伙的问题。
本申请实施例提供了一种可能的实现方式,具体地,步骤S101包括:
步骤S1011(图中未示出),从所述用户集合中确定待识别用户,并获取待识别用户的用户相关信息;
步骤S1012(图中未示出),基于所述待识别用户的用户相关信息与预训练的GBDT分类器确定所述待识别用户是否为目标用户。
其中,GBDT(Gradient Boosting Decision Tre,梯度提升决策树),GBDT通过采用加法模型(即基函数的线性组合),以及不断减小训练过程产生的残差来达到将数据分类或者回归的算法。
具体地,从用户集合中确定待识别用户,并通过预训练的GBDT分类器确定待识别用户是否为目标用户,解决了目标用户的确定问题。
本申请实施例提供了一种可能的实现方式,步骤S1012(图中未示出)包括:
基于所述待识别用户的用户相关信息通过Boost-tree算法确定公共特征;
基于所述待识别用户的用户相关信息与所述公共特征,通过预训练的GBDT分类器确定待识别用户是否为目标用户。
具体地,基于所述待识别用户的用户相关信息通过Boost-tree算法确定公共特征(即进行正则化处理),然后将确定的公共特征与待识别用户的原始特征进行拼接得到组合特征,继而将组合特征输入预训练的GBDT确定待识别用户是否为目标用户,其中,该原始特征可以是基于用户的用户相关信息得到的,如可以是基于用户相关信息进行one hot编码得到的向量表达、也可以是通过词嵌入方法得到的向量表达。
示例性地,在确定目标用户阶段,输入模型的信息包括用户的基本信息(如用户姓名,年龄,办卡时间,手机号),用户的消费信息(每个月信用卡消费的金额,消费的次数)以及部分跟信用卡绑定的储蓄卡的转账情况(转账账号,每个月转账金额,转账次数)。但实际情况,并不是所有用户都可以拿到设定的所有特征,同时,GBDT也无法处理规模太大的数据,可以通过如图5所示的架构进行正则化处理。在模型的训练过程中,基于多个用户(图中示例性的给出的任务1、2、3)的特征通过boost tree算法确定用户的公共特征(即图中的residual),然后将用户的原始特征与分别确定的residual拼接得到组合特征,进行GBDT分类器的训练。在boost-tree算法中,每棵树被顺序建立,在划分一个节点的时候,需要找到一个切割点。用IL和IR分别表示一个节点的左孩子节点和右孩子节点的示例集合,节点的切割值分数计算方法公式2所示:
其中,gi为boost-tree算法损失函数的一阶导数,hi为损失函数的二阶导数,λ和γ为常量。由于需要构建一个共同的增强树模型,而不同任务的数据量大小可能会有很大的差异,因此,公式2计算出的总分很容易被样本量较大的任务所支配,样本量较小的任务可能被忽略,具体来说,对于每个任务t,损失分数只能通过等式2中的任务特定实例来计算,因此,如果不同任务的样本大小不平衡,则总得分由多数任务支配,所选分割点仅与少数任务相关,这就意味着对于样本量较小的任务来说,在公共部分构建的树没有好处。
示例性地,GBTD的训练可以包括:GBTD通过多轮迭代,每轮迭代产生一个弱分类器,每个分类器在上一轮分类器的残差基础上进行训练,对弱分类器的要求一般是足够简单,并且是低方差和高偏差的,因为训练的过程是通过降低偏差来不断提高最终分类器的精度。弱分类器可以选择CART TREE(也就是分类回归树),由于上述高偏差和简单的要求,每个分类回归树的深度不会很深,最终的总分类器是将每轮训练得到的弱分类器加权求和得到的(也就是加法模型)。
对于本申请实施例,解决了目标用户的确定问题,其中,通过正则化处理可以减少GBDT分类的计算量。
本申请实施例提供了一种可能的实现方式,具体地,步骤S105包括以下至少一项:
基于所述团伙信息确定所述团伙包括的目标用户的数量,基于所述团伙包括的目标用户的数量确定所述团伙是否为欺诈团伙;
基于所述团伙信息确定所述团伙包括的用户的数量,基于所述团伙包括的用户的数量确定所述团伙是否为欺诈团伙。
具体地,基于所述团伙信息确定所述团伙包括的目标用户的数量或包括的用户的总数量,基于团伙包括的目标用户的数量或包括的用户的总数量确定团伙是否为欺诈团伙。
示例性地,引进两条业务规则对最终的诈骗团伙进行判断,业务规则可以是由业务经验获得:
1、如果团伙的规模大于5个用户,则确定为欺诈团伙;
2、如果团伙包括三个以上目标用户,则团伙确定为欺诈团伙。
对于本申请示例,解决了如何根据团伙信息确定是否为欺诈团伙的问题。
图2为本申请实施例提供的一种欺诈团伙识别装置,该装置20包括:第一确定模块201、第二确定模块202、第三确定模块203、第四确定模块204以及第五确定模块205,其中,
第一确定模块201,用于从用户集合中确定至少一个目标用户;
第二确定模块202,用于确定所述至少一个目标用户中任一目标用户的终端设备使用信息,以及确定所述终端设备的关联用户;
第三确定模块203,用于基于所述任一目标用户的终端设备使用信息以及所述终端设备的关联用户,确定所述任一目标用户与所述关联用户的邻接矩阵;
第四确定模块204,用于基于所述邻接矩阵以及预训练的图神经网络确定团伙信息,所述团伙信息包括关联用户信息;
第五确定模块205,用于基于确定的所述团伙信息通过预定的业务规则,确定所述团伙是否为欺诈团伙。
本申请实施例提供了一种欺诈团伙识别装置,与现有技术通过身份认证的方式实现欺诈申请的识别相比,本申请通过从用户集合中确定至少一个目标用户,确定至少一个目标用户中任一目标用户的终端设备使用信息,以及确定终端设备的关联用户,基于任一目标用户的终端设备使用信息以及终端设备的关联用户,确定任一目标用户与关联用户的邻接矩阵,基于邻接矩阵以及预训练的图神经网络确定团伙信息,团伙信息包括关联用户信息,基于确定的团伙信息通过预定的业务规则,确定团伙是否为欺诈团伙。即本申请通过图神经网络基于目标用户(其中目标用户为欺诈可能性较高的用户)与关联用户的设备共用图构建的邻接矩阵,确定欺诈团伙,解决了欺诈团伙的识别问题;此外,先从用户集合中确定至少一个目标用户,然后分别基于各个目标用户进行设备共享图的构建,继而进行欺诈团伙的识别,避免全局构图,减少了数据的计算量。
本实施例的欺诈团伙识别装置可执行本申请上述实施例中提供的一种欺诈团伙识别方法,其实现原理相类似,此处不再赘述。
本申请实施例提供了一种可能的实现方式,具体地,所述第四确定模块包括:
第一确定单元,用于基于所述邻接矩阵通过预训练的图神经网络确定所述任一目标用户与所述关联用户的关联权重矩阵;
切割单元,用于基于预定的阈值对所述关联权重矩阵进行切割,得到切割后的关联权重矩阵;
第二确定单元,用于基于所述切割后的关联权重矩阵确定团伙信息。
本申请实施例,解决了如何通过图神经网络确定团伙的问题。
本申请实施例提供了一种可能的实现方式,具体地,所述第一确定模块包括:
第三确定单元,用于从所述用户集合中确定待识别用户,并获取待识别用户的用户相关信息;
第四确定单元,用于基于所述待识别用户的用户相关信息与预训练的GBDT分类器确定所述待识别用户是否为目标用户。
具体地,从用户集合中确定待识别用户,并通过预训练的GBDT分类器确定待识别用户是否为目标用户,解决了目标用户的确定问题。
本申请实施例提供了一种可能的实现方式,具体地,所述第四确定单元包括:
第一确定子单元,永不基于所述待识别用户的用户相关信息通过Boost-tree算法确定公共特征;
第二确定子单元,用于基于所述待识别用户的用户相关信息与所述公共特征,通过预训练的GBDT分类器确定待识别用户是否为目标用户。
对于本申请实施例,解决了目标用户的确定问题,其中,通过正则化处理可以减少GBDT分类的计算量。
本申请实施例提供了一种可能的实现方式,具体地,所述第五确定模块,具体用于基于所述团伙信息确定所述团伙包括的目标用户的数量,基于所述团伙包括的目标用户的数量确定所述团伙是否为欺诈团伙;
和/或,具体用于基于所述团伙信息确定所述团伙包括的用户的数量,基于所述团伙包括的用户的数量确定所述团伙是否为欺诈团伙。
对于本申请示例,解决了如何根据团伙信息确定是否为欺诈团伙的问题。
本申请实施例提供了一种电子设备,如图4所示,图4所示的电子设备40包括:处理器401和存储器403。其中,处理器401和存储器403相连,如通过总线402相连。进一步地,电子设备40还可以包括收发器404。需要说明的是,实际应用中收发器404不限于一个,该电子设备40的结构并不构成对本申请实施例的限定。其中,处理器401应用于本申请实施例中,用于实现图2所示模块的功能。收发器404包括接收机和发射机。
处理器401可以是CPU,通用处理器,DSP,ASIC,FPGA或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器401也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等。
总线402可包括一通路,在上述组件之间传送信息。总线402可以是PCI总线或EISA总线等。总线402可以分为地址总线、数据总线、控制总线等。为便于表示,图4中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
存储器403可以是ROM或可存储静态信息和指令的其他类型的静态存储设备,RAM或者可存储信息和指令的其他类型的动态存储设备,也可以是EEPROM、CD-ROM或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。
存储器403用于存储执行本申请方案的应用程序代码,并由处理器401来控制执行。处理器401用于执行存储器403中存储的应用程序代码,以实现图2或图3所示实施例提供的欺诈团伙识别装置的功能。
本申请实施例提供了一种电子设备,与现有技术通过身份认证的方式实现欺诈申请的识别相比,本申请通过从用户集合中确定至少一个目标用户,确定至少一个目标用户中任一目标用户的终端设备使用信息,以及确定终端设备的关联用户,基于任一目标用户的终端设备使用信息以及终端设备的关联用户,确定任一目标用户与关联用户的邻接矩阵,基于邻接矩阵以及预训练的图神经网络确定团伙信息,团伙信息包括关联用户信息,基于确定的团伙信息通过预定的业务规则,确定团伙是否为欺诈团伙。即本申请通过图神经网络基于目标用户(其中目标用户为欺诈可能性较高的用户)与关联用户的设备共用图构建的邻接矩阵,确定欺诈团伙,解决了欺诈团伙的识别问题;此外,先从用户集合中确定至少一个目标用户,然后分别基于各个目标用户进行设备共享图的构建,继而进行欺诈团伙的识别,避免全局构图,减少了数据的计算量。
本申请实施例提供了一种电子设备适用于上述方法实施例。在此不再赘述。
本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现上述实施例中所示的方法。
本申请实施例提供了一种计算机可读存储介质,与现有技术通过身份认证的方式实现欺诈申请的识别相比,本申请通过从用户集合中确定至少一个目标用户,确定至少一个目标用户中任一目标用户的终端设备使用信息,以及确定终端设备的关联用户,基于任一目标用户的终端设备使用信息以及终端设备的关联用户,确定任一目标用户与关联用户的邻接矩阵,基于邻接矩阵以及预训练的图神经网络确定团伙信息,团伙信息包括关联用户信息,基于确定的团伙信息通过预定的业务规则,确定团伙是否为欺诈团伙。即本申请通过图神经网络基于目标用户(其中目标用户为欺诈可能性较高的用户)与关联用户的设备共用图构建的邻接矩阵,确定欺诈团伙,解决了欺诈团伙的识别问题;此外,先从用户集合中确定至少一个目标用户,然后分别基于各个目标用户进行设备共享图的构建,继而进行欺诈团伙的识别,避免全局构图,减少了数据的计算量。
本申请实施例提供了一种计算机可读存储介质适用于上述方法实施例。在此不再赘述。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
以上仅是本申请的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

Claims (7)

1.一种欺诈团伙识别方法,其特征在于,包括:
从用户集合中确定至少一个目标用户;
确定所述至少一个目标用户中任一目标用户的终端设备使用信息,以及确定所述终端设备的关联用户;
基于所述任一目标用户的终端设备使用信息以及所述终端设备的关联用户,确定所述任一目标用户与所述关联用户的邻接矩阵;
基于所述邻接矩阵以及预训练的图神经网络确定团伙信息,所述团伙信息包括关联用户信息;
基于确定的所述团伙信息通过预定的业务规则,确定所述团伙是否为欺诈团伙;
所述从用户集合中确定至少一个目标用户,包括:从所述用户集合中确定待识别用户,并获取待识别用户的用户相关信息;基于所述待识别用户的用户相关信息与预训练的GBDT分类器确定所述待识别用户是否为目标用户;
所述基于所述待识别用户的用户相关信息与预训练的GBDT分类器确定所述待识别用户是否为目标用户,包括:基于所述待识别用户的用户相关信息通过Boost-tree算法确定公共特征;基于所述待识别用户的用户相关信息与所述公共特征,通过预训练的GBDT分类器确定待识别用户是否为目标用户;
所述基于所述待识别用户的用户相关信息与所述公共特征通过预训练的GBDT分类器确定待识别用户是否为目标用户,包括将所述公共特征与待识别用户的原始特征进行拼接得到组合特征,将所述组合特征输入至预训练的GBDT确定待识别用户是否为目标用户;
所述原始特征包括基于所述待识别用户的用户相关信息进行one-hot编码得到的向量表达、通过词嵌入方法得到的向量表达。
2.根据权利要求1所述的方法,其特征在于,所述基于所述邻接矩阵以及预训练的图神经网络确定团伙信息,所述团伙信息包括关联用户信息,包括:
基于所述邻接矩阵通过预训练的图神经网络确定所述任一目标用户与所述关联用户的关联权重矩阵;
基于预定的阈值对所述关联权重矩阵进行切割,得到切割后的关联权重矩阵;
基于所述切割后的关联权重矩阵确定团伙信息。
3.根据权利要求1-2任一项所述的方法,其特征在于,所述基于确定的所述团伙信息通过预定的业务规则,确定所述团伙是否为欺诈团伙,包括以下至少一项:
基于所述团伙信息确定所述团伙包括的目标用户的数量,基于所述团伙包括的目标用户的数量确定所述团伙是否为欺诈团伙;
基于所述团伙信息确定所述团伙包括的用户的数量,基于所述团伙包括的用户的数量确定所述团伙是否为欺诈团伙。
4.一种欺诈团伙识别装置,其特征在于,包括:
第一确定模块,用于从用户集合中确定至少一个目标用户;
第二确定模块,用于确定所述至少一个目标用户中任一目标用户的终端设备使用信息,以及确定所述终端设备的关联用户;
第三确定模块,用于基于所述任一目标用户的终端设备使用信息以及所述终端设备的关联用户,确定所述任一目标用户与所述关联用户的邻接矩阵;
第四确定模块,用于基于所述邻接矩阵以及预训练的图神经网络确定团伙信息,所述团伙信息包括关联用户信息;
第五确定模块,用于基于确定的所述团伙信息通过预定的业务规则,确定所述团伙是否为欺诈团伙;
所述第一确定模块包括:第三确定单元,用于从所述用户集合中确定待识别用户,并获取待识别用户的用户相关信息;第四确定单元,用于基于所述待识别用户的用户相关信息与预训练的GBDT分类器确定所述待识别用户是否为目标用户;
所述第四确定单元包括:第一确定子单元,用于基于所述待识别用户的用户相关信息通过Boost-tree算法确定公共特征;第二确定子单元,用于基于所述待识别用户的用户相关信息与所述公共特征,通过预训练的GBDT分类器确定待识别用户是否为目标用户。
5.根据权利要求4所述的装置,其特征在于,所述第四确定模块包括:
第一确定单元,用于基于所述邻接矩阵通过预训练的图神经网络确定所述任一目标用户与所述关联用户的关联权重矩阵;
切割单元,用于基于预定的阈值对所述关联权重矩阵进行切割,得到切割后的关联权重矩阵;
第二确定单元,用于基于所述切割后的关联权重矩阵确定团伙信息。
6.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储器;
一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于:执行根据权利要求1至3任一项所述的欺诈团伙识别方法。
7.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储计算机指令,当其在计算机上运行时,使得计算机执行上述权利要求1至3中任一项所述的欺诈团伙识别方法。
CN202010282673.6A 2020-04-12 2020-04-12 欺诈团伙识别方法、装置、电子设备及计算机可读存储介质 Active CN111428217B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010282673.6A CN111428217B (zh) 2020-04-12 2020-04-12 欺诈团伙识别方法、装置、电子设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010282673.6A CN111428217B (zh) 2020-04-12 2020-04-12 欺诈团伙识别方法、装置、电子设备及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN111428217A CN111428217A (zh) 2020-07-17
CN111428217B true CN111428217B (zh) 2023-07-28

Family

ID=71553865

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010282673.6A Active CN111428217B (zh) 2020-04-12 2020-04-12 欺诈团伙识别方法、装置、电子设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN111428217B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112487286B (zh) * 2020-11-23 2024-05-28 中信银行股份有限公司 目标用户确定方法、装置、系统、电子设备及介质
CN112580668B (zh) * 2020-12-24 2022-10-18 西安深信科创信息技术有限公司 一种背景欺诈检测方法、装置及电子设备
CN113159778B (zh) * 2020-12-24 2023-11-24 西安四叶草信息技术有限公司 一种金融欺诈的检测方法及装置
CN114418780B (zh) * 2022-03-11 2022-08-09 太平金融科技服务(上海)有限公司深圳分公司 欺诈团伙识别方法、装置、计算机设备和存储介质
CN114723574A (zh) * 2022-04-06 2022-07-08 平安科技(深圳)有限公司 基于人工智能的保险反欺诈识别方法、装置、设备及介质
CN115243268A (zh) * 2022-07-20 2022-10-25 中国联合网络通信集团有限公司 一种团体诈骗关系识别方法、系统及可读存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8245282B1 (en) * 2008-08-19 2012-08-14 Eharmony, Inc. Creating tests to identify fraudulent users
CN107403326A (zh) * 2017-08-14 2017-11-28 云数信息科技(深圳)有限公司 一种基于电信数据的保险欺诈识别方法及装置

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107657536B (zh) * 2017-02-20 2018-07-31 平安科技(深圳)有限公司 社保欺诈行为的识别方法和装置
CN107292424B (zh) * 2017-06-01 2020-01-21 四川新网银行股份有限公司 一种基于复杂社交网络的反欺诈和信用风险预测方法
CN107633067B (zh) * 2017-09-21 2020-03-27 北京工业大学 一种基于人员行为规律和数据挖掘方法的群体识别方法
CN109961296A (zh) * 2017-12-25 2019-07-02 腾讯科技(深圳)有限公司 商户类型识别方法及装置
CN108681936B (zh) * 2018-04-26 2021-11-02 浙江邦盛科技有限公司 一种基于模块度和平衡标签传播的欺诈团伙识别方法
CN109816519A (zh) * 2019-01-25 2019-05-28 宜人恒业科技发展(北京)有限公司 一种欺诈团伙识别方法、装置及设备
CN109919624B (zh) * 2019-02-28 2020-09-22 杭州师范大学 一种基于时空集中性的网贷欺诈团伙识别与预警方法
CN110046929B (zh) * 2019-03-12 2023-06-20 平安科技(深圳)有限公司 一种欺诈团伙识别方法、装置、可读存储介质及终端设备
CN110070364A (zh) * 2019-03-27 2019-07-30 北京三快在线科技有限公司 基于图模型检测团伙欺诈的方法和装置、存储介质
CN110097472B (zh) * 2019-05-08 2022-12-27 腾讯科技(深圳)有限公司 一种社团属性识别方法及相关设备
CN110245875A (zh) * 2019-06-21 2019-09-17 深圳前海微众银行股份有限公司 欺诈风险评估方法、装置、设备及存储介质
CN110413707A (zh) * 2019-07-22 2019-11-05 百融云创科技股份有限公司 互联网中欺诈团伙关系的挖掘与排查方法及其系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8245282B1 (en) * 2008-08-19 2012-08-14 Eharmony, Inc. Creating tests to identify fraudulent users
CN107403326A (zh) * 2017-08-14 2017-11-28 云数信息科技(深圳)有限公司 一种基于电信数据的保险欺诈识别方法及装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
The Research on Fraud Group Mining Which Based on Social Network Analysis;Zhi-juan Jia等;《 2017 29th Chinese Control And Decision Conference (CCDC)》;全文 *
基于社交网络的犯罪团伙发现算法研究;潘潇等;《软件导刊》;第17卷(第12期);全文 *
点击欺诈群体检测与发现;董亚楠等;《计算机应用研究》;第33卷(第6期);全文 *

Also Published As

Publication number Publication date
CN111428217A (zh) 2020-07-17

Similar Documents

Publication Publication Date Title
CN111428217B (zh) 欺诈团伙识别方法、装置、电子设备及计算机可读存储介质
CN111291816B (zh) 针对用户分类模型进行特征处理的方法及装置
CN107133865B (zh) 一种信用分的获取、特征向量值的输出方法及其装置
CN109766454A (zh) 一种投资者分类方法、装置、设备及介质
CN113011646B (zh) 一种数据处理方法、设备以及可读存储介质
CN113011889B (zh) 账号异常识别方法、系统、装置、设备及介质
CN113240505B (zh) 图数据的处理方法、装置、设备、存储介质及程序产品
CN110929836B (zh) 神经网络训练及图像处理方法和装置、电子设备、介质
CN110428139A (zh) 基于标签传播的信息预测方法及装置
CN110020866B (zh) 一种识别模型的训练方法、装置及电子设备
CN113656699B (zh) 用户特征向量确定方法、相关设备及介质
CN107451854A (zh) 确定用户类型的方法及装置、电子设备
CN111353554B (zh) 预测缺失的用户业务属性的方法及装置
CN111242319A (zh) 模型预测结果的解释方法和装置
CN112669143A (zh) 基于关联网络的风险评估方法、装置、设备以及存储介质
CN110969441A (zh) 基于深度学习的反欺诈模型处理方法及装置
CN111091408A (zh) 用户识别模型创建方法、装置与识别方法、装置
CN113592593A (zh) 序列推荐模型的训练及应用方法、装置、设备及存储介质
CN115511606A (zh) 对象识别方法、装置、设备及存储介质
CN112364198A (zh) 一种跨模态哈希检索方法、终端设备及存储介质
CN114443958A (zh) 一种推荐方法、推荐系统及推荐系统训练方法
CN111859057B (zh) 数据特征处理方法及数据特征处理装置
CN111967973B (zh) 银行客户数据处理方法及装置
CN111984842B (zh) 银行客户数据处理方法及装置
CN116720214A (zh) 一种用于隐私保护的模型训练方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant