CN112070506A - 风险用户识别方法、装置、服务器及存储介质 - Google Patents

风险用户识别方法、装置、服务器及存储介质 Download PDF

Info

Publication number
CN112070506A
CN112070506A CN202010896516.4A CN202010896516A CN112070506A CN 112070506 A CN112070506 A CN 112070506A CN 202010896516 A CN202010896516 A CN 202010896516A CN 112070506 A CN112070506 A CN 112070506A
Authority
CN
China
Prior art keywords
user
risk
features
behavior
preset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010896516.4A
Other languages
English (en)
Inventor
黎相麟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Kaniu Technology Co ltd
Original Assignee
Shenzhen Kaniu Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Kaniu Technology Co ltd filed Critical Shenzhen Kaniu Technology Co ltd
Priority to CN202010896516.4A priority Critical patent/CN112070506A/zh
Publication of CN112070506A publication Critical patent/CN112070506A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/40Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
    • G06Q20/401Transaction verification
    • G06Q20/4016Transaction verification involving fraud or risk level assessment in transaction processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例公开了一种风险用户识别方法、装置、服务器及存储介质。该方法包括:获取目标用户的用户行为特征;将所述用户行为特征输入预设的深度学习网络模型得到预设维度的用户行为向量;将所述用户行为向量与预设的风险行为向量匹配得到匹配相似度;若所述匹配相似度大于等于预设相似度阈值则确定所述目标用户为风险用户。本发明实施例能够基于用户行为特征深度分析,通过由行为特征得到的行为向量识别风险用户,识别精度更高,且不容易被规避措施规避。

Description

风险用户识别方法、装置、服务器及存储介质
技术领域
本发明涉及计算机技术领域,尤其涉及一种风险用户识别方法、装置、服务器及存储介质。
背景技术
随着互联网技术的发展,利用互联网进行用户间的交易(例如产品交易、服务交易等)越来越普遍。为了保障利用互联网进行交易的安全性,需要识别出风险用户(例如经营欺诈网站的广告主、经营非法产品的商家、伪造信息骗贷的用户等),以避免与风险用户进行交易等行为带来的损失。目前在对风险用户进行识别时,大多通过采集用户的历史行为数据,利用机器学习的方法训练出行为风险识别模型,然后直接使用用户实际的行为数据由行为风险识别模型进行风险识别,这种方法对于行为数据没有具体的挖掘,使用的数据量非常庞大,其他方式包括提取用户的行为特征,与风险用户的行为特征比对进行风险识别,这种方法由于行为特征的具体表现形式局限,容易被风险用户规避。
发明内容
有鉴于此,本发明提供了一种风险用户识别方法,能够基于用户行为特征深度分析,通过由行为特征得到的行为向量识别风险用户,识别精度更高,且不容易被规避措施规避。
为解决上述技术问题,本发明采用以下技术方案:
第一方面,本发明提供了一种风险用户识别方法,包括:
获取目标用户的用户行为特征;
将所述用户行为特征输入预设的深度学习网络模型得到预设维度的用户行为向量;
将所述用户行为向量与预设的风险行为向量匹配得到匹配相似度;
若所述匹配相似度大于等于预设相似度阈值则确定所述目标用户为风险用户。
第二方面,本发明提供了一种风险用户识别装置,包括:
行为特征获取模块,用于获取目标用户的行为特征;
用户行为向量确定模块,用于将所述行为特征输入预设的深度学习网络模型得到预设维度的用户行为向量;
匹配模块,用于将所述用户行为向量与预设的风险行为向量匹配得到匹配相似度;
风险用户识别模块,用于若所述匹配相似度大于等于预设相似度阈值则确定所述目标用户为风险用户。
第三方面,本发明提供了一种服务器,包括存储器和处理器,所述存储器上存储有可在处理器运行的计算机程序,所述处理器执行所述计算机程序时实现如本发明任一实施例提供的风险用户识别方法。
第四方面,本发明提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被执行时实现如本发明任一实施例提供的风险用户识别方法。
本发明提供的风险用户识别方法,对获取到的用户行为特征通过预设的深度学习网络模型转化为预设维度的用户行为向量,进而根据用户行为向量匹配风险行为向量得到匹配相似度,根据匹配相似度识别风险用户,通过深度语义识别的方式识别风险用户,而不是局限于词句式的行为特征识别风险用户,可以更有效的避免风险用户的规避措施,提高风险用户识别准确率。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见的,下面描述中的附图仅仅是本申请的部分实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1是本发明实施例一提供的一种风险用户识别方法的流程图;
图2是本发明实施例一提供的一种风险用户识别方法的子流程图;
图3是本发明实施例二提供的一种风险用户识别方法的子流程图;
图4是本发明实施例二提供的一种风险用户识别方法的子流程图;
图5是本发明实施例二提供的一种风险用户识别方法的子流程图;
图6是本发明实施例二提供的一种风险用户识别方法的子流程图;
图7是本发明实施例三提供的一种欺诈识别装置的结构示意图;
图8是本发明实施例四提供的一种服务器的结构示意图。
具体实施方式
下面结合本申请实施例中的附图,对本申请实施中的技术方案进行清楚、完整的描述。可以理解的是,此处所描述的具体实施例仅仅是本申请一部分实施例,而不是全部的实施例,仅用于解释本申请,而非对本申请的限定。另外还需要说明的是,基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中使用的术语只是为了描述具体的实施方式的目的,不是旨在于限制本发明。本文所使用的术语“和/或”包括一个或多个相关的所列项目的任意的和所有的组合。
此外,术语“第一”、“第二”等可在本文中用于描述各种方向、动作、步骤或元件等,但这些方向、动作、步骤或元件不受这些术语限制。这些术语仅用于将第一个方向、动作、步骤或元件与另一个方向、动作、步骤或元件区分。术语“第一”、“第二”等而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者多个特征的组合。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。需要说明的是,当一个部被称为“固定于”另一个部,它可以直接在另一个部上也可以存在居中的部。当一个部被认为是“连接”到另一个部,它可以是直接连接到另一个部或者可能同时存在居中部。本文所使用的术语“垂直的”、“水平的”、“左”、“右”以及类似的表述,只是为了说明的目的,并不表示是唯一的实施方式。
在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各步骤描述成顺序的处理,但是其中的许多步骤可以被并行地、并发地或者同时实施。此外,各步骤的顺序可以被重新安排。当其操作完成时处理可以被终止,但是还可以具有未包括在附图中的附加步骤。处理可以对应于方法、函数、规程、子例程、子程序等等。
实施例一
参见图1,本实施例提供了一种风险用户识别方法,该方法可以由终端或服务器执行,也可以通过服务器与终端的交互完成,本实施例中以服务器为例进行说明,具体的,该方法包括以下步骤:
S110、获取目标用户的用户行为特征。
目标用户为待识别的用户,用户行为特征为根据用户行为数据得到的用于描述用户行为的文本信息,可以通过数据埋点等方式获取。行为数据可以根据风险类型有所不同,如针对金融欺诈风险,行为数据可以为用户的资金流动数据,文本信息为描述用户资金流动的词、句等。
具体的,本实施例中服务器可以根据用户的操作数据具体化用户的操作行为,得到用户行为特征。
本实施例中,服务器得到的包括用户稠密特征和用户稀疏特征,用户行为特征由用户稠密特征和用户稀疏特征交叉得到,步骤S110如图2所示具体包括步骤S111-112:
S111、获取目标用户的用户稠密特征和用户稀疏特征。
用户稠密特征维度较低,一般包括传统的特征,如用户的人口统计学信息,例如性别、年龄、健康状况、职业、婚姻、文化水平、收入等偏静态的特征;用户稀疏特征的维度很高,用户稀疏特征如用户的行为序列等用于刻画用户实时行为的特征,用户稠密特征是相对于用户稀疏特征而言的,二者没有具体的界限,实际可以根据情况不同自行设置。
具体的,服务器在通过数据埋点获取用户的行为数据,对用户的行为数据处理得到不同维度的行为特征,根据实际情况将其分为用户稠密特征和用户稀疏特征。
S112、对所述用户稠密特征和用户稀疏特征进行拼接得到所述用户行为特征。
用户稀疏特征维度较高,后续直接处理会导致维度暴增,因此需要对其进行降维并与用户稠密特征拼接,作为一体的用户行为特征进行后续分析。具体的,服务器在得到用户稠密特征和用户稀疏特征后,对用户稠密特征进行one-hot编码操作,再对用户稀疏特征进行embedding降维到低维空间,将处理后的用户稠密特征和用户稀疏特征进行拼接,即可得到用户行为特征。
其中,对用户稠密特征进行one-hot编码是因为后续识别风险用户时是基于向量空间中的度量来进行计算的,为了使非偏序关系的变量取值不具有偏序性,并且到圆点是等距的。使用one-hot编码,将离散特征的取值扩展到了欧式空间,离散特征的某个取值就对应欧式空间的某个点。将离散型特征使用one-hot编码,会让特征之间的距离计算更加合理。离散特征进行one-hot编码后,编码后的特征,其实每一维度的特征都可以看做是连续的特征。就可以跟对连续型特征的归一化方法一样,对每一维特征进行归一化。Embedding是深度学习领域的常用手段,用于将把高维原始数据(如图像和句子,本实施例中用户稀疏特征为句子)映射到低维流形,使得高维的原始数据被映射到低维流形之后变得可分。
S120、将所述用户行为特征输入预设的深度学习网络模型得到预设维度的用户行为向量。
预设的深度学习网络模型可以由多层网络构成,用于将用户行为特征转化为预设维度的行为向量,预设维度可以根据实际需求自行设置。用户行为向量已经把用户行为特征中文字的位置信息抛弃了,是一个预设维度的低维语义向量。
具体的,服务器中设置有预设的深度学习网络模型,服务器在得到用户行为特征后,直接将用户行为特征输入深度学习网络模型,得到固定长度的用户行为向量。
S130、将所述用户行为向量与预设的风险行为向量匹配得到匹配相似度。
预设的风险行为向量为根据风险用户的行为特征得到的行为向量,其可以根据识别的风险用户增加而不断增加。匹配相似度用于表示用户行为向量与风险行为向量的相似程度,相似程度越高说明用户行为向量与风险行为向量越符合,即目标用户是风险用户的可能性越大。
服务器在得到用户行为向量后,利用用户行为向量与预设的风险行为向量匹配,计算得到匹配相似度。
S140、若所述匹配相似度大于等于预设相似度阈值则确定所述目标用户为风险用户。
预设相似度阈值为用于根据匹配相似度识别风险用户的标准,当匹配相似度大于等于预设相似度阈值则判定目标用户为风险用户,反之则目标用户不是风险用户。预设相似度阈值可以根据实际情况不同有所不同,例如需要识别的风险类型不同,则对应不同的预设相似度阈值。
示例性的,在一个实施例中,根据用户行为向量与预设的风险行为向量匹配得到匹配相似度的具体计算方式采用cos相似度计算方法,具体包括:将所述用户行为向量与风险行为向量输入余弦相似度公式得到相似度R(A,B),所述相似度R(A,B)计算过程如下式:
Figure BDA0002658570060000081
其中,n表示预设维度,Ai表示用户行为向量的在第i个维度的分向量,Bi表示风险行为向量在第i个维度的分向量。
本实施例提供了一种风险用户识别方法,对获取到的用户行为特征通过预设的深度学习网络模型转化为预设维度的用户行为向量,进而根据用户行为向量匹配风险行为向量得到匹配相似度,根据匹配相似度识别风险用户,通过深度语义识别的方式识别风险用户,而不是局限于词句式的行为特征识别风险用户,可以更有效的避免风险用户的规避措施,提高风险用户识别准确率。
实施例二
实施例二提供了一种风险用户识别方法,其与实施例一的区别在于,进一步详细解释了对用户稠密特征和用户稀疏特征进行拼接的过程,以及风险行为向量的获取过程,具体包括:
如图3-5所示,分别为步骤S112的三种示例,图3为步骤S112的第一种示例,包括步骤S1121-1122:
S1121、对所述用户稀疏特征进行词嵌入转化并进行交叉得到交叉特征。
S1122、对所述用户稠密特征和所述交叉特征进行拼接得到所述用户行为特征。
用户稀疏特征经过词嵌入后,每个用户稀疏特征都被映射成了一个向量,不同类别向量之间经过交叉运算得到交叉特征,用户稠密特征直接与交叉特征拼接,拼接后的特征就是用户行为特征,作为深度学习网络模型的输入。
图4为步骤S112的第一种示例,包括步骤S1123-1125:
S1123、将所述用户稠密特征离散化得到离散特征。
S1124、对所述离散特征和所述用户稀疏特征进行词嵌入得到嵌入后离散矩阵和嵌入后稀疏矩阵。
S1125、对所述嵌入后离散矩阵和所述嵌入后稀疏矩阵进行拼接、交叉得到用户行为特征。
把用户稠密特征离散化,转换为离散特征,然后和用户稀疏特征都进行词嵌入,之后再进行特征交叉。此时可以发现,这样相当于用户稠密特征参加了特征交叉。
图5为步骤S112的第三种示例,包括步骤S1126-1128:
S1126、将所述用户稠密特征与对应的词嵌入矩阵相乘得到用户稠密矩阵。
S1127、将所述用户稀疏特征进行词嵌入得到用户稀疏矩阵。
S1128、对所述用户稠密矩阵和用户稀疏矩阵进行拼接、交叉得到用户行为特征。
对每个用户稠密特征x维护一个词嵌入向量e,然后把用户稠密特征和词嵌入向量e对应的权重向量(词嵌入矩阵)相乘得到最终的特征向量,相当于一个用户稠密特征映射成一个特征向量,之后和用户稀疏特征映射的词嵌入矩阵进行拼接。此时仍然可以发现,这样相当于用户稠密特征也和用户稀疏特征进行交叉特征提取。
如图6所示,为风险行为向量的获取过程,在步骤S130之前,包括步骤S150-170:
S150、获取风险用户的风险稠密特征和风险稀疏特征。
风险稠密特征和风险稀疏特征与用户稠密特征和用户稀疏特征对应,区别在于风险稠密特征和风险稀疏特征是基于风险用户的行为数据得到的。
S160、对所述风险稠密特征和风险稀疏特征进行拼接得到风险行为特征。
步骤S160的具体过程和步骤S112一致,区别在于将用户稠密特征和用户稀疏特征替代为风险稠密特征和风险稀疏特征,将用户行为特征替代为风险行为特征。
S170、将所述风险行为特征输入预设的深度学习网络模型得到预设维度的风险行为向量。
风险行为向量的维度和用户行为向量的维度必须一致,否则二者无法进行匹配计算。
可以理解的是,步骤S110-120和步骤S150-160的实际过程是类似的,二者可以使用同一深度学习网络模型,也可以使用不同的深度网络学习模型,但是必须保证深度学习网络模型输出的向量维度一致,即用户行为向量和风险行为向量的维度一致。
本实施例提供的一种风险用户识别方法,进一步提供了对用户稠密特征和用户稀疏特征进行拼接的过程,以及风险行为向量的获取过程,采用深度语义匹配的思想,创造性的将匹配结果用于表示目标用户与风险用户的匹配程度,实现了更准确的识别风险用户。
实施例三
图7为本发明实施例三提供的一种风险用户识别装置300的结构示意图,该装置包括:
行为特征获取模块310,用于获取目标用户的行为特征;
用户行为向量确定模块320,用于将所述行为特征输入预设的深度学习网络模型得到预设维度的用户行为向量;
匹配模块330,用于将所述用户行为向量与预设的风险行为向量匹配得到匹配相似度;
风险用户识别模块340,用于若所述匹配相似度大于等于预设相似度阈值则确定所述目标用户为风险用户。
可选的,在一些实施例中,行为特征获取模块310包括特征获取单元和特征拼接单元:
特征获取单元,用于获取目标用户的用户稠密特征和用户稀疏特征。
特征拼接单元,用于对所述用户稠密特征和用户稀疏特征进行拼接得到所述用户行为特征。
可选的,在一些实施例中,特征拼接单元具体用于:对所述用户稀疏特征进行词嵌入转化并进行交叉得到交叉特征;对所述用户稠密特征和所述交叉特征进行拼接得到所述用户行为特征。
可选的,在一些实施例中,特征拼接单元具体用于:将所述用户稠密特征离散化得到离散特征;对所述离散特征和所述用户稀疏特征进行词嵌入得到嵌入后离散矩阵和嵌入后稀疏矩阵;对所述嵌入后离散矩阵和所述嵌入后稀疏矩阵进行拼接、交叉得到用户行为特征。
可选的,在一些实施例中,特征拼接单元具体用于:将所述用户稠密特征与对应的词嵌入矩阵相乘得到用户稠密矩阵;将所述用户稀疏特征进行词嵌入得到用户稀疏矩阵;对所述用户稠密矩阵和用户稀疏矩阵进行拼接、交叉得到用户行为特征。
可选的,在一些实施例中,匹配模块330具体用于:将所述用户行为向量与风险行为向量输入余弦相似度公式得到相似度R(A,B),所述相似度R(A,B)计算过程如下式:
Figure BDA0002658570060000121
其中,n表示预设维度,Ai表示用户行为向量的在第i个维度的分向量,Bi表示风险行为向量在第i个维度的分向量。
可选的,在一些实施例中,风险用户识别装置300还包括风险特征获取模块、风险特征拼接模块和风险行为向量确定模块:
风险特征获取模块,用于获取风险用户的风险稠密特征和风险稀疏特征。
风险特征拼接模块,用于对所述风险稠密特征和风险稀疏特征进行拼接得到风险行为特征。
风险行为向量确定模块,用于将所述风险行为特征输入预设的深度学习网络模型得到预设维度的风险行为向量。
本实施例提供了一种风险用户识别装置,对获取到的用户行为特征通过预设的深度学习网络模型转化为预设维度的用户行为向量,进而根据用户行为向量匹配风险行为向量得到匹配相似度,根据匹配相似度识别风险用户,通过深度语义识别的方式识别风险用户,而不是局限于词句式的行为特征识别风险用户,可以更有效的避免风险用户的规避措施,提高风险用户识别准确率。
实施例四
图8为本发明实施例六提供的一种服务器400的结构示意图,如图8所示,该服务器包括存储器410、处理器420,服务器中处理器420的数量可以是一个或多个,图8中以一个处理器420为例;服务器中的存储器410、处理器420可以通过总线或其他方式连接,图8中以通过总线连接为例。
存储器410作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的风险用户识别方法对应的程序指令/模块(例如,风险用户识别装置中的行为特征获取模块310、用户行为向量确定模块320、匹配模块330和风险用户识别模块340)。处理器420通过运行存储在存储器410中的软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述的风险用户识别方法。
其中,所述处理器420用于运行存储在存储器410中的计算机可执行程序,以实现如下步骤:步骤S110、获取目标用户的用户行为特征;步骤S120、将所述用户行为特征输入预设的深度学习网络模型得到预设维度的用户行为向量;步骤S130、将所述用户行为向量与预设的风险行为向量匹配得到匹配相似度;步骤S140、若所述匹配相似度大于等于预设相似度阈值则确定所述目标用户为风险用户。
当然,本发明实施例所提供的一种服务器,该服务器不限于如上所述的方法操作,还可以执行本发明实施例任意实施例所提供的风险用户识别方法中的相关操作。
存储器410可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器410可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器410可进一步包括相对于处理器420远程设置的存储器,这些远程存储器可以通过网络连接至服务器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
本实施例提供了一种服务器,对获取到的用户行为特征通过预设的深度学习网络模型转化为预设维度的用户行为向量,进而根据用户行为向量匹配风险行为向量得到匹配相似度,根据匹配相似度识别风险用户,通过深度语义识别的方式识别风险用户,而不是局限于词句式的行为特征识别风险用户,可以更有效的避免风险用户的规避措施,提高风险用户识别准确率。
实施例五
本发明实施例五还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种风险用户识别方法,该风险用户识别方法包括:
获取目标用户的用户行为特征;
将所述用户行为特征输入预设的深度学习网络模型得到预设维度的用户行为向量;
将所述用户行为向量与预设的风险行为向量匹配得到匹配相似度;
若所述匹配相似度大于等于预设相似度阈值则确定所述目标用户为风险用户。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的风险用户识别方法中的相关操作。
通过以上关于实施方式的描述,所述领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,设备,或者网络设备等)执行本发明各个实施例所述的方法。
值得注意的是,上述授权装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (10)

1.一种风险用户识别方法,其特征在于,包括:
获取目标用户的用户行为特征;
将所述用户行为特征输入预设的深度学习网络模型得到预设维度的用户行为向量;
将所述用户行为向量与预设的风险行为向量匹配得到匹配相似度;
若所述匹配相似度大于等于预设相似度阈值则确定所述目标用户为风险用户。
2.根据权利要求1所述的方法,其特征在于,所述获取目标用户的用户行为特征包括:
获取目标用户的用户;
对所述用户稠密特征和用户稀疏特征进行拼接得到所述用户行为特征。
3.根据权利要求2所述的方法,其特征在于,所述对所述用户稠密特征和用户稀疏特征进行拼接得到所述用户行为特征包括:
对所述用户稀疏特征进行词嵌入转化并进行交叉得到交叉特征;
对所述用户稠密特征和所述交叉特征进行拼接得到所述用户行为特征。
4.根据权利要求2所述的方法,其特征在于,所述对所述用户稠密特征和用户稀疏特征进行拼接得到所述用户行为特征包括:
将所述用户稠密特征离散化得到离散特征;
对所述离散特征和所述用户稀疏特征进行词嵌入得到嵌入后离散矩阵和嵌入后稀疏矩阵;
对所述嵌入后离散矩阵和所述嵌入后稀疏矩阵进行拼接、交叉得到用户行为特征。
5.根据权利要求2所述的方法,其特征在于,所述对所述用户稠密特征和用户稀疏特征进行拼接得到所述用户行为特征包括:
将所述用户稠密特征与对应的词嵌入矩阵相乘得到用户稠密矩阵;
将所述用户稀疏特征进行词嵌入得到用户稀疏矩阵;
对所述用户稠密矩阵和用户稀疏矩阵进行拼接、交叉得到用户行为特征。
6.根据权利要求4所述的方法,其特征在于,所述将所述用户行为向量与预设的风险行为向量匹配得到匹配相似度包括:
将所述用户行为向量与风险行为向量输入余弦相似度公式得到相似度R(A,B),所述相似度R(A,B)计算过程如下式:
Figure FDA0002658570050000021
其中,n表示预设维度,Ai表示用户行为向量的在第i个维度的分向量,Bi表示风险行为向量在第i个维度的分向量。
7.根据权利要求1所述的方法,其特征在于,所述将所述用户行为向量与预设的风险行为向量匹配得到匹配相似度之前,还包括:
获取风险用户的风险稠密特征和风险稀疏特征;
对所述风险稠密特征和风险稀疏特征进行拼接得到风险行为特征;
将所述风险行为特征输入预设的深度学习网络模型得到预设维度的风险行为向量。
8.一种风险用户识别装置,其特征在于,包括:
行为特征获取模块,用于获取目标用户的行为特征;
用户行为向量确定模块,用于将所述行为特征输入预设的深度学习网络模型得到预设维度的用户行为向量;
匹配模块,用于将所述用户行为向量与预设的风险行为向量匹配得到匹配相似度;
风险用户识别模块,用于若所述匹配相似度大于等于预设相似度阈值则确定所述目标用户为风险用户。
9.一种服务器,其特征在于,包括存储器和处理器,所述存储器上存储有可在处理器运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1-7任意一项所述的风险用户识别方法。
10.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被执行时,实现如权利要求1-7任意一项所述的风险用户识别方法。
CN202010896516.4A 2020-08-31 2020-08-31 风险用户识别方法、装置、服务器及存储介质 Pending CN112070506A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010896516.4A CN112070506A (zh) 2020-08-31 2020-08-31 风险用户识别方法、装置、服务器及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010896516.4A CN112070506A (zh) 2020-08-31 2020-08-31 风险用户识别方法、装置、服务器及存储介质

Publications (1)

Publication Number Publication Date
CN112070506A true CN112070506A (zh) 2020-12-11

Family

ID=73665275

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010896516.4A Pending CN112070506A (zh) 2020-08-31 2020-08-31 风险用户识别方法、装置、服务器及存储介质

Country Status (1)

Country Link
CN (1) CN112070506A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113240304A (zh) * 2021-05-20 2021-08-10 北京百度网讯科技有限公司 特征构建方法、装置、设备以及存储介质
CN113781201A (zh) * 2021-08-19 2021-12-10 支付宝(杭州)信息技术有限公司 电子金融活动的风险评估方法和装置
CN113989043A (zh) * 2021-10-28 2022-01-28 支付宝(杭州)信息技术有限公司 一种事件的风险识别方法、装置及设备
CN116823274A (zh) * 2023-08-30 2023-09-29 杭银消费金融股份有限公司 一种应用于金融终端的欺诈风险评估方法及装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113240304A (zh) * 2021-05-20 2021-08-10 北京百度网讯科技有限公司 特征构建方法、装置、设备以及存储介质
CN113781201A (zh) * 2021-08-19 2021-12-10 支付宝(杭州)信息技术有限公司 电子金融活动的风险评估方法和装置
CN113989043A (zh) * 2021-10-28 2022-01-28 支付宝(杭州)信息技术有限公司 一种事件的风险识别方法、装置及设备
CN116823274A (zh) * 2023-08-30 2023-09-29 杭银消费金融股份有限公司 一种应用于金融终端的欺诈风险评估方法及装置
CN116823274B (zh) * 2023-08-30 2024-01-09 杭银消费金融股份有限公司 一种应用于金融终端的欺诈风险评估方法及装置

Similar Documents

Publication Publication Date Title
CN112070506A (zh) 风险用户识别方法、装置、服务器及存储介质
WO2021169111A1 (zh) 简历筛选方法、装置、计算机设备和存储介质
WO2020061489A1 (en) Training neural networks for vehicle re-identification
CN110033170B (zh) 识别风险商家的方法及装置
CN110334179B (zh) 问答处理方法、装置、计算机设备和存储介质
CN111858843B (zh) 一种文本分类方法及装置
CN110377733B (zh) 一种基于文本的情绪识别方法、终端设备及介质
CN110245714B (zh) 图像识别方法、装置及电子设备
CN113792526B (zh) 字符生成模型的训练方法、字符生成方法、装置和设备和介质
CN111090807A (zh) 一种基于知识图谱的用户识别方法及装置
CN105740808A (zh) 人脸识别方法和装置
CN116311214B (zh) 车牌识别方法和装置
EP3371739A1 (en) High speed reference point independent database filtering for fingerprint identification
CN110175500B (zh) 指静脉比对方法、装置、计算机设备及存储介质
CN114722794A (zh) 数据提取方法和数据提取装置
CN109657710B (zh) 数据筛选方法、装置、服务器及存储介质
CN113836297B (zh) 文本情感分析模型的训练方法及装置
CN114255381B (zh) 图像识别模型的训练方法、图像识别方法、装置及介质
CN115373982A (zh) 基于人工智能的测试报告分析方法、装置、设备及介质
CN114090781A (zh) 基于文本数据的容斥事件检测方法和装置
CN114117037A (zh) 意图识别方法、装置、设备和存储介质
CN110059180B (zh) 文章作者身份识别及评估模型训练方法、装置及存储介质
CN111694969A (zh) 一种用户身份识别方法及装置
CN109165097B (zh) 一种数据处理方法以及数据处理装置
CN112989815A (zh) 基于信息交互的文本相似度识别方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination