CN109801077A - 一种套现用户检测方法、装置及设备 - Google Patents
一种套现用户检测方法、装置及设备 Download PDFInfo
- Publication number
- CN109801077A CN109801077A CN201910052269.7A CN201910052269A CN109801077A CN 109801077 A CN109801077 A CN 109801077A CN 201910052269 A CN201910052269 A CN 201910052269A CN 109801077 A CN109801077 A CN 109801077A
- Authority
- CN
- China
- Prior art keywords
- user
- detected
- information
- arbitrage
- unique characteristics
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明实施例提供了一种套现用户检测方法、装置及设备,其中,该方法包括:获取各个待检测用户的自身特征信息以及各个待检测用户的交互信息,其中,针对各个待检测用户,该交互信息包括该待检测用户与其他待检测用户交互的信息和该待检测用户与待检测用户之外的其他对象交互的信息;针对各个待检测用户,根据该待检测用户的自身特征信息,以及该待检测用户的交互信息,确定该待检测用户的邻居特征信息;并将该待检测用户的自身特征信息和邻居特征信息,输入至注意力机制模型,得到该待检测用户套现的概率;其中,注意力机制模型是根据多个训练样本训练得到的。通过本发明实施例提供的套现用户检测方法、装置及设备,提高检测的准确性。
Description
技术领域
本发明涉及计算机技术领域,特别是涉及一种套现用户检测方法、装置及设备。
背景技术
信用支付服务如离线信用卡服务等,在商业银行和互联网金融机构的在线信用支付等许多方面都得到了广泛的应用。在日常生活中,信用支付服务为用户和商家带来便利。然而,不断增长的欺诈行为严重影响了信用支付服务的安全性。套现欺诈是用非法或不真诚的手段追求现金收益,例如,通过购买预付卡或其他商品,然后再出售。
随着电子商务的迅速发展,套现欺诈已经成为主要欺诈行为之一。套现欺诈行为是违法的可能会导致金融风险。因为在大多数情况下,进行套现欺诈行为的套现用户贷款违约的情况要高得多。因此,套现用户检测是金融机构欺诈侦查系统等的重要组成部分。
发明内容
本发明实施例的目的在于提供一种套现用户检测方法、装置及设备,以提高检测的准确性。具体技术方案如下:
第一方面,本发明实施例提供了一种套现用户检测方法,包括:
获取各个待检测用户的自身特征信息以及各个待检测用户的交互信息,其中,针对各个待检测用户,该交互信息包括该待检测用户与其他待检测用户交互的信息和该待检测用户与待检测用户之外的其他对象交互的信息;
针对各个待检测用户,根据该待检测用户的所述自身特征信息,以及该待检测用户的所述交互信息,确定该待检测用户的邻居特征信息;并将该待检测用户的所述自身特征信息和所述邻居特征信息,输入至注意力机制模型,得到该待检测用户套现的概率;其中,所述注意力机制模型是根据多个训练样本训练得到的。
可选的,训练所述注意力机制模型的步骤,包括:
获取多个训练样本;其中,所述训练样本中标记有所述训练样本包括的样本用户套现的概率;
针对各个训练样本,将该训练样本输入至预设注意力机制模型,对所述预设注意力机制模型进行训练,得到训练好的注意力机制模型。
可选的,在获取各个待检测用户的自身特征信息以及各个待检测用户的交互信息之后,所述方法还包括:
根据各个待检测用户的自身特征信息以及各个待检测用户的交互信息,构建属性异质信息网络AHIN;其中,所述AHIN中各个待检测用户位于多个元路径上,各个元路径分别连接待检测用户与该待检测用户的邻居。
可选的,所述根据该待检测用户的所述自身特征信息,以及该待检测用户的所述交互信息,确定该待检测用户的邻居特征信息,包括:
根据已构建的所述AHIN,确定该待检测用户的邻居;
根据所述邻居的特征信息,确定该待检测用户的所述邻居特征信息。
可选的,在所述根据已构建的所述AHIN,确定该待检测用户的邻居之后,所述方法还包括:
确定该待检测用户基于各个元路径的注意力权重;
所述根据所述邻居的特征信息,确定该待检测用户的所述邻居特征信息,包括:
针对各个元路径,将该元路径对应的注意力权重和第一特征信息作为第一邻居特征信息,其中,第一特征信息为该元路径连接的该待检测用户的邻居的特征信息;
将各个元路径分别得到的第一邻居特征信息作为该待检测用户的邻居特征信息。
可选的,在所述根据该待检测用户的所述自身特征信息,以及该待检测用户的所述交互信息,确定该待检测用户的邻居特征信息之后,所述方法还包括:
将所述自身特征信息和所述邻居特征信息进行融合,得到融合后的信息;
所述将该待检测用户的所述自身特征信息和所述邻居特征信息,输入至注意力机制模型,得到该待检测用户套现的概率,包括:
将所述融合后的信息输入至所述注意力机制模型,得到该待检测用户套现的概率。
第二方面,本发明实施例提供了一种套现用户检测装置,包括:
第一获取模块,用于获取各个待检测用户的自身特征信息以及各个待检测用户的交互信息,其中,针对各个待检测用户,该交互信息包括该待检测用户与其他待检测用户交互的信息和该待检测用户与待检测用户之外的其他对象交互的信息;
第一确定模块,用于针对各个待检测用户,根据该待检测用户的所述自身特征信息,以及该待检测用户的所述交互信息,确定该待检测用户的邻居特征信息;
输入模块,用于将该待检测用户的所述自身特征信息和所述邻居特征信息,输入至注意力机制模型,得到该待检测用户套现的概率;其中,所述注意力机制模型是根据多个训练样本训练得到的。
可选的,所述装置还包括:
第二获取模块,用于获取多个训练样本;其中,所述训练样本中标记有所述训练样本包括的样本用户套现的概率;
训练模块,用于针对各个训练样本,将该训练样本输入至预设注意力机制模型,对所述预设注意力机制模型进行训练,得到训练好的注意力机制模型。
可选的,所述装置还包括:
构建模块,用于根据各个待检测用户的自身特征信息以及各个待检测用户的交互信息,构建属性异质信息网络AHIN;其中,所述AHIN中各个待检测用户位于多个元路径上,各个元路径分别连接待检测用户与该待检测用户的邻居。
第三方面,本发明实施例提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,所述处理器,所述通信接口,所述存储器通过所述通信总线完成相互间的通信;
所述存储器,用于存放计算机程序;
所述处理器,用于执行所述存储器上所存放的程序时,实现上述第一方面所述的方法步骤。
本发明实施例提供的套现用户检测方法、装置及设备,可以获取各个待检测用户的自身特征信息以及各个待检测用户的交互信息;针对各个待检测用户,根据该待检测用户的自身特征信息,以及该待检测用户的交互信息,确定该待检测用户的邻居特征信息;并将该待检测用户的自身特征信息和邻居特征信息,输入至注意力机制模型,得到该待检测用户套现的概率。本发明实施例中,在套现用户检测过程中,同时考虑待检测用户的自身特征信息和交互信息,如此,可以基于交互信息确定待检测用户的邻居特征信息,通过自身特征信息和邻居特征信息表示待检测用户,进而对待检测用户进行检测,如此能够提高检测的准确性。当然,实施本发明的任一产品或方法必不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的套现用户检测方法的流程图;
图2为本发明实施例中信贷支付服务场景下各个对象之间的交互示意图;
图3(a)为本发明实施例中属性异质信息网络的示意图;
图3(b)为本发明实施例中元路径的示意图;
图4(a)为本发明实施例中仿真实验的一种结果示意图;
图4(b)为本发明实施例中仿真实验的另一种结果示意图;
图5为本发明实施例提供的具体实施例的示意图;
图6为本发明实施例提供的套现用户检测装置的结构示意图;
图7为本发明实施例提供的电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
已有的套现用户检测方式中,采集待检测用户的特征信息,如用户简介,信用历史,交易总结,以及最近的其他相关行业的行为等。然后,将待检测用户的特征信息输入至分类器,如基于树的模型或神经网络等确定该待检测用户是否是套现用户,同时,可以确定待检测用户套现的概率。
已有的套现用户检测方式中预测主要基于统计特征,没有利用待检测用户之间的交互关系,而这些交互关系可能有利于套现用户的检测。如此已有方式中仅考虑待检测用户自身特征信息有可能影响检测的准确性。
为了提高检测的准确性,本发明实施例提供了一种套现用户检测方法。具体地,本发明实施例提供的套现用户检测方法可以应用于电子设备。其中,该电子设备可以为处理器、台式计算机、便携式计算机、智能移动设备等。
下面对本发明实施例提供的套现用户检测方法进行详细说明。
本发明实施例提供了一种套现用户检测方法,如图1所示,可以包括:
S101,获取各个待检测用户的自身特征信息以及各个待检测用户的交互信息。
待检测用户的自身特征信息也可以理解为待检测用户的属性信息。具体地,可以包括:用户简介,信用历史,交易总结,以及最近的其他相关行业的行为等等。
其中,针对各个待检测用户,该交互信息可以包括该待检测用户与其他待检测用户交互的信息和该待检测用户与待检测用户之外的其他对象交互的信息。
如图2所示信贷支付服务场景下各个对象之间的交互示意图。一般情况可以可以包括三种类型的对象:用户、商家和设备。其中,设备例如,网站,桌面,移动应用,wifi设备,等等。除了属性信息之外,这些对象还具有丰富的交互信息,例如,用户之间的资金转移关系,用户和设备之间登录关系以及用户和商家之间的交易关系。其中,用户可以包括属性信息,如表1所示。
表1
姓名 | 年龄 | 性别 | 其它 |
Mary | 25 | 女 | … |
Tom | 30 | 男 | … |
Bob | 35 | 男 | … |
本发明实施例中的待检测用户可以是图2示意图中的一个或者多个用户。
针对各个待检测用户,电子设备从有可能包括待检测用户交易记录等信息的位置,获取各个待检测用户的自身特征信息以及各个待检测用户的交互信息。其中,该位置可以包括待检测用户参与的交易平台、信用平台等。
一种可选的实施例中,在S101:获取各个待检测用户的自身特征信息以及各个待检测用户的交互信息之后,还可以包括:
根据各个待检测用户的自身特征信息以及各个待检测用户的交互信息,构建属性异质信息网络AHIN。
其中,AHIN中各个待检测用户位于多个元路径上,各个元路径分别连接待检测用户与该待检测用户的邻居。
异质信息网络(Heterogeneous Information Network,HIN),由多种类型的节点和链接组成,被认为是一种强大的信息建模方法用于描述数据异构性。
HIN是一种特殊的信息网络,包含多种类型的对象或多种类型的链接。
异质信息网络可以表示为G={V,E,X},包含实体集合V和边集合和属性矩阵。一个异质信息网络同时有一个节点类型映射函数φ:V→A和一个边类型映射函数其中A和R表示预先定义好的实体和边的类型集合,并且|A|+|R|>2。
在异质信息网络中,两个实体可以通过不同的语义路径所连接,这些语义路径被称为元路径。
元路径ρ被定义为如下形式的路径A1→A2→...→AL+1,可以简写为A1A2…Al+1)。元路径还可以描述一种A_1和A_(l+1)之间的联合关系R=R_1°R_2°…°R_l。
本发明实施例中,为了集成对象的现有属性信息,进一步将异质信息网络进行扩展,构建属性异质信息网络(Attributes Heterogeneous Information Network,AHIN)。AHIN可以清楚地说明对象和以及对象之间的相互作用,如图3(a)所示。元路径可以包括两种形式UMU和UU,如图3(b)元路径示意图所示,其中,UMU表示两个用户与相同的商家交互,如交易,UU表示两个用户之间交互,如进行资金转移。
类似于HIN,AHIN中可以包括对象:用户、商家和设备,用户与用户之间、商家与商家之间、用户与商家之间、用户与设备之间以及商家与设备之间等都存在交互关系。如用户与用户之间进行资金转账,商家与商家之间进行之间转账,用户与商家之间进行交易,如进行资金转账,用户登录设备,商家登录设备等等。
将套现用户检测问题建模为在AHIN中形成的分类问题。在信用支付服务场景下,AHIN由不同类型的实体以及它们之间丰富的相互作用关系组成。
S102,针对各个待检测用户,根据该待检测用户的自身特征信息,以及该待检测用户的交互信息,确定该待检测用户的邻居特征信息;并将该待检测用户的自身特征信息和邻居特征信息,输入至注意力机制模型,得到该待检测用户套现的概率。
具体地,根据该待检测用户的自身特征信息,以及该待检测用户的交互信息,确定该待检测用户的邻居特征信息,可以包括:
A1,根据已构建的AHIN,确定该待检测用户的邻居。
AHIN中可以包括待检测用户与其他用户的交互关系,根据AHIN可以确定待检测用户基于不同的元路径的邻居,即不同的元路径上与该待检测用户连接的邻居,这里所说的连接可以理解为语义连接,如两个用户之间进行交易可以称这两个用户连接,位于一条元路径上。
在根据已构建的AHIN,确定该待检测用户的邻居之后,还可以包括:
确定该待检测用户基于各个元路径的注意力权重。
可以理解为确定各个元路径对该待检测用户的重要程度。可以重要程度不同的元路径确定不同的注意力权重。如重要程度较大的元路径确定较大的注意力权重,重要程度较小的元路径确定较小的注意力权重。
A2,根据邻居的特征信息,确定该待检测用户的邻居特征信息。
具体地,可以包括:
B1,针对各个元路径,将该元路径对应的注意力权重和第一特征信息作为第一邻居特征信息。
其中,第一特征信息为该元路径连接的该待检测用户的邻居的特征信息。
B2,将各个元路径分别得到的第一邻居特征信息作为该待检测用户的邻居特征信息。
预先训练注意力机制模型,在确定待检测用户的自身特征信息,以及该待检测用户的邻居特征信息后,将该待检测用户的自身特征信息和邻居特征信息,输入至注意力机制模型,得到该待检测用户套现的概率。
其中,注意力机制模型是根据多个训练样本训练得到的。具体地,训练注意力机制模型的步骤,包括:
A1,获取多个训练样本。
其中,训练样本中标记有训练样本包括的样本用户套现的概率。
训练样本包括样本用户的交易记录等。
为了提高训练的准确性,电子设备获取多个训练样本,如500个、1000个、2000等等。
一种实现方式中,可以人工进行标记。或者也可以通过自动化形式进行标记。本发明实施例不对标记的形式进行限制,任何可以对训练样本标记的形式均在本发明实施的保护范围内。
A2,针对各个训练样本,将该训练样本输入至预设注意力机制模型,对预设注意力机制模型进行训练,得到训练好的注意力机制模型。
具体地,预设注意力机制模型可以包括待测参数,将训练样本输入预设注意力机制模型,调整待测参数,以使预设注意力机制模型的输出无限逼近于预先标记的概率,如预设注意力机制模型的输出与预先标记的概率之间的代价函数收敛时,确定待测参数,得到的包括确定的待测参数的预设注意力机制模型即为训练好的注意力机制模型。其中,待测参数可以包括:隐藏层层数,隐藏层神经元的数量,批尺寸,学习速率,和/或迭代次数,等等。
本发明实施例中,在套现用户检测过程中,同时考虑待检测用户的自身特征信息和交互信息,如此,可以基于交互信息确定待检测用户的邻居特征信息,通过自身特征信息和邻居特征信息表示待检测用户,进而对待检测用户进行检测,如此能够提高检测的准确性。
本发明实施例一种可选的实施例中,在根据该待检测用户的自身特征信息,以及该待检测用户的交互信息,确定该待检测用户的邻居特征信息之后,还可以包括:
将自身特征信息和邻居特征信息进行融合,得到融合后的信息;
将该待检测用户的自身特征信息和邻居特征信息,输入至注意力机制模型,得到该待检测用户套现的概率,包括:
将融合后的信息输入至注意力机制模型,得到该待检测用户套现的概率。
本发明实施例中的套现用户检测过程可以称之为:基于层次的关注机制现金用户检测模型(Hierarchic Attention mechanisim based Cash-out User Detection model,HACUD)。HACUD的基本思想通过充分利用交互关系,显著增强对象的特征表示。在AHIN中基于元路径的邻居的帮助以及我们对真实数据的观察,假设物体的特征表示,除了内在特征之外,也由它们的邻居的特征构成。基于元路径的邻居在AHIN中利用丰富的结构信息的概念。也就是说,可以通过指定的元路径找到邻居(连接两个节点的关系序列)。
本发明实施例中,注意力机制的第一层是在特性中模拟用户的注意力空间(即属性信息),而第二层则捕捉到不同元路径对预测任务的不同贡献。最后,通过多层感知机预测用户在未来一段时间内的套现概率。
本发明实施例可以包括几个优点:(1)可以通过不同的元路径捕获结构信息的不同方面;(2)相对于传统的网络表示学习方法减少了表示空间的维度;(3)具有动态预测新节点的潜力。
另外,可以假设对象属性和元路径都有不同的重要性,通过层次的注意力机制,以学习用户对属性和元路径的偏好。具体地,可以采用基于元路径的邻居,并且利用结构信息和层次注意力机制自动学习属性和元路径的重要性。
本发明实施例还进行了仿真实验。
直观地说,套现用户倾向于通过不同的互动聚集在一起,以图2为例,套现用户往往会赚更多的钱与销售特定商品的商家进行交易或与更多的骗子互动。
为了验证现金用户的聚合对于不同的关系,在真实数据集上做实验(见实验中10天的数据集)。首先分别基于图3(b)所示的两种形式的元路径,收集各个元路径的邻居。针对每一个元路径,计算有现金用户的邻居的数量(称为现金流出的邻居),并关于他们的现金的数量邻居将所有用户划分为不同的团体。在每个组中计算现金支付率,即现金的比例用户。如图4(a)和图4(b)所示的基于两种元路径下,具有不同数量套现邻居的用户与没有套现邻居的用户的套现率的提升百分比。
分析图4(a)和图4(b),可以得到:
(1)高现金率的用户倾向于拥有更多的现金现金不足的邻居。这个观察结果表明,基于化生的邻居们有一致的行为原始用户,这意味着用户的特性可以源于他们的基于元路径的邻居。
(2)不同的元路径的邻居有不同的对用户的影响。如图4(a)和图4(b)所示的不同结果。
通过实验分析,不同的特征和元路径对待检测用户有不同的影响,可以基于不同的元路径确定待检测用户的邻居的特征信息,将待检测用户的自身特征信息与邻居的特征信息后,用于表示待检测用户,进而对待检测用户进行套现检测,得到待检测用户套现的概率。
下面结合具体实施例,对本发明实施例提供的方法进行详细说明。
首先分析基于元路径的邻居的影响在真实的套现用户检测数据集上,然后提出基于层次注意力机制的套现用户检测模型,简称为HACUD。
首先,针对于每个待检测用户,基于不同的元路径聚集该待检测用于的邻居的特征,形成AHIN中各个方面的结构信息;然后,转换和融合原始特特征,如待检测用户的自身特征信息以获得更好的特征表示。其中,考虑到不同的特征和元路径有不同的重要性,本发明实施例中可以通过层次的注意力机制模拟待检测用户对不同特征和元路径的偏好。
分析基于元路径的邻居的影响在真实的套现用户检测数据集上,然后提出基于层次注意力机制的套现用户检测模型,简称为HACUD。具体过程如图5所示。
基于元路径的邻居聚合。每一个实体的特征表示不仅仅由它自身的特征决定,也由它的邻居的特征决定。基于这个想法,为每一个待检测用户聚合它基于各条元路径的邻居。具体地来说,与最近的属性网络的表示学习类似,并不使用邻居的0/1编码来表示节点,而是聚合它基于各条元路径的邻居的特征信息来表示这个节点。
对于每一个待检测用户u,可以得到该待检测用户自身的自身特征信息,如自身特征向量Xu。
可以按如下公式得到该用户基于元路径的聚合特征,也可以理解为基于元路径的邻居特征信息:
如基于元路径1的邻居特征信息基于元路径n的邻居特征信息
其中,为待检测用户u基于元路径ρ的聚合特征,为待检测用户u基于元路径ρ的邻居集合,为待检测用户u和邻居j基于元路径ρ的权重。
为了可以对待检测用户更好地进行表示,通过特征融合层转换和融合原始特征
首先,将原始的稀疏特征映射成低维的稠密表示,由此可以分别得到待检测用户u的隐层表示hu=WXu+b,以及该待检测用户基于不同元路径的隐层表示:如基于元路径1的隐层表示基于元路径n的隐层表示隐层表示
其中,W和Wρ为权重矩阵,b和bρ为偏置向量。
然后,将待检测用户自身的自身特征信息与基于元路径的邻居的特征信息进行融合表示,并可以添加一个全连接层来完成复杂的交互。针对于每一条元路径,通过以下公式获得基于该元路径的融合表示:
如基于元路径1的融合表示基于元路径n的融合表示
其中,为基于元路径ρ的权重矩阵,为基于元路径ρ的偏置向量,g(...,...)为融合函数,可以包括将拼接操作、加权和或者按元素乘等,可以理解为将hu和进行拼接操作、加权和或者按元素乘等,F为标志符。
因为不同的特征并不是对预测任务有相同的贡献,所以可以在每条元路径上学习每个特征的重要性权重来表示每个特征对此次预测的重要性。给定用户的表示和基于每一条元路径的表示,可以通过两层的神经网络来获得注意力值。具体地,给定待检测用户的隐层表示hu和待检测用户基于元路径ρ的隐层表示可以采用两层的神经网络来实现特征层面上的注意力机制,如下所示:
如基于元路径1的基于元路径n的
其中,和为权重矩阵,和为偏置向量,为中间结果,为待检测用户u基于元路径ρ的特征注意力向量,为对hu和进行拼接操作。
确定基于元路径ρ的注意力值βu,ρ。
其中,zρ为基于元路径ρ的注意力权重,为待检测用户u基于所有元路径表示的拼接。
得到βu,ρ后,计算融合待检测用户自身特征信息和邻居特征信息的待检测用户的最后表示eu:
因为神经网络在建模复杂的交互场景上有很强的能力,将得到的待检测用户的最后表示作为多层神经网络的输入,且将该最后表示进行如下线性变换:
zu=ReLU(WL...ReLU(W1eu+b1)+bL)
其中,WL为第L层的权重矩阵,W1为第1层的权重矩阵,bL为第L层的偏置向量,b1为第1层的偏置向量。
最后,通过sigmoid单元回归得到待检测用户套现的概率,具体通过如下公式:
其中,pu为待检测用户套现的概率,为权重矩阵,bp为偏置向量。
另外,还可以对模型进行优化。
其中,L(Θ)为损失函数,Θ为模型的参数集合,yu为真实的类别标签。
本发明实施例提供了一种套现用户检测装置,如图6所示,包括:
第一获取模块601,用于获取各个待检测用户的自身特征信息以及各个待检测用户的交互信息,其中,针对各个待检测用户,该交互信息包括该待检测用户与其他待检测用户交互的信息和该待检测用户与待检测用户之外的其他对象交互的信息;
第一确定模块602,用于针对各个待检测用户,根据该待检测用户的自身特征信息,以及该待检测用户的交互信息,确定该待检测用户的邻居特征信息;
输入模块603,用于将该待检测用户的自身特征信息和邻居特征信息,输入至注意力机制模型,得到该待检测用户套现的概率;其中,注意力机制模型是根据多个训练样本训练得到的。
本发明实施例中,在套现用户检测过程中,同时考虑待检测用户的自身特征信息和交互信息,如此,可以基于交互信息确定待检测用户的邻居特征信息,通过自身特征信息和邻居特征信息表示待检测用户,进而对待检测用户进行检测,如此能够提高检测的准确性。
可选的,该装置还包括:
第二获取模块,用于获取多个训练样本;其中,训练样本中标记有训练样本包括的样本用户套现的概率;
训练模块,用于针对各个训练样本,将该训练样本输入至预设注意力机制模型,对预设注意力机制模型进行训练,得到训练好的注意力机制模型。
可选的,该装置还包括:
构建模块,用于根据各个待检测用户的自身特征信息以及各个待检测用户的交互信息,构建属性异质信息网络AHIN;其中,AHIN中各个待检测用户位于多个元路径上,各个元路径分别连接待检测用户与该待检测用户的邻居。
可选的,第一确定模块,具体用于根据已构建的AHIN,确定该待检测用户的邻居;根据邻居的特征信息,确定该待检测用户的邻居特征信息。
可选的,该装置还包括:
第二确定模块,用于确定该待检测用户基于各个元路径的注意力权重;
第一确定模块602,具体用于针对各个元路径,将该元路径对应的注意力权重和第一特征信息作为第一邻居特征信息,其中,第一特征信息为该元路径连接的该待检测用户的邻居的特征信息;将各个元路径分别得到的第一邻居特征信息作为该待检测用户的邻居特征信息。
可选的,该装置还包括:
融合模块,用于将自身特征信息和邻居特征信息进行融合,得到融合后的信息;
输入模块603,具体用于将融合后的信息输入至注意力机制模型,得到该待检测用户套现的概率。
需要说明的是,本发明实施例提供的套现用户检测装置是应用上述套现用户检测方法的装置,则上述套现用户检测方法的所有实施例均适用于该装置,且均能达到相同或相似的有益效果。
本发明实施例还提供了一种电子设备,如图7所示,包括处理器701、通信接口702、存储器703和通信总线704,其中,处理器701,通信接口702,存储器703通过通信总线704完成相互间的通信。
存储器703,用于存放计算机程序;
处理器701,用于执行存储器703上所存放的程序时,实现上述套现用户检测方法的方法步骤。
本发明实施例中,在套现用户检测过程中,同时考虑待检测用户的自身特征信息和交互信息,如此,可以基于交互信息确定待检测用户的邻居特征信息,通过自身特征信息和邻居特征信息表示待检测用户,进而对待检测用户进行检测,如此能够提高检测的准确性。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质内存储有计算机程序,计算机程序被处理器执行时实现上述套现用户检测方法的方法步骤。
本发明实施例中,在套现用户检测过程中,同时考虑待检测用户的自身特征信息和交互信息,如此,可以基于交互信息确定待检测用户的邻居特征信息,通过自身特征信息和邻居特征信息表示待检测用户,进而对待检测用户进行检测,如此能够提高检测的准确性。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于裝置、设备及计算机可读存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。
Claims (10)
1.一种套现用户检测方法,其特征在于,包括:
获取各个待检测用户的自身特征信息以及各个待检测用户的交互信息,其中,针对各个待检测用户,该交互信息包括该待检测用户与其他待检测用户交互的信息和该待检测用户与待检测用户之外的其他对象交互的信息;
针对各个待检测用户,根据该待检测用户的所述自身特征信息,以及该待检测用户的所述交互信息,确定该待检测用户的邻居特征信息;并将该待检测用户的所述自身特征信息和所述邻居特征信息,输入至注意力机制模型,得到该待检测用户套现的概率;其中,所述注意力机制模型是根据多个训练样本训练得到的。
2.根据权利要求1所述的方法,其特征在于,训练所述注意力机制模型的步骤,包括:
获取多个训练样本;其中,所述训练样本中标记有所述训练样本包括的样本用户套现的概率;
针对各个训练样本,将该训练样本输入至预设注意力机制模型,对所述预设注意力机制模型进行训练,得到训练好的注意力机制模型。
3.根据权利要求1所述的方法,其特征在于,在获取各个待检测用户的自身特征信息以及各个待检测用户的交互信息之后,所述方法还包括:
根据各个待检测用户的自身特征信息以及各个待检测用户的交互信息,构建属性异质信息网络AHIN;其中,所述AHIN中各个待检测用户位于多个元路径上,各个元路径分别连接待检测用户与该待检测用户的邻居。
4.根据权利要求3所述的方法,其特征在于,所述根据该待检测用户的所述自身特征信息,以及该待检测用户的所述交互信息,确定该待检测用户的邻居特征信息,包括:
根据已构建的所述AHIN,确定该待检测用户的邻居;
根据所述邻居的特征信息,确定该待检测用户的所述邻居特征信息。
5.根据权利要求4所述的方法,其特征在于,在所述根据已构建的所述AHIN,确定该待检测用户的邻居之后,所述方法还包括:
确定该待检测用户基于各个元路径的注意力权重;
所述根据所述邻居的特征信息,确定该待检测用户的所述邻居特征信息,包括:
针对各个元路径,将该元路径对应的注意力权重和第一特征信息作为第一邻居特征信息,其中,第一特征信息为该元路径连接的该待检测用户的邻居的特征信息;
将各个元路径分别得到的第一邻居特征信息作为该待检测用户的邻居特征信息。
6.根据权利要求3所述的方法,其特征在于,在所述根据该待检测用户的所述自身特征信息,以及该待检测用户的所述交互信息,确定该待检测用户的邻居特征信息之后,所述方法还包括:
将所述自身特征信息和所述邻居特征信息进行融合,得到融合后的信息;
所述将该待检测用户的所述自身特征信息和所述邻居特征信息,输入至注意力机制模型,得到该待检测用户套现的概率,包括:
将所述融合后的信息输入至所述注意力机制模型,得到该待检测用户套现的概率。
7.一种套现用户检测装置,其特征在于,包括:
第一获取模块,用于获取各个待检测用户的自身特征信息以及各个待检测用户的交互信息,其中,针对各个待检测用户,该交互信息包括该待检测用户与其他待检测用户交互的信息和该待检测用户与待检测用户之外的其他对象交互的信息;
第一确定模块,用于针对各个待检测用户,根据该待检测用户的所述自身特征信息,以及该待检测用户的所述交互信息,确定该待检测用户的邻居特征信息;
输入模块,用于将该待检测用户的所述自身特征信息和所述邻居特征信息,输入至注意力机制模型,得到该待检测用户套现的概率;其中,所述注意力机制模型是根据多个训练样本训练得到的。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
第二获取模块,用于获取多个训练样本;其中,所述训练样本中标记有所述训练样本包括的样本用户套现的概率;
训练模块,用于针对各个训练样本,将该训练样本输入至预设注意力机制模型,对所述预设注意力机制模型进行训练,得到训练好的注意力机制模型。
9.根据权利要求7所述的装置,其特征在于,所述装置还包括:
构建模块,用于根据各个待检测用户的自身特征信息以及各个待检测用户的交互信息,构建属性异质信息网络AHIN;其中,所述AHIN中各个待检测用户位于多个元路径上,各个元路径分别连接待检测用户与该待检测用户的邻居。
10.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,所述处理器,所述通信接口,所述存储器通过所述通信总线完成相互间的通信;
所述存储器,用于存放计算机程序;
所述处理器,用于执行所述存储器上所存放的程序时,实现权利要求1-6任一所述的方法步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910052269.7A CN109801077A (zh) | 2019-01-21 | 2019-01-21 | 一种套现用户检测方法、装置及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910052269.7A CN109801077A (zh) | 2019-01-21 | 2019-01-21 | 一种套现用户检测方法、装置及设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109801077A true CN109801077A (zh) | 2019-05-24 |
Family
ID=66559894
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910052269.7A Pending CN109801077A (zh) | 2019-01-21 | 2019-01-21 | 一种套现用户检测方法、装置及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109801077A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110348850A (zh) * | 2019-05-28 | 2019-10-18 | 深圳壹账通智能科技有限公司 | 聚合支付商户的套现风险检测方法及装置、电子设备 |
CN110443624A (zh) * | 2019-07-31 | 2019-11-12 | 中国工商银行股份有限公司 | 基于区块链的收单商户审查方法及节点装置 |
CN110555749A (zh) * | 2019-07-26 | 2019-12-10 | 阿里巴巴集团控股有限公司 | 基于神经网络的信用行为预测方法以及装置 |
CN110995810A (zh) * | 2019-11-25 | 2020-04-10 | 腾讯科技(深圳)有限公司 | 一种基于人工智能的对象识别方法和相关装置 |
CN112257959A (zh) * | 2020-11-12 | 2021-01-22 | 上海优扬新媒信息技术有限公司 | 用户风险预测方法、装置、电子设备及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103955535A (zh) * | 2014-05-14 | 2014-07-30 | 南京大学镇江高新技术研究院 | 一种基于元路径的个性化推荐方法及系统 |
CN104636912A (zh) * | 2015-02-13 | 2015-05-20 | 银联智惠信息服务(上海)有限公司 | 信用卡套现识别方法和装置 |
CN107944629A (zh) * | 2017-11-30 | 2018-04-20 | 北京邮电大学 | 一种基于异质信息网络表示的推荐方法及装置 |
CN108038692A (zh) * | 2017-11-06 | 2018-05-15 | 阿里巴巴集团控股有限公司 | 角色识别方法、装置及服务器 |
CN108399509A (zh) * | 2018-04-12 | 2018-08-14 | 阿里巴巴集团控股有限公司 | 确定业务请求事件的风险概率的方法及装置 |
CN109002488A (zh) * | 2018-06-26 | 2018-12-14 | 北京邮电大学 | 一种基于元路径上下文的推荐模型训练方法及装置 |
-
2019
- 2019-01-21 CN CN201910052269.7A patent/CN109801077A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103955535A (zh) * | 2014-05-14 | 2014-07-30 | 南京大学镇江高新技术研究院 | 一种基于元路径的个性化推荐方法及系统 |
CN104636912A (zh) * | 2015-02-13 | 2015-05-20 | 银联智惠信息服务(上海)有限公司 | 信用卡套现识别方法和装置 |
CN108038692A (zh) * | 2017-11-06 | 2018-05-15 | 阿里巴巴集团控股有限公司 | 角色识别方法、装置及服务器 |
CN107944629A (zh) * | 2017-11-30 | 2018-04-20 | 北京邮电大学 | 一种基于异质信息网络表示的推荐方法及装置 |
CN108399509A (zh) * | 2018-04-12 | 2018-08-14 | 阿里巴巴集团控股有限公司 | 确定业务请求事件的风险概率的方法及装置 |
CN109002488A (zh) * | 2018-06-26 | 2018-12-14 | 北京邮电大学 | 一种基于元路径上下文的推荐模型训练方法及装置 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110348850A (zh) * | 2019-05-28 | 2019-10-18 | 深圳壹账通智能科技有限公司 | 聚合支付商户的套现风险检测方法及装置、电子设备 |
CN110555749A (zh) * | 2019-07-26 | 2019-12-10 | 阿里巴巴集团控股有限公司 | 基于神经网络的信用行为预测方法以及装置 |
CN110555749B (zh) * | 2019-07-26 | 2021-10-29 | 创新先进技术有限公司 | 基于神经网络的信用行为预测方法以及装置 |
CN110443624A (zh) * | 2019-07-31 | 2019-11-12 | 中国工商银行股份有限公司 | 基于区块链的收单商户审查方法及节点装置 |
CN110995810A (zh) * | 2019-11-25 | 2020-04-10 | 腾讯科技(深圳)有限公司 | 一种基于人工智能的对象识别方法和相关装置 |
CN112257959A (zh) * | 2020-11-12 | 2021-01-22 | 上海优扬新媒信息技术有限公司 | 用户风险预测方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109801077A (zh) | 一种套现用户检测方法、装置及设备 | |
TWI740106B (zh) | 產品推薦方法和裝置 | |
Baesens et al. | Credit risk analytics: Measurement techniques, applications, and examples in SAS | |
CN109002488A (zh) | 一种基于元路径上下文的推荐模型训练方法及装置 | |
Chen et al. | Predicting default risk on peer-to-peer lending imbalanced datasets | |
US20090276368A1 (en) | Systems and methods for providing personalized recommendations of products and services based on explicit and implicit user data and feedback | |
CN112308650B (zh) | 推荐理由生成方法、装置、设备及存储介质 | |
Singh et al. | A study of Indian Gen X and Millennials consumers’ intention to use FinTech payment services during COVID-19 pandemic | |
CN110020662A (zh) | 用户分类模型的训练方法和装置 | |
Nookhao et al. | The consumer trust influencing intention to use electronic wallet in Thailand | |
US20230342797A1 (en) | Object processing method based on time and value factors | |
CN113781149A (zh) | 信息推荐方法、装置、计算机可读存储介质及电子设备 | |
CN112328869A (zh) | 一种用户贷款意愿的预测方法、装置及计算机系统 | |
CN110033353A (zh) | 用户对象推荐方法、装置、计算机可读存储介质和计算机设备 | |
CN108446738A (zh) | 一种聚类方法、装置及电子设备 | |
Han et al. | An evidence-based credit evaluation ensemble framework for online retail SMEs | |
Hong et al. | Probabilistic reliable linguistic term sets applied to investment project selection with the gained and lost dominance score method | |
Kusno et al. | Determinant factors of online purchase decision process via social commerce: An empirical study of organic black rice in Indonesia | |
CN110389963A (zh) | 基于大数据的渠道效果识别方法、装置、设备和存储介质 | |
CN107209897A (zh) | 处理和分析用户数据以便确定关键词质量 | |
CN111291838B (zh) | 实体对象分类结果的解释方法和装置 | |
CN112150276A (zh) | 一种机器学习模型的训练方法、使用方法、装置和设备 | |
Perez | Perception of e-wallets as the mode of payment for online enrollment in Marinduque State College | |
Carlsson et al. | Over-indebtedness and consumption patterns in digital society–A research review | |
Fu et al. | Constructing a scene-based knowledge system for E-commerce industries: Business analysis and challenges |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |