CN109558951B

CN109558951B - 一种欺诈账号检测方法、装置及其存储介质

Info

Publication number: CN109558951B
Application number: CN201811413556.8A
Authority: CN
Inventors: 曾山松; 岳永鹏
Original assignee: Beijing Knownsec Information Technology Co Ltd
Current assignee: Beijing Knownsec Information Technology Co Ltd
Priority date: 2018-11-23
Filing date: 2018-11-23
Publication date: 2020-11-03
Anticipated expiration: 2038-11-23
Also published as: CN109558951A

Abstract

本发明提供了一种欺诈账号检测方法、装置及其存储介质，涉及反欺诈检测技术领域。该欺诈账号检测方法包括：基于每个账号的关联设备特征和账号行为特征确定所述账号为欺诈账号的初始置信度；基于每个账号与其他账号的关联关系确定网络账号关系图，所述网络账号关系图包括每个账号与其他账号在不同关联关系下为欺诈账号的转移概率；基于置信度传播算法获得所述网络账号关系图中每个账号为欺诈账号的稳定置信度，基于账号的稳定置信度确定每个账号是否为欺诈账号。该方法结合账号的固有特征、登录行为特征和置信度传播算法判断账号是否为欺诈账号，提高了欺诈预测的效率、准确度和泛化能力。

Description

一种欺诈账号检测方法、装置及其存储介质

技术领域

本发明涉及反欺诈检测技术领域，具体而言，涉及一种欺诈账号检测方法、装置及其存储介质。

背景技术

传统的反欺诈检测系统，主要基于有监督的机器学习算法或者无监督的离群点检测方法，通过利用网络账号的账号画像特征或者行为轨迹特征判别网络账号是否为欺诈账号。

基于账号画像的欺诈账号检测方法可以根据充分利用账号的固有属性及网络行为轨迹进行欺诈账号的检测，但是账号属性的收集和账号行为轨迹的探测都需要耗费大量的人力物力，这对模型最终的效果的提高和训练的效率的提升都带来了不小的挑战，同时该检测方法仅仅基于单个账号的数据进行欺诈检测，检测准确度较低。

发明内容

有鉴于此，本发明实施例的目的在于提供一种欺诈账号检测方法、装置及其存储介质，以解决现有技术中由于账号属性的收集和账号行为轨迹的探测都需要耗费大量的人力物力且仅基于单个账号的数据进行欺诈检测存在的欺诈检测的效率和准确度较低问题。

第一方面，本发明实施例提供了一种欺诈账号检测方法，所述欺诈账号检测方法包括：基于每个账号的关联设备特征和账号行为特征确定所述账号为欺诈账号的初始置信度，所述关联设备特征为登录账号的设备的固有特征，所述账号行为特征为账号的登录行为特征；基于每个账号与其他账号的关联关系确定网络账号关系图，所述网络账号关系图包括每个账号与其他账号在不同关联关系下为欺诈账号的转移概率；基于置信度传播算法获得所述网络账号关系图中每个账号为欺诈账号的稳定置信度，基于账号的稳定置信度确定每个账号是否为欺诈账号。

上述实施例基于账号的关联设备特征和账号行为特征确定初始置信度，更接近于网络关系图中账号欺诈行为置信度的真实分布，有利用置信度传播算法的收敛，从而提高欺诈检测准确率；并基于置信度传播算法和账号之间的关联关系获得稳定置信度作为账号是否为欺诈账号的判定标准，充分利用账号网络关系的网络结构，自动匹配和利用网络关系图谱的异常子图模式，降低了操作复杂度，且通过节点进行置信度的多轮传播，使得网络达到最终平衡状态，提高了欺诈检测模型的泛化能力。

综合第一方面，所述基于每个账号的关联设备特征和账号行为特征确定所述账号为欺诈账号的初始置信度，包括：基于每个账号的关联设备特征和账号行为特征，采用机器学习分类方法确定每个账号为欺诈账号的初始置信度。

上述实施例采用机器学习分类方法获得账号的初始置信度，而不是采用人工判断和计算，能够基于多维度的数据更加准确地确定账号的初始置信度，提高了初始置信度获取的自动化程度、效率和准确率。

综合第一方面，所述基于每个账号与其他账号的关联关系确定网络账号关系图，包括：基于每个账号与其他账号的关联关系计算每个账号为欺诈账号的转移概率矩阵；将所述转移概率矩阵中每个账号为欺诈账号的转移概率作为所述网络账号关系图的图边的权重，确定所述网络账号关系图。

上述实施例引入账号之间的关联关系生成账号为欺诈账号的转移概率矩阵，基于转移概率矩阵获得网络账号关系图，更接近于网络关系图中账号欺诈行为置信度的真实分布，有利用置信度传播算法的收敛，从而提高了欺诈账号检测的准确率。

综合第一方面，所述基于置信度传播算法获得所述网络账号关系图中每个账号为欺诈账号的稳定置信度，包括：基于置信度传播算法中的置信度更新规则对所述网络账号关系图中每个账号为欺诈账号的概率进行迭代更新；在每个账号为欺诈账号的概率分布的收敛度满足预设收敛阈值时，基于所述概率分布确定每个账号为欺诈账号的稳定置信度。

上述实施例通过置信度算法对账号为欺诈账号的概率进行全局更新，并在全局概率分布达到预设收敛阈值时确定账号的稳定置信度，避免在概率分布未迭代至稳定程度就完成置信度的确定，从而提高了欺诈账号检测的准确度。

综合第一方面，所述基于账号的稳定置信度确定每个账号是否为欺诈账号，包括：将已知欺诈账号的稳定置信度设置为预设置信阈值，判断账号的稳定置信度是否大于所述预设置信阈值；若是，确定所述账号为欺诈账号；若否，确定所述账号不是欺诈账号。

综合第一方面，所述关联设备特征包括所述设备的市场价格、上市时间，所述账号行为特征包括所述账号的登录地点、登录时间、登录是否使用虚拟专用网络。

上述实施例通过市场价格、上市时间、账号的登录地点、登录时间、登录是否使用虚拟专用网络作为特征输入机器学习分类器，从而使分类器确定的初始置信度更加真实、准确。

第二方面，本发明实施例提供了一种欺诈账号检测装置，所述欺诈账号检测装置包括：初始置信度确定模块，用于基于每个账号的关联设备特征和账号行为特征确定所述账号为欺诈账号的初始置信度，所述关联设备特征为登录账号的设备的固有特征，所述账号行为特征为账号的登录行为特征；网络账号关系图确定模块，用于基于每个账号与其他账号的关联关系确定网络账号关系图，所述网络账号关系图包括每个账号与其他账号在不同关联关系下为欺诈账号的转移概率；欺诈确定模块，用于基于置信度传播算法获得所述网络账号关系图中每个账号为欺诈账号的稳定置信度，基于账号的稳定置信度确定每个账号是否为欺诈账号。

综合第二方面，所述初始置信度确定模块还用于基于每个账号的关联设备特征和账号行为特征，采用机器学习分类方法确定每个账号为欺诈账号的初始置信度。

综合第二方面，所述网络账号关系图确定模块包括：转移概率矩阵计算单元，用于基于每个账号与其他账号的关联关系计算每个账号为欺诈账号的转移概率矩阵；网络账号关系图确定单元，用于将所述转移概率矩阵中每个账号为欺诈账号的转移概率作为所述网络账号关系图的图边的权重，确定所述网络账号关系图。

综合第二方面，所述欺诈确定模块包括：迭代更新单元，用于基于置信度传播算法中的置信度更新规则对所述网络账号关系图中每个账号为欺诈账号的概率进行迭代更新；稳定置信度确定单元，用于在每个账号为欺诈账号的概率分布的收敛度低于预设收敛阈值时，基于所述概率分布确定每个账号为欺诈账号的稳定置信度。

第三方面，本发明实施例还提供了一种计算机可读取存储介质，所述计算机可读取存储介质中存储有计算机程序指令，所述计算机程序指令被一处理器读取并运行时，执行上述任一方面所述方法中的步骤。

本发明的其他特征和优点将在随后的说明书阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明实施例了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本发明的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1为本发明第一实施例提供的一种欺诈账号检测方法的流程示意图；

图2为本发明第一实施例提供的一种网络账号关系图确定步骤的流程示意图；

图3为本发明第一实施例提供的一种网络账号关系图的结构示意图；

图4为本发明第二实施例提供的一种欺诈账号检测装置100的模块示意图；

图5为本发明第三实施例提供的一种可应用于本申请实施例中的电子设备200的结构框图。

图标：100-欺诈账号检测装置；110-初始置信度确定模块；120-网络账号关系图确定模块；130-欺诈确定模块；200-电子设备；201-存储器；202-存储控制器；203-处理器；204-外设接口；205-输入输出单元；206-音频单元；207-显示单元。

具体实施方式

下面将结合本发明实施例中附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此，以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围，而是仅仅表示本发明的选定实施例。基于本发明的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本发明保护的范围。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步定义和解释。同时，在本发明的描述中，术语“第一”、“第二”等仅用于区分描述，而不能理解为指示或暗示相对重要性。

第一实施例

经本申请人研究发现，商户为了伪造其良好的信誉情况，例如好的评价和销量等，在平台上获取更多流量入口和活动支持，会通过各种渠道进行刷单，比如找朋友刷、找刷单团队刷、找职业刷客刷、虚拟机自刷等各种渠道。这种行为不仅干扰的正常的生产经营活动，误导消费者消费，而且对别的商户造成恶意竞争的影响，损害了竞争对手的利益。另一方面，随着互联网电商平台和金融平台的崛起，为了迅速获得更多的新客户，这些平台采取发放大量优惠券和返利的方式吸引客户，但是，这也给羊毛党们有了可趁之机，发展不断组织化，专业化，产业化。给这些平台带来了巨大的经济损失，一方面补贴的各种优惠无法到达真实用户手中，羊毛党获得优惠和返利后迅速撤离，使得平台客户大量流失，另一方面，羊毛党账号的存在，造成大量的活跃僵尸用户，不利于平台对自身真实的经营状况进行评估和统计。从而需要欺诈检测系统对账号进行欺诈检测，现有的反欺诈检测系统，主要基于有监督的机器学习算法或者无监督的离群点检测方法，通过利用网络账号的账号画像特征或者行为轨迹特征判别网络账号是否为欺诈账号。同时随着图算法的不断发展，人们也通过分析网络账号之间的关联关系，通过专业知识制定子图模式匹配算法，去检测网络中的异常关系子图，判别账号的欺诈行为。但是基于账号画像的欺诈账号检测方法可以根据充分利用账号的固有属性及网络行为轨迹进行欺诈账号的检测，但是账号属性的收集和账号行为轨迹的探测都需要耗费大量的人力物力，这对模型最终的效果的提高和训练的效率的提升都带来了不小的挑战。基于网络关系图的欺诈账号检测方法可以根据网络账号的关联关系通过一系列子图匹配模式挖掘出图中的异常节点以识别欺诈账号，这种方式不需要收集上网账号的固有属性和行为轨迹信息，且可以采用无监督的方式对异常网络图节点进行发现和挖掘，减少的数据标注的工作量，但是子图模式的发现需要丰富的专家知识，且无法充分利用上网账号的固有属性信息，给模型的扩展和效果提高带来了限制。

为了解决现有的欺诈检测方法中存在的问题，本发明第一实施例提供了一种欺诈账号检测方法，该方法的执行主体可以是计算机、智能终端、云处理器或其他能够进行逻辑运算的处理设备。

请参考图1，图1为本发明第一实施例提供的一种欺诈账号检测方法的流程示意图，该欺诈账号检测方法的具体步骤可以如下：

步骤S20：基于每个账号的关联设备特征和账号行为特征确定账号为欺诈账号的初始置信度。

本实施例中的关联设备特征为登录账号的设备的固有特征，账号行为特征为账号的登录行为特征。例如，账号A在设备1上登录，则设备1为账号A的关联设备，应当理解的是，每个账号的关联设备可以为多个。

作为一种可选的实施方式，账号每次登录某应用程序以及相关的操作信息通常会被该应用程序对应的服务器记录在数据库中，本实施例可以在该数据库中获取关联设备特征和账号行为特征。应当理解的是，若关联设备特征和账号行为特征的数据是被登录账号的设备记录的，也可以在该设备处获取关联设备特征和账号行为特征。

置信度也叫置信水平，它是指特定个体对待特定命题真实性相信的程度，也就是概率是对个人信念合理性的量度。在统计学原理中进行说明，一个概率样本的置信区间(Confidence interval)是对这个样本的某个总体参数的区间估计，置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的程度，置信区间给出的是被测量参数的测量值的可信程度，即前面所要求的“一定概率”。这个概率被称为置信水平。本实施例中的置信度即为账号为欺诈账号的概率的置信度。

步骤S40：基于每个账号与其他账号的关联关系确定网络账号关系图。

本实施例中网络账号关系图包括每个账号与其他账号在不同关联关系下为欺诈账号的转移概率。

步骤S60：基于置信度传播算法获得网络账号关系图中每个账号为欺诈账号的稳定置信度，基于账号的稳定置信度确定每个账号是否为欺诈账号。

置信传播是一种在图模型上进行推断的消息传递算法。其主要思想是：对于马尔科夫随机场中的每一个节点，通过消息传播，把该节点的概率分布状态传递给相邻的节点，从而影响相邻节点的概率分布状态，经过一定次数的迭代，每个节点的概率分布将收敛于一个稳态。具体地，置信度传播算法利用结点与结点之间相互传递信息而更新当前整个马尔可夫随机场(Markov random field,MRF)的标记状态，是基于MRF的一种近似计算。该算法是一种迭代的方法，可以解决概率图模型概率推断问题，而且所有信息的传播可以并行实现。经过多次迭代后，所有结点的信度不再发生变化，就称此时每一个结点的标记即为最优标记，MRF也达到了收敛状态。对于无环环路的MRF，BP算法可以收敛到其最优解。

本实施例提供的欺诈账号检测方法基于账号的关联设备特征和账号行为特征确定初始置信度，更接近于网络关系图中节点(账号)欺诈行为置信度的真实分布，有利用置信度传播算法的收敛，从而提高欺诈检测准确率；并基于置信度传播算法和账号之间的关联关系获得稳定置信度作为账号是否为欺诈账号的判定标准，充分利用账号网络关系的网络结构，自动匹配和利用网络关系图谱的异常子图模式，降低了操作复杂度，且通过节点进行置信度的多轮传播，使得网络达到最终平衡状态，提高了欺诈检测模型的泛化能力。

作为一种可选的实施方式，步骤S20包括：基于每个账号的关联设备特征和账号行为特征，采用机器学习分类方法确定每个账号为欺诈账号的初始置信度。

本实施例中的关联设备特征可以包括设备的市场价格、上市时间等，账号行为特征可以包括账号的登录地点、登录时间、登录是否使用虚拟专用网络等。其中，廉价的设备可以减低欺诈者的欺诈成本，因此往往廉价设备被用作欺诈设备的可能性更高。进一步地，欺诈者会通过批量操作降低时间成本，因此欺诈账号通常会在某一区域、某一时间点集体登录，进而不同登录地点和登录时间为诈骗账号的可能性不同。同时欺诈者还可能使用虚拟专用网络(Virtual Private Network，VPN)在公用网络上建立专用网络，进行加密通讯，以躲避欺诈检测，因此可以根据是否使用VPN来进一步判断账号是否为欺诈账号。

以下表数据进行举例说明：

表1

从表1收集的训练数据可以看出，欺诈账号习惯使用成本低廉的设备，且为了隐藏自身的网络位置，大多采用VPN登录。

作为一种可选的实施方式，本实施可以采用机器学习分类器中有监督的逻辑回归分类器输出该账号为欺诈账号的概率值。逻辑回归分类器的数学表示为：Y＝f(x)＝1/(1+e^-wx)，其中，f(x)即为逻辑回归函数，其输入是训练集中的每个样本各个特征组成的一个n维向量x，x＝(x₁,x₂,x₃...x_n)，n代表样本特征的个数，向量的每个维度是样本的一个特征，如设备上市时间，设备上市价格等。逻辑回归分类器输出是一个概率值，概率值大于0.5代表该账号是欺诈账号，概率值小于0.5代表该账号是正常账号，概率值越大代表该账号属于欺诈账号的初始置信度越大。应当理解的是，概率值0.5的设置可以根据具体情况进行调整。

应当理解的是，在其他可选的实施例中，还可以采用基于决策树、聚类、贝叶斯分类、支持向量或其他算法的分类器确定初始置信度。同时，除了账户的登录地点、登录时间和登录设备的固有特征外，还可以基于账户画像采集该账户其他信息。

本实施例采用机器学习分类方法获得账号的初始置信度，而不是采用人工判断和计算，能够基于多维度的数据更加准确地确定账号的初始置信度，提高了初始置信度获取的自动化程度、效率和准确率。

针对步骤S40，请参考图2，图2为本发明第一实施例提供的一种网络账号关系图确定步骤的流程示意图，该网络账号关系图确定步骤具体可以如下：

步骤S41：基于每个账号与其他账号的关联关系计算每个账号为欺诈账号的转移概率矩阵。

步骤S42：将转移概率矩阵中每个账号为欺诈账号的转移概率作为网络账号关系图的图边的权重，确定网络账号关系图。

针对步骤S41，两个账号的关联关系会影响互相之间为欺诈账号的概率，例如，两个网络账号经常在同一地点，同一时间，使用同一设备进行登录或者浏览网页，如果其中一个账号是欺诈账号，则另一个账号也极有可能是欺诈账号，可以给这种关联关系设定较高的转移概率。两个网络账号使用同一收货地址，绑定同一手机号，其中一个网络账号为欺诈账号，则另一个设备为欺诈账号的概率也极高。通过运用统计学习和采样的方法，可以依据已经采集的样本数据对网络中的账号为欺诈账号转移概率进行计算，得到两个账号在各种关联关系下账号为欺诈账号的转移概率矩阵。如下表2和表3所示：

表2(关系一：两账号在同一地点、同一时间、同一设备登录)

	账号2(欺诈账号)	账号2(正常账号)
			账号1(欺诈账号)	0.9	0.1
账号1(正常账号)	0.2	0.8

表3(关系二：两账号绑定同一收货地址，同一手机号码)

	账号2(欺诈账号)	账号2(正常账号)
			账号1(欺诈账号)	0.99	0.01
账号1(正常账号)	0.02	0.98

针对步骤S42，请参考图3，图3为本发明第一实施例提供的一种网络账号关系图的结构示意图，其中，网络账号关系图的图边的权重为上述步骤S41确定的各个账号之间的转移概率。

作为一种可选的实施方式，本实施例中步骤S60的“基于置信度传播算法获得所述网络账号关系图中每个账号为欺诈账号的稳定置信度”步骤可以包括：

步骤S61：基于置信度传播算法中的置信度更新规则对网络账号关系图中每个账号为欺诈账号的概率进行迭代更新。

在置信度传播算法中，对于网络账号关系图的每一个账号节点，通过置信度消息传播、更新规则，把该账号节点的欺诈概率分布状态传递给相邻的账号节点，从而影响相邻账号节点的欺诈概率分布状态，经过一定次数的迭代，以使每个账号节点的欺诈概率分布收敛于一个稳定状态。

针对图3中的账号1、账号2、账号3、账号4和账号5，其为欺诈账号的初始置信度分别为P(1)、p(2)、p(3)、p(4)、p(5)，从节点i到节点j的边权重即转移概率为M_ij,则账号节点i的置信度更新规则为：P(i)＝Avg(M_ij*P(j))，迭代多次后网络将达到平衡状态。

步骤S62：在每个账号为欺诈账号的概率分布的收敛度满足预设收敛阈值时，基于概率分布确定每个账号为欺诈账号的稳定置信度。

P(i)即为节点i的欺诈行为稳定置信度，可以根据该稳定置信度判别账号节点是否为欺诈账号，一般可以采用topK或设定阈值的方式进行判别。采用topK的方式是通过排序算法获得网络中稳定置信度最高的k个节点，将其判定为欺诈账号；采用设定阈值的方法可以通过统计方法对训练集中的数据进行统计，取训练样本中所有已知欺诈账号在网络达到平衡状态下的稳定置信度的平均值作为预设置信阈值，当生产环境中某个不在训练集中的账号在网络中的稳定置信度大于该预设置信阈值，我们将其视为欺诈账号。

本实施例通过置信度算法对账号为欺诈账号的概率进行全局更新，并在全局概率分布达到预设收敛阈值时确定账号的稳定置信度，避免在概率分布未迭代至稳定程度就完成置信度的确定，从而提高了欺诈账号检测的准确度。

第二实施例

为了配合本发明第一实施例提供的欺诈账号检测方法，本发明第二实施例还提供了一种欺诈账号检测装置100。

请参考图4，图4为本发明第二实施例提供的一种欺诈账号检测装置100的模块示意图。

欺诈账号检测装置100包括初始置信度确定模块110、网络账号关系图确定模块120和欺诈确定模块130。

初始置信度确定模块110，用于基于每个账号的关联设备特征和账号行为特征确定账号为欺诈账号的初始置信度，关联设备特征为登录账号的设备的固有特征，账号行为特征为账号的登录行为特征。

网络账号关系图确定模块120，用于基于每个账号与其他账号的关联关系确定网络账号关系图，网络账号关系图包括每个账号与其他账号在不同关联关系下为欺诈账号的转移概率。

欺诈确定模块130，用于基于置信度传播算法获得网络账号关系图中每个账号为欺诈账号的稳定置信度，基于账号的稳定置信度确定每个账号是否为欺诈账号。

作为一种可选的实施方式，初始置信度确定模块110还用于基于每个账号的关联设备特征和账号行为特征，采用机器学习分类方法确定每个账号为欺诈账号的初始置信度。

作为一种可选的实施方式，本实施例中的网络账号关系图确定模块120包括转移概率矩阵计算单元和网络账号关系图确定单元。

转移概率矩阵计算单元，用于基于每个账号与其他账号的关联关系计算每个账号为欺诈账号的转移概率矩阵。

网络账号关系图确定单元，用于将所述转移概率矩阵中每个账号为欺诈账号的转移概率作为所述网络账号关系图的图边的权重，确定所述网络账号关系图。

作为一种可选的实施方式，本实施例中的欺诈确定模块130包括迭代更新单元和稳定置信度确定单元。

迭代更新单元，用于基于置信度传播算法中的置信度更新规则对网络账号关系图中每个账号为欺诈账号的概率进行迭代更新。

稳定置信度确定单元，用于在每个账号为欺诈账号的概率分布的收敛度低于预设收敛阈值时，基于概率分布确定每个账号为欺诈账号的稳定置信度。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的装置的具体工作过程，可以参考前述方法中的对应过程，在此不再过多赘述。

第三实施例

请参照图5，图5为本发明第三实施例提供的一种可应用于本申请实施例中的电子设备200的结构框图。本实施例提供的电子设备200可以包括欺诈账号检测装置100、存储器201、存储控制器202、处理器203、外设接口204、输入输出单元205、音频单元206、显示单元207。

所述存储器201、存储控制器202、处理器203、外设接口204、输入输出单元205、音频单元206、显示单元207各元件相互之间直接或间接地电性连接，以实现数据的传输或交互。例如，这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。所述欺诈账号检测装置100包括至少一个可以软件或固件(firmware)的形式存储于所述存储器201中或固化在欺诈账号检测装置100的操作系统(operating system，OS)中的软件功能模块。所述处理器203用于执行存储器201中存储的可执行模块，例如欺诈账号检测装置100包括的软件功能模块或计算机程序。

其中，存储器201可以是，但不限于，随机存取存储器(Random Access Memory，RAM)，只读存储器(Read Only Memory，ROM)，可编程只读存储器(Programmable Read-OnlyMemory，PROM)，可擦除只读存储器(Erasable Programmable Read-Only Memory，EPROM)，电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory，EEPROM)等。其中，存储器201用于存储程序，所述处理器203在接收到执行指令后，执行所述程序，前述本发明实施例任一实施例揭示的流过程定义的服务器所执行的方法可以应用于处理器203中，或者由处理器203实现。

处理器203可以是一种集成电路芯片，具有信号的处理能力。上述的处理器203可以是通用处理器，包括中央处理器(Central Processing Unit，简称CPU)、网络处理器(Network Processor，简称NP)等；还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器203也可以是任何常规的处理器等。

所述外设接口204将各种输入/输出装置耦合至处理器203以及存储器201。在一些实施例中，外设接口204，处理器203以及存储控制器202可以在单个芯片中实现。在其他一些实例中，他们可以分别由独立的芯片实现。

输入输出单元205用于提供给用户输入数据实现用户与所述服务器(或本地终端)的交互。所述输入输出单元205可以是，但不限于，鼠标和键盘等设备。

音频单元206向用户提供音频接口，其可包括一个或多个麦克风、一个或者多个扬声器以及音频电路。

显示单元207在所述电子设备200与用户之间提供一个交互界面(例如用户操作界面)或用于显示图像数据给用户参考。在本实施例中，所述显示单元207可以是液晶显示器或触控显示器。若为触控显示器，其可为支持单点和多点触控操作的电容式触控屏或电阻式触控屏等。支持单点和多点触控操作是指触控显示器能感应到来自该触控显示器上一个或多个位置处同时产生的触控操作，并将该感应到的触控操作交由处理器203进行计算和处理。

可以理解，图5所示的结构仅为示意，所述电子设备200还可包括比图5中所示更多或者更少的组件，或者具有与图5所示不同的配置。图5中所示的各组件可以采用硬件、软件或其组合实现。

综上所述，本发明实施例提供了一种欺诈账号检测方法、装置及其存储介质，该欺诈账号检测方法基于账号的关联设备特征和账号行为特征确定初始置信度，更接近于网络关系图中账号欺诈行为置信度的真实分布，有利用置信度传播算法的收敛，从而提高欺诈检测准确率；并基于置信度传播算法和账号之间的关联关系获得稳定置信度作为账号是否为欺诈账号的判定标准，充分利用账号网络关系的网络结构，自动匹配和利用网络关系图谱的异常子图模式，降低了操作复杂度，且通过节点进行置信度的多轮传播，使得网络达到最终平衡状态，提高了欺诈检测模型的泛化能力。

在本申请所提供的几个实施例中，应该理解到，所揭露的装置和方法，也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分，所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现方式中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或动作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

另外，在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分，也可以是各个模块单独存在，也可以两个或两个以上模块集成形成一个独立的部分。

所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步定义和解释。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应所述以权利要求的保护范围为准。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

Claims

1.一种欺诈账号检测方法，包括：基于每个账号与其他账号的关联关系确定网络账号关系图，所述网络账号关系图包括每个账号与其他账号在不同关联关系下为欺诈账号的转移概率，其特征在于，所述方法还包括：

基于每个账号的关联设备特征和账号行为特征确定所述账号为欺诈账号的初始置信度，所述关联设备特征为登录账号的设备的固有特征，所述账号行为特征为账号的登录行为特征；

基于置信度传播算法获得所述网络账号关系图中每个账号为欺诈账号的稳定置信度，基于账号的稳定置信度确定每个账号是否为欺诈账号。

2.根据权利要求1所述的欺诈账号检测方法，其特征在于，所述基于每个账号的关联设备特征和账号行为特征确定所述账号为欺诈账号的初始置信度，包括：

基于每个账号的关联设备特征和账号行为特征，采用机器学习分类方法确定每个账号为欺诈账号的初始置信度。

3.根据权利要求1所述的欺诈账号检测方法，其特征在于，所述基于每个账号与其他账号的关联关系确定网络账号关系图，包括：

基于每个账号与其他账号的关联关系计算每个账号为欺诈账号的转移概率矩阵；

将所述转移概率矩阵中每个账号为欺诈账号的转移概率作为所述网络账号关系图的图边的权重，确定所述网络账号关系图。

4.根据权利要求1所述的欺诈账号检测方法，其特征在于，所述基于置信度传播算法获得所述网络账号关系图中每个账号为欺诈账号的稳定置信度，包括：

基于置信度传播算法中的置信度更新规则对所述网络账号关系图中每个账号为欺诈账号的概率进行迭代更新；

在每个账号为欺诈账号的概率分布的收敛度满足预设收敛阈值时，基于所述概率分布确定每个账号为欺诈账号的稳定置信度。

5.根据权利要求1所述的欺诈账号检测方法，其特征在于，所述基于账号的稳定置信度确定每个账号是否为欺诈账号，包括：

将已知欺诈账号的稳定置信度设置为预设置信阈值，判断账号的稳定置信度是否大于所述预设置信阈值；

若是，确定所述账号为欺诈账号；

若否，确定所述账号不是欺诈账号。

6.根据权利要求1-5中任一权项所述的欺诈账号检测方法，其特征在于，所述关联设备特征包括所述设备的市场价格、上市时间，所述账号行为特征包括账号的登录地点、登录时间、登录是否使用虚拟专用网络。

7.一种欺诈账号检测装置，包括网络账号关系图确定模块，用于基于每个账号与其他账号的关联关系确定网络账号关系图，所述网络账号关系图包括每个账号与其他账号在不同关联关系下为欺诈账号的转移概率，其特征在于，所述装置还包括：

初始置信度确定模块，用于基于每个账号的关联设备特征和账号行为特征确定所述账号为欺诈账号的初始置信度，所述关联设备特征为登录账号的设备的固有特征，所述账号行为特征为账号的登录行为特征；

欺诈确定模块，用于基于置信度传播算法获得所述网络账号关系图中每个账号为欺诈账号的稳定置信度，基于账号的稳定置信度确定每个账号是否为欺诈账号。

8.根据权利要求7所述的欺诈账号检测装置，其特征在于，所述网络账号关系图确定模块包括：

转移概率矩阵计算单元，用于基于每个账号与其他账号的关联关系计算每个账号为欺诈账号的转移概率矩阵；

9.根据权利要求7所述的欺诈账号检测装置，其特征在于，所述欺诈确定模块包括：

迭代更新单元，用于基于置信度传播算法中的置信度更新规则对所述网络账号关系图中每个账号为欺诈账号的概率进行迭代更新；

稳定置信度确定单元，用于在每个账号为欺诈账号的概率分布的收敛度低于预设收敛阈值时，基于所述概率分布确定每个账号为欺诈账号的稳定置信度。

10.一种计算机可读取存储介质，其特征在于，所述计算机可读取存储介质中存储有计算机程序指令，所述计算机程序指令被一处理器读取并运行时，执行权利要求1-6任一项所述方法中的步骤。