树状风险账户识别方法、装置、服务器及存储介质
技术领域
本发明涉及计算机技术领域,尤其涉及一种树状风险账户识别方法、装置、服务器及存储介质。
背景技术
现有技术中,随着资金交易形式的多样化,套现、虚假交易等风险行为也越来越多。有一类风险交易行为是上层账户给中间账户转移资金,中间账户再给下层账户转移资金,经过多层转移后资金分散到了用于作弊的账户,用于作弊的账户进行作弊交易套取资金。这一类的风险账户从资金关系上形成了典型的树状网络,网络中的上层和中间层只有资金的获取和转移行为,最后一层的账户才进行作弊。
发明内容
本说明书实施例提供及一种树状风险账户识别方法、装置、服务器及存储介质。
第一方面,本说明书实施例提供一种树状风险账户识别方法,应用于由多个账户构成的目标网络中,所述方法包括:
获取每个账户的属性特征,并基于所述每个账户的属性特征构建所述目标网络的属性矩阵;
获取所述每个账户的用于表征与其他账户是否存在关联的关联特征,并基于所述每个账户的关联特征构建所述目标网络的结构矩阵;
将所述属性矩阵以及所述结构矩阵输入至预设的图卷积网络模型中,得到所述每个账户的账户类型,所述账户类型为风险类型或正常类型;
基于所述每个账户的账户类型,确定所述目标网络中的树状风险账户集合。
第二方面,本说明书实施例提供一种树状风险账户识别装置,应用于由多个账户构成的目标网络中,所述装置包括:
属性矩阵构建模块,用于获取每个账户的属性特征,并基于所述每个账户的属性特征构建所述目标网络的属性矩阵;
结构矩阵构建模块,用于获取所述每个账户的用于表征与其他账户是否存在关联的关联特征,并基于所述每个账户的关联特征构建所述目标网络的结构矩阵;
识别模块,用于将所述属性矩阵以及所述结构矩阵输入至预设的图卷积网络模型中,得到所述每个账户的账户类型,所述账户类型为风险类型或正常类型;
账户确定模块,用于基于所述每个账户的账户类型,确定所述目标网络中的树状风险账户集合。
第三方面,本说明书实施例提供一种服务器,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行上述任一项所述方法的步骤。
第四方面,本说明书实施例提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任一项所述方法的步骤。
本说明书实施例有益效果如下:
在本说明书实施例提供的树状风险账户识别方法中,基于目标网络中每个账户的属性特征,构建目标网络的属性矩阵,以及基于每个账户的用于表征与其他账户是否存在关联的关联特征,构建目标网络的结构矩阵,将属性矩阵以及结构矩阵输入至预设的图卷积网络模型中,得到每个账户的账户类型,其中,预设的图卷积网络模型用于对账户进行分类,分类结果包括风险类型或正常类型。基于每个账户的账户类型,确定出目标网络中的树状风险账户集合。上述方案中,属性矩阵能够反映目标网络中每个账户的自身属性,结构矩阵能够反映账户与账户之间的关联,例如能够反映账户之间的资金转移交易等关联,这样,可以将目标网络看作为图结构,账户看作是图结构中的节点,属性矩阵和结构矩阵则分别对应了图的节点属性信息和图的网络结构信息。通过预设的图卷积网络模型能够不仅对节点属性信息进行判断,还综合了图的网络结构信息,将风险账户之间的关联也考虑在内。由于在树状作弊风险行为中,上层和中间账户没有作弊行为,但是上层和中间账户与下层的作弊账户存在直接或间接的交易,通过本方案中的网络结构信息能够有效的将上层账户、中间账户和下层账户之间的关联刻画出来,因此识别出的账户类型更加精准,进而根据账户类型确定出的树状风险账户准确率更高。由于树状风险账户的识别准确率提高,降低了计算机重新计算风险和校正错误的次数,进而节约了计算机资源。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1为本说明书实施例第一方面提供的一种树状风险账户识别方法的流程图;
图2为本说明书实施例第二方面提供的树状风险账户识别装置的示意图;
图3为本说明书实施例第三方面提供的服务器的示意图。
具体实施方式
为了更好的理解上述技术方案,下面通过附图以及具体实施例对本说明书实施例的技术方案做详细的说明,应当理解本说明书实施例以及实施例中的具体特征是对本说明书实施例技术方案的详细的说明,而不是对本说明书技术方案的限定,在不冲突的情况下,本说明书实施例以及实施例中的技术特征可以相互组合。
本说明书实施例提供一种树状风险账户识别方法,应用于由多个账户构成的目标网络中,每个账户包含有多个特征。如图1所示,为本说明书实施例提供的树状风险账户识别方法的流程图,该方法包括以下步骤:
步骤S11:获取每个账户的属性特征,并基于所述每个账户的属性特征构建所述目标网络的属性矩阵;
步骤S12:获取所述每个账户的用于表征与其他账户是否存在关联的关联特征,并基于所述每个账户的关联特征构建所述目标网络的结构矩阵;
步骤S13:将所述属性矩阵以及所述结构矩阵输入至预设的图卷积网络模型中,得到所述每个账户的账户类型,所述账户类型为风险类型或正常类型;
步骤S14:基于所述每个账户的账户类型,确定所述目标网络中的树状风险账户集合。
在具体实施过程中,目标网络可以根据实际需要进行选择,例如,目标网络为电商平台的各个账户组成的网络,也可以是在线支付平台的各个账户组成的网络,当然还可以是其他网络,这里就不一一列举了。以在线支付平台的各个账户组成的网络为例,账户可以为用户在该支付平台进行注册时生成的。为了便于说明,本说明书实施例中以账户数量是N为例,N为大于1的正整数,N的取值可以根据实际需要进行设定,例如,N可以为在线支付平台的账户总数,那么N个账户即为在线支付平台的所有账户,N还可以取小于账户总数的任意值,那么N个账户可以是对所有账户进行筛选、采样得到的。
应理解的是,目标网络可以抽象成图的拓扑结构,由节点和节点之间的边构成。举例来讲,在目标网络为在线支付平台的N个账户构成的网络时,每个账户对应图中的一个结点,即与目标网络对应的图包含有N个节点,账户之间的关联信息可以用来确定节点之间是否有边连接。可见,本说明书实施例中的树状风险账户识别方法可以转化为对目标网络对应的图结构进行处理,以识别出目标网络中的树状风险账户。
首先,通过步骤S11构建目标网络的属性矩阵,即:获取每个账户的属性特征,并基于所述每个账户的属性特征构建所述目标网络的属性矩阵。
本说明书实施例中,每个账户都具有多种特征,例如,一个账户具有账户基本特征、历史交易行为特征、账户登录特征等。应理解的是,一个账户的属性特征是反映该账户属性的特征,属性特征可以根据实际需要进行设置,例如通过人为选择属性特征,通过主成分分析确定属性特征等。在一个实施例中,属性特征可以包括账户的性别特征、年龄特征、历史交易金额特征、历史交易次数特征等。
应理解的是,属性特征的种类和数量需要与预设的图卷积网络模型一致,例如,预设的图卷积模型中选取的训练样本的属性特征数量为3,分别为账户名特征、历史交易金额特征、历史交易笔数特征,那么在对目标网络进行处理时,也需要获取目标网络中的每个账户的上述三个特征。
由于账户对应图中的节点,因此,账户的属性特征可以看作是账户对应的节点的属性特征。基于每个账户的属性特征构建目标网络的属性矩阵,可以通过多种方式实现。可以直接根据每个账户的属性特征构建属性矩阵,也可以先对每个账户的属性特征进行处理(如归一化处理、编码处理等),根据处理后的属性特征构建属性矩阵,这里不做限定。
然后,通过步骤S12构建目标网络的结构矩阵,即:获取所述每个账户的用于表征与其他账户是否存在关联的关联特征,并基于所述每个账户的关联特征构建所述目标网络的结构矩阵。
本说明书实施例中,一个账户的关联特征能够反映该账户与其他账户之间是否存在关联,即通过关联特征可以反映出节点与节点之间的联系紧密程度。关联特征可以根据实际需要进行设置,例如,关联特征可以为用于表征与其他账户是否存在转账交易的特征、用于表征与其他账户是否发生过代付的特征、用于表征与其他账户是否互为通讯录好友的特征等。
应理解的是,由于关联特征能够反映账户之间的关联程度,因此,通过关联特征可以确定节点与节点之间是否有边连接,或者确定节点与节点之间的距离远近等。
根据关联特征构建目标网络的结构矩阵可以通过多种方式实现。在一个实施例中,可以先根据每个账户的关联特征建立该节点与其他节点之间的边,然后通过计算与目标网络对应的图的邻接矩阵、拉普拉斯矩阵等以得到结构矩阵。
接下来,执行步骤S13:将所述属性矩阵以及所述结构矩阵输入至预设的图卷积网络模型中,得到所述每个账户的账户类型,所述账户类型为风险类型或正常类型。
本说明书实施例中,预设的图卷积网络模型为预先训练好的,用于对账户类型进行识别,识别结果包括两类,一类是风险类型,一类是正常类型。应说明的是,预设的图卷积网络模型的网络结构可以根据实际需要进行设定,例如图卷积网络模型的层数、每层的神经元数等。本说明书实施例中,为了实现对账户类别的识别,预设的图卷积网络模型的最后一层可以设置为分类器,如softmax分类器,用于对账户类型进行分类。
预设的图卷积网络模型的输入数据为属性矩阵和结构矩阵,输出为每个账户的账户类型,将目标网络的属性矩阵和结构矩阵输入至预设的图卷积网络模型中,即可得到目标网络中每个账户的账户类型。
最后,执行步骤S14:基于所述每个账户的账户类型,确定所述目标网络中的树状风险账户集合。
本说明书实施例中,在得到每个账户的账户类型之后,可以对风险类型账户进行重新构图,例如,针对风险类型账户,确定任意两个风险类型账户之间是否存在关联,如果存在关联,则这两个风险类型账户对应的节点有边连接,通过这种方式重新构建风险类型账户之间的图。进一步的,在重构图中确定是否存在树状结构的风险账户集合。
应理解的是,在树状作弊风险中,由于资金转移链路长,上层和中间账户没有作弊行为,因此,传统的分类方法无法识别这种树状风险账户,风险账户识别的错误率较高,导致对风险账户管控的效果较差,这样,就会需要消耗更多的计算机资源进行反复计算和校正。而本说明书实施例中,能够通过上述方案,通过构建属性矩阵以及结构矩阵,将网络中各个账户的自身属性以及账户之间的关联准确的刻画出来,因此识别出的账户类型更加精准,进而根据账户类型确定出的树状风险账户准确率更高,从而降低了计算机重新计算风险和校正错误的次数,进而节约了计算机资源。
在具体实施过程中,步骤S11可以通过以下步骤实现:针对所述每个账户,将该账户的属性特征按照预设顺序排列,获得一组特征序列;基于所述每个账户的特征序列,构建所述属性矩阵。
需要说明的是,属性特征可以包括数值型的特征,例如年龄特征、历史交易笔数特征、历史交易总额特征等,属性特征还可以包括非数值型的特征,例如性别特征、账户学历特征等。对于数值型的属性特征,可以直接用于特征序列的构建,对于非数值型的属性特征,可以先将非数值型的属性特征进行特征转换,例如进行one-hot编码,转换成数值型特征。
属性特征的预设顺序可以根据需要进行设定,本说明书实施例中,属性特征的预设顺序是与预设的图卷积网络模型所使用的属性特征顺序一致的。举例来讲,在训练图卷积网络模型时,使用的属性特征顺序依次为年龄特征、历史交易次数特征、历史交易金额特征,那么在构建目标网络的属性矩阵时,也需要使用商户属性特征的排列顺序。
针对每个账户,都可以根据属性特征的预设顺序构建一组特征序列,当属性特征数量为M时,每个账户的特征序列长度均为M。那么对于N个账户来说,属性矩阵可以为一个N行M列的矩阵,其中,属性矩阵的每一行分别对应一个账户的特征序列,属性矩阵的每一列分别对应一个属性特征下N个账户的属性特征数值,即,矩形矩阵第i行第j列的元素代表账户i的属性特征j的数值。
当然,还可以通过其他方式来构建属性矩阵,例如将每个账户的属性特征先进行归一化处理,在构建属性矩阵等,这里不做限定。
进一步的,步骤S12可以通过以下方式实现:根据所述每个账户的关联特征,确定所述目标网络的邻接矩阵,并将所述邻接矩阵作为所述结构矩阵。
本说明书实施例中,关联特征可以包括以下特征中的一者或多者:用于表征与其他账户是否存在相互交易的特征、用于表征与其他账户是否存在公用设备的特征,用于表征与其他账户是否互为通讯录好友的特征。当然,还可以包括其他特征,这里不做限定。
具体来讲,用于表征与其他账户是否存在相互交易的特征,是指账户之间是否存在转账、代付、收发红包等交易的特征;用于表征与其他账户是否存在共用设备的特征,是指不同的账户是否共用过同一台设备进行登录的特征;用于表征与其他账户是否互为通讯录好友的特征,是指一个账户是否存在于另一个账户的通讯录中的特征。
本实施例中,当一个账户的存在与其他账户的交易、公用设备、互为通讯录好友中的一种或多种时,该账户的关联特征可以为存在与其他账户的关联。如果一个账户与其他账户不存在上述几种情况时,则该账户的关联特征可以为不存在与其他账户的关联。
进一步的,根据关联特征来对目标网络中各个账户的对应的节点进行边连接。具体来讲,当一个账户的关联特征为不存在与其他账户的关联时,则该账户对应的节点与其他账户对应的节点均没有边连接,该结点为孤立的节点。当一个账户的关联特征为存在与其他账户的关联时,需要确定该账户与哪些账户存在关联,并将关联的节点进行边连接,下面分别以上述三种类型的关联特征为例,来对节点之间的边连接进行说明。
当关联特征表明一个账户与其他账户之间存在相互交易时,可以获取该账户的历史交易明细,例如,该账户为账户A,获取账户A的历史交易明细,历史交易明细中查找到账户A与账户B发生过转账,账户A与账户C发生过代付,那么账户B和账户C均与账户A存在关联,即账户A对应的节点与账户B对应的节点有边连接,账户A对应的节点与账户C对应的节点有边连接。
当关联特征表明一个账户与其他账户之间存在公用设备时,可以通过获取每个账户的历史登录设备信息,并将该账户的历史登录设备信息与其他账户的历史登录设备信息进行一一比对。例如,该账户为账户A,在获取到所有账户的历史登录设备信息之后,将账户A的历史登录设备信息与其他账户的历史登录设备信息进行比对,如果账户A的历史登录设备信息与账户D的历史登录设备信息相同时,则确定账户A和账户D对应的两个节点有边连接。
当关联特征表明一个账户与其他账户互为通讯录好友时,可以请求获取每个账户的常用设备中的通讯录信息。例如,在确定账户A是否与其他账户互为通讯录好友时,可以在除账户A以外的账户的通讯录信息中查找是否存在账户A的信息,如果在账户E的通讯录信息中存在账户A的信息(如账户A的用户真实姓名),则账户A对应的节点与账户E对应的节点有边连接。
应理解的是,在确定节点之间是否有边存在时,可以选择上述一种关联特征或几种关联特征来进行边连接。举例来说,可以选择只通过用于表征与其他账户是否存在相互交易的关联特征来确定节点之间的边,即当一个账户与其他账户存在转账、代付、收发红包等交易时,节点之间才有边连接,否则没有边连接。或者,可以通过用于表征与其他账户是否存在相互交易的关联特征、以及用于表征与其他账户是否存在公用设备的关联特征这两种关联特征来确定节点之间的边。即,当一个账户与其他账户存在转账、代付、收发红包等交易,和/或该账户与其他账户存在共用设备时,节点之间才有边连接,否则没有边连接。
通过上述方式,能够将目标网络对应的图中的节点和边定义好,下面可以计算该图的邻接矩阵,作为目标网络的结构矩阵。邻接矩阵是表示节点之间相邻关系的矩阵,本说明书实施例中,目标网络中共有N个账户,即节点数为N,那么邻接矩阵为N行N列的方阵。以目标网络对应的图为无向图为例,邻接矩阵用W为N行N列的矩阵,邻接矩阵中的元素Wij通过以下方式确定:当节点i和节点j邻接,即有边连接时,Wij为1,否则Wij为0,其中,i和j均为小于或等于N的正整数。当然,由于邻接矩阵用于表示节点与节点之间边的权重,因此权重的值可以根据需要进行设置,不局限于上面的例子。另外,目标网络对应的图还可以为有向图,此时需要计算有向图的邻接矩阵作为结构矩阵,这里不做限定。
本说明书实施例中,预设的图卷积网络是提前训练好的,具体可以通过以下方式进行训练:获取训练样本集合,所述训练样本集合中包括被标记为风险类型的样本,以及被标记为正常类型的样本;基于所述训练样本集合中每个训练样本的属性特征,构建样本属性矩阵,以及基于所述每个训练样本的关联特征,构建样本结构矩阵;建立初始的图卷积网络模型;基于所述样本属性矩阵以及所述样本结构矩阵,对所述初始的图卷积网络模型进行训练,得到训练好的图卷积网络模型,作为所述预设的图卷积网络模型。
本说明书实施例中,训练样本可以是任意网络中的账户,并且已经预先打好了标签,训练样本的标签分为两类,一类为风险类型,另一类为正常类型。其中,树状风险结构的账户以及其他存在风险的账户均可以标记为风险类型。进一步的,根据训练样本的属性特征,构建与训练样本对应的网络的样本属性矩阵,以及根据训练样本的关联特征,构建该网络的样本结构矩阵。样本属性矩阵和样本结构矩阵的构建方式,和上面目标网络的属性矩阵和结构矩阵的构建相同,这里就不再赘述了。
需要说明的是,本说明书实施例中,构建样本属性矩阵和构建目标网络的属性矩阵所使用的账户属性特征的类别都是相同的,例如,构建样本属性矩阵时,使用的样本账户的属性特征为属性特征a、属性特征b以及属性特征c,那么在构建目标网络的属性矩阵时,也需要获取目标网络账户的属性特征a、属性特征b以及属性特征c。同样的,如果构建样本结构矩阵时使用的是用于表征与其他账户是否存在相互交易的关联特征,那么在构建目标网络的结构矩阵时,也需要获取每个账户的用于表征与其他账户是否存在相互交易的关联特征,并根据该关联特征构建结构矩阵。
初始的图卷积网络模型可以根据实际需要进行设置,在本说明书实施例中,初始的图卷积网络模型包括1个输入层,2个隐藏层,一个输出层,其中,各层的神经元数可以根据实际需要进行设定,例如,输入层的神经元数为属性特征的数量,第一隐藏层的神经元数为125,第二隐藏层的神经元数为25,输出层的神经元数为5,各层的权重矩阵也为随机初始化的。为了实现对训练样本的分类,本说明书实施例中,输出层与分类器连接,例如softmax分类器,通过分类器来对训练样本进行分类。
在具体实施过程中,隐藏层即为卷积层,通过卷积运算将输入的目标网络的属性矩阵X和结构矩阵A映射到高维抽象空间中,本说明书实施例中,可以通过以下公式进行卷积运算:
Hl+1=f(Hl,A)=σ(AHlWl)
其中,Hl为第l层的节点特征,H0为属性矩阵X,σ表示非线性激活函数,Wl表示第l层的权重矩阵。
在经过隐藏层的卷积变换之后,得到了每个节点的特征向量,这些特征向量包含了节点所在的结构信息和属性信息,然后通过输出的softmax函数判断该节点所属的类型。
以非线性激活函数为Relu为例,上述图卷积网络模型的计算过程可以写成以下形式:
Z=f(A,X)=softmax(A*Re Lu(A*Re Lu(AXW0)W1)W2)
其中,W0、W1、W2分别为权重矩阵,在节点的真实标签为风险类型时,Z为节点属于各个类型的概率。
本说明书实施例中,通过softmax分类器实现二分类,因此,对于每个节点来说,输出的Z为二维向量,例如输出为[0.2,0.8],则表明节点属于第一分类的概率为0.2,属于第二分类的概率为0.8。其中,第一分类可以为正常类型,第二分类为风险类型,或者第一分类为风险类型,第二分类为正常类型。根据输出向量中最大的概率值,确定节点最终属于哪个类型。以第一分类为正常类型,第二分类为风险类型为例,上述输出向量[0.2,0.8]中,最大概率值为0.8,则表明预测的节点类型为第二分类的风险类型。
进一步的,构建图卷积网络模型的损失函数,损失函数可以采用以下交叉熵公式:
其中,Y是有标签的节点集合,i表示节点集合中的第i个样本,F表示样本的类别向量,向量长度等于标签类型数量,Yif表示第i个样本的第f个类别向量的值,Zif表示第i个样本是第f个类别的概率。
本说明书实施例中,样本包括两种类别,一种正常类型,一种风险类型,因此,F为二维向量。例如,当F为[0,1]时,表示样本的标签被标记为风险类型,F为[1,0]时,表示样本的标签被标记为正常类型。举例来讲,当一个样本,即一个节点为风险类型,F为[0,1],且通过图卷积网络处理预测得到的输出向量Z为[0.2,0.8],则通过上述公式得到预测值和真实标签之间的交叉熵为L=-(0×ln0.2+1×ln0.8)。
根据损失函数可以对初始的图卷积网络模型进行不断的调整,例如采用梯度下降法对各层的权重矩阵进行调整,当迭代调整的次数达到预设次数,或者对节点分类的正确率达到预设条件时,可以认为模型训练完成,将训练好的模型作为预设的图卷积网络模型,用于对未被标记的账户进行分类识别。
进一步的,通过预设的图卷积网络模型对目标网络中的每个账户进行分类,得到每个账户的账户类型,然后根据每个账户的账户类型,来确定树状风险账户,在具体实施过程中,可以通过以下方式实现:
获取所述账户类型为所述风险类型的多个风险账户;基于所述多个风险账户中每个账户的关联特征,构建所述多个风险账户的关联图;确定所述关联图中是否存在树状连接的多个账户,若存在,则将所述树状连接的多个账户确定为所述树状风险账户集合。
本说明书实施例中,在确定了每个账户的账户类型之后,将风险类型的风险账户筛选出来,重新构建这些风险类型账户的关联图。在构建关联图时,每个风险账户看作是关联图的一个节点,根据每个风险账户的关联特征,来确定节点之间是否有边连接。例如,当关联特征为用于表征与其他账户是否存在相互交易的关联特征时,判断一个节点是否与其他节点有无边连接,需要根据该节点对应的账户是否与其他节点对应的账户之间是否存在转账、代付、收发红包等交易,若存在,则有边连接,否则没有边连接。
得到重新构建的关联图后,进一步判断关联图中是否存在树状结构,在一个实施例中,可以将孤立的节点去除掉,然后将关联图中的连通图提取出来,可以将连通图中的各个节点所对应的账户的集合作为树状风险账户集合。当然,还可以进一步对连通图进行判断,例如,判断连通图中是否有明显的上下层分级,通过预设的树状结构的一些特征来进行进一步判断,当提取的连通图满足预设的树状结构特征时,则确定连通图中各节点所对应的账户的集合为树状风险账户集合。
综上所述,本说明书实施例中的方案,属性矩阵能够反映目标网络中每个账户的自身属性,结构矩阵能够反映账户与账户之间的关联,例如能够反映账户之间的资金转移交易等关联,这样,可以将目标网络看作为图结构,账户看作是图结构中的节点,属性矩阵和结构矩阵则分别对应了图的节点属性信息和图的网络结构信息。通过预设的图卷积网络模型能够不仅对节点属性信息进行判断,还综合了图的网络结构信息,将风险账户之间的关联也考虑在内,因此识别出的账户类型更加精准,进而根据账户类型确定出的树状风险账户集合准确率更高。由于树状风险账户集合的识别准确率提高,降低了计算机重新计算风险和校正错误的次数,进而节约了计算机资源。
第二方面,基于同一发明构思,本说明书实施例提供一种树状风险账户识别装置,应用于由多个账户构成的目标网络中,请参考图2,包括:
属性矩阵构建模块21,用于获取所述每个账户的属性特征,并基于所述每个账户的属性特征构建所述目标网络的属性矩阵;
结构矩阵构建模块22,用于获取所述每个账户的用于表征与其他账户是否存在关联的关联特征,并基于所述每个账户的关联特征构建所述目标网络的结构矩阵;
识别模块23,用于将所述属性矩阵以及所述结构矩阵输入至预设的图卷积网络模型中,得到所述每个账户的账户类型,所述账户类型为风险类型或正常类型;
账户确定模块24,用于基于所述每个账户的账户类型,确定所述目标网络中的树状风险账户集合。
在一种可选实现方式中,属性矩阵构建模块21,用于:
针对所述每个账户,将该账户的属性特征按照预设顺序排列,获得一组特征序列;
基于所述每个账户的特征序列,构建所述属性矩阵。
在一种可选实现方式中,结构矩阵构建模块22,用于:
根据所述每个账户的关联特征,确定所述目标网络的邻接矩阵,并将所述邻接矩阵作为所述结构矩阵。
在一种可选实现方式中,所述关联特征包括以下特征中的一者或多者:用于表征与其他账户是否存在相互交易的特征、用于表征与其他账户是否存在共用设备的特征,用于表征与其他账户是否互为通讯录好友的特征。
在一种可选实现方式中,所述预设的图卷积网络通过以下方式获得:
获取训练样本集合,所述训练样本集合中包括被标记为风险类型的样本,以及被标记为正常类型的样本;
基于所述训练样本集合中每个训练样本的属性特征,构建样本属性矩阵,以及基于所述每个训练样本的关联特征,构建样本结构矩阵;
建立初始的图卷积网络模型;
基于所述样本属性矩阵以及所述样本结构矩阵,对所述初始的图卷积网络模型进行训练,得到训练好的图卷积网络模型,作为所述预设的图卷积网络模型。
在一种可选实现方式中,账户确定模块24,用于:
获取所述账户类型为所述风险类型的多个风险账户;
基于每个风险账户的关联特征,构建所述多个风险账户的关联图;
确定所述关联图中是否存在树状连接的多个账户,若存在,则将所述树状连接的多个账户确定为所述树状风险账户集合。
关于上述装置,其中各个模块的具体功能已经在本发明实施例提供的树状风险账户识别方法的实施例中进行了详细描述,此处将不做详细阐述说明。
第三方面,基于与前述实施例中树状风险账户识别方法同样的发明构思,本发明还提供一种树状风险账户识别装置,如图3所示,包括存储器404、处理器402及存储在存储器404上并可在处理器402上运行的计算机程序,所述处理器402执行所述程序时实现前文所述树状风险账户识别方法的任一方法的步骤。
其中,在图3中,总线架构(用总线400来代表),总线400可以包括任意数量的互联的总线和桥,总线400将包括由处理器402代表的一个或多个处理器和存储器404代表的存储器的各种电路链接在一起。总线400还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口406在总线400和接收器401和发送器403之间提供接口。接收器401和发送器403可以是同一个元件,即收发机,提供用于在传输介质上与各种其他装置通信的单元。处理器402负责管理总线400和通常的处理,而存储器404可以被用于存储处理器402在执行操作时所使用的数据。
第四方面,基于与前述实施例中基于树状风险账户识别方法的发明构思,本发明还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现前文所述基于树状风险账户识别方法的任一方法的步骤。
本说明书是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的设备。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令设备的制造品,该指令设备实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。