CN111447082B - 关联账号的确定方法、装置和关联数据对象的确定方法 - Google Patents

关联账号的确定方法、装置和关联数据对象的确定方法 Download PDF

Info

Publication number
CN111447082B
CN111447082B CN202010146808.6A CN202010146808A CN111447082B CN 111447082 B CN111447082 B CN 111447082B CN 202010146808 A CN202010146808 A CN 202010146808A CN 111447082 B CN111447082 B CN 111447082B
Authority
CN
China
Prior art keywords
account
target
group
self
account number
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010146808.6A
Other languages
English (en)
Other versions
CN111447082A (zh
Inventor
刘佳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN202010146808.6A priority Critical patent/CN111447082B/zh
Publication of CN111447082A publication Critical patent/CN111447082A/zh
Application granted granted Critical
Publication of CN111447082B publication Critical patent/CN111447082B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/145Network analysis or design involving simulating, designing, planning or modelling of a network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/02Details
    • H04L12/16Arrangements for providing special services to substations
    • H04L12/18Arrangements for providing special services to substations for broadcast or conference, e.g. multicast
    • H04L12/1813Arrangements for providing special services to substations for broadcast or conference, e.g. multicast for computer conferences, e.g. chat rooms
    • H04L12/1822Conducting the conference, e.g. admission, detection, selection or grouping of participants, correlating users to one or more conference sessions, prioritising transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本说明书提供了关联账号的确定方法、装置和关联数据对象的确定方法。在一个实施例中,上述关联账号的确定方法通过先建立包含了目标账号和可能为目标账号的关联账号的待定账号的目标群组;再确定出目标群组中各个账号的特征向量;进一步利用事先训练好的包含有self‑attention层的预设的处理模型根据上述目标群组中账号的特征向量,确定出针对该目标群组的自相似矩阵;进而可以根据自相似矩阵中表征群组中不同账号之间的关联关系的相似度参数,较为高效地从待定账号中确定出与目标账号紧密相关的关联账号,从而提高了搜寻、确定关联账号的效率。

Description

关联账号的确定方法、装置和关联数据对象的确定方法
技术领域
本说明书属于互联网技术领域,尤其涉及关联账号的确定方法、装置和关联数据对象的确定方法。
背景技术
在一些针对网络上的违规行为(例如,违规交易、风险交易等)的监控场景中,违规者往往可能还会同时拥有并操控其他多个关联账号,或者违规者的同伙会使用其他关联账号来进行或协助实现违规行为。
网络监控机构或平台在发现某个实施违规行为的目标账号后,希望能够进一步搜索并找到与该目标账号相关的其他关联账号,以便可以一并进行处理。
因此,目前亟需一种能够高效地搜寻、确定出目标账号的关联账号的方法。
发明内容
本说明书提供了一种关联账号的确定方法、装置和关联数据对象的确定方法,以提高搜寻、确定与目标账号紧密相关的关联账号的效率。
本说明书提供的关联账号的确定方法、装置和关联数据对象的确定方法是这样实现的:
一种关联账号的确定方法,包括:建立针对目标账号的目标群组,其中,所述目标群组包括目标账号和待定账号;确定出所述目标群组中账号的特征向量;利用预设的处理模型,根据所述目标群组中账号的特征向量,确定出目标群组的自相似矩阵,其中,所述预设的处理模型至少包括self-attention层,所述目标群组的自相似矩阵包含有所述目标群组中账号之间的特征相似度参数,所述特征相似度参数用于表征目标群组中的账号之间的关联关系;根据所述目标群组的自相似矩阵,确定出目标账号的关联账号。
一种关联账号的确定装置,包括:建群模块,用于建立针对目标账号的目标群组,其中,所述目标群组包括目标账号和待定账号;第一确定模块,用于确定出所述目标群组中账号的特征向量;第二确定模块,用于利用预设的处理模型,根据所述目标群组中账号的特征向量,确定出目标群组的自相似矩阵,其中,所述预设的处理模型至少包括self-attention层,所述目标群组的自相似矩阵包含有所述目标群组中账号之间的特征相似度参数,所述特征相似度参数用于表征目标群组中的账号之间的关联关系;第三确定模块,用于根据所述目标群组的自相似矩阵,确定出目标账号的关联账号。
一种关联数据对象的确定方法,包括:建立针对目标数据对象的目标对象组,其中,所述目标对象组包括目标数据对象和待定数据对象;确定出所述目标对象组中数据对象的特征向量;利用预设的处理模型,根据所述目标对象组中数据对象的特征向量,确定出目标对象组的自相似矩阵,其中,所述预设的处理模型至少包括self-attention层,所述目标对象组的自相似矩阵包含有所述目标对象组中数据对象之间的特征相似度参数,所述特征相似度参数用于表征目标对象组中的数据对象之间的关联关系;根据所述目标对象组的自相似矩阵,确定出目标数据对象的关联数据对象。
一种服务器,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器执行所述指令时实现建立针对目标账号的目标群组,其中,所述目标群组包括目标账号和待定账号;确定出所述目标群组中账号的特征向量;利用预设的处理模型,根据所述目标群组中账号的特征向量,确定出目标群组的自相似矩阵,其中,所述预设的处理模型至少包括self-attention层,所述目标群组的自相似矩阵包含有所述目标群组中账号之间的特征相似度参数,所述特征相似度参数用于表征目标群组中的账号之间的关联关系;根据所述目标群组的自相似矩阵,确定出目标账号的关联账号。
一种计算机可读存储介质,其上存储有计算机指令,所述指令被执行时实现建立针对目标账号的目标群组,其中,所述目标群组包括目标账号和待定账号;确定出所述目标群组中账号的特征向量;利用预设的处理模型,根据所述目标群组中账号的特征向量,确定出目标群组的自相似矩阵,其中,所述预设的处理模型至少包括self-attention层,所述目标群组的自相似矩阵包含有所述目标群组中账号之间的特征相似度参数,所述特征相似度参数用于表征目标群组中的账号之间的关联关系;根据所述目标群组的自相似矩阵,确定出目标账号的关联账号。
本说明书提供的关联账号的确定方法、装置和关联数据对象的确定方法,通过先建立包含了目标账号,以及可能为目标账号的关联账号的待定账号的目标群组;再确定出所述目标群组中各个账号的特征向量;进一步利用事先训练好的包含有self-attention层的预设的处理模型根据上述目标群组中账号的特征向量,确定出针对该目标群组的自相似矩阵;进而可以根据自相似矩阵中表征群组中不同账号之间的关联关系的相似度参数,较为高效地从待定账号中确定出与目标账号紧密相关的关联账号,从而可以有效提高搜寻、确定关联账号的效率。
附图说明
为了更清楚地说明本说明书实施例,下面将对实施例中所需要使用的附图作简单地介绍,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是应用本说明书实施例提供的关联账号的确定方法的系统结构组成的一个实施例的示意图;
图2是在一个场景示例中,应用本说明书实施例提供的关联账号的确定方法的一种实施例的示意图;
图3是在一个场景示例中,应用本说明书实施例提供的关联账号的确定方法的一种实施例的示意图;
图4是本说明书的一个实施例提供的关联账号的确定方法的流程示意图;
图5是本说明书的一个实施例提供的获取预设的处理模型的示意图;
图6所本说明书的一个实施例提供的关联数据对象的确定方法的流程示意图;
图7是本说明书的一个实施例提供的服务器的结构组成示意图;
图8是本说明书的一个实施例提供的关联账号的确定装置的结构组成示意图。
具体实施方式
为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。
本说明书实施例提供一种关联账号的确定方法,该方法具体可以应用于包含有监控服务器和监控终端的系统中。
具体的,可以参阅图1所示。监控服务器可以先基于目标账号,筛选出与目标账号可能相关的其他账号作为待定账号,来建立针对目标账号的,包含有目标账号和待定账号的目标群组。进一步,监控服务器可以将上述目标群组中的账号信息发送给监控终端。监控终端采集获取上述目标群组中各个账号的属性数据和行为数据,并将上述账号的属性数据和行为数据反馈给监控服务器。监控服务器可以利用预设的处理模型,根据所述目标群组中账号的特征向量,确定出目标群组的自相似矩阵,其中,所述预设的处理模型至少包括self-attention层,所述目标群组的自相似矩阵包含有所述目标群组中账号之间的特征相似度参数,所述特征相似度参数用于表征目标群组中的账号之间的关联关系;再根据所述目标群组的自相似矩阵,确定出目标账号的关联账号。进而监控服务器可以调用监控终端对上述目标账号的关联账号进行进一步的监控,或者对关联账号进行相应处理。
在本实施例中,所述监控服务器具体可以包括一种应用于业务处理平台一侧,能够实现数据传输、数据处理等功能的负责数据处理的服务器。具体的,所述监控服务器例如可以为一个具有数据运算、存储功能以及网络交互功能的电子设备。或者,所述监控服务器也可以为运行于该电子设备中,为数据处理、存储和网络交互提供支持的软件程序。在本实施例中,并不具体限定所述服务器的数量。所述监控服务器具体可以为一个服务器,也可以为几个服务器,或者,由若干服务器形成的服务器集群。
在本实施例中,所述监控终端具体可以包括一种能够针对账号,或者账号所登录使用的设备进行相关数据采集、实现数据传输等功能的电子设备或者程序插件等。
在一个具体的场景示例中,可以参阅图2所示,风险交易监控处理系统的监控服务器在接收并根据用户的投诉,确定A账号为涉及参与商品虚假宣传等违规行为的目标账号后,为了阻止A账号的持有者通过所拥有的其他账号继续进行商品虚假宣传,可以应用本说明书所提供的关联账号的确定方法,来搜寻、确定出与A账号关系密切的其他关联账号,可以记为团伙账号。例如A账号的使用者所拥有的除A账号以外用于参与商品虚假宣传等违规行为的账号,或者是与A账号的使用者关系密切的其他人(例如A账号的使用者的同伙)所拥有的用于参与商品虚假宣传等违规行为的账号。
在本场景示例中,具体实施时,风险交易监控处理系统的监控服务器在将上述A账号确定为存在交易风险,涉及违规行为的目标账号后,进一步,监控服务器可以通过监控终端采集获取与A账号相关的记录数据。
首先,考虑到A账号的关联账号由于也会涉及参与到上述商品虚假宣传等违规行为,甚至有时还会与A账号配合共同进行商品虚假宣传等违规行为。因此,A账号与关联账号之间往往会有较大的概率存在交互联系。基于上述考虑,可以先确定出A账号的通讯录,再基于通讯录圈定出针对A账号的待定账号。
其中,上述待定账号具体可以理解相对于普通账号,有可能是A账号的关联账号,待需要进一步确定的账号。
具体实施时,监控终端可以先确定出A账号的登录设备(也可以称为介质设备),例如,A账号登录时所使用的手机;进一步,可以从上述登录设备中读取得到A账号的手机通讯录作为上述A账号的通讯录。当然,监控终端还可以通过读取A账号的登录设备上针对某个关键应用(例如,淘宝APP)的缓存数据,读取出A账号在该关键应用中的好友名单,作为上述A账号的通讯录。进而后续,可以将A账号的通讯录中与A账号存在交互联系的账号确定为待定账号。
其次,又考虑到A账号的使用者,如果除A账号外还拥有多个其他的关联账号,则A账号的使用者可能会使用同一个登录设备来登录其他的关联账号。基于上述考虑,监控终端还可以读取获取A账号的登录设备的使用记录,以便从上述使用记录中圈定出和A账号一样使用登录过该登录设备的其他账号作为待定账号。
此外,还考虑到A账号的使用者在通过A账号实施违规行为时,还可能会涉及到资金等数据的转移变动。例如,A账号的使用者往往会将A账号通过实施违规行为得到的资金数据转移到其他的关联账号上。因此,监控终端还可以采集A账号预设时间段(例如最近一周)的资金变动记录,以便确定出预设时间段里与A账号发生过资金往来的账号,进而可以从上述账号中圈定出待定账号。
需要说明的是,上述所列举的与A账号相关的记录数据,以及获取方式只是一种示意性说明。具体实施时,根据具体的应用场景和精度要求,还可以引入其他类型的数据作为A账号相关的记录数据,并采用其他合适的方式进行获取。对此,本说明书不作限定。
在本场景示例中,为了缩减需要进一步确定的待定账号的数量。具体实施时,监控服务器可以综合上述所获取的A账号预设时间段的资金变动记录、A账号的通讯录,以及A账号的登录设备的使用记录,来筛选出属于关联账号的概率相对更高的账号作为符合预设要求的待定账号。
具体实施时,监控服务器可以先从A账号的通讯录中提取出多个账号作为第一类账号;根据A账号的登录设备的使用记录,确定出该登录设备登录过的除A账号以外的其他账号作为第二类账号;根据A账号的预设时间段的资金变动记录,确定出在预设时间段与A账号发生过资金变动的其他账号作为第三类账号。进一步,监控服务器可以根据上述第一类账号、第二类账号和第三类账号,筛选出同时满足上述三类账号中的至少两类账号的账号作为符合预设要求的待定账号。
例如,根据上述三类账号,发现其中的B账号只属于第三类账号,而C账号即属于第一类账号,又属于第二类账号,则可以判断C账号相对于B账号与A账号的关系更为紧密,更有可能是A账号的关联账号。因此,相对于B账号,可以将C作为符合预设要求的账号,即将C账号确定为A账号的待定账号。
当然,需要说明的是,上述所列举的基于上述A账号的预设时间段的资金变动记录、通讯录以及A账号的登录设备的使用记录,来筛选出关联账号的方式只是一种示意性说明。具体实施时,根据具体的应用场景,还可以采用其他合适的方式来筛选出符合预设要求的待定账号。
例如,监控服务器还可以根据A账号的通讯录,从第一类账号中筛选出预设时间段内与A账号通讯较为频繁的账号作为待定账号。可以根据A账号的预设时间段的资金变动记录,从第二类账号中筛选出与账号的发生资金变动的资金额数值较大的账号作为待定账号。还可以根据A账号的登录设备的使用记录,从第三类账号中筛选出在登录设备登录时出现过登录失败记录,例如,人脸登录识别失败记录等的账号作为上述待定账号。
在本场景示例中,监控服务器可以将上述确定出的多个待定账号与A账号组合,作为一个群组,可以记为针对A账号的目标群组。后续可以基于该目标群组中账号之间关联关系来找到与A账号关系紧密的关联账号。
具体的,监控服务器可以通过监控终端,有针对性地搜集获取目标群组中的各个账号(包括A账号和关联账号)在静态属性维度上的属性数据,以及在动态行为维度上的行为数据。
具体实施时,监控服务器可以通过监控终端采集目标群组中各个账号的注册用户的年龄信息、职业信息,账号的实名认证结果、信用评价,以及账号注册时使用的手机号码、身份证号等身份证明信息等,作为各个账号的属性数据。当然,需要说明的是,上述所列举的账号的属性数据只是一种示意性说明。具体实施时,根据具体的应用场景和处理需要,还可以采集获取其他类型的静态数据作为账号的属性数据。对此,本说明书不作限定。
监控服务器还可以通过监控终端采集目标群组中各个账号的大额转账记录、账号登录失败记录、账号的转账次数,或者其他与违规行为可能存在关联的行为记录,作为各个账号的行为数据。当然,需要说明的是,上述所列举的账号的行为数据只是一种示意性说明。具体实施时,根据具体的应用场景和处理需要,还可以采集获取其他类型的动态数据,例如,账号推送的广告数量、账号与外地账号发生交互的次数等,作为账号的行为数据。对此,本说明书不作限定。
在得到上述目标群组中各个账号的属性数据和行为数据后,可以参阅图3所示,监控服务器可以根据各个账号的属性数据和行为数据分别计算出对应各个账号的特征向量。
进一步,监控服务器可以调用事先训练好的预设的处理模型对上述目标群组中的各个账号的特征向量进行处理,得到能够反映出各个账号的特征向量之间的相似度的自相似矩阵。进而可以根据上述自相似矩阵,通过分析不同账号的特征向量之间的相似度情况,来判断不同账号之间的关联关系。最后可以根据该目标群组中不同账号之间的关联关系,找到与目标账号关系较为紧密的待定账号作为该目标账号的关联账号。
其中,上述预设的处理模型具体可以包括一种训练好的包含有self-attention层的神经网络模型。通过该预设的处理模型,可以提取并输出在利用self-attention层根据目标群组中各个账号的特征向量计算该目标群组中各个账号所对应的隐特征向量过程中生成的自相似矩阵。
其中,上述自相似矩阵具体可以包括目标群组中各个账号之间的特征相似度参数,每一个特征相似度参数用于表征所对应的两个账号的特征之间的相似程度。进一步,每一个特征相似度参数通过表征上述两个账号的特征之间的相似程度,可以间接反映出所对应的两个之间的关联关系。具体的,如果一个特征相似度参数的数值越大,表示该特征相似度参数所对应的两个账号的特征之间的相似程度越高,相应的,上述两个账号之间的关联关系越紧密。相对的,如果一个特征相似度参数的数值越小,表示该特征相似度参数所对应的两个账号的特征之间的相似程度越低,相应的,上述两个账号之间的关联关系越疏远。
上述self-attention层具体可以包括一种基于自注意力机制结合目标群组中其他账号的特征向量,通过对原账号的特征向量进行抽象处理,得到对应的隐特征向量的神经网络层。其中,上述隐特征向量具体可以理解为一种不表征具体实际的物理含义,但与原账号对应,表征该账号的抽象特征的浮点向量。
通常在利用self-attention层对输入的目标群组中的各个账号的特征向量进行抽象处理得到各个账号的隐特征向量的过程中会生成对应该目标群组的自相似矩阵。
在本场景示例中,具体实施时,监控服务器可以将A账号的目标群组中各个账号的特征向量作为模型输入,输入至上述预设的处理模型中,并运行上述预设的处理模型。上述预设的处理模型具体运行时,在通过self-attention层集合目标群组中其他账号的特征向量来计算各个账号的隐特征向量时,会生成针对该目标群组整体的自相似矩阵;进而可以将上述自相似矩阵作为模型输出,反馈给监控服务器。这样监控服务器就可以获得针对该目标群组的自相似矩阵。
在监控服务器通过预设的处理模型得到上述自相似矩阵后,监控服务器可以根据上述自相似矩阵中所包含的特征相似度参数,筛选出与A账号之间的特征相似度参数大于预设的相似度参数阈值的待定账号,作为与A账号相对关系较为紧密的账号,并将上述账号确定为A账号的关联账号。其中,上述预设的相似度参数阈值可以根据具体的应用场景和精度要求,灵活设置。对此,本说明书不作限定。
例如,按照上述方式,可以从目标群组中所包含的多个待定账号中筛选出C账号、F账号和H账号这三个账号作为与A账号关系较为紧密的关联账号。
进一步,监控服务器可以通过监控终端有针对性地对上述关联账号C账号、F账号和H账号进行进一步的监控,并采集上述三个账号的行为数据,以便根据监控结果和行为数据确定上述三个账号是否也涉及参与违规行为。如果确定上述三个账号也涉及参与违规行为,可以将上述三个账号,连同A账号一同进行封号处理,从而可以有效地阻止A账号使用者,或者A账号使用者的同伙继续使用其他账号在网络上进行商品虚假宣传等违规行为。从而可以较好地维护网络环境,保护网上正常用户的合法权益。
由上述场景示例可见,本说明书提供的关联账号的确定方法,通过先建立包含了目标账号和可能为关联账号的待定账号的目标群组,并获取该目标群组中的各个账号的属性数据和行为数据;再基于各个账号的属性数据和行为数据计算出对应账号的特征向量;进一步利用事先训练好的包含有self-attention层的预设的处理模型根据上述目标群组中账号的特征向量,确定出针对该目标群组的自相似矩阵;进而可以根据自相似矩阵中表征群组中不同账号之间的关联关系的相似度参数,较为高效地从待定账号中确定出与目标账号紧密相关的关联账号,提高了搜寻、确定关联账号的效率。
参阅图4所示,本说明书实施例提供了一种关联账号的确定方法。其中,该方法具体应用于服务器一侧。具体实施时,该方法可以包括以下内容。
S401:建立针对目标账号的目标群组,其中,所述目标群组包括目标账号和待定账号。
在一些实施例中,上述目标账号具体可以包括涉及参与违规行为(例如,高危行为)的账号。具体的,上述违规行为可以包括商品的虚假宣传,也可以包括在网上散布违规信息或敏感信息,还可以包括涉及参与或协助诈骗、赌博等违法行为的操作等等。上述账号具体可以是用户在网上,或者在某个应用程序中使用的账号。例如,淘宝账号,或者支付宝账号等。
当然,上述所列举的目标账号只是一种示意性说明。具体实施时,根据具体的应用场景和处理需要,上述目标账号也可以是一种包含有已经确定命中某个关注属性的账号。例如,在客服服务场景中,上述目标账号可以是命中客户关于使用咨询的属性的账号。
在一些实施例中,上述待定账号具体可以包括可能与目标账号存在较为紧密关联的,需要进一步确定是否为目标账号的关联账号的账号。
其中,上述关联账号可以包括一种与目标账号关系紧密的账号。具体的,上述关联账号可以包括一种团伙账号。例如,上述关联账号可以是目标账号使用者所使用的其他小号,也可以是目标账号的使用者的同伙所使用账号等。当然,上述所列举的关联账号只是一种示意性说明。具体实施时,根据具体的应用场景和处理需要,上述关联账号还可以包括其他类型的与目标账号关系紧密的账号。对此,本说明书不作限定。
在一些实施例中,上述目标群组具体可以理解为一种账号组合,其中,上述目标群组中具体可以包括目标账号,以及一个或多个待定账号。
在一些实施例中,服务器可以根据接收用户的投诉信息,例如,投诉邮件;根据用户的投诉信息,将被投诉的涉及参与违规行为的账号确定为上述目标账号。服务器也可以通过对网络上在线账号进行监测,将监测到的涉及参与或者协助进行违规行为的账号(例如,对普通用户而言存在交易风险的账号)确定为目标账号等。
在一些实施例中,服务器可以先获取并根据与目标账号相关的记录数据,确定出一个或多个待定账号;再将上述目标账号和待定账号组合,建立针对目标账号的目标群组。
在一些实施例中,上述与目标账号相关的记录数据具体可以包括以下所列举的记录数据中的一种或多种:目标账号预设时间段的资金变动记录、目标账号的通讯录、目标账号的登录设备的使用记录等等。当然,需要说明的是,上述所列举的记录数据只是一种示意性说明。具体实施时,根据具体情况,还可以获取除上述所列举的记录数据以外其他类型的数据作为上述与目标账号相关的记录数据。对此,本说明书不作限定。
在一些实施例中,为了能够较为精准地筛选出待定账号,以减少后续确定关联账号的范围,可以综合利用上述目标账号预设时间段的资金变动记录、目标账号的通讯录、目标账号的登录设备的使用记录等多种与目标账号相关的记录数据来确定出待定账号。
具体的,服务器可以将目标账号的通讯录中所保存的多个账号确定为第一类账号,将目标账号的登录设备的使用记录中所记录的通过该登录设备所登录过的其他账号确定为第二类账号;将目标账号预设时间段的资金变动记录中所记录的与目标账号在预设时间段发生过资金变动交互的其他账号确定为第三类账号;进一步,服务器可以从第一类账号、第二类账号和第三类账号所包含的账号中,筛选出同时属于两种类型的账号,和/或同时属于上述三种类型的账号作为符合预设要求的待定账号。
此外,服务器也可以根据上述目标账号预设时间段的资金变动记录、目标账号的通讯录、目标账号的登录设备的使用记录,分别建立包含有对应类型账号的资金图、通讯图和设备图这三种记录中的账号分布图;再通过对上述三种账号分布图进行切分聚集等处理,确定出符合预设要求的待定账号等。
当然,需要说明的是,上述所列举的待定账号的筛选方式只是一种示意性说明。具体实施时,根据具体的应用场景和处理要求,还可以采用其他合适的方式来筛选出目标账号的待定账号。例如,为了进一步缩小待定账号的数据量,服务器在得到了目标账号预设时间段的资金变动记录、目标账号的通讯录、目标账号的登录设备的使用记录后,还可以进一步采集上述目标账号预设时间段的资金变动记录、目标账号的通讯录、目标账号的登录设备的使用记录上述记录数据所涉及到的账号的特征信息,例如,上述记录数据所涉及到的账号的转账频率、与目标账号的通讯频率等等。进而可以根据上述目标账号预设时间段的资金变动记录、目标账号的通讯录、目标账号的登录设备的使用记录,结合账号的特征信息,更加精准地确定出待定账号。
在一些实施例中,服务器可以通过组合将目标账号和上述筛选出的待定账号组合在一起,建立一个后续处理分析的群组,作为针对该目标账号的目标群组。
S402:确定出所述目标群组中账号的特征向量。
在一些实施例中,上述确定出所述目标群组中账号的特征向量,具体实施时,可以包括以下内容:获取所述目标群组中的账号的属性数据和行为数据;根据所述账号的属性数据和行为数据,确定出所述目标群组中账号的特征向量。
在一些实施例中,上述账号的属性数据,具体可以包括一种基于静态维度,用于表征账号的静态属性特征的数据。具体的,上述账号的属性数据可以包括:账号的注册用户的年龄信息、职业信息,账号的实名认证结果、信用评价,以及账号注册时使用的手机号码、身份证号等身份证明信息等。当然,需要说明的是,上述所列举的账号的属性数据只是一种示意性说明。具体实施时,根据具体的应用场景和处理需要,还可以采集获取其他类型的静态数据作为账号的属性数据。对此,本说明书不作限定。
在一些实施例中,上述账号的行为数据,具体可以包括一种基于动态维度,用于表征账号的动态行为特征的数据。具体的,上述账号的行为数据可以包括:账号的大额转账记录、账号登录失败记录、账号的转账次数等。当然,需要说明的是,上述所列举的账号的行为数据只是一种示意性说明。具体实施时,根据具体的应用场景和处理需要,还可以采集获取其他类型的动态数据,例如,账号推送的广告数量、账号与外地账号发生交互的次数等,作为账号的行为数据。对此,本说明书不作限定。
在一些实施例中,具体实施时,服务器可以通过查询相应的数据库或记录文件,或者有针对性地对上述目标群组中的账号进行监测和数据采集,来获取目标群组中各个账号的上述属性数据和行为数据。
在一些实施例中,上述账号的特征向量具体可以理解为一种基于账号的属性数据和行为数据得到的,具有实际的物理含义,能够表征出所对应账号的特征的向量。
在一些实施例中,具体实施时,服务器可以根据目标群组中各个账号的属性数据和行为数据,通过特征向量计算,得到分别对应于目标群组中的各个账号的特征向量。
S403:利用预设的处理模型,根据所述目标群组中账号的特征向量,确定出目标群组的自相似矩阵,其中,所述预设的处理模型至少包括self-attention层,所述目标群组的自相似矩阵包含有所述目标群组中账号之间的特征相似度参数,所述特征相似度参数用于表征目标群组中的账号之间的关联关系。
在一些实施例中,上述预设的处理模型具体可以包括一种训练好的包含有self-attention层的神经网络模型。通过该预设的处理模型,可以提取并输出在利用self-attention层根据目标群组中各个账号的特征向量计算该目标群组中各个账号所对应的隐特征向量过程中生成的自相似矩阵。
其中,上述自相似矩阵具体可以包括目标群组中各个账号之间的特征相似度参数,每一个特征相似度参数用于表征所对应的两个账号的特征之间的相似程度。进一步,每一个特征相似度参数通过表征上述两个账号的特征之间的相似程度,可以间接反映出所对应的两个之间的关联关系。具体的,如果一个特征相似度参数的数值越大,表示该特征相似度参数所对应的两个账号的特征之间的相似程度越高,相应的,上述两个账号之间的关联关系越紧密。相对的,如果一个特征相似度参数的数值越小,表示该特征相似度参数所对应的两个账号的特征之间的相似程度越低,相应的,上述两个账号之间的关联关系越疏远。
上述self-attention层具体可以包括一种基于自注意力机制结合目标群组中其他账号的特征向量,通过对原账号的特征向量进行抽象处理,得到对应的隐特征向量的神经网络层。其中,上述隐特征向量具体可以理解为一种不表征具体实际的物理含义,但与原账号对应,表征该账号的抽象特征的浮点向量。
通常在利用self-attention层对输入的目标群组中的各个账号的特征向量进行抽象处理得到各个账号的隐特征向量的过程中会生成对应该目标群组的自相似矩阵。
在一些实施例中,具体实施时,服务器可以将目标群组中各个账号的特征向量作为模型输入,输入至上述预设的处理模型中,并运行上述预设的处理模型。预设的处理模型具体运行时,会通过所包含的self-attention层根据该目标群组中的各个账号的特征向量计算对应的隐特征向量,同时提取出在计算隐特征向量的过程中生成的针对该目标群组的自相似矩阵,进而将该自相似矩阵作为模型输出,反馈给服务器。
S404:根据所述目标群组的自相似矩阵,确定出目标账号的关联账号。
在一些实施例中,服务器可以根据上述目标群组的自相似矩阵所包含的各个账号之间的特征相似度参数,筛选出与目标账号之间的特征相似度参数大于预设的相似度参数阈值的待定账号,并判断这类账号为与目标账号关系较为紧密的账号,进而可以将这类账号确定为目标账号的关联账号。
其中,上述预设的相似度参数阈值可以根据具体的应用场景和精度要求,灵活设置。对于预设的相似度参数阈值的具体取值,本说明书不作限定。
在一些实施例中,在确定出目标账号的关联账号,进一步,可以针对目标账号和关联账号一并进行相应处理。例如,同时对上述目标账号和关联账号进行封号处理。或者同时对上述目标账号和关联账号发送警告信息等。
在一些实施例中,在按照上述方式确定出目标账号的关联账号后,还可以有针对性对上述关联账号进行监测和行为数据采集,并根据上述关联账号的监测结果和行为数据,对上述关联账号是否真的是目标账号的关联账号进行校验。再校验通过时,将上述关联账号正式确定为目标账号的关联账号,并对上述关联账号进行相应处理,从而可以避免由于误差,对原本不是关联账号的普通账号进行了误处理。
在本实施例中,通过先建立包含了目标账号和可能为关联账号的待定账号的目标群组,并获取该目标群组中的各个账号的属性数据和行为数据;再基于各个账号的属性数据和行为数据计算出对应账号的特征向量;进一步利用事先训练好的包含有self-attention层的预设的处理模型根据上述目标群组中账号的特征向量,确定出针对该目标群组的自相似矩阵;进而可以根据自相似矩阵中表征群组中不同账号之间的关联关系的相似度参数,较为高效地从待定账号中确定出与目标账号紧密相关的关联账号,提高了搜寻、确定关联账号的效率。
在一些实施例中,上述建立针对目标账号的目标群组,具体实施时,可以包括以下内容:获取目标账号预设时间段的资金变动记录、目标账号的通讯录、目标账号的登录设备的使用记录;根据所述目标账号预设时间段的资金变动记录、目标账号的通讯录、目标账号的登录设备的使用记录,筛选出符合预设要求的账号作为所述待定账号;建立包含有所述目标账号和所述待定账号的群组,作为所述目标群组。
在一些实施例中,上述确定出所述目标群组中账号的特征向量,具体实施时,可以包括以下内容:获取所述目标群组中的账号的属性数据和行为数据;根据所述账号的属性数据和行为数据,确定出所述目标群组中账号的特征向量。
在一些实施例中,所述账号的属性数据具体可以包括以下至少之一:账号注册用户的年龄信息、账号注册用户的职业信息、账号的实名认证结果、账号的信用评级等等。
在一些实施例中,所述账号的行为数据具体可以包括以下至少之一:大额转账记录、账号登录失败记录、账号的转账次数等。
在一些实施例中,上述根据所述目标群组的自相似矩阵,确定出目标账号的关联账号,具体实施时,可以包括以下内容:根据所述目标群组的自相似矩阵中待定账号与目标账号之间的特征相似度参数,筛选出与目标账号之间的特征相似度参数大于预设的相似度参数阈值的待定账号,作为所述目标账号的关联账号。
在一些实施例中,所述目标账号具体可以包括涉及风险交易的账号,和/或,被举报的账号等。当然,需要说明的,上述所列举的目标账号只是一种示意性说明。具体实施时,根据具体的应用场景,上述目标账号还可以包括涉及其他违规行为的账号。对此,本说明书不作限定。
在一些实施例中,在目标账号具体包括涉及风险交易的账号,和/或,被举报的账号等账号的情况下,相应的,目标账号的关联账号具体可以包括目标账号的团伙账号。其中,上述团伙账号具体可以是目标账号的使用者所拥有使用的用于进行或协助进行违规行为的其他账号,也可以是目标账号的使用者的同伙所拥有使用的用于进行或协助进行违规行为的其他账号。
在一些实施例中,可以事先获取并利用样本数据,进行模型训练来建立预设的处理模型。具体实施时,可以参阅图5所示,按照以下方式建立预设的处理模型。
S1:建立针对样本账号的样本群组,其中,所述样本群组包括样本账号,以及样本账号的关联账号,和/或,样本账号的无关账号。
在本实施例中,服务器可以通过查询历史监控记录找到之前被确定为涉及参与过违规行为的账号作为样本账号。进一步,可以搜集与上述样本账号紧密相关的关联账号,以及与样本账号没有关联关系或者关联关系较弱的无关账号,和该样本账号组合,来建立得到针对样本账号的样本群组。
S2:在样本群组中,针对样本账号的关联账号设置黑标签,针对样本账号的无关账号设置白标签,得到标注后的样本群组。
在本实施例中,具体实施时,可以根据样本群组中除样本账号以外的各个账号是否为样本账号的关联账号,对各个账号进行标注。例如,可以通过为样本群组中属于样本账号的关联账号设置黑标签来标注出关联账号;通过为样本群组中属于样本账号的无关账号设置白标签,标注出无关账号。从而完成对样本群组的标注,得到标注后的样本群组。需要说明的是,上述所列举的标注样本群组的方式只是一种示意性说明。具体实施时,根据具体情况,也可以采用其他合适的标注方式,或使用其他类型的标签进行标注。对此,本说明书不作限定。
S3:确定出所述标注后的样本群组中账号的特征向量。
在本实施例中,上述确定出所述标注后的样本群组中账号的特征向量,具体实施时,可以包括以下内容:获取所述标注后的样本群组中的账号的属性数据和行为数据;根据所述账号的属性数据和行为数据,确定出所述标注后的样本群组中账号的特征向量。
S4:建立包含有self-attention层的初始的处理模型,其中,所述初始的处理模型用于输出self-attention层在根据标注后的样本群组中账号的特征向量计算对应的标注后的样本群组中账号的第一隐特征向量过程中生成的自相似矩阵。
在本实施例中,可以基于self-attention层来构建上述初始的处理模型。其中,通过上述初始的处理模型可以输出self-attention层在根据标注后的样本群组中账号的特征向量计算对应的标注后的样本群组中账号的第一隐特征向量过程中生成的自相似矩阵。同时,通过上述初始的处理模型也可以得到self-attention层在根据标注后的样本群组中账号的特征向量计算得到的账号的第一隐特征向量。
S5:利用所述标注后的样本群组中账号的特征向量,训练所述初始的处理模型,得到所述预设的处理模型。
在一些实施例中,可以利用标注后的样本群组中账号的特征向量,不断输入到初始的处理模型中,根据输出结果,有针对性地调整初始的处理模型的模型参数,从而对初始的处理模型进行学习训练。通过多次的学习训练,使得处理模型输出结果符合精度要求,则可以得到上述预设的处理模型。
在一些实施例中,上述利用所述标注后的样本群组中账号的特征向量,训练所述初始的处理模型,得到所述预设的处理模型,具体实施时,可以包括以下内容:利用所述初始的处理模型处理所述标注后的样本群组中账号的特征向量,得到对应的标注后的样本群组中账号的第一隐特征向量,以及自相似矩阵;根据所述自相似矩阵,和所述标注后的样本群组中账号的第一隐特征向量,计算标注后的样本群组中的账号的第二隐特征向量;根据所述标注后的样本群组中的账号第二隐特征向量,预测出标注后的样本群组中账号为样本账号的关联账号的概率值;根据所述标注后的样本群组中账号为样本账号的关联账号的概率值,和所述标注后的样本群组中账号的标签数据,调整所述初始的处理模型中的模型参数。
在本实施例中,上述根据所述自相似矩阵,和所述标注后的样本群组中账号的第一隐特征向量,计算标注后的样本群组中的账号的第二隐特征向量,具体实施时,可以将标注后的样本群组中的各个账号的第一隐特征向量分别乘以上述自相似矩阵,从而可以得到各个账号的对应的第二隐特征向量。
在本实施例中,具体实施时,可以通过全连接神经网络来根据所述标注后的样本群组中的账号第二隐特征向量,预测出标注后的样本群组中的账号为样本账号的关联账号的概率值。
在本实施例中,可以根据所测出的标注后的样本群组中账号为样本账号的关联账号的概率值和该账号所标注的数据标签之间的差异,作为该模型的损失值,可以记为loss。进而可以利用上述损失值,有针对性地调整模型中的模型参数,以不断地优化模型,使得基于调整后的模型所得到的损失值不断减小。直到基于调整后的模型所得到的损失值小于预设的损失值阈值,停止调整,并将当前的模型确定为符合精度要求的预设的处理模型,完成模型训练。
由上可见,本说明书实施例提供的关联账号的确定方法,通过先建立包含了目标账号和可能为关联账号的待定账号的目标群组,并获取该目标群组中的各个账号的属性数据和行为数据;再基于各个账号的属性数据和行为数据计算出对应账号的特征向量;进一步利用事先训练好的包含有self-attention层的预设的处理模型根据上述目标群组中账号的特征向量,确定出针对该目标群组的自相似矩阵;进而可以根据自相似矩阵中表征群组中不同账号之间的关联关系的相似度参数,较为高效地从待定账号中确定出与目标账号紧密相关的关联账号,提高了搜寻、确定关联账号的效率。还通过获取并根据目标账号预设时间段的资金变动记录、目标账号的通讯录、目标账号的登录设备的使用记录等数据,先筛选出具有相对较高概率的为目标账号的待定账号,来构建目标群组,缩小了后续确定关联账号的账号范围,进一步提高了确定关联账号的效率。还通过先建立包含有self-attention层的,能够输出self-attention层在根据标注后的样本群组中账号的特征向量计算对应的标注后的样本群组中账号的第一隐特征向量过程中生成的自相似矩阵,以及标注后的样本群组中账号的第一隐特征向量的初始的处理模型,再利用所述标注后的样本群组中账号的特征向量,训练所述初始的处理模型,从而得到能够较为准确、全面地确定出可以反映出群组中各个账号之间的关联关系的自相似矩阵,继而可以利用上述自相似矩阵,通过分析待定账号和目标账号之间的关联关系,快速地找到目标账号的关联账号。
参阅图6所示,本说明书实施例还提供了一种关联数据对象的确定方法。该方法具体实施时,可以包括以下内容。
S601:建立针对目标数据对象的目标对象组,其中,所述目标对象组包括目标数据对象和待定数据对象;
S602:确定出所述目标对象组中的数据对象的特征向量;
S603:利用预设的处理模型,根据所述目标对象组中数据对象的特征向量,确定出目标对象组的自相似矩阵,其中,所述预设的处理模型至少包括self-attention层,所述目标对象组的自相似矩阵包含有所述目标对象组中数据对象之间的特征相似度参数,所述特征相似度参数用于表征目标对象组中的数据对象之间的关联关系;
S604:根据所述目标对象组的自相似矩阵,确定出目标数据对象的关联数据对象。
在一些实施例中,上述数据对象具体可以是账号,也可以是手机号码或电话号码,还可以是邮箱地址等。对于上述数据对象的具体类型,本说明书不作限定。
在一些实施例中,上述确定目标对象组中的数据对象的特征向量具体实施时,可以包括以下内容:获取所述目标对象组中的数据对象的属性数据和行为数据;根据所述数据对象的属性数据和行为数据,确定出所述目标对象组中数据对象的特征向量。
在本实施例中,通过上述方法,可以快速、准确地搜寻、确定出与目标数据对象关系较为紧密的关联数据对象。
本说明书实施例还提供一种服务器,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器具体实施时可以根据指令执行以下步骤:建立针对目标账号的目标群组,其中,所述目标群组包括目标账号和待定账号;确定出所述目标群组中账号的特征向量;利用预设的处理模型,根据所述目标群组中账号的特征向量,确定出目标群组的自相似矩阵,其中,所述预设的处理模型至少包括self-attention层,所述目标群组的自相似矩阵包含有所述目标群组中账号之间的特征相似度参数,所述特征相似度参数用于表征目标群组中的账号之间的关联关系;根据所述目标群组的自相似矩阵,确定出目标账号的关联账号。
为了能够更加准确地完成上述指令,参阅图7所示,本说明书实施例还提供了另一种具体的服务器,其中,所述服务器包括网络通信端口701、处理器702以及存储器703,上述结构通过内部线缆相连,以便各个结构可以进行具体的数据交互。
其中,所述网络通信端口701,具体可以用于获取目标账号,以及获取针对目标账号的目标群组中的账号的属性数据和行为数据。
所述处理器702,具体可以用于建立针对目标账号的目标群组,其中,所述目标群组包括目标账号和待定账号;确定出目标群组的自相似矩阵,其中,所述预设的处理模型至少包括self-attention层,所述目标群组的自相似矩阵包含有所述目标群组中账号之间的特征相似度参数,所述特征相似度参数用于表征目标群组中的账号之间的关联关系;根据所述目标群组的自相似矩阵,确定出目标账号的关联账号。
所述存储器703,具体可以用于存储相应的指令程序。
在本实施例中,所述网络通信端口701可以是与不同的通信协议进行绑定,从而可以发送或接收不同数据的虚拟端口。例如,所述网络通信端口可以是负责进行web数据通信的80号端口,也可以是负责进行FTP数据通信的21号端口,还可以是负责进行邮件数据通信的25号端口。此外,所述网络通信端口还可以是实体的通信接口或者通信芯片。例如,其可以为无线移动网络通信芯片,如GSM、CDMA等;其还可以为Wifi芯片;其还可以为蓝牙芯片。
在本实施例中,所述处理器702可以按任何适当的方式实现。例如,处理器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式等等。本说明书并不作限定。
在本实施例中,所述存储器703可以包括多个层次,在数字系统中,只要能保存二进制数据的都可以是存储器;在集成电路中,一个没有实物形式的具有存储功能的电路也叫存储器,如RAM、FIFO等;在系统中,具有实物形式的存储设备也叫存储器,如内存条、TF卡等。
本说明书实施例还提供了一种基于上述关联账号的确定方法的计算机存储介质,所述计算机存储介质存储有计算机程序指令,在所述计算机程序指令被执行时实现:建立针对目标账号的目标群组,其中,所述目标群组包括目标账号和待定账号;获取所述目标群组中的账号的属性数据和行为数据;根据所述账号的属性数据和行为数据,确定出所述目标群组中账号的特征向量;利用预设的处理模型,根据所述目标群组中账号的特征向量,确定出目标群组的自相似矩阵,其中,所述预设的处理模型至少包括self-attention层,所述目标群组的自相似矩阵包含有所述目标群组中账号之间的特征相似度参数,所述特征相似度参数用于表征目标群组中的账号之间的关联关系;根据所述目标群组的自相似矩阵,确定出目标账号的关联账号。
在本实施例中,上述存储介质包括但不限于随机存取存储器(Random AccessMemory,RAM)、只读存储器(Read-Only Memory,ROM)、缓存(Cache)、硬盘(Hard DiskDrive,HDD)或者存储卡(Memory Card)。所述存储器可以用于存储计算机程序指令。网络通信单元可以是依照通信协议规定的标准设置的,用于进行网络连接通信的接口。
在本实施例中,该计算机存储介质存储的程序指令具体实现的功能和效果,可以与其它实施方式对照解释,在此不再赘述。
参阅图8所示,在软件层面上,本说明书实施例还提供了一种关联账号的确定装置,该装置具体可以包括以下的结构模块。
建群模块801,具体可以用于建立针对目标账号的目标群组,其中,所述目标群组包括目标账号和待定账号。
第一确定模块802,具体可以用于确定出所述目标群组中账号的特征向量。
第二确定模块803,具体可以用于利用预设的处理模型,根据所述目标群组中账号的特征向量,确定出目标群组的自相似矩阵,其中,所述预设的处理模型至少包括self-attention层,所述目标群组的自相似矩阵包含有所述目标群组中账号之间的特征相似度参数,所述特征相似度参数用于表征目标群组中的账号之间的关联关系。
第三确定模块804,具体可以用于根据所述目标群组的自相似矩阵,确定出目标账号的关联账号。
在一个实施例中,所述建群模块801具体可以包括以下结构单元:
第一获取单元,具体可以用于获取目标账号预设时间段的资金变动记录、目标账号的通讯录、目标账号的登录设备的使用记录;
筛选单元,具体可以用于根据所述目标账号预设时间段的资金变动记录、目标账号的通讯录、目标账号的登录设备的使用记录,筛选出符合预设要求的账号作为所述待定账号;
第一建立单元,具体可以用于建立包含有所述目标账号和所述待定账号的群组,作为所述目标群组。
在一些实施例中,所述第一确定模块802具体实施时,可以用于获取目标群组中的账号的属性数据和行为数据;并根据目标群组中的账号的属性数据和行为数据,确定出所述目标群组中账号的特征向量。
在一些实施例中,所述账号的属性数据具体可以包括以下至少之一:账号注册用户的年龄信息、账号注册用户的职业信息、账号的实名认证结果、账号的信用评级等等。
在一些实施例中,所述账号的行为数据具体可以包括以下至少之一:大额转账记录、账号登录失败记录、账号的转账次数等等。
在一些实施例中,所述第三确定模块804具体实施时,可以用于根据所述目标群组的自相似矩阵中待定账号与目标账号之间的特征相似度参数,筛选出与目标账号之间的特征相似度参数大于预设的相似度参数阈值的待定账号,作为所述目标账号的关联账号。
在一些实施例中,所述目标账号具体可以包括涉及风险交易的账号,和/或,被举报的账号等。
在一些实施例中,所述目标账号的关联账号具体可以包括目标账号的团伙账号得到。
在一些实施例中,所述装置具体还可以包括建模模块,用于训练建立预设的处理模型。其中,上述建模模块具体可以包括以下结构单元:
第二建立单元,具体可以用于建立针对样本账号的样本群组,其中,所述样本群组包括样本账号,以及样本账号的关联账号,和/或,样本账号的无关账号;
标注单元,具体可以用于在样本群组中,针对样本账号的关联账号设置黑标签,针对样本账号的无关账号设置白标签,得到标注后的样本群组;
第一确定单元,具体可以用于确定出所述标注后的样本群组中账号的特征向量;
第三建立单元,具体可以用于建立包含有self-attention层的初始的处理模型,其中,所述初始的处理模型用于输出self-attention层在根据标注后的样本群组中账号的特征向量计算对应的标注后的样本群组中账号的第一隐特征向量过程中生成的自相似矩阵;
训练单元,具体可以用于利用所述标注后的样本群组中账号的特征向量,训练所述初始的处理模型,得到所述预设的处理模型。
在一些实施例中,所述训练单元具体实施时,可以用于利用所述初始的处理模型处理所述标注后的样本群组中账号的特征向量,得到对应的标注后的样本群组中账号的第一隐特征向量,以及自相似矩阵;根据所述自相似矩阵,和所述标注后的样本群组中账号的第一隐特征向量,计算标注后的样本群组中的账号的第二隐特征向量;根据所述标注后的样本群组中的账号第二隐特征向量,预测出标注后的样本群组中账号为样本账号的关联账号的概率值;根据所述标注后的样本群组中账号为样本账号的关联账号的概率值,和所述标注后的样本群组中账号的标签数据,调整所述初始的处理模型中的模型参数。
需要说明的是,上述实施例阐明的单元、装置或模块等,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。为了描述的方便,描述以上装置时以功能分为各种模块分别描述。当然,在实施本说明书时可以把各模块的功能在同一个或多个软件和/或硬件中实现,也可以将实现同一功能的模块由多个子模块或子单元的组合实现等。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
由上可见,本说明书实施例提供的关联账号的确定装置,通过建立模块先建立包含了目标账号和可能为关联账号的待定账号的目标群组;再通过第一确定模块基于各个账号的属性数据和行为数据计算出对应账号的特征向量;进一步通过第二确定模块利用事先训练好的包含有self-attention层的预设的处理模型根据上述目标群组中账号的特征向量,确定出针对该目标群组的自相似矩阵;进而通过第三确定模块根据自相似矩阵中表征群组中不同账号之间的关联关系的相似度参数,较为高效地从待定账号中确定出与目标账号紧密相关的关联账号,提高了搜寻、确定关联账号的效率。
虽然本说明书提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的手段可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的装置或客户端产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境,甚至为分布式数据处理环境)。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、产品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、产品或者设备所固有的要素。在没有更多限制的情况下,并不排除在包括所述要素的过程、方法、产品或者设备中还存在另外的相同或等同要素。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内部包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构、类等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
通过以上的实施例的描述可知,本领域的技术人员可以清楚地了解到本说明书可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本说明书的技术方案本质上可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,移动终端,服务器,或者网络设备等)执行本说明书各个实施例或者实施例的某些部分所述的方法。
本说明书中的各个实施例采用递进的方式描述,各个实施例之间相同或相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。本说明书可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
虽然通过实施例描绘了本说明书,本领域普通技术人员知道,本说明书有许多变形和变化而不脱离本说明书的精神,希望所附的权利要求包括这些变形和变化而不脱离本说明书的精神。

Claims (23)

1.一种关联账号的确定方法,包括:
建立针对目标账号的目标群组,其中,所述目标群组包括目标账号和待定账号;
确定出所述目标群组中账号的特征向量;
利用预设的处理模型,根据所述目标群组中账号的特征向量,确定出目标群组的自相似矩阵,其中,所述预设的处理模型至少包括self-attention层,所述目标群组的自相似矩阵包含有所述目标群组中账号之间的特征相似度参数,所述特征相似度参数用于表征目标群组中的账号之间的关联关系;其中,利用预设的处理模型,根据所述目标群组中账号的特征向量,确定出目标群组的自相似矩阵,包括:利用预设的处理模型的self-attention层在根据该目标群组中的各个账号的特征向量计算对应的隐特征向量的同时,提取出在计算隐特征向量的过程中生成的针对该目标群组的自相似矩阵;
根据所述目标群组的自相似矩阵,确定出目标账号的关联账号。
2.根据权利要求1所述的方法,建立针对目标账号的目标群组,包括:
获取目标账号预设时间段的资金变动记录、目标账号的通讯录、目标账号的登录设备的使用记录;
根据所述目标账号预设时间段的资金变动记录、目标账号的通讯录、目标账号的登录设备的使用记录,筛选出符合预设要求的账号作为所述待定账号;
建立包含有所述目标账号和所述待定账号的群组,作为所述目标群组。
3.根据权利要求1所述的方法,确定出所述目标群组中账号的特征向量,包括:
获取目标群组中的账号的属性数据和行为数据;
根据目标群组中的账号的属性数据和行为数据,确定出所述目标群组中账号的特征向量。
4.根据权利要求3所述的方法,所述账号的属性数据包括以下至少之一:账号注册用户的年龄信息、账号注册用户的职业信息、账号的实名认证结果、账号的信用评级。
5.根据权利要求3所述的方法,所述账号的行为数据包括以下至少之一:大额转账记录、账号登录失败记录、账号的转账次数。
6.根据权利要求1所述的方法,根据所述目标群组的自相似矩阵,确定出目标账号的关联账号,包括:
根据所述目标群组的自相似矩阵中待定账号与目标账号之间的特征相似度参数,筛选出与目标账号之间的特征相似度参数大于预设的相似度参数阈值的待定账号,作为所述目标账号的关联账号。
7.根据权利要求1所述的方法,所述目标账号包括被判断为涉及风险交易的账号,和/或,被举报的账号。
8.根据权利要求7所述的方法,所述目标账号的关联账号包括目标账号的团伙账号。
9.根据权利要求1所述的方法,所述预设的处理模型按照以下方式获取:
建立针对样本账号的样本群组,其中,所述样本群组包括样本账号,以及样本账号的关联账号,和/或,样本账号的无关账号;
在样本群组中,针对样本账号的关联账号设置黑标签,针对样本账号的无关账号设置白标签,得到标注后的样本群组;
获取并根据所述标注后的样本群组中的账号的属性数据和行为数据,确定出所述标注后的样本群组中账号的特征向量;
建立包含有self-attention层的初始的处理模型,其中,所述初始的处理模型用于输出self-attention层在根据标注后的样本群组中账号的特征向量计算对应的标注后的样本群组中账号的第一隐特征向量过程中生成的自相似矩阵;
利用所述标注后的样本群组中账号的特征向量,训练所述初始的处理模型,得到所述预设的处理模型。
10.根据权利要求9所述的方法,利用所述标注后的样本群组中账号的特征向量,训练所述初始的处理模型,得到所述预设的处理模型,包括:
利用所述初始的处理模型处理所述标注后的样本群组中账号的特征向量,得到对应的标注后的样本群组中账号的第一隐特征向量,以及自相似矩阵;
根据所述自相似矩阵,和所述标注后的样本群组中账号的第一隐特征向量,计算标注后的样本群组中的账号的第二隐特征向量;
根据所述标注后的样本群组中的账号第二隐特征向量,预测出标注后的样本群组中账号为样本账号的关联账号的概率值;
根据所述标注后的样本群组中账号为样本账号的关联账号的概率值,和所述标注后的样本群组中账号的标签数据,调整所述初始的处理模型中的模型参数。
11.一种关联账号的确定装置,包括:
建群模块,用于建立针对目标账号的目标群组,其中,所述目标群组包括目标账号和待定账号;
第一确定模块,用于确定出目标群组中账号的特征向量;
第二确定模块,用于利用预设的处理模型,根据所述目标群组中账号的特征向量,确定出目标群组的自相似矩阵,其中,所述预设的处理模型至少包括self-attention层,所述目标群组的自相似矩阵包含有所述目标群组中账号之间的特征相似度参数,所述特征相似度参数用于表征目标群组中的账号之间的关联关系;其中,第二确定模块具体用于利用预设的处理模型的self-attention层在根据该目标群组中的各个账号的特征向量计算对应的隐特征向量的同时,提取出在计算隐特征向量的过程中生成的针对该目标群组的自相似矩阵;
第三确定模块,用于根据所述目标群组的自相似矩阵,确定出目标账号的关联账号。
12.根据权利要求11所述的装置,所述建群模块包括:
第一获取单元,用于获取目标账号预设时间段的资金变动记录、目标账号的通讯录、目标账号的登录设备的使用记录;
筛选单元,用于根据所述目标账号预设时间段的资金变动记录、目标账号的通讯录、目标账号的登录设备的使用记录,筛选出符合预设要求的账号作为所述待定账号;
第一建立单元,用于建立包含有所述目标账号和所述待定账号的群组,作为所述目标群组。
13.根据权利要求11所述的装置,所述第一确定模块具体用于获取所述目标群组中的账号的属性数据和行为数据;并根据所述账号的属性数据和行为数据,确定出所述目标群组中账号的特征向量。
14.根据权利要求13所述的装置,所述账号的属性数据包括以下至少之一:账号注册用户的年龄信息、账号注册用户的职业信息、账号的实名认证结果、账号的信用评级。
15.根据权利要求13所述的装置,所述账号的行为数据包括以下至少之一:大额转账记录、账号登录失败记录、账号的转账次数。
16.根据权利要求11所述的装置,所述第三确定模块具体用于根据所述目标群组的自相似矩阵中待定账号与目标账号之间的特征相似度参数,筛选出与目标账号之间的特征相似度参数大于预设的相似度参数阈值的待定账号,作为所述目标账号的关联账号。
17.根据权利要求11所述的装置,所述目标账号包括被判断为涉及风险交易的账号,和/或,被举报的账号。
18.根据权利要求17所述的装置,所述目标账号的关联账号包括目标账号的团伙账号。
19.根据权利要求11所述的装置,所述装置还包括建模模块,包括:
第二建立单元,用于建立针对样本账号的样本群组,其中,所述样本群组包括样本账号,以及样本账号的关联账号,和/或,样本账号的无关账号;
标注单元,用于在样本群组中,针对样本账号的关联账号设置黑标签,针对样本账号的无关账号设置白标签,得到标注后的样本群组;
第一确定单元,用于确定出所述标注后的样本群组中账号的特征向量;
第三建立单元,用于建立包含有self-attention层的初始的处理模型,其中,所述初始的处理模型用于输出self-attention层在根据标注后的样本群组中账号的特征向量计算对应的标注后的样本群组中账号的第一隐特征向量过程中生成的自相似矩阵;
训练单元,用于利用所述标注后的样本群组中账号的特征向量,训练所述初始的处理模型,得到所述预设的处理模型。
20.根据权利要求19所述的装置,所述训练单元具体用于利用所述初始的处理模型处理所述标注后的样本群组中账号的特征向量,得到对应的标注后的样本群组中账号的第一隐特征向量,以及自相似矩阵;根据所述自相似矩阵,和所述标注后的样本群组中账号的第一隐特征向量,计算标注后的样本群组中的账号的第二隐特征向量;根据所述标注后的样本群组中的账号第二隐特征向量,预测出标注后的样本群组中账号为样本账号的关联账号的概率值;根据所述标注后的样本群组中账号为样本账号的关联账号的概率值,和所述标注后的样本群组中账号的标签数据,调整所述初始的处理模型中的模型参数。
21.一种关联数据对象的确定方法,包括:
建立针对目标数据对象的目标对象组,其中,所述目标对象组包括目标数据对象和待定数据对象;
确定出所述目标对象组中数据对象的特征向量;
利用预设的处理模型,根据所述目标对象组中数据对象的特征向量,确定出目标对象组的自相似矩阵,其中,所述预设的处理模型至少包括self-attention层,所述目标对象组的自相似矩阵包含有所述目标对象组中数据对象之间的特征相似度参数,所述特征相似度参数用于表征目标对象组中的数据对象之间的关联关系;利用预设的处理模型,根据所述目标对象组中数据对象的特征向量,确定出目标对象组的自相似矩阵,包括:利用预设的处理模型的self-attention层在根据目标对象组中数据对象的特征向量计算对应的隐特征向量的同时,提取出在计算隐特征向量的过程中生成的针对该目标对象组的自相似矩阵;
根据所述目标对象组的自相似矩阵,确定出目标数据对象的关联数据对象。
22.一种服务器,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器执行所述指令时实现权利要求1至10中任一项所述方法的步骤。
23.一种计算机可读存储介质,其上存储有计算机指令,所述指令被执行时实现权利要求1至10中任一项所述方法的步骤。
CN202010146808.6A 2020-03-05 2020-03-05 关联账号的确定方法、装置和关联数据对象的确定方法 Active CN111447082B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010146808.6A CN111447082B (zh) 2020-03-05 2020-03-05 关联账号的确定方法、装置和关联数据对象的确定方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010146808.6A CN111447082B (zh) 2020-03-05 2020-03-05 关联账号的确定方法、装置和关联数据对象的确定方法

Publications (2)

Publication Number Publication Date
CN111447082A CN111447082A (zh) 2020-07-24
CN111447082B true CN111447082B (zh) 2022-09-02

Family

ID=71653996

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010146808.6A Active CN111447082B (zh) 2020-03-05 2020-03-05 关联账号的确定方法、装置和关联数据对象的确定方法

Country Status (1)

Country Link
CN (1) CN111447082B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106161406A (zh) * 2015-04-22 2016-11-23 深圳市腾讯计算机系统有限公司 获取用户账号的方法和装置
CN107066616A (zh) * 2017-05-09 2017-08-18 北京京东金融科技控股有限公司 用于账号处理的方法、装置及电子设备
CN109784013A (zh) * 2017-11-14 2019-05-21 阿里巴巴集团控股有限公司 一种信息识别的方法、装置以及设备
CN110852881A (zh) * 2019-10-14 2020-02-28 支付宝(杭州)信息技术有限公司 风险账户识别方法、装置、电子设备及介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140089170A1 (en) * 2012-09-21 2014-03-27 Rawllin International Inc. Financial account labels

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106161406A (zh) * 2015-04-22 2016-11-23 深圳市腾讯计算机系统有限公司 获取用户账号的方法和装置
CN107066616A (zh) * 2017-05-09 2017-08-18 北京京东金融科技控股有限公司 用于账号处理的方法、装置及电子设备
CN109784013A (zh) * 2017-11-14 2019-05-21 阿里巴巴集团控股有限公司 一种信息识别的方法、装置以及设备
CN110852881A (zh) * 2019-10-14 2020-02-28 支付宝(杭州)信息技术有限公司 风险账户识别方法、装置、电子设备及介质

Also Published As

Publication number Publication date
CN111447082A (zh) 2020-07-24

Similar Documents

Publication Publication Date Title
CN108876133B (zh) 基于业务信息的风险评估处理方法、装置、服务器和介质
CN107872436B (zh) 一种账号识别方法、装置及系统
CN110442712B (zh) 风险的确定方法、装置、服务器和文本审理系统
CN109949154B (zh) 客户信息分类方法、装置、计算机设备和存储介质
CN110992167A (zh) 银行客户业务意图识别方法及装置
CN110956547A (zh) 一种基于搜索引擎的实时识别欺诈团伙的方法及系统
CN112132676B (zh) 联合训练目标模型的贡献度的确定方法、装置和终端设备
CN108399565A (zh) 金融产品推荐装置、方法及计算机可读存储介质
CN104836781A (zh) 区分访问用户身份的方法及装置
CN111932268A (zh) 企业风险识别方法及装置
CN112819611A (zh) 欺诈识别方法、装置、电子设备和计算机可读存储介质
CN109670931B (zh) 贷款用户的行为检测方法、装置、设备及存储介质
CN112328802A (zh) 数据处理方法、装置和服务器
CN113836360B (zh) 数据检测方法及装置
CN111160919A (zh) 一种区块链地址风险评估方法及装置
CN112347457A (zh) 异常账户检测方法、装置、计算机设备和存储介质
CN112910953B (zh) 业务数据的推送方法、装置和服务器
CN109670929A (zh) 贷款预警的控制方法、装置、设备及计算机可读存储介质
CN111179023B (zh) 订单识别方法及装置
CN111447082B (zh) 关联账号的确定方法、装置和关联数据对象的确定方法
CN115760390A (zh) 业务数据处理方法、装置和网点终端设备
CN107516213B (zh) 风险识别方法及装置
CN115689571A (zh) 异常用户行为监测方法、装置、设备和介质
CN109815393B (zh) 信息处理方法、装置、计算机设备及可读存储介质
US20220327186A1 (en) Fraud detection system, fraud detection method, and program

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40033645

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant