具体实施方式
本申请通过建立多维度的复杂关系网络,可以从多维度同时实现对节点特征的分析,从而实现对特征账号的准确识别。
为对本申请进行进一步说明,提供下列实施例:
请参考图1,图1示出了根据本申请一示例性实施例的识别特征账号的方法,可以应用于服务器,该方法包括:
步骤102,获取历史行为数据中包含的账号之间的关联关系,以及账号分别与账号属性信息、网络环境属性信息之间的关联关系;
在本实施中,账号之间的关联关系可以包括信息流动关系、社会关系等,而信息流动关系具体涉及到信息流动方向、信息的数值、时间等信息,社会关系具体可以为“陌生人”、“朋友”、“亲人”等。账号属性信息可以包括:账号对应的手机号码、身份证号码等信息。账号与网络环境属性信息之间的关联关系可以包括:账号登录采用的设备、该设备所处的网络类型(如有线网络或无线网络)、该设备的IP地址或MAC地址等信息。
步骤104,将所述关联关系映射为节点之间的对应关系,并建立对应的关系网络;
在本实施中,图2示出了根据本申请一示例性实施例的关系网络:账号A与账号B对应的节点之间存在信息流动关系,并具体表现为“信息的数值为10000,信息流动时间为2014-06-24 12:30:00”,而账号A与账号D对应的节点之间存在社会关系,并具体表现为“亲人”关系;手机号1为账号A的账号属性信息,即账号A与手机号1之间存在关联关系,而设备1为账号A的网络环境属性信息,即账号A与设备1之间存在关联关系,并具体表现为“登录时间为2014-06-24 12:00:00”;类似地,其他账号与账号属性信息、网络环境属性信息之间也存在相应的关联关系,并表现为图2中的节点之间的连线。
在本实施例中,可以通过图存储结构实现对关系网络的存储。作为一示例性实施方式,可以采用邻接矩阵的形式实现图存储;作为另一示例性实施方式,基于关系网络的稀疏特性,即每个节点仅与少量节点存在直接关联关系,而与其他大部分节点均不存在直接关联关系,因而可以采用邻接表的方式进行存储,以节省存储空间。
步骤106,当所述关系网络中存在符合预设特征的节点簇时,确定所述节点簇中包含特征账号。
由上述实施例可知,本申请通过集合多种类型的关联关系形成如图2所示的关系网络,与仅包含单维度的关联关系的关系网络相比较,该关系网络为包含多维度的关联关系的“复杂关系网络”,因而通过对复杂关系网络的特征分析,可以准确地识别出特征账号。
下面根据复杂关系网络的多维度特征,详细描述如何实现对特征账号的准确识别。
(1)信息闭环
作为一示例性实施例,当多个账号之间存在非正常的信息交互时,会导致在多个账号之间形成相似数值的信息流动闭环。举例而言,在账号A、账号B和账号C之间实现非正常交互时,分别在账号A与账号B、账号B与账号C、账号C与账号A之间形成三次非正常交互,从而形成A→B、B→C、C→A的三次信息流动,并且三次信息流动的数值相似,使得没有发生真正的数值变动(信息由账号A流出,最终又流入账号A),但会形成A→B→C→A的信息流动闭环,即可通过对信息流动闭环的检测,识别出相应的特征账号(如上述的账号A、账号B和账号C)。
针对上述实施例,图3示出了根据本申请另一示例性实施例的识别特征账号的方法,包括:
步骤302,构建子网络;
在本实施例中,可以从已生成的复杂关系网络中筛选出预设类型的节点,以构成子网络;或者,也可以直接选取相应类型的节点,以构成子网络。作为一示例性实施方式,构成子网络的节点可以包含信息流动节点,该信息流动节点对应的账号之间在预设时间段内存在信息流动关系,比如图2所示的账号A与账号B对应的节点之间完成了数值为“10000”的信息流动,且时间为“2014-06-24 12:30:00”。
步骤304,选取种子节点;
在本实施例中,可以将任一账号对应的节点作为种子节点,并由种子节点开始发送传递消息,检测是否存在相应的资金流动闭环;当然,也可以通过对各节点的特征识别,预先选取可疑账号对应的节点,以作为种子节点。
步骤306,种子节点发送传递消息;
在本实施例中,如图4A所示,假定节点A(对应于账号A,下同)为选取的种子节点,则由节点A确定以自身为起始节点的信息流动关系对应的终止节点,比如节点A检测到以自身为起始节点的信息流动关系包括:1、A→B(表示信息由节点A流动至节点B),数值:50;2、A→B,数值49.9;3、A→G,数值:3;4、A→H,数值:25;5、A→H,数值:2,即节点A对应的终止节点为节点B、节点G和节点H。其中,信息流动关系可以发生于指定的时间段内,比如一周、一个月、半年等,可以根据实际需求进行设置。
因此,节点A分别向节点B、节点G和节点H发送传递消息,该传递消息中包含起始传递节点的唯一标识和对应于每个终止节点的流动信息的数值,且所述起始传递节点的唯一标识为当前节点的唯一标识。具体地,对应于上述信息流动关系“1”和“2”,由于都是由节点A向节点B发起的信息流动关系,因而节点A向节点B发送的传递消息中包含:节点A的唯一标识“A”、流动信息的总数值“99.9”、单次流动信息的数值“50”和“49.9”,因而可以记录为“A;total:99.9;order1:50;order2:49.9”;对应于上述信息流动关系“3”,节点A向节点G发送的传递消息中包含:“A;total:3;order1:3”;对应于上述信息流动关系“4”和“5”,节点A向节点H发送的传递消息中包含:“A;total:27;order1:25;order2:2”。
步骤308,判断迭代次数是否满足大于预设次数N1,若满足,则转入步骤312,否则转入步骤310;
步骤310,在各账号对应的节点之间,实现传递消息的接收和发送;
在本实施例中,在每次迭代操作的过程中,对接收到的传递消息执行相应的传递操作,从而通过多次迭代操作来检测是否存在信息流动闭环。
1)第一次迭代操作
如图4B所示,节点B、节点G和节点H分别接收到来自节点A的传递消息,并提取其中的起始传递节点的唯一标识和流动信息的数值。每个接收到传递消息的节点查看该“起始传递节点的唯一标识”与自身节点的唯一标识是否相同,比如此时“起始传递节点的唯一标识”为“A”,显然与节点B、节点G和节点H的唯一标识均不相同,说明尚未形成信息闭环。
然后,每个节点判断是否存在以自身节点为起始节点且匹配于接收到的传递消息中包含的流动信息的数值的信息流动关系。具体地,比如节点B确定存在以自身节点为起始节点的信息流动关系:1、节点B→节点I,数值:50;2、节点B→节点C,数值:99.9;其中,信息流动关系1中的数值“50”与传递消息中的“order1:50”或“order2:49.9”相匹配,且信息流动关系2中的数值“99.9”与传递消息中的“total:99.9”相匹配,则由节点B相应地分别向节点I和节点C发送传递消息,且在传递消息中:节点B添加自身节点的唯一标识为途径节点、根据相匹配的信息流动关系对应的流动信息的数值更新该第一传递消息。
具体地,在节点B向节点I发送的传递消息中,包含“A;B;total:50;order1:50”,表明该传递消息由节点A发出、途径节点B传输,且以节点B为起始节点的信息总数值为50,其中包含一次信息的数值为50;类似地,在节点B向节点C发送的传递消息中,包含“A;B;total:99.9;order1:99.9”。
类似地,节点H确定存在以自身节点为起始节点的信息流动关系:节点H→节点F,数值:2,且其中的数值“2”与相应的传递消息中的“order2:2”相匹配,则由节点H相应地向节点F发送传递消息,且在传递消息中包含“A;H;total:2;order1:2”,表明该传递消息由节点A发出、途径节点H传输,且以节点H为起始节点的信息的总数值为2,其中包含一条信息的数值为2。
2)第二次迭代操作
如图4C所示,节点C和节点I接收到来自节点B的传递消息、节点F接收到来自节点H的传递消息,并提取其中的起始传递节点的唯一标识和流动信息的数值,且每个接收到传递消息的节点查看该“起始传递节点的唯一标识”与自身节点的唯一标识是否相同,显然此时均不相同,说明尚未形成信息闭环。
然后,每个节点判断是否存在以自身节点为起始节点且匹配于接收到的传递消息中包含的流动信息的数值的信息流动关系。具体地,节点F和节点I不存在以自身为起始节点的信息流动关系,不执行后续的消息传输;节点C确定存在以自身节点为起始节点的信息流动关系:节点C→节点D,数值:100.01,且其中的数值“100.01”与传递消息中的“order1:99.9”相匹配(比如预设的容错数值为0.3),则由节点C相应地向节点D发送传递消息,且在传递消息中,包含“A;B;C;total:100.01;order1:100.01”,表明该传递消息由节点A发出、途径节点B和节点C传输,且以节点C为起始节点的信息的总数值为100.01,其中包含一条信息的数值为100.01。
3)后续的迭代操作
如图4D所示,在第三次迭代操作中,由于存在以节点D为起始节点、节点E为终止节点的信息流动关系,且流动信息的总数值为89.9+9.9=99.8,与接收到的传递消息中的流动信息的数值“100.01”相匹配,则由节点D向节点E发送传递消息,其中包含“A;B;C;D;total:99.8;order1:89.9;order2:9.9”,表明该传递消息由节点A发出、途径节点B、节点C和节点D传输,且以节点D为起始节点的信息的总数值为99.8,其中包含一条信息的数值为89.9、另一条信息的数值为9.9。
在第四次迭代操作中,由于存在以节点E为起始节点、节点F为终止节点的信息流动关系,且流动信息的总数值为100,与接收到的传递消息中的流动信息的总数值“99.8”相匹配,则由节点E向节点F发送传递消息,其中包含“A;B;C;D;E;total:100;order1:100”,表明该传递消息由节点A发出、途径节点B、节点C、节点D和节点E传输,且以节点E为起始节点的信息的总数值为100,其中包含一条信息的数值为100。
在第五次迭代操作中,由于存在以节点F为起始节点、节点A为终止节点的信息流动关系,且流动信息的总数值为59+40.9=99.9,与接收到的传递消息中的流动信息的总数值“100”相匹配,则由节点F向节点A发送传递消息,其中包含“A;B;C;D;E;F;total:99.9;order1:59;order2:40.9”,表明该传递消息由节点A发出、途径节点B、节点C、节点D、节点E和节点F传输,且以节点F为起始节点的信息的总数值为99.9,其中包含一条信息的数值为59、另一条信息的数值为40.9。
在第六次迭代操作中,节点A在接收到来自节点F的传递消息时,提取出其中的“起始传递节点的唯一标识”为“A”,与自身的唯一标识相同,因而确定已经形成闭环,并且根据传递消息中包含的途径节点,确定该闭环的结构为:节点A-节点B-节点C-节点D-节点E-节点F-节点A,且流动信息的数值约为100(从99.8至100.01不等)。
步骤312,输出闭环信息,比如构成闭环的节点信息、涉及的流动信息的数值等。
在上述实施例中,基于账号之间的信息流动关系实现消息传递,从而通过多次迭代操作,检测出如图4D所示的单纯由信息流动关系构成的闭环1,说明构成该闭环1的节点对应的账号为特征账号;而作为另一示例性实施方式,也可以由信息流动关系与其他的节点间对应关系共同构成闭环结构。
举例而言,比如图4E所示的结构中,当节点K被选为种子节点时,可以通过两次迭代操作,检测出在节点K与节点D之间存在数值为1.01的信息流动关系、在节点D与节点E之间存在数值为1的信息流动关系;同时,由于节点K与节点E对应的用户之间的社会关系为“朋友”,因而由信息流动关系和社会关系共同构成了图4E所示的闭环2,说明构成该闭环2的节点对应的账号为特征账号。
其中,可以根据账号分别与账号属性信息、网络环境属性信息之间的关联关系,确定账号之间的身份关系及其密切程度,比如当两个账号经常采用相同的设备登录账号、采用相同的地址信息等时,说明可能为亲人或朋友。当然,相关技术中已经存在具体对于社会关系的判断方式,均可应用于本申请的技术方案中,此处不再赘述。
(2)稠密子网络
作为另一示例性实施例,当某个用户账号通过控制一群“虚拟用户”账号进行虚假信息交互时,会导致该用户账号对应的虚拟用户账号形成聚集效应。举例而言,正常的账户在发送交互信息时,往往会涉及到多个不同方面,不会总在同一用户账号处频繁、反复地购买商品;而如果账号A通过注册虚拟用户账号进行虚假交易时,这些虚拟用户账号以及相应的账号属性信息、网络环境属性信息均会与账号A频繁产生关联,导致这些节点与账号A之间呈现出不正常的“稠密”关系,形成相应的“稠密子网络”。因此,如果存在节点簇中包含的节点数量大于或等于预设数量阈值,且各节点与同一用户账号对应的节点之间的关系权重值均大于或等于预设权重值,就可以判定该节点簇构成了稠密子网络,从而将相应的账号识别为特征账号。
针对上述实施例,图5示出了根据本申请另一示例性实施例的识别特征账号的方法,包括:
步骤502,在构建的如图2所示的复杂关系网络中,计算相邻节点之间的关系权重值;
在本实施例中,针对账号与账号、账号属性信息、网络环境属性信息之间的关联关系,均需要计算相应的节点之间的关系权重值。作为一示例性实施方式,可以基于逻辑回归算法,计算各相邻节点之间的关系权重值。
1)账号与账号之间的关系权重值
对于账号之间的关系权重值,可以基于信息交互的场景、次数和数值等指标进行计算,具体可以表现为下述公式(1):
其中,W1为账号之间的关系权重值,关系n为出现的场景数,a1为某场景下次数的权重,CNT代表次数的具体值,a2为某场景下数值的权重,AMT代表数值的具体值;同时,次数和数值对应的权重a1和a2,可以分别通过下述公式(2)和公式(3)计算得到:
其中,f(x)表示逻辑回归函数,即逻辑回归函数的正半部分在次数/数值变量取99分位数的变化率(一阶导数)衰减为变量取0时变化率的0.01,从而趋于平缓。通过该公式,可以实现指标无量纲化,指标值的递增对分值的贡献随着指标值增加而趋于平缓,并将最终分值归一化在[0,1]区间。
2)账号与网络环境属性信息之间的关系权重值
对于账号与网络环境属性信息之间的关系权重值,可以基于其共同出现的天数为指标进行计算,具体可以表现为下述公式(4):
其中,W2为账号与网络环境属性信息之间的关系权重值,DAY_CNT代表共同出现的天数,a3为天数的权重,其可以采用下述公式(5)进行计算:
步骤504,卖家账号节点向相邻节点发送传递消息;
在本实施例中,基于上述公式(1)~(5),可以得到如图6A所示的各节点之间的关系权重值。其中,节点A1~A5、节点B1和节点C1与指定节点之间直接关联,可以直接得到这些节点与指定节点之间的关系强度值,而对于其他节点与指定节点之间的关系强度值,则可以通过多次迭代的消息传递方式进行计算。
其中,指定节点发送的传递消息中包含:相应的指定账号ID和指定节点与接收该传递消息的节点之间的关系强度值,该关系强度值为预设关系强度值与相应的关系权重值的乘积。具体地,比如图6A所示的指定节点向节点A1发送传递消息时,假定预设关系强度值为1,则指定节点与节点A1之间的关系强度值为0.8×1=0.8,即该消息中包含“A:0.8”,表明该消息由指定账号A对应节点发出,且接收方节点(即节点A1)与指定账号A之间的关系强度值为0.8。
步骤506,判断当前迭代次数是否满足大于预设次数N2,若满足,则转入步骤510,否则转入步骤508。
步骤508,在指定节点之外的各节点之间,实现传递消息的接收和发送;
在本实施例中,在每次迭代操作的过程中,每个节点在接收到来自父级相邻节点的传递消息时,将自身的唯一标识添加为该传递消息中的途径节点,计算该传递消息中的关系权重值与对应于当前节点的每个子级相邻节点的关系权重值的乘积并更新至该传递消息中,并将更新后的该传递消息发送至对应的每个子级相邻节点;其中,每个节点还累加并记录接收到的指定账号ID相同的传递消息中的关系强度值。
下面以节点A1、A2、A5和A8为例,对消息传递的处理方式和过程进行详细描述。
1)第一次迭代操作
节点A1接收到来自指定节点的传递消息后,提取其中的关系强度值“0.8”;节点A1对应的相邻节点为节点A5,且节点A1与节点A5之间的关系权重值为0.8,因此计算得到A5与指定节点之间的关系强度值为0.8×0.8=0.64,则节点A1将接收到的传递消息更新为“A#A1:0.64”并发送至节点A5,表明该消息由指定账号A对应节点发出、途径节点A1,且接收方节点(即节点A5)与指定账号A之间的关系强度值为0.64。
同时,节点A2在接收到来自指定节点的传递消息后,提取其中的关系强度值“0.65”;节点A1对应的相邻节点为节点A5,且节点A1与节点A5之间的关系权重值为0.8,因此计算得到A5与指定节点之间的关系强度值为0.65×0.8=0.52,则节点A1将接收到的传递消息更新为“A#A2:0.52”并发送至节点A5,表明该消息由指定账号A对应节点发出、途径节点A2,且接收方节点(即节点A5)与指定账号A之间的关系强度值为0.52。
2)第二次迭代操作
节点A5在接收到来自节点A1的传递消息后,提取其中的关系强度值“0.64”;节点A5对应的相邻节点为节点A8,且节点A5与节点A8之间的关系权重值为1.0,因此计算得到A8与指定节点之间的关系强度值为0.64×1.0=0.64,则节点A5将接收到的传递消息更新为“A#A1#A5:0.64”并发送至节点A8,表明该消息由指定账号A对应节点发出、途径节点A1和节点A5,且接收方节点(即节点A8)与指定账号A之间的关系强度值为0.64。
同时,节点A5在接收到来自节点A2的传递消息后,提取其中的关系强度值“0.52”,计算得到A8与指定节点之间的关系强度值为0.52×1.0=0.52,则节点A5将接收到的传递消息更新为“A#A2#A5:0.52”并发送至节点A8,表明该消息由指定账号A对应节点发出、途径节点A2和节点A5,且接收方节点(即节点A8)与指定账号A之间的关系强度值为0.52。
其中,每个节点在接收到传递消息后,还会记录其中的关系强度值。比如节点A1会记录接收到的传递消息中的关系强度值“A:0.8”,表明节点A1与指定账号A之间的关系强度值为0.8(若仍存在其他指定账号,则记录为“B:0.6”:表明节点A1与指定账号B之间的关系强度值为0.6);而对于节点A5,由于分别接收到来自节点A1和节点A2的传递消息,因而会分别获取相应的传递消息中的关系强度值“A:0.64”和“A:0.52”,而由于这两个关系强度值对应于的指定账号ID相同,因而节点A5需要将其进行累加为0.64+0.52=1.16,并将累加数值记录为节点A5与指定节点之间的关系强度值。
因此,通过对传递消息进行预设次数的迭代操作,根据每个节点记录的关系强度值,选取与同一用户账号之间的关系强度值大于或等于预设数值的所有节点,若节点数量大于或等于预设数量,则将该所有节点作为所述节点簇;或者,选取关系强度值大于或等于预设百分位数的所有节点,若存在对应于同一用户账号且数量大于或等于所述预设数量的多个节点,则将该多个节点作为所述节点簇。
具体如图6C所示,根据节点A1~A8、节点B1~B2、节点C1与指定节点之间的关系强度值,选取节点A1~A8构成对应于指定账号A的稠密子网络,则指定账号A和节点A1~A8对应的账号均为特征账号。
此外,作为一示例性实施例,本申请在通过消息传递的迭代操作来检测资金闭环或稠密子网络时,可以采用并行计算模型来实现,即通过并行计算来提升消息传递的效率。当然,本领域技术人员应该理解的是,本申请并不对消息传递的方式进行限制,显然也可以通过其他方式实现消息传递。
其中,当采用并行计算模型进行消息传递时,可以优选使用BSP(BulkSynchronous Parallel Computing Model,整体同步并行计算模型)。
本申请可以应用于各种类型的数据交互场景,下面以其中的典型应用为例,对本申请的技术方案进行详细说明。
1)电商平台
当本申请的技术方案应用于电商平台时,比如对于“支付宝”平台,“特征账号”即存在虚假交易的账号,比如多个卖家用户之间的相互虚假购买商品,或者卖家通过控制一系列的虚拟买家账号进行虚假的商品交易,从而造成卖家用户的信誉虚高、商品排名上升,不利于买家用户做出正确判断。而基于本申请的技术方案,即可有效识别上述虚假交易涉及的虚拟买家账号,从而对其进行搜索、购买等权限的权重做出合理调整。
其中,基于本申请的技术方案,账号之间交互的信息可以具体理解为账号之间的流动资金,而信息的数值即流动资金的数额。相应地,图4D所示的“节点A-节点B-节点C-节点D-节点E-节点F-节点A”构成的闭环1为纯资金流动关系构成的资金闭环;而图4E所示的“K-D-E”构成的闭环2,则为资金流动关系和社会关系构成的信息闭环。
而针对基于“稠密子网络”的实施例,则指定账号可以为卖家账号,而该卖家账号通过控制诸多虚拟买家账号进行虚假交易时,导致形成相应的聚集效应,因而可以用于识别特征账号。
2)即时通讯或社交网络
当本申请的技术方案应用于即时通讯或社交网络场景时,账号之间交互的信息可以为用户账号之间的即时通讯消息或账号关联消息。其中,通讯消息包括即时通讯消息和非即时通讯消息,比如留言、评论等。具体地,“特征账号”即存在欺诈或骚扰行为的账号,比如用户通过控制一系列“小号”,并通过这些“小号”对其他用户进行欺诈或骚扰,比如发送欺骗消息、木马网站的网址或广告等。而基于本申请的技术方案,即可有效识别上述欺诈或骚扰行为涉及的账号,从而对其进行消息发送、好友添加等权限的权重做出合理调整。
图7示出了根据本申请的一示例性实施例的服务器的示意结构图。请参考图7,在硬件层面,该电子设备包括处理器、内部总线、网络接口、内存以及非易失性存储器,当然还可能包括其他业务所需要的硬件。处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成识别特征账号的装置。当然,除了软件实现方式之外,本申请并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
请参考图8,在软件实施方式中,该识别特征账号的装置可以包括关系获取单元、网络建立单元和账号确定单元。其中:
关系获取单元,获取历史行为数据中包含的账号之间的关联关系,以及账号分别与账号属性信息、网络环境属性信息之间的关联关系;
网络建立单元,将所述关联关系映射为节点之间的对应关系,并建立对应的关系网络;
账号确定单元,当所述关系网络中存在符合预设特征的节点簇时,确定所述节点簇中包含特征账号。
可选的,所述预设特征包括:
所述节点簇中的各节点之间形成闭环的对应关系;
其中,相邻节点之间的对应关系均映射于账号之间的关联关系,且映射的关联关系包括账号之间的信息流动关系。
可选的,所述预设特征还包括:
至少两对相邻节点之间的对应关系映射于账号之间的信息流动关系;
其中,对应于所述至少两对相邻节点的信息流动关系在所述闭环中的信息流动方向一致,且流动信息的数值之间的差值小于或等于预设差值阈值。
可选的,所述流动信息的数值为预设时间段内的单次流动信息的数值或累计流动信息的数值。
可选的,所述账号之间的信息流动关系包括:
映射的所有关联关系均为账号之间的信息流动关系;
或者,至少两对相邻节点之间的对应关系映射于账号之间的信息流动关系,且映射的其余关联关系为账号之间的密切程度超出预设程度的身份关系。
可选的,还包括:
关系确定单元,根据账号分别与账号属性信息、网络环境属性信息之间的关联关系,确定账号之间的身份关系及其密切程度。
可选的,所述账号确定单元具体用于:
从所述关系网络中筛选出子网络,该子网络中包含信息流动节点,该信息流动节点对应的账号之间在预设时间段内存在信息流动关系;
控制所述子网络中被指定的节点执行下述操作:确定以当前节点为起始节点的信息流动关系对应的终止节点,并向每个终止节点发送第一传递消息,该第一传递消息中包含起始传递节点的唯一标识和对应于每个终止节点的流动信息的数值,且所述起始传递节点的唯一标识为当前节点的唯一标识;
控制所述子网络中的每个节点执行下述操作:
当接收到的第一传递消息中包含的起始传递节点的唯一标识与当前节点的唯一标识不同时,若存在以当前节点为起始节点且匹配于该第一传递消息中包含的流动信息的数值的信息流动关系,则在该第一传递消息中添加当前节点的唯一标识为途径节点、根据相匹配的信息流动关系对应的流动信息的数值更新该第一传递消息,并将处理后的第一传递消息发送至相应的终止节点;
当接收到的第一传递消息中包含的起始传递节点的唯一标识与当前节点的唯一标识相同时,上报该第一传递消息中的起始传递节点和途径节点,以构成所述节点簇。
可选的,所述子网络中还包括:亲密节点,该亲密节点对应的账号之间的身份关系的密切程度超出预设程度;
所述账号确定单元还控制所述第一网络中的每个节点执行下述操作:
当接收到的第一传递消息中包含的起始传递节点的唯一标识与当前节点的唯一标识不同,且不存在以当前节点为起始节点且匹配于该第一传递消息中包含的流动信息的数值的信息流动关系时,若存在与当前节点相对应的亲密节点,则在该第一传递消息中添加当前节点的唯一标识为途径节点,并将处理后的第一传递消息发送至相应的终止节点。
可选的,所述预设特征包括:
所述节点簇中包含的节点数量大于或等于预设数量阈值,且各节点与同一预设账号对应的节点之间的关系权重值均大于或等于预设权重值。
可选的,所述账号确定单元具体用于:
计算所述关系网络中的相邻节点之间的关系权重值;
以被指定的预设账号对应的节点为起始节点,向每个相邻节点发送第二传递消息,该第二传递消息中包含所述被指定的预设账号ID和相应的关系强度值,该关系强度值为预设关系强度值与相应的关系权重值的乘积;
每个节点在接收到来自父级相邻节点的第二传递消息时,将自身的唯一标识添加为该第二传递消息中的途径节点,计算该第二传递消息中的关系权重值与对应于当前节点的每个子级相邻节点的关系权重值的乘积并更新至该第二传递消息中,并将更新后的该第二传递消息发送至对应的每个子级相邻节点;其中,每个节点还累加并记录接收到的预设账号ID相同的第二传递消息中的关系强度值;
根据每个节点记录的关系强度值,选取与同一预设账号之间的关系强度值大于或等于预设数值的所有节点,若节点数量大于或等于预设数量,则将该所有节点作为所述节点簇;或者,选取关系强度值大于或等于预设百分位数的所有节点,若存在对应于同一预设账号且数量大于或等于所述预设数量的多个节点,则将该多个节点作为所述节点簇。
可选的,通过逻辑回归算法计算所述关系权重值。
可选的:根据账号之间的交互场景、次数和信息的数值,计算相应的相邻节点之间的关系权重值;
和/或根据账号与网络环境属性信息之间的关联关系的保持时间长度,计算相应的相邻节点之间的关系权重值。
因此,本申请通过建立多维度的复杂关系网络,可以从多维度同时实现对节点特征的分析,从而实现对特征账号的准确识别。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上所述仅为本申请的较佳实施例而已,并不用以限制本申请,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请保护的范围之内。