CN109587523B - 一种虚假关注的识别方法以及相关设备 - Google Patents

一种虚假关注的识别方法以及相关设备 Download PDF

Info

Publication number
CN109587523B
CN109587523B CN201811452375.6A CN201811452375A CN109587523B CN 109587523 B CN109587523 B CN 109587523B CN 201811452375 A CN201811452375 A CN 201811452375A CN 109587523 B CN109587523 B CN 109587523B
Authority
CN
China
Prior art keywords
node
nodes
target
degree
importance score
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811452375.6A
Other languages
English (en)
Other versions
CN109587523A (zh
Inventor
王璐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Douyu Network Technology Co Ltd
Original Assignee
Wuhan Douyu Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Douyu Network Technology Co Ltd filed Critical Wuhan Douyu Network Technology Co Ltd
Priority to CN201811452375.6A priority Critical patent/CN109587523B/zh
Publication of CN109587523A publication Critical patent/CN109587523A/zh
Application granted granted Critical
Publication of CN109587523B publication Critical patent/CN109587523B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/24Monitoring of processes or resources, e.g. monitoring of server load, available bandwidth, upstream requests
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/21Server components or server architectures
    • H04N21/218Source of audio or video content, e.g. local disk arrays
    • H04N21/2187Live feed
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/258Client or end-user data management, e.g. managing client capabilities, user preferences or demographics, processing of multiple end-users preferences to derive collaborative data
    • H04N21/25866Management of end-user data

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computer Graphics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供了一种虚假关注的识别方法及相关设备,用于识别直播平台中虚假关注特征不明显的用户或直播间。该方法包括:计算目标二部图中的每个节点的目标重要度分数,所述目标二部图指示直播平台中用户对直播间的关注关系,所述每个节点为用户节点或直播间节点;确定所述每个节点的出度或入度;根据所述每个节点的目标重要度分数以及所述每个节点的出度或入度确定所述目标二部图中任意两个节点的相似度;基于所述任意两个节点的相似度确定所述每个节点的同步性指标;将所述每个节点中同步性指标大于预设阈值的节点确定为虚假关注的节点。

Description

一种虚假关注的识别方法以及相关设备
技术领域
本发明涉及直播领域,尤其涉及一种虚假关注的识别方法以及相关设备。
背景技术
在直播平台上,为了达到某些目的经常存在虚假的刷关注行为,这样的刷关注行为会对平台的直播生态造成极大的影响。因此需要有一些有效的方法能够识别那些具有刷关注嫌疑的用户。
通常识别异常刷挂关注行为的方法是采用一些强规则,这些规则是通过一些较为明显的异常进行识别的。采用强规则的方法可以识别出一些风险用户,然而为了避免误杀会将规则设置的非常严格,因此只能找到那些具有明显特征的作弊用户,因此会遗漏其他特征不明显的嫌疑用户。
发明内容
本发明实施例提供了一种虚假关注的识别方法及相关设备,用于识别直播平台中虚假关注特征不明显的用户或直播间。
本发明实施例的第一方面提供了一种虚假关注的识别方法,包括:
计算目标二部图中的每个节点的目标重要度分数,所述目标二部图指示直播平台中用户对直播间的关注关系,所述每个节点为用户节点或直播间节点;
确定所述每个节点的出度或入度;
根据所述每个节点的目标重要度分数以及所述每个节点的出度或入度确定所述目标二部图中任意两个节点的相似度;
基于所述任意两个节点的相似度确定所述每个节点的同步性指标;
将所述每个节点中同步性指标大于预设阈值的节点确定为虚假关注的节点。
可选地,所述计算所述目标二部图中的每个节点的目标重要度分数包括:
确定所述每个节点的初始重要度分数;
基于所述每个节点的初始重要度分数迭代计算所述每个节点的重要度分数;
当满足迭代终止条件时,将迭代终止时输出的所述每个节点的重要度分数进行归一化处理得到所述目标重要度分数。
可选地,所述基于所述每个节点的初始重要度分数迭代计算所述每个节点的重要度分数包括:
重复执行如下公式,迭代计算所述每个节点的重要度分数:
Figure BDA0001886981490000021
其中,Ik(i)是节点i在第k轮的重要度分数,k为大于1的正整数,所述节点i为所述每个节点中的任意一个节点,N(i)为所述节点i的邻居节点集合,INk-1(j)是节点j在第k-1轮归一化后的重要度分数,所述节点j为所述邻居节点集合中的任意一个节点,其中,通过以下公式计算INk-1(j):
Figure BDA0001886981490000022
Ik(j)为所述节点j在第k轮的重要度分数,max{Ik}为所述节点i以及所述邻居节点集合中的节点在第k轮的重要度分数的最大值。
可选地,所述根据所述每个节点的目标重要度分数以及所述每个节点的出度或入度确定所述目标二部图中任意两个节点的相似度包括:
根据所述每个节点的目标重要度分数以及所述每个节点的出度或入度构建所述目标二部图对应的二维状态空间;
通过如下公式计算所述目标二部图中任意两个节点的相似度:
sim(u,v)=1(u∈g,v∈g)
sim(u,v)=0(u∈g,v∈g0,g≠g0);
其中,sim(u,v)为节点u和节点v的相似度,所述节点u和所述节点v为所述目标二部图中的任意两个不同的节点,g和g0为所述二维状态空间中的任意两个不同的网格。
可选地,所述基于任意两个节点的相似度确定所述每个节点的同步性指标包括:
通过如下公式计算所述每个节点的同步性指标:
Figure BDA0001886981490000031
其中,sync(i)为节点i的同步性指标,所述节点i为所述每个节点中的任意一个节点,N(i)是所述节点i的邻居节点集合,j和k为所述节点i的邻居节点集合中的任意一个节点,|N(i)|为所述节点i的邻居节点集合中的节点数量,sim(j,k)为所述节点j和所述节点k的相似度。
本发明实施例第二方面提供了一种虚假关注的识别装置,包括:
计算单元,用于计算目标二部图中的每个节点的目标重要度分数,所述目标二部图指示直播平台中用户对直播间的关注关系,所述每个节点为用户节点或直播间节点;
第一确定单元,用于确定所述每个节点的出度或入度;
第二确定单元,用于根据所述每个节点的目标重要度分数以及所述每个节点的出度或入度确定所述目标二部图中任意两个节点的相似度;
第三确定单元,用于基于所述任意两个节点的相似度确定所述每个节点的同步性指标;
第四确定单元,用于将所述每个节点中同步性指标大于预设阈值的节点确定为虚假关注的节点。
可选地,所述计算单元具体用于:
确定所述每个节点的初始重要度分数;
基于所述每个节点的初始重要度分数迭代计算所述每个节点的重要度分数;
当满足迭代终止条件时,将迭代终止时输出的所述每个节点的重要度分数进行归一化处理得到所述目标重要度分数。
可选地,所述计算单元还具体用于:
重复执行如下公式,迭代计算所述每个节点的重要度分数:
Figure BDA0001886981490000041
其中,Ik(i)是节点i在第k轮的重要度分数,k为大于1的正整数,所述节点i为所述每个节点中的任意一个节点,N(i)为所述节点i的邻居节点集合,INk-1(j)是节点j在第k-1轮归一化后的重要度分数,所述节点j为所述邻居节点集合中的任意一个节点,其中,通过以下公式计算INk-1(j):
Figure BDA0001886981490000042
Ik(j)为所述节点j在第k轮的重要度分数,max{Ik}为所述节点i以及所述邻居节点集合中的节点在第k轮的重要度分数的最大值。
可选地,所述第二确定单元具体用于:
根据所述每个节点的目标重要度分数以及所述每个节点的出度或入度构建所述目标二部图对应的二维状态空间;
通过如下公式计算所述目标二部图中任意两个节点的相似度:
sim(u,v)=1(u∈g,v∈g)
sim(u,v)=0(u∈g,v∈g0,g≠g0);
其中,sim(u,v)为节点u和节点v的相似度,所述节点u和所述节点v为所述目标二部图中的任意两个不同的节点,g和g0为所述二维状态空间中的任意两个不同的网格。
可选地,所述第三确定单元具体用于:
通过如下公式计算所述每个节点的同步性指标:
Figure BDA0001886981490000051
其中,sync(i)为节点i的同步性指标,所述节点i为所述每个节点中的任意一个节点,N(i)是所述节点i的邻居节点集合,j和k为所述节点i的邻居节点集合中的任意一个节点,|N(i)|为所述节点i的邻居节点集合中的节点数量,sim(j,k)为所述节点j和所述节点k的相似度。
本发明第三方面提供了一种电子设备,包括存储器、处理器,其特征在于,所述处理器用于执行存储器中存储的计算机管理类程序时实现如上述任意一项所述的虚假关注的识别方法的步骤。
本发明第四方面提供了一种计算机可读存储介质,其上存储有计算机管理类程序,其特征在于:所述计算机管理类程序被处理器执行时实现如上述任意一项所述的虚假关注的识别方法的步骤。
综上所述,可以看出,本发明实施例中,由于是计算直播平台对应的目标二部中的每个节点的同步性指标,该每个节点为目标二部图中的直播间节点和用户节点,同时将每个节点中同步性指标大于预设阈值的节点确定为虚假关注节点,因此在识别直播平台中的虚假关注的用户和直播间时,不会遗漏特征不明显的虚假关注用户和虚假关注的直播间。
附图说明
图1为本发明实施例提供的一种虚假关注的识别方法的流程示意图;
图2为本发明实施例提供的一种虚假关注的识别装置的实施例示意图;
图3为本发明实施例提供的一种虚假关注的识别装置的硬件结构示意图;
图4为本发明实施例提供的一种电子设备的实施例示意图;
图5为本发明实施例提供的一种计算机可读存储介质的实施例示意图。
具体实施方式
本发明实施例提供了一种虚假关注的识别方法及相关设备,用于识别直播平台中虚假关注特征不明显的用户或直播间。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
下面从虚假关注的识别装置的角度对虚假关注的识别方法进行说明,该虚假关注的识别装置可以为服务器,也可以为服务器中的服务单元。
请参阅图1,图1为本发明实施例提供的虚假关注的识别方法的一个实施例示意图,包括:
101、计算目标二部图中每个节点的目标重要度分数。
本实施例中,虚假关注的识别装置可以首先构建直播平台对应的目标二部图,该目标二部图指示直播平台中用户对直播间的关注关系。也就是说,在目标二部图中,一部分是由直播平台中的用户形成的顶点,另一部分则是由直播平台中的直播间形成的顶点。如果用户对直播间有关注行为,那么该用户和该直播间之间能够在图上形成一条边,最终得到直播平台中有关注关系的用户与直播间之间目标二部图,其中该二部图是一个有向图,由用户节点指向直播间节点。之后计算目标二部图中每个节点的目标重要度分数,该每个节点包括用户节点或直播间节点,具体的,可以首先确定每个节点的初始重要度分数,之后基于每个节点的初始重要度分数迭代计算每个节点的重要度分数,当满足迭代终止条件时,将迭代终止时输出的每个节点的重要度分数确定为每个节点的目标重要度分数。
需要说明的是,重复执行如下公式,迭代计算所述每个节点的重要度分数:
Figure BDA0001886981490000071
其中,Ik(i)是节点i在第k轮的重要度分数,k为大于1的正整数,节点i为每个节点中的任意一个节点,N(i)为节点i的邻居节点集合,INk-1(j)是节点j在第k-1轮归一化后的重要度分数,节点j为邻居节点集合中的任意一个节点,其中,通过以下公式计算INk-1(j):
Figure BDA0001886981490000081
Ik(j)为节点j在第k轮的重要度分数,max{Ik}为节点i以及邻居节点集合中的节点在第k轮的重要度分数的最大值。
当满足迭代终止条件时,将迭代终止时输出的每个节点的重要度分数经过归一化处理得到每个节点的目标重要度分数IN(i)。由此可以计算出每个节点中每个节点的重要度分数。
需要说明的是,该迭代终止条件可以为迭代次数达到第一预设阈值,也可以为重要度分数得到收敛,具体不做限定。
需要说明的是,对于直播平台的目标二部图来说,只需要构建一次即可,之后,持续对该目标二部图进行更新即可,例如当有用户关注直播间的行为时,即对目标二部图进行更新。
102、确定每个节点的出度或入度。
本实施例中,对于目标二部图中的任意一个节点,可以根据目标二部图的图结构可以得到每个节点的出度或者入度,将节点i的度记作D(i),该节点i为每个节点中的任意一个节点。
需要说明的是,通过步骤101可以计算目标二部图中每个节点的目标重要度分数,通过步骤102可以确定每个节点的出度或入度,然而这两个步骤之间并没有先后执行顺序的限制,可以先执行步骤101,也可以先执行步骤102,或者同时执行,具体不做限定。
103、根据每个节点的目标重要度分数以及每个节点的出度或入度确定目标二部图中任意两个节点的相似度。
本实施例中,虚假关注的识别装置可以根据每个节点的目标重要度分数以及每个节点的出度或入度确定目标二部图中任意两个节点的相似度。具体的,首先根据每个节点的目标重要度分数以及每个节点的出度或入度构建目标二部图对应的二维状态空间,之后,通过如下公式计算目标二部图中任意两个节点的相似度:
sim(u,v)=1(u∈g,v∈g)
sim(u,v)=0(u∈g,v∈g0,g≠g0);
其中,sim(u,v)为节点u和节点v的相似度,节点u和节点v为目标二部图中的任意两个不同的节点,g和g0为二维状态空间中的任意两个不同的网格。也就是说,可以基于每个节点的重要度分数和每个节点的出度或入度构建一个二维的特征空间,将每个节点的重要度分数和每个节点的出度或入度的值进行均匀切分,如果切分的段数是n,那么整个二维特征空间将被分成n*n个网格,记网格集合为G,那么每个节点会落在网格的某个区域g,g满足g∈G,之后,可以通过上述公式计算节点u和v的相似度sim(u,v),若节点u和节点v属于相同网格那么相似度为1,否则是0。
104、基于任意两个节点的相似度确定每个节点的同步性指标。
本实施例中,虚假关注的识别装置可以通过如下公式计算各个几点的同步性指标:
Figure BDA0001886981490000091
其中,sync(i)为节点i的同步性指标,节点i为每个节点中的任意一个节点,N(i)是节点i的邻居节点集合,j和k为节点i的邻居节点集合中的任意一个节点,|N(i)|为节点i的邻居节点集合中的节点数量,sim(j,k)为节点j和节点k的相似度。
105、将每个节点中同步性指标大于预设阈值的节点确定为虚假关注的节点。
本实施例中,虚假关注的识别装置在计算得到目标二部图中每个节点的同步性指标之后,可以将每个节点中同步性指标大于预设阈值的节点确定为虚假关注的节点。
综上所述,可以看出,本发明实施例中,由于是计算直播平台对应的目标二部中的每个节点的同步性指标,该每个节点为目标二部图中的直播间节点和用户节点,同时将每个节点中同步性指标大于预设阈值的节点确定为虚假关注节点,因此在识别直播平台中的虚假关注的用户和直播间时,不会遗漏特征不明显的虚假关注用户和虚假关注的直播间。
上面对本发明实施例中虚假关注的识别方法进行了描述,下面对本发明实施例中的虚假关注的识别装置进行描述。
请参阅图2,本发明实施例中虚假关注的识别装置的一个实施例,该虚假关注的识别装置包括:
计算单元201,用于计算目标二部图中的每个节点的目标重要度分数,所述目标二部图指示直播平台中用户对直播间的关注关系,所述每个节点为用户节点或直播间节点;
第一确定单元202,用于确定所述每个节点的出度或入度;
第二确定单元203,用于根据所述每个节点的目标重要度分数以及所述每个节点的出度或入度确定所述目标二部图中任意两个节点的相似度;
第三确定单元204,用于基于所述任意两个节点的相似度确定所述每个节点的同步性指标;
第四确定单元205,用于将所述每个节点中同步性指标大于预设阈值的节点确定为虚假关注的节点。
可选地,所述计算单元201具体用于:
确定所述每个节点的初始重要度分数;
基于所述每个节点的初始重要度分数迭代计算所述每个节点的重要度分数;
当满足迭代终止条件时,将迭代终止时输出的所述每个节点的重要度分数进行归一化处理得到所述目标重要度分数。
可选地,所述计算单元201还具体用于:
重复执行如下公式,迭代计算所述每个节点的重要度分数:
Figure BDA0001886981490000111
其中,Ik(i)是节点i在第k轮的重要度分数,k为大于1的正整数,所述节点i为所述每个节点中的任意一个节点,N(i)为所述节点i的邻居节点集合,INk-1(j)是节点j在第k-1轮归一化后的重要度分数,所述节点j为所述邻居节点集合中的任意一个节点,其中,通过以下公式计算INk-1(j):
Figure BDA0001886981490000112
Ik(j)为所述节点j在第k轮的重要度分数,max{Ik}为所述节点i以及所述邻居节点集合中的节点在第k轮的重要度分数的最大值。
可选地,所述第二确定单元203具体用于:
根据所述每个节点的目标重要度分数以及所述每个节点的出度或入度构建所述目标二部图对应的二维状态空间;
通过如下公式计算所述目标二部图中任意两个节点的相似度:
sim(u,v)=1(u∈g,v∈g)
sim(u,v)=0(u∈g,v∈g0,g≠g0);
其中,sim(u,v)为节点u和节点v的相似度,所述节点u和所述节点v为所述目标二部图中的任意两个不同的节点,g和g0为所述二维状态空间中的任意两个不同的网格。
可选地,所述第三确定单元204具体用于:
通过如下公式计算所述每个节点的同步性指标:
Figure BDA0001886981490000121
其中,sync(i)为节点i的同步性指标,所述节点i为所述每个节点中的任意一个节点,N(i)是所述节点i的邻居节点集合,j和k为所述节点i的邻居节点集合中的任意一个节点,|N(i)|为所述节点i的邻居节点集合中的节点数量,sim(j,k)为所述节点j和所述节点k的相似度。
上面图2从模块化功能实体的角度对本发明实施例中的虚假关注的识别装置进行了描述,下面从硬件处理的角度对本发明实施例中的虚假关注的识别装置进行详细描述,请参阅图3,本发明实施例中的虚假关注的识别装置300一个实施例,包括:
输入装置301、输出装置302、处理器303和存储器304(其中处理器303的数量可以一个或多个,图3中以一个处理器303为例)。在本发明的一些实施例中,输入装置301、输出装置502、处理器303和存储器304可通过总线或其它方式连接,其中,图3中以通过总线连接为例。
其中,通过调用存储器304存储的操作指令,处理器303,用于执行如下步骤:
计算目标二部图中的每个节点的目标重要度分数,所述目标二部图指示直播平台中用户对直播间的关注关系,所述每个节点为用户节点或直播间节点;
确定所述每个节点的出度或入度;
根据所述每个节点的目标重要度分数以及所述每个节点的出度或入度确定所述目标二部图中任意两个节点的相似度;
基于所述任意两个节点的相似度确定所述每个节点的同步性指标;
将所述每个节点中同步性指标大于预设阈值的节点确定为虚假关注的节点。
通过调用存储器304存储的操作指令,处理器303,还用于执行图1对应的实施例中的任一方式。
请参阅图4,图4为本发明实施例提供的电子设备的实施例示意图。
如图4所示,本发明实施例提供了一种电子设备,包括存储器410、处理器420及存储在存储器420上并可在处理器420上运行的计算机程序411,处理器420执行计算机程序411时实现以下步骤:
计算目标二部图中的每个节点的目标重要度分数,所述目标二部图指示直播平台中用户对直播间的关注关系,所述每个节点为用户节点或直播间节点;
确定所述每个节点的出度或入度;
根据所述每个节点的目标重要度分数以及所述每个节点的出度或入度确定所述目标二部图中任意两个节点的相似度;
基于所述任意两个节点的相似度确定所述每个节点的同步性指标;
将所述每个节点中同步性指标大于预设阈值的节点确定为虚假关注的节点。
在具体实施过程中,处理器420执行计算机程序411时,可以实现图1对应的实施例中任一实施方式。
由于本实施例所介绍的电子设备为实施本发明实施例中一种虚假关注的识别装置所采用的设备,故而基于本发明实施例中所介绍的方法,本领域所属技术人员能够了解本实施例的电子设备的具体实施方式以及其各种变化形式,所以在此对于该电子设备如何实现本发明实施例中的方法不再详细介绍,只要本领域所属技术人员实施本发明实施例中的方法所采用的设备,都属于本发明所欲保护的范围。
请参阅图5,图5为本发明实施例提供的一种计算机可读存储介质的实施例示意图。
如图5所示,本实施例提供了一种计算机可读存储介质500,其上存储有计算机程序511,该计算机程序511被处理器执行时实现如下步骤:
计算目标二部图中的每个节点的目标重要度分数,所述目标二部图指示直播平台中用户对直播间的关注关系,所述每个节点为用户节点或直播间节点;
确定所述每个节点的出度或入度;
根据所述每个节点的目标重要度分数以及所述每个节点的出度或入度确定所述目标二部图中任意两个节点的相似度;
基于所述任意两个节点的相似度确定所述每个节点的同步性指标;
将所述每个节点中同步性指标大于预设阈值的节点确定为虚假关注的节点。
在具体实施过程中,该计算机程序511被处理器执行时可以实现图1对应的实施例中任一实施方式。
需要说明的是,在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详细描述的部分,可以参见其它实施例的相关描述。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式计算机或者其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
本发明实施例还提供了一种计算机程序产品,该计算机程序产品包括计算机软件指令,当计算机软件指令在处理设备上运行时,使得处理设备执行如图1对应实施例中的风电场数字化平台设计的方法中的流程。
所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriber line,DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存储的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘(solid state disk,SSD))等。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修该,或者对其中部分技术特征进行等同替换;而这些修该或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (6)

1.一种虚假关注的识别方法,其特征在于,包括:
计算目标二部图中的每个节点的目标重要度分数,所述目标二部图指示直播平台中用户对直播间的关注关系,所述每个节点为用户节点或直播间节点;
确定所述每个节点的出度或入度;
根据所述每个节点的目标重要度分数以及所述每个节点的出度或入度确定所述目标二部图中任意两个节点的相似度;
基于所述任意两个节点的相似度确定所述每个节点的同步性指标;
将所述每个节点中同步性指标大于预设阈值的节点确定为虚假关注的节点;
所述计算目标二部图中的每个节点的目标重要度分数包括:
确定所述每个节点的初始重要度分数;
基于所述每个节点的初始重要度分数迭代计算所述每个节点的重要度分数;
当满足迭代终止条件时,将迭代终止时输出的所述每个节点的重要度分数进行归一化处理得到所述目标重要度分数;
所述基于所述每个节点的初始重要度分数迭代计算所述每个节点的重要度分数包括:
重复执行如下公式,迭代计算所述每个节点的重要度分数:
Figure DEST_PATH_IMAGE001
其中,
Figure DEST_PATH_IMAGE002
是节点i在第k轮的重要度分数,k为大于1的正整数,所述节点i为所述每个节点中的任意一个节点,
Figure DEST_PATH_IMAGE003
为所述节点i的邻居节点集合,
Figure DEST_PATH_IMAGE004
是节点j在第k-1轮归一化后的重要度分数,所述节点j为所述邻居节点集合中的任意一个节点,其中,通过以下公式计算
Figure DEST_PATH_IMAGE005
Figure DEST_PATH_IMAGE006
Figure DEST_PATH_IMAGE007
为所述节点j在第k-1轮的重要度分数,
Figure DEST_PATH_IMAGE008
为所述节点i以及所述邻居节点集合中的节点在第k-1轮的重要度分数的最大值。
2.根据权利要求1所述的方法,其特征在于,所述根据所述每个节点的目标重要度分数以及所述每个节点的出度或入度确定所述目标二部图中任意两个节点的相似度包括:
根据所述每个节点的目标重要度分数以及所述每个节点的出度或入度构建所述目标二部图对应的二维状态空间;
通过如下公式计算所述目标二部图中任意两个节点的相似度:
Figure DEST_PATH_IMAGE009
其中,
Figure DEST_PATH_IMAGE010
为节点u和节点v的相似度,所述节点u和所述节点v为所述目标二部图中的任意两个不同的节点,g和
Figure DEST_PATH_IMAGE011
为所述二维状态空间中的任意两个不同的网格。
3.根据权利要求1所述的方法,其特征在于,所述基于所述任意两个节点的相似度确定所述每个节点的同步性指标包括:
通过如下公式计算所述每个节点的同步性指标:
Figure DEST_PATH_IMAGE012
其中,
Figure DEST_PATH_IMAGE013
为节点i的同步性指标,所述节点i为所述每个节点中的任意一个节点,
Figure DEST_PATH_IMAGE014
是所述节点i的邻居节点集合,j或k为所述节点i的邻居节点集合中的任意一个节点,
Figure DEST_PATH_IMAGE015
为所述节点i的邻居节点集合中的节点数量,
Figure DEST_PATH_IMAGE016
为所述节点j和所述节点k的相似度。
4.一种虚假关注的识别装置,其特征在于,包括:
计算单元,用于计算目标二部图中的每个节点的目标重要度分数,所述目标二部图指示直播平台中用户对直播间的关注关系,所述每个节点为用户节点或直播间节点;
第一确定单元,用于确定所述每个节点的出度或入度;
第二确定单元,用于根据所述每个节点的目标重要度分数以及所述每个节点的出度或入度确定所述目标二部图中任意两个节点的相似度;
第三确定单元,用于基于所述任意两个节点的相似度确定所述每个节点的同步性指标;
第四确定单元,用于将所述每个节点中同步性指标大于预设阈值的节点确定为虚假关注的节点;
所述计算单元具体用于:
确定所述每个节点的初始重要度分数;
基于所述每个节点的初始重要度分数迭代计算所述每个节点的重要度分数;
当满足迭代终止条件时,将迭代终止时输出的所述每个节点的重要度分数进行归一化处理得到所述目标重要度分数;
所述计算单元还具体用于:
重复执行如下公式,迭代计算所述每个节点的重要度分数:
Figure DEST_PATH_IMAGE017
其中,
Figure DEST_PATH_IMAGE018
是节点i在第k轮的重要度分数,k为大于1的正整数,所述节点i为所述每个节点中的任意一个节点,
Figure DEST_PATH_IMAGE019
为所述节点i的邻居节点集合,
Figure DEST_PATH_IMAGE020
是节点j在第k-1轮归一化后的重要度分数,所述节点j为所述邻居节点集合中的任意一个节点,其中,通过以下公式计算
Figure DEST_PATH_IMAGE021
Figure DEST_PATH_IMAGE022
Figure DEST_PATH_IMAGE023
为所述节点j在第k-1轮的重要度分数,
Figure DEST_PATH_IMAGE024
为所述节点i以及所述邻居节点集合中的节点在第k-1轮的重要度分数的最大值。
5.一种电子设备,包括存储器、处理器,其特征在于,所述处理器用于执行存储器中存储的计算机管理类程序时实现如权利要求1至3中任意一项所述的虚假关注的识别方法的步骤。
6.一种计算机可读存储介质,其上存储有计算机管理类程序,其特征在于:所述计算机管理类程序被处理器执行时实现如权利要求1至3中任意一项所述的虚假关注的识别方法的步骤。
CN201811452375.6A 2018-11-30 2018-11-30 一种虚假关注的识别方法以及相关设备 Active CN109587523B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811452375.6A CN109587523B (zh) 2018-11-30 2018-11-30 一种虚假关注的识别方法以及相关设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811452375.6A CN109587523B (zh) 2018-11-30 2018-11-30 一种虚假关注的识别方法以及相关设备

Publications (2)

Publication Number Publication Date
CN109587523A CN109587523A (zh) 2019-04-05
CN109587523B true CN109587523B (zh) 2021-05-28

Family

ID=65925613

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811452375.6A Active CN109587523B (zh) 2018-11-30 2018-11-30 一种虚假关注的识别方法以及相关设备

Country Status (1)

Country Link
CN (1) CN109587523B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112016934B (zh) * 2019-05-31 2023-12-29 慧安金科(北京)科技有限公司 用于检测异常数据的方法、设备和计算机可读存储介质
CN110288358A (zh) * 2019-06-20 2019-09-27 武汉斗鱼网络科技有限公司 一种设备团体确定方法、装置、设备及介质
CN113365113B (zh) * 2021-05-31 2022-09-09 武汉斗鱼鱼乐网络科技有限公司 目标节点识别方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104518930A (zh) * 2015-01-09 2015-04-15 哈尔滨工程大学 一种面向微博的异常用户和消息同时检测方法
CN105005594A (zh) * 2015-06-29 2015-10-28 嘉兴慧康智能科技有限公司 异常微博用户识别方法
WO2016053685A1 (en) * 2014-09-29 2016-04-07 Pivotal Software, Inc. Determining and localizing anomalous network behavior
CN108052543A (zh) * 2017-11-23 2018-05-18 北京工业大学 一种基于图分析聚类的微博相似账号检测方法
CN108712663A (zh) * 2018-05-03 2018-10-26 武汉斗鱼网络科技有限公司 基于二分图的直播间推荐方法、相关存储介质和设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016053685A1 (en) * 2014-09-29 2016-04-07 Pivotal Software, Inc. Determining and localizing anomalous network behavior
CN104518930A (zh) * 2015-01-09 2015-04-15 哈尔滨工程大学 一种面向微博的异常用户和消息同时检测方法
CN105005594A (zh) * 2015-06-29 2015-10-28 嘉兴慧康智能科技有限公司 异常微博用户识别方法
CN108052543A (zh) * 2017-11-23 2018-05-18 北京工业大学 一种基于图分析聚类的微博相似账号检测方法
CN108712663A (zh) * 2018-05-03 2018-10-26 武汉斗鱼网络科技有限公司 基于二分图的直播间推荐方法、相关存储介质和设备

Also Published As

Publication number Publication date
CN109587523A (zh) 2019-04-05

Similar Documents

Publication Publication Date Title
CN109255371B (zh) 一种确定直播平台虚假关注用户的方法以及相关设备
CN109587523B (zh) 一种虚假关注的识别方法以及相关设备
CN109257617B (zh) 一种确定直播平台中嫌疑用户的方法以及相关设备
US11057411B2 (en) Log analysis device, log analysis method, and log analysis program
CN108985954B (zh) 一种建立各标识的关联关系的方法以及相关设备
US20130318615A1 (en) Predicting attacks based on probabilistic game-theory
CN110896488B (zh) 一种直播间的推荐方法以及相关设备
JP2021533474A (ja) ノード分類方法、モデル訓練方法並びに、その装置、機器及びコンピュータプログラム
CN109379608B (zh) 一种直播间的推荐方法以及相关设备
CN109413439B (zh) 一种确定嫌疑用户的方法及相关设备
CN109951725B (zh) 一种直播间的推荐方法以及相关设备
CN111770047B (zh) 异常群体的检测方法、装置及设备
CN109981326B (zh) 家庭宽带感知故障定位的方法及装置
CN109388693B (zh) 一种确定分区意图的方法以及相关设备
CN111598711A (zh) 目标用户账号识别方法、计算机设备及存储介质
CN109784403B (zh) 一种识别风险设备的方法以及相关设备
WO2020222005A1 (en) Data protection
CN114338064A (zh) 识别网络流量类型的方法、装置、设备和存储介质
CN114329452A (zh) 一种异常行为检测方法、装置及相关设备
CN112070161A (zh) 一种网络攻击事件分类方法、装置、终端及存储介质
CN108076032B (zh) 一种异常行为用户识别方法及装置
CN110876072A (zh) 一种批量注册用户识别方法、存储介质、电子设备及系统
CN109905722B (zh) 一种确定嫌疑节点的方法以及相关设备
CN110781410A (zh) 一种社群检测方法及装置
CN115484112B (zh) 支付大数据安全防护方法、系统及云平台

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant