CN110855723A - 一种识别目标互动账号的方法及系统、介质、设备 - Google Patents
一种识别目标互动账号的方法及系统、介质、设备 Download PDFInfo
- Publication number
- CN110855723A CN110855723A CN202010048905.1A CN202010048905A CN110855723A CN 110855723 A CN110855723 A CN 110855723A CN 202010048905 A CN202010048905 A CN 202010048905A CN 110855723 A CN110855723 A CN 110855723A
- Authority
- CN
- China
- Prior art keywords
- interaction
- account
- degree
- field
- interactions
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/08—Network architectures or network communication protocols for network security for authentication of entities
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/1066—Session management
- H04L65/1073—Registration or de-registration
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/21—Server components or server architectures
- H04N21/218—Source of audio or video content, e.g. local disk arrays
- H04N21/2187—Live feed
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/478—Supplemental services, e.g. displaying phone caller identification, shopping application
- H04N21/4788—Supplemental services, e.g. displaying phone caller identification, shopping application communicating with other users, e.g. chatting
Abstract
本发明公开了一种识别目标互动账号的方法,先将具有联系的互动场次进行合并,可将为了规避风险而将目标互动账号分布到不同的互动场次中的目标互动账号的客观特征进行合并,以使不太明显的特征凸显出来;在此基础上,再基于所述N场互动中每场互动的互动结果规律值和互动结果规律阈值,获得所述目标互动账号,可避免因目标互动账号为了规避风险而将目标账号分布到不同的互动场次中造成的对单场互动的识别不准确的问题,提供了一种可准确识别出目标互动账户的方法,因此,使用该方法识别出目标互动账号后,即可准确对占用直播网络资源的目标互动账号进行屏蔽。
Description
技术领域
本发明涉及网络直播技术领域,尤其涉及一种识别目标互动账号的方法及系统、介质、设备。
背景技术
在网络直播平台上,直播互动是常见项目。例如,斗鱼直播的互动获取虚拟礼物。而一些非正常的账户则利用直播互动项目来进行虚拟礼物的转移。由于其根本不是正常的网络直播用户,目的只是为了利用网络直播平台进行牟利,因此,这些目标互动账户会异常占用网络直播平台的网络资源。为了解决目标互动账户占用网络资源的问题,需要将其进行屏蔽,因此,目前急需一种能准确识别出目标互动账户的方法。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的识别目标互动账号的方法及系统。
一方面,本申请通过本申请的一实施例提供如下技术方案:
一种识别目标互动账号的方法,所述方法包括:
获取过去预设时间段内参与M场互动的账号集及所述账号集中账号的基础数据,其中,所述基础数据包括账号注册时间、账号注册来源、账号等级和账号互动时所使用的设备,M为大于等于2的正整数;
基于所述账号注册时间、账号注册来源、账号等级和账号互动时所使用的设备,获得所述账号集中账号之间的关联度;
基于所述账号之间的关联度,获得每场互动的内联度、两场互动之间的外联度和两场互动之间的互联度;
基于所述每场互动的内联度和两场互动之间的外联度,获得两场互动之间的接近度;
基于所述两场互动之间的互联度和两场互动之间的最小割边权重,获得两场互动之间的同质度;
基于所述两场互动之间的接近度和同质度,对所述M场互动进行合并,获得N场互动,N为大于等于1的正整数;
基于所述N场互动中每场互动的互动结果规律值和互动结果规律阈值,获得所述目标互动账号。
可选的,所述基于所述账号之间的关联度,获得每场互动的内联度、两场互动之间的外联度和两场互动之间的互联度,具体包括:
按照如下公式计算每场互动的内联度:
按照如下公式计算两场互动之间的外联度:
按照如下公式计算两场互动之间的互联度:
可选的,所述基于所述每场互动的内联度和两场互动之间的外联度,获得两场互动之间的接近度,具体包括:
按照如下公式计算两场互动之间的接近度:
可选的,所述基于所述两场互动之间的互联度和两场互动之间的最小割边权重,获得两场互动之间的同质度,具体包括:
按照如下公式计算两场互动之间的同质度:
可选的,所述基于所述两场互动之间的接近度和同质度,对所述M场互动进行合并,获得N场互动,具体包括:
基于所述两场互动之间的接近度和同质度,获得两场互动之间的合并度量值;
基于所述两场互动之间的合并度量值和合并度量阈值,对所述M场互动进行合并,获得N场互动。
可选的,所述基于所述两场互动之间的合并度量值和合并度量阈值,对所述M场互动进行合并,获得N场互动,具体包括:
将所述M场互动按照各互动场次的参与账号数量大小进行排序;
分别计算所述排序中参与的账号数量最小的第一互动场次与所述排序中的其他场次的合并度量值,获得与所述第一互动场次之间有的最大合并度量值的第二互动场次;
若所述最大合并度量值高于合并度量阈值,则合并所述第一互动场次与第二互动场次,将合并后的互动场次按照参与的账号数量大小插入所述排序中,并返回执行分别计算所述排序中参与的账号数量最小的第一互动场次与所述排序中的其他场次的合并度量值步骤,迭代至所述排序中的任意两个互相场次之间的合并度量值都低于所述合并度量阈值,获得N场互动。
可选的,所述基于所述N场互动中每场互动的互动结果规律值和互动结果规律阈值,获得所述目标互动账号,具体包括:
按照如下公式计算所述N场互动中每场互动的互动结果规律值:
其中,是所述N场互动中任意一场互动的互动结果规律值;是该场互动中获得虚拟
礼物的账号集合,u是中的任意一个账号;是该场互动中失去虚拟礼物的账号集合,v是中的任意一个账号;表示的是中账号u的获取虚拟礼物占该场互动中总获得虚拟礼
物的比例;表示的是中账号v的失去虚拟礼物占该场互动中总失去虚拟礼物的比例;
将所述互动结果规律值大于互动结果规律阈值的互动场次对应的账号识别为目标互动账号。
另一方面,本申请通过本申请的另一实施例提供一种识别目标互动账号的系统,所述系统包括:
数据获取模块,用于获取过去预设时间段内参与M场互动的账号集及所述账号集中账号的基础数据,其中,所述基础数据包括账号注册时间、账号注册来源、账号等级和账号互动时所使用的设备,M为大于等于2的正整数;
第一获得模块,用于基于所述账号注册时间、账号注册来源、账号等级和账号互动时所使用的设备,获得所述账号集中账号之间的关联度;
第二获得模块,用于基于所述账号之间的关联度,获得每场互动的内联度、两场互动之间的外联度和两场互动之间的互联度;
第三获得模块,用于基于所述每场互动的内联度和两场互动之间的外联度,获得两场互动之间的接近度;
第四获得模块,用于基于所述两场互动之间的互联度和两场互动之间的最小割边权重,获得两场互动之间的同质度;
互动合并模块,用于基于所述两场互动之间的接近度和同质度,对所述M场互动进行合并,获得N场互动,N为大于等于1的正整数;
第五获得模块,用于基于所述N场互动中每场互动的互动结果规律值和互动结果规律阈值,获得所述目标互动账号。
本发明公开了一种可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述方法的步骤。
本发明公开了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述方法的步骤。
本申请实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:
本发明的方法,获取过去预设时间段内参与M场互动的账号集及所述账号集中账号的基础数据,其中,所述基础数据包括账号注册时间、账号注册来源、账号等级和账号互动时所使用的设备,M为大于等于2的正整数;基于所述账号注册时间、账号注册来源、账号等级和账号互动时所使用的设备,获得所述账号集中账号之间的关联度;基于所述账号之间的关联度,获得每场互动的内联度、两场互动之间的外联度和两场互动之间的互联度;基于所述每场互动的内联度和两场互动之间的外联度,获得两场互动之间的接近度;基于所述两场互动之间的互联度和两场互动之间的最小割边权重,获得两场互动之间的同质度;基于所述两场互动之间的接近度和同质度,对所述M场互动进行合并,获得N场互动,N为大于等于1的正整数;先将具有联系的互动场次进行合并,可将为了规避风险而将目标互动账号分布到不同的互动场次中的目标互动账号的客观特征进行合并,以使不太明显的特征凸显出来;在此基础上,再基于所述N场互动中每场互动的互动结果规律值和互动结果规律阈值,获得所述目标互动账号,可避免因目标互动账号为了规避风险而将目标账号分布到不同的互动场次中造成的对单场互动的识别不准确的问题,提供了一种可准确识别出目标互动账户的方法,因此,使用该方法识别出目标互动账号后,即可准确对占用直播网络资源的目标互动账号进行屏蔽。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1是本发明一种实施例中的识别目标互动账号的方法流程图;
图2是本发明一种实施例中的识别目标互动账号的系统构架图。
具体实施方式
本申请实施例通过提供一种识别目标互动账号的方法及系统,为解决目标互动账户占用网络资源的问题,提供一种能准确识别出目标互动账户的方法。
本申请实施例的技术方案为解决上述技术问题,总体思路如下:
一种识别目标互动账号的方法,包括:获取过去预设时间段内参与M场互动的账号集及所述账号集中账号的基础数据,其中,所述基础数据包括账号注册时间、账号注册来源、账号等级和账号互动时所使用的设备,M为大于等于2的正整数;基于所述账号注册时间、账号注册来源、账号等级和账号互动时所使用的设备,获得所述账号集中账号之间的关联度;基于所述账号之间的关联度,获得每场互动的内联度、两场互动之间的外联度和两场互动之间的互联度;基于所述每场互动的内联度和两场互动之间的外联度,获得两场互动之间的接近度;基于所述两场互动之间的互联度和两场互动之间的最小割边权重,获得两场互动之间的同质度;基于所述两场互动之间的接近度和同质度,对所述M场互动进行合并,获得N场互动,N为大于等于1的正整数;基于所述N场互动中每场互动的互动结果规律值和互动结果规律阈值,获得所述目标互动账号。
为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。
首先说明,本文中出现的术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
在直播平台上,直播互动是常见项目,是吸引直播观众的一种方式,例如,斗鱼直播的虚拟礼物互动(虚拟礼物可以用于增送主播、参与互动等),具体互动方法是:主播设置互动方法,账号使用虚拟礼物参与互动。而一些非正常的直播参与用户(即本申请中的目标互动账号)则利用该互动,进行非正常的“薅虚拟礼物”,由于目标互动账号进行非正常交易需要的虚拟礼物数量较大,为了不容易被发现,黑产常通过非常多的小号去薅虚拟礼物,每个账号的虚拟礼物存量不多。为了达到交易的目的,黑产通过虚拟礼物互动行为将若干小号中的虚拟礼物转移到几个号上。
由于上述目标互动账号根本不是正常的网络直播用户,目的只是为了利用网络直播平台进行牟利,因此,这些目标互动账户会异常占用网络直播平台的网络资源。为了解决目标互动账户占用网络资源的问题,需要将其进行屏蔽,因此,目前急需一种能准确识别出目标互动账户的方法。
现有技术中,由于通常通过互动转移虚拟礼物的手段是:黑产通过自行设置互动方法,操纵互动结果,少数的互动参与者可以从多数互动参与者那里获取大量的虚拟礼物,从而达到转移的目的。这样的手段可以通过异常的互动方法或者虚拟礼物获取的比率悬殊等规则进行识别。然而,为了规避这样的规则,采用了更加隐蔽的转移方式,通过多次互动来达到转移的效果,每场互动的结果没有明显的异常。
为此,本申请提供如下实施例,以克服上述困难,提供一种能准确识别出目标互动账户的方法,可准确识别出目标互动账户,对其屏蔽后可释放目标互动账户参与互动所占用直播网络资源,从而提高直播的流畅度。
下面以具体的实施例进行详细的解释说明。
实施例一
本实施提供了一种识别目标互动账号的方法,参见图1,所述方法包括:
S101、获取过去预设时间段内参与M场互动的账号集及所述账号集中账号的基础数据,其中,所述基础数据包括账号注册时间、账号注册来源、账号等级和账号互动时所使用的设备,M为大于等于2的正整数;
S102、基于所述账号注册时间、账号注册来源、账号等级和账号互动时所使用的设备,获得所述账号集中账号之间的关联度;
S103、基于所述账号之间的关联度,获得每场互动的内联度、两场互动之间的外联度和两场互动之间的互联度;
S104、基于所述每场互动的内联度和两场互动之间的外联度,获得两场互动之间的接近度;
S105、基于所述两场互动之间的互联度和两场互动之间的最小割边权重,获得两场互动之间的同质度;
S106、基于所述两场互动之间的接近度和同质度,对所述M场互动进行合并,获得N场互动,N为大于等于1的正整数;
S107、基于所述N场互动中每场互动的互动结果规律值和互动结果规律阈值,获得所述目标互动账号。
其中,该目标互动账号可以是参与直播互动的用户,也可以是参与直播互动的电子设备,如智能机器人等。
下面参照图1,对本实施中各步骤进行详细的解释说明。
首先,执行步骤S101,获取过去预设时间段内参与M场互动的账号集及所述账号集中账号的基础数据,其中,所述基础数据包括账号注册时间、账号注册来源、账号等级和账号互动时所使用的设备,M为大于等于2的正整数。
需要说明的是,过去预设时间段可以是过去一周、一个月等,这里并不受任何限制。账号集包括参与M场互动的所有账号,其中每场互动包括多个账号,而目标互动账号和正常互动账号都包含在账号集中,而目标互动账号很可能就分散在个场次的互动中进行非正常的互动的参与。
而为了对目标互动账号进行准确识别,首先需要将分散在各场次中的目标互动账号参与互动的数据进行合并,为此,需要获得各场次之间的联系,本申请中,通过各场次之间的账号的关联度建立基本的连接关系基础。
因此,为了后续获得更准确的账号之间的关联度,本实施例中选取了用户账号在参与直播时产生的客观数据来计算账号之间的关联度,即账号注册时间、账号注册来源、账号等级和账号互动时所使用的设备,其理论根据如下:
本发明实施例中,之所以选取账号注册时间和账号注册来源作为基础数据,是由于直播平台规定,每个账号使用虚拟礼物的数量有限,因此,黑产需要批量使用大量账号,其主要手段是通过批量注册脚本进行注册。因此,它们的注册时间以及注册的渠道来源非常有可能是相同的。因此,如果两个账号之间账号注册时间和账号注册来源相同,那么其关联度就会比较高,可见,账号注册时间和账号注册来源是获得更准确的关联度所必不可少的核心参数之一。
本发明实施例中,之所以选取账号等级作为基础数据,是由于平台规定一些领取虚拟礼物的场景必须满足一定的等级,因此,黑产薅虚拟礼物账号通常会统一将账号升级到最低等级要求,因此,造成其账号等级相同的概率非常高。因此,对于互动来说,如果两个账号之间账号等级相同,那么其关联度就会比较高,可见,账号等级是获得更准确的关联度所必不可少的核心参数之一。
本发明实施例中,之所以选取账号互动时所使用的设备作为基础数据,是由于黑产为了节省一般使用相同的设备或者虚拟机进行操作。因此,对于互动来说,如果两个账号之间账号等级相同,那么其关联度就会比较高,可见,账号互动时所使用的设备是获得更准确的关联度所必不可少的核心参数之一。
基于此,本领域技术人员显然可以理解,在本发明实施例步骤S101中选取的账号注册时间、账号注册来源、账号等级和账号互动时所使用的设备这四种参数均是是解决技术问题所必不可少的信息参数,并非人为主观因素的选取,而是为了解决技术问题必须对上述账号注册时间、账号注册来源、账号等级和账号互动时所使用的设备数据进行获取(也即符合自然规律的选取),以为下述S102提供数据基础。
另外,由于为了在合并后准确的识别出目标互动账号,因此,本实施例中至少需要2个或2个以上的互动场次,在实际操作时,互动场次一般会更多。
本实施中的互动可以指所有的直播互动,本实施例以斗鱼的虚拟礼物互动为例进行详细说明,但并不是一种限制。
接下来,执行S102,基于所述账号注册时间、账号注册来源、账号等级和账号互动时所使用的设备,获得所述账号集中账号之间的关联度。
可以理解的是,这里账号之间的关联度包括同一互动场次中的账号之间的关联度、不同互动场次的账号之间的账号关联度,即账号集中所有账号两两之间的关联度都是本步骤所获得的。
具体的,关联度的获得方法是:根据S101中采集的账号i和j的基础数据,统计账号i和j的基础数据中数据相同的个数,该个数即表示了它们之间的关联度。举例来说,账号i和j的账号注册时间和账号注册来源都相同,则账号i与j的关联度为2,依次类推,可获得账号之间的关联度。
接下来,执行S103、基于所述账号之间的关联度,获得每场互动的内联度、两场互动之间的外联度和两场互动之间的互联度;
为了后续两场互动之间的接近度和同质度的计算,本实施例中,需要基于所述账号之间的关联度,获得每场互动的内联度、两场互动之间的外联度和两场互动之间的互联度。
在具体实施过程中,
按照如下公式计算每场互动的内联度:
需要说明的是,该公式表示的是一个互动场次账号户之间的联系程度,计算原理是统计同一个互动场次中账号两两之间的平均关联度,其分子是账号的关联度之和,分母是可能形成的关联用户总对数。
按照如下公式计算两场互动之间的外联度:
需要说明的是,该公式表示的是两个不同互动场次用户之间的联系程度,计算原理是统计两个不同互动场次中账号两两之间的平均关联度,其分子是账号关联度之和,分母是可能形成的关联用户总对数。
按照如下公式计算两场互动之间的互联度:
接下来,执行S104,基于所述每场互动的内联度和两场互动之间的外联度,获得两场互动之间的接近度。
在具体实施过程中,在S103的基础上,按照如下公式计算两场互动之间的接近度:
需要说明的是,该公式表示的是两两互动场次之间的接近度,衡量的是参与互动场次的账号之间的接近程度。该公式的计算原理是如果两个互动场次之间的外联度越大说明它们之间的联系越强,相应的接近度就会越高,接近度越高,目标互动账号在这两个互动场次中参与互动的概率就越高,就越应该合并起来,以提高识别的准确性,因此,将外联度作为分子。公式的分母表示的是加权内联度,这提供了一个基准,即当互动场次之间的外联度比这个基准提升的程度越高时相应的两个互动场次之间的接近程度才越大;此外,这里的分母加权时的权值使用参与互动场次账号数量来决定,参与账号数越多贡献的权重越大。其原因在于:在相同内联度的情况下,账号数越多的场次紧密程度相对越高,账号数少的场次更容易计算得到更大的内联度。若不考虑参与账号的个数,将各场次的贡献看成一样的,那么参与账号数较多的场次难以合并,算法会更倾向于把账号数少的场次进行合并,导致最终合并的场次账号数量不大,可能造成难以挖掘出其异常的特征。
接下来,执行S105,基于所述两场互动之间的互联度和两场互动之间的最小割边权重,获得两场互动之间的同质度。
在具体实施过程中,在S103的基础上,按照如下公式计算两场互动之间的同质度:
需要说明的是,最小割边权重是指将互动场次进行分割,分割成两个互不相连的部分需要切割边的最小权重之和。具体的,分割的方法可以是使用Karger算法,每次随机地从剩下的图中选出一条边,将这条边的两个端点缩在一起,直到整个图剩下两个端点,那么原图中分别被缩到这两个端点的那些点分别构成了两个互不相连的部分,再从原图中找到两部分之间边的权重之和。
同质度考虑的是合并后的互动场次与合并前互动场次的同质性,即合并前互动场
次参与账号是紧密相连的,而合并之后仍然很紧密,那么该合并才是具有同质的,可保证两
个互动场次合并之后与合并前各互动场次中用户的连接方式是相似的。因此,在公式中的
互联度表示的是因为合并而带来的连接权值增加,而
表示的是最小割边权重的平均值,代表在未合并前各互动场次参与账号之间的紧密程度。
这两个值越接近,则表明合并后的紧密程度变化越小,因此,用两者比值的最小值表示紧密
程度,该值越大说明紧密程度变化越小。
接下来,执行S106,基于所述两场互动之间的接近度和同质度,对所述M场互动进行合并,获得N场互动,N为大于等于1的正整数。
具体步骤包括:
首先,基于所述两场互动之间的接近度和同质度,获得两场互动之间的合并度量值;
这里需要同时考虑接近度和同质度的原因是:
1)若只考虑互动场次之间的接近度,不考虑连接同质度,那么可能出现的情况是互动场次本身的连接度很低,但因为两个互动场次之间存在某几个相同的账号使得合并之后的连接度变得很高,互动场次之间的接近度非常高,若将这样互动场次继续合并显然是不合适的。
2)若只考虑连接同质度,不考虑互动场次之间的接近度,那么可能出现的情况是两个连接非常稀疏的互动场次经过合并后依然十分稀疏,连接同质度非常高。而这样的情况实际上是不能合并的,只考虑连接同质度会带来这样的错误。
因此,为了准确的合并后,准确的识别出目标互动账号,需要在实施过程中同时考虑互动场次的接近度和同质度。
其次,基于所述两场互动之间的合并度量值和合并度量阈值,对所述M场互动进行合并,获得N场互动。其具体步骤包括:
将所述M场互动按照各互动场次的参与账号数量大小进行排序;这里从小到大排列或从大到小排列均可,后续只要从小到大进行处理即可。
分别计算所述排序中参与的账号数量最小的第一互动场次与所述排序中的其他场次的合并度量值,获得与所述第一互动场次之间有的最大合并度量值的第二互动场次;
若所述最大合并度量值高于合并度量阈值,则合并所述第一互动场次与第二互动场次,将合并后的互动场次按照参与的账号数量大小插入所述排序中,并返回执行分别计算所述排序中参与的账号数量最小的第一互动场次与所述排序中的其他场次的合并度量值步骤,迭代至所述排序中的任意两个互相场次之间的合并度量值都低于所述合并度量阈值,获得N场互动。
需要说明的是,超过合并度量阈值,说明两互动场次之间的接近度和同质度比较高,它们之间的联系非常紧密,因此,可以合并。合并的目的是为了让异常更显著的反应出来,从而解决黑产伪装的问题,最终可以提升目标互动账号识别准确性。
在本实施例中,上述合并度量阈值选取的方法是:选取若干单个的互动场次,利用最小割将其分割成两个不同的部分,按照上述迭代方法计算合并这两个部分,得到互动场次合并度量值。将合并度量值从大到小进行排序,取95%的分位点作为阈值。其选取的原理是:影响该阈值的因素是如果发现当前目标互动账号参与互动的互动场次比较分散,那么将合并度量阈值调低,合并之后的规模更大,更容易凸显异常。需要说明的是,在正态分布中,95%分位数表示的是均值-2*方差,95%分位数可以表示排除异常值后理论上的取值下界。因此,取95%的分位点作为合并度量阈值,可以保证对互动场次的有效合并,最终可以提升目标互动账号识别准确性。
接下来,执行S107,基于所述N场互动中每场互动的互动结果规律值和互动结果规律阈值,获得所述目标互动账号。
在具体的实施过程中,首先,按照如下公式计算所述N场互动中每场互动的互动结果规律值:
其中,是所述N场互动中任意一场互动的互动结果规律值;是该场互动中获得虚拟
礼物的账号集合,u是中的任意一个账号;是该场互动中失去虚拟礼物的账号集合,v
是中的任意一个账号;表示的是中账号u的获取虚拟礼物占该场互动中总获得虚
拟礼物的比例;表示的是中账号v的失去虚拟礼物占该场互动中总失去虚拟礼物的比
例;
然后,将所述互动结果规律值大于互动结果规律阈值的互动场次对应的账号识别为目标互动账号。
其中,互动结果规律值即表示互动结果的衡量值,例如互动结果异常率。
上述公式表示的是互动结果分布的异常程度,如果互动结果是虚拟礼物被账号集中在少数几个账号获取,而其他失去虚拟礼物的账号失去虚拟礼物的数量比较均匀,那么该结果就异常,可以确定该互动场次异常。因此,为了描述上述这样的异常,公式的分母表示的是互动获取虚拟礼物的账号获取虚拟礼物占比的信息熵,值越大说明获去虚拟礼物的人越多、获取的虚拟礼物占比分布越均匀,异常程度越低;分子表示的是互动失去虚拟礼物的账号失去虚拟礼物占比的信息熵,值越大说明失去虚拟礼物的人越多、失去的虚拟礼物占比分布越均匀,异常程度越高。因此,公式整体而言,值越大这说明异常程度越高。
其中,互动结果规律阈值的设定主要是根据已有的异常互动场次互动结果异常率大到小进行排序,取95%的分位点作为互动结果规律阈值。影响该阈值的因素包括识别覆盖率,覆盖率要求越大,则将阈值降低,反之则增。需要说明的是,在正态分布中,95%分位数表示的是均值-2*方差,95%分位数可以表示排除异常值后理论上的取值下界。因此,取95%的分位点作为互动结果规律阈值,可以保证识别出异常特征明显的合并场次,最终可以提升目标互动账号识别准确性。
为了实现减少直播网络资源被占用,提高直播的流畅度,在将所述互动结果规律值大于互动结果规律阈值的互动场次对应的账号识别为目标互动账号之后,该方法还包括:
对目标互动账号进行屏蔽。
在清楚了本发明的整体技术方案后,下面以一个具体的实例来进行再次说明。
经过计算:
于是:
于是:合并度量值=0.64*0.3=0.192
举例来说,设定合并度量阈值0.15,因此,互动场次A和B可以合并。
合并后:
举例来说,设定互动结果规律阈值1.5,由于合并后的互动结果异常率大于该阈值,因此识别为异常行为。
上述本申请实施例中的技术方案,至少具有如下的技术效果或优点:
本实施例的方法,获取过去预设时间段内参与M场互动的账号集及所述账号集中账号的基础数据,其中,所述基础数据包括账号注册时间、账号注册来源、账号等级和账号互动时所使用的设备,M为大于等于2的正整数;基于所述账号注册时间、账号注册来源、账号等级和账号互动时所使用的设备,获得所述账号集中账号之间的关联度;基于所述账号之间的关联度,获得每场互动的内联度、两场互动之间的外联度和两场互动之间的互联度;基于所述每场互动的内联度和两场互动之间的外联度,获得两场互动之间的接近度;基于所述两场互动之间的互联度和两场互动之间的最小割边权重,获得两场互动之间的同质度;基于所述两场互动之间的接近度和同质度,对所述M场互动进行合并,获得N场互动,N为大于等于1的正整数;先将具有联系的互动场次进行合并,可将为了规避风险而将目标互动账号分布到不同的互动场次中的目标互动账号的客观特征进行合并,以使不太明显的特征凸显出来;在此基础上,再基于所述N场互动中每场互动的互动结果规律值和互动结果规律阈值,获得所述目标互动账号,可避免因目标互动账号为了规避风险而将目标账号分布到不同的互动场次中造成的对单场互动的识别不准确的问题,提供了一种可准确识别出目标互动账户的方法,因此,使用该方法识别出目标互动账号后,即可准确对占用直播网络资源的目标互动账号进行屏蔽。
实施例二
基于与实施例一同样的发明构思,本实施例提供一种识别目标互动账号的系统,参见图2,所述系统包括:
数据获取模块,用于获取过去预设时间段内参与M场互动的账号集及所述账号集中账号的基础数据,其中,所述基础数据包括账号注册时间、账号注册来源、账号等级和账号互动时所使用的设备,M为大于等于2的正整数;
第一获得模块,用于基于所述账号注册时间、账号注册来源、账号等级和账号互动时所使用的设备,获得所述账号集中账号之间的关联度;
第二获得模块,用于基于所述账号之间的关联度,获得每场互动的内联度、两场互动之间的外联度和两场互动之间的互联度;
第三获得模块,用于基于所述每场互动的内联度和两场互动之间的外联度,获得两场互动之间的接近度;
第四获得模块,用于基于所述两场互动之间的互联度和两场互动之间的最小割边权重,获得两场互动之间的同质度;
互动合并模块,用于基于所述两场互动之间的接近度和同质度,对所述M场互动进行合并,获得N场互动,N为大于等于1的正整数;
第五获得模块,用于基于所述N场互动中每场互动的互动结果规律值和互动结果规律阈值,获得所述目标互动账号。
由于本实施例所介绍的识别目标互动账号的系统为实现本申请实施例一种识别目标互动账号的方法所采用的系统,故而基于本申请实施例一中所介绍的识别目标互动账号的方法,本领域所属技术人员能够了解本实施例的系统的具体实施方式以及其各种变化形式,所以在此对于如何利用本中的系统实现实施例一中的方法不再详细介绍。只要本领域所属技术人员用于实现本申请实施例中识别目标互动账号的方法所采用的系统,都属于本申请所欲保护的范围。
基于与前述实施例中同样的发明构思,本发明实施例还提供一种可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现实施例一所述方法的步骤。
基于与前述实施例中同样的发明构思,本发明实施例还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现实施例一所述方法的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (10)
1.一种识别目标互动账号的方法,其特征在于,所述方法包括:
获取过去预设时间段内参与M场互动的账号集及所述账号集中账号的基础数据,其中,所述基础数据包括账号注册时间、账号注册来源、账号等级和账号互动时所使用的设备,M为大于等于2的正整数;
基于所述账号注册时间、账号注册来源、账号等级和账号互动时所使用的设备,获得所述账号集中账号之间的关联度;
基于所述账号之间的关联度,获得每场互动的内联度、两场互动之间的外联度和两场互动之间的互联度;
基于所述每场互动的内联度和两场互动之间的外联度,获得两场互动之间的接近度;
基于所述两场互动之间的互联度和两场互动之间的最小割边权重,获得两场互动之间的同质度;
基于所述两场互动之间的接近度和同质度,对所述M场互动进行合并,获得N场互动,N为大于等于1的正整数;
基于所述N场互动中每场互动的互动结果规律值和互动结果规律阈值,获得所述目标互动账号。
2.如权利要求1所述的方法,其特征在于,所述基于所述账号之间的关联度,获得每场互动的内联度、两场互动之间的外联度和两场互动之间的互联度,具体包括:
按照如下公式计算每场互动的内联度:
按照如下公式计算两场互动之间的外联度:
按照如下公式计算两场互动之间的互联度:
5.如权利要求4所述的方法,其特征在于,所述基于所述两场互动之间的接近度和同质度,对所述M场互动进行合并,获得N场互动,具体包括:
基于所述两场互动之间的接近度和同质度,获得两场互动之间的合并度量值;
基于所述两场互动之间的合并度量值和合并度量阈值,对所述M场互动进行合并,获得N场互动。
6.如权利要求5所述的方法,其特征在于,所述基于所述两场互动之间的合并度量值和合并度量阈值,对所述M场互动进行合并,获得N场互动,具体包括:
将所述M场互动按照各互动场次的参与账号数量大小进行排序;
分别计算所述排序中参与的账号数量最小的第一互动场次与所述排序中的其他场次的合并度量值,获得与所述第一互动场次之间有的最大合并度量值的第二互动场次;
若所述最大合并度量值高于合并度量阈值,则合并所述第一互动场次与第二互动场次,将合并后的互动场次按照参与的账号数量大小插入所述排序中,并返回执行分别计算所述排序中参与的账号数量最小的第一互动场次与所述排序中的其他场次的合并度量值步骤,迭代至所述排序中的任意两个互相场次之间的合并度量值都低于所述合并度量阈值,获得N场互动。
8.一种识别目标互动账号的系统,其特征在于,所述系统包括:
数据获取模块,用于获取过去预设时间段内参与M场互动的账号集及所述账号集中账号的基础数据,其中,所述基础数据包括账号注册时间、账号注册来源、账号等级和账号互动时所使用的设备,M为大于等于2的正整数;
第一获得模块,用于基于所述账号注册时间、账号注册来源、账号等级和账号互动时所使用的设备,获得所述账号集中账号之间的关联度;
第二获得模块,用于基于所述账号之间的关联度,获得每场互动的内联度、两场互动之间的外联度和两场互动之间的互联度;
第三获得模块,用于基于所述每场互动的内联度和两场互动之间的外联度,获得两场互动之间的接近度;
第四获得模块,用于基于所述两场互动之间的互联度和两场互动之间的最小割边权重,获得两场互动之间的同质度;
互动合并模块,用于基于所述两场互动之间的接近度和同质度,对所述M场互动进行合并,获得N场互动,N为大于等于1的正整数;
第五获得模块,用于基于所述N场互动中每场互动的互动结果规律值和互动结果规律阈值,获得所述目标互动账号。
9.一种可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-7任一项所述方法的步骤。
10.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1-7任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010048905.1A CN110855723B (zh) | 2020-01-16 | 2020-01-16 | 一种识别目标互动账号的方法及系统、介质、设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010048905.1A CN110855723B (zh) | 2020-01-16 | 2020-01-16 | 一种识别目标互动账号的方法及系统、介质、设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110855723A true CN110855723A (zh) | 2020-02-28 |
CN110855723B CN110855723B (zh) | 2020-04-21 |
Family
ID=69610843
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010048905.1A Active CN110855723B (zh) | 2020-01-16 | 2020-01-16 | 一种识别目标互动账号的方法及系统、介质、设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110855723B (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105721279A (zh) * | 2016-01-15 | 2016-06-29 | 中国联合网络通信有限公司广东省分公司 | 一种电信网络用户的交往圈挖掘方法及系统 |
CN106060676A (zh) * | 2016-05-17 | 2016-10-26 | 腾讯科技(深圳)有限公司 | 基于直播的在线互动方法和装置 |
CN106228410A (zh) * | 2016-07-29 | 2016-12-14 | 武汉斗鱼网络科技有限公司 | 一种直播平台中虚拟礼物任务防刷系统及方法 |
CN107481009A (zh) * | 2017-08-28 | 2017-12-15 | 广州虎牙信息科技有限公司 | 识别直播平台异常充值用户的方法、装置及终端 |
CN108734452A (zh) * | 2017-04-13 | 2018-11-02 | 阿里巴巴集团控股有限公司 | 互联网资源转移方法、转账方法及装置 |
CN108875817A (zh) * | 2018-06-06 | 2018-11-23 | 网易(杭州)网络有限公司 | 识别外挂方法及装置、存储介质、电子装置 |
CN109816397A (zh) * | 2018-12-03 | 2019-05-28 | 北京奇艺世纪科技有限公司 | 一种欺诈判别方法、装置及存储介质 |
CN110399925A (zh) * | 2019-07-26 | 2019-11-01 | 腾讯科技(武汉)有限公司 | 账号的风险识别方法、装置及存储介质 |
CN110418173A (zh) * | 2019-07-18 | 2019-11-05 | 北京达佳互联信息技术有限公司 | 确定异常账户的方法、装置、服务器及存储介质 |
US10484644B2 (en) * | 2014-02-26 | 2019-11-19 | Arris Enterprises Llc | Copy count for DTCP with an abbreviation hash used for check in copy |
-
2020
- 2020-01-16 CN CN202010048905.1A patent/CN110855723B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10484644B2 (en) * | 2014-02-26 | 2019-11-19 | Arris Enterprises Llc | Copy count for DTCP with an abbreviation hash used for check in copy |
CN105721279A (zh) * | 2016-01-15 | 2016-06-29 | 中国联合网络通信有限公司广东省分公司 | 一种电信网络用户的交往圈挖掘方法及系统 |
CN106060676A (zh) * | 2016-05-17 | 2016-10-26 | 腾讯科技(深圳)有限公司 | 基于直播的在线互动方法和装置 |
CN106228410A (zh) * | 2016-07-29 | 2016-12-14 | 武汉斗鱼网络科技有限公司 | 一种直播平台中虚拟礼物任务防刷系统及方法 |
CN108734452A (zh) * | 2017-04-13 | 2018-11-02 | 阿里巴巴集团控股有限公司 | 互联网资源转移方法、转账方法及装置 |
CN107481009A (zh) * | 2017-08-28 | 2017-12-15 | 广州虎牙信息科技有限公司 | 识别直播平台异常充值用户的方法、装置及终端 |
CN108875817A (zh) * | 2018-06-06 | 2018-11-23 | 网易(杭州)网络有限公司 | 识别外挂方法及装置、存储介质、电子装置 |
CN109816397A (zh) * | 2018-12-03 | 2019-05-28 | 北京奇艺世纪科技有限公司 | 一种欺诈判别方法、装置及存储介质 |
CN110418173A (zh) * | 2019-07-18 | 2019-11-05 | 北京达佳互联信息技术有限公司 | 确定异常账户的方法、装置、服务器及存储介质 |
CN110399925A (zh) * | 2019-07-26 | 2019-11-01 | 腾讯科技(武汉)有限公司 | 账号的风险识别方法、装置及存储介质 |
Non-Patent Citations (1)
Title |
---|
程瑶 等: "移动社交应用的用户隐私泄漏问题研究", 《计算机学报》 * |
Also Published As
Publication number | Publication date |
---|---|
CN110855723B (zh) | 2020-04-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109033408A (zh) | 信息推送方法及装置、计算机可读存储介质、电子设备 | |
Breitmoser | Strategic reasoning in p-beauty contests | |
Shah et al. | Mining for bidding strategies on eBay | |
CN111737481B (zh) | 知识图谱的降噪方法、装置、设备和存储介质 | |
CN108460627A (zh) | 营销活动方案推送方法、装置、计算机设备及存储介质 | |
CN109409432B (zh) | 一种图像处理方法、装置和存储介质 | |
Smith et al. | How does the behaviour of the core differ from the periphery?–An international trade network analysis | |
CN110855723B (zh) | 一种识别目标互动账号的方法及系统、介质、设备 | |
CN106021311A (zh) | 网络社交活动推荐方法和装置 | |
US8396787B2 (en) | Simplified quote sharing calculation | |
CN115222461B (zh) | 一种智能营销精准推荐方法 | |
CN108280651A (zh) | 一种商品对象审核方法、装置及系统 | |
CN116757715A (zh) | 排行榜生成方法及装置、存储介质、计算机设备 | |
CN110837895A (zh) | 模型解释方法和装置、电子设备及计算机可读存储介质 | |
Šíma | Market potential of TikTok in the context of the communication range of soccer players on social networks | |
Iapadre et al. | Measuring trade regionalisation: The case of Asia | |
Bishop | The world poultry market: government intervention and multilateral policy reform | |
CN108809987B (zh) | 一种基于大数据分析的网游推广方法 | |
Ejima et al. | Concept of keystone species in web systems: Identifying small yet influential online bulletin board threads | |
CN107392921A (zh) | 一种基于切比雪夫距离的半监督多目标聚类图像分割方法 | |
Bankole et al. | ECOWAS trade liberalization scheme (ETLS) and its impact on Intra-Regional Trade | |
Kou et al. | Dynamic evolution research and system implementation of international soybean trade network based on complex network | |
Tseng et al. | Experimental evidence for the interplay between individual wealth and transaction network | |
JP2004537114A5 (zh) | ||
CN114071196A (zh) | 一种识别目标直播间的方法及系统、介质、设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
EE01 | Entry into force of recordation of patent licensing contract |
Application publication date: 20200228 Assignee: Yidu Lehuo Network Technology Co.,Ltd. Assignor: WUHAN DOUYU YULE NETWORK TECHNOLOGY Co.,Ltd. Contract record no.: X2023980041383 Denomination of invention: A method, system, medium, and device for identifying target interactive accounts Granted publication date: 20200421 License type: Common License Record date: 20230908 |
|
EE01 | Entry into force of recordation of patent licensing contract |