CN108366274B - 一种刷播放量的检测方法和装置 - Google Patents

一种刷播放量的检测方法和装置 Download PDF

Info

Publication number
CN108366274B
CN108366274B CN201810027743.6A CN201810027743A CN108366274B CN 108366274 B CN108366274 B CN 108366274B CN 201810027743 A CN201810027743 A CN 201810027743A CN 108366274 B CN108366274 B CN 108366274B
Authority
CN
China
Prior art keywords
playing
video
detected
data
preset time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810027743.6A
Other languages
English (en)
Other versions
CN108366274A (zh
Inventor
琛ュ浆
补彬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing QIYI Century Science and Technology Co Ltd
Original Assignee
Beijing QIYI Century Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing QIYI Century Science and Technology Co Ltd filed Critical Beijing QIYI Century Science and Technology Co Ltd
Priority to CN201810027743.6A priority Critical patent/CN108366274B/zh
Publication of CN108366274A publication Critical patent/CN108366274A/zh
Application granted granted Critical
Publication of CN108366274B publication Critical patent/CN108366274B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/24Monitoring of processes or resources, e.g. monitoring of server load, available bandwidth, upstream requests
    • H04N21/2407Monitoring of transmitted content, e.g. distribution time, number of downloads
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/24Monitoring of processes or resources, e.g. monitoring of server load, available bandwidth, upstream requests

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本发明实施例提供了一种刷播放量的检测方法和装置,该方法和装置应用于视频播放网站,具体为将预设时间周期划分为多个时间窗口;获取待检测视频在每个时间窗口内的特征向量;将多个预设时间周期内所有时间窗口的特征向量进行聚类处理,得到待检测视频在多个预设时间周期内的播放向量集,去除其中的异常向量,得到正常播放向量集;在待检测视频正常播放期间,获取待检测视频的播放数据;对待检测视频的播放数据与正常播放向量集进行比较;如果存在偏差数据,则判定待检测视频被恶意刷播放量;如果不存在偏差数据,则判定没有被恶意刷播放量。通过判定是否有刷播放量的发生,运营者可以及时进行干预、惩处或者采取其他相应措施,从而能够较好地避免其经济利益受损。

Description

一种刷播放量的检测方法和装置
技术领域
本发明涉及互联网技术领域,特别是涉及一种刷播放量的检测方法和装置。
背景技术
由于目前法律法规还不太健全,且受经济利益驱使,黑产往往会有目的有组织的针对相应的视频播放网站刷播放量,以便使某些受益方获取非法利益。对于视频网站来说,这一行为会导致在统计相应视频的播放量时,得到的统计量远高于其实际播放量,在某些受益方获取非法利益的同时造成视频播放网站的运营者遭到经济损失;此外,实际播放量的异常还会影响到视频推荐服务的质量,从而造成用户体验下降。
发明内容
有鉴于此,本发明提供了一种刷播放量的检测方法和装置,以避免视频播放网站因非法刷播放量而导致运营者遭到经济损失。
为了解决上述问题,本发明公开了一种刷播放量的检测方法,应用于视频播放网站,其特征在于,所述检测方法包括步骤:
将预设时间周期划分为多个时间窗口;
获取待检测视频在每个时间窗口内的特征向量;
将多个预设时间周期内所有时间窗口的特征向量进行聚类处理,得到所述待检测视频在多个预设时间周期内的播放向量集,去除其中的异常向量,得到正常播放向量集;
在所述待检测视频正常播放期间,获取所述待检测视频的播放数据;
对所述待检测视频的播放数据与所述正常播放向量集进行比较;
如果存在偏差数据,则判定所述待检测视频被恶意刷播放量;
如果不存在偏差数据,则判定没有被恶意刷播放量。
可选的,所述预设时间周期为24小时。
可选的,所述特征向量为所述待检测视频在所述时间窗口内的总访问次数、平均每分钟访问次数、总访问用户数、平均每分钟访问用户数、总访问IP数、平均每分钟访问IP数和总访问位置数中的部分或全部。
可选的,所述多个预设时间周期包括至少10个预设时间周期。
可选的,还包括步骤:
当判定没有恶意刷播放量时,将所述播放数据作为正常特征向量加入到所述正常播放向量集。
相应的,为了保证上述方法的实施,本发明还提供了一种刷播放量的检测装置,应用于视频播放网站,所述检测方法包括:
时间窗口划分模块,用于将预设时间周期划分为多个时间窗口;
特征向量获取模块,用于获取待检测视频在每个时间窗口内的特征向量;
第一聚类处理模块,用于将多个预设时间周期内所有时间窗口的特征向量进行聚类处理,得到所述待检测视频在多个预设时间周期内的播放向量集,去除其中的异常向量,得到正常播放向量集;
播放数据获取模块,用于在所述待检测视频正常播放期间,获取所述待检测视频的播放数据;
播放数据判断模块,用于对所述待检测视频的播放数据与所述正常播放向量集进行比较;
第一判定模块,用于当存在偏差数据时,判定所述待检测视频被恶意刷播放量;
第二判定模块,用于当不存在偏差数据时,判定没有被恶意刷播放量。
可选的,所述预设时间周期为24小时。
可选的,所述特征向量为所述待检测视频在所述时间窗口内的总访问次数、平均每分钟访问次数、总访问用户数、平均每分钟访问用户数、总访问IP数、平均每分钟访问IP数和总访问位置数中的部分或全部。
可选的,所述多个预设时间周期包括至少10个预设时间周期。
可选的,还包括:
第二聚类处理模块,用于当判定没有恶意刷播放量时,将所述播放数据作为正常特征向量加入到所述正常播放向量集。
从上述技术方案可以看出,本发明提供了一种刷播放量的检测方法和装置,该方法和装置应用于视频播放网站,具体为将预设时间周期划分为多个时间窗口;获取待检测视频在每个时间窗口内的特征向量;将多个预设时间周期内所有时间窗口的特征向量进行聚类处理,得到待检测视频在多个预设时间周期内的播放向量集,去除其中的异常向量,得到正常播放向量集;在待检测视频正常播放期间,获取待检测视频的播放数据;对待检测视频的播放数据与正常播放向量集进行比较;如果存在偏差数据,则判定待检测视频被恶意刷播放量;如果不存在偏差数据,则判定没有被恶意刷播放量。通过判定是否有刷播放量的发生,运营者可以及时进行干预、惩处或者采取其他相应措施,从而能够较好地避免其经济利益受损;且通过对恶意刷播放量的检测,可以根据检测结果对实际的播放数据进行处理,得到真实的播放数据,能够避免因为播放数据的异常而导致视频推荐服务质量的下降,从而保证了用户体验。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种刷播放量的检测方法的步骤流程图;
图2为本发明实施例提供的一种播放量的播放向量集图形;
图3为本发明实施例提供的另一种刷播放量的检测方法的步骤流程图;
图4为本发明实施例提供的一种刷播放量的检测装置的结构框图;
图5为本发明实施例提供的另一种刷播放量的检测装置的结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
图1为本发明实施例提供的一种刷播放量的检测方法的步骤流程图。
参照图1所示,本实施例提供的检测方法应用于视频播放网站,用于对非法刷播放量的行为进行检测,以避免给运营者造成经济损失,该检测方法具体包括如下步骤:
S101:将预设时间周期划分为多个时间窗口。
这里设定预设时间周期的原因在于视频的播放有其固有的规律,例如在一天内的各个时段的播放量是不同的,例如在白天多少一些,晚上多一些。鉴于人们的活动一般以24小时为一个周期,即日出而作日落而息,因此,这里的预设时间周期可以选择1天,具体来说选择24小时。
时间窗口则可以根据实际需要进行划分,当然随着划分密度的加大会增加数据的精确性,但相对也会增加计算量,均衡考虑,则可以选择1小时为一个时间窗口,这样1天可以划分为24个时间窗口,如果选择0.5小时为一个时间窗口,则1天会划分为48个时间窗口。
S102:获取每个时间窗口内的特征向量。
这里具体是指在获取多个预设时间周期内每个预设周期内每个时间窗口的特征向量,所谓特征向量是指用于表征相应待检测视频的点播或播放特征的特征数据,例如待检测视频在每个时间窗口内的总访问次数、平均每分钟访问次数、总访问用户数、平均每分钟访问用户数、总访问IP数、平均每分钟访问IP数、总访问位置数等。
上述特征数据可以从待检测数据在网站运行期间的日志文件中获取,为了避免无效数据干扰,可以在提取这些特征数据时首先将日志文件中的异常值和格式不统一的数据,最后将非异常值和统一格式的数据作为特征数据予以提取。
S103:将多个预设时间周期的特征向量进行聚类处理。
在得到多个预设时间周期的每个时间周期内每个时间窗口的特征向量后,将上述特征向量进行聚类处理,即根据预设时间周期的时间顺序和时间窗口的时间顺序对特征向量进行排序组合并聚类处理,从而得到聚类结果,该聚类结果为一个多维数组,即得到本实施例中的播放向量集。例如,单独以播放量来说,得到的播放向量集的图形化表达方式如图2所示。通过人工分析或其他办法去除其中的异常向量,即得到正常播放向量集。
S104:获取正常播放期间的播放数据。
在相应待检测视频的正常播放期间内,对应于上述预设时间周期的设定和时间窗口的设定,在每个预设时间周期内,对该待检测视频的每个时间窗口的播放数据进行检测,即获取与上述特征向量相对应的播放数据,如每个时间窗口内的总访问次数、平均每分钟访问次数、总访问用户数、平均每分钟访问用户数、总访问IP数、平均每分钟访问IP数和总访问位置数。
S105:判断播放数据中是否存在相对于正常播放向量集的偏差数据。
具体来说,每次得到预设时间周期内的播放数据后,将该播放数据与播放向量集进行比较,由于播放向量集由多个预设时间周期内特征向量聚类而成,因此其中与每个时间窗口对应的数据应该是一个数据范围,在将播放数据与之对比时,如果没有刷播放量的行为,则播放数据中的每个数据应该在相应时间窗口的数据范围之内,或者偏差在预设阈值之内,如果不在该数据范围之内或者偏差超出预设阈值的话,则表明存在刷播放量的行为。
S106:如果存在偏差数据,则判定被恶意刷播放量。
即播放数据中某个或某些数据不在上述数据范围之内,或者偏差在预设阈值之外的情况下,判定该待检测视频被恶意刷播放量,此时可以提供管理人员进行实际查看或者采取其他干预措施。
S107:如果不存在偏差数据,则判定没有被恶意刷播放量。
即播放数据中所有数据都在上述数据范围之内,或者偏差在预设阈值之内的情况下,判定该待检测视频没有被恶意刷播放量。
从上述技术方案可以看出,本实施例提供了一种刷播放量的检测方法,该方法应用于视频播放网站,具体为将预设时间周期划分为多个时间窗口;获取待检测视频在每个时间窗口内的特征向量;将多个预设时间周期内所有时间窗口的特征向量进行聚类处理,得到待检测视频在多个预设时间周期内的播放向量集,去除其中的异常向量,得到正常播放向量集;在待检测视频正常播放期间,获取待检测视频的播放数据;对待检测视频的播放数据与正常播放向量集进行比较;如果存在偏差数据,则判定待检测视频被恶意刷播放量;如果不存在偏差数据,则判定没有被恶意刷播放量。通过判定是否有刷播放量的发生,运营者可以及时进行干预、惩处或者采取其他相应措施,从而能够较好地避免其经济利益受损;且通过对恶意刷播放量的检测,可以根据检测结果对实际的播放数据进行处理,得到真实的播放数据,能够避免因为播放数据的异常而导致视频推荐服务质量的下降,从而保证了用户体验。
另外,本实施例中还可以包括如下步骤,具体参照图3所示。
S108:将播放数据加入到正常播放向量集。
在得到一个完整预设时间周期的播放数据后,如果通过将其与播放向量集进行比较没有发现偏差数据,则表明该周期内不存在恶意刷播放量,即该周期内的播放数据是正常数据,可以作为候选比较的依据,此时可以将该播放数据通过聚类加入到正常播放向量集中,以增加正常播放向量集的客观性。
还有,在某个待检测视频的上线初期,由于播放周期较少,因此较少的特征向量还无法代表其实际的播放规律,因此此时可以采取人工方式进行判断是否有恶意刷播放量的情况发生。当播放时间较长后,则可以获取能够较为真实代表其实际的播放规律的数据,因此,这里的预设时间周期的数量可以选择至少10个,也就是说在相应视频上线至少10天后可以通过本方法判断是否有恶意刷播放量的情况发生。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
实施例二
图4为本发明实施例提供的一种刷播放量的检测装置的结构框图。
参照图4所示,本实施例提供的检测装置应用于视频播放网站,用于对非法刷播放量的行为进行检测,以避免给运营者造成经济损失,该检测装置具体包括时间窗口划分模块10、特征向量获取模块20、第一聚类处理模块30、播放数据获取模块40、播放数据判断模块50、第一判定模块60和第二判定模块70。
时间窗口划分模块用于将预设时间周期划分为多个时间窗口。
这里设定预设时间周期的目的得原因在于视频的播放有其固有的规律,例如在一天内的各个时段的播放量是不同的,例如在白天多少一些,晚上多一些。鉴于人们的活动一般以24小时为一个周期,即日出而作日落而息,因此,这里的预设时间周期可以选择1天,具体来说选择24小时。
时间窗口则可以根据实际需要进行划分,当然随着划分密度的加大会增加数据的精确性,但相对也会增加计算量,均衡考虑,则可以选择1小时为一个时间窗口,这样1天可以划分为24个时间窗口,如果选择0.5小时为一个时间窗口,则1天会划分为48个时间窗口。
特征向量获取模块用于获取每个时间窗口内的特征向量。
这里具体是指在获取多个预设时间周期内每个预设周期内每个时间窗口的特征向量,所谓特征向量是指用于表征相应待检测视频的点播或播放特征的特征数据,例如待检测视频在每个时间窗口内的总访问次数、平均每分钟访问次数、总访问用户数、平均每分钟访问用户数、总访问IP数、平均每分钟访问IP数、总访问位置数等。
上述特征数据可以从待检测数据在网站运行期间的日志文件中获取,为了避免无效数据干扰,可以在提取这些特征数据时首先将日志文件中的异常值和格式不统一的数据,最后将非异常值和统一格式的数据作为特征数据予以提取。
第一聚类处理模块用于将多个预设时间周期的特征向量进行聚类处理。
在得到多个预设时间周期的每个时间周期内每个时间窗口的特征向量后,将上述特征向量进行聚类处理,即根据预设时间周期的时间顺序和时间窗口的时间顺序对特征向量进行排序组合并聚类处理,从而得到聚类结果,该聚类结果为一个多维数组,即得到本实施例中的播放向量集。例如,单独以播放量来说,得到的播放向量集的图形化表达方式如图2所示,并通过人工分析或其他办法去除其中的异常向量,即得到正常播放向量集。。
播放数据获取模块用于获取正常播放期间的播放数据。
在相应待检测视频的正常播放期间内,对应于上述预设时间周期的设定和时间窗口的设定,在每个预设时间周期内,对该待检测视频的每个时间窗口的播放数据进行检测,即获取与上述特征向量相对应的播放数据,如每个时间窗口内的总访问次数、平均每分钟访问次数、总访问用户数、平均每分钟访问用户数、总访问IP数、平均每分钟访问IP数和总访问位置数。
数据判断模块用于判断播放数据中是否存在相对于播放向量集的偏差数据。
具体来说,每次得到预设时间周期内的播放数据后,将该播放数据与正常播放向量集进行比较,由于播放向量集由多个预设时间周期内特征向量聚类而成,因此其中与每个时间窗口对应的数据应该是一个数据范围,在将播放数据与之对比时,如果没有刷播放量的行为,则播放数据中的每个数据应该在相应时间窗口的数据范围之内,或者偏差在预设阈值之内,如果不在该数据范围之内或者偏差超出预设阈值的话,则表明存在刷播放量的行为。
第一判定模块用于当数据判断模块判断出该播放数据存在偏差数据时,判定被恶意刷播放量。
即播放数据中某个或某些数据不在上述数据范围之内,或者偏差在预设阈值之外的情况下,判定该待检测视频被恶意刷播放量,此时可以提供管理人员进行实际查看或者采取其他干预措施。
第二判定模块用于当数据判断模块判断该播放数据不存在偏差数据时,判定没有被恶意刷播放量。
即播放数据中所有数据都在上述数据范围之内,或者偏差在预设阈值之内的情况下,判定该待检测视频没有被恶意刷播放量。
从上述技术方案可以看出,本实施例提供了一种刷播放量的检测装置,该装置应用于视频播放网站,具体包括时间窗口划分模块、特征向量获取模块、第一聚类处理模块、播放数据获取模块、播放数据判断模块、第一判定模块和第二判定模块。时间窗口划分模块用于将预设时间周期划分为多个时间窗口;特征向量获取模块用于获取待检测视频在每个时间窗口内的特征向量;第一聚类处理模块用于将多个预设时间周期内所有时间窗口的特征向量进行聚类处理,得到所述待检测视频在多个预设时间周期内的播放向量集;播放数据获取模块用于在所述待检测视频正常播放期间,获取所述待检测视频的播放数据;播放数据判断模块则用于对所述待检测视频的播放数据与所述播放向量集进行比较;如果存在偏差数据,第一判定模块则判定所述待检测视频被恶意刷播放量;如果不存在偏差数据,第二判定模块则则判定没有被恶意刷播放量。通过判定是否有刷播放量的发生,运营者可以及时进行干预、惩处或者采取其他相应措施,从而能够较好地避免其经济利益受损;且通过对恶意刷播放量的检测,可以根据检测结果对实际的播放数据进行处理,得到真实的播放数据,能够避免因为播放数据的异常而导致视频推荐服务质量的下降,从而保证了用户体验。
另外,本实施例中还可以包括第二聚类处理模块80,具体参照图5所示。
第二聚类处理模块用于将播放数据加入到播放向量集。
在得到一个完整预设时间周期的播放数据后,如果通过将其与播放向量集进行比较没有发现偏差数据,则表明该周期内不存在恶意刷播放量,即该周期内的播放数据是正常数据,可以作为候选比较的依据,此时可以将该播放数据通过聚类加入到正常播放向量集中,以增加正常播放向量集的客观性。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本发明所提供的技术方案进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种刷播放量的检测方法,应用于视频播放网站,其特征在于,所述检测方法包括步骤:
将预设时间周期划分为多个时间窗口;
获取待检测视频在每个时间窗口内的特征向量;
将多个预设时间周期内所有时间窗口的特征向量进行聚类处理,得到所述待检测视频在多个预设时间周期内的播放向量集,去除其中的异常向量,得到正常播放向量集;
在所述待检测视频正常播放期间,获取所述待检测视频的播放数据;
对所述待检测视频的播放数据与所述正常播放向量集进行比较;
如果存在偏差数据,则判定所述待检测视频被恶意刷播放量;
如果不存在偏差数据,则判定没有被恶意刷播放量;
其中,所述将多个预设时间周期内所有时间窗口的特征向量进行聚类处理,包括:
根据所述预设时间周期的时间顺序和所述时间窗口的时间顺序对所述特征向量进行排序组合并聚类处理。
2.如权利要求1所述的检测方法,其特征在于,所述预设时间周期为24小时。
3.如权利要求1所述的检测方法,其特征在于,所述特征向量为所述待检测视频在所述时间窗口内的总访问次数、平均每分钟访问次数、总访问用户数、平均每分钟访问用户数、总访问IP数、平均每分钟访问IP数和总访问位置数中的部分或全部。
4.如权利要求1所述的检测方法,其特征在于,所述多个预设时间周期包括至少10个预设时间周期。
5.如权利要求1所述的检测方法,其特征在于,还包括步骤:
当判定没有恶意刷播放量时,将所述播放数据作为正常特征向量加入到所述正常播放向量集。
6.一种刷播放量的检测装置,应用于视频播放网站,其特征在于,所述检测装置包括:
时间窗口划分模块,用于将预设时间周期划分为多个时间窗口;
特征向量获取模块,用于获取待检测视频在每个时间窗口内的特征向量;
第一聚类处理模块,用于将多个预设时间周期内所有时间窗口的特征向量进行聚类处理,得到所述待检测视频在多个预设时间周期内的播放向量集,去除其中的异常向量,得到正常播放向量集;
播放数据获取模块,用于在所述待检测视频正常播放期间,获取所述待检测视频的播放数据;
播放数据判断模块,用于对所述待检测视频的播放数据与所述正常播放向量集进行比较;
第一判定模块,用于当存在偏差数据时,判定所述待检测视频被恶意刷播放量;
第二判定模块,用于当不存在偏差数据时,判定没有被恶意刷播放量;
其中,所述第一聚类处理模块,还用于:
根据所述预设时间周期的时间顺序和所述时间窗口的时间顺序对所述特征向量进行排序组合并聚类处理。
7.如权利要求6所述的检测装置,其特征在于,所述预设时间周期为24小时。
8.如权利要求6所述的检测装置,其特征在于,所述特征向量为所述待检测视频在所述时间窗口内的总访问次数、平均每分钟访问次数、总访问用户数、平均每分钟访问用户数、总访问IP数、平均每分钟访问IP数和总访问位置数中的部分或全部。
9.如权利要求6所述的检测装置,其特征在于,所述多个预设时间周期包括至少10个预设时间周期。
10.如权利要求6所述的检测装置,其特征在于,还包括:
第二聚类处理模块,用于当判定没有恶意刷播放量时,将所述播放数据作为正常特征向量加入到所述正常播放向量集。
CN201810027743.6A 2018-01-11 2018-01-11 一种刷播放量的检测方法和装置 Active CN108366274B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810027743.6A CN108366274B (zh) 2018-01-11 2018-01-11 一种刷播放量的检测方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810027743.6A CN108366274B (zh) 2018-01-11 2018-01-11 一种刷播放量的检测方法和装置

Publications (2)

Publication Number Publication Date
CN108366274A CN108366274A (zh) 2018-08-03
CN108366274B true CN108366274B (zh) 2020-09-01

Family

ID=63011041

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810027743.6A Active CN108366274B (zh) 2018-01-11 2018-01-11 一种刷播放量的检测方法和装置

Country Status (1)

Country Link
CN (1) CN108366274B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110381377B (zh) * 2019-07-23 2021-07-27 秒针信息技术有限公司 一种资讯播放的检测方法、装置、电子设备及存储介质
CN110290400B (zh) * 2019-07-29 2022-06-03 北京奇艺世纪科技有限公司 可疑刷量视频的识别方法、真实播放量预估方法及装置
CN112583801B (zh) * 2020-12-02 2022-06-07 深圳第一线通信有限公司 基于大数据的网络异常行为检测系统及其方法
CN116582702B (zh) * 2023-07-11 2023-09-15 成都工业职业技术学院 一种基于大数据的网络视频播放量预测方法、系统及介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103327016A (zh) * 2013-06-06 2013-09-25 合一信息技术(北京)有限公司 一种计算网络流媒体异常播放量并对其修正的方法及系统
CN103886068A (zh) * 2014-03-20 2014-06-25 北京国双科技有限公司 用于互联网用户行为分析的数据处理方法和装置
CN106815255A (zh) * 2015-11-27 2017-06-09 阿里巴巴集团控股有限公司 检测数据访问异常的方法及装置
CN107529093A (zh) * 2017-09-05 2017-12-29 北京奇艺世纪科技有限公司 一种视频文件播放量的检测方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170187737A1 (en) * 2015-12-28 2017-06-29 Le Holdings (Beijing) Co., Ltd. Method and electronic device for processing user behavior data

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103327016A (zh) * 2013-06-06 2013-09-25 合一信息技术(北京)有限公司 一种计算网络流媒体异常播放量并对其修正的方法及系统
CN103886068A (zh) * 2014-03-20 2014-06-25 北京国双科技有限公司 用于互联网用户行为分析的数据处理方法和装置
CN106815255A (zh) * 2015-11-27 2017-06-09 阿里巴巴集团控股有限公司 检测数据访问异常的方法及装置
CN107529093A (zh) * 2017-09-05 2017-12-29 北京奇艺世纪科技有限公司 一种视频文件播放量的检测方法及系统

Also Published As

Publication number Publication date
CN108366274A (zh) 2018-08-03

Similar Documents

Publication Publication Date Title
CN108366274B (zh) 一种刷播放量的检测方法和装置
CN106874165B (zh) 网页检测方法和装置
CN110609941B (zh) 互联网操作事件的风险识别方法及装置
CN109063969B (zh) 一种账户风险评估的方法及装置
CN111030992B (zh) 检测方法、服务器及计算机可读存储介质
CN107016298B (zh) 一种网页篡改监测方法及装置
CN109842858B (zh) 一种业务异常订购检测方法及装置
CN107547266B (zh) 在线量异常点的检测方法和装置、计算机设备和存储介质
CN117291649B (zh) 一种集约化的营销数据处理方法及系统
CN109389988B (zh) 音效调整控制方法和装置、存储介质及电子装置
CN109800572A (zh) 检测方法、系统以及计算机可读存储介质
CN113992340A (zh) 用户异常行为识别方法、装置、设备、存储介质和程序
CN111881365A (zh) 内容推荐方法及装置
CN114329452A (zh) 一种异常行为检测方法、装置及相关设备
CN113123955B (zh) 柱塞泵异常检测方法、装置、存储介质及电子设备
CN109598525B (zh) 数据处理方法和装置
US10110625B2 (en) Network security assessment system
CN110765171B (zh) 一种不良用户甄别方法、存储介质、电子设备及系统
CN112822527B (zh) 视频推荐方法、装置、服务器及存储介质
US20130304470A1 (en) Electronic device and method for detecting pornographic audio data
CN110334517B (zh) 可信策略的更新方法及装置、可信安全管理平台
CN112115324A (zh) 一种基于幂律分布确认刷赞用户的方法及装置
JP7075362B2 (ja) 判定装置、判定方法及び判定プログラム
CN109427177B (zh) 一种监控报警方法及装置
CN107948739B (zh) 一种网络电视去重用户数的计算方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant