CN104143055B - 盗版视频监控方法与系统 - Google Patents

盗版视频监控方法与系统 Download PDF

Info

Publication number
CN104143055B
CN104143055B CN201410402626.5A CN201410402626A CN104143055B CN 104143055 B CN104143055 B CN 104143055B CN 201410402626 A CN201410402626 A CN 201410402626A CN 104143055 B CN104143055 B CN 104143055B
Authority
CN
China
Prior art keywords
video
information
source video
pirate
source
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410402626.5A
Other languages
English (en)
Other versions
CN104143055A (zh
Inventor
张云锋
张缓迅
周盛
姚键
潘柏宇
卢述奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Youku Culture Technology Beijing Co ltd
Original Assignee
1Verge Internet Technology Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 1Verge Internet Technology Beijing Co Ltd filed Critical 1Verge Internet Technology Beijing Co Ltd
Priority to CN201410402626.5A priority Critical patent/CN104143055B/zh
Publication of CN104143055A publication Critical patent/CN104143055A/zh
Application granted granted Critical
Publication of CN104143055B publication Critical patent/CN104143055B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/10Protecting distributed programs or content, e.g. vending or licensing of copyrighted material ; Digital rights management [DRM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Technology Law (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Television Signal Processing For Recording (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

本申请公开了盗版视频监控方法与系统,该方法:为版权视频建立特征配置表,并根据所述特征配置表进行初步网络检索,将检索获得的源视频链接作为待检测链接;提取待检测链接对应的网页内容中包含的源视频特征信息,并将所述源视频特征信息作为一行记录写入待检测日志表中;利用所述特征配置表中的记录与所述日志表中的对应的记录进行对比分析,判断所述源视频是否盗版所述版权视频;若所述源视频盗版所述版权视频,则将源视频地址标记为盗版链接并保存到盗版信息表中。本发明通过定期的从网络中采集网络视频的相关数据并进行对比分析,从而实现判断网络中是否有盗版视频的存在。

Description

盗版视频监控方法与系统
技术领域
本申请涉及互联网技术领域,具体地说,涉及盗版视频监控方法与系统。
背景技术
现阶段,随着法律法规的逐步完善和知识产权意识的提升,对于盗版侵权的抵制越发严厉。对于网络视频以及视频网站而言,同样紧随着时代逐步的提升对于版权的保护。渐渐改变了从前网络中盗版视频充斥的状况。
目前的网络环境下,各大门户视频网站基本上都可以保持这优良的版权意识,合法的播出正版的电影、电视剧、综艺节目等网络视频;既保证了各方的合法权益,又提高了用户的观看体验,可谓是一种共赢的经营模式。
同时在当前视频网站的激烈竞争环境下,网站取得合法版权的网络视频,也代表着该网站的竞争力;往往某些热门节目的独家播出版权,是视频网站通过巨资购买,同时也能够为视频网站带来大量的流量和收益。
可以说在视频网站这一竞争激烈的领域当中,版权关乎到多方的巨大利益,也是决定这一领域能否公平良性发展的方向关键因素之一,对于版权的保护至关重要。
当前对于版权的保护,依然存在诸多不完善之处。对于网络环境中盗版视频的发现、监控乃至维权举报的力度,都是有待提高的。依然存在一些视频网站或由于疏漏,或处于投机取巧的目的,非法播放盗版网络视频的情况。
现有技术中,还没有一种有效且便于实施的方式,能够帮助视频网站及时的监控发现盗版视频的存在,并帮助视频网站做出有效的处理。
发明内容
有鉴于此,本申请所要解决的技术问题是提供了一种盗版视频监控方法及系统,通过定期的从网络中采集网络视频的相关数据并进行对比分析,从而实现判断网络中是否有盗版视频的存在。
为了解决上述技术问题,本申请有如下技术方案:
一种盗版视频监控方法,其特征在于,包括:
为版权视频建立特征配置表,并根据所述特征配置表进行初步网络检索,将检索获得的源视频链接作为待检测链接;
提取待检测链接对应的网页内容中包含的源视频特征信息,并将所述源视频特征信息作为一行记录写入待检测日志表中;
利用所述特征配置表中的记录与所述日志表中的对应的记录进行对比分析,判断所述源视频是否盗版所述版权视频;
若所述源视频盗版所述版权视频,则将源视频地址标记为盗版链接并保存到盗版信息表中。
优选地,其中,所述特征配置表包括:
版权视频名称信息、版权视频导演信息、版权视频演员信息、版权视频时长信息、版权视频类型信息、版权视频地区信息及版权视频发行年代信息。
优选地,其中,所述源视频特征信息包括:
源视频名称信息、源视频导演信息、源视频演员信息、源视频时长信息、源视频类型信息、源视频地区信息、源视频发行年代信息及源视频地址信息。
优选地,其中,所述将所述特征信息制成待检测日志表中的一条记录具体为:
预设时间周期,并按照所述时间周期建立检测日志,将所述时间周期范围内提取的每条源视频特征信息,作为一条记录写入所述检测日志表中。
优选地,其中,所述将源视频特征信息制成一个记录具体为:
将所述源视频特征信息与相应的版权视频ID共同作为一个记录。
优选地,其中,所述利用所述特征配置表与所述记录进行对比分析具体为:
所述时间周期结束之后,从所述检测日志表中提取所述记录,并通过所述记录中的版权视频ID,查询对应的版权视频的特征配置表;
利用贝叶斯分类算法对所述特征配置表中的特征信息与所述日志表中的记录对应的源视频特征信息进行对比分析。
优选地,其中,若所述源视频盗版所述版权视频,则还包括:
将待检测链接对应的网页截图并保存。
优选地,其中,若所述源视频盗版所述版权视频,则还包括:
将所述待检测链接上报人工核对。
优选地,其中,若所述源视频盗版所述版权视频,则还包括:
向所述待检测链接所属网站发送警告消息。
一种盗版视频监控系统,其特征在于,包括:
后端配置模块,用于为版权视频建立特征配置表;
前端采集模块,用于根据所述特征配置表进行初步网络检索,将检索获得的源视频链接作为待检测链接;提取待检测链接中包含的源视频特征信息,并将所述特征信息作为一行记录写入待检测日志表中;
信息判定模块,用于利用所述特征配置表与所述日志表中的记录进行对比分析,判断所述源视频是否盗版所述版权视频;若所述源视频盗版所述版权视频,则将源视频地址标记为盗版链接并保存到盗版信息表中。
数据库,用于保存所述特征特征配置表、日志表和盗版信息表。
优选地,其中,还包括:
配置信息缓存模块,用于从数据库提取特征配置信息,并供前端采集模块和信息判定模块采集。
优选地,其中,还包括:
盗版处理模块,用于将待检测链接对应的网页截图并保存;将所述待检测链接上报人工核对;向所述待检测链接所述网站发送警告消息。
优选地,其中,所述前端采集模块包括:
检索单元,用于根据所述特征配置表进行初步网络检索,将检索获得的源视频链接作为待检测链接;
记录单元,用于提取待检测链接中包含的源视频特征信息,将所述时间周期范围内提取的每条源视频特征信息与相应的版权视频ID共同作为一个记录,写入所述检测日志表中。
优选地,其中,所述信息判定模块包括:
日志提取单元,从所述检测日志中提取所述记录,并通过所述记录中的版权视频ID,查询对应的版权视频的特征配置表;
对比分析单元,用于利用贝叶斯分类算法对所述特征配置表与所述记录中的源视频特征信息进行对比分析。
与现有技术相比,本申请所述的方法和系统,达到了如下效果:
(1)实时对网络环境中的视频进行采集和对比分析,从而实现了判断网络环境中是否存在非法播放的盗版视频。
(2)提高了盗版视频监控的准确性,有效的保护了视频版权。
(3)避免了监测过程中对于数据库的过度访问。
当然,实施本申请的任一产品必不一定需要同时达到以上所述的所有技术效果。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本申请实施例所述方法流程图;
图2为本申请另一实施例所述方法流程图;
图3为本申请实施例所述系统结构示意图。
具体实施方式
如在说明书及权利要求当中使用了某些词汇来指称特定组件。本领域技术人员应可理解,硬件制造商可能会用不同名词来称呼同一个组件。本说明书及权利要求并不以名称的差异来作为区分组件的方式,而是以组件在功能上的差异来作为区分的准则。如在通篇说明书及权利要求当中所提及的“包含”为一开放式用语,故应解释成“包含但不限定于”。“大致”是指在可接收的误差范围内,本领域技术人员能够在一定误差范围内解决所述技术问题,基本达到所述技术效果。此外,“耦接”一词在此包含任何直接及间接的电性耦接手段。因此,若文中描述一第一装置耦接于一第二装置,则代表所述第一装置可直接电性耦接于所述第二装置,或通过其他装置或耦接手段间接地电性耦接至所述第二装置。说明书后续描述为实施本申请的较佳实施方式,然所述描述乃以说明本申请的一般原则为目的,并非用以限定本申请的范围。本申请的保护范围当视所附权利要求所界定者为准。
本申请所述的盗版视频监控方法中,将实时对网络环境中的视频进行采集和对比分析,从而判断网络环境中是否存在非法播放的盗版视频,并且还将在发现盗版视频的情况下,相应的做出处理。参照图1所示,为本申请所述方法的一个具体实施例。本实施例中所述方法包括:
步骤101、为版权视频建立特征配置表,并根据所述特征配置表进行初步网络检索,将检索获得的源视频链接作为待检测链接。
本实施例中,假设视频网站A将利用所述方法实现盗版网络视频的监控,实际上,基于所述方法,网站A可以针对其所拥有的大量的版权视频进行盗版的监控,不过本实施例中为方便阐述方法的流程,仅仅从一个具体视频的角度出发进行描述。
首先需针对网站A所拥有一个版权视频建立配置表。所述特征配置表中包括版权视频名称信息、版权视频导演信息、版权视频演员信息、版权视频时长信息、版权视频类型信息、版权视频地区信息及版权视频发行年代信息等具体的内容。所述特征配置表将作为搜索并判断网络中其他视频是否为盗版的依据。
例如网站A拥有合法播放电影《老男孩猛龙过江》的版权,则针对该视频的若干特征,建立能够建立一个特征配置表。该特征配置表的内容如表1:
表1
基于上述特征配置表中包括的特征,即可在网络中进行一个初步的检索,很可能发现某些疑似盗版视频的网络视频。此处将这些疑似盗版的网络视频统称源视频。进一步可将检索获得的源视频链接作为待检测链接,用以进一步的判断所述源视频是否为盗版视频。
本实施例中假设得到一个如下的待检测链接前缀:
“http://v.xxx.com/#ct=301989888&rn=20&pn=0&db=0&s=0&fbl=800&oq=&f=3&rsp=&ie=utf-8&word=”
步骤102、提取待检测链接对应的网页内容中包含的源视频特征信息,并将所述源视频特征信息作为一行记录写入待检测日志表中。
此处根据待检测链接,对源视频的相关特征进行提取。源视频特征信息包括:源视频名称信息、源视频导演信息、源视频演员信息、源视频时长信息、源视频类型信息、源视频地区信息及源视频发行年代信息。以上特征信息将用于判断源视频是否为盗版视频。额外的,源视频特征信息中还包括源视频地址信息;记录源视频的地址便于对源视频进行可能出现的后续处理。
本实施例中将对前述的待检测链接前缀与版权视频的名称进行拼组,得到完整的链接:
“http://v.xxx.com/#ct=301989888&rn=20&pn=0&db=0&s=0&fbl=800&oq=&f=3&rsp=&ie=utf-8&word=老男孩之猛龙过江”
然后基于上述的链接对其相应的网页或视频播放页面中进行信息提取,得到一个检索结果列表页,提取检索结果列表页的网页的内容,得到结果如下:
<div class="mod_sideright clearfix">
<ul class="pic160_90 clearfix">2
<li data-searchpingback-position="c1=27"data-searchpingback-albumname="老男孩之猛龙过江_高清版江">
<a href="http://v.xxx.com/w_19rsgj34yl.html" class="piclist_img" target="_blank">
<img width="160" height="90" alt="老男孩之猛龙过江_高清版" title="老男孩之猛龙过江_高清版" src="http://v.xxx.com/image/20140720/uv_160_90.GIF">
</a>
<p class="piclist_title"><spanclass="stitle">老男孩之猛龙过江_高清版</span></p>
</li>
<li data-searchpingback-position="c1=7" data-searchpingback-albumname="【小苹果】筷子兄弟周星驰《老男孩之猛龙过江》_高清">
<a href="http://v.xxx.com/w_19rsmh8f65.html" class="piclist_img" target="_blank">
<img width="160" height="90" alt="筷子兄弟周星驰老男孩之猛龙过江" title="筷子兄弟周星驰老男孩之猛龙过江" src="http://v.xxx.com/image/20140806/m2_160_90.GIF">
</a>
<p class="piclist_title"><spanclass="stitle">易红涛电影老男孩猛龙过江小苹果</span></p>
</li>
<li data-searchpingback-position="c1=10" data-searchpingback-albumname="电影《老男孩猛龙过江》终极预告">
<a href="http://v.xxx.com/w_19rsm3jrhp.html" class="piclist_img" target="_blank">
<img width="160" height="90" alt="电影《老男孩猛龙过江》终极预告" title="电影《老男孩猛龙过江》终极预告" src="http://v.xxx.com/image/20140807/m1_160_90.GIF">
</a>
<p class="piclist_title"><spanclass="stitle">电影《老男孩猛龙过江》终极预告</span></p>
</li>
</ul>
</div>
从上述网页内容中进一步进行分析,可以得到如下三个视频播放页url:
http://v.xxx.com/w_19rsgj34yl.html
html://v.xxx.com/w_19rsmh8f65.html
html://v.xxx.com/w_19rsm3jrhp.html
然后进一步提取上述三个url对应的网页中的内容又可以得到每个url对应的视频的详细信息,如下面是提取第一个url对应网页的内容时的结果片段:
<div class="videoitem vi-138v row-last">
<a href="http://v.xxx.com/w_19rsgj34yl.html" class="v-thumb vt-138" target="_blank" alog-text="">
<img src="http://v.xxx.com/image/20140720/uv_160_90.GIF" class="juzhao">
<span class="v-play-mask"></span>
<span class="v-play-icon"></span>
</a>
<div class="v-desc">
<dl>
<dt class="v-title"><a href="http://v.xxx.com/w_19rsgj34yl.html" title="老男孩之猛龙过江_高清版"></a></dt>
<dt class="v-director"><a href="http://v.xxx.com/person/20140801/xyang.html" title="">肖央</a></dt>
<dt class="v-actor">王太利、肖央</dt>
<dt class="v-timeLen"><span>95分钟</span></dt>
<dt class="v-area">内地</dt>
</dl>
</div>
</div>
通过这一标签片段获悉源视频特征信息如表2:
表2
以上源视频特征信息,将所谓一个记录写入到检测日志表当中。需要说明的是,本实施例中所述检测日志根据预设的时间周期建立。检测日志中可以包括多个记录。
具体的说,本实施例中假设所述时间周期为1小时,并且以整时作为起点。即意味着每个整时(例如1点整)建立一个检测日志,在时间周期范围内(即1点~2点间)检索到的每一个源视频的特征信息,连带源视频相应的版权视频ID,共同记录为检测日志中的一个记录。所述时间周期结束之后(即2点以后),开始对该检测日志中的每个记录进行相应的检测,判断记录对应的源视频是否为盗版。
假设本实施例中的版权视频电影《老男孩猛龙过江》在版权方网站A的视频ID为012345,所述记录的具体内容参见表3:
表3
步骤103、利用所述特征配置表中的记录与所述日志表中的对应的记录进行对比分析,判断所述源视频是否盗版所述版权视频。
所述时间周期结束之后,从所述检测日志中提取所述记录,并通过所述记录中的版权视频ID,查询对应的版权视频的特征配置表。
本实施例中,通过表3中包括的版权视频ID012345,即可获悉表3中特征信息对应的源视频,可能是版权视频《老男孩猛龙过江》的盗版视频。相应的查询到表1中所示的特征配置表。在对比分析表1与表3中对应的特征信息,即可更为准确的判断该源视频是否为版权视频的盗版。
本领域中常规的分析算法均可结合在本实施例的整体技术方案之下,所以本实施例中将不对分析算法做出具体的限定。不过此处将举例说明,利用贝叶斯分类算法对表1与表3中特征信息进行对比分析的过程如下:
设C={0,1},其中0表示非盗版视频,1表示盗版视频。
取a1~a5共5个特征信息进行对比分析:a1、被检测的视频名称是否包含了版权库中设置的视频名称; a2、导演是否相同;a3、视频时长的时间差长度;a4、视频地区是否相同;a5、视频发行年代是否相同。
分析式如下:
a1:{a=0(不是),a=1(是)},
a2:{a=0(不是),a=1(是)},
a3:{0<a<=0.1,0.1<a<=0.3,a>0.3},
a4:{a=0(不是),a=1(是)},
a5:{ a=0(不是),a=1(是)}。
通过训练样本中盗版记录数和非盗版记录数量分别除以记录总数,得到:
P(C=0)=580/1000=0.58
P(C=1)=420/1000=0.42
计算每个类别条件下各个特征属性划分的频率
P(a1=0|C=0)=0.4
P(a1=1|C=0)=0.6
P(a1=0|C=1)=0.2
P(a1=1|C=1)=0.8
P(a2=0|C=0)=0.45
P(a2=1|C=0)=0.55
P(a2=0|C=1)=0.17
P(a2=1|C=1)=0.83
P(0<=a3<0.1|C=0)=0.35
P(0.1<=a3<0.3|C=0)=0.32
P(a3>=0.3|C=0)=0.33
P(0<=a3<0.1|C=1)=0.9
P(0.1<=a3<0.3|C=1)=0.08
P(a3>=0.3|C=1)=0.33=0.02
P(a4=0|C=0)=0.46
P(a4=1|C=0)=0.54
P(a4=0|C=1)=0.22
P(a4=1|C=1)=0.78
P(a5=0|C=0)=0.67
P(a5=1|C=0)=0.33
P(a5=0|C=1)=0.11
P(a5=1|C=1)=0.89
对比表1和表3有:
a1=0,a2=1, 0<=a3<0.1,a4=0,a5=1;
根据贝叶斯公式:
P(C=0)P(x|C=0)
=P(C=0)*P(a1=0|C=0) *P(a2=1|C=0)*P(0<=a3<0.1|C=0)
*P(a4=0|C=0)*P(a5=1|C=0)=0.58*0.4*0.55*0.35*0.46*0.33=0.006779388
P(C=1)P(x|C=1)
=P(C=1)*P(a1=0|C=1) *P(a2=1|C=1)*P(0<=a3<0.1|C=1)
*P(a4=0|C=1)*P(a5=1|C=1)=0.42*0.2*0.83*0.9*0.22*0.89=0.0122860584
根据计算结果:P(C=0)P(x|C=0)< P(C=1)P(x|C=1)。判断结果显示该源视频盗版该版权视频。
步骤104、若所述源视频盗版所述版权视频,则将源视频地址标记为盗版链接并保存到盗版信息表中。
当发现所述源视频为盗版视频,则将源视频地址标记为盗版链接并保存,以便后续留存证据供后续的相关处理。
还需要说明的是,以上步骤101~步骤104中描述的流程,仅仅为针对一个版权视频和源视频的判断过程。在实际情况下,可以按照上述方式实时/定期的对一个或多个版权视频进行进行反复的网络监控和检测,以全面的控制盗版视频的出现。
通过以上技术方案可知,本实施例所述方法存在的有益效果是:实时对网络环境中的视频进行采集和对比分析,从而实现了判断网络环境中是否存在非法播放的盗版视频。
参见图2所示,为本申请所述方法的另一个具体实施例。本实施例中,将在前述实施例的基础之上,更进一步的对盗版视频的处理方式做出的公开和描述。本实施例中所述方法包括:
步骤201、为版权视频建立特征配置表,并根据所述特征配置表进行初步网络检索,将检索获得的源视频链接作为待检测链接。
步骤202、提取待检测链接对应的网页内容中包含的源视频特征信息,并将所述源视频特征信息作为一行记录写入待检测日志表中。
步骤203、利用所述特征配置表中的记录与所述日志表中的对应的记录进行对比分析,判断所述源视频是否盗版所述版权视频。
步骤204、若所述源视频盗版所述版权视频,则将源视频地址标记为盗版链接并保存到盗版信息表中。
步骤205、若所述源视频盗版所述版权视频,则将待检测链接对应的网页截图并保存。
步骤206、若所述源视频盗版所述版权视频,则将所述待检测链接上报人工核对。
步骤207、若所述源视频盗版所述版权视频,则向所述待检测链接所述网站发送警告消息。
在步骤205~步骤207中,描述了针对盗版视频进行相应处理的方法。通过将待检测链接对应的网页截图并保存,可以留存盗版视频播放的相关证据。通过将所述待检测链接上报人工核对,能够进一步的启动人工核对源视频是否为盗版视频的流程,确保了盗版视频检测的准确性。在必要的情况下,也可以直接向所述待检测链接所述网站发送警告消息,勒令其停止盗版侵权的行为。
通过以上技术方案可知,本实施例存在的有益效果是:描述了三种对于盗版视频的处理方式,使得本申请整体技术方案更加完整,公开更加充分,提高了盗版视频监控的准确性,有效的保护了视频版权。
参见图3所示,为本申请所述盗版视频监控系统的具体实施例。本实施例中,所述系统用于实现前述实施例中所述的方法,其技术方案本质上与前述实施例一致,前述实施例中的相应描述,同样适用于本实施例中。所述系统具体包括:
后端配置模块301,用于为版权视频建立特征配置表。
前端采集模块302,用于根据所述特征配置表进行初步网络检索,将检索获得的源视频链接作为待检测链接;提取待检测链接中包含的源视频特征信息,并将所述特征信息制成待检测日志中的一个记录。
所述前端采集模块302包括:
检索单元,用于根据所述特征配置表进行初步网络检索,将检索获得的源视频链接作为待检测链接;
记录单元,用于提取待检测链接中包含的源视频特征信息,将所述时间周期范围内提取的每条源视频特征信息与相应的版权视频ID共同作为一个记录,写入所述检测日志中。
信息判定模块303,用于利用所述特征配置表中的记录与所述日志表记录进行对比分析,判断所述源视频是否盗版所述版权视频。
所述信息判定模块303包括:
日志提取单元,用于所述时间周期结束之后,从所述检测日志中提取所述记录,并通过所述记录中的版权视频ID,查询对应的版权视频的特征配置表;
对比分析单元,用于利用贝叶斯分类算法对所述特征配置表中的记录与所述日志表记录中的源视频特征信息进行对比分析。
数据库304,用于保存所述特征配置表、日志表、盗版信息表,并在所述源视频盗版所述版权视频时,将源视频标记为盗版链接并保存到盗版信息表。
优选的,所述系统还包括:盗版处理模块305,用于将待检测链接对应的网页截图并保存;将所述待检测链接上报人工核对;向所述待检测链接所述网站发送警告消息。
优选的,所述系统还包括配置信息缓存模块306,用于从数据库提取特征配置表,并供前端采集模块和信息判定模块使用。
需要说明的是,在所述系统中,由于前端采集模块302、信息判定模块303乃至盗版处理模块305均可能需要访问数据库304获得所述特征配置表;并且在某些大型系统中,为了多通道并行开展盗版视频的监控,也可能设置多个前端采集模块302、信息判定模块303和盗版处理模块305;所以大量的相关模块同时访问数据库304,会为数据库304的运行带来很大的压力。所以本实施例中为了缓解数据库304的运行负担,优选的设置了所述配置信息缓存模块306,用来从数据库提取特征配置表,并向所述特征配置表转发至相应的其他模块上,避免了对于数据库304的过度访问。
通过以上技术方案可知,本实施例所述系统存在的有益效果是:实时对网络环境中的视频进行采集和对比分析,从而实现了判断网络环境中是否存在非法播放的盗版视频;提高了盗版视频监控的准确性,有效的保护了视频版权;避免了监测过程中对于数据库的过度访问。
通过以上各实施例可知,本申请所述盗版视频监控方法及系统存在的有益效果是:
(1)实时对网络环境中的视频进行采集和对比分析,从而实现了判断网络环境中是否存在非法播放的盗版视频。
(2)提高了盗版视频监控的准确性,有效的保护了视频版权。
(3)避免了监测过程中对于数据库的过度访问。
本领域内的技术人员应明白,本申请的实施例可提供为方法、装置、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
上述说明示出并描述了本申请的若干优选实施例,但如前所述,应当理解本申请并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述发明构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本申请的精神和范围,则都应在本申请所附权利要求的保护范围内。

Claims (14)

1.一种盗版视频监控方法,其特征在于,包括:
为版权视频建立特征配置表,并根据所述特征配置表进行初步网络检索,将检索获得的源视频链接作为待检测链接;
提取待检测链接对应的网页内容中包含的源视频特征信息,并将所述源视频特征信息作为一行记录写入待检测日志表中;
利用所述特征配置表中的记录与所述日志表中的对应的记录进行对比分析,判断所述源视频是否盗版所述版权视频;
若所述源视频盗版所述版权视频,则将源视频地址标记为盗版链接并保存到盗版信息表中;
所述特征配置表中包括版权视频名称信息、版权视频导演信息、版权视频演员信息、版权视频时长信息、版权视频类型信息、版权视频地区信息或版权视频发行年代信息至少一种;
所述源视频特征信息包括源视频名称信息、源视频导演信息、源视频演员信息、源视频时长信息、源视频类型信息、源视频地区信息或源视频发行年代信息至少一种。
2.根据权利要求1所述盗版视频监控方法,其特征在于,所述特征配置表包括:
版权视频名称信息、版权视频导演信息、版权视频演员信息、版权视频时长信息、版权视频类型信息、版权视频地区信息及版权视频发行年代信息。
3.根据权利要求1所述盗版视频监控方法,其特征在于,所述源视频特征信息包括:
源视频名称信息、源视频导演信息、源视频演员信息、源视频时长信息、源视频类型信息、源视频地区信息、源视频发行年代信息及源视频地址信息。
4.根据权利要求1~3任意一项所述盗版视频监控方法,其特征在于,所述将所述特征信息制成待检测日志表中的一条记录具体为:
预设时间周期,并按照所述时间周期建立检测日志,将所述时间周期范围内提取的每条源视频特征信息,作为一条记录写入所述检测日志表中。
5.根据权利要求4所述盗版视频监控方法,其特征在于,所述将源视频特征信息制成一个记录具体为:
将所述源视频特征信息与相应的版权视频ID共同作为一个记录。
6.根据权利要求5所述盗版视频监控方法,其特征在于,所述利用所述特征配置表与所述记录进行对比分析具体为:
所述时间周期结束之后,从所述检测日志表中提取所述记录,并通过所述记录中的版权视频ID,查询对应的版权视频的特征配置表;
利用贝叶斯分类算法对所述特征配置表中的特征信息与所述日志表中的记录对应的源视频特征信息进行对比分析。
7.根据权利要求1~3任意一项所述盗版视频监控方法,其特征在于,若所述源视频盗版所述版权视频,则还包括:
将待检测链接对应的网页截图并保存。
8.根据权利要求1~3任意一项所述盗版视频监控方法,其特征在于,若所述源视频盗版所述版权视频,则还包括:
将所述待检测链接上报人工核对。
9.根据权利要求1~3任意一项所述盗版视频监控方法,其特征在于,若所述源视频盗版所述版权视频,则还包括:
向所述待检测链接所属网站发送警告消息。
10.一种盗版视频监控系统,其特征在于,包括:
后端配置模块,用于为版权视频建立特征配置表;
前端采集模块,用于根据所述特征配置表进行初步网络检索,将检索获得的源视频链接作为待检测链接;提取待检测链接中包含的源视频特征信息,并将所述特征信息作为一行记录写入待检测日志表中;
信息判定模块,用于利用所述特征配置表与所述日志表中的记录进行对比分析,判断所述源视频是否盗版所述版权视频;若所述源视频盗版所述版权视频,则将源视频地址标记为盗版链接并保存到盗版信息表中。
数据库,用于保存所述特征特征配置表、日志表和盗版信息表;
所述特征配置表中包括版权视频名称信息、版权视频导演信息、版权视频演员信息、版权视频时长信息、版权视频类型信息、版权视频地区信息或版权视频发行年代信息至少一种;
所述源视频特征信息包括源视频名称信息、源视频导演信息、源视频演员信息、源视频时长信息、源视频类型信息、源视频地区信息或源视频发行年代信息至少一种。
11.根据权利要求10所述盗版视频监控系统,其特征在于,还包括:
配置信息缓存模块,用于从数据库提取特征配置信息,并供前端采集模块和信息判定模块采集。
12.根据权利要求10所述盗版视频监控系统,其特征在于,还包括:
盗版处理模块,用于将待检测链接对应的网页截图并保存;将所述待检测链接上报人工核对;向所述待检测链接网站发送警告消息。
13.根据权利要求10所述盗版视频监控系统,其特征在于,所述前端采集模块包括:
检索单元,用于根据所述特征配置表进行初步网络检索,将检索获得的源视频链接作为待检测链接;
记录单元,用于提取待检测链接中包含的源视频特征信息,将时间周期范围内提取的每条源视频特征信息与相应的版权视频ID共同作为一个记录,写入所述检测日志表中。
14.根据权利要求13所述盗版视频监控系统,其特征在于,所述信息判定模块包括:
日志提取单元,从所述检测日志中提取所述记录,并通过所述记录中的版权视频ID,查询对应的版权视频的特征配置表;
对比分析单元,用于利用贝叶斯分类算法对所述特征配置表与所述记录中的源视频特征信息进行对比分析。
CN201410402626.5A 2014-08-16 2014-08-16 盗版视频监控方法与系统 Active CN104143055B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410402626.5A CN104143055B (zh) 2014-08-16 2014-08-16 盗版视频监控方法与系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410402626.5A CN104143055B (zh) 2014-08-16 2014-08-16 盗版视频监控方法与系统

Publications (2)

Publication Number Publication Date
CN104143055A CN104143055A (zh) 2014-11-12
CN104143055B true CN104143055B (zh) 2017-02-15

Family

ID=51852225

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410402626.5A Active CN104143055B (zh) 2014-08-16 2014-08-16 盗版视频监控方法与系统

Country Status (1)

Country Link
CN (1) CN104143055B (zh)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104469496B (zh) * 2014-12-11 2018-04-03 北京国双科技有限公司 用于视频播放器的盗链检测方法和装置
CN105912890A (zh) * 2016-03-31 2016-08-31 乐视控股(北京)有限公司 资源盗用的检测方法和装置
CN105872769B (zh) * 2016-04-27 2019-12-03 亦非云互联网技术(上海)有限公司 一种基于互联网媒体平台的版权保护方法及系统
CN108664489B (zh) * 2017-03-29 2022-12-23 腾讯科技(深圳)有限公司 网站内容监控方法和装置
CN109614766B (zh) * 2018-10-31 2021-01-22 创新先进技术有限公司 一种通过文件获取对网页进行区块链存证的方法及装置
CN109582885B (zh) * 2018-10-31 2020-06-12 阿里巴巴集团控股有限公司 一种通过网页监测对网页进行区块链存证的方法及装置
CN109618237A (zh) * 2018-11-26 2019-04-12 维沃移动通信有限公司 一种视频处理方法及移动终端
CN110324729B (zh) * 2019-07-18 2021-08-27 北京奇艺世纪科技有限公司 一种识别侵权视频链接的方法、装置、电子设备及介质
CN110795699B (zh) * 2019-10-04 2022-12-02 易方信息科技股份有限公司 基于iPhone系统状态栏的iOS11以下的防录屏方法
CN110737802B (zh) * 2019-10-15 2022-06-03 中科智云科技有限公司 盗版视频检测方法、装置、电子设备及存储介质
CN111355732B (zh) 2020-02-28 2021-06-11 腾讯科技(深圳)有限公司 链接检测方法、装置、电子设备及存储介质
CN112383770A (zh) * 2020-11-02 2021-02-19 杭州当虹科技股份有限公司 一种通过语音识别技术的影视版权监测比对方法
CN112688931B (zh) * 2020-12-21 2022-08-12 杭州当虹科技股份有限公司 一种使用RecordRTC获取视频播放网页取证内容的方法
CN112788363B (zh) * 2020-12-30 2023-04-28 北京奇艺世纪科技有限公司 识别侵权视频的方法、识别侵权视频的装置及电子设备
CN114051163B (zh) * 2021-11-10 2024-03-22 广东触电传媒科技有限公司 一种基于视频字幕比对的版权监测方法及系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101639880A (zh) * 2008-07-31 2010-02-03 华为技术有限公司 一种文件检测方法和装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101493918A (zh) * 2008-10-21 2009-07-29 深圳市牧笛科技有限公司 在线音乐盗版监控方法和系统
CN101794363B (zh) * 2010-01-29 2011-08-24 华中科技大学 网络多媒体版权主动追踪与监视系统
CN102855423A (zh) * 2011-06-29 2013-01-02 盛乐信息技术(上海)有限公司 一种文字作品的追踪方法和装置
CN103686244A (zh) * 2013-12-26 2014-03-26 乐视网信息技术(北京)股份有限公司 视频数据的管理方法及其系统
CN103942254B (zh) * 2014-03-18 2017-11-14 电子科技大学 一种面向网盘分享服务的盗版视频资源发现方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101639880A (zh) * 2008-07-31 2010-02-03 华为技术有限公司 一种文件检测方法和装置

Also Published As

Publication number Publication date
CN104143055A (zh) 2014-11-12

Similar Documents

Publication Publication Date Title
CN104143055B (zh) 盗版视频监控方法与系统
US9935967B2 (en) Method and device for detecting malicious URL
KR101171536B1 (ko) 비디오 지문의 시간 세그먼트 기반 추출 및 강건한 일치
CN110324729B (zh) 一种识别侵权视频链接的方法、装置、电子设备及介质
CN101350043B (zh) 数字内容的一致性检测方法及装置
EP2608107A2 (en) System and method for fingerprinting video
WO2017084308A1 (zh) 视频播放方法及装置
CN101639880A (zh) 一种文件检测方法和装置
WO2009099790A2 (en) System and method for detecting the source of media content with application to business rules
KR100986223B1 (ko) 불법 동영상 데이터 검색 장치 및 방법
KR100930077B1 (ko) 디지털 저작권 관리를 위한 워터마크 추적 시스템
CN113918895A (zh) 一种文本文档溯源追踪的方法
JP4742264B2 (ja) コンテンツ検出装置、不正使用判定装置及び警報装置並びにコンテンツ配信ネットワークシステム
Choi et al. Feature Analysis and Detection Techniques for Piracy Sites.
KR101373176B1 (ko) 복제 동영상정보 검출방법 및 장치, 저장매체
CN111539929A (zh) 一种版权检测方法、装置及电子设备
Duman et al. Trueclick: Automatically distinguishing trick banners from genuine download links
US11714847B2 (en) Methods and apparatus to detect unconfined view media
Huang et al. Mediaprinting: Identifying multimedia content for digital rights management
CN103839004A (zh) 检测恶意文件的方法和设备
KR20200124050A (ko) 컨텐츠 무단복사 탐지방법 및 이를 이용하는 서비스 서버
Ma et al. Salient region detection for biometric watermarking
KR101081308B1 (ko) 동영상 저작권 위반 판별방법 및 그것을 이용한 동영상 저작권 위반 판별장치
US20240160832A1 (en) Prevention of Web Scraping and Copy and Paste of Content by Font Obfuscation
Le Callet et al. Visibility control and quality assessment of watermarking and data hiding algorithms

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CP01 Change in the name or title of a patent holder

Address after: 100080 Beijing Haidian District city Haidian street A Sinosteel International Plaza No. 8 block 5 layer A, C

Patentee after: Youku network technology (Beijing) Co.,Ltd.

Address before: 100080 Beijing Haidian District city Haidian street A Sinosteel International Plaza No. 8 block 5 layer A, C

Patentee before: 1VERGE INTERNET TECHNOLOGY (BEIJING) Co.,Ltd.

CP01 Change in the name or title of a patent holder
TR01 Transfer of patent right

Effective date of registration: 20200318

Address after: Room 508, floor 5, building 4, No. 699, Wangshang Road, Changhe street, Binjiang District, Hangzhou City, Zhejiang Province

Patentee after: Alibaba (China) Co.,Ltd.

Address before: 100080 Beijing Haidian District city Haidian street A Sinosteel International Plaza No. 8 block 5 layer A, C

Patentee before: Youku network technology (Beijing) Co.,Ltd.

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20240618

Address after: 101400 Room 201, 9 Fengxiang East Street, Yangsong Town, Huairou District, Beijing

Patentee after: Youku Culture Technology (Beijing) Co.,Ltd.

Country or region after: China

Address before: Room 508, 5th floor, building 4, No.699 Wangshang Road, Changhe street, Binjiang District, Hangzhou City, Zhejiang Province, 310025

Patentee before: Alibaba (China) Co.,Ltd.

Country or region before: China