CN101493918A - 在线音乐盗版监控方法和系统 - Google Patents
在线音乐盗版监控方法和系统 Download PDFInfo
- Publication number
- CN101493918A CN101493918A CNA200810216970XA CN200810216970A CN101493918A CN 101493918 A CN101493918 A CN 101493918A CN A200810216970X A CNA200810216970X A CN A200810216970XA CN 200810216970 A CN200810216970 A CN 200810216970A CN 101493918 A CN101493918 A CN 101493918A
- Authority
- CN
- China
- Prior art keywords
- audio
- frequency fingerprint
- frequency
- pirate
- audio file
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Reverberation, Karaoke And Other Acoustics (AREA)
Abstract
本发明涉及一种在线音乐盗版监控方法和系统,依次包括以下步骤:音频指纹提取模块从互联网上获取音频下载地址;音频指纹提取模块读取来自所述音频下载地址的音频文件,经过处理得到音频指纹;监控分析模块将所述音频指纹与正版音频文件的音频指纹比对;如果比对结果大于设定阈值,则侵权定位模块进一步获取涉嫌侵权者的信息,向该涉嫌侵权者发出警告。同现有技术相比较,本发明的技术效果在于:通过网络蜘蛛、音频指纹提取、特征码提取等技术手段对网络数字音乐资源有效的监控,和对侵权行为的取证、警告,整个流程是自动化的,大大的节约成本,节省了时间,保证了维权的及时性。
Description
技术领域
本发明涉及一种盗版监控方法,特别是涉及一种针对网络数字音乐资源盗版的监控方法。
背景技术
人们已经习惯于通过互联网获取数字音乐资源,但是通过互联网下载未经授权的数字音乐,这使得版权所有人蒙受巨大损失。目前,多数维权公司或者团体是借助人工,上互联网通过关键字搜索和发现盗版资源,取证也是由人工下载。现有技术存在以下不足:监控、取证和通知等环节是分离的,各环节都由人工进行,这导致监控取证工作量大、成本高,盗版发现不及时,监控覆盖面不全等问题。
发明内容
本发明要解决的技术问题在于避免上述现有技术的不足之处而提出一种自动监控网络音乐盗版、并对该盗版行为自动取证和自动警告涉嫌侵权者的在线音乐盗版监控方法和系统。
本发明解决所述技术问题可以通过采用以下技术方案来实现:
提出一种在线音乐盗版监控方法,依次包括以下步骤,
①从互联网上获取音频下载地址;
②读取来自所述音频下载地址的音频文件,经过处理得到音频指纹;
③将所述音频指纹与正版音频文件的音频指纹比对;
④如果比对结果大于设定阈值,则判断该音频文件涉嫌侵权,并进一步获取涉嫌侵权者的信息,向该涉嫌侵权者发出警告。
同现有技术相比较,本发明的技术效果在于:通过网络蜘蛛、音频指纹提取、特征码提取等技术手段对网络数字音乐资源有效的监控,和对侵权行为的取证、警告,整个流程是自动化的,大大的节约成本,节省了时间,保证了维权的及时性。
附图说明
图1是本发明方法在线音乐盗版监控方法流程示意图;
图2是本发明在线音乐盗版监控系统的功能模块方框示意图。
具体实施方式
以下结合附图所示之最佳实施例作进一步详述。
如图1所示,本实施例在线音乐盗版监控方法,依次包括以下步骤:
①从互联网上获取音频下载地址,获取音频下载地址是选择音乐网站首页地址进行递归抓取,遇到后缀为音频文件格式的统一资源定位符URL,便标注为音频下载地址;然后获取来自所述音频下载地址的音频文件哈希值,判断该哈希值是否已经存在,如果已经存在,则丢弃该音频文件;哈希算法将任意长度的二进制值映射为固定长度的较小二进制值,这个小的二进制值称为哈希值(hash code),哈希值是一段数据唯一且极其紧凑的数值表示形式;哈希值是hash table中的一组特殊的整数,如果两个对象的内容相同的话,它们的哈希值也相同。
②如果该哈希值在数据库中不存在,则读取来自所述音频下载地址的音频文件,读取音频文件不少于90秒的播放时间长度,经过处理得到音频指纹;然后对所述音频指纹进行压缩,并将压缩后的音频指纹定位至相关音频指纹数据库,对音频指纹数据库进行更新;
③将所述音频指纹与正版音频文件的音频指纹比对;
④如果比对结果大于设定阈值,则判断该音频文件可能涉嫌侵权;
⑤如果该音频文件涉嫌侵权,则将所述音频指纹和其文本信息进行关联,进一步验证歌曲名称、歌手姓名、专辑名称等相关信息的准确性,如果经过验证信息准确,则进一步获取涉嫌侵权者的信息,向该涉嫌侵权者发出警告。
通过互联网搜索、音频指纹匹配等强有力的保护版权的先进技术,主动监控方式及时掌握互联网数字音乐盗版信息传播情况,获取侵权行为信息,同时系统可以对提供盗版下载的网站进行预警、追踪、取证等一系列功能。解决了目前版权保护存在的瓶颈问题。第一保护了网络上传播的数字音乐内容不被非法篡改,第二对数字音乐版权提供了有效的保护,防止被随意传播,第三对已经发生的侵权行为进行取证。
如图2所示,本发明在线音乐盗版监控系统,包括网络蜘蛛模块1,用于获取互联网上的音频下载地址信息和获取互联网上的相关站点的文本信息。网络蜘蛛先通过种子URL开始递归抓取,遇到后缀为MP3、WMA等格式的URL,标注为音频下载地址,并把音频下载地址传送到音频指纹提取系统,同时把文本信息和下载URL传送到信息关联系统。
音频指纹提取模块2,用于读取互联网上链接的音频文件和正版音频文件并处理得到音频指纹;音频指纹提取系统用于读取音频文件或者音频输入,输出音频特征码。音频文件来源可以是互联网上的链接、CD播放器、DVD播放器、硬盘等。音频文件应不少于90秒的播放时间长度。音频指纹提取系统先从音频文件读取90秒的数据,通过解码器解码,处理得到定长的音频指纹。并把音频指纹传送到音频指纹索引系统,如果是从互联网提取到的音频指纹,同时把音频指纹和URL传送到链接索引系统。
监控分析模块3,用于将从互联网上链接的音频文件的音频指纹与正版音频文件的音频指纹比对,判断是否超过设定阈值;用于接受用户提交的监控请求,根据用户的提交音频或者文本信息,在索引中匹配,如果发现相似文件,再通过定位系统获取进一步的侵权者的信息,发出警报。
侵权定位模块4,用于获取涉嫌侵权者的信息,向该涉嫌侵权者发出警告;用于对相关侵权网站获取公司名称,EMAIL等信息,同时通过盗版URL获取文件IP等。通过这些信息,可以方便对这个侵权公司或者个人警告。
指纹索引模块5,用于对音频指纹信息进行压缩和索引;用于对指纹信息进行有效压缩和索引。音频指纹本身是长度为424个字节的字符串,任意两个音频指纹可以计算得到一个量化的相似程度,通过对音频指纹数据库进行索引,对于给定的音频指纹,可以迅速匹配与之相似的音频指纹。
信息关联模块6,用于将所述音频指纹信息和其文本信息进行关联,进一步验证相关信息的准确性。
Claims (10)
1.一种在线音乐盗版监控方法,其特征在于:依次包括以下步骤,
①从互联网上获取音频下载地址;
②读取来自所述音频下载地址的音频文件,经过处理得到音频指纹;
③将所述音频指纹与正版音频文件的音频指纹比对;
④如果比对结果大于设定阈值,则判断该音频文件涉嫌侵权,并进一步获取涉嫌侵权者的信息,向该涉嫌侵权者发出警告。
2.如权利要求1所述的在线音乐盗版监控方法,其特征在于:在步骤①之后,先获取音频文件哈希值,判断该哈希值是否已经存在,如果已经存在,则丢弃该音频文件,如果该哈希值不存在,则继续进行下一个步骤。
3.如权利要求1所述的在线音乐盗版监控方法,其特征在于:步骤①所述从互联网上获取音频下载地址是选择音乐网站首页地址进行递归抓取,遇到后缀为音频文件格式的统一资源定位符URL,便标注为音频下载地址。
4.如权利要求1所述的在线音乐盗版监控方法,其特征在于:步骤②中所述读取音频文件不少于90秒的播放时间长度。
5.如权利要求1所述的在线音乐盗版监控方法,其特征在于:在步骤②之后步骤③之前,对所述音频指纹进行索引,并将该音频指纹加入相关音频指纹数据库。
6.如权利要求1所述的在线音乐盗版监控方法,其特征在于:步骤④中,经判断音频文件涉嫌侵权,向涉嫌侵权者发出警告之前,将所述音频指纹和其文本信息进行关联,进一步验证相关信息的准确性。
7.如权利要求1所述的在线音乐盗版监控方法,其特征在于:所述相关信息包括歌曲名称、歌手姓名和/或专辑名称。
8.一种在线音乐盗版监控系统,其特征在于:包括
网络蜘蛛模块,用于获取互联网上的音频下载地址信息;
音频指纹提取模块,用于读取互联网上链接的音频文件和正版音频文件并处理得到音频指纹;
监控分析模块,用于将从互联网上链接的音频文件的音频指纹与正版音频文件的音频指纹比对,判断是否超过设定阈值;
侵权定位模块,用于获取涉嫌侵权者的信息,向该涉嫌侵权者发出警告。
9.如权利要求8所述的在线音乐盗版监控系统,其特征在于:还包括音频指纹索引模块,用于对音频指纹信息进行压缩和索引,以实现对音频指纹的快速匹配。
10.如权利要求8所述的在线音乐盗版监控系统,其特征在于:还包括信息关联模块,用于将所述音频指纹信息和其他文本信息进行关联,进一步验证相关信息的准确性。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNA200810216970XA CN101493918A (zh) | 2008-10-21 | 2008-10-21 | 在线音乐盗版监控方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNA200810216970XA CN101493918A (zh) | 2008-10-21 | 2008-10-21 | 在线音乐盗版监控方法和系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101493918A true CN101493918A (zh) | 2009-07-29 |
Family
ID=40924506
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA200810216970XA Pending CN101493918A (zh) | 2008-10-21 | 2008-10-21 | 在线音乐盗版监控方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101493918A (zh) |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102236685A (zh) * | 2010-05-07 | 2011-11-09 | 盛乐信息技术(上海)有限公司 | 一种基于音频指纹技术的本地音乐信息重获方法 |
CN102314562A (zh) * | 2010-07-01 | 2012-01-11 | 盛乐信息技术(上海)有限公司 | 音视频分享网站的视频版权检测系统及方法 |
CN103314389A (zh) * | 2010-11-12 | 2013-09-18 | 谷歌公司 | 使用旋律标识的媒体权利管理 |
CN103562913A (zh) * | 2011-03-17 | 2014-02-05 | 远程媒体有限责任公司 | 用于媒体文件同步的系统及方法 |
CN104143055A (zh) * | 2014-08-16 | 2014-11-12 | 合一网络技术(北京)有限公司 | 盗版视频监控方法与系统 |
CN104252480A (zh) * | 2013-06-27 | 2014-12-31 | 深圳市腾讯计算机系统有限公司 | 一种音频信息检索的方法和装置 |
US9129094B2 (en) | 2010-11-12 | 2015-09-08 | Google Inc. | Syndication including melody recognition and opt out |
CN105142018A (zh) * | 2015-08-12 | 2015-12-09 | 深圳Tcl数字技术有限公司 | 基于音频指纹的节目识别方法及装置 |
CN105185401A (zh) * | 2015-08-28 | 2015-12-23 | 广州酷狗计算机科技有限公司 | 同步多媒体文件列表的方法及装置 |
CN105631247A (zh) * | 2014-10-31 | 2016-06-01 | 腾讯科技(深圳)有限公司 | 一种多媒体版权管理方法及装置 |
CN106910494A (zh) * | 2016-06-28 | 2017-06-30 | 阿里巴巴集团控股有限公司 | 一种音频识别方法和装置 |
CN107547908A (zh) * | 2016-06-28 | 2018-01-05 | 真相网络科技(北京)有限公司 | 一种智能互联网音视频自动录制取证方法及系统 |
CN108702572A (zh) * | 2016-05-25 | 2018-10-23 | 谷歌有限责任公司 | 控制音频输出的方法、系统和介质 |
CN109829265A (zh) * | 2019-01-30 | 2019-05-31 | 杭州拾贝知识产权服务有限公司 | 一种音频作品的侵权取证方法和系统 |
CN110503961A (zh) * | 2019-09-03 | 2019-11-26 | 北京字节跳动网络技术有限公司 | 音频识别方法、装置、存储介质及电子设备 |
CN110728592A (zh) * | 2018-07-17 | 2020-01-24 | 阿里巴巴集团控股有限公司 | 一种版权监控方法、版权查询方法、系统和设备 |
CN111859088A (zh) * | 2020-07-23 | 2020-10-30 | 闵雯 | 一种基于大数据的用户权限管理系统及方法 |
CN112420023A (zh) * | 2020-11-26 | 2021-02-26 | 杭州音度人工智能有限公司 | 一种音乐侵权检测方法 |
-
2008
- 2008-10-21 CN CNA200810216970XA patent/CN101493918A/zh active Pending
Cited By (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102236685A (zh) * | 2010-05-07 | 2011-11-09 | 盛乐信息技术(上海)有限公司 | 一种基于音频指纹技术的本地音乐信息重获方法 |
CN102314562A (zh) * | 2010-07-01 | 2012-01-11 | 盛乐信息技术(上海)有限公司 | 音视频分享网站的视频版权检测系统及方法 |
US9129094B2 (en) | 2010-11-12 | 2015-09-08 | Google Inc. | Syndication including melody recognition and opt out |
CN103314389A (zh) * | 2010-11-12 | 2013-09-18 | 谷歌公司 | 使用旋律标识的媒体权利管理 |
US9396312B2 (en) | 2010-11-12 | 2016-07-19 | Google Inc. | Syndication including melody recognition and opt out |
CN103562913A (zh) * | 2011-03-17 | 2014-02-05 | 远程媒体有限责任公司 | 用于媒体文件同步的系统及方法 |
CN104252480A (zh) * | 2013-06-27 | 2014-12-31 | 深圳市腾讯计算机系统有限公司 | 一种音频信息检索的方法和装置 |
CN104252480B (zh) * | 2013-06-27 | 2018-09-07 | 深圳市腾讯计算机系统有限公司 | 一种音频信息检索的方法和装置 |
CN104143055A (zh) * | 2014-08-16 | 2014-11-12 | 合一网络技术(北京)有限公司 | 盗版视频监控方法与系统 |
CN105631247A (zh) * | 2014-10-31 | 2016-06-01 | 腾讯科技(深圳)有限公司 | 一种多媒体版权管理方法及装置 |
CN105142018A (zh) * | 2015-08-12 | 2015-12-09 | 深圳Tcl数字技术有限公司 | 基于音频指纹的节目识别方法及装置 |
CN105185401A (zh) * | 2015-08-28 | 2015-12-23 | 广州酷狗计算机科技有限公司 | 同步多媒体文件列表的方法及装置 |
CN105185401B (zh) * | 2015-08-28 | 2019-01-01 | 广州酷狗计算机科技有限公司 | 同步多媒体文件列表的方法及装置 |
CN108702572A (zh) * | 2016-05-25 | 2018-10-23 | 谷歌有限责任公司 | 控制音频输出的方法、系统和介质 |
US11294620B2 (en) | 2016-05-25 | 2022-04-05 | Google Llc | Methods, systems, and media for controlling audio output |
US10776074B2 (en) | 2016-05-25 | 2020-09-15 | Google Llc | Methods, systems, and media for controlling audio output |
CN108702572B (zh) * | 2016-05-25 | 2021-04-06 | 谷歌有限责任公司 | 控制音频输出的方法、系统和介质 |
CN106910494A (zh) * | 2016-06-28 | 2017-06-30 | 阿里巴巴集团控股有限公司 | 一种音频识别方法和装置 |
CN107547908A (zh) * | 2016-06-28 | 2018-01-05 | 真相网络科技(北京)有限公司 | 一种智能互联网音视频自动录制取证方法及系统 |
CN106910494B (zh) * | 2016-06-28 | 2020-11-13 | 创新先进技术有限公司 | 一种音频识别方法和装置 |
US10910000B2 (en) | 2016-06-28 | 2021-02-02 | Advanced New Technologies Co., Ltd. | Method and device for audio recognition using a voting matrix |
US11133022B2 (en) | 2016-06-28 | 2021-09-28 | Advanced New Technologies Co., Ltd. | Method and device for audio recognition using sample audio and a voting matrix |
CN110728592A (zh) * | 2018-07-17 | 2020-01-24 | 阿里巴巴集团控股有限公司 | 一种版权监控方法、版权查询方法、系统和设备 |
CN109829265A (zh) * | 2019-01-30 | 2019-05-31 | 杭州拾贝知识产权服务有限公司 | 一种音频作品的侵权取证方法和系统 |
CN110503961A (zh) * | 2019-09-03 | 2019-11-26 | 北京字节跳动网络技术有限公司 | 音频识别方法、装置、存储介质及电子设备 |
CN110503961B (zh) * | 2019-09-03 | 2023-03-14 | 北京字节跳动网络技术有限公司 | 音频识别方法、装置、存储介质及电子设备 |
CN111859088A (zh) * | 2020-07-23 | 2020-10-30 | 闵雯 | 一种基于大数据的用户权限管理系统及方法 |
CN112420023B (zh) * | 2020-11-26 | 2022-03-25 | 杭州音度人工智能有限公司 | 一种音乐侵权检测方法 |
CN112420023A (zh) * | 2020-11-26 | 2021-02-26 | 杭州音度人工智能有限公司 | 一种音乐侵权检测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101493918A (zh) | 在线音乐盗版监控方法和系统 | |
CN102867515B (zh) | 通过数字水印对数字音频版权进行认证的方法 | |
EP1474760B1 (en) | Fast hash-based multimedia object metadata retrieval | |
US9424402B2 (en) | Blocking of unlicensed audio content in video files on a video hosting website | |
CN101304414B (zh) | 用于处理信息的系统、装置、方法和程序 | |
US8117463B2 (en) | Information device, information server, information processing system, information processing program method, and information processing program | |
AU2008314573B2 (en) | Methods and apparatus to create a media measurement reference database from a plurality of distributed sources | |
US20030061490A1 (en) | Method for identifying copyright infringement violations by fingerprint detection | |
US20050246543A1 (en) | System and method of content copy control | |
US20100287201A1 (en) | Method and a system for identifying elementary content portions from an edited content | |
CN107633078A (zh) | 音频指纹提取方法、音视频检测方法、装置及终端 | |
CN104050217A (zh) | 媒体内容替换方法和系统 | |
JP2005534051A (ja) | 信号エンコーダのタイプ決定 | |
US20180322901A1 (en) | Copyright checking for uploaded media | |
KR100834978B1 (ko) | 자막 정보를 제공하는 방법 및 그 시스템 | |
US8787613B2 (en) | Forensic mark insertion apparatus and method | |
JP2003316914A (ja) | コンテンツ探索情報管理システムと方法およびコンテンツ探索システムと方法ならびにプログラム | |
JP4483049B2 (ja) | マルチメディアコンテンツの登録システム | |
JP4990823B2 (ja) | 違法コンテンツ判定支援システムおよび違法コンテンツ判定支援システムの制御プログラム | |
RU81614U1 (ru) | Устройство системы учета выхода в эфир рекламных сообщений | |
JP7254376B2 (ja) | アーティストアイディー統合管理のためのサーバー、システム、その方法 | |
Steinebach et al. | Forensic audio watermark detection | |
KR100725920B1 (ko) | 비디오 pat 소프트웨어 평가/인증 시스템 및 그 방법 | |
Selvakumar et al. | Content recognition using audio finger printing | |
CN116208336A (zh) | 一种nft文件实现去中心化存储证明的方法及服务器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20090729 |