CN106162321A - 一种声纹特征和音频水印相结合的音频信号识别方法 - Google Patents
一种声纹特征和音频水印相结合的音频信号识别方法 Download PDFInfo
- Publication number
- CN106162321A CN106162321A CN201610788886.XA CN201610788886A CN106162321A CN 106162321 A CN106162321 A CN 106162321A CN 201610788886 A CN201610788886 A CN 201610788886A CN 106162321 A CN106162321 A CN 106162321A
- Authority
- CN
- China
- Prior art keywords
- audio
- vocal print
- print feature
- frequency
- digital watermarking
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000001755 vocal effect Effects 0.000 title claims abstract description 86
- 238000000034 method Methods 0.000 title claims abstract description 39
- 230000005236 sound signal Effects 0.000 title claims abstract description 34
- 238000000605 extraction Methods 0.000 claims abstract description 24
- 238000001228 spectrum Methods 0.000 claims abstract description 18
- 239000000284 extract Substances 0.000 claims description 11
- 238000012952 Resampling Methods 0.000 claims description 10
- 238000010835 comparative analysis Methods 0.000 claims description 5
- 230000008859 change Effects 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 208000031481 Pathologic Constriction Diseases 0.000 description 1
- 241000638935 Senecio crassissimus Species 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 238000005498 polishing Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 210000001215 vagina Anatomy 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/439—Processing of audio elementary streams
- H04N21/4394—Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/018—Audio watermarking, i.e. embedding inaudible data in the audio signal
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/54—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for retrieval
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/83—Generation or processing of protective or descriptive data associated with content; Content structuring
- H04N21/835—Generation of protective data, e.g. certificates
- H04N21/8358—Generation of protective data, e.g. certificates involving watermark
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computer Security & Cryptography (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Editing Of Facsimile Originals (AREA)
Abstract
本发明公开了一种声纹特征和音频水印相结合的音频信号识别方法,解决了现有技术中音频识别不精确、使用范围窄,以及音视频内容的数字水印版权保护等问题。该声纹特征和音频水印相结合的音频信号识别方法包括:(1)样本来源;(2)对所述步骤(1)中的文件提取音频进行预处理,获得对应的频谱数据;(3)声纹特征提取;(4)声纹特征识别;根据需要还可包括数字水印生成和添加。本发明申请以声纹特征和音频数字水印相结合,在广播电视台实际环境经测试,无论广播、直播、录播以及会场均能对声音进行较好的识别。
Description
技术领域
本发明属于音频信号识别技术领域,具体的说,是涉及一种声纹特征和音频水印相结合的音频信号识别方法及音视频内容的数字水印版权保护方法。
背景技术
现有技术中,有通过电视声音识别电视节目,如微信的摇电视,其技术实现主要倚靠声纹特征来对电视直播进行识别,该技术方案存在以下缺陷:在音量较小情况下无法准确识别。也有另一种技术方案,通过高频水印技术将包含数字水印的高频音频信号嵌入音频信号的包络中,实现隐藏高频信号的噪声干扰,通过校验技术将水印提取以验证音频是否被识别,如视淘,该技术方案存在以下缺陷:对硬件设备要求较高,适用于录播、点播视频等,对于直播信号无法有效处理。并且随着IPTV、OTT、网络直播、手机直播等应用的普及,存在大量的盗播、盗版行为,很难有效的追溯和进行版权保护。
发明内容
为了改善上述问题,本发明的目的在于提供一种以声纹特征和音频水印相结合,面向电视、广播等多媒体的音频信号识别方法。
为了实现上述目的,本发明采用的技术方案如下:
一种声纹特征和音频水印相结合的音频信号识别方法,包括以下步骤:
(1)样本来源:实时收录音视频直播流和保存点播视频文件或音频文件;或指定的需匹配的视频或音频文件;
(2)对所述步骤(1)中的文件提取音频进行预处理,获得对应的频谱数据;
(3)声纹特征提取:根据频谱数据进行声纹特征提取,所提取的声纹特征存入服务器端内存数据库,该声纹特征对应为该音视频文件或者直播频道;
(4)声纹特征识别,包括以下三种方式:
(a)音频声纹特征识别:客户端获取音频声纹特征数据,并将该音频特征数据通过声纹特征提取方法生成待识别的声纹特征,将待识别的声纹特征与服务器端内存数据库所存的声纹特征进行比对,通过对比得到识别结果;
(b)音频数字水印提取识别:客户端提取出音视频资源中的数字水印,通过数字水印识别出音视频文件或者直播频道;
(c)音频声纹特征识别与音频数字水印提取识别相结合。
进一步的,在所述步骤(1)之前还包括数字水印生成和添加:通过数字水印算法生成数字水印,并将生成的数字水印混入对应的音视频资源中并上传至播控系统,该数字水印对应将要使用的音视频文件或者直播频道。通过该步骤,可实现音视频内容的数字水印版权的保护。
进一步的,所述数字水印生成和添加如下:通过数字水印算法在18000–20000之间生成一个随机高频信号;数字水印的添加如下:将包含数字水印的高频信号通过音轨添加的方式在播控设备上植入到将要使用的音视频文件中。
进一步的,所述步骤(1)的具体方式如下:直播,远端编转码器将直播音频信号推送,通过部署在服务器上的收录程序对指定的直播音频流进行实时接收;点播,将点播的音视频文件上传至FTP服务器。
进一步的,所述步骤(2)中的预处理方式如下:直播,首先,将音频信号进行数字化处理,进行指定频率的数字采样,使音频信号转换为二进制数串;然后,将二进制数串进行短时傅立叶变换,获取到信号的频谱数据;
点播,获取点播的音视频文件的音频信号,将该音频信号转化为二进制数串;然后,将二进制数串进行短时傅立叶变换,获取到信号的频谱数据。
进一步的,所述步骤(4)中声纹特征提取如下:通过不同的音阶将所需的频率对应的坐标上的频谱数据提取出来,将提取的频谱数据进行极大值计算,获取到极大值对应的坐标,以极大值对应的坐标为依据,将指定范围内频率和时间进行hash计算生成30位特征值并存入内存数据库,该声纹特征对应为该音视频文件或者直播频道。
进一步的,所述(a)中音频声纹特征识别如下:客户端通过录音设备获取到音频数据上传至识别服务器,识别服务器将该音频数据进行重采样,重采样后的音频数据数字化处理后,通过声纹特征提取方法,将生成的声纹特征与数据库内所存的声纹特征进行比对,根据比对结果确定识别结果。
进一步的,所述(b)中数字水印的提取和识别如下:客户端通过录音设备将录音音频上传至识别服务器,通过提取算法将录音音频的高频信号提取出来,通过高频信号提取数字水印识别出音视频文件或者直播频道。
进一步的,所述(c)的具体实现方式如下:
音频声纹特征识别:客户端通过录音设备获取到音频数据上传至识别服务器,识别服务器将该音频数据进行重采样,重采样后的音频数据数字化处理后,通过声纹特征提取方法,将生成的声纹特征与数据库内所存的声纹特征进行比对,根据比对结果确定识别结果;
数字水印的提取和识别:客户端通过录音设备将录音音频上传至识别服务器,通过提取算法将录音音频的高频信号提取出来,通过高频信号提取数字水印识别出音视频文件或者直播频道;
将音频声纹特征识别和数字水印的提取和识别的识别结果进行综合比较分析,根据综合比较分析的结果确定识别结果,综合比较分析的方式可以设定不同的权值进行比较分析,其分析方式可以采用现有的分析方式。将两种方式识别的结果进行比较分析,一方面可以提高声纹识别准确率,一方面可以进行音视频内容的数字水印版权保护。
本发明与现有技术相比,具有以下优点及有益效果:
本发明将声纹特征和音频水印相结合应用于音频信号的识别方法中,与现有技术相比,本发明对声音识别的场景应用广泛,识别效率高,根据应用场景可以配置选择识别方法;另一方面,采用本发明能够提高传统电视的受众数量和时间,通过互动性与新媒体、互联网进行连通,以多种方式的互动增加传统媒体观众的粘度,提高对用户观看电视行为的统计和广告投放的精准度。此外,本发明将数字水印应用于音视频内容中,一方面可以结合声纹特征识别,提高声纹识别准确率,另一方面,可以实现对音视频内容的数字水印版权保护。
附图说明
图1为本发明的流程示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步说明,本发明的实施方式包括但不限于下列实施例。
实施例
如图1所示,本实施例提供了一种声纹特征和音频水印相结合的音频信号识别方法,与现有技术不同的是,本方法将声纹特征和音频水印相结合,实现实时音频精确识别,本方法结合数字信号处理、计算机多媒体等技术来实现,主要应用于电视直播、视频播放、广播、音乐等含有音频载体的领域。
本方法的实现原理如下:通过收录服务器实时收录直播流和保存点播视频文件,经过对视频的音频预处理,获取到所需数字音频信号,可通过声纹特征提取算法提取声纹特征和数字水印算法生成数字水印,1.所提取的声纹特征可存储在内存数据库中以提高识别结果比对的实时响应;2.将生成的数字水印混入指定的音视频资源中并上传至播控系统。
具体的说,本方法主要包括:
一、实时收录直播流和保存点播视频文件
对于直播场景:远端编转码器将直播音频信号推送,通过部署在服务器上的收录程序对指定的直播音频流进行实时接收;对于点播场景:将音视频文件上传至FTP服务器。
二、对视频的音频进行预处理,获得对应的频谱数据
对于直播场景:在收录直播音频的同时,异步对该流数据进行数字化处理,进行44100/48000等指定频率的数字采样,使音频信号转换为二进制数串;对于点播场景:通过软件获取其音频信号,以该信号采样为准将其转为数字信号--即一连串的二进制数串;
在获得二进制数串后,将该数串进行数字信号处理。主要是将该数字信号进行短时傅立叶变换,为保证在所需的帧内能够清晰的分辨处频域特征,其中需要确定所需的短时帧长度,窗函数的选取可选择汉明窗或者汉宁窗,窗口大小及平滑度的选取,采样频率可选择对应信号的采样率。由短时傅立叶变换获取到信号的频谱数据。
三、声纹特征提取
根据频谱数据进行声纹特征提取,所提取的声纹特征存入内存数据库,该声纹特征对应为该音视频文件或者直播频道;具体的,通过不同的音阶将所需的频率对应的坐标上的频谱数据提取出来,将提取的频谱数据进行极大值计算,获取到极大值对应的坐标,以极大值对应的坐标为依据,将指定范围内频率和时间进行hash计算生成30位特征值并存入内存数据库,该声纹特征对应为该音视频文件或者直播频道。
四、声纹特征识别
客户端获取音频数据,并将该音频数据通过声纹特征提取方法生成待识别的声纹特征,将待识别的声纹特征与内存数据库所存的声纹特征进行比对,通过对比得到识别结果。具体的说,客户端通过录音设备获取到音频数据上传至识别服务器,识别服务器将该音频数据进行重采样,重采样后的音频数据数字化处理后,通过声纹特征提取方法,将生成的声纹特征与数据库内所存的声纹特征进行比对。
本实施例在进一步的优选方案中,比对中使用了数据库桶技术,减少了匹配的时间复杂度,增大了碰撞机率,快速匹配后将会获取到相应的识别结果。
五、数字水印生成和添加
通过数字水印算法生成数字水印,并将生成的数字水印混入对应的音视频资源中并上传至播控系统,该数字水印对应将要使用的音视频文件或者直播频道;具体的说,数字水印生成如下:通过数字水印算法在18000–20000之间生成一个随机高频信号;数字水印的添加如下:将包含数字水印的高频信号通过音轨添加的方式在播控设备上植入到将要使用的音视频文件中。
六、数字水印提取和识别
客户端通过录音设备将录音音频上传至识别服务器,识别程序根据提取算法将录音音频的高频信号提取出来,通过比对提取出来的数字水印可获得对应的所识别出的音视频节目或频道,返回结果。
本发明申请以声纹特征和音频数字水印相结合,在电视台实际环境经测试,无论广播、直播、录播以及会场均能对声音进行较好的识别。
本发明申请中所涉及到的算法、比对分析方法均为现有技术,本领域技术人员可以根据实际的需求,选择匹配的技术手段。
按照上述实施例,便可很好地实现本发明。值得说明的是,基于上述结构或方法设计的前提下,为解决同样的技术问题,即使在本发明上做出的一些无实质性的改动或润色,所采用的技术方案的实质仍然与本发明一样,故其也应当在本发明的保护范围内。
Claims (9)
1.一种声纹特征和音频水印相结合的音频信号识别方法,其特征在于,包括以下步骤:
(1)样本来源:实时收录音视频直播流和保存点播视频文件或音频文件;或指定的需匹配的视频或音频文件;
(2)对所述步骤(1)中的文件提取音频进行预处理,获得对应的频谱数据;
(3)声纹特征提取:根据频谱数据进行声纹特征提取,所提取的声纹特征存入服务器端内存数据库,该声纹特征对应为该音视频文件或者直播频道;
(4)声纹特征识别,包括以下三种方式:
(a)音频声纹特征识别:客户端获取音频声纹特征数据,并将该音频特征数据通过声纹特征提取方法生成待识别的声纹特征,将待识别的声纹特征与服务器端内存数据库所存的声纹特征进行比对,通过对比得到识别结果;
(b)音频数字水印提取识别:客户端提取出音视频资源中的数字水印,通过数字水印识别出音视频文件或者直播频道;
(c)音频声纹特征识别与音频数字水印提取识别相结合。
2.根据权利要求1所述的声纹特征和音频水印相结合的音频信号识别方法,其特征在于,在所述步骤(1)之前还包括数字水印生成和添加:通过数字水印算法生成数字水印,并将生成的数字水印混入对应的音视频资源中并上传至播控系统,该数字水印对应将要使用的音视频文件或者直播频道。
3.根据权利要求2所述的声纹特征和音频水印相结合的音频信号识别方法,其特征在于,所述数字水印生成和添加的具体实现如下:通过数字水印算法在18000–20000之间生成一个随机高频信号;数字水印的添加如下:将包含数字水印的高频信号通过音轨添加的方式在播控设备上植入到将要使用的音视频文件中。
4.根据权利要求1所述的声纹特征和音频水印相结合的音频信号识别方法,其特征在于,所述步骤(1)的具体方式如下:直播,远端编转码器将直播音频信号推送,通过部署在服务器上的收录程序对指定的直播音频流进行实时接收;点播,将点播的音视频文件上传至FTP服务器。
5.根据权利要求1所述的声纹特征和音频水印相结合的音频信号识别方法,其特征在于,所述步骤(2)中的预处理方式如下:直播,首先,将音频信号进行数字化处理,进行指定频率的数字采样,使音频信号转换为二进制数串;然后,将二进制数串进行短时傅立叶变换,获取到信号的频谱数据;
点播,获取点播的音视频文件的音频信号,将该音频信号转化为二进制数串;然后,将二进制数串进行短时傅立叶变换,获取到信号的频谱数据。
6.根据权利要求1所述的声纹特征和音频水印相结合的音频信号识别方法,其特征在于,所述步骤(4)中声纹特征提取如下:通过不同的音阶将所需的频率对应的坐标上的频谱数据提取出来,将提取的频谱数据进行极大值计算,获取到极大值对应的坐标,以极大值对应的坐标为依据,将指定范围内频率和时间进行hash计算生成30位特征值并存入内存数据库,该声纹特征对应为该音视频文件或者直播频道。
7.根据权利要求1所述的声纹特征和音频水印相结合的音频信号识别方法,其特征在于,所述(a)中音频声纹特征识别如下:客户端通过录音设备获取到音频数据上传至识别服务器,识别服务器将该音频数据进行重采样,重采样后的音频数据数字化处理后,通过声纹特征提取方法,将生成的声纹特征与数据库内所存的声纹特征进行比对,根据比对结果确定识别结果。
8.根据权利要求1所述的声纹特征和音频水印相结合的音频信号识别方法,其特征在于,所述(b)中数字水印的提取和识别如下:客户端通过录音设备将录音音频上传至识别服务器,通过提取算法将录音音频的高频信号提取出来,通过高频信号提取数字水印识别出音视频文件或者直播频道。
9.根据权利要求1所述的声纹特征和音频水印相结合的音频信号识别方法,其特征在于,所述(c)的具体实现方式如下:
音频声纹特征识别:客户端通过录音设备获取到音频数据上传至识别服务器,识别服务器将该音频数据进行重采样,重采样后的音频数据数字化处理后,通过声纹特征提取方法,将生成的声纹特征与数据库内所存的声纹特征进行比对,根据比对结果确定识别结果;
数字水印的提取和识别:客户端通过录音设备将录音音频上传至识别服务器,通过提取算法将录音音频的高频信号提取出来,通过高频信号提取数字水印识别出音视频文件或者直播频道;
将音频声纹特征识别和数字水印的提取和识别的识别结果进行综合比较分析,根据综合比较分析的结果确定识别结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610788886.XA CN106162321A (zh) | 2016-08-31 | 2016-08-31 | 一种声纹特征和音频水印相结合的音频信号识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610788886.XA CN106162321A (zh) | 2016-08-31 | 2016-08-31 | 一种声纹特征和音频水印相结合的音频信号识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106162321A true CN106162321A (zh) | 2016-11-23 |
Family
ID=57345475
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610788886.XA Pending CN106162321A (zh) | 2016-08-31 | 2016-08-31 | 一种声纹特征和音频水印相结合的音频信号识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106162321A (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108171151A (zh) * | 2017-12-26 | 2018-06-15 | 上海亿动信息技术有限公司 | 一种对视频广告进行识别统计的控制方法及装置 |
CN108268572A (zh) * | 2017-01-04 | 2018-07-10 | 北京酷我科技有限公司 | 一种歌曲同步方法及系统 |
CN108447501A (zh) * | 2018-03-27 | 2018-08-24 | 中南大学 | 一种云存储环境下基于音频字的盗版视频检测方法与系统 |
CN108882016A (zh) * | 2018-07-31 | 2018-11-23 | 成都华栖云科技有限公司 | 一种视频基因数据提取的方法及系统 |
CN110446060A (zh) * | 2018-05-03 | 2019-11-12 | 尼尔森网联媒介数据服务有限公司 | 电视的媒体信息识别方法、交互方法及设备 |
CN111294467A (zh) * | 2018-12-06 | 2020-06-16 | 马上消费金融股份有限公司 | 一种呼叫处理方法及相关装置 |
TWI713916B (zh) * | 2018-10-24 | 2020-12-21 | 淇譽電子科技股份有限公司 | 即時辨識廣告的互動方法及其互動系統 |
CN112820297A (zh) * | 2020-12-30 | 2021-05-18 | 平安普惠企业管理有限公司 | 声纹识别方法、装置、计算机设备及存储介质 |
CN113316004A (zh) * | 2020-08-14 | 2021-08-27 | 南京百家云科技有限公司 | 一种保护流媒体版权的方法及装置 |
CN113763963A (zh) * | 2021-08-24 | 2021-12-07 | 南京龙垣信息科技有限公司 | 电话卡冒用检测方法、系统、计算机设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110174137A1 (en) * | 2010-01-15 | 2011-07-21 | Yamaha Corporation | Tone reproduction apparatus and method |
CN103440330A (zh) * | 2013-09-03 | 2013-12-11 | 网易(杭州)网络有限公司 | 一种音乐节目信息获取方法和设备 |
CN103440313A (zh) * | 2013-08-27 | 2013-12-11 | 复旦大学 | 基于音频指纹特征的音乐检索系统 |
CN103747277A (zh) * | 2014-01-10 | 2014-04-23 | 北京酷云互动科技有限公司 | 一种多媒体节目识别方法和装置 |
CN104299617A (zh) * | 2014-11-10 | 2015-01-21 | 江苏梦之音科技有限公司 | 一种在音频中嵌入与检测数字信息的方法 |
-
2016
- 2016-08-31 CN CN201610788886.XA patent/CN106162321A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110174137A1 (en) * | 2010-01-15 | 2011-07-21 | Yamaha Corporation | Tone reproduction apparatus and method |
CN103440313A (zh) * | 2013-08-27 | 2013-12-11 | 复旦大学 | 基于音频指纹特征的音乐检索系统 |
CN103440330A (zh) * | 2013-09-03 | 2013-12-11 | 网易(杭州)网络有限公司 | 一种音乐节目信息获取方法和设备 |
CN103747277A (zh) * | 2014-01-10 | 2014-04-23 | 北京酷云互动科技有限公司 | 一种多媒体节目识别方法和装置 |
CN104299617A (zh) * | 2014-11-10 | 2015-01-21 | 江苏梦之音科技有限公司 | 一种在音频中嵌入与检测数字信息的方法 |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108268572A (zh) * | 2017-01-04 | 2018-07-10 | 北京酷我科技有限公司 | 一种歌曲同步方法及系统 |
CN108171151A (zh) * | 2017-12-26 | 2018-06-15 | 上海亿动信息技术有限公司 | 一种对视频广告进行识别统计的控制方法及装置 |
CN108447501A (zh) * | 2018-03-27 | 2018-08-24 | 中南大学 | 一种云存储环境下基于音频字的盗版视频检测方法与系统 |
CN108447501B (zh) * | 2018-03-27 | 2020-08-18 | 中南大学 | 一种云存储环境下基于音频字的盗版视频检测方法与系统 |
CN110446060A (zh) * | 2018-05-03 | 2019-11-12 | 尼尔森网联媒介数据服务有限公司 | 电视的媒体信息识别方法、交互方法及设备 |
CN108882016A (zh) * | 2018-07-31 | 2018-11-23 | 成都华栖云科技有限公司 | 一种视频基因数据提取的方法及系统 |
TWI713916B (zh) * | 2018-10-24 | 2020-12-21 | 淇譽電子科技股份有限公司 | 即時辨識廣告的互動方法及其互動系統 |
CN111294467A (zh) * | 2018-12-06 | 2020-06-16 | 马上消费金融股份有限公司 | 一种呼叫处理方法及相关装置 |
CN113316004A (zh) * | 2020-08-14 | 2021-08-27 | 南京百家云科技有限公司 | 一种保护流媒体版权的方法及装置 |
CN113316004B (zh) * | 2020-08-14 | 2022-05-17 | 南京百家云科技有限公司 | 一种保护流媒体版权的方法及装置 |
CN112820297A (zh) * | 2020-12-30 | 2021-05-18 | 平安普惠企业管理有限公司 | 声纹识别方法、装置、计算机设备及存储介质 |
CN113763963A (zh) * | 2021-08-24 | 2021-12-07 | 南京龙垣信息科技有限公司 | 电话卡冒用检测方法、系统、计算机设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106162321A (zh) | 一种声纹特征和音频水印相结合的音频信号识别方法 | |
US11412286B2 (en) | Methods and apparatus to verify and/or correct media lineup information | |
US11272226B2 (en) | System and method for continuous media segment identification | |
CA2875289C (en) | Methods and apparatus for identifying media | |
Wang | An industrial strength audio search algorithm. | |
US20160073148A1 (en) | Media customization based on environmental sensing | |
JP2008504741A (ja) | 2つのメディア・セグメントの重なりを特徴付ける方法 | |
WO2012170451A1 (en) | Methods and systems for performing comparisons of received data and providing a follow-on service based on the comparisons | |
TW201347522A (zh) | 旨在描繪於第一終端機上的第一多媒體串流和旨在描繪於第二終端機上的第二多媒體串流之同步化方法和系統及裝置 | |
US20190306577A1 (en) | Signal processing method for determining audience rating of media, and additional information inserting apparatus, media reproducing apparatus and audience rating determining apparatus for performing the same method | |
CN103594083A (zh) | 通过电视伴音自动识别电视节目的技术 | |
CN112913251A (zh) | 利用水印和签名的媒体识别 | |
US11854556B2 (en) | Methods and apparatus for supplementing partially readable and/or inaccurate codes in media | |
Plapous et al. | A low-complexity audio fingerprinting technique for embedded applications | |
Kim et al. | Robust audio fingerprinting method using prominent peak pair based on modulated complex lapped transform | |
CN104202628B (zh) | 客户端播放节目的识别系统和方法 | |
CN105554590B (zh) | 一种基于音频指纹的直播流媒体识别系统 | |
RU2704484C1 (ru) | Способ определения предпочтений медиапользователей | |
Lee et al. | Audio fingerprinting to identify TV commercial advertisement in real-noisy environment | |
Stojancic et al. | Interoperable AV SYNC Systems in SMPTE 22TV LIP SYNC AHG (Content-Fingerprinting Based Audio-Video Synchronization) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20161123 |
|
RJ01 | Rejection of invention patent application after publication |