CN107516529B - 一种移动端音频快速识别方法 - Google Patents
一种移动端音频快速识别方法 Download PDFInfo
- Publication number
- CN107516529B CN107516529B CN201710683924.XA CN201710683924A CN107516529B CN 107516529 B CN107516529 B CN 107516529B CN 201710683924 A CN201710683924 A CN 201710683924A CN 107516529 B CN107516529 B CN 107516529B
- Authority
- CN
- China
- Prior art keywords
- watermark
- audio
- files
- file
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 18
- 238000007792 addition Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/018—Audio watermarking, i.e. embedding inaudible data in the audio signal
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Editing Of Facsimile Originals (AREA)
Abstract
Description
技术领域
本发明涉及数字信号处理技术领域,尤其是涉及一种具有较高识别效率的移动端音频快速识别方法。
背景技术
在通常的音频水印识别系统中,一般是采用嵌入唯一水印到音频文件中,识别端逐个比对水印库,如此计算量非常大,无法做到实时性,对系统运算能力要求很高,需要在服务器端完成,无法在移动端(手机)上完成识别工作。
例如需要10000个样本,则需要10000个水印文件来表示,需要的对比次数平均为如果每次对比耗时为t,则识别时的平均耗时为5000t,在处理能力较弱的移动端(手机或PAD等设备)上实用性和实时性都会极差,无法被广泛应用。
发明内容
本发明主要是解决现有技术所存在的需要的水印文件量大、识别耗时长的技术问题,提供一种只需要少量水印文件就可以提供足够大的样本量、识别快速、实时性强的移动端音频快速识别方法。
本发明针对上述技术问题主要是通过下述技术方案得以解决的:一种移动端音频快速识别方法,包括以下步骤:
S002、选择一个样本,将样本中的水印文件嵌入到音频中;
S003、对嵌有水印文件的音频进行对比识别。
作为优选,所述步骤S002中,识别单个水印文件需要的音频时长为T,识别整个样本需要的时长为K×T,将整个音频按照K×T的时长划分为若干段,每段按时长T划分后依次标记为T1、T2、T3…TK,将所选择的样本中的K个水印文件依次嵌入到T1、T2、T3…TK中,循环嵌入直至音频结束。
作为优选,步骤S003中,首先提取音频中的水印文件样本,然后对样本中的水印文件依次对比识别,识别过程如下:
S031、从样本中提取未识别的水印文件,与未被标记的组中的水印文件进行对比识别,识别成功后将此水印文件所在的组进行标记;
S032、重复步骤S031直至所有水印文件均已被识别;
初始时所有组均未被标记,结束后清除所有组的标记。
作为优选,所述K为4,样本数M为10000,N为40。
采用编组然后抽取文件的方式,可以用少量水印文件生成足够大的样本数,例如分组数为4,需要的样本数为10000,则可以倒推出N为40,相对于常规技术方案的10000个样本需要10000个水印文件,本方案极大减少了水印文件的数量,简化了编码。
每次对比需要的时间为t,在K为4时,识别完4T所需要的识别耗费时间为4个位置识别时间的和,我们在录音4T时长后,依据嵌入规则和概率论随机变量及其分布,第1个位置识别出来的平均时间最长,可能是4组中的任意一个水印,对比次数的算数平均数第2个水印识别时不需要与第一个水印所在组中的水印进行对比(即只需要在与其他三组中的文件进行对比),识别出来的平均时间稍长,对比次数的算数平均数第3个水印识别时不需要与第一个和第二个水印文件所在组中的水印文件进行对比,识别出来的平均时间稍短,对比次数的算数平均数最后1个水印只需要与最后一个组中的水印文件进行对比,识别出来的平均时间最短,对比次数的算数平均数10000个样本只需要40个水印表示,需要在4T时间内完成识别所要进行的对比次数的算数平均数 次,则平均识别时间为52×t。也就是说本方案在第二个水印及后续水印的识别过程中对照文件就不包含已识别的水印所在组的水印文件,越到后面所需要的对比次数越少,识别时间也越快,降低了整体识别耗时。相比于传统方案的10000个样本平均需要5000t的识别时间,本方案极大地提高了识别速度,并且保留了同样的区分度。
本发明带来的实质性效果是,只需要极少量的水印文件即可提供极大的样本量,识别时耗时少,速度快,对资源占用少,适用于手机等性能受限的移动端。
附图说明
图1是本发明的一种流程图。
具体实施方式
下面通过实施例,并结合附图,对本发明的技术方案作进一步具体的说明。
实施例:本实施例的一种移动端音频快速识别方法,如图1所示,包括以下步骤:
S002、选择一个样本,将样本中的水印文件嵌入到音频中:识别单个水印文件需要的音频时长为T,识别整个样本需要的时长为4×T,将整个音频按照K×T的时长划分为若干段,每段按时长T划分后依次标记为T1、T2、T3、T4,将所选择的样本中的4个水印文件依次嵌入到T1、T2、T3、T4中,循环嵌入直至音频结束;
S003、对嵌有水印文件的音频进行对比识别:首先提取音频中的水印文件样本,然后对样本中的水印文件依次对比识别,识别过程如下:
S031、从样本中提取未识别的水印文件,与未被标记的组中的水印文件进行对比识别,识别成功后将此水印文件所在的组进行标记;
S032、重复步骤S031直至所有水印文件均已被识别;
初始时所有组均未被标记,结束后清除所有组的标记。
采用编组然后抽取文件的方式,可以用少量水印文件生成足够大的样本数,例如分组数为4,需要的样本数为10000,则可以倒推出N为40,相对于常规技术方案的10000个样本需要10000个水印文件,本方案极大减少了水印文件的数量,简化了编码。
每次对比需要的时间为t,在K为4时,识别完4T所需要的识别耗费时间为4个位置识别时间的和,我们在录音4T时长后,依据嵌入规则和概率论随机变量及其分布,第1个位置识别出来的平均时间最长,可能是4组中的任意一个水印,对比次数的算数平均数第2个水印识别时不需要与第一个水印所在组中的水印进行对比(即只需要在与其他三组中的文件进行对比),识别出来的平均时间稍长,对比次数的算数平均数第3个水印识别时不需要与第一个和第二个水印文件所在组中的水印文件进行对比,识别出来的平均时间稍短,对比次数的算数平均数最后1个水印只需要与最后一个组中的水印文件进行对比,识别出来的平均时间最短,对比次数的算数平均数10000个样本只需要40个水印表示,需要在4T时间内完成识别所要进行的对比次数的算数平均数 次,则平均识别时间为52×t。也就是说本方案在第二个水印及后续水印的识别过程中对照文件就不包含已识别的水印所在组的水印文件,越到后面所需要的对比次数越少,识别时间也越快,降低了整体识别耗时。相比于传统方案的10000个样本平均需要5000t的识别时间,本方案极大地提高了识别速度,并且保留了同样的区分度。
本方案中的最小嵌入时长4T,需要满足的条件是小于最短广告或用户最短体验时间,最短广告一般为5秒,用户最短体验时间也是4-5秒。经过的实验,发明人得出了识别单个水印需要录音时长T为0.68秒,4T为2.72秒,满足实际应用要求。
本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。
尽管本文较多地使用了水印文件、样本、音频等术语,但并不排除使用其它术语的可能性。使用这些术语仅仅是为了更方便地描述和解释本发明的本质;把它们解释成任何一种附加的限制都是与本发明精神相违背的。
Claims (3)
1.一种移动端音频快速识别方法,其特征在于,包括以下步骤:
S002、选择一个样本,将样本中的水印文件嵌入到音频中;
S003、对嵌有水印文件的音频进行对比识别;
所述步骤S002中,识别单个水印文件需要的音频时长为T,识别整个样本需要的时长为K×T,将整个音频按照K×T的时长划分为若干段,每段按时长T划分后依次标记为T1、T2、T3…TK,将所选择的样本中的K个水印文件依次嵌入到T1、T2、T3…TK中,循环嵌入直至音频结束。
2.根据权利要求1所述的一种移动端音频快速识别方法,其特征在于,步骤S003中,首先提取音频中的水印文件样本,然后对样本中的水印文件依次对比识别,识别过程如下:
S031、从样本中提取未识别的水印文件,与未被标记的组中的水印文件进行对比识别,识别成功后将此水印文件所在的组进行标记;
S032、重复步骤S031直至所有水印文件均已被识别;
初始时所有组均未被标记,结束后清除所有组的标记。
3.根据权利要求1或2所述的一种移动端音频快速识别方法,其特征在于,所述K为4,样本数M为10000,N为40。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710683924.XA CN107516529B (zh) | 2017-08-11 | 2017-08-11 | 一种移动端音频快速识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710683924.XA CN107516529B (zh) | 2017-08-11 | 2017-08-11 | 一种移动端音频快速识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107516529A CN107516529A (zh) | 2017-12-26 |
CN107516529B true CN107516529B (zh) | 2020-06-09 |
Family
ID=60722113
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710683924.XA Active CN107516529B (zh) | 2017-08-11 | 2017-08-11 | 一种移动端音频快速识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107516529B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101702229A (zh) * | 2009-11-06 | 2010-05-05 | 电子科技大学 | 一种含认证水印和恢复水印的图像生成方法和恢复方法 |
CN104142984A (zh) * | 2014-07-18 | 2014-11-12 | 电子科技大学 | 一种基于粗细粒度的视频指纹检索方法 |
CN104917989A (zh) * | 2014-03-11 | 2015-09-16 | 移康智能科技(上海)有限公司 | 分级水印的添加方法及其系统 |
CN106919813A (zh) * | 2015-12-25 | 2017-07-04 | 中国电信股份有限公司 | 大数据水印管理方法和系统 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080301456A1 (en) * | 2005-12-22 | 2008-12-04 | Antonius Adriaan Maria Staring | Efficient Secure Forensic Watermarking |
US8838978B2 (en) * | 2010-09-16 | 2014-09-16 | Verance Corporation | Content access management using extracted watermark information |
-
2017
- 2017-08-11 CN CN201710683924.XA patent/CN107516529B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101702229A (zh) * | 2009-11-06 | 2010-05-05 | 电子科技大学 | 一种含认证水印和恢复水印的图像生成方法和恢复方法 |
CN104917989A (zh) * | 2014-03-11 | 2015-09-16 | 移康智能科技(上海)有限公司 | 分级水印的添加方法及其系统 |
CN104142984A (zh) * | 2014-07-18 | 2014-11-12 | 电子科技大学 | 一种基于粗细粒度的视频指纹检索方法 |
CN106919813A (zh) * | 2015-12-25 | 2017-07-04 | 中国电信股份有限公司 | 大数据水印管理方法和系统 |
Also Published As
Publication number | Publication date |
---|---|
CN107516529A (zh) | 2017-12-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102880726B (zh) | 一种图像过滤方法及系统 | |
CN109036386B (zh) | 一种语音处理方法及装置 | |
CN104750620B (zh) | 一种内存迁移方法及装置 | |
CN110163061B (zh) | 用于提取视频指纹的方法、装置、设备和计算机可读介质 | |
CN111260220A (zh) | 群控设备识别方法、装置、电子设备和存储介质 | |
CN108877783A (zh) | 确定音频数据的音频类型的方法和装置 | |
CN113516249A (zh) | 基于半异步的联邦学习方法、系统、服务器及介质 | |
CN107516529B (zh) | 一种移动端音频快速识别方法 | |
CN115357571A (zh) | 一种数据去重方法、装置、设备及介质 | |
CN108416425B (zh) | 一种卷积运算方法及装置 | |
CN106326258B (zh) | Url匹配方法及装置 | |
CN107680598B (zh) | 基于好友声纹通讯录的信息交互方法、装置及其设备 | |
CN108880559B (zh) | 数据压缩方法、数据解压缩方法、压缩设备及解压缩设备 | |
CN115631330B (zh) | 特征提取方法、模型训练方法、图像识别方法及应用 | |
US20160364457A1 (en) | Length of the longest common subsequence algorithm optimization | |
US7571093B1 (en) | Method of identifying duplicate voice recording | |
CN112182327A (zh) | 一种数据处理方法、装置、设备及介质 | |
US20220199202A1 (en) | Method and apparatus for compressing fastq data through character frequency-based sequence reordering | |
CN111160517A (zh) | 一种深度神经网络的卷积层量化方法及装置 | |
WO2018041036A1 (zh) | 关键词的查找方法、装置及终端 | |
CN107783990B (zh) | 一种数据压缩方法及终端 | |
CN112037814B (zh) | 一种音频指纹的提取方法、装置、电子设备及存储介质 | |
CN111597379B (zh) | 音频搜索方法、装置、计算机设备和计算机可读存储介质 | |
CN102769658A (zh) | 网络文件还原方法及装置 | |
KR102060110B1 (ko) | 컨텐츠에 포함되는 객체를 분류하는 방법, 장치 및 컴퓨터 프로그램 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |