CN107516529B

CN107516529B - 一种移动端音频快速识别方法

Info

Publication number: CN107516529B
Application number: CN201710683924.XA
Authority: CN
Inventors: 赵凡; 彭小光
Original assignee: Hangzhou Linker Technology Co ltd
Current assignee: Hangzhou Linker Technology Co ltd
Priority date: 2017-08-11
Filing date: 2017-08-11
Publication date: 2020-06-09
Anticipated expiration: 2037-08-11
Also published as: CN107516529A

Abstract

本发明公开了一种移动端音频快速识别方法，其包括以下步骤：S001、对水印文件进行编组：将N个水印文件分为K组，每组包含的水印文件数量为n，n＝N/K，n为正整数，从每组中抽取一个水印文件，共有M种组合，

每一种组合代表一个样本；S002、选择一个样本，将样本中的水印文件嵌入到音频中；S003、对嵌有水印文件的音频进行对比识别。识别时只需要将水印文件与之前已识别的水印所在组之外的组进行对比即可。本方案识别速度快，适用于手机等移动端。

Description

一种移动端音频快速识别方法

技术领域

本发明涉及数字信号处理技术领域，尤其是涉及一种具有较高识别效率的移动端音频快速识别方法。

背景技术

在通常的音频水印识别系统中，一般是采用嵌入唯一水印到音频文件中，识别端逐个比对水印库，如此计算量非常大，无法做到实时性，对系统运算能力要求很高，需要在服务器端完成，无法在移动端(手机)上完成识别工作。

例如需要10000个样本，则需要10000个水印文件来表示，需要的对比次数平均为

如果每次对比耗时为t，则识别时的平均耗时为5000t，在处理能力较弱的移动端(手机或PAD等设备)上实用性和实时性都会极差，无法被广泛应用。

发明内容

本发明主要是解决现有技术所存在的需要的水印文件量大、识别耗时长的技术问题，提供一种只需要少量水印文件就可以提供足够大的样本量、识别快速、实时性强的移动端音频快速识别方法。

本发明针对上述技术问题主要是通过下述技术方案得以解决的：一种移动端音频快速识别方法，包括以下步骤：

S001、对水印文件进行编组：将N个水印文件分为K组，每组包含的水印文件数量为n，n＝N/K，n为正整数，从每组中抽取一个水印文件，共有M种组合，

每一种组合代表一个样本；

S002、选择一个样本，将样本中的水印文件嵌入到音频中；

S003、对嵌有水印文件的音频进行对比识别。

作为优选，所述步骤S002中，识别单个水印文件需要的音频时长为T，识别整个样本需要的时长为K×T，将整个音频按照K×T的时长划分为若干段，每段按时长T划分后依次标记为T₁、T₂、T₃…T_K，将所选择的样本中的K个水印文件依次嵌入到T₁、T₂、T₃…T_K中，循环嵌入直至音频结束。

作为优选，步骤S003中，首先提取音频中的水印文件样本，然后对样本中的水印文件依次对比识别，识别过程如下：

S031、从样本中提取未识别的水印文件，与未被标记的组中的水印文件进行对比识别，识别成功后将此水印文件所在的组进行标记；

S032、重复步骤S031直至所有水印文件均已被识别；

初始时所有组均未被标记，结束后清除所有组的标记。

作为优选，所述K为4，样本数M为10000，N为40。

采用编组然后抽取文件的方式，可以用少量水印文件生成足够大的样本数，例如分组数为4，需要的样本数为10000，则可以倒推出N为40，相对于常规技术方案的10000个样本需要10000个水印文件，本方案极大减少了水印文件的数量，简化了编码。

每次对比需要的时间为t，在K为4时，识别完4T所需要的识别耗费时间为4个位置识别时间的和，我们在录音4T时长后，依据嵌入规则和概率论随机变量及其分布，第1个位置识别出来的平均时间最长，可能是4组中的任意一个水印，对比次数的算数平均数

第2个水印识别时不需要与第一个水印所在组中的水印进行对比(即只需要在与其他三组中的文件进行对比)，识别出来的平均时间稍长，对比次数的算数平均数

第3个水印识别时不需要与第一个和第二个水印文件所在组中的水印文件进行对比，识别出来的平均时间稍短，对比次数的算数平均数

最后1个水印只需要与最后一个组中的水印文件进行对比，识别出来的平均时间最短，对比次数的算数平均数

10000个样本只需要40个水印表示，需要在4T时间内完成识别所要进行的对比次数的算数平均数

次，则平均识别时间为52×t。也就是说本方案在第二个水印及后续水印的识别过程中对照文件就不包含已识别的水印所在组的水印文件，越到后面所需要的对比次数越少，识别时间也越快，降低了整体识别耗时。相比于传统方案的10000个样本平均需要5000t的识别时间，本方案极大地提高了识别速度，并且保留了同样的区分度。

本发明带来的实质性效果是，只需要极少量的水印文件即可提供极大的样本量，识别时耗时少，速度快，对资源占用少，适用于手机等性能受限的移动端。

附图说明

图1是本发明的一种流程图。

具体实施方式

下面通过实施例，并结合附图，对本发明的技术方案作进一步具体的说明。

实施例：本实施例的一种移动端音频快速识别方法，如图1所示，包括以下步骤：

S001、对水印文件进行编组：将N个水印文件分为K组，每组包含的水印文件数量为n，从每组中抽取一个水印文件，共有M种组合，

每一种组合代表一个样本；N为40，K为4，n为10，M为10000；

S002、选择一个样本，将样本中的水印文件嵌入到音频中：识别单个水印文件需要的音频时长为T，识别整个样本需要的时长为4×T，将整个音频按照K×T的时长划分为若干段，每段按时长T划分后依次标记为T₁、T₂、T₃、T₄，将所选择的样本中的4个水印文件依次嵌入到T₁、T₂、T₃、T₄中，循环嵌入直至音频结束；

S003、对嵌有水印文件的音频进行对比识别：首先提取音频中的水印文件样本，然后对样本中的水印文件依次对比识别，识别过程如下：

S032、重复步骤S031直至所有水印文件均已被识别；

初始时所有组均未被标记，结束后清除所有组的标记。

本方案中的最小嵌入时长4T，需要满足的条件是小于最短广告或用户最短体验时间，最短广告一般为5秒，用户最短体验时间也是4-5秒。经过的实验，发明人得出了识别单个水印需要录音时长T为0.68秒，4T为2.72秒，满足实际应用要求。

本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代，但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。

尽管本文较多地使用了水印文件、样本、音频等术语，但并不排除使用其它术语的可能性。使用这些术语仅仅是为了更方便地描述和解释本发明的本质；把它们解释成任何一种附加的限制都是与本发明精神相违背的。

Claims

1.一种移动端音频快速识别方法，其特征在于，包括以下步骤：

每一种组合代表一个样本；

S002、选择一个样本，将样本中的水印文件嵌入到音频中；

S003、对嵌有水印文件的音频进行对比识别；

所述步骤S002中，识别单个水印文件需要的音频时长为T，识别整个样本需要的时长为K×T，将整个音频按照K×T的时长划分为若干段，每段按时长T划分后依次标记为T₁、T₂、T₃…T_K，将所选择的样本中的K个水印文件依次嵌入到T₁、T₂、T₃…T_K中，循环嵌入直至音频结束。

2.根据权利要求1所述的一种移动端音频快速识别方法，其特征在于，步骤S003中，首先提取音频中的水印文件样本，然后对样本中的水印文件依次对比识别，识别过程如下：

S032、重复步骤S031直至所有水印文件均已被识别；

初始时所有组均未被标记，结束后清除所有组的标记。

3.根据权利要求1或2所述的一种移动端音频快速识别方法，其特征在于，所述K为4，样本数M为10000，N为40。