CN107516529B - 一种移动端音频快速识别方法 - Google Patents

一种移动端音频快速识别方法 Download PDF

Info

Publication number
CN107516529B
CN107516529B CN201710683924.XA CN201710683924A CN107516529B CN 107516529 B CN107516529 B CN 107516529B CN 201710683924 A CN201710683924 A CN 201710683924A CN 107516529 B CN107516529 B CN 107516529B
Authority
CN
China
Prior art keywords
watermark
audio
files
file
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710683924.XA
Other languages
English (en)
Other versions
CN107516529A (zh
Inventor
赵凡
彭小光
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Linker Technology Co ltd
Original Assignee
Hangzhou Linker Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Linker Technology Co ltd filed Critical Hangzhou Linker Technology Co ltd
Priority to CN201710683924.XA priority Critical patent/CN107516529B/zh
Publication of CN107516529A publication Critical patent/CN107516529A/zh
Application granted granted Critical
Publication of CN107516529B publication Critical patent/CN107516529B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/018Audio watermarking, i.e. embedding inaudible data in the audio signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

本发明公开了一种移动端音频快速识别方法,其包括以下步骤:S001、对水印文件进行编组:将N个水印文件分为K组,每组包含的水印文件数量为n,n=N/K,n为正整数,从每组中抽取一个水印文件,共有M种组合,
Figure DDA0001376189470000011
每一种组合代表一个样本;S002、选择一个样本,将样本中的水印文件嵌入到音频中;S003、对嵌有水印文件的音频进行对比识别。识别时只需要将水印文件与之前已识别的水印所在组之外的组进行对比即可。本方案识别速度快,适用于手机等移动端。

Description

一种移动端音频快速识别方法
技术领域
本发明涉及数字信号处理技术领域,尤其是涉及一种具有较高识别效率的移动端音频快速识别方法。
背景技术
在通常的音频水印识别系统中,一般是采用嵌入唯一水印到音频文件中,识别端逐个比对水印库,如此计算量非常大,无法做到实时性,对系统运算能力要求很高,需要在服务器端完成,无法在移动端(手机)上完成识别工作。
例如需要10000个样本,则需要10000个水印文件来表示,需要的对比次数平均为
Figure BDA0001376189450000011
如果每次对比耗时为t,则识别时的平均耗时为5000t,在处理能力较弱的移动端(手机或PAD等设备)上实用性和实时性都会极差,无法被广泛应用。
发明内容
本发明主要是解决现有技术所存在的需要的水印文件量大、识别耗时长的技术问题,提供一种只需要少量水印文件就可以提供足够大的样本量、识别快速、实时性强的移动端音频快速识别方法。
本发明针对上述技术问题主要是通过下述技术方案得以解决的:一种移动端音频快速识别方法,包括以下步骤:
S001、对水印文件进行编组:将N个水印文件分为K组,每组包含的水印文件数量为n,n=N/K,n为正整数,从每组中抽取一个水印文件,共有M种组合,
Figure BDA0001376189450000012
每一种组合代表一个样本;
S002、选择一个样本,将样本中的水印文件嵌入到音频中;
S003、对嵌有水印文件的音频进行对比识别。
作为优选,所述步骤S002中,识别单个水印文件需要的音频时长为T,识别整个样本需要的时长为K×T,将整个音频按照K×T的时长划分为若干段,每段按时长T划分后依次标记为T1、T2、T3…TK,将所选择的样本中的K个水印文件依次嵌入到T1、T2、T3…TK中,循环嵌入直至音频结束。
作为优选,步骤S003中,首先提取音频中的水印文件样本,然后对样本中的水印文件依次对比识别,识别过程如下:
S031、从样本中提取未识别的水印文件,与未被标记的组中的水印文件进行对比识别,识别成功后将此水印文件所在的组进行标记;
S032、重复步骤S031直至所有水印文件均已被识别;
初始时所有组均未被标记,结束后清除所有组的标记。
作为优选,所述K为4,样本数M为10000,N为40。
采用编组然后抽取文件的方式,可以用少量水印文件生成足够大的样本数,例如分组数为4,需要的样本数为10000,则可以倒推出N为40,相对于常规技术方案的10000个样本需要10000个水印文件,本方案极大减少了水印文件的数量,简化了编码。
每次对比需要的时间为t,在K为4时,识别完4T所需要的识别耗费时间为4个位置识别时间的和,我们在录音4T时长后,依据嵌入规则和概率论随机变量及其分布,第1个位置识别出来的平均时间最长,可能是4组中的任意一个水印,对比次数的算数平均数
Figure BDA0001376189450000021
第2个水印识别时不需要与第一个水印所在组中的水印进行对比(即只需要在与其他三组中的文件进行对比),识别出来的平均时间稍长,对比次数的算数平均数
Figure BDA0001376189450000022
第3个水印识别时不需要与第一个和第二个水印文件所在组中的水印文件进行对比,识别出来的平均时间稍短,对比次数的算数平均数
Figure BDA0001376189450000023
最后1个水印只需要与最后一个组中的水印文件进行对比,识别出来的平均时间最短,对比次数的算数平均数
Figure BDA0001376189450000024
10000个样本只需要40个水印表示,需要在4T时间内完成识别所要进行的对比次数的算数平均数
Figure BDA0001376189450000031
Figure BDA0001376189450000032
次,则平均识别时间为52×t。也就是说本方案在第二个水印及后续水印的识别过程中对照文件就不包含已识别的水印所在组的水印文件,越到后面所需要的对比次数越少,识别时间也越快,降低了整体识别耗时。相比于传统方案的10000个样本平均需要5000t的识别时间,本方案极大地提高了识别速度,并且保留了同样的区分度。
本发明带来的实质性效果是,只需要极少量的水印文件即可提供极大的样本量,识别时耗时少,速度快,对资源占用少,适用于手机等性能受限的移动端。
附图说明
图1是本发明的一种流程图。
具体实施方式
下面通过实施例,并结合附图,对本发明的技术方案作进一步具体的说明。
实施例:本实施例的一种移动端音频快速识别方法,如图1所示,包括以下步骤:
S001、对水印文件进行编组:将N个水印文件分为K组,每组包含的水印文件数量为n,从每组中抽取一个水印文件,共有M种组合,
Figure BDA0001376189450000033
每一种组合代表一个样本;N为40,K为4,n为10,M为10000;
S002、选择一个样本,将样本中的水印文件嵌入到音频中:识别单个水印文件需要的音频时长为T,识别整个样本需要的时长为4×T,将整个音频按照K×T的时长划分为若干段,每段按时长T划分后依次标记为T1、T2、T3、T4,将所选择的样本中的4个水印文件依次嵌入到T1、T2、T3、T4中,循环嵌入直至音频结束;
S003、对嵌有水印文件的音频进行对比识别:首先提取音频中的水印文件样本,然后对样本中的水印文件依次对比识别,识别过程如下:
S031、从样本中提取未识别的水印文件,与未被标记的组中的水印文件进行对比识别,识别成功后将此水印文件所在的组进行标记;
S032、重复步骤S031直至所有水印文件均已被识别;
初始时所有组均未被标记,结束后清除所有组的标记。
采用编组然后抽取文件的方式,可以用少量水印文件生成足够大的样本数,例如分组数为4,需要的样本数为10000,则可以倒推出N为40,相对于常规技术方案的10000个样本需要10000个水印文件,本方案极大减少了水印文件的数量,简化了编码。
每次对比需要的时间为t,在K为4时,识别完4T所需要的识别耗费时间为4个位置识别时间的和,我们在录音4T时长后,依据嵌入规则和概率论随机变量及其分布,第1个位置识别出来的平均时间最长,可能是4组中的任意一个水印,对比次数的算数平均数
Figure BDA0001376189450000041
第2个水印识别时不需要与第一个水印所在组中的水印进行对比(即只需要在与其他三组中的文件进行对比),识别出来的平均时间稍长,对比次数的算数平均数
Figure BDA0001376189450000042
第3个水印识别时不需要与第一个和第二个水印文件所在组中的水印文件进行对比,识别出来的平均时间稍短,对比次数的算数平均数
Figure BDA0001376189450000043
最后1个水印只需要与最后一个组中的水印文件进行对比,识别出来的平均时间最短,对比次数的算数平均数
Figure BDA0001376189450000044
10000个样本只需要40个水印表示,需要在4T时间内完成识别所要进行的对比次数的算数平均数
Figure BDA0001376189450000045
Figure BDA0001376189450000046
次,则平均识别时间为52×t。也就是说本方案在第二个水印及后续水印的识别过程中对照文件就不包含已识别的水印所在组的水印文件,越到后面所需要的对比次数越少,识别时间也越快,降低了整体识别耗时。相比于传统方案的10000个样本平均需要5000t的识别时间,本方案极大地提高了识别速度,并且保留了同样的区分度。
本方案中的最小嵌入时长4T,需要满足的条件是小于最短广告或用户最短体验时间,最短广告一般为5秒,用户最短体验时间也是4-5秒。经过的实验,发明人得出了识别单个水印需要录音时长T为0.68秒,4T为2.72秒,满足实际应用要求。
本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。
尽管本文较多地使用了水印文件、样本、音频等术语,但并不排除使用其它术语的可能性。使用这些术语仅仅是为了更方便地描述和解释本发明的本质;把它们解释成任何一种附加的限制都是与本发明精神相违背的。

Claims (3)

1.一种移动端音频快速识别方法,其特征在于,包括以下步骤:
S001、对水印文件进行编组:将N个水印文件分为K组,每组包含的水印文件数量为n,n=N/K,n为正整数,从每组中抽取一个水印文件,共有M种组合,
Figure FDA0002433467790000011
每一种组合代表一个样本;
S002、选择一个样本,将样本中的水印文件嵌入到音频中;
S003、对嵌有水印文件的音频进行对比识别;
所述步骤S002中,识别单个水印文件需要的音频时长为T,识别整个样本需要的时长为K×T,将整个音频按照K×T的时长划分为若干段,每段按时长T划分后依次标记为T1、T2、T3…TK,将所选择的样本中的K个水印文件依次嵌入到T1、T2、T3…TK中,循环嵌入直至音频结束。
2.根据权利要求1所述的一种移动端音频快速识别方法,其特征在于,步骤S003中,首先提取音频中的水印文件样本,然后对样本中的水印文件依次对比识别,识别过程如下:
S031、从样本中提取未识别的水印文件,与未被标记的组中的水印文件进行对比识别,识别成功后将此水印文件所在的组进行标记;
S032、重复步骤S031直至所有水印文件均已被识别;
初始时所有组均未被标记,结束后清除所有组的标记。
3.根据权利要求1或2所述的一种移动端音频快速识别方法,其特征在于,所述K为4,样本数M为10000,N为40。
CN201710683924.XA 2017-08-11 2017-08-11 一种移动端音频快速识别方法 Active CN107516529B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710683924.XA CN107516529B (zh) 2017-08-11 2017-08-11 一种移动端音频快速识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710683924.XA CN107516529B (zh) 2017-08-11 2017-08-11 一种移动端音频快速识别方法

Publications (2)

Publication Number Publication Date
CN107516529A CN107516529A (zh) 2017-12-26
CN107516529B true CN107516529B (zh) 2020-06-09

Family

ID=60722113

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710683924.XA Active CN107516529B (zh) 2017-08-11 2017-08-11 一种移动端音频快速识别方法

Country Status (1)

Country Link
CN (1) CN107516529B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101702229A (zh) * 2009-11-06 2010-05-05 电子科技大学 一种含认证水印和恢复水印的图像生成方法和恢复方法
CN104142984A (zh) * 2014-07-18 2014-11-12 电子科技大学 一种基于粗细粒度的视频指纹检索方法
CN104917989A (zh) * 2014-03-11 2015-09-16 移康智能科技(上海)有限公司 分级水印的添加方法及其系统
CN106919813A (zh) * 2015-12-25 2017-07-04 中国电信股份有限公司 大数据水印管理方法和系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080301456A1 (en) * 2005-12-22 2008-12-04 Antonius Adriaan Maria Staring Efficient Secure Forensic Watermarking
US8838978B2 (en) * 2010-09-16 2014-09-16 Verance Corporation Content access management using extracted watermark information

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101702229A (zh) * 2009-11-06 2010-05-05 电子科技大学 一种含认证水印和恢复水印的图像生成方法和恢复方法
CN104917989A (zh) * 2014-03-11 2015-09-16 移康智能科技(上海)有限公司 分级水印的添加方法及其系统
CN104142984A (zh) * 2014-07-18 2014-11-12 电子科技大学 一种基于粗细粒度的视频指纹检索方法
CN106919813A (zh) * 2015-12-25 2017-07-04 中国电信股份有限公司 大数据水印管理方法和系统

Also Published As

Publication number Publication date
CN107516529A (zh) 2017-12-26

Similar Documents

Publication Publication Date Title
CN102880726B (zh) 一种图像过滤方法及系统
CN109036386B (zh) 一种语音处理方法及装置
CN104750620B (zh) 一种内存迁移方法及装置
CN110163061B (zh) 用于提取视频指纹的方法、装置、设备和计算机可读介质
CN111260220A (zh) 群控设备识别方法、装置、电子设备和存储介质
CN108877783A (zh) 确定音频数据的音频类型的方法和装置
CN113516249A (zh) 基于半异步的联邦学习方法、系统、服务器及介质
CN107516529B (zh) 一种移动端音频快速识别方法
CN115357571A (zh) 一种数据去重方法、装置、设备及介质
CN108416425B (zh) 一种卷积运算方法及装置
CN106326258B (zh) Url匹配方法及装置
CN107680598B (zh) 基于好友声纹通讯录的信息交互方法、装置及其设备
CN108880559B (zh) 数据压缩方法、数据解压缩方法、压缩设备及解压缩设备
CN115631330B (zh) 特征提取方法、模型训练方法、图像识别方法及应用
US20160364457A1 (en) Length of the longest common subsequence algorithm optimization
US7571093B1 (en) Method of identifying duplicate voice recording
CN112182327A (zh) 一种数据处理方法、装置、设备及介质
US20220199202A1 (en) Method and apparatus for compressing fastq data through character frequency-based sequence reordering
CN111160517A (zh) 一种深度神经网络的卷积层量化方法及装置
WO2018041036A1 (zh) 关键词的查找方法、装置及终端
CN107783990B (zh) 一种数据压缩方法及终端
CN112037814B (zh) 一种音频指纹的提取方法、装置、电子设备及存储介质
CN111597379B (zh) 音频搜索方法、装置、计算机设备和计算机可读存储介质
CN102769658A (zh) 网络文件还原方法及装置
KR102060110B1 (ko) 컨텐츠에 포함되는 객체를 분류하는 방법, 장치 및 컴퓨터 프로그램

Legal Events

Date Code Title Description
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant