CN110211608B - 一种语音检索方法及系统 - Google Patents
一种语音检索方法及系统 Download PDFInfo
- Publication number
- CN110211608B CN110211608B CN201910500492.3A CN201910500492A CN110211608B CN 110211608 B CN110211608 B CN 110211608B CN 201910500492 A CN201910500492 A CN 201910500492A CN 110211608 B CN110211608 B CN 110211608B
- Authority
- CN
- China
- Prior art keywords
- hash
- sequence
- voice
- matrix
- original file
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 61
- 101150060512 SPATA6 gene Proteins 0.000 claims abstract description 338
- 238000000605 extraction Methods 0.000 claims abstract description 19
- 239000011159 matrix material Substances 0.000 claims description 111
- 238000013507 mapping Methods 0.000 claims description 36
- 230000000739 chaotic effect Effects 0.000 claims description 26
- 238000000354 decomposition reaction Methods 0.000 claims description 26
- 238000010276 construction Methods 0.000 claims description 25
- 230000009466 transformation Effects 0.000 claims description 21
- 238000007781 pre-processing Methods 0.000 claims description 13
- 238000005516 engineering process Methods 0.000 abstract description 5
- 238000006073 displacement reaction Methods 0.000 description 8
- 238000005070 sampling Methods 0.000 description 8
- 238000002156 mixing Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 3
- 229910010888 LiIn Inorganic materials 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/61—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/63—Querying
- G06F16/632—Query formulation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/54—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for retrieval
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L9/00—Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
- H04L9/001—Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols using chaotic signals
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Signal Processing (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Databases & Information Systems (AREA)
- Acoustics & Sound (AREA)
- General Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Computer Security & Cryptography (AREA)
- Computer Networks & Wireless Communication (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Complex Calculations (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种语音检索方法及系统,涉及语音检索技术领域。该方法包括:获取查询语音;提取查询语音的第二哈希序列;将第二哈希序列与建立的系统哈希索引表进行匹配,得到与第二哈希序列匹配的第一哈希序列;在建立的密文语音库中根据第一哈希序列获取原始文件;建立密文语音库;建立系统哈希索引表。该方法借鉴生物哈希技术,对原始语音进行特征提取,获取原始语音的第一哈希序列,将第一哈希序列作为检索摘要,通过比较第一哈希序列和查询语音的第二哈希序列的汉明距离,完成检索内容的匹配。该方法通过采用生物哈希技术提取语音的哈希摘要,提高了语音哈希摘要的安全性。
Description
技术领域
本发明涉及语音检索技术领域,特别是涉及一种语音检索方法及系统。
背景技术
面对海量的多媒体数据,如何保证用户的数据安全,如何在数据安全的条件下准确、快速地从海量数据中检索到所需内容等,一直是多媒体检索研究领域的热点问题。尤其是在语音上传到云端之前,对语音数据进行加密来确保敏感语音数据的安全,但是加密的数据会失去语音的固有特性,对检索也会造成影响。因此,在加密的语音数据中快速、准确的检索到自己需要的数据将是亟待解决的问题。
目前,语音检索方法主要包括:文本检索、内容检索、语义检索,其中基于内容的检索是研究的热点,基于内容的检索方法主要有:多关键词检索、模糊检索和排序检索。语音特征提取方法主要包括:感知哈希、音频指纹和生物哈希等方法。基于这些检索方法和特征提取方法,国内外学者在基于内容的多媒体密文检索方面取得了很好的研究成果。然而现有方法虽然考虑了云端语音数据的安全性,但没有考虑检索哈希摘要的安全性等问题。因此,现有检索方法还存在哈希摘要的安全性低的问题。
发明内容
本发明的目的是提供一种语音检索方法及系统,解决了现有检索方法的哈希摘要的安全性低的问题。
为实现上述目的,本发明提供了如下方案:
一种语音检索方法,包括:
获取查询语音;
提取所述查询语音的第二哈希序列;
将所述第二哈希序列与建立的系统哈希索引表进行匹配,得到与所述第二哈希序列匹配的第一哈希序列;
在建立的密文语音库中根据所述第一哈希序列获取原始文件;
建立密文语音库包括:
获取原始文件;
对所述原始文件进行加密,得到加密文件并将所述加密文件上传至云端的语音库,得到所述密文语音库;
建立系统哈希索引表包括:
对所述原始文件进行特征提取,得到所述原始文件的第一哈希序列;
将所述第一哈希序列组成哈希索引并存储至所述云端的系统哈希库,得到所述系统哈希索引表。
可选的,所述对所述原始文件进行加密,得到加密文件并将所述加密文件上传至云端的语音库,得到所述密文语音库,包括:采用二维混沌映射加密算法对所述原始文件进行加密,得到加密文件并将所述加密文件上传至云端的语音库,得到所述密文语音库。
可选的,所述对所述原始文件进行特征提取,得到所述原始文件的第一哈希序列,包括:
对所述原始文件进行预处理,得到预处理信号;
对所述预处理信号进行离散余弦变换,得到小波分解低频系数;
对所述小波分解低频系数进行离散小波变换,得到小波梅林矩阵;
对一维差分形式的映射方程进行伪随机变换,得到随机矩阵;
对所述随机矩阵进行快速傅里叶变换,得到第一矩阵;
利用所述小波梅林矩阵对所述第一矩阵进行迭代,得到所述第二矩阵;
对所述第二矩阵进行重新构造生成第三矩阵;
利用所述第三矩阵对所述原始文件进行哈希构造,得到所述第一哈希序列。
可选的,所述将所述第一哈希序列组成哈希索引并存储至所述云端的系统哈希库,得到所述系统哈希索引表,包括:
通过哈希函数将所述原始文件与所述第一哈希序列进行映射,生成所述哈希索引;
将所述哈希索引存储至所述系统哈希库,得到所述系统哈希索引表。
可选的,所述将所述第二哈希序列与建立的系统哈希索引表进行匹配,得到与所述第二哈希序列匹配的第一哈希序列,包括:
将所述第二哈希序列和所述系统哈希索引表中的所有所述第一哈希序列的汉明距离与设定阈值进行比较;
当所述第二哈希序列和所述第一哈希序列的汉明距离小于或等于设定阈值时,得到与所述第二哈希序列匹配的所述第一哈希序列。
一种语音检索系统,包括:
查询语音获取模块,用于获取查询语音;
提取模块,用于提取所述查询语音的第二哈希序列;
匹配模块,用于将所述第二哈希序列与建立的系统哈希索引表进行匹配,得到与所述第二哈希序列匹配的第一哈希序列;
获取模块,用于在建立的密文语音库中根据所述第一哈希序列获取原始文件;
密文语音库建立模块,用于建立密文语音库;
密文语音库建立模块包括:
原始文件获取单元,用于获取原始文件;
加密单元,用于对所述原始文件进行加密,得到加密文件并将所述加密文件上传至云端的语音库,得到所述密文语音库;
系统哈希索引表建立模块,用于建立系统哈希索引表;
系统哈希索引表建立模块包括:
特征提取单元,用于对所述原始文件进行特征提取,得到所述原始文件的第一哈希序列;
哈希索引单元,用于将所述第一哈希序列组成哈希索引并存储至所述云端的系统哈希库,得到所述系统哈希索引表。
可选的,所述加密单元,包括:
加密子单元,用于采用二维混沌映射加密算法对所述原始文件进行加密,得到加密文件并将所述加密文件上传至云端的语音库,得到所述系统哈希索引表。
可选的,所述特征提取单元,包括:
预处理子单元,用于对所述原始文件进行预处理,得到预处理信号;
离散余弦变换子单元,用于对所述预处理信号进行离散余弦变换,得到小波分解低频系数;
离散小波变换子单元,用于对所述小波分解低频系数进行离散小波变换,得到小波梅林矩阵;
伪随机变换子单元,用于对一维差分形式的映射方程进行伪随机变换,得到随机矩阵;
傅里叶变换子单元,用于对所述随机矩阵进行快速傅里叶变换,得到第一矩阵;
迭代子单元,用于利用所述小波梅林矩阵对所述第一矩阵进行迭代,得到所述第二矩阵;
构造子单元,用于对所述第二矩阵进行重新构造生成第三矩阵;
哈希构造子单元,用于利用所述第三矩阵对所述原始文件进行哈希构造,得到所述第一哈希序列。
可选的,所述哈希索引单元,包括:
映射子单元,用于通过哈希函数将所述原始文件与所述第一哈希序列进行映射,生成所述哈希索引;
存储子单元,用于将所述哈希索引存储至所述系统哈希库,得到所述系统哈希索引表。
可选的,所述匹配模块,包括:
比较单元,用于将所述第二哈希序列和所述系统哈希索引表中的所有所述第一哈希序列的汉明距离与设定阈值进行比较;
匹配单元,用于当所述第二哈希序列和所述第一哈希序列的汉明距离小于或等于设定阈值时,得到与所述第二哈希序列匹配的所述第一哈希序列。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明提供一种语音检索方法及系统,该方法包括:获取查询语音;提取查询语音的第二哈希序列;将第二哈希序列与建立的系统哈希索引表进行匹配,得到与第二哈希序列匹配的第一哈希序列;在建立的密文语音库中根据第一哈希序列获取原始文件;建立密文语音库,建立密文语音库包括:获取原始文件;对原始文件进行加密,得到加密文件并将加密文件上传至云端语音库,得到密文语音库;建立系统哈希索引表,建立系统哈希索引表包括:对原始文件进行特征提取,得到第一哈希序列;将第一哈希序列组成哈希索引并存储至云端的系统哈希库,得到系统哈希索引表。该方法借鉴生物哈希技术,对语音进行特征提取,获取语音的第一哈希序列,将第一哈希序列作为检索摘要,通过比较第一哈希序列和第二哈希序列的汉明距离,完成检索内容的匹配。该方法通过采用生物哈希技术提取原始语音和查询语音的哈希摘要,提高了语音哈希摘要的安全性。该方法在哈希构造方面可对常见的WAV、MP3、FLAC、OGG和M4A等5种不同格式语音文件数据进行处理,通过对5种不同格式混合而成的2000段音频进行特征提取和检索结果的实验结果来看,该方法具有很好的鲁棒性和区分性,且提高了检索效率和检索精确度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例1所提供的语音检索方法的流程图;
图2为本发明实施例1所提供的语音检索方法的离散小波变换原理图;
图3为本发明实施例2所提供的语音检索系统的系统结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
实施例1
本实施例提供一种语音检索方法。在进行语音检索之前需要在云端建立密文语音库和系统哈希索引表。
建立密文语音库包括:
1、获取原始文件。原始文件包括语音信号s(t)。
2、对原始文件进行加密,得到加密文件并将加密文件上传至云端的语音库,得到密文语音库。具体包括:采用二维混沌映射加密算法对原始文件进行加密,得到加密文件并将加密文件上传至云端的语音库,得到密文语音库。
采用二维混沌映射加密算法对原始文件进行加密具体包括:
设定两个初始值:当k=1时,xk-1=1.0,xk=1.2。通过二维混沌(Henon)映射公式的差分方程:xk+1=1-a*xk 2+0.3xk-1产生关于xk的混沌序列,其中xk为差分方程得到混沌序列值,xk-1为xk的前一个混沌序列值,xk+1为xk的后一个混沌序列值,k为正整数,0<a<0.35。本发明实施例1中可选的a=0.2,然后根据公式(1)产生一个混合序列ci。
利用混合序列ci对原始文件的语音信号s(t)进行加密,得到加密语音S(t),即加密文件。具体为:利用混合序列ci对语音加密。当xk的取值范围为[-0.5,1.5]时,根据混合序列ci将xk二值化为0和1,然后对xk进行异或运算。当xk的取值范围为[-1.5,-0.5]时,根据混合序列ci将xk转化为2,然后对xk进行模相减运算。最后,根据转化后的xk得到加密语音S(t),即加密文件。
建立系统哈希索引表包括:
1、对原始文件进行特征提取,得到原始文件的第一哈希序列。具体包括:
对原始文件进行预处理,得到预处理信号。具体为:
对原始文件中的语音信号s(t)进行预加重处理得到预处理信号s’(t)。这样有利于提升信号的高频有用部分,并且还利于后续的特征提取。其中语音信号s(t)的采样频率16kHz,声道数为单声道,采样精度为16位。
对预处理信号进行离散余弦变换,得到小波分解低频系数。具体为:
对预处理信号s’(t)进行三阶离散余弦变换(Discrete Wavelet Transform,离散余弦变换)变换,得到小波分解低频系数L(z)={Li},其中Li为第i阶分解的低频系数;i为分解的低频系数的阶数,i=1,2,…N;N为低频分解系数长度。将小波分解低频系数L(z)记做A。
小波分解的意义在于能够在尺度参数a的离散化和位移参数b的离散化上对信号进行分解,而且不同尺度的选择可以根据不同的目标来进行确定。对于许多信号而言,信号中的低频成分相当重要,低频成分常常蕴含着信号的特征;而信号中的高频成分则给出了信号的细节或差别。语音信号如果去掉高频成分,听起来与以前可能不同,但仍能知道所说的内容;如果去掉足够的低频成分,则听到的是一些没有意义的声音。在小波分析中经常用到近似与细节,其中近似表示信号的高尺度,即低频信息。
对小波分解低频系数进行离散小波变换,得到小波梅林矩阵。具体为:
对预处理信号s’(t)中的待分析信号f(t)进行离散小波变换。离散小波变换为待分析信号f(t)在母小波φ(t)下进行的变换,且待分析信号f(t)属于任意能量有限空间,所以也称这种变换为待分析信号f(t)的连续小波变换。
离散小波变换是对基本小波的尺度和平移进行离散化。在运用中,首先需要对尺度因子a和位移因子b进行离散化处理,如公式(2):
a=a0 m,b=nb0a0 m (2)
其中,m,n为固定的整数,m=0,±1,±2,±3…;n=0,±1±2…;幂底数基底a0为大于1的固定常数,a0的取值反映了尺度离散化的程度;b0为大于0的固定常数,b0表示位移因子b的离散化间隔。尺度因子a和位移因子b的选值与母小波φ(t)的具体形式有关。
离散小波变换表示为:
离散小波变换函数表示为:
当a0=2,b0=1时,离散小波变换称为二进制离散小波变换。
图2为本发明实施例1所提供的语音检索方法的离散小波变换原理图。参见图2,图2还表示如何利用阶层架构对一个离散信号进行离散小波变换的原理。对语音信号s(t)进行离散化得到离散语音输入信号S[n],S[n]为长度为N的离散语音输入信号;G[n]表示低通滤波器,可以将输入信号的高频部份滤掉而输出低频部份;H[n]表示高通滤波器,与低通滤波器相反,可以将输入信号的低频部份滤掉而输出高频部份;↓2表示降采样滤波器。当S[n]作为输入时,则输出SL[n]或SH[n],其中SH[n]为S[n]作为输入经过低通滤波器和降采样滤波器得到的语音信号的高频部分;SL[n]为S[n]作为输入经过低通滤波器和降采样滤波器得到的语音信号的低频部分。
利用得到的低频部分SL[n]即可将小波分解低频系数A构造成小波梅林矩阵X(q,p)。将小波分解低频系数A构造成小波梅林矩阵X(q,p),便于与之后一维混沌(logistic)映射生成的矩阵进行迭代。利用离散小波变换还可以构造生物特征向量产生检索摘要。
对一维差分形式的映射方程进行伪随机变换,得到随机矩阵。具体为:
对一维差分形式的映射方程xq+1=u*xq*(1-xq)进行伪随机变换,其中xq表示映射方程得到混沌序列值,xq+1表示xq的后一个混沌序列值,xq∈(0,1),q=0,1,2…;u表示控制参数,u的取值范围为3.5999<u<4。设定一个初始值:x1,即q=1,并将x1作为密钥,本实施例1根据控制参数u和初始值x1对一维差分方程的映射方程进行计算,可以得到混沌序列xq。为了得到较为随机的随机矩阵,可选的:u=3.999,混沌序列数量q=4000。已知初始值x1、控制参数u和混沌序列数量q=4000,可以计算出混沌序列x1,…,x4000。将得到的混沌序列x1,…,x4000的1×4000的矩阵改写成p×q的矩阵,得到随机矩阵B(p,q),其中p表示矩阵的行数,q表示矩阵的列数。
对随机矩阵进行快速傅里叶变换,得到第一矩阵。具体为:对随机矩阵B(p,q)进行快速傅里叶变换,得到第一矩阵Y(p,q)。
利用小波梅林矩阵对第一矩阵进行迭代,得到第二矩阵。具体为:
利用小波梅林矩阵X(q,p)对第一矩阵Y(p,q)进行迭代产生第二矩阵P(q,q)。其中第二矩阵P(q,q)中左边的q表示小波梅林矩阵X(q,p)中的q,第二矩阵P(q,q)中右边的q表示第一矩阵Y(p,q)中的q。
对第二矩阵进行重新构造生成第三矩阵。具体为:将q×q维的第二矩阵P(q,q)重新构造生成一个一行q2列的第三矩阵H(1,q2),并计算第三矩阵H(1,q2)的平均值为z。
利用第三矩阵对原始文件进行哈希构造,得到第一哈希序列。具体为:
利用第三矩阵H(1,q2)对原始文件进行哈希构造,生成第一哈希序列h={h(j)},其中j为哈希序列对应的位数,j=1,2…M,M为第一哈希序列的总长度。
二进制的哈希构造方法为:
用第三矩阵H(1,q2)的所有数据减去第三矩阵H(1,q2)的平均值z。若剩余数据大于0,则该行数据变为1;若剩余数据小于0,则该行数据变为0。
上式中H(j)表示第三矩阵H(1,q2)中第j位的数据,j为哈希序列对应的位数。
2、将第一哈希序列组成哈希索引并存储至系统哈希库,得到系统哈希索引表。包括:
通过哈希函数将原始文件与第一哈希序列进行映射,生成哈希索引,具体为:
利用二进制的哈希构造方法对原始文件中的语音信号s(t)进行哈希构造,得到第一哈希序列h(j)。
然而对语音信号s(t)进行哈希构造的过程中会出现不同的信号数据带有相同的下标的情况,即冲突现象。针对这种情况,可以将第一个得到此下标的信号数据作为一个链表的结点,然后将所有得到相同下标的信号数据存储于链表中,具体过程如下:
将原始文件中的语音信号s(t)记做为U,通过哈希函数将U全部映射到系统哈希库的系统哈希表中,将映射到系统哈希表中的U记做为T。T[0,…,M-1]的槽位上的数据为:
h:U→{0,1,2,…,M-1} (6);
其中M为第一哈希序列的总长度。
按照公式(6)对原始文件中的所有语音信号进行操作,当遍历完原始文件中的所有语音信号后,哈希索引建立完成。上述映射方法同时也将语音信号按照哈希索引的形式有效的组织起来,为检索奠定了基础。
将哈希索引存储至系统哈希表中,得到系统哈希索引表。
图1为本发明实施例1所提供的语音检索方法的流程图。参见图1,一种语音检索方法包括:
步骤101,获取查询语音。获取用户提交的查询语音信号S1。
步骤102,提取查询语音的第二哈希序列。
步骤102具体包括:利用建立系统哈希索引表步骤中的第三矩阵H(1,n2)对查询语音信号S1进行哈希构造,生成查询语音信号S1的第二哈希序列。
步骤103,将第二哈希序列与建立的系统哈希索引表中所有的第一哈希序列进行匹配,得到与第二哈希序列匹配的第一哈希序列。
步骤103具体包括:
将第二哈希序列和系统哈希索引表中的所有第一哈希序列的汉明距离与设定阈值进行比较。具体为:
将查询语音信号S1的第二哈希序列h1和密文语音库中的所有语音信号S={S(e)}对应的系统哈希索引表h(e’)中的第一哈希序列h={h(j)}的汉明距离与设定阈值进行比较。其中,e表示密文语音库中第e段语音片段,e=1,2…E,E为密文语音库中所有语音信号的总片段数;h(e’)表示系统哈希索引表,包括所有语音信号S={S(e)}对应的第一哈希序列h={h(j)},e’=1,2…E,E为系统哈希索引表中所有语音的总片段数,h表示系统哈希索引表中所有语音信号片段产生的第一哈希序列。
当第二哈希序列和第一哈希序列的汉明距离小于或等于设定阈值时,得到与第二哈希序列匹配的第一哈希序列。
具体为:当h1和第一哈希序列h={h(j)}的汉明距离小于或者等于阈值时,则表示检索成功,得到与第二哈希序列匹配的第一哈希序列。具体汉明距离的匹配过程为:
式(7)中h1为查询语音信号S1的第二哈希序列的哈希值;h2(j)为密文语音库中任意语音信号S2的第一哈希序列的哈希值;hd为h1和h2(j)的归一化汉明距离DH(:,:),即比特误码率(BitErrorRate,BER),表示哈希值的错误比特数与总比特数的比值。DH(S1,S2)为语音信号S1和S2的比特误码率(BER)。
采用BER的假设检验来对哈希匹配进行描述:
1)如果查询语音信号S1和密文语音库中的语音信号S2的内容相同,则
DH(S1,S2)≤τ (8)
2)如果查询语音信号S1和密文语音库中的语音信号S2的内容不相同,则
DH(S1,S2)>τ (9)
其中,τ为检索阈值。
通过设置匹配阈值τ的大小,比较S1和S2的哈希序列的数学距离。若查询语音信号S1和密文语音库中的语音信号S2的数学距离DH≤τ,则认为两个语音信号S1和S2的内容相同,检索成功。
在语音不经过噪声处理的条件下,当阈值τ=0时,表示查询语音信号S1和密文语音库中的语音信号S2的内容相同,检索成功。
步骤104,在建立的密文语音库中根据第一哈希序列获取原始文件。具体为:当检索成功时为用户返回密文语音库中的第一哈希序列所对应的原始文件。
检索阶段是语音检索方法中最重要的部分,为了防止造成数据不必要的损失,所以在语音数据上传云端之前先对语音数据加密。
本发明实施例1语音检索方法借鉴生物哈希技术,对语音进行特征提取,获取语音的第一哈希序列,将第一哈希序列作为检索摘要,通过比较第一哈希序列和第二哈希序列的汉明距离,完成检索内容的匹配,提高了哈希摘要的安全性。该方法在哈希构造方面可对常见的WAV、MP3、FLAC、OGG和M4A等5种不同格式语音文件数据进行处理,通过对5种不同格式混合而成的2000段音频进行特征提取和检索结果的实验结果来看,该方法具有很好的鲁棒性和区分性,且提高了检索效率和检索精确度。
实施例2
本实施例提供一种语音检索系统。在进行语音检索之前需要先建立密文语音库和系统哈希索引表,所以先执行密文语音库建立模块和系统哈希索引表建立模块。
密文语音库建立模块,用于建立密文语音库。
密文语音库建立模块包括:
原始文件获取单元,用于获取原始文件。原始文件包括语音信号s(t)。
加密单元,用于对原始文件进行加密,得到加密文件并将加密文件上传至云端的语音库,得到密文语音库。
加密单元,包括:
加密子单元,用于采用二维混沌映射加密算法对原始文件进行加密,得到加密文件并将加密文件上传至云端的语音库,得到密文语音库。
加密子单元的采用二维混沌映射加密算法对原始文件进行加密具体包括:
设定两个初始值:当k=1时,xk-1=1.0,xk=1.2。通过二维混沌(Henon)映射公式的差分方程:xk+1=1-a*xk 2+0.3xk-1产生关于xk的混沌序列,其中xk为差分方程得到混沌序列值,xk-1为xk的前一个混沌序列值,xk+1为xk的后一个混沌序列值,k为正整数,0<a<0.35。本发明实施例2中可选的a=0.2,然后根据公式(1)产生一个混合序列ci。
利用混合序列ci对原始文件的语音信号s(t)进行加密,得到加密语音S(t),即加密文件。具体为:利用混合序列ci对语音加密,当xk的取值范围为[-0.5,1.5]时,根据混合序列ci将xk二值化为0和1,然后对xk进行异或运算。当xk的取值范围为[-1.5,-0.5]时,根据混合序列ci将xk转化为2,然后对xk进行模相减运算。最后,根据转化后的xk得到加密语音S(t),即加密文件。
系统哈希索引表建立模块,用于建立云端的系统哈希索引表。
系统哈希索引表建立模块包括:
特征提取单元,用于对原始文件进行特征提取,得到原始文件的第一哈希序列。
特征提取单元,包括:
预处理子单元,用于对原始文件进行预处理,得到预处理信号。
预处理子单元具体包括:
对原始文件中的语音信号s(t)进行预加重处理得到预处理信号s’(t)。这样有利于提升信号的高频有用部分,并且还利于后续的特征提取。其中语音信号s(t)的采样频率16kHz,声道数为单声道,采样精度为16位。
离散余弦变换子单元,用于对预处理信号进行离散余弦变换,得到小波分解低频系数。
离散余弦变换子单元具体包括:
对预处理信号s’(t)进行三阶离散余弦变换(Discrete Wavelet Transform,离散余弦变换)变换,得到小波分解低频系数L(z)={Li},其中Li为第i阶分解的低频系数;i为分解的低频系数的阶数,i=1,2,…N;N为低频分解系数长度。将小波分解低频系数L(z)记做A。
小波分解的意义在于能够在尺度参数a的离散化和位移参数b的离散化上对信号进行分解,而且不同尺度的选择可以根据不同的目标来进行确定。对于许多信号而言,信号中的低频成分相当重要,低频成分常常蕴含着信号的特征;而信号中的高频成分则给出了信号的细节或差别。语音信号如果去掉高频成分,听起来与以前可能不同,但仍能知道所说的内容;如果去掉足够的低频成分,则听到的是一些没有意义的声音。在小波分析中经常用到近似与细节,其中近似表示信号的高尺度,即低频信息。
离散小波变换子单元,用于对小波分解低频系数进行离散小波变换,得到小波梅林矩阵。
离散小波变换子单元具体包括:
对预处理信号s’(t)中的待分析信号f(t)进行离散小波变换。离散小波变换为待分析信号f(t)在母小波φ(t)下进行的变换,且待分析信号f(t)属于任意能量有限空间,所以也称这种变换为待分析信号f(t)的连续小波变换。
离散小波变换是对基本小波的尺度和平移进行离散化。在运用中,首先需要对尺度因子a和位移因子b进行离散化处理,如公式(2):
a=a0 m,b=nb0a0 m (2)
其中,m,n为固定的整数,m=0,±1,±2,±3…;n=0,±1±2…;幂底数基底a0为大于1的固定常数,a0的取值反映了尺度离散化的程度;b0为大于0的固定常数,b0表示位移因子b的离散化间隔。尺度因子a和位移因子b的选值与母小波φ(t)的具体形式有关。
离散小波变换表示为:
离散小波变换函数表示为:
当a0=2,b0=1时,离散小波变换称为二进制离散小波变换。
对语音信号s(t)进行离散化得到离散语音输入信号S[n],S[n]为长度为N的离散语音输入信号;低通滤波器G[n]可以将输入信号的高频部份滤掉而输出低频部份;高通滤波器H[n],与低通滤波器相反,可以将输入信号的低频部份滤掉而输出高频部份。当S[n]作为输入时,则输出SL[n]或SH[n],其中SH[n]为S[n]作为输入经过低通滤波器和降采样滤波器得到的语音信号的高频部分;SL[n]为S[n]作为输入经过低通滤波器和降采样滤波器得到的语音信号的低频部分。
利用得到的低频部分SL[n]即可将小波分解低频系数A构造成小波梅林矩阵X(q,p)。将小波分解低频系数A构造成小波梅林矩阵X(q,p),便于与之后一维混沌(logistic)映射生成的矩阵进行迭代。利用离散小波变换还可以构造生物特征向量产生检索摘要。
伪随机变换子单元,用于对一维差分形式的映射方程进行伪随机变换,得到随机矩阵。
伪随机变换子单元具体为:
对一维差分形式的映射方程xq+1=u*xq*(1-xq)进行伪随机变换,其中xq表示映射方程得到混沌序列值,xq+1表示xq的后一个混沌序列值,xq∈(0,1),q=0,1,2…;u表示控制参数,u的取值范围为3.5999<u<4。设定一个初始值:x1,即q=1,并将x1作为密钥,本实施例2根据控制参数u和初始值x1对一维差分方程的映射方程进行计算,可以得到混沌序列xq。为了得到较为随机的随机矩阵,可选的:u=3.999,混沌序列数量q=4000。,已知初始值x1、控制参数u和混沌序列数量q=4000,可以计算出混沌序列x1,…,x4000。将得到的混沌序列x1,…,x4000的1×4000的矩阵改写成p×q的矩阵,得到随机矩阵B(p,q),其中p表示矩阵的行数,q表示矩阵的列数。
傅里叶变换子单元,用于对随机矩阵进行快速傅里叶变换,得到第一矩阵。
傅里叶变换子单元具体为:对随机矩阵B(p,q)进行快速傅里叶变换,得到第一矩阵Y(p,q)。
迭代子单元,用于利用小波梅林矩阵对第一矩阵进行迭代,得到第二矩阵。
迭代子单元具体为:
利用小波梅林矩阵X(q,p)对第一矩阵Y(p,q)进行迭代产生第二矩阵P(q,q)。其中第二矩阵P(q,q)中左边的q表示小波梅林矩阵X(q,p)中的q,第二矩阵P(q,q)中右边的q表示第一矩阵Y(p,q)中的q。
构造子单元,用于对第二矩阵进行重新构造生成第三矩阵。
构造子单元具体为:将q×q维的第二矩阵P(q,q)重新构造生成一个一行q2列的第三矩阵H(1,q2),并计算第三矩阵H(1,q2)的平均值为z。
哈希构造子单元,用于利用第三矩阵对原始文件进行哈希构造,得到第一哈希序列。
哈希构造子单元具体为:
利用第三矩阵H(1,q2)对原始文件进行哈希构造,生成第一哈希序列h={h(j)},其中j为哈希序列对应的位数,j=1,2…M,M为第一哈希序列的总长度。
二进制的哈希构造为:
用第三矩阵H(1,q2)的所有数据减去第三矩阵H(1,q2)的平均值z。若剩余数据大于0,则该行数据变为1;若剩余数据小于0,则该行数据变为0。
上式中H(j)表示第三矩阵H(1,q2)中第j位的数据,j为哈希序列对应的位数。
哈希索引单元,用于将第一哈希序列组成哈希索引并存储至系统哈希库,得到系统哈希索引表。
哈希索引单元具体为:
利用二进制的哈希构造方法对原始文件中的语音信号s(t)进行哈希构造,得到第一哈希序列h(j)。
然而对语音信号s(t)进行哈希构造的过程中会出现不同的信号数据带有相同的下标的情况,即冲突现象。针对这种情况,采用映射子单元。
哈希索引单元包括:
映射子单元,用于通过哈希函数将原始文件与第一哈希序列进行映射,生成哈希索引。
映射子单元包括:
将原始文件中的语音信号s(t)记做为U,通过哈希函数将U全部映射到系统哈希库的系统哈希表中,将映射到系统哈希表中的U记做为T。T[0,…,M-1]的槽位上的数据为:
h:U→{0,1,2,…,M-1} (6);
其中M为第一哈希序列的总长度。
按照公式(6)对原始文件中的所有语音信号进行操作,当遍历完原始文件中的所有语音信号后,哈希索引建立完成。
存储子单元,用于将哈希索引存储至系统哈希表中,得到系统哈希索引表。
图3为本发明实施例2所提供的语音检索系统的系统结构图。参见图3,一种语音检索系统包括:
查询语音获取模块201,用于获取查询语音。获取用户提交的查询语音信号S1。
提取模块202,用于提取查询语音的第二哈希序列。
提取模块202具体包括:利用哈希构造子单元对查询语音信号S1进行哈希构造,生成查询语音信号S1的第二哈希序列。
匹配模块203,用于将第二哈希序列与建立的系统哈希索引表中所有的第一哈希序列进行匹配,得到与第二哈希序列匹配的第一哈希序列。
匹配模块203,包括:
比较单元,用于将第二哈希序列和系统哈希索引表中的所有第一哈希序列的汉明距离与设定阈值进行比较。
比较单元具体为:
将查询语音信号S1的第二哈希序列h1和密文语音库中的所有语音信号S={S(e)}对应的系统哈希索引表h(e’)中的第一哈希序列h={h(j)}的汉明距离与设定阈值进行比较。其中,e表示密文语音库中第e段语音片段,e=1,2…E,E为密文语音库中所有语音信号的总片段数;h(e’)表示系统哈希索引表,包括所有语音信号S={S(e)}对应的第一哈希序列h={h(j)},e’=1,2…E,E为系统哈希索引表中所有语音的总片段数,h表示系统哈希索引表中所有语音信号片段产生的第一哈希序列。
匹配单元,用于当第二哈希序列和第一哈希序列的汉明距离小于或等于设定阈值时,得到与第二哈希序列匹配的第一哈希序列。
匹配单元具体为:当h1和第一哈希序列h={h(j)}的汉明距离小于或者等于阈值时,则表示检索成功,得到与第二哈希序列匹配的第一哈希序列。具体汉明距离的匹配过程为:
式(7)中h1为查询语音信号S1的第二哈希序列的哈希值;h2(j)为密文语音库中任意语音信号S2的第一哈希序列的哈希值;hd为h1和h2(j)的归一化汉明距离DH(:,:),即比特误码率(BitErrorRate,BER),表示哈希值的错误比特数与总比特数的比值。DH(S1,S2)为语音信号S1和S2的比特误码率(BER)。
采用BER的假设检验来对哈希匹配进行描述:
1)如果查询语音信号S1和密文语音库中的语音信号S2的内容相同,则
DH(S1,S2)≤τ (8)
2)如果查询语音信号S1和密文语音库中的语音信号S2的内容不相同,则
DH(S1,S2)>τ (9)
其中,τ为检索阈值。
通过设置匹配阈值τ的大小,比较S1和S2的哈希序列的数学距离。若查询语音信号S1和密文语音库中的语音信号S2的数学距离DH≤τ,则认为两个语音信号S1和S2的内容相同,检索成功。
在语音不经过噪声处理的条件下,当阈值τ=0时,表示查询语音S1和密文语音库中的语音信号S2的内容相同,检索成功。
获取模块204,用于在建立的密文语音库中根据第一哈希序列获取原始文件。具体为:当检索成功时为用户返回密文语音库中的第一哈希序列所对应的原始文件。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
Claims (8)
1.一种语音检索方法,其特征在于,包括:
获取查询语音;
提取所述查询语音的第二哈希序列;
将所述第二哈希序列与建立的系统哈希索引表进行匹配,得到与所述第二哈希序列匹配的第一哈希序列;
在建立的密文语音库中根据所述第一哈希序列获取原始文件;
建立密文语音库包括:
获取原始文件;
对所述原始文件进行加密,得到加密文件并将所述加密文件上传至云端的语音库,得到所述密文语音库;
建立系统哈希索引表包括:
对所述原始文件进行特征提取,得到所述原始文件的第一哈希序列;
所述对所述原始文件进行特征提取,得到所述原始文件的第一哈希序列,包括:
对所述原始文件进行预处理,得到预处理信号;
对所述预处理信号进行离散余弦变换,得到小波分解低频系数;
对所述小波分解低频系数进行离散小波变换,得到小波梅林矩阵;
对一维差分形式的映射方程进行伪随机变换,得到随机矩阵;
对所述随机矩阵进行快速傅里叶变换,得到第一矩阵;
利用所述小波梅林矩阵对所述第一矩阵进行迭代,得到第二矩阵;
对所述第二矩阵进行重新构造生成第三矩阵;
利用所述第三矩阵对所述原始文件进行哈希构造,得到所述第一哈希序列;
将所述第一哈希序列组成哈希索引并存储至所述云端的系统哈希库,得到所述系统哈希索引表。
2.根据权利要求1所述的语音检索方法,其特征在于,所述对所述原始文件进行加密,得到加密文件并将所述加密文件上传至云端的语音库,得到所述密文语音库,包括:采用二维混沌映射加密算法对所述原始文件进行加密,得到加密文件并将所述加密文件上传至云端的语音库,得到所述密文语音库。
3.根据权利要求1所述的语音检索方法,其特征在于,所述将所述第一哈希序列组成哈希索引并存储至所述云端的系统哈希库,得到所述系统哈希索引表,包括:
通过哈希函数将所述原始文件与所述第一哈希序列进行映射,生成所述哈希索引;
将所述哈希索引存储至所述系统哈希库,得到所述系统哈希索引表。
4.根据权利要求1所述的语音检索方法,其特征在于,所述将所述第二哈希序列与建立的系统哈希索引表进行匹配,得到与所述第二哈希序列匹配的第一哈希序列,包括:
将所述第二哈希序列和所述系统哈希索引表中的所有所述第一哈希序列的汉明距离与设定阈值进行比较;
当所述第二哈希序列和所述第一哈希序列的汉明距离小于或等于设定阈值时,得到与所述第二哈希序列匹配的所述第一哈希序列。
5.一种语音检索系统,其特征在于,包括:
查询语音获取模块,用于获取查询语音;
提取模块,用于提取所述查询语音的第二哈希序列;
匹配模块,用于将所述第二哈希序列与建立的系统哈希索引表进行匹配,得到与所述第二哈希序列匹配的第一哈希序列;
获取模块,用于在建立的密文语音库中根据所述第一哈希序列获取原始文件;
密文语音库建立模块,用于建立密文语音库;
密文语音库建立模块包括:
原始文件获取单元,用于获取原始文件;
加密单元,用于对所述原始文件进行加密,得到加密文件并将所述加密文件上传至云端的语音库,得到所述密文语音库;
系统哈希索引表建立模块,用于建立系统哈希索引表;
系统哈希索引表建立模块包括:
特征提取单元,用于对所述原始文件进行特征提取,得到所述原始文件的第一哈希序列;
所述特征提取单元,包括:
预处理子单元,用于对所述原始文件进行预处理,得到预处理信号;
离散余弦变换子单元,用于对所述预处理信号进行离散余弦变换,得到小波分解低频系数;
离散小波变换子单元,用于对所述小波分解低频系数进行离散小波变换,得到小波梅林矩阵;
伪随机变换子单元,用于对一维差分形式的映射方程进行伪随机变换,得到随机矩阵;
傅里叶变换子单元,用于对所述随机矩阵进行快速傅里叶变换,得到第一矩阵;
迭代子单元,用于利用所述小波梅林矩阵对所述第一矩阵进行迭代,得到第二矩阵;
构造子单元,用于对所述第二矩阵进行重新构造生成第三矩阵;
哈希构造子单元,用于利用所述第三矩阵对所述原始文件进行哈希构造,得到所述第一哈希序列;
哈希索引单元,用于将所述第一哈希序列组成哈希索引并存储至所述云端的系统哈希库,得到所述系统哈希索引表。
6.根据权利要求5所述的语音检索系统,其特征在于,所述加密单元,包括:
加密子单元,用于采用二维混沌映射加密算法对所述原始文件进行加密,得到加密文件并将所述加密文件上传至云端的语音库,得到所述密文语音库。
7.根据权利要求5所述的语音检索系统,其特征在于,所述哈希索引单元,包括:
映射子单元,用于通过哈希函数将所述原始文件与所述第一哈希序列进行映射,生成所述哈希索引;
存储子单元,用于将所述哈希索引存储至所述系统哈希库,得到所述系统哈希索引表。
8.根据权利要求5所述的语音检索系统,其特征在于,所述匹配模块,包括:
比较单元,用于将所述第二哈希序列和所述系统哈希索引表中的所有所述第一哈希序列的汉明距离与设定阈值进行比较;
匹配单元,用于当所述第二哈希序列和所述第一哈希序列的汉明距离小于或等于设定阈值时,得到与所述第二哈希序列匹配的所述第一哈希序列。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910500492.3A CN110211608B (zh) | 2019-06-11 | 2019-06-11 | 一种语音检索方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910500492.3A CN110211608B (zh) | 2019-06-11 | 2019-06-11 | 一种语音检索方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110211608A CN110211608A (zh) | 2019-09-06 |
CN110211608B true CN110211608B (zh) | 2021-05-28 |
Family
ID=67791842
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910500492.3A Active CN110211608B (zh) | 2019-06-11 | 2019-06-11 | 一种语音检索方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110211608B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111897909B (zh) * | 2020-08-03 | 2022-08-05 | 兰州理工大学 | 一种基于深度感知哈希的密文语音检索方法及系统 |
CN112035700B (zh) * | 2020-08-31 | 2022-09-13 | 兰州理工大学 | 一种基于cnn的语音深度哈希学习方法及系统 |
CN112967724B (zh) * | 2021-02-01 | 2022-06-14 | 西北师范大学 | 一种基于特征融合的长序列生物哈希认证方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104835499A (zh) * | 2015-05-13 | 2015-08-12 | 西南交通大学 | 基于时-频域趋势变化的密文语音感知哈希及检索方案 |
CN109036439A (zh) * | 2018-08-24 | 2018-12-18 | 兰州理工大学 | 一种加密语音信号的感知哈希特征提取方法及系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9940930B1 (en) * | 2016-12-07 | 2018-04-10 | Google Llc | Securing audio data |
-
2019
- 2019-06-11 CN CN201910500492.3A patent/CN110211608B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104835499A (zh) * | 2015-05-13 | 2015-08-12 | 西南交通大学 | 基于时-频域趋势变化的密文语音感知哈希及检索方案 |
CN109036439A (zh) * | 2018-08-24 | 2018-12-18 | 兰州理工大学 | 一种加密语音信号的感知哈希特征提取方法及系统 |
Non-Patent Citations (1)
Title |
---|
密文语音检索与基于可恢复水印的语音认证研究;林蓝;《中国优秀硕士学位论文全文数据库信息科技辑》;20160115;第I138卷(第2016/01期);第6页第2段,第24页第1-4段 * |
Also Published As
Publication number | Publication date |
---|---|
CN110211608A (zh) | 2019-09-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110211608B (zh) | 一种语音检索方法及系统 | |
US9158842B1 (en) | Sound representation via winner-take-all coding of auditory spectra | |
CN111444967B (zh) | 生成对抗网络的训练方法、生成方法、装置、设备及介质 | |
CN102157154B (zh) | 基于音频内容的非均匀离散余弦变换音频可靠性认证方法 | |
CN104835499B (zh) | 基于时‑频域趋势变化的密文语音感知哈希及检索方案 | |
US10217469B2 (en) | Generation of a signature of a musical audio signal | |
Zhang et al. | A retrieval algorithm of encrypted speech based on short-term cross-correlation and perceptual hashing | |
CN111897909B (zh) | 一种基于深度感知哈希的密文语音检索方法及系统 | |
WO2023134549A1 (zh) | 编码器的生成方法、指纹提取方法、介质及电子设备 | |
Zhang et al. | Histogram-based retrieval for encrypted JPEG images | |
CN110059218A (zh) | 一种基于快速傅里叶逆变换的语音检索方法及系统 | |
CN108366072B (zh) | 一种支持语音加密搜索的云存储方法 | |
Li et al. | Audio perceptual hashing based on nmf and mdct coefficients | |
Kong et al. | Adversarial audio: A new information hiding method and backdoor for dnn-based speech recognition models | |
Zhao et al. | A retrieval algorithm for encrypted speech based on perceptual hashing | |
Zhang et al. | An encrypted speech retrieval algorithm based on Chirp-Z transform and perceptual hashing second feature extraction | |
Zhang et al. | Content-based encrypted speech retrieval scheme with deep hashing | |
Norouzi Larki et al. | Quantum Audio Steganalysis Based on Quantum Fourier Transform and Deutsch–Jozsa Algorithm | |
Daoui et al. | New method for bio-signals zero-watermarking using quaternion shmaliy moments and short-time fourier transform | |
CN104637484A (zh) | 一种基于共生矩阵分析的mp3音频隐写检测方法 | |
Zhang et al. | Searchable encryption over encrypted speech retrieval scheme in cloud storage | |
Chen et al. | Audio retrieval based on wavelet transform | |
JP6271092B2 (ja) | 信号の埋め込みを生成する方法およびシステム | |
JP2003281190A (ja) | 汎用データ検索方法 | |
Zhang et al. | One-factor cancelable fingerprint template protection based on feature enhanced hashing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |