CN110211608B

CN110211608B - 一种语音检索方法及系统

Info

Publication number: CN110211608B
Application number: CN201910500492.3A
Authority: CN
Inventors: 张秋余; 李改莉; 胡颖杰; 李昱洲; 张登海; 韩继田; 张永兵
Original assignee: Lanzhou University of Technology
Current assignee: Lanzhou University of Technology
Priority date: 2019-06-11
Filing date: 2019-06-11
Publication date: 2021-05-28
Anticipated expiration: 2039-06-11
Also published as: CN110211608A

Abstract

本发明公开了一种语音检索方法及系统，涉及语音检索技术领域。该方法包括：获取查询语音；提取查询语音的第二哈希序列；将第二哈希序列与建立的系统哈希索引表进行匹配，得到与第二哈希序列匹配的第一哈希序列；在建立的密文语音库中根据第一哈希序列获取原始文件；建立密文语音库；建立系统哈希索引表。该方法借鉴生物哈希技术，对原始语音进行特征提取，获取原始语音的第一哈希序列，将第一哈希序列作为检索摘要，通过比较第一哈希序列和查询语音的第二哈希序列的汉明距离，完成检索内容的匹配。该方法通过采用生物哈希技术提取语音的哈希摘要，提高了语音哈希摘要的安全性。

Description

一种语音检索方法及系统

技术领域

本发明涉及语音检索技术领域，特别是涉及一种语音检索方法及系统。

背景技术

面对海量的多媒体数据，如何保证用户的数据安全，如何在数据安全的条件下准确、快速地从海量数据中检索到所需内容等，一直是多媒体检索研究领域的热点问题。尤其是在语音上传到云端之前，对语音数据进行加密来确保敏感语音数据的安全，但是加密的数据会失去语音的固有特性，对检索也会造成影响。因此，在加密的语音数据中快速、准确的检索到自己需要的数据将是亟待解决的问题。

目前，语音检索方法主要包括：文本检索、内容检索、语义检索，其中基于内容的检索是研究的热点，基于内容的检索方法主要有：多关键词检索、模糊检索和排序检索。语音特征提取方法主要包括：感知哈希、音频指纹和生物哈希等方法。基于这些检索方法和特征提取方法，国内外学者在基于内容的多媒体密文检索方面取得了很好的研究成果。然而现有方法虽然考虑了云端语音数据的安全性，但没有考虑检索哈希摘要的安全性等问题。因此，现有检索方法还存在哈希摘要的安全性低的问题。

发明内容

本发明的目的是提供一种语音检索方法及系统，解决了现有检索方法的哈希摘要的安全性低的问题。

为实现上述目的，本发明提供了如下方案：

一种语音检索方法，包括：

获取查询语音；

提取所述查询语音的第二哈希序列；

将所述第二哈希序列与建立的系统哈希索引表进行匹配，得到与所述第二哈希序列匹配的第一哈希序列；

在建立的密文语音库中根据所述第一哈希序列获取原始文件；

建立密文语音库包括：

获取原始文件；

对所述原始文件进行加密，得到加密文件并将所述加密文件上传至云端的语音库，得到所述密文语音库；

建立系统哈希索引表包括：

对所述原始文件进行特征提取，得到所述原始文件的第一哈希序列；

将所述第一哈希序列组成哈希索引并存储至所述云端的系统哈希库，得到所述系统哈希索引表。

可选的，所述对所述原始文件进行加密，得到加密文件并将所述加密文件上传至云端的语音库，得到所述密文语音库，包括：采用二维混沌映射加密算法对所述原始文件进行加密，得到加密文件并将所述加密文件上传至云端的语音库，得到所述密文语音库。

可选的，所述对所述原始文件进行特征提取，得到所述原始文件的第一哈希序列，包括：

对所述原始文件进行预处理，得到预处理信号；

对所述预处理信号进行离散余弦变换，得到小波分解低频系数；

对所述小波分解低频系数进行离散小波变换，得到小波梅林矩阵；

对一维差分形式的映射方程进行伪随机变换，得到随机矩阵；

对所述随机矩阵进行快速傅里叶变换，得到第一矩阵；

利用所述小波梅林矩阵对所述第一矩阵进行迭代，得到所述第二矩阵；

对所述第二矩阵进行重新构造生成第三矩阵；

利用所述第三矩阵对所述原始文件进行哈希构造，得到所述第一哈希序列。

可选的，所述将所述第一哈希序列组成哈希索引并存储至所述云端的系统哈希库，得到所述系统哈希索引表，包括：

通过哈希函数将所述原始文件与所述第一哈希序列进行映射，生成所述哈希索引；

将所述哈希索引存储至所述系统哈希库，得到所述系统哈希索引表。

可选的，所述将所述第二哈希序列与建立的系统哈希索引表进行匹配，得到与所述第二哈希序列匹配的第一哈希序列，包括：

将所述第二哈希序列和所述系统哈希索引表中的所有所述第一哈希序列的汉明距离与设定阈值进行比较；

当所述第二哈希序列和所述第一哈希序列的汉明距离小于或等于设定阈值时，得到与所述第二哈希序列匹配的所述第一哈希序列。

一种语音检索系统，包括：

查询语音获取模块，用于获取查询语音；

提取模块，用于提取所述查询语音的第二哈希序列；

匹配模块，用于将所述第二哈希序列与建立的系统哈希索引表进行匹配，得到与所述第二哈希序列匹配的第一哈希序列；

获取模块，用于在建立的密文语音库中根据所述第一哈希序列获取原始文件；

密文语音库建立模块，用于建立密文语音库；

密文语音库建立模块包括：

原始文件获取单元，用于获取原始文件；

加密单元，用于对所述原始文件进行加密，得到加密文件并将所述加密文件上传至云端的语音库，得到所述密文语音库；

系统哈希索引表建立模块，用于建立系统哈希索引表；

系统哈希索引表建立模块包括：

特征提取单元，用于对所述原始文件进行特征提取，得到所述原始文件的第一哈希序列；

哈希索引单元，用于将所述第一哈希序列组成哈希索引并存储至所述云端的系统哈希库，得到所述系统哈希索引表。

可选的，所述加密单元，包括：

加密子单元，用于采用二维混沌映射加密算法对所述原始文件进行加密，得到加密文件并将所述加密文件上传至云端的语音库，得到所述系统哈希索引表。

可选的，所述特征提取单元，包括：

预处理子单元，用于对所述原始文件进行预处理，得到预处理信号；

离散余弦变换子单元，用于对所述预处理信号进行离散余弦变换，得到小波分解低频系数；

离散小波变换子单元，用于对所述小波分解低频系数进行离散小波变换，得到小波梅林矩阵；

伪随机变换子单元，用于对一维差分形式的映射方程进行伪随机变换，得到随机矩阵；

傅里叶变换子单元，用于对所述随机矩阵进行快速傅里叶变换，得到第一矩阵；

迭代子单元，用于利用所述小波梅林矩阵对所述第一矩阵进行迭代，得到所述第二矩阵；

构造子单元，用于对所述第二矩阵进行重新构造生成第三矩阵；

哈希构造子单元，用于利用所述第三矩阵对所述原始文件进行哈希构造，得到所述第一哈希序列。

可选的，所述哈希索引单元，包括：

映射子单元，用于通过哈希函数将所述原始文件与所述第一哈希序列进行映射，生成所述哈希索引；

存储子单元，用于将所述哈希索引存储至所述系统哈希库，得到所述系统哈希索引表。

可选的，所述匹配模块，包括：

比较单元，用于将所述第二哈希序列和所述系统哈希索引表中的所有所述第一哈希序列的汉明距离与设定阈值进行比较；

匹配单元，用于当所述第二哈希序列和所述第一哈希序列的汉明距离小于或等于设定阈值时，得到与所述第二哈希序列匹配的所述第一哈希序列。

根据本发明提供的具体实施例，本发明公开了以下技术效果：

本发明提供一种语音检索方法及系统，该方法包括：获取查询语音；提取查询语音的第二哈希序列；将第二哈希序列与建立的系统哈希索引表进行匹配，得到与第二哈希序列匹配的第一哈希序列；在建立的密文语音库中根据第一哈希序列获取原始文件；建立密文语音库，建立密文语音库包括：获取原始文件；对原始文件进行加密，得到加密文件并将加密文件上传至云端语音库，得到密文语音库；建立系统哈希索引表，建立系统哈希索引表包括：对原始文件进行特征提取，得到第一哈希序列；将第一哈希序列组成哈希索引并存储至云端的系统哈希库，得到系统哈希索引表。该方法借鉴生物哈希技术，对语音进行特征提取，获取语音的第一哈希序列，将第一哈希序列作为检索摘要，通过比较第一哈希序列和第二哈希序列的汉明距离，完成检索内容的匹配。该方法通过采用生物哈希技术提取原始语音和查询语音的哈希摘要，提高了语音哈希摘要的安全性。该方法在哈希构造方面可对常见的WAV、MP3、FLAC、OGG和M4A等5种不同格式语音文件数据进行处理，通过对5种不同格式混合而成的2000段音频进行特征提取和检索结果的实验结果来看，该方法具有很好的鲁棒性和区分性，且提高了检索效率和检索精确度。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例1所提供的语音检索方法的流程图；

图2为本发明实施例1所提供的语音检索方法的离散小波变换原理图；

图3为本发明实施例2所提供的语音检索系统的系统结构图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本发明作进一步详细的说明。

实施例1

本实施例提供一种语音检索方法。在进行语音检索之前需要在云端建立密文语音库和系统哈希索引表。

建立密文语音库包括：

1、获取原始文件。原始文件包括语音信号s(t)。

2、对原始文件进行加密，得到加密文件并将加密文件上传至云端的语音库，得到密文语音库。具体包括：采用二维混沌映射加密算法对原始文件进行加密，得到加密文件并将加密文件上传至云端的语音库，得到密文语音库。

采用二维混沌映射加密算法对原始文件进行加密具体包括：

设定两个初始值：当k＝1时，x_k-1＝1.0，x_k＝1.2。通过二维混沌(Henon)映射公式的差分方程：x_k+1＝1-a*x_k ²+0.3x_k-1产生关于x_k的混沌序列，其中x_k为差分方程得到混沌序列值，x_k-1为x_k的前一个混沌序列值，x_k+1为x_k的后一个混沌序列值，k为正整数，0<a<0.35。本发明实施例1中可选的a＝0.2，然后根据公式(1)产生一个混合序列c_i。

利用混合序列c_i对原始文件的语音信号s(t)进行加密，得到加密语音S(t)，即加密文件。具体为：利用混合序列c_i对语音加密。当x_k的取值范围为[-0.5,1.5]时，根据混合序列c_i将x_k二值化为0和1，然后对x_k进行异或运算。当x_k的取值范围为[-1.5,-0.5]时，根据混合序列c_i将x_k转化为2，然后对x_k进行模相减运算。最后，根据转化后的x_k得到加密语音S(t)，即加密文件。

建立系统哈希索引表包括：

1、对原始文件进行特征提取，得到原始文件的第一哈希序列。具体包括：

对原始文件进行预处理，得到预处理信号。具体为：

对原始文件中的语音信号s(t)进行预加重处理得到预处理信号s’(t)。这样有利于提升信号的高频有用部分，并且还利于后续的特征提取。其中语音信号s(t)的采样频率16kHz，声道数为单声道，采样精度为16位。

对预处理信号进行离散余弦变换，得到小波分解低频系数。具体为：

对预处理信号s’(t)进行三阶离散余弦变换(Discrete Wavelet Transform，离散余弦变换)变换，得到小波分解低频系数L(z)＝{L_i}，其中L_i为第i阶分解的低频系数；i为分解的低频系数的阶数，i＝1,2,…N；N为低频分解系数长度。将小波分解低频系数L(z)记做A。

小波分解的意义在于能够在尺度参数a的离散化和位移参数b的离散化上对信号进行分解，而且不同尺度的选择可以根据不同的目标来进行确定。对于许多信号而言，信号中的低频成分相当重要，低频成分常常蕴含着信号的特征；而信号中的高频成分则给出了信号的细节或差别。语音信号如果去掉高频成分，听起来与以前可能不同，但仍能知道所说的内容；如果去掉足够的低频成分，则听到的是一些没有意义的声音。在小波分析中经常用到近似与细节，其中近似表示信号的高尺度，即低频信息。

对小波分解低频系数进行离散小波变换，得到小波梅林矩阵。具体为：

对预处理信号s’(t)中的待分析信号f(t)进行离散小波变换。离散小波变换为待分析信号f(t)在母小波φ(t)下进行的变换，且待分析信号f(t)属于任意能量有限空间，所以也称这种变换为待分析信号f(t)的连续小波变换。

离散小波变换是对基本小波的尺度和平移进行离散化。在运用中，首先需要对尺度因子a和位移因子b进行离散化处理，如公式(2)：

a＝a₀ ^m,b＝nb₀a₀ ^m (2)

其中，m，n为固定的整数，m＝0,±1,±2,±3…；n＝0,±1±2…；幂底数基底a₀为大于1的固定常数，a₀的取值反映了尺度离散化的程度；b₀为大于0的固定常数，b₀表示位移因子b的离散化间隔。尺度因子a和位移因子b的选值与母小波φ(t)的具体形式有关。

离散小波变换表示为：

其中<*,*>表示内积，*表示复数共轭，w_f(m,n)表示f(t)的离散小波变换；φ_m,n(t)表示小波基，小波基为母小波φ(t)经过移位和伸缩所产生的一组函数；

表示小波基的复数共轭。

离散小波变换函数表示为：

其中，

表示对母小波φ(t)进行尺度变换和平移变换后得到的函数；

表示对母小波φ(t)进行尺度变换和位移变换的离散化处理后得到的函数；t表示函数变量。

当a₀＝2，b₀＝1时，离散小波变换称为二进制离散小波变换。

图2为本发明实施例1所提供的语音检索方法的离散小波变换原理图。参见图2，图2还表示如何利用阶层架构对一个离散信号进行离散小波变换的原理。对语音信号s(t)进行离散化得到离散语音输入信号S[n]，S[n]为长度为N的离散语音输入信号；G[n]表示低通滤波器，可以将输入信号的高频部份滤掉而输出低频部份；H[n]表示高通滤波器，与低通滤波器相反，可以将输入信号的低频部份滤掉而输出高频部份；↓2表示降采样滤波器。当S[n]作为输入时，则输出S_L[n]或S_H[n]，其中S_H[n]为S[n]作为输入经过低通滤波器和降采样滤波器得到的语音信号的高频部分；S_L[n]为S[n]作为输入经过低通滤波器和降采样滤波器得到的语音信号的低频部分。

利用得到的低频部分S_L[n]即可将小波分解低频系数A构造成小波梅林矩阵X(q,p)。将小波分解低频系数A构造成小波梅林矩阵X(q,p)，便于与之后一维混沌(logistic)映射生成的矩阵进行迭代。利用离散小波变换还可以构造生物特征向量产生检索摘要。

对一维差分形式的映射方程进行伪随机变换，得到随机矩阵。具体为：

对一维差分形式的映射方程x_q+1＝u*x_q*(1-x_q)进行伪随机变换，其中x_q表示映射方程得到混沌序列值，x_q+1表示x_q的后一个混沌序列值，x_q∈(0,1)，q＝0,1,2…；u表示控制参数，u的取值范围为3.5999<u<4。设定一个初始值：x₁，即q＝1，并将x₁作为密钥，本实施例1根据控制参数u和初始值x₁对一维差分方程的映射方程进行计算，可以得到混沌序列x_q。为了得到较为随机的随机矩阵，可选的：u＝3.999，混沌序列数量q＝4000。已知初始值x₁、控制参数u和混沌序列数量q＝4000，可以计算出混沌序列x₁,…,x₄₀₀₀。将得到的混沌序列x₁,…,x₄₀₀₀的1×4000的矩阵改写成p×q的矩阵，得到随机矩阵B(p,q)，其中p表示矩阵的行数，q表示矩阵的列数。

对随机矩阵进行快速傅里叶变换，得到第一矩阵。具体为：对随机矩阵B(p,q)进行快速傅里叶变换，得到第一矩阵Y(p,q)。

利用小波梅林矩阵对第一矩阵进行迭代，得到第二矩阵。具体为：

利用小波梅林矩阵X(q,p)对第一矩阵Y(p,q)进行迭代产生第二矩阵P(q,q)。其中第二矩阵P(q,q)中左边的q表示小波梅林矩阵X(q,p)中的q，第二矩阵P(q,q)中右边的q表示第一矩阵Y(p,q)中的q。

对第二矩阵进行重新构造生成第三矩阵。具体为：将q×q维的第二矩阵P(q,q)重新构造生成一个一行q²列的第三矩阵H(1,q²)，并计算第三矩阵H(1,q²)的平均值为z。

利用第三矩阵对原始文件进行哈希构造，得到第一哈希序列。具体为：

利用第三矩阵H(1,q²)对原始文件进行哈希构造，生成第一哈希序列h＝{h(j)}，其中j为哈希序列对应的位数，j＝1,2…M，M为第一哈希序列的总长度。

二进制的哈希构造方法为：

用第三矩阵H(1,q²)的所有数据减去第三矩阵H(1,q²)的平均值z。若剩余数据大于0，则该行数据变为1；若剩余数据小于0，则该行数据变为0。

上式中H(j)表示第三矩阵H(1,q²)中第j位的数据，j为哈希序列对应的位数。

2、将第一哈希序列组成哈希索引并存储至系统哈希库，得到系统哈希索引表。包括：

通过哈希函数将原始文件与第一哈希序列进行映射，生成哈希索引，具体为：

利用二进制的哈希构造方法对原始文件中的语音信号s(t)进行哈希构造，得到第一哈希序列h(j)。

然而对语音信号s(t)进行哈希构造的过程中会出现不同的信号数据带有相同的下标的情况，即冲突现象。针对这种情况，可以将第一个得到此下标的信号数据作为一个链表的结点，然后将所有得到相同下标的信号数据存储于链表中，具体过程如下：

将原始文件中的语音信号s(t)记做为U，通过哈希函数将U全部映射到系统哈希库的系统哈希表中，将映射到系统哈希表中的U记做为T。T[0，…，M-1]的槽位上的数据为：

h:U→{0,1,2,…,M-1} (6)；

其中M为第一哈希序列的总长度。

按照公式(6)对原始文件中的所有语音信号进行操作，当遍历完原始文件中的所有语音信号后，哈希索引建立完成。上述映射方法同时也将语音信号按照哈希索引的形式有效的组织起来，为检索奠定了基础。

将哈希索引存储至系统哈希表中，得到系统哈希索引表。

图1为本发明实施例1所提供的语音检索方法的流程图。参见图1，一种语音检索方法包括：

步骤101，获取查询语音。获取用户提交的查询语音信号S₁。

步骤102，提取查询语音的第二哈希序列。

步骤102具体包括：利用建立系统哈希索引表步骤中的第三矩阵H(1,n²)对查询语音信号S₁进行哈希构造，生成查询语音信号S₁的第二哈希序列。

步骤103，将第二哈希序列与建立的系统哈希索引表中所有的第一哈希序列进行匹配，得到与第二哈希序列匹配的第一哈希序列。

步骤103具体包括：

将第二哈希序列和系统哈希索引表中的所有第一哈希序列的汉明距离与设定阈值进行比较。具体为：

将查询语音信号S₁的第二哈希序列h₁和密文语音库中的所有语音信号S＝{S(e)}对应的系统哈希索引表h(e’)中的第一哈希序列h＝{h(j)}的汉明距离与设定阈值进行比较。其中，e表示密文语音库中第e段语音片段，e＝1,2…E，E为密文语音库中所有语音信号的总片段数；h(e’)表示系统哈希索引表，包括所有语音信号S＝{S(e)}对应的第一哈希序列h＝{h(j)}，e’＝1,2…E，E为系统哈希索引表中所有语音的总片段数，h表示系统哈希索引表中所有语音信号片段产生的第一哈希序列。

当第二哈希序列和第一哈希序列的汉明距离小于或等于设定阈值时，得到与第二哈希序列匹配的第一哈希序列。

具体为：当h₁和第一哈希序列h＝{h(j)}的汉明距离小于或者等于阈值时，则表示检索成功，得到与第二哈希序列匹配的第一哈希序列。具体汉明距离的匹配过程为：

式(7)中h₁为查询语音信号S₁的第二哈希序列的哈希值；h₂(j)为密文语音库中任意语音信号S₂的第一哈希序列的哈希值；hd为h₁和h₂(j)的归一化汉明距离DH(:，:)，即比特误码率(BitErrorRate，BER)，表示哈希值的错误比特数与总比特数的比值。DH(S₁,S₂)为语音信号S₁和S₂的比特误码率(BER)。

采用BER的假设检验来对哈希匹配进行描述：

1)如果查询语音信号S₁和密文语音库中的语音信号S₂的内容相同，则

DH(S₁,S₂)≤τ (8)

2)如果查询语音信号S₁和密文语音库中的语音信号S₂的内容不相同，则

DH(S₁,S₂)＞τ (9)

其中，τ为检索阈值。

通过设置匹配阈值τ的大小，比较S₁和S₂的哈希序列的数学距离。若查询语音信号S₁和密文语音库中的语音信号S₂的数学距离DH≤τ，则认为两个语音信号S₁和S₂的内容相同，检索成功。

在语音不经过噪声处理的条件下，当阈值τ＝0时，表示查询语音信号S₁和密文语音库中的语音信号S₂的内容相同，检索成功。

步骤104，在建立的密文语音库中根据第一哈希序列获取原始文件。具体为：当检索成功时为用户返回密文语音库中的第一哈希序列所对应的原始文件。

检索阶段是语音检索方法中最重要的部分，为了防止造成数据不必要的损失，所以在语音数据上传云端之前先对语音数据加密。

本发明实施例1语音检索方法借鉴生物哈希技术，对语音进行特征提取，获取语音的第一哈希序列，将第一哈希序列作为检索摘要，通过比较第一哈希序列和第二哈希序列的汉明距离，完成检索内容的匹配，提高了哈希摘要的安全性。该方法在哈希构造方面可对常见的WAV、MP3、FLAC、OGG和M4A等5种不同格式语音文件数据进行处理，通过对5种不同格式混合而成的2000段音频进行特征提取和检索结果的实验结果来看，该方法具有很好的鲁棒性和区分性，且提高了检索效率和检索精确度。

实施例2

本实施例提供一种语音检索系统。在进行语音检索之前需要先建立密文语音库和系统哈希索引表，所以先执行密文语音库建立模块和系统哈希索引表建立模块。

密文语音库建立模块，用于建立密文语音库。

密文语音库建立模块包括：

原始文件获取单元，用于获取原始文件。原始文件包括语音信号s(t)。

加密单元，用于对原始文件进行加密，得到加密文件并将加密文件上传至云端的语音库，得到密文语音库。

加密单元，包括：

加密子单元，用于采用二维混沌映射加密算法对原始文件进行加密，得到加密文件并将加密文件上传至云端的语音库，得到密文语音库。

加密子单元的采用二维混沌映射加密算法对原始文件进行加密具体包括：

设定两个初始值：当k＝1时，x_k-1＝1.0，x_k＝1.2。通过二维混沌(Henon)映射公式的差分方程：x_k+1＝1-a*x_k ²+0.3x_k-1产生关于x_k的混沌序列，其中x_k为差分方程得到混沌序列值，x_k-1为x_k的前一个混沌序列值，x_k+1为x_k的后一个混沌序列值，k为正整数，0<a<0.35。本发明实施例2中可选的a＝0.2，然后根据公式(1)产生一个混合序列c_i。

利用混合序列c_i对原始文件的语音信号s(t)进行加密，得到加密语音S(t)，即加密文件。具体为：利用混合序列c_i对语音加密，当x_k的取值范围为[-0.5,1.5]时，根据混合序列c_i将x_k二值化为0和1，然后对x_k进行异或运算。当x_k的取值范围为[-1.5,-0.5]时，根据混合序列c_i将x_k转化为2，然后对x_k进行模相减运算。最后，根据转化后的x_k得到加密语音S(t)，即加密文件。

系统哈希索引表建立模块，用于建立云端的系统哈希索引表。

系统哈希索引表建立模块包括：

特征提取单元，用于对原始文件进行特征提取，得到原始文件的第一哈希序列。

特征提取单元，包括：

预处理子单元，用于对原始文件进行预处理，得到预处理信号。

预处理子单元具体包括：

离散余弦变换子单元，用于对预处理信号进行离散余弦变换，得到小波分解低频系数。

离散余弦变换子单元具体包括：

离散小波变换子单元，用于对小波分解低频系数进行离散小波变换，得到小波梅林矩阵。

离散小波变换子单元具体包括：

a＝a₀ ^m,b＝nb₀a₀ ^m (2)

离散小波变换表示为：

表示小波基的复数共轭。

离散小波变换函数表示为：

其中，

表示对母小波φ(t)进行尺度变换和平移变换后得到的函数；

对语音信号s(t)进行离散化得到离散语音输入信号S[n]，S[n]为长度为N的离散语音输入信号；低通滤波器G[n]可以将输入信号的高频部份滤掉而输出低频部份；高通滤波器H[n]，与低通滤波器相反，可以将输入信号的低频部份滤掉而输出高频部份。当S[n]作为输入时，则输出S_L[n]或S_H[n]，其中S_H[n]为S[n]作为输入经过低通滤波器和降采样滤波器得到的语音信号的高频部分；S_L[n]为S[n]作为输入经过低通滤波器和降采样滤波器得到的语音信号的低频部分。

伪随机变换子单元，用于对一维差分形式的映射方程进行伪随机变换，得到随机矩阵。

伪随机变换子单元具体为：

对一维差分形式的映射方程x_q+1＝u*x_q*(1-x_q)进行伪随机变换，其中x_q表示映射方程得到混沌序列值，x_q+1表示x_q的后一个混沌序列值，x_q∈(0,1)，q＝0,1,2…；u表示控制参数，u的取值范围为3.5999<u<4。设定一个初始值：x₁，即q＝1，并将x₁作为密钥，本实施例2根据控制参数u和初始值x₁对一维差分方程的映射方程进行计算，可以得到混沌序列x_q。为了得到较为随机的随机矩阵，可选的：u＝3.999，混沌序列数量q＝4000。，已知初始值x₁、控制参数u和混沌序列数量q＝4000，可以计算出混沌序列x₁,…,x₄₀₀₀。将得到的混沌序列x₁,…,x₄₀₀₀的1×4000的矩阵改写成p×q的矩阵，得到随机矩阵B(p,q)，其中p表示矩阵的行数，q表示矩阵的列数。

傅里叶变换子单元，用于对随机矩阵进行快速傅里叶变换，得到第一矩阵。

傅里叶变换子单元具体为：对随机矩阵B(p,q)进行快速傅里叶变换，得到第一矩阵Y(p,q)。

迭代子单元，用于利用小波梅林矩阵对第一矩阵进行迭代，得到第二矩阵。

迭代子单元具体为：

构造子单元，用于对第二矩阵进行重新构造生成第三矩阵。

构造子单元具体为：将q×q维的第二矩阵P(q,q)重新构造生成一个一行q²列的第三矩阵H(1,q²)，并计算第三矩阵H(1,q²)的平均值为z。

哈希构造子单元，用于利用第三矩阵对原始文件进行哈希构造，得到第一哈希序列。

哈希构造子单元具体为：

二进制的哈希构造为：

哈希索引单元，用于将第一哈希序列组成哈希索引并存储至系统哈希库，得到系统哈希索引表。

哈希索引单元具体为：

然而对语音信号s(t)进行哈希构造的过程中会出现不同的信号数据带有相同的下标的情况，即冲突现象。针对这种情况，采用映射子单元。

哈希索引单元包括：

映射子单元，用于通过哈希函数将原始文件与第一哈希序列进行映射，生成哈希索引。

映射子单元包括：

h:U→{0,1,2,…,M-1} (6)；

其中M为第一哈希序列的总长度。

按照公式(6)对原始文件中的所有语音信号进行操作，当遍历完原始文件中的所有语音信号后，哈希索引建立完成。

存储子单元，用于将哈希索引存储至系统哈希表中，得到系统哈希索引表。

图3为本发明实施例2所提供的语音检索系统的系统结构图。参见图3，一种语音检索系统包括：

查询语音获取模块201，用于获取查询语音。获取用户提交的查询语音信号S₁。

提取模块202，用于提取查询语音的第二哈希序列。

提取模块202具体包括：利用哈希构造子单元对查询语音信号S₁进行哈希构造，生成查询语音信号S₁的第二哈希序列。

匹配模块203，用于将第二哈希序列与建立的系统哈希索引表中所有的第一哈希序列进行匹配，得到与第二哈希序列匹配的第一哈希序列。

匹配模块203，包括：

比较单元，用于将第二哈希序列和系统哈希索引表中的所有第一哈希序列的汉明距离与设定阈值进行比较。

比较单元具体为：

匹配单元，用于当第二哈希序列和第一哈希序列的汉明距离小于或等于设定阈值时，得到与第二哈希序列匹配的第一哈希序列。

匹配单元具体为：当h₁和第一哈希序列h＝{h(j)}的汉明距离小于或者等于阈值时，则表示检索成功，得到与第二哈希序列匹配的第一哈希序列。具体汉明距离的匹配过程为：

采用BER的假设检验来对哈希匹配进行描述：

DH(S₁,S₂)≤τ (8)

DH(S₁,S₂)＞τ (9)

其中，τ为检索阈值。

在语音不经过噪声处理的条件下，当阈值τ＝0时，表示查询语音S₁和密文语音库中的语音信号S₂的内容相同，检索成功。

获取模块204，用于在建立的密文语音库中根据第一哈希序列获取原始文件。具体为：当检索成功时为用户返回密文语音库中的第一哈希序列所对应的原始文件。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处。综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种语音检索方法，其特征在于，包括：

获取查询语音；

提取所述查询语音的第二哈希序列；

建立密文语音库包括：

获取原始文件；

建立系统哈希索引表包括：

所述对所述原始文件进行特征提取，得到所述原始文件的第一哈希序列，包括：

对所述原始文件进行预处理，得到预处理信号；

对所述随机矩阵进行快速傅里叶变换，得到第一矩阵；

利用所述小波梅林矩阵对所述第一矩阵进行迭代，得到第二矩阵；

对所述第二矩阵进行重新构造生成第三矩阵；

利用所述第三矩阵对所述原始文件进行哈希构造，得到所述第一哈希序列；

2.根据权利要求1所述的语音检索方法，其特征在于，所述对所述原始文件进行加密，得到加密文件并将所述加密文件上传至云端的语音库，得到所述密文语音库，包括：采用二维混沌映射加密算法对所述原始文件进行加密，得到加密文件并将所述加密文件上传至云端的语音库，得到所述密文语音库。

3.根据权利要求1所述的语音检索方法，其特征在于，所述将所述第一哈希序列组成哈希索引并存储至所述云端的系统哈希库，得到所述系统哈希索引表，包括：

4.根据权利要求1所述的语音检索方法，其特征在于，所述将所述第二哈希序列与建立的系统哈希索引表进行匹配，得到与所述第二哈希序列匹配的第一哈希序列，包括：

5.一种语音检索系统，其特征在于，包括：

查询语音获取模块，用于获取查询语音；

提取模块，用于提取所述查询语音的第二哈希序列；

密文语音库建立模块，用于建立密文语音库；

密文语音库建立模块包括：

原始文件获取单元，用于获取原始文件；

系统哈希索引表建立模块，用于建立系统哈希索引表；

系统哈希索引表建立模块包括：

所述特征提取单元，包括：

迭代子单元，用于利用所述小波梅林矩阵对所述第一矩阵进行迭代，得到第二矩阵；

哈希构造子单元，用于利用所述第三矩阵对所述原始文件进行哈希构造，得到所述第一哈希序列；

6.根据权利要求5所述的语音检索系统，其特征在于，所述加密单元，包括：

加密子单元，用于采用二维混沌映射加密算法对所述原始文件进行加密，得到加密文件并将所述加密文件上传至云端的语音库，得到所述密文语音库。

7.根据权利要求5所述的语音检索系统，其特征在于，所述哈希索引单元，包括：

8.根据权利要求5所述的语音检索系统，其特征在于，所述匹配模块，包括：