CN103886858B

CN103886858B - 一种声掩蔽信号产生方法和系统

Info

Publication number: CN103886858B
Application number: CN201410088725.0A
Authority: CN
Inventors: 徐艳云; 张萌; 朱大立
Original assignee: Institute of Information Engineering of CAS
Current assignee: Institute of Information Engineering of CAS
Priority date: 2014-03-11
Filing date: 2014-03-11
Publication date: 2016-10-05
Anticipated expiration: 2034-03-11
Also published as: CN103886858A

Abstract

本发明提供一种声掩蔽信号产生方法和系统，包括：提取一个或多个样本声音信号，建立声音样本特征模型库；获取目标声源信号；对所述目标声源信号进行声音识别，选取所述声音样本特征模型库中识别相似度达到预设阈值的一个或多个样本声音信号；对所选取的样本声音信号进行置乱组合，得到声掩蔽信号。本发明所产生的声掩蔽信号与目标声源信号具有相似的声音特征，言语可懂度低，且不包含任何目标声源信号信息，在掩蔽效率和保密性上均具有较大优势。

Description

一种声掩蔽信号产生方法和系统

技术领域

本发明涉及语音信号处理领域，尤其涉及一种声掩蔽信号产生方法和系统。

背景技术

保密会议室是召开涉及国家秘密会议的场所，会议进行过程中会产生、处理和存储大量国家秘密，研究表明，语音是产生泄密的重要信息形式，急需一种能够有效保护秘密信息的方法。声掩蔽是指加入一种自然或人工合成的干扰源，通过听觉掩蔽来覆盖目标声源声音。在会议室可能存在声音泄漏和窃听的位置布设干扰源，掩蔽有用语音，从而达到语音保密的目的。语音泄密的途径多，不能依靠单一的技术手段，然而，声掩蔽技术作为一种重要的语音防护手段，具有简单易行、成本低、效率高的特点。

现有的声掩蔽信号产生方法，掩蔽信号源一种是白噪声、粉红噪声、空调噪声等噪声信号，由于与目标声源信号没有相关性，掩蔽效率低，而且容易增加会议室周围声音的烦恼度；另一种是由目标声源信号处理得到，掩蔽效率优于噪声掩蔽信号，但是目标声源信号易于被解密，不适用于对语音信号的保密。因此，需要寻找一种更加有效的声掩蔽信号，来提高掩蔽效率和保密性。

发明内容

（一）要解决的技术问题

本发明提供一种声掩蔽信号产生方法和系统，以解决现有技术中的声掩蔽信号掩蔽效率不高，保密性不够好的技术问题。

（二）技术方案

为解决上述技术问题，本发明提供一种声掩蔽信号产生方法，包括：

提取一个或多个样本声音信号，建立声音样本特征模型库；

获取目标声源信号；

对所述目标声源信号进行声音识别，选取所述声音样本特征模型库中识别相似度达到预设阈值的一个或多个样本声音信号；

对所选取的样本声音信号进行置乱组合，得到声掩蔽信号。

进一步地，

所述提取一个或多个样本声音信号包括：利用录音器录制一个或多个涉密人员声音样本，对所述声音样本进行语音增强和降噪，提取样本声音信号；

所述建立声音样本特征模型库包括：训练所述样本声音信号，建立声音样本特征模型库。

进一步地，所述获取目标声源信号包括：

利用传声器获取目标声源信号，并进行语音增强、降噪和声源定位。

进一步地，

所述对所述目标声源信号进行声音识别包括：利用说话人识别技术对所述目标声源信号进行声音识别；

所述选取所述声音样本特征模型库中识别相似度达到预设阈值的一个或多个样本声音信号包括：选取所述声音样本特征模型库中归一化识别相似度参数a大于η的一个或多个样本声音信号；其中a∈[0,1]，表示声音样本特征模型库中的样本声音信号与所述目标声源信号的归一化识别相似度参数，a越大识别相似度越高；0.5<η<1。

进一步地，所述对所选取的样本声音信号进行置乱组合包括：

对每一个样本声音信号按照时域分段，将分段信号进行随机重组，得到每一个样本声音信号的置乱重组信号；

当所选取的样本声音信号大于1个时，将所述每一个样本声音信号的置乱重组信号进行组合，公式为：a₁s₁+a₂s₂+…+a_ns_n；其中s₁，s₂…，s_n为所选取的样本声音信号的置乱重组信号，a₁，a₂…，a_n为样本声音信号对应的归一化识别相似度参数。

另一方面，本发明还提供一种声掩蔽信号产生系统，包括：模型库建立单元、目标声源获取单元、样本声音选取单元和声掩蔽信号单元，所述样本声音选取单元与模型库建立单元、目标声源获取单元、声掩蔽信号单元分别相连；其中：

模型库建立单元，用于提取一个或多个样本声音信号，建立声音样本特征模型库；

目标声源获取单元，用于获取目标声源信号；

样本声音选取单元，用于对所述目标声源信号进行声音识别，选取所述声音样本特征模型库中识别相似度达到预设阈值的一个或多个样本声音信号；

声掩蔽信号单元，用于对所选取的样本声音信号进行置乱组合，得到声掩蔽信号。

进一步地，所述模型库建立单元包括：

样本声音提取子单元，用于利用录音器录制一个或多个涉密人员声音样本，对所述声音样本进行语音增强和降噪，提取样本声音信号；

模型库训练子单元，用于训练所述样本声音信号，建立声音样本特征模型库。

进一步地，所述目标声源获取单元包括：

预处理子单元，用于利用传声器获取目标声源信号，并进行语音增强、降噪和声源定位。

进一步地，所述样本声音选取单元包括：

识别子单元，用于利用说话人识别技术对所述目标声源信号进行声音识别；

选取子单元，用于选取所述声音样本特征模型库中归一化识别相似度参数a大于η的一个或多个样本声音信号；其中a∈[0,1]，表示声音样本特征模型库中的样本声音信号与所述目标声源信号的归一化识别相似度参数，a越大识别相似度越高；0.5<η<1。

进一步地，所述声掩蔽信号单元包括：

置乱重组子单元，用于对每一个样本声音信号按照时域分段，将分段信号进行随机重组，得到每一个样本声音信号的置乱重组信号；

组合子单元，用于当所选取的样本声音信号大于1个时，将所述每一个样本声音信号的置乱重组信号进行组合，公式为：a₁s₁+a₂s₂+…+a_ns_n；其中s₁，s₂…，s_n为所选取的样本声音信号的置乱重组信号，a₁，a₂…，a_n为样本声音信号对应的归一化识别相似度参数。

（三）有益效果

可见，在本发明实施例提供的一种声掩蔽信号产生方法和系统中，能够在事先建立的声音样本特征模型库中，通过对目标声源信号的自动识别选取声音特征相似的样本声音信号，进行信号处理后得到声掩蔽信号。本发明实施例所产生的声掩蔽信号与目标声源信号具有相似的声音特征，言语可懂度低，且不包含任何目标声源信号信息，在掩蔽效率和保密性上均具有较大优势。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例声掩蔽信号产生方法的基本流程示意图；

图2是本发明实施例1声掩蔽信号产生方法的流程示意图；

图3是本发明实施例1的目标声源信号波形图；

图4是本发明实施例1所选取的a₁=0.72的样本声音信号波形图；

图5是本发明实施例1所选取的a₁=0.8的样本声音信号波形图；

图6是本发明实施例1得到的声掩蔽信号波形图；

图7是本发明实施例1的目标声源信号和声掩蔽信号叠加得到的掩蔽波形图；

图8是本发明实施例2声掩蔽信号产生系统的基本结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实施例首先提供一种声掩蔽信号产生方法，参见图1，包括：

步骤101：提取一个或多个样本声音信号，建立声音样本特征模型库。

步骤102：获取目标声源信号。

步骤103：对所述目标声源信号进行声音识别，选取所述声音样本特征模型库中识别相似度达到预设阈值的一个或多个样本声音信号。

步骤104：对所选取的样本声音信号进行置乱组合，得到声掩蔽信号。

可见，在本发明实施例提供的一种声掩蔽信号产生方法中，能够在事先建立的声音样本特征模型库中，通过对目标声源信号的自动识别选取声音特征相似的样本声音信号，进行信号处理后得到声掩蔽信号。本发明实施例所产生的的声掩蔽信号与目标声源信号具有相似的声音特征，言语可懂度低，且不包含任何目标声源信号信息，在掩蔽效率和保密性上均具有较大优势。

优选地，提取一个或多个样本声音信号可以包括：利用录音器录制一个或多个涉密人员声音样本并进行预处理，提取样本声音信号。其中的预处理方法可以包括：对声音样本进行语音增强和降噪。

优选地，建立声音样本特征模型库可以包括：对样本声音信号进行训练，建立声音样本特征模型库。

优选地，获取目标声源信号可以包括：利用传声器获取目标声源信号，并进行预处理后得到干净的目标声源信号；其中预处理过程可以包括：语音增强、降噪和声源定位。

优选地，对目标声源信号进行声音识别可以包括：利用说话人识别技术对所述目标声源信号进行声音识别。识别后可以选取声音特征相同或相似的一个或几个声音样本信号，具体包括：选取声音样本特征模型库中归一化识别相似度参数a大于η的一个或多个样本声音信号；其中a∈[0,1]表示声音样本特征模型库中的样本声音信号与所述目标声源信号的归一化识别相似度参数，a越大识别相似度越高；0.5<η<1。

优选地，对所选取的样本声音信号进行置乱组合可以包括：对每一个样本声音信号按照时域分段，将分段信号进行随机重组，得到每一个样本声音信号的置乱重组信号。其中，当所选取的样本声音信号大于1个时，还需要将所述每一个样本声音信号的置乱重组信号进行组合，公式为：a₁s₁+a₂s₂+…+a_ns_n；其中s₁，s₂…，s_n为所选取的样本声音信号的置乱重组信号，a₁，a₂…，a_n为样本声音信号对应的归一化识别相似度参数。

实施例1：

本发明实施例1提供一种声掩蔽信号产生方法，参见图2，该方法具体包括：

步骤201：录制涉密人员声音样本。

本步骤中，首先利用录音器录制有权参加保密会议的10个涉密人员声音样本。由于背景噪声的存在，所录制的信号中会包含噪声和其他干扰，因此需要对声音样本进行预处理，包括语音增强和降噪等，得到干净的涉密人员样本声音信号。

步骤202：建立声音样本特征模型库。

本步骤中，将所提取的10个涉密人员样本声音信号进行训练，训练采用VQ矢量量化方法（或可采用动态事件规整DTW，隐马尔可夫模型HMM，人工神经网络ANN，支持向量机SVM，高斯模型和高斯混合模型GMM等方法），从而建立涉密人员的声音样本特征模型库。

步骤203：获取目标声源信号。

本步骤中，利用传声器获取1个人员的语音信号作为目标声源信号，并进行预处理，包括语音增强、降噪和声源定位，如图3所示。

步骤204：对目标声源信号进行声音识别，选取样本声音信号。

本步骤中，采用说话人识别技术对经预处理后的目标声源信号进行声音识别，计算声音样本特征模型库中的10个样本声音信号与目标声源信号的归一化识别相似度参数a，a越大识别相似度越高，a∈[0,1]。

选取归一化识别相似度参数a>0.7的样本声音信号，得到两个样本声音信号：a₁=0.72，如图4；a₂=0.8，如图5。

步骤205：对所选取的样本声音信号进行置乱组合，得到声掩蔽信号。

本步骤中，对选取的两个样本声音信号进行置乱，置乱方法为声音信号分段时长为145ms时域分段，和均匀分布的随机重组。并且，由于本发明实施例1中所选取的样本声音信号大于1个，则还需对置乱后的信号进行组合，公式为a₁s₁+a₂s₂，s₁，s₂为所选取的样本声音信号的置乱重组信号，a₁，a₂为对应的归一化识别相似度参数，a₁=0.72，a₂=0.8，最终得到如图6所示的置乱组合后的声掩蔽信号。并且，为了测试本发明实施例中的声掩蔽信号的声音掩蔽效果，可将图3中的目标声源信号与图6的声掩蔽信号进行叠加，得到图7所示的掩蔽波形图以验证掩蔽效率和保密性。

至此，则完成了本发明实施例1的声掩蔽信号产生方法的全过程。

实施例2：

本发明实施例2提供一种声掩蔽信号产生系统，参见图8，包括：

模型库建立单元801，用于提取一个或多个样本声音信号，建立声音样本特征模型库；

目标声源获取单元802，用于获取目标声源信号；

样本声音选取单元803，用于对所述目标声源信号进行声音识别，选取所述声音样本特征模型库中识别相似度达到预设阈值的一个或多个样本声音信号；

声掩蔽信号单元804，用于对所选取的样本声音信号进行置乱组合，得到声掩蔽信号。

优选地，模型库建立单元801可以包括：

优选地，目标声源获取单元802可以包括：预处理子单元，用于利用传声器获取目标声源信号，并进行语音增强、降噪和声源定位。

优选地，样本声音选取单元803可以包括：

优选地，声掩蔽信号单元804可以包括：

可见，本发明实施例具有如下有益效果：

在本发明实施例提供的一种声掩蔽信号产生方法和系统中，能够在事先建立的声音样本特征模型库中，通过对目标声源信号的自动识别选取声音特征相似的样本声音信号，进行信号处理后得到声掩蔽信号。本发明实施例所产生的声掩蔽信号与目标声源信号具有相似的声音特征，言语可懂度低，且不包含任何目标声源信号信息，在掩蔽效率和保密性上均具有较大优势。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种声掩蔽信号产生方法，其特征在于，包括：

提取一个或多个样本声音信号，建立声音样本特征模型库；

获取目标声源信号；

对所选取的样本声音信号进行置乱组合，得到声掩蔽信号。

2.根据权利要求1所述的声掩蔽信号产生方法，其特征在于：

3.根据权利要求1所述的声掩蔽信号产生方法，其特征在于，所述获取目标声源信号包括：

4.根据权利要求1至3中任一项所述的声掩蔽信号产生方法，其特征在于：

5.根据权利要求4所述的声掩蔽信号产生方法，其特征在于，所述对所选取的样本声音信号进行置乱组合包括：

6.一种声掩蔽信号产生系统，其特征在于，包括：模型库建立单元、目标声源获取单元、样本声音选取单元和声掩蔽信号单元，所述样本声音选取单元与模型库建立单元、目标声源获取单元、声掩蔽信号单元分别相连；其中：

目标声源获取单元，用于获取目标声源信号；

7.根据权利要求6所述的声掩蔽信号产生系统，其特征在于，所述模型库建立单元包括：

8.根据权利要求6所述的声掩蔽信号产生系统，其特征在于，所述目标声源获取单元包括：

9.根据权利要求6至8中任一项所述的声掩蔽信号产生系统，其特征在于，所述样本声音选取单元包括：

10.根据权利要求9所述的声掩蔽信号产生系统，其特征在于，所述声掩蔽信号单元包括：