CN103886858B - 一种声掩蔽信号产生方法和系统 - Google Patents
一种声掩蔽信号产生方法和系统 Download PDFInfo
- Publication number
- CN103886858B CN103886858B CN201410088725.0A CN201410088725A CN103886858B CN 103886858 B CN103886858 B CN 103886858B CN 201410088725 A CN201410088725 A CN 201410088725A CN 103886858 B CN103886858 B CN 103886858B
- Authority
- CN
- China
- Prior art keywords
- signal
- sound
- sample
- sample audio
- audio signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Abstract
本发明提供一种声掩蔽信号产生方法和系统,包括:提取一个或多个样本声音信号,建立声音样本特征模型库;获取目标声源信号;对所述目标声源信号进行声音识别,选取所述声音样本特征模型库中识别相似度达到预设阈值的一个或多个样本声音信号;对所选取的样本声音信号进行置乱组合,得到声掩蔽信号。本发明所产生的声掩蔽信号与目标声源信号具有相似的声音特征,言语可懂度低,且不包含任何目标声源信号信息,在掩蔽效率和保密性上均具有较大优势。
Description
技术领域
本发明涉及语音信号处理领域,尤其涉及一种声掩蔽信号产生方法和系统。
背景技术
保密会议室是召开涉及国家秘密会议的场所,会议进行过程中会产生、处理和存储大量国家秘密,研究表明,语音是产生泄密的重要信息形式,急需一种能够有效保护秘密信息的方法。声掩蔽是指加入一种自然或人工合成的干扰源,通过听觉掩蔽来覆盖目标声源声音。在会议室可能存在声音泄漏和窃听的位置布设干扰源,掩蔽有用语音,从而达到语音保密的目的。语音泄密的途径多,不能依靠单一的技术手段,然而,声掩蔽技术作为一种重要的语音防护手段,具有简单易行、成本低、效率高的特点。
现有的声掩蔽信号产生方法,掩蔽信号源一种是白噪声、粉红噪声、空调噪声等噪声信号,由于与目标声源信号没有相关性,掩蔽效率低,而且容易增加会议室周围声音的烦恼度;另一种是由目标声源信号处理得到,掩蔽效率优于噪声掩蔽信号,但是目标声源信号易于被解密,不适用于对语音信号的保密。因此,需要寻找一种更加有效的声掩蔽信号,来提高掩蔽效率和保密性。
发明内容
(一)要解决的技术问题
本发明提供一种声掩蔽信号产生方法和系统,以解决现有技术中的声掩蔽信号掩蔽效率不高,保密性不够好的技术问题。
(二)技术方案
为解决上述技术问题,本发明提供一种声掩蔽信号产生方法,包括:
提取一个或多个样本声音信号,建立声音样本特征模型库;
获取目标声源信号;
对所述目标声源信号进行声音识别,选取所述声音样本特征模型库中识别相似度达到预设阈值的一个或多个样本声音信号;
对所选取的样本声音信号进行置乱组合,得到声掩蔽信号。
进一步地,
所述提取一个或多个样本声音信号包括:利用录音器录制一个或多个涉密人员声音样本,对所述声音样本进行语音增强和降噪,提取样本声音信号;
所述建立声音样本特征模型库包括:训练所述样本声音信号,建立声音样本特征模型库。
进一步地,所述获取目标声源信号包括:
利用传声器获取目标声源信号,并进行语音增强、降噪和声源定位。
进一步地,
所述对所述目标声源信号进行声音识别包括:利用说话人识别技术对所述目标声源信号进行声音识别;
所述选取所述声音样本特征模型库中识别相似度达到预设阈值的一个或多个样本声音信号包括:选取所述声音样本特征模型库中归一化识别相似度参数a大于η的一个或多个样本声音信号;其中a∈[0,1],表示声音样本特征模型库中的样本声音信号与所述目标声源信号的归一化识别相似度参数,a越大识别相似度越高;0.5<η<1。
进一步地,所述对所选取的样本声音信号进行置乱组合包括:
对每一个样本声音信号按照时域分段,将分段信号进行随机重组,得到每一个样本声音信号的置乱重组信号;
当所选取的样本声音信号大于1个时,将所述每一个样本声音信号的置乱重组信号进行组合,公式为:a1s1+a2s2+…+ansn;其中s1,s2…,sn为所选取的样本声音信号的置乱重组信号,a1,a2…,an为样本声音信号对应的归一化识别相似度参数。
另一方面,本发明还提供一种声掩蔽信号产生系统,包括:模型库建立单元、目标声源获取单元、样本声音选取单元和声掩蔽信号单元,所述样本声音选取单元与模型库建立单元、目标声源获取单元、声掩蔽信号单元分别相连;其中:
模型库建立单元,用于提取一个或多个样本声音信号,建立声音样本特征模型库;
目标声源获取单元,用于获取目标声源信号;
样本声音选取单元,用于对所述目标声源信号进行声音识别,选取所述声音样本特征模型库中识别相似度达到预设阈值的一个或多个样本声音信号;
声掩蔽信号单元,用于对所选取的样本声音信号进行置乱组合,得到声掩蔽信号。
进一步地,所述模型库建立单元包括:
样本声音提取子单元,用于利用录音器录制一个或多个涉密人员声音样本,对所述声音样本进行语音增强和降噪,提取样本声音信号;
模型库训练子单元,用于训练所述样本声音信号,建立声音样本特征模型库。
进一步地,所述目标声源获取单元包括:
预处理子单元,用于利用传声器获取目标声源信号,并进行语音增强、降噪和声源定位。
进一步地,所述样本声音选取单元包括:
识别子单元,用于利用说话人识别技术对所述目标声源信号进行声音识别;
选取子单元,用于选取所述声音样本特征模型库中归一化识别相似度参数a大于η的一个或多个样本声音信号;其中a∈[0,1],表示声音样本特征模型库中的样本声音信号与所述目标声源信号的归一化识别相似度参数,a越大识别相似度越高;0.5<η<1。
进一步地,所述声掩蔽信号单元包括:
置乱重组子单元,用于对每一个样本声音信号按照时域分段,将分段信号进行随机重组,得到每一个样本声音信号的置乱重组信号;
组合子单元,用于当所选取的样本声音信号大于1个时,将所述每一个样本声音信号的置乱重组信号进行组合,公式为:a1s1+a2s2+…+ansn;其中s1,s2…,sn为所选取的样本声音信号的置乱重组信号,a1,a2…,an为样本声音信号对应的归一化识别相似度参数。
(三)有益效果
可见,在本发明实施例提供的一种声掩蔽信号产生方法和系统中,能够在事先建立的声音样本特征模型库中,通过对目标声源信号的自动识别选取声音特征相似的样本声音信号,进行信号处理后得到声掩蔽信号。本发明实施例所产生的声掩蔽信号与目标声源信号具有相似的声音特征,言语可懂度低,且不包含任何目标声源信号信息,在掩蔽效率和保密性上均具有较大优势。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例声掩蔽信号产生方法的基本流程示意图;
图2是本发明实施例1声掩蔽信号产生方法的流程示意图;
图3是本发明实施例1的目标声源信号波形图;
图4是本发明实施例1所选取的a1=0.72的样本声音信号波形图;
图5是本发明实施例1所选取的a1=0.8的样本声音信号波形图;
图6是本发明实施例1得到的声掩蔽信号波形图;
图7是本发明实施例1的目标声源信号和声掩蔽信号叠加得到的掩蔽波形图;
图8是本发明实施例2声掩蔽信号产生系统的基本结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例首先提供一种声掩蔽信号产生方法,参见图1,包括:
步骤101:提取一个或多个样本声音信号,建立声音样本特征模型库。
步骤102:获取目标声源信号。
步骤103:对所述目标声源信号进行声音识别,选取所述声音样本特征模型库中识别相似度达到预设阈值的一个或多个样本声音信号。
步骤104:对所选取的样本声音信号进行置乱组合,得到声掩蔽信号。
可见,在本发明实施例提供的一种声掩蔽信号产生方法中,能够在事先建立的声音样本特征模型库中,通过对目标声源信号的自动识别选取声音特征相似的样本声音信号,进行信号处理后得到声掩蔽信号。本发明实施例所产生的的声掩蔽信号与目标声源信号具有相似的声音特征,言语可懂度低,且不包含任何目标声源信号信息,在掩蔽效率和保密性上均具有较大优势。
优选地,提取一个或多个样本声音信号可以包括:利用录音器录制一个或多个涉密人员声音样本并进行预处理,提取样本声音信号。其中的预处理方法可以包括:对声音样本进行语音增强和降噪。
优选地,建立声音样本特征模型库可以包括:对样本声音信号进行训练,建立声音样本特征模型库。
优选地,获取目标声源信号可以包括:利用传声器获取目标声源信号,并进行预处理后得到干净的目标声源信号;其中预处理过程可以包括:语音增强、降噪和声源定位。
优选地,对目标声源信号进行声音识别可以包括:利用说话人识别技术对所述目标声源信号进行声音识别。识别后可以选取声音特征相同或相似的一个或几个声音样本信号,具体包括:选取声音样本特征模型库中归一化识别相似度参数a大于η的一个或多个样本声音信号;其中a∈[0,1]表示声音样本特征模型库中的样本声音信号与所述目标声源信号的归一化识别相似度参数,a越大识别相似度越高;0.5<η<1。
优选地,对所选取的样本声音信号进行置乱组合可以包括:对每一个样本声音信号按照时域分段,将分段信号进行随机重组,得到每一个样本声音信号的置乱重组信号。其中,当所选取的样本声音信号大于1个时,还需要将所述每一个样本声音信号的置乱重组信号进行组合,公式为:a1s1+a2s2+…+ansn;其中s1,s2…,sn为所选取的样本声音信号的置乱重组信号,a1,a2…,an为样本声音信号对应的归一化识别相似度参数。
实施例1:
本发明实施例1提供一种声掩蔽信号产生方法,参见图2,该方法具体包括:
步骤201:录制涉密人员声音样本。
本步骤中,首先利用录音器录制有权参加保密会议的10个涉密人员声音样本。由于背景噪声的存在,所录制的信号中会包含噪声和其他干扰,因此需要对声音样本进行预处理,包括语音增强和降噪等,得到干净的涉密人员样本声音信号。
步骤202:建立声音样本特征模型库。
本步骤中,将所提取的10个涉密人员样本声音信号进行训练,训练采用VQ矢量量化方法(或可采用动态事件规整DTW,隐马尔可夫模型HMM,人工神经网络ANN,支持向量机SVM,高斯模型和高斯混合模型GMM等方法),从而建立涉密人员的声音样本特征模型库。
步骤203:获取目标声源信号。
本步骤中,利用传声器获取1个人员的语音信号作为目标声源信号,并进行预处理,包括语音增强、降噪和声源定位,如图3所示。
步骤204:对目标声源信号进行声音识别,选取样本声音信号。
本步骤中,采用说话人识别技术对经预处理后的目标声源信号进行声音识别,计算声音样本特征模型库中的10个样本声音信号与目标声源信号的归一化识别相似度参数a,a越大识别相似度越高,a∈[0,1]。
选取归一化识别相似度参数a>0.7的样本声音信号,得到两个样本声音信号:a1=0.72,如图4;a2=0.8,如图5。
步骤205:对所选取的样本声音信号进行置乱组合,得到声掩蔽信号。
本步骤中,对选取的两个样本声音信号进行置乱,置乱方法为声音信号分段时长为145ms时域分段,和均匀分布的随机重组。并且,由于本发明实施例1中所选取的样本声音信号大于1个,则还需对置乱后的信号进行组合,公式为a1s1+a2s2,s1,s2为所选取的样本声音信号的置乱重组信号,a1,a2为对应的归一化识别相似度参数,a1=0.72,a2=0.8,最终得到如图6所示的置乱组合后的声掩蔽信号。并且,为了测试本发明实施例中的声掩蔽信号的声音掩蔽效果,可将图3中的目标声源信号与图6的声掩蔽信号进行叠加,得到图7所示的掩蔽波形图以验证掩蔽效率和保密性。
至此,则完成了本发明实施例1的声掩蔽信号产生方法的全过程。
实施例2:
本发明实施例2提供一种声掩蔽信号产生系统,参见图8,包括:
模型库建立单元801,用于提取一个或多个样本声音信号,建立声音样本特征模型库;
目标声源获取单元802,用于获取目标声源信号;
样本声音选取单元803,用于对所述目标声源信号进行声音识别,选取所述声音样本特征模型库中识别相似度达到预设阈值的一个或多个样本声音信号;
声掩蔽信号单元804,用于对所选取的样本声音信号进行置乱组合,得到声掩蔽信号。
优选地,模型库建立单元801可以包括:
样本声音提取子单元,用于利用录音器录制一个或多个涉密人员声音样本,对所述声音样本进行语音增强和降噪,提取样本声音信号;
模型库训练子单元,用于训练所述样本声音信号,建立声音样本特征模型库。
优选地,目标声源获取单元802可以包括:预处理子单元,用于利用传声器获取目标声源信号,并进行语音增强、降噪和声源定位。
优选地,样本声音选取单元803可以包括:
识别子单元,用于利用说话人识别技术对所述目标声源信号进行声音识别;
选取子单元,用于选取所述声音样本特征模型库中归一化识别相似度参数a大于η的一个或多个样本声音信号;其中a∈[0,1],表示声音样本特征模型库中的样本声音信号与所述目标声源信号的归一化识别相似度参数,a越大识别相似度越高;0.5<η<1。
优选地,声掩蔽信号单元804可以包括:
置乱重组子单元,用于对每一个样本声音信号按照时域分段,将分段信号进行随机重组,得到每一个样本声音信号的置乱重组信号;
组合子单元,用于当所选取的样本声音信号大于1个时,将所述每一个样本声音信号的置乱重组信号进行组合,公式为:a1s1+a2s2+…+ansn;其中s1,s2…,sn为所选取的样本声音信号的置乱重组信号,a1,a2…,an为样本声音信号对应的归一化识别相似度参数。
可见,本发明实施例具有如下有益效果:
在本发明实施例提供的一种声掩蔽信号产生方法和系统中,能够在事先建立的声音样本特征模型库中,通过对目标声源信号的自动识别选取声音特征相似的样本声音信号,进行信号处理后得到声掩蔽信号。本发明实施例所产生的声掩蔽信号与目标声源信号具有相似的声音特征,言语可懂度低,且不包含任何目标声源信号信息,在掩蔽效率和保密性上均具有较大优势。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种声掩蔽信号产生方法,其特征在于,包括:
提取一个或多个样本声音信号,建立声音样本特征模型库;
获取目标声源信号;
对所述目标声源信号进行声音识别,选取所述声音样本特征模型库中识别相似度达到预设阈值的一个或多个样本声音信号;
对所选取的样本声音信号进行置乱组合,得到声掩蔽信号。
2.根据权利要求1所述的声掩蔽信号产生方法,其特征在于:
所述提取一个或多个样本声音信号包括:利用录音器录制一个或多个涉密人员声音样本,对所述声音样本进行语音增强和降噪,提取样本声音信号;
所述建立声音样本特征模型库包括:训练所述样本声音信号,建立声音样本特征模型库。
3.根据权利要求1所述的声掩蔽信号产生方法,其特征在于,所述获取目标声源信号包括:
利用传声器获取目标声源信号,并进行语音增强、降噪和声源定位。
4.根据权利要求1至3中任一项所述的声掩蔽信号产生方法,其特征在于:
所述对所述目标声源信号进行声音识别包括:利用说话人识别技术对所述目标声源信号进行声音识别;
所述选取所述声音样本特征模型库中识别相似度达到预设阈值的一个或多个样本声音信号包括:选取所述声音样本特征模型库中归一化识别相似度参数a大于η的一个或多个样本声音信号;其中a∈[0,1],表示声音样本特征模型库中的样本声音信号与所述目标声源信号的归一化识别相似度参数,a越大识别相似度越高;0.5<η<1。
5.根据权利要求4所述的声掩蔽信号产生方法,其特征在于,所述对所选取的样本声音信号进行置乱组合包括:
对每一个样本声音信号按照时域分段,将分段信号进行随机重组,得到每一个样本声音信号的置乱重组信号;
当所选取的样本声音信号大于1个时,将所述每一个样本声音信号的置乱重组信号进行组合,公式为:a1s1+a2s2+…+ansn;其中s1,s2…,sn为所选取的样本声音信号的置乱重组信号,a1,a2…,an为样本声音信号对应的归一化识别相似度参数。
6.一种声掩蔽信号产生系统,其特征在于,包括:模型库建立单元、目标声源获取单元、样本声音选取单元和声掩蔽信号单元,所述样本声音选取单元与模型库建立单元、目标声源获取单元、声掩蔽信号单元分别相连;其中:
模型库建立单元,用于提取一个或多个样本声音信号,建立声音样本特征模型库;
目标声源获取单元,用于获取目标声源信号;
样本声音选取单元,用于对所述目标声源信号进行声音识别,选取所述声音样本特征模型库中识别相似度达到预设阈值的一个或多个样本声音信号;
声掩蔽信号单元,用于对所选取的样本声音信号进行置乱组合,得到声掩蔽信号。
7.根据权利要求6所述的声掩蔽信号产生系统,其特征在于,所述模型库建立单元包括:
样本声音提取子单元,用于利用录音器录制一个或多个涉密人员声音样本,对所述声音样本进行语音增强和降噪,提取样本声音信号;
模型库训练子单元,用于训练所述样本声音信号,建立声音样本特征模型库。
8.根据权利要求6所述的声掩蔽信号产生系统,其特征在于,所述目标声源获取单元包括:
预处理子单元,用于利用传声器获取目标声源信号,并进行语音增强、降噪和声源定位。
9.根据权利要求6至8中任一项所述的声掩蔽信号产生系统,其特征在于,所述样本声音选取单元包括:
识别子单元,用于利用说话人识别技术对所述目标声源信号进行声音识别;
选取子单元,用于选取所述声音样本特征模型库中归一化识别相似度参数a大于η的一个或多个样本声音信号;其中a∈[0,1],表示声音样本特征模型库中的样本声音信号与所述目标声源信号的归一化识别相似度参数,a越大识别相似度越高;0.5<η<1。
10.根据权利要求9所述的声掩蔽信号产生系统,其特征在于,所述声掩蔽信号单元包括:
置乱重组子单元,用于对每一个样本声音信号按照时域分段,将分段信号进行随机重组,得到每一个样本声音信号的置乱重组信号;
组合子单元,用于当所选取的样本声音信号大于1个时,将所述每一个样本声音信号的置乱重组信号进行组合,公式为:a1s1+a2s2+…+ansn;其中s1,s2…,sn为所选取的样本声音信号的置乱重组信号,a1,a2…,an为样本声音信号对应的归一化识别相似度参数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410088725.0A CN103886858B (zh) | 2014-03-11 | 2014-03-11 | 一种声掩蔽信号产生方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410088725.0A CN103886858B (zh) | 2014-03-11 | 2014-03-11 | 一种声掩蔽信号产生方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103886858A CN103886858A (zh) | 2014-06-25 |
CN103886858B true CN103886858B (zh) | 2016-10-05 |
Family
ID=50955716
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410088725.0A Active CN103886858B (zh) | 2014-03-11 | 2014-03-11 | 一种声掩蔽信号产生方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103886858B (zh) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102014214052A1 (de) * | 2014-07-18 | 2016-01-21 | Bayerische Motoren Werke Aktiengesellschaft | Virtuelle Verdeckungsmethoden |
CN104144601A (zh) * | 2014-07-22 | 2014-11-12 | 北京利云技术开发公司 | 防止利用手机进行窃听的装置 |
CN104575486B (zh) * | 2014-12-25 | 2019-04-02 | 中国科学院信息工程研究所 | 基于声掩蔽原理的声泄漏防护方法及系统 |
CN104637485B (zh) * | 2015-03-03 | 2018-05-01 | 山东省计算中心(国家超级计算济南中心) | 一种用于保护汉语语音私密度的掩蔽信号的生成方法 |
CN106558303A (zh) * | 2015-09-29 | 2017-04-05 | 苏州天声学科技有限公司 | 阵列式声音掩蔽器及声音掩蔽方法 |
CN107295148A (zh) * | 2016-03-31 | 2017-10-24 | 北京中密安信息安全技术有限公司 | 防窃听录音方法和干扰屏蔽器 |
CN106960673A (zh) * | 2017-02-08 | 2017-07-18 | 中国人民解放军信息工程大学 | 一种语音掩蔽方法和设备 |
CN111239686B (zh) * | 2020-02-18 | 2021-12-21 | 中国科学院声学研究所 | 一种基于深度学习的双通道声源定位方法 |
CN111596261B (zh) * | 2020-04-02 | 2022-06-14 | 云知声智能科技股份有限公司 | 一种声源定位方法及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1505811A (zh) * | 2001-02-26 | 2004-06-16 | 777388安大略有限公司 | 联网声音屏蔽和寻呼系统 |
EP1770685A1 (en) * | 2005-10-03 | 2007-04-04 | Maysound ApS | A system for providing a reduction of audiable noise perception for a human user |
CN102110441A (zh) * | 2010-12-22 | 2011-06-29 | 中国科学院声学研究所 | 一种基于时间反转的声掩蔽信号产生方法 |
CN102257559A (zh) * | 2008-12-23 | 2011-11-23 | 伯斯有限公司 | 基于掩蔽的增益控制 |
CN103262154A (zh) * | 2010-12-07 | 2013-08-21 | 雅马哈株式会社 | 掩蔽声音产生装置、掩蔽声音输出装置和掩蔽声音产生程序 |
-
2014
- 2014-03-11 CN CN201410088725.0A patent/CN103886858B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1505811A (zh) * | 2001-02-26 | 2004-06-16 | 777388安大略有限公司 | 联网声音屏蔽和寻呼系统 |
EP1770685A1 (en) * | 2005-10-03 | 2007-04-04 | Maysound ApS | A system for providing a reduction of audiable noise perception for a human user |
CN102257559A (zh) * | 2008-12-23 | 2011-11-23 | 伯斯有限公司 | 基于掩蔽的增益控制 |
CN103262154A (zh) * | 2010-12-07 | 2013-08-21 | 雅马哈株式会社 | 掩蔽声音产生装置、掩蔽声音输出装置和掩蔽声音产生程序 |
CN102110441A (zh) * | 2010-12-22 | 2011-06-29 | 中国科学院声学研究所 | 一种基于时间反转的声掩蔽信号产生方法 |
Also Published As
Publication number | Publication date |
---|---|
CN103886858A (zh) | 2014-06-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103886858B (zh) | 一种声掩蔽信号产生方法和系统 | |
Campbell et al. | Forensic speaker recognition | |
CN102394062B (zh) | 一种自动录音设备源识别的方法和系统 | |
CN103856689B (zh) | 面向新闻视频的人物对话字幕提取方法 | |
CN103811020A (zh) | 一种智能语音处理方法 | |
CN107452372A (zh) | 远场语音识别模型的训练方法和装置 | |
CN102708867A (zh) | 一种基于声纹和语音的防录音假冒身份识别方法及系统 | |
CN109935226A (zh) | 一种基于深度神经网络的远场语音识别增强系统及方法 | |
CN106356067A (zh) | 录音方法、装置及终端 | |
CN109448759A (zh) | 一种基于气爆音的抗语音认证欺骗攻击检测方法 | |
CN107507626B (zh) | 一种基于语音频谱融合特征的手机来源识别方法 | |
CN103778917B (zh) | 一种在电话满意度调查中检测身份冒充的系统与方法 | |
CN108876951A (zh) | 一种基于声音识别的教学考勤方法 | |
Pianese et al. | Deepfake audio detection by speaker verification | |
Sinclair et al. | Where are the challenges in speaker diarization? | |
Vickers et al. | Robust North Atlantic right whale detection using deep learning models for denoising | |
CN109410956A (zh) | 一种音频数据的对象识别方法、装置、设备及存储介质 | |
CN105845143A (zh) | 基于支持向量机的说话人确认方法及其系统 | |
CN106205635A (zh) | 语音处理方法及系统 | |
Doan et al. | Bts-e: Audio deepfake detection using breathing-talking-silence encoder | |
CN105575387A (zh) | 基于听觉仿生中耳蜗基底膜的声源定位方法 | |
Mun et al. | DNN transfer learning based non-linear feature extraction for acoustic event classification | |
CN108665901B (zh) | 一种音素/音节提取方法及装置 | |
Vester et al. | Quantifying group specificity of animal vocalizations without specific sender information | |
Hamdan | The Freedom of Speech Itself |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |