CN108257611A - 语音信号降噪方法、装置及电子设备 - Google Patents
语音信号降噪方法、装置及电子设备 Download PDFInfo
- Publication number
- CN108257611A CN108257611A CN201810085623.1A CN201810085623A CN108257611A CN 108257611 A CN108257611 A CN 108257611A CN 201810085623 A CN201810085623 A CN 201810085623A CN 108257611 A CN108257611 A CN 108257611A
- Authority
- CN
- China
- Prior art keywords
- signal
- sparse
- noise reduction
- observation
- sampled point
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 230000009467 reduction Effects 0.000 claims abstract description 83
- 239000011159 matrix material Substances 0.000 claims abstract description 55
- 230000009466 transformation Effects 0.000 claims abstract description 45
- 238000011946 reduction process Methods 0.000 claims abstract description 33
- 230000006870 function Effects 0.000 claims description 7
- 230000001755 vocal effect Effects 0.000 abstract description 57
- 238000010586 diagram Methods 0.000 description 6
- 230000006854 communication Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000000844 transformation Methods 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 235000015170 shellfish Nutrition 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
Abstract
本发明实施例提供一种语音信号降噪方法、装置及电子设备,该方法包括:通话设备对接收到的原始语音信号进行稀疏变换。接着,再根据预设观测矩阵对此稀疏信号进行降维处理,获取与稀疏信号对应的观测信号,获取到的观测信号的维数远远小于稀疏信号的维数。然后,通话设备对此低维数的观测信号进行降噪处理。由于观测信号的维数远远小于稀疏信号的维数,因此,通话设备对此观测信号进行降噪处理不但能够达到减小降噪过程中的计算量以及计算复杂度的目的,而且也能够达到减小原始语音信号中噪声信号对有用语音信号干扰的目的。最终,通话设备将降噪后观测信号进行稀疏逆变换,用户便可以通过通话设备听到不被噪声信号干扰的降噪后语音信号。
Description
技术领域
本发明涉及信号降噪技术领域,尤其涉及一种语音信号降噪方法、装置及电子设备。
背景技术
日常工作以及生活中常见的无线通话设备通常有手机、蓝牙耳机、对讲机等等,它们在提高了工作效率的同时,还可以让用户免除恼人电线的牵绊,自在地以各种方式轻松通话。
但在实际通话过程中,用户的通话环境往往十分复杂。尤其当用户在户外通话时,语音信号的接收方接收到的往往是含有有用信号以及噪声信号的混合语音信号,其中,常见的噪声信号为风声、水声或者汽车鸣笛声等等。
为了提高用户的通话质量,在实际应用中往往需要对混合语音信号进行降噪处理。现有技术中,常用的降噪方法有子空间语音降噪法、自适应噪声抵消法等等,但其都存在计算量大、计算复杂度高等问题。因此,如何减小降噪过程的计算量、降低计算复杂度就成为亟待解决的问题。
发明内容
有鉴于此,本发明实施例提供一种语音信号降噪种方法、装置及电子设备,用以在保证语音信号降噪效果的同时减小降噪过程的计算量、降低计算复杂度,提高用户间的通话质量。
本发明实施例提供一种语音信号降噪方法,包括:
对原始语音信号进行稀疏变换,以得到稀疏信号;
通过预设观测矩阵对所述稀疏信号的降维处理,获取对应于所述稀疏信号的观测信号;
对所述观测信号进行降噪处理,以得到降噪后观测信号;
对所述降噪后观测信号进行稀疏逆变换,以得到降噪后语音信号。
可选地,所述对所述观测信号进行降噪处理,以得到降噪后观测信号,包括:
根据以下公式调整所述观测信号中任一采样点的信号强度:
zk+1=zk+λkδk
其中,k+1为信号强度的调整次数,k≥0,zk+1表示第k+1次调整后所述任一采样点的调整后信号强度,zk表示第k+1次调整前所述任一采样点的当前信号强度,λk为调整参数,所述调整参数λk为使函数F(zk+λkδk)具有最小值时对应的λk值,δk为降噪参数,
其中,表示所述zk的梯度值,αk为相关系数,所述相关系数
其中,αmax,αmin均为预设值,γk-1=(δk-1)TBδk-1,Φ为所述预设观测矩阵,Ψ为预设正交基矩阵;
若所述任一采样点的调整后信号强度满足预设条件,则停止对所述任一采样点的信号强度进行调整;
根据满足所述预设条件的采样点生成所述降噪后观测信号。
可选地,在所述根据以下公式调整所述观测信号中任一采样点的信号强度之后,所述方法还包括:
记录已调整次数k+1;
若所述任一采样点的调整后信号强度不满足预设条件,则将所述已调整次数加1;
对所述任一采样点的信号强度进行剩余次调整,其中,所述剩余次调整为预设调整次数与所述已调整次数之差。
可选地,在所述调整所述观测信号中任一采样点的信号强度之前,所述方法还包括:
针对所述任一采样点设置相关系数的初始值为:
其中,α0为相关系数的初始值,z0为所述观测信号中所述任一采样点的原始信号强度,▽F(z0)表示所述原始信号强度的梯度值。
可选地,所述对原始语音信号进行稀疏变换,以得到稀疏信号,包括:
根据以下公式对所述原始语音信号进行稀疏变换:X=ΨTS;
其中,X为稀疏信号,S为原始语音信号,ΨT为预设正交基矩阵的转置矩阵;
所述通过预设观测矩阵对所述稀疏信号的降维处理,获取对应于所述稀疏信号的观测信号,包括:
根据以下公式对所述稀疏信号进行降维处理:Y=ΦX;
其中,Y为观测信号,X为稀疏信号,Φ为预设观测矩阵;
所述对所述降噪后观测信号进行稀疏逆变换,以得到降噪后语音信号,包括:
根据以下公式对所述降噪后观测信号进行稀疏逆变换:S'=ΨY';
其中,S'为降噪后语音信号,Ψ为预设正交基矩阵,Y'为降噪后观测信号。
本发明实施例提供一种语音信号降噪装置,包括:
稀疏变换模块,用于对原始语音信号进行稀疏变换,以得到稀疏信号;
获取模块,用于通过预设观测矩阵对所述稀疏信号的降维处理,获取对应于所述稀疏信号的观测信号;
降噪模块,用于对所述观测信号进行降噪处理,以得到降噪后观测信号;
稀疏逆变换模块,用于对所述降噪后观测信号进行稀疏逆变换,以得到降噪后语音信号。
可选地,所述降噪模块包括:
调整单元,用于根据以下公式调整所述观测信号中任一采样点的信号强度:
zk+1=zk+λkδk
其中,k+1为信号强度的调整次数,k≥0,zk+1表示第k+1次调整后所述任一采样点的调整后信号强度,zk表示第k+1次调整前所述任一采样点的当前信号强度,λk为调整参数,所述调整参数λk为使函数F(zk+λkδk)具有最小值时对应的λk值,δk为降噪参数,
其中,表示所述zk的梯度值,αk为相关系数,所述相关系数
其中,αmax,αmin均为预设值,γk-1=(δk-1)TBδk-1,Φ为所述预设观测矩阵,Ψ为预设正交基矩阵;
若所述任一采样点的调整后信号强度满足预设条件,则停止对所述任一采样点的信号强度进行调整;
生成单元,用于根据满足所述预设条件的采样点生成所述降噪后观测信号。
可选地,所述降噪模块还用于:
记录已调整次数k+1;
若所述任一采样点的调整后信号强度不满足预设条件,则将所述已调整次数加1;
对所述任一采样点的信号强度进行剩余次调整,其中,所述剩余次调整为预设调整次数与所述已调整次数之差。
可选地,所述降噪模块还用于:
针对所述任一采样点设置相关系数的初始值为:
其中,α0为相关系数的初始值,z0为所述观测信号中所述任一采样点的原始信号强度,表示所述原始信号强度的梯度值。
本发明实施例提供一种电子设备,包括:存储器,以及与所述存储器连接的处理器;
所述存储器,用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令供所述处理器调用执行;
所述处理器,用于执行所述一条或多条计算机指令以上述语音信号降噪方法中的任意一种方法。
本发明实施例提供的语音信号降噪方法、装置及电子设备,通话设备接收原始语音信号,此原始语音信号是非稀疏信号,并且原始语音信号中同时含有用的语音信号以及对语音信号产生干扰的噪声信号。通话设备根据预设正交基矩阵对原始语音信号进行稀疏变换,这样能够保证在不丢失原始语音信号包含的信息的同时使原始语音信号以较为简洁的形式表示出来,从而得到适应于后续降噪处理的稀疏信号。接着,通话设备再根据预设观测矩阵对此稀疏信号进行降维处理,获取与稀疏信号对应的观测信号。获取到的观测信号保留了稀疏信号中的重要信息,并且此观测信号的维数远远小于稀疏信号的维数。然后,通话设备对此低维数的观测信号进行降噪处理。由于观测信号的维数远远小于稀疏信号的维数也即是观测信号的数据量远远小于稀疏信号,因此,通话设备对此观测信号进行降噪处理不但能够达到减小降噪过程中的计算量以及计算复杂度的目的,而且也能够达到减小原始语音信号中噪声信号对有用语音信号干扰的目的,提高用户之间的通话质量的效果。最终,通话设备将降噪后观测信号进行稀疏逆变换,得到非稀疏信号也即是降噪后语音信号,用户可以通过通话设备听到不被噪声信号干扰的降噪后语音信号。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的语音信号降噪方法实施例一的流程图;
图2为本发明实施例提供的语音信号降噪装置实施例一的结构示意图;
图3为本发明实施例提供的语音信号降噪装置实施例二的结构示意图;
图4为本发明实施例提供的电子设备实施例一的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义,“多种”一般包含至少两种,但是不排除包含至少一种的情况。
应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
应当理解,尽管在本发明实施例中可能采用术语第一、第二、第三等来描述XXX,但这些XXX不应限于这些术语。这些术语仅用来将XXX彼此区分开。例如,在不脱离本发明实施例范围的情况下,第一XXX也可以被称为第二XXX,类似地,第二XXX也可以被称为第一XXX。
取决于语境,如在此所使用的词语“如果”、“若”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的商品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种商品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的商品或者系统中还存在另外的相同要素。
图1为本发明实施例提供的语音信号降噪方法实施例一的流程图,本实施例提供的该语音信号降噪方法的执行主体可以为通话设备,如图1所示,该方法包括如下步骤:
S101,对原始语音信号进行稀疏变换,以得到稀疏信号。
用户在使用通话设备通话的过程中,若通话双方的任一方所处的通话环境较为恶劣,则此方使用的通话设备接收到的原始语音信号实质上是一个非稀疏的混合信号,也即是原始语音信号中同时包含有的用户发出的语音信号以及外界环境产生的噪声信号。通话设备对此原始语音信号进行稀疏变换,以得到稀疏信号。稀疏信号是原始语音信号的另一种表现形式,此稀疏信号中包含的信息与原始语音信号中包含的信息相同,并且此稀疏信号与原始语音信号相比更为简洁。通话设备可以基于此稀疏信号进行后续的降噪处理。
可选地,通话设备可以根据以下公式对原始语音信号进行稀疏变换:
X=ΨTS
其中,S为原始语音信号,X为稀疏信号,ΨT为预设正交基矩阵的转置矩阵。可选地,预设正交基矩阵可以为哈尔小波基(Harr wavelet基)、线性调频小波基(chirplet基)、快速傅里叶变换基(FFT基)等等。
需要说明的是,上述描述中并未对稀疏变换的次数进行限定。可选地,通话设备可以对原始语音信号进行一次或多次的稀疏变换。由于稀疏变换的次数可以同时影响到原始语音信号的简洁程度以及最后的降噪效果。因此,在实际应用中,通话设备通常会对原始语音信号进行多次稀疏变换,在保证原始语音信号表示形式具有较高简洁性的同时也能保证原始语音信号的降噪效果。可选地,通过实验发现,当对原始语音信号进行4次稀疏变换后,原始语音信号具有最佳的降噪效果。
S102,通过预设观测矩阵对稀疏信号的降维处理,获取对应于稀疏信号的观测信号。
由于稀疏信号的维度通常较高,若通话设备直接使用此稀疏信号进行降噪处理的话,会使得降噪处理过程的计算量很大且计算复杂度很高。因此,通话设备可以利用预设观测矩阵对稀疏信号进行降维处理,以得到维数较低的信号也即是观测信号。此观测信号中包含有稀疏信号中的全部信息,且观测信号中包含的数据量远远小于稀疏信号中包含的数据量。
上述观测信号的获取过程可以理解为:预设观测矩阵中的每一行数据都可以看成是一个信息提取器,通过观测矩阵中每一行数据分别与稀疏信号进行相乘,即可拾取到第一稀疏信号中的部分信息,但此部分信息足以代表原始信号中的全部信息。因此,可以认为获得的观测信号中包含有稀疏信号中的全部信息。
可选地,通话设备可以根据以下公式对稀疏信号进行降维处理,从而获取对应于稀疏信号的观测信号:
Y=ΦX
其中,Y为观测信号,X为稀疏信号,Φ为预设观测矩阵。可选地,预设观测矩阵是具有有限等距性(Restricted Isometry Property,RIP)的矩阵。在实际应用中,预设观测矩阵可以是随机观测矩阵,例如高斯随机矩阵、贝努力随机矩阵等等,也可以是确定性观测矩阵,例如循环观测矩阵、啁啾序列观测矩阵、多项式观测矩阵等等。本实施例中并不限定具体使用的预设观测矩阵。
S103,对观测信号进行降噪处理,以得到降噪后观测信号。
此时,通话设备得到的观测信号中仍然是包含噪声信号的,此噪声信号会对有用的语音信号造成干扰。因此,通话设备需要进一步对观测信号进行降噪处理。
通话设备在得到观测信号的同时,也即是得到了观测信号中各个采样点的原始信号强度。可选地,通话设备可以通过对观测信号中每个采样点的信号强度进行调整的方式实现对观测信号进行降噪处理。
一种可选地方式,通话设备可以利用迭代计算的方式逐步调整观测信号中任一采样点的信号强度,以使任一采样点的信号强度满足预设条件。具体调整过程可以参见以下描述。
通话设备在对观测信号中任一采样点A的信号强度进行调整之前,首先需要针对此任一采样点A的信号强度设置一个相关系数的初始值。
具体地,通话设备可以将针对任一采样点A的相关系数的初始值设置为:
其中,α0为相关系数的初始值,z0为观测信号中任一采样点A的原始信号强度,▽F(z0)表示此原始信号强度的梯度值。可选地。预设的α0通常都会在由αmin和αmax组成的数值区间之间,在实际应用中,αmax=1030,αmin=10-30。
通话设备在设置完相关系数的初始值后,便可以基于此相关系数的初始值开始下述信号强度的迭代计算。
可选地,通话设备可以根据以下公式调整观测信号中任一采样点A的信号强度:
zk+1=zk+λkδk;
其中,k+1为信号强度的调整次数,k≥0,zk+1表示第k+1次调整后任一采样点A的调整后信号强度,zk表示第k+1次调整前任一采样点A的当前信号强度,λk为调整参数,调整参数λk为使函数F(zk+λkδk)有最小值时对应的λk值,λk∈(0,1),δk为降噪参数,
其中,表示zk的梯度值,αk为相关系数,
其中,αmax,αmin均为预设值,可选地,αmax=1030,αmin=10-30,γk-1=(δk-1)TBδk-1,Φ为预设观测矩阵,Ψ为预设正交基矩阵。
任一采样点A的信号强度每进行一次调整后,通话设备会记录下此次调整是第几次调整也即是已调整次数,同时还会判断调整后信号强度是否满足预设条件。
若任一采样点A的调整后信号强度满足预设条件,则停止对任一采样点A的信号强度进行调整。然后,通话设备开始对任一采样点A的下一个采样点B的信号强度进行调整。可选地,此预设条件可以为:任一采样点A的调整后信号强度小于等于0。
若任一采样点A的调整后信号强度不满足预设条件,则通话设备更新已调整次数也即是将前述记录的已调整次数加1,同时再继续对任一采样点A的信号强度进行下一次的调整,直至任一采样点A的信号强度满足预设条件。
但在实际应用中,为了提高信号强度调整的效率,可选地,通话设备可以预先设置一个调整次数。若任一采样点A的调整后信号强度不满足预设条件,则通话设备会将当前记录的已调整次数加1,再继续对任一采样点A的信号强度进行剩余次调整,其中,剩余次调整为预设调整次数与已调整次数之差。
上述描述只是针对于观测信号中的某一个采样点的信号强度进行调整的过程,观测信号中的其他采样点也是如此,在此不再赘述。
在通话设备对观测信号中的全部采样点都进行上述操作后,会使得观测信号中各个采样点的信号强度都满足预设条件,此时,观测信号中仍然同时包含有噪声信号以及有用的语音信息,但此时噪声信号已经不能对语音信号造成干扰,也即是实现了对观测信号的降噪处理。
S104,对降噪后观测信号进行稀疏逆变换,以得到降噪后语音信号。
通话设备再对降噪后观测信号进行稀疏逆变换,以得到一个非稀疏的语音信号也即是降噪后语音信号。用户可以通过通话设备听到降噪后语音信号。
可选地,通话设备可以根据以下公式对降噪后观测信号进行稀疏逆变换:
S'=ΨY'
其中,S'为降噪后语音信号,Ψ为预设正交基矩阵,Y'为降噪后观测信号。
在此需要说明的是,假设两个用户分别使用通话设备I以及通话设备II进行通话,且通话设备I对应的用户所处的通话环境较为恶劣。在上述前提下,本实施例是以降噪过程发生在通话设备I中为例进行说明的,也即是通话设备I在接收到包括用户发出的语音信号以及外界环境中的噪声信号的原始语音信号后,在通话设备I内直接进行上述降噪过程,并最终将经过降噪处理后的信号发送至通话设备II。
当然,上述降噪过程也可以发生在通话设备II内的,也即是在通话设备II接收到通话设备I发送的原始语音信号后,在通话设备II内进行上述降噪处理。本发明并不对执行降噪处理的设备进行限定。
本实施例中,通话设备接收原始语音信号,此原始语音信号是非稀疏信号,并且原始语音信号中同时含有用的语音信号以及对语音信号产生干扰的噪声信号。通话设备根据预设正交基矩阵对原始语音信号进行稀疏变换,这样能够保证在不丢失原始语音信号包含的信息的同时使原始语音信号以较为简洁的形式表示出来,从而得到适应于后续降噪处理的稀疏信号。接着,通话设备再根据预设观测矩阵对此稀疏信号进行降维处理,获取与稀疏信号对应的观测信号。获取到的观测信号保留了稀疏信号中的重要信息,并且此观测信号的维数远远小于稀疏信号的维数。然后,通话设备对此低维数的观测信号进行降噪处理。由于观测信号的维数远远小于稀疏信号的维数也即是观测信号的数据量远远小于稀疏信号,因此,通话设备对此观测信号进行降噪处理不但能够达到减小降噪过程中的计算量以及计算复杂度的目的,而且也能够达到减小原始语音信号中噪声信号对有用语音信号干扰的目的,提高用户之间的通话质量的效果。最终,通话设备将降噪后观测信号进行稀疏逆变换,得到非稀疏信号也即是降噪后语音信号,用户可以通过通话设备听到不被噪声信号干扰的降噪后语音信号。
图2为本发明实施例提供的语音信号降噪装置实施例一的结构示意图,如图2所示,该语音信号降噪装置包括:稀疏变换模块11、获取模块12、降噪模块13以及稀疏逆变换模块14。
稀疏变换模块11,用于对原始语音信号进行稀疏变换,以得到稀疏信号。
获取模块12,用于通过预设观测矩阵对稀疏信号的降维处理,获取对应于稀疏信号的观测信号。
降噪模块13,用于对观测信号进行降噪处理,以得到降噪后观测信号。
稀疏逆变换模块14,用于对降噪后观测信号进行稀疏逆变换,以得到降噪后语音信号。
图2所示装置可以执行图1所示实施例的方法,本实施例未详细描述的部分,可参考对图1所示实施例的相关说明。该技术方案的执行过程和技术效果参见图1所示实施例中的描述,在此不再赘述。
图3为本发明实施例提供的语音信号降噪装置实施例二的结构示意图,如图3所示,在图2所示实施例基础上,该语音信号降噪装置中的降噪模块13包括:调整单元131和生成单元132。
调整单元131,用于根据以下公式调整观测信号中任一采样点的信号强度:
zk+1=zk+λkδk
其中,k+1为信号强度的调整次数,k≥0,zk+1表示第k+1次调整后任一采样点的调整后信号强度,zk表示第k+1次调整前任一采样点的当前信号强度,λk为调整参数,调整参数λk为使函数F(zk+λkδk)具有最小值时对应的λk值,δk为降噪参数,
其中,表示zk的梯度值,αk为相关系数,
其中,αmax,αmin均为预设值,γk-1=(δk-1)TBδk-1,Φ为预设观测矩阵,Ψ为预设正交基矩阵。
若任一采样点的调整后信号强度满足预设条件,则停止对任一采样点的信号强度进行调整。
生成单元132,用于根据满足预设条件的采样点生成降噪后观测信号。
可选地,该语音信号降噪装置中的降噪模块13还用于:
记录已调整次数k+1,若任一采样点的调整后信号强度值不满足预设条件,则将已调整次数加1,以及对任一采样点的信号强度进行剩余次调整,其中,剩余次调整为预设调整次数与已调整次数之差。
可选地,该语音信号降噪装置中的降噪模块13还用于:
针对任一采样点设置相关系数的初始值为:
其中,α0为相关系数的初始值,z0为第二稀疏信号中任一采样点的原始信号强度,▽F(z0)表示原始信号强度的梯度值。
可选地,该语音信号降噪装置中的稀疏变换模块11具体用于:
根据以下公式对原始语音信号进行稀疏变换:X=ΨTS;
其中,X为稀疏信号,S为原始语音信号,ΨT为预设正交基矩阵的转置矩阵。
该语音信号降噪装置中的获取模块12具体用于:
根据以下公式对稀疏信号进行降维处理:Y=ΦX;
其中,Y为观测信号,X为稀疏信号,Φ为预设观测矩阵。
该语音信号降噪装置中的稀疏逆变换模块14具体用于:
根据以下公式对降噪后观测信号进行稀疏逆变换:S'=ΨY';
其中,S'为降噪后语音信号,Ψ为预设正交基矩阵,Y'为降噪后观测信号。
图3所示装置可以执行图1所示实施例的方法,本实施例未详细描述的部分,可参考对图1所示实施例的相关说明。该技术方案的执行过程和技术效果参见图1所示实施例中的描述,在此不再赘述。
以上描述了语音信号降噪装置的内部功能和结构,在一个可能的设计中,语音信号降噪装置的结构可实现为一电子设备,例如手机、蓝牙耳机等等。图4为本发明实施例提供的电子设备实施例一的结构示意图,如图4所示,该电子设备包括:存储器21,以及与存储器连接的处理器22,存储器21用于存储电子设备执行上述任一实施例中提供的语音信号降噪方法的程序,处理器22被配置为用于执行存储器21中存储的程序。
程序包括一条或多条计算机指令,其中,一条或多条计算机指令被处理器22执行时能够实现如下步骤:
对原始语音信号进行稀疏变换,以得到稀疏信号;
通过预设观测矩阵对稀疏信号的降维处理,获取对应于稀疏信号的观测信号;
对观测信号进行降噪处理,以得到降噪后观测信号;
对降噪后观测信号进行稀疏逆变换,以得到降噪后语音信号。
可选地,处理器22还用于执行前述各方法步骤中的全部或部分步骤。
其中,电子设备的结构中还可以包括通信接口23,用于电子设备与其他设备或通信网络通信。
以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助加必需的通用硬件平台的方式来实现,当然也可以通过硬件和软件结合的方式来实现。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以产品的形式体现出来,该计算机产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机装置(可以是个人计算机,服务器,或者网络装置等)执行各个实施例或者实施例的某些部分的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种语音信号降噪方法,其特征在于,包括:
对原始语音信号进行稀疏变换,以得到稀疏信号;
通过预设观测矩阵对所述稀疏信号的降维处理,获取对应于所述稀疏信号的观测信号;
对所述观测信号进行降噪处理,以得到降噪后观测信号;
对所述降噪后观测信号进行稀疏逆变换,以得到降噪后语音信号。
2.根据权利要求1所述的方法,其特征在于,所述对所述观测信号进行降噪处理,以得到降噪后观测信号,包括:
根据以下公式调整所述观测信号中任一采样点的信号强度:
zk+1=zk+λkδk
其中,k+1为信号强度的调整次数,k≥0,zk+1表示第k+1次调整后所述任一采样点的调整后信号强度,zk表示第k+1次调整前所述任一采样点的当前信号强度,λk为调整参数,所述调整参数λk为使函数F(zk+λkδk)具有最小值时对应的λk值,δk为降噪参数,
其中,表示所述zk的梯度值,αk为相关系数,所述相关系数
其中,αmax,αmin均为预设值,γk-1=(δk-1)TBδk-1,Φ为所述预设观测矩阵,Ψ为预设正交基矩阵;
若所述任一采样点的调整后信号强度满足预设条件,则停止对所述任一采样点的信号强度进行调整;
根据满足所述预设条件的采样点生成所述降噪后观测信号。
3.根据权利要求2所述的方法,其特征在于,在所述根据以下公式调整所述观测信号中任一采样点的信号强度之后,所述方法还包括:
记录已调整次数k+1;
若所述任一采样点的调整后信号强度不满足预设条件,则将所述已调整次数加1;
对所述任一采样点的信号强度进行剩余次调整,其中,所述剩余次调整为预设调整次数与所述已调整次数之差。
4.根据权利要求3所述的方法,其特征在于,在所述调整所述观测信号中任一采样点的信号强度之前,所述方法还包括:
针对所述任一采样点设置相关系数的初始值为:
其中,α0为相关系数的初始值,z0为所述观测信号中所述任一采样点的原始信号强度,表示所述原始信号强度的梯度值。
5.根据权利要求1至4中任一项所述的方法,其特征在于,所述对原始语音信号进行稀疏变换,以得到稀疏信号,包括:
根据以下公式对所述原始语音信号进行稀疏变换:X=ΨTS;
其中,X为稀疏信号,S为原始语音信号,ΨT为预设正交基矩阵的转置矩阵;
所述通过预设观测矩阵对所述稀疏信号的降维处理,获取对应于所述稀疏信号的观测信号,包括:
根据以下公式对所述稀疏信号进行降维处理:Y=ΦX;
其中,Y为观测信号,X为稀疏信号,Φ为预设观测矩阵;
所述对所述降噪后观测信号进行稀疏逆变换,以得到降噪后语音信号,包括:
根据以下公式对所述降噪后观测信号进行稀疏逆变换:S'=ΨY';
其中,S'为降噪后语音信号,Ψ为预设正交基矩阵,Y'为降噪后观测信号。
6.一种语音信号降噪装置,其特征在于,包括:
稀疏变换模块,用于对原始语音信号进行稀疏变换,以得到稀疏信号;
获取模块,用于通过预设观测矩阵对所述稀疏信号的降维处理,获取对应于所述稀疏信号的观测信号;
降噪模块,用于对所述观测信号进行降噪处理,以得到降噪后观测信号;
稀疏逆变换模块,用于对所述降噪后观测信号进行稀疏逆变换,以得到降噪后语音信号。
7.根据权利要求6所述的装置,其特征在于,所述降噪模块包括:
调整单元,用于根据以下公式调整所述观测信号中任一采样点的信号强度:
zk+1=zk+λkδk
其中,k+1为信号强度的调整次数,k≥0,zk+1表示第k+1次调整后所述任一采样点的调整后信号强度,zk表示第k+1次调整前所述任一采样点的当前信号强度,λk为调整参数,所述调整参数λk为使函数F(zk+λkδk)具有最小值时对应的λk值,δk为降噪参数,
其中,表示所述zk的梯度值,αk为相关系数,所述相关系数
其中,αmax,αmin均为预设值,γk-1=(δk-1)TBδk-1,Φ为所述观测矩阵,Ψ为预设正交基矩阵;
若所述任一采样点的调整后信号强度满足预设条件,则停止对所述任一采样点的信号强度进行调整;
生成单元,用于根据满足所述预设条件的采样点生成所述降噪后观测信号。
8.根据权利要求7所述的装置,其特征在于,所述降噪模块还用于:
记录已调整次数k+1;
若所述任一采样点的调整后信号强度不满足预设条件,则将所述已调整次数加1;
对所述任一采样点的信号强度进行剩余次调整,其中,所述剩余次调整为预设调整次数与所述已调整次数之差。
9.根据权利要求8所述的装置,其特征在于,所述降噪模块还用于:
针对所述任一采样点设置相关系数的初始值为:
其中,α0为相关系数的初始值,z0为所述观测信号中所述任一采样点的原始信号强度,表示所述原始信号强度的梯度值。
10.一种电子设备,其特征在于,包括:存储器,以及与所述存储器连接的处理器;
所述存储器,用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令供所述处理器调用执行;
所述处理器,用于执行所述一条或多条计算机指令以实现权利要求1至5中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810085623.1A CN108257611A (zh) | 2018-01-29 | 2018-01-29 | 语音信号降噪方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810085623.1A CN108257611A (zh) | 2018-01-29 | 2018-01-29 | 语音信号降噪方法、装置及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108257611A true CN108257611A (zh) | 2018-07-06 |
Family
ID=62742397
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810085623.1A Pending CN108257611A (zh) | 2018-01-29 | 2018-01-29 | 语音信号降噪方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108257611A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102915735A (zh) * | 2012-09-21 | 2013-02-06 | 南京邮电大学 | 一种基于压缩感知的含噪语音信号重构方法及装置 |
CN103595414A (zh) * | 2012-08-15 | 2014-02-19 | 王景芳 | 一种稀疏采样与信号压缩感知重构方法 |
CN103745727A (zh) * | 2013-12-25 | 2014-04-23 | 南京邮电大学 | 一种含噪声语音信号压缩感知方法 |
CN106548780A (zh) * | 2016-10-28 | 2017-03-29 | 南京邮电大学 | 一种语音信号的压缩感知重构方法 |
-
2018
- 2018-01-29 CN CN201810085623.1A patent/CN108257611A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103595414A (zh) * | 2012-08-15 | 2014-02-19 | 王景芳 | 一种稀疏采样与信号压缩感知重构方法 |
CN102915735A (zh) * | 2012-09-21 | 2013-02-06 | 南京邮电大学 | 一种基于压缩感知的含噪语音信号重构方法及装置 |
CN103745727A (zh) * | 2013-12-25 | 2014-04-23 | 南京邮电大学 | 一种含噪声语音信号压缩感知方法 |
CN106548780A (zh) * | 2016-10-28 | 2017-03-29 | 南京邮电大学 | 一种语音信号的压缩感知重构方法 |
Non-Patent Citations (3)
Title |
---|
MÁRIO A. T. FIGUEIREDO ET AL: "Gradient Projection for Sparse Reconstruction: Application to Compressed Sensing and Other Inverse Problems", 《IEEE JOURNAL OF SELECTED TOPICS IN SIGNAL PROCESSING》 * |
叶蕾: "语音信号压缩感知关键技术研究", 《中国博士学位论文全文数据库(信息科技辑)》 * |
屈小波等: "《压缩感知及应用》", 1 October 2015 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8811601B2 (en) | Integrated echo cancellation and noise suppression | |
US20210217433A1 (en) | Voice processing method and apparatus, and device | |
US8781137B1 (en) | Wind noise detection and suppression | |
US9344579B2 (en) | Variable step size echo cancellation with accounting for instantaneous interference | |
CN104980337A (zh) | 一种音频处理的性能提升方法及装置 | |
CN106898359A (zh) | 音频信号处理方法、系统、音频交互装置及计算机设备 | |
KR20050115857A (ko) | 안정성 강제하에서 독립 성분 분석을 사용하여 음향을처리하는 시스템 및 방법 | |
CA2574713A1 (en) | Separation of target acoustic signals in a multi-transducer arrangement | |
US20140198923A1 (en) | Real time audio echo and background noise reduction for a mobile device | |
WO2017099728A1 (en) | System and method for suppression of non-linear acoustic echoes | |
CN112634923B (zh) | 基于指挥调度系统的音频回声消除方法、设备、存储介质 | |
CN110211602B (zh) | 智能语音增强通信方法及装置 | |
CN111063366A (zh) | 降低噪声的方法、装置、电子设备及可读存储介质 | |
US20220301577A1 (en) | Echo cancellation method and apparatus | |
US10636434B1 (en) | Joint spatial echo and noise suppression with adaptive suppression criteria | |
CN109727605A (zh) | 处理声音信号的方法及系统 | |
CN109215672B (zh) | 一种声音信息的处理方法、装置及设备 | |
CN101292508B (zh) | 声回波消除器 | |
US11380312B1 (en) | Residual echo suppression for keyword detection | |
CN101958122A (zh) | 一种回声消除的方法和装置 | |
CN108257611A (zh) | 语音信号降噪方法、装置及电子设备 | |
CN107967919A (zh) | 消除tdd噪声的方法、装置及移动终端 | |
CN107750038B (zh) | 音量调节方法、装置、设备及存储介质 | |
CN104754446B (zh) | 一种麦克风控制方法和装置 | |
CN115620737A (zh) | 语音信号处理装置、方法、电子设备和扩音系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180706 |