CN102150206A - 噪音抑制装置以及声音解码装置 - Google Patents
噪音抑制装置以及声音解码装置 Download PDFInfo
- Publication number
- CN102150206A CN102150206A CN2008801310563A CN200880131056A CN102150206A CN 102150206 A CN102150206 A CN 102150206A CN 2008801310563 A CN2008801310563 A CN 2008801310563A CN 200880131056 A CN200880131056 A CN 200880131056A CN 102150206 A CN102150206 A CN 102150206A
- Authority
- CN
- China
- Prior art keywords
- spectrum
- noise
- signal
- noise suppression
- frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000001629 suppression Effects 0.000 title claims abstract description 178
- 238000001228 spectrum Methods 0.000 claims abstract description 540
- 238000009499 grossing Methods 0.000 claims abstract description 76
- 238000012545 processing Methods 0.000 claims description 167
- 239000000203 mixture Substances 0.000 claims description 122
- 230000006866 deterioration Effects 0.000 claims description 62
- 238000006243 chemical reaction Methods 0.000 claims description 34
- 230000033228 biological regulation Effects 0.000 claims description 13
- 238000000034 method Methods 0.000 abstract description 74
- 230000008569 process Effects 0.000 abstract description 20
- 238000004364 calculation method Methods 0.000 abstract description 2
- 230000000593 degrading effect Effects 0.000 abstract 1
- 238000007792 addition Methods 0.000 description 58
- 230000000694 effects Effects 0.000 description 38
- 230000003595 spectral effect Effects 0.000 description 24
- 238000001514 detection method Methods 0.000 description 23
- 239000012467 final product Substances 0.000 description 17
- 230000008859 change Effects 0.000 description 14
- 238000013139 quantization Methods 0.000 description 9
- 238000010276 construction Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 230000009471 action Effects 0.000 description 7
- 238000011156 evaluation Methods 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 6
- 230000015556 catabolic process Effects 0.000 description 6
- 238000006731 degradation reaction Methods 0.000 description 6
- 239000012141 concentrate Substances 0.000 description 5
- 238000003754 machining Methods 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000003292 diminished effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 101000822695 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C1 Proteins 0.000 description 1
- 101000655262 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C2 Proteins 0.000 description 1
- 241001269238 Data Species 0.000 description 1
- 101000655256 Paraclostridium bifermentans Small, acid-soluble spore protein alpha Proteins 0.000 description 1
- 101000655264 Paraclostridium bifermentans Small, acid-soluble spore protein beta Proteins 0.000 description 1
- 230000005534 acoustic noise Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000013016 damping Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
Abstract
加工成分计算部(14)根据噪音抑制谱(18)与推测噪音谱(17)之比求出变形噪音抑制谱(18a),而且相位加扰部(15)进行相位加扰,得到在主观上察觉不到噪音抑制谱(18)中包含的劣化成分的作为平滑化成分的加工谱(19)。信号加法部(11)对由于噪音抑制部(3)的噪音抑制处理而劣化了的噪音抑制谱(18)的频率成分相加加工谱(19)来抑制劣化成分。
Description
技术领域
本发明涉及对混入到声音/音响信号中的噪音进行抑制的噪音抑制装置以及具备噪音抑制装置的声音解码装置。
背景技术
作为如下噪音抑制处理的代表性的方法,例如有SS(Spectral Subtraction:谱减)法,其中,所述噪音抑制处理为:通过从混入了噪音的输入信号中抑制作为目标外信号的噪音,从而强调作为目标信号的声音信号等。在SS法中,通过从振幅谱中减去另行推测的平均的噪音谱,由此进行噪音抑制(例如,参照非专利文献1)。
在进行了SS法等噪音抑制处理的情况下,噪音谱的推测误差作为失真而残留于噪音抑制处理后的信号中,这具有与处理前的信号大不相同的特性,并且作为刺耳的噪音(还称为人工的噪音、乐音(musical tone))而出现,所以往往会使输出信号的主观质量大幅劣化(变差)。
另外,如果提高声音以及音乐声(musical sound)等声音音响编码方式的压缩率,则与编码时的量化噪音以及符号模型化相伴的谱失真逐渐增大,输出信号的主观质量大幅劣化。特别是在声音音响信号中混入噪音的情况以及在输入信号中仅存在噪音的情况下,编码方式所利用的声音模型、与背景噪音的模型大不相同,所以其劣化变得显著。另外,背景噪音区间中的这些劣化感像“沙沙(シュルシュル)”这样的水流声,有时被称为水流噪音(Water Flow Noise)。
作为对所述那样的主观性的劣化感进行抑制的以往的方法,例如有专利文献1公开的技术。
在专利文献1的音信号加工方法中,以在听觉上减轻由于噪音抑制处理、低比特率声音编码处理而产生的失真感为目的,根据由声音/噪音状态判别单元求出的信号中的噪音比率的推测值,对输入信号与将输入信号进行平滑化而得到的加工信号进行加权相加,从而以包含大量背景噪音等劣化成分的区间为中心来改善主观质量。
非专利文献1:Steven F.Boll“Suppression of Acoustic noise in speech using spectral subtraction”,IEEE Trans.ASSP,Vol.ASSP-27,No.2,April 1979
专利文献1:日本特开2004-272292号公报(第14页~第16页、图4)
以往的噪音抑制装置如上所述构成,所以存在如下课题:输入信号和加工信号的加权相加控制依赖于声音/噪音状态判别单元,如果声音区间检测失败而在包含声音的区间进行加工,则产生回声感(回音感)、噪音感而使质量显著劣化。
另外,在以往的噪音抑制装置中,为了减轻区间判定错误的影响,还举出了使用连续量的区间判定评价值的改善对策,但评价值自身是基于时域中的分析结果的值,对于频域是一定值。因此,存在如下课题:例如,在噪音功率集中于低频那样的汽车行驶噪音混入了的声音信号中,如果以对低频的噪音的劣化感进行抑制的方式调整评价值的阈值,则会错误地加工功率相对地比噪音信号大的高频的声音信号而导致质量劣化,相反,如果进行不会发现高频的声音信号的失真这样的调整,则几乎得不到改善效果。
另外,在以往的噪音抑制装置中,虽然在谱区域中针对每个频率成分控制着加权相加,但控制要素仅是输入信号的振幅谱成分的大小,而并未针对每个频率成分来判定是声音还是噪音,其结果,输入信号是否是声音(或者音乐声)这较大地依赖于时域中的区间判定评价值,如果错误地进行其区间判定,则质量劣化的状况不会改变。
本发明是为了解决所述课题而完成的,目的在于提供一种可以实现听觉上理想的噪音抑制并且即使在高噪音下质量劣化也少的噪音抑制装置以及具备该噪音抑制装置的高质量的声音解码装置。
本发明的噪音抑制装置,具备:时间/频率变换部,将输入信号变换为作为频率成分的输入信号谱;噪音谱推测部,根据输入信号来推测推测噪音谱;噪音谱抑制部,根据推测噪音谱进行输入信号谱的噪音抑制,生成噪音抑制谱;信号变形部,生成根据基于噪音抑制谱和推测噪音谱的比而使噪音抑制谱变形并且平滑化了的加工谱;以及信号加法部,对噪音抑制谱相加加工谱,来抑制该噪音抑制谱中包含的劣化成分。
由此,具有如下效果:不会由于区间判定错误而产生回声感以及噪音感,可以针对每个谱成分改善主观质量。
另外,本发明的声音解码装置,具备:声音解码部,对规定的编码数据进行解码而生成解码信号;时间/频率变换部,将解码信号变换为作为频率成分的解码信号谱;噪音谱推测部,根据解码信号来推测推测噪音谱;信号变形部,生成根据基于解码信号谱和推测噪音谱的比而使解码信号谱变形并且平滑化了的加工谱;以及信号加法部,对解码信号谱相加加工谱,来抑制该解码信号谱中包含的劣化成分。
由此,具有如下效果:不会由于区间判定错误而产生回声感以及噪音感,可以针对每个谱成分改善主观质量。
附图说明
图1是本发明的实施方式1的噪音抑制装置的整体结构图。
图2是示出本发明的实施方式1记载的信号加工部中的一系列的处理内容的动作说明图,是对某个频率的振幅谱和相位谱进行矢量化而表现的图。
图3是说明本发明的实施方式1记载的信号加工部中的一系列的处理的曲线图,示出典型的情况下的谱。
图4(a)是示出本发明的实施方式1记载的信号加工部中的一系列的处理内容的动作说明图,示出对图3的区域B的频率的振幅谱和相位谱进行矢量化而表现的结果。
图4(b)是示出本发明的实施方式1记载的信号加工部中的一系列的处理内容的动作说明图,示出对图3的区域C的频率的振幅谱和相位谱进行矢量化而表现的结果。
图5是本发明的实施方式2的噪音抑制装置的整体结构图。
图6是示出本发明的实施方式2记载的信号加工部中的一系列的处理内容的动作说明图,是对某个频率的振幅谱和相位谱进行矢量化而表现的图。
图7是本发明的实施方式4的噪音抑制装置的整体结构图。
图8是本发明的实施方式5的声音解码装置的整体结构图。
图9是本发明的实施方式6的声音解码装置的整体结构图。
图10是本发明的实施方式8的噪音抑制装置的整体结构图。
图11是本发明的实施方式9的声音解码装置的整体结构图。
图12是本发明的实施方式10的声音解码装置的整体结构图。
具体实施方式
以下,为了进一步详细说明本发明,参照附图来说明用于实施本发明的优选方式。
实施方式1.
图1是示出本实施方式的噪音抑制装置100的整体结构的图。
图1所示的噪音抑制装置100包括时间/频率变换部2、噪音抑制部3、信号加工部4、频率/时间变换部5。噪音抑制部3包括噪音谱抑制部7和噪音谱推测部8,其中,该噪音谱推测部8包括声音/噪音判定部9以及噪音谱更新部10。信号加工部4包括信号加法部11、振幅平滑部12以及信号变形部13,其中,该信号变形部13包括加工成分计算部14以及相位加扰部15。
以下,根据图1,说明噪音抑制装置100的动作原理。
首先,以规定的采样频率(例如,8kHz)进行了采样、并以规定的帧周期(例如,20msec)进行了帧分割的输入信号1被输入到噪音抑制装置100内的时间/频率变换部2和后述说明的噪音谱推测部8内部的声音/噪音判定部9。
时间/频率变换部2对所述的被分割为帧周期的输入信号1进行加窗处理,并对加窗后的信号,使用例如256点的FFT(Fast Fourier Transform:快速傅立叶变换),变换为每个频率的谱成分即输入信号谱16。时间/频率变换部2将该输入信号谱16分别输出到噪音抑制部3内部的噪音谱抑制部7和噪音谱推测部8、信号加工部4内部的振幅平滑部12。在加窗处理中,例如可以使用汉宁窗(Hanning window)、梯形窗等公知的方法。另外,由于FFT是公知的方法,所以省略说明。
在噪音抑制部3中,噪音谱抑制部7使用从后述说明的噪音谱推测部8输入的推测噪音谱17,对从时间/频率变换部2输入的输入信号谱16进行噪音抑制处理,将所得到的结果作为噪音抑制谱18而输出到信号加工部4内部的信号加法部11和加工成分计算部14。
此处,作为噪音谱抑制部7中的噪音抑制处理的方法,除了例如非专利文献1记载那样的基于谱减法的方法、以及根据输入信号谱16和推测噪音谱17的每个频率的信噪比(SN比)对每个谱成分提供衰减量的谱振幅抑制等公知的方法以外,还可以使用将谱减法和谱振幅抑制进行了组合的方法(例如,专利第3454190号“噪音抑制装置以及方法”记载的方法)等。
信号加工部4根据噪音抑制后的输入信号谱即噪音抑制谱18和推测噪音谱17的形态,进行噪音抑制谱18中的劣化成分的加工处理以使在听觉方面变得理想。具体而言,使用噪音谱抑制部7输出的噪音抑制谱18和噪音谱推测部8输出的推测噪音谱17,由信号变形部13生成加工谱19,并由信号加法部11对噪音谱18相加加工谱19而生成加法谱20。然后,振幅平滑部12在时间方向以及频率方向上对加法谱20进行平滑化,生成以使在听觉方面变得理想的方式进行了平滑化加工的平滑化噪音抑制谱21而输出到频率/时间变换部5。在后面详述信号加工部4的处理。
频率/时间变换部5通过对从信号加工部4输入的平滑化噪音抑制谱21进行逆FFT处理而恢复到时域信号,一边进行用于与前后帧的平滑连接的加窗处理一边进行连接,并将所得到的信号作为输出信号6而输出。
噪音谱推测部8进行输入信号1中的平均的噪音谱的推测。首先,声音/噪音判定部9使用输入信号1、时间/频率变换部2输出的输入信号谱16、以及根据过去的帧而推测出的推测噪音谱17,计算像声音的信号VAD。像声音的信号VAD表示当前帧的输入信号1是否是声音或者噪音的程度,例如,是在声音的可能性高的情况下取大的评价值、并在声音的可能性低的情况下取小的评价值的信号。
作为像声音的信号VAD的计算方法,声音/噪音判定部9例如可以分别单独或者组合使用输入信号1的自相关分析的最大值、以及可以根据输入信号1的功率与推测噪音谱17的功率之比来计算的帧SN比。此处,关于式(1)、帧SN比SNRfr,可以通过式(2)分别计算输入信号1的自相关分析结果的最大值ACFmax。
此处,x(t)是时间t下的帧分割后的输入信号1,N是自相关分析区间长度,S(k)是输入信号谱16的第k个成分,N(k)是推测噪音谱17的第k个成分,M是FFT点数。
可以根据通过所述式(1)求出的自相关分析的最大值ACFmax、和通过式(2)求出的帧SN比SNRfr,例如通过下式(3)来计算像声音的信号VAD。
VAD=wACF·ACFmax+wSNR·SNRfr·SNRnorm (3)
此处,SNRnorm是用于将SNRfr的值标准化到0~1范围内的规定的值、wACF以及wSNR是用于加权的规定的值,分别根据噪音的种类或者噪音的功率,以可以适合地判定像声音的信号VAD的方式预先调整即可。另外,ACFmax根据所述式(1)的性质,取0~1的范围的值。声音/噪音判定部9将通过以上所示的处理而计算出的用于噪音谱推测的像声音的信号VAD输出到噪音谱更新部10。
另外,在所述式(3)中,通过将wACF或者wSNR的值中的某一个设定为0,还可以单独利用设定为0以外的一方的参数来计算出像声音的信号VAD。具体而言,在将wSNR设成0的情况下,仅利用自相关分析的最大值ACFmax就求出像声音的信号VAD。
另一方面,在像声音的信号VAD的计算中,还可以追加所述式(3)所示的指标/值以外的分析参数。例如,可以追加如下等各种改善、变更:声音/噪音判定部9使用输入信号谱16和推测噪音谱17,计算出每个频率的谱成分的SN比,利用取该每个频率的谱成分的SN比的总和而得到的值(总和越大,声音的可能性越高)、或者利用每个频率的谱成分的SN比的方差(方差(variance)越大,越是出现声音的谐波构造,声音的可能性越高)。
噪音谱更新部10参照声音/噪音判定部9的输出即像声音的信号VAD,在当前帧的输入信号1的形态是噪音的可能性高的情况下,使用当前帧的输入信号谱16,更新从内部存储器等中保存的过去的帧推测出的推测噪音谱17。噪音谱更新部10例如按照下式(4)将输入信号谱16反映到推测噪音谱17从而进行更新。
其中
k=0,...,M
此处,n是帧编号,N(n-1,k)是更新前的推测噪音谱17,Snoise(n,k)是判断为噪音的可能性高的当前帧的输入信号谱16,N颚化符号(n,k)(由于是电子申请的关系,所以将附加了~记号的字母字符记载为字母颚化符号(alphabet tilde))是更新后的推测噪音谱17。另外,α(k)是取0~1的值的规定的更新速度系数,设定比较接近0的值即可。另外,关于α(k),有时优选随着成为高频而使系数值稍微变大,也可以根据噪音的种类等来进行调整。
以上,噪音谱更新部10通过计算式(4)的右边,并将左边的N颚化符号(n,k)作为新的推测噪音谱17,从而进行更新。噪音谱更新部10将所得到的推测噪音谱17分别输出到所述的噪音谱抑制部7、声音/噪音判定部9、加工成分计算部14以及振幅平滑部12。此处,输出到声音/噪音判定部9的推测噪音谱17在接下来的帧的像声音的评价中被应用。
另外,关于该推测噪音谱17的更新方法,为了进一步提高推测精度、推测追踪性,例如可以进行如下等各种变形、改善:根据像声音的信号VAD的值而应用多个更新速度系数,或者参照帧之间的输入信号功率、推测噪音功率的变动性并在它们的变动大的情况下应用使更新速度加快那样的更新速度系数,或者在某一定时间用功率最小或像声音的信号VAD最小的帧的输入信号谱16来置换(复位)推测噪音谱17。另外,在像声音的信号VAD的值充分大的情况、即当前帧的输入信号1在概率方面是声音的可能性高的情况下,噪音谱更新部10也可以不进行推测噪音谱17的更新。
接下来,说明信号加工部4。
信号变形部13使用噪音谱抑制部7输出的噪音抑制谱18和噪音谱推测部8输出的推测噪音谱17,生成加工谱19。首先,加工成分计算部14针对推测噪音谱17的每个频率成分,取得对其振幅值乘以规定值而得到的值(后述的变形推测噪音谱),以具有与该得到的值相同的振幅值的方式使噪音抑制谱18变形,并作为变形噪音抑制谱18a而输出到相位加扰部15。另外,例如优选噪音抑制处理中的最大抑制量附近的值,作为与推测噪音谱17相乘的规定值。例如,如果最大抑制量是-12dB,则规定值设定为0.25~0.2程度即可,根据噪音的种类、噪音抑制方法、劣化的程度、或者使用者的嗜好而预先进行调整即可。另外,也可以将多个值预先保持在存储器等中,并由加工成分计算部14根据噪音的种类以及噪音功率等而切换为适合的值等。
相位加扰部15进行作为平滑化的一种的相位加扰。相位加扰部15对于由加工成分计算部14计算出的变形噪音抑制谱18a,针对每个频率对其相位成分给予加扰,并将加扰后的谱作为加工谱19而输出到信号加法部11。作为对各相位成分给予加扰的方法,使用随机数来生成规定范围的相位角,并将它与原来的相位角进行相加即可。在不设置相位角生成的范围的限制的情况下,相位加扰部15将各相位成分置换为利用随机数生成的值即可。
另外,关于相位角生成范围的限制,相位加扰部15可以适应性地控制相位角生成范围,例如,在噪音功率非常大且噪音抑制谱18的劣化大的情况下不设置范围的限制、或者根据噪音功率的大小或每个频率的谱的SN比而例如在噪音功率或SN比变低的情况下增大范围等。另外,相位加扰部15也可以在频率轴方向上进行加权,对于加扰的范围的限制,随着成为高频而增大加扰的范围,或在低频中停止相位加扰等。
信号加法部11将加工谱19相加到噪音抑制谱18来抑制噪音抑制谱18中包含的劣化成分,并将所得到的加法谱20输出到振幅平滑部12。
图2是示出信号变形部13和信号加法部11中的一系列的处理内容的动作说明图,是对某个频率的振幅谱和相位谱进行矢量化而表现的图。
图2的(a)示出噪音抑制谱18与推测噪音谱17的关系的一个例子,通过噪音抑制谱18的矢量101、推测噪音谱17的矢量102、对推测噪音谱17的振幅乘以规定值而得到的标量值103、以成为与标量值103相同的振幅值的方式使矢量101变形而得到的变形噪音抑制谱18a的矢量104来表现。
另外,图2的(b)示出噪音抑制谱18、加工谱19以及加法谱20的关系的一个例子,通过噪音抑制谱18的矢量101、变形噪音抑制谱18a的矢量104、对变形噪音抑制谱18a进行相位加扰而得到的加工谱19的矢量105、加法谱20的矢量106来表现。另外,θ是用于对矢量104进行相位加扰的相位角。用虚线圆示出相位加扰的范围(加工谱19的存在范围)A。
另外,图3是举出更具体的例子来说明信号变形部13和信号加法部11的一系列的处理的曲线图,示出典型的情况下的谱。在图3中,纵轴是振幅谱的功率,横轴是频率。虚线表示推测噪音谱17以及对推测噪音谱17乘以比1小的规定的正值而进行了变形的变形推测噪音谱17a,实线表示噪音抑制谱18以及平滑化噪音抑制谱21。另外,单点划线的区域B示出变形推测噪音谱17a的振幅值接近噪音抑制谱18的振幅值的情况的一个例子,区域C示出变形推测噪音谱17a的振幅值比噪音抑制谱18的振幅值小的情况的一个例子。另外,图3的变形推测噪音谱17a相当于对图2的推测噪音谱17的振幅乘以规定值而得到的标量值103。
图4是示出针对图3的区域B、C的信号变形部13和信号加法部11的一系列的处理内容的动作说明图,在图4(a)中对图3的区域B的频率的振幅谱和相位谱进行矢量化来表现,在图4(b)中对图3的区域C的频率的振幅谱和相位谱进行矢量化来表现。另外,在图4中关于与图2相同的结构要素附加同一符号。
如图4(a)所示,在变形推测噪音谱17a的振幅值(相当于标量值103)接近噪音抑制谱18的振幅值(相当于矢量101)的情况下,对推测噪音谱17相乘的规定值被设定为最大抑制量附近,所以可视为对噪音抑制谱18的谱成分以接近最大抑制量的抑制量进行了噪音抑制。换言之,表示该谱成分是噪音。另外,在该情况下,如图3的区域B所示,在噪音抑制谱18中残留有在噪音抑制处理中未能完全抑制的噪音的可能性变高(特别是越是成为高频,即频率越高),作为噪音抑制谱18中的劣化成分的残留噪音D通过加工谱19而接受大的信号加工。
另一方面,如图4(b)所示,在变形推测噪音谱17a的振幅值比噪音抑制谱18的振幅值小的情况下,噪音抑制谱18的谱成分是声音的可能性高,但如图3的区域C所示,由于噪音抑制谱18占优势,所以即使接受基于加工谱19的信号加工,影响也小,几乎没有听觉上的影响。
再次回到噪音抑制装置100的动作原理来进行说明。图1所示的振幅平滑部12对从信号加法部11输入的加法谱20,进行每个频率的谱的振幅成分的平滑化处理,并将平滑化后的谱作为平滑化噪音抑制谱21而输出到频率/时间变换部5。此处,在平滑化处理中,可以使用频率轴方向、时间轴方向(帧间平滑)中的某一个、或者将两者进行组合来使用。作为本实施方式中的适合的例子,振幅平滑部12可以进行例如下式(5)以及(6)所示那样的频率轴以及时间轴双方的平滑化处理。
X(n,0)=SADD(n,0)
X(n,k)=(1-β(k))·SADD(n,k-1)
+β(k)·SADD(n,k)
其中,k=1,...,M
(5)
Y(n,k)=(1-γ(k))·Y(n-1,k)+γ(k)·X(n,k)
其中,k=0,...,M
(6)
此处,所述式(5)表示频率轴方向的平滑化处理,式(6)表示时间轴方向的平滑化,n是帧编号,k是谱成分编号,SADD(n,k)是加法谱20,X(n,k)是频率轴方向的平滑化后的加法谱,Y(n,k)是频率轴/时间轴双方的平滑化后的加法谱、即平滑化噪音抑制谱21。另外,β(k)以及γ(k)分别是频率轴方向、时间轴方向的平滑化系数,是具有0~1的值的规定值。平滑化系数β(k)以及γ(k)的最佳值根据帧长度、希望消除的劣化音的程度而不同,但在本实施方式的结构中,分别优选0.95左右、0.2~0.4程度的值。另外,根据噪音的种类,优选的是进行平滑化系数的频率方向的加权,例如,在功率偏向于低频的汽车行驶噪音等中,进行使低频部的平滑化加强这样的调整即可,对于风噪音、涡轮噪音等“叮(キ一ソ)”这样的处于中~高频的噪音,还可以进行使其频带的频率方向的平滑化加强且相反地使其频带的时间轴方向的平滑化减弱这样的调整,可以特殊化到噪音种类来提高平滑化的效果。
而且,振幅平滑部12在所述振幅平滑化处理中,可以根据输入信号谱16和推测噪音谱17,例如变更或控制平滑化处理方法,或者变更平滑化系数。在本实施方式中,振幅平滑部12使用输入信号谱16和推测噪音谱17的每个频率的SN比(将输入信号谱16设为S、将推测噪音谱17设为N的谱SN比),例如在设成如下的情况下输出声音6的质量良好:在谱SN比小于0.75dB的情况下,进行频率轴方向和时间轴方向双方的平滑化,在谱SN比是0.75dB以上且小于1.5dB的情况下,进行仅时间轴方向的平滑化,在谱SN比是1.5dB以上的情况下使平滑化处理停止。另外,振幅平滑部12也可以代替输入信号谱16而使用噪音抑制谱18。噪音抑制谱18与推测噪音谱17之比如图3的说明所述那样能够成为残留噪音的良好的指标,所以振幅平滑部12可以使更高效地进行平滑化处理,可以进一步改善主观质量。
另外,振幅平滑部12也可以以不会对声音信号造成影响的程度(例如,1dB的振幅),对平滑化处理后的谱成分重叠伪噪音,其中,该伪噪音例如是具有Hoth谱(Hoth spectrum)特性的噪音、褐色噪音(brown noise)、或者对白噪音赋予输入信号中的噪音谱的频率特性(倾斜等)而得到的噪音等。
根据本实施方式1,噪音抑制装置100具备:时间/频率变换部2,将输入信号1变换为作为频率成分的输入信号谱16;噪音谱推测部8,根据输入信号1来推测推测噪音谱17;噪音谱抑制部7,根据推测噪音谱17进行输入信号谱16的噪音抑制,生成噪音抑制谱18;信号变形部13,生成根据基于噪音抑制谱18和推测噪音谱17的比而使噪音抑制谱18变形并且平滑化(相位加扰)了的加工谱19;以及信号加法部11,对噪音抑制谱18相加加工谱19,抑制噪音抑制谱18中包含的劣化成分。
因此,在信号加工部4对由于噪音抑制处理等而劣化的噪音抑制谱18进行规定的加工处理时,可以根据噪音抑制谱18的频率成分的值和推测噪音谱17的频率成分的值,求出在主观上察觉不到噪音抑制谱18中包含的劣化成分的作为平滑化成分的加工谱19,并相加到噪音抑制谱18的频率成分中,抑制劣化成分。其结果,不需要进行在以往的方法中必要的声音/噪音区间判定,其结果,具有如下效果:不会由于区间判定错误而产生回声感、噪音感,可以改善主观质量。
另外,信号加工部4在频域中针对每个谱成分,进行细致的加工成分的生成以及加工处理。因此,例如,即使是混入了噪音功率集中于低频那样的汽车行驶噪音的声音信号,也可以进行在主观上改善低频的噪音的劣化感并且不对高频的声音成分进行加工那样的劣化成分的加工处理,所以具有可以进一步改善主观质量的效果。
另外,信号加工部4根据作为输入信号的噪音抑制谱18、和推测噪音谱17这两者,针对每个谱成分生成加工成分。因此,具有如下效果:可以实现与各谱成分对应的加工控制,例如对于在某个频带中局部地产生了劣化成分的信号等,也可以改善主观质量。
另外,作为信号加工部4的加工处理,进行振幅谱成分的平滑化和相位谱成分的加扰。因此,具有如下效果:对于劣化成分具有的人工的振幅成分以及相位成分,可以良好地抑制这些成分的不稳定的举动,或者给予加扰,可以进一步改善主观质量。
另外,在所述实施方式1中,构成为由相位加扰部15和振幅平滑部12这两者进行对噪音抑制谱18实施的处理,但也可以构成为例如噪音抑制装置100仅具备相位加扰部15而仅实施相位加扰处理等,仅实施某一方的处理。
另外,在所述实施方式1中,在推测噪音谱17的推测中使用了声音/噪音判定部9、噪音谱更新部10,但作为得到噪音谱的单元,不限于该结构,例如也可以采用如下方法:通过使噪音谱的更新速度变得非常缓慢从而省略声音/噪音判定部9,或者不根据输入信号1进行推测噪音谱17的推测而根据仅输入了噪音的噪音推测用的输入信号另行进行分析、推测。
实施方式2.
图5是示出本实施方式的噪音抑制装置100的整体结构的图,是在所述实施方式1的噪音抑制装置100中追加了信号减法部22的结构。在以下的实施方式的说明中,对与之前说明的实施方式1(图1)的结构要素相同或者相当的部分附加同一符号,并省略说明。
加工成分计算部14针对推测噪音谱17的每个频率成分,求出对其振幅值乘以规定值后的值(变形推测噪音谱),以具有与该值相同的振幅值的方式,针对每个频率成分使噪音抑制谱18变形而作为变形噪音抑制谱18a输出到相位加扰部15,并且还输出到信号减法部22。另外,作为对推测噪音谱17相乘的规定值,与实施方式1同样地,根据噪音的种类、噪音抑制方法、劣化音的程度、或者使用者的嗜好,预先调整即可。
信号减法部22进行从由噪音谱抑制部7所输出的噪音抑制谱18中减去变形噪音抑制谱18a的减法处理,将所得到的谱成分输出到信号加法部11。
图6是示出信号变形部13、信号减法部22、以及信号加法部11中的一系列的处理内容的动作说明图,是对某个频率的振幅谱和相位谱进行矢量化而表现的图。在图6中对与图2相同或者相当的部分附加同一符号而省略说明。
图6的(a)与图2的(a)同样地,示出了噪音抑制谱18与推测噪音谱17的关系的一个例子,通过噪音抑制谱18的矢量101、推测噪音谱17的矢量102、对推测噪音谱17的振幅乘以规定值而得到的标量值103、变形噪音抑制谱18a的矢量104、从噪音抑制谱18减去变形噪音抑制谱18a而得到的谱的成分矢量107来表现。
另外,图6的(b)与图2的(b)同样地,示出了噪音抑制谱、与通过图6的(a)得到的加工谱以及加法谱的关系的一个例子,通过噪音抑制谱18的矢量101、变形噪音抑制谱18a的矢量104、加工谱19的矢量105、从噪音抑制谱18减去变形噪音抑制谱18a而得到的谱的成分矢量107、加法谱20的矢量108来表现。
在图6中,与图2不同的点在于,在进行将加工谱19的矢量105相加到噪音抑制谱18的矢量101的处理之前,减去变形噪音抑制谱18a的矢量104。由此,具有如下优点:即使在信号加法部11中为了抑制劣化成分而进行相加加工谱19的处理,噪音抑制谱18的振幅也不会增加。
振幅平滑部12与所述实施方式1同样地,对加法谱20进行振幅平滑化处理。另外,振幅平滑部12也可以以不会对声音信号造成影响的程度(例如,1dB的振幅),对平滑化处理后的谱成分重叠伪噪音,其中,该伪噪音是例如具有Hoth谱特性的噪音、褐色噪音、或者对白噪音赋予输入信号中的噪音谱的频率特性(倾斜等)而得到的噪音等。
根据本实施方式2,在噪音抑制装置100中具备:信号变形部13,生成根据基于噪音抑制谱18和推测噪音谱17的比而使噪音抑制谱18变形了的变形噪音抑制谱18a,并且生成对变形噪音抑制谱18a进行了平滑化(相位加扰)的加工谱19;信号减法部22,从噪音抑制谱18减去变形噪音抑制谱18a;以及信号加法部11,对由信号减法部22减去了变形噪音抑制谱18a的噪音抑制谱18相加加工谱19,抑制噪音抑制谱18中包含的劣化成分。
信号加工部4对于噪音抑制谱18,减去变形噪音抑制谱18a并且相加加工谱19,所以除了所述实施方式1中叙述的效果以外,还具有可以抑制输出信号6的噪音感的增加并且可以进一步改善主观质量的效果。
另外,在所述实施方式2中,如图5所示,在进行了信号减法部22的减法处理之后进行信号加法部11的加法处理,但即使使该顺序颠倒,即在对噪音抑制谱18相加加工谱19之后减去变形噪音抑制谱18a,也可以得到相同的效果,这是显而易见的。
另外,在所述实施方式2中,构成为噪音抑制装置100具备振幅平滑部12,但也可以构成为不具备振幅平滑部12而省略振幅平滑化处理。
另外,在所述实施方式2中,在推测噪音谱17的推测中使用了声音/噪音判定部9、噪音谱更新部10,但与所述实施方式1同样地得到噪音谱的单元不限于该结构,例如也可以采用如下方法:通过使噪音谱的更新速度变得非常缓慢从而省略声音/噪音判定部9,或者不根据输入信号1进行推测噪音谱17的推测而根据仅输入了噪音的噪音推测用的输入信号另行进行分析、推测。
实施方式3.
在所述实施方式1以及2中,在信号变形部13内部的加工成分计算部14的处理中,使用噪音抑制处理中的最大抑制量附近的值,作为针对推测噪音谱17的每个频率相乘的规定值。在本实施方式中,对于针对推测噪音谱17的每个频率相乘的规定值,进行例如在低频下是大的值、在高频下是小的值这样的频率轴方向的加权。在附图上,本实施方式的噪音抑制装置的结构与图1所示的所述实施方式1或者图5所示的实施方式2的噪音抑制装置100的结构相同,仅加工成分计算部14的处理不同。
另外,加工成分计算部14既可以根据噪音的种类或者使用者的嗜好,从例如1个以上的多个表(在程序中记载的情况下是常数排列)中选择频率加权中使用的加权系数,也可以将可根据噪音功率或者推测噪音谱17的低频成分功率与高频成分功率之比而算出的谱倾斜量等作为输入,预先定义生成输出加权系数的函数,针对每个帧,根据该函数生成频率加权中使用的加权系数而依次应用。
根据本实施方式3,加工成分计算部14对用于针对推测噪音谱17的每个频率相乘的规定值进行频率方向的加权。因此,除了所述实施方式1以及2中叙述的效果以外,还具有对于在频率方向上劣化的程度不同的信号也能够改善主观质量的效果。
实施方式4.
在所述实施方式1中,在频域(或者称为谱区域)中实施了噪音抑制处理,但无需一定是该结构,也可以在时域中实施。图7是示出本实施方式的噪音抑制装置100的整体结构的图,代替所述实施方式1的噪音谱抑制部7而具备噪音抑制滤波器部23和时间/频率变换部24。在以下的实施方式的说明中,对与之前说明的实施方式1(图1)的结构要素相同或者相当的部分附加同一符号,并省略说明。
图7所示的噪音抑制滤波器部23输入输入信号1而进行时域中的噪音抑制处理。具体而言,噪音抑制滤波器部23对输入信号1进行例如卡尔曼滤波等与时间轴处理对应的噪音抑制处理,并作为噪音抑制信号而输出到时间/频率变换部24。
时间/频率变换部24将噪音抑制滤波器部23所输出的噪音抑制信号变换为频域的信号。具体而言,时间/频率变换部24进行噪音抑制信号的FFT,将所得到的谱成分作为噪音抑制谱18而输出到信号加法部11和加工成分计算部14。另外,优选时间/频率变换部24的FFT点数、与已经说明的时间/频率变换部2的FFT点数相同,当时间/频率变换部24输出噪音抑制谱18时,使时间/频率变换部2与FFT点数相同即可。即,与时间/频率变换部2的FFT点数相比,时间/频率变换部24在自身的FFT点数更大的情况下,例如对谱成分进行间除(間引き:间拔)或者平均化而输出,在更小的情况下,例如对谱成分进行插值而输出即可。但是,时间/频率变换部2、24的FFT点数无需一定相同。
根据本实施方式4,具有如下效果:作为噪音抑制处理的方法,不论频域、时域如何,都可以改善处理对象的信号的主观质量。
另外,所述实施方式4的结构还可以容易地应用于所述实施方式2以及3,即使在该结构的情况下,也具有如下效果:作为噪音抑制处理的方法,不论频域、时域如何,都可以改善处理对象的信号的主观质量。
实施方式5.
也可以对实施方式1的噪音抑制装置100进行变形,而构成本实施方式所示的声音解码装置200。图8是示出本实施方式的声音解码装置200的整体结构的图。声音解码装置200代替输入信号而被输入编码数据25,新具备对编码数据25进行解码处理的声音解码部26。在图8中对与图1相同或者相当的部分附加同一符号。
首先,编码数据25经由例如未图示的有线或无线通信路径、或者存储器等存储单元等而被输入到声音解码装置200内的声音解码部26。另外,编码数据25是由未图示的声音编码部另行对声音音响信号进行编码而得到的结果。
声音解码部26对编码数据25进行与所述声音编码部的编码处理对应的规定的解码处理,并将解码信号27输出到时间/频率变换部2以及声音/噪音判定部9。
时间/频率变换部2代替输入信号1而对解码信号27,与所述实施方式1同样地进行帧分割以及加窗处理,并对加窗后的信号进行例如FFT。然后,时间/频率变换部2将每个频率的谱成分即解码信号谱28输出到信号加工部4以及噪音谱推测部8。
在噪音谱推测部8中,首先,声音/噪音判定部9使用所输入的解码信号27和解码信号谱28,计算当前帧的像声音的信号。接下来,噪音谱更新部10推测解码信号谱28中的平均的噪音谱,并作为推测噪音谱17而输出。另外,对于该噪音谱推测部8内的结构和各处理,可以使用与所述实施方式1同样的结构和各处理。
信号加工部4内的信号变形部13使用解码信号谱28、和噪音谱推测部8输出的推测噪音谱17,生成加工谱19。首先,在加工成分计算部14中,针对推测噪音谱17的每个频率成分,得到对其振幅值乘以规定值后的值,以具有与该得到的值相同的振幅值的方式,针对每个频率成分使解码信号谱28变形,并作为变形解码信号谱28a而输出到相位加扰部15。另外,与实施方式1不同,在本实施方式中不进行噪音抑制处理,所以对推测噪音谱17相乘的规定值并非是最大抑制量附近的值,而例如设定为1或者比1稍微小的值、或者根据声音编码方法、解码信号27的劣化程度或使用者的嗜好而预先调整即可。另外,还可以将多个值预先保持在存储器等中,并由加工成分计算部14根据声音编码方法的种类等而切换为适合的值。
相位加扰部15对于由加工成分计算部14计算出的变形解码信号谱28a,针对每个频率向其相位成分提供加扰,并将加扰后的谱作为加工谱19而输出到信号加法部11。对各相位成分提供加扰的方法以及相位加扰范围的控制方法可以使用与实施方式1同样的方法。
信号加法部11对解码信号谱28相加加工谱19,并将所得到的加法谱20输出到振幅平滑部12。
振幅平滑部12对从信号加法部11输入的加法谱20,进行每个频率的谱的振幅成分的平滑化处理,并将平滑化后的谱作为平滑化解码信号谱29而输出到频率/时间变换部5。另外,关于该振幅平滑部12的结构、处理以及平滑化控制方法等,可以使用与实施方式1同样的结构、处理以及平滑化控制方法等,关于各参数等,例如根据声音编码方法或者解码信号27的劣化程度而预先调整即可。
另外,振幅平滑部12也可以以不会对声音信号造成影响的程度(例如,1dB的振幅),对平滑化处理后的谱成分重叠人工地生成的伪噪音,其中,该伪噪音例如是具有Hoth谱特性的噪音、褐色噪音、或者对白噪音赋予输入信号中的噪音谱的频率特性(倾斜等)而得到的噪音等。
频率/时间变换部5通过对从信号加工部4输入的平滑化解码信号谱29进行逆FFT处理从而恢复到时域信号,进行用于与前后帧的平滑连接的加窗处理并且进行连接,并将所得到的信号作为输出信号6而输出。
根据本实施方式5,声音解码装置200具备:声音解码部26,对规定的编码数据25进行解码而生成解码信号27;时间/频率变换部2,将解码信号27变换为作为频率成分的解码信号谱28;噪音谱推测部8,从解码信号27推测推测噪音谱17;信号变形部13,生成根据基于解码信号谱28和推测噪音谱17的比而使解码信号谱28变形并且平滑化(相位加扰)了的加工谱19;以及信号加法部11,对解码信号谱28相加加工谱19,来抑制解码信号谱28中包含的劣化成分。
因此,在信号加工部4对由于声音编码处理而劣化了的解码信号谱28进行规定的加工处理时,可以根据解码信号谱28的频率成分的值和推测噪音谱17的频率成分的值,求出在主观上察觉不到解码信号谱28中包含的劣化成分的作为平滑化成分的加工谱19,并相加到解码信号谱28的频率成分中,抑制劣化成分。其结果,不需要进行在以往的方法中必要的声音/噪音区间判定,其结果,具有如下效果:不会由于区间判定错误而产生回声感、噪音感,可以改善主观质量。
另外,信号加工部4在频域中针对每个谱成分,进行细致的加工成分的生成以及加工处理。因此,例如,即使是混入了噪音功率集中于低频那样的汽车行驶噪音的声音信号,也可以进行在主观上改善低频的噪音的劣化感并且不对高频的声音成分进行加工那样的劣化成分的加工处理,所以具有可以进一步改善主观质量的效果。
另外,信号加工部4根据作为输入信号的解码信号谱28、与推测噪音谱17这两者,针对每个谱成分生成加工成分。因此,具有如下效果:可以实现与各谱成分对应的加工控制,例如对于在某个频带中局部地产生了劣化成分的信号等,也可以改善主观质量。
另外,作为信号加工部4的加工处理,进行振幅谱成分的平滑化和相位谱成分的加扰。因此,具有如下效果:针对劣化成分所具有的人工的振幅成分以及相位成分,可以良好地抑制这些成分的不稳定的举动,或者提供加扰,可以进一步改善主观质量。
另外,在所述实施方式5中,构成为由相位加扰部15和振幅平滑部12这两者进行对解码信号谱28实施的处理,但也可以构成为例如声音解码装置200仅具备相位加扰部15而仅实施相位加扰处理等,仅实施某一方的处理。
另外,在所述实施方式5中,在推测噪音谱17的推测中,使用了声音/噪音判定部9、噪音谱更新部10,但与所述实施方式1同样地,得到噪音谱的单元不限于该结构,例如也可以采用如下方法:通过使噪音谱的更新速度变得非常缓慢从而省略声音/噪音判定部9,或者不根据解码信号27进行推测噪音谱17的推测而根据仅输入了噪音的噪音推测用的输入信号另行进行分析、推测。
实施方式6.
也可以与所述实施方式5同样地,将所述实施方式2的噪音抑制装置100进行变形,而构成本实施方式所示那样的声音解码装置200。图9是示出本实施方式的声音解码装置200的整体结构的图。在图9中对与图5或者图8相同或者相当的部分附加同一符号而省略说明。
加工成分计算部14针对推测噪音谱17的每个频率成分,得到对其振幅值乘以规定值后的值,以具有与该得到的值相同的振幅值的方式,针对每个频率成分使解码信号谱28变形,并作为变形解码信号谱28a而输出到相位加扰部15,并且还输出到信号减法部22。另外,对推测噪音谱17相乘的规定值与所述实施方式5同样地,例如设定为1或者比1稍微小的值,或者根据声音编码方法、解码信号27的劣化程度或者使用者的嗜好而预先调整即可。另外,还可以将多个值预先保持在存储器等中,并由加工成分计算部14根据声音编码方法的种类等而切换为适合的值。
信号减法部22进行从由时间/频率变换部2所输出的解码信号谱28中减去变形解码信号谱28a的减法处理,并将所得到的谱成分输出到信号加法部11。
振幅平滑部12与所述实施方式5同样地,对加法谱20进行振幅平滑化处理。另外,振幅平滑部12也可以以不会对声音信号造成影响的程度(例如,1dB的振幅),对平滑化处理后的谱成分重叠人工地生成的伪噪音,其中,该伪噪音例如是具有Hoth谱特性的噪音、褐色噪音、或者对白噪音赋予了输入信号中的噪音谱的频率特性(倾斜等)而得到的噪音等。
根据本实施方式6,声音解码装置200具备:信号变形部13,生成根据基于解码信号谱28和推测噪音谱17的比而使解码信号谱28变形了的变形解码信号谱28a,并且生成对变形解码信号谱28a进行了平滑化(相位加扰)的加工谱19;信号减法部22,从解码信号谱28减去变形解码信号谱28a;以及信号加法部11,对由信号减法部22减去了变形解码信号谱28a后的解码信号谱28相加加工谱19,来抑制解码信号谱28中包含的劣化成分。
信号加工部4对于解码信号谱28,减去变形解码信号谱28a并且相加加工谱19,所以除了所述实施方式5中叙述的效果以外,还具有可以抑制输出信号6的噪音感的增加、并且可以进一步改善主观质量的效果。
另外,在所述实施方式6中,如图9所示,在进行了信号减法部22的减法处理之后,进行信号加法部11的加法处理,但即使使该顺序颠倒,即在对解码信号谱28相加加工谱19之后减去变形解码信号谱28a,也可以得到相同的效果,这是显而易见的。
另外,在所述实施方式6中,构成为声音解码装置200具备振幅平滑部12,但也可以构成为不具备振幅平滑部12而省略振幅平滑化处理。
另外,在所述实施方式6中,在推测噪音谱17的推测中,使用了声音/噪音判定部9、噪音谱更新部10,但与所述实施方式1同样地,得到噪音谱的单元不限于该结构,例如也可以采用如下方法:通过使噪音谱的更新速度变得非常缓慢从而省略声音/噪音判定部9,或者不根据解码信号27进行推测噪音谱17的推测而根据仅输入了噪音的噪音推测用的输入信号另行进行分析、推测。
实施方式7.
在所述实施方式5以及6中,在信号变形部13内部的加工成分计算部14的处理中,使用在频率轴方向上一定的值,来作为针对推测噪音谱17的每个频率相乘的规定值。在本实施方式中,对于针对推测噪音谱17的每个频率相乘的规定值,进行例如在低频下是大的值、在高频下是小的值这样的频率轴方向的加权。在附图上,本实施方式的声音解码装置200的结构与图8所示的实施方式5或者图9所示的实施方式6的声音解码装置200的结构相同,仅加工成分计算部14的处理不同。
另外,加工成分计算部14既可以根据声音编码方法的种类或者使用者的嗜好,从例如1个以上的多个表(在程序中记载的情况下是常数排列)中选择频率加权中使用的加权系数,也可以将可根据噪音功率或者推测噪音谱17的低频成分功率与高频成分功率之比而算出的谱倾斜量等作为输入,预先定义生成输出加权系数的函数,针对每个帧生成加权系数而依次应用。
根据本实施方式7,加工成分计算部14对用于针对推测噪音谱17的每个频率相乘的规定值进行频率方向的加权。因此,除了所述实施方式5以及6中叙述的效果以外,还具有对于在频率方向上劣化的程度不同的信号也可以改善主观质量的效果。
实施方式8.
在所述实施方式1中,构成为信号加工部4根据基于推测噪音谱17和噪音抑制谱18的比而生成加工谱19,但在本实施方式中,也可以构成为根据基于推测噪音谱17和噪音抑制谱18的比而控制噪音抑制谱18的相位加扰的幅度。
图10是示出本实施方式的噪音抑制装置100的整体结构的图。图10所示的噪音抑制装置100的信号加工部4与图1所示的所述实施方式1的信号加工部4不同,包括相位加扰部30、相位控制部31以及振幅平滑部12。另外,在图10中,对与图1相同或者相当的部分附加同一符号而省略说明。
相位控制部31在被输入了噪音抑制谱18和推测噪音谱17时,例如计算出噪音抑制谱18与推测噪音谱17的每个频率的SN比(将噪音抑制谱18设为S、并将推测噪音谱17设为N的谱SN比)。接下来,相位控制部31根据所计算出的谱SN比而计算出用于对相位加扰的幅度进行控制的相位控制信号32,并输出到相位加扰部30。
作为相位加扰的范围的控制方法,例如有如下方法:在谱SN比小的情况下控制成使相位加扰的范围变大,相反在谱SN比大的情况下控制成使其范围变小。作为对相位加扰的范围进行指示的相位控制信号32的设定方法,例如有如下方法:将多个与谱SN比对应的规定值存储在表等中,并由相位控制部31将与和计算出的谱SN比最接近的表上的谱SN比对应的规定值作为相位控制信号32而输出。或者,也可以预先定义将谱SN比作为输入且输出相位控制信号32的规定的函数,并由相位控制部31使用该函数来计算相位控制信号32。在使用任一个方法的情况下,只要根据噪音的种类、噪音抑制方法、劣化的程度或者使用者的嗜好而预先调整即可。
另外,在相位加扰的范围的控制中,相位控制部31也可以在频率轴方向上进行加权,例如,随着成为高频而增大加扰的范围,在低频中停止相位加扰等。相位控制部31既可以根据噪音抑制方法的种类或者使用者的嗜好,从例如1个以上的多个表(在程序中记载的情况下是常数排列)中选择频率加权中使用的加权系数,也可以将可根据噪音功率或者推测噪音谱17的低频成分功率与高频成分功率之比而算出的谱倾斜量等作为输入,并预先定义生成输出加权系数的函数,针对每个帧生成加权系数而依次应用。
另外,作为所述相位加扰的范围的控制要素,为简化说明而例示了谱SN比,但不限于该结构,例如也可以将可根据噪音抑制谱18的全频带功率与推测噪音谱17的全频带功率之比、以及推测噪音谱17的低频成分功率与高频成分功率之比而算出的谱倾斜量等作为控制要素来进行组合使用。通过追加这些控制要素,相位控制部31可以进一步高精度地控制相位加扰的范围,可以进一步改善主观质量。
相位加扰部30按照用于对相位控制部31所输出的相位加扰的幅度进行控制的相位控制信号32进行噪音抑制谱18的相位加扰,并作为相位加扰谱33而输出。另外,即使代替相位加扰部30而使用图1所示的所述实施方式1记载的相位加扰部15的结构,也起到同样的效果。
振幅平滑部12对于从相位加扰部30输入的相位加扰谱33,进行每个频率的谱的振幅成分的平滑化处理,并将平滑化后的谱作为平滑化噪音抑制谱21而输出到频率/时间变换部5。另外,关于该振幅平滑部12的结构、处理以及平滑化控制方法等,可以使用与实施方式1同样的结构、处理以及平滑化控制方法等,关于各参数等,例如根据噪音抑制方法的种类或者信号的劣化程度而预先调整即可。
另外,振幅平滑部12也可以以不会对声音信号造成影响的程度(例如,1dB的振幅),对平滑化处理后的谱成分重叠人工地生成的伪噪音,其中,该伪噪音例如是具有Hoth谱特性的噪音、褐色噪音、或者对白噪音赋予输入信号中的噪音谱的频率特性(倾斜等)而得到的噪音等。
根据本实施方式8,噪音抑制装置100构成为在信号加工部4对由于噪音抑制处理等而劣化的噪音抑制谱18进行规定的加工处理时,根据作为输入信号的噪音抑制谱18的频率成分的值、和推测噪音谱17的频率成分的值,以使在主观上察觉不到噪音抑制谱18中包含的劣化成分的方式进行相位加扰。因此,不需要进行在以往的方法中必要的声音/噪音区间判定,其结果具有如下效果:不会由于区间判定错误而产生回声感、噪音感,可以改善主观质量。
另外,信号加工部4在频域中针对每个谱成分,进行细致的加工处理。因此,例如,即使是混入了噪音功率集中于低频那样的汽车行驶噪音的声音信号,也可以进行在主观上改善低频的噪音的劣化感、并且不对高频的声音成分进行加工那样的劣化成分的加工处理,所以具有可以进一步改善主观质量的效果。
另外,信号加工部4根据作为输入信号的噪音抑制谱18、和推测噪音谱17这两者,针对每个谱成分进行加工处理。因此,具有如下效果:可以实现与各谱成分对应的加工控制,例如对于在某个频带中局部地产生了劣化成分的信号等,也可以改善主观质量。
另外,作为信号加工部4的加工处理,进行振幅谱成分的平滑化、和相位谱成分的加扰。因此,具有如下效果:针对劣化成分所具有的人工的振幅成分以及相位成分,可以良好地抑制这些成分的不稳定的举动、或提供加扰,可以进一步改善主观质量。
另外,在所述实施方式8中,构成为噪音抑制装置100具备振幅平滑部12,但也可以构成为不具备振幅平滑部12而省略振幅平滑化处理。
另外,在所述实施方式8中,在推测噪音谱17的推测中,使用了声音/噪音判定部9、噪音谱更新部10,但与所述实施方式1同样地,得到噪音谱的单元不限于该结构,例如也可以采用如下方法:通过使噪音谱的更新速度变得非常缓慢从而省略声音/噪音判定部9,或者不根据输入信号1进行推测噪音谱17的推测,而根据仅输入了噪音的噪音推测用的输入信号另行进行分析、推测。
另外,在所述实施方式8中,在频域中实施了噪音抑制处理,但无需一定是该结构,通过组合所述实施方式8和所述实施方式4的结构从而对时域的噪音抑制处理也可以实施。具体而言,将实施方式4的信号加工部4置换为实施方式8的信号加工部4。
在该结构的情况下,作为噪音抑制处理的方法,具有不论是频域还是时域都可以改善其主观质量的效果。
实施方式9.
与所述实施方式8同样地,将所述实施方式5的声音解码装置200进行变形,代替由信号加工部4根据基于解码信号谱28和推测噪音谱17的比来生成加工谱19,而根据基于解码信号谱28和推测噪音谱17的比来控制解码信号谱28的相位加扰的幅度。
图11是示出本实施方式的声音解码装置200的整体结构的图。图11所示的声音解码装置200的信号加工部4与图8所示的所述实施方式5的信号加工部4不同,包括相位加扰部30、相位控制部31以及振幅平滑部12。在图11中对与图5或者图8相同或者相当的部分附加同一符号而省略说明。
相位控制部31在被输入了解码信号谱28和推测噪音谱17时,例如计算出解码信号谱28和推测噪音谱17的每个频率的SN比(将解码信号谱28设为S、并将推测噪音谱17设为N的谱SN比)。接下来,相位控制部31根据计算出的谱SN比而计算出用于对相位加扰的幅度进行控制的相位控制信号32,并输出到相位加扰部30。
作为相位加扰的范围的控制方法,例如有如下方法:在谱SN比小的情况下控制成使相位加扰的范围变大,相反在谱SN比大的情况下控制成使其范围变小。作为对相位加扰的范围进行指示的相位控制信号32的设定方法、加扰的范围的控制、以及控制要素,可以使用与实施方式8中的处理同样的方法,根据声音编码方法的种类、劣化的程度或者使用者的嗜好而预先调整即可。
相位加扰部30按照相位控制部31所输出的相位控制信号32进行解码信号谱28的相位加扰,并作为相位加扰谱33而输出。另外,代替相位加扰部30而使用图1所示的所述实施方式1记载的相位加扰部15的结构,也起到同样的效果。
振幅平滑部12对从相位加扰部30输入的相位加扰谱33,进行每个频率的谱的振幅成分的平滑化处理,并将平滑化后的谱作为平滑化解码信号谱29而输出到频率/时间变换部5。另外,关于该振幅平滑部12的结构、处理以及平滑化控制方法等,可以使用与所述实施方式5同样的结构、处理以及平滑化控制方法等,关于各参数等,例如根据声音编码方法的种类或者信号的劣化程度而预先调整即可。
另外,振幅平滑部12也可以以不会对声音信号造成影响的程度(例如,1dB的振幅),对平滑化处理后的谱成分重叠人工地生成的伪噪音,其中,该伪噪音例如是具有Hoth谱特性的噪音、褐色噪音、或者对白噪音赋予输入信号中的噪音谱的频率特性(倾斜等)而得到的噪音等。
根据本实施方式9,在声音解码装置200中,在信号加工部4对由于声音编码处理而劣化的解码信号谱28进行规定的加工处理时,根据作为输入信号的解码信号谱28的频率成分的值、和推测噪音谱17的频率成分的值,以在主观上察觉不到解码信号谱28中包含的劣化成分的方式进行相位加扰。因此,不需要进行在以往的方法中必要的声音/噪音区间判定,其结果,具有如下效果:不会由于区间判定错误而产生回声感、噪音感,可以改善主观质量。
另外,信号加工部4在频域中针对每个谱成分,进行细致的加工处理。因此,例如,即使是混入了噪音功率集中于低频那样的汽车行驶噪音的声音信号,也可以进行在主观上改善低频的噪音的劣化感、并且不对高频的声音成分进行加工那样的劣化成分的加工处理,所以具有可以进一步改善主观质量的效果。
另外,信号加工部4根据作为输入信号的解码信号谱28、和推测噪音谱17这两者,针对每个谱成分进行加工处理。因此,具有如下效果:可以实现与各谱成分对应的加工控制,例如对于在某个频带中局部地产生了劣化成分的信号等,也可以改善主观质量。
另外,作为信号加工部4的加工处理,进行振幅谱成分的平滑化、和相位谱成分的加扰。因此,具有如下效果:针对劣化成分所具有的人工的振幅成分以及相位成分,可以良好地抑制这些成分的不稳定的举动、或提供加扰,可以进一步改善主观质量。
另外,在所述实施方式9中,构成为声音解码装置200具备振幅平滑部12,但也可以构成为不具备振幅平滑部12而省略振幅平滑化处理。
另外,在所述实施方式9中,在推测噪音谱17的推测中使用了声音/噪音判定部9、噪音谱更新部10,但与所述实施方式1同样地,得到噪音谱的单元不限于该结构,例如也可以采用如下方法:通过使噪音谱的更新速度变得非常缓慢从而省略声音/噪音判定部9,或者不根据解码信号27进行推测噪音谱17的推测而根据仅输入了噪音的噪音推测用的输入信号另行进行分析、推测。
实施方式10.
在所述实施方式5~7以及9中,信号加工部4构成为将解码信号谱28作为加工对象而实施加工处理,但也可以构成为如图12所示,在由噪音谱抑制部7进行了解码信号27的噪音抑制处理之后,由信号加工部4进行信号加工。图12是示出本实施方式的声音解码装置200的整体结构的图。在图12中,示出了为了进行噪音抑制处理而具备噪音谱抑制部7的结构,但也可以构成为代替噪音谱抑制部7而具备噪音抑制滤波器部23以及时间/频率变换部24(图7)。另外,在图12中对与图1~11相同或者相当的部分附加同一符号而省略说明。
作为本实施方式的噪音抑制处理,可以使用所述实施方式1叙述那样的通过噪音谱抑制部7实现的频域中的噪音抑制方法、或者所述实施方式4叙述那样的通过噪音抑制滤波器部23实现的时域中的噪音抑制方法。此时,在解码信号谱28中,除了与声音编码处理相伴的劣化以外,还新加入与噪音抑制处理相伴的劣化,但根据劣化程度,适宜地调整信号加工部4内的未图示的信号变形部13、振幅平滑部12、相位控制部31的控制方法以及各种参数即可。
而且,作为在声音解码部26的后级连续的处理,例示噪音抑制处理而进行了说明,但例如还可以置换为共振峰强调或听觉屏蔽处理等的后置滤波处理、振幅动态范围压缩处理等其他信号加工处理。
根据本实施方式10,具有如下效果:对于包含声音编码处理起因以外的劣化成分的信号,也可以加工成主观上良好的信号,可以改善主观质量。
实施方式11.
在所述实施方式1~10中,构成为时间/频率变换部2通过FFT来计算谱成分,频率/时间变换部5使实施了加工处理后的谱成分通过逆FFT处理而恢复到时域的信号,但也可以代替FFT而对带通滤波器群的各输出,实施加工处理,并通过按频带的信号的相加而得到输出信号,还可以使用小波(Wavelet)变换等变换函数。
根据本实施方式11,即使是没有使用傅立叶变换的结构,也能得到与实施方式1~10中叙述的效果同样的效果。
另外,在所述实施方式1~11中,也可以代替相位加扰部15的结构而使用相位加扰部30(以及相位控制部31)的结构,另外,也可以代替相位加扰部30(以及相位控制部31)的结构而使用相位加扰部15的结构。
产业上的可利用性
如上所述,本发明的噪音抑制装置以及声音解码装置通过对声音/音响信号等目的信号以外的噪音进行抑制,从而可以实现音质改善以及声音识别率等的提高,所以适用于在各种噪音环境下使用的便携电话以及对讲机(interphone)等的声音通信系统、非手持式通话系统、电视会议系统、监视系统、声音储存系统、声音识别系统等。
Claims (12)
1.一种噪音抑制装置,具备:
时间/频率变换部,将输入信号变换为作为频率成分的输入信号谱;
噪音谱推测部,根据所述输入信号来推测推测噪音谱;
噪音谱抑制部,根据所述推测噪音谱进行所述输入信号谱的噪音抑制,生成噪音抑制谱;
信号变形部,生成根据基于所述噪音抑制谱和所述推测噪音谱的比而使所述噪音抑制谱变形并且平滑化了的加工谱;以及
信号加法部,对所述噪音抑制谱相加所述加工谱,来抑制该噪音抑制谱中包含的劣化成分。
2.根据权利要求1所述的噪音抑制装置,其特征在于,
信号变形部生成进行了频率轴方向的加权的加工谱。
3.一种噪音抑制装置,具备:
时间/频率变换部,将输入信号变换为作为频率成分的输入信号谱;
噪音谱推测部,根据所述输入信号来推测推测噪音谱;
噪音谱抑制部,根据所述推测噪音谱进行所述输入信号谱的噪音抑制,生成噪音抑制谱;
信号变形部,生成根据基于所述噪音抑制谱和所述推测噪音谱的比而使所述噪音抑制谱变形了的变形噪音抑制谱,并且生成对该变形噪音抑制谱进行了平滑化的加工谱;
信号减法部,从所述噪音抑制谱减去所述变形噪音抑制谱;以及
信号加法部,对由所述信号减法部减去了所述变形噪音抑制谱后的所述噪音抑制谱相加所述加工谱,来抑制该噪音抑制谱中包含的劣化成分。
4.根据权利要求3所述的噪音抑制装置,其特征在于,
信号变形部生成进行了频率轴方向的加权的加工谱。
5.一种噪音抑制装置,具备:
时间/频率变换部,将输入信号变换为作为频率成分的输入信号谱;
噪音谱推测部,根据所述输入信号来推测推测噪音谱;
噪音谱抑制部,根据所述推测噪音谱进行所述输入信号谱的噪音抑制,生成噪音抑制谱;以及
相位加扰部,以与基于所述噪音抑制谱和所述推测噪音谱的比对应的程度,对所述噪音抑制谱的相位进行加扰。
6.根据权利要求5所述的噪音抑制装置,其特征在于,
相位加扰部求出进行了频率轴方向的加权的相位加扰的程度。
7.一种声音解码装置,具备:
声音解码部,对规定的编码数据进行解码而生成解码信号;
时间/频率变换部,将所述解码信号变换为作为频率成分的解码信号谱;
噪音谱推测部,根据所述解码信号来推测推测噪音谱;
信号变形部,生成根据基于所述解码信号谱和所述推测噪音谱的比而使所述解码信号谱变形并且平滑化了的加工谱;以及
信号加法部,对所述解码信号谱相加所述加工谱,来抑制该解码信号谱中包含的劣化成分。
8.根据权利要求7所述的声音解码装置,其特征在于,
信号变形部生成进行了频率轴方向的加权的加工谱。
9.一种声音解码装置,具备:
声音解码部,对规定的编码数据进行解码而生成解码信号;
时间/频率变换部,将所述解码信号变换为作为频率成分的解码信号谱;
噪音谱推测部,根据所述解码信号来推测推测噪音谱;
信号变形部,生成根据基于所述解码信号谱和所述推测噪音谱的比而使所述解码信号谱变形了的变形解码信号谱,并且生成对该变形解码信号谱进行了平滑化的加工谱;
信号减法部,从所述解码信号谱减去所述变形解码信号谱;以及
信号加法部,对由所述信号减法部减去了所述变形解码信号谱后的所述解码信号谱相加所述加工谱,来抑制该解码信号谱中包含的劣化成分。
10.根据权利要求9所述的声音解码装置,其特征在于,
信号变形部生成进行了频率轴方向的加权的加工谱。
11.一种声音解码装置,具备:
声音解码部,对规定的编码数据进行解码而生成解码信号;
时间/频率变换部,将所述解码信号变换为作为频率成分的解码信号谱;
噪音谱推测部,根据所述解码信号来推测推测噪音谱;以及
相位加扰部,以与基于所述解码信号谱和所述推测噪音谱的比对应的程度,对所述解码信号谱的相位进行加扰。
12.根据权利要求11所述的声音解码装置,其特征在于,
相位加扰部求出进行了频率轴方向的加权的相位加扰的程度。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2008/003021 WO2010046954A1 (ja) | 2008-10-24 | 2008-10-24 | 雑音抑圧装置および音声復号化装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102150206A true CN102150206A (zh) | 2011-08-10 |
CN102150206B CN102150206B (zh) | 2013-06-05 |
Family
ID=42119013
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2008801310563A Expired - Fee Related CN102150206B (zh) | 2008-10-24 | 2008-10-24 | 噪音抑制装置以及声音解码装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20110125490A1 (zh) |
EP (1) | EP2346032B1 (zh) |
JP (1) | JP5153886B2 (zh) |
CN (1) | CN102150206B (zh) |
WO (1) | WO2010046954A1 (zh) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8725506B2 (en) * | 2010-06-30 | 2014-05-13 | Intel Corporation | Speech audio processing |
CN103109320B (zh) | 2010-09-21 | 2015-08-05 | 三菱电机株式会社 | 噪声抑制装置 |
US9531344B2 (en) * | 2011-02-26 | 2016-12-27 | Nec Corporation | Signal processing apparatus, signal processing method, storage medium |
CN103137133B (zh) * | 2011-11-29 | 2017-06-06 | 南京中兴软件有限责任公司 | 非激活音信号参数估计方法及舒适噪声产生方法及系统 |
CA2806372C (en) | 2012-02-16 | 2016-07-19 | Qnx Software Systems Limited | System and method for dynamic residual noise shaping |
CN104662605A (zh) * | 2012-07-25 | 2015-05-27 | 株式会社尼康 | 信号处理装置、拍摄装置及程序 |
GB2520048B (en) * | 2013-11-07 | 2018-07-11 | Toshiba Res Europe Limited | Speech processing system |
US9721580B2 (en) * | 2014-03-31 | 2017-08-01 | Google Inc. | Situation dependent transient suppression |
CN105338148B (zh) * | 2014-07-18 | 2018-11-06 | 华为技术有限公司 | 一种根据频域能量对音频信号进行检测的方法和装置 |
JP6379839B2 (ja) * | 2014-08-11 | 2018-08-29 | 沖電気工業株式会社 | 雑音抑圧装置、方法及びプログラム |
US9953661B2 (en) * | 2014-09-26 | 2018-04-24 | Cirrus Logic Inc. | Neural network voice activity detection employing running range normalization |
JP6669277B2 (ja) * | 2016-12-20 | 2020-03-18 | 三菱電機株式会社 | 音声ノイズ検出装置、デジタル放送受信装置、及び音声ノイズ検出方法 |
US11282531B2 (en) * | 2020-02-03 | 2022-03-22 | Bose Corporation | Two-dimensional smoothing of post-filter masks |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1281576A (zh) * | 1997-12-08 | 2001-01-24 | 三菱电机株式会社 | 声音信号加工方法和声音信号加工装置 |
JP2005258158A (ja) * | 2004-03-12 | 2005-09-22 | Advanced Telecommunication Research Institute International | ノイズ除去装置 |
US7092516B2 (en) * | 2001-09-20 | 2006-08-15 | Mitsubishi Denki Kabushiki Kaisha | Echo processor generating pseudo background noise with high naturalness |
CN101154384A (zh) * | 2006-09-25 | 2008-04-02 | 富士通株式会社 | 声音信号纠正方法、声音信号纠正设备以及计算机程序 |
Family Cites Families (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4630305A (en) * | 1985-07-01 | 1986-12-16 | Motorola, Inc. | Automatic gain selector for a noise suppression system |
JP3259759B2 (ja) * | 1996-07-22 | 2002-02-25 | 日本電気株式会社 | 音声信号伝送方法及び音声符号復号化システム |
JP4230414B2 (ja) | 1997-12-08 | 2009-02-25 | 三菱電機株式会社 | 音信号加工方法及び音信号加工装置 |
US6088668A (en) * | 1998-06-22 | 2000-07-11 | D.S.P.C. Technologies Ltd. | Noise suppressor having weighted gain smoothing |
WO2000046789A1 (fr) * | 1999-02-05 | 2000-08-10 | Fujitsu Limited | Detecteur de la presence d'un son et procede de detection de la presence et/ou de l'absence d'un son |
JP3454190B2 (ja) * | 1999-06-09 | 2003-10-06 | 三菱電機株式会社 | 雑音抑圧装置および方法 |
JP3454206B2 (ja) * | 1999-11-10 | 2003-10-06 | 三菱電機株式会社 | 雑音抑圧装置及び雑音抑圧方法 |
EP2242049B1 (en) * | 2001-03-28 | 2019-08-07 | Mitsubishi Denki Kabushiki Kaisha | Noise suppression device |
JP3457293B2 (ja) * | 2001-06-06 | 2003-10-14 | 三菱電機株式会社 | 雑音抑圧装置及び雑音抑圧方法 |
US20030055645A1 (en) * | 2001-09-18 | 2003-03-20 | Meir Griniasty | Apparatus with speech recognition and method therefor |
JP4162604B2 (ja) * | 2004-01-08 | 2008-10-08 | 株式会社東芝 | 雑音抑圧装置及び雑音抑圧方法 |
US7492889B2 (en) * | 2004-04-23 | 2009-02-17 | Acoustic Technologies, Inc. | Noise suppression based on bark band wiener filtering and modified doblinger noise estimate |
US7454332B2 (en) * | 2004-06-15 | 2008-11-18 | Microsoft Corporation | Gain constrained noise suppression |
GB2422237A (en) * | 2004-12-21 | 2006-07-19 | Fluency Voice Technology Ltd | Dynamic coefficients determined from temporally adjacent speech frames |
US20080243496A1 (en) * | 2005-01-21 | 2008-10-02 | Matsushita Electric Industrial Co., Ltd. | Band Division Noise Suppressor and Band Division Noise Suppressing Method |
US20060184363A1 (en) * | 2005-02-17 | 2006-08-17 | Mccree Alan | Noise suppression |
JP4670483B2 (ja) * | 2005-05-31 | 2011-04-13 | 日本電気株式会社 | 雑音抑圧の方法及び装置 |
US8566086B2 (en) * | 2005-06-28 | 2013-10-22 | Qnx Software Systems Limited | System for adaptive enhancement of speech signals |
JP4765461B2 (ja) * | 2005-07-27 | 2011-09-07 | 日本電気株式会社 | 雑音抑圧システムと方法及びプログラム |
US8612216B2 (en) * | 2006-01-31 | 2013-12-17 | Siemens Enterprise Communications Gmbh & Co. Kg | Method and arrangements for audio signal encoding |
ATE425532T1 (de) * | 2006-10-31 | 2009-03-15 | Harman Becker Automotive Sys | Modellbasierte verbesserung von sprachsignalen |
JP2008148179A (ja) * | 2006-12-13 | 2008-06-26 | Fujitsu Ltd | 音声信号処理装置および自動利得制御装置における雑音抑圧処理方法 |
US9966085B2 (en) * | 2006-12-30 | 2018-05-08 | Google Technology Holdings LLC | Method and noise suppression circuit incorporating a plurality of noise suppression techniques |
JP5018193B2 (ja) * | 2007-04-06 | 2012-09-05 | ヤマハ株式会社 | 雑音抑圧装置およびプログラム |
KR101437830B1 (ko) * | 2007-11-13 | 2014-11-03 | 삼성전자주식회사 | 음성 구간 검출 방법 및 장치 |
US20110178800A1 (en) * | 2010-01-19 | 2011-07-21 | Lloyd Watts | Distortion Measurement for Noise Suppression System |
-
2008
- 2008-10-24 JP JP2010534608A patent/JP5153886B2/ja active Active
- 2008-10-24 WO PCT/JP2008/003021 patent/WO2010046954A1/ja active Application Filing
- 2008-10-24 US US13/055,837 patent/US20110125490A1/en not_active Abandoned
- 2008-10-24 EP EP08877520.0A patent/EP2346032B1/en not_active Not-in-force
- 2008-10-24 CN CN2008801310563A patent/CN102150206B/zh not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1281576A (zh) * | 1997-12-08 | 2001-01-24 | 三菱电机株式会社 | 声音信号加工方法和声音信号加工装置 |
US7092516B2 (en) * | 2001-09-20 | 2006-08-15 | Mitsubishi Denki Kabushiki Kaisha | Echo processor generating pseudo background noise with high naturalness |
JP2005258158A (ja) * | 2004-03-12 | 2005-09-22 | Advanced Telecommunication Research Institute International | ノイズ除去装置 |
CN101154384A (zh) * | 2006-09-25 | 2008-04-02 | 富士通株式会社 | 声音信号纠正方法、声音信号纠正设备以及计算机程序 |
JP2008076975A (ja) * | 2006-09-25 | 2008-04-03 | Fujitsu Ltd | 音信号補正方法、音信号補正装置及びコンピュータプログラム |
Also Published As
Publication number | Publication date |
---|---|
WO2010046954A1 (ja) | 2010-04-29 |
EP2346032B1 (en) | 2014-05-07 |
CN102150206B (zh) | 2013-06-05 |
JPWO2010046954A1 (ja) | 2012-03-15 |
US20110125490A1 (en) | 2011-05-26 |
EP2346032A4 (en) | 2012-10-24 |
EP2346032A1 (en) | 2011-07-20 |
JP5153886B2 (ja) | 2013-02-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102150206B (zh) | 噪音抑制装置以及声音解码装置 | |
JP7427752B2 (ja) | 時間領域デコーダにおける量子化雑音を低減するためのデバイスおよび方法 | |
KR100341044B1 (ko) | 음성 신호 가공 방법 및 음성 신호 가공 장치 | |
JP5535198B2 (ja) | 雑音抑圧装置 | |
JP5302968B2 (ja) | 音声明瞭化を伴うスピーチ改善 | |
US7454332B2 (en) | Gain constrained noise suppression | |
CN102132343B (zh) | 噪声抑制装置 | |
US8175145B2 (en) | Post-processing for reducing quantization noise of an encoder during decoding | |
US9252728B2 (en) | Non-speech content for low rate CELP decoder | |
CA2424375A1 (en) | Perceptually improved enhancement of encoded acoustic signals | |
RU2622863C2 (ru) | Эффективное ослабление опережающего эха в цифровом звуковом сигнале | |
KR20070007851A (ko) | 계층 부호화 장치 및 계층 부호화 방법 | |
WO2009072777A1 (en) | Apparatus and method of enhancing quality of speech codec | |
JP4786183B2 (ja) | 音声復号化装置、音声復号化方法、プログラム、記録媒体 | |
RU2707144C2 (ru) | Аудиокодер и способ для кодирования аудиосигнала | |
JP5840087B2 (ja) | 音声信号復元装置および音声信号復元方法 | |
CN103258542A (zh) | 半导体装置和语音通信装置 | |
JP4295372B2 (ja) | 音声符号化装置 | |
Ogawa | More robust J-RASTA processing using spectral subtraction and harmonic sieving | |
Jung et al. | Speech enhancement by overweighting gain with nonlinear structure in wavelet packet transform | |
KR20130034915A (ko) | 해양 음성 통신에서 음성 코딩 파라미터 기반의 효율적인 음성 신호 강화 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20130605 Termination date: 20201024 |
|
CF01 | Termination of patent right due to non-payment of annual fee |