CN103258542A - 半导体装置和语音通信装置 - Google Patents
半导体装置和语音通信装置 Download PDFInfo
- Publication number
- CN103258542A CN103258542A CN201310050871XA CN201310050871A CN103258542A CN 103258542 A CN103258542 A CN 103258542A CN 201310050871X A CN201310050871X A CN 201310050871XA CN 201310050871 A CN201310050871 A CN 201310050871A CN 103258542 A CN103258542 A CN 103258542A
- Authority
- CN
- China
- Prior art keywords
- noise
- input signal
- signal
- criterion value
- reservoir
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000004065 semiconductor Substances 0.000 title claims abstract description 40
- 238000004891 communication Methods 0.000 title claims description 30
- 206010038743 Restlessness Diseases 0.000 claims description 169
- 238000012545 processing Methods 0.000 claims description 116
- 230000005764 inhibitory process Effects 0.000 claims description 37
- 230000001629 suppression Effects 0.000 claims description 37
- 238000000034 method Methods 0.000 abstract description 59
- 230000008569 process Effects 0.000 abstract description 28
- 238000003860 storage Methods 0.000 abstract description 8
- 230000008030 elimination Effects 0.000 abstract description 4
- 238000003379 elimination reaction Methods 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 37
- 238000001228 spectrum Methods 0.000 description 34
- 230000001413 cellular effect Effects 0.000 description 18
- 238000005516 engineering process Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 10
- 230000008859 change Effects 0.000 description 7
- 230000000694 effects Effects 0.000 description 6
- 238000013461 design Methods 0.000 description 5
- 230000005055 memory storage Effects 0.000 description 4
- 230000002411 adverse Effects 0.000 description 3
- 230000004069 differentiation Effects 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 239000000654 additive Substances 0.000 description 2
- 230000000996 additive effect Effects 0.000 description 2
- 230000004888 barrier function Effects 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000000737 periodic effect Effects 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 210000001260 vocal cord Anatomy 0.000 description 2
- 101100366000 Caenorhabditis elegans snr-1 gene Proteins 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000000712 assembly Effects 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000005538 encapsulation Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 229910021421 monocrystalline silicon Inorganic materials 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephone Function (AREA)
- Noise Elimination (AREA)
Abstract
本发明公开了一种半导体装置和语音通信装置。本发明提供一种用于实现较高精度噪声消除的技术。根据本发明的实施例的半导体装置包括:解码器,该解码器对编码后的输入信号解码;确定单元,该确定单元确定语音信号是否包括在输入信号中;抑制器,该抑制器基于通过确定单元的确定的结果来执行用于抑制包括在输入信号中的噪声分量的抑制处理;以及第一储存器,该第一储存器用于将指定语音信号相对于基于语音信号的失真的噪声的比例的第一准则值存储为用于确定的确定准则值。
Description
相关申请的交叉引用
包括说明书、附图和摘要的于2012年2月15日提交的日本专利申请No.2012-030384的公开通过引用的方式全部合并于此。
技术领域
本发明涉及半导体装置和语音通信装置,并且更特别地,涉及有效地应用至执行用于从包括语音信号和噪声的输入信号消除噪声的处理的半导体装置的技术。
背景技术
在诸如蜂窝电话或电话会议系统的语音通信装置中,减少噪声非常重要。诸如蜂窝电话的很多语音通信装置采用用于去除背景噪声(环境噪声)的技术。例如,专利文献1和2公开了用于从包括语音信号和背景噪声的信号去除背景噪声的背景技术。
专利文献1公开了一种噪声消除技术,以在不使声音质量恶化的情况下消除背景噪声,其消除通过从输入信号消除背景噪声的明显改变分量获得的估计背景噪声,并且消除包括具有低S/N比率的频带中的背景噪声的明显改变分量的再更新后的估计背景噪声。专利文献2公开了一种技术,该技术在用于从包括语音信号和背景噪声的信号消除背景噪声的背景噪声消除装置中,基于用于基于过去噪声间隔的带宽谱计算的每个频带的S/N比率来确定当前帧信号是语音间隔还是噪声间隔。
专利文献1:日本未审查专利申请公开No.H10-171497
专利文献2:日本未审查专利申请公开No.2001-265367
发明内容
本发明要解决的问题
在消除背景噪声的装置中,在很多情况下,执行检测语音信号是否包括在输入信号中的处理(在下文中还称为噪声确定处理),之后执行区别语音和噪声并且抑制噪声的处理。在噪声确定处理中,例如,通过使用用于确定声音是语音还是噪声的确定准则来确定语音信号是否包括在输入信号中。按照惯例,基于背景噪声来确定用于确定的确定准则。例如,在应用了蜂窝电话的现有回波消除器技术的噪声抑制器中,基于表示在假定使用环境中的一般使用环境中输入信号与背景噪声的S/N比率(例如,22dB)来确定用于噪声确定处理的确定准则。
另一方面,由于诸如背景噪声的线性噪声(加性噪声)、以及另外由语音信号的编码造成的语音信号本身的失真和由在扬声器和麦克风之间存在的障碍物(例如,面具、头盔等)造成的语音信号本身的失真,导致语音通信装置在通信时的声音质量恶化。本发明的发明人发现,在使用仅考虑关于包括除了背景噪声之外的噪声的输入信号的背景噪声确定的确定准则执行噪声确定处理的情况下,存在语音被错误地确定为噪声的可能性。例如,在由于通过编解码器的低比特速率的编码导致语音信号恶化并且除了背景噪声之外的噪声变得比假定背景噪声更大的情况下,当使用基于假定背景噪声确定的确定准则执行噪声确定处理时,语音被错误地确定为噪声,并且存在语音被错误地抑制的可能性。例如,在除了背景噪声之外的噪声存在于呼叫语音中并且除了噪声之外的语音的S/N比率是17dB的情况下,当使用基于背景噪声确定的噪声确定准则(22dB)执行噪声确定处理时,尽管输入信号包括语音信号的可能性高,但是17dB和22dB范围内的输入信号可以被确定为噪声。在专利文献2中不考虑基于语音信号的失真的噪声。
本发明的发明人认为,即使应用专利文献1等中描述的技术并且执行抑制输入信号中的噪声的处理,也不能抑制除了背景噪声之外的噪声分量,使得不足以噪声消除。
本发明的目的是提供用于实现较高精度噪声消除的技术。
本发明的以上和其他目的以及新颖的特征根据说明书的描述和附图将变得显而易见。
在说明书中公开的发明的典型一个的概述将简单描述如下。
根据本发明的实施例的半导体装置包括:解码器,该解码器对编码后的输入信号解码;确定单元,该确定单元确定语音信号是否包括在输入信号中;抑制器,该抑制器基于通过确定单元的确定的结果,执行用于抑制包括在输入信号中的噪声分量的抑制处理;以及第一储存器,该第一储存器用于将指定语音信号相对于基于语音信号的失真的噪声的比例的第一准则值存储为用于确定的确定准则值。
发明的效果
由说明书中公开的发明的典型一个获得的效果将简单描述如下。
通过半导体装置,可以实现高精度噪声消除。
附图说明
图1是图示蜂窝电话终端的说明图,其中,语音处理装置执行用于在再生语音时抑制包括在输入信号中的噪声分量的噪声抑制处理。
图2是图示由语音处理器10执行的信号处理的流程的说明图。
图3是图示语音处理器10的内部配置的框图。
图4是图示多种背景噪声确定准则值SNR1的说明图。
图5是图示多种特定噪声确定准则值SNR2的说明图。
图6是图示特定噪声表的说明书。
图7是图示多种特定噪声表的说明图。
图8是图示由语音处理器10执行的噪声抑制处理的流程的流程图。
图9是图示噪声确定处理的流程的流程图。
图10是图示根据第二实施例的语音处理器的内部配置的框图。
图11是图示由语音处理器20执行的噪声确定处理的流程的流程图。
图12是图示根据第三实施例的语音处理器的内部配置的框图。
图13是图示由语音处理器30执行的噪声抑制处理的流程的流程图。
图14是图示根据第四实施例的语音处理器的内部配置的框图。
图15是图示由语音处理器40执行的噪声抑制处理的流程的流程图。
具体实施方式
1.实施例的概述
首先,将描述在该申请中公开的发明的代表性实施例的概述。在代表性实施例的概述的解释中的段落中引用的图中的参考数字仅指示包括在参考数字所指定的组件的概念中的组件。
[1]用于考虑由语音的失真导致的噪声来检测语音的半导体装置
根据本发明的代表性实施例的半导体装置(3)包括:解码器(11),解码器(11)对编码后的输入信号解码;确定单元(1001、4001),确定单元(1001、4001)确定语音信号是否包括在输入信号中;抑制器(1002、1003),抑制器(1002、1003)基于通过确定单元的确定的结果来执行用于抑制包括在由解码器解码的输入信号中的噪声分量的抑制处理。半导体装置还具有第一储存器(107、208),第一储存器(107、208)用于将指定语音信号相对于基于语音信号的失真的噪声(特定噪声)的比例的第一准则值(SNR2)存储为用于确定的确定准则值。
在[1]的半导体装置中,第一准则值可以用作用于确定的确定准则值。从而,例如,即使在基于语音信号的失真的噪声大于假定背景噪声的情况下,错误地确定语音信号是噪声的可能性变得低于使用仅考虑背景噪声的确定准则值的情况。因此,可以提高噪声消除的精度。
[2]最小准则值作为确定准则的选择
[1]的半导体装置进一步包括:第二储存器(105、208),第二储存器(105、208)用于将指定语音信号相对于背景噪声的比例的第二准则值存储为用于通过确定单元的确定的确定准则值;以及选择器(108),选择器(108)选择存储在第一储存器中的第一准则值和存储在第二储存器中的第二准则值中的较小的一个。在[1]的半导体装置中,确定单元使用由选择器选择的准则值作出确定。
以这样的方式,根据在第一和第二储存器中设置的基准值,容易地选择适于确定的确定准则值。
[3]根据背景噪声的响度的确定准则的动态确定
[2]的半导体装置进一步包括:更新器(304),更新器(304)基于包括在解码后的输入信号中的背景噪声的信号水平来计算第二准则值,并且更新第二储存器中的值。
通过该配置,即使在包括在输入信号中的背景噪声的信号水平改变的情况下,也可以选择适于确定的确定准则值。
[4]确定方法
在[2]或[3]的半导体装置中,在输入信号的信号水平高于基于确定准则值确定的确定阈值(噪声水平×噪声确定准则SNR)的情况下,确定单元确定语音信号包括在输入信号中,并且在输入信号的信号水平低于确定阈值的情况下,确定单元确定没有语音信号包括在输入信号中。
[5]用于抑制背景噪声和基于来自包括语音的信号的语音失真的噪声的处理
在[1]至[4]中的任一项中的半导体装置中,抑制器执行用于抑制关于由确定单元确定为包括语音信号的输入信号的输入信号的背景噪声的处理和用于抑制基于语音信号的失真的噪声的处理。
通过该配置,不仅抑制了背景噪声而且抑制了基于语音信号的失真的噪声。从而,可以进一步改进声音质量。
[6]用于抑制处理的准则值(噪声表)
[1]至[5]中的任一项中的半导体装置进一步包括:第三储存器(103),第三储存器(103)用于将第三准则值(背景噪声表)存储为背景噪声抑制量的准则;以及第四储存器(109),第四储存器(109)用于将第四准则值(特定噪声表)存储为基于语音信号的失真的噪声的抑制量的准则。在半导体中,在确定单元确定包括语音信号的情况下,抑制器执行从输入信号减去根据第三准则值的抑制量并且减去根据第四准则值的抑制量的处理,并且在确定单元确定不包括语音信号的情况下,抑制器执行从输入信号减去根据第三准则值的抑制量的处理。
通过该配置,除了背景噪声之外,可以容易地抑制基于语音信号的失真的噪声。
[7]基于浊音中的语音失真的噪声的抑制
在[5]或[6]的半导体装置中,抑制器执行从每个均由确定单元确定为包括语音信号的输入信号中的包括浊音的语音信号的输入信号减去根据第三准则值的抑制量和根据第四准则值的抑制量的处理(4001)。
通过该配置,对清音不执行根据第四准则值的噪声的抑制。从而,即使在基于语音信号的失真的噪声具有接近清音的信号波形的情况下,对包括清音的语音信号不施加不利影响。
[8]根据语音的编码方法的噪声
在[1]至[7]中的任一项中的半导体装置,基于声信号的失真的噪声是基于编码的噪声。
由于可以执行不仅考虑背景噪声而且考虑基于编解码器的编码的噪声的噪声抑制,例如,甚至在通过编解码器的编码的比特速率低并且语音信号的失真大的情况下,也可以进一步改进声音质量。
[9]考虑基于语音的失真的噪声来检测语音的语音通信装置
根据本发明的代表性实施例的语音通信装置(1)包括:接收器(12),接收器(12)用于接收编码后的输入信号;解码器(11),解码器(11)对由接收器接收到的输入信号解码;以及抑制处理器(100、400),抑制处理器(100、400)执行用于抑制包括在由解码器解码的输入信号中的噪声的处理。抑制处理器包括:确定单元(1001),确定单元(1001)用于确定语音信号是否包括在输入信号中;抑制器(1002、1003),抑制器(1002、1003)用于执行用于基于由确定单元的确定的结果来抑制包括在输入信号中的噪声分量的抑制处理;以及第一储存器(107、208),第一储存器(107、208)用于将指定语音信号相对于基于语音信号的失真的噪声的比例的第一准则值(SNR2)存储为用于确定的确定准则值。
通过该配置,以类似于[1]的方式,可以提高通过语音通信装置的噪声消除的精度。
[10]最小准则值作为确定准则的选择
在[9]的语音通信装置中,抑制处理器进一步包括:第二储存器(105),第二储存器(105)用于将指定语音信号相对于背景噪声的比例的第二准则值(SNR1)存储为用于通过确定单元的确定的确定准则值;以及选择器(108),选择器(108)选择存储在第一储存器中的第一准则值和存储在第二储存器中的第二准则值中的较小的一个。确定单元使用由选择器选择的准则值作出确定。
通过该配置,以类似于[2]的方式,可以选择适于确定的确定准则值。
[11]根据背景噪声的响度的确定准则的动态确定
在[10]的语音通信装置中,抑制处理器进一步包括:更新器(304),更新器(304)基于包括在解码后的输入信号中的背景噪声的信号水平来计算第二准则值,并且更新第二储存器中的值。
通过该配置,以类似于[3]的方式,可以选择适于确定的确定准则值。
[12]确定方法
在[10]或[11]的语音通信装置中,在输入信号的信号水平高于基于确定准则值确定的确定阈值(噪声水平×噪声确定准则SNR)的情况下,确定单元确定语音信号包括在输入信号中,并且在输入信号的信号水平低于确定阈值的情况下,确定单元确定没有语音信号包括在输入信号中。然而,甚至在确定不包括语音信号的情况下,如果确定语音信号包括在时间轴上的确定结果中,则确定包括语音信号。
[13]抑制背景噪声和基于来自包括语音的信号的语音失真的噪声的处理
在[9]至[12]中的任一项中的语音通信装置中,抑制器执行用于抑制关于由确定单元确定为包括语音信号的输入信号的输入信号的背景噪声的处理、以及用于抑制基于语音信号的失真的噪声的处理。
通过该配置,不仅抑制了背景噪声,而且抑制了基于语音信号的失真的噪声。从而,可以进一步改进声音质量。
[14]用于抑制处理的准则值
在[9]至[13]的语音通信装置的任一个中,抑制处理器进一步包括:第三储存器(103),第三储存器(103)用于将第三准则值(背景噪声表)存储为背景噪声抑制量的基准;以及第四储存器(109),第四储存器(109)用于将第四准则值(特定噪声表)存储为基于语音信号的失真的噪声的抑制量的基准。在确定单元确定包括语音信号的情况下,抑制器执行从输入信号减去根据第三准则值的抑制量并且减去根据第四准则值的抑制量的处理,并且在确定单元确定不包括语音信号的情况下,抑制器执行从输入信号减去根据第三准则值的抑制量的处理。
通过该配置,以类似于[6]的方式,可以容易地抑制基于语音信号的失真的噪声。
[15]基于浊音的语音失真的噪声的抑制
在[13]或[14]的语音通信装置中,抑制器执行从每个均由确定单元确定为包括语音信号的输入信号中的包括浊音的语音信号的输入信号减去根据第三准则值的抑制量和根据第四准则值的抑制量的处理(4001)。
通过该配置,以类似于[7]的方式,通过用于抑制噪声的处理,对包括清音的语音信号不施加不利影响。
[16]根据语音的编码方法的噪声
在[9]至[15]中的任一项中的语音通信装置中,基于声信号的失真的噪声是基于编码的噪声。
通过该配置,可以执行不仅考虑背景噪声而且考虑基于编解码器的编码的噪声的抑制处理。
[17]抑制由语音的失真导致的噪声的半导体装置
根据本发明的代表性实施例的另一个半导体装置(3)包括:解码器(11),解码器(11)对编码后的输入信号解码;抑制处理器(100、400),抑制处理器(100、400)执行用于抑制包括在由解码器解码的输入信号中的抑制处理;以及储存器(107、208、109),储存器(107、208、109)用于存储准则值(SNR2,特定噪声表),该准则值用于抑制包括在抑制处理中使用的解码后的输入信号中的噪声中的基于语音信号的失真的噪声。
通过该配置,可以执行考虑基于语音信号的失真的噪声的抑制处理。因此,与仅考虑背景噪声的情况相比,可以提高噪声消除的精度。
[18]根据语音的编码方法的噪声
在[17]的半导体装置中,基于语音信号的失真的噪声是基于编码的噪声。
通过该配置,以类似于[8]的方式,可以进一步改进声音质量。
[19]基于浊音中的语音失真的噪声的抑制
在[18]的半导体装置中,抑制处理器(400)对包括由解码器解码的输入信号中的浊音的语音信号的输入信号执行用于抑制基于语音信号的失真的噪声的处理。
通过该配置,以类似于[7]的方式,通过用于抑制噪声的处理,对包括清音的语音信号不施加不利影响。
2.实施例的详情
将更明确地描述实施例。
第一实施例
图1作为语音通信装置的实施例图示了安装了执行用于在再生语音时消除包括在输入信号中的噪声分量的噪声抑制处理的语音处理装置的蜂窝电话终端。在图中,安装在蜂窝电话终端1中的语音处理装置3形成在通过已知CMOS集成电路制造技术由单晶硅制成的半导体基板上,但是不限于此。
参考图1,将简单地描述从蜂窝电话终端2发送的语音通信数据由蜂窝电话终端1接收和再生的情况下的处理的流程。在图中,仅图示了用于解释所述处理所必须的功能框。明显地,蜂窝电话终端1具有用于发送语音通信数据的功能单元(发送器、编码器等),并且蜂窝电话终端2具有用于接收语音通信数据的功能单元(语音处理器、接收器等)。
首先,由扬声器发出的语音由提供在蜂窝电话终端2中的麦克风转换为电信号。由于来自扬声器存在的周围环境的背景噪声也被提供给麦克风,所以包括语音和背景噪声的声音被转换为电信号。由麦克风生成的电信号由编码器编码。虽然不限制,但是通过编码器对语音编码的方法例如是AMR的G.725、ADPCM(自适应差分脉码调制)等。由发送器21通过预定发送方法发送通过编码器的编码处理生成的编码数据。
蜂窝电话终端1经由接收器12接收从蜂窝电话终端2发送的编码数据。解码器11执行用于对所接收到的编码数据解码以生成PCM数据的解码处理。语音处理装置10基于PCM数据来执行用于再生语音的多种信号处理,并且经由扬声器再生语音。
图2图示了由语音处理器10执行的信号处理的流程。如图2中所示,从解码器11输出的PCM数据被临时存储在存储器(缓冲存储器)中。存储在存储器中的PCM数据以预定数据为单位被依次地读取,并且经过多种信号处理。例如,使用一个帧中的80个采样以数据为单位执行信号处理。首先,抑制包括在PCM数据中的DC分量。此后,执行噪声抑制处理,以抑制包括在PCM数据中的噪声分量。为了校正声音质量,执行校正信号的频率特性的处理。最后,执行增益调节,使得语音信号的输出水平变为合适水平。
在下文中,将参考附图详细地描述通过语音处理器10的噪声抑制处理。
图3是图示语音处理器10的内部配置的框图。在图中,为了说明的方便起见,仅图示了关于噪声抑制处理的功能框。如图中所示,语音处理器10具有噪声抑制器100、能量计算器101、背景噪声表更新器102、背景噪声表保持器103、背景噪声确定基准选择器104、背景噪声确定基准保持器105、特定噪声确定水平保持器107、特定噪声选择器106、特定噪声表保持器109、以及噪声确定基准选择器108。在功能单元中,噪声抑制器100、能量计算器101、背景噪声表更新器102、背景噪声确定基准选择器104、特定噪声选择器106、以及噪声确定基准选择器108是当例如诸如CPU的程序处理器执行存储在ROM(只读存储器)或RAM(随机存取存储器)中的程序时实现的功能实现装置的一部分。
通过语音处理器10的噪声抑制处理由噪声抑制器100执行,并且被粗略地划分为两个处理。其中之一是用于确定语音信号是否包括在接收到的一帧的PCM数据(在下文中,还简单地称为输入信号)中的确定处理,并且另一个是用于基于确定结果抑制包括在输入信号中的噪声的抑制处理。
首先,将详细地描述确定处理。确定处理由确定处理器1001执行。作为由确定处理器1001执行的确定处理,存在两个处理;在时间轴上执行的确定处理、以及在频率轴上执行的确定处理。在说明书中,通过将在时间轴上执行的确定处理描述为“浊音/清音确定处理”,并且将在频率轴上执行的确定处理描述为“噪声确定处理”,区分两个确定处理。在下文中,将特别主要地描述噪声确定处理。
首先,确定处理器1001对输入信号执行快速傅里叶变换(FFT)计算,并且将由时间函数表示的时间轴信号转换为频率轴上的信号(频谱信号)。接下来,确定处理器1001对转换后的输入信号执行使用噪声确定基准SNR的噪声确定处理,由此确定语音信号是否包括在输入信号中。噪声确定基准SNR是用于确定用于相互区分噪声和语音的阈值的信息,并且是例如通过“20log(Ps/Pn)”表示的值。Ps表示语音信号的信号电压(或信号电流),并且Pn表示噪声的信号电压(或信号电流)。确定处理器1001执行将通过将噪声的信号水平乘以噪声确定基准SNR获得的值与输入信号的信号噪声相比较的处理,当输入信号较高时,确定语音帧,并且当输入信号较低时,确定噪声帧。例如,当噪声确定基准SNR的值是22dB(幅度比:13)时,确定处理器1001确定输入信号的信号水平相对于噪声的信号水平是22dB或更高。具体地,当输入信号的信号水平是噪声的13倍那么高时,确定处理器1001确定输入信号是包括语音信号的帧(语音帧)。在另一种情况下,确定处理器1001确定输入信号是不包括语音信号(噪声帧)的帧。
这是在通过确定处理器1001的确定处理中使用哪个噪声确定基准的问题。例如,在仅考虑背景噪声的情况下,在存在很少噪声的安静环境下,语音信号相对于背景噪声的S/N比率高。因此,通过具有高S/N比率(大阈值)的噪声确定基准来执行确定处理。相反,在噪声环境中,语音信号相对于背景噪声的S/N比率较低,使得通过具有低S/N比率的噪声确定基准(小阈值)来执行确定处理。以这样的方式,可以抑制由呼叫环境中的改变导致的确定精度的恶化。然而,如上所述,除了诸如背景噪声的线性噪声分量之外,输入信号包括基于语音信号的失真的噪声(在下文中,称为特定噪声)。例如,特定噪声包括基于由编解码器的编码方法、比特速率、压缩率等导致的语音信号的失真的噪声和基于由诸如在扬声器和麦克风之间存在的面具或头盔的障碍物导致的语音信号的失真的噪声。从而,如上所述,在语音信号通过由编解码器等以低比特速率编码在很大程度上失真并且特定噪声变为大于假定背景噪声的情况下,当通过基于背景噪声确定的噪声确定基准来执行噪声确定处理时,尽管输入信号是语音帧,但是存在输入信号被错误地确定为噪声帧的可能性,并且语音信号由随后抑制处理错误地抑制。为了解决该问题,实施例中的语音处理器10不仅考虑背景噪声而且还考虑特定噪声来执行噪声确定处理。具体地,通过使用表示语音信号相对于背景噪声的S/N比率的背景噪声确定基准SNR1和表示语音信号相对于特定噪声的S/N比率的特定噪声确定基准SNR2之间的较低噪声确定基准来执行噪声确定处理。
首先,将详细地描述背景噪声确定基准SNR1。
图4图示了背景噪声确定基准SNR1。如图中所示,根据假定的呼叫环境来制备多个背景噪声确定基准SNR1,诸如,假定诸如安静房间的安静呼叫环境的噪声确定基准SNR1_0(=45dB)、假定诸如正常房间的正常呼叫环境的噪声确定基准SNR1_1(=22dB)、以及假定大噪声的噪声确定基准SNR1_n(=6dB)。噪声确定基准SNR1_0至SNR1_n(n表示1或更大的整数)的信息被保持在例如背景噪声确定基准保持器105中。背景噪声确定基准保持器105是具有用于存储数据的存储区的储存器,其例如是存储器。被用作背景噪声确定基准SNR1的信息由例如N/S调节模式信号确定。N/S调节模式信号是指示背景噪声确定基准SNR1的信号,并且从外部或经由用户接口被接收。具体地,背景噪声确定基准选择器104从背景噪声确定基准保持器105选择性地读取与由N/S调节模式信号指示的值相对应的背景噪声确定基准SNR1_0至SNR1_n,并且将其作为背景噪声确定基准SNR1提供给噪声确定基准选择器108。例如,在由N/S调节模式信号指定的参数值是“1”的情况下,背景噪声确定基准选择器104选择背景噪声确定基准SNR_1(=22dB),并且将该信息作为背景噪声确定基准SNR1提供给噪声确定基准选择器108。
现在将描述特定噪声确定基准SNR2。
如上所述,语音信号通过由编解码器等编码失真。本发明的发明人发现,语音信号的失真可以被建模为取决于编解码器的编码方法、比特速率、压缩率等并且其不取决于语音信号的噪声分量。例如,包括在由预定编码方法并且以预定比特速率编码的语音信号中的特定噪声分量可以被建模(数字化)为任何形式的噪声分量,诸如,不取决于频率的白噪声形式的噪声分量、脉冲形状噪声分量、或由频率以预定比率加权的白噪声形式的噪声分量。在实施例中,特定噪声确定基准SNR2基于建模的特定噪声被预先计算,并且被存储在语音处理装置中的储存器中。
图5图示了多种特定噪声确定基准SNR2。如图中所示,根据假定的特定噪声来制备多个特定噪声确定基准SNR2,诸如,在通过编解码器的编码方法是G.726并且比特速率是24kbit/s的情况下的噪声确定基准SNR2_2和假定当使用面具时的呼叫的噪声确定基准SNR2_5。通过以下方法计算噪声确定基准SNR2_0至SNR2。例如,从基于在设计阶段中作出的仿真的结果或实际装置的估计结果掌握的特定噪声的特性来建模特定噪声分量。计算建模后的特定噪声分量的平均能量,并且基于平均能量来计算特定噪声确定基准。特定噪声确定基准例如在半导体装置的设计阶段或者蜂窝电话终端的制造状态下被计算,并且被存储在特定噪声确定基准保持器107中。特定噪声确定基准保持器107是具有用于存储数据的存储区的存储装置,其是例如存储器。被用作噪声确定基准SNR2的信息由例如特定噪声选择信号确定。特定噪声选择信号是指示将被考虑的特定噪声的信号,并且例如从外部或经由用户被接收。具体地,特定噪声选择器106从特定噪声确定基准保持器107读取与由特定噪声选择信号指示的参数值相对应的特定噪声确定基准SNR2_0至SNR2_m,并且将其作为特定噪声确定基准SNR2提供给噪声确定基准选择器108。例如,在由特定噪声选择信号指定参数值“0”和“5”的情况下,特定噪声选择器106选择特定噪声确定基准SNR1_0和SNR2_5,并且将它们提供给噪声确定基准选择器108。
噪声确定基准选择器108接收由背景噪声确定基准选择器104选择的背景噪声确定基准SNR1和由特定噪声选择器106选择的特定噪声确定基准SNR2,从所接收到的噪声确定基准选择最低噪声确定基准,并且将其提供给确定处理器1001。由噪声确定基准选择器108确定噪声确定基准的方法被表示为等式(1)。在等式(1)中,Ps表示语音信号的信号电压(或信号电流)、Pn_0至Pn_m(m表示1或更大的整数)表示特定噪声的信号电压(或信号电流),并且Pb表示背景噪声的信号电压(或信号电流)。通过等式(1)的确定方法,例如,在背景噪声确定基准SNR1_1、特定噪声确定基准SNR2_0、以及特定噪声确定基准SNR2_5被提供给噪声确定基准选择器108的情况下,当特定噪声确定基准SNR2_0的值最小时,特定噪声确定基准SNR2_0被选择并且被提供给确定处理器1001。确定处理器1001使用由噪声确定基准选择器108选择的噪声确定基准,并且通过上述方法执行噪声确定处理。
因此,即使在语音信号通过低比特速率的编码在很大程度上失真并且根据失真的特定噪声变为大于假定背景噪声的情况下,使用最低噪声确定基准来执行噪声确定处理。从而,包括语音信号的帧被错误地确定为噪声帧的可能性变低。
接下来,将详细地描述抑制处理。抑制处理根据输入信号是否为语音帧而变化。具体地,对由噪声确定处理确定为语音帧的输入信号,执行抑制特定噪声的特定噪声抑制处理以及抑制背景噪声的背景噪声抑制处理。另一方面,对被确定为噪声帧的输入信号,执行背景噪声抑制处理。
将描述特定噪声抑制处理。由确定处理器1001确定为语音帧的输入信号的频谱信号被提供给特定噪声抑制处理器1002。频谱信号具有例如包括81个频带中的每个中的频谱数据的数据结构。特定噪声抑制处理器1002基于特定噪声表的值对频谱信号执行特定噪声抑制处理。
图6是图示特定噪声表的说明图。如图中所示,特定噪声表具有例如表示特定噪声的响度的频谱数据被存储在划分后的81个频带中的每个中的数据结构。数量不限于81,而是可以对应于在噪声抑制处理中的FFT计算中的频率点的数量。每个频带中的频谱数据都是例如通过从基于在设计阶段作出的仿真的结果或真实装置的估计结果掌握的特定噪声的特性对每个频带中的特定噪声建模(数字化)获得的数据。在实施例中,特定噪声表被预先生成用于假定的多种特定噪声中的每种,并且存储在语音处理装置中的存储装置中。
图7图示了多种特定噪声表。如图中所示,根据假定的特定噪声来制备多个特定噪声表NT2,诸如,在通过编解码器的编码方法是G.726并且比特速率是24kbit/s的情况下的特定噪声表NT2_0和假定当使用面具时的呼叫的特定噪声表NT2_5。特定噪声表NT2_0至NT2_m的信息例如被存储在特定噪声表保持器109中。特定噪声表保持器109是具有用于存储数据的存储区的存储装置,其例如是存储器。用于特定噪声抑制处理的特定噪声表由例如特定噪声选择信号确定。特定噪声抑制处理器1002从特定噪声表保持器109读取与由特定噪声选择信号指定的参数值相对应的特定噪声表NT2_0至NT2_m中的任一个,通过使用读取的表来执行特定噪声抑制处理,并且从输入信号估计特定噪声分量。具体地,特定噪声抑制处理器1002执行从输入信号的频谱数据的值减去由特定噪声选择信号指定的特定噪声表中的频谱数据的值的处理。在81个频带中的每个中执行减法处理。
将确定背景噪声抑制处理。由确定处理器1001确定为噪声帧的输入信号(频谱信号)不经由特定噪声抑制处理器1002提供给背景噪声抑制处理器1003。特定噪声分量由特定噪声抑制处理器1002抑制的语音帧的输入信号(频谱信号)还被提供给背景噪声抑制处理器1003。背景噪声抑制处理器1003对输入的频谱信号执行噪声抑制处理。具体地,背景噪声抑制处理器1003执行从背景噪声表保持器103读取背景噪声表的值并且从输入的频谱信号减去通过将表的读取值乘以预定因数获得的值的处理。在每个频带中执行减法处理。背景噪声表具有例如表示背景噪声的响度被存储在被划分的81个频带中的每个中的数据结构,类似于图6中所示的特定噪声表,并且被存储在背景噪声表保持器103中。背景噪声表保持器103是具有用于存储数据的存储区的储存器,其例如是存储器。预定因数是用于增加/减少背景噪声的减少量的因数,并且被设置为根据例如输入信号是否为语音帧而变化的值。例如,对于被确定为噪声帧的输入信号,通过将预定因数设置为大值,增加了抑制量。另一方面,对于被确定为语音帧的输入信号,通过将预定因数设置为小值,减少了抑制量。背景噪声抑制处理器1003对经过背景噪声抑制处理的频谱信号执行逆快速傅里叶变换(IFFT),以将信号逆变换为由时间的函数表示的时间轴信号。逆变换后的输入信号被提供给执行频率特性调节、增益调节等的功能单元,并且最终由扬声器再生。
将描述生成背景噪声表的方法。背景噪声表更新器102预期,在紧接在呼叫开始之后的一段预定时段,输入信号不包括语音信号而是仅包括背景噪声,并且通过使用在系统启动之后的预定时段生成背景噪声表。具体地,首先,能量计算器101计算在紧接在呼叫开始之后的预定时段内提供的输入信号(一个帧中的PCM数据)的平均能量。接下来,背景噪声表更新器102对所计算的平均能量执行FFT计算处理,以生成用于81个频带中的每个的频谱数据。背景噪声表更新器102将所生成的频谱数据存储到背景噪声表保持器103中。此后,在通过确定处理器1001执行的噪声确定处理中输入信号被确定为噪声帧并且噪声时段继续多于预定时段的情况下,背景噪声表更新器102基于输入信号的平均能量来生成用于每个频带的频谱数据,并且更新存储在背景噪声表保持器103中的背景噪声表。在更新背景噪声表时,防止背景噪声表的明显改变的发生。以这样的方式,可以根据呼叫环境中的改变来更新背景噪声表。将详细地描述通过语音处理器10的噪声抑制处理的流程。
图8是图示通过语音处理器10执行的噪声抑制处理的流程的流程图。
当呼叫在蜂窝终端1和2之间开始并且PCM数据被存储在缓冲存储器中时,噪声抑制处理开始。首先,确定背景噪声确定基准SNR1(S101)。具体地,当接收到N/S调节模式信号时,背景噪声确定基准选择器104从背景噪声确定基准保持器105读取与由N/S调节模式信号指定的参数值相对应的背景噪声确定基准SNR1_0至SNR1_n中的任何一个,并且将其提供给噪声确定基准选择器108。接下来,确定特定噪声确定基准SNR2(S102)。具体地,当接收到特定噪声选择信号时,特定噪声选择器106从特定噪声确定基准保持器107读取与由特定噪声选择信号指定的参数值相对应的特定噪声确定基准SNR2_0至SNR2_m中的任何一个,并且将其提供给噪声确定基准选择器108。
当DC分量被抑制的一个帧的PCM数据(输入信号)被提供给确定处理器1001时,确定处理器1001计算输入信号的平均能量(S103)。确定处理器1001基于所计算的平均能量来确定语音信号是否包括在输入信号中(S104)。确定处理是在时间轴上执行的浊音/清音确定处理。在浊音/清音确定处理中,虽然未限制,但是基于帧的平均能量和紧接在该帧之前的帧的平均能量之间的相关性来确定语音信号的存在或不存在。
确定处理器1001确定用于在频率轴上执行的噪声确定处理的噪声确定基准SNR(S105)。具体地,噪声确定基准选择器108从输入的背景噪声确定基准SNR1和特定噪声确定基准SNR2中选择最小噪声确定基准,并且将其提供给确定处理器1001,由此确定噪声确定基准SNR。
确定处理器1001对在步骤S103中在时间轴上经过噪声确定处理的输入信号执行FFT计算处理,以生成频谱信号(S106)。频谱信号包括例如用于81个频带中的每个的频谱数据。确定处理器1001计算输入信号的信号水平(输入信号水平)和噪声的信号水平(噪声水平)(S107)。具体地,确定处理器1001从用于与输入信号相关的81个频带中的每个的频谱数据生成表示输入信号水平的单一数据。在背景噪声表被生成的情况下,确定处理器1001从背景噪声表中的用于81个频带中的每个的频谱数据生成表示噪声水平的单一数据。后续处理根据从呼叫开始是否已经经过预定时段被分支(S108)。在从呼叫开始未逝去预定时段的情况下,背景噪声表更新器102通过上述方法生成背景噪声表,并且将其存储在背景噪声表保持器103中(S109)。确定处理器1001对在步骤S106中转换为频谱信号的输入信号执行IFFT计算,以将信号逆变换为时间轴上的信号(S115)。逆变换后的输入信号被输出到在后期阶段(post stage)中校正频率特性的功能部件(S116)。此后,确定呼叫是否已经结束(S117)。在呼叫已经结束的情况下,语音处理器10中的噪声抑制处理结束。当呼叫未结束时,程序返回到步骤S103。即,直到从呼叫开始逝去预定时段为止接收到的输入信号被用于背景噪声表的生成,但是输入信号不经过噪声抑制处理并且被原样再生。
另一方面,在步骤S108中从呼叫开始逝去预定时段之后的输入信号被提供给确定处理器1001,并且执行噪声确定处理(S110)。
图9是图示噪声确定处理的流程的流程图。首先,确定处理器1001将通过将噪声的信号水平乘以噪声确定基准SNR获得的值与输入信号的信号水平相比较。具体地,比较通过将在步骤S107中计算的噪声的水平乘以在步骤S105中确定的噪声确定基准SNR获得的值与在步骤S107中计算的输入信号水平。在步骤S110中,在输入信号水平较高的情况下,确定处理器1001确定输入信号是语音帧(S1104)。另一方面,在输入信号水平较低的情况下,确定处理器1001参考步骤S104中的确定结果(S1102)。在步骤S104中确定语音帧的情况下,确定处理器1001确定输入信号是语音帧(S1104)。在步骤S104中确定噪声帧的情况下,确定处理器1001确定输入信号是噪声帧(S1103)。
在步骤S110中输入信号被确定为连续用于多于预定时段的噪声帧的情况下,将确定结果通知背景噪声表更新器102,并且背景噪声表更新器102通过上述方法更新背景噪声表(S111)。在输入信号被确定为噪声帧中,由背景噪声抑制处理器1003来抑制背景噪声分量(S114)。
在步骤S110中输入信号被确定为语音帧的情况下,特定噪声抑制处理器1002读取与由特定噪声选择信号指定的参数值相对应的特定噪声表中的值(S112)。特定噪声抑制处理器1002基于所读取的特定噪声表来执行特定噪声抑制处理(S113)。此后,在特定噪声分量被抑制的频谱信号中,还由背景噪声抑制处理器1003来抑制背景噪声分量(S114)。背景噪声抑制处理器1003对特定噪声分量和背景噪声分量被抑制的频谱信号或者背景噪声分量被抑制的频谱信号执行IFFT,并且逆变换为时间轴上的信号(S115)。逆变换后的输入信号被输出到用于在后期阶段校正频率特性的功能单元(S116)。确定呼叫是否结束(S117)。当呼叫结束时,语音处理器10中的噪声抑制处理结束。当呼叫未结束时,程序再次返回到步骤S103,并且步骤S103至步骤S116中的处理被重复执行,直到呼叫结束为止。
根据第一实施例,在除了背景噪声之外的噪声存在的情况下,可以根据等式(1)的确定方法来确定噪声确定准则值。从而,与仅基于背景噪声使用噪声确定准则值执行噪声确定的方法相比,可以降低错误地确定包括语音信号的帧是噪声帧的可能性,并且可以提高噪声确定处理的精度。而且,通过执行特定噪声抑制处理,不仅抑制背景噪声而且还抑制基于语音信号的失真的噪声。因此,可以以更高精度执行噪声消除。
图10图示了根据第二实施例的语音处理器的内部配置的实例。图20中所示的语音处理器20具有通过从根据第一实施例的语音处理器10消除选择噪声确定基准SNR的功能获得的配置。具体地,语音处理器20具有代替噪声确定基准选择器108的噪声确定基准保持器208、特定噪声确定基准保持器107、特定噪声选择器106、背景噪声确定基准选择器104、以及背景噪声确定基准保持器105。
噪声确定基准保持器208是具有用于存储数据的存储区的存储装置,其是例如存储器。在噪声确定基准保持器208中,存储了基于等式(1)确定的噪声确定基准SNR的信息。例如,在设计包括语音处理器10的半导体集成电路的阶段,计算根据假定呼叫环境的背景噪声确定基准SNR1和根据假定特定噪声的特定噪声确定基准SNR2,并且将最小噪声确定基准的信息写入噪声确定基准保持器208。该信息可以在设计蜂窝电话终端的阶段从外部写入噪声确定基准保持器208。类似地,还将根据假定特定噪声的特定噪声表写入特定噪声表保持器109。例如,在编解码器的编码方法是AMR的情况下,存储特定噪声表NT2_0。在编码方法是G.726并且比特速率是24kbit/s的情况下,存储特定噪声表NT2_2。
图11图示了由语音处理器20执行的噪声确定处理的流程。
当呼叫在蜂窝电话终端1和2之间开始时,开始噪声抑制处理。首先,确定噪声确定基准SNR(S201)。具体地,确定处理器1001读取存储在噪声确定基准保持器208中的噪声确定基准SNR,由此确定用于噪声确定处理的噪声确定基准SNR。除了步骤S105(基于SNR1和SNR2选择噪声确定基准的处理)之外,后续处理基本类似于图8中所示的处理流程中的处理。
根据第二实施例,可以执行不仅考虑背景噪声而且考虑特定噪声的噪声确定处理。因此,以类似于第一实施例的方式,可以提高噪声确定处理的精度。通过执行特定噪声抑制处理,不仅抑制背景噪声,而且抑制基于语音信号的失真的噪声,使得可以执行高精度噪声消除。而且,在第二实施例中,由于基于等式(1)确定的噪声确定基准被预先存储在噪声确定基准保持器208中,所以用于从多个噪声确定基准选择一个噪声确定基准的功能单元变为不必要。因此,可以简化系统配置。
第三实施例
图12图示了根据第三实施例的语音处理器的内部配置。图中所示的语音处理器30具有根据第一实施例的语音处理器10的功能,并且另外,具有根据背景噪声的改变来更新背景噪声确定基准SNR1的功能。具体地,语音处理器30具有代替背景噪声确定基准选择器104的背景噪声确定基准计算器304。
背景噪声确定基准计算器304基于被确定为噪声帧的输入信号来计算背景噪声确定基准SNR1,并且将其提供给噪声确定基准选择器108。例如,背景噪声确定基准计算器304通过确定处理器1001监视确定结果,当确定噪声帧时,基于由能量计算器101计算的输入信号的平均能量来计算噪声确定基准SNR1,并且将其提供给噪声确定基准选择器108。噪声确定基准SNR1可以通过监视上述确定结果被更新,或者可以在更新背景噪声表时被更新。更新频率不受限制。
图13图示了由语音处理器30执行的噪声抑制处理的流程。
当呼叫在蜂窝电话终端1和2之间开始时,噪声抑制处理开始。首先,确定背景噪声确定基准SNR1的初始值(S301)。具体地,当接收到N/S调节模式信号时,背景噪声确定基准计算器304从背景噪声确定基准保持器105读取与由N/S调节模式信号指定的参数值相对应的背景噪声确定基准SNR1_0至SNR1_n中的任何一个,并且将其提供给噪声确定基准选择器108。直到步骤S110的以下步骤类似于图8的处理流程中的步骤。
当在步骤S110中输入信号被确定为语音帧时,以类似于以上的方式,执行抑制特定噪声分量和背景噪声分量的处理(S112至S114)。另一方面,当在步骤S110中输入信号被确定为噪声帧时,更新背景噪声表(S111)。背景噪声确定基准计算器304通过上述方法基于被确定为噪声帧的输入信号的平均能量来计算背景噪声确定基准,并且将其作为新背景噪声确定基准SNR1提供给噪声确定基准选择器108。以下处理类似于图8中的处理。
根据第三实施例,以类似于第一实施例的方法,可以提高噪声确定的精度,并且可以实现较高精度噪声消除。根据第三实施例,例如,甚至当扬声器从嘈杂呼叫环境移动至安静呼叫环境并且通过编码导致的特定噪声的S/N比率低于用于背景噪声的S/N比率时,可以根据改变来选择最佳噪声确定基准,并且可以进一步提高噪声确定的精度。
第四实施例
图14图示了根据第四实施例的语音处理器的内部配置。除了根据第一实施例的语音处理器10的功能之外,图中所示的语音处理器40还具有区分浊音和清音并且执行抑制处理的功能。
浊音是声带的声音伴随周期振动并且具有类似波形重复的特性。另一方面,清音是在不使声带振动的情况下经过的声音,并且接近白噪声等的噪声波形,并且不检测到重复波形。清音的频谱功率比浊音的频谱功率小得多。从而,当执行从包括清音的输入信号的频谱数据减去建模后的特定噪声的频谱分量的处理时,存在频谱失真发生的可能性。根据第四实施例的语音处理器40对包括浊音的语音帧执行抑制特定噪声的处理,并且不对包括清音的语音帧执行抑制特定噪声的处理。
图14中所示的噪声抑制器400中的确定处理器4001通过噪声确定处理区分噪声帧和语音帧,类似于上述确定处理器1001。在区分之后,确定处理器4001对语音帧执行用于区分是否包括浊音的浊音/清音确定处理。确定处理器4001使用浊音的波形(特性)具有周期性的事实,根据波形周期的体视比来确定浊音的存在/不存在。具体地,确定处理器4001基于相关性间距(correlation pitch)的强度来确定浊音的存在/不存在。例如,当值等于或大于设置归一化的互相关值的阈值时,确定浊音。当值小于该阈值时,确定清音。通过确定处理器4001的浊音/清音确定方法不限于上述方法,而是可以使用其他方法。例如,为了以高精度确定甚至周期不清楚的浊音,除了归一化的互相关值之外,还可以使用过零次数等执行确定。
通过浊音/清音确定处理被确定为包括浊音的帧的语音帧的输入信号(频谱信号)被提供给特定噪声抑制处理器1002,并且通过上述方法来抑制特定噪声。另一方面,被确定为不包括浊音(清音)的语音帧的输入信号(频谱信号)被提供给背景噪声抑制处理器1003,并且通过上述方法来抑制背景噪声。以这样的方式,在没有使清音的特性恶化的情况下,可以有效地抑制噪声,并且其有助于改进呼叫质量。
虽然不限制,但是背景噪声抑制处理器1003的背景噪声抑制处理以类似于第一实施例的方式在语音帧和噪声帧之间变化。该处理在浊音的语音帧和清音的语音帧之间不变化。
图15图示了通过语音处理器40执行的噪声抑制处理的流程。
步骤S101至S110类似于图8的处理流程中的步骤。
在步骤S110中输入信号被确定为噪声帧的情况下,类似于图8,执行更新背景噪声表并且抑制噪声帧中的背景噪声分量的处理(S111和S114)。另一方面,当在步骤S110中输入信号被确定为语音帧时,确定处理器4001对被确定为语音帧的输入信号进一步执行浊音/清音确定处理(S401)。在步骤S401中确定浊音的情况下,类似于图8,执行抑制来自输入信号的特定噪声和背景噪声的处理(S112和S114)。另一方面,在步骤S401中确定清音的情况下,执行抑制来自输入信号的背景噪声的处理(S114)。以下处理类似于图8中的处理。
根据第四实施例,类似于第一实施例,可以提高噪声确定的精度。通过区分浊音的语音帧和清音的语音帧并且执行噪声抑制处理,在不使清音的特性恶化的情况下,可以有效地抑制噪声,并且其有助于改进呼叫声音质量。
虽然已经基于实施例具体地描述了在此由发明人实现的本发明,但是明显地,本发明不限于这些实施例,而是可以在不脱离发明的主旨的情况下被不同地改变。
例如,在第四实施例中,区分浊音和清音并且执行噪声抑制处理的功能被添加至第一实施例中的语音处理器10。然而,本发明不限于该配置。当功能被添加至第二和第三实施例中的语音处理器20和30中的每个时,可以期望类似效果。
虽然安装在蜂窝电话终端中的语音处理装置已被描述为第一至第四实施例中的实例,但是本发明不限于该配置。该技术可以被应用至安装在语音通信装置中的任何语音处理装置,其中,噪声消除对声音质量施加大影响,诸如,电话会议系统或用于浴室的电话。
在语音处理装置3中,例如,语音处理器10和解码器11可以在不同半导体芯片中形成。语音处理装置3可以被包括作为诸如SIP(系统级封装)的半导体装置,其中,语音处理器10、解码器11、以及接收器12被密封在一个封装中。
虽然已经描述了通过由CPU执行的程序处理实现语音处理器10、20和30中的每个功能单元的情况,但是本发明不限于该情况。每个功能单元都可以由专用硬件、通过专用硬件和软件的程序处理固定存在的系统来实现。
Claims (19)
1.一种半导体装置,包括:
解码器,所述解码器对编码的输入信号进行解码;
确定单元,所述确定单元确定语音信号是否被包括在所述输入信号中;
抑制器,所述抑制器基于由所述确定单元进行的确定的结果来执行抑制处理,所述抑制处理用于抑制包括在由所述解码器解码的所述输入信号中的噪声分量;以及
第一储存器,所述第一储存器用于将第一准则值存储为用于所述确定的确定准则值,所述第一准则值指定语音信号相对于基于所述语音信号的失真的噪声的比例。
2.根据权利要求1所述的半导体装置,进一步包括:
第二储存器,所述第二储存器用于将第二准则值存储为用于由所述确定单元进行的确定的确定准则值,所述第二准则值指定语音信号相对于背景噪声的比例;以及
选择器,所述选择器选择存储在所述第一储存器中的所述第一准则值和存储在所述第二储存器中的所述第二准则值中的较小的一个,
其中,所述确定单元使用由所述选择器选择的所述准则值来作出所述确定。
3.根据权利要求2所述的半导体装置,进一步包括:更新器,所述更新器基于包括在解码的输入信号中的背景噪声的信号水平来计算所述第二准则值,并且更新所述第二储存器中的值。
4.根据权利要求2所述的半导体装置,其中,在所述输入信号的所述信号水平高于基于所述确定准则值确定的确定阈值的情况下,所述确定单元确定语音信号被包括在所述输入信号中,并且在所述输入信号的所述信号水平低于所述确定阈值的情况下,所述确定单元确定没有语音信号被包括在所述输入信号中。
5.根据权利要求2所述的半导体装置,其中,所述抑制器执行用于抑制关于由所述确定单元确定为包括语音信号的输入信号的输入信号的所述背景噪声的处理以及用于抑制基于所述语音信号的失真的噪声的处理。
6.根据权利要求5所述的半导体装置,进一步包括:
第三储存器,所述第三储存器用于将第三准则值存储为背景噪声抑制量的基准;以及
第四储存器,所述第四储存器用于将第四准则值存储为基于语音信号的失真的噪声的抑制量的基准,
其中,在所述确定单元确定了包括语音信号的情况下,所述抑制器执行从所述输入信号中减去根据所述第三准则值的抑制量并且减去根据所述第四准则值的抑制量的处理,并且在所述确定单元确定了不包括语音信号的情况下,所述抑制器执行从所述输入信号中减去根据所述第三准则值的所述抑制量的处理。
7.根据权利要求6所述的半导体装置,其中,所述抑制器执行从每一个均由所述确定单元确定为包括语音信号的输入信号中的、包括浊音的语音信号的输入信号中减去根据所述第三准则值的抑制量和根据所述第四准则值的抑制量的处理。
8.根据权利要求1所述的半导体装置,其中,基于声音信号的失真的噪声是基于所述编码的噪声。
9.一种语音通信装置,包括:
接收器,所述接收器用于接收编码的输入信号;
解码器,所述解码器对由所述接收器接收到的所述输入信号进行解码;以及
抑制处理器,所述抑制处理器执行用于抑制包括在由所述解码器解码的所述输入信号中的噪声的处理,
其中,所述抑制处理器包括:
确定单元,所述确定单元用于确定语音信号是否包括在所述输入信号中;
抑制器,所述抑制器用于基于由所述确定单元的确定的结果来执行抑制处理,所述抑制处理用于抑制包括在所述输入信号中的噪声分量,以及
第一储存器,所述第一储存器用于将第一准则值存储为用于所述确定的确定准则值,所述第一准则值指定语音信号相对于基于所述语音信号的失真的噪声的比例。
10.根据权利要求9所述的语音通信装置,其中,所述抑制处理器进一步包括:
第二储存器,所述第二储存器用于将第二准则值存储为用于由所述确定单元进行的确定的确定准则值,所述第二准则值指定语音信号相对于背景噪声的比例;以及
选择器,所述选择器选择存储在所述第一储存器中的所述第一准则值和存储在所述第二储存器中的所述第二准则值中的较小的一个,并且
所述确定单元使用由所述选择器选择的所述准则值来作出所述确定。
11.根据权利要求10所述的语音通信装置,其中,所述抑制处理器进一步包括:更新器,所述更新器基于包括在解码的输入信号中的背景噪声的信号水平来计算所述第二准则值,并且更新所述第二储存器中的值。
12.根据权利要求10所述的语音通信装置,其中,在所述输入信号的所述信号水平高于基于所述确定准则值确定的确定阈值的情况下,所述确定单元确定语音信号被包括在所述输入信号中,并且在所述输入信号的所述信号水平低于所述确定阈值的情况下,所述确定单元确定没有语音信号被包括在所述输入信号中。
13.根据权利要求10所述的语音通信装置,其中,所述抑制器执行用于抑制关于由所述确定单元确定为包括语音信号的输入信号的输入信号的所述背景噪声的处理以及用于抑制基于所述语音信号的失真的噪声的处理。
14.根据权利要求13所述的语音通信装置,其中,所述抑制处理器进一步包括:
第三储存器,所述第三储存器用于将第三准则值存储为背景噪声抑制量的基准;以及
第四储存器,所述第四储存器用于将第四准则值存储为基于语音信号的失真的噪声的抑制量的基准,
在所述确定单元确定了包括语音信号的情况下,所述抑制器执行从所述输入信号中减去根据所述第三准则值的抑制量并且减去根据所述第四准则值的抑制量的处理,并且在所述确定单元确定了不包括语音信号的情况下,所述抑制器执行从所述输入信号中减去根据所述第三准则值的所述抑制量的处理。
15.根据权利要求14所述的语音通信装置,其中,所述抑制器执行从每一个均由所述确定单元确定为包括语音信号的输入信号中的、包括浊音的语音信号的输入信号中减去根据所述第三准则值的抑制量和根据所述第四准则值的抑制量的处理。
16.根据权利要求9的语音通信装置,其中,基于所述声信号的失真的噪声是基于所述编码的噪声。
17.一种半导体装置,包括:
解码器,所述解码器对编码的输入信号进行解码;
抑制处理器,所述抑制处理器执行用于抑制包括在由所述解码器解码的所述输入信号中的抑制处理;以及
储存器,所述储存器用于存储准则值,所述准则值用于抑制包括在解码的输入信号中的噪声中的基于语音信号的失真的噪声,所述准则值在所述抑制处理中进行使用。
18.根据权利要求17所述的半导体装置,其中,基于所述语音信号的失真的噪声是基于所述编码的噪声。
19.根据权利要求18所述的半导体装置,其中,所述抑制处理器对包括由所述解码器解码的输入信号中的浊音的语音信号的输入信号执行用于抑制基于所述语音信号的失真的噪声的处理。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012-030384 | 2012-02-15 | ||
JP2012030384A JP5898515B2 (ja) | 2012-02-15 | 2012-02-15 | 半導体装置及び音声通信装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103258542A true CN103258542A (zh) | 2013-08-21 |
Family
ID=48946376
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310050871XA Pending CN103258542A (zh) | 2012-02-15 | 2013-02-08 | 半导体装置和语音通信装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US9431022B2 (zh) |
JP (1) | JP5898515B2 (zh) |
KR (1) | KR20130094246A (zh) |
CN (1) | CN103258542A (zh) |
TW (1) | TW201333935A (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6206271B2 (ja) * | 2014-03-17 | 2017-10-04 | 株式会社Jvcケンウッド | 雑音低減装置、雑音低減方法及び雑音低減プログラム |
KR102446392B1 (ko) * | 2015-09-23 | 2022-09-23 | 삼성전자주식회사 | 음성 인식이 가능한 전자 장치 및 방법 |
US11146607B1 (en) * | 2019-05-31 | 2021-10-12 | Dialpad, Inc. | Smart noise cancellation |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1805008A (zh) * | 2005-01-11 | 2006-07-19 | 索尼株式会社 | 语音检测装置、自动图像拾取装置和语音检测方法 |
CN101043560A (zh) * | 2006-03-22 | 2007-09-26 | 北京大学深圳研究生院 | 回声消除器及回声消除方法 |
US20080219473A1 (en) * | 2007-03-06 | 2008-09-11 | Nec Corporation | Signal processing method, apparatus and program |
CN101789240A (zh) * | 2009-12-25 | 2010-07-28 | 华为技术有限公司 | 语音信号处理方法和装置以及通信系统 |
JP2010529511A (ja) * | 2007-06-14 | 2010-08-26 | フランス・テレコム | 符号器の量子化ノイズを復号化中に低減するための後処理方法及び装置 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10171497A (ja) | 1996-12-12 | 1998-06-26 | Oki Electric Ind Co Ltd | 背景雑音除去装置 |
CA2312721A1 (en) * | 1997-12-08 | 1999-06-17 | Mitsubishi Denki Kabushiki Kaisha | Sound signal processing method and sound signal processing device |
JP3588030B2 (ja) * | 2000-03-16 | 2004-11-10 | 三菱電機株式会社 | 音声区間判定装置及び音声区間判定方法 |
JP3762621B2 (ja) * | 2000-07-31 | 2006-04-05 | 株式会社ケンウッド | 通信端末 |
JP4207494B2 (ja) * | 2002-08-19 | 2009-01-14 | ソニー株式会社 | 音声信号の処理装置および処理方法、並びに方法を実行するためのプログラムおよびそのプログラムを記録したコンピュータ読み取り可能な媒体 |
KR100640865B1 (ko) * | 2004-09-07 | 2006-11-02 | 엘지전자 주식회사 | 음성 품질 향상 방법 및 장치 |
-
2012
- 2012-02-15 JP JP2012030384A patent/JP5898515B2/ja not_active Expired - Fee Related
-
2013
- 2013-01-09 TW TW102100748A patent/TW201333935A/zh unknown
- 2013-02-08 CN CN201310050871XA patent/CN103258542A/zh active Pending
- 2013-02-13 US US13/766,329 patent/US9431022B2/en active Active
- 2013-02-14 KR KR1020130015719A patent/KR20130094246A/ko not_active Application Discontinuation
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1805008A (zh) * | 2005-01-11 | 2006-07-19 | 索尼株式会社 | 语音检测装置、自动图像拾取装置和语音检测方法 |
CN101043560A (zh) * | 2006-03-22 | 2007-09-26 | 北京大学深圳研究生院 | 回声消除器及回声消除方法 |
US20080219473A1 (en) * | 2007-03-06 | 2008-09-11 | Nec Corporation | Signal processing method, apparatus and program |
JP2010529511A (ja) * | 2007-06-14 | 2010-08-26 | フランス・テレコム | 符号器の量子化ノイズを復号化中に低減するための後処理方法及び装置 |
CN101789240A (zh) * | 2009-12-25 | 2010-07-28 | 华为技术有限公司 | 语音信号处理方法和装置以及通信系统 |
Also Published As
Publication number | Publication date |
---|---|
US20130211831A1 (en) | 2013-08-15 |
TW201333935A (zh) | 2013-08-16 |
KR20130094246A (ko) | 2013-08-23 |
JP2013167720A (ja) | 2013-08-29 |
JP5898515B2 (ja) | 2016-04-06 |
US9431022B2 (en) | 2016-08-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8483854B2 (en) | Systems, methods, and apparatus for context processing using multiple microphones | |
US8060363B2 (en) | Audio signal encoding | |
KR101693280B1 (ko) | 오디오 데이터 처리 방법, 장치 및 시스템 | |
RU2658544C1 (ru) | Генерация комфортного шума | |
KR20040005860A (ko) | 음성 통신에서의 위로 잡음 생성 방법 및 시스템 | |
US20110125507A1 (en) | Method and System for Frequency Domain Postfiltering of Encoded Audio Data in a Decoder | |
JP2016500453A (ja) | 低ビットレートで背景ノイズをモデル化するためのコンフォートノイズ付加 | |
CN102855881B (zh) | 一种回声抑制方法和装置 | |
CN103258542A (zh) | 半导体装置和语音通信装置 | |
RU2707144C2 (ru) | Аудиокодер и способ для кодирования аудиосигнала | |
JP2010532875A (ja) | ディジタル信号の復号中に後処理ステップによってもたらされるひずみの制限 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: Tokyo, Japan Applicant after: Renesas Electronics Corporation Address before: Kanagawa Applicant before: Renesas Electronics Corporation |
|
COR | Change of bibliographic data | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20130821 |
|
WD01 | Invention patent application deemed withdrawn after publication |