CN102956236A - 信息处理设备、信息处理方法和程序 - Google Patents
信息处理设备、信息处理方法和程序 Download PDFInfo
- Publication number
- CN102956236A CN102956236A CN2012102799378A CN201210279937A CN102956236A CN 102956236 A CN102956236 A CN 102956236A CN 2012102799378 A CN2012102799378 A CN 2012102799378A CN 201210279937 A CN201210279937 A CN 201210279937A CN 102956236 A CN102956236 A CN 102956236A
- Authority
- CN
- China
- Prior art keywords
- signal
- amplitude
- frequency function
- frequency
- estimating
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 8
- 238000003672 processing method Methods 0.000 title claims description 6
- 238000012545 processing Methods 0.000 claims description 21
- 230000008859 change Effects 0.000 claims description 19
- 230000006870 function Effects 0.000 description 113
- 238000010586 diagram Methods 0.000 description 34
- 238000004891 communication Methods 0.000 description 18
- 230000003321 amplification Effects 0.000 description 10
- 238000000034 method Methods 0.000 description 10
- 238000003199 nucleic acid amplification method Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 9
- 230000003044 adaptive effect Effects 0.000 description 8
- 238000006243 chemical reaction Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 241001269238 Data Species 0.000 description 3
- 230000005764 inhibitory process Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000002592 echocardiography Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 244000287680 Garcinia dulcis Species 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000012856 packing Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0264—Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M9/00—Arrangements for interconnection not involving centralised switching
- H04M9/08—Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
- H04M9/082—Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/02—Circuits for transducers, loudspeakers or microphones for preventing acoustic reaction, i.e. acoustic oscillatory feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02082—Noise filtering the noise being echo, reverberation of the speech
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/01—Aspects of volume control, not necessarily automatic, in sound systems
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Telephone Function (AREA)
- Circuit For Audible Band Transducer (AREA)
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
Abstract
一种信息处理设备,包括:估计部分,其依据输出到扬声器的第一信号和从麦克风输入的第二信号来估计幅度频率函数;产生部分,其依据第一信号和幅度频率函数来产生估计回声信号;以及抑制部分,其从第二信号中抑制估计回声信号,其中,估计部分基于估计的幅度频率函数和短时平均幅度频率函数之间的相关性来改变幅度频率函数的系数。
Description
技术领域
本公开涉及一种信息处理设备、信息处理方法及程序,并且更具体地涉及一种快速抑制回声分量的信息处理设备、信息处理方法及程序。
背景技术
在电视会议系统中,在第一设备和第二设备之间进行通信。当从第一设备中的扬声器发出另一方的声音(即,从第二设备传送的声音)时,该声音可能被麦克风采集并且可能被传送到另一方(即,第二设备)。在此情况下,出现所谓的回声现象。
为了抑制该回声现象,已经提出了多种提议(例如,JP-A-2004-56453)。
在JP-A-2004-56453中公开的技术中,通过从麦克风的输出信号或者扬声器的输出信号中减去线性回声消除器的输出信号而获得的信号之一对应于第一信号,而线性回声消除器的输出信号对应于第二信号。基于指示是否存在近端声音的声音检测信号,依据第一信号和第二信号,对于第一信号和第二信号的每个频率分量,计算回声泄漏的估计值。然后,基于所计算的估计值来校正第一信号,由此产生了近端信号,在该近端信号中,从第一信号中移除了回声分量。
发明内容
然而,在所提出的技术中,在声音的输出电平(output level)改变的情况下,需要耗费时间来充分地抑制回声分量。
相应地,希望提供一种能够快速抑制回声分量的技术。
本公开的实施例针对一种信息处理设备,包括:估计部分,其依据输出到扬声器的第一信号和从麦克风输入的第二信号来估计幅度频率函数;产生部分,其依据第一信号和幅度频率函数来产生估计回声信号;以及抑制部分,其从第二信号中抑制估计回声信号,其中,估计部分基于估计的幅度频率函数和短时平均幅度频率函数之间的相关性来改变幅度频率函数的系数。
在相关性高于预先确定的阈值的情况下,可以按照恒定值改变系数。
在相关性低于阈值的情况下,可以不改变系数。
第一信号可以是输出到扬声器的信号在频域中的信号,第二信号可以是从麦克风输入的信号在频域中的信号。
信息处理设备还可以包括计算部分,其依据频域中的第一信号和第二信号计算瞬时幅度频率函数,并且估计部分可以依据该瞬时幅度频率函数来估计幅度频率函数。
可以将频域中的第二信号转换为时域中的信号,在所述频域中的第二信号中抑制了估计回声信号。
本公开的另一实施例针对一种与根据本公开实施例的信息处理设备相对应的方法和程序。
在本公开实施例中,依据输出到扬声器的第一信号和从麦克风输入的第二信号来估计幅度频率函数;依据第一信号和幅度频率函数来产生估计回声信号;从第二信号中抑制估计回声信号;以及基于估计的幅度频率函数和短时平均幅度频率函数之间的相关性来改变幅度频率函数的系数。
如上所述,根据本公开实施例,可以快速抑制回声分量。
附图说明
图1是图示根据本公开实施例的信息处理系统的配置的框图;
图2是图示自适应回声减法器的配置的框图;
图3是图示幅度频率函数估计部分的配置的框图;
图4是图示第一信息处理设备的输出处理的流程图;
图5是图示第一信息处理设备的输入处理的流程图;
图6是图示幅度频率函数估计处理的流程图;
图7是图示更新系数的具体示例的图;
图8是图示信息处理系统的操作的概览的图;
图9是示意性地图示信息处理系统的操作的图;
图10是图示幅度频率函数估计部分的比较配置的框图;
图11是示意性地图示进行比较的信息处理系统的操作的图;以及
图12是图示个人计算机的配置示例的框图。
具体实施方式
下文中,将描述实施本公开的实施例,并且将按照以下顺序进行描述。
1.信息处理系统的配置
2.信息处理系统的操作
3.关于操作的概念性描述
4.本公开对于程序的应用
5.其它
<1.信息处理系统的配置>
图1是图示根据本公开实施例的信息处理系统1的配置的框图。
例如,形成电视会议系统的信息处理系统1包括第一信息处理设备11、第二信息处理设备12、以及将第一信息处理设备11和第二信息处理设备12连接的通信线路13。通信线路13是可以通过其进行数字通信的通信线路,例如诸如以太网(商标)。通信线路13可以包括诸如因特网等之类的网络。在信息处理系统1中,省略与图像信号处理有关的配置。
第一信息处理设备11包括近端设备31、扬声器32、以及麦克风33。
近端设备31包括放大器51、A/D转换器52、自适应回声减法器53、声音编解码部分54、通信部分55、D/A转换器56、以及放大器57。
麦克风33接收第一信息处理设备11的用户的声音作为输入。放大器51放大来自麦克风33的输入。可以随着用户调节音量(未示出)而将放大器51的放大因子(amplification factor)设置和改变为任意值。A/D转换器52将来自放大器51的声音信号从模拟信号转换为数字信号。自适应回声减法器53例如包括数字信号处理器(DSP),并且对从A/D转换器52输入的信号执行抑制回声分量的处理,所述回声分量是由于从扬声器32输出的声音而引起的噪声分量。
声音编解码部分54执行将从麦克风33输入的声音信号转换为在电视会议系统1中确定的码的处理,也就是说,执行编码处理,从而将输入的声音信号通过通信线路13传送到第二信息处理设备12。此外,声音编解码部分54执行对通过通信线路13从第二信息处理设备12传送到第一信息处理设备11的码进行解码的处理。
D/A转换器56将从声音编解码部分54提供的声音信号从数字信号转换为模拟信号。放大器57放大从D/A转换器56输出的模拟声音信号。可以随着用户调节音量(未示出)而将放大器57的放大因子设置和改变为任意值。扬声器32基于放大器57放大的声音信号来输出声音。
以与第一信息处理设备11相似的方式来配置第二信息处理设备12。也就是说,第二信息处理设备12包括远端设备71、扬声器72、以及麦克风73。此外,尽管未示出,以与近端设备31类似的方式,远端设备71包括放大器、A/D转换器、自适应回声减法器、声音编解码部分、通信部分、D/A转换器、以及放大器。
图2是图示自适应回声减法器53的配置的框图。自适应回声减法器53包括麦克风输入FFT(快速傅立叶变换)部分101、参考输入FFT部分102、瞬时幅度频率函数计算部分103、幅度频率函数估计部分104、估计回声产生部分105、回声抑制部分106、以及逆FFT部分107。
麦克风输入FFT部分101通过FFT将从A/D转换器52输入的声音信号转换为频域中的信号,并且然后以预定频率为单位来执行带宽分割。参考输入FFT部分102通过FFT将从声音编解码部分54输入的声音信号转换为频域中的信号,并且然后以预定频率为单位来执行带宽分割。瞬时幅度频率函数计算部分103将来自麦克风输入FFT部分101的每个频带的瞬时麦克风输入信号除以来自参考输入FFT部分102的每个频带的瞬时扬声器输出信号,来计算瞬时幅度频率函数。该幅度频率函数是指示每个频率的信号幅度的大小的特征。
幅度频率函数估计部分104基于从瞬时幅度频率函数计算部分103输入的瞬时幅度频率函数来估计幅度频率函数。后面将参考图3来描述幅度频率函数估计部分104的细节。估计回声产生部分105依据幅度频率函数估计部分104产生的估计的幅度频率函数以及被参考输入FFT部分102转换到频域中的瞬时扬声器输出信号,来产生估计回声信号。
回声抑制部分106从自麦克风输入FFT部分101输出的麦克风输入频率数据中减去由估计回声产生部分105产生的估计回声信号,以便产生其中抑制了回声分量的回声抑制后信号。逆FFT部分107将从回声抑制部分106输出的回声抑制后信号转换为时域中的回声抑制后信号,并且然后将该信号输出到声音编解码部分54。
图3是图示幅度频率函数估计部分104的配置的框图。幅度频率函数估计部分104包括平均值计算部分151、方差计算部分152、更新系数计算部分153、更新系数改变部分154、存储部分155以及相关性计算部分156。
平均值计算部分151计算从瞬时幅度频率函数计算部分103输入的每个频带的瞬时幅度频率函数的平均值。方差计算部分152基于从瞬时幅度频率函数计算部分103输入的瞬时幅度频率函数以及从平均值计算部分151输入的平均值,计算每个频带的方差。更新系数计算部分153基于从方差计算部分152输出的方差,计算每个频带的更新系数。更新系数改变部分154基于由相关性计算部分156计算的相关性来改变由更新系数计算部分153计算的每个频带的更新系数,然后将结果输出到存储部分155。
存储部分155使用从更新系数改变部分154输出的改变后的更新系数和从瞬时幅度频率函数计算部分103输入的每个频带的瞬时幅度频率函数,计算并存储每个频带的估计的幅度频率函数。相关性计算部分156计算在从瞬时幅度频率函数计算部分103输入的整个频带中的瞬时幅度频率函数和从存储部分155提供的整个频带中的估计的幅度频率函数之间的相关性。
<2.信息处理系统的操作>
接下来,将参考图4-6描述信息处理系统1的操作。
首先,将参考图4描述第一信息处理设备11的输出处理。图4是图示第一信息处理设备的输出处理的流程图。
在步骤S1,第一信息处理设备11的通信部分55从第二信息处理设备12的远端设备71接收声音数据。也就是说,在第二信息处理设备12的用户的声音信号是通过麦克风73获得并且通过通信线路13传送的情况下,通信部分55接收该声音信号。在步骤S2,声音编解码部分54对该数据进行解码。也就是说,声音编解码部分54对在步骤S1中由通信部分55接收的声音数据进行解码。解码后的声音数据被提供到D/A转换器56并且被提供到自适应回声减法器53。
在步骤S3,D/A转换器56将声音编解码部分54解码后的声音数据转换为模拟信号。在步骤S4,扬声器32输出声音。也就是说,D/A转换器56进行D/A转换后的声音信号被放大器57放大,并且然后对应的声音(即第二信息处理设备12的用户的声音)从扬声器32输出。
第一信息处理设备11的用户听到第二信息处理设备12的用户的声音并且发出声音作为回应。
接下来,将描述输入声音的操作。图5是图示第一信息处理设备11的输入处理的流程图。
在步骤S21,麦克风33接收声音作为输入。也就是说,第一信息处理设备11的用户响应于第二信息处理设备12的用户的声音而发出的声音被麦克风33收集。这里,从扬声器32输出的、从第二信息处理设备12传送的声音,即回声分量可能被输入到麦克风33。如果回声分量被照原样传送到第二信息处理设备12,则第二信息处理设备12的用户听到该用户自己发出的带有一些延迟的声音作为来自该用户自己的扬声器72的回声,因此出现所谓的回声现象。
在步骤S22,A/D转换器52对输入的声音信号进行A/D转换。也就是说,在步骤S21输入到麦克风33的声音信号被放大器51放大,被A/D转换器52从模拟信号转换为数字信号,并且然后被输入到自适应回声减法器53。
在步骤S23,参考输入FFT部分102对参考输入信号执行FFT。也就是说,对在图4的步骤S2中从声音编解码部分54输入的第二信息处理设备12的用户的声音数据进行FFT,并且然后对于每个频带被转换为频域中的声音数据。在步骤S24,麦克风输入FFT部分101对麦克风输入信号执行FFT。也就是说,在步骤S22,对从A/D转换器52提供的第一信息处理设备11的用户的声音数据进行FFT,然后对于每个频带被转换为频域中的声音数据。
在步骤S25,瞬时幅度频率函数计算部分103计算瞬时幅度频率函数。具体地,将在步骤S24中计算的瞬时麦克风输入信号除以在步骤S23中计算的瞬时扬声器输出信号,以由此计算瞬时幅度频率函数。接下来,在步骤S26,幅度频率函数估计部分104执行幅度频率函数估计处理。在图6中示出了关于幅度频率函数估计处理的细节。这里,将参考图6描述幅度频率函数估计处理。
图6是图示幅度频率函数估计处理的流程图。在步骤S71,平均值计算部分151计算每个频带的瞬时幅度频率函数的平均值。例如,通过以下公式计算在时间t在频带n中的瞬时幅度频率函数的值xn(t)的平均值Ave xn。
在步骤S72,方差计算部分152基于在步骤S71由平均值计算部分151计算的平均值Ave xn以及在时间t在频带n中的瞬时幅度频率函数的值xn(t),来计算每个频带的瞬时幅度频率函数的方差。具体地,通过以下公式来计算在时间t在频带n中的瞬时幅度频率函数的值xn(t)的方差值σ2 n。
在步骤S73,更新系数计算部分153依据在步骤S72中计算的方差,计算幅度频率函数的每个频带的更新系数。通过以下公式来表示频带n的更新系数μn。
μn=f(σn)(3)
图7是图示更新系数μn的具体示例的图。在该示例中,当σn的值为0到a时,更新系数μn为0;而当σn的值为b或更大时更新系数μn为0.3。此外,当σn的值为a到b时,更新系数μn与σn的值成比例地从0线性地增加到0.3。
在步骤S74,相关性计算部分156依据在步骤S71中计算的每个频带的瞬时幅度频率函数的平均值,计算整个频带中的短时平均幅度频率函数。在步骤S75,相关性计算部分156计算估计的幅度频率函数和整个频带中的短时平均幅度频率函数之间的相关性。所述估计的幅度频率函数是事先在步骤S77中计算的,所述整个频带中的短时平均幅度频率函数是在步骤S74中计算的。
在步骤S76,更新系数改变部分154改变每个频带的更新系数μn。改变后的更新系数被设置为μ′n。在步骤S75中计算的相关性值具有等于或大于预先确定的预定阈值的大小的情况下,也就是说,在相关性高的情况下,每个频带的更新系数μn被改变为预先确定的改变后的更新系数α(恒定值)。另一方面,在相关性值具有小于该阈值的大小的情况下,也就是说,在相关性低的情况下,改变后的更新系数μ′n被照原样设置为更新系数μn(μ′n=μn)。
在步骤S77,存储部分155基于每个频带的瞬时幅度频率函数和改变后的更新系数,估计每个频带的幅度频率函数。估计的幅度频率函数被存储在存储部分155中。每个频带的瞬时幅度频率函数是在图5的步骤S25中计算的值,改变后的更新系数是在步骤S76中改变的值μ′n(=α或μn)。通过以下公式表示频带n的估计的幅度频率函数zn(t)。
Zn(t)=(1-μn)×Zn(t-1)+μn×Xn(t)(4)
公式(4)中的zn(t-1)是在之前的处理中存储在存储部分155中的估计的幅度频率函数。
返回图5,在步骤S26中如上所述地执行来幅度频率函数估计处理之后,估计回声产生部分105在步骤S27中产生估计回声信号。具体地,将在步骤S77中产生的估计的幅度频率函数乘以从参考输入FFT部分102输出的瞬时扬声器输出信号,以由此产生与回声信号对应的估计回声信号。
在步骤S28中,回声抑制部分106产生回声抑制后信号。也就是说,从自麦克风输入FFT部分101输出的瞬时麦克风输入信号中减去由估计回声产生部分105在步骤S27中产生的估计回声信号。由于从瞬时麦克风输入信号中减去了与回声信号对应的估计回声信号,因此获得了在其中抑制了回声分量的信号。
在步骤S29,逆FFT部分107对回声抑制后信号执行逆FFT。因此,获得了时域中的回声抑制后信号。回声抑制后信号被提供到声音编解码部分54。
在步骤S30,声音编解码部分54对回声抑制后信号进行编码。在步骤S31,通信部分55将数据传送到远端设备71。也就是说,通过通信线路13将编码后的回声抑制后数据传送到第二信息处理设备12。
在第二信息处理设备12中,执行与上述的第一信息处理设备11中的输出处理和输入处理相同的处理。
<3.关于操作的概念性描述>
接下来,将描述上述操作的概念。图8是示意性地图示信息处理系统1的操作的图。如图中所示,在与瞬时幅度频率函数计算部分103相对应的除法器191中,将从A/D转换器52输出的瞬时麦克风输入信号除以从声音编解码部分54输出的瞬时扬声器输出信号。由此,获得瞬时幅度频率函数。
幅度频率函数估计部分104依据瞬时幅度频率函数估计出估计的幅度频率函数。形成估计回声产生部分105的乘法器192将扬声器输出信号与估计的幅度频率函数相乘在一起,以由此产生估计回声信号。形成回声抑制部分106的减法器193从瞬时麦克风输入信号中减去估计回声信号,以由此产生回声抑制后信号。
由于回声抑制后信号被以此方式传送到另一方的设备,另一方的设备的用户可以可靠地听到对方的发声,而没有受到该用户自己的发声的干扰。
例如,在用户调节放大器57或放大器51的音量(volume)以改变放大因子的情况下,瞬时幅度频率函数改变。这里,由于上述处理被实时地重复,因此学习到新的系数,并且设置所学习到的系数。相应地,即使放大因子改变,也可以抑制回声分量。
图9是示意性地图示信息处理系统1的操作的图。如图所示,假设存在以下特性:将音量改变之前的估计的幅度频率函数表示为g1。通过改变放大因子,假设将被表示为g3的特性设置为音量改变之后的目标幅度频率函数。在此情况下,如果估计的幅度频率函数g1和目标幅度频率函数g3之间的相关性为高,如上所述,改变后的更新系数μ′n被设置为恒定值α。结果,当特性逐渐从估计的幅度频率函数g1改变为目标幅度频率函数g3时,转变期间在整个频带中的短时平均幅度频率函数g2在每个频带中具有被改变了相同值的增益,由此在目标幅度频率函数g3的特性上快速收敛。
这里,对于比较,可以考虑不同的配置作为幅度频率函数估计部分104。图10是图示幅度频率函数估计部分104的比较配置的框图。在配置示例中,与图3所示的平均值计算部分151、方差计算部分152、更新系数计算部分153和存储部分155相对应,提供平均值计算部分251、方差计算部分252、更新系数计算部分253和存储部分254。然而,未提供与更新系数改变部分154和相关性计算部分156相对应的配置。也就是说,在该配置中,未基于相关性更新系数。结果,在放大因子改变的情况下,转变期间的幅度频率函数如图11所示。
图11是示意性地图示进行比较的信息处理系统1的操作的图。如图所示,假设存在以下特性:将音量改变之前的估计的幅度频率函数表示为g11。通过改变放大因子,假设将被表示为g13的特性设置为音量改变之后的目标幅度频率函数。在此情况下,当特性从估计的幅度频率函数g11改变为目标幅度频率函数g13时,转变期间在整个频带中的短时平均幅度频率函数g12在每个频带中具有被改变了不同值的增益。结果,耗费很长时间来收敛目标幅度频率函数g13的特性。
信息处理系统1不限于电视会议系统1,并且可以应用于诸如免提电话系统或监控照相机系统之类的系统、或者在再现汽车音响的同时执行声音辨别的设备。
<4.本公开对于程序的应用>
可以通过硬件或软件执行上述处理系列。在通过软件执行处理系列的情况下,在计算机中安装形成该软件的程序。这里,计算机包括在专用硬件中安装的计算机、或者通过例如安装各种程序而能够执行各种功能的通用个人计算机。
图12是图示通过程序执行上述处理系列的计算机300的硬件的配置示例的框图。
在计算机300中,CPU(中央处理单元)301、ROM(只读存储器)302、和RAM(随机存取存储器)303通过总线304彼此连接。
输入和输出接口305与总线304连接。输入部分306、输出部分307、存储部分308、通信部分309和驱动器310与输入和输出接口305连接。
输入部分306包括键盘、鼠标、麦克风等。输出部分307包括显示器、扬声器等。存储部分308包括硬盘、非易失性存储器等。通信部分309包括网络接口等。驱动器310驱动诸如磁盘、光盘、磁光盘或半导体存储器之类的可移动介质311。
在具有如此配置的计算机中,例如,CPU 301通过输入和输出接口305和总线304将存储在存储部分308中的程序加载到RAM 303上以便被运行,并且由此执行上述处理系列。
在计算机中,例如,可以通过在驱动器310中安装可移动介质311(其为打包介质(package medium)等),经由输入和输出接口305在存储部分308中安装所述程序。此外,可以由通信部分309通过有线或无线传送介质接收所述程序,并且可以将所述程序安装在存储部分308中。此外,可以预先在ROM 302或存储部分308中安装所述程序。
由计算机执行的程序可以是按照在此说明书中描述的顺序以时序方式执行其处理的程序,或者可以是并行地或者在诸如打电话之类的必要定时执行其处理的程序。
此外,在该说明书中,系统表示包括多个设备的整个配置。
本公开的实施例不限于上述实施例,可以在不偏离本公开的精神的情况下在范围内做出各种修改。
<5.其它>
可以将本公开实现为以下配置:
(1)一种信息处理设备,包括:
估计部分,其依据输出到扬声器的第一信号和从麦克风输入的第二信号来估计幅度频率函数;
产生部分,其依据第一信号和幅度频率函数来产生估计回声信号;以及
抑制部分,其从第二信号中抑制所述估计回声信号,
其中,估计部分基于估计的幅度频率函数和短时平均幅度频率函数之间的相关性来改变幅度频率函数的系数。
(2)如(1)所述的信息处理设备,
其中,在相关性高于预先确定的阈值的情况下,按照恒定值来改变系数。
(3)如(2)所述的信息处理设备,
其中,在相关性低于阈值的情况下,不改变系数。
(4)如(1)、(2)或(3)所述的信息处理设备,
其中,第一信号是输出到扬声器的信号在频域中的信号,第二信号是从麦克风输入的信号在频域中的信号。
(5)如(1)到(4)中的任一项所述的信息处理设备,还包括:
计算部分,其依据频域中的第一信号和第二信号计算瞬时幅度频率函数,
其中,估计部分依据该瞬时幅度频率函数来估计所述幅度频率函数。
(6)如(1)到(5)中任一项所述的信息处理设备,
其中,将频域中的第二信号转换为时域中的信号,在所述频域中的第二信号中抑制了估计回声信号。
(7)一种信息处理方法,包括:
依据输出到扬声器的第一信号和从麦克风输入的第二信号来估计幅度频率函数;
依据第一信号和幅度频率函数来产生估计回声信号;以及
从第二信号中抑制估计回声信号,
其中,在估计幅度频率函数时,基于估计的幅度频率函数和短时平均幅度频率函数之间的相关性来改变幅度频率函数的系数。
(8)一种程序,其使得计算机运行包括以下步骤的例程:
依据输出到扬声器的第一信号和从麦克风输入的第二信号来估计幅度频率函数;
依据第一信号和幅度频率函数来产生估计回声信号;以及
从第二信号中抑制估计回声信号,
其中,在估计幅度频率函数时,基于估计的幅度频率函数和短时平均幅度频率函数之间的相关性来改变幅度频率函数的系数。
本公开包含与在2011年8月15日向日本专利局提交的日本优先权专利申请JP 2011-177568中公开的主题相关的主题,通过引用将其全部内容并入这里。
本领域技术人员应了解,根据设计需要和其他因素,可以进行各种修改、组合、子组合和变化,只要它们在所附权利要求或等同物的范围内即可。
Claims (8)
1.一种信息处理设备,包括:
估计部分,其依据输出到扬声器的第一信号和从麦克风输入的第二信号来估计幅度频率函数;
产生部分,其依据第一信号和幅度频率函数来产生估计回声信号;以及
抑制部分,其从第二信号中抑制估计回声信号,
其中,估计部分基于估计的幅度频率函数和短时平均幅度频率函数之间的相关性来改变幅度频率函数的系数。
2.如权利要求1所述的信息处理设备,
其中,在相关性高于预先确定的阈值的情况下,按照恒定值来改变系数。
3.如权利要求2所述的信息处理设备,
其中,在所述相关性低于阈值的情况下,不改变系数。
4.如权利要求3所述的信息处理设备,
其中,第一信号是输出到扬声器的信号在频域中的信号,第二信号是从麦克风输入的信号在频域中的信号。
5.如权利要求4所述的信息处理设备,还包括:
计算部分,其依据频域中的第一信号和第二信号计算瞬时幅度频率函数,
其中,估计部分依据该瞬时幅度频率函数来估计幅度频率函数。
6.如权利要求5所述的信息处理设备,
其中,将频域中的第二信号转换为时域中的信号,在所述频域中的第二信号中抑制了所述估计回声信号。
7.一种信息处理方法,包括:
依据输出到扬声器的第一信号和从麦克风输入的第二信号来估计幅度频率函数;
依据第一信号和幅度频率函数来产生估计回声信号;以及
从第二信号中抑制估计回声信号,
其中,在估计幅度频率函数时,基于估计的幅度频率函数和短时平均幅度频率函数之间的相关性来改变幅度频率函数的系数。
8.一种程序,其使得计算机执行包括以下步骤的处理:
依据输出到扬声器的第一信号和从麦克风输入的第二信号来估计幅度频率函数;
依据第一信号和幅度频率函数来产生估计回声信号;以及
从第二信号中抑制估计回声信号,
其中,在估计幅度频率函数时,基于估计的幅度频率函数和短时平均幅度频率函数之间的相关性来改变幅度频率函数的系数。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011177568A JP2013042334A (ja) | 2011-08-15 | 2011-08-15 | 情報処理装置、情報処理方法、およびプログラム |
JP2011-177568 | 2011-08-15 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102956236A true CN102956236A (zh) | 2013-03-06 |
Family
ID=47712680
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2012102799378A Pending CN102956236A (zh) | 2011-08-15 | 2012-08-08 | 信息处理设备、信息处理方法和程序 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20130044890A1 (zh) |
JP (1) | JP2013042334A (zh) |
CN (1) | CN102956236A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106716527A (zh) * | 2014-07-31 | 2017-05-24 | 皇家Kpn公司 | 噪声抑制系统和方法 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11902757B2 (en) * | 2022-06-14 | 2024-02-13 | Tencent America LLC | Techniques for unified acoustic echo suppression using a recurrent neural network |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1953060A (zh) * | 2006-11-24 | 2007-04-25 | 北京中星微电子有限公司 | 一种麦克风回声消除装置及回声消除方法 |
US20070263850A1 (en) * | 2006-04-28 | 2007-11-15 | Microsoft Corporation | Integration of a microphone array with acoustic echo cancellation and residual echo suppression |
CN101339769A (zh) * | 2007-07-03 | 2009-01-07 | 富士通株式会社 | 回音抑制器、回音抑制方法 |
-
2011
- 2011-08-15 JP JP2011177568A patent/JP2013042334A/ja not_active Withdrawn
-
2012
- 2012-07-19 US US13/553,077 patent/US20130044890A1/en not_active Abandoned
- 2012-08-08 CN CN2012102799378A patent/CN102956236A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070263850A1 (en) * | 2006-04-28 | 2007-11-15 | Microsoft Corporation | Integration of a microphone array with acoustic echo cancellation and residual echo suppression |
CN1953060A (zh) * | 2006-11-24 | 2007-04-25 | 北京中星微电子有限公司 | 一种麦克风回声消除装置及回声消除方法 |
CN101339769A (zh) * | 2007-07-03 | 2009-01-07 | 富士通株式会社 | 回音抑制器、回音抑制方法 |
US20090010445A1 (en) * | 2007-07-03 | 2009-01-08 | Fujitsu Limited | Echo suppressor, echo suppressing method, and computer readable storage medium |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106716527A (zh) * | 2014-07-31 | 2017-05-24 | 皇家Kpn公司 | 噪声抑制系统和方法 |
Also Published As
Publication number | Publication date |
---|---|
US20130044890A1 (en) | 2013-02-21 |
JP2013042334A (ja) | 2013-02-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101964670B (zh) | 回声抑制方法及回声抑制设备 | |
US8355511B2 (en) | System and method for envelope-based acoustic echo cancellation | |
CN101826892B (zh) | 回声消除器 | |
EP2987316B1 (en) | Echo cancellation | |
US8126161B2 (en) | Acoustic echo canceller system | |
US9386373B2 (en) | System and method for estimating a reverberation time | |
CN103329450B (zh) | 回波消除装置以及回波检测装置 | |
CN103270740B (zh) | 声音控制装置、声音控制方法以及移动终端装置 | |
US9343073B1 (en) | Robust noise suppression system in adverse echo conditions | |
CN105453587A (zh) | 窄频带噪声检测与消除的系统及方法 | |
US20110228946A1 (en) | Comfort noise generation method and system | |
KR102190833B1 (ko) | 에코 억제 | |
CN103534942A (zh) | 处理音频信号 | |
CN110992923B (zh) | 回声消除方法、电子设备以及存储装置 | |
JP2006323230A (ja) | ノイズレベル推定方法及びその装置 | |
US8767974B1 (en) | System and method for generating comfort noise | |
US8406430B2 (en) | Simulated background noise enabled echo canceller | |
CN102956236A (zh) | 信息处理设备、信息处理方法和程序 | |
CN103370741A (zh) | 处理音频信号 | |
TWI234941B (en) | Echo canceler, article of manufacture, and method and system for canceling echo | |
CN109493878B (zh) | 一种用于回声消除的滤波方法及装置、设备、介质 | |
KR20220157475A (ko) | 반향 잔류 억제 | |
JP2013005106A (ja) | 場内拡声装置、場内拡声方法、及びそのプログラム | |
JP5620350B2 (ja) | 場内拡声方法、場内拡声装置とそのプログラム | |
JP2002261659A (ja) | 多チャネルエコーキャンセル方法、その装置、そのプログラム及び記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20130306 |