CN102576543B - 多输入噪声抑制装置、多输入噪声抑制方法以及集成电路 - Google Patents

多输入噪声抑制装置、多输入噪声抑制方法以及集成电路 Download PDF

Info

Publication number
CN102576543B
CN102576543B CN201180004046.5A CN201180004046A CN102576543B CN 102576543 B CN102576543 B CN 102576543B CN 201180004046 A CN201180004046 A CN 201180004046A CN 102576543 B CN102576543 B CN 102576543B
Authority
CN
China
Prior art keywords
power spectrum
weight coefficient
spectrum
sound
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201180004046.5A
Other languages
English (en)
Other versions
CN102576543A (zh
Inventor
金森丈郎
杠慎一
番场裕
寺田泰宏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Publication of CN102576543A publication Critical patent/CN102576543A/zh
Application granted granted Critical
Publication of CN102576543B publication Critical patent/CN102576543B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02165Two microphones, one receiving mainly the noise signal and the other one mainly the speech signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2410/00Microphones
    • H04R2410/01Noise reduction using microphones having different directional characteristics
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2410/00Microphones
    • H04R2410/05Noise reduction with a separate noise microphone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/20Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
    • H04R2430/25Array processing for suppression of unwanted side-lobes in directivity characteristics, e.g. a blocking matrix

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

功率谱推定部(200)根据功率谱(P1(ω))、通过至少进行将功率谱(P2(ω))乘以权重系数(A2(ω))的运算而获得的第一运算值,推定推定目标声功率谱(Ps(ω))。系数更新部(300)更新权重系数(A2(ω))以及权重系数(A1(ω)),以使第二运算值接近功率谱(P1(ω)),该第二运算值是对将功率谱(P2(ω))以及推定目标声功率谱(P3(ω))分别乘以权重系数(A2(ω))以及权重系数(A1(ω))而获得的至少两个值进行加法运算而获得的。

Description

多输入噪声抑制装置、多输入噪声抑制方法以及集成电路
技术领域
本发明涉及多输入噪声抑制装置、多输入噪声抑制方法、程序以及集成电路,尤其涉及利用包含目标声以及噪声成分的信号来抑制噪声成分的多输入噪声抑制装置、多输入噪声抑制方法、程序及集成电路。
背景技术
作为现有的噪声抑制装置,例如有基于目标声中混入了噪声的主信号、噪声参照信号来抑制噪声成分的装置(例如,参照专利文献1)。
在专利文献1所记载的噪声抑制装置(传声器装置)中,通过进行水平判断来检测只存在想要抑制的噪声的状态,并基于主信号以及噪声参照信号的平均功率谱比、噪声参照信号的功率谱,来推定主信号中包含的噪声的功率谱。
然后,决定可抑制推定出的噪声成分的滤波系数,并对主信号进行滤波,从而抑制噪声成分。以下,专利文献1中记载的这种抑制噪声成分的技术也称之为现有技术A。
先行技术文献
专利文献
专利文献1:特开2004-187283号公报
发明内容
发明要解决的问题
但是,在所述现有技术A中存在如下课题。
具体而言,为了使现有技术A的噪声抑制装置进行适当的噪声抑制动作,需要求出不存在目标声成分的时间区间的平均功率谱比。
在像现有技术A这种以对目标声成分以及噪声成分的发生状态进行检测作为前提的结构的情况下,例如,若将包含微小目标声的状态(区间)判断为噪声区间,将发生过度抑制,而导致音质的劣化。另外,在目标声的发生频度高的情况下,无法获得用于求出平均功率谱比的时间区间,从而无法对噪声的传导系统的变动进行追踪。
即,在像现有技术A这种以对目标声成分以及噪声成分的发生状态进行检测作为前提的结构中,存在要想获得噪声成分经过高精度抑制的声音信号时处理就会变得复杂的问题。
本发明是为了解决所述问题而开发的,其目的在于提供能够通过简单的处理就能获得噪声成分被高精度抑制的声音信号的多输入噪声抑制装置等。
用于解决问题的手段
为了解决所述问题,本发明的一个形态的多输入噪声抑制装置使用包含目标声成分以及噪声成分的主信号、和包含噪声成分的至少一个噪声参照信号进行处理,该多输入噪声抑制装置具备:功率谱算出部,在每经过与声音的处理单位对应的单位时刻时,进行算出主功率谱和参照功率谱的算出处理,该主功率谱是所述主信号的功率谱,该参照功率谱是所述噪声参照信号的功率谱;功率谱推定部,在每次进行所述算出处理时,根据所述主功率谱和第一运算值,进行推定被视为目标声的功率谱的推定目标声功率谱的推定处理,该第一运算值是通过至少进行将所述参照功率谱乘以第一权重系数的乘法运算而获得的;以及,系数更新部,在每次进行所述推定处理时,更新所述第一权重系数以及第二权重系数,以使第二运算值接近所述主功率谱,该第二运算值是对将所述参照功率谱以及所述推定目标声功率谱分别乘以所述第一权重系数以及所述第二权重系数所获得的至少两个值进行加法运算而获得的;所述功率谱推定部通过在所述推定处理中至少进行如下乘法运算来推定所述推定目标声功率谱,并输出该推定完的推定目标声功率谱,该乘法运算是指将在经过第k+1个单位时刻时算出的所述参照功率谱乘以在经过第k个单位时刻时由所述系数更新部更新的第一权重系数的运算,其中,k为1以上的整数。
根据所述结构,在每经过单位时刻时,所述第一权重系数以及所述第二权重系数被更新,由此使第二运算值接近所述主功率谱。所述第一权重系数以及第二权重系数分别是用于对所述参照功率谱以及所述推定目标声功率谱进行乘法运算的系数。
第二运算值是对将所述参照功率谱以及所述推定目标声功率谱分别乘以所述第一权重系数以及所述第二权重系数所获得的至少两个值进行加法运算而获得的值。即,第二运算值是包含所述参照功率谱的一部分和所述推定目标声功率谱的一部分的值。
即,在每经过单位时刻时,所述第一权重系数以及所述第二权重系数被更新,从而使包含参照功率谱的一部分和被视为目标声的功率谱的推定目标声功率谱的一部分的第二运算值接近包含有目标声成分以及噪声成分的主信号的主功率谱,该参照功率谱是包含噪声成分的噪声参照信号的参照功率谱。
因此,每经过单位时刻时,所述第一权重系数以及所述第二权重系数分别被收敛向正确表示主信号中包含的目标声成分的量以及噪声成分的量的值。
另外,功率谱推定部通过至少进行将在经过第K+1个单位时刻时算出的所述参照功率谱乘以在经过第K个单位时刻时被更新的第一权重系数的乘法运算,来推定所述推定目标声功率谱,并输出该推定完的推定目标声功率谱。
由此,在每经过单位时刻时,利用被收敛为正确表示目标声成分的量以及噪声成分的量的值的第一权重系数所推定出的推定目标声功率谱,将成为非常接近目标声的功率谱的值。从而能够获得(推定)噪声成分被高精度抑制的声音信号(推定目标声功率谱)。其结果,能够高精度地抑制噪声成分。
另外,在所述的现有技术A中,由于需要对目标声成分以及噪声成分的发生状态进行检测,因此,要想高精度地抑制噪声成分,处理将变得复杂。
相对于此,本形态的多输入噪声抑制装置根据从主信号的主功率谱和噪声参照信号的参照功率谱获得的第一运算值来推定推定目标声功率谱,因此不需要对目标声成分以及噪声成分的发生状态进行检测。即,本形态的多输入噪声抑制能够通过简单的处理获得(推定)噪声成分经过高精度抑制的声音信号(推定目标声功率谱)。
另外,优选为,所述功率谱推定部通过至少进行从所述主功率谱减去所述第一运算值的运算,推定与从所述主功率谱单纯地减去了所述第一运算值的结果不同的所述推定目标声功率谱。
另外,优选为,所述系数更新部通过最小均方法(Least Mean Square:LMS)来更新所述第一权重系数以及所述第二权重系数,以使所述主功率谱和所述第二运算值的差分接近零。
根据所述结构,能通过少量运算推定出高精度抑制噪声的目标声。
另外,优选为,所述系数更新部更新所述第一权重系数以及所述第二权重系数,以使所述第一权重系数以及所述第二权重系数分别成为非负值。
根据所述结构,能够改善各权重系数的收敛性能,以及能够缩短至推定出噪声被抑制的目标声为止的时间。
另外,优选为,所述功率谱推定部包括具有滤波器特性的滤波器运算部,该滤波器特性取决于所述主功率谱和所述第一运算值的差分,所述滤波器运算部通过利用所述滤波器特性来对所述主功率谱进行滤波,从而推定所述推定目标声功率谱。
根据所述结构,在功率谱推定部后段的系数更新部中,能够获得适当的误差信号,从而能改善各权重系数的推定精度。
另外,优选为,所述多输入噪声抑制装置使用多个所述噪声参照信号进行处理,与多个所述噪声参照信号分别对应的多个参照功率谱中的某一个是固定值。
根据所述结构,能够除去因装置或者所连接的器件等的固有噪声等的影响而存在的固定噪声的影响,从而能够推定出以更高的精度抑制噪声的目标声。
另外,优选为,所述功率谱算出部在每经过所述单位时刻时以帧为单位算出所述主功率谱以及所述参照功率谱,所述功率谱推定部在每经过所述单位时刻时,以帧为单位推定所述推定目标声功率谱,所述系数更新部包括时间平均部,该时间平均部算出时间平均,该时间平均是指所述主功率谱、所述参照功率谱以及所述推定目标声功率谱分别在多个所述帧内的平均,所述系数更新部更新所述第一权重系数以及所述第二权重系数,以使由所述时间平均部算出的所述主功率谱的时间平均接近取决于如下加法运算的值,该加法运算是指在所述参照功率谱的时间平均上加上所述推定目标声功率谱的时间平均的运算。
根据所述结构,在频率分析的帧时间的长度短的情况下,或者在提高权重系数的更新速度的情况下,能使权重系数的收敛性能稳定化。
另外,优选为,还具备目标声波形提取部,该目标声波形提取部通过使用由所述系数更新部更新的所述第一权重系数以及第二权重系数来推定所述目标声功率谱,并至少进行为了以时域表示推定出的该目标声功率谱的变换,从而提取目标声的信号波形。
根据所述结构,能够提取高精度地抑制了噪声的目标声的信号波形。
另外,优选为,所述的多输入噪声抑制装置还具备:主传声器,在所述目标声的输出源的方向上具有灵敏度,接收所述主信号;参照传声器,在所述目标声的输出源的方向上的灵敏度为最小或极小,接收所述噪声参照信号。
根据所述结构,能够获得作为指向性和噪声抑制性能被改善的指向性传声器的功能。
另外,优选为,所述系数更新部在每次更新所述第一权重系数时输出更新后的该第一权重系数,所述噪声抑制装置还具备存储部在所述系数更新部每次输出所述第一权重系数时,该存储部存储由所述系数更新部输出的最新的所述第一权重系数。
根据所述结构,至少能使功率谱推定部使用第一权重系数的定时成为恰当的定时,从而能够推定出以更高的精度抑制了噪声的目标声。
另外,优选为,所述多输入噪声抑制装置还具备判断部,判断由所述系数更新部对所述第一权重系数以及所述第二权重系数进行更新的更新次数是否在预先设定的规定次数以上,所述功率谱推定部在所述判断部判断为所述更新次数小于所述规定次数的期间内进行所述推定处理,所述系数更新部在所述判断部判断为所述更新次数小于所述规定次数的期间内,使用上一次更新的所述第一权重系数以及所述第二权重系数,更新所述第一权重系数以及所述第二权重系数。
根据所述结构,能够缩短收敛单位时间内的权重系数所需的时间,从而能够改善对于传达系统的变动等的跟踪性。由此,能够推定出以更高的精度抑制的目标声。
本发明的一个形态的多输入噪声抑制方法,使用包含目标声成分以及噪声成分的主信号、和包含噪声成分的至少一个噪声参照信号进行处理,该多输入噪声抑制方法包括:进行算出处理的步骤,在每经过与声音的处理单位对应的单位时刻时,算出主功率谱和参照功率谱的算出处理,该主功率谱是所述主信号的功率谱,该参照功率谱是所述噪声参照信号的功率谱;进行推定处理的步骤,在每次进行所述算出处理时,根据所述主功率谱和第一运算值,推定被视为目标声的功率谱的推定目标声功率谱,该第一运算值是通过至少进行将所述参照功率谱乘以第一权重系数的乘法运算而获得的;以及,更新步骤,在每次进行所述推定处理时,更新所述第一权重系数以及第二权重系数,以使第二运算值接近所述主功率谱,该第二运算值是对将所述参照功率谱以及所述推定目标声功率谱分别乘以所述第一权重系数以及所述第二权重系数所获得的至少两个值进行加法运算所获得的,在所述进行推定处理的步骤中,通过在所述推定处理中至少进行如下乘法运算来推定所述推定目标声功率谱,并输出该推定完的推定目标声功率谱,该乘法运算是指将在经过第k+1个单位时刻时算出的所述参照功率谱乘以在经过第k个单位时刻时更新的第一权重系数的运算,其中,k为1以上的整数。
本发明的一个形态的程序,由计算机使用包含目标声成分以及噪声成分的主信号、和包含噪声成分的至少一个噪声参照信号进行处理,该程序包括:进行算出处理的步骤,在每经过与声音的处理单位对应的单位时刻时,算出主功率谱和参照功率谱的算出处理,该主功率谱是所述主信号的功率谱,该参照功率谱是所述噪声参照信号的功率谱;进行推定处理的步骤,在每次进行所述算出处理时,根据所述主功率谱和第一运算值,推定被视为目标声的功率谱的推定目标声功率谱,该第一运算值是通过至少进行将所述参照功率谱乘以第一权重系数的乘法运算而获得的;以及,更新步骤,在每次进行所述推定处理时,更新所述第一权重系数以及第二权重系数,以使第二运算值接近所述主功率谱,该第二运算值是对将所述参照功率谱以及所述推定目标声功率谱分别乘以所述第一权重系数以及所述第二权重系数所获得的至少两个值进行加法运算所获得的,在所述进行推定处理的步骤中,通过在所述推定处理中至少进行如下乘法运算来推定所述推定目标声功率谱,并输出该推定完的推定目标声功率谱,该乘法运算是指将在经过第k+1个单位时刻时算出的所述参照功率谱乘以在经过第k个单位时刻时更新的第一权重系数的运算,其中,k为1以上的整数。
本发明的一个形态的集成电路使用包含目标声成分以及噪声成分的主信号、和包含噪声成分的至少一个噪声参照信号进行处理,该集成电路具备:功率谱算出部,在每经过与声音的处理单位对应的单位时刻时,进行算出主功率谱和参照功率谱的算出处理,该主功率谱是所述主信号的功率谱,该参照功率谱是所述噪声参照信号的功率谱;功率谱推定部,在每次进行所述算出处理时,根据所述主功率谱和第一运算值,进行推定被视为目标声的功率谱的推定目标声功率谱的推定处理,该第一运算值是通过至少进行将所述参照功率谱乘以第一权重系数的乘法运算而获得的;以及,系数更新部,在每次进行所述推定处理时,更新所述第一权重系数以及第二权重系数,以使第二运算值接近所述主功率谱,该第二运算值是对将所述参照功率谱以及所述推定目标声功率谱分别乘以所述第一权重系数以及所述第二权重系数所获得的至少两个值进行加法运算所获得的,所述功率谱推定部,通过在所述推定处理中至少进行如下乘法运算来推定所述推定目标声功率谱,并输出该推定完的推定目标声功率谱,该乘法运算是指将在经过第k+1个单位时刻时算出的所述参照功率谱乘以在经过第k个单位时刻时由所述系数更新部更新的第一权重系数的运算,其中,k为1以上的整数。
发明效果
根据本发明,能够通过简单的处理,获得高精度的抑制了噪声成分的声音信号。
附图说明
图1是实施方式1的多输入噪声抑制装置的方框图。
图2是表示实施方式1的多输入噪声抑制装置的结构的一个例子的方框图。
图3是说明被输入到实施方式1的多输入噪声抑制装置的信号的图。
图4是表示实施方式1的系数更新部的结构的一个例子的方框图。
图5是表示实施方式1的系数更新部的结构一个其他例子的方框图。
图6是表示实施方式1的功率谱推定部的结构的一个其他例子的方框图。
图7是噪声抑制处理的流程图。
图8是表示实施方式1的多输入噪声抑制装置的输入信号波形的一个例子的图。
图9是表示通过实施方式1的多输入噪声抑制装置可获得的权重系数的时间变化和收敛值的一个例子的图。
图10是表示实施方式1的功率谱推定部的结构的一个其他例子的方框图。
图11是表示实施方式1的系数更新部的结构的一个其他例子的方框图。
图12是表示实施方式1的多输入噪声抑制装置的一个其他例子的方框图。
图13是实施方式2的多输入噪声抑制装置的方框图。
图14是表示实施方式2的目标声波形提取部的结构的一个例子的方框图。
图15是噪声抑制处理A的流程图。
图16是表示实施方式2的计算机模拟中使用的输入输出信号的波形的图。
图17是说明在多个噪声参照信号中存在窜扰的情况下输入到实施方式2的装置的信号的图。
图18是表示实施方式2的计算机模拟中使用的输入输出信号的波形的图。
图19是表示实施方式2的多输入噪声抑制装置的一个其他例子的方框图。
图20是实施方式3的多输入噪声抑制装置的方框图。
图21是表示实施方式3的多输入噪声抑制装置的输入输出的各种信号的指向性模式的例子的图。
具体实施方式
以下,参照附图详细说明本发明的实施方式。以下说明的实施方式均为本发明优选的一具体例。以下的实施方式中出现的数值、形状、结构要素、结构要素的配置位置以及连接形态、步骤、步骤的顺序等仅为一例,并不表示本发明限定于此。
本发明只受权利要求的限定。因此,将以下的实施方式的结构要素中的未被记载在用于表示本发明的最上位概念的独立权利要求项中的结构要素,作为虽然不是为了达成本发明的目的所必须的,但能够构成更为优选的形态的结构要素进行说明。
另外,在以下的说明中,对相同结构要素赋予相同符号。这些相同结构要素的名称以及功能也相同。因此,有时将省略相关的详细说明。
(实施方式1)
图1是实施方式1的多输入噪声抑制装置1000的方框图。
如图1所示,多输入噪声抑制装置1000具备功率谱算出部100、功率谱推定部200和系数更新部300。
功率谱算出部100在每经过单位时刻时,算出主功率谱和参照功率谱,详情后述。该主功率谱是主信号x(n)的功率谱。该参照功率谱是噪声参照信号的功率谱。
功率谱算出部100具备频率分析部110、120和130。
频率分析部110对主信号x(n)进行频率分析(时间频率变换),并输出通过该频率分析所获得的功率谱P1(ω)。主信号x(n)包含目标声成分以及噪声成分。
在本说明书中,目标声成分是表示目标声的成分。在本说明书,目标声是只包含被视为必要的声音成分的声音。在本说明书,作为一例,将不必要的声音作为噪声。在此情况下,目标声是不包含噪声成分的,而只包含被视为必要的声音成分的声音。并且,在本说明书中,以2πf表示ω。
频率分析部120对主信号x(n)中包含的噪声成分,或者对包含该噪声成分的一部分的噪声参照信号r1(n)进行频率分析,并输出通过该频率分析所获得的功率谱P2(ω)。
频率分析部130对主信号x(n)中包含的噪声成分,或者对包含该噪声成分的一部分的噪声参照信号r2(n)进行频率分析,并输出通过该频率分析所获得的功率谱P3(ω)。
即,噪声参照信号r1(n)、r2(n)分别包含噪声成分。
功率谱推定部200在每次由功率谱算出部100进行所述算出处理时,根据主功率谱和第一运算值来进行推定处理,推定出被视为目标声的功率谱的推定目标声功率谱,该第一运算值是通过至少进行将参照功率谱乘以权重系数的乘法运算而获得的值,详情后述。
以下,将推定目标声功率谱Ps(ω)仅记载为Ps(ω)。
功率谱推定部200接收由频率分析部110、120和130分别输出的功率谱P1(ω)、P2(ω)和P3(ω)。并且,功率谱推定部200接收由系数更新部300输出的权重系数A2(ω)和A3(ω)。
以下,将功率谱P1(ω)、P2(ω)、P3(ω)分别记载为P1(ω)、P2(ω)、P3(ω)。
功率谱推定部200利用功率谱P1(ω)、P2(ω)、P3(ω)以及权重系数A2(ω)、A3(ω)来抑制主信号x(n)的功率谱P1(ω)中包含的噪声成分,并输出推定目标声功率谱Ps(ω),详情后述。
系数更新部300接收由频率分析部110、120、130分别输出的功率谱P1(ω)、P2(ω)、P3(ω),以及由功率谱推定部200输出的推定目标声功率谱Ps(ω)。并且,系数更新部300在每次更新所述第一权重系数时,输出更新后的该第一权重系数。该第一权重系数是权重系数A2(ω)或者权重系数A3(ω)。
由系数更新部300输出的权重系数A2(ω)、A3(ω)被输入到功率谱推定部200,以供在与下一个处理时刻对应的推定目标声功率谱的推定处理中使用。
图2表示了功率谱算出部100中包含的频率分析部110、120、130,以及功率谱推定部200和系数更新部300的结构的一个例子。
频率分析部110包含FFT(Fast Fourier Transform:快速傅里叶变换)运算部111和功率运算部112。FFT运算部111对主信号x(n)进行FFT运算,并输出通过该FFT运算获得的频谱。在本说明书中,以帧为单位来进行FFT运算。在本说明书中,帧表示用于对被作为FFT运算的处理对象的信号的一部分(一定时间内的信号)进行处理的范围。该一定时间例如是100毫秒。例如,在作为信号的一部分的100毫秒的信号成为FFT运算的对象的情况下,帧被设定为该100毫秒的信号。
在本实施方式中,帧时间例如是48k/S(64≤S≤4096)的范围的值。帧时间例如是100毫秒。
连续的多个帧被设定成该连续的多个帧中的相邻接的两个帧的一部分重叠的方式。为了使相邻接的两个帧重叠而使帧进行移位的长度,称之为帧移位长度或者帧移位量。
另外,也可以将该多个帧设定成其中相邻接的两个帧不重叠的方式。
帧与某时刻对应。在以下的说明中,与帧对应的时刻也称之为帧时刻。从帧时刻开始到经过了帧时间后的时刻为止的信号,既是一次FFT运算的对象。帧时刻是与声音的处理单位对应的单位时刻。以下,也将帧时刻称作时刻、处理时刻或者单位时刻。
多个帧分别与多个帧时刻对应。在本实施方式中,例如以时刻T1、T2、……、Tn表示多个帧时刻。以下,帧中的处理也称之为帧处理。
功率运算部112对由FFT运算部111输出的频谱,按每个频率成分计算该频谱的绝对值的二次方,并将通过该计算所获得的结果作为功率谱P1(ω)输出。
在本说明书中,每个频率成分是指每个规定的频率。该规定的频率例如是48k/S(64≤S≤4096)的范围的值。当S为1024时,48k/1024=46.9,因此该规定的频率大概为47Hz。在此情况下,每个频率成分相当于47的各倍数(47、94、141、……)。
频率分析部120包含FFT运算部121和功率运算部122。FFT运算部121对噪声参照信号r1(n)进行FFT运算,并输出通过该FFT运算所获得的频谱。功率运算部122对由FFT运算部121输出的频谱,按每个频率成分计算该频谱的绝对值的二次方,并将通过该计算所获得的结果作为功率谱P2(ω)输出。
频率分析部130包含FFT运算部131和功率运算部132。FFT运算部131对噪声参照信号r2(n)进行FFT运算,并输出通过该FFT运算所获得的频谱。功率运算部132对由FFT运算部131输出的频谱,按每个频率成分计算该频谱的绝对值的二次方,并将通过该计算所获得的结果作为功率谱P3(ω)输出。
功率谱推定部200包含乘法运算部212、213。乘法运算部212对功率谱P2(ω),通过按每个频率成分乘以权重系数A2(ω),来进行加权。然后,乘法运算部212输出被加权的功率谱。
乘法运算部213对功率谱P3(ω),通过按每个频率成分乘以权重系数A3(ω),来进行加权。然后,乘法运算部213输出被加权的功率谱。
功率谱推定部200还包含加法运算部221、减法运算部222和滤波器运算部250。
加法运算部221按每个频率成分,对由乘法运算部212、213分别输出的两个被加权的功率谱进行加法运算。在以下的说明中,由加法运算部221进行加法运算所获得的功率谱也称之为第一功率谱。然后,加法运算部221输出第一功率谱。
减法运算部222按每个频率成分,从功率谱P1(ω)减去第一功率谱。在以下的说明中,由减法运算部222进行减法运算所获得的功率谱也称之为第二功率谱。然后,减法运算部222将第二功率谱作为功率谱Psig(ω)输出。
滤波器运算部250利用功率谱P1(ω)以及功率谱Psig(ω),算出推定目标声功率谱Ps(ω),并输出该推定目标声功率谱Ps(ω)。
系数更新部300包含乘法运算部311、312、313。
乘法运算部311、312、313分别对功率谱进行乘以加权系数的乘法运算,详情后述。
系数更新部300还包含加法运算部321和减法运算部322。
加法运算部321按每个频率成分,对由乘法运算部311、312、313分别输出的被加权的三个功率谱进行加法运算。加法运算部321输出通过该加法运算所获得的功率谱。
另外,系数更新部300还包含下述时间平均部305。在此,为了简化附图,图2中未表示时间平均部305。
减法运算部322按每个频率成分,进行从功率谱P1(ω)减去由加法运算部321输出的功率谱的减法运算。减法运算部322将通过该减法运算所获得的功率谱作为推定误差功率谱Perr(ω)输出。
权重系数A1(ω)、A2(ω)、A3(ω)根据推定误差功率谱Perr(ω)、推定目标声功率谱Ps(ω)以及功率谱P2(ω)、P3(ω)而被更新。在以下的说明中,权重系数A2(ω)、A3(ω)也分别称之为第一权重系数。另外,在以下的说明中,权重系数A1(ω)也称之为第二权重系数。
乘法运算部311、312、313利用更新后的各权重系数,对下一个处理时刻的各输入信号进行加权,详情后述。在此,关于权重系数A1(ω)、A2(ω)、A3(ω)的更新,如图2所示,以通常用于记载自适应算法的箭头线来表示。该箭头线被表示为连接于乘法运算部311、312、313。关于权重系数A1(ω)、A2(ω)、A3(ω)的更新的详细内容,将在以下的动作说明中以公式表示。
接下来,就多输入噪声抑制装置1000动作进行说明。
在以下的说明中,在没有特别注明的情况下,代表信号的符号的开头文字若是小字,表示时域信号。另外,代表信号的符号的开头文字若是大字,表示包含有被变换为频域的相位信息的复合频谱。另外,在代表信号的符号中,开头文字为P的符号表示功率谱。
以下,参照图3,说明根据主信号x(n)和噪声参照信号r1(n)、r2(n)之间的关系来推定推定目标声功率谱的方法。
在此,进行说明时设想为存在发出目标声S0(ω)的目标声源和分别发出噪声N1(ω)以及噪声N2(ω)的噪声源A以及噪声源B。
观察主信号x(n)时,将其设想为包含有将目标声S0(ω)、噪声N1(ω)、噪声N2(ω)分别乘以传达特性H11(ω)、H12(ω)、H13(ω)后的各信号的信号。在此,传达特性(传达函数)是表示由传达声音的介质所致的该声音的变化的函数。若以频域表示主信号x(n),将得到以下的公式1。
X(ω)=H11(ω)S0(ω)+H12(ω)N1(ω)+H13(ω)N2(ω)(式1)
公式1中的X(ω)是主信号x(n)的频谱。
另外,在此将噪声参照信号r1(n)表现(观察)为噪声N1(ω)乘以传达特性H22(ω)的信号。另外,将噪声参照信号r2(n)表现(观察)为噪声N2(ω)乘以传达特性H33(ω)的信号。
在频域中,噪声参照信号r1(n)、r2(n)分别被表示为公式2以及公式3。公式2中的R1(ω)是以频域表示噪声参照信号r1(n)的频谱。公式3中的R2(ω)是以频域表示噪声参照信号r2(n)的频谱。
R1(ω)=H22(ω)N1(ω)   (式2)
R2(ω)=H33(ω)N2(ω)   (式3)
在公式1~3中,若以噪声N1(ω)以及噪声N2(ω)分别作为噪声成分,噪声参照信号r1(n)、r2(n)将分别包含主信号x(n)所包含的噪声成分。
相对而言,在公式1~3中,若以乘上了传达特性的噪声N1(ω)以及噪声N2(ω)分别作为噪声成分,主信号x(n)所包含的噪声成分将不同于噪声参照信号r1(n)、r2(n)分别所包含的噪声成分。
在此,设想可视为从主信号X(ω)中除去噪声成分之后的目标声成分的功率谱的推定目标声功率谱Ps(ω)如公公式4所示。在此情况下,通过利用公式1~公式3来计算公式4,可获得推定目标声功率谱Ps(ω)。
Ps(ω)=|H11(ω)S0(ω)|2   (式4)
在此,作为此类利用可通过装置观察到的主信号以及噪声信号来推定目标声的方法,例如有利用振幅相位信息来消除噪声波形的消噪(消噪器)方式,以及,在不利用相位信息的情况下在功率谱上进行处理的噪声抑制(抑制器)方式。在本实施方式中,设想采用所述噪声抑制方式。
如果只是单纯地从主信号x(n)中减去噪声参照信号r1(n)、r2(n),并不能获得噪声抑制效果。在此,使用传达特性H11(ω)、H22(ω)、H33(ω)表现公式1~公式3的输入信号的理由在于,为了表现出通过对噪声参照信号r1(n)、r2(n)分别进行加权来推定混入到主信号x(n)中的噪声成分的必要性。
传达特性H11(ω)、H12(ω)、H13(ω)、H22(ω)、H33(ω)根据目标声源以及噪声源A、B相对于装置(例如,多输入噪声抑制装置1000)的位置和距离而不同。因此,如果只是单纯地从主信号x(n)中减去噪声参照信号r1(n)、r2(n),并不能推定出目标声或者抑制噪声。
根据本发明的实施方式的推定方法,在不利用相位信息的情况下,在功率谱区域进行处理。通过以上,可以简化如上所述的存在多个声源时的处理。在公式1中,若以功率谱表现公式的两边,并取时间平均ε的话,独立的各信号的积将被视为零(例如,ε{S0(ω)N1 *(ω)}≒0,其中,*表示复共轭,ε表示波形括号({})内的信号的时间平均)。
因此,可将公式1表示为公式5。在此,以帧为单位来处理功率谱。在本说明书中,时间平均例如是对与连续的多个帧分别对应的多个信号(例如,功率谱),按每个相同的频率成分算出的平均。
ϵ { X ( ω ) X * ( ω ) } = ϵ { H 11 ( ω ) H 11 * ( ω ) S 0 ( ω ) S 0 * ( ω ) } + ϵ { H 12 ( ω ) H 12 * ( ω ) N 1 ( ω ) N 1 * ( ω ) } + ϵ { H 13 ( ω ) H 13 * ( ω ) N 2 ( ω ) N 2 * ( ω ) }   (式5)
在公式5中、*表示复共轭。
在此,将X(ω)的功率谱表现为Px(ω),将噪声N1(ω)的功率谱表现为PN1(ω),将噪声N2(ω)的功率谱表现为PN2(ω)。若在公式5的X(ω)、N1(ω)以及N2(ω)中分别代入Px(ω)、PN1(ω)以及PN2(ω),并利用公式4来整理公式5,可得出以下的公式6。
ε{PX(ω)}=ε{PS(ω)}+H12(ω)H12 *(ω)ε{PN1(ω)}+H13(ω)H13 *(ω)ε{PN2(ω)}   (式6)
在此,将公式2的R1(ω)的功率谱表现为PR1(ω),将公式3的R2(ω)的功率谱表现为PR2(ω)。这此情况下,从公式2、公式3可分别得出公式7、公式8。然后,将公式7、公式8代入公式6并进行整理。从而,如公式9所示,能用线形公式来表现想求的Ps(ω)和可观察到的Px(ω)、PR1(ω)、PR2(ω)之间的关系。
P N 1 ( ω ) = 1 H 22 ( ω ) H 22 * ( ω ) P R 1 ( ω )   (式7)
P N 2 ( ω ) = 1 H 33 ( ω ) H 33 * ( ω ) P R 2 ( ω )   (式8)
ϵ { P X ( ω ) } = ϵ { P S ( ω ) } + H 12 ( ω ) H 12 * ( ω ) H 22 ( ω ) H 22 * ( ω ) ϵ { P R 1 ( ω ) } + H 13 ( ω ) H 13 * ( ω ) H 33 ( ω ) H 33 * ( ω ) ϵ { P R 2 ( ω ) }   (式9)
将公式9右边的涉及第2项以及第3项的传达特性的部分,表现为如公式10、公式11所示的权重系数A2(ω)、A3(ω)。如果将公式10以及公式11代入公式9,可得出公式12。
A 2 ( ω ) = H 12 ( ω ) H 12 * ( ω ) H 22 ( ω ) H 22 * ( ω )     (式10)
A 3 ( ω ) = H 13 ( ω ) H 13 * ( ω ) H 33 ( ω ) H 33 * ( ω )     (式11)
ε{PX(ω)}=ε{PS(ω)}+A2(ω)ε{PR1(ω)}+A3(ω)ε{PR2(ω)}   (式12)
如上所述,通过算出权重系数A2(ω)、A3(ω),并根据可通过多输入噪声抑制装置观察到的功率谱信号Px(ω)、PR1(ω)、PR2(ω),求出推定目标声功率谱信号Ps(ω)。
在公式12中,功率谱Px(ω)、PR1(ω)、PR2(ω)、Ps(ω)各自的水平,在与单位时刻T1、T2、…、Tn分别对应的帧中发生变化。相对于此,权重系数A2(ω)、A3(ω)只与传达特性有关。因此,传达特性若不变,权重系数A2(ω)、A3(ω)则保持固定的值。
因此,即使功率谱Px(ω)、PR1(ω)、PR2(ω)、Ps(ω)在与单位时刻T1、T2、……、Tn分别对应的帧中发生变化,也存在可使公式12的线形式成立的权重系数A2(ω),A3(ω)。
通过应用自适应均衡算法,使公式12的左边的Px(ω)与右边的线形式相等化,从而可获得权重系数A2(ω)、A3(ω)。根据该方法,与单位时刻T1、T2、……、Tn分别对应的帧中的功率谱Px(ω)、PR1(ω)、PR2(ω)以及Ps(ω)的值可随时用于算出权重系数A2(ω)、A3(ω)。因此,根据本实施方式,不必为了推定出目标声而对只有目标声或者只有噪声的时间区间进行检测。
在此,单位时刻T1、T2、……、Tn与所述帧时刻对应。在20Hz~20kHz的可听域的音响处理的情况下,帧长以及帧移位长度例如是数msec~数100msec的顺序的值。并且,在使用超声波或者低频波等其他信号的情况下,帧长以及帧移位长度相对于所处理的频域成比例地变化。
作为应用于公式12的自适应均衡算法,例如有LMS法(Least MeanSquare:自适应滤波算法)。以下说明利用该LMS法来求出权重系数A2(ω)、A3(ω)的方法。
通常,LMS法用于推定被卷积在信号中的传达特性,因此,输入信号是时间波形,用于推定的系数是传达特性的脉冲响应。在本实施方式中,将LMS法利用于求出多个信道间的频率成分功率的比率。
因此,输入信号不是时间波形,而是多个信道各自的频率成分的功率谱,用于推定的系数是权重系数A2(ω)、A3(ω)。在本实施方式中,LMS法中使用的输入信号以及权重系数取非负的值。就输入信号以及权重系数取非负的值的这一点而言,本实施方式中使用的输入信号以及权重系数不同于通常的LMS法中应用的输入信号以及推定系数。
在通过LMS法求解的计算中,使用公式13求出推定误差Perr(ω),使用公式14更新系数。公式13、公式14是作为LMS法应用了NLMS(Normalized Least Mean Square:归一化最小均方)的例子。
通过学习来更新公式13以及公式14中的权重系数A1(ω)的结果,推定目标声功率谱Ps(ω)将成为与输入信号功率谱Px(ω)中包含的目标声功率谱相等的值。因此,可以预先将权重系数A1(ω)设为固定系数,例如,权重系数A1(ω)=1等。
Perr(ω)=ε{Px(ω)}-(A1(ω)ε{PS(ω)}+A2(ω)ε{PR1(ω)}+A3(ω)ε{PR2(ω)})   (式13)
A 1 ( ω ) A 2 ( ω ) A 3 ( ω ) n + 1 = A 1 ( ω ) A 2 ( ω ) A 3 ( ω ) n + α · P err ( ω ) ϵ { P S ( ω ) } 2 + ϵ { P R 1 ( ω ) } 2 + ϵ { P R 2 ( ω ) } 2 ϵ { P S ( ω ) } ϵ { P R 1 ( ω ) } ϵ { P R 2 ( ω ) }     (式14)
在公式14中,与n对应的项表示现在的权重系数A1(ω)、A2(ω)、A3(ω)。与n+1对应的项表示更新后的权重系数A1(ω)、A2(ω)、A3(ω)。
P1(ω)=PX(ω)    (式15)
P2(ω)=PR1(ω)    (式16)
P3(ω)=PR2(ω)    (式17)
图4表示了实施方式1的系数更新部30的结构的一个例子。
系数更新部300包含时间平均部305。时间平均部305算出主功率谱、参照功率谱以及推定目标声功率谱分别在多个帧中的平均即时间平均,详情后述。
时间平均部305包含LPF部301、302、303、304。向LPF部301、302、303、304,分别输入Ps(ω)、P2(ω)、P3(ω)、P1(ω)。
根据图4的结构,系数更新部300能够利用将公式15~公式17代入公式13及公式14所获得公式,来更新权重系数A1(ω)、A2(ω)、A3(ω)。在以下的说明中,将公式15代入公式13所获得的公式称之为公式13A。另外,在以下的说明中,将公式16以及公式17代入公式14所获得的公式称之为公式14A。
在公式13以及公式14中,ε表示波形括号({})内的信号的时间平均。LPF部301向乘法运算部311输出ε{Ps(ω)}。LPF部302向乘法运算部312输出ε{P2(ω)}。LPF部303向乘法运算部313输出ε{P3(ω)}。LPF部304向减法运算部322输出ε{P1(ω)}。ε{Ps(ω)}、ε{P2(ω)}、ε{P3(ω)}、ε{P1(ω)}分别是Ps(ω)、P2(ω)、P3(ω)、P1(ω)的时间平均。
LPF部301~304分别具有算出与多个帧分别对应的多个输入信号的时间平均的作用。
LPF部301算出与多个帧分别对应的多个Ps(ω)的时间平均ε{Ps(ω)}。LPF部302算出与多个帧分别对应的多个P2(ω)(参照功率谱)的时间平均ε{P2(ω)}。LPF部303与LPF部302同样,算出ε{P3(ω)}。LPF部304算出与多个帧分别对应的多个P1(ω)(主功率谱)的时间平均ε{P1(ω)}。
系数更新部300通过将算出的各输入信号的时间平均和由减法运算部322输出的推定误差功率谱Perr(ω)代入公式13A以及公式14A,来更新在乘法运算部311~313使用的权重系数A1(ω)、A2(ω)、A3(ω)。
在此,输入到系数更新部300的各输入信号和权重系数A1(ω)、A2(ω)、A3(ω)均取非负的值。因此,收敛(更新)权重系数A1(ω)、A2(ω)、A3(ω),以使推定误差功率谱Perr(ω)接近零。
在公式13中,如果权重系数A1(ω)、A2(ω)、A3(ω)过大,Perr(ω)将成为负值。在公式14中,由于Perr(ω)以外的变量为非负的值,因此,权重系数A1(ω)、A2(ω)、A3(ω)以减少的方向被更新。
相反,如果权重系数A1(ω)、A2(ω)、A3(ω)过小,Perr(ω)成为正值,权重系数A1(ω)、A2(ω)、A3(ω)以增加的方向被更新。随着Perr(ω)在正负之间的变动,而求出权重系数A1(ω)、A2(ω)、A3(ω)的比率。
输入水平越高的信道(信号),权重系数A1(ω)、A2(ω)、A3(ω)对Perr(ω)值的影响就越大。因此,越是与输入水平高的信道(信号)对应的权重系数,其基于Perr(ω)的更新量就越大。
另外,公式14的步长参数(Step size parameter)α是用于控制被设定为通过多次更新而使权重系数逐渐接近收敛值的收敛速度的参数。在本实施方公式中,α被设定在0<α<1的范围,通过采用这样的参数α,还可以获得平滑处理的效果(时间平均的效果)。
另外,在频率分析部110、120、130中,为了进行频率分析,使用某时间长度的信号。由此,可包含短时间平均的效果。因此,在本实施方式中,也可以使用公式18以及公式19来进行权重系数A1(ω)、A2(ω)、A3(ω)的更新处理。
公式18是省略了公式13的ε{}部分的公式。公式19是省略了公式14的ε{}部分的公式。
Perr(ω)=PX(ω)-(A1(ω)PS(ω)+A2(ω)PR1(ω)+A3(ω)PR2(ω))    (式18)
A 1 ( &omega; ) A 2 ( &omega; ) A 3 ( &omega; ) n + 1 = A 1 ( &omega; ) A 2 ( &omega; ) A 3 ( &omega; ) n + &alpha; &CenterDot; P err ( &omega; ) P S ( &omega; ) 2 + P R 1 ( &omega; ) 2 + P R 2 ( &omega; ) 2 P S ( &omega; ) P R 1 ( &omega; ) P R 2 ( &omega; ) &epsiv;     (式19)
因此,使用公式18以及公式19来更新权重系数A1(ω)、A2(ω)、A3(ω)的系数更新部300也可以具有如图5所例示的结构。
即,系数更新部300也可以是不包含时间平均部305的结构。
接下来,就目标声功率谱的导出进行说明,该导出相当于推定目标声功率谱Ps(ω)的推定方法。推定目标声功率谱Ps(ω)是被希望作为多输入噪声抑制装置1000的输出而求出的信号。为了使用公式13、公式14来获得权重系数A1(ω)、A2(ω)、A3(ω),有必要预先推定(算出)目标声功率谱Ps(ω)。
但是,如果利用假为设Perr(ω)=0、权重系数A1(ω)=1的公式20来推定推定目标声功率谱Ps(ω)的话,在进行公式13的运算时,Perr(ω)将始终为零。因此,无法利用公式14来进行更新系数。假设为权重系数A1(ω)=1的理由在于,权重系数A1(ω)最终被收敛为大致等于1。公式20是基于频谱减法的公式。
PS(ω)=PX(ω)-(A2(ω)PR1(ω)+A3(ω)PR2(ω))    (式20)
因此,有必要采用根据与公式20不同的规范导出的方法来推定推定目标声功率谱Ps(ω)。并且,优选采用噪声抑制效果比公式20更高的方法来推定。
功率谱推定部200并不限定于图2所示的结构,也可以是以下图6所示的结构。
图6是表示功率谱推定部200具备滤波器运算部251的结构例的方框图。图6表示了采用维纳滤波法来导出推定目标声功率谱Ps(ω)的例子,维纳滤波法用于噪声抑制(噪声抑制器)。乘法运算部212、213和加法运算部221以及减法运算部222的结构与图2中说明的结构相同,因此省略说明。
滤波器运算部251,作为噪声抑制(噪声抑制器)的滤波特性,具有如公式21所示的维纳滤波器的滤波特性Hw(ω)。在此,Psig(ω)是对公式20的右边进行计算而获得的值。
Hw ( &omega; ) = P sig ( &omega; ) P X ( &omega; )     (式21)
功率谱推定部200(滤波器运算部250),根据公式21以及公式22,通过将主信号x(n)的频谱X(ω)乘以滤波器特性Hw(ω),再将以上乘法运算的结果乘以2,而获得(算出)推定目标声功率谱Ps(ω)。频谱X(ω)是由FFT运算部111输出的频谱。
P S ( &omega; ) = | P sig ( &omega; ) P X ( &omega; ) &CenterDot; X ( &omega; ) | 2     (式22)
然后,通过整理公式22,导出公式23。图2的功率谱推定部200根据公式23算出推定目标声功率谱Ps(ω)。
P S ( &omega; ) = P sig ( &omega; ) 2 P X ( &omega; )     (式23)
图2的功率谱推定部200(滤波器运算部250)通过利用公式23,能够像图6的功率谱推定部200利用公式22进行的运算那样,算出推定目标声功率谱Ps(ω),并能够削减运算量。
公式23是基于功率谱Psig(ω)的公式,功率谱Psig(ω)是功率谱P1(ω)和第一功率谱的差分。即,图2的滤波器运算部250具有基于主功率谱和第一运算值(加法运算部221的输出)的差分(功率谱Psig(ω))的滤波器特性。
滤波器运算部250根据公式23来算出推定目标声功率谱Ps(ω)的这一处理,相当于滤波器运算部250针对主功率谱,通过利用所述滤波特性进行滤波,从而推定出推定目标声功率谱Ps(ω)的处理。
公式22以及公式23是以维纳滤波法作为规范得到的公式,其与公式20的频谱减法运算不同,在进行公式13的运算时,Perr(ω)始终不会常成为零。因此,能够利用公式13来进行权重系数的更新。
以下,说明由实施方公式1的多输入噪声抑制装置1000进行的处理(以下,也称之为噪声抑制处理)。噪声抑制处理以帧为单位进行。在本实施方式中,帧时间例如是100毫秒。另外,帧时间并不限于100毫秒,也可以是数毫秒~数100秒的范围。
噪声抑制处理被重复进行多次。一次的噪声抑制处理贯穿整个帧时间而进行。噪声抑制处理被重复进行多次的这个处理,相当于实施方式1的多输入噪声抑制方法。
图7是噪声抑制处理的流程图。在此,设想在帧时刻T(k+1)开始进行噪声抑制处理(k为1以上的整数)。
首先,在步骤S1001中,功率谱算出部100在每经过单位时刻(帧时刻)时,进行算出处理,算出作为主信号的功率谱的主功率谱和作为所述噪声参照信号的功率谱的参照功率谱。
具体是,功率谱算出部100在帧时间内,对在帧时刻T(k+1)输入的主信号x(n)以及噪声参照信号r1(n)、r2(n)进行频率分析,并通过该频率分析算出功率谱P1(ω)、P2(ω)、P3(ω)。然后,功率谱算出部100输出功率谱P1(ω)、P2(ω)、P3(ω)。在此,关于功率谱算出部100的频率分析部110、120、130分别进行的处理,在前面已作说明,在此省略重述。
即,所述功率谱算出部100在每经过所述单位时刻(帧时刻)时,以帧为单位,算出主功率谱以及参照功率谱。
然后,在步骤S1002中,功率谱推定部200在每次进行所述算出处理时,根据主功率谱和第一运算值来进行推定处理,以推定出被视为目标声的功率谱的推定目标声功率频,该第一运算值是通过至少进行将所述参照功率谱乘以第一权重系数的运算而获得的,详情后述。
具体是,功率谱推定部200利用在与帧时刻T(k+1)对应的帧时间内由功率谱算出部100输出的功率谱P1(ω)、P2(ω)、P3(ω)和在与帧时刻Tk对应的帧时间内由系数更新部300算出的权重系数A2(ω)、A3(ω),来推定(算出)推定目标声功率谱Ps(ω)。
即,功率谱推定部200在每经过所述单位时刻时,以帧为单位,推定推定目标声功率谱。
另外,在第一次进行步骤S1002时,功率谱推定部200将任意的权重系数A2(ω)、A3(ω)用作初期值。另外,作为该初期值的权重系数A2(ω)、A3(ω)可以是通过模拟处理等决定的、用于算出与目标声的功率谱接近的推定目标声功率谱Ps(ω)的权重系数。
并且,具体是,功率谱推定部200在所述推定处理中,通过至少进行如下运算来推定推定目标声功率谱Ps(ω),并输出该推定完的推定目标声功率谱Ps(ω),该运算是指将在经过第k+1个单位时刻Tk时算出的所述参照功率谱乘以在经过第k个单位时刻Tk时由所述系数更新部300更新的第一权重系数的运算。该第一权重系数例如是A2(ω)。该参照功率谱例如是功率谱P2(ω)。
以下,进行详细说明。首先,乘法运算部212对功率谱P2(ω),通过按每个频率成分乘算权重系数A2(ω)来进行加权。然后,乘法运算部212输出被加权的功率谱。
另外,乘法运算部213对功率谱P3(ω),通过按每个频率成分乘算权重系数A3(ω)来进行加权。然后,乘法运算部213输出被加权的功率谱。
加法运算部221,按每个频率成分,对由乘法运算部212、213分别输出的两个功率谱进行加法运算,并输出通过该加法运算所获得的第一功率谱。
减法运算部222,按每个频率成分,从功率谱P1(ω)减去第一功率谱。然后,减法运算部222将通过该减法以上所获得的第二功率谱作为功率谱Psig(ω)输出。即,功率谱推定部200的减法运算部222进行从所述主功率谱减去所述第一运算值的运算。该第一运算值是由加法运算部221输出的第一功率谱。
滤波器运算部250利用功率谱P1(ω)以及功率谱Psig(ω),通过公式15和基于维纳滤波法的公式23,算出推定目标声功率谱Ps(ω)。即,滤波器运算部250通过对主功率谱P1(ω)进行利用基于功率谱Psig(ω)的滤波器特性的滤波处理,来推定推定目标声功率谱Ps(ω)。
即,功率谱推定部200通过至少进行从所述主功率谱减去所述第一运算值的运算,来推定与从所述主功率谱单纯地减去所述第一运算值的结果不同的推定目标声功率谱Ps(ω)。
然后,滤波器运算部250输出该推定目标声功率谱Ps(ω)。
接下来,在步骤S1003中,图5中的系数更新部300利用由功率谱算出部100输出的功率谱P1(ω)、P2(ω)、P3(ω)以及由滤波器运算部250输出的推定目标声功率谱Ps(ω),来更新权重系数A1(ω)、A2(ω)、A3(ω)。
具体是,系数更新部300在每次进行所述推定处理时,更新所述第一权重系数以及第二权重系数,以使第二运算值接近所述主功率谱,该第二运算值是对将所述参照功率谱以及所述推定目标声功率谱分别乘以所述第一权重系数以及第二权重系数所获得的至少两个值进行加算的值。该第二权重系数是A1(ω)。该第二运算值是由加法运算部321输出的功率谱。
换言之,系数更新部300根据LMS法来更新所述第一权重系数以及第二权重系数,以使主功率谱和所述第二运算值的差分接近零。
并且,具体是,乘法运算部311对推定目标声功率谱Ps(ω),通过按每个频率成分乘算权重系数A1(ω)来进行加权。然后,乘法运算部311输出被加权的功率谱。
乘法运算部312对功率谱P2(ω),通过按每个频率成分乘算权重系数A2(ω)来进行加权。然后,乘法运算部312输出被加权的功率谱。
乘法运算部313对功率谱P3(ω),通过按每个频率成分乘算权重系数A3(ω)来进行加权。然后,乘法运算部313输出被加权的功率谱。
加法运算部321按每个频率成分,对由乘法运算部311、312、313分别输出的、被加权的三个功率谱进行加法运算。加法运算部321输出通过该加法运算获得的功率谱(以下,也称之为加算完的功率谱)。
减法运算部322按每个频率成分,从功率谱P1(ω)减去由加法运算部321输出的加算完的功率谱。减法运算部322将通过该减算获得的功率谱作为推定误差功率谱Perr(ω)输出。
并且,系数更新部300利用公式18以及公式19和公式15~公式17,更新(算出)权重系数A1(ω)、A2(ω)、A3(ω)。然后,系数更新部300将更新后的权重系数A2(ω)、A3(ω)作为供功率谱推定部200在与帧时刻T(k+2)对应的帧时间内使用的系数,输出到该功率谱推定部200。
以上的噪声抑制处理在每经过单位时刻(帧时刻)时被重复进行多次。从而更新加权系数A1(ω)、A2(ω)、A3(ω),以使由加法运算部321输出的加算后的功率谱接近主信号x(n)的主功率谱。即,每经过单位时刻时,第一权重系数以及第二权重系数分别被收敛向正确表示主信号中包含的目标声成分的量以及噪声成分的量的值。该第一权重系数是权重系数A2(ω)或者权重系数A3(ω)。该第二权重系数是权重系数A1(ω)。
通过以上,利用每经过单位时刻时被收敛向正确表示目标声成分的量以及噪声成分的量的值的第一权重系数所推定出的推定目标声功率谱,将成为与目标声的功率谱非常接近的值。由此,能够得到(推定)噪声成分被高精度抑制的声音信号(推定目标声功率谱)。其结果,能够高精度地抑制噪声成分。
另外,在步骤S1003中,也可以由具有图4的结构的系数更新部300进行处理。在此情况下,如上所述,系数更新部300利用公式13~公式17来更新(算出)权重系数A1(ω)、A2(ω)、A3(ω)。
在此情况下,图4中的所述系数更新部300更新所述第一权重系数以及第二权重系数,以使由所述时间平均部305算出的主功率谱的时间平均接近取决于以下加法运算的值,该加法运算是指对所述参照功率谱的时间平均和所述推定目标声功率谱的时间平均进行加算。
接下来,参照图8以及图9说明本实施方式的多输入噪声抑制装置1000的模拟操作的结果。
图8表示了被输入到本实施方式的多输入噪声抑制装置1000的信号的一个例子。并且,图8是以波形显示图3中的各信号的图。
图8(a)表示了以时域表示目标声S0(ω)的目标声s0(n)。图8(b)表示了以时域表示噪声N1(ω)的噪声n1(n)。噪声n1(n)相当于噪声参照信号r1(n)。
图8(c)表示了以时域表示噪声N2(ω)的噪声n2(n)。噪声n2(n)相当于噪声参照信号r2(n)。图8(d)表示了主信号x(n)。
为了模拟出有噪声混入到目标声s0(n)中的状态,作为一个例子,根据公式24生成主信号x(n)。
x(n)=s0(n)+0.5×n1(n)+0.7×n2(n)    (式24)
为了简单起见,公式24表现的是瞬间混合模式。公式24相当于,设想在公式1中,H11(ω)=1.0、H12(ω)=0.5、H13(ω)=0.7就所有的频率成分ω而言都分别成立的情况下的公式。
在实际情况下,表示主信号的公式为卷积混合模式,卷积有传达特性。然而,在实施方公式1的处理中,由频率分析部110、120、130将各信号变换成功率谱。
因此,时域的卷积被变换成频率区域的乘法运算的形式。即,能将每个频率成分的变动当做瞬间混合来处理。由此,通过公式24也能确认多输入噪声抑制装置1000的动作。
另外,在设想为H22(ω)=1.0、H33(ω)=1.0就所有的频率成分ω而言都分别成立的情况下,根据公式2、公式3求出噪声参照信号r1(n)、噪声参照信号r2(n)。
图9是表示与图8的各信号对应的权重系数A1(ω)、A2(ω)、A3(ω)的更新状态的图。横坐标表示时间,纵坐标表示权重系数的值。权重系数的值表示按每个频率成分ω取平均的值。
图9表示了在以具有如图8所示的波形的主信号x(n)以及噪声参照信号r1(n)、r2(n)作为多输入噪声抑制装置1000的输入信号的情况下的权重系数A1(ω)、A2(ω)、A3(ω)的变化。
在图9中,粗线表示权重系数A2(ω)的变化。虚线表示权重系数A3(ω)的变化。图9中的最上部的线表示权重系数A1(ω)的变化。
如图9所示,可知权重系数A1(ω)被收敛为约1.0,权重系数A2(ω)收敛为约0.25,权重系数A3(ω)收敛为约0.49。权重系数A1(ω)、A2(ω)、A3(ω)是用于对功率谱进行乘法运算的系数。因此,各权重系数被收敛为与其对应的传达特性的振幅水平的二次方。
即,权重系数A1(ω)被收敛为H11(ω)的绝对值的二次方,权重系数A2(ω)被收敛为H12(ω)的绝对值的二次方,权重系数A3(ω)被收敛为H13(ω)的绝对值的二次方。
在此,对公式24中使用的输入信号以及条件进行整理,其结果如下。
(条件1)s0(n)表示语音波形信号。
(条件2)n1(n)等于Wn1(n)×sin(2×π×0.5×n/fs)。n1(n)表示振幅以1sec的周期变化的广域噪声信号。
(条件3)n2(n)等于Wn2(n)×cos(2×π×0.1×n/fs)。n2(n)表示振幅以5sec的周期变化的广域噪声信号。
(条件4)Wn1(n)、Wn2(n)是相互独立的白噪声。
(条件5)设想fs=44100Hz、公式14的步长参数α=0.005、FFT长度(帧大小)=1024。
如上所述,根据本实施方式的多输入噪声抑制装置1000以及多输入噪声抑制方法,在每经过单位时刻时,第一权重系数以及第二权重系数分别被收敛向正确表示主信号中包含的目标声成分的量以及噪声成分的量的值。该第一权重系数是权重系数A2(ω)或者权重系数A3(ω)。该第二权重系数是权重系数A1(ω)。
因此,利用在每经过单位时刻时被收敛向正确表示目标声成分的量以及噪声成分的量的值的第一权重系数所推定出的推定目标声功率谱,将成为与目标声的功率谱非常接近的值。从而,能够获得(推定)噪声成分被高精度地抑制的声音信号(推定目标声功率谱)。其结果,能高精度地抑制噪声成分。
另外,在所述现有技术A中,由于必须对目标声成分以及噪声成分的发生状态进行检测,因此,若要对噪声成分进行高精度的抑制,将导致处理变得复杂。
相对于此,本实施方式的多输入噪声抑制装置1000根据主信号的主功率谱和从噪声参照信号的功率谱获得的运算值来推定推定目标声功率谱。具体是,本实施方式的多输入噪声抑制装置1000利用主功率谱和噪声参照信号的功率谱的线性和(线性组合关系),来推定推定目标声功率谱。
因此,无需对目标声成分以及噪声成分的发生状态进行检测。即,本形态的多输入噪声抑制装置能通过简单的处理,获得(推定)噪声成分被高精度地抑制的声音信号(推定目标声功率谱)。
另外,本实施方式的多输入噪声抑制装置1000在同时存在多个声源的状态下也能对权重系数进行推定。换言之,即使在目标声和噪声同时发生的情况下,也能推定出正确的权重系数。因此,能获得噪声成分被抑制的推定目标声功率谱。另外,由于本实施方式的多输入噪声抑制装置1000能够始终进行学习,因此,对传达特性变化的跟踪性和推定精度得以提高,以及可改善音质以及噪声抑制量。
另外,即使在噪声参照信号的信道数为多个的情况下,也会通过学习来适当地分配信道间的抑制权重,因此能使多输入噪声抑制装置的动作稳定,且不会增加处理的复杂度。
另外,图2中的功率谱推定部200可以具有图10所示的结构。图10所示的功率谱推定部200不同于图2所示的功率谱推定部200之处在于,在减法运算部222和滤波器运算部250之间设有数值范围限制部230。
由减法运算部222输出的功率谱Psig(ω)(第二功率谱)是功率谱,因此功率谱Psig(ω)应该取非负的值。但是,功率谱Psig(ω)在学习的中途阶段或者因误差等,可能会出现取负值的情况。因此,数值范围限制部230会对功率谱Psig(ω)(第二功率谱)加以限制,以防止其成为负值。具体是,数值范围限制部230在Psig(ω)成为负值的情况下,将Psig(ω)设定为0。
通过所述结构,能够改善由系数更新部300更新的权重系数A1(ω)、A2(ω)、A3(ω)的收敛性能。
另外,图2的系数更新部300也可以具有图11所示的结构。图11所示的系数更新部300不同于图2所示的系数更新部300之处在于,还包含数值范围限制部330。
数值范围限制部330在根据由减法运算部322输出的推定误差功率谱Perr(ω)来更新权重系数A1(ω)、A2(ω)、A3(ω)的系数更新中,对系数值的数值范围进行限制。
权重系数具有如下特征点,在[A1(ω)、A2(ω)、A3(ω)]=[1、0、0]的情况下,噪声抑制效果成为零,且不再进行系数更新。在此,数值范围限制部330设定权重系数A2(ω)、A3(ω)的最小值,例如A2(ω)>0、A3(ω)>0,即,使A2(ω)、A3(ω)取正的值,以防成为[A1(ω)、A2(ω)、A3(ω)]=[1、0、0]。
即,图11的系数更新部300对所述第一权重系数以及第二权重系数进行更新,以使所述第一权重系数以及第二权重系数(A1(ω))分别成为非负的值(例如,正的值)。该第一权重系数是权重系数A2(ω)或者权重系数A3(ω)。
根据所述结构,能获得更稳定的动作。
另外,如图12所示,本实施方式的多输入噪声抑制装置1000可以是将作为处理对象的多个噪声参照信号中的一个噪声参照信号(信道)作为固定值(固定系数)来进行噪声抑制处理的结构。即,所述多输入噪声抑制装置1000利用多个噪声参照信号进行处理,与所示多个噪声参照信号分别对应的多个参照功率谱中的某一个是固定值。
在主信号x(n)所包含的、系统的电路噪声或者连接于多输入噪声抑制装置1000的传感器的电路噪声等较大的情况下,权重系数的学习将出现问题。在这种情况下,为了表现电路噪声等固定噪声,例如能通过将功率谱P3(ω)的值设定为固定值(固定系数)的方法来改善学习动作。
另外,关于实施方式1的多输入噪声抑制装置1000所利用的噪声参照信号的数量,在此是噪声参照信号r1(n)、r2(n)这两个,但并不限定于此。多输入噪声抑制装置1000也可以是利用一个主信号和一个噪声参照信号来进行噪声抑制处理的结构(以下,也称之为结构A)。该一个噪声参照信号,例如是噪声参照信号r1(n)。
在结构A中,功率谱推定部200不使用加法运算部221。在此情况下,由乘法运算部212输出的功率谱被输入到减法运算部222。然后,减法运算部222按每个频率成分,通过从功率谱P1(ω)减去由减乘法运算部212输出的功率谱,算出功率谱Psig(ω)。然后,滤波器运算部250利用功率谱P1(ω)以及第二功率谱Psig(ω),算出(推定)推定目标声功率谱Ps(ω)。
在结构A中,功率谱推定部200进行根据主功率谱(功率谱P1(ω))和第一运算值来推定推定目标声功率谱Ps(ω)的处理,该第一运算值是通过至少进行所述参照功率谱乘以第一权重系数(A2(ω))的运算而获得的。
另外,在结构A中,系数更新部300不使用乘法运算部313。在此情况下,加法运算部321按照每个频率成分,对由乘法运算部311、312分别输出的加权后的两个功率谱进行加法运算,并输出通过该加法运算所获得的功率谱。
减法运算部322将按每个频率成分从功率谱P1(ω)减去由加法运算部321输出的功率谱的结果,作为推定误差功率谱Perr(ω)输出。然后,如上所述,系数更新部300度权重系数A1(ω)、A2(ω)进行更新。
即,在结构A中,系数更新部300更新所述第一权重系数以及所述第二权重系数,以使第二运算值接近所述主功率谱,该第二运算值是通过对将所述参照功率谱以及所述推定目标声功率谱分别乘以第一权重系数(A2(ω))以及第二权重系数(A1(ω))而获得的至少两个值进行加法运算而获得的。在此,第二运算值是由加法运算部321输出的功率谱。
另外,多输入噪声抑制装置1000可以利用一个主信号和三个以上的噪声参照信号来进行噪声抑制处理。
在此,说明了功率谱算出部100具备频率分析部110、120、130的情况。此外,也可以通过硬件或者信息处理器的软件方式来实现功率谱算出部100。另外,功率谱算出部100的各频率分析部可以进行同时并列处理或者分时处理。即,功率谱算出部100是能够在单位处理时间(帧时间)内算出功率谱的结构即可。
(实施方式2)
图13是实施方式2的多输入噪声抑制装置1000A的方框图。在图13中,对与图1的多输入噪声抑制装置1000相同的结构要素赋予相同的符号,并省略其说明。
在图13中,多输入噪声抑制装置1000A不同于图1的多输入噪声抑制装置1000之处在于,还具备存储部350、目标声波形提取部400和判断部500。在以下的说明中,由输入噪声抑制装置1000A进行的处理也称之为噪声抑制处理A。
图14是表示实施方式2的目标声波形提取部400的结构的一个例子的方框图。
图15是噪声抑制处理A的流程图。
以下参照图13~图15,说明多输入噪声抑制装置1000A的结构以及动作。
图13的目标声波形提取400利用主信号x(n)、主信号x(n)的功率谱P1(ω)、噪声参照信号r1(n)的功率谱P2(ω)、噪声参照信号r2(n)的功率谱P3(ω)、由系数更新部300输出的权重系数A2(ω)和A3(ω),输出对主信号x(n)中包含的噪声成分进行了抑制的输出信号y(n)。
功率谱P1(ω)由频率分析部110输出。功率谱P2(ω)由频率分析部120输出。功率谱P3(ω)由频率分析部130输出。
目标声波形提取部400包含:乘法运算部412、413、414、415;加法运算部421;减法运算部422;传达特性运算部450;傅里叶逆变换部(IFFT)460;系数更新部470;滤波部480。
图13的存储部350是用于临时存储(保持)由系数更新部300输出的最新的权重系数A2(ω)、A3(ω)的缓存器。具体是,存储部350在每次由所述系数更新部300输出所述第一权重系数时,对所述系数更新部300输出的最新的第一权重系数进行存储。
在此,设想为最新的帧时刻是帧时刻T(k+1)。更具体是,存储部350对由系数更新部300在与帧时刻Tk对应的时间内输出的权重系数A2(ω)、A3(ω)进行临时存储(保持),该帧时刻Tk是帧时刻T(k+1)的前一个帧时刻。然后,在帧时刻T(k+1)的帧处理中,存储部350将其保持的权重系数A2(ω)、A3(ω)输出到功率谱推定部200。
图14的目标声波形提取部400的乘法运算部412对功率谱P2(ω),按每个频率成分ω乘以权重系数A2(ω)。然后,乘法运算部412将通过该乘法运算所获得的信号作为输出信号输出。乘法运算部413对来自乘法运算部412的输出信号,按照每个频率成分乘以定数γ1。然后,乘法运算部413将通过该乘法运算所获得的信号作为输出信号输出。
乘法运算部414对功率谱P3(ω),按每个频率成分乘以权重系数A3(ω)。然后,乘法运算部414将通过该乘法运算所获得的信号作为输出信号输出。乘法运算部415对来自乘法运算部414的输出信号,按每个频率成分乘以定数γ2。然后,乘法运算部415将通过该乘法运算所获得的信号作为输出信号输出。
加法运算部421按每个相同的频率成分,对来自乘法运算部413的输出信号和来自乘法运算部415的输出信号的频率成分进行加法运算。然后,加法运算部421将通过该加法运算所获得的信号作为输出信息输出。
减法运算部422通过按每个频率成分,从主信号x(n)的功率谱P1(ω)减去来自加法运算部421的输出信号,算出功率谱Psig(ω),并输出该功率谱Psig(ω)。
传达特性运算部450利用主信号x(n)的功率谱P1(ω)和来自减法运算部422的功率谱Psig(ω),算出维纳滤波器传达特性Hw(ω)并输出。
傅里叶逆变换部460对由传达特性运算部450输出的维纳滤波器传达特性Hw(ω)进行逆变换,并算出与各帧对应的滤波系数。然后,傅里叶逆变换部460输出表示算出的多个滤波系数的信号。
系数更新部470针对来自傅里叶逆变换部460的输出信号,对根据每个帧移动量而变化的滤波系数进行平滑化,生成连续变化的时变系数,并输出该时变系数。
滤波部480生成将时变系数卷积在主信号(n)中的输出信号y(n),并输出该输出信号y(n)。
即,目标声波形提取部400利用由所述系数更新部300更新的所述第一权重系数以及第二权重系数来推定所述目标声功率谱,并通过至少进行以时域来表示该推定出的目标声功率谱的变换,提取(输出)目标声的信号波形。该目标声的信号波形是输出信号y(n)的波形。
以下说明具有所述结构的目标声波形提取部400的动作。
若设想乘法运算部413所使用的定数为γ1、乘法运算部415所使用的定数为γ2,减法运算部422将根据公式25来算出功率谱Psig(ω)。
Psig(ω)=P1(ω)-(γ1A2(ω)P2(ω)+γ2A3(ω)P3(ω))  (式25)
在公式25中,γ1=γ2=1时,功率谱Psig(ω)将成为推定出的目标声功率谱。
在此,设定γ1、γ2的目的在于,在考虑推定出的权重系数A2(ω)、A3(ω)会因少许的误差或者噪声的传达系统的变动而相对于理想值发生误差的基础上,以对抑制量的强弱进行控制。另外,γ1、γ2可以取0≤(γ1,γ2)≤10的范围的值。
在传达特性运算部450中,通常是根据噪声抑制中使用的维纳滤波器传达特性,通过公式26来计算传达特性Hw(ω)。
Hw ( &omega; ) = [ P sig ( &omega; ) ] min = 0 P 1 ( &omega; ) + &beta; ( &omega; )     (式26)
但是,在根据公式25求出Psig(ω)的阶段,Psig(ω)有时会具有负的值。因此,根据公式26右边的第一项的分子[·]min=0,在Psig(ω)<0的情况下,按每个频率成分,将Psig(ω)设定为0。另外,公式26的右边的β(ω)是被称作底限系数(Flooring parameters)的系数,是用于设定最大抑制量的限制的定数。β(ω)可取值的数值范围是0≤β(ω)≤1。
在傅里叶逆变换部460中,如公式27所示,通过对Hw(ω)进行IFFT(Inverse Fast Fourier Transform:快速傅里叶逆变换),将传达特性Hw(ω)变换为脉冲响应。
hw(n)=F-1{HW(ω)}    (式27)
在公式27中,F-1表示傅里叶逆变换。
到傅里叶逆变换部460为止的处理为帧处理,相对于此,后段的时变系数FIR滤波器的处理是以样本作为单位的处理。因此,系数更新部470通过将脉冲响应作为线间插值等,来更新(控制)滤波系数,使得按每个样本连续变化。该脉冲响应是由傅里叶逆变换部460以帧移位量的周期为单位输出的。
滤波部480进行将来自系数更新部470的时变系数卷积到主信号x(n)的运算,并输出通过该卷积运算所获得的输出信号y(n)。
如上所述,利用推定出的权重系数A2(ω)、A3(ω),求出用于噪声抑制的功率谱Psig(ω),并由滤波部480执行用于抑制噪声的滤波处理。
图15所示的噪声抑制处理A被重复进行多次。与图7的噪声抑制处理同样,一次的噪声抑制处理A在整个帧时间内被进行。在此,设想在帧时刻T(k+1)开始进行噪声抑制处理A(k为1以上的整数)。噪声抑制处理A被重复进行多次的处理,相当于实施方式2的多输入噪声抑制方法。
首先,在步骤S1401中,进行与图7中的步骤S1001同样的处理,在此省略重述。由此,功率谱算出部100利用主信号x(n)、噪声参照信号r1(n)、r2(n),算出在帧时刻T(k+1)的功率谱P1(ω)、P2(ω)、P3(ω),并输出。另外,关于由功率谱算出部100的频率分析部110、120、130分别进行的处理,前面已作说明,在此省略重述。
然后,在步骤S1402中,进行与图7的步骤S1002同样的处理,在此省略重述。
以下,进行简单的说明。功率谱推定部200利用帧时刻T(k+1)时的功率谱P1(ω)、P2(ω)、P3(ω)以及被存储在存储部350的、与帧时刻Tk对应的权重系数A2(ω)、A3(ω),算出(推定)推定目标声功率谱Ps(ω),并输出该推定目标声功率谱Ps(ω)。帧时刻Tk是帧时刻T(k+1)的前一个帧时刻。与帧时刻Tk对应的权重系数A2(ω)、A3(ω)是由系数更新部300在与帧时刻Tk对应的帧时间内算出的权重系数。
即,在步骤S1402中,功率谱推定部200通过至少进行如下运算来推定所述推定目标声功率谱,并输出该推定完的推定目标声功率谱。该运算是指将在经过第k+1个单位时刻时算出的所述参照功率谱乘以在经过第k个单位时刻时由所述系数更新部300更新的第一系数的运算。
然后,在步骤S1403中,进行与图7的步骤S1003同样的处理,在此省略重述。
以下,进行简单的说明。系数更新部300利用由功率谱算出部100输出的功率谱P1(ω)、P2(ω)、P3(ω)和由滤波器运算部250输出的推定目标声功率谱Ps(ω),更新与帧时刻T(k+1)对应的权重系数A1(ω)、A2(ω)、A3(ω)。另外,系数更新部300向该目标声波形提取部400输出更新后的权重系数A2(ω)、A3(ω)。
即,在步骤S1403中,系数更新部300利用所述更新的第一权重系数以及第二权重系数,来更新所述第一权重系数以及所述第二权重系数。
在步骤S1404中,系数更新部300使存储部350对被更新的权重系数A2(ω)、A3(ω)进行存储。
然后,在步骤S1405中,判断部500判断重复进行步骤S1402~S1404的处理的重复次数是否达到了预先设定的规定次数。即,判断部500判断由系数更新部300对所述第一权重系数以及所述第二权重系数进行的更新的更新次数是否为预先设定的规定次数以上。
如果在步骤S1405判断为“是”,处理将移动到步骤S1406。相反,如果在步骤S1405判断为“否”,则在k上加算1,并再次进行步骤S1402的处理。
在此,设想在步骤S1405判断为“否”,再次进行了步骤S1402、S1403的处理。即,在所述判断部500判断为所述更新次数不满所述规定次数的期间,所述功率谱推定部200进行步骤S1402的处理。另外,在所述判断部500判断为所述更新次数不满所述规定次数的期间,系数更新部300进行步骤S1403的处理。
在步骤S1406中,目标声波形提取部400利用在与时刻T(k+1)对应的帧时间更新的最新加权系数A2(ω)、A3(ω),根据主信号x(n)生成对噪声进行了抑制的输出信号y(n),并输出该输出信号y(n)。在此,关于目标声波形提取部400从主信号x(n)生成输出信号y(n)的处理,以上已参照图14进行了说明,在此省略重述。
另外,在噪声抑制处理A中,可以像实施方式1那样,在一个帧时间内,按照由功率谱推定部200进行处理之后由系数更新部300进行处理的顺序,只进行一次步骤S1402、S1403的处理,从而更新权重系数。
另外,要想进一步提高噪声抑制的精度的情况下,可以像本实施方式这样,在一个帧时间内,按照由功率谱推定部200进行处理之后由系数更新部300进行处理的顺序,重复进行步骤S1402、S1403的处理,从而更新权重系数。
步骤S1405中进行判断时利用的规定次数,其值越大,权重系数的正确性就越高。但是,由于与帧移动量以及运算速度的关系,重复次数的有限的,因此重复次数被设定成一次以上、且多输入噪声抑制装置1000A的处理极限次数以下的值。
如上所述,多输入噪声抑制装置1000A以帧为单位,重复进行步骤S1401~步骤S1406的处理。重复次数为一次以上。另外,由于与帧移动量以及运算速度的关系,重复次数的上限是有限的。
另外,系由数更新部300进行的权重系数的更新处理,是利用在实施方式1中说明的公式18或公式14进行的处理。
图16是表示向本实施方式的多输入噪声抑制装置1000A输入与图8相同的输入信号时的输入输出信号的波形的图。
图16(a)~(d)分别与图8(a)~与(d)相同,在此省略重述。
图16(e)表示了目标声波形提取部400输出的输出信号y(n)。由于与混入了噪声的输入信号x(n)对应的权重系数随着时间经过被收敛,输出信号y(n)的波形逐渐接近目标声S0(n)的波形。
另外,多输入噪声抑制装置1000A可以利用以下的图17所示的主信号x(n)和噪声参照信号r1(n)、r2(n),进行噪声抑制处理A。
图17是表示在噪声参照信号r1(n)、r2(n)之间存在窜扰的情况下的各信号的图。在图17中,对与图3相同的符号以及公式不重复进行说明。
在图17中,如果H32(ω)N2(ω)所示的窜扰对R1(ω)有影响,R1(ω)被表示为图17的公式。另外,如果H32(ω)N2(ω)所示的窜扰对R2(ω)有影响,R2(ω)被表示为图17公式。
图18表示了在H11(ω)=H22(ω)=H33(ω)=1、H12(ω)=0.5、H13(ω)=0.7、H32(ω)=0.5、H23(ω)=0.5的情况下的多输入噪声抑制装置1000A的输入信号波形以及输出信号波形。
图18(a)~(d)分别与图8(a)~(d)相同,在此省略重述。
图18(e)是表示噪声参照信号r1(n)的波形的图。图18(f)是表示噪声参照信号r2(n)的波形的图。图18(g)与图16(e)相同,在此省略重述。
除了噪声参照信号r1(n)与噪声参照信号r2(n)为相同值等的特殊情况之外,即使在噪声参照信号r1(n)和噪声参照信号r2(n)之间存在窜扰,如果能像实施方式1的公式12那样表现各功率谱,多输入噪声抑制装置1000A就能像使用图16所示的信号的情况一样抑制噪声。
如上所述,根据本实施方式的多输入噪声抑制装置1000A,除了实施方式1的效果之外,通过设置目标声波形提取部400,还可以提取目标声的波形。即,能够输出目标声。
在此,关于目标声的波形提取,即使不设置如上所述的目标声波形提取部400,也能通过对目标声功率谱Ps(ω)进行IFFT来提取波形。但是,如本实施方式所示,通过使用最新的权重系数A2(ω)、A3(ω),或者设置乘法运算部413、415,能获得对噪声被进一步抑制的波形(目标声)。
在此,多输入噪声抑制装置1000A是具备判断部500的结构,此外,如图19所示,多输入噪声抑制装置1000A也可以不具备判断部500。在此情况下,功率谱推定部200按预先规定的次数,反复进行噪声抑制处理A的步骤S1402的处理。另外,系数更新部300按预先规定的次数反复进行噪声抑制处理A的步骤S1403、S1404的处理。然后,进行步骤S1406的处理。
在此,实施方式2的多输入噪声抑制装置1000A所利用的噪声参照信号的数量为噪声参照信号r1(n)、r2(n)这两个,但并不限定于此。与实施方式1中说明的情况同样,多输入噪声抑制装置1000A也可以是利用一个主信号和一个噪声参照信号来进行噪声抑制处理A的结构。一个噪声参照信号例如是噪声参照信号r1(n)。另外,多输入噪声抑制装置1000A也可以使用一个主信号和三个以上的噪声参照信号来进行噪声抑制处理A。
(实施方式3)
图20是实施方式3的多输入噪声抑制装置1000B的方框图。在图20中,对与图13的多输入噪声抑制装置相同的结构要素,赋予相同的符号,并省略其说明。
在图20中,多输入噪声抑制装置1000B不同于图13的多输入噪声抑制装置1000A之处在于,还具被传声器10、20、30。多输入噪声抑制装置1000B的其他结构以及功能与多输入噪声抑制装置1000A的相同,在此省略重述。
传声器10被构成为只接收主信号x(n)。传声器20被构成为只接收噪声参照信号r1(n)。传声器30被构成为只接收噪声参照信号r2(n)。
即,多输入噪声抑制装置1000B作为意向性传声装置进行动作。
接下来,就多输入噪声抑制装置1000B的动作进行说明。
以下,设想相对于本实施方式的多输入噪声抑制装置1000B的位置,发出目标声的目标声源的位置为正面0°的位置。在极性图中,相对于目标声的传声器的声压灵敏度为正面0°方向的图表值。所谓的极性图是通过圆形图表,以360度表示声音的指向特性的图。
以下,从多输入噪声抑制装置1000B侧看时,发出目标声的方向也称之为目标声方向。
传声器10是用于获取主信号x(n)的传声器。因此,传声器10利用在目标声方向(正面0°)上具有灵敏度的特性。尤其是,传声器10的指向特性优选在正面0°具有最大灵敏度。传声器10将接收到的信号发送给频率分析部110以及目标声波形提取部400。
图21(a)是表示传声器10的指向特性的例子的图。即,传声器10是在所述目标声的输出源的方向上具有灵敏度的、用于接收所述主信号x(n)的主传声器。换言之,传声器10在所述目标声的输出源(目标声源)方向上灵敏度高于在其他声源(例如,噪声源A)方向上的灵敏度。
传声器20是用于获得噪声参照信号r1(n)的传声器。即,传声器20是接收所述噪声参照信号r1(n)的参照传声器。因此,传声器20具有在目标声方向(正面0°)上有灵敏度盲点的指向特性。传声器20将接收到的信号发送到频率分析部120。
图21(b)是表示传声器20的指向特性的例子的图。作为一个例子,传声器20具有在90°和270°有最大灵敏度的双指向特性。
传声器30是用于获得噪声参照信号r2(n)的传声器。即,传声器30是接收所述噪声参照信号r2(n)的参照传声器。因此,为了有效利用多个噪声参照信号,传声器30具有与传声器10、20不同的指向特性。传声器30将接收到的信号发送到频率分析部130。
图21(c)是表示传声器30的指向特性的例子的图。传声器30为了获得噪声参照信号r2(n),作为一个例子,具有在正面0°有灵敏度盲点的指向特性。另外,为了降低被输入到传声器20的信号和窜扰,传声器30例如具有还在90°以及270°有灵敏度盲点的指向特性。作为传声器30的指向特性的种类,相当于在180°方向上具有最大灵敏度的二次声压倾度型的指向性模式。
即,传声器20、30分别是在所述目标声的输出源方向上的灵敏度最小或者极小的参照传声器。换言之,传声器20、30分别是在所述目标声的输出源方向的灵敏度几乎为零(大致为零)的参照传声器。
如上所述,将分别输入到传声器10、20、30的多个信号,作为多输入噪声抑制装置1000B的输入信号。
关于在主信号x(n)的指向特性(图21(a))的90°以及270°方向上的声音,根据噪声参照信号r1(n)的指向特性(图21(b))来进行抑制。
另外,关于在主信号x(n)的指向特性(图21(a))的180°的方向上的声音,根据噪声参照信号r2(n)的指向特性(图21(c))来进行抑制。
其结果,由多输入噪声抑制装置1000B输出的输出信号y(n),如图21(d)所示,在正面0°方向以外的方向上的灵敏度被抑制,从而获得狭角的主瓣以及正面0°方向以外的方向的衰减量被改善的旁瓣。即,获得旁瓣抑制器的动作。
如上所述,从极性图的中心看,目标声源例如在正面0°的位置。在此,从极性图的中心看,噪声源A例如在270°的位置。另外,从极性图的中心看,噪声源B例如在180°的位置。
在此情况下,传声器10只接收主信号x(n)。另外,传声器20只接收噪声参照信号r1(n)。传声器30只接收噪声参照信号r2(n)。
根据以上,传声器10将主信号x(n)发送到频率分析部110以及目标声波形提取部400。另外,传声器20向频率分析部120发送噪声参照信号r1(n)。另外,传声器30向频率分析部130发送噪声参照信号r2(n)。
在噪声参照信号r1(n)和噪声参照信号r2(n)之间,会根据角度而发生窜扰。但是,如实施方式2中说明的那样,即使存在窜扰,多输入噪声抑制装置1000A也能毫无障碍地进行动作。
另外,噪声参照信号r1(n)、r2(n)的指向性模式被进行加权,多个噪声参照信号r1(n)、r2(n)的综合特性被收敛为具有与主信号的正面0°近旁以外的角度的指向性模式相近的形状的特性。所谓的主信号的正面0°近旁以外的角度根据噪声参照信号的数而变化,例如是90°~270°、10°~350°等。
如上所述,在本实施方式的多输入噪声抑制装置1000B中,可进行自动地使多个噪声参照信号的指向性模式最优化的动作。因此,在实际的音场中,即使在从多个方向同时发音的状态下,多输入噪声抑制装置1000B也能够始终学习权重系数,因此能够进行高精度的噪声抑制。
另外,与以往的必须利用不同方向的声音的水平比例来对只发出目标声或者噪声的状态进行学习控制的结构相比,多输入噪声抑制装置1000B能够改善噪声抑制性能和音质。
以上,根据本实施方式,能够实现即使在存在多个声源的情况下,也能够通过简单的处理来推定经过高精度噪声抑制的声音的多输入噪声抑制装置以及多输入噪声抑制方法。
(其他变形例)
以上,就本发明的多输入噪声抑制装置以及多输入噪声抑制方法,根据所述各实施方式进行了说明,但本发明并不限定于这些实施方式。在不超出本发明主旨的范围内,将该领域技术人员可想象到的变形例实施于本实施方式而获得的形态,也属于本发明的范围中。
例如,在所述各实施方式中使用的所有数值是为了具体说明本发明的一个例子的数值。即,本发明并不限于所述的实施方式中使用的各数值。
另外,本发明的多输入噪声抑制方法相当于图7的噪声抑制处理以及图15的噪声抑制处理A。
本发明的多输入噪声抑制方法并非定要包含图7或图15中的对应的所有步骤。本发明的多输入噪声抑制方法并非定要包含图7以及图15中的对应的所有步骤。即,本发明的多输入噪声抑制方法只要包含能够实现本发明的效果的最低限度的步骤即可。
另外,多输入噪声抑制方法中的各步骤的顺序是为了具体说明本发明的一个例子,也可以是其他顺序。另外,多输入噪声抑制方法的一部分步骤和其他步骤是可以互相独立且并行地执行的。
另外,噪声参照信号是由噪声源发出的噪声的信号,但并不限定于此。噪声参照信号可以是由目标声源发出的目标声被例如壁等反射而变化的声音的信号。
(1)所述多输入噪声抑制装置1000、1000A、1000B具体是由微处理器、ROM、RAM、硬盘单元、显示单元、键盘、鼠标等构成的计算机。所述RAM或者硬盘单元中存储有计算机程序。通过由所述微处理器按照所述计算机程序进行动作,从而各多输入噪声抑制装置1000、1000A、1000B可分别达成所述实施方式中说明的功能。在此,计算机程序是为了达成规定的功能,由多个表示针对计算机的指令的命令码构成的程序。
(2)分别构成所述多输入噪声抑制装置1000、1000A、1000B的结构要素的一部分或全部,可由一个系统LSI(Large Scale Integration∶大规模集成电路)构成。系统LSI是将多个结构要素叠层于一个芯片上制造而成的超多功能LSI,具体为包括微处理器、ROM、RAM等而构成的计算机系统。所述RAM中存储有计算机程序。通过由所述微处理器按照所述计算机程序进行动作,系统LSI达成其功能。
另外,多输入噪声抑制装置1000、1000A可以由集成电路构成。
(3)分别构成所述多输入噪声抑制装置1000、1000A、1000B的结构要素的一部分或全部,可由能在各装置进行装卸的IC卡或者单体模块构成。所述IC卡或者所述模块是由微处理器、ROM、RAM等构成的计算机系统。所述IC卡或所述模块可以包含所述超多功能LSI。通过由微处理器按照计算机程序进行动作,所述IC卡或所述模块达成其功能。该IC卡或该模块可以具有防篡改性。
(4)本发明可以是所述多输入噪声抑制方法。另外,本发明可以是使计算机执行所述多输入噪声抑制方法所包含的各步骤的计算机程序。另外,本发明可以是由所述计算机程序组成的数字信号。
另外,本发明可以是将所述计算机程序或者所述数字信号存储在计算机可读取的存储介质的结构。计算机可读取的存储介质例如是软盘、硬盘、CD-ROM、MO、DVD、DVD-ROM、DVD-RAM、BD(Blu-rayDisc:蓝光盘)、半导体存储器等。另外,本发明还可以是被存储在这些存储介质中的所述数字信号。
另外,本发明也可以采用通过电气通信回线、无线或有线通信回线、以互联网为代表的网络、数据广播等传送所述计算机程序或者所述数字信息的形式。
另外,本发明也可以是具备微处理器和存储器的计算机系统,所述存储器存储所述计算机程序,所述微处理器根据所述计算机程序进行动作。
另外,通过将所述程序或者所述数字信号存储在所述存储介质中转移的方法,或者通过将所述程序或者所述数字信号经由所述网络转移的方法,可由独立的其他计算机系统执行所述程序或者所述数字信号。
(5)可对所述实施方式以及所述变形例分别进行组合。
以上公开的实施方式其所有的内容仅为例示,不应理解为是对本发明的限制。本发明的范围以权利要求为准,并不取决于以上的说明,在与权利要求均等的意义以及范围内进行的所有变更,也属于本发明的范畴。
(工业上的可利用性)
本发明的多输入噪声抑制装置以及多输入噪声抑制方法可用于噪声抑制装置以及指向性传声装置等。另外,也可应用于会议系统的反射波抑制器,以及医疗器械等利用来自多个传感器的信号来提取目标信号(目标声)的装置等。
符号说明
10、20、30            传声器
100                   功率谱算出部
110、120、130         频率分析部
111、121、131         FFT运算部
112、122、132         功率运算部
200                   功率谱推定部
212、213、311、312、313、412、413、414、415    乘法运算部
221、321、421          加法运算部
222、322、422          减法运算部
230、330               数值范围限制部
250、251               滤波器运算部
300、470               系数更新部
301、302、303、304     LPF部
305                    时间平均部
350                    存储部
400                    目标声波形提取部
450                    传达特性运算部
460                    傅里叶逆变换部
480                    滤波部
500                    判断部
1000、1000A、1000B    多输入噪声抑制装置

Claims (13)

1.一种多输入噪声抑制装置,使用包含目标声成分以及噪声成分的主信号、和包含噪声成分的至少一个噪声参照信号进行处理,该多输入噪声抑制装置具备:
功率谱算出部,在每经过与声音的处理单位对应的单位时刻时,进行算出主功率谱和参照功率谱的算出处理,该主功率谱是所述主信号的功率谱,该参照功率谱是所述噪声参照信号的功率谱;
功率谱推定部,在每次进行所述算出处理时,根据所述主功率谱和第一运算值,进行推定被视为目标声的功率谱的推定目标声功率谱的推定处理,该第一运算值是通过至少进行将所述参照功率谱乘以第一权重系数的乘法运算而获得的;以及
系数更新部,在每次进行所述推定处理时,更新所述第一权重系数以及第二权重系数,以使第二运算值接近所述主功率谱,该第二运算值是对将所述参照功率谱以及所述推定目标声功率谱分别乘以所述第一权重系数以及所述第二权重系数所获得的至少两个值进行加法运算而获得的,
所述功率谱推定部,通过在所述推定处理中至少进行如下乘法运算来推定所述推定目标声功率谱,并输出该推定完的推定目标声功率谱,该乘法运算是指将在经过第k+1个单位时刻时算出的所述参照功率谱乘以在经过第k个单位时刻时由所述系数更新部更新的第一权重系数的运算,其中,k为1以上的整数。
2.如权利要求1所述的多输入噪声抑制装置
所述功率谱推定部通过至少进行从所述主功率谱减去所述第一运算值的运算,推定与从所述主功率谱单纯地减去了所述第一运算值的结果不同的所述推定目标声功率谱。
3.如权利要求1或者2所述的多输入噪声抑制装置,
所述系数更新部通过最小均方法来更新所述第一权重系数以及所述第二权重系数,以使所述主功率谱和所述第二运算值的差分接近零。
4.如权利要求1所述的多输入噪声抑制装置,
所述系数更新部更新所述第一权重系数以及所述第二权重系数,以使所述第一权重系数以及所述第二权重系数分别成为非负值。
5.如权利要求1所述的多输入噪声抑制装置,
所述功率谱推定部包括具有滤波器特性的滤波器运算部,该滤波器特性取决于所述主功率谱和所述第一运算值的差分,
所述滤波器运算部通过利用所述滤波器特性来对所述主功率谱进行滤波,从而推定所述推定目标声功率谱。
6.如权利要求1所述的多输入噪声抑制装置,
所述多输入噪声抑制装置使用多个所述噪声参照信号进行处理,
与多个所述噪声参照信号分别对应的多个参照功率谱中的某一个是固定值。
7.如权利要求1所述的多输入噪声抑制装置,
所述功率谱算出部,在每经过所述单位时刻时,以帧为单位算出所述主功率谱以及所述参照功率谱,
所述功率谱推定部,在每经过所述单位时刻时,以帧为单位推定所述推定目标声功率谱,
所述系数更新部包括时间平均部,该时间平均部算出时间平均,该时间平均是指所述主功率谱、所述参照功率谱以及所述推定目标声功率谱分别在多个所述帧内的平均,
所述系数更新部更新所述第一权重系数以及所述第二权重系数,以使由所述时间平均部算出的所述主功率谱的时间平均接近取决于如下加法运算的值,该加法运算是指在所述参照功率谱的时间平均上加上所述推定目标声功率谱的时间平均的运算。
8.如权利要求1所述的多输入噪声抑制装置,
还具备目标声波形提取部,该目标声波形提取部通过使用由所述系数更新部更新的所述第一权重系数以及第二权重系数来推定所述目标声功率谱,并至少进行为了以时域表示推定出的该目标声功率谱的变换,从而提取目标声的信号波形。
9.如权利要求1所述的多输入噪声抑制装置,还具备:
主传声器,在所述目标声的输出源的方向上具有灵敏度,接收所述主信号;以及
参照传声器,在所述目标声的输出源的方向上的灵敏度为最小或极小,接收所述噪声参照信号。
10.如权利要求1所述的多输入噪声抑制装置,
所述系数更新部,在每次更新所述第一权重系数时,输出更新后的该第一权重系数,
所述噪声抑制装置还具备存储部,在所述系数更新部每次输出所述第一权重系数时,该存储部存储由所述系数更新部输出的最新的所述第一权重系数。
11.如权利要求1所述的多输入噪声抑制装置,
该多输入噪声抑制装置还具备判断部,判断由所述系数更新部对所述第一权重系数以及所述第二权重系数进行更新的更新次数是否在预先设定的规定次数以上,
所述功率谱推定部,在所述判断部判断为所述更新次数小于所述规定次数的期间内,进行所述推定处理,
所述系数更新部,在所述判断部判断为所述更新次数小于所述规定次数的期间内,使用上一次更新的所述第一权重系数以及所述第二权重系数,更新所述第一权重系数以及所述第二权重系数。
12.一种多输入噪声抑制方法,使用包含目标声成分以及噪声成分的主信号、和包含噪声成分的至少一个噪声参照信号进行处理,该多输入噪声抑制方法包括:
进行算出处理的步骤,在每经过与声音的处理单位对应的单位时刻时,算出主功率谱和参照功率谱的算出处理,该主功率谱是所述主信号的功率谱,该参照功率谱是所述噪声参照信号的功率谱;
进行推定处理的步骤,在每次进行所述算出处理时,根据所述主功率谱和第一运算值,推定被视为目标声的功率谱的推定目标声功率谱,该第一运算值是通过至少进行将所述参照功率谱乘以第一权重系数的乘法运算而获得的;以及
更新步骤,在每次进行所述推定处理时,更新所述第一权重系数以及第二权重系数,以使第二运算值接近所述主功率谱,该第二运算值是对将所述参照功率谱以及所述推定目标声功率谱分别乘以所述第一权重系数以及所述第二权重系数所获得的至少两个值进行加法运算所获得的,
在所述进行推定处理的步骤中,通过在所述推定处理中至少进行如下乘法运算来推定所述推定目标声功率谱,并输出该推定完的推定目标声功率谱,该乘法运算是指将在经过第k+1个单位时刻时算出的所述参照功率谱乘以在经过第k个单位时刻时更新的第一权重系数的运算,其中,k为1以上的整数。
13.一种集成电路,使用包含目标声成分以及噪声成分的主信号、和包含噪声成分的至少一个噪声参照信号进行处理,该集成电路具备:
功率谱算出部,在每经过与声音的处理单位对应的单位时刻时,进行算出主功率谱和参照功率谱的算出处理,该主功率谱是所述主信号的功率谱,该参照功率谱是所述噪声参照信号的功率谱;
功率谱推定部,在每次进行所述算出处理时,根据所述主功率谱和第一运算值,进行推定被视为目标声的功率谱的推定目标声功率谱的推定处理,该第一运算值是通过至少进行将所述参照功率谱乘以第一权重系数的乘法运算而获得的;以及
系数更新部,在每次进行所述推定处理时,更新所述第一权重系数以及第二权重系数,以使第二运算值接近所述主功率谱,该第二运算值是对将所述参照功率谱以及所述推定目标声功率谱分别乘以所述第一权重系数以及所述第二权重系数所获得的至少两个值进行加法运算所获得的,所述功率谱推定部,通过在所述推定处理中至少进行如下乘法运算来推定所述推定目标声功率谱,并输出该推定完的推定目标声功率谱,该乘法运算是指将在经过第k+1个单位时刻时算出的所述参照功率谱乘以在经过第k个单位时刻时由所述系数更新部更新的第一权重系数的运算,其中,k为1以上的整数。
CN201180004046.5A 2010-07-26 2011-07-26 多输入噪声抑制装置、多输入噪声抑制方法以及集成电路 Active CN102576543B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2010-167289 2010-07-26
JP2010167289 2010-07-26
PCT/JP2011/004219 WO2012014451A1 (ja) 2010-07-26 2011-07-26 多入力雑音抑圧装置、多入力雑音抑圧方法、プログラムおよび集積回路

Publications (2)

Publication Number Publication Date
CN102576543A CN102576543A (zh) 2012-07-11
CN102576543B true CN102576543B (zh) 2014-09-10

Family

ID=45529682

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201180004046.5A Active CN102576543B (zh) 2010-07-26 2011-07-26 多输入噪声抑制装置、多输入噪声抑制方法以及集成电路

Country Status (5)

Country Link
US (1) US8824700B2 (zh)
EP (1) EP2600344B1 (zh)
JP (1) JP5919516B2 (zh)
CN (1) CN102576543B (zh)
WO (1) WO2012014451A1 (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5530812B2 (ja) * 2010-06-04 2014-06-25 ニュアンス コミュニケーションズ,インコーポレイテッド 音声特徴量を出力するための音声信号処理システム、音声信号処理方法、及び音声信号処理プログラム
CN102750956B (zh) * 2012-06-18 2014-07-16 歌尔声学股份有限公司 一种单通道语音去混响的方法和装置
JP2014017645A (ja) * 2012-07-09 2014-01-30 Sony Corp 音声信号処理装置、音声信号処理方法、プログラム及び記録媒体
US9078057B2 (en) * 2012-11-01 2015-07-07 Csr Technology Inc. Adaptive microphone beamforming
JP6226301B2 (ja) 2012-12-21 2017-11-08 パナソニックIpマネジメント株式会社 指向性マイクロホン装置、音響信号処理方法およびプログラム
JP6087762B2 (ja) * 2013-08-13 2017-03-01 日本電信電話株式会社 残響抑圧装置とその方法と、プログラムとその記録媒体
US9749746B2 (en) * 2015-04-29 2017-08-29 Fortemedia, Inc. Devices and methods for reducing the processing time of the convergence of a spatial filter
CN106297817B (zh) * 2015-06-09 2019-07-09 中国科学院声学研究所 一种基于双耳信息的语音增强方法
JP6556657B2 (ja) * 2016-04-07 2019-08-07 日本電信電話株式会社 音源分離装置、音源分離方法、プログラム、記録媒体
US10326625B1 (en) 2018-01-26 2019-06-18 Nvidia Corporation System and method for reference noise compensation for single-ended serial links
US10187094B1 (en) 2018-01-26 2019-01-22 Nvidia Corporation System and method for reference noise compensation for single-ended serial links
CN110808025B (zh) * 2019-11-11 2023-12-08 重庆中易智芯科技有限责任公司 基于fpga的主动噪声控制系统模块化设计方法
CN111540372B (zh) * 2020-04-28 2023-09-12 北京声智科技有限公司 一种多麦克阵列降噪处理的方法及装置
CN111711887B (zh) * 2020-06-23 2021-03-23 上海驻净电子科技有限公司 一种多点降噪系统及方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101091209A (zh) * 2005-09-02 2007-12-19 日本电气株式会社 抑制噪声的方法、装置和计算机程序
CN101238511A (zh) * 2005-08-11 2008-08-06 旭化成株式会社 声源分离装置、音频识别装置、移动电话机、声源分离方法、以及程序
CN101300623A (zh) * 2005-09-02 2008-11-05 日本电气株式会社 用于抑制噪声的方法、设备和计算机程序
CN101627428A (zh) * 2007-03-06 2010-01-13 日本电气株式会社 抑制杂音的方法、装置以及程序

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04216599A (ja) * 1990-12-17 1992-08-06 Oki Electric Ind Co Ltd 適応型雑音除去装置
JP3216704B2 (ja) * 1997-08-01 2001-10-09 日本電気株式会社 適応アレイ装置
EP1131892B1 (en) * 1998-11-13 2006-08-02 Bitwave Private Limited Signal processing apparatus and method
FI116643B (fi) * 1999-11-15 2006-01-13 Nokia Corp Kohinan vaimennus
WO2002058221A1 (en) 2001-01-18 2002-07-25 Koninklijke Philips Electronics N.V. A dc/dc up/down converter
CA2354808A1 (en) 2001-08-07 2003-02-07 King Tam Sub-band adaptive signal processing in an oversampled filterbank
US7181026B2 (en) 2001-08-13 2007-02-20 Ming Zhang Post-processing scheme for adaptive directional microphone system with noise/interference suppression
JP4286637B2 (ja) 2002-11-18 2009-07-01 パナソニック株式会社 マイクロホン装置および再生装置
US7577262B2 (en) 2002-11-18 2009-08-18 Panasonic Corporation Microphone device and audio player
GB2398913B (en) * 2003-02-27 2005-08-17 Motorola Inc Noise estimation in speech recognition
JP4608650B2 (ja) 2003-05-30 2011-01-12 独立行政法人産業技術総合研究所 既知音響信号除去方法及び装置
JP4283212B2 (ja) * 2004-12-10 2009-06-24 インターナショナル・ビジネス・マシーンズ・コーポレーション 雑音除去装置、雑音除去プログラム、及び雑音除去方法
JP5435204B2 (ja) * 2006-07-03 2014-03-05 日本電気株式会社 雑音抑圧の方法、装置、及びプログラム
JP4818955B2 (ja) 2007-02-27 2011-11-16 三菱電機株式会社 雑音除去装置
JP4493690B2 (ja) 2007-11-30 2010-06-30 株式会社神戸製鋼所 目的音抽出装置,目的音抽出プログラム,目的音抽出方法
JP2010066478A (ja) 2008-09-10 2010-03-25 Toyota Motor Corp 雑音抑制装置及び雑音抑制方法
JP4906908B2 (ja) * 2009-11-30 2012-03-28 インターナショナル・ビジネス・マシーンズ・コーポレーション 目的音声抽出方法、目的音声抽出装置、及び目的音声抽出プログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101238511A (zh) * 2005-08-11 2008-08-06 旭化成株式会社 声源分离装置、音频识别装置、移动电话机、声源分离方法、以及程序
CN101091209A (zh) * 2005-09-02 2007-12-19 日本电气株式会社 抑制噪声的方法、装置和计算机程序
CN101300623A (zh) * 2005-09-02 2008-11-05 日本电气株式会社 用于抑制噪声的方法、设备和计算机程序
CN101627428A (zh) * 2007-03-06 2010-01-13 日本电气株式会社 抑制杂音的方法、装置以及程序

Also Published As

Publication number Publication date
CN102576543A (zh) 2012-07-11
JP5919516B2 (ja) 2016-05-18
US8824700B2 (en) 2014-09-02
EP2600344A1 (en) 2013-06-05
US20120177223A1 (en) 2012-07-12
EP2600344A4 (en) 2014-03-12
EP2600344B1 (en) 2015-02-18
JPWO2012014451A1 (ja) 2013-09-12
WO2012014451A1 (ja) 2012-02-02

Similar Documents

Publication Publication Date Title
CN102576543B (zh) 多输入噪声抑制装置、多输入噪声抑制方法以及集成电路
CN109473118B (zh) 双通道语音增强方法及装置
EP3703052A1 (en) Echo cancellation method and apparatus based on time delay estimation
JP4496186B2 (ja) 音源分離装置、音源分離プログラム及び音源分離方法
CN101867355B (zh) 使用无限脉冲响应滤波器的有源噪声控制系统
CN103444094B (zh) 自适应均衡器、声学回波消除器装置以及有源噪声控制装置
CN101510426B (zh) 一种噪声消除方法及系统
JP5817366B2 (ja) 音声信号処理装置、方法及びプログラム
EP3276621B1 (en) Noise suppression device and noise suppressing method
WO2015065682A1 (en) Selective audio source enhancement
CN104036784A (zh) 一种回声消除方法及装置
CN104637491A (zh) 用于内部mmse计算的基于外部估计的snr的修改器
JP2011242343A (ja) 車両方向特定装置、車両方向特定方法、及びそのプログラム
CN104981865A (zh) 有源振动噪声控制装置
JP2006313997A (ja) 騒音量推定装置
Xiao et al. A new efficient filtered-x affine projection sign algorithm for active control of impulsive noise
JP6265136B2 (ja) 雑音除去システム、音声検出システム、音声認識システム、雑音除去方法および雑音除去プログラム
WO2012176932A1 (ja) 音声処理装置、音声処理方法および音声処理プログラム
KR20200095370A (ko) 음성 신호에서의 마찰음의 검출
US9584905B2 (en) Audio signal mixing
US20190385590A1 (en) Generating device, generating method, and non-transitory computer readable storage medium
Wang et al. An adaptive algorithm for nonstationary active sound-profiling
CN102598127B (zh) 信号处理方法、信息处理装置
KR101463955B1 (ko) 방향 정보를 이용한 암묵 신호 추출 방법 및 이를 위한 디믹싱 시스템
CN102598128A (zh) 信号处理方法、信息处理装置及用于存储信号处理程序的存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant