CN108353225A - 免提控制装置 - Google Patents

免提控制装置 Download PDF

Info

Publication number
CN108353225A
CN108353225A CN201580084118.XA CN201580084118A CN108353225A CN 108353225 A CN108353225 A CN 108353225A CN 201580084118 A CN201580084118 A CN 201580084118A CN 108353225 A CN108353225 A CN 108353225A
Authority
CN
China
Prior art keywords
microphone
noise
signal
level
input signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201580084118.XA
Other languages
English (en)
Other versions
CN108353225B (zh
Inventor
小寺宏典
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Publication of CN108353225A publication Critical patent/CN108353225A/zh
Application granted granted Critical
Publication of CN108353225B publication Critical patent/CN108353225B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/60Substation equipment, e.g. for use by subscribers including speech amplifiers
    • H04M1/6033Substation equipment, e.g. for use by subscribers including speech amplifiers for providing handsfree use or a loudspeaker mode in telephone sets
    • H04M1/6041Portable telephones adapted for handsfree use
    • H04M1/6075Portable telephones adapted for handsfree use adapted for handsfree use in a vehicle
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/60Substation equipment, e.g. for use by subscribers including speech amplifiers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/60Substation equipment, e.g. for use by subscribers including speech amplifiers
    • H04M1/6033Substation equipment, e.g. for use by subscribers including speech amplifiers for providing handsfree use or a loudspeaker mode in telephone sets
    • H04M1/6041Portable telephones adapted for handsfree use
    • H04M1/605Portable telephones adapted for handsfree use involving control of the receiver volume to provide a dual operational mode at close or far distance from the user
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • H04R1/406Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2499/00Aspects covered by H04R or H04S not otherwise provided for in their subgroups
    • H04R2499/10General applications
    • H04R2499/13Acoustic transducers and sound field adaptation in vehicles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • H04S7/303Tracking of listener position or orientation

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Telephone Function (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)

Abstract

本发明的免提控制装置按每个频率进行调整,从而使多个麦克风的输入信号中所包含的噪声的特性相互一致,并从调整噪声特性后的多个麦克风的输入信号中,将被判别为说话者输入了说话语音的麦克风的输入信号切换成发送至通话对象的信号。

Description

免提控制装置
技术领域
本发明涉及一种免提控制装置,该免提控制装置进行控制,从而在免提通话中判别多个麦克风中说话者输入了说话语音的麦克风,并将判别出的麦克风的输入信号发送至通话对象。
背景技术
近些年,驾驶员无需手持移动电话就能够进行通话的免提通话系统得到了普及。在免提通话系统中,通过利用多个麦克风,多个说话者能与远端侧的说话者进行通话。在此情况下,为了清楚地将所收集到的说话语音发送至通话对象,必须恰当地判别说话者输入了说话语音的麦克风。
例如在专利文献1中记载了如下技术,即:从多个麦克风中判别说话者输入了说话语音的麦克风。在专利文献1所记载的系统中,将多个麦克风中说话者输入说话语音持续了预定时间以上且输入电平超过阈值的麦克风判别为与说话者的位置相对应的麦克风。通过在免提通话系统中利用该判别方法,能够从多个麦克风中恰当地判别说话者输入了说话语音的麦克风。
另外,在专利文献1所记载的系统中,预先测定各个麦克风附近的背景噪声电平,在进行了将各个麦克风的背景噪声电平与环境整体的背景噪声电平进行校准的校正之后,判别与说话者的位置相对应的麦克风。由此,能够进行排除了各个麦克风的背景噪声电平的影响的判别。
现有技术文献
专利文献
专利文献1
日本专利特开2007-174155号公报
发明内容
发明所要解决的技术问题
在搭载于车辆的免提通话系统中,在车辆行驶过程中所产生的路面噪声会分别输入至多个麦克风中,将包含路面噪声在内的语音传达给通话对象。此时,输入至麦克风的噪声的增益、频率特性之类的噪声特性因多个麦克风的不同而不同,因此,存在以下问题:若改变说话者而切换麦克风的输入信号,则会导致通话对象听到的噪声的质感大幅变化而产生不适感。
例如,麦克风与语音识别、ANC(Active Noise Control:主动噪音控制)等免提通话以外的功能并用的情况下,基于所使用的功能以及设置位置,有时麦克风的音响特性是不同的。在此情况下,基于音响特性的差异,噪声特性也会不同。因此,若切换发送至通话对象的电话的麦克风的输入信号,则会导致通话对象所听到的噪声的质感大幅变化。
另外,即使在免提通话中使用多个麦克风的情况下,若对输入信号所实施的语音处理不同,则与此相对应地,语音处理后的输入信号中所包含的噪声的特性也是不同的。而且,即使对多个麦克风使用音响特性相同的麦克风,在各个麦克风的增益、频率特性、温度特性等存在个体差异的情况下,与此相对应地,麦克风的输入信号中所包含的噪声的特性也是不同的。
因此,即使在这些情况下,若切换发送至通话对象的电话的麦克风的输入信号,则也会导致通话对象所听到的噪声的质感大幅变化。
另外,专利文献1所记载的系统如上所述,对输入信号实施将各个麦克风的背景噪声电平与环境整体的背景噪声电平进行校准的校正。因此,若将校正后的信号发送至通话对象的电话,则即使切换通话对象所听到的麦克风的输入信号,也可期待通话对象所听到的噪声的质感变化能降低。
然而,专利文献1中各个麦克风的背景噪声电平是通过预先测定各个麦克风附近存在何种程度的背景噪声而得到的,设想了噪声变动较少的环境。
另一方面,在车辆中,例如随着车辆的行驶而会产生路面噪声。路面噪声是指因轮胎表面与路面摩擦而产生的噪声,因路面的状态不同其形态会大幅变化。例如,虽然路面噪声主要产生于低频带,但是因干燥的路面、湿润的路面的不同每个频率的噪声电平会动态地大幅变化。
因此,在搭载于车辆的免提通话系统中,即使实施专利文献1所记载的背景噪声的校正处理,也无法使各个麦克风的输入信号中所包含的噪声的特性相互一致。
因此,若切换发送至通话对象的电话的麦克风的输入信号,则依然会导致通话对象所听到的噪声的质感大幅变化。
本发明正是为了解决上述问题而完成的,其目的在于得到一种免提控制装置,该免提控制装置在切换发送至通话对象的电话的麦克风的输入信号时能够减轻通话对象所听到的噪声的质感的变化。
解决技术问题所采用的技术方案
本发明所涉及的免提控制装置包括判别部、噪声特性调整部及切换部。判别部从多个麦克风中判别说话者输入了说话语音的麦克风。噪声特性调整部按每个频率来进行调整,从而使得多个麦克风的输入信号中所包含的噪声的特性相互一致。切换部将由噪声特性调整部进行噪声特性调整后的多个麦克风的输入信号中由判别部判别出的麦克风的输入信号切换成发送至通话对象的信号。
发明效果
根据本发明,由于按每个频率进行调整,从而使得多个麦克风的输入信号中所包含的噪声的特性相互一致,因此,在切换发送至通话对象的电话的麦克风的输入信号时能够减轻通话对象所听到的噪声的质感的变化。
附图说明
图1是表示具有本发明的实施方式1所涉及的免提控制装置的免提通话系统的结构的框图。
图2是表示存在多个说话者的免提通话的概要的图。
图3A是表示实现实施方式1所涉及的免提控制装置的功能的硬件结构的图,图3B是表示对实现实施方式1所涉及的免提控制装置的功能的软件进行执行的硬件结构的图。
图4是示出实施方式1所涉及的免提控制装置的动作的流程图。
图5是表示实施方式1中的噪声特性的调整处理的概要的图。
图6是表示对成为噪声特性的调整对象的频带进行变更的情况的图。
图7是表示对成为噪声特性的调整对象的带宽进行变更的情况的图。
具体实施方式
下面,为了更详细地说明本发明,根据附图,对用于实施本发明的方式进行说明。
实施方式1
图1是表示具有本发明的实施方式1所涉及的免提控制装置2的免提通话系统1的结构的框图。
另外,图2是表示存在多个说话者的免提通话的概要的图。图2中,在图1所示的免提通话系统1中,作为说话者,存在有坐于驾驶座SA的乘客A和坐于副驾驶座SB的乘客B,利用麦克风5A、5B收集乘客A的说话语音,用麦克风5C收集乘客B的说话语音。
另外,图2中作为一个示例,示出了驾驶座SA一侧配置有2个麦克风,副驾驶座SB一侧配置有1个麦克风的情况,但麦克风的个数及特性的组合是任意的。
如图1所示,免提通话系统1搭载于车辆20,是在车辆20一侧与车辆20外的通信对象之间进行免提通话的系统。作为其结构,具备:免提控制装置2、通信装置3、车辆20一侧的移动电话4A、麦克风5A~5C、放大器6及扬声器7A、7B。
通信装置3是与被带入车辆20的移动电话4A之间进行无线通信的装置。作为无线通信方式,例如使用与蓝牙(注册商标)相对应的近距离无线通信。
另外,通信装置3使用免提通信协议与移动电话4A连接并进行通信。
移动电话4A经由移动电话线路与远端侧的移动电话4B之间进行通信连接。例如移动电话4A经由移动电话线路将从通信装置3接收到的说话者的语音信号发送至移动电话4B。另外,若移动电话4A经由移动电话线路从移动电话4B接收通话对象的语音信号,则使用上述免提通信协议向通信装置3发送该语音信号。
麦克风5A~5C是设置于车辆20的车厢内的麦克风,例如被利用于免提通话中对说话者的说话语音进行收集。下面,以麦克风5A~5C具有下述功能的情况进行说明。
麦克风5A、5B设置于车厢内的驾驶座SA一侧,构成利用麦克风5A、5B这两者的立体声方式的麦克风。麦克风5A、5B是收集坐于驾驶座SA的乘客A(例如操作方向盘H的驾驶员)的说话语音的、具有指向性的麦克风。图2中,用区域C来表示麦克风5A、5B的收集区域。
麦克风5C是设置于副驾驶座SB一侧而收集坐于副驾驶座SB的乘客B的说话语音的、无指向性的麦克风。图2中,用区域D来表示麦克风5C的收集区域。麦克风5A~5C可以都是无指向性的麦克风。
放大器6是对利用移动电话4A接收且经由通信装置3输入的通话对象的说话语音的信号进行放大的放大器。
扬声器7A、7B设定于车辆20的车厢内,对由放大器6放大后的通话对象的说话语音的信号进行语音输出。
免提控制装置2判别麦克风5A~5C中车辆20一侧的说话者输入了说话语音的麦克风,并将所判别出的麦克风的输入信号输出至通信装置3。作为其结构,具有语音处理部10A~10C、判别部11、噪声特性调整部12及切换部13。
语音处理部10A~10C是对来自麦克风5A~5C的输入信号进行语音处理的处理部。语音处理部10A对由驾驶座SA一侧的麦克风5A、5B收集到的语音信号进行语音处理,语音处理部10B对由副驾驶座SB一侧的麦克风5C收集到的语音信号进行语音处理。语音处理部10A、10B例如对输入语音信号实施波束成形处理、回声消除处理、电平校正处理。
波束成形处理是对于由麦克风5A、5B所收集到的语音信号仅加强从说话者(驾驶员)的位置到达的语音的处理。例如使由麦克风5A、5B所收集的语音信号延迟并合成,基于预先对每个位置准备的延迟时间来检测出合成信号的电平。然后,将与电平变得最大的延迟时间相对应的位置确定为乘客A的位置。如上所述,通过确定乘客A的位置并加强来自该方向的语音信号,从而能够力图提高说话语音的SN(Signal to Noise:信号噪声)比。图1中,波束成形处理仅由对来自麦克风5A、5B的输入语音进行处理的语音处理部10A来实施。
回声消除处理是对由麦克风5A~5C所收集的通话对象的说话语音的回声进行消除的处理。例如使用自适应滤波器,学习扬声器7A、7B与麦克风5A~5C的脉冲响应,对从扬声器7A、7B输出的语音信号叠加学习到的脉冲响应从而生成模拟回声。然后,将模拟回声看作施加于麦克风5A~5C的来自扬声器7A、7B的语音,从麦克风5A~5C的输入语音减去该模拟回声,从而消除回声。
电平校正处理是对因麦克风5A~5C的各个特性所引起的信号电平的差异进行校正的处理。作为麦克风5A~5C的特性,是因针对输入信号的增益、频率特性、指向性、每个麦克风的个体差异所引起的误差。
电平校正处理例如是对麦克风5A~5C的背景噪声电平假定为0时的语音电平进行比较而使其相对一致的校正。
通过实施上述处理,来自语音处理部10A、10B的语音信号a1、b1成为从乘客A或乘客B的说话语音信号中消除了麦克风特性所引起的电平差异后的信号。
语音处理部10C中,对从语音处理部10A、10B输入的信号实施例如噪声消除处理、频率特性的校正处理、自动增益控制处理(下面记为AGC处理)、限幅处理。
噪声消除处理是使麦克风5A~5C的输入信号中所包含的噪声电平降低预先规定的电平的处理。例如,通过生成使麦克风5A~5C的输入信号中所包含的噪声相位反转后的信号并与输入信号进行合成,由此降低噪声。或者,也可以对麦克风5A~5C的输入信号赋予传递函数的特性,从而降低噪声。
利用该处理,虽然降低了麦克风5A~5C的输入信号中的噪声电平,但若过于提高消除程度,则也会导致说话语音的音质劣化。因此,即使在实施噪声消除处理后的输入信号中,也会成为残留有通话对象能够听到的噪声的状态。
频率特性的校正处理是基于重放空间即麦克风5A、5B附近的空间以及麦克风5C附近的空间、按每个频率校正麦克风5A~5C的输入信号的电平及相位的处理。如上所述,麦克风5A~5C在车厢内的设置位置不同,因此因声音的反射或吸收所引起的声音的传递特性在麦克风5A、5B附近的空间及麦克风5C附近的空间中是不同的。如上所述,若每个重放空间的传递特性不同,则传递到通话对象的说话语音的每个频率的电平及相位会变化,导致音质劣化。
因此,语音处理部10C对麦克风5A~5C的输入信号中与说话语音相当的频带的信号实施频率特性的校正处理,由此防止因重放空间所引起的音质的劣化。
AGC处理是对麦克风5A~5C的输入信号进行增益调整的处理。
例如语音处理部10C预先设定标准输入电平,在麦克风5A~5C的输入信号的电平小于标准输入电平的情况下,作为无语音区,自动地进行降低输入信号的增益的调整。另外,在麦克风5A~5C的输入信号的电平在标准输入电平以上的情况下,为了不使输入信号的音量过大,而自动地对增益进行调整以使输入信号的电平稍微降低。
限幅处理是将麦克风5A~5C的输入信号中信号电平高于阈值电平的输入信号限制在阈值电平以下的处理。
例如通过以阈值电平来限制信号电平超过阈值电平的输入信号的信号电平,从而使来自语音处理部10C的语音信号a2、b2的各个信号电平在阈值电平以下。由此,能够防止因突然产生的信号电平较高的输入信号而引起的音质降低。
另外,语音处理部10A~10C可以具有与免提控制装置2分开设置的语音处理装置的功能。在此情况下,免提控制装置2具有判别部11、噪声特性调整部12以及切换部13,判别部11及噪声特性调整部12从上述语音处理装置适当地输入语音信号并进行处理。
判别部11从麦克风5A~5C中判别说话者输入了说话语音的麦克风。例如判别部11输入来自语音处理部10A的语音信号a1和来自语音处理部10B的语音信号b1。然后,判别部11将与麦克风5A、5B对应地预先准备的阈值电平和语音信号a1的信号电平进行比较,将与麦克风5C对应地预先准备的阈值电平和语音信号b1的信号电平进行比较。判别部11通过上述比较,选择信号电平高于阈值电平且语音信号a1和语音信号b1中信号电平较高的一个,将得到所选择的输出信号的麦克风作为说话者输入说话语音的麦克风。
噪声特性调整部12按每个频率进行调整,从而使麦克风5A~5C的输入信号中所包含的噪声特性相互一致。
例如噪声特性调整部12对来自语音处理部10C的语音信号a2、b2进行快速傅立叶变换(FFT),得到语音信号a2、b2的频谱。
然后,噪声特性调整部12将语音信号a2、b2的频谱中与路面噪声相对应的低频带设定为调整对象的频带。
之后,噪声特性调整部12按调整对象的频带中每个预先设定的带宽使噪声的振幅电平相一致,从而使语音信号a2、b2中所包含的噪声特性相互一致。
在将发送至通话对象的信号从麦克风5A、5B的输入信号(语音信号a3)切换至麦克风5C的输入信号(语音信号b3)的情况下,进行使语音信号b3中所包含的噪声特性与语音信号a3中所包含的噪声特性校准的调整。
由此,在切换发送至通话对象的移动电话4B的麦克风的输入信号时,能够减轻通话对象所听到的噪声的质感的变化。
切换部13如图2中双箭头所示那样,将由噪声特性调整部12进行噪声特性调整后的麦克风5A~5C的输入信号中被判别部11判别出的麦克风的输入信号切换成发送至通话对象的信号。
例如切换部13具有开关,该开关切换至来自噪声特性调整部12的语音信号a3、b3中的任一个并输出至通信装置3。切换部13在由判别部11判别为麦克风5A、5B的情况下,将语音信号a3输出至通信装置3,在由判别部11判别为麦克风5C的情况下,将语音信号b3输出至通信装置3。
图3A是表示实现实施方式1所涉及的免提控制装置2的功能的硬件结构的图,图3B是表示对实现实施方式1所涉及的免提控制装置2的功能的软件进行执行的硬件结构的图。
免提控制装置2中的语音处理部10A~10C、判别部11、噪声特性调整部12及切换部13的各个功能由处理电路来实现。
即,免提控制装置2具备用于执行后述的图3所示的步骤ST1至步骤ST3的处理的处理电路。
处理电路可以是专用硬件,也可以是读取存储于存储器的程序并加以执行的CPU(Central Processing Unit:中央处理单元)。
如图3A所示,在处理电路是专用硬件的处理电路100的情况下,处理电路100可以是例如单一电路、复合电路、可编程处理器、并联可编程处理器、ASIC(ApplicationSpecific Integrated Circuit:专用集成电路)、FPGA(Field-Programmable Gate Array:现场可编程门阵列)、或它们的组合。
另外,可以分别利用处理电路来实现语音处理部10A~10C、判别部11、噪声特性调整部12及切换部13的各个部分的功能,也可以用1个处理电路来统一地实现各个部分的功能。
如图3B所示,在处理电路是CPU101的情况下,语音处理部10A~10C、判别部11、噪声特性调整部12及切换部13的功能通过软件、固件或软件和固件的组合来实现。
软件和固件被记为程序,存储于存储器102。CPU101读出存储于存储器102的程序并执行,从而实现各部分的功能。即,免提控制装置2由CPU101来执行时,具有用于存储最终执行图4所示的各步骤的处理的程序的存储器102。另外,这些程序是在计算机中执行语音处理部10A~10C、判别部11、噪声特性调整部12及切换部13的步骤或方法的程序。
这里,存储器可以是例如RAM(Random Access Memory:只读存储器)、ROM、闪存、EPROM(Erasable Programmable ROM:可擦可编程只读存储器)、EEPROM(ElectricallyEPROM:电可擦可编程只读存储器)等非易失性或易失性的半导体存储器、磁盘、软盘、光盘、压缩光盘、迷你盘、DVD(DigitalVersatile Disk:数字通用盘)等。
另外,对于语音处理部10A~10C、判别部11、噪声特性调整部12及切换部13的各功能,可以用专用硬件来实现一部分,用软件或固件来实现一部分。
例如语音处理部10A~10C用专用硬件的处理电路100来实现其功能,判别部11、噪声特性调整部12及切换部13通过CPU101执行存储于存储器102中的程序来实现其功能。
由此,上述处理电路可以利用硬件、软件、固件或它们的组合来实现上述功能。
接着对动作进行说明。
图4是表示实施方式1所涉及的免提控制装置2的动作的流程图,示出了从判别说话者输入了说话语音的麦克风到切换发送至通信对象的信号为止的一系列处理。另外,设为反复实施图4所示的步骤ST1至步骤ST3为止的处理。
首先,判别部11比较语音信号a1的信号电平和与麦克风5A、5B相对应的阈值电平,比较语音信号b1的信号电平和与麦克风5C相对应的阈值电平。然后,判别部11选择信号电平高于阈值电平且语音信号a1和语音信号b1中信号电平较高的一个,将得到所选择的输出信号的麦克风判别为说话者输入说话语音的麦克风(步骤ST1)。
在上述说明中,示出了判别部11比较麦克风5A~5C的输入信号的信号电平(绝对语音振幅)来判别麦克风的情况,但也可以根据利用背景噪声相对地比较麦克风5A~5C的输入信号的结果来进行判别。
例如判别部11也可以比较从麦克风5A~5C的输入信号的信号电平中减去背景噪声后得到的信号电平,来判别说话者输入了说话语音的麦克风。
作为麦克风5A~5C,即使使用相同特性的麦克风,实际上也存在因个体差异而引起的误差。因此,尽管图2所示的乘客A输入了大于乘客B的语音电平,但是也可能因上述误差而使输入信号的绝对语音振幅反转,导致将说话者输入了说话语音的麦克风判别为麦克风5C。
因而,判别部11比较从麦克风5A~5C的输入信号的信号电平中减去背景噪声后的信号电平。
由此通过用背景噪声来相对地比较麦克风5A~5C的输入信号,从而能够防止因麦克风5A~5C的个体差异而引起的误判定。
在比较从输入信号的信号电平减去背景噪声电平后得到的信号电平且差值偏离了预先规定的值以上的情况下,可将得到该信号电平较大的输入信号的麦克风判别为说话者输入了说话语音的麦克风。
例如对下面情况进行说明,即:从麦克风5A、5B的输入信号的信号电平减去背景噪声后得到的信号电平为60dB,从麦克风5C的输入信号的信号电平减去背景噪声后得到的信号电平为59dB。
此处,在上述预先规定的值为10dB的情况下,即使选择麦克风5C作为说话者输入了说话语音的麦克风,由于信号电平之差为1dB,因此,也不将麦克风5A、5B的输入信号切换成发送对象。
另一方面,若从麦克风5C的输入信号的信号电平减去背景噪声后得到的信号电平为50dB,则将麦克风5A、5B的输入信号切换成发送对象。
由此,无需根据误差电平的差异实施切换,能够提高判别部11的处理的可靠性。
另外,也可以不比较信号电平,而通过比较SN比来判别麦克风。
例如利用麦克风5A、5B的SN比与关于SN比的阈值、麦克风5C的SN比与关于SN比的阈值,进行与信号电平的情况相同的比较处理。
如上所述,语音信号a1、b1中,因麦克风特性而引起的电平的差异被消除。通过比较这样的语音信号a1、b1,能够适当地判别说话者输入了说话语音的麦克风。
判别部11可以变更上述的信号电平的阈值或者SN比的阈值。例如可以将用户输入的值设定为上述阈值。
另外,作为一个示例,观察信号电平、SN电平之差的时间平均,将对该时间平均加上特定的偏移量后得到的值作为阈值。若乘客A说话时的麦克风5A及麦克风5B的SN比和麦克风5C的SN比之差平均为7dB,则将该差减去偏移值3dB后得到的4dB作为阈值。由此可动态地变更阈值。
另外,判别部11可以在判别为说话者输入了说话语音的麦克风的输入信号的信号电平变为其它麦克风的输入信号的信号电平以下起经过了预先规定的保持时间之前,不将其它麦克风判别为说话者输入了说话语音的麦克风。例如在将麦克风5A、5B判别为说话者输入了说话语音的麦克风之后,即使语音信号a1的信号电平变为因麦克风5C的输入信号而引起的语音信号b1的信号电平以下,在经过上述保持时间之前,也不将输出至通信装置3的信号从语音信号a3切换成语音信号b3。
由此,能够防止频繁地切换输出至通信装置3的信号、即发送至通信对象的信号,能够在判断为确实是说话者变化时才进行切换。作为保持时间,例如可以考虑数百毫秒左右的时间。
而且,判别部11在语音信号a1、b1中的一个信号电平小于下限阈值的情况下,判断为该语音信号为无声,将得到另一个语音信号的麦克风判别为说话者输入了说话语音的麦克风。例如若判断为语音信号a1的信号电平为无声电平,则将得到语音信号b1的麦克风5C判别为说话者输入了说话语音的麦克风。由此,能够自动地将发送至通信对象的信号从语音信号a3切换成语音信号b3。即使如此,也能够适当地判别说话者输入了说话语音的麦克风。
接着,噪声特性调整部12按每个频率进行调整,从而使麦克风5A~5C的输入信号中所包含的噪声特性相互一致(步骤ST2)。
例如噪声特性调整部12对的语音信号a2、b2进行快速傅立叶变换(FFT),得到语音信号a2、b2的频谱。
然后,噪声特性调整部12如图5所示,将语音信号a2、b2的频谱中与路面噪声相对应的低频带设定为调整对象的频带BW。然后,噪声特性调整部12如图5中箭头所示那样,在调整对象的频带BW中,按每个预先规定的带宽RB进行使噪声振幅电平相一致的调整,从而使语音信号a2、b2中所包含的噪声特性相互一致。
由此,由于来自噪声特性调整部12的语音信号a3、b3中所包含的噪声特性相互一致,因此,无论将语音信号a3、b3中的哪一个切换成发送至通话对象的信号,都能够减轻切换前后通话对象所听到的噪声质感的变化。
另外,示出了仅将与噪声对应的频带设定为调整对象的频带BW的情况,但是也可以将说话语音的频带包含在内设定为调整对象。
例如在噪声与说话语音的差异不明确的情况下,使说话语音及噪声的特性相互一致。即使如此,也能够减轻在切换前后通话对象所听到的噪声的质感的变化。
另外,噪声特性调整部12可以变更调整对象的频带BW的设定。例如,如图6所示,在设定了调整对象的频带BW1之后,仅将语音信号a2、b2中的任意的语音信号所包含的噪声的电平超过阈值电平Th的频带BW2变更为调整对象的频带。通过将上述阈值电平Th设为通话对象能够听到的下限电平,由此能够仅将必须调整噪声特性的频带选择作为调整对象,从而能够适当地使噪声特性一致。
另外,随着车辆的行驶而产生的噪声中,除了路面噪声以外,还有图像噪声、空腔共振音等。图像噪声是因轮胎槽中的空间进行压缩和释放而产生的噪声,成为比路面噪声更高音域的噪声。另外,空腔共振音是因填充于轮胎内部的空气的振动而产生的噪声,它也是比路面噪声更高音域的干声。
因而,噪声特性调整部12在除了上述路面噪声以外的噪声的特性也一致的情况下,将与图像噪声及空腔共振音相对应的更高频带的分量设定为调整对象的频带BW。
由此,能够根据实际的噪声环境适当地使噪声的特性一致。
而且,噪声特性调整部12可以变更带宽RB的设定。
例如,在路面噪声的电平为阈值以上的行驶环境中,为了微调噪声的特性,而使带宽RB均变窄。另一方面,在路面噪声的电平小于阈值的行驶环境中,为了减轻调整处理的运算负担,使带宽RB均变宽。
由此,能够适当地使噪声的特性一致。
另外,不仅可以在一定宽度内变更带宽RB,也可以在不同宽度内变更带宽RB。
例如如图7所示,在调整对象的频带BW中的噪声电平的变动量大于预先规定的阈值的频带中,从带宽RB2变更为带宽RB1而使带宽变窄。由此,在噪声电平的变动较大的部分能够微调来使特性一致,能够恰当地消除语音信号a2、b2中的噪声特性的差异。
接着,切换部13将由噪声特性调整部12进行噪声特性调整后的麦克风5A~5C的输入信号中被判别部11判别出的麦克风的输入信号切换成发送至通话对象的信号(步骤ST3)。
例如在由判别部11判别为麦克风5A、5B的情况下,将语音信号a3输出至通信装置3,在由判别部11判别为麦克风5C的情况下,将语音信号b3输出至通信装置3。
通信装置3利用近距离无线通信将从切换部13输入的语音信号发送至移动电话4A。移动电话4A经由移动电话线路将语音信号发送至移动电话4B。由此,通话对象能够听到车辆20的说话者的说话语音。
如上所述,实施方式1所涉及的免提控制装置2具有图1所示的结构,并按每个频率进行调整,以使麦克风5A~5C的输入信号中所包含的噪声的特性相互一致。通过这样结构,在切换发送至通话对象的移动电话4B的麦克风5A~5C的输入信号时,能够减轻通话对象所听到的噪声的质感的变化。
在实施方式1所涉及的免提控制装置2中,判别部11比较从麦克风5A~5C的输入信号的信号电平中减去背景噪声后得到的信号电平,来判别说话者输入了说话语音的麦克风。通过这样结构,能够防止因麦克风5A~5C的个体差异而引起的误判定。
而且,在实施方式1所涉及的免提控制装置2中,噪声特性调整部12按调整对象的频带BW中每个预先规定的带宽RB来调整输入信号中所包含的噪声的特性。由此,无论将语音信号a3、b3中的哪一个切换成发送至通话对象的信号,都能够在切换前后减轻通话对象所听到的噪声的质感的变化。
而且,在实施方式1所涉及的免提控制装置2中,噪声特性调整部12的调整对象的频带BW可进行设定变更。由此,能够适当地使噪声的特性一致。
而且,在实施方式1所涉及的免提控制装置2中,带宽RB能够进行设定变更。由此,能够适当地使噪声的特性一致。
而且,在实施方式1所涉及的免提控制装置2中,噪声特性调整部12使调整对象的频带BW中噪声电平的变动量大于预先规定的阈值的频带中的带宽RB变窄。
由此,在噪声电平的变动较大的部分能够微调来使特性一致,能够适当地消除语音信号a2、b2中的噪声特性的差异。
而且,在实施方式1所涉及的免提控制装置2中,判别部11可以在判别为说话者输入了说话语音的麦克风的输入信号的信号电平变为其它麦克风的输入信号的信号电平以下起经过了预先规定的保持时间之前,不将其它麦克风判别为说话者输入了说话语音的麦克风。由此,能够防止输出至通信对象的信号被频繁切换,能够在判断为确实是说话者变化时才进行切换。
此外,本发明可以在其发明的范围内对实施方式的任意结构要素进行变形,或省略实施方式的任意的结构要素。
工业上的实用性
本发明所涉及的免提控制装置能够减轻因麦克风的输入信号的切换而造成的噪声的质感的变化,因此,适用于车载用的免提通话系统。
标号说明
1免提通话系统,2免提控制装置,3通信装置,4A、4B移动电话,5A~5C麦克风,6放大器,7A、7B扬声器,10A~10C语音处理部,11判别部,12噪声特性调整部,13切换部,20车辆,100处理电路,101CPU,102存储器。

Claims (7)

1.一种免提控制装置,其特征在于,包括:
判别部,该判别部从多个麦克风中判别说话者输入了说话语音的麦克风;
噪声特性调整部,该噪声特性调整部按每个频率进行调整,从而使得所述多个麦克风的输入信号中所包含的噪声的特性相互一致;以及
切换部,该切换部将由所述噪声特性调整部调整噪声特性后的所述多个麦克风的输入信号中由所述判别部判别出的麦克风的输入信号切换成发送至通话对象的信号。
2.如权利要求1所述的免提控制装置,其特征在于,
所述判别部对从麦克风的输入信号的信号电平减去背景噪声后的信号电平进行比较,判别说话者输入了说话语音的麦克风。
3.如权利要求1所述的免提控制装置,其特征在于,
所述噪声特性调整部在调整对象的频带中按每个预先规定的带宽来对输入信号中所包含的噪声的特性进行调整。
4.如权利要求3所述的免提控制装置,其特征在于,
所述噪声特性调整部的所述调整对象的频带能够进行设定变更。
5.如权利要求3所述的免提控制装置,其特征在于,
所述带宽能够进行设定变更。
6.如权利要求5所述的免提控制装置,其特征在于,
所述噪声特性调整部使所述调整对象的频带中噪声电平的变动量大于预先规定的阈值的频带中的所述带宽变窄。
7.如权利要求1所述的免提控制装置,其特征在于,
即使所判别的麦克风的输入信号的信号电平变为其它麦克风的输入信号的信号电平以下,在经过了保持时间之前的期间,所述判别部也不将所述其它麦克风判别为说话者输入了说话语音的麦克风。
CN201580084118.XA 2015-10-30 2015-10-30 免提控制装置 Active CN108353225B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2015/080754 WO2017072958A1 (ja) 2015-10-30 2015-10-30 ハンズフリー制御装置

Publications (2)

Publication Number Publication Date
CN108353225A true CN108353225A (zh) 2018-07-31
CN108353225B CN108353225B (zh) 2020-09-22

Family

ID=58629992

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580084118.XA Active CN108353225B (zh) 2015-10-30 2015-10-30 免提控制装置

Country Status (5)

Country Link
US (1) US10320964B2 (zh)
JP (1) JP6272586B2 (zh)
CN (1) CN108353225B (zh)
DE (1) DE112015006987B4 (zh)
WO (1) WO2017072958A1 (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1753084A (zh) * 2004-09-23 2006-03-29 哈曼贝克自动系统股份有限公司 使用噪声降低的多通道自适应语音信号处理
CN101512374A (zh) * 2006-11-09 2009-08-19 松下电器产业株式会社 声源位置检测装置
US20090299742A1 (en) * 2008-05-29 2009-12-03 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for spectral contrast enhancement
US20100150372A1 (en) * 2005-12-21 2010-06-17 Yamaha Corporation Loudspeaker system
CN102404671A (zh) * 2010-09-07 2012-04-04 索尼公司 噪音去除装置与噪音去除方法

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7319962B2 (en) * 1999-12-24 2008-01-15 Medtronic, Inc. Automatic voice and data recognition for implanted medical device instrument systems
US20120203557A1 (en) * 2001-03-29 2012-08-09 Gilad Odinak Comprehensive multiple feature telematics system
US7457757B1 (en) * 2002-05-30 2008-11-25 Plantronics, Inc. Intelligibility control for speech communications systems
US7492889B2 (en) * 2004-04-23 2009-02-17 Acoustic Technologies, Inc. Noise suppression based on bark band wiener filtering and modified doblinger noise estimate
JP2006033700A (ja) * 2004-07-21 2006-02-02 Denso Corp 車載ハンズフリー通話装置
JP2008252722A (ja) * 2007-03-30 2008-10-16 Clarion Co Ltd ハンズフリー装置、その制御方法及び制御プログラム
JP5191750B2 (ja) * 2008-01-25 2013-05-08 川崎重工業株式会社 音響装置
US9215527B1 (en) * 2009-12-14 2015-12-15 Cirrus Logic, Inc. Multi-band integrated speech separating microphone array processor with adaptive beamforming
JP5606764B2 (ja) * 2010-03-31 2014-10-15 クラリオン株式会社 音質評価装置およびそのためのプログラム
US8861756B2 (en) * 2010-09-24 2014-10-14 LI Creative Technologies, Inc. Microphone array system
US8606572B2 (en) * 2010-10-04 2013-12-10 LI Creative Technologies, Inc. Noise cancellation device for communications in high noise environments
US9538286B2 (en) 2011-02-10 2017-01-03 Dolby International Ab Spatial adaptation in multi-microphone sound capture
JP2012203122A (ja) * 2011-03-24 2012-10-22 Panasonic Corp 音声選択装置並びにそれを使用したメディア機器およびハンズフリー通話装置
US8712769B2 (en) * 2011-12-19 2014-04-29 Continental Automotive Systems, Inc. Apparatus and method for noise removal by spectral smoothing
JP2014017645A (ja) 2012-07-09 2014-01-30 Sony Corp 音声信号処理装置、音声信号処理方法、プログラム及び記録媒体
EP3282678B1 (en) * 2016-08-11 2019-11-27 GN Audio A/S Signal processor with side-tone noise reduction for a headset

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1753084A (zh) * 2004-09-23 2006-03-29 哈曼贝克自动系统股份有限公司 使用噪声降低的多通道自适应语音信号处理
US20100150372A1 (en) * 2005-12-21 2010-06-17 Yamaha Corporation Loudspeaker system
CN101512374A (zh) * 2006-11-09 2009-08-19 松下电器产业株式会社 声源位置检测装置
US20090299742A1 (en) * 2008-05-29 2009-12-03 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for spectral contrast enhancement
CN102404671A (zh) * 2010-09-07 2012-04-04 索尼公司 噪音去除装置与噪音去除方法

Also Published As

Publication number Publication date
WO2017072958A1 (ja) 2017-05-04
JPWO2017072958A1 (ja) 2018-02-08
DE112015006987B4 (de) 2019-06-06
DE112015006987T5 (de) 2018-07-05
US10320964B2 (en) 2019-06-11
US20180288205A1 (en) 2018-10-04
JP6272586B2 (ja) 2018-01-31
CN108353225B (zh) 2020-09-22

Similar Documents

Publication Publication Date Title
US9002028B2 (en) Noisy environment communication enhancement system
EP1591995B1 (en) Indoor communication system for a vehicular cabin
US8218397B2 (en) Audio source proximity estimation using sensor array for noise reduction
US8296136B2 (en) Dynamic controller for improving speech intelligibility
US20070003078A1 (en) Adaptive gain control system
US9386381B2 (en) Vehicle communication with a hearing aid device
US8019454B2 (en) Audio processing system
CN101203063B (zh) 麦克风阵列的噪声消除方法及装置
JP2008236448A (ja) 音声信号処理装置、ハンズフリー通話装置、音声信号処理方法および制御プログラム
CN110248016B (zh) 用于自动调节免提系统的系统
JP2012025270A (ja) 車両用の音量制御装置および音量制御装置用のプログラム
US20160192071A1 (en) Acoustic device, acoustic processing method, and acoustic processing program
JPH09186540A (ja) 騒音感応自動音量調整装置
US20120143603A1 (en) Speech processing apparatus and method
US20210035595A1 (en) Noise reduction apparatus
CN108353225A (zh) 免提控制装置
JP6862871B2 (ja) 車載用音処理装置
JP5383008B2 (ja) 音声明瞭度改善システム及び音声明瞭度改善方法
US7756265B2 (en) On-board hands-free communication apparatus
CN107833580B (zh) 基于输入噪声特性动态增加的噪声抑制
JP2017030671A (ja) 騒音低減装置、騒音低減方法、及び車載システム
JP2020077933A (ja) ハンズフリー通話装置、及びハンズフリー通話装置の制御方法
JP7183119B2 (ja) 音声信号処理装置
CN113783988B (zh) 一种车内通话音量控制方法及装置
US11240653B2 (en) Main unit, system and method for an infotainment system of a vehicle

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant