JP6272586B2 - ハンズフリー制御装置 - Google Patents

ハンズフリー制御装置 Download PDF

Info

Publication number
JP6272586B2
JP6272586B2 JP2017547320A JP2017547320A JP6272586B2 JP 6272586 B2 JP6272586 B2 JP 6272586B2 JP 2017547320 A JP2017547320 A JP 2017547320A JP 2017547320 A JP2017547320 A JP 2017547320A JP 6272586 B2 JP6272586 B2 JP 6272586B2
Authority
JP
Japan
Prior art keywords
noise
microphone
signal
hands
microphones
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017547320A
Other languages
English (en)
Other versions
JPWO2017072958A1 (ja
Inventor
宏典 小寺
宏典 小寺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Application granted granted Critical
Publication of JP6272586B2 publication Critical patent/JP6272586B2/ja
Publication of JPWO2017072958A1 publication Critical patent/JPWO2017072958A1/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/60Substation equipment, e.g. for use by subscribers including speech amplifiers
    • H04M1/6033Substation equipment, e.g. for use by subscribers including speech amplifiers for providing handsfree use or a loudspeaker mode in telephone sets
    • H04M1/6041Portable telephones adapted for handsfree use
    • H04M1/6075Portable telephones adapted for handsfree use adapted for handsfree use in a vehicle
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/60Substation equipment, e.g. for use by subscribers including speech amplifiers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/60Substation equipment, e.g. for use by subscribers including speech amplifiers
    • H04M1/6033Substation equipment, e.g. for use by subscribers including speech amplifiers for providing handsfree use or a loudspeaker mode in telephone sets
    • H04M1/6041Portable telephones adapted for handsfree use
    • H04M1/605Portable telephones adapted for handsfree use involving control of the receiver volume to provide a dual operational mode at close or far distance from the user
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • H04R1/406Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2499/00Aspects covered by H04R or H04S not otherwise provided for in their subgroups
    • H04R2499/10General applications
    • H04R2499/13Acoustic transducers and sound field adaptation in vehicles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • H04S7/303Tracking of listener position or orientation

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Acoustics & Sound (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Quality & Reliability (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Telephone Function (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)

Description

この発明は、ハンズフリー通話において、複数のマイクのうち、話者が発話音声を入力したマイクを判別し、判別したマイクの入力信号が通話相手に送信されるように制御するハンズフリー制御装置に関する。
近年、運転者が携帯電話機を手で持つことなく通話が可能なハンズフリー通話システムが普及している。また、ハンズフリー通話システムにおいては、複数のマイクを利用することにより、複数の話者が遠端側の話者と通話することも可能である。この場合、明瞭に集音された発話音声を通話相手に送信するには、話者が発話音声を入力したマイクを適切に判別する必要がある。
例えば、特許文献1には、複数のマイクの中から、話者が発話音声を入力したマイクを判別する技術が記載されている。特許文献1に記載されるシステムでは、複数のマイクのうち、話者が発話音声を入力して予め定めた時間以上連続して入力レベルが閾値を超えるマイクを話者の位置に対応するマイクとして判別している。この判別方法をハンズフリー通話システムに利用することで、複数のマイクの中から話者が発話音声を入力したマイクを適切に判別することができる。
また、特許文献1に記載されるシステムでは、各マイクの近傍における暗ノイズレベルを予め測定しておき、各マイクの暗ノイズレベルを室全体の暗ノイズレベルに合わせ込む補正を行ってから、話者の位置に対応するマイクを判別している。これにより、各マイクの暗ノイズレベルの影響が排除された判別を行うことができる。
特開2007−174155号公報
車両に搭載されたハンズフリー通話システムでは、車両の走行に伴って発生したロードノイズが複数のマイクのそれぞれに入力されて、ロードノイズを含んだ音声が通話相手に伝わる。このとき、マイクに入力されるノイズのゲイン、周波数特性といったノイズ特性が複数のマイクのそれぞれで異なるため、話者が変わってマイクの入力信号を切り替えると、通話相手が聞くノイズの質感が大きく変化して違和感を与えるという課題があった。
例えば、マイクが、音声認識、ANC(Active Noise Control)などのハンズフリー通話以外の機能と併用される場合、使用される機能および設置位置に応じてマイクの音響特性が異なることがある。この場合、音響特性の差異に応じてノイズ特性も異なるものとなる。従って、通話相手の電話機に送信するマイクの入力信号を切り替えると、通話相手が聞くノイズの質感が大きく変化することになる。
また、複数のマイクをハンズフリー通話に使用する場合でも、入力信号に施す音声処理が異なると、これに応じて音声処理後の入力信号に含まれるノイズの特性も異なるものとなる。さらに、複数のマイクに音響特性が同一のマイクを使用しても、それぞれのマイクのゲイン、周波数特性、温度特性などに個体差がある場合は、これに応じてマイクの入力信号に含まれるノイズの特性も異なるものとなる。
従って、これらの場合においても、通話相手の電話機に送信するマイクの入力信号を切り替ると、通話相手が聞くノイズの質感が大きく変化することになる。
なお、特許文献1に記載されるシステムは、前述したように各マイクの暗ノイズレベルを室全体の暗ノイズレベルに合わせ込む補正を入力信号に施している。このため、補正後の信号を通話相手の電話機に送信すれば、通話相手が聞くマイクの入力信号を切り替えても、通話相手が聞くノイズの質感の変化の軽減が期待される。
しかしながら、特許文献1における、各マイクの暗ノイズレベルは、各マイクの近傍にどれだけのレベルの暗ノイズが存在するかを予め測定して得るものであり、ノイズの変動が少ない環境を想定している。
一方、車両においては、例えば、車両の走行に伴ってロードノイズが発生する。ロードノイズとは、タイヤ表面と路面との摩擦に起因して発生するノイズであり、路面の状態によって態様が大きく変動する。例えば、ロードノイズは主に低周波数帯域に発生するが、乾いた路面、濡れた路面によって周波数ごとのノイズレベルが動的に大きく変動する。
このため、車両に搭載されたハンズフリー通話システムでは、特許文献1に記載されるような暗ノイズの補正処理を施しても各マイクの入力信号に含まれるノイズの特性を互いに揃えることができない。
従って、依然として、通話相手の電話機に送信するマイクの入力信号を切り替えると、通話相手が聞くノイズの質感が大きく変化することになる。
この発明は上記課題を解決するもので、通話相手の電話機に送信するマイクの入力信号を切り替えたときに通話相手が聞くノイズの質感の変化を軽減させることができるハンズフリー制御装置を得ることを目的とする。
この発明に係るハンズフリー制御装置は、判別部、ノイズ特性調整部および切り替え部を備える。判別部は、複数のマイクの中から、話者が発話音声を入力したマイクを判別する。ノイズ特性調整部は、複数のマイクの入力信号に含まれるノイズの特性が互いに揃うように周波数ごとに調整する。切り替え部は、ノイズ特性調整部によってノイズの特性が調整された複数のマイクの入力信号のうち、判別部によって判別されたマイクの入力信号を、通話相手に送信する信号に切り替える。
この発明によれば、複数のマイクの入力信号に含まれるノイズの特性が互いに揃うように周波数ごとに調整するので、通話相手の電話機に送信するマイクの入力信号を切り替えたときに通話相手が聞くノイズの質感の変化を軽減させることができる。
この発明の実施の形態1に係るハンズフリー制御装置を備えたハンズフリー通話システムの構成を示すブロック図である。 複数の話者が存在するハンズフリー通話の概要を示す図である。 図3Aは、実施の形態1に係るハンズフリー制御装置の機能を実現するハードウェア構成を示す図であり、図3Bは、実施の形態1に係るハンズフリー制御装置の機能を実現するソフトウェアを実行するハードウェア構成を示す図である。 実施の形態1に係るハンズフリー制御装置の動作を示すフローチャートである。 実施の形態1におけるノイズ特性の調整処理の概要を示す図である。 ノイズ特性の調整対象となる周波数帯域を変更した場合を示す図である。 ノイズ特性の調整対象となる周波数幅を変更した場合を示す図である。
以下、この発明をより詳細に説明するため、この発明を実施するための形態について、添付の図面に従って説明する。
実施の形態1.
図1は、この発明の実施の形態1に係るハンズフリー制御装置2を備えたハンズフリー通話システム1の構成を示すブロック図である。
また、図2は、複数の話者が存在するハンズフリー通話の概要を示す図である。図2において、図1に示すハンズフリー通話システム1において、話者として運転席SAに着座する乗員Aと助手席SBに着座する乗員Bが存在し、マイク5A,5Bで乗員Aの発話音声を集音し、マイク5Cで乗員Bの発話音声を集音する。
なお、図2では一例として、運転席SA側に2本、助手席SB側に1本のマイクを配置した場合を示したが、マイクの本数および特性の組み合わせは任意である。
図1に示すように、ハンズフリー通話システム1は、車両20に搭載されて、車両20側と車両20外の通信相手との間でハンズフリー通話を行うシステムである。その構成として、ハンズフリー制御装置2、通信装置3、車両20側の携帯電話機4A、マイク5A〜5C、アンプ6およびスピーカ7A,7Bを備える。
通信装置3は、車両20に持ち込まれた携帯電話機4Aとの間で無線通信を行う装置である。無線通信方式として、例えば、ブルートゥース(登録商標)に対応した近距離無線通信を使用する。
また、通信装置3は、ハンズフリー通信プロトコルを用いて携帯電話機4Aと接続して通信を行う。
携帯電話機4Aは、携帯電話回線を介して遠端側の携帯電話機4Bとの間で通信接続を行う。例えば、携帯電話機4Aは、通信装置3から受信した話者の音声信号を、携帯電話回線を介して携帯電話機4Bに送信する。また、携帯電話機4Aは、携帯電話回線を介して携帯電話機4Bから通話相手の音声信号を受信すると、上記ハンズフリー通信プロトコルを用いて通信装置3に当該音声信号を送信する。
マイク5A〜5Cは、車両20の車室内に設置されたマイクであって、例えば、ハンズフリー通話に利用されて話者の発話音声を集音する。なお、以降では、マイク5A〜5Cが下記の機能を有しているものとして説明する。
マイク5A,5Bは、車室内の運転席SA側に設置されて、マイク5A,5Bの両方を利用するステレオ方式のマイクを構成する。マイク5A,5Bは、運転席SAに着座する乗員A(例えば、ハンドルHを操作する運転者)の発話音声を集音する、指向性を有したマイクである。図2ではマイク5A,5Bの集音エリアをエリアCで示している。
また、マイク5Cは、助手席SB側に設置されて、助手席SBに着座する乗員Bの発話音声を集音する、無指向性のマイクである。図2ではマイク5Cの集音エリアをエリアDで示している。なお、マイク5A〜5Cがいずれも無指向性のマイクであってもよい。
アンプ6は、携帯電話機4Aによって受信されて通信装置3を介して入力した通話相手の発話音声の信号を増幅するアンプである。
スピーカ7A,7Bは、車両20の車室内に設定されて、アンプ6によって増幅された通話相手の発話音声の信号を音声出力する。
ハンズフリー制御装置2は、マイク5A〜5Cのうち、車両20側の話者が発話音声を入力したマイクを判別し、判別したマイクの入力信号を通信装置3に出力する。その構成として、音声処理部10A〜10C、判別部11、ノイズ特性調整部12および切り替え部13を備える。
音声処理部10A〜10Cは、マイク5A〜5Cからの入力信号を音声処理する処理部である。また、音声処理部10Aは、運転席SA側のマイク5A,5Bで集音された音声信号を音声処理し、音声処理部10Bは、助手席SB側のマイク5Cで集音された音声信号を音声処理する。音声処理部10A,10Bは、入力音声信号に対して、例えば、ビームフォーミング処理、エコーキャンセル処理、レベル補正処理を実施する。
ビームフォーミング処理は、マイク5A,5Bにより集音された音声信号に対して話者(運転者)の位置から到達する音声のみを強調させる処理である。例えば、マイク5A,5Bで集音された音声信号を遅延させて合成し、位置ごとに予め用意した遅延時間を基に合成信号のレベルを検出する。そして、最もレベルが大きくなる遅延時間に対応する位置を乗員Aの位置に決定する。このように乗員Aの位置を特定してその方向からの音声信号を強調することで、発話音声のSN(Signal to Noise)比の向上を図ることができる。なお、図1では、ビームフォーミング処理は、マイク5A,5Bからの入力音声を処理する音声処理部10Aのみで実施される。
エコーキャンセル処理は、マイク5A〜5Cに集音された通話相手の発話音声のエコーをキャンセルする処理である。例えば、適応フィルタを使用して、スピーカ7A,7Bとマイク5A〜5Cのインパルスレスポンスを学習し、スピーカ7A,7Bから出力される音声信号に対して、学習したインパルスレスポンスを畳み込んだ擬似エコーを生成する。そして、擬似エコーをマイク5A〜5Cに加わるスピーカ7A,7Bからの音声と見なして、マイク5A〜5Cの入力音声から差し引くことでエコーをキャンセルする。
レベル補正処理は、マイク5A〜5Cの各特性に起因した信号レベルの差異を補正する処理である。マイク5A〜5Cの特性としては、入力信号に対するゲイン、周波数特性、指向性、マイクごとの個体差に起因した誤差である。
レベル補正処理とは、例えば、マイク5A〜5Cの暗ノイズレベルを0と仮定したときの音声レベルを比較して一定に合わせる補正である。
これらの処理を施すことで、音声処理部10A,10Bからの音声信号a1,b1は、乗員Aまたは乗員Bの発話音声信号からマイク特性に起因したレベルの差異がキャンセルされた信号となる。
また、音声処理部10Cでは、音声処理部10A,10Bから入力した信号に対して、例えば、ノイズキャンセル処理、周波数特性の補正処理、自動ゲイン制御処理(以下、AGC処理と記載する)、リミッタ処理を実施する。
ノイズキャンセル処理とは、マイク5A〜5Cの入力信号に含まれるノイズのレベルを予め定めたレベルだけ低減させる処理である。例えば、マイク5A〜5Cの入力信号に含まれるノイズを位相反転させた信号を生成して入力信号に合成することで、ノイズを低減させる。または、マイク5A〜5C入力信号に対して伝達関数の特性を与えることでノイズを低減させてもよい。
なお、この処理によって、マイク5A〜5Cの入力信号におけるノイズレベルは低減されるが、キャンセルの度合いを過剰に高くすると発話音声の音質も劣化する。このため、ノイズキャンセル処理を施した後の入力信号においても、通話相手が聞き取れるノイズが残った状態になっている。
周波数特性の補正処理は、再生空間であるマイク5A,5Bの近傍の空間およびマイク5Cの近傍の空間に応じてマイク5A〜5Cの入力信号を周波数ごとにレベルおよび位相を補正する処理である。前述したように、マイク5A〜5Cは、車室内における設置場所が異なるので、音の反射または吸収による音の伝達特性がマイク5A,5Bの近傍の空間およびマイク5Cの近傍の空間で異なる。このように再生空間ごとに伝達特性が異なると通話相手に伝わる発話音声の周波数ごとのレベルおよび位相が変化して音質が劣化する。
そこで、音声処理部10Cがマイク5A〜5Cの入力信号における発話音声に相当する周波数帯域の信号に対して周波数特性の補正処理を施すことで、再生空間に起因した音質の劣化を防止している。
AGC処理は、マイク5A〜5Cの入力信号に対してゲイン調整を行う処理である。
例えば、音声処理部10Cには、基準入力レベルが予め設定されており、マイク5A〜5Cの入力信号のレベルが基準入力レベル未満である場合、無音区間であるとして、入力信号のゲインを下げる調整を自動で行う。また、基準入力レベル以上である場合は、入力信号の音量が大きくなり過ぎないように、入力信号のレベルが少し下がるようにゲインを自動で調整する。
リミッタ処理は、マイク5A〜5Cの入力信号のうち、信号レベルが閾値レベルよりも高い入力信号を閾値レベル以下に制限する処理である。
例えば、信号レベルが閾値レベルを超える入力信号の信号レベルを閾値レベルで制限をかけることで、音声処理部10Cからの音声信号a2,b2の各信号レベルが閾値レベル以下となる。これにより、突発的に生じた信号レベルが高い入力信号に起因した音質低下を防止することができる。
なお、音声処理部10A〜10Cは、ハンズフリー制御装置2とは別に設けた音声処理装置の機能であってもよい。この場合、ハンズフリー制御装置2は、判別部11、ノイズ特性調整部12および切り替え部13を備え、判別部11およびノイズ特性調整部12が上記音声処理装置から音声信号を適宜入力して処理を行うことになる。
判別部11は、マイク5A〜5Cの中から、話者が発話音声を入力したマイクを判別する。例えば、判別部11が、音声処理部10Aからの音声信号a1と音声処理部10Bからの音声信号b1を入力する。そして、判別部11は、マイク5A,5Bに対応して予め用意した閾値レベルと音声信号a1の信号レベルを比較し、マイク5Cに対応して予め用意した閾値レベルと音声信号b1の信号レベルを比較する。判別部11は、この比較により、信号レベルが閾値レベルよりも高く、音声信号a1と音声信号b1とで信号レベルが高い方を選択し、選択した出力信号が得られたマイクを話者が発話音声を入力したマイクと判別する。
ノイズ特性調整部12は、マイク5A〜5Cの入力信号に含まれるノイズの特性が互いに揃うように周波数ごとに調整する。
例えば、ノイズ特性調整部12は、音声処理部10Cからの音声信号a2,b2に対して高速フーリエ変換(FFT)を行って音声信号a2,b2の周波数スペクトルを得る。
そして、ノイズ特性調整部12は、音声信号a2,b2の周波数スペクトルにおける、ロードノイズに対応する低周波数帯域を調整対象の周波数帯域に設定する。
この後、ノイズ特性調整部12は、音声信号a2,b2に含まれるノイズの特性が互いに揃うように、調整対象の周波数帯域において予め定められた周波数幅ごとにノイズの振幅レベルを合わせる。
なお、通話相手に送信する信号を、マイク5A,5Bの入力信号(音声信号a3)からマイク5Cの入力信号(音声信号b3)に切り替える場合、音声信号b3に含まれるノイズの特性を、音声信号a3に含まれるノイズの特性に合わせ込む調整を行う。
このようにすることで、通話相手の携帯電話機4Bに送信するマイクの入力信号を切り替えたときに、通話相手が聞くノイズの質感の変化を軽減させることができる。
切り替え部13は、ノイズ特性調整部12によってノイズの特性が調整されたマイク5A〜5Cの入力信号のうち、判別部11によって判別されたマイクの入力信号を、図2において両矢印で示すように、通話相手に送信する信号に切り替える。
例えば、切り替え部13は、ノイズ特性調整部12からの音声信号a3,b3のうちのいずれかに切り替えて通信装置3へ出力するスイッチを有している。そして、切り替え部13は、判別部11によってマイク5A,5Bが判別された場合、音声信号a3を通信装置3へ出力し、判別部11によってマイク5Cが判別された場合は、音声信号b3を通信装置3へ出力する。
図3Aは実施の形態1に係るハンズフリー制御装置2の機能を実現するハードウェア構成を示す図であり、図3Bは、実施の形態1に係るハンズフリー制御装置2の機能を実現するソフトウェアを実行するハードウェア構成を示す図である。
ハンズフリー制御装置2における音声処理部10A〜10C、判別部11、ノイズ特性調整部12および切り替え部13の各機能は、処理回路により実現される。
すなわち、ハンズフリー制御装置2は、後述する図3に示すステップST1からステップST3までの処理を行うための処理回路を備える。
処理回路は、専用のハードウェアであっても、メモリに格納されたプログラムを読み出して実行するCPU(Central Processing Unit)であってもよい。
図3Aに示すように処理回路が専用のハードウェアの処理回路100である場合、処理回路100は、例えば、単一回路、複合回路、プログラム化したプロセッサ、並列プログラム化したプロセッサ、ASIC(Application Specific Integrated Circuit)、FPGA(Field−Programmable Gate Array)、または、これらを組み合わせたものが該当する。
また、音声処理部10A〜10C、判別部11、ノイズ特性調整部12および切り替え部13の各部の機能をそれぞれ処理回路で実現してもよいし、各部の機能をまとめて1つの処理回路で実現してもよい。
図3Bに示すように処理回路がCPU101である場合、音声処理部10A〜10C、判別部11、ノイズ特性調整部12および切り替え部13の機能は、ソフトウェア、ファームウェアまたはソフトウェアとファームウェアとの組み合わせにより実現される。
ソフトウェアとファームウェアはプログラムとして記述され、メモリ102に格納される。CPU101は、メモリ102に格納されたプログラムを読み出して実行することにより、各部の機能を実現する。すなわち、ハンズフリー制御装置2は、CPU101によって実行されるときに、図4に示す各ステップの処理が結果的に実行されるプログラムを格納するためのメモリ102を備える。また、これらのプログラムは、音声処理部10A〜10C、判別部11、ノイズ特性調整部12および切り替え部13の手順または方法をコンピュータに実行させるものである。
ここで、メモリとは、例えば、RAM(Random Access Memory)、ROM、フラッシュメモリ、EPROM(Erasable Programmable ROM)、EEPROM(Electrically EPROM)などの不揮発性または揮発性の半導体メモリ、磁気ディスク、フレキシブルディスク、光ディスク、コンパクトディスク、ミニディスク、DVD(Digital Versatile Disk)などが該当する。
なお、音声処理部10A〜10C、判別部11、ノイズ特性調整部12および切り替え部13の各機能について、一部を専用のハードウェアで実現し、一部をソフトウェアまたはファームウェアで実現してもよい。
例えば、音声処理部10A〜10Cは、専用のハードウェアの処理回路100でその機能を実現し、判別部11、ノイズ特性調整部12および切り替え部13は、CPU101が、メモリ102に格納されたプログラム実行することによりその機能を実現する。
このように、上記処理回路は、ハードウェア、ソフトウェア、ファームウェア、またはこれらの組み合わせによって前述の機能を実現することができる。
次に動作について説明する。
図4は、実施の形態1に係るハンズフリー制御装置2の動作を示すフローチャートであり、話者が発話音声を入力したマイクを判別してから通話相手に送信する信号を切り替えるまでの一連の処理を示している。なお、図4に示すステップST1からステップST3までの処理は繰り返し実施されるものとする。
まず、判別部11は、音声信号a1の信号レベルとマイク5A,5Bに対応する閾値レベルを比較し、音声信号b1の信号レベルとマイク5Cに対応する閾値レベルとを比較する。そして、判別部11は、信号レベルが閾値レベルよりも高く、音声信号a1と音声信号b1とで信号レベルが高い方を選択し、選択した出力信号が得られたマイクを話者が発話音声を入力したマイクと判別する(ステップST1)。
なお、これまでの説明では、判別部11が、マイク5A〜5Cの入力信号の信号レベル(絶対音声振幅)を比較してマイクを判別する場合を示したが、マイク5A〜5Cの入力信号を暗ノイズレベルで相対的に比較した結果に基づいて、判別してもよい。
例えば、判別部11は、マイク5A〜5Cの入力信号の信号レベルから暗ノイズレベルを引いた信号レベルを比較して、話者が発話音声を入力したマイクを判別してもよい。
マイク5A〜5Cとして同じ特性のマイクを用いても、実際には個体差に起因した誤差が発生する。このため、図2に示した乗員Aの方が乗員Bよりも大きい音声レベルであるにも拘わらず、上記誤差によって入力信号の絶対音声振幅が逆転して、話者が発話音声を入力したマイクとしてマイク5Cが判別される可能性がある。
そこで、判別部11が、マイク5A〜5Cの入力信号の信号レベルから暗ノイズレベルを引いた信号レベルを比較する。
このようにマイク5A〜5Cの入力信号を暗ノイズレベルで相対的に比較することで、マイク5A〜5Cの個体差に起因した誤判定を防止することができる。
なお、入力信号の信号レベルから暗ノイズレベルを引いた信号レベルを比較してその差が予め定めた値以上離れていた場合に、当該信号レベルが大きい方の入力信号が得られたマイクを、話者が発話音声を入力したマイクと判別してもよい。
例えば、マイク5A,5Bの入力信号の信号レベルから暗ノイズレベルを引いた信号レベルが60dBであり、マイク5Cの入力信号の信号レベルから暗ノイズレベルを引いた信号レベルが59dBであった場合について説明する。
ここで、上記予め定めた値が10dBである場合、話者が発話音声を入力したマイクとしてマイク5Cが選択されていたとしても、信号レベルの差が1dBであるため、マイク5A,5Bの入力信号を送信対象に切り替えない。
一方、マイク5Cの入力信号の信号レベルから暗ノイズレベルを引いた信号レベルが、50dBであれば、マイク5A,5Bの入力信号が送信対象に切り替えられる。
このようにすることで誤差レベルでの差異で切り替えが実施されなくなり、判別部11の処理の信頼性を向上させることができる。
また、信号レベルの代わりにSN比を比較してマイクを判別してもよい。
例えば、マイク5A,5BにおけるSN比とSN比についての閾値、マイク5CにおけるSN比とSN比についての閾値を利用して信号レベルの場合と同様の比較処理を行う。
前述したように、音声信号a1,b1はマイク特性に起因したレベルの差異がキャンセルされている。このような音声信号a1,b1を比較することで、話者が発話音声を入力したマイクを適切に判別することが可能となる。
なお、判別部11は、前述したような信号レベルの閾値またはSN比の閾値を変更可能であってもよい。例えば、ユーザにより入力された値を上記閾値として設定してもよい。
また、一例として、信号レベル、SNレベルの差の時間平均を観測して、この時間平均から特定のオフセットを加えた値を閾値とする。乗員Aが話したときのマイク5Aおよびマイク5BのSN比とマイク5CのSN比との差が平均7dBであれば、そこからオフセット値3dBを引いて得られる4dBを閾値とする。このようにして動的に閾値を変更してもよい。
また、判別部11は、話者が発話音声を入力したと判別したマイクの入力信号の信号レベルが、他のマイクの入力信号の信号レベル以下となってから予め定められた保持時間が経過するまで、他のマイクを、話者が発話音声を入力したマイクとして判別しないようにしてもよい。例えば、話者が発話音声を入力したマイクとしてマイク5A,5Bが判別された後に、音声信号a1の信号レベルがマイク5Cの入力信号に起因する音声信号b1の信号レベル以下となっても、上記保持時間が経過するまで通信装置3に出力する信号を、音声信号a3から音声信号b3に切り替えない。
このようにすることで、通信装置3に出力する信号、すなわち通信相手に送信する信号が頻繁に切り替わることが防止され、確実に話者が変わったと判断されるときに切り替えを行うことができる。なお、保持時間としては、例えば、数百ミリ秒程度の時間が考えられる。
さらに、判別部11は、音声信号a1,b1の一方の信号レベルが下限閾値未満である場合、この音声信号が無音であると判断して、もう一方の音声信号が得られたマイクを、話者が発話音声を入力したマイクと判別してもよい。例えば、音声信号a1の信号レベルが無音レベルであると判断すると、音声信号b1が得られたマイク5Cを、話者が発話音声を入力したマイクと判別する。これにより、通信相手に送信する信号が、音声信号a3から音声信号b3に自動的に切り替えられる。このようにしても、話者が発話音声を入力したマイクを適切に判別することが可能となる。
次に、ノイズ特性調整部12は、マイク5A〜5Cの入力信号に含まれるノイズの特性が互いに揃うように周波数ごとに調整する(ステップST2)。
例えば、ノイズ特性調整部12は、音声信号a2,b2に対して高速フーリエ変換(FFT)を行って音声信号a2,b2の周波数スペクトルを得る。
そして、ノイズ特性調整部12は、図5に示すように、音声信号a2,b2の周波数スペクトルにおける、ロードノイズに対応する低周波数帯域を調整対象の周波数帯域BWに設定する。この後、ノイズ特性調整部12は、調整対象の周波数帯域BWにおいて、図5において矢印で示すように、音声信号a2,b2に含まれるノイズの特性が互いに揃うように予め定められた周波数幅RBごとにノイズの振幅レベルを合わせる調整を行う。
これにより、ノイズ特性調整部12からの音声信号a3,b3に含まれるノイズの特性が互いに揃うので、音声信号a3,b3のいずれかを通話相手に送信する信号に切り替えても、切り替え前後で通話相手が聞くノイズの質感の変化を軽減させることができる。
なお、ノイズに対応する周波数帯域のみを調整対象の周波数帯域BWに設定する場合を示したが、発話音声の周波数帯域を含めて調整対象に設定してもよい。
例えば、ノイズと発話音声との差異が明確でない場合、発話音声およびノイズの特性を互いに揃える。このようにしても、切り替え前後で通話相手が聞くノイズの質感の変化を軽減させることができる。
また、ノイズ特性調整部12は、調整対象の周波数帯域BWの設定変更が可能であってもよい。例えば、図6に示すように、調整対象の周波数帯域BW1を設定してから、音声信号a2,b2のうち、いずれかに含まれるノイズのレベルが閾値レベルThを超える周波数帯域BW2のみを調整対象の周波数帯域に変更する。上記の閾値レベルThを通話相手が聞き取れる下限レベルとすることで、ノイズ特性の調整が必要な周波数帯域のみを調整対象として選択することが可能となり、ノイズ特性を適切に揃えることができる。
また、車両の走行に伴って発生するノイズには、ロードノイズの他にパターンノイズ、空洞共鳴音などがある。パターンノイズは、タイヤ溝における空気の圧縮と開放によって生じるノイズであり、ロードノイズよりも高音域のノイズとなる。また、空洞共鳴音は、タイヤ内部に充填された空気の振動により発生するノイズであり、こちらもロードノイズよりも高音域の乾いた音となる。
そこで、ノイズ特性調整部12は、これらのロードノイズ以外のノイズの特性も揃える場合、パターンノイズおよび空洞共鳴音に対応するより高周波数帯域の成分を調整対象の周波数帯域BWに設定する。
このようにすることで、実際のノイズ環境に応じてノイズの特性を適切に揃えることが可能となる。
さらに、ノイズ特性調整部12は、周波数幅RBの設定変更が可能であってもよい。
例えば、ロードノイズのレベルが閾値以上となる走行環境では、ノイズの特性を細かく調整するために周波数幅RBを一律狭くする。一方、ロードノイズのレベルが閾値未満の走行環境では、調整処理の演算負担を軽くするため、周波数幅RBを一律広くする。
このようにすることで、ノイズの特性を適切に揃えることが可能となる。
なお、周波数幅RBは一定幅で変更するのみならず、異なる幅に変更してもよい。
例えば、図7に示すように、調整対象の周波数帯域BWのうち、ノイズレベルの変動量が予め定めた閾値よりも大きい周波数帯域において周波数幅RB2から周波数幅RB1に変更して周波数幅を狭くする。このようにすることで、ノイズレベルの変動が激しい部分で細かく特性を揃えることができ、音声信号a2,b2におけるノイズ特性の差異を適切になくすことができる。
次に、切り替え部13は、ノイズ特性調整部12によってノイズの特性が調整されたマイク5A〜5Cの入力信号のうち、判別部11によって判別されたマイクの入力信号を、通話相手に送信する信号に切り替える(ステップST3)。
例えば、判別部11によってマイク5A,5Bが判別された場合、音声信号a3を通信装置3へ出力し、判別部11によってマイク5Cが判別された場合には、音声信号b3を通信装置3へ出力する。
通信装置3は、切り替え部13から入力した音声信号を、近距離無線通信で携帯電話機4Aに送信する。携帯電話機4Aは、携帯電話回線を介して音声信号を携帯電話機4Bに送信する。これにより、通話相手が、車両20の話者の発話音声を聞くことができる。
以上のように、実施の形態1に係るハンズフリー制御装置2は、図1に示す構成を有しており、マイク5A〜5Cの入力信号に含まれるノイズの特性が互いに揃うように周波数ごとに調整している。このように構成することで、通話相手の携帯電話機4Bに送信するマイク5A〜5Cの入力信号を切り替えたときに通話相手が聞くノイズの質感の変化を軽減させることができる。
また、実施の形態1に係るハンズフリー制御装置2において、判別部11は、マイク5A〜5Cの入力信号の信号レベルから暗ノイズレベルを引いた信号レベルを比較して、話者が発話音声を入力したマイクを判別する。このように構成することで、マイク5A〜5Cの個体差に起因した誤判定を防止することができる。
さらに、実施の形態1に係るハンズフリー制御装置2において、ノイズ特性調整部12は、入力信号に含まれるノイズの特性を、調整対象の周波数帯域BWにおいて予め定められた周波数幅RBごとに調整する。このようにすることで、音声信号a3,b3のいずれかを通話相手に送信する信号に切り替えても、切り替え前後で通話相手が聞くノイズの質感の変化を軽減させることができる。
さらに、実施の形態1に係るハンズフリー制御装置2において、ノイズ特性調整部12の調整対象の周波数帯域BWは、設定変更が可能である。このようにすることで、ノイズの特性を適切に揃えることが可能となる。
さらに、実施の形態1に係るハンズフリー制御装置2において、周波数幅RBは、設定変更が可能である。このようにすることで、ノイズの特性を適切に揃えることが可能となる。
さらに、実施の形態1に係るハンズフリー制御装置2において、ノイズ特性調整部12は、調整対象の周波数帯域BWのうち、ノイズレベルの変動量が予め定められた閾値よりも大きい周波数帯域における周波数幅RBを狭くする。
このようにすることで、ノイズレベルの変動が大きい部分で細かく特性を揃えることができ、音声信号a2,b2におけるノイズ特性の差異を適切になくすことができる。
さらに、実施の形態1に係るハンズフリー制御装置2において、判別部11は、話者が発話音声を入力したと判別したマイクの入力信号の信号レベルが他のマイクの入力信号の信号レベル以下となってから予め定められた保持時間が経過するまで、他のマイクを、話者が発話音声を入力したマイクとして判別しない。このようにすることで、通信相手に送信する信号が頻繁に切り替わることが防止され、確実に話者が変わったと判断されるときに切り替えを行うことができる。
なお、本発明はその発明の範囲内において、実施の形態の任意の構成要素の変形、もしくは実施の形態の任意の構成要素の省略が可能である。
この発明に係るハンズフリー制御装置は、マイクの入力信号の切り替わりによるノイズの質感の変化を軽減させることができるので、車載用のハンズフリー通話システムに好適である。
1 ハンズフリー通話システム、2 ハンズフリー制御装置、3 通信装置、4A,4B 携帯電話機、5A〜5C マイク、6 アンプ、7A,7B スピーカ、10A〜10C 音声処理部、11 判別部、12 ノイズ特性調整部、13 切り替え部、20 車両、100 処理回路、101 CPU、102 メモリ。

Claims (7)

  1. 複数のマイクの中から、話者が発話音声を入力したマイクを判別する判別部と、
    前記複数のマイクの入力信号に含まれるノイズの特性が互いに揃うように周波数ごとに調整するノイズ特性調整部と、
    前記ノイズ特性調整部によってノイズの特性が調整された前記複数のマイクの入力信号のうち、前記判別部によって判別されたマイクの入力信号を、通話相手に送信する信号に切り替える切り替え部と
    を備えたことを特徴とするハンズフリー制御装置。
  2. 前記判別部は、マイクの入力信号の信号レベルから暗ノイズレベルを引いた信号レベルを比較して、話者が発話音声を入力したマイクを判別することを特徴とする請求項1記載のハンズフリー制御装置。
  3. 前記ノイズ特性調整部は、入力信号に含まれるノイズの特性を、調整対象の周波数帯域において予め定められた周波数幅ごとに調整することを特徴とする請求項1記載のハンズフリー制御装置。
  4. 前記ノイズ特性調整部の前記調整対象の周波数帯域は、設定変更が可能であることを特徴とする請求項3記載のハンズフリー制御装置。
  5. 前記周波数幅は、設定変更が可能であることを特徴とする請求項3記載のハンズフリー制御装置。
  6. 前記ノイズ特性調整部は、前記調整対象の周波数帯域のうち、ノイズレベルの変動量が予め定められた閾値よりも大きい周波数帯域における前記周波数幅を狭くすることを特徴とする請求項5記載のハンズフリー制御装置。
  7. 前記判別部は、判別したマイクの入力信号の信号レベルが他のマイクの入力信号の信号レベル以下となっても保持時間が経過するまでの間、前記他のマイクを、話者が発話音声を入力したマイクと判別しないことを特徴とする請求項1記載のハンズフリー制御装置。
JP2017547320A 2015-10-30 2015-10-30 ハンズフリー制御装置 Active JP6272586B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2015/080754 WO2017072958A1 (ja) 2015-10-30 2015-10-30 ハンズフリー制御装置

Publications (2)

Publication Number Publication Date
JP6272586B2 true JP6272586B2 (ja) 2018-01-31
JPWO2017072958A1 JPWO2017072958A1 (ja) 2018-02-08

Family

ID=58629992

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017547320A Active JP6272586B2 (ja) 2015-10-30 2015-10-30 ハンズフリー制御装置

Country Status (5)

Country Link
US (1) US10320964B2 (ja)
JP (1) JP6272586B2 (ja)
CN (1) CN108353225B (ja)
DE (1) DE112015006987B4 (ja)
WO (1) WO2017072958A1 (ja)

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7319962B2 (en) * 1999-12-24 2008-01-15 Medtronic, Inc. Automatic voice and data recognition for implanted medical device instrument systems
US20120203557A1 (en) * 2001-03-29 2012-08-09 Gilad Odinak Comprehensive multiple feature telematics system
US7457757B1 (en) * 2002-05-30 2008-11-25 Plantronics, Inc. Intelligibility control for speech communications systems
US7492889B2 (en) * 2004-04-23 2009-02-17 Acoustic Technologies, Inc. Noise suppression based on bark band wiener filtering and modified doblinger noise estimate
JP2006033700A (ja) * 2004-07-21 2006-02-02 Denso Corp 車載ハンズフリー通話装置
ATE405925T1 (de) * 2004-09-23 2008-09-15 Harman Becker Automotive Sys Mehrkanalige adaptive sprachsignalverarbeitung mit rauschunterdrückung
JP4311402B2 (ja) * 2005-12-21 2009-08-12 ヤマハ株式会社 拡声システム
EP2090895B1 (en) * 2006-11-09 2011-01-05 Panasonic Corporation Sound source position detector
JP2008252722A (ja) * 2007-03-30 2008-10-16 Clarion Co Ltd ハンズフリー装置、その制御方法及び制御プログラム
JP5191750B2 (ja) * 2008-01-25 2013-05-08 川崎重工業株式会社 音響装置
US8831936B2 (en) * 2008-05-29 2014-09-09 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for speech signal processing using spectral contrast enhancement
US9215527B1 (en) * 2009-12-14 2015-12-15 Cirrus Logic, Inc. Multi-band integrated speech separating microphone array processor with adaptive beamforming
JP5606764B2 (ja) * 2010-03-31 2014-10-15 クラリオン株式会社 音質評価装置およびそのためのプログラム
JP5573517B2 (ja) * 2010-09-07 2014-08-20 ソニー株式会社 雑音除去装置および雑音除去方法
US8861756B2 (en) * 2010-09-24 2014-10-14 LI Creative Technologies, Inc. Microphone array system
US8606572B2 (en) * 2010-10-04 2013-12-10 LI Creative Technologies, Inc. Noise cancellation device for communications in high noise environments
US9538286B2 (en) 2011-02-10 2017-01-03 Dolby International Ab Spatial adaptation in multi-microphone sound capture
JP2012203122A (ja) * 2011-03-24 2012-10-22 Panasonic Corp 音声選択装置並びにそれを使用したメディア機器およびハンズフリー通話装置
US8712769B2 (en) * 2011-12-19 2014-04-29 Continental Automotive Systems, Inc. Apparatus and method for noise removal by spectral smoothing
JP2014017645A (ja) 2012-07-09 2014-01-30 Sony Corp 音声信号処理装置、音声信号処理方法、プログラム及び記録媒体
EP3282678B1 (en) * 2016-08-11 2019-11-27 GN Audio A/S Signal processor with side-tone noise reduction for a headset

Also Published As

Publication number Publication date
US20180288205A1 (en) 2018-10-04
DE112015006987B4 (de) 2019-06-06
WO2017072958A1 (ja) 2017-05-04
CN108353225B (zh) 2020-09-22
CN108353225A (zh) 2018-07-31
DE112015006987T5 (de) 2018-07-05
JPWO2017072958A1 (ja) 2018-02-08
US10320964B2 (en) 2019-06-11

Similar Documents

Publication Publication Date Title
JP5551176B2 (ja) ノイズ低減のためのセンサーアレイを使用したオーディオ源近接推定
CN110476208B (zh) 用于扰动信号补偿的音频系统和方法
US9002028B2 (en) Noisy environment communication enhancement system
US9432766B2 (en) Audio processing device comprising artifact reduction
US8296136B2 (en) Dynamic controller for improving speech intelligibility
KR20200034670A (ko) 가변 마이크로폰 어레이 방향을 갖는 헤드셋들을 위한 듀얼 마이크로폰 음성 프로세싱
US20050265560A1 (en) Indoor communication system for a vehicular cabin
JP2008538882A (ja) マイク信号の中の風ノイズの検出および抑制
KR20190019833A (ko) 룸-의존적 적응형 음색 보정
JP2010283506A (ja) 車載用音響処理装置
US10887685B1 (en) Adaptive white noise gain control and equalization for differential microphone array
JP5292345B2 (ja) 音質自動調整機能を備える音響再生装置、およびそれを組み込んだハンズフリー電話装置
KR20100120567A (ko) 오디오 출력 장치 및 오디오 출력 방법
JP7078594B2 (ja) 車両用装置、車両、車両用装置の動作方法およびプログラム
JP6272586B2 (ja) ハンズフリー制御装置
JP5383008B2 (ja) 音声明瞭度改善システム及び音声明瞭度改善方法
US20230097305A1 (en) Audio device with microphone sensitivity compensator
US20230098384A1 (en) Audio device with dual beamforming
US20230101635A1 (en) Audio device with distractor attenuator
EP4156183A1 (en) Audio device with a plurality of attenuators
JP2008034928A (ja) 音声入出力装置及びプログラム
CN117202003A (zh) 无线耳机的降噪校准方法及装置、电子设备、存储介质
WO2018025397A1 (ja) 電子機器及び車載ハンズフリー装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170925

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20170925

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20171130

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20171205

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20171228

R150 Certificate of patent or registration of utility model

Ref document number: 6272586

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250