JP6272586B2

JP6272586B2 - ハンズフリー制御装置

Info

Publication number: JP6272586B2
Application number: JP2017547320A
Authority: JP
Inventors: 宏典小寺
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 2015-10-30
Filing date: 2015-10-30
Publication date: 2018-01-31
Anticipated expiration: 2035-10-30
Also published as: CN108353225A; US10320964B2; WO2017072958A1; CN108353225B; US20180288205A1; JPWO2017072958A1; DE112015006987B4; DE112015006987T5

Description

この発明は、ハンズフリー通話において、複数のマイクのうち、話者が発話音声を入力したマイクを判別し、判別したマイクの入力信号が通話相手に送信されるように制御するハンズフリー制御装置に関する。

近年、運転者が携帯電話機を手で持つことなく通話が可能なハンズフリー通話システムが普及している。また、ハンズフリー通話システムにおいては、複数のマイクを利用することにより、複数の話者が遠端側の話者と通話することも可能である。この場合、明瞭に集音された発話音声を通話相手に送信するには、話者が発話音声を入力したマイクを適切に判別する必要がある。

例えば、特許文献１には、複数のマイクの中から、話者が発話音声を入力したマイクを判別する技術が記載されている。特許文献１に記載されるシステムでは、複数のマイクのうち、話者が発話音声を入力して予め定めた時間以上連続して入力レベルが閾値を超えるマイクを話者の位置に対応するマイクとして判別している。この判別方法をハンズフリー通話システムに利用することで、複数のマイクの中から話者が発話音声を入力したマイクを適切に判別することができる。

また、特許文献１に記載されるシステムでは、各マイクの近傍における暗ノイズレベルを予め測定しておき、各マイクの暗ノイズレベルを室全体の暗ノイズレベルに合わせ込む補正を行ってから、話者の位置に対応するマイクを判別している。これにより、各マイクの暗ノイズレベルの影響が排除された判別を行うことができる。

特開２００７−１７４１５５号公報

車両に搭載されたハンズフリー通話システムでは、車両の走行に伴って発生したロードノイズが複数のマイクのそれぞれに入力されて、ロードノイズを含んだ音声が通話相手に伝わる。このとき、マイクに入力されるノイズのゲイン、周波数特性といったノイズ特性が複数のマイクのそれぞれで異なるため、話者が変わってマイクの入力信号を切り替えると、通話相手が聞くノイズの質感が大きく変化して違和感を与えるという課題があった。

例えば、マイクが、音声認識、ＡＮＣ（ＡｃｔｉｖｅＮｏｉｓｅＣｏｎｔｒｏｌ）などのハンズフリー通話以外の機能と併用される場合、使用される機能および設置位置に応じてマイクの音響特性が異なることがある。この場合、音響特性の差異に応じてノイズ特性も異なるものとなる。従って、通話相手の電話機に送信するマイクの入力信号を切り替えると、通話相手が聞くノイズの質感が大きく変化することになる。

また、複数のマイクをハンズフリー通話に使用する場合でも、入力信号に施す音声処理が異なると、これに応じて音声処理後の入力信号に含まれるノイズの特性も異なるものとなる。さらに、複数のマイクに音響特性が同一のマイクを使用しても、それぞれのマイクのゲイン、周波数特性、温度特性などに個体差がある場合は、これに応じてマイクの入力信号に含まれるノイズの特性も異なるものとなる。
従って、これらの場合においても、通話相手の電話機に送信するマイクの入力信号を切り替ると、通話相手が聞くノイズの質感が大きく変化することになる。

なお、特許文献１に記載されるシステムは、前述したように各マイクの暗ノイズレベルを室全体の暗ノイズレベルに合わせ込む補正を入力信号に施している。このため、補正後の信号を通話相手の電話機に送信すれば、通話相手が聞くマイクの入力信号を切り替えても、通話相手が聞くノイズの質感の変化の軽減が期待される。

しかしながら、特許文献１における、各マイクの暗ノイズレベルは、各マイクの近傍にどれだけのレベルの暗ノイズが存在するかを予め測定して得るものであり、ノイズの変動が少ない環境を想定している。
一方、車両においては、例えば、車両の走行に伴ってロードノイズが発生する。ロードノイズとは、タイヤ表面と路面との摩擦に起因して発生するノイズであり、路面の状態によって態様が大きく変動する。例えば、ロードノイズは主に低周波数帯域に発生するが、乾いた路面、濡れた路面によって周波数ごとのノイズレベルが動的に大きく変動する。
このため、車両に搭載されたハンズフリー通話システムでは、特許文献１に記載されるような暗ノイズの補正処理を施しても各マイクの入力信号に含まれるノイズの特性を互いに揃えることができない。
従って、依然として、通話相手の電話機に送信するマイクの入力信号を切り替えると、通話相手が聞くノイズの質感が大きく変化することになる。

この発明は上記課題を解決するもので、通話相手の電話機に送信するマイクの入力信号を切り替えたときに通話相手が聞くノイズの質感の変化を軽減させることができるハンズフリー制御装置を得ることを目的とする。

この発明に係るハンズフリー制御装置は、判別部、ノイズ特性調整部および切り替え部を備える。判別部は、複数のマイクの中から、話者が発話音声を入力したマイクを判別する。ノイズ特性調整部は、複数のマイクの入力信号に含まれるノイズの特性が互いに揃うように周波数ごとに調整する。切り替え部は、ノイズ特性調整部によってノイズの特性が調整された複数のマイクの入力信号のうち、判別部によって判別されたマイクの入力信号を、通話相手に送信する信号に切り替える。

この発明によれば、複数のマイクの入力信号に含まれるノイズの特性が互いに揃うように周波数ごとに調整するので、通話相手の電話機に送信するマイクの入力信号を切り替えたときに通話相手が聞くノイズの質感の変化を軽減させることができる。

この発明の実施の形態１に係るハンズフリー制御装置を備えたハンズフリー通話システムの構成を示すブロック図である。複数の話者が存在するハンズフリー通話の概要を示す図である。図３Ａは、実施の形態１に係るハンズフリー制御装置の機能を実現するハードウェア構成を示す図であり、図３Ｂは、実施の形態１に係るハンズフリー制御装置の機能を実現するソフトウェアを実行するハードウェア構成を示す図である。実施の形態１に係るハンズフリー制御装置の動作を示すフローチャートである。実施の形態１におけるノイズ特性の調整処理の概要を示す図である。ノイズ特性の調整対象となる周波数帯域を変更した場合を示す図である。ノイズ特性の調整対象となる周波数幅を変更した場合を示す図である。

以下、この発明をより詳細に説明するため、この発明を実施するための形態について、添付の図面に従って説明する。
実施の形態１．
図１は、この発明の実施の形態１に係るハンズフリー制御装置２を備えたハンズフリー通話システム１の構成を示すブロック図である。
また、図２は、複数の話者が存在するハンズフリー通話の概要を示す図である。図２において、図１に示すハンズフリー通話システム１において、話者として運転席ＳＡに着座する乗員Ａと助手席ＳＢに着座する乗員Ｂが存在し、マイク５Ａ，５Ｂで乗員Ａの発話音声を集音し、マイク５Ｃで乗員Ｂの発話音声を集音する。
なお、図２では一例として、運転席ＳＡ側に２本、助手席ＳＢ側に１本のマイクを配置した場合を示したが、マイクの本数および特性の組み合わせは任意である。

図１に示すように、ハンズフリー通話システム１は、車両２０に搭載されて、車両２０側と車両２０外の通信相手との間でハンズフリー通話を行うシステムである。その構成として、ハンズフリー制御装置２、通信装置３、車両２０側の携帯電話機４Ａ、マイク５Ａ〜５Ｃ、アンプ６およびスピーカ７Ａ，７Ｂを備える。

通信装置３は、車両２０に持ち込まれた携帯電話機４Ａとの間で無線通信を行う装置である。無線通信方式として、例えば、ブルートゥース（登録商標）に対応した近距離無線通信を使用する。
また、通信装置３は、ハンズフリー通信プロトコルを用いて携帯電話機４Ａと接続して通信を行う。

携帯電話機４Ａは、携帯電話回線を介して遠端側の携帯電話機４Ｂとの間で通信接続を行う。例えば、携帯電話機４Ａは、通信装置３から受信した話者の音声信号を、携帯電話回線を介して携帯電話機４Ｂに送信する。また、携帯電話機４Ａは、携帯電話回線を介して携帯電話機４Ｂから通話相手の音声信号を受信すると、上記ハンズフリー通信プロトコルを用いて通信装置３に当該音声信号を送信する。

マイク５Ａ〜５Ｃは、車両２０の車室内に設置されたマイクであって、例えば、ハンズフリー通話に利用されて話者の発話音声を集音する。なお、以降では、マイク５Ａ〜５Ｃが下記の機能を有しているものとして説明する。
マイク５Ａ，５Ｂは、車室内の運転席ＳＡ側に設置されて、マイク５Ａ，５Ｂの両方を利用するステレオ方式のマイクを構成する。マイク５Ａ，５Ｂは、運転席ＳＡに着座する乗員Ａ（例えば、ハンドルＨを操作する運転者）の発話音声を集音する、指向性を有したマイクである。図２ではマイク５Ａ，５Ｂの集音エリアをエリアＣで示している。
また、マイク５Ｃは、助手席ＳＢ側に設置されて、助手席ＳＢに着座する乗員Ｂの発話音声を集音する、無指向性のマイクである。図２ではマイク５Ｃの集音エリアをエリアＤで示している。なお、マイク５Ａ〜５Ｃがいずれも無指向性のマイクであってもよい。

アンプ６は、携帯電話機４Ａによって受信されて通信装置３を介して入力した通話相手の発話音声の信号を増幅するアンプである。
スピーカ７Ａ，７Ｂは、車両２０の車室内に設定されて、アンプ６によって増幅された通話相手の発話音声の信号を音声出力する。

ハンズフリー制御装置２は、マイク５Ａ〜５Ｃのうち、車両２０側の話者が発話音声を入力したマイクを判別し、判別したマイクの入力信号を通信装置３に出力する。その構成として、音声処理部１０Ａ〜１０Ｃ、判別部１１、ノイズ特性調整部１２および切り替え部１３を備える。

音声処理部１０Ａ〜１０Ｃは、マイク５Ａ〜５Ｃからの入力信号を音声処理する処理部である。また、音声処理部１０Ａは、運転席ＳＡ側のマイク５Ａ，５Ｂで集音された音声信号を音声処理し、音声処理部１０Ｂは、助手席ＳＢ側のマイク５Ｃで集音された音声信号を音声処理する。音声処理部１０Ａ，１０Ｂは、入力音声信号に対して、例えば、ビームフォーミング処理、エコーキャンセル処理、レベル補正処理を実施する。

ビームフォーミング処理は、マイク５Ａ，５Ｂにより集音された音声信号に対して話者（運転者）の位置から到達する音声のみを強調させる処理である。例えば、マイク５Ａ，５Ｂで集音された音声信号を遅延させて合成し、位置ごとに予め用意した遅延時間を基に合成信号のレベルを検出する。そして、最もレベルが大きくなる遅延時間に対応する位置を乗員Ａの位置に決定する。このように乗員Ａの位置を特定してその方向からの音声信号を強調することで、発話音声のＳＮ（ＳｉｇｎａｌｔｏＮｏｉｓｅ）比の向上を図ることができる。なお、図１では、ビームフォーミング処理は、マイク５Ａ，５Ｂからの入力音声を処理する音声処理部１０Ａのみで実施される。

エコーキャンセル処理は、マイク５Ａ〜５Ｃに集音された通話相手の発話音声のエコーをキャンセルする処理である。例えば、適応フィルタを使用して、スピーカ７Ａ，７Ｂとマイク５Ａ〜５Ｃのインパルスレスポンスを学習し、スピーカ７Ａ，７Ｂから出力される音声信号に対して、学習したインパルスレスポンスを畳み込んだ擬似エコーを生成する。そして、擬似エコーをマイク５Ａ〜５Ｃに加わるスピーカ７Ａ，７Ｂからの音声と見なして、マイク５Ａ〜５Ｃの入力音声から差し引くことでエコーをキャンセルする。

レベル補正処理は、マイク５Ａ〜５Ｃの各特性に起因した信号レベルの差異を補正する処理である。マイク５Ａ〜５Ｃの特性としては、入力信号に対するゲイン、周波数特性、指向性、マイクごとの個体差に起因した誤差である。
レベル補正処理とは、例えば、マイク５Ａ〜５Ｃの暗ノイズレベルを０と仮定したときの音声レベルを比較して一定に合わせる補正である。
これらの処理を施すことで、音声処理部１０Ａ，１０Ｂからの音声信号ａ１，ｂ１は、乗員Ａまたは乗員Ｂの発話音声信号からマイク特性に起因したレベルの差異がキャンセルされた信号となる。

また、音声処理部１０Ｃでは、音声処理部１０Ａ，１０Ｂから入力した信号に対して、例えば、ノイズキャンセル処理、周波数特性の補正処理、自動ゲイン制御処理（以下、ＡＧＣ処理と記載する）、リミッタ処理を実施する。
ノイズキャンセル処理とは、マイク５Ａ〜５Ｃの入力信号に含まれるノイズのレベルを予め定めたレベルだけ低減させる処理である。例えば、マイク５Ａ〜５Ｃの入力信号に含まれるノイズを位相反転させた信号を生成して入力信号に合成することで、ノイズを低減させる。または、マイク５Ａ〜５Ｃ入力信号に対して伝達関数の特性を与えることでノイズを低減させてもよい。
なお、この処理によって、マイク５Ａ〜５Ｃの入力信号におけるノイズレベルは低減されるが、キャンセルの度合いを過剰に高くすると発話音声の音質も劣化する。このため、ノイズキャンセル処理を施した後の入力信号においても、通話相手が聞き取れるノイズが残った状態になっている。

周波数特性の補正処理は、再生空間であるマイク５Ａ，５Ｂの近傍の空間およびマイク５Ｃの近傍の空間に応じてマイク５Ａ〜５Ｃの入力信号を周波数ごとにレベルおよび位相を補正する処理である。前述したように、マイク５Ａ〜５Ｃは、車室内における設置場所が異なるので、音の反射または吸収による音の伝達特性がマイク５Ａ，５Ｂの近傍の空間およびマイク５Ｃの近傍の空間で異なる。このように再生空間ごとに伝達特性が異なると通話相手に伝わる発話音声の周波数ごとのレベルおよび位相が変化して音質が劣化する。
そこで、音声処理部１０Ｃがマイク５Ａ〜５Ｃの入力信号における発話音声に相当する周波数帯域の信号に対して周波数特性の補正処理を施すことで、再生空間に起因した音質の劣化を防止している。

ＡＧＣ処理は、マイク５Ａ〜５Ｃの入力信号に対してゲイン調整を行う処理である。
例えば、音声処理部１０Ｃには、基準入力レベルが予め設定されており、マイク５Ａ〜５Ｃの入力信号のレベルが基準入力レベル未満である場合、無音区間であるとして、入力信号のゲインを下げる調整を自動で行う。また、基準入力レベル以上である場合は、入力信号の音量が大きくなり過ぎないように、入力信号のレベルが少し下がるようにゲインを自動で調整する。

リミッタ処理は、マイク５Ａ〜５Ｃの入力信号のうち、信号レベルが閾値レベルよりも高い入力信号を閾値レベル以下に制限する処理である。
例えば、信号レベルが閾値レベルを超える入力信号の信号レベルを閾値レベルで制限をかけることで、音声処理部１０Ｃからの音声信号ａ２，ｂ２の各信号レベルが閾値レベル以下となる。これにより、突発的に生じた信号レベルが高い入力信号に起因した音質低下を防止することができる。
なお、音声処理部１０Ａ〜１０Ｃは、ハンズフリー制御装置２とは別に設けた音声処理装置の機能であってもよい。この場合、ハンズフリー制御装置２は、判別部１１、ノイズ特性調整部１２および切り替え部１３を備え、判別部１１およびノイズ特性調整部１２が上記音声処理装置から音声信号を適宜入力して処理を行うことになる。

判別部１１は、マイク５Ａ〜５Ｃの中から、話者が発話音声を入力したマイクを判別する。例えば、判別部１１が、音声処理部１０Ａからの音声信号ａ１と音声処理部１０Ｂからの音声信号ｂ１を入力する。そして、判別部１１は、マイク５Ａ，５Ｂに対応して予め用意した閾値レベルと音声信号ａ１の信号レベルを比較し、マイク５Ｃに対応して予め用意した閾値レベルと音声信号ｂ１の信号レベルを比較する。判別部１１は、この比較により、信号レベルが閾値レベルよりも高く、音声信号ａ１と音声信号ｂ１とで信号レベルが高い方を選択し、選択した出力信号が得られたマイクを話者が発話音声を入力したマイクと判別する。

ノイズ特性調整部１２は、マイク５Ａ〜５Ｃの入力信号に含まれるノイズの特性が互いに揃うように周波数ごとに調整する。
例えば、ノイズ特性調整部１２は、音声処理部１０Ｃからの音声信号ａ２，ｂ２に対して高速フーリエ変換（ＦＦＴ）を行って音声信号ａ２，ｂ２の周波数スペクトルを得る。
そして、ノイズ特性調整部１２は、音声信号ａ２，ｂ２の周波数スペクトルにおける、ロードノイズに対応する低周波数帯域を調整対象の周波数帯域に設定する。
この後、ノイズ特性調整部１２は、音声信号ａ２，ｂ２に含まれるノイズの特性が互いに揃うように、調整対象の周波数帯域において予め定められた周波数幅ごとにノイズの振幅レベルを合わせる。

なお、通話相手に送信する信号を、マイク５Ａ，５Ｂの入力信号（音声信号ａ３）からマイク５Ｃの入力信号（音声信号ｂ３）に切り替える場合、音声信号ｂ３に含まれるノイズの特性を、音声信号ａ３に含まれるノイズの特性に合わせ込む調整を行う。
このようにすることで、通話相手の携帯電話機４Ｂに送信するマイクの入力信号を切り替えたときに、通話相手が聞くノイズの質感の変化を軽減させることができる。

切り替え部１３は、ノイズ特性調整部１２によってノイズの特性が調整されたマイク５Ａ〜５Ｃの入力信号のうち、判別部１１によって判別されたマイクの入力信号を、図２において両矢印で示すように、通話相手に送信する信号に切り替える。
例えば、切り替え部１３は、ノイズ特性調整部１２からの音声信号ａ３，ｂ３のうちのいずれかに切り替えて通信装置３へ出力するスイッチを有している。そして、切り替え部１３は、判別部１１によってマイク５Ａ，５Ｂが判別された場合、音声信号ａ３を通信装置３へ出力し、判別部１１によってマイク５Ｃが判別された場合は、音声信号ｂ３を通信装置３へ出力する。

図３Ａは実施の形態１に係るハンズフリー制御装置２の機能を実現するハードウェア構成を示す図であり、図３Ｂは、実施の形態１に係るハンズフリー制御装置２の機能を実現するソフトウェアを実行するハードウェア構成を示す図である。
ハンズフリー制御装置２における音声処理部１０Ａ〜１０Ｃ、判別部１１、ノイズ特性調整部１２および切り替え部１３の各機能は、処理回路により実現される。
すなわち、ハンズフリー制御装置２は、後述する図３に示すステップＳＴ１からステップＳＴ３までの処理を行うための処理回路を備える。
処理回路は、専用のハードウェアであっても、メモリに格納されたプログラムを読み出して実行するＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）であってもよい。

図３Ａに示すように処理回路が専用のハードウェアの処理回路１００である場合、処理回路１００は、例えば、単一回路、複合回路、プログラム化したプロセッサ、並列プログラム化したプロセッサ、ＡＳＩＣ（ＡｐｐｌｉｃａｔｉｏｎＳｐｅｃｉｆｉｃＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ）、ＦＰＧＡ（Ｆｉｅｌｄ−ＰｒｏｇｒａｍｍａｂｌｅＧａｔｅＡｒｒａｙ）、または、これらを組み合わせたものが該当する。
また、音声処理部１０Ａ〜１０Ｃ、判別部１１、ノイズ特性調整部１２および切り替え部１３の各部の機能をそれぞれ処理回路で実現してもよいし、各部の機能をまとめて１つの処理回路で実現してもよい。

図３Ｂに示すように処理回路がＣＰＵ１０１である場合、音声処理部１０Ａ〜１０Ｃ、判別部１１、ノイズ特性調整部１２および切り替え部１３の機能は、ソフトウェア、ファームウェアまたはソフトウェアとファームウェアとの組み合わせにより実現される。
ソフトウェアとファームウェアはプログラムとして記述され、メモリ１０２に格納される。ＣＰＵ１０１は、メモリ１０２に格納されたプログラムを読み出して実行することにより、各部の機能を実現する。すなわち、ハンズフリー制御装置２は、ＣＰＵ１０１によって実行されるときに、図４に示す各ステップの処理が結果的に実行されるプログラムを格納するためのメモリ１０２を備える。また、これらのプログラムは、音声処理部１０Ａ〜１０Ｃ、判別部１１、ノイズ特性調整部１２および切り替え部１３の手順または方法をコンピュータに実行させるものである。

ここで、メモリとは、例えば、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）、ＲＯＭ、フラッシュメモリ、ＥＰＲＯＭ（ＥｒａｓａｂｌｅＰｒｏｇｒａｍｍａｂｌｅＲＯＭ）、ＥＥＰＲＯＭ（ＥｌｅｃｔｒｉｃａｌｌｙＥＰＲＯＭ）などの不揮発性または揮発性の半導体メモリ、磁気ディスク、フレキシブルディスク、光ディスク、コンパクトディスク、ミニディスク、ＤＶＤ（ＤｉｇｉｔａｌＶｅｒｓａｔｉｌｅＤｉｓｋ）などが該当する。

なお、音声処理部１０Ａ〜１０Ｃ、判別部１１、ノイズ特性調整部１２および切り替え部１３の各機能について、一部を専用のハードウェアで実現し、一部をソフトウェアまたはファームウェアで実現してもよい。
例えば、音声処理部１０Ａ〜１０Ｃは、専用のハードウェアの処理回路１００でその機能を実現し、判別部１１、ノイズ特性調整部１２および切り替え部１３は、ＣＰＵ１０１が、メモリ１０２に格納されたプログラム実行することによりその機能を実現する。
このように、上記処理回路は、ハードウェア、ソフトウェア、ファームウェア、またはこれらの組み合わせによって前述の機能を実現することができる。

次に動作について説明する。
図４は、実施の形態１に係るハンズフリー制御装置２の動作を示すフローチャートであり、話者が発話音声を入力したマイクを判別してから通話相手に送信する信号を切り替えるまでの一連の処理を示している。なお、図４に示すステップＳＴ１からステップＳＴ３までの処理は繰り返し実施されるものとする。
まず、判別部１１は、音声信号ａ１の信号レベルとマイク５Ａ，５Ｂに対応する閾値レベルを比較し、音声信号ｂ１の信号レベルとマイク５Ｃに対応する閾値レベルとを比較する。そして、判別部１１は、信号レベルが閾値レベルよりも高く、音声信号ａ１と音声信号ｂ１とで信号レベルが高い方を選択し、選択した出力信号が得られたマイクを話者が発話音声を入力したマイクと判別する（ステップＳＴ１）。

なお、これまでの説明では、判別部１１が、マイク５Ａ〜５Ｃの入力信号の信号レベル（絶対音声振幅）を比較してマイクを判別する場合を示したが、マイク５Ａ〜５Ｃの入力信号を暗ノイズレベルで相対的に比較した結果に基づいて、判別してもよい。
例えば、判別部１１は、マイク５Ａ〜５Ｃの入力信号の信号レベルから暗ノイズレベルを引いた信号レベルを比較して、話者が発話音声を入力したマイクを判別してもよい。

マイク５Ａ〜５Ｃとして同じ特性のマイクを用いても、実際には個体差に起因した誤差が発生する。このため、図２に示した乗員Ａの方が乗員Ｂよりも大きい音声レベルであるにも拘わらず、上記誤差によって入力信号の絶対音声振幅が逆転して、話者が発話音声を入力したマイクとしてマイク５Ｃが判別される可能性がある。
そこで、判別部１１が、マイク５Ａ〜５Ｃの入力信号の信号レベルから暗ノイズレベルを引いた信号レベルを比較する。
このようにマイク５Ａ〜５Ｃの入力信号を暗ノイズレベルで相対的に比較することで、マイク５Ａ〜５Ｃの個体差に起因した誤判定を防止することができる。

なお、入力信号の信号レベルから暗ノイズレベルを引いた信号レベルを比較してその差が予め定めた値以上離れていた場合に、当該信号レベルが大きい方の入力信号が得られたマイクを、話者が発話音声を入力したマイクと判別してもよい。

例えば、マイク５Ａ，５Ｂの入力信号の信号レベルから暗ノイズレベルを引いた信号レベルが６０ｄＢであり、マイク５Ｃの入力信号の信号レベルから暗ノイズレベルを引いた信号レベルが５９ｄＢであった場合について説明する。
ここで、上記予め定めた値が１０ｄＢである場合、話者が発話音声を入力したマイクとしてマイク５Ｃが選択されていたとしても、信号レベルの差が１ｄＢであるため、マイク５Ａ，５Ｂの入力信号を送信対象に切り替えない。
一方、マイク５Ｃの入力信号の信号レベルから暗ノイズレベルを引いた信号レベルが、５０ｄＢであれば、マイク５Ａ，５Ｂの入力信号が送信対象に切り替えられる。
このようにすることで誤差レベルでの差異で切り替えが実施されなくなり、判別部１１の処理の信頼性を向上させることができる。

また、信号レベルの代わりにＳＮ比を比較してマイクを判別してもよい。
例えば、マイク５Ａ，５ＢにおけるＳＮ比とＳＮ比についての閾値、マイク５ＣにおけるＳＮ比とＳＮ比についての閾値を利用して信号レベルの場合と同様の比較処理を行う。
前述したように、音声信号ａ１，ｂ１はマイク特性に起因したレベルの差異がキャンセルされている。このような音声信号ａ１，ｂ１を比較することで、話者が発話音声を入力したマイクを適切に判別することが可能となる。

なお、判別部１１は、前述したような信号レベルの閾値またはＳＮ比の閾値を変更可能であってもよい。例えば、ユーザにより入力された値を上記閾値として設定してもよい。
また、一例として、信号レベル、ＳＮレベルの差の時間平均を観測して、この時間平均から特定のオフセットを加えた値を閾値とする。乗員Ａが話したときのマイク５Ａおよびマイク５ＢのＳＮ比とマイク５ＣのＳＮ比との差が平均７ｄＢであれば、そこからオフセット値３ｄＢを引いて得られる４ｄＢを閾値とする。このようにして動的に閾値を変更してもよい。

また、判別部１１は、話者が発話音声を入力したと判別したマイクの入力信号の信号レベルが、他のマイクの入力信号の信号レベル以下となってから予め定められた保持時間が経過するまで、他のマイクを、話者が発話音声を入力したマイクとして判別しないようにしてもよい。例えば、話者が発話音声を入力したマイクとしてマイク５Ａ，５Ｂが判別された後に、音声信号ａ１の信号レベルがマイク５Ｃの入力信号に起因する音声信号ｂ１の信号レベル以下となっても、上記保持時間が経過するまで通信装置３に出力する信号を、音声信号ａ３から音声信号ｂ３に切り替えない。
このようにすることで、通信装置３に出力する信号、すなわち通信相手に送信する信号が頻繁に切り替わることが防止され、確実に話者が変わったと判断されるときに切り替えを行うことができる。なお、保持時間としては、例えば、数百ミリ秒程度の時間が考えられる。

さらに、判別部１１は、音声信号ａ１，ｂ１の一方の信号レベルが下限閾値未満である場合、この音声信号が無音であると判断して、もう一方の音声信号が得られたマイクを、話者が発話音声を入力したマイクと判別してもよい。例えば、音声信号ａ１の信号レベルが無音レベルであると判断すると、音声信号ｂ１が得られたマイク５Ｃを、話者が発話音声を入力したマイクと判別する。これにより、通信相手に送信する信号が、音声信号ａ３から音声信号ｂ３に自動的に切り替えられる。このようにしても、話者が発話音声を入力したマイクを適切に判別することが可能となる。

次に、ノイズ特性調整部１２は、マイク５Ａ〜５Ｃの入力信号に含まれるノイズの特性が互いに揃うように周波数ごとに調整する（ステップＳＴ２）。
例えば、ノイズ特性調整部１２は、音声信号ａ２，ｂ２に対して高速フーリエ変換（ＦＦＴ）を行って音声信号ａ２，ｂ２の周波数スペクトルを得る。
そして、ノイズ特性調整部１２は、図５に示すように、音声信号ａ２，ｂ２の周波数スペクトルにおける、ロードノイズに対応する低周波数帯域を調整対象の周波数帯域ＢＷに設定する。この後、ノイズ特性調整部１２は、調整対象の周波数帯域ＢＷにおいて、図５において矢印で示すように、音声信号ａ２，ｂ２に含まれるノイズの特性が互いに揃うように予め定められた周波数幅ＲＢごとにノイズの振幅レベルを合わせる調整を行う。
これにより、ノイズ特性調整部１２からの音声信号ａ３，ｂ３に含まれるノイズの特性が互いに揃うので、音声信号ａ３，ｂ３のいずれかを通話相手に送信する信号に切り替えても、切り替え前後で通話相手が聞くノイズの質感の変化を軽減させることができる。

なお、ノイズに対応する周波数帯域のみを調整対象の周波数帯域ＢＷに設定する場合を示したが、発話音声の周波数帯域を含めて調整対象に設定してもよい。
例えば、ノイズと発話音声との差異が明確でない場合、発話音声およびノイズの特性を互いに揃える。このようにしても、切り替え前後で通話相手が聞くノイズの質感の変化を軽減させることができる。

また、ノイズ特性調整部１２は、調整対象の周波数帯域ＢＷの設定変更が可能であってもよい。例えば、図６に示すように、調整対象の周波数帯域ＢＷ１を設定してから、音声信号ａ２，ｂ２のうち、いずれかに含まれるノイズのレベルが閾値レベルＴｈを超える周波数帯域ＢＷ２のみを調整対象の周波数帯域に変更する。上記の閾値レベルＴｈを通話相手が聞き取れる下限レベルとすることで、ノイズ特性の調整が必要な周波数帯域のみを調整対象として選択することが可能となり、ノイズ特性を適切に揃えることができる。

また、車両の走行に伴って発生するノイズには、ロードノイズの他にパターンノイズ、空洞共鳴音などがある。パターンノイズは、タイヤ溝における空気の圧縮と開放によって生じるノイズであり、ロードノイズよりも高音域のノイズとなる。また、空洞共鳴音は、タイヤ内部に充填された空気の振動により発生するノイズであり、こちらもロードノイズよりも高音域の乾いた音となる。
そこで、ノイズ特性調整部１２は、これらのロードノイズ以外のノイズの特性も揃える場合、パターンノイズおよび空洞共鳴音に対応するより高周波数帯域の成分を調整対象の周波数帯域ＢＷに設定する。
このようにすることで、実際のノイズ環境に応じてノイズの特性を適切に揃えることが可能となる。

さらに、ノイズ特性調整部１２は、周波数幅ＲＢの設定変更が可能であってもよい。
例えば、ロードノイズのレベルが閾値以上となる走行環境では、ノイズの特性を細かく調整するために周波数幅ＲＢを一律狭くする。一方、ロードノイズのレベルが閾値未満の走行環境では、調整処理の演算負担を軽くするため、周波数幅ＲＢを一律広くする。
このようにすることで、ノイズの特性を適切に揃えることが可能となる。

なお、周波数幅ＲＢは一定幅で変更するのみならず、異なる幅に変更してもよい。
例えば、図７に示すように、調整対象の周波数帯域ＢＷのうち、ノイズレベルの変動量が予め定めた閾値よりも大きい周波数帯域において周波数幅ＲＢ２から周波数幅ＲＢ１に変更して周波数幅を狭くする。このようにすることで、ノイズレベルの変動が激しい部分で細かく特性を揃えることができ、音声信号ａ２，ｂ２におけるノイズ特性の差異を適切になくすことができる。

次に、切り替え部１３は、ノイズ特性調整部１２によってノイズの特性が調整されたマイク５Ａ〜５Ｃの入力信号のうち、判別部１１によって判別されたマイクの入力信号を、通話相手に送信する信号に切り替える（ステップＳＴ３）。
例えば、判別部１１によってマイク５Ａ，５Ｂが判別された場合、音声信号ａ３を通信装置３へ出力し、判別部１１によってマイク５Ｃが判別された場合には、音声信号ｂ３を通信装置３へ出力する。
通信装置３は、切り替え部１３から入力した音声信号を、近距離無線通信で携帯電話機４Ａに送信する。携帯電話機４Ａは、携帯電話回線を介して音声信号を携帯電話機４Ｂに送信する。これにより、通話相手が、車両２０の話者の発話音声を聞くことができる。

以上のように、実施の形態１に係るハンズフリー制御装置２は、図１に示す構成を有しており、マイク５Ａ〜５Ｃの入力信号に含まれるノイズの特性が互いに揃うように周波数ごとに調整している。このように構成することで、通話相手の携帯電話機４Ｂに送信するマイク５Ａ〜５Ｃの入力信号を切り替えたときに通話相手が聞くノイズの質感の変化を軽減させることができる。

また、実施の形態１に係るハンズフリー制御装置２において、判別部１１は、マイク５Ａ〜５Ｃの入力信号の信号レベルから暗ノイズレベルを引いた信号レベルを比較して、話者が発話音声を入力したマイクを判別する。このように構成することで、マイク５Ａ〜５Ｃの個体差に起因した誤判定を防止することができる。

さらに、実施の形態１に係るハンズフリー制御装置２において、ノイズ特性調整部１２は、入力信号に含まれるノイズの特性を、調整対象の周波数帯域ＢＷにおいて予め定められた周波数幅ＲＢごとに調整する。このようにすることで、音声信号ａ３，ｂ３のいずれかを通話相手に送信する信号に切り替えても、切り替え前後で通話相手が聞くノイズの質感の変化を軽減させることができる。

さらに、実施の形態１に係るハンズフリー制御装置２において、ノイズ特性調整部１２の調整対象の周波数帯域ＢＷは、設定変更が可能である。このようにすることで、ノイズの特性を適切に揃えることが可能となる。

さらに、実施の形態１に係るハンズフリー制御装置２において、周波数幅ＲＢは、設定変更が可能である。このようにすることで、ノイズの特性を適切に揃えることが可能となる。

さらに、実施の形態１に係るハンズフリー制御装置２において、ノイズ特性調整部１２は、調整対象の周波数帯域ＢＷのうち、ノイズレベルの変動量が予め定められた閾値よりも大きい周波数帯域における周波数幅ＲＢを狭くする。
このようにすることで、ノイズレベルの変動が大きい部分で細かく特性を揃えることができ、音声信号ａ２，ｂ２におけるノイズ特性の差異を適切になくすことができる。

さらに、実施の形態１に係るハンズフリー制御装置２において、判別部１１は、話者が発話音声を入力したと判別したマイクの入力信号の信号レベルが他のマイクの入力信号の信号レベル以下となってから予め定められた保持時間が経過するまで、他のマイクを、話者が発話音声を入力したマイクとして判別しない。このようにすることで、通信相手に送信する信号が頻繁に切り替わることが防止され、確実に話者が変わったと判断されるときに切り替えを行うことができる。

なお、本発明はその発明の範囲内において、実施の形態の任意の構成要素の変形、もしくは実施の形態の任意の構成要素の省略が可能である。

この発明に係るハンズフリー制御装置は、マイクの入力信号の切り替わりによるノイズの質感の変化を軽減させることができるので、車載用のハンズフリー通話システムに好適である。

１ハンズフリー通話システム、２ハンズフリー制御装置、３通信装置、４Ａ，４Ｂ携帯電話機、５Ａ〜５Ｃマイク、６アンプ、７Ａ，７Ｂスピーカ、１０Ａ〜１０Ｃ音声処理部、１１判別部、１２ノイズ特性調整部、１３切り替え部、２０車両、１００処理回路、１０１ＣＰＵ、１０２メモリ。

Claims

複数のマイクの中から、話者が発話音声を入力したマイクを判別する判別部と、
前記複数のマイクの入力信号に含まれるノイズの特性が互いに揃うように周波数ごとに調整するノイズ特性調整部と、
前記ノイズ特性調整部によってノイズの特性が調整された前記複数のマイクの入力信号のうち、前記判別部によって判別されたマイクの入力信号を、通話相手に送信する信号に切り替える切り替え部と
を備えたことを特徴とするハンズフリー制御装置。
前記判別部は、マイクの入力信号の信号レベルから暗ノイズレベルを引いた信号レベルを比較して、話者が発話音声を入力したマイクを判別することを特徴とする請求項１記載のハンズフリー制御装置。
前記ノイズ特性調整部は、入力信号に含まれるノイズの特性を、調整対象の周波数帯域において予め定められた周波数幅ごとに調整することを特徴とする請求項１記載のハンズフリー制御装置。
前記ノイズ特性調整部の前記調整対象の周波数帯域は、設定変更が可能であることを特徴とする請求項３記載のハンズフリー制御装置。
前記周波数幅は、設定変更が可能であることを特徴とする請求項３記載のハンズフリー制御装置。
前記ノイズ特性調整部は、前記調整対象の周波数帯域のうち、ノイズレベルの変動量が予め定められた閾値よりも大きい周波数帯域における前記周波数幅を狭くすることを特徴とする請求項５記載のハンズフリー制御装置。
前記判別部は、判別したマイクの入力信号の信号レベルが他のマイクの入力信号の信号レベル以下となっても保持時間が経過するまでの間、前記他のマイクを、話者が発話音声を入力したマイクと判別しないことを特徴とする請求項１記載のハンズフリー制御装置。