WO2022059214A1

WO2022059214A1 - 車載装置及び車載システム

Info

Publication number: WO2022059214A1
Application number: PCT/JP2020/035642
Authority: WO
Inventors: 晋明鍜治本
Original assignee: 株式会社デンソーテン
Priority date: 2020-09-18
Filing date: 2020-09-18
Publication date: 2022-03-24
Also published as: JPWO2022059214A1; JP7557542B2

Abstract

車載装置（２０）は、スピーカ（ＳＰ２）と、スピーカ（ＳＰ２）の出力音量を制御する音量制御部と、を備える。音量制御部は、他の車載装置（１０）にて車両の乗員の発話による音声入力処理が実行されており、且つ、スピーカ（ＳＰ２）での出力対象とされる対象音響信号の内容が、他の車載装置（１０）により車両内の他のスピーカ（ＳＰ１）での出力対象とされる他の音響信号の内容と相違するとき、そうでないときと比べてスピーカ（ＳＰ２）の出力音量を低下させる、スピーカ（ＳＰ２）の出力音量を所定音量に設定する、又は、スピーカ（ＳＰ２）を消音させる。

Description

車載装置及び車載システム

　本発明は、車載装置及び車載システムに関する。

　音声入力処理により音声操作が可能な車載装置が提案されている。発話者（運転手等）は発話により様々な指示又は問い合わせ等を車載装置に行う。車載装置では、音声認識を通じ、指示又は問い合わせ等に応答する処理を実行する。例えば、「ＡＢＣ駅を目的地に設定して」という発話があった場合、車載装置は「了解しました。ＡＢＣ駅を目的地に設定します」という音声応答を行うと共に、ＡＢＣ駅を目的地に設定したナビゲーション動作を行う。この種の車載装置では、一般に、車内スピーカの出力音が音声入力用のマイクロホンに戻ることによるエコーをキャンセルする機能（エコーキャンセラ）が設けられる。

　他方、車内には複数の車載装置（例えばヘッドユニットとして機能する車載装置とリアシートエンタテイメント機器として機能する車載装置）、及び、複数の車載装置に対応付けられた複数のスピーカが設けられることもあり、複数のスピーカにて互いに異なる内容の音響信号が再生されることがある。

特開２００１－２３６０９０号公報特開平７－４６５００号公報

　音声入力処理を担う車載装置が直接出力制御を行うスピーカからの出力音成分は、エコーキャンセラの機能により、マイクロホンの出力音響信号から除去することができる。しかしながら、他のスピーカが別個の音響信号を再生出力している場合などにあっては、他のスピーカの出力音に対してエコーキャンセラが有効に働かず、他のスピーカの出力音が音声認識にとっての雑音になる。この際、音声認識及び音声認識に基づく音声入力処理が正しく動作しないことが懸念される。

　本発明は、正常な音声入力処理の実行に寄与する車載装置及び車載システムを提供することを目的とする。

　本発明に係る車載装置は、車両に設置される車載装置であって、スピーカと、前記スピーカの出力音量を制御する音量制御部と、を備え、前記音量制御部は、他の車載装置にて前記車両の乗員の発話による音声入力処理が実行されており、且つ、前記スピーカでの出力対象とされる対象音響信号の内容が、前記他の車載装置により前記車両内の他のスピーカでの出力対象とされる他の音響信号の内容と相違するとき、そうでないときと比べて前記出力音量を低下させる、前記出力音量を所定音量に設定する、又は、前記スピーカを消音させる構成（第１の構成）である。

　上記第１の構成に係る車載装置において、前記音量制御部は、前記他の車載装置にて前記音声入力処理が実行されていないとき、又は、前記対象音響信号の内容が前記他の音響信号の内容と同一であるとき、前記出力音量を、与えられた音量設定情報に基づく音量に設定し、前記他の車載装置にて前記音声入力処理が実行されており且つ前記対象音響信号の内容が前記他の音響信号の内容と相違するとき、前記出力音量を前記音量設定情報に基づく音量より低下させる、前記音量設定情報に関わらず前記出力音量を前記所定音量に設定する、又は、前記スピーカを消音させる構成（第２の構成）であっても良い。

　上記第１又は第２の構成に係る車載装置において、前記他の車載装置では、前記発話による音を受けるマイクロホンへの入力音響信号に基づき前記発話の内容に対する音声認識を実行し、前記音声入力処理は前記音声認識の結果に基づいて実行され、前記音声認識は、前記マイクロホンへの入力音響信号における前記他の音響信号の成分を抑制してから実行される構成（第３の構成）であっても良い。

　本発明に係る車載システムは、上記第１～第３の構成の何れかに係る車載装置と、他の車載装置と、を備えた構成（第４の構成）である。

　本発明に係る他の車載装置は、車両に設置される車載装置であって、前記車両の乗員の発話による音を受けるマイクロホンと、前記発話の内容に対して音声認識を実行する音声認識部と、前記発話による音声入力処理を起動させる音声入力起動部と、前記音声入力処理が実行されているとき、前記音声認識の結果に基づき前記発話の内容に対して応答する応答処理部と、音響信号の供給により前記車両内のスピーカに音を出力させる音響信号処理部と、前記車両に設置された他の車載装置に対し制御信号を送信する他装置制御部と、を備え、前記他装置制御部は、前記音声入力処理が実行されており、且つ、前記車両内のスピーカでの出力対象となる対象音響信号の内容が前記他の車載装置における他のスピーカでの出力対象となる他の音響信号の内容と相違するとき、そうでないときと比べて前記他のスピーカの出力音量を低下させる制御信号、前記出力音量を所定音量に設定する制御信号、又は、前記他のスピーカを消音させる制御信号を、前記他の車載装置に送信する構成（第５の構成）である。

　上記第５の構成に係る車載装置において、前記マイクロホンへの入力音響信号に含まれる前記対象音響信号の成分を抑制することで前記入力音響信号に基づく抑制後音響信号を生成するエコー抑制部を更に備え、前記音声認識部は、前記抑制後音響信号に基づいて前記音声認識を実行する構成（第６の構成）であっても良い。

　本発明に係る他の車載システムは、上記第５又は第６の構成に係る車載装置と、他の車載装置と、を備えた構成（第７の構成）である。

　本発明によれば、正常な音声入力処理の実行に寄与する車載装置及び車載システムを提供することが可能である。

は、本発明の実施形態に係る車両に関し、車内の様子を概略的に示す図である。は、本発明の実施形態に係る車載システムの全体構成図である。は、本発明の実施形態に係る前席ユニットの内部構成図である。は、図３に示される主処理部の一部機能ブロック図である。は、図３に示される主処理部の一部機能ブロック図である。は、本発明の実施形態に係る後席ユニットの内部構成図である。は、図６に示される主処理部の一部機能ブロック図である。は、本発明の実施形態に係り、後席ユニットで生成される音量抑制指令信号を説明するための図である。は、本発明の実施形態に属ずる第１実施例に係り、第１ケースでの音響信号の流れを示す図である。は、本発明の実施形態に属ずる第１実施例に係り、第２ケースでの音響信号の流れを示す図である。

　以下、本発明の実施形態の例を、図面を参照して具体的に説明する。参照される各図において、同一の部分には同一の符号を付し、同一の部分に関する重複する説明を原則として省略する。尚、本明細書では、記述の簡略化上、情報、信号、物理量又は部材等を参照する記号又は符号を記すことによって、該記号又は符号に対応する情報、信号、物理量又は部材等の名称を省略又は略記することがある。例えば、後述の“１０”によって参照される前席ユニットは（図１参照）、前席ユニット１０と表記されることもあるし、ユニット１０と略記されることもあり得るが、それらは全て同じものを指す。

　図１に本発明の実施形態に係る車両ＣＲの車内の様子を概略的に示す。図２に本発明の実施形態に係る車載システムＳＹＳの全体構成を示す。車内又は車両内とは車両ＣＲの車室内を指す。ここでは、車両ＣＲとして路面上を走行可能な車両（自動車等）を主として想定するが、車両ＣＲは任意の種類の車両であって良い。車両ＣＲに対し複数の乗員が搭乗できる。車両ＣＲの車内には座席ＳＴ１～ＳＴ３が設けられる。座席ＳＴ１は車両ＣＲの運転手が座る運転席である。図１において乗員ＰＳ１は車両ＣＲの運転手を表す。このため、乗員ＰＳ１は運転手ＰＳ１と称されることがある。また、運転手以外の乗員は同乗者と称されることがある。運転席ＳＴ１から車両ＣＲのステアリングホイールＳＴＲに向かう向きを「前方」と定義し、車両ＣＲのステアリングホイールＳＴＲから運転席ＳＴ１に向かう向きを「後方」と定義する。また、本実施形態において左、右とは、特に記述なき限り、運転席ＳＴ１に前を向いて座る運転手ＰＳ１から見た左、右を指す。

　座席ＳＴ１の左側に座席ＳＴ２（助手席）が設置され、座席ＳＴ１及びＳＴ２の後方に座席ＳＴ３（以下、後部座席ＳＴ３と称することがある）が設けられる。座席ＳＴ２及びＳＴ３の夫々に運転手ＰＳ１以外の乗員（即ち同乗者）が座ることができる。図１の例において、座席ＳＴ３は複数の乗員が座ることのできる幅広座席となっている。図１において乗員ＰＳ２は後部座席ＳＴ３に座る同乗者である。車両ＣＲに乗員ＰＳ１及びＰＳ２以外の乗員が更に乗車していても良いが、ここでは乗員ＰＳ１及びＰＳ２にのみ注目する。

　本実施形態に係る車載システムＳＹＳは（図２参照）、車両ＣＲに搭載されるシステムであって、運転手ＰＳ１用の電子機器である前席ユニット１０と、後部座席ＳＴ３に座る乗員用の電子機器である後席ユニット２０と、車内スピーカＳＰ１と、を備える。ユニット１０及び２０並びに車内スピーカＳＰ１は車両ＣＲの車内に設置される。

　前席ユニット１０に設けられた表示部を運転手ＰＳ１が容易に視認可能となるように、前席ユニット１０は運転席ＳＴ１の前方に設置される。後席ユニット２０に設けられた表示部を後部座席ＳＴ３に座る乗員（ここでは乗員ＰＳ２）が容易に視認可能となるように、後席ユニット２０は座席ＳＴ１及びＳＴ２の後方側であって且つ座席ＳＴ３の前方側に設置される。例えば、後席ユニット２０の筐体は車両ＣＲの天板に支持されて良い。車載システムＳＹＳにおいて、前席ユニット１０は所謂ヘッドセット機器として機能するものであって良く、後席ユニット２０は所謂リアシートエンターテイメント（ＲＳＥ）機器として機能するものであって良い。

　車内スピーカＳＰ１は車両ＣＲの車内の適所に設置される。図１では、単体のスピーカが車内スピーカＳＰ１として示されているが、複数のスピーカにて車内スピーカＳＰ１が構成されていても良い。

　車両ＣＲ内に形成されたローカルエリアネットワークを通じて、図２に示す如く、ユニット１０及び２０は無線又は有線接続されて互いに双方向通信が可能であり、且つ、前席ユニット１０及び車内スピーカＳＰ１は無線又は有線接続されて前席ユニット１０から車内スピーカＳＰ１への信号送信が可能である。

　図３に前席ユニット１０の内部構成を示す。前席ユニット１０は、運転手ＰＳ１が視認可能な表示部１１と、運転手ＰＳ１からの各種操作を受ける操作部１２と、主処理部１３と、前席ユニット１０以外の任意の機器と通信を行うための通信部１４と、自身が収音した音を音響信号に変換して出力するマイクロホン１５と、を備える。通信部１４を用いた通信の相手側機器には後席ユニット２０及び車内スピーカＳＰ１が含まれる。更に、通信部１４は、所定の移動体通信回線を介してインターネットを含む情報通信網に接続可能であっても良く、この場合、情報通信網に接続された任意の装置との間で双方向通信が可能である。

　主処理部１３は、マイクロコンピュータ、メモリ、及び、ＤＳＰ（Digital Signal Processor）を含む信号処理回路等からなる。主処理部１３において、メモリはＲＯＭ（Read　Only　Memory）及びＲＡＭ（Random　Access　Memory）を含み、メモリに格納されたプログラムをマイクロコンピュータにて実行することで各種の機能を実現する。主処理部１３にて実現される機能には、車両ＣＲによる目的地までの移動を支援するナビゲーション機能、車両ＣＲの運転操作を支援する運転支援機能、提供された動画像を再生する動画像再生機能、任意の音源からの音響信号を再生するオーディオ機能、発話者の発話による入力を受け付けて発話者の発話内容に対して応答する音声入力機能などが含まれる。音声入力機能を実現するための処理に音声入力処理が含まれる。

　図４に、音声入力処理に関与する音声入力部１１０の構成を示す。音声入力部１１０は主処理部１３に設けられる。音声入力部１１０は、フロントエンド１１１、ＥＣＮＲ１１２（エコー抑制部）、音声認識部１１３、応答処理部１１４及び音声入力起動部１１５を備える。

　マイクロホン１５は、自身の周辺音を収音し、収音した音を音響信号Ｓｉｇ０１に変換して出力する。音響信号Ｓｉｇ０１はフロントエンド１１１に入力される。音響信号Ｓｉｇ０１はアナログの音響信号である。フロントエンド１１１はアンプ及びアナログ／デジタル変換器を有する。フロントエンド１１１において、アンプによりアナログの音響信号Ｓｉｇ０１を増幅し、増幅後のアナログの音響信号Ｓｉｇ０１をアナログ／デジタル変換器によりデジタルの音響信号Ｓｉｇ０２に変換する。

　マイクロホン１５は、発話者の発話による音を受け、主として発話者の発話内容を収音する。音声入力処理において、発話者は、発話によって前席ユニット１０を操作する操作者として機能し、発話により前席ユニット１０に対し任意の指示又は問い合わせ等を音声入力することができる。ここにおける発話者は車両ＣＲの何れかの乗員である。発話者は運転手ＰＳ１以外の乗員であっても良いが、ここでは、発話者は運転手ＰＳ１であるとする。即ち、マイクロホン１５の収音対象は主として運転手ＰＳ１の発話の音声である。しかしながら、発話者から直接発せられる発話音以外の音（以下、雑音と称する）もマイクロホン１５に到達することがある。主だった雑音としてエコーがある。ここにおけるエコーとは、マイクロホン１５にて収音される、エコー対象スピーカからの出力音を指す。エコー対象スピーカは車内スピーカＳＰ１を含む。

　ＥＣＮＲ１１２は、音響信号Ｓｉｇ０２に含まれる雑音を除去することで音響信号Ｓｉｇ０３を生成する処理（エコーキャンセル及びノイズリダクション処理）を実行する。除去の対象となる雑音は上述のエコーを含み、エコー以外の雑音もＥＣＮＲ１１２で除去される。より具体的には、ＥＣＮＲ１１２は、エコー対象スピーカからの出力音に応じたリファレンス信号Ｓｉｇ＿ｒｅｆを参照し、音響信号Ｓｉｇ０２からリファレンス信号Ｓｉｇ＿ｒｅｆの成分を除去することで、エコーが抑制された音響信号である音響信号Ｓｉｇ０３を生成する。リファレンス信号Ｓｉｇ＿ｒｅｆは、エコー対象スピーカからの出力音がマイクロホン１５に入力されたときに、エコー対象スピーカからの出力音に基づきマイクロホン１５の出力音響信号に含まれることになる音響信号を推測したものである。故に、音響信号Ｓｉｇ０２からリファレンス信号Ｓｉｇ＿ｒｅｆの成分を除去することで、音響信号Ｓｉｇ０２からエコー対象スピーカの出力音を表す音響信号の成分が除去される。尚、ここにおける除去とは、完全なる除去を意味する他、部分的な除去も含む概念であり、除去を低減と読み替えても良い。エコーを抑制する信号処理自体は公知であるので、その処理内容の詳細な説明は省略する。

　音声認識部１１３は、音響信号Ｓｉｇ０３に基づき発話者（ここでは運転手ＰＳ１）の発話内容を認識する音声認識処理を実行する。音声認識処理による発話者の発話内容の認識を音声認識とも称する。音声認識により発話者の発話内容がテキストデータ（文字列データ）に変換される。

　応答処理部１１４は、音声認識にて得られたテキストデータに基づいて発話者の意図を理解し、音声入力処理において、運転手ＰＳ１の発話内容に応答する応答処理を実行する。音声入力処理が実行されている場合にのみ応答処理が実行され、音声入力処理が実行されていない場合には応答処理は実行されない。

　音声入力起動部１１５は、音声入力処理の起動の有無を制御する。音声入力処理の起動の有無の制御は、音声入力処理を実行させるか否かの制御と等価である。前席ユニット１０の初期状態では音声入力処理は起動していないものとする（即ち実行されていないものとする）。音声入力起動部１１５は、所定の起動条件が成立したときに音声入力処理を起動させる。音声入力処理が起動されることで、音声入力処理が実行されていない状態から音声入力処理が実行されている状態へと遷移する。音声入力処理では、発話者の発話による音声を前席ユニット１０への入力操作として受け付けて入力操作に対する応答を行う。

　例えば、発話者によるウェイクアップキーワードの発話があったときに起動条件が成立する。ウェイクアップキーワードは音声入力部１１０に対して予め登録されたキーワードである。より具体的には例えば、音声入力起動部１１５は、音声認識部１１３にて得られたテキストデータにウェイクアップキーワードが含まれているか否かを判定し、当該テキストデータにウェイクアップキーワードが含まれている場合に音声入力処理を起動させる。或いは例えば、操作部１２に対して所定の起動操作が入力されたときに起動条件が成立するようにしても良い。

　音声入力処理の起動後、所定の終了条件が成立すると、音声入力起動部１１５により音声入力処理が実行されていない状態に戻される。終了条件は任意である。例えば、発話者（ここでは運転手ＰＳ１）の一連の発話内容に対する応答処理が完了したと判断されたとき（この判断の主体は応答処理部１１４又は音声入力起動部１１５であって良い）、終了条件が成立しても良いし、操作部１２に対して所定の終了操作が入力されたとき、終了条件が成立しても良い。

　音声入力処理の起動後、発話者（ここでは運転手ＰＳ１を想定）は前席ユニット１０を音声操作することができる。応答処理における応答は、発話者に対する音声応答及び表示応答の少なくとも一方を含んでいて良い。音声応答は、応答用スピーカからの音声出力により実現される。応答用スピーカは典型的には車内スピーカＳＰ１であって良いが、車内スピーカＳＰ１及び後述の後席スピーカＳＰ２（図６参照）の何れとも異なる、前席ユニット１０に備え付けられた他のスピーカ（不図示）であっても良い。この場合、音声応答によるエコーを抑制するべく、上記他のスピーカも上記エコー対象スピーカに含められ、音声応答による音響信号がリファレンス信号Ｓｉｇ＿ｒｅｆに含められる。表示応答は、前席ユニット１０の表示部１１での文字や画像の表示により実現される。

　例えば、応答処理では、発話者（ここでは運転手ＰＳ１）の発話内容に応じて、天候情報、ニュース、店舗又は観光地などの情報を音声応答又は表示応答により発話者に提供する。また例えば、主処理部１３がナビゲーション動作を実行可能に構成されている場合において、発話者（ここでは運転手ＰＳ１）が目的地の設定を指示する発話を行ったとき、応答処理では、当該指示に従いナビゲーション動作での目的地を設定する。ナビゲーション動作では、車両ＣＲの現在地から目的地までの走行予定ルートを設定し、地図画像上に走行予定ルートを重畳した画像を表示部１１に表示する。

　更に例えば、主処理部１３は制御対象機器の制御を行う機能を有していても良く、この場合、応答処理は制御対象機器の制御を含み得る。制御対象機器は、車両ＣＲに搭載された機器（但しユニット１０及び２０並びに車内スピーカＳＰ１とは異なる）であって、主処理部１３により動作が制御される機器である。例えば、車外を照らす車外用照明装置（ヘッドライト等）、車室内を照らす車内用照明装置、車両ＣＲのフロントガラスに付着した水や汚れを払拭するためのワイパー、車室内の温度及び湿度を調整するエアコンディショナが、制御対象機器に該当しうる。ワイパーを例にとれば、音声入力処理の起動後、発話者から「ワイパーをオンにして」という発話があった場合、応答処理部１１４は、応答処理として、「了解しました」という音声出力による音声応答を行うと共に（この際、表示応答も行っても良い）、ワイパーを作動させる。

　以下のように考えることもできる。主処理部１３の動作モードを非音声入力モード及び音声入力モードを含む複数のモードの何れかに設定する動作モード設定部（不図示）が主処理部１３に設けられ、主処理部１３の動作モードが非音声入力モードに設定されているときには音声入力処理は非実行とされ、主処理部１３の動作モードが音声入力モードに設定されているときには音声入力処理が実行される。つまり、音声入力起動部１１５が動作モード設定部に相当すると考えることができ、主処理部１３の動作モードが非音声入力モードであるときにおいて所定の起動条件が成立すると、主処理部１３の動作モードを非音声入力モードから音声入力モードに切り替える。その後、所定の終了条件が成立すると、主処理部１３の動作モードを非音声入力モードに戻す。このように考えた場合、応答処理部１１４は、音声入力モードにおいて、音声認識の結果に基づき発話者の発話内容に対して応答する応答処理を実行する、と言える。

　図５に主処理部１３における音響信号出力に関わる一部機能ブロック図を示す。主処理部１３には音響信号処理部１２０及びＲＳＥ音量干渉部１３０（他装置制御部）が設けられる。

　音響信号処理部１２０には音響信号Ｓｉｇ１１が入力される。音響信号処理部１２０は、音響信号Ｓｉｇ１１に対して所定の信号処理を施し、該信号処理後の音響信号Ｓｉｇ１１を音響信号Ｓｉｇ１２として出力する。但し、音響信号Ｓｉｇ１１及びＳｉｇ１２は互いに同じ信号であっても構わない。ここでは、音響信号Ｓｉｇ１１及びＳｉｇ１２は実質的に同じ内容を有した信号であるとする（それらの振幅は異なり得る）。音響信号Ｓｉｇ１２は車内スピーカＳＰ１に出力される。

　車内スピーカＳＰ１は音響信号Ｓｉｇ１２を音（音波）として出力する。上述の如く車内スピーカＳＰ１はエコー対象スピーカに含まれているため、車内スピーカＳＰ１からの出力音を表す音響信号Ｓｉｇ１１又はＳｉｇ１２そのものが、或いは、音響信号Ｓｉｇ１１又はＳｉｇ１２に基づく信号が、リファレンス信号Ｓｉｇ＿ｒｅｆ（図４参照）に含められる。尚、車内スピーカＳＰ１は前席ユニット１０の構成要素に含まれていても良い。

　ＲＳＥ音量干渉部１３０は、後席ユニット２０に設けられるスピーカ（後述の後席スピーカＳＰ２：図６参照）の出力音に干渉する機能を持つが、詳細は後述される。

　図６に後席ユニット２０の内部構成を示す。後席ユニット２０は、乗員ＰＳ２が視認可能な表示部２１と、乗員ＰＳ２からの各種操作を受ける操作部２２と、主処理部２３と、後席ユニット２０以外の任意の機器と通信を行うための通信部２４と、後席スピーカＳＰ２と、を備える。通信部２４を用いた通信の相手側機器には、少なくとも前席ユニット１０が含まれる。更に、通信部２４は、所定の移動体通信回線を介してインターネットを含む情報通信網に接続可能であっても良く、この場合、情報通信網に接続された任意の装置との間で双方向通信が可能である。ユニット１０及び２０間の任意の信号の送受信は通信部１４及び２４を用いて実現されるが、以下の信号送受信に関わる説明では、通信部１４又は２４の記述が省略されることがある。

　主処理部２３は、マイクロコンピュータ、メモリ、及び、ＤＳＰ（Digital Signal Processor）を含む信号処理回路等からなる。主処理部２３において、メモリはＲＯＭ（Read　Only　Memory）及びＲＡＭ（Random　Access　Memory）を含み、メモリに格納されたプログラムをマイクロコンピュータにて実行することで各種の機能を実現する。

　図７に、後席スピーカＳＰ２の出力制御に関わる、主処理部２３の一部機能ブロック図を示す。主処理部２３は、音響信号処理部２１０、音量制御部２２０、及び、音量抑制指令部２３０を備える。音響信号処理部２１０には音響信号Ｓｉｇ２１が入力される。音響信号Ｓｉｇ２１は、前席ユニット１０から受信した音響信号であっても良いし、前席ユニット１０以外の装置又は記録媒体から取得した音響信号であっても良いし、主処理部２３内で生成された音響信号であっても良い。音響信号処理部２１０は、音響信号Ｓｉｇ２１に対して所定の信号処理を施し、該信号処理後の音響信号Ｓｉｇ２１を音響信号Ｓｉｇ２２として出力する。音響信号Ｓｉｇ２２は後席スピーカＳＰ２に出力される。後席スピーカＳＰ２は音響信号Ｓｉｇ２２を音（音波）として出力する。

　後席スピーカＳＰ２からの出力音の音量（後席スピーカＳＰ２の出力音量と称することがある）は音量制御部２２０により制御される。音響信号処理部２１０は、音量制御部２２０の制御の下で、音響信号Ｓｉｇ２１の振幅を調整する振幅調整処理を実行可能であり、音響信号Ｓｉｇ２１に対して振幅調整処理を施すことで得られる音響信号（即ち、振幅調整処理による振幅調整後の音響信号Ｓｉｇ２１）を音響信号Ｓｉｇ２２として出力する。

　音響信号Ｓｉｇ２２は、後席スピーカＳＰ２から出力されるべき音を電気信号で表したものであるので、音響信号Ｓｉｇ２２の振幅が大きくなるほど後席スピーカＳＰ２の出力音量も大きくなり、音響信号Ｓｉｇ２２の振幅が小さくなるほど後席スピーカＳＰ２の出力音量も小さくなる。ここでは、音響信号処理部２１０は、振幅調整処理において音響信号Ｓｉｇ２１の振幅をｋ_AMP倍することで音響信号Ｓｉｇ２２を生成するものとする。故に、係数ｋ_AMPが大きくなるほど後席スピーカＳＰ２の出力音量も大きくなる。

　音量制御部２２０は音量設定情報ＶＯＬ^*と音量抑制指令信号ＭＴ^*とに基づき、後席スピーカＳＰ２の出力音量を制御する。音量制御部２２０は、係数ｋ_AMPの値を指定することで後席スピーカＳＰ２の出力音量を制御することができる。音量抑制指令信号ＭＴ^*は、アクティブの信号状態（例えばハイレベル）又はノンアクティブの信号状態（例えばローレベル）をとる二値化信号である。

　音量抑制指令信号ＭＴ^*がノンアクティブの信号状態にあるとき、音量抑制指令信号ＭＴ^*は無効であり、音量制御部２２０は音量設定情報ＶＯＬ^*のみに基づいて係数ｋ_AMPの値を設定する（故に、後席スピーカＳＰ２の出力音量は音量設定情報ＶＯＬ^*に基づく音量に設定される）。音量設定情報ＶＯＬ^*は１以上ｎ以下の整数の何れかの値とるものとし、音量設定情報ＶＯＬ^*の値が増大するほど係数ｋ_AMPの値が増大するものとする。ｎは２以上の任意の整数である。故に、音量抑制指令信号ＭＴ^*がノンアクティブの信号状態にある場合、音響信号Ｓｉｇ２１が一定であると仮定すれば、音量設定情報ＶＯＬ^*の値が大きくなるほど係数ｋ_AMPの増大を通じて後席スピーカＳＰ２の出力音量も大きくなり、音量設定情報ＶＯＬ^*の値が小さくなるほど係数ｋ_AMPの低下を通じて後席スピーカＳＰ２の出力音量も小さくなる。

　音量設定情報ＶＯＬ^*の値は後席ユニット２０の操作部２２に対する入力操作に基づいて決定されて良い。操作部２２は、後席ユニット２０に対して有線又は無線で接続されたリモートコントローラや任意の端末装置にて実現されても良い。表示部２１にてタッチパネルが形成される場合、タッチパネルが操作部２２として機能しても良い。或いは、前席ユニット１０の操作部１２に対する入力操作に基づいて音量設定情報ＶＯＬ^*の値が決定されるようにしても良い。

　尚、後席ユニット２０は、表示部２１におけるディスプレイ（映像を表示する表示画面）を振動させることで音を出力するディスプレイスピーカ機能を有していて良い。この場合、表示部２１におけるディスプレイが後席スピーカＳＰ２として機能し、音響信号Ｓｉｇ２２に基づいてディスプレイが振動することで音響信号Ｓｉｇ２２に基づく音がディスプレイから出力される。勿論、後席スピーカＳＰ２は表示部２１とは別個独立に設けられたスピーカであっても良い。後席スピーカＳＰ２は後席ユニット２０の外部に設けられたスピーカであっても良い。

　音量抑制指令信号ＭＴ^*がアクティブの信号状態にあるとき、音量制御部２２０は、音量抑制処理を実行する。

　音量抑制処理は以下の第１音声抑制処理であって良い。第１音声抑制処理において、音量制御部２２０は、音量設定情報ＶＯＬ^*に関わらず係数ｋ_AMPの値に所定値ｋ_LOWを設定する。所定値ｋ_LOWは係数ｋ_AMPの可変範囲の最小値（例えば１）である。音量抑制指令信号ＭＴ^*がノンアクティブの信号状態にある場合において、音量設定情報ＶＯＬ^*が音量設定情報ＶＯＬ^*の可変範囲の最小値をとり、故に、係数ｋ_AMPの値が係数ｋ_AMPの可変範囲の最小値（例えば１）と一致するとき、後席スピーカＳＰ２の出力音量は後席スピーカＳＰ２の出力音量の可変範囲の最小音量となる。故に、第１音声抑制処理が実行されたときの後席スピーカＳＰ２の出力音量は、後席スピーカＳＰ２の出力音量の可変範囲の最小音量（所定音量）となる。従って、音量設定情報ＶＯＬ^*の値が２以上である場合において第１音声抑制処理が実行されたとき、第１音声抑制処理が実行されない場合と比べて後席スピーカＳＰ２の出力音量は小さくなる（換言すれば音量設定情報ＶＯＬ^*に基づく音量よりも後席スピーカＳＰ２の出力音量は小さくなる）。但し、音量設定情報ＶＯＬ^*の値が１である場合において第１音声抑制処理が実行されたときには、第１音声抑制処理が実行されない場合と比べて後席スピーカＳＰ２の出力音量は小さくならない（“ＶＯＬ^*＝１”である時点で後席スピーカＳＰ２の出力音量が最小音量となっているため）。何れにせよ、第１音声抑制処理が実行されたときには、音量設定情報ＶＯＬ^*に関わらず後席スピーカＳＰ２の出力音量が所定値ｋ_LOWに応じた所定音量に設定される。

　尚、所定値ｋ_LOWは係数ｋ_AMPの可変範囲の最小値より大きい値（但し、少なくとも係数ｋ_AMPの可変範囲の最大値よりは小さい）を有していても良い。即ち例えば、音量抑制指令信号ＭＴ^*がノンアクティブの信号状態にあるときにおいて係数ｋ_AMPの値がｎ種類の値の何れかに設定されるのであれば（ｎは３以上であるとする）、第１音声抑制処理において係数ｋ_AMPの値は、ｎ種類の値の内、２番目に小さい値であっても良い。

　音量抑制処理は以下の第２音声抑制処理であっても良い。第２音声抑制処理において、音量制御部２２０は、音量設定情報ＶＯＬ^*及び音量抑制指令信号ＭＴ^*に基づいて係数ｋ_AMPの値を設定する。説明の具体化のため、音量抑制指令信号ＭＴ^*がノンアクティブの信号状態にある場合、音量設定情報ＶＯＬ^*の値がそのまま係数ｋ_AMPの値に設定されることを想定する（即ち“ＶＯＬ^*＝ｋ_AMP”と想定する）。この場合において、音量抑制指令信号ＭＴ^*がアクティブの信号状態にあるとき、第２音声抑制処理において、音量制御部２２０は、音量設定情報ＶＯＬ^*の値より小さな値（例えば“ＶＯＬ^*－１”）を係数ｋ_AMPの値に設定する。そうすると、音量設定情報ＶＯＬ^*の値が２以上である場合において第２音声抑制処理が実行されたとき、第２音声抑制処理が実行されない場合と比べて後席スピーカＳＰ２の出力音量は小さくなる（換言すれば音量設定情報ＶＯＬ^*に基づく音量よりも後席スピーカＳＰ２の出力音量は小さくなる）。

　但し、係数ｋ_AMPの値が所定の下限値（ここでは１）より小さくなることが禁止されていても良く、この場合にあっては、音量設定情報ＶＯＬ^*の値が１である場合において第２音声抑制処理が実行されたとき、第２音声抑制処理が実行されない場合と比べて後席スピーカＳＰ２の出力音量は小さくならない。即ち、第１音声抑制処理が実行されたときと同様、結果として、後席スピーカＳＰ２の出力音量は後席スピーカＳＰ２の出力音量の可変範囲の最小音量（所定音量）となる。

　音量抑制処理は以下の第３音声抑制処理であっても良い。第３音声抑制処理において、音量制御部２２０は、後席スピーカＳＰ２への音響信号Ｓｉｇ２２の出力を停止させる。従って、第３音声抑制処理が実行されたとき、後席スピーカＳＰ２の出力音量はゼロとなる（即ち、後席スピーカＳＰ２は消音される）。

　音量抑制指令部２３０は、音量制御部２２０に対して音量抑制指令信号ＭＴ^*を出力する。図８を参照して音量抑制指令信号ＭＴ^*の状態制御を説明する。図８において、波形６１１は前席ユニット１０における音声入力処理の実行／非実行の状態を表す。図８において、波形６１２は、車内スピーカＳＰ１での出力対象となる音響信号Ｓｉｇ＿ＳＰ１と、後席スピーカＳＰ２での出力対象となる音響信号Ｓｉｇ＿ＳＰ２との同一性を表す。図８において、波形６１３は音量抑制指令信号ＭＴ^*の信号状態を表す。

　同一性が評価される一方の音響信号、即ち、後席スピーカＳＰ２での出力対象となる音響信号Ｓｉｇ＿ＳＰ２は音響信号Ｓｉｇ２１又はＳｉｇ２２である（図７参照）。但し、第３音声抑制処理が実行される場合にあっては、音響信号Ｓｉｇ２２が存在しなくなるので、音響信号Ｓｉｇ＿ＳＰ２は音響信号Ｓｉｇ２１であると解される。音声抑制処理として第１又は第２音声抑制処理が実行される場合にあっては、後席スピーカＳＰ２での出力対象となる音響信号Ｓｉｇ＿ＳＰ２は音響信号Ｓｉｇ２１又はＳｉｇ２２である、と考えて良い。以下では、音声抑制処理として第３音声抑制処理が実行されうることを考慮して、音響信号Ｓｉｇ２１が音響信号Ｓｉｇ＿ＳＰ２であると考える。

　同一性が評価される他方の音響信号、即ち、車内スピーカＳＰ１での出力対象となる音響信号Ｓｉｇ＿ＳＰ１は音響信号Ｓｉｇ１１又はＳｉｇ１２であるが（図５参照）、ここでは主に、音響信号Ｓｉｇ１１が音響信号Ｓｉｇ＿ＳＰ１であると考える。

　音量抑制指令部２３０は、対象期間において音量抑制指令信号ＭＴ^*をアクティブの信号状態とし、対象期間と異なる非対象期間において音量抑制指令信号ＭＴ^*をノンアクティブの信号状態とする。

　前席ユニット１０の主処理部１３において音声入力処理が実行されている期間であって、且つ、音響信号Ｓｉｇ＿ＳＰ１の内容と音響信号Ｓｉｇ＿ＳＰ２の内容とが相違する期間が、対象期間に相当する。前席ユニット１０の主処理部１３において音声入力処理が実行されていない期間は、音響信号Ｓｉｇ＿ＳＰ１及びＳｉｇ＿ＳＰ２の内容の同一／相違に関係なく、非対象期間に属する。前席ユニット１０の主処理部１３において音声入力処理が実行されている期間であっても、当該期間中における音響信号Ｓｉｇ＿ＳＰ１の内容と音響信号Ｓｉｇ＿ＳＰ２の内容が互いに同じである場合には、当該期間は非対象期間に属する。尚、主処理部１３において音声入力処理が実行されている期間とは、換言すれば、主処理部１３の動作モードが音声入力モードに設定されている期間に相当する。主処理部１３において音声入力処理が実行されていない期間とは、換言すれば、主処理部１３の動作モードが非音声入力モードに設定されている期間に相当する。

　音響信号Ｓｉｇ＿ＳＰ１の内容と音響信号Ｓｉｇ＿ＳＰ２の内容が互いに同じであるとは、音響信号Ｓｉｇ＿ＳＰ１及びＳｉｇ＿ＳＰ２の元となる音源が同じであることを指し、故に、音響信号Ｓｉｇ＿ＳＰ１を車内スピーカＳＰ１に入力したときの車内スピーカＳＰ１の出力音の内容と、音響信号Ｓｉｇ＿ＳＰ２を後席スピーカＳＰ２に入力したときの後席スピーカＳＰ２の出力音の内容が互いに同じであることを意味する。音響信号Ｓｉｇ＿ＳＰ１の振幅と音響信号Ｓｉｇ＿ＳＰ２の振幅が互いに相違していたとしても音響信号Ｓｉｇ＿ＳＰ１の波形と音響信号Ｓｉｇ＿ＳＰ２の波形が互いに相似であれば、音響信号Ｓｉｇ＿ＳＰ１の内容と音響信号Ｓｉｇ＿ＳＰ２の内容は互いに同じであると解される。即ち、音響信号Ｓｉｇ＿ＳＰ１に基づく車内スピーカＳＰ１の出力音の音量と音響信号Ｓｉｇ＿ＳＰ２に基づく後席スピーカＳＰ２の出力音の音量とが相違していたとしても、音響信号Ｓｉｇ＿ＳＰ１を車内スピーカＳＰ１に入力したときの車内スピーカＳＰ１の出力音の内容と音響信号Ｓｉｇ＿ＳＰ２を後席スピーカＳＰ２に入力したときの後席スピーカＳＰ２の出力音の内容が互いに同じであれば、音響信号Ｓｉｇ＿ＳＰ１の内容と音響信号Ｓｉｇ＿ＳＰ２の内容は互いに同じであると解される。尚、本実施形態において、音源とは、音波を発生する物体を指すのではなく、音響信号（音の電気信号）の発生源を指す。

　共通の音源に基づく共通の音響信号が、音響信号Ｓｉｇ１１として前席ユニット１０の音響信号処理部１２０（図５参照）に入力されると同時に音響信号Ｓｉｇ２１として後席ユニット２０の音響信号処理部２１０（図７参照）に入力されたとき、音響信号Ｓｉｇ＿ＳＰ１の内容と音響信号Ｓｉｇ＿ＳＰ２の内容は互いに同じとなる。より具体的には例えば、磁気ディスクに記録された映画の動画像が表示部２１にて再生されると共に当該動画像に付随する音響信号（映画上の挿入歌の音響信号等）が後席スピーカＳＰ２に入力されて後席スピーカＳＰ２で再生されており、これと同時に、当該動画像に付随する音響信号が車内スピーカＳＰ１に入力されて車内スピーカＳＰ１でも再生されているとき、音響信号Ｓｉｇ＿ＳＰ１の内容と音響信号Ｓｉｇ＿ＳＰ２の内容は互いに同じとなる。音響信号のスピーカでの再生とは、音響信号をスピーカにて音として出力することを指す。

　第１音源に基づく第１音響信号が音響信号Ｓｉｇ１１として前席ユニット１０の音響信号処理部１２０（図５参照）に入力され、一方、第２音源に基づく第２音響信号が音響信号Ｓｉｇ２１として後席ユニット２０の音響信号処理部２１０（図７５参照）に入力されたとき、音響信号Ｓｉｇ＿ＳＰ１の内容と音響信号Ｓｉｇ＿ＳＰ２の内容は互いに相違する（但し、第１及び第２音源は互いに異なり、第１及び第２音響信号は互いに異なるものとする）。より具体的には例えば、光ディスク等の記録媒体に記録された映画の動画像が表示部２１にて再生されると共に当該動画像に付随する音響信号（映画上の挿入歌の音響信号等）が後席スピーカＳＰ２に入力されて後席スピーカＳＰ２で再生されており、この際、ラジオ放送に基づく楽曲の音響信号が車内スピーカＳＰ１に入力されて車内スピーカＳＰ１で再生されているとき、音響信号Ｓｉｇ＿ＳＰ１の内容と音響信号Ｓｉｇ＿ＳＰ２の内容は互いに相違する。

　マイクロホン１５には、音声入力処理の対象となる発話者の発話による音に加えて、車内スピーカＳＰ１の出力音及び後席スピーカＳＰ２の出力音も入力される。前席ユニット１０における主処理部１３は、車内スピーカＳＰ１での出力対象となる音響信号Ｓｉｇ＿ＳＰ１を認識している。このため、音響信号Ｓｉｇ＿ＳＰ１（例えばＳｉｇ１１又はＳｉｇ１２）をリファレンス信号Ｓｉｇ＿ｒｅｆに含めたＥＣＮＲ１１２の処理によって（図４参照）、音響信号Ｓｉｇ＿ＳＰ１の成分を音響信号Ｓｉｇ０２から除去することができ、その後の音声認識に対して音響信号Ｓｉｇ＿ＳＰ１の成分は殆ど影響を与えない。

　また、音響信号Ｓｉｇ＿ＳＰ２の内容が音響信号Ｓｉｇ＿ＳＰ１の内容と同じであるならば、ＥＣＮＲ１１２の処理によって（図４参照）、音響信号Ｓｉｇ＿ＳＰ１の成分と同時に音響信号Ｓｉｇ＿ＳＰ２の成分も音響信号Ｓｉｇ０２から除去される。結果、その後の音声認識に対して音響信号Ｓｉｇ＿ＳＰ２の成分も殆ど影響を与えず、正確な音声認識が期待される。

　但し、音響信号Ｓｉｇ＿ＳＰ２の内容が音響信号Ｓｉｇ＿ＳＰ１の内容と相違する場合、ＥＣＮＲ１１２の処理によって音響信号Ｓｉｇ＿ＳＰ２の成分を音響信号Ｓｉｇ０２から除去することができない。この場合において音声認識の結果に基づく音声入力処理を実行した場合、後席スピーカＳＰ２の出力音が正確な音声認識及び音声入力処理を阻害しうる。これを考慮し、本実施形態では、前席ユニット１０にて音声入力処理が実行されており且つ音響信号Ｓｉｇ＿ＳＰ２の内容が音響信号Ｓｉｇ＿ＳＰ１の内容と相違するとき（即ち上述の対象期間において）、音声抑制処理（第１～第３音声抑制処理の何れか）を実行することで、そうでないときと比べて後席スピーカＳＰ２の出力音量を低下させる、後席スピーカＳＰ２の出力音量を所定音量（典型的には例えば後席スピーカＳＰ２の出力音量の可変範囲の最小音量）に設定する、又は、後席スピーカＳＰ２を消音させる（図８参照）。

　これにより、音声認識の正確性が担保され、音声入力処理を正しく行うことが可能となる（後席スピーカＳＰ２の出力音が音声入力処理を阻害することを抑制できる）。

　以下、複数の実施例の中で、幾つかの具体的な動作例、応用技術、変形技術等を説明する。本実施形態にて上述した事項は、特に記述無き限り且つ矛盾無き限り、以下の各実施例に適用される。各実施例において、上述の事項と矛盾する事項がある場合には、各実施例での記載が優先されて良い。また矛盾無き限り、以下に示す複数の実施例の内、任意の実施例に記載した事項を、他の任意の実施例に適用することもできる（即ち複数の実施例の内の任意の２以上の実施例を組み合わせることも可能である）。

＜＜第１実施例＞＞
　第１実施例を説明する。図９に示す如く、前席ユニット１０の主処理部１３は、通信部１４を用い任意の音源からの音響信号を後席ユニット２０に送信する音響信号送信部１５０を有していて良い。図９の例では、音源ＡＳａからの音響信号Ｓｉｇａが音響信号送信部１５０を通じて後席ユニット２０に送信される。この場合、音響信号Ｓｉｇａが後席ユニット２０の通信部２４にて受信されて音響信号Ｓｉｇ２１として音響信号処理部２１０に入力される。音響信号Ｓｉｇａの後席ユニット２０への送信とは別に、前席ユニット１０の主処理部１３では、図９に示す如く、音響信号Ｓｉｇａを音響信号Ｓｉｇ１１として音響信号処理部１２０（図５も参照）に入力しても良い。

　音響信号Ｓｉｇａを後席ユニット２０に送信すると同時に音響信号Ｓｉｇａを音響信号Ｓｉｇ１１として音響信号処理部１２０に入力する第１ケースを考える。図９は第１ケースにおける音響信号の流れを表している。第１ケースでは、音源ＡＳａからの音響信号ＳｉｇａがスピーカＳＰ１及びＳＰ２の夫々にて同時に再生される（説明の簡単化のため、通信等による遅延を無視）。第１ケースでは、音響信号Ｓｉｇ＿ＳＰ１の内容（音響信号Ｓｉｇ１１の内容）と音響信号Ｓｉｇ＿ＳＰ２の内容（音響信号Ｓｉｇ２１の内容）が互いに同じとなる。

　一方、図１０に示す第２ケースでは、音源ＡＳａからの音響信号Ｓｉｇａが音響信号Ｓｉｇ１１として前席ユニット１０の音響信号処理部１２０に入力される一方で、音源ＡＳｂからの音響信号Ｓｉｇｂが音響信号送信部１５０より通信部１４を通じて後席ユニット２０に送信される。そうすると、後席ユニット２０では音響信号Ｓｉｇｂが音響信号Ｓｉｇ２１として音響信号処理部２１０に入力される。結果、第２ケースでは、音源ＡＳａからの音響信号Ｓｉｇａが車内スピーカＳＰ１にて再生されると同時に音源ＡＳｂからの音響信号Ｓｉｇｂが後席スピーカＳＰ２にて再生される。音源ＡＳａ及びＡＳｂは互いに異なり、故に音響信号Ｓｉｇａ及びＳｉｇｂも互いに異なる。故に、第２ケースでは、音響信号Ｓｉｇ＿ＳＰ１の内容（音響信号Ｓｉｇ１１の内容）と音響信号Ｓｉｇ＿ＳＰ２の内容（音響信号Ｓｉｇ２１の内容）が互いに相違する。

　前席ユニット１０のＲＳＥ音量干渉部１３０（図５参照）は、車内スピーカＳＰ１の出力音の音源と後席スピーカＳＰ２の出力音の音源とが同じであるか否かを判定する。図９の第１ケースの如く、共通の音源からの共通の音響信号を車内スピーカＳＰ１にて再生し且つ後席ユニット２０に送信するケースでは、車内スピーカＳＰ１の出力音の音源と後席スピーカＳＰ２の出力音の音源は互いに同じであると判定される。図１０の第２ケースの如く、互いに異なる音源からの互いに異なる音響信号を車内スピーカＳＰ１にて再生し且つ後席ユニット２０に送信するケースでは、車内スピーカＳＰ１の出力音の音源と後席スピーカＳＰ２の出力音の音源は互いに異なると判定される。車内スピーカＳＰ１の出力音の音源と後席スピーカＳＰ２の出力音の音源とが同じであるか否かの判定は、音響信号Ｓｉｇ＿ＳＰ１の内容と音響信号Ｓｉｇ＿ＳＰ２の内容とが同じであるか否かの判定と等価である。この判定の結果と音声入力処理が現在実行されているか否かに基づき、ＲＳＥ音量干渉部１３０は、対象期間及び非対象期間を認識及び設定することができる（即ち、任意のタイミングが対象期間及び非対象期間の何れに属するかを判断できる）。

　前席ユニット１０のＲＳＥ音量干渉部１３０（図５参照）は、対象期間において音量抑制指令信号ＭＴ^*の信号状態がアクティブとなることを指示する第１制御信号を後席ユニット２０に送信し、非対象期間において音量抑制指令信号ＭＴ^*の信号状態がノンアクティブとなることを指示する第２制御信号を後席ユニット２０に送信する。音量抑制指令部２３０（図７参照）は、ＲＳＥ音量干渉部１３０から受信した第１又は第２制御信号に基づき音量抑制指令信号ＭＴ^*の信号状態をアクティブ又はノンアクティブに設定する。

　図９の第１ケースでは、車内スピーカＳＰ１の出力音の音源と後席スピーカＳＰ２の出力音の音源とが同じである、即ち音響信号Ｓｉｇ＿ＳＰ１の内容と音響信号Ｓｉｇ＿ＳＰ２の内容とが同じである。故に、図９の第１ケースでは音声入力処理が実行されているか否かに関わらず上記第１制御信号は後席ユニット２０に送信されず、結果、後席ユニット２０において上記音量抑制処理は実行されない。

　図１０の第２ケースでは、車内スピーカＳＰ１の出力音の音源と後席スピーカＳＰ２の出力音の音源とが相違する、即ち音響信号Ｓｉｇ＿ＳＰ１の内容と音響信号Ｓｉｇ＿ＳＰ２の内容とが相違する。故に、図１０の第２ケースにおいて音声入力処理が実行されている期間は対象期間に相当し、対象期間において上記第１制御信号が後席ユニット２０に送信されることで後席ユニット２０において上記音量抑制処理が実行される。

　音源ＡＳ１及びＡＳ２は任意の音源であって良い。音源として、音響信号が記録された光ディスク等の記録媒体、音響信号を含む放送波が挙げられる。また、インターネットを含む情報通信網を通じてユニット１０又は２０にて取得される音響信号が音響信号Ｓｉｇａ又はＳｉｇｂであっても良い。

　尚、後席スピーカＳＰ２にて再生される音響信号が前席ユニット１０から後席ユニット２０に提供されることを前提とした方法を上述したが、前席ユニット１０に依存することなく、後席ユニット２０単体にて取得される音響信号が後席スピーカＳＰ２にて生成されても良い。この場合には、音響信号Ｓｉｇ２１を後席ユニット２０から前席ユニット１０に送信し、前席ユニット１０のＲＳＥ音量干渉部１３０において、車内スピーカＳＰ１にて再生されるべき音響信号Ｓｉｇ１１と受信した音響信号Ｓｉｇ２１とを比較することにより、音響信号Ｓｉｇ＿ＳＰ１の内容（音響信号Ｓｉｇ１１の内容）と音響信号Ｓｉｇ＿ＳＰ２の内容（音響信号Ｓｉｇ２１の内容）とが同じであるか否かを判定すれば良い。

＜＜第２実施例＞＞
　第２実施例を説明する。第２実施例では、音響信号Ｓｉｇ＿ＳＰ１の内容と音響信号Ｓｉｇ＿ＳＰ２の内容とが同じであるか否かの判定を後席ユニット２０側で行う。この場合には、車内スピーカＳＰ１にて再生されるべき音響信号Ｓｉｇ１１を前席ユニット１０から後席ユニット２０に送信する。そして、後席ユニット２０の音量抑制指令部２３０（図７参照）において、後席スピーカＳＰ２にて再生されるべき音響信号Ｓｉｇ２１と受信した音響信号Ｓｉｇ１１とを比較することにより、音響信号Ｓｉｇ＿ＳＰ１の内容（音響信号Ｓｉｇ１１の内容）と音響信号Ｓｉｇ＿ＳＰ２の内容（音響信号Ｓｉｇ２１の内容）とが同じであるか否かを判定すれば良い。

　一方で、前席ユニット１０のＲＳＥ音量干渉部１３０は、音声入力処理が現在実行されているか否かを示す通知信号を制御信号として、後席ユニット２０に送信する。例えば、音声入力処理が現在実行されているときのみ特定の通知信号を制御信号として後席ユニット２０に送信すれば良い。音量抑制指令部２３０は、音響信号Ｓｉｇ＿ＳＰ１の内容と音響信号Ｓｉｇ＿ＳＰ２の内容とが同じであるか否かの判定の結果と、受信した通知信号としての制御信号と、に基づき対象期間及び非対象期間を認識及び設定する（即ち、任意のタイミングが対象期間及び非対象期間の何れに属するかを判断する）。そして、音量抑制指令部２３０は、音量抑制指令信号ＭＴ^*の信号状態を、対象期間においてアクティブとし、非対象期間においてノンアクティブとすれば良い。

＜＜第３実施例＞＞
　第３実施例を説明する。第３実施例では、本発明の一側面に係る装置又はシステムについて考察する。

　本発明の一側面に係る車載装置（以下、便宜上、車載装置Ｗ_RSEと称する）は、車両に設置される車載装置（２０）であって、スピーカ（ＳＰ２）と、前記スピーカの出力音量を制御する音量制御部（２２０）と、を備え、前記音量制御部は、他の車載装置（１０）にて前記車両の乗員の発話による音声入力処理が実行されており、且つ、前記スピーカ（ＳＰ２）での出力対象とされる対象音響信号（Ｓｉｇ＿ＳＰ２）の内容が、前記他の車載装置により前記車両内の他のスピーカ（ＳＰ１）での出力対象とされる他の音響信号（Ｓｉｇ＿ＳＰ１）の内容と相違するとき、そうでないときと比べて前記出力音量を低下させる、前記出力音量を所定音量に設定する、又は、前記スピーカを消音させる。

　これにより、スピーカ（ＳＰ２）の出力音が他の車載装置での音声入力処理を阻害することが抑制され、他の車載装置において音声入力処理を正しく行うことが可能となる。

　具体的には例えば、車載装置Ｗ_RSEにおいて、前記音量制御部（２２０）は、前記他の車載装置（１０）にて前記音声入力処理が実行されていないとき、又は、前記対象音響信号（Ｓｉｇ＿ＳＰ２）の内容が前記他の音響信号（Ｓｉｇ＿ＳＰ１）の内容と同一であるとき、前記出力音量を、与えられた音量設定情報（ＶＯＬ^*）に基づく音量に設定し、前記他の車載装置（１０）にて前記音声入力処理が実行されており且つ前記対象音響信号（Ｓｉｇ＿ＳＰ２）の内容が前記他の音響信号（Ｓｉｇ＿ＳＰ１）の内容と相違するとき、前記出力音量を前記音量設定情報に基づく音量より低下させる、前記音量設定情報に関わらず前記出力音量を前記所定音量に設定する、又は、前記スピーカを消音させると良い。

　これにより、基本的にはスピーカ（ＳＰ２）の出力音量が音量設定情報に基づくものとされる。スピーカの出力音が音声入力処理を阻害する可能性があるときに音量低下等が行われて、音声入力処理の正確な実行が担保される。

　また具体的には例えば、車載装置Ｗ_RSEに関し、前記他の車載装置（１０）では、前記発話による音を受けるマイクロホン（１５）への入力音響信号に基づき前記発話の内容に対する音声認識を実行し、前記音声入力処理は前記音声認識の結果に基づいて実行され、前記音声認識は、前記マイクロホンへの入力音響信号における前記他の音響信号（Ｓｉｇ＿ＳＰ１）の成分を抑制してから実行されると良い。

　他の音響信号（Ｓｉｇ＿ＳＰ１）の成分の抑制により所謂エコーキャンセルが実現され、正確な音声認識が担保される。対象音響信号（Ｓｉｇ＿ＳＰ２）の内容が他の音響信号（Ｓｉｇ＿ＳＰ１）の内容と同一であるきには、エコーキャンセルにより対象音響信号（Ｓｉｇ＿ＳＰ２）の成分も抑制されるので、正確な音声認識が期待される。一方、それらが相違するときには、対象音響信号（Ｓｉｇ＿ＳＰ２）に対してエコーキャンセルが機能せず、正確な音声認識が阻害されるおそれがある。しかし、車載装置Ｗ_RSEでは、他の車載装置（１０）にて音声入力処理が実行されており且つ対象音響信号（Ｓｉｇ＿ＳＰ２）の内容が他の音響信号（Ｓｉｇ＿ＳＰ１）の内容と相違するとき、スピーカ（ＳＰ２）の出力音量の低下等が図られるため、音声認識の正確性が担保され、結果、音声入力処理の正確な実行が担保される。

　尚、後席ユニット２０は車載装置Ｗ_RSEの例である。或いは、後席ユニット２０は車載装置Ｗ_RSEを内包すると言える。

　そして例えば、上記の車載装置Ｗ_RSE（２０）と、他の車載装置（１０）を備えた車載システム（ＳＹＳ）を構成すると良い。

　本発明の他の一側面に係る車載装置（以下、便宜上、車載装置Ｗ_HUと称する）は、車両に設置される車載装置（１０）であって、前記車両の乗員の発話による音を受けるマイクロホン（１５）と、前記発話の内容に対して音声認識を実行する音声認識部（１１３）と、前記発話による音声入力処理を起動させる音声入力起動部（１１５）と、前記音声入力処理が実行されているとき、前記音声認識の結果に基づき前記発話の内容に対して応答する応答処理部（１１４）と、音響信号の供給により前記車両内のスピーカ（ＳＰ１）に音を出力させる音響信号処理部（１２０）と、前記車両に設置された他の車載装置（２０）に対し制御信号を送信する他装置制御部（１３０）と、を備え、前記他装置制御部は、前記音声入力処理が実行されており、且つ、前記車両内のスピーカ（ＳＰ１）での出力対象となる対象音響信号（Ｓｉｇ＿ＳＰ１）の内容が前記他の車載装置（２０）における他のスピーカ（ＳＰ２）での出力対象となる他の音響信号（Ｓｉｇ＿ＳＰ２）の内容と相違するとき、そうでないときと比べて前記他のスピーカの出力音量を低下させる制御信号、前記出力音量を所定音量に設定する制御信号、又は、前記他のスピーカを消音させる制御信号を、前記他の車載装置（２０）に送信する。

　他のスピーカ（ＳＰ２）の音量低下等により、音声入力処理において必要な音声認識の正確性が担保される。結果、車載装置Ｗ_HUにおいて音声入力処理を正しく行うことが可能となる。

　具体的には例えば、車載装置Ｗ_HUにおいて、前記マイクロホンへの入力音響信号に含まれる前記対象音響信号（Ｓｉｇ＿ＳＰ１）の成分を抑制することで前記入力音響信号に基づく抑制後音響信号（Ｓｉｇ０３）を生成するエコー抑制部（１１２）を更に設け、前記音声認識部は、前記抑制後音響信号に基づいて前記音声認識を実行すると良い。

　対象音響信号（Ｓｉｇ＿ＳＰ１）の成分の抑制により、即ちスピーカ（ＳＰ１）での出力対象となる音響信号の成分の抑制により所謂エコーキャンセルが実現され、正確な音声認識が担保される。スピーカ（ＳＰ１）での出力対象となる音響信号（Ｓｉｇ＿ＳＰ１）の内容が他のスピーカ（ＳＰ２）での出力対象となる他の音響信号（Ｓｉｇ＿ＳＰ２）の内容と同一であるきには、エコーキャンセルにより他の音響信号（Ｓｉｇ＿ＳＰ２）の成分も抑制されるので、正確な音声認識が期待される。一方、それらが相違するときには、他の音響信号（Ｓｉｇ＿ＳＰ２）に対してエコーキャンセルが機能せず、正確な音声認識が阻害されるおそれがある。しかし、車載装置Ｗ_HUでは、音声入力処理が実行されており且つスピーカ（ＳＰ１）での出力対象となる音響信号（対象音響信号）の内容が他のスピーカ（ＳＰ２）での出力対象となる他の音響信号の内容と相違するとき、他のスピーカ（ＳＰ２）の出力音量の低下等が図られるため、音声認識の正確性が担保され、結果、音声入力処理の正確な実行が担保される。

　尚、前席ユニット１０は車載装置Ｗ_HUの例である。或いは、前席ユニット１０は車載装置Ｗ_HUを内包すると言える。図５のＲＳＥ音量干渉部１３０は他装置制御部の例である。図４のＥＣＮＲ１１２はエコー抑制部の例である。

　そして例えば、上記の車載装置Ｗ_HU（１０）と、他の車載装置（２０）を備えた車載システム（ＳＹＳ）を構成すると良い。

　これにより、スピーカ（ＳＰ２）の出力音が車載装置Ｗ_HUでの音声入力処理を阻害することが抑制され、車載装置Ｗ_HUにおいて音声入力処理を正しく行うことが可能となる。

　本発明の実施形態は、特許請求の範囲に示された技術的思想の範囲内において、適宜、種々の変更が可能である。以上の実施形態は、あくまでも、本発明の実施形態の例であって、本発明ないし各構成要件の用語の意義は、以上の実施形態に記載されたものに制限されるものではない。上述の説明文中に示した具体的な数値は、単なる例示であって、当然の如く、それらを様々な数値に変更することができる。

　ＣＲ　車両
ＳＹＳ　車載システム
ＳＰ１　車内スピーカ
ＳＰ２　後席スピーカ
　１０　前席ユニット
　１５　マイクロホン
　２０　後席ユニット
１１０　音声入力部
１１１　フロントエンド
１１２　ＥＣＮＲ
１１３　音声認識部
１１４　応答処理部
１１５　音声入力起動部
１２０　音響信号処理部
１３０　ＲＳＥ音量干渉部
２１０　音響信号処理部
２２０　音量制御部
２３０　音量抑制指令部

Claims

　車両に設置される車載装置であって、
　スピーカと、
　前記スピーカの出力音量を制御する音量制御部と、を備え、
　前記音量制御部は、他の車載装置にて前記車両の乗員の発話による音声入力処理が実行されており、且つ、前記スピーカでの出力対象とされる対象音響信号の内容が、前記他の車載装置により前記車両内の他のスピーカでの出力対象とされる他の音響信号の内容と相違するとき、そうでないときと比べて前記出力音量を低下させる、前記出力音量を所定音量に設定する、又は、前記スピーカを消音させる
、車載装置。
　前記音量制御部は、
　前記他の車載装置にて前記音声入力処理が実行されていないとき、又は、前記対象音響信号の内容が前記他の音響信号の内容と同一であるとき、前記出力音量を、与えられた音量設定情報に基づく音量に設定し、
　前記他の車載装置にて前記音声入力処理が実行されており且つ前記対象音響信号の内容が前記他の音響信号の内容と相違するとき、前記出力音量を前記音量設定情報に基づく音量より低下させる、前記音量設定情報に関わらず前記出力音量を前記所定音量に設定する、又は、前記スピーカを消音させる
、請求項１に記載の車載装置。
　前記他の車載装置では、前記発話による音を受けるマイクロホンへの入力音響信号に基づき前記発話の内容に対する音声認識を実行し、前記音声入力処理は前記音声認識の結果に基づいて実行され、前記音声認識は、前記マイクロホンへの入力音響信号における前記他の音響信号の成分を抑制してから実行される
、請求項１又は２に記載の車載装置。
　請求項１～３の何れかに記載の車載装置と、
　他の車載装置と、を備えた
、車載システム。
　車両に設置される車載装置であって、
　前記車両の乗員の発話による音を受けるマイクロホンと、
　前記発話の内容に対して音声認識を実行する音声認識部と、
　前記発話による音声入力処理を起動させる音声入力起動部と、
　前記音声入力処理が実行されているとき、前記音声認識の結果に基づき前記発話の内容に対して応答する応答処理部と、
　音響信号の供給により前記車両内のスピーカに音を出力させる音響信号処理部と、
　前記車両に設置された他の車載装置に対し制御信号を送信する他装置制御部と、を備え、
　前記他装置制御部は、前記音声入力処理が実行されており、且つ、前記車両内のスピーカでの出力対象となる対象音響信号の内容が前記他の車載装置における他のスピーカでの出力対象となる他の音響信号の内容と相違するとき、そうでないときと比べて前記他のスピーカの出力音量を低下させる制御信号、前記出力音量を所定音量に設定する制御信号、又は、前記他のスピーカを消音させる制御信号を、前記他の車載装置に送信する
、車載装置。
　前記マイクロホンへの入力音響信号に含まれる前記対象音響信号の成分を抑制することで前記入力音響信号に基づく抑制後音響信号を生成するエコー抑制部を更に備え、
　前記音声認識部は、前記抑制後音響信号に基づいて前記音声認識を実行する
、請求項５に記載の車載装置。
　請求項６又は７に記載の車載装置と、
　他の車載装置と、を備えた
、車載システム。