WO2018139650A1

WO2018139650A1 - 音声制御装置、音声制御方法、及びプログラム

Info

Publication number: WO2018139650A1
Application number: PCT/JP2018/002770
Authority: WO
Inventors: 洋一奥山; 洋人河内; 昭光藤吉
Original assignee: パイオニア株式会社
Priority date: 2017-01-27
Filing date: 2018-01-29
Publication date: 2018-08-02

Abstract

車両（２４０）は、自動車などの任意の車両である。車両（２４０）には、マイク（１０）が設けられている。マイク（１０）は、車両（２４０）の外部で発生する車外音を取り込み、車外音を表す音声信号（音声信号（１２））を生成する。また、車両（２４０）には、カメラ（３０）が設けられている。カメラ（３０）は、撮像を行い、その撮像結果を表す画像（撮像画像（３２））を生成する。カメラ（３０）は、その画角に車両（２４０）の進行方向が含まれるように設置されている。音声制御装置（２００）は、撮像画像（３２）を用い、車両（２４０）の進行方向にある交差点について、交差点（４０）の周辺に存在する物体が車両（２４０）の搭乗者にとって視認しやすいか否かを判定する。そして、音声制御装置（２００）は、上記判定の結果に応じ、車両（２４０）の車外音を表す音声信号（１２）を用いた処理を行う。

Description

音声制御装置、音声制御方法、及びプログラム

　本発明は、音声制御装置、音声制御方法、及びプログラムに関する。

　自動車などの車両において、車外音（車両の外で発生した音）をマイクで取り込んで利用する技術が開発されている。例えば特許文献１は、予め登録したエリアに接近した場合に、スピーカから出力する音声の音源を車内音源（オーディオ装置など）から車外音源に切り替える技術を開示している。つまり、予め登録したエリアに接近すると、車室内で車外音が再生される。

特開２００６－２６２１４７号公報

　特許文献１の技術では、車外音を再生させる場所を予め登録しておく必要がある。そのため、車両の利用者は、車外音を再生させたい場所を予め把握しておく必要がある。また、車外音を再生させたい場所が多い場合、登録作業の負荷が大きい。よって、車両の安全走行のために車室内に車外音を再生させたい場所であったとしても、登録し忘れなどによりその再生が十分にできない虞がある。さらに、自動運転を実行可能な自動運転車の利用者にあっては、当該自動運転車の安全走行のために車室内に車外音を再生させたい場所を予め把握しているとは考えにくいため、同様の課題が存在するものと考えられる。

　本発明は、上述の課題に鑑みてなされたものであり、自動運転車を含む車両の走行の安全性を容易に向上させる技術を提供することを一つの目的とする。

　請求項１に記載の音声制御装置は、（１）車両の進行方向が撮像されている撮像画像を用い、前記車両の進行方向にある交差点について、その交差点の周辺にある物体が前記車両の搭乗者にとって視認しやすいか否かを判定する判定手段と、（２）前記判定手段の判定結果に応じ、前記車両の外で発生している車外音を表す音声信号を用いた処理を実行する処理手段と、を有する。

　請求項１０に記載の音声制御方法は、コンピュータによって実行される音声制御方法である。当該音声制御方法は、（１）車両の進行方向が撮像されている撮像画像を用い、前記車両の進行方向にある交差点について、その交差点の周辺にある物体が前記車両の搭乗者にとって視認しやすいか否かを判定する判定ステップと、（２）前記判定ステップにおける判定結果に応じ、前記車両の外で発生している車外音を表す音声信号を用いた処理を実行する処理ステップと、を有する。

　請求項１１に記載のプログラムは、コンピュータに、（１）車両の進行方向が撮像されている撮像画像を用い、前記車両の進行方向にある交差点について、その交差点の周辺にある物体が前記車両の搭乗者にとって視認しやすいか否かを判定する判定ステップと、（２）前記判定ステップにおける判定結果に応じ、前記車両の外で発生している車外音を表す音声信号を用いた処理を実行する処理ステップと、を実行させる。

　上述した目的、およびその他の目的、特徴および利点は、以下に述べる好適な実施の形態、およびそれに付随する以下の図面によってさらに明らかになる。

実施形態１の音声制御装置の使用環境を例示する図である。見通しが良い交差点と見通しが悪い交差点をそれぞれ例示する図である。音声制御装置の機能構成を例示する図である。音声制御装置のハードウエア構成を例示する図である。実施形態１の音声制御装置によって実行される処理の流れを例示するフローチャートである。交差点に設置されているミラーを例示する図である。樹木によってミラーの一部が隠されている様子を例示する図である。交差点に接続している他の道路を表す領域を例示する図である。道路の輪郭線を延長した様子を例示する図である。判定部による判定の結果に応じて車外音の再生が行われる処理の流れを例示するフローチャートである。実施形態２の音声制御装置によって実行される処理の流れを例示するフローチャートである。実施形態３の音声制御装置によって実行される処理の流れを例示するフローチャートである。実施形態４の音声制御装置によって実行される処理の流れを例示するフローチャートである。

　以下、本発明の実施の形態について、図面を用いて説明する。尚、すべての図面において、同様な構成要素には同様の符号を付し、適宜説明を省略する。また、特に説明する場合を除き、ブロック図における各ブロックは、ハードウエア単位の構成ではなく、機能単位の構成を表している。

＜概要＞
　図１は、実施形態１の音声制御装置２００の使用環境を例示する図である。なお、図１は音声制御装置２００に関する理解を容易にするための図であり、音声制御装置２００の動作を何ら限定するものではない。

　車両２４０は、自動車などの任意の車両である。車両２４０には、マイク１０が設けられている。マイク１０は、車両２４０の外部で発生する車外音を取り込み、車外音を表す音声信号（音声信号１２）を生成する。

　また、車両２４０には、カメラ３０が設けられている。カメラ３０は、撮像を行い、その撮像結果を表す画像（撮像画像３２）を生成する。カメラ３０は、その画角に車両２４０の進行方向が含まれるように設置されている。そのため、車両２４０が交差点に向かって走行していると、撮像画像３２には、車両２４０の進行方向にある交差点（交差点４０）が含まれる（図１参照）。

　交差点４０は、複数の道路の接続点となる場所である。図１の交差点４０では、４つの道路が十字型に交差するように接続されている。しかし、交差点４０において複数の道路が接続される態様は、十字型に限定されない。その他の態様は、例えば、Ｙ字型（三叉路における接続点）やＴ字型（Ｔ字路における接続点）などである。

　音声制御装置２００は、撮像画像３２を用い、車両２４０の進行方向にある交差点４０の周辺に存在する物体が車両２４０の搭乗者にとって視認しやすいか否かを判定する。言い換えれば、音声制御装置２００は、交差点４０が見通しの良い交差点であるか否かを判定する。交差点４０の周辺に存在する物体が車両２４０の搭乗者にとって視認しやすい場合、その交差点４０は見通しが良い交差点である。一方、交差点４０の周辺に存在する物体が車両２４０の搭乗者にとって視認しにくい場合、その交差点４０は、見通しが悪い交差点である。

　図２は、見通しが良い交差点４０と見通しが悪い交差点４０をそれぞれ例示する図である。図２（ａ）は、見通しが良い交差点４０を例示している。図２（ａ）の場合、車両２４０の搭乗者の視界を遮ってしまう建物などが存在しない。そのため、車両２４０の搭乗者は、交差点４０に接続している道路４４、道路４６、及び道路４８それぞれの広い範囲を容易に視認することができる。そのため、車両２４０の搭乗者は、これらの道路を走行して交差点４０に向かう他の車両や、これらの道路の脇にある歩道を歩いて交差点４０に向かう歩行者を容易に視認することができる。なお、記載を簡潔にするため、以降の説明では、特に断らない限り、「道路」には、その脇にある歩道も含まれるとする。

　図２（ｂ）は、見通しが悪い交差点４０を例示している。まず、道路４４がカーブしているため、車両２４０の搭乗者が視認できる道路４４の範囲が狭い。また、建物によって道路４６や道路４８が隠されているため、車両２４０の搭乗者が視認できる道路４６や道路４８の範囲も狭い。よって、車両２４０の搭乗者にとって、道路４４、道路４６、又は道路４８を走行して交差点４０に向かう他の車両や、これらの道路を歩いて交差点４０に向かう歩行者を視認することが難しい。

　ここで一般に、車両の走行を適切に制御するためには、視覚情報や聴覚情報が有用である。図１の車両２４０の場合、視覚情報は、車両２４０の搭乗者の目に写る情報や、カメラ３０によって撮像される情報などである。聴覚情報は、車両２４０の搭乗者の耳に聞こえる情報や、マイク１０によって取り込まれる情報である。

　しかし、図２（ｂ）の交差点４０のように見通しの悪い交差点では、交差点の走行に有用な視覚情報を得ることが難しい。一方で、見通しの悪い交差点であっても、交差点の走行に有用な聴覚情報を得られる蓋然性は高い。交差点の走行に有用な聴覚情報は、例えば、交差点に向かう車両が発する音（エンジン音やロードノイズ）や、交差点に向かう歩行者が発する音（話し声など）などである。

　そこで本実施形態の音声制御装置２００は、交差点４０における見通しの良さに応じ、車両２４０の車外音を表す音声信号１２を用いた処理を行う。こうすることで、交差点４０に向けて車両２４０を走行させる際、車両２４０の走行の制御に有用な視覚情報が得られない場合であっても、聴覚情報を利用して車両２４０の走行を適切に制御できるようにする。

　例えば音声制御装置２００は、交差点４０における見通しが悪い場合に、音声信号１２を車両２４０の室内で再生する。こうすることで、車両２４０の搭乗者は、交差点４０に向かう他の車両や歩行者の存在を認識し、適切な対処ができるようになる。例えば運転手は、交差点４０の手前で車両２４０を減速又は停止させるという対処をすることができる。その他にも例えば、運転手以外の搭乗者は、運転手にアドバイスをしたり、事故が起こった場合に備えて身構えたりするといった対処をすることができる。

　なお、本実施形態の音声制御装置２００では、交差点４０における見通しの悪さが撮像画像３２を用いて判定され、その判定結果に応じて音声信号１２を用いた処理が行われる。そのため特許文献１の技術とは異なり、車外音を再生すべき場所を予め登録しておくという作業が必要無い。よって、音声制御装置２００の利用者（車両２４０の搭乗者）は、車外音を再生すべき場所を予め把握しておく必要がない。また、音声制御装置２００の利用者に、車外音を再生すべき場所を登録するという作業負荷を強いることがない。さらに、音声制御装置２００は、車両２４０が接近している時点における交差点４０の状態に基づいて、音声信号１２を用いた処理を行うことができる。そのため、例えば普段は見通しの良い交差点４０において一時的に見通しが悪くなっているようなケースであっても、音声信号１２を用いた処理を適切に行うことができる。よって、本実施形態の音声制御装置２００によれば、車両の走行の安全性を容易に向上させることができる。

　なお、音声制御装置２００が行う音声信号１２の処理は、音声信号１２を車両２４０の室内で再生させる処理に限定されない。その他の処理については後述する。

　以下、本実施形態の音声制御装置２００について、さらに詳細に説明する。

＜音声制御装置２００の機能構成の例＞
　図３は、音声制御装置２００の機能構成を例示する図である。音声制御装置２００は、判定部２０２及び処理部２０４を有する。判定部２０２は、カメラ３０によって生成される撮像画像３２を用い、車両２４０の進行方向にある交差点４０の周辺に存在する物体が車両２４０の搭乗者にとって視認しやすいか否かを判定する。処理部２０４は、判定部２０２の判定結果に応じ、車両２４０の車外音を表す音声信号１２を用いた処理を実行する。

＜音声制御装置２００のハードウエア構成の例＞
　音声制御装置２００の各機能構成部は、各機能構成部を実現するハードウエア（ハードワイヤードされた電子回路など）で実現されてもよいし、ハードウエアとソフトウエアとの組み合わせ（電子回路とそれを制御するプログラムの組み合わせなど）で実現されてもよい。以下、音声制御装置２００の各機能構成部がハードウエアとソフトウエアとの組み合わせで実現される場合について、さらに説明する。

　図４は、音声制御装置２００のハードウエア構成を例示する図である。計算機１００は、音声制御装置２００を実現する計算機である。例えば計算機１００は、車両２４０に設けられている種々のハードウエアを制御する ECU（Electronic Control Unit）である。その他にも例えば、計算機１００は、車両２４０に設けられているカーナビゲーション装置である。計算機１００は、音声制御装置２００を実現するために専用に設計された計算機であってもよいし、汎用の計算機であってもよい。

　計算機１００は、バス１０２、プロセッサ１０４、メモリ１０６、ストレージデバイス１０８、入出力インタフェース１１０、及びネットワークインタフェース１１２を有する。バス１０２は、プロセッサ１０４、メモリ１０６、ストレージデバイス１０８、入出力インタフェース１１０、及びネットワークインタフェース１１２が、相互にデータを送受信するためのデータ伝送路である。ただし、プロセッサ１０４などを互いに接続する方法は、バス接続に限定されない。プロセッサ１０４は、マイクロプロセッサ、CPU（Central Processing Unit）、又は GPU（Graphics Processing Unit）などを用いて実現される演算処理装置である。メモリ１０６は、RAM（Random Access Memory）などを用いて実現される主記憶装置である。ストレージデバイス１０８は、ROM（Read Only Memory）やフラッシュメモリなどを用いて実現される補助記憶装置である。ただし、ストレージデバイス１０８は、RAM など、主記憶装置を構成するハードウエアと同様のハードウエアで構成されてもよい。

　入出力インタフェース１１０は、計算機１００を周辺機器と接続するためのインタフェースである。図４において、入出力インタフェース１１０には、マイク１０、スピーカ２０、及びカメラ３０が接続されている。

　計算機１００には、入出力インタフェース１１０を介し、車両２４０の制御に用いる各種のアナログ信号やデジタル信号が入力又は出力される。例えば、音声信号１２は、入出力インタフェース１１０を介して、マイク１０から計算機１００へ入力される。また例えば、撮像画像３２は、入出力インタフェース１１０を介して、カメラ３０から計算機１００へ入力される。

　ただし、計算機１００が音声信号１２を取得する方法は、マイク１０から直接取得する方法に限定されない。例えば音声信号１２が記憶装置に記憶される場合、計算機１００は、この記憶装置から音声信号１２を取得してもよい。この場合、マイク１０は、入出力インタフェース１１０に接続されていなくてもよい。

　同様に、計算機１００が撮像画像３２を取得する方法は、カメラ３０から直接取得する方法に限定されない。例えば撮像画像３２が記憶装置に記憶される場合、計算機１００は、この記憶装置から撮像画像３２を取得してもよい。この場合、カメラ３０は、入出力インタフェース１１０に接続されていなくてもよい。

　入出力インタフェース１１０には、アナログの入力信号をデジタル信号に変換する A/D コンバータや、デジタルの出力信号をアナログ信号に変換する D/A コンバータなどが適宜含まれる。例えばマイク１０から出力される音声信号がアナログ信号である場合、入出力インタフェース１１０が有する A/D コンバータによってこのアナログ信号がデジタル信号に変換され、このデジタル信号がプロセッサ１０４によって処理される。

　ネットワークインタフェース１１２は、計算機１００を通信網に接続するためのインタフェースである。この通信網は、例えば CAN（Controller Area Network）通信網や WAN（Wide Area Network）などである。ネットワークインタフェース１１２が通信網に接続する方法は、無線接続であってもよいし、有線接続であってもよい。

　ストレージデバイス１０８は、音声制御装置２００の各機能構成部を実現するためのプログラムモジュールを記憶している。プロセッサ１０４は、このプログラムモジュールをメモリ１０６に読み出して実行することで、音声制御装置２００の機能を実現する。

＜＜マイク１０について＞＞
　マイク１０は、車両２４０の外部で発生する車外音を取り込み、その車外音を表す電気信号（音声信号１２）を生成することができる任意の装置である。車両２４０に設けられるマイク１０の設置位置は任意である。また、車両２４０に設けられるマイク１０の数は任意である。

＜＜スピーカ２０について＞＞
　スピーカ２０は、音声信号によって表される音声を出力することができる任意の装置である。例えばスピーカ２０は、音声信号１２によって表される車外音を、車両２４０の室内に出力することができる。車両２４０に設けられるスピーカ２０の設置位置は任意である。また、車両２４０に設けられるスピーカ２０の数は任意である。

＜＜カメラ３０について＞＞
　カメラ３０は、任意のタイミングで撮像を行い、撮像の結果として撮像画像３２を生成することができる任意の撮像装置である。カメラ３０は、動画データを生成するビデオカメラであってもよいし、静止画像データを生成するスチルカメラであってもよい。なお、前者の場合、撮像画像３２は、動画データを構成する１つのフレームである。

＜処理の流れ＞
　図５は、実施形態１の音声制御装置２００によって実行される処理の流れを例示するフローチャートである。判定部２０２は撮像画像３２を取得する（Ｓ１０２）。判定部２０２は、撮像画像３２を用いて、車両２４０の進行方向にある交差点４０について、交差点４０の周辺に存在する物体が、車両２４０の搭乗者にとって視認しやすいか否かを判定する（Ｓ１０４）。車両２４０は、Ｓ１０４における判定の結果に応じ、音声信号１２を用いた処理を行う（Ｓ１０６）。

＜撮像画像の取得：Ｓ１０２＞
　判定部２０２は撮像画像３２を取得する（Ｓ１０２）。ここで、判定部２０２が撮像画像３２を取得する方法は任意である。例えば判定部２０２は、カメラ３０から送信される撮像画像３２を受信する。また例えば、判定部２０２は、カメラ３０にアクセスし、カメラ３０に記憶されている撮像画像３２を取得する。

　なお、カメラ３０は、カメラ３０の外部に設けられている記憶装置に撮像画像３２を記憶してもよい。この場合、判定部２０２は、この記憶装置にアクセスして撮像画像３２を取得する。

　判定部２０２が撮像画像３２を取得するタイミングは様々である。例えば判定部２０２は、カメラ３０によって新たな撮像画像３２が生成される度に、その撮像画像３２を取得する。その他にも例えば、判定部２０２は、定期的に未取得の撮像画像３２を取得してもよい。例えば判定部２０２が１秒間に１回撮像画像３２を取得する場合、判定部２０２は、１秒間に生成される複数の撮像画像３２（例えば 30fps(frames/second) で撮像が行われる場合、３０枚の撮像画像３２）をまとめて取得する。

＜交差点４０の検出＞
　判定部２０２は、交差点４０における見通しの良さを判定する前提として、交差点４０を検出する。つまり判定部２０２は、車両２４０の進行方向に交差点があることを検出する。判定部２０２が交差点４０を検出する方法は様々である。例えば判定部２０２は、撮像画像３２を解析することで交差点４０を検出する。具体的には、判定部２０２は、複数の道路が接続されている場所を撮像画像３２から検出し、その場所を交差点４０として扱う。

　その他にも例えば、判定部２０２は、地図情報を使って、車両２４０の進行方向に交差点があることを検出し、その交差点を交差点４０として扱う。地図情報を取得する技術には、既存の技術を利用することができる。なお、地図情報を利用して交差点４０を検出する場合、判定部２０２は、交差点４０が検出された後に生成された撮像画像３２のみを取得するようにしてもよい。

＜交差点４０における見通しの良さの判定：Ｓ１０４＞
　判定部２０２は、撮像画像３２を用いて、車両２４０の進行方向にある交差点４０について、「交差点４０の周辺に存在する物体が車両２４０の搭乗者にとって視認しやすいか否か」を判定する（Ｓ１０４）。そのために判定部２０２は、交差点４０の周辺に存在する物体の視認のしやすさに関連する要素（以下、視認性要素）を撮像画像３２の中から抽出する。例えば視認性要素は、交差点４０に設置されるミラーである。視認性要素に関する具体的な説明は後述する。判定部２０２は、抽出された１つ以上の視認性要素に基づいて、交差点４０の周辺に存在する物体が車両２４０の搭乗者にとって視認しやすいか否かを判定する。

　例えば判定部２０２は、視認性要素の抽出結果に基づいて、交差点４０の周辺に存在する物体の視認しやすさを表す指標値（以下、視認性指標値）を算出する。そして判定部２０２は、視認性指標値が基準値以上である場合、交差点４０の周辺に存在する物体が車両２４０の搭乗者にとって視認しやすい（交差点４０における見通しが良い）と判定する。一方、判定部２０２は、視認性指標値が基準値未満である場合、交差点４０の周辺に存在する物体が車両２４０の搭乗者にとって視認しにくい（交差点４０における見通しが悪い）と判定する。この基準値は、判定部２０２に予め設定されていてもよいし、判定部２０２からアクセス可能な記憶装置に記憶されていてもよい。

　なお、視認性要素が複数ある場合、例えば判定部２０２は、各視認性要素の抽出結果に基づいて視認性指標値を算出し、算出した複数の視認性指標値の統計値（合計値、平均値、最大値、又は最小値など）を算出する。そして判定部２０２は、この統計値が基準値以上である場合、交差点４０の周辺に存在する物体が車両２４０の搭乗者にとって視認しやすい（交差点４０における見通しが良い）と判定する。一方、判定部２０２は、この統計値が基準値未満である場合、交差点４０の周辺に存在する物体が車両２４０の搭乗者にとって視認しにくい（交差点４０における見通しが悪い）と判定する。

＜＜視認性要素について＞＞
　視認性要素は、交差点４０の周辺に存在する物体の視認のしやすさに関連する要素である。以下、視認性要素の具体例をいくつか挙げて説明する。

＜＜＜視認性要素の例１＞＞＞
　例えば視認性要素は、交差点４０に設置されているミラーである。一般に、交差点には、交差点の付近に存在する車両や歩行者を把握しやすくするためにミラーが設置されていることがある。図６は、交差点に設置されているミラーを例示する図である。ミラーは、符号５０で表されている。

　交差点４０にミラー５０が設置されていると、車両２４０の搭乗者は、直接視認することができない車両や歩行者を、ミラー５０を介して視認することができる。そのため、交差点４０の付近に設置されているミラー５０は、交差点４０の周辺に存在する物体の視認のしやすさを向上させる要素である。

　例えば判定部２０２は、撮像画像３２から、交差点４０の付近に設置されているミラー５０の検出を試みる。そして判定部２０２は、この検出の結果に基づいて、ミラー５０に関する視認性指標値を算出する。ミラー５０が検出される場合におけるミラー５０に関する視認性指標値は、ミラー５０が検出されない場合におけるミラー５０に関する視認性指標値も高い値とする。なお、撮像画像３２からミラーを検出する処理には、画像から特定のオブジェクトを認識する技術を利用することができる。

　なお、ミラー５０によって交差点４０の周囲の物体が視認しやすくなる度合いは、車両２４０が視認できるミラー５０の大きさに依存する。例えばミラー５０の周辺に樹木などが存在することにより、ミラー５０の一部が見えないことがある。図７は、樹木によってミラー５０の一部が隠されている様子を例示する図である。このようにミラー５０の一部が見えないと、交差点４０の周辺の物体を視認しにくくなる。また、ミラー５０が全体的に小さい場合、ミラー５０の全体を視認できたとしても、交差点４０の周辺の物体を視認しにくい。

　そこで判定部２０２は、ミラー５０に関する視認性指標値を、撮像画像３２から検出されるミラー５０の面積が大きいほど大きい値としてもよい。そのため判定部２０２は、撮像画像３２にミラー５０が含まれるものの、ミラー５０の一部が撮像画像３２に含まれない場合に、交差点４０の周辺に存在する物体が車両２４０の搭乗者にとって視認しにくいと判定しうる。ここで、「ミラー５０の面積」は、支柱などを含むミラー５０全体の面積であってもよいし、周囲の物体を映す部分（図６における符号５２）のみの面積であってもよい。

＜＜＜視認性要素の例２＞＞＞
　例えば視認性要素は、撮像画像３２における、交差点４０に接続している他の道路を表す領域の広さである。ここで、「交差点４０に接続している他の道路」とは、交差点４０に接続している道路のうち、車両２４０が現在走行している道路以外の道路（図２（ｂ）における道路４４、道路４６、及び道路４８）である。

　図８は、交差点４０に接続している他の道路を表す領域を例示する図である。図８において、道路４４を表す領域、道路４６を表す領域、道路４８を表す領域がそれぞれドット柄で塗られている。

　例えば判定部２０２は、交差点４０に接続している他の道路それぞれについて、その道路に関する視認性指標値を算出する。ここで、道路に関する視認性指標値は、撮像画像３２においてその道路を表す領域の面積が大きいほど大きい値になるようにする。そして判定部２０２は、各道路について算出した視認指標値の統計値を、交差点４０に接続している道路に関する視認性指標値として算出する。

　なお図８などを見ると、撮像画像３２において、車両２４０の進行方向にある道路（道路４４）の領域は、車両２４０の進行方向とは異なる方向（例えば車両２４０の進行方向に直交する方向）にある道路（道路４６及び道路４８）の領域よりも大きくなりやすい。判定部２０２は、この点を考慮して視認性指標値を算出することが好ましい。

　例えば判定部２０２は、道路に関する視認性指標値を、その道路を隠す障害物が存在しないと仮定した場合におけるその道路の面積で、撮像画像３２に実際に含まれるその道路の面積を除算した値とする。障害物が存在しないと仮定した場合における道路の面積は、例えば、撮像画像３２に含まれるその道路の輪郭線を撮像画像３２の端まで延長させ、その延長させた輪郭線で囲まれる面積を算出することにより、算出することができる。

　図９は、道路４８の輪郭線を延長した様子を例示する図である。点線４９は、撮像画像３２に含まれる道路４８の輪郭線を撮像画像３２の端まで延長させた線である。なお、図９では、図を見やすくなるため、道路４８の前にある建物の図示を省略している。

＜＜＜視認性要素の例３＞＞＞
　例えば視認性要素は、交差点４０の車両２４０が走行している道路に対し交差点４０を介して接続されている他の道路（図２（ｂ）における道路４４、道路４６、及び道路４８）を視認しにくくしまう障害物である。例えば障害物は、建物、側壁、又は樹木などである。

　例えば判定部２０２は、撮像画像３２から、交差点４０の周辺に存在する障害物の検出を試みる。そして判定部２０２は、この検出の結果に基づいて、障害物に関する視認性指標値を算出する。障害物に関する視認性指標値は、撮像画像３２から検出される障害物が多いほど大きい値となる。例えば判定部２０２は、撮像画像３２から、障害物を表す領域を検出し、検出された各領域の面積の合計値を、障害物に関する視認性指標値とする。

＜音声信号の処理：Ｓ１０６＞
　車両２４０は、判定部２０２による判定の結果に応じ、車両２４０の車外音の音声信号１２を用いた処理を行う（Ｓ１０６）。処理部２０４が行う処理は様々である。例えば処理部２０４は、判定部２０２による判定の結果に応じて、車外音を車両２４０の室内で再生するか否かを決定する。なお、車外音の再生以外で処理部２０４が行う処理については、後述する他の実施形態で説明する。

　例えば処理部２０４は、交差点の周辺に存在する物体が車両２４０の搭乗者によって視認しにくい（交差点の見通しが悪い）と判定された場合、スピーカ２０に音声信号１２を再生させる。そのため、車両２４０の室内へ車外音が出力される。一方、処理部２０４は、交差点の周辺に存在する物体が車両２４０の搭乗者にとって視認しやすい（交差点の見通しが良い）と判定された場合、スピーカ２０に車外音を再生させない。そのため、車両２４０の室内へ車外音が出力されない。

　こうすることで、車両２４０の搭乗者は、交差点４０の見通しが悪い場合に、車外音によって、交差点４０で発生しうる危険を予測することができる。例えば車両２４０の搭乗者は、交差点４０に接近する他の車両や歩行者を視認できなくても、他の車両が発生させる音（エンジン音やロードノイズなど）が含まれる車外音や、歩行者の話し声などが含まれる車外音を聞くことにより、他の車両や歩行者が交差点に接近していることを予測することができるようになる。よって、見通しの悪い交差点における事故を減らすことができる。

　一方、交差点４０の見通しが良ければ、車両２４０の搭乗者は、交差点４０に接近する他の車両や歩行者を視覚によって把握することができる。そのためこの場合には、車外音を車両２４０の室内に出力しないようにすることで、車両２４０の室内の快適さを高めることができる。

　図１０は、判定部２０２による判定の結果に応じて車外音の再生が行われる処理の流れを例示するフローチャートである。図１０のフローチャートは、図５のＳ１０６において実行される処理の流れを具体化したものの一例である。

　交差点の周辺に存在する物体が車両２４０の搭乗者にとって視認しにくいと判定された場合（Ｓ２０２：ＮＯ）、処理部２０４は、音声信号１２をスピーカ２０に再生させる（Ｓ２０４）。一方、交差点の周辺に存在する物体が車両２４０の搭乗者にとって視認しやすいと判定された場合（Ｓ２０２：ＹＥＳ）、図１０の処理は終了する（音声信号１２がスピーカ２０から再生されない）。

　なお、車外音の再生について処理部２０４が行う処理は、上述の例に限定されない。例えば処理部２０４は、判定部２０２の判定結果に応じて、スピーカ２０における車外音のゲインを変更してもよい。具体的には、処理部２０４は、交差点の周辺に存在する物体が車両２４０の搭乗者にとって視認しにくいと判定された場合における車外音のゲインを、交差点の周辺に存在する物体が車両２４０の搭乗者にとって視認しやすいと判定された場合における車外音のゲインよりも大きくする。

　その他にも例えば、スピーカ２０が、車外音と音楽とが合成された音声を出力しているとする。この場合、処理部２０４は、判定部２０２による判定結果に応じて、車外音と音楽のゲインの比率を変更してもよい。具体的には、処理部２０４は、交差点の周辺に存在する物体が車両２４０の搭乗者にとって視認しにくいと判定された場合、音楽のゲインよりも車外音のゲインを大きくする。一方、処理部２０４は、交差点の周辺に存在する物体が車両２４０の搭乗者にとって視認しやすいと判定された場合、車外音のゲインよりも音楽のゲインを大きくする。

＜変形例＞
　ここでは、実施形態１の音声制御装置２００の変形例について説明する。以下で説明する音声制御装置２００を、変形例１の音声制御装置２００と呼ぶ。なお、以下で説明する点を除き、変形例１の音声制御装置２００は、前述した音声制御装置２００と同じ機能を有する。

　ここまで実施形態１として、判定部２０２が、撮像画像３２の中から抽出した視認性要素に基づいて、交差点４０周辺に存在する物体が車両２４０の搭乗者にとって視認しやすいか否かを判定する実施例について説明した。これに対し、変形例１の判定部２０２は、センサを利用して、車両２４０の進行方向にある交差点４０周辺の環境状況が自動運転の実行可能条件を満たすか否かを判定し、この判定の結果に応じて、交差点４０周辺に存在する物体の視認のしやすさを判定する。

　ここで、変形例１の音声制御装置２００では、車両２４０が自動運転車であることを前提とする。ここでいう自動運転車とは、周囲の環境を認識して自律的に走行する車両を意味する。実施例１において、図４に示した計算機１００は、自動運転の制御も行うとする。そのため、計算機１００は、自律走行を実現するために要する種々の機構とさらに接続される（図示せず）。例えばこのような機構には、車両２４０の現在位置を衛星航法や自律航法にて検出可能な測位ユニットや、周囲の環境を認識するための外界センサなどが含まれる。測位ユニットは、例えば GPS（Global Positioning System）センサなどである。外界センサは、例えばレーダーや LiDAR（Light Detection and Ranging）センサなどである。

　また、更に精度よく車両２４０の現在位置を検出するために、計算機１００は、ネットワークインタフェース１１２を介して、不図示の地図データサーバ装置から、測位ユニットが検出した現在位置周辺の高精度３次元地図データを取得して、ストレージデバイス１０８に一時的に記憶してもよい。この場合、例えば計算機１００は、現在位置周辺の高精度３次元地図と外界センサの測定データのスキャンマッチングにより自車両の位置推定を行う。すなわち、高精度３次元地図上の地物の位置と当該地物の外界センサによる測定データに基づいて、車両２４０の現在位置を推定する。

　自動運転車では、自動運転の実行可能条件が満たされている場合に、自動運転が実行される。そのため、自動運転車を手動運転から自動運転に切り替えようとする際、自動運転の実行可能条件が満たされているかどうかの判定が行われる。そして、自動運転の実行可能条件が満たされていなければ、自動運転への切り替えが行われない。また、自動運転中にも、自動運転の実行可能条件が満たされているか否かの判定が行われる。そして、自動運転の実行可能条件が満たされていなければ、車両の搭乗者に運転権限を委譲する（すなわち、自動運転から手動運転に切り替える）旨が報知され、その後に手動運転への切り替えが行われる。

　自動運転の実行可能条件には、（Ａ）推定された現在位置の確度が所定の基準よりも高いこと、および（Ｂ）外界センサにより周囲の環境が十分認識できていること、が必要となる。ここで、（Ａ）の条件を判定するにあたり、計算機１００は、衛星航法、及び自律航法により推定した現在位置と、高精度３次元地図上の地物の位置と外界センサにより計測された実際の地物の位置に基づいて推定した現在位置との一致度に応じて、現在位置の確度を判定する。例えば計算機１００は、それぞれで推定した現在位置同士の差異が所定の距離以下（例えば５０ｃｍ）である場合に、推定された現在位置の確度が所定の基準よりも高いと判定する。また（Ｂ）の条件を判定するにあたり、例えば計算機１００は、カメラ３０や LiDAR などにより撮像された画像に基づいて、車両２４０の所定距離（例えば２０ｍ）以上前方の路面にペイントされた区画線が、識別可能かを判定する。

　ここで、上記判定の際に検出されるべき地物や区画線を検出できず、（Ａ）や（Ｂ）の条件が満たされないことがある。その原因としては、例えば、地物や区画線と自車両との間に他の移動体や樹木などの障害物が存在したことや、雨や霧などの気象状況に起因する視界不良などがある。車両２４０を自動運転に切り替えようとした際に（Ａ）や（Ｂ）の条件、すなわち自動運転の実行可能条件が満たされなかった場合、計算機１００は、車両２４０を自動運転に切り替えない。また、自動運転中にこれらの事象が発生した場合は、車両２４０の搭乗者に運転権限を委譲する（すなわち、自動運転から手動運転に切り替える）旨を、スピーカ２０等により当該搭乗者に報知する。

　言い換えれば、自動運転の実行可能条件が満たされない場合には、障害物の存在や気象状況に起因する視界不良により、車両の進行方向にある交差点周辺に存在する物体が、車両の搭乗者にとって視認しにくい状況となっている可能性が高い。そこで、判定部２０２は、カメラ３０または LiDAR により撮像された画像に基づいて、車両の進行方向の環境状況が自動運転の可能条件を満たすか否かを判定する。そして、自動運転の可能条件が満たされない場合、判定部２０２は、車両の進行方向にある交差点周辺に存在する物体が、車両の搭乗者にとって視認しにくい状況となっていると判定する。

［実施形態２］
　実施形態２の音声制御装置２００の機能構成は、実施形態１の音声制御装置２００の機能構成と同様に、図３で表される。以下で説明する事項を除き、実施形態２の音声制御装置２００は、実施形態１の音声制御装置２００と同様の機能を有する。

　実施形態２の処理部２０４は、判定部２０２による判定結果及び車外音の音声信号を用いて、車両２４０の進行方向にある交差点４０が危険であるか否かを判定する。以下、この判定を「交差点の危険判定」と呼ぶ。

　例えば処理部２０４は、車外音の音声信号１２を用いて交差点４０の危険判定を行うか否かを、判定部２０２による判定結果に基づいて決定する。具体的には、処理部２０４は、交差点４０の周辺にある物体が車両２４０の搭乗者にとって視認しやすくないと判定された場合に、音声信号１２を用いて交差点４０の危険判定を行う。一方、交差点４０の周辺にある物体が車両２４０の搭乗者にとって視認しやすいと判定された場合、処理部２０４は、上記危険判定を行わない。

　こうすることで、交差点４０の見通しが悪い場合に、車外音によって交差点４０が危険であるか否かが判定される。そのため、車両２４０の搭乗者が交差点４０に接近する他の車両や歩行者を視認できなくても、車両２４０の搭乗者は、交差点４０の危険度合いを把握することができるようになる。よって、見通しの悪い交差点における事故を減らすことができる。

　一方、交差点４０の見通しが良ければ、車両２４０の搭乗者は、交差点４０に接近する他の車両や歩行者を視覚によって把握することができる。そのためこのような場合には音声制御装置２００による危険判定を行わないようにすることで、音声制御装置２００が消費する計算機資源を削減することができる。

　以下、交差点の危険判定の具体的な方法について説明する。

　例えば処理部２０４は、音声信号１２の中に、他の車両によって発せられる音、又は人によって発せられる音が含まれる場合、交差点が危険であると判定する。一方、これらの音が音声信号１２に含まれない場合、処理部２０４は、交差点が危険でないと判定する。他の車両によって発せられる音は、例えば、自動車やバイクによって発せられるエンジン音、ロードノイズ、又はブレーキ音である。その他にも例えば、他の車両によって発せられる音は、自転車によって発せられるロードノイズやブレーキ音である。人によって発せられる音は、例えば声や足音である。ここで、音声信号からこれらの種々の音を検出する技術には、既存の技術を利用することができる。

　その他にも例えば、処理部２０４は、車外音の音声信号１２を用いて、交差点４０の危険度合いを表す指標値（以下、危険指標値）を算出し、この危険指標値に基づいて、交差点４０が危険であるか否かを判定してもよい。処理部２０４は、危険指標値が基準値以上である場合、交差点が危険であると判定する。一方、処理部２０４は、危険指標値が基準値未満である場合、交差点が危険でないと判定する。この基準値は、処理部２０４に予め設定されていてもよいし、処理部２０４からアクセス可能な記憶装置に記憶されていてもよい。

　危険指標値を算出するために、処理部２０４は、音声信号１２から、交差点４０の危険度合いを測る指標として利用できる音を検出する。そして、その処理部２０４は、その検出結果に基づいて危険指標値を算出する。

　交差点４０の危険度合いを測る指標として利用できる音は、例えば前述した、他の車両によって発せられる音や、人によって発せられる音である。例えば処理部２０４は、音声信号１２に含まれる車両のエンジン音が大きいほど、危険指標値の値を大きくする。車両のエンジン音が大きい場合、その車両が加速しながら交差点４０に接近していると考えられるためである。

　その他にも例えば、処理部２０４は、音声信号１２に含まれる他の車両のロードノイズが大きいほど、危険指標値の値を大きくする。これは、車両から発せられるロードノイズが大きいほど、車両の速度が大きいか、又は車両の大きさが大きいと考えられるためである。

　その他にも例えば、処理部２０４は、音声信号１２に含まれる人の声が大きいほど、危険指標値を大きい値にする。人の声が大きい場合、その人は他の人と会話をしながら（例えば携帯電話を使って話しながら）歩いており、注意力が散漫になっている蓋然性が高いためである。

　その他にも例えば、処理部２０４は、音声信号１２に含まれる人の声を用いてその人の推定年齢を算出し、その推定年齢が子供又は高齢者である場合、それ以外の場合よりも、危険指標値を大きい値にする。人の声の音声から人の推定年齢を算出する技術には、既存の技術を利用することができる。

＜危険判定の結果の利用方法＞
　処理部２０４による危険判定の結果を利用する方法は様々である。例えば処理部２０４は、交差点４０が危険であると判定された場合に、車両２４０の搭乗者に対してその旨の通知を行う。この通知は、例えば、車両２４０に設けられているディスプレイ装置（カーナビゲーションシステムのディスプレイ装置）やスピーカ２０を利用して行われる。

　その他にも例えば、処理部２０４は、車両２４０の走行を制御する装置（以下、走行制御装置）に対して、危険判定の結果を出力してもよい。走行制御装置は、例えば、車両２４０の自動運転を制御する装置である。交差点４０が危険である判定されている場合、例えば走行制御装置は、車両２４０を交差点４０の手前で減速させたり、一時停止させたりする。

＜処理の流れ＞
　図１１は、実施形態２の音声制御装置２００によって実行される処理の流れを例示するフローチャートである。図１１のフローチャートは、図５のＳ１０６において実行される処理の流れを具体化したものの一例である。

　Ｓ１０４において、交差点４０の周辺にある物体が車両２４０の搭乗者にとって視認しやすいと判定された場合（Ｓ３０２：ＹＥＳ）、図１１の処理は終了する。一方、交差点４０の周辺にある物体が車両２４０の搭乗者にとって視認しにくいと判定された場合（Ｓ３０２：ＮＯ）、処理部２０４は、交差点４０が危険であるか否かを判定する（Ｓ３０４）。

＜ハードウエア構成の例＞
　実施形態２の音声制御装置２００のハードウエア構成は、実施形態１の音声制御装置２００のハードウエア構成と同様に、例えば図４で表される。また本実施形態において、前述したストレージデバイス１０８に記憶されるプログラムモジュールには、本実施形態で説明した機能を実現するプログラムがさらに含まれる。

［実施形態３］
　実施形態３の音声制御装置２００の機能構成は、実施形態１の音声制御装置２００の機能構成と同様に、図３で表される。以下で説明する事項を除き、実施形態３の音声制御装置２００は、実施形態１の音声制御装置２００と同様の機能を有する。

　実施形態３の処理部２０４は、実施形態２の処理部２０４と同様に、交差点４０の危険判定を行う。ただし、以下の点で実施形態２の処理部２０４と異なる。

　実施形態２の処理部２０４は、判定部２０２による判定の結果にかかわらず、交差点４０の危険判定を行う。ただし、実施形態３の処理部２０４は、交差点４０が危険であるか否かの判定基準を、判定部２０２による判定の結果に応じて決める。

　具体的には、実施形態３の処理部２０４は、前述した危険指標値と比較する基準値として、判定部２０２の判定結果に応じた値を利用する。そのために、交差点４０の周辺にある物体が車両２４０の搭乗者にとって視認しやすいと判定された場合に利用される第１基準値と、交差点４０の周辺にある物体が車両２４０の搭乗者にとって視認しやすくないと判定された場合に利用される第２基準値を用意しておく。第１基準値は第２基準値よりも大きい値である。

　言い換えれば、実施形態３の処理部２０４は、交差点４０の周辺にある物体が車両２４０の搭乗者にとって視認しやすいと判定された場合、危険指標値が第１基準値以上であるか否かを判定する。そして、処理部２０４は、危険指標値が第１基準値以上である場合、交差点４０が危険であると判定する。一方、処理部２０４は、危険指標値が第１基準値未満である場合、交差点４０が危険でないと判定する。

　また、処理部２０４は、交差点４０の周辺にある物体が車両２４０の搭乗者にとって視認しやすくないと判定された場合、危険指標値が第２基準値以上であるか否かを判定する。そして処理部２０４は、危険指標値が第２基準値以上である場合、交差点４０が危険であると判定する。一方、処理部２０４は、危険指標値が第２基準値未満である場合、交差点４０が危険でないと判定する。

　本実施形態の音声制御装置２００によれば、交差点４０における見通しが悪い場合の方が、交差点４０における見通しが良い場合よりも、交差点４０が危険であると判定されやすくなる。このように交差点４０における見通しの良さも加味して危険判定を行うことで、交差点４０が危険であるか否かの判定の精度を高くすることができる。

＜危険判定の結果の利用方法＞
　実施形態３の処理部２０４による危険判定の結果の利用方法は、実施形態２の処理部２０４による危険判定の結果の利用方法と同様である。

＜処理の流れ＞
　図１２は、実施形態３の音声制御装置２００によって実行される処理の流れを例示するフローチャートである。図１２のフローチャートは、図５のＳ１０６において実行される処理の流れを具体化したものの一例である。

　Ｓ１０４の後、処理部２０４は、交差点４０の危険指標値を算出する（Ｓ４０２）。Ｓ１０４において、交差点４０の周辺にある物体が車両２４０の搭乗者にとって視認しやすいと判定された場合（Ｓ４０４：ＹＥＳ）、処理部２０４は、危険指標値が第１基準値以上であるか否かを判定する（Ｓ４０６）。危険指標値が第１基準値以上である場合（Ｓ４０６：ＹＥＳ）、処理部２０４は、交差点４０が危険であると判定する（Ｓ４０８）。危険指標値が第１基準値以上でない場合（Ｓ４０６：ＮＯ）、処理部２０４は、交差点４０が危険でないと判定する（Ｓ４１０）。

　Ｓ１０４において、交差点４０の周辺にある物体が車両２４０の搭乗者にとって視認しにくいと判定された場合（Ｓ４０４：ＮＯ）、処理部２０４は、危険指標値が第２基準値以上であるか否かを判定する（Ｓ４１２）。危険指標値が第２基準値以上である場合（Ｓ４１２：ＹＥＳ）、処理部２０４は、交差点４０が危険であると判定する（Ｓ４０８）。危険指標値が第２基準値以上でない場合（Ｓ４１２：ＮＯ）、処理部２０４は、交差点４０が危険でないと判定する（Ｓ４１０）。

［実施形態４］
　実施形態４の音声制御装置２００の機能構成は、実施形態１の音声制御装置２００の機能構成と同様に、図３で表される。以下で説明する事項を除き、実施形態４の音声制御装置２００は、実施形態１の音声制御装置２００又は実施形態２の音声制御装置２００と同様の機能を有する。

　実施形態４の処理部２０４は、車両２４０の進行方向にある交差点の周辺にある物体が車両２４０の搭乗者にとって視認しやすくないと判定された場合、緊急車両が車両２４０に近づいているか否かを判定する。具体的には、処理部２０４は、車外音の音声信号を用いて、その音声信号に緊急車両のサイレンが含まれるか否かを判定する。さらに、車外音の音声信号に緊急車両のサイレンが含まれる場合、処理部２０４は、その音声信号を用いて、その緊急車両が車両２４０に近づいているか否かを判定する。

　ここで、音声信号に緊急車両のサイレンが含まれるか否かを判定する技術には、音声信号に特定の音（サイレン）が含まれているか否かを判定する既存の技術を利用することができる。また、緊急車両が車両２４０に近づいているか否かを判定する技術には、音源（緊急車両）が観測地（車両２４０）に近づいているか否かを判定する既存の技術を利用することができる。

　「緊急車両が車両２４０に近づいているか否か」の判定結果の利用方法は様々である。例えば処理部２０４は、緊急車両が車両２４０に近づいていると判定された場合、その旨の通知を車両２４０の搭乗者に対して行う。この通知は、危険判定の結果と同様の方法で行うことができる。

　その他にも例えば、処理部２０４は、車両２４０の走行を制御する走行制御装置に対して、危険判定の結果を出力してもよい。交差点４０が危険である判定されている場合、例えば走行制御装置は、車両２４０を交差点４０の手前で減速させたり、一時停止させたりする。

＜処理の流れ＞
　図１３は、実施形態４の音声制御装置２００によって実行される処理の流れを例示するフローチャートである。図１３のフローチャートは、図５のＳ１０６において実行される処理の流れを具体化したものの一例である。

　Ｓ１０４において、交差点４０の周辺にある物体が車両２４０の搭乗者にとって視認しやすいと判定された場合（Ｓ５０２：ＹＥＳ）、図１３の処理は終了する。一方、交差点４０の周辺にある物体が車両２４０の搭乗者にとって視認しにくいと判定された場合（Ｓ５０２：ＮＯ）、処理部２０４は、緊急車両が車両２４０に近づいているか否かを判定する（Ｓ５０２）。

＜ハードウエア構成の例＞
　実施形態４の音声制御装置２００のハードウエア構成は、実施形態１の音声制御装置２００のハードウエア構成と同様に、例えば図４で表される。また本実施形態において、前述したストレージデバイス１０８に記憶されるプログラムモジュールには、本実施形態で説明した機能を実現するプログラムがさらに含まれる。

　以上、図面を参照して本発明の実施形態について述べたが、これらは本発明の例示であり、上記各実施形態の組み合わせ、又は上記以外の様々な構成を採用することもできる。

　この出願は、２０１７年１月２７日に出願された日本出願特願２０１７－０１３２６７号を基礎とする優先権を主張し、その開示の全てをここに取り込む。

Claims

　車両の進行方向が撮像されている撮像画像を用い、前記車両の進行方向にある交差点周辺に存在する物体が前記車両の搭乗者にとって視認しやすいか否かを判定する判定手段と、
　前記判定手段の判定結果に応じ、前記車両の外で発生している車外音を表す音声信号を用いた処理を実行する処理手段と、を有する音声制御装置。
　前記交差点周辺に存在する物体が視認しやすくないと判定された場合、前記処理手段は、前記音声信号を前記車両の室内で再生させる、請求項１に記載の音声制御装置。
　前記処理手段は、前記判定手段による判定結果及び前記音声信号を用いて、前記交差点が危険であるか否かを判定する、請求項１に記載の音声制御装置。
　前記処理手段は、前記交差点の周辺に存在する物体が視認しやすくないと判定された場合のみ、前記音声信号を用いて前記交差点が危険であるか否かを判定する、請求項３に記載の音声制御装置。
　前記処理手段は、
　　前記音声信号を用いて前記交差点の危険度を算出し、
　　前記交差点の周辺に存在する物体が視認しやすいと判定された場合、前記危険度が第１閾値以上であれば前記交差点が危険であると判定し、
　　前記交差点の周辺に存在する物体が視認しやすくないと判定された場合、前記危険度が第２閾値以上であれば前記交差点が危険であると判定し、
　前記第１閾値は、前記第２閾値より大きい、請求項３に記載の音声制御装置。
　前記処理手段は、前記交差点の周辺に存在する物体が視認しやすくないと判定された場合、前記交差点に近づいている緊急車両のサイレンが前記音声信号に含まれるか否かを判定する、請求項３～５いずれか一項に記載の音声制御装置。
　前記判定手段は、前記交差点にミラーが設置されていない場合又は前記交差点に設置されているミラーの少なくとも一部が前記撮像画像に含まれない場合に、前記交差点の周辺に存在する物体が視認しやすくないと判定する、請求項１～６いずれか一項に記載の音声制御装置。
　前記判定手段は、前記撮像画像において前記交差点の周辺に存在する障害物が基準より多い場合に、前記交差点の周辺に存在する物体が視認しやすくないと判定する、請求項１～６いずれか一項に記載の音声制御装置。
　前記判定手段は、前記撮像画像に基づいて、前記車両の進行方向の環境状況が自動運転の可能条件を満たさない場合に、前記交差点の周辺に存在する物体が視認しやすくないと判定する、請求項１～６いずれか一項に記載の音声制御装置。
　コンピュータによって実行される音声制御方法であって、
　車両の進行方向が撮像されている撮像画像を用い、前記車両の進行方向にある交差点周辺に存在する物体が前記車両の搭乗者にとって視認しやすいか否かを判定する判定ステップと、
　前記判定ステップにおける判定結果に応じ、前記車両の外で発生している車外音を表す音声信号を用いた処理を実行する処理ステップと、を有する音声制御方法。
　コンピュータに、
　車両の進行方向が撮像されている撮像画像を用い、前記車両の進行方向にある交差点周辺に存在する物体が前記車両の搭乗者にとって視認しやすいか否かを判定する判定ステップと、
　前記判定ステップにおける判定結果に応じ、前記車両の外で発生している車外音を表す音声信号を用いた処理を実行する処理ステップと、を実行させるプログラム。