WO2021192410A1

WO2021192410A1 - 音声出力制御装置、音声出力システム、音声出力制御方法およびプログラム

Info

Publication number: WO2021192410A1
Application number: PCT/JP2020/043489
Authority: WO
Inventors: 小林　建; 利一藤井; 一夫野村; 達弘 ▲鮭▼川; 真史上村; 丁珠崔
Original assignee: 株式会社Ｊｖｃケンウッド
Priority date: 2020-03-25
Filing date: 2020-11-20
Publication date: 2021-09-30
Also published as: CN114981756A; US20230012555A1

Abstract

音声出力制御装置２０は、ユーザの顔の向きの状態を検出する向き検出部２１と、周辺音を取得する周辺音取得部２４と、周辺音取得部２４が取得した周辺音に基づき、周辺音を低減する処理を行う周辺音低減処理部２５と、向き検出部２１が、ユーザの顔の向きの状態が第一状態である場合は、周辺音低減処理部２５による周辺音を低減した音声を出力し、ユーザの顔の向きの状態が第一状態から第二状態に変化した場合は、周辺音低減処理部２５による周辺音を低減した状態よりは周辺音が聞こえやすい状態とする音声出力制御部２６と、を備える。

Description

音声出力制御装置、音声出力システム、音声出力制御方法およびプログラム

　本発明は、音声出力制御装置、音声出力システム、音声出力制御方法およびプログラムに関する。

　音声出力可能な電子書籍やゲームなど、表示画面にコンテンツ内容を表示することに加えて、音声を出力する技術が知られている（例えば、特許文献１参照）。

特開２０１６－１９２２１１号公報

　ところが、このような装置を、例えば公共交通機関などの乗車時に利用している場合、車内放送などの周辺音が聞き取りにくい場合などがある。

　本発明は、上記に鑑みてなされたものであって、適切に周辺音の確認を可能にすることを目的とする。

　上述した課題を解決し、目的を達成するために、本発明に係る音声出力制御装置は、ユーザの顔の向きの状態を検出する向き検出部と、前記ユーザの周辺音を取得する周辺音取得部と、前記周辺音取得部が取得した周辺音に基づき、周辺音を低減する処理を行う周辺音低減処理部と、前記向き検出部が、前記ユーザの顔の向きの状態が第一状態である場合は、前記周辺音低減処理部による周辺音を低減した音声を出力し、前記ユーザの顔の向きの状態が前記第一状態から第二状態に変化した場合は、前記周辺音低減処理部による周辺音を低減した状態よりは周辺音が聞こえやすい状態とする音声出力制御部と、を備える。

　本発明に係る音声出力制御装置は、ユーザの視線方向を検出する視線検出部と、前記ユーザの周辺音を取得する周辺音取得部と、前記視線検出部の検出結果に基づき、前記ユーザがコンテンツを表示した表示画面を注視しているか否かを判断する注視判断部と、前記注視判断部が、前記ユーザがコンテンツを表示した表示画面を注視していると判断した場合と、注視していないと判断した場合とで、前記周辺音取得部が取得した周辺音の出力の状態を変更して音声を出力する音声出力制御部と、を備える。

　本発明に係る音声出力システムは、上記の音声出力制御装置と、周辺音を収音する収音部と、音声を出力する音声出力部と、を備える。

　本発明に係る音声出力制御方法は、音声出力装置を利用しているユーザの顔の向きの状態を検出するステップと、前記ユーザの周辺音を取得するステップと、前記ユーザの顔の向きの状態が第一状態である場合は、取得した周辺音に基づき周辺音を低減した音声を出力し、前記ユーザの顔の向きの状態が前記第一状態から第二状態に変化した場合は、周辺音を低減した状態よりは周辺音が聞こえやすい状態とするステップと、を含む。

　本発明に係るプログラムは、音声出力装置を利用しているユーザの顔の向きの状態を検出するステップと、前記ユーザの周辺音を取得するステップと、前記ユーザの顔の向きの状態が第一状態である場合は、取得した周辺音に基づき周辺音を低減した音声を出力し、前記ユーザの顔の向きの状態が前記第一状態から第二状態に変化した場合は、周辺音を低減した状態よりは周辺音が聞こえやすい状態とするステップと、をコンピュータに実行させる。

　本発明に係る音声出力制御方法は、音声出力装置を利用しているユーザの視線方向を検出するステップと、前記ユーザの周辺音を取得するステップと、視線方向の検出結果に基づき、前記ユーザがコンテンツを表示した表示画面を注視しているか否かを判断するステップと、前記ユーザがコンテンツを表示した表示画面を注視していると判断した場合と、注視していないと判断した場合とで、周辺音の出力の状態を変更して音声を出力するステップと、を含む。

　本発明に係るプログラムは、音声出力装置を利用しているユーザの視線方向を検出するステップと、前記ユーザの周辺音を取得するステップと、視線方向の検出結果に基づき、前記ユーザがコンテンツを表示した表示画面を注視しているか否かを判断するステップと、前記ユーザがコンテンツを表示した表示画面を注視していると判断した場合と、注視していないと判断した場合とで、周辺音の出力の状態を変更して音声を出力するステップと、をコンピュータに実行させる。

　本発明によれば、適切に周辺音の確認できるという効果を奏する。

図１は、第一実施形態に係る音声出力システムとしての音声出力装置を示すブロック図である。図２は、音声出力装置の向きを説明する概略図である。図３は、音声出力装置の向きを説明する概略図である。図４は、第一実施形態に係る音声出力システムにおける処理の流れの一例を示すフローチャートである。図５は、第一実施形態に係る音声出力システムにおける処理の流れの他の例を示すフローチャートである。図６は、第二実施形態に係る音声出力システムの概略図である。図７は、第二実施形態に係る音声出力システムのブロック図である。図８は、第三実施形態に係る音声出力システムのブロック図である。図９は、第三実施形態に係る音声出力システムにおける処理の流れの一例を示すフローチャートである。図１０は、第四実施形態に係るコンテンツ出力システムを示すブロック図である。図１１は、第四実施形態に係るコンテンツ出力システムにおける処理の流れの一例を示すフローチャートである。図１２は、第四実施形態に係るコンテンツ出力システムにおける処理の流れの他の例を示すフローチャートである。図１３は、第五実施形態に係るコンテンツ出力システムのブロック図である。図１４は、第五実施形態に係るコンテンツ出力システムにおける処理の流れの一例を示すフローチャートである。図１５は、第六実施形態に係るコンテンツ出力システムのブロック図である。図１６は、第六実施形態に係るコンテンツ出力システムにおける処理の流れの一例を示すフローチャートである。図１７は、第七実施形態に係るコンテンツ出力システムを示すブロック図である。図１８は、第七実施形態に係るコンテンツ出力システムにおける処理の流れの一例を示すフローチャートである。図１９は、第七実施形態に係るコンテンツ出力システムにおける処理の流れの他の例を示すフローチャートである。図２０は、第八実施形態に係るコンテンツ出力システムのブロック図である。図２１は、第八実施形態に係るコンテンツ出力システムにおける処理の流れの一例を示すフローチャートである。図２２は、第九実施形態に係るコンテンツ出力システムのブロック図である。図２３は、第九実施形態に係るコンテンツ出力システムにおける処理の流れの一例を示すフローチャートである。

　以下に添付図面を参照して、本発明に係る音声出力システム１の実施形態を詳細に説明する。なお、以下の実施形態により本発明が限定されるものではない。

［第一実施形態］
＜音声出力システム＞
　図１は、第一実施形態に係る音声出力システム１としての音声出力装置１０を示すブロック図である。音声出力装置は、例えば、ヘッドホン１０である。本実施形態では、音声出力システム１は、ヘッドホン１０単体で構成される。

＜ヘッドホン＞
　ヘッドホン１０は、音声を出力したり、周辺の音声のノイズをキャンセルしたりする。ヘッドホン１０は、例えばオーバーヘッド式で、ユーザの頭に装着する。ヘッドホン１０は、音声出力制御装置２０から出力される音声データに基づいて、音声を出力する。ヘッドホン１０は、音声出力制御装置２０から出力される制御信号に基づいて、周辺のノイズをキャンセル可能である。ヘッドホン１０は、音声出力制御装置２０を内蔵している。ヘッドホン１０は、左音声出力部１１と右音声出力部１２と音声入力部１３と左マイクロフォン１４と右マイクロフォン１５とセンサ１６と音声出力制御装置２０とを有する。

　左音声出力部１１は、左耳用の音声出力部である。左音声出力部１１は、左耳を覆う筐体を有する。左音声出力部１１は、左耳において視聴させる音声を出力する。左音声出力部１１は、音声出力制御装置２０から音声データを取得する。左音声出力部１１は、音声データの左チャンネルデータを出力する。左音声出力部１１は、音声データの左チャンネルデータをＤ／Ａ変換して得られた電気信号を音に変換して出力する。

　右音声出力部１２は、右耳用の音声出力部である。右音声出力部１２は、右耳において視聴させる音声を出力する。右音声出力部１２は、音声出力制御装置２０から音声データを取得する。右音声出力部１２は、音声データの右チャンネルデータを出力する。右音声出力部１２は、音声データの右チャンネルデータをＤ／Ａ変換して得られた電気信号を音に変換して出力する。

　音声入力部１３は、例えば音楽または映像などのコンテンツの音声データが入力される。音声入力部１３は、例えば図示しない記憶部に記憶された音声データが入力されてもよい。音声入力部１３は、例えば図示しない電子書籍端末、スマートフォン、タブレット端末、携帯用音楽再生装置、および、携帯用ゲーム機などの電子機器から、有線または無線で音声データが入力されてもよい。

　左マイクロフォン１４は、左音声出力部１１の筐体に配置されている。左マイクロフォン１４は、周辺音を取得する。周辺音は、例えば第三者の話し声および乗物の騒音などを含む環境音である。左マイクロフォン１４は、取得した音声を周辺音取得部２４に出力する。

　右マイクロフォン１５は、右音声出力部１２の筐体に配置されている。右マイクロフォン１５は、周辺音を取得する。右マイクロフォン１５は、取得した音声を周辺音取得部２４に出力する。

　センサ１６は、ヘッドホン１０の姿勢、言い換えると、ヘッドホン１０の向きを検出する。言い換えると、センサ１６は、ヘッドホン１０を装着したユーザの顔の向きを検出する。センサ１６は、例えば３軸の加速度センサなどの各種センサを利用してヘッドホン１０の姿勢を検出する。各種センサから姿勢を算出する方法は、公知のいずれの方法を使用してもよい。センサ１６は、検出結果を向き検出部２１へ出力する。センサ１６は、左音声出力部１１の筐体および右音声出力部１２の筐体にそれぞれ配置されることが好ましい。これにより、高精度にヘッドホン１０の姿勢を検出可能である。

＜音声出力制御装置＞
　音声出力制御装置２０は、ヘッドホン１０から音声を出力したり、周辺のノイズをキャンセルしたりする。音声出力制御装置２０は、ユーザの顔の向きに応じて、周辺音を低減した音声を出力したり、周辺音を低減した状態よりは周辺音が聞こえやすい状態としたりする。音声出力制御装置２０は、例えば、ＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）または音声処理用プロセッサなどで構成された演算処理装置（制御部）である。音声出力制御装置２０は、図示しない記憶部に記憶されているプログラムをメモリにロードして、プログラムに含まれる命令を実行する。音声出力制御装置２０は、向き検出部２１と音声処理部２２と内部メモリである記憶部とが含まれる。音声処理部２２は、音声取得部２３と周辺音取得部２４と周辺音低減処理部２５と音声出力制御部２６とを有する。音声出力制御装置２０は、一または複数の装置で構成されていてもよい。

　向き検出部２１は、センサ１６の検出結果から、ヘッドホン１０の姿勢、言い換えると、ヘッドホン１０の向きを検出する。これにより、向き検出部２１は、ヘッドホン１０を装着したユーザの顔の向きを検出する。より詳しくは、向き検出部２１は、ユーザの顔の向きが第一状態であること、ユーザの顔の向きが第一状態と異なる第二状態であることを検出する。向き検出部２１は、例えばユーザの顔の向きが下方を向いている状態であること、ユーザの顔の向きが下方を向いていない状態であることを検出する。向き検出部２１は、例えばユーザの顔の向きの変化によって生じる加速度が閾値より小さいこと、ユーザの顔の向きの変化によって生じる加速度が閾値以上であることを検出可能である。

　ユーザの顔の向きが第一状態から第二状態に変わった場合、ユーザが周辺を見回すなど、ユーザの注意が周辺に向いた可能性が高い。ユーザの顔の向きが下方を向いている状態から下方を向いていない状態に変わった場合、ユーザが顔を上げて周辺を確認するなど、ユーザの注意が周辺に向いた可能性が高い。ユーザの顔の向きの変化によって生じる加速度が閾値以上である場合、ユーザが顔の向きを急激に変化させたことを示し、ユーザの注意が周辺に向いた可能性が高い。このように、ユーザの注意が周辺に向いた可能性が高い場合には、周辺音を低減するノイズキャンセルの機能をＯＦＦにして、周辺音を聞きやすい状態にすることが好ましい。

　図２および図３は、ユーザがヘッドホン１０のヘッドバンド１０１をユーザの頭頂部にかけて装着している場合のヘッドホンの向きを示す概略図である。図２は、ヘッドホン１０を横方向、具体的には、ユーザがヘッドホン１０を装着している状態の右横方向の右音声出力部１２側から見た場合の姿勢を示す図である。この場合、ヘッドホン１０を装着しているユーザの顔は、＋Ｙ方向を向いており、下方ではなく前方を向いている。図３は、ヘッドホン１０を横方向、具体的には図２と同様に、ユーザがヘッドホン１０を装着している状態の右横方向から見た場合の姿勢を示す図である。この場合、ヘッドホン１０を装着しているユーザの顔は、＋Ｙ方向である下方を向く。

　図２および図３に示すように、ヘッドホン１０を装着したユーザの顔の向きは、重力加速度Ｇが検出される方向に対するヘッドホン１０のＹ軸方向およびＺ軸方向の傾きによって規定される。ヘッドホン１０を装着したユーザがまっすぐ前を向いている状態から、下方を向いた状態になると、ヘッドホン１０は、図２に示す状態から図３に示す状態のように姿勢が変化する。

　例えば、ヘッドホン１０がユーザの頭に装着されている状態において、ヘッドホン１０の角度から、ユーザの顔が下を向いているか否かを判断する。例えば、図２に示す状態のように、重力加速度Ｇが検出される方向が、－Ｚ方向から±２０度以内であるときは、ユーザの顔の向きが下方を向いておらず、前方を向いていると判断する。また、図３に示す状態のように、重力加速度Ｇが検出される方向が、－Ｚから±２０度以上であるときは、ユーザの顔の向きが下方を向いていると判断する。なお、Ｚ軸に限定されず、Ｙ軸またはＺ軸とＹ軸との合成ベクトルなどを使用してもよい。

　ヘッドホン１０がユーザの頭に装着されているか否かは、センサ１６の検出結果によって判断可能である。センサ１６のＸ軸方向の検出結果がほぼ水平を示しており、＋Ｙ軸方向または－Ｙ軸方向から例えば±１０度以内に重力加速度が検出されていない場合、ヘッドホン１０がユーザの頭に装着されていると判断する。さらに、例えばヘッドバンド１０１の開き具合またはイヤーパッドへの圧力などを検出する他のセンサを使用してもよい。

　音声取得部２３は、左音声出力部１１と右音声出力部１２とから出力するための音声データを音声入力部１３から取得する。

　周辺音取得部２４は、左マイクロフォン１４と右マイクロフォン１５とから、ユーザの周辺音を取得する。

　周辺音低減処理部２５は、周辺音取得部２４が取得した周辺音に基づいて、周辺音のノイズキャンセルを行って周辺音を低減する。ノイズキャンセルの方法は、公知の方法を適用可能であり、周辺音の位相を逆にした信号を、音声入力部１３が取得した音声データに合成して、音声出力制御部２６に出力させる。

　音声出力制御部２６は、ヘッドホン１０から音声データを音として出力する制御を行う。より詳しくは、音声出力制御部２６は、音声データの左チャンネルデータをＤ／Ａ変換して増幅した信号を左音声出力部１１から出力させる。音声出力制御部２６は、音声データの右チャンネルデータをＤ／Ａ変換して増幅した信号を右音声出力部１２から出力させる。

　音声出力制御部２６は、向き検出部２１が、ユーザの顔の向きが第一状態である場合は、周辺音低減処理部２５による周辺音を低減した音声を出力し、ユーザの顔の向きが第一状態から第二状態に変化した場合は、周辺音低減処理部２５による周辺音を低減した状態よりは周辺音が聞こえやすい状態とする。

　音声出力制御部２６は、ユーザの顔の向きが下方を向いている状態である場合は、周辺音低減処理部２５による周辺音を低減した音声を出力し、ユーザの顔の向きが下方を向いている状態から下方を向いていない状態に変化した場合は、周辺音低減処理部２５による周辺音を低減した状態よりは周辺音が聞こえやすい状態とする。

　音声出力制御部２６は、ユーザの顔の向きの変化によって生じる加速度が閾値より小さい状態である場合は、周辺音低減処理部２５による周辺音を低減した音声を出力し、ユーザの顔の向きの変化によって生じる加速度が閾値以上である状態に変化した場合は、周辺音低減処理部２５による周辺音を低減した状態よりは周辺音が聞こえやすい状態とする。

　音声出力制御部２６は、周辺音低減処理部２５による周辺音を低減した状態よりは周辺音が聞こえやすい状態として、周辺音低減処理部２５による周辺音低減処理を行わないとしてもよい。この場合、音声出力制御部２６は、ノイズキャンセルをＯＦＦにする。これにより、ヘッドホン１０を装着しているユーザが、周辺音を聞きやすくなる。

　音声出力制御部２６は、周辺音低減処理部２５による周辺音を低減した状態よりは周辺音が聞こえやすい状態として、周辺音低減処理部２５による周辺音低減処理を行なわず、周辺音取得部２４が取得した周辺音を左音声出力部１１と右音声出力部１２とから出力してもよい。これにより、ヘッドホン１０を装着しているユーザが、左音声出力部１１と右音声出力部１２とから周辺音を聞けるようになる。

　次に、図４、図５を用いて、ヘッドホン１０における情報処理について説明する。図４は、第一実施形態に係る音声出力システム１における処理の流れの一例を示すフローチャートである。図５は、第一実施形態に係る音声出力システム１における処理の流れの他の例を示すフローチャートである。例えば、ヘッドホン１０の電源がＯＮになった場合、ヘッドホン１０がユーザの頭に装着された場合、ヘッドホン１０がコンテンツの音声を出力する機能を備えている場合、ヘッドホン１０から音声の出力が開始された場合、または、音声出力制御処理の開始操作がされた場合などに、図４、図５に示すフローチャートの処理が実行される。また、図４、図５に示すフローチャートの処理の開始時は、ノイズキャンセル処理が行われていることが前提である。

　まず、図４に示す処理について説明する。音声出力制御装置２０は、ユーザの顔の向きの状態が変化したか否かを判定する（ステップＳ１０１）。より詳しくは、向き検出部２１は、センサ１６の検出結果から、ヘッドホン１０の姿勢、言い換えると、ヘッドホン１０の向きを検出し、ヘッドホン１０の向きが変化したか否かを判定する。向き検出部２１によって、ユーザの顔の向きの状態に変化があったと判定する場合（ステップＳ１０１でＹｅｓ）、ステップＳ１０２へ進む。向き検出部２１によって、ユーザの顔の向きの状態に変化があったと判定しない場合（ステップＳ１０１でＮｏ）、ステップＳ１０４へ進む。ステップＳ１０１で判定するユーザの顔の向きの状態の変化の有無とは、ユーザの顔の向きが、Ｘ軸方向、Ｙ軸方向またはＺ軸方向の少なくともいずれかで、例えば１０度以上の変化があった場合に、ユーザの顔の向きの状態に変化があったと判定する。または、ステップＳ１０１で判定するユーザの顔の向きの状態の変化の有無とは、ユーザの顔の向きが変わったときの加速度が閾値以上であった場合に、ユーザの顔の向きの状態に変化があったと判定する。この場合の閾値とは、ユーザの顔が急に異なる方向を向いたときに発生するような加速度を検出するような閾値である。

　ユーザの顔の向きの状態に変化があったと判定する場合（ステップＳ１０１でＹｅｓ）、音声出力制御装置２０は、ステップＳ１０１で検出されたユーザの顔の向きの状態の変化が、第一状態から第二状態への変化であるか否かを判定する（ステップＳ１０２）。より詳しくは、音声出力制御部２６は、ステップＳ１０１で検出されたユーザの顔の向きの状態の変化が、ユーザの顔が下方を向いている第一状態から、ユーザの顔が下方を向いていない第二状態への変化であるか否かを判定する。または、音声出力制御部２６は、ステップＳ１０１で検出されたユーザの顔の向きの状態の変化が、ユーザの顔の向きの変化によって生じる加速度が閾値より小さい第一状態から、ユーザの顔の向きの変化によって生じる加速度が閾値より大きい第二状態への変化であるか否かを判定する。

　ユーザの顔の向きの状態の変化が、第一状態から第二状態への変化であると判定する場合（ステップＳ１０２でＹｅｓ）、音声出力制御装置２０は、ステップＳ１０３へ進む。ユーザの顔の向きの状態の変化が、第一状態から第二状態への変化であると判定しない場合（ステップＳ１０２でＮｏ）、音声出力制御装置２０は、ステップＳ１０４へ進む。

　ユーザの顔の向きの状態の変化が、第一状態から第二状態への変化であると判定する場合（ステップＳ１０２でＹｅｓ）、音声出力制御装置２０は、ノイズキャンセルをＯＦＦにする（ステップＳ１０３）。より詳しくは、音声出力制御部２６は、周辺音低減処理部２５によるノイズキャンセルをＯＦＦにする。なお、音声出力制御部２６は、コンテンツの音声を左音声出力部１１と右音声出力部１２とから出力してもよい。この状態では、周囲の音声が聞こえやすい状態で、左音声出力部１１と右音声出力部１２とからコンテンツの音声が出力される。音声出力制御装置２０は、ステップＳ１０４へ進む。

　音声出力制御装置２０は、ヘッドホン１０の利用を終了するか否かを判定する（ステップＳ１０４）。例えば、ヘッドホン１０の電源がＯＦＦになった場合、ヘッドホン１０がユーザの頭から取り外された場合、ヘッドホン１０から音声の出力が停止された場合、または、音声出力制御処理の終了操作がされた場合などに、利用を終了すると判定して（ステップＳ１０４でＹｅｓ）、処理を終了する。音声出力制御装置２０は、上記に該当しない場合、利用を終了すると判定せずに（ステップＳ１０４でＮｏ）、ステップＳ１０５へ進む。

　音声出力制御装置２０は、利用を終了すると判定しない場合（ステップＳ１０４でＮｏ）、所定期間経過したか否かを判定する（ステップＳ１０５）。より詳しくは、音声出力制御部２６は、ステップＳ１０３でノイズキャンセルがＯＦＦとなってから、例えば３０秒間から1分間程度の予め設定された期間が経過したか否かを判定する。この場合の所定期間とは、ユーザが周辺音を確認するために適切な期間である。音声出力制御部２６によって、所定期間経過したと判定しない場合（ステップＳ１０５でＮｏ）、再度ステップＳ１０５の判定を行い、所定期間経過したと判定した場合（ステップＳ１０５でＹｅｓ）、ステップＳ１０６へ進む。

　ステップＳ１０５で、所定期間経過したと判定した場合（ステップＳ１０５でＹｅｓ）、音声出力制御装置２０は、ノイズキャンセルをＯＮとして（ステップＳ１０６）、ステップＳ１０１へ進む。

　つづいて、図５に示す処理について説明する。図５に示すフローチャートのステップＳ１１１、ステップＳ１１２、ステップＳ１１４、ステップ１１５は、図４に示すフローチャートのステップＳ１０２、ステップＳ１０２、ステップＳ１０４、ステップＳ１０５と同様の処理を行う。

　ユーザの顔の向きの状態が、第一状態から第二状態への変化であると判定する場合（ステップＳ１１２でＹｅｓ）、音声出力制御装置２０は、ノイズキャンセルをＯＦＦにして、周辺音を出力する（ステップＳ１１３）。より詳しくは、音声出力制御部２６は、周辺音低減処理部２５によるノイズキャンセルをＯＦＦにして、周辺音取得部２４が取得した周辺音を左音声出力部１１と右音声出力部１２とから出力する。なお、音声出力制御部２６は、コンテンツの音声を左音声出力部１１と右音声出力部１２とから出力してもよい。この状態では、周囲の音声が聞こえやすい状態で、左音声出力部１１と右音声出力部１２とからコンテンツの音声とともに、周辺音が出力される。音声出力制御装置２０は、ステップＳ１１４へ進む。

　ステップＳ１１５で、所定期間経過したと判定した場合（ステップＳ１１５でＹｅｓ）、音声出力制御装置２０は、ノイズキャンセルをＯＮにするとともに、周辺音の出力を停止し（ステップＳ１１６）、ステップＳ１１１へ進む。

　このようにして、ヘッドホン１０を装着しているユーザの顔の向きの状態が第一状態から第二状態に変わった場合、ユーザの顔の向きが下方を向いている状態から下方を向いていない状態に変わった場合、または、ユーザの顔の向きの変化によって生じる加速度が閾値以上である場合、周辺音を低減した状態よりは周辺音が聞こえやすい状態とする。

＜効果＞
　上述したように、本実施形態は、ユーザの顔の向きの状態が第一状態から第二状態に変わった場合、ユーザの顔の向きが下方を向いている状態から下方を向いていない状態に変わった場合、または、ユーザの顔の向きの変化によって生じる加速度が閾値以上である場合、周辺音を低減した状態よりは周辺音が聞こえやすくできる。本実施形態によれば、ユーザが周辺に注意を向けたと推定される状態となった場合に、周辺音がノイズキャンセルされた状態より、適切に周辺音を確認できる。このようにして、本実施形態によれば、ユーザが周辺音を聞きたいときに、適切に周辺音を確認できる。

　本実施形態では、ユーザの顔の向きの状態が第一状態から第二状態に変わった場合、ユーザの顔の向きが下方を向いている状態から下方を向いていない状態に変わった場合、または、ユーザの顔の向きの変化によって生じる加速度が閾値以上である場合、周辺音を低減した状態よりは周辺音が聞こえやすくする。これらの場合は、いずれもユーザの注意が周辺に向いた可能性が高い。本実施形態によれば、ユーザの注意が周辺に向いた可能性が高い場合に、ノイズキャンセルの機能をＯＦＦにして、周辺音を聞きやすい状態にできる。

　本実施形態では、周辺音を低減した状態よりは周辺音が聞こえやすい状態として、周辺音低減処理部２５による周辺音低減処理を行わない、または、周辺音低減処理を行なわず、周辺音取得部２４が取得した周辺音を左音声出力部１１と右音声出力部１２とから出力する。本実施形態によれば、周辺音を聞こえやすくできる。

　ユーザの顔の向きの状態が第一状態から第二状態に変わる場合とは、例えば、ユーザがヘッドホン１０で音楽等を聴きながら、交通機関の座席に着座し、下方を向いている状態で、ユーザが交通機関内の放送により停車駅などの情報を知りたく、顔を上げる動作を行う。このような動作を行うことで、ユーザの顔の向きの状態が第一状態から第二状態に変わる。

［第二実施形態］
　図６は、第二実施形態に係る音声出力システム１Ａの概略図である。図７は、第二実施形態に係る音声出力システム１Ａのブロック図である。音声出力システム１Ａは、音声出力装置としてのヘッドホン１０Ａと、例えば、電子書籍端末、スマートフォン、タブレット端末、携帯用音楽再生装置、および、携帯用ゲーム機などの電子機器３０Ａとを含む。言い換えると、音声出力システム１Ａは、音声出力装置としてのヘッドホン１０Ａと電子機器３０Ａとの組み合わせである。

　ヘッドホン１０Ａは、電子機器３０Ａと有線または無線でデータを送受信可能に接続されている。ヘッドホン１０Ａは、電子機器３０Ａから出力される音声信号を出力する。

　電子機器３０Ａは、音声入力部１３と同様の機能を有する音声入力部３１Ａと、音声出力制御装置２０と同様の機能を有する音声出力制御装置４０Ａとを有する。

　図７におけるヘッドホン１０Ａの構成は、図１に示すヘッドホン１０の構成に含まれる構成と同等である。また、図７における電子機器３０Ａの構成は、図１に示すヘッドホン１０の構成に含まれる構成に対して、音声出力制御装置４０Ａが音声出力制御装置２０に対応し、音声処理部４２Ａが音声処理部２２に対応する。同様に、音声取得部４３Ａが音声取得部２３に対応し、周辺音取得部４４Ａが周辺音取得部２４に対応し、周辺音低減処理部４５Ａが周辺音低減処理部２５に対応し、音声出力制御部４６Ａが音声出力制御部２６に対応し、向き検出部４１Ａが向き検出部２１に対応して、各々同等の構成である。

　上述したように、本実施形態のように音声出力装置としてのヘッドホン１０Ａと電子機器３０Ａとの組み合わせても、第一実施形態と同様に適切に周辺音を確認できる。

［第三実施形態］
　図８、図９を参照しながら、本実施形態に係る音声出力システム１Ｂについて説明する。図８は、第三実施形態に係る音声出力システム１Ｂのブロック図である。図９は、第三実施形態に係る音声出力システム１Ｂにおける処理の流れの一例を示すフローチャートである。音声出力システム１Ｂは、基本的な構成は第二実施形態の音声出力システム１Ａと同様である。本実施形態では、電子機器３０Ｂは、ＧＮＳＳ（Global　Navigation　Satellite　System）受信部３２Ｂと位置情報算出部４７Ｂと判断部４８Ｂとを有する。

　ＧＮＳＳ受信部３２Ｂは、ＧＮＳＳ衛星からのＧＮＳＳ信号を受信するＧＮＳＳ受信機などで構成される。ＧＮＳＳ受信部３２Ｂは、受信したＧＮＳＳ信号を位置情報算出部４７Ｂに出力する。

　位置情報算出部４７Ｂは、ＧＮＳＳ受信部３２ＢからＧＮＳＳ信号を受け付ける。位置情報算出部４７Ｂは、ＧＮＳＳ信号に基づいて、現在位置情報を算出する。位置情報算出部４７ＢおよびＧＮＳＳ受信部３２Ｂは、ＧＮＳＳ信号に限らず、他の方式の測位衛星システムに対応していてもよい。

　判断部４８Ｂは、ユーザが交通機関を利用しているか否かを判断する。例えば、判断部４８Ｂは、位置情報算出部４７Ｂが算出した位置情報に基づいて、ヘッドホン１０Ｂを装着したユーザの現在位置が、図示しない地図情報の交通機関の位置情報に該当する場合や、移動履歴や移動速度に基づいて、交通機関を利用していると判断してもよい。判断部４８Ｂは、交通機関を利用しているかを判断する方法は限定されず、例えば、ヘッドホン１０Ｂの周辺のノイズまたは振動を利用するような他の方法によって判断されてもよい。

　次に、図９を用いて、音声出力システム１Ｂにおける情報処理について説明する。図９に示すフローチャートのステップＳ１２２ないしステップＳ１２４、ステップＳ１２６およびステップＳ１２７は、図４に示すフローチャートのステップＳ１０１ないしステップＳ１０３、ステップＳ１０５およびステップＳ１０６と同様の処理を行う。

　音声出力制御装置４０Ｂは、交通機関を利用しているか否かを判断する（ステップＳ１２１）。より詳しくは、判断部４８Ｂによって、位置情報算出部４７Ｂが算出した位置情報に基づいて、ユーザの現在位置が、地図情報の交通機関の位置情報に該当する場合などの判断結果に基づき、交通機関を利用していると判断する。判断部４８Ｂによって、交通機関を利用していると判断する場合（ステップＳ１２１でＹｅｓ）、ステップＳ１２２へ進む。判断部４８Ｂによって、交通機関を利用していると判断しない場合（ステップＳ１２１でＮｏ）、処理を終了する。

　ステップＳ１２５における利用終了の判断は、ヘッドホン１０Ｂまたは電子機器３０Ｂの利用終了の判断に加えて、音声出力制御装置４０Ｂは、交通機関の利用を終了するか否かも判断する（ステップＳ１２５）。より詳しくは、判断部４８Ｂによって、位置情報算出部４７Ｂが算出した位置情報に基づいて、ユーザの現在位置が、地図情報の交通機関の位置情報から外れる場合など、交通機関の利用が終了していることの検出によって、交通機関の利用を終了すると判断する。判断部４８Ｂによって、交通機関の利用を終了すると判断する場合（ステップＳ１２５でＹｅｓ）、処理を終了する。判断部４８Ｂによって、交通機関の利用を終了すると判断しない場合（ステップＳ１２５でＮｏ）、ステップＳ１２６へ進む。

＜効果＞
　上述したように、本実施形態は、ヘッドホン１０Ｂを装着したユーザが交通機関を利用している場合であって、ユーザの顔の向きが第一状態から第二状態に変わった場合、ユーザの顔の向きが下方を向いている状態から下方を向いていない状態に変わった場合、または、ユーザの顔の向きの変化によって生じる加速度が閾値以上である場合には、周辺音を低減した状態よりは周辺音が聞こえやすくできる。本実施形態によれば、ヘッドホン１０Ｂを装着したユーザが交通機関の利用中に、アナウンスなどを聞くために顔を上げた場合などに、アナウンスなどの周辺音を聞きやすくできる。本実施形態によれば、不用意にノイズキャンセルがＯＦＦされることを抑制できる。

［第四実施形態］
＜コンテンツ出力システム＞
　図１０は、第四実施形態に係るコンテンツ出力システム１Ｔを示すブロック図である。本実施形態では、音声出力制御装置の一実施形態であるコンテンツ出力制御装置４０Ｔについて説明する。コンテンツ出力システム１Ｔは、音声出力システムの一実施形態である。以下の実施形態においても同様である。コンテンツ出力制御装置４０Ｔが、音声出力制御装置に対応し、コンテンツ出力システム１Ｔが、音声出力システムに対応する。以下の説明においては、第一実施形態ないし第三実施形態の音声出力システム及び音声出力制御装置と同様の構成要素には、同一の符号または対応する符号を付したり、対応関係を記載したりして、その詳細な説明は省略する。コンテンツ出力システム１Ｔは、音声出力装置としてのヘッドホン１０Ｔと、例えば、電子書籍端末、スマートフォン、タブレット端末、携帯用音楽再生装置、および、携帯用ゲーム機など、映像および音声で構成されるコンテンツの再生や表示等を行う電子機器３０Ｔとを含む。言い換えると、コンテンツ出力システム１Ｔは、音声出力装置としてのヘッドホン１０Ｔと電子機器３０Ｔとの組み合わせである。コンテンツ出力システム１Ｔは、ユーザの視線方向に応じて、ヘッドホン１０Ｔから音声を出力したり、周辺の音声のノイズをキャンセルしたりする。

＜ヘッドホン＞
　ヘッドホン１０Ｔは、電子機器３０Ｔのコンテンツ出力制御装置４０Ｔから出力される音声データに基づいて、表示画面３６に表示したコンテンツに関する音声を出力する。ヘッドホン１０Ｔは、コンテンツ出力制御装置４０Ｔから出力される制御信号に基づいて、周辺のノイズをキャンセル可能である。ヘッドホン１０Ｔは、電子機器３０Ｔと有線または無線でデータを送受信可能に接続されている。ヘッドホン１０Ｔは、左音声出力部１１と右音声出力部１２と左マイクロフォン１４と右マイクロフォン１５とコンテンツ出力制御装置４０Ｔとを有する。ヘッドホン１０Ｔは、第二実施形態のヘッドホン１０Ａと同様に構成され、センサを有していない点で異なる。

＜電子機器＞
　電子機器３０Ｔは、コンテンツ入力部３１Ｔと、表示部３２Ｔ（図６参照）と、視線センサ３３Ｔと、コンテンツ出力制御装置４０Ｔとを有する。

　コンテンツ入力部３１Ｔは、第二実施形態の音声入力部３１Ａに対応する。コンテンツ入力部３１Ｔに入力されるコンテンツデータは、例えば、音声出力を伴うコンテンツデータであり、動画コンテンツ、ゲームコンテンツ、ＷＥＢコンテンツなどである。

　コンテンツデータには、コンテンツに関する映像データと音声データとを含む。コンテンツに関する映像データとは、表示画面３６に表示するコンテンツの映像データである。コンテンツに関する音声データとは、表示画面３６に表示されたコンテンツの映像データに対応して出力する音声の音声データである。コンテンツに関する音声データとは、例えば、電子書籍のテキスト読み上げの音声、ＷＥＢページのテキスト読み上げ音声および解説音声などでもよい。

　視線センサ３３Ｔは、電子機器３０Ｔの表示画面３６と同じ方向を向いて配置されている。視線センサ３３Ｔは、電子機器３０Ｔの表示画面３６と対面している人物の視線を検出するセンサである。視線センサ３３Ｔは、ユーザが表示画面３６を視認している状態では、ユーザの顔と向かい合う位置に配置されている。視線センサ３３Ｔは、例えば、電子機器３０Ｔの表示画面３６の上部に配置されている。視線センサ３３Ｔは、撮影した撮影データをコンテンツ出力制御装置４０Ｔの視線検出部４３Ｔへ出力する。

　視線センサ３３Ｔは、例えば、赤外ＬＥＤ群で構成された赤外光発光部と、一対の赤外線カメラとを含む。本実施形態では、視線センサ３３Ｔは、一対の赤外光発光部でユーザの顔方向に赤外光を照射し、赤外線カメラで撮影する。このようにして赤外線カメラで撮影した撮影映像から、後述する視線検出部４３Ｔが、ユーザの瞳孔と角膜反射の位置とに基づいて、ユーザの視線が表示画面３６を向いているか否かを判断する。さらに、ユーザの瞳孔と角膜反射の位置とに基づいて、表示画面３６におけるユーザの視線の位置が判断される。視線センサ３３Ｔは、可視光カメラなど、同様の機能を有する他の構成であってもよい。

　表示部３２Ｔは、コンテンツ入力部３１Ｔに入力されたコンテンツの映像を表示する。表示部３２Ｔは、液晶ディスプレイ（ＬＣＤ：Ｌｉｑｕｉｄ　Ｃｒｙｓｔａｌ　Ｄｉｓｐｌａｙ）または有機ＥＬ（Ｏｒｇａｎｉｃ　Ｅｌｅｃｔｒｏ－Ｌｕｍｉｎｅｓｃｅｎｃｅ）ディスプレイなどを含むディスプレイである。表示部３２Ｔは、表示制御部４２Ｔから出力された表示データに基づいて、コンテンツの映像を表示する。表示部３２Ｔは、映像が表示される表示画面３６を備える。

　ヘッドホン１０Ｔには、ヘッドホン１０Ｔがユーザの頭に装着されているか否かを検出するセンサが備えられていてもよい。具体的には、ヘッドホン１０Ｔには３軸の加速度センサが備えられ、重力加速度が検出されている方向に基づいて、ヘッドホン１０Ｔがユーザの頭に装着されていると判断する。さらに、例えばヘッドバンドの開き具合またはイヤーパッドへの圧力などを検出する他のセンサを使用してもよい。センサは、例えば第二実施形態のセンサ１６と同様の構成でもよい。

＜コンテンツ出力制御装置＞
　コンテンツ出力制御装置４０Ｔは、ヘッドホン１０Ｔから音声を出力したり、周辺のノイズをキャンセルしたりする。コンテンツ出力制御装置４０Ｔは、ユーザの視線方向に応じて、周辺音を低減した音声を出力したり、周辺音を低減した状態よりは周辺音が聞こえやすい状態としたりする。コンテンツ出力制御装置４０Ｔは、映像取得部４１Ｔと表示制御部４２Ｔと視線検出部４３Ｔと注視判断部４４Ｔと音声処理部５０Ｔと内部メモリである記憶部とが含まれる。音声処理部５０Ｔは、第一実施形態の音声処理部２２に対応する。コンテンツ出力制御装置４０Ｔは、一または複数の装置で構成されていてもよい。

　映像取得部４１Ｔは、表示部３２Ｔの表示画面３６に出力するためのコンテンツの映像データをコンテンツ入力部３１Ｔから取得する。

　表示制御部４２Ｔは、映像取得部４１Ｔが取得したコンテンツの映像データを表示部３２Ｔの表示画面３６に表示させる。

　視線検出部４３Ｔは、視線センサ３３Ｔが撮影した撮影データに基づいて、ユーザの視線方向を検出する。視線を検出する方法は限定されないが、本実施形態では、角膜反射によって視線を検出する。

　注視判断部４４Ｔは、視線検出部４３Ｔの検出結果に基づき、ユーザがコンテンツを表示した電子機器３０Ｔの表示画面３６を注視しているか否かを判断する。表示画面３６を注視しているとは、ユーザの視線方向に表示画面３６が位置した状態、言い換えると、ユーザの視線方向と表示画面３６とが交差する状態が、第一所定期間以上継続することをいう。第一所定期間とは、例えば５秒程度である。表示画面３６を注視していないとは、ユーザの視線方向が表示画面３６と異なる方向に向いている状態、言い換えると、ユーザの視線方向と表示画面３６とが交差しない状態が、第二所定期間以上継続することをいう。第二所定期間とは、例えば５秒程度である。

　周辺音低減処理部５４Ｔは、周辺音取得部５２が取得した周辺音に基づき、ユーザに対して音声を出力する左音声出力部１１と右音声出力部１２とが出力する音声に対して周辺音を低減する処理を行う。周辺音低減処理部５４Ｔは、周辺音取得部５２が取得した周辺音に基づいて、周辺音のノイズキャンセルを行って周辺音を低減する。ノイズキャンセルの方法は、公知の方法を適用可能であり、周辺音の位相を逆にした信号を、音声出力制御部２６に出力させる。

　音声出力制御部５３Ｔは、注視判断部４４Ｔが、ユーザがコンテンツを表示した表示画面３６を注視していると判断した場合と、注視していないと判断した場合とで、周辺音取得部５２が取得した周辺音の出力の状態を変更して音声を出力する。本実施形態では、音声出力制御部５３Ｔは、注視判断部４４Ｔによってユーザがコンテンツを表示した表示画面３６を注視していると判断した場合は、周辺音低減処理部５４Ｔによる周辺音を低減した音声を出力し、ユーザがコンテンツを表示した表示画面３６を注視していないと判断した場合は、周辺音低減処理部５４Ｔによる周辺音を低減した状態よりは周辺音が聞こえやすい状態とする。

　次に、図１１、図１２を用いて、ヘッドホン１０Ｔにおける情報処理について説明する。図１１は、第四実施形態に係るコンテンツ出力システム１Ｔにおける処理の流れの一例を示すフローチャートである。図１２は、第四実施形態に係るコンテンツ出力システム１Ｔにおける処理の流れの他の例を示すフローチャートである。例えば、ヘッドホン１０Ｔの電源がＯＮになった場合、ヘッドホン１０Ｔがユーザの頭に装着された場合、ヘッドホン１０Ｔから音声の出力が開始された場合、または、コンテンツ出力制御処理の開始操作がされた場合などに、図１１、図１２に示すフローチャートの処理が実行される。

　まず、図１１に示す処理について説明する。コンテンツ出力制御装置４０Ｔは、音声出力を伴うコンテンツが表示部３２Ｔに表示されているか否かを判断する（ステップＳＴ１０１）。より詳しくは、コンテンツ入力部３１Ｔに入力された、音声および映像からなるコンテンツが再生され、コンテンツの映像が表示部３２Ｔに表示され、コンテンツの音声がヘッドホン１０Ｔに出力されているか否かを判断する。言い換えると、音声および映像からなるコンテンツが再生されているか否かを判断する。音声出力を伴うコンテンツが表示部３２Ｔに表示されている状態とは、表示部３２Ｔにコンテンツの映像が表示され、コンテンツの音声がヘッドホン１０Ｔに出力されている状態であり、これらの出力は、コンテンツの再生が終了するまで継続される。

　音声出力を伴うコンテンツが表示部３２Ｔに表示されていると判断する場合（ステップＳＴ１０１でＹｅｓ）、ステップＳＴ１０２へ進む。音声出力を伴うコンテンツが表示部３２Ｔに表示されていると判断しない場合（ステップＳＴ１０１でＮｏ）、本処理を終了する。音声出力を伴うコンテンツが表示部３２Ｔに表示されていると判断する場合（ステップＳＴ１０１でＹｅｓ）、ユーザが表示画面３６を注視しているか否かを判断する（ステップＳＴ１０２）。より詳しくは、注視判断部４４Ｔによって、視線検出部４３Ｔの検出結果から、ユーザがコンテンツを表示した電子機器３０Ｔの表示画面３６を注視しているか否かを判断する。注視判断部４４Ｔによって、ユーザが表示画面３６を注視していると判断する場合（ステップＳＴ１０２でＹｅｓ）、ステップＳＴ１０３へ進む。注視判断部４４Ｔによって、ユーザが表示画面３６を注視していると判断しない場合（ステップＳＴ１０２でＮｏ）、ステップＳＴ１０４へ進む。

　ユーザが表示画面３６を注視していると判断する場合（ステップＳＴ１０２でＹｅｓ）、コンテンツ出力制御装置４０Ｔは、ノイズキャンセルをＯＮにする（ステップＳＴ１０２）。より詳しくは、音声出力制御部５３Ｔは、周辺音低減処理部５４Ｔによるノイズキャンセルを行う。なお、音声出力制御部５３Ｔは、コンテンツの音声を左音声出力部１１と右音声出力部１２とから出力してもよい。この状態では、左音声出力部１１と右音声出力部１２とからコンテンツの音声が出力される。コンテンツ出力制御装置４０Ｔは、ステップＳＴ１０５へ進む。

　ステップＳＴ１０３の処理は、ステップＳＴ１０１でＹｅｓのときにノイズキャンセルが既にＯＮとなっていた場合はノイズキャンセルがＯＮの状態を継続し、ステップＳＴ１０１でＹｅｓのときにノイズキャンセルがＯＦＦとなっていた場合はノイズキャンセルをＯＮとする。

　ユーザが表示画面３６を注視していると判断しない場合（ステップＳＴ１０２でＮｏ）、コンテンツ出力制御装置４０Ｔは、ノイズキャンセルをＯＦＦにする（ステップＳＴ１０４）。より詳しくは、音声出力制御部５３Ｔは、周辺音低減処理部５４ＴによるノイズキャンセルをＯＦＦにする。なお、音声出力制御部５３Ｔは、コンテンツの音声を左音声出力部１１と右音声出力部１２とから出力してもよい。この状態では、周囲の音声が聞こえやすい状態で、左音声出力部１１と右音声出力部１２とからコンテンツの音声が出力される。コンテンツ出力制御装置４０Ｔは、ステップＳＴ１０５へ進む。

　ステップＳＴ１０４の処理は、ステップＳＴ１０１でＹｅｓのときにノイズキャンセルが既にＯＮとなっていた場合はノイズキャンセルをＯＦＦとし、ステップＳＴ１０１でＹｅｓのときにノイズキャンセルがＯＦＦとなっていた場合はノイズキャンセルがＯＦＦの状態を継続する。

　コンテンツ出力制御装置４０Ｔは、ヘッドホン１０Ｔや電子機器３０Ｔなどのコンテンツ出力システム１Ｔの利用を終了するか否かを判断する（ステップＳＴ１０５）。例えば、ヘッドホン１０Ｔや電子機器３０Ｔの電源がＯＦＦになった場合、ヘッドホン１０Ｔがユーザの頭から取り外された場合、ヘッドホン１０Ｔへの音声の出力が停止された場合、または、コンテンツ出力制御処理の終了操作がされた場合などに、利用を終了すると判断して（ステップＳＴ１０５でＹｅｓ）、処理を終了する。コンテンツ出力制御装置４０Ｔは、上記に該当しない場合、利用を終了すると判断せずに（ステップＳＴ１０５でＮｏ）、ステップＳＴ１０１の処理を再度実行する。

　つづいて、図１２に示す処理について説明する。図１２に示すフローチャートのステップＳＴ１１１、ステップＳＴ１１２、ステップＳＴ１１３、ステップＳＴ１１５は、図１１に示すフローチャートのステップＳＴ１０１、ステップＳＴ１０２、ステップＳＴ１０３、ステップＳＴ１０５と同様の処理を行う。

　ユーザが表示画面３６を注視していると判断しない場合（ステップＳＴ１１２でＮｏ）、コンテンツ出力制御装置４０Ｔは、ノイズキャンセルをＯＦＦにして、周辺音を出力する（ステップＳＴ１１４）。より詳しくは、音声出力制御部５３Ｔは、周辺音低減処理部５４ＴによるノイズキャンセルをＯＦＦにして、周辺音取得部５２が取得した周辺音を左音声出力部１１と右音声出力部１２とから出力する。なお、音声出力制御部５３Ｔは、コンテンツの音声を左音声出力部１１と右音声出力部１２とから出力してもよい。この状態では、周囲の音声が聞こえやすい状態で、左音声出力部１１と右音声出力部１２とからコンテンツの音声とともに、周辺音が出力される。コンテンツ出力制御装置４０Ｔは、ステップＳＴ１１５へ進む。

　ステップＳＴ１１３の処理は、ステップＳＴ１１１でＹｅｓのときにノイズキャンセルが既にＯＮとなっていた場合はノイズキャンセルがＯＮの状態を継続し、ステップＳＴ１１１でＹｅｓのときにノイズキャンセルがＯＦＦであり周辺音が出力されている状態となっていた場合はノイズキャンセルをＯＮとして周辺音の出力を停止する。

　ステップＳＴ１１４の処理は、ステップＳＴ１１１でＹｅｓのときにノイズキャンセルが既にＯＮとなっていた場合はノイズキャンセルをＯＦＦとして周辺音を出力し、ステップＳＴ１１１でＹｅｓのときにノイズキャンセルがＯＦＦであり周辺音が出力されている状態となっていた場合はノイズキャンセルがＯＦＦの状態と周辺音の出力とを継続する。

　このようにして、ヘッドホン１０Ｔを装着しているユーザが表示画面３６を注視している場合、周辺音を低減し、ヘッドホン１０Ｔを装着しているユーザが表示画面３６を注視していない場合、周辺音を低減した状態よりは周辺音が聞こえやすい状態とする。

＜効果＞
　上述したように、本実施形態は、ヘッドホン１０Ｔを装着しているユーザが表示画面３６を注視している場合、周辺音を低減し、ユーザが表示画面３６を注視していない場合、周辺音を低減した状態よりは周辺音が聞こえやすくできる。本実施形態によれば、ユーザが表示画面３６を注視することを中断して、ユーザが周辺に注意を向けたと推定される状態となった場合に、周辺音がノイズキャンセルされた状態より、適切に周辺音を確認できる。このようにして、本実施形態によれば、ユーザが周辺音を聞きたいときに、ユーザが操作をしなくても、適切に周辺音を確認できる。

　本実施形態では、周辺音を低減した状態よりは周辺音が聞こえやすい状態として、周辺音低減処理部５４Ｔによる周辺音低減処理を行わない、または、周辺音低減処理を行なわず、周辺音取得部５２が取得した周辺音を左音声出力部１１と右音声出力部１２とから出力する。本実施形態によれば、周辺音を聞こえやすくできる。

［第五実施形態］
　図１３、図１４を参照しながら、本実施形態に係るコンテンツ出力システム１ＴＡについて説明する。図１３は、第五実施形態に係るコンテンツ出力システム１ＴＡのブロック図である。図１４は、第五実施形態に係るコンテンツ出力システム１ＴＡにおける処理の流れの一例を示すフローチャートである。コンテンツ出力システム１ＴＡは、基本的な構成は第四実施形態のコンテンツ出力システム１Ｔと同様である。以下の説明においては、コンテンツ出力システム１Ｔと同様の構成要素には、同一の符号または対応する符号を付し、その詳細な説明は省略する。本実施形態では、電子機器３０ＴＡは、撮影部３３ＴＡと、コンテンツ出力制御装置４０ＴＡの顔検出部４８ＴＡとを有する点と、音声出力制御部５３ＴＡにおける処理とが、第四実施形態と異なる。

　撮影部３３ＴＡは、電子機器３０ＴＡの表示画面３６と対面している人物を撮影する可視光カメラである。撮影部３３ＴＡは、ユーザの顔を撮影する。撮影部３３ＴＡは、ユーザが表示画面３６を視認している状態では、ユーザの顔を撮影可能な位置に配置されている。撮影部３３ＴＡは、例えば、電子機器３０ＴＡの表示画面３６の上部に配置されている。撮影部３３ＴＡは、撮影した撮影データをコンテンツ出力制御装置４０ＴＡの顔検出部４８ＴＡへ出力する。撮影部３３ＴＡと視線センサ３３Ｔとは、同一の可視光カメラであってもよい。

　顔検出部４８ＴＡは、撮影部３３ＴＡが撮影した撮影データからユーザの顔を認識し、認識した顔の向きを検出する。より詳しくは、顔検出部４８ＴＡは、顔検出部４８ＴＡが検出した顔の向きが、表示画面３６に対して対向する向きであるか否かを検出する。例えばユーザがコンテンツが表示された表示画面３６を注視している場合には、ユーザの顔の向きは表示画面３６に対して対向する向きである。例えばユーザが周辺に注意を向けて周りを見回すような場合には、ユーザの顔の向きは表示画面３６に対して対向する向きではない。

　表示画面３６に対して対向する向きとは、ユーザが表示画面３６に表示されたコンテンツの画像などを視認可能な向きのことである。表示画面３６に対して対向する向きとは、例えば、上下方向視および左右方向視において、ユーザの両眼の中心を通り、ユーザの前方に延びる直線と、表示画面３６とが交差する角度が例えば、９０°±３０°程度の範囲など、明らかにユーザが表示画面３６を見ているとされる向きが定義されればよい。

　音声出力制御部５３ＴＡは、注視判断部４４Ｔによってユーザがコンテンツを表示した表示画面３６を注視していると判断したことに加えて、顔検出部４８ＴＡが検出した顔の向きが、表示画面３６に対して対向する向きである場合に、周辺音低減処理部５４Ｔによる周辺音を低減した音声を出力する。音声出力制御部５３ＴＡは、注視判断部４４Ｔによってユーザがコンテンツを表示した表示画面３６を注視していないと判断したことに加えて、顔検出部４８ＴＡが検出した顔の向きが、表示画面３６に対して対向する向きではない場合に、周辺音低減処理部５４Ｔによる周辺音を低減した状態よりは周辺音が聞こえやすい状態とする。ユーザがコンテンツを表示した表示画面３６を注視していない場合でも、ユーザの顔の向きが表示画面３６に対して対向する場合、ユーザがコンテンツの視聴を継続する意思があると推定される。この場合、周辺音の低減を継続することが好ましい。これに対して、ユーザがコンテンツを表示した表示画面３６を注視しておらず、かつ、ユーザの顔の向きが表示画面３６に対して対向していない場合、ユーザは周辺に高い注意を払っていると推定される。この場合、周辺音を確認可能にすることが好ましい。

　次に、図１４を用いて、コンテンツ出力システム１ＴＡにおける情報処理について説明する。図１４に示すフローチャートのステップＳＴ１２１、ステップＳＴ１２２、ステップＳＴ１２４ないしステップＳＴ１２６は、図１１に示すフローチャートのステップＳＴ１０１、ステップＳＴ１０２、ステップＳＴ１０３ないしステップＳＴ１０５と同様の処理を行う。

　コンテンツ出力制御装置４０ＴＡは、ユーザの顔は対向しているか否かを判断する（ステップＳＴ１２３）。より詳しくは、顔検出部４８ＴＡが検出した顔の向きが、表示画面３６に対して対向する向きである場合（ステップＳＴ１２３でＹｅｓ）、ステップＳＴ１２４へ進む。顔検出部４８ＴＡが検出した顔の向きが、表示画面３６に対して対向する向きではない場合（ステップＳＴ１２３でＮｏ）、ステップＳＴ１２５へ進む。

＜効果＞
　上述したように、本実施形態は、ユーザが表示画面３６を注視して、かつ、ユーザの顔の向きが表示画面３６に対して対向する場合、周辺音を低減して、ユーザが表示画面３６を注視していないで、かつ、ユーザの顔の向きが表示画面３６に対して対向する向きではない場合、周辺音を低減した状態よりは周辺音が聞こえやすくできる。本実施形態によれば、ユーザが顔の向きを表示画面３６に対向しない向きにして、ユーザが周辺に注意を向けたと状態されるときに、適切に周辺音を確認できる。

［第六実施形態］
　図１５、図１６を参照しながら、本実施形態に係るコンテンツ出力システム１ＴＢについて説明する。図１５は、第六実施形態に係るコンテンツ出力システム１ＴＢのブロック図である。図１６は、第六実施形態に係るコンテンツ出力システム１ＴＢにおける処理の流れの一例を示すフローチャートである。コンテンツ出力システム１ＴＢは、基本的な構成は図１３に示す第五実施形態のコンテンツ出力システム１ＴＡと同様である。本実施形態では、電子機器３０ＴＢは、ＧＮＳＳ受信部３４ＴＢとコンテンツ出力制御装置４０ＴＢの位置情報算出部４９ＴＢと判断部５０ＴＢとを有する点と音声出力制御部５３ＴＢにおける処理とが、第四実施形態と異なる。

　ＧＮＳＳ受信部３４ＴＢは、第三実施形態のＧＮＳＳ受信部３２Ｂと同様に構成されている。

　位置情報算出部４９ＴＢは、第三実施形態の位置情報算出部４７Ｂと同様に構成されている。

　判断部５０ＴＢは、第三実施形態の判断部４８Ｂと同様に構成されている。

　音声出力制御部５３ＴＢは、ユーザが交通機関を利用している場合に、ユーザがコンテンツを表示した表示画面３６を注視していると判断した場合は、周辺音低減処理部５４Ｔによる周辺音を低減した音声を出力し、ユーザがコンテンツを表示した表示画面３６を注視していないと判断した場合は、周辺音低減処理部５４Ｔによる周辺音を低減した状態よりは周辺音が聞こえやすい状態とする。

　次に、図１６を用いて、コンテンツ出力システム１ＴＢにおける情報処理について説明する。図１６に示すフローチャートのステップＳＴ１３１、ステップＳＴ１３６は、図９に示すフローチャートのステップＳ１２１、ステップＳ１２５と同様の処理を行う。図１６に示すフローチャートのステップＳＴ１３２ないしステップＳＴ１３５、は、図１１に示すフローチャートのステップＳＴ１０１ないしステップＳＴ１０４と同様の処理を行う。

＜効果＞
　上述したように、本実施形態は、ヘッドホン１０Ｔを装着したユーザが交通機関を利用している場合であって、ユーザが表示画面３６を注視している場合には、周辺音を低減し、ユーザが表示画面３６を注視していない場合には、周辺音を低減した状態よりは周辺音が聞こえやすくできる。本実施形態によれば、ヘッドホン１０Ｔを装着したユーザが交通機関の利用中に、アナウンスなどを聞くために顔の向きを表示画面３６と対向する向きから変えた場合などに、アナウンスなどの周辺音を聞きやすくできる。本実施形態によれば、不用意にノイズキャンセルがＯＦＦされることを抑制できる。

［第七実施形態］
＜コンテンツ出力システム＞
　図１７は、第七実施形態に係るコンテンツ出力システム１Ｕを示すブロック図である。コンテンツ出力システム１Ｕは、ユーザが表示画面３６を注視しているか否かに応じて、ヘッドホン１０Ｕから表示画面３６に表示したコンテンツに関する音声を出力したり、周辺の音声を出力したりする。コンテンツ出力システム１Ｕは、コンテンツ出力制御装置４０Ｕの音声処理部５０Ｕが、第四実施形態と異なる。

＜コンテンツ出力制御装置＞
　コンテンツ出力制御装置４０Ｕは、ユーザが表示画面３６を注視しているか否かに応じて、ヘッドホン１０Ｕからコンテンツに関する音声を出力したり、周辺音を出力したりする。　

　音声処理部５０Ｕは、第四実施形態と同様に構成された音声取得部５１と周辺音取得部５２と、音声出力制御部５３Ｕとを有する。

　音声出力制御部５３Ｕは、注視判断部４４Ｕが、ユーザがコンテンツを表示した表示画面３６を注視していると判断した場合と、注視していないと判断した場合とで、周辺音取得部５２が取得した周辺音の出力の状態を変更して音声を出力する。本実施形態では、音声出力制御部５３Ｕは、注視判断部４４Ｕが、ユーザがコンテンツを表示した表示画面３６を注視していると判断した場合は、音声取得部５１が取得したコンテンツに関する音声を出力し、ユーザがコンテンツを表示した表示画面３６を注視していないと判断した場合は、周辺音取得部５２が取得した周辺音を出力する。

　音声出力制御部５３Ｕは、注視判断部４４Ｕが、ユーザがコンテンツを表示した表示画面３６を注視していないと判断した場合は、音声取得部５１が取得したコンテンツに関する音声に加えて、周辺音取得部５２が取得した周辺音を出力してもよい。この場合は、コンテンツに関する音声とともに周辺音がヘッドホン１０Ｕから出力される。

　次に、図１８、図１９を用いて、ヘッドホン１０Ｕにおける情報処理について説明する。図１８は、第七実施形態に係るコンテンツ出力システム１Ｕにおける処理の流れの一例を示すフローチャートである。図１９は、第七実施形態に係るコンテンツ出力システム１Ｕにおける処理の流れの他の例を示すフローチャートである。例えば、ヘッドホン１０Ｕの電源がＯＮになった場合、ヘッドホン１０Ｕがユーザの頭に装着された場合、ヘッドホン１０Ｕから音声の出力が開始された場合、または、コンテンツ出力制御処理の開始操作がされた場合などに、図１８、図１９に示すフローチャートの処理が実行される。図１８に示すフローチャートのステップＳＵ１０１、ステップＳＵ１０２、ステップＳＵ１０５は、図１１に示すフローチャートのステップＳＴ１０１、ステップＳＴ１０２、ステップＳＴ１０５と同様の処理を行う。

　ユーザが表示画面３６を注視していると判断する場合（ステップＳＵ１０２でＹｅｓ）、コンテンツ出力制御装置４０Ｕは、コンテンツの音声を出力する（ステップＳＵ１０３）。より詳しくは、音声出力制御部５３Ｕは、音声取得部５１が取得した、コンテンツに関する音声をヘッドホン１０Ｕから出力する。これにより、ヘッドホン１０Ｕの左音声出力部１１と右音声出力部１２とからコンテンツの音声が出力される。コンテンツ出力制御装置４０Ｕは、ステップＳＵ１０５へ進む。

　ステップＳＵ１０３の処理は、ステップＳＵ１０１でＹｅｓのときに周辺音が出力されていない状態の場合は周辺音が出力されていない状態でコンテンツ音の出力を継続し、ステップＳＵ１０１でＹｅｓのときに周辺音が出力されている状態の場合はコンテンツ音の出力を継続し周辺音の出力を停止する。

　ユーザが表示画面３６を注視していると判断しない場合（ステップＳＵ１０２でＮｏ）、コンテンツ出力制御装置４０Ｕは、周辺音を出力する（ステップＳＵ１０４）。より詳しくは、音声出力制御部５３Ｕは、周辺音取得部５２が取得した周辺音を出力する。これにより、ヘッドホン１０Ｕの左音声出力部１１と右音声出力部１２とから周辺音が出力される。コンテンツ出力制御装置４０Ｕは、ステップＳＵ１０５へ進む。

　ステップＳＵ１０４の処理は、ステップＳＵ１０１でＹｅｓのときに周辺音が出力されていない状態の場合は周辺音の出力を開始し、ステップＳＵ１０１でＹｅｓのときに周辺音が出力されている状態の場合は周辺音の出力を維持する。

　つづいて、図１９に示す処理について説明する。図１９に示すフローチャートのステップＳＵ１１１、ステップＳＵ１１２、ステップＳＵ１１３、ステップＳＵ１１５は、図１８に示すフローチャートのステップＳＵ１０１、ステップＳＵ１０２、ステップＳＵ１０３、ステップＳＵ１０５と同様の処理を行う。

　ユーザが表示画面３６を注視していると判断しない場合（ステップＳＵ１１２でＮｏ）、コンテンツ出力制御装置４０Ｕは、コンテンツに関する音声とともに、周辺音を出力する（ステップＳＵ１１４）。より詳しくは、音声取得部５１が取得したコンテンツに関する音声とともに、周辺音取得部５２が取得した周辺音をヘッドホン１０Ｕの左音声出力部１１と右音声出力部１２とから出力する。コンテンツ出力制御装置４０Ｕは、ステップＳＵ１１５へ進む。

　ステップＳＵ１１３の処理は、ステップＳＵ１１１でＹｅｓのときに周辺音が出力されていない状態の場合は周辺音が出力されていない状態でコンテンツ音の出力を継続し、ステップＳＵ１１１でＹｅｓのときにコンテンツ音と周辺音が出力されている状態の場合はコンテンツ音の出力を継続し周辺音の出力を停止する。

　ステップＳＵ１１４の処理は、ステップＳＵ１１１でＹｅｓのときにコンテンツ音が出力され周辺音が出力されていない状態の場合はコンテンツ音の出力を維持した状態で周辺音の出力を開始し、ステップＳＵ１１１でＹｅｓのときにコンテンツ音と周辺音が出力されている状態の場合はコンテンツ音と周辺音の出力を維持する。

　ステップＳＵ１１４で、コンテンツ音とともに周辺音を出力する場合は、コンテンツ音の音量はユーザが設定した音量の状態であってもよく、周辺音を出力している期間のコンテンツ音の音量をユーザが設定した音量より低くしてもよい。

　このようにして、ヘッドホン１０Ｕを装着しているユーザが表示画面３６を注視している場合、コンテンツに関する音声を出力し、ユーザが表示画面３６を注視していない場合、周辺音を出力する。

＜効果＞
　上述したように、本実施形態は、ヘッドホン１０Ｕを装着しているユーザが表示画面３６を注視している場合、コンテンツの音声を出力し、ユーザが表示画面３６を注視していない場合、周辺音を出力できる。本実施形態によれば、ユーザが表示画面３６を注視することを中断して、ユーザが周辺に注意を向けたと推定される状態となった場合に、適切に周辺音を確認できる。このようにして、本実施形態によれば、ユーザが周辺音を聞きたいときに、ユーザが操作をしなくても、適切に周辺音を確認できる。

　本実施形態では、ユーザが表示画面３６を注視していない場合、コンテンツの音声とともに周辺音を出力できる。本実施形態によれば、コンテンツの視聴を継続しながら、周辺音を確認できる。

［第八実施形態］
　図２０、図２１を参照しながら、本実施形態に係るコンテンツ出力システム１ＵＡについて説明する。図２０は、第八実施形態に係るコンテンツ出力システム１ＵＡのブロック図である。図２１は、第八実施形態に係るコンテンツ出力システム１ＵＡにおける処理の流れの一例を示すフローチャートである。コンテンツ出力システム１ＵＡは、基本的な構成は第七実施形態のコンテンツ出力システム１Ｕと同様である。以下の説明においては、コンテンツ出力システム１Ｕと同様の構成要素には、同一の符号または対応する符号を付し、その詳細な説明は省略する。本実施形態では、電子機器３０ＵＡは、ＧＮＳＳ受信部３４ＵＡとコンテンツ出力制御装置４０ＵＡの位置情報算出部４５ＵＡと判断部４６ＡＵとを有する点と、音声出力制御部５３ＵＡにおける処理とが、第七実施形態と異なる。

　ＧＮＳＳ受信部３４ＵＡは、第三実施形態のＧＮＳＳ受信部３２Ｂと同様に構成されている。

　位置情報算出部４５ＵＡは、第三実施形態の位置情報算出部４７Ｂと同様に構成されている。

　判断部４６ＵＡは、第三実施形態の判断部４８Ｂと同様に構成されている。

　音声出力制御部５３ＵＡは、ユーザが交通機関を利用している場合に、ユーザがコンテンツを表示した表示画面３６を注視していると判断した場合は、音声取得部５１が取得したコンテンツに関する音声を出力し、ユーザがコンテンツを表示した表示画面３６を注視していないと判断した場合は、周辺音取得部５２が取得した周辺音を出力する。

　次に、図２１を用いて、コンテンツ出力システム１ＵＡにおける情報処理について説明する。図２１に示すフローチャートのステップＳＵ１２１、ステップＳＵ１２６は、図９に示すフローチャートのステップＳ１２１、ステップＳ１２５と同様の処理を行う。図２１に示すフローチャートのステップＳＵ１２２ないしステップＳＵ１２５、は、図１８に示すフローチャートのステップＳＵ１０１ないしステップＳＵ１０４と同様の処理を行う。

＜効果＞
　上述したように、本実施形態は、ヘッドホン１０Ｕを装着したユーザが交通機関を利用している場合であって、ユーザが表示画面３６を注視していない場合には、周辺音を出力する。本実施形態によれば、ヘッドホン１０Ｕを装着したユーザが交通機関の利用中に、アナウンスなどを聞くために、コンテンツの表示画面３６を注視しなくなった場合などに、アナウンスなどの周辺音をヘッドホン１０Ｕで聞くことができる。本実施形態によれば、不用意に周辺音が出力されることを抑制できる。

［第九実施形態］
　図２２、図２３を参照しながら、本実施形態に係るコンテンツ出力システム１ＵＢについて説明する。図２２は、第九実施形態に係るコンテンツ出力システム１ＵＢのブロック図である。図２３は、第九実施形態に係るコンテンツ出力システム１ＵＢにおける処理の流れの一例を示すフローチャートである。コンテンツ出力システム１ＵＢは、基本的な構成は第七実施形態のコンテンツ出力システム１Ｕと同様である。本実施形態では、電子機器３０ＵＢは、撮影部３５ＵＢと、コンテンツ出力制御装置４０ＵＢの顔検出部４７ＵＢとを有する点と、音声出力制御部５３ＵＢにおける処理とが、第七実施形態と異なる。

　撮影部３５ＵＢは、第五実施形態の撮影部３３ＴＡと同様に構成されている。

　顔検出部４７ＵＢは、第五実施形態の顔検出部４８ＴＡと同様に構成されている。

　音声出力制御部５３ＵＢは、注視判断部４４Ｕによってユーザがコンテンツを表示した表示画面３６を注視していると判断したことに加えて、顔検出部４７ＵＢが検出した顔の向きが、表示画面３６に対して対向する向きである場合に、音声取得部５１が取得したコンテンツに関する音声を出力する。音声出力制御部５３ＵＢは、注視判断部４４Ｕによってユーザがコンテンツを表示した表示画面３６を注視していないと判断したことに加えて、顔検出部４７ＵＢが検出した顔の向きが、表示画面３６に対して対向する向きではない場合に、周辺音取得部５２が取得した周辺音を出力する。ユーザがコンテンツを表示した表示画面３６を注視していない場合でも、ユーザの顔の向きが表示画面３６に対して対向する場合、ユーザがコンテンツの視聴を継続する意思があると推定される。この場合、コンテンツの視聴を継続させることが好ましい。これに対して、ユーザがコンテンツを表示した表示画面３６を注視しておらず、かつ、ユーザの顔の向きが表示画面３６に対して対向していない場合、ユーザは周辺に高い注意を払っていると推定される。この場合、周辺音を確認可能にすることが好ましい。

　次に、図２３を用いて、コンテンツ出力システム１ＵＢにおける情報処理について説明する。図２３に示すフローチャートのステップＳＵ１３１、ステップＳＵ１３２、ステップＳＵ１３４ないしステップＳＵ１３６は、図１８に示すフローチャートのステップＳＵ１０１、ステップＳＵ１０２、ステップＳＵ１０３ないしステップＳＵ１０５と同様の処理を行う。図２３に示すフローチャートのステップＳＵ１３３は、図１４に示すフローチャートのステップＳＴ１２３と同様の処理を行う。

＜効果＞
　上述したように、本実施形態は、ユーザが表示画面３６を注視して、かつ、ユーザの顔の向きが表示画面３６に対して対向する場合、コンテンツの音声を出力し、ユーザが表示画面３６を注視していないで、かつ、ユーザの顔の向きが表示画面３６に対して対向する向きではない場合、周辺音取得部５２が取得した周辺音を出力できる。本実施形態によれば、ユーザが顔の向きを表示画面３６に対向しない向きにして、ユーザが周辺に注意を向けたと状態されるときに、適切に周辺音を確認できる。

　図示した音声出力システム１の各構成要素は、機能概念的なものであり、必ずしも物理的に図示の如く構成されていなくてもよい。すなわち、各装置の具体的形態は、図示のものに限られず、各装置の処理負担や使用状況などに応じて、その全部または一部を任意の単位で機能的または物理的に分散または統合してもよい。

　音声出力システム１の構成は、例えば、ソフトウェアとして、メモリにロードされたプログラムなどによって実現される。上記実施形態では、これらのハードウェアまたはソフトウェアの連携によって実現される機能ブロックとして説明した。すなわち、これらの機能ブロックについては、ハードウェアのみ、ソフトウェアのみ、または、それらの組み合わせによって種々の形で実現できる。

　上記に記載した構成要素には、当業者が容易に想定できるもの、実質的に同一のものを含む。さらに、上記に記載した構成は適宜組み合わせが可能である。また、本発明の要旨を逸脱しない範囲において構成の種々の省略、置換または変更が可能である。

　上記では、周辺音が聞こえやすい状態の例として、周辺音低減処理を行わない状態とする例と、周辺音低減処理を行わず周辺音を出力する例とを示した。周辺音が聞こえやすい状態の例として、上記以外に、周辺音低減レベルを下げる、つまりノイズキャンセルレベルの効果を低減させてもよい。また、他の例として、ノイズキャンセルレベルの効果を低減させつつ周辺音を出力することとしてもよい。周辺音低減レベルを下げる処理とは、左マイクロフォン１４と右マイクロフォン１５とから取得した周辺音の位相を逆にして、音圧レベルを下げた信号を、音声入力部１３が取得した音声データに合成して、音声出力制御部２６に出力させる。

　また、上記では、周辺音が聞こえやすい状態とする処理を、左音声出力部１１と右音声出力部１２とに対して行ったが、左音声出力部１１と右音声出力部１２とのいずれか一方に対して行うこととしてもよい。例えば、ユーザが自らの利き耳の方で用いる音声出力部に対して、周辺音が聞こえやすい状態とする処理が行われるように設定してもよい。

　上記では、音声出力装置の一例としてヘッドホン１０について説明したが、これに限定されない。音声出力装置は、例えば、イヤホンおよび首掛け式のスピーカなどであってもよい。音声出力装置は、音声入力部１３を備えない、ノイズキャンセル機能のみを有する電子耳栓装置にも適用可能である。

　１　　　　音声出力システム
　１０　　　ヘッドホン（音声出力装置）
　１１　　　左音声出力部
　１２　　　右音声出力部
　１３　　　音声入力部
　１４　　　左マイクロフォン
　１５　　　右マイクロフォン
　１６　　　センサ
　２０　　　音声出力制御装置
　２１　　　向き検出部
　２２　　　音声処理部
　２３　　　音声取得部
　２４　　　周辺音取得部
　２５　　　周辺音低減処理部
　２６　　　音声出力制御部

Claims

　ユーザの顔の向きの状態を検出する向き検出部と、
　前記ユーザの周辺音を取得する周辺音取得部と、
　前記周辺音取得部が取得した周辺音に基づき、周辺音を低減する処理を行う周辺音低減処理部と、
　前記向き検出部が、前記ユーザの顔の向きの状態が第一状態である場合は、前記周辺音低減処理部による周辺音を低減した音声を出力し、前記ユーザの顔の向きの状態が前記第一状態から第二状態に変化した場合は、前記周辺音低減処理部による周辺音を低減した状態よりは周辺音が聞こえやすい状態とする音声出力制御部と、
　を備える、音声出力制御装置。
　前記第一状態は、前記ユーザの顔の向きが下方を向いている状態であり、
　前記第二状態は、前記ユーザの顔の向きが下方を向いていない状態である、
　請求項１に記載の音声出力制御装置。
　前記第一状態は、前記ユーザの顔の向きの変化によって生じる加速度が閾値より小さい状態であり、
　前記第二状態は、前記ユーザの顔の向きの変化によって生じる加速度が閾値以上である状態である、
　請求項１に記載の音声出力制御装置。
　前記ユーザが交通機関を利用していることを判断する判断部、をさらに備え、
　前記音声出力制御部は、前記ユーザが交通機関を利用している場合に、前記ユーザの顔の向きの状態が前記第一状態である場合は、前記周辺音低減処理部による周辺音を低減した音声を出力し、前記ユーザの顔の向きの状態が前記第一状態から前記第二状態に変化した場合は、前記周辺音低減処理部による周辺音を低減した状態よりは周辺音が聞こえやすい状態とする、
　請求項１から３のいずれか１項に記載の音声出力制御装置。
　ユーザの視線方向を検出する視線検出部と、
　前記ユーザの周辺音を取得する周辺音取得部と、
　前記視線検出部の検出結果に基づき、前記ユーザがコンテンツを表示した表示画面を注視しているか否かを判断する注視判断部と、
　前記注視判断部が、前記ユーザがコンテンツを表示した表示画面を注視していると判断した場合と、注視していないと判断した場合とで、前記周辺音取得部が取得した周辺音の出力の状態を変更して音声を出力する音声出力制御部と、
　を備える、音声出力制御装置。
　前記周辺音取得部が取得した周辺音に基づき、ユーザに対して音声を出力する音声出力部が出力する音声に対して周辺音を低減する処理を行う周辺音低減処理部、をさらに備え、
　前記音声出力制御部は、前記注視判断部が、前記ユーザがコンテンツを表示した表示画面を注視していると判断した場合は、前記周辺音低減処理部による周辺音を低減した音声を出力し、前記ユーザがコンテンツを表示した表示画面を注視していないと判断した場合は、前記周辺音低減処理部による周辺音を低減した状態よりは周辺音が聞こえやすい状態とする音声出力制御部と、
　請求項５に記載の音声出力制御装置。
　前記音声出力制御部は、前記周辺音低減処理部による周辺音を低減した状態よりは周辺音が聞こえやすい状態として、前記周辺音低減処理部による周辺音低減処理を行わない、
　請求項１から３、６のいずれか一項に記載の音声出力制御装置。
　前記音声出力制御部は、前記周辺音低減処理部による周辺音を低減した状態よりは周辺音が聞こえやすい状態として、前記周辺音低減処理部による周辺音低減処理を行なわず、前記周辺音取得部が取得した周辺音を出力する、
　請求項１から３、６のいずれか一項に記載の音声出力制御装置。
　前記コンテンツに関する音声を取得する音声取得部、をさらに備え、
　前記音声出力制御部は、前記注視判断部が、前記ユーザがコンテンツを表示した表示画面を注視していると判断した場合は、前記音声取得部が取得した前記コンテンツに関する音声を出力し、前記ユーザがコンテンツを表示した表示画面を注視していないと判断した場合は、前記周辺音取得部が取得した周辺音を出力する、
　請求項５に記載の音声出力制御装置。
　前記音声出力制御部は、前記ユーザがコンテンツを表示した表示画面を注視していないと判断した場合は、前記音声取得部が取得した前記コンテンツに関する音声に加えて、前記周辺音取得部が取得した周辺音を出力する、
　請求項９に記載の音声出力制御装置。
　前記ユーザの顔を認識し、認識した顔の向きを検出する顔検出部、をさらに備え、
　前記音声出力制御部は、前記ユーザがコンテンツを表示した表示画面を注視していると判断したことに加えて、前記顔検出部が検出した顔の向きが、前記表示画面に対して対向する向きである場合と、前記ユーザがコンテンツを表示した表示画面を注視していないと判断したことに加えて、前記顔検出部が検出した顔の向きが、前記表示画面に対して対向する向きではない場合とで、前記周辺音取得部が取得した周辺音の出力の状態を変更して音声を出力する、
　請求項５から１０のいずれか一項に記載の音声出力制御装置。
　前記ユーザが交通機関を利用していることを判断する判断部、をさらに備え、
　前記音声出力制御部は、前記ユーザが交通機関を利用している場合に、前記ユーザがコンテンツを表示した表示画面を注視していると判断した場合と、前記ユーザがコンテンツを表示した表示画面を注視していないと判断した場合とで、前記周辺音取得部が取得した周辺音の出力の状態を変更して音声を出力する、
　請求項５から１１のいずれか一項に記載の音声出力制御装置。
　請求項１から１２のいずれか一項に記載の音声出力制御装置と、
　周辺音を収音する収音部と、
　音声を出力する音声出力部と、
　を備える、音声出力システム。
　音声出力装置を利用しているユーザの顔の向きの状態を検出するステップと、
　前記ユーザの周辺音を取得するステップと、
　前記ユーザの顔の向きの状態が第一状態である場合は、取得した周辺音に基づき周辺音を低減した音声を出力し、前記ユーザの顔の向きの状態が前記第一状態から第二状態に変化した場合は、周辺音を低減した状態よりは周辺音が聞こえやすい状態とするステップと、
　を含む、音声出力制御装置が実行する音声出力制御方法。
　音声出力装置を利用しているユーザの顔の向きの状態を検出するステップと、
　前記ユーザの周辺音を取得するステップと、
　前記ユーザの顔の向きの状態が第一状態である場合は、取得した周辺音に基づき周辺音を低減した音声を出力し、前記ユーザの顔の向きの状態が前記第一状態から第二状態に変化した場合は、周辺音を低減した状態よりは周辺音が聞こえやすい状態とするステップと、
　を含む、コンピュータが実行するプログラム。
　音声出力装置を利用しているユーザの視線方向を検出するステップと、
　前記ユーザの周辺音を取得するステップと、
　視線方向の検出結果に基づき、前記ユーザがコンテンツを表示した表示画面を注視しているか否かを判断するステップと、
　前記ユーザがコンテンツを表示した表示画面を注視していると判断した場合と、注視していないと判断した場合とで、周辺音の出力の状態を変更して音声を出力するステップと、
　を含む、音声出力制御方法。
　音声出力装置を利用しているユーザの視線方向を検出するステップと、
　前記ユーザの周辺音を取得するステップと、
　視線方向の検出結果に基づき、前記ユーザがコンテンツを表示した表示画面を注視しているか否かを判断するステップと、
　前記ユーザがコンテンツを表示した表示画面を注視していると判断した場合と、注視していないと判断した場合とで、周辺音の出力の状態を変更して音声を出力するステップと、
　を含む、コンピュータが実行するプログラム。