WO2017038260A1

WO2017038260A1 - 情報処理装置、情報処理方法、およびプログラム

Info

Publication number: WO2017038260A1
Application number: PCT/JP2016/070724
Authority: WO
Inventors: 宏久渋谷
Original assignee: ソニー株式会社
Priority date: 2015-08-28
Filing date: 2016-07-13
Publication date: 2017-03-09
Also published as: US11017758B2; CN108293162A; EP3343948B1; EP3343948A1; CN108293162B; JP6787325B2; EP3343948A4; JPWO2017038260A1; US20180240453A1; US20200193958A1; EP3751451A1; US10726825B2

Abstract

【課題】ユーザが音声信号をより適切に聴取することを可能にする情報処理装置、情報処理方法、およびプログラムを提供する。【解決手段】ユーザまたは環境の少なくともいずれかのセンシング情報に基づいて、前記ユーザの行動を認識する行動認識部と、認識された前記ユーザの行動に基づいて、前記ユーザに聴取される音声信号、ノイズ低減信号、または外音モニタ信号の少なくともいずれかに対する信号処理を制御する処理制御部と、前記信号処理を実行する信号処理部と、を備える、情報処理装置。

Description

情報処理装置、情報処理方法、およびプログラム

　本開示は、情報処理装置、情報処理方法、およびプログラムに関する。

　近年、携帯型のオーディオプレーヤの普及に伴い、室外でも良好な再生音場空間を得るために、外部環境のノイズを低減させることが可能なノイズ低減システムが普及している。

　このようなノイズ低減システムとしては、例えば、下記の特許文献１～３に開示されるシステムが提案されている。

　具体的には、下記の特許文献１には、特定の周波数以下の帯域のノイズ成分を低減させるノイズ低減システムが開示されている。また、下記の特許文献２には、ユーザの耳部に装着される筐体の内部に設けられたマイクから収音したノイズと、該筐体の外部に設けられたマイクから収音したノイズとを用いて、ノイズ低減信号を生成するノイズ低減システムが開示されている。

　また、外部環境のノイズに対応して、より適切なノイズ低減信号を生成することが検討されている。例えば、下記の特許文献３には、収音したノイズの特性を分析し、分析したノイズ特性に基づいて選択されたフィルタ係数にてノイズ低減信号を生成することが開示されている。

特許第５０３４７３０号特許第５１９４４３４号特開２００８－１２２７２９号公報

　しかし、上記の特許文献１～３に開示される技術は、音声を聴取している際のユーザの行動および状況に対応して、音声信号、ノイズ低減信号、または外音モニタ信号の少なくともいずれかに対して適切な信号処理を施すものではなかった。

　そこで、本開示では、ユーザが音声信号をより適切に聴取することを可能にする、新規かつ改良された情報処理装置、情報処理方法、およびプログラムを提案する。

　本開示によれば、ユーザまたは環境の少なくともいずれかのセンシング情報に基づいて、前記ユーザの行動を認識する行動認識部と、認識された前記ユーザの行動に基づいて、前記ユーザに聴取される音声信号、ノイズ低減信号、または外音モニタ信号の少なくともいずれかに対する信号処理を制御する処理制御部と、前記信号処理を実行する信号処理部と、を備える、情報処理装置が提供される。

　また、本開示によれば、ユーザまたは環境の少なくともいずれかのセンシング情報に基づいて、前記ユーザの行動を認識することと、認識された前記ユーザの行動に基づいて、前記ユーザに聴取される音声信号、ノイズ低減信号、または外音モニタ信号の少なくともいずれかに対する信号処理を演算処理装置によって制御することと、前記信号処理を実行することと、を含む、情報処理方法が提供される。

　さらに、本開示によれば、コンピュータをユーザまたは環境の少なくともいずれかのセンシング情報に基づいて、前記ユーザの行動を認識する行動認識部と、認識された前記ユーザの行動に基づいて、前記ユーザに聴取される音声信号、ノイズ低減信号、または外音モニタ信号の少なくともいずれかに対する信号処理を制御する処理制御部と、前記信号処理を実行する信号処理部と、として機能させる、プログラムが提供される。

　本開示によれば、ユーザの行動を認識することで、認識した行動に基づいて、音声信号、ノイズ低減信号、または外音モニタ信号の少なくともいずれかに対する信号処理を制御することが可能である。

　以上説明したように本開示によれば、ユーザは、音声信号をより適切に聴取することが可能である。

　なお、上記の効果は必ずしも限定的なものではなく、上記の効果とともに、または上記の効果に代えて、本明細書に示されたいずれかの効果、または本明細書から把握され得る他の効果が奏されてもよい。

本開示の第１の実施形態に係る情報処理装置の使用例を説明する説明図である。同実施形態に係る情報処理装置の機能構成を説明するブロック図である。外部音声モニタ機能の一例を説明する説明図である。同実施形態に係る情報処理装置の回路構成等を説明するブロック図である。同実施形態に係る情報処理装置の動作例を示したフローチャート図である。同実施形態に係る情報処理装置の動作の実例を示したフローチャート図である。同実施形態に係る情報処理装置の動作の他の実例を示したフローチャート図である。同実施形態の変形例に係る情報処理装置の概要を説明する模式図である。本開示の第２の実施形態に係る情報処理装置の内部構成を示したブロック図である。同実施形態に係る情報処理装置の動作の実例を示したフローチャート図であり、本開示の第３の実施形態に係る情報処理装置の内部構成を示したブロック図である。ユーザの位置情報を地図上にプロットした模式図である。

　以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。

　なお、説明は以下の順序で行うものとする。
　１．第１の実施形態
　　１．１．情報処理装置の概要
　　１．２．情報処理装置の構成
　　１．３．情報処理装置の動作
　　１．４．情報処理装置の変形例
　２．第２の実施形態
　　２．１．情報処理装置の構成
　　２．２．情報処理装置の動作
　３．第３の実施形態
　　３．１．情報処理装置の構成
　４．まとめ

　＜１．第１の実施形態＞
　［１．１．情報処理装置の概要］
　まず、図１を参照して、本開示の第１の実施形態に係る情報処理装置の概要について説明する。図１は、本実施形態に係る情報処理装置１の使用例を説明する説明図である。

　図１に示すように、本実施形態に係る情報処理装置１は、例えば、音声信号を生成するオーディオプレーヤである。情報処理装置１は、各種センサによって測定されたユーザ３または環境の少なくともいずれかのセンシング情報からユーザ３の行動を認識し、認識したユーザ３の行動に基づいて、ユーザ３に聴取させる音声信号、ノイズ低減信号、または外音モニタ信号の少なくともいずれかの生成を制御する。なお、情報処理装置１によって生成された音声信号は、例えば、図１に示すように、接続されたヘッドフォン等の音響機器２を介してユーザ３に聴取されてもよい。

　具体的には、情報処理装置１は、認識したユーザ３の行動に基づいて、外部環境にて収音された音声に基づいて、ユーザ３によって聴取される外部環境の音声を低減させるノイズ低減信号、または外部環境の音声をユーザ３が確認するための外部モニタ信号を生成してもよい。外部モニタ信号は、単独でユーザ３に聴取されてもよく、音声コンテンツと重畳されてユーザ３に聴取されてもよい。

　また、情報処理装置１は、認識したユーザ３の行動に基づいて、音声コンテンツの音声信号（以下、単にコンテンツ信号ともいう）に施される音響処理を制御してもよい。さらに、情報処理装置１は、認識したユーザの行動に基づいて、コンテンツ信号に施される増幅処理を制御してもよい。これにより、情報処理装置１は、ユーザに対して、ユーザの行動に対応した信号処理が施された音声を聴取させることができる。

　情報処理装置１は、図１に示したように、ユーザ３または環境の少なくともいずれかのセンシング情報を測定可能な各種センサを備える携帯型オーディオプレーヤであってもよいが、スマートフォン、またはウェアラブル端末などであってもよい。また、情報処理装置１は、例えば、スピーカなどの発音体を備えるヘッドフォン、またはイヤフォンなどの音響機器であってもよい。さらに、情報処理装置１は、ネットワークを介してユーザ３または環境の少なくともいずれかのセンシング情報を受信し、ネットワークを介して信号処理を施した音声信号を音響機器２に送信する情報処理サーバであってもよい。

　なお、各種センサは、例えば、加速度センサ、ジャイロセンサ、地磁気センサ、気圧センサ、温度センサ、照度センサ、脈波センサ、ＧＮＳＳ（Ｇｌｏｂａｌ　Ｎａｖｉｇａｔｉｏｎ　Ｓａｔｅｌｌｉｔｅ　Ｓｙｓｔｅｍ）センサ、マイクロフォンなどである。これら各種センサは、情報処理装置１が備えていてもよく、情報処理装置１の外部の装置が備えていてもよい。各種センサが情報処理装置１の外部の装置に備えられている場合、情報処理装置１は、通信インターフェースまたは外部入力インターフェースを介して、センシング情報を取得する。

　このような各種センサにて測定されたユーザ３または環境の少なくともいずれかのセンシング情報により、情報処理装置１は、ユーザ３の様々な行動を認識することができる。なお、情報処理装置１によるユーザ３の行動認識には、機械学習による行動認識アルゴリズムが用いられることが好ましい。情報処理装置１によって認識されるユーザ３の行動としては、例えば、以下の表１に示すような行動を例示することができる。また、情報処理装置１は、このようなユーザ３の行動に加えて、ユーザ３が情報処理装置１を手で保持しているのか否か、ユーザ３が情報処理装置１を手で操作しているのか否かについても認識することができる。

　このような情報処理装置１によれば、ユーザ３の行動、状況、ユースケースなどに応じて、音声信号、ノイズ低減信号、または外音モニタ信号の少なくともいずれかに対して、適切な信号処理を施すことができる。

　［１．２．情報処理装置の構成］
　続いて、図２および図３を参照して、本実施形態に係る情報処理装置１の構成を説明する。図２は、本実施形態に係る情報処理装置１の機能構成を説明するブロック図であり、図３は、外部音声モニタ機能の一例を説明する説明図である。

　図２に示すように、情報処理装置１は、センサ部１００と、行動認識部１１０と、処理制御部１２０と、コンテンツ記憶部１３０と、マイク部１４０と、信号処理部１５０と、出力部１６０と、を備える。

　センサ部１００は、各種センサを備え、行動認識部１１０にて用いられるユーザ３または環境の少なくともいずれかのセンシング情報を測定する。センサ部１００が備える各種センサは、例えば、加速度センサ、ジャイロセンサ、地磁気センサ、気圧センサ、温度センサ、照度センサ、脈波センサ、ＧＮＳＳセンサ、マイクロフォンなどである。これらの各種センサは、例えば、情報処理装置１（すなわち、情報処理装置１を有するユーザ３）の移動速度、傾き、方位、振動、位置などの運動情報、情報処理装置１の周囲の気圧、温度、照度、音圧、音声などの環境情報、情報処理装置１を有するユーザ３の体温、血圧、脈拍などの身体情報をセンシング情報として測定することができる。なお、行動認識部１１０によって、ユーザ３の行動をより細かい区分にて正確に認識するためには、センサ部１００が備える各種センサの種類は、多い方が好ましい。また、センサ部１００は、ユーザ３または環境の少なくともいずれかのセンシング情報を測定することができれば、情報処理装置１の外部に備えられていてもよい。

　行動認識部１１０は、センサ部１００が測定したユーザ３または環境の少なくともいずれかのセンシング情報に基づいて、ユーザ３の行動を認識する。

　行動認識部１１０によるユーザ３の行動認識には、例えば、特開２００６－３４０９０３、特開２０１１－８１４３１、特開２０１２－１０７９９２に開示されるようなアルゴリズムを用いることができる。

　具体的には、行動認識部１１０は、互いに直交する直線運動を検知する複数の加速度計、および互いに直交する回転軸の回転運動を検知する複数のジャイロセンサからの信号の自己相関性を算出することで、ユーザ３の歩行周波数を算出してもよい。これにより、行動認識部１１０は、ユーザ３の歩行周波数から、ユーザ３が歩いているか、走っているか、立ち止まっているか等を認識することができる。また、行動認識部１１０は、鉛直方向の加速度の波形の半周期が１歩または２歩のいずれかに相当するのかを波形形状から判定し、判定結果に基づいてユーザ３の歩行状況を検出してもよい。これにより、行動認識部１１０は、ユーザ３の歩行状況から、ユーザが歩いているか、走っているか、立ち止まっているか等を認識することができる。さらに、行動認識部１１０は、センシング情報、およびユーザ３の行動の組み合わせごとに、あらかじめスコアを割り当てておき、測定されたセンシング情報に対応するユーザ３の行動のスコアを算出することでユーザ３の行動を認識してもよい。例えば、行動認識部１１０は、測定されたセンシング情報に対応する行動のスコアを積算し、最もスコアが高い行動をユーザ３の行動であると認識してもよい。

　また、行動認識部１１０は、好ましくは、機械学習アルゴリズムを用いた行動認識によって、ユーザ３または環境の少なくともいずれかのセンシング情報からユーザ３の行動を認識してもよい。具体的には、行動認識部１１０は、機械学習アルゴリズムを用いてユーザ３の行動を認識するための行動認識エンジンを生成し、生成した行動認識エンジンを用いてセンシング情報からユーザ３の行動を認識してもよい。

　機械学習による行動認識アルゴリズムとしては、公知の種々のアルゴリズムを用いることができるが、例えば、サポートベクターマシン、ニューラルネットワーク、隠れマルコフモデル、ｋ平均法、ｋ近傍法、単純ベイズ分類器などのアルゴリズムを用いることができる。

　なお、行動認識部１１０によって認識されるユーザ３の行動の区分の数および細かさは、ユーザ３の各行動を適切な確度で認識できるような数および細かさであればよく、例えば、認識に用いられるセンシング情報の種類に応じて適宜設定することが可能である。また、上述した行動認識部１１０によるユーザ３の行動の認識は、常に実行されてもよく、ユーザ３による実行の指示入力が行われた場合にのみ実行されてもよい。

　処理制御部１２０は、ユーザ３の行動に基づいて、信号処理部１５０にて実行される信号処理を制御する。具体的には、処理制御部１２０は、マイク部１４０にて収音された外部音声を打ち消すノイズ低減信号の生成を制御してもよい。また、処理制御部１２０は、マイク部１４０にて収音された外部音声をユーザ３に聴取させる外部モニタ信号の生成を制御してもよい。また、処理制御部１２０は、コンテンツ記憶部１３０に記憶された音声コンテンツのコンテンツ信号に施されるイコライザなどの音響処理、および音量を調節する増幅処理を制御してもよい。処理制御部１２０は、ユーザ３の行動に基づいて、上記の音声信号、ノイズ低減信号、または外音モニタ信号の少なくともいずれかに対する信号処理を制御する。

　なお、処理制御部１２０は、上記の信号処理の制御に加えて、または替えて、認識されたユーザ３の行動に基づいて、再生される音声コンテンツの選択を制御してもよい。

　以下では、処理制御部１２０によって制御される信号処理についてそれぞれ詳述する。

　処理制御部１２０は、ユーザ３の行動に基づいて、外部音声を打ち消すノイズ低減信号、または外部音声をユーザ３に聴取させる外部モニタ信号の少なくともいずれかの生成を制御してもよい。

　例えば、ユーザ３がランニングおよびスキーなどの運動をしている場合、処理制御部１２０は、外部環境の音声をユーザ３が聴取することを可能にするために、外部音声を含む外部モニタ信号の生成を制御してもよい。また、処理制御部１２０は、ユーザ３が自転車および自動車などを運転している場合にも同様に、外部音声を含む外部モニタ信号の生成を制御してもよい。これにより、処理制御部１２０は、ユーザ３が運動および運転などの外部環境に注意を払う必要がある行動をしている場合、ユーザ３に対して外部環境の音声を聴取させることができる。

　例えば、ユーザ３がバス、電車および航空機等に乗っている場合、処理制御部１２０は、外部環境の音声を低減させるために、外部音声を打ち消すノイズ低減信号の生成を制御してもよい。これにより、処理制御部１２０は、ユーザ３が外部環境に注意を払う必要性が低い行動をしている場合、外部環境の音声を打ち消すことで、ユーザ３に対して音声コンテンツの聴取に適した音場環境を提供することができる。なお、外部音声を打ち消すノイズ低減信号は、例えば、収音した外部音声の信号の位相を反転させることで生成することができる。

　例えば、ユーザ３が歩行等をしている場合、処理制御部１２０は、外部音声のうちユーザ３が必要とする音声のみをユーザ３に聴取させるために、外部音声のうち所定の周波数帯域（例えば、低周波帯域）の音声信号の強度を低減させた外部モニタ信号の生成を制御してもよい。これにより、処理制御部１２０は、ユーザ３が風切り音などの特定の周波数帯域のノイズ音を発生させやすい行動をしている場合に、該ノイズ音を選択的に打ち消すことで、外部音声および音声コンテンツの聴取に適した音場環境を提供することができる。また、処理制御部１２０は、ユーザ３が歩行をしている場合、自動車の走行音の周波数帯域を選択的にユーザ３に聴取させる外部モニタ信号の生成を制御することも可能である。

　このような特定の周波数帯域を選択に打ち消した外部モニタ信号は、例えば、図３で示すように、人の音声帯域よりも低い周波数帯域（例えば、３００Ｈｚ以下）にノイズ低減特性を有するノイズ低減信号と外部音声の信号とを重畳させることで生成することができる。また、このような外部モニタ信号は、特定の周波数帯域の信号を低減させるバンドストップフィルタにて外部音声を信号処理することでも生成することができる。

　なお、ユーザ３が移動している場合、処理制御部１２０は、外部音声のうち、ユーザ３の移動速度に応じた周波数帯域の音声信号の強度を選択的に低減させた外部モニタ信号の生成を制御してもよい。具体的には、処理制御部１２０は、低減可能な周波数帯域が異なる複数のバンドストップフィルタを用意し、ユーザ３の移動速度に応じて異なるバンドストップフィルタにて外部音声を信号処理してもよい。ユーザ３の移動に伴い発生する風切り音は、ユーザ３の移動速度によって周波数および強度が変化すると考えられる。したがって、処理制御部１２０は、信号強度を低減させる周波数帯域をユーザ３の移動速度に応じて変化させることにより、風切り音などのノイズ音を効果的に打ち消し、ユーザ３に対して外部音声および音声コンテンツの聴取に適した音場環境を提供することができる。

　また、処理制御部１２０は、ユーザ３の行動に基づいて、音声コンテンツなどのコンテンツ信号に対して施される音響処理を制御してもよい。音響処理とは、例えば、コンテンツ信号の周波数成分の分布を変更するイコライザ処理、人間の聴覚の特性を利用してコンテンツ信号に臨場感を付与する疑似サラウンド処理などである。なお、イコライザ処理は、音声コンテンツの音質を変更するためにコンテンツ信号に対して施されるイコライザ処理に加えて、音声コンテンツのコンテンツ信号と、ノイズ低減信号または外部モニタ信号とを重畳させるためにコンテンツ信号に対して施されるイコライザ処理をも含む。

　例えば、ユーザ３がバス、電車および航空機等に乗っている場合、処理制御部１２０は、コンテンツ信号の低周波帯域の信号強度を高めるようにイコライザ処理を制御してもよい。これにより、処理制御部１２０は、ユーザ３が外部音声の低周波帯域のノイズ音が高くなる行動をしている場合、音声コンテンツの低周波帯域の信号強度を高めることで、ユーザ３による音声コンテンツの聴取を容易にすることができる。

　例えば、ユーザ３がランニングおよびスキーなどの運動をしている場合、処理制御部１２０は、コンテンツ信号により高い臨場感を付与するように疑似サラウンド処理を制御してもよい。これにより、処理制御部１２０は、ユーザ３に聴取される音声コンテンツの臨場感を高めることで、運動中のユーザ３の気分が高揚するようにコンテンツ信号の信号処理を制御することができる。

　さらに、ユーザ３の行動によってコンテンツ信号に施される増幅処理が制御される場合、処理制御部１２０は、ユーザ３の行動に基づいて、音声コンテンツなどのコンテンツ信号に対して施される増幅処理を制御する。増幅処理は、例えば、音声コンテンツの音量を制御する信号処理である。

　例えば、ユーザ３が自転車および自動車などを運転している場合、処理制御部１２０は、コンテンツ信号に対して施される増幅処理の増幅量を減少させてもよい。これにより、処理制御部１２０は、ユーザ３に聴取される音声コンテンツの音量を減少させることで、ユーザ３の意識を運転により集中させることができる。

　例えば、ユーザ３がバス、電車および航空機等に乗っている場合、処理制御部１２０は、コンテンツ信号に対して施される増幅処理の増幅量を増加させてもよい。これにより、処理制御部１２０は、ユーザ３が大きな外部音声が発生する行動をしている場合、ユーザ３に聴取される音声コンテンツの音量を増加させることで、ユーザ３による音声コンテンツの聴取を容易にすることができる。

　なお、認識されたユーザ３の行動に対して、処理制御部１２０がどのような信号処理を割り当てるのかは、上述した例示に限定されず任意に設定可能である。処理制御部１２０の制御は、あらかじめ設定されていてもよく、ソフトウェア等を介してユーザ３によって適宜、設定可能であってもよい。

　コンテンツ記憶部１３０は、情報処理装置１が備える記憶装置であり、ユーザ３にて聴取される音声コンテンツを記憶する。コンテンツ記憶部１３０は、公知の記憶装置であってもよく、例えば、フラッシュメモリ、ＳＳＤ（Ｓｏｌｉｄ　Ｓｔａｔｅ　Ｄｒｉｖｅ）装置、ＨＤＤ（Ｈａｒｄ　Ｄｉｓｋ　Ｄｒｉｖｅ）装置であってもよい。

　なお、ユーザ３によって聴取される音声コンテンツは、図２に示したように情報処理装置１の内部の記憶装置に記憶されていてもよいが、本開示に係る技術は、このような例示に限定されない。音声コンテンツは、例えば、外部の記憶装置に記憶され、外部入力インターフェースを介して情報処理装置１に入力されていてもよく、ネットワーク等を介して情報処理装置１にストリーミング送信されていてもよい。

　マイク部１４０は、マイクロフォン等の音響機器を備え、信号処理部１５０にてノイズ低減信号、または外音モニタ信号の少なくともいずれかの生成に用いられる外部音声を収音する。マイク部１４０は、情報処理装置１に備えられていてもよいが、音声コンテンツの聴取に用いられる音響機器２に備えられていてもよい。マイク部１４０が音響機器２に備えられる場合、マイク部１４０は、音響機器２のユーザ３の耳部に装着される筐体の外部に備えられていてもよく、該筐体の内部に備えられていてもよく、該筐体の外部および内部の双方に備えられていてもよい。

　信号処理部１５０は、マイク部１４０が収音した外部音声を信号処理することにより、ノイズ低減信号または外音モニタ信号の少なくともいずれかを生成する。また、信号処理部１５０は、コンテンツ記憶部１３０に記憶された音声コンテンツを信号処理し、ユーザ３に聴取させる音声信号を生成する。なお、信号処理部１５０が実行する信号処理の内容は、認識されたユーザ３の行動に基づいて処理制御部１２０によって制御される。

　具体的には、信号処理部１５０は、マイク部１４０にて収音された外部音声を打ち消すノイズ低減信号、またはマイク部１４０にて収音された外部音声をユーザ３に聴取させる外部モニタ信号の少なくともいずれかを生成する。また、信号処理部１５０は、コンテンツ記憶部１３０に記憶された音声コンテンツのコンテンツ信号に対して、音響処理および増幅処理を施す。さらに、信号処理部１５０は、ノイズ低減信号または外部モニタ信号と、各種信号処理を施したコンテンツ信号とを重畳させることで、ユーザ３に聴取させる音声信号を生成する。これにより、信号処理部１５０は、ユーザ３の行動や状況に応じて、最適な信号処理を実行することができる。

　なお、信号処理部１５０による信号処理は、常に実行されてもよく、ユーザ３による実行の指示入力が行われた場合にのみ実行されてもよい。

　出力部１６０は、信号処理部１５０によって生成された音声信号、ノイズ低減信号、または外音モニタ信号の少なくともいずれかを出力する。例えば、出力部１６０は、信号処理部１５０によって生成された音声信号、ノイズ低減信号、または外音モニタ信号の少なくともいずれかをユーザ３に対して出力するスピーカ等の音響機器であってもよい。また、出力部１６０は、信号処理部１５０によって生成された音声信号、ノイズ低減信号、または外音モニタ信号の少なくともいずれかを外部の音響機器２へ出力するＵＳＢ（Ｕｎｉｖｅｒｓａｌ　Ｓｅｒｉａｌ　Ｂｕｓ）端子、光オーディオ端子などを備える外部出力インターフェースであってもよい。

　次に、図４を参照して、本実施形態に係る情報処理装置１のより具体的な構成を説明する。図４は、本実施形態に係る情報処理装置１の回路構成等を説明するブロック図である。

　図４に示すように、センサ部１００に相当する各種センサ１０１によってユーザ３または環境の少なくともいずれかのセンシング情報が測定される。また、行動認識部１１０に相当する行動認識エンジン（Ａｃｔｉｖｉｔｙ　Ｒｅｃｏｇｎｉｔｉｏｎ　Ｅｎｇｉｎｅ：ＡＲＥ）１１１は、測定されたユーザ３または環境の少なくともいずれかのセンシング情報に基づいて、ユーザ３の行動を認識する。処理制御部１２０に相当するプロセッサ１２１は、認識されたユーザ３の行動に基づいて、デジタルシグナルプロセッサ（Ｄｉｇｉｔａｌ　Ｓｉｇｎａｌ　Ｐｒｏｃｅｓｓｏｒ：ＤＳＰ）１５３、イコライザ回路（Ｅｑｕａｌｉｚｅｒ：ＥＱ）１５５、およびパワーアンプ回路１５７にて実行される信号処理を制御する。

　また、マイク部１４０に相当するマイクロフォン１４１は、外部音声を収音する。収音された外部音声は、マイクアンプ回路１５１にて増幅された後、Ａ／Ｄ変換回路（Ａｎａｌｏｇ　ｔｏ　Ｄｉｇｉｔａｌ　Ｃｏｎｖｅｒｔｅｒ：ＡＤＣ）１５２によってデジタル信号に変換される。デジタルシグナルプロセッサ１５３は、プロセッサ１２１による制御に基づいて、デジタル変換された外部音声の音声信号を信号処理し、ノイズ低減信号、または外音モニタ信号の少なくともいずれかを生成する。生成されたノイズ低減信号、または外音モニタ信号の少なくともいずれかは、Ｄ／Ａ変換回路（Ｄｉｇｉｔａｌ　ｔｏ　Ａｎａｌｏｇ　Ｃｏｎｖｅｒｔｅｒ：ＤＡＣ）１５４によってアナログ信号に変換される。

　一方、コンテンツ記憶部１３０に相当するストレージ装置１３１には、音声コンテンツが記憶され、イコライザ回路１５５は、音声コンテンツに対してプロセッサ１２１による制御に基づいた音響処理を施す。

　加算回路１５６は、Ｄ／Ａ変換回路１５４によって変換されたノイズ低減信号、または外音モニタ信号の少なくともいずれかと、イコライザ回路１５５によって音響処理された音声コンテンツのコンテンツ信号とを加算する。また、加算された信号は、パワーアンプ回路１５７によりプロセッサ１２１の制御に基づく増幅処理が施される。増幅処理が施された信号は、出力部１６０に相当するスピーカ１６１によってユーザ３に対して聴取可能に出力される。すなわち、マイクアンプ回路１５１、Ａ／Ｄ変換回路１５２、デジタルシグナルプロセッサ１５３、Ｄ／Ａ変換回路１５４、イコライザ回路１５５、加算回路１５６、およびパワーアンプ回路１５７が信号処理部１５０に相当する。

　このような構成により、本実施形態に係る情報処理装置１は、ユーザ３または環境の少なくともいずれかのセンシング情報により認識されたユーザ３の行動に応じて、音声信号、ノイズ低減信号、または外音モニタ信号の少なくともいずれかに対して、適切な信号処理を施すことができる。

　なお、本実施形態に係る情報処理装置１による情報処理は、ソフトウェアとハードウェアとの協働によって実現される。情報処理装置１が備えるハードウェアとしては、例えば、ブリッジまたは内部バス等により相互に接続されたＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）、ＲＯＭ（Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）、ＲＡＭ（Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）などを例示することができる。

　具体的には、ＣＰＵは、演算処理装置または制御装置として機能し、ＲＯＭ等に記憶された各種プログラムに従って、情報処理装置１の動作全般を制御する。ＲＯＭは、ＣＰＵが使用するプログラム、演算パラメータを記憶し、ＲＡＭは、ＣＰＵの実行において使用するプログラムや、その実行において適宜変化するパラメータ等を一時記憶する。

　また、ＣＰＵ、ＲＯＭおよびＲＡＭなどのハードウェアを本実施形態に係る情報処理装置１の各構成と同等の機能を発揮させるコンピュータプログラムも作成可能である。また、該コンピュータプログラムを記憶させた記憶媒体も提供される。

　［１．３．情報処理装置の動作］
　次に、図５～図７を参照して、本実施形態に係る情報処理装置１の動作について説明する。

　図５は、本実施形態に係る情報処理装置１の動作例を示したフローチャート図である。なお、下記で示す動作例は、あくまで一例であって、本実施形態に係る情報処理装置１の動作が、下記例示に限定されるわけではない。

　図５に示すように、まず、センサ部１００は、ユーザ３または環境の少なくともいずれかのセンシング情報を測定する（Ｓ１０１）。続いて、行動認識部１１０は、測定されたユーザ３または環境の少なくともいずれかのセンシング情報に基づいて、ユーザ３の行動を認識する（Ｓ１０３）。次に、処理制御部１２０は、ユーザ３の行動に基づいて、信号処理の処理モードを制御する（Ｓ１０５）。

　ここで、信号処理部１５０は、処理制御部１２０によって制御された処理モードに応じて、マイク部１４０によって収音された外部音声を信号処理し、ノイズ低減信号、または外音モニタ信号の少なくともいずれかを生成する（Ｓ１０７）。また、信号処理部１５０は、処理制御部１２０によって制御された処理モードに応じたイコライザにて、コンテンツ記憶部１３０に記憶された音声コンテンツのコンテンツ信号を信号処理する（Ｓ１０９）。さらに、信号処理部１５０は、処理制御部１２０によって制御された処理モードに応じた音量になるように、音声コンテンツのコンテンツ信号を増幅する（Ｓ１１１）。続いて、信号処理部１５０は、生成されたノイズ低減信号、または外音モニタ信号の少なくともいずれかと、信号処理されたコンテンツ信号とを重畳する（Ｓ１１３）。その後、出力部１６０は、生成された信号をユーザ３または音響機器２に出力する（Ｓ１１５）。

　以上の動作により、情報処理装置１は、ユーザ３の行動に応じて、音声信号、ノイズ低減信号、または外音モニタ信号の少なくともいずれかに対して、適切な信号処理を施すことができる。

　続いて、図６および図７を参照して、本実施形態に係る情報処理装置１の動作の実例を説明する。図６および図７は、本実施形態に係る情報処理装置１の動作の実例を示したフローチャート図である。

　まず、図６を参照して、ユーザ３が一般道などにて各種運動をしている場合の情報処理装置１の動作の実例を説明する。

　図６に示すように、例えば、ユーザ３が歩行している（Ｓ２１０）場合、情報処理装置１は、ユーザ３に対するセンシング情報を用いた行動認識によりユーザ３の歩行を認識し（Ｓ２１１）、信号処理を歩行モードに制御する（Ｓ２１２）。また、情報処理装置１は、歩行モードにて信号処理を行い、ユーザ３に聴取される音声信号を生成する（Ｓ２１３）。ここで、歩行モードにおける信号処理は、例えば、ユーザ３が外部音声を聴取することができるように、外部モニタ信号の生成を含んでもよい。

　次に、ユーザ３がランニングを開始した（Ｓ２２０）場合、情報処理装置１は、ユーザ３に対するセンシング情報を用いた行動認識によりユーザ３が走っていることを認識し（Ｓ２２１）、信号処理をランニングモードに制御する（Ｓ２２２）。また、情報処理装置１は、ランニングモードにて信号処理を行い、ユーザ３に聴取される音声信号を生成する（Ｓ２２３）。ここで、ランニングモードにおける信号処理は、例えば、風切り音などの低周波帯域の音声を低減した外部モニタ信号の生成を含んでもよい。

　また、ユーザ３が立ち止まった（Ｓ２３０）場合、情報処理装置１は、ユーザ３に対するセンシング情報を用いた行動認識によりユーザ３が立ち止まったことを認識し（Ｓ２３１）、信号処理を停止モードに制御する（Ｓ２３２）。また、情報処理装置１は、停止モードにて信号処理を行い、ユーザ３に聴取される音声信号を生成する（Ｓ２３３）。ここで、停止モードにおける信号処理は、例えば、外部音声を打ち消すノイズ低減信号の生成を含んでもよい。

　次に、図７を参照して、ユーザ３がスキー場などにてスキーまたはスノーボードをしている場合の情報処理装置１の動作の実例を説明する。

　図７に示すように、例えば、ユーザ３がリフトに乗車している（Ｓ３１０）場合、情報処理装置１は、ユーザ３および環境に対するセンシング情報を用いた行動認識によりユーザ３のリフト乗車を認識し（Ｓ３１１）、信号処理をリフトモードに制御する（Ｓ３１２）。また、情報処理装置１は、リフトモードにて信号処理を行い、ユーザ３に聴取される音声信号を生成する（Ｓ３１３）。ここで、リフトモードにおける信号処理は、例えば、外部音声を打ち消すノイズ低減信号の生成を含んでもよい。

　次に、ユーザ３が滑走を開始した（Ｓ３２０）場合、情報処理装置１は、ユーザ３および環境に対するセンシング情報を用いた行動認識によりユーザ３がゲレンデを滑走していることを認識し（Ｓ３２１）、信号処理をスキーモードに制御する（Ｓ３２２）。また、情報処理装置１は、スキーモードにて信号処理を行い、ユーザ３に聴取される音声信号を生成する（Ｓ３２３）。ここで、スキーモードにおける信号処理は、例えば、風切り音などの低周波帯域の音声を低減した外部モニタ信号の生成を含んでもよい。

　また、ユーザ３の滑走が終了し、ゲレンデを歩行している（Ｓ３３０）場合、情報処理装置１は、ユーザ３および環境に対するセンシング情報を用いた行動認識によりユーザ３が滑走を停止し、歩行していることを認識し（Ｓ３３１）、信号処理を歩行モードに制御する（Ｓ３３２）。また、情報処理装置１は、歩行モードにて信号処理を行い、ユーザ３に聴取される音声信号を生成する（Ｓ３３３）。ここで、歩行モードにおける信号処理は、例えば、ユーザ３が外部音声を聴取することができるように、外部モニタ信号の生成を含んでもよい。

　このように、本実施形態に係る情報処理装置１によれば、ユーザ３の行動に応じて、音声信号、ノイズ低減信号、または外音モニタ信号の少なくともいずれかに対して、適切な信号処理を施すことができる。

　［１．４．情報処理装置の変形例］
　続いて、図８を参照して、第１の実施形態の変形例に係る情報処理装置１について説明する。図８は、本変形例に係る情報処理装置１の概要を説明する模式図である。本変形例に係る情報処理装置１は、ユーザ３の耳部に装着される筐体の内部および外部の双方に外部音声を収音するマイクロフォンを備え、それぞれのマイクロフォンにて収音した外部音声に基づいて、ノイズ低減信号を生成するものである。

　図８に示すように、本変形例に係る情報処理装置１は、具体的には、ユーザ３の耳部に装着される筐体４０１に発音体４３１を備えるヘッドフォンである。なお、筐体４０１は、ヘッドバンド４０２によって反対側のユーザ３の耳部を覆う筐体（図示せず）と連結されている。

　本変形例に係る情報処理装置１では、筐体４０１の外部および内部のそれぞれにマイクロフォン４１１、４１２が設けられ、筐体４０１の外部および内部の外部音声をそれぞれ収音している。ノイズキャンセリング回路４２１は、マイクロフォン４１１、４１２のそれぞれにて収音された外部音声に基づいて、それぞれノイズ低減信号を生成し、生成したノイズ低減信号の各々を合成することで、合成ノイズ低減信号を生成する。

　一方、音声コンテンツのコンテンツ信号Ｓは、イコライザ回路４２２にて信号処理される。信号処理されたコンテンツ信号Ｓは、加算回路４２３にて合成ノイズ低減信号と加算された後、パワーアンプ回路４２４にて増幅され、発音体４３１にて音声に変換される。

　ここで、筐体４０１の外部にて収音された外部音声を用いてノイズ低減を行う方式は、フィードバック方式とも呼ばれ、一般にノイズを低減可能な帯域は狭いものの、比較的大きな低減が可能な方式である。一方、筐体４０１の内部にて収音された外部音声を用いてノイズ低減を行う方式は、フィードフォワード方式とも呼ばれ、一般にノイズを低減可能な帯域が広いものの、発音体４３１から発せられる音声により発振してしまう可能性がある方式である。

　本変形例に係る情報処理装置１では、フィードバック方式と、フィードフォワード方式とを組み合わせてノイズ低減を行うことにより、フィードバック方式およびフィードフォワード方式の利点を併せ持ったノイズ低減を行うことができる。また、情報処理装置１は、センシング情報に基づいてユーザ３の行動を認識し、認識したユーザ３の行動に応じて、上述したノイズ低減等を行うことにより、ユーザ３が音声信号をより適切に聴取することを可能にする。

　＜２．第２の実施形態＞
　次に、図９および図１０を参照して、本開示の第２の実施形態に係る情報処理装置１Ａについて説明する。本実施形態に係る情報処理装置１Ａは、ユーザ３または環境の少なくともいずれかのセンシング情報に加えて、マイク部１４０が収音した外部音声の解析結果をさらに用いてユーザ３の行動を認識することで、ユーザ３の行動を認識する精度を向上させるものである。

　［２．１．情報処理装置の構成］
　まず、図９を参照して、本実施形態に係る情報処理装置１Ａの機能構成について説明する。図９は、本実施形態に係る情報処理装置１Ａの内部構成を示したブロック図である。

　図９に示すように、情報処理装置１Ａは、センサ部１００と、行動認識部１１０Ａと、処理制御部１２０と、コンテンツ記憶部１３０と、マイク部１４０と、信号処理部１５０と、出力部１６０と、解析部１７０とを備える。

　ここで、センサ部１００、処理制御部１２０、コンテンツ記憶部１３０、マイク部１４０、信号処理部１５０、および出力部１６０の具体的な構成については、第１の実施形態にて説明した構成と実質的に同様であるため、ここでの詳細な説明は省略する。

　解析部１７０は、マイク部１４０が収音した外部音声を解析することよってユーザ３の周囲の環境を判定する。例えば、解析部１７０は、外部音声に含まれるノイズ音の強度および周波数帯域に基づいてユーザ３の周囲の環境を判定してもよい。具体的には、解析部１７０は、外部音声のうち、人間の音声帯域の周波数（例えば、３００Ｈｚ）以下の帯域の音声をノイズ音と見なし、該ノイズ音の強度および周波数の分布に基づいてユーザ３の周囲の環境を判定してもよい。例えば、解析部１７０により判定可能なユーザ３の周囲の環境としては、「電車内」、「航空機内」、「電車内または航空機内以外」などを例示することができる。

　行動認識部１１０Ａは、センサ部１００が測定したユーザ３または環境の少なくともいずれかのセンシング情報、および解析部１７０が解析したユーザ３の周囲の環境に基づいて、ユーザ３の行動を認識する。ここで、ユーザ３の行動の中には、ユーザ３の周囲の環境と密接に結び付いたものが存在する。例えば、ユーザ３が自動車、バス、電車、航空機などの乗り物に乗っている場合、ユーザ３の周囲の環境は、乗っている乗り物の車内に限定される。

　そこで、解析部１７０によって判定されたユーザ３の周囲の環境がユーザ３の行動を限定するものである場合、行動認識部１１０Ａは、ユーザ３の周囲の環境に基づいてユーザ３の行動を認識してもよい。具体的には、解析部１７０によってユーザ３の周囲の環境が自動車、バス、電車、または航空機などの内部であると判定された場合、行動認識部１１０Ａは、ユーザ３が自動車、バス、電車、または航空機に乗っていると認識してもよい。これにより、行動認識部１１０Ａは、ユーザ３の行動をより高い精度で認識することが可能になる。

　また、行動認識部１１０Ａは、ユーザ３または環境の少なくともいずれかのセンシング情報を優先的に用いて、ユーザ３の行動を認識してもよい。例えば、行動認識部１１０Ａは、まず、ユーザ３または環境の少なくともいずれかのセンシング情報を用いてユーザ３の行動を認識し、該センシング情報からはユーザ３の行動を認識できない場合に限って、ユーザ３の周囲の環境に基づいてユーザ３の行動を認識してもよい。

　［２．２．情報処理装置の動作］
　次に、図１０を参照して、本実施形態に係る情報処理装置１Ａの動作の実例を説明する。図１０は、本実施形態に係る情報処理装置１Ａの動作の実例を示したフローチャート図である。図１０では、ユーザ３がホームから電車に乗った場合の情報処理装置１Ａの動作の実例を示している。

　図１０に示すように、例えば、ユーザ３がホームを歩行している（Ｓ４１０）場合、情報処理装置１Ａは、ユーザ３に対するセンシング情報を用いた行動認識によりユーザ３の歩行を認識する（Ｓ４１１）。また、情報処理装置１Ａは、外部音声のノイズ成分から、ユーザ３の周囲の環境を電車内または航空機内以外であると判定する（Ｓ４１２）。

　これにより、情報処理装置１Ａは、ユーザ３の行動を歩行であると認識し、信号処理を歩行モードに制御する（Ｓ４１３）。また、情報処理装置１Ａは、歩行モードにて信号処理を行い、ユーザ３に聴取される音声信号を生成する（Ｓ４１４）。ここで、歩行モードにおける信号処理は、例えば、ユーザ３が外部音声を聴取することができるように、外部モニタ信号の生成を含んでもよい。

　次に、ユーザ３が電車に乗った（Ｓ４２０）場合、情報処理装置１Ａは、ユーザ３に対するセンシング情報を用いた行動認識によりユーザ３が電車に乗っていることを認識する（Ｓ４２１）。また、情報処理装置１Ａは、外部音声のノイズ成分から、ユーザ３の周囲の環境を電車内であると判定する（Ｓ４２２）。

　これにより、情報処理装置１Ａは、ユーザ３が電車に乗っていると認識し、信号処理を電車モードに制御する（Ｓ４３３）。また、情報処理装置１Ａは、電車モードにて信号処理を行い、ユーザ３に聴取される音声信号を生成する（Ｓ４３４）。ここで、歩行モードにおける信号処理は、例えば、音声コンテンツの聴取に適した音場環境を提供することができるように、外部音声を打ち消すノイズ低減信号の生成を含んでもよい。

　このように、本実施形態に係る情報処理装置１Ａは、収音した外部音声から判定したユーザ３の周囲の環境にさらに基づくことにより、より高い精度でユーザ３の行動を認識することができる。したがって、本実施形態に係る情報処理装置１Ａは、音声信号、ノイズ低減信号、または外音モニタ信号の少なくともいずれかに対して、適切な信号処理を施すことができる。

　＜３．第３の実施形態＞
　［３．１．情報処理装置の構成］
　次に、図１１および図１２を参照して、本開示の第３の実施形態に係る情報処理装置１Ｂについて説明する。本実施形態に係る情報処理装置１Ｂは、位置情報取得部１８０が取得したユーザ３の位置情報の履歴より認識されたユーザ３の行動パターンをさらに用いることで、より高い精度および粒度にてユーザ３の行動を認識するものである。

　ここで、図１１は、本実施形態に係る情報処理装置１Ａの内部構成を示したブロック図である。また、図１２は、位置情報取得部１８０が取得したユーザ３の位置情報の履歴を地図上にプロットした模式図である。

　図１１に示すように、情報処理装置１Ｂは、センサ部１００と、行動認識部１１０Ｂと、処理制御部１２０と、コンテンツ記憶部１３０と、マイク部１４０と、信号処理部１５０と、出力部１６０と、位置情報取得部１８０と、行動パターン認識部１９０とを備える。

　位置情報取得部１８０は、情報処理装置１Ｂの位置情報（すなわち、ユーザ３の位置情報）を取得する。例えば、位置情報取得部１８０は、複数の人工衛星から送信される時刻情報付きの信号から情報処理装置１Ｂの位置を算出するＧＮＳＳセンサであってもよい。また、位置情報取得部１８０は、ＧＮＳＳによる測位を補助する情報をネットワーク等から受信することで情報処理装置１Ｂの位置を算出するＡ－ＧＮＳＳ（Ａｓｓｉｓｔｅｄ　Ｇｌｏｂａｌ　Ｎａｖｉｇａｔｉｏｎ　Ｓａｔｅｌｌｉｔｅ　Ｓｙｓｔｅｍ）であってもよい。さらに、位置情報取得部１８０は、移動体通信網における基地局からの距離、またはＷｉ－Ｆｉ（登録商標）のアクセスポイントからの距離を用いた三角測量法によって、情報処理装置１Ｂの位置を算出してもよい。

　行動パターン認識部１９０は、位置情報取得部１８０が取得したユーザ３の位置情報の履歴に基づいて、ユーザ３の行動パターンを認識する。

　例えば、図１２に示すように、行動パターン認識部１９０は、位置情報取得部１８０により取得されたユーザ３の位置情報１８１を地図上に時系列にプロットすることで、ユーザ３の位置情報の遷移の履歴を得ることができる。行動パターン認識部１９０は、このような位置情報の遷移の履歴から、例えば、ユーザ３の位置情報が線路上を遷移している場合、該当する時間中、ユーザ３は電車に乗っていると判断することができる。また、行動パターン認識部１９０は、ユーザ３が所定の建物に９時～１７時までいる場合、該当する時間中、ユーザ３は、仕事をしていると判断することができる。

　さらに、行動パターン認識部１９０は、所定の期間（例えば、１ヶ月など）、上記のユーザ３の位置情報の遷移の履歴を蓄積することで、ユーザ３の位置情報の遷移の規則性からユーザ３の行動パターンをより正確に認識することができる。

　例えば、行動パターン認識部１９０は、平日の昼間、ユーザ３が所定の建物にいる場合、該当する時間中、ユーザ３は、仕事をしていると判断することができる。また、行動パターン認識部１９０は、多くの休日の間、ユーザ３が所定の建物にいる場合、該当する時間中、ユーザ３は、自宅にいると判断することができる。また、行動パターン認識部１９０は、休日および平日の深夜から早朝の間、ユーザ３が所定の建物にいる場合、該当する時間中、ユーザ３は、眠っていると判断することができる。さらに、行動パターン認識部１９０は、ある休日の昼間、ユーザ３がデパート等の建物にいる場合、該当する時間中、ユーザ３は、買い物をしていると判断することができる。

　これによれば、行動パターン認識部１９０は、ユーザ３の位置情報の履歴をライフログとして蓄積することで、ユーザ３の行動パターンを認識することができる。なお、ユーザ３の行動パターンの認識方法および認識される行動パターンは、例えば、特開２０１１－８１４３１に開示されたものを用いることも可能である。

　行動認識部１１０Ｂは、センサ部１００が測定したユーザ３または環境の少なくともいずれかのセンシング情報、および行動パターン認識部１９０により認識されたユーザ３の行動パターンに基づいて、ユーザ３の行動を認識する。

　例えば、行動認識部１１０Ｂは、ユーザ３または環境の少なくともいずれかのセンシング情報からユーザ３の行動を認識できない場合、ユーザ３の行動パターンに基づいて現時刻および現在位置にて最も適切と判断される行動をユーザ３の行動と認識してもよい。また、行動認識部１１０Ｂは、ユーザ３の行動パターンに基づいて現時刻および現在位置にて除外可能な行動をあらかじめ除外した上で、ユーザ３または環境の少なくともいずれかのセンシング情報に基づいてユーザ３の行動を認識してもよい。

　したがって、行動認識部１１０Ｂは、ユーザ３の位置情報の履歴から認識されたユーザ３の行動パターンにさらに基づくことにより、高い精度および粒度にてユーザ３の行動を認識することが可能である。

　このように、本実施形態に係る情報処理装置１Ｂは、ユーザ３の位置情報から認識されたユーザ３の行動パターンをさらに用いることにより、より高い精度および粒度にてユーザ３の行動を認識することができる。したがって、本実施形態に係る情報処理装置１Ｂは、音声信号、ノイズ低減信号、または外音モニタ信号の少なくともいずれかに対して、適切な信号処理を施すことができる。

　＜４．まとめ＞
　以上にて説明したように、本開示の第１の実施形態に係る情報処理装置１によれば、ユーザ３または環境の少なくともいずれかのセンシング情報に基づいてユーザ３の行動を認識し、認識した行動に応じて、音声信号、ノイズ低減信号、または外音モニタ信号の少なくともいずれかに対して、適切な信号処理を施すことができる。

　また、本開示の第２の実施形態に係る情報処理装置１Ａによれば、ユーザ３または環境の少なくともいずれかのセンシング情報に加えて、外部音声の解析結果にさらに基づくことで、より高い精度にてユーザの行動を認識することができる。これにより、情報処理装置１Ａは、音声信号、ノイズ低減信号、または外音モニタ信号の少なくともいずれかに対して、適切な信号処理を施すことができる。

　さらに、本開示の第３の実施形態に係る情報処理装置１Ｂによれば、ユーザ３または環境の少なくともいずれかのセンシング情報に加えて、位置情報の履歴から認識したユーザ３の行動パターンにさらに基づくことで、より高い精度および粒度にてユーザの行動を認識することができる。これにより、情報処理装置１Ｂは、音声信号、ノイズ低減信号、または外音モニタ信号の少なくともいずれかに対して、適切な信号処理を施すことができる。

　以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示の技術的範囲はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。

　例えば、上記各実施形態では、本開示の各実施形態に係る情報処理装置は、携帯型オーディオプレーヤを例示して説明したが、本技術はかかる例に限定されない。例えば、本開示の各実施形態に係る情報処理装置は、スマートフォン、ウェアラブル端末、ヘッドフォンおよびイヤフォンなどの音響機器、ならびにネットワーク上の情報処理サーバなどであってもよい。

　また、本明細書に記載された効果は、あくまで説明的または例示的なものであって限定的ではない。つまり、本開示に係る技術は、上記の効果とともに、または上記の効果に代えて、本明細書の記載から当業者には明らかな他の効果を奏しうる。

　なお、以下のような構成も本開示の技術的範囲に属する。
（１）
　ユーザまたは環境の少なくともいずれかのセンシング情報に基づいて、前記ユーザの行動を認識する行動認識部と、
　認識された前記ユーザの行動に基づいて、前記ユーザに聴取される音声信号、ノイズ低減信号、または外音モニタ信号の少なくともいずれかに対する信号処理を制御する処理制御部と、
　前記信号処理を実行する信号処理部と、
を備える、情報処理装置。
（２）
　前記外音モニタ信号は、収音された外部音声を含む信号であり、
　前記信号処理部は、前記外音モニタ信号を生成する、前記（１）に記載の情報処理装置。
（３）
　前記ノイズ低減信号は、収音された外部音声に含まれるノイズを低減させる信号であり、
　前記信号処理部は、前記ノイズ低減信号を生成する、前記（１）または（２）に記載の情報処理装置。
（４）
　前記処理制御部は、前記音声信号に施される音響処理を制御する、前記（１）～（３）のいずれか一項に記載の情報処理装置。
（５）
　前記処理制御部は、前記音声信号の増幅処理を制御する、前記（１）～（４）のいずれか一項に記載の情報処理装置。
（６）
　前記行動認識部は、前記センシング情報を用いた機械学習アルゴリズムによって前記ユーザの行動を認識する、前記（１）～（５）のいずれか一項に記載の情報処理装置。
（７）
　前記行動認識部は、外部音声にさらに基づいて、前記ユーザの行動を認識する、前記（１）～（６）のいずれか一項に記載の情報処理装置。
（８）
　前記ユーザの位置情報に基づいて、前記ユーザの行動パターンを認識する行動パターン認識部をさらに備え、
　前記処理制御部は、認識された前記ユーザの行動パターンにさらに基づいて、前記信号処理を制御する、前記（１）～（７）のいずれか一項に記載の情報処理装置。
（９）
　前記行動認識部によって前記ユーザが歩行していると認識された場合、
　前記処理制御部は、収音された外部音声の低周波帯域の強度を低下させた前記外音モニタ信号の生成を制御する、前記（２）に記載の情報処理装置。
（１０）
　前記行動認識部によって前記ユーザが移動していると認識された場合、
　前記処理制御部は、前記ユーザの移動速度に基づいて、前記ノイズ低減信号の生成を制御する、前記（１）～（１０）のいずれか一項に記載の情報処理装置。
（１１）
　前記処理制御部は、前記ユーザの移動速度に基づいて、前記ノイズ低減信号によって低減されるノイズの周波数帯域および強度の少なくともいずれかを制御する、前記（１０）に記載の情報処理装置。
（１２）
　前記処理制御部による制御は、前記ユーザによって設定可能である、前記（１）～（１１）のいずれか一項に記載の情報処理装置。
（１３）
　ユーザまたは環境の少なくともいずれかのセンシング情報に基づいて、前記ユーザの行動を認識することと、
　認識された前記ユーザの行動に基づいて、前記ユーザに聴取される音声信号、ノイズ低減信号、または外音モニタ信号の少なくともいずれかに対する信号処理を演算処理装置によって制御することと、
　前記信号処理を実行することと、
を含む、情報処理方法。
（１４）
　コンピュータを
　ユーザまたは環境の少なくともいずれかのセンシング情報に基づいて、前記ユーザの行動を認識する行動認識部と、
　認識された前記ユーザの行動に基づいて、前記ユーザに聴取される音声信号、ノイズ低減信号、または外音モニタ信号の少なくともいずれかに対する信号処理を制御する処理制御部と、
　前記信号処理を実行する信号処理部と、
として機能させる、プログラム。

　１　　　　情報処理装置
　２　　　　音響機器
　３　　　　ユーザ
　１００　　センサ部
　１１０　　行動認識部
　１２０　　処理制御部
　１３０　　コンテンツ記憶部
　１４０　　マイク部
　１５０　　信号処理部
　１６０　　出力部
　１７０　　解析部
　１８０　　位置情報取得部
　１９０　　行動パターン認識部

Claims

　ユーザまたは環境の少なくともいずれかのセンシング情報に基づいて、前記ユーザの行動を認識する行動認識部と、
　認識された前記ユーザの行動に基づいて、前記ユーザに聴取される音声信号、ノイズ低減信号、または外音モニタ信号の少なくともいずれかに対する信号処理を制御する処理制御部と、
　前記信号処理を実行する信号処理部と、
を備える、情報処理装置。
　前記外音モニタ信号は、収音された外部音声を含む信号であり、
　前記信号処理部は、前記外音モニタ信号を生成する、請求項１に記載の情報処理装置。
　前記ノイズ低減信号は、収音された外部音声に含まれるノイズを低減させる信号であり、
　前記信号処理部は、前記ノイズ低減信号を生成する、請求項１に記載の情報処理装置。
　前記処理制御部は、前記音声信号に施される音響処理を制御する、請求項１に記載の情報処理装置。
　前記処理制御部は、前記音声信号の増幅処理を制御する、請求項１に記載の情報処理装置。
　前記行動認識部は、前記センシング情報を用いた機械学習アルゴリズムによって前記ユーザの行動を認識する、請求項１に記載の情報処理装置。
　前記行動認識部は、外部音声にさらに基づいて、前記ユーザの行動を認識する、請求項１に記載の情報処理装置。
　前記ユーザの位置情報に基づいて、前記ユーザの行動パターンを認識する行動パターン認識部をさらに備え、
　前記処理制御部は、認識された前記ユーザの行動パターンにさらに基づいて、前記信号処理を制御する、請求項１に記載の情報処理装置。
　前記行動認識部によって前記ユーザが歩行していると認識された場合、
　前記処理制御部は、収音された外部音声の低周波帯域の強度を低下させた前記外音モニタ信号の生成を制御する、請求項２に記載の情報処理装置。
　前記行動認識部によって前記ユーザが移動していると認識された場合、
　前記処理制御部は、前記ユーザの移動速度に基づいて、前記ノイズ低減信号の生成を制御する、請求項１に記載の情報処理装置。
　前記処理制御部は、前記ユーザの移動速度に基づいて、前記ノイズ低減信号によって低減されるノイズの周波数帯域および強度の少なくともいずれかを制御する、請求項１０に記載の情報処理装置。
　前記処理制御部による制御は、前記ユーザによって設定可能である、請求項１に記載の情報処理装置。
　ユーザまたは環境の少なくともいずれかのセンシング情報に基づいて、前記ユーザの行動を認識することと、
　認識された前記ユーザの行動に基づいて、前記ユーザに聴取される音声信号、ノイズ低減信号、または外音モニタ信号の少なくともいずれかに対する信号処理を演算処理装置によって制御することと、
　前記信号処理を実行することと、
を含む、情報処理方法。
　コンピュータを
　ユーザまたは環境の少なくともいずれかのセンシング情報に基づいて、前記ユーザの行動を認識する行動認識部と、
　認識された前記ユーザの行動に基づいて、前記ユーザに聴取される音声信号、ノイズ低減信号、または外音モニタ信号の少なくともいずれかに対する信号処理を制御する処理制御部と、
　前記信号処理を実行する信号処理部と、
として機能させる、プログラム。