WO2018198792A1

WO2018198792A1 - 信号処理装置および方法、並びにプログラム

Info

Publication number: WO2018198792A1
Application number: PCT/JP2018/015355
Authority: WO
Inventors: 真里斎藤; 広岩瀬
Original assignee: ソニー株式会社
Priority date: 2017-04-26
Filing date: 2018-04-12
Publication date: 2018-11-01
Also published as: JP7078039B2; US20200051586A1; EP3618059A1; EP3618059A4; JPWO2018198792A1; US11081128B2

Abstract

本開示は、プライバシを保護した状態を自然に作り出すことができるようにする信号処理装置および方法、並びにプログラムに関する。宛先のユーザへの通知発生のタイミングで、音状態推定部は、周囲の音を検出する。ユーザ状態推定部は、先のユーザへの通知発生のタイミングで、宛先のユーザおよび宛先以外のユーザの位置を検出する。音状態推定部により検出された周囲の音が、マスキングに用いることができるマスキング可能な音であると判定されたタイミングで、ユーザ状態推定部により検出された宛先のユーザの位置が所定のエリア内にある場合、出力制御部は、宛先のユーザへの通知を出力制御する。本開示は、例えば、信号処理装置とスピーカを含む個別通知システムに適用することができる。

Description

信号処理装置および方法、並びにプログラム

　本開示は、信号処理装置および方法、並びにプログラムに関し、特に、プライバシを保護した状態を自然に作り出すことができるようにした信号処理装置および方法、並びにプログラムに関する。

　システムから特定のユーザにだけ伝えるべき時間があった場合、複数人がいる部屋では、システムからの通知があった場合、その場にいる人全員に伝わってしまい、プライバシが保護されていなかった。また、BFなど指向性が高い出力を行い、特定のユーザだけに聞かせることもできるが、そのために、専用のスピーカがあちこちに必要になった。

　そこで、特許文献１においては、患者情報を認識したときに、マスキング音を生成するマスキング音生成部の動作を開始させて、患者の会話音を周囲に聞こえ難くする提案がなされている。

特開２０１０－１９９３５号公報

　しかしながら、特許文献１の提案では、マスキング音を鳴らすことで不自然な状態になり、リビングなどの環境では、かえって気付かれてしまっていた。

　本開示は、このような状況に鑑みてなされたものであり、プライバシを保護した状態を自然に作り出すことができるようにするものである。

　本技術の一側面の信号処理装置は、宛先のユーザへの通知発生のタイミングで、周囲の音を検出する音検出部と、前記通知発生のタイミングで、前記宛先のユーザおよび宛先以外のユーザの位置を検出する位置検出部と、前記音検出部により検出された周囲の音が、マスキングに用いることができるマスキング可能な音であると判定されたタイミングで、前記位置検出部により検出された前記宛先のユーザの位置が所定のエリア内にある場合、前記宛先のユーザへの通知を出力制御する出力制御部とを備える。

　前記宛先のユーザおよび宛先以外のユーザの移動を検出する移動検出部をさらに備え、前記移動検出部により移動が検出された場合、前記位置検出部は、前記移動検出部により検出された移動により推定される前記宛先のユーザおよび宛先以外のユーザの位置も検出することができる。

　前記マスキング可能な音が継続する時間を予測する継続時間予測部をさらに備え、前記出力制御部は、前記継続時間予測部により予測された前記マスキング可能な音の継続が終了する旨を出力制御することができる。

　前記周囲の音は、室内で機器から発せられる定常音、室内で機器から非定期的に発せられる音、人や動物からの発声音、または室外から入ってくる環境音である。

　前記音検出部により検出された周囲の音が、マスキングに用いることができるマスキング可能な音でないと判定された場合、前記位置検出部により検出された前記宛先のユーザの位置が所定のエリア内にあるとき、前記出力制御部は、前記宛先以外のユーザだけに聞こえる周波数帯の音とともに、前記宛先のユーザへの通知を出力制御することができる。

　前記出力制御部は、前記音検出部により検出された周囲の音と似ている音質で、前記宛先のユーザへの通知を出力制御することができる。

　前記出力制御部は、前記位置検出部により検出された前記宛先以外のユーザの位置が所定のエリア内にない場合、前記宛先のユーザへの通知を出力制御することができる。

　前記出力制御部は、前記位置検出部により検出された前記宛先以外のユーザが寝ている状態と検出された場合、前記宛先のユーザへの通知を出力制御することができる。

　前記出力制御部は、前記位置検出部により検出された前記宛先以外のユーザが所定の事に集中している場合、前記宛先のユーザへの通知を出力制御することができる。

　前記所定のエリアは、前記宛先のユーザがよくいるエリアである。

　前記音検出部により検出された周囲の音が、マスキングに用いることができるマスキング可能な音であると判定されなかった場合、または、前記位置検出部により検出された前記宛先のユーザの位置が所定のエリア内にない場合、前記出力制御部は、通知があることを前記宛先のユーザに通知することができる。

　前記宛先のユーザへの通知の発信者に対して、前記宛先のユーザへの通知済みをフィードバックするフィードバック部をさらに備えることができる。

　本技術の一側面の信号処理方法は、信号処理装置が、宛先のユーザへの通知発生のタイミングで、周囲の音を検出し、前記通知発生のタイミングで、前記宛先のユーザおよび宛先以外のユーザの位置を検出し、検出された周囲の音が、マスキングに用いることができるマスキング可能な音であると判定されたタイミングで、検出された前記宛先のユーザの位置が所定のエリア内にある場合、前記宛先のユーザへの通知を出力制御する。

　本技術の一側面のプログラムは、宛先のユーザへの通知発生のタイミングで、周囲の音を検出する音検出部と、前記通知発生のタイミングで、前記宛先のユーザおよび宛先以外のユーザの位置を検出する位置検出部と、前記音検出部により検出された周囲の音が、マスキングに用いることができるマスキング可能な音であると判定されたタイミングで、前記位置検出部により検出された前記宛先のユーザの位置が所定のエリア内にある場合、前記宛先のユーザへの通知を出力制御する出力制御部として、コンピュータを機能させる。

　本技術の一側面においては、宛先のユーザへの通知発生のタイミングで、周囲の音が検出され、前記通知発生のタイミングで、前記宛先のユーザおよび宛先以外のユーザの位置が検出される。そして、検出された周囲の音が、マスキングに用いることができるマスキング可能な音であると判定されたタイミングで、検出された前記宛先のユーザの位置が所定のエリア内にある場合、前記宛先のユーザへの通知が出力制御される。

　本開示によれば、信号を処理することができる。特に、プライバシを保護した状態を自然に作り出すことができる。

本技術を適用した個別通知システムの動作について説明する図である。本技術を適用した個別通知システムの他の動作について説明する図である。エージェントの構成例を示すブロック図である。個別通知信号処理について説明するフローチャートである。図４のステップＳ５２の状態推定処理について説明するフローチャートである。コンピュータの主な構成例を示すブロック図である。

　以下、本開示を実施するための形態（以下実施の形態とする）について説明する。

　まず、図１を参照して、本技術を適用した個別通知システムの動作について説明する。

　図１の例において、個別通知システムは、エージェント２１とスピーカ２２を含むように構成されており、周囲の音（以下、周囲音と称する）を利用して、通知を伝えたい人（宛先のユーザと称する）にしか聞こえないタイミングを検出して、エージェント２１が発話するものである。

　ここで、周囲音を利用するとは、例えば、周囲の発話（宛先のユーザ以外の複数人対話や子ども同士で騒ぐなど）、空気清浄器、エアーコンディショナ、ピアノの練習音、周囲の車両通行音などが用いられて、聞こえない状況の推定を行うということである。

　エージェント２１は、本技術を適用した信号処理装置であり、ロボットのような物理エージェント、または、スマートホンやパーソナルコンピュータなどの据え置き機器または専用機器にインストールされているソフトウエアエージェントなどである。スピーカ２２は、エージェント２１に無線通信などで接続されており、エージェント２１の指示により音声を出力する。

　エージェント２１は、例えば、ユーザ１１に対する通知を有している。その際、図１のエージェント２１は、テレビジョン装置３１からの音とユーザ１１以外のユーザ（例えば、ユーザ１２）の位置を検出することで、ユーザ１２が、スピーカ２２から離れた位置（音声が通知不可能な位置）にあるテレビジョン装置３１の番組を視聴していることを認識する。そして、テレビジョン装置３１からの音がしているタイミングで、エージェント２１は、矢印に示されるように、ユーザ１１が、スピーカ２２からの音声が通知可能なエリアに移動してきたのを検出したときに、スピーカ２２より「サプライズのプレゼント案ですが、、、」と通知３２を出力する。

　また、個別通知システムは、図２のようにも動作する。図２は、本技術を適用した個別通知システムの他の動作について説明する図である。

　エージェント２１は、図１の場合と同様に、ユーザ１１に対する通知を有している。その際、図２のエージェント２１は、扇風機４１からのBooonという音（騒音）とユーザ１１以外のユーザ（例えば、ユーザ１２）の位置を検出することで、ユーザ１２が、スピーカ２２から離れた位置（音声が通知不可能な位置）におり、ユーザ１２の位置とスピーカ２２の位置で、扇風機４１が騒音を出していることを認識する。さらに、エージェント２１は、ユーザ１１が、スピーカ２２からの音声が通知可能なエリアに位置することを確認したときに、スピーカ２２より「サプライズのプレゼント案ですが、、、」と通知３２を出力する。

　以上のように、図１および図２の個別通知システムにおいては、テレビジョン装置３１の音がしているとき、あるいは、子どもが騒ぎ始めたら、など、一定以上の音がしている状況で、エージェント２１近くにいる人に発話が行われるので、ユーザ１２に聞こえないように、ユーザ１１にだけ通知することができる。これにより、プライバシを保護した状態を自然につくり出すことができる。

　なお、これら以外に、例えば、そろそろ揚げ物が終わりそう、テレビジョンの番組が終わりそう、など、検知した妨害音が継続する時間を予測して、警告の発話や視覚フィードバックが行われてもよい。

　図３は、図１のエージェントの構成例を示すブロック図である。

　図３の例において、エージェント２１には、スピーカ２２の他、カメラ５１およびマイクロホン５２が接続されている。エージェント２１は、画像入力部６１、画像処理部６２、音声入力部６３、音声処理部６４、音状態推定部６５、ユーザ状態推定部６６、音源識別用情報DB６７、ユーザ識別用情報DB６８、状態推定部６９、通知管理部７０、および出力制御部７１を含むように構成されている。

　カメラ５１は、撮像した被写体の画像を、画像入力部６１に入力する。マイクロホン５２は、上述したように、テレビジョン装置３１や扇風機４１などの音やユーザ１１や１２の音声などの周囲音を集音して、集音した周囲音を音声入力部６３に入力する。

　画像入力部６１は、カメラ５１からの画像を、画像処理部６２に供給する。画像処理部６２は、供給された画像に対して、所定の画像処理を行い、画像処理済みの画像を、音状態推定部６５およびユーザ状態推定部６６に供給する。

　音声入力部６３は、マイクロホン５２からの周囲音を、音声処理部６４に供給する。音声処理部６４は、供給された音に対して、所定の音声処理を行い、音声処理済みの音を、音状態推定部６５およびユーザ状態推定部６６に供給する。

　音状態推定部６５は、画像処理部６２からの画像および音声処理部６４からの音から、音源識別用情報DB６７の情報を参照して、例えば、室内で空気清浄器、エアーコンディショナのような機器から発せられる定常音、室内でテレビジョン、ピアノの音のような機器から非定期的に発せられる音、人や動物からの発声音、または、周囲の車両通行音など室外から入ってくる環境音など、マスキング素材音を検出し、検出結果を状態推定部６９に供給する。また、音状態推定部６５は、検出されたマスキング素材音が継続するかを推定し、推定結果を状態推定部６９に供給する。

　ユーザ状態推定部６６は、画像処理部６２からの画像および音声処理部６４からの音から、ユーザ識別用情報DB６８の情報を参照して、宛先であるユーザ、宛先以外のユーザなどすべてのユーザの位置を検出し、その検出結果を状態推定部６９に供給する。また、ユーザ状態推定部６６は、すべてのユーザの移動を検出して、検出結果を状態推定部６９に供給する。このとき、それぞれのユーザに対して、移動軌跡を加味した位置予測が行われる。

　音源識別用情報DB６７は、音源ごとの周波数・継続時間・音量特性、時間帯ごとの出現頻度情報などを記憶している。ユーザ識別用情報DB６８には、ユーザの嗜好性、ユーザの一日の行動パターン（ユーザに伝わりやすい場所やよく行く場所についてなどのこと）が、ユーザ情報として記憶されている。このユーザ識別用情報DB６８を参照して、ユーザ状態推定部６６は、ユーザ本来の行動を予測して、それを阻害しないように情報提示するようにできる。通知可能エリアの設定も、ユーザ識別用情報DB６８を参照して行われてもよい。

　状態推定部６９は、音状態推定部６５からの検出結果や推定結果、ユーザ状態推定部６６からの検出結果に基づき、素材音や各ユーザの位置に応じて、検出された素材音が、宛先以外のユーザに対してマスキングが可能であるか否かを判定し、可能である場合、通知管理部７０を制御し、宛先のユーザに対して通知を行わせる。

　通知管理部７０は、通知、すなわち、通知する必要のある伝言やメッセージなどを管理しており、通知が発生した場合、状態推定部６９にその旨を通知し、状態推定を行わせる。また、通知管理部７０は、状態推定部６９からの制御のタイミングで、出力制御部７１に、伝言やメッセージを出力させる。

　出力制御部７１は、通知管理部７０からの制御のもと、伝言やメッセージを音声出力部７２に出力させる。例えば、出力制御部７１は、音声出力部７２を制御し、例えば、マスキング素材音（テレビジョンで発話にしている人の声質）に似ている音量であったり、マスキング素材音（周囲で対話している人）よりも目立たない音質、音量で、通知させるようにしてもよい。

　また、聞こえにくい周波数の利用として、宛先以外のユーザだけに聞こえる周波数帯の音でメッセージすることも可能である。例えば、モスキート音をマスキング素材音としてメッセージを発生させることで、若者にはモスキートオンによりメッセージが聞こえない状況とすることができる。例えば、検出された素材音がマスキング不可能であったり、素材音が検出されなかった場合に、モスキート音が用いられるようにしてもよい。なお、聞こえにくい周波数としたが、周波数に限らず、聞こえにくい音質など聞こえにくい音であれば、利用可能である。

　音声出力部７２は、出力制御部７１の制御のもと、伝言やメッセージを所定の音で出力する。

　なお、図３の例においては、伝言やメッセージの通知は、音声のみにする例の構成例が示されているが、視覚による通知や、視覚および聴覚による通知を行うために、個別通知システムには、表示部を備えさせて、エージェントを、表示制御部を備えた構成とすることもできる。

　次に、図４のフローチャートを参照して、個別通知システムの個別通知信号処理について説明する。

　ステップＳ５１において、通知管理部７０は、宛先への通知が発生したと判定するまで待機している。ステップＳ５１において、通知が発生したと判定された場合、通知管理部７０は、状態推定部６９に、通知が発生したことを示す信号を供給し、処理は、ステップＳ５２に進む。

　ステップＳ５２において、音状態推定部６５およびユーザ状態推定部６６は、状態推定部６９の制御のもと、状態推定処理を行う。この状態推定処理は、図５を参照して後述されるが、ステップＳ５２の状態推定処理により、素材音の検出結果とユーザ状態の検出結果とが状態推定部６９に供給される。なお、素材音の検出とユーザ状態の検出は、通知が発生した同じタイミングで行われてもよいし、全く同じでなくても、多少違っていてもよい。

　ステップＳ５３において、状態推定部６９は、素材音の検出結果とユーザ状態の検出結果に基づいて、素材音によりマスキング可能であるか否かを判定する。すなわち、素材音でマスキングすることで、宛先のユーザだけに通知ができるかが判定される。ステップＳ５３において、マスキング可能ではないと判定された場合、処理は、ステップＳ５２に戻り、それ以降の処理が繰り返される。

　ステップＳ５３において、マスキング可能であると判定された場合、処理は、ステップＳ５４に進む。ステップＳ５４において、通知管理部７０は、状態推定部６９の制御のタイミングで、出力制御部７１に、通知を実行させ、スピーカ２２から、伝言やメッセージを出力させる。

　次に、図５のフローチャートを参照して、図４のステップＳ５２の状態推定処理について説明する。

　カメラ５１は、撮像した被写体の画像を、画像入力部６１に入力する。マイクロホン５２は、上述したように、テレビジョン装置３１や扇風機４１などの音やユーザ１１やユーザ１２の音声などの周囲音を集音して、集音した周囲音を音声入力部６３に入力する。

　ステップＳ７１において、ユーザ状態推定部６６は、ユーザの位置を検出する。すなわち、ユーザ状態推定部６６は、画像処理部６２からの画像および音声処理部６４からの音から、ユーザ識別用情報DB６８の情報を参照して、宛先であるユーザ、宛先以外のユーザなどすべてのユーザの位置を検出し、その検出結果を状態推定部６９に供給する。

　ステップＳ７２において、ユーザ状態推定部６６は、すべてのユーザの移動を検出して、検出結果を状態推定部６９に供給する。

　ステップＳ７３において、音状態推定部６５は、画像処理部６２からの画像および音声処理部６４からの音から、音源識別用情報DB６７の情報を参照して、空気清浄器、エアーコンディショナ、テレビジョン、ピアノの音や、周囲の車両通行音など、マスキング素材音を検出し、検出結果を状態推定部６９に供給する。

　ステップＳ７４において、音状態推定部６５は、検出されたマスキング素材音が継続するかを推定し、推定結果を状態推定部６９に供給する。

　その後、図４のステップＳ５２に戻り、処理は、ステップＳ５３に進む。そして、ステップＳ５３において、これらの素材音の検出結果とユーザ状態の検出結果に基づいて、素材音によりマスキング可能であるか否かが判定される。

　以上のようにすることで、宛先のユーザだけに聞こえるように、伝言やメッセージを出力させることができる。すなわち、プライバシを保護した状態を自然に作り出すことができる。

　なお、上記説明においては、マスキング素材音を利用して、宛先のユーザ以外に聞こえないようにする例を説明してきたが、アテンションがないときを利用して、宛先のユーザ以外に聞こえないようにしてもよい。

　「アテンションがないとき」とは、例えば、宛先のユーザ以外が何かに集中していて（テレビジョンの番組や仕事など）、音が聞こえない状態であるとき、例えば、居眠り状態のとき（状態を検知して、伝えたくない人が聞こえなさそうであれば、通知を実行する）。

　さらに、例えば、自動でコンテンツなどを再生する機能などを用いて、宛先以外のユーザに対して、そのユーザが興味を持つ音楽、ニュースなどのコンテンツを再生し、その間に宛先のユーザに対して秘匿したい情報を提示することも可能である。

　なお、宛先であるユーザだけに聞こえるように、伝言やメッセージを出力させることができない場合、通知があることだけを宛先のユーザに指定したり、宛先の端末の表示部に提示したり、廊下やトイレなど宛先以外のユーザがいない場所への誘導を行うようにしてもよい。

　また、宛先であるユーザだけに聞こえるように、伝言やメッセージを出力させた後の確認方法としては、通知の提供者に対して、パブリックスペースにいる宛先のユーザに情報を提示したことをフィードバックするようにしてもよい。宛先のユーザが情報の内容を確認したこともフィードバックするようにしてもよい。フィードバック方法は、ジェスチャでもかまわない。このフィードバックは、例えば、通知管理部７０などにより行われる。

　さらに、マルチモーダルを用いてもよい。すなわち、音とビジュアル、触覚などを組み合わせ、音だけ、ビジュアルだけでは内容が伝わらないような構成にして、両者を組み合わせることで、情報の内容が伝わるようにしてもよい。

　＜コンピュータ＞
　上述した一連の処理は、ハードウエアにより実行させることもできるし、ソフトウエアにより実行させることもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここでコンピュータには、専用のハードウエアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータ等が含まれる。

　図６は、上述した一連の処理をプログラムにより実行するコンピュータのハードウエアの構成例を示すブロック図である。

　図６に示されるコンピュータにおいて、CPU（Central Processing Unit）３０１、ROM（Read Only Memory）３０２、RAM（Random Access Memory）３０３は、バス３０４を介して相互に接続されている。

　バス３０４にはまた、入出力インタフェース３０５も接続されている。入出力インタフェース３０５には、入力部３０６、出力部３０７、記憶部３０８、通信部３０９、およびドライブ３１０が接続されている。

　入力部３０６は、例えば、キーボード、マウス、マイクロホン、タッチパネル、入力端子などよりなる。出力部３０７は、例えば、ディスプレイ、スピーカ、出力端子などよりなる。記憶部３０８は、例えば、ハードディスク、RAMディスク、不揮発性のメモリなどよりなる。通信部３０９は、例えば、ネットワークインタフェースよりなる。ドライブ３１０は、磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリなどのリムーバブルメディア３１１を駆動する。

　以上のように構成されるコンピュータでは、CPU３０１が、例えば、記憶部３０８に記憶されているプログラムを、入出力インタフェース３０５およびバス３０４を介して、RAM３０３にロードして実行することにより、上述した一連の処理が行われる。RAM３０３にはまた、CPU３０１が各種の処理を実行する上において必要なデータなども適宜記憶される。

　コンピュータ（CPU３０１）が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブルメディア３１１に記録して適用することができる。その場合、プログラムは、リムーバブルメディア３１１をドライブ３１０に装着することにより、入出力インタフェース３１０を介して、記憶部３０８にインストールすることができる。

　また、このプログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することもできる。その場合、プログラムは、通信部３０９で受信し、記憶部３０８にインストールすることができる。

　その他、このプログラムは、ROM３０２や記憶部３０８に、あらかじめインストールしておくこともできる。

　また、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。

　例えば、本明細書において、システムとは、複数の構成要素（装置、モジュール（部品）等）の集合を意味し、全ての構成要素が同一筐体中にあるか否かは問わない。したがって、別個の筐体に収納され、ネットワークを介して接続されている複数の装置、及び、１つの筐体の中に複数のモジュールが収納されている１つの装置は、いずれも、システムである。

　また、例えば、１つの装置（または処理部）として説明した構成を分割し、複数の装置（または処理部）として構成するようにしてもよい。逆に、以上において複数の装置（または処理部）として説明した構成をまとめて１つの装置（または処理部）として構成されるようにしてもよい。また、各装置（または各処理部）の構成に上述した以外の構成を付加するようにしてももちろんよい。さらに、システム全体としての構成や動作が実質的に同じであれば、ある装置（または処理部）の構成の一部を他の装置（または他の処理部）の構成に含めるようにしてもよい。

　また、例えば、本技術は、１つの機能を、ネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。

　また、例えば、上述したプログラムは、任意の装置において実行することができる。その場合、その装置が、必要な機能（機能ブロック等）を有し、必要な情報を得ることができるようにすればよい。

　また、例えば、上述のフローチャートで説明した各ステップは、１つの装置で実行する他、複数の装置で分担して実行することができる。さらに、１つのステップに複数の処理が含まれる場合には、その１つのステップに含まれる複数の処理は、１つの装置で実行する他、複数の装置で分担して実行することができる。

　なお、コンピュータが実行するプログラムは、プログラムを記述するステップの処理が、本明細書で説明する順序に沿って時系列に実行されるようにしても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで個別に実行されるようにしても良い。さらに、このプログラムを記述するステップの処理が、他のプログラムの処理と並列に実行されるようにしても良いし、他のプログラムの処理と組み合わせて実行されるようにしても良い。

　なお、本明細書において複数説明した本技術は、矛盾が生じない限り、それぞれ独立に単体で実施することができる。もちろん、任意の複数の本技術を併用して実施することもできる。例えば、いずれかの実施の形態において説明した本技術を、他の実施の形態において説明した本技術と組み合わせて実施することもできる。また、上述した任意の本技術を、上述していない他の技術と併用して実施することもできる。

　なお、本技術は以下のような構成も取ることができる。
　（１）　宛先のユーザへの通知発生のタイミングで、周囲の音を検出する音検出部と、
　前記通知発生のタイミングで、前記宛先のユーザおよび宛先以外のユーザの位置を検出する位置検出部と、
　前記音検出部により検出された周囲の音が、マスキングに用いることができるマスキング可能な音であると判定されたタイミングで、前記位置検出部により検出された前記宛先のユーザの位置が所定のエリア内にある場合、前記宛先のユーザへの通知を出力制御する出力制御部と
　を備える信号処理装置。
　（２）　前記宛先のユーザおよび宛先以外のユーザの移動を検出する移動検出部を
　さらに備え、
　前記移動検出部により移動が検出された場合、前記位置検出部は、前記移動検出部により検出された移動により推定される前記宛先のユーザおよび宛先以外のユーザの位置も検出する
　前記（１）に記載の信号処理装置。
　（３）　前記マスキング可能な音が継続する時間を予測する継続時間予測部をさらに備え、
　前記出力制御部は、前記継続時間予測部により予測された前記マスキング可能な音の継続が終了する旨を出力制御する
　前記（１）または（２）に記載の信号処理装置。
　（４）　前記周囲の音は、室内で機器から発せられる定常音、室内で機器から非定期的に発せられる音、人や動物からの発声音、または室外から入ってくる環境音である
　前記（１）乃至（３）のいずれかに記載の信号処理装置。
　（５）　前記音検出部により検出された周囲の音が、マスキングに用いることができるマスキング可能な音でないと判定された場合、前記位置検出部により検出された前記宛先のユーザの位置が所定のエリア内にあるとき、前記出力制御部は、前記宛先以外のユーザだけに聞こえる周波数帯の音とともに、前記宛先のユーザへの通知を出力制御する
　前記（１）乃至（４）のいずれかに記載の信号処理装置。
　（６）　前記出力制御部は、前記音検出部により検出された周囲の音と似ている音質で、前記宛先のユーザへの通知を出力制御する
　前記（１）乃至（５）のいずれかに記載の信号処理装置。
　（７）　前記出力制御部は、前記位置検出部により検出された前記宛先以外のユーザの位置が所定のエリア内にない場合、前記宛先のユーザへの通知を出力制御する
　前記（１）乃至（６）のいずれかに記載の信号処理装置。
　（８）　前記出力制御部は、前記位置検出部により検出された前記宛先以外のユーザが寝ている状態と検出された場合、前記宛先のユーザへの通知を出力制御する
　前記（１）乃至（６）のいずれかに記載の信号処理装置。
　（９）　前記出力制御部は、前記位置検出部により検出された前記宛先以外のユーザが所定の事に集中している場合、前記宛先のユーザへの通知を出力制御する
　前記（１）乃至（６）のいずれかに記載の信号処理装置。
　（１０）　前記所定のエリアは、前記宛先のユーザがよくいるエリアである
　前記（１）乃至（９）のいずれかに記載の信号処理装置。
　（１１）　前記音検出部により検出された周囲の音が、マスキングに用いることができるマスキング可能な音であると判定されなかった場合、または、前記位置検出部により検出された前記宛先のユーザの位置が所定のエリア内にない場合、前記出力制御部は、通知があることを前記宛先のユーザに通知する
　前記（１）乃至（１０）のいずれかに記載の信号処理装置。
　（１２）　前記宛先のユーザへの通知の発信者に対して、前記宛先のユーザへの通知済みをフィードバックするフィードバック部をさらに備える
　前記（１）乃至（１１）のいずれかに記載の信号処理装置。
　（１３）　信号処理装置が、
　宛先のユーザへの通知発生のタイミングで、周囲の音を検出する音検出部と、
　前記通知発生のタイミングで、前記宛先のユーザおよび宛先以外のユーザの位置を検出する位置検出部と、
　前記音検出部により検出された周囲の音が、マスキングに用いることができるマスキング可能な音であると判定されたタイミングで、前記位置検出部により検出された前記宛先のユーザの位置が所定のエリア内にある場合、前記宛先のユーザへの通知を出力制御する
　信号処理方法。
　（１４）　宛先のユーザへの通知発生のタイミングで、周囲の音を検出する音検出部と、
　前記通知発生のタイミングで、前記宛先のユーザおよび宛先以外のユーザの位置を検出する位置検出部と、
　前記音検出部により検出された周囲の音が、マスキングに用いることができるマスキング可能な音であると判定されたタイミングで、前記位置検出部により検出された前記宛先のユーザの位置が所定のエリア内にある場合、前記宛先のユーザへの通知を出力制御する出力制御部と
　して、コンピュータを機能させるプログラム。

　２１　エージェント，　２２　スピーカ，　３１　テレビジョン装置，　３２　通知，　４１　扇風機，　５１　カメラ，　５２　マイクロホン，　６１　画像入力部，　６２　画像処理部，　６３　音声入力部，　６４　音声処理部，　６５　音状態推定部，　６６　ユーザ状態推定部，　６７　音源識別用情報DB，　６８　ユーザ識別用情報DB，　６９　状態推定部，　７０　通知管理部，　７１　出力制御部，　７２　音声出力部

Claims

　宛先のユーザへの通知発生のタイミングで、周囲の音を検出する音検出部と、
　前記通知発生のタイミングで、前記宛先のユーザおよび宛先以外のユーザの位置を検出する位置検出部と、
　前記音検出部により検出された周囲の音が、マスキングに用いることができるマスキング可能な音であると判定されたタイミングで、前記位置検出部により検出された前記宛先のユーザの位置が所定のエリア内にある場合、前記宛先のユーザへの通知を出力制御する出力制御部と
　を備える信号処理装置。
　前記宛先のユーザおよび宛先以外のユーザの移動を検出する移動検出部を
　さらに備え、
　前記移動検出部により移動が検出された場合、前記位置検出部は、前記移動検出部により検出された移動により推定される前記宛先のユーザおよび宛先以外のユーザの位置も検出する
　請求項１に記載の信号処理装置。
　前記マスキング可能な音が継続する時間を予測する継続時間予測部をさらに備え、
　前記出力制御部は、前記継続時間予測部により予測された前記マスキング可能な音の継続が終了する旨を出力制御する
　請求項１に記載の信号処理装置。
　前記周囲の音は、室内で機器から発せられる定常音、室内で機器から非定期的に発せられる音、人や動物からの発声音、または室外から入ってくる環境音である
　請求項１に記載の信号処理装置。
　前記音検出部により検出された周囲の音が、マスキングに用いることができるマスキング可能な音でないと判定された場合、前記位置検出部により検出された前記宛先のユーザの位置が所定のエリア内にあるとき、前記出力制御部は、前記宛先以外のユーザだけに聞こえる音質の音とともに、前記宛先のユーザへの通知を出力制御する
　請求項１に記載の信号処理装置。
　前記出力制御部は、前記音検出部により検出された周囲の音と似ている音質で、前記宛先のユーザへの通知を出力制御する
　請求項１に記載の信号処理装置。
　前記出力制御部は、前記位置検出部により検出された前記宛先以外のユーザの位置が所定のエリア内にない場合、前記宛先のユーザへの通知を出力制御する
　請求項１に記載の信号処理装置。
　前記出力制御部は、前記位置検出部により検出された前記宛先以外のユーザが寝ている状態と検出された場合、前記宛先のユーザへの通知を出力制御する
　請求項１に記載の信号処理装置。
　前記出力制御部は、前記位置検出部により検出された前記宛先以外のユーザが所定の事に集中している場合、前記宛先のユーザへの通知を出力制御する
　請求項１に記載の信号処理装置。
　前記所定のエリアは、前記宛先のユーザがよくいるエリアである
　請求項１に記載の信号処理装置。
　前記音検出部により検出された周囲の音が、マスキングに用いることができるマスキング可能な音であると判定されなかった場合、または、前記位置検出部により検出された前記宛先のユーザの位置が所定のエリア内にない場合、前記出力制御部は、通知があることを前記宛先のユーザに通知する
　請求項１に記載の信号処理装置。
　前記宛先のユーザへの通知の発信者に対して、前記宛先のユーザへの通知済みをフィードバックするフィードバック部をさらに備える
　請求項１に記載の信号処理装置。
　信号処理装置が、
　宛先のユーザへの通知がある場合、周囲の音を検出する音検出部と、
　前記宛先のユーザおよび宛先以外のユーザの位置を検出する位置検出部と、
　前記音検出部により検出された周囲の音が、マスキングに用いることができるマスキング可能な音であると判定されたタイミングで、前記位置検出部により検出された前記宛先のユーザの位置が所定のエリア内にある場合、前記宛先のユーザへの通知を出力制御する
　信号処理方法。
　宛先のユーザへの通知発生のタイミングで、周囲の音を検出する音検出部と、
　前記通知発生のタイミングで、前記宛先のユーザおよび宛先以外のユーザの位置を検出する位置検出部と、
　前記音検出部により検出された周囲の音が、マスキングに用いることができるマスキング可能な音であると判定されたタイミングで、前記位置検出部により検出された前記宛先のユーザの位置が所定のエリア内にある場合、前記宛先のユーザへの通知を出力制御する出力制御部と
　して、コンピュータを機能させるプログラム。