JP2009282645A - 情報処理装置 - Google Patents
情報処理装置 Download PDFInfo
- Publication number
- JP2009282645A JP2009282645A JP2008132552A JP2008132552A JP2009282645A JP 2009282645 A JP2009282645 A JP 2009282645A JP 2008132552 A JP2008132552 A JP 2008132552A JP 2008132552 A JP2008132552 A JP 2008132552A JP 2009282645 A JP2009282645 A JP 2009282645A
- Authority
- JP
- Japan
- Prior art keywords
- display
- utterance
- user
- duration
- utterance position
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【解決手段】複数のマイクロフォンが所定配置で設けられているマイクロフォンアレイで取得された音声データに基づいてユーザーの鼻口腔から発せられた音の継続時間を特定すると共に、ユーザーの鼻口腔から発せられた音の発声位置を3次元的に特定する発生位置特定手段、前記継続時間が所定時間より長いか否かを判定する手段、およびユーザーに対する表示を行う表示制御手段とを有し、前記表示制御手段は、前記継続時間判定手段による判定結果と、前記発声位置特定手段によって特定された発声位置とに応じて、ディスプレイ上の表示態様を変更するように制御する。
【選択図】図1
Description
また、特許文献2(特開2007−228135号公報)では、雑音に対する頑健性を高めた音声ポインティングデバイスを開発し、ユーザが進みたい方向を向いて音声、呼気音、または口笛などの音をたてることで、進行方向の指示が可能な電動車いすの開発を行っている。電動車いすの例では、ポインティングデバイスのセンサ部である2つのマイクロフォンアレイを左右の肘掛先端に実装することで、音源の2次元的な位置を推定している。
ーフェイスの改善の余地が大いに残されている。
クロフォンアレイと、前記マイクロフォンアレイにより取得された音声データに基づいてユーザーの鼻口腔から発せられた音の継続時間を特定する継続時間特定手段と、前記マイクロフォンアレイにより取得された音声データに基づいてユーザーの鼻口腔から発せられた音の発声位置を3次元的に特定する発声位置特定手段と、前記継続時間特定手段によって特定された継続時間が所定時間より長いか否かを判定する継続時間判定手段と、ユーザーに対する表示を行う表示手段と、前記表示手段を制御する表示制御手段と、を有し、前記表示制御手段は、前記継続時間判定手段による判定結果と、前記発声位置特定手段によって特定された発声位置とに応じて、前記表示手段に表示されるカーソルの移動量の変更を行うように制御することを有することを特徴とする情報処理装置である。
図1は本発明の実施の形態に係る情報処理装置の外観を斜視的に示す図であり、図2は本発明の実施の形態に係る情報処理装置に用いられるインターフェイス装置の外観を斜視的に示す図であり、図3は本発明の実施の形態に係る情報処理装置のブロック構成を示す図である。
ーフェイス装置100と、インターフェイス装置100からの入力を受けこれに基づいて演算処理などを行うコンピュータ本体部20と、コンピュータ本体部20からの出力をユーザーのために表示するディスプレイ部30とから主として構成されている。コンピュータ本体部20は、CPU(不図示)とCPU上で動作するプログラムを保持するROM(不図示)やHDD(不図示)、CPUのワークエリアとして機能するRAM(不図示)、他の機器と接続するためのインターフェイス手段(不図示)などからなる汎用の情報処理機構であり、例えば汎用のパーソナルコンピュータを用いることができる。また、特許請求の範囲において「表示制御手段」として表現される構成は、コンピュータ本体部20のCPUとCPU上で動作するプログラムとビデオRAM(不図示)などによって実現されるものである。このようなコンピュータ本体部20の構成や動作については、いずれも周知であるので詳述を避ける。また、特許請求の範囲において「表示手段」として記載されている構成はディスプレイ部30である。このディスプレイ部30についても一般的なものを用いることができる。なお、コンピュータ本体部20としては、汎用のパーソナルコンピュータなどを用いることができるが、これに限らず、その他の種々のコンピュータを用いることができる。
域の中のユーザーの発声のみを検出するようにして、発声検出領域R外からの音は雑音と
して処理する。
かが特定される。このような特定を行う構成は、特許請求の範囲において「発声位置特定手段」として表現されている。
、仮想的に分割された空間の中で、発声がどの空間内で発声があったのかに係る情報が利用される。
ォンアレイ200から音声データの取り込みが行われる。このステップではより具体的には、マイクロフォンアレイ200から出力される音声のアナログ信号をマイクアンプ280で増幅した後、AD変換部290でデジタル信号に変換し、記憶部400に一時記憶する。
る。
に係る情報処理装置において発声検出領域R中に定義された仮想空間例を示す図である。
、A4の4つの空間に分割されており、それぞれ空間で発声があった場合には、一般的な
十字キーの「上」、「下」、「右」、「左」に相当するイベントとして定義されている。例えば、A1の領域内でユーザーが長く「シュー」と発音すると、十字キーの「上」に相
当するイベント検出信号が生成される訳である。
すると、十字キーの「上」の方向に速くカーソルが移動するようなイベント検出信号が生成される。
の空間に分割されており、それぞれ空間で発声があった場合には、一般的なマウスの「右クリック」、「左クリック」に相当するイベントとして定義されている。例えば、B1の
領域内でユーザーが短く「シュッ」と発音すると、マウスの「右クリック」に相当するイベント検出信号が生成される訳である。
てカーソルが上方向に移動するように表示制御がされる。また、B1の領域内でユーザー
が短く「シュッ」などと発音すると、ディスプレイ部30において、マウスの右クリックに相当するような表示制御がされる。
間例を示す図である。
、A4の4つの空間に分割されており、それぞれ空間で発声があった場合には、一般的な
十字キーの「上」、「下」、「右」、「左」に相当するイベントとして定義されている。例えば、A1の領域内でユーザーが長く「シュー」と発音すると、十字キーの「上」に相
当するイベント検出信号が生成される訳である。
の3つの空間に分割されており、それぞれ空間で発声があった場合には、一般的なマウスの「右クリック」、「左クリック」、「拡大表示の実行/解除」に相当するイベントとして定義されている。例えば、C1の領域内でユーザーが短く「シュッ」と発音すると、マ
ウスの「右クリック」に相当するイベント検出信号が生成される訳である。また、C3の
領域内でユーザーが短く「シュッ」と発音すると、カーソル近傍の表示の拡大表示を実行したり、或いは拡大表示を解除したりするコマンドに相当するイベント検出信号が生成される訳である。
領域内でユーザーが短く「シュッ」などと発音すると、ディスプレイ部30においてカーソル近傍の表示の拡大表示を実行したり、或いは拡大表示を解除したりする表示制御がなされる。つまり、C3の領域内でユーザーの短時間の発声が、拡大表示ON・OFFのト
グルスイッチのような役割を果たし、ユーザーはこのようなスイッチ機能によって、必要に応じて拡大表示を行い、細かい入力作業を実行することができるようになる。これにより、本発明の情報処理装置10では、小さなアイコンやボタンへのカーソル移動などの細かな入力操作を行うことが可能となる。
空間例を示す図である。
般的な十字キーの「上」、「下」、「右」、「左」に相当するイベントとして定義されている。例えば、D1の領域内でユーザーが長く「シュー」と発音すると、十字キーの「上
」に相当するイベント検出信号が生成される訳である。また、発声検出領域Rの奥側に設
定されたD5の領域は、ディスプレイ部30における表示の拡大率をユーザーが変更可能
なように設けられた空間である。そして、拡大率の変更においては、PQRS平面と発声位置と間の距離に応じて拡大率が設定されるようにしている。領域D5において、PQR
S平面と発声位置とが近ければ近いほど、拡大率が大きくなるように設定し、PQRS平面と発声位置とが近ければ近いほど、拡大率が小さくなるように設定すると、入力デバイスとして直感的に用いることが可能である。例えば、D5の領域内でユーザーが長く「シ
ュー」と発音しながら、長い発声で近づくと拡大率が大きくなるようなイベント検出信号がインターフェイス装置100によって生成され、これをコンピュータ本体部20に送信し、ディスプレイ部30における表示の拡大率を大きくするように表示制御させる。
すると、十字キーの「上」の方向に速くカーソルが移動するようなイベント検出信号が生成される。
の領域内でユーザーが短く「シュッ」と発音すると、マウスの「右クリック」に相当するイベント検出信号が生成される訳である。
領域内でユーザーが長く「シュー」などと発音しながら、PQRS平面に近づけば近づくほど、ディスプレイ部30での表示の拡大率が大きくなり、D5の領域内でユーザーが長
く「シュー」などと発音しながら、PQRS平面から離れれば離れるほど、ディスプレイ部30での表示の拡大率が小さくなるように、表示制御がなされるようになっている。ユーザーはこのような拡大率の変更機能によって、必要に応じて拡大表示を行い、細かい入力作業を実行することができるようになる。これにより、本発明の情報処理装置10では、小さなアイコンやボタンへのカーソル移動などの細かな入力操作を行うことが可能となる。
空間例を示す図である。
、A4の4つの空間に分割されており、それぞれ空間で発声があった場合には、一般的な
十字キーの「上」、「下」、「右」、「左」に相当するイベントとして定義されている。例えば、A1の領域内でユーザーが長く「シュー」と発音すると、十字キーの「上」に相
当するイベント検出信号が生成される訳である。
する。すなわち、大きな音量で発声するほど一度に大きく移動することができるようなイベント検出信号を生成する。このようなイベント検出信号によれば、ディスプレイ部30では、大きな音量で発声されるほど、カーソルが一度に大きく移動するような表示制御がなされる。例えば、A1の領域内でユーザーが、比較的大きな声で長く「シュー」と発音
すると、十字キーの「上」の方向に速くカーソルが移動するようなイベント検出信号が生成される。
、E4、E5、E6の6つの空間に分割されており、E1、E2の領域で発声があった場合に
は、一般的なマウスの「右クリック」、「左クリック」に相当するイベントとして定義されている。例えば、E1の領域内でユーザーが短く「シュッ」と発音すると、マウスの「
右クリック」に相当するイベント検出信号が生成される訳である。
に相当するイベント検出信号が生成される訳である。このようなイベント検出信号によれば、ディスプレイ部30では、カーソルが微小移動するような表示制御がなされる。すなわち、ユーザーは必要に応じて、空間領域のE3、E4、E5、E6の短い発声を行うことにより、カーソルの細かい移動を実行することができるようになる。
移動し、右上45°の方向で発声が検出されたらカーソルは右上45°の方向に移動するように表示制御する。また、カーソルの移動量は、分割された領域の境界部に存在する所定の線分(O−O’)からの距離に比例して決定するようにしてもよい。すなわち、中心から離れて発声するほど一度に大きくカーソルを移動させることができるように表示制御を行う。カーソルの移動量は、距離と発声音量に比例して決定するようにしてもよい。
空間例を示す図である。
に説明する。
’においては、カーソル移動量を特定する際には、距離dに比例し、なおかつ、拡大率
に反比例したカーソル移動量が特定されるようになっている。例えば、拡大率が2倍となると、例えば、カーソルの移動量は1/2となるように設定されている。
分(O−O’)からの距離dに比例して決定する。すなわち、中心から離れて発声するほど一度に大きくカーソルを移動させることができるように表示制御を行う。
空間例を示す図である。
心に説明する。
’においては、カーソル移動量を特定する際には、距離dに比例し、なおかつ、拡大率
に反比例したカーソル移動量が特定されるようになっている。例えば、拡大率が2倍となると、例えば、カーソルの移動量は1/2となるように設定されている。
発声位置を認識しているかをグラフィカルに示すウインドウである。
るのかを把握することは容易ではない。また、発声音量は発声する音「シー」や「シュー」の違いでも変化し、把握しにくい。
1)ズーム機能無し (第1実施形態)
2)クリック動作によるON/OFF切り替えズーム有り (第2実施形態)
3)発話位置によるON/OFF切り替えズーム有り (第3実施形態)
それぞれの条件について本人が操作可能であると判断するまで練習を行い、実験を行った。
いずれのズーム機能においてもズーム無しの時と比較して目標への到達時間が短縮されている。このことからズームによりカーソルの細かい操作が可能になったといえ、ズーム機能の有効性が示された。また、二つのズーム機能を比較すると、概ね発話位置によるON/OFF切り替えズームが短い時間で目標に到達している。これは、クリックによるON/OFF切り替えでは、一度移動を停止し、クリックを行う必要があったためであると考えられる。しかし、いくつかの試行では位置によるON/OFF切り替えの方が目標到達へ長い時間を要している。これは、Z軸方向の発話位置がユーザの意図しない時に変化したことによる。このときズーム倍率が変化し、カーソルが予期しない速度で移動し制御が困難になる。この傾向は練習時間が短かった被験者ほど現れやすかった。
被験者へのインタビューの結果、システムの使用感に関して以下のことがわかった。
・前後(Z軸)方向の発話位置が制御しにくく、思ったようにズームの倍率を制御できない。
・カーソル位置の微調整が(ズーム機能なしでは)できない。
・短時間発話でクリックではなく微調整ができるようにしてほしい。
スプレイからの距離も変化し、ユーザの意図しないZ軸座標の変化が現れる。これにより、拡大率が予期せず変化し、ユーザの混乱を招く。練習時間を長くとった場合、発話位置のZ軸座標制御が可能になるが、多くの被験者はできる限り前後への移動をしない、すなわち、ズーム機能を使用しないように操作を行っていた。また、
・拡大表示内に目標が入っていないと目標を見失う。
・視覚フィードバックを見ながら操作するのは難しい。
・カーソルを見失いやすい
等の視覚的な面での問題点が挙げられた。視覚フィードバックは操作の邪魔にならないようにディスプレイ部30右下に表示されている。操作をしながらその表示を確認することは難しい。また、マウスなどと比較して制御が難しいため、予想以上に大きく移動してしまうことがしばしば発生し、カーソルを見失うことがある。そこで、視覚フィードバックをカーソルに重ねる形で表示する等の方法が考えられる。
つの処理、1.ユーザ発声位置の推定(近距離音源の推定)、2.周囲雑音の到来方向推定(遠距離にある音源の音波到来方向の推定)、3.ユーザーの発話検出、4.音源分離、
5.音声認識処理(特願2003−320183号)について以下に述べる。
1.ユーザー発声位置の推定(近距離音源の推定)
マイクロフォンアレイから約1m以内の近距離にある音源の位置を、マイクロフォンアレイで推定する方法について以下に説明する。
任意の位置
音源位置の推定処理は連続するN個のフレームを1つのブロックとして処理する。音源位置の推定をより安定に行うためには、フレーム数Nを増やす、そして/また連続するNb個のブロックの全てで式(30)の条件が満たされたら発声があったと判断する。ブロック数は任意に設定する。連続するNフレームの時間内において、近似的に音源が静止していると見られるほどの速さで音源が移動している場合は、前記手法により音源の移動奇跡を捉えることができる。
2.周囲雑音の到来方向推定(遠距離にある音源の音波到来方向の推定)
マイクロフォンアレイから遠距離にある音源の音波が到来する方向を、マイクロフォンアレイで推定する手法について以下に述べる。
複数のマイクロフォンは3次元空間中の任意の位置に配置可能である。遠距離から到来す
る音波は平面波として観測されると考える。
,φ)から到来する音波を各マイクロフォンで受音し、そのフーリエ変換を求めることで受音信号を狭帯域信号に分解し、各受音信号の狭帯域信号毎に利得と位相を複素数として表し、それを要素として狭帯域信号毎に全受音信号分だけ並べたベクトルを音源の位置ベクトルと定義する。以下の処理において、方向(θ,φ)から到来する音波は、前述の位置ベクトルとして表現される。位置ベクトルは具体的に以下のように求められる。q番目のマイクロフォンと平面sの間の距離rqを次式により求める。
距離音源が発生する直前に推定された、遠距離音源の音波の到来方向推定結果を用いるなどして対処する。
3.ユーザーの発話検出
複数の音源が存在している場合、どの音源が認識すべき音声なのかの特定は一般的に難しい。一方、音声を用いたインタフェースを採用するシステムでは、予めシステムのユーザがシステムに対して相対的にどのような位置で発声するかを表すユーザ発声領域を決めておくことができる。この場合、前述の方法でシステムの周囲に音源が複数存在しているとしても、各音源の位置や音波の到来方向を推定できれば、システムが予め想定しているユーザ発声領域に入る音源を選択することで容易にユーザの音声を特定できるようになる。
る。図23では、任意の位置に配置された8個のマイクロフォンm1〜m8を用いた処理を仮定し、近距離音源の探索領域および遠距離音源の探索領域のそれぞれで、ユーザ発声領域を定義している。近距離音源の探索空間は、(PxL,PyL)と(PxH,PyH)の2点を結ぶ直線を対角線とする矩形領域で、その領域内で(PTxL1,PTyL1
)と(PTxH1,PTyH1)、(PTxL2,PTyL2)と(PTxH2,PTyH2)のそれぞれの2点を結ぶ直線を対角線とする2つの矩形領域をユーザー発声領域と
定義している。従って、式(20)により発声があったと判断された音源位置のなかで、その座標ベクトルが前記ユーザ発声領域内に入っているものを選択することで、近距離に存在する音源の中でユーザー声を特定できる。
4.音源分離
発話検出された音源の位置推定結果または音波の到来方向推定結果を用いて、ユーザの音声を強調し周囲雑音を抑圧する音源分離処理について以下に説明する。ユーザ音声の発話位置または到来方向は前記発話検出処理により求められている。また、周囲雑音の音源位置または到来方向も既に推定されている。これらの推定結果と式(8)と式(27)の音源位置ベクトル、そして無指向性雑音の分散を表すσを用いて、行列V(ω)を次式のように定義する。
ここで、相関行列V(ω)には近距離音源S個と遠距離音源K個を合わせて(S+K)個の音源が含まれているから、固有値の大きい方から(S+K)の固有値と固有ベクトルを用いて、Z(ω)を次式のように定義する。
5.音声認識処理
前記音源分離処理は、指向性雑音に対しては有効であるが、無指向性雑音に対してはある程度雑音が残留してしまう。また、突発性雑音のように短時間で発生する雑音に対してもあまり雑音抑圧効果を望めない。そこで、前記音源分離処理により強調されたユーザー音声の認識に、例えば、特願2003−320183号「背景雑音歪みの補正処理方法及びそれを用いた音声認識システム」で述べられている特徴補正法を組み込んだ音声認識エンジンを用いることで、残留雑音の影響を軽減する。なお本発明は、音声認識エンジンとして特願2003−320183号に限定するものではなく、この他にも雑音に頑健な様々な手法を実装した音声認識エンジンを使用することが考えられる。
られる累積出力確率が利用可能となる。この累積出力確率から算出される重みを前述の事後確率に付与することにより、雑音の一時的に変化する非定常成分により劣化した事後確率の信頼度を改善することが出来る。
ら周囲雑音の定常的な特徴を推定するので、発話区間の開始時点がずれると認識精度が著しく劣化してしまう。一方、複数の音源が存在していても、その音源がある位置や音波の到来方向において、式(18)や式(29)で表される関数は鋭いピークを示す。従って、この情報を用いて発話区間検出を行っている本発明音声認識装置は、複数の周囲雑音が存在しても頑健に発話区間検出が行え、高い音声認識精度を保つことができる。
Claims (9)
- 複数のマイクロフォンが所定配置で設けられてなるマイクロフォンアレイと、
前記マイクロフォンアレイにより取得された音声データに基づいてユーザーの鼻口腔から発せられた音の発声位置を3次元的に特定する発声位置特定手段と、
ユーザーに対する表示を行う表示手段と、
前記表示手段を制御する表示制御手段と、を有し、
前記表示制御手段は、前記発声位置特定手段によって特定された発声位置に応じて、前記表示手段上に表示されるカーソル位置の変更を行うように制御することを有することを特徴とする情報処理装置。 - 複数のマイクロフォンが所定配置で設けられてなるマイクロフォンアレイと、
前記マイクロフォンアレイにより取得された音声データに基づいてユーザーの鼻口腔から発せられた音の継続時間を特定する継続時間特定手段と、
前記マイクロフォンアレイにより取得された音声データに基づいてユーザーの鼻口腔から発せられた音の発声位置を3次元的に特定する発声位置特定手段と、
前記継続時間特定手段によって特定された継続時間が所定時間より長いか否かを判定する継続時間判定手段と、
ユーザーに対する表示を行う表示手段と、
前記表示手段を制御する表示制御手段と、を有し、
前記表示制御手段は、前記継続時間判定手段による判定結果と、前記発声位置特定手段によって特定された発声位置とに応じて、前記表示手段における表示態様を変更するように制御することを特徴とする情報処理装置。 - 複数のマイクロフォンが所定配置で設けられてなるマイクロフォンアレイと、
前記マイクロフォンアレイにより取得された音声データに基づいてユーザーの鼻口腔から発せられた音の継続時間を特定する継続時間特定手段と、
前記マイクロフォンアレイにより取得された音声データに基づいてユーザーの鼻口腔から発せられた音の発声位置を3次元的に特定する発声位置特定手段と、
前記継続時間特定手段によって特定された継続時間が所定時間より長いか否かを判定する継続時間判定手段と、
ユーザーに対する表示を行う表示手段と、
前記表示手段を制御する表示制御手段と、を有し、
前記表示制御手段は、前記継続時間判定手段による判定結果と、前記発声位置特定手段によって特定された発声位置とに応じて、前記表示手段における拡大表示実行又は拡大表示解除の別を変更するように制御することを特徴とする情報処理装置。 - 複数のマイクロフォンが所定配置で設けられてなるマイクロフォンアレイと、
前記マイクロフォンアレイにより取得された音声データに基づいてユーザーの鼻口腔から発せられた音の継続時間を特定する継続時間特定手段と、
前記マイクロフォンアレイにより取得された音声データに基づいてユーザーの鼻口腔から発せられた音の発声位置を3次元的に特定する発声位置特定手段と、
前記継続時間特定手段によって特定された継続時間が所定時間より長いか否かを判定する継続時間判定手段と、
ユーザーに対する表示を行う表示手段と、
前記表示手段を制御する表示制御手段と、を有し、
前記表示制御手段は、前記継続時間判定手段による判定結果と、前記発声位置特定手段によって特定された発声位置とに応じて、前記表示手段における表示の拡大率を変更するように制御することを特徴とする情報処理装置。 - 複数のマイクロフォンが所定配置で設けられてなるマイクロフォンアレイと、
前記マイクロフォンアレイにより取得された音声データに基づいてユーザーの鼻口腔から発せられた音の継続時間を特定する継続時間特定手段と、
前記マイクロフォンアレイにより取得された音声データに基づいてユーザーの鼻口腔から発せられた音の発声位置を3次元的に特定する発声位置特定手段と、
前記継続時間特定手段によって特定された継続時間が所定時間より長いか否かを判定する継続時間判定手段と、
ユーザーに対する表示を行う表示手段と、
前記表示手段を制御する表示制御手段と、を有し、
前記表示制御手段は、前記継続時間判定手段による判定結果と、前記発声位置特定手段によって特定された発声位置とに応じて、前記表示手段に表示されるカーソルの移動量の変更を行うように制御することを有することを特徴とする情報処理装置。 - 前記表示制御手段は、前記表示手段における表示の拡大率の変更に伴い、前記表示手段に表示されるカーソルの移動量を変更することを特徴とする請求項3又は請求項4に記載の情報処理装置。
- 前記マイクロフォンアレイにより取得された音声データに基づいてユーザーの鼻口腔から発せられた音の音量を特定する音量特定手段、を有し、
前記表示制御手段は、前記表示手段に表示されるカーソルの移動量を、前記音量特定手段によって特定された音量又は音量の対数値に比例させるように制御することを特徴とする請求項6に記載の情報処理装置。 - 前記表示制御手段は、前記表示手段に表示されるカーソルの移動量を、前記発声位置特定手段によって特定された発声位置と所定線分との間の距離に比例させるように制御することを特徴とする請求項6に記載の情報処理装置。
- 前記表示制御手段は、前記発声位置特定手段によって特定された発声位置を前記表示手段に表示するように制御することを特徴とする請求項1乃至請求項8に記載の情報処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008132552A JP4953095B2 (ja) | 2008-05-20 | 2008-05-20 | 情報処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008132552A JP4953095B2 (ja) | 2008-05-20 | 2008-05-20 | 情報処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009282645A true JP2009282645A (ja) | 2009-12-03 |
JP4953095B2 JP4953095B2 (ja) | 2012-06-13 |
Family
ID=41453062
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008132552A Expired - Fee Related JP4953095B2 (ja) | 2008-05-20 | 2008-05-20 | 情報処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4953095B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011205258A (ja) * | 2010-03-24 | 2011-10-13 | Ntt Docomo Inc | 音連動装置、音連動システム、音連動方法および音連動処理プログラム |
JP2013122695A (ja) * | 2011-12-12 | 2013-06-20 | Honda Motor Co Ltd | 情報提示装置、情報提示方法、情報提示プログラム、及び情報伝達システム |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07191800A (ja) * | 1993-12-27 | 1995-07-28 | Yamatake Honeywell Co Ltd | 空間動作インターフェイス |
JP2003263308A (ja) * | 2002-12-27 | 2003-09-19 | Nec Infrontia Corp | 画面制御装置とその方法 |
JP2004005038A (ja) * | 2002-05-30 | 2004-01-08 | Internatl Business Mach Corp <Ibm> | コンピュータ装置、表示制御装置、ポインタの位置制御方法、プログラム |
JP2004280301A (ja) * | 2003-03-13 | 2004-10-07 | Yoshitaka Fukumoto | ポインティングデバイス |
JP2007066054A (ja) * | 2005-08-31 | 2007-03-15 | Toshiba Corp | 情報処理装置、および表示制御方法 |
JP3132986U (ja) * | 2007-04-10 | 2007-06-28 | アーベル・システムズ株式会社 | 風圧検出表示装置 |
JP2007228135A (ja) * | 2006-02-22 | 2007-09-06 | National Institute Of Advanced Industrial & Technology | 発声位置推定方法およびそれを用いた発声位置推定装置、電動車椅子 |
-
2008
- 2008-05-20 JP JP2008132552A patent/JP4953095B2/ja not_active Expired - Fee Related
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07191800A (ja) * | 1993-12-27 | 1995-07-28 | Yamatake Honeywell Co Ltd | 空間動作インターフェイス |
JP2004005038A (ja) * | 2002-05-30 | 2004-01-08 | Internatl Business Mach Corp <Ibm> | コンピュータ装置、表示制御装置、ポインタの位置制御方法、プログラム |
JP2003263308A (ja) * | 2002-12-27 | 2003-09-19 | Nec Infrontia Corp | 画面制御装置とその方法 |
JP2004280301A (ja) * | 2003-03-13 | 2004-10-07 | Yoshitaka Fukumoto | ポインティングデバイス |
JP2007066054A (ja) * | 2005-08-31 | 2007-03-15 | Toshiba Corp | 情報処理装置、および表示制御方法 |
JP2007228135A (ja) * | 2006-02-22 | 2007-09-06 | National Institute Of Advanced Industrial & Technology | 発声位置推定方法およびそれを用いた発声位置推定装置、電動車椅子 |
JP3132986U (ja) * | 2007-04-10 | 2007-06-28 | アーベル・システムズ株式会社 | 風圧検出表示装置 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011205258A (ja) * | 2010-03-24 | 2011-10-13 | Ntt Docomo Inc | 音連動装置、音連動システム、音連動方法および音連動処理プログラム |
JP2013122695A (ja) * | 2011-12-12 | 2013-06-20 | Honda Motor Co Ltd | 情報提示装置、情報提示方法、情報提示プログラム、及び情報伝達システム |
US8990078B2 (en) | 2011-12-12 | 2015-03-24 | Honda Motor Co., Ltd. | Information presentation device associated with sound source separation |
Also Published As
Publication number | Publication date |
---|---|
JP4953095B2 (ja) | 2012-06-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4982807B2 (ja) | 操作方法およびそのための操作装置、プログラム | |
US7803050B2 (en) | Tracking device with sound emitter for use in obtaining information for controlling game program execution | |
JP5572445B2 (ja) | 残響抑圧装置、及び残響抑圧方法 | |
US8073157B2 (en) | Methods and apparatus for targeted sound detection and characterization | |
CN102447697B (zh) | 开放环境中的半私人通信的方法及系统 | |
CN102197424B (zh) | 用于一致性检测的系统、方法和设备 | |
JP5724125B2 (ja) | 音源定位装置 | |
US20110014981A1 (en) | Tracking device with sound emitter for use in obtaining information for controlling game program execution | |
JP2008064892A (ja) | 音声認識方法およびそれを用いた音声認識装置 | |
JP2019008134A (ja) | 音源分離情報検出装置、ロボット、音源分離情報検出方法及びプログラム | |
WO2013154792A1 (en) | Systems, methods, and apparatus for spatially directive filtering | |
JP2013535915A (ja) | 多重マイク位置選択性処理用のシステム、方法、装置、およびコンピュータ可読媒体 | |
JP7259843B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP4953095B2 (ja) | 情報処理装置 | |
JP4682344B2 (ja) | 発声位置推定方法およびそれを用いた発声位置推定装置、電動車椅子 | |
JPWO2018037643A1 (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP4822458B2 (ja) | インターフェイス装置とインターフェイス方法 | |
JP4266370B2 (ja) | 姿勢角度検出装置を用いた電子楽器およびその制御方法 | |
JP4660740B2 (ja) | 電動車椅子搭載用音声入力装置 | |
Hu et al. | Robust speaker's location detection in a vehicle environment using GMM models | |
Sasou | Acoustic head orientation estimation applied to powered wheelchair control | |
JP4552034B2 (ja) | ヘッドセット型マイクロフォンアレイ音声入力装置 | |
TWI831513B (zh) | 適用於無吊桿的頭戴式耳機之麥克風系統及波束成形方法 | |
Hioka et al. | Improvement of DOA estimation using virtually generated multichannel data from two-channel microphone array | |
Hashimoto et al. | Development of a 3D pointing voice interface using a three-axis microphone array |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100224 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110810 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110823 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111007 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120228 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120301 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150323 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |