JP2013025757A - 入力装置、信号処理方法、プログラム、および記録媒体 - Google Patents

入力装置、信号処理方法、プログラム、および記録媒体 Download PDF

Info

Publication number
JP2013025757A
JP2013025757A JP2011163153A JP2011163153A JP2013025757A JP 2013025757 A JP2013025757 A JP 2013025757A JP 2011163153 A JP2011163153 A JP 2011163153A JP 2011163153 A JP2011163153 A JP 2011163153A JP 2013025757 A JP2013025757 A JP 2013025757A
Authority
JP
Japan
Prior art keywords
signal
frequency band
phase difference
unit
low frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2011163153A
Other languages
English (en)
Inventor
Yuki Mitsufuji
祐基 光藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2011163153A priority Critical patent/JP2013025757A/ja
Priority to US13/552,321 priority patent/US9654872B2/en
Priority to CN201210251486.7A priority patent/CN102905210B/zh
Publication of JP2013025757A publication Critical patent/JP2013025757A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2200/00Indexing scheme relating to G06F1/04 - G06F1/32
    • G06F2200/16Indexing scheme relating to G06F1/16 - G06F1/18
    • G06F2200/163Indexing scheme relating to constructional details of the computer
    • G06F2200/1636Sensing arrangement for detection of a tap gesture on the housing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/20Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
    • H04R2430/21Direction finding using differential microphone array [DMA]

Landscapes

  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

【課題】簡単な動作により所望の機器を操作することができるようにする。
【解決手段】少なくとも2つのマイクロホンは、X軸に対して互いに逆方向(図1においては、内側)を向くように筐体である眼鏡に設置される。ユーザは、例えば、音声コマンダ装置の筐体の左側から、筐体に衝撃を与える。これにより、マイクロホンを介して、音声コマンダ装置に信号が入力される。音声コマンダ装置は、入力された信号に対して信号処理を施して、コマンドを識別し、そのコマンド信号を用いて、操作対象の機器を制御する。本開示は、例えば、眼鏡を筐体とする音声コマンダ装置に適用することができる。
【選択図】図1

Description

本開示は、入力装置、信号処理方法、プログラム、および記録媒体に関し、特に、簡単な動作により所望の機器を操作することができるようにした入力装置、信号処理方法、プログラム、および記録媒体に関する。
近年、ボタンなどで構成される操作部を用いずに、マイクロホンを用いて機器の操作を行う手法が提案されている(特許文献1参照)。
特開2010−213099号公報
しかしながら、特許文献1に記載の技術は、ユーザが入力した音と、周囲の環境から意図せず入力される音とを区別する手段として、モノラル信号の波形の形状を用いている。このため、叩き方、個人の癖、周囲の環境変化、マイクロホン間の個体差、またはマイクロホンの経時変化などの影響により、操作が容易ではない。
本開示は、このような状況に鑑みてなされたものであり、機器を簡単に操作することができるものである。
本開示の一側面の入力装置は、筐体上の異なる位置に、空間軸のうちの1軸について異なる方向を向くように配置されている少なくとも2つのマイクロホンと、前記マイクロホンより入力された信号から低周波数帯域の信号を抽出する低周波数帯域抽出部と、前記低周波数帯域抽出部より抽出された前記低周波帯数域の信号を用いて位相差を算出する位相差算出部と、前記位相差算出部より算出された前記位相差に基づいて制御信号を生成する制御信号生成部とを備える。
前記制御信号生成部は、前記位相差算出部より算出された前記位相差に基づき、低域において逆位相が生じている場合、制御信号を生成することができる。
前記低周波数帯域抽出部により用いられる低域通過フィルタは、前記マイクロホン間の距離を考慮して決定される。
前記低周波数帯域抽出部により用いられる低域通過フィルタは、スピーチの周波数を考慮して決定される。
前記低周波数帯域抽出部より抽出された前記低周波帯数域の信号を用いて差分信号を生成する差分信号生成部をさらに備え、前記制御信号生成部は、前記差分信号生成部により生成された前記差分信号にも基づいて、前記制御信号を生成することができる。
前記制御信号生成部は、前記差分信号生成部により生成された前記差分信号に基づき、どのマイクロホンからの入力かを判定して、前記制御信号を生成することができる。
前記マイクロホンは、前記筐体に対して衝撃が与えられる前記1軸について互いに異なる方向を向くように配置されている。
前記筐体は、身体に装着される。
本開示の一側面の信号処理方法は、筐体上の異なる位置に、空間軸のうちの1軸について異なる方向を向くように配置されている少なくとも2つのマイクロホンを備える入力装置が、前記マイクロホンより入力された信号から低周波数帯域の信号を抽出し、抽出された前記低周波帯数域の信号を用いて位相差を算出し、算出された前記位相差に基づいて制御信号を生成する。
本開示の一側面のプログラムは、筐体上の異なる位置に、空間軸のうちの1軸について異なる方向を向くように配置されている少なくとも2つのマイクロホンを備える入力装置に、前記マイクロホンより入力された信号から低周波数帯域の信号を抽出する低周波数帯域抽出部と、前記低周波数帯域抽出部より抽出された前記低周波帯数域の信号を用いて位相差を算出する位相差算出部と、前記位相差算出部より算出された前記位相差に基づいて制御信号を生成する制御信号生成部として機能させる。
本開示の一側面の記録媒体に記録されているプログラムは、筐体上の異なる位置に、空間軸のうちの1軸について異なる方向を向くように配置された少なくとも2つのマイクロホンを備える入力装置に、前記マイクロホンより入力された信号から低周波数帯域の信号を抽出する低周波数帯域抽出部と、前記低周波数帯域抽出部より抽出された前記低周波帯数域の信号を用いて位相差を算出する位相差算出部と、前記位相差算出部より算出された前記位相差に基づいて制御信号を生成する制御信号生成部として機能させる。
本開示の一側面においては、筐体上の異なる位置に、空間軸のうちの1軸について異なる方向を向くように配置されている少なくとも2つのマイクロホンより入力された信号から低周波数帯域の信号が抽出される。そして、抽出された前記低周波帯数域の信号を用いて位相差が算出され、算出された前記位相差に基づいて制御信号が生成される。
本開示の一側面によれば、所望の機器を操作することができる。特に、簡単な動作により所望の機器を操作することができる。
本技術を適用した音声コマンダ装置の外観の構成例を示す外観図である。 音声コマンダ装置の内部の構成例を示すブロック図である。 マイクロホン間の距離と、空気伝搬音が2つのマイクロホンへ到達する距離の差を説明する図である。 マイクロホン間の相互相関値の例を示す図である。 低域通過フィルタの例を示す図である。 相互相関計算を概念的に示す図である。 音声コマンダ装置の処理を説明するフローチャートである。 信号処理を説明するフローチャートである 音声コマンダ装置の外観の他の構成例を示す外観図である。 音声コマンダ装置の外観の他の構成例を示す外観図である。 音声コマンダ装置の外観の他の構成例を示す外観図である。 コンピュータの構成例を示すブロック図である。
以下、本開示を実施するための形態(以下実施の形態とする)について説明する。
[音声コマンダ装置の外観の構成例]
図1は、本技術を適用した入力装置としての、音声コマンダ装置の外観の構成例を示す図である。
音声コマンダ装置11は、マイクロホン21−Lおよび21−Rを含むように構成される。音声コマンダ装置11の筐体は、例えば、ユーザが身に着ける、図1に示される眼鏡ので構成される。すなわち、音声コマンダ装置11は、例えば、眼鏡のフレームに内蔵されているか、眼鏡のフレームに付加されている。
図1の例においては、空間軸が設定されている。筐体正面に対して、横方向は、X軸であり、奥行き方向は、Y軸であり、縦方向は、Z軸である。なお、X軸においては、右が正方向である。Y軸においては、奥が正方向である。Z軸においては、下が正方向である。
マイクロホン21−Lは、X軸の正方向を向くように、筐体の左端に設置されている。具体的には、マイクロホン21−Lは、X軸の正方向およびZ軸の正方向を向くように、眼鏡の左側のレンズ枠の下部に設置されている。マイクロホン21−Rは、X軸の負方向を向くように、筐体の右端に設置されている。具体的には、マイクロホン21−Rは、X軸の負の方向およびZ軸の正の方向を向くように、眼鏡の右側のレンズ枠の下部に設置されている。
すなわち、マイクロホン21−Lおよび21−Rは、X軸に対して互いに逆方向(図1においては、内側)を向くように、眼鏡の異なる位置に設置されている。なお、図1の例の場合、マイクロホン21−Lおよび21−Rは、Y軸方向に対して角度をなしておらず、また、Z軸方向に対して正方向を向いているが、Y軸およびZ軸については特に限定されない。
ユーザは、音声コマンダ装置11の筐体の左側から(X軸の正方向に)、または、筐体の右側から(X軸の負方向に)、筐体に衝撃を与える。これにより、マイクロホン21−Lおよび21−Rにより、音声コマンダ装置11に信号(固体伝搬音)が入力される。すなわち、X軸方向の衝撃が信号として、音声コマンダ装置11に入力される。
音声コマンダ装置11は、入力された信号に対して信号処理を施して、コマンドを識別し、そのコマンド信号を用いて、図示せぬ操作対象の機器を制御する。すなわち、ユーザは、音声コマンダ装置11の筐体に対して、衝撃を与えることにより、操作対象の機器を制御することができる。
この衝撃は、筐体の側面からの衝撃であればよく、マイクロホン21−Lまたは21−Rに直接衝撃をあたえる必要はないが、あたえてもよい。なお、この場合の衝撃とは、軽く触れたり、軽く叩かれることで与えられる強さの衝撃、すなわち、筐体に対して振動を与えられるだけの強さの衝撃であればよい。筐体が破損するほどの強さは、想定されていない。
ここで、マイクロホン21−Lおよび21−Rに入力される音(信号)を、以下、固体伝搬音と称し、空気振動を通じて入力される音(空気伝播音)と区別する。
なお、図1の例においては、筐体の左右にそれぞれマイクロホン21−Lおよび21−Rが1本ずつ設けられている例が示されているが、左右のマイクロホンの数は、最少でも1本ずつ設けられればよく、1本ずつに限定されない。また、左右のマイクロホンの数は、左右で同じであってもよいし、同じでなくてもよい。さらに、マイクロホン21−Lおよび21−Rの配置位置は、図1の位置に限定されない。すなわち、少なくとも2本のマイクロホンが異なる位置に設置されていればよい。
また、図1の例においては、X軸について、マイクロホン21−Lおよび21−Rの配置方向や外部からの衝撃方向を説明したが、X軸に限らず、Y軸またはZ軸でもよい。すなわち、少なくとも2つのマイクロホンが空間軸のうちの1軸について異なる方向(逆方向)を向くように設置されていればよい。そして、衝撃(ユーザの操作)は、その軸に対して与えられるように構成される。
なお、上記説明においては、マイクロホンの向きとその内部の素子の向きは同じ場合を想定している。例えば、マイクロホンが同じ方向を向いていたとしても、その素子が逆方向を向いていればよい。
また、以下、マイクロホン21−Lおよびマイクロホン21−Rを個々に区別する必要がない場合、マイクロホン21と称する。
[音声コマンダ装置の内部の構成例]
図2は、音声コマンダ装置の内部の構成例を示す図である。
図2の例においては、音声コマンダ装置11は、おおまかに、コマンド生成ブロック31と機器制御ブロック32により構成される。
コマンド生成ブロック31は、例えば、ユーザの身体に装着される筐体内に設けられる。コマンド生成ブロック31は、マイクロホン21より入力される信号を処理し、操作対象の機器を操作するためのコマンド信号を生成し、生成したコマンド信号を、機器制御ブロック32に送信する。
機器制御ブロック32は、例えば、操作対象の機器の側や、操作対象の機器内部などに設けられる。機器制御ブロック32は、コマンド生成ブロック31からのコマンド信号を受信し、操作対象の機器に対して、制御情報を供給する。
コマンド生成ブロック31は、入力端子41、低周波数帯域抽出部42、マイクロホン間特徴抽出部43、コマンド識別部44、コマンド送信部45、およびアンテナ46を含むように構成される。
入力端子41は、入力音源であるマイクロホン21からの入力信号x(n,ch)を、低周波数帯域抽出部42に供給する。
低周波数帯域抽出部42は、低域通過フィルタにより、入力端子41からの入力信号の低周波数帯域、すなわち、低域通過信号を抽出し、抽出した低域通過信号を、マイクロホン間特徴抽出部43に供給する。
マイクロホン間特徴抽出部43は、低周波数帯域抽出部42からの低域通過信号から特徴量を抽出し、抽出した特徴量を、コマンド識別部44に供給する。具体的には、マイクロホン間特徴抽出部43は、相関計算部51、位相差計算部52、および差分信号生成部53を含むように構成される。
相関計算部51は、低周波数帯域抽出部42からの低域通過信号を、時間フレームに分割し、2つのマイクロホン21間のフレーム分割信号の相互相関値を計算する。相関計算部51は、計算した相互相関値を位相差計算部52に供給する。
位相差計算部52は、相関計算部51からの相互相関値から、位相差を計算する。すなわち、位相差計算部52は、相互相関値の絶対値のうち、最大値をとるインデックスを位相差情報として取得する。位相差計算部52は、低域通過信号の特徴量としての、取得した位相差とその最大値をコマンド識別部44に供給する。
差分信号生成部53は、低周波数帯域抽出部42からの低域通過信号を用いて、差分信号を生成する。差分信号生成部53は、低域通過信号の特徴量としての、得られた差分信号を、コマンド識別部44に供給する。
コマンド識別部44は、位相差計算部52からの位相差とその最大値と、差分信号生成部53からの差分信号を、低域通過信号の特徴量として入力し、2種類の閾値判定を行うことで、コマンド識別結果を得る。コマンド識別部44は、得られたコマンド識別結果であるコマンダ情報を、コマンド送信部45に供給する。
コマンド送信部45は、コマンド識別部44により識別されたコマンド情報を、コマンド信号として、アンテナ46を介して、例えば、無線通信により、機器制御ブロック32に送信する。
機器制御ブロック32は、アンテナ61、コマンド受信部62、および機器制御部63を含むように構成される。
コマンド受信部62は、コマンド送信部45から送信されたコマンド信号を、アンテナ61を介して受信し、受信したコマンド信号を、機器制御部63に供給する。
機器制御部63は、コマンド受信部62からのコマンド信号に対応する、操作対象の機器を制御するための制御情報を生成し、生成した制御情報を、操作対象の機器に対して、送信する。
なお、図2の例においては、音声コマンダ装置11をコマンド生成ブロック31と機器制御ブロック32の2つのブロックに分けて示したが、音声コマンダ装置11は、1つのブロックとして構成することも可能である。この場合、コマンド送信部45、アンテナ46、アンテナ61、およびコマンド受信部62を省略することができる。
[低周波数帯域抽出部の処理]
次に、音声コマンダ装置11の各部の詳細について説明する。まず、低周波数帯域抽出部42の処理について説明する。
低周波数帯域抽出部42は、低域通過フィルタにより入力信号の低周波数帯域を抽出する。低周波数帯域抽出部42は、入力信号x(n,ch)に低域通過フィルタを適用し、次の式(1)に示される低域通過信号l(n,ch)を得る。
Figure 2013025757
ここで、nは、信号の時間インデックス、chは、マイクロホン識別子であり、図1の例の場合、2である。また、aは、分母のフィルタ係数、bは、分子のフィルタ係数であり、Mは、分母のフィルタ次数、Mは、分子のフィルタ次数である。
フィルタ係数a、bは、2つの要素を考慮して決定される。要素の1つは、マイクロホン21間の距離である。音声コマンダ装置11は、固体伝搬音が逆位相を伴うという特徴を利用する。すなわち、低周波数帯域抽出部42は、固体伝搬音を抽出している。したがって、位相差を生み出すマイクロホン21間の距離は、性能を決定する上で重要な要素である。
図3は、マイクロホン21間の距離と、空気伝搬音がマイクロホン21−Lおよび21−Rへ到達する距離の差を表した図である。
マイクロホン21間の距離Aと、空気伝搬音がマイクロホン21−Lとおよび21−Rへ到達する距離の差Bの関係は、三平方の定理により、必ず距離A≧距離の差Bとなる。距離の差Bの部分において、空気伝搬音に逆位相が生じると、その逆位相が固体伝搬音の相関値を計算する上でノイズとなり、コマンド識別部44によるコマンド識別の性能を劣化させてしまう。
そこで、低周波数帯域抽出部42は、距離の差Bの部分において、空気伝搬音の半波長分の波が含まれないように、短い波長の成分を高域除去フィルタ(低域通過フィルタ)で低減する。
マイクロホン21間の距離Aは、筐体(図1の例では、眼鏡)の最も距離が長くなる両端に取り付けた場合で、筐体の幅を大きく見積もっても30cmであるので、距離の差Bは、必然的に30cm以内である。音の速度を340[m/s]とした場合、30cm進むために必要な時間は、0.88[ms]である。0.88[ms]に、半波長が含まれる周波数は567[Hz]以上の周波数であり、それ以上の周波数を遮断すると、外部音声から生じる逆位相を誤って特徴として抽出する影響を低減することができる。
フィルタ係数a、bを決定する要素のもう1つは、スピーチの存在である。図1の例の場合、眼鏡にマイクロホン21−Lおよび21−Rが設けられるので、マイクロホン21から、口までの距離は非常に短く、振幅が大きい信号は、固体伝搬音か、音声コマンダ装置11の装着者のスピーチである可能性が高い。
一般的に、スピーチは、50乃至1000[Hz]に基本周波数が、1k乃至4k[Hz]にフォルマントが含まれ、大きな振幅を持っている。一方、固体伝搬音は、0乃至50[Hz]付近にピークを持ち、周波数が高くなるにつれて徐々に減衰していく。
したがって、50[Hz]以下の信号を抽出することにより、スピーチの影響を除去することができる。
図4Aおよび図4Bは、マイクロホン21間の相互相関値を表した図である。図4Aは、低域通過フィルタの適用なしの場合のマイクロホン21間の相互相関値を表したグラフである。図4Bは、低周波数帯域抽出部42による低域通過フィルタの適用ありの場合のマイクロホン21間の相互相関値を表したグラフである。
縦軸は、相互相関値を表している。横軸は、サンプル数を1ずつずらしながら内積を取った値(ラグ)を表している。
どちらのグラフも、X軸の0の位置において、Y軸の相互相関値が正の値を示す場合、同位相であることを示し、Y軸の相互相関値が負の値を示す場合、逆位相であることを示す。コマンド識別部44は、この逆位相を抽出することでコマンドを識別する。
しかしながら、図4Aにおいては、スピーチ信号の影響で、逆位相であることが読み取りづらくなっている。これに対して、図4Bの場合、低域通過フィルタによりスピーチの影響が除去されているので、固体伝搬音が逆位相を持っていることが読み取りやすくなっている。
以上のように、低周波数帯域抽出部42においては、2つの要素を考慮された低域通過フィルタが使用される。これにより、567[Hz]以上のマイクロホン21間の逆位相を伴う外部音声が入力される影響と、50[Hz]以上のスピーチのマイクロホン21間の同位相信号が入力される影響を同時に除去することができる。
なお、図1の例の場合、筐体が眼鏡であるので、スピーチの影響が考えられるが、スピーチの影響がない筐体の場合には、少なくとも1つの要素(マイクロホン間の距離)さえ考慮されていればよい。
例えば、低周波数帯域抽出部42においては、図5に示されるような、50[Hz]以上を遮断するような低域通過フィルタが用いられ、低域通過信号l(n,ch)が抽出される。低周波数帯域抽出部42は、抽出した低域通過信号l(n,ch)を、相関計算部51および差分信号生成部53に供給する。
[相関計算部の処理]
次に、相関計算部51の処理について説明する。
相関計算部51は、低周波数帯域抽出部42により供給された低域通過信号(n,ch)を、時間フレームに分割し、マイクロホン21間のフレーム分割信号の相関値を計算する。例えば、相関計算部51は、相互相関を使用し、次の式(2)に示される相互相関値R(fr,i)を求める。
Figure 2013025757
ここで、Rは、相互相関値であり、sは、フレーム毎の時間インデックスである。fr=0,…,FR-1であり、FRは、総フレーム数である。i=-(Fsize-1),…, Fsize-1であり、Fsizeは、1フレームに含まれる総サンプル数である。
なお、本実施例においては、サンプリング周波数にかかわらず、Fsizeを20[ms]相当のサンプル数とし、フレームの前進数を10[ms]相当のサンプル数としたが、それ以外の値を用いてもよい。
図6は、相関計算部51における相互相関計算を概念的に示した図である。なお、図6に示される低域通過信号l(n,ch)およびl(n,ch+1)は、信号を概念的に示めしたものである。したがって、信号に高周波がのっているように見えるが、実際には、低域通過信号l(n,ch)およびl(n,ch+1)は、低域通過フィルタがかけられているので、高周波はのっていない。
チャンネルchの低域通過信号l(n,ch)からfrフレームが分割され、チャンネルch+1の低域通過信号l(n,ch+1)からfrフレームが分割されて、相互相関計算が行われる。次に、チャンネルchの低域通過信号l(n,ch)からfr+1フレームが分割され、チャンネルch+1の低域通過信号l(n,ch+1)からfr+1フレームが分割されて、相互相関計算が行われる。
チャンネルchの低域通過信号l(n,ch)からfr+2フレームが分割され、チャンネルch+1の低域通過信号l(n,ch+1)からfr+2フレームが分割されて、相互相関計算が行われる。次に、チャンネルchの低域通過信号l(n,ch)からfr+3フレームが分割され、チャンネルch+1の低域通過信号l(n,ch+1)からfr+3フレームが分割されて、相互相関計算が行われる。
以上のようにして計算された相互相関値R(fr,i)は、位相差計算部52に供給される。
[位相差計算部の処理]
次に、位相差計算部52の処理について説明する。
位相差計算部52は、相関計算部51から供給された相互相関値R(fr,i)から、位相差を計算する。具体的には、位相差計算部52は、次の式(3)に示されるように、相互相関値R(fr,i)の絶対値を計算して、計算された絶対値のうち、最大値をとるインデックスimax(fr)を位相差情報として、取得する。
Figure 2013025757
なお、式(3)においては、位相差imax(fr)をスカラー値として求めているが、FFTなどを用いて、周波数毎に分割した信号から、ベクトル値として位相差imax(fr,f)を取得するようにしてもよい。このfは、周波数インデックスを表している。
位相差計算部52は、取得した位相差imax(fr)と、その最大値R(fr,imax(fr))を、コマンド識別部44に供給する。
[差分信号生成部の処理]
次に、差分信号生成部53の処理について説明する。
差分信号生成部53は、次の式(4)に示されるように、低周波数帯域抽出部42からの低域通過信号l(n,ch)を用いて、差分信号lsub(n)を生成する。
Figure 2013025757
例えば、30cmという距離および眼鏡の素材の場合、d=0に設定される。すなわち、dは、左右のマイクロホンへの伝達速度の差であり、マイクロホン間の距離や筐体の素材に依存し、統計処理による事前実験において予め決めることができる値である。30cmという距離、および眼鏡の素材においては、d=0となったが、例えば、100m離れている場合には伝達に時間がかかるため、|d|>0となる。
差分信号生成部53は、生成した差分信号lsub(n)をコマンド識別部44に供給する。
[コマンド識別部の処理]
次に、コマンド識別部44の処理について説明する。
コマンド識別部44は、識別器を有している。コマンド識別部44は、位相差計算部52からの位相差imax(fr)およびその最大値R(fr,imax(fr))と、差分信号生成部53からの差分信号lsub(n)を特徴量として、識別器へ入力し、コマンド識別結果を得る。
具体的には、コマンド識別部44は、閾値処理を行い、コマンダ情報Dを得る。コマンダ情報Dは、0:コマンドなし、1:マイクロホン21−L側からの入力コマンド、2:マイクロホン21−R側からの入力コマンドの3種類からなる。
閾値処理は、2段階で構成されており、コマンド識別部44は、第1に、コマンドの正負判定情報D1(fr)(=0or1)を出力し、第2に、マイクロホン21の左右判定情報D2(fr)(=1or2)を出力する。そして、コマンド識別部44は、最後に、コマンドの正負判定情報D1(fr)と、マイクロホン21の左右判定情報D2(fr)から、コマンダ情報D(fr)を取得する。
第1の閾値処理は、次の式(5)および式(6)で表わされる。
Figure 2013025757
Figure 2013025757
ただし、thre1は、0以上の値である。本実施例においては、信号振幅を半開区間(-1,1)とし、20[ms]の相互相関を計算した場合、thre1=1.0に設定されている。Pは、前後のフレーム数を表し、前50[ms]、後50[ms]に相当する。
また、本実施例においては、10[ms]でフレーム前進しているため、P=5に設定している。さらに、本実施例においては、u=v=0に設定されている。つまり、位相差0以外は、許容しないとしているが、筐体の素材や入力方法によって0以外の値にしてもよい。
このように、第1の閾値処理としては、位相差の値が0であり、かつ、-thre1以下の値であるかどうかが判定される。すなわち、強い逆位相が低域でおきていれば、コマンドがあると判定される。固体伝搬音は、完全な逆位相であり、1サンプルのずれも許容しないという仮定を基にした処理である。
理論上、マイクロホン21−Lに入力された固体伝搬音がマイク21−Rまでに到達する過程において、1/サンプリング周波数以上の時間がかからなければ、ずれが生じることはなく、完全な逆位相が生じる。実際、様々な叩き方で固体伝搬音の入力を行ってみたが、統計的にサンプルのずれは生じず、位相差0で最小値になった。
すなわち、図4の例の場合は、ずれが生じることがない例であり、マイクロホン21間の信号に時間的な差があれば、観察すべきX軸の位置は、0の位置から、数サンプル(例えば、−1サンプルや1サンプル)ずれた位置となる。
次に、コマンド識別部44は、フレーム毎に得られた正負判定情報D1_f(fr)の前後フレームの結果を反映し、最終的なコマンドの正負判定情報D1(fr)とする。固体伝搬音は、立ち上がりから100[ms]までに優位な振幅成分が含まれている。このため、コマンド識別部44は、フレーム分割して得られたコマンドの正負判定情報D1_f(fr)が100[ms](例えば、2*P=10フレーム分)の時間の中で、一定数を占める場合のみコマンドとし、一定数を占めない場合は、ノイズとして取り除く。なお、例えば、thre2は、0.5に設定される。
マイクロホン21の左右判定情報D2(fr)を決定する第2の閾値処理は、次の式(7)および式(8)で表わされる。
Figure 2013025757
Figure 2013025757
コマンド識別部44は、第2の閾値処理として、得られたコマンドの正負判定情報D1(fr)と、差分信号生成部53からの差分信号lsub(n)を用いて、マイクロホン21の左右判定情報D2(fr)を計算する。
コマンド識別部44は、コマンドの正負判定情報D1(fr)が正と判定された前後Pフレームのうち、差分信号のピークが正の場合は、マイクロホン21−Lからの入力、負の場合は、マイクロホン21−Rからの入力として判定する。
以上のようにして得られたコマンドの正負判定情報D1(fr)と、左右判定情報D2(fr)を用いて、コマンド識別部44は、次の式(9)に示されるように、コマンダ情報D(fr)を計算する。そして、このコマンダ情報D(fr)は、コマンド送信部45に供給される。
Figure 2013025757
[音声コマンダ装置の処理]
次に、図7のフローチャートを参照して、音声コマンダ装置11の機器制御処理の流れを説明する。
図1に示される音声コマンダ装置11である眼鏡を装着したユーザは、例えば、テレビジョン装置の音量を下げるために、眼鏡の左側から、X軸の正方向に対して、眼鏡を軽く叩く。
ステップS11において、マイクロホン21−Lとマイクロホン21−Rは、X軸の正方向に対して与えられた衝撃に対応する信号を、それぞれ入力する。マイクロホン21−Lとマイクロホン21−Rからの入力信号がそれぞれ、入力端子41を介して、低周波数帯域抽出部42に入力される。
ステップS12において、低周波数帯域抽出部42、マイクロホン間特徴抽出部43、およびコマンド識別部44は、入力端子41からの入力信号に対して信号処理を行う。この信号処理の詳細は、図8を参照して後述される。
ステップS12により、入力信号に対して信号処理が行われ、コマンドが識別されてた結果であるコマンダ情報が、コマンド送信部45に供給される。
ステップS13において、コマンド送信部45およびコマンド受信部62は、コマンド信号を送受信する。
すなわち、コマンド送信部45は、コマンド識別部44により識別されたコマンド情報を、コマンド信号として、アンテナ46を介して、例えば、無線通信により、コマンド受信部62に送信する。コマンド受信部62は、コマンド送信部45から送信されたコマンド信号を、アンテナ61を介して受信し、受信したコマンド信号を、機器制御部63に供給する。
ステップS14において、機器制御部63は、コマンド受信部62からのコマンド信号に対応する、操作対象の機器を制御するための制御情報を生成し、生成した制御情報を、操作対象の機器に対して送信する。
例えば、機器制御部63には、コマンド信号に対応する制御情報のデータベースが登録されている。機器制御部63は、そのデータベースを参照して、コマンド受信部62からのコマンド信号に対応する、操作対象の機器を制御するための制御情報(例えば、音量を下げる制御情報)を生成し、操作対象の機器であるテレビジョン装置に対して、送信する。
この制御情報に対応して、テレビジョン装置は、音量を下げる処理を行う。
以上のようにして、ユーザは、眼鏡である筐体を側面から所定の数叩くだけの容易な動作で、所望の機器を操作することができる。
すなわち、従来の特許文献1に記載の技術は、ユーザが入力した音と、周囲の環境から意図せず入力される音とを区別する手段として、モノラル信号の波形の形状を用いている。したがって、叩き方、個人の癖、周囲の環境変化、マイクロホン間の個体差、およびマイクロホンの経年変化などにより、操作が容易ではなかった。
これに対して、音声コマンダ装置11の場合、マイクロホン間の位相差を用いており、波形の形状には依存されない。したがって、叩く位置や叩き方、経年変化、手袋を装着しているかしていないかなどに影響されず、単に、眼鏡である筐体を側面から叩くだけの動作で、所望の機器を操作することができる。
具体的には、筐体の特定部分を叩かなくてもよく、1つの軸(図1の例の場合X軸)について、筐体に設置されたマイクロホン21の向きとは、逆方向側から叩くだけの動作で、所望の機器を操作することができる。
また、従来の特許文献1に記載の技術を実現するには、マイクロホン近辺をたたく必要があり、人が快適にたたくために最適なマイクロホンの配置が求められ、そのため、音響上最適な場所にマイクロホンを配置することが困難であった。
これに対して、音声コマンダ装置11においては、マイクロホンを直接叩かなくてもよいので、マイクロホン配置の自由度は高い。また、マイクロホンを直接叩かないから劣化もなく、経年変化しても周波数特性が変わっても精度に影響はない。
さらに、多くのステレオマイクロホンを搭載する機器においては、ステレオ感を出すという目的から、複数のマイクロホンを、互いに逆向きに設置しているので、それを利用することが可能である。
[音声コマンダ装置の信号処理]
次に、図8のフローチャートを参照して、図7のステップS12の信号処理の流れを説明する。
図7のステップS11において、マイクロホン21−Lとマイクロホン21−Rからの入力信号がそれぞれ、入力端子41を介して、低周波数帯域抽出部42に入力される。
ステップS21において、低周波数帯域抽出部42は、例えば、図5を参照して上述した低域通過フィルタにより、入力端子41からの入力信号の低周波数帯域、すなわち、低域通過信号を抽出する。低周波数帯域抽出部42は、抽出した低域通過信号を、マイクロホン間特徴抽出部43に供給する。
これにより、図3および図4を参照して上述したように、567[Hz]以上のマイクロホン21間の逆位相を伴う外部音声が入力される影響と、50[Hz]以上のスピーチのマイクロホン21間の同位相信号が入力される影響を同時に除去することができる。
この結果、以降の処理の精度を向上させることができる。特に、コマンド識別部44によるコマンド識別の性能を向上させることができる。
ステップS22において、相関計算部51は、低周波数帯域抽出部42からの低域通過信号を、時間フレームに分割し、2つのマイクロホン21間のフレーム分割信号の相互相関値を計算する。相関計算部51は、計算した相互相関値を位相差計算部52に供給する。
ステップS23において、位相差計算部52は、相関計算部51からの相互相関値から、位相差を計算する。すなわち、位相差計算部52は、相互相関値の絶対値のうち、最大値をとるインデックスを位相差情報として取得する。位相差計算部52は、取得した位相差とその最大値をコマンド識別部44に供給する。
コマンド識別部44においては、この位相差と最大値が用いられて、上述した式(5)および式(6)により、その信号内にコマンドがあるか否かが識別される。
ステップS24において、差分信号生成部53は、低周波数帯域抽出部42からの低域通過信号を用いて、差分信号を生成する。差分信号生成部53は、得られた差分信号を、コマンド識別部44に供給する。
コマンド識別部44においては、この差分信号が用いられて、上述した式(7)および式(8)により、その信号内にコマンドがあった場合に、マイクロホン21−Lからの入力であるか、マイクロホン21−Rからの入力であるかが識別される。
ステップS25において、コマンド識別部44は、位相差計算部52からの位相差とその最大値と、差分信号生成部53からの差分信号を特徴量として、コマンドを識別し、コマンド識別結果を得る。コマンド識別部44は、得られたコマンド識別結果であるコマンダ情報を、コマンド送信部45に供給する。
具体的には、コマンド識別部44は、第1の閾値処理として、位相差計算部52からの位相差とその最大値を用いて、上述した式(5)および式(6)により、その信号内にコマンドがあるか否かを識別する。これにより、コマンドの正負判定情報D1(fr)が計算される。
すなわち、固体伝搬音が逆位相を伴うことを特徴として、それを利用して、コマンドを識別することができる。
コマンド識別部44は、第2の閾値処理として、差分信号を用いて、上述した式(7)および式(8)により、その信号内にコマンドがあった場合に、マイクロホン21−Lからの入力であるか、マイクロホン21−Rからの入力であるかを識別する。これにより、マイクロホン21の左右判定情報D2(fr)が計算される。
これにより、左右のどちらからの入力であるかを判別することができるので、操作対象の操作の数を増やすことができる。
そして、コマンド識別部44は、コマンドの正負判定情報D1(fr)と、左右判定情報D2(fr)を用いて、上述した式(9)により、コマンダ情報D(fr)を計算し、得られたコマンダ情報D(fr)を、コマンド送信部45に供給する。
ステップS25の後、処理は、図7のステップS12に戻る。
以上のようにすることで、コマンド識別を精度よく行うことできるので、1つの軸(図1の例の場合、X軸)について、筐体に設置されたマイクロホン21の向きとは、逆方向側から叩くだけという簡単な動作で、所望の機器を操作することができる。
なお、図1の例においては、音声コマンダ装置11の筐体が、ユーザが装着可能な眼鏡の例を示したが、音声コマンダ装置11の筐体は、眼鏡に限定されない。例えば、ヘッドマウントディスプレイなどでもよいし、また、他の音声コマンダ装置11の外観の他の構成例について、以下に説明する。
[音声コマンダ装置の外観の他の構成例]
図9は、本技術を適用した音声コマンダ装置の他の外観の構成例を示す図である。
図9に示される音声コマンダ装置71は、例えば、タブレット型のパーソナルコンピュータに内蔵されているか、付加されている。すなわち、音声コマンダ装置71の筐体は、例えば、タブレット型のパーソナルコンピュータで構成されている。この筐体の大きさは、ユーザの手よりも大きい例が示されているが、持ち運べるサイズであれば、どのサイズでもよい。筐体の大きさは、例えば、手のひらサイズであってもよい。
音声コマンダ装置71は、マイクロホン81−Lおよび81−R、並びにLCD82を含むように構成される。なお、図9の例において、横方向はX軸であり、右が正方向である。
マイクロホン81−Lは、X軸の負方向を向くように、筐体の左端に設置されている。具体的には、マイクロホン81−Lは、筐体の正面に設けられたLCD82の左枠の中央部に設置されている。マイクロホン81−Rは、X軸の正方向を向くように、筐体の右端に設置されている。具体的には、マイクロホン81−Rは、筐体の正面に設けられたLCD82の右枠の中央部に設置されている。
すなわち、マイクロホン81−Lおよび81−Rは、X軸に対して互いに逆方向(図9においては、外側)を向くように設置される。
ユーザは、音声コマンダ装置71の筐体の左側から(X軸の正方向に)、または、筐体の右側から(X軸の負方向に)、筐体に衝撃を与える。これにより、マイクロホン81−Lおよび81−Rにより、音声コマンダ装置71に信号が入力される。すなわち、X軸方向の衝撃が信号として、音声コマンダ装置71に入力される。
音声コマンダ装置71は、入力された信号に対して信号処理を施して、コマンドを識別し、そのコマンド信号を用いて、図示せぬ操作対象の機器を制御する。すなわち、ユーザは、音声コマンダ装置71の筐体に対して、衝撃を与えることにより、操作対象の機器を制御することができる。
なお、図9に示される音声コマンダ装置71は、図1の音声コマンダ装置11と基本的に同様に構成される。すなわち、図9に示される音声コマンダ装置71は、図2を参照して上述した構成であり、図7および図8を参照して上述した動作を行う。したがって、音声コマンダ装置71の構成と動作の説明は繰り返しになるので省略する。
[音声コマンダ装置の外観の他の構成例]
図10は、本技術を適用した音声コマンダ装置の他の外観の構成例を示す図である。
図10に示される音声コマンダ装置101は、例えば、ICレコーダに内蔵されているか、付加されている。すなわち、音声コマンダ装置101の筐体は、例えば、ICレコーダで構成されている。
音声コマンダ装置101は、マイクロホン111−Lおよび111−R、並びにLCD112を含むように構成される。なお、図10の例において、横方向はX軸であり、右が正方向である。
筐体の正面、上側には、操作用のLCD112が備えられている。マイクロホン111−Lは、X軸の負方向を向くように、筐体の上部左側に設置されている。マイクロホン111−Rは、X軸の正方向を向くように、筐体の上部右側に設置されている。
すなわち、マイクロホン111−Lおよび111−Rは、X軸に対して互いに逆方向(図10においては、外側)を向くように設置される。
ユーザは、音声コマンダ装置101の筐体の左側から(X軸の正方向に)、または、筐体の右側から(X軸の負方向に)、筐体に衝撃を与える。これにより、マイクロホン111−Lおよび111−Rにより、音声コマンダ装置101に信号が入力される。すなわち、X軸方向の衝撃が信号として、音声コマンダ装置101に入力される。
音声コマンダ装置101は、入力された信号に対して信号処理を施して、コマンドを識別し、そのコマンド信号を用いて、図示せぬ操作対象の機器を制御する。すなわち、ユーザは、音声コマンダ装置101の筐体に対して、衝撃を与えることにより、操作対象の機器を制御することができる。
なお、図10に示される音声コマンダ装置101は、図1の音声コマンダ装置11と基本的に同様に構成される。すなわち、図10に示される音声コマンダ装置101は、図2を参照して上述した構成であり、図7および図8を参照して上述した動作を行う。したがって、音声コマンダ装置101の構成と動作の説明は繰り返しになるので省略する。
[音声コマンダ装置の外観の他の構成例]
図11は、本技術を適用した音声コマンダ装置の他の外観の構成例を示す図である。
図11に示される音声コマンダ装置151は、例えば、持ち運び可能なカメラに内蔵されているか、付加されている。すなわち、音声コマンダ装置151の筐体は、例えば、カメラで構成されている。
音声コマンダ装置151は、マイクロホン161−Lおよび161−R、レンズなどで構成される撮像部162、並びにLCD163を含むように構成される。なお、図11に示される方向がX軸であり、右が正方向である。
筐体の正面、上側には、撮像部162が備えられており、筐体の右側面には、LCD163が備えられている。マイクロホン161−Lは、X軸の負方向を向くように、筐体における下部左側に設置されている。マイクロホン161−Rは、X軸の正方向を向くように、筐体における下部右側に設置されている。
すなわち、マイクロホン161−Lおよび161−Rは、X軸に対して互いに逆方向(図11においては、外側)を向くように設置される。
ユーザは、音声コマンダ装置151の筐体の左側から(X軸の正方向に)、または、筐体の右側から(X軸の負方向に)、筐体に衝撃を与える。これにより、マイクロホン161−Lおよび161−Rにより、音声コマンダ装置151に信号が入力される。すなわち、X軸方向の衝撃が信号として、音声コマンダ装置151に入力される。
音声コマンダ装置151は、入力された信号に対して信号処理を施して、コマンドを識別し、そのコマンド信号を用いて、図示せぬ操作対象の機器を制御する。すなわち、ユーザは、音声コマンダ装置151の筐体に対して、衝撃を与えることにより、操作対象の機器を制御することができる。
なお、図11に示される音声コマンダ装置151は、図1の音声コマンダ装置11と基本的に同様に構成される。すなわち、図11に示される音声コマンダ装置151は、図2を参照して上述した構成であり、図7および図8を参照して上述した動作を行う。したがって、音声コマンダ装置151の構成と動作の説明は繰り返しになるので省略する。
以上のように、音声コマンダ装置の筐体は、ユーザが装着可能なもの、ユーザが身につけることが可能なもの、あるいは、持ち運びが可能なものであることが望ましいが、その大きさが大きすぎなければ、それ以外のものであってもよい。
すなわち、備えられる少なくとも2本のマイクロホン間の距離Aが、図3を参照して上述した距離の差Bに、用いる低域通過フィルタを通過した低域の半波長が含まれない距離であれば、どのような装置であってもよい。
上述した一連の処理は、ハードウェアにより実行することもできるし、ソフトウェアにより実行することもできる。一連の処理をソフトウェアにより実行する場合には、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ、又は、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のコンピュータなどに、プログラム記録媒体からインストールされる。
[コンピュータの構成例]
図12は、上述した一連の処理をプログラムにより実行するコンピュータのハードウェアの構成例を示している。
CPU(Central Processing Unit)201は、ROM(Read Only Memory)202、又は記憶部208に記憶されているプログラムに従って各種の処理を実行する。RAM(Random Access Memory)203には、CPU201が実行するプログラムやデータ等が適宜記憶される。これらのCPU201、ROM202、及びRAM203は、バス204により相互に接続されている。
CPU201にはまた、バス204を介して入出力インタフェース205が接続されている。入出力インタフェース205には、キーボード、マウス、マイクロホン等よりなる入力部206、ディスプレイ、スピーカ等よりなる出力部207が接続されている。CPU201は、入力部206から入力される指令に対応して各種の処理を実行する。そして、CPU201は、処理の結果を出力部207に出力する。
入出力インタフェース205に接続されている記憶部208は、例えばハードディスクからなり、CPU201が実行するプログラムや各種のデータを記憶する。通信部209は、インターネットやローカルエリアネットワーク等のネットワークを介して外部の装置と通信する。
また、通信部209を介してプログラムを取得し、記憶部208に記憶してもよい。
入出力インタフェース205に接続されているドライブ210は、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリ等のリムーバブルメディア211が装着されたとき、それらを駆動し、そこに記録されているプログラムやデータ等を取得する。取得されたプログラムやデータは、必要に応じて記憶部208に転送され、記憶される。
コンピュータにインストールされ、コンピュータによって実行可能な状態とされるプログラムを記録(記憶)する記録媒体は、図12に示すように、磁気ディスク(フレキシブルディスクを含む)、光ディスク(CD-ROM(Compact Disc-Read Only Memory),DVD(Digital Versatile Disc)を含む)、光磁気ディスク(MD(Mini-Disc)を含む)、もしくは半導体メモリ等よりなるパッケージメディアであるリムーバブルメディア211、又は、プログラムが一時的もしくは永続的に格納されるROM202や、記憶部208を構成するハードディスク等により構成される。記録媒体へのプログラムの記録は、必要に応じてルータ、モデム等のインタフェースである通信部209を介して、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線又は無線の通信媒体を利用して行われる。
なお、本明細書において、上述した一連の処理を記述するステップは、記載された順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。
また、本開示における実施の形態は、上述した実施の形態に限定されるものではなく、本開示の要旨を逸脱しない範囲において種々の変更が可能である。
以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、開示はかかる例に限定されない。本開示の属する技術の分野における通常の知識を有するであれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例また修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。
なお、本技術は以下のような構成も取ることができる。
(1) 筐体上の異なる位置に、空間軸のうちの1軸について異なる方向を向くように配置されている少なくとも2つのマイクロホンと、
前記マイクロホンより入力された信号から低周波数帯域の信号を抽出する低周波数帯域抽出部と、
前記低周波数帯域抽出部より抽出された前記低周波帯数域の信号を用いて位相差を算出する位相差算出部と、
前記位相差算出部より算出された前記位相差に基づいて制御信号を生成する制御信号生成部と
を備える入力装置。
(2) 前記制御信号生成部は、前記位相差算出部より算出された前記位相差に基づき、低域において逆位相が生じている場合、制御信号を生成する
前記(1)に記載の入力装置。
(3) 前記低周波数帯域抽出部により用いられる低域通過フィルタは、前記マイクロホン間の距離を考慮して決定される
前記(1)または(2)に記載の入力装置。
(4) 前記低周波数帯域抽出部により用いられる低域通過フィルタは、スピーチの周波数を考慮して決定される
前記(1)または(2)に記載の入力装置。
(5) 前記低周波数帯域抽出部より抽出された前記低周波帯数域の信号を用いて差分信号を生成する差分信号生成部を
さらに備え、
前記制御信号生成部は、前記差分信号生成部により生成された前記差分信号にも基づいて、前記制御信号を生成する
前記(1)乃至(4)のいずれかに記載の入力装置。
(6) 前記制御信号生成部は、前記差分信号生成部により生成された前記差分信号に基づき、どのマイクロホンからの入力かを判定して、前記制御信号を生成する
前記(5)に記載の入力装置。
(7) 前記マイクロホンは、前記筐体に対して衝撃が与えられる前記1軸について異なる方向を向くように配置されている
前記(1)乃至(6)のいずれかに記載の入力装置。
(8) 前記筐体は、身体に装着される
前記(1)乃至(7)のいずれかに記載の入力装置。
(9) 筐体上の異なる位置に、空間軸のうちの1軸について異なる方向を向くように配置されている少なくとも2つのマイクロホンを備える入力装置が、
前記マイクロホンより入力された信号から低周波数帯域の信号を抽出し、
抽出された前記低周波帯数域の信号を用いて位相差を算出し、
算出された前記位相差に基づいて制御信号を生成する
信号処理方法。
(10) 筐体上の異なる位置に、空間軸のうちの1軸について異なる方向を向くように配置されている少なくとも2つのマイクロホンを備える入力装置に、
前記マイクロホンより入力された信号から低周波数帯域の信号を抽出する低周波数帯域抽出部と、
前記低周波数帯域抽出部より抽出された前記低周波帯数域の信号を用いて位相差を算出する位相差算出部と、
前記位相差算出部より算出された前記位相差に基づいて制御信号を生成する制御信号生成部と
して機能させるプログラム。
(11) 前記(10)に記載のプログラムが記録されている記録媒体。
1 音声コマンダ装置, 21,21−L,21−R マイクロホン, 31 コマンド生成ブロック, 32 機器制御ブロック, 42 低周波数帯域抽出部, 43 マイクロホン間特徴抽出部, 44 コマンド識別部, 45 コマンド送信部, 51 相関計算部, 52 位相差計算部, 53 差分信号生成部, 62 コマンド受信部, 63 機器制御部, 71 音声コマンダ装置, 81−L,81−R マイクロホン, 101 音声コマンダ装置, 111−L,111−R マイクロホン

Claims (11)

  1. 筐体上の異なる位置に、空間軸のうちの1軸について異なる方向を向くように配置されている少なくとも2つのマイクロホンと、
    前記マイクロホンより入力された信号から低周波数帯域の信号を抽出する低周波数帯域抽出部と、
    前記低周波数帯域抽出部より抽出された前記低周波帯数域の信号を用いて位相差を算出する位相差算出部と、
    前記位相差算出部より算出された前記位相差に基づいて制御信号を生成する制御信号生成部と
    を備える入力装置。
  2. 前記制御信号生成部は、前記位相差算出部より算出された前記位相差に基づき、低域において逆位相が生じている場合、制御信号を生成する
    請求項1に記載の入力装置。
  3. 前記低周波数帯域抽出部により用いられる低域通過フィルタは、前記マイクロホン間の距離を考慮して決定される
    請求項1に記載の入力装置。
  4. 前記低周波数帯域抽出部により用いられる低域通過フィルタは、スピーチの周波数を考慮して決定される
    請求項1に記載の入力装置。
  5. 前記低周波数帯域抽出部より抽出された前記低周波帯数域の信号を用いて差分信号を生成する差分信号生成部を
    さらに備え、
    前記制御信号生成部は、前記差分信号生成部により生成された前記差分信号に基づいて、前記制御信号を生成する
    請求項1に記載の入力装置。
  6. 前記制御信号生成部は、前記差分信号生成部により生成された前記差分信号に基づき、どのマイクロホンからの入力かを判定して、前記制御信号を生成する
    請求項5に記載の入力装置。
  7. 前記マイクロホンは、前記筐体に対して衝撃が与えられる前記1軸について異なる方向を向くように配置されている
    請求項1に記載の入力装置。
  8. 前記筐体は、身体に装着される
    請求項1に記載の入力装置。
  9. 筐体上の異なる位置に、空間軸のうちの1軸について異なる方向を向くように配置されている少なくとも2つのマイクロホンを備える入力装置が、
    前記マイクロホンより入力された信号から低周波数帯域の信号を抽出し、
    抽出された前記低周波帯数域の信号を用いて位相差を算出し、
    算出された前記位相差に基づいて制御信号を生成する
    信号処理方法。
  10. 筐体上の異なる位置に、空間軸のうちの1軸について異なる方向を向くように配置されている少なくとも2つのマイクロホンを備える入力装置に、
    前記マイクロホンより入力された信号から低周波数帯域の信号を抽出する低周波数帯域抽出部と、
    前記低周波数帯域抽出部より抽出された前記低周波帯数域の信号を用いて位相差を算出する位相差算出部と、
    前記位相差算出部より算出された前記位相差に基づいて制御信号を生成する制御信号生成部と
    して機能させるプログラム。
  11. 請求項10に記載のプログラムが記録されている記録媒体。
JP2011163153A 2011-07-26 2011-07-26 入力装置、信号処理方法、プログラム、および記録媒体 Withdrawn JP2013025757A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2011163153A JP2013025757A (ja) 2011-07-26 2011-07-26 入力装置、信号処理方法、プログラム、および記録媒体
US13/552,321 US9654872B2 (en) 2011-07-26 2012-07-18 Input device, signal processing method, program, and recording medium
CN201210251486.7A CN102905210B (zh) 2011-07-26 2012-07-19 输入设备和信号处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011163153A JP2013025757A (ja) 2011-07-26 2011-07-26 入力装置、信号処理方法、プログラム、および記録媒体

Publications (1)

Publication Number Publication Date
JP2013025757A true JP2013025757A (ja) 2013-02-04

Family

ID=47577211

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011163153A Withdrawn JP2013025757A (ja) 2011-07-26 2011-07-26 入力装置、信号処理方法、プログラム、および記録媒体

Country Status (3)

Country Link
US (1) US9654872B2 (ja)
JP (1) JP2013025757A (ja)
CN (1) CN102905210B (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102179056B1 (ko) * 2013-07-19 2020-11-16 엘지전자 주식회사 이동 단말기 및 그것의 제어방법
US9271064B2 (en) * 2013-11-13 2016-02-23 Personics Holdings, Llc Method and system for contact sensing using coherence analysis
EP2945398B1 (en) * 2014-05-15 2017-10-11 Nxp B.V. Motion sensor
CN111163411B (zh) * 2018-11-08 2022-11-18 达发科技股份有限公司 减少干扰音影响的方法及声音播放装置
CN111781536B (zh) * 2020-08-04 2023-03-28 蚌埠依爱消防电子有限责任公司 一种监测单相交流系统对地绝缘电阻及泄漏电容的方法
CN112153547A (zh) * 2020-09-03 2020-12-29 海尔优家智能科技(北京)有限公司 音频信号的校正方法、装置、存储介质及电子装置

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006075275A1 (en) * 2005-01-12 2006-07-20 Koninklijke Philips Electronics N.V. Audio entertainment system, method, computer program product
KR100677613B1 (ko) * 2005-09-09 2007-02-02 삼성전자주식회사 멀티미디어 기기의 동작을 제어하는 방법 및 그 장치
JP5401760B2 (ja) * 2007-02-05 2014-01-29 ソニー株式会社 ヘッドフォン装置、音声再生システム、音声再生方法
DK2088802T3 (da) * 2008-02-07 2013-10-14 Oticon As Fremgangsmåde til estimering af lydsignalers vægtningsfunktion i et høreapparat
US8184816B2 (en) * 2008-03-18 2012-05-22 Qualcomm Incorporated Systems and methods for detecting wind noise using multiple audio sources
JP5166117B2 (ja) * 2008-05-20 2013-03-21 株式会社船井電機新応用技術研究所 音声入力装置及びその製造方法、並びに、情報処理システム
JP2010213099A (ja) 2009-03-11 2010-09-24 Sony Ericsson Mobile Communications Ab 音声信号処理装置及び音声信号処理方法
CN102422652B (zh) * 2009-04-28 2014-07-02 松下电器产业株式会社 助听装置和助听方法
JP5493611B2 (ja) * 2009-09-09 2014-05-14 ソニー株式会社 情報処理装置、情報処理方法およびプログラム
JP5716287B2 (ja) * 2010-04-07 2015-05-13 ソニー株式会社 音声信号処理装置、音声信号処理方法、プログラム

Also Published As

Publication number Publication date
CN102905210B (zh) 2017-04-26
US20130028439A1 (en) 2013-01-31
US9654872B2 (en) 2017-05-16
CN102905210A (zh) 2013-01-30

Similar Documents

Publication Publication Date Title
US11122359B2 (en) Acoustic output apparatus and method thereof
JP2013025757A (ja) 入力装置、信号処理方法、プログラム、および記録媒体
JP5493611B2 (ja) 情報処理装置、情報処理方法およびプログラム
CN106898348B (zh) 一种出声设备的去混响控制方法和装置
EP2679022B1 (en) Systems, methods, apparatus, and computer-readable media for spatially selective audio augmentation
CN104602163B (zh) 主动降噪耳机及应用于该耳机的降噪控制方法和系统
EP3295682B1 (en) Privacy-preserving energy-efficient speakers for personal sound
EP4131997A1 (en) Earphone
WO2018034178A1 (ja) 個人認証システム、個人認証装置、個人認証方法および記録媒体
US20190272843A1 (en) Method and apparatus for acoustic echo suppression
CN109074799A (zh) 信号处理设备、信号处理方法及程序
CN104021798A (zh) 用于通过具有可变频谱增益和可动态调制的硬度的算法对音频信号隔音的方法
Luo et al. HCI on the table: robust gesture recognition using acoustic sensing in your hand
US11842725B2 (en) Detection of speech
EP2012725A2 (en) Narrow band noise reduction for speech enhancement
US20130066626A1 (en) Speech enhancement method
CN111833890B (zh) 头盔佩戴状态自动检测的装置和方法
Talukder et al. Exploiting Playback Device's Effect on Multi-channel Audio to Secure Voice Assistants
KR20220165173A (ko) 신호 처리 장치 및 방법
CN115250646A (zh) 一种辅助聆听方法及装置
GB2573380A (en) Method and apparatus for acoustic echo suppression

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20141007