JP2000181498A - ビームフォーマを用いた信号入力装置及び信号入力用プログラムを記録した記録媒体 - Google Patents

ビームフォーマを用いた信号入力装置及び信号入力用プログラムを記録した記録媒体

Info

Publication number
JP2000181498A
JP2000181498A JP10356015A JP35601598A JP2000181498A JP 2000181498 A JP2000181498 A JP 2000181498A JP 10356015 A JP10356015 A JP 10356015A JP 35601598 A JP35601598 A JP 35601598A JP 2000181498 A JP2000181498 A JP 2000181498A
Authority
JP
Japan
Prior art keywords
signal
noise
target signal
input
frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP10356015A
Other languages
English (en)
Inventor
Yasuyuki Masai
康之 正井
Tomohiro Onoki
智宏 小野木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Computer Engineering Corp
Original Assignee
Toshiba Corp
Toshiba Computer Engineering Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Computer Engineering Corp filed Critical Toshiba Corp
Priority to JP10356015A priority Critical patent/JP2000181498A/ja
Publication of JP2000181498A publication Critical patent/JP2000181498A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Noise Elimination (AREA)

Abstract

(57)【要約】 【課題】任意の方向からの目的信号入力を可能にする。 【解決手段】マイクロフォン101a,101bで受け
てディジタル化された信号を周波数分析部102にて各
チャネル毎に周波数分析し、周波数スペクトルを出力す
る。ビームフォーマ103,104はその周波数スペク
トルを用いて適応フィルタ処理で目的音,雑音の到来方
向に指向性を集中し、目的音,雑音の周波数スペクトル
を出力する。方向推定部105,106はビームフォー
マ104,103の適応フィルタから目的音,雑音の方
向を推定し、その結果に基づき修正部109,110が
ビームフォーマ103,104の入力方向を逐次修正す
る。修正部109,110は、目的音,雑音の周波数ス
ペクトルに基づき方向雑音抽出部107で雑音到来方向
から雑音が抽出され、それが特定キーワードであると方
向雑音判定部108で判定されると、その方向が目的音
方向となるよう修正する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、空間を伝搬する信
号を機器に入力するのに好適な、ビームフォーマを用い
た信号入力装置及び信号入力用プログラムを記録した記
録媒体に関する。
【0002】
【従来の技術】空間を伝搬する信号(音声、或いは可視
光線、赤外線、電波等の電磁波など)を入力して処理す
る装置、例えば音声を入力して処理する音声認識装置で
は、装置に音声(信号)を入力する際に、騒音や他の声
などの雑音が混入してしまうと装置の性能が著しく低下
することが知られている。
【0003】そこで、雑音混入時の性能低下を解決する
ために、雑音や複数の音源から目的信号、つまり目的音
だけを抽出する方法として、 (イ)目的音に雑音が重畳した主入力と雑音のみの参照
入力を用い、適応フィルタによって主入力の雑音を参照
入力から推定し、主入力から減算する方法 (ロ)目的音が入力されていない雑音だけのときか、ま
たは別途雑音のみの参照入力から雑音の周波数成分を求
め、雑音の重畳した目的音の周波数成分から雑音の周波
数成分を減算する方法(スペクトルサブトラクション) (ハ)複数のマイクを用い、目的音の方向に指向性を集
中することによって目的音以外の方向の雑音を抑圧する
方法(ビームフォーマ) などが、従来から用いられてきている。
【0004】
【発明が解決しようとする課題】しかし上記した従来技
術にあっては、例えば(イ)、(ロ)の方法では、目的
音(目的信号)の入力には1つのマイクを用い、かつ参
照入力に目的音が混入しない位置でなければならないた
め、入力可能な位置・方向はかなりの制約を受けるとい
う問題がある。一方、(ハ)の方法については、複数の
マイクを用いて指向性を制御するため、利用者が入力可
能な方向は(イ)、(ロ)に比べると広くなるものの、
目的音方向と雑音方向を区別する必要があるため、目的
音の入力可能な方向は単一の方向かまたは単一の方向の
前後θの範囲に制限する必要がある。したがって、上記
(イ)、(ロ)、(ハ)のいずれの方法も、利用者が使
用する際に任意の、更には複数の方向から目的音(目的
信号)を入力することはできないという問題があった。
この問題は、音声に限らず、可視光線、赤外線、電波な
ど、空間を伝搬する信号を入力して処理する装置全般に
共通である。
【0005】本発明は上記事情を考慮してなされたもの
でその目的は、空間を伝搬する目的の信号への指向性を
制御することにより、任意の方向からの目的信号入力を
可能にするビームフォーマを用いた信号入力装置及び信
号入力用プログラムを記録した記録媒体を提供すること
にある。
【0006】本発明の他の目的は、空間を伝搬する目的
の信号への指向性を制御することにより、任意の且つ複
数の方向からの目的信号入力を可能にするビームフォー
マを用いた信号入力装置及び信号入力用プログラムを記
録した記録媒体を提供することにある。
【0007】
【課題を解決するための手段】本発明の信号入力装置
は、空間を伝搬する信号を少なくとも2箇所の異なった
位置で受信して量子化することで得られた量子化ディジ
タル信号を入力し、入力した各受信位置に対応する量子
化ディジタル信号を複数の周波数帯域毎に周波数分析し
て各周波数帯域毎の周波数スペクトルを出力する周波数
分析手段と、上記各周波数帯域毎の周波数スペクトルを
用いて適応フィルタ処理により目的信号以外の到来方向
の信号の抑圧処理を行って目的信号を出力する第1のビ
ームフォーマ処理手段と、上記各周波数帯域毎の周波数
スペクトルを用いて適応フィルタ処理により目的信号の
到来方向の信号の抑圧処理を行って目的信号以外の雑音
を出力する第2のビームフォーマ処理手段と、上記第1
のビームフォーマ処理手段で計算される適応フィルタ係
数から雑音の方向を推定する雑音方向推定手段と、上記
第2のビームフォーマ処理手段で計算される適応フィル
タ係数から目的信号の方向を推定する目的信号方向推定
手段と、上記第1のビームフォーマ処理手段で計算され
る周波数スペクトルと上記第2のビームフォーマ処理手
段で計算される周波数スペクトルを用いて雑音到来方向
からの雑音を抽出する方向雑音抽出手段と、上記抽出さ
れた雑音が特定のキーワード或いは特定周波数信号であ
るか否かを判定する方向雑音判定手段と、上記第1のビ
ームフォーマ処理手段において入力対象とする目的信号
の到来方向(第1の入力方向)を、上記推定された目的
信号方向に基づいて逐次修正する一方、上記抽出された
雑音が上記特定のキーワード或いは特定周波数信号であ
ると判定された場合には、その特定のキーワード或いは
特定周波数信号を発した方向が目的信号方向となるよう
に上記第1の入力方向を修正する目的信号方向修正手段
と、上記第2のビームフォーマ処理手段において入力対
象とする雑音の到来方向(第2の入力方向)を、上記推
定された雑音方向に基づいて逐次修正する一方、上記抽
出された雑音が上記特定のキーワード或いは特定周波数
信号であると判定された場合には、その特定のキーワー
ド或いは特定周波数信号を発した方向が目的信号方向と
なるように上記第2の入力方向を修正する雑音方向修正
手段とを備えたことを特徴とする。
【0008】上記の構成において、第1のビームフォー
マ処理手段(目的音ビームフォーマ)では、各周波数帯
域毎の周波数スペクトルを用いて適応フィルタ処理によ
り目的信号以外の到来方向の信号の抑圧処理が行われて
目的信号(の周波数スペクトル)が出力される一方、こ
れとは別に、第2のビームフォーマ処理手段(雑音ビー
ムフォーマ)では、各周波数帯域毎の周波数スペクトル
を用いて適応フィルタ処理により目的信号の到来方向の
信号の抑圧処理が行われて目的信号以外の雑音(の周波
数スペクトル)が出力される。
【0009】そこで、第1のビームフォーマ処理手段で
目的信号以外の到来方向の信号、つまり雑音が抑圧され
ることに着目し、第1のビームフォーマ処理手段で計算
される適応フィルタ係数から雑音の方向を推定すること
が可能となる。同様に、第2のビームフォーマ処理手段
で目的信号の到来方向の信号が抑圧されることに着目
し、第2のビームフォーマ処理手段で計算される適応フ
ィルタ係数から目的信号の方向を推定することが可能と
なる。ここでは、抑圧が最も強く行われる方向が、推定
される方向として得られる。
【0010】したがって、この推定された目的信号方向
に基づいて、上記第1のビームフォーマ処理手段におい
て入力対象とする目的信号到来方向(第1の入力方向)
を逐次修正し、推定された雑音方向に基づいて、上記第
2のビームフォーマ処理手段において入力対象とする雑
音到来方向(第2の入力方向)を逐次修正することで、
第1のビームフォーマ処理手段からは目的信号の周波数
スペクトルを、第2のビームフォーマ処理手段からは雑
音の周波数スペクトルを、別々に高精度に出力すること
が可能となる。
【0011】また、上記の構成においては、上記第1及
び第2のビームフォーマ処理手段からそれぞれ出力され
る周波数スペクトルを用いて雑音到来方向からの雑音を
抽出し、その抽出した雑音が特定のキーワード或いは特
定周波数信号であると判定できた場合には、その特定の
キーワード或いは特定周波数信号を発した方向が目的信
号方向となるように、第1のビームフォーマ処理手段に
おける第1の入力方向と、第2のビームフォーマ処理手
段における第2の入力方向とが修正される。これによ
り、雑音方向からの到来信号であっても、目的信号方向
(第1の入力方向)を、特定のキーワード或いは特定周
波数信号を発した方向に修正し、これに応じて雑音方向
(第2の入力方向)も修正することで、空間を伝搬する
信号を2箇所以上の異なった位置で受けて量子化するこ
とで得られた量子化ディジタル信号から、目的信号の周
波数スペクトルと雑音の周波数スペクトルとを高精度に
抽出して出力することができる。つまり、上記の構成に
おいては、利用者が特定のキーワード或いは特定周波数
信号を任意の方向から与えることで、その方向からの目
的信号の入力が可能となるため、目的信号の入力可能な
方向を制限する必要がなく、任意の方向から目的信号を
入力できる。
【0012】ここで、方向雑音抽出手段に適応フィルタ
を用いるならば、雑音方向の周波数スペクトルと目的信
号方向の周波数スペクトルとに基づいて、雑音到来方向
からの雑音の抽出を簡単に行うことが可能となる。この
場合、雑音方向の周波数スペクトルを主入力、目的信号
方向の周波数スペクトルを参照入力として、雑音方向の
周波数スペクトルに合まれる背景雑音を抑圧し、真に雑
音方向から到来する信号(方向雑音)のみを抽出するよ
うにするとよい。この他、方向雑音抽出手段での雑音到
来方向からの雑音の抽出に、スペクトルサブトラクショ
ンを用いることも可能である。
【0013】また、目的信号の入力可能な方向の指定に
特定のキーワードを用いる場合には、方向雑音判定手段
に音声認識機能を持たせて、方向雑音抽出手段により抽
出された雑音に対する音声認識処理を行って、その認識
結果から特定のキーワードであるか否かを判定するよう
にするとよい。
【0014】また、目的信号の入力可能な方向の指定に
特定の周波数信号を用いる場合には、方向雑音抽出手段
により抽出された雑音(方向雑音)の周波数スペクトル
の特定の周波数成分の有無を検出する機能を、方向雑音
判定手段に持たせればよい。この場合、例えば、正弦波
のような信号でも、その発生(入力)方向を目的信号の
方向とすることができる。ここで、特定の周波数成分の
有無は、方向雑音抽出手段により抽出された方向雑音の
各周波数帯域毎の周波数スペクトルを比較し、最も値
(例えばパワー)の大きい周波数帯域をその方向雑音の
周波数成分とし、その周波数成分が特定の周波数成分に
一致するか否かをチェックすることで検出するとよい。
【0015】また、上記方向雑音抽出手段によって抽出
された雑音が特定のキーワード或いは特定周波数信号で
あると方向雑音判定手段により判定された場合に、その
特定のキーワード或いは特定周波数信号を発した方向が
目的信号方向となるように、上記の如く第1のビームフ
ォーマ処理手段における第1の入力方向と、第2のビー
ムフォーマ処理手段における第2の入力方向を修正する
代わりに、空間を伝搬する信号を少なくとも2箇所の異
なった位置で受信して量子化する信号量子化装置を駆動
して、その受信位置の向きを変える駆動手段を設け、特
定のキーワード或いは特定周波数信号を発した方向が目
的信号方向となるように、上記駆動手段により上記信号
量子化装置を駆動してその受信位置の向きを変えるよう
にしても構わない。
【0016】また本発明は、複数の任意の方向から目的
信号を入力可能なように、上記第1のビームフォーマ処
理手段に相当する第1の主ビームフォーマ処理手段、上
記第2のビームフォーマ処理手段に相当する第2の主ビ
ームフォーマ処理手段、上記雑音方向推定手段に相当す
る主雑音方向推定手段、上記目的信号方向推定手段に相
当する主目的信号方向推定手段、上記目的信号方向修正
手段に相当する主目的信号方向修正手段、及び上記雑音
方向修正手段に相当する主雑音方向修正手段(を有する
信号源推定ビームフォーマ処理手段)と、上記周波数分
析手段の他に、上記主目的信号推定手段によって推定さ
れた目的信号方向の信号源に対して指向性を集中させる
ために、その信号源に対応した以下に述べる機能構成の
信号源ビームフォーマ処理手段(として機能させるため
のプロセス)を動的に生成する信号源ビーム制御手段
と、この信号源ビーム制御手段により生成されている上
記信号源ビームフォーマ処理手段の出力する信号源方向
の周波数スペクトルのうちの少なくとも1つを選択する
信号源ビーム選択手段とを備えたことをも特徴とする。
【0017】ここで、信号源ビームフォーマ処理手段
は、上記周波数分析手段から出力される各周波数帯域毎
の周波数スペクトルを用いて適応フィルタ処理により該
当する目的信号以外の到来方向の信号の抑圧処理を行っ
て目的信号を出力する第1の副ビームフォーマ処理手段
と、上記各周波数帯域毎の周波数スペクトルを用いて適
応フィルタ処理により目的信号の到来方向の信号の抑圧
処理を行って目的信号以外の雑音を出力する第2の副ビ
ームフォーマ処理手段と、上記第1の副ビームフォーマ
処理手段で計算される適応フィルタ係数から雑音の方向
を推定する副雑音方向推定手段と、上記第2の副ビーム
フォーマ処理手段で計算される適応フィルタ係数から目
的信号の方向を推定する副目的信号方向推定手段と、上
記第1の副ビームフォーマ処理手段において入力対象と
する目的信号の到来方向である第1の副入力方向を、上
記副目的信号方向推定手段で推定された目的信号方向に
基づいて逐次修正する副目的信号方向修正手段と、上記
第2の副ビームフォーマ処理手段において入力対象とす
る雑音の到来方向である第2の副入力方向を、上記副雑
音方向推定手段で推定された雑音方向に基づいて逐次修
正する副雑音方向修正手段を有し、対応する信号源から
の目的信号の周波数スペクトルと、雑音の周波数スペク
トルとを別個に出力可能なように構成されている。
【0018】上記の構成においては、目的信号の信号源
が複数存在する場合でも、(信号源推定ビームフォーマ
処理手段での探索範囲で)その信号源から目的信号が発
せられると、(信号源推定ビームフォーマ処理手段内
の)主目的信号推定手段によってその目的信号の方向が
推定されて第1の主ビームフォーマ処理手段により、そ
の目的信号の信号源に対して指向性が集中される結果、
その信号源の方向に対してのみ指向性を持ち、他の方向
からの信号は雑音として抑圧するように働く信号源ビー
ムフォーマ処理手段(として機能させるためのプロセ
ス)が動的に生成されるため、つまり複数の信号源の各
々に対して、その信号源にビームを集中した信号源ビー
ムフォーマ処理手段が動的に生成されるため、生成され
た各信号源ビームフォーマ処理手段により、該当する信
号源に対応した信号の周波数スペクトルをそれぞれ出力
することが可能となる。また、各信号源に対応した信号
の周波数スペクトルの出力とは別に、信号源以外から到
来する雑音の周波数スペクトルも、例えば(信号源推定
ビームフォーマ処理手段内の)第2の主ビームフォーマ
処理手段から出力することが可能となる。
【0019】ここで、上記主目的信号推定手段によって
推定された目的信号方向からの信号到来が一定時間以上
継続する特定状態(第1の状態)を検出する継続時間判
定手段を設け、この継続時間判定手段による上記第1の
状態の検出に応じて、上記信号源ビーム制御手段による
信号源ビームフォーマ処理手段の生成が行われる構成と
するとよい。また、既に生成されている信号源ビームフ
ォーマ処理手段に対応する信号源に対しては、たとえ上
記第1の状態が判定されたとしても、新たにその信号源
の方向に対応した信号源ビームフォーマ処理手段の生成
は行わないようにするとよい。
【0020】また、上記継続時間判定手段に、上記主目
的信号推定手段によって推定された目的信号方向からの
信号到来が一定時間以上ない第2の状態を検出する機能
を追加し、この第2の状態の検出された場合には、上記
信号源ビーム制御手段により、その際の信号到来方向と
同一方向を目的信号到来方向とする信号源ビームフォー
マ処理手段(として機能させるためのプロセス)が削除
されるようにするとよい。
【0021】また、上記信号源ビーム選択手段に、生成
されている信号源ビームフォーマ処理手段のうち、最も
最近にまたは最も以前に生成された信号源ビームフォー
マ処理手段から出力される信号源方向の周波数スペクト
ルを選択して出力する機能を持たせるとよい。この場
合、各信号源ビームフォーマ処理手段に対応させて、そ
の信号源ビームフォーマ処理手段の生成順序を管理する
ための生成情報記憶手段を設けるとよい。ここで、生成
順序の管理情報としては、生成時刻、或いは生成順番を
表す数値等が利用可能である。生成情報記憶手段は、各
信号源ビームフォーマ処理手段に分散配置しても、1箇
所に集中させても構わない。
【0022】また、上記信号源ビーム選択手段に、生成
された各信号源ビームフォーマ処理手段から出力される
周波数スペクトルを全て加算した周波数スペクトルを出
力する機能を持たせてもよい。
【0023】また、上記信号源ビーム選択手段に、生成
されている信号源ビームフォーマ処理手段の出力する信
号源方向の周波数スペクトルのうち、特定のキーワード
の周波数スペクトル或いは特定の周波数信号の周波数ス
ペクトルを選択して出力する機能を持たせてもよい。こ
こで、特定のキーワードの周波数スペクトルを検出する
には、音声認識機能を用いればよく、特定の周波数信号
の周波数スペクトルを検出するには、先に述べた特定周
波数成分の有無を検出する機能を用いればよい。
【0024】更に、上記信号源ビーム選択手段に、上記
の各機能のうちの少なくとも2つを持たせ、いずれの機
能を用いるかを外部からの指定に応じて選択可能な構成
としてもよい。
【0025】
【発明の実施の形態】以下、本発明の実施の形態につき
図面を参照して説明する。以下の説明では主に人間の発
声を対象としているが、空間を伝搬する信号であれば、
それ以外の信号、例えば光線、電波等の電磁波であって
もよい。
【0026】[第1の実施形態]図1は本発明の第1の
実施形態に係る信号入力装置の基本構成を示すブロック
図である。
【0027】まず、空間を伝搬する信号、例えば人が発
声した音声は、音声入力部101に入力される。音声入
力部101は複数の、例えば2つのそれぞれ異なった位
置に配置されたマイクロフォン101a,101bと、
A/D変換部(ADC)101c,101dとを有して
いる。音声入力部101に入力された音声はマイクロフ
ォン101a,101bによりそれぞれ受音されて電気
信号(音声信号)に変換され、更にA/D変換部101
c,101dによりそれぞれディジタル信号(量子化デ
ィジタル信号)に変換されて周波数分析部102に送ら
れる。
【0028】周波数分析部102は、音声入力部101
により入力される各音声信号のそれぞれについて予め定
められた複数の周波数帯域(以下、チャネルと称する)
毎に周波数分析を行う。この周波数分析では、例えば高
速フーリエ変換(FFT)などにより周波数スペクトル
が計算される。周波数スペクトルは固定の時間長を単位
に計算する。この固定の時間長をフレームという。
【0029】周波数分析部102による各マイクロフォ
ン101a,101bからの入力音声信号別の各チャネ
ル毎の周波数分析結果(周波数スペクトル計算結果)
は、目的音ビームフォーマ103及び雑音ビームフォー
マ104にそれぞれ入力される。このように、ビームフ
ォーマ103,104には、従来のビームフォーマと異
なって、音声信号(ディジタル音声信号)ではなくて、
その音声信号の周波数分析結果である周波数スペクトル
が入力されることに注意されたい。
【0030】目的音ビームフォーマ103は、周波数分
析部102から送られる各チャネル毎の周波数スペクト
ルから、周波数領域の適応フィルタ212(図2(a)
参照))により(目的信号としての)目的音(目的音
声)以外の到来方向の音、つまり雑音の抑圧処理を行っ
て目的音方向の音声の周波数スペクトル(目的音周波数
スペクトル)を出力する。ここでは、目的音の方向が音
声入力部101(内のマイクロフォン101a,101
b)の正面となるように、目的音方向推定部105の出
力に基づく目的音方向修正部109による目的音入力方
向修正のための方向指定(入力方向指定)に従って後述
する整相部211(図2(a)参照)で位相操作が行わ
れる。
【0031】一方、雑音ビームフォーマ104は、周波
数分析部102から送られる各チャネル毎の周波数スペ
クトルから、周波数領域の適応フィルタ212(図2
(a)参照)により目的音の到来方向の音声(目的音)
を抑圧する処理を行って、目的音以外の音、つまり雑音
の周波数スペクトルを出力する。ここでは、雑音の方向
が音声入力部101(内のマイクロフォン101a,1
01b)の正面となるように、雑音方向推定部105の
出力に基づく雑音方向修正部110による雑音入力方向
修正のための方向指定(入力方向指定)に従って図2
(a)中の整相部211で位相操作が行われる。
【0032】本実施形態において、目的音ビームフォー
マ103及び雑音ビームフォーマ104は同一構成であ
る。目的音ビームフォーマ103と雑音ビームフォーマ
104との相違点は、目的音ビームフォーマ103には
周波数分析部102からのチャネル毎の周波数スペクト
ルの他に、目的音方向修正部109からの目的音方向の
修正指定が入力されるのに対し、雑音ビームフォーマ1
04には周波数分析部102からのチャネル毎の周波数
スペクトルの他に、雑音方向修正部110からの雑音方
向の修正指定が入力されることにある。
【0033】上記目的音方向推定部105は、雑音ビー
ムフォーマ104の適応フィルタ係数から目的音方向を
推定する。一方、上記雑音方向推定部106は、目的音
ビームフォーマ103の適応フィルタ係数から雑音方向
を推定する。
【0034】目的音ビームフォーマ103から出力され
る目的音方向の周波数スペクトル、及び雑音ビームフォ
ーマ104から出力される雑音方向の周波数スペクトル
は、図1の信号入力装置を入力インタフェースに持つ、
音声認識装置等の利用機器(図示せず)に入力されると
共に、方向雑音抽出部107に入力される。方向雑音抽
出部107は、適応フィルタを用い、雑音方向の周波数
スペクトルを主入力、目的音方向の周波数スペクトルを
参照入力として、雑音方向の周波数スペクトルに合まれ
る背景雑音を抑圧し、真に雑音方向から到来する音声
(方向雑音)のみを抽出する。
【0035】通常、方向雑音抽出部107が抽出する方
向雑音は装置全体としては抑圧すべきものであるが、目
的音以外の雑音の方向で音声が発せられると、その発声
が方向をもった雑音となるため、方向雑音抽出部107
で抽出することによって雑音方向で発せられた音声を得
ることができる。
【0036】方向雑音抽出部107により抽出された方
向雑音は方向雑音判定部108に入力される。方向雑音
判定部108は、方向雑音抽出部107の抽出(検出)
した方向雑音が雑音であるか、あるい発声音であるかを
判定し、発声音であって且つその発声音が特定のキーワ
ードに一致する場合には、目的音方向推定部105及び
雑音方向推定部106にキーワード検出通知を送り、当
該目的音方向推定部105及び雑音方向推定部106を
介して目的音方向修正部109及び雑音方向修正部11
0により、特定のキーワードの発声があった方向が目的
音の方向となるように修正させる。ここでは、方向雑音
判定部108でのキーワードの判定に音声認識技術を用
いる。
【0037】なお、方向雑音判定部108での音声認識
に用いられる方向雑音抽出部107からの出力は、音声
認識の入力としては劣化が大きいものの、方向を決定す
るキーワードは1つかまたは少数でよく、種類が極めて
限られているため、実用上問題ない性能が得られる。
【0038】また、方向雑音判定部108で、方向雑音
の周波数スペクトルの特定の周波数成分の有無を検出す
るようにすれば、例えば、正弦波のような信号でもその
方向を目的音の方向とすることができる。この特定の周
波数成分の有無は、各チャネル(周波数チャネル、周波
数帯域)毎の周波数スペクトルを比較し、最も値(例え
ばパワー)の大きいチャネルの周波数帯域をその信号の
周波数成分とし、その周波数成分が特定の周波数成分に
一致するか否かをチェックすることで検出できる。
【0039】図2(a)は、目的音ビームフォーマ10
3及び雑音ビームフォーマ104のブロック構成を示
す。
【0040】ビームフォーマ103及び104は、入力
対象となる方向からの信号が等価的に同時に2つのマイ
クロフォン101a,102bに到着したとみなせるよ
うに、対応する2つの周波数スペクトルに遅延を施し整
相する整相部211と、適応フィルタ212を含むビー
ムフォーマ本体213とから構成される。
【0041】マイクロフォン101a,102bが、例
えば図2(b)に示すように配置されている場合、マイ
クロフォン101aの信号の位相とマイクロフォン10
1bの信号の位相が同じになるように、マイクロフォン
101aの信号に伝搬時間差τ=r・c=d・c・sin
αに相当する複素数W1=(cosj ωτ,sinjωτ)の
複素共役をかけることにより行う。ここで、cは音速、
dはマイクロフォン101a,101b間の距離であ
る。
【0042】一方、マイクロフォン101bの信号に
は、複素数W2=(1,0)の複素共役をかけるものと
する。このとき、W1とW2を並べたベクトルW1,W
2を一般に方向ベクトルと呼び、複素共役のベクトルW
*,W2*を補正ベクトルと呼ぶ。
【0043】目的音ビームフォーマ103の整相部21
1では目的音が入力対象となるようにマイクロフォン1
01a,101bの信号に対応する2つの周波数スペク
トルに遅延を施す。一方、雑音ビームフォーマ104の
整相部211では雑音を入力対象とするように上記2つ
の周波数スペクトルに遅延を施す。
【0044】目的音ビームフォーマ103のビームフォ
ーマ本体213は、整相部211で整相された上記2つ
の周波数スペクトルから、周波数領域の適応フィルタ2
12により雑音を抑圧し、目的音方向の周波数スペクト
ルを出力する。一方、雑音ビームフォーマ104のビー
ムフォーマ本体213は、整相部211で整相された上
記2つの周波数スペクトルから、周波数領域の適応フィ
ルタ212により目的音を抑圧し、雑音方向の周波数ス
ペクトルを出力する。ここでは、ビームフォーマ本体2
13は一般化サイドローブキャンセラ(GSC)により
構成されるものとするが、フロスト型ビームフォーマ
等、GSC以外のビームフォーマ構成も適用可能であ
る。
【0045】次に、目的音方向推定部105及び雑音方
向推定部106での方向推定処理の詳細について、図3
のフローチャートを参照して説明する。なお、このフロ
ーチャートに従う処理は、フレーム単位で、目的音方向
推定部105及び雑音方向推定部106でほぼ同様に行
われる。
【0046】目的音方向推定部105及び雑音方向推定
部106は、まず目的音の追尾範囲θc±θrを設定し、
それに対応した探索範囲を設定する初期設定処理を行う
(ステップS1)。ここで、目的音追尾範囲の中心角度
を示すθcは可変のパラメータであり、初期値は0゜で
ある。また、θrは固定のパラメータであり、例えば2
0゜である。また、探索範囲は、雑音方向推定部106
では、雑音の到来方向を調べる角度範囲φ1を示し、θ
c+θr<φ1<180゜+θc−θrと、−180゜+θ
c+θr<φ1<θc−θrに設定される。一方、目的音方
向推定部105では、探索範囲は目的音の到来方向を調
べる角度範囲φ2を示し、θc−θr<φ2<θc+θrに
設定される。また、初期設定処理では、周波数分析部1
02により得られる周波数スペクトルの成分数(FFT
長)が設定される。ここでは、FFT長は256であ
る。
【0047】次に方向推定部105,106は、ビーム
フォーマ103,104の適応フィルタ係数を取得する
(ステップS2)。ここで、本実施形態で適用する図2
の構成のGSCを用いたビームフォーマ103,104
では、従来の音声信号を入力するGSCを用いたビーム
フォーマ103と異なって、音声の周波数スペクトルを
入力していることから、つまり時間領域の適応フィルタ
ではなくて、周波数領域の適応フィルタ212を使用し
ていることから、従来のように時間領域のフィルタ係数
から周波数領域のフィルタ係数への変換処理を行うこと
なく、周波数領域のフィルタ係数を取得できる。したが
って、処理の高速化が可能となる。
【0048】次に方向推定部105,106は、周波数
スペクトルの各周波数成分の番号をkとすると(FFT
長が256の本実施形態では、k=0〜255)、自身
の探索範囲内の1つの角度θについて、各周波数成分毎
に方向ベクトルS(k,θ)を生成し、フィルタ係数W
(k)と当該方向ベクトルS(k,θ)との内積を計算
して対応する方向θへの感度(方向別感度)|W(k)
・S(k,θ)|2を求め、全周波数成分(k=0〜2
56)についてその感度を加算して、その方向別感度の
累積値D(θ)=Σ|W(k)・S(k,θ)|2を求
める処理を行う(ステップS3〜S5)。
【0049】方向推定部105,106は、上記した方
向別感度の累積値D(θ)を求める処理を、自身の探索
範囲内で、所定角度、例えば1゜刻みで繰り返し実行す
る(ステップS6)。
【0050】次に方向推定部105,106は、求めた
方向別感度の累積値D(θ)の群の中から、最小値とな
る方向θmin=min{D(θ)}を求める(ステップ
S7)。ここで、方向推定部(目的音方向推定部)10
5で求められるθminは、雑音ビームフォーマ104で
到来信号が最も抑圧されている角度、つまり目的音の到
来方向(の推定結果)を示し、方向推定部(雑音方向推
定部)106で求められるθminは、目的音ビームフォ
ーマ103で到来信号が最も抑圧されている角度、つま
り主たる雑音の到来方向(の推定結果)を示す。
【0051】次に方向推定部105,106は、方向雑
音判定部108からキーワード検出通知が送られている
か否かをチェックする(ステップS8)。もし、キーワ
ード検出通知が送られていない場合には、方向推定部1
05,106は、ステップS7で求めた、(方向別感度
の累積値D(θ)が最小値となる)方向θminを信号
(方向推定部105では目的音、方向推定部106では
雑音)の到来方向(入力方向)と推定し、その推定した
到来方向(入力方向)θminを方向修正部109,11
0に通知して(ステップS9)、次のフレームの処理
(ステップS2)に戻る。
【0052】これに対し、キーワード検出通知が送られ
ている場合には、方向推定部(目的音方向推定部)10
5と方向推定部(雑音方向推定部)106とで異なる処
理が次のように行われる。なお、図3のフローチャート
では、キーワード検出通知が送られている場合の雑音方
向推定部106の処理手順は省略されている。
【0053】まず、目的音方向推定部105は、目的音
方向追尾範囲の中心角度θcをステップS7で求めた方
向θminに更新すると共に、その更新後のθcを雑音方向
推定部106に通知して(ステップS10)、次のフレ
ームの処理(ステップS2)に戻る。一方、雑音方向推
定部106は、推定した雑音到来方向(入力方向)θmi
nを雑音方向修正部110に通知すると共に、目的音方
向推定部105から通知されるθcを、新たなθcとして
設定する。
【0054】次に、目的音方向修正部109及び雑音方
向修正部110の動作の詳細を説明する。目的音方向修
正部109は、前フレームまでの目的音の入力方向と現
フレームの目的音方向推定部105での方向推定結果と
を平均化して、新たな目的音入力方向を計算し、その入
力方向を目的音ビームフォーマ103の整相部211に
出力する。同様に、雑音方向修正部110は、前フレー
ムまでの雑音の入力方向と現フレームの雑音方向推定部
106での方向推定結果とを平均化して、新たな雑音入
力方向を計算し、その入力方向を雑音ビームフォーマ1
04の整相部211に出力する。
【0055】目的音方向修正部109及び雑音方向修正
部110での上記した入力方向の平均化は、nを現フレ
ーム(現在の処理フレーム)の番号、E(n)を現フレ
ームの方向推定結果、θ1(n−1)を前フレームまで
の入力方向、θ1(n)を平均化された入力方向とする
と、例えば係数αを用いて次式 θ1(n)=θ1(n−1)・(1一α)十E(n)・α に従って行われる。ここで、αはビームフォーマの出力
パワーに基づいて可変にしてもよい。
【0056】次に、方向雑音抽出部107の詳細を説明
する。図4は方向雑音抽出部107のブロック構成を示
す。方向雑音抽出部107は、雑音ビームフォーマ10
4から出力される雑音方向の周波数スペクトルを主入
力、目的音ビームフォーマ103から出力される目的音
方向の周波数スペクトルを参照入力とした適応フィルタ
107aを用いて構成される。
【0057】主入力をPn、参照入力をPvとすると、P
n,Pvは、 Pn=N+B′ Pv=V+B″ と表すことができる。但し、Nは雑音源、Vは目的音、
B′は雑音方向の背景雑音成分、B″は目的音方向の背
景雑音成分である。
【0058】このとき、雑音方向から目的音方向変更の
ためのキーワードが発声されると、 Pn=V+B′ Pv=B″ となる。
【0059】適応フィルタ107aは目的音方向の背景
雑音成分B″が雑音方向の背景雑音成分B′に近付くよ
うにフィルタ係数を更新するため、PnはVのみとな
り、キーワードの発声を抽出することができる。つまり
方向雑音抽出部107では、先に述べたように、雑音方
向の周波数スペクトルを主入力、目的音方向の周波数ス
ペクトルを参照入力として、雑音方向の周波数スペクト
ルに合まれる背景雑音を抑圧し、真に雑音方向から到来
する音声(ここでは目的音以外の雑音の方向から発せら
れた音声としての方向雑音)の周波数スペクトルのみを
抽出する。ここでは適応フィルタを用いたが、スペクト
ルサブトラクションなどを用いてもよい。
【0060】方向雑音抽出部107により抽出された方
向雑音の周波数スペクトルは方向雑音判定部108に入
力される。以下、この方向雑音判定部108の詳細を説
明する。
【0061】図5は方向雑音判定部108のブロック構
成を示す。同図において、音声区間検出部108aは、
フレーム単位で方向雑音の周波数スペクトルからパワー
を求め、音声区間を検出する。もし、音声区間が検出さ
れなかった場合には、方向雑音が雑音であるとして、次
に述べるベクトル量子化部108bに制御を渡さない。
これに対して音声区間が検出された場合には、方向雑音
が発声音であるとして、その発声音の認識処理のため
に、ベクトル量子化部108bに制御を渡す。
【0062】ベクトル量子化部108bは、音声区間検
出部108aにより検出された音声区間内の周波数スペ
クトル列に対してコードブック108cとの類似度計算
を行い、音声記号列を出力する。
【0063】マッチング処理部108dは、予め認識辞
書108eに登録された特定のキーワード(1種類とは
限らない)の標準パターン(認識対象単語)と音声記号
列とのマッチングを行って、そのマッチングの度合いを
示すスコア(マッチングスコア)を求め、一定レベル以
上のスコアが得られた場合に、特定のキーワード(コマ
ンド)を検出したものとして、キーワード検出通知を目
的音方向推定部105及び雑音方向推定部106に送
る。この場合、前記したように目的音方向追尾範囲の中
心角度θcが、キーワードの発声音の到来方向(θmin)
に更新される。
【0064】次に、以上に述べた機能を持つ図1の信号
入力装置の全体の処理について、図6のフローチャート
を参照して説明する。この処理はフレーム毎に行われる
もので、まずステップS11の初期設定処理により、目
的音方向の追尾範囲θc±θrが設定され(ここではθc
=0゜,θr=20゜)、これに応じて雑音方向推定部
106の探索範囲φ1がθc+θr<φ1<180゜+θ
c−θrと、−180゜+θc+θr<φ1<θc−θrに、
目的音方向推定部105の探索範囲φ2がθc−θr<φ
2<θc+θrに、それぞれ設定される。また、目的音の
入力方向(第1の入力方向)θ1の初期値を0゜、雑音
の入力方向(第2の入力方向)θ2の初期値を90゜と
する。
【0065】次に、目的音ビームフォーマ103の処理
を行って、雑音方向推定部106にて雑音方向(θmi
n)を推定する(ステップS12,S13)。雑音方向
修正部110では、推定された雑音方向(θmin)がφ
2の範囲内であれば(ステップS14)、雑音ビームフ
ォーマ104での雑音入力方向をθminだけ修正し(ス
テップS15)、そうでなければ、修正しない。
【0066】続いて、雑音ビームフォーマ104の処理
に進み、目的音方向推定部105にて目的音の方向(θ
min)を推定する(ステップS16,S17)。推定さ
れた目的音の方向がφ1の範囲内ならば、方向雑音抽出
部107にて方向雑音の抽出を行う(ステップS18,
S19)。
【0067】もし、抽出された方向雑音が特定のキーワ
ード、つまりコマンド(或いは特定周波数の信号)であ
ると方向雑音判定部108で判定されたならば(ステッ
プS20,S21)、目的音の方向が雑音の方向となる
ように目的音方向推定部105、雑音方向推定部106
にて目的音追尾範囲の中心角度θcをθminに更新するこ
とで、目的音方向修正部109、雑音方向修正部110
を介して、目的音ビームフォーマ103での目的音入力
方向、雑音ビームフォーマ104での雑音入力方向を修
正し(ステップS22,S23)、次のフレームの処理
に移る。
【0068】これに対し、方向雑音が特定のキーワード
(或いは特定周波数理信号)でないならば(ステップS
20,S21)、それは単なる雑音として何もせずに次
のフレームの処理に移る。
【0069】一方、目的音方向推定部105で推定され
た目的音の方向(θmin)がφ1の範囲内でないならば
(ステップS18)、つまりφ2の範囲内ならば、目的
音方向修正部109を介して目的音ビームフォーマ10
3での目的音入力方向を、θminだけ修正し(ステップ
S24)、次のフレームの処理に移る。
【0070】以上に述べた図1の構成の信号入力装置
は、例えば、音声入力部101を内蔵したパーソナルコ
ンピュータ等の情報処理装置(計算機)を、周波数分析
部102、目的音ビームフォーマ103、雑音ビームフ
ォーマ104、目的音方向推定部105、雑音方向推定
部106、方向雑音抽出部107、方向雑音判定部10
8、目的音方向修正部109及び雑音方向修正部110
として機能させるためのプログラム(信号入力用プログ
ラム)が記録されたCD−ROM、フロッピーディス
ク、メモリカード等の機械読み取り可能な記録媒体か
ら、そのプログラムを当該情報処理装置にて読み取り実
行することで、実現される。なお、上記プログラムが、
ネットワーク等の通信媒体を介して情報処理装置にダウ
ンロードされるものであっても構わない。また、音声入
力部101は、当該情報処理装置に内蔵されている必要
はなく、当該情報処理装置に外部接続して使用されるも
のであっても構わない。
【0071】[第2の実施形態]図7は本発明の第2の
実施形態に係る信号入力装置の基本構成を示すブロック
図であり、図1と同一部分には同一符号を付してある。
【0072】以下、図7の構成の信号入力装置の特徴に
ついて、前記第1の実施形態における図1の構成との相
違点を中心に述べる。まず図7の構成が図1と異なる第
1の点は、音声入力部101に駆動部201が取り付け
られていることである。この駆動部201は声入力部1
01(内の両マイクロフォン101a,101b)を駆
動(角度回転)することで、当該音声入力部101の向
き(角度)を変えるようになっている。
【0073】また、図7の構成が図1と異なる第1の点
は、目的音方向推定部105及び雑音方向推定部106
に代えて、目的音方向推定部205及び雑音方向推定部
206が用いられていることである。目的音方向推定部
205は、方向雑音検出部107により検出された方向
雑音が発声であって、且つその発声が特定のキーワード
である場合、つまり方向雑音判定部108からのキーワ
ード検出通知がある場合に、図1中の目的音方向推定部
105とは異なって、目的音の追尾範囲の中心角度θc
を前記図3のフローチャートのステップS7に相当する
処理で取得されるθmin(信号到来方向)に更新する代
わりに、そのθminの角度だけ音声入力部101(内の
両マイクロフォン101a,101b)の向きを変える
ように、駆動部201に対して方向変更指示を与える。
【0074】一方、雑音方向推定部206は、方向雑音
判定部108からのキーワード検出通知がある場合に
は、図1中の雑音方向推定部106とは異なって、目的
音の追尾範囲の中心角度θcの更新を行うことなく、そ
のまま次のフレームの処理に移る。
【0075】なお、方向雑音検出部107により検出さ
れた方向雑音が発声でないか、発声であっても、その発
声が特定のキーワードでない場合、つまり方向雑音判定
部108からのキーワード検出通知がない場合の目的音
方向推定部205、雑音方向推定部206の動作は、図
1中の目的音方向推定部105、雑音方向推定部106
と同様であり、取得したθminが目的音方向修正部10
9、雑音方向修正部110に通知される。
【0076】次に、図7の信号入力装置の全体の処理に
ついて、図8のフローチャートを参照して説明する。
【0077】この処理はフレーム毎に行われるもので、
まずステップS31の初期設定処理により、目的音方向
の追尾範囲θc±θrが設定され(ここではθc=0゜,
θr=20゜)、これに応じて雑音方向推定部206の
探索範囲φ1がθc+θr<φ1<180゜+θc−θr
と、−180゜+θc+θr<φ1<θc−θrに、目的音
方向推定部205の探索範囲φ2がθc−θr<φ2<θ
c+θrに、それぞれ設定される。また、目的音の入力方
向θ1の初期値を0゜、雑音の入力方向θ2の初期値を
90゜とする。
【0078】次に、目的音ビームフォーマ103の処理
を行って、雑音方向推定部206にて雑音方向を推定し
(ステップS32,S33)、雑音方向がφ2の範囲内
であれば(ステップS34)、雑音方向修正部110に
より雑音ビームフォーマ104の入力方向を修正し(ス
テップS35)、そうでなければ、修正しない。
【0079】続いて、雑音ビームフォーマ104の処理
に進み、目的音方向推定部105にて目的音の方向を推
定する(ステップS36,S37)。推定された目的音
の方向がφ1の範囲内ならば、方向雑音抽出部107に
て方向雑音の抽出を行う(ステップS38,S39)。
ここまでの処理は、前記第1の実施形態における第6の
フローチャートに示した処理と同様である。
【0080】さて、方向雑音抽出の結果、抽出された方
向雑音が特定のキーワード(或いは特定周波数の信号)
であると方向雑音判定部108で判定されたならば(ス
テップS40,S41)、目的音の方向が雑音の方向と
なるように、目的音方向推定部205から駆動部201
に対して(信号到来方向として求められた)角度θmin
だけの方向変更を指示して、当該駆動部201により音
声入力部101(のマイクロフォン101a,101
b)の向きをθminだけ物理的に修正させ(ステップS
42)、次のフレームの処理に移る。
【0081】これに対し、方向雑音が特定のキーワード
(或いは特定周波数理信号)でないならば(ステップS
40,S41)、前記第1の実施形態と同様に、それは
単なる雑音として何もせずに次のフレームの処理に移
る。
【0082】一方、目的音方向推定部205で推定され
た目的音の方向(θmin)がφ1の範囲内でないならば
(ステップS38)、つまりφ2の範囲内ならば、目的
音方向修正部109を介して目的音ビームフォーマ10
3での目的音入力方向をθminだけ修正し(ステップS
43)、次のフレームの処理に移る。
【0083】以上に述べたように本実施形態において
は、方向雑音判定部208からのキーワード検出通知に
応じて、目的音方向推定部205から駆動部201に対
して方向変更指示が出されることにより、音声入力部1
01(内のマイクロフォン101a,101b)の向き
(入力方向)がθminだけ物理的に変更されるようにし
ている。この動作は、前記第1の実施形態において目的
音追尾範囲の中心角度θcをθminに更新するのと同様の
効果を与えることができ、これにより目的音は物理的に
常に音声入力部101の正面となり、目的音の入力方向
を常に良好に保つことができる。
【0084】以上に述べた図7の構成の信号入力装置
は、例えば、音声入力部101及び駆動部201が内
蔵、または外部接続されたパーソナルコンピュータ等の
情報処理装置(計算機)を、周波数分析部102、目的
音ビームフォーマ103、雑音ビームフォーマ104、
目的音方向推定部205、雑音方向推定部206、方向
雑音抽出部107、方向雑音判定部108、目的音方向
修正部109及び雑音方向修正部110として機能させ
るためのプログラムが記録された機械読み取り可能な記
録媒体から、そのプログラムを当該情報処理装置にて読
み取り実行することで、実現される。なお、上記プログ
ラムが、ネットワーク等の通信媒体を介して情報処理装
置にダウンロードされるものであっても構わない。
【0085】[第3の実施形態]図9は本発明の第3の
実施形態に係る信号入力装置の基本構成を示すブロック
図であり、図1と同一部分には同一符号を付してある。
【0086】図9の信号入力装置は、音声入力部10
1、及び周波数分析部102の他に、図1の主構成と同
様の構成を有し、複数の音源、例えばA音源、B音源、
…n音源のうちの目的の音源に対して指向性を集中する
ことが可能な音源推定ビームフォーマ301と、図1の
主構成と同様の構成を有し、所定のA音源、B音源、…
n音源に対してそれぞれ指向性を集中する音源ビームフ
ォーマA,B,…nを動的に生成・削除することが可能
な音源ビーム制御部302と、音源ビームフォーマA,
B,…nから出力される音源方向の周波数スペクトルの
少なくとも1つを選択する音源選択部303とを備えて
いる。
【0087】ここで、図9の構成の信号入力装置は、例
えば、音声入力部101を内蔵した、或いは外部接続可
能なパーソナルコンピュータ等の情報処理装置(計算
機)を、周波数分析部102、音源推定ビームフォーマ
301、音源ビーム制御部302、音源選択部303、
及び音源ビーム制御部302により生成・削除される音
源ビームフォーマi(i=A,B,…)として機能させ
るためのプログラムが記録された機械読み取り可能な記
録媒体から、そのプログラムを当該情報処理装置にて読
み取り実行することで、実現される。なお、上記プログ
ラムが、ネットワーク等の通信媒体を介して情報処理装
置にダウンロードされるものであっても構わない。
【0088】図9の構成において、i音源(iはA,
B,…)からの例えば音声は音声入力部101に入力さ
れる。音声入力部101に入力された音声はマイクロフ
ォン101a,101bにより電気信号(音声信号)に
変換され、更にA/D変換部101c,101dにより
ディジタル化されて周波数分析部102に送られる。周
波数分析部102は、各入力音声信号のそれぞれについ
て周波数分析を行い、各チャネル毎の周波数分析結果で
ある周波数スペクトルを取得する。各チャネル毎の周波
数分析結果(周波数スペクトル計算結果)は、音源推定
ビームフォーマ301に入力される。
【0089】音源推定ビームフォーマ301は、図10
に示すように、目的音ビームフォーマ103、雑音ビー
ムフォーマ104、目的音方向推定部105、雑音方向
推定部106、目的音方向修正部109、及び雑音方向
修正部110の各機能要素を備えている。音源推定ビー
ムフォーマ301は、目的音の探索範囲でi音源から目
的音が発せられると、i音源に対して指向性を集中す
る。この操作は、前記第1の実施形態において、(方向
雑音判定部108にてキーワードが検出されない場合と
同様に行われる。即ち、目的音方向推定部105、雑音
方向推定部106にてフレーム毎に信号到来方向(入力
方向)としてのθminが求められ、それが目的音方向修
正部109、雑音方向修正部110に通知されること
で、目的音ビームフォーマ103、雑音ビームフォーマ
104により実現される。
【0090】音源推定ビームフォーマ301の特徴は、
上記の機能要素の外に、目的音方向からの音声到来の状
況を監視して、音声到来が予め定められた一定時間以上
継続している第1の状態と、音声非到来が予め定められ
た一定時間以上継続している第2の状態を判定する継続
時間判定部304を備えていることである。継続時間判
定部304は、上記第1の状態を判定した場合には、音
源ビームフォーマ生成を要求する第1の判定結果を、上
記第2の状態を判定した場合には、音源ビームフォーマ
削除を要求する第2の判定結果を、音源ビーム制御部3
02に出力する。
【0091】ここで、上記継続時間は、次のようにして
求められる。まず、目的音方向推定部105では、図3
のフローチャートに示す処理と同様の処理が行われる。
但し本実施形態では、前記第1の実施形態とは異なっ
て、ステップS7での最小値計算で信号到来方向と推定
されるθminを求めた後は、必ずステップS9が実行さ
れて、そのθminが目的音方向修正部109に通知され
る。また、本実施形態では、最小値計算に用いられた、
探索範囲内の各角度θ毎の方向別感度の累積値D(θ)
が、目的音方向推定部105から継続時間判定部304
に渡される。
【0092】継続時間判定部304は、目的音方向推定
部105から渡された探索範囲内の各角度θ毎の方向別
感度の累積値D(θ)の最大値と最小値との差を求め、
その差が予め定められた規定値以上ある場合に音声到来
を、規定値に満たない場合に音声非到来を判定する。そ
して継続時間判定部304は、予め定められた一定フレ
ーム数連続して音声到来を判定した場合に、上記第1の
状態を判定する。同様に継続時間判定部304は、予め
定められた一定フレーム数連続して音声非到来を判定し
た場合に、上記第2の状態を判定する。
【0093】音源ビーム制御部302は、i音源からの
音声到来が一定時間以上継続した結果、音源推定ビーム
フォーマ301内の継続時間判定部304から第1の判
定結果が出力された場合、i音源用の音源ビームフォー
マiの生成が要求されているものと判断し、i音源の方
向にビームを集中した音源ビームフォーマiを新たに生
成する。但し、既に音源ビームフォーマiが生成されて
いる場合には、新たな生成は行わない。つまり、同一方
向の音源ビームフォーマiを重複して生成しないる。
【0094】音源ビームフォーマiは、図11に示すよ
うに、音源推定ビームフォーマ301と同様の機能構
成、即ち目的音ビームフォーマ103、雑音ビームフォ
ーマ104、目的音方向推定部105、雑音方向推定部
106、目的音方向修正部109、及び雑音方向修正部
110の各機能要素を備えている。音源ビームフォーマ
iの構成が音源推定ビームフォーマ301と異なる点
は、継続時間判定部304に代えて生成情報記憶部30
5が設けられていることである。この生成情報記憶部3
05には、該当する音源ビームフォーマiの生成時刻
(を示す情報)、または当該音源ビームフォーマiの生
成順番を示す生成番号が記憶される。
【0095】音源選択部303は、生成されている各音
源ビームフォーマiの生成情報記憶部305に記憶され
ている生成時刻(或いは生成番号)に基づいて、例えば
最も最近に生成された音源ビームフォーマi、或いは最
も以前に生成された音源ビームフォーマiの、目的音ビ
ームフォーマ103から出力される目的音の周波数スペ
クトル、即ちi音源方向からの音声の周波数スペクトル
を選択する。ここで、いずれの音源ビームフォーマiに
より出力されるi音源方向からの周波数スペクトルを選
択するかは、システムで予め定められていても、ユーザ
の選択操作により指定されるものであっても構わない。
【0096】図12(a)に、音源推定ビームフォーマ
301での、A,B,Cの各音源に対する指向性(入力
方向の変化範囲)と雑音の入力方向との関係を示す。ま
た、図12(b),(c),(d)に、A,B,Cの各
音源に対して音源ビームフォーマA,B,Cがそれぞれ
生成された場合の、当該音源ビームフォーマA,B,
C、での、A,B,Cの各音源に対する指向性(入力方
向の変化範囲)と雑音の入力方向との関係を示す。
【0097】音源ビームフォーマAはA音源に対しての
み指向性を持ち、他の方向からの音声は雑音として抑圧
するように働く。同様に、音源ビームフォーマBはB音
源に対してのみ、音源ビームフォーマCはC音源に対し
てのみ、それぞれ指向性を持ち、他の方向からの音声は
雑音として抑圧するように働く。先に述べたように、既
に音源ビームフォーマiを生成しているi音源に対して
は2回目以降の音源ビームフォーマの生成は行わない。
また、i音源に対応する音源ビームフォーマiは、記憶
容量の許す限り生成できるものとし、一定時間その音源
からの発声がなければ削除される。
【0098】以上に述べた図9の構成の信号入力装置に
より、複数の目的音音源が存在してもそれぞれの音源の
音声を個別に抽出することが可能になる。ここで、各音
源ビームフォーマi内の生成情報記憶部305には生成
時刻、或いは生成番号が記憶されるので、前記したよう
に当該生成情報記憶部305の情報に基づいて、音源選
択部303により、例えば、最初に生成された音源ビー
ムフォーマの結果を採用するとか、最後に生成された音
源ビームフォーマの結果を採用するといったことが可能
となる。また、音源の音声毎に抽出した音声を音源選択
部303にて全て加算するならば、音源以外の雑音を除
去した音声を得ることができる。また、音源選択部30
3に音声認識装置を付加し、音源からの音声が人間の発
声である場合に、音源毎に音声認識装置へ入力して認識
処理を行わせるならば、認識結果が特定のキーワードで
あった周波数スペクトルだけを選択することが可能であ
る。同様に、周波数判別を行うことにより、特定の周波
数信号であった周波数スペクトルだけを選択することも
可能である。
【0099】次に、以上に述べた機能を持つ図9の信号
入力装置の全体の処理について、図13のフローチャー
トを参照して説明する。この処理はフレーム毎に行われ
るもので、まずステップS51の初期設定処理により、
音源推定ビームフォーマ301における目的音方向の追
尾範囲θc±θrが設定され(ここではθc=0゜,θr=
20゜)、これに応じて音源推定ビームフォーマ301
内の雑音方向推定部106の探索範囲φ1がθc+θr<
φ1<180゜+θc−θrと、−180゜+θc+θr<
φ1<θc−θrに、同じく音源推定ビームフォーマ30
1内の目的音方向推定部105の探索範囲φ2がθc−
θr<φ2<θc+θrに、それぞれ設定される。また、
目的音の入力方向θ1の初期値を0゜、雑音の入力方向
θ2の初期値を90゜とする。
【0100】次に、音源推定ビームフォーマ301内の
目的音ビームフォーマ103の処理を行って、音源推定
ビームフォーマ301内の雑音方向推定部106にて雑
音方向を推定し(ステップS52,S53)、雑音方向
がφ2の範囲内であれば(ステップS54)、音源推定
ビームフォーマ301内の雑音方向修正部110により
当該音源推定ビームフォーマ301内の雑音ビームフォ
ーマ104の入力方向を修正し(ステップS55)、そ
うでなければ、修正しない。
【0101】続いて、音源推定ビームフォーマ301内
の雑音ビームフォーマ104の処理に進み、当該音源推
定ビームフォーマ301内の目的音方向推定部105に
て目的音の方向(θmin)を推定する(ステップS5
6,S57)。推定された目的音の方向(θmin)がφ
1の範囲内でないならば(ステップS58)、つまりφ
2の範囲内であるならば、音源推定ビームフォーマ30
1内の目的音方向修正部109にて目的音ビームフォー
マ103の入力方向をθminだけ修正し(ステップS5
9)、ステップS60に進む。これに対し、推定された
目的音の方向(θmin)がφ1の範囲内であるならば
(ステップS58)、そのままステップS60に進む。
【0102】ステップS60では、音源推定ビームフォ
ーマ301内の継続時間判定部304にて音声到来の継
続時間、或いは音声非到来の継続時間が判定される。も
し、一定時間以上同じ方向からの音声の到来が継続して
いる場合には、その音声の音源iに対応した音源ビーム
フォーマiを、当該音源ビームフォーマiが生成されて
いないことを条件に、音源ビーム制御部302にて生成
する(ステップS61,S62)。
【0103】これに対し、既に生成してある音源ビーム
フォーマiが指向性を集中している方向(i音源の方
向)から、一定時間以上音声が到来しないことが判定さ
れた場合には、その音源ビームフォーマiを音源ビーム
制御部302にて削除する(ステップS63,S6
4)。なお、継続時間判定部304で判定する音声到来
の継続時間は、必ずしも連続して発せられる音声の継続
時間でなくてもよく、例えば断続的に発せられる音声で
もよい、なお、以上の各実施形態では、音声入力部10
1内のマイクロフォンの数が2個の場合について説明し
たが、マイクロフォン数は複数であればよく、3個以上
であっても構わない。
【0104】また、以上の各実施形態では、人が発声し
た音声を入力対象とする信号入力装置について説明した
が、本発明は、空間を伝搬する信号であれば、音声に限
らず、可視光線、赤外線、電波等の電磁波などの信号も
入力対象とすることが可能である。但し、この場合には
入力部に、マイクロフォンに代えて、受光器やアンテナ
等を用いる必要がある。なお、この入力部は信号入力装
置の構成要素とせずに、当該装置に外部接続して用いる
構成であっても構わない。
【0105】
【発明の効果】以上詳述したように本発明によれば、特
定のキーワード或いは特定周波数信号を任意の方向から
与えることで、指向性を集中する方向が変更されて、そ
の特定のキーワード或いは特定周波数信号が発せられた
方向に指向性を集中させることができるため、目的信号
の入力可能な方向を制限する必要がなくなり、任意の方
向から目的信号を入力できる。
【0106】また本発明によれば、目的信号の信号源が
複数存在する場合でも、その信号源から目的信号が発せ
られると、その信号源の方向に対してのみ指向性を持
ち、他の方向からの信号は雑音として抑圧するように働
く信号源ビームフォーマ処理手段が動的に生成されるた
め、任意の且つ複数の方向から目的信号を入力できる。
【図面の簡単な説明】
【図1】本発明の第1の実施形態に係る信号入力装置の
基本構成を示すブロック図。
【図2】図1中の目的音ビームフォーマ103及び雑音
ビームフォーマ104のブロック構成図と、当該ビーム
フォーマ103及び104による入力方向の設定を説明
するための図。
【図3】目的音方向推定部105及び雑音方向推定部1
06での方向推定処理を説明するためのフローチャー
ト。
【図4】図1中の方向雑音抽出部107の構成を示すブ
ロック図。
【図5】図1中の方向雑音判定部108の構成を示すブ
ロック図。
【図6】図1の構成の全体の処理を説明するためのフロ
ーチャート。
【図7】本発明の第2の実施形態に係る信号入力装置の
基本構成を示すブロック図。
【図8】図7の構成の全体の処理を説明するためのフロ
ーチャート。
【図9】本発明の第3の実施形態に係る信号入力装置の
基本構成を示すブロック図。
【図10】図9中の音源推定ビームフォーマ301の構
成を示すブロック図。
【図11】図9中の音源ビームフォーマi(i=A,
B,…n)の構成を示すブロック図。
【図12】音源推定ビームフォーマ301での、A,
B,Cの各音源に対する指向性(入力方向の変化範囲)
と雑音の入力方向との関係を示す図と、音源ビームフォ
ーマA,B,Cでの、A,B,Cの各音源に対する指向
性と雑音の入力方向との関係を示す図。
【図13】図9の構成の全体の処理を説明するためのフ
ローチャート。
【符号の説明】
101…音声入力部(信号量子化装置) 101a,101b…マイクロフォン 101c,101d…A/D変換部(ADC) 102…周波数分析部 103…目的音ビームフォーマ(第1の主ビームフォー
マ処理手段、第1の副ビームフォーマ処理手段) 104…雑音ビームフォーマ(第2の主ビームフォーマ
処理手段、第2の副ビームフォーマ処理手段) 105…目的音方向推定部(目的信号方向推定手段、主
目的信号方向推定手段、副目的信号方向推定手段) 106…雑音方向推定部(主雑音方向推定手段、副雑音
方向推定手段) 107…方向雑音抽出部 107a…適応フィルタ 108…方向雑音判定部 109…目的音方向修正部(目的信号方向修正手段、主
目的信号方向修正手段、副目的信号方向修正手段) 110…雑音方向修正部(主雑音方向修正手段、副雑音
方向修正手段) 201…駆動部 205…目的音方向推定部(目的信号方向推定手段、制
御手段) 206…雑音方向推定部 211…整相部 212…適応フィルタ 213…ビームフォーマ本体 301…音源推定ビームフォーマ(信号源推定ビームフ
ォーマ処理手段) 302…音源ビーム制御部(信号源ビーム制御手段) 303…音源選択部(信号源ビーム選択手段) 304…継続時間判定部 305…生成情報記憶部 A,B,C〜n,i…音源ビームフォーマ(信号源ビー
ムフォーマ処理手段)
───────────────────────────────────────────────────── フロントページの続き (72)発明者 小野木 智宏 東京都青梅市新町3丁目3番地の1 東芝 コンピュ―タエンジニアリング株式会社内 Fターム(参考) 5D015 DD02 EE05 5K052 AA01 BB23 DD01 EE12 EE40 FF02 FF31 9A001 BB06 EZ05 GZ03 GZ04 HH17 HH34

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】 空間を伝搬する信号を少なくとも2箇所
    の異なった位置で受信して量子化することで得られた量
    子化ディジタル信号を入力し、入力した各受信位置に対
    応する量子化ディジタル信号を複数の周波数帯域毎に周
    波数分析して各周波数帯域毎の周波数スペクトルを出力
    する周波数分析手段と、 前記各周波数帯域毎の周波数スペクトルを用いて適応フ
    ィルタ処理により目的信号以外の到来方向の信号の抑圧
    処理を行って目的信号を出力する第1のビームフォーマ
    処理手段と、 前記各周波数帯域毎の周波数スペクトルを用いて適応フ
    ィルタ処理により目的信号の到来方向の信号の抑圧処理
    を行って目的信号以外の雑音を出力する第2のビームフ
    ォーマ処理手段と、 前記第1のビームフォーマ処理手段で計算される適応フ
    ィルタ係数から雑音の方向を推定する雑音方向推定手段
    と、 前記第2のビームフォーマ処理手段で計算される適応フ
    ィルタ係数から目的信号の方向を推定する目的信号方向
    推定手段と、 前記第1のビームフォーマ処理手段で計算される周波数
    スペクトルと前記第2のビームフォーマ処理手段で計算
    される周波数スペクトルを用いて雑音到来方向からの雑
    音を抽出する方向雑音抽出手段と、 前記方向雑音抽出手段によって抽出された雑音が特定の
    キーワード或いは特定周波数信号であるか否かを判定す
    る方向雑音判定手段と、 前記第1のビームフォーマ処理手段において入力対象と
    する目的信号の到来方向である第1の入力方向を、前記
    目的信号方向推定手段で推定された目的信号方向に基づ
    いて逐次修正する一方、前記方向雑音抽出手段によって
    抽出された雑音が前記特定のキーワード或いは特定周波
    数信号であると前記方向雑音判定手段により判定された
    場合には、その特定のキーワード或いは特定周波数信号
    を発した方向が目的信号方向となるように前記第1の入
    力方向を修正する目的信号方向修正手段と、 前記第2のビームフォーマ処理手段において入力対象と
    する雑音の到来方向である第2の入力方向を、前記雑音
    方向推定手段で推定された雑音方向に基づいて逐次修正
    する一方、前記方向雑音抽出手段によって抽出された雑
    音が前記特定のキーワード或いは特定周波数信号である
    と前記方向雑音判定手段により判定された場合には、そ
    の特定のキーワード或いは特定周波数信号を発した方向
    が目的信号方向となるように前記第2の入力方向を修正
    する雑音方向修正手段とを具備することを特徴とする信
    号入力装置。
  2. 【請求項2】 空間を伝搬する信号を少なくとも2箇所
    の異なった位置で受信して量子化する信号量子化装置
    と、 前記信号量子化装置によって量子化された前記各受信位
    置に対応する信号を複数の周波数帯域毎に周波数分析し
    て各周波数帯域毎の周波数スペクトルを出力する周波数
    分析手段と、 前記各周波数帯域毎の周波数スペクトルを用いて適応フ
    ィルタ処理により目的信号以外の到来方向の信号の抑圧
    処理を行って目的信号を出力する第1のビームフォーマ
    処理手段と、 前記各周波数帯域毎の周波数スペクトルを用いて適応フ
    ィルタ処理により目的信号の到来方向の信号の抑圧処理
    を行って目的信号以外の雑音を出力する第2のビームフ
    ォーマ処理手段と、 前記第1のビームフォーマ処理手段で計算される適応フ
    ィルタ係数から雑音の方向を推定する雑音方向推定手段
    と、 前記第2のビームフォーマ処理手段で計算される適応フ
    ィルタ係数から目的信号の方向を推定する目的信号方向
    推定手段と、 前記第1のビームフォーマ処理手段で計算される周波数
    スペクトルと前記第2のビームフォーマ処理手段で計算
    される周波数スペクトルを用いて雑音到来方向からの雑
    音を抽出する方向雑音抽出手段と、 前記方向雑音抽出手段によって抽出された雑音が特定の
    キーワード或いは特定周波数信号であるか否かを判定す
    る方向雑音判定手段と、 前記第1のビームフォーマ処理手段において入力対象と
    する目的信号の到来方向である第1の入力方向を、前記
    目的信号方向推走手段で推定された目的信号方向に基づ
    いて逐次修正する目的信号方向修正手段と、 前記第2のビームフォーマ処理手段において入力対象と
    する雑音の到来方向である第2の入力方向を、前記雑音
    方向推定手段で推定された雑音方向に基づいて逐次修正
    する雑音方向修正手段と、 前記方向雑音抽出手段によって抽出された雑音が前記特
    定のキーワード或いは特定周波数信号であると前記方向
    雑音判定手段により判定された場合に、その特定のキー
    ワード或いは特定周波数信号を発した方向が目的信号方
    向となるように、前記信号量子化装置を駆動する駆動手
    段とを具備することを特徴とする信号入力装置。
  3. 【請求項3】 空間を伝搬する信号を少なくとも2箇所
    の異なった位置で受信して量子化することで得られた量
    子化ディジタル信号を入力し、入力した各受信位置に対
    応する量子化ディジタル信号を複数の周波数帯域毎に周
    波数分析して各周波数帯域毎の周波数スペクトルを出力
    する周波数分析手段と、 前記各周波数帯域毎の周波数スペクトルを用いて適応フ
    ィルタ処理により目的信号以外の到来方向の信号の抑圧
    処理を行って目的信号を出力する第1の主ビームフォー
    マ処理手段と、 前記各周波数帯域毎の周波数スペクトルを用いて適応フ
    ィルタ処理により目的信号の到来方向の信号の抑圧処理
    を行って目的信号以外の雑音を出力する第2の主ビーム
    フォーマ処理手段と、 前記第1の主ビームフォーマ処理手段で計算される適応
    フィルタ係数から雑音の方向を推定する主雑音方向推定
    手段と、 前記第2の主ビームフォーマ処理手段で計算される適応
    フィルタ係数から目的信号の方向を推定する主目的信号
    方向推定手段と、 前記第1の主ビームフォーマ処理手段において入力対象
    とする目的信号の到来方向である第1の主入力方向を、
    前記主目的信号方向推定手段で推定された目的信号方向
    に基づいて逐次修正する主目的信号方向修正手段と、 前記第2の主ビームフォーマ処理手段において入力対象
    とする雑音の到来方向である第2の主入力方向を、前記
    主雑音方向推定手段で推定された雑音方向に基づいて逐
    次修正する主雑音方向修正手段と、 前記主目的信号推定手段によって推定された目的信号方
    向の信号源に対して指向性を集中させるために、前記各
    周波数帯域毎の周波数スペクトルを用いて適応フィルタ
    処理により該当する目的信号以外の到来方向の信号の抑
    圧処理を行って目的信号を出力する第1の副ビームフォ
    ーマ処理手段、前記各周波数帯域毎の周波数スペクトル
    を用いて適応フィルタ処理により目的信号の到来方向の
    信号の抑圧処理を行って目的信号以外の雑音を出力する
    第2の副ビームフォーマ処理手段、前記第1の副ビーム
    フォーマ処理手段で計算される適応フィルタ係数から雑
    音の方向を推定する副雑音方向推定手段、前記第2の副
    ビームフォーマ処理手段で計算される適応フィルタ係数
    から目的信号の方向を推定する副目的信号方向推定手
    段、前記第1の副ビームフォーマ処理手段において入力
    対象とする目的信号の到来方向である第1の副入力方向
    を、前記副目的信号方向推定手段で推定された目的信号
    方向に基づいて逐次修正する副目的信号方向修正手段、
    及び前記第2の副ビームフォーマ処理手段において入力
    対象とする雑音の到来方向である第2の副入力方向を、
    前記副雑音方向推定手段で推定された雑音方向に基づい
    て逐次修正する副雑音方向修正手段の各機能要素を有す
    る信号源ビームフォーマ処理手段を動的に生成する信号
    源ビーム制御手段と、 前記信号源ビーム制御手段により生成されている前記信
    号源ビームフォーマ処理手段の出力する信号源方向の周
    波数スペクトルのうちの少なくとも1つを選択する信号
    源ビーム選択手段とを具備することを特徴とする信号入
    力装置。
  4. 【請求項4】 前記主目的信号推定手段によって推定さ
    れた目的信号方向からの信号到来が一定時間以上継続す
    る特定状態を検出する継続時間判定手段を更に具備し、 前記信号源ビーム制御手段は、前記継続時間判定手段に
    よる前記特定状態の検出に応じて前記信号源ビームフォ
    ーマ処理手段の生成を行うことを特徴とする請求項3記
    載の信号入力装置。
  5. 【請求項5】 前記主目的信号推定手段によって推定さ
    れた目的信号方向からの信号到来が一定時間以上継続す
    る第1の状態と、前記目的信号方向からの信号到来が一
    定時間以上ない第2の状態とを検出する継続時間判定手
    段を更に具備し、 前記信号源ビーム制御手段は、前記継続時間判定手段に
    よる前記第1の状態の検出に応じて前記信号源ビームフ
    ォーマ処理手段の生成を行い、前記継続時間判定手段に
    よる前記第2の状態の検出に応じて、その際の信号到来
    方向と同一方向を目的信号到来方向とする前記信号源ビ
    ームフォーマ処理手段を削除することを特徴とする請求
    項3記載の信号入力装置。
  6. 【請求項6】 前記信号源ビーム選択手段は、前記信号
    源ビーム制御手段により生成されている前記信号源ビー
    ムフォーマ処理手段のうち、最も最近にまたは最も以前
    に生成された信号源ビームフォーマ処理手段から出力さ
    れる信号源方向の周波数スペクトルを選択して出力する
    ことを特徴とする請求項3記載の信号入力装置。
  7. 【請求項7】 前記信号源ビーム選択手段は、前記信号
    源ビーム制御手段により生成されている前記信号源ビー
    ムフォーマ処理手段の出力する信号源方向の周波数スペ
    クトルを全て選択し、それらを加算して出力することを
    特徴とする請求項3記載の信号入力装置。
  8. 【請求項8】 前記信号源ビーム選択手段は、前記信号
    源ビーム制御手段により生成されている前記信号源ビー
    ムフォーマ処理手段の出力する信号源方向の周波数スペ
    クトルのうち、特定のキーワードの周波数スペクトル或
    いは特定の周波数信号の周波数スペクトルを選択して出
    力することを特徴とする請求項3記載の信号入力装置。
  9. 【請求項9】 コンピュータを、 空間を伝搬する信号を少なくとも2箇所の異なった位置
    で受信して量子化することで得られた量子化ディジタル
    信号を入力し、入力した各受信位置に対応する量子化デ
    ィジタル信号を複数の周波数帯域毎に周波数分析して各
    周波数帯域毎の周波数スペクトルを出力する周波数分析
    手段と、 前記各周波数帯域毎の周波数スペクトルを用いて適応フ
    ィルタ処理により目的信号以外の到来方向の信号の抑圧
    処理を行って目的信号を出力する第1のビームフォーマ
    処理手段と、 前記各周波数帯域毎の周波数スペクトルを用いて適応フ
    ィルタ処理により目的信号の到来方向の信号の抑圧処理
    を行って目的信号以外の雑音を出力する第2のビームフ
    ォーマ処理手段と、 前記第1のビームフォーマ処理手段で計算される適応フ
    ィルタ係数から雑音の方向を推定する雑音方向推定手段
    と、 前記第2のビームフォーマ処理手段で計算される適応フ
    ィルタ係数から目的信号の方向を推定する目的信号方向
    推定手段と、 前記第1のビームフォーマ処理手段で計算される周波数
    スペクトルと前記第2のビームフォーマ処理手段で計算
    される周波数スペクトルを用いて雑音到来方向からの雑
    音を抽出する方向雑音抽出手段と、 前記方向雑音抽出手段によって抽出された雑音が特定の
    キーワード或いは特定周波数信号であるか否かを判定す
    る方向雑音判定手段と 前記第1のビームフォーマ処理手段において入力対象と
    する目的信号の到来方向である第1の入力方向を、前記
    目的信号方向推定手段で推定された目的信号方向に基づ
    いて逐次修正する一方、前記方向雑音抽出手段によって
    抽出された雑音が前記特定のキーワード或いは特定周波
    数信号であると前記方向雑音判定手段により判定された
    場合には、その特定のキーワード或いは特定周波数信号
    を発した方向が目的信号方向となるように前記第1の入
    力方向を修正する目的信号方向修正手段と、 前記第2のビームフォーマ処理手段において入力対象と
    する雑音の到来方向である第2の入力方向を、前記雑音
    方向推定手段で推定された雑音方向に基づいて逐次修正
    する一方、前記方向雑音抽出手段によって抽出された雑
    音が前記特定のキーワード或いは特定周波数信号である
    と前記方向雑音判定手段により判定された場合には、そ
    の特定のキーワード或いは特定周波数信号を発した方向
    が目的信号方向となるように前記第2の入力方向を修正
    する雑音方向修正手段として機能させるためのプログラ
    ムを記録した機械読み取り可能な記録媒体。
  10. 【請求項10】 コンピュータを、 空間を伝搬する信号を信号量子化装置により少なくとも
    2箇所の異なった位置で受信して量子化することで得ら
    れた量子化ディジタル信号を入力し、入力した各受信位
    置に対応する量子化ディジタル信号を複数の周波数帯域
    毎に周波数分析して各周波数帯域毎の周波数スペクトル
    を出力する周波数分析手段と、 前記各周波数帯域毎の周波数スペクトルを用いて適応フ
    ィルタ処理により目的信号以外の到来方向の信号の抑圧
    処理を行って目的信号を出力する第1のビームフォーマ
    処理手段と、 前記各周波数帯域毎の周波数スペクトルを用いて適応フ
    ィルタ処理により目的信号の到来方向の信号の抑圧処理
    を行って目的信号以外の雑音を出力する第2のビームフ
    ォーマ処理手段と、 前記第1のビームフォーマ処理手段で計算される適応フ
    ィルタ係数から雑音の方向を推定する雑音方向推定手段
    と、 前記第2のビームフォーマ処理手段で計算される適応フ
    ィルタ係数から目的信号の方向を推定する目的信号方向
    推定手段と、 前記第1のビームフォーマ処理手段で計算される周波数
    スペクトルと前記第2のビームフォーマ処理手段で計算
    される周波数スペクトルを用いて雑音到来方向からの雑
    音を抽出する方向雑音抽出手段と、 前記方向雑音抽出手段によって抽出された雑音が特定の
    キーワード或いは特定周波数信号であるか否かを判定す
    る方向雑音判定手段と、 前記第1のビームフォーマ処理手段において入力対象と
    する目的信号の到来方向である第1の入力方向を、前記
    目的信号方向推走手段で推定された目的信号方向に基づ
    いて逐次修正する目的信号方向修正手段と、 前記第2のビームフォーマ処理手段において入力対象と
    する雑音の到来方向である第2の入力方向を、前記雑音
    方向推定手段で推定された雑音方向に基づいて逐次修正
    する雑音方向修正手段と、 前記方向雑音抽出手段によって抽出された雑音が前記特
    定のキーワード或いは特定周波数信号であると前記方向
    雑音判定手段により判定された場合に、その特定のキー
    ワード或いは特定周波数信号を発した方向が目的信号方
    向となるように、前記信号量子化装置を駆動手段により
    駆動させる制御手段として機能させるためのプログラム
    を記録した機械読み取り可能な記録媒体。
  11. 【請求項11】 コンピュータを、 空間を伝搬する信号を少なくとも2箇所の異なった位置
    で受信して量子化することで得られた量子化ディジタル
    信号を入力し、入力した各受信位置に対応する量子化デ
    ィジタル信号を複数の周波数帯域毎に周波数分析して各
    周波数帯域毎の周波数スペクトルを出力する周波数分析
    手段と、 前記各周波数帯域毎の周波数スペクトルを用いて適応フ
    ィルタ処理により目的信号以外の到来方向の信号の抑圧
    処理を行って目的信号を出力する第1の主ビームフォー
    マ処理手段と、 前記各周波数帯域毎の周波数スペクトルを用いて適応フ
    ィルタ処理により目的信号の到来方向の信号の抑圧処理
    を行って目的信号以外の雑音を出力する第2の主ビーム
    フォーマ処理手段と、 前記第1の主ビームフォーマ処理手段で計算される適応
    フィルタ係数から雑音の方向を推定する主雑音方向推定
    手段と、 前記第2の主ビームフォーマ処理手段で計算される適応
    フィルタ係数から目的信号の方向を推定する主目的信号
    方向推定手段と、 前記第1の主ビームフォーマ処理手段において入力対象
    とする目的信号の到来方向である第1の主入力方向を、
    前記主目的信号方向推定手段で推定された目的信号方向
    に基づいて逐次修正する主目的信号方向修正手段と、 前記第2の主ビームフォーマ処理手段において入力対象
    とする雑音の到来方向である第2の主入力方向を、前記
    主雑音方向推定手段で推定された目的信号方向に基づい
    て逐次修正する主雑音方向修正手段と、 前記主目的信号推定手段によって推定された目的信号方
    向の信号源に対して指向性を集中させるために、前記各
    周波数帯域毎の周波数スペクトルを用いて適応フィルタ
    処理により該当する目的信号以外の到来方向の信号の抑
    圧処理を行って目的信号を出力する第1の副ビームフォ
    ーマ処理手段、前記各周波数帯域毎の周波数スペクトル
    を用いて適応フィルタ処理により目的信号の到来方向の
    信号の抑圧処理を行って目的信号以外の雑音を出力する
    第2の副ビームフォーマ処理手段、前記第1の副ビーム
    フォーマ処理手段で計算される適応フィルタ係数から雑
    音の方向を推定する副雑音方向推定手段、前記第2の副
    ビームフォーマ処理手段で計算される適応フィルタ係数
    から目的信号の方向を推定する副目的信号方向推定手
    段、前記第1の副ビームフォーマ処理手段において入力
    対象とする目的信号の到来方向である第1の副入力方向
    を、前記副目的信号方向推定手段で推定された目的信号
    方向に基づいて逐次修正する副目的信号方向修正手段、
    及び前記第2の副ビームフォーマ処理手段において入力
    対象とする雑音の到来方向である第2の副入力方向を、
    前記副雑音方向推定手段で推定された雑音方向に基づい
    て逐次修正する副雑音方向修正手段の各機能要素を有す
    る信号源ビームフォーマ処理手段を動的に生成する信号
    源ビーム制御手段と、 前記信号源ビーム制御手段により生成されている前記信
    号源ビームフォーマ処理手段の出力する信号源方向の周
    波数スペクトルのうちの少なくとも1つを選択する信号
    源ビーム選択手段として機能させるためのプログラムを
    記録した機械読み取り可能な記録媒体。
  12. 【請求項12】 空間を伝搬する信号を少なくとも2箇
    所の異なった位置で受信して量子化することで得られた
    量子化ディジタル信号を入力し、入力した各受信位置に
    対応する量子化ディジタル信号を複数の周波数帯域毎に
    周波数分析して各周波数帯域毎の周波数スペクトルを出
    力するステップと、 前記各周波数帯域毎の周波数スペクトルを用いて適応フ
    ィルタ処理により目的信号以外の到来方向の信号の抑圧
    処理を行って目的信号の周波数スペクトルを出力する第
    1のビームフォーマ処理を行うステップと、 前記第1のビームフォーマ処理で計算される適応フィル
    タ係数から雑音の方向を推定するステップと、 前記推定された雑音方向が目的信号の追尾範囲内にある
    場合に、前記各周波数帯域毎の周波数スペクトルを用い
    て適応フィルタ処理により目的信号の到来方向の信号の
    抑圧処理を行って目的信号以外の雑音の周波数スペクト
    ルを出力する第2のビームフォーマ処理において入力対
    象とする雑音の到来方向である第2の入力方向を、前記
    推定された雑音方向に基づいて修正するステップと、 前記推定された雑音方向が目的信号の追尾範囲内にある
    場合には、前記第2の入力方向の修正後に、前記推定さ
    れた雑音方向が目的信号の追尾範囲外にある場合にはそ
    のまま前記第2のビームフォーマ処理を行うステップ
    と、 前記第2のビームフォーマ処理で計算される適応フィル
    タ係数から目的信号の方向を推定するステップと、 前記推定された目的信号方向が目的信号の追尾範囲内に
    ある場合に、前記第1のビームフォーマ処理において入
    力対象とする目的信号の到来方向である第1の入力方向
    を、前記推定された目的信号方向に基づいて修正するス
    テップと、 前記推定された目的信号方向が目的信号の追尾範囲内に
    ない場合に、前記第1のビームフォーマ処理で計算され
    る周波数スペクトルと前記第2のビームフォーマ処理で
    計算される周波数スペクトルを用いて雑音到来方向から
    の雑音を抽出するステップと、 前記抽出された雑音が特定のキーワード或いは特定周波
    数信号であるか否かを判定するステップと、 前記抽出された雑音が特定のキーワード或いは特定周波
    数信号であると判定された場合には、当該特定のキーワ
    ード或いは特定周波数信号を発した方向が目的信号方向
    となるように前記第1の入力方向及び前記第2の入力方
    向を修正するステップとを具備することを特徴とする信
    号入力方法。、
JP10356015A 1998-12-15 1998-12-15 ビームフォーマを用いた信号入力装置及び信号入力用プログラムを記録した記録媒体 Withdrawn JP2000181498A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10356015A JP2000181498A (ja) 1998-12-15 1998-12-15 ビームフォーマを用いた信号入力装置及び信号入力用プログラムを記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10356015A JP2000181498A (ja) 1998-12-15 1998-12-15 ビームフォーマを用いた信号入力装置及び信号入力用プログラムを記録した記録媒体

Publications (1)

Publication Number Publication Date
JP2000181498A true JP2000181498A (ja) 2000-06-30

Family

ID=18446901

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10356015A Withdrawn JP2000181498A (ja) 1998-12-15 1998-12-15 ビームフォーマを用いた信号入力装置及び信号入力用プログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JP2000181498A (ja)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002311990A (ja) * 2000-12-19 2002-10-25 Hewlett Packard Co <Hp> 音声制御式機器の活動化方法およびシステム
JP2006094522A (ja) * 2004-09-23 2006-04-06 Harman Becker Automotive Systems Gmbh ノイズ低減による多重チャンネル適応の音声信号処理
WO2007123047A1 (ja) * 2006-04-20 2007-11-01 Nec Corporation 適応アレイ制御装置、方法、プログラム、及びこれを利用した適応アレイ処理装置、方法、プログラム
WO2007123052A1 (ja) * 2006-04-20 2007-11-01 Nec Corporation 適応アレイ制御装置、方法、プログラム、及び適応アレイ処理装置、方法、プログラム
WO2007123048A1 (ja) * 2006-04-20 2007-11-01 Nec Corporation 適応アレイ制御装置、方法、プログラム、及びこれを利用した適応アレイ処理装置、方法、プログラム
WO2007123051A1 (ja) * 2006-04-20 2007-11-01 Nec Corporation 適応アレイ制御装置、方法、プログラム、及び適応アレイ処理装置、方法、プログラム
JP2008193420A (ja) * 2007-02-05 2008-08-21 Sony Corp ヘッドフォン装置、音声再生システム、音声再生方法
US7680287B2 (en) 2002-09-17 2010-03-16 Kabushiki Kaisha Toshiba Directional setting apparatus, directional setting system, directional setting method and directional setting program
US7852369B2 (en) * 2002-06-27 2010-12-14 Microsoft Corp. Integrated design for omni-directional camera and microphone array
WO2012070671A1 (ja) * 2010-11-24 2012-05-31 日本電気株式会社 信号処理装置、信号処理方法、及び信号処理プログラム
JP2017153065A (ja) * 2016-02-25 2017-08-31 パナソニック株式会社 音声認識方法、音声認識装置及びプログラム
JP2019029861A (ja) * 2017-07-31 2019-02-21 日本電信電話株式会社 音響信号処理装置、方法及びプログラム
JP2020505648A (ja) * 2017-01-28 2020-02-20 ボーズ・コーポレーションBose Corporation オーディオデバイスフィルタの変更
JP2022509903A (ja) * 2018-10-26 2022-01-25 フェイスブック・テクノロジーズ・リミテッド・ライアビリティ・カンパニー 環境トリガに基づく適応的anc

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002311990A (ja) * 2000-12-19 2002-10-25 Hewlett Packard Co <Hp> 音声制御式機器の活動化方法およびシステム
US7852369B2 (en) * 2002-06-27 2010-12-14 Microsoft Corp. Integrated design for omni-directional camera and microphone array
US7680287B2 (en) 2002-09-17 2010-03-16 Kabushiki Kaisha Toshiba Directional setting apparatus, directional setting system, directional setting method and directional setting program
JP2006094522A (ja) * 2004-09-23 2006-04-06 Harman Becker Automotive Systems Gmbh ノイズ低減による多重チャンネル適応の音声信号処理
US8194872B2 (en) 2004-09-23 2012-06-05 Nuance Communications, Inc. Multi-channel adaptive speech signal processing system with noise reduction
JP4973657B2 (ja) * 2006-04-20 2012-07-11 日本電気株式会社 適応アレイ制御装置、方法、プログラム、及び適応アレイ処理装置、方法、プログラム
JP4973656B2 (ja) * 2006-04-20 2012-07-11 日本電気株式会社 適応アレイ制御装置、方法、プログラム、及び適応アレイ処理装置、方法、プログラム
WO2007123051A1 (ja) * 2006-04-20 2007-11-01 Nec Corporation 適応アレイ制御装置、方法、プログラム、及び適応アレイ処理装置、方法、プログラム
WO2007123048A1 (ja) * 2006-04-20 2007-11-01 Nec Corporation 適応アレイ制御装置、方法、プログラム、及びこれを利用した適応アレイ処理装置、方法、プログラム
US8014230B2 (en) 2006-04-20 2011-09-06 Nec Corporation Adaptive array control device, method and program, and adaptive array processing device, method and program using the same
US8106827B2 (en) 2006-04-20 2012-01-31 Nec Corporation Adaptive array control device, method and program, and adaptive array processing device, method and program
US8174935B2 (en) 2006-04-20 2012-05-08 Nec Corporation Adaptive array control device, method and program, and adaptive array processing device, method and program using the same
WO2007123052A1 (ja) * 2006-04-20 2007-11-01 Nec Corporation 適応アレイ制御装置、方法、プログラム、及び適応アレイ処理装置、方法、プログラム
JP4973655B2 (ja) * 2006-04-20 2012-07-11 日本電気株式会社 適応アレイ制御装置、方法、プログラム、及びこれを利用した適応アレイ処理装置、方法、プログラム
WO2007123047A1 (ja) * 2006-04-20 2007-11-01 Nec Corporation 適応アレイ制御装置、方法、プログラム、及びこれを利用した適応アレイ処理装置、方法、プログラム
US8184823B2 (en) 2007-02-05 2012-05-22 Sony Corporation Headphone device, sound reproduction system, and sound reproduction method
JP2008193420A (ja) * 2007-02-05 2008-08-21 Sony Corp ヘッドフォン装置、音声再生システム、音声再生方法
WO2012070671A1 (ja) * 2010-11-24 2012-05-31 日本電気株式会社 信号処理装置、信号処理方法、及び信号処理プログラム
CN103250208A (zh) * 2010-11-24 2013-08-14 日本电气株式会社 信号处理装置、信号处理方法和信号处理程序
US9030240B2 (en) 2010-11-24 2015-05-12 Nec Corporation Signal processing device, signal processing method and computer readable medium
JP2017153065A (ja) * 2016-02-25 2017-08-31 パナソニック株式会社 音声認識方法、音声認識装置及びプログラム
JP2020505648A (ja) * 2017-01-28 2020-02-20 ボーズ・コーポレーションBose Corporation オーディオデバイスフィルタの変更
JP2019029861A (ja) * 2017-07-31 2019-02-21 日本電信電話株式会社 音響信号処理装置、方法及びプログラム
JP2022509903A (ja) * 2018-10-26 2022-01-25 フェイスブック・テクノロジーズ・リミテッド・ライアビリティ・カンパニー 環境トリガに基づく適応的anc
US11869475B1 (en) 2018-10-26 2024-01-09 Meta Platforms Technologies, Llc Adaptive ANC based on environmental triggers

Similar Documents

Publication Publication Date Title
CN110070882B (zh) 语音分离方法、语音识别方法及电子设备
US10149049B2 (en) Processing speech from distributed microphones
JP4163294B2 (ja) 雑音抑圧処理装置および雑音抑圧処理方法
US9269367B2 (en) Processing audio signals during a communication event
US5208864A (en) Method of detecting acoustic signal
KR100316116B1 (ko) 잡음감소시스템및장치와,이동무선국
US7158645B2 (en) Orthogonal circular microphone array system and method for detecting three-dimensional direction of sound source using the same
JP2000181498A (ja) ビームフォーマを用いた信号入力装置及び信号入力用プログラムを記録した記録媒体
JP5070873B2 (ja) 音源方向推定装置、音源方向推定方法、及びコンピュータプログラム
CN110610718B (zh) 一种提取期望声源语音信号的方法及装置
JP6169910B2 (ja) 音声処理装置
CN113113034A (zh) 用于平面麦克风阵列的多源跟踪和语音活动检测
JP2002062348A (ja) 信号処理装置及び信号処理方法
TW202147862A (zh) 強烈雜訊干擾存在下穩健的揚聲器定位系統與方法
US20220109929A1 (en) Cascaded adaptive interference cancellation algorithms
CN109270493B (zh) 声源定位方法和装置
WO2021093798A1 (zh) 用于选择麦克风阵列的输出波束的方法
US11727926B1 (en) Systems and methods for noise reduction
CN110992967A (zh) 一种语音信号处理方法、装置、助听器及存储介质
US20080120100A1 (en) Method For Detecting Target Sound, Method For Detecting Delay Time In Signal Input, And Sound Signal Processor
US11647344B2 (en) Hearing device with end-to-end neural network
Kim Hearing aid speech enhancement using phase difference-controlled dual-microphone generalized sidelobe canceller
CN113223544A (zh) 音频的方向定位侦测装置及方法以及音频处理系统
US10887709B1 (en) Aligned beam merger
JP2913105B2 (ja) 音響信号検出方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20051104

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20060809

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20060814

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061002