JP2003271189A - 話者方向検出回路及びその検出方法 - Google Patents

話者方向検出回路及びその検出方法

Info

Publication number
JP2003271189A
JP2003271189A JP2002069397A JP2002069397A JP2003271189A JP 2003271189 A JP2003271189 A JP 2003271189A JP 2002069397 A JP2002069397 A JP 2002069397A JP 2002069397 A JP2002069397 A JP 2002069397A JP 2003271189 A JP2003271189 A JP 2003271189A
Authority
JP
Japan
Prior art keywords
evaluation function
circuit
speaker
microphones
direction detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002069397A
Other languages
English (en)
Inventor
Tsugumitsu Tomotake
世光 友竹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nef KK
Original Assignee
Nef KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nef KK filed Critical Nef KK
Priority to JP2002069397A priority Critical patent/JP2003271189A/ja
Publication of JP2003271189A publication Critical patent/JP2003271189A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Abstract

(57)【要約】 【課題】 話者位置の誤検出を従来よりも低減させるこ
と。 【解決手段】 マイクロホン1、4の入力信号を線形予
測回路2、5へ入力して声道の影響を取り除いた信号を
生成し、その信号を評価関数演算回路8へ入力して評価
関数演算を行う。又、マイクロホン1,4の入力を基
に、ゼロ交差回数検出回路11によって得られた、ゼロ
交差回数情報を基に有音/雑音判定回路10により、あ
る音源からマイクロフォンに入力されたものが、雑音に
よるものか、発声者によるものか判定する。発声者によ
るものと判定された場合、方向検出回路9は評価関数演
算回路8からの演算結果に基づき話者方向検出を行う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は話者方向検出回路及
びその検出方法に関し、特にテレビジョン会議装置の様
に画像入力用ビデオカメラと音声入力用マイクロホンを
有し、設置場所が固定されている装置のビデオカメラ撮
像角制御のための話者方向検出回路及びその検出方法に
関する。
【0002】
【従来の技術】従来、2つのマイクロホンの到達時間差
(遅延)を検出する手段として、相互相関関数が一般に
用いられている。この関数を算出して、その最大値の与
える到達時間差(遅延)が検出でき、この時間差(遅
延)により、音波の到達方向が推定できることが一般に
知られている(後述する図5及び図6参照)。
【0003】音波の到達方向と、複数のマイクロホンで
受信した信号の時間差とは、一対一の関係にあるため、
この時間差を推定できれば音波の到達方向が推定できる
ことがよく知られている。
【0004】図8は複数のマイクロホンで受信した信号
の時間差の理論を示す図である。同図を参照し、θs方
向から到達する音波を平面波として考え、距離dだけ離
れて設置された2つのマイクロホンM1,M2でその音
波を受信すると考える。この時に各マイクロホンM1,
M2の受信信号χ1(t)とχ2(t)との関係には、 χ2(t)=χ1(t−τs) τs=(d×sin(θs)/c) c:音速 という関係が成立する。
【0005】従って、逆に信号χ1(t)とχ2(t)
の間の時間差τsが分かれば、波の到達方向θsは次式
で求められる。 θs=sin-1(c・τs/d) 時間差τsは、χ1(t)とχ2(t)との相互相関関
数φ12(τ)から、 φ12(τ)=Ε(χ1(t)・χ2(t+τ)) =Ε(χ1(t)・χ1(t+τ−τs))=φ11(τ−τs) となる。
【0006】ただし、E(χ1(t)・χ2(t+
τ))は期待値を表し、φ11(τ)はχ1(t)の自
己相関を表す。自己相関関数φ11(τ)はτ=0で最
大をとることが知られているため、φ12(τ)はτ=
τsで最大値をとる。
【0007】このことより、相互相関関数φ12(τ)
を計算し、その最大値を与えるτを求めればτsが得ら
れ、その値を到達方向θsを求める式に代入すれば、音
波の方向を推定する事ができる。従って、この推定結果
から到達遅延時間を求め、話者方向に換算して出力する
という動作をする。
【0008】相互相関関数φ12(τ)は、周波数帯域
幅が広い場合は、比較的、鋭いピークを持つことが既に
知られている。よって、このようにピークが鋭い場合
は、雑音等が重畳しても精度の良いτsを推定できる。
しかしながら、ピークの鋭さは音波信号の周波数帯域幅
に影響を受けるし、雑音の影響もあるため、何らかの方
法で、誤りの影響を排除する必要がある。
【0009】特願2000−045306号(話者方向
検出回路及びそれに用いる話者方向検出方法)に提案さ
れているように、上記誤りの影響を低減する方法とし
て、2つのマイクロホンの到達時間差(遅延)の算出
に、自己相関関数と相互相関関数の関係式を用いた評価
関数を用いている。この方法は、上記の相互相関関数の
値に時間的な統計処理を施しており、到達時間差(遅
延)を相互相関関数で検出する手段より誤検出を低減し
ている。
【0010】
【発明が解決しようとする課題】話者方向検出装置の出
力信号を用いてビデオカメラの撮像角を制御しようとし
た場合、話者方向の検出誤りが発生すると、話者以外の
方向にビデオカメラが向いてしまい、テレビジョン会議
装置の利用者に多大な不都合が生じるという問題があっ
た。
【0011】所で、話者方向検装置を小型化する場合マ
イクロホン間隔が特に広くはないので、それぞれのマイ
クロホンに入力される音声サンプルの波形の関係は、遅
延等は存在するもの、同一の音源からの物であり、ほぼ
同じ波形とみなすことができる。
【0012】よって、2マクロホン入力の相互相関結果
は、1マイクロホンの入力と見なした場合、遅延を含ん
だ自己相関と近似することができる。自己相関をピッチ
検出方法に用いる場合があることは当業界では一般的に
知られており、一般に、音声波形には駆動音源情報と声
道情報が混在しているため、声道の影響を取り除いてか
らピッチ検出を行った方が抽出誤りが少なくなることが
知られている。
【0013】言い換えると、声道情報を差し引いた方
が、自己相関の精度は増すことになる。よって、声道の
影響を取り除いたほうが、自己相関は当然の事、1マイ
クロホンの自己相関と見なした2マイクロホンの相互相
関の正確性も増すことになる。これにより、評価結果の
精度がよくなり、方向検出の精度も向上する。
【0014】当業界においては、音声スペクトルは、比
較的ゆっくり変化するスペクトル包絡と短時間で変化す
るスペクトル微細構造に分離でき、前者が声道の共振特
性に、後者が駆動音源特性に対応していることが良く知
られいる。
【0015】又、線形予測分析後の残差信号は、平たん
なスペクトル包絡特性を持ち、駆動音源に基づくスペク
トルの微細構造情報のみを持っていることも知られてい
る。よって、結果的に線形予測分析後の残差信号は声道
の影響が取り除かれることは容易に理解できる。
【0016】又、前述の特願2000−045306号
に提案されているように、相互相関関数と自己相関関数
の関係式を用いた評価関数は、相互相関の2乗/自己相
関であるが、マイクロホンの入力信号レベルが小さい場
合、評価関数の結果自体は、相互相関の値も相対的に小
さくなり、又、自己相関の値も小さくなるが、評価関数
の式において、割り算で割られる値も割る値も相対的に
小さくなるので、結果の値自体は特に小さくなることは
ない。
【0017】しかしながら、入力レベルが相対的に小さ
いということは、周囲雑音の影響が強くなり、周囲雑音
の発生源の方向を示す場合、要するに誤検出する確率が
高くなる。よって、現実的には、入力された音声信号
が、話者から発声された声か、周囲雑音かを判定し、方
向検出制御を止める手段が有効となる。
【0018】前述の特願2000−045306号に提
案されている方法では、マイクロホンの入力信号又は、
この入力信号から算出される自己相関値をしきい値比較
して、有音/雑音判定を行うようになっているが、マイ
クロホンから、比較的離れた話者からの音声は、パワー
(音圧)が小さくなり雑音と判定されやすくなり、方向
検出の感度が鈍くなる傾向になる。
【0019】そこで本発明の目的は、話者位置の誤検出
を従来よりも低減させることが可能な話者方向検出回路
及びその検出方法を提供することにある。
【0020】
【課題を解決するための手段】前記課題を解決するため
に本発明による話者方向検出回路は、複数のマイクロホ
ンからの音声信号が入力され、これら音声信号を自己相
関関数と相互相関関数との関係式を用いて評価関数演算
する評価関数演算手段を含む話者方向検出回路であっ
て、その話者方向検出回路は前記評価関数演算手段の前
段に、前記複数のマイクロホンからの音声信号の各々を
線形予測する線形予測手段を含み、その線形予測後の音
声信号に基づき前記評価関数演算がなされることを特徴
とする。
【0021】又、本発明による話者方向検出方法は、複
数のマイクロホンからの音声信号が入力され、これら音
声信号を自己相関関数と相互相関関数との関係式を用い
て評価関数演算する評価関数演算ステップを含む話者方
向検出方法であって、その話者方向検出方法は前記評価
関数演算ステップの前段に、前記複数のマイクロホンか
らの音声信号の各々を線形予測する線形予測ステップを
含み、その線形予測後の音声信号に基づき前記評価関数
演算がなされることを特徴とする。
【0022】本発明によれば、上記構成により話者位置
の誤検出を従来よりも低減させることが可能となる。
【0023】本発明は、線形予測回路を設けてマイクロ
ホン入力信号から声道の影響を取り除く。その声道の影
響を取り除いたマイクロホン入力信号を、相互相関関数
及び自己相関を用いた関係式で示される評価関数演算回
路に入力し、自己相関及び相互相関の演算結果の精度を
向上させることにより、話者方向検出の誤動作を少なく
し、安定性を高める。
【0024】又、同時に、周囲雑音の影響による誤検出
を回避するため、有音/雑音検出回路を設け、有音区間
を検出する。これにより、方向検出感度を保ちつつ、同
時に、話者からの音声をマイクロホンが受けたと思われ
る場合のみ、位置検出結果の更新を行う。
【0025】
【発明の実施の形態】以下、本発明の実施の形態につい
て添付図面を参照しながら説明する。前述の特願200
0−045306号記載の従来技術では、マイクロホン
入力信号をそのまま相互相関関数及び自己相関を用いた
関係式で示される評価関数演算回路に入力し、話者方向
の検出を行っていた。
【0026】これに対し、本発明では、マイクロホンの
入力信号から線形予測した信号を差し引くことにより、
声道成分を削除した信号を評価演算回路に入力し、話者
方向の検出を行う。
【0027】図1は本発明に係る話者方向検出回路の最
良の実施の形態の構成図である。同図を参照すると、話
者方向検出回路はマイクロホン(MIC)1と、線形予
測回路2と、減算器3と、マイクロホン(MIC)4
と、線形予測回路5と、減算器6と、遅延バッファ7
と、評価関数演算回路8と、方向検出回路9と、有音/
雑音判定回路10と、ゼロ交差回数検出回路11とを含
んで構成されている。
【0028】次に、この話者方向検出回路の動作につい
て説明する。同図に示すように、まず、マイクロホン1
の入力信号を線形予測回路2に入力する。そして、この
線形予測回路2で線形予測を行い、線形予測信号を生成
する。次に、減算器3にてその線形予測信号をマイクロ
ホン1の入力信号から差し引き、残差信号を生成する。
【0029】マイクロホン4の入力信号もマイクロホン
1側と同様に、線形予測回路5、減算器6にて声道の影
響を取り除いた残差信号を生成し、さらに遅延バッファ
7にて所定の遅延を付与する。
【0030】次に、これらの残差信号を評価関数演算回
路8に入力する。この評価関数演算回路8では、例え
ば、自己相関関数と相互相関関数の関係式を用いた評価
関数を使用して、この評価関数の最大値を検出し、ここ
で得た位相差を基にして、方向検出回路9にて話者の方
向検出を行う。なお、この関数の詳細は、前述の特願2
000−045306号に記載されいるため、説明を省
略する。
【0031】又、マイクロホン1,4の入力を基に、ゼ
ロ交差回数検出回路11によって得られた、ゼロ交差回
数情報を基に有音/雑音判定回路10により、ある音源
からマイクロフォンに入力されたものが、雑音によるも
のか、発声者によるものか判定し、雑音と判定された場
合は、方向検出回路9の更新を停止し、この時の検出信
号方向は雑音源と思われる位置方向を示さないように制
御する。一方、発声者によるものと判定された場合は、
方向検出回路9により話者の方向検出を行う。
【0032】なお、ゼロ交差回数検出回路11は入力さ
れる信号の振幅がゼロレベルを交差する回数、即ち信号
の極性が正から負あるいは負から正に切り替わる回数を
検出するもので、一般に、雑音の方が発声者による音声
よりもゼロ交差回数が多い。従って、ゼロ交差回数を所
定しきい値と比較することにより、入力信号が発声者に
よる音声であるかあるいは雑音であるかの判定が可能と
なる。
【0033】
【実施例】以下、本発明の実施例について説明する。ま
ず、第1実施例について説明する。図2は本発明に係る
話者方向検出回路の第1実施例の構成図である。同図を
参照すると、話者方向検出回路はマイクロホン(MI
C)21と、メモリ22と、線形予測回路23と、減算
器24と、マイクロホン(MIC)25と、メモリ26
と、線形予測回路27と、減算器28と、線形予測回路
29と、減算器30と、マイクロホン(MIC)31
と、メモリ32と、線形予測回路33と、減算器34
と、自己相関演算回路35と、評価関数回路36と、相
互相関関数回路37と、自己相関演算回路38と、評価
関数回路39と、相互相関関数回路40と、方向検出回
路41とを含んで構成されている。
【0034】次に、この話者方向検出回路の動作につい
て説明する。まず、メモリ22を介して得たマイクロホ
ン21の入力信号を線形予測回路23に入力する。そし
て、線形予測回路23で線形予測を行い、線形予測信号
を生成する。次に、減算器24てその線形予測信号をマ
イクロホン21の入力信号から差し引き、残差信号を生
成する。
【0035】同様に、メモリ26を介して得たマイクロ
ホン25の入力信号を線形予測回路27に入力する。そ
して、線形予測回路27で線形予測を行い、線形予測信
号を生成する。次に、減算器28てその線形予測信号を
マイクロホン25の入力信号から差し引き、残差信号を
生成する。
【0036】次に、これら生成した残差信号を自己相関
演算回路35及び相互相関関数回路37に入力し、自己
相関及び相互相関を算出する。そして、この結果を基に
評価関数回路36にて、先に述べた評価関数式に従って
演算を行い、その演算結果の値を方向検出回路41へ渡
す。そして、位置検出回路41は、その値が最大となる
遅延位置を決定し、その遅延に該当する方向が水平方向
位置となる。
【0037】同様に、マイクロホン25とマイクロホン
31の入力信号についても、同様の回路手順で処理し、
垂直方向検出を行う。
【0038】評価関数回路36、39では、例えば、自
己相関関数と相互相関関数の関係式を用いた評価関数を
使用して、この評価関数の最大値を検出し、ここで得た
位相差を基にして、話者の方向検出を行う。なお、この
関数の詳細は、前述の特願2000−045306号に
記載させているので、説明を省略する。
【0039】次に、第2実施例について説明する。図3
は本発明に係る話者方向検出回路の第2実施例の構成図
である。なお、図2(第1実施例)と同様の構成部分に
ついては同一番号を付す。
【0040】同図を参照すると、話者方向検出回路は第
1実施例の構成にゼロ交差回数検出回路42と、有音/
雑音判定回路43とを追加したものである。
【0041】次に、この話者方向検出回路の動作につい
て説明する。まず、マイクロホン21からの信号は、メ
モリ回路22に一旦蓄積された後、減算器24により線
形予測回路23の出力と差分され、線形予測残差信号と
して相互相関演算回路37に供給される。
【0042】一方、マイクロホン25からの信号は、メ
モリ回路26に一旦蓄積された後、線形予測回路27に
供給される。そして、線形予測回路27の出力を減算器
28によりメモリ26を介して得た入力信号と差分し、
残差信号を算出する。この算出結果を自己相関演算回路
35に供給し、自己相関演算を行う。
【0043】線形予測回路23、27は、もっとも簡単
な例では、数次のFIR(Finite Impuls
e Filter)等により実現できる。
【0044】図4はマイクロホンの位置の一例を示す図
である。ちなみに、マイクロホン21とマイクロホン2
5は、同図に示すマイクロホン1,マイクロホン2に該
当するように水平方向に置かれて、水平方向位置探索に
利用するために使用する。
【0045】一方、相互相関演算回路37では、相互相
関演算を行い、時間差毎の相互相関関数値が算出処理さ
れる。そして、相互相関演算回路37と自己相関演算回
路35とで得られた結果を基にして、評価関数回路36
において、ある時間分の加算処理された後に最大値検索
を行い、時間差を算出する。そして、その算出した時間
差(遅延)を基に、方向検出回路41にて水平方向角を
求める処理が行われる。
【0046】なお、線形予測回路27、29、及び、自
己相関演算回路35、38の結果は同様なので、どちら
か片方のみの演算を行い、評価関数回路37、39の入
力としても良い。
【0047】ここでは、説明は省略するが、マイクロホ
ン25及びマイクロホン31からの信号を用いて、水平
方向と同様に処理を行うことによって、垂直方向の位置
を検出する。
【0048】ちなみに、マイクロホン31は、図4に示
すマイクロホン3に該当する。
【0049】所で、各マイクロホン21、25、31
は、メモリ22、26、32を介して、ゼロ交差回数検
出回路42に入力され、ここで、各入力の短時間ゼロ交
差回数を演算する。この結果を基に、有音/雑音判定回
路43にて有音/雑音判定が行われる。
【0050】そして、雑音区間と判定された場合は、方
向検出回路41の制御を停止し、雑音源の影響により誤
動作することを防止する。なお、ゼロ交差回数算出方法
は、様々な方法が既に提案されているため、本提案回路
に有効な方法を用いれば良い。
【0051】図5は水平方向位置検出方法の一例を示す
説明図である。同図に示す水平方向位置検出方法は当業
者にとってよく知られており、又本発明とは直接関係し
ないので、その詳細な構成の説明は省略する。
【0052】以下の式により、水平方向角θを検出す
る。 Lsinθ=νTh θ=sin-1(νTh /L) なお、Lはマイクロホン間の距離(m)、νは音速(m
/s)、Th はマイクロホン間の遅延時間(sec)
を示す。
【0053】又、時間差(遅延)Th は、サンプリン
グ周期(sec)×時間差(サンプル)で求められる。
【0054】図6は垂直方向位置検出方法の一例を示す
説明図である。この方法は図5と全く同様に導けるの
で、ここでは説明は省略する。
【0055】次に、第3実施例について説明する。第3
実施例は話者方向検出方法に関するものである。第3実
施例は、主に第2実施例の構成を基にしている。図7は
本発明に係る話者方向検出方法の処理手順を示すフロー
チャートである。
【0056】同図を参照すると、回路動作開始時点で、
評価結果の加算時間分を検出するCNT値を初期化する
(ステップ601)。フロチャートでは省略されている
が、この時点で、評価関数加算値は全て初期化されてい
るとする。次に、該当マイクロホンより、音声データを
入手した後(ステップ602)、16kHzサンプリン
グで、32から40サンプル程度毎に線形予測処理(ス
テップ603)、自己相関演算(ステップ604)、相
互相関演算(ステップ605)を行う。
【0057】線形予測処理(ステップ603)、自己相
関演算(ステップ604)、相互相関関演算(ステップ
605)は、バッファにデータを蓄積してフレーム単位
で一気に処理を行うか、もしくは、サンプル毎の部分に
分割して計算を行うことによっても計算することが出来
るので、どちらのやり方でもよい。
【0058】分割処理の場合は、相関関数演算(ステッ
プ605)が終わっているか相関演算終了確認(ステッ
プ606)において判定し、終了していない場合は(ス
テップ605にてNOの場合)、ステップ602へ戻れ
ばよい。
【0059】次に、残差信号生成までを含む線形予測処
理(ステップ603)及び、自己相関演算(ステップ6
04)、相互相関演算(ステップ605)によって得ら
れた結果を基に、評価関数の算出を行う(ステップ60
7)。評価関数は、(相互相関の二乗/自己相関)を評
価関数として計算する。
【0060】次に、ここで得られた評価関数を統計的に
平均化するため、評価結果の加算(ステップ608)に
おいて、過去の結果に加算して蓄積する。この後、CN
Tは蓄積時間を計るのに使用しているため、CNTの更
新(CNT+1)を行う(ステップ609)。
【0061】次に、CNT値の確認を予め設定した値
(MAX)との比較により行う(設定値MAXは、例え
ば200msから1s程度の任意の値とすると良い)。
そして、CNT値が予め設定した値MAXと一致しない
場合は(ステップ610にてNOの場合)、ステップ6
02に戻る。一方、設定値MAXと一致した場合は(ス
テップ610にてYESの場合)、CNTを0に初期化
した後(ステップ611)、評価結果の最大値検索を行
い(ステップ612)、最大となる時の時間差(遅延)
を検出する。
【0062】又、この検出期間中で、各マイクロホンの
ゼロ交差回数の結果を基に、有音と判定した場合のみ、
時間差(遅延)より方向を算出する(ステップ613及
び614)。ゼロ交差回数は、音声(厳密には有音部分
のみ)では、相対的に少なく、雑音(厳密には音声の無
声音部分も含む。)では相対的に多くなることが知られ
ている。従って、この音声理論に基づき、音声/雑音を
判定する。
【0063】なお、有音/雑音の判定方法(ステップ6
15及び616)については、マイクロホンの全ての入
力が、有音区間と判定した場合のみ有音区間とする方
法、又は、いずれかが有音と判定した場合に有音区間と
する方法等がある。又、ステップ613において、評価
関数加算結果を初期化しておく。これによって、次に新
しく開始する評価関数加算に備える。ところで、図7で
は、ステップ602から616までの処理は、水平方
向、垂直方向のそれぞれ独立的に処理する必要がある。
【0064】なお、図7のフローチャートを第1実施例
に適用する場合は、図7のステップ612の処理が終了
したらステップ614へジャンプするようにすればよ
い。
【0065】その他の実施例として、前述の特願200
0−045306号記載の発明に示した有音/雑音判定
方式も含めた回路において、本発明で提案したゼロ交差
回数検出による音声検出回路を組み合わせることによ
り、更に、誤検出しにくい回路を得ることができる。
【0066】なお、本発明が上記実施の形態及び各実施
例に限定されず、本発明の技術思想の範囲内において上
記実施の形態及び各実施例は適宜変更され得ることは明
らかである。
【0067】
【発明の効果】本発明による話者方向検出回路によれ
ば、評価関数演算手段の前段に、複数のマイクロホンか
らの音声信号の各々を線形予測する線形予測手段を含
み、その線形予測後の音声信号に基づき評価関数演算が
なされるため、話者位置の誤検出を従来よりも低減させ
ることが可能となる。
【0068】又、本発明による話者方向検出方法によれ
ば、評価関数演算ステップの前段に、複数のマイクロホ
ンからの音声信号の各々を線形予測する線形予測ステッ
プを含み、その線形予測後の音声信号に基づき評価関数
演算がなされるため、上記話者方向検出回路と同様の効
果を奏する。
【0069】具体的に説明すると、音声波形から声道の
影響を取り除くことにより、評価関数演算回路により計
算される位相差の精度を高め、話者位置の検出誤りを低
減することができる。
【0070】要するに、音声の声道の影響を取り除くこ
とにより、相互相関関数及び、自己相関関数の結果を使
用した評価関数演算回路により算出される位相差の精度
を上げ、話者方向の検出精度を向上させることができ
る。
【0071】又、短時間のゼロ交差関数検出に基づく有
音/雑音判定を行うことにより、周囲雑音による誤検出
を防止することができる。
【図面の簡単な説明】
【図1】本発明に係る話者方向検出回路の最良の実施の
形態の構成図である。
【図2】本発明に係る話者方向検出回路の第1実施例の
構成図である。
【図3】本発明に係る話者方向検出回路の第2実施例の
構成図である。
【図4】マイクロホンの位置の一例を示す図である。
【図5】水平方向位置検出方法の一例を示す説明図であ
る。
【図6】垂直方向位置検出方法の一例を示す説明図であ
る。
【図7】本発明に係る話者方向検出方法の処理手順を示
すフローチャートである。
【図8】複数のマイクロホンで受信した信号の時間差の
理論を示す図である。
【符号の説明】
1、4 マイクロホン 2、5 線形予測回路 3、6 減算器 7 遅延バッファ 8 評価関数演算回路 9 方向検出回路 10 有音/雑音判定回路 11 ゼロ交差回数検出回路 21、25、31 マイクロホン 22、26、32 メモリ 23、27、29、33 線形予測回路 24、28、30、34 減算器 35、38 自己相関演算回路 36、39 評価関数回路 37、40 相互相関関数回路 41 方向検出回路 42 ゼロ交差回数検出回路 43 有音/雑音判定回路
フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G10L 9/14 D 301A

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 複数のマイクロホンからの音声信号が入
    力され、これら音声信号を自己相関関数と相互相関関数
    との関係式を用いて評価関数演算する評価関数演算手段
    を含む話者方向検出回路であって、 前記評価関数演算手段の前段に、前記複数のマイクロホ
    ンからの音声信号の各々を線形予測する線形予測手段を
    含み、その線形予測後の音声信号に基づき前記評価関数
    演算がなされることを特徴とする話者方向検出回路。
  2. 【請求項2】 前記複数のマイクロホンからの信号のゼ
    ロ交差回数を検出し、得られた回数情報を基にその信号
    が有音であるか雑音であるかの判定を行う有音/雑音判
    定手段をさらに含み、前記有音/雑音判定手段にてその
    信号が有音と判定された場合に話者方向検出がなされる
    ことを特徴とする請求項1記載の話者方向検出回路。
  3. 【請求項3】 水平方向検出用マイクロホンからの音声
    信号及び垂直方向検出用マイクロホンからの音声信号の
    各々に対して前記評価関数演算手段による評価関数演算
    がなされることを特徴とする請求項1又は2記載の話者
    方向検出回路。
  4. 【請求項4】 複数のマイクロホンからの音声信号が入
    力され、これら音声信号を自己相関関数と相互相関関数
    との関係式を用いて評価関数演算する評価関数演算ステ
    ップを含む話者方向検出方法であって、 前記評価関数演算ステップの前段に、前記複数のマイク
    ロホンからの音声信号の各々を線形予測する線形予測ス
    テップを含み、その線形予測後の音声信号に基づき前記
    評価関数演算がなされることを特徴とする話者方向検出
    方法。
  5. 【請求項5】 前記複数のマイクロホンからの信号のゼ
    ロ交差回数を検出し、得られた回数情報を基にその信号
    が有音であるか雑音であるかの判定を行う有音/雑音判
    定ステップをさらに含み、前記有音/雑音判定ステップ
    にてその信号が有音と判定された場合に話者方向検出が
    なされることを特徴とする請求項4記載の話者方向検出
    方法。
  6. 【請求項6】 水平方向検出用マイクロホンからの音声
    信号及び垂直方向検出用マイクロホンからの音声信号の
    各々に対して前記評価関数演算ステップによる評価関数
    演算がなされることを特徴とする請求項4又は5記載の
    話者方向検出方法。
JP2002069397A 2002-03-14 2002-03-14 話者方向検出回路及びその検出方法 Pending JP2003271189A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002069397A JP2003271189A (ja) 2002-03-14 2002-03-14 話者方向検出回路及びその検出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002069397A JP2003271189A (ja) 2002-03-14 2002-03-14 話者方向検出回路及びその検出方法

Publications (1)

Publication Number Publication Date
JP2003271189A true JP2003271189A (ja) 2003-09-25

Family

ID=29200238

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002069397A Pending JP2003271189A (ja) 2002-03-14 2002-03-14 話者方向検出回路及びその検出方法

Country Status (1)

Country Link
JP (1) JP2003271189A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005077205A (ja) * 2003-08-29 2005-03-24 Advanced Telecommunication Research Institute International 音源方向推定装置、信号の時間遅延推定装置及びコンピュータプログラム
CN101510426A (zh) * 2009-03-23 2009-08-19 北京中星微电子有限公司 一种噪声消除方法及系统
JP2016114512A (ja) * 2014-12-16 2016-06-23 日本電気株式会社 振動発生源推定装置、方法およびプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005077205A (ja) * 2003-08-29 2005-03-24 Advanced Telecommunication Research Institute International 音源方向推定装置、信号の時間遅延推定装置及びコンピュータプログラム
CN101510426A (zh) * 2009-03-23 2009-08-19 北京中星微电子有限公司 一种噪声消除方法及系统
JP2016114512A (ja) * 2014-12-16 2016-06-23 日本電気株式会社 振動発生源推定装置、方法およびプログラム

Similar Documents

Publication Publication Date Title
JP4587160B2 (ja) 信号処理装置および方法
US9886968B2 (en) Robust speech boundary detection system and method
JP3423906B2 (ja) 音声の動作特性検出装置および検出方法
US9959886B2 (en) Spectral comb voice activity detection
JP2021503633A (ja) 音声ノイズ軽減方法、装置、サーバー及び記憶媒体
JP2003514412A (ja) 音源が一対のマイクロフォンから近いか遠いかを判断する方法
JP3033061B2 (ja) 音声雑音分離装置
JP4497911B2 (ja) 信号検出装置および方法、ならびにプログラム
GB2380644A (en) Speech detection
JPH08160994A (ja) 雑音抑圧装置
JP2000310993A (ja) 音声検出装置
JP2004109712A (ja) 話者方向検出装置
KR101811716B1 (ko) 음성 인식 방법 및 그에 따른 음성 인식 장치
JP2000163098A (ja) 音声認識装置
JP2003271189A (ja) 話者方向検出回路及びその検出方法
JP2007093635A (ja) 既知雑音除去装置
JP2002315089A (ja) 話者方向検出回路
JP6106618B2 (ja) 音声区間検出装置、音声認識装置、その方法、及びプログラム
CN111226278B (zh) 低复杂度的浊音语音检测和基音估计
JP4659556B2 (ja) 音源方向検出装置
JPS63281200A (ja) 音声区間検出方式
WO2023228785A1 (ja) 音響信号処理装置、音響信号処理方法及びプログラム
JP2016080767A (ja) 周波数成分抽出装置、周波数成分抽出方法及び周波数成分抽出プログラム
JPH09247800A (ja) 左右音像方向抽出方法
JP2020024310A (ja) 音声処理システム及び音声処理方法