JP3074952B2 - 雑音除去装置 - Google Patents

雑音除去装置

Info

Publication number
JP3074952B2
JP3074952B2 JP04218068A JP21806892A JP3074952B2 JP 3074952 B2 JP3074952 B2 JP 3074952B2 JP 04218068 A JP04218068 A JP 04218068A JP 21806892 A JP21806892 A JP 21806892A JP 3074952 B2 JP3074952 B2 JP 3074952B2
Authority
JP
Japan
Prior art keywords
noise
unit
microphone
time
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP04218068A
Other languages
English (en)
Other versions
JPH0667691A (ja
Inventor
啓三郎 ▲高▼木
和永 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP04218068A priority Critical patent/JP3074952B2/ja
Publication of JPH0667691A publication Critical patent/JPH0667691A/ja
Application granted granted Critical
Publication of JP3074952B2 publication Critical patent/JP3074952B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声認識装置などに用
いる、雑音中で発声された音声から雑音を除去する雑音
除去装置に関するものである。
【0002】
【従来の技術】音声認識や音声通信を行う際に、使用環
境によりさまざまな雑音が存在し、これらの雑音が音声
認識の認識率を低下させ、音声通信を阻害する大きな要
因となっている。
【0003】従来、音声を主に入力する音声マイクロホ
ンと周囲雑音を主に入力する雑音マイクロホンの2つの
マイクロホンを用い、音声マイクロホンに含まれる雑音
成分を推定し、推定した雑音を、雑音を含む音声から除
去してクリアな音声に変換する、いわゆる2入力スペク
トルサブトラクションと呼ばれる手法が存在している。
【0004】例えば、菅村らによる、“2入力による雑
音除去手法を用いた自動車内の音声認識”電子情報通信
学会技術研究報告、SP−81、pp.41−48(1
989)(以下、引用文献[1]と称する)に述べられ
ているような2入力スペクトルサブトラクションを用い
た雑音除去装置は、図16に示すような構成となってい
る。すなわち図16では、話者の口の前に設置し、音声
を主に入力する音声マイクロホン201と、音声マイク
に入力された周囲雑音となるべく同じものが入力され、
しかも、音声はなるべく混入しない位置に設置した雑音
マイクロホン202の2つのマイクロホンを用い、2c
h同時に入力する。音声マイクロホン201により入力
された雑音を含む音声は、音声特徴抽出部203におい
て雑音を含む音声の時系列特徴ベクトルに変換され、雑
音マイクロホン202により入力された周囲雑音は、雑
音特徴抽出部204において周囲雑音の時系列特徴ベク
トルに変換される。2入力サブトラクション部205で
は、まず、特徴抽出部203から得られた雑音を含む音
声の時系列特徴ベクトル中に含まれる雑音成分を、特徴
抽出部204から得られた周囲雑音の時系列特徴ベクト
ルを用いて推定する。この雑音成分の推定は、例えば、
音声を含まない時間位置で2つの入力を比較してあらか
じめ2入力間の補正係数を算出しておき、求めた補正係
数を雑音特徴抽出部204から得られた周囲雑音の時系
列特徴ベクトル全体に乗ずることにより行う。次に、2
入力サブトラクション部205は、推定した雑音の時系
列特徴ベクトルを音声特徴抽出部203から得られた雑
音を含む音声の時系列特徴ベクトル全体から差し引くこ
とにより,雑音除去後のクリアな音声の時系列特徴ベク
トルを出力する。ここで得られたクリアな音声の時系列
特徴ベクトルを用いて音声認識を行うことにより、雑音
による認識率の劣化の少ない音声認識を実現しようとし
ている。
【0005】
【発明が解決しようとする課題】しかしながら、通常の
騒音環境では、物体の移動音や人の話し声などの時間
的、空間的に性質が変化するような非定常雑音源を含
み、雑音の伝達特性や雑音が到来する方向が時々刻々と
変化するため、従来の1つの雑音マイクロホンを用いた
2入力スペクトルサブトラクションにおいては音声マイ
クロホンに入力される雑音成分と、雑音マイクに入力さ
れる雑音とが常に同一のものが入力されるとは限らない
ため、音声に含まれる雑音の推定に誤差が生じ、雑音除
去効果が低下するという欠点を有していた。また、従来
の2入力スペクトルサブトラクションにおいては、雑音
マイクロホンの設置方法、あるいは使用する雑音環境に
よっては、発声した音声が雑音マイクロホンに混入する
場合があり、この混入した音声を音声マイクロホンから
得られた特徴ベクトルから差し引くため、本来除去すべ
きでない音声の特徴ベクトル成分を除去する場合がある
ため、音声の認識率あるいは通信の了解度が著しく低下
するという欠点を有していた。
【0006】本発明の目的は、上述の問題を解決するも
のであり、時間的、空間的に性質が変化するような非定
常雑音に対しても効率良く雑音除去を行い、また、音声
の雑音マイクロホンへの混入が起こった場合でも必要な
音声信号を除去しない安定な雑音除去装置を提供するこ
とにある。
【0007】
【課題を解決するための手段】第1の発明は、音声を主
に入力する音声マイクロホンと、周囲雑音を主に入力
し、音声マイクロホンの周囲に配置された複数の雑音マ
イクロホンと、音声マイクロホンの出力信号を音声の時
系列特徴ベクトルに変換する音声特徴抽出部と、複数の
雑音マイクロホンの出力信号をそれぞれ雑音の時系列特
徴ベクトルに変換する複数の雑音特徴抽出部と、複数の
雑音特徴抽出部から得られた雑音の時系列特徴ベクトル
のなかから周囲雑音に最も近い雑音の時系列特徴ベクト
ルを選び出す雑音検出部と、雑音検出部が選び出した雑
音の時系列特徴ベクトルを選択し出力する選択部と、音
声特徴抽出部が出力する音声の時系列特徴ベクトルか
ら、選択部が出力する雑音の時系列特徴ベクトルを差し
引く2入力サブトラクション部とを備えることを特徴と
している。
【0008】第2の発明は、音声を主に入力する音声マ
イクロホンと、周囲雑音を主に入力し、音声マイクロホ
ンの周囲に配置された複数の雑音マイクロホンと、音声
マイクロホンの出力信号を音声の時系列特徴ベクトルに
変換する音声特徴抽出部と、複数の雑音マイクロホンの
出力信号のうちパワーが最小となる雑音マイクロホンの
出力信号を選び出す最小パワー検出部と、最小パワー検
出部が選び出した雑音マイクロホンの出力信号を選択し
出力する選択部と、選択部が出力する雑音マイクロホン
の出力信号を雑音の時系列特徴ベクトルに変換する雑音
特徴抽出部と、音声特徴抽出部が出力する音声の時系列
特徴ベクトルから、雑音特徴抽出部が出力する雑音の時
系列特徴ベクトルを差し引く2入力サブトラクション部
とを備えることを特徴としている。
【0009】第3の発明は、音声を主に入力する音声マ
イクロホンと、周囲雑音を主に入力し、音声マイクロホ
ンの周囲に配置された複数の雑音マイクロホンと、音声
マイクロホンの出力信号を音声の時系列特徴ベクトルに
変換する音声特徴抽出部と、複数の雑音マイクロホンの
出力信号をそれぞれ雑音の時系列特徴ベクトルに変換す
る複数の雑音特徴抽出部と、複数の雑音特徴抽出部が出
力する雑音の時系列特徴ベクトルと音声特徴抽出部が出
力する音声の時系列特徴ベクトルとの間の類似度を計算
して出力する類似度計算部と、類似度計算部が出力する
類似度のうち最大の類似度を選び出す最大値検出部と、
雑音の時系列特徴ベクトルのうち、最大値検出部が選び
出した類似度と対応した雑音の時系列特徴ベクトルを選
択して出力する選択部と、音声特徴抽出部が出力する音
声の時系列特徴ベクトルから選択部が出力する雑音の第
n時系列特徴ベクトルを差し引く2入力サブトラクショ
ン部とを備えることを特徴としている。
【0010】第4の発明は、第3の発明において、類似
度計算部が出力する類似度にあらかじめ定められた重み
を付加して重み付き類似度を出力する重み付加部を備
え、最大値検出部は重み付加部の出力する重み付き類似
度のうち最大の類似度を選び出すことを特徴としてい
る。
【0011】第5の発明は、音声を主に入力する音声マ
イクロホンと、周囲雑音を主に入力し、音声マイクロホ
ンの周囲に配置された複数の雑音マイクロホンと、音声
マイクロホンの出力信号を音声の時系列特徴ベクトルに
変換する音声特徴抽出部と、音声マイクロホンの出力信
号を音声の部分帯域の時系列特徴ベクトルに変換する音
声部分特徴抽出部と、複数の雑音マイクロホンの出力信
号それぞれを雑音の部分帯域の時系列特徴ベクトルに変
換する複数の部分特徴抽出部と、複数の部分特徴抽出部
が出力する雑音の部分帯域の時系列特徴ベクトルと音声
部分特徴抽出部が出力する音声の部分帯域の時系列特徴
ベクトルとの間の類似度をそれぞれ計算し、出力する部
分帯域類似度計算部と、部分帯域類似度計算部が出力す
る類似度のうち最大の類似度を選び出す最大値検出部
と、複数の雑音マイクロホンの出力信号のうち、最大値
検出部が選び出した類似度と対応した雑音マイクロホン
からの出力信号を選択して出力する選択部と、選択部が
出力する雑音マイクロホンからの出力信号を雑音の時系
列特徴ベクトルに変換する雑音特徴抽出部と、音声特徴
抽出部が出力する音声の時系列特徴ベクトルから雑音特
徴抽出部が出力する雑音の時系列特徴ベクトルを差し引
く2入力サブトラクション部とを備えることを特徴とし
ている。
【0012】第6の発明は、第3第4または第5の発明
において、最大値検出部の代わりに、入力された類似度
のうち最小の類似度を求める最小値検出部を備えること
を特徴としている。
【0013】第7の発明は、音声を主に入力する音声マ
イクロホンと、周囲雑音を主に入力し、音声マイクロホ
ンの周囲に配置された複数の雑音マイクロホンと、音声
マイクロホンの出力信号を音声の時系列特徴ベクトルに
変換する音声特徴抽出部と、複数の雑音マイクロホンの
出力信号をそれぞれ雑音の時系列特徴ベクトルに変換す
る複数の雑音特徴抽出部と、複数の雑音特徴抽出部から
得られた雑音の時系列特徴ベクトルを平均化し、平均化
した特徴ベクトルを雑音の合成ベクトルとして出力する
平均値合成部と、音声特徴抽出部が出力する音声の時系
列特徴ベクトルから平均値合成部が出力する雑音の合成
ベクトルを差し引く2入力サブトラクション部とを備え
ることを特徴としている。
【0014】第8の発明は、第7の発明において、平均
値合成部の代わりに、雑音特徴抽出部が出力する雑音の
時系列特徴ベクトルにあらかじめ定められた重みを付加
した後に平均化し、平均化した特徴ベクトルを雑音の合
成ベクトルとして出力する重み付き平均値合成部を備え
ることを特徴としている。
【0015】第9の発明は、音声を主に入力する音声マ
イクロホンと、周囲雑音を主に入力し、音声マイクロホ
ンの周囲に配置された複数の雑音マイクロホンと、音声
マイクロホンの出力信号を音声の時系列特徴ベクトルに
変換する音声特徴抽出部と、複数の雑音マイクロホンの
出力信号をそれぞれ雑音の第1〜第N時系列特徴ベクト
ルに変換する第1〜第N雑音特徴抽出部と、複数の雑音
特徴抽出部が出力する雑音の時系列特徴ベクトルそれぞ
れを複数の帯域に分割して出力する分割部と、分割部が
出力する帯域分割後の雑音の時系列特徴ベクトルの各帯
域毎にパワーが最小のものを取り出し、帯域毎の各最小
値を合成して雑音の合成ベクトルとして出力する最小値
合成部と、音声特徴抽出部が出力する音声の時系列特徴
ベクトルから最小値合成部が出力する雑音の合成ベクト
ルを差し引く2入力サブトラクション部とを備えること
を特徴としている。
【0016】第10の発明は第1の発明において、音声
マイクロホンから得られた出力信号を用いて音声が存在
しない区間を雑音区間として検出する雑音区間検出部を
備え、雑音検出部が雑音区間検出部により検出された雑
音区間の雑音の時系列特徴ベクトルを用いて雑音の時系
列特徴ベクトルを選び出すことを特徴としている。
【0017】第11の発明は、第2の発明において、音
声マイクロホンから得られた出力信号を用いて音声が存
在しない区間を雑音区間として検出する雑音区間検出部
を備え、最小パワー検出部が雑音区間検出部により検出
された雑音区間の雑音マイクロホンの出力信号を用いて
雑音マイクロホンの出力信号を選び出すことを特徴とし
ている。
【0018】第12の発明は、第3または第4の発明に
おいて、音声マイクロホンから得られた出力信号を用い
て音声が存在しない区間を雑音区間として検出する雑音
区間検出部を備え、類似度計算部が雑音区間検出部によ
り検出された雑音区間の雑音の時系列特徴ベクトルを用
いて類似度を計算して出力することを特徴としている。
【0019】第13の発明は、第5の発明において、音
声マイクロホンから得られた出力信号を用いて音声が存
在しない区間を雑音区間として検出する雑音区間検出部
を備え、部分帯域類似度計算部が雑音区間検出部により
検出された雑音区間の雑音の部分帯域の時系列特徴ベク
トルを用いて類似度を計算して出力することを特徴とし
ている。
【0020】第14の発明は、第10、11、12また
は13の発明において、雑音区間検出部は2入力サブト
ラクション部が出力する特徴ベクトルを用いて音声が存
在しない区間を雑音区間として検出することを特徴とし
ている。
【0021】第15の発明は、第3、第4または第5の
発明において、音声マイクロホンから得られた出力信号
を用いて音声が存在しない区間を雑音区間として検出す
る雑音区間検出部または2入力サブトラクション部が出
力する特徴ベクトルを用いて音声が存在しない区間を雑
音区間として検出する雑音区間検出部を備え、最大値検
出部の代わりに、雑音区間検出部が検出した雑音区間内
では入力された類似度のうち最大の類似度を選び出し、
雑音区間検出部が雑音区間を検出していない場合は入力
された類似度のうち最小の類似度を選び出す最大/最小
値検出部を備えることを特徴としている。
【0022】
【作用】第1の発明の作用を図1を用いて説明する。雑
音を含む音声は、音声マイクロホン1により電気信号に
変換される。これと同時に、周囲雑音は、音声マイクロ
ホン1の周囲に設置された2つ以上の第1〜第N雑音マ
イクロホン2により電気信号に変換される。2つ以上の
第1〜第N雑音マイクロホン2の設置方法は多々ある
が、例えば、音声マイクの周囲に適当な距離を保って配
置しても良いし、あるいは、あらゆる方角から到来する
雑音に対応して放射状に配置したり、また、特定の雑音
源に向けて設置しても良い。音声特徴抽出部3は、音声
マイクロホン1から得られた電気信号を、音響的な特徴
を時系列的に表現する時系列特徴量に変換する変換器で
あり、例えば、古井“ディジタル音声処理”、東海大学
出版(1985)(以下、引用文献[2]と称する)の
pp.37−49に述べられているようなDFT(離散
的フーリエ変換器)、FFT(高速フーリエ変換器)ま
たはBPF(帯域フィルタバンク)等で構成され、例え
ば、パワースペクトル、振幅スペクトルまたはBPF出
力等の特徴ベクトルの時系列データを出力する。また、
第1〜第N音声特徴抽出部4は、2つ以上の第1〜第N
雑音マイクロホン2から得られた電気信号を、それぞれ
音響的な特徴を時系列的に表現する時系列特徴量に変換
する変換器であり、雑音の第1〜第N時系列特徴ベクト
ルを出力する。この第1〜第N雑音特徴抽出部4は、音
声特徴抽出部3と同一の機能を有する。雑音検出部5
は、第1〜第N雑音特徴抽出部4から得られた雑音の第
1〜第N時系列特徴ベクトルのなかから周囲雑音に最も
近い雑音の第n時系列特徴ベクトルを選び出す。この周
囲雑音に最も近いかどうかの判定は、例えば、雑音の第
1〜第N時系列特徴ベクトルをYi (t)(1≦i≦
N、t:時刻)、あらかじめ記憶しておいた周囲雑音の
特徴ベクトルをRとすると、時刻tにおいて、 n=argmin(i)[‖Yi (t)−R‖] のように周囲雑音の特徴ベクトルRとの間のベクトル間
距離が最小となる雑音の第n時系列特徴ベクトルY
i (t)におけるnを求めることで行うことができる。
この周囲雑音に最も近いかどうかの判定は、これ以外に
も低域パワーが高域パワーに比べて大きいかなどの周波
数分布状態の情報を用いる方法でも可能である。ただ
し、argmin(i)[]は、[]内の演算結果につ
いての最小値を与えるiを求める関数とする。雑音検出
部4において選び出された雑音の第n時系列特徴ベクト
ルは、選択部6において選択し出力される。2入力サブ
トラクション部7は、音声マイクロホン1が出力する雑
音を含む音声の時系列特徴ベクトルから、選択部6が出
力する雑音の第n時系列特徴ベクトルを差し引くことに
より、2入力スペクトルサブトラクションを行い、音声
に含まれる雑音を除去する。この2入力サブトラクショ
ン部7は、例えば、引用文献[1]に述べられているよ
うな、図16に示す2入力サブトラクション部205と
同一の機能を有している。すなわち、第1の発明は、2
つ以上の第1〜第N雑音マイクロホン2が出力する雑音
の第1〜第N時系列特徴ベクトルのうち、最も、周囲雑
音と近い雑音の第n時系列特徴ベクトルを選択すること
により、雑音源が移動したり、また、雑音の伝達特性が
時間的、空間的に変化した場合であっても、常に最も雑
音の除去効果が高い雑音マイクロホンからの出力を選択
するという作用がある。また、周囲雑音に最も近い雑音
の第n時系列特徴ベクトルを選択することにより、音声
の回り込みが大であるような雑音マイクロホンからの出
力信号は選ばないため、音声の雑音マイクロホンへの回
り込みによる音声の認識率あるいは通信の了解度の低下
を防止するという効果がある。
【0023】第2の発明の作用を図2を用いて説明す
る。雑音を含む音声は、音声マイクロホン11により電
気信号に変換され、同時に周囲雑音は、音声マイクロホ
ン11の周囲に設置された2つ以上の第1〜第N雑音マ
イクロホン12により電気信号に変換される。音声特徴
抽出部13は、音声マイクロホン11から得られた電気
信号を、音響的な特徴を時系列的に表現する時系列特徴
量に変換する変換器であり、この音声特徴抽出部13
は、図1における音声特徴抽出部3と同一の機能を有す
る。最小パワー検出部14は、2つ以上の第1〜第N雑
音マイクロホン12の出力信号のうちパワーが最小とな
る第n雑音マイクロホンの出力信号を選び出す。すなわ
ち、2つ以上の第1〜第N雑音マイクロホン12から得
られた第1〜第NパワーをPi (t)(1≦i≦N)と
すると、最小パワー検出部14は、時刻tにおいて、 n=argmin(i)[Pi (t)] なる演算を行い、最もパワーが小さいPi に関するnを
求めることで行う。ここで用いる出力信号のパワーは、
部分的な帯域に制限した信号のパワーを用いても良い。
最小パワー検出部14が選び出した第n雑音マイクロホ
ンの出力信号は、選択部15において選択され出力され
る。選択部15において選択された第n雑音マイクロホ
ンの出力信号は、雑音特徴抽出部16において雑音の時
系列特徴ベクトルに変換される。この雑音特徴抽出部1
6は、図1における音声特徴抽出部3と同一の機能を有
する。2入力サブトラクション部17は、図1における
2入力サブトラクション部7と同一の機能を有し、音声
特徴抽出部13が出力する音声の時系列特徴ベクトルか
ら、雑音特徴抽出部16が出力する雑音の時系列特徴ベ
クトルを差し引くことにより、2入力スペクトルサブト
ラクションを行う。すなわち、第2の発明は、音声マイ
クロホン11の近隣に雑音源が存在せず、しかも雑音源
が複数の雑音マイクロホンの近隣を移動しているような
場合に特定の雑音源からの入力を排除するように働き、
音声マイクロホン11に入力される雑音と選択部15か
ら得られる雑音との相関が高くなり、従来の1つの雑音
マイクロホンを用いて2入力スペクトルサブトラクショ
ンを行った場合に比べて、高い雑音除去性能が得られる
という効果がある。また、最小のパワーを有する雑音マ
イクロホンからの第n時系列特徴ベクトルを用いること
で、音声の回り込みの大きな雑音マイクロホンからの出
力信号は選ばないため、音声の雑音マイクロホンへの回
り込みによる音声の認識率あるいは通信の了解度の低下
を防止することができるという効果がある。
【0024】第3の発明の作用を図3を用いて説明す
る。雑音を含む音声は、音声マイクロホン21により電
気信号に変換され、同時に周囲雑音は、音声マイクロホ
ン11の周囲に設置された2つ以上の第1〜第N雑音マ
イクロホン22により電気信号に変換される。音声特徴
抽出部23は、音声マイクロホン21から得られた電気
信号を、音響的な特徴を時系列的に表現する時系列特徴
量に変換する変換器である。第1〜第N雑音特徴抽出部
24は、2つ以上の第1〜第N雑音マイクロホン22の
電気信号を、音響的な特徴を時系列的に表現する時系列
特徴量に変換する変換器であり、雑音の第1〜第N時系
列特徴ベクトルを出力する。この音声特徴抽出部23お
よび第1〜第N雑音特徴抽出部24は、図1における音
声特徴抽出部3と同一の機能を有する。類似度計算部2
5は、第1〜第N雑音特徴抽出部24が出力する雑音の
第1〜第N時系列特徴ベクトルと、音声特徴抽出部23
が出力する音声の時系列特徴ベクトルとの間の第1〜第
N類似度をそれぞれ計算し出力する。この第1〜第N類
似度を求める方法は、例えば、音声マイクロホン21か
ら得られた音声の時系列特徴ベクトルをX(t)、第1
〜第N雑音特徴抽出部24から得られた雑音の第1〜第
N時系列特徴ベクトルをYi (t)、求める類似度をβ
i (t)とすると、
【0025】
【数1】
【0026】で求めることが可能である。この類似度の
求め方としては他にも多々あるが、例えば、引用文献
[2]に述べられているような、ベクトル同士の内積を
用いる方法によっても求めることが可能である。最大値
検出部26は、類似度計算部25が出力する第1〜第N
類似度のうち最大の第n類似度を選び出す。選択部27
は、雑音の第1〜第N時系列特徴ベクトルのうち、最大
値検出部26が選び出した第n類似度と対応した雑音の
第n時系列特徴ベクトルを選択して出力する。2入力サ
ブトラクション部28は、図1における2入力サブトラ
クション部7と同一の機能を有し、音声特徴抽出部23
が出力する音声の時系列特徴ベクトルから、選択部27
が出力する雑音の第n時系列特徴ベクトルを差し引くこ
とにより、2入力スペクトルサブトラクションを行う。
すなわち、第3の発明は、音声マイクロホン21に入力
された雑音と最も相関の高い雑音を入力する第n雑音マ
イクロホンからの時系列特徴ベクトルを用いることで、
常に雑音除去効果が最良となり、従来の1つの雑音マイ
クロホンを用いて2入力スペクトルサブトラクションを
行った場合に比べて高い雑音除去性能が得られるという
効果がある。
【0027】第4の発明の作用を図4を用いて説明す
る。図4は、図3に示す雑音除去装置の構成に加えて、
類似度計算部25が出力する第1〜第N類似度にあらか
じめ定められた重みを付加し、重み付き第1〜第N類似
度を出力する重み付加部29を有し、最大値検出部26
は、重み付加部29が出力する重み付き第1〜第N類似
度のうち最大の第n類似度を選び出すように構成されて
いる。すなわち、第4の発明は、第1〜第N類似度に重
みを付けることで、特定の雑音マイクロホンからの入力
を特に重視して選択することが可能である。このことに
より、例えば、音声マイクロホン21に近い位置に設置
された雑音マイクロホン22からの入力に、より大きな
重みを与え、音声マイクロホン21から遠い位置に設置
された雑音マイクロホン22に小さな重みを付けた場合
には、音声マイクロホン21に入力される周囲雑音と相
関が高い雑音が入力される可能性のある近傍の雑音マイ
クロホン22からの入力が重視され、従来の2入力スペ
クトルサブトラクションに比べて、高い雑音除去性能が
得られるという効果がある。あるいは、例えば、音声マ
イクロホン21に近い位置に設置された雑音マイクロホ
ン22からの入力に、より小さな重みを与え、音声の混
入の可能性が少ない、遠方の雑音マイクロホン22から
の入力が重視されるため、雑音マイクロホンへの音声の
混入による認識率の劣化や通信了解度の低下を防止する
ことが可能であるという効果がある。
【0028】第5の発明の作用を図5を用いて説明す
る。雑音を含む音声は、音声マイクロホン41により電
気信号に変換され、同時に周囲雑音は、2つ以上の第1
〜第N雑音マイクロホン42により電気信号に変換され
る。音声特徴抽出部43は、音声マイクロホン41から
得られた電気信号を、音響的な特徴を時系列的に表現す
る時系列特徴量に変換する変換器である。この音声特徴
抽出部23は、図1における音声特徴抽出部3と同一の
機能を有する。音声部分特徴抽出部44は、音声マイク
ロホン41から得られた電気信号を、部分帯域の音響的
な特徴を時系列的に表現する時系列特徴量に変換する変
換器であり、例えば、BPF、DFTによる分析結果か
ら選び出した一部分の周波数帯域を音声の部分帯域の特
徴ベクトルとして出力する。この部分帯域の特徴として
は、これらの他にも引用文献[2]に述べられているケ
プストラム分析などの他の分析結果や、KL変換等によ
る圧縮された特徴量も含む。第1〜第N部分特徴抽出部
45は、2つ以上の第1〜第N雑音マイクロホン42の
電気信号を、部分帯域の音響的な特徴を時系列的に表現
する時系列特徴量に変換する変換器であり、雑音の部分
帯域の第1〜第N時系列特徴ベクトルを出力する。この
第1〜第N部分特徴抽出部45は、音声部分特徴抽出部
44と同一の機能を有する。部分帯域類似度計算部46
は、第1〜第N部分特徴抽出部45が出力する雑音の部
分帯域の第1〜第N時系列特徴ベクトルと、音声部分特
徴抽出部44が出力する音声の部分帯域の時系列特徴ベ
クトルとの間の第1〜第N類似度をそれぞれ計算し出力
する。最大値検出部47は、部分帯域類似度計算部46
が出力する第1〜第N類似度のうち最大の第n類似度を
選び出す。選択部48は、2つ以上の第1〜第N雑音マ
イクロホン42の出力信号のうち、最大値検出部47が
選び出した第n類似度と対応した第n雑音マイクロホン
からの出力信号を選択して出力する。選択部48から得
られた第n雑音マイクロホンからの出力信号は、雑音特
徴抽出部49において雑音の時系列特徴ベクトルに変換
される。この雑音特徴抽出部49は、図1における音声
特徴抽出部3と同一の機能を有する。2入力サブトラク
ション部50は、図1における2入力サブトラクション
部7と同一の機能を有し、音声特徴抽出部43が出力す
る音声の時系列特徴ベクトルから、雑音特徴抽出部49
が出力する雑音の時系列特徴ベクトルを差し引くことに
より、2入力スペクトルサブトラクションを行う。すな
わち、第5の発明は、音声マイクロホン41に入力され
た雑音の部分帯域の特徴ベクトルと最も相関の高い雑音
が入力された雑音マイクロホンの出力信号を用いて、2
入力スペクトルサブトラクションを行うので、常に雑音
除去効果が最良となり、従来の1つの雑音マイクロホン
を用いて2入力スペクトルサブトラクションを行った場
合に比べて、高い雑音除去性能が得られるという効果が
ある。特に、雑音の存在する帯域が限られていることが
あらかじめ分かっているような場合には、部分帯域をあ
らかじめ雑音が存在する帯域に設定することにより、よ
り正確な雑音除去が可能であるという効果がある。
【0029】第6の発明の作用を図6を用いて説明す
る。図6は、図3に示す雑音除去装置において、最大値
検出部26の代わりに最小値検出部30を有し、この最
小値検出部30は、入力された第1〜第N類似度のうち
最小の第n類似度を選び出すように構成されている。す
なわち、第5の発明は、音声マイクロホン21の入力信
号との類似度が最も低い雑音マイクロホン22の出力信
号を用いて2入力スペクトルサブトラクションを行うこ
とで、常に音声の回り込みが最も小さい雑音マイクロホ
ン22の出力信号を選択するため、音声の雑音マイクロ
ホンへの回り込みにより、音声自身を差し引くことによ
る音声の認識率あるいは通信の了解度の低下を防止する
という効果がある。図6では、第3の発明に対して応用
した例を示したが、第4または第5の発明に対しても同
様の構成をとることが可能である。
【0030】第7の発明の作用を図7を用いて説明す
る。雑音を含む音声は、音声マイクロホン61により電
気信号に変換され、これと同時に周囲雑音は、2つ以上
の第1〜第N雑音マイクロホン62により電気信号に変
換される。音声特徴抽出部63は、音声マイクロホン6
1から得られた電気信号を、音響的な特徴を時系列的に
表現する時系列特徴量に変換する変換器である。
【0031】第1〜第N雑音特徴抽出部64は、2つ以
上の第1〜第Nマイクロホン62の電気信号を、音響的
な特徴を時系列的に表現する時系列特徴量に変換する変
換器であり、雑音の第1〜第N時系列特徴ベクトルを出
力する。この音声特徴抽出部63および第1〜第N雑音
特徴抽出部64は、図1における音声特徴抽出部3と同
一の機能を有する。第1〜第N雑音特徴抽出部64から
得られた雑音の第1〜第N時系列特徴ベクトルは、平均
値合成部65において平均化され、雑音の合成ベクトル
として出力される。すなわち、2つ以上の第1〜第Nマ
イクロホン62から得られた時系列特徴ベクトルをYi
(t)、得られた雑音の合成ベクトルをM(t)とする
と、平均値合成部65は、時刻tにおいて、
【0032】
【数2】
【0033】なる演算を行い、2つ以上の第1〜第N雑
音マイクロホン62から得られた時系列特徴ベクトルの
合成ベクトルM(t)を計算し、出力する。平均値を求
める方法は、このような計算以外にも相乗平均を用いた
り、あるいは引用文献[2]に述べられているセントロ
イド(パターン中心)などを用いることができる。2入
力サブトラクション部66は、図1における2入力サブ
トラクション部7と同一の機能を有し、音声特徴抽出部
63が出力する音声の時系列特徴ベクトルから、平均値
合成部65が出力する雑音の合成ベクトルを差し引くこ
とにより、2入力スペクトルサブトラクションを行う。
すなわち、第7の発明は、2つ以上の第1〜第Nマイク
ロホン62から得られた時系列特徴ベクトルの平均ベク
トルを用いて2入力スペクトルサブトラクションを行う
ことにより、雑音が第1〜第N雑音マイクロホン62よ
り多くの雑音マイクロホンに入力されていればいるほど
合成ベクトルに、より大きく反映され、逆に特定の雑音
マイクロホンにのみ入力される雑音は、平均化操作を行
うために合成ベクトルにはあまり大きく反映されないた
め、特定の雑音マイクロホンにのみ入力された雑音によ
る除去誤りが低減されるという効果がある。
【0034】第8の発明の作用を図8を用いて説明す
る。図8は、図7に示す平均値合成部65の代わりに重
み付き平均値合成部67を有し、この重み付き平均値合
成部67は、第1〜第N雑音特徴抽出部が出力する雑音
の第1〜第N時系列特徴ベクトルにあらかじめ定めた重
みを付加した後に平均化し、平均化した特徴ベクトルを
雑音の合成ベクトルとして出力する。すなわち、第8の
発明は、重みを付加することで特定の雑音マイクロホン
からの入力を特に重視することが可能であるため、第4
の発明が有するのと同様の効果を得、さらに、2つ以上
の第1〜第N雑音マイクロホン62から得られた時系列
特徴ベクトルの平均ベクトルを用いることで、第7の発
明が有するのと同様の効果を兼備している。
【0035】第9の発明の作用を図9を用いて説明す
る。雑音を含む音声は、音声マイクロホン81により電
気信号に変換され、同時に周囲雑音は、音声マイクロホ
ン81の周囲に設置された2つ以上の第1〜第N雑音マ
イクロホン82により電気信号に変換される。音声特徴
抽出部83は、音声マイクロホン81から得られた電気
信号を、音響的な特徴を時系列的に表現する時系列特徴
量に変換する変換器である。第1〜第N雑音特徴抽出部
84は、2つ以上の第1〜第N雑音マイクロホン82の
電気信号を、音響的な特徴を時系列的に表現する時系列
特徴量に変換する変換器であり、雑音の第1〜第N時系
列特徴ベクトルを出力する。この音声特徴抽出部83お
よび第1〜第N雑音特徴抽出部84は、図1における音
声特徴抽出部3と同一の機能を有する。第1〜第N雑音
特徴抽出部84が出力する雑音の第1〜第N時系列特徴
ベクトルは、それぞれ分割部85において複数の帯域に
分割され出力される。最小合成部86は、分割部85が
出力する帯域分割後の雑音の時系列特徴ベクトルの各帯
域毎にパワー最小のものを取り出し、帯域毎の各最小値
を合成し、雑音の合成ベクトルとして出力する。2入力
サブトラクション部87は、図1における2入力サブト
ラクション部7と同一の機能を有し、音声特徴抽出部8
3が出力する音声の時系列特徴ベクトルから、最小値合
成部86が出力する雑音の合成ベクトルを差し引くこと
により、2入力スペクトルサブトラクションを行う。す
なわち、帯域毎に伝達特性が異なるような環境で発声し
た場合、雑音マイクロホンへの音声の回り込み量は、帯
域毎、雑音マイクロホン毎に異なっていると考えられ
る。このような場合、第9の発明を用いることで、雑音
の第1〜第N時系列特徴ベクトルを複数の帯域に分割
し、各帯域毎に最小のパワーを有するものを選択し、そ
れぞれ帯域毎の最小値を合成して出力することにより、
常に音声の回り込み量が最も少ない特定の雑音マイクロ
ホンの特定帯域の特徴量を用いて雑音の特徴ベクトルを
合成するため、雑音マイクロホンへの音声の混入による
認識率の劣化や通信了解度の低下を防止することが可能
であるという効果がある。
【0036】第10の発明の作用を図10を用いて説明
する。図10は、図1に示す雑音除去装置の構成に加え
て、音声マイクロホン1から得られた出力信号を用いて
音声が存在しない区間を雑音区間として検出する雑音区
間検出部8を有し、雑音検出部5が雑音区間検出部8に
より検出された雑音区間の雑音の第1〜第N時系列特徴
ベクトルを用いて雑音の第n時系列特徴ベクトルを選び
出すように構成されている。すなわち、第10の発明
は、第1の発明が有する効果に加えて、音声の混入がな
い雑音区間を用いて雑音の第1〜第N時系列特徴ベクト
ルの1つを選択するため、より正しく雑音の推定が可能
であり、雑音の除去効果が高くなるという効果を得る。
【0037】第11の発明の作用を図11を用いて説明
する。図11は、図2に示す雑音除去装置の構成に加え
て、音声マイクロホン11から得られた出力信号を用い
て音声が存在しない区間を雑音区間として検出する雑音
区間検出部18を有し、最小パワー検出部14が雑音区
間検出部18により検出された雑音区間の第1〜第N雑
音マイクロホンの出力信号を用いて第n雑音マイクロホ
ンの出力信号を選び出すように構成されている。すなわ
ち、第11の発明は、第2の発明が有する効果に加え
て、音声の混入がない雑音区間を用いて第1〜第N雑音
マイクロホンの出力の一つを選択するため、より正しく
雑音の推定が可能であり、雑音の除去効果が高くなると
いう効果を得る。
【0038】第12の発明の作用を図12を用いて説明
する。図12は、図3に示す雑音除去装置の構成に加え
て、音声マイクロホン21から得られた出力信号を用い
て音声が存在しない区間を雑音区間として検出する雑音
区間検出部31を有し、類似度計算部25が雑音区間検
出部31により検出された雑音区間の雑音の第1〜第N
時系列特徴ベクトルを用いて第1〜第N類似度を計算し
て出力するように構成されている。図12では、図3に
対して応用した例を示したが、図4に示す実施例に対し
ても同様の構成をとることが可能である。すなわち、第
12の発明は、第3または第4の発明が有する効果に加
えて、音声の混入がない雑音区間を用いて雑音の第1〜
第N時系列特徴ベクトルの出力の一つを選択するため、
より正しく雑音の推定が可能であり、雑音の除去効果が
高くなるという効果を得る。
【0039】第13の発明の作用を図13を用いて説明
する。図13は、図5に示す雑音除去装置の構成に加え
て、音声マイクロホン41から得られた出力信号を用い
て音声が存在しない区間を雑音区間として検出する雑音
区間検出部51を有し、部分帯域類似度計算部46が雑
音区間検出部51により検出された雑音区間の雑音の部
分帯域の第1〜第N時系列特徴ベクトルを用いて第1〜
第N類似度を計算して出力するように構成されている。
すなわち、第13の発明は、第5の発明が有する効果に
加えて、音声の混入がない雑音区間を用いて第1〜第N
雑音マイクロホンの出力の一つを選択するため、より正
しく雑音の推定が可能であり、雑音の除去効果が高くな
るという効果を得る。
【0040】第14の発明の作用を図14を用いて説明
する。図14は、図10に示す雑音除去装置において、
雑音区間検出部9が,2入力サブトラクション部7の出
力する特徴ベクトルを用いて音声が存在しない区間を雑
音区間として検出するように構成されている。図14で
は、図10に対して応用した例を示したが、図11また
は図12または図13に示す雑音除去装置に対しても同
様の構成をとることが可能である。すなわち、第14の
発明は、第10また第11または第13の発明が有する
効果に加えて、雑音除去後のクリアな時系列特徴ベクト
ルを用いて雑音区間を推定することにより、雑音区間の
検出精度が改善され、このことにより、より高性能な雑
音除去が可能であるという効果がある。
【0041】第15の発明の作用を図15を用いて説明
する。図15は、図3に示す雑音除去装置の構成に加え
て、音声マイクロホン21から得られた出力信号を用い
て音声が存在しない区間を雑音区間として検出する雑音
区間検出部31と、最大値検出部26の代わりに雑音区
間検出部31が検出した雑音区間内では第1〜第N類似
度のうち最大の類似度を選び出し、雑音区間検出部31
が雑音区間を検出していない場合は第1〜第N類似度の
うち最小の類似度を選び出す最大/最小値検出部32を
有している。雑音区間検出部31は、2入力サブトラク
ション部28が出力する特徴ベクトルを用いて音声が存
在しない区間を雑音区間として検出するように構成する
ことも可能である。図15では、図3に対して応用した
例を示したが、図4または図5に示す雑音除去装置に対
しても同様の構成をとることが可能である。すなわち、
第15の発明は、第3または第4または第5の発明が有
する効果に加えて、雑音区間以外の音声が存在する区間
では音声マイクロホンの出力信号と最も類似していない
雑音マイクロホンの出力信号を選択する。このことによ
り雑音マイクへの音声の回り込み量が最も少ない雑音マ
イクロホンからの出力信号を選択し、雑音マイクロホン
への音声の混入による認識率の劣化や通信了解度の低下
を防止することができる。
【0042】
【実施例】次に、本発明の実施例について図面を参照し
て説明する。
【0043】図1は、第1の発明の一実施例を示すブロ
ック図である。図1に示す雑音除去装置は、音声を主に
入力する音声マイクロホン1と周囲雑音を主に入力し、
音声マイクロホンの周囲に配置した2つ以上の第1〜第
N雑音マイクロホン2と、音声マイクロホン1の出力信
号を音声の時系列特徴ベクトルに変換する音声特徴抽出
部3と、2つ以上の第1〜第N雑音マイクロホン2の出
力信号をそれぞれ雑音の第1〜第N時系列特徴ベクトル
に変換する第1〜第N雑音特徴抽出部4と、第1〜第N
雑音特徴抽出部4から得られた雑音の第1〜第N時系列
特徴ベクトルのなかから周囲雑音に最も近い雑音の第n
時系列特徴ベクトル(n=1〜N)を選び出す雑音検出
部5と、雑音検出部5が選び出した雑音の第n時系列特
徴ベクトルを選択し出力する選択部6と、音声特徴抽出
部3が出力する音声の時系列特徴ベクトルから選択部6
が出力する雑音の第n時系列特徴ベクトルを差し引く2
入力サブトラクション部7とを有している。
【0044】雑音を含む音声は、音声マイクロホン1に
より電気信号に変換される。これと同時に、周囲雑音
は、音声マイクロホン1の周囲に設置した2つ以上の第
1〜第N雑音マイクロホン2により電気信号に変換され
る。2つ以上の第1〜第N雑音マイクロホン2の設置方
法は多々あるが、例えば、音声マイクの周囲に適当な距
離を保って配置しても良いし、あるいは、あらゆる方角
から到来する雑音に対応して放射線状に配置したり、ま
た特定の雑音源に向けて設置しても良い。音声マイクロ
ホン1から得られた電気信号は、音声特徴抽出部3にお
いて、音声の時系列特徴ベクトルに変換され、2つ以上
の第1〜第N雑音マイクロホン2から得られた電気信号
は、それぞれ第1〜第N雑音特徴抽出部4において、雑
音の第1〜第N時系列特徴ベクトルに変換される。雑音
検出部5は、第1〜第N雑音特徴抽出部4から得られた
雑音の第1〜第N時系列特徴ベクトルのなかから、周囲
雑音に最も近い雑音の第n時系列特徴ベクトルを選び出
す。雑音検出部5において選び出された雑音の第n時系
列特徴ベクトルは、選択部6において選択し出力され
る。2入力サブトラクション部7は、音声マイクロホン
1が出力する、雑音を含む音声の時系列特徴ベクトルか
ら、選択部6が出力する雑音の第n時系列特徴ベクトル
を差し引くことにより、2入力スペクトルサブトラクシ
ョンを行い、音声に含まれる雑音を除去する。この2入
力サブトラクション部7は、図16に示す2入力サブト
ラクション部205と同一の機能を有している。
【0045】図2は、第2の発明の一実施例を示すブロ
ック図である。図2に示す雑音除去装置は、音声を主に
入力する音声マイクロホン11と、周囲雑音を主に入力
し、音声マイクロホン11の周囲に配置した2つ以上の
第1〜第N雑音マイクロホン12と、音声マイクロホン
11の出力信号を音声の時系列特徴ベクトルに変換する
音声特徴抽出部13と、2つ以上の第1〜第N雑音マイ
クロホン12の出力信号のうち、パワーが最小となる第
n雑音マイクロホンの出力信号を選び出す最小パワー検
出部14と、最小パワー検出部14が選び出した第n雑
音マイクロホンの出力信号を選択し出力する選択部15
と、選択部15が出力する第n雑音マイクロホンの出力
信号を、雑音の時系列特徴ベクトルに変換する雑音特徴
抽出部16と、音声特徴抽出部13が出力する音声の時
系列特徴ベクトルから、雑音特徴抽出部16が出力する
雑音の時系列特徴ベクトルを差し引く2入力サブトラク
ション部とを有している。
【0046】雑音を含む音声は、音声マイクロホン11
により電気信号に変換される。これと同時に、周囲雑音
は、音声マイクロホン11の周囲に設置した2つ以上の
第1〜第N雑音マイクロホン12により電気信号に変換
される。音声マイクロホン11から得られた電気信号
は、音声特徴抽出部13において音声の時系列特徴ベク
トルに変換される。この音声特徴抽出部13は、図1に
おける音声特徴抽出部3と同一の機能を有する。最小パ
ワー検出部14は、2つ以上の第1〜第N雑音マイクロ
ホン12の出力信号のうち、パワーが最小となる第n雑
音マイクロホンの出力信号を選び出す。最小パワー検出
部14が選び出した第n雑音マイクロホンの出力信号は
選択部15において選択され出力される。選択部15に
おいて選択された第n雑音マイクロホンの出力信号は、
雑音特徴抽出部16において雑音の時系列特徴ベクトル
に変換される。この2入力サブトラクション部17は、
図1における2入力サブトラクション部7と同一の機能
を有し、音声特徴抽出部13が出力する雑音の時系列特
徴ベクトルを差し引くことにより2入力スペクトルサブ
トラクションを行う。
【0047】図3は、第3の発明の一実施例を示すブロ
ック図である。図3に示す雑音除去装置は、音声を主に
入力する音声マイクロホン21と、周囲雑音を主に入力
し、音声マイクロホン21の周囲に配置した2つ以上の
第1〜第N雑音マイクロホン22と、音声マイクロホン
21の出力信号を音声の時系列特徴ベクトルに変換する
音声特徴抽出部23と、2つ以上の第1〜第N雑音マイ
クロホン22の出力信号を、それぞれ雑音の第1〜第N
時系列特徴ベクトルに変換する第1〜第N雑音特徴抽出
部24と、第1〜第N雑音特徴抽出部24が出力する雑
音の第1〜第N時系列特徴ベクトルと、音声特徴抽出部
23が出力する音声の時系列特徴ベクトルとの間の第1
〜第N類似度をそれぞれ計算し出力する類似度計算部2
5と、類似度計算部25が出力する第1〜第N類似度の
うち最大の第n類似度を選び出す最大値検出部26と、
雑音の第1〜第N時系列特徴ベクトルのうち、最大値検
出部26が選び出した第n類似度と対応した雑音の第n
時系列特徴ベクトルを選択して出力する選択部27と、
音声特徴抽出部23が出力する音声の時系列特徴ベクト
ルから、選択部27が出力する雑音の第n時系列特徴ベ
クトルを差し引く2入力サブトラクション部とを有して
いる。
【0048】雑音を含む音声は、音声マイクロホン21
により電気信号に変換される。これと同時に、周囲雑音
は、音声マイクロホン11の周囲に設置された2つ以上
の第1〜第N雑音マイクロホン22により電気信号に変
換される。音声マイクロホン21から得られた電気信号
は、音声特徴抽出部23において音声の時系列特徴ベク
トルに変換され、2つ以上の第1〜第N雑音マイクロホ
ン22の出力信号は、それぞれ第1〜第N雑音特徴抽出
部24において雑音の第1〜第N時系列特徴ベクトルに
変換される。
【0049】この音声特徴抽出部23および第1〜第N
雑音特徴抽出部24は、図1における音声特徴抽出部3
と同一の機能を有する。類似度計算部25は、第1〜第
N雑音特徴抽出部24が出力する雑音の第1〜第N時系
列特徴ベクトルと、音声特徴抽出部23が出力する音声
の時系列特徴ベクトルとの間の第1〜第N類似度をそれ
ぞれ計算し出力する。
【0050】最大値検出部26は、類似度計算部25が
出力する第1〜第N類似度のうち最大の第n類似度を選
び出す。選択部27は、雑音の第1〜第N時系列特徴ベ
クトルのうち、最大値検出部26が選び出した第n類似
度と対応した雑音の第n時系列特徴ベクトルを選択して
出力する。2入力サブトラクション部28は、図1にお
ける2入力サブトラクション部7と同一の機能を有し、
音声特徴抽出部23が出力する音声の時系列特徴ベクト
ルから、選択部27が出力する雑音の第n時系列特徴ベ
クトルを差し引くことにより2入力スペクトルサブトラ
クションを行う。
【0051】図4は、第4の発明の一実施例を示すブロ
ック図である。図4に示す雑音除去装置は、図3に示す
一実施例の構成に加えて、類似度計算部25が出力する
第1〜第N類似度にあらかじめ定めた重みを付加し、重
み付き第1〜第N類似度を出力する重み付加部29を有
し、最大値検出部26は、重み付加部29が出力する重
み付き第1〜第N類似度のうち、最大の第n類似度を選
び出すように構成されている。
【0052】図5は、第5の発明の一実施例を示すブロ
ック図である。図5に示す雑音除去装置は、音声を主に
入力する音声マイクロホン41と、周囲雑音を主に入力
し、音声マイクロホン41の周囲に配置した2つ以上の
第1〜第N雑音マイクロホン42と、音声マイクロホン
41の出力信号を音声の時系列特徴ベクトルに変換する
音声特徴抽出部43と、音声マイクロホン41の出力信
号を音声の部分帯域の時系列特徴ベクトルに変換する音
声部分特徴抽出部44と、2つ以上の第1〜第N雑音マ
イクロホン42の出力信号それぞれを雑音の部分帯域の
第1〜第N時系列特徴ベクトルに変換する第1〜第N部
分特徴抽出部45と、第1〜第N部分特徴抽出部45が
出力する雑音の部分帯域の第1〜第N時系列特徴ベクト
ルと、音声部分特徴抽出部44が出力する音声の部分帯
域の時系列特徴ベクトルとの間の第1〜第N類似度をそ
れぞれ計算し出力する部分帯域類似度計算部46と、部
分帯域類似度計算部46が出力する第1〜第N類似度の
うち最大の第n類似度を選び出す最大値検出部47と、
2つ以上の第1〜第N雑音マイクロホン42の出力信号
のうち、最大値検出部47が選び出した第n類似度と対
応した第n雑音マイクロホン45からの出力信号を選択
して出力する選択部48と、選択部48が出力する第n
雑音マイクロホン45からの出力信号を、雑音の時系列
特徴ベクトルに変換する雑音特徴抽出部49と、音声特
徴抽出部43が出力する音声の時系列特徴ベクトルか
ら、雑音特徴抽出部49が出力する雑音の時系列特徴ベ
クトルを差し引くことにより2入力サブトラクション部
50とを有している。
【0053】雑音を含む音声は、音声マイクロホン41
により電気信号に変換される。これと同時に周囲雑音
は、2つ以上の第1〜第N雑音マイクロホン42により
電気信号に変換される。音声マイクロホン41から得ら
れた出力信号は、音声特徴抽出部43において音声の時
系列特徴ベクトルに変換され、同時に音声マイクロホン
41の出力信号は、音声部分特徴抽出部44において音
声の部分帯域の時系列特徴ベクトルに変換される。この
音声特徴抽出部43は、図1における音声特徴抽出部3
と同一の機能を有する。2つ以上の第1〜第N雑音マイ
クロホン42の出力信号は、それぞれ第1〜第N部分特
徴抽出部45において雑音の部分帯域の第1〜第N時系
列特徴ベクトルに変換される。部分帯域類似度計算部4
6は、第1〜第N部分特徴抽出部45が出力する雑音の
部分帯域の第1〜第N時系列特徴ベクトルと、音声部分
特徴抽出部44が出力する音声の部分帯域の時系列特徴
ベクトルとの間の第1〜第N類似度をそれぞれ計算し出
力する。最大値検出部47は、部分帯域類似度計算部4
6が出力する第1〜第N類似度のうち、最大の第n類似
度を選び出す。選択部48は、2つ以上の第1〜第N雑
音マイクロホン42の出力信号のうち、最大値検出部4
7が選び出した第n類似度と対応した第n雑音マイクロ
ホン45からの出力信号を選択して出力する。選択部4
8から得られた第n雑音マイクロホン45からの出力信
号は、雑音特徴抽出部49において雑音の時系列特徴ベ
クトルに変換される。この雑音特徴抽出部49は、図1
における音声特徴抽出部3と同一の機能を有する。2入
力サブトラクション部50は、図1における2入力サブ
トラクション部7と同一の機能を有し、音声特徴抽出部
43が出力する音声の時系列特徴ベクトルから、雑音特
徴抽出部49が出力する雑音の時系列特徴ベクトルを差
し引くことにより2入力スペクトルサブトラクションを
行う。
【0054】図6は、第6の発明の一実施例を示すブロ
ック図である。図6に示す雑音除去装置は、図3に示す
実施例における最大値検出部26の代わりに、入力され
た第1〜第N類似度のうち最大の第n類似度を求める最
小値検出部30を有している。本実施例では、図3に対
して応用した例を示したが、図4または図5に示す実施
例に対しても同様の構成をとることが可能である。
【0055】図7は、第7の発明の一実施例を示すブロ
ック図である。図7に示す雑音除去装置は、音声を主に
入力する音声マイクロホン61と、周囲雑音を主に入力
し、音声マイクロホン61の周囲に配置した2つ以上の
第1〜第Nマイクロホン62と、音声マイクロホン61
の出力信号を音声の時系列特徴ベクトルに変換する音声
特徴抽出部63と、2つ以上の第1〜第N雑音マイクロ
ホン62の出力信号をそれぞれ雑音の第1〜第N時系列
特徴ベクトルに変換する第1〜第N雑音特徴抽出部64
と、第1〜第N雑音特徴抽出部64から得られた雑音の
第1〜第N時系列特徴ベクトルを平均化し、平均化した
特徴ベクトルを雑音の合成ベクトルとして出力する平均
値合成部65と、音声特徴抽出部63が出力する音声の
時系列特徴ベクトルから、平均値合成部65が出力する
雑音の合成ベクトルを差し引く2入力サブトラクション
部66とを有している。
【0056】雑音を含む音声は、音声マイクロホン61
により電気信号に変換される。これと同時に周囲雑音
は、2つ以上の第1〜第N雑音マイクロホン62により
電気信号に変換される。音声マイクロホン61の出力信
号は、音声特徴抽出部63において音声の時系列特徴ベ
クトルに変換され、2つ以上の第1〜第N雑音マイクロ
ホン62の出力信号は、第1〜第N雑音特徴抽出部64
においてそれぞれ雑音の第1〜第N時系列特徴ベクトル
に変換される。この音声特徴抽出部63および第1〜第
N雑音特徴抽出部64は、図1における音声特徴抽出部
3と同一の機能を有する。第1〜第N雑音特徴抽出部6
4から得られた雑音の第1〜第N時系列特徴ベクトル
は、平均値合成部65において平均化され、雑音の合成
ベクトルとして出力される。2入力サブトラクション部
66は、図1における2入力サブトラクション部7と同
一の機能を有し、音声特徴抽出部63が出力する音声の
時系列特徴ベクトルから、平均値合成部65が出力する
雑音の合成ベクトルを差し引くことにより2入力スペク
トルサブトラクションを行う。
【0057】図8は、第8の発明の一実施例を示すブロ
ック図である。図8に示す雑音除去装置は、図7に示す
一実施例における平均値合成部65の代わりに、第1〜
第N雑音特徴抽出部が出力する雑音の第1〜第N時系列
特徴ベクトルにあらかじめ定めた重みを付加した後に平
均化し、平均化した特徴ベクトルを雑音の合成ベクトル
として出力する重み付き平均値合成部67を有してい
る。
【0058】図9は、第9の発明の一実施例を示すブロ
ック図である。図9に示す雑音除去装置は、音声を主に
入力する音声マイクロホン81と、周囲雑音を主に入力
し、音声マイクロホン81の周囲に配置した2つ以上の
第1〜第N雑音マイクロホン82と、音声マイクロホン
81の出力信号を音声の時系列特徴ベクトルに変換する
音声特徴抽出部83と、2つ以上の第1〜第N雑音マイ
クロホン82の出力信号を、それぞれ雑音の第1〜第N
時系列特徴ベクトルに変換する第1〜第N雑音特徴抽出
部84と、第1〜第N雑音特徴抽出部84が出力する雑
音の第1〜第N時系列特徴ベクトルそれぞれを、複数の
帯域に分割して出力する分割部85と、分割部85が出
力する帯域分割後の雑音の時系列特徴ベクトルの各帯域
毎に、パワーが最小のものを取り出し、帯域毎の各最小
値を合成して雑音の合成ベクトルとして出力する最小値
合成部86と、音声特徴抽出部83が出力する音声の時
系列特徴ベクトルから、最小値合成部86が出力する雑
音の合成ベクトルを差し引く2入力サブトラクション部
87とを有している。
【0059】雑音を含む音声は、音声マイクロホン81
により電気信号に変換される。これと同時に周囲雑音
は、音声マイクロホン81の周囲に設置した2つ以上の
第1〜第N雑音マイクロホン82により電気信号に変換
される。音声マイクロホン81の出力信号は、音声特徴
抽出部83において音声の時系列特徴ベクトルに変換さ
れ、2つ以上の第1〜第N雑音マイクロホン82の出力
信号は、それぞれ第1〜第N雑音特徴抽出部84におい
て雑音の第1〜第N時系列特徴ベクトルに変換される。
この音声特徴抽出部83および第1〜第N雑音特徴抽出
部84は、図1における音声特徴抽出部3と同一の機能
を有する。第1〜第N雑音特徴抽出部84が出力する雑
音の第1〜第N時系列特徴ベクトルは、それぞれ分割部
85において複数の帯域に分割され出力される。最小値
合成部86は、分割部85が出力する帯域分割後の雑音
の時系列特徴ベクトルの各帯域毎に、パワーが最小のも
のを取り出し、帯域毎の各最小値を合成し雑音の合成ベ
クトルとして出力する。2入力サブトラクション部87
は、図1における2入力サブトラクション部7と同一の
機能を有し、音声特徴抽出部83が出力する音声の時系
列特徴ベクトルから最小値合成部86が出力する雑音の
合成ベクトルを差し引くことにより2入力スペクトルサ
ブトラクションを行う。
【0060】図10は、第10の発明の一実施例を示す
ブロック図である。図10に示す雑音除去装置は、図1
に示す実施例の構成に加えて、音声マイクロホン1から
得られた特徴ベクトルを用いて音声が存在しない区間を
雑音区間として検出する雑音区間検出部8を有し、雑音
検出部5が、雑音区間検出部8により検出された雑音区
間の雑音の第1〜第N時系列特徴ベクトルを用いて、雑
音の第n時系列特徴ベクトルを選び出すように構成され
ている。
【0061】図11は、第11の発明の一実施例を示す
ブロック図である。図11に示す雑音除去装置は、図2
に示す実施例の構成に加えて、音声マイクロホン11か
ら得られた出力信号を用いて音声が存在しない区間を雑
音区間として検出する雑音区間検出部18を有し、最小
パワー検出部14が雑音区間検出部18により検出され
た雑音区間の第1〜第N雑音マイクロホンの出力信号を
用いて、第n雑音マイクロホンの出力信号を選び出すよ
うに構成されている。
【0062】図12は、第12の発明の一実施例を示す
ブロック図である。図12に示す雑音除去装置は、図3
に示す実施例の構成に加えて、音声マイクロホン21か
ら得られた出力信号を用いて音声が存在しない区間を雑
音区間として検出する雑音区間検出部31を有し、類似
度計算部25が、雑音区間検出部31により検出された
雑音区間の雑音の第1〜第N時系列特徴ベクトルを用い
て、第1〜第N類似度を計算して出力するように構成さ
れている。本実施例では図3に対して応用した例を示し
たが、図4に示す実施例に対しても同様の構成をとるこ
とが可能である。
【0063】図13は、第13の発明の一実施例を示す
ブロック図である。図13に示す雑音除去装置は、図5
に示す実施例の構成に加えて、音声マイクロホン41か
ら得られた出力信号を用いて、音声が存在しない区間を
雑音区間として検出する雑音区間検出部51を有し、部
分帯域類似度計算部46が、雑音区間検出部51により
検出された雑音区間の雑音の部分帯域の第1〜第N時系
列特徴ベクトルを用いて、第1〜第N類似度を計算して
出力するように構成されている。
【0064】図14は、第14の発明の一実施例を示す
ブロック図である。図14に示す雑音除去装置は、図1
0に示す実施例の構成において、雑音区間検出部9が、
2入力サブトラクション部7が出力する特徴ベクトルを
用いて音声が存在しない区間を雑音区間として検出する
ように構成されている。本実施例では、図10に対して
応用した例を示したが、図11または図12または図1
3に示す実施例に対しても同様の構成をとることが可能
である。
【0065】図15は、第15の発明の一実施例を示す
ブロック図である。図15に示す雑音除去装置は、図3
に示す実施例の構成に加えて、音声マイクロホン21か
ら得られた出力信号を用いて、音声が存在しない区間を
雑音区間として検出する雑音区間検出部31と、最大値
検出部26の代わりに雑音区間検出部31が検出した雑
音区間内では、第1〜第N類似度のうち最大の類似度を
選び出し、雑音区間検出部31が雑音区間を検出してい
ない場合は、第1〜第N類似度のうち最小の類似度を選
び出す最大/最小値検出部32を有している。雑音区間
検出部31は、2入力サブトラクション部28が出力す
る特徴ベクトルを用いて音声が存在しない区間を雑音区
間として検出するように構成することも可能である。本
実施例では、図3に対して応用した例を示したが、図4
または図5に示す実施例に対しても同様の構成をとるこ
とが可能である。
【0066】
【発明の効果】以上説明したように本発明の雑音除去装
置は、音声マイクロホンに含まれる雑音成分を複数の雑
音マイクロホンを用いて推定して除去を行うことによ
り、時間的、空間的に性質が変化するような非定常雑音
に対しても効率良く雑音除去を行うことができ、また、
音声の雑音マイクロホンへの混入が起こった場合でも必
要な音声信号を除去しない、安定な雑音除去を行うこと
ができるという効果を有する。
【図面の簡単な説明】
【図1】第1の発明の一実施例を示すブロック図であ
る。
【図2】第2の発明の一実施例を示すブロック図であ
る。
【図3】第3の発明の一実施例を示すブロック図であ
る。
【図4】第4の発明の一実施例を示すブロック図であ
る。
【図5】第5の発明の一実施例を示すブロック図であ
る。
【図6】第6の発明の一実施例を示すブロック図であ
る。
【図7】第7の発明の一実施例を示すブロック図であ
る。
【図8】第8の発明の一実施例を示すブロック図であ
る。
【図9】第9の発明の一実施例を示すブロック図であ
る。
【図10】第10の発明の一実施例を示すブロック図で
ある。
【図11】第11の発明の一実施例を示すブロック図で
ある。
【図12】第12の発明の一実施例を示すブロック図で
ある。
【図13】第13の発明の一実施例を示すブロック図で
ある。
【図14】第14の発明の一実施例を示すブロック図で
ある。
【図15】第15の発明の一実施例を示すブロック図で
ある。
【図16】従来の2入力スペクトルサブトラクションに
よる雑音除去装置を示すブロック図である。
【符号の説明】
1,11,21,41,61,81,201 音声マイ
クロホン 2,12,22,42,62,82,202 雑音マイ
クロホン 3,13,23,43,63,83,203 音声特徴
抽出部 4,16,24,49,64,84 雑音特徴抽出部 5 雑音検出部 6,15,27,48 選択部 7,17,28,50,66,87,205 2入力サ
ブトラクション部 8,9,18,31,51 雑音区間検出部 14 最小パワー検出部 25 類似度計算部 26,47 最大値検出部 29 重み付加部 30 最小値検出部 32 最大/最小値検出部 44 音声部分特徴抽出部 45 部分特徴抽出部 46 部分帯域類似度計算部 65 平均値合成部 67 重み付き平均値合成部 85 分割部 86 最小値合成部
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平4−16900(JP,A) 特開 平4−249299(JP,A) 特開 平3−256100(JP,A) 特開 昭63−262695(JP,A) 特開 平5−6193(JP,A) 特開 平3−218199(JP,A) 特許2861011(JP,B2) 特許2544173(JP,B2) 日本音響学会平成3年度春季研究発表 会講演論文集 2−5−3「2段スペク トルサブトラクションによる雑音下音声 認識」p.59−60(平成3年3月27日発 行) 電子情報通信学会技術研究報告[音声 ]Vol.89,No.340,SP89−81, 「2入力による雑音除去手法を用いた自 動車内の音声認識」p.33−40(1989年 12月14日発行) (58)調査した分野(Int.Cl.7,DB名) G10L 15/00 - 17/00 G10L 21/02 JICSTファイル(JOIS)

Claims (5)

    (57)【特許請求の範囲】
  1. 【請求項1】音声を主に入力する音声マイクロホンと、 周囲雑音を主に入力し、音声マイクロホンの周囲に配置
    された複数の雑音マイクロホンと、 音声マイクロホンの出力信号を音声の時系列特徴ベクト
    ルに変換する音声特徴抽出部と、 複数の雑音マイクロホンの出力信号のうちパワーが最小
    となる雑音マイクロホンの出力信号を選び出す最小パワ
    ー検出部と、 最小パワー検出部が選び出した雑音マイクロホンの出力
    信号を選択し出力する選択部と、 選択部が出力する雑音マイクロホンの出力信号を雑音の
    時系列特徴ベクトルに変換する雑音特徴抽出部と、 音声特徴抽出部が出力する音声の時系列特徴ベクトルか
    ら、雑音特徴抽出部が出力する雑音の時系列特徴ベクト
    ルを差し引く2入力サブトラクション部とを備えること
    を特徴とする雑音除去装置。
  2. 【請求項2】音声を主に入力する音声マイクロホンと、 周囲雑音を主に入力し、音声マイクロホンの周囲に配置
    された複数の雑音マイクロホンと、 音声マイクロホンの出力信号を音声の時系列特徴ベクト
    ルに変換する音声特徴抽出部と、 複数の雑音マイクロホンの出力信号をそれぞれ雑音の時
    系列特徴ベクトルに変換する複数の雑音特徴抽出部と、 複数の雑音特徴抽出部が出力する雑音の時系列特徴ベク
    トルと音声特徴抽出部が出力する音声の時系列特徴ベク
    トルとの間の類似度を計算して出力する類似度計算部
    と、音声マイクロホンから得られた出力信号を用いて音声が
    存在しない区間を雑音区間として検出する雑音区間検出
    部または2入力サブトラクション部が出力する 特徴ベク
    トルを用いて音声が存在しない区間を雑音区間として検
    出する雑音区間検出部と、 雑音区間検出部が検出した雑音区間内では入力された類
    似度のうち最大の類似度を選び出し、雑音区間検出部が
    雑音区間を検出していない場合は入力された類似度のう
    ち最小の類似度を選び出す最大/最小値検出部と、 雑音の時系列特徴ベクトルのうち、最大値/最小値検出
    部が選び出した類似度と対応した雑音の時系列特徴ベク
    トルを選択して出力する選択部と、 音声特徴抽出部が出力する音声の時系列特徴ベクトルか
    ら選択部が出力する雑音の第n時系列特徴ベクトルを差
    し引く2入力サブトラクション部とを備えることを特徴
    とする雑音除去装置。
  3. 【請求項3】請求項記載の雑音除去装置において、類
    似度計算部が出力する類似度にあらかじめ定められた重
    みを付加して重み付き類似度を出力する重み付加部を
    らに備えたことを特徴とする雑音除去装置。
  4. 【請求項4】音声を主に入力する音声マイクロホンと、 周囲雑音を主に入力し、音声マイクロホンの周囲に配置
    された複数の雑音マイクロホンと、 音声マイクロホンの出力信号を音声の時系列特徴ベクト
    ルに変換する音声特徴抽出部と、 音声マイクロホンの出力信号を音声の部分帯域の時系列
    特徴ベクトルに変換する音声部分特徴抽出部と、 複数の雑音マイクロホンの出力信号それぞれを雑音の部
    分帯域の時系列特徴ベクトルに変換する複数の部分特徴
    抽出部と、 複数の部分特徴抽出部が出力する雑音の部分帯域の時系
    列特徴ベクトルと音声部分特徴抽出部が出力する音声の
    部分帯域の時系列特徴ベクトルとの間の類似度をそれぞ
    れ計算し、出力する部分帯域類似度計算部と、音声マイクロホンから得られた出力信号を用いて音声が
    存在しない区間を雑音区間として検出する雑音区間検出
    部または2入力サブトラクション部が出力する 特徴ベク
    トルを用いて音声が存在しない区間を雑音区間として検
    出する雑音区間検出部と、 雑音区間検出部が検出した雑音区間内では入力された類
    似度のうち最大の類似度を選び出し、雑音区間検出部が
    雑音区間を検出していない場合は入力された類似度のう
    ち最小の類似度を選び出す最大/最小値検出部と、 複数の雑音マイクロホンの出力信号のうち、最大/最小
    検出部が選び出した類似度と対応した雑音マイクロホ
    ンからの出力信号を選択して出力する選択部と、 選択部が出力する雑音マイクロホンからの出力信号を雑
    音の時系列特徴ベクトルに変換する雑音特徴抽出部と、 音声特徴抽出部が出力する音声の時系列特徴ベクトルか
    ら雑音特徴抽出部が出力する雑音の時系列特徴ベクトル
    を差し引く2入力サブトラクション部とを備えることを
    特徴とする雑音除去装置。
  5. 【請求項5】音声を主に入力する音声マイクロホンと、 周囲雑音を主に入力し、音声マイクロホンの周囲に配置
    された複数の雑音マイクロホンと、 音声マイクロホンの出力信号を音声の時系列特徴ベクト
    ルに変換する音声特徴抽出部と、 複数の雑音マイクロホンの出力信号をそれぞれ雑音の第
    1〜第N時系列特徴ベクトルに変換する第1〜第N雑音
    特徴抽出部と、 複数の雑音特徴抽出部が出力する雑音の時系列特徴ベク
    トルそれぞれを複数の帯域に分割して出力する分割部
    と、 分割部が出力する帯域分割後の雑音の時系列特徴ベクト
    ルの各帯域毎にパワーが最小のものを取り出し、帯域毎
    の各最小値を合成して雑音の合成ベクトルとして出力す
    る最小値合成部と、 音声特徴抽出部が出力する音声の時系列特徴ベクトルか
    ら最小値合成部が出力する雑音の合成ベクトルを差し引
    く2入力サブトラクション部とを備えることを特徴とす
    る雑音除去装置。
JP04218068A 1992-08-18 1992-08-18 雑音除去装置 Expired - Fee Related JP3074952B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP04218068A JP3074952B2 (ja) 1992-08-18 1992-08-18 雑音除去装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP04218068A JP3074952B2 (ja) 1992-08-18 1992-08-18 雑音除去装置

Publications (2)

Publication Number Publication Date
JPH0667691A JPH0667691A (ja) 1994-03-11
JP3074952B2 true JP3074952B2 (ja) 2000-08-07

Family

ID=16714150

Family Applications (1)

Application Number Title Priority Date Filing Date
JP04218068A Expired - Fee Related JP3074952B2 (ja) 1992-08-18 1992-08-18 雑音除去装置

Country Status (1)

Country Link
JP (1) JP3074952B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3510458B2 (ja) 1997-09-05 2004-03-29 沖電気工業株式会社 音声認識システムおよび音声認識制御プログラムを記録した記録媒体

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100406517B1 (ko) * 2000-11-25 2003-11-21 배형진 건축공사용 a형 지주
JP3812887B2 (ja) 2001-12-21 2006-08-23 富士通株式会社 信号処理システムおよび方法
US8126155B2 (en) * 2003-07-02 2012-02-28 Fuji Xerox Co., Ltd. Remote audio device management system
FR2883656B1 (fr) * 2005-03-25 2008-09-19 Imra Europ Sas Soc Par Actions Traitement continu de la parole utilisant une fonction de transfert heterogene et adaptee
JP4536020B2 (ja) * 2006-03-13 2010-09-01 Necアクセステクニカ株式会社 雑音除去機能を有する音声入力装置および方法
US8369555B2 (en) * 2006-10-27 2013-02-05 Avago Technologies Wireless Ip (Singapore) Pte. Ltd. Piezoelectric microphones
JP5391008B2 (ja) * 2009-09-16 2014-01-15 キヤノン株式会社 撮像装置及びその制御方法
JP5641186B2 (ja) * 2010-01-13 2014-12-17 ヤマハ株式会社 雑音抑圧装置およびプログラム
JP5473786B2 (ja) * 2010-06-03 2014-04-16 キヤノン株式会社 音声信号処理装置、及びその制御方法
CN103270772B (zh) 2010-11-25 2017-06-06 日本电气株式会社 信号处理设备、信号处理方法
WO2014112023A1 (ja) * 2013-01-17 2014-07-24 日本電気株式会社 雑音除去システム、音声検出システム、音声認識システム、雑音除去方法および雑音除去プログラム
JP6211890B2 (ja) * 2013-01-24 2017-10-11 日本電信電話株式会社 収音装置
US9905243B2 (en) 2013-05-23 2018-02-27 Nec Corporation Speech processing system, speech processing method, speech processing program, vehicle including speech processing system on board, and microphone placing method
KR101827276B1 (ko) 2016-05-13 2018-03-22 엘지전자 주식회사 전자 장치 및 그 제어 방법
WO2018173267A1 (ja) 2017-03-24 2018-09-27 ヤマハ株式会社 収音装置および収音方法
WO2018174135A1 (ja) * 2017-03-24 2018-09-27 ヤマハ株式会社 収音装置および収音方法
WO2022031280A1 (en) * 2020-08-05 2022-02-10 Hewlett-Packard Development Company, L.P. Peripheral microphones
WO2024039102A1 (ko) * 2022-08-18 2024-02-22 삼성전자주식회사 혼합 음원으로부터 타겟 음원을 분리하는 방법 및 그 전자 장치

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
日本音響学会平成3年度春季研究発表会講演論文集 2−5−3「2段スペクトルサブトラクションによる雑音下音声認識」p.59−60(平成3年3月27日発行)
電子情報通信学会技術研究報告[音声]Vol.89,No.340,SP89−81,「2入力による雑音除去手法を用いた自動車内の音声認識」p.33−40(1989年12月14日発行)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3510458B2 (ja) 1997-09-05 2004-03-29 沖電気工業株式会社 音声認識システムおよび音声認識制御プログラムを記録した記録媒体

Also Published As

Publication number Publication date
JPH0667691A (ja) 1994-03-11

Similar Documents

Publication Publication Date Title
JP3074952B2 (ja) 雑音除去装置
EP2546831B1 (en) Noise suppression device
US7478041B2 (en) Speech recognition apparatus, speech recognition apparatus and program thereof
US6266633B1 (en) Noise suppression and channel equalization preprocessor for speech and speaker recognizers: method and apparatus
JP5127754B2 (ja) 信号処理装置
JP4177755B2 (ja) 発話特徴抽出システム
US5749068A (en) Speech recognition apparatus and method in noisy circumstances
US7995767B2 (en) Sound signal processing method and apparatus
US20100198588A1 (en) Signal bandwidth extending apparatus
US8693287B2 (en) Sound direction estimation apparatus and sound direction estimation method
US8391471B2 (en) Echo suppressing apparatus, echo suppressing system, echo suppressing method and recording medium
JP2004531767A5 (ja)
US20060031067A1 (en) Sound input device
KR20080026456A (ko) 음신호 처리 방법, 음신호 처리 장치 및 기록 매체
JPH0566795A (ja) 雑音抑圧装置とその調整装置
JP2008236077A (ja) 目的音抽出装置,目的音抽出プログラム
JPWO2018163328A1 (ja) 音響信号処理装置、音響信号処理方法、及びハンズフリー通話装置
JP2011033717A (ja) 雑音抑圧装置
EP0459384B1 (en) Speech signal processing apparatus for cutting out a speech signal from a noisy speech signal
JP5443547B2 (ja) 信号処理装置
JP4858663B2 (ja) 音声認識方法及び音声認識装置
AU698712B2 (en) Detecting voice activity
Lee et al. Cochannel speech separation
JP3106543B2 (ja) 音声信号処理装置
CN111226278B (zh) 低复杂度的浊音语音检测和基音估计

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees