JPH04281498A - 騒音除去装置 - Google Patents

騒音除去装置

Info

Publication number
JPH04281498A
JPH04281498A JP3069189A JP6918991A JPH04281498A JP H04281498 A JPH04281498 A JP H04281498A JP 3069189 A JP3069189 A JP 3069189A JP 6918991 A JP6918991 A JP 6918991A JP H04281498 A JPH04281498 A JP H04281498A
Authority
JP
Japan
Prior art keywords
noise
acoustic transducer
input
signal
microphone
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3069189A
Other languages
English (en)
Inventor
Junichiro Fujimoto
潤一郎 藤本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP3069189A priority Critical patent/JPH04281498A/ja
Publication of JPH04281498A publication Critical patent/JPH04281498A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【技術分野】本発明は、騒音除去装置、より詳細には、
音声認識装置に用いて好適な騒音除去装置、換言すれば
、騒音中での音声認識を可能にする騒音除去装置に関す
る。
【0002】
【従来技術】近年、音声による機器のコントロール、つ
まり音声認識の技術が注目を浴び、利用されるようにな
って来ている。通常、音声認識では音声を収集する音響
変換器としてマイクロフォンを使い、これから入力され
た音声を特徴量に変換し、パターンマッチングや統計的
な手法、あるいはニュラルネットなど音声認識技術とし
て知られた技術を用いて認識し、結果を出す。このよう
な音声認識を利用する上で、妨害となるものは、いうま
でもなく騒音である。ここで言う騒音とは、マイクロフ
ォンから入力される利用者の音声以外のものを指す。大
きな騒音が混入すると2つの問題が起こる。第1は音声
区間の検出ができないことである。一般に、音声区間の
検出は、新美著;情報科学講座E・19・3;「音声認
識」(共立出版)に紹介されているようにマイクロフォ
ン入力の信号レベルが決められたしきい値を越えるかど
うかによって判断している。騒音のレベルが大きくなる
と、騒音によってしきい値を越えてしまうことがある。 特に、騒音の大きさがダイナミックに変動している時に
この問題が発生する。第2は特徴パターンが変ってしま
うことである。これはマイクロフォンからの入力を分析
する際、音声以外の信号が加わり、加わったままで特徴
変換するため、同じ音声でも環境騒音が違うと、特徴パ
ターンも違ってしまう。従って、正確な音声認識ができ
ないことになる。
【0003】これに対し、最近、音声認識の音声信号か
ら騒音を除去する方法が提案されているが、ここでは本
発明に関係するものと、よく利用される重要なものを取
り上げ、簡単に述べる。まず、スペクトラム・サブトラ
クション法(SS法)は音声入力用のマイクロフォンか
ら入力される信号の、音声が入力されない時の信号を特
徴分析し、騒音の特徴として記憶しておく。この特徴を
、音声入力されたときの特徴から差し引き、その結果を
音声認識用の特徴量として使うものである。この方法は
簡単に実現できる反面、ダイナミックな騒音に弱いと言
う欠点をっている。他にくし歯型フィルタを使う方法な
どもあるがフィルタの周波数決めが難しいことや、SS
法同様、ダイナミックな騒音に弱いと言う欠点を持って
いる。
【0004】また、このようなダイナミックな騒音に対
しても効力を持つように考えられたものとして、2本の
マイクロフォンを用いる方法がある。図8は、2本のマ
イクロフォンを用いる場合の従来技術の例を説明するた
めの図で、この方法では、1つのマイクロフォンMsを
音声認識用(信号源)に、他方のマイクロフォンMnを
騒音用(雑音源)に使うもので、音声と騒音に相関が無
いと言う前提で、両者の差を最小にするように適応フィ
ルタFaの定数を変化させるものである。この結果、得
られる信号は、騒音を含まない音声だけのものに近くな
って騒音除去ができるというものである。この方法は計
算量が多いと言う欠点はあるが、他の方法に比べてダイ
ナミックな騒音を除去することができ、騒音の除去能力
は最も強い。
【0005】上記の方法をもとに、計算量を減らしたも
のが提案されている。図9は、この計算量を減らした従
来技術の一例を説明するための図で、音声が入力されな
い時の、騒音入力用マイクロフォンMnに対する音声入
力用マイクロフォンMsのレベル比k、k=Ss/Sn
(式(1))、を求めておき(ただし、Ssは音声入力
用マイクロフォンの出力をスペクトルに変換したレベル
、Snは騒音用マイクロフォンの出力をスペクトルに変
換したレベルである)、音声が入力された時には認識用
データSとして、S=Ss−K・Sn(式(2))を出
力するものである。しかし、この方法では、一つの装置
に対して音声入力が複数箇所でできないと言う欠点があ
った。また、騒音検出用のマイクロフォンを複数持って
いて、利用者がその間を移動しているような場合、話者
の移動にともなって騒音が変化するため、式(1)から
kが計算された直後でないと正しく騒音がキャンセルで
きないと言う欠点があった。
【0006】
【目的】本発明は、上述のごとき実情に鑑みてなされた
もので、(1)騒音中の音声認識を実現し、しかも一つ
の音声認識装置に対して複数のマイクロフォン入力がで
きるようにすること、(2)騒音中の音声認識を実現し
、しかも話者の移動にともなって変化する式(1)のk
を補正する方法を提供すること、を目的としてなされた
ものである。
【0007】
【構成】本発明は、上記目的を達成するために、(1)
音声認識装置へ音声入力用の音響変換器を複数有し、こ
れとは別に騒音検出用の音響変換器を有し、該騒音検出
用の音響変換器とそれぞれの音声入力用の音響変換器と
の関係を記憶する記憶部とを有し、それぞれの音声入力
用の音響変換器に入力された信号から、騒音検出用の音
響変換器に入力された信号にそれぞれの音声入力用音響
変換器に対応する記憶部に記憶されたデータを用いて操
作を加えた上で差し引くことによって不要な信号を減ず
るようにしたことを特徴としたものであり、更には、(
2)上記(1)において、音声入力用の音響変換器と騒
音用の音響変換器の出力の関係を記憶しておき、操作を
加えた上で音声入力用の音響変換器の出力から差し引く
際に、前記記憶された関係の1部または全部を用いて代
用して操作を加えた上で差し引くことによって不要な信
号を減ずるようにしたことを特徴としたものであり、或
いは、(3)音声認識装置への音声入力用の音響変換器
と、これとは別に騒音検出用の複数個の音響変換器と、
それぞれの騒音検出用の音響変換器と前記音声入力用の
音響変換器との関係を求めて記憶する記憶部とを有し、
前記音声入力用の音響変換器に入力された信号から、そ
れぞれの騒音検出用の音響変換器に入力された信号に前
記音声入力用音響変換器に対応する記憶部に記憶された
データと重みによって操作を加えて上で差し引くことに
よって不要な信号を減じることを特徴としたものであり
、更には、上記(3)において、(4)音声入力用の音
響変換器の近辺から決められた信号を発し、騒音用の音
響変換器で受信した結果によって前記重みを決定するこ
と、或いは、前記(4)において、(5)音声入力用の
音響変換器の近辺から発する信号として、音声認識の分
析帯域内の複数の周波数信号を使うこと、或いは、(6
)音声入力用の音響変換器の近辺から発する信号として
、音声認識の分析帯域外の信号を使うこと、或いは、(
7)音声入力用の音響変換器の近辺から発する信号とし
て、継続時間の短い信号を使うことを特徴としたもので
ある。以下、本発明の実施例に基いて説明する。
【0008】図1は、請求項1に記載の発明の一実施例
を説明するための構成図で、この例は、音声認識用のマ
イクロフォンが2本(Ms1,Ms2)と騒音入力用の
マイクロフォンが1本(Mn)の場合の構成例を示すが
、勿論、マイクロフォンの数を限定するものではない。 音声認識装置によっては、1台で多入力のものがあり、
複数の話者が利用できるようになっている。ここでは、
話者は2人で、同じ騒音環境下に居るものと仮定されて
いる。従来の方法と同様、騒音入力用のマイクロフォン
Mnと音声入力用マイクロフォンMs1の関係を調べ、
係数k1(k1=Ss1/Sn)として係数k1部に記
憶し、マイクロフォンMnとマイクロフォンMs2の関
係を係数k2(k2=Ss2/Sn)として係数k2部
に記憶しておく。求めた係数k1,k2をS=Ss−k
i・Snに代入すると(ただし、iはマイクロフォンの
番号)、Ss1−k1・Sn,Ss2−k2・Snが求
まり、騒音の影響を小さくした音声信号Sが得られる。 騒音の環境が同じであれば、1つの騒音検出マイクロフ
ォンで騒音キャンセルができる。
【0009】一方、騒音用のマイクロフォンが複数必要
となる時がある。例えば、話者がワイヤレスのマイクロ
フォンで動きながら入力するような場合、話者の動きに
つれて騒音環境も変化する。図2は、上述のごときワイ
ヤレスマイクロフォンで動きながら入力する場合の騒音
環境の変化を補正する場合の一例(請求項2に記載の発
明)を説明するための図で、この場合、マイクロフォン
Mn1,Mn2は騒音検出用のもので、マイクロフォン
Msが音声入力用である。音声はワイヤレスマイクMs
で動きながら発声するものとする。先にも述べたように
、騒音用のマイクは2つで説明するが、それ以上多くて
も良い。できればワイヤレスマイクと普通のマイクの特
性を補正する回路を設けるのが良いが、説明ではこれは
無いものとする。仮に1つの部屋の中の両端に異なる騒
音源があって、それらを騒音環境A、騒音環境Bと呼ぶ
ことにする。騒音環境AにはマイクロフォンMn1が取
付けてあり、騒音環境BにはマイクロフォンMn2が取
付けてあるものとする。まず、話者が騒音環境Aに行っ
た場合は、式(1)に従ってk1が計算され、認識時に
は、スイッチS1をC接点に接続することにより、この
k1を使って式(2)に従い、騒音をキャンセルするこ
とができる。また、話者が、騒音環境Bに居る時は、ス
イッチS1をa接点に接続することにより、騒音環境A
と同じやり方で騒音のキャンセルが実行できる。つぎに
、この話者が騒音環境AからBへ動く途中に音声入力の
必要性があるとすると、この環境では騒音環境AでもB
でもなく、今までのやりかたでは騒音のキャンセルがで
きない。このような時は式(1)のkとしてk1とk2
の平均を取ったものを用い、マイクロフォンMn1とM
n2の出力信号の平均にこのkをかけて、スイッチS1
をb接点に接続することにより、式(2)に従って騒音
のキャンセルを行なうことができる。ただし、マイクロ
フォンMn1とMn2の距離が大きく離れている時には
音声の遅延分を考慮する必要がある。
【0010】図3は、請求項3に記載の発明の一実施例
を説明するための構成図で、図中、マイクロフォンMn
1,Mn2は騒音検出用のもので、マイクロフォンMs
が音声入力用である。図2の場合と同様、音声はワイヤ
レスマイクで動きながら発声するものとする。騒音用の
マイクロフォンは2つとして説明するが、それ以上多く
ても良い。従来の方法と同様、騒音入力用のマイクロフ
ォンMn1と音声入力用マイクロフォンMsの関係を調
べ、係数k1として記憶し、マイクロフォンMn2とマ
イクロフォンMsの関係を係数k2として記憶しておく
。 また、重みW1,W2はそれぞれ2個づつ記されている
が、これは分かりやすくするためのものであって、両側
に同じ重みをつけると言う意味である。さらに、この重
みの大きさは自由に変化させることができる。仮に1つ
の部屋の中の両端に異なる騒音源があって、それらを騒
音環境A、騒音環境Bと呼ぶことにする。騒音環境Aに
はマイクロフォンMn1が取付けてあり、騒音環境Bに
はマイクロフォンMn2が取付けてあるものとする。話
者がこれらの環境を移動する時、重みを変化させる。話
者が騒音環境Aに居る時には重みW1は1、その位置に
よって重みW2が0となり、話者が騒音環境Bに居る時
には重みW2は1、重みW1が0となり、さらに、その
中間においては、その位置に応じて重みW1と重みW2
の和が1となるようにそれぞれの重み量を変化する。
【0011】図4は、請求項4に記載の発明の一実施例
を説明するための図で、この例は、図3に示した実施例
において、音声入力用のマイクロフォンMsに、発振子
1、スイッチS2、発振器2等を設け、これらにより正
確に話者の位置を推定して、より正確に騒音除去を行う
ようにしたものである。図4において、まず、音声入力
する前に、利用者はマイクロフォンMsについているス
イッチS2を押して、発振子1より信号を発生させる。 騒音検出用マイクロフォンMn1,Mn2でその信号を
受けて検波してその大きさをもとめ、重みW1,W2の
比を決めるようにする。それに続き、kiを求め、それ
から音声を入力する。勿論、重みとkiを求める順序は
どちらが先になっても良いことはいうまでもない。
【0012】しかし、図4に示した例は、ある騒音環境
から異なる環境へと移動しながら使用するものであるか
ら、部屋等の環境の影響を受けやすい。従って、特定の
周波数の信号のみを用いていると、場所によって信号と
反射音の干渉が起こり、正確な話者の位置が推定できな
くなってしまう。そこで、このような場合には、請求項
5に記載の発明のように、音声入力用の音響変換器の近
辺から信号として、音声認識の分析帯域内の複数の周波
数信号を使う様にする。
【0013】しかし、上記の方法は、マイクロフォンM
sから信号を発信して、その信号がマイクロフォンMn
1,Mn2へ到達した時の大きさを測定して、マイクロ
フォンMsの位置を推定していることになるから、信号
を発してから音声を入力するまでに話者が動いてしまう
と、効果は小さくなってしまう。このようなため、図5
に示した実施例においては(請求項6)、音声入力用の
音響変換器の近辺からの信号として、音声認識の分析帯
域外の信号を使うようにしている。このように分析帯域
外の信号を常に出しながら音声入力を実施すると、音声
分析の前段階でこの信号を取りだして2つの重みを刻々
と変化させれば、重みは話者の移動に伴って変化し、移
動中にも正確に追随させることができる。
【0014】以上に説明した方法ではマイクロフォンM
sから発生された信号をマイクロフォンMn1,Mn2
で受信し、その振幅についてのみ取扱っていたが、振幅
以外にも、信号が2つのマイクロフォンへ達する遅延分
を考慮して同様の目的を達することができる。図7は、
その場合の一実施例を説明するための図で、この実施例
では、音声入力用の音響変換器の近辺からの信号として
、継続時間の短い信号、例えば、図6に示すようなバー
スト波を使い、このバースト波信号をマイクロフォンM
n1,Mn2において受信し、その受信信号の立上がり
を重みの変化に反映するようにしている。まず、立上が
り時間差からは、直接音の到達時間差を知ることができ
るから、話者の位置が求められる。できればこのバース
ト波を複数回発してその平均を求めればより精度は向上
する。この結果から、遅れている方のマイクロフォンの
重みを遅れている量に応じて小さくなるようにすると良
い。これは信号の立ち下がりによって行なうことも可能
であるが、部屋の反射音の影響が強く、立上がりを利用
するほどの精度は得られない。
【0015】以上に、本発明の各請求項に対応した説明
を行ったが、それぞれの発明の方法を単独で実施しても
良いし、それらの組合せで実施しても良いことは言うま
でもない。また、本発明は騒音のキャンセルにかかるも
のであって、認識部は特に限定するものではないので詳
しくは説明しない。また、ここでの説明には特徴パラメ
ータの種類は触れていないが、それは後段の音認識の方
式に依るところが大きいためで、音声認識方式が決れば
、それに従って決ってくる。なお、特徴パラメータとし
てはスペクトルや線形予測係数等が知られている。
【0016】
【効果】以上の説明から明らかなように、請求項1乃至
2の発明によると、騒音中の音声認識を実現し、しかも
一つの音声認識装置に対して複数のマイクロフォン入力
が可能となった。また、請求項3の発明によると、騒音
中の音声認識を実現し、複数の騒音環境と、その中間で
の音声認識が可能となった。更に、請求項4乃至7の発
明によると、話者が騒音環境内を音声認識をさせながら
移動している場合でも正確に騒音除去ができ、さらに、
音声認識中にも話者の位置を推定するので、認識させな
がら移動している場合にも正確な騒音除去ができる。
【図面の簡単な説明】
【図1】  請求項1に記載の発明の一実施例を説明す
るための構成図である。
【図2】  請求項2に記載の発明の一実施例を説明す
るための構成図である。
【図3】  請求項3に記載の発明の一実施例を説明す
るための構成図である。
【図4】  請求項4に記載の発明の一実施例を説明す
るための構成図である。
【図5】  請求項6に記載の発明の一実施例を説明す
るための構成図である。
【図6】  バースト信号波形の例を示す図である。
【図7】  請求項7に記載の発明の一実施例を説明す
るための構成図である。
【図8】  適応フィルタを用いた騒音除去方法の従来
技術の一例を説明するための図である。
【図9】  従来の簡易型騒音除去装置の一例を説明す
るための図である。
【符号の説明】
Mn,Mn1,Mn2…騒音入力用マイクロフォン、M
s,Ms1,Ms2…音声入力用マイクロフォン、S1
,S2…スイッチ、1…発振子、2…発振器。

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】  複数個の音声入力用の音響変換器と、
    騒音検出用の音響変換器と、該騒音検出用の音響変換器
    と前記音声入力用の各音響変換器との関係を求めて記憶
    する記憶部とを有し、前記各音声入力用の音響変換器に
    入力された信号から、前記騒音検出用の音響変換器に入
    力された信号に前記各音声入力用音響変換器に対応する
    記憶部に記憶されたデータを用いて操作を加えた上で差
    し引くことを特徴とする騒音除去装置。
  2. 【請求項2】  請求項1において、音声入力用の音響
    変換器と騒音用の音響変換器の出力の関係を記憶してお
    き、操作を加えた上で前記各音声入力用の音響変換器の
    出力から差し引く際に、前記記憶された関係の1部また
    は全部を用いて代用して操作を加えた上で差し引くこと
    を特徴とする騒音除去装置。
  3. 【請求項3】  音声入力用の音響変換器と、騒音検出
    用の複数個の音響変換器と、該各騒音検出用の音響変換
    器と前記音声入力用の音響変換器との関係を求めて記憶
    する記憶部とを有し、前記音声入力用の音響変換器に入
    力された信号から、前記騒音検出用の各音響変換器に入
    力された信号に前記音声入力用音響変換器に対応する記
    憶部に記憶されたデータと重みとによって操作を加えた
    上で差し引くことを特徴とする騒音除去装置。
  4. 【請求項4】  請求項3において、音声入力用の音響
    変換器の近辺に発振器を具備し、該発振器から決められ
    た信号を発し、この信号を騒音用の音響変換器で受信し
    た結果によって前記重みを決定することを特徴とする騒
    音除去装置。
  5. 【請求項5】  請求項4において、音声入力用の音響
    変換器の近辺から発する信号として、音声認識の分析帯
    域内の複数の周波数信号を使うことを特徴とする騒音除
    去装置。
  6. 【請求項6】  請求項4において、音声入力用の音響
    変換器の近辺から発する信号として、音声認識の分析帯
    域外の信号を使うことを特徴とする騒音除去装置。
  7. 【請求項7】  請求項4において、音声入力用の音響
    変換器の近辺から発する信号として、継続時間の短い信
    号を使うことを特徴とする騒音除去装置。
JP3069189A 1991-03-08 1991-03-08 騒音除去装置 Pending JPH04281498A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3069189A JPH04281498A (ja) 1991-03-08 1991-03-08 騒音除去装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3069189A JPH04281498A (ja) 1991-03-08 1991-03-08 騒音除去装置

Publications (1)

Publication Number Publication Date
JPH04281498A true JPH04281498A (ja) 1992-10-07

Family

ID=13395535

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3069189A Pending JPH04281498A (ja) 1991-03-08 1991-03-08 騒音除去装置

Country Status (1)

Country Link
JP (1) JPH04281498A (ja)

Similar Documents

Publication Publication Date Title
US10580411B2 (en) Talker change detection
US5208864A (en) Method of detecting acoustic signal
US9031259B2 (en) Noise reduction apparatus, audio input apparatus, wireless communication apparatus, and noise reduction method
KR102352927B1 (ko) 상관 기반 근접장 검출기
US9215527B1 (en) Multi-band integrated speech separating microphone array processor with adaptive beamforming
JP5706513B2 (ja) 空間オーディオプロセッサおよび音響入力信号に基づいて空間パラメータを提供する方法
US7366662B2 (en) Separation of target acoustic signals in a multi-transducer arrangement
KR101449433B1 (ko) 마이크로폰을 통해 입력된 사운드 신호로부터 잡음을제거하는 방법 및 장치
US20170140771A1 (en) Information processing apparatus, information processing method, and computer program product
KR20090050372A (ko) 혼합 사운드로부터 잡음을 제거하는 방법 및 장치
RU2760097C2 (ru) Способ и устройство для захвата аудиоинформации с использованием формирования диаграммы направленности
US20130218559A1 (en) Noise reduction apparatus, audio input apparatus, wireless communication apparatus, and noise reduction method
US20140044274A1 (en) Estimating Direction of Arrival From Plural Microphones
RU2758192C2 (ru) Звукозапись с использованием формирования диаграммы направленности
RU2759715C2 (ru) Звукозапись с использованием формирования диаграммы направленности
KR100657912B1 (ko) 잡음 제거 방법 및 장치
KR100992656B1 (ko) 음향 및 비음향 센서를 이용한 유성음 및 무성음 감지시스템 및 방법
Schwartz et al. Multi-microphone voice activity and single-talk detectors based on steered-response power output entropy
JPH04281498A (ja) 騒音除去装置
JP4542538B2 (ja) ダブルトーク状態判定方法、その方法を用いた反響消去装置、そのプログラム及びその記録媒体
CN110140171B (zh) 使用波束形成的音频捕获
Yousefian et al. Power level difference as a criterion for speech enhancement
JPH0327698A (ja) 音響信号検出方法
Dinesh et al. Real-time Multi Source Speech Enhancement for Voice Personal Assistant by using Linear Array Microphone based on Spatial Signal Processing
Krikke et al. Who Said That? A Comparative Study of Non-Negative Matrix Factorisation and Deep Learning Techniques