JPH04212600A - 音声入力装置 - Google Patents

音声入力装置

Info

Publication number
JPH04212600A
JPH04212600A JP2405395A JP40539590A JPH04212600A JP H04212600 A JPH04212600 A JP H04212600A JP 2405395 A JP2405395 A JP 2405395A JP 40539590 A JP40539590 A JP 40539590A JP H04212600 A JPH04212600 A JP H04212600A
Authority
JP
Japan
Prior art keywords
power
audio signal
signal
microphone
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2405395A
Other languages
English (en)
Inventor
Toru Miyamae
徹 宮前
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2405395A priority Critical patent/JPH04212600A/ja
Publication of JPH04212600A publication Critical patent/JPH04212600A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、指向性マイクロホン
を複数個使用し、この中から最適な音声信号を選択して
音声認識装置などに音声信号を供給する音声入力装置に
関する。
【0002】
【従来の技術】従来、音声認識装置などの音声入力部に
マイクなどから供給される音声信号に含まれる雑音をな
るべく少なくすることが、音声認識装置における音声認
識率を高くするために要請されている。そこで音声認識
を行う場合の雑音を除去する方法がいろいろ考えられて
いる。(1)その一つは、マイクロホンなどで空間の音
波を電気信号に変換する場合に雑音を含まないように集
音する方法、(2)もう一つはマイクロホンなどで音波
を電気信号に変換した後に、信号処理などを行い所望の
音声信号のみを抽出する方法などが考えられる。
【0003】前記(1)の方法においては、例えば指向
性の狭い角度のマイクなどを使用すると、特定の狭い範
囲の音源からの音波のみを集音した電気信号のみを得や
すい。
【0004】また前記(2)の方法においては、所望の
音源からの電気信号(例えば音声信号)の回りに含まれ
る背景雑音を、フィルタによって所望の音声信号のみを
濾波して雑音を除去するという方法である。
【0005】
【発明が解決しようとする課題】しかしながら、以上述
べた音声入力方法では次のような問題があった。つまり
、指向性の狭い角度のマイクを用いた場合でも、マイク
ロホンの指向方向から到来する雑音に対する除去は前記
(1)の方法では除去できない。また前記(2)の方法
においては定常的な雑音に対しては対処が可能であるが
、突発的な雑音(ランダム雑音)の発生に対しては対処
することが困難であった。
【0006】この発明は、以上の課題に鑑み為されたも
のであり、その目的とするところは最適な音声信号を選
択し外部へ供給する音声入力装置を提供することである
【0007】
【課題を解決するための手段】この発明は、以上の目的
を達成するために、指向性の狭い角度の複数のマイクロ
ホンで集音した音声信号のパワーやSNR(Signa
l  to  NoiseRatio)を測定し、最適
な音声信号を供給するマイクロホンを選択するように音
声入力装置を改良した。
【0008】つまり、指向性マイクロホンを複数個用い
て音声信号を集音し、集音した複数の音声信号から所望
の音声信号を得る音声入力装置において、前記複数のマ
イクロホンで集音された音声信号が所望の位置の音源か
ら発音されたものか否かを判断する判断手段と、所望の
位置から発音された音声信号と判断されれば音声信号の
信号対雑音比情報又はパワー情報の最大値によって所望
の音声信号を選択する選択手段を有することを特徴とす
る。
【0009】
【作用】この発明によれば、判断手段によって複数の指
向性マイクロホンで集音された音声信号が所望の位置の
音源から発音されたものかどうかを判断することによっ
て、所望の話者から発音された者かどうかが判断され、
所望の位置の音源からの音声信号と判断されれば選択手
段によって、複数の音声信号のSNR情報又はパワー情
報の最大値の音声信号を選択することによって最適な音
声信号を得ることができ、所望の位置以外の音源からの
雑音信号は選択されない。
【0010】
【実施例】次にこの発明に係る音声入力装置の好適な一
実施例を図面を用いて説明する。図中同一部材には同一
符号を付す。
【0011】第1図は音声入力装置1の機能ブロック図
を示す。図中A1〜Anはマイクロホン、B1〜Bnは
パワー測定器、C1〜CnはSNR測定器、11は比較
回路、12は選択回路である。2は音声認識装置である
【0012】この音声入力装置1には、指向性の狭い角
度のマイクロホンA1〜Anが空間上に適当に配置され
、それぞれのマイクロホンで電気信号の音声信号Si1
〜Sinに変換されるとそれぞれ対応するパワー測定器
B1〜Bnに供給される。パワー測定器B1〜Bnにお
いては供給された音声信号のパワー及び雑音のパワーを
測定する。音声信号をx(t)と表すとパワーPは、x
2(t)の平均値として表される。ここで得られた音声
信号のパワーをそれぞれS1〜Snとし、また音声信号
が入力されていない時の信号を雑音としてこの雑音のパ
ワーをN1〜Nnとする。この音声信号のパワーS1〜
Sn及び雑音のパワーN1〜Nnはそれぞれのパワー測
定器B1〜Bnから、SNR測定器C1〜Cnと選択回
路12に供給される。
【0013】SNR測定器C1〜Cnでは入力された音
声信号のパワーS1〜Snと雑音のパワーN1〜Nnか
らSNRを算出する。それぞれのSNR測定器C1〜C
nで得られたSNR1〜SNRnは選択回路12に供給
される。比較回路11では、入力された音声信号のパワ
ー信号S1〜Snが規定の領域内の音源から発っせられ
たものであるか否かを確認する。ここで規定の領域で発
せられた音声であると判断されれば、選択可能信号を選
択回路12に供給する。
【0014】ここで前記規定の領域内の音源から発せら
れたものであるか否かの判断方法は次のようにして行う
。つまり前記パワー測定器A1〜Anから供給される音
声信号のパワー信号S1〜Snの中で、最大パワーをS
maxとし、最小パワーをSminとするときに、Sm
ax/Smin  <  1+Th  の条件(1)を
満足するか否かを判断する。ここでThはしきい値を表
すものであり、各マイクの空間配置やマイクの利得等で
調整されて定められる定数である。尚前記の条件は一つ
の例である。
【0015】この条件を満たさない場合には、マイクロ
ホンの指向性の領域内で発せられた音声ではないと判断
して、前記選択可能信号を選択回路12には供給しない
。しかしながら条件を満足すると判断されれば選択可能
信号を選択回路12に供給する。この比較回路11にお
ける処理は後述の選択回路12で最終的に最適なマイク
ロホンからの音声信号を一つ選択する上での前処理的な
機能を果たす。
【0016】ここで比較回路11を実現するための回路
構成の例を図2を用いて次に示す。図において比較回路
11は、最大値検出器111と最小値検出器112と割
算器113と比較器114で構成される。SNR測定器
C1〜Cnから供給された音声信号のパワー信号S1〜
Snはそれぞれ最大値検出器111と最小値検出器11
2に供給され、最大値SmaxとSminが格納される
。次に割算器113においてSmaxとSminを割算
し、次に比較器114において割算結果が、外部より入
力された値(1+Th)よりも小さいか否かを比較し、
小さければ選択可能信号を出力し、小さくなければ選択
可能信号を出力しない。
【0017】選択回路12に供給された前記条件(1)
を満たした複数の音声信号のパワー信号SiとそのSN
Rの情報は、ここで一つに選択される。選択方法は次の
ような方法である。つまり入力されたSNRの内、一番
高い値のSNRを示しているマイクロホンの音声信号の
パワー信号Siを選択する。
【0018】選択回路12を実現するための回路構成の
例を図3を用いて次に説明する。図において選択回路1
2は最大値検出器121、122と、選択スイッチ12
3とで構成される。SNR測定器C1〜Cnから供給さ
れたSNR1〜SNRn情報は最大値検出器122に供
給され、最大のSNRが選択される。また前記パワー測
定器B1〜Bnから供給されたパワー信号P1〜Pnも
最大値検出器121に供給され、最大のパワー信号が選
択される。次に比較回路11から選択可能信号が選択ス
イッチ123に供給されていたならば、前記最大のSN
Rを得ることができた音声信号をSi1〜Sinの中か
ら選択して出力する。
【0019】ここで選択された音声信号が最終的にこの
音声入力装置1の出力信号として出力され、この出力信
号は例えば音声認識装置2の音声入力部に供給して、音
声認識すると従来に比べ雑音の影響を抑えた分だけ音声
認識率を高くすることができる。このようにして複数の
マイクロホンで集音された音声信号の内からSNRの良
い音声信号を自動的に選択することができる。
【0020】また上記実施例においてはSNRの値を最
適な音声信号の選択の指標として採用したが、もっと簡
易的にはSNRではなく入力音声信号のパワーPの値で
大小関係を比較し、一番大きいパワーを選択することに
よって最適な音声信号を選択することもできる場合もあ
る。このようにすることによってSNR測定器C1〜C
nを備えることを省略することができるので、ハードウ
エアの規模を小型化することができる。
【0021】次には実際に2個のマイクロホンを使用し
て、前記音声入力装置1を使用した音声認識の運用方法
を図4に示す。図において使用者Cはパーソナルコンピ
ュータ3の前に座って、使用者Cが話した言葉を使用者
Cの左右の前方に2つのマイクロホンA1及びA2を設
置して集音し、集音した音声信号を音声入力装置1と音
声認識装置2経由でパーソナルコンピュータ3で処理し
てパーソナルコンピュータ3のディスプレイに使用者C
が話した言葉を文字列で表示して文章を作成している運
用図である。
【0022】マイクロホンA1の指向性の角度をθ1と
し、マイクロホンA2の指向性の角度をθ2とし、マイ
クロホンA1の指向性の範囲とマイクロホンA2の指向
性の範囲が交差する範囲を交差範囲D(斜線範囲)とし
、マイクロホンA1の指向性の範囲内には雑音源Aが存
在し、この雑音源Aは使用者Cの後方に位置し、またマ
イクロホンA2の指向性の範囲内には雑音源Bが存在し
、この雑音源Bは使用者Cの後方に位置するものとする
【0023】以上のような装置の配置のもとに、音声入
力装置1の動作を説明する。図4において雑音源Aのみ
が存在し雑音を発する場合を説明する。雑音源Aはマイ
クロホンA1の指向性の範囲内に位置し、マイクロホン
A2の指向性の範囲内には位置しない。マイクロホンA
1で集音され、パワー測定器B1で測定された雑音のパ
ワーをN1とし使用者Cが発した音声のパワーをS1と
し、マイクロホンA2で集音され、パワー測定器B2で
測定された雑音のパワーをN2とし使用者Cが発した音
声のパワーをS2とすると、当然に前記雑音源Aはマイ
クロホンA1の指向性の範囲内に位置するのであるから
、雑音のパワーN1>N2となる。
【0024】したがってマイクロホンA1で集音される
音声信号のSNR1とマイクロホンA2で集音される音
声信号のSNR2の関係は、SNR1(=S1/N1)
<SNR2(=S2/N2)となる。このようにして選
択回路12ではマイクロホンA2で集音された音声信号
が音声認識装置2に供給されて、雑音源Aからの雑音信
号は音声認識装置には混入されず、雑音による音声信号
の認識率の低下を生じさせない。
【0025】次に雑音源Bが突発的に雑音を発した場合
の音声入力装置1の動作を説明する。雑音源Bはマイク
ロホンA2の指向性の範囲内に位置し、マイクロホンA
1の指向性の範囲内には位置しない。この場合には雑音
のパワーはN1<N2となり、マイクロホンA2で集音
される雑音のパワーの方が大きくなる。
【0026】したがってSNR1>SNR2となり、選
択回路12ではマイクロホンA1で集音された音声信号
が音声認識装置2に供給される。
【0027】次に雑音源Bが人間であって、使用者Cが
話さずに代わりに雑音源Bの話した音声で音声認識装置
が誤動作していた場合の誤動作防止法をこの実施例に係
る音声入力装置1で説明する。
【0028】上記の誤動作防止法としては、雑音源Bが
規定領域(図4においては、マイクロホンA1の指向性
とマイクロホンA2の指向性の交差範囲D)に存在する
か否かを判断する。判断して規定領域内に存在する場合
にはその音声信号を選択するものとし、しかしながら図
4に示すように雑音源Bが交差範囲D内に存在しないと
判断された場合はこの雑音源Bから発せられた音声信号
を音声認識装置2には供給しない。
【0029】具体的には次のようにして判断する。つま
りマイクロホンA1及びA2において集音し、集音され
た音声信号はそれぞれパワー測定器B1及びB2で測定
し、次にSNR測定器C1、C2においてSNRが算出
され、SNR測定器C1においてはSNR1=S1/N
1を得る。またSNR測定器C2においてはSNR2=
S2/N2を得る。これらのSNR情報は前記選択回路
12に供給される。比較回路11においては次の条件、
前記条件1を変形して例えば1−Th  <  S1/
S2<  1+Th,但し0<Th<<1、例えばTh
=0.1とする(これを条件(2)とする)。この条件
を満足するか否かを確認する。
【0030】つまり、この例においてはマイクロホンA
1とマイクロホンA2は使用者Cから等しい距離に位置
するので、雑音源Bがなければ使用者Cの音声信号のマ
イクロホンA1及びA2におけるパワーはほぼ等しいと
考えられるので、S1/S2はほぼ1に等しいと考えら
れる。したがって前記条件(2)を満足するものとして
選択可能信号を選択回路12に供給し、選択回路12は
SNR測定器C1、C2から供給されたSNR情報の最
大値を検出して、対応する前記マイクロホンA1の入力
音声又は前記マイクロホンA2の入力音声が選択される
【0031】しかしながら図4において雑音源Bは交差
範囲Dの外に位置しているので、雑音源Bから発せられ
た音声によるマイクロホンA2における音声信号のパワ
ーをS2とし、マイクロホンA1における雑音源Bから
の音声信号のパワーをS1とすると、S1とS2の関係
はS1<<S2となる。なぜかというと雑音源Bはマイ
クロホンA1の指向性の範囲外に位置するため、マイク
ロホンA1には雑音源Bから発せられる音声信号は集音
されないためほぼ0に近い。よって前記関係S1<<S
2の関係となり、この関係であると前記条件(2)を満
たさなくなる。よって比較回路11は雑音源Bからの音
声信号によっては選択可能信号を選択回路12に供給し
ないので、音声認識装置2には雑音源Bから音声信号は
出力されない。雑音源がマイクロホンA1及びA2のど
ちらのマイクロホンの指向性の範囲内にも存在しない場
合は、前記条件(2)を満たす可能性はあるが、満たし
たとしても指向性の範囲外であるため、マイクロホンA
1及びA2で集音される音声信号のパワーは、ほぼ0に
近いと考えられるので音声認識の誤動作を招く心配はな
い。このようにして2個の指向性マイクロホンの指向性
の交差範囲内に使用者を配置し、指向性の交差範囲以外
の雑音源からの音声信号を選択しないようにすることが
できる。したがってこのような音声入力装置は、さまざ
まな製品を製造するプラントや航空機や車両などに設置
される音声認識装置や音響装置などの音声入力部として
利用でき、音声認識率の向上等に寄与することができる
【0032】以上の実施例においては、音声認識装置に
供給する音声信号の音声入力装置を例に説明したが、こ
の発明は音声認識装置に限るものではなく、他の音響装
置に供給する場合もこの音声入力装置は応用できる。
【0033】
【発明の効果】以上述べたようにこの発明によれば、次
のような効果を発揮する。
【0034】つまり判断手段と選択手段を有することに
よって、所望の位置の音源からの音声信号のみを音声信
号のパワー情報又はSNR情報の最大値で選択し、所望
の位置以外の音源からの雑音は選択されないので、最適
な音声信号を得ることができる。
【図面の簡単な説明】
【図1】この実施例に係る音声入力装置のブロック図で
ある。
【図2】図1における比較回路の回路図である。
【図3】図1における選択回路の回路図である。
【図4】音声入力装置の運用例概念図である。
【符号の説明】
1  音声入力装置 11  比較回路(判断手段) 12  選択回路(選択手段) A1〜An  マイクロホン B1〜Bn  パワー測定器 C1〜Cn  SNR測定器

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】  指向性マイクロホンを複数個用いて音
    声信号を集音し、集音した複数の音声信号から所望の音
    声信号を得る音声入力装置において、前記複数のマイク
    ロホンで集音された音声信号が所望の位置の音源から発
    音されたものか否かを判断する判断手段と、所望の位置
    から発音された音声信号と判断されれば複数の音声信号
    の信号対雑音比情報又はパワー情報の最大値によって所
    望の音声信号を選択する選択手段を有することを特徴と
    する音声入力装置。
JP2405395A 1990-12-05 1990-12-05 音声入力装置 Pending JPH04212600A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2405395A JPH04212600A (ja) 1990-12-05 1990-12-05 音声入力装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2405395A JPH04212600A (ja) 1990-12-05 1990-12-05 音声入力装置

Publications (1)

Publication Number Publication Date
JPH04212600A true JPH04212600A (ja) 1992-08-04

Family

ID=18514994

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2405395A Pending JPH04212600A (ja) 1990-12-05 1990-12-05 音声入力装置

Country Status (1)

Country Link
JP (1) JPH04212600A (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1081682A2 (en) * 1999-08-31 2001-03-07 Pioneer Corporation Method and system for microphone array input type speech recognition
JP2005045779A (ja) * 2003-07-02 2005-02-17 Fuji Xerox Co Ltd オーディオ装置を管理する方法およびインタフェース・ツール、並びにオーディオ装置を管理するコンピュータが実行するコンピュータ・プログラム製品
JP2007171316A (ja) * 2005-12-20 2007-07-05 Yamaha Corp 収音装置
JP2008040075A (ja) * 2006-08-04 2008-02-21 Toyota Motor Corp ロボット装置及びロボット装置の制御方法
JP2011061422A (ja) * 2009-09-09 2011-03-24 Sony Corp 情報処理装置、情報処理方法およびプログラム
JP2011123370A (ja) * 2009-12-11 2011-06-23 Oki Electric Industry Co Ltd 音源分離装置、プログラム及び方法
JP2011248025A (ja) * 2010-05-25 2011-12-08 Nippon Telegr & Teleph Corp <Ntt> チャネル統合方法、チャネル統合装置、プログラム
JP2019076587A (ja) * 2017-10-26 2019-05-23 株式会社三洋物産 遊技機
JP2019176328A (ja) * 2018-03-28 2019-10-10 沖電気工業株式会社 収音装置、プログラム及び方法

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1081682A2 (en) * 1999-08-31 2001-03-07 Pioneer Corporation Method and system for microphone array input type speech recognition
EP1081682A3 (en) * 1999-08-31 2001-08-01 Pioneer Corporation Method and system for microphone array input type speech recognition
JP2005045779A (ja) * 2003-07-02 2005-02-17 Fuji Xerox Co Ltd オーディオ装置を管理する方法およびインタフェース・ツール、並びにオーディオ装置を管理するコンピュータが実行するコンピュータ・プログラム製品
JP4501556B2 (ja) * 2003-07-02 2010-07-14 富士ゼロックス株式会社 オーディオ装置を管理する方法、装置及びプログラム
JP2007171316A (ja) * 2005-12-20 2007-07-05 Yamaha Corp 収音装置
JP2008040075A (ja) * 2006-08-04 2008-02-21 Toyota Motor Corp ロボット装置及びロボット装置の制御方法
JP2011061422A (ja) * 2009-09-09 2011-03-24 Sony Corp 情報処理装置、情報処理方法およびプログラム
JP2011123370A (ja) * 2009-12-11 2011-06-23 Oki Electric Industry Co Ltd 音源分離装置、プログラム及び方法
JP2011248025A (ja) * 2010-05-25 2011-12-08 Nippon Telegr & Teleph Corp <Ntt> チャネル統合方法、チャネル統合装置、プログラム
JP2019076587A (ja) * 2017-10-26 2019-05-23 株式会社三洋物産 遊技機
JP2019176328A (ja) * 2018-03-28 2019-10-10 沖電気工業株式会社 収音装置、プログラム及び方法

Similar Documents

Publication Publication Date Title
CN109599124B (zh) 一种音频数据处理方法、装置及存储介质
US10043515B2 (en) Voice activation system
US8611554B2 (en) Hearing assistance apparatus
EP1489596B1 (en) Device and method for voice activity detection
US5867581A (en) Hearing aid
US5828997A (en) Content analyzer mixing inverse-direction-probability-weighted noise to input signal
US7558636B2 (en) Apparatus and method for adaptive signal characterization and noise reduction in hearing aids and other audio devices
Nordqvist et al. An efficient robust sound classification algorithm for hearing aids
US20060074686A1 (en) Controlling an apparatus based on speech
US10721562B1 (en) Wind noise detection systems and methods
US9521486B1 (en) Frequency based beamforming
US11558699B2 (en) Hearing device component, hearing device, computer-readable medium and method for processing an audio-signal for a hearing device
US9749741B1 (en) Systems and methods for reducing intermodulation distortion
JPH04212600A (ja) 音声入力装置
KR101689332B1 (ko) 정보 기반 소리 음량 조절 장치 및 그 방법
US10015592B2 (en) Acoustic signal processing apparatus, method of processing acoustic signal, and storage medium
JP2005227512A (ja) 音信号処理方法及びその装置、音声認識装置並びにプログラム
US20200015010A1 (en) Sound pickup device and sound pickup method
JP4493690B2 (ja) 目的音抽出装置,目的音抽出プログラム,目的音抽出方法
JP2010091897A (ja) 音声信号強調装置
US8737652B2 (en) Method for operating a hearing device and hearing device with selectively adjusted signal weighing values
US9190069B2 (en) In-situ voice reinforcement system
US20210151066A1 (en) Audio Device And Method Of Audio Processing With Improved Talker Discrimination
WO2019178802A1 (en) Method and device for estimating direction of arrival and electronics apparatus
US11915681B2 (en) Information processing device and control method