JPS5923397A - 音声認識装置 - Google Patents
音声認識装置Info
- Publication number
- JPS5923397A JPS5923397A JP57133412A JP13341282A JPS5923397A JP S5923397 A JPS5923397 A JP S5923397A JP 57133412 A JP57133412 A JP 57133412A JP 13341282 A JP13341282 A JP 13341282A JP S5923397 A JPS5923397 A JP S5923397A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- power
- section
- input
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
本発明は音声の認識を行なう音声認識装置に関するもの
て・ある。
て・ある。
従来より音声認識装置の望ましい使用条件として、話者
が音声入力部を意識せずに使用できること、即ち音声入
力部を話者に近接して設ける(例えば接話マイクの使用
)のではなく、音声入力部から離れた場所からでも音声
を入力できることが挙げられている。この場合、特に問
題となるのが周囲の雑音であり、周囲雑音は音声認識の
際誤認識をもたらす主たる要因の一つであって、耐雑音
性能の高い音声認識装置が従来より望まれている。
が音声入力部を意識せずに使用できること、即ち音声入
力部を話者に近接して設ける(例えば接話マイクの使用
)のではなく、音声入力部から離れた場所からでも音声
を入力できることが挙げられている。この場合、特に問
題となるのが周囲の雑音であり、周囲雑音は音声認識の
際誤認識をもたらす主たる要因の一つであって、耐雑音
性能の高い音声認識装置が従来より望まれている。
さて、周囲雑音の対処法として従来より提案されている
方法は、1つの音声入力部を通して得られる入力音声に
ついて、例えば、無音状態での雑音のスペクトルパター
ンを記憶しておき、有音状態ニおいて入力音声のスペク
トルパターンカラ前記雑音スペクトルパターンを差引い
た結果を用いて入力音声の認識を行う方法である。しか
し、この方法においては、音声入力部が1つであるため
に、特に、音声入力部と音声の発声点との間に雑音源が
存在する様な場合には入力音声信号の信号対雑音電力比
が劣化し、入力された音声信号に対し上記の様な処理を
施しても顕著な効果が期待できない。
方法は、1つの音声入力部を通して得られる入力音声に
ついて、例えば、無音状態での雑音のスペクトルパター
ンを記憶しておき、有音状態ニおいて入力音声のスペク
トルパターンカラ前記雑音スペクトルパターンを差引い
た結果を用いて入力音声の認識を行う方法である。しか
し、この方法においては、音声入力部が1つであるため
に、特に、音声入力部と音声の発声点との間に雑音源が
存在する様な場合には入力音声信号の信号対雑音電力比
が劣化し、入力された音声信号に対し上記の様な処理を
施しても顕著な効果が期待できない。
本発明は、上記欠点に鑑み音声認識の性能劣化の主たる
要因である周囲雑音に対して、音声入力部を複数個設け
、前記それぞれの音声入力部から得られる入力音声信号
の信号対雑音電力比うち最大値を与える入力音声信号を
用いて入力音声の認識を行うことにより、入力音声のス
サ−・クトルパターンから雑音スペクトルパターンを差
引くととによる周囲雑音除去効果を高めることのできる
音声認識装置を提供するものである。
要因である周囲雑音に対して、音声入力部を複数個設け
、前記それぞれの音声入力部から得られる入力音声信号
の信号対雑音電力比うち最大値を与える入力音声信号を
用いて入力音声の認識を行うことにより、入力音声のス
サ−・クトルパターンから雑音スペクトルパターンを差
引くととによる周囲雑音除去効果を高めることのできる
音声認識装置を提供するものである。
以下、本発明の一実施例について図面を参照しながら説
明する。
明する。
第1図は本発明の一実施例における音声認識装置のブロ
ック図である8 第1図において、1a、1b、〜1C(l−1音声入力
を人力するとともに電気的な音声信号に変換する音声入
力部、2a 、2b 、〜2Cはそれぞれ音声入力部1
a、1b〜1Cから送出される音声信号を基に音声入力
の始端と終端を検出する音声区間検出部、3a、3b、
〜3Cはそれぞれ音声区間検出部2a、2b〜2Cから
送出される有音区間を示す始端検出信号及び終端検出信
号を基にそれぞれの音声人力部1a、1b〜1Cから送
出される音声信号を一定時間ごとにサンプリングすると
ともにその電力を求める電力計算部、4a、4b〜4c
はそれぞれ電力計算部3a 、3b〜3Cの出力を保持
するとともに音声区間検出部2a 、2b〜2Cの指示
により保持していた電力計算結果を出力する電力保持部
、5a、5b〜5Cは後述する信号電力と雑音電力との
比を計算する電力比計算部、6は電力比計算部sa、5
b〜5Cにより計算された信号電力と雑音電力との比の
中から一番大きな電力比を検出する最大電力比検出部、
ya、yb〜7Cは最大電力比検出部6の指示によりそ
れぞれの音声入力部1a、1b〜1Cから送出され一時
保持していた音声信号を出力する音声保持部、8は音声
保持部7a、7b〜7Cのどれか1つから送出されてき
た音声信号から音声入力を認識する音声認識部である。
ック図である8 第1図において、1a、1b、〜1C(l−1音声入力
を人力するとともに電気的な音声信号に変換する音声入
力部、2a 、2b 、〜2Cはそれぞれ音声入力部1
a、1b〜1Cから送出される音声信号を基に音声入力
の始端と終端を検出する音声区間検出部、3a、3b、
〜3Cはそれぞれ音声区間検出部2a、2b〜2Cから
送出される有音区間を示す始端検出信号及び終端検出信
号を基にそれぞれの音声人力部1a、1b〜1Cから送
出される音声信号を一定時間ごとにサンプリングすると
ともにその電力を求める電力計算部、4a、4b〜4c
はそれぞれ電力計算部3a 、3b〜3Cの出力を保持
するとともに音声区間検出部2a 、2b〜2Cの指示
により保持していた電力計算結果を出力する電力保持部
、5a、5b〜5Cは後述する信号電力と雑音電力との
比を計算する電力比計算部、6は電力比計算部sa、5
b〜5Cにより計算された信号電力と雑音電力との比の
中から一番大きな電力比を検出する最大電力比検出部、
ya、yb〜7Cは最大電力比検出部6の指示によりそ
れぞれの音声入力部1a、1b〜1Cから送出され一時
保持していた音声信号を出力する音声保持部、8は音声
保持部7a、7b〜7Cのどれか1つから送出されてき
た音声信号から音声入力を認識する音声認識部である。
上記のように構成された装置において、以下その動作を
説明するー まず音声入力は、音声入力部1a、1b〜1Cにおいて
電気信号(音声信号)に変換され、それぞれの音声区間
検出部2a、2b〜2Cと音声保持部γa 、 7 b
−1cと電力計算部3a、3b〜3Cとに送出される
。次に音声区間検出部2a。
説明するー まず音声入力は、音声入力部1a、1b〜1Cにおいて
電気信号(音声信号)に変換され、それぞれの音声区間
検出部2a、2b〜2Cと音声保持部γa 、 7 b
−1cと電力計算部3a、3b〜3Cとに送出される
。次に音声区間検出部2a。
2b〜2cでは、音声入力部1a、1b〜1cのそれぞ
れの出力に関して人力した音声の始端と糸冬端を検出し
て、その情報を電力計算部3a、3b〜3Cに出力する
と同時に、それぞれが始端を検出した時点て音声イ)(
持部7a、7b〜7Cに音声信号の保持を開始させる信
号を出力し、また、終端を検出した時点で音声保持部7
a、7b〜7Cのそれぞれに音声信号の保持を終了させ
る信号を出力し、さらに終端を検出しだ時点て電力保持
@b4a 、4b〜4Cに対して、保持している電力を
それぞれの電力比計算部6a 、5b〜5cLで出力さ
せる信号を出力する。一方、音声保持部子a。
れの出力に関して人力した音声の始端と糸冬端を検出し
て、その情報を電力計算部3a、3b〜3Cに出力する
と同時に、それぞれが始端を検出した時点て音声イ)(
持部7a、7b〜7Cに音声信号の保持を開始させる信
号を出力し、また、終端を検出した時点で音声保持部7
a、7b〜7Cのそれぞれに音声信号の保持を終了させ
る信号を出力し、さらに終端を検出しだ時点て電力保持
@b4a 、4b〜4Cに対して、保持している電力を
それぞれの電力比計算部6a 、5b〜5cLで出力さ
せる信号を出力する。一方、音声保持部子a。
7b〜7Cば、それぞれが音声区間検出部2a。
2b〜2cのそれぞれにおいて音声区間として判定され
た部分の音声信号を保持する。
た部分の音声信号を保持する。
次に電力計算部3a 、3b〜3Cは、音声人力部1a
、1b〜1Cのそれぞれの出力、即ち音声信号に関して
一定時間隔で電力を求め、始端前での部分(無音状態)
における電力を電力保持部4a 、4b〜4Cのうち、
無音状態における電力計算結果(すなわち、雑音電力)
を保持する部分に出力し、始端から終端までの部分(す
なわち、有音状態)における電力を電力保持部4a 、
4b〜4Cのうち、有音状態における電力計算結果(音
声電力)を保持する部分に出力する。次に電力保持部4
a、4b 〜4cでは、電力計算部3a、3b〜3Cの
それぞれの出力(雑音電力及び音声電力)を、雑音電力
は雑音電力を保持すべき領域に、また信号電力は信号電
力を保持すべき領域に、それぞれ保持し、音声区間検出
部2a 、2b〜2Cのそれぞれから、保持している電
力を電力比計算部5a 、5b〜6Cに出力すべき信号
が入力された時点で、前記電力を電力比計算部5a 、
5b〜5cに出力する。次に電力比計算部5a、6b〜
5cでは、電力保持部4a、4b〜4cのそれぞれから
の出力、即ち前記電力を用いて、各音声入力部1a、1
b〜1Cに入力された音声の音声対雑音電力比を計算し
、最大電力比検出部6に出力する。
、1b〜1Cのそれぞれの出力、即ち音声信号に関して
一定時間隔で電力を求め、始端前での部分(無音状態)
における電力を電力保持部4a 、4b〜4Cのうち、
無音状態における電力計算結果(すなわち、雑音電力)
を保持する部分に出力し、始端から終端までの部分(す
なわち、有音状態)における電力を電力保持部4a 、
4b〜4Cのうち、有音状態における電力計算結果(音
声電力)を保持する部分に出力する。次に電力保持部4
a、4b 〜4cでは、電力計算部3a、3b〜3Cの
それぞれの出力(雑音電力及び音声電力)を、雑音電力
は雑音電力を保持すべき領域に、また信号電力は信号電
力を保持すべき領域に、それぞれ保持し、音声区間検出
部2a 、2b〜2Cのそれぞれから、保持している電
力を電力比計算部5a 、5b〜6Cに出力すべき信号
が入力された時点で、前記電力を電力比計算部5a 、
5b〜5cに出力する。次に電力比計算部5a、6b〜
5cでは、電力保持部4a、4b〜4cのそれぞれから
の出力、即ち前記電力を用いて、各音声入力部1a、1
b〜1Cに入力された音声の音声対雑音電力比を計算し
、最大電力比検出部6に出力する。
そして最大電力比検出部6は、各電力比計算部sa、5
b〜6Cからの出力、即ち電力比のうちの最大値を検出
し、最大電力比を与えた電力保持部4a、4b〜4Cの
うちの1つに対応する音声保持部7a、7b〜7cに対
して、保持している音声信号を音声認識部8に出力させ
るだめの信号すなわち保持音声信号出力信号を送出する
。そして最終的に音声認識部8は、音声保持部子a、7
b〜7Cのうち、最大電力比を与える音声保持部からの
音声信号を用いて入力音声の認識を行い、認識結果を出
力する。
b〜6Cからの出力、即ち電力比のうちの最大値を検出
し、最大電力比を与えた電力保持部4a、4b〜4Cの
うちの1つに対応する音声保持部7a、7b〜7cに対
して、保持している音声信号を音声認識部8に出力させ
るだめの信号すなわち保持音声信号出力信号を送出する
。そして最終的に音声認識部8は、音声保持部子a、7
b〜7Cのうち、最大電力比を与える音声保持部からの
音声信号を用いて入力音声の認識を行い、認識結果を出
力する。
次に第1図で示しだ複数個の音声入力部1a。
1b〜1cについて、第2図を用いて具体的な配置例を
説明する。
説明する。
第2図は、例えば音声入力部1a、1b〜1cとして同
じ周波数特性を持つ音声入力部11゜12.13.14
を部屋の四隅に配置した場合である。第2図において、
話者15と音声入力部11〜14との距離及び雑音源1
6と音声入力部11〜14との距離をそれぞれS++
、 312 、 S1s 、 314 。
じ周波数特性を持つ音声入力部11゜12.13.14
を部屋の四隅に配置した場合である。第2図において、
話者15と音声入力部11〜14との距離及び雑音源1
6と音声入力部11〜14との距離をそれぞれS++
、 312 、 S1s 、 314 。
nN 、 tN2 、 n+5 、 n+4とするとき
、音声入力部11〜14のそれぞれへ入力される電力は
音声入力部11〜14と音源(話者15又は雑音源16
)との距離の逆数に関する単調増加関数であり、それぞ
れをf (S++ )、 f(S+2) 、 f (S
+s) 、 f (S+4) 。
、音声入力部11〜14のそれぞれへ入力される電力は
音声入力部11〜14と音源(話者15又は雑音源16
)との距離の逆数に関する単調増加関数であり、それぞ
れをf (S++ )、 f(S+2) 、 f (S
+s) 、 f (S+4) 。
f(n11 )、f(n12) 、f(n15) 、f
(n14)で表せば、話者16及び雑音源16と音声入
力部11〜14が第2図の様な配置にある場合に音声入
力部11〜14のそれぞれに入力される信号対雑音電力
比、/’(SN )/、I’(nN ) 、f(S+2
)/f(n+2) 、f(S+3)/7(n+:f(S
14)/f(n14)のうち最大の信号対雑音電力比は
fcss+ )/7(njj )であるだめ、音声入力
部11の入力信号を用いて入力音声の認識を行う。この
様な構成は、話者及び雑音源の移動は殆んどないがそれ
らの存在位置が不明の場合に特に有効である。
(n14)で表せば、話者16及び雑音源16と音声入
力部11〜14が第2図の様な配置にある場合に音声入
力部11〜14のそれぞれに入力される信号対雑音電力
比、/’(SN )/、I’(nN ) 、f(S+2
)/f(n+2) 、f(S+3)/7(n+:f(S
14)/f(n14)のうち最大の信号対雑音電力比は
fcss+ )/7(njj )であるだめ、音声入力
部11の入力信号を用いて入力音声の認識を行う。この
様な構成は、話者及び雑音源の移動は殆んどないがそれ
らの存在位置が不明の場合に特に有効である。
以上のように本実施例によれば、複数の音声入力部1a
、ib〜1Cにより音声を入力し、それぞれの音声区間
検出部2a、2b〜2Cにより音声区間を認識するとと
もに、電力計算部3a。
、ib〜1Cにより音声を入力し、それぞれの音声区間
検出部2a、2b〜2Cにより音声区間を認識するとと
もに、電力計算部3a。
3b〜3cにより電力計算を行ない電力比計算部sa
、tsb〜6Cにより音声電力と雑音電力の比を求め電
力比が最大となった入力信号から音声認識部8により音
声認識を行なうことにより雑音を除去できる。
、tsb〜6Cにより音声電力と雑音電力の比を求め電
力比が最大となった入力信号から音声認識部8により音
声認識を行なうことにより雑音を除去できる。
なお、特に雑音の周波数特性が時間と共に変化する様な
場合には、相異った周波数特性を持つ音声入力部を複数
個1ケ所に設置し、雑音電力の大きな領域に関する利得
が小さな音声入力部からの・)、入力信号を用いて入力
音声の認識を行なってもよい。
場合には、相異った周波数特性を持つ音声入力部を複数
個1ケ所に設置し、雑音電力の大きな領域に関する利得
が小さな音声入力部からの・)、入力信号を用いて入力
音声の認識を行なってもよい。
さらに、本実施例においては、音声区間検出部2 a
、 21)−−2C,音声保持部子a、了り〜了C1電
力計算部sa 、3b〜3c、電力保持部4a。
、 21)−−2C,音声保持部子a、了り〜了C1電
力計算部sa 、3b〜3c、電力保持部4a。
4b〜4C1電力比計算部6a、5b〜5cを、音声入
力部1a、1b〜1Cのそれぞれに関して設けだが、音
声入力部1a、1b〜1Cだけを複数個とし、音声区間
検出部、音声保持部、電力計算部、電−力保持部、電力
比計算部をそれぞれ1個だけ設け、各音声入力部からの
信号に関して共通で使用するようにしてもよい− また、第1図において、特に音声入力部を2個とした場
合は、最大電力比検出部アは大小判定部に置換えること
もできる。
力部1a、1b〜1Cのそれぞれに関して設けだが、音
声入力部1a、1b〜1Cだけを複数個とし、音声区間
検出部、音声保持部、電力計算部、電−力保持部、電力
比計算部をそれぞれ1個だけ設け、各音声入力部からの
信号に関して共通で使用するようにしてもよい− また、第1図において、特に音声入力部を2個とした場
合は、最大電力比検出部アは大小判定部に置換えること
もできる。
以」二のように本発明は音声認識における誤認識の主た
る要因である周囲雑音に関して、音声入力部を複数個設
けて、それぞれの音声入力部から得られる入力音声信号
の信号対雑音電力比のうち最大値を与える入力音声信号
を用いて人力音声の認識を行うことにより、以下の様な
効果が得られる。
る要因である周囲雑音に関して、音声入力部を複数個設
けて、それぞれの音声入力部から得られる入力音声信号
の信号対雑音電力比のうち最大値を与える入力音声信号
を用いて人力音声の認識を行うことにより、以下の様な
効果が得られる。
■ 周囲雑音の影響をできるだけ避けることができる−
■ 認識結果の信頼度を上げることができる。
■ 更に、同一の周波数特性を持つ音声入力部を複数個
並べた場合には、入力音声のスペクトルパターンから雑
音スペクトルパターンを差引くことによる周囲雑音除去
の効果を高めることもできる。
並べた場合には、入力音声のスペクトルパターンから雑
音スペクトルパターンを差引くことによる周囲雑音除去
の効果を高めることもできる。
第1図は本発明の一実施例における音声認識装置のブロ
ック図、第2図は音声入力部の配置を示した図である。 1 a 、 1 b 〜1 c =・・−・音声入力部
、2a 、2b〜2C・・・・・・音声区間検出部、3
a、3b〜3C・・・・・・電力割算部、4a 、4b
〜4C・・・・・・電力保持部、5a 、6b〜5C・
・・電力比計算部、6・・・・・最大電力比検出部、7
a、7b〜7C・・・・・音声保持部、8・・・・・音
声認識部、 代理人の氏名 弁理士 中 尾 敏 男 ほか1名第1
図 第2図
ック図、第2図は音声入力部の配置を示した図である。 1 a 、 1 b 〜1 c =・・−・音声入力部
、2a 、2b〜2C・・・・・・音声区間検出部、3
a、3b〜3C・・・・・・電力割算部、4a 、4b
〜4C・・・・・・電力保持部、5a 、6b〜5C・
・・電力比計算部、6・・・・・最大電力比検出部、7
a、7b〜7C・・・・・音声保持部、8・・・・・音
声認識部、 代理人の氏名 弁理士 中 尾 敏 男 ほか1名第1
図 第2図
Claims (1)
- 音声を電気信号に変換するとともに、それぞれ別の位置
に設けられた複数の音声入力手段と、前記音声入力手段
から送出された電気信号により音声区間を検出する音声
区間検出手段と、前記音声入力手段から送出された電気
信号により入力信号の電力を割算する電力計算手段と、
前記電力計算手段から送出された電力の比を計算する電
力比計算手段と、複数設けられた前記電力比計算手段の
中から電力比の最大値を検出する最大電力比計算手段と
、前記音声入力手段が変換した音声の電気信号により音
声の認識を行なう音声認識部とを具備し、前記音声区間
検出手段により音声区間でないと判定された状態(無音
状態)で複数個の前記音声入力手段から得られる信号の
それぞれに関して前記電力計算手段を用いて求めた電力
(雑音電力)と、前記音声区間検出手段によシ音声区間
と判定された状態(有音状態)で複数個の前記音声入力
手段から得られる信号のそれぞれに関して前記電力計算
手段を用いて求めた電力(音声電力)との比(音声対雑
音電力比)を前記電力比計算手段により求め、前記最大
電力比検出手段により、複数個の前記音声入力手段に関
する音声対雑音型送出することを特徴とする音声認識装
置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP57133412A JPS5923397A (ja) | 1982-07-29 | 1982-07-29 | 音声認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP57133412A JPS5923397A (ja) | 1982-07-29 | 1982-07-29 | 音声認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS5923397A true JPS5923397A (ja) | 1984-02-06 |
Family
ID=15104158
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP57133412A Pending JPS5923397A (ja) | 1982-07-29 | 1982-07-29 | 音声認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS5923397A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS60166995A (ja) * | 1984-02-10 | 1985-08-30 | 神内 教博 | 音声波検出方法 |
-
1982
- 1982-07-29 JP JP57133412A patent/JPS5923397A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS60166995A (ja) * | 1984-02-10 | 1985-08-30 | 神内 教博 | 音声波検出方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8065115B2 (en) | Method and system for identifying audible noise as wind noise in a hearing aid apparatus | |
JP3435686B2 (ja) | 収音装置 | |
JPS6245730B2 (ja) | ||
US8155327B2 (en) | Tone detector and method used in a robot for detecting a tone | |
JPS5923397A (ja) | 音声認識装置 | |
JPS6257040B2 (ja) | ||
JP2992324B2 (ja) | 音声区間検出方法 | |
JP4531350B2 (ja) | 音声入力装置および音声認識処理システム | |
JP3284968B2 (ja) | 話速変換機能を有する補聴器 | |
JP2870421B2 (ja) | 話速変換機能を有する補聴器 | |
JP6973652B2 (ja) | 音声処理装置、方法およびプログラム | |
JPS6057897A (ja) | 音声区間検出用閾値の設定方法 | |
JP2975808B2 (ja) | 音声認識装置 | |
JPS63278100A (ja) | 音声認識装置 | |
JPS58125099A (ja) | 音声認識装置 | |
JPH06175676A (ja) | 音声検出器 | |
JPH0894731A (ja) | 音源方向検出方法及び装置 | |
JPS60205600A (ja) | 音声認識装置 | |
JP3679310B2 (ja) | 圧縮回路 | |
JPH0573090A (ja) | 音声認識方法 | |
JPH07210186A (ja) | 音声登録装置 | |
JPH0376471B2 (ja) | ||
JPH01287699A (ja) | 雑音除去装置 | |
JPS59231600A (ja) | 音声区間検出方法 | |
JPS59208600A (ja) | 話者照合装置 |