JPS5859497A - 音声認識装置 - Google Patents
音声認識装置Info
- Publication number
- JPS5859497A JPS5859497A JP56158310A JP15831081A JPS5859497A JP S5859497 A JPS5859497 A JP S5859497A JP 56158310 A JP56158310 A JP 56158310A JP 15831081 A JP15831081 A JP 15831081A JP S5859497 A JPS5859497 A JP S5859497A
- Authority
- JP
- Japan
- Prior art keywords
- noise
- voice
- spectrum
- speech
- added
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
この発明は、室内雑音、周囲騒音、伝送路で発生する雑
音などのいろいろな雑音が音声に加わっている場合でも
、N音が加わっていない場合に比較して性能が大fli
tこ低下することなく、安定に動作する音声l&i!!
!織装置に関するものである。
音などのいろいろな雑音が音声に加わっている場合でも
、N音が加わっていない場合に比較して性能が大fli
tこ低下することなく、安定に動作する音声l&i!!
!織装置に関するものである。
機械による音声の自動認識Iズ機械への情報大刀手段と
して人間にとってもつとも自然で便利な手段であると言
える。
して人間にとってもつとも自然で便利な手段であると言
える。
音声認識g&書を使用する環境としては、靜がな室内も
めれば騒音レベルの高い作業現場4あるというようにい
ろいろな状況が考えられる。従って一般的に(1音声g
識装置の入力音声にはいろいろな雑音が加わっており、
この場合音声認識装置の性能は雑音が加わっていない場
合に比較して低下する。
めれば騒音レベルの高い作業現場4あるというようにい
ろいろな状況が考えられる。従って一般的に(1音声g
識装置の入力音声にはいろいろな雑音が加わっており、
この場合音声認識装置の性能は雑音が加わっていない場
合に比較して低下する。
従来こうし穴雑f環境下の音声vl!識4こおいては付
加雑音の影響を少なくするために接話型マイクロホンが
用いられている。しかし接話型マイクロホンの使用はこ
れを使用する人間にとって非常にわずられしいものであ
り1人間工学的な操作性の面から適当であると番1言え
ない。このため音声に雑音が加わっている場合でも安定
に動作する音声g識装置を開発することが望まれてIた
。
加雑音の影響を少なくするために接話型マイクロホンが
用いられている。しかし接話型マイクロホンの使用はこ
れを使用する人間にとって非常にわずられしいものであ
り1人間工学的な操作性の面から適当であると番1言え
ない。このため音声に雑音が加わっている場合でも安定
に動作する音声g識装置を開発することが望まれてIた
。
この発明は音声に加わっているMfを除去する処理を組
み込むことによって、従来の音声認識装置にみられt付
加雑音による性能低下を防ぐことを特徴とし、その目的
は雑音環境下でも接話型!イクロホンを用いることなく
安定に音声認識を行うこと番こめる。
み込むことによって、従来の音声認識装置にみられt付
加雑音による性能低下を防ぐことを特徴とし、その目的
は雑音環境下でも接話型!イクロホンを用いることなく
安定に音声認識を行うこと番こめる。
以下、この発明の詳細な説明する。
有声音声の短時間周波数スペクトルは、第1図に示すよ
うに音声の基本周波数とその高調波周波数からなるライ
ンースペクトル信号として観測され、いわゆるスペクト
ルの調波構造を示すQ一方、フンダム雑音のスペクトル
には、第2図に示すように、スペクトルの調波構造昏ス
認められず、広い帝纜にわkつてエネルギが分布してい
る。
うに音声の基本周波数とその高調波周波数からなるライ
ンースペクトル信号として観測され、いわゆるスペクト
ルの調波構造を示すQ一方、フンダム雑音のスペクトル
には、第2図に示すように、スペクトルの調波構造昏ス
認められず、広い帝纜にわkつてエネルギが分布してい
る。
そこで雑音が加わったfFのスペクトルから音声の基本
周波数とその高l波成分を取り去る処理により、その音
声スペクトルが除去された雑音から音声に加わっている
雑it推定してこれを雑音が加わった’を声から除去す
る。この雑音除去処理されfct%iiこ対し認識処理
を行う。
周波数とその高l波成分を取り去る処理により、その音
声スペクトルが除去された雑音から音声に加わっている
雑it推定してこれを雑音が加わった’を声から除去す
る。この雑音除去処理されfct%iiこ対し認識処理
を行う。
次にこの発明ζこよる音声111m製置の一冥施例を第
3図を参照して説明する。
3図を参照して説明する。
まず入力1子1から入力ぜれた雑音が加わつt音声、即
ち4f付加曾声Aをアナログ−ディジタル変俟器2によ
ってディジタル信号Bに変換する。
ち4f付加曾声Aをアナログ−ディジタル変俟器2によ
ってディジタル信号Bに変換する。
以後の処理はディジタル1g号を30m秒程鹿の時間長
○分析フレームに切9出して、フレーム単位に行なう。
○分析フレームに切9出して、フレーム単位に行なう。
はじめに離散的7−リエ変換器3番こよって・第4図に
示す工うに雑音が力Ωわった音声の周波数スペクトルC
f1t累める。次に音声基本周数数抽出部4によって入
力音声の基本周波数りを求め、この基本周波数tもとに
して櫛歯型フィルタ50特性を設足して周波数スペクト
ルCから、音声の基本周波数りとその高調(波成分とを
櫛歯型フィルタ5によって取出し1wcS図に示すよう
なラインスペクトル信号Eを求める。音声の基本周波数
を求める方法としては、入力音声の短時間自己相関関数
の最大ピークを検出する方法などの公知の方法を用いる
ことができる。 “次に引算部6によって
雑音付加音声のスペクトルCからライン・スペクトル信
号Et−引き去って@6図の実線に示すように、ライン
ースペクトルが存在する周波数以外の周波数における雑
音スペクトルを求め、これを第す図の破線で示すような
階段状のスペクトルで近似して雑音の推定スペクトルF
t−求める。つtv、全周波数帯域をいくつかの周波数
帯域に分割しく第6図の例では3分割)各周波数帯域毎
に帯域内の雑音のパワーを平均して単位周波数e)たり
の平均値を求め、帯域内の各周波数でのスペクトル値が
その平均1直憂こ等しいような平坦なスペクトルを持つ
推足スペクトルFt−求める。
示す工うに雑音が力Ωわった音声の周波数スペクトルC
f1t累める。次に音声基本周数数抽出部4によって入
力音声の基本周波数りを求め、この基本周波数tもとに
して櫛歯型フィルタ50特性を設足して周波数スペクト
ルCから、音声の基本周波数りとその高調(波成分とを
櫛歯型フィルタ5によって取出し1wcS図に示すよう
なラインスペクトル信号Eを求める。音声の基本周波数
を求める方法としては、入力音声の短時間自己相関関数
の最大ピークを検出する方法などの公知の方法を用いる
ことができる。 “次に引算部6によって
雑音付加音声のスペクトルCからライン・スペクトル信
号Et−引き去って@6図の実線に示すように、ライン
ースペクトルが存在する周波数以外の周波数における雑
音スペクトルを求め、これを第す図の破線で示すような
階段状のスペクトルで近似して雑音の推定スペクトルF
t−求める。つtv、全周波数帯域をいくつかの周波数
帯域に分割しく第6図の例では3分割)各周波数帯域毎
に帯域内の雑音のパワーを平均して単位周波数e)たり
の平均値を求め、帯域内の各周波数でのスペクトル値が
その平均1直憂こ等しいような平坦なスペクトルを持つ
推足スペクトルFt−求める。
引算器7によって雑音付加音声Aに周期成分が存在する
と認められる場合にはライン・スペクトル列Eから雑1
の推定スペクトルFt引き去って雑音低減された音声の
スペクトルGを求める。また雑音付加音声A1こ周期成
分が存在すると認められない場合に(ズ、雑を科加晋声
のスペクトルCから雑音の推定スペクトルFを引き去っ
て雑音低減きれた音声のスペクトルGを求める。
と認められる場合にはライン・スペクトル列Eから雑1
の推定スペクトルFt引き去って雑音低減された音声の
スペクトルGを求める。また雑音付加音声A1こ周期成
分が存在すると認められない場合に(ズ、雑を科加晋声
のスペクトルCから雑音の推定スペクトルFを引き去っ
て雑音低減きれた音声のスペクトルGを求める。
入力t%に顕著な周期成分が存在するか否かの判定は、
fF基本周仮数抽出部4において音声の基本周波数を求
める際に計3I嘔れる短時間相関係数の最大ピーク値H
がしきい値より犬か否かによp判定を行う。
fF基本周仮数抽出部4において音声の基本周波数を求
める際に計3I嘔れる短時間相関係数の最大ピーク値H
がしきい値より犬か否かによp判定を行う。
次に、iMAf除去嘔れた音声スペクトルGから・音声
の特徴パラメータ抽出s81こより、を声認臓のための
特値パラメータエを求める。従来音声紹織の待像パラメ
ータとしては、音声の自己相関関数、音声の”L P
Gパラメータ、BPF (バンドパスフィルタ)群の出
力パワーなどが知られているが、自己相関関数を特徴パ
ラメータとする場合には雑音除去された音声のパワース
ペクトルGからフーリエ変換によつ(て自己相関関数を
求めればよく、またLPCパラメータを特徴パラメータ
とする場合には前記求めた自己相関関数から公知の方法
によってLPCパラメータを求めればよい。またBPF
群の出力パワーを特徴パラメータとする場合は、雑音除
去された音声O周波数スペクトルGにおいて各周波数帯
域におけるパワーを求めればよい。
の特徴パラメータ抽出s81こより、を声認臓のための
特値パラメータエを求める。従来音声紹織の待像パラメ
ータとしては、音声の自己相関関数、音声の”L P
Gパラメータ、BPF (バンドパスフィルタ)群の出
力パワーなどが知られているが、自己相関関数を特徴パ
ラメータとする場合には雑音除去された音声のパワース
ペクトルGからフーリエ変換によつ(て自己相関関数を
求めればよく、またLPCパラメータを特徴パラメータ
とする場合には前記求めた自己相関関数から公知の方法
によってLPCパラメータを求めればよい。またBPF
群の出力パワーを特徴パラメータとする場合は、雑音除
去された音声O周波数スペクトルGにおいて各周波数帯
域におけるパワーを求めればよい。
次に、パターンマツチング部9により、前記入力音声の
特徴パラメータ(入カバターン)■と。
特徴パラメータ(入カバターン)■と。
標準パターンメモリ10め中にあらかじめ用意されてい
る複数個の特徴パラメータ(標準パターン)Jとの間で
!ツチング処理を行い、入力パターンエとの距離が最小
となる標準パターンの音声を入力音声の認識結果にとし
て出力端子11に導出する。
る複数個の特徴パラメータ(標準パターン)Jとの間で
!ツチング処理を行い、入力パターンエとの距離が最小
となる標準パターンの音声を入力音声の認識結果にとし
て出力端子11に導出する。
上述の入力パターンエと標準パターンJとの間のマツチ
ングの方法としては、動的計画法(DP)を用いる方法
などの既知の方法を用いることができる。
ングの方法としては、動的計画法(DP)を用いる方法
などの既知の方法を用いることができる。
なお上述の雑音除去処理において、雑音のスペクトルが
白色雑音のように平坦であることがわかっていたり、雑
−11oレベルが音声レベルに比べて低い場合は、帯域
分割処理を行なわず、全周波数帯域でスペクトル平坦な
雑音の推定スペクトルを求めてこれを引き去るよう番こ
簡単化することも考えられ、tた周期性の存在の有無に
よって異なった処理を行なうことなく、推足し比雑音ス
ペクトルFtライン・スペクトル信号Eから引き去る処
理だけを行なうか、あるいは推定した雑音スペクトルF
を元の雑音付加音声Aから引き去る処理だけを行なって
雑音低減され7tt声のスペクトルを求めるように(資
)単化することも考えられる。雑音除去処理は、プログ
ラム制御の計算機を用いて演算処理的に行なうことも、
また、櫛歯型フィルタ、帯域フィルタなどのディジタル
・フィルタや引算器やバッファ拳メモリ等を構成4J素
とする専用ハードウェアによって処理すること40T能
である。
白色雑音のように平坦であることがわかっていたり、雑
−11oレベルが音声レベルに比べて低い場合は、帯域
分割処理を行なわず、全周波数帯域でスペクトル平坦な
雑音の推定スペクトルを求めてこれを引き去るよう番こ
簡単化することも考えられ、tた周期性の存在の有無に
よって異なった処理を行なうことなく、推足し比雑音ス
ペクトルFtライン・スペクトル信号Eから引き去る処
理だけを行なうか、あるいは推定した雑音スペクトルF
を元の雑音付加音声Aから引き去る処理だけを行なって
雑音低減され7tt声のスペクトルを求めるように(資
)単化することも考えられる。雑音除去処理は、プログ
ラム制御の計算機を用いて演算処理的に行なうことも、
また、櫛歯型フィルタ、帯域フィルタなどのディジタル
・フィルタや引算器やバッファ拳メモリ等を構成4J素
とする専用ハードウェアによって処理すること40T能
である。
この発明の有効性を単語音声認識のシばニレ−ジョン実
験によって検証した結果を示す。音声認識の特徴パラメ
ータとしてLPCケプストラムを用いた時に、第3図に
示した雑音除去処理を行わない場合と行った場合の認識
率を調べた。その結果、白色雑音付加、SN比18dB
では72慢が945に4C1SN比12 d BfGC
25$1!80 Siコを九室内雑音付加、SNN13
2dBでは62チが96%に、SN比6dBでは20%
が83チ1こ。
験によって検証した結果を示す。音声認識の特徴パラメ
ータとしてLPCケプストラムを用いた時に、第3図に
示した雑音除去処理を行わない場合と行った場合の認識
率を調べた。その結果、白色雑音付加、SN比18dB
では72慢が945に4C1SN比12 d BfGC
25$1!80 Siコを九室内雑音付加、SNN13
2dBでは62チが96%に、SN比6dBでは20%
が83チ1こ。
それぞれ−鐵率が大幅に向上し、雑音除去り場を考慮し
た音声Ia!識装置としてのこの発明の有効性が確証て
れ沈。
た音声Ia!識装置としてのこの発明の有効性が確証て
れ沈。
上述したようにこのQ’明の音声g識装置によれば音声
から雑音を除去する処理を組み込むことにより、付加雑
音による性能低下が妨げられ、安定に動作するという大
なる特長を有する。このためこの発明の装置によれば従
米童声認繊装置を用いる場合に存在したいろいろな制約
1例えば静かな環境で用いること、接話厘マイクロホン
を用いることなどに拘束されることなく、騒音レベルの
高い場所で使用する場合やマイクロホンとの距離が(ズ
なれている場合、ま7t8/N特性の悪い伝送路を通っ
て送られてきた音声を認識する場合など幅広い状況の下
で安定し北性能で音声認識を行うことができ、音声1識
?Atの適用領域を広げより有効に活用するうえで極め
て効果が太きい。
から雑音を除去する処理を組み込むことにより、付加雑
音による性能低下が妨げられ、安定に動作するという大
なる特長を有する。このためこの発明の装置によれば従
米童声認繊装置を用いる場合に存在したいろいろな制約
1例えば静かな環境で用いること、接話厘マイクロホン
を用いることなどに拘束されることなく、騒音レベルの
高い場所で使用する場合やマイクロホンとの距離が(ズ
なれている場合、ま7t8/N特性の悪い伝送路を通っ
て送られてきた音声を認識する場合など幅広い状況の下
で安定し北性能で音声認識を行うことができ、音声1識
?Atの適用領域を広げより有効に活用するうえで極め
て効果が太きい。
第1因(1、有声音声のスペクトルの例を示す図、第2
!!Hズランダム雑音のスペクトルの例を示す図、第3
図(1この侘明装置lの一実施例を示すブロック図、第
4図il を声+擁オのスペクトル例を示す図、第5図
にc−背付加音声から音声の基本周波数とその高?A波
成分を卓り出したライン・スペクトル信号を示す図、4
6図は雑音付加音声からライン・スペクトル列を引き去
ったスペクトルを示す図である。 l:入力、(子、2:アナログデイジタル変MA3:雛
赦的フーリエ変遺器、4:音声の基本周期抽出部、5:
@1lit型フィルタ、6,7:引算器、8;特徴パラ
メータ抽出部、9:バタ、−ンマツチング部、10:標
準パターンメモリ、 11:出力端子。 スズ スベ 第1図 第2図 7トル
ス(クトル″A′4 図 75図
クりル スペ
クトル16図 スペクトル
!!Hズランダム雑音のスペクトルの例を示す図、第3
図(1この侘明装置lの一実施例を示すブロック図、第
4図il を声+擁オのスペクトル例を示す図、第5図
にc−背付加音声から音声の基本周波数とその高?A波
成分を卓り出したライン・スペクトル信号を示す図、4
6図は雑音付加音声からライン・スペクトル列を引き去
ったスペクトルを示す図である。 l:入力、(子、2:アナログデイジタル変MA3:雛
赦的フーリエ変遺器、4:音声の基本周期抽出部、5:
@1lit型フィルタ、6,7:引算器、8;特徴パラ
メータ抽出部、9:バタ、−ンマツチング部、10:標
準パターンメモリ、 11:出力端子。 スズ スベ 第1図 第2図 7トル
ス(クトル″A′4 図 75図
クりル スペ
クトル16図 スペクトル
Claims (1)
- (1)雑音が加わった音声から音声の基本周波数成分と
その高調波成分を取り出してライン・k望トル列からな
る信号を得ゐ手段と、前記雑音が加わつ念音声をいくつ
かの周波数帯域に分割し、その分割された周波数帯域ご
とに−fが加わつytii!!lから前記ライン・スペ
クトル1M号をう1き去り、そのライン・スペクトル信
号が引き去られた雑音成分を平均化して前記周波数帯域
ごとに平坦なスペクトルを持つ雑音の推足f直を求める
中段と、前記雑音が加わつか音声中に顕著な周期成分が
存在すると認められた時には前記ライン・スペクトル信
号から前記雑音の推定値を引き去って雑音低減された音
声を求め、前記雑音が加わつfc曾音声に顕著な周期成
分が存在しないと認められた時にはその雑音が加わった
音声から前記雑音の推定111を引き去って雑音低減式
れた音声を求める手段と、前記雑音低減され念fF’か
らV戸認誠のための特徴パラメータを求める手段と、そ
の求められた特徴パラメータと、Toらかじめ用意され
た複数個の棉準音声の特徴パラメータとのマツチングを
行う手段とからなる音声認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP56158310A JPS5859497A (ja) | 1981-10-05 | 1981-10-05 | 音声認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP56158310A JPS5859497A (ja) | 1981-10-05 | 1981-10-05 | 音声認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS5859497A true JPS5859497A (ja) | 1983-04-08 |
Family
ID=15668828
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP56158310A Pending JPS5859497A (ja) | 1981-10-05 | 1981-10-05 | 音声認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS5859497A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63501537A (ja) * | 1985-09-03 | 1988-06-09 | モトロ−ラ・インコ−ポレ−テツド | 音声通信装置及びその動作方法 |
JP2016517238A (ja) * | 2013-04-19 | 2016-06-09 | コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. | 干渉の存在下での符号化された可視光の受信 |
-
1981
- 1981-10-05 JP JP56158310A patent/JPS5859497A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63501537A (ja) * | 1985-09-03 | 1988-06-09 | モトロ−ラ・インコ−ポレ−テツド | 音声通信装置及びその動作方法 |
JP2016517238A (ja) * | 2013-04-19 | 2016-06-09 | コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. | 干渉の存在下での符号化された可視光の受信 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8031861B2 (en) | Communication system tonal component maintenance techniques | |
AU676714B2 (en) | Noise reduction | |
JP4187795B2 (ja) | 音声信号障害を低減するための方法 | |
CN104067339A (zh) | 噪音抑制装置 | |
Hardwick et al. | Speech enhancement using the dual excitation speech model | |
US7917359B2 (en) | Noise suppressor for removing irregular noise | |
Ramirez et al. | Voice activity detection with noise reduction and long-term spectral divergence estimation | |
JP2836271B2 (ja) | 雑音除去装置 | |
JP2014513320A (ja) | オーディオ信号におけるドミナント周波数を減衰する方法及び装置 | |
JPH11265199A (ja) | 送話器 | |
JPS5859497A (ja) | 音声認識装置 | |
JP2979714B2 (ja) | 音声信号処理装置 | |
Kajita et al. | Robust speech feature extraction using SBCOR analysis | |
EP3945519A1 (en) | Filtering method, filtering device, and filtering program | |
US6314394B1 (en) | Adaptive signal separation system and method | |
CN112118511A (zh) | 耳机降噪方法、装置、耳机及计算机可读存储介质 | |
JP2859634B2 (ja) | 雑音除去装置 | |
JP2002064617A (ja) | 反響抑圧方法・反響抑圧装置 | |
JP2863214B2 (ja) | 雑音除去装置及び該装置を用いた音声認識装置 | |
KR100744375B1 (ko) | 음성 처리 장치 및 방법 | |
EP1748426A2 (en) | Method and apparatus for adaptively suppressing noise | |
KR930008721A (ko) | 음성인식 시스템의 특징추출방법 | |
JPH04211523A (ja) | 信号処理装置及びボイスダイアル電話システム | |
JPS6015280B2 (ja) | 音声に加わつた雑音の低減方法 | |
Farsi et al. | Robust speech recognition based on mixed histogram transform and asymmetric noise suppression |