JPH01158499A - 定常雑音除去方式 - Google Patents
定常雑音除去方式Info
- Publication number
- JPH01158499A JPH01158499A JP62316203A JP31620387A JPH01158499A JP H01158499 A JPH01158499 A JP H01158499A JP 62316203 A JP62316203 A JP 62316203A JP 31620387 A JP31620387 A JP 31620387A JP H01158499 A JPH01158499 A JP H01158499A
- Authority
- JP
- Japan
- Prior art keywords
- stationary
- voice
- noise
- section
- power
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 claims description 7
- 238000001514 detection method Methods 0.000 abstract description 8
- 238000001228 spectrum Methods 0.000 abstract description 8
- 238000000605 extraction Methods 0.000 abstract description 3
- 239000000284 extract Substances 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 3
- 230000003595 spectral effect Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 230000007423 decrease Effects 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は音声認識装置に係り、特に定常雑音の除去に好
適な雑音除去方式に関する。
適な雑音除去方式に関する。
従来の雑音除去方式としては、特開昭61−11309
9号に記載のように、主に入力音声の音声パワーの大き
さを利用した方式となっていた。
9号に記載のように、主に入力音声の音声パワーの大き
さを利用した方式となっていた。
上記従来技術は、雑音を減衰させて入力できる指向性マ
イクロホン等の利用を前提としていた。
イクロホン等の利用を前提としていた。
しかし、現在、一般に使われているマイクロホンは無指
向性マイクロホンである。音声認識に、無指向性マイク
ロホンを利用した時、特に電話のベル音のように定常的
な音は音声パワーが大きく、入力音声と音声パワーの大
きさのみでは判別できない問題があった。このため、定
常雑音を音声と誤認識する問題が生じる。この解決法と
して、定常雑音を標準バタンとして登録することが考え
られるが、標準バタンか増加してしまい、認識性能や装
置の規模の面からも好ましくない。
向性マイクロホンである。音声認識に、無指向性マイク
ロホンを利用した時、特に電話のベル音のように定常的
な音は音声パワーが大きく、入力音声と音声パワーの大
きさのみでは判別できない問題があった。このため、定
常雑音を音声と誤認識する問題が生じる。この解決法と
して、定常雑音を標準バタンとして登録することが考え
られるが、標準バタンか増加してしまい、認識性能や装
置の規模の面からも好ましくない。
本発明の目的は、音声パワーの大きな定常的な雑音の除
去を、認識装置の構成をあまり変えずに達成することに
ある。
去を、認識装置の構成をあまり変えずに達成することに
ある。
例えば、電話のベル音のような定常雑音は次のような特
徴を有する。■パワーが上昇した後、−定のパワーレベ
ルを長く保った後、下降し、パワーの凹凸がない、■定
常雑音の■の間では、そのスペクトル形状の変化が少な
い、このため、入力した信号のパワーが谷を示す位置で
分割し、その分割した区間の長さが長く、その区間内の
スペクトル変動が少ないものを定常雑音候補とする。そ
して、音声のうち、長い持続時間での発声が可能な5母
音や撥音の音声のみと、定常雑音候補とのマツチングを
行ない、どの音声とも類似しない場合は、定常雑音と判
定することにより達成される。
徴を有する。■パワーが上昇した後、−定のパワーレベ
ルを長く保った後、下降し、パワーの凹凸がない、■定
常雑音の■の間では、そのスペクトル形状の変化が少な
い、このため、入力した信号のパワーが谷を示す位置で
分割し、その分割した区間の長さが長く、その区間内の
スペクトル変動が少ないものを定常雑音候補とする。そ
して、音声のうち、長い持続時間での発声が可能な5母
音や撥音の音声のみと、定常雑音候補とのマツチングを
行ない、どの音声とも類似しない場合は、定常雑音と判
定することにより達成される。
本方式では、まずパワーが谷を示す位置で入力信号を分
割し、その分割された区間の時間長が長いもののみを雑
音候補とする。発声される音声は。
割し、その分割された区間の時間長が長いもののみを雑
音候補とする。発声される音声は。
子音の位置で音声パワーの谷を生じることが多く。
音節の持続時間は長くて200 m5ec程度である。
このため、200〜300 m5ec以下の持続時間の
ものは音声として対象から外す。
ものは音声として対象から外す。
次に、雑音候補のスペクトル変動を調べ、スペクトル変
動の大きいものを雑音候補からはずす。
動の大きいものを雑音候補からはずす。
これにより、例えば母音のみから成り、音声パワーの凹
凸のない「青い」などの音声を雑音候補から外すことが
できる。ここまでの処理により残される音声としては、
単独発声された5母音や撥音のみとなる。そして、これ
らの発声は明瞭な発声である。このため、あらかじめ登
録した5母音や撥音と比較することにより、雑音候補を
雑音と音声に識別できる。
凸のない「青い」などの音声を雑音候補から外すことが
できる。ここまでの処理により残される音声としては、
単独発声された5母音や撥音のみとなる。そして、これ
らの発声は明瞭な発声である。このため、あらかじめ登
録した5母音や撥音と比較することにより、雑音候補を
雑音と音声に識別できる。
以下、本発明の一実施例を第1図により説明する。第1
図は、入力音声から、母音を認識した後。
図は、入力音声から、母音を認識した後。
子音を認識する方式を用いた音声認識装置に実施した例
である。音声信号はマイクロホンにより電気信号に変換
され、A/D変換器(図示しない)により標本化されて
取り込まれる。特徴抽出部1では音声信号から、音声パ
ワーやスペクトル情報を抽出する。音声分割部2では、
あらかじめ、無音を入力し、そのパワーを第2図の無音
レベル記憶部2−1に格納しておく、音声入力時には、
無音部検出部2−2は、入力される音声パワーが無音レ
ベル記憶部2−1の無音レベル以上となる音声区間を切
り出し、入力音声を分割する(第3図のt1〜tz、t
a〜を番)0次に音声パワーdip検出部2−3では、
更に音声パワーが谷を示す位置を検出し、その位置で更
に細分割する(第3図のt1〜ta、tg〜t=)、そ
して、持続時間判定部2−4は、分割された区間の時間
長を求め1時間長が長い区間(例えば300 m5ec
以上)にマークを付ける。
である。音声信号はマイクロホンにより電気信号に変換
され、A/D変換器(図示しない)により標本化されて
取り込まれる。特徴抽出部1では音声信号から、音声パ
ワーやスペクトル情報を抽出する。音声分割部2では、
あらかじめ、無音を入力し、そのパワーを第2図の無音
レベル記憶部2−1に格納しておく、音声入力時には、
無音部検出部2−2は、入力される音声パワーが無音レ
ベル記憶部2−1の無音レベル以上となる音声区間を切
り出し、入力音声を分割する(第3図のt1〜tz、t
a〜を番)0次に音声パワーdip検出部2−3では、
更に音声パワーが谷を示す位置を検出し、その位置で更
に細分割する(第3図のt1〜ta、tg〜t=)、そ
して、持続時間判定部2−4は、分割された区間の時間
長を求め1時間長が長い区間(例えば300 m5ec
以上)にマークを付ける。
第1図の定常部検出部3は、音声分割部2でマーク付け
された音声区間のスペクトル情報を用いて、その区間の
定常部を求める。そして、マーク付けされた区間の全区
間が定常部であればマークを残し、それ以外であればマ
ークを消す0次に。
された音声区間のスペクトル情報を用いて、その区間の
定常部を求める。そして、マーク付けされた区間の全区
間が定常部であればマークを残し、それ以外であればマ
ークを消す0次に。
音声/雑音判定部4では、母音標準バタン5を用いて、
定常部検出部3で求められた定常部が何の母音であるか
を判定する。ただし、ここでマークの付けられた定常部
は、母音標準パタン5のうちの単独発声された母音およ
び撥音のみとのマツチングを行なう。そして、マークさ
れた定常部が母音や撥音とマツチングしたものは、音声
としてマークを外す。この定常部検出部3および音声/
雑音判定部4の処理は、例えば日本音響学会昭和60年
度秋季研究発表会1−4−20の音声の定常部のセグメ
ンテーション法などにより実現することができる。
定常部検出部3で求められた定常部が何の母音であるか
を判定する。ただし、ここでマークの付けられた定常部
は、母音標準パタン5のうちの単独発声された母音およ
び撥音のみとのマツチングを行なう。そして、マークさ
れた定常部が母音や撥音とマツチングしたものは、音声
としてマークを外す。この定常部検出部3および音声/
雑音判定部4の処理は、例えば日本音響学会昭和60年
度秋季研究発表会1−4−20の音声の定常部のセグメ
ンテーション法などにより実現することができる。
そして、子音認識部6は、VCVパタン7を用いて、マ
ークの付いていない定常部を核として、その定常部間の
子音を認識する。そして、マークの付いた定常部は雑音
区間として出力しない。
ークの付いていない定常部を核として、その定常部間の
子音を認識する。そして、マークの付いた定常部は雑音
区間として出力しない。
以上の処理により、定常雑音を除去した音声認識が可能
となる。
となる。
本実施例によれば、従来の音声認識装置の構成をほとん
ど変えることなく、高性能な定常雑音を除去可能な認識
装置を実現できる。
ど変えることなく、高性能な定常雑音を除去可能な認識
装置を実現できる。
本発明によれば、定常雑音のパワー形状やスペクトル情
報の特徴を用いて定常雑音候補の絞り込みを行なうこと
により、比較すべき音声を限定できるため高性能な雑音
の除去が可能となる。また本発明で用いる音声パワーや
スペクトル情報および標準パタンは1通常音声認識で抽
出されるものであるため、従来の認識装置の規模を増加
させることなく実現可能である。
報の特徴を用いて定常雑音候補の絞り込みを行なうこと
により、比較すべき音声を限定できるため高性能な雑音
の除去が可能となる。また本発明で用いる音声パワーや
スペクトル情報および標準パタンは1通常音声認識で抽
出されるものであるため、従来の認識装置の規模を増加
させることなく実現可能である。
第1図は本発明の一実施例でブロック図、第2図は、第
1図の音声分割部のブロック図、第3図は第1図、第2
図の音声分割部の処理を説明するための図である。 1・・・特徴抽出部、2・・・音声分割部、3・・・定
常部検出部、4・・・音声/雑音判定部、5・・・母音
標準バタン、6・・・子音認識部、7・・・vCvパタ
ン、2−1・・・無音レベル記憶部、2−2・・・無音
部検出部、2−3・・・音声パワー−〇tp検出部、2
−4・・・持続時間判定部。
1図の音声分割部のブロック図、第3図は第1図、第2
図の音声分割部の処理を説明するための図である。 1・・・特徴抽出部、2・・・音声分割部、3・・・定
常部検出部、4・・・音声/雑音判定部、5・・・母音
標準バタン、6・・・子音認識部、7・・・vCvパタ
ン、2−1・・・無音レベル記憶部、2−2・・・無音
部検出部、2−3・・・音声パワー−〇tp検出部、2
−4・・・持続時間判定部。
Claims (1)
- 1、入力される音声を認識する認識装置において、上記
音声のパワー又は音韻情報を抽出する手段と、上記音声
パワーの谷を検出する手段と、その谷の位置や音声パワ
ーの大きさにより入力音声を分割する手段と、その分割
された音声区間内の音韻的な定常部を検出する手段と、
上記分割された音声区間の時間長と定常部の存在位置か
ら、雑音候補を検出する手段と、この雑音候補と母音や
撥音との比較を行なうことにより雑音を検出する手段と
を有していることを特徴とする定常雑音除去方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62316203A JPH01158499A (ja) | 1987-12-16 | 1987-12-16 | 定常雑音除去方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62316203A JPH01158499A (ja) | 1987-12-16 | 1987-12-16 | 定常雑音除去方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH01158499A true JPH01158499A (ja) | 1989-06-21 |
Family
ID=18074444
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP62316203A Pending JPH01158499A (ja) | 1987-12-16 | 1987-12-16 | 定常雑音除去方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH01158499A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002531882A (ja) * | 1998-11-30 | 2002-09-24 | マイクロソフト コーポレイション | バレーパーセンテージを使用した純粋音声の検出 |
JP2009020459A (ja) * | 2007-07-13 | 2009-01-29 | Yamaha Corp | 音声処理装置およびプログラム |
-
1987
- 1987-12-16 JP JP62316203A patent/JPH01158499A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002531882A (ja) * | 1998-11-30 | 2002-09-24 | マイクロソフト コーポレイション | バレーパーセンテージを使用した純粋音声の検出 |
JP2009020459A (ja) * | 2007-07-13 | 2009-01-29 | Yamaha Corp | 音声処理装置およびプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPS5972496A (ja) | 単音識別装置 | |
JP5201053B2 (ja) | 合成音声判別装置、方法及びプログラム | |
JPS6138479B2 (ja) | ||
JPH01158499A (ja) | 定常雑音除去方式 | |
JP3114757B2 (ja) | 音声認識装置 | |
JPH04324499A (ja) | 音声認識装置 | |
JP2886879B2 (ja) | 音声認識方法 | |
JPH06175677A (ja) | 音声認識方法 | |
JPS6250800A (ja) | 音声認識装置 | |
JPS59149400A (ja) | 音声入力装置 | |
JPS62166400A (ja) | 音声ワ−ドプロセツサ装置 | |
JPH0640274B2 (ja) | 音声認識装置 | |
JPS60166996A (ja) | 音声標準パタン登録方法 | |
JPS58195895A (ja) | 単語音声認識装置 | |
JPS63173100A (ja) | キ−ワ−ド抽出装置 | |
JPS6315295A (ja) | 音声認識装置 | |
JPS59195300A (ja) | 音声認識装置 | |
JPH0316038B2 (ja) | ||
JPS6334479B2 (ja) | ||
JPH07302098A (ja) | 単語音声認識装置 | |
JPS6375800A (ja) | 音声認識装置 | |
JPS6240497A (ja) | 音声パタ−ン分類方式 | |
JPS63191199A (ja) | 有声破裂子音識別装置 | |
JPS63306498A (ja) | 音声区間検出方式 | |
JPS62115498A (ja) | 無声破裂子音識別方式 |