JPS6367197B2 - - Google Patents

Info

Publication number
JPS6367197B2
JPS6367197B2 JP58011761A JP1176183A JPS6367197B2 JP S6367197 B2 JPS6367197 B2 JP S6367197B2 JP 58011761 A JP58011761 A JP 58011761A JP 1176183 A JP1176183 A JP 1176183A JP S6367197 B2 JPS6367197 B2 JP S6367197B2
Authority
JP
Japan
Prior art keywords
standard pattern
noise
phoneme
standard
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP58011761A
Other languages
English (en)
Other versions
JPS59137999A (ja
Inventor
Katsuyuki Futayada
Yukari Maeda
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP58011761A priority Critical patent/JPS59137999A/ja
Publication of JPS59137999A publication Critical patent/JPS59137999A/ja
Publication of JPS6367197B2 publication Critical patent/JPS6367197B2/ja
Granted legal-status Critical Current

Links

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、音声認識技術に関するものである。
従来例の構成とその問題点 音声認識の方法において、入力音声と標準パタ
ーンを比較して、最も類似度の高いものを出力す
る方法が一般的である。この場合、標準パターン
の単位として単語を用いるもの、音素を用いるも
のが代表的である。以下の説明では、不特定話者
を対象とした音声認識によつて説明を行なうの
で、音素を単位とした認識方法が有効であり、以
下の説明は音素の認識によつて説明を行なう。し
かし、本発明の内容は音素の認識方法に止どまる
ものでなく、単語や文を単位とした場合も全く同
様な方法が使用できる。
従来の装置における音素認識を行なう部分のブ
ロツク図を第1図に示す。1は分析部、2は音素
認識比較部、3は音素標準パターン格納部であ
る。格納部3には、各音素に対応する標準的な特
徴パラメータが音素の数だけ入つている。この
各々の標準パターンと分析部1で分析された入力
特徴パラメータが比較部2で比較され、入力特徴
パラメータと類似度が最も大きい標準パターンに
おける音素の記号又は番号が音素認識結果として
出力される。
不特定話者を対象とするシステムでの標準パタ
ーンの作成には、多くの人のデータが必要であ
る。したがつて、使用環境下でいちいち多くの人
のデータを収録する事は出来ない為一定環境(例
えば防音室内)において収録したデータを使つて
作成せざるを得ない。この為騒音下(使用環境
下)での入力音声と騒音なし標準パターンとのマ
ツチング(照合)がうまくいかず認識率が低下す
る原因となつていた。第2図にS/N比(信号対
騒音比)と音素認識率の関係を示す。これを見る
と、騒音のない場合の認識率は85.2%となるが
S/N比が低くなるにつれて認識率も低下し、
S/N比5dB(デシベル)になると72.7%と12.5%
も低下してしまい騒音の影響を考慮していない従
来の方法は明らかに問題がある。
発明の目的 本発明は、以上のような従来の問題点を解決す
る為になされたもので、騒音を考慮した標準パタ
ーンを作成し、それを使用し音素認識をする事に
よつて誤認識を少なくする事を目的とする。
発明の構成 この目的を達成するために本発明は騒音の種類
に対応して複数の標準パターンを用意しておき環
境騒音に応じて最適な標準パターンを選択するよ
うにしたものである。
実施例の説明 第3図は本発明の一実施例を示すもので、1は
分析部、2は音素認識比較部でこれらは第1図と
対応している。3は騒音レベル検出部、4は標準
パターン選択部、5は標準パターン格納部であ
る。標準パターン格納部5には、第1図の格納部
3とは異なり、騒音のレベルと対応した複数の標
準パターンが格納されている。6はモードの切り
替えを行なうスイツチであり、a側に倒れている
と認識モード、b側に倒れていると環境学習モー
ドとなる。
音声認識装置使用前(音声が入つていない状
態)にスイツチ6をb側に切り替えて、まず使用
環境騒音のみを騒音レベル検出部3の騒音レベル
検出部で検出する。4では検出された騒音レベル
によつて標準パターン格納部5の中から対応する
音素標準パターンを選択する。以後の認識では、
この標準パターンを使用する事になる。音声認識
装置使用時にはスイツチ6をa側に切り替え、第
1図の場合と同様に入力音声を分析部1で特徴パ
ラメータに変換し、比較部2で標準パターンと比
較して音素の認識を行なう。
次に騒音を考慮した標準パターンの作成法につ
いて説明を行なう。使用環境下における騒音の性
質をそのまま使用して標準パターンを作成すれ
ば、認識率の向上に対する貢献度が最も大きい
が、環境騒音の種類はさまざまであるのでこの方
法は現実的でない。従つてここでは騒音の性質を
モデル化する事によつて、標準パターンを作成す
る。
環境騒音の周波数特性は統計的には第4図に示
すHOTHスペクトル特性であることが知られて
いる。騒音の代表として、HOTHスペクトル特
性を有するモデル騒音を作成しておく。このモデ
ル騒音と防音室内で収録した音声データをS/N
比が一定値になるように混合して騒音入りの音声
データを作成する。次に、このデータを使用して
従来と同様の方法で音素標準パターンを作成す
る。このような手続きをいくつかのS/N比に対
して行ない、複数の標準パターンを作成して標準
パターン格納部5に格納してある。本実施例で
は、S/N比5dB〜35dBを対象とし、5dBおきに
標準パターンを作成し、合計8種類の標準パター
ンを作成して標準パターン格納部5に格納してい
る。このようにして作成した標準パターンは汎用
的なものであり、一度作成しておけば変更する必
要がないのが特徴である。
騒音レベル検出部3は、マイクロホンから入力
された騒音信号の自乗和を計算してパワーを求め
る部分である。標準パターン選択部4は騒音パワ
ーをS/N比に変換し、標準パターン格納部5の
中から対応するS/N比に最も近い標準パターン
を選択する。S/N比と騒音パワーの変換は次式
で行なう。
S/N比=10log(音声パワー)−10log (騒音パワー) ここでマイクに入力される音声パワー(右辺第
1項)は、ほぼ一定と考えて良いから上式で、
S/N比と騒音パワーを対応づけることができ
る。
発明の効果 本発明による効果を音素認識率で評価する。こ
こで用いる音素認識率とは、正しく認識されたフ
レームの数(1フレームは10m sec長の音声デ
ータ)の全フレーム数に対する割合で定義され
る。第5図は例としてS/N比25dBに相当する
騒音環境下における5母音と鼻音(/m/,/
n/,はつ音)に対する評価結果を示したもので
ある。実線7が本発明による標準パターンを使用
した場合の結果であり、破線8は従来の標準パタ
ーンを使用した場合の結果である。平均認識率で
3.6%の向上が認められ、鼻音では26%も向上し
た。従つて、本発明の効果は大きいと言える。
尚、第5図は、男性10名が発声した212単語の
中の音素を対象として評価したもので、各音素共
約15000フレーム程度のデータ量があり、十分信
頼できる結果である。
このように本発明は、比較的単純で一般性のあ
る方法であり、しかも音素認識率の改善に対する
効果が大きく有効である。
【図面の簡単な説明】
第1図は標準パターンマツチングによつて音素
認識を行なう従来の方法のブロツク図、第2図は
S/N比と音素認識率の関係を示す図、第3図は
本発明の一実施例における音声認識装置ブロツク
図、第4図は騒音の周波数スペクトルを示す図、
第5図は本発明の装置による認識率を従来の装置
によるそれぞれと比較して示す図である。 1…分析部、2…音声認識比較部、3…騒音レ
ベル検出部、4…標準パターン選択部、5…標準
パターン格納部、6…モード切り替えスイツチ。

Claims (1)

    【特許請求の範囲】
  1. 1 音声と標準パターンを比較する手段を有し、
    騒音の種類に応じて複数の標準パターンを用意し
    ておき、装置使用前に、環境騒音を学習し、学習
    結果によつて、上記標準パターンの中から対応す
    る標準パターンの選択を行ない、この標準パター
    ンを使用して騒音環境下で発声した音声の認識を
    行なうことを特徴とする音声認識装置。
JP58011761A 1983-01-27 1983-01-27 音声認識装置 Granted JPS59137999A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58011761A JPS59137999A (ja) 1983-01-27 1983-01-27 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58011761A JPS59137999A (ja) 1983-01-27 1983-01-27 音声認識装置

Publications (2)

Publication Number Publication Date
JPS59137999A JPS59137999A (ja) 1984-08-08
JPS6367197B2 true JPS6367197B2 (ja) 1988-12-23

Family

ID=11786959

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58011761A Granted JPS59137999A (ja) 1983-01-27 1983-01-27 音声認識装置

Country Status (1)

Country Link
JP (1) JPS59137999A (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0792673B2 (ja) * 1984-10-02 1995-10-09 株式会社東芝 認識用辞書学習方法
JPS6191700A (ja) * 1984-10-11 1986-05-09 株式会社日立製作所 音声入力装置
JPS6242198A (ja) * 1985-08-20 1987-02-24 松下電器産業株式会社 音声認識装置
JPH0192699U (ja) * 1987-12-11 1989-06-16
JP2591233Y2 (ja) * 1991-06-25 1999-03-03 東プレ株式会社 バン型車における荷物扉の煽止装置
JP4858663B2 (ja) * 2001-06-08 2012-01-18 日本電気株式会社 音声認識方法及び音声認識装置
JP4257491B2 (ja) * 2002-11-08 2009-04-22 ソニー株式会社 音声認識装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5934595A (ja) * 1982-08-20 1984-02-24 富士通株式会社 音声認識処理方式

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5934595A (ja) * 1982-08-20 1984-02-24 富士通株式会社 音声認識処理方式

Also Published As

Publication number Publication date
JPS59137999A (ja) 1984-08-08

Similar Documents

Publication Publication Date Title
US4811399A (en) Apparatus and method for automatic speech recognition
US7133826B2 (en) Method and apparatus using spectral addition for speaker recognition
EP0077194B1 (en) Speech recognition system
US6411927B1 (en) Robust preprocessing signal equalization system and method for normalizing to a target environment
US20090192788A1 (en) Sound Processing Device and Program
JP2007017620A (ja) 発話区間検出装置、そのためのコンピュータプログラム及び記録媒体
JPS6367197B2 (ja)
JP2002236494A (ja) 音声区間判別装置、音声認識装置、プログラム及び記録媒体
JP2003330491A (ja) 音声認識装置および音声認識方法ならびにプログラム
US20080228477A1 (en) Method and Device For Processing a Voice Signal For Robust Speech Recognition
JPS63502304A (ja) 高雑音環境における言語認識のためのフレ−ム比較法
JPH0449952B2 (ja)
KR100587260B1 (ko) 음향 기기의 음성인식장치
JP2006010739A (ja) 音声認識装置
JPH04324499A (ja) 音声認識装置
JPS6242198A (ja) 音声認識装置
JP3900628B2 (ja) 音声認識装置
Mandel Directly Comparing the Listening Strategies of Humans and Machines.
Fan et al. Power-normalized PLP (PNPLP) feature for robust speech recognition
JP3346200B2 (ja) 音声認識装置
JP2658426B2 (ja) 音声認識方法
JPH0293697A (ja) 雑音除去方法
JP2017068153A (ja) 半導体装置、システム、電子機器、及び、音声認識方法
JP2975808B2 (ja) 音声認識装置
JP2000155600A (ja) 音声認識システムおよび入力音声レベル警告方法