JPS6167896A - 音声認識方法 - Google Patents
音声認識方法Info
- Publication number
- JPS6167896A JPS6167896A JP59189907A JP18990784A JPS6167896A JP S6167896 A JPS6167896 A JP S6167896A JP 59189907 A JP59189907 A JP 59189907A JP 18990784 A JP18990784 A JP 18990784A JP S6167896 A JPS6167896 A JP S6167896A
- Authority
- JP
- Japan
- Prior art keywords
- word
- speaker
- standard
- standard pattern
- learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
産業上の利用分野
本発明は複数の標準パターンを用いる不特定話者の音声
を認識する音声認識方法に関するものである。
を認識する音声認識方法に関するものである。
従来例の構成とその問題点
不特定話者音声認識における話者毎の発声変動に対処す
るために、各々のカテゴリについて複数個の標準パター
ンを用いる方法があるう例えば、特願昭68−6732
1号に記載の方法ではこの考えをさらに進め、話者毎の
特徴が各カテゴリ間で一定の関係を保っていることに着
目し、話者毎に各カテゴリ中の最適な標準パターンを選
択してこれらをセント化して用いることが行なわれる。
るために、各々のカテゴリについて複数個の標準パター
ンを用いる方法があるう例えば、特願昭68−6732
1号に記載の方法ではこの考えをさらに進め、話者毎の
特徴が各カテゴリ間で一定の関係を保っていることに着
目し、話者毎に各カテゴリ中の最適な標準パターンを選
択してこれらをセント化して用いることが行なわれる。
ここに標準パターンとなる音声単位は、音韻、音節、単
語のいずれでもよいとされている。
語のいずれでもよいとされている。
しかしながらこの方法には以下に述べるような問題点が
ある。即ち、この方法を単語標準パターンに基く音声認
識方法に適用する場合には、−単語の認識毎に一個だけ
の学習しか行なわれないため、話者学習の速度が遅いと
いう問題があり、−方この方法を音韻あるいは音節標準
パターンに基く音声認識方法に適用する場合には、−単
語の認識毎に多数回の学習が行なえるので話者学習の速
度は速いものの、単語認識を音韻情報のみから満足に行
な°うための複雑な演算処理を必要とするため、これを
装置化するときに装置規模が大きくなってしまうという
問題点があった。
ある。即ち、この方法を単語標準パターンに基く音声認
識方法に適用する場合には、−単語の認識毎に一個だけ
の学習しか行なわれないため、話者学習の速度が遅いと
いう問題があり、−方この方法を音韻あるいは音節標準
パターンに基く音声認識方法に適用する場合には、−単
語の認識毎に多数回の学習が行なえるので話者学習の速
度は速いものの、単語認識を音韻情報のみから満足に行
な°うための複雑な演算処理を必要とするため、これを
装置化するときに装置規模が大きくなってしまうという
問題点があった。
発明の目的
本発明は上記従来の問題点を解消するもので、単語全長
のスペクトルマツチングに基く音声認識方法において、
話者に最適なセット化単語標準パターンを、少数の単語
認識を行なうのみ′で選択することのできる音声認識方
法を提供することを目的とするものである。
のスペクトルマツチングに基く音声認識方法において、
話者に最適なセット化単語標準パターンを、少数の単語
認識を行なうのみ′で選択することのできる音声認識方
法を提供することを目的とするものである。
発明の構成
本発明は、各音韻についての複数個の標準パターンを音
韻間でセント化したセット化音韻標準ノくターンと、各
単語についての複数個の標準ノくターンを単語間でセッ
ト化したセット化単語標準パターンと、前記セット化音
韻標準パターンとセット化単語標準パターンとの間の対
応関係を定めたセット対応テーブルとを有し、音声認識
時における前記セット化音韻標準パタ′−ンに基いた話
者学習の際には、音韻標準パターンの使用頻度及び学習
サンプル識別時の信頼度とに基いて前記話者に適合した
音韻標準パターンのセットを選択し、さらに前記セット
対応テーブルを用いて前記話者に適合した単語標準パタ
ーンのセットを選択し、選択されたセット化単語標準パ
ターンを用いて音声の識別を行なうものであり、単語全
長のパターンマツチングに基く音声認識方法でありなが
ら、話者学習のみを音韻レベルで行なうことにより学習
速度を高めることができるものである。
韻間でセント化したセット化音韻標準ノくターンと、各
単語についての複数個の標準ノくターンを単語間でセッ
ト化したセット化単語標準パターンと、前記セット化音
韻標準パターンとセット化単語標準パターンとの間の対
応関係を定めたセット対応テーブルとを有し、音声認識
時における前記セット化音韻標準パタ′−ンに基いた話
者学習の際には、音韻標準パターンの使用頻度及び学習
サンプル識別時の信頼度とに基いて前記話者に適合した
音韻標準パターンのセットを選択し、さらに前記セット
対応テーブルを用いて前記話者に適合した単語標準パタ
ーンのセットを選択し、選択されたセット化単語標準パ
ターンを用いて音声の識別を行なうものであり、単語全
長のパターンマツチングに基く音声認識方法でありなが
ら、話者学習のみを音韻レベルで行なうことにより学習
速度を高めることができるものである。
実施例の説明
以下、第1図に従って本発明の一実施例について説明す
る。
る。
認識すべき単語入力は第1図中音韻識別部1に入力され
、ここで話者学習に必要な音韻のみが識別される。この
識別結果は話者学習手段2に送られ、セット化音韻標準
パターン3からの出力とともに話者の学習に用いられる
。この際、話者学習に用いることのできる音韻の出現頻
度が、個々の単語の入力頻度より高くなるように予め学
習用音韻の種類を決めておく。このような方法でいくつ
かの音声入力を受けつけることによシ、話者学習手段2
により、多数の音韻に基いた正確な学習が可能となる。
、ここで話者学習に必要な音韻のみが識別される。この
識別結果は話者学習手段2に送られ、セット化音韻標準
パターン3からの出力とともに話者の学習に用いられる
。この際、話者学習に用いることのできる音韻の出現頻
度が、個々の単語の入力頻度より高くなるように予め学
習用音韻の種類を決めておく。このような方法でいくつ
かの音声入力を受けつけることによシ、話者学習手段2
により、多数の音韻に基いた正確な学習が可能となる。
学習結果は音韻標準パターン3中の特定のセット番号と
してセット番号変換手段4に入力される。セット番号変
換手段4はセット対応テーブル6から読み込んだ情報を
もとに、前記音韻セット番号に最も対応の良い単語標準
パターンのセクト番号を決定し、これを単語スペクトル
マツチング手段6に入力する。単語スペクトルマツチン
グ手段6はこの入力を受け、セット化単語標準パターン
7から前記セット番号に対応する標準パターンセットを
読み出し、読み出されたセット化単語標準パターン7と
、前記単語入力をスペクトル分析した結果とを順次マツ
チングすることによって単語判定を行ない、認識結果出
力を得る。
してセット番号変換手段4に入力される。セット番号変
換手段4はセット対応テーブル6から読み込んだ情報を
もとに、前記音韻セット番号に最も対応の良い単語標準
パターンのセクト番号を決定し、これを単語スペクトル
マツチング手段6に入力する。単語スペクトルマツチン
グ手段6はこの入力を受け、セット化単語標準パターン
7から前記セット番号に対応する標準パターンセットを
読み出し、読み出されたセット化単語標準パターン7と
、前記単語入力をスペクトル分析した結果とを順次マツ
チングすることによって単語判定を行ない、認識結果出
力を得る。
ここで、話者学習に用いられる音韻は、音声を構成する
全ての音韻を対象とする必要はなく、予め別の手段で定
められたところの、話者学習に最も都合のよい音韻のみ
に限って行なえば十分である。日本語を認識する場合、
6母音はこの目的にかなった音韻である。即ち出現頻度
が十分高いため話者学習の速度が速く、またこれら5母
音の識別のみであれば、他の子音に比較して十分高い識
別が可能であり、さらにこの識別を行なうための演算処
理も比較的少なくて済むという利点がある。
全ての音韻を対象とする必要はなく、予め別の手段で定
められたところの、話者学習に最も都合のよい音韻のみ
に限って行なえば十分である。日本語を認識する場合、
6母音はこの目的にかなった音韻である。即ち出現頻度
が十分高いため話者学習の速度が速く、またこれら5母
音の識別のみであれば、他の子音に比較して十分高い識
別が可能であり、さらにこの識別を行なうための演算処
理も比較的少なくて済むという利点がある。
従って、単語全長のスペクトルマツチングに基いた比較
的小規模な音声認識方法にセット化標準パターンによる
話者適用の方法を組み込む場合には、本実施例に示すよ
うな構成をとり、話者学習の対象として6母音を選ぶの
が都合が良い。 ゛発明の効果 以上のように本発明によれば、音韻に基いた話者学習を
行なうことにより、単語に基いた話者学習を行なう場合
よりも学習の速度が速くなる利点がある。また一方では
単語全長のパターンに基いた音声認識を行なうことによ
り、個々の音韻に基いた音声認識を行なう場合よりも小
規模な装置実現を可能にする方法を提供できる利点もあ
る。
的小規模な音声認識方法にセット化標準パターンによる
話者適用の方法を組み込む場合には、本実施例に示すよ
うな構成をとり、話者学習の対象として6母音を選ぶの
が都合が良い。 ゛発明の効果 以上のように本発明によれば、音韻に基いた話者学習を
行なうことにより、単語に基いた話者学習を行なう場合
よりも学習の速度が速くなる利点がある。また一方では
単語全長のパターンに基いた音声認識を行なうことによ
り、個々の音韻に基いた音声認識を行なう場合よりも小
規模な装置実現を可能にする方法を提供できる利点もあ
る。
図は本発明の一実施例における音声認識方法を実現する
ためのブロック構成図である。 1・・・・・・音韻識別部、2・・・・・・話者学習手
段、3・・・・・・セット化音韻標準パターン、4・・
・・・・セット番号変換手段、5・・・・・・セット対
応テーブル、6・・・・・・単語スペクトルマツチング
手段、7・・・・・・セット化単語標準パターン。
ためのブロック構成図である。 1・・・・・・音韻識別部、2・・・・・・話者学習手
段、3・・・・・・セット化音韻標準パターン、4・・
・・・・セット番号変換手段、5・・・・・・セット対
応テーブル、6・・・・・・単語スペクトルマツチング
手段、7・・・・・・セット化単語標準パターン。
Claims (1)
- 各音韻についての複数個の標準パターンを音韻間でセッ
ト化したセット化音韻標準パターンと、各単語について
の複数個の標準パターンを単語間でセット化したセット
化単語標準パターンと、前記セット化音韻標準パターン
とセット化単語標準パターンとの間の対応関係を定めた
セット対応テーブルとを有し、音声認識時における前記
セット化音韻標準パターンに基いた話者学習の際には、
音韻標準パターンの使用頻度及び学習サンプル識別時の
信頼度とに基いて前記話者に適合した音韻標準パターン
のセットを選択し、さらに前記セット対応テーブルを用
いて前記話者に適合した単語標準パターンのセットを選
択し、選択されたセット化単語標準パターンを用いて音
声の識別を行なうことを特徴とする音声認識方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59189907A JPH0823759B2 (ja) | 1984-09-11 | 1984-09-11 | 音声認識方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59189907A JPH0823759B2 (ja) | 1984-09-11 | 1984-09-11 | 音声認識方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS6167896A true JPS6167896A (ja) | 1986-04-08 |
JPH0823759B2 JPH0823759B2 (ja) | 1996-03-06 |
Family
ID=16249195
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP59189907A Expired - Lifetime JPH0823759B2 (ja) | 1984-09-11 | 1984-09-11 | 音声認識方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0823759B2 (ja) |
-
1984
- 1984-09-11 JP JP59189907A patent/JPH0823759B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPH0823759B2 (ja) | 1996-03-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2815579B2 (ja) | 音声認識における単語候補削減装置 | |
JPS5972496A (ja) | 単音識別装置 | |
JPH0713594A (ja) | 音声合成において音声の質を評価するための方法 | |
JPS61219099A (ja) | 音声認識装置 | |
JP2583074B2 (ja) | 音声合成方法 | |
JP2820093B2 (ja) | 単音節認識装置 | |
JPS6167896A (ja) | 音声認識方法 | |
JP2980382B2 (ja) | 話者適応音声認識方法および装置 | |
KR100355453B1 (ko) | 동시에 병렬적으로 문자인식 및 음성인식을 사용한 컴퓨터 사용자 인터페이스 방법 | |
JPS5958493A (ja) | 認識装置 | |
JP2001013986A (ja) | 音声認識用音響モデルの話者適応装置及び方法 | |
JPS63148299A (ja) | 単語音声認識方法および装置 | |
JPH01158499A (ja) | 定常雑音除去方式 | |
JPS61149997A (ja) | 音声認識装置 | |
Peterson et al. | Identification of Filtered Vowels | |
Barney et al. | New artificial larynx | |
JPS62209598A (ja) | 単語音声認識処理方式 | |
JPH04260100A (ja) | 音声認識装置 | |
Lehiste | Acoustical clues to word boundaries | |
JPS58195895A (ja) | 単語音声認識装置 | |
JPS63168697A (ja) | 音声認識装置 | |
JPS62147492A (ja) | 音声認識装置における標準パラメ−タの修正方法 | |
Jeng et al. | The study on speech processing and character recognition at Telecommunication Laboratories (TL) | |
JPS62160499A (ja) | 音声認識装置 | |
JPS607493A (ja) | 単音節音声認識方式 |