JPS608898A - 音声認識装置 - Google Patents
音声認識装置Info
- Publication number
- JPS608898A JPS608898A JP58117422A JP11742283A JPS608898A JP S608898 A JPS608898 A JP S608898A JP 58117422 A JP58117422 A JP 58117422A JP 11742283 A JP11742283 A JP 11742283A JP S608898 A JPS608898 A JP S608898A
- Authority
- JP
- Japan
- Prior art keywords
- dictionary
- recognition
- voice
- registered
- learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(イ)発明の技術分野
本発明は音声認識装置に係り、特にマルチテンプレート
方式に改良を加えた音声認識装置に関する。
方式に改良を加えた音声認識装置に関する。
(r))技術の背景
従来の音声認識装置には、使用者の音声を登Sし、その
登録した音声と入力した音声とを照合して最も似ている
ものを認識結果として出力する特定話者音声認識装置が
ある。
登録した音声と入力した音声とを照合して最も似ている
ものを認識結果として出力する特定話者音声認識装置が
ある。
この型式の音声認識装置には、1つの語に複数の辞書を
用意するマルチテンプレート方式のものや、これに学習
処理を導入して上記方式を更に発展させたものがあるが
、この後者の方式になるものであっても、その辞書登録
における発声の態様や、発生される語の性質に対する分
析がいまだ十分でなく、その結果として、用意しなL−
Jればならない辞書容量はなお多くにならざるを得ない
のみならず、そのために認識時間が長くなる等更に改善
すべき余地が残されている。
用意するマルチテンプレート方式のものや、これに学習
処理を導入して上記方式を更に発展させたものがあるが
、この後者の方式になるものであっても、その辞書登録
における発声の態様や、発生される語の性質に対する分
析がいまだ十分でなく、その結果として、用意しなL−
Jればならない辞書容量はなお多くにならざるを得ない
のみならず、そのために認識時間が長くなる等更に改善
すべき余地が残されている。
G”i従来技術と問題点
上記の特定話者音声認識装置の初期においては、1つの
語に1つの辞書を用意する場合ζこ生ずる誤認識を回避
せんとして発声のばらつきに対処する辞書、即ち1つの
語に複数の辞書を用意するいゎゆるマルチテンプレート
方式の音声認識装置が開発された。この装置においては
、各語毎にその語を発7ii l、た場合に生じiqる
各種音声を十分に登録している場合にはその効果を期待
出来る。しかし、実際にtJ、音声登録を続りて行なう
場合が多く、その登録の際の発声が同様なものになり易
いため、−マルチテンブレ−I・化のすJ果は稀釈化さ
れてしまう。
語に1つの辞書を用意する場合ζこ生ずる誤認識を回避
せんとして発声のばらつきに対処する辞書、即ち1つの
語に複数の辞書を用意するいゎゆるマルチテンプレート
方式の音声認識装置が開発された。この装置においては
、各語毎にその語を発7ii l、た場合に生じiqる
各種音声を十分に登録している場合にはその効果を期待
出来る。しかし、実際にtJ、音声登録を続りて行なう
場合が多く、その登録の際の発声が同様なものになり易
いため、−マルチテンブレ−I・化のすJ果は稀釈化さ
れてしまう。
そこで、登録か終了したら、入力音声と対応するjAの
辞111の照合距「111の近いものについて特定比イ
・X(入カフ1声と登録音声とを合成し一ζi′¥た学
習音声をその語の登録11声として町今ε?を11なう
とい・)学習処理を行ない、徐々に発声の異なる辞71
に4る下段を採用している。
辞111の照合距「111の近いものについて特定比イ
・X(入カフ1声と登録音声とを合成し一ζi′¥た学
習音声をその語の登録11声として町今ε?を11なう
とい・)学習処理を行ない、徐々に発声の異なる辞71
に4る下段を採用している。
このようにして、すべての語に複数の辞書を持たU゛て
も、その登録の際に同様な発声になる音声が登録される
場合には、依然として十述したと同様マルチテンブレー
I・化の効果を発揮出来ない。
も、その登録の際に同様な発声になる音声が登録される
場合には、依然として十述したと同様マルチテンブレー
I・化の効果を発揮出来ない。
又、語によっ−(は発声し易(ばらつきの出にくいもの
や、類似語がなく誤J73識しにくいものがある。
や、類似語がなく誤J73識しにくいものがある。
、二のような語について子連のようなマルチテンプレー
ト化を行なう必要性は乏しい。
ト化を行なう必要性は乏しい。
仁)発明の目的
本発明は上述したようなIjfl来装置の有する欠点に
鑑みて創案されたもので、その目的は用意しなければな
らない辞書数を大幅に削減して認識時間の短縮化を達成
しろる音声認識装置を提供することにある。
鑑みて創案されたもので、その目的は用意しなければな
らない辞書数を大幅に削減して認識時間の短縮化を達成
しろる音声認識装置を提供することにある。
(ホ)発明の構成
そして、この目的はマルチテンブレー1・方式の辞書を
有し、その辞書内容を学習処理により更新する手段を有
する音声認識装置において、上記学習処理におりる認識
順位をめる手段と、その認識順位が予め決められた順位
に達したか否かを判定する手段と、上記予め決められた
順位に達していないことに応答して−J二記学習処理を
継続させ、それに達したとき入力背定パラメータの」−
記辞書への追加登録処理に入る手段とを備えて構成する
ことによって達成される。
有し、その辞書内容を学習処理により更新する手段を有
する音声認識装置において、上記学習処理におりる認識
順位をめる手段と、その認識順位が予め決められた順位
に達したか否かを判定する手段と、上記予め決められた
順位に達していないことに応答して−J二記学習処理を
継続させ、それに達したとき入力背定パラメータの」−
記辞書への追加登録処理に入る手段とを備えて構成する
ことによって達成される。
(へ)発明の実施例
原生、添付図面を参照して本発明の詳細な説明する。
添イ旧21面は本発明の一実施例を示す。Iは使用=Q
」Jから発声された音声を受音するマイクロボンで、2
はマイクロボン1に接続された音声特徴抽出部である。
」Jから発声された音声を受音するマイクロボンで、2
はマイクロボン1に接続された音声特徴抽出部である。
3は音声特徴抽出部2から出力された入力音声パラメー
タを格納する入力音声パラメータ照合部ァである。入力
音声バラノータバソファ3の出力は登録学習制御部4へ
接続されると共に、パラメータ照合部5へ接続され、そ
こへの入力音声パラメータは登録学習制御部4の制御の
下にある登録音声パラメータ辞書部6から出力される登
録音声バラメークとパラメータ照合部5で照合され、登
録音声パラメータ毎に照合距離を認識制御部7へ与える
ようにパラメータ照合部5は構成されている。又、登録
音声パラメータ辞書部6の登録音声パラメータ出力は登
録学習制御部4へ接続され、登録学習制御部4は後述す
るような学習処理結果の学習音声パラメータ又は入力音
声バラメークを登録音声パラメータ辞書部6に再登録又
は追加登録するように構成されている。
タを格納する入力音声パラメータ照合部ァである。入力
音声バラノータバソファ3の出力は登録学習制御部4へ
接続されると共に、パラメータ照合部5へ接続され、そ
こへの入力音声パラメータは登録学習制御部4の制御の
下にある登録音声パラメータ辞書部6から出力される登
録音声バラメークとパラメータ照合部5で照合され、登
録音声パラメータ毎に照合距離を認識制御部7へ与える
ようにパラメータ照合部5は構成されている。又、登録
音声パラメータ辞書部6の登録音声パラメータ出力は登
録学習制御部4へ接続され、登録学習制御部4は後述す
るような学習処理結果の学習音声パラメータ又は入力音
声バラメークを登録音声パラメータ辞書部6に再登録又
は追加登録するように構成されている。
認識制御部7はパラメータ照合部5から照合距離を受け
て最も照合距離の近い辞書を認識結果の辞書とし、その
辞書情報を認識辞書情報として線8上に送出すると共に
上記最も照合距離の近い辞書が何語であるかを示す情報
を登録学習制御部4の制御の下にある辞書ディレクトリ
部9から冴で認識結果を線10上に送出し、又そのとき
の認識順位情報を線11上に送出するように構成されて
いる。線8は登録学習制御部4へ接続されている。
て最も照合距離の近い辞書を認識結果の辞書とし、その
辞書情報を認識辞書情報として線8上に送出すると共に
上記最も照合距離の近い辞書が何語であるかを示す情報
を登録学習制御部4の制御の下にある辞書ディレクトリ
部9から冴で認識結果を線10上に送出し、又そのとき
の認識順位情報を線11上に送出するように構成されて
いる。線8は登録学習制御部4へ接続されている。
12は装置に登録モート、学習モード又は認識モードを
設定し、次候補要求信号を発生ずるためのもので、認識
制御部7及び登録学習制御部4へ接続されている。
設定し、次候補要求信号を発生ずるためのもので、認識
制御部7及び登録学習制御部4へ接続されている。
13は線■0上に正解の認識結果が出されたときの順位
が辞書追加を行なわなcノればならない予め決められた
順位に達したとき線14」二に辞書追加要求信号を発生
ずる辞書追加制御部で、線■4は登録学習制御部4へ接
続されている。
が辞書追加を行なわなcノればならない予め決められた
順位に達したとき線14」二に辞書追加要求信号を発生
ずる辞書追加制御部で、線■4は登録学習制御部4へ接
続されている。
15は登録学習制御部4で処理される音声パラメータを
格納するバッファである。
格納するバッファである。
次に、上述した構成の本発明装置の動作を説明する。
本発明を実施する装置には、登録モート、学習モート及
び認識モードがあワて、装置は先ず、使用−1tJによ
る操作パネルの操作により登録モート−に設定される。
び認識モードがあワて、装置は先ず、使用−1tJによ
る操作パネルの操作により登録モート−に設定される。
この登録モードにおいて、使用者Uが登録すべき語をマ
イクロホン1へ四番ノで順次に発声する。
イクロホン1へ四番ノで順次に発声する。
マイクロホン1から入力された音声は音声特徴抽出部2
で認識用音声パラメータに変換され、その入力音声パラ
メータは入力音声パラメータバッファ3に格納される。
で認識用音声パラメータに変換され、その入力音声パラ
メータは入力音声パラメータバッファ3に格納される。
格納された入力音声パラメータは登録学習?lil+御
部4の制御a11により登録音声パラメータ辞書部(j
に登録されると共に、その登録された辞書とり1応する
辞膚ディレク1り部9に登録語の識別情報が登録される
。
部4の制御a11により登録音声パラメータ辞書部(j
に登録されると共に、その登録された辞書とり1応する
辞膚ディレク1り部9に登録語の識別情報が登録される
。
このような処理が登録したいすべての語について行なわ
れる。
れる。
その終了後、使用打U 4;t:操作パネル12から学
習モートを設定し、再び登録モー1−の場合と同様にし
、て音声を入力させる。その入力された音声は音声特徴
抽出部2に与えられ、そこで音声パラメータの抽出処理
が行なわれる。抽出された入力音声パラメータは入力音
声パラメータバッファ3に格納される。
習モートを設定し、再び登録モー1−の場合と同様にし
、て音声を入力させる。その入力された音声は音声特徴
抽出部2に与えられ、そこで音声パラメータの抽出処理
が行なわれる。抽出された入力音声パラメータは入力音
声パラメータバッファ3に格納される。
この入力音声パラメータバッファ3の入力音声パラメー
タは登録学習制御部4の制御の下に登録音声パラメータ
辞書部6に登録されているすべての登録音声パラメータ
と順番にパラメータ照合部5で照合され、その照合完了
の都度照合距離を認識制御部7へ送る。
タは登録学習制御部4の制御の下に登録音声パラメータ
辞書部6に登録されているすべての登録音声パラメータ
と順番にパラメータ照合部5で照合され、その照合完了
の都度照合距離を認識制御部7へ送る。
これらの照合が終了すると、認識制御部7では、照合距
離の最も近い辞書を認識結果の辞書とすると共に、その
辞書が何語であるかを辞書ディレクトリ部9から得てそ
の認識結果を線10上に送出する。これと同時的に、認
識制御部7から線8を経て与えられる認識辞書情報に基
づいて、登録学習制御部4が上述認識結果の辞■を学習
相手の辞書とし、その辞書内容と入力音声パラメータと
を特定の比率で合成して学習音声パラメータを作成J°
る。その学習音声パラメータはx、4.’++1合声)
々ラメータハノファ15に格納される。
離の最も近い辞書を認識結果の辞書とすると共に、その
辞書が何語であるかを辞書ディレクトリ部9から得てそ
の認識結果を線10上に送出する。これと同時的に、認
識制御部7から線8を経て与えられる認識辞書情報に基
づいて、登録学習制御部4が上述認識結果の辞■を学習
相手の辞書とし、その辞書内容と入力音声パラメータと
を特定の比率で合成して学習音声パラメータを作成J°
る。その学習音声パラメータはx、4.’++1合声)
々ラメータハノファ15に格納される。
上述した認MBi果を使用者(Jがチ、ニックし、それ
が誤認識のものである場合には、使用7f U &よI
榮作パネル12を1榮作して次の認識候?+tiを要j
;1−る。
が誤認識のものである場合には、使用7f U &よI
榮作パネル12を1榮作して次の認識候?+tiを要j
;1−る。
この要求に応答して認識制御部7は欠に照合「巨Fjl
lが近い別の語についての認識結果を次候補として出力
する。登録学習制御部4では、新しし1認識辞壱: I
i ?uに応答して百びヒ述と同様の手順により′y習
音声パラメータを作成し、それを学習音声ノイラメータ
ハノファ15に再格納する。
lが近い別の語についての認識結果を次候補として出力
する。登録学習制御部4では、新しし1認識辞壱: I
i ?uに応答して百びヒ述と同様の手順により′y習
音声パラメータを作成し、それを学習音声ノイラメータ
ハノファ15に再格納する。
このようにして、認識結果Gこ正解力咄)jされ、て使
用fイUが次の語の学習作業に移り、音声力(入ツノさ
れると、登録学習制御部4は学習音声)々ラメータバッ
ファ15の音声パラメータを学習Gこ用G)た登録音声
パラメータ辞書に再登録し、1つのKnの学習処理を終
了する。
用fイUが次の語の学習作業に移り、音声力(入ツノさ
れると、登録学習制御部4は学習音声)々ラメータバッ
ファ15の音声パラメータを学習Gこ用G)た登録音声
パラメータ辞書に再登録し、1つのKnの学習処理を終
了する。
上述のような学習処理において、認識結果Gこ正解が出
力されるときの線11上の認識順位情幸■力(辞書追加
を行なうべき予め決められた順位にi幸しているならば
、辞書追加制御部13から線14上に辞書追加要求信号
が送出される。この信号を受けた登録学習制御部4は上
述したような学習処理の代りに、入力音声パラメータを
新辞書に登録する処理に移る。即ち、その入力音声パラ
メータは学習音声パラメータバッファ15に格納され、
そのパラメータは認識結果に正解が出力され、使用者U
が次の語の学習作業に移り、その語の音声が入力される
と、登録学習制御部4は学習音声パラメータ照合部ァ1
5の音声パラメータを登録音声パラメータ辞書部6の空
辞書に登録すると共に、その辞書識別情報を上記空辞書
に関連イ」けて辞書ディレクトリ部9に登録する。この
ようにして上述認識順位情報を出力するに至った語につ
いてはマルチテンプレート化が行なわれる。
力されるときの線11上の認識順位情幸■力(辞書追加
を行なうべき予め決められた順位にi幸しているならば
、辞書追加制御部13から線14上に辞書追加要求信号
が送出される。この信号を受けた登録学習制御部4は上
述したような学習処理の代りに、入力音声パラメータを
新辞書に登録する処理に移る。即ち、その入力音声パラ
メータは学習音声パラメータバッファ15に格納され、
そのパラメータは認識結果に正解が出力され、使用者U
が次の語の学習作業に移り、その語の音声が入力される
と、登録学習制御部4は学習音声パラメータ照合部ァ1
5の音声パラメータを登録音声パラメータ辞書部6の空
辞書に登録すると共に、その辞書識別情報を上記空辞書
に関連イ」けて辞書ディレクトリ部9に登録する。この
ようにして上述認識順位情報を出力するに至った語につ
いてはマルチテンプレート化が行なわれる。
なお、上記実施例においては、辞書追加要求はその語乃
至語群に最適の基準又はこれに準する基準が設定され−
でなされるのがよい。
至語群に最適の基準又はこれに準する基準が設定され−
でなされるのがよい。
(1)発明のすJ果
以−ヒ述べたように、本発明によれば、すべての語がマ
ルチテンプレート化されるのではなく、誤認識し易い語
についてマルチテンプレート化されるように構成されて
いるので、登録音声パラメータ辞書の容量を大幅に削減
し得る。これは又照合時間の短縮となるから、認識に要
する時間も短くて済む等の効果が得られる。
ルチテンプレート化されるのではなく、誤認識し易い語
についてマルチテンプレート化されるように構成されて
いるので、登録音声パラメータ辞書の容量を大幅に削減
し得る。これは又照合時間の短縮となるから、認識に要
する時間も短くて済む等の効果が得られる。
添付図面は本発明の一実施例を示す。
図中、1はマイクロホン、2は音声特徴抽出部、3は入
力音声パラメータバッファ、4は登録学習制御部、5は
パラメータ照合部、6は登録音声パラメータ辞書部、7
は認識制御部、9は辞書ディレクトリ部、12は操作パ
ネル、13は辞書追加制御部、15は学習音声パラメー
タ照合部ァである。
力音声パラメータバッファ、4は登録学習制御部、5は
パラメータ照合部、6は登録音声パラメータ辞書部、7
は認識制御部、9は辞書ディレクトリ部、12は操作パ
ネル、13は辞書追加制御部、15は学習音声パラメー
タ照合部ァである。
Claims (1)
- マルチテンプレート方式の辞書を有し、その辞書内容を
学習処理により更新する手段を有する音声認識装置にお
いて、上記学習処理におりる認識順位をめる手段と、そ
の認8iill順位が予め決められた順位に達したか否
かを判定する手段と、上記予め決められた順位に達して
いないことに応答して上記学習処理を相続させ、それに
達したとき入力音声パラメータの」二記辞書への追加登
録処理に入る手段とを備えて構成したことを特徴とする
音声認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP58117422A JPS608898A (ja) | 1983-06-29 | 1983-06-29 | 音声認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP58117422A JPS608898A (ja) | 1983-06-29 | 1983-06-29 | 音声認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS608898A true JPS608898A (ja) | 1985-01-17 |
Family
ID=14711249
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP58117422A Pending JPS608898A (ja) | 1983-06-29 | 1983-06-29 | 音声認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS608898A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6011897A (ja) * | 1983-06-30 | 1985-01-22 | 富士通株式会社 | 音声認識装置 |
-
1983
- 1983-06-29 JP JP58117422A patent/JPS608898A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6011897A (ja) * | 1983-06-30 | 1985-01-22 | 富士通株式会社 | 音声認識装置 |
JPH0362279B2 (ja) * | 1983-06-30 | 1991-09-25 | Fujitsu Ltd |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPS62232691A (ja) | 音声認識装置 | |
JPS608898A (ja) | 音声認識装置 | |
JPS63149699A (ja) | 音声入出力装置 | |
JPS645320B2 (ja) | ||
JPS6011897A (ja) | 音声認識装置 | |
JP2980382B2 (ja) | 話者適応音声認識方法および装置 | |
JPS6073592A (ja) | 特定話者用音声認識装置 | |
JPS6126678B2 (ja) | ||
WO2021064886A1 (ja) | 情報処理装置、プログラム及び情報処理方法 | |
JPS5934595A (ja) | 音声認識処理方式 | |
JPS63157199A (ja) | 話者照合装置 | |
JPS599080B2 (ja) | 音声認識方法 | |
JPS59176791A (ja) | 音声登録方式 | |
JPH04301695A (ja) | 音声認識装置の辞書制御方式 | |
JPS62217297A (ja) | 単語音声認識装置 | |
JPS60113298A (ja) | 特定話者音声認識装置 | |
JPS60170885A (ja) | 単音節音声学習方式 | |
JPS62226196A (ja) | 標準パタン逐次学習方式 | |
JPS59195299A (ja) | 特定話者音声認識装置 | |
JPS6312000A (ja) | 音声認識装置 | |
JPS6134599A (ja) | パタ−ン認識方式 | |
JPS6167897A (ja) | 音声認識装置 | |
JPS6375796A (ja) | 特定話者音声認識装置の音声認識辞書作成方式 | |
JPS6410080B2 (ja) | ||
JPS61231600A (ja) | 音声認識装置 |