JPS6073592A - 特定話者用音声認識装置 - Google Patents
特定話者用音声認識装置Info
- Publication number
- JPS6073592A JPS6073592A JP58181172A JP18117283A JPS6073592A JP S6073592 A JPS6073592 A JP S6073592A JP 58181172 A JP58181172 A JP 58181172A JP 18117283 A JP18117283 A JP 18117283A JP S6073592 A JPS6073592 A JP S6073592A
- Authority
- JP
- Japan
- Prior art keywords
- learning
- registered
- speech
- parameters
- parameter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔発明の技術分野〕
本発明は、使用者の音声を登録し、その登録した音声と
入力した音声とを比較して最も似ている登録音声を認識
結果とする特定話者用音声認識装置に関するものである
。
入力した音声とを比較して最も似ている登録音声を認識
結果とする特定話者用音声認識装置に関するものである
。
従来、特定話者用音声認識装置では、使用者の音声を音
声辞書に登録し、認識時に、入力した音声辞書を順番に
照合して最も照合距離の近いものを認識結果としている
。また、1つの語に対し辞書が1つでは、発声のばらつ
きによる差で誤認識をすることがあるため、1つの語に
複数の辞書を用意して、ばらついた場合の発声を登録す
ることにより、誤認識をしにくいようにしている。この
1つの語に複数の辞書を用意する方式をマルチ・テンプ
レート方式と呼んでいる。
声辞書に登録し、認識時に、入力した音声辞書を順番に
照合して最も照合距離の近いものを認識結果としている
。また、1つの語に対し辞書が1つでは、発声のばらつ
きによる差で誤認識をすることがあるため、1つの語に
複数の辞書を用意して、ばらついた場合の発声を登録す
ることにより、誤認識をしにくいようにしている。この
1つの語に複数の辞書を用意する方式をマルチ・テンプ
レート方式と呼んでいる。
マルチ・テンプレート方式の音声認識装置では、1つの
語に2個ないし4個程度の辞書を用意して、なるべく発
声の異なる音声を登録することによシ認識率の向上を図
っているが、現実には、音声登録時に続けて発声の異な
る音声を登録してしまうため、実質的に同様な発声にな
ってしまい、マルチ・テンプレートの効果があまり出な
い。そとで、登録が終了すると学習処理を行い、入力音
声と対応する語の辞書の照合距離の近い方に、特定の比
率で入力音声と登録音声とを平均した学習音声を再登録
することにより、徐々に発声の異なる辞書にすることを
行っている。
語に2個ないし4個程度の辞書を用意して、なるべく発
声の異なる音声を登録することによシ認識率の向上を図
っているが、現実には、音声登録時に続けて発声の異な
る音声を登録してしまうため、実質的に同様な発声にな
ってしまい、マルチ・テンプレートの効果があまり出な
い。そとで、登録が終了すると学習処理を行い、入力音
声と対応する語の辞書の照合距離の近い方に、特定の比
率で入力音声と登録音声とを平均した学習音声を再登録
することにより、徐々に発声の異なる辞書にすることを
行っている。
このように全ての語に複数の辞書を持たせても、同様な
発声が登録されると効果が出な・い。また、語によって
は、発声しやすくばらつきの出にくいものや、類似語が
なく誤認識しにくいものがある。
発声が登録されると効果が出な・い。また、語によって
は、発声しやすくばらつきの出にくいものや、類似語が
なく誤認識しにくいものがある。
このような語は辞書が1つでも充分である。
本発明は、上記の考察に基づくものであって、マルチ・
テンプレート化の無駄を省き、登録音声パラメータ辞書
の容量削減、認識処理の効率化を図った特定話者用音声
認識装置を提供することを目的とするものである0 〔発明の構成〕 そのために本発明の特定話者用音声認識装置は、入力音
声を入力音声パラメータに変換する音声特徴抽出部、音
声パラメータを登録する登録音声ノくラメータ辞書部、
該登録音声パラメータ辞書部の辞書と対応して登録語の
識別情報を設定する辞書ディレクトリ部、パラメータの
照合を行って照合距離をめるパラメータ照合部、登録モ
ードか学習モードか認識モードかのいずれかの動作モー
ドを指定するモード指定手段、登録モードか学習モード
かの指定に応じて上記登録音声パラメータ辞書部と対応
する上記辞書ディレクトリ部とに対して音声パラメータ
の登録と登録語の識別情報の設定や音声パラメータの平
均化処理を行う登録学習制御部、学習モードの指定の場
合には認識情報を上記登録学習制御部に送り認識モード
の場合には入力音声パラメータと登録音声パラメータと
を上記パラメータ照合部で照合してめた照合距離が最も
近いものを認識結果として出力する認識結果制御部を具
備する音声認識装置において、上記パラメータ照合部は
、入力音声パラメータと全ての登録音声パラメータとの
照合を行って照合距離をめると共に上記登録学習制御部
から学習音声パラメータが与えられたときは入力音声パ
ラメータと学習音声パラメータとの照合を行って照合距
離をめ、上記認識結果制御部は、学習モードが指定され
ている場合には、上記パラメータ照合部でめた登録音声
パラメータとの照合距離のうち最も近いものから順に複
数の情報若しくは上記パラメータ照合部でめた学習音声
パラメータとの照合距離の情報を認識情報として上記登
録学習制御部に送り、上記登録学習制御部は、学習モー
ドが指定されている場合には、上記複数の情報をもとに
学習語が1位で認識されたか否かを調べ、1位で認識さ
れた場合には学習語の辞書の平均化を行い、1位以外で
認識された場合には学習語の辞書と入力音声パラメータ
とを特定の比率で平均化して学習音声パラメータとして
上記パラメータ照合部に与え、学習音声パラメータとの
照合距離が1位の登録音声パラメータとの照合距離よシ
も近いことを条件に学習語の辞書の平均化を行い、学習
音声パラメータとの照合距離が1位の登録音声パラメー
タとの照合距離よりも近くないことを条件に辞書の追加
を行うように構成されたことを特徴とするものである。
テンプレート化の無駄を省き、登録音声パラメータ辞書
の容量削減、認識処理の効率化を図った特定話者用音声
認識装置を提供することを目的とするものである0 〔発明の構成〕 そのために本発明の特定話者用音声認識装置は、入力音
声を入力音声パラメータに変換する音声特徴抽出部、音
声パラメータを登録する登録音声ノくラメータ辞書部、
該登録音声パラメータ辞書部の辞書と対応して登録語の
識別情報を設定する辞書ディレクトリ部、パラメータの
照合を行って照合距離をめるパラメータ照合部、登録モ
ードか学習モードか認識モードかのいずれかの動作モー
ドを指定するモード指定手段、登録モードか学習モード
かの指定に応じて上記登録音声パラメータ辞書部と対応
する上記辞書ディレクトリ部とに対して音声パラメータ
の登録と登録語の識別情報の設定や音声パラメータの平
均化処理を行う登録学習制御部、学習モードの指定の場
合には認識情報を上記登録学習制御部に送り認識モード
の場合には入力音声パラメータと登録音声パラメータと
を上記パラメータ照合部で照合してめた照合距離が最も
近いものを認識結果として出力する認識結果制御部を具
備する音声認識装置において、上記パラメータ照合部は
、入力音声パラメータと全ての登録音声パラメータとの
照合を行って照合距離をめると共に上記登録学習制御部
から学習音声パラメータが与えられたときは入力音声パ
ラメータと学習音声パラメータとの照合を行って照合距
離をめ、上記認識結果制御部は、学習モードが指定され
ている場合には、上記パラメータ照合部でめた登録音声
パラメータとの照合距離のうち最も近いものから順に複
数の情報若しくは上記パラメータ照合部でめた学習音声
パラメータとの照合距離の情報を認識情報として上記登
録学習制御部に送り、上記登録学習制御部は、学習モー
ドが指定されている場合には、上記複数の情報をもとに
学習語が1位で認識されたか否かを調べ、1位で認識さ
れた場合には学習語の辞書の平均化を行い、1位以外で
認識された場合には学習語の辞書と入力音声パラメータ
とを特定の比率で平均化して学習音声パラメータとして
上記パラメータ照合部に与え、学習音声パラメータとの
照合距離が1位の登録音声パラメータとの照合距離よシ
も近いことを条件に学習語の辞書の平均化を行い、学習
音声パラメータとの照合距離が1位の登録音声パラメー
タとの照合距離よりも近くないことを条件に辞書の追加
を行うように構成されたことを特徴とするものである。
以下、本発明の実施例を図面を参照しつつ説明する。
図は本発明の音声認識装置の1実施例構成を示す図であ
る。図において、1はマイク、2は音声特徴抽出部、3
は入力音声パラメータ・バッファ、4は操作パネル、5
はパラメータ照合部、6は学習音声パラメータ・バッフ
ァ、7は登録学習制御部、8は登録音声パラメータ辞書
部、9は辞書ディレクトリ部、10は認識結果制御部を
示す。
る。図において、1はマイク、2は音声特徴抽出部、3
は入力音声パラメータ・バッファ、4は操作パネル、5
はパラメータ照合部、6は学習音声パラメータ・バッフ
ァ、7は登録学習制御部、8は登録音声パラメータ辞書
部、9は辞書ディレクトリ部、10は認識結果制御部を
示す。
本発明は、マルチ・テンプレート化を全登録語に均一に
行うのではなく、学習処理時に、認識順位が1位でなか
った場合、学習効果を予測し、もしある回数平均化して
も1位にならない場合には、その入力音声は登録語とは
別の発声であると判断してマルチ・テンプレート化を行
うものである。
行うのではなく、学習処理時に、認識順位が1位でなか
った場合、学習効果を予測し、もしある回数平均化して
も1位にならない場合には、その入力音声は登録語とは
別の発声であると判断してマルチ・テンプレート化を行
うものである。
従って、逆に学習効果を予測し、ある回数平均化すれば
1位に上がる場合には、その入力音声は登録語で平均化
すべきであると判断して辞書の追加は行わないように処
理を行うものである。このような本発明の特定話者用音
声認識装置の1実施例構成を示したのが図である。
1位に上がる場合には、その入力音声は登録語で平均化
すべきであると判断して辞書の追加は行わないように処
理を行うものである。このような本発明の特定話者用音
声認識装置の1実施例構成を示したのが図である。
図において、マイク1は音声を入力する音声入力部であ
り、音声特徴抽出部2は入力音声を認識用の入力音声パ
ラメータに変換するものである。′操作パネル4は動作
モードの指定を行ったシ、キ′−による各種情報の入力
を行ったシ、処理進行に伴い各種情報の表示を行ったり
するものである。
り、音声特徴抽出部2は入力音声を認識用の入力音声パ
ラメータに変換するものである。′操作パネル4は動作
モードの指定を行ったシ、キ′−による各種情報の入力
を行ったシ、処理進行に伴い各種情報の表示を行ったり
するものである。
なお、動作モードには、登録モードと学習モードと認識
モードの3つがあり、登録モードでは使用者の入力音声
を音声登録パラメータ辞書部8に登録すると共に対応す
る辞書ブイレフ) lJ部9に登録語の識別情報を設定
し、学習モードでは登録音声と入力音声の平均化や辞書
の追加を行い、認識モードでは音声認識を行う。パラメ
ータ照合部5は、学習モードでは入力音声パラメータと
登録音声パラメータとの照合を行い、且つ学習語が第1
位以外で認識された場合に学習音声パラメータと入力音
声パラメータとの照合を行い、登録モードでは入力音声
パラメータと登録音声パラメータとの照合を行うもので
ある。登録音声パラメータ辞書部8は、音声の特徴を表
わす音声パラメータその他の特徴情報を格納するもので
あり、辞書ディレクトリ部9は、登録語の識別情報を設
定するものである。登録学習制御部7は、登録モードが
操作パネル4から指定されている場合には′入力音声パ
ラメータ・バッファ3に格納された入力音声パラメータ
を登録音声パラメータ照合部8に登録すると共に対応す
る辞書ディレクトリ部9に登録語の識別情報を設定する
。また、学習モードが操作パネル4から指定されている
場合には、学習語を認識していて認識結果制御部1oか
ら送られてくる認識情報により学習語が第1位で認識さ
れたか否かを調べ、第1位で認識されたときは辞書の平
均化を行い、第1位以外で認識されたときは、認識結果
の辞書と入力音声パラメータを特定の比率で平均化して
学習音声パラメータとして学習音声ハラメータ・バッフ
ァニ格納し、この学習音声パラメータと入力音声パラメ
ータとの照合距離をみる。その照合距離が第1位の登録
音声パラメータと入力音声パラメータとの距離より大き
いか小さいかによシ、大きい場合には辞書の追加を行い
、小さい場合には登録音声パラメータの平均化を行う。
モードの3つがあり、登録モードでは使用者の入力音声
を音声登録パラメータ辞書部8に登録すると共に対応す
る辞書ブイレフ) lJ部9に登録語の識別情報を設定
し、学習モードでは登録音声と入力音声の平均化や辞書
の追加を行い、認識モードでは音声認識を行う。パラメ
ータ照合部5は、学習モードでは入力音声パラメータと
登録音声パラメータとの照合を行い、且つ学習語が第1
位以外で認識された場合に学習音声パラメータと入力音
声パラメータとの照合を行い、登録モードでは入力音声
パラメータと登録音声パラメータとの照合を行うもので
ある。登録音声パラメータ辞書部8は、音声の特徴を表
わす音声パラメータその他の特徴情報を格納するもので
あり、辞書ディレクトリ部9は、登録語の識別情報を設
定するものである。登録学習制御部7は、登録モードが
操作パネル4から指定されている場合には′入力音声パ
ラメータ・バッファ3に格納された入力音声パラメータ
を登録音声パラメータ照合部8に登録すると共に対応す
る辞書ディレクトリ部9に登録語の識別情報を設定する
。また、学習モードが操作パネル4から指定されている
場合には、学習語を認識していて認識結果制御部1oか
ら送られてくる認識情報により学習語が第1位で認識さ
れたか否かを調べ、第1位で認識されたときは辞書の平
均化を行い、第1位以外で認識されたときは、認識結果
の辞書と入力音声パラメータを特定の比率で平均化して
学習音声パラメータとして学習音声ハラメータ・バッフ
ァニ格納し、この学習音声パラメータと入力音声パラメ
ータとの照合距離をみる。その照合距離が第1位の登録
音声パラメータと入力音声パラメータとの距離より大き
いか小さいかによシ、大きい場合には辞書の追加を行い
、小さい場合には登録音声パラメータの平均化を行う。
認識結果制御部1oは、操作パネル4から学習モードが
指定されている場合には、最も照合距離の近いものから
いくつかを識別情報と共に認識情報(同じ語は下位のも
のを除く)として出力し、認識モードが指定されている
場合には、最も照合距離の近いものを認識結果として出
力する。以下、各動作モードについて願を追って説明す
る。
指定されている場合には、最も照合距離の近いものから
いくつかを識別情報と共に認識情報(同じ語は下位のも
のを除く)として出力し、認識モードが指定されている
場合には、最も照合距離の近いものを認識結果として出
力する。以下、各動作モードについて願を追って説明す
る。
1 t” 登録モードの場合について説明する。使用者
は、操作パネル4から登録モードを指定し、登録すべき
語の音声を順番に発声していく。発声された音声がマイ
ク1から入力されると、その入力音声は、音声特徴抽出
部2で認識用の入力音声パラメータに変換され、入力音
声パラメータ・バッファ3に格納される。この入力音声
パラメータは登録学習制御部7によって登録音声パラメ
ータ辞書部8に登録される。同時に、登録学習制御部7
によって辞書と対応する辞書ディレクトリ部9に登録語
の識別情報が設定される。このようにして全登録語の登
録が終了すると、使用者は、次に操作パネル4から学習
モードを指定し、再び登録モードで行ったと同様に音声
をマイク1から入力する。
は、操作パネル4から登録モードを指定し、登録すべき
語の音声を順番に発声していく。発声された音声がマイ
ク1から入力されると、その入力音声は、音声特徴抽出
部2で認識用の入力音声パラメータに変換され、入力音
声パラメータ・バッファ3に格納される。この入力音声
パラメータは登録学習制御部7によって登録音声パラメ
ータ辞書部8に登録される。同時に、登録学習制御部7
によって辞書と対応する辞書ディレクトリ部9に登録語
の識別情報が設定される。このようにして全登録語の登
録が終了すると、使用者は、次に操作パネル4から学習
モードを指定し、再び登録モードで行ったと同様に音声
をマイク1から入力する。
学資モードでは、マイク1から音声が入力されると、そ
の入力音声は、音声特徴抽出部2で入力音声パラメータ
に変換され、入力音声パラメータ。
の入力音声は、音声特徴抽出部2で入力音声パラメータ
に変換され、入力音声パラメータ。
・バッファ3に格納される。そうすると、パラメータ照
合部5で入力音声パラメータ・バッファ3に格納された
入力音声パラメータと登録音声パラメータ辞書部8に登
録された登録音声パラメータが順番に照合され、その照
合距離が認識結果制御部10に送られる。全登録音声パ
ラメータとの照合が終了すると、認識結果制御部1oで
は、最も照合距離の近いものからいくつかを認識候補の
辞書として、辞書ディレクトリ部9から、それらの辞書
が何の語であるかを調べ、その結果、同じ語が認識候補
に含まれている場合には、上位を採用し他は候補から除
重て、複数の辞書の語を認識情報として送出する0登録
学習制御部7では、認識情報に基づいて、学習語が1位
で認識された場合には、辞書の平均化をすべきと判断し
、認識結果の辞書と入力音声パラメータを特定の比率で
平均化し、学習音声パラメータとして学習音声パラメー
タとして学習音声パラメータ・バッファ6に格納し、或
いは直接認識結果の辞書エリアに書込む他方、学習語が
1位以外で認識された場合には、辞書の学習効果を次の
ようにチェックし、辞書の平均化を行うべきか、マルチ
・テンプレート化して入力音声パラメータを新辞書とし
て追加すべきかを決め、そのいずれかの処理を行う。
合部5で入力音声パラメータ・バッファ3に格納された
入力音声パラメータと登録音声パラメータ辞書部8に登
録された登録音声パラメータが順番に照合され、その照
合距離が認識結果制御部10に送られる。全登録音声パ
ラメータとの照合が終了すると、認識結果制御部1oで
は、最も照合距離の近いものからいくつかを認識候補の
辞書として、辞書ディレクトリ部9から、それらの辞書
が何の語であるかを調べ、その結果、同じ語が認識候補
に含まれている場合には、上位を採用し他は候補から除
重て、複数の辞書の語を認識情報として送出する0登録
学習制御部7では、認識情報に基づいて、学習語が1位
で認識された場合には、辞書の平均化をすべきと判断し
、認識結果の辞書と入力音声パラメータを特定の比率で
平均化し、学習音声パラメータとして学習音声パラメー
タとして学習音声パラメータ・バッファ6に格納し、或
いは直接認識結果の辞書エリアに書込む他方、学習語が
1位以外で認識された場合には、辞書の学習効果を次の
ようにチェックし、辞書の平均化を行うべきか、マルチ
・テンプレート化して入力音声パラメータを新辞書とし
て追加すべきかを決め、そのいずれかの処理を行う。
まず、登録学習制御部7は、入力音声パラメータと学習
語の認識結果の辞書を学習効果チェック用の特定比率で
平均化し、学習音声パラメータ・バッファ6に格納する
。この学習音声パラメータと入力音声パラメータとをパ
ラメータ照合部5で照合して照合距離を認識結果制御部
10へ送シ、認識情報として登録学習制御部7へ送る。
語の認識結果の辞書を学習効果チェック用の特定比率で
平均化し、学習音声パラメータ・バッファ6に格納する
。この学習音声パラメータと入力音声パラメータとをパ
ラメータ照合部5で照合して照合距離を認識結果制御部
10へ送シ、認識情報として登録学習制御部7へ送る。
登録学習制御部7では、この学習音声パラメータと入力
音声パラメータとの照合距離、及び第1位で誤認識した
入力音声と登録音声との照合距離の比較を行い、学習音
声パラメータの方の照合距離が小さい場合には学習効果
を有効として辞書の平均化を行い、逆に、学習音声パラ
メータの方の照合距離が大きい場合には、その入力語は
登録語とは別の発声であると判断して辞書の追加を行う
。辞書の追加処理は、音声登録の場合と同様に、入力音
声゛パラメータを登録音声パラメータ辞書部8の空きエ
リアに書込み、同時に、対応する辞書ディレクトリ部9
に学習語の識別情報を書込む。
音声パラメータとの照合距離、及び第1位で誤認識した
入力音声と登録音声との照合距離の比較を行い、学習音
声パラメータの方の照合距離が小さい場合には学習効果
を有効として辞書の平均化を行い、逆に、学習音声パラ
メータの方の照合距離が大きい場合には、その入力語は
登録語とは別の発声であると判断して辞書の追加を行う
。辞書の追加処理は、音声登録の場合と同様に、入力音
声゛パラメータを登録音声パラメータ辞書部8の空きエ
リアに書込み、同時に、対応する辞書ディレクトリ部9
に学習語の識別情報を書込む。
以上のようにして順番に登録語を学習していき、第1位
で認識されたシ、誤認識された場合でも。
で認識されたシ、誤認識された場合でも。
平均化によシ第1位になると予想される場合には辞書の
平均化を行い、また平均化しても第1位にならないと予
想される場合には辞書の追加が行われたりして処理され
ていくことになる。
平均化を行い、また平均化しても第1位にならないと予
想される場合には辞書の追加が行われたりして処理され
ていくことになる。
認識モードは、学習モードの照合処理の場合と同様に、
入力音声パラメータと登録音声パラメータ全部とを照合
して、最も照合距離の小さいものを認識結果として出力
させるものである。
入力音声パラメータと登録音声パラメータ全部とを照合
して、最も照合距離の小さいものを認識結果として出力
させるものである。
以上の説明から明らかなように、本発明によれば、同じ
語でありながら発声が異なるために誤認識しやすい音声
はマルチ・テンプレート化し、発声がばらつきにくい語
や他に類似語がない−ために誤認識しにくい音声は辞書
の平均化を行う、というように学習するので、全ての語
をマルチ・テンプレート化する場合に比較して登録音声
パラメータ辞書の容量を大幅に減らすことが可能とな如
、しかも、その分パラメータ照合作業も減少するので、
認識時間を早めることが可能となる。
語でありながら発声が異なるために誤認識しやすい音声
はマルチ・テンプレート化し、発声がばらつきにくい語
や他に類似語がない−ために誤認識しにくい音声は辞書
の平均化を行う、というように学習するので、全ての語
をマルチ・テンプレート化する場合に比較して登録音声
パラメータ辞書の容量を大幅に減らすことが可能とな如
、しかも、その分パラメータ照合作業も減少するので、
認識時間を早めることが可能となる。
図は本発明の音声認識装置の1実施例構成を示す図であ
る。 1・・・マイク、2・・・音声特徴抽出部、3・・・入
力音声パラメータ・バッファ、4・・・操作パネル、5
・・・パラメータ照合部、6・・・学習音声パラメータ
・バッファ、7・・・登録学習制御部、8・・・登録音
声パラメータ辞書部、9・・・辞書ディレクトリ部、1
0・・・認識結果制御部。 特許出願人 富士通株式会社 代理人弁理士 京 谷 四 部
る。 1・・・マイク、2・・・音声特徴抽出部、3・・・入
力音声パラメータ・バッファ、4・・・操作パネル、5
・・・パラメータ照合部、6・・・学習音声パラメータ
・バッファ、7・・・登録学習制御部、8・・・登録音
声パラメータ辞書部、9・・・辞書ディレクトリ部、1
0・・・認識結果制御部。 特許出願人 富士通株式会社 代理人弁理士 京 谷 四 部
Claims (1)
- 入力音声を入力音声パラメータに変換する音声特徴抽出
部、音声/’l?ラメータを登録する登録音声パラメー
タ辞書部、該登録音声/<ラメータ辞書部の辞書と対応
して登録語の識別情報を設定する辞書ディレクトリ部、
ノくラメータの照合を行ってl収金距離をめ、るパラメ
ータ照合部、登録モー1−” l)1学習そ−ドか認識
モードかのいずれかの動作モードを指定するモード指定
手段、登録モート°力瓢学習モードかの指定に応じて上
記登録音声ノ(ラメータ辞書部と対応する上記辞書ブイ
レフh 17部とに対して音声パラメータの登録と登録
語の識別情報の設定や音声パラメータの平均化処理を行
う登録学習制御部、学習モードの指定の場合には認識情
報を上記登録学習制御部に送り認識モードの場合には入
力音声パラメータと登録音声パラメータとを上記パラメ
ータ照合部で照合してめた照合距離が最も近いものを認
識結果として出力する認識結果制御部を具備する音声認
識装置において、上記パラメータ照合部は、入力音声パ
ラメータと全ての登録音声パラメータとの照合を行って
照合距離をめ若しくは上記登録学習制御部から学習音声
パラメータが与えられたときは入力音声パラメータと学
習音声パラメータとの照合を行って照合距離をめ、上記
認識結果制御部は、学習モードが指定されている場合に
は、上記パラメータ照合部でめた登録音声パラメータと
の照合距離のうち最も近いものから順に複数の情報若し
くは上記パラメータ照合部でめた学習音声パラメータと
の照合距離の情報を認識情報として上記登録学習制御部
に送り、上記登録学習制御部は、学習そ一ドが指定され
ている場合には、上記複数の情報をもとに学習語が1位
で認識されたか否かを調べ、1位で認識された場合には
学習語の辞書の平均化を行い、1位以外で認識された場
合には学習語の辞書と入力音声パラメータとを特定の比
率で平均イヒして学習音声パラメータとして上記ノくラ
メータ照合部に与え、学習音声ノくラメータとの照合距
離75;1位の登録音声パラメータとの照合距離よシも
近いことを条件に学習語の辞書の平均化を行い、学習音
声パラメータとの照合距離が1位の登録音声パラメータ
との照合距離よりも近くないことを条件に辞書の追加を
行うように構成されたことを特徴とする特定話者用音声
認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP58181172A JPS6073592A (ja) | 1983-09-29 | 1983-09-29 | 特定話者用音声認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP58181172A JPS6073592A (ja) | 1983-09-29 | 1983-09-29 | 特定話者用音声認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS6073592A true JPS6073592A (ja) | 1985-04-25 |
JPH0217038B2 JPH0217038B2 (ja) | 1990-04-19 |
Family
ID=16096140
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP58181172A Granted JPS6073592A (ja) | 1983-09-29 | 1983-09-29 | 特定話者用音声認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS6073592A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6140686A (ja) * | 1984-08-01 | 1986-02-26 | Nec Corp | 標準パタ−ン登録方式 |
JPS63169698A (ja) * | 1987-01-08 | 1988-07-13 | 富士通株式会社 | 標準パタ−ン格納部管理方法 |
-
1983
- 1983-09-29 JP JP58181172A patent/JPS6073592A/ja active Granted
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6140686A (ja) * | 1984-08-01 | 1986-02-26 | Nec Corp | 標準パタ−ン登録方式 |
JPS63169698A (ja) * | 1987-01-08 | 1988-07-13 | 富士通株式会社 | 標準パタ−ン格納部管理方法 |
Also Published As
Publication number | Publication date |
---|---|
JPH0217038B2 (ja) | 1990-04-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5873061A (en) | Method for constructing a model of a new word for addition to a word model database of a speech recognition system | |
JPH0422276B2 (ja) | ||
JP2002006878A (ja) | 音声フレーズ認識方法及び音声認識装置 | |
JP2000122691A (ja) | 綴り字読み式音声発話の自動認識方法 | |
JP3124277B2 (ja) | 音声認識システム | |
JPS6073592A (ja) | 特定話者用音声認識装置 | |
JP2980382B2 (ja) | 話者適応音声認識方法および装置 | |
JP2002082688A (ja) | 話者適応化装置、話者適応化方法、話者適応化プログラムを記録したコンピュータ読取可能な記録媒体、音声認識装置、音声認識方法および音声認識プログラムを記録したコンピュータ読取可能な記録媒体 | |
JPS6126678B2 (ja) | ||
JPH04271397A (ja) | 音声認識装置 | |
JP3100208B2 (ja) | 音声認識装置 | |
JPS5934595A (ja) | 音声認識処理方式 | |
JPS63118198A (ja) | 音声認識装置 | |
JPS60113298A (ja) | 特定話者音声認識装置 | |
JPS62111292A (ja) | 音声認識装置 | |
JPS608898A (ja) | 音声認識装置 | |
JPS61254994A (ja) | 連続単語認識装置 | |
JPH04251300A (ja) | 音声認識装置 | |
JPS61123889A (ja) | 音声認識装置 | |
JPH0430598B2 (ja) | ||
JPS6312000A (ja) | 音声認識装置 | |
JPS63218999A (ja) | 音声認識装置 | |
JPS6287993A (ja) | 音声認識装置 | |
JPS62204299A (ja) | 音声認識装置 | |
JPS63173098A (ja) | 音声認識装置 |