JPH02230198A - 音声認識方式 - Google Patents
音声認識方式Info
- Publication number
- JPH02230198A JPH02230198A JP1051116A JP5111689A JPH02230198A JP H02230198 A JPH02230198 A JP H02230198A JP 1051116 A JP1051116 A JP 1051116A JP 5111689 A JP5111689 A JP 5111689A JP H02230198 A JPH02230198 A JP H02230198A
- Authority
- JP
- Japan
- Prior art keywords
- phoneme
- speaker
- string
- recognition
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000011159 matrix material Substances 0.000 claims abstract description 17
- 238000000034 method Methods 0.000 claims description 15
- 230000006978 adaptation Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は音声認識方式に関し、特に特定話者用として用
いられる音声認識方式に関する。
いられる音声認識方式に関する。
従来、不特定話者音韻認識装置が認識し生成する音韻列
中の誤りを、音韻記号によって書かれた単語辞書とマッ
チングし、すでに登録してある単語の列に強制的に発話
語業として書き加えることにより、不特定話者音韻認識
装置の認識率を見かけ上向上させる方法が行われている
。
中の誤りを、音韻記号によって書かれた単語辞書とマッ
チングし、すでに登録してある単語の列に強制的に発話
語業として書き加えることにより、不特定話者音韻認識
装置の認識率を見かけ上向上させる方法が行われている
。
又、そのマッチングに対して、不特定話者音韻認識装置
が認識し出力した音韻列の誤りの傾向を,行に標準音韻
列をとり、列に不特定話者音韻認識装置を通したときの
誤り音韻列をとって、その誤り率をマトリクスの値とす
るコンフユージテンマトリクスとして保持し、最もコス
トの低い単語列を、認識誤りを訂正した装置全体の認識
音韻列として出力する方法が考えられている.〔発明が
解決しようとする課題〕 上述した従来の音声認識方式のコンフユ−ジョンマトリ
クスは、音声の特性により一般的に決まらず、個人性に
よって変動するという問題点がある。
が認識し出力した音韻列の誤りの傾向を,行に標準音韻
列をとり、列に不特定話者音韻認識装置を通したときの
誤り音韻列をとって、その誤り率をマトリクスの値とす
るコンフユージテンマトリクスとして保持し、最もコス
トの低い単語列を、認識誤りを訂正した装置全体の認識
音韻列として出力する方法が考えられている.〔発明が
解決しようとする課題〕 上述した従来の音声認識方式のコンフユ−ジョンマトリ
クスは、音声の特性により一般的に決まらず、個人性に
よって変動するという問題点がある。
本発明の目的は、音韻認識装置の認識率を向上させるこ
とができる音声認識方式を提供することにある. 〔課題を解決するための手段〕 本発明の音声認識方式は、話者の音声を入力して認識し
た音韻列を出力する音声認識方式において、話者の音声
を入力して認識した音韻列を出力する音声認識方式にお
いて、 (A)個人用の音韻と認識音韻との対応と、そのもっと
もらしさの度合とを保持するコンフユージヨンマトリク
ス、 (B)前記話者が発声した音声中の単語の音韻記号で書
かれた辞書と標準文または単語列と前記音韻記号による
標準テンプレートとによって、前記話者の前記標準文の
音声より前記コンフュージョンマトリクスを前記話者に
適合させる手段、 を備えて構成されている. 〔実施例〕 次に、本発明の実施例について図面を参照して説明する
. 第1図は本発明の一実施例のブロック図である. 第1図に示す音声認識方式の実施例は、動作モードとし
て認識モードと適合化モードの2つのモードを有してい
る. 第1図において、認識モードでは、発話された音声はマ
イクロホンにより採取されて音韻認識装置1に送出され
、音声を受信した音韻認識装置1は認識出力として音韻
列を出力する。認識され出力された音韻列は誤り訂正機
構5に送出される。
とができる音声認識方式を提供することにある. 〔課題を解決するための手段〕 本発明の音声認識方式は、話者の音声を入力して認識し
た音韻列を出力する音声認識方式において、話者の音声
を入力して認識した音韻列を出力する音声認識方式にお
いて、 (A)個人用の音韻と認識音韻との対応と、そのもっと
もらしさの度合とを保持するコンフユージヨンマトリク
ス、 (B)前記話者が発声した音声中の単語の音韻記号で書
かれた辞書と標準文または単語列と前記音韻記号による
標準テンプレートとによって、前記話者の前記標準文の
音声より前記コンフュージョンマトリクスを前記話者に
適合させる手段、 を備えて構成されている. 〔実施例〕 次に、本発明の実施例について図面を参照して説明する
. 第1図は本発明の一実施例のブロック図である. 第1図に示す音声認識方式の実施例は、動作モードとし
て認識モードと適合化モードの2つのモードを有してい
る. 第1図において、認識モードでは、発話された音声はマ
イクロホンにより採取されて音韻認識装置1に送出され
、音声を受信した音韻認識装置1は認識出力として音韻
列を出力する。認識され出力された音韻列は誤り訂正機
構5に送出される。
誤り訂正機構5は音韻辞書3とコンフユージヨンマトリ
クス4とにより、音韻認識装置1から出力された音韻列
を、音韻辞書3に登録されている単語列に相当する音韻
列に変換し出力する。なお、誤り訂正機f115は、日
本語平仮名列の単語への分割法と、後述のコンフユージ
ヨンマトリクス4中の誤りコストを用いた単語分割評価
法(例えば工一スターヒューリスティック探索法)によ
って容易に実現することができる. 一方、適合化モードは、標準例文の特定話者による発話
を入力として音韻認識装置1によって変換され出力され
た音韻列を話者適合機構2へ送出し、音韻列を受信した
話者適合機構2は内部に蓄えている標準文の音韻記号列
と音韻辞書3を用いてコンフユージヨンマトリクス4を
話者に適合させる。
クス4とにより、音韻認識装置1から出力された音韻列
を、音韻辞書3に登録されている単語列に相当する音韻
列に変換し出力する。なお、誤り訂正機f115は、日
本語平仮名列の単語への分割法と、後述のコンフユージ
ヨンマトリクス4中の誤りコストを用いた単語分割評価
法(例えば工一スターヒューリスティック探索法)によ
って容易に実現することができる. 一方、適合化モードは、標準例文の特定話者による発話
を入力として音韻認識装置1によって変換され出力され
た音韻列を話者適合機構2へ送出し、音韻列を受信した
話者適合機構2は内部に蓄えている標準文の音韻記号列
と音韻辞書3を用いてコンフユージヨンマトリクス4を
話者に適合させる。
第2図において、コンフユージゴンマトリクス4は、行
に標準音韻列、列に誤り音韻列を有しその要素は、標準
化された誤り頻度である.この誤り頻度の値は、例えば
、0から1『0までの値をとり、0はその音韻列間に認
識誤りがないことを示し、100は常に認識誤りがある
ことを示している。
に標準音韻列、列に誤り音韻列を有しその要素は、標準
化された誤り頻度である.この誤り頻度の値は、例えば
、0から1『0までの値をとり、0はその音韻列間に認
識誤りがないことを示し、100は常に認識誤りがある
ことを示している。
話者適合機構2は、内部の標準文の有する音韻記号列と
特定話者の標準文発話認識結果にもとづき、コンフユー
ジヨンマトリクス4の誤り認識音韻列に対する音韻列の
誤り頻度につき、その特定話者、の場合の誤り頻度の値
を計算しコンフユージヨンマトリクス4に出力する。な
お、話者適合機構2は、よく知られたDPマッチング法
を用いて、例えば重複,脱落,置換及び挿入などの誤り
の修正にかかるコストを1.1,1.1として最小のコ
ストの標準音韻列に分割することにより容易に実現する
ことができる. 〔発明の効果〕 以上説明したように、本発明は、話者の個性を学習させ
ることにより、音韻認識装置の認識率を向上させること
ができるという効果を有する.
特定話者の標準文発話認識結果にもとづき、コンフユー
ジヨンマトリクス4の誤り認識音韻列に対する音韻列の
誤り頻度につき、その特定話者、の場合の誤り頻度の値
を計算しコンフユージヨンマトリクス4に出力する。な
お、話者適合機構2は、よく知られたDPマッチング法
を用いて、例えば重複,脱落,置換及び挿入などの誤り
の修正にかかるコストを1.1,1.1として最小のコ
ストの標準音韻列に分割することにより容易に実現する
ことができる. 〔発明の効果〕 以上説明したように、本発明は、話者の個性を学習させ
ることにより、音韻認識装置の認識率を向上させること
ができるという効果を有する.
第1図は本発明の一実施例のブロック図、゛第2図は第
1図の実施例のコンフユージヨンマトリクス4を説明す
る図である. 1・・・音韻認識装置、2・・・話者適合機構、3・・
・音韻辞書、4・・・コンフユージョンマト・リクス、
5・・・誤り訂正機構. 人力考戸 エカ含81嗜gPj 第 図 北6 CCO DDD 王 ? 図
1図の実施例のコンフユージヨンマトリクス4を説明す
る図である. 1・・・音韻認識装置、2・・・話者適合機構、3・・
・音韻辞書、4・・・コンフユージョンマト・リクス、
5・・・誤り訂正機構. 人力考戸 エカ含81嗜gPj 第 図 北6 CCO DDD 王 ? 図
Claims (1)
- 【特許請求の範囲】 話者の音声を入力して認識した音韻列を出力する音声認
識方式において、 (A)個人用の音韻と認識音韻との対応と、そのもっと
もらしさの度合とを保持するコンフュージョンマトリク
ス、 (B)前記話者が発声した音声中の単語の音韻記号で書
かれた辞書と標準文または単語列と前記音韻記号による
標準テンプレートとによって、前記話者の前記標準文の
音声より前記コン フュージョンマトリクスを前記話者に適合させる手段、 を備えたことを特徴とする音声認識方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1051116A JPH02230198A (ja) | 1989-03-02 | 1989-03-02 | 音声認識方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1051116A JPH02230198A (ja) | 1989-03-02 | 1989-03-02 | 音声認識方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH02230198A true JPH02230198A (ja) | 1990-09-12 |
Family
ID=12877838
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP1051116A Pending JPH02230198A (ja) | 1989-03-02 | 1989-03-02 | 音声認識方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH02230198A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007105409A1 (ja) * | 2006-02-27 | 2007-09-20 | Nec Corporation | 標準パタン適応装置、標準パタン適応方法および標準パタン適応プログラム |
-
1989
- 1989-03-02 JP JP1051116A patent/JPH02230198A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007105409A1 (ja) * | 2006-02-27 | 2007-09-20 | Nec Corporation | 標準パタン適応装置、標準パタン適応方法および標準パタン適応プログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7107216B2 (en) | Grapheme-phoneme conversion of a word which is not contained as a whole in a pronunciation lexicon | |
US5333275A (en) | System and method for time aligning speech | |
US7657430B2 (en) | Speech processing apparatus, speech processing method, program, and recording medium | |
JP2002304190A (ja) | 発音変化形生成方法及び音声認識方法 | |
JP2005258443A (ja) | 発音グラフを使用して新しい単語の発音学習を改善すること | |
JP2005208643A (ja) | ユーザ訂正を用いた自動音声認識学習のためのシステムおよび方法 | |
WO2004047075A1 (ja) | 音声処理装置および方法、記録媒体並びにプログラム | |
JPH0261700A (ja) | 音声認識装置 | |
JPH02230198A (ja) | 音声認識方式 | |
JPH05100693A (ja) | 音声認識用コンピユータ・システム | |
JP3277579B2 (ja) | 音声認識方法および装置 | |
JP2004021207A (ja) | 音素認識方法、音素認識装置および音素認識プログラム | |
Bodenstab et al. | Multi-pass pronunciation adaptation | |
JP2001188556A (ja) | 音声認識方法及び装置 | |
JPS6229796B2 (ja) | ||
JP3299170B2 (ja) | 音声登録認識装置 | |
JPH0736481A (ja) | 補完音声認識装置 | |
JPH03245192A (ja) | 外国語単語の発音決定方法 | |
JPH08171396A (ja) | 音声認識装置 | |
JPH0229799A (ja) | 音素を単位とした音声認識装置 | |
JPS59121399A (ja) | 単語音声登録方式 | |
Lihan et al. | Comparison of Slovak and Czech speech recognition based on grapheme and phoneme acoustic models | |
JPH09244692A (ja) | 発声単語認証方法およびこの方法を実施する装置 | |
JPH08211891A (ja) | ヒドン・マルコフ・モデルの学習方法 | |
JPH0713587A (ja) | 隠れマルコフモデル連結学習方法 |