JPH02230198A - 音声認識方式 - Google Patents

音声認識方式

Info

Publication number
JPH02230198A
JPH02230198A JP1051116A JP5111689A JPH02230198A JP H02230198 A JPH02230198 A JP H02230198A JP 1051116 A JP1051116 A JP 1051116A JP 5111689 A JP5111689 A JP 5111689A JP H02230198 A JPH02230198 A JP H02230198A
Authority
JP
Japan
Prior art keywords
phoneme
speaker
string
recognition
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1051116A
Other languages
English (en)
Inventor
Kazushi Muraki
一至 村木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP1051116A priority Critical patent/JPH02230198A/ja
Publication of JPH02230198A publication Critical patent/JPH02230198A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は音声認識方式に関し、特に特定話者用として用
いられる音声認識方式に関する。
〔従来の技術〕
従来、不特定話者音韻認識装置が認識し生成する音韻列
中の誤りを、音韻記号によって書かれた単語辞書とマッ
チングし、すでに登録してある単語の列に強制的に発話
語業として書き加えることにより、不特定話者音韻認識
装置の認識率を見かけ上向上させる方法が行われている
又、そのマッチングに対して、不特定話者音韻認識装置
が認識し出力した音韻列の誤りの傾向を,行に標準音韻
列をとり、列に不特定話者音韻認識装置を通したときの
誤り音韻列をとって、その誤り率をマトリクスの値とす
るコンフユージテンマトリクスとして保持し、最もコス
トの低い単語列を、認識誤りを訂正した装置全体の認識
音韻列として出力する方法が考えられている.〔発明が
解決しようとする課題〕 上述した従来の音声認識方式のコンフユ−ジョンマトリ
クスは、音声の特性により一般的に決まらず、個人性に
よって変動するという問題点がある。
本発明の目的は、音韻認識装置の認識率を向上させるこ
とができる音声認識方式を提供することにある. 〔課題を解決するための手段〕 本発明の音声認識方式は、話者の音声を入力して認識し
た音韻列を出力する音声認識方式において、話者の音声
を入力して認識した音韻列を出力する音声認識方式にお
いて、 (A)個人用の音韻と認識音韻との対応と、そのもっと
もらしさの度合とを保持するコンフユージヨンマトリク
ス、 (B)前記話者が発声した音声中の単語の音韻記号で書
かれた辞書と標準文または単語列と前記音韻記号による
標準テンプレートとによって、前記話者の前記標準文の
音声より前記コンフュージョンマトリクスを前記話者に
適合させる手段、 を備えて構成されている. 〔実施例〕 次に、本発明の実施例について図面を参照して説明する
. 第1図は本発明の一実施例のブロック図である. 第1図に示す音声認識方式の実施例は、動作モードとし
て認識モードと適合化モードの2つのモードを有してい
る. 第1図において、認識モードでは、発話された音声はマ
イクロホンにより採取されて音韻認識装置1に送出され
、音声を受信した音韻認識装置1は認識出力として音韻
列を出力する。認識され出力された音韻列は誤り訂正機
構5に送出される。
誤り訂正機構5は音韻辞書3とコンフユージヨンマトリ
クス4とにより、音韻認識装置1から出力された音韻列
を、音韻辞書3に登録されている単語列に相当する音韻
列に変換し出力する。なお、誤り訂正機f115は、日
本語平仮名列の単語への分割法と、後述のコンフユージ
ヨンマトリクス4中の誤りコストを用いた単語分割評価
法(例えば工一スターヒューリスティック探索法)によ
って容易に実現することができる. 一方、適合化モードは、標準例文の特定話者による発話
を入力として音韻認識装置1によって変換され出力され
た音韻列を話者適合機構2へ送出し、音韻列を受信した
話者適合機構2は内部に蓄えている標準文の音韻記号列
と音韻辞書3を用いてコンフユージヨンマトリクス4を
話者に適合させる。
第2図において、コンフユージゴンマトリクス4は、行
に標準音韻列、列に誤り音韻列を有しその要素は、標準
化された誤り頻度である.この誤り頻度の値は、例えば
、0から1『0までの値をとり、0はその音韻列間に認
識誤りがないことを示し、100は常に認識誤りがある
ことを示している。
話者適合機構2は、内部の標準文の有する音韻記号列と
特定話者の標準文発話認識結果にもとづき、コンフユー
ジヨンマトリクス4の誤り認識音韻列に対する音韻列の
誤り頻度につき、その特定話者、の場合の誤り頻度の値
を計算しコンフユージヨンマトリクス4に出力する。な
お、話者適合機構2は、よく知られたDPマッチング法
を用いて、例えば重複,脱落,置換及び挿入などの誤り
の修正にかかるコストを1.1,1.1として最小のコ
ストの標準音韻列に分割することにより容易に実現する
ことができる. 〔発明の効果〕 以上説明したように、本発明は、話者の個性を学習させ
ることにより、音韻認識装置の認識率を向上させること
ができるという効果を有する.
【図面の簡単な説明】
第1図は本発明の一実施例のブロック図、゛第2図は第
1図の実施例のコンフユージヨンマトリクス4を説明す
る図である. 1・・・音韻認識装置、2・・・話者適合機構、3・・
・音韻辞書、4・・・コンフユージョンマト・リクス、
5・・・誤り訂正機構. 人力考戸 エカ含81嗜gPj 第 図 北6 CCO DDD 王 ? 図

Claims (1)

  1. 【特許請求の範囲】 話者の音声を入力して認識した音韻列を出力する音声認
    識方式において、 (A)個人用の音韻と認識音韻との対応と、そのもっと
    もらしさの度合とを保持するコンフュージョンマトリク
    ス、 (B)前記話者が発声した音声中の単語の音韻記号で書
    かれた辞書と標準文または単語列と前記音韻記号による
    標準テンプレートとによって、前記話者の前記標準文の
    音声より前記コン フュージョンマトリクスを前記話者に適合させる手段、 を備えたことを特徴とする音声認識方式。
JP1051116A 1989-03-02 1989-03-02 音声認識方式 Pending JPH02230198A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1051116A JPH02230198A (ja) 1989-03-02 1989-03-02 音声認識方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1051116A JPH02230198A (ja) 1989-03-02 1989-03-02 音声認識方式

Publications (1)

Publication Number Publication Date
JPH02230198A true JPH02230198A (ja) 1990-09-12

Family

ID=12877838

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1051116A Pending JPH02230198A (ja) 1989-03-02 1989-03-02 音声認識方式

Country Status (1)

Country Link
JP (1) JPH02230198A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007105409A1 (ja) * 2006-02-27 2007-09-20 Nec Corporation 標準パタン適応装置、標準パタン適応方法および標準パタン適応プログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007105409A1 (ja) * 2006-02-27 2007-09-20 Nec Corporation 標準パタン適応装置、標準パタン適応方法および標準パタン適応プログラム

Similar Documents

Publication Publication Date Title
US7107216B2 (en) Grapheme-phoneme conversion of a word which is not contained as a whole in a pronunciation lexicon
US5333275A (en) System and method for time aligning speech
US7657430B2 (en) Speech processing apparatus, speech processing method, program, and recording medium
JP2002304190A (ja) 発音変化形生成方法及び音声認識方法
JP2005258443A (ja) 発音グラフを使用して新しい単語の発音学習を改善すること
JP2005208643A (ja) ユーザ訂正を用いた自動音声認識学習のためのシステムおよび方法
WO2004047075A1 (ja) 音声処理装置および方法、記録媒体並びにプログラム
JPH0261700A (ja) 音声認識装置
JPH02230198A (ja) 音声認識方式
JPH05100693A (ja) 音声認識用コンピユータ・システム
JP3277579B2 (ja) 音声認識方法および装置
JP2004021207A (ja) 音素認識方法、音素認識装置および音素認識プログラム
Bodenstab et al. Multi-pass pronunciation adaptation
JP2001188556A (ja) 音声認識方法及び装置
JPS6229796B2 (ja)
JP3299170B2 (ja) 音声登録認識装置
JPH0736481A (ja) 補完音声認識装置
JPH03245192A (ja) 外国語単語の発音決定方法
JPH08171396A (ja) 音声認識装置
JPH0229799A (ja) 音素を単位とした音声認識装置
JPS59121399A (ja) 単語音声登録方式
Lihan et al. Comparison of Slovak and Czech speech recognition based on grapheme and phoneme acoustic models
JPH09244692A (ja) 発声単語認証方法およびこの方法を実施する装置
JPH08211891A (ja) ヒドン・マルコフ・モデルの学習方法
JPH0713587A (ja) 隠れマルコフモデル連結学習方法