JPH02230198A

JPH02230198A - 音声認識方式

Info

Publication number: JPH02230198A
Application number: JP1051116A
Authority: JP
Inventors: Kazushi Muraki; 一至村木
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1989-03-02
Filing date: 1989-03-02
Publication date: 1990-09-12

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔産業上の利用分野〕本発明は音声認識方式に関し、特に特定話者用として用
いられる音声認識方式に関する。

〔従来の技術〕

従来、不特定話者音韻認識装置が認識し生成する音韻列
中の誤りを、音韻記号によって書かれた単語辞書とマッ
チングし、すでに登録してある単語の列に強制的に発話
語業として書き加えることにより、不特定話者音韻認識
装置の認識率を見かけ上向上させる方法が行われている
。

又、そのマッチングに対して、不特定話者音韻認識装置
が認識し出力した音韻列の誤りの傾向を，行に標準音韻
列をとり、列に不特定話者音韻認識装置を通したときの
誤り音韻列をとって、その誤り率をマトリクスの値とす
るコンフユージテンマトリクスとして保持し、最もコス
トの低い単語列を、認識誤りを訂正した装置全体の認識
音韻列として出力する方法が考えられている．〔発明が
解決しようとする課題〕上述した従来の音声認識方式のコンフユ−ジョンマトリ
クスは、音声の特性により一般的に決まらず、個人性に
よって変動するという問題点がある。

本発明の目的は、音韻認識装置の認識率を向上させるこ
とができる音声認識方式を提供することにある．〔課題を解決するための手段〕本発明の音声認識方式は、話者の音声を入力して認識し
た音韻列を出力する音声認識方式において、話者の音声
を入力して認識した音韻列を出力する音声認識方式にお
いて、（Ａ）個人用の音韻と認識音韻との対応と、そのもっと
もらしさの度合とを保持するコンフユージヨンマトリク
ス、（Ｂ）前記話者が発声した音声中の単語の音韻記号で書
かれた辞書と標準文または単語列と前記音韻記号による
標準テンプレートとによって、前記話者の前記標準文の
音声より前記コンフュージョンマトリクスを前記話者に
適合させる手段、を備えて構成されている．〔実施例〕次に、本発明の実施例について図面を参照して説明する
．第１図は本発明の一実施例のブロック図である．第１図に示す音声認識方式の実施例は、動作モードとし
て認識モードと適合化モードの２つのモードを有してい
る．第１図において、認識モードでは、発話された音声はマ
イクロホンにより採取されて音韻認識装置１に送出され
、音声を受信した音韻認識装置１は認識出力として音韻
列を出力する。認識され出力された音韻列は誤り訂正機
構５に送出される。

誤り訂正機構５は音韻辞書３とコンフユージヨンマトリ
クス４とにより、音韻認識装置１から出力された音韻列
を、音韻辞書３に登録されている単語列に相当する音韻
列に変換し出力する。なお、誤り訂正機ｆ１１５は、日
本語平仮名列の単語への分割法と、後述のコンフユージ
ヨンマトリクス４中の誤りコストを用いた単語分割評価
法（例えば工一スターヒューリスティック探索法）によ
って容易に実現することができる．一方、適合化モードは、標準例文の特定話者による発話
を入力として音韻認識装置１によって変換され出力され
た音韻列を話者適合機構２へ送出し、音韻列を受信した
話者適合機構２は内部に蓄えている標準文の音韻記号列
と音韻辞書３を用いてコンフユージヨンマトリクス４を
話者に適合させる。

第２図において、コンフユージゴンマトリクス４は、行
に標準音韻列、列に誤り音韻列を有しその要素は、標準
化された誤り頻度である．この誤り頻度の値は、例えば
、０から１『０までの値をとり、０はその音韻列間に認
識誤りがないことを示し、１００は常に認識誤りがある
ことを示している。

話者適合機構２は、内部の標準文の有する音韻記号列と
特定話者の標準文発話認識結果にもとづき、コンフユー
ジヨンマトリクス４の誤り認識音韻列に対する音韻列の
誤り頻度につき、その特定話者、の場合の誤り頻度の値
を計算しコンフユージヨンマトリクス４に出力する。な
お、話者適合機構２は、よく知られたＤＰマッチング法
を用いて、例えば重複，脱落，置換及び挿入などの誤り
の修正にかかるコストを１．１，１．１として最小のコ
ストの標準音韻列に分割することにより容易に実現する
ことができる．〔発明の効果〕以上説明したように、本発明は、話者の個性を学習させ
ることにより、音韻認識装置の認識率を向上させること
ができるという効果を有する．

【図面の簡単な説明】

第１図は本発明の一実施例のブロック図、゛第２図は第
１図の実施例のコンフユージヨンマトリクス４を説明す
る図である．１・・・音韻認識装置、２・・・話者適合機構、３・・
・音韻辞書、４・・・コンフユージョンマト・リクス、
５・・・誤り訂正機構．人力考戸エカ含８１嗜ｇＰｊ第図北６ＣＣＯＤＤＤ王？図

Claims

【特許請求の範囲】話者の音声を入力して認識した音韻列を出力する音声認
識方式において、（Ａ）個人用の音韻と認識音韻との対応と、そのもっと
もらしさの度合とを保持するコンフュージョンマトリク
ス、（Ｂ）前記話者が発声した音声中の単語の音韻記号で書
かれた辞書と標準文または単語列と前記音韻記号による
標準テンプレートとによって、前記話者の前記標準文の
音声より前記コンフュージョンマトリクスを前記話者に適合させる手段、を備えたことを特徴とする音声認識方式。