JPS6169099A

JPS6169099A - 音声認識装置

Info

Publication number: JPS6169099A
Application number: JP59191028A
Authority: JP
Inventors: 文雄前原
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 1984-09-12
Filing date: 1984-09-12
Publication date: 1986-04-09

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】産業上の利用分野本発明は音声認識の誤り訂正に関する。

従来例の構成とその問題点従来、音声認識装置では入力音声信号を分析することに
よって得られるｎ次元の特徴ベクトル系列（ａ　１　、
　ａ　２　、・・・・・・ａＩ）に対し辞書としてあら
かじめ装置内に登録しであるＰ個の標準パターンベクト
ル系列（ｂ、、ｂ、、・・・・・・ｂ、ｌ・・・・・・
（ｂｌ、ｂ２゜・・・・・・ｂＫ）の中からこれと距離
の最も近いもの、もしぐは最も類似性の大きいものをも
って認識結果としているが、このとき入力ベクトル系列
［’１＋”２＋の中の１要素ベクトルｂ４の市街距離、
もしくはユークリッド距離を計算しこれを確からしさの
尺度とし、これをもとに２つのベクトル系列の総距離ｄ
、、を、ダイナミックプログラミングや線形伸縮などの
手法を用いて計算するものが大部分である。

但し、市街距離、ユ−クリッド距離は次式で与えられる
。

ａｉ＝（ａｉｌ、ａｉ２．　・−・、　ａｉ　、Ｎ　１
ｂＪ＝（ｂＪ　　　ｂｆ　　　・・・・・・、ｂ五Ｎ）
とするとｍ　　　ｍ、１　＋　　ｍ、２＋き・・・・・（２）以下の説明では確からしさの尺度として、上述のような
距離尺度を用いた場合を例として説明する。この場合、
距離が小さいほどより確からしいとする。

上記の原理にもとすく音声認識装置の一つとして、日本
語ワードグロセソサへの入力を目的として、仮名キー人
力の代りに、音節単位に区切って発声したもの、例えば
「ア」、「力」、「イ」、「・・」。

「す」を認識する単音節認識や、連続音声を音節単位も
しくはそれに類する単位、例えば「子音・母音・子音」
連鎖などに分割して、これらの単位毎に認識を行うもの
がある。

１　　　　　　　　ところで上記のような音節型、もし
くはこれに類する認識装置を日本語ワードフロセッサ（
以下ワープロと略す）の入力として用いる時、ワープロ
の持つカナ漢字変換のための単語辞書や文章辞書もしく
は単語辞書と言語処理機能の組合せなどを用いて認識に
おける誤りを訂正するものが有る。

音節を認識する型の装置を例にひいてこの場合の動作に
ついて説明すると、音節認識部において、音節単位のパ
ターンとしてあらかじめ登録されているＰ個の標準パタ
ーンと入力パラメータベクトル列との比較に際して、最
小距離を与える標準パターン１つを選ぶ代りに、距離の
小さいもの１個（■は正の整数）を選択して、例えば入
力音声がｌ個（工は正の整数）の音節から成るとすると
、ＩｘＪ個の音節候補マｌ−ＩＪソックスその各々につ
いての標準パターンとの総距離ｄｉ、ｊ（但し１゜ｊは
１≦ｉ≦工、１≦ｊ≦Ｉ　なる整数、以下総距離ｄｉ＋
Ｊを単に距離と呼ぶ）を用いてＩ通りの構成可能文章の
各々について累積距離Ｓ、（１）を５ｒ（ｉ）＝、Σｄ
ｉ　、　ｒ（ｉ）ｚ＝１（但しｒ（１）はｌの関数でｉの各段において１≦ｊ≦
Ｉなるｉのうち１つに対応する。）として計算し、このうち累積距離の小さいものからＮ個
の文章候補を選びだし、あらかじめ記憶されている文章
辞書（一般のカナ漢字変換に使われるものが流用可能）
を検索し、一致したものを文章認識結果とするものがあ
る。この間の動作を具体例によってさらに説明する。

第１図はＩ＝ｓ、Ｊ＝４とした場合の例で、１つの音節
入力に対して４つの音節候補を出力する。

文章中の音節数ば５で、正しい発声は「あたらしい」と
する。第１音節（ｉ＝１）では音節候補として（あかば
た１３　５２　６３　□９）（下段は距離を表わす）が得
られたことを示す。Ｉ＝５．Ｊ＝４の時生成可能な文章
は「あだたちい」、「あだだちび」・・・・・・・・・
「たささいし」でＴ　１＝４５−１０２４通り存在する
。誤りの訂正には１０２４通りの文章中から、先に述べ
た累積距離の小さいものＮ個（Ｎは正の整数）を用い、
あらかじめ記憶されている文章辞書との比較を行う。第
１図の例では、第１候補（あたたちい）累積距離　８２第２候補（あた
たしい）　　ｌ　　　８６第３候補（あたらちい）累積
距離　８７第４候補（あたらしい）〃９１となり、辞書中に「あたらしい」という文章のみが存在
すると誤りが訂正できる。実際第１〜３候補に示される
様な文章は存在しないので、辞書中にこのような文章が
存在しないことは明らかである。

ところで、上記のような方法で、音節認識における距離
をもとに１個の音節を選んだ時、音節によっては上位１
個の中に入ることが非常に少ない、言いかえると非常に
認識しにくい音節が発生する。

例えば「ん」などのように、文章のどの位置にくるかに
よって発声が異なるものなどがある。この場合、何度言
い直しても、上位１個に候補が入らず、正しい文章が得
られないということが生じるという欠点を有する。

発明の目的本発明は上記欠点に鑑み、複数の音韻もしくは音節、あ
るいはこれに類する音響単位の認識候補を用いて、辞書
検索により訂正を行う場合において、認識しにくい音節
に対しても訂正が容易な認識装置を提供することを目的
とする。

発明の構成本発明は、この目的を達成するために、あらかじめ各音
響単位に対し実験的、もしくは統計的に求められた誤認
識候補を記憶している記憶手段を用い、認識された音響
単位の第一候補に関し、前記記憶手段の内容をもとに複
数個の誤認識候補を選択し、前記認識された音響単位の
各候補とともに認識を行うように構成している。

実施例の説明以下、本発明の一実施例について図面を参照しながら説
明する。

第２図は本発明の一実施例における音声認識装置のブロ
ック図である。本実施例においては音響単位として音節
を用いる。第２図において、１はｆ　　　　　入力音声
をパラメータ分析してＮ次元の・くラメータベクトル列
（ａｌ　ｒ　”２　＋・・・・・・、ａＩ）よりなる入
カバターンに遂次変換するパラメータ分析部で、フィル
タバンク、フーリエ変換器、線形予測糸数型分析器など
により構成される。

２は標準パターン記憶部で、あらかじめパラメータ分析
された音声を音節標準パターン（ｂ　１　、　ｂ　Ｍ。

・・・・・・、ｂ））・・・・・・　Ｌ　ｂｒ　、　弓
、　、、、、・・、ｂＭ　）として記憶する。

３は比較部で前記入力パラメータベクトル列（ａｌ　＋
ａ２＋・・・・・・、ａＩｌと標準パターン記憶部２に
記憶されている標準パターンとの距離を計算する。

４は判定部であり、比較部３で標準パターンと入カバタ
ーンを比較して得られた距離のうち小さいものから１個
（工は正の整数）を音節候補として選択出力する。この
１個の音節候補の各距離をｄｉ２．とする。但し添字ｉ
は、１≦ｉ≦工　で第１番目に出現した音節を、また添
字ｉは、１≦ｊ≦Ｉで距離が第ｊ番目に小さいことを各
々示す。

５は誤り候補記憶部で、実験的もしくは統計的に求めた
各音節に対する誤認識候補とその時の平均距離を記憶し
ている。６は候補選択部で、判定部４より得られた１個
の音節候補と、との１個の音節候補のうちの第１番目の
音節候補に対応し誤り候補記憶部５を参照して得られる
Ｍ個の誤認識候補を入力とし、これらＪ＋Ｍ個の候補の
中から距離の小さいものＬ個（Ｌは整数）を最終音節候
補として出力する。ただし音節候補と誤認識候補で重複
のあるものはその距離の小さい方を選び最終音節候補と
する。７は文章候補生成部で、候補選択部らより与えら
れるＬ個の最終音節候補の中から各識別音節に与えられ
た距離ｄ　＞　］　Ｊ但し１≦ｊ′≦Ｌをもとに、累積
距離５ｒ（ｉ）をΣ　ｄ。

５ｒ（ｉ）　＝　、　　　１．　ｒ（ｉ）ｌ＝１として求める。但しｒ（１）はｉの関数でｉの各段にお
いて１≦ｊ′≦Ｌなるｊ′のうちの１つに対応づけられ
る。従って工音節より成る文章ではＬ　個の５ｒ（ｉ）
が計算される。すなわち１≦ｒ（１）≦Ｌ　である。次
に上記の計算で求められた５ｒ（ｉ）のうち小さいもの
からＮ個を選び出し、これに該当する音節の組合せを文
章候補として出力する。８は文章辞書で予め文章が記憶
されている。９は辞書マツチング部で、文章辞書８に記
憶されている文章と、文章候補生成部子で得られたＮ個
の文章候補のうち累積距離Ｓ、（１）の小さいものから
順次比較してゆき辞書と一致したものを認識結果として
出力する。

次に上記のように構成された装置の動作について第１図
に示した具体例を用いて説明する。

今５音節より成る文章（文節）「あたらしい」が発声さ
れたとする。パラメータ分析部１におけるパラメータ分
析、比較部３における標準パターンとの比較の後、判定
部４の出力として第１図に示す音節候補マトリックスが
順次出現したとする。

今この中から累積距離の小さい文章候補４つ（Ｎ＝４）
を選択して辞書マツチングに供する場合を例にとって説
明する。判定部４で与えられる距離は、第１図中、候補
音節名工のに）内数字で示す。誤り候補記憶部５には前
もって判定部４の第１図に示されるデータを大量にとっ
ておき、すべての発生可能音節に対する誤りパターンを
集めておき、各音節毎に誤る頻度の高いものから第１〜
第４候補を誤認識候補とし、また各誤認識候補について
の複数のデータの距離の平均値を誤認識候補の距離とす
る。この時認識しにくい音節、例えば「ん」等は強制的
に誤認識候補に加えることが効果が有ることが実験的に
確かめられている。以上のようにして誤り候補記憶部５
には第３図の３１に示すように、各音節に対する誤り頻
度の高い音節とその平均距離を記憶する。

介入力として「あたらしい」という文章が発声された時
、判定部４の出力として第３図の３２に示す音節候補マ
トリックスが生じたとする。この時誤り候補記憶部５は
音節候補マトリックスの第一候補に対応する誤認識候補
３３を候補選択部６に出力する。候補選択部６は判定部
４からの音節候補マトリックスと誤り候補記憶部５から
の誤認識候補マトリックスをもとに両者のうちの距離最
小のものから順に４候補を選択する。この時、両ｆ　　
　　　　者に同一の音節が発生した時は距離の小さい方
を採用する。以上の動作により候補選択部６の出力とし
て第３図の３４に示す最終音節候補マｌ−ＩＪフックス
得る。文章候補生成部７では入力した最終音節候補マド
ＩＪノクスの各音節候補距離をもとに式（１）より累積
距離５ｒ（ｉ）を１≦ｒ（ｉ）≦４，１≦１≦５の各組
合せについて計算し、そのうち累積距離の小さいもの４
つを文章候補として辞書マツチング部９に出力する。第
３図の３４の例では文章候補としては第４図に示すよう
に（あたたちい）。

（あたたしい）、（あたらちい）、（あたらしい）とな
る。

辞書マツチング部９は入力された文章候補と、文章辞書
８内に記憶されている文章とを累積距離の小さいものか
ら順次比較し、一致したものを認識結果とする。なお辞
書と一致するもので累積距離が第２位のもの第３位のも
のを順次認識の第２゜第３候補とすることも可能である
。

以上のように本実施例によれば判定部４により判定され
た音節候補の第−位のものに対し、誤り候補記憶部５よ
り得られた誤認識候補による誤認識候補マトリックスを
生成し、判定部４より得られた音節候補マトリックスと
合せて候補選択部６で最終音節候補マトリックスを生成
し、これをもとに文章候補生成部７に供することにより
、誤認識に関する統計的性質をもり込んだ効率的な認識
誤り訂正を実現できる。

なお本実施例は、この出力をカナ漢字変換機能を組合わ
せて結果を漢字カナまじり文で出力することが可能であ
る。又実施例中、文章辞書８は、一般に行われているカ
ナ漢字変換の自立語辞書並びに付属語辞書及びそれらの
接続関係をチェックする言語処理機能におきかえること
が可能である。

又本実施例はこの一部もしくは全体をコンピュータに置
きかえ、プログラム的にこれを実現することができる。

さらに本実施例では、音節候補選択の尺度として距離を
用いたが、これを類似度もし発明の効果以上のように本発明の音声認識装置は、音響単位毎の識
別の結果得られた複数組の認識候補の他に、予め実験的
にもしくは統計的に得られた誤認識候補を装置内に記憶
しておき、この両者をもとに認識候補を生成することに
より、誤りの統計的性質を考慮した候補選択を行うこと
ができ認識装置の性能を向上することができその工業的
価値は大なるものが有る。

【図面の簡単な説明】

第１図は音節候補マトリックス認識結果の一例を示す図
、第２図は本発明の一実施例における音声認識装置のブ
ロック図、第３図は本発明の実施例の動作を説明するだ
めの図、第４図は本発明の実施例における文章候補生成
の例を説明するための図である。１・・・・・・パラメータ分析部、２・・・・・・標準
パターン記憶部、３・・・・・・比較部、４・・・・・
・判定部、６・・・・・・誤り候補記憶部、６・・・・
・・候補選択部。代理人の氏名　弁理士　中　尾　敏　男　ほか１名第１
図 −→吟間

Claims

【特許請求の範囲】

入力音声を所定の音響単位で識別し、各音響単位毎に複
数個の識別候補と、その識別の確からしさの値を出力す
る識別手段と、各音響単位毎に実験的または統計的に求
められた誤認識候補およびその確からしさの値よりなる
誤認識候補マトリックスを記憶する誤認識マトリックス
記憶手段とを備え、前記識別候補と誤認識候補を用いて
音声認識を行なうことを特徴とする音声認識装置。