JPS615300A

JPS615300A - 学習機能付音声入力装置

Info

Publication number: JPS615300A
Application number: JP59127735A
Authority: JP
Inventors: 外川　文雄
Original assignee: Sharp Corp
Current assignee: Sharp Corp
Priority date: 1984-06-19
Filing date: 1984-06-19
Publication date: 1986-01-11

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】く技術分野〉本発明は文節（単語）単位に発声された音声を音節単位
に認識し、該認識された音節候補列を作成し、辞書照合
を含む文法処理を行なって文節（単語）候補及びその認
識評価値を出力する音声入力装置に関し、特にこれまで
に入力し確定された一連の自立語の分゛野別属性の傾向
を参照（学習）して、′これから確定すべき文節（単語
）候補に係る自立語の分野を推定し、これにもとづいて
認識評価値を補正し認識結果の出力順序を変更するよう
にした学習機能付音声入力装置に関するものである。

〈従来技術〉従来の日本語音声入力装置において、例えば入力音声を
音節単位に認識し、この認識された音節候補の組合せに
より複数の文節候補列を作成し、辞書照合を−含む文法
処理を行なって文節単位の認識結果を出力している。そ
してこの時文節の長さと各音節毎の候補数を組合せた数
の文節候補列が作成され、また辞書照合の結果も複数の
認識結果が出力される。

この場合、音声認識結果の確からしさの順序で複数の認
識結果を順次出力している。

しかし、従来のこのような方法において、単音節の認識
結果がほとんど誤まりの無い場合、あるいは対象とする
語粟が少ない場合には特に問題は生じないか、現在の音
声認識の技術レベルでは充分に区切った音節でも識別し
にくい音節があり、また連続的に発声した音声では調音
結合等の影響により識別率が更に低下する。

また辞書に収納された語索が多くなれば思ってもみない
語が最初に認識結果として出力されることがある。

そこで、従来はたとえば、認識結果の複数の候補を音声
認識結果の確からしさを示す確度情報と、音声認識結果
の確からしさ以外の自立語の長さ、頻度を含む条件にも
とすく文法評°価値情報とから得られる総合評価値情報
によって評価して認識結果の出力順序を決定するように
した日本語音声入力装置が提案されてｂる。

しかしながら、この種装置によれば認識結果の正解率は
向上するが、処理内容が煩雑すぎて装置構成が非常に複
雑になるという問題があった。

〈目的〉本発明はかかる従来の問題点に鑑みて成されたもので、
その目的とするところは、これまでに入力確定された一
連の文節（単語）の分野別属性を統計的に検知しながら
、これから確定すべき文節（単語）の分野を予測すると
いう所謂学習機能により、処理内容を簡略化でき且文節
（単語）の認識率を向上させることのできる学習機能付
音声入力装置を提供せんとするものである。

〈実施例〉以下図にもとづいて本発明の詳細な説明する。

まず本発明の詳細な説明する。言葉には意味や概念を表
わす最小の基本単位である語幹でこ＼では自立語という
）が含まれる。日本語として存在する数万から数１０万
の自立語は、幾つかの語いカテゴリを構成しており、例
えば事務系、技術系、医学系、法律系などの分野を語い
カテゴリとして設定すれば、「政治」という自立語は事
務系や法律系の文章ではよく使われるが技術系の文章に
は殆ど使われない。また「酸化」という自立語は技術系
や医学系ではよく使われるが事務系ではあまり使われな
い。

このように一連の文章中に現われる自立語の属する語い
カテゴリ（分野）には文章の分野に応じである偏りを示
す。

本発明はこの点に着目して、予め複数種の分野に対して
各自立語に分野別属性を設定し、この偏りを逆に利用し
て文章などの音声入力時に以前に入力された自立語の分
野別属性を学習し現在入力している分野を推定するもの
で、この推定分野と認識結果の各文節（単語）候補を構
成する自立語の分野別属性を用いて分野別属性の尤度を
算出し、その尤度で音響処理及び文法処理から求められ
た認識評価値（なお、認識評価値の算出方法はたとえば
特願昭５８−５８５］８号で説明している。）を補正し
たものを新しい評価値として得、この評価値をもとにし
て候補の並び換えを行なうものである。

以下、文節を区切りて発声された音声（文節音声）を認
識する場合を例に上げて具体的に説明する。

第１図は本発釘に係る学習機能付音声入力装置の概略構
成図である。図において、ｌはマイクロホンを介して入
力された文節単位の音声を音節単位に区分して単音節毎
の特徴抽出を行なう音響処理部であり、従来公知のもの
である。２は各装置を制御するコントローラ（ＣＰＵ）
、８は音響処理にて得られた入力音声の特徴パターンを
記憶する音節パターンバッファ、４は各単音節毎の標準
パターンを記憶する標準音節パターンメモリ、５は音節
候補ラティスバッファであり、特徴パターンと標準パタ
ーンとのマツチング計算処理が行なわれ、このマツチン
グ計算処理の結果、最も近似したものが第１候補として
、また順次近似したものが次候補として選出され、その
結果が近似度（確からしさ）を示す距離差情報と共に音
節ラティスとして前記ラティスバッフ１５に記憶される
ようになっている。６は候補列作成部にて識別確度の高
順に展開された候補列（かな列）を記憶する候補列バッ
フ１．７は文法分析によって得られた認識評価値をもつ
文節候補を記憶する文節候補バッファである。

８は自立語の分野別属性を記憶する分野別属性フラッグ
テーブルである。このテーブルは第１表に示すように、
文節を解釈できる辞書を構成する　　　　′自立語約３
，４万語に対して分野別属性フラッグをもたせ自立語番
号の昇順に並び換えたものでありＭ（分野数）×Ｎ（自
立語数）ｂｉｔｓ　　で構成されて因る。第１表では８
種の分野（たとえば、物理、化学、生物、地学、倫理、
政経、歴史、地理）をＦ１〜Ｆ８の８個のフラッグに対
応させ、さらにフラッグの１１”、０＃によって自立語
の分野別属性を記憶するようにしている。なお、フラッ
グＦｍか１＃であれば分野ｍＫ属し、−〇＃であれば分
野ｍに属さないことを示している。

９は分野別カウンタであり、９２表に示すように、各分
野に対応するＢ１〜Ｂ８の８個のカウンタから成る。１
０は文法分析に必要な文法情報、見出し語辞書及び接辞
語辞書等を含む辞書メモリである。

第１表ＩＩ／１１２表次に上記の如く構成された装置の動作を第２図に示す処
理フローに従って説明する。なお、点、線で囲んだ部分
が本発明に係る処理フローである。

文節単位に発声された入力音声は音響処理により音節パ
ターンが抽出されて識別され音節候補ラティスが出力さ
れる（ａ−ｆ）。この音節ラティスは候補列作成部にて
ａ！！別確度の高い願に展開され候補列（かな列）が作
成されて８，４万語の辞書照合及び文法分析部で文法分
析か行なわれ文法的に可能な解釈が総て行なわれる。も
し、解釈が不可能ならば除外し次の候補列を作成する。

そして、ｇ臓評価値Ｈｆをもつ文節候補を分析結果とし
て得る（ｇ−ｊ）。同時に、各文節候補を構成する自立
語の分野別属性Ｆｍ　（ｍ＝Ｌ　Ｍ）と現在の分野別カ
ウンタＢｍ　（ｍ−１，Ｍ）Ｏ値を用いて尤度演算部に
て分野別属性の尤度Ｌｉを次式のような内積で求める（
　ｋ＝ｍ　）。

但し、Ｌｉは第ｉ候補文節の亦野別−性の尤度である。

次に評価値算出部により、次式に従って認識評価値Ｈｉ
を対応の尤度Ｌｉで割算して新しい評価値Ｈ１°を求め
、文命候補を出力する。

Ｈｉ’　＝Ｈｉ　／　（１＋Ｌｉｘｋ）　　　　　　　
式（２）但し、ｋ；重み付は係数で、ｋ　＞　０゜そし
て、並換部にて求めた評価値Ｈｉ″にもとづく文節候補
の並び換えを行なう（ｎ−ｐ）。

このようにして、°新しい評価値Ｈ１′　　によって並
び換えられた文節候補のうち、候補順位−位のものが話
者（オペレータ）によって確定されると、その確定され
た文節に含まれる自立語の分野別属性Ｆｍを次式で示す
通り、分野別カウンタＢｍに累計加算し、これまでに確
定した自立語の分野別属性の傾向を記憶し、次の自立語
における分野別属性の尤度Ｌｉの算出時に参照できるよ
うに考慮されている。、（ｑ、ｒ、ｍ）。

Ｂｍ＝Ｂｍ＋Ｆｍ　　（ｆｏｒｍ＝１．、Ｍ）　　　　
　式（３）次に具体例を挙げて今少し詳細に説明する。

今、たとえば、「化学反応は熱や触媒によって加速され
る。例えば、鉄が」と入力した文章に続いて／酸化する
／と発声して入力した場合、文節候補の認識評価値Ｈに
よる候補順位は第３表に示す通りであり、「参賀する」
が第１位であった。

文節候補（噛鍵判１場画６ｒ）（ルＣ陶唆「ｆ仔■ｍ１；　Ｈ）
、（ｆｉｅ）（ｍ己）（硼ｆｌｌＪＦａＱ心１Ｌ）１）　　　　　１０００　　　さんがする参賀する　（
０，３８）２）　　　　　１８００　　　さんかする　
参加する　（０，４６）酸化する　（０，８７）８）　　　１５００　　さん力；〈ぶ山岳部（０，４７
）第８表ところで、入力音声の／酸化する／を認識するまでに、
化学、反応、触媒、加速、鉄の各自立語５が確定されて
おり、確定される度毎に分野別カウンタＢ１〜Ｂ８”は
各自立語の分野別属性（フラッグＦｌ−Ｆ８の状態）を
累計している。

したがって、／酸化する／という入力音声の認識時にあ
っては分野別カウンタＢ１〜Ｂ８の各カウンタ値は第２
表に示す通り、化学系の分野別カウンタＢ２で高い値（
５）を示しており、現在化学系の分野の入力が行なわれ
ているという予測をしていることがわかる。

よって、式（１）にもとづいて入力音声／酸化する／は
係る各文節候補について分野別属性の尤度りを算出する
と、第３表のように「酸化する」の値りがα８７と大き
な値になる。次に、式（２）に各文節候補の認識評価値
Ｈと対応の尤度りを代入して新しい認識評価値Ｈ′を求
めて並び換えると、第４表に示す通り１．「酸化する」
が第１候補となり誤りが訂正される。

分野別属性の尤度による評価後（認識評価値；Ｈ′）（１）　　　　６９５　　　　　酸化するｒ２）　　　
　７５２　　　　　参賀する（３１　　　８９０　　　
　　参加する（４）　　　　１０２０　　　　山岳部第
４表このように、本発明は既に確定した一連の文節（単語）
の分野別属性の傾向を参照して、次に確定すべき文節（
単語）の分野を予測し、再評価するようにしたものであ
り、簡単な処理手順でもって認識率を向上させることか
できる。

なお、上記実施例では分野別カウンタＢｍにて自立語の
確定の度毎にその分野別属性を累計カウントしているが
、この分野別カウンタＢｍの各分野別毎のカウンタ値を
任意に設定し且その設定値を固定できるようにしてもよ
い。たとえば、分野にのカウンタのみにある値を設定し
、他の分野のカウンタ値を総て′０＃に固定すれば、分
野ｋに属する音声入力が確率良く行なえ見掛は上分野に
の語いに限定した状態となる。

なお、総てのカウンタ値を０＃に設定し固定すれば全文
節候補の尤度Ｌｉ＝０でＨｉ’＝Ｈｉとなり本発明に係
る処理が作用しない状態と々る。

また、分野別属性を表わすフラッグＦｍは１０＃。

’Ｉ”の２値シはなく、文章や会話で使用される使用頻
度などに基づいた統計的なアナログ値であっても良い。

く効果〉以上詳細に説明したように、本発明装置は予め定められ
た複数の分野に対して各自立語の分野別属性情報を記憶
する手段と、入力した文節（単語）が確定する度毎に当
該文節（単語）を構成する自立語の分野別属性情報を順
次累計カウントする分野別カウンター手段と、前記各文
節（単語）候補蚤゛１構成する自立語の分野別属性情報
と、前記カウンター手段の累計による、今一つの分野別
属性情報を用いて、前記各文節（単語）候補に係る分野
別属性情報の尤度を算出する手段と、算出した尤度を用
いて前記各文節（単語）の認識評価値を補正する手段と
から成るから、処理内容を簡略化でき尚且文節（単語）
の認識率を向上させることが出来る。

【図面の簡単な説明】

第１図は本発明装置の概略構成図、第２図は処理フロー
を示す図である。１は音響処理部、　　　２はコントローラ、３は音節パ
ターンバッファ、　　８は分野別属性フラッグテーブル
、　　　９は分野別カウンタ。

Claims

【特許請求の範囲】１、文節（単語）単位に発声された音声を音節単位に認
識し、該認識された音節候補の組合せにより複数の文節
（単語）に候補列を作成し、辞書照合を含む文法処理を
行なって文節（単語）候補及びその認識評価値を出力す
る音声入力装置に於て、予め定められた複数の分野に対して各自立語の分野別属
性情報を記憶する手段と、入力した文節（単語）が確定
する度毎に当該文節（単語）を構成する自立語の分野別
属性情報を順次累計カウントする分野別カウンター手段
と、前記各文節（単語）候補を構成する自立語の分野別
属性情報と前記カウンター手段の累計による今一つの分
野別属性情報を用いて、前記各文節（単語）候補に係る
分野別属性情報の尤度を算出する手段と、算出した尤度
を用いて前記各文節（単語）の認識評価値を補正する手
段とを備えたことを特徴とする学習機能付音声入力装置
。２、前記記憶手段を、各自立語に対して分野別の属性フ
ラッグをもたせ、かつ自立語番号の昇順に並び換えたフ
ラッグテーブルにて構成したことを特徴とする特許請求
の範囲第１項に記載の学習機能付音声入力装置。３、前記カウンター手段を、必要に応じて各分野別毎の
カウンター値を任意に設定でき、且その設定値を固定し
得るように構成したことを特徴とする特許請求の範囲第
１項に記載の学習機能付音声入力装置。４、前記補正手段は補正評価値にもとづいて文節（単語
）候補の並び換えを行なう手段を包含して成ることを特
徴とする特許請求の範囲第１項に記載の学習機能付音声
入力装置。