JPS59180629A

JPS59180629A - 日本語音声入力装置

Info

Publication number: JPS59180629A
Application number: JP58058513A
Authority: JP
Inventors: Fumio Togawa; 外川　文雄; Mitsuhiro Toya; 充宏斗谷
Original assignee: Computer Basic Technology Research Association Corp
Current assignee: Computer Basic Technology Research Association Corp
Priority date: 1983-03-30
Filing date: 1983-03-30
Publication date: 1984-10-13
Also published as: JPS6325366B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】く技術分野〉本発明は文節単位に発声された音声を音節単位に認識し
、この認識された音節候補の組合せにより複数の文節候
補列を作成し、辞書照合を含む文法゛処理を行なって文
節単位の認識結果を出力する日本゛語音声入力装置の改
良に関するものであり、更に詳細には認識結果の複数の
候補を音声認識結果の確からしさ及び該確からしさ以外
の条件にもとすいて総合評価して認識結果の出力順序を
変更するようにしだ日本語音声入力装置に関するもので
ある。

〈従来技術〉従来の日本語音声入力装置において、例えば入力音声を
音節単位に認識し、この認識された音節候補の組合せに
より複数の文節候補列を作成し、辞書照合を含む文法処
理を行なって文節単位の認識結果を出力している。そし
てこの時文節の長さと各音節毎の候補数を組合せた数の
文節候補列が作成され、まだ辞書照合の結果も複数の認
識結果が出力される。

この場合、音声認識結果の確からしさの順序で複数の認
識結果を順次出力している０しかし、従来のこのような方法において、単音節の認識
結果がほとんど誤まりの無い場合、あるいは対象とする
語粟が少ない場合には特に問題は生じないが、現在の音
声認識の技術レベルでは充分に区切った音節でも識別し
にぐい音節があり、また連続的に発声した音声では調音
結合等の影響により識別率が更１ｆこ低下する。

また辞書に収納された語粟が多くなれば思ってもみない
語が最初に認識結果として出力されることがある。

本発明者等はこのような音響分析での音節認識率（音節
の正解率）が悪い場合に有効となる認識結果の出力順序
の決定方法を先に特願昭５７−２３２２１、３号「音−
人力式日本語文書処理装置」として提案した。

この方法は、音声認識結果の確からしき以外の自立語の
長さ、頻度等の条件を考慮に入れて認識結果の出力順令
脚定するようにしだものである。

しかし、本発明者等が先に提案した方法によれば、音響
分析技術の向上に従って、音節認識率が良くなって来る
と、認識結果の出力順序の決定に際して、逆に悪い方向
に働き、最終の文節認識結果の正解率を平均的に落とし
てしまうという問題点が見出されるに至った。

く目的〉本発明は上記の点に鑑みて成されたものであり、認識結
果の複数の候補を音声認識結果の確からしさを示す確度
情報と、音声認識結果の確からしさ以外の自立語の長さ
、頻度を含む条件にもとず〈文法評価値情報とから得ら
れる総合評価値情報によって評価して認識結果の出力順
序を決定するようにした日本語音声入力装置を提供する
ことを目的としている。

〈実施例〉以下、本発明を一実施例を挙げて詳細に説明する。

第１図は本発明の音声入力式日本語文書処理装置の一実
施例の構成を示すブロック図である。

第１図において、■は音声入力をビノクア、ノブするマ
イクロホンであり、このマイクロホン１により検出され
た音声は単音節認識部２に入力される。この単音節認識
部２は従来公知のものであり、マイクロホン１を介して
入力された文節単位の音声が音節単位に区分されて単音
節毎の特徴描出が行なわれる。一方メモリ３には各単音
節毎の標準パターンが記憶されており、単音節認識部２
において入力音声の特徴パターンと標準パターンとのマ
ツチング計算処理が行なわれ、このマツチング計算処理
の結果、最も近似したものが第１候補として、また順次
近似したものが次候補として選出され、その結果が近似
度（確からしさ）を示す距離差情報と共（（メモ＋）４
に音節ラティスとして記憶される。

上記単音節認識部２において認識され、音節ラティスと
してメモリ４に記憶された内容は候補列作成部５に入力
されて近似度（確からしさ）を示す距離差情報を用いて
確度の高い順に文節候補（かな文字列）が作成されて文
節候補メモ、す６に記憶される。なおメモリ６において
領域６ａは文節候補の確からしさを示す確度情報の記憶
領域、領−第６ｂは後述する評価内容を記憶する評価レ
ジスタ領域である。

上記候補列作成部５において作成され、メモリ６内に記
憶された複数の候補列は順次文節分析部７に入力されて
文法的な分析が行なわれると共に分析に必要な文法情報
及び見出し語辞書、接辞語辞書等を含む辞書メモリ８の
内容と照合され、一致したものが認識結果メモリ９に文
節（単語）の漢字候補情報として記憶される。更に文節
分析部７は後述するようにメモリ９に記憶される文節（
漢字）候補の構成要素を分析して文法評価値を算出し、
仮名漢字変換処理における同音語の最高評価値を得た漢
字候補が認識結果メモリ９に記憶され、ま、たメモリエ
リア９ａにその候補に対する文法評価値が記憶される。

また上記メモリ領域６ａに記憶されている確度情報Ｙと
メモリエリア９ａに記憶された文法評価値′情報Ｘにも
とすいて算出された各候・補の総合評価値Ｚがメモリエ
リア９ｂに記憶され、この総合評価値Ｚを用いて文節候
補のソートが行なわれて、認識結果の出力順序が決定さ
れるように構成されている。

なお１０は評価点算出のために用いられるバッフ７であ
り、メモリ領域Ａ、Ｂ、Ｃ，ＳＴ、ＳＢ、Ｘ。

を有している。また１１け認識結果等を表示する表示装
置、１２はかなキー、ファンクションキー等を有する入
力装置、１３け上記各装置を制御するコントローラ（Ｃ
ＰＵ）である。

次に上記の如く構成された装置の動作を第２図に示す１
文節の処理フローに従って説明する。

文節単位に発声された音声はマイクロホン１によって検
出されて単音節認識部２によシ、音響分析によって単音
節単位に認識され（ｎｏ−ｎ３）、その認識結果が音節
ラティスメモリ４に入力記憶される。

例えば入力音声「／こ／／（／ｌみ／／７ｖ／／の／」
（「国民の」）に対する単音節認識結果として第１表に
示すような音節ラティスが形成される。

なお、上記第１表において音節ラティスのに）内に示し
た数字は第１位の認識結果を１０とした時の２位以下の
確度を表わしている。

上記のように音節ラティスには音節番号と音節確度（確
からしさ）情報が書かれることになる。

ここで音節の確からしさを表わす音節確度は次のように
して算出される。

即ち、単音節認識部２で入力音節の特徴パターンとメモ
リ３に記憶されている複数の標準パターンとの間でパタ
ーンマツチングが行なわれ、パターンマツチングの結果
として、各標準パターンとのマツチング距離を得る。こ
のマツチング距離の小さい順に並べて、上位数個を音節
候補とする。

第２表に音節候補のマツチング距離をに）内の数値で示
す。第」表に示しだ音節確度は、第１位のマツチング距
離で各位のマツチング距離を除して正規化したものであ
る。

上記単音節認識部２において認識され、音節ラティスと
してメモリ４に記憶され。た音節単位の各候補は候補列
作成部５に入力される。

候補列作成部５は音節ラティスメモ＋）４に記憶された
音節単位の認識結果を用いて、最初に上首Ｃメモリ４に
記憶された１位の認識結果ばかりを並べて候補列を作成
して文節候補メモリ６に記憶し、次に順次２位以下の認
識結果を組合せて確度の総和（候補列の確度）の小さい
順に候補列（文節候補）を作成してメモリ６に記憶する
。またこの時各文節候補に対する確度情報Ｙがメモリエ
リア６ａに記憶される（ｎ４）。上記第４表に示した例
では３６個の候補列が第３表の如く作成されてメモリ６
に記憶される。

第３表次妬メモリ６に記憶された候補列は順次文節分析部７に
入力さ九、文節の分析が行なわれる（ｎ５）。

即ち文節分析部７では入力される候補列を辞書メモリ８
の内容との照合を含む文法分析を次のように実行する。

候補列→（接頭語）十自立語＋（接尾語）」−（活用語
尾）」−（付属語列）ただしくニ）内の要素は無くても良い。

ステップｎ５におじで行なわれる文節の文法分析処理フ
ローは第３図に詳細に示されており、文節分析部７はま
ず入力された候補列と辞書メモリ８の記憶内容との照合
を行なって仮名漢字変換処理を実行する（ｎ２０．ｎ２
１）。

この時変換でき々かった場合には入力された候補列が文
節として不可能なかな配列と判定して、メモリエリア６
ｂのその候補列に対応した位置（評価レジスタ）にｒＯ
Ｊを入れて、文節分析結果（評価）「×」の決定を行う
（ステップｎ　２２．２３．２４　）（。

一方、仮名漢字変換処理動作（ｎ２１）の結果、変換が
可能であった場合には、評価レジスタエリア６ｂの対応
位置（評価レジスタ）を「１」にセットして（ｎ２５）
、照合の結果一致したことを示す判定情報を記憶すると
共にステップｎ２６以後の文法評価値算出動作に移行す
る。

即ち、本発明実施例において各文節候補についてｎ２０
”ｒｒ２５の動作を実行することにより上記第３表の評
価欄に示したように「○」を付加した６個の候補列が文
節として可能であることが分析される。

また、本発明実施例においては文節々して可能々候補列
についてステ、プｎ２６以後において文節の構成要素に
おいて重み付けを行なって出力順序付けを行なっている
がその一例を以下に示す。

文節として可能な候補列に対する文法評価値は上記した
文節の要素の接頭語、自立語、接尾語の各々に対して次
の３点において点数を与え、各要素ごとに重みをかけて
加算した点数の合計として算出される。

■　語長 ■　頻度 ■　直前の数百文節での使用の有無法に各項目に対する文法評価値の算出動作を説明する。

（Ｄ　　自立語に対する評価値（ｎ２６〜ｎ３１）自立
語長は、その自立語の活用語尾の長さも含めた長さとす
る。例えば「歩いた」では、「歩Ｊが自立語の語幹であ
シ、「い」が活用語尾であり、「だ」が付属語となる。

従って自立語長は３となり、この自立語の長さはＡレジ
スタに記憶される（ｎ２６）。

自立語に対する頻度情報は３ランクに分け、少ないもの
から０．１．２の値が与えられて例えば辞書メモリ８に
記憶されており、この辞書メモリ８よシ所望の頻度情報
が取出されてＢレジスタに記憶される（　ｎ　２７　）
。

次にステップｎ２８に移行して直前の数十文節で使用さ
れているか否かが判定され、使用されていればｉｌ」、
使用されていなければ「０」がＣレジスタに記憶される
（　ｎ２９．３０）。

次にステップｎ３１に移行して自立語の評価値Ｊが次式％式％に従って算出され、その結果がＪレジスタに記憶される
。

なお、自立語の場合には、一度用いたものを再度用いる
確率が高いため、使用の有無の情報Ｃに重みをかけてい
る。

（１１）接頭語、接尾語に対する評価値（ｎ３２〜ｎ４
７）接頭語はその文字数（拗音は除く）を２倍したもの
を用いる。ただし、文字数が０（接頭語がない時）の時
にば「４」を与える（ｎ３３）０また頻度は２ランクに
分けられており、少ないものをｒＯＪ、多いものをｒｌ
Ｊとしている。

更に使用の有無は無い時には「０」、有の時には「１」
を与えて−る。

接頭語長ばＡレジスタに記憶され（ｎ３４）、頻度情報
／／ｉＢレジスタに記憶され（ｎ３５）、使用の有無情
報はＣレジスタに記憶され（ｎ３７．３８）、その後ス
テップｎ３９に移行して接頭語の評価値ＳＴが次式％式％に従って計算され、その結果がＳＴレジスタに記憶され
る。

接尾語の場合には接頭語と同様の動作がステソゲｎ４０
〜ｎ４７において実行され、その結果がＳＢレジスタに
記憶される。

次にステップｎ４８に移行して１文節全体の評価値Ｘが
次式％式％に従って計算され、その結果がＸレジスタに記憶される
。

次にステソゲｎ４９に移行してＸレジスタの値が評価値
レジスタ（メモリエリア９ａ）の値よシ大きいか否かが
判定され、Ｘレジスタの値が評価値レジスタの値より大
きい場合には評価値レジスタ（メモリエリア９ａ）にＸ
レジスタの内容を記憶すると共に、ステプ゛−プｎ２１
，１１２２において変換された漢字候補をその文法評価
値と共にメモリ９に記憶する（ｎ５０）。

一方ｎ４９においてＸレジスタの値が評価値レジスタの
値より大きくない場合にはステップｎ５０を飛び越して
ステップｎ、５１に移行する。

ステップｎ５１においては次の同音語の候補があるか否
かが判定され、同音語の候補があればステップｎ２６以
降に戻って新たな同音語候補に対する文法評価値の計算
が行なわれる。

また同音語の候補が々ければステップｎ５２に移行して
１候補列に対する文節の分析動作が終了する（　ｎ　５
　＋　ｎ　６　）。

このような動作により１候補列に対する漢字候補がその
文法評価値と共に認識結果メモリ９に記憶され、また１
候補列に対して同音語（複数の漢字候補）が存在する場
合には評価点の最も大きい漢字候補がメモリ９に記憶さ
れることになる。

第３表に示しだ例においては「ごふにんの」→「ご赴任の」「ごふみんの」→「ご不眠の」「おふにんの」→「お赴任の」「こくみんのＪ→「国民の」「おふみんの」→「お不眠の」の漢字候補が得られる。また接頭語「ご」に関しては頻
度が高いため５Ｔ＝２＋１＋Ｏ＝３とし、「赴任」は頻度１．「国民」及び「贈り物」は頻
度２．「不眠」け頻度０とした場合、各文節を評価する
と、「ご赴任のＪ：（接頭）（自立語・・・３文字）（付属
語）Ｘ＝３＋１６Ｘ（３＋１十〇）＋４＝７１「ご不眠の」
：（接頭）（自立語・・・３文字）（付属語）Ｘ＝３＋１６Ｘ（３十〇十〇）＋４＝５５「お赴任の」
；（接頭〕（自立語、・・３文字）（付属語）Ｘ＝３＋１６Ｘ（’３＋１十０）＋４＝７１「国民の」
：（自立語・・４文字）（付属語）Ｘ＝４＋１６（４，
＋２十〇）＋４＝１０４「お不眠の」：（接頭）（自立
語・３文字）（付属語）Ｘ−＝３＋１６ｘ（３＋Ｏ＋０）＋４＝５５「贈り物Ｊ
：（自立語・・５文字）Ｘ＝４＋１６Ｘ（５＋２）＋４＝１２０となり「贈り物
」が最高の文法評価値となる。

次にステップｎ８（第２図）において各文節認識結果の
総合評価値がの式に従って算出され、その結果がメモリエリア９ｂに
記憶される。

このステップにおいて例えば「国民の」の総合評価値がとなり、最高の総合評価値となる。

従ってステップｎ９（第２図）において文節認識結果を
ソートすることによりメモリ９の記憶内容は第４表の■
の如くなる。

このような一連の動作により漢字候補「国民の」が第１
位の認識候補となりステップｎｌｏに移行して、その第
１位の認Ｒ候補「国民の」が最初に出力されることにな
る。

第４表なお、第４表においてＩの欄は音響分析から得られる確
度（確からしさ）情報によってソートした場合、■の欄
は本発明者等が先に提案した文法分析から得られる文法
評価値によってノートした場合のメモリ９の記憶内容を
示している。

上記の第４表に示した例からも明らかなように入力音声
に対応した正しい文節「国民の」は■では第４位、■で
は第′２位であるのに対し、本発明による■では第１位
に出力されるようになり、本発明が最も良い結果になっ
ていることが判る。

以上のような処理手順により、音声認識の確度に従った
認識結果の出力順、あるいは文法分析による文法評価値
に従った認識結果の出力順に比べて、認識結果の正解率
の高いものが先に出力されるようＫなる。

く効果〉以上述べたよう傾、本発明によれば認識結果の複数の候
補を音声認識結果の確からしさを示す確度情報と、音声
認識結果の確からしさ以外の自立語の長さ、頻度を含む
条件にもとすく文法評価値情報とから得られる総合評価
値情報により評価して認識結果の出力順序を決定するよ
うに成しているため、妥当性の高い文節から順次出力さ
れることになシ、認識結果の正解率が向上すると共に、
候補選択が容易となる。

【図面の簡単な説明】

第１図は本発明の一実施例装置の構成を示すブロック図
、第２図は１文節の処理フローを示す図、第３図は本発
明による１候補列（文節）に対する文節の分析処理フロ
ーを示す図である。２・・・単Ｗ節認識部、３・・・標準パターンメモリ、
４・音節シティスメモリミ５・・・候補列作成部、６・
・文節候補メモリ、７・・・文節分析部、８・・・辞書
メモリ、９・・認識結果メモリ、１０・・・文法評価値
算出用バッファメモリ、６ａ・・・確度情報記憶メモリ
、９ａ・・文法評価値記憶エリア、９ｂ　・総合評価値
記憶エリア。

Claims

【特許請求の範囲】１、文節単位に発声された音声を音節単位に認識し、該
認識された音節候補の組合せＫより複数の文節候補列を
作成し、辞書照合を含む文法処理を行なって文節単位の
認識結果を出力する日本語音声入力装置において、認識結果の複数の候補を音声認識結果の確からしさを示
す確度情報と、音声認識結果の確からしさ以外の自立語
の長さ、頻度を含む条件にもとず〈文法評価値情報とか
ら得られる総合評価値情報により評価して認識結果の出
力順序を決定する手段を備えたことを特徴とする日本語
音声入力装置。