JPH10301597A

JPH10301597A - 音声認識装置

Info

Publication number: JPH10301597A
Application number: JP9112285A
Authority: JP
Inventors: Seiichi Miki; 清一三木
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1997-04-30
Filing date: 1997-04-30
Publication date: 1998-11-13
Anticipated expiration: 2017-04-30
Also published as: JP3036591B2

Abstract

(57)【要約】【課題】音声認識結果の候補の選択に際して精度良く
候補を自動選択し得る音声認識装置を提供すること。【解決手段】この音声認識装置では、３つ組出現数記
憶部９に予め名詞及びその名詞に接続する助詞と、名詞
より後に発声された用語とによる３つ組の出現数の共起
の定量的な起こり易さを示す３つ組出現数情報が保持記
憶されており、パラメータ分析部１で分析された入力音
声と標準パターン記憶部２の標準パターンとの距離を比
較部３で求めた結果に基づいて判定部４により発声毎の
音声認識結果の候補を出力し、この発声毎の音声認識結
果の候補を記憶蓄積する候補選択部５により一つ以上の
発声に対して音声認識結果の候補を選択する際、３つ組
出現数情報に基づいて音声認識結果として自動的に最適
な音声認識結果を得てこれを認識結果表示部６で表示す
る。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、主として一つ以上
の発声に対してそれぞれ複数の音声認識結果の候補から
認識結果を選択して文を得る音声認識装置に関する。

【０００２】

【従来の技術】従来、例えば単語毎に発声し、最終的に
文を入力するような音声認識装置においては、発声毎の
音声認識結果の候補の中から文として最適になるような
音声認識結果を自動的に選択することが考えられてい
る。

【０００３】これに対し、例えば特開平４−７５１６３
号公報に開示されたかな漢字変換装置では、かな漢字変
換候補の選択に共起意味情報及び共起格情報を用いてい
るが、このような技術は音声認識装置でも使用すること
ができる。

【０００４】そこで、図９は、こうした場合の音声認識
装置の基本構成を示したブロック図である。この音声認
識装置では、入力手段１０から入力されたかな文字を編
集制御部１１が入力かな列記憶部１２と出力文字列記憶
部１９に格納し、表示手段２０に表示する。又、編集制
御部１１の指示により、かな漢字変換制御部１３は、入
力かな列記憶部１２に記憶されているかな列から単語辞
書１６を参照することによりかな漢字変換候補を作成
し、かな漢字変換候補記憶部１４に格納する。更に、共
起情報検査部１５は共起情報記憶部１７を参照しなが
ら、かな漢字変換候補記憶部１４に格納されているかな
漢字変換候補の中から最適なかな漢字変換候補を選択す
ることにより、かな漢字変換の結果を作成する。最後に
編集制御部１１は、かな漢字変換した結果を出力文字列
記憶部１９に格納し、表示手段２０に表示する。

【０００５】この音声認識装置の場合、表示されたかな
漢字変換結果を見てユーザは同音語選択をするか否かを
決定する。同音語選択をしない場合、出力文字列記憶部
１９に格納されているかな漢字変換候補が変換結果とな
る。

【０００６】同音語選択をする場合、編集制御部１１は
かな漢字変換候補記憶部１４に格納されている候補を出
力文字列記憶部１９に格納し、表示手段２０に表示す
る。ユーザは表示されたかな漢字変換候補から正しいも
のを選択する。

【０００７】次に、編集制御部１１の指示により共起情
報登録部１８は、選択されたかな漢字変換候補中の単語
の共起意味情報及び共起格情報をかな漢字変換制御部１
３から得て共起情報記憶部１７に登録する。選択された
かな漢字変換候補が変換結果となる。

【０００８】そこで、以下はこの音声認識装置おいて、
共起情報検査部１５がかな漢字変換候補記憶部１４から
最適なかな漢字変換候補を選択する方法と、共起情報登
録部１８がかな漢字変換結果から得られた共起情報を登
録する方法とを図９〜図１１と図１３とを参照して説明
する。但し、図１０は単語辞書１６の内容を例示したも
ので、図１１はかな漢字変換候補記憶部１４の内容を例
示したもので、図１２は共起情報記憶部１７の内容を例
示したものである。又、図１３はかな入力文字列「うま
がかける」，「うまにかける」，「うまがかける」を順
に変換操作していったときの変換結果を例示したもので
ある。

【０００９】最初に、かな入力文字列「うまがかける」
に対し、例えば「書ける」「駆ける」「賭ける」といっ
た同音語から選択した結果、「馬が駆ける」をかな漢字
変換結果としてユーザが決定すると、共起情報記憶部１
７に単語「馬」の読み，単語表記，単語「馬」に対する
共起意味情報として単語「駆ける」の意味コード（０
２），及び単語「馬」に対する共起格情報として共起格
情報コード（ｂ１）が記憶登録される。因みに、単語の
意味コードは単語辞書１６に登録されている。共起格情
報コードはかな漢字変換制御部１３が入力かな列記憶部
１２に格納されているかな列の係り受け関係を解析する
ことにより与え、同一種の格には同一コードが与えられ
る。

【００１０】同様に、「うまにかける」の入力文字列に
対し、「馬に賭ける」をかな漢字変換結果としてユーザ
が決定すると、共起情報記憶部１７に単語「馬」の読
み，単語表記，単語「賭ける」の意味コード（０３），
及び共起格情報コード（ｂ２）が登録される。

【００１１】最後の「うまがかける」のかな入力文字列
に対し、かな漢字変換候補記憶部１４には、「かける」
にかな漢字変換の候補が複数あるため、共起情報検査部
１５がいずれかを選択する必要がある。共起情報記憶部
１７に示されるように、単語「馬」に対し、「駆ける」
の共起意味情報（０２）及び「賭ける」の共起意味情報
（０３）は何れも共起情報記憶部１８に登録されてい
る。

【００１２】共起意味情報のみ用いる場合を考えると、
「かける」のかな漢字変換結果として「駆ける」と「賭
ける」とを選択することができる。共起格情報まで用い
ると、かな漢字変換制御部１３の解析の結果、「うま」
と「かける」との共起格情報はｂ１であり、これによ
り、図１２に示されるようにｂ１という共起格情報が登
録されている「駆ける」を選択できる。

【００１３】以上に説明したように、既存の音声認識装
置において、共起意味情報や共起格情報を用いること
で、それらを用いない場合と比べて精度良くかな漢字変
換候補を選択できる。

【００１４】

【発明が解決しようとする課題】上述した音声認識装置
の場合、かな漢字変換候補の代わりに発声毎の音声認識
結果の候補を用いることで、発声毎の音声認識結果の候
補から音声認識結果の候補を自動的に選択できるように
なるが、共起の有無のみを用い、共起の定量的な起こり
易さを用いていないため、音声認識のようにかな漢字変
換と比較して候補が多く与えられる場合（例えば同じ共
起格情報を持つ候補が多数ある場合）等の用途に際して
は精度良く候補を自動選択することが困難となってい
る。

【００１５】本発明は、このような問題点を解決すべく
なされたもので、その技術的課題は、音声認識結果の候
補の選択に際して精度良く候補を自動選択し得る音声認
識装置を提供することにある。

【００１６】

【課題を解決するための手段】本発明によれば、入力音
声に対して複数の音声認識結果の候補を与え、一つ以上
の発声に対して該複数の音声認識結果の候補の中から選
択して全体として文を得る音声認識装置において、複数
の音声認識結果の候補の中からの選択に際し、名詞及び
該名詞に接続する助詞と、名詞より後に発声された用語
とによる３つ組の共起の定量的な起こり易さに基づいて
最適な音声認識結果を得る音声認識装置が得られる。

【００１７】又、本発明によれば、入力音声を分析する
パラメータ分析部と、予め分析された音声の標準パター
ンを保持記憶した標準パターン記憶部と、標準パターン
と入力音声との距離を求める比較部と、距離の結果に基
づいて発声毎の音声認識結果の候補を出力する判定部
と、発声毎の音声認識結果の候補を記憶蓄積し、一つ以
上の発声に対して該音声認識結果の候補の中から全体と
して文を得るように音声認識結果を選択する候補選択部
と、音声認識結果を表示する認識結果表示部とを備えた
音声認識装置において、予め名詞及び該名詞に接続する
助詞と、名詞より後に発声された用語とによる３つ組の
出現数の共起の定量的な起こり易さを示す３つ組出現数
情報を保持記憶した３つ組出現数記憶部を備え、候補選
択部は、音声認識結果の候補の選択に際して３つ組出現
数情報に基づいて最適な音声認識結果を得る音声認識装
置が得られる。

【００１８】更に、本発明によれば、上記音声認識装置
において、コーパスを入力するコーパス入力部と、コー
パスの文に出現する３つ組を登録すると共に、該登録結
果に応じて３つ組出現数記憶部における３つ組出現数情
報の内容修正に寄与する３つ組出現登録部とを備えた音
声認識装置が得られる。

【００１９】加えて、本発明によれば、上記音声認識装
置において、音声認識結果の表示に対してユーザが文を
入力して修正操作入力を行う修正入力部を備え、認識結
果表示部は修正操作入力の内容を３つ組出現登録部へ伝
送し、３つ組出現登録部は修正操作入力の内容による文
に出現する３つ組を検出して登録すると共に、３つ組出
現数記憶部における３つ組出現数情報の内容修正に寄与
する音声認識装置が得られる。

【００２０】

【発明の実施の形態】以下に実施例を挙げ、本発明の音
声認識装置について、図面を参照して詳細に説明する。

【００２１】最初に、本発明の音声認識装置の機能的概
要を簡単に説明する。この音声認識装置は、入力音声に
対して複数の音声認識結果の候補を与え、一つ以上の発
声に対して複数の音声認識結果の候補の中から選択して
全体として文を得るもので、複数の音声認識結果の候補
の中からの選択に際し、名詞及びその名詞に接続する助
詞と、名詞より後に発声された用語とによる３つ組の共
起の定量的な起こり易さに基づいて自動的に最適な音声
認識結果を得るようにしたものである。

【００２２】図１は、本発明の一実施例に係る音声認識
装置の基本構成を示したブロック図である。この音声認
識装置は、入力音声を分析するパラメータ分析部１と、
予め分析された音声の標準パターンを保持記憶した標準
パターン記憶部２と、標準パターンと入力音声との距離
を求める比較部３と、距離の結果に基づいて発声毎の音
声認識結果の候補を出力する判定部４と、発声毎の音声
認識結果の候補を記憶蓄積し、一つ以上の発声に対して
音声認識結果の候補の中から全体として文を得るように
音声認識結果を選択する候補選択部５と、音声認識結果
を表示する認識結果表示部６と、予め名詞及びその名詞
に接続する助詞と、名詞より後に発声された用語とによ
る３つ組の出現数の共起の定量的な起こり易さを示す３
つ組出現数情報を保持記憶した３つ組出現数記憶部９と
を備えている。但し、ここで候補選択部５は、音声認識
結果の候補の選択に際して３つ組出現数記憶部９の３つ
組出現数情報に基づいて自動的に最適な音声認識結果を
得るようになっている。

【００２３】又、この音声認識装置は、コーパスを入力
するコーパス入力部７と、コーパスの文に出現する３つ
組を登録し、その登録結果に応じて３つ組出現数記憶部
９における３つ組出現数情報の内容修正に寄与する３つ
組出現登録部８とを備えている。

【００２４】図２は、この音声認識装置の動作処理とし
て、入力音声から音声認識結果を表示するまでの処理を
示したフローチャートである。

【００２５】ここでは、パラメータ分析部１での音声入
力（ステップＳ１）として単語毎に発声された入力音声
を分析し、比較部３で入力音声と標準パターン記憶部２
に格納されている単語の標準パターンとを比較し、入力
音声と標準パータンとの距離を求める。パラメータ分析
部１は例えばフィルタバンク，フーリエ変換器，線形予
測係数型分析器等により構成されるもので、入力音声を
分析してパラメータベクトル列に変換する。標準パター
ン記憶部２に格納されている標準パターンは、パラメー
タベクトル列として表現されている。標準パターンの中
から分析された入力音声と距離の近い複数が音声認識結
果の候補として判定部４で選ばれる。これにより、分析
・比較を行い音声認識結果の候補取得（ステップＳ２）
する処理が行われる。

【００２６】ここで、距離の代わりに確からしさを用い
ることもできる。音声認識結果の候補は、発声された順
番に候補選択部５で記憶・蓄積される。これにより、候
補選択部に認識結果候補を蓄積（ステップＳ３）する処
理が行われる。候補選択部５は判定部４から与えられた
音声認識結果の候補のうち、最も距離の近い候補を音声
認識結果として認識結果表示部６へ伝送し、認識結果表
示部６で表示する。これにより、認識結果表示（ステッ
プＳ４）する処理が行われる。

【００２７】引き続き、ユーザによる文終了通知が有る
か否かを判定（ステップＳ５）し、文終了通知が無けれ
ば音声入力（ステップＳ１）の前にリターンして待機す
るが、文終了通知が有れば（ユーザによる一文の発声が
終了すれば）文終了をシステムに通知する。ユーザは文
終了を例えばマウスやキーボード等を使用して行なう
が、音声を用いても通知することができる。

【００２８】文終了が通知されると、候補選択部５では
３つ組出現数記憶部９からの３つ組出現数情報に基づい
て全体として最適な文となるように、発声毎に得られた
音声認識結果の候補の中から最適な候補を発声毎にそれ
ぞれ一つずつ選択し、それらを最適な音声認識結果とし
て認識結果表示部６へ伝送する。これにより、蓄積され
た候補と３つ組情報（３つ組出現数情報）とを用いて音
声認識結果を選択・決定（ステップＳ６）する処理が行
われる。認識結果表示部６では伝送された音声認識結果
を表示し、認識結果表示（ステップＳ７）の処理が行わ
れる。この後、候補選択部５はそれまでに蓄積されてい
た発声毎に得られた音声認識結果の候補を消去し、候補
選択部５の認識結果候補を消去（ステップＳ８）する処
理が行われた後、音声入力（ステップＳ１）の前にリタ
ーンして待機する。

【００２９】図３は、この音声認識装置の動作処理とし
て、入力音声から認識結果を表示する際、ユーザからの
文終了通知を待たずに音声入力がなされる度に候補を選
択する場合の処理動作を示したフローチャートである。

【００３０】この場合、表示される認識結果は音声入力
（ステップＳ１）がなされる度に更新される。３つ組出
現数記憶部９の内容は、予めコーパス入力部１にコーパ
スを入力することで得られる。コーパスは多数の文から
構成される。文は単語に分けられており、単語には品詞
が付加されているものとする。コーパス入力部１はコー
パスを文毎に３つ組出現登録部８へ伝送し、３つ組出現
登録部８ではコーパスの文に出現する３つ組の出現数を
数えて３つ組出現数記憶部９の３つ組出現数情報を修正
する。３つ組は上述したように、文中に出現する名詞及
びその名詞に接続する助詞と、名詞より後に出現する用
語とによる３つの単語の組みのことである。このような
処理が加えられるため、動作処理上は図２で説明した各
部の働きによって、音声入力（ステップＳ１）の後、分
析・比較を行い音声認識結果の候補取得（ステップＳ
２）する処理，候補選択部に認識結果候補を蓄積（ステ
ップＳ３）する処理，蓄積された候補と３つ組情報（３
つ組出現数情報）とを用いて音声認識結果を選択・決定
（ステップＳ６）する処理，及び認識結果表示（ステッ
プＳ５）の処理がこの順で行われる。

【００３１】図４は、図３の処理動作で要するコーパス
を用いて３つ組出現数記憶部９の内容を修正する際の処
理動作を示したフローチャートである。

【００３２】ここでは、コーパスの入力（ステップＳ
１）を経てコーパスを文に分割（ステップＳ２）し、文
を左から走査（ステップＳ３）して文中の３つ組を検出
（ステップＳ４）した後、検出された３つ組について出
現数を１増やす（ステップＳ５）処理を行っている。こ
の後は、文の終端か否かを判定（ステップＳ６）し、終
端でなければ文中の３つ組を検出（ステップＳ４）する
処理に戻るが、終端であればコーパスが終了であるか否
かを判定（ステップＳ７）する。この結果、終了でなけ
れば文を左から走査（ステップＳ３）する処理に戻る
が、終了であれば処理動作を終了する。

【００３３】図５は、図４による処理動作を具体的に例
示したものである。ここでは「私は今日学校へ走って行
った」という文に対し、３つ組出現登録部８が出現する
３つ組を計数し、３つ組出現数記憶部９に登録する例を
示している。即ち、３つ組出現登録部８は与えられた文
を左から走査し、名詞を検出する。ここでは、先ず
「私」という名詞が検出される。名詞が検出されると、
与えられた文からそれと接続する助詞及びその名詞より
後に出現する用語を検出し、助詞「は」，用語「走っ
て」が検出される。３つ組出現登録部８は検出された３
つ組に対し、３つ組出現数記憶部９中の同じ３つ組の出
現数に１を加える。３つ組出現登録部８は、３つ組出現
数記憶部９中の「私／は／走って」という３つ組の出現
数に１を加える。同様に、図５の例文からは「私／は／
行った」，「学校／へ／走って」，「学校／へ／行っ
た」という３つ組が検出され、それぞれ３つ組出現数記
憶部９の出現数に１が加えられる。

【００３４】図６は、候補選択部５の候補選択を例示し
たものである。ここでは、「私は」「本を」「買う」と
発声した場合を示している。判定部４により最初の発声
に対しては「私は」「かかしは」「はだしは」の３つの
候補，２つめの発声に対しては「本当」「本を」「癌
を」の３つの候補，最後の発声に対しては「カブ」「買
う」「飼う」の３つの候補，最後の発声に対しては「カ
ブ」「買う」「飼う」の３つの候補がそれぞれ得られて
いる。それぞれの音声認識結果の候補中から一つずつ選
んで接続した列を文候補とする。図６の例では３×３×
３＝３７個の文候補が得られている。

【００３５】候補選択部５は各文候補中に出現する３つ
組を検出し、それぞれに対して３つ組出現数記憶部９を
参照してその出現数を調べ、それを総和した値を文候補
の文スコアとする。例えば文スコアに比較部３で得られ
た入力音声と標準パターンとの距離の逆数を加えること
もできる。又、上述したように出現した３つ組の出現数
をそのまま加算すると、一文中に用語が複数含まれるよ
うな文候補が高い文スコアを得ることになるため、これ
を防止するために文候補中の用語の個数でスコアを割算
することもできる。何れにしても、文スコアの最も高い
文候補を最適な音声認識結果として、認識結果表示部６
へ伝送する。

【００３６】図６の例では、「私は本を買う」という文
候補に対して、「私は買う」「本を買う」という２つの
３つ組が出現し、最も高い文スコアを与えている。従来
技術では例えば図６では、「癌を買う」「本を買う」は
どちらも共起が存在するため、例えば何れかがより新し
く出現した共起であるかという程度でしか選択基準が存
在しないが、本発明の音声認識装置ではより確からしい
選択が可能となる。図６では文を分割して発声した場合
を例示したが、本発明の音声認識装置では一文を一度に
発声する場合でも、音声認識結果の候補に単語区切りと
品詞情報とが与えられていれば適用できる。

【００３７】図７は、本発明の他の実施例に係る音声認
識装置の基本構成を示したブロック図である。この音声
認識装置では、図１に示したものと比べ、新たに音声認
識結果の表示に対してユーザが文を入力して修正操作入
力を行う修正入力部２１が備えられ、認識結果表示部６
が修正操作入力の内容を３つ組出現登録部８へ伝送し、
３つ組出現登録部８で修正操作入力の内容による文に出
現する３つ組を検出して登録すると共に、３つ組出現数
記憶部９における３つ組出現数情報の内容修正に寄与す
るようになっている点が相違している。

【００３８】図８は、この音声認識装置の動作処理とし
て、入力音声から音声認識結果を表示するまでの処理
（候補選択及び修正による３つ組出現数記憶部９の内容
の更新を含む）動作を示したフローチャートである。即
ち、ここでは入力音声から認識結果を表示し、それが誤
っていた場合にユーザが修正し、その結果を３つ組出現
数記憶部９に反映するようになっている。

【００３９】ここでの処理は、図２で説明したものと途
中の認識結果表示（ステップＳ７）の処理までは同様に
なっている。この後に認識結果表示部６によって表示さ
れた音声認識結果に誤りがあった場合、ユーザは修正入
力部２１により結果を修正する。このため、動作処理上
はユーザによる修正有りか否かを判定（ステップＳ８）
し、有りの場合にユーザ修正（ステップＳ９）の処理を
行ってからユーザ修正終了か否かを判定（ステップＳ１
０）し、ユーザ修正終了でなければユーザ修正（ステッ
プＳ９）の前にリターンして待機するが、ユーザ修正終
了であればユーザによる修正が無い場合と同様に次の処
理へ移行する。ユーザ修正は例えばキーボードやマウス
等によりなされる。

【００４０】ユーザ修正終了の場合やユーザによる修正
が無い場合は、得られた音声認識結果は文として３つ組
出現登録部８へ伝送され、ここで３つ組出現数記憶部９
の情報が修正される。これにより、得られた結果を用い
て３つ組出現数記憶部の情報修正（ステップＳ１１）の
処理が行われる。３つ組出現数記憶部９の最初の内容
は、コーパス入力部１にコーパスを入力することで得ら
れる。ここでは、得られた音声認識結果を用いて３つ組
出現数記憶部９の情報修正することにより、コーパスに
出現しなかった３つ組情報を記憶・登録することができ
る。この後、候補選択部５はそれまでに蓄積されていた
発声毎に得られた音声認識結果の候補を消去し、候補選
択部５の認識結果候補を消去（ステップＳ１２）する処
理が行われた後、音声入力（ステップＳ１）の前にリタ
ーンして待機する。

【００４１】

【発明の効果】以上に説明したように、本発明の音声認
識装置によれば、音声認識結果の候補に対し、その候補
を選択して文を得る際、予め装置内に記憶された名詞及
びそれに接続する助詞と名詞より後に出現する用語とに
よる３つ組の共起の定量的な起こり易さを用いて音声認
識結果の候補から自動的に最適な音声認識結果を選択し
ているので、音声認識結果の候補の選択に際して精度良
く候補を自動選択し得るようになる。即ち、この音声認
識装置の場合、例えば予め用意した大量のコーパスに出
現した文中で用いられた共起の出現頻度を調べる等によ
り、予めそれぞれの共起の定量的な起こり易さを調べて
おくことで、それを音声認識結果の候補の選択に用いる
ため、より正解が得られる可能性が高くなる。

【図面の簡単な説明】

【図１】本発明の一実施例の音声認識装置の基本構成を
示したブロック図である。

【図２】図１に示す音声認識装置の動作処理として、入
力音声から音声認識結果を表示するまでの処理動作を示
したフローチャートである。

【図３】図１に示す音声認識装置の動作処理として、入
力音声から認識結果を表示する際、ユーザからの文終了
通知を待たずに音声入力がなされる度に候補を選択する
場合の処理動作を示したフローチャートである。

【図４】図３に示す処理動作で要するコーパスを用いて
３つ組出現数記憶部の内容を修正する際の処理動作を示
したフローチャートである。

【図５】図４による処理内容を具体的に例示したもので
ある。

【図６】図１に示す音声認識装置に備えられる候補選択
部の候補選択内容を具体的に例示したものである。

【図７】本発明の他の実施例の音声認識装置の基本構成
を示したブロック図である。

【図８】図７に示す音声認識装置の動作処理として、入
力音声から音声認識結果を表示するまでの処理（候補選
択及び修正による３つ組出現数記憶部の内容の更新を含
む）動作を示したフローチャートである。

【図９】従来の音声認識装置の基本構成を示したブロッ
ク図である。

【図１０】図９に示す音声認識装置に備えられる単語辞
書の内容を具体的に例示したものである。

【図１１】図９に示す音声認識装置に備えられるかな漢
字変換候補記憶部の内容を具体的に例示したものであ
る。

【図１２】図９に示す音声認識装置に備えられる共起情
報記憶部の内容を具体的に例示したものである。

【図１３】図９に示す音声認識装置によるかな漢字変換
操作による変換結果を具体的に例示したものである。

【符号の説明】

１パラメータ分析部２標準パターン記憶部３比較部４判定部５候補選択部６認識結果表示部７コーパス入力部８３つ組出現登録部９３つ組出現数記憶部

Claims

【特許請求の範囲】

【請求項１】入力音声に対して複数の音声認識結果の
候補を与え、一つ以上の発声に対して該複数の音声認識
結果の候補の中から選択して全体として文を得る音声認
識装置において、前記複数の音声認識結果の候補の中か
らの選択に際し、名詞及び該名詞に接続する助詞と、前
記名詞より後に発声された用語とによる３つ組の共起の
定量的な起こり易さに基づいて最適な音声認識結果を得
ることを特徴とする音声認識装置。
【請求項２】入力音声を分析するパラメータ分析部
と、予め分析された音声の標準パターンを保持記憶した
標準パターン記憶部と、前記標準パターンと前記入力音
声との距離を求める比較部と、前記距離の結果に基づい
て発声毎の音声認識結果の候補を出力する判定部と、前
記発声毎の音声認識結果の候補を記憶蓄積し、一つ以上
の発声に対して該音声認識結果の候補の中から全体とし
て文を得るように音声認識結果を選択する候補選択部
と、前記音声認識結果を表示する認識結果表示部とを備
えた音声認識装置において、予め名詞及び該名詞に接続
する助詞と、前記名詞より後に発声された用語とによる
３つ組の出現数の共起の定量的な起こり易さを示す３つ
組出現数情報を保持記憶した３つ組出現数記憶部を備
え、前記候補選択部は、前記音声認識結果の候補の選択
に際して前記３つ組出現数情報に基づいて最適な音声認
識結果を得ることを特徴とする音声認識装置。
【請求項３】請求項２記載の音声認識装置において、
コーパスを入力するコーパス入力部と、前記コーパスの
文に出現する３つ組を登録すると共に、該登録結果に応
じて前記３つ組出現数記憶部における前記３つ組出現数
情報の内容修正に寄与する３つ組出現登録部とを備えた
ことを特徴とする音声認識装置。
【請求項４】請求項３記載の音声認識装置において、
前記音声認識結果の表示に対してユーザが文を入力して
修正操作入力を行う修正入力部を備え、前記認識結果表
示部は前記修正操作入力の内容を前記３つ組出現登録部
へ伝送し、前記３つ組出現登録部は前記修正操作入力の
内容による文に出現する３つ組を検出して登録すると共
に、前記３つ組出現数記憶部における前記３つ組出現数
情報の内容修正に寄与することを特徴とする音声認識装
置。