JPH10301597A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH10301597A
JPH10301597A JP9112285A JP11228597A JPH10301597A JP H10301597 A JPH10301597 A JP H10301597A JP 9112285 A JP9112285 A JP 9112285A JP 11228597 A JP11228597 A JP 11228597A JP H10301597 A JPH10301597 A JP H10301597A
Authority
JP
Japan
Prior art keywords
speech recognition
recognition result
unit
candidate
sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP9112285A
Other languages
English (en)
Other versions
JP3036591B2 (ja
Inventor
Seiichi Miki
清一 三木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP9112285A priority Critical patent/JP3036591B2/ja
Publication of JPH10301597A publication Critical patent/JPH10301597A/ja
Application granted granted Critical
Publication of JP3036591B2 publication Critical patent/JP3036591B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 音声認識結果の候補の選択に際して精度良く
候補を自動選択し得る音声認識装置を提供すること。 【解決手段】 この音声認識装置では、3つ組出現数記
憶部9に予め名詞及びその名詞に接続する助詞と、名詞
より後に発声された用語とによる3つ組の出現数の共起
の定量的な起こり易さを示す3つ組出現数情報が保持記
憶されており、パラメータ分析部1で分析された入力音
声と標準パターン記憶部2の標準パターンとの距離を比
較部3で求めた結果に基づいて判定部4により発声毎の
音声認識結果の候補を出力し、この発声毎の音声認識結
果の候補を記憶蓄積する候補選択部5により一つ以上の
発声に対して音声認識結果の候補を選択する際、3つ組
出現数情報に基づいて音声認識結果として自動的に最適
な音声認識結果を得てこれを認識結果表示部6で表示す
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、主として一つ以上
の発声に対してそれぞれ複数の音声認識結果の候補から
認識結果を選択して文を得る音声認識装置に関する。
【0002】
【従来の技術】従来、例えば単語毎に発声し、最終的に
文を入力するような音声認識装置においては、発声毎の
音声認識結果の候補の中から文として最適になるような
音声認識結果を自動的に選択することが考えられてい
る。
【0003】これに対し、例えば特開平4−75163
号公報に開示されたかな漢字変換装置では、かな漢字変
換候補の選択に共起意味情報及び共起格情報を用いてい
るが、このような技術は音声認識装置でも使用すること
ができる。
【0004】そこで、図9は、こうした場合の音声認識
装置の基本構成を示したブロック図である。この音声認
識装置では、入力手段10から入力されたかな文字を編
集制御部11が入力かな列記憶部12と出力文字列記憶
部19に格納し、表示手段20に表示する。又、編集制
御部11の指示により、かな漢字変換制御部13は、入
力かな列記憶部12に記憶されているかな列から単語辞
書16を参照することによりかな漢字変換候補を作成
し、かな漢字変換候補記憶部14に格納する。更に、共
起情報検査部15は共起情報記憶部17を参照しなが
ら、かな漢字変換候補記憶部14に格納されているかな
漢字変換候補の中から最適なかな漢字変換候補を選択す
ることにより、かな漢字変換の結果を作成する。最後に
編集制御部11は、かな漢字変換した結果を出力文字列
記憶部19に格納し、表示手段20に表示する。
【0005】この音声認識装置の場合、表示されたかな
漢字変換結果を見てユーザは同音語選択をするか否かを
決定する。同音語選択をしない場合、出力文字列記憶部
19に格納されているかな漢字変換候補が変換結果とな
る。
【0006】同音語選択をする場合、編集制御部11は
かな漢字変換候補記憶部14に格納されている候補を出
力文字列記憶部19に格納し、表示手段20に表示す
る。ユーザは表示されたかな漢字変換候補から正しいも
のを選択する。
【0007】次に、編集制御部11の指示により共起情
報登録部18は、選択されたかな漢字変換候補中の単語
の共起意味情報及び共起格情報をかな漢字変換制御部1
3から得て共起情報記憶部17に登録する。選択された
かな漢字変換候補が変換結果となる。
【0008】そこで、以下はこの音声認識装置おいて、
共起情報検査部15がかな漢字変換候補記憶部14から
最適なかな漢字変換候補を選択する方法と、共起情報登
録部18がかな漢字変換結果から得られた共起情報を登
録する方法とを図9〜図11と図13とを参照して説明
する。但し、図10は単語辞書16の内容を例示したも
ので、図11はかな漢字変換候補記憶部14の内容を例
示したもので、図12は共起情報記憶部17の内容を例
示したものである。又、図13はかな入力文字列「うま
がかける」,「うまにかける」,「うまがかける」を順
に変換操作していったときの変換結果を例示したもので
ある。
【0009】最初に、かな入力文字列「うまがかける」
に対し、例えば「書ける」「駆ける」「賭ける」といっ
た同音語から選択した結果、「馬が駆ける」をかな漢字
変換結果としてユーザが決定すると、共起情報記憶部1
7に単語「馬」の読み,単語表記,単語「馬」に対する
共起意味情報として単語「駆ける」の意味コード(0
2),及び単語「馬」に対する共起格情報として共起格
情報コード(b1)が記憶登録される。因みに、単語の
意味コードは単語辞書16に登録されている。共起格情
報コードはかな漢字変換制御部13が入力かな列記憶部
12に格納されているかな列の係り受け関係を解析する
ことにより与え、同一種の格には同一コードが与えられ
る。
【0010】同様に、「うまにかける」の入力文字列に
対し、「馬に賭ける」をかな漢字変換結果としてユーザ
が決定すると、共起情報記憶部17に単語「馬」の読
み,単語表記,単語「賭ける」の意味コード(03),
及び共起格情報コード(b2)が登録される。
【0011】最後の「うまがかける」のかな入力文字列
に対し、かな漢字変換候補記憶部14には、「かける」
にかな漢字変換の候補が複数あるため、共起情報検査部
15がいずれかを選択する必要がある。共起情報記憶部
17に示されるように、単語「馬」に対し、「駆ける」
の共起意味情報(02)及び「賭ける」の共起意味情報
(03)は何れも共起情報記憶部18に登録されてい
る。
【0012】共起意味情報のみ用いる場合を考えると、
「かける」のかな漢字変換結果として「駆ける」と「賭
ける」とを選択することができる。共起格情報まで用い
ると、かな漢字変換制御部13の解析の結果、「うま」
と「かける」との共起格情報はb1であり、これによ
り、図12に示されるようにb1という共起格情報が登
録されている「駆ける」を選択できる。
【0013】以上に説明したように、既存の音声認識装
置において、共起意味情報や共起格情報を用いること
で、それらを用いない場合と比べて精度良くかな漢字変
換候補を選択できる。
【0014】
【発明が解決しようとする課題】上述した音声認識装置
の場合、かな漢字変換候補の代わりに発声毎の音声認識
結果の候補を用いることで、発声毎の音声認識結果の候
補から音声認識結果の候補を自動的に選択できるように
なるが、共起の有無のみを用い、共起の定量的な起こり
易さを用いていないため、音声認識のようにかな漢字変
換と比較して候補が多く与えられる場合(例えば同じ共
起格情報を持つ候補が多数ある場合)等の用途に際して
は精度良く候補を自動選択することが困難となってい
る。
【0015】本発明は、このような問題点を解決すべく
なされたもので、その技術的課題は、音声認識結果の候
補の選択に際して精度良く候補を自動選択し得る音声認
識装置を提供することにある。
【0016】
【課題を解決するための手段】本発明によれば、入力音
声に対して複数の音声認識結果の候補を与え、一つ以上
の発声に対して該複数の音声認識結果の候補の中から選
択して全体として文を得る音声認識装置において、複数
の音声認識結果の候補の中からの選択に際し、名詞及び
該名詞に接続する助詞と、名詞より後に発声された用語
とによる3つ組の共起の定量的な起こり易さに基づいて
最適な音声認識結果を得る音声認識装置が得られる。
【0017】又、本発明によれば、入力音声を分析する
パラメータ分析部と、予め分析された音声の標準パター
ンを保持記憶した標準パターン記憶部と、標準パターン
と入力音声との距離を求める比較部と、距離の結果に基
づいて発声毎の音声認識結果の候補を出力する判定部
と、発声毎の音声認識結果の候補を記憶蓄積し、一つ以
上の発声に対して該音声認識結果の候補の中から全体と
して文を得るように音声認識結果を選択する候補選択部
と、音声認識結果を表示する認識結果表示部とを備えた
音声認識装置において、予め名詞及び該名詞に接続する
助詞と、名詞より後に発声された用語とによる3つ組の
出現数の共起の定量的な起こり易さを示す3つ組出現数
情報を保持記憶した3つ組出現数記憶部を備え、候補選
択部は、音声認識結果の候補の選択に際して3つ組出現
数情報に基づいて最適な音声認識結果を得る音声認識装
置が得られる。
【0018】更に、本発明によれば、上記音声認識装置
において、コーパスを入力するコーパス入力部と、コー
パスの文に出現する3つ組を登録すると共に、該登録結
果に応じて3つ組出現数記憶部における3つ組出現数情
報の内容修正に寄与する3つ組出現登録部とを備えた音
声認識装置が得られる。
【0019】加えて、本発明によれば、上記音声認識装
置において、音声認識結果の表示に対してユーザが文を
入力して修正操作入力を行う修正入力部を備え、認識結
果表示部は修正操作入力の内容を3つ組出現登録部へ伝
送し、3つ組出現登録部は修正操作入力の内容による文
に出現する3つ組を検出して登録すると共に、3つ組出
現数記憶部における3つ組出現数情報の内容修正に寄与
する音声認識装置が得られる。
【0020】
【発明の実施の形態】以下に実施例を挙げ、本発明の音
声認識装置について、図面を参照して詳細に説明する。
【0021】最初に、本発明の音声認識装置の機能的概
要を簡単に説明する。この音声認識装置は、入力音声に
対して複数の音声認識結果の候補を与え、一つ以上の発
声に対して複数の音声認識結果の候補の中から選択して
全体として文を得るもので、複数の音声認識結果の候補
の中からの選択に際し、名詞及びその名詞に接続する助
詞と、名詞より後に発声された用語とによる3つ組の共
起の定量的な起こり易さに基づいて自動的に最適な音声
認識結果を得るようにしたものである。
【0022】図1は、本発明の一実施例に係る音声認識
装置の基本構成を示したブロック図である。この音声認
識装置は、入力音声を分析するパラメータ分析部1と、
予め分析された音声の標準パターンを保持記憶した標準
パターン記憶部2と、標準パターンと入力音声との距離
を求める比較部3と、距離の結果に基づいて発声毎の音
声認識結果の候補を出力する判定部4と、発声毎の音声
認識結果の候補を記憶蓄積し、一つ以上の発声に対して
音声認識結果の候補の中から全体として文を得るように
音声認識結果を選択する候補選択部5と、音声認識結果
を表示する認識結果表示部6と、予め名詞及びその名詞
に接続する助詞と、名詞より後に発声された用語とによ
る3つ組の出現数の共起の定量的な起こり易さを示す3
つ組出現数情報を保持記憶した3つ組出現数記憶部9と
を備えている。但し、ここで候補選択部5は、音声認識
結果の候補の選択に際して3つ組出現数記憶部9の3つ
組出現数情報に基づいて自動的に最適な音声認識結果を
得るようになっている。
【0023】又、この音声認識装置は、コーパスを入力
するコーパス入力部7と、コーパスの文に出現する3つ
組を登録し、その登録結果に応じて3つ組出現数記憶部
9における3つ組出現数情報の内容修正に寄与する3つ
組出現登録部8とを備えている。
【0024】図2は、この音声認識装置の動作処理とし
て、入力音声から音声認識結果を表示するまでの処理を
示したフローチャートである。
【0025】ここでは、パラメータ分析部1での音声入
力(ステップS1)として単語毎に発声された入力音声
を分析し、比較部3で入力音声と標準パターン記憶部2
に格納されている単語の標準パターンとを比較し、入力
音声と標準パータンとの距離を求める。パラメータ分析
部1は例えばフィルタバンク,フーリエ変換器,線形予
測係数型分析器等により構成されるもので、入力音声を
分析してパラメータベクトル列に変換する。標準パター
ン記憶部2に格納されている標準パターンは、パラメー
タベクトル列として表現されている。標準パターンの中
から分析された入力音声と距離の近い複数が音声認識結
果の候補として判定部4で選ばれる。これにより、分析
・比較を行い音声認識結果の候補取得(ステップS2)
する処理が行われる。
【0026】ここで、距離の代わりに確からしさを用い
ることもできる。音声認識結果の候補は、発声された順
番に候補選択部5で記憶・蓄積される。これにより、候
補選択部に認識結果候補を蓄積(ステップS3)する処
理が行われる。候補選択部5は判定部4から与えられた
音声認識結果の候補のうち、最も距離の近い候補を音声
認識結果として認識結果表示部6へ伝送し、認識結果表
示部6で表示する。これにより、認識結果表示(ステッ
プS4)する処理が行われる。
【0027】引き続き、ユーザによる文終了通知が有る
か否かを判定(ステップS5)し、文終了通知が無けれ
ば音声入力(ステップS1)の前にリターンして待機す
るが、文終了通知が有れば(ユーザによる一文の発声が
終了すれば)文終了をシステムに通知する。ユーザは文
終了を例えばマウスやキーボード等を使用して行なう
が、音声を用いても通知することができる。
【0028】文終了が通知されると、候補選択部5では
3つ組出現数記憶部9からの3つ組出現数情報に基づい
て全体として最適な文となるように、発声毎に得られた
音声認識結果の候補の中から最適な候補を発声毎にそれ
ぞれ一つずつ選択し、それらを最適な音声認識結果とし
て認識結果表示部6へ伝送する。これにより、蓄積され
た候補と3つ組情報(3つ組出現数情報)とを用いて音
声認識結果を選択・決定(ステップS6)する処理が行
われる。認識結果表示部6では伝送された音声認識結果
を表示し、認識結果表示(ステップS7)の処理が行わ
れる。この後、候補選択部5はそれまでに蓄積されてい
た発声毎に得られた音声認識結果の候補を消去し、候補
選択部5の認識結果候補を消去(ステップS8)する処
理が行われた後、音声入力(ステップS1)の前にリタ
ーンして待機する。
【0029】図3は、この音声認識装置の動作処理とし
て、入力音声から認識結果を表示する際、ユーザからの
文終了通知を待たずに音声入力がなされる度に候補を選
択する場合の処理動作を示したフローチャートである。
【0030】この場合、表示される認識結果は音声入力
(ステップS1)がなされる度に更新される。3つ組出
現数記憶部9の内容は、予めコーパス入力部1にコーパ
スを入力することで得られる。コーパスは多数の文から
構成される。文は単語に分けられており、単語には品詞
が付加されているものとする。コーパス入力部1はコー
パスを文毎に3つ組出現登録部8へ伝送し、3つ組出現
登録部8ではコーパスの文に出現する3つ組の出現数を
数えて3つ組出現数記憶部9の3つ組出現数情報を修正
する。3つ組は上述したように、文中に出現する名詞及
びその名詞に接続する助詞と、名詞より後に出現する用
語とによる3つの単語の組みのことである。このような
処理が加えられるため、動作処理上は図2で説明した各
部の働きによって、音声入力(ステップS1)の後、分
析・比較を行い音声認識結果の候補取得(ステップS
2)する処理,候補選択部に認識結果候補を蓄積(ステ
ップS3)する処理,蓄積された候補と3つ組情報(3
つ組出現数情報)とを用いて音声認識結果を選択・決定
(ステップS6)する処理,及び認識結果表示(ステッ
プS5)の処理がこの順で行われる。
【0031】図4は、図3の処理動作で要するコーパス
を用いて3つ組出現数記憶部9の内容を修正する際の処
理動作を示したフローチャートである。
【0032】ここでは、コーパスの入力(ステップS
1)を経てコーパスを文に分割(ステップS2)し、文
を左から走査(ステップS3)して文中の3つ組を検出
(ステップS4)した後、検出された3つ組について出
現数を1増やす(ステップS5)処理を行っている。こ
の後は、文の終端か否かを判定(ステップS6)し、終
端でなければ文中の3つ組を検出(ステップS4)する
処理に戻るが、終端であればコーパスが終了であるか否
かを判定(ステップS7)する。この結果、終了でなけ
れば文を左から走査(ステップS3)する処理に戻る
が、終了であれば処理動作を終了する。
【0033】図5は、図4による処理動作を具体的に例
示したものである。ここでは「私は今日学校へ走って行
った」という文に対し、3つ組出現登録部8が出現する
3つ組を計数し、3つ組出現数記憶部9に登録する例を
示している。即ち、3つ組出現登録部8は与えられた文
を左から走査し、名詞を検出する。ここでは、先ず
「私」という名詞が検出される。名詞が検出されると、
与えられた文からそれと接続する助詞及びその名詞より
後に出現する用語を検出し、助詞「は」,用語「走っ
て」が検出される。3つ組出現登録部8は検出された3
つ組に対し、3つ組出現数記憶部9中の同じ3つ組の出
現数に1を加える。3つ組出現登録部8は、3つ組出現
数記憶部9中の「私/は/走って」という3つ組の出現
数に1を加える。同様に、図5の例文からは「私/は/
行った」,「学校/へ/走って」,「学校/へ/行っ
た」という3つ組が検出され、それぞれ3つ組出現数記
憶部9の出現数に1が加えられる。
【0034】図6は、候補選択部5の候補選択を例示し
たものである。ここでは、「私は」「本を」「買う」と
発声した場合を示している。判定部4により最初の発声
に対しては「私は」「かかしは」「はだしは」の3つの
候補,2つめの発声に対しては「本当」「本を」「癌
を」の3つの候補,最後の発声に対しては「カブ」「買
う」「飼う」の3つの候補,最後の発声に対しては「カ
ブ」「買う」「飼う」の3つの候補がそれぞれ得られて
いる。それぞれの音声認識結果の候補中から一つずつ選
んで接続した列を文候補とする。図6の例では3×3×
3=37個の文候補が得られている。
【0035】候補選択部5は各文候補中に出現する3つ
組を検出し、それぞれに対して3つ組出現数記憶部9を
参照してその出現数を調べ、それを総和した値を文候補
の文スコアとする。例えば文スコアに比較部3で得られ
た入力音声と標準パターンとの距離の逆数を加えること
もできる。又、上述したように出現した3つ組の出現数
をそのまま加算すると、一文中に用語が複数含まれるよ
うな文候補が高い文スコアを得ることになるため、これ
を防止するために文候補中の用語の個数でスコアを割算
することもできる。何れにしても、文スコアの最も高い
文候補を最適な音声認識結果として、認識結果表示部6
へ伝送する。
【0036】図6の例では、「私は本を買う」という文
候補に対して、「私は買う」「本を買う」という2つの
3つ組が出現し、最も高い文スコアを与えている。従来
技術では例えば図6では、「癌を買う」「本を買う」は
どちらも共起が存在するため、例えば何れかがより新し
く出現した共起であるかという程度でしか選択基準が存
在しないが、本発明の音声認識装置ではより確からしい
選択が可能となる。図6では文を分割して発声した場合
を例示したが、本発明の音声認識装置では一文を一度に
発声する場合でも、音声認識結果の候補に単語区切りと
品詞情報とが与えられていれば適用できる。
【0037】図7は、本発明の他の実施例に係る音声認
識装置の基本構成を示したブロック図である。この音声
認識装置では、図1に示したものと比べ、新たに音声認
識結果の表示に対してユーザが文を入力して修正操作入
力を行う修正入力部21が備えられ、認識結果表示部6
が修正操作入力の内容を3つ組出現登録部8へ伝送し、
3つ組出現登録部8で修正操作入力の内容による文に出
現する3つ組を検出して登録すると共に、3つ組出現数
記憶部9における3つ組出現数情報の内容修正に寄与す
るようになっている点が相違している。
【0038】図8は、この音声認識装置の動作処理とし
て、入力音声から音声認識結果を表示するまでの処理
(候補選択及び修正による3つ組出現数記憶部9の内容
の更新を含む)動作を示したフローチャートである。即
ち、ここでは入力音声から認識結果を表示し、それが誤
っていた場合にユーザが修正し、その結果を3つ組出現
数記憶部9に反映するようになっている。
【0039】ここでの処理は、図2で説明したものと途
中の認識結果表示(ステップS7)の処理までは同様に
なっている。この後に認識結果表示部6によって表示さ
れた音声認識結果に誤りがあった場合、ユーザは修正入
力部21により結果を修正する。このため、動作処理上
はユーザによる修正有りか否かを判定(ステップS8)
し、有りの場合にユーザ修正(ステップS9)の処理を
行ってからユーザ修正終了か否かを判定(ステップS1
0)し、ユーザ修正終了でなければユーザ修正(ステッ
プS9)の前にリターンして待機するが、ユーザ修正終
了であればユーザによる修正が無い場合と同様に次の処
理へ移行する。ユーザ修正は例えばキーボードやマウス
等によりなされる。
【0040】ユーザ修正終了の場合やユーザによる修正
が無い場合は、得られた音声認識結果は文として3つ組
出現登録部8へ伝送され、ここで3つ組出現数記憶部9
の情報が修正される。これにより、得られた結果を用い
て3つ組出現数記憶部の情報修正(ステップS11)の
処理が行われる。3つ組出現数記憶部9の最初の内容
は、コーパス入力部1にコーパスを入力することで得ら
れる。ここでは、得られた音声認識結果を用いて3つ組
出現数記憶部9の情報修正することにより、コーパスに
出現しなかった3つ組情報を記憶・登録することができ
る。この後、候補選択部5はそれまでに蓄積されていた
発声毎に得られた音声認識結果の候補を消去し、候補選
択部5の認識結果候補を消去(ステップS12)する処
理が行われた後、音声入力(ステップS1)の前にリタ
ーンして待機する。
【0041】
【発明の効果】以上に説明したように、本発明の音声認
識装置によれば、音声認識結果の候補に対し、その候補
を選択して文を得る際、予め装置内に記憶された名詞及
びそれに接続する助詞と名詞より後に出現する用語とに
よる3つ組の共起の定量的な起こり易さを用いて音声認
識結果の候補から自動的に最適な音声認識結果を選択し
ているので、音声認識結果の候補の選択に際して精度良
く候補を自動選択し得るようになる。即ち、この音声認
識装置の場合、例えば予め用意した大量のコーパスに出
現した文中で用いられた共起の出現頻度を調べる等によ
り、予めそれぞれの共起の定量的な起こり易さを調べて
おくことで、それを音声認識結果の候補の選択に用いる
ため、より正解が得られる可能性が高くなる。
【図面の簡単な説明】
【図1】本発明の一実施例の音声認識装置の基本構成を
示したブロック図である。
【図2】図1に示す音声認識装置の動作処理として、入
力音声から音声認識結果を表示するまでの処理動作を示
したフローチャートである。
【図3】図1に示す音声認識装置の動作処理として、入
力音声から認識結果を表示する際、ユーザからの文終了
通知を待たずに音声入力がなされる度に候補を選択する
場合の処理動作を示したフローチャートである。
【図4】図3に示す処理動作で要するコーパスを用いて
3つ組出現数記憶部の内容を修正する際の処理動作を示
したフローチャートである。
【図5】図4による処理内容を具体的に例示したもので
ある。
【図6】図1に示す音声認識装置に備えられる候補選択
部の候補選択内容を具体的に例示したものである。
【図7】本発明の他の実施例の音声認識装置の基本構成
を示したブロック図である。
【図8】図7に示す音声認識装置の動作処理として、入
力音声から音声認識結果を表示するまでの処理(候補選
択及び修正による3つ組出現数記憶部の内容の更新を含
む)動作を示したフローチャートである。
【図9】従来の音声認識装置の基本構成を示したブロッ
ク図である。
【図10】図9に示す音声認識装置に備えられる単語辞
書の内容を具体的に例示したものである。
【図11】図9に示す音声認識装置に備えられるかな漢
字変換候補記憶部の内容を具体的に例示したものであ
る。
【図12】図9に示す音声認識装置に備えられる共起情
報記憶部の内容を具体的に例示したものである。
【図13】図9に示す音声認識装置によるかな漢字変換
操作による変換結果を具体的に例示したものである。
【符号の説明】
1 パラメータ分析部 2 標準パターン記憶部 3 比較部 4 判定部 5 候補選択部 6 認識結果表示部 7 コーパス入力部 8 3つ組出現登録部 9 3つ組出現数記憶部

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 入力音声に対して複数の音声認識結果の
    候補を与え、一つ以上の発声に対して該複数の音声認識
    結果の候補の中から選択して全体として文を得る音声認
    識装置において、前記複数の音声認識結果の候補の中か
    らの選択に際し、名詞及び該名詞に接続する助詞と、前
    記名詞より後に発声された用語とによる3つ組の共起の
    定量的な起こり易さに基づいて最適な音声認識結果を得
    ることを特徴とする音声認識装置。
  2. 【請求項2】 入力音声を分析するパラメータ分析部
    と、予め分析された音声の標準パターンを保持記憶した
    標準パターン記憶部と、前記標準パターンと前記入力音
    声との距離を求める比較部と、前記距離の結果に基づい
    て発声毎の音声認識結果の候補を出力する判定部と、前
    記発声毎の音声認識結果の候補を記憶蓄積し、一つ以上
    の発声に対して該音声認識結果の候補の中から全体とし
    て文を得るように音声認識結果を選択する候補選択部
    と、前記音声認識結果を表示する認識結果表示部とを備
    えた音声認識装置において、予め名詞及び該名詞に接続
    する助詞と、前記名詞より後に発声された用語とによる
    3つ組の出現数の共起の定量的な起こり易さを示す3つ
    組出現数情報を保持記憶した3つ組出現数記憶部を備
    え、前記候補選択部は、前記音声認識結果の候補の選択
    に際して前記3つ組出現数情報に基づいて最適な音声認
    識結果を得ることを特徴とする音声認識装置。
  3. 【請求項3】 請求項2記載の音声認識装置において、
    コーパスを入力するコーパス入力部と、前記コーパスの
    文に出現する3つ組を登録すると共に、該登録結果に応
    じて前記3つ組出現数記憶部における前記3つ組出現数
    情報の内容修正に寄与する3つ組出現登録部とを備えた
    ことを特徴とする音声認識装置。
  4. 【請求項4】 請求項3記載の音声認識装置において、
    前記音声認識結果の表示に対してユーザが文を入力して
    修正操作入力を行う修正入力部を備え、前記認識結果表
    示部は前記修正操作入力の内容を前記3つ組出現登録部
    へ伝送し、前記3つ組出現登録部は前記修正操作入力の
    内容による文に出現する3つ組を検出して登録すると共
    に、前記3つ組出現数記憶部における前記3つ組出現数
    情報の内容修正に寄与することを特徴とする音声認識装
    置。
JP9112285A 1997-04-30 1997-04-30 音声認識装置 Expired - Fee Related JP3036591B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9112285A JP3036591B2 (ja) 1997-04-30 1997-04-30 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9112285A JP3036591B2 (ja) 1997-04-30 1997-04-30 音声認識装置

Publications (2)

Publication Number Publication Date
JPH10301597A true JPH10301597A (ja) 1998-11-13
JP3036591B2 JP3036591B2 (ja) 2000-04-24

Family

ID=14582876

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9112285A Expired - Fee Related JP3036591B2 (ja) 1997-04-30 1997-04-30 音声認識装置

Country Status (1)

Country Link
JP (1) JP3036591B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000054180A1 (fr) * 1999-03-05 2000-09-14 Cai Co., Ltd. Systeme et procede de creation de document formate sur la base de la reconnaissance vocale conversationnelle
JP2002041080A (ja) * 2000-07-11 2002-02-08 Internatl Business Mach Corp <Ibm> 単語予測方法、音声認識方法、単語予測装置、音声認識装置、コンピュータ・システム、記憶媒体およびプログラム伝送装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000054180A1 (fr) * 1999-03-05 2000-09-14 Cai Co., Ltd. Systeme et procede de creation de document formate sur la base de la reconnaissance vocale conversationnelle
JP2002041080A (ja) * 2000-07-11 2002-02-08 Internatl Business Mach Corp <Ibm> 単語予測方法、音声認識方法、単語予測装置、音声認識装置、コンピュータ・システム、記憶媒体およびプログラム伝送装置

Also Published As

Publication number Publication date
JP3036591B2 (ja) 2000-04-24

Similar Documents

Publication Publication Date Title
US7277851B1 (en) Automated creation of phonemic variations
US7873508B2 (en) Apparatus, method, and computer program product for supporting communication through translation between languages
JP2000089786A (ja) 音声認識結果の修正方法および装置
JP3036591B2 (ja) 音声認識装置
JP4220151B2 (ja) 音声対話装置
JP2000056795A (ja) 音声認識装置
JP2006343405A (ja) 音声理解装置、音声理解方法、単語・意味表現組データベースの作成方法、そのプログラムおよび記憶媒体
JP3956730B2 (ja) 言語処理装置
JP2570681B2 (ja) ワード・プロセッサ
JPH04232997A (ja) 音声認識装置における認識結果表示方式
JP2000056793A (ja) 音声認識装置
JPH09274495A (ja) 音声認識装置
JPH08185197A (ja) 日本語解析装置、及び日本語テキスト音声合成装置
JPH1196141A (ja) 中国語入力変換処理装置、中国語入力変換処理方法、中国語入力変換処理プログラムを記録した記録媒体
JP3895797B2 (ja) 変換候補生成方法
JPH10240736A (ja) 形態素解析装置
JPS63163956A (ja) 文書作成・校正支援装置
JP2895137B2 (ja) 日本文誤り自動検出および訂正装置
JPH0836575A (ja) 統語解析装置
JPH08278973A (ja) 並列句解析装置および学習データ作成装置
JPH0458381A (ja) 光学的文字読取装置
JPH02298997A (ja) 音声認識装置
JP2001175645A (ja) 中国語入力変換処理装置、中国語入力変換処理方法及び記録媒体
JPH0546612A (ja) 文章誤り検出装置
JPH0772891A (ja) 音声認識装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20000126

LAPS Cancellation because of no payment of annual fees