JP2000082114A - 情報解析装置、情報解析方法及び情報解析プログラムを記録した記録媒体 - Google Patents

情報解析装置、情報解析方法及び情報解析プログラムを記録した記録媒体

Info

Publication number
JP2000082114A
JP2000082114A JP10251075A JP25107598A JP2000082114A JP 2000082114 A JP2000082114 A JP 2000082114A JP 10251075 A JP10251075 A JP 10251075A JP 25107598 A JP25107598 A JP 25107598A JP 2000082114 A JP2000082114 A JP 2000082114A
Authority
JP
Japan
Prior art keywords
candidate
input
analysis
score
analysis result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10251075A
Other languages
English (en)
Inventor
Yasuyuki Kono
恭之 河野
Takehide Yano
武秀 屋野
Munehiko Sasajima
宗彦 笹島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP10251075A priority Critical patent/JP2000082114A/ja
Publication of JP2000082114A publication Critical patent/JP2000082114A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Character Discrimination (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】 【課題】 表層的な解析過程だけでなく意味解析の処理
に基づいて入力候補の選択を行うことができ、また、多
数の候補の意味解析を多大な時間を要することなく完了
することができる情報解析装置を提供する。 【解決手段】 入力候補取り出し部11で取り出された
入力候補について解析処理を施し、候補解析結果を導く
入力候補解析部10と、該入力候補の解析時におけるペ
ナルティスコアを所定の方法により算出する解析ペナル
ティ算出部13と、該入力候補の前記入力内容候補スコ
アと前記ペナルティスコアに基づいて所定の方法により
前記候補解析結果のスコアである解析結果スコアを算出
する解析結果スコア算出部16と、前記候補解析結果
を、該入力に対して既に解析の終了した候補解析結果を
蓄える順序付けられた集合である候補解析結果集合15
に挿入する手段とを具備する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声認識や文字認
識等、一般に複数の候補を認識結果として与えられ、そ
れを解析して利用者の意図を抽出する、もしくはその応
答を生成するための情報解析装置、情報解析方法及び情
報解析プログラムを記憶した媒体に関する。
【0002】
【従来の技術】近年、計算機技術の発展により、音声や
手書き文字、自然言語といった利用者にとってより自然
な方法で種々の情報を計算機に入力することが可能にな
ってきており、その利用を促進する技術が求められるよ
うになってきている。
【0003】例えば、コンピュータにマイクロフォンと
安価なA/Dコンバータが装備されたことにより、利用
者がコンピュータに対して自分の要求を発声すると、コ
ンピュータがその発声に対して音声認識・理解を行って
利用者の要求を解釈し、その返答を行うような技術の重
要性が増している。
【0004】音声認識や文字認識といった認識処理を伴
う入力の処理において従来から問題になっていた点とし
て、これらの認識処理においては利用者の意図する入力
を一意に認識結果として得られることが一般に期待でき
ないということがあった。
【0005】従来これらの音声認識等を用いた対話装置
においては、音声認識結果として得られる音響的なスコ
アや、認識単語候補ラティスの構文解析結果として得ら
れる文法的なスコアを用いて最尤スコアを持つ候補を入
力と仮定し、その候補の理解結果に基づいて応答を生成
することにより、音声等を用いたマン−マシンインタフ
ェースを実現していた。
【0006】ところが多くの音声認識装置において認識
誤りは避けられず、音響的な最尤候補が利用者の入力と
一致することが期待できないことが一般的であった。こ
のため、音声認識結果を構文解析して文法的にありうる
候補のみに絞り込むと共に、構文解析の観点から各文候
補のスコアの再調整なども行われたが、そのようにして
も最尤候補が利用者の実際の入力と異なることがすくな
からずあった。
【0007】また、最尤候補が実際の入力でないことが
考えられるため複数の候補を理解処理することが考えら
れるが、入力候補数が多い場合にはその理解処理におい
て多数の候補を解析処理する必要があるために処理時間
が大きくなるという問題があった。
【0008】
【発明が解決しようとする課題】このように従来は、認
識処理を伴う入力を理解し、その入力に対して応答する
ような情報解析装置、方式及びプログラムを記憶した媒
体において、認識処理やその表層的な解析処理に基づく
最尤候補は、候補としての信頼性に欠けるという問題が
あった。また、認識処理やその表層的な解析処理に基づ
く候補全てについて意味的な解析処理を加えるには、解
析処理の時間がかかりすぎるという問題もあった。
【0009】本発明はこのような事情を考慮してなされ
たもので、表層的な解析過程だけでなく意味解析の処理
に基づいて入力候補の選択を行うことができ、また、多
数の候補の意味解析においても多大な時間を要すること
なく解析を完了することができる情報解析装置、方式及
びプログラムを記憶した媒体を提供することにある。
【0010】
【課題を解決するための手段】例えば、従来の認識処理
を伴う入力を理解し、その入力に対して応答するような
情報解析装置、方式及びプログラムを記憶した媒体にお
いては、認識処理やその表層的な解析処理に基づく最尤
候補は、候補としての信頼性に欠け、表層的な最尤候補
に基づいた応答が利用者の意図とはずれたものになるこ
とが多々あるという問題があった。
【0011】しかし本発明では、表層的な解析処理を行
った後の各候補の意味的な解析処理において、解析時に
おけるペナルティスコアを算出する手段、及び表層的な
解析処理のスコアと前記ペナルティスコアを勘案して各
候補を再スコアリングし、その結果に基づいて候補順位
を制御する手段を設けることで、例えば意味解析におい
て曖昧性を含む候補の順位を下げ、より直接的な入力候
補を優先した候補選択ができるなど、意味解析処理過程
での選好を反映したより利用者の実際の入力を候補とし
て受け付けやすい候補選択ができるようになっている。
【0012】また、従来のシステムにおいては多くの入
力候補を意味解析しては、解析処理に時間がかかりすぎ
るという問題もあった。
【0013】しかし本発明では、意味解析前の候補の表
層的な解析処理段階のスコアと意味解析時におけるペナ
ルティスコアの予測値の少なくとも一方を、意味解析を
既に終了した候補集合の再スコアリングされた各スコア
を用いて意味解析が必要かどうかを評価し、意味解析を
しても再尤候補となる見込みのない候補の意味解析を行
わないことで、高速に複数候補の意味解析処理ができる
ようになっている。
【0014】本発明によれば、認識処理を伴う入力を理
解し、その入力に対して応答するような情報解析装置、
方式及びプログラムを記憶した媒体において、表層的な
解析処理を行った後の各候補の意味的な解析処理におい
て、解析時におけるペナルティスコアを算出する手段、
及び表層的な解析処理のスコアと前記ペナルティスコア
を勘案して各候補を再スコアリングし、その結果に基づ
いて候補順位を制御する手段を設けることで、意味解析
処理過程での選好を反映したより利用者の実際の入力を
候補として受け付けやすい候補選択が可能となる。
【0015】さらに、本発明によれば、認識処理を伴う
入力を理解し、その入力に対して応答するような情報解
析装置、方式及びプログラムを記憶した媒体において、
表層的な解析処理を行った後の各候補の意味的な解析処
理において、意味解析前の候補の表層的な解析処理段階
のスコアと意味解析時におけるペナルティスコアの予測
値の少なくとも一方を、意味解析を既に終了した候補集
合の再スコアリングされた各スコアを用いて意味解析が
必要かどうかを評価し、意味解析をしても再尤候補とな
る見込みのない候補の意味解析を行わないことで、高速
に複数候補の意味解析処理が可能となる。
【0016】
【発明の実施の形態】本発明は、認識処理を伴う入力の
理解に際し、表層的な解析処理を行った後の各候補の意
味的な解析処理において、解析時におけるペナルティス
コアを算出する手段、及び表層的な解析処理のスコアと
前記ペナルティスコアを勘案して各候補を再スコアリン
グし、その結果に基づいて候補順位を制御する手段を設
けることで、意味解析処理過程での選好を反映したより
利用者の実際の入力を候補として受け付けやすい候補選
択を行う機能を持ち、また、表層的な解析処理を行った
後の各候補の意味的な解析処理において、意味解析前の
候補の表層的な解析処理段階のスコアと意味解析時にお
けるペナルティスコアの予測値の少なくとも一方を、意
味解析を既に終了した候補集合の再スコアリングされた
各スコアを用いて意味解析が必要かどうかを評価し、意
味解析をしても再尤候補となる見込みのない候補の意味
解析を行わないことで、高速に複数候補の意味解析処理
を行う機能を持つ情報解析装置、方式及びプログラムを
提供するものであり、以下、図面を参照して本発明の詳
細につき説明する。
【0017】第1図は、本発明の具体例に係る情報解析
装置の概略構成図である。図1に示すように本発明の情
報解析装置は、解析制御部10、入力候補取り出し部11、
入力候補解析部12、ペナルティ算出部13、ペナルティ予
測部14、解析スコア算出部16の6つのモジュール、及び
入力候補集合15、候補解析結果集合17の2つのデータベ
ースからなり、構文解析装置4と問題解決装置5に接続
する。音声認識装置3は、マイク2から入力された利用
者の発声文を認識し、認識結果である例えば単語とその
時間位置とスコアの3つ組みの集合を構文解析装置4に
入力として与える。構文解析装置4は与えられた音声認
識結果を構文解析し、文として受理可能な単語系列候補
と音声認識・構文解析という表層的な解析に基づくその
候補のスコアである入力候補表層スコアとの組である入
力候補を入力候補表層スコアの降順にソートした集合で
ある入力候補集合を生成し、本発明に係る情報解析装置
1に入力として与える。本発明に係る情報解析装置1
は、与えられた入力候補集合に含まれる入力候補に対し
て意味解析処理を行って問題解決装置5で処理可能な形
式の入力意味表現に変換すると共に、意味解析処理にお
けるペナルティスコアを意味解析以前に予測するかもし
くは意味解析の過程でのペナルティ値を算出し、そのペ
ナルティ値に応じて該入力候補の入力候補表層スコアに
バイアスを加えた解析結果スコアと前記入力意味表現と
の組を入力解析結果候補とし、得られた解析結果候補を
解析結果スコアの降順にソートした集合である解析結果
候補集合を生成し、問題解決装置5の入力として与え
る。問題解決装置5は、与えられた解析結果候補集合に
基づいて問題解決を行い、例えば利用者への応答を出力
する。
【0018】次に、本発明の具体例に係る情報解析装置
の内部構成の概略を述べる。
【0019】解析制御部10は、本装置における意味解
析処理を制御する。まず、解析制御部10は、構文解析
装置4から入力候補集合を与えられると、それを入力候
補取り出し部11に引き渡す。そして、入力候補集合が
与えられた場合、及び一つの入力候補の解析が終了した
場合に、次の解析すべき入力候補の取り出しを入力候補
取り出し部11に指示する。
【0020】入力候補取り出し部11は、解析制御部1
0から入力候補集合を与えられると、それを入力候補集
合15に蓄積する。また、次の候補の取り出しを解析制
御部10から指示されると、入力候補集合15から次の
入力候補を取り出し、解析制御部10及び入力候補解析
部12及びペナルティ予測部14に伝達する。解析制御
部10は、取り出された入力候補の入力候補表層スコア
が、候補解析結果候補集合17中の解析結果候補の解析
結果スコアの最大値よりも予め定められた以上に劣って
いる場合、以降の入力候補を意味解析する必要がないと
判断して入力候補の取り出し及び解析を中止し、それま
でに得られている候補解析結果集合17を問題解決装置
5に伝達する。
【0021】ペナルティ予測部14は、入力候補取り出
し部11から伝達された入力候補の単語系列候補に対
し、その意味解析におけるペナルティ値が概算予測でき
る場合、そのペナルティ予測値を解析制御部10に伝達
する。解析制御部10は、取り出された入力候補の入力
候補表層スコアと与えられたペナルティ予測値を解析結
果スコア算出部16に伝達し、スコア算出部16は解析
結果スコアの予測値を算出する。解析制御部10は、ス
コア算出部16から得られたその入力候補の解析結果ス
コアの予測値が、候補解析結果候補集合17中の解析結
果候補の解析結果スコアの最大値よりも予め定められた
以上に劣っている場合、その入力候補を意味解析する必
要がないと判断し、次の解析すべき入力候補の取り出し
を入力候補取り出し部11に指示する。
【0022】入力候補解析部12は、入力候補取り出し
部11から解析すべき入力候補を与えられ、その意味解
析処理を行い、問題解決装置5で処理可能な形式の入力
意味表現に変換する。
【0023】ペナルティ算出部13は、入力候補解析部
12での意味解析処理を監視し、予め与えられたペナル
ティ条件に合致する処理が行われた場合、その入力候補
に対するペナルティ値を積算する。入力候補解析部12
は、ある入力候補の解析が終了するとその変換された解
析結果の意味表現を解析制御部10に与えると共に、そ
の入力候補の入力候補表層スコアと、ペナルティ算出部
13から得られるその入力候補のペナルティ値を解析結
果スコア算出部16に伝達する。
【0024】解析結果スコア算出部16は、与えられた
入力候補表層スコアと、ペナルティ値もしくはペナルテ
ィ予測値を元にその入力候補の解析結果スコアもしくは
解析結果スコアの予測値を算出する。
【0025】解析制御部10は、ある入力候補について
入力候補解析部12から得られた解析結果の意味表現
と、解析結果スコア算出部16から得られたその入力候
補の解析結果スコアを組にしてその入力候補に対する解
析結果候補とし、候補解析結果集合17に解析結果スコ
アの降順になるように蓄積する。そして、入力候補集合
中の全入力候補の解析処理が終了するか、もしくは途中
で解析処理の中止を決定すると、候補解析結果集合17
を解析結果候補集合とする。そして、解析結果候補集合
を問題解決装置5の入力として与え、情報解析装置1は
停止する。
【0026】以上が本発明に係る情報処理システムの概
略構成である。
【0027】第2図は、本発明の具体例に係る情報解析
装置、方法、及びプログラムの概略処理である。以下、
第2図を参照して全体的な処理の流れを説明する。
【0028】表層的な解析処理が終了して入力候補集合
が渡され、本発明の具体例に係る処理が開始(S0)され
ると、まず入力候補集合中の候補が全て意味解析された
かを判断し(S1)、全入力候補が解析終了していると、
解析結果候補集合を出力し、本処理は終了する(S10
)。未だ全入力候補の意味解析が終了していない場
合、入力候補集合から次の解析対象となる入力候補を取
り出す(S2)。
【0029】次に、その入力候補の入力候補表層スコア
が、既に蓄積された解析結果候補集合中の解析結果候補
の解析結果スコアの最大値よりも予め定められた以上に
劣っているかどうかを判定する(S3)。劣っている場
合、以降の入力候補を意味解析する必要がないと判断し
て以降の解析を行わず、それまでの解析結果候補集合を
出力し、本処理は終了する(S10 )。
【0030】入力候補の入力候補表層スコアが劣ってい
ない場合、次にその候補の意味解析前にペナルティ値が
予測可能かを判断する(S4)。予測可能な場合、その入
力候補のペナルティ値を予測し(S7)、次に意味解析ス
コアを予測し(S8)、その入力候補の解析結果スコアの
予測値が、解析結果候補集合中の解析結果候補の解析結
果スコアの最大値よりも予め定められた以上に劣ってい
るかどうかを判断する(S9)。劣っている場合は、その
入力候補の解析を行わず、次の候補の解析を行おうとS1
に戻る。
【0031】S9で劣っていない場合、もしくはS4で予測
不可能な場合、その入力候補の意味解析を行うと共に、
意味解析処理を監視し、予め与えられたペナルティ条件
に合致する処理が行われた場合、その入力候補に対する
ペナルティ値を積算する処理を行う(S5)。
【0032】ある入力候補の解析が終了すると、与えら
れた入力候補表層スコアと、ペナルティ値を元にその入
力候補の解析結果スコアを算出する。そして、入力候補
解析処理で得られた解析結果の意味表現と解析結果スコ
アを組にしてその入力候補に対する解析結果候補とし、
候補解析結果集合に解析結果スコアの降順になるように
蓄積する(S6)。そして次の候補の解析を行おうとS1に
戻る。
【0033】第3図は、本発明の具体例に係る情報解析
装置、方法、及びプログラムをソフトウェアとして実現
した際の装置全体の概略構成である。図中、1はCPU 、
2はメインメモリ、3は入力部、4は出力部である。メ
インメモリ2は、本発明の機能を実現するに必要なプロ
グラム等を格納しておくメモリであり、CPU 1は、この
メモリ2に記憶されたプログラムを実行して各種処理や
各種制御を実施する演算制御の中枢であり、入力部3
は、利用者の音声を取り込み、音声認識・構文解析処理
といった表層的な処理を行いデータ化したり、あるいは
入力文字を取りこんで文字認識・構文解析し、データ化
するなどしてその入力情報をCPU 1に与えるものであ
る。出力部4は、認識結果、解析結果や最終出力を表示
あるいはデータとして出力したりするものである。ま
た、この他、各種辞書などを保持するハードディスクや
光ディスクなどによる大容量記憶装置5、また、光ディ
スクやCD-ROM、CD-R、CD-RW 、DVD などの過般型記憶媒
体をアクセスする大容量記憶媒体ドライブ装置6、外部
システムとの通信を行う通信部7などを有する。
【0034】以上が本発明に係る情報解析装置、方法、
及びプログラムの構成とその機能、及びその処理方式で
ある。
【0035】ここで、音声カーナビゲーション質問を意
味解析する場合を例に取り、第4 図を参照して更に詳し
く説明する。
【0036】利用者が名神高速道路の栗東付近を神戸方
面に向けて走行中にマイクに向かって「吹田インターの
次のサービスエリアはどこ」と発生したとする。ところ
が、発声開始時にマイクに行きが吹きかかり、「吹田」
という単語のスコアが十分でなく、 1000 インターの次のサービスエリアはどこ 975 どの入口から出るの 950 吹田インターの次のサービスエリアはどこ 951 吹田サービスエリアはどこ という4つの入力候補からなる入力候補集合が、表層的
な解析である音声認識、及び構文解析の結果として本発
明に係る情報解析装置に伝えられたとする。ここで、入
力候補文の前の数字は各入力候補の表層解析スコアであ
る。
【0037】まず最初に、表層スコアが最も高い入力候
補 1000インターの次のサービスエリアはどこ が取り出される(S2)。次に、この入力候補の表層スコ
アが、候補解析結果集合に照らし合わせて解析する意義
があるかどうかを判断しようとするが(S3)、候補解析
結果集合が空のため、次のステップに進み、この入力候
補に対しペナルティ予測が可能かを判断する(S4)。ペ
ナルティ予測ができるかどうかは、0個以上の予め設定
されたペナルティ予測ルールが発火可能かで判断され、
本実施例では第5図に示すようなペナルティ予測ルール
が適用可能かを判断する。ここでは、ペナルティ予測ル
ールが適用できないため、次に実際に入力候補の解析を
行うことになる(S5)。ここで、この入力候補の自然言
語文の解析過程については既に先行発明が多数あり本発
明の趣旨でないため、解析過程の詳細は割愛するが、こ
の入力候補の意味解析過程において、0個以上の予め設
定されたペナルティルールが発火可能になると発火し、
そのルールのペナルティ値が入力候補毎に蓄積される。
この入力候補に対しては、第4図に示すようなペナルテ
ィルールが発火することで、単に「インター」という省
略された表現から、現在地や予定経路といった情報から
デフォルト解釈が行われて「栗東インターチェンジ」と
なり、意味解釈結果として栗東インターチェンジのの次
のサービスエリアである大津サービスエリアが得られ、
「INPUT=Where(インターの次のサービスエリア) Ans=大
津SA」という意味表現が得られると共に、この入力候補
にペナルティが1追加される。次に、解析結果スコアの
算出に際して、このペナルティ値に所定の係数100が乗
ぜられ、表層スコアから減じられる。これにより 1000 - 1 *100 = 900 という計算が行われ、 「900,INPUT=Where(インターの次のサービスエリア) An
s=大津SA」 という解析結果候補がこの入力候補に対して得られ、候
補解析結果集合に最初の候補として追加され(S6)、次
の候補取り出しに戻る(S1)。
【0038】次に、入力候補 975 どの入口から出るの が取り出される(S2)。次に、この入力候補の表層スコ
アが、候補解析結果集合に照らし合わせて解析する意義
があるかどうかを判断しようとするが(S3)、表層スコ
ア(975 )が候補解析結果集合中のスコアの最大値(90
0 )よりも大きいためスキップされない。このため、こ
の入力候補に対し第5図に示すようなペナルティ予測ル
ールが適用可能である(S4)。そこで、ペナルティ予測
(S7)を行い、この候補は意味的におかしな文のためペ
ナルティ予測ルールが発火してペナルティ予測値4 がつ
く。これにより 975 - 4 *100 = 500 という計算が行われ(S8)、この予測集合が候補解析結
果集合に照らし合わせて解析する意義がないと判断でき
るため(S9)、この候補の意味解析はスキップされる。
【0039】次に、入力候補 950 吹田インターの次のサービスエリアはどこ が取り出される(S2)。この入力候補はS3でもS4でもス
キップされず、意味解析が行われるが、意味解析におい
ても(S5)入力文に曖昧性がないためペナルティルール
が発火せず、表層スコアである950 がそのまま解析結果
スコアとなる。結果として、 「950,INPUT=Where(吹田インターの次のサービスエリ
ア) Ans=吹田SA」 という解析結果候補がこの入力候補に対して得られ、候
補解析結果集合にそれまでの最高スコアの候補として追
加され(S6)、次の候補取り出しに戻る(S1)。
【0040】次に、入力候補 600 吹田サービスエリアはどこ が取り出される(S2)。しかし、この入力候補は表層ス
コアが低く、候補解析結果集合にそれまでの最高スコア
の候補として記録されている 「950,INPUT=Where(吹田インターの次のサービスエリ
ア) Ans=吹田SA」 という解析結果候補を超えないことが明らかなため、S4
で以降の入力候補の意味解析がスキップされる。この例
の場合はこの入力候補が最後の候補であるため、一つの
候補の解析時間のみが短縮されたが、実際にはより多く
の候補があるため、一般にこのような見込みのない候補
群の意味解析処理を打ち切ることの効果は大きい。かく
して、本情報解析処理は終了し(S10 )、候補解析結果
集合 950,INPUT=Where(吹田インターの次のサービスエリア)
Ans=吹田SA 900,INPUT=Where(インターの次のサービスエリア) Ans=
大津SA が得られ、次の問題解決処理に送付される。
【0041】本実施例のような利用者と計算機が対話的
にインタラクションを行うシステムにおいて、問題解決
処理では一般に与えられた入力意図表現に基づいて応答
を生成し出力することになるが、利用者に対する出力は
確定的である必要がある。このため一般に問題解決処理
の段階では、入力意図として複数候補からなる集合を与
えられたとしても、例えば再尤候補が入力されたとし
て、入力を確定的なものとして扱う必要がある。このた
め、問題解決処理では前記与えられた候補解析結果集合
から再尤の候補 950,INPUT=Where( 吹田インターの次のサービスエリア)
Ans=吹田SA を入力とし、応答を生成することになる。かくして、構
文解析といった表層的な解析処理では正すことができな
かった音声認識といった認識処理において不可避な誤り
を、意味解釈の過程でこの場合は「より確定的な表現を
選好する」という基準に基づいた再スコアリングを施す
ことで正すことができた。また、候補解析の過程で再尤
候補となる見込みのない候補群の意味解析を行わないよ
う制御することで、意味解析処理全体の速度を向上させ
ることができた。
【0042】かくしてこのように構成された情報解析装
置、方法、及びプログラムによれば、表層的な解析処理
を行った後の各候補の意味的な解析処理において、解析
時におけるペナルティスコアを算出する手段、及び表層
的な解析処理のスコアと前記ペナルティスコアを勘案し
て各候補を再スコアリングし、その結果に基づいて候補
順位を制御する手段を設けることで、意味解析処理過程
での選好を反映したより利用者の実際の入力を候補とし
て受け付けやすい候補選択が可能となる。また、本発明
によれば、表層的な解析処理を行った後の各候補の意味
的な解析処理において、意味解析前の候補の表層的な解
析処理段階のスコアと意味解析時におけるペナルティス
コアの予測値の少なくとも一方を、意味解析を既に終了
した候補集合の再スコアリングされた各スコアを用いて
意味解析が必要かどうかを評価し、意味解析をしても再
尤候補となる見込みのない候補の意味解析を行わないこ
とで、高速に複数候補の意味解析処理が可能となる。
【0043】尚、上述の例では、入力候補集合が構文解
析された音声認識結果の形式で与えられているように記
述しているが、これらの与えられる入力候補集合につい
ては上述の実現形態に限定されるものではなく、例え
ば、構文解析後に表層的に変換された意図表現の集合と
して与えられることも可能であり、また、構文解析後の
文字認識結果であっても構わない。すなわち、本発明
は、入力に対して認識処理を含む表層的な解析処理を行
った結果として得られる候補集合の各候補の意味的な解
析処理に関するものであり、そのような機能もしくは処
理を持つ装置、方法、及びプログラムにおいて、本発明
の実現形態には上述の例に対して種々の変形が可能であ
り、それらも趣旨に反しない限り本発明の実施形態の範
囲内である。
【0044】
【発明の効果】以上説明したように、本発明によれば、
認識処理を伴う入力を理解し、その入力に対して応答す
るような情報解析装置、方式及びプログラムを記憶した
媒体において、表層的な解析処理を行った後の各候補の
意味的な解析処理において、解析時におけるペナルティ
スコアを算出する手段、及び表層的な解析処理のスコア
と前記ペナルティスコアを勘案して各候補を再スコアリ
ングし、その結果に基づいて候補順位を制御する手段を
設けることで、意味解析処理過程での選好を反映したよ
り利用者の実際の入力を候補として受け付けやすい候補
選択ができる、表層的な解析処理を行った後の各候補の
意味的な解析処理において、意味解析前の候補の表層的
な解析処理段階のスコアと意味解析時におけるペナルテ
ィスコアの予測値の少なくとも一方を、意味解析を既に
終了した候補集合の再スコアリングされた各スコアを用
いて意味解析が必要かどうかを評価し、意味解析をして
も再尤候補となる見込みのない候補の意味解析を行わな
いことで、高速に複数候補の意味解析処理がが可能とな
る、等の実用上多大な効果が奏せられる。
【図面の簡単な説明】
【図1】本発明の情報解析装置の構成図である。
【図2】本発明の情報解析装置の全体的な処理の流れを
示すフローチャートである。
【図3】本発明の情報解析装置に用いられる情報解析プ
ログラムの構成図である。
【図4】ペナル本発明の情報解析装置に用いられるティ
ルールの例を示す図である。
【図5】ペナルティ予測ルールの例図である。
【符号の説明】
1 情報解析装置 2 マイク 3 音声認識装置 4 構文解析装置 5 問題解決装置 10 解析制御部 11 入力候補取り出し部 12 入力候補解析部 13 ペナルティ算出部 14 ペナルティ予測部 15 入力候補集合 16 解析結果スコア算出部 17 候補解析結果集合
───────────────────────────────────────────────────── フロントページの続き (72)発明者 笹島 宗彦 大阪府大阪市中央区本町4丁目2番12号 株式会社東芝関西支社内 Fターム(参考) 5B064 EA08 EA20 EA31 5B091 AA15 CA05 CA12 CB12 CD01 EA07 5D015 LL01 LL10

Claims (21)

    【特許請求の範囲】
  1. 【請求項1】 入力を受理して前段階の処理を施して入
    力内容候補と該前段階処理における該入力内容候補の確
    からしさである入力内容候補スコアの組からなる入力候
    補を少なくとも一つ以上含んだ順序付けられた集合であ
    る入力候補集合を出力する前段階処理装置に接続し、該
    入力候補集合に解析処理を施して順序付けられた解析結
    果集合を出力する情報解析装置において、該入力候補集
    合から所定の基準に従って解析対象の入力候補を順に取
    りだす入力候補取り出し手段と、前記入力候補取り出し
    手段で取り出された入力候補について解析処理を施し、
    その入力候補の解析結果である候補解析結果を導く入力
    候補解析手段と、該入力候補の解析時におけるペナルテ
    ィスコアを所定の方法により算出する解析ペナルティ算
    出手段と、該入力候補の前記入力内容候補スコアと前記
    ペナルティスコアに基づいて所定の方法により前記候補
    解析結果のスコアである解析結果スコアを算出する解析
    結果スコア算出手段と、前記入力候補解析手段により得
    られた候補解析結果を、該入力に対して既に解析の終了
    した候補解析結果を蓄える順序付けられた集合である候
    補解析結果集合に挿入する手段であり、前記候補解析結
    果の解析結果スコアに基づいて前記候補解析結果集合へ
    の挿入個所を決定する候補解析結果蓄積手段と、前記解
    析対象としている入力候補、及び候補解析結果集合のい
    ずれか一方が所定の条件に適合した際に、入力候補取り
    出しの停止を入力候補取り出し手段に指示すると共に、
    その時点での候補解析結果集合を基に解析結果集合を生
    成し出力する解析制御手段、を具備したことを特徴とす
    る情報解析装置。
  2. 【請求項2】 請求項1記載の情報解析装置の構成手段
    に加え、前記入力候補のペナルティスコアの予測値を候
    補解析以前に算出する解析ペナルティ予測手段、を具備
    することを特徴とする情報解析装置。
  3. 【請求項3】 前記解析制御手段には、前記入力候補集
    合から取り出された入力候補の入力内容候補スコアと前
    記候補解析結果集合に既に蓄積されている候補解析結果
    のうち最低尤度の解析結果スコアとが所定の関係を満足
    する場合、その時点で入力候補取り出しの停止を指示し
    て解析結果集合を生成する機能を備えることを特徴とす
    る請求項1又は2記載の情報解析装置。
  4. 【請求項4】 前記解析制御手段には、前記入力候補集
    合から取り出された入力候補の入力内容候補スコアと前
    記ペナルティスコア予測値、及び前記候補解析結果集合
    に既に蓄積されている候補解析結果のうち最低尤度の解
    析結果スコアとが所定の関係を満足する場合、その時点
    で入力候補取り出しの停止を指示して解析結果集合を生
    成する機能を備えることを特徴とする請求項2記載の情
    報解析装置。
  5. 【請求項5】 前記入力は音声入力であり、前記前段階
    処理装置は利用者からの音声入力を音声認識し、所定の
    文法に合致した認識単語系列を各入力内容候補とし、該
    情報解析装置は各入力内容候補である単語系列を意味解
    析・問題解決することで候補解析結果である意味解析・
    問題解決結果を得ると共にその解析時のペナルティスコ
    アで再順序付けを行い、順序付けられた入力音声の意味
    解析・問題解決結果集合である候補解析結果集合を生成
    し出力することを特徴とする請求項1又は2又は3又は
    4記載の情報解析装置。
  6. 【請求項6】 前記ペナルティスコアは前記入力候補解
    析時の計算コストであることを特徴とする請求項1又は
    2又は3又は4記載の情報解析装置。
  7. 【請求項7】 前記入力候補解析手段における入力候補
    解析過程において、前記入力候補の解釈に複数の候補で
    ある入力候補解釈候補が存在する場合、所定の基準に基
    づいて入力候補解釈候補を選択すると共に、前記解析ペ
    ナルティ算出手段ではその入力候補の前記ペナルティス
    コアに所定のペナルティを付加することを特徴とする請
    求項1又は2又は3又は4記載の情報解析装置。
  8. 【請求項8】 入力を受理して前段階の処理を施して入
    力内容候補と該前段階処理における該入力内容候補の確
    からしさである入力内容候補スコアの組からなる入力候
    補を少なくとも一つ以上含んだ順序付けられた集合であ
    る入力候補集合を出力する前段階処理の後段に位置し、
    該入力候補集合に解析処理を施して順序付けられた解析
    結果集合を出力する情報解析方法において、該入力候補
    集合から所定の基準に従って解析対象の入力候補を順に
    取りだす入力候補取り出しステップと、前記入力候補取
    り出しステップで取り出された入力候補について解析処
    理を施し、その入力候補の解析結果である候補解析結果
    を導く入力候補解析ステップと、該入力候補の解析時に
    おけるペナルティスコアを所定の方法により算出する解
    析ペナルティ算出ステップと、該入力候補の前記入力内
    容候補スコアと前記ペナルティスコアに基づいて所定の
    方法により前記候補解析結果のスコアである解析結果ス
    コアを算出する解析結果スコア算出ステップと、前記入
    力候補解析ステップにより得られた候補解析結果を、該
    入力に対して既に解析の終了した候補解析結果を蓄える
    順序付けられた集合である候補解析結果集合に挿入する
    ステップであり、前記候補解析結果の解析結果スコアに
    基づいて前記候補解析結果集合への挿入個所を決定する
    候補解析結果蓄積ステップと、前記解析対象としている
    入力候補、及び候補解析結果集合のいずれか一方が所定
    の条件に適合した際に、入力候補取り出しの停止を入力
    候補取り出しステップに指示すると共に、その時点での
    候補解析結果集合を基に解析結果集合を生成し出力する
    解析制御ステップ、を具備したことを特徴とする情報解
    析方法。
  9. 【請求項9】 請求項8記載の情報解析方法の構成ステ
    ップに加え、前記入力候補のペナルティスコアの予測値
    を候補解析以前に算出する解析ペナルティ予測ステッ
    プ、を具備することを特徴とする情報解析方法。
  10. 【請求項10】 前記解析制御ステップには、前記入力
    候補集合から取り出された入力候補の入力内容候補スコ
    アと前記候補解析結果集合に既に蓄積されている候補解
    析結果のうち最低尤度の解析結果スコアとが所定の関係
    を満足する場合、その時点で入力候補取り出しの停止を
    指示して解析結果集合を生成する機能を備えることを特
    徴とする請求項8又は9記載の情報解析方法。
  11. 【請求項11】 前記解析制御ステップには、前記入力
    候補集合から取り出された入力候補の入力内容候補スコ
    アと前記ペナルティスコア予測値、及び前記候補解析結
    果集合に既に蓄積されている候補解析結果のうち最低尤
    度の解析結果スコアとが所定の関係を満足する場合、そ
    の時点で入力候補取り出しの停止を指示して解析結果集
    合を生成する機能を備えることを特徴とする請求項9記
    載の情報解析方法。
  12. 【請求項12】 前記入力は音声入力であり、前記前段
    階処理は利用者からの音声入力を音声認識し、所定の文
    法に合致した認識単語系列を各入力内容候補とし、該情
    報解析方法は各入力内容候補である単語系列を意味解析
    ・問題解決することで候補解析結果である意味解析・問
    題解決結果を得ると共にその解析時のペナルティスコア
    で再順序付けを行い、順序付けられた入力音声の意味解
    析・問題解決結果集合である候補解析結果集合を生成し
    出力することを特徴とする請求項8又は9又は10又は
    11記載の情報解析方法。
  13. 【請求項13】 前記ペナルティスコアは前記入力候補
    解析時の計算コストであることを特徴とする請求項8又
    は9又は10又は11記載の情報解析方法。
  14. 【請求項14】 前記入力候補解析ステップにおける入
    力候補解析過程において、前記入力候補の解釈に複数の
    候補である入力候補解釈候補が存在する場合、所定の基
    準に基づいて入力候補解釈候補を選択すると共に、前記
    解析ペナルティ算出ステップではその入力候補の前記ペ
    ナルティスコアに所定のペナルティを付加することを特
    徴とする請求項8又は9又は10又は11記載の情報解
    析方法。
  15. 【請求項15】 コンピュータにて読み取り可能な記憶
    媒体に記憶され、コンピュータにて実行可能なプログラ
    ムであり、入力を受理して前段階の処理を施して入力内
    容候補と該前段階処理における該入力内容候補の確から
    しさである入力内容候補スコアの組からなる入力候補を
    少なくとも一つ以上含んだ順序付けられた集合である入
    力候補集合を出力する前段階処理の後段に位置し、該入
    力候補集合に解析処理を施して順序付けられた解析結果
    集合を出力するものとして機能させるプログラムにおい
    て、該入力候補集合から所定の基準に従って解析対象の
    入力候補を順に取りだす入力候補取り出しステップと、
    前記入力候補取り出しステップで取り出された入力候補
    について解析処理を施し、その入力候補の解析結果であ
    る候補解析結果を導く入力候補解析ステップと、該入力
    候補の解析時におけるペナルティスコアを所定の方法に
    より算出する解析ペナルティ算出ステップと、該入力候
    補の前記入力内容候補スコアと前記ペナルティスコアに
    基づいて所定の方法により前記候補解析結果のスコアで
    ある解析結果スコアを算出する解析結果スコア算出ステ
    ップと、前記入力候補解析ステップにより得られた候補
    解析結果を、該入力に対して既に解析の終了した候補解
    析結果を蓄える順序付けられた集合である候補解析結果
    集合に挿入するステップであり、前記候補解析結果の解
    析結果スコアに基づいて前記候補解析結果集合への挿入
    個所を決定する候補解析結果蓄積ステップと、前記解析
    対象としている入力候補、及び候補解析結果集合のいず
    れか一方が所定の条件に適合した際に、入力候補取り出
    しの停止を入力候補取り出しステップに指示すると共
    に、その時点での候補解析結果集合を基に解析結果集合
    を生成し出力する解析制御ステップ、を具備したことを
    特徴とするプログラムを記憶した媒体。
  16. 【請求項16】 請求項15記載の情報解析装置の構成
    ステップに加え、前記入力候補のペナルティスコアの予
    測値を候補解析以前に算出する解析ペナルティ予測ステ
    ップ、を具備することを特徴とするプログラムを記憶し
    た媒体。
  17. 【請求項17】 前記解析制御ステップには、前記入力
    候補集合から取り出された入力候補の入力内容候補スコ
    アと前記候補解析結果集合に既に蓄積されている候補解
    析結果のうち最低尤度の解析結果スコアとが所定の関係
    を満足する場合、その時点で入力候補取り出しの停止を
    指示して解析結果集合を生成する機能を備えることを特
    徴とする請求項15又は16記載のプログラムを記憶し
    た媒体。
  18. 【請求項18】 前記解析制御ステップには、前記入力
    候補集合から取り出された入力候補の入力内容候補スコ
    アと前記ペナルティスコア予測値、及び前記候補解析結
    果集合に既に蓄積されている候補解析結果のうち最低尤
    度の解析結果スコアとが所定の関係を満足する場合、そ
    の時点で入力候補取り出しの停止を指示して解析結果集
    合を生成する機能を備えることを特徴とする請求項16
    記載のプログラムを記憶した媒体。
  19. 【請求項19】 前記入力は音声入力であり、前記前段
    階処理は利用者からの音声入力を音声認識し、所定の文
    法に合致した認識単語系列を各入力内容候補とし、該情
    報解析方法は各入力内容候補である単語系列を意味解析
    ・問題解決することで候補解析結果である意味解析・問
    題解決結果を得ると共にその解析時のペナルティスコア
    で再順序付けを行い、順序付けられた入力音声の意味解
    析・問題解決結果集合である候補解析結果集合を生成し
    出力することを特徴とする請求項15又は16又は17
    又は18記載のプログラムを記憶した媒体。
  20. 【請求項20】 前記ペナルティスコアは前記入力候補
    解析時の計算コストであることを特徴とする請求項15
    又は16又は17又は18記載のプログラムを記憶した
    媒体。
  21. 【請求項21】 前記入力候補解析ステップにおける入
    力候補解析過程において、前記入力候補の解釈に複数の
    候補である入力候補解釈候補が存在する場合、所定の基
    準に基づいて入力候補解釈候補を選択すると共に、前記
    解析ペナルティ算出ステップではその入力候補の前記ペ
    ナルティスコアに所定のペナルティを付加することを特
    徴とする請求項15又は16又は17又は18記載のプ
    ログラムを記憶した媒体。
JP10251075A 1998-09-04 1998-09-04 情報解析装置、情報解析方法及び情報解析プログラムを記録した記録媒体 Pending JP2000082114A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10251075A JP2000082114A (ja) 1998-09-04 1998-09-04 情報解析装置、情報解析方法及び情報解析プログラムを記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10251075A JP2000082114A (ja) 1998-09-04 1998-09-04 情報解析装置、情報解析方法及び情報解析プログラムを記録した記録媒体

Publications (1)

Publication Number Publication Date
JP2000082114A true JP2000082114A (ja) 2000-03-21

Family

ID=17217271

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10251075A Pending JP2000082114A (ja) 1998-09-04 1998-09-04 情報解析装置、情報解析方法及び情報解析プログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JP2000082114A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005202165A (ja) * 2004-01-15 2005-07-28 Advanced Media Inc 音声認識システム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005202165A (ja) * 2004-01-15 2005-07-28 Advanced Media Inc 音声認識システム

Similar Documents

Publication Publication Date Title
JP4846336B2 (ja) 会話制御装置
JP4849663B2 (ja) 会話制御装置
JP4888996B2 (ja) 会話制御装置
JP4849662B2 (ja) 会話制御装置
EP1489598B1 (en) Speech recognition
US7805302B2 (en) Applying a structured language model to information extraction
JP3004883B2 (ja) 終話検出方法及び装置並びに連続音声認識方法及び装置
EP1422692A2 (en) Automatic insertion of non-verbalized punctuation in speech recognition
US20050182625A1 (en) Systems and methods for determining predictive models of discourse functions
JP2007114621A (ja) 会話制御装置
US10248649B2 (en) Natural language processing apparatus and a natural language processing method
JP2005275348A (ja) 音声認識方法、この方法を実施する装置、プログラムおよび記録媒体
JP2000082114A (ja) 情報解析装置、情報解析方法及び情報解析プログラムを記録した記録媒体
JP2005157602A (ja) 会話制御装置、会話制御方法並びにこれらのプログラム
KR100277690B1 (ko) 화행 정보를 이용한 음성 인식 방법
EP0987681B1 (en) Speech recognition method and apparatus
JP2000259176A (ja) 音声認識装置およびその記録媒体
JP4204043B2 (ja) ゲーム機、ゲームの実行方法、並びにプログラム
JP4204041B2 (ja) ゲーム機、ゲームの実行方法、並びにプログラム
JP2005122549A (ja) 会話制御装置及び会話制御方法
JPH10187185A (ja) 言語処理装置および方法
EP0469485B1 (en) Language processing system using an expanded LR parser
JP4223841B2 (ja) 音声対話システム及び方法
JP2005099604A (ja) 会話制御装置、会話制御方法、およびゲームシステム
JP2002341891A (ja) 音声認識装置および音声認識方法