JP3581044B2

JP3581044B2 - 音声対話処理方法、音声対話処理システムおよびプログラムを記憶した記憶媒体

Info

Publication number: JP3581044B2
Application number: JP14077399A
Authority: JP
Inventors: 宗彦笹島; 恭之河野; 武秀屋野
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 1999-05-20
Filing date: 1999-05-20
Publication date: 2004-10-27
Anticipated expiration: 2019-05-20
Also published as: JP2000330588A

Description

【０００１】
【発明の属する技術分野】
本発明は、ユーザから発せられた音声情報を認識し、認識した情報から上記音声情報に対する応答文を生成する音声対話処理方法、音声対話処理システムおよびプログラムを記憶した記憶媒体に関する。
【０００２】
【従来の技術】
高度化・多機能化された機械システムに対するヒューマンインタフェース性能を向上させるために、利用者（ユーザ）から発せられた音声情報に基づいて機械システムと対話する音声対話処理システムが研究・開発されている。
【０００３】
このような音声対話処理システムにおいては、ユーザの発話した音声による自然語文を機械システムに搭載された計算機（コンピュータ）により認識してその意味（意図）を解釈し、解釈した意味情報に対応する応答情報（応答文）を作成して上記ユーザに出力することにより、ユーザと機械システムとの対話をおこなっている。
【０００４】
コンピュータの音声認識処理においては、入力された自然言語文を構成する音声情報から当該自然言語文を構成する単語が検出され、コンピュータの構文解釈処理により、検出された単語集合から「文」として正しい候補が選択・抽出される。そして、コンピュータの意味解釈処理により、抽出された文候補に基づいて自然言語文の意味が解釈され、応答情報作成処理により、解釈された意味に対応する適切な応答文が作成・出力される。
【０００５】
ところで、上述した音声対話処理システムにおいては、ユーザから発せられた自然言語文を構成する音声情報を自動的に認識してその意図を解釈する必要がある。
【０００６】
従来では、助詞（例えば、「て」、「は」、「が」）等の付属語も自然言語文の意味解釈において重要な役割を果たす場合もあることを考慮して、助詞等の付属語を含む自然言語文をそのまま認識かつ解釈する方法があり、代表的な方法としてディクテーションが挙げられる。
【０００７】
【発明が解決しようとする課題】
しかしながら、上述した自然言語文を構成する付属語を含む全ての単語を認識・解釈する方法では、「は」、「が」等の助詞を認識語彙に含めているが、これらの助詞を構成する語は、名詞、動詞等の自立語の一部としても認識されるため、上記助詞を入力音声情報中の誤った位置で認識してしまう、いわゆる「湧き出し誤り」が多発する。
【０００８】
この多発した湧き出し誤りにより、構文解釈処理において選択抽出される文候補は爆発的に増大するため、音声対話処理システムの処理時間を非常に増大させ、音声対話処理システムの実用性を阻害している。
【０００９】
また、上記自然言語文を構成する全ての単語（付属語を含む）を認識・解釈する方法では、非常に短い語である助詞を認識しなければならないため、例えば、上記音声対話処理システムを、周囲にノイズが存在する実環境下で適用した場合においては、上記ノイズの影響で助詞の認識を一層困難にしている。
【００１０】
例えば、音声対話処理システムをカーナビゲーションシステムに適用した場合（以下、音声対話型カーナビゲーションシステムと記載する）では、車体の走行ノイズ、オーディオノイズおよび車外の風の音等の様々なノイズにより、ユーザ（ドライバ）から発せられた音声情報（自然言語文）から助詞を認識することは、非常に困難である。
【００１１】
一方、助詞の認識に基づく文法的な制約条件を利用して、助詞を含む文の認識を高速化する手法も考え出されているが、実環境下（例えば、音声対話型カーナビゲーションシステムにおける車両運転中等）において、ユーザが文法的に正確な文を発声することを望むことは難しく、さらに、文法的な誤りに加えて、例えば、「えーと」等の不要語や言いよどみ、どもり、言い直し等も発生するため、上記文法的や制約条件に基づく方法でも、自然言語文を構成する全ての単語を正確に認識することは困難である。
【００１２】
そこで、上述した自然言語文を構成する付属語を含む全ての単語を認識・解釈する方法において生じた問題点を解決するために、入力された自然言語文を構成する音声情報から、助詞等の付属語、不要語等を除く自立語等のキーワード（自由な発声を理解して意味表現を得るために必要な予め定めた特定の単語）のみを認識し、認識したキーワードの時系列（キーワード系列）のみから上記自然言語文の意味を解釈する方法も提案されている。
【００１３】
しかしながら、このキーワードに基づく認識・解釈方法では、「コーラ２つ」、「チーズバーガーいらない」等の少数のキーワードから構成された単純な自然言語文には適しているが、例えば、「吹田サービスエリアの次の駐車場付きのレストランは？」等のように、単語数（キーワード数）が多い複雑な文に対して、このキーワードに基づく認識・解釈方法を適用した場合では、キーワード系列「吹田サービスエリア次駐車場付きレストラン」となり、キーワード間の係り受け関係を特定することが難しくなる。
【００１４】
すなわち、上記キーワード系列は、例えば「吹田サービスエリアは、次の駐車場付きのレストランですか？」という確認の意味と、「吹田サービスエリアの次にある駐車場付きのレストランは何ですか」という質問の意味との２通りに解釈できるため、コンピュータの意味解釈処理において一義的に解釈することができなかった。
【００１５】
この結果、単語数の多い複雑な自然言語文を音声情報として、上述したキーワードに基づく認識・解釈方法を適用した音声対話処理システムに入力しても応答文を作成して出力することができない場合があり、音声対話処理システムの実用性を低下させる要因となっている。
【００１６】
本発明は上述した事情に鑑みてなされたもので、助詞等の付属語の欠落や誤認識が多発する実環境下においても、入力された音声情報に係る自然言語文の意味を実時間で一義的に解釈処理して応答文を作成可能な音声対話処理システムおよび音声対話処理方法を提供することをその目的とする。
【００１７】
【課題を解決するための手段】
上述した目的を達成するための請求項１に係る発明によれば、音声情報を認識処理して得られたデータを意味解釈して応答文を生成し、生成した応答文を出力する音声対話処理システムにおいて、前記音声情報を入力する音声情報入力手段と、入力された音声情報を認識処理して前記音声情報に含まれる自立語の候補を互いの順序関係を有する単語系列として抽出する抽出手段と、受理可能な文型を複数の品詞の系列パターンとして記憶する品詞系列パターン記憶手段と、抽出された単語系列を前記複数の品詞系列パターンと照合することにより、少なくとも１つの品詞系列パターンに対応する単語系列を前記音声情報に対応する文候補列として求める手段と、求められた文候補列に対して付属語を補完することにより前記意味解釈用の自然言語文構造のデータを生成する自然言語文構造データ生成手段とを備え、この自然言語文構造データ生成手段は、求められた文候補列に対して、互いに自然言語文構造が異なる複数の自然言語文構造データを生成する手段と、生成された複数の自然言語文構造データの中から意味的に尤らしい１つの自然言語文構造データを所定の判断情報に基づいて選択し、選択した自然言語文構造データの意味解釈を知識ベースを参照して選択意味解釈手段で行う意味解釈手段とを含むものである。
【００１８】
請求項２に係る音声対話処理システムでは、前記意味解釈手段における所定の判断情報は、複数の自然言語文構造データの選択処理を行う直前に音声出力された応答音声情報、あるいは、カーナビゲーションシステムからの自車両の現在走行位置情報であることを特徴とするものである。
【００１９】
請求項３に係る音声対話処理システムでは、前記自然言語文構造データ生成手段は、前記複数の品詞系列パターンそれぞれの少なくとも１つの品詞に係る付属語を予め記憶する付属語記憶手段と、前記文候補列の品詞系列パターンに対応する付属語を前記付属語記憶手段から読み出して前記少なくとも１つの品詞に補完して前記自然言語文構造データを生成する手段とを備えている。
【００２０】
請求項４に係る音声対話処理システムでは、知識ベースを有し、この知識ベースを参照しながら前記自然言語文構造データの意味解釈を行う意味解釈手段と、意味解釈内容に基づいて前記音声情報に対する応答文データを生成する応答文データ生成手段と、生成された応答文データを音声情報として出力する音声情報出力手段とを備えている。
【００２１】
請求項５に係る音声対話処理システムでは、前記応答文データ生成手段は、前記意味解釈内容に加えて、前記自然言語文構造データ生成手段により生成された自然言語文構造データを含む応答文データを生成する手段である。
【００２３】
また、上述した目的を達成するための請求項６に係る発明によれば、音声情報を認識処理して得られたデータを意味解釈して応答文を生成し、生成した応答文を出力する音声対話処理方法において、前記音声情報を入力するステップと、この入力ステップにより入力された音声情報を認識処理して前記音声情報に含まれる自立語の候補を互いの順序関係を有する単語系列として抽出するステップと、受理可能な文型を複数の品詞の系列パターンとして記憶するステップと、前記抽出ステップにより抽出された単語系列を前記複数の品詞系列パターンと照合することにより、少なくとも１つの品詞系列パターンに対応する単語系列を前記音声情報に対応する文候補列として求めるステップと、このステップにより求められた文候補列に対して付属語を補完することにより前記意味解釈用の自然言語文構造のデータを生成するステップとを備え、この自然言語文構造データ生成ステップは、求められた文候補列に対して、互いに自然言語文構造が異なる複数の自然言語文構造データを生成するステップと、生成された複数の自然言語文構造データの中から意味的に尤らしい１つの自然言語文データを所定の判断情報に基づいて選択し、選択した自然言語文構造データの意味解釈を知識ベースを参照して選択意味解釈手段で選択意味解釈手段で行うステップとを有する方法である。
【００２４】
そして、上述した目的を達成するための請求項７に係る発明によれば、入力された音声情報を認識処理して得られたデータを意味解釈して応答文を生成し、生成した応答文を出力するためのコンピュータが読取り可能なプログラムを記憶した記憶媒体において、前記プログラムは、前記入力された音声情報をコンピュータに認識処理させて前記音声情報に含まれる自立語の候補を互いの順序関係を有する単語系列として抽出させる手段と、受理可能な文型を複数の品詞の系列パターンとして前記コンピュータにメモリに記憶させる手段と、抽出された単語系列を前記コンピュータにより前記複数の品詞系列パターンと照合させることにより、少なくとも１つの品詞系列パターンに対応する単語系列を前記音声情報に対応する文候補列として前記コンピュータに求めさせる手段と、求めた文候補列に対して付属語を前記コンピュータに補完させることにより前記意味解釈用の自然言語文構造のデータを生成させる手段とを備え、この自然言語文構造データ生成手段は、求められた文候補列に対して、互いに自然言語文構造が異なる複数の自然言語文構造データをコンピュータに生成させる手段と、生成された複数の自然言語文構造データの中から意味的に尤らしい１つの自然言語文データを所定の判断情報に基づいて選択し、選択した自然言語文構造データの意味解釈を知識ベースを参照してコンピュータに行わせる手段とを有するものである。
【００２５】
【発明の実施の形態】
本発明に係る音声対話処理方法、音声対話処理システムおよびプログラムを記憶した記憶媒体の実施形態について図面を参照して説明する。なお、本実施形態では、説明をより具体的にするため、本実施形態に係る音声対話システムを所定の車両に搭載されたカーナビゲーションシステムに適用した音声対話型カーナビゲーションシステムについて説明する。
【００２６】
図１は、本実施の形態に係る音声対話処理システムの概略構成を示すブロック図である。
【００２７】
図１によれば、音声対話処理システム１は、ユーザから発せられた自然言語文を構成する音声情報（音声波信号）をマイクロホン等を介して入力し、入力した音声信号をデジタルデータに変換する音声入力部２と、変換された音声データに基づいて音声対話処理を実行するＣＰＵ３とを備えている。
【００２８】
ＣＰＵ３は、上記音声対話処理として、音声データに基づいて入力音声情報の候補となる単語が格子状に組み合わされた単語ラティスを例えばワードスポッティング法を用いて生成し、生成した単語ラティスに基づいて所定のキーワード系列を上記音声情報（自然言語文）に対応する文候補として求め、求めたキーワード系列の意味を解釈して応答音声データを作成するようになっている。
【００２９】
また、音声対話処理システム１は、ＣＰＵ３の上記音声対話処理用のプログラムＰ、音声対話処理に必要なファイル群Ｆ１〜Ｆ８および知識ベースＤを有するメモリ４と、ＣＰＵ３により作成された応答音声データを応答音声情報（音声波形信号）に変換し、スピーカ等を介してユーザに出力する音声出力部５とを備えている。
【００３０】
メモリ４に記憶されたファイルＦ１は、“品詞辞書”（データ）を格納するための品詞辞書ファイルＦ１であり、また、ファイルＦ２は、“文型辞書”（データ）を格納するための文型辞書ファイルＦ２である。
【００３１】
図２は、本実施形態における品詞辞書ファイルＦ１に格納された“品詞辞書”の一例を示す図である。
【００３２】
図２に示す“品詞辞書”によれば、“品詞”、すなわち、“入力要素カテゴリ”については角丸長方形枠で囲んで示し、“単語”、すなわち、“入力要素”については長方形枠で囲んで示す。例えば、“品詞「場所」”は“「現在地」、「施設」、「目的地」、「経由地」”といった“子品詞”から構成され、“品詞「経由地」”は子品詞「出口・入口」と共に単語「インター」及び「インターチェンジ」を要素として有している。
【００３３】
本実施形態では、このような形で入力された単語ラティスに対する解釈の基盤となる単語とその品詞構造の辞書を有している。
【００３４】
図３は、本実施形態で受理可能な単語系列（キーワード系列）である「文」の形を定義するために文型辞書ファイルＦ２に格納された“文型辞書”の一例を示す図である。
【００３５】
【外１】

【００３６】
これらの文型において、“（”と“）”とで括られた最も小さい固まり、例えば“（場所）”や“（経由地名）”等、が一つの単語に対応する品詞となる。そして、それらの系列の連接が“−（ハイフン）”で表され、「ＡかＢかＣのうちの何れかの選択」は“（Ａ｜Β｜Ｃ｜）”と記述される。また、“［”と“］”とで囲まれた区間は高々一回、すなわち、０回または１回だけ“［”と“］”で囲まれた区間が現れることを意味する。
【００３７】
【外２】

【００３８】
ＣＰＵ３は、音声対話処理システム１の起動時において、メモリ４に記憶された文型辞書ファイルＦ２を展開することにより、図４に示す“品詞系列パターン辞書”を作成し、作成した“品詞系列パターン辞書”をメモリ４上の品詞系列パターン辞書ファイルＦ３に格納するようになっている。
【００３９】
すなわち、図４によれば、図３の文型“ｇ１”は、“ｓｐ０１−ｇ１”から“ｓｐ１８−ｇ１”までの１８個の品詞系列パターンに展開することができ、文型“ｇ２”は、“ｓｐ０１−ｇ２”から“ｓｐ０４−ｇ２”までの４個の品詞系列パターンに展開することができる。
【００４０】
この“ｓｐ０１−ｇ１”から“ｓｐ１８−ｇ１”と“ｓｐ０１−ｇ２”から“ｓｐ０４−ｇ２”に示すような各品詞系列パターンに付与された記号を、当該各品詞系列パターンを識別するための識別番号を表す“品詞系列ＩＤ”と呼ぶ。
【００４１】
【外３】

【００４２】
また、ＣＰＵ３は、生成した“品詞系列パターン辞書”を品詞系列パターン辞書ファイルＦ３に格納するとともに、生成した“品詞系列パターン辞書”の内容に基づいて、各品詞の各品詞系列パターンにおける出現箇所（出現順序）と当該品詞とを用いて“品詞系列ハッシュ辞書”を生成してメモリ４上の品詞系列ハッシュ辞書ファイルＦ４に格納するようになっている。
【００４３】
図５は、品詞系列ハッシュ辞書ファイルＦ４に格納された“品詞系列ハッシュ辞書”の一例を示す図である。
【００４４】
図５（ａ）〜図５（ｅ）に示すように、“品詞系列ハッシュ辞書”は、単語出現番号“１”から、あり得る品詞系列パターンの最長“ｎ”（本実施形態では“５”）までの各“出現順位の表”と、各単語系列パターンの末尾からの“ハッシュ表”とから構成される。
【００４５】
例えば、図５（ａ）に示す“単語出現番号１”の“ハッシュ表”を見れば、本実施形態の文型辞書において品詞項目“品詞（地名）”が文頭に現れる単語系列のパターンとしては、“品詞系列ΙＤ”が“ｓｐ０１−ｇ２”と“ｓｐ０２−ｇ２”の２種類しかないことがわかる。
【００４６】
一方、メモリ４上のノード要素データファイルＦ５は、単語ラティスを構成する各単語（以下、ノードとする）に対する複数のデータ要素を各ノード毎にそれぞれ格納するためのファイルである。
【００４７】
ここで、ノード要素データファイルＦ５に格納される各ノードのノード要素データを具体的に説明するため、音声データからのワードスポッティング法を用いて得られた結果を図６に示す簡単なものとし、そのワードスポッティング結果に基づく単語ラティスが図７に示すものであるとする。
【００４８】
このとき、ノード要素データファイルＦ５の各ノードに対応する格納領域には、図８に示すノード要素データが格納される。
【００４９】
すなわち、図８に示すように、ノード要素データは、“ノード１Ｄ”、“所属品詞”、“前ノードリスト”、“次ノードリスト”、“未処理前ノードリスト”、“解析途中経過リスト”、“入力要素１ｄ：単語表象”の７個である。
【００５０】
ここで、単語ラティスのノードの第１の要素データは、ノードの識別子である“ノードＩＤ”であり、図７で各ノードに示されているように、「入力要素ΙＤ：単語表象」の形式で記述される。
【００５１】
第２の要素データは、そのノード（単語）の“所属品詞”である。
【００５２】
第３の要素データは、そのノードの前に接続する可能性のあるノードの集合を表す“前ノードリスト”である。
【００５３】
第４の要素データは、そのノードの後ろに接続する可能性のあるノードの集合を表す“次ノードリスト”である。
【００５４】
第５の要素データは、前ノードリストの要素中解析処理が終了していないノードの集合を表す“未処理前ノードリスト”であり、このリストの内容が空にならない限りそのノードの解析を行ってはならないことを示す。
【００５５】
第６の要素データは、そのノードが表象する単語が受理される単語系列の要素であるならば、どの品詞系列パターンがその単語系列のテンプレートとしてあり得るかを要素として持つ“解析途中経過リスト”である。解析途中経過リストは、そのノードが受理可能単語系列の何番目に現れるかの数値と、その順序でそのノードが表象する単語が現れたときに考えられる品詞系列ＩＤのリストとの組のリストで表現される。
【００５６】
例えば、図７に示す単語ラティスを例にとると、当該単語ラティスのノード“「０７：今」”については“（「今」…）”という具合に、単語系列の最初に現れる場合と、“（「道」、「今」、…）”という具合に、２番目に現れる場合とが考えられる。
【００５７】
このような場合、“解析途中経過リスト”として、“［（１、１…１）、（２、−…］］”と云う具合に、この単語が１番目に現れた場合に取り得る品詞系列パターンのリストと２番目に現れた場合に取り得る品詞系列パターンのそれとがそれぞれ分けて格納される。
【００５８】
また、ファイルＦ６は、現在処理対象とし得る単語ラティスの上のノードのリストを格納するファイル（処理中ノードリストファイル）であり、また、ファイルＦ７は、単語ラティスで受理可能な“品詞系列ＩＤ”を格納するためのファイル（品詞系列候補リストファイル）である。
【００５９】
そして、本実施形態では、図４に示す各キーワード系列の意味を一義的に定めるために、当該キーワード系列毎に、そのキーワード系列に対して補完される助詞等の付属語およびその補完位置を表す情報（以下、付属語補完情報ともいう）が予めメモリ４に設置された付属語補完ファイルＦ８に格納されている。
【００６０】
すなわち、図９に示すように、付属語補完ファイルＦ８には、品詞系列ＩＤ“ｓｐ０８−ｇ１”の品詞系列に対しては、キーワード「疑問詞：どれくらい」に係る付属語として、助動詞「ですか」が補完されることを表す情報が格納されている。
【００６１】
なお、キーワード「経由地名」と「経由地」との間、キーワード「経由地」と「道程」との間、およびキーワード「疑問詞：どれくらい」との間には、「φ」という情報が格納されている。この「φ」は、キーワード間において付属語が必要ないことを表す情報である。
【００６２】
そして、品詞系列ＩＤ“ｓｐ０ｘ−ｇｙ”の品詞系列に対しては、キーワード（経由地）に係る付属語、キーワード（形容詞）に係る付属語、およびキーワード（条件）の付属語として、それぞれ助詞「の」が補完されることを表す情報が格納されており、また、キーワード「場所：施設」に係る付属語として、助詞「は」が補完されることを表す情報が格納されている。
【００６３】
さらに、メモリ４に記憶された知識ベースＤには、文候補となるキーワード系列が問題の解決を要求する意図（意味内容）であるとされた場合に、その問題の解決処理に必要な専門的知識（例えば、カーナビゲーションシステムでは、地図情報等）が体系化され、かつコンピュータ処理に適した形式で蓄積されている。
【００６４】
続いて、本実施形態の全体処理動作について、特に、ＣＰＵ３の音声対話処理を中心に詳細に説明する。
【００６５】
今、図６に示すように、ユーザが「西宮インターチェンジまでどのくらいですか」という音声情報を発したとする。
【００６６】
このとき、ユーザから発せられた音声情報は音声入力部２により音声データに変換されてＣＰＵ３に送られる。
【００６７】
ＣＰＵ３に対して音声入力部２から送信された音声データが入力されると、音声対話処理プログラムＰを読み出し、読み出した音声対話処理プログラムＰに従って、最初に公知のワードスポッティング法を用いた音声認識処理Ｓ１を実行して、上記音声情報の候補となる単語（キーワード）が格子状に組み合わされた単語ラティスを生成する。
【００６８】
次いで、ＣＰＵ１３は、メモリ４上の品詞辞書ファイルＦ１、品詞系列パターン辞書ファイルＦ３、および品詞系列ハッシュ辞書ファイルＦ４およびノード要素データファイルＦ５を参照しながら構文解析処理Ｓ２を行うことにより、所定のキーワード系列を上記音声情報（自然言語文）に対応する文候補として求める。
【００６９】
以下、この構文解析処理Ｓ２について詳細に説明する。
【００７０】
すなわち、ＣＰＵ３は、ノード要素データファイルＦ５を参照して、音声認識処理により生成された単語ラティスの全ノードについて、前ノードリストの内容を未処理前ノードリストにコピーし（図１０；ステップＳ１０）、単語ラティスの開始ノードに接続している、すなわちキーワード系列の先頭になり得る単語を表象するノードを処理中ノードリストファイルＦ６に格納する（ステップＳ１１）。
【００７１】
次いで、ＣＰＵ３は、ステップＳ１１の処理により処理中ノードリストファイルＦ６に格納した各ノードの解析途中経過リストの初期値を設定し（ステップＳ１２）、処理中ノードリストファイルＦ６に格納した各ノードのノード要素データファイルＦ６における未処理前ノードリストから開始ノードを削除する（ステップＳ１３）。
【００７２】
【外４】

【００７３】
ステップＳ１０〜ステップＳ１３の処理が終了すると、ＣＰＵ３は、処理中ノードリストファイルＦ６が空、すなわち、単語ラティスにおける処理中ノードがなくなったか否か判断する（ステップＳ１４）。
【００７４】
今、図７に示すように処理中ノードファイルＦ６は空ではないため（ステップＳ１４→ＮＯ）、ＣＰＵ３は、処理中ノードリストファイルＦ６からノードを１つ（例えば、ノードＭ「０７：今」）を取り出す（ステップＳ１５）。
【００７５】
次いでＣＰＵ３は、ノード要素データファイルＦ５を参照して、取り出したノード「０７：今」の未処理前ノードリストは空であるか否か判断する（ステップＳ１６）。
【００７６】
今、ノード「０７：今」の“未処理前ノードリスト”は空でないため、ステップＳ１６の判断はＮＯとなり、ステップＳ１４の処理に戻る。そして、再び、ステップＳ１５で別のノード「０１：道」が処理中ノードリストファイルＦ６から取り出される。
【００７７】
このノード「０１：道」のノード要素データファイルＦ５における“未処理前ノードリスト”は空のため（ステップＳ１６→ＹＥＳ）、ＣＰＵ３は、後続のノード「０７：今」と「１５：インターチェンジ」に対して、上記ノード「０１：道」の“解析途中経過リスト”の内容を伝播する（ステップＳ１７）。
【００７８】
ただし、上述したように、ノード「０１：道」の“解析途中経過リスト”は空であるため（ステップＳ１８→ＹＥＳ）、ノード「０７：今」とノード「ｌ５：インターチェンジ」の“解析途中経過リスドの内容は変化しない。
【００７９】
そして、ＣＰＵ３は、ノード要素データファイルＦ５を参照して、ノード「０７：今」およびノード「ｌ５：インターチェンジ」の“未処理前ノードリスト”からそれぞれノード「０１：道」を削除する（ステップＳ１９）。
【００８０】
【外５】

【００８１】
次にステップＳ１５で、再び、ノード「０７：今」が処理中ノードリストファイルＦ６から取り出されるが、ノード「０７：今」の“未処理前ノードリスト”は空となったため、今回は伝播が可能となる（ステップＳ１６、Ｓ１７参照）。
【００８２】
しかしながら、このノード「０７：今」の“解析途中経過リスト”も事実上、“空”、すなわち、このノードを経由して受理可能な品詞系列はないため（ステップＳ１８→ＹＥＳ）、このノードの後ろに接続する各ノード「１４：インター、１８：今、２０：まで、１５：インターチェンジ」の“解析途中経過リスト”の内容は変化せず、これらのノードの“未処理前ノードリスト”からノード「０７：今」が削除されるのみである（ステップＳ１９参照）。
【００８３】
【外６】

【００８４】
次にステップＳ１４の処理に移行するが、上述したように、処理中ノードリストＦ６は空ではないため、ステップＳ１５において、ＣＰＵ３により、処理中ノードリストファイルＦ６からノード「０３：西宮」が取り出される。このノード「０３：西宮」の“未処理前ノードリスト”は空のため（ステップＳ１６→ＹＥＳ）、“解析途中経過リスト”の内容の伝播が可能である（ステップＳ１７参照）。
【００８５】
【外７】

【００８６】
次いで、ＣＰＵ３は、品詞系列辞書ファイルＦ４を参照して、生成したリストと、後続するノードの対応する“品詞系列ハッシュ”の内容との積集合をとる（ステップＳ２１）。
【００８７】
【外８】

【００８８】
【外９】

【００８９】
次に、ステップＳ１４→ＮＯであるため、ステップＳ１５でノード「１５：インターチェンジ」が処理中ノードリストファイルＦ６から取り出される。このノード「１５：インターチェンジ」の“未処理前ノードリスト”は空のため、“解析途中経過リスト”の内容の伝播が可能である（ステップＳ１６、Ｓ１７参照）。
【００９０】
【外１０】

【００９１】
そして、ＣＰＵ３は、品詞系列辞書ファイルＦ４を参照して、生成したリストと、後続するノード「２０：まで」の対応する“品詞系列ハッシュ辞書”の内容との積集合をとる（ステップＳ２１参照）。
【００９２】
【外１１】

【００９３】
同様のサイクルがノード「１４：インター」からの伝播でも行われる。この伝播の際、ノード「１４：インター」からはノード「１８：今」に対しても接続可能ではあるが、ノード「１８：今」の対応する“品詞ハッシュ辞書”の項目がないため、上記積集合をとってもノード「１８：今」の“解析途中経過リスト”の内容は空のままである。
【００９４】
【外１２】

【００９５】
次に、ステップＳ１４→ＮＯであるため、ステップＳ１５の処理により、ノード「２０：まで」が処理中ノードリストファイルＦ１６から取り出される。このノード「２０：まで」の“未処理前ノードリスト”は空のため、“解析途中経過リスド”の内容の伝播が可能である（ステップＳ１６、ステップＳ１７参照）。
【００９６】
【外１３】

【００９７】
【外１４】

【００９８】
次に、「終了」ノードへの伝播に際しては、単語出現番号「ｅｎｄ」の“ハッシュ辞書項目”が参照される。この場合、品詞「道程」で終了する文型は登録されていないため、辞書参照は失敗し、終了ノードの解析途中経過リストの内容は更新されない。
【００９９】
【外１５】

【０１００】
次に、ステップＳ１４→ＮＯであるため、ステップＳ１５で、ノード「２４：どのくらい」が処理中ノードリストファイルＦ１５から取り出される。このノード「２４：どのくらい」の“未処理前ノードリスト”は空のため、“解析途中経過リスト”の内容の伝播が可能である（ステップＳ１６、Ｓ１７参照）。しかし、このノード「２４：どのくらい」に接続可能なノードは「終了」ノードのみなので、終了ノードに伝播させる。
【０１０１】
【外１６】

【０１０２】
また、処理中ノードリストファイルＦ６の内容が空になり（ステップＳ１４→ＹＥＳ）、ＣＰＵ３は、「終了」ノードの“解析途中経過リスト”の中の全ての品詞系列パターン（この場合、品詞系列ＩＤ“ｓｐ０８−ｇ１”）を、品詞系列候補リストファイルＦ７に格納する（ステップＳ２２）。
【０１０３】
そして、ＣＰＵ３は、上述したステップＳ１０〜ステップＳ２２の処理過程において単語ラティスの各ノードが所属し得る品詞系列（品詞系列ＩＤ）の集合がノード要素データファイルＦ５内の各ノードの“解析途中経過リスト”として残っているため、品詞系列候補リストファイルＦ７に格納された“品詞系列ＩＤ（ｓｐ０８−ｇ１）”を“解析途中経過リスト”のメンバとして有する単語系列を単語ラティスから探索することで、求める文候補としての“キーワード系列”を得ることができる（ステップＳ２３）。
【０１０４】
【外１７】

【０１０５】
同様に、例えば、ユーザから「吹田サービスエリアの次の、えーと、駐車場付きのレ、レストランは？」という音声情報が発せられた場合には、この音声情報が変換された音声データに基づいて、ＣＰＵ３のステップＳ１の処理により単語ラティスが生成され、ＣＰＵ３のステップＳ２（ステップＳ１０〜ステップＳ２３）の処理により、品詞系列パターン（品詞系列ＩＤ“ｓｐ０ｘ−ｇｙ”）のキーワード系列（「吹田」、「サービスエリア」、「次」、「駐車場付き」、「レストラン」）が生成される。
【０１０６】
このようにして、構文解析処理（ステップＳ２：ステップＳ１０〜ステップＳ２３）により、入力音声情報に対応する文候補としてのキーワード系列（以下、キーワード系列：「吹田」、「サービスエリア」、「次」、「駐車場付き」、「レストラン」の場合について説明する）が生成されると、ＣＰＵ３は、付属語補完ファイルＦ８を参照して付属語補完処理（ステップＳ３）を実行する。
【０１０７】
すなわち、ＣＰＵ３は、付属語補完ファイルＦ８を参照し（図１２；ステップＳ３０）補完される助詞等の付属語およびその補完位置を表す情報、生成したキーワード系列の品詞系列ＩＤ（“ｓｐ０ｘ−ｇｙ”）に対して補完される助詞等の付属語およびその補完位置を表す情報（付属語補完情報）を読み出し（ステップＳ３１）、読み出した付属語補完情報に基づいて、生成したキーワード系列（「吹田」、「サービスエリア」、「次」、「駐車場付き」、「レストラン」）における補完位置に対して助詞等の付属語を補完する（ステップＳ３２）。
【０１０８】
例えば、本実施形態では、「サービスエリア」と「次」との間、「次」と「駐車場付き」との間および「駐車場付き」と「レストラン」との間にそれぞれ付属語（助詞「の」）が補完され、「レストラン」の末尾に付属語（助詞「は」）が補完される。
【０１０９】
この結果、キーワード系列（「吹田」、「サービスエリア」、「次」、「駐車場付き」、「レストラン」）は、助詞等の付属語を有する自然言語文構造データ（「吹田サービスエリアの次の駐車場付きのレストランは？」という内容のテキストデータ）となる。
【０１１０】
このようにしてステップＳ３の付属語補完処理が終了すると、ＣＰＵ３は、知識ベースＤを参照してステップＳ４の意味解析・問題解決処理を実行する。
【０１１１】
すなわち、ＣＰＵ３は、ステップＳ３（ステップＳ３０〜ステップＳ３２）で生成された自然言語文構造データ（「吹田サービスエリアの次の駐車場付きのレストランは？」）の意味を解釈する（図１３；ステップＳ４０）。
【０１１２】
このとき、ＣＰＵ３は、解釈対象となるデータがキーワード系列ではなく、キーワード系列から生成された自然言語文構造データであるため、上記各キーワード（自立語）の格を用いた知的な意味解釈処理を行うことができ、上記自然文構造データ（「吹田サービスエリアの次の駐車場付きのレストランは？」の意味を容易、迅速かつ一義的に解釈することができる。
【０１１３】
すなわち、従来においては、上記キーワード系列（「吹田」、「サービスエリア」、「次」、「駐車場付き」、「レストラン」）だけでは、吹田サービスエリアは、次の駐車場付きのレストランですか？」という確認の意味と、「吹田サービスエリアの次にある駐車場付きのレストランは何ですか」という質問の意味とのどちらであるか一義的に解釈することができなかったが、本実施形態においては、ＣＰＵ３は、上記キーワード系列（「吹田」、「サービスエリア」、「次」、「駐車場付き」、「レストラン」）を後者の質問の意味に迅速かつ一義的に解釈することができる。
【０１１４】
次いで、ＣＰＵ３は、自然言語文構造データの意図を解釈した結果、この自然言語データの意図は問題解決要求、すなわち、「吹田サービスエリアの次の駐車場付きレストランに関する情報（名前、場所等）取得要求」であることを認識し、認識した問題解決要求を受けて、知識ベースＤを参照し、上記問題解決要求に応答する意図を表す応答文（自然言語文）のテキストデータ（例えば、「吹田サービスエリアの次にある駐車場付きのレストランは、○○○○にある△△△△です」というテキストデータ）を生成する（ステップＳ４１）。
【０１１５】
このようにしてステップＳ５（ステップＳ４０、ステップＳ４１）の応答文生成処理により応答文（テキストデータ）が生成されると、ＣＰＵ３は、生成された応答文に基づいてステップＳ６に示す音声合成処理を実行する。
【０１１６】
すなわち、ＣＰＵ３は、生成された応答文テキストデータを解析処理して発音記号列に変換し、この発音記号列に対して韻律制御処理を行って各音素の時間長およびイントネーション等の韻律制御情報を求め、発音記号列および韻律制御情報に基づいて音声合成処理を行うことにより、応答音声データを作成し、作成した応答文音声データを音声出力部５に送信する。
【０１１７】
音声出力部５では、送信されてきた応答音声データが応答音声情報（音声波形信号）に変換されスピーカ等を介してユーザに出力（システム発話）される。
【０１１８】
この結果、ユーザは、自ら発した音声情報（質問）に対応してシステム１から発話された応答音声情報を聞くことができる。すなわち、ユーザは、音声対話システム１と対話することができる。
【０１１９】
以上述べたように、本実施形態によれば、ユーザから発せられた音声情報の中から、「助詞」等の付属語、「えーと」等の不要語、言いよどみ、どもりおよび言い直し等の音声認識する上で困難な語を除く、自立語等のキーワードから構成されたキーワード系列を自動的に抽出し、抽出したキーワード系列に基づいて意味解釈処理を行って応答文を自動的に生成することができる。
【０１２０】
したがって、従来の音声対話処理システムにおいて必要であった、上記「助詞」等の付属語認識に伴う「湧き出し誤り」に起因した多数の単語ラティスを処理するための処理時間を大幅に削減することができ、音声対話処理システムの実用性を向上させることができる。
【０１２１】
また、上述したように、本実施形態の音声対話システムにおいては、助詞等の付属語や不要語等を認識することなくキーワード系列を抽出することができるため、実環境下でのノイズ等の影響を最小限度に抑制しながら上記応答情報に基づくキーワード系列を正確に認識することができる。
【０１２２】
特に、本実施形態では、キーワードの並び（キーワード系列）の状態において上記キーワード系列の意味解釈を行うのではなく、そのキーワード系列に対して助詞等の付属語を補完し、キーワード系列から構成された自然言語文として意味解釈処理を行うことができるため、従来において、キーワード系列だけではその意味が一義的に解釈できなかった場合でも、助詞等の付属語を補完して各キーワードの格、すなわち、各キーワードのキーワード系列中の他のキーワードに対する関係を定めることにより、キーワード系列の意味を迅速かつ一義的に解釈することができる。
【０１２３】
したがって、単語数の多い複雑な自然言語文を音声情報として音声対話処理システムに入力した場合でも、容易に応答文を作成して出力することができるため、音声対話処理システムの実用性をさらに向上させることができる。
【０１２４】
なお、本実施形態において、ＣＰＵ３は、応答文生成処理（ステップＳ５）のステップＳ４１の処理において、応答文として、上記付属語を補完した自然言語構造データ（テキストデータ）を含めることも可能である。この場合、ＣＰＵ３の音声合成処理（ステップＳ６）により、付属語を補完して生成したユーザからの音声情報に対応する入力音声情報を含む応答音声情報が音声出力部５を介してユーザに出力される。
【０１２５】
この結果、ユーザは、出力された入力音声情報を含む応答音声情報により、自ら発した音声情報を音声対話処理システム１がどのように解釈したのかを容易に把握することができ、万一、音声対話システム１がユーザの音声情報を誤解して解釈していた場合には、速やかに修正した音声情報入力動作を行うことができる。
【０１２６】
ところで、上述した本実施形態の付属語補完ファイルＦ８において、各キーワード系列には、それぞれ一義的な自然言語文構造をその各キーワード系列に与えるための単一の付属語補完情報が格納されている。
【０１２７】
例えば、品詞系列ＩＤ“ｓｐ０ｘ−ｇｙ”の品詞系列に対しては、一義的な自然言語文構造（吹田サービスエリアの次の駐車場付きのレストランは；以下、第１の自然文構造と記載する）を与えるための、キーワード（経由地）、キーワード（形容詞）およびキーワード（条件）それぞれの付属語として助詞「の」が、また、キーワード「場所：施設」に係る付属語として、助詞「は」がそれぞれ補完されることを表す単一の付属語補完情報が付属語補完ファイルＦ８に格納されている。
【０１２８】
しかしながら、本発明は上記構成に限定されるものではない。
【０１２９】
例えば、付属語補完ファイルＦ８に対して、複数の自然言語文構造を各キーワード系列にそれぞれ与えるための複数の付属語補完情報をキーワード系列毎に格納しておく。
【０１３０】
例えば、上述した品詞系列ＩＤ“ｓｐ０ｘ−ｇｙ”の品詞系列に対しては、上述した第１の自然言語文構造を与えるための付属語補完情報（以下、第１の付属語補完情報と記載する）に加えて、第１の自然言語文構造とは異なる自然言語文構造（吹田サービスエリアは次の駐車場付きレストランですか）を与えるための、キーワード（経由地）とキーワード（形容詞）との間の付属語として助詞「は」が、キーワード（形容詞）とキーワード（条件）との間の付属語として助詞「の」が、およびキーワード「場所：施設」に係る付属語として、助動詞・助詞「です・か」がそれぞれ補完されることを表す第２の付属語補完情報が付属語補完ファイルＦ８にそれぞれ格納されている。
【０１３１】
このとき、ＣＰＵ３は、上述したステップＳ３１の処理として、キーワード系列の品詞系列ＩＤ（“ｓｐ０ｘ−ｇｙ”）に対応する第１および第２の付属語補完情報をそれぞれ読み出し、ステップＳ３２の処理として、読み出した第１および第２の付属語補完情報に基づいて、生成したキーワード系列（「吹田」、「サービスエリア」、「次」、「駐車場付き」、「レストラン」）における補完位置に対して助詞等の付属語をそれぞれ補完することにより、第１の自然言語文構造データ（質問の意味を表す「吹田サービスエリアの次の駐車場付きのレストランは？」という内容を表すテキストデータ）および第２の自然言語文構造データ（確認の意味を表す「吹田サービスエリアは次の駐車場付きのレストランですか？」という内容を表すテキストデータ）をそれぞれ生成する。
【０１３２】
そして、ＣＰＵ３は、上述したステップＳ４０の処理として、上述したステップＳ３０〜ステップＳ３２で生成された第１の自然言語文構造データ（「吹田サービスエリアの次の駐車場付きのレストランは？」）および第２の自然言語文構造データ（「吹田サービスエリアは次の駐車場付きのレストランですか？」）の中から意味的に尤らしい１つの自然言語文構造データ（第１あるいは第２の自然言語文構造データ）を選択し、選択した第１あるいは第２の自然言語文構造データの意味を解釈するようになっている。
【０１３３】
例えば、ＣＰＵ３が上記自然言語文構造データ選択処理を行う直前に、上記意味解釈処理、応答文生成処理、音声合成処理および音声出力処理により音声出力部５を介して音声出力（システム発話）された応答音声情報が「次のレストランは吹田サービスエリアです」であった場合において、ＣＰＵ３は、所定の判断情報に基づいて、上記応答音声情報に対応する応答文テキストデータの内容に基づいて何れか一方の自然言語文構造データを選択する。
【０１３４】
例えば、ＣＰＵ３は、所定の判断情報として、自然言語文構造データ選択処理を行う直前に音声出力された応答音声情報の内容（応答文テキストデータの内容）を参照し、例えば、その応答音声情報として、第２の自然言語文構造データ（「吹田サービスエリアは次の駐車場付きのレストランですか？」）の解答となる応答音声情報「次のレストランは吹田サービスエリアです」が音声出力（システム発話）されている場合には、既にシステム発話されている応答音声情報に対応する自然言語文構造データに基づく音声情報をユーザが発話する可能性は低いと判断し、直前にシステム発話された応答音声情報に対応する第２の自然言語文構造データではなく、別のレストランの場所を質問するための第１の自然言語文構造データを選択し、選択した第１の自然言語文構造データの意味解釈処理を行うようになっている。
【０１３５】
また、例えば、ＣＰＵ３は、自然言語文構造データ選択処理を行う際に、図示しないカーナビゲーションシステムからの自車両の現在走行位置情報を上記所定の判断情報として参照し、例えば、現在の自車両の走行位置が吹田サービスエリアを既に通過している場合には、既に通過している場所に関する確認情報をユーザが発話する可能性は低いと判断し、現在走行位置から過去に関する情報を表す第２の自然言語文構造データではなく、現在走行位置から将来に関する情報を表す第１の自然言語文構造データを選択し、選択した第１の自然言語文構造データの意味解釈処理を行うようになっている。
【０１３６】
すなわち、本変形例によれば、生成したキーワード系列に対して付属語補完処理により一義的な自然言語文構造データを生成するのではなく、予め用意した複数の付属語補完情報に基づいて生成したキーワード系列に対応する複数の自然言語文構造データを生成し、生成した複数の自然言語文構造データの中から、例えば直前のシステム発話内容や現在走行位置情報等の所定の判断情報を参照することにより、現在の状況に即した意味的に尤らしい１つの自然言語文構造データを選択して意味解釈することができる。
【０１３７】
この結果、音声対話システム１がユーザの音声情報を誤解して解釈する可能性を減少させることができ、音声対話処理システムの信頼性をさらに向上させることができる。
【０１３８】
なお、本実施形態およびその変形例では、ユーザから入力された音声情報に基づく応答文を応答音声情報としてユーザに出力したが、本発明はこれに限定されるものではなく、例えば、図示しない表示装置（モニタ）を介して視覚的にユーザに出力してもよい。
【０１３９】
また、本実施形態およびその変形例においては、本発明に係る音声対話処理システムをカーナビゲーションシステムに適用した例について説明したが、本発明はこれに限定されるものではなく、音声により動作させたいあらゆる機械システムに対して適用可能である。
【０１４０】
さらに、本実施形態およびその変形例では、構文解析処理として、“品詞系列ハッシュ辞書”を用いることにより、キーワード系列を求めたが、本発明はこれに限定されるものではなく、本システムで受理可能な文型を構成する複数の品詞系列パターンと音声情報から求められた単語系列とを照合することによりキーワード系列を求めるものであれば、何れの方法を用いてもよい。
【０１４１】
【発明の効果】
以上述べたように、本発明の音声対話処理方法、音声対話処理システムおよびプログラムを記憶した記憶媒体によれば、ユーザから発せられた付属語等を含む音声情報から、その音声情報に対応する複数の自立語の候補から、受理可能な文型を表す複数の品詞の系列パターンの内の少なくとも１つのパターンに対応する単語系列を前記音声情報に対応する文候補列として求め、求めた文候補列に基づいて意味解釈処理を行って応答文を自動的に生成することができる。
【０１４２】
すなわち、本発明では、実環境下においても、周囲のノイズ等に影響を受けることなく文候補列を求めることができ、かつ「助詞」等の付属語認識に伴う膨大な単語ラティスの処理時間を大幅に削減することができるため、音声対話処理システムの実用性を向上させることができる。
【０１４３】
さらに、本発明の音声対話処理方法、音声対話処理システムおよびプログラムを記憶した記憶媒体によれば、文候補列ではその意味が一義的に解釈できなかった場合でも、助詞等の付属語を補完して文候補列を構成する各自立語の文候補列中の他の自立語に対する関係を定めることができるため、文候補列の意味を迅速かつ一義的に解釈することができる。
【０１４４】
したがって、単語数の多い複雑な自然言語文を音声情報として音声対話処理システムに入力した場合でも、容易に応答文を作成して出力することができるため、音声対話処理システムの実用性をさらに向上させることができる。
【図面の簡単な説明】
【図１】本発明の実施の形態に係る音声対話処理システムの概略構成を示すブロック図。
【図２】本実施の形態に係る品詞辞書ファイルに格納された“品詞辞書”の一例を示す図。
【図３】本実施形態における文型辞書ファイルに格納された“文型辞書”の一例を示す図。
【図４】本実施形態における品詞系列パターン辞書ファイルに格納された“品詞系列パターン”の一例を示す図。
【図５】品詞系列ハッシュ辞書ファイルに格納された“品詞系列ハッシュ辞書”の一例を示す図。
【図６】本実施形態に係るワードスポッティング結果の一例を示す図。
【図７】図６に示すワードスポッティング結果に基づく単語ラティスを示す図。
【図８】本実施形態に係るノード要素データファイルに格納されるノード要素データを示す図。
【図９】本実施形態に係る付属語補完ファイルに格納される付属語補完情報を示す図。
【図１０】本実施形態におけるＣＰＵ３の構文解析処理を説明するための概略フローチャート。
【図１１】図１０に示すステップＳ１０〜ステップＳ１３が終了した時点での単語ラティスのノードの各ノード要素データを示す図。
【図１２】本実施形態におけるＣＰＵ３の付属語補完処理を説明するための概略フローチャート。
【図１３】本実施形態におけるＣＰＵ３の意味解析・問題解決処理を説明するための概略フローチャート。
【符号の説明】
１音声対話処理システム
２音声入力部
３ＣＰＵ
４メモリ
５音声出力部
Ｓ１音声認識処理
Ｓ２構文解析処理
Ｓ３付属語補完処理
Ｓ４意味解析・問題解決処理
Ｓ５応答文生成処理
Ｓ６音声合成処理
Ｆ１品詞辞書ファイル
Ｆ２文型辞書ファイル
Ｆ３品詞系列パターン辞書ファイル
Ｆ４品詞系列ハッシュ辞書ファイル
Ｆ５ノード要素データファイル
Ｆ６処理中ノードリストファイル
Ｆ７品詞系列候補リストファイル
Ｆ８付属語補完ファイル
Ｄ知識ベース
Ｐ音声対話処理プログラム

Claims

音声情報を認識処理して得られたデータを意味解釈して応答文を生成し、生成した応答文を出力する音声対話処理システムにおいて、前記音声情報を入力する音声情報入力手段と、入力された音声情報を認識処理して前記音声情報に含まれる自立語の候補を互いの順序関係を有する単語系列として抽出する抽出手段と、受理可能な文型を複数の品詞の系列パターンとして記憶する品詞系列パターン記憶手段と、抽出された単語系列を前記複数の品詞系列パターンと照合することにより、少なくとも１つの品詞系列パターンに対応する単語系列を前記音声情報に対応する文候補列として求める手段と、求められた文候補列に対して付属語を補完することにより前記意味解釈用の自然言語文構造のデータを生成する自然言語文構造データ生成手段とを備え、この自然言語文構造データ生成手段は、求められた文候補列に対して、互いに自然言語文構造が異なる複数の自然言語文構造データを生成する手段と、生成された複数の自然言語文構造データの中から意味的に尤らしい１つの自然言語文構造データを所定の判断情報に基づいて選択し、選択した自然言語文構造データの意味解釈を知識ベースを参照して選択意味解釈手段で行う意味解釈手段とを含むことを特徴とする音声対話処理システム。
前記意味解釈手段における所定の判断情報は、複数の自然言語文構造データの選択処理を行う直前に音声出力された応答音声情報、あるいは、カーナビゲーションシステムからの自車両の現在走行位置情報であることを特徴とする請求項１記載の音声対話処理システム。
前記自然言語文構造データ生成手段は、前記複数の品詞系列パターンそれぞれの少なくとも１つの品詞に係る付属語を予め記憶する付属語記憶手段と、前記文候補列の品詞系列パターンに対応する付属語を前記付属語記憶手段から読み出して前記少なくとも１つの品詞に補完して前記自然言語文構造データを生成する手段とを備えたことを特徴とする請求項１記載の音声対話処理システム。
知識ベースを有し、この知識ベースを参照しながら前記自然言語文構造データの意味解釈を行う意味解釈手段と、意味解釈内容に基づいて前記音声情報に対する応答文データを生成する応答文データ生成手段と、生成された応答文データを音声情報として出力する音声情報出力手段とを備えたことを特徴とする請求項１または３記載の音声対話処理システム。
前記応答文データ生成手段は、前記意味解釈内容に加えて、前記自然言語文構造データ生成手段により生成された自然言語文構造データを含む応答文データを生成する手段であることを特徴とする請求項４記載の音声対話処理システム。
音声情報を認識処理して得られたデータを意味解釈して応答文を生成し、生成した応答文を出力する音声対話処理方法において、前記音声情報を入力するステップと、この入力ステップにより入力された音声情報を認識処理して前記音声情報に含まれる自立語の候補を互いの順序関係を有する単語系列として抽出するステップと、受理可能な文型を複数の品詞の系列パターンとして記憶するステップと、前記抽出ステップにより抽出された単語系列を前記複数の品詞系列パターンと照合することにより、少なくとも１つの品詞系列パターンに対応する単語系列を前記音声情報に対応する文候補列として求めるステップと、このステップにより求められた文候補列に対して付属語を補完することにより前記意味解釈用の自然言語文構造のデータを生成するステップとを備え、この自然言語文構造データ生成ステップは、求められた文候補列に対して、互いに自然言語文構造が異なる複数の自然言語文構造データを生成するステップと、生成された複数の自然言語文構造データの中から意味的に尤らしい１つの自然言語文データを所定の判断情報に基づいて選択し、選択した自然言語文構造データの意味解釈を知識ベースを参照して選択意味解釈手段で行うステップとを有することを特徴とする音声対話処理方法。
入力された音声情報を認識処理して得られたデータを意味解釈して応答文を生成し、生成した応答文を出力するためのコンピュータが読取り可能なプログラムを記憶した記憶媒体において、前記プログラムは、前記入力された音声情報をコンピュータに認識処理させて前記音声情報に含まれる自立語の候補を互いの順序関係を有する単語系列として抽出させる手段と、受理可能な文型を複数の品詞の系列パターンとして前記コンピュータにメモリに記憶させる手段と、抽出された単語系列を前記コンピュータにより前記複数の品詞系列パターンと照合させることにより、少なくとも１つの品詞系列パターンに対応する単語系列を前記音声情報に対応する文候補列として前記コンピュータに求めさせる手段と、求めた文候補列に対して付属語を前記コンピュータに補完させることにより前記意味解釈用の自然言語文構造のデータを生成させる手段とを備え、この自然言語文構造データ生成手段は、求められた文候補列に対して、互いに自然言語文構造が異なる複数の自然言語文構造データをコンピュータに生成させる手段と、生成された複数の自然言語文構造データの中から意味的に尤らしい１つの自然言語文データを所定の判断情報に基づいて選択し、選択した自然言語文構造データの意味解釈を知識ベースを参照してコンピュータに行わせる手段とを有することを特徴とするプログラムを記憶した記憶媒体。