WO2007105615A1

WO2007105615A1 - 要求内容識別システム、自然言語による要求内容の識別方法及びプログラム

Info

Publication number: WO2007105615A1
Application number: PCT/JP2007/054632
Authority: WO
Inventors: Kai Ishikawa; Susumu Akamine; Shinichi Ando
Original assignee: Nec Corporation
Priority date: 2006-03-10
Filing date: 2007-03-09
Publication date: 2007-09-20
Also published as: US20090099840A1; US8583435B2; JPWO2007105615A1; JP5099367B2

Abstract

　要求内容識別システムは、入力装置１００ｂより入力された音声データについて音声認識処理を行い、更に、共通ルール記憶手段４０１に記憶された共通ルールと、要求固有ルール記憶手段４０２に記憶された要求固有ルールとを用いて要求解析処理を行う。また、音声認識結果と回答要求データ記憶手段４０４に格納された情報要求文又は回答との類似文書検索処理を行う。要求候補スコア計算手段３０４ｃにて、前記各処理で得られた音声認識スコアと、要求解析スコアと、類似文書検索スコアとから統合スコアを計算し、要求識別結果生成手段３０２ｂにて、最も統合スコアの高い要求内容を識別して生成し、出力装置２００に送る。

Description

明細書

要求内容識別システム、自然言語による要求内容の識別方法及びプログラム

技術分野

[0001] 本発明は、要求内容識別システム、自然言語による要求内容の識別方法及びプログラムに関し、特に、自然言語形式で入力された要求文 (入力要求文)を解析し、該入力要求文の要求内容を識別'出力することのできる要求内容識別システム、自然言語による要求内容の識別方法及びプログラムに関する。

背景技術

[0002] 従来より、利用者が入力する情報要求に対して、内容の関連する文書集合を関連度の高いものから順に並べて出力するものが知られている力近年では、単に情報要求に関連する文書を提示するのではなぐ入力された質問文力情報要求の内容を識別し、回答情報を抽出して提示する、質問応答技術の研究が盛んに行われている。

[0003] この質問応答技術の一つの鍵となるのが、入力質問文に対する、情報要求内容の識別技術である。識別する情報要求内容は、対象とするドメインによって内容も粒度も異なるが、例えば、情報機器を対象とする質問応答においては、情報機器に関する様々な機能の使い方や疑問、トラブルの解決方法等といった、様々な質問と回答を想定することができる。この場合、入力された質問文がどれに該当するのかということを、必要に応じて大雑把に、あるいは、詳細に識別する。

[0004] このような従来の情報要求内容の識別技術の一例が特許文献 1に開示されている。特許文献 1記載の日本語質問メッセージ解析装置は、日本語質問メッセージを入力する入力手段と、メッセージ力情報要求の核となる部分を述べている情報要求文を抽出する情報要求文抽出手段と、情報要求文を解析する日本語解析部と、さらに情報要求文の意味構造を求める意味構造解析部と、要求文の参照表現を解消する参照表現解消手段と、メッセージにおける主たる情報要求を構造化する情報要求構造化手段と、情報要求文を出力する出力手段とから構成される。 [0005] 上記日本語質問メッセージ解析装置は、より具体的には、次のように動作する。前記情報要求文抽出手段が、入力された処理対象の日本語質問メッセージについて、特定の表現文字列に着目して、情報要求の核となる部分を述べている情報要求文を抽出すると、前記日本語解析部が、前記情報要求文の構文解析処理によって情報要求文の構文解析結果を生成する。そして、前記意味構造解析部が、前記日本語解析部で得られた情報要求文の構文解析結果と、予め情報要求文のバリエーションに対して構文構造を記述した意味構造パタン辞書との照合によって、情報要求文の意味構造を抽出する。また、前記参照表現解消手段が、前記情報要求文抽出手段により抽出された前記情報要求文に参照表現が含まれる場合に、該参照表現を前記情報要求文の特性に基づいて解消する。前記情報要求構造化手段が、抽出された複数の情報要求文が同一の対象物に対する情報要求を述べている場合に、該複数の情報要求文の構造を統合して、前記日本語質問メッセージにおける主たる情報要求内容を構造化する。最後に、前記出力手段が、前記情報要求構造化手段により統合された情報要求文を出力する。

[0006] 特許文献 1 :特許第 3358100号

発明の開示

発明が解決しょうとする課題

[0007] し力しながら、上記従来技術には、未知の要求文が入力された場合に、要求文から誤った意味構造が抽出されたり、意味構造の抽出自体に失敗するという問題点が残されている。その理由は、未知の要求文が入力された場合、適切な意味構造パタンが存在しないために、意味構造の抽出に失敗し、あるいは、誤ったパタンの照合によつて誤った意味構造が抽出されるためである。

[0008] また、上記した質問応答技術に限らず、音声入力された情報要求や操作要求から、要求内容を識別し、要求情報を提示する音声情報検索や音声質問応答、または、要求操作を実行する音声コマンドといった用途を視野に入れると、要求文が音声入力されることも考えねばならない。

[0009] カロえて、要求文が音声によって入力される場合も、同様にして、意味構造の抽出に失敗し、あるいは、誤ったパタンの照合によって誤った意味構造が抽出されることが予想される。その理由は、音声認識処理によって得られる要求文テキストは誤り含みのため、要求文の誤りに起因して構文構造に誤りを生じ、さらに、要求文に対して正

L ヽ意味構造パタンが照合しなくなるためである。

[0010] 本発明は、上記した事情に鑑みてなされたものであって、その目的とするところは、未知の要求文や、音声によって入力された要求文を、頑健かつ精度良く識別できる要求内容識別システムを提供することにある。

課題を解決するための手段

[0011] 上記課題を解決する第 1の発明は、自然言語形式で入力された要求文 (入力要求文)を解析し、要求内容を識別する要求内容識別システムであって、要求内容に依存しない共通規則と、各要求内容に固有の要求固有規則とを用いて、前記入力要求文に対する構文解析を行い、要求内容の識別を行うことを特徴とする。

[0012] 上記課題を解決する第 2の本発明は、自然言語形式で入力された要求文 (入力要求文)を解析し、要求内容を識別する要求内容識別システムであって、要求内容に依存しない共通規則を記憶する共通規則記憶手段と、各要求内容に固有の要求固有規則を記憶する要求固有規則記憶手段と、前記共通規則と前記要求固有規則を用いて入力要求文に対する構文解析を行う要求解析処理手段と、前記構文解析の結果力要求内容の識別結果を生成する要求識別結果生成手段とを備えたことを特徴とする。

[0013] 上記課題を解決する第 3の本発明は、上記第 2の発明において、前記要求解析処理手段が、前記入力要求文に対して、予め用意された要求内容との適合の度合いを示す解析スコアとともに解析結果候補を複数生成し、前記要求識別結果生成手段が、前記解析スコアに基づいて、最尤の解析結果候補を選択し、要求内容の識別結果を生成することを特徴とする。

[0014] 上記課題を解決する第 4の本発明は、上記第 2又は第 3の発明において、更に、音声入力された入力要求文に対して音声認識処理を行って音声認識結果候補を生成する音声認識処理手段を備え、前記要求解析処理手段が、前記音声認識結果候補に対して、予め用意された要求内容との適合の度合いを示す解析スコアとともに解析結果候補を複数生成し、前記要求識別結果生成手段が、前記解析スコアに基づいて、最尤の解析結果候補を選択し、要求内容の識別結果を生成することを特徴とする。

[0015] 上記課題を解決する第 5の本発明は、上記第 2から第 4のいずれかの発明において、更に、前記解析スコアに加えて、音声認識結果と音声認識結果候補との適合の度合いを示す認識スコアを加味した統合スコアを算出する要求候補スコア計算手段を備え、前記要求識別結果生成手段が、前記統合スコアに基づいて、最尤の解析結果候補を選択することを特徴とする。

[0016] 上記課題を解決する第 6の本発明は、上記第 2から第 5のいずれかの発明において、更に、所定の回答文書データ集合及び要求文データ集合の少なくとも一方を検索対象として、前記入力要求文に類似するデータを検索する類似検索処理を行って、前記入力要求文との適合の度合いを示す検索スコアとともに検索結果候補を求める類似文書検索処理手段と、前記解析スコアに加えて、前記検索スコアを加味した統合スコアを算出する要求候補スコア計算手段とを備え、前記要求識別結果生成手段が、前記統合スコアに基づいて、最尤の解析結果候補を選択することを特徴とする。

[0017] 上記課題を解決する第 7の本発明は、上記第 2から第 6のいずれかの発明において、更に、音声入力された入力要求文に対して音声認識処理を行って音声認識結果候補を生成する音声認識処理手段を備え、前記類似文書検索処理手段が、所定の回答文書データ集合及び要求文データ集合の少なくとも一方を検索対象として、前記音声認識結果候補に類似するデータを検索する類似検索処理を行って、前記各音声認識結果候補との適合の度合いを示す検索スコアとともに検索結果候補を求め、前記要求候補スコア計算手段が、前記解析スコアと検索スコアに加えて、前記音声認識結果候補との適合の度合いを示す認識スコアを加味した統合スコアを算出し、前記要求識別結果生成手段が、該統合スコアに基づいて、最尤の解析結果候補を選択することを特徴とする。

[0018] 上記課題を解決する第 8の本発明は、上記第 2から第 7のいずれかの発明において、前記要求固有規則記憶手段は、前記要求固有規則を要求内容毎に区分けして記憶しており、前記要求解析処理手段は、前記共通規則と前記区分けされた要求固有規則を順次切り替えて入力要求文に対する構文解析を行うことを特徴とする。

[0019] 上記課題を解決する第 9の本発明は、上記第 2から第 8のいずれかの発明において、更に、類似する要求内容をクラスタ化した要求内容クラスタを記憶する要求内容クラスタ記憶手段を有し、前記要求識別結果生成手段が、前記要求内容クラスタ毎に、少なくとも前記解析スコアを集計して、最尤の解析結果候補クラスタを選択し、要求内容の識別結果として生成することを特徴とする。

[0020] 上記課題を解決する第 10の本発明は、要求内容に依存しない共通規則を記憶する共通規則記憶手段と、各要求内容に固有の要求固有規則を記憶する要求固有規則記憶手段と、を備えるコンピュータに入力された自然言語形式による要求内容を識別する要求内容識別方法であって、前記コンピュータが、前記共通規則と前記要求固有規則を用いて要求文 (入力要求文）に対する構文解析を行うステップと、前記コンピュータが、前記構文解析の結果力要求内容の識別結果を生成するステップとを含むことを特徴とする。

[0021] 上記課題を解決する第 11の本発明は、要求内容に依存しない共通規則を記憶する共通規則記憶手段と、各要求内容に固有の要求固有規則を記憶する要求固有規則記憶手段と、を備えるコンピュータに実行させるプログラムであって、入力された自然言語による要求文 (入力要求文）に対して、前記共通規則と前記要求固有規則を用いて要求解析を行う処理と、前記構文解析の結果から要求内容の識別結果を生成する処理とを前記コンピュータに実行させて、該コンピュータを、自然言語形式の要求内容を識別する手段として機能させるためのプログラムである。

発明の効果

[0022] 本発明によれば、未知の要求文が入力されたり、要求文が音声によって入力されたりした場合でも、これらの影響による要求識別の失敗や誤りが少ない、頑健で精度の高い情報要求識別結果を得ることが可能となる。その理由は、前記した共通ルールと要求固有ルールを適用し、未知の要求文に対しても、誤ったルールの適用による識別誤りを最小限に抑え、要求文の構文構造の妥当性や要求の識別結果の妥当性が保証された識別結果が得られるよう構成したことにある。

図面の簡単な説明 [図 1]本発明の第 1の実施形態に係る要求内容識別システムの構成を表したブロック図である。

[図 2]本発明の第 1の実施形態に係る要求内容識別システムの動作を表した流れ図である。

[図 3]本発明の第 2の実施形態に係る要求内容識別システムの構成を表したブロック図である。

[図 4]本発明の第 2の実施形態に係る要求内容識別システムの動作を表した流れ図である。

[図 5]本発明の第 3の実施形態に係る要求内容識別システムの構成を表したブロック図である。

[図 6]本発明の第 3の実施形態に係る要求内容識別システムの動作を表した流れ図である。

[図 7]本発明の第 4の実施形態に係る要求内容識別システムの構成を表したブロック図である。

[図 8]本発明の第 4の実施形態に係る要求内容識別システムの動作を表した流れ図である。

[図 9]本発明の第 5の実施形態に係る要求内容識別システムの構成を表したブロック図である。

[図 10]本発明の第 5の実施形態に係る要求内容識別システムの動作を表した流れ図である。

[図 11]本発明の第 6の実施形態に係る要求内容識別システムの構成を表したブロック図である。

[図 12]本発明の第 6の実施形態に係る要求内容識別システムの動作を表した流れ図である。

[図 13]本発明の実施例を説明するための、情報要求文テキスト (情報要求文音声データ）の例である。

[図 14]本発明の実施例を説明するための、共通ルールおよび要求内容固有ルールの例（一部分)である。圆 15]本発明の実施例を説明するための、情報要求文テキスト (情報要求文音声データ) rに対する要求解析結果の具体例を示す図である。

A

圆 16]本発明の実施例を説明するための、情報要求文テキスト (情報要求文音声データ) rに対する要求解析結果の具体例を示す図である。

B

[図 17]本発明に係る要求内容識別システムの要求候補スコアテーブル記憶手段に格納される情報 (テーブル)の一例を表した図である。

圆 18]本発明に係る要求内容識別システムの要求候補スコア計算手段によって算出される統合スコアを説明するための図である。

[図 19]図 13の情報要求文と、回答要求データ記憶手段に記憶された内容との類似検索を行った場合の類似文書検索スコアとの関係を表した図である。

圆 20]本発明に係る要求内容識別システムの要求候補スコア計算手段によって算出される統合スコアを説明するための図である。

圆 21]本発明の実施例を説明するための、情報要求文テキスト (情報要求文音声データ) rに対する要求解析結果の具体例を示す図である。

C

[図 22]本発明に係る要求内容識別システムの要求候補スコアテーブル記憶手段に格納される情報 (テーブル)の一例を表した図である。

圆 23]本発明に係る要求内容識別システムの要求候補スコア計算手段によって算出される統合スコアを説明するための図である。

[図 24]本発明の実施例を説明するための、共通ルールおよび要求内容固有ルールの別の例（一部分)である。

圆 25]本発明の実施例を説明するための、情報要求文テキスト (情報要求文音声データ) rに対する要求解析結果の具体例を示す図である。

A

圆 26]本発明の実施例を説明するための、情報要求文テキスト (情報要求文音声データ）の別の例である。

圆 27]本発明に係る要求内容識別システムの多階層要求内容クラスタ記憶手段に記憶される情報の具体例である。

[図 28]本発明の実施例を説明するための、共通ルールおよび要求内容固有ルールの別の例（一部分)である。 [図 29]本発明の実施例を説明するための、情報要求文テキスト (情報要求文音声データ) rに対する要求解析結果の具体例を示す図である。

A

[図 30]本発明の実施例を説明するための、情報要求文テキスト (情報要求文音声データ) rに対する要求解析結果の具体例を示す図である。

D

符号の説明

[0024] 100a, 100b 入力装置

200 出力装置

300 コンピュータ（中央処理装置；プロセッサ；データ処理装置）

301a, 301b, 301c, 301d 要求解析処理手段

302a, 302b, 302c 要求識別結果生成手段

303 音声認識処理手段

304a, 304b, 304c 要求候補スコア計算手段

305a, 305b 類似文書検索処理手段

306a, 306b 規貝 IJ切替手段

400 記録媒体

401 共通ルール記憶手段

402、 402b 要求固有ルール記憶手段

403 要求候補スコアテーブル記憶手段

404 回答要求データ記憶手段

405 要求内容多階層クラスタ記憶手段

406 要求クラスタ固有ルール記憶手段

発明を実施するための最良の形態

[0025] [第 1の実施形態]

続いて、本発明の第 1の実施形態について図面を参照して詳細に説明する。図 1 は、本発明の第 1の実施形態に係る要求内容識別システムの構成を表したブロック図である。図 1を参照すると、本実施形態に係る要求内容識別システムは、入力装置 100aと、出力装置 200と、プログラム制御により動作するコンピュータ（中央処理装置；プロセッサ；データ処理装置） 300と、記憶媒体 400とから構成されてヽる。 [0026] コンピュータ（中央処理装置；プロセッサ；データ処理装置） 300は、それぞれコンビユータブログラムで構成された要求解析処理手段 301aと、要求識別結果生成手段 3 02aとを含んで構成される。

[0027] 要求解析処理手段 301aは、入力された情報要求文のテキストデータに対して、共通ルール記憶手段 401に記憶された共通ルールと、要求固有ルール記憶手段 402 に記憶された要求固有ルールとを用、て要求解析処理を行、、入力要求文に対する構文構造を生成することにより、入力要求文に対する要求解析結果の複数候補として、入力要求文に対する要求内容番号とその要求解析スコアのリストを出力する手段である。

[0028] 要求識別結果生成手段 302aは、要求解析処理手段 301aより出力されたリストの入力要求文に対する要求内容番号の候補をスコア順にソートし、最もスコアの高い要求内容番号を識別結果として生成し、出力する手段である。

[0029] 記憶媒体 400は、共通ルール記憶手段 401と、要求固有ルール記憶手段 402とを含む。共通ルール記憶手段 401は、要求解析処理手段 301aにおいて、入力要求文に対して要求解析を行う際に用いる、固有の要求内容に依存しな、ように記述された構文解析用のルール (共通ルール)を記憶する。要求固有ルール記憶手段 402 は、要求解析処理手段 301aにおいて、入力要求文に対して要求解析を行う際に用いる、固有の要求内容に固有の語彙や表現に特化して記述された構文解析用のルール（要求固有ルール）を記憶する。

[0030] 続いて、本実施形態の動作について図面を参照して詳細に説明する、図 2は、本発明の第 1の実施形態に係る要求内容識別システムの動作を表した流れ図である。図 2を参照すると、まず、入力装置 100aより情報要求文のテキストデータが入力されると (ステップ A1)、要求解析処理手段 301aが、入力された情報要求文のテキストデータに対して、共通ルール記憶手段 401に記憶された共通ルールと、要求固有ルール記憶手段 402に記憶された要求固有ルールとを用いて要求解析処理を行、、入力要求文に対する構文構造を生成することにより、入力要求文に対する要求解析結果の複数候補として、入力要求文に対する要求内容番号と各要求内容との構文解析上の適合の度合、を示す解析スコアのリスト (Nベスト）を出力する (ステップ A2)。 [0031] 続いて、要求識別結果生成手段 302aが、要求解析処理手段 301aで得られた入力要求文の全候補をスコア順にソートし、最もスコアの高い要求内容番号を識別結果として生成し、出力装置 200に送る (ステップ A3)。

[0032] 以上のように、本実施形態によれば、上記解析スコアに基づいた選択が可能となるため、入力された情報要求文の構文構造の妥当性や要求の識別結果の妥当性が保証された識別結果が得られる。また、未知の要求文に対しても、誤ったルールの適用による識別誤りを最小限に抑えることが可能であり、精度の良い情報要求文力の要求の識別を実現することが可能となって、る。

[0033] [第 2の実施形態]

続、て、音声で入力された情報要求文を識別可能とした本発明の第 2の実施形態について図面を参照して詳細に説明する。図 3は、本発明の第 2の実施形態に係る要求内容識別システムの構成を表したブロック図である。図 3を参照すると、本実施形態に係る要求内容識別システムは、入力装置 100bと、出力装置 200と、プロダラム制御により動作するコンピュータ（中央処理装置；プロセッサ；データ処理装置） 30 0と、記憶媒体 400とから構成されている。

[0034] 上記第 1の実施形態との相違点は、入力装置 100bが音声入力装置である点と、コンピュータ (中央処理装置；プロセッサ；データ処理装置） 300の構成と、記憶媒体 40 0に、要求候補スコアテーブル記憶手段 403が追加されている点である。以下、上記した第 1の実施形態と共通する部分は適宜省略して説明する。

[0035] 本実施形態におけるコンピュータ（中央処理装置;プロセッサ；データ処理装置） 30 0は、それぞれコンピュータプログラムで構成された音声認識処理手段 303と、要求解析処理手段 30 lbと、要求候補スコア計算手段 304aと、要求識別結果生成手段 3 02bとを含んで構成される。

[0036] 音声認識処理手段 303は、入力された情報要求文の音声データに対して音声認識処理を行い、入力要求文に対する音声認識結果として、予め用意された情報要求文テキストとの適合の度合いを示す音声認識スコアの付与された情報要求文テキストを複数候補出力する手段である。

[0037] 要求解析処理手段 301bは、音声認識処理手段 303で得られた音声認識結果の各候補に対して、共通ルール記憶手段 401に記憶された共通ルールと、要求固有ルール記憶手段 402に記憶された要求固有ルールとを用いて要求解析処理を行ヽ、音声認識結果の各候補に対する構文構造を生成することにより、音声認識結果の各候補に対する要求解析結果の複数候補として、認識結果の各候補に対する要求内容番号とその要求解析スコアのリストを出力する手段である。

[0038] 要求候補スコア計算手段 304aは、音声認識処理手段 303で得られた音声認識結果の各候補とその音声認識スコアと、要求解析処理手段 301bで得られた要求内容番号とその要求解析スコアとを、要求候補スコアテーブル記憶手段 403に記録する。更に、要求候補スコア計算手段 304aは、上記音声認識結果の各候補の音声認識スコアと、要求内容番号とその要求解析スコアとを組み合わせることにより、入力された情報要求文に対する要求内容の全候補に対して統合スコアを計算し、要求内容番号とともに要求識別結果生成手段 302bに出力する手段である。

[0039] 要求識別結果生成手段 302bは、要求候補スコア計算手段 304aより出力された入力要求文の全候補を統合スコア順にソートし、最も統合スコアの高い要求内容番号を識別結果として生成し、出力する手段である。

[0040] 要求候補スコアテーブル 403は、要求候補スコア計算手段 304aにおいて、音声認識処理手段 303で得られた音声認識結果の各候補とその音声認識スコアを記録するとともに、音声認識結果の各候補に対して要求解析処理手段 301bで得られた、要求内容番号とその要求解析スコアを記録する際に用いる、要求候補スコアテーブルを記憶する（図 17参照)。

[0041] 続いて、本実施形態の動作について図面を参照して詳細に説明する、図 4は、本発明の第 2の実施形態に係る要求内容識別システムの動作を表した流れ図である。図 4を参照すると、まず、入力装置 100bより情報要求文音声が入力されると (ステツプ B1)、音声認識処理手段 303が、入力された情報要求文の音声データに対して音声認識処理を行い、入力された情報要求文に対する音声認識結果として、音声認識スコアの付与された情報要求文テキストを複数候補 (Nベスト）出力する (ステップ B2 ; 例：図 13の r〜r ) o

A C

[0042] 続いて、要求解析処理手段 301bが、音声認識処理手段 303で得られた音声認識結果の各候補に対して、共通ルール記憶手段 401に記憶された共通ルールと、要求固有ルール記憶手段 402に記憶された要求固有ルールとを用いて要求解析処理を行い、音声認識結果の各候補に対する構文構造を生成することにより、音声認識結果の各候補に対する要求解析結果の複数候補 (Nベスト)として、認識結果の各候補に対する要求内容番号とその要求解析スコアのリストを出力する (ステップ B3)。

[0043] 続ヽて、要求候補スコア計算手段 304aが、音声認識処理手段 303で得られた音声認識結果の各候補に対して、その音声認識スコアとともに、要求解析処理手段 30 lbで得られた要求内容番号とその要求解析スコアを、要求候補スコアテーブル記憶手段 403に記録し、さらに、音声認識結果の各候補に対して、音声認識スコアと要求解析スコアを組み合わせることにより、入力された情報要求文に対する要求内容の全候補に対して統合スコアを計算し、要求内容番号を統合スコアとともに出力する (ステップ B4)。

[0044] 最後に、要求識別結果生成手段 302bが、要求候補スコア計算手段 304aで得られた入力要求文の全候補を統合スコア順にソートし、最も統合スコアの高い要求内容番号を識別結果として生成し、出力装置 200に送る (ステップ B5)。

[0045] 以上のように、本実施形態によれば、音声認識スコアと要求候補スコアを組み合わせた統合スコアを用いて、るため、音声認識と要求解析の結果を相補的に用いて最適な質問内容の識別結果を得ることが可能となる。また本実施形態によれば、音声認識処理のバラツキを考慮に入れているため、音声認識誤りの影響を最小限に抑えることが可能であり、精度の良い情報要求文力の要求の識別を実現することができる。

[0046] [第 3の実施形態]

続いて、上記第 1の実施形態に改良を加えた本発明の第 3の実施形態について図面を参照して詳細に説明する。図 5は、本発明の第 3の実施形態に係る要求内容識別システムの構成を表したブロック図である。図 5を参照すると、本実施形態に係る要求内容識別システムは、入力装置 100aと、出力装置 200と、プログラム制御により動作するコンピュータ（中央処理装置;プロセッサ;データ処理装置） 300と、記憶媒体 4 00と力構成されている。 [0047] 上記第 1の実施形態との相違点は、コンピュータ（中央処理装置;プロセッサ；データ処理装置） 300の構成と、記憶媒体 400に、回答要求データ記憶手段 404が追カロされている点である。以下、上記した第 1、第 2の実施形態と共通する部分は適宜省略して説明する。

[0048] 本実施形態におけるコンピュータ（中央処理装置;プロセッサ；データ処理装置） 30 0は、それぞれコンピュータプログラムで構成された要求解析処理手段 301aと、要求候補スコア計算手段 304bと、類似文書検索処理手段 305aと、要求識別結果生成手段 302bとを含んで構成される。

[0049] 要求解析処理手段 301aは、上記第 1の実施形態と同様に、入力された情報要求文のテキストデータに対して、共通ルール記憶手段 401に記憶された共通ルールと、要求固有ルール記憶手段 402に記憶された要求固有ルールとを用いて要求解析処理を行い、入力要求文に対する構文構造を生成することにより、入力要求文に対する要求解析結果の複数候補として、入力要求文に対する要求内容番号とその要求解析スコアのリストを出力する手段である。

[0050] 類似文書検索処理手段 305aは、入力された情報要求文のテキストデータを検索要求として、回答要求データ記憶手段 404に記憶された各要求内容に対する回答文書集合又は各要求内容に対する情報要求文集合又はその両方を対象に検索を行い、検索結果として要求内容番号と情報要求文との適合の度合いを示す類似文書検索スコアを求め、要求内容番号とその類似文書検索スコアの組を出力する手段である。

[0051] 本実施形態における要求候補スコア計算手段 304bは、上記した第 2の実施形態の要求候補スコア計算手段 304aと略同様であるが、音声認識スコアに代えて、類似文書検索スコアを用い、統合スコアを計算する点で異なっている。即ち、要求候補スコア計算手段 304bは、要求解析処理手段 301aで得られた要求内容番号とその要求解析スコアの各候補に対して、類似文書検索処理手段 305aで得られた要求内容番号とその類似文書検索スコアを、要求解析スコアと組み合わせることにより、入力された情報要求文に対する要求内容の全候補に対して統合スコアを計算し、要求内容番号を統合スコアとともに出力する手段である。 [0052] 要求識別結果生成手段 302bは、要求候補スコア計算手段 304bで得られた入力要求文の全候補を統合スコア順にソートし、最も統合スコアの高い要求内容番号を識別結果として生成し、出力する手段である。

[0053] 回答要求データ記憶手段 404は、類似文書検索処理手段 305aが、入力要求文に類似するデータを検索する際に、検索対象となる文書データを記憶する手段である。例えば、各要求内容に対する回答文書集合又は Z及び情報要求文集合が記憶される。

[0054] 続いて、本実施形態の動作について図面を参照して詳細に説明する、図 6は、本発明の第 3の実施形態に係る要求内容識別システムの動作を表した流れ図である。図 6を参照すると、まず、入力装置 100aより情報要求文のテキストデータが入力されると (ステップ A1)、要求解析処理手段 301aが、入力された情報要求文のテキストデータに対して、共通ルール記憶手段 401に記憶された共通ルールと、要求固有ルール記憶手段 402に記憶された要求固有ルールとを用いて要求解析処理を行、、入力要求文に対する構文構造を生成することにより、入力要求文に対する要求解析結果の複数候補 (Nベスト)として、入力要求文に対する要求内容番号とその要求解析スコアのリストを出力する（ステップ A2)。

[0055] 続、て、類似文書検索処理手段 305aが、ステップ A1にて入力された情報要求文のテキストデータを検索要求として、回答要求データ記憶手段 404に記憶された文書データを対象に類似文書検索を行い、検索結果として要求内容番号と類似文書検索スコアを求め、要求内容番号とその類似文書検索スコアの組を出力する (ステツプ Cl)。

[0056] 続いて、要求候補スコア計算手段 304bが、入力された情報要求文のテキストデータに対して、要求解析処理手段 301aで得られた要求内容番号とその要求解析スコァを、類似文書検索処理手段 305aで得られた要求内容番号とその類似文書検索スコァと組み合わせることにより、入力要求文に対する要求内容の全候補に対して統合スコアを計算し、要求内容番号を統合スコアとともに出力する (ステップ C2)。

[0057] 最後に、要求識別結果生成手段 302bが、要求候補スコア計算手段 304bで得られた入力要求文の全候補を統合スコア順にソートし、最も統合スコアの高い要求内容番号を識別結果として生成し、出力装置 200に送る (ステップ B5)。

[0058] 以上のように、本実施形態によれば、類似文書検索スコアと要求候補スコアを組み合わせた統合スコアを用いているため、要求解析、類似文書検索の結果を相補的に用いて最適な質問内容の識別結果を得ることが可能となる。また本実施形態によつても、未知の要求文や音声認識誤りに対する影響を最小限に抑えることが可能であり、精度の良い情報要求文力の要求の識別を実現することができる。

[0059] [第 4の実施形態]

続いて、上記第 2の実施形態に改良を加えた本発明の第 4の実施形態について図面を参照して詳細に説明する。図 7は、本発明の第 4の実施形態に係る要求内容識別システムの構成を表したブロック図である。図 7を参照すると、本実施形態に係る要求内容識別システムは、入力装置 100bと、出力装置 200と、プログラム制御により動作するコンピュータ（中央処理装置;プロセッサ;データ処理装置） 300と、記憶媒体 4 00と力構成されている。

[0060] 上記第 2の実施形態との相違点は、コンピュータ（中央処理装置;プロセッサ；データ処理装置） 300の構成と、記憶媒体 400に、上記第 3の実施形態で説明した回答要求データ記憶手段 404が追加されている点である。以下、上記した第 2、第 3の実施形態と共通する部分は適宜省略して説明する。

[0061] 本実施形態におけるコンピュータ（中央処理装置;プロセッサ；データ処理装置） 30 0は、それぞれコンピュータプログラムで構成された音声認識処理手段 303と、要求解析処理手段 301bと、要求候補スコア計算手段 304cと、類似文書検索処理手段 3 05bと、要求識別結果生成手段 302bとを含んで構成される。

[0062] 音声認識処理手段 303は、上記第 2の実施形態で説明したように、入力された情報要求文の音声データに対して音声認識処理を行い、入力要求文に対する音声認識結果として、音声認識スコアの付与された情報要求文テキストを複数候補出力する手段である。

[0063] 要求解析処理手段 301bは、上記第 2の実施形態で説明したように、音声認識処理手段 303で得られた音声認識結果の各候補に対して、共通ルール記憶手段 401〖こ記憶された共通ルールと、要求固有ルール記憶手段 402に記憶された要求固有ル一ルとを用いて要求解析処理を行、、音声認識結果の各候補に対する構文構造を生成することにより、音声認識結果の各候補に対する要求解析結果の複数候補として、認識結果の各候補に対する要求内容番号とその要求解析スコアのリストを出力する手段である。

[0064] 類似文書検索処理手段 305bは、音声認識処理手段 303で得られた音声認識結果の各候補を検索要求として、回答要求データ記憶手段 404に記憶された各要求内容に対する回答文書集合又は各要求内容に対する情報要求文集合又はその両方を対象に検索を行い、検索結果として要求内容番号とその類似文書検索スコアを求め、要求内容番号とその類似文書検索スコアの組を出力する手段である。

[0065] 要求候補スコア計算手段 304cは、音声認識処理手段 303で得られた音声認識結果の各候補とその音声認識スコアと、要求解析処理手段 301bで得られた要求内容番号とその要求解析スコアと、類似文書検索処理手段 305bで得られた要求内容番号とその類似文書検索スコアとを要求候補スコアテーブル記憶手段 403に記録する。更に、要求候補スコア計算手段 304cは、上記音声認識結果の各候補の音声認識スコアと、上記要求内容番号とその要求解析スコアと類似文書検索スコアとを組み合わせることにより、入力された情報要求文に対する要求内容の全候補に対して統合スコアを計算し、要求内容番号とともに要求識別結果生成手段 302bに出力する手段である。

[0066] 要求識別結果生成手段 302bは、要求候補スコア計算手段 304cより出力された入力要求文の全候補を統合スコア順にソートし、最も統合スコアの高い要求内容番号を識別結果として生成し、出力する手段である。

[0067] 要求候補スコアテーブル 403及び回答要求データ記憶手段 404は、それぞれ第 2 の実施形態及び第 3の実施形態で説明しているので省略する。

[0068] 続いて、本実施形態の動作について図面を参照して詳細に説明する。図 8は、本発明の第 4の実施形態に係る要求内容識別システムの動作を表した流れ図である。図 8を参照すると、まず、入力装置 100bより情報要求文音声が入力されると (ステツプ B1)、音声認識処理手段 303が、入力された情報要求文の音声データに対して音声認識処理を行い、入力された情報要求文に対する音声認識結果として、音声認識スコアの付与された情報要求文テキストを複数候補 (Nベスト）出力する (ステップ B2 ; 例：図 13の r〜r ) o

A C

[0069] 続いて、要求解析処理手段 301bが、音声認識処理手段 303で得られた音声認識結果の各候補に対して、共通ルール記憶手段 401に記憶された共通ルールと、要求固有ルール記憶手段 402に記憶された要求固有ルールとを用いて要求解析処理を行い、音声認識結果の各候補に対する構文構造を生成することにより、音声認識結果の各候補に対する要求解析結果の複数候補 (Nベスト)として、認識結果の各候補に対する要求内容番号とその要求解析スコアのリストを出力する (ステップ B3)。

[0070] 続いて、類似文書検索処理手段 305bが、音声認識処理手段 303で得られた音声認識結果の各候補を検索要求として、回答要求データ記憶手段 404に記憶された文書データを対象に類似文書検索を行い、検索結果として要求内容番号と類似文書検索スコアを求め、要求内容番号とその類似文書検索スコアの組を出力する (ステップ Dl)。

[0071] 続、て、要求候補スコア計算手段 304cが、音声認識処理手段 303で得られた音声認識結果の各候補に対して、その音声認識スコアとともに、要求解析処理手段 30 lbで得られた要求内容番号とその要求解析スコアと、類似文書検索処理手段 305b で得られた要求内容番号とその類似文書検索スコアを、要求候補スコアテーブル記憶手段 403に記録し、さらに、音声認識結果の各候補に対して、音声認識スコアと要求解析スコアと類似文書検索スコアを組み合わせることにより、入力された情報要求文に対する要求内容の全候補に対して統合スコアを計算し、要求内容番号を統合スコアとともに出力する (ステップ D2)。

[0072] 最後に、要求識別結果生成手段 302bが、要求候補スコア計算手段 304cで得られた入力要求文の全候補を統合スコア順にソートし、最も統合スコアの高い要求内容番号を識別結果として生成し、出力装置 200に送る (ステップ B5)。

[0073] 以上のように、本実施形態によれば、音声認識スコアと要求候補スコアと類似文書検索スコアを組み合わせた統合スコアを用いているため、音声認識、要求解析、類似文書検索の結果を相補的に用いて音声認識誤りの影響を最小限に抑え、最適な質問内容の識別結果を得ることが可能となる。 [0074] [第 5の実施形態]

続いて、本発明の第 5の実施形態について図面を参照して詳細に説明する。図 9 は、本発明の第 5の実施形態に係る要求内容識別システムの構成を表したブロック図である。図 9を参照すると、本実施形態に係る要求内容識別システムは、入力装置 100aと、出力装置 200と、プログラム制御により動作するコンピュータ（中央処理装置；プロセッサ；データ処理装置） 300と、記憶媒体 400とから構成されてヽる。

[0075] 上記第 1の実施形態との相違点は、コンピュータ（中央処理装置;プロセッサ；データ処理装置） 300の構成に規則切替手段 306aを追加した点と、上記第 1の実施形態で説明した要求固有ルールを一括して記憶する要求固有ルール記憶手段 402に代えて、要求固有ルール 1、要求固有ルール 2、 · · ·、要求固有ルール Nというように各要求内容毎に、対応する要求固有ルールを区別して記憶する、要求固有ルール記憶手段 402bを備えた点である。

[0076] コンピュータ（中央処理装置；プロセッサ；データ処理装置） 300は、それぞれコンビユータブログラムで構成された要求解析処理手段 301cと、規則切替手段 306aと、要求識別結果生成手段 302aとを含んで構成される。

[0077] 要求解析処理手段 301cは、入力された情報要求文のテキストデータに対して、共通ルール記憶手段 401に記憶された共通ルールと、要求固有ルール記憶手段 402 bに、各要求内容毎に記憶された要求固有ルール 1、要求固有ルール 2、 · · ·、要求固有ルール Nのすベての要求固有ルールのうち、規則切替手段 306aが順次切り替える要求固有ルールとを用、て要求解析処理を行、、入力要求文に対して共通ルールとすべての要求固有ルールから、ずれかを順次用いて構文構造を生成することにより、入力要求文に対する要求解析結果の複数候補として、入力要求文に対する要求内容番号とその要求解析スコアのリストを出力する手段である。

[0078] 要求識別結果生成手段 302aは、要求解析処理手段 301cより出力されたリストの入力要求文に対する要求内容番号の候補をスコア順にソートし、最もスコアの高い要求内容番号を識別結果として生成し、出力する手段である。

[0079] 規則切替手段 306aは、要求固有ルール記憶手段 402bに記憶された要求固有ルール 1、要求固有ルール 2、 · · ·、要求固有ルール Nの全 N個の要求固有ルールのうち、いずれかの要求固有ルールに順次切り替えを行うことにより、要求解析処理手段

301cに対して要求解析処理に用いる要求固有ルールを提供する。

[0080] 記憶媒体 400は、共通ルール記憶手段 401と、要求固有ルール記憶手段 402bとを含む。共通ルール記憶手段 401は、要求解析処理手段 301cにおいて、入力要求文に対して要求解析を行う際に用いる、固有の要求内容に依存しな、ように記述された構文解析用のルール (共通ルール)を記憶する。要求固有ルール記憶手段 402 bは、要求解析処理手段 301cにおいて、入力要求文に対して要求解析を行う際に用いる、固有の要求内容に固有の語彙や表現に特化して記述された構文解析用のルール（要求固有ルール）を各要求内容毎に、対応する要求固有ルールとして、要求固有ルール 1、要求固有ルール 2、 · · ·、要求固有ルール Nの全 N個の要求固有ルールを区別して記憶する。

[0081] 続いて、本実施形態の動作について図面を参照して詳細に説明する。図 10は、本発明の第 5の実施形態に係る要求内容識別システムの動作を表した流れ図である。図 10を参照すると、まず、入力装置 100aより情報要求文のテキストデータが入力されると (ステップ A1)、要求解析処理手段 301cが、入力された情報要求文のテキストデータに対して、共通ルール記憶手段 401に記憶された共通ルールと、要求固有ルール記憶手段 402bに、各要求内容毎に記憶された要求固有ルール 1、要求固有ルール 2、 · · ·、要求固有ルール Nのすベての要求固有ルールのうち、規則切替手段 3 06aが順次切り替える要求固有ルールとを用いて要求解析処理を行い、入力要求文に対して共通ルールとすべての要求固有ルールから、ずれかを順次用いて構文構造を生成することにより、入力要求文に対する要求解析結果の複数候補として、入力要求文に対する要求内容番号と各要求内容との構文解析上の適合の度合いを示す解析スコアのリスト (Nベスト）を出力する (ステップ El)。

[0082] 続いて、要求識別結果生成手段 302aが、要求解析処理手段 301cで得られた入力要求文の全候補をスコア順にソートし、最もスコアの高い要求内容番号を識別結果として生成し、出力装置 200に送る (ステップ A3)。

[0083] 以上のように、本実施形態によれば、第 1の実施例と同様、上記解析スコアに基づいた選択が可能となるため、入力された情報要求文の構文構造の妥当性や要求の識別結果の妥当性が保証された識別結果が得られる。また、未知の要求文に対しても、誤ったルールの適用による識別誤りを最小限に抑えることが可能であり、精度の良、情報要求文力の要求の識別を実現することが可能となって、る。

[0084] [第 6の実施形態]

続いて、本発明の第 6の実施形態について図面を参照して詳細に説明する。図 11 は、本発明の第 6の実施形態に係る要求内容識別システムの構成を表したブロック図である。

図 11を参照すると、本実施形態に係る要求内容識別システムは、入力装置 100aと、出力装置 200と、プログラム制御により動作するコンピュータ（中央処理装置;プロセッサ;データ処理装置） 300と、記憶媒体 400とから構成されている。

[0085] 上記第 5の実施形態との相違点は、記憶媒体 400に、後記する要求内容多階層クラスタ記憶手段 405と、要求クラスタ固有ルール記憶手段 406とが追加されている点である。

[0086] コンピュータ（中央処理装置；プロセッサ；データ処理装置） 300は、それぞれコンビユータブログラムで構成された要求解析処理手段 301dと、規則切替手段 306bと、要求識別結果生成手段 302cとを含んで構成される。

[0087] 要求解析処理手段 301dは、入力された情報要求文のテキストデータに対して、共通ルール記憶手段 401に記憶された共通ルールと、要求固有ルール記憶手段 402 bに、各要求内容毎に記憶された要求固有ルール 1、要求固有ルール 2、 · · ·、要求固有ルール N、要求クラスタ固有ルール記憶手段 406に各要求内容クラスタ毎に記憶された要求クラスタ固有ルール 1、要求クラスタ固有ルール 2、 · · ·、要求クラスタ固有ルール Nのすベての要求固有ルールのうち、規則切替手段 306bが順次切り替える要求内容クラスタに対応する要求固有ルールの集合とを用 Vヽて要求解析処理を行 V、、入力要求文に対して共通ルールとすべての要求固有ルールから!/、ずれかの要求内容クラスタに対応する要求固有ルールの集合を順次用いて構文構造を生成することにより、入力要求文に対する要求解析結果の複数候補として、入力要求文に対する要求内容クラスタとその要求解析スコアのリストを出力する手段である。

[0088] 要求識別結果生成手段 302cは、要求解析処理手段 301dより出力されたリストの入力要求文に対する要求内容クラスタの候補をスコア順にソートし、最もスコアの高い要求内容クラスタ (要求内容番号の集合で表現される）を識別結果として生成し、出力する手段である。

[0089] 規則切替手段 306bは、要求内容多階層クラスタ記憶手段 405に記憶された内容に従って、要求固有ルール記憶手段 402bに各要求内容毎に記憶された要求固有ルール 1、要求固有ルール 2、 . · ·、要求固有ルール Nの全 N個の要求固有ルール及び要求クラスタ固有ルール記憶手段 406に各要求内容クラスタ毎に記憶された要求クラスタ固有ルール 1、要求クラスタ固有ルール 2、 · · ·、要求クラスタ固有ルール N のうち、いずれかの要求内容クラスタに対応する要求固有ルールの集合に順次切り替えを行うことにより、要求解析処理手段 301dに対して要求解析処理に用いる要求固有ルールの集合を提供する。

[0090] 記憶媒体 400は、共通ルール記憶手段 401と、要求固有ルール記憶手段 402bと、要求内容多階層クラスタ記憶手段 405と、要求クラスタ固有ルール記憶手段 406と、を含む。共通ルール記憶手段 401は、要求解析処理手段 301dにおいて、入力要求文に対して要求解析を行う際に用いる、固有の要求内容に依存しな!、ように記述された構文解析用のルール (共通ルール)を記憶する。要求固有ルール記憶手段 4 02bは、要求解析処理手段 301dにおいて、入力要求文に対して要求解析を行う際に用いる、固有の要求内容に固有の語彙や表現に特化して記述された構文解析用のルール（要求固有ルール）を各要求内容毎に、対応する要求固有ルールとして、要求固有ルール 1、要求固有ルール 2、 · · ·、要求固有ルール Nの全 N個の要求固有ルールを区別して記憶する。要求内容多階層クラスタ記憶手段 405は、要求内容が互いに類似する質問内容の集合を多階層のクラスタ構造 (要求内容番号の集合で表現される）で記述した要求内容クラスタ（要求内容カテゴリ）を記憶する。また、要求クラスタ固有ルール記憶手段 406は、前記要求内容クラスタに固有の語彙や表現に特ィ匕して記述された構文解析用のルール (要求クラスタ固有ルール)を各クラスタ毎に、対応する要求固有ルールとして、要求クラスタ固有ルール 1、要求クラスタ固有ルール 2、 · · ·、要求クラスタ固有ルール Nの全 N個の要求クラスタ固有ルールを区別し飞 feす。。 [0091] 続いて、本実施形態の動作について図面を参照して詳細に説明する。図 12は、本発明の第 6の実施形態に係る要求内容識別システムの動作を表した流れ図である。図 12を参照すると、まず、入力装置 100aより情報要求文のテキストデータが入力されると (ステップ A1)、要求解析処理手段 301dが、入力された情報要求文のテキストデータに対して、共通ルール記憶手段 401に記憶された共通ルールと、要求固有ルール記憶手段 402b及び要求クラスタ固有ルール記憶手段 406に格納されたすベての要求固有ルールのうち、規則切替手段 306bが順次切り替える要求内容クラスタに対応する要求固有ルールの集合とを用いて要求解析処理を行!ヽ、構文構造を生成することにより、入力要求文に対する要求解析結果の複数候補として、入力要求文に対する要求内容クラスタと、各クラスタの要求内容との構文解析上の適合の度合、を示す解析スコアのリスト (Nベスト）を出力する (ステップ F1)。

[0092] 続いて、要求識別結果生成手段 302cが、要求解析処理手段 301dで得られた入力要求文の全候補をスコア順にソートし、最もスコアの高い要求内容クラスタ（要求内容番号の集合で表現される）を識別結果として生成し、出力装置 200に送る (ステツプ F2)。

[0093] 以上のように、本実施形態によれば、第 5の実施形態の効果に加え、上記解析スコァに基づいた要求内容クラスタの選択が可能となるため、入力された情報要求文が未知の要求文で、直接対応する要求内容番号が存在しない場合においても、最も内容の近い適当な要求内容クラスタに対応する要求として識別することが可能となっている。

[0094] 続いて、上記した各実施形態の作用効果をより具体的に説明すベぐ本発明の実施例を説明する。

[0095] [実施例 1]

以下、第 1実施例として、上記した本発明の第 1の実施形態の動作を、図 1、図 2と、図 13〜図 15の補助図面を参照して、具体的に説明する。

[0096] 本実施例では、図 2のステップ A1にて、入力装置 100aに、「ショートメール受信時の画面は設定できます力」（図 13の表記記号 r )との情報要求文が入力されたものと

A

して説明する。図 14は、共通ルール (a)及び (b)と、要求内容固有ルール (a)及び（ b)の具体例を表した図である（各ルールは全体の一部を示す。 ) oなお、図 14の要求内容固有ルール (a)及び (b)は、要求内容番号 19に固有の要求固有ルールの一部である。

[0097] 続いて、先に図 2のステップ A2で説明したように、要求解析処理手段 301aが、共通ルール記憶手段 401、要求固有ルール記憶手段 402より、共通ルールと、要求固有ルールとを用いて、前記した図 13の表記記号 r の要求文について要求解析処理

A

を行い、入力要求文に対する構文構造を生成することにより、入力要求文に対する要求解析結果の複数候補として、入力要求文に対する要求内容番号とその要求解析スコアのリストを出力する。

[0098] 図 15は、要求解析処理手段 30 laが、図 14に示すような共通ルール (a)及び (b)、要求内容固有ルール (a)及び (b)を用いて、図 13の表記記号 r の情報要求文の要

A

求解析により得られた候補とその解析スコアを表した図である。図 15を参照すると、要求内容 Q を候補とする第 1解析候補 S (r )の解析スコアは 25であり、要求内

19 1 A

容 Q を候補とする第 2解析候補 S (r )の解析スコアは—35であり、要求内容 Qを

15 2 A 0 候補とする第 3解析候補 S (r )の解析スコアは— 40である。

3 A

[0099] そして、先に図 2のステップ A3で説明したように、要求識別結果生成手段 302aが、これら全候補をスコア順にソートし、最もスコアの高い候補を最尤とし、その要求内容番号を識別結果として生成し、出力装置 200に送る。図 15に例示した要求解析結果の場合、上記スコア順に、要求内容 Q (解析スコア = 25)、要求内容 Q (解析ス

19 15 コア = 35)、要求内容 Q (解析スコア =ー 40)が得られ、最もスコアの高い第 1解

0

析候補 S (r )の要求内容 Q が識別結果として生成される。

1 A 19

[0100] [実施例 2]

以下、第 2実施例として、上記した本発明の第 2の実施形態の動作を、図 3、図 4と、図 13〜図 18の補助図面を参照して、具体的に説明する。

[0101] 本実施例では、図 4のステップ B1にて、入力装置 100bに、「ショートメール受信時の画面は設定できます力」（図 13の表記記号 r )との音声にて情報要求文が入力さ

A

れたものとして説明する。

[0102] そして、音声認識処理手段 303における音声認識処理の結果（図 4のステップ B2) 、情報要求文の第 1候補として、図 13の表記記号!：の情報要求文 (音声認識スコア

B

=— 20)と、第 2候補として、図 13の表記記号!：の情報要求文 (音声認識スコア =—

A

22)とが得られたものとする。

[0103] そして、先に図 4のステップ B3で説明したように、要求解析処理手段 301bが、共通ルール記憶手段 401、要求固有ルール記憶手段 402より、共通ルールと、要求固有ルールとを用いて、前記した図 13の表記記号 r、r の要求文について要求解析処

B A

理を行い、入力要求文に対する構文構造を生成することにより、入力要求文に対する要求解析結果の複数候補として、入力要求文に対する要求内容番号とその要求解析スコアのリストを出力する。

[0104] 図 16は、要求解析処理手段 301bが、図 14に示すような共通ルール (a)及び (b)、要求内容固有ルール (a)及び (b)を用いて、図 13の表記記号 rの情報要求文の要

B

求解析により得られた候補とその解析スコアを表した図である。図 16を参照すると、要求内容番号 19で特定される要求内容 Q を候補とする第 1解析候補 S (r )の解

15 1 B 析スコアは— 35であり、要求内容 Qを候補とする第 2解析候補 S2 (r )の解析スコア

0 B

は— 40であり、要求内容 Q を候補とする第 3解析候補 S3 (r )の解析スコアは— 45

19 B

である。

[0105] 図 13の表記記号 r の情報要求文についての要求解析により得られた候補とその

A

解析スコアは、先の実施例 1で図 15を用いて説明したとおりであり、要求番号 19で特定される要求内容 Q を候補とする第 1解析候補 S (r )の解析スコアは—25であり、

19 1 A

要求内容 Q を候補とする第 2解析候補 S (r )の解析スコアは 35であり、要求内

15 2 A

容 Qを候補とする第 3解析候補 S (r )の解析スコアは— 40である。

0 3 A

[0106] 従って、上記表記記号 rの要求文 (第 1候補)の音声認識スコアとして— 20が、要

B

求解析結果として、要求内容 Q (解析スコア =ー35)、要求内容 Q (解析スコア =

15 0

-40)、要求内容 Q (解析スコア =—45)が要求候補スコア計算手段 304aに出力

19

される。同様にして、上記表記記号 r の要求文 (第 2候補)の音声認識スコアとして

A

22が、要求解析結果として、要求内容 Q (解析スコア = 25)、要求内容 Q (解析

19 15 スコア = 35)、要求内容 Q (解析スコア =—40)が要求候補スコア計算手段 304a

0

に出力されることとなる。 [0107] そして、先に図 4のステップ B4で説明したように、要求候補スコア計算手段 304aが、上記音声認識結果の各候補の音声認識スコアと、要求内容番号とその要求解析スコアを、要求候補スコアテーブル記憶手段 403に記録する。

[0108] 図 17は、上記表記記号!：の要求文 (第 1候補)と上記表記記号 rの要求文 (第 2候

B A

補）について、各音声認識スコアと、要求内容番号とその要求解析スコアの記録したテーブルの一例である。

[0109] さらに、要求候補スコア計算手段 304aは、上記したテーブルに記録された音声認識スコアと要求解析スコアを組み合わせることにより、入力された情報要求文に対する要求内容の全候補に対して統合スコアを計算し、要求内容番号を統合スコアとともに出力する。

[0110] 上記統合スコアの計算には、例えば、下記（1)式を用いることができる。ここで、 R— Scoreは音声認識スコア、 P— Scoreは解析スコア、 α , j8 (a >0, j8 >0)は結合パラメータ、 Θは要求解析の解析スコアに対する閾値である。

[0111] [数 1]

Score (η , Q.) = a -R_Score {η)+ β - p _ Score (S_m(r,)),0) （1)

[0112] 例えば、上記（1)式 (但し、 α = β =1, Θ = 100)を用いて、音声認識結果の各候補に対する要求内容番号毎の統合スコアを計算すると、図 18に示すとおりとなる。図 18を参照すると、上記表記記号 rの要求文 (第 1候補）に対して、 ··· 55(Q = Q

B 1

)、 ···、一 65(Q = Q )、 ···、一 60(Q = Q )、と上記表記記号 r の要求文（第 2候

5 19 0 A

補）に対して 57(Q Q 47(Q Q ) 62(Q Q )とい

15 19 0 つた結果が得られている。

[0113] そして、先に図 4のステップ B5で説明したように、要求識別結果生成手段 302bが、要求候補スコア計算手段 304aで得られた入力要求文の全候補を統合スコア順にソートすると、図 18の結果の場合、 Score (Q ) =—47 Score(Q )=-55, Score (

19 15

Q ) =— 60· · ·となる。そして、最尤の候補である、最もスコアの高い Q = Q が生成

0 19

•出力される。

[0114] ここで、注意すべきことは、入力音声が、図 13の表記記号 rであり、その音声認識

A 結果として図 13の表記記号 rの方が音声認識スコアが高力つたにもかかわらず、上

B

記した要求解析結果を組み合わせることにより、第 1実施例と同様に正しい結果が得られていることである。このように、本発明の第 2の実施形態 (実施例)では、音声認識誤りの影響を最小限に抑え、精度良く要求内容を識別することが可能となっている。

[0115] [実施例 3]

以下、第 3実施例として、上記した本発明の第 3の実施形態の動作を、図 5、図 6と、図 13、図 14、図 16、図 19、図 20の補助図面を参照して、具体的に説明する。

[0116] 本実施例では、図 6のステップ A1にて、入力装置 100aに、「ショートメール受信機能画面は設定できますか」（図 13の表記記号!：）との情報要求文が入力されたものと

B

して説明する。

[0117] 先に図 6のステップ A2で説明したように、要求解析処理手段 301aが、共通ルール記憶手段 401、要求固有ルール記憶手段 402より、共通ルールと、要求固有ルールとを用いて、前記した図 13の表記記号 rの要求文について要求解析処理を行い、

B

入力要求文に対する構文構造を生成することにより、入力要求文に対する要求解析結果の複数候補として、入力要求文に対する要求内容番号とその要求解析スコアのリストを出力する。

[0118] 図 13の表記記号 rの情報要求文についての要求解析により得られた候補とその

B

解析スコアは、先の実施例 2で図 16を用いて説明したとおりであり、要求番号 19で特定される要求内容 Q を候補とする第 1解析候補 S (r )の解析スコアは—35であり、

15 1 B

要求内容 Qを候補とする第 2解析候補 S (r )の解析スコアは 40であり、要求内容

0 2 B

Q を候補とする第 3解析候補 S (r )の解析スコアは— 45である。

19 3 B

[0119] 先に図 6のステップ C1で説明したように、類似文書検索処理手段 305aが、入力された情報要求文のテキストデータを検索要求として、回答要求データ記憶手段 404 に記憶された文書データを対象に類似文書検索を行い、検索結果として要求内容番号と類似文書検索スコアを求め、要求内容番号とその類似文書検索スコアの組を出力する。

[0120] 図 19は、表記記号 r〜r の情報要求文と、回答要求データ記憶手段 404に記憶さ

A C

れた内容との類似検索を行った場合の類似文書検索スコアとの関係を表した図である。

以下、図 19に示されたように、表記記号 rの情報要求文に対し、各要求内容番号

B

に対する類似文書検索スコアとして、…、 +3 (Q = Q )、 ···、 +15(Q = Q )、 ···

15 19

、が得られたものとして説明する。

[0121] そして、先に図 6のステップ C2で説明したように、要求候補スコア計算手段 304bは、上記したテーブルに記録された類似文書検索スコアと要求解析スコアを組み合わせることにより、入力された情報要求文に対する要求内容の全候補に対して統合スコァを計算し、要求内容番号を統合スコアとともに出力する。

[0122] 上記統合スコアの計算には、例えば、下記（2)式を用いることができる。ここで、 P— Scoreは解析スコア、 IR— Scoreは類似文書検索スコア、 α , j8 (a >0, j8 >0)は結合パラメータ、 Θは要求解析の解析スコアに対する閾値である。

[0123] [数 2]

Score (η ,Q = a- _{^ __^Ρ _Score (S r,)),©) + β - IR_Score (η , Q) … （2)

[0124] 例えば、上記（2)式 (但し、 α = β =1, Θ = 100)を用いて、要求内容番号毎の統合スコア Score (r, Q)を計算すると、図 20に示すとおりとなる。図 20を参照すると、

1 i

上記表記記号 rの要求文 (第 1候補）に対して、 ···、 -32(Q = Q )、 ···、一 30(Q

B 15

=Q ), ···、 -40(Q = Q )、といった結果が得られている。

19 0

[0125] そして、先に図 6のステップ B5で説明したように、要求識別結果生成手段 302bが、これら全候補をスコア順にソートし、最もスコアの高い候補を最尤とし、その要求内容番号を識別結果として生成し、出力装置 200に送る。図 20に例示した要求解析結果の場合、上記スコア順に、要求内容 Q (解析スコア = 30)、要求内容 Q (解析ス

19 15 コア = 32)、要求内容 Q (解析スコア =ー 40)が得られ、最もスコアの高い要求内

0

容 Q

19が識別結果として生成される。

[0126] 本実施例においても、図 13の表記記号 rの入力テキストに対し、その類似文書検

B

索結果と、要求解析結果を組み合わせることにより、第 1実施例と同様に正しい結果が得られていることである。このように、本発明の第 3の実施形態 (実施例)でも、未知の要求文や音声認識誤りに対する影響を最小限に抑え、精度良く要求内容を識別することが可能となって、る。

[0127] [実施例 4]

以下、第 4実施例として、上記した本発明の第 4の実施形態の動作を、図 7、図 8と、図 13、図 14、図 16、図 19、図 21〜図 23の補助図面を参照して、具体的に説明する。

[0128] 本実施例では、図 8のステップ B1にて、入力装置 100bに、「ショートメール受信時の画面は設定できます力」（図 13の表記記号 r )との音声にて情報要求文が入力さ

A

れたものとして説明する。

[0129] そして、音声認識処理手段 303における音声認識処理の結果（図 8のステップ B2) 、情報要求文の第 1候補として、図 13の表記記号!：の情報要求文 (音声認識スコア

C

B

22)とが得られたものとする。

[0130] そして、先に図 8のステップ B3で説明したように、要求解析処理手段 301bが、共通ルール記憶手段 401、要求固有ルール記憶手段 402より、共通ルールと、要求固有ルールとを用いて、前記した図 13の表記記号 r、rの要求文について要求解析処

C B

[0131] 図 21は、要求解析処理手段 301bが、図 14に示すような共通ルール (a)及び (b)、要求内容固有ルール (a)及び (b)を用いて、図 13の表記記号 r の情報要求文の要

C

求解析により得られた候補とその解析スコアを表した図である。図 21を参照すると、要求内容 Qを候補とする第 1解析候補 S (r )の解析スコアは— 50である。

0 1 C

[0132] 図 13の表記記号 rの情報要求文についての要求解析により得られた候補とその

B

解析スコアは、先の実施例 2で図 16を用いて説明したとおりであり、要求内容番号 1 9で特定される要求内容 Q を候補とする第 1解析候補 S (r )の解析スコアは 35

15 1 B

であり、要求内容 Qを候補とする第 2解析候補 S (r )の解析スコアは—40であり、要

0 2 B

求内容 Q を候補とする第 3解析候補 S (r )の解析スコアは— 45である。

19 3 B

[0133] 続いて、先に図 8のステップ D1で説明したように、類似文書検索処理手段 305bが、音声認識処理手段 303で得られた音声認識結果の前記第 1候補、第 2候補を検索要求として、回答要求データ記憶手段 404に記憶された文書データを対象に類似文書検索を行い、検索結果として要求内容番号と類似文書検索スコアを求め、要求内容番号とその類似文書検索スコアの組を出力する。

[0134] 上記類似文書検索の結果、図 19に示したように、表記記号 rの情報要求文に対し

C

、各要求内容番号に対する類似文書検索スコアとして、 ···、 +2(Q = Q )、 ···

15 、 +

2(Q = Q )、 ···、が得られ、表記記号 rの情報要求文に対し、各要求内容番号に

19

対する類似文書検索スコアとして、…、 +3 (Q = Q )、 ···、 +15(Q = Q )、 ···、

15 19 が得られたものとして説明する。

[0135] そして、先に図 8のステップ D2で説明したように、要求候補スコア計算手段 304cが

、上記音声認識結果の各候補の音声認識スコアと、要求内容番号とその要求解析スコアを、要求候補スコアテーブル記憶手段 403に記録する。

[0136] 図 22は、上記表記記号 rの要求文 (第 1候補）と上記表記記号 rの要求文 (第 2候

C B

補）について、各音声認識スコアと、要求内容番号とその要求解析スコアを記録したテーブルの一例である。

[0137] さらに、要求候補スコア計算手段 304cは、上記したテーブルに記録された音声認識スコアと要求解析スコアと類似文書検索スコアを組み合わせることにより、入力された情報要求文に対する要求内容の全候補に対して統合スコアを計算し、要求内容番号を統合スコアとともに出力する。

[0138] 上記統合スコアの計算には、例えば、下記（3)式を用いることができる。ここで、 R—

Scoreは音声認識スコア、 P— Scoreは解析スコア、 IR— Scoreは類似文書検索スコ了ヽ（X, β , y (α>0, β >0, γ >0)は結合パラメータ、 Θは要求解析の解析スコァに対する閾値である。

[0139] [数 3]

Score (rj,Qi) = a-R_ Score (η ) +

β '

- ^IR-^Score (^r> ' ) … (3) [0140] 例えば、上記（3)式 (但し、 α = β = γ =1, Θ = 100)を用いて、要求内容番号毎の統合スコア Score (r, Q)を計算すると、図 23〖こ示すとおりとなる。図 23を参照する

1 i

と、音声認識結果の表記記号 rの要求文 (第 1候補）に対して、 ···、 118(Q = Q

C 15

)、 ···、— 118(Q = Q )、 ···、 -70(Q = Q )、といった結果が得られ、音声認識

19 0

結果の表記記号 rの要求文 (第 2候補）に対して、 ···、—54(Q = Q )、 ···、 52

B 15

(Q = Q ), ···、 -62(Q = Q )、といった結果が得られている。

19 0

[0141] そして、先に図 8のステップ B5で説明したように、要求識別結果生成手段 302bが、これら全候補をスコア順にソートし、最もスコアの高い候補を最尤とし、その要求内容番号を識別結果として生成し、出力装置 200に送る。図 23に例示した要求解析結果の場合、上記スコア順に、要求内容 Q (解析スコア = 52)、要求内容 Q (解析ス

19 15 コア = 54)、要求内容 Q (解析スコア = 62)が得られ、最もスコアの高い要求内

0

容 Q

19が識別結果として生成される。

[0142] 上記したように、本実施例においても、比較的元の発声文を正しく認識している音声認識結果の第 2候補!：に対する要求解析結果と類似文書検索に基づいて、要求

B

内容番号 Q = Q

19が最尤の識別結果であると判断している。このように、精度良く要求内容を識別できている理由は、音声入力された情報要求文に対し、その音声認識結果、その類似文書検索結果と、要求解析結果を相補的に用いて音声認識誤りの影響を最小限に抑えていることにある。

[0143] [実施例 5]

以下、第 5実施例として、上記した本発明の第 5の実施形態の動作を、図 9、図 10と、図 13、図 24〜図 25の補助図面を参照して、具体的に説明する。

[0144] 本実施例では、図 10のステップ A1にて、入力装置 100aに、「ショートメール受信時の画面は設定できますか」（図 13の表記記号 r )との情報要求文が入力されたもの

A

として説明する。図 24は、共通ルール (a)及び (b)と、要求固有ルール記憶手段 40 2bに区別して格納された要求内容固有ルールの具体例を表した図である（各ルールは全体の一部を示す。；)。なお、図 24の要求内容固有ルール 19 (a)及び (b)は、要求内容番号 19に固有の要求固有ルール 19の一部であり、図 14に例示した要求固有ルールとの相違点は、要求内容番号が省略されている点である。 [0145] 続いて、先に図 10のステップ Elで説明したように、要求解析処理手段 301cが、共通ルール記憶手段 401、要求固有ルール記憶手段 402bより、共通ルールと、規則切替手段 306aが順次切り替える要求固有ルールとを用いて、前記した図 13の表記記号 r の要求文について要求解析処理を行い、入力要求文に対して共通ルールと

A

すべての要求固有ルール力いずれかを順次用いて構文構造を生成することにより

、入力要求文に対する要求解析結果の複数候補として、入力要求文に対する要求内容番号とその要求解析スコアのリストを出力する。

[0146] 図 25は、要求解析処理手段 301cが、図 24に示すような共通ルール (a)及び (b)、要求内容固有ルール 19 (a)及び (b)を用いて、図 13の表記記号 r の情報要求文の

A

要求解析により得た第 1解析候補 S⁽¹⁹⁾ (r )とその解析スコア、共通ルールと要求内

1 A

容固有ルール 15を用いた第 1解析候補 S⁽¹⁵⁾ (r )とその解析スコア、共通ルールの

1 A

みを用いた第 1解析候補 S^(c>) (r )を表した図である。図 25を参照すると、要求内容

1 A

Q を候補とする第 1解析候補 S(¹⁹⁾ (r )の解析スコアは—25であり、要求内容 Q

19 1 A 15 を候補とする第 1解析候補 S(¹⁵⁾ (r )の解析スコアは— 35であり、要求内容 Qを候

1 A 0 補とする第 1解析候補 S^(G) (r )の解析スコアは— 40である。

1 A

[0147] そして、先に図 10のステップ A3で説明したように、要求識別結果生成手段 302aが、これら全候補をスコア順にソートし、最もスコアの高い候補を最尤とし、その要求内容番号を識別結果として生成し、出力装置 200に送る。図 25に例示した要求解析結果の場合、上記スコア順に、要求内容 Q (解析スコア = 25)、要求内容 Q (解析

19 15 スコア = 35)、要求内容 Q (解析スコア =ー 40)が得られ、最もスコアの高い第 1

0

解析候補 S⁽¹⁹⁾ (r )の要求内容 Q が識別結果として生成される。

1 A 19

[0148] [実施例 6]

以下、第 6実施例として、上記した本発明の第 6の実施形態の動作を、図 11、図 12 と、図 13、図 24、図 26〜図 30の補助図面を参照して、具体的に説明する。

[0149] 本実施例では、図 12のステップ A1にて、入力装置 100aに、「ショートメール受信時の画面は設定できますか」（図 13の表記記号 r )との情報要求文が入力された場

A

合と、「ショートメール受信時の設定はできますか」（図 26の表記記号 r )との情報要

D

求文が入力された場合について説明する。 [0150] 図 27は、要求内容多階層クラスタ 405の具体例を表した図であり、要求内容クラスタ番号 (C1〜C121〜CN)と、各要求内容クラスタに含まれる要求内容番号が定義された構成となっている。例えば、要求内容クラスタ 1 (C1)は、互いに類似する要求内容番号 1、 5が定義付けられており、要求内容クラスタ 3 (C3)は、互いに類似する要求内容番号 19、 20が定義付けられている。

[0151] 図 28は、要求内容番号 20および要求内容クラスタ 3 (C3)に対する要求クラスタ固有ルールの具体例を示した図である。なお、図 28の要求内容固有ルール 20 (a)及び (b)は、要求内容番号 20に固有の要求固有ルール 20の一部であり、要求クラスタ固有ルール 3は、要求内容クラスタ 3 (C3)に固有の要求固有ルールの一部である。

[0152] 続いて、先に図 12のステップ F1で説明したように、要求解析処理手段 301dが、共通ルールと、要求固有ルール記憶手段 402b及び要求クラスタ固有ルール記憶手段 406に記憶された要求固有ルールのうち、規則切替手段 306bが順次切り替える要求固有ルールの集合とを用いて、前記した図 13の表記記号 r の要求文について要

A

求解析処理を行い、入力要求文に対して共通ルールと、要求内容クラスタに対応する要求固有ルールの集合を順次用いて構文構造を生成することにより、入力要求文に対する要求解析結果の複数候補として、入力要求文に対する要求内容クラスタ（要求内容番号の集合で表現される）とその要求解析スコアのリストを出力する。

[0153] 図 29は、要求解析処理手段 30 Idが、図 24に示すような共通ルール (a)及び (b)、要求内容固有ルール 19 (a)及び (b)を用いて図 13の表記記号 r の情報要求文の

A

要求解析により得た第 1解析候補 S⁽¹⁹⁾ (r )とその解析スコア、共通ルールと図 28に

1 A

示すような要求内容固有ルール 20 (a)及び (b)を用いた第 1解析候補 S(^2C>) (r )、要

1 A 求内容クラスタ 3 (C3；図 27参照）に対応する要求内容固有ルール 19、要求内容固有ルール 20及び図 28に示すような要求クラスタ固有ルール 3 (C3)を用いた第 1解析候補 S^(e3) (r )を表した図である。

1 A

[0154] 図 29を参照すると、要求内容 Q を候補とする第 1解析候補 S⁽¹⁹⁾ (r )の解析スコ

19 1 A

ァは— 25であり、要求内容 Q を候補とする第 1解析候補 S(^2C>) (r )の解析スコアは

20 1 A

— 35であり、要求内容クラスタ 3 (C3)を候補とする第 1解析候補 S^(G3) (r )の解析ス

1 A コアは一 25である。 [0155] そして、先に図 12のステップ F2で説明したように、要求識別結果生成手段 302cが、これら全候補をスコア順にソートし、最もスコアの高い候補を最尤とし、その要求内容クラスタを識別結果として生成し、出力装置 200に送る。図 29に例示した要求解析結果の場合、上記スコア順（同スコアの場合、クラスタ構成要素が少ない方から上位に並べる）に、要求内容 Q (解析スコア = 25)、要求内容クラスタ 3 (解析スコア =

19

— 25)、要求内容 Q (解析スコア = 35)が得られ、最もスコアの高い S(¹⁹) (r )の

20 1 A 要求内容 Q

19が識別結果として生成される。

[0156] また、図 12のステップ A1にて、入力装置 100aに、「ショートメール受信時の設定はできますか」（図 26の表記記号!：）との情報要求文が入力された場合も同様である。

D

[0157] 図 30は、要求解析処理手段 30 Idが、図 24に示すような共通ルール (a)及び (b)、要求内容固有ルール 19 (a)及び (b)を用いて図 26の表記記号 rの情報要求文の

D

1 D

1 D 求内容クラスタ 3 (C3)に対応する要求内容固有ルール 19、要求内容固有ルール 20 及び図 28に示すような要求クラスタ固有ルール C3を用いた第 1解析候補 S^(e3) (r )

1 D を表した図である。

[0158] 図 30を参照すると、要求内容 Q を候補とする第 1解析候補 S⁽¹⁹⁾ (r )と要求内容

19 1 D

Q を候補とする第 1解析候補 S(^2G) (r )は共通ルールのみに基づく同一構造で解

20 1 D

析スコアも共に— 45である。一方、要求内容クラスタ C3を候補とする第 1解析候補 S⁽ ^C3) (r )の解析スコアは— 30である。

1 D

[0159] そして、先に図 12のステップ F2で説明したように、要求識別結果生成手段 302cが、これら全候補をスコア順にソートし、最もスコアの高い候補を最尤とし、その要求内容クラスタを識別結果として生成し、出力装置 200に送る。図 30に例示した要求解析結果の場合、上記スコア順（同スコアの場合、クラスタ構成要素が少ない方から上位に並べる）に、要求内容クラスタ 3 (解析スコア = 30)、要求内容 Q (解析スコア =

19

—45)、要求内容 Q (解析スコア =—45)が得られ、最もスコアの高い S(^C3) (r )の

20 I D 要求内容クラスタ C3が識別結果として生成される。

[0160] このように本実施例では、特定の要求内容番号に対応しない入力要求文であっても、その上位階層の要求内容クラスタに識別され、結果を出力することができる。以上、本発明を実施するための形態及びこれに即応した各実施例を説明したが、本発明の技術的範囲は、上述した実施形態及び実施例の記載に限定されるものではなぐ要求内容の識別を必要とするシステムの用途、仕様等に応じて、各種の変形をカロえることが可能であることは、うまでもな!/、。

Claims

請求の範囲

[1] 自然言語形式で入力された要求文 (入力要求文)を解析し、要求内容を識別する要求内容識別システムであって、

要求内容に依存しない共通規則と、各要求内容に固有の要求固有規則とを用いて、前記入力要求文に対する構文解析を行い、要求内容の識別を行うこと、

を特徴とする要求内容識別システム。

[2] 自然言語形式で入力された要求文 (入力要求文)を解析し、要求内容を識別する要求内容識別システムであって、

要求内容に依存しない共通規則を記憶する共通規則記憶手段と、

各要求内容に固有の要求固有規則を記憶する要求固有規則記憶手段と、前記共通規則と前記要求固有規則を用いて入力要求文に対する構文解析を行う要求解析処理手段と、

前記構文解析の結果から要求内容の識別結果を生成する要求識別結果生成手段と

を備えたことを特徴とする要求内容識別システム。

[3] 前記要求解析処理手段が、前記入力要求文に対して、予め用意された要求内容との適合の度合いを示す解析スコアとともに解析結果候補を複数生成し、

前記要求識別結果生成手段が、前記解析スコアに基づいて、最尤の解析結果候補を選択し、要求内容の識別結果を生成すること、

を特徴とする請求項 2に記載の要求内容識別システム。

[4] 更に、音声入力された入力要求文に対して音声認識処理を行って音声認識結果候補を生成する音声認識処理手段を備え、

前記要求解析処理手段が、前記音声認識結果候補に対して、予め用意された要求内容との適合の度合いを示す解析スコアとともに解析結果候補を複数生成し、前記要求識別結果生成手段が、前記解析スコアに基づいて、最尤の解析結果候補を選択し、要求内容の識別結果を生成すること、

を特徴とする請求項 2に記載の要求内容識別システム。

[5] 更に、前記解析スコアに加えて、音声認識結果と音声認識結果候補との適合の度合いを示す認識スコアを加味した統合スコアを算出する要求候補スコア計算手段を備え、

前記要求識別結果生成手段が、前記統合スコアに基づいて、最尤の解析結果候補を選択すること、

を特徴とする請求項 3に記載の要求内容識別システム。

[6] 更に、所定の回答文書データ集合及び要求文データ集合の少なくとも一方を検索対象として、前記入力要求文に類似するデータを検索する類似検索処理を行って、前記入力要求文との適合の度合いを示す検索スコアとともに検索結果候補を求める類似文書検索処理手段と、

前記解析スコアに加えて、前記検索スコアを加味した統合スコアを算出する要求候補スコア計算手段とを備え、

を特徴とする請求項 3に記載の要求内容識別システム。

[7] 更に、音声入力された入力要求文に対して音声認識処理を行って音声認識結果候補を生成する音声認識処理手段を備え、

前記類似文書検索処理手段が、所定の回答文書データ集合及び要求文データ集合の少なくとも一方を検索対象として、前記音声認識結果候補に類似するデータを検索する類似検索処理を行って、前記各音声認識結果候補との適合の度合!、を示す検索スコアとともに検索結果候補を求め、

前記要求候補スコア計算手段が、前記解析スコアと検索スコアに加えて、前記音声認識結果候補との適合の度合いを示す認識スコアを加味した統合スコアを算出し、前記要求識別結果生成手段が、該統合スコアに基づいて、最尤の解析結果候補を選択すること、

を特徴とする請求項 6に記載の要求内容識別システム。

[8] 前記要求固有規則記憶手段は、前記要求固有規則を要求内容毎に区分けして記憶しており、

前記要求解析処理手段は、前記共通規則と前記区分けされた要求固有規則を順次切り替えて入力要求文に対する構文解析を行うこと、

を特徴とする請求項 2から請求項 7いずれかに記載の要求内容識別システム。

[9] 更に、類似する要求内容をクラスタ化した要求内容クラスタを記憶する要求内容クラスタ記憶手段を有し、

前記要求識別結果生成手段が、前記要求内容クラスタ毎に、少なくとも前記解析スコアを集計して、最尤の解析結果候補クラスタを選択し、要求内容の識別結果として生成すること、

を特徴とする請求項 3から請求項 8いずれか一に記載の要求内容識別システム。

[10] 要求内容に依存しない共通規則を記憶する共通規則記憶手段と、各要求内容に固有の要求固有規則を記憶する要求固有規則記憶手段と、を備えるコンピュータに入力された自然言語形式による要求内容を識別する要求内容識別方法であって、前記コンピュータが、前記共通規則と前記要求固有規則を用いて要求文 (入力要求文）に対する構文解析を行うステップと、

前記コンピュータが、前記構文解析の結果から要求内容の識別結果を生成するステツプと、を含むこと、

を特徴とする自然言語による要求内容の識別方法。

[11] 要求内容に依存しない共通規則を記憶する共通規則記憶手段と、各要求内容に固有の要求固有規則を記憶する要求固有規則記憶手段と、を備えるコンピュータに実行させるプログラムであって、

入力された自然言語による要求文 (入力要求文）に対して、前記共通規則と前記要求固有規則を用いて要求解析を行う処理と、

前記構文解析の結果から要求内容の識別結果を生成する処理と、を前記コンビュータに実行させて、該コンピュータを、自然言語形式の要求内容を識別する手段として機能させるためのプログラム。