JP2004139446A - 日常言語コンピュータシステムで用いられる秘書エージェントシステム、秘書エージェントプログラムおよび対話プランニング方法 - Google Patents

日常言語コンピュータシステムで用いられる秘書エージェントシステム、秘書エージェントプログラムおよび対話プランニング方法 Download PDF

Info

Publication number
JP2004139446A
JP2004139446A JP2002304842A JP2002304842A JP2004139446A JP 2004139446 A JP2004139446 A JP 2004139446A JP 2002304842 A JP2002304842 A JP 2002304842A JP 2002304842 A JP2002304842 A JP 2002304842A JP 2004139446 A JP2004139446 A JP 2004139446A
Authority
JP
Japan
Prior art keywords
language
user
plan
unit
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002304842A
Other languages
English (en)
Inventor
Shino Iwashita
岩 下 志 乃
Toru Sugimoto
杉 本   徹
Michio Sugano
菅 野 道 夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
RIKEN Institute of Physical and Chemical Research
Original Assignee
RIKEN Institute of Physical and Chemical Research
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by RIKEN Institute of Physical and Chemical Research filed Critical RIKEN Institute of Physical and Chemical Research
Priority to JP2002304842A priority Critical patent/JP2004139446A/ja
Publication of JP2004139446A publication Critical patent/JP2004139446A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

【課題】ユーザと日常言語コンピュータシステムとの間での言語テクストの対話的なやりとりを個々のユーザに特化した形で柔軟にかつ精密に行うことができる秘書エージェントシステムを提供する。
【解決手段】秘書エージェントシステム10は、言語理解・生成モジュール20において、ユーザの個人的な特徴に関する知識を蓄積する知識ベースであるクライアントモデル部40を参照して、ユーザに特化した言語テクストの意味理解および生成を行う。また、プランモジュール30において、対話のパターンを当該対話の各段階に対応する複数のステージ間の関係として表す複数のインタラクションプランユニット35と、進行中の対話の構造を各インタラクションプランユニット35間の依存関係として表すプラン構造37と、ユーザの個人的な特徴に関する知識を蓄積する知識ベースであるクライアントモデル部40を参照して、ユーザに特化した対話プランニングを行う。
【選択図】 図1

Description

【0001】
【発明の属する技術分野】
本発明は、人間が日常的に用いる言語(日常言語)の意味の体系を構造化したセミオティックベースに基づいて言語テクストの処理を行う日常言語コンピュータシステムに係り、とりわけ、ユーザと日常言語コンピュータシステムとの間での言語テクストの対話的なやりとりを支援する秘書エージェントシステムおよび秘書エージェントプログラムに関する。また、本発明は、このような秘書エージェントシステムで好適に用いられ、ユーザと日常言語コンピュータシステムとの間で行われる対話の流れを制御する対話プランニング方法に関する。
【0002】
【従来の技術】
近年、情報処理技術や通信技術などの急速な発展により、我々の生活の至るところでコンピュータが用いられるようになってきている。このような高度情報化社会においては、コンピュータなどの専門的な知識が少ない一般的なユーザでも簡単にコンピュータを扱えることが望まれるが、実際には、コンピュータを扱える人は専門的な知識を持った一部の人に限られているのが現状である。
【0003】
このような背景の下で、コンピュータの操作性を向上させるための各種の手法が提案されており、例えば、特許文献1には、ユーザとの間で自然言語による対話を実現する対話システムが提案されている。また、非特許文献1には、対話システムにおける自然言語による対話プランニングおよびそれに用いられるユーザモデルが提案されている。さらに、対話システムにおける具体的な対話の制御方法として、特許文献2には、対話の一貫性を損なうことなくユーザによる割り込みをいつでも受け付けることを可能にするための、談話ゴールに基づく対話制御方法が提案されている。また、非特許文献2には、ユーザが電話を通して電子メールシステムにアクセスすることを可能にするための、対話構造のモデルを用いた相互主導型の対話管理方式が提案されている。
【0004】
一方、このような対話システムを用いた手法以外にも、個々のユーザごとに情報の提供の仕方を変えることにより、コンピュータの操作性を向上させる手法が提案されている。例えば、特許文献3には、見学者が展示会場を簡単に移動できるとともに見学者のプライバシーを保護できるような個人化情報提示方法が提案されている。また、非特許文献3には、互いに関連度を持つキーワードの集合から作成された概念空間を用い、ユーザの興味を、ユーザとコンピュータとの間の質問/回答の対話を通して推定することにより、情報提供を個人化していく方法が提案されている。さらに、非特許文献4には、過去のユーザプロファイルと現在閲覧したホームページの特徴ベクトルとを合成するパラメータを設定することにより、個人の嗜好に合ったホームページを推薦することを可能にするソフトウェアが提案されている。
【0005】
【特許文献1】
特開2002−162993号公報
【特許文献2】
特開2001−356797号公報
【特許文献3】
特開2000−172238号公報
【非特許文献1】
熊本 忠彦,「自然言語対話システムにおける協調的応答の生成」,人工知能学会論文誌,Vol.14,No.1,pp.3−10,1999
【非特許文献2】
Sandra Williams and Martlesham Heath, ”Dialogue management in a mixed−initiative, cooperative, spoken language system,” 11th Twente Workshop on Language Technology (TWLT11) Dialogue Management in Natural Language Systems, Enschade, Netherlands, June 1996
【非特許文献3】
角 薫,角 康之,間瀬 健二,中須賀 真一,堀 浩一,「個人の概念空間を利用した興味の推定による情報提供」,電子情報通信学会論文誌,Vol.J82−D−II,No.10,pp.1634−1644
【非特許文献4】
九津見 洋,内藤 榮一,荒木 昭一,江村 里志,新居 薫治,「ユーザ適応型ホームページ推薦ソフト“ウェブナビゲーター”の開発」,電子情報通信学会論文誌,Vol.J−84−D−II,No.6,pp.1149−1157
【0006】
【発明が解決しようとする課題】
しかしながら、上述した従来の手法はいずれも、既存のコンピュータシステムを前提とするものであり、ユーザとの対話を表面的には実現することができるものの、内部で行われる情報処理はあくまでも数値や記号などに基づいた演算処理に過ぎず、ユーザの発話の意味を理解した上で情報処理を行っているわけではない。このため、このようなコンピュータを利用するユーザは、依然として、コンピュータで行われる情報処理の内容や操作などを正確に理解した上でコンピュータを操作する必要があり、コンピュータなどの専門的な知識が少ない一般的なユーザには依然として使いこなすことが困難であるという問題がある。
【0007】
このような背景の下で、本発明者らは、日常生活において家電製品と同じような感覚で誰でも簡単にコンピュータを扱えることができるようにするため、新しいパラダイムに基づくコンピュータシステム(「日常言語コンピュータシステム」)を提案している(特開2002−236681号公報、特願2002−154688号および特願2002−154823号参照)。本発明者らが提案する日常言語コンピュータシステムは、日常言語の意味の体系を構造化したセミオティックベースに基づいて言語テクストの処理を行うものであり、全ての情報処理を日常言語をベースとして実行することにより、ユーザとコンピュータとが日常言語により直接対話することを可能にするものである。なお、特願2002−154688号および特願2002−154823号は出願時点において未公開の出願であるが、特願2002−154688号に関連する論文として、論文1(高橋 祐介,伊藤 紀子,藤城 浩子,菅野 道夫,「セミオティックベースにおけるコンテクスト層の検討」,2002年度人工知能学会全国大会(第16回),3B1−02,May 2002)があり、特願2002−154823号に関連する論文として、論文2(岩爪 道昭,小林 一郎,杉本 徹,岩下 志乃,菅野 道夫,「日常言語コンピューティング(第2報)‐日常言語に基づく計算機資源の管理・実行環境を目指して‐」,2002年度人工知能学会全国大会(第16回),3B1−01,May 2002)および論文3(小林 一郎,岩爪 道昭,杉本 徹,岩下 志乃,菅野 道夫,「自然言語をコンピュータの通信規約にした通信手法の提案」,2002年度人工知能学会全国大会(第16回),3B1−04,May 2002)があるので、併せて参照されたい。
【0008】
本発明はこのような日常言語コンピュータシステムを前提としてなされたものであり、ユーザと日常言語コンピュータシステムとの間での言語テクストの対話的なやりとりを個々のユーザに特化した形で柔軟にかつ精密に行うことができる秘書エージェントシステムおよび秘書エージェントプログラムを提供することを目的とする。
【0009】
また、本発明は、このような秘書エージェントシステムで好適に用いられる対話プランニング方法であって、ユーザと日常言語コンピュータシステムとの間で行われる対話の流れを個々のユーザに特化した形で円滑にかつ自然な形で制御することができる対話プランニング方法を提供することを目的とする。
【0010】
【課題を解決するための手段】
本発明は、第1の解決手段として、日常言語の意味の体系を構造化したセミオティックベースに基づいて言語テクストの処理を行う日常言語コンピュータシステムで用いられ、ユーザと日常言語コンピュータシステムとの間での言語テクストの対話的なやりとりを支援する秘書エージェントシステムにおいて、前記日常言語コンピュータシステムの前記セミオティックベースを参照して、前記ユーザから入力された言語テクストの意味理解を行うとともに、言語テクストの言語的特徴に基づいて前記ユーザへ出力される言語テクストの生成を行う言語理解・生成処理部と、前記ユーザと前記日常言語コンピュータシステムとの間で行われる言語テクストに基づく対話の流れを制御するプラン処理部であって、前記言語理解・生成処理部により意味理解を行うことで得られた言語テクストの言語的特徴に基づいて、前記言語理解・生成処理部を介して前記ユーザへ出力される言語テクストの言語的特徴の生成を行うプラン処理部と、前記ユーザの個人的な特徴に関する知識を蓄積するクライアントモデル部とを備え、前記言語理解・生成処理部は、前記セミオティックベースとともに前記クライアントモデル部を参照して、前記ユーザに特化した言語テクストの意味理解および言語テクストの生成を行うことを特徴とする秘書エージェントシステムを提供する。
【0011】
なお、上述した第1の解決手段において、前記プラン処理部は、(a)前記ユーザと前記日常言語コンピュータシステムとの間で行われる対話のパターンを当該対話の各段階に対応する複数のステージ間の関係として表す複数のプランユニットを保持するプランライブラリと、(b)進行中の対話の構造を前記各プランユニット間の依存関係として表すプラン構造と、(c)前記プランライブラリに保持されている前記複数のプランユニットを参照して、前記言語理解・生成処理部により意味理解を行うことで得られた言語テクストの言語的特徴に基づいて前記プラン構造における現時点のステージを同定するステージ同定部と、(d)前記ステージ同定部により同定された現時点のステージに続く可能性のあるステージのうち前記ユーザまたは前記日常言語コンピュータシステム上で稼働する言語アプリケーションや他のエージェントなどに対する発話などの実質的な動作を表すステージである複数のムーブの中から最適なムーブを選択するムーブ選択部とを有することが好ましい。また、前記プラン処理部は、(e)前記プランライブラリに保持されている前記複数のプランユニットを参照して、前記プラン構造における現時点のステージに続く可能性のあるステージのうち前記ユーザの次の発話を表すステージであるムーブを予測する発話予測部をさらに有し、前記プラン処理部の前記ステージ同定部は、前記言語理解・生成処理部により意味理解を行うことで得られた言語テクストの言語的特徴と、前記発話予測部により予測されたムーブとのマッチングを行うことにより、前記プラン構造における現時点のステージを同定することが好ましい。さらに、前記プラン処理部の前記プランライブラリに保持されている前記複数のプランユニットは対話が行われる状況を表す状況タイプごとに分類されており、前記プラン処理部の前記ステージ同定部および前記ムーブ選択部で用いられる前記プラン構造は、状況タイプに対応する複数のサブプラン構造の組み合わせとして管理されていることが好ましい。
【0012】
また、上述した第1の解決手段において、前記プラン処理部の前記プランライブラリに保持されている前記複数のプランユニットの前記各ステージにはそのステージの望ましさを表す数値として選好度が与えられており、前記プラン処理部の前記ムーブ選択部は、前記各プランユニットの前記各ステージに与えられた選好度を参照して、前記複数のムーブの中から最適なムーブを選択することが好ましい。また、前記プラン処理部の前記ムーブ選択部は、前記クライアントモデル部に蓄積されている前記ユーザの個人的な特徴に関する知識を参照して、前記複数のムーブの中から最適なムーブを選択することが好ましい。
【0013】
さらに、上述した第1の解決手段において、前記クライアントモデル部は、前記言語理解・生成処理部を介して前記ユーザから入力された言語テクストに含まれる情報または前記プラン処理部により制御される対話の流れに関する情報に基づいて、前記ユーザの個人的な特徴に関する知識を自律的に学習することが好ましい。
【0014】
さらに、上述した第1の解決手段において、前記クライアントモデル部は、前記ユーザ自身の言語的傾向を記述した言語傾向情報を保持し、前記言語理解・生成処理部は、前記クライアントモデル部に保持されている前記言語傾向情報を参照して、前記ユーザから入力された言語テクストを前記日常言語コンピュータシステムで用いられる適切な言語テクストに換言するとともに、前記日常言語コンピュータシステムから得られた言語テクストを前記ユーザに理解しやすい言語テクストに換言することが好ましい。ここで、前記クライアントモデル部に保持されている前記言語傾向情報はコンピュータ画面上に呈示される文字、図および線を表現する複数の感性語を含むことが好ましい。また、前記クライアントモデル部は、複数のユーザに共通した特徴を記述したプロパティ特性情報をさらに保持し、前記言語理解・生成処理部は、前記クライアントモデル部に保持されている前記言語傾向情報を前記プロパティ特性情報とともに参照して、言語テクストの換言を行うことが好ましい。
【0015】
さらに、上述した第1の解決手段において、前記クライアントモデル部は、前記ユーザ自身のプロフィールを記述したプロパティ情報を保持し、前記言語理解・生成処理部は、前記クライアントモデル部に保持されている前記プロパティ情報を参照して、前記ユーザから入力された言語テクストを部分的に補完するとともに、前記日常言語コンピュータシステムから得られた言語テクストを部分的に省略することが好ましい。また、前記クライアントモデル部は、複数のユーザに共通した特徴を記述したプロパティ特性情報をさらに保持し、前記言語理解・生成処理部は、前記クライアントモデル部に保持されている前記プロパティ情報を前記プロパティ特性情報とともに参照して、言語テクストの補完および省略を行うことが好ましい。
【0016】
さらに、上述した第1の解決手段において、前記クライアントモデル部は、前記ユーザ自身のプロフィールを記述したプロパティ情報を保持し、前記プラン処理部は、前記クライアントモデル部に保持されている前記プロパティ情報を参照して、前記ユーザと前記日常言語コンピュータシステムとの間で行われる対話の流れを制御することが好ましい。また、前記クライアントモデル部は、複数のユーザに共通した特徴を記述したプロパティ特性情報をさらに保持し、前記プラン処理部は、前記クライアントモデル部に保持されている前記プロパティ情報を前記プロパティ特性情報とともに参照して、前記ユーザと前記日常言語コンピュータシステムとの間で行われる対話の流れを制御することが好ましい。
【0017】
本発明は、第2の解決手段として、日常言語の意味の体系を構造化したセミオティックベースに基づいて言語テクストの処理を行う日常言語コンピュータシステムで用いられ、ユーザと前記日常言語コンピュータシステムとの間での言語テクストの対話的なやりとりを支援する秘書エージェントプログラムにおいて、前記日常言語コンピュータシステムの前記セミオティックベースを参照して、前記ユーザから入力された言語テクストの意味理解を行うとともに、言語テクストの言語的特徴に基づいて前記ユーザへ出力される言語テクストの生成を行う言語理解・生成処理機能と、前記ユーザと前記日常言語コンピュータシステムとの間で行われる言語テクストに基づく対話の流れを制御するプラン処理機能であって、前記言語理解・生成処理機能により意味理解を行うことで得られた言語テクストの言語的特徴に基づいて、前記言語理解・生成処理機能を介して前記ユーザへ出力される言語テクストの言語的特徴の生成を行うプラン処理機能とを備え、前記言語理解・生成処理機能は、前記セミオティックベースとともに、あらかじめ用意された前記ユーザの個人的な特徴に関する知識を参照して、前記ユーザに特化した言語テクストの意味理解および言語テクストの生成を行うことを特徴とする秘書エージェントプログラムを提供する。
【0018】
本発明は、第3の解決手段として、日常言語の意味の体系を構造化したセミオティックベースに基づいて言語テクストの処理を行う日常言語コンピュータシステムで用いられる対話プランニング方法において、前記セミオティックベースを参照して意味理解を行うことで得られた言語テクストの言語的特徴を受け取るステップと、前記ユーザと前記日常言語コンピュータシステムとの間で行われる対話のパターンを当該対話の各段階に対応する複数のステージ間の関係として表す複数のプランユニットと、進行中の対話の構造を前記各プランユニット間の依存関係として表すプラン構造とを参照して、前記言語テクストの言語的特徴に基づいて前記プラン構造における現時点のステージを同定するステップと、同定された現時点のステージに続く可能性のあるステージのうち前記ユーザまたは前記日常言語コンピュータシステム上で稼働する言語アプリケーションや他のエージェントなどに対する発話などの実質的な動作を表すステージである複数のムーブの中から最適なムーブを選択し、前記言語理解・生成処理部を介して前記ユーザへ出力される言語テクストの言語的特徴の生成、または前記日常言語コンピュータシステム上で稼働する言語アプリケーションや他のエージェントなどへ出力される操作指示の生成を行うステップとを含むことを特徴とする対話プランニング方法を提供する。
【0019】
なお、上述した第3の解決手段において、前記複数のプランユニットを参照して、前記プラン構造における現時点のステージに続く可能性のあるステージのうち前記ユーザの次の発話を表すステージであるムーブを予測するステップをさらに含み、前記プラン構造における現時点のステージを同定するステップにおいて、意味理解を行うことで得られた言語テクストの言語的特徴と、予測されたムーブとのマッチングを行うことが好ましい。また、前記複数のプランユニットは対話が行われる状況に対応する状況タイプごとに分類されており、前記プラン構造は、状況タイプに対応する複数のサブプラン構造の組み合わせとして管理されていることが好ましい。
【0020】
また、上述した第3の解決手段において、前記複数のプランユニットの前記各ステージにはそのステージの望ましさを表す数値として選好度が与えられており、前記プラン構造における現時点のステージに続く可能性のある前記複数のムーブの中から最適なムーブを選択するステップにおいて、前記各プランユニットの前記各ステージに与えられた選好度を参照することが好ましい。また、前記プラン構造における現時点のステージに続く可能性のある前記複数のムーブの中から最適なムーブを選択するステップにおいて、クライアントモデル部に蓄積されている前記ユーザの個人的な特徴に関する知識を参照するが好ましい。
【0021】
本発明によれば、言語理解・生成処理部において、ユーザの個人的な特徴に関する知識を蓄積する知識ベースであるクライアントモデル部を参照して、ユーザに特化した言語テクストの意味理解および生成を行っているので、ユーザと日常言語コンピュータシステムとの間での言語テクストの対話的なやりとりを個々のユーザに特化した形で柔軟にかつ精密に行うことができる。
【0022】
また、本発明によれば、プラン処理部において、ユーザと日常言語コンピュータシステムとの間で行われる対話のパターンを当該対話の各段階に対応する複数のステージ間の関係として表す複数のプランユニットと、進行中の対話の構造を各プランユニット間の依存関係として表すプラン構造とを参照して、対話プランニングを行っているので、ユーザと日常言語コンピュータシステムとの間で行われる対話の流れを円滑にかつ自然な形で制御することができる。また、プラン処理部において、ユーザの個人的な特徴に関する知識を蓄積する知識ベースであるクライアントモデル部を参照して、対話プランニングを行っているので、ユーザと日常言語コンピュータシステムとの間で行われる対話の流れを個々のユーザに特化した形で行うことができる。
【0023】
【発明の実施の形態】
以下、図面を参照して本発明の実施の形態について説明する。
【0024】
[1.秘書エージェントシステムの全体構成]
図1は本発明の一実施の形態に係る秘書エージェントシステムの全体構成を示すブロック図である。なお、図1に示す秘書エージェントシステム10は、人間が日常的に用いる言語である日常言語を記述または口述した言語テクストの処理を行う日常言語コンピュータシステムに組み込まれて用いられるものであり、ユーザと日常言語コンピュータシステムとの間での言語テクストの対話的なやりとりを支援する窓口となるものである。ここで、日常言語コンピュータシステムは、日常言語の意味の体系を構造化したセミオティックベースに基づいて言語テクストの処理を行うものであり、その詳細については特開2002−236681号公報、特願2002−154688号および特願2002−154823号に記載されているとおりであるので、詳細な説明は省略する。なお、日常言語コンピュータシステムが、ネットワークを介してクライアント側コンピュータおよびネットワーク側コンピュータが接続されたような分散構成をとる場合には、秘書エージェントシステム10は、ユーザにより直接操作されるクライアント側コンピュータ上で稼働するクライアント秘書エージェントシステムの形態をとることが好ましい。
【0025】
図1に示すように、秘書エージェントシステム10は、言語理解・生成モジュール(言語理解・生成処理部)20と、プランモジュール(プラン処理部)30と、クライアントモデル部40とを備えている。
【0026】
このうち、言語理解・生成モジュール20は、セミオティックベース60を参照して、ユーザから入力された言語テクストの意味理解を行うとともに、言語テクストの言語的特徴に基づいてユーザへ出力される言語テクストの生成を行うモジュールである。ここで、セミオティックベース60は、言語テクストの意味理解および生成のために有効な形で日常言語の意味の体系を構造化したデータベースであり、汎用電子化辞書61、コンテクストベース62、意味ベース63、語彙文法ベース64および状況依存辞書65を有している。言語理解・生成モジュール20は、このようなセミオティックベース60を参照して、言語テクストを状況、意味、語彙文法および表現の4種類の観点から分析し、言語テクストの意味理解および生成を行う。なお、ユーザと言語理解・生成モジュール20との間での言語テクストの入出力は外部インタフェース50を介して行われる。
【0027】
プランモジュール30は、言語理解・生成モジュール20から得られた言語テクストの言語的特徴に基づいて秘書エージェントシステム10がとるべき行動(ユーザへの応答(言語テクストの出力)や、日常言語コンピュータシステム上で稼働する言語アプリケーションや他のエージェントへの操作指示)を決定するモジュールである。すなわち、プランモジュール30は、ユーザと日常言語コンピュータシステムとの間で行われる言語テクストに基づく対話の流れを制御し、言語理解・生成モジュール20により意味理解を行うことで得られた言語テクストの言語的特徴に基づいて、言語理解・生成モジュール20を介してユーザへ出力される言語テクストの言語的特徴の生成、または日常言語コンピュータシステム上で稼働する言語アプリケーションや他のエージェントへの操作指示の生成を行うものである。
【0028】
クライアントモデル部40は、ユーザの個人的な特徴に関する知識を蓄積する知識ベースである。なお、クライアントモデル部40は、言語理解・生成モジュール20およびプランモジュール30において利用されるものであり、言語理解・生成モジュール20において、ユーザに特化した言語テクストの意味理解および生成を行ったり、プランモジュール30において、ユーザに特化した対話プランニングを行ったりすることを可能にするものである。
【0029】
以下、秘書エージェントシステム10の各部(言語理解・生成モジュール20、プランモジュール30およびクライアントモデル40)の構成および動作の詳細について説明する。
【0030】
[2. 言語理解・生成モジュール]
まず、言語理解・生成モジュール20の詳細について説明する。
【0031】
図1に示すように、言語理解・生成モジュール20は、マイクやキーボードなどの入力装置(図示せず)により外部インタフェース50を介して入力された音声や文字などの形式の日常言語からなる言語テクストの意味理解を行うためのものであり、セミオティックベース60を参照して一般的な言語知識の範囲で言語テクストの意味理解を行う一般的テクスト理解部21と、クライアントモデル部40に蓄積されているユーザの個人的な特徴に関する知識を参照してユーザに特化した(個人化した)より精密な言語テクストの意味理解を行うユーザ特化テクスト理解部22とを有している。
【0032】
また、言語理解・生成モジュール20は、プランモジュール30により生成された言語テクストの言語的特徴に基づいて言語テクストの生成を行うものであり、セミオティックベース60を参照して一般的な言語知識の範囲で言語テクストの生成を行う一般的テクスト生成部23と、クライアントモデル部40に蓄積されているユーザの個人的な特徴に関する知識を参照してユーザに特化した(個人化した)より精密な言語テクストの生成を行うユーザ特化テクスト生成部24とを有している。
【0033】
[2.1.言語テクストの意味理解]
以下、図2により、一般的テクスト理解部21およびユーザ特化テクスト理解部22において言語テクストの意味理解を行う方法について説明する。なお、以下の説明のうち、一般的テクスト理解部21における言語テクストの意味理解の手順(ステップ101〜106)については、特開2002−236681号公報および特願2002−154688号に記載された方法と同様であるので、以下においては、その概略のみを説明する。また、ユーザ特化テクスト理解部23における言語テクストの意味理解の手順(ステップ107)については、[4.クライアントモデル部]の欄で詳細に説明する。
【0034】
まず、言語理解・生成モジュール20に対して、外部インタフェース50を介して言語テクストが入力されると、一般的テクスト理解部21において、セミオティックベース60を参照して一般的な言語知識の範囲で言語テクストの意味理解が行われる(ステップ101〜106)。
【0035】
(1) パージング処理
まず、セミオティックベース60の汎用電子化辞書61を参照して、入力された言語テクストの形態素解析および係り受け解析を行う(ステップ101)。
【0036】
(2) 発話予測の確認
次に、入力された言語テクストが、対話の構造に基づいて事前に予測された発話の内容と一致するかどうかを確認する(ステップ102)。ここで、入力された言語テクストと事前に予測した発話内容とが一致した場合は、それ以後の処理(ステップ103〜107)を省略することができる。なお、ステップ102で用いられる予測発話は、後述するように、プランモジュール30の発話予測部33により生成される([3.プランモジュール]の欄参照)。
【0037】
(3) 状況タイプの同定
その後、セミオティックベース60のコンテクストベース62を参照して、言語テクストに含まれる語彙や概念の傾向に基づいて、対話が行われる状況を表す状況タイプの同定を行う(ステップ103)。
【0038】
(4) 資源のセットアップ
また、セミオティックベース60のコンテクストベース62を参照して、同定された状況タイプに関連付けられた全ての資源を活性化する(ステップ104)。
【0039】
(5) 意味解析
さらに、セミオティックベース60の意味ベース63および語彙文法ベース64のシステムネットワークを探査し、ステップ101で行われたパージング処理の結果に基づいて意味解析(語彙文法特徴および意味特徴の導出)を行う(ステップ105)。
【0040】
(6) 文脈理解
その後、得られた意味解析の結果と対話の構造に基づいて予測された発話の内容とのマッチングを行い、意味解析の結果の具体化および補完を行う(ステップ106)。
【0041】
なお、このようにして一般的な言語知識の範囲で言語テクストの意味理解を行った後、最終的に、ユーザ特化テクスト理解部22において、クライアントモデル部40に蓄積されているユーザの個人的な特徴に関する知識を参照して、ユーザに特化した(個人化した)より精密な言語テクストの意味理解(換言や補完など)を行い、得られた意味解析の結果(言語テクストの言語的特徴)をプランモジュール30へ送る(ステップ107)。
【0042】
[2.2.言語テクストの生成]
次に、図3により、一般的テクスト生成部23およびユーザ特化テクスト生成部24において言語テクストの生成を行う方法について説明する。なお、以下の説明のうち、一般的テクスト生成部23における言語テクストの生成の手順(ステップ201〜206)については、特開2002−236681号公報および特願2002−154688号に記載された方法と同様であるので、以下においては、その概略のみを説明する。また、ユーザ特化テクスト生成部24における言語テクストの生成の手順(ステップ207)については、[4.クライアントモデル部]の欄で詳細に説明する。
【0043】
まず、言語理解・生成モジュール20に対して、プランモジュール30により生成された言語テクストの言語的特徴が送られると、一般的テクスト生成部23において、セミオティックベース60を参照して一般的な言語知識の範囲で言語テクストの生成が行われる(ステップ201〜206)。
【0044】
(1) 状況タイプの同定
まず、セミオティックベース60のコンテクストベース62を参照して、対話が行われる状況を表す状況タイプに変化があるかどうかを確認し、必要があれば状況タイプを更新する(ステップ201)。
【0045】
(2) 資源のセットアップ
ここで、状況タイプが更新された場合には、セミオティックベース60のコンテクストベース62を参照して、新しい状況タイプに関連付けられた資源を活性化する(ステップ202)。
【0046】
(3) テクストプランニング
次に、セミオティックベース60のコンテクストベース62を参照して、システムネットワークの値を確認し、対応する概念を活性化し、次いで、発話役割、発話機能および発話内容を決定する(ステップ203)。
【0047】
(4) 意味特徴展開
そして、セミオティックベース60の意味ベース63を参照して、発話役割、発話機能および発話内容の意味特徴から、発話のインスタンス情報を決定する(ステップ204)。
【0048】
(5) 文脈照合
また、必要に応じて、現在の発話状況に適した形にインスタンス情報を修正する(ステップ205)。
【0049】
(6) 語彙特徴展開
その後、セミオティックベース60の語彙文法ベース64および状況依存辞書65を検索し、インスタンス情報に対応する語彙表現を選択し、次いで、生成されるべき発話の内容のメタ機能を考慮して適切な助詞や接続形を選択する(ステップ206)。
【0050】
なお、このようにして一般的な言語知識の範囲で言語テクストの生成を行った後、最終的に、ユーザ特化テクスト生成部24において、クライアントモデル部40に蓄積されているユーザの個人的な特徴に関する知識を参照してユーザに特化した(個人化した)より精密な言語テクストの生成(換言や省略など)を行い、得られた生成結果(言語テクスト)を出力する(ステップ207)。
【0051】
[3.プランモジュール]
次に、プランモジュール30の詳細について説明する。
【0052】
図1に示すように、プランモジュール30は、ユーザと日常言語コンピュータシステムとの間で行われる対話の構造を管理することにより、ユーザと日常言語コンピュータシステムとの間で行われる言語テクストに基づく対話の流れを制御するものであり、この目的のため、プランモジュール30は、ユーザと日常言語コンピュータシステムとの間で行われる対話のパターンを集めたデータベースであるプランライブラリ34と、進行中の対話の構造を表すデータ構造であるプラン構造37とを備えている。
【0053】
[3.1.プランライブラリ]
図1に示すように、プランライブラリ34は、ユーザまたは秘書エージェントシステム10で行われる可能な動作の系列を表す複数のプランユニットを保持するものであり、後述するステージ同定部31、ムーブ選択部32および発話予測部33において利用される。
【0054】
ここで、プランライブラリ34に保持されているプランユニットは、次の2種類に分類される。
【0055】
(1) インタラクションプランユニット
インタラクションプランユニット35は、対話のパターン(すなわち可能な発話(動作)の系列)を表すものであり、対話の流れを把握して、次にユーザに対して出力する内容を決めたり、ユーザの入力を理解したり予測したりするために用いられる。
【0056】
(2) ドメインプランユニット
ドメインプランユニット36は、コンピュータ操作(アプリケーション操作など)を伴う作業のパターン(可能な動作の系列)を表すものであり、ユーザの作業段階を把握して、対話の話題を同定または選択したり、日常言語コンピュータシステム上で稼働する言語アプリケーションへ出力する内容を決めたりするために用いられる。
【0057】
ここで、インタラクションプランユニット35およびドメインプランユニット36は、対話または作業のパターンを当該対話または作業の各段階に対応する複数のステージ間の関係(動作の系列)として表している。また、インタラクションプランユニット35およびドメインプランユニット36は、対話または作業が行われる状況に対応する状況タイプごとに分類されている。
【0058】
なお、インタラクションプランユニット35およびドメインプランユニット36のいずれの種類のプランユニットも次の4つの要素から構成されている。
【0059】
(1) ヘッダ:プランユニットの名前とスロット(パラメータや引数)のリストを指定する部分。
【0060】
(2) ボディ:可能な動作の系列を遷移ネットワークの形式で記述する部分。
【0061】
(3) 効果 :当該プランユニットの実行後に成立する条件を記述する部分。
【0062】
(4) 制約 :スロットの値に関する制約条件を記述する部分。
【0063】
ここで、プランユニットのボディには、動作の逐次的実行や選択、省略、繰り返しなどのパターンがネットワーク形式で表現されており、ノード間をつなぐ各アークがステージに対応している(図4および図5参照)。
【0064】
なお、各ステージには、ラベルとして、ユーザや秘書エージェントシステム10の動作(言語テクストの入出力またはコンピュータ操作を伴う作業)の仕様が割り当てられている。また、各ステージには、そのステージの望ましさ(ユーザの動作の場合には、確からしさ)を表す数値として選好度が与えられている。ここで、各ステージに割り当てられるラベルとしては、上述したような実質的な動作以外にも、他のプランユニットや、複数の動作の列に展開されるマクロ表現がある。なお、ステージのうち、他のプランユニットおよびマクロ表現以外のラベルを持つステージ(すなわち実質的な動作を行うステージ)をムーブと呼ぶ。
【0065】
ここで、図4および図5は、「ワープロを使った文書作成に関する依頼応対」という状況タイプに結び付けられたプランユニットの例を示す図であり、このうち、図4(a)(b)(c)(d)はインタラクションプランユニットの例を示し、図5はドメインプランユニットの例を示している。なお、図4(a)(b)(c)(d)および図5においては、見やすさを重視して、各ステージに割り当てられた動作の仕様のうち動作タイプ(言語テクストの入出力の場合には、図6に列挙するような発話行為の種類)のみを記し、付随するスロットの詳細や、各ステージの選好度については省略している。
【0066】
なお、プランライブラリ34に保持されているインタラクションプランユニット35およびドメインプランユニット36に含まれている各要素はセミオティックベース60に蓄積されている状況タイプや意味特徴と対応付けられており、後述するステージ同定部31、ムーブ選択部32および発話予測部33において、状況や言語的特徴を生かした処理を行うことができるようになっている。
【0067】
[3.2.プラン構造]
図1に示すように、プラン構造37は、進行中の対話の構造を各インタラクションプランユニット35間の依存関係として表すものであり、後述するステージ同定部31、ムーブ選択部32および発話予測部33において利用される。
【0068】
ここで、プラン構造37では、例えば、これまでに実行が完了した、または現在実行中のインタラクションプランユニット35間の依存関係がツリー構造で表現される。この場合には、プラン構造37中の各ノードは、実行が完了した、または現在実行中のインタラクションプランユニットのインスタンスに対応し、ノード間の親子関係は、対応するインスタンス間の全体/部分関係を表す。なお、プラン構造37には、このようなノード間の関係に加えて、対話が現在どこまで進んだかを示すポインタが与えられている。例として、図7に、値の質問(askValue)に対して回答(informValue)を行った直後のプラン構造を示す。
【0069】
すなわち、プラン構造37には、ユーザと日常言語コンピュータシステムとの間で行われる対話において、秘書エージェントシステム10がユーザの入力を理解したり秘書エージェントシステム10自身が出力を行ったりする度に、後述するステージ同定部31において、入力および出力の内容に対応する新しいノードがプラン構造37に追加される。なお、ユーザはときどき、事前には予測できないような恣意的な話題を選択して状況の変更を行うことがあるため、単一のツリー構造では対話の全体的な流れを管理しきれないことがある。このため、このような場合には、後述するステージ同定部31において、プラン構造37を、状況タイプとツリー構造(サブプラン構造)との組を一つの要素とするようなスタックの形態で管理するようにするとよい(図8参照)。
【0070】
[3.3.対話プランニング]
ここで、プランモジュール30は、上述したプランライブラリ34およびプラン構造37を参照して、ユーザと日常言語コンピュータシステムとの間で行われる対話の流れを個々のユーザに特化した形で円滑にかつ自然な形で制御する。具体的には、まず、ステージ同定部31において、プランライブラリ34に保持されている複数のインタラクションプランユニット35のうち、言語理解・生成モジュール20により同定された現在の状況タイプに結び付けられたたインタラクションプランユニット35を参照して、言語理解・生成処理モジュール20により意味理解を行うことで得られた言語テクストの言語的特徴(意味特徴)に基づいてプラン構造37における現時点のステージを同定する。次に、ムーブ選択部32において、ステージ同定部31により同定された現時点のステージに続く可能性のある複数のムーブの中から最適なムーブを選択する。これにより、ユーザに対しては、応答の生成のために必要とされる言語テクストの言語的特徴(意味特徴)が出力され、日常言語コンピュータシステムに対しては、日常言語コンピュータシステム上で稼働する言語アプリケーションや他のエージェントへの操作指示が言語プロトコルの形で出力される。さらに、発話予測部33においては、プランライブラリ34に保持されている複数のインタラクションプランユニット35を参照して、プラン構造37における現時点のステージに続く可能性のあるステージの中から、ユーザの次の発話を表すステージであるムーブが予測される。なお、発話予測部33により生成された発話の予測結果は、上述したように、言語理解・生成モジュール20の一般的テクスト理解部21において、処理を簡略化したり、対話の文脈を考慮に入れて意味解析の結果を具体化したり補完したりするために利用される他、プランモジュール30のステージ同定部31において、プラン構造37における現時点のステージを同定する際に利用される。
【0071】
以下、プランモジュール30のステージ同定部31、ムーブ選択部32および発話予測部33で行われる処理の詳細について説明する。
【0072】
[3.3.1.ステージ同定部]
ステージ同定部31は、言語理解・生成処理モジュール20から、ユーザが入力した言語テクストの解析結果である言語的特徴(意味特徴)の集合を受け取ると、それらが進行中の対話の構造を表すプラン構造37においてどのステージに相当するものであるのかを同定する。具体的な処理の手順は、ユーザの入力が対話の構造に基づいて事前に予測できるものであったか、それとも予想外のものであったかによって異なる。前者の場合には、入力された言語テクストの言語的特徴(意味特徴)と発話の予測結果との間でマッチングを行うだけでよい。マッチングの結果、入力された言語テクストの意味が補完されることもあれば、プラン構造37が一部具体化される場合もある。一方、後者の場合には、プラン構造37に新たなツリー構造を導入する。これにより、ユーザの上位の意図を推論することが可能となり、より適切な形で対話の流れを制御することが可能となる。
【0073】
以下、図9により、ステージ同定部31における処理の詳細について説明する。
【0074】
(1) まず、言語理解・生成処理モジュール20により同定された状況タイプが変化したかどうか確認する(ステップ301)。そして、状況タイプが変化していない場合には、発話予測部33により事前に予測された、プラン構造37におけるポインタ位置にある現時点のステージに続く可能性のあるムーブと、入力された言語テクストの言語的特徴(意味特徴)とのマッチングを行う(ステップ302)。
【0075】
(2) ここで、状況タイプが変化しておらず、かつマッチングに成功した場合には、マッチングを実行して(ステップ303)、新しいムーブに対応するノードをプラン構造37に追加しかつポインタをそのノードへ移動する(ステップ304)。
【0076】
(3) 一方、状況タイプが変化した場合またはマッチングに失敗した場合には、入力された言語テクストの言語的特徴(意味特徴)を起点として上位のツリー構造を推定し、得られたツリー構造をスタックの新しい要素として追加する。具体的には、入力された言語テクストの言語的特徴(意味特徴)に対応するノードをプラン構造37に追加しかつポインタをそのノードへ移動した後(ステップ305)、入力された言語テクストの言語的特徴(意味特徴)の表す動作をボディの第1要素として持つようなインタラクションプランユニットを検索し(ステップ306)、もしそのようなプランユニットがちょうど1個見つかった場合は、対応するノードをプラン構造37に追加しかつポインタをそのノードへ移動しながら(ステップ307)、続けてさらに上位のプランユニットを検索していく。これに対し、もしそのようなプランユニットが存在しないか、同程度に確からしい複数の候補が見つかった場合は、そこで処理を中断する。
【0077】
[3.3.2.ムーブ選択部]
ムーブ選択部32は、ステージ同定部31により現時点のステージが同定された後、現時点のステージに続く可能性のある複数のムーブの中から、各ステージに与えられた選好度や、クライアントモデル部40に蓄積されたユーザの個人的な特徴に関する知識、言語アプリケーションの現在の状態、入力された言語テクストの言語的特徴(意味特徴)などを参照して、最適なムーブを選択する。
【0078】
以下、図10により、ムーブ選択部32における処理の詳細について説明する。
【0079】
(1) まず、後述する発話予測部33における発話の予測の手順と同様の手順で、現時点のステージに続く可能性のあるムーブの集合を生成する(ステップ401)。
【0080】
(2) 次に、プランライブラリ34に保持されているインタラクションプランユニット35の各ステージに事前に与えられている選好度に対して、クライアントモデル部40に蓄積されたユーザの個人的な特徴に関する知識に応じて補正を加える(ステップ402)。
【0081】
(3) そして、ステップ401で得られた、現時点のステージに続く可能性のあるムーブの集合の中から、選好度が最大のムーブを選択する(ステップ403)。
【0082】
(4) ここで、選択されたムーブが秘書エージェントシステム10自身の動作である場合には(ステップ404)、選択されたムーブをユーザまたは日常言語コンピュータシステム上で稼働する言語アプリケーションや他のエージェントなどに対して実行する(ステップ405)。具体的には、選択されたムーブがユーザへの応答に対応するものである場合には、ムーブのラベルに指定された動作の仕様(応答の生成に必要とされる言語テクストの言語的特徴(意味特徴)の集合)を言語理解・生成モジュール20の一般的テクスト生成部23へ送る。これに対し、選択されたムーブがコンピュータ操作(アプリケーション操作など)に対応するものである場合には、日常言語コンピュータシステム上で稼働する言語アプリケーションや他のエージェントなどへ言語プロトコルの形で操作指示を出力する。
【0083】
(5) その後、実行されたムーブに対応するノードをプラン構造に追加しかつポインタをそのノードへ移動した後(ステップ406)、ステップ401へ戻る。すなわち、次のムーブが秘書エージェントシステム10自身の動作でなくなるまで、以上の手順を繰り返す。
【0084】
[3.3.3.発話予測部]
発話予測部33は、プランライブラリ34に保持されている複数のインタラクションプランユニット35を参照し、自然言語処理におけるトップダウン予測の手続きを利用して、プラン構造37における現時点のステージに続く可能性のあるステージの中から、ユーザの次の発話を表すステージであるムーブを予測する。
【0085】
以下、図11により、発話予測部33における処理の詳細について説明する。
【0086】
(1) まず、求めるべき予測発話の集合Aを空集合とする(ステップ501)。
【0087】
(2) 次に、プラン構造における現時点のステージ(ノード)に1つ上のステージ(親ノード)が存在するかどうかを判断し(ステップ502)、存在する場合には親ノードへ移動する(ステップ503)。これに対し、もし1つ上のステージ(親ノード)が存在しない場合には処理を終了する。
【0088】
(3) その後、その親ノードに対応するインタラクションプランユニットにおいてそれに続く可能性のあるステージが存在するかどうかを判断し(ステップ504)、もしそのようなステージが存在する場合には、次の手順で処理を行う。これに対し、もしそのようなステージが存在しない場合には、ステップ502へ戻る。
【0089】
(3a) まず、候補となるステージへ移動する(ステップ506)。
【0090】
(3b) そのステージがムーブである場合には(ステップ507)、それを集合Aに追加する(ステップ509)。
【0091】
(3c) そのステージがインタラクションプランユニットである場合には(ステップ507)、そのボディの第1要素に移動して(ステップ508)、ステップ507へ戻る。
【0092】
[4.クライアントモデル部]
次に、クライアントモデル部40の詳細について説明する。
【0093】
図1に示すように、クライアントモデル部40は、ユーザの個人的な特徴に関する知識を蓄積する知識ベースであり、ユーザ個人に関する知識を格納するプロファイル情報41と、複数のユーザに共通した特徴を記述したプロパティ特性情報42とを含む。
【0094】
[4.1.プロファイル情報]
図12に示すように、プロファイル情報41は、ユーザ自身の言語的傾向を記述した言語傾向情報51と、ユーザ自身のプロフィールを記述したプロパティ情報55とを有している。以下、言語傾向情報51およびプロパティ情報55の詳細について説明する。
【0095】
[4.1.1.言語傾向情報]
言語傾向情報51は、各ユーザの言語的傾向を表す情報(独自の言語辞書)であり、言語理解・生成モジュール20において、ユーザに特化した言語テクストの意味理解および生成を行う際に利用される。なお、ここでいう「言語的傾向」とは、同じ言葉でもユーザによってとらえる意味に違いが大きい言葉に対して、各ユーザがどのような使い方をするかということであり、このような言語的傾向を保持する情報として、ユーザ語52、感性語53および程度副詞54の3種類の情報が用いられる。
【0096】
[4.1.1.1.ユーザ語]
ユーザ語52は、辞書に記載されている言葉であるがユーザが新たに別の意味をつけているような言葉や、ユーザが新たに作り出した言葉であり辞書に記載されていないような言葉について、その言葉と意味とをセットにして蓄積したものである。
【0097】
[4.1.1.2.感性語]
感性語53は、個人の感じ方によってあいまい性や多義性、状況依存性の大きい言葉である形容詞や形容動詞、比喩などについて、その言葉と意味とをセットにして蓄積したものである。なお、ユーザがコンピュータ操作を行う際に用いられる感性語としては、コンピュータ画面上に呈示される文字、図および線を表現するものが一般的である。以下、これらの感性語の具体例について説明する。
【0098】
まず、コンピュータ画面上に呈示される文字、図および線はそれぞれ、次のような属性を持つ。
【0099】
(1) 文字=種類(フォント+スタイル+文字飾り)+大きさ(フォントサイズ)+色
(2) 図=内容(キーワード)+大きさ(サイズ)+雰囲気(タッチ+色)
(3) 線=種類(点線+スタイル+始終点)+色+太さ
これらの属性のうち、フォントを例に挙げると、それを表現する感性語は全て「フォーマルさ」、「インパクト」および「重さ」の軸に分解される。ここで、「フォーマルさ」、「インパクト」および「重さ」のそれぞれの軸は「丸さ」および「太さ」というフォントの持つ物理量に対応しており、このような対応関係に基づいて具体的なフォントを決定する。図13(a)(b)に、感性語と物理量との対応関係と、それに基づいて選択されるフォントの例を示す。
【0100】
一方、色については、図14(a)(b)に示すようなHue&Toneシステムを用いて色相と色調(明度および彩度)とにより表現する。ユーザが色を表現するときには、(1)色相のみを表現する感性語、(2)色調のみを表現する感性語、(3)両方を総合した感性語のいずれかを用いる。ここで、ユーザが色を表現した言葉が上記(1)〜(3)のいずれに該当するかによって色の決定方法が異なる。具体的には、上記(1)の場合には、色調を質問し直し、該当する具体的な色を検索してユーザに提示する。また、上記(2)の場合には、色相を質問し直し、該当する具体的な色を検索してユーザに提示する。さらに、上記(3)の場合には、当該感性語に該当する具体的な色を検索してユーザに提示する。
【0101】
図(絵)については、「クリスマスの絵」や「春らしい絵」など、図(絵)を形容する言葉をキーワードとして検索し、ユーザに提示する。それぞれの図(絵)には、キーワードの他、色、絵のタッチに関する情報が付与されており、色や絵のタッチを表現する感性語を用いて検索することができる。
【0102】
なお、フォント、色および図などを表現する感性語としては、言葉として同じものが用いられる場合が多いが、同じユーザで同じ感性語でも、それぞれの場合で意味が異なることが多い。具体的には例えば、図15に示すように、同じ「ポップな」という言葉でも、そのときに文字を入力していればフォントの種類や大きさなどに結び付けられるが、絵を入力しているときには絵の色合いなどに結び付けられる。このため、感性語の意味を状況タイプに結び付けて管理し、セミオティックベースで特定された状況(状況タイプ)に応じた感性語の意味を選択するようにすることが好ましい。
【0103】
なお、上述したような感性語は、いくつかの典型的な語に関してのみ言葉とその意味とをセットにして蓄積しておき、新たに入力された感性語に関しては、既に蓄積されている感性語のうちのいくつかの語を結合して意味を表現するようにしてもよい。例えば、「ポップな」フォントは「おしゃれ」で「都会的な」フォントという意味であると理解し、そのような語の結合として意味を表現する。なお、この場合には、「ポップな」フォントとして、「おしゃれ」で「都会的な」フォント、すなわち細くて鋭いフォントの1つが選択される。
【0104】
[4.1.1.3.程度副詞]
程度副詞54は、それが形容する言葉の意味を強めたり弱めたりする効果がある言葉について、その言葉と意味とをセットにして蓄積したものである。具体的には例えば、上述したような、コンピュータ画面上に呈示される文字、図および線を例に挙げると、その属性の一つである大きさは、「大きい」と「小さい」という言葉で表現され、その程度は、程度副詞により表現される。この場合、程度副詞により表現される大きさが相対的な大きさなのか絶対的な大きさなのかを考慮して、具体的な大きさを決定する。なお、程度副詞は、感性語と同様に個人の感じ方によって意味にあいまいさを生じるものであるので、それぞれの程度副詞をファジィ集合で表現し、ファジィ集合をユーザごとに変化させるようにすることが好ましい。
【0105】
[4.1.2.プロパティ情報]
プロパティ情報55は、各ユーザのプロフィール(ユーザの名前や性別、知識レベル、スケジュールなど)を表す情報であり、プランモジュール30において、ユーザに特化した対話プランニングを行う際に利用される。なお、プロパティ情報55は、ユーザ情報56、スケジュール57および個人的関連知識58の3種類の情報を有している。なお、プロパティ情報55の初期値としては、ユーザに対して事前にアンケート形式で質問を行うことによって得られた結果が用いられ、ユーザとの対話によって追加したり修正したりすることができる。なお、プロパティ情報55に含まれる各要素はセミオティックベース60にリンクされており、言語理解・生成モジュール20において、当該各要素に該当する発話のインスタンス情報が用いられる。
[4.1.2.1.ユーザ情報]
ユーザ情報56は、ユーザが誰でどんな人であるかを表す情報であり、図16に示すように、ユーザの氏名や年齢、性別、出身地、学歴、性格、趣味などに関する情報を記述したものである。
【0106】
[4.1.2.2.スケジュール]
スケジュール57は、ユーザのスケジュール(イベントやファイル操作などに関するスケジュール)を表す情報である。スケジュール57は、マクロなスケジュールとミクロなスケジュールとに分類される。マクロなスケジュールは、図17(a)(b)に示すように、現在までに行われたイベントおよびファイル操作に関する情報を日時とともに記述したものであり、日時、イベント名およびファイル名などの各種の項目から検索することができる。その際、図17(b)に示すように、日時をファジィ集合で表現することにより、あいまいな言い方(例えば、「最近使ったファイル」や「2週間前のファイル」)によって検索することができるようにするとよい。一方、ミクロなスケジュールは、現在行っているファイル操作等の作業に限定したスケジュールであり、作業が始まってから終わるまでを一区切りとし、その中での作業順番を時間とともに記述したものである。
【0107】
[4.1.2.3.個人的関連知識]
個人的関連知識58は、ユーザ情報56やスケジュール57に含まれる各要素の詳細に関する知識であり、図18に示すように、ユーザの所属する会社に関する知識(名称や業種、人数、部署名など)や、行われるイベントに関する知識(イベントの種類や人数、場所など)を記述したものである。なお、個人的関連知識58には、ユーザに特化したアプリケーション操作を実現するための情報として、アプリケーション操作などに対するユーザの好みや知識レベルに関する情報が含められている。
【0108】
なお、プロパティ情報55には、プランモジュール30における意思決定(ステージの同定やムーブの選択)のために用いられる情報として、ユーザの秘書エージェントシステムに対する希望に関する情報(例えば、どのくらいシステム内の作業内容をユーザにレポートするか、どの程度システムが自主的に行動するか、など)を含めるようにしてもよい。
【0109】
[4.2.プロパティ特性情報]
プロパティ特性情報42は、プロファイル情報41のプロパティ情報55に蓄積されている各ユーザの知識がユーザ全体の中でどのような傾向や特徴を持つかを記述したものである。すなわち、多数のユーザに関するプロパティ情報を集めると、プロパティ情報に含まれる各要素の値に一定の特徴や傾向が生まれる。プロパティ特性情報42は、このような特徴や傾向に関する情報を、プロパティ情報の一種のメタ情報として抽出したものである。ここで、プロパティ特性情報42としては、多数のユーザからアンケート調査などで事前に得られた結果が用いられる。なお、図12に示すように、プロパティ特性情報42は、知識レベルや性別、性格ごとに蓄積されている。ここで、知識レベルによって分類されたコンピュータ操作に関するプロパティ特性情報の一例を図19に示す。
【0110】
なお、プロパティ特性情報42は、プロファイル情報41の言語傾向情報51とともに、言語理解・生成モジュール20において、ユーザに特化した言語テクストの意味理解および生成を行う際に利用される。また、プロパティ特性情報42は、プロファイル情報41のプロパティ情報55とともに、プランモジュール30において、ユーザに特化した対話プランニングを行う際に利用される。
【0111】
[4.3.言語理解・生成モジュールおよびプランモジュールによるクライアントモデル部の利用]
上述したように、クライアントモデル部40は、言語理解・生成モジュール20およびプランモジュール30において利用される。言語理解・生成モジュール20においては、クライアントモデル部40に蓄積されているユーザの個人的な特徴に関する知識を参照してユーザに特化した言語テクストの意味理解(換言や補完など)および言語テクストの生成(換言や省略など)が行われる。また、プランモジュール30においては、クライアントモデル部40に蓄積されているユーザの個人的な特徴に関する知識を参照してユーザに特化した対話プランニング(推論)が行われる。
【0112】
以下、言語理解・生成モジュール20およびプランモジュール30におけるクライアントモデル部40の利用方法を、換言、補完・省略、および推論という代表的な3種類の処理を例に挙げて説明する。
【0113】
[4.3.1.換言]
言語理解・生成モジュール20においては、クライアントモデル部40に保持されているプロファイル情報41(言語傾向情報51)およびプロパティ特性情報42を参照して、ユーザ特化テクスト理解部22により、ユーザから入力された言語テクストをプランモジュール30で用いられる適切な言語テクストに換言するとともに、ユーザ特化テクスト生成部24により、プランモジュール30から得られた言語テクストをユーザに理解しやすい言語テクストに換言する。なお、換言の処理は、具体的には次のような場合に行われる。
【0114】
(1) ユーザの入力した言語テクストにユーザ語に登録されている言葉がある場合には、登録されている意味の言葉に変換する。
【0115】
(2) ユーザに対して出力される言語テクスト中の言葉をユーザに合った言葉に変換する。
【0116】
(3) ユーザの入力した言語テクスト中の感性語と程度副詞とを物理量の表現に換言して、言語アプリケーションへ送信する。
【0117】
(4) 言語アプリケーションから送信された物理量の表現を、ユーザに合った感性語と程度副詞とに変換してユーザに対して出力する。
【0118】
(5) ユーザのプロパティ情報に該当するプロパティ特性情報を活性化し、その特性に合わせた言語表現に変換する。
【0119】
[4.3.2.補完・省略]
言語理解・生成モジュール20においては、クライアントモデル部40に保持されているプロファイル情報41(プロパティ情報55)およびプロパティ特性情報42を参照して、ユーザ特化テクスト理解部22により、ユーザから入力された言語テクストを部分的に補完する。すなわち、言語テクスト中に必要な情報を追加したり言語テクスト中の言葉の意味を限定したりすることにより、検索の範囲を狭めたり誤解を少なくしたりする。なお、補完の処理は、具体的には次のような場合に行われる。
【0120】
(1) ユーザの入力した言語テキスト中に足りない情報がある場合に、その情報を表す言葉を追加する(例:「出張報告書を書く。」 → 「Java(登録商標)ワープロで出張報告書を書く。」)。
【0121】
(2) ユーザの入力した言語テクスト中に一般的な表現の言葉が含まれている場合に、その言葉の意味を限定する言葉を追加する(例:「出張」→「東京出張」)。
【0122】
一方、言語理解・生成モジュール20においては、クライアントモデル部40に保持されているプロファイル情報41(プロパティ情報55)およびプロパティ特性情報42を参照して、ユーザ特化テクスト生成部24により、プランモジュール30から得られた言語テクストを部分的に省略する。すなわち、言語テクストの生成において、全ての情報を含めようとすると生成された文が長くなり、ユーザにとって分かりづらいものとなってしまうので、このような事態を減らすため、生成される言語テクストのうち不要な言葉を削除する。なお、省略の処理は、補完の逆操作として、以下のような場合に行われる。
【0123】
(1) ユーザにとって自明な情報(ユーザが以前に入力した言語テクスト中に含まれる情報)を削除する(例:「Java(登録商標)ワープロで出張報告書を書きました。」→「出張報告書を書きました。」)。
【0124】
(2) 具体的な言葉の抽象度を上げて簡潔に表現する(例:「出張報告書を開きます。」→「報告書を開きます。」)。
【0125】
[4.3.3.推論]
プランモジュール30においては、クライアントモデル部40に保持されているプロファイル情報41(プロパティ情報55)およびプロパティ特性情報42を参照して、作業の状態や状況タイプに合わせてユーザと日常言語コンピュータシステムとの間で行われる対話の流れを制御する。すなわち、プランモジュール30は、ユーザを適切に支援するため、クライアントモデル部40に蓄積されているユーザの個人的な特徴に関する知識(ユーザの好みや特徴、知識レベルなど)からユーザの意図を推論し、推論結果に応じて秘書エージェントシステム10がとるべき行動を決定する。なお、プランモジュール30は、プランライブラリ34に保持されているインタラクションプランユニット35およびドメインプランユニット36についてそれぞれ推論を行う。
【0126】
ここで、インタラクションプランユニット35により規定される、ユーザと日常言語コンピュータシステムとの間で行われる対話の手順に関しては、クライアントモデル部40に保持されているプロファイル情報41(プロパティ情報55)に含まれる関連する情報によって、クライアントモデル部40に保持されているインタラクションプランユニット35の各ステージに与えられている選好度の数値を調整する。なお、選好度を決定するためのパラメータとしては、次の3つを準備することが好ましい。
(1) 主導度:システムが自主的に意思決定を行う度合いを表すパラメータ。
【0127】
(2) 大胆度:システムが自分の決定したことを実行に移す度合いを表すパラメータ。
【0128】
(3) 情報提供度:システムがユーザに提供する情報量の度合いを表すパラメータ。
【0129】
これに対し、ドメインプランユニット36により規定される、コンピュータ操作(アプリケーション操作など)を伴う作業の手順に関しては、操作の手順を選択したり操作の内容を決定したりするため、クライアントモデル部40に保持されているプロファイル情報41(プロパティ情報55)において個人的関連知識58として蓄積されている、アプリケーション操作に対する好みや知識レベル、そしてプロパティ特性情報42のうちユーザの知識レベルに対応する情報が利用される。
【0130】
[4.4.クライアントモデル部における学習]
クライアントモデル部40は、ユーザの変化に適応するため、言語理解・生成モジュール20部を介してユーザから入力された言語テクストに含まれる情報またはプランモジュール30により制御される対話の流れに関する情報に基づいて、ユーザの個人的な特徴に関する知識を自律的に学習する。
【0131】
以下、クライアントモデル部40に保持されているプロファイル情報41(言語傾向情報51およびプロパティ情報55)およびプロパティ特性情報42のそれぞれの学習方法について説明する。
【0132】
(1) 言語傾向情報
ユーザから入力された言語テクストはコーパスとして蓄えられるので、入力された言語テクストの傾向が変化した際に、コーパス中のレジスタにおける選択確率が変化し、自動的に言語傾向が学習される。また、新たなユーザ語や感性語は、その都度、ユーザにその語の意味を聞き、言葉と意味とをセットにして蓄積していく。
【0133】
(2) プロパティ情報
ユーザから入力された言語テクスト中に、プロパティ情報55に含まれるユーザ情報56、スケジュール57および個人的関連知識58に関連する言葉が含まれている場合には、その中から、現在の情報に足りない情報を補足したり、現在の情報の間違った内容を修正したりする。なお、時間の経過に伴って、終了したスケジュールの情報は消去するが、過去のユーザ情報やそれに関する個人的関連知識は蓄積しておく。
【0134】
(3) プロパティ特性情報
プロファイル情報41(プロパティ情報55)の変化に伴ってプロパティ特性情報52の活性化状態を変化させる。これにより、ユーザの知識レベルが低いと判断されているときには専門用語を簡単な言葉に換言するが、知識レベルが高くなるにつれて専門用語をそのままユーザに出力することが可能になる。
【0135】
このように本実施の形態によれば、秘書エージェントシステム10の言語理解・生成モジュール20において、ユーザの個人的な特徴に関する知識を蓄積する知識ベースであるクライアントモデル部40を参照して、ユーザに特化した言語テクストの意味理解および生成を行っているので、ユーザと日常言語コンピュータシステムとの間での言語テクストの対話的なやりとりを個々のユーザに特化した形で柔軟にかつ精密に行うことができる。
【0136】
また、本実施の形態によれば、秘書エージェントシステム10のプランモジュール30において、ユーザと日常言語コンピュータシステムとの間で行われる対話のパターンを当該対話の各段階に対応する複数のステージ間の関係として表す複数のインタラクションプランユニット35と、進行中の対話の構造を各インタラクションプランユニット35間の依存関係として表すプラン構造37とを参照して、対話プランニングを行っているので、ユーザと日常言語コンピュータシステムとの間で行われる対話の流れを円滑にかつ自然な形で制御することができる。また、プランモジュール30において、ユーザの個人的な特徴に関する知識を蓄積する知識ベースであるクライアントモデル部40を参照して、対話プランニングを行っているので、ユーザと日常言語コンピュータシステムとの間で行われる対話の流れを個々のユーザに特化した形で行うことができる。
【0137】
なお、上述した実施の形態において、言語理解・生成モジュール20、プランモジュール30およびクライアントモデル部40は、ソフトウェア的に実現することが可能であり、処理機能を備えたコンピュータ上に実装されて利用されるプログラムの形態をとることも可能である。このようなプログラムは、各種の記録媒体に記録され、コンピュータから呼び出されて上述したような処理が行われる。なお、記録媒体としては、磁気ディスク、フロッピーディスク、ハードディスク、光ディスク(CD−ROM、CD−RおよびDVD等)、光磁気ディスク(MO等)および半導体メモリ等を含み、プログラムを記録することができ、かつコンピュータ読み取り可能なものであれば、その記録形式はどのようなものでもよい。また、記録媒体としては、ネットワーク上で伝送される際の搬送波等の情報伝達媒体を含む。
【0138】
【実施例】
次に、上述した実施の形態の具体的実施例について述べる。
【0139】
実施例1
まず、第1の実施例として、秘書エージェントシステムを介して、日常言語コンピュータシステム上で動作するワープロソフトにより文書の作成を行う場合を例に挙げて説明する。具体的には、「クリスマス会の招待状」という文書を作成するという状況において、秘書エージェントシステムがユーザの指示の下でワープロソフトの操作を行う場合における動作について説明する。ここで、ワープロソフトは日常言語コンピュータシステム上で動作する言語アプリケーションであり、秘書エージェントシステムからワープロソフトに対する操作指示は日常言語に基づく言語プロトコルを介して行われる(特願2002−154823号参照)。
【0140】
以下、図20に示す対話例に沿って、ユーザからのそれぞれの入力(言語テクスト)に対して秘書エージェントシステムの内部でどのようにして、言語テクストの意味理解、対話プランニング、およびユーザに対して出力される言語テクストの生成が行われるのかを順に説明する。なお、第1の実施例では、クライアントモデル部には、プロパティ情報(ユーザ情報)として図16に示すような情報が蓄積されているものとする。
【0141】
<1:クリスマス会の招待状を書きたい。>
まず、図20に示す対話例におけるユーザの1番目の発話である『(1.)クリスマス会の招待状を書きたい。』に対して行われる処理について説明する。
【0142】
(1) 一般的なテクスト理解
まず、セミオティックベースを参照して、言語テクストに対してパージング処理を行い、その結果から現在の状況が「招待状作成に関する依頼応対」という状況タイプに属するものであると推論する。そして、この状況タイプに関連付けられた資源を活性化した後、意味解析を行って、この入力された言語テクストの言語的特徴(語彙文法特徴および意味特徴)を導き出す。なお、この段階では、招待状の作成のために使用するアプリケーションソフトの種類はまだ不明である。
【0143】
(2) ユーザに特化したテクスト理解
[補完] 次に、クライアントモデル部に蓄積されているプロパティ情報(個人的関連知識)を検索して、(招待状は手紙の一種であることから)招待状の作成のためにJava(登録商標)ワープロを用いることを推論し、セミオティックベースによる一般的な理解の結果を補完する。
【0144】
(3) ステージ同定
対話の初期の状態ではプラン構造(のスタック)は空であるので、予測された発話は存在しない。テクスト理解の結果、入力された言語テクストはwantActionタイプであることが分かるので、wantActionをボディの第1要素に持つようなインタラクションプランユニットを検索する。これにより、wantActionUnitが見つかるので、図21に示すようなプラン構造(wantActionUnitを親ノード、wantActionを子ノードとするようなプラン構造)を生成し、wantActionノードに現在位置を示すポインタをセットする。
【0145】
(4) ムーブ選択
wantActionUnitのボディの第2要素であるIDENTIFYマクロ(ドメインプランユニットのスロット値の同定)は、現在対象としているwriteDocumentドメインプランユニットに不明なスロット値が存在しないので、スキップし、次の第3要素のEXECUTEマクロに処理を進める。
【0146】
第3要素のEXECUTEマクロ(ドメインプランユニットの実行)を実行するためには、まず、writeDocumentのボディの第1要素であるboot動作を対象とするvoluntaryActionUnit(秘書エージェントシステムが自発的にドメインプランユニットを実行するためのインタラクションプランユニット)を選択して、プラン構造内のwantActionUnitノードの下にEXECUTEマクロおよびvoluntaryActionUnitに対応するノードを追加する。さらに、voluntaryActionUnitのボディの第1要素であるEXECUTEを展開して、boot動作を言語アプリケーション(Java(登録商標)ワープロ)に対して要求するムーブを生成および選択する。このムーブは言語アプリケーションに対するものであるので、その操作指示(『(2.)起動してください。』)が言語プロトコルを介して言語アプリケーションに対して送信される。
【0147】
引き続き、voluntaryActionUnitのボディの第2要素に処理を進めると、次はユーザに対するreportAction動作である。これは必ずしも実行する必要のないオプションのムーブであるため、選好度を利用して実行するかどうかが決定される。ここで、クライアントモデル部に蓄積されているプロパティ情報(ユーザ情報)が参照すると、ユーザの心配度が高いという情報が得られるので(図16参照)、選好度が高めに補正され、reportAction動作が実行されることになる。このreportAction動作の言語的特徴が言語理解・生成モジュールへ送られる。この時点におけるプラン構造を図22に示す。
【0148】
(5) 一般的なテクスト生成
プランモジュールから送られてきた言語的特徴に基づき、Java(登録商標)ワープロを起動するという動作を行ったことを報告する言語テクストが生成される。
【0149】
(6) ユーザに特化したテクスト生成
[省略] ユーザは普段Java(登録商標)ワープロを使っているので、「Java(登録商標)ワープロを起動しました。」という報告は少し冗長である。このため、『(3.)ワープロを起動しました。』という表現に変換した上で、その結果がユーザに対して出力される。
【0150】
<4:タイトルは「クリスマス会のお誘い」で。>
次に、図20に示す対話例におけるユーザの4番目の発話である『(4.)タイトルは「クリスマス会のお誘い」で。』に対して行われる処理について説明する。
【0151】
(1) 一般的なテクスト理解
1番目の発話と同様に処理を行う。状況タイプに変更がないので、前回と同じ資源を用いて言語テクストの言語的特徴(意味特徴)を導き出す。ここで入力された言語テクストには、タイトルをどうしたいのかが指定されていないが、プランモジュールの発話予測部において、いずれかの編集作業を依頼するような発話が予測されるので、文脈理解の結果、タイトルの入力を依頼する発話であると理解する。
【0152】
(2) ユーザに特化したテクスト理解
ここでは、とくに処理は行われない。
【0153】
(3) ステージ同定
入力された言語テクストはdemandActionタイプであるので、それをボディの第1要素として持つようなインタラクションプランユニットを検索する。その結果、demandActionUnitが見つけられるので、それをプラン構造に追加する。
【0154】
(4) ムーブ選択
demandActionUnitのボディの第2要素であるEXECUTEマクロを展開して、タイトルの書式で指定された文字列を入力する操作を要求するような言語テクスト(『(5.)タイトルの書式で「クリスマス会へのお誘い」と入力してください。』)を生成し、言語プロトコルを介して言語アプリケーションに対して送信する。その次に、前回と同様に、demandActionUnitのボディの第3要素であるreportAction動作を実行することを決定し、その言語的特徴を言語理解・生成モジュールへ送る。この時点におけるプラン構造を図23に示す。
【0155】
(5) 一般的なテクスト生成
タイトルを入力したことを報告する言語テクスト(『(6.)タイトルを入力しました。』)が生成される。
【0156】
(6) ユーザに特化したテクスト生成
ここでは、とくに処理は行われず、そのまま言語テクストがユーザに対して出力される。
【0157】
<7:もう少し明るくて軽い感じにして。>
次に、図20に示す対話例におけるユーザの7番目の発話である『(7.)もう少し明るくて軽い感じにして。』に対して行われる処理について説明する。
【0158】
(1) 一般的なテクスト理解
これまでの発話と同様に処理を行い、言語テクストの言語的特徴(意味特徴)を導き出す。
【0159】
(2) ユーザに特化したテクスト理解
[換言1] クライアントモデル部に蓄積されているプロパティ情報(ユーザ情報)に含まれている「大げさ度」が高くないので、「もう少し」という副詞はそのまま標準の意味で解釈する。
【0160】
[換言2] 「明るくて軽い」という感性語に当てはまるフォントを図13(a)(b)に示すフォントグラフから、色を図15(a)(b)に示す色グラフからそれぞれ検索し、「もう少し」という副詞を考慮した結果、「丸ゴシック体」と「オレンジ色」という情報を得る。そして、この情報に基づいて言語テクストを換言し、「タイトルのフォントを丸ゴシック体にして色をオレンジ色にしてほしい、という依頼として言語テクストを解釈する。
【0161】
(3) ステージ同定
入力された言語テクストはdemandActionタイプであるので、それをボディの第1要素に持つdemandActionUnitが検索され、プラン構造に追加される。
【0162】
(4) ムーブ選択
demandAction動作に対応して、タイトルのフォントを丸ゴシック体にして色をオレンジにする操作を要求するような言語テクスト(『(8.)タイトルのフォントを丸ゴシック体にして色をオレンジにしてください。』)を生成し、言語プロトコルを介して言語アプリケーションに対して送信する。その次に、前回と同様にしてreportAction動作を実行することを決定する。
【0163】
(5) 一般的なテクスト生成
タイトルのフォントを丸ゴシック体にして色をオレンジにしたことを報告する言語テクストが生成される。
【0164】
(6) ユーザに特化したテクスト生成
[換言] セミオティックベースによって生成された言語テクストに含まれる「丸ゴシック体」および「オレンジ」という語を、ユーザに合わせて再び「少し」という程度副詞と「明るくて軽い」という感性語の組み合わせに変換し、その結果(『(9.)タイトルを少し明るくて軽い感じにしました。』)がユーザに対して出力される。
【0165】
<10:日付を入れて。>
次に、図20に示す対話例におけるユーザの10番目の発話である『(10.)日付を入れて。』に対して行われる処理について説明する。
【0166】
これまでの発話と同様に、上述した(1)〜(6)の順番で言語テクストの意味理解および生成が行われる。ここでは、「日付」という語がいつの日付を指すのか不明であるので、ムーブ選択の過程においてdemandActionUnitのボディの第2要素であるIDENTIFYマクロが展開され、identifyValueUnitがプラン構造に追加される。このインタラクションプランユニットは不明なスロットの値を問い合わせるために秘書が利用するプラン(戦略)を表すものである。ここでは、日付の候補として「今日」が想定されるので、ユーザに対して値の確認を行うconfirmValueという動作タイプが選択される。値の確認に用いられる言語的特徴としては、「〜でいいですか?」や、「〜でいいですね?」などいくつかの候補があるが、例えば想定の確信度があまり高くない場合には「〜でいいですか?」に相当する言語的特徴が選択される。すなわち、プランモジュールにおいては、プランライブラリに含まれる各プランユニットの各要素がセミオティックベースの資源に対応付けられているので、対話プランニングの段階で言語テクストの細かい言語的特徴を選択することができる。なお、このようにしてプランモジュールで選択された言語的特徴は、その後のセミオティックベースを利用した言語テクストの生成の際に、実際に「〜でいいですか?」という言語表現(『(11.)今日の日付でいいですか?』)として具体化される。
【0167】
<12.はい。>
次に、図20に示す対話例におけるユーザの12番目の発話である『(12.)はい。』に対して行われる処理について説明する。
【0168】
秘書エージェントシステムが直前にユーザに対して質問を行っているので、プランモジュールは、ユーザが「はい」または「いいえ」と答えることを予測することができる。入力された言語テクストに対してパージング処理を行った結果、実際に予測された発話の内容と一致するので、意味解析の処理が全て省略されて、予測された言語的特徴(意味特徴)がプランモジュールへ直接送られる。
【0169】
<13.○×レストランの電話番号を調べて。>
次に、図20に示す対話例におけるユーザの13番目の発話である『(13.)○×レストランの電話番号を調べて。』に対して行われる処理について説明する。
【0170】
言語理解・生成モジュールは、入力された言語テクストに対してパージング処理を行った結果、電話番号を調べるという内容から、状況タイプを「招待状作成に関する依頼応対」から「Web閲覧」に変更して、関連する資源をセットアップし直す。プランモジュールの側でも、利用されるプランライブラリの内容を新しい状況タイプに合ったものに切り替える。そして、Webで情報検索を行うためには、まず、関連するWebページを開くことが必要であることを推論し、ユーザが普段Web閲覧に利用している言語アプリケーション(Webブラウザ)に対してページを開く操作指示(『(14.)○×レストランのWebページを開いてください。』)を送信する。プラン構造に関しては、招待状作成のためのツリー構造はそのまま残して、新しいWeb閲覧のためのツリー構造を生成してスタックに追加する。この時点におけるプラン構造を図24に示す。
【0171】
実施例2
次に、第2の実施例として、秘書エージェントシステムを、ユーザからなされた質問に対して適切な応答を行うシステム(ヘルプシステム)として用いる場合を例に挙げて説明する。なお、上述した第1の実施例は、秘書エージェントシステムとの対話を通してユーザがワープロソフトを間接的に操作する方式(すなわち「依頼/応対」の形式)であるのに対し、第2の実施例は、ユーザがワープロソフトを直接的に操作している状況で秘書エージェントシステムが適宜ユーザの手助けをする方式(すなわち「質問/応答」の形式)である。具体的には、ユーザがワープロの操作を行っている間に分からないことが生じたときに、秘書エージェントシステムに質問を行う。すると、秘書エージェントシステムは、質問の言語テクストの意味理解を行い、適切な回答をユーザに対して出力する。その際、クライアントモデル部に蓄積されているプロパティ情報やプロパティ特性情報が適宜参照され、ユーザの知識レベルに合わせて専門用語を簡単な言葉に換言したり、回答の内容をより詳しくしたりするといったような、ユーザに特化した応答を行う。なお、ユーザからなされる質問には、ワープロの操作手順を知りたいといったワープロの操作に関する質問の他、文書の作成に関する提案や助言を求める質問があるので、秘書エージェントシステムは、ユーザからなされた質問の種類を把握した上で、ユーザに対して適切な応答を行う。
【0172】
以下、図25に示す対話例に沿って、ユーザからのそれぞれの入力(言語テクスト)に対して秘書エージェントシステムの内部でどのようにして、言語テクストの意味理解、対話プランニング、およびユーザに対して出力される言語テクストの生成が行われるのかを順に説明する。ここで、第2の実施例における手順は、上述した第1の実施例における手順と基本的に同様であるので、第2の実施例に特有な部分のみを詳細に説明し、共通する部分についての説明は適宜省略する。なお、第2の実施例では、クライアントモデル部には、上述した第1の実施例の場合と同様に、プロパティ情報(ユーザ情報)として図16に示すような情報が蓄積されているものとする。
【0173】
<1:字をもっとかわいくしたいのですが。>
まず、図25に示す対話例におけるユーザの1番目の発話である『(1.)字をもっとかわいくしたいのですが。』に対して行われる処理について説明する。
【0174】
(1) 一般的なテクスト理解
まず、セミオティックベースを参照して、言語テクストに対してパージング処理を行い、その結果から現在の状況が「ワープロの操作に関する質問応答」という状況タイプに属するものであると推論する。そして、この状況タイプに関連付けられた資源を活性化した後、意味解析を行って、この入力された言語テクストの言語的特徴(語彙文法特徴および意味特徴)を導き出す。
【0175】
(2) ユーザに特化したテクスト理解
[換言1] クライアントモデル部に蓄積されているプロパティ情報(ユーザ情報)に含まれている「大げさ度」が高くないので、「もっと」という副詞はそのまま標準の意味で解釈する。
【0176】
[換言2] 「かわいく」という感性語を「フォーマルさ」、「インパクト」および「重さ」の観点で分析し、当てはまるフォントを図13に示すフォントグラフから検索した結果、「ポップ体」という情報が得られる。
【0177】
(3) ステージ同定
テクスト理解の結果、入力された言語テクストはwantActionタイプであることが分かるので、wantActionをボディの第1要素に持つようなインタラクションプランユニットを検索する。これにより、wantActionUnitが見つかるので、wantActionUnitを親ノード、wantActionを子ノードとするようなプラン構造を生成する。
【0178】
(4) ムーブ選択
wantActionUnitのボディの第2要素であるIDENTIFYマクロをスキップし、第3要素のEXECUTEマクロを実行するため、setProperty動作(この場合は、フォントの変更)の実行をユーザに提案するインタラクションプランユニットを選択する。このようなインタラクションプランユニットが選択されるのは現在の状況が「質問応答」の状況であるからであり、第1の実施例のように「依頼応対」の状況である場合には、秘書エージェントシステム自身が言語アプリケーション(ワープロソフト)に対して言語プロトコルを介してフォントの変更を実行するインタラクションプランユニットが選択されることになる。なお、このような対応は、プランライブラリにおいて利用可能なプランユニットが状況タイプごとに組織化されているために可能となる。なおここでは、質問の内容がフォントの変更についての具体的な操作の手順を質問しているのではないことと、クライアントモデル部に蓄積されているプロパティ情報やプロパティ特性情報により検索されたユーザの知識レベルとから、フォントの変更を提案するのみで具体的な操作の手順について詳しく述べないインタラクションプランユニットを選択する。
【0179】
(5) 一般的なテクスト生成
フォントをポップ体に変更するように提案する言語テクスト(『(2.)フォントをポップ体に変更したらいかがですか?』)が生成される。
【0180】
(6) ユーザに特化したテクスト生成
[換言] クライアントモデル部に蓄積されているプロパティ情報(個人的関連知識)から、ユーザのワープロの操作に関する知識レベルが初級者であるということが分かる。クライアントモデル部に蓄積されているプロパティ特性情報から、初級者の特徴として「フォント」という専門用語は理解できると判定されるため、「字」という言葉を「フォント」と変換して出力を行う。
【0181】
<3:フォントって何ですか?>
次に、図25に示す対話例におけるユーザ3番目の発話である『(3.)フォントって何ですか?』に対して行われる処理について説明する。
【0182】
(1) 一般的なテクスト理解
1番目の発話と同様に処理を行い、言語テクストの言語的特徴(意味特徴)を導き出す。
【0183】
(2) ユーザに特化したテクスト理解
[学習] ユーザが「フォント」という言葉が理解できなかったので、クライアントモデル部に蓄積されているプロパティ情報(個人的関連知識)において、ユーザのワープロに関する知識レベルを「初級者」から「初心者」に変更する。
【0184】
(3) ステージ同定
このようなユーザの質問は事前に予測できないものであるので、プラン構造に新しいツリー構造を導入する。
【0185】
(4) ムーブ選択
質問に対して答えるムーブを選択する。
【0186】
(5) 一般的なテクスト生成
フォントについての説明を行う言語テクスト(『(4.)文字の種類のことです。』)を生成する。
【0187】
(6) ユーザに特化したテクスト生成
ここでは特に処理は行われず、そのまま言語テクストがユーザに対して出力される。
【0188】
<5:どうやってフォントを変えればいいのですか?>
次に、図25に示す対話例におけるユーザの1番目の発話である『(5.)どうやってフォントを変えればいいのですか?』に対して行われる処理について説明する。
【0189】
これまでの発話と同様に、上述した(1)〜(6)の順番で言語テクストの意味理解および生成が行われる。ここでは、具体的な操作の手順がユーザから質問されているので、セミオティックベースを利用して、フォントを変更するための手順を説明するための言語テクストを生成する。その際、必要に応じて、現在の状態を確認するための言語テクスト(『(6.)変えたい文字は選択してありますか?』)をユーザに対して出力し、ユーザからの回答(『(7.)はい。』)を待って、フォントを変更するための手順を説明するための言語テクストを出力する。なお、出力される言語テクストは全ての手順を説明するために長くて複雑なものであるので、知識レベルに合わせて自明な部分を省略して出力する。ただし、ここでは、クライアントモデル部に蓄積されているプロパティ情報(個人的関連知識)から得られるユーザの知識レベルが初心者であるため、ユーザに特化した言語テクストの生成において、省略の処理は行われず、詳しい操作の手順を説明する言語テクスト(『(8.)一番上にファイル、編集、などとかいてあるバーのうち、書式をクリックすると、フォントというメニューが出ますので、クリックしてください。』)がそのままユーザに対して出力される。
【0190】
実施例3
最後に、第3の実施例として、秘書エージェントシステムを介して、日常言語コンピュータシステム上で動作するWebやデータベースの検索を行う場合を例に挙げて説明する。具体的には、ユーザが自分の求めている情報を手に入れるために秘書エージェントシステムに対して希望を伝える。すると、秘書エージェントシステムは、Webや適当なデータベースにアクセスして随時検索を行い、取得した結果を分かりやすい言語表現に直してユーザに対して出力する。なおこのとき、秘書エージェントシステムは、ユーザが柔軟かつ効率的に情報検索を行えるように対話を通して支援するとともに、ユーザから入力された言語テクスト中に含まれる検索語がデータベースに適した形となるように換言および補完を行ったり、検索の結果がユーザに合った形となるよう出力したりする。ここで、データベースは日常言語コンピュータシステム上で動作する言語アプリケーションと考えられるので、秘書エージェントシステムとデータベースとの間で行われる対話(検索問合せおよび結果提示)は日常言語に基づく言語プロトコルを介して行われる(特願2002−154823号参照)。
【0191】
以下、図26に示す対話例に沿って、ユーザからのそれぞれの入力(言語テクスト)に対して秘書エージェントシステムの内部でどのようにして、言語テクストの意味理解、対話プランニング、およびユーザに対して出力される言語テクストの生成が行われるのかを順に説明する。ここで、第3の実施例における手順は、上述した第1および第2の実施例における手順と基本的に同様であるので、第3の実施例に特有な部分のみを詳細に説明し、共通する部分についての説明は適宜省略する。
【0192】
<1:時計をいつもの通販で書いたいんだけど。>
まず、図26に示す対話例におけるユーザの1番目の発話である『(1.)時計をいつもの通販で買いたいんだけど。』に対して行われる処理について説明する。
【0193】
この場合には、セミオティックベースを参照して、言語テクストに対してパージング処理を行い、その結果から現在の状況が「商品データの検索」という状況タイプに属するものであると推論する。ここで、「時計」だけでは商品データベースの検索条件としては不十分であるので、時計の種類を同定する(IDENTIFY)ための質問(askValue)『(2.)どんな時計ですか?』をユーザに対して出力し、ユーザに条件の入力を促す。
【0194】
<3:この間買ったのと似たようなもので目覚ましの音がでっかいやつ。>
次に、図26に示す対話例におけるユーザの3番目の発話である『(3.)この間買ったのと似たようなもので目覚ましの音がでっかいやつ。』に対して行われる処理について説明する。
【0195】
この場合には、ユーザに特化したテクスト理解において、クライアントモデル部に蓄積されているプロパティ情報(スケジュール情報)を検索して「この間買ったの」の内容を特定し、ユーザ語である「でっかい」を「大きい」に換言する。また、ユーザがいつも「通販○○」で買い物をするという知識を利用して店舗情報の補完を行い、その結果を用いて、商品データベースに対して検索の問い合わせ(『(4.)通販○○で、アニメキャラクターの目覚し時計で音の大きいものを検索してください。』)を実行する(EXECUTE)。
【0196】
また、商品データベースから検索の結果(『(5.)46件あります。』)を受け取った後、その情報を所定の言語テクスト(『(6.)目覚ましが46個見つかりました。』)の形でユーザに対して出力する。ここで、候補の件数が多い場合には、候補を絞り込むための動作を取ることに決めて、所定の言語テクスト(『(7.)予算はいくらですか?』)の形で商品の金額についての希望をユーザに質問する。
【0197】
<8:色のいいやつがいいな。>
次に、図2に示す対話例におけるユーザの8番目の発話である『(8.)色のいいやつがいいな。』に対して行われる処理について説明する。
【0198】
商品の金額についての質問に対して、ユーザは商品の色に関する希望を入力している。このような質問とそれに続く入力の食い違いは実際の対話においてしばしば見られる現象である。ユーザの入力が予想外のものであるので、プランモジュールにおけるステージの同定において、既存のプラン構造を拡張することができず、新しいツリー構造が生成されてスタックに追加される。また、クライアントモデル部に蓄積されているプロパティ情報(個人的関連知識)に含まれるユーザの色の好みに関する情報を利用して、「色のいい」を「青」に換言する。
【0199】
<10:うん。>
次に、図26に示す対話例におけるユーザの10番目の発話である『うん。』に対して行われる処理について説明する。
【0200】
秘書エージェントシステムが直前にユーザに対して質問(『9.青がいいですか?』)を行っているので、プランモジュールは、ユーザが「はい(うん)」または「いいえ」と答えることを予測することができる。入力された言語テクストに対してパージング処理を行った結果、実際に予測された発話の内容と一致するので、意味解析の処理が全て省略されて、予測された言語的特徴(意味特徴)が直接プランモジュールへ送られる。
【0201】
その後、商品データベースに対して検索の問い合わせ(『(11.)青のものはありますか?』)を実行する。ここでは、前に検索した結果に「青」という条件を加えて再検索を行ったところ候補が2件に絞られたので、秘書エージェントシステムは、商品データベースから検索の結果(『(12.)2件あります。』)を受け取った後、さらに、商品データベースに対して問い合わせ(『(13.)1件目のキャラクターと値段を教えてください。』)を実行する。ここでは、秘書エージェントシステムは、商品データベースから問い合わせの回答(『(14.)「いるかくん」で4,200円です。』)を受け取った後、1件目の商品の情報を所定の言語テクスト(『「「いるかくん」で4,200円の時計があります。」』)の形でユーザに対して出力する。
【0202】
【発明の効果】
以上説明したように本発明によれば、ユーザと日常言語コンピュータシステムとの間での言語テクストの対話的なやりとりを個々のユーザに特化した形で柔軟にかつ精密に行うことができる。また、ユーザと日常言語コンピュータシステムとの間で行われる対話の流れを個々のユーザに特化した形で円滑にかつ自然な形で制御することができる。
【図面の簡単な説明】
【図1】本発明の一実施の形態に係る秘書エージェントシステムの全体構成を示すブロック図。
【図2】図1に示す秘書エージェントシステムの言語理解・生成モジュールにおける言語テクストの理解過程を説明するためのフローチャート。
【図3】図1に示す秘書エージェントシステムの言語理解・生成モジュールにおける言語テクストの生成過程を説明するためのフローチャート。
【図4】図1に示す秘書エージェントシステムのプランモジュールで用いられるインタラクションプランユニットの例を示す図。
【図5】図1に示す秘書エージェントシステムのプランモジュールで用いられるドメインプランユニットの一例を示す図。
【図6】図4に示すインタラクションプランユニットの各ステージに割り当てられる動作仕様のうち動作タイプ(発話行為の種類)を列挙して示す図。
【図7】図1に示す秘書エージェントシステムのプランモジュールで用いられるプラン構造の一例を示す図。
【図8】図7に示すプラン構造の管理方法の一例を示す図。
【図9】図1に示す秘書エージェントシステムのプランモジュールにおけるステージの同定方法を説明するためのフローチャート。
【図10】図1に示す秘書エージェントシステムのプランモジュールにおけるムーブの選択方法を説明するためのフローチャート。
【図11】図1に示す秘書エージェントシステムのプランモジュールにおける発話の予測方法を説明するためのフローチャート。
【図12】図1に示す秘書エージェントシステムのクライアントモデル部で用いられるプロファイル情報(言語傾向情報およびプロパティ情報)およびプロパティ特性情報の概要を説明するための図。
【図13】図12に示すプロファイル情報の言語傾向情報に含まれる感性語の利用態様の一例(フォントの決定例)を説明するための図。
【図14】図12に示すプロファイル情報の言語傾向情報に含まれる感性語の利用態様の他の例(色の決定例)を説明するための図。
【図15】図12に示すプロファイル情報の言語傾向情報に含まれる感性語の意味と状況(状況タイプ)との関係を説明するための図。
【図16】図12に示すプロファイル情報のプロパティ情報に含まれるユーザ情報の一例を示す図。
【図17】図12に示すプロファイル情報のプロパティ情報に含まれるスケジュールの一例を説明するための図。
【図18】図12に示すプロファイル情報のプロパティ情報に含まれる個人的関連知識の一例を示す図。
【図19】図12に示すプロパティ特性情報の一例を示す図。
【図20】実施例1で行われる対話例(ワープロソフトを使う場合の対話例)を説明するための図。
【図21】実施例1におけるプラン構造の第1段階を示す図。
【図22】実施例1におけるプラン構造の第2段階を示す図。
【図23】実施例1におけるプラン構造の第3段階を示す図。
【図24】実施例1におけるプラン構造の第4段階を示す図。
【図25】実施例2で行われる対話例(ヘルプシステムとして用いられる場合の対話例)を説明するための図。
【図26】実施例3で行われる対話例(情報検索を行う場合の対話例)を説明するための図。
【符号の説明】
10 秘書エージェントシステム
20 言語理解・生成モジュール
21 一般的テクスト理解部
22 ユーザ特化テクスト理解部
23 一般的テクスト生成部
24 ユーザ特化テクスト生成部
30 プランモジュール
31 ステージ同定部
32 ムーブ選択部
33 発話予測部
34 プランライブラリ
35 インタラクションプランユニット
36 ドメインプランユニット
37 プラン構造
40 クライアントモデル部
41 プロファイル情報
42 プロパティ特性情報
50 外部インタフェース
51 言語傾向情報
52 ユーザ語
53 感性語
54 程度副詞
55 プロパティ情報
56 ユーザ情報
57 スケジュール
58 個人的関連知識
60 セミオティックベース
61 汎用電子化辞書
62 コンテクストベース
63 意味ベース
64 語彙文法ベース
65 状況依存辞書

Claims (20)

  1. 日常言語の意味の体系を構造化したセミオティックベースに基づいて言語テクストの処理を行う日常言語コンピュータシステムで用いられ、ユーザと日常言語コンピュータシステムとの間での言語テクストの対話的なやりとりを支援する秘書エージェントシステムにおいて、
    前記日常言語コンピュータシステムの前記セミオティックベースを参照して、前記ユーザから入力された言語テクストの意味理解を行うとともに、言語テクストの言語的特徴に基づいて前記ユーザへ出力される言語テクストの生成を行う言語理解・生成処理部と、
    前記ユーザと前記日常言語コンピュータシステムとの間で行われる言語テクストに基づく対話の流れを制御するプラン処理部であって、前記言語理解・生成処理部により意味理解を行うことで得られた言語テクストの言語的特徴に基づいて、前記言語理解・生成処理部を介して前記ユーザへ出力される言語テクストの言語的特徴の生成を行うプラン処理部と、
    前記ユーザの個人的な特徴に関する知識を蓄積するクライアントモデル部とを備え、
    前記言語理解・生成処理部は、前記セミオティックベースとともに前記クライアントモデル部を参照して、前記ユーザに特化した言語テクストの意味理解および言語テクストの生成を行うことを特徴とする秘書エージェントシステム。
  2. 前記プラン処理部は、(a)前記ユーザと前記日常言語コンピュータシステムとの間で行われる対話のパターンを当該対話の各段階に対応する複数のステージ間の関係として表す複数のプランユニットを保持するプランライブラリと、(b)進行中の対話の構造を前記各プランユニット間の依存関係として表すプラン構造と、(c)前記プランライブラリに保持されている前記複数のプランユニットを参照して、前記言語理解・生成処理部により意味理解を行うことで得られた言語テクストの言語的特徴に基づいて前記プラン構造における現時点のステージを同定するステージ同定部と、(d)前記ステージ同定部により同定された現時点のステージに続く可能性のあるステージのうち前記ユーザまたは前記日常言語コンピュータシステム上で稼働する言語アプリケーションや他のエージェントなどに対する発話などの実質的な動作を表すステージである複数のムーブの中から最適なムーブを選択するムーブ選択部とを有することを特徴とする、請求項1に記載の秘書エージェントシステム。
  3. 前記プラン処理部は、(e)前記プランライブラリに保持されている前記複数のプランユニットを参照して、前記プラン構造における現時点のステージに続く可能性のあるステージのうち前記ユーザの次の発話を表すステージであるムーブを予測する発話予測部をさらに有し、
    前記プラン処理部の前記ステージ同定部は、前記言語理解・生成処理部により意味理解を行うことで得られた言語テクストの言語的特徴と、前記発話予測部により予測されたムーブとのマッチングを行うことにより、前記プラン構造における現時点のステージを同定することを特徴とする、請求項2に記載の秘書エージェントシステム。
  4. 前記プラン処理部の前記プランライブラリに保持されている前記複数のプランユニットは対話が行われる状況を表す状況タイプごとに分類されており、
    前記プラン処理部の前記ステージ同定部および前記ムーブ選択部で用いられる前記プラン構造は、状況タイプに対応する複数のサブプラン構造の組み合わせとして管理されていることを特徴とする、請求項2または3に記載の秘書エージェントシステム。
  5. 前記プラン処理部の前記プランライブラリに保持されている前記複数のプランユニットの前記各ステージにはそのステージの望ましさを表す数値として選好度が与えられており、
    前記プラン処理部の前記ムーブ選択部は、前記各プランユニットの前記各ステージに与えられた選好度を参照して、前記複数のムーブの中から最適なムーブを選択することを特徴とする、請求項2乃至4のいずれかに記載の秘書エージェントシステム。
  6. 前記プラン処理部の前記ムーブ選択部は、前記クライアントモデル部に蓄積されている前記ユーザの個人的な特徴に関する知識を参照して、前記複数のムーブの中から最適なムーブを選択することを特徴とする、請求項2乃至5のいずれかに記載の秘書エージェントシステム。
  7. 前記クライアントモデル部は、前記言語理解・生成処理部を介して前記ユーザから入力された言語テクストに含まれる情報または前記プラン処理部により制御される対話の流れに関する情報に基づいて、前記ユーザの個人的な特徴に関する知識を自律的に学習することを特徴とする、請求項1乃至6のいずれかに記載の秘書エージェントシステム。
  8. 前記クライアントモデル部は、前記ユーザ自身の言語的傾向を記述した言語傾向情報を保持し、
    前記言語理解・生成処理部は、前記クライアントモデル部に保持されている前記言語傾向情報を参照して、前記ユーザから入力された言語テクストを前記日常言語コンピュータシステムで用いられる適切な言語テクストに換言するとともに、前記日常言語コンピュータシステムから得られた言語テクストを前記ユーザに理解しやすい言語テクストに換言することを特徴とする、請求項1乃至7のいずれかに記載の秘書エージェントシステム。
  9. 前記クライアントモデル部に保持されている前記言語傾向情報はコンピュータ画面上に呈示される文字、図および線を表現する複数の感性語を含むことを特徴とする、請求項8に記載の秘書エージェントシステム。
  10. 前記クライアントモデル部は、複数のユーザに共通した特徴を記述したプロパティ特性情報をさらに保持し、
    前記言語理解・生成処理部は、前記クライアントモデル部に保持されている前記言語傾向情報を前記プロパティ特性情報とともに参照して、言語テクストの換言を行うことを特徴とする、請求項8に記載の秘書エージェントシステム。
  11. 前記クライアントモデル部は、前記ユーザ自身のプロフィールを記述したプロパティ情報を保持し、
    前記言語理解・生成処理部は、前記クライアントモデル部に保持されている前記プロパティ情報を参照して、前記ユーザから入力された言語テクストを部分的に補完するとともに、前記日常言語コンピュータシステムから得られた言語テクストを部分的に省略することを特徴とする、請求項1乃至10のいずれかに記載の秘書エージェントシステム。
  12. 前記クライアントモデル部は、複数のユーザに共通した特徴を記述したプロパティ特性情報をさらに保持し、
    前記言語理解・生成処理部は、前記クライアントモデル部に保持されている前記プロパティ情報を前記プロパティ特性情報とともに参照して、言語テクストの補完および省略を行うことを特徴とする、請求項11に記載の秘書エージェントシステム。
  13. 前記クライアントモデル部は、前記ユーザ自身のプロフィールを記述したプロパティ情報を保持し、
    前記プラン処理部は、前記クライアントモデル部に保持されている前記プロパティ情報を参照して、前記ユーザと前記日常言語コンピュータシステムとの間で行われる対話の流れを制御することを特徴とする、請求項1乃至12のいずれかに記載の秘書エージェントシステム。
  14. 前記クライアントモデル部は、複数のユーザに共通した特徴を記述したプロパティ特性情報をさらに保持し、
    前記プラン処理部は、前記クライアントモデル部に保持されている前記プロパティ情報を前記プロパティ特性情報とともに参照して、前記ユーザと前記日常言語コンピュータシステムとの間で行われる対話の流れを制御することを特徴とする、請求項13に記載の秘書エージェントシステム。
  15. 日常言語の意味の体系を構造化したセミオティックベースに基づいて言語テクストの処理を行う日常言語コンピュータシステムで用いられ、ユーザと前記日常言語コンピュータシステムとの間での言語テクストの対話的なやりとりを支援する秘書エージェントプログラムにおいて、
    前記日常言語コンピュータシステムの前記セミオティックベースを参照して、前記ユーザから入力された言語テクストの意味理解を行うとともに、言語テクストの言語的特徴に基づいて前記ユーザへ出力される言語テクストの生成を行う言語理解・生成処理機能と、
    前記ユーザと前記日常言語コンピュータシステムとの間で行われる言語テクストに基づく対話の流れを制御するプラン処理機能であって、前記言語理解・生成処理機能により意味理解を行うことで得られた言語テクストの言語的特徴に基づいて、前記言語理解・生成処理機能を介して前記ユーザへ出力される言語テクストの言語的特徴の生成を行うプラン処理機能とを備え、
    前記言語理解・生成処理機能は、前記セミオティックベースとともに、あらかじめ用意された前記ユーザの個人的な特徴に関する知識を参照して、前記ユーザに特化した言語テクストの意味理解および言語テクストの生成を行うことを特徴とする秘書エージェントプログラム。
  16. 日常言語の意味の体系を構造化したセミオティックベースに基づいて言語テクストの処理を行う日常言語コンピュータシステムで用いられる対話プランニング方法において、
    前記セミオティックベースを参照して意味理解を行うことで得られた言語テクストの言語的特徴を受け取るステップと、
    前記ユーザと前記日常言語コンピュータシステムとの間で行われる対話のパターンを当該対話の各段階に対応する複数のステージ間の関係として表す複数のプランユニットと、進行中の対話の構造を前記各プランユニット間の依存関係として表すプラン構造とを参照して、前記言語テクストの言語的特徴に基づいて前記プラン構造における現時点のステージを同定するステップと、
    同定された現時点のステージに続く可能性のあるステージのうち前記ユーザまたは前記日常言語コンピュータシステム上で稼働する言語アプリケーションや他のエージェントなどに対する発話などの実質的な動作を表すステージである複数のムーブの中から最適なムーブを選択し、前記言語理解・生成処理部を介して前記ユーザへ出力される言語テクストの言語的特徴の生成、または前記日常言語コンピュータシステム上で稼働する言語アプリケーションや他のエージェントなどへ出力される操作指示の生成を行うステップとを含むことを特徴とする対話プランニング方法。
  17. 前記複数のプランユニットを参照して、前記プラン構造における現時点のステージに続く可能性のあるステージのうち前記ユーザの次の発話を表すステージであるムーブを予測するステップをさらに含み、
    前記プラン構造における現時点のステージを同定するステップにおいて、意味理解を行うことで得られた言語テクストの言語的特徴と、予測されたムーブとのマッチングを行うことを特徴とする、請求項16に記載の対話プランニング方法。
  18. 前記複数のプランユニットは対話が行われる状況に対応する状況タイプごとに分類されており、
    前記プラン構造は、状況タイプに対応する複数のサブプラン構造の組み合わせとして管理されていることを特徴とする、請求項16または17に記載の秘書エージェントシステム。
  19. 前記複数のプランユニットの前記各ステージにはそのステージの望ましさを表す数値として選好度が与えられており、
    前記プラン構造における現時点のステージに続く可能性のある前記複数のムーブの中から最適なムーブを選択するステップにおいて、前記各プランユニットの前記各ステージに与えられた選好度を参照することを特徴とする、請求項16乃至18のいずれかに記載の秘書エージェントシステム。
  20. 前記プラン構造における現時点のステージに続く可能性のある前記複数のムーブの中から最適なムーブを選択するステップにおいて、クライアントモデル部に蓄積されている前記ユーザの個人的な特徴に関する知識を参照することを特徴とする、請求項16乃至19のいずれかに記載の秘書エージェントシステム。
JP2002304842A 2002-10-18 2002-10-18 日常言語コンピュータシステムで用いられる秘書エージェントシステム、秘書エージェントプログラムおよび対話プランニング方法 Pending JP2004139446A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002304842A JP2004139446A (ja) 2002-10-18 2002-10-18 日常言語コンピュータシステムで用いられる秘書エージェントシステム、秘書エージェントプログラムおよび対話プランニング方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002304842A JP2004139446A (ja) 2002-10-18 2002-10-18 日常言語コンピュータシステムで用いられる秘書エージェントシステム、秘書エージェントプログラムおよび対話プランニング方法

Publications (1)

Publication Number Publication Date
JP2004139446A true JP2004139446A (ja) 2004-05-13

Family

ID=32452150

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002304842A Pending JP2004139446A (ja) 2002-10-18 2002-10-18 日常言語コンピュータシステムで用いられる秘書エージェントシステム、秘書エージェントプログラムおよび対話プランニング方法

Country Status (1)

Country Link
JP (1) JP2004139446A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008507007A (ja) * 2004-06-17 2008-03-06 ロベルト・ボッシュ・ゲゼルシャフト・ミト・ベシュレンクテル・ハフツング 車両及び他の複雑な装置用の双方向マニュアル、システム及び方法
US9390117B2 (en) 2012-05-31 2016-07-12 International Business Machines Corporation Method of transforming sets of input strings into at least one pattern expression that is string expressing sets of input strings, method of extracting transformation pattern as approximate pattern expression, and computer and computer program for the methods
JP2016535297A (ja) * 2013-12-16 2016-11-10 三菱電機株式会社 対話マネージャー
KR101804632B1 (ko) * 2015-10-02 2017-12-04 엘지전자 주식회사 대화형 에이전트 서비스 제공 장치, 그 동작 방법

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002236681A (ja) * 2001-02-09 2002-08-23 Inst Of Physical & Chemical Res 日常言語コンピューティングシステムおよびその方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002236681A (ja) * 2001-02-09 2002-08-23 Inst Of Physical & Chemical Res 日常言語コンピューティングシステムおよびその方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008507007A (ja) * 2004-06-17 2008-03-06 ロベルト・ボッシュ・ゲゼルシャフト・ミト・ベシュレンクテル・ハフツング 車両及び他の複雑な装置用の双方向マニュアル、システム及び方法
JP4689670B2 (ja) * 2004-06-17 2011-05-25 ロベルト・ボッシュ・ゲゼルシャフト・ミト・ベシュレンクテル・ハフツング 車両及び他の複雑な装置用の双方向マニュアル、システム及び方法
US9390117B2 (en) 2012-05-31 2016-07-12 International Business Machines Corporation Method of transforming sets of input strings into at least one pattern expression that is string expressing sets of input strings, method of extracting transformation pattern as approximate pattern expression, and computer and computer program for the methods
JP2016535297A (ja) * 2013-12-16 2016-11-10 三菱電機株式会社 対話マネージャー
KR101804632B1 (ko) * 2015-10-02 2017-12-04 엘지전자 주식회사 대화형 에이전트 서비스 제공 장치, 그 동작 방법

Similar Documents

Publication Publication Date Title
CN111033492B (zh) 为自动化助手提供命令束建议
US11636258B2 (en) Systems and methods for constructing textual output options
JP5142720B2 (ja) デバイスの認知的に過負荷なユーザのインタラクティブ会話型対話
JP5166661B2 (ja) 計画に基づくダイアログを実行する方法および装置
US20050138556A1 (en) Creation of normalized summaries using common domain models for input text analysis and output text generation
EP0907923A1 (en) Method and system for computing semantic logical forms from syntax trees
JP2010532897A (ja) 知的なテキスト注釈の方法、システム及びコンピュータ・プログラム
KR20160147303A (ko) 기억 능력을 이용하는 다중 사용자 기반의 대화 관리 방법 및 이를 수행하는 장치
Kong et al. Conversational AI with Rasa: Build, test, and deploy AI-powered, enterprise-grade virtual assistants and chatbots
JP2002236681A (ja) 日常言語コンピューティングシステムおよびその方法
Foster State of the art review: Multimodal fission
Becker et al. Natural and intuitive multimodal dialogue for in-car applications: The SAMMIE system
Masuwa-Morgan et al. Justification of the need for an ontology for accessibility requirements (Theoretic framework)
JP2004139446A (ja) 日常言語コンピュータシステムで用いられる秘書エージェントシステム、秘書エージェントプログラムおよび対話プランニング方法
Zhou Natural language interface for information management on mobile devices
Shaikh et al. Comprehensive understanding of intelligent user interfaces
JP2019194759A (ja) 対話システム補強装置及びコンピュータプログラム
US20220327288A1 (en) Semantic Parsing of Utterance Using Contractive Paraphrasing
JP4056298B2 (ja) 言語コンピュータ、言語処理方法、ならびに、プログラム
Gasós et al. Intelligent E-commerce with guiding agents based on Personalized Interaction Tools
JP2001249930A (ja) 協調的応答型情報提供方法および装置
Phatangare et al. AI-Powered News Web App
Parente Clique: perceptually based, task oriented auditory display for GUI applications
Tools Online Help and User Manuals A Syntactical Analysis using
Sheu et al. Dynamic and Goal-oriented Interaction for Multi-modal Service Agents

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060104

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060303

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060322