JP2004139446A

JP2004139446A - 日常言語コンピュータシステムで用いられる秘書エージェントシステム、秘書エージェントプログラムおよび対話プランニング方法

Info

Publication number: JP2004139446A
Application number: JP2002304842A
Authority: JP
Inventors: Shino Iwashita; 岩　下　志　乃; Toru Sugimoto; 杉　本　　　徹; Michio Sugano; 菅　野　道　夫
Original assignee: RIKEN Institute of Physical and Chemical Research
Current assignee: RIKEN Institute of Physical and Chemical Research
Priority date: 2002-10-18
Filing date: 2002-10-18
Publication date: 2004-05-13

Abstract

【課題】ユーザと日常言語コンピュータシステムとの間での言語テクストの対話的なやりとりを個々のユーザに特化した形で柔軟にかつ精密に行うことができる秘書エージェントシステムを提供する。
【解決手段】秘書エージェントシステム１０は、言語理解・生成モジュール２０において、ユーザの個人的な特徴に関する知識を蓄積する知識ベースであるクライアントモデル部４０を参照して、ユーザに特化した言語テクストの意味理解および生成を行う。また、プランモジュール３０において、対話のパターンを当該対話の各段階に対応する複数のステージ間の関係として表す複数のインタラクションプランユニット３５と、進行中の対話の構造を各インタラクションプランユニット３５間の依存関係として表すプラン構造３７と、ユーザの個人的な特徴に関する知識を蓄積する知識ベースであるクライアントモデル部４０を参照して、ユーザに特化した対話プランニングを行う。
【選択図】　図１

Description

【０００１】
【発明の属する技術分野】
本発明は、人間が日常的に用いる言語（日常言語）の意味の体系を構造化したセミオティックベースに基づいて言語テクストの処理を行う日常言語コンピュータシステムに係り、とりわけ、ユーザと日常言語コンピュータシステムとの間での言語テクストの対話的なやりとりを支援する秘書エージェントシステムおよび秘書エージェントプログラムに関する。また、本発明は、このような秘書エージェントシステムで好適に用いられ、ユーザと日常言語コンピュータシステムとの間で行われる対話の流れを制御する対話プランニング方法に関する。
【０００２】
【従来の技術】
近年、情報処理技術や通信技術などの急速な発展により、我々の生活の至るところでコンピュータが用いられるようになってきている。このような高度情報化社会においては、コンピュータなどの専門的な知識が少ない一般的なユーザでも簡単にコンピュータを扱えることが望まれるが、実際には、コンピュータを扱える人は専門的な知識を持った一部の人に限られているのが現状である。
【０００３】
このような背景の下で、コンピュータの操作性を向上させるための各種の手法が提案されており、例えば、特許文献１には、ユーザとの間で自然言語による対話を実現する対話システムが提案されている。また、非特許文献１には、対話システムにおける自然言語による対話プランニングおよびそれに用いられるユーザモデルが提案されている。さらに、対話システムにおける具体的な対話の制御方法として、特許文献２には、対話の一貫性を損なうことなくユーザによる割り込みをいつでも受け付けることを可能にするための、談話ゴールに基づく対話制御方法が提案されている。また、非特許文献２には、ユーザが電話を通して電子メールシステムにアクセスすることを可能にするための、対話構造のモデルを用いた相互主導型の対話管理方式が提案されている。
【０００４】
一方、このような対話システムを用いた手法以外にも、個々のユーザごとに情報の提供の仕方を変えることにより、コンピュータの操作性を向上させる手法が提案されている。例えば、特許文献３には、見学者が展示会場を簡単に移動できるとともに見学者のプライバシーを保護できるような個人化情報提示方法が提案されている。また、非特許文献３には、互いに関連度を持つキーワードの集合から作成された概念空間を用い、ユーザの興味を、ユーザとコンピュータとの間の質問／回答の対話を通して推定することにより、情報提供を個人化していく方法が提案されている。さらに、非特許文献４には、過去のユーザプロファイルと現在閲覧したホームページの特徴ベクトルとを合成するパラメータを設定することにより、個人の嗜好に合ったホームページを推薦することを可能にするソフトウェアが提案されている。
【０００５】
【特許文献１】
特開２００２−１６２９９３号公報
【特許文献２】
特開２００１−３５６７９７号公報
【特許文献３】
特開２０００−１７２２３８号公報
【非特許文献１】
熊本　忠彦，「自然言語対話システムにおける協調的応答の生成」，人工知能学会論文誌，Ｖｏｌ．１４，Ｎｏ．１，ｐｐ．３−１０，１９９９
【非特許文献２】
Ｓａｎｄｒａ　Ｗｉｌｌｉａｍｓ　ａｎｄ　Ｍａｒｔｌｅｓｈａｍ　Ｈｅａｔｈ，　”Ｄｉａｌｏｇｕｅ　ｍａｎａｇｅｍｅｎｔ　ｉｎ　ａ　ｍｉｘｅｄ−ｉｎｉｔｉａｔｉｖｅ，　ｃｏｏｐｅｒａｔｉｖｅ，　ｓｐｏｋｅｎ　ｌａｎｇｕａｇｅ　ｓｙｓｔｅｍ，”　１１ｔｈ　Ｔｗｅｎｔｅ　Ｗｏｒｋｓｈｏｐ　ｏｎ　Ｌａｎｇｕａｇｅ　Ｔｅｃｈｎｏｌｏｇｙ　（ＴＷＬＴ１１）　Ｄｉａｌｏｇｕｅ　Ｍａｎａｇｅｍｅｎｔ　ｉｎ　Ｎａｔｕｒａｌ　Ｌａｎｇｕａｇｅ　Ｓｙｓｔｅｍｓ，　Ｅｎｓｃｈａｄｅ，　Ｎｅｔｈｅｒｌａｎｄｓ，　Ｊｕｎｅ　１９９６
【非特許文献３】
角　薫，角　康之，間瀬　健二，中須賀　真一，堀　浩一，「個人の概念空間を利用した興味の推定による情報提供」，電子情報通信学会論文誌，Ｖｏｌ．Ｊ８２−Ｄ−ＩＩ，Ｎｏ．１０，ｐｐ．１６３４−１６４４
【非特許文献４】
九津見　洋，内藤　榮一，荒木　昭一，江村　里志，新居　薫治，「ユーザ適応型ホームページ推薦ソフト“ウェブナビゲーター”の開発」，電子情報通信学会論文誌，Ｖｏｌ．Ｊ−８４−Ｄ−ＩＩ，Ｎｏ．６，ｐｐ．１１４９−１１５７
【０００６】
【発明が解決しようとする課題】
しかしながら、上述した従来の手法はいずれも、既存のコンピュータシステムを前提とするものであり、ユーザとの対話を表面的には実現することができるものの、内部で行われる情報処理はあくまでも数値や記号などに基づいた演算処理に過ぎず、ユーザの発話の意味を理解した上で情報処理を行っているわけではない。このため、このようなコンピュータを利用するユーザは、依然として、コンピュータで行われる情報処理の内容や操作などを正確に理解した上でコンピュータを操作する必要があり、コンピュータなどの専門的な知識が少ない一般的なユーザには依然として使いこなすことが困難であるという問題がある。
【０００７】
このような背景の下で、本発明者らは、日常生活において家電製品と同じような感覚で誰でも簡単にコンピュータを扱えることができるようにするため、新しいパラダイムに基づくコンピュータシステム（「日常言語コンピュータシステム」）を提案している（特開２００２−２３６６８１号公報、特願２００２−１５４６８８号および特願２００２−１５４８２３号参照）。本発明者らが提案する日常言語コンピュータシステムは、日常言語の意味の体系を構造化したセミオティックベースに基づいて言語テクストの処理を行うものであり、全ての情報処理を日常言語をベースとして実行することにより、ユーザとコンピュータとが日常言語により直接対話することを可能にするものである。なお、特願２００２−１５４６８８号および特願２００２−１５４８２３号は出願時点において未公開の出願であるが、特願２００２−１５４６８８号に関連する論文として、論文１（高橋　祐介，伊藤　紀子，藤城　浩子，菅野　道夫，「セミオティックベースにおけるコンテクスト層の検討」，２００２年度人工知能学会全国大会（第１６回），３Ｂ１−０２，Ｍａｙ　２００２）があり、特願２００２−１５４８２３号に関連する論文として、論文２（岩爪　道昭，小林　一郎，杉本　徹，岩下　志乃，菅野　道夫，「日常言語コンピューティング（第２報）‐日常言語に基づく計算機資源の管理・実行環境を目指して‐」，２００２年度人工知能学会全国大会（第１６回），３Ｂ１−０１，Ｍａｙ　２００２）および論文３（小林　一郎，岩爪　道昭，杉本　徹，岩下　志乃，菅野　道夫，「自然言語をコンピュータの通信規約にした通信手法の提案」，２００２年度人工知能学会全国大会（第１６回），３Ｂ１−０４，Ｍａｙ　２００２）があるので、併せて参照されたい。
【０００８】
本発明はこのような日常言語コンピュータシステムを前提としてなされたものであり、ユーザと日常言語コンピュータシステムとの間での言語テクストの対話的なやりとりを個々のユーザに特化した形で柔軟にかつ精密に行うことができる秘書エージェントシステムおよび秘書エージェントプログラムを提供することを目的とする。
【０００９】
また、本発明は、このような秘書エージェントシステムで好適に用いられる対話プランニング方法であって、ユーザと日常言語コンピュータシステムとの間で行われる対話の流れを個々のユーザに特化した形で円滑にかつ自然な形で制御することができる対話プランニング方法を提供することを目的とする。
【００１０】
【課題を解決するための手段】
本発明は、第１の解決手段として、日常言語の意味の体系を構造化したセミオティックベースに基づいて言語テクストの処理を行う日常言語コンピュータシステムで用いられ、ユーザと日常言語コンピュータシステムとの間での言語テクストの対話的なやりとりを支援する秘書エージェントシステムにおいて、前記日常言語コンピュータシステムの前記セミオティックベースを参照して、前記ユーザから入力された言語テクストの意味理解を行うとともに、言語テクストの言語的特徴に基づいて前記ユーザへ出力される言語テクストの生成を行う言語理解・生成処理部と、前記ユーザと前記日常言語コンピュータシステムとの間で行われる言語テクストに基づく対話の流れを制御するプラン処理部であって、前記言語理解・生成処理部により意味理解を行うことで得られた言語テクストの言語的特徴に基づいて、前記言語理解・生成処理部を介して前記ユーザへ出力される言語テクストの言語的特徴の生成を行うプラン処理部と、前記ユーザの個人的な特徴に関する知識を蓄積するクライアントモデル部とを備え、前記言語理解・生成処理部は、前記セミオティックベースとともに前記クライアントモデル部を参照して、前記ユーザに特化した言語テクストの意味理解および言語テクストの生成を行うことを特徴とする秘書エージェントシステムを提供する。
【００１１】
なお、上述した第１の解決手段において、前記プラン処理部は、（ａ）前記ユーザと前記日常言語コンピュータシステムとの間で行われる対話のパターンを当該対話の各段階に対応する複数のステージ間の関係として表す複数のプランユニットを保持するプランライブラリと、（ｂ）進行中の対話の構造を前記各プランユニット間の依存関係として表すプラン構造と、（ｃ）前記プランライブラリに保持されている前記複数のプランユニットを参照して、前記言語理解・生成処理部により意味理解を行うことで得られた言語テクストの言語的特徴に基づいて前記プラン構造における現時点のステージを同定するステージ同定部と、（ｄ）前記ステージ同定部により同定された現時点のステージに続く可能性のあるステージのうち前記ユーザまたは前記日常言語コンピュータシステム上で稼働する言語アプリケーションや他のエージェントなどに対する発話などの実質的な動作を表すステージである複数のムーブの中から最適なムーブを選択するムーブ選択部とを有することが好ましい。また、前記プラン処理部は、（ｅ）前記プランライブラリに保持されている前記複数のプランユニットを参照して、前記プラン構造における現時点のステージに続く可能性のあるステージのうち前記ユーザの次の発話を表すステージであるムーブを予測する発話予測部をさらに有し、前記プラン処理部の前記ステージ同定部は、前記言語理解・生成処理部により意味理解を行うことで得られた言語テクストの言語的特徴と、前記発話予測部により予測されたムーブとのマッチングを行うことにより、前記プラン構造における現時点のステージを同定することが好ましい。さらに、前記プラン処理部の前記プランライブラリに保持されている前記複数のプランユニットは対話が行われる状況を表す状況タイプごとに分類されており、前記プラン処理部の前記ステージ同定部および前記ムーブ選択部で用いられる前記プラン構造は、状況タイプに対応する複数のサブプラン構造の組み合わせとして管理されていることが好ましい。
【００１２】
また、上述した第１の解決手段において、前記プラン処理部の前記プランライブラリに保持されている前記複数のプランユニットの前記各ステージにはそのステージの望ましさを表す数値として選好度が与えられており、前記プラン処理部の前記ムーブ選択部は、前記各プランユニットの前記各ステージに与えられた選好度を参照して、前記複数のムーブの中から最適なムーブを選択することが好ましい。また、前記プラン処理部の前記ムーブ選択部は、前記クライアントモデル部に蓄積されている前記ユーザの個人的な特徴に関する知識を参照して、前記複数のムーブの中から最適なムーブを選択することが好ましい。
【００１３】
さらに、上述した第１の解決手段において、前記クライアントモデル部は、前記言語理解・生成処理部を介して前記ユーザから入力された言語テクストに含まれる情報または前記プラン処理部により制御される対話の流れに関する情報に基づいて、前記ユーザの個人的な特徴に関する知識を自律的に学習することが好ましい。
【００１４】
さらに、上述した第１の解決手段において、前記クライアントモデル部は、前記ユーザ自身の言語的傾向を記述した言語傾向情報を保持し、前記言語理解・生成処理部は、前記クライアントモデル部に保持されている前記言語傾向情報を参照して、前記ユーザから入力された言語テクストを前記日常言語コンピュータシステムで用いられる適切な言語テクストに換言するとともに、前記日常言語コンピュータシステムから得られた言語テクストを前記ユーザに理解しやすい言語テクストに換言することが好ましい。ここで、前記クライアントモデル部に保持されている前記言語傾向情報はコンピュータ画面上に呈示される文字、図および線を表現する複数の感性語を含むことが好ましい。また、前記クライアントモデル部は、複数のユーザに共通した特徴を記述したプロパティ特性情報をさらに保持し、前記言語理解・生成処理部は、前記クライアントモデル部に保持されている前記言語傾向情報を前記プロパティ特性情報とともに参照して、言語テクストの換言を行うことが好ましい。
【００１５】
さらに、上述した第１の解決手段において、前記クライアントモデル部は、前記ユーザ自身のプロフィールを記述したプロパティ情報を保持し、前記言語理解・生成処理部は、前記クライアントモデル部に保持されている前記プロパティ情報を参照して、前記ユーザから入力された言語テクストを部分的に補完するとともに、前記日常言語コンピュータシステムから得られた言語テクストを部分的に省略することが好ましい。また、前記クライアントモデル部は、複数のユーザに共通した特徴を記述したプロパティ特性情報をさらに保持し、前記言語理解・生成処理部は、前記クライアントモデル部に保持されている前記プロパティ情報を前記プロパティ特性情報とともに参照して、言語テクストの補完および省略を行うことが好ましい。
【００１６】
さらに、上述した第１の解決手段において、前記クライアントモデル部は、前記ユーザ自身のプロフィールを記述したプロパティ情報を保持し、前記プラン処理部は、前記クライアントモデル部に保持されている前記プロパティ情報を参照して、前記ユーザと前記日常言語コンピュータシステムとの間で行われる対話の流れを制御することが好ましい。また、前記クライアントモデル部は、複数のユーザに共通した特徴を記述したプロパティ特性情報をさらに保持し、前記プラン処理部は、前記クライアントモデル部に保持されている前記プロパティ情報を前記プロパティ特性情報とともに参照して、前記ユーザと前記日常言語コンピュータシステムとの間で行われる対話の流れを制御することが好ましい。
【００１７】
本発明は、第２の解決手段として、日常言語の意味の体系を構造化したセミオティックベースに基づいて言語テクストの処理を行う日常言語コンピュータシステムで用いられ、ユーザと前記日常言語コンピュータシステムとの間での言語テクストの対話的なやりとりを支援する秘書エージェントプログラムにおいて、前記日常言語コンピュータシステムの前記セミオティックベースを参照して、前記ユーザから入力された言語テクストの意味理解を行うとともに、言語テクストの言語的特徴に基づいて前記ユーザへ出力される言語テクストの生成を行う言語理解・生成処理機能と、前記ユーザと前記日常言語コンピュータシステムとの間で行われる言語テクストに基づく対話の流れを制御するプラン処理機能であって、前記言語理解・生成処理機能により意味理解を行うことで得られた言語テクストの言語的特徴に基づいて、前記言語理解・生成処理機能を介して前記ユーザへ出力される言語テクストの言語的特徴の生成を行うプラン処理機能とを備え、前記言語理解・生成処理機能は、前記セミオティックベースとともに、あらかじめ用意された前記ユーザの個人的な特徴に関する知識を参照して、前記ユーザに特化した言語テクストの意味理解および言語テクストの生成を行うことを特徴とする秘書エージェントプログラムを提供する。
【００１８】
本発明は、第３の解決手段として、日常言語の意味の体系を構造化したセミオティックベースに基づいて言語テクストの処理を行う日常言語コンピュータシステムで用いられる対話プランニング方法において、前記セミオティックベースを参照して意味理解を行うことで得られた言語テクストの言語的特徴を受け取るステップと、前記ユーザと前記日常言語コンピュータシステムとの間で行われる対話のパターンを当該対話の各段階に対応する複数のステージ間の関係として表す複数のプランユニットと、進行中の対話の構造を前記各プランユニット間の依存関係として表すプラン構造とを参照して、前記言語テクストの言語的特徴に基づいて前記プラン構造における現時点のステージを同定するステップと、同定された現時点のステージに続く可能性のあるステージのうち前記ユーザまたは前記日常言語コンピュータシステム上で稼働する言語アプリケーションや他のエージェントなどに対する発話などの実質的な動作を表すステージである複数のムーブの中から最適なムーブを選択し、前記言語理解・生成処理部を介して前記ユーザへ出力される言語テクストの言語的特徴の生成、または前記日常言語コンピュータシステム上で稼働する言語アプリケーションや他のエージェントなどへ出力される操作指示の生成を行うステップとを含むことを特徴とする対話プランニング方法を提供する。
【００１９】
なお、上述した第３の解決手段において、前記複数のプランユニットを参照して、前記プラン構造における現時点のステージに続く可能性のあるステージのうち前記ユーザの次の発話を表すステージであるムーブを予測するステップをさらに含み、前記プラン構造における現時点のステージを同定するステップにおいて、意味理解を行うことで得られた言語テクストの言語的特徴と、予測されたムーブとのマッチングを行うことが好ましい。また、前記複数のプランユニットは対話が行われる状況に対応する状況タイプごとに分類されており、前記プラン構造は、状況タイプに対応する複数のサブプラン構造の組み合わせとして管理されていることが好ましい。
【００２０】
また、上述した第３の解決手段において、前記複数のプランユニットの前記各ステージにはそのステージの望ましさを表す数値として選好度が与えられており、前記プラン構造における現時点のステージに続く可能性のある前記複数のムーブの中から最適なムーブを選択するステップにおいて、前記各プランユニットの前記各ステージに与えられた選好度を参照することが好ましい。また、前記プラン構造における現時点のステージに続く可能性のある前記複数のムーブの中から最適なムーブを選択するステップにおいて、クライアントモデル部に蓄積されている前記ユーザの個人的な特徴に関する知識を参照するが好ましい。
【００２１】
本発明によれば、言語理解・生成処理部において、ユーザの個人的な特徴に関する知識を蓄積する知識ベースであるクライアントモデル部を参照して、ユーザに特化した言語テクストの意味理解および生成を行っているので、ユーザと日常言語コンピュータシステムとの間での言語テクストの対話的なやりとりを個々のユーザに特化した形で柔軟にかつ精密に行うことができる。
【００２２】
また、本発明によれば、プラン処理部において、ユーザと日常言語コンピュータシステムとの間で行われる対話のパターンを当該対話の各段階に対応する複数のステージ間の関係として表す複数のプランユニットと、進行中の対話の構造を各プランユニット間の依存関係として表すプラン構造とを参照して、対話プランニングを行っているので、ユーザと日常言語コンピュータシステムとの間で行われる対話の流れを円滑にかつ自然な形で制御することができる。また、プラン処理部において、ユーザの個人的な特徴に関する知識を蓄積する知識ベースであるクライアントモデル部を参照して、対話プランニングを行っているので、ユーザと日常言語コンピュータシステムとの間で行われる対話の流れを個々のユーザに特化した形で行うことができる。
【００２３】
【発明の実施の形態】
以下、図面を参照して本発明の実施の形態について説明する。
【００２４】
［１．秘書エージェントシステムの全体構成］
図１は本発明の一実施の形態に係る秘書エージェントシステムの全体構成を示すブロック図である。なお、図１に示す秘書エージェントシステム１０は、人間が日常的に用いる言語である日常言語を記述または口述した言語テクストの処理を行う日常言語コンピュータシステムに組み込まれて用いられるものであり、ユーザと日常言語コンピュータシステムとの間での言語テクストの対話的なやりとりを支援する窓口となるものである。ここで、日常言語コンピュータシステムは、日常言語の意味の体系を構造化したセミオティックベースに基づいて言語テクストの処理を行うものであり、その詳細については特開２００２−２３６６８１号公報、特願２００２−１５４６８８号および特願２００２−１５４８２３号に記載されているとおりであるので、詳細な説明は省略する。なお、日常言語コンピュータシステムが、ネットワークを介してクライアント側コンピュータおよびネットワーク側コンピュータが接続されたような分散構成をとる場合には、秘書エージェントシステム１０は、ユーザにより直接操作されるクライアント側コンピュータ上で稼働するクライアント秘書エージェントシステムの形態をとることが好ましい。
【００２５】
図１に示すように、秘書エージェントシステム１０は、言語理解・生成モジュール（言語理解・生成処理部）２０と、プランモジュール（プラン処理部）３０と、クライアントモデル部４０とを備えている。
【００２６】
このうち、言語理解・生成モジュール２０は、セミオティックベース６０を参照して、ユーザから入力された言語テクストの意味理解を行うとともに、言語テクストの言語的特徴に基づいてユーザへ出力される言語テクストの生成を行うモジュールである。ここで、セミオティックベース６０は、言語テクストの意味理解および生成のために有効な形で日常言語の意味の体系を構造化したデータベースであり、汎用電子化辞書６１、コンテクストベース６２、意味ベース６３、語彙文法ベース６４および状況依存辞書６５を有している。言語理解・生成モジュール２０は、このようなセミオティックベース６０を参照して、言語テクストを状況、意味、語彙文法および表現の４種類の観点から分析し、言語テクストの意味理解および生成を行う。なお、ユーザと言語理解・生成モジュール２０との間での言語テクストの入出力は外部インタフェース５０を介して行われる。
【００２７】
プランモジュール３０は、言語理解・生成モジュール２０から得られた言語テクストの言語的特徴に基づいて秘書エージェントシステム１０がとるべき行動（ユーザへの応答（言語テクストの出力）や、日常言語コンピュータシステム上で稼働する言語アプリケーションや他のエージェントへの操作指示）を決定するモジュールである。すなわち、プランモジュール３０は、ユーザと日常言語コンピュータシステムとの間で行われる言語テクストに基づく対話の流れを制御し、言語理解・生成モジュール２０により意味理解を行うことで得られた言語テクストの言語的特徴に基づいて、言語理解・生成モジュール２０を介してユーザへ出力される言語テクストの言語的特徴の生成、または日常言語コンピュータシステム上で稼働する言語アプリケーションや他のエージェントへの操作指示の生成を行うものである。
【００２８】
クライアントモデル部４０は、ユーザの個人的な特徴に関する知識を蓄積する知識ベースである。なお、クライアントモデル部４０は、言語理解・生成モジュール２０およびプランモジュール３０において利用されるものであり、言語理解・生成モジュール２０において、ユーザに特化した言語テクストの意味理解および生成を行ったり、プランモジュール３０において、ユーザに特化した対話プランニングを行ったりすることを可能にするものである。
【００２９】
以下、秘書エージェントシステム１０の各部（言語理解・生成モジュール２０、プランモジュール３０およびクライアントモデル４０）の構成および動作の詳細について説明する。
【００３０】
［２．　言語理解・生成モジュール］
まず、言語理解・生成モジュール２０の詳細について説明する。
【００３１】
図１に示すように、言語理解・生成モジュール２０は、マイクやキーボードなどの入力装置（図示せず）により外部インタフェース５０を介して入力された音声や文字などの形式の日常言語からなる言語テクストの意味理解を行うためのものであり、セミオティックベース６０を参照して一般的な言語知識の範囲で言語テクストの意味理解を行う一般的テクスト理解部２１と、クライアントモデル部４０に蓄積されているユーザの個人的な特徴に関する知識を参照してユーザに特化した（個人化した）より精密な言語テクストの意味理解を行うユーザ特化テクスト理解部２２とを有している。
【００３２】
また、言語理解・生成モジュール２０は、プランモジュール３０により生成された言語テクストの言語的特徴に基づいて言語テクストの生成を行うものであり、セミオティックベース６０を参照して一般的な言語知識の範囲で言語テクストの生成を行う一般的テクスト生成部２３と、クライアントモデル部４０に蓄積されているユーザの個人的な特徴に関する知識を参照してユーザに特化した（個人化した）より精密な言語テクストの生成を行うユーザ特化テクスト生成部２４とを有している。
【００３３】
［２．１．言語テクストの意味理解］
以下、図２により、一般的テクスト理解部２１およびユーザ特化テクスト理解部２２において言語テクストの意味理解を行う方法について説明する。なお、以下の説明のうち、一般的テクスト理解部２１における言語テクストの意味理解の手順（ステップ１０１〜１０６）については、特開２００２−２３６６８１号公報および特願２００２−１５４６８８号に記載された方法と同様であるので、以下においては、その概略のみを説明する。また、ユーザ特化テクスト理解部２３における言語テクストの意味理解の手順（ステップ１０７）については、［４．クライアントモデル部］の欄で詳細に説明する。
【００３４】
まず、言語理解・生成モジュール２０に対して、外部インタフェース５０を介して言語テクストが入力されると、一般的テクスト理解部２１において、セミオティックベース６０を参照して一般的な言語知識の範囲で言語テクストの意味理解が行われる（ステップ１０１〜１０６）。
【００３５】
（１）　パージング処理
まず、セミオティックベース６０の汎用電子化辞書６１を参照して、入力された言語テクストの形態素解析および係り受け解析を行う（ステップ１０１）。
【００３６】
（２）　発話予測の確認
次に、入力された言語テクストが、対話の構造に基づいて事前に予測された発話の内容と一致するかどうかを確認する（ステップ１０２）。ここで、入力された言語テクストと事前に予測した発話内容とが一致した場合は、それ以後の処理（ステップ１０３〜１０７）を省略することができる。なお、ステップ１０２で用いられる予測発話は、後述するように、プランモジュール３０の発話予測部３３により生成される（［３．プランモジュール］の欄参照）。
【００３７】
（３）　状況タイプの同定
その後、セミオティックベース６０のコンテクストベース６２を参照して、言語テクストに含まれる語彙や概念の傾向に基づいて、対話が行われる状況を表す状況タイプの同定を行う（ステップ１０３）。
【００３８】
（４）　資源のセットアップ
また、セミオティックベース６０のコンテクストベース６２を参照して、同定された状況タイプに関連付けられた全ての資源を活性化する（ステップ１０４）。
【００３９】
（５）　意味解析
さらに、セミオティックベース６０の意味ベース６３および語彙文法ベース６４のシステムネットワークを探査し、ステップ１０１で行われたパージング処理の結果に基づいて意味解析（語彙文法特徴および意味特徴の導出）を行う（ステップ１０５）。
【００４０】
（６）　文脈理解
その後、得られた意味解析の結果と対話の構造に基づいて予測された発話の内容とのマッチングを行い、意味解析の結果の具体化および補完を行う（ステップ１０６）。
【００４１】
なお、このようにして一般的な言語知識の範囲で言語テクストの意味理解を行った後、最終的に、ユーザ特化テクスト理解部２２において、クライアントモデル部４０に蓄積されているユーザの個人的な特徴に関する知識を参照して、ユーザに特化した（個人化した）より精密な言語テクストの意味理解（換言や補完など）を行い、得られた意味解析の結果（言語テクストの言語的特徴）をプランモジュール３０へ送る（ステップ１０７）。
【００４２】
［２．２．言語テクストの生成］
次に、図３により、一般的テクスト生成部２３およびユーザ特化テクスト生成部２４において言語テクストの生成を行う方法について説明する。なお、以下の説明のうち、一般的テクスト生成部２３における言語テクストの生成の手順（ステップ２０１〜２０６）については、特開２００２−２３６６８１号公報および特願２００２−１５４６８８号に記載された方法と同様であるので、以下においては、その概略のみを説明する。また、ユーザ特化テクスト生成部２４における言語テクストの生成の手順（ステップ２０７）については、［４．クライアントモデル部］の欄で詳細に説明する。
【００４３】
まず、言語理解・生成モジュール２０に対して、プランモジュール３０により生成された言語テクストの言語的特徴が送られると、一般的テクスト生成部２３において、セミオティックベース６０を参照して一般的な言語知識の範囲で言語テクストの生成が行われる（ステップ２０１〜２０６）。
【００４４】
（１）　状況タイプの同定
まず、セミオティックベース６０のコンテクストベース６２を参照して、対話が行われる状況を表す状況タイプに変化があるかどうかを確認し、必要があれば状況タイプを更新する（ステップ２０１）。
【００４５】
（２）　資源のセットアップ
ここで、状況タイプが更新された場合には、セミオティックベース６０のコンテクストベース６２を参照して、新しい状況タイプに関連付けられた資源を活性化する（ステップ２０２）。
【００４６】
（３）　テクストプランニング
次に、セミオティックベース６０のコンテクストベース６２を参照して、システムネットワークの値を確認し、対応する概念を活性化し、次いで、発話役割、発話機能および発話内容を決定する（ステップ２０３）。
【００４７】
（４）　意味特徴展開
そして、セミオティックベース６０の意味ベース６３を参照して、発話役割、発話機能および発話内容の意味特徴から、発話のインスタンス情報を決定する（ステップ２０４）。
【００４８】
（５）　文脈照合
また、必要に応じて、現在の発話状況に適した形にインスタンス情報を修正する（ステップ２０５）。
【００４９】
（６）　語彙特徴展開
その後、セミオティックベース６０の語彙文法ベース６４および状況依存辞書６５を検索し、インスタンス情報に対応する語彙表現を選択し、次いで、生成されるべき発話の内容のメタ機能を考慮して適切な助詞や接続形を選択する（ステップ２０６）。
【００５０】
なお、このようにして一般的な言語知識の範囲で言語テクストの生成を行った後、最終的に、ユーザ特化テクスト生成部２４において、クライアントモデル部４０に蓄積されているユーザの個人的な特徴に関する知識を参照してユーザに特化した（個人化した）より精密な言語テクストの生成（換言や省略など）を行い、得られた生成結果（言語テクスト）を出力する（ステップ２０７）。
【００５１】
［３．プランモジュール］
次に、プランモジュール３０の詳細について説明する。
【００５２】
図１に示すように、プランモジュール３０は、ユーザと日常言語コンピュータシステムとの間で行われる対話の構造を管理することにより、ユーザと日常言語コンピュータシステムとの間で行われる言語テクストに基づく対話の流れを制御するものであり、この目的のため、プランモジュール３０は、ユーザと日常言語コンピュータシステムとの間で行われる対話のパターンを集めたデータベースであるプランライブラリ３４と、進行中の対話の構造を表すデータ構造であるプラン構造３７とを備えている。
【００５３】
［３．１．プランライブラリ］
図１に示すように、プランライブラリ３４は、ユーザまたは秘書エージェントシステム１０で行われる可能な動作の系列を表す複数のプランユニットを保持するものであり、後述するステージ同定部３１、ムーブ選択部３２および発話予測部３３において利用される。
【００５４】
ここで、プランライブラリ３４に保持されているプランユニットは、次の２種類に分類される。
【００５５】
（１）　インタラクションプランユニット
インタラクションプランユニット３５は、対話のパターン（すなわち可能な発話（動作）の系列）を表すものであり、対話の流れを把握して、次にユーザに対して出力する内容を決めたり、ユーザの入力を理解したり予測したりするために用いられる。
【００５６】
（２）　ドメインプランユニット
ドメインプランユニット３６は、コンピュータ操作（アプリケーション操作など）を伴う作業のパターン（可能な動作の系列）を表すものであり、ユーザの作業段階を把握して、対話の話題を同定または選択したり、日常言語コンピュータシステム上で稼働する言語アプリケーションへ出力する内容を決めたりするために用いられる。
【００５７】
ここで、インタラクションプランユニット３５およびドメインプランユニット３６は、対話または作業のパターンを当該対話または作業の各段階に対応する複数のステージ間の関係（動作の系列）として表している。また、インタラクションプランユニット３５およびドメインプランユニット３６は、対話または作業が行われる状況に対応する状況タイプごとに分類されている。
【００５８】
なお、インタラクションプランユニット３５およびドメインプランユニット３６のいずれの種類のプランユニットも次の４つの要素から構成されている。
【００５９】
（１）　ヘッダ：プランユニットの名前とスロット（パラメータや引数）のリストを指定する部分。
【００６０】
（２）　ボディ：可能な動作の系列を遷移ネットワークの形式で記述する部分。
【００６１】
（３）　効果　：当該プランユニットの実行後に成立する条件を記述する部分。
【００６２】
（４）　制約　：スロットの値に関する制約条件を記述する部分。
【００６３】
ここで、プランユニットのボディには、動作の逐次的実行や選択、省略、繰り返しなどのパターンがネットワーク形式で表現されており、ノード間をつなぐ各アークがステージに対応している（図４および図５参照）。
【００６４】
なお、各ステージには、ラベルとして、ユーザや秘書エージェントシステム１０の動作（言語テクストの入出力またはコンピュータ操作を伴う作業）の仕様が割り当てられている。また、各ステージには、そのステージの望ましさ（ユーザの動作の場合には、確からしさ）を表す数値として選好度が与えられている。ここで、各ステージに割り当てられるラベルとしては、上述したような実質的な動作以外にも、他のプランユニットや、複数の動作の列に展開されるマクロ表現がある。なお、ステージのうち、他のプランユニットおよびマクロ表現以外のラベルを持つステージ（すなわち実質的な動作を行うステージ）をムーブと呼ぶ。
【００６５】
ここで、図４および図５は、「ワープロを使った文書作成に関する依頼応対」という状況タイプに結び付けられたプランユニットの例を示す図であり、このうち、図４（ａ）（ｂ）（ｃ）（ｄ）はインタラクションプランユニットの例を示し、図５はドメインプランユニットの例を示している。なお、図４（ａ）（ｂ）（ｃ）（ｄ）および図５においては、見やすさを重視して、各ステージに割り当てられた動作の仕様のうち動作タイプ（言語テクストの入出力の場合には、図６に列挙するような発話行為の種類）のみを記し、付随するスロットの詳細や、各ステージの選好度については省略している。
【００６６】
なお、プランライブラリ３４に保持されているインタラクションプランユニット３５およびドメインプランユニット３６に含まれている各要素はセミオティックベース６０に蓄積されている状況タイプや意味特徴と対応付けられており、後述するステージ同定部３１、ムーブ選択部３２および発話予測部３３において、状況や言語的特徴を生かした処理を行うことができるようになっている。
【００６７】
［３．２．プラン構造］
図１に示すように、プラン構造３７は、進行中の対話の構造を各インタラクションプランユニット３５間の依存関係として表すものであり、後述するステージ同定部３１、ムーブ選択部３２および発話予測部３３において利用される。
【００６８】
ここで、プラン構造３７では、例えば、これまでに実行が完了した、または現在実行中のインタラクションプランユニット３５間の依存関係がツリー構造で表現される。この場合には、プラン構造３７中の各ノードは、実行が完了した、または現在実行中のインタラクションプランユニットのインスタンスに対応し、ノード間の親子関係は、対応するインスタンス間の全体／部分関係を表す。なお、プラン構造３７には、このようなノード間の関係に加えて、対話が現在どこまで進んだかを示すポインタが与えられている。例として、図７に、値の質問（ａｓｋＶａｌｕｅ）に対して回答（ｉｎｆｏｒｍＶａｌｕｅ）を行った直後のプラン構造を示す。
【００６９】
すなわち、プラン構造３７には、ユーザと日常言語コンピュータシステムとの間で行われる対話において、秘書エージェントシステム１０がユーザの入力を理解したり秘書エージェントシステム１０自身が出力を行ったりする度に、後述するステージ同定部３１において、入力および出力の内容に対応する新しいノードがプラン構造３７に追加される。なお、ユーザはときどき、事前には予測できないような恣意的な話題を選択して状況の変更を行うことがあるため、単一のツリー構造では対話の全体的な流れを管理しきれないことがある。このため、このような場合には、後述するステージ同定部３１において、プラン構造３７を、状況タイプとツリー構造（サブプラン構造）との組を一つの要素とするようなスタックの形態で管理するようにするとよい（図８参照）。
【００７０】
［３．３．対話プランニング］
ここで、プランモジュール３０は、上述したプランライブラリ３４およびプラン構造３７を参照して、ユーザと日常言語コンピュータシステムとの間で行われる対話の流れを個々のユーザに特化した形で円滑にかつ自然な形で制御する。具体的には、まず、ステージ同定部３１において、プランライブラリ３４に保持されている複数のインタラクションプランユニット３５のうち、言語理解・生成モジュール２０により同定された現在の状況タイプに結び付けられたたインタラクションプランユニット３５を参照して、言語理解・生成処理モジュール２０により意味理解を行うことで得られた言語テクストの言語的特徴（意味特徴）に基づいてプラン構造３７における現時点のステージを同定する。次に、ムーブ選択部３２において、ステージ同定部３１により同定された現時点のステージに続く可能性のある複数のムーブの中から最適なムーブを選択する。これにより、ユーザに対しては、応答の生成のために必要とされる言語テクストの言語的特徴（意味特徴）が出力され、日常言語コンピュータシステムに対しては、日常言語コンピュータシステム上で稼働する言語アプリケーションや他のエージェントへの操作指示が言語プロトコルの形で出力される。さらに、発話予測部３３においては、プランライブラリ３４に保持されている複数のインタラクションプランユニット３５を参照して、プラン構造３７における現時点のステージに続く可能性のあるステージの中から、ユーザの次の発話を表すステージであるムーブが予測される。なお、発話予測部３３により生成された発話の予測結果は、上述したように、言語理解・生成モジュール２０の一般的テクスト理解部２１において、処理を簡略化したり、対話の文脈を考慮に入れて意味解析の結果を具体化したり補完したりするために利用される他、プランモジュール３０のステージ同定部３１において、プラン構造３７における現時点のステージを同定する際に利用される。
【００７１】
以下、プランモジュール３０のステージ同定部３１、ムーブ選択部３２および発話予測部３３で行われる処理の詳細について説明する。
【００７２】
［３．３．１．ステージ同定部］
ステージ同定部３１は、言語理解・生成処理モジュール２０から、ユーザが入力した言語テクストの解析結果である言語的特徴（意味特徴）の集合を受け取ると、それらが進行中の対話の構造を表すプラン構造３７においてどのステージに相当するものであるのかを同定する。具体的な処理の手順は、ユーザの入力が対話の構造に基づいて事前に予測できるものであったか、それとも予想外のものであったかによって異なる。前者の場合には、入力された言語テクストの言語的特徴（意味特徴）と発話の予測結果との間でマッチングを行うだけでよい。マッチングの結果、入力された言語テクストの意味が補完されることもあれば、プラン構造３７が一部具体化される場合もある。一方、後者の場合には、プラン構造３７に新たなツリー構造を導入する。これにより、ユーザの上位の意図を推論することが可能となり、より適切な形で対話の流れを制御することが可能となる。
【００７３】
以下、図９により、ステージ同定部３１における処理の詳細について説明する。
【００７４】
（１）　まず、言語理解・生成処理モジュール２０により同定された状況タイプが変化したかどうか確認する（ステップ３０１）。そして、状況タイプが変化していない場合には、発話予測部３３により事前に予測された、プラン構造３７におけるポインタ位置にある現時点のステージに続く可能性のあるムーブと、入力された言語テクストの言語的特徴（意味特徴）とのマッチングを行う（ステップ３０２）。
【００７５】
（２）　ここで、状況タイプが変化しておらず、かつマッチングに成功した場合には、マッチングを実行して（ステップ３０３）、新しいムーブに対応するノードをプラン構造３７に追加しかつポインタをそのノードへ移動する（ステップ３０４）。
【００７６】
（３）　一方、状況タイプが変化した場合またはマッチングに失敗した場合には、入力された言語テクストの言語的特徴（意味特徴）を起点として上位のツリー構造を推定し、得られたツリー構造をスタックの新しい要素として追加する。具体的には、入力された言語テクストの言語的特徴（意味特徴）に対応するノードをプラン構造３７に追加しかつポインタをそのノードへ移動した後（ステップ３０５）、入力された言語テクストの言語的特徴（意味特徴）の表す動作をボディの第１要素として持つようなインタラクションプランユニットを検索し（ステップ３０６）、もしそのようなプランユニットがちょうど１個見つかった場合は、対応するノードをプラン構造３７に追加しかつポインタをそのノードへ移動しながら（ステップ３０７）、続けてさらに上位のプランユニットを検索していく。これに対し、もしそのようなプランユニットが存在しないか、同程度に確からしい複数の候補が見つかった場合は、そこで処理を中断する。
【００７７】
［３．３．２．ムーブ選択部］
ムーブ選択部３２は、ステージ同定部３１により現時点のステージが同定された後、現時点のステージに続く可能性のある複数のムーブの中から、各ステージに与えられた選好度や、クライアントモデル部４０に蓄積されたユーザの個人的な特徴に関する知識、言語アプリケーションの現在の状態、入力された言語テクストの言語的特徴（意味特徴）などを参照して、最適なムーブを選択する。
【００７８】
以下、図１０により、ムーブ選択部３２における処理の詳細について説明する。
【００７９】
（１）　まず、後述する発話予測部３３における発話の予測の手順と同様の手順で、現時点のステージに続く可能性のあるムーブの集合を生成する（ステップ４０１）。
【００８０】
（２）　次に、プランライブラリ３４に保持されているインタラクションプランユニット３５の各ステージに事前に与えられている選好度に対して、クライアントモデル部４０に蓄積されたユーザの個人的な特徴に関する知識に応じて補正を加える（ステップ４０２）。
【００８１】
（３）　そして、ステップ４０１で得られた、現時点のステージに続く可能性のあるムーブの集合の中から、選好度が最大のムーブを選択する（ステップ４０３）。
【００８２】
（４）　ここで、選択されたムーブが秘書エージェントシステム１０自身の動作である場合には（ステップ４０４）、選択されたムーブをユーザまたは日常言語コンピュータシステム上で稼働する言語アプリケーションや他のエージェントなどに対して実行する（ステップ４０５）。具体的には、選択されたムーブがユーザへの応答に対応するものである場合には、ムーブのラベルに指定された動作の仕様（応答の生成に必要とされる言語テクストの言語的特徴（意味特徴）の集合）を言語理解・生成モジュール２０の一般的テクスト生成部２３へ送る。これに対し、選択されたムーブがコンピュータ操作（アプリケーション操作など）に対応するものである場合には、日常言語コンピュータシステム上で稼働する言語アプリケーションや他のエージェントなどへ言語プロトコルの形で操作指示を出力する。
【００８３】
（５）　その後、実行されたムーブに対応するノードをプラン構造に追加しかつポインタをそのノードへ移動した後（ステップ４０６）、ステップ４０１へ戻る。すなわち、次のムーブが秘書エージェントシステム１０自身の動作でなくなるまで、以上の手順を繰り返す。
【００８４】
［３．３．３．発話予測部］
発話予測部３３は、プランライブラリ３４に保持されている複数のインタラクションプランユニット３５を参照し、自然言語処理におけるトップダウン予測の手続きを利用して、プラン構造３７における現時点のステージに続く可能性のあるステージの中から、ユーザの次の発話を表すステージであるムーブを予測する。
【００８５】
以下、図１１により、発話予測部３３における処理の詳細について説明する。
【００８６】
（１）　まず、求めるべき予測発話の集合Ａを空集合とする（ステップ５０１）。
【００８７】
（２）　次に、プラン構造における現時点のステージ（ノード）に１つ上のステージ（親ノード）が存在するかどうかを判断し（ステップ５０２）、存在する場合には親ノードへ移動する（ステップ５０３）。これに対し、もし１つ上のステージ（親ノード）が存在しない場合には処理を終了する。
【００８８】
（３）　その後、その親ノードに対応するインタラクションプランユニットにおいてそれに続く可能性のあるステージが存在するかどうかを判断し（ステップ５０４）、もしそのようなステージが存在する場合には、次の手順で処理を行う。これに対し、もしそのようなステージが存在しない場合には、ステップ５０２へ戻る。
【００８９】
（３ａ）　まず、候補となるステージへ移動する（ステップ５０６）。
【００９０】
（３ｂ）　そのステージがムーブである場合には（ステップ５０７）、それを集合Ａに追加する（ステップ５０９）。
【００９１】
（３ｃ）　そのステージがインタラクションプランユニットである場合には（ステップ５０７）、そのボディの第１要素に移動して（ステップ５０８）、ステップ５０７へ戻る。
【００９２】
［４．クライアントモデル部］
次に、クライアントモデル部４０の詳細について説明する。
【００９３】
図１に示すように、クライアントモデル部４０は、ユーザの個人的な特徴に関する知識を蓄積する知識ベースであり、ユーザ個人に関する知識を格納するプロファイル情報４１と、複数のユーザに共通した特徴を記述したプロパティ特性情報４２とを含む。
【００９４】
［４．１．プロファイル情報］
図１２に示すように、プロファイル情報４１は、ユーザ自身の言語的傾向を記述した言語傾向情報５１と、ユーザ自身のプロフィールを記述したプロパティ情報５５とを有している。以下、言語傾向情報５１およびプロパティ情報５５の詳細について説明する。
【００９５】
［４．１．１．言語傾向情報］
言語傾向情報５１は、各ユーザの言語的傾向を表す情報（独自の言語辞書）であり、言語理解・生成モジュール２０において、ユーザに特化した言語テクストの意味理解および生成を行う際に利用される。なお、ここでいう「言語的傾向」とは、同じ言葉でもユーザによってとらえる意味に違いが大きい言葉に対して、各ユーザがどのような使い方をするかということであり、このような言語的傾向を保持する情報として、ユーザ語５２、感性語５３および程度副詞５４の３種類の情報が用いられる。
【００９６】
［４．１．１．１．ユーザ語］
ユーザ語５２は、辞書に記載されている言葉であるがユーザが新たに別の意味をつけているような言葉や、ユーザが新たに作り出した言葉であり辞書に記載されていないような言葉について、その言葉と意味とをセットにして蓄積したものである。
【００９７】
［４．１．１．２．感性語］
感性語５３は、個人の感じ方によってあいまい性や多義性、状況依存性の大きい言葉である形容詞や形容動詞、比喩などについて、その言葉と意味とをセットにして蓄積したものである。なお、ユーザがコンピュータ操作を行う際に用いられる感性語としては、コンピュータ画面上に呈示される文字、図および線を表現するものが一般的である。以下、これらの感性語の具体例について説明する。
【００９８】
まず、コンピュータ画面上に呈示される文字、図および線はそれぞれ、次のような属性を持つ。
【００９９】
（１）　文字＝種類（フォント＋スタイル＋文字飾り）＋大きさ（フォントサイズ）＋色
（２）　図＝内容（キーワード）＋大きさ（サイズ）＋雰囲気（タッチ＋色）
（３）　線＝種類（点線＋スタイル＋始終点）＋色＋太さ
これらの属性のうち、フォントを例に挙げると、それを表現する感性語は全て「フォーマルさ」、「インパクト」および「重さ」の軸に分解される。ここで、「フォーマルさ」、「インパクト」および「重さ」のそれぞれの軸は「丸さ」および「太さ」というフォントの持つ物理量に対応しており、このような対応関係に基づいて具体的なフォントを決定する。図１３（ａ）（ｂ）に、感性語と物理量との対応関係と、それに基づいて選択されるフォントの例を示す。
【０１００】
一方、色については、図１４（ａ）（ｂ）に示すようなＨｕｅ＆Ｔｏｎｅシステムを用いて色相と色調（明度および彩度）とにより表現する。ユーザが色を表現するときには、（１）色相のみを表現する感性語、（２）色調のみを表現する感性語、（３）両方を総合した感性語のいずれかを用いる。ここで、ユーザが色を表現した言葉が上記（１）〜（３）のいずれに該当するかによって色の決定方法が異なる。具体的には、上記（１）の場合には、色調を質問し直し、該当する具体的な色を検索してユーザに提示する。また、上記（２）の場合には、色相を質問し直し、該当する具体的な色を検索してユーザに提示する。さらに、上記（３）の場合には、当該感性語に該当する具体的な色を検索してユーザに提示する。
【０１０１】
図（絵）については、「クリスマスの絵」や「春らしい絵」など、図（絵）を形容する言葉をキーワードとして検索し、ユーザに提示する。それぞれの図（絵）には、キーワードの他、色、絵のタッチに関する情報が付与されており、色や絵のタッチを表現する感性語を用いて検索することができる。
【０１０２】
なお、フォント、色および図などを表現する感性語としては、言葉として同じものが用いられる場合が多いが、同じユーザで同じ感性語でも、それぞれの場合で意味が異なることが多い。具体的には例えば、図１５に示すように、同じ「ポップな」という言葉でも、そのときに文字を入力していればフォントの種類や大きさなどに結び付けられるが、絵を入力しているときには絵の色合いなどに結び付けられる。このため、感性語の意味を状況タイプに結び付けて管理し、セミオティックベースで特定された状況（状況タイプ）に応じた感性語の意味を選択するようにすることが好ましい。
【０１０３】
なお、上述したような感性語は、いくつかの典型的な語に関してのみ言葉とその意味とをセットにして蓄積しておき、新たに入力された感性語に関しては、既に蓄積されている感性語のうちのいくつかの語を結合して意味を表現するようにしてもよい。例えば、「ポップな」フォントは「おしゃれ」で「都会的な」フォントという意味であると理解し、そのような語の結合として意味を表現する。なお、この場合には、「ポップな」フォントとして、「おしゃれ」で「都会的な」フォント、すなわち細くて鋭いフォントの１つが選択される。
【０１０４】
［４．１．１．３．程度副詞］
程度副詞５４は、それが形容する言葉の意味を強めたり弱めたりする効果がある言葉について、その言葉と意味とをセットにして蓄積したものである。具体的には例えば、上述したような、コンピュータ画面上に呈示される文字、図および線を例に挙げると、その属性の一つである大きさは、「大きい」と「小さい」という言葉で表現され、その程度は、程度副詞により表現される。この場合、程度副詞により表現される大きさが相対的な大きさなのか絶対的な大きさなのかを考慮して、具体的な大きさを決定する。なお、程度副詞は、感性語と同様に個人の感じ方によって意味にあいまいさを生じるものであるので、それぞれの程度副詞をファジィ集合で表現し、ファジィ集合をユーザごとに変化させるようにすることが好ましい。
【０１０５】
［４．１．２．プロパティ情報］
プロパティ情報５５は、各ユーザのプロフィール（ユーザの名前や性別、知識レベル、スケジュールなど）を表す情報であり、プランモジュール３０において、ユーザに特化した対話プランニングを行う際に利用される。なお、プロパティ情報５５は、ユーザ情報５６、スケジュール５７および個人的関連知識５８の３種類の情報を有している。なお、プロパティ情報５５の初期値としては、ユーザに対して事前にアンケート形式で質問を行うことによって得られた結果が用いられ、ユーザとの対話によって追加したり修正したりすることができる。なお、プロパティ情報５５に含まれる各要素はセミオティックベース６０にリンクされており、言語理解・生成モジュール２０において、当該各要素に該当する発話のインスタンス情報が用いられる。
［４．１．２．１．ユーザ情報］
ユーザ情報５６は、ユーザが誰でどんな人であるかを表す情報であり、図１６に示すように、ユーザの氏名や年齢、性別、出身地、学歴、性格、趣味などに関する情報を記述したものである。
【０１０６】
［４．１．２．２．スケジュール］
スケジュール５７は、ユーザのスケジュール（イベントやファイル操作などに関するスケジュール）を表す情報である。スケジュール５７は、マクロなスケジュールとミクロなスケジュールとに分類される。マクロなスケジュールは、図１７（ａ）（ｂ）に示すように、現在までに行われたイベントおよびファイル操作に関する情報を日時とともに記述したものであり、日時、イベント名およびファイル名などの各種の項目から検索することができる。その際、図１７（ｂ）に示すように、日時をファジィ集合で表現することにより、あいまいな言い方（例えば、「最近使ったファイル」や「２週間前のファイル」）によって検索することができるようにするとよい。一方、ミクロなスケジュールは、現在行っているファイル操作等の作業に限定したスケジュールであり、作業が始まってから終わるまでを一区切りとし、その中での作業順番を時間とともに記述したものである。
【０１０７】
［４．１．２．３．個人的関連知識］
個人的関連知識５８は、ユーザ情報５６やスケジュール５７に含まれる各要素の詳細に関する知識であり、図１８に示すように、ユーザの所属する会社に関する知識（名称や業種、人数、部署名など）や、行われるイベントに関する知識（イベントの種類や人数、場所など）を記述したものである。なお、個人的関連知識５８には、ユーザに特化したアプリケーション操作を実現するための情報として、アプリケーション操作などに対するユーザの好みや知識レベルに関する情報が含められている。
【０１０８】
なお、プロパティ情報５５には、プランモジュール３０における意思決定（ステージの同定やムーブの選択）のために用いられる情報として、ユーザの秘書エージェントシステムに対する希望に関する情報（例えば、どのくらいシステム内の作業内容をユーザにレポートするか、どの程度システムが自主的に行動するか、など）を含めるようにしてもよい。
【０１０９】
［４．２．プロパティ特性情報］
プロパティ特性情報４２は、プロファイル情報４１のプロパティ情報５５に蓄積されている各ユーザの知識がユーザ全体の中でどのような傾向や特徴を持つかを記述したものである。すなわち、多数のユーザに関するプロパティ情報を集めると、プロパティ情報に含まれる各要素の値に一定の特徴や傾向が生まれる。プロパティ特性情報４２は、このような特徴や傾向に関する情報を、プロパティ情報の一種のメタ情報として抽出したものである。ここで、プロパティ特性情報４２としては、多数のユーザからアンケート調査などで事前に得られた結果が用いられる。なお、図１２に示すように、プロパティ特性情報４２は、知識レベルや性別、性格ごとに蓄積されている。ここで、知識レベルによって分類されたコンピュータ操作に関するプロパティ特性情報の一例を図１９に示す。
【０１１０】
なお、プロパティ特性情報４２は、プロファイル情報４１の言語傾向情報５１とともに、言語理解・生成モジュール２０において、ユーザに特化した言語テクストの意味理解および生成を行う際に利用される。また、プロパティ特性情報４２は、プロファイル情報４１のプロパティ情報５５とともに、プランモジュール３０において、ユーザに特化した対話プランニングを行う際に利用される。
【０１１１】
［４．３．言語理解・生成モジュールおよびプランモジュールによるクライアントモデル部の利用］
上述したように、クライアントモデル部４０は、言語理解・生成モジュール２０およびプランモジュール３０において利用される。言語理解・生成モジュール２０においては、クライアントモデル部４０に蓄積されているユーザの個人的な特徴に関する知識を参照してユーザに特化した言語テクストの意味理解（換言や補完など）および言語テクストの生成（換言や省略など）が行われる。また、プランモジュール３０においては、クライアントモデル部４０に蓄積されているユーザの個人的な特徴に関する知識を参照してユーザに特化した対話プランニング（推論）が行われる。
【０１１２】
以下、言語理解・生成モジュール２０およびプランモジュール３０におけるクライアントモデル部４０の利用方法を、換言、補完・省略、および推論という代表的な３種類の処理を例に挙げて説明する。
【０１１３】
［４．３．１．換言］
言語理解・生成モジュール２０においては、クライアントモデル部４０に保持されているプロファイル情報４１（言語傾向情報５１）およびプロパティ特性情報４２を参照して、ユーザ特化テクスト理解部２２により、ユーザから入力された言語テクストをプランモジュール３０で用いられる適切な言語テクストに換言するとともに、ユーザ特化テクスト生成部２４により、プランモジュール３０から得られた言語テクストをユーザに理解しやすい言語テクストに換言する。なお、換言の処理は、具体的には次のような場合に行われる。
【０１１４】
（１）　ユーザの入力した言語テクストにユーザ語に登録されている言葉がある場合には、登録されている意味の言葉に変換する。
【０１１５】
（２）　ユーザに対して出力される言語テクスト中の言葉をユーザに合った言葉に変換する。
【０１１６】
（３）　ユーザの入力した言語テクスト中の感性語と程度副詞とを物理量の表現に換言して、言語アプリケーションへ送信する。
【０１１７】
（４）　言語アプリケーションから送信された物理量の表現を、ユーザに合った感性語と程度副詞とに変換してユーザに対して出力する。
【０１１８】
（５）　ユーザのプロパティ情報に該当するプロパティ特性情報を活性化し、その特性に合わせた言語表現に変換する。
【０１１９】
［４．３．２．補完・省略］
言語理解・生成モジュール２０においては、クライアントモデル部４０に保持されているプロファイル情報４１（プロパティ情報５５）およびプロパティ特性情報４２を参照して、ユーザ特化テクスト理解部２２により、ユーザから入力された言語テクストを部分的に補完する。すなわち、言語テクスト中に必要な情報を追加したり言語テクスト中の言葉の意味を限定したりすることにより、検索の範囲を狭めたり誤解を少なくしたりする。なお、補完の処理は、具体的には次のような場合に行われる。
【０１２０】
（１）　ユーザの入力した言語テキスト中に足りない情報がある場合に、その情報を表す言葉を追加する（例：「出張報告書を書く。」　→　「Ｊａｖａ（登録商標）ワープロで出張報告書を書く。」）。
【０１２１】
（２）　ユーザの入力した言語テクスト中に一般的な表現の言葉が含まれている場合に、その言葉の意味を限定する言葉を追加する（例：「出張」→「東京出張」）。
【０１２２】
一方、言語理解・生成モジュール２０においては、クライアントモデル部４０に保持されているプロファイル情報４１（プロパティ情報５５）およびプロパティ特性情報４２を参照して、ユーザ特化テクスト生成部２４により、プランモジュール３０から得られた言語テクストを部分的に省略する。すなわち、言語テクストの生成において、全ての情報を含めようとすると生成された文が長くなり、ユーザにとって分かりづらいものとなってしまうので、このような事態を減らすため、生成される言語テクストのうち不要な言葉を削除する。なお、省略の処理は、補完の逆操作として、以下のような場合に行われる。
【０１２３】
（１）　ユーザにとって自明な情報（ユーザが以前に入力した言語テクスト中に含まれる情報）を削除する（例：「Ｊａｖａ（登録商標）ワープロで出張報告書を書きました。」→「出張報告書を書きました。」）。
【０１２４】
（２）　具体的な言葉の抽象度を上げて簡潔に表現する（例：「出張報告書を開きます。」→「報告書を開きます。」）。
【０１２５】
［４．３．３．推論］
プランモジュール３０においては、クライアントモデル部４０に保持されているプロファイル情報４１（プロパティ情報５５）およびプロパティ特性情報４２を参照して、作業の状態や状況タイプに合わせてユーザと日常言語コンピュータシステムとの間で行われる対話の流れを制御する。すなわち、プランモジュール３０は、ユーザを適切に支援するため、クライアントモデル部４０に蓄積されているユーザの個人的な特徴に関する知識（ユーザの好みや特徴、知識レベルなど）からユーザの意図を推論し、推論結果に応じて秘書エージェントシステム１０がとるべき行動を決定する。なお、プランモジュール３０は、プランライブラリ３４に保持されているインタラクションプランユニット３５およびドメインプランユニット３６についてそれぞれ推論を行う。
【０１２６】
ここで、インタラクションプランユニット３５により規定される、ユーザと日常言語コンピュータシステムとの間で行われる対話の手順に関しては、クライアントモデル部４０に保持されているプロファイル情報４１（プロパティ情報５５）に含まれる関連する情報によって、クライアントモデル部４０に保持されているインタラクションプランユニット３５の各ステージに与えられている選好度の数値を調整する。なお、選好度を決定するためのパラメータとしては、次の３つを準備することが好ましい。
（１）　主導度：システムが自主的に意思決定を行う度合いを表すパラメータ。
【０１２７】
（２）　大胆度：システムが自分の決定したことを実行に移す度合いを表すパラメータ。
【０１２８】
（３）　情報提供度：システムがユーザに提供する情報量の度合いを表すパラメータ。
【０１２９】
これに対し、ドメインプランユニット３６により規定される、コンピュータ操作（アプリケーション操作など）を伴う作業の手順に関しては、操作の手順を選択したり操作の内容を決定したりするため、クライアントモデル部４０に保持されているプロファイル情報４１（プロパティ情報５５）において個人的関連知識５８として蓄積されている、アプリケーション操作に対する好みや知識レベル、そしてプロパティ特性情報４２のうちユーザの知識レベルに対応する情報が利用される。
【０１３０】
［４．４．クライアントモデル部における学習］
クライアントモデル部４０は、ユーザの変化に適応するため、言語理解・生成モジュール２０部を介してユーザから入力された言語テクストに含まれる情報またはプランモジュール３０により制御される対話の流れに関する情報に基づいて、ユーザの個人的な特徴に関する知識を自律的に学習する。
【０１３１】
以下、クライアントモデル部４０に保持されているプロファイル情報４１（言語傾向情報５１およびプロパティ情報５５）およびプロパティ特性情報４２のそれぞれの学習方法について説明する。
【０１３２】
（１）　言語傾向情報
ユーザから入力された言語テクストはコーパスとして蓄えられるので、入力された言語テクストの傾向が変化した際に、コーパス中のレジスタにおける選択確率が変化し、自動的に言語傾向が学習される。また、新たなユーザ語や感性語は、その都度、ユーザにその語の意味を聞き、言葉と意味とをセットにして蓄積していく。
【０１３３】
（２）　プロパティ情報
ユーザから入力された言語テクスト中に、プロパティ情報５５に含まれるユーザ情報５６、スケジュール５７および個人的関連知識５８に関連する言葉が含まれている場合には、その中から、現在の情報に足りない情報を補足したり、現在の情報の間違った内容を修正したりする。なお、時間の経過に伴って、終了したスケジュールの情報は消去するが、過去のユーザ情報やそれに関する個人的関連知識は蓄積しておく。
【０１３４】
（３）　プロパティ特性情報
プロファイル情報４１（プロパティ情報５５）の変化に伴ってプロパティ特性情報５２の活性化状態を変化させる。これにより、ユーザの知識レベルが低いと判断されているときには専門用語を簡単な言葉に換言するが、知識レベルが高くなるにつれて専門用語をそのままユーザに出力することが可能になる。
【０１３５】
このように本実施の形態によれば、秘書エージェントシステム１０の言語理解・生成モジュール２０において、ユーザの個人的な特徴に関する知識を蓄積する知識ベースであるクライアントモデル部４０を参照して、ユーザに特化した言語テクストの意味理解および生成を行っているので、ユーザと日常言語コンピュータシステムとの間での言語テクストの対話的なやりとりを個々のユーザに特化した形で柔軟にかつ精密に行うことができる。
【０１３６】
また、本実施の形態によれば、秘書エージェントシステム１０のプランモジュール３０において、ユーザと日常言語コンピュータシステムとの間で行われる対話のパターンを当該対話の各段階に対応する複数のステージ間の関係として表す複数のインタラクションプランユニット３５と、進行中の対話の構造を各インタラクションプランユニット３５間の依存関係として表すプラン構造３７とを参照して、対話プランニングを行っているので、ユーザと日常言語コンピュータシステムとの間で行われる対話の流れを円滑にかつ自然な形で制御することができる。また、プランモジュール３０において、ユーザの個人的な特徴に関する知識を蓄積する知識ベースであるクライアントモデル部４０を参照して、対話プランニングを行っているので、ユーザと日常言語コンピュータシステムとの間で行われる対話の流れを個々のユーザに特化した形で行うことができる。
【０１３７】
なお、上述した実施の形態において、言語理解・生成モジュール２０、プランモジュール３０およびクライアントモデル部４０は、ソフトウェア的に実現することが可能であり、処理機能を備えたコンピュータ上に実装されて利用されるプログラムの形態をとることも可能である。このようなプログラムは、各種の記録媒体に記録され、コンピュータから呼び出されて上述したような処理が行われる。なお、記録媒体としては、磁気ディスク、フロッピーディスク、ハードディスク、光ディスク（ＣＤ−ＲＯＭ、ＣＤ−ＲおよびＤＶＤ等）、光磁気ディスク（ＭＯ等）および半導体メモリ等を含み、プログラムを記録することができ、かつコンピュータ読み取り可能なものであれば、その記録形式はどのようなものでもよい。また、記録媒体としては、ネットワーク上で伝送される際の搬送波等の情報伝達媒体を含む。
【０１３８】
【実施例】
次に、上述した実施の形態の具体的実施例について述べる。
【０１３９】
実施例１
まず、第１の実施例として、秘書エージェントシステムを介して、日常言語コンピュータシステム上で動作するワープロソフトにより文書の作成を行う場合を例に挙げて説明する。具体的には、「クリスマス会の招待状」という文書を作成するという状況において、秘書エージェントシステムがユーザの指示の下でワープロソフトの操作を行う場合における動作について説明する。ここで、ワープロソフトは日常言語コンピュータシステム上で動作する言語アプリケーションであり、秘書エージェントシステムからワープロソフトに対する操作指示は日常言語に基づく言語プロトコルを介して行われる（特願２００２−１５４８２３号参照）。
【０１４０】
以下、図２０に示す対話例に沿って、ユーザからのそれぞれの入力（言語テクスト）に対して秘書エージェントシステムの内部でどのようにして、言語テクストの意味理解、対話プランニング、およびユーザに対して出力される言語テクストの生成が行われるのかを順に説明する。なお、第１の実施例では、クライアントモデル部には、プロパティ情報（ユーザ情報）として図１６に示すような情報が蓄積されているものとする。
【０１４１】
＜１：クリスマス会の招待状を書きたい。＞
まず、図２０に示す対話例におけるユーザの１番目の発話である『（１．）クリスマス会の招待状を書きたい。』に対して行われる処理について説明する。
【０１４２】
（１）　一般的なテクスト理解
まず、セミオティックベースを参照して、言語テクストに対してパージング処理を行い、その結果から現在の状況が「招待状作成に関する依頼応対」という状況タイプに属するものであると推論する。そして、この状況タイプに関連付けられた資源を活性化した後、意味解析を行って、この入力された言語テクストの言語的特徴（語彙文法特徴および意味特徴）を導き出す。なお、この段階では、招待状の作成のために使用するアプリケーションソフトの種類はまだ不明である。
【０１４３】
（２）　ユーザに特化したテクスト理解
［補完］　次に、クライアントモデル部に蓄積されているプロパティ情報（個人的関連知識）を検索して、（招待状は手紙の一種であることから）招待状の作成のためにＪａｖａ（登録商標）ワープロを用いることを推論し、セミオティックベースによる一般的な理解の結果を補完する。
【０１４４】
（３）　ステージ同定
対話の初期の状態ではプラン構造（のスタック）は空であるので、予測された発話は存在しない。テクスト理解の結果、入力された言語テクストはｗａｎｔＡｃｔｉｏｎタイプであることが分かるので、ｗａｎｔＡｃｔｉｏｎをボディの第１要素に持つようなインタラクションプランユニットを検索する。これにより、ｗａｎｔＡｃｔｉｏｎＵｎｉｔが見つかるので、図２１に示すようなプラン構造（ｗａｎｔＡｃｔｉｏｎＵｎｉｔを親ノード、ｗａｎｔＡｃｔｉｏｎを子ノードとするようなプラン構造）を生成し、ｗａｎｔＡｃｔｉｏｎノードに現在位置を示すポインタをセットする。
【０１４５】
（４）　ムーブ選択
ｗａｎｔＡｃｔｉｏｎＵｎｉｔのボディの第２要素であるＩＤＥＮＴＩＦＹマクロ（ドメインプランユニットのスロット値の同定）は、現在対象としているｗｒｉｔｅＤｏｃｕｍｅｎｔドメインプランユニットに不明なスロット値が存在しないので、スキップし、次の第３要素のＥＸＥＣＵＴＥマクロに処理を進める。
【０１４６】
第３要素のＥＸＥＣＵＴＥマクロ（ドメインプランユニットの実行）を実行するためには、まず、ｗｒｉｔｅＤｏｃｕｍｅｎｔのボディの第１要素であるｂｏｏｔ動作を対象とするｖｏｌｕｎｔａｒｙＡｃｔｉｏｎＵｎｉｔ（秘書エージェントシステムが自発的にドメインプランユニットを実行するためのインタラクションプランユニット）を選択して、プラン構造内のｗａｎｔＡｃｔｉｏｎＵｎｉｔノードの下にＥＸＥＣＵＴＥマクロおよびｖｏｌｕｎｔａｒｙＡｃｔｉｏｎＵｎｉｔに対応するノードを追加する。さらに、ｖｏｌｕｎｔａｒｙＡｃｔｉｏｎＵｎｉｔのボディの第１要素であるＥＸＥＣＵＴＥを展開して、ｂｏｏｔ動作を言語アプリケーション（Ｊａｖａ（登録商標）ワープロ）に対して要求するムーブを生成および選択する。このムーブは言語アプリケーションに対するものであるので、その操作指示（『（２．）起動してください。』）が言語プロトコルを介して言語アプリケーションに対して送信される。
【０１４７】
引き続き、ｖｏｌｕｎｔａｒｙＡｃｔｉｏｎＵｎｉｔのボディの第２要素に処理を進めると、次はユーザに対するｒｅｐｏｒｔＡｃｔｉｏｎ動作である。これは必ずしも実行する必要のないオプションのムーブであるため、選好度を利用して実行するかどうかが決定される。ここで、クライアントモデル部に蓄積されているプロパティ情報（ユーザ情報）が参照すると、ユーザの心配度が高いという情報が得られるので（図１６参照）、選好度が高めに補正され、ｒｅｐｏｒｔＡｃｔｉｏｎ動作が実行されることになる。このｒｅｐｏｒｔＡｃｔｉｏｎ動作の言語的特徴が言語理解・生成モジュールへ送られる。この時点におけるプラン構造を図２２に示す。
【０１４８】
（５）　一般的なテクスト生成
プランモジュールから送られてきた言語的特徴に基づき、Ｊａｖａ（登録商標）ワープロを起動するという動作を行ったことを報告する言語テクストが生成される。
【０１４９】
（６）　ユーザに特化したテクスト生成
［省略］　ユーザは普段Ｊａｖａ（登録商標）ワープロを使っているので、「Ｊａｖａ（登録商標）ワープロを起動しました。」という報告は少し冗長である。このため、『（３．）ワープロを起動しました。』という表現に変換した上で、その結果がユーザに対して出力される。
【０１５０】
＜４：タイトルは「クリスマス会のお誘い」で。＞
次に、図２０に示す対話例におけるユーザの４番目の発話である『（４．）タイトルは「クリスマス会のお誘い」で。』に対して行われる処理について説明する。
【０１５１】
（１）　一般的なテクスト理解
１番目の発話と同様に処理を行う。状況タイプに変更がないので、前回と同じ資源を用いて言語テクストの言語的特徴（意味特徴）を導き出す。ここで入力された言語テクストには、タイトルをどうしたいのかが指定されていないが、プランモジュールの発話予測部において、いずれかの編集作業を依頼するような発話が予測されるので、文脈理解の結果、タイトルの入力を依頼する発話であると理解する。
【０１５２】
（２）　ユーザに特化したテクスト理解
ここでは、とくに処理は行われない。
【０１５３】
（３）　ステージ同定
入力された言語テクストはｄｅｍａｎｄＡｃｔｉｏｎタイプであるので、それをボディの第１要素として持つようなインタラクションプランユニットを検索する。その結果、ｄｅｍａｎｄＡｃｔｉｏｎＵｎｉｔが見つけられるので、それをプラン構造に追加する。
【０１５４】
（４）　ムーブ選択
ｄｅｍａｎｄＡｃｔｉｏｎＵｎｉｔのボディの第２要素であるＥＸＥＣＵＴＥマクロを展開して、タイトルの書式で指定された文字列を入力する操作を要求するような言語テクスト（『（５．）タイトルの書式で「クリスマス会へのお誘い」と入力してください。』）を生成し、言語プロトコルを介して言語アプリケーションに対して送信する。その次に、前回と同様に、ｄｅｍａｎｄＡｃｔｉｏｎＵｎｉｔのボディの第３要素であるｒｅｐｏｒｔＡｃｔｉｏｎ動作を実行することを決定し、その言語的特徴を言語理解・生成モジュールへ送る。この時点におけるプラン構造を図２３に示す。
【０１５５】
（５）　一般的なテクスト生成
タイトルを入力したことを報告する言語テクスト（『（６．）タイトルを入力しました。』）が生成される。
【０１５６】
（６）　ユーザに特化したテクスト生成
ここでは、とくに処理は行われず、そのまま言語テクストがユーザに対して出力される。
【０１５７】
＜７：もう少し明るくて軽い感じにして。＞
次に、図２０に示す対話例におけるユーザの７番目の発話である『（７．）もう少し明るくて軽い感じにして。』に対して行われる処理について説明する。
【０１５８】
（１）　一般的なテクスト理解
これまでの発話と同様に処理を行い、言語テクストの言語的特徴（意味特徴）を導き出す。
【０１５９】
（２）　ユーザに特化したテクスト理解
［換言１］　クライアントモデル部に蓄積されているプロパティ情報（ユーザ情報）に含まれている「大げさ度」が高くないので、「もう少し」という副詞はそのまま標準の意味で解釈する。
【０１６０】
［換言２］　「明るくて軽い」という感性語に当てはまるフォントを図１３（ａ）（ｂ）に示すフォントグラフから、色を図１５（ａ）（ｂ）に示す色グラフからそれぞれ検索し、「もう少し」という副詞を考慮した結果、「丸ゴシック体」と「オレンジ色」という情報を得る。そして、この情報に基づいて言語テクストを換言し、「タイトルのフォントを丸ゴシック体にして色をオレンジ色にしてほしい、という依頼として言語テクストを解釈する。
【０１６１】
（３）　ステージ同定
入力された言語テクストはｄｅｍａｎｄＡｃｔｉｏｎタイプであるので、それをボディの第１要素に持つｄｅｍａｎｄＡｃｔｉｏｎＵｎｉｔが検索され、プラン構造に追加される。
【０１６２】
（４）　ムーブ選択
ｄｅｍａｎｄＡｃｔｉｏｎ動作に対応して、タイトルのフォントを丸ゴシック体にして色をオレンジにする操作を要求するような言語テクスト（『（８．）タイトルのフォントを丸ゴシック体にして色をオレンジにしてください。』）を生成し、言語プロトコルを介して言語アプリケーションに対して送信する。その次に、前回と同様にしてｒｅｐｏｒｔＡｃｔｉｏｎ動作を実行することを決定する。
【０１６３】
（５）　一般的なテクスト生成
タイトルのフォントを丸ゴシック体にして色をオレンジにしたことを報告する言語テクストが生成される。
【０１６４】
（６）　ユーザに特化したテクスト生成
［換言］　セミオティックベースによって生成された言語テクストに含まれる「丸ゴシック体」および「オレンジ」という語を、ユーザに合わせて再び「少し」という程度副詞と「明るくて軽い」という感性語の組み合わせに変換し、その結果（『（９．）タイトルを少し明るくて軽い感じにしました。』）がユーザに対して出力される。
【０１６５】
＜１０：日付を入れて。＞
次に、図２０に示す対話例におけるユーザの１０番目の発話である『（１０．）日付を入れて。』に対して行われる処理について説明する。
【０１６６】
これまでの発話と同様に、上述した（１）〜（６）の順番で言語テクストの意味理解および生成が行われる。ここでは、「日付」という語がいつの日付を指すのか不明であるので、ムーブ選択の過程においてｄｅｍａｎｄＡｃｔｉｏｎＵｎｉｔのボディの第２要素であるＩＤＥＮＴＩＦＹマクロが展開され、ｉｄｅｎｔｉｆｙＶａｌｕｅＵｎｉｔがプラン構造に追加される。このインタラクションプランユニットは不明なスロットの値を問い合わせるために秘書が利用するプラン（戦略）を表すものである。ここでは、日付の候補として「今日」が想定されるので、ユーザに対して値の確認を行うｃｏｎｆｉｒｍＶａｌｕｅという動作タイプが選択される。値の確認に用いられる言語的特徴としては、「〜でいいですか？」や、「〜でいいですね？」などいくつかの候補があるが、例えば想定の確信度があまり高くない場合には「〜でいいですか？」に相当する言語的特徴が選択される。すなわち、プランモジュールにおいては、プランライブラリに含まれる各プランユニットの各要素がセミオティックベースの資源に対応付けられているので、対話プランニングの段階で言語テクストの細かい言語的特徴を選択することができる。なお、このようにしてプランモジュールで選択された言語的特徴は、その後のセミオティックベースを利用した言語テクストの生成の際に、実際に「〜でいいですか？」という言語表現（『（１１．）今日の日付でいいですか？』）として具体化される。
【０１６７】
＜１２．はい。＞
次に、図２０に示す対話例におけるユーザの１２番目の発話である『（１２．）はい。』に対して行われる処理について説明する。
【０１６８】
秘書エージェントシステムが直前にユーザに対して質問を行っているので、プランモジュールは、ユーザが「はい」または「いいえ」と答えることを予測することができる。入力された言語テクストに対してパージング処理を行った結果、実際に予測された発話の内容と一致するので、意味解析の処理が全て省略されて、予測された言語的特徴（意味特徴）がプランモジュールへ直接送られる。
【０１６９】
＜１３．○×レストランの電話番号を調べて。＞
次に、図２０に示す対話例におけるユーザの１３番目の発話である『（１３．）○×レストランの電話番号を調べて。』に対して行われる処理について説明する。
【０１７０】
言語理解・生成モジュールは、入力された言語テクストに対してパージング処理を行った結果、電話番号を調べるという内容から、状況タイプを「招待状作成に関する依頼応対」から「Ｗｅｂ閲覧」に変更して、関連する資源をセットアップし直す。プランモジュールの側でも、利用されるプランライブラリの内容を新しい状況タイプに合ったものに切り替える。そして、Ｗｅｂで情報検索を行うためには、まず、関連するＷｅｂページを開くことが必要であることを推論し、ユーザが普段Ｗｅｂ閲覧に利用している言語アプリケーション（Ｗｅｂブラウザ）に対してページを開く操作指示（『（１４．）○×レストランのＷｅｂページを開いてください。』）を送信する。プラン構造に関しては、招待状作成のためのツリー構造はそのまま残して、新しいＷｅｂ閲覧のためのツリー構造を生成してスタックに追加する。この時点におけるプラン構造を図２４に示す。
【０１７１】
実施例２
次に、第２の実施例として、秘書エージェントシステムを、ユーザからなされた質問に対して適切な応答を行うシステム（ヘルプシステム）として用いる場合を例に挙げて説明する。なお、上述した第１の実施例は、秘書エージェントシステムとの対話を通してユーザがワープロソフトを間接的に操作する方式（すなわち「依頼／応対」の形式）であるのに対し、第２の実施例は、ユーザがワープロソフトを直接的に操作している状況で秘書エージェントシステムが適宜ユーザの手助けをする方式（すなわち「質問／応答」の形式）である。具体的には、ユーザがワープロの操作を行っている間に分からないことが生じたときに、秘書エージェントシステムに質問を行う。すると、秘書エージェントシステムは、質問の言語テクストの意味理解を行い、適切な回答をユーザに対して出力する。その際、クライアントモデル部に蓄積されているプロパティ情報やプロパティ特性情報が適宜参照され、ユーザの知識レベルに合わせて専門用語を簡単な言葉に換言したり、回答の内容をより詳しくしたりするといったような、ユーザに特化した応答を行う。なお、ユーザからなされる質問には、ワープロの操作手順を知りたいといったワープロの操作に関する質問の他、文書の作成に関する提案や助言を求める質問があるので、秘書エージェントシステムは、ユーザからなされた質問の種類を把握した上で、ユーザに対して適切な応答を行う。
【０１７２】
以下、図２５に示す対話例に沿って、ユーザからのそれぞれの入力（言語テクスト）に対して秘書エージェントシステムの内部でどのようにして、言語テクストの意味理解、対話プランニング、およびユーザに対して出力される言語テクストの生成が行われるのかを順に説明する。ここで、第２の実施例における手順は、上述した第１の実施例における手順と基本的に同様であるので、第２の実施例に特有な部分のみを詳細に説明し、共通する部分についての説明は適宜省略する。なお、第２の実施例では、クライアントモデル部には、上述した第１の実施例の場合と同様に、プロパティ情報（ユーザ情報）として図１６に示すような情報が蓄積されているものとする。
【０１７３】
＜１：字をもっとかわいくしたいのですが。＞
まず、図２５に示す対話例におけるユーザの１番目の発話である『（１．）字をもっとかわいくしたいのですが。』に対して行われる処理について説明する。
【０１７４】
（１）　一般的なテクスト理解
まず、セミオティックベースを参照して、言語テクストに対してパージング処理を行い、その結果から現在の状況が「ワープロの操作に関する質問応答」という状況タイプに属するものであると推論する。そして、この状況タイプに関連付けられた資源を活性化した後、意味解析を行って、この入力された言語テクストの言語的特徴（語彙文法特徴および意味特徴）を導き出す。
【０１７５】
（２）　ユーザに特化したテクスト理解
［換言１］　クライアントモデル部に蓄積されているプロパティ情報（ユーザ情報）に含まれている「大げさ度」が高くないので、「もっと」という副詞はそのまま標準の意味で解釈する。
【０１７６】
［換言２］　「かわいく」という感性語を「フォーマルさ」、「インパクト」および「重さ」の観点で分析し、当てはまるフォントを図１３に示すフォントグラフから検索した結果、「ポップ体」という情報が得られる。
【０１７７】
（３）　ステージ同定
テクスト理解の結果、入力された言語テクストはｗａｎｔＡｃｔｉｏｎタイプであることが分かるので、ｗａｎｔＡｃｔｉｏｎをボディの第１要素に持つようなインタラクションプランユニットを検索する。これにより、ｗａｎｔＡｃｔｉｏｎＵｎｉｔが見つかるので、ｗａｎｔＡｃｔｉｏｎＵｎｉｔを親ノード、ｗａｎｔＡｃｔｉｏｎを子ノードとするようなプラン構造を生成する。
【０１７８】
（４）　ムーブ選択
ｗａｎｔＡｃｔｉｏｎＵｎｉｔのボディの第２要素であるＩＤＥＮＴＩＦＹマクロをスキップし、第３要素のＥＸＥＣＵＴＥマクロを実行するため、ｓｅｔＰｒｏｐｅｒｔｙ動作（この場合は、フォントの変更）の実行をユーザに提案するインタラクションプランユニットを選択する。このようなインタラクションプランユニットが選択されるのは現在の状況が「質問応答」の状況であるからであり、第１の実施例のように「依頼応対」の状況である場合には、秘書エージェントシステム自身が言語アプリケーション（ワープロソフト）に対して言語プロトコルを介してフォントの変更を実行するインタラクションプランユニットが選択されることになる。なお、このような対応は、プランライブラリにおいて利用可能なプランユニットが状況タイプごとに組織化されているために可能となる。なおここでは、質問の内容がフォントの変更についての具体的な操作の手順を質問しているのではないことと、クライアントモデル部に蓄積されているプロパティ情報やプロパティ特性情報により検索されたユーザの知識レベルとから、フォントの変更を提案するのみで具体的な操作の手順について詳しく述べないインタラクションプランユニットを選択する。
【０１７９】
（５）　一般的なテクスト生成
フォントをポップ体に変更するように提案する言語テクスト（『（２．）フォントをポップ体に変更したらいかがですか？』）が生成される。
【０１８０】
（６）　ユーザに特化したテクスト生成
［換言］　クライアントモデル部に蓄積されているプロパティ情報（個人的関連知識）から、ユーザのワープロの操作に関する知識レベルが初級者であるということが分かる。クライアントモデル部に蓄積されているプロパティ特性情報から、初級者の特徴として「フォント」という専門用語は理解できると判定されるため、「字」という言葉を「フォント」と変換して出力を行う。
【０１８１】
＜３：フォントって何ですか？＞
次に、図２５に示す対話例におけるユーザ３番目の発話である『（３．）フォントって何ですか？』に対して行われる処理について説明する。
【０１８２】
（１）　一般的なテクスト理解
１番目の発話と同様に処理を行い、言語テクストの言語的特徴（意味特徴）を導き出す。
【０１８３】
（２）　ユーザに特化したテクスト理解
［学習］　ユーザが「フォント」という言葉が理解できなかったので、クライアントモデル部に蓄積されているプロパティ情報（個人的関連知識）において、ユーザのワープロに関する知識レベルを「初級者」から「初心者」に変更する。
【０１８４】
（３）　ステージ同定
このようなユーザの質問は事前に予測できないものであるので、プラン構造に新しいツリー構造を導入する。
【０１８５】
（４）　ムーブ選択
質問に対して答えるムーブを選択する。
【０１８６】
（５）　一般的なテクスト生成
フォントについての説明を行う言語テクスト（『（４．）文字の種類のことです。』）を生成する。
【０１８７】
（６）　ユーザに特化したテクスト生成
ここでは特に処理は行われず、そのまま言語テクストがユーザに対して出力される。
【０１８８】
＜５：どうやってフォントを変えればいいのですか？＞
次に、図２５に示す対話例におけるユーザの１番目の発話である『（５．）どうやってフォントを変えればいいのですか？』に対して行われる処理について説明する。
【０１８９】
これまでの発話と同様に、上述した（１）〜（６）の順番で言語テクストの意味理解および生成が行われる。ここでは、具体的な操作の手順がユーザから質問されているので、セミオティックベースを利用して、フォントを変更するための手順を説明するための言語テクストを生成する。その際、必要に応じて、現在の状態を確認するための言語テクスト（『（６．）変えたい文字は選択してありますか？』）をユーザに対して出力し、ユーザからの回答（『（７．）はい。』）を待って、フォントを変更するための手順を説明するための言語テクストを出力する。なお、出力される言語テクストは全ての手順を説明するために長くて複雑なものであるので、知識レベルに合わせて自明な部分を省略して出力する。ただし、ここでは、クライアントモデル部に蓄積されているプロパティ情報（個人的関連知識）から得られるユーザの知識レベルが初心者であるため、ユーザに特化した言語テクストの生成において、省略の処理は行われず、詳しい操作の手順を説明する言語テクスト（『（８．）一番上にファイル、編集、などとかいてあるバーのうち、書式をクリックすると、フォントというメニューが出ますので、クリックしてください。』）がそのままユーザに対して出力される。
【０１９０】
実施例３
最後に、第３の実施例として、秘書エージェントシステムを介して、日常言語コンピュータシステム上で動作するＷｅｂやデータベースの検索を行う場合を例に挙げて説明する。具体的には、ユーザが自分の求めている情報を手に入れるために秘書エージェントシステムに対して希望を伝える。すると、秘書エージェントシステムは、Ｗｅｂや適当なデータベースにアクセスして随時検索を行い、取得した結果を分かりやすい言語表現に直してユーザに対して出力する。なおこのとき、秘書エージェントシステムは、ユーザが柔軟かつ効率的に情報検索を行えるように対話を通して支援するとともに、ユーザから入力された言語テクスト中に含まれる検索語がデータベースに適した形となるように換言および補完を行ったり、検索の結果がユーザに合った形となるよう出力したりする。ここで、データベースは日常言語コンピュータシステム上で動作する言語アプリケーションと考えられるので、秘書エージェントシステムとデータベースとの間で行われる対話（検索問合せおよび結果提示）は日常言語に基づく言語プロトコルを介して行われる（特願２００２−１５４８２３号参照）。
【０１９１】
以下、図２６に示す対話例に沿って、ユーザからのそれぞれの入力（言語テクスト）に対して秘書エージェントシステムの内部でどのようにして、言語テクストの意味理解、対話プランニング、およびユーザに対して出力される言語テクストの生成が行われるのかを順に説明する。ここで、第３の実施例における手順は、上述した第１および第２の実施例における手順と基本的に同様であるので、第３の実施例に特有な部分のみを詳細に説明し、共通する部分についての説明は適宜省略する。
【０１９２】
＜１：時計をいつもの通販で書いたいんだけど。＞
まず、図２６に示す対話例におけるユーザの１番目の発話である『（１．）時計をいつもの通販で買いたいんだけど。』に対して行われる処理について説明する。
【０１９３】
この場合には、セミオティックベースを参照して、言語テクストに対してパージング処理を行い、その結果から現在の状況が「商品データの検索」という状況タイプに属するものであると推論する。ここで、「時計」だけでは商品データベースの検索条件としては不十分であるので、時計の種類を同定する（ＩＤＥＮＴＩＦＹ）ための質問（ａｓｋＶａｌｕｅ）『（２．）どんな時計ですか？』をユーザに対して出力し、ユーザに条件の入力を促す。
【０１９４】
＜３：この間買ったのと似たようなもので目覚ましの音がでっかいやつ。＞
次に、図２６に示す対話例におけるユーザの３番目の発話である『（３．）この間買ったのと似たようなもので目覚ましの音がでっかいやつ。』に対して行われる処理について説明する。
【０１９５】
この場合には、ユーザに特化したテクスト理解において、クライアントモデル部に蓄積されているプロパティ情報（スケジュール情報）を検索して「この間買ったの」の内容を特定し、ユーザ語である「でっかい」を「大きい」に換言する。また、ユーザがいつも「通販○○」で買い物をするという知識を利用して店舗情報の補完を行い、その結果を用いて、商品データベースに対して検索の問い合わせ（『（４．）通販○○で、アニメキャラクターの目覚し時計で音の大きいものを検索してください。』）を実行する（ＥＸＥＣＵＴＥ）。
【０１９６】
また、商品データベースから検索の結果（『（５．）４６件あります。』）を受け取った後、その情報を所定の言語テクスト（『（６．）目覚ましが４６個見つかりました。』）の形でユーザに対して出力する。ここで、候補の件数が多い場合には、候補を絞り込むための動作を取ることに決めて、所定の言語テクスト（『（７．）予算はいくらですか？』）の形で商品の金額についての希望をユーザに質問する。
【０１９７】
＜８：色のいいやつがいいな。＞
次に、図２に示す対話例におけるユーザの８番目の発話である『（８．）色のいいやつがいいな。』に対して行われる処理について説明する。
【０１９８】
商品の金額についての質問に対して、ユーザは商品の色に関する希望を入力している。このような質問とそれに続く入力の食い違いは実際の対話においてしばしば見られる現象である。ユーザの入力が予想外のものであるので、プランモジュールにおけるステージの同定において、既存のプラン構造を拡張することができず、新しいツリー構造が生成されてスタックに追加される。また、クライアントモデル部に蓄積されているプロパティ情報（個人的関連知識）に含まれるユーザの色の好みに関する情報を利用して、「色のいい」を「青」に換言する。
【０１９９】
＜１０：うん。＞
次に、図２６に示す対話例におけるユーザの１０番目の発話である『うん。』に対して行われる処理について説明する。
【０２００】
秘書エージェントシステムが直前にユーザに対して質問（『９．青がいいですか？』）を行っているので、プランモジュールは、ユーザが「はい（うん）」または「いいえ」と答えることを予測することができる。入力された言語テクストに対してパージング処理を行った結果、実際に予測された発話の内容と一致するので、意味解析の処理が全て省略されて、予測された言語的特徴（意味特徴）が直接プランモジュールへ送られる。
【０２０１】
その後、商品データベースに対して検索の問い合わせ（『（１１．）青のものはありますか？』）を実行する。ここでは、前に検索した結果に「青」という条件を加えて再検索を行ったところ候補が２件に絞られたので、秘書エージェントシステムは、商品データベースから検索の結果（『（１２．）２件あります。』）を受け取った後、さらに、商品データベースに対して問い合わせ（『（１３．）１件目のキャラクターと値段を教えてください。』）を実行する。ここでは、秘書エージェントシステムは、商品データベースから問い合わせの回答（『（１４．）「いるかくん」で４，２００円です。』）を受け取った後、１件目の商品の情報を所定の言語テクスト（『「「いるかくん」で４，２００円の時計があります。」』）の形でユーザに対して出力する。
【０２０２】
【発明の効果】
以上説明したように本発明によれば、ユーザと日常言語コンピュータシステムとの間での言語テクストの対話的なやりとりを個々のユーザに特化した形で柔軟にかつ精密に行うことができる。また、ユーザと日常言語コンピュータシステムとの間で行われる対話の流れを個々のユーザに特化した形で円滑にかつ自然な形で制御することができる。
【図面の簡単な説明】
【図１】本発明の一実施の形態に係る秘書エージェントシステムの全体構成を示すブロック図。
【図２】図１に示す秘書エージェントシステムの言語理解・生成モジュールにおける言語テクストの理解過程を説明するためのフローチャート。
【図３】図１に示す秘書エージェントシステムの言語理解・生成モジュールにおける言語テクストの生成過程を説明するためのフローチャート。
【図４】図１に示す秘書エージェントシステムのプランモジュールで用いられるインタラクションプランユニットの例を示す図。
【図５】図１に示す秘書エージェントシステムのプランモジュールで用いられるドメインプランユニットの一例を示す図。
【図６】図４に示すインタラクションプランユニットの各ステージに割り当てられる動作仕様のうち動作タイプ（発話行為の種類）を列挙して示す図。
【図７】図１に示す秘書エージェントシステムのプランモジュールで用いられるプラン構造の一例を示す図。
【図８】図７に示すプラン構造の管理方法の一例を示す図。
【図９】図１に示す秘書エージェントシステムのプランモジュールにおけるステージの同定方法を説明するためのフローチャート。
【図１０】図１に示す秘書エージェントシステムのプランモジュールにおけるムーブの選択方法を説明するためのフローチャート。
【図１１】図１に示す秘書エージェントシステムのプランモジュールにおける発話の予測方法を説明するためのフローチャート。
【図１２】図１に示す秘書エージェントシステムのクライアントモデル部で用いられるプロファイル情報（言語傾向情報およびプロパティ情報）およびプロパティ特性情報の概要を説明するための図。
【図１３】図１２に示すプロファイル情報の言語傾向情報に含まれる感性語の利用態様の一例（フォントの決定例）を説明するための図。
【図１４】図１２に示すプロファイル情報の言語傾向情報に含まれる感性語の利用態様の他の例（色の決定例）を説明するための図。
【図１５】図１２に示すプロファイル情報の言語傾向情報に含まれる感性語の意味と状況（状況タイプ）との関係を説明するための図。
【図１６】図１２に示すプロファイル情報のプロパティ情報に含まれるユーザ情報の一例を示す図。
【図１７】図１２に示すプロファイル情報のプロパティ情報に含まれるスケジュールの一例を説明するための図。
【図１８】図１２に示すプロファイル情報のプロパティ情報に含まれる個人的関連知識の一例を示す図。
【図１９】図１２に示すプロパティ特性情報の一例を示す図。
【図２０】実施例１で行われる対話例（ワープロソフトを使う場合の対話例）を説明するための図。
【図２１】実施例１におけるプラン構造の第１段階を示す図。
【図２２】実施例１におけるプラン構造の第２段階を示す図。
【図２３】実施例１におけるプラン構造の第３段階を示す図。
【図２４】実施例１におけるプラン構造の第４段階を示す図。
【図２５】実施例２で行われる対話例（ヘルプシステムとして用いられる場合の対話例）を説明するための図。
【図２６】実施例３で行われる対話例（情報検索を行う場合の対話例）を説明するための図。
【符号の説明】
１０　秘書エージェントシステム
２０　言語理解・生成モジュール
２１　一般的テクスト理解部
２２　ユーザ特化テクスト理解部
２３　一般的テクスト生成部
２４　ユーザ特化テクスト生成部
３０　プランモジュール
３１　ステージ同定部
３２　ムーブ選択部
３３　発話予測部
３４　プランライブラリ
３５　インタラクションプランユニット
３６　ドメインプランユニット
３７　プラン構造
４０　クライアントモデル部
４１　プロファイル情報
４２　プロパティ特性情報
５０　外部インタフェース
５１　言語傾向情報
５２　ユーザ語
５３　感性語
５４　程度副詞
５５　プロパティ情報
５６　ユーザ情報
５７　スケジュール
５８　個人的関連知識
６０　セミオティックベース
６１　汎用電子化辞書
６２　コンテクストベース
６３　意味ベース
６４　語彙文法ベース
６５　状況依存辞書

Claims

日常言語の意味の体系を構造化したセミオティックベースに基づいて言語テクストの処理を行う日常言語コンピュータシステムで用いられ、ユーザと日常言語コンピュータシステムとの間での言語テクストの対話的なやりとりを支援する秘書エージェントシステムにおいて、
前記日常言語コンピュータシステムの前記セミオティックベースを参照して、前記ユーザから入力された言語テクストの意味理解を行うとともに、言語テクストの言語的特徴に基づいて前記ユーザへ出力される言語テクストの生成を行う言語理解・生成処理部と、
前記ユーザと前記日常言語コンピュータシステムとの間で行われる言語テクストに基づく対話の流れを制御するプラン処理部であって、前記言語理解・生成処理部により意味理解を行うことで得られた言語テクストの言語的特徴に基づいて、前記言語理解・生成処理部を介して前記ユーザへ出力される言語テクストの言語的特徴の生成を行うプラン処理部と、
前記ユーザの個人的な特徴に関する知識を蓄積するクライアントモデル部とを備え、
前記言語理解・生成処理部は、前記セミオティックベースとともに前記クライアントモデル部を参照して、前記ユーザに特化した言語テクストの意味理解および言語テクストの生成を行うことを特徴とする秘書エージェントシステム。
前記プラン処理部は、（ａ）前記ユーザと前記日常言語コンピュータシステムとの間で行われる対話のパターンを当該対話の各段階に対応する複数のステージ間の関係として表す複数のプランユニットを保持するプランライブラリと、（ｂ）進行中の対話の構造を前記各プランユニット間の依存関係として表すプラン構造と、（ｃ）前記プランライブラリに保持されている前記複数のプランユニットを参照して、前記言語理解・生成処理部により意味理解を行うことで得られた言語テクストの言語的特徴に基づいて前記プラン構造における現時点のステージを同定するステージ同定部と、（ｄ）前記ステージ同定部により同定された現時点のステージに続く可能性のあるステージのうち前記ユーザまたは前記日常言語コンピュータシステム上で稼働する言語アプリケーションや他のエージェントなどに対する発話などの実質的な動作を表すステージである複数のムーブの中から最適なムーブを選択するムーブ選択部とを有することを特徴とする、請求項１に記載の秘書エージェントシステム。
前記プラン処理部は、（ｅ）前記プランライブラリに保持されている前記複数のプランユニットを参照して、前記プラン構造における現時点のステージに続く可能性のあるステージのうち前記ユーザの次の発話を表すステージであるムーブを予測する発話予測部をさらに有し、
前記プラン処理部の前記ステージ同定部は、前記言語理解・生成処理部により意味理解を行うことで得られた言語テクストの言語的特徴と、前記発話予測部により予測されたムーブとのマッチングを行うことにより、前記プラン構造における現時点のステージを同定することを特徴とする、請求項２に記載の秘書エージェントシステム。
前記プラン処理部の前記プランライブラリに保持されている前記複数のプランユニットは対話が行われる状況を表す状況タイプごとに分類されており、
前記プラン処理部の前記ステージ同定部および前記ムーブ選択部で用いられる前記プラン構造は、状況タイプに対応する複数のサブプラン構造の組み合わせとして管理されていることを特徴とする、請求項２または３に記載の秘書エージェントシステム。
前記プラン処理部の前記プランライブラリに保持されている前記複数のプランユニットの前記各ステージにはそのステージの望ましさを表す数値として選好度が与えられており、
前記プラン処理部の前記ムーブ選択部は、前記各プランユニットの前記各ステージに与えられた選好度を参照して、前記複数のムーブの中から最適なムーブを選択することを特徴とする、請求項２乃至４のいずれかに記載の秘書エージェントシステム。
前記プラン処理部の前記ムーブ選択部は、前記クライアントモデル部に蓄積されている前記ユーザの個人的な特徴に関する知識を参照して、前記複数のムーブの中から最適なムーブを選択することを特徴とする、請求項２乃至５のいずれかに記載の秘書エージェントシステム。
前記クライアントモデル部は、前記言語理解・生成処理部を介して前記ユーザから入力された言語テクストに含まれる情報または前記プラン処理部により制御される対話の流れに関する情報に基づいて、前記ユーザの個人的な特徴に関する知識を自律的に学習することを特徴とする、請求項１乃至６のいずれかに記載の秘書エージェントシステム。
前記クライアントモデル部は、前記ユーザ自身の言語的傾向を記述した言語傾向情報を保持し、
前記言語理解・生成処理部は、前記クライアントモデル部に保持されている前記言語傾向情報を参照して、前記ユーザから入力された言語テクストを前記日常言語コンピュータシステムで用いられる適切な言語テクストに換言するとともに、前記日常言語コンピュータシステムから得られた言語テクストを前記ユーザに理解しやすい言語テクストに換言することを特徴とする、請求項１乃至７のいずれかに記載の秘書エージェントシステム。
前記クライアントモデル部に保持されている前記言語傾向情報はコンピュータ画面上に呈示される文字、図および線を表現する複数の感性語を含むことを特徴とする、請求項８に記載の秘書エージェントシステム。
前記クライアントモデル部は、複数のユーザに共通した特徴を記述したプロパティ特性情報をさらに保持し、
前記言語理解・生成処理部は、前記クライアントモデル部に保持されている前記言語傾向情報を前記プロパティ特性情報とともに参照して、言語テクストの換言を行うことを特徴とする、請求項８に記載の秘書エージェントシステム。
前記クライアントモデル部は、前記ユーザ自身のプロフィールを記述したプロパティ情報を保持し、
前記言語理解・生成処理部は、前記クライアントモデル部に保持されている前記プロパティ情報を参照して、前記ユーザから入力された言語テクストを部分的に補完するとともに、前記日常言語コンピュータシステムから得られた言語テクストを部分的に省略することを特徴とする、請求項１乃至１０のいずれかに記載の秘書エージェントシステム。
前記クライアントモデル部は、複数のユーザに共通した特徴を記述したプロパティ特性情報をさらに保持し、
前記言語理解・生成処理部は、前記クライアントモデル部に保持されている前記プロパティ情報を前記プロパティ特性情報とともに参照して、言語テクストの補完および省略を行うことを特徴とする、請求項１１に記載の秘書エージェントシステム。
前記クライアントモデル部は、前記ユーザ自身のプロフィールを記述したプロパティ情報を保持し、
前記プラン処理部は、前記クライアントモデル部に保持されている前記プロパティ情報を参照して、前記ユーザと前記日常言語コンピュータシステムとの間で行われる対話の流れを制御することを特徴とする、請求項１乃至１２のいずれかに記載の秘書エージェントシステム。
前記クライアントモデル部は、複数のユーザに共通した特徴を記述したプロパティ特性情報をさらに保持し、
前記プラン処理部は、前記クライアントモデル部に保持されている前記プロパティ情報を前記プロパティ特性情報とともに参照して、前記ユーザと前記日常言語コンピュータシステムとの間で行われる対話の流れを制御することを特徴とする、請求項１３に記載の秘書エージェントシステム。
日常言語の意味の体系を構造化したセミオティックベースに基づいて言語テクストの処理を行う日常言語コンピュータシステムで用いられ、ユーザと前記日常言語コンピュータシステムとの間での言語テクストの対話的なやりとりを支援する秘書エージェントプログラムにおいて、
前記日常言語コンピュータシステムの前記セミオティックベースを参照して、前記ユーザから入力された言語テクストの意味理解を行うとともに、言語テクストの言語的特徴に基づいて前記ユーザへ出力される言語テクストの生成を行う言語理解・生成処理機能と、
前記ユーザと前記日常言語コンピュータシステムとの間で行われる言語テクストに基づく対話の流れを制御するプラン処理機能であって、前記言語理解・生成処理機能により意味理解を行うことで得られた言語テクストの言語的特徴に基づいて、前記言語理解・生成処理機能を介して前記ユーザへ出力される言語テクストの言語的特徴の生成を行うプラン処理機能とを備え、
前記言語理解・生成処理機能は、前記セミオティックベースとともに、あらかじめ用意された前記ユーザの個人的な特徴に関する知識を参照して、前記ユーザに特化した言語テクストの意味理解および言語テクストの生成を行うことを特徴とする秘書エージェントプログラム。
日常言語の意味の体系を構造化したセミオティックベースに基づいて言語テクストの処理を行う日常言語コンピュータシステムで用いられる対話プランニング方法において、
前記セミオティックベースを参照して意味理解を行うことで得られた言語テクストの言語的特徴を受け取るステップと、
前記ユーザと前記日常言語コンピュータシステムとの間で行われる対話のパターンを当該対話の各段階に対応する複数のステージ間の関係として表す複数のプランユニットと、進行中の対話の構造を前記各プランユニット間の依存関係として表すプラン構造とを参照して、前記言語テクストの言語的特徴に基づいて前記プラン構造における現時点のステージを同定するステップと、
同定された現時点のステージに続く可能性のあるステージのうち前記ユーザまたは前記日常言語コンピュータシステム上で稼働する言語アプリケーションや他のエージェントなどに対する発話などの実質的な動作を表すステージである複数のムーブの中から最適なムーブを選択し、前記言語理解・生成処理部を介して前記ユーザへ出力される言語テクストの言語的特徴の生成、または前記日常言語コンピュータシステム上で稼働する言語アプリケーションや他のエージェントなどへ出力される操作指示の生成を行うステップとを含むことを特徴とする対話プランニング方法。
前記複数のプランユニットを参照して、前記プラン構造における現時点のステージに続く可能性のあるステージのうち前記ユーザの次の発話を表すステージであるムーブを予測するステップをさらに含み、
前記プラン構造における現時点のステージを同定するステップにおいて、意味理解を行うことで得られた言語テクストの言語的特徴と、予測されたムーブとのマッチングを行うことを特徴とする、請求項１６に記載の対話プランニング方法。
前記複数のプランユニットは対話が行われる状況に対応する状況タイプごとに分類されており、
前記プラン構造は、状況タイプに対応する複数のサブプラン構造の組み合わせとして管理されていることを特徴とする、請求項１６または１７に記載の秘書エージェントシステム。
前記複数のプランユニットの前記各ステージにはそのステージの望ましさを表す数値として選好度が与えられており、
前記プラン構造における現時点のステージに続く可能性のある前記複数のムーブの中から最適なムーブを選択するステップにおいて、前記各プランユニットの前記各ステージに与えられた選好度を参照することを特徴とする、請求項１６乃至１８のいずれかに記載の秘書エージェントシステム。
前記プラン構造における現時点のステージに続く可能性のある前記複数のムーブの中から最適なムーブを選択するステップにおいて、クライアントモデル部に蓄積されている前記ユーザの個人的な特徴に関する知識を参照することを特徴とする、請求項１６乃至１９のいずれかに記載の秘書エージェントシステム。