JP6759308B2

JP6759308B2 - 保守装置

Info

Publication number: JP6759308B2
Application number: JP2018225638A
Authority: JP
Inventors: 富士本　淳; 淳富士本; 野中　誠之; 誠之野中; 勝倉　裕; 裕勝倉
Original assignee: Universal Entertainment Corp
Current assignee: Universal Entertainment Corp
Priority date: 2012-12-28
Filing date: 2018-11-30
Publication date: 2020-09-23
Anticipated expiration: 2033-12-04
Also published as: JP2019067433A; JP2019053767A; JPWO2014103645A1; WO2014103645A1; JP6529761B2

Description

ユーザに話題を提供する話題提供システム、ユーザに情報検索機能を提供する情報検索システム、テキストデータから重要な文字列を抽出する文解析装置、及び複数の辞書を比較する情報更新装置に関する。

これまでに、ネットワークを介して人工知能を用いたチャットなどの会話サービスが提供されてきている。従来の会話制御システムは、人工知能を使ったものであり、ユーザが入力した文字情報などをサーバで形態素解析して形態素から把握される意味内容に関連付けられている予め作成された回答内容をユーザに出力するシステムであった。

また、形態素解析を第一形態素と第二形態素とに分けて概念に応じた解析をする会話制御システムもあった。さらに、ユーザに対して抱く感情度等も特定して回答を作成する会話制御システムもあった。

また、所定期間にネット検索等で急増した検索ワードや、所定期間にニュースなどで急増したワードなどをイベントワードとして記憶し、さらに、ネット検索等において、イベントワードとともに入力されるワード（ＡＮＤ検索等で用いられるワード）や、イベントワードを含むニュースから出現頻度などを基に予め解析したワードを、イベントワード関連語として記憶し、このような状況において、ネット検索等の検索ワードとしてイベントワードの１つが入力された場合に、上述したイベントワード関連語を一覧表示するように構成された情報検索システムがある（特許文献４参照）。

さらに、従来より、コンピュータシステムに入力される文や、インターネット上に公開されているホームページ等のコンテンツから、話題性のあるワードを抽出するためのシステムが開示されている。例えば、特許文献５及び特許文献６に開示されている情報取得装置では、利用者から入力された入力情報等から、最も話題性のある情報を探し出すために、形態素データベースに記憶された形態素群と入力情報を照合し、入力情報から形態素に対応する文字列を抽出する。形態素は、入力情報等に含まれる文を構成する、「語」のような最小単位に対応するものであり、この最小単位には、例えば、名詞、形容詞、動詞などの品詞が含まれる。上記の形態素データベースには、一般的な文に用いられる名詞、形容詞、動詞などを含む形態素群が予め登録されている。

またさらに、従来より、個人によって生成されたテキストデータから、意味識別可能な複数の分解テキストデータを抽出し、さらに、複数の条件を用いてフィルタリングを行うことによって検閲の場（広義フィルタリングのための空間）を提供するとともに特異性を見い出して可視化するシステムが提案されている。

例えば、特許文献７には、個人によって生成された個人生成データを、意味識別可能な複数の分解テキストデータに分解し、これらの分解テキストデータが示す対象について、所定の関連条件と所定の特徴条件を満たすデータを抽出して、当該抽出されたデータの集まりを検閲の場として生成し、さらに、当該抽出されたデータの集まりから、分解テキストデータが示す対象について、所定の特異条件を満たすデータを抽出し、こうして抽出されたデータから、所定の特異性を検出して可視化する情報処理システムが開示されている。

ここで、検閲の場とは、検閲の対象となるテキストデータの集まりから構成される空間である。また、関連条件は、分解テキストデータが示す対象（テキストデータに含まれている話題や内容など）について、情報処理システムの運用者等が設定する条件であり、例えば、分解テキストデータが示す対象が食品のラーメンである場合に、関連条件を満たす関連対象として、醤油味のラーメンや塩味のラーメンを含めることができる。

特徴条件は、分解テキストデータが示す対象の属性（特性や特色などの特徴）に関する条件である。属性は、嗜好と捉えることもでき、例えば、分解テキストデータが示す対象が食品である場合に、おいしいや、まずいといった、個人による主観的または客観的記述が考えられる。

特異条件は、テキストデータが示す対象に関して所定の特異性を示すことである。特異性は、所定の対象に関する各種の量、度合い、変化率が所定の閾値より大きいか小さいかによって判断できる。例えば、ある部分空間において、「ラーメン」という語（発話）の出現回数が残りの部分空間よりも多い場合に、所定の特異条件を満たすとして、その分解テキストデータが抽出され可視化される。

特開２００７−３０５１４６号公報特開２００４−８６２４６号公報特開２００９−２４５４６６号公報特開２００７−３４４６６号公報特許第４２５３４８７号公報特許第４４０２８６８号公報特開２０１２−２２１２２２号公報

第１の課題は以下の通りである。
会話を進める際には、まず何らかの話題（テーマなど）を予め提供し、その話題に沿って会話を進めていくことが一般的に行われる。従来から存在する話題制御システム（会話制御システムを含む）を用いてユーザと会話を進める場合に、このような会話形態に適応させるためには、以下のような問題が生ずることが想定される。すなわち、まず、話題と会話の流れに合わせた自然な応答を実現するために、多様な入力情報に対応できる話題制御ルールを構築しようとしても、全てに対応できる話題制御ルールを準備することはできず、自然な応答を実現することが困難になり得る。さらに、話題制御ルールには、話題制御システムの全般に亘って高度かつ専門的な知識と技術とが関連しているため、話題制御ルールを変更したり修正したりする保守作業を別個に行うことが困難になる。

本発明は、上述の点に鑑みてなされたものであり、その目的とするところは、話題と会話の流れに合わせた自然な応答を実現することができるとともに、話題制御ルールの変更、追加、修正などの保守作業を別個に行うことのできる話題制御システムとしての話題提供システムを提供することにある。

第２の課題は以下の通りである。
会話を進める際には、まず何らかの話題（テーマなど）を予め提供し、その話題に沿って会話を進めていくことが一般的に行われる。このため、従来から存在する会話制御システムでは、ユーザとの会話を進めるための膨大な量のデータやプログラムを構築するとともに、これらのデータやプログラムを用いて処理をすることでシステムを実現していた。さらに、様々なユーザに対して対応できるようにするために、会話制御システムの処理の大半をサーバにおいて実行していた。このような会話制御システムを構築することにより、比較的記憶容量が小さかったり処理能力が低かったりする端末装置（携帯電話やスマートフォンなどの携帯端末など）であっても、ユーザとの会話を進めていくことができた。

しかしながら、このような会話制御システムでは、以下のような問題が生ずることが想定される。すなわち、まず、ユーザから入力された入力情報に対する応答などの処理をサーバ側で実行するため、ユーザから入力されるたびに、ネットワークを介した通信が必要となるとともに、サーバに接続するユーザの端末装置が多い場合には、処理時間が長くなり応答が遅延しやすくなっていた。さらに、ユーザから入力された入力情報に対する応答などの処理をサーバ側で実行するため、複数のユーザの状態に応じて異なる応答ができるようにした場合には、処理時間がさらに長くならざるを得ず、応答が遅延しやすくなっていた。

本発明は、上述の点に鑑みてなされたものであり、その目的とするところは、サーバの負担を軽くできかつネットワークのトラフィックを少なくできるとともに、複数のユーザの状態に応じて的確に応答し、かつユーザとの会話の流れに合わせて円滑に会話を進めることができる会話制御端末装置を提供することにある。

第３の課題は以下の通りである。
会話を進める際には、まず何らかの話題（テーマなど）を予め提供し、その話題に沿って会話を進めていくことが一般的に行われる。このため、従来から存在する会話制御システムでは、ユーザとの会話を進めるための膨大な量のデータやプログラムを構築するとともに、これらのデータやプログラムを用いて処理をすることでシステムを実現していた。したがって、記憶容量が大きく処理能力が高いサーバなどによって応答情報を決定するともに、このようなサーバに、ユーザが操作する端末装置を複数接続することで、複数のユーザにサービスを提供することを可能としていた。

しかしながら、このような会話制御システムでは、以下のような問題が生ずることが想定される。すなわち、上述したように、ユーザからの入力情報に対する応答などの処理を行ってユーザと会話を進めるためには、膨大な量のデータを構築する必要がある。このようなデータの構築には、会話制御システムの全般に亘る高度で専門的な知識や経験を要していた。このため、サーバに接続してくる複数のユーザの各々に対してカスタムを施して応答するためには、会話制御システムの多岐に亘って作業を行う必要があり困難になっていた。

本発明は、上述の点に鑑みてなされたものであり、その目的とするところは、会話制御システムを利用する複数のユーザの各々に対してカスタムを施して応答することができるとともに、施したカスタムが適切であるか否かを事前に検証することができるような保守装置を提供することにある。

第４の課題は以下の通りである。
上述の特許文献４のような情報検索システムでは、以下のような問題が生ずることが想定される。すなわち、イベントワード関連語が、ネット検索においてイベントワードとＡＮＤ検索したものから得られている場合、ユーザのイベントワードの入力に応じて一覧表示される、こうしたイベントワード関連語は、入力者由来の情報であるため、ネット検索のユーザにとっては既知の偏った情報である場合が多く、イベントワードとイベントワード関連語の間の関連も、入力者が考える関連にすぎない。そのため、ネット検索においてイベントワードとＡＮＤ検索したものから得られているイベントワード関連語によって、既知でない新規な話題を取得することが困難である。

また、イベントワード関連語が、イベントワードを含むニュースから出現頻度などを基に予め解析したものである場合、そのイベントワード関連語は、過去のニュースを解析したものであるため、そのようなイベントワード関連語によって最新の話題を取得することが困難である。

本発明の目的は、上述した第４の課題を解決することができるような情報検索システム、情報検索装置、情報検索方法、及びプログラムを提供することにある。

第５の課題は以下の通りである。
上述した、特許文献５や特許文献６に開示されている情報取得装置では、入力情報等から最も話題性のある情報（語）を探し出すために、照合対象となる形態素データベースを予め作成しなければならず、その労力は極めて多大なものである。形態素データベースには、日常的な文に用いられる名詞、形容詞、動詞等を、概ね網羅するように登録しておかなければ、入力情報等の有効な解析を実現することができない。

さらに、この情報取得装置では、話題性のある情報を、例えば、「語」といった、形態素の単位でしか把握することができない。

また、上記情報取得装置では、入力情報等から最も話題性のある情報を探し出すために、入力情報等に含まれる語ごとに形態素データベースとの照合処理を行う必要があるが、この処理は、データベースのアクセスや比較処理等に多くの時間を必要とするため、応答時間が長くなり、その結果、入力情報等の解析をリアルタイムに行うことが困難である。

さらに、日本語以外の他の言語について、同様の処理、すなわち、入力情報等から最も話題性のある情報を探し出すためには、形態素データベースを新たに用意し、さらに、各言語の文法に合わせて、解析ロジック等を再構築しなければならない。

従って、本発明の目的は、上述した第５の課題をことごとく解決する文解析装置、文解析方法、及びプログラムを提供することである。

第６の課題は以下の通りである。
上述した、特許文献７に開示されている情報処理システムでは、個人によって生成されたテキストデータから、意味識別可能な複数の分解テキストデータを抽出し、さらに、所定の条件を満たす分解テキストデータを絞り込んで可視化するが、検閲の対象とするテキストデータは、ネットワーク上で世界中から絶え間なく更新され続けている膨大なテキストデータを含むものであり、最新の情報を扱うためには、分解テキストデータの抽出を、その膨大なテキストデータの更新に合わせて逐次行っていかなければならず、その作業量は膨大である。

また、新たに出現した分解テキストデータは、新規情報として価値が大きいが、膨大なテキストデータから新たに出現した分解テキストデータを切り分けることは極めて困難である。特に、膨大なテキストデータにおいて、このような新たに出現した分解テキストデータを抽出することは、話題を把握する上で重要であるが、テキストデータが膨大であるがゆえに、そのような分解テキストデータを的確にとらえることが難しい。

従って、本発明の目的は、上述した第６の課題を解決することができる情報更新装置、情報更新方法、及びプログラムを提供することである。

本発明の第１の実施態様に係る特徴は、
ユーザが入力する入力情報を分析することによって生成された入力特定情報に基づいて話題に関わる応答情報を規定するためのシナリオデータを記憶するシナリオデータ記憶部と、
前記入力特定情報を受信する受信部と、
前記シナリオデータを編集可能にするためのシナリオデータ編集部と、
前記受信部で受信した入力特定情報に基づいて編集したシナリオデータの応答を検証可能にするシナリオデータ検証部と、
編集したシナリオデータを外部に送信するシナリオデータ送信部と、を備え、
ユーザが入力情報を入力するための入力部と、
前記入力情報及び前記応答情報に関する状態制御指標を記憶する状態制御指標記憶部と、
前記シナリオデータと前記状態制御指標とに基づいて前記応答情報を決定する応答情報決定部と、
前記応答情報決定部によって決定された応答情報を出力する出力部と、を備える会話制御端末装置を仮想的に構築する端末装置仮想構築部を有し、前記状態制御指標は、過去の前記入力情報、及び過去の前記応答情報の少なくともいずれかに関する指標である。

会話制御システムにおけるデータは、ユーザが入力した入力情報を分析して入力特定情報を生成するためのデータと、この入力特定情報に基づいて応答情報を決定するためのシナリオデータとの双方がある。このシナリオデータは、ユーザへの回答である応答情報を多様化することができるデータである。上述した構成によれば、シナリオデータ編集部によって、シナリオデータを編集でき、シナリオデータ検証部によって、編集したシナリオデータの応答を検証できる。このようにすることで、会話制御システムの全般に亘る高度に専門的な知識や技術がなくても、シナリオデータについて、会話制御システムを利用する複数のユーザの各々に対してカスタムを施すことができる。

端末装置仮想構築部は、会話制御端末装置を保守装置において仮想的に構築して実行することができる。したがって、一般のユーザが使用する会話制御端末装置と同様の環境を保守装置において実現することができる。これにより、ユーザが実際に会話を進める環境と同様の環境で、シナリオデータの内容や動作を予め確認することができ、ユーザと会話をする前にシナリオデータの内容を検証することができ、サーバに接続してくる複数のユーザの各々に対して施したカスタムが適切であるか否かを事前に検証することができる。

本発明の第２の実施態様に係る特徴は、
ユーザが入力する入力情報を分析することによって生成された入力特定情報に基づいて話題に関わる応答情報を規定するためのシナリオデータを記憶するシナリオデータ記憶部と、
前記入力特定情報を受信する受信部と、
前記シナリオデータを編集可能にするためのシナリオデータ編集部と、
前記受信部で受信した入力特定情報に基づいて編集したシナリオデータの応答を検証可能にするシナリオデータ検証部と、
編集したシナリオデータを外部に送信するシナリオデータ送信部と、を備え、
話題を関係付ける関連詞を介して話題の近さや繋がり方を付与した話題リストを生成するための話題解析部を、さらに備え、
前記シナリオデータ編集部は、前記話題リストと前記関連詞を利用してユーザに話題を紹介するための話題紹介シナリオおよびユーザの入力に応答するための入力関連シナリオを前記シナリオデータとして編集可能にすることである。

会話制御システムにおけるデータは、ユーザが入力した入力情報を分析して入力特定情報を生成するためのデータと、この入力特定情報に基づいて応答情報を決定するためのシナリオデータとの双方がある。このシナリオデータは、ユーザへの回答である応答情報を多様化することができるデータである。上述した構成によれば、シナリオデータ編集部によって、話題解析部と連携しながらシナリオデータを編集でき、シナリオデータ検証部によって、編集したシナリオデータの応答を検証できる。このようにすることで、会話制御システムの全般に亘る高度に専門的な知識や技術がなくても、シナリオデータについて、会話制御システムを利用する複数のユーザの各々に対してカスタムを施すことができる。

本発明の他の実施態様に係る特徴は、以下の通りである。
本発明の第１の実施の形態に係る特徴は、
ユーザが入力情報を入力するための入力部と、
前記入力情報を分析して入力特定情報を生成する入力情報分析部と、
話題に関する応答情報を規定するためのシナリオデータを抽出するシナリオデータ記憶部と、
前記シナリオデータと前記入力特定情報とに基づいて前記応答情報を決定する応答情報決定部と、
前記応答情報決定部によって決定された応答情報を出力する出力部と、を備えることである。

シナリオデータと入力情報分析部によって分析された入力特定情報とによって応答情報を決定するので、話題と会話の流れとに合わせた自然な応答を実現することができる。

さらに、シナリオデータに基づいて話題に関する応答情報を規定することができるので、話題制御システムの全般に亘る高度かつ専門的な知識や技術に依存することなく、話題制御ルールの変更、追加、修正などの保守作業を別個に行うことができる。

本発明の第１の実施の形態に係る特徴は、さらに、
前記入力情報及び前記応答情報に関する状態制御指標を記憶する状態制御指標記憶部をさらに備え、
前記応答情報決定部は、前記シナリオデータ及び前記入力特定情報のほかに前記状態制御指標を加えて前記応答情報を決定することである。

シナリオデータ及び入力特定情報のほかに状態制御指標を使って応答情報を決定するので、より話題と会話の流れとに合わせた自然な応答を実現することができる。

さらに、状態制御指標により、入力や話題提供の履歴を捉えて話題提供をすることができるので、ユーザが文脈学習（話題と会話の過去の流れを記憶して現在の流れに適合することを「文脈学習」という。）を体感するような応答を実現することができる。

本発明の第１の実施の形態に係る特徴は、さらに、
前記シナリオデータは、異なる話題への遷移を規定する情報を含み、
前記異なる話題への遷移を規定する情報に応じて、現在の話題に関する応答情報を規定するためのシナリオデータから、異なる話題に関する応答情報を規定するためのシナリオデータへ、シナリオデータを切り替える話題切替部を、さらに備えることである。

シナリオデータを使って話題や話題名を切り替えることができるので、話題と会話との流れに合わせた自然な応答を実現することができる。

さらに、状態制御指標と併用することによりユーザの性格や感情状態を捉えて話題切替ができるので、ユーザが感情制御（ユーザの性格や感情状態を捉えて話題を切り替えることを「感情制御」という）を体感するような応答を実現することができる。

さらに、本発明の第１の実施の形態は、
それぞれが関連詞（例えば、通常の検索処理などに用いられる通常のキーワードとは異なる、話題を関連付けることができるテキストデータの一部）に関連付けられた話題を記憶する話題リスト（例えば、図１７に示す話題リストＧ）と、
テキストデータ（例えば、保守装置３の担当者によってキーボードから入力される話題等）に関連付けられた関連詞に基づいて、前記テキストデータに関連する話題を前記話題リストから抽出する話題抽出手段（例えば、保守装置３のＣＰＵ等で構成される制御部）と、
前記抽出された話題を表示するよう制御する表示制御手段（例えば、保守装置３のＣＰＵ等で構成される制御部）とを備え、
前記表示制御手段は、前記抽出された話題のそれぞれについて、当該話題に関連付けられている関連詞を表示する（例えば、図１７の画面１８１５のように「条件設定：優先関連詞」を指示することで、関連詞を優先したリスト形態で表示する）よう制御する話題提供システムである。

このような本発明の構成によって、話題そのものと、その話題に関連する複数の関連詞を表示することができるので、話題リストから得た話題をベースに、その話題から遷移して様々な話題のバリエーションを表示できる。

さらに、本発明の第１の実施の形態に係る特徴は、
前記テキストデータが、（１）入力された話題、（２）外部のログデータ（例えば、ツイッターやブログなどの、ネットワークを介して収集できるデータ）から、入力された話題に基づいて抽出された話題
のうち、少なくともどちらかを含むように構成されることである。

このような本発明の構成によって、キーボードなどの直接的な入力装置による話題の入力と、外部からの情報から得られた話題が入力されるので、これらを自動的に減数又は追加し、これを繰り返すことによって話題紹介リストを構築することができる。

さらに、本発明の第１の実施の形態に係る特徴は、
前記表示制御手段が、前記抽出された話題に関連付けられている関連詞が入力された場合に、当該入力された関連詞に関連付けられた話題を表示する（例えば、図１７の画面１８１５に示すように、「安心します」の入力によって、表示される話題を関連詞「安心します」に関連付けられた話題のみに絞り込んで表示し、画面１８１１に示すように、「一番怖い」の入力によって、表示される話題を関連詞「一番怖い」に関連付けられた話題のみにさらに絞り込んで表示する）よう制御することである。

このような本発明の構成によって、話題に関連付けられた関連詞を容易に認識し入力することができるので、話題紹介リストの候補として表示された話題を、より目的となる話題紹介リストになるよう容易に絞り込むことができる。

さらに、本発明の第１の実施の形態に係る特徴は、
前記表示制御手段が、過去に関連詞が話題に関連付けられた態様に基づいて（例えば、過去の他のユーザ履歴で構築された嗜好辞書Ｅを参照して関連詞の関連付けを分析して）、話題の表示を制御することである。

このような本発明の構成によって、関連詞の関連付けに係る態様が他のユーザの応答履歴から分析されるので、ユーザの嗜好に基づいて関連詞を表示することができる。

本発明の第２の実施の形態に係る特徴は、
ユーザが入力情報を入力するための入力部と、
話題に関する応答情報を規定するためのシナリオデータを記憶するシナリオデータ記憶部と、
前記入力情報及び前記応答情報に関する状態制御指標を記憶する状態制御指標記憶部と、
前記シナリオデータと前記状態制御指標とに基づいて前記応答情報を決定する応答情報決定部と、
前記応答情報決定部によって決定された応答情報を出力する出力部と、を備えることである。

会話制御端末装置にシナリオデータ記憶部と状態制御指標記憶部との双方を設けて応答情報を決定するので、ユーザとの会話が可能であるか否かを会話制御端末装置で判断して制御でき、会話制御端末装置における処理の負担を著しく増加させることなく、かつ、サーバの負担も増加させることなく、さらに、ネットワークのトラフィックも増加させることなく、ユーザとの会話の流れに合わせて円滑に会話を進めることができる。

さらに、本実施の形態による会話制御端末装置は、シナリオデータと状態制御指標とに基づいて応答情報を決定するので、ユーザとの会話の進行状態に応じて応答情報を決定でき、サーバの負担を増大させることなく、ユーザの状態に応じて的確に応答することができる。

本発明の第２の実施の形態に係る特徴は、さらに、
前記入力情報を外部に送信する送信部と、
送信された入力情報を分析して生成された入力特定情報を受信する受信部と、をさらに備え、
前記応答情報決定部は、前記シナリオデータ及び前記状態制御指標に前記入力特定情報を加えて前記応答情報を決定することである。

入力特定情報を加えて応答情報を決定するので、サーバなどの外部で分析した結果である入力特定情報を含めて応答情報を決定でき、ユーザとの会話の流れに合わせて円滑に会話を進めることができる。

本発明の第２の実施の形態に係る特徴は、さらに、
前記受信部は前記入力情報に基づいて抽出されたシナリオデータを受信し、
前記シナリオデータ記憶部は受信したシナリオデータを記憶することである。

入力情報に基づいて抽出されたシナリオデータを受信するので、ユーザが入力した入力情報に基づいてシナリオデータを切り替えていくことができ、ユーザとの会話の流れに合わせて円滑に会話を進めることができる。

本発明の第２の実施の形態に係る特徴は、さらに、
前記シナリオデータは、異なる話題への遷移を規定する情報を含み、
前記異なる話題への遷移を規定する情報に応じて話題切替入力情報を生成する切替入力情報入力部を備え、
前記送信部は、前記話題切替入力情報を外部に送信し、
前記受信部は、前記話題切替入力情報に基づいたシナリオデータを受信することである。

状態制御指標とシナリオデータとに基づいて話題を切り替えることができるので、ユーザとの会話の状態を見ながら話題を切り替ることができ、ユーザとの会話の流れに合わせて円滑に会話を進めることができる。

本発明の第４の実施の形態は、
キーワードに基づく検索により収集されたテキストデータ（例えば、図２０に示す収集されたＷＥＢページから取得される外部ログ５０２（テキストデータ））から、前記キーワードに関する文情報（例えば、キーワード検索にヒットしたテキストデータの一部である質問文等）を取得する文情報取得手段（例えば、図２０に示す入力情報分析部４１）と、
前記文情報のそれぞれから所定条件を満たす１つまたは複数の文字列（例えば、意味識別可能な文字列である関連詞）を選出し、対応する前記文情報ごとに、前記文字列を文字列記憶手段（例えば、図２０に示す関連詞辞書５０）に記憶する文字列選出手段（例えば、図２０に示す文解析部４３）と、
前記選出された前記文字列を、対応する前記文情報ごとにユーザに対して表示するための情報（例えば、ユーザに対して図３７に示すような関連詞・共起語一覧表示画面６５０を表示するための図２０に示す関連詞・共起語データ５２を含む入力特定情報）を出力する情報出力手段（例えば、図２０に示す入力情報分析部４１）を備えるように構成された情報検索システム（例えば、図２０に示す情報検索システム１００）である。

本発明のこのような構成によって、選出された文字列が情報発信者由来の情報として得られ、既知でない新規な話題も取得することができる。また、選出された文字列（関連詞）が、キーワードに基づく検索から得られる最新の情報であるため、最新の情報を得ることができる。

本発明の第４の実施の形態に係る特徴は、
前記文字列選出手段は、
事前に記憶された文字列データ（例えば、形態素データ等を含む辞書）との照合を行うことなく、前記文字列を選出するように構成されることである。

本発明のこのような構成によって、事前に形態素データ等を含む辞書を作成・維持する労力が不要となり、容易に情報検索システムを構築できる。

本発明の第４の実施の形態に係る特徴は、さらに、
前記文字列選出手段はさらに、
前記テキストデータから同じ文字列を検索する文字列検索手段（例えば、図２１に示す文字列検索処理部４３ｂ）と、
前記同じ文字列について、前の隣接文字の異なり度合い（例えば、検索された「同じ文字列」の直前に出現する文字が、どの程度異なっているか（バリエーションがあるか）を示す指標であり、前の隣接文字として現れる文字のパターン数に基づくもの）、及び後の隣接文字の異なり度合い（例えば、検索された「同じ文字列」の直後に出現する文字が、どの程度異なっているか（バリエーションがあるか）を示す指標であり、後の隣接文字として現れる文字のパターン数に基づくもの）を判定する異なり度合い判定手段（例えば、図２１に示す異なり度合い判定処理部４３ｃ）と、
前記前の隣接文字の異なり度合い、及び前記後の隣接文字の異なり度合いに基づいて、前記同じ文字列が特定文字列（例えば、関連詞）であるか否かを決定する特定文字列決定手段（例えば、図２１に示す関連詞決定処理部４３ｄ）とを備え、
前記文字列選出手段は、前記決定された特定文字列から、前記文字列を選出するように構成されることである。

本発明のこのような構成によって、隣接する文字の異なり度合いに応じて関連詞が判定され、形態素データ等を含む辞書と逐一比較処理を行う必要がなく、処理を高速化することができ、関連詞の表示処理等をリアルタイムに行うことができる。

本発明の第４の実施の形態に係る特徴は、さらに、
話題に関する応答情報を規定するためのシナリオデータ（例えば、図１４に示すようなステートメントからなるデータ）を記憶するシナリオデータ記憶手段（例えば、図２０に示すシナリオデータ２８、シナリオデータ５５）と、
前記シナリオデータに基づいて、前記選出された前記文字列を含む前記応答情報を決定する応答情報決定手段（例えば、図２０に示す応答情報決定部２５）と、
前記応答情報決定手段によって決定された前記応答情報を出力する応答情報出力手段（例えば、図２０に示す出力制御部２６）をさらに備えるように構成されることである。

本発明のこのような構成によって、選出された文字列（関連詞）をユーザに表示する場合の表示態様を多様化することができるとともに、表示の編集を容易に実行・管理することができる。

本発明の第４の実施の形態に係る特徴は、さらに、
辞書比較手段（例えば、図２２に示す辞書比較処理部４６ｃ）をさらに備え、
前記文字列選出手段は、前記文字列を前記文字列記憶手段に記憶する場合に、それぞれ、前記テキストデータの収集条件に応じて、対応する辞書（例えば、図２２に示す関連詞辞書５０）に記憶し、
前記辞書比較手段は、複数の前記辞書を比較する比較処理を行い、比較結果を比較結果記憶手段（例えば、図２２に示す比較結果データ５４）に記憶し、
前記応答情報決定手段は、前記シナリオデータに基づいて、前記比較結果を含む前記応答情報を決定し、
前記応答情報出力手段は、前記応答情報決定手段によって決定された前記応答情報を出力し、
前記辞書比較手段はさらに、複数の前記辞書のうち少なくとも１つが更新された場合に、前記比較処理を行い、前記比較結果記憶手段に記憶された比較結果を自動的に更新するように構成されることである。

本発明のこのような構成によって、選出された文字列（関連詞）の更新を自動的に行うことができ、各更新タイミングにおける比較結果によって関連詞の出現状況の変化を把握して表示することにより、関連詞をユーザに表示する場合の表示態様を多様化することができる。

本発明の第４の実施の形態に係る特徴は、さらに、
前記情報出力手段は、
前記文情報の１つに対応する前記文字列の１つと、前記文情報の１つとは異なる文情報に対応する前記文字列の１つが共通する場合に、前記１の文情報に対応する前記文字列の集合と、前記他の文情報に対応する前記文字列の集合とを関連付けて表示するための情報を出力するように構成されることである。

本発明の第４の実施の形態に係る特徴は、さらに、
前記情報出力手段は、
所定の１または複数の前記文情報に対応する前記文字列の集合をすべて表示するための情報を出力し、
前記文字列の表示順は、前記ユーザの前記文字列に対する利用態様に応じて決定されるように構成されることである。

本発明の第４の実施の形態は、さらに、
テキストデータの収集条件となるキーワードを入力するキーワード入力手段（例えば、図２０に示す入力制御部２１）と、
前記キーワードに基づいて収集されたテキストデータから取得された、前記キーワードに関する文情報のそれぞれから、所定条件を満たす１つまたは複数の文字列が選出された場合に、前記選出された前記文字列を、対応する前記文情報ごとにユーザに対して表示するための情報を出力する情報出力手段（例えば、図２０に示す出力制御部２６）を備えるように構成された情報検索装置（例えば、図２０に示す会話制御端末装置２’’）である。

本発明の第４の実施の形態は、さらに、
キーワードに基づく検索により収集されたテキストデータから、前記キーワードに関する文情報を取得する文情報取得ステップと、
前記文情報のそれぞれから所定条件を満たす１つまたは複数の文字列を選出し、対応する前記文情報ごとに、前記文字列を文字列記憶手段に記憶する文字列選出ステップと、
前記選出された前記文字列を、対応する前記文情報ごとにユーザに対して表示するための情報を出力する情報出力ステップを備えるように構成された情報検索方法である。

本発明の第４の実施の形態は、さらに、
コンピュータに、
キーワードに基づく検索により収集されたテキストデータから、前記キーワードに関する文情報を取得する文情報取得手段、
前記文情報のそれぞれから所定条件を満たす１つまたは複数の文字列を選出し、対応する前記文情報ごとに、前記文字列を文字列記憶手段に記憶する文字列選出手段、及び、
前記選出された前記文字列を、対応する前記文情報ごとにユーザに対して表示するための情報を出力する情報出力手段として機能させるためのプログラムである。

本発明の第５の実施の形態は、
テキストデータ（例えば、収集されたＷＥＢページから取得されるテキストデータである外部ログ５０２）から同じ文字列を検索する文字列検索手段（例えば、図２１に示す文字列検索処理部４３ｂ）と、
前記同じ文字列について、前の隣接文字の異なり度合い（例えば、検索された「同じ文字列」の直前に出現する文字が、どの程度異なっているか（バリエーションがあるか）を示す指標であり、前の隣接文字として現れる文字のパターン数に基づくもの）、及び後の隣接文字の異なり度合い（例えば、検索された「同じ文字列」の直後に出現する文字が、どの程度異なっているか（バリエーションがあるか）を示す指標であり、後の隣接文字として現れる文字のパターン数に基づくもの）を判定する異なり度合い判定手段（例えば、図２１に示す異なり度合い判定処理部４３ｃ）と、
前記前の隣接文字の異なり度合い、及び前記後の隣接文字の異なり度合いに基づいて、前記同じ文字列が特定文字列（例えば、関連詞）であるか否かを決定する特定文字列決定手段（例えば、図２１に示す関連詞決定処理部４３ｄ）とを備えるように構成される文解析装置（例えば、図２１に示す文解析部４３を含む文解析装置）である。

本発明のこのような構成によって、例えば、インターネット上に公開されている外部の情報をネットワークを通じてテキストデータとして収集し、その取得したテキストデータから前記文字列検索手段が同じ文字列を検索し、当該同じ文字列についての前後の隣接文字の異なり度合いを前記異なり度合い判定手段で判定した後、当該異なり度合い判定手段で判定された前記前後の隣接文字の異なり度合いに基づいて、前記同じ文字列が特定文字列（例えば、関連詞）か否かを特定文字列決定手段で特定できるので、辞書を用いることなく、テキストデータのなかから、話題を識別するために重要な特定文字列を抽出することができる。

本発明の第５の実施の形態に係る特徴は、
特定文字列決定手段が、
前記テキストデータ内に複数の特定文字列が含まれる場合に、それぞれの特定文字列に関する前記前の隣接文字の異なり度合い、前記後の隣接文字の異なり度合い、文字長、及び出現頻度の少なくとも１つに基づいて、前記テキストデータ内における特定文字列のランク付けを行うように構成されることである。

このように構成すれば、前記特定文字列決定手段が、前記テキストデータ内に複数の特定文字列が含まれる場合に、それぞれの特定文字列に関する前記前後の隣接文字の異なり度合い、文字長、及び出現頻度の少なくとも１つに基づいて、前記テキストデータ内における特定文字列のランク付けを行うので、例えば、ある話題に関連する特定文字列を単に抽出するだけでなく、様々な観点からのパラメータでのランク付けを行って、複数の特定文字列ごとに、重要度や話題性などに応じて差別化した特定文字列の解析を行うことができる。

本発明の第５の実施の形態に係る特徴は、さらに
前記テキストデータが、所定条件により収集されたデータ（例えば、個人によって生成された、インターネット上に公開されているＷＥＢページやブログのテキストデータ、ツイート情報などのデータ）であり、
異なる前記テキストデータに関してそれぞれ前記特定文字列が決定される場合に、当該決定された前記特定文字列が、対応する前記テキストデータごとにグループ化される（例えば、各テキストデータに対して個々に特定文字列の集合が形成され、全体として複数のテキストデータについて、特定文字列の集合の集合として管理される）ように構成されることである。

このように構成すれば、例えば、個人によって生成された、インターネット上に公開されているＷＥＢページやブログのテキストデータ、ツイート情報などのデータをテキストデータとして収集し、その収集した異なる複数の前記テキストデータに関して、それぞれ前記特定文字列が決定される場合に、当該決定された前記特定文字列が、対応する前記テキストデータごとにグループ化する処理を前記特定文字列決定手段によって実行するので、各特定文字列がグループ化されるとともに、前述したランク付けと同様、各特定文字列が、それぞれのグループにおいて差別化され、分析自由度が向上する可能性がある。

本発明の第５の実施の形態は、さらに、
テキストデータから同じ文字列を検索するステップと、
前記同じ文字列について、前の隣接文字の異なり度合い、及び後の隣接文字の異なり度合いを判定するステップと、
前記前の隣接文字の異なり度合い、及び前記後の隣接文字の異なり度合いに基づいて、前記同じ文字列が特定文字列であるか否かを決定するステップとを含む文解析方法である。
このように構成すれば、上記本発明の文解析装置と同様の作用効果を奏する方法を提供できる。

こうした本発明の実施態様によって、辞書を用いることなく、テキストデータのなかから、話題を識別するために重要な特定文字列を抽出することができる。

本発明の第５の実施の形態は、さらに、
コンピュータに、
テキストデータから同じ文字列を検索する文字列検索手段、
前記同じ文字列について、前の隣接文字の異なり度合い、及び後の隣接文字の異なり度合いを判定する異なり度合い判定手段、及び、
前記前の隣接文字の異なり度合い、及び前記後の隣接文字の異なり度合いに基づいて、前記同じ文字列が特定文字列であるか否かを決定する特定文字列決定手段として機能させるプログラムである。

本発明のこのような構成によって、辞書を用いることなく、テキストデータのなかから、話題を識別するために重要な特定文字列を抽出することができる。

本発明の第６の実施の形態は、
テキストデータ（例えば、収集されたＷＥＢページから取得されるテキストデータである外部ログ５０２）から、意味識別可能な文字列（例えば、関連詞）を抽出し、抽出された文字列を、前記テキストデータに対応する辞書（例えば、関連詞辞書５０）に記憶する文字列抽出手段（例えば、図２２に示す文字列抽出処理部４６ｂ）と、
複数の前記辞書を比較する比較処理（例えば、関連詞辞書（ｉ−１）に記憶された関連詞と関連詞辞書（ｉ）に記憶された関連詞を比較し、関連詞辞書（ｉ）で新たに出現した新着関連詞があるか否かや関連詞辞書（ｉ）で消滅した消滅関連詞があるか否かなどを判定する処理）を行い、比較結果（例えば、新着関連詞等）を比較結果記憶手段（比較結果データ５４）に記憶する辞書比較手段（例えば、図２２に示す辞書比較処理部４６ｃ）とを備え、
異なる前記辞書に対応付けられたテキストデータ（例えば、関連詞辞書（ｉ−１）に記憶された関連詞の抽出元であるテキストデータ１と、関連詞辞書（ｉ）に記憶された関連詞の抽出元であるテキストデータ２）は、異なる収集条件（例えば、同じ検索条件によって検索された、異なる時間におけるテキストデータ、または、同じ時間において、異なる検索条件によって検索されたテキストデータ）によって収集されたテキストデータであり、
前記辞書比較手段は、複数の前記辞書のうち少なくとも１つが更新された場合に、前記比較処理を行い、前記比較結果記憶手段に記憶された比較結果を自動的に更新（例えば、上書き更新、または累積的に更新）するように構成された情報更新装置（例えば、図２２に示す情報更新部４６を含む情報更新装置）である。

本発明のこのような構成によって、例えば、テキストデータから、意味識別可能な文字列を抽出し、抽出された文字列を前記テキストデータに対応する辞書に記憶（異なる辞書に対応付けられたテキストデータは、異なる収集条件によって収集されたテキストデータである）し、辞書比較手段が複数の前記辞書を比較して、比較結果を自動的に比較結果記憶手段に記憶するので、異なる収集条件により収集されたテキストデータから、逐次、意味識別可能な文字列を自動的に抽出することができ、それらの文字列を記憶した辞書を比較することにより、最新の文字列等を把握することができるとともに、話題の変化を効果的に把握することがきる。

本発明の第６の実施の形態に係る特徴は、
前記辞書比較手段が、
前記比較処理において、複数の前記辞書における文字列の出現状況（例えば、関連詞辞書（ｉ−１）と関連詞辞書（ｉ）を比較した場合に、関連詞辞書（ｉ）で関連詞が新たに出現する状況、関連詞辞書（ｉ）で関連詞が消滅する状況等）に応じて、対応する文字列を前記比較結果として記憶するように構成されることである。

このように構成すれば、前記辞書比較手段が、前記比較処理において、複数の前記辞書における文字列の出現状況に応じて、対応する文字列を前記比較結果として記憶するので、例えば、（時系列において）後の関連詞辞書で新たに出現した関連詞や、後の関連詞辞書で消滅した関連詞等を、その出現状況に応じて把握することができる。

本発明の第６の実施の形態に係る特徴は、さらに、
前記文字列抽出手段が、
前記テキストデータから複数の前記文字列を抽出した場合に、当該複数の前記文字列を関連付けて、対応する前記辞書に記憶し（例えば、１つのテキストデータから抽出された複数の関連詞（共起関連詞）を、ランク付けして１レコードとして記憶する）、
前記辞書比較手段が、
前記比較処理において、複数の前記辞書で共通する文字列がある場合に、前記共通する文字列のそれぞれに関連付けられた文字列を比較する（例えば、関連詞の集合同士で共通性を判断する、すなわち、それぞれの共通関連詞の共起関連詞を比較する）ように構成されることである。

このように構成すれば、前記文字列抽出手段が、例えば、複数の文字列を関連付けて辞書に記憶し、前記比較処理が、前記比較処理において、複数の辞書で共通する文字列（共通関連詞）に関し、それぞれに関連付けられた文字列（近傍関連詞）についても比較を行うので、共通の文字列に関する共通性のレベル等についても把握することができる。

本発明の第６の実施の形態は、さらに、
テキストデータから、意味識別可能な文字列を抽出し、抽出された文字列を、前記テキストデータに対応する辞書に記憶する文字列抽出ステップと、
複数の前記辞書を比較する比較処理を行い、比較結果を比較結果記憶手段に記憶する辞書比較ステップとを備え、
異なる前記辞書に対応付けられたテキストデータは、異なる収集条件によって収集されたテキストデータであり、
前記辞書比較ステップは、複数の前記辞書のうち少なくとも１つが更新された場合に、前記比較処理を行い、前記比較結果記憶手段に記憶された比較結果を自動的に更新するように構成された情報更新方法である。
このように構成すれば、上記本発明の情報更新装置と同様の作用効果を奏する情報更新方法を提供できる。

本発明の第６の実施の形態は、さらに、
コンピュータに、
テキストデータから、意味識別可能な文字列を抽出し、抽出された文字列を、前記テキストデータに対応する辞書に記憶する文字列抽出手段、及び、
複数の前記辞書を比較する比較処理を行い、比較結果を比較結果記憶手段に記憶する辞書比較手段として機能させるプログラムであって、
異なる前記辞書に対応付けられたテキストデータは、異なる収集条件によって収集されたテキストデータであり、
さらに、前記辞書比較手段は、複数の前記辞書のうち少なくとも１つが更新された場合に、前記比較処理を行い、前記比較結果記憶手段に記憶された比較結果を自動的に更新するように構成される。
このように構成すれば、上記本発明の情報更新装置と同様の作用効果を奏するコンピュータで実行可能なプログラムを提供できる。

本発明の実施態様に係る効果は、会話制御システムを利用する複数のユーザの各々に対してカスタムを施して応答することができるとともに、施したカスタムが適切であるか否かを事前に検証することができることである。

また、本発明の他の実施態様に係る効果は以下の通りである。
本発明の第１の実施の形態における効果は、
話題と会話の流れに合わせた自然な応答を実現することができるとともに、話題制御ルールの変更、追加、修正などの保守作業を別個に行うことができることである。また、話題そのものと、その話題に関連する複数の関連詞を表示することができるので、話題リストから得た話題をベースに、その話題から遷移して様々な話題のバリエーションを表示できる。

本発明の第２の実施の形態における効果は、
サーバの負担を軽くできかつネットワークのトラフィックを少なくできるとともに、複数のユーザの状態に応じて的確に応答し、かつユーザとの会話の流れに合わせて円滑に会話を進めることができることである。

本発明の第４の実施の形態における効果は、
情報検索システムを利用するユーザに対して、既知でない最新の話題を取得しうるキーワード（文字列）を提供することができることである。

本発明の第５の実施の形態における効果は、
本発明に係る文解析装置によって、テキストデータと照合するデータベースを用いることなく、当該テキストデータから重要な文字列を抽出することができ、これによって、形態素データベースのようなデータベースを予め作成したり、維持・管理したりする必要がなくなることである。また、形態素に基づいた文字列の把握を行わないため、重要な文字列を、例えば、語といった単位以外にも、いくつかの語を含んだ句、節、それ以外の文の一部といった柔軟な態様で把握することができる。

また、本発明に係る文解析装置によって、テキストデータから同じ文字列が検索され、その文字列の前後の隣接文字の異なり度合いが判定され、当該異なり度合いにより、文字列の重要性が判断されるため、データベースへのアクセスやデータベースに記憶された形態素群との比較処理が行われず、テキストデータから重要な文字列が高速に抽出される。

さらに、本発明に係る文解析装置によって、上述のような、文字列の前後の隣接文字の異なり度合いにより、文字列の重要性が判断されるため、解析ロジック等の再構築を行うことなく、日本語以外の言語にも容易に対応できる。

本発明の第６の実施の形態における効果は、
本発明に係る情報更新装置によって、異なる収集条件により収集されたテキストデータから、逐次分解テキストデータを自動的に抽出することができ、その結果、膨大なテキストデータから、最新の分解テキストデータ等を把握できることである。テキストデータには、ネットワーク上において個人によって頻繁に作成・更新されるデータだけでなく、所定の機関等において日々、作成・更新されるデータ等も含まれうる。また、分解テキストデータの抽出が自動的に行われることにより、当該分解テキストデータの定義や作成に関する労力を大きく軽減することができる。

また、本発明に係る情報更新装置によって、異なる収集条件により収集されたテキストデータから、逐次分解テキストデータを自動的に抽出するとともに、こうして抽出された分解テキストデータを比較して、新たに出現した分解テキストデータを切り分けることができ、話題の把握等に関して価値の高い新規情報を瞬時に得ることができ、話題の変化を効果的に把握することがきる。また、消滅した分解テキストデータや再度出現した分解テキストデータなどを把握することもでき、これらの情報を必要とする多様なシステムに適用することができる。

さらに、本発明に係る情報更新装置によって、テキストデータから分解テキストデータを抽出する際に、そのテキストデータから抽出された複数の分解テキストデータを意味のある集合としてとらえ、分解テキストデータの出現状況と分解テキストデータの上記集合（共起関係）を関連付けることによって、話題の変化をより効果的に把握することができる。

話題提供システムの概要を示す図である。会話制御端末装置の概要を示す図である。保守装置の概要を示す図である。話題提供システム１のシステム構成の概略を示すブロック図である。シナリオデータのステートメントの具体的な処理を示すフローチャートである。シナリオデータのステートメントの具体的な処理を示すフローチャートである。シナリオデータのステートメントの具体的な処理を示すフローチャートである。シナリオデータのステートメントの具体的な処理を示すフローチャートである。シナリオデータのステートメントの具体的な処理を示すフローチャートである。シナリオデータのステートメントの具体的な処理を示すフローチャートである。シナリオデータのステートメントの具体的な処理を示すフローチャートである。シナリオデータのステートメントの具体的な処理を示すフローチャートである。出力部２２０に出力される例を示す図である。シナリオデータのステートメントの具体的な例を示す図である。話題解析に基づいて応答情報を生成して応答情報を出力部に出力する過程を示す図である。話題紹介リストの構成の例を示す図である。話題の抽出、関連詞辞書の生成及び嗜好辞書の生成の過程を示す図である。保守装置３の話題ネタ設定画面に話題が入力されて、前記関連詞辞書、前記話題リストに基づいて話題紹介リストを生成し出力するまでの処理の流れを示したものである。情報検索システムの技術的思想を説明するための図である。情報検索システムの概要を示す図である。情報検索システムの文解析部の概要を示す図である。情報検索システムの情報更新部の概要を示す図である。ＦＡＱ検索システムの画面遷移を示す図である。ＦＡＱ候補表示画面の表示処理を表すフローチャートである。情報検索システムの文解析処理の概要を示す図である。外部ログの一例を示す図である。関連詞辞書の一例を示す図である。情報検索システムの文字列検索処理を表すフローチャートである。サフィックスアレイと二分探索を用いた文字列検索の仕組みを示す図である。サフィックスアレイと二分探索を用いた文字列検索の仕組みを示す図である。情報検索システムの異なり度合い判定処理の処理手順を表すフローチャートである。前後の隣接文字の異なり度合いを判定するための仕組みを示す図である。ＦＡＱ表示画面の表示処理を表すフローチャートである。関連詞・共起語一覧画面の表示処理を表すフローチャートである。ＦＡＱ検索システムの画面の例を示す図である。ＦＡＱ検索システムの画面の例を示す図である。ＦＡＱ検索システムの画面の例を示す図である。嗜好データの例、及びＦＡＱ検索システムの画面の例を示す図である。情報検索システムの情報更新部の処理概要を示す図である。情報検索システムの情報更新部の文字列抽出処理の処理手順を表すフローチャートである。情報検索システムの情報更新部の辞書比較処理の処理手順を表すフローチャートである。情報検索システムの情報更新部の文字列抽出処理と辞書比較処理を示す図である。情報検索システムの情報更新部の文字列抽出処理と辞書比較処理を示す図である。情報検索システムの情報更新部の文字列抽出処理と辞書比較処理を示す図である。情報検索システムの情報更新部の文字列抽出処理と辞書比較処理を関連詞辞書の内容とともに示す図である。情報検索システムの情報更新部の辞書比較処理により記憶される比較結果データの内容を示す図である。情報検索システムの情報更新部の文字列抽出処理と辞書比較処理を関連詞辞書の内容とともに示す図である。情報検索システムの情報更新部の文字列抽出処理と辞書比較処理を関連詞辞書の内容とともに示す図である。情報検索システムの情報更新部の文字列抽出処理と辞書比較処理を関連詞辞書の内容とともに示す図である。本発明の情報検索システムに含まれる話題提供サーバを構成するコンピュータのハードウェア構成の例を示す図である。話題提供システムの他のシステム構成の概略を示すブロック図である。

以下に、本実施の形態について図面に基づいて説明する。

図１は、話題提供システム１の概要を示す図である。図２は、会話制御端末装置２の概要を示す図である。図３は、保守装置３の概要を示す図である。

＜＜＜話題提供システムの概要＞＞＞
図１に示すように、本実施の形態による話題提供システム１の特徴は、
ユーザが入力情報を入力するための入力部と、
前記入力情報を分析して入力特定情報を生成する入力情報分析部と、
話題に関する応答情報を規定するためのシナリオデータを抽出するシナリオデータ記憶部と、
前記シナリオデータと前記入力特定情報とに基づいて前記応答情報を決定する応答情報決定部と、
前記応答情報決定部によって決定された応答情報を出力する出力部と、を備えることである。

本実施の形態による話題提供システム１は、図１に示すように、主に、入力部と入力情報分析部とシナリオデータ記憶部と応答情報決定部と出力部とを備える。図１においては、これらの構成を実線の四角で示した。点線の四角で示した送信部と受信部と切替入力情報入力部とについては、後述する。図１において破線で囲んだ部分が、後述する図２に示す会話制御端末装置２の構成である。

入力部は、ユーザが入力情報を入力するための部材や部位である。入力部は、ユーザが所望する情報を入力情報として入力できるものであればよい。たとえば、入力部は、キーボードやタッチパネルやマイクロフォンやカメラなどがある。ユーザは、入力部からテキストデータや音声データや画像データなどを入力できる。入力部に入力された入力情報は、次に説明する入力情報分析部に供給される。入力情報は、後述する送信部を介して入力情報分析部に供給されるのが好ましい。

入力情報分析部は、入力情報を分析して入力特定情報を生成する。入力特定情報は、入力情報に含まれる各種の情報を分析した結果、生成される情報である。たとえば、特定のキーワード（後述する関連詞など）が入力情報に含まれる数や頻度などの統計的な分析などがある。さらに、入力情報の分析により、ユーザが入力した質問などからユーザの意思や嗜好を分析することができる。さらに、他のユーザとの比較により相対的な分析結果も取得することができる。さらにまた、分析用辞書などのデータを予め生成しておき、分析用辞書によって、入力情報を分析することもできる。入力情報分析部は、生成した入力特定情報を後述する応答情報決定部に供給する。

シナリオデータ記憶部は、シナリオデータを抽出するための部材や部位である。シナリオデータは、後述するシナリオデータ記憶部（複数のシナリオデータ）に予め記憶されているデータである。入力情報分析部によって生成された入力特定情報に基づいて必要であると判断されたシナリオデータが抽出されて、抽出されたシナリオデータがシナリオデータ記憶部に記憶される。シナリオデータ記憶部（複数のシナリオデータ）から抽出されたシナリオデータは、後述する受信部と応答情報決定部とを経てシナリオデータ記憶部に記憶される。

シナリオデータは、ユーザに提供する話題に関する応答情報を規定するためデータである。すなわち、シナリオデータには、ユーザに提供するための話題の情報が含まれている。

さらに、シナリオデータには、複数の話題の情報からなる話題紹介リストも含まれる。話題紹介リストはユーザに提供される。ユーザは、提供された話題紹介リストに含まれる話題を選択することで、入力情報の入力の代替の情報にすることができる。ユーザは、選択操作で会話を進めることができるので、文字を入力する場合に比べて、ユーザの入力操作を簡素にすることができ、会話を円滑に進めることができる。

また、話題紹介リストによって複数の話題をユーザに提供することができ、ユーザは、各種の話題を知得でき、興味の範囲を広げることができる。

さらに、シナリオデータは、ユーザに挨拶をするための情報を含むものが好ましい。単に、ユーザに話題を提供するための情報のみならず、挨拶をするための情報をシナリオデータに含めることにより、ユーザと挨拶をすることができ会話をより自然なものにすることができる。

シナリオデータは、話題提供システム１の契約者がユーザに提供したい情報を含めて事前に作成しておくデータである。シナリオデータによって、ユーザに提供したい情報を規定することができる。

さらに、シナリオデータは複数のステートメントからなる。ステートメントには、出力用情報や出力用コマンドや制御コマンドなどが含まれる。

出力用情報は、出力部で出力される情報である。出力用情報には、話題の情報や挨拶の情報などが含まれる。話題の情報や挨拶の情報は、ユーザに提供してユーザとの会話を進めるための情報である。

出力用コマンドは、話題の情報や挨拶の情報を出力部に出力するとき、出力の仕様を制御するためのコマンドである。たとえば、画面を消去したり、改行したり、出力している時間を制御したり、所定の画像を表示したりするためのコマンドである。

制御コマンドは、ステートメントを制御するための判断や、話題名（たとえば、テーマなど）を切り替えたり、状態制御指標を変更したりするためのコマンドである。特に、判断は、時間や時刻によって分岐させるための判断や、状態制御指標の内容によって、分岐させるための判断などがある。判断によって分岐させることによって、所定のステートメントに遷移させることができる。

なお、本実施の形態では、ステートメントの各々を区別する必要がない場合には、ステートメントはシナリオデータと同義である。

なお、単一のステートメントに、出力用情報と出力用コマンドと制御コマンドとの全てを含める必要はない。たとえば、所定のステートメントを出力用情報のみで構成したり、出力用コマンドのみで構成したり、制御コマンドのみで構成したりすることができる。

このように、ステートメントには、単に、ユーザに提供する情報のみならず、各種のコマンドも含まれる。これにより、出力部において、話題の情報や挨拶の情報をさまざまな仕様で出力することができ、会話を自然にかつ円滑に進めることができる。

上述したように、シナリオデータ（ステートメント）には、出力用情報や出力用コマンドや制御コマンドなどが含まれている。出力用情報や出力用コマンドや制御コマンドを適宜規定することによって、話題制御ルールを構築することができる。特に、話題提供システム１の契約者がユーザに提供したい各種の情報（話題）をシナリオデータに含めることにより、契約者が所望する話題制御ルールを構築することができる。

シナリオデータは、契約者が提供したい情報について適宜規定すればよいので、話題提供システム１の全般に亘る高度かつ専門的な知識や技術に依存することなく、話題制御ルールの変更、追加、修正などの保守作業を別個に行うことができる。

応答情報決定部は、応答情報を決定する。応答情報は、上述した入力情報分析部から供給されたシナリオデータと入力特定情報とに基づいて決定される。すなわち、ユーザが入力した入力情報を分析して得られた入力特定情報を用いて応答情報を決定する。したがって、シナリオデータによって話題提供システム１の契約者の意思を応答情報に反映させることができるとともに、入力特定情報によってユーザの意思を応答情報に反映させることができ、会話の主体の双方の意思を反省させて応答情報を生成することができる。話題提供システム１の契約者とユーザとのバランスを図って会話を円滑に進めることで自然な応答を実現することができる。

応答情報には、シナリオデータのステートメントが含められる。ステートメントに含まれるユーザに提供する出力用情報のみならず、出力用コマンドなどの各種のコマンドも応答情報に含めることができる。このようにすることで、話題の情報や挨拶の情報をさまざまな仕様で出力部から出力することができる。

出力部は、応答情報決定部によって決定された応答情報を出力する。ユーザは、出力部から出力された応答情報を認識することによって、話題が提供される。

このように、本実施の形態による話題提供システム１は、出力部に出力される応答情報によってユーザに各種の話題を提供することができる。すなわち、本実施の形態による話題提供システム１は、入力情報から入力特定情報を生成し、シナリオデータと入力特定情報とから応答情報を決定し、応答情報の出力によってユーザに各種の話題を提供する。

本実施の形態による話題提供システム１は、シナリオデータ（たとえば、後述するステートメントや話題紹介リストなど）と、入力情報分析部によって分析された入力特定情報とによって応答情報を決定するので、話題と会話の流れとに合わせた自然な応答を実現することができる。

さらに、図１に示すように、本実施の形態による話題提供システム１の特徴は、
前記入力情報及び前記応答情報に関する状態制御指標を記憶する状態制御指標記憶部をさらに備え、
前記応答情報決定部は、前記シナリオデータ及び前記入力特定情報のほかに前記状態制御指標を加えて前記応答情報を決定することである。

話題提供システム１は、状態制御指標記憶部を備える。状態制御指標記憶部は、状態制御指標を記憶する。状態制御指標は、入力情報と応答情報とに関する指標である。状態制御指標は、主に会話の履歴に基づく指標であり、さらには、会話の履歴に基づいて判別できるユーザの感情や性格なども示す指標である。たとえば、ユーザが過去に入力した入力情報に基づいて定められる指標や、過去にユーザに提供した応答情報に基づいて定められる指標などがある。さらに、過去にユーザに提供した応答情報に対するユーザの入力から得られるユーザの感情や性格などを示す指標などもある。

応答情報決定部は、シナリオデータ及び入力特定情報のほかに状態制御指標を加えて応答情報を決定する。このように、状態制御指標も用いて応答情報を決定するので、ユーザとの過去の会話や、会話から得られたユーザの感情や性格なども踏まえて話題を提供したり会話を進めたりすることができる。したがって、同じ話題を重複してユーザに提供したり、飛躍した話題をユーザに提供したりすることを防止でき、ユーザの感情や性格などにあわせた円滑な会話を進めることができる。

本実施の形態において、状態制御指標記憶部は、会話制御端末装置２に備えられている。状態制御指標は、応答情報決定部によって決定されたり変更されたりするのが好ましい。状態制御指標は、シナリオデータと入力特定情報とに基づいて応答情報決定部によって決定されるのが好ましい。

本実施の形態による話題提供システム１は、シナリオデータ及び入力特定情報のほかに状態制御指標を使って応答情報を決定するので、より話題と会話の流れとに合わせた自然な応答を実現することができる。

さらにまた、図１に示すように、本実施の形態による話題提供システム１の特徴は、
前記シナリオデータは、異なる話題への遷移を規定する情報（たとえば、後述する話題切替情報など）を含み、
前記異なる話題への遷移を規定する情報に応じて、現在の話題に関する応答情報を規定するためのシナリオデータから、異なる話題に関する応答情報を規定するためのシナリオデータへ、シナリオデータを切り替える話題切替部を、さらに備えることである。

本実施の形態では、話題切替部は、切替入力情報入力部と入力情報分析部とを含む。話題切替部は、シナリオデータ及び入力特定情報に基づいて、シナリオデータを切り替えるか否かを判断する。具体的には、状態制御指標に基づいてシナリオデータを切り替えるのが好ましい。切替入力情報入力部は、話題切替入力情報が後述する送信部に送信され、入力情報分析部に供給される。入力情報分析部は、入力情報のほかに話題切替入力情報にも基づいて、シナリオデータ記憶部（複数のシナリオデータ）に記憶されているシナリオデータを抽出する。

シナリオデータは、異なる話題（話題名）への遷移を規定する情報を含む。話題切替部は、シナリオデータを切り替える。この切り替えは、現在の話題に関する応答情報を規定するためのシナリオデータから、異なる話題に関する応答情報を規定するためのシナリオデータへ切り替えるものである。

たとえば、サーバなどに全てのシナリオデータを記憶させておき、異なる話題への遷移を規定する情報に基づいてサーバの全てのシナリオデータから組み替え直したシナリオデータを生成し、組み替え直されたシナリオデータがシナリオデータ記憶部に記憶される。このシナリオデータの組み替えは、複数のステートメントの組み合せを話題名に応じて定めることで実行できる。

したがって、ユーザとの会話で一の話題から他の話題に移った場合も、異なる話題への遷移を規定する情報にしたがって他の話題に遷移させることができ、あらゆる話題に対応することができ、様々なユーザに対応することができる。組み替えたシナリオデータによって他の話題をユーザに提供することができる。

また、話題ごと（話題名）にシナリオデータを準備すればよいので、シナリオデータの保守が容易になる。具体的には、シナリオデータに変更が必要になった場合には、そのシナリオデータのみを修正すればよい。また、新たな話題が必要になった場合には、そのシナリオデータのみを追加すればよい。さらに、古い話題となって必要でなくなった場合には、そのシナリオデータのみを削除すればよい。

シナリオデータは、契約者が提供したい情報について、話題ごと（話題名）に適宜規定すればよいので、話題が増えた場合であっても、話題提供システム１の全般に亘る高度かつ専門的な知識や技術に依存することなく、話題制御ルールの変更、追加、修正などの保守作業を話題ごとに行うことができる。

異なる話題への遷移を規定する情報を有するので、このようなシナリオデータの更新があった場合でも、シナリオデータの遷移の整合を容易に図ることができる。

たとえば、状態制御指標のうち、後述する性格指標に基づいて話題を切り替えるか否かを判断するのが好ましい。性格指標は、ユーザが、話題に対して積極的であるのか又は消極的であるのかを示す指標である。

本実施の形態による話題提供システム１は、シナリオデータを使って話題を切り替えることができるので、話題と会話との流れに合わせた自然な応答を実現することができる。

図１において点線の四角で示した送信部と受信部と切替入力情報入力部とについて説明する。本実施の形態による話題提供システム１は、これらの送信部と受信部と切替入力情報入力部とを備えることができる。

また、図１に示した送信部は、入力情報を外部に送信するための装置や部材である。入力情報を外部に送信するものであればよい。外部は、たとえば、サーバや、会話制御端末装置２などにすることができる。

さらに、図１に示した受信部は入力特定情報を受信するための装置や部材である。入力特定情報は、外部で生成される。すなわち、受信部は、外部で生成された入力特定情報を受信する装置や部材である。外部では、送信部から送信された入力情報を分析して入力特定情報を生成し、生成された入力特定情報は受信部に送信される。

さらにまた、図１に示した切替入力情報入力部は、異なる話題への遷移を規定する情報に応じて話題切替入力情報（たとえば、後述する性格指標など）を生成する。異なる話題への遷移を規定する情報は、シナリオデータに含まれる情報であり、たとえば、後述する話題切替情報などがある。

上述した話題切替部は、入力情報分析部と切替入力情報入力部とを含むのが好ましい。入力情報に基づいて、話題切替入力情報を生成するので、ユーザの意思を反映させた話題に遷移させることができる。

また、図１に示したシナリオデータ記憶部（複数のシナリオデータ）は、複数のシナリオデータを記憶する。ここで、複数のシナリオデータは、ユーザと会話をするために必要な話題名に対応する全てのシナリオデータである。全てのシナリオデータのうち、入力特定情報に基づいて必要であると判断されたシナリオデータが抽出される。

＜＜＜会話制御端末装置２の概要＞＞＞
図２に示すように、本実施の形態による会話制御端末装置２の特徴は、
ユーザが入力情報を入力するための入力部と、
話題に関する応答情報を規定するためのシナリオデータを記憶するシナリオデータ記憶部と、
前記入力情報及び前記応答情報に関する状態制御指標を記憶する状態制御指標記憶部と、
前記シナリオデータと前記状態制御指標とに基づいて前記応答情報を決定する応答情報決定部と、
前記応答情報決定部によって決定された応答情報を出力する出力部と、を備えることである。

本実施の形態による会話制御端末装置２は、図２に示すように、主に、入力部とシナリオデータ記憶部と状態制御指標記憶部と応答情報決定部と出力部とを備える。図２においては、これらの構成を実線の四角で示した。図２において大きく破線で囲んだ部分が、会話制御端末装置２の構成である。なお、点線の四角で示したシナリオデータ記憶部（複数のシナリオデータ）と入力情報分析部とは、話題提供サーバ４に含まれる構成である。

入力部は、本実施の形態による話題提供システム１の入力部と同様に、ユーザが入力情報を入力するための部材や部位である。入力部は、ユーザが所望する情報を入力情報として入力できるものであればよい。たとえば、入力部は、キーボードやタッチパネルやマイクロフォンやカメラなどがある。ユーザは、入力部からテキストデータや音声データや画像データなどを入力できる。入力部に入力された入力情報は、次に説明する入力情報分析部に供給される。入力情報は、後述する送信部を介して入力情報分析部に供給されるのが好ましい。

シナリオデータ記憶部は、シナリオデータを記憶するための部材や部位である。シナリオデータは、図２に示す話題提供サーバ４のシナリオデータ記憶部（複数のシナリオデータ）に予め記憶されているデータである。入力情報分析部によって生成された入力特定情報に基づいて必要であると判断されたシナリオデータが抽出されて、抽出されたシナリオデータがシナリオデータ記憶部に記憶される。シナリオデータ記憶部（複数のシナリオデータ）から抽出されたシナリオデータは、後述する受信部と応答情報決定部とを経てシナリオデータ記憶部に記憶される。

シナリオデータは、ユーザに提供する話題に関する応答情報を規定するためデータである。シナリオデータには、ユーザに提供するための話題の情報が含まれている。なお、会話制御端末装置２で用いるシナリオデータの構成や機能などについては、本実施の形態による話題提供システム１のシナリオデータと同じである。

本実施の形態による会話制御端末装置２は、状態制御指標記憶部を備える。状態制御指標記憶部は、状態制御指標を記憶する。状態制御指標は、主に会話の履歴に基づく指標であり、さらには、会話の履歴に基づいて導くことができるユーザの感情や性格なども示す指標である。たとえば、ユーザが過去に入力した入力情報に基づいて定められる指標や、過去にユーザに提供した応答情報に基づいて定められる指標などがある。さらに、過去にユーザに提供した応答情報に対するユーザの入力から導くことができるユーザの感情や性格なども示す指標などもある。

このように、本実施の形態においては、会話制御端末装置２が状態制御指標記憶部を備える。すなわち、会話制御端末装置２の外部、たとえば、話題提供サーバ４などが状態制御指標記憶部を備える構成ではない。したがって、本実施の形態では、話題提供サーバ４などの外部の装置によって、ユーザとの会話が制御されるのではなく、会話制御端末装置２によってユーザとの会話が制御される。

応答情報決定部は、話題提供サーバ４の入力情報分析部から供給されたシナリオデータと状態制御指標とに基づいて応答情報を決定する。シナリオデータによって話題提供システム１の契約者の意思を応答情報に反映させることができる。

さらに、状態制御指標を用いて応答情報を決定するので、ユーザとの過去の会話や、会話から得られたユーザの感情や性格なども踏まえて話題を提供したり会話を進めたりすることができる。したがって、同じ話題を重複してユーザに提供したり、飛躍した話題をユーザに提供したりすることを防止でき、より円滑な会話を進めることで自然な応答を実現することができる。

状態制御指標は、応答情報決定部によって決定されたり変更されたりするのが好ましい。状態制御指標は、シナリオデータと入力特定情報とに基づいて応答情報決定部によって決定されるのが好ましい。

本実施の形態による会話制御端末装置２は、会話制御端末装置２にシナリオデータ記憶部と状態制御指標記憶部との双方を設けて応答情報を決定するので、ユーザとの会話が可能であるか否かを会話制御端末装置２で判断して制御でき、会話制御端末装置２における処理の負担を著しく増加させることなく、かつ、サーバの負担も増加させることなく、さらに、ネットワークのトラフィックも増加させることなく、ユーザとの会話の流れに合わせて円滑に会話を進めることができる。

さらに、本実施の形態による会話制御端末装置２は、シナリオデータと状態制御指標とに基づいて応答情報を決定するので、ユーザとの会話の進行状態に応じて応答情報を決定でき、サーバの負担を増大させることなく、ユーザの状態に応じて的確に応答することができる。

さらに、図２に示すように、本実施の形態による会話制御端末装置２の特徴は、
前記入力情報を外部に送信する送信部と、
送信された入力情報を分析して生成された入力特定情報を受信する受信部と、をさらに備え、
前記応答情報決定部は、前記シナリオデータ及び前記状態制御指標に前記入力特定情報を加えて前記応答情報を決定することである。

本実施の形態による会話制御端末装置２は、送信部と受信部とをさらに備える。

送信部は、入力情報を外部に送信する。入力情報を会話制御端末装置２の外部に送信するものであればよい。外部は、たとえば、サーバや、他の会話制御端末装置２などにすることができる。

受信部は、入力特定情報を受信する。入力特定情報は、会話制御端末装置２の外部で生成される。すなわち、受信部は、会話制御端末装置２の外部で生成された入力特定情報を受信する装置や部材である。会話制御端末装置２の外部では、送信部から送信された入力情報を分析して入力特定情報を生成し、生成された入力特定情報は、会話制御端末装置２の受信部に送信される。

応答情報決定部は、シナリオデータ及び状態制御指標に入力特定情報を加えて応答情報を決定する。ユーザが入力した入力情報を分析して得られた入力特定情報も含めて応答情報を決定する。したがって、シナリオデータによって話題提供システム１の契約者の意思を応答情報に反映させることができるとともに、入力特定情報によってユーザの意思を応答情報に反映させることができ、会話の主体の双方の意思を反省させて応答情報を生成することができる。話題提供システム１の契約者とユーザとのバランスを図って会話を円滑に進めることで自然な応答を実現することができる。

本実施の形態による会話制御端末装置２は、入力特定情報を加えて応答情報を決定するので、サーバなどの外部で分析した結果である入力特定情報を含めて応答情報を決定でき、ユーザとの会話の流れに合わせて円滑に会話を進めることができる。

さらにまた、図２に示すように、本実施の形態による会話制御端末装置２の特徴は、
前記受信部は前記入力情報に基づいて抽出されたシナリオデータを受信し、
前記シナリオデータ記憶部は受信したシナリオデータを記憶することである。

本実施の形態による会話制御端末装置２の受信部は、入力情報に基づいて抽出されたシナリオデータを受信する。すなわち、シナリオデータは、会話制御端末装置２の外部で抽出される。会話制御端末装置２の外部に送信された入力情報に基づき、会話制御端末装置２の外部において、入力情報に基づいてシナリオデータは抽出される。抽出されたシナリオデータは、会話制御端末装置２の受信部に送信される。

シナリオデータ記憶部は、会話制御端末装置２の受信部で受信したシナリオデータを記憶する。上述したように、会話制御端末装置２で用いるシナリオデータの構成や機能などについては、本実施の形態による話題提供システム１のシナリオデータと同じである。

本実施の形態による会話制御端末装置２は、入力情報に基づいて抽出されたシナリオデータを受信するので、ユーザが入力した入力情報に基づいてシナリオデータを切り替えていくことができ、ユーザとの会話の流れに合わせて円滑に会話を進めることができる。

さらに、図２に示すように、本実施の形態による会話制御端末装置２の特徴は、
前記シナリオデータは、異なる話題への遷移を規定する情報（たとえば、後述する話題切替情報など）を含み、
前記異なる話題への遷移を規定する情報に応じて話題切替入力情報（たとえば、後述する性格指標など）を生成する切替入力情報入力部を備え、
前記送信部は、前記話題切替入力情報を外部に送信し、
前記受信部は、前記話題切替入力情報に基づいたシナリオデータを受信することである。

本実施の形態による会話制御端末装置２で用いるシナリオデータは、異なる話題への遷移を規定する情報を含む。

本実施の形態による会話制御端末装置２は、切替入力情報入力部を備える。切替入力情報入力部は、異なる話題への遷移を規定する情報に応じて話題切替入力情報を生成する。異なる話題への遷移を規定する情報は、たとえば、後述するステートメントの要素である話題切替情報などがある。また、話題切替入力情報は、たとえば、後述する性格指標などがある。

切替入力情報入力部は、シナリオデータ及び入力特定情報に基づいて、シナリオデータを切り替えるか否かを判断する。具体的には、状態制御指標に基づいてシナリオデータを切り替えるのが好ましい。切替入力情報入力部は、話題切替入力情報が送信部に送信され、入力情報分析部に供給される。入力情報分析部は、入力情報のほかに話題切替入力情報にも基づいて、話題提供サーバ４のシナリオデータ記憶部（複数のシナリオデータ）に記憶されているシナリオデータを抽出する。

さらに、本実施の形態による会話制御端末装置２の送信部は、話題切替入力情報を外部に送信する。また、受信部は、話題切替入力情報に基づいたシナリオデータを受信する。

現在の話題に関する応答情報を規定するためのシナリオデータから、異なる話題に関する応答情報を規定するためのシナリオデータへ切り替えることができる。

たとえば、サーバなどに全てのシナリオデータを記憶させておき、話題切替入力情報に基づいてサーバの全てのシナリオデータから組み替え直したシナリオデータを生成し、組み替え直されたシナリオデータが会話制御端末装置２のシナリオデータ記憶部に記憶される。

したがって、ユーザとの会話で一の話題から他の話題に移った場合も、異なる話題への遷移を規定する情報にしたがって他の話題に遷移させることができ、あらゆる話題に対応することができ、様々なユーザに対応することができる。

状態制御指標のうち、後述する性格指標に基づいて話題を切り替えるか否かを判断するのが好ましい。性格指標は、ユーザが、話題に対して積極的であるのか又は消極的であるのかを示す指標である。

本実施の形態による会話制御端末装置２によれば、状態制御指標とシナリオデータとに基づいて話題を切り替えることができるので、ユーザとの会話の状態を見ながら話題を切り替ることができ、ユーザとの会話の流れに合わせて円滑に会話を進めることができる。

図２に示した入力情報分析部は、入力情報を分析して入力特定情報を生成する。入力特定情報は、入力情報に含まれる各種の情報を分析した結果、生成される情報である。たとえば、特定のキーワード（後述する関連詞など）が入力情報に含まれる数や頻度などの統計的な分析などがある。

また、図２に示したシナリオデータ記憶部（複数のシナリオデータ）は、複数のシナリオデータを記憶する。ここで、複数のシナリオデータは、ユーザと会話をするために必要な話題名に対応する全てのシナリオデータである。全てのシナリオデータのうち、入力特定情報に基づいて必要であると判断されたシナリオデータが抽出される。

＜＜＜保守装置３の概要＞＞＞
図３に示すように、本実施の形態による保守装置３の特徴は、
ユーザが入力する入力情報を分析することによって生成された入力特定情報に基づいて話題に関わる応答情報を規定するためのシナリオデータを記憶するシナリオデータ記憶部と、
前記入力特定情報を受信する受信部と、
前記シナリオデータを編集可能にするためのシナリオデータ編集部と、
前記受信部で受信した入力特定情報に基づいて編集したシナリオデータの応答を検証可能にするシナリオデータ検証部と、
編集したシナリオデータを外部に送信するシナリオデータ送信部と、を備えることである。

本実施の形態による保守装置３は、図３に示すように、主に、シナリオデータ記憶部と受信部とシナリオデータ編集部とシナリオデータ検証部とシナリオデータ送信部とを備える。図３においては、これらの構成を実線の四角で示した。なお、点線の四角で示したシナリオデータ記憶部（複数のシナリオデータ）と入力情報分析部とは、話題提供サーバ４（図２参照）に含まれる構成である。図３に示すように、シナリオデータ検証部に状態制御指標記憶部を加えたものが、後述する端末装置仮想構築部を構成する。これらの構成の間で授受される情報は、上述した話題提供システム１や会話制御端末装置２と同様である。

上述した話題提供システム１や会話制御端末装置２は、主として、一般のユーザが会話制御端末装置２と会話をするためのものである。これに対して、保守装置３は、主として、話題提供システム１の契約者が使用するものであり、一般のユーザに話題を提供するためのシナリオデータの保守を話題提供システム１の契約者が行うための装置である。保守装置３は、このような相違があるが、図３において、話題提供システム１や会話制御端末装置２と同様の機能を有し同様のデータを用いる構成には、同じ名称を付した。

この保守装置３におけるシナリオデータ記憶部及び受信部は、上述した話題提供システム１や会話制御端末装置２におけるシナリオデータ記憶部及び受信部と機能的に実質的に同じものである。話題提供システム１や会話制御端末装置２と同じものにすることができる。たとえば、ユーザが使用すると想定される会話制御端末装置２に保守装置３のシナリオデータ記憶部及び受信部を実装してもよい。さらに、後述するように、保守装置３において会話制御端末装置２を仮想的に構築し、仮想的な会話制御端末装置２のシナリオデータ記憶部及び受信部としてもよい。

シナリオデータ記憶部は、シナリオデータを記憶するための部材や部位である。シナリオデータは、話題提供サーバ４（図２参照）のシナリオデータ記憶部（複数のシナリオデータ）に予め記憶されているデータである。入力情報分析部によって生成された入力特定情報に基づいて必要であると判断されたシナリオデータが抽出されて、抽出されたシナリオデータがシナリオデータ記憶部に記憶される。シナリオデータ記憶部（複数のシナリオデータ）から抽出されたシナリオデータは、後述する受信部と応答情報決定部とを経てシナリオデータ記憶部に記憶される。

シナリオデータは、入力特定情報に基づいて話題に関わる応答情報を規定するためのデータである。入力特定情報は、入力情報を分析することによって生成された情報である。入力情報は、たとえば、会話制御端末装置２においてユーザが入力する情報である。

なお、上述したように、保守装置３は、主として、話題提供システム１の契約者が使用するものである。この保守装置３においては、入力情報は、仮想的にユーザが入力した情報とすることができる。保守装置３は、ユーザに対してシナリオデータを利用可能にする前にシナリオデータを検証するためのものである。したがって、ここでのユーザは、仮想的なユーザでよく、また、実際のユーザが入力するであろうと想定される情報を入力情報とすればよい。したがって、想定される様々な入力情報を用いて入力特定情報を生成し、後述するシナリオデータ検証部によってシナリオデータの応答を検証することができる。

シナリオデータには、ユーザに提供するための話題の情報が含まれている。保守装置３で用いるシナリオデータの構成や機能などについては、上述した本実施の形態による話題提供システム１のシナリオデータや、会話制御端末装置２のシナリオデータと同じである。

なお、シナリオデータの構成や機能などについては、話題提供システム１や会話制御端末装置２におけるシナリオデータと同じではあるが、上述したように、保守装置３は、ユーザに対してシナリオデータを利用可能にする前にシナリオデータを検証するためのものである。したがって、保守装置３が対象とするシナリオデータは、検証するためのシナリオデータであり、ユーザに対してシナリオデータを利用可能にする前のデータである。

受信部は、入力特定情報を受信する。入力特定情報は、保守装置３の外部で生成される。すなわち、受信部は、保守装置３の外部で生成された入力特定情報を受信する装置や部材である。保守装置３の外部で、入力情報を分析して入力特定情報を生成し、保守装置３の外部で生成された入力特定情報が、保守装置３の受信部に送信される。

上述したように、入力情報は、仮想的にユーザが入力した情報とすることができる。したがって、ここでの入力特定情報は、実際のユーザが入力するであろうと想定される情報を入力情報として、保守装置３の外部で生成されたものにすることができる。このように、実際のユーザが入力するであろうと想定される情報を入力情報にすることで、様々な入力情報に基づいてシナリオデータを検証することができる。

シナリオデータ編集部は、シナリオデータを編集可能にするための装置や部材である。シナリオデータは、話題提供システム１の契約者の担当者がキーボードなどを操作することによって、編集することができる。編集は、シナリオデータの追加、削除、変更などである。具体的には、編集は、シナリオデータを構成するステートメントを追加したり、削除したり、変更したりする工程である。シナリオデータの編集により、複数のユーザの各々に対してシナリオデータのカスタムを施すことができる。

シナリオデータ検証部は、シナリオデータの応答を検証可能にするための装置や部材である。ここでのシナリオデータは、編集したシナリオデータである。シナリオデータ編集部で編集したシナリオデータの応答が適切であるか否かを検証するための装置や部材である。

このように、シナリオデータ検証部は、想定される様々な入力情報を用いて入力特定情報を生成し、シナリオデータ編集部によって編集されたシナリオデータの応答を検証することができる。このため、あらゆるユーザに対してシナリオデータの応答が適切であるか否かを検証できるので、シナリオデータ編集部により複数のユーザの各々に対して施したシナリオデータのカスタムを検証することができる。

シナリオデータ送信部は、編集したシナリオデータを外部に送信する。外部は、たとえば、サーバや、他の会話制御端末装置２などにすることができる。このように、編集したシナリオデータを外部に送信することによって、検証済みのシナリオデータをユーザに対して利用可能にすることができる。

なお、上述したように、仮想的にユーザが入力した情報を入力情報として、シナリオデータ編集部でシナリオデータを編集したり、シナリオデータ検証部がシナリオデータを検証する例を示したが、後述するように、話題解析部によって話題リストを生成し、話題リストに基づくシナリオデータを編集したり検証したりすることができる。話題解析部については後述する。

シナリオデータ検証部によって、シナリオデータ編集部で編集したシナリオデータの応答が適切であるか否かを検証する。このようにしたことにより、サーバなどの外部にシナリオデータを送信する前に、シナリオデータの内容や整合性を確認することができる。サーバなどの外部に送信された検証済みのシナリオデータは、最終的には、少なくともその一部が会話制御端末装置２に送信され、ユーザとの会話に用いられる。

さらに、図３に示すように、本実施の形態による保守装置３の特徴は、
ユーザが入力情報を入力するための入力部と、
前記入力情報及び前記応答情報に関する状態制御指標を記憶する状態制御指標記憶部と、
前記シナリオデータと前記状態制御指標とに基づいて前記応答情報を決定する応答情報決定部と、
前記応答情報決定部によって決定された応答情報を出力する出力部と、を備える会話制御端末装置を仮想的に構築する端末装置仮想構築部を有することである。

本実施の形態による保守装置３は、図３に示すように、端末装置仮想構築部を有する。この端末装置仮想構築部によって、会話制御端末装置２’が仮想的に構築される。

さらに、本実施の形態による保守装置３は、図３に示すように、シナリオデータ検証部を有する。このシナリオデータ検証部に状態制御指標記憶部を加えたものが、端末装置仮想構築部を構成する。

このように、保守装置３には、会話制御端末装置２’が機能として備えられている。シミュレーション用のパッケージとして会話制御端末装置２’の機能を保守装置３に備えることができる。あるいは、仮想的に構築された会話制御端末装置２’から保守機能を省いたものを、実際の会話制御端末装置２とすることもできる。仮想的に構築される会話制御端末装置２’は、ハードウェアとして実現してもソフトウェアで実現してもよい。ハードウェアとして実現する場合には、実際の会話制御端末装置２とは異なる別個の装置を仮想的に構築される会話制御端末装置２’とすればよい。また、ソフトウェアで実現する場合には、保守装置３においてエミュレーションなどによって会話制御端末装置２’を実現させればよい。

保守装置３は、主として、話題提供システム１の契約者が使用するものであり、一般のユーザに話題を提供するためのシナリオデータの保守をするための装置であればよい。

端末装置仮想構築部及びシナリオデータ検証部は、図３に示すように、主に、入力部と応答情報決定部と出力部と、を備える。さらに、端末装置仮想構築部は、状態制御指標記憶部を備える。

入力部は、ユーザが入力情報を入力するための部材や部位である。入力部は、ユーザが所望する情報を入力情報として入力できるものであればよい。たとえば、入力部は、キーボードやタッチパネルやマイクロフォンやカメラなどがある。ユーザは、入力部からテキストデータや音声データや画像データなどを入力できる。

上述したように、ここで、入力情報は、仮想的にユーザが入力した情報でよい。ユーザも、仮想的なユーザでよく、また、実際のユーザが入力するであろうと想定される情報を入力情報とすればよい。

状態制御指標記憶部は、状態制御指標を記憶する。状態制御指標は、入力情報と応答情報とに関する指標である。状態制御指標は、主に履歴に関する指標である。たとえば、ユーザが過去に入力した入力情報に関する指標や、ユーザに過去に提供した応答情報に関する指標などがある。

応答情報決定部は、シナリオデータ及び入力特定情報のほかに状態制御指標を加えて応答情報を決定する。

出力部は、応答情報決定部によって決定された応答情報を出力する。

このように、仮想的に構築される会話制御端末装置２’で、編集したシナリオデータを使用したり、検証済みのシナリオデータを使用したりすることができ、ユーザに対して利用可能にするよりも前に、シナリオデータの内容や制御を確認することができる。ユーザに適切な話題を提供することができる。

端末装置仮想構築部は、会話制御端末装置２’を保守装置３において仮想的に構築して実行することができる。したがって、一般のユーザが使用する会話制御端末装置２と同様の環境を保守装置３において実現することができる。これにより、ユーザが実際に会話を進める環境と同様の環境で、シナリオデータの内容や動作を予め確認することができ、ユーザと会話をする前にシナリオデータの内容を検証することができ、サーバに接続してくる複数のユーザの各々に対して施したカスタムが適切であるか否かを事前に検証することができる。

さらに、図３に示すように、本実施の形態による保守装置３の特徴は、
話題を関係付ける関連詞を介して話題の近さや繋がり方を付与した話題リストを生成するための話題解析部を、さらに備え、
前記シナリオデータ編集部は、前記話題リストと前記関連詞を利用してユーザに話題を紹介するための話題紹介シナリオおよびユーザの入力に応答するための入力関連シナリオを前記シナリオデータとして編集可能にすることである。

本実施の形態による保守装置３は、話題解析部（図示せず）を備える。話題解析部は、話題リストを生成するための装置や部材である。話題リストは、話題を関係付ける関連詞を介して話題の近さや繋がり方を付与したデータである。話題解析部によって、話題に関連付けられる関連詞が話題リストに蓄積されていく。保守装置３においては、話題リストは、話題提供システム１の契約者に提供されるデータであり、シナリオデータを生成する際に用いられる。

たとえば、保守装置３の出力部には、後述する図１７に示すように、話題リストが出力される。話題提供システム１の契約者は、保守装置３の出力部に出力された話題リストを参照して、ユーザに提供するための話題紹介シナリオのデータ及び入力関連シナリオのデータを構築することができる。このようにすることで、話題提供システム１の契約者は、容易かつ簡便に話題紹介シナリオのデータ及び入力関連シナリオのデータを構築することができる。

シナリオデータ編集部は、話題紹介シナリオと入力関連シナリオとをシナリオデータとして編集可能にする。話題紹介シナリオ及び入力関連シナリオは、話題リスト及び関連詞によって編集可能にされる。話題リスト及び関連詞を用いて編集できるので、容易かつ簡便に入力関連シナリオを構築できる。

話題紹介シナリオは、ユーザに話題を紹介するためのシナリオである。ユーザは、話題紹介シナリオによって話題が提供される。入力関連シナリオは、ユーザの入力に応答するためのシナリオである。ユーザが所定の情報、たとえば挨拶などの情報を入力すると入力関連シナリオによって、対応する挨拶などの情報がユーザに回答される。

このシナリオデータ編集部によって、話題提供システム１の契約者は、話題紹介シナリオと入力関連シナリオとを編集して所望するものにできる。

話題リストは、各種のログ、たとえば、ツイッターやブログなどの取得可能なデータに基づいて、更新することができる。すなわち、話題リストには、最新の情報を関連詞として蓄積していくことができる。このため、話題リストに基づいて話題紹介シナリオ及び入力関連シナリオを編集したり検証したりする際に、話題提供システム１の契約者は、話題リストによって最新の情報を知得して、話題紹介シナリオ及び入力関連シナリオを編集することができ、ユーザに最新の情報を含めた話題を提供することができるとともに、最新の情報によって新たなユーザ層を開拓することもできる。

また、図３に示した送信部は、入力情報を外部に送信するための装置や部材である。入力情報を外部に送信するものであればよい。外部は、たとえば、話題提供サーバ４（図２参照）や、会話制御端末装置２などにすることができる。

さらに、図３に示した入力情報分析部は、入力情報を分析して入力特定情報を生成する。入力特定情報は、入力情報に含まれる各種の情報を分析した結果、生成される情報である。たとえば、特定のキーワード（後述する関連詞など）が入力情報に含まれる数や頻度などの統計的な分析などがある。

さらにまた、図３に示したシナリオデータ記憶部（複数のシナリオデータ）は、複数のシナリオデータを記憶する。ここで、複数のシナリオデータは、ユーザと会話をするために必要な話題名に対応する全てのシナリオデータである。全てのシナリオデータのうち、入力特定情報に基づいて必要であると判断されたシナリオデータが抽出される。

＜＜＜話題提供システム１のシステム構成＞＞＞
図４は、話題提供システム１のシステム構成の概略を示すブロック図である。

話題提供システム１は、topiclet２０とiWA３０とiWA Manager４０とを有する。

＜＜Topiclet２０＞＞
本実施の形態において、Topiclet２０は、たとえば、ユーザが使用する端末装置などのハードウェアに相当する。また、Topiclet２０は、図２に示した会話制御端末装置２に対応する。Topiclet２０によって話題がユーザに提供される。なお、本実施の形態において、「Topiclet」は、話題をユーザに提供するために端末装置で実行されるソフトウェアや、端末装置やこれらのソフトウェアによって実現できる話題提供環境と同義に用いる場合がある。

具体的には、Topiclet２０は、ＣＰＵ（中央処理装置）、ＲＯＭ（リードオンリーメモリ）、ＲＡＭ（ランダムアクセスメモリ）、ディスプレイ、キーボード（いずれも図示せず）などを有する。Topiclet２０は、パーソナルコンピュータや携帯端末装置などにすることができる。

Topiclet２０は、入力部２１０と出力部２２０と送信部２３０と受信部２４０と応答情報決定部２５０と切替入力情報入力部２６０とシナリオデータ記憶部２７０と状態制御指標記憶部２８０とを有する。

＜入力部２１０＞
入力部２１０は、ユーザが入力情報を入力するための装置や部材である。入力部２１０は、キーボードやタッチパネルやマイクなどがある。入力部２１０は、ユーザが質問などの情報を入力できる装置や部材であればよい。

＜出力部２２０＞
出力部２２０は、後述する応答情報決定部によって決定された応答情報を出力する。出力部２２０には、ディスプレイやスピーカなどがある。出力部２２０は、応答情報をユーザに認識可能に出力できるものであればよい。

このように、ユーザは、入力部２１０に入力情報を入力し、出力部２２０に出力された応答情報を認識することで、会話を進めることができる。

＜送信部２３０及び受信部２４０＞
送信部２３０は、入力部２１０に入力された入力情報をiWA３０に送信するための装置や部材である。たとえば、送信部２３０は、通信用インターフェースなどがある。

なお、iWA３０に送信する入力情報には、ユーザが入力部２１０から入力情報のほかに、ユーザを識別するためのユーザＩＤも含まれる。ユーザＩＤは、ユーザを識別できる情報であればよい。ユーザの各々に割り当てた情報でもよい。さらに、ユーザＩＤは、Topiclet２０のシリアル番号などのTopiclet２０を一義的に識別できる情報にすることもできる。ユーザＩＤは、話題提供システム１や会話制御端末装置２を利用するユーザの各々を識別できる情報であればよい。

受信部２４０は、iWA３０から送信された入力特定情報とシナリオデータとを受信するための装置や部材である。たとえば、送信部２３０は、通信用インターフェースなどがある。Topiclet２０は、送信部２３０及び受信部２４０によって、iWA３０と通信可能に接続される。

＜応答情報決定部２５０＞
応答情報決定部２５０は、入力特定情報及びシナリオデータに基づいて応答情報を決定する。たとえば、応答情報決定部２５０は、Topiclet２０のＣＰＵ、ＲＯＭ、ＲＡＭなどから構成される。このように、iWA３０から送信された入力特定情報及びシナリオデータを用いて応答情報を決定する。

応答情報決定部２５０では、入力とは関係なくシナリオデータに基づいて応答情報は動的に変化する。

応答情報決定部２５０は、応答情報を決定する。応答情報は、シナリオデータと入力特定情報とに基づいて決定される。すなわち、ユーザが入力した入力情報を分析して得られた入力特定情報を用いて応答情報を決定する。したがって、ユーザの意思を反映させた応答情報を生成することができ、ユーザが所望する話題を提供することによってユーザとの会話を円滑に進めることができる。

応答情報には、入力特定情報に基づいてシナリオデータのステートメントが含められる。ステートメントに含まれるユーザに提供する出力用情報のみならず、出力用コマンドなどの各種のコマンドも応答情報に含めることができる。このようにすることで、出力部において、話題の情報や挨拶の情報をさまざまな仕様で出力することができる。

応答情報決定部２５０は、シナリオデータ及び入力特定情報のほかに状態制御指標を加えて応答情報を決定する。このように、状態制御指標も用いて応答情報を決定することで、ユーザとの過去の会話を踏まえて話題を提供したり会話を進めたりすることができる。したがって、同じ話題を重複してユーザに提供したり、飛躍した話題をユーザに提供したりすることを防止でき、より円滑な会話を進めることができる。

また、応答情報決定部２５０は、シナリオデータと状態制御指標とに基づいて応答情報を決定してもよい。

＜切替入力情報入力部２６０＞
切替入力情報入力部２６０は、Topiclet２０のＣＰＵ、ＲＯＭ、ＲＡＭなどから構成される。

切替入力情報入力部２６０は、異なる話題への遷移を規定する情報に応じて話題切替入力情報を生成する。異なる話題への遷移を規定する情報は、たとえば、後述する話題切替情報などがある。また、話題切替入力情報は、たとえば、後述する性格指標などがある。

＜シナリオデータ記憶部２７０＞
シナリオデータ記憶部２７０は、話題に関する応答情報を規定するためのシナリオデータを抽出する。たとえば、シナリオデータ記憶部２７０は、Topiclet２０のＲＯＭやＲＡＭなどから構成される。

後述するように、本実施の形態では、シナリオデータは、複数のステートメントからなる。Topiclet２０において、一のステートメントから他のステートメントに遷移させていくことで、ユーザに話題を提供しつつ、ユーザと会話をすることができる。シナリオデータ記憶部２７０は、ユーザとの会話を進めていくための複数のステートメントを記憶する。ステートメントを遷移させていくことでユーザとの会話を進める具体例は、図５〜図１４で具体的に説明する。

後述するように、iWA３０もシナリオデータ記憶部３２０を備える。iWA３０のシナリオデータ記憶部３２０は、全てのシナリオデータを記憶する。これに対して、Topiclet２０のシナリオデータ記憶部２７０は、一部のシナリオデータとして記憶すればよい。Topiclet２０を使用するユーザの会話に必要なシナリオデータとしてTopiclet２０に送信すればよい。

本実施の形態では、ユーザがTopiclet２０と会話をする際に、会話をする度に、回答などの情報がiWA３０からTopiclet２０に送信されるわけではない。ユーザに提供したい話題を含むシナリオデータがiWA３０から送信されたときには、Topiclet２０のシナリオデータ記憶部２７０にシナリオデータが記憶される。ユーザがTopiclet２０と会話をするときには、シナリオデータ記憶部２７０に既に記憶されているシナリオデータが用いられる。本実施の形態では、会話をする度にiWA３０からTopiclet２０に回答などの情報が送信されるわけではないので、ユーザと円滑に会話をすることができる。

なお、iWA３０のシナリオデータ記憶部３２０に記憶されている全てのシナリオデータをTopiclet２０に送信するようにしてもよい。より円滑に話題をユーザに提供することができる。

＜状態制御指標記憶部２８０＞
状態制御指標記憶部２８０は、状態制御指標を記憶する。状態制御指標は、入力情報及び応答情報に関する指標である。状態制御指標記憶部２８０は、Topiclet２０のＲＯＭやＲＡＭなどから構成される。

Topiclet２０は、状態制御指標記憶部２８０を有し、状態制御指標記憶部２８０に状態制御指標が記憶される。本実施の形態では、状態制御指標は、サーバ（後述するiWA３０）には送信されず、Topiclet２０で保持される情報である。Topiclet２０は、状態制御指標記憶部２８０に記憶されている状態制御指標を参照して応答情報を決定する。状態制御指標をTopiclet２０で保持するようにすることで、iWA３０との通信量を減らすことができる。また、Topiclet２０で状態制御指標を参照してシナリオデータを用いればよいので、迅速に処理をすることができ、ユーザと円滑に会話をすることができる。

＜状態制御指標＞
本実施の形態では、状態制御指標には、入力指標と進捗指標と性格指標との三種類の指標を用いて、ユーザに提供する話題を制御している。なお、他の指標を用いてもよい。

入力指標は、これまでにユーザがどのような入力をしてきたのか、すなわち、ユーザの入力の履歴を示す情報である。入力指標を用いることによって、ユーザが質問をしやすい状況に誘導することができる。すなわち、入力指標を用いることにより、ユーザの以前の入力を踏まえた話題をユーザに提供することができる。これにより、ユーザが、同じような質問を繰り返すなど無駄な質問をすることなく、ユーザに話題を提供することができる。

進捗指標は、これまでにユーザに対してどのような話題を提供してきたのか、すなわち、ユーザに提供した話題の履歴を示す情報である。進捗指標によって、ユーザに提供したい話題を維持（記憶）することができる。これにより、ユーザがストレスを感じさせることなく、ユーザに話題を提供することができる。進捗指標を用いることにより、一連の説明を話題として提供している際に、途中でユーザから質問されても、一連の説明の続きを再開することができる。

性格指標は、これまでにユーザがどのような姿勢で入力してきたのか、すなわち、ユーザの姿勢の履歴を示す情報である。たとえば、ある話題について、ユーザが積極的な入力してきたのか消極的な入力してきたのかを示す情報である。積極的な場合には、あるテーマに関する話題を提供し続けることができると判断することができる。一方、消極的な場合には、あるテーマとは別のテーマに切り替えて話題を提供しなければならないと判断することができる。

たとえば、車に興味があると思われるユーザには、車に関する話題を提供し続ければよいと判断することができる。一方、車に興味がないと思われるユーザには、車とは関係のない食べ物などに関する話題を提供しなければならないと判断することができる。

このように、性格指標により、ユーザに提供する話題の話題名（テーマ）を切り替えることができる。ユーザは、話題の話題名を意識することなく切り替えられた話題名に属する話題に触れることができる。

＜iWA３０＞
本実施の形態において、iWA３０は、たとえば、サーバなどのハードウェアに相当する。iWA３０は、図２に示した話題提供サーバ４に対応する。iWA３０は、Topiclet２０と通信可能に接続される。Topiclet２０においてユーザに提供される話題に関する処理を実行するためのハードウェアである。

具体的には、iWA３０は、ＣＰＵ（中央処理装置）、ＲＯＭ（リードオンリーメモリ）、ＲＡＭ（ランダムアクセスメモリ）、ＨＤＤ（ハードディスクドライブ）、ディスプレイ、キーボード（いずれも図示せず）などを有する。

iWA３０は、入力情報分析部３１０とシナリオデータ記憶部３２０とを備える。

＜入力情報分析部３１０＞
入力情報分析部３１０は、入力情報を分析して入力特定情報を生成する。入力情報は、ユーザによって入力部２１０にから入力された情報である。入力特定情報は、入力情報を統計的に解析した結果や、その結果から話題提供に必要な情報が含まれる。たとえば、入力情報に関連詞が出現する回数や頻度などの情報がある。また、その結果によって話題提供に必要になると判断されたシナリオデータ（ステートメント）などが含まれる。

さらに、入力情報の分析により、ユーザが入力した質問などからユーザの意思や嗜好を分析することができる。他のユーザの入力情報やその入力特定情報との比較により相対的な分析結果も取得することができる。また、分析用辞書などのデータを予め生成しておき、分析用辞書によって入力情報を分析することもできる。

たとえば、入力特定情報には、関連詞、シナリオデータ、シナリオデータに含まれる関連詞の数などの各種の情報を含む。シナリオデータには、ユーザに提供する話題の情報や、ユーザと会話をするために必要な挨拶の情報などが含まれる。

＜関連詞＞
本実施の形態による話題提供システム１、会話制御端末装置２及び保守装置３で用いる各種のデータは、関連詞と呼ばれるデータを基礎として構成されている。関連詞は、通常の検索処理などに用いられる通常のキーワードとは異なり、履歴情報や嗜好などの各種の情報を互いに関連付けることができる。関連詞が保持している関連情報に基づいて、入力情報を分析することができる。

＜シナリオデータ記憶部３２０＞
シナリオデータ記憶部３２０は、複数のシナリオデータを記憶する。ここで、複数のシナリオデータは、Topiclet２０でユーザと会話をするために必要な話題名に対応する全てのシナリオデータである。全てのシナリオデータのうち、入力特定情報に基づいて必要であると判断されたシナリオデータがTopiclet２０に送信される。したがって、Topiclet２０においてユーザと会話をする際に、会話をする度に、シナリオデータがTopiclet２０に送信されるわけではない。上述したように、シナリオデータは、複数のステートメントからなる。したがって、入力特定情報に基づいて必要であると判断されたシナリオデータを構成する複数のステートメントがTopiclet２０に送信される。

生成した入力特定情報に基づいて、必要であると判断された場合にステートメントがシナリオデータとしてTopiclet２０に送信される。必要でないと判断された場合には、既にTopiclet２０に送信しているステートメントで十分であり、この場合には、ステートメントはTopiclet２０に送信されない。

なお、入力特定情報に基づいて必要であると判断されたシナリオデータのみをTopiclet２０に送信するのではなく、シナリオデータ記憶部３２０に記憶されている全てのシナリオデータをTopiclet２０に送信するようにしてもよい。Topiclet２０に全てのシナリオデータを既に送信しているので、シナリオデータの送受信に要する時間を短縮でき、ユーザとの会話を円滑に進めることができる。

また、話題名を切り替える場合には、シナリオデータ記憶部３２０に記憶されているシナリオデータを組み替えて、その話題名に対応するシナリオデータをTopiclet２０に送信する。すなわち、その話題名に対応するシナリオデータに対応するステートメントがTopiclet２０に送信される。組み替えたシナリオデータは、topiclet２０のシナリオデータ記憶部２７０に記憶される。このシナリオデータの組み替えは、話題名に応じて実行できる。

ユーザと会話が進むに従って、一の話題名から他の話題名に移す必要が生ずる場合も想定される。このような場合には、一の話題名に対応するシナリオデータでは十分に対応できなくなる。このような場合のため、他の話題名に対応するシナリオデータに切り替えることができる。

＜iWA Manager４０＞
本実施の形態において、iWA Manager４０は、たとえば、サーバなどのハードウェアに相当する。iWA Manager４０は、図３に示した保守装置３に対応する。iWA Manager４０は、iWA３０と通信可能に接続される。iWA Manager４０は、主に、iWA３０で用いるシナリオデータに関する処理を実行するためのハードウェアである。

具体的には、iWA Manager４０は、ＣＰＵ（中央処理装置）、ＲＯＭ（リードオンリーメモリ）、ＲＡＭ（ランダムアクセスメモリ）、ＨＤＤ（ハードディスクドライブ）、ディスプレイ、キーボード（いずれも図示せず）などを有する。

iWA Manager４０は、シナリオデータ編集部４１０と、シナリオデータ検証部４２０と、シナリオデータ送信部４３０と、を有する。

＜シナリオデータ編集部４１０＞
シナリオデータ編集部４１０は、シナリオデータを編集可能にする装置又は部材である。シナリオデータは、話題提供システム１の契約者の担当者がキーボードなどを操作することによって、編集することができる。編集は、シナリオデータの追加、削除、変更などである。具体的には、編集は、シナリオデータを構成するステートメントを追加したり、削除したり、変更したりする工程である。

新しい商品が販売されたり、新しいサービスが提供されたり、各種の事件が起こったり、新しい層のユーザが増えたりするなどに応じて、最新の話題に対応できるようにシナリオデータを更新する必要がある。このため、担当者は、ネットワークを介して各種の情報を取得し、これらの情報に基づいてシナリオデータを最新のものに更新することができる。シナリオデータを更新することで、最新の情報に対応した話題をユーザに提供することができる。

また、シナリオデータ編集部４１０によって、誤字・脱字など不適切な情報や誤った情報を訂正することにより、適切な情報に対応した話題をユーザに提供することができる。

＜シナリオデータ検証部４２０＞
シナリオデータ検証部４２０は、入力情報分析部で生成された入力特定情報に基づいて編集したシナリオデータの応答を検証可能にする装置や部材である。すなわち、シナリオデータ検証部４２０は、シナリオデータ編集部４１０で編集したシナリオデータの応答が適切であるか否かを検証するための装置や部材である。

シナリオデータの内容が適切であれば、シナリオデータの応答は適切になる。本実施の形態のシナリオデータは、出力部２２０で出力される出力用情報や、出力部２２０への出力の仕様を制御するための出力用コマンドや、ステートメントを制御するための判断や、話題名を切り替えたり、状態制御指標を変更したりするための制御コマンドを含む。このため、出力部２２０に出力されるデータが適切であるかどうかを検証するだけでなく、出力部２２０への出力の制御が適切であるかどうかの検証や、シナリオデータの遷移などの制御が適切であるかどうかの検証をする必要がある。

シナリオデータ検証部４２０は、想定される様々な入力情報を用いて入力特定情報を生成し、シナリオデータ編集部４１０によって編集されたシナリオデータの応答を検証することができる。このため、あらゆるユーザに対してシナリオデータの応答が適切であるか否かを検証できるので、ユーザの各々に対してカスタムを施すことができる。

＜端末装置仮想構築部＞
シナリオデータ検証部４２０は、端末装置仮想構築部によって、Topiclet２０と同様の環境を仮想的に構築することができる。仮想的な環境下でシナリオデータを検証することにより、ユーザが実際に使用する環境に近い環境で、シナリオデータの出力や動作を検証することができ、シナリオデータが適切であるか否かを容易かつ的確に判断することができる。

＜シナリオデータ送信部４３０＞
シナリオデータ送信部４３０は、編集したシナリオデータを外部、たとえば、iWA３０に送信する。特に、シナリオデータ編集部４１０によって編集され、さらに、シナリオデータ検証部４２０によって検証されたシナリオデータをiWA３０に送信する。したがって、シナリオデータ送信部４３０は、検証済みのシナリオデータをiWA３０に送信する。

このようにすることで、iWA３０からTopiclet２０に送信されるシナリオデータを常に適切な状態に保つことができる。したがって、適切なシナリオデータを用いた話題をiWA３０を介してユーザに提供することができる。

＜＜＜話題提供サーバが提供するデータ構成＞＞＞
図１５に示すように、iWA３０からは、シナリオデータと入力特定情報と話題紹介リストとが出力される。以下では、シナリオデータの例と入力特定情報の例と話題紹介リストの例とを説明する。

＜＜＜シナリオデータの実例＞＞＞
図１４は、本実施の形態の話題提供システム１、会話制御端末装置２及び保守装置３で用いるシナリオデータの例である。以下では、この図１４に示したシナリオデータを具体的な処理手順によって説明する。図１４に示したシナリオデータは、第１〜第１３の複数のステートメントからなる。図５〜図１２は、これらの第１〜第１３のシナリオデータの処理手順を示すフローチャートである。図１３は、第１〜第１３のシナリオデータを処理することによって出力部２２０に出力される例を示す図である。

上述したように、本実施の形態の話題提供システム１、会話制御端末装置２及び保守装置３で用いるシナリオデータ（ステートメント）は、出力用情報や、出力用コマンドや、制御コマンドが含まれる。シナリオデータ（ステートメント）は、このような出力用情報や出力用コマンドや制御コマンドなどの各種の要素によって構成される。

図５は、第１、第２及び第３のステートメントの処理を示すフローチャートである。

＜第１のステートメント＞
最初に、第１のステートメントに遷移する。図５では、ステップＳ５１１〜Ｓ５２１が、第１のステートメントの処理に対応する。

まず、進捗指標を−１に設定する（ステップＳ５１１）。この値が進捗の状態を示す。次いで、出力部２２０を一旦消去して（ステップＳ５１３）、出力部２２０に「不安を解消する話題にシフトします。」と出力する（ステップＳ５１５）。この処理によって、たとえば、図１３（ａ）に示すように、「地震が心配だ」という話題がユーザの操作によって入力されて、出力部２２０のテキストデータ表示領域に、「不安を解消する話題にシフトします。」と表示される（図１３の１３１１）。

次に、所定の画像を出力して（ステップＳ５１７）、３秒間待機する（ステップＳ５１９）。この処理によって、図１３（ａ）に示すように、出力部２２０の画像データ表示領域に所定の色の顔画像Ｍ１が表示されて、３秒間待機する（図１３の１３１１）。

次いで、「心配だ。」という語を入力情報として、「話題ネタ」という話題名に切り替える（ステップＳ５２１）。この処理によって、この例では、第２のステートメントに遷移する（図１３の１３１３）。

＜第２のステートメント＞
図５では、ステップＳ５２３〜Ｓ５２５が、第２のステートメントの処理に対応する。

第２のステートメントに遷移して、まず、絶対時間、たとえば、１２時００分に至ったか否かの監視を開始する（ステップＳ５２３）。次いで、絶対時間が到来したか否かを判断する（ステップＳ５２５）（図１３の１３１５）。絶対時間が到来していない場合には（ＮＯ）、第３のステートメントに遷移させる。絶対時間に至った場合には（ＹＥＳ）、絶対時間の監視を解除して第１３のステートメントに遷移させる（符号ＥＥ）。

＜第３のステートメント＞
図５では、ステップＳ５２７〜Ｓ５３３が、第３のステートメントの処理に対応する。

第３のステートメントに遷移したときには、進捗指標が−１であるか否かを判断する（ステップＳ５２７）（図１３の１３１７）。進捗指標が−１であると判別したときには（ＹＥＳ）、第４のステートメントに遷移させる（符号Ｅ１）。

進捗指標が−１でないと判別したときには（ＮＯ）、進捗指標が−２であるか否かを判断する（ステップＳ５２９）。進捗指標が−２であると判別したときには（ＹＥＳ）、第５のステートメントに遷移させる（符号Ｅ２）。

進捗指標が−２でないと判別したときには（ＮＯ）、進捗指標が−３であるか否かを判断する（ステップＳ５３１）。進捗指標が−３であると判別したときには（ＹＥＳ）、第６のステートメントに遷移させる（符号Ｅ３）。

進捗指標が−３でないと判別したときには（ＮＯ）、進捗指標が−４であるか否かを判断する（ステップＳ５３３）。進捗指標が−４であると判別したときには（ＹＥＳ）、別のステートメント（sta:200）に遷移させる。進捗指標が−４でないと判別したときには（ＮＯ）、なにもしない。

上述した第２のステートメントや第３のステートメントは制御コマンドのみからなる。このように、ステートメントは、出力部２２０に出力するための出力用情報を有しないものでもよい。

＜第４のステートメント及び第７のステートメント＞
図６は、第４のステートメント及び第７のステートメントに対応する処理を示す。第４のステートメントは、ステップＳ６１１〜Ｓ６２１に対応する。第７のステートメントは、ステップＳ６２３〜Ｓ６２９に対応する。

＜第４のステートメント＞
第４のステートメントに遷移したときには、相対時間、たとえば、１２０秒の測定の開始する（ステップＳ６１１）。次いで、入力指標を１に設定するとともに（ステップＳ６１３）、入力指標を１に設定した回数を計数する（ステップＳ６１５）。

次に、入力指標を１に設定した回数が５回に至ったか否かを判断する（ステップＳ６１７）（図１３の１３１９）。入力指標を１に設定した回数が５回に至った場合には（ＹＥＳ）、第１０のステートメントに遷移させる（符号Ｅ１１）。

入力指標を１に設定した回数が５回に至っていない場合には（ＮＯ）、相対時間、たとえば、１２０秒を経過したか否かを判断する（ステップＳ６１９）（図１３の１３１９）。相対時間を経過した場合には（ＹＥＳ）、相対時間の測定を終了し（ステップＳ６２１）、第１０のステートメントに遷移させる（符号Ｅ１１）。

相対時間を経過していない場合には（ＮＯ）、第７のステートメントに遷移させる。

＜第７のステートメント＞
第７のステートメントに遷移したときには、出力部２２０を消去し（ステップＳ６２３）、出力部２２０に「「心配だ」について質問はありませんか？」と出力する（ステップＳ６２５）。次いで、所定の画像（たとえば、所定の色の顔画像Ｍ１）を出力して（ステップＳ６２７）、１０秒間待機する（ステップＳ６２９）。この処理によって、図１３（ｂ）に示すように、出力部２２０の画像データ表示領域に所定の色の顔画像Ｍ１が表示されて、１０秒間待機する。次いで、第２のステートメントに遷移させる（符号ＥＳ）。

＜第５のステートメント及び第８のステートメント＞
図７は、第５のステートメント及び第８のステートメントに対応する処理を示す。第５のステートメントは、ステップＳ７１１〜Ｓ７２１に対応する。第８のステートメントは、ステップＳ７２３〜Ｓ７２９に対応する。

＜第５のステートメント＞
第５のステートメントに遷移したときには、相対時間、たとえば、１２０秒の測定の開始する（ステップＳ７１１）。次いで、入力指標を２に設定するとともに（ステップＳ７１３）、入力指標を２に設定した回数を計数する（ステップＳ７１５）。

次に、入力指標を２に設定した回数が５回に至ったか否かを判断する（ステップＳ７１７）（図１３の１３１９）。入力指標を２に設定した回数が５回に至った場合には（ＹＥＳ）、第１１のステートメントに遷移させる（符号Ｅ１２）。

入力指標を２に設定した回数が５回に至っていない場合には（ＮＯ）、相対時間、たとえば、１２０秒を経過したか否かを判断する（ステップＳ７１９）（図１３の１３１９）。相対時間を経過した場合には（ＹＥＳ）、相対時間の測定を終了し（ステップＳ７２１）、第１１のステートメントに遷移させる（符号Ｅ１２）。

相対時間を経過していない場合には（ＮＯ）、第８のステートメントに遷移させる。

＜第８のステートメント＞
第８のステートメントに遷移したときには、出力部２２０を消去し（ステップＳ７２３）、出力部２２０に「「大丈夫」について質問はありませんか？」と出力する（ステップＳ７２５）。次いで、所定の画像（たとえば、所定の色の顔画像Ｍ１）を出力して（ステップＳ７２７）、１０秒間待機する（ステップＳ７２９）。次いで、第２のステートメントに遷移させる（符号ＥＳ）。

＜第６のステートメント及び第９のステートメント＞
図８は、第６のステートメント及び第９のステートメントに対応する処理を示す。第６のステートメントは、ステップＳ８１１〜Ｓ８２１に対応する。第９のステートメントは、ステップＳ８２３〜Ｓ８２９に対応する。

＜第６のステートメント＞
第６のステートメントに遷移したときには、相対時間、たとえば、１２０秒の測定の開始する（ステップＳ８１１）。次いで、入力指標を３に設定するとともに（ステップＳ８１３）、入力指標を３に設定した回数を計数する（ステップＳ８１５）。

次に、入力指標を３に設定した回数が５回に至ったか否かを判断する（ステップＳ８１７）（図１３の１３１９）。入力指標を３に設定した回数が５回に至った場合には（ＹＥＳ）、第１１のステートメントに遷移させる（符号Ｅ１３）。

入力指標を３に設定した回数が５回に至っていない場合には（ＮＯ）、相対時間、たとえば、１２０秒を経過したか否かを判断する（ステップＳ８１９）（図１３の１３１９）。相対時間を経過した場合には（ＹＥＳ）、相対時間の測定を終了し（ステップＳ８２１）、第１２のステートメントに遷移させる（符号Ｅ１３）。

相対時間を経過していない場合には（ＮＯ）、第９のステートメントに遷移させる。

＜第９のステートメント＞
第９のステートメントに遷移したときには、出力部２２０を消去し（ステップＳ８２３）、出力部２２０に「「危険だ」について質問はありませんか？」と出力する（ステップＳ８２５）。次いで、所定の画像（たとえば、所定の色の顔画像Ｍ１）を出力して（ステップＳ８２７）、１０秒間待機する（ステップＳ８２９）。次いで、第２のステートメントに遷移させる（符号ＥＳ）。

＜第１０のステートメント＞
図９は、第１０のステートメントに対応する処理を示す。上述した図６の処理（符号Ｅ１１）によって、第１０のステートメントに遷移する。

第１０のステートメントに遷移したときには、進捗指標を−２に設定する（ステップＳ９１１）。次いで、出力部２２０を消去し（ステップＳ９１３）、出力部２２０に「次の話題にシフトします」と出力する（ステップＳ９１５）。所定の画像（たとえば、所定の色の顔画像Ｍ１）を出力して（ステップＳ９１７）、３秒間待機する（ステップＳ９１９）。次いで、「大丈夫」という語を入力情報として、この語に対応する話題名に切り替える（ステップＳ９２１）。次いで、第２のステートメントに遷移させる（符号ＥＳ）。

上述した処理によって、図１３（ｄ）に示すように、出力部２２０のテキストデータ表示領域に、「次の話題にシフトします」と表示される。このようにすることで、一の話題名のシナリオデータから他の話題名のシナリオデータに遷移することができる。

＜第１１のステートメント＞
図１０は、第１１のステートメントに対応する処理を示す。上述した図７の処理（符号Ｅ１２）によって、第１１のステートメントに遷移する。

第１１のステートメントに遷移したときには、進捗指標を−３に設定する（ステップＳ１０１１）。次いで、出力部２２０を消去し（ステップＳ１０１３）、出力部２２０に「次の話題にシフトします」と出力する（ステップＳ１０１５）。所定の画像（たとえば、所定の色の顔画像Ｍ１）を出力して（ステップＳ１０１７）、３秒間待機する（ステップＳ１０１９）。次いで、「危険だ」という語を入力情報として、この語に対応する話題名に切り替える（ステップＳ１０２１）。次いで、第２のステートメントに遷移させる（符号ＥＳ）。

＜第１２のステートメント＞
図１１は、第１２のステートメントに対応する処理を示す。上述した図８の処理（符号Ｅ１３）によって、第１２のステートメントに遷移する。

第１２のステートメントに遷移したときには、進捗指標を−４に設定する（ステップＳ１１１１）。次いで、出力部２２０を消去し（ステップＳ１１１３）、出力部２２０に「時間になりました」と出力する（ステップＳ１１１５）。所定の画像（たとえば、所定の色の顔画像Ｍ１）を出力して（ステップＳ１１１７）、３秒間待機する（ステップＳ１１１９）。次いで、第１３のステートメントに遷移させる（符号ＥＥ）。

＜第１３のステートメント＞
図１２は、第１３のステートメントに対応する処理を示す。上述した図１１の処理（符号ＥＥ）によって、第１３のステートメントに遷移する。

第１３のステートメントに遷移したときには、出力部２２０を消去し（ステップＳ１２１１）、出力部２２０に「説明を終了します」と出力する（ステップＳ１２１３）（図８の１３２１）。所定の画像（たとえば、所定の色の顔画像Ｍ１）を出力して（ステップＳ１２１５）、３秒間待機する（ステップＳ１２１７）。次いで、別のステートメント（sta:200）に遷移させる。

なお、図１３（ｂ）に示す状態で、ユーザが「やっぱり、政治が心配ですね」と入力した場合には（図１３（ｃ））、出力部２２０のテキストデータ表示領域に、「政治家は嘘をつかないので心配する必要はありません」と表示され（図１３（ｃ））、再び、図１３（ｂ）に示す状態に戻る。

＜シナリオデータの構成＞
上述した第１〜第１３のステートメントのように、本実施の形態では、シナリオデータは複数のステートメントからなる。一のステートメントに遷移して、その一のステートメントに基づく処理を実行したあと、他のステートメントに遷移して、そのステートメントに基づく処理を実行する。このようなステートメントの遷移とステートメントにおける処理とを繰り返していくことによって、ユーザに話題を提供していくことができる。このように、本実施の形態における話題提供システム１、会話制御端末装置２及び保守装置３では、シナリオデータ（複数のステートメント）が用いられる。ここでは、単一のステートメントの構成について説明する。

上述した第１〜第１３のステートメントのように、本実施の形態のステートメントは、遷移情報や判断などの各種の要素から構成される。ユーザに話題を提供するための制御や、ユーザとの会話の制御に必要な要素をステートメントに含めることができる。

識別情報は、ステートメントを識別するために付された情報である。ステートメントを遷移させるときに、この識別情報が参照される。１つのステートメントには、遷移先情報も含まれている。

すなわち、１つのステートメントには、識別情報と遷移先情報との双方が含まれている。識別情報は、ステートメントを識別するための識別情報であり、そのステートメント自身を示す情報である。一方、遷移先情報は、次に遷移させるべきステートメントを指定するための情報である。識別情報及び遷移先情報は、他のステートメントから一のステートメントに遷移するときに用いられる情報である。すなわち、他のステートメントに定められている遷移先情報にしたがって、その遷移先情報と一致する識別情報のステートメントを探し、遷移先情報と一致した識別情報のステートメント（一のステートメント）に遷移させる。このように、識別情報と遷移先情報との双方を用いることによって、ステートメントを次々に遷移させていくことができる。

判断は、指標に基づく判断と時間に基づく判断とがある。指標に基づく判断は、指標が所定の条件を満たすか否かを判断するための判断である。指標が、所定の条件を満たした場合には真と判別し、所定の条件を満たさなかった場合には偽と判別して分岐させることができる。時間に基づく判断は、時間が所定の条件を満たすか否かを判断するための判断である。時間や時刻が、所定の条件を満たした場合には真と判別し、所定の条件を満たさなかった場合には偽と判別して分岐させることができる。

出力情報は、出力部２２０に出力するためのテキストデータである。なお、出力情報の画像データを指定する識別情報（たとえば、ファイル名など）を含ませることによって、出力情報によって画像も出力部２２０に出力することができる。

設定要素は、状態指標を設定するための要素である。設定された状態指標に基づいて、ステートメントを遷移させたり分岐させたりすることができる。

その他の要素として、たとえば、改行や消去などがある。改行は、出力部２２０においてテキストを改行して出力するためのものである。消去は、出力部２２０に出力したテキストや画像を消すためのものである。

出力制御要素は、上述した出力情報の出力を制御するための要素である。たとえば、出力情報を出力する時間を規定したり、出力情報の出力とともに出力する画像を規定したりすることができる。

遷移先情報は、次の遷移先のステートメントを指定するための情報である。この遷移先情報に一致する識別情報を探し、その識別情報のステートメントに遷移させる。

話題切替情報は、話題名を切り替えるための要素である。本実施の形態のシナリオデータ（複数のステートメント）は、複数の話題名ごとに規定されている。すなわち、複数の話題名の各々にシナリオデータが対応するように、シナリオデータは規定されている。すなわち、本実施の形態では、複数の話題名の各々にシナリオデータが対応するように規定され、さらに、シナリオデータの各々は、複数のステートメントによって構成されている。

ユーザと会話で一の話題名で足りる場合には、一の話題名に対応するシナリオデータを使ってステートメントを次々に遷移させていけばよい。しかしながら、ユーザと会話が進むに従って、一の話題名から他の話題名に移す必要が生ずる場合も想定される。このような場合には、一の話題名に対応するシナリオデータでは十分に対応できなくなる。このため、複数の話題名の各々に対応するシナリオデータを予め規定しておくことによって、一の話題名から他の話題名に話題が移る必要が生じた場合でも、他の話題名に対応するシナリオデータに切り替えることができる。他の話題名に対応するシナリオデータも複数のステートメントによって構成されている。他の話題名に対応するシナリオデータのステートメントを次々に遷移させることで、他の話題名についてユーザと会話を進めることができる。

話題名を切り替える場合には、iWA３０に記憶されている全てのシナリオデータを組み替えて、その話題名に対応するシナリオデータを生成する。組み替えたシナリオデータは、topiclet２０のシナリオデータ記憶部２７０に記憶される。このシナリオデータの組み替えは、複数のステートメントの組み合せを話題名に応じて定めることで実行できる。

また、話題名を切り替えるか否かは、上述した性格指標に基づいて判断するのが好ましい。性格指標は、ある話題について、ユーザが積極的であるのか消極的であるのかを示す情報である。積極的な場合には、話題名を切り替えることなく話題を提供し続けることができると判断することができる。一方、消極的な場合には、話題名を切り替えて話題を提供しなければならないと判断することができる。

＜＜入力特定情報の実例＞＞
入力特定情報には、入力情報に対応する識別情報あるいは識別情報を特定するための情報が付加されており、この情報によりシナリオデータを起動することができる。

なお、図１５では、図１〜図４における入力特定情報には、次に述べる話題紹介リストも含まれる。

＜＜話題紹介リストの実例＞＞
図１６は、話題紹介リストの構成の例を示す図である。

＜話題紹介リストの構成＞
話題紹介リストは、関連詞集合と話題との組のリストである。関連詞集合は、話題に含まれている関連詞の集合である。関連詞の近傍は、ある関連詞Ａに着目した場合に、関連詞Ａを含む関連詞の集合である。関連詞の近傍系は、関連詞の近傍の集合である。関連詞の近傍数は、関連詞の近傍系の要素数である。関連詞の位相は、関連詞の近傍系を見ることによりわかるものである。話題解析を実施することにより、全ての関連詞の組に対して近傍系を表示できる。嗜好解析を実施することにより、関連詞の近傍系を嗜好順に表示することができる。話題紹介に関わるシナリオは、関連詞の近傍系に基づき話題の近さや繋がりに基づいて構成できるシナリオである。

話題は、アクションとインデックスとが割り当てられたテキストである。アクションは、テキストをクリック等により起動する変化である。話題にはインデックスとしての関連詞集合が付加されている。インデックスをクリックするとインデックスに含まれる関連詞の関連詞仲間が表示される。

＜話題紹介リストの利用＞
図１７は、関連詞辞書や嗜好辞書などの関連詞構造が導入された関連詞により、話題紹介リストの話題は繋がっていることを示している。利用者は話題紹介リストの話題の繋がり方に着目して話題を検知することができる。

また、利用者は、話題紹介リストにおける関連詞構造を参考にしながら、関連詞に基づいて話題切替を実施することにより、多様な観点から話題を検知することが可能となる。

＜関連詞による話題切替＞
話題に関わる応答情報を規定するシナリオデータにおいては、話題名による話題切替だけではなく、話題そのものを切り替えて紹介することが必要となる。話題解析は、話題紹介リストを介して、シナリオデータで話題そのものを切り替えるために必要な「関連詞と関連詞構造」を提供している。

図１７に示したように関連詞により話題の近さや繋がり方を見ることができるので、関連詞をシナリオデータで利用することにより、話題そのものの話題切替が実施できることになる。例えば、現在の話題に対して、内容の近い話題への話題切替や内容が繋がっている話題への話題切替などが実施できる。

また、関連詞に関連詞構造が導入されていることにより、関連詞を変数化した変数関連詞（例えば、最も頻度の高い関連詞、最も人気のある関連詞など）をシナリオデータで利用することにより、話題の多様な紹介が可能となる。

関連詞による話題切替ができることにより、利用者が話題紹介リストを用いて話題を検知する手作業を、話題提供システム１がシナリオデータを用いて話題提供サービスとして再現することができる。

＜＜＜話題解析＞＞＞
次に、改めて、図１５乃至図１８に基づいて、図４における保守装置３に設けられた話題解析部について説明する。前述したように、保守装置３は、話題提供システム１の契約者がユーザに提供したい情報を含めて事前に作成するためのシナリオデータ検証部を構成している。そして、ユーザに提供したい情報（話題紹介リスト）を作成するためには必要が無いが、シナリオデータ検証部に対して前述した状態制御指標記憶部を加えることにより、この実施形態の保守装置３は、仮想的に前記会話制御端末装置２として機能させるための端末装置仮想構築部としても機能するように構成している。つまり、前記状態制御指標記憶部をシナリオデータ検証部に加えることにより端末装置仮想構築部を構成し、この端末装置仮想構築部が前述したtopiclet２０とiWA Manager４０とに相当する。

図１５に図示されているように、本話題解析部によれば、話題を解析することが可能であるとともに、話題紹介リストの可視化を行うための出力を行うことができる。つまり、話題を関係付ける関連詞を介して、話題の近さや繋がり方を付与した話題リストを生成することが話題解析部で実行されるようにしている。また、保守装置３は、この話題解析部に加えて、話題リストと前記関連詞とを利用してユーザに話題を紹介するための話題紹介リスト（図１７における話題リストに相当）、及びユーザの入力に応答するための入力関連シナリオを前記シナリオデータとして編集可能にするためのシナリオデータ編集部とを有していることも特徴としている。保守装置３の場合には、会話制御端末装置２に仮想的に構築しているので、ここでのユーザの入力はシミュレーター（担当者）の入力に相当する。

以下、前述した話題解析部における話題解析、話題紹介リストの生成、シナリオデータ編集部によるシナリオデータ編集について説明する。

＜＜＜話題解析に基づく応答の出力＞＞＞
図１５は、話題解析に基づいて応答情報を生成して応答情報を出力部に出力する過程を示す図である。図１６は、話題紹介リストの構成の例を示す図である。図１７は、話題の抽出、関連詞辞書の生成及び嗜好辞書の生成の過程を示す図である。話題解析は、話題解析部によって実行されて、サーバとしてのiWA３０の嗜好辞書や関連詞辞書が構築される。保守装置３のＣＰＵ等で構成される制御部は、これらの辞書を利用して、契約者の担当者が入力した複数の話題（話題ネタ）の夫々に、話題に含まれる複数の関連詞を自動的に付与する。

図１５は、話題解析に基づいて応答情報を生成して応答情報を出力部に出力する過程を示す図である。

話題解析をした結果、iWA３０によって、入力関連シナリオや話題紹介シナリオからシナリオデータを生成する。iWA３０によって、識別情報などの要素から入力特定情報を生成する。iWA３０によって、関連詞の集合と話題とから話題リストを生成する。

そして、生成したシナリオデータと入力特定情報と話題紹介リストとに基づいて応答情報を生成し、出力部２２０から応答情報を出力する。

このようにすることで話題解析から応答情報を生成し、応答情報を出力することができる。話題解析により応答情報を生成することにより、ユーザとの会話で用いる応答情報をユーザの各々に対して適切な内容にすることができ、ユーザとの会話をより円滑にすることができる。

＜話題紹介リストの構成＞
図１６は、話題紹介リストの構成の例を示す図である。

話題紹介リストは、関連詞集合と話題との組のリストである。関連詞集合は、話題に含まれている関連詞の集合である。関連詞の近傍は、ある関連詞Ａに着目した場合に、関連詞Ａを含む関連詞の集合である。関連詞の近傍系は、関連詞の近傍の集合である。関連詞の近傍数は、関連詞の近傍系の要素数である。関連詞の位相は、関連詞の近傍系を見ることによりわかるものである。話題解析を実施することにより、全ての関連詞の組に対して近傍系を表示できる。嗜好解析を実施することにより、関連詞の近傍系を嗜好順に表示することができる。話題紹介に関わるシナリオは、関連詞の近傍系に基づき話題の近さや繋がりに基づいて構成できるシナリオである。

＜話題の抽出、関連詞辞書の生成、嗜好辞書の生成＞
図１７は、話題紹介リストの作成と、嗜好辞書を用いたユーザのプロファイリング化とを示す図である。

前記話題紹介リストは、図１７における保守装置３に設けられた表示装置の画面（符号１８１３と符号１８１１）に示されるような表示形態で可視化されて、関連詞辞書Ｆや外部のニュースソースから得た話題リストＧをiWA３０から抽出しつつ、担当者の入力による話題の手入力と、外部から取り入れた話題のデータ群からなる前記話題リストＧに基づき保守装置３の制御によって自動的に話題を追加構築されていくものである。

話題紹介リストに話題（画面１８１３と１８１１の話題ネタ設定の欄）として入力され表示される内容の入力源は、第１に、契約者の担当者が、保守装置３の入力装置としての入力キーボードで話題ネタを直接にインプットして設定する第１形態と、iWA３０が外部から収集したログデータ、たとえば、ツイッターやブログなどのネットワークを介して収集できるデータから前記保守装置３の入力装置で担当者が入力した話題に基づいて、自動的にiWA３０が話題ネタを抽出する（１８１１）第２形態が存在する。抽出した話題から、話題紹介リストの候補となる話題閲覧リストのデータが生成される。iWA３０は、保守装置３を通じて担当者が手入力した話題に対し、画面１８１５に表示するために、関連詞辞書Ｆを参照して、複数の関連詞がiWA３０の制御の基で入力された話題に関連付けられる段階と、次に、担当者が手入力した話題に対して関連づけられた関連詞辞書をキーとして、iWA３０が外部から収集した一般的なニュース群からなる話題リストＧを参照し、担当者が入力した話題と関連する外部の話題を自動的にiWA３０が抽出し、その抽出したデータを保守装置３が受信して画面１８１１に示すように表示する段階とを主な構成している。

そして、担当者は入力キーボードなどの直接的な入力装置による話題の入力と、外部からの情報をiWA３０が予め蓄積した話題リストのデータベースから得られた話題を自動的な減数又は追加を繰り返しつつ話題紹介リストを構築するのである。

一方、本実施例の保守装置３では、前述した話題紹介リストの生成に加えて、iWA３０から得られた嗜好辞書Ｅを参照しつつ、入力された話題に対して、関連詞辞書Ｆに基づいて紐付された画面１８１５に表示される関連詞群と、他のユーザの応答履歴から生成されたユーザＩＤとユーザタイプと、関連詞とが関連付けられたユーザタイプリストのデータの関連詞を比較する。この比較によって、例えば、画面１８１７に示すように、ある話題に対する関連詞として抽出された「一番怖い」が、過去の他のユーザ履歴で構築された嗜好辞書Ｅを参照して、どのようなユーザタイプのユーザが入力した情報に、同じような関連詞が関連付けられたかを分析処理して表示して可視化を行うことができる。

この分析結果は同じ関連詞を入力したユーザを特定するためのユーザＩＤと、ユーザタイプ（例えば、昨日のお客）と、全てのユーザに共通する関連詞とともに記憶され、この記憶されたデータに基づいて、ユーザの嗜好を分析するために利用することができる。その利用の仕方としては、例えば、同じ嗜好を持つと考えられるようなユーザに、その嗜好に合致すると考えられる特定のサービスを、前記ユーザＩＤからユーザのメールアドレス等の送付先を特定できるので、送付先を特定して配信したり、サービス以外でも嗜好に合った話題を前記特定した送付先に提供したりするために利用することが可能となる。

図１８に示すのが、前述した保守装置３の第１形態による手入力によって話題が話題ネタ設定画面に入力されて、前記関連詞辞書、前記話題リストによって話題紹介リストを生成しサーバとしてのiWA３０に出力するまでの処理の流れを示したものである。図１７では、嗜好辞書を用いて入力された話題からユーザのプロファイルを行う処理を説明したが、このプロファイルを行う処理は話題紹介リスト生成とは異なる処理となるので、この図１８のフローでは入力された話題からユーザのプロファイルを行う処理の説明を省略する。

図１８を参照して、保守装置３の制御部は、保守装置３の表示画面に話題ネタの設定画面を表示して、話題の入力が前記担当者により実行されるのを待つ（S2000）。

次に、入力画面に対して話題がキーボード等の入力装置を介して入力され、話題ネタ設定のスイッチが入力されたと判定された場合（S2001：YES）、サーバとしてのiWA３０に対して、話題ネタ設定された話題ネタが送信され、この送信された話題ネタのデータの内容に応じて、関連詞辞書ＦからiWA３０のＣＰＵの制御の基で１つ以上の関連詞が抽出される。図１７の画面１８１３の場合には、話題ネタとして「パニック議論ネタ」が保守装置３からiWA３０に送信され、この「パニック議論ネタ」の内容からiWA３０のＣＰＵの制御の基で、「パニック」という関連詞が抽出される。そして、この関連詞「パニック」をキーとして、予めiWA３０のデータベース内に存在する話題リストＧのデータから、関連する話題を抽出すると、画面１８１３に図示されているように、話題リスト（選択話題数：1424 全話題数1424）スルーブット：17.25が表示される。この画面１８１３から見出せるのは、「パニック」という関連詞をキーとして、iWA３０のＣＰＵの制御の基で、１４２４の話題が抽出されて、最終的に話題紹介リストを構成する可能性のある１４２４個の話題とその話題に関連付けられた複数の関連詞が、保守装置３に受信されて画面１８１３に図示される。端的に説明すると、図１７の画面１８１３の表示を行うための、「パニック」という関連詞をキーとして、複数の話題と、それぞれの話題に対して複数の代表関連詞が関連つけられたリストデータを表示するためのデータをiWA３０から受信する（S2002）。

このような入力は、第１回目の「パニック」という関連詞をキーとして１４２４件の話題が話題紹介リスト候補として提供可能に生成され表示されたが、この数が多い場合は、可視化されている話題の内容を前記担当者が判断して、より目的となる話題紹介リストに採用する話題となるように絞込みを実行することができる。つまり、図１８のフローを参照して、ステップS2004の話題紹介リストのリストデータとして確定させることなく、一定時間経過後にタイムアウトして、再度に、ステップS2001における追加の話題ネタの入力を実行することができる。例えば、画面１８１５では、第２回目の「安心します」という話題ネタを入力することによって、入力された代表関連詞と話題となる受信されたデータを表示したものであり、そこには、選択話題数１３６全話題数１４２４スループット：１６．５４と表示される。つまり、話題提供リストとして生成中のリストデータは、１４２４から１３６へ減数したということになる。これによって、前記担当者の意向に沿った話題提供リストに近い形態に改変されたことになる。

さらに、新たな話題を担当者が思いつかないような場合には、その表示形態を関連詞中心とした表示形態に変更することができる。この表示形態は、画面１８１５に示されるように「条件設定：優先関連詞」を前記入力装置の操作によって入力することで、関連詞を優先したリスト形態で表示することができるようになっている。つまり、第２回目の話題に対して、iWA３０のＣＰＵの制御の基で付与した複数の関連詞は、図１７の画面1815に示すように、１３６個の各話題（１，２，３・・・・，１３６）ごとの行に、複数の関連詞が複数列で表示される表示形態に切り替えることが可能となっている。この表示形態の切替は、前述したように、保守装置３の図示しない制御部は、前記入力装置の画面切替入力に応じて、行ごとに表示される話題ごとの関連詞を列方向に列挙する形態に表示変更する。前記担当者は、この表示形態から自らが作成しようとする話題紹介に適した関連詞を画面１８１５に表示される複数の関連詞から決定し、その関連詞を前記入力装置で入力することが可能である（Ｓ2001：ＹＥＳ）。この入力した状態を示すのが、画面１８１１であり、この場合は、関連詞「一番怖い」を新たな話題ネタとして入力した。そして、関連詞「一番怖い」を話題リストのデータベースをiWA３０のＣＰＵの制御の基で参照し、入力された話題ネタに基づいて、複数の関連詞と話題とからなる新たな話題紹介リストの候補としてのリストデータを受信し（Ｓ2002）、表示する（Ｓ2003）。

前記話題リストＧは、サーバとしてのiWA３０が外部からインターネットなどの外部情報収集手段によって集めた情報からなるリストである。そして、話題リストＧの各話題には、複数の関連詞が予め関連付けてiWA３０のデータベースに記憶されている。このように、この実施形態では、前記担当者の知識不足や能力不足で、話題を設定するバリエーションが陳腐なものとなる可能性があって、サーバとしてのiWA３０話題リストから得た他の関連話題を抽出して、保守装置３の画面に話題そのものと、その話題に関連する複数の関連詞を表示することによって可視化することになるから、これらの話題リストから得た話題をベースに前述したように遷移する話題のバリエーションを豊富なものとできる可能性が高まるのである。

前述したような話題提供リストの候補の改変は、入力完了の入力がなされる（S2004：YES）まで、所定時間が経過するとタイムアウトして、上述した話題を入力させるための入力画面を表示し、次の話題を待って、上記S200〜S2003の処理を順次繰り返す。

そして、入力完了の入力（S2004：YES）がなされると、サーバとしてのiWA３０に対して話題紹介リストとしてのデータを出力する（S2005）。

＜＜＜情報検索システムにおける技術的思想の概要＞＞＞
本発明の情報検索システムは、図１に示すような話題提供システム１の仕組みを用いて、ユーザに、既知でない最新の話題を取得しうるキーワード（文字列）を提供するものである。最初に、本発明の情報検索システムにおける技術的思想の概要について、図１９を参照して説明する。

本発明の情報検索システムでは、個人が生成した風説情報等を含む外部ログ５０２から、文解析処理５１１、嗜好解析処理５１２、話題解析処理５１３を経て、話題を識別可能な重要な文字列（特定文字列）の関係性や分布状況を表示し、この表示をユーザが閲覧することによって話題（トピック）を把握することができる。外部ログ５０２の入力から特定文字列の表示の提供までが瞬時に行われる。特定文字列の例として、ここでは関連詞が用いられる。

例えば、インターネット上のＷＥＢページ等を検索した結果を話題情報ととらえると、この話題情報を圧縮・要約することにより、話題情報の要約である話題辞書が得られる。本発明の情報検索システムでは、話題辞書の圧縮は、上述した文解析処理５１１の前に行われる。例えば、ＷＥＢページ等を検索した結果のうち、タグやスクリプト文などを除いた、話題情報となりうるテキストデータだけが抽出され、そのように抽出されたテキストデータが文解析処理５１１の処理対象となる。

より具体的な例では、企業情報（話題情報）は、個人が生成したテキストデータからなる、企業に関わる情報であり、これは、企業に関わる知識空間である。この知識空間を、上述の処理で、言語に関わる辞書を利用することなく圧縮・要約して、部分知識空間に変換する。このような処理により、結果的に、企業情報が識別できる分解テキストデータ（関連詞）の集合からなる辞書（企業に関わる部分知識空間）が得られる。この部分知識空間には、後述するように、関連詞同士の繋がりを表す情報が含まれる。

会話制御端末装置２’’において、（例えば、会話制御端末装置２’’のユーザから）外部ログ５０２を収集するための条件が与えられ、上述した処理（文解析処理５１１、嗜好解析処理５１２、及び話題解析処理５１３）の処理結果として、会話制御端末装置２’’に関連詞が提供される。会話制御端末装置２’’は、例えば、ＰＣ（パーソナルコンピュータ）、スマートフォン、ロボットといった装置であり、会話制御端末装置２’’がＰＣであれば、処理結果の関連詞は、会話制御端末装置２’’のディスプレイに表示され、それらが、会話制御端末装置２’’のユーザに、瞬時に話題を把握するための情報として提供される。会話制御端末装置２’’は、上述の会話制御端末装置２や会話制御端末装置２’の変形例として構成される。

上述の文解析処理５１１、嗜好解析処理５１２、及び話題解析処理５１３は、話題提供サーバ４’によって行われる。話題提供サーバ４’は、上述の話題提供サーバ４の変形例として構成される。

＜＜文解析処理の概要の説明＞＞
文解析処理５１１は、外部ログ５０２に含まれる文情報を、文字列の出現特性に基づいて解析し、関連詞５０３を選出する。

文解析処理５１１は、外部ログ５０２から、形態素データのような事前に記憶・調製された辞書データを用いることなく、話題を識別可能な関連詞を選出（抽出）する。すなわち、外部ログ５０２に出現する共通の文字列を検索し、それらの文字列の直前の隣接文字の異なり度合い、及び直後の隣接文字の異なり度合いに応じて、関連詞を抽出する。

外部ログ５０２は、上述のように個人により作成した風説情報（例えば、所定のログフォーマットにより記憶されたデータ、インターネット上に公開されているＷＥＢページ（ホームページ）やブログのテキストデータ、及びTWITTER（登録商標）のツイート情報）や、任意の機関によって事前に生成・編集されたデータやデータベース内のテキスト情報が含まれる。また、音声ファイル・動画ファイルから音声認識処理を経て取得されるテキストデータ等、様々なデータであってもよい。

また、外部ログ５０２は、収集条件によって収集されたデータである。例えば、キーワード検索の検索結果として示されたＷＥＢページ（ホームページ）５０１に記載されているテキストデータや、ある属性を有するユーザのブログに記載された文や、TWITTERにおけるツイート情報などであってもよい。キーワード検索における検索条件等は、ユーザが、会話制御端末装置２’’から指定することができる。なお、１つの外部ログ５０２は、複数のテキストファイルを含むもの（例えば、１つのＷＥＢサイトに含まれる複数のＷＥＢページ（ＨＴＭＬファイル）を含むもの）であってもよいし、１つのテキストファイルを分割した一部（例えば、１ファイルに含まれるテキストを１万ラインごとに分割したうちの１つ）であってもよい。

＜＜嗜好解析処理の概要の説明＞＞
嗜好解析処理５１２は、文解析処理５１１によって抽出された関連詞について、それらの使われ方を内部ログ５０６に基づいて捉え、それらの重要性を判定する。

内部ログ５０６はユーザ（ユーザの所属する機関や組織等を含む）の嗜好を示すデータであり、例えば、所定のログフォーマットにより記憶されたデータである。内部ログ５０６は、例えば、ユーザによってどのような関連詞が利用される傾向にあるか等を示すデータを含む。このように、ユーザの嗜好に応じた重要度によって関連付けられた関連詞を、本明細書では、話題鍵（クラスタ）５０４と称する。

＜＜話題解析処理の概要の説明＞＞
話題解析処理５１３は、嗜好解析処理５１２によって生成された話題鍵５０４について、話題ネタ５０７に基づいて、その分布を捉え、互いに関連付けられた関連詞の分布をユーザに提供する。

話題ネタ５０７は、上述のように、契約者の担当者が、保守装置３の入力装置で直接インプットして設定する場合と、話題提供サーバ４’が、保守装置３の入力装置で担当者が入力したキーワードに基づいて、外部から収集した外部ログ５０２（例えば、TWITTERやブログなどのネットワークを介して収集できるデータ）から自動的に抽出する場合等がある。

こうした話題解析処理５１３によって、話題のなかで関連詞がどのように分布しているかを示すことができ、会話制御端末装置２’’のユーザに合わせて関連詞を推奨するようにもできる。

＜＜＜情報検索システムの概要＞＞＞
次に、図２０を参照して、情報検索システムの概要について説明する。図２０に示す情報検索システム１００は、会話制御端末装置２’’、及び話題提供サーバ４’を含み、会話制御端末装置２’’と話題提供サーバ４’の間は、所定のネットワーク（ＬＡＮ、インターネット、ＷＡＮ、無線通信等）で接続される。

＜＜会話制御端末装置２’’の概要＞＞
会話制御端末装置２’’は、入力制御部２１、検索制御部２２、送信制御部２３、受信制御部２４、応答情報決定部２５、出力制御部２６、及びネットワークインタフェース（Ｉ／Ｆ）部２７を含む。また、ＲＡＭのような主記憶装置、またはハードディスクや半導体メモリのような外部記憶装置に、シナリオデータ２８を記憶する。

入力制御部２１は、会話制御端末装置２’’のユーザがキーボードやマウス等を用いて入力を受け付け、入力の内容に応じて入力データ等を対応する機能部に渡す。例えば、ユーザは、キーボードにより検索キーワードを入力したり、マウスにより興味のある関連詞の表示領域をクリックしたりする。

検索制御部２２は、会話制御端末装置２’’で動作する一般的なＷＥＢブラウザを含む。会話制御端末装置２’’は例えばインターネットに接続されており、ユーザがこのＷＥＢブラウザを操作して、ＷＥＢページの検索（一般的に利用可能なインターネット検索）を行うと、検索制御部２２は、得られた検索結果を送信制御部２３に送信する。検索結果には、検索キーワードに関連するＷＥＢページのアドレス（例えば、ＵＲＬ等のインターネットアドレス識別情報）が含まれている。

送信制御部２３は、検索制御部２２から検索結果を受信すると、これを、例えば、ＡＰＩ送信により、入力情報として、話題提供サーバ４’の入力情報分析部４１に送信する。

受信制御部２４は、話題提供サーバ４’の入力情報分析部４１から送信される入力特定情報等を受信し、これを応答情報決定部２５に供給する。

応答情報決定部２５は、シナリオデータ２８と入力特定情報とに基づいて応答情報を決定する。入力情報分析部４１から、入力特定情報（例えば、関連詞の分布を表示するためのデータ）と当該表示に必要であると判断されたシナリオデータとに基づいて応答情報を決定する。

出力制御部２６は、応答情報決定部２５により決定された応答情報を会話制御端末装置２’’に表示するよう制御する。

ネットワークインタフェース部２７は、ネットワークを介して接続された話題提供サーバ４’との間のアクセスやデータ送受信、及びその他のコンピュータ（例えば、インターネットを介して接続されるインターネット検索エンジンを備えるサーバ等）との間のアクセスやデータ送受信を制御する。

シナリオデータ２８は、図１４に示すような、ユーザに提供する話題に関する応答情報を規定するためデータである。シナリオデータ２８は、後述する話題提供サーバ４’のシナリオデータ５５に予め記憶されているデータである。話題提供サーバ４’の入力情報分析部４１によって生成された入力特定情報に基づいて必要であると判断されたシナリオデータが、シナリオデータ５５から抽出され、抽出されたシナリオデータが、会話制御端末装置２’’のシナリオデータ２８に記憶される。シナリオデータ５５から抽出されたシナリオデータは、受信制御部２４と応答情報決定部２５の処理によってシナリオデータ２８に記憶される。

話題提供サーバ４’のシナリオデータ５５にすべてのシナリオデータを記憶させておき、異なる話題への遷移を規定する情報に基づいて、シナリオデータ５５のシナリオデータから組み替え直したシナリオデータを生成し、組み替え直されたシナリオデータのみを会話制御端末装置２’’のシナリオデータ２８に記憶することができる。

＜＜話題提供サーバ４’の概要＞＞
話題提供サーバ４’は、入力情報分析部４１、及びネットワークインタフェース（Ｉ／Ｆ）部４７を含む。また、ＲＡＭのような主記憶装置、またはハードディスクや半導体メモリのような外部記憶装置に、検索結果データ４８、関連詞候補データ４９、関連詞辞書５０、嗜好データ５１、関連詞・共起語データ５２、話題データ５３、比較結果データ５４、及びシナリオデータ５５が記憶される。なお、これらのデータは、様々なデータフォーマット、データ記憶形式をとることができる。

入力情報分析部４１は、会話制御端末装置２’’から受信した入力情報を分析して入力特定情報を生成する。入力特定情報は、入力情報に含まれる各種の情報を分析した結果、生成される情報であり、例えば、後述する関連詞の分布などが含まれる。入力情報分析部４１はさらに、外部ログ取得制御部４２、文解析部４３、嗜好解析部４４、話題解析部４５、及び情報更新部４６を含む。

外部ログ取得制御部４２は、会話制御端末装置２’’から受信した入力情報が、外部ログ５０２を識別する識別情報（例えば、検索キーワードに関連するＷＥＢページ５０１のアドレスを含む検索結果）である場合に、例えば、インターネット経由でその識別情報にアクセスし、対応するＨＴＭＬデータ等を取得する。また、会話制御端末装置２’’から受信した入力情報が、関連詞を抽出する対象となるテキストデータそのものを含んでいる場合は、そのデータを外部ログ５０２として文解析部４３に提供する。

また、所定の間隔で自動起動されるクローラー（図３９参照）から、外部ログ５０２を識別する情報（例えば、検索キーワードに関連するＷＥＢページ５０１のアドレスを含む検索結果）を受信した場合は、当該外部ログ５０２にアクセスし、対応するデータを取得して、取得したデータを、関連詞辞書を比較するために情報更新部４６に提供する。

文解析部４３は、外部ログ取得制御部４２によって取得された外部ログ５０２からテキストデータを取得し、文字列の出現特性に応じて当該テキストデータに含まれる重要な関連詞を抽出し、関連詞辞書５０に記憶する。

嗜好解析部４４は、文解析部４３によって関連詞辞書５０に記憶された関連詞について、嗜好データ５１に基づいて重要性を判定し、判定結果を関連詞・共起語データ５２に記憶する。嗜好データ５１は、ユーザによる関連詞の利用態様を記憶した内部ログ５０６を含むデータである。

話題解析部４５は、嗜好解析部４４によって生成された関連詞・共起語データ５２に記憶された関連詞について、話題データ５３に基づいて、その分布を捉え、互いに関連詞を関連付け、関連詞・共起語データ５２を更新する。話題データ５３は、契約者の担当者がインプットして設定、または自動的に抽出された話題ネタ５０７を含むデータである。

情報更新部４６は、異なる収集条件により収集されたテキストデータに基づいて、それぞれ関連詞を選出して関連詞辞書を生成し、こうして生成された関連詞辞書を比較し、比較結果を比較結果データ５４に記憶する。

ネットワークインタフェース部４７は、ネットワークを介して接続された会話制御端末装置２’’との間のアクセスやデータ送受信、及びその他のコンピュータ（例えば、インターネットを介して接続されるインターネット検索エンジンを備えるサーバ等）との間のアクセスやデータ送受信を制御する。

なお、この実施例では、情報検索システム１００を、会話制御端末装置２’’、及び話題提供サーバ４’を含むシステムとして説明したが、会話制御端末装置２’’、及び話題提供サーバ４’を一体化させた１つのコンピュータとして構成することもできる。また逆に、同様の機能を、ネットワーク接続された３つ以上のコンピュータに分散させて実現することもできる。また、文解析部４３を、１つの独立した文解析装置として構成することができ、同様に、情報更新部４６を、１つの独立した情報更新装置として構成することができる。文解析装置と情報更新装置がネットワークを介して他の装置と接続され、上述の情報検索システム１００を構成することができる。

＜文解析部の概要＞
次に、図２１を参照して、文解析部４３の概要について説明する。文解析部４３では、テキストデータから同じ文字列を検索し、当該検索された同じ文字列についてそれぞれ、前の隣接文字の異なり度合いと後の隣接文字の異なり度合いを判定し、その判定された異なり度合いに基づいて、その検索された「同じ文字列」が、話題に関して重要性が高く、テキストデータを意味識別可能な関連詞であるか否かを決定する。前の隣接文字の異なり度合いとは、検索された「同じ文字列」の直前に出現する文字が、どの程度異なっているかを示す指標である。同様に、後の隣接文字の異なり度合いとは、検索された「同じ文字列」の直後に出現する文字が、どの程度異なっているかを示す指標である。

ここで、例えば、検索された「同じ文字列」のうち、前の隣接文字の異なり度合いと後の隣接文字の異なり度合いが大きい文字列が、関連詞として決定される。このようにして決定された１つまたは複数の文字列は、必要に応じて、所定の記憶手段に記憶される。

このような文字列の抽出は、テキストデータに含まれる複数の同じ文字列に注目したときに、それぞれの文字列の直前に位置する文字として多くのバリエーションの文字が出現するとともに、それぞれの文字列の直後に位置する文字として多くのバリエーションの文字が出現するという出現特性が認められる場合、その文字列が、独立した、よく用いられる用語である、との考えに基づくものである。このように、本発明の文解析部４３では、文字列の運動学（kinematics）を基礎におく考えに基づいて文字列が抽出される。

ここで、「いろは」という文字列が１００回出現する日本語テキストデータを仮定すると、この文字列「いろは」を１００個検索し、それぞれの文字列「いろは」について、直前の文字が何かを調べる。その結果、「あ」や「い」を含む３０通りの文字が出現するという事実が得られるものとする。このことは、例えば、「・・・あいろは・・・」や「・・・いいろは・・・」といった表現が、上記の日本語テキストデータに存在するということを示している。一方、それぞれの文字列「いろは」について、直後の文字が何かを調べる。その結果、「わ」や「ん」を含む２０通りの文字が出現するという事実が得られるものとする。このことは、例えば、「・・・いろはわ・・・」や「・・・いろはん・・・」といった表現が、上記の日本語テキストデータに存在するということを示している。

この場合、前の隣接文字の異なり度合いは、例えば、「あ」や「い」を含む３０通りというバリエーションの数に基づいて判定され、後の隣接文字の異なり度合いは、例えば、「わ」や「ん」を含む２０通りというバリエーションの数に基づいて判定される。ここで、前の隣接文字の異なり度合いと後の隣接文字の異なり度合いが大きいと判定された場合は、「いろは」という文字列の前後の文字が大きな多様性をもって変化しており、これによって文字列「いろは」が、独立した用語であって重要性の高い語である可能性が高いと判断され、関連詞として決定され、必要に応じて記憶手段に記憶される。前の隣接文字の異なり度合いと後の隣接文字の異なり度合いが大きいか否かは、共通の、または個別の判断基準により判断される。

文解析部４３は、テキストデータ取得処理部４３ａ、文字列検索処理部４３ｂ、異なり度合い判定処理部４３ｃ、及び関連詞決定処理部４３ｄを備える。さらに、関連詞決定処理部４３ｄには、関連詞決定部４３ｄ−１、及びランク付け管理部４３ｄ−２が含まれる。

テキストデータ取得処理部４３ａは、外部ログ５０２（処理の対象となるテキストデータ）を取得し、これを文字列検索処理部４３ｂに提供する（後述の図２５に示すテキストデータ取得処理５２０）。文字列検索処理部４３ｂは、図２５に示す文字列検索処理５３０を行う。異なり度合い判定処理部４３ｃは、図２５に示す異なり度合い判定処理５４０を行う。

関連詞決定処理部４３ｄは、関連詞を決定し、必要に応じて、決定された関連詞を関連詞辞書５０に記憶する（図２５に示す関連詞決定処理５５０）。

また、関連詞決定部４３ｄ−１は、外部ログ５０２に含まれる同じ文字列に関する前後の隣接文字の異なり度合い等から、当該同じ文字が関連詞であるか否かを決定する。ランク付け管理部４３ｄ−２は、１つの外部ログ５０２において、複数の関連詞が決定される場合に、必要に応じてその関連詞についてランク付けを行う。

＜情報更新部の概要＞
次に、図２２を参照して、情報更新部４６の概要について説明する。情報更新部４６は、テキストデータ取得処理部４６ａ、文字列抽出処理部４６ｂ、辞書比較処理部４６ｃ、及び比較結果出力部４６ｄを備える。

テキストデータ取得処理部４６ａは、外部ログ５０２（処理の対象となるテキストデータ）を取得し、これを文字列抽出処理部４６ｂに提供する（後述の、図３９に示すテキストデータ取得処理７００）。文字列抽出処理部４６ｂは、外部ログ５０２から関連詞を抽出し、これを、対応する関連詞辞書５０に記憶する（図３９に示す文字列抽出処理７１０）。文字列抽出処理部４６ｂは、例えば、上述した文解析部４３による処理と同様の処理である。

辞書比較処理部４６ｃは、複数の関連詞辞書５０を比較し、比較結果を比較結果データ５４に記憶する（図３９に示す辞書比較処理７２０）。

比較結果出力部４６ｅは、比較結果データ５４から表示すべき比較結果を取得し、これを含む入力特定情報を会話制御端末装置２’’に送信する。

＜＜＜本発明の情報検索システムをＦＡＱ検索に適用した実施例の説明＞＞＞
次に、本発明の一実施形態に係る情報検索システムを用いて、ユーザの指示に応じてＦＡＱ検索の結果を表示するＦＡＱ検索システムについて説明する。

＜＜ＦＡＱ検索システムの画面遷移＞＞
図２３には、ＦＡＱ検索システムの画面遷移が示されている。ユーザは最初に、会話制御端末装置２’’において所定の指示を行い、ディスプレイにＦＡＱ検索画面６００を表示させて、そこで所望の検索キーワードを（キーボード等を用いて）入力する。ＦＡＱ検索画面６００は、例えば、図３５（Ａ）に示すような入力指示画面であり、ＦＡＱ検索画面６００には、検索キーワード入力部６０１と「ＦＡＱ検索」ボタン６０２が表示されている。

ユーザがここで、検索キーワード入力部６０１に検索キーワード（図３５（Ａ）の例では、「ネットワーク」）を入力し、「ＦＡＱ検索」ボタン６０２をマウス等でクリックすると、ＦＡＱ候補表示画面６１０が表示される。ＦＡＱ候補表示画面６１０は、例えば、図３５（Ｂ）に示すような表示画面であり、関連詞索引表示部６１１、候補質問文表示部６１２、及び「ＦＡＱ検索画面に戻る」ボタン６１３が表示されている。候補質問文表示部６１２に示された質問は、すべて「ネットワーク」に関するもので、ユーザが入力した検索キーワードに基づいて検索された結果が表示されている。関連詞索引表示部６１１に示された関連詞の集合は、それぞれ対応する質問に含まれる関連詞の集合である。ユーザがここで、「ＦＡＱ検索画面に戻る」ボタン６１３をクリックすると、会話制御端末装置２’’のディスプレイの表示がＦＡＱ検索画面６００に戻る。

ＦＡＱ候補表示画面６１０において、ユーザが候補質問文表示部６１２に表示された候補質問文のうちの１つをマウスのクリック等によって選択すると（矢印（１））、ＦＡＱ表示画面６３０が表示される。ＦＡＱ表示画面６３０は、例えば、図３６に示すような表示画面であり、質問表示部６３１、関連詞索引表示部６３２、回答表示部６３３、及び「ＦＡＱ候補表示画面に戻る」ボタン６３４が表示されている。ユーザがここで、「ＦＡＱ候補表示画面に戻る」ボタン６３４をクリックすると、会話制御端末装置２’’のディスプレイの表示がＦＡＱ候補表示画面６１０に戻る。

ＦＡＱ候補表示画面６１０において、ユーザが関連詞索引表示部６１１に表示された関連詞索引のうちの１つをマウスのクリック等によって選択すると（矢印（２））、関連詞・共起語一覧表示画面６５０が表示される。関連詞・共起語一覧表示画面６５０は、例えば、図３７に示すような表示画面であり、ＮＯ表示部６５１、関連詞表示部６５２、近傍関連詞表示部（６５３〜６５６）、及び「ＦＡＱ候補表示画面に戻る」ボタン６５７が表示されている。ユーザがここで、「ＦＡＱ候補表示画面に戻る」ボタン６５７をクリックすると、会話制御端末装置２’’のディスプレイの表示がＦＡＱ候補表示画面６１０に戻る。

関連詞・共起語一覧表示画面６５０において、ユーザが関連詞表示部６５２または近傍関連詞表示部（６５３〜６５６）に表示された関連詞のうちの１つをマウスのクリック等によって選択すると、ＦＡＱ検索画面６６０が表示される。ＦＡＱ検索画面６６０は、例えば、図３８（Ｂ）に示すような表示画面であり、これは、図３５（Ａ）に示すＦＡＱ検索画面６００と実質的に同様のものであり、画面制御が元に戻ったことを示している。そして、ＦＡＱ検索画面６６０の検索キーワード入力部６６１には、検索キーワードとして、関連詞・共起語一覧表示画面６５０で選択した関連詞（例えば、図３７の例では、「ＳＮＳ」）が、自動的にセットされる。

ユーザがこの状況で、「ＦＡＱ検索」ボタン６６２をクリックすると、再び、ＦＡＱ候補表示画面６１０が表示され、今度は、「ＳＮＳ」に関する質問文が、候補質問文表示部６１２に示される。

＜＜ＦＡＱ候補表示画面の表示処理に関する説明＞＞
次に、図２４を参照して、ＦＡＱ候補表示画面の表示処理について説明する。図２４は、ＦＡＱ候補表示画面の表示処理を表すフローチャートであり、会話制御端末装置２’’と話題提供サーバ４’においてそれぞれどのような処理が行われるかを示している。会話制御端末装置２’’では、例えば、上述したTopiclet２０によって各処理が行われ、図３５〜図３８に示した、会話制御端末装置２’’のディスプレイへの画面表示は、ここでは、Topiclet２０によって、またはTopiclet２０の制御によって動作するＷＥＢブラウザ等によって行われる。

最初に、ステップＳ１１において、ユーザがＦＡＱ検索画面６００で「ＦＡＱ検索」ボタン６０２をクリックしたか否かが判定される。「ＦＡＱ検索」ボタン６０２がクリックされない間は（ＮＯ）、この判定が繰り返される。「ＦＡＱ検索」ボタン６０２がクリックされた場合（ＹＥＳ）、ステップＳ１２において、ユーザによって検索キーワード入力部６０１に入力された検索キーワードによる検索結果を入力情報として話題提供サーバ４’に送信する。この実施例においては、検索結果は、一般的なインターネット検索サイトでキーワード検索を行った結果であり、Topiclet２０は、このインターネット検索サイトでの検索を制御し、検索結果をＡＰＩ送信により話題提供サーバ４’に送信する。検索結果は、例えば、当該キーワード検索にヒットしたＷＥＢページのアドレスである。

話題提供サーバ４’が会話制御端末装置２’’から入力情報を受け取ると、ステップＳ１３において、入力情報を分析し、入力情報に含まれるＷＥＢページのアドレスにアクセスして、ＷＥＢページに対応するＨＴＭＬデータ等から、対象となるテキストデータとなる外部ログ５０２を取得する。

次に、話題提供サーバ４’は、ステップＳ１４において、取得した外部ログ５０２に対して文解析処理を実行し、外部ログ５０２から関連詞を抽出する。文解析処理については、後で詳細に説明する。

その後、話題提供サーバ４’は、ステップＳ１５において、ステップＳ１４で外部ログ５０２から抽出された関連詞から、関連詞辞書５０を生成する。関連詞辞書５０には、外部ログ５０２内のそれぞれの文情報に対する関連詞索引５０ａが含まれる。

次に、話題提供サーバ４’は、ステップＳ１６において、ＦＡＱ候補表示画面６１０に表示するために、関連詞辞書５０から関連詞索引５０ａ等を取得し、これらの情報を入力特定情報として会話制御端末装置２’’に送信する。

会話制御端末装置２’’は、話題提供サーバ４’から入力特定情報を受信すると（ステップＳ１７）、ステップＳ１８において、受信した入力特定情報とシナリオデータ２８に基づいて、応答情報を決定する。なお、話題提供サーバ４’は、必要に応じてシナリオデータ５５を会話制御端末装置２’’に送信し、会話制御端末装置２’’はこれをシナリオデータ２８に記憶する。

次に、ステップＳ１９において、ステップＳ１８で決定された応答情報を会話制御端末装置２’’のディスプレイに表示する。例えば、図３５（Ｂ）に示すようなＦＡＱ候補表示画面６１０が表示さる。この実施例では、例えば、候補質問文表示部６１２には、収集された質問文の一部（Ｑ１、Ｑ８、Ｑ１３、Ｑ２４、Ｑ２５）が候補質問文としてリスト表示される。また、関連詞索引表示部６１１には、候補質問文として表示された質問文にそれぞれ対応する関連詞索引が示されている。

＜＜文解析処理の詳細な説明＞＞
次に、図２５を参照して、話題提供サーバ４’の文解析部４３（図２０、図２１参照）で実行される文解析処理の概要を説明する。最初に、文解析部４３は、テキストデータである外部ログ５０２を取得する（テキストデータ取得処理５２０）。外部ログ５０２は、前述のように、様々なデータソースから受信することができる。この実施例では、会話制御端末装置２’’から受信したＷＥＢページのアドレスに基づいて、各ＷＥＢページにアクセスし、対応するＨＴＭＬデータ等からテキストデータを取得している。また、取得した外部ログ５０２、または外部ログ５０２を取得する際に、特定のテキストデータだけを取得するようフィルタ処理を行ったり、特定の分類によりグルーピングをしたりすることもできる。

次に、文解析部４３は、テキストデータ取得処理５２０により取得された外部ログ５０２から、同じ（共通の）文字列を検索する（文字列検索処理５３０）。この処理は、例えば、取得した外部ログ５０２の中の「いろは」という同じ文字列を検索し、取り出す処理である。１つのテキストデータに１００個の文字列「いろは」が存在する場合は、そのすべてが取り出される。また、テキストデータの中には、「いろは」以外にも同じ文字列が複数存在する可能性があるが、その場合は、それらの文字列も同様に検索して取り出す。例えば、文字列「いろは」の他に、文字列「にほへと」が複数含まれていれば、その文字列も同様に取り出される。なお、文字列「いろはに」などのように、同じ文字列としてすでに取り出されている「いろは」をそのまま含む文字列が複数ある場合も、文字列「いろは」とは別に、同じ文字列として検索される。

文字列検索処理５３０はさらに、同じ文字列として検索された文字列を、それぞれ、その文字列の前の隣接文字と後の隣接文字とともに、検索結果データ４８に記憶する。検索結果データ４８に記憶されるデータは、例えば、上記の例の文字列「いろは」については、１００個のそれぞれの「いろは」について、文字列「いろは」、「いろは」の前の隣接文字、及び「いろは」の後の隣接文字を含むデータである。上述した例の場合、文字列「にほへと」や文字列「いろはに」についても同様に、それらの文字列と、前の隣接文字、及び後の隣接文字が検索結果データ４８に記憶される。

このように、文字列検索処理５３０において、同じ文字列が検索された場合に、その文字列と、前後の隣接文字を記憶するのは、最終的に、重要な意味を持つ関連詞を決定するためであるが、外部ログ５０２のなかに同じ文字列が複数存在する場合であっても、その出現頻度が所定の頻度に達しない場合は、この時点で、関連詞として決定される可能性がないとの判断を行い、その文字列に関するデータを検索結果データ４８として記憶しないようにすることができる。多くの文字からなる外部ログ５０２において、わずかな回数しか出現しない語（文字列）は、そもそも重要性が高くないと判断できるからである。

また、文字列検索処理５３０において、外部ログ５０２から同じ文字列を検索し記憶するために、本実施形態では、サフィックスアレイ（Suffix Array：接尾辞配列）という検索用データ構造を用い、これを二分探索（Binary Search）により検索することで、同じ文字列を高速に検索している。なお、本実施形態では、上記のような方法により、文字列検索処理５３０を行っているが、他の様々な方法を採用して、同様の検索処理を行うことができる。サフィックスアレイと二分探索を用いた文字列検索処理５３０の処理については、後で詳細に説明する。

次に、文解析部４３は、文字列検索処理５３０によって検索結果データ４８に記憶された文字列とその前後の隣接文字の内容から、前の隣接文字の異なり度合いと後の隣接文字の異なり度合いを判定する（異なり度合い判定処理５４０）。

ここで、１つの文字をｓ（ｉ）と表し、
ｓ（ｉ）〜ｓ（ｊ）より構成される文字列ｍ（ｉ，ｊ）を、
ｍ（ｉ，ｊ）＝（ｓ（ｉ），ｓ（ｉ＋１），ｓ（ｉ＋２），・・・ｓ（ｊ−２），ｓ（ｊ−１），ｓ（ｊ））と表し、
ｓ（ｉ）〜ｓ（ｊ−１）より構成される文字列ｍ（ｉ，ｊ−１）を、
ｍ（ｉ，ｊ−１）＝（ｓ（ｉ），ｓ（ｉ＋１），ｓ（ｉ＋２），・・・ｓ（ｊ−２），ｓ（ｊ−１））と表し、
ｓ（ｉ＋１）〜ｓ（ｊ）より構成される文字列ｍ（ｉ＋１，ｊ）を、
ｍ（ｉ＋１，ｊ）＝（ｓ（ｉ＋１），ｓ（ｉ＋２），・・・ｓ（ｊ−２），ｓ（ｊ−１），ｓ（ｊ））と表す。

この場合、前の隣接文字に関する境界条件は、
Ｔ（ｉ−１）＝｛Ｓ（ｉ−１）｜ｍ（ｉ，ｊ）｝
Ｔ（ｉ）＝｛Ｓ（ｉ）｜ｍ（ｉ＋１，ｊ）｝
で定義され、
後の隣接文字に関する境界条件は、
Ｂ（ｊ）＝｛Ｓ（ｊ）｜ｍ（ｉ，ｊ−１）｝
Ｂ（ｊ＋１）＝｛Ｓ（ｊ＋１）｜ｍ（ｉ，ｊ）｝
で定義される。

ここで、例えば、｛Ｓ（ｉ−１）｜ｍ（ｉ，ｊ）｝は、文字列ｍ（ｉ，ｊ）を共通とし、その直前に出現する文字の集合を意味する。なお、ここで、ｓ（ｉ）∈Ｔ（ｉ）、及びｓ（ｊ）∈Ｂ（ｊ）が成立する。

例えば、Ｔ（ｉ−１）の要素数が多く、Ｔ（ｉ）の要素数が１の場合、ｓ（ｉ）が関連詞の先頭になる可能性が高く、一方、Ｂ（ｊ）の要素数が１で、Ｂ（ｊ＋１）の要素数が多い場合、ｓ（ｊ）が関連詞の末尾になる可能性が高く、結果的に、文字列ｍ（ｉ，ｊ）は、関連詞の候補として判断される。

このように、同じ文字列について、それらの前（または後）の隣接文字の出現態様、すなわち、隣接文字がどれくらいのバリエーションで出現するかに基づいて、同じ文字列についての隣接文字に関する異なり度合いを判定する。前後の隣接文字に関する異なり度合いが判定されると、判定された異なり度合いは、対応する文字列とともに、関連詞候補データ４９に記憶される。なお、異なり度合い判定処理５４０の処理は、後で詳細に説明する。

次に、文解析部４３は、異なり度合い判定処理５４０により判定された、同じ文字列の前後の隣接文字に関する異なり度合いに基づいて、その同じ文字列が関連詞であるか否かを決定し、関連詞であると決定された場合、その文字列を関連詞辞書５０に記憶する（関連詞決定処理５５０）。

上述のように、同じ文字列について、それらの前後の隣接文字にどのようなバリエーションがあるかを見ると、隣接文字の出現要素数が小さい場合、その隣接文字と「同じ文字列」は一体となって、よく使われる別の文字列を形成していると考えることができ、他方、隣接文字の出現要素数が大きい場合は、隣接文字と「同じ文字列」が区切られ、その「同じ文字列」が独立した用語であって重要性の高い語である可能性が高いと考えられる。また、その「同じ文字列」が関連詞であるか否かは、前の隣接文字の異なり度合いと後の隣接文字の異なり度合いのほかに、さらなる要素を考慮して決定することができる。こうした、関連詞決定処理５５０については、後で詳細に説明する。

さらに、関連詞決定処理５５０では、関連詞が複数決定された場合に、関連詞として決定された文字列の間でランク付けを行うようにすることができる。こうしたランク付けは、例えば、文字列の重要度に関するランク付けであり、その文字列に関する、前後の隣接文字の異なり度合いのほかに、さらなる要素を考慮して決定することができる。例えば、文字列の文字長、出現頻度等に基づいてランク付けがされうる。また、順位を示すだけでなく、相対的な程度の差を表すことができるように、数値によってランク付けを行うこともできる。

＜具体的な外部ログの例に対する文解析処理の説明＞
図２６は、外部ログ５０２の一例である外部ログ５０２ａを示している。外部ログ５０２ａは、図２６（Ａ）に示すように、検索キーワードによる検索結果として、質問文の記載部分に「ネットワーク」を含む文情報だけが集められたものであり、元のデータは、例えば、インターネット上の様々なサーバにおいて様々な利用者によって書き込まれた問題解決のためのテキストデータである。これらのテキストデータの代表的な例としては、インターネット上に公開されているＷＥＢページ（ホームページ）やブログのテキストデータ、及びTWITTERのツイート情報などがある。また、任意の機関によって事前に生成・編集されたデータやデータベース内のテキスト情報が含まれてもよい。元のデータでは、質問文（Ｑ（質問））と回答文（Ａ（回答））とが１対１に対応するよう構成されているものとする。なお、ここでは、質問文の記載部分に文字列「ネットワーク」が含まれる文情報のみを元のデータから抽出しているが、質問文と回答文の記載部分に文字列「ネットワーク」が含まれる文情報を抽出するなど、様々なバリエーションを考えることができる。

ここで、文解析部４３による文解析処理が行われると、図２６（Ａ）に示した外部ログ５０２ａがテキストデータ取得処理５２０によって取得され、その後、上述した文字列検索処理５３０、異なり度合い判定処理５４０、及び関連詞決定処理５５０が行われると、図２６（Ｂ）に示すように、抽出された文情報の質問文について、それぞれ複数の関連詞が抽出されている。例えば、質問文のうち、Ｑ１については、「ネットワーク」、「トラブル」、「対応」、及び「設定」が選出されている。Ｑ１の質問の記載において、検索キーワードに相当する「ネットワークには」下線が付され、他の関連詞は矩形で囲まれている。また、Ｑ１の質問の記載に対応する、抽出された関連詞の集合として、｛ネットワーク、設定、トラブル、対応｝が示されている。この関連詞の集合は、関連詞決定処理５５０に関して上述したランク付けの順に記載されている。

同様に、Ｑ８については、「ネットワーク」、「設定」、及び「事象別に」が選出されている。Ｑ８の質問の記載において、検索キーワードに相当する「ネットワークには」下線が付され、他の関連詞は矩形で囲まれている。また、Ｑ８の質問の記載に対応する、抽出された関連詞の集合として、｛ネットワーク、設定、事象別に｝が示されている。また、ここで、質問文だけでなく、回答文の記載内容に関しても関連詞を抽出し、関連詞索引に含めるように構成することもできる。

このような関連詞決定処理５５０によって生成された関連詞辞書５０の例が、図２７（Ａ）に示されている。関連詞索引５０ａとして、図２６（Ｂ）に示した、それぞれの質問に関する関連詞の集合がそのまま記憶されている。関連詞辞書５０としては、こうした関連詞索引５０ａのみを記憶しておけば十分な場合もあるが、この実施例では、関連詞索引に対応する質問文を質問文５０ｂに記憶し、さらに、その質問文５０ｂに対応する回答を、回答文５０ｃに記憶する。

関連詞辞書５０に記憶された関連詞索引５０ａは、図２７（Ａ）に示すように、対応する文情報にそれぞれ対応付けて記憶されることにより、１の関連詞の集合と他の関連詞の集合との間で共通する関連詞を介して、他の集合に属する関連詞同士が関連付けられることになる。例えば、図２７（Ｂ）に示すように、質問文のうち、Ｑ１の質問についての関連詞の集合として、｛ネットワーク、設定、トラブル、対応｝が把握され、質問文のうち、Ｑ８の質問についての関連詞の集合として、｛ネットワーク、設定、事象別に｝が把握される場合、（検索キーワードである関連詞「ネットワーク」を除いて）共通している関連詞「設定」が存在し、それによって、関連詞「設定」と関連する関連詞（共起関連詞ということもできる）が｛トラブル、対応、事象別に｝であることが把握され、さらに、関連詞「トラブル」や「対応」が関連詞「事象別に」と関連する、すなわち、共に、関連詞「設定」と共起するという共通点を有しているという点で関係性を有していることが把握される。

このような、関連詞同士の関係性は、この実施例では、検索キーワード「ネットワーク」で収集された外部ログ５０２ａの文情報の間で見られたものであるが、まったく異なる検索キーワードで収集された文情報の関連詞同士に、このような関連性を見いだすことができる場合もあり、この場合に、潜在的な話題の関係性を発見することもできる。

＜文解析部における文字列検索処理の詳細な説明＞
図２８ないし図３０を参照して、文字列検索処理５３０を説明する。図２８は、文字列検索処理５３０の処理手順を表すフローチャートである。図２９、図３０は、サフィックスアレイと二分探索を用いた文字列検索の仕組みを示す図であり、検索対象の文字列として、例えば、外部ログ５０２の文字列の一部である「このコードがコードリストにある」とのテキストデータ５０２−１が設定される。通常は、外部ログ５０２のテキスト部分すべてが検索対象となるが、ここでは、例示のため、テキスト部分の一部としている。

最初に、文字列「このコードがコードリストにある」のなかから同じ文字列を検索するために、サフィックスアレイを作成する。図２８のステップＳ２１において、テキストデータの最初の文字から最終の文字まで、サフィックスを展開する。ここで、図２９を参照すると、図２９（Ａ）に示された、検索対象のテキストデータ５０２−１（「このコードがコードリストにある」）から、図２９（Ｂ）に示すように、１〜１５までのインデックスが付されたサフィックスが展開されている。それぞれのサフィックスは、検索対象のテキストデータ５０２−１において、インデックスの位置（開始文字位置）から末尾までの文字列であり、例えば、インデックス「１」については、検索対象のテキストデータ５０２−１の１文字目から末尾（１５文字目）までの文字列「このコードがコードリストにある」が示されている。また、インデックス「１０」については、検索対象のテキストデータ５０２−１の１０文字目から末尾（１５文字目）までの文字列「リストにある」が示されている。最後のインデックス「１５」については、末尾である１５文字目の文字「る」が示されている。

次に、図２８のステップＳ２２において、展開されたサフィックスを所定順序でソートし、サフィックスアレイを作成する。ここで、図２９を参照すると、図２９（Ｂ）に示されたサフィックスがソートされ、ソート後のサフィックスアレイが図２９（Ｃ）に示されている。ソートは、例えば、各文字に対応する文字コード（この例ではＪＩＳコード）によって行われ、１レコード目から４レコード目にかけて、１文字目が、「ー」（ＪＩＳコード＝213C）、「あ」（ＪＩＳコード＝2422）、「が」（ＪＩＳコード＝242C）のように、当該文字コード順にソートされていることが分かる。１レコード目と２レコード目は、１文字目と２文字目が同じであるが、３文字目が「が」と「リ」で異なり（「が」（ＪＩＳコード＝242C）、「リ」（ＪＩＳコード＝256A））、それによって、１レコード目が最初に配置されている。なお、インデックスは、図２９（Ｂ）のインデックスが、対応するレコードに付随してそのまま付与されている。

次に、図２８のステップＳ２３において、順次、テキストデータ内から検索文字列を１つずつ決定する。これは、テキストデータ内に同じ文字列があるかどうかを検索するのであるから、テキストデータ内のすべての部分文字列を検索文字列として、テキストデータと照合する。例えば、図２９の検索対象のテキストデータ５０２−１に関しては、１文字の検索文字列「こ」〜「る」、２文字の検索文字列「この」、「のコ」、・・・、「にあ」、「ある」、３文字の検索文字列「このコ」、「のコー」、・・・、「トにあ」、「にある」等が順に決定され、以下同様に、１５文字の「このコードがコードリストにある」までが検索文字列となる。ただしこの場合、１文字や１５文字の検索文字列については、検索対象のテキストデータ５０２−１と照合する意味がないので、省略することができる。また、それ以外にも、検索文字列の文字長を所定の範囲に限定することができる。

次に、図２８のステップＳ２４において、検索を行う検索文字列がすべて終了したか否かが判定される。ここで、すべて終了した場合は、文字列検索処理が終了する。まだすべてが終了していない場合は、ステップＳ２５において、検索文字列を検索キーとして、サフィックスアレイを検索する。ここで、図３０を参照すると、図３０（Ａ）及び図３０（Ｂ）に示すように、検索文字列として、検索対象のテキストデータ５０２−１内から３文字の文字列「コード」が決定された場合の検索処理が示されている。このとき、図３０（Ｃ）のサフィックスアレイに対して二分探索が行われる。図３０（Ｃ）のサフィックスアレイは、図２９（Ｃ）に示すサフィックスアレイと同じものであり、図３０（Ｃ）では、二分探索による検索の過程が示されている。

図３０（Ｃ）を参照すると、まず、サフィックスアレイの中央のレコード（１）（インデックス＝１５、文字列「る」）と検索文字列「コード」を比較する。このとき、「る」のＪＩＳコードは246B、「コ」のＪＩＳコードは2533で、「コ」の方が大きいので、レコード（１）より下でサフィックスアレイの下半分の中心に位置するレコード（２）（インデックス＝１２、文字列「トにある」）と検索文字列「コード」を比較する。このとき、「ト」のＪＩＳコードは2548、「コ」のＪＩＳコードは2533で、「コ」の方が小さいので、レコード（１）とレコード（２）の中心に位置するレコード（３）（インデックス＝７、文字列「コードリストにある」）と検索文字列「コード」を比較する。

そうすると、レコード（３）の最初の３文字と検索文字列「コード」が一致するため、検索文字列と同じ文字列が検索対象のテキストデータ５０２−１に見つかったことになる。さらにその後、レコード（３）の上下のレコードと比較すると、レコード（４）の最初の３文字と検索文字列「コード」が一致するため、検索文字列と同じ文字列が検索対象のテキストデータ５０２−１が見つかったことになる。このような二分探索により、検索対象のテキストデータ５０２−１のなかに、「コード」という文字列が２つあることがわかる（そのうちの１つは、検索対象のテキストデータ５０２−１から抽出された検索文字列「コード」それ自体である）。

次に、図２８のステップＳ２６において、検索文字列が所定数ヒットしたか否かが判定される。検索文字列が所定数ヒットしないと判定された場合、その文字列を関連詞の候補とすることなく、次の検索文字列による検索を行うため、ステップＳ２３に進む。ここで、所定数は、検索対象のテキストデータ５０２−１の文字数や、検索文字列の文字数など、様々な要素に基づいて決定されうる。所定数ヒットしないということは、検索対象のテキストデータ５０２−１において、その検索文字列の出現頻度が小さく、重要な語ではないということを表している。なお、この段階では、出現頻度を評価することなく、関連詞の候補として記憶しておき、後続の関連詞決定処理等において最終的に判断するように構成することもできる。

ステップＳ２６において、検索文字列が所定数ヒットしたと判定された場合、ステップＳ２７に進み、そこで、検索キー（検索文字列）に一致した文字列を関連詞の候補とし、それぞれ、前後の隣接文字とともに、１レコードとして関連詞候補データ４９に記憶する。ここで、図３０（Ｃ）を参照すると、検索結果として、検索文字列「コード」と一致する文字列が先頭に見つかったレコード（３）とレコード（４）について、それぞれ、検索文字列と同じ文字列「コード」と、前後の隣接文字が、１レコードとして記憶される。例えば、レコード（３）については、「が」、「コード」、「リ」が１レコードとして記憶される。前の隣接文字が「が」であり、後の隣接文字が「リ」である。また、レコード（４）については、「の」、「コード」、「が」が１レコードとして記憶される。前の隣接文字が「の」であり、後の隣接文字が「が」である。

このように、この実施例における文解析部４３では、上述のように、サフィックスアレイと二分探索を用いて、高速にテキストデータ内で同じ文字列を見つけ出すように構成されているが、本発明は当該処理方法に限定されるものではない。上述した以外の方法で、テキストデータ内の同じ文字列を見つけ出すようにすることができる。

＜文解析部における異なり度合い判定処理の詳細な説明＞
次に、図３１及び図３２を参照して、この実施例における文解析部４３の異なり度合い判定処理について、より詳細に説明する。

図３１は、異なり度合い判定処理５４０の処理手順を表すフローチャートである。図３２は、前後の隣接文字の異なり度合いを判定するための仕組みを示す図であり、図３０に示すような、検索文字列「コード」での文字列検索処理を、多くの文字を含む検索対象文字列に対して行った結果、検索結果として検索文字列「コード」が２６個得られ、それに対応する２６件のレコードを処理する状況を示している。

最初に、図３１のステップＳ３１において、文字列検索処理５３０で、検索結果データ４８に記憶された文字列のレコード（前後の隣接文字を含む）から、１つの文字列に関するレコードを取り出す。ここで、図３２（Ａ）を参照すると、検索結果データ４８に記憶された文字列「コード」についてのレコード（全２６レコード）が取り出され、メモリに展開された様子が示されている。

次に、図３１のステップＳ３２において、検索結果データ４８に記憶された文字列のレコードをすべて取得し、異なり度合い判定処理を行うべきデータがなくなったと判定された場合、図３１の異なり度合い判定処理は終了する。ステップＳ３２において、すべての処理が終了しておらず、検索結果データ４８に記憶された文字列の１つについてすべてのレコードが取得できている場合は、ステップＳ３３に進む。

次に、図３１のステップＳ３３において、検索結果データ４８に記憶された文字列の１つについて取得したすべてのレコードについて、前の隣接文字でソートし、前の隣接文字に関する出現文字のパターン数を求める。ここで、図３２（Ａ）を参照すると、検索結果データ４８に記憶された文字列「コード」について取得したレコード（全２６件）について、前の隣接文字５６１でソートした結果が示されている。このソートは、上述した文字列検索処理におけるサフィックスアレイの作成のときと同様、文字コード（例えば、ＪＩＳコード）を用いて行うことができる。このようなソートを行った後、レコード間で前の隣接文字５６１の値が変化した（ブレークした）回数をカウントすることによって、前の隣接文字５６１の出現文字のパターン数が分かる。図３２（Ａ）の場合、前の隣接文字５６１は、「」、「（」、「、」、「「」、「が」、「た」、「で」、「ど」、「の」、「は」、「べ」、「も」、「り」の１３パターンである。

このように、この実施例の文解析部４３では、前の隣接文字５６１をソートし、その値が各レコード間で変化したかどうかで、前の隣接文字に関する出現文字のパターン数を求めているが、本発明は当該処理方法に限定されるものではない。出現文字のパターン数は、他の様々な方法で求めることができる。また、所定の文字や文字パターンに関する扱いを、仕様に応じて柔軟に設定することができる。例えば、改行・改ページなどの制御文字等を考慮しないようにすることができる。また、句点や読点などを考慮することもできるし、無視することもできる。さらに、英字の大文字と小文字を同じ文字として扱うこともできるし、別の文字として扱うこともできる。また、ソートについては、半角英数などの１バイトコード文字については、対応する１バイトをソートし、漢字などの２バイトコード文字については、対応する２バイトをソートする。また、前の隣接文字５６１をソートする場合、本実施形態では、１文字の隣接文字をソートすることとしているが、２文字以上の文字をソートして、その異なり度合いを判定するようにもできる。

次に、図３１のステップＳ３４において、前の隣接文字５６１に関する異なり度合いを判定する。この場合、異なり度合いは、隣接文字５６１が（図３２（Ａ）の２６件のレコードの間で）、どの程度異なっているかを示す指標であり、従って、上述した前の隣接文字に関する出現文字のパターン数に基づいて判定される。異なり度合いは、パターン数そのものであってもよいが、例えば、文字列の出現頻度（図３２（Ａ）の場合は、「コード」の出現頻度が２６）等を考慮して判定することもできる。また、異なり度合いを所定の閾値により複数の段階（例えば、３段階）で評価することもできる。またさらに、隣接文字５６１が特定の文字である場合に、その文字のカウントや異なり度合いの判定に関し、任意の重み付けを行うようにすることもできる。

次に、図３１のステップＳ３５において、検索結果データ４８に記憶された文字列の１つについて取得したすべてのレコードについて、後の隣接文字でソートし、後の隣接文字に関する出現文字のパターン数を求める。ここで、図３２（Ｂ）を参照すると、検索結果データ４８に記憶された文字列「コード」について取得したレコード（全２６件）について、後の隣接文字５６３でソートした結果が示されている。このようなソートにより、図３２（Ａ）に示したレコード５６５、レコード５６６は、それぞれ点線矢印に示す位置に配置される。

このソートは、上述した文字列検索処理におけるサフィックスアレイの作成のときと同様、文字コード（例えば、ＪＩＳコード）を用いて行うことができる。このようなソートを行った後、レコード間で後の隣接文字５６３の値が変化した（ブレークした）回数をカウントすることによって、後の隣接文字５６３の出現文字のパターン数が分かる。図３２（Ｂ）の場合、後の隣接文字２１３は、「、」、「「」、「」」、「が」、「で」、「と」、「に」、「の」、「は」、「を」、「リ」、「支」の１２パターンである。

このように、この実施例の文解析部４３では、後の隣接文字５６３をソートし、その値が各レコード間で変化したかどうかで、後の隣接文字に関する出現文字のパターン数を求めているが、本発明は当該処理方法に限定されるものではない。出現文字のパターン数は、他の様々な方法で求めることができる。また、所定の文字については、当該パターン数のカウントに含めないようにすることができる。また、ソートについては、半角英数などの１バイトコード文字については、対応する１バイトをソートし、漢字などの２バイトコード文字については、対応する２バイトをソートする。また、後の隣接文字５６３をソートする場合、本実施形態では、１文字の隣接文字をソートすることとしているが、２文字以上の文字をソートして、その異なり度合いを判定するようにもできる。

次に、図３１のステップＳ３６において、後の隣接文字５６３に関する異なり度合いを判定する。この場合、異なり度合いは、隣接文字５６３が（図３２（Ｂ）の２６件のレコードの間で）、どの程度異なっているかを示す指標であり、従って、上述した後の隣接文字に関する出現文字のパターン数に基づいて判定される。異なり度合いは、パターン数そのものであってもよいが、例えば、文字列の出現頻度（図３２（Ｂ）の場合は、「コード」の出現頻度が２６）等を考慮して判定することもできる。また、異なり度合いを所定の閾値により複数の段階（例えば、３段階）で評価することもできる。またさらに、隣接文字５６３が特定の文字である場合に、その文字のカウントや異なり度合いの判定に関し、任意の重み付けを行うようにすることもできる。

次に、図３１のステップＳ３７において、判定対象の文字列、及び、その文字列に関して判定された、前の隣接文字に関する異なり度合いと後の隣接文字に関する異なり度合いが、関連詞候補データ４９に記憶される。

図３１のステップＳ３７の処理が終了すると、ステップＳ３１に進み、次の「同じ文字列」に関する処理が行われる。

＜文解析部における関連詞決定処理の詳細な説明＞
関連詞決定処理５５０においては、異なり度合い判定処理５４０により関連詞候補データ４９に記憶されたデータを順次読み出し、判定された前後の隣接文字の異なり度合いに基づいて、対応する文字列が関連詞か否かを決定し、決定された関連詞を、例えば、上述した関連詞索引の形で関連詞辞書５０に記憶するとともに、その関連詞索引に対応する文情報（例えば、上述の例では、質問文と回答文）を関連詞辞書５０に記憶する。関連詞決定処理５５０は、例えば、前後の隣接文字の異なり度合いの大小に応じて、対応する文字列が関連詞であるか否かを決定する。

前後の隣接文字の異なり度合いの大小については、共通の、または前後で異なる判断基準により判断されうる。前後の隣接文字の異なり度合いが、所定の大きさであると判断された場合に、対応する文字列は、独立した用語であって、話題を識別する重要な語である関連詞として決定される。すなわち、前後の隣接文字の異なり度合いによりスコアが計算され、そのスコアに基づいて、その対応する文字列が関連詞であるか否かを決定するようにしてもよい。

また、関連詞決定処理５５０では、前後の隣接文字の異なり度合いに加えて、対応する文字列の文字長、対応する文字列の出現頻度、特定の文字が前の隣接文字として出現する確率・頻度、特定の文字が後の隣接文字として出現する確率・頻度、特定の文字の組合せが前後の隣接文字として出現する確率・頻度等を考慮してスコアを計算し、計算されたスコアに基づいて、その対応する文字列が関連詞であるか否かを決定するようにしてもよい。

さらに、１つのテキストデータ（検索対象の文字列）において、複数の関連詞の候補がある場合に、その候補の数や、それぞれについて計算されたスコアの分布に応じて、関連詞として決定するための決定条件を変化させることもできる。

またさらに、関連詞決定処理５５０では、外部ログ５０２、または外部ログ５０２に含まれる文情報のそれぞれについて決定された関連詞が複数ある場合に、関連詞として決定された文字列の間でランク付けを行うようにすることができる。こうしたランク付けは、例えば、話題に関する文字列の重要度に関するランク付けであり、上述した、前後の隣接文字の異なり度合いにより計算されたスコアや、前後の隣接文字の異なり度合いに加え、他の様々な要素を加味して計算されたスコア等に基づいて決定される。また、このようなランク付けは、関連詞として決定された文字列の重要度を順序付けるだけでなく、関連詞間の相対的な重要度を示すことができるように、例えば、上述のスコアの値を用いる等して、具体的な数値によりランク付けを行うことができる。

また、このようなランク付けは、関連詞が複数決定された場合に行われるが、１つのテキストデータに関して決定された複数の関連詞について行うこともできるし、所定の条件によりグルーピングされた複数のテキストデータに関して決定された複数の関連詞について行うこともできる。

例えば、所定の条件によりグルーピングされた複数のテキストデータとして、入力された検索キーワードにヒットしたＷＥＢページ群のテキストデータや、所定の属性に該当するユーザのTWITTERの内容などが考えられる。

＜＜ＦＡＱ表示画面の表示処理に関する説明＞＞
次に、図３３を参照して、ＦＡＱ表示画面の表示処理について説明する。図３３は、ＦＡＱ表示画面の表示処理を表すフローチャートであり、会話制御端末装置２’’と話題提供サーバ４’においてそれぞれどのような処理が行われるかを示している。会話制御端末装置２’’では、例えば、上述したTopiclet２０によって各処理が行われる。

最初に、ステップＳ４１において、ユーザが、図３５（Ｂ）に示すＦＡＱ候補表示画面６１０で、候補質問文表示部６１２に表示された候補質問文のうちの１つをマウスのクリック等によって選択したか否かが判定される。候補質問文のうちの１つが選択されていない間は（ＮＯ）、この判定が繰り返される。候補質問文のうちの１つが選択された場合（ＹＥＳ）、ステップＳ４２において、選択された候補質問文を、入力情報として話題提供サーバ４’に送信する。入力情報には、選択された質問文そのものを含むこともできるが、この質問文を識別できる識別子が含まれていれば十分である。なお、ユーザは、関心のある質問文を複数同時に選択するようにもできる。

話題提供サーバ４’が会話制御端末装置２’’から入力情報を受け取ると、ステップＳ４３において、入力情報を分析し、入力情報に含まれる質問文に対応する回答文を、関連詞辞書５０から取得する。なお、この実施例では、図２７（Ａ）に示すように、関連詞辞書５０に質問文５０ｂと、これに対応する回答文５０ｃを記憶するようにしているが、これらの質問文５０ｂと回答文５０ｃを、関連詞辞書５０の関連詞索引５０ａと関連付けながら、別のファイルに記憶させることもできる。

次に、話題提供サーバ４’は、ステップＳ４４において、ＦＡＱ表示画面６３０に表示するために、関連詞辞書５０から取得した質問文５０ｂに対応する回答文５０ｃを含む情報を関連詞・共起語データ５２に記憶するとともに、この情報を入力特定情報として会話制御端末装置２’’に送信する。

会話制御端末装置２’’は、話題提供サーバ４’から入力特定情報を受信すると（ステップＳ４５）、ステップＳ４６において、受信した入力特定情報とシナリオデータ２８に基づいて、応答情報を決定する。なお、話題提供サーバ４’は、必要に応じてシナリオデータ５５を会話制御端末装置２’’に送信し、会話制御端末装置２’’はこれをシナリオデータ２８に記憶する。

次に、ステップＳ４７において、ステップＳ４６で決定された応答情報を会話制御端末装置２’’のディスプレイに表示する。例えば、図３５（Ｂ）に示すようなＦＡＱ候補表示画面６１０において、候補質問文表示部６１２にリスト表示されている質問文の１つ（例えば、矢印（１）に示すＱ２４の質問）を選択すると、図３６に示されるようなＦＡＱ表示画面６３０が表示され、そこで、質問表示部６３１に、選択した質問文であるＱ２４の質問が表示されるとともに、関連詞索引表示部６３２に、Ｑ２４の質問に対応する関連詞索引が表示され、さらに、回答表示部６３３に、Ｑ２４の質問に対応する回答（Ａ２４の回答）が表示される。

このような、ＦＡＱ検索画面６００からＦＡＱ表示画面６３０までの画面遷移により、ユーザは、ユーザの指定した検索キーワードでＦＡＱを検索し、検索結果として複数の質問文の候補を表示させることができ、さらにそこで、それぞれの候補質問文において、どのような重要なキーワードが現れているか（すなわち、どのような事項に関連するものであるか）を、関連詞索引を見ることによって容易に把握することができる。

また、この実施例では、ＦＡＱ候補表示画面６１０において、質問文に対応する回答文を表示していないが、候補質問文をリスト表示させる段階で、それぞれ対応する回答文を表示するようにすることもできる。

＜＜関連詞・共起語一覧画面の表示処理に関する説明＞＞
次に、図３４を参照して、関連詞・共起語一覧画面の表示処理について説明する。図３４は、関連詞・共起語一覧画面の表示処理を表すフローチャートであり、会話制御端末装置２’’と話題提供サーバ４’においてそれぞれどのような処理が行われるかを示している。会話制御端末装置２’’では、例えば、上述したTopiclet２０によって各処理が行われる。

最初に、ステップＳ５１において、ユーザが、図３５（Ｂ）に示すＦＡＱ候補表示画面６１０で、関連詞索引表示部６１１に表示された関連詞索引のうちの１つをマウスのクリック等によって選択したか否かが判定される。関連詞索引のうちの１つが選択されていない間は（ＮＯ）、この判定が繰り返される。関連詞索引のうちの１つが選択された場合（ＹＥＳ）、ステップＳ５２において、選択された関連詞索引を、入力情報として話題提供サーバ４’に送信する。入力情報には、選択された関連詞索引そのものを含むこともできるが、この関連詞索引を識別できる識別子が含まれていれば十分である。なお、ユーザは、関心のある関連詞索引を複数同時に選択するようにもできる。

話題提供サーバ４’が会話制御端末装置２’’から入力情報を受け取ると、ステップＳ５３において、入力情報を分析し、関連詞辞書５０から、入力情報に含まれる関連詞索引を含むすべての関連詞索引を取得する。

次に、話題提供サーバ４’は、ステップＳ５４において、嗜好データ５１のような内部ログ５０６に基づいて、ステップＳ５３で取得した関連詞索引に含まれるすべての関連詞について嗜好解析を行う。嗜好データ５１は、それぞれのユーザによって、これまでにどのような関連詞がどのように利用されてきたかといった利用態様を示すデータを記憶したログファイルであり、例えば、図３８（Ａ）に示すように、ユーザＩＤ５１ａごとに、そのユーザがどの関連詞５１ｂを、参照または検索キーワードとして入力してきたかを記憶している。このほか、嗜好データ５１として、関連詞の利用日時や詳細な利用内容を記憶しておき、これらの情報をも加味して嗜好解析を行うこともできる。

話題提供サーバ４’は、連詞索引に含まれるすべての関連詞について、この嗜好データ５１に基づいて、嗜好解析を行い、各関連詞の重要度を決定する。例えば、嗜好データ５１を参照して、同じユーザにおいて、利用頻度の高い関連詞ほど、高い重要度となるよう関連詞の重要度を設定する。このような重要度によって関連付けられた関連詞は、上述の話題鍵（クラスタ）５０４に相当する。

次に、話題提供サーバ４’は、ステップＳ５５において、話題データ５３のような話題ネタ５０７に基づいて、ステップＳ５４で重要度が設定された関連詞について、さらに話題解析を行う。話題データ５３は、契約者の担当者が入力した話題であったり、当該担当者が入力した話題に基づいて、外部ログ５０２から自動的に抽出した話題であったりする。このような話題データ５３に基づいて、その分布を捉え、互いに関連付けられた関連詞の分布をユーザに提供する。例えば、ＦＡＱのなかで話題となっている関連詞とその共起語を関連付け、話題の中で関連詞がどのように分布しているのか表すようにできる。また、話題ネタの入力や自動抽出において、会話制御端末装置２’’のユーザごとに調整を行い、ユーザに合わせて関連詞を推奨するように構成することができる。例えば、対象となる質問文を、所定の範囲に限定するよう、話題を調整することもできる。

次に、話題提供サーバ４’は、ステップＳ５６において、関連詞・共起語一覧表示画面６５０に表示するために、最終的にステップＳ５５において関連付けがされた関連詞を含む情報を入力特定情報として会話制御端末装置２’’に送信する。

会話制御端末装置２’’は、話題提供サーバ４’から入力特定情報を受信すると（ステップＳ５７）、ステップＳ５８において、受信した入力特定情報とシナリオデータ２８に基づいて、応答情報を決定する。なお、話題提供サーバ４’は、必要に応じてシナリオデータ５５を会話制御端末装置２’’に送信し、会話制御端末装置２’’はこれをシナリオデータ２８に記憶する。

次に、ステップＳ５９において、ステップＳ５８で決定された応答情報を会話制御端末装置２’’のディスプレイに表示する。例えば、図３７に示すような関連詞・共起語一覧表示画面６５０が、会話制御端末装置２’’のディスプレイに表示される。関連詞・共起語一覧表示画面６５０には、ＮＯ表示部６５１、関連詞表示部６５２、近傍関連詞表示部（６５３〜６５６）、及び「ＦＡＱ候補表示画面に戻る」ボタン６５７が表示され、関連詞が２次元のマトリックスの形態で表示されている。

マトリックスの縦軸方向について、関連詞表示部６５２には、この実施例のＦＡＱ検索に関して関連詞として抽出され、関連詞辞書５０の関連詞索引に現れるすべての関連詞が、重複無く順に表示されている。表示順は、嗜好解析によって決定された各関連詞の重要度に応じて設定され、この実施例では、ＮＯ表示部６５１に示された数字が低いほど（図３７の上部に表示されるほど）、対応する関連詞の重要度が高いものとなっている。なお、図３７では、ＮＯ表示部６５１に示された数字は、１〜１７までとなっているが、関連詞・共起語一覧表示画面６５０のスライダーバーを操作して下方向に移動させることによって、より多くの関連詞を閲覧することができる。

マトリックスの横軸方向について、関連詞表示部６５２に表示された関連詞の右横には、近傍関連詞表示部６５３〜近傍関連詞表示部６５６が示され、ここには、関連詞表示部６５２に表示された関連詞に関する近傍関連詞が表示される。近傍とは、図１６に関して説明したように、ある関連詞Ａに着目した場合、関連詞Ａを含む関連詞集合は、「関連詞の近傍」であり、そのような関連詞をここでは、近傍関連詞としている。なお、関連詞集合は、ある話題に含まれている関連詞の集合であり、ここでは、関連詞索引がこれに相当する。

なお、図３７では、近傍関連詞は、近傍関連詞１〜近傍関連詞４までの４つしか示されていないが、関連詞・共起語一覧表示画面６５０のスライダーバーを操作して右方向に移動させることによって、より多くの近傍関連詞を閲覧することができる。近傍関連詞は、関連詞表示部６５２に表示された関連詞と共起する関連詞（共起関連詞：すなわち、同じ話題で、共に出現する関連詞）ということができる。近傍関連詞の（横方向における）表示順は、共起関係が強いもの、すなわち、関連詞表示部６５２に表示された関連詞と共に出現する頻度が高いものほど、関連詞表示部６５２に表示された関連詞に近い位置に表示されるよう調整される。また、この横方向の表示順に関して、関連詞のランク付けや、ユーザまたは情報検索システムによる設定等を考慮して決定することもできる。

また、関連詞・共起語一覧表示画面６５０では、関連詞表示部６５２に表示された関連詞のうち、図３５（Ｂ）に示すＦＡＱ候補表示画面６１０で、関連詞索引表示部６１１に表示された関連詞索引のうちの１つをマウスのクリック等によって選択した際に、その関連詞索引に含まれていた関連詞（この実施例では、例えば、「ネットワーク」、「接続」、「ルータ」、及び「モデム」）は、ユーザが認識しやすいようにハイライト表示となっている。

ユーザは、関連詞・共起語一覧表示画面６５０の関連詞表示部６５２、及び近傍関連詞表示部（６５３〜）に表示された関連詞のマトリックス表示により、ユーザ自身が元来着目していた関連詞（検索キーワード）と関連する別の関連詞を、自身が関連詞をどのように利用してきたかという観点と、ユーザまたは情報検索システムによって着目・推奨する話題に近いかという観点で見ることができ、新たな関連詞についての「気づき」が与えられうる。例えば、図３７の関連詞・共起語一覧表示画面６５０における関連詞のマトリックス表示では、検索キーワード「ネットワーク」による検索を行ったが、ＮＯ表示部６５１に表示された数字が、１〜１３、及び１５の場合には、表示された関連詞の集合から、概ね通信ネットワークに関連する話題であることが分かるが、ＮＯ表示部６５１に表示された数字が１４、１６、及び１７の場合は、ソーシャルネットワークに関連する話題となっており、他と異なる話題が出現していることが分かる。

ユーザが、関連詞・共起語一覧表示画面６５０の関連詞表示部６５２、または近傍関連詞表示部（６５３〜）に表示された関連詞の１つをマウスのクリック等によって選択すると（図３７の矢印）、画面が、図３８（Ｂ）に示すようなＦＡＱ検索画面６６０に自動的に遷移し、そこで、選択された関連詞（この実施例では、近傍関連詞の「ＳＮＳ」）が、ＦＡＱ検索画面６６０の検索キーワード入力部６６１に自動的にセットされる。ユーザがこの状況で、「ＦＡＱ検索」ボタン６６２をクリックすると、再び、ＦＡＱ候補表示画面６１０が表示され、今度は、「ＳＮＳ」に関する質問文が、候補質問文表示部６１２に示される。

＜＜＜情報更新部における処理概要の説明＞＞＞
情報更新部４６は、異なる収集条件によって収集された外部ログ５０２（テキストデータ）から、意味識別可能な文字列を抽出し、抽出された文字列を、テキストデータに対応する関連詞辞書に記憶し、これらの関連詞辞書について比較処理を行うことによって得られた比較結果を比較結果データ５４に記憶し更新する。比較処理は、関連詞辞書の更新がされた場合に自動的に行われる。

異なる関連詞辞書に対応付けられたテキストデータは、異なる収集条件によって収集されたテキストデータであり、これらのテキストデータは、例えば、同様の対象やデータソースについて異なるタイミングで収集される複数のテキストデータであったり、同様のタイミングにおいて、異なる主題や検索条件によって収集される複数のテキストデータであったりする。

上記の比較処理は、複数の関連詞辞書を比較して、新たに出現した関連詞のほか、消滅した関連詞、共通して出現する関連詞、（３つ以上の時系列テキストデータに対応する辞書において）再度出現した関連詞など、関連詞の出現状況を判定し、関連詞がこのような出現状況のうちいずれかである場合に、その関連詞を比較結果として記憶する。

また、１つのテキストデータから複数の関連詞が抽出された場合に、それらの関連詞を１つの集合として（共起関連詞として）関連付け、対応する関連詞辞書に記憶することができる。このように構成することにより、比較処理において、複数の関連詞辞書で共通する関連詞があると判定された場合に、その関連詞の共起関連詞を比較し、さらなる判定を行うことができる。

このように、関連詞の出現に関する履歴等をとらえることにより、関連詞の意味を炙りだせるようになる。すなわち、このような処理を繰り返すことにより、関連詞が所属する話題名が明確となるほか、いつもの関連詞と（新たに出現した）新着関連詞とを区別して扱うことができたり、関連詞辞書の比較処理によって、話題の類似性や相違性についての判断をしたりすることができる。こうした機能を、関連詞学習機能と称することとする。関連詞学習機能により、エンドユーザの入力識別手段が多様化することが期待できる。

図３９を参照して、情報更新部４６の処理概要について説明する。最初に、情報更新部４６は、テキストデータである外部ログ５０２を取得する（テキストデータ取得処理７００）。外部ログ５０２は、例えば、クローラー７３０によって収集される。クローラー７３０が、ＷＥＢページのネットワークアドレス（ＵＲＬ等）を返す場合は、そのネットワークアドレスにアクセスすることにより外部ログ５０２を取得するようにもできる。またさらに、取得した外部ログ５０２、または外部ログ５０２を取得する際に、特定のテキストデータだけを取得するようフィルタ処理を行ったり、特定の分類によりグルーピングをしたりすることもできる。

クローラー７３０は、例えば、自動起動され、決められた時間に決められた話題名に対して話題解析を行う（すなわち、検索を行って、定期的に話題を収集する）。話題名は、例えば、関連詞辞書５０を保持しているサービス（ユーザが扱う話題にそれぞれ対応したサービスＩＤに割り当てられた領域）に記憶され、ユーザが１０個の話題を扱いたい場合は、１０個のサービスを利用してそれらの話題を扱うことになる。また、上述した１つ１つのサービスについて、対応する話題チップを設定し、各話題チップが常時、対応する話題に関する情報を収集し、ユーザの入力に応じて、関連する話題チップを連携・統合させ、より多様な話題提供サービスを実現することもできる。

クローラー７３０による検索は、例えば、インターネット上の既存のインターネット検索サイトにアクセスし、そこで検索キーワードを指定することにより、当該インターネット検索サイトの検索サーバから検索結果を受信する。検索結果には、例えば、検索キーワードに合致または類似するコンテンツを含んだＷＥＢページのアドレス（ＷＥＢページ１のアドレス、ＷＥＢページ２のアドレス、ＷＥＢページ３のアドレス、・・・、ＷＥＢページＸのアドレス）が含まれる。

クローラー７３０は、この実施例では、既存のインターネット検索サイトにおける検索を実行することで検索結果を取得するようにしているが、他の様々な方法により、所定の条件を満たすＷＥＢページのアドレスを取得することができる。また、検索対象はインターネット上のＷＥＢページに限定されるものではなく、TWITTERのツイート情報や、任意の機関や組織によって事前に生成・編集された（ネットワーク上またはローカルの）データやデータベース内のテキスト情報であってもよい。

既存のインターネット検索サイトは、そのインターネット検索サイトが使用する検索サーバに備えられた検索エンジンにより、インターネット上のデータソースから検索キーワードに合致、または類似するＷＥＢページのアドレスを、検索のリクエストに応じて（あるいは事前の定期的収集活動により）収集する。

クローラー７３０は、検索サーバから検索結果が送信されると、クローラー７３０が動作するコンピュータから、その検索結果を（例えば、ＡＰＩ送信により）話題提供サーバ４’に送信する。また、クローラー７３０は、フィルタを用いて、検索結果のうち、所定の条件を満たすものを除外するよう構成することができる。

この実施例では、クローラー７３０が、決められた時間に自動的に起動されるが、話題提供サーバ４’の動作制御に応じてクローラー７３０の動作を制御し、検索結果を取得するようにしてもよい。また、クローラー７３０が所定のインターバルで検索結果を取得し、クローラー７３０が動作するコンピュータにその検索結果を保持しておき、話題提供サーバ４’が、必要なタイミングで、当該コンピュータにアクセスして検索結果を取得するようにもできる。また、クローラー７３０が話題提供サーバ４’で実行されるように構成することもできる。

また、この実施例では、クローラー７３０が動作するコンピュータが、検索結果として検索キーワードに関連するＷＥＢページのアドレスを話題提供サーバ４’に送信するが、クローラー７３０が動作するコンピュータにおいて、これらのＷＥＢページにアクセスし、その結果得られたテキストデータを外部ログ５０２として話題提供サーバ４’に送信するようにもできる。

次に、情報更新部４６は、テキストデータ取得処理７００により取得された外部ログ５０２から、意味識別可能な文字列を抽出し、抽出された文字列を関連詞辞書５０に記憶する（文字列抽出処理７１０）。このように抽出された文字列は、上述の関連詞に相当するものであり、これらの関連詞は、その関連詞が抽出された外部ログ５０２に対応する関連詞辞書１〜３等に、それぞれ記憶される。

外部ログ５０２から関連詞を抽出する方法として様々な方法が考えられる。例えば、上述した文解析部４３による方法で関連詞の抽出を行うことができる。

文字列抽出処理７１０では、複数の外部ログ５０２から関連詞が抽出され、それぞれ対応する関連詞辞書５０に記憶される。例えば、複数の外部ログ５０２は、同様の対象やデータソースについて異なるタイミングで収集されたテキストデータであったり、同様のタイミングにおいて、異なる主題や検索条件によって収集される複数のテキストデータであったりする。文字列抽出処理７１０の詳細な処理については、後で説明する。

次に、情報更新部４６は、文字列抽出処理７１０により、それぞれ関連詞が記憶された複数の関連詞辞書５０を比較し、関連詞の出現状況に応じて、比較結果を比較結果データ５４に記憶する（辞書比較処理７２０）。

例えば、異なるタイミングで収集された２つの関連詞辞書（関連詞辞書１、関連詞辞書２）を比較する場合、関連詞辞書１に存在せず、関連詞辞書２に存在する関連詞があれば、これを、新たに出現した新着の関連詞として、比較結果データ５４に記憶し、逆に、関連詞辞書１に存在し、関連詞辞書２に存在しない関連詞があれば、これを、消滅した関連詞として、比較結果データ５４に記憶する。

また、例えば、異なる主題について同様のタイミングで収集された３つの関連詞辞書（関連詞１〜３）を比較する場合、すべての関連詞辞書１〜３に存在する関連詞があれば、これを、共通した関連詞として比較結果データ５４に記憶する。

なお、複数の関連詞辞書において、関連詞がどのような出現状況のときに比較結果データ５４に記憶するかは、情報更新部４６の利用態様に応じて柔軟に規定することができる。辞書比較処理７２０の詳細な処理については、後で詳細に説明する。

会話制御端末装置２’’から、ユーザが直接、あるいは応答シナリオに応じて、所定の関連詞辞書を比較した比較結果データ５４の表示が要求されると、話題提供サーバ４’がこれらの比較結果データ５４を含む入力特定情報を会話制御端末装置２’’に送信し、会話制御端末装置２’’は、この入力特定情報を受け取ると、入力特定情報とシナリオデータ２８に基づいて応答情報を決定し、会話制御端末装置２’’のディスプレイに当該応答情報を表示するよう制御する。

会話制御端末装置２’’のディスプレイには、例えば、話題名と、この話題における関連詞の変化が表示される。関連詞の変化の表示には、例えば、関連詞の出現状況とこれに対応する関連詞が含まれる。

後述する図４６の比較結果データ５４に関しては、例えば、話題名「２０１３年１０月１０日、ｔ２における「株の取引」の話題」について、出現状況が「新着関連詞」である関連詞「税率」と、出現状況が「消滅関連詞」である関連詞「口座」が表示される。この表示は、図４６に示す比較結果データ５４の、レコード５４ａに対応するものである。ユーザは、ディスプレイに表示された内容を見て、話題名に関する話題において、ｔ２というタイミングで、新たに「税率」という関連詞が出現し、これと同時に、「口座」という関連詞が消滅したという気づきを得ることができる。

＜＜情報更新部における文字列抽出処理の説明＞＞
図４０を参照して、文字列抽出処理７１０について説明する。図４０は、文字列抽出処理７１０の処理手順を表すフローチャートである。最初に、ステップＳ６１において、関連詞を抽出する対象となる外部ログ５０２（テキストデータ）を読み込む。テキストデータは、上述のように、テキストデータが取得できる限り、どのようなデータであってもよい。

次に、ステップＳ６２において、ステップＳ６１で読み込んだテキストデータから、意味識別可能な文字列である関連詞を抽出する。テキストデータから関連詞を抽出する方法は、上述のように、文解析部４３による、前後の隣接文字の異なり度合いに基づく方法や、形態素解析を用いた方法などを含む様々な方法がある。

次に、ステップＳ６３において、ステップＳ６２で１つのテキストデータに対して複数の関連詞が抽出された場合に、所定の判断基準により、その複数の関連詞にランク付けを行う。例えば、テキストデータにおける関連詞の重要度に応じてランク付けを行うことができ、関連詞の文字長や出現頻度に応じてランク付けが行われうる。また、関連詞を、前後の隣接文字の異なり度合いに基づく方法により抽出する場合は、前後の隣接文字の異なり度合いに応じてランク付けが行われる。なお、ランク付けは、このような基準のほか様々な要素、及びこれらの組合せによって行うことができる。このような「ランク」は、話題との関連性を示すものである。また、関連詞が複数抽出された場合であっても、このようなランク付けを行わないようにすることもできる。

次に、ステップＳ６４において、ステップＳ６３でランク付けされた関連詞を、テキストデータに対応する関連詞辞書に記憶する。例えば、１つのテキストデータから抽出された関連詞は、１つのレコードにまとめて記憶され、各関連詞は、ランク付けに応じた記憶位置（配列エントリー）に記憶される。関連詞は、このように記憶されることにより、複数の関連詞が、１つのテキストデータ（それらの関連詞が抽出されたテキストデータ）に関連付けられた集合として定義される。ランク付けは、その集合のなかで関連詞を順位付けるものである。

文字列抽出処理は、処理対象のテキストデータが複数ある場合は、上述したステップＳ６１からステップＳ６４までの処理を、テキストデータごとに繰り返す。

＜＜情報更新部における辞書比較処理の説明＞＞
図４１を参照して、辞書比較処理７２０について説明する。図４１は、辞書比較処理７２０の処理手順を表すフローチャートである。この実施例では、時系列データとして収集された２つのテキストデータ（テキストデータ１、テキストデータ２）から関連詞が抽出され、それぞれ対応する関連詞辞書（ｉ−１）、関連詞辞書（ｉ）、に記憶されている状況で比較処理が行われるものとする。

最初に、ステップＳ７１において、関連詞辞書（ｉ−１）、関連詞辞書（ｉ）に記憶されている関連詞を読み出す。次に、ステップＳ７２において、関連詞辞書（ｉ−１）と関連詞辞書（ｉ）の関連詞を比較し、そのなかから関連詞辞書（ｉ−１）に存在せず、関連詞辞書（ｉ）に存在する関連詞を、新たに出現した関連詞（新着関連詞）として比較結果データ５４に記憶する。それぞれの関連詞辞書は、例えば、話題名に対応付けられており、辞書比較処理７２０は、この話題名を用いて比較を行うことができる。新着関連詞は、対応する関連詞辞書を表すことができる話題名、出現状況（この場合は、新たに出現したことを表す「新着」の文字やこれに対応するコード等）とともに比較結果データ５４に記憶される。

次に、ステップＳ７３において、関連詞辞書（ｉ−１）と関連詞辞書（ｉ）の関連詞を比較し、そのなかから関連詞辞書（ｉ−１）に存在し、関連詞辞書（ｉ）に存在しない関連詞を、消滅した関連詞（消滅関連詞）として比較結果データ５４に記憶する。それぞれの関連詞辞書は、例えば、話題名に対応付けられており、消滅関連詞は、この話題名、出現状況（この場合は、新たに出現したことを表す「消滅」の文字やこれに対応するコード等）とともに比較結果データ５４に記憶される。

その後、ステップＳ７４において、関連詞辞書（ｉ−１）の内容を関連詞辞書（ｉ）にコピーする。これは、次のタイミングにおいて、文字列抽出処理７１０が関連詞を記憶するための関連詞辞書（ｉ−１）を用意するためであり、その後、この新たな関連詞辞書（ｉ−１）と、関連詞辞書（ｉ−１）の内容がコピーされた関連詞辞書（ｉ）が、辞書比較処理７２０によって比較される。

このように、文字列抽出処理７１０と辞書比較処理７２０は、所定のタイミングで繰り返し実行されるが、詳細な説明については後述する。また、辞書比較処理７２０が繰り返し処理されることによって、比較結果データ５４に、その処理タイミングにおいてそれぞれ比較結果が記憶されることになるが、比較結果を記憶する際に、それ以前に記憶されていた比較結果を消去するか、累積的に記憶するかは、本発明に係る情報検索システム１００の仕様に応じて決定される。また、比較結果データ５４を、辞書比較処理７２０ごとに別個に用意するようにしてもよい。

また、この例では省略したが、関連詞辞書（ｉ−１）と関連詞辞書（ｉ）を比較して、共通する関連詞（共通関連詞）を比較結果データ５４に記憶することもできる。この場合、例えば、関連詞辞書（ｉ−１）において共通関連詞とともに記憶されている他の関連詞（共起関連詞）と、関連詞辞書（ｉ）において共通関連詞とともに記憶されている他の関連詞（共起関連詞）との間に共通性があるか否かをさらに比較して、当該共通性に関する情報を比較結果データ５４に記憶することができる。

さらに、上記のような共起関連詞を比較する場合に、それらの共起関連詞に関連付けられたランクを考慮して共通性に関する情報を判定してもよい。例えば、ランクの高い（それらの関連詞で示される話題にとって重要性が高い）共起関連詞が、関連詞辞書（ｉ−１）と関連詞辞書（ｉ）において共通する場合、共通関連詞の共通性はより高く評価されうる。

＜＜＜情報更新部における文字列抽出処理と辞書比較処理の説明＞＞＞
図４２は、同じＷＥＢページから時系列に収集された５つのテキストデータ（テキストデータ１〜５）から、文字列抽出処理７１０によって、それぞれ異なるタイミングで関連詞が抽出され、抽出された関連詞が、それぞれ対応する関連詞辞書（ｉ−１）または関連詞辞書（ｉ）に記憶され、その後、関連詞辞書（ｉ）が更新された場合に、関連詞辞書（ｉ−１）と関連詞辞書（ｉ）とを対象として辞書比較処理７２０が行われ、これらの処理が、時間（Ｔ＝ｔ１）から（Ｔ＝ｔ５）まで周期的に行われている例を示している（時間（Ｔ＝ｔ６）以降は省略した）。

最初に、時間（Ｔ＝ｔ１）において、この時点で所定のＷＥＢページから収集されたテキストデータ１から、文字列抽出処理７１０ａによって関連詞が抽出され、抽出された関連詞が関連詞辞書（ｉ−１）に記憶される。この文字列抽出処理７１０ａは、図４０を参照して説明した文字列抽出処理７１０に対応する。

次の、時間（Ｔ＝ｔ２）において、Ｔ＝ｔ１の場合と同様に、同じＷＥＢページから収集されたテキストデータ２から、文字列抽出処理７１０ｂによって関連詞が抽出され、抽出された関連詞が関連詞辞書（ｉ）に記憶される。ここで、対象のＷＥＢページにおいて話題や記載内容の変化があれば、抽出される関連詞もそれに応じて変化することになる。関連詞辞書（ｉ）に関連詞が記憶されると（更新されると）、辞書比較処理７２０ａによって関連詞辞書（ｉ−１）と関連詞辞書（ｉ）の比較が行われ、関連詞の出現状況に応じて、例えば、新たに出現した新着関連詞等が比較結果データ５４に記憶される。また、比較処理が終わると、関連詞辞書（ｉ）の内容が、関連詞辞書（ｉ−１）にコピーされる。

この辞書比較処理７２０ａは、図４１を参照して説明した辞書比較処理７２０に対応する。なお、この図では、辞書比較処理７２０ａが、Ｔ＝ｔ２のタイミングで行われているように記載されているが、関連詞辞書（ｉ）が更新された後に行われるものである。

次の、時間（Ｔ＝ｔ３）において、Ｔ＝ｔ１、ｔ２の場合と同様に、同じＷＥＢページから収集されたテキストデータ３から、文字列抽出処理７１０ｃによって関連詞が抽出され、抽出された関連詞が関連詞辞書（ｉ）に記憶される。ここで、対象のＷＥＢページにおいて話題や記載内容の変化があれば、抽出される関連詞もそれに応じて変化することになる。関連詞辞書（ｉ）に関連詞が記憶されると（更新されると）、辞書比較処理７２０ｂによって関連詞辞書（ｉ−１）と関連詞辞書（ｉ）の比較が行われ、関連詞の出現状況に応じて、例えば、新たに出現した新着関連詞等が比較結果データ５４に記憶される。また、比較処理が終わると、関連詞辞書（ｉ）の内容が、関連詞辞書（ｉ−１）にコピー（待避）される。

以降、同様にこれらの文字列抽出処理（７１０ｄ、７１０ｅ）及び辞書比較処理（７２０ｃ、７２０ｄ）を繰り返して、比較結果データ５４が、関連詞辞書（ｉ−１）と関連詞辞書（ｉ）を比較した結果得られた関連詞により、各タイミング（Ｔ＝ｔ２〜ｔ５）ごとに更新される。比較結果としての関連詞を最新のものだけ記憶するか累積的に記憶するかは、上述したように、適用する応用システム等の仕様による。

図４３は、同じＷＥＢページから時系列に収集された５つのテキストデータ（テキストデータ１〜５）から、文字列抽出処理７１０によって、それぞれ異なるタイミングで関連詞が抽出され、抽出された関連詞が、それぞれ対応する関連詞辞書（ｉ−１）、関連詞辞書（ｉ）、または関連詞辞書（ｉ＋１）に記憶され、その後、関連詞辞書（ｉ＋１）が更新された場合に、関連詞辞書（ｉ−１）、関連詞辞書（ｉ）、関連詞辞書（ｉ＋１）とを対象として辞書比較処理７２０が行われ、これらの処理が、時間（Ｔ＝ｔ１）から（Ｔ＝ｔ５）まで周期的に行われている例を示している（時間（Ｔ＝ｔ６）以降は省略した）。図４１との相違は、関連詞辞書がサイクリックに３つ用いられている点である。

最初に、時間（Ｔ＝ｔ１）において、この時点で所定のＷＥＢページから収集されたテキストデータ１から、文字列抽出処理７１０ｆによって関連詞が抽出され、抽出された関連詞が関連詞辞書（ｉ−１）に記憶される。

次の、時間（Ｔ＝ｔ２）において、Ｔ＝ｔ１の場合と同様に、同じＷＥＢページから収集されたテキストデータ２から、文字列抽出処理７１０ｇによって関連詞が抽出され、抽出された関連詞が関連詞辞書（ｉ）に記憶される。ここで、対象のＷＥＢページにおいて話題や記載内容の変化があれば、抽出される関連詞もそれに応じて変化することになる。その後、時間（Ｔ＝ｔ３）において、Ｔ＝ｔ１、ｔ２の場合と同様に、同じＷＥＢページから収集されたテキストデータ３から、文字列抽出処理７１０ｈによって関連詞が抽出され、抽出された関連詞が関連詞辞書（ｉ＋１）に記憶される。ここで、対象のＷＥＢページにおいて話題や記載内容の変化があれば、抽出される関連詞もそれに応じて変化することになる。

時間（Ｔ＝ｔ３）において、関連詞辞書（ｉ＋１）に関連詞が記憶されると（更新されると）、辞書比較処理７２０ｆによって３つの関連詞辞書（関連詞辞書（ｉ−１）、関連詞辞書（ｉ）、関連詞辞書（ｉ＋１））の比較が行われ、関連詞の出現状況に応じて、関連詞等が比較結果データ５４に記憶される。この実施例では、３つの関連辞書に関する比較が行われるため、２つの関連詞辞書に関する変化に基づいて記憶する関連詞として、例えば、新たに出現した新着関連詞や消滅した消滅関連詞のほか、３つの関連詞辞書に亘る変化に基づいて記憶すべきと判定される関連詞もある。例えば、関連詞辞書（ｉ）において一旦消滅して、関連詞辞書（ｉ＋１）において再度出現した復活関連詞などである。その他、関連詞辞書において関連詞の出現頻度を記憶していることが条件となるが、短期間のうちに（３つの関連詞辞書において）急激に出現頻度が高まった関連詞、（３つの関連詞辞書において）出現頻度が激減した関連詞、（３つの関連詞辞書において）出現頻度が再び高くなった関連詞、他の関連詞の出現頻度が変化するなかで一定範囲の出現頻度を維持する関連詞などを把握することも可能である。

辞書比較処理７２０ｆにおいて、比較処理が終わると、関連詞辞書（ｉ）の内容が、関連詞辞書（ｉ−１）にコピーされるとともに、関連詞辞書（ｉ＋１）の内容が、関連詞辞書（ｉ）にコピーされる。なお、この図では、辞書比較処理７２０ｆが、Ｔ＝ｔ３のタイミングで行われているように記載されているが、関連詞辞書（ｉ−１）、及び関連詞辞書（ｉ）が更新された後に行われるものである。

次の、時間（Ｔ＝ｔ４）において、Ｔ＝ｔ１〜ｔ３の場合と同様に、同じＷＥＢページから収集されたテキストデータ４から、文字列抽出処理７１０ｉによって関連詞が抽出され、抽出された関連詞が関連詞辞書（ｉ＋１）に記憶される。ここで、対象のＷＥＢページにおいて話題や記載内容の変化があれば、抽出される関連詞もそれに応じて変化することになる。関連詞辞書（ｉ＋１）に関連詞が記憶されると（更新されると）、辞書比較処理７２０ｇによって３つの関連詞辞書（関連詞辞書（ｉ−１）、関連詞辞書（ｉ）、関連詞辞書（ｉ＋１））の比較が行われ、関連詞の出現状況に応じて、関連詞等が比較結果データ５４に記憶される。また、比較処理が終わると、関連詞辞書（ｉ）の内容が、関連詞辞書（ｉ−１）にコピーされるとともに、関連詞辞書（ｉ＋１）の内容が、関連詞辞書（ｉ）にコピーされる。

以降、同様にこれらの文字列抽出処理７１０ｊ及び辞書比較処理７２０ｈを繰り返して、比較結果データ５４が、関連詞辞書（ｉ−１）、関連詞辞書（ｉ）、関連詞辞書（ｉ＋１）を比較した結果得られた関連詞により、各タイミング（Ｔ＝ｔ３〜ｔ５）ごとに更新される。比較結果としての関連詞を最新のものだけ記憶するか累積的に記憶するかは、上述したように、適用する応用システム等の仕様による。

なお、図４２の実施例では２つの関連詞辞書を、図４３の実施例では３つの関連詞辞書を（サイクリックに）用いて比較結果データ５４を記憶・更新しているが、これ以上の関連詞辞書を用いて辞書比較処理を行ってもよい。これによって、より多くのタイミングにおける関連詞の出現状況を把握することができ、この出現状況が所定条件を満たす場合に、当該関連詞を比較結果データ５４に記憶することができる。

図４４は、異なるＷＥＢページ（異なる主題に関するＷＥＢページ）から同タイミングで収集された３つのテキストデータ（テキストデータＡ〜Ｃ）から、文字列抽出処理７１０によって関連詞が抽出され、抽出された関連詞が、それぞれ対応する関連詞辞書Ａ、関連詞辞書Ｂ、または関連詞辞書Ｃに記憶され、その後、これらの３つの関連詞辞書を対象として辞書比較処理７２０が行われ、これらの処理が、時間（Ｔ＝ｔ１）から（Ｔ＝ｔ３）まで周期的に行われている例を示している（時間（Ｔ＝ｔ４）以降は省略した）。

最初に、時間（Ｔ＝ｔ１）において、この時点で所定の異なるＷＥＢページからそれぞれ収集された３つのテキストデータ（テキストデータＡ〜Ｃ）から、文字列抽出処理７１０ｋ、文字列抽出処理７１０ｍ、文字列抽出処理７１０ｎによって関連詞が抽出され、抽出された関連詞がそれぞれ、関連詞辞書Ａ、関連詞辞書Ｂ、関連詞辞書Ｃに記憶される。

その後、辞書比較処理７２０ｋによって３つの関連詞辞書（関連詞辞書Ａ、関連詞辞書Ｂ、関連詞辞書Ｃ）の比較が行われ、関連詞の出現状況に応じて、関連詞等が比較結果データ５４に記憶される。この実施例では、例えば、３つの関連詞辞書に共通して存在する関連詞が比較結果データ５４に記憶される。この場合、テキストデータＡ〜Ｃは、それぞれ異なる主題に関するＷＥＢページから収集されたテキストデータであり、異なる関連詞よりも、３つの関連詞辞書に共通する関連詞（共通関連詞）に着目したほうが、共通の話題を発見することが可能となり、その点で意味のある場合が多い。

また、関連詞辞書Ａにおいて共通関連詞とともに記憶されている他の関連詞（共起関連詞）、関連詞辞書Ｂにおいて共通関連詞とともに記憶されている他の関連詞（共起関連詞）、及び関連詞辞書Ｃにおいて共通関連詞とともに記憶されている他の関連詞（共起関連詞）との間に共通性があるか否かをさらに比較して、当該共通性に関する情報を比較結果データ５４に記憶することができる。

さらに、上記のような共起関連詞を比較する場合に、それらの共起関連詞に関連付けられたランクを考慮して共通性に関する情報を判定してもよい。例えば、ランクの高い（それらの関連詞で示される話題にとって重要性が高い）共起関連詞が、３つの関連詞辞書において共通する場合、共通関連詞の共通性はより高く評価されうる。

このような、時間（Ｔ＝ｔ１）における３つの関連詞辞書の比較を、時間（Ｔ＝ｔ２）において繰り返し行うことができる。このような処理を行うことにより、比較結果データ５４を時系列に更新することができる。

時間（Ｔ＝ｔ２）において、時間（Ｔ＝ｔ１）と同様に、この時点で所定の異なるＷＥＢページからそれぞれ収集された３つのテキストデータ（テキストデータＡ’〜Ｃ’）から、文字列抽出処理７１０ｋ’、文字列抽出処理７１０ｍ’、文字列抽出処理７１０ｎ’によって関連詞が抽出され、抽出された関連詞がそれぞれ、関連詞辞書Ａ’、関連詞辞書Ｂ’、関連詞辞書Ｃ’に記憶される。この実施例では、テキストデータＡ’は、テキストデータＡと同じＷＥＢページ、または同じ主題のＷＥＢページを想定している。同様に、テキストデータＢ’は、テキストデータＢと同じＷＥＢページ、または同じ主題のＷＥＢページであり、テキストデータＣ’は、テキストデータＣと同じＷＥＢページ、または同じ主題のＷＥＢページである。

その後、辞書比較処理７２０ｋ’によって３つの関連詞辞書（関連詞辞書Ａ’、関連詞辞書Ｂ’、関連詞辞書Ｃ’）の比較が行われ、関連詞の出現状況に応じて、関連詞等が比較結果データ５４に記憶される。この実施例では、例えば、３つの関連詞辞書に共通して存在する関連詞が比較結果データ５４に記憶される。

さらに、時間（Ｔ＝ｔ３）において、時間（Ｔ＝ｔ１、ｔ２）と同様に、この時点で所定の異なるＷＥＢページからそれぞれ収集された３つのテキストデータ（テキストデータＡ’’〜Ｃ’’）から、文字列抽出処理７１０ｋ’’、文字列抽出処理７１０ｍ’’、文字列抽出処理７１０ｎ’’によって関連詞が抽出され、抽出された関連詞がそれぞれ、関連詞辞書Ａ’’、関連詞辞書Ｂ’’、関連詞辞書Ｃ’’に記憶される。この実施例では、テキストデータＡ’’は、テキストデータＡ、テキストデータＡ’と同じＷＥＢページ、または同じ主題のＷＥＢページを想定している。同様に、テキストデータＢ’’は、テキストデータＢ、テキストデータＢ’と同じＷＥＢページ、または同じ主題のＷＥＢページであり、テキストデータＣ’’は、テキストデータＣ、テキストデータＣ’と同じＷＥＢページ、または同じ主題のＷＥＢページである。

その後、辞書比較処理７２０ｋ’’によって３つの関連詞辞書（関連詞辞書Ａ’’、関連詞辞書Ｂ’’、関連詞辞書Ｃ’’）の比較が行われ、関連詞の出現状況に応じて、関連詞等が比較結果データ５４に記憶される。この実施例では、例えば、３つの関連詞辞書に共通して存在する関連詞が比較結果データ５４に記憶される。

なお、図４４の実施例では、同じタイミングで、異なるＷＥＢページ（異なる主題に関するＷＥＢページ）から収集された３つのテキストデータに基づいて関連詞の抽出を行ったが、２つのテキストデータからそれぞれ関連詞の抽出を行ってもよいし、４つ以上のテキストデータからそれぞれ関連詞の抽出を行ってもよい。

＜＜情報更新部における文字列抽出処理と辞書比較処理の詳細な説明＞＞
次に、図４５を参照して、図４３に示した文字列抽出処理７１０と辞書比較処理７２０の例をより詳細に説明する。図４５は、３つのテキストデータ（テキストデータ１〜３）に対してそれぞれ文字列抽出処理（７１０ｆ、７１０ｇ、７１０ｈ）が行われ、対応する関連詞辞書（ｉ−１）、関連詞辞書（ｉ）、関連詞辞書（ｉ＋１）に対して、辞書比較処理７２０ｆが行われるところを示している。

この実施例では、３つのテキストデータは、共通の主題「株の取引」に関連する同じＷＥＢページから収集されたものである。例えば、ＷＥＢ検索により、検索キーワード「株の取引」を入力し、その結果得られた３つのＷＥＢページを１つのテキストデータとして扱う。図４５では、テキストデータ１は、時間（Ｔ＝ｔ１）における、第１のＷＥＢページから得られたテキストデータ１−１、第２のＷＥＢページから得られたテキストデータ１−２、第３のＷＥＢページから得られたテキストデータ１−３を含む。同様に、テキストデータ２は、時間（Ｔ＝ｔ２）における、第１のＷＥＢページから得られたテキストデータ２−１、第２のＷＥＢページから得られたテキストデータ２−２、第３のＷＥＢページから得られたテキストデータ２−３を含み、テキストデータ３は、時間（Ｔ＝ｔ３）における、第１のＷＥＢページから得られたテキストデータ３−１、第２のＷＥＢページから得られたテキストデータ３−２、第３のＷＥＢページから得られたテキストデータ３−３を含む。ここで、第１のＷＥＢページのＵＲＬはすべて同じであり、第２のＷＥＢページのＵＲＬはすべて同じであり、第３のＷＥＢページのＵＲＬはすべて同じである。

ここで、１つのテキストデータに含まれる３つのＷＥＢページに対応するテキストデータ（テキストデータ１−１、テキストデータ１−２、テキストデータ１−３）はそれぞれ、図２６に示すような質問文に対応付けて考えることができる。例えば、テキストデータ１−１はＱ１の質問であり、テキストデータ１−２はＱ８の質問であり、テキストデータ１−３はＱ１３の質問である。

文字列抽出処理７１０ｆは、時間（Ｔ＝ｔ１）において、テキストデータ１から所定の方法により関連詞を抽出し、関連詞辞書（ｉ−１）に記憶する。この実施例では、関連詞が４つ抽出され、それぞれをランクの順に配列して、１レコードとし関連詞辞書（ｉ−１）に格納する。関連詞のランク付けは、例えば、出現頻度等に基づいて決定することができる。抽出された４つの関連詞（関連詞１〜関連詞４）は、ランク順に「○社」、「△銀行」、「申込みは」、「口座」である。形態素解析等では、意味を持つ最小の単位（形態素）に分解して文字列を把握するが、他の方法では、形態素より大きな単位（例えば、文や文の一部）が関連詞として抽出されうる。上述の「申込みは」といった、名詞と助詞からなる文字列も関連詞として抽出されている。

また、この実施例では、それぞれのテキストデータに関して４つの関連詞が抽出されるようになっているが、これは説明の便宜のためのものである（以降の実施例も同様である）。実際には、関連詞がいくつ抽出されてもよく、テキストデータによってその数が異なる。文字列抽出処理において、一定の判定基準において閾値を超えた場合に文字列が関連詞として決定される場合は、その判定に応じて抽出される関連詞の数が変わってくる。また、抽出する関連詞の数を固定数とすることもできるし、テキストデータの文字数等に応じて設定するようにもできる。

文字列抽出処理７１０ｇは、時間（Ｔ＝ｔ２）において、テキストデータ２から所定の方法により関連詞を抽出し、関連詞辞書（ｉ）に記憶する。この実施例では、関連詞が４つ抽出され、それぞれをランクの順に配列して、１レコードとし関連詞辞書（ｉ）に格納する。関連詞のランク付けは、例えば、出現頻度等に基づいて決定することができる。抽出された４つの関連詞（関連詞１〜関連詞４）は、ランク順に「税率」、「○社」、「△銀行」、「申込みは」である。

同様に、文字列抽出処理７１０ｈは、時間（Ｔ＝ｔ３）において、テキストデータ３から所定の方法により関連詞を抽出し、関連詞辞書（ｉ＋１）に記憶する。この実施例では、関連詞が４つ抽出され、それぞれをランクの順に配列して、１レコードとし関連詞辞書（ｉ＋１）に格納する。関連詞のランク付けは、例えば、出現頻度等に基づいて決定することができる。抽出された４つの関連詞（関連詞１〜関連詞４）は、ランク順に「○社」、「口座」、「△銀行」、「申込みは」である。

次に、関連詞辞書（ｉ−１）、関連詞辞書（ｉ）、関連詞辞書（ｉ＋１）に対して、辞書比較処理７２０ｆが行われる。この実施例では、辞書比較処理７２０ｆは、新たに出現した関連詞（新着関連詞）、消滅した関連詞（消滅関連詞）、及び再度出現した関連詞（復活関連詞）を検出し、これらを比較結果データ５４に記憶するものとする。

例えば、関連詞辞書（ｉ−１）と関連詞辞書（ｉ）を比較すると、関連詞辞書（ｉ）で、関連詞「税率」が新たに出現しており、さらに、関連詞「口座」が消滅している。そこで、比較結果データ５４には、図４６のレコード５４ａに示すように、関連詞「税率」「口座」が記憶される。また、比較結果データ５４には、これらの関連詞とともに、出現状況を表すデータ（この実施例では、新たに出現した関連詞の場合「新着」、消滅した関連詞の場合「消滅」）が同じレコードに記憶される。さらに、この実施例では、当該出現状況となったタイミングを示すために、関連詞辞書を識別する「話題名」のデータが記憶される。各関連詞辞書は、話題名や日付けと対応付けられ、関連詞辞書（ｉ）は、ここでは「２０１３年１０月１０日、ｔ２における「株の取引」の話題」といった話題名に対応付けられている。

次に、関連詞辞書（ｉ）と関連詞辞書（ｉ＋１）を比較すると、関連詞辞書（ｉ＋１）で、関連詞「税率」が消滅しており、さらに、関連詞「口座」が復活している（関連詞辞書（ｉ−１）に存在し、関連詞辞書（ｉ）で消滅していた）。そこで、比較結果データ５４には、図４６のレコード５４ｂに示すように、関連詞「口座」「税率」が記憶される。また、比較結果データ５４には、これらの関連詞とともに、出現状況を表すデータ（この実施例では、再度出現した（復活した）関連詞の場合「復活」、消滅した関連詞の場合「消滅」）が同じレコードに記憶される。さらに、この実施例では、当該出現状況となったタイミングを示すために、関連詞辞書を識別する「話題名」のデータが記憶される。各関連詞辞書は、話題名や日付けと対応付けられ、関連詞辞書（ｉ＋１）は、ここでは「２０１３年１０月１０日、ｔ３における「株の取引」の話題」といった話題名に対応付けられている。

次に、図４７を参照して、図４４に示した文字列抽出処理７１０と辞書比較処理７２０の例をより詳細に説明する。図４７は、時間（Ｔ＝ｔ１）において、３つのテキストデータ（テキストデータＡ〜Ｃ）に対してそれぞれ文字列抽出処理（７１０ｋ、７１０ｍ、７１０ｎ）が行われ、対応する関連詞辞書Ａ、関連詞辞書Ｂ、関連詞辞書Ｃに対して、辞書比較処理７２０ｋが行われるところを示している。

この実施例では、３つのテキストデータは、同じ時間（Ｔ＝ｔ１）において、異なる主題に関連するＷＥＢページから収集されたものである。すなわち、テキストデータＡは、「Ａ社の技術」を主題としたＷＥＢページに基づくものであり、テキストデータＢは、「Ｂ社の技術」を主題としたＷＥＢページに基づくものであり、テキストデータＣは、「ＡＩ（人工知能）関連技術」を主題としたＷＥＢページに基づくものである。

例えば、テキストデータＡに関しては、ＷＥＢ検索により、検索キーワード「Ａ社の技術」を入力し、その結果得られた３つのＷＥＢページを１つのテキストデータとして扱う。同様に、テキストデータＢに関しては、ＷＥＢ検索により、検索キーワード「Ｂ社の技術」を入力し、その結果得られた３つのＷＥＢページを１つのテキストデータとして扱い、テキストデータＣに関しては、ＷＥＢ検索により、検索キーワード「ＡＩ（人工知能）関連技術」を入力し、その結果得られた３つのＷＥＢページを１つのテキストデータとして扱う。

図４７では、テキストデータ１は、主題「Ａ社の技術」に関連した、第１のＷＥＢページから得られたテキストデータＡ−１、第２のＷＥＢページから得られたテキストデータＡ−２、第３のＷＥＢページから得られたテキストデータＡ−３を含む。同様に、テキストデータ２は、主題「Ｂ社の技術」に関連した、第１のＷＥＢページから得られたテキストデータＢ−１、第２のＷＥＢページから得られたテキストデータＢ−２、第３のＷＥＢページから得られたテキストデータＢ−３を含み、テキストデータ３は、主題「ＡＩ（人工知能）関連技術」に関連した、第１のＷＥＢページから得られたテキストデータＣ−１、第２のＷＥＢページから得られたテキストデータＣ−２、第３のＷＥＢページから得られたテキストデータＣ−３を含む。

文字列抽出処理７１０ｋは、テキストデータＡから所定の方法により関連詞を抽出し、関連詞辞書Ａに記憶する。この実施例では、関連詞が４つ抽出され、それぞれをランクの順に配列して、１レコードとし関連詞辞書Ａに格納する。関連詞のランク付けは、例えば、出現頻度等に基づいて決定することができる。抽出された４つの関連詞（関連詞１〜関連詞４）は、ランク順に「Ａ社」、「音声」、「音声認識」、「営業」となっている。

文字列抽出処理７１０ｍは、テキストデータＢから所定の方法により関連詞を抽出し、関連詞辞書Ｂに記憶する。この実施例では、関連詞が４つ抽出され、それぞれをランクの順に配列して、１レコードとし関連詞辞書Ｂに格納する。関連詞のランク付けは、例えば、出現頻度等に基づいて決定することができる。抽出された４つの関連詞（関連詞１〜関連詞４）は、ランク順に「音声」、「研究開発」、「Ｂ社の業績」、「音声認識」となっている。

同様に、文字列抽出処理７１０ｎは、テキストデータＣから所定の方法により関連詞を抽出し、関連詞辞書Ｃに記憶する。この実施例では、関連詞が４つ抽出され、それぞれをランクの順に配列して、１レコードとし関連詞辞書Ｃに格納する。関連詞のランク付けは、例えば、出現頻度等に基づいて決定することができる。抽出された４つの関連詞（関連詞１〜関連詞４）は、ランク順に「ＡＩ」、「ロボット」、「音声認識」、「エージェント」となっている。

次に、関連詞辞書Ａ、関連詞辞書Ｂ、関連詞辞書Ｃに対して、辞書比較処理７２０ｋが行われる。この実施例では、辞書比較処理７２０ｋは、３つの辞書に共通する関連詞（共通関連詞）を検出し、これらを比較結果データ５４に記憶するものとする。

関連詞辞書Ａ、関連詞辞書Ｂ、関連詞辞書Ｃを比較すると、それぞれ上述した関連詞を記憶しており、共通関連詞として「音声認識」が存在することが認められる。そこで、この「音声認識」を比較結果データ５４に記憶する。

このような共通関連詞を把握することにより、企業間関連情報の分析を効果的に実現することができる。例えば、Ａ社の技術に関する記述で多く用いられている関連詞をテキストデータＡに基づく文字列抽出処理７１０ｋにより抽出し、Ｂ社の技術に関する記述で多く用いられている関連詞をテキストデータＢに基づく文字列抽出処理７１０ｍにより抽出し、ＡＩ（人工知能）関連技術に関する記述で多く用いられている関連詞をテキストデータＣに基づく文字列抽出処理７１０ｎにより抽出することによって、Ａ社とＢ社とが、どのようなＡＩ関連技術で共通性を有している可能性があるかを、客観的に把握することができる。

なお、図４７に示す実施例では、同じ時間（Ｔ＝ｔ１）において、異なる主題に関連するＷＥＢページから収集されたテキストデータに基づく関連詞辞書を比較するものであり、ＷＥＢページは、それぞれは意図的なＷＥＢ検索により収集されたものであるが、まったく偶然に集められたＷＥＢページからそれぞれ得られた関連詞辞書を比較した結果、偶然にも共通の関連詞が見いだされるといったケースも考えられる。

次に、図４８を参照して、情報更新部４６における文字列抽出処理７１０と辞書比較処理７２０の他の実施例を説明する。図４８は、図４５に示した文字列抽出処理７１０と辞書比較処理７２０の変形例を示すものである。図４８には、２つのテキストデータ（テキストデータ１、テキストデータ２）に対してそれぞれ文字列抽出処理７１０が行われ、対応する関連詞辞書（ｉ−１）、関連詞辞書（ｉ）に対して、辞書比較処理７２０が行われるところを示している。図４５に示す、テキストデータ３に関する処理については表示を省略した。

この実施例では、２つのテキストデータは、共通の主題「株の取引」に関連する同じＷＥＢページから収集されたものである。例えば、ＷＥＢ検索により、検索キーワード「株の取引」を入力し、その結果得られた３つのＷＥＢページを１つのテキストデータとするが、関連詞は、ＷＥＢページの単位ごとに抽出する。これによって、関連詞が、ＷＥＢページごとに管理されるが、３つのＷＥＢページに基づくテキストデータを３つ用意し、そのテキストデータごとに関連詞が抽出されるようにしてもよい。ここでは、関連詞が、複数のテキストデータから抽出されていることが重要である。

図４８では、テキストデータ１は、時間（Ｔ＝ｔ１）における、第１のＷＥＢページから得られたテキストデータ１−１、第２のＷＥＢページから得られたテキストデータ１−２、第３のＷＥＢページから得られたテキストデータ１−３を含む。同様に、テキストデータ２は、時間（Ｔ＝ｔ２）における、第１のＷＥＢページから得られたテキストデータ２−１、第２のＷＥＢページから得られたテキストデータ２−２、第３のＷＥＢページから得られたテキストデータ２−３を含む。ここで、第１のＷＥＢページのＵＲＬはすべて同じであり、第２のＷＥＢページのＵＲＬはすべて同じであり、第３のＷＥＢページのＵＲＬはすべて同じである。

文字列抽出処理７１０は、時間（Ｔ＝ｔ１）において、テキストデータ１から所定の方法により関連詞を抽出する。これは、上述のように、テキストデータ１に含まれるテキストデータごとに行われ、例えば、テキストデータ１−１から所定の方法により関連詞が抽出され、テキストデータ１−２から所定の方法により関連詞が抽出され、テキストデータ１−３から所定の方法により関連詞が抽出される。この実施例では、それぞれについて関連詞が４つ抽出され、各関連詞をランクの順に配列する。関連詞のランク付けは、例えば、出現頻度等に基づいて決定することができる。テキストデータ１−１に関し、抽出された４つの関連詞（関連詞１〜関連詞４）は、ランク順に「○社」、「口座」、「申込手続」、「△銀行」である。テキストデータ１−２に関し、抽出された４つの関連詞（関連詞１〜関連詞４）は、ランク順に「口座」、「△銀行」、「申込みは」、「◇社」である。テキストデータ１−３に関し、抽出された４つの関連詞（関連詞１〜関連詞４）は、ランク順に「株の購入」、「△銀行」、「指し値」、「○社」である。

次に、文字列抽出処理７１０は、このように抽出された関連詞のそれぞれについて、近傍関連詞を求め、それらを関連詞辞書（ｉ−１）に記憶する。近傍関連詞は、ある関連詞に着目した場合に、その関連詞とともに出現する（共起する）関連詞である。各テキストデータ（１−１、１−２、１−３）において、そのテキストデータに対応する話題に含まれている関連詞の集合は関連詞集合であり、ある関連詞に着目した場合、その関連詞を含む関連詞集合を、関連詞の近傍と称し、関連詞の近傍の集合を、関連詞の近傍系と称する。関連詞辞書（ｉ−１）には、関連詞ごとに、関連詞の近傍系が記憶される。

例えば、関連詞「○社」に着目すると、この関連詞は、テキストデータ１−１について抽出されており、関連詞の近傍は｛○社、口座、申請手続、△銀行｝である。同様に、この関連詞は、テキストデータ１−３について抽出されており、関連詞の近傍は｛株の購入、△銀行、指し値、○社｝である。これらから、関連詞「○社」について、関連詞の近傍系は、｛○社、口座、株の購入、△銀行、申請手続、指し値｝となる（テキストデータ１−１についての関連詞の近傍と、テキストデータ１−３についての関連詞の近傍とで重複する関連詞「△銀行」は１つだけ含められる）。

こうして求められた関連詞の近傍系が、それぞれの関連詞「○社」、「口座」、「△銀行」、「申請手続」、「株の購入」、「申込みは」、「指し値」、「◇社」について、関連詞辞書（ｉ−１）に記憶される。各関連詞については、関連詞の近傍系（近傍関連詞１〜７）が記憶されるが、これらの順序は、文字列抽出処理７１０により行われたランク付けや、共起性の高さ等を考慮して定められる。

さらに、文字列抽出処理７１０は同様に、時間（Ｔ＝ｔ２）において、テキストデータ２から所定の方法により関連詞を抽出する。これは、上述のように、テキストデータ２に含まれるテキストデータごとに行われ、例えば、テキストデータ２−１から所定の方法により関連詞が抽出され、テキストデータ２−２から所定の方法により関連詞が抽出され、テキストデータ２−３から所定の方法により関連詞が抽出される。この実施例では、それぞれについて関連詞が４つ抽出され、各関連詞をランクの順に配列する。関連詞のランク付けは、例えば、出現頻度等に基づいて決定することができる。テキストデータ２−１に関し、抽出された４つの関連詞（関連詞１〜関連詞４）は、ランク順に「○社」、「口座」、「新しい制度」、「申請手続」である。テキストデータ２−２に関し、抽出された４つの関連詞（関連詞１〜関連詞４）は、ランク順に「口座」、「△銀行」、「◇社」、「株の購入」である。テキストデータ２−３に関し、抽出された４つの関連詞（関連詞１〜関連詞４）は、ランク順に「株の購入」、「△銀行」、「○社」、「新しい制度」である。

次に、文字列抽出処理７１０は、このように抽出された関連詞のそれぞれについて、近傍関連詞を求め、それらを関連詞辞書（ｉ）に記憶する。例えば、関連詞「○社」に着目すると、この関連詞は、テキストデータ２−１について抽出されており、関連詞の近傍は｛○社、口座、新しい制度、申請手続｝である。同様に、この関連詞は、テキストデータ２−３について抽出されており、関連詞の近傍は｛株の購入、△銀行、○社、新しい制度｝である。これらから、関連詞「○社」について、関連詞の近傍系は、｛○社、口座、株の購入、新しい制度、申請手続、△銀行｝となる（テキストデータ２−１についての関連詞の近傍と、テキストデータ２−３についての関連詞の近傍とで重複する関連詞「新しい制度」は１つだけ含められる）。

こうして求められた関連詞の近傍系が、それぞれの関連詞「○社」、「口座」、「△銀行」、「申請手続」、「株の購入」、「新しい制度」、「◇社」について、関連詞辞書（ｉ）に記憶される。各関連詞については、関連詞の近傍系（近傍関連詞１〜６）が記憶されるが、これらの順序は、文字列抽出処理７１０により行われたランク付けや、共起性の高さ等を考慮して定められる。

次に、辞書比較処理７２０により、関連詞辞書（ｉ−１）と関連詞辞書（ｉ）が比較される。その結果、関連詞「指し値」、「申込みは」は、時間（Ｔ＝ｔ２）で消滅した消滅関連詞であり（図４８の符号７５３参照）、関連詞「新しい制度」は、時間（Ｔ＝ｔ２）で新たに出現する新着関連詞であり（図４８の符号７５２参照）、これらの関連詞は、関連詞辞書（ｉ−１）と関連詞辞書（ｉ）の変化分として比較結果データ５４に記憶される。

さらに、辞書比較処理７２０は、関連詞「○社」、「口座」、「△銀行」、「申請手続」、「株の購入」、「◇社」については、時間（Ｔ＝ｔ１）及び時間（Ｔ＝ｔ２）の両方で存在する関連詞であるが、各関連詞の近傍関連詞についても比較を行う。そうすると、近傍関連詞（または近傍関連詞の順序）が変化していることが分かる（図４８の符号７５１参照）。このことは、話題における当該関連詞の関係性や位置づけが変化していることを示している。本発明に係る情報検索システム１００が、こうした近傍関連詞の変化についても可視化しようとする場合は、これらの情報についても比較結果データ５４に記憶する。

次に、図４９を参照して、情報更新部４６における文字列抽出処理７１０と辞書比較処理７２０の他の実施例を説明する。図４９は、図４７に示した文字列抽出処理７１０と辞書比較処理７２０の変形例を示すものである。図４９には、３つのテキストデータ（テキストデータＡ〜Ｃ）に対してそれぞれ文字列抽出処理７１０が行われ、対応する関連詞辞書Ａ、関連詞辞書Ｂ、関連詞辞書Ｃに対して、辞書比較処理７２０が行われるところを示している。

この実施例では、３つのテキストデータは、同じ時間（Ｔ＝ｔ１）において、異なる主題に関連する同じＷＥＢページから収集されたものである。すなわち、テキストデータＡは、「Ａ社の技術」を主題としたＷＥＢページに基づくものであり、テキストデータＢは、「Ｂ社の技術」を主題としたＷＥＢページに基づくものであり、テキストデータＣは、「ＡＩ（人工知能）関連技術」を主題としたＷＥＢページに基づくものである。

例えば、テキストデータＡに関しては、ＷＥＢ検索により、検索キーワード「Ａ社の技術」を入力し、その結果得られた２つのＷＥＢページから２つのテキストデータ（テキストデータＡ−１、テキストデータＡ−２）を取得し、これらを文字列抽出処理７１０においては個別に扱う。同様に、テキストデータＢに関しては、ＷＥＢ検索により、検索キーワード「Ｂ社の技術」を入力し、その結果得られた２つのＷＥＢページから２つのテキストデータ（テキストデータＢ−１、テキストデータＢ−２）を取得し、これらを文字列抽出処理７１０においては個別に扱う。同様に、テキストデータＣに関しては、ＷＥＢ検索により、検索キーワード「ＡＩ（人工知能）関連技術」を入力し、その結果得られた２つのＷＥＢページから２つのテキストデータ（テキストデータＣ−１、テキストデータＣ−２）を取得し、これらを文字列抽出処理７１０においては個別に扱う。図４８では、テキストデータＡ、テキストデータＢ、テキストデータＣにそれぞれ３つのテキストデータが含まれていたが、この実施例では、それぞれ２つのテキストデータを含むものとする。

文字列抽出処理７１０は、時間（Ｔ＝ｔ１）において、テキストデータＡから所定の方法により関連詞を抽出する。これは、上述のように、テキストデータＡに含まれるテキストデータごとに行われ、例えば、テキストデータＡ−１から所定の方法により関連詞が抽出され、テキストデータＡ−２から所定の方法により関連詞が抽出される。この実施例では、それぞれについて関連詞が４つ抽出され、各関連詞をランクの順に配列する。関連詞のランク付けは、例えば、出現頻度等に基づいて決定することができる。テキストデータＡ−１に関し、抽出された４つの関連詞（関連詞１〜関連詞４）は、ランク順に「Ａ社」、「音声」、「音声認識」、「ロボット」である。テキストデータＡ−２に関し、抽出された４つの関連詞（関連詞１〜関連詞４）は、ランク順に「圧縮技術」、「音声認識」、「営業」、「音声」である。

次に、文字列抽出処理７１０は、このように抽出された関連詞のそれぞれについて、近傍関連詞を求め、それらを関連詞辞書Ａに記憶する。近傍関連詞は、ある関連詞に着目した場合に、その関連詞とともに出現する（共起する）関連詞である。各テキストデータ（Ａ−１、Ａ−２）において、そのテキストデータに対応する話題に含まれている関連詞の集合は関連詞集合であり、ある関連詞に着目した場合、その関連詞を含む関連詞集合を、関連詞の近傍と称し、関連詞の近傍の集合を、関連詞の近傍系と称する。関連詞辞書Ａには、関連詞ごとに、関連詞の近傍系が記憶される。

例えば、関連詞「音声認識」に着目すると、この関連詞は、テキストデータＡ−１について抽出されており、関連詞の近傍は｛Ａ社、音声、音声認識、ロボット｝である。同様に、この関連詞は、テキストデータＡ−２について抽出されており、関連詞の近傍は｛圧縮技術、音声認識、営業、音声｝である。これらから、関連詞「音声認識」について、関連詞の近傍系は、｛音声認識、Ａ社、圧縮技術、音声、ロボット、営業｝となる（テキストデータＡ−１についての関連詞の近傍と、テキストデータＡ−２についての関連詞の近傍とで重複する関連詞「音声」は１つだけ含められる）。

こうして求められた関連詞の近傍系が、それぞれの関連詞「Ａ社」、「音声認識」、「音声」、「圧縮技術」、「営業」、「ロボット」について、関連詞辞書Ａに記憶される。各関連詞については、関連詞の近傍系（近傍関連詞１〜５）が記憶されるが、これらの順序は、文字列抽出処理７１０により行われたランク付けや、共起性の高さ等を考慮して定められる。

さらに、文字列抽出処理７１０は、時間（Ｔ＝ｔ１）において、テキストデータＢから所定の方法により関連詞を抽出する。これは、上述のように、テキストデータＢに含まれるテキストデータごとに行われ、例えば、テキストデータＢ−１から所定の方法により関連詞が抽出され、テキストデータＢ−２から所定の方法により関連詞が抽出される。この実施例では、それぞれについて関連詞が４つ抽出され、各関連詞をランクの順に配列する。関連詞のランク付けは、例えば、出現頻度等に基づいて決定することができる。テキストデータＢ−１に関し、抽出された４つの関連詞（関連詞１〜関連詞４）は、ランク順に「音声」、「Ｂ社の業績」、「音声認識」、「研究開発」である。テキストデータＢ−２に関し、抽出された４つの関連詞（関連詞１〜関連詞４）は、ランク順に「研究開発」、「音声」、「音声認識」、「認証技術」である。

次に、文字列抽出処理７１０は、このように抽出された関連詞のそれぞれについて、近傍関連詞を求め、それらを関連詞辞書Ｂに記憶する。例えば、関連詞「音声」に着目すると、この関連詞は、テキストデータＢ−１について抽出されており、関連詞の近傍は｛音声、Ｂ社の業績、音声認識、研究開発｝である。同様に、この関連詞は、テキストデータＢ−２について抽出されており、関連詞の近傍は｛研究開発、音声、音声認識、認証技術｝である。これらから、関連詞「音声」について、関連詞の近傍系は、｛音声、研究開発、Ｂ社の業績、音声認識、認証技術｝となる（テキストデータＢ−１についての関連詞の近傍と、テキストデータＢ−２についての関連詞の近傍とで重複する関連詞「音声認識」、「研究開発」はそれぞれ１つだけ含められる）。

こうして求められた関連詞の近傍系が、それぞれの関連詞「音声」、「研究開発」、「Ｂ社の業績」、「音声認識」、「認証技術」について、関連詞辞書Ｂに記憶される。各関連詞については、関連詞の近傍系（近傍関連詞１〜４）が記憶されるが、これらの順序は、文字列抽出処理７１０により行われたランク付けや、共起性の高さ等を考慮して定められる。

さらに、文字列抽出処理７１０は、時間（Ｔ＝ｔ１）において、テキストデータＣから所定の方法により関連詞を抽出する。これは、上述のように、テキストデータＣに含まれるテキストデータごとに行われ、例えば、テキストデータＣ−１から所定の方法により関連詞が抽出され、テキストデータＣ−２から所定の方法により関連詞が抽出される。この実施例では、それぞれについて関連詞が４つ抽出され、各関連詞をランクの順に配列する。関連詞のランク付けは、例えば、出現頻度等に基づいて決定することができる。テキストデータＣ−１に関し、抽出された４つの関連詞（関連詞１〜関連詞４）は、ランク順に「ＡＩ」、「エージェント」、「ロボット」、「音声認識」である。テキストデータＣ−２に関し、抽出された４つの関連詞（関連詞１〜関連詞４）は、ランク順に「ロボット」、「音声認識」、「ＡＩ」、「学習機能」である。

次に、文字列抽出処理７１０は、このように抽出された関連詞のそれぞれについて、近傍関連詞を求め、それらを関連詞辞書Ｃに記憶する。例えば、関連詞「ＡＩ」に着目すると、この関連詞は、テキストデータＣ−１について抽出されており、関連詞の近傍は｛ＡＩ、エージェント、ロボット、音声認識｝である。同様に、この関連詞は、テキストデータＣ−２について抽出されており、関連詞の近傍は｛ロボット、音声認識、ＡＩ、学習機能｝である。これらから、関連詞「ＡＩ」について、関連詞の近傍系は、｛ＡＩ、ロボット、エージェント、音声認識、学習機能｝となる（テキストデータＣ−１についての関連詞の近傍と、テキストデータＣ−２についての関連詞の近傍とで重複する関連詞「ロボット」、「音声認識」はそれぞれ１つだけ含められる）。

こうして求められた関連詞の近傍系が、それぞれの関連詞「ＡＩ」、「ロボット」、「音声認識」、「エージェント」、「学習機能」について、関連詞辞書Ｃに記憶される。各関連詞については、関連詞の近傍系（近傍関連詞１〜４）が記憶されるが、これらの順序は、文字列抽出処理７１０により行われたランク付けや、共起性の高さ等を考慮して定められる。

次に、辞書比較処理７２０により、関連詞辞書Ａ〜Ｃが比較される。その結果、関連詞「音声認識」は、時間（Ｔ＝ｔ１）において、３つの関連詞辞書に共通する関連詞（共通関連詞）であり（図４９の符号７５５、７５５’、７５５’’参照）、これが比較結果データ５４に記憶される。このような共通関連詞を把握することにより、異なる主題のなかから共通する話題を発見することができ、この実施例のような主題の設定を行えば、企業間関連情報の分析にもつながる。

また、辞書比較処理７２０は、この共通関連詞について、各関連詞の近傍関連詞についても比較を行う。そうすると、近傍関連詞の共通性や近傍関連詞の順序の共通性等を把握することができ、これによって、共通関連詞の間の共通性のレベルを判定することができる。

なお、関連詞辞書Ａと関連詞辞書Ｂにおける共通関連詞として「音声」が把握されうるが（図４９の符号７５６、７５６’参照）、このような一部の関連詞辞書における共通関連詞も重要な情報となる場合があるため、比較結果データ５４に記憶することができる。

＜＜＜文脈学習機能とサービスＩＤの切り換え＞＞＞
本発明の一実施形態に係る情報検索システム１００では、会話制御端末装置２’’と、この装置を利用するユーザとの間の対話において、上述したように、入力指標や進捗指標等を学習して、その入力指標や進捗指標等に応じた対話を実現することができる。このような機能が、文脈学習機能である。入力指標は、これまでにユーザがどのような入力をしてきたのか、すなわち、ユーザの入力の履歴を示す情報である。また、進捗指標は、これまでにユーザに対してどのような話題を提供してきたのか、すなわち、ユーザに提供した話題の履歴を示す情報である。

さらに、情報検索システム１００では、話題提供サーバ４’の情報更新部４６で関連詞の出現に関する履歴等をとらえることにより、関連詞が所属する話題名を明確にすることができるほか、いつもの関連詞と（新たに出現した）新着関連詞とを区別して扱うことができたり、関連詞辞書の比較処理によって、話題の類似性や相違性についての判断をしたりすることができる、関連詞学習機能を実現できる。こうした関連詞学習機能により、会話制御端末装置２’’のユーザは、多くの話題名に関わる入力タイプを扱うことができるようになり、ユーザの入力識別手段が多様化できる。

シナリオデータは、ユーザの会話制御端末装置２’’における入力状況から判定される入力タイプに基づいてサービスＩＤを切り換えるよう制御する。例えば、情報検索システム１００における話題提供サーバ４’の文解析部４３、嗜好解析部４４、及び話題解析部４５によって提供される関連詞辞書５０や関連詞・共起語一覧表示画面６５０等を提供する機能に対応するサービスＩＤと、話題提供サーバ４’の情報更新部４６によって提供される関連詞辞書５０や比較結果データ５４の表示等を提供する機能に対応するサービスＩＤを、シナリオデータによって自動的に切り換える。

対応するシナリオデータのステートメントは、例えば、所定の入力タイプが入力された場合のアクションとして、対応するサービスＩＤのサービスに遷移させるように設定される。これを、図１４に示すようなシナリオデータで表すと、以下のようなステートメントとなる。
<sto:$IDN$:<sta:$num$>:$input$>
ここで、「sto」は、状態を遷移させる記述(shift to)であり、「$IDN$」は遷移先のサービスの識別番号であり、「<sta:$num$>」は、その遷移先のサービスにおける状態番号であり、「<$input$>」は、ユーザの入力文である。

＜＜＜本発明の一実施形態に係る話題提供サーバのハードウェア構成の説明＞＞＞
次に、図５０を参照して、本発明の一実施形態に係る話題提供サーバ４’を構成するコンピュータのハードウェア構成の例について説明する。ただし、図５０に示す話題提供サーバ４’の構成は、その代表的な構成を例示したにすぎない。

話題提供サーバ４’は、ＣＰＵ（Central Processing Unit）８０１、ＲＡＭ（Random Access Memory）８０２、ＲＯＭ（Read Only Memory）８０３、ネットワークインタフェース８０４、オーディオ制御部８０５、マイクロフォン８０６、スピーカ８０７、ディスプレイコントローラ８０８、ディスプレイ８０９、入力機器インタフェース８１０、キーボード８１１、マウス８１２、外部記憶装置８１３、外部記録媒体インタフェース８１４、及びこれらの構成要素を互いに接続するバス８１５を含んでいる。

ＣＰＵ８０１は、話題提供サーバ４’の各構成要素の動作を制御し、ＯＳの制御下で、本発明に係る文解析部４３、嗜好解析部４４、話題解析部４５、情報更新部４６における処理等の実行を制御する。

ＲＡＭ８０２には、ＣＰＵ８０１で実行される各処理を実行するためのプログラムや、それらのプログラムが実行中に使用するデータが一時的に格納される。また、上述のように、関連詞辞書５０や比較結果データ５４等も記憶されうる。ＲＯＭ８０３には、話題提供サーバ４’の起動時に実行されるプログラム等が格納される。

ネットワークインタフェース８０４は、ネットワーク９００に接続するためのインタフェースである。ネットワーク９００は、例えば、図２０に示す会話制御端末装置２’’やクローラー７３０が動作するコンピュータとの間のネットワークや、インターネットのようなネットワークである。

オーディオ制御部８０５は、マイクロフォン８０６とスピーカ８０７を制御して音声の入出力を制御する。ディスプレイコントローラ８０８は、ＣＰＵ８０１が発行する描画命令を実際に処理するための専用コントローラである。ディスプレイ８０９は、例えば、ＬＣＤ（Liquid Crystal Display）やＣＲＴ（Cathode Ray Tube）で構成される表示装置である。

入力機器インタフェース８１０は、キーボード８１１やマウス８１２から入力された信号を受信して、その信号パターンに応じて所定の指令をＣＰＵ８０１に送信する。

外部記憶装置８１３は、例えば、ハードディスクや半導体メモリのような記憶装置であり、この装置内には上述したプログラムやデータが記録され、実行時に、必要に応じてそこからＲＡＭ８０２にロードされる。例えば、また、上述のように、関連詞辞書５０や比較結果データ５４等も記憶されうる。

外部記録媒体インタフェース８１４は、外部記録媒体９１０にアクセスして、そこに記録されているデータを読み取る。外部記録媒体９１０は、例えば、可搬型のフラッシュメモリ、ＣＤ（Compact Disc）、ＤＶＤ（Digital Versatile Disc）などである。ＣＰＵ８０１で実行され、本発明の各機能を実現するためのプログラムは、この外部記録媒体インタフェース８１４を介して外部記録媒体９１０から提供されうる。また、本発明の各機能を実現するためのプログラムの他の流通形態としては、ネットワーク上の所定のサーバから、ネットワーク９００及びネットワークインタフェース８０４を介して外部記憶装置８１３やＲＡＭ８０２に格納されるというルート等も考えられる。

本発明の一実施形態に係る話題提供サーバ４’のハードウェア構成について、一例を説明したが、本発明の情報検索システム１００に含まれる会話制御端末装置２’’やクローラー７３０が動作するコンピュータのハードウェア構成も基本的に、図５０に示す構成と同様である。ただし、ここで、話題提供サーバ４’やクローラー７３０が動作するコンピュータについては、オーディオ制御部８０５、マイクロフォン８０６、スピーカ８０７、ディスプレイコントローラ８０８、ディスプレイ８０９、入力機器インタフェース８１０、キーボード８１１、及びマウス８１２は必須の構成要素ではない。

また、ここまでに説明した情報検索システム１００は、会話制御端末装置２’’で動作するTopiclet２０と、話題提供サーバ４’との間で、シナリオデータ２８（または、シナリオデータ５５）による制御に応じてデータの送受信を行うことにより、会話制御端末装置２’’のディスプレイに関連詞等の情報を表示する構成である。また、Topiclet２０を、例えば、所定のタイミングで会話制御端末装置２’’にダウンロードされ起動されるようにし、そのTopiclet２０がインターネット等のネットワークを介して話題提供サーバ４’と通信を行う、いわゆるクラウドコンピューティングによるシステムとして構成することができる。

しかしながら、本発明に係る情報検索システム１００は、他の様々な構成・方法により、本発明の技術的思想を効果的に実現することができる。例えば、上述した話題提供サーバ４’の各機能を、ＷＥＢサーバやＡＳＰ（Active Server Pages）サーバ等で構成し、会話制御端末装置２’’で動作する一般的なＷＥＢブラウザが、シナリオデータに制御されることなく（あるいは、シナリオデータによる制御の下で）、ユーザの指示に応じて、会話制御端末装置２’’のディスプレイに、関連詞等の情報を表示したり、話題や関連詞辞書や比較結果データの切り換えを行ったりするように構成することができる。この場合、話題提供サーバ４’として機能する、ＷＥＢサーバやＡＳＰサーバ等は、会話制御端末装置２’’のディスプレイに画面表示を行うために、当該表示のためのデータ（例えば、ＨＴＭＬデータ）を編集し生成する。

＜＜＜話題提供システムの他のシステム構成＞＞＞
次に、図５１を参照して、話題提供システムの他のシステム構成の概略について説明する。

図５１に示す話題提供システム１’は、会話制御端末装置１００２（Topiclet１０２０）、話題提供サーバ１００４（iWA１０３０）、保守装置１００３（iWA Manager１０４０）、および話題解析装置１００５を有する。図４に示す話題提供システム１では、話題解析処理による結果の（シナリオデータ編集部４１０への）提供が、保守装置３（iWA Manager４０）において行われるように示されているが、図５１に示す話題提供システム１’では、話題解析処理自体が話題解析装置１００５という、保守装置１００３（iWA Manager１０４０）とは別個の装置により実行されることが示されており、話題提供システムをこのようなシステム構成で実現することもできる。

話題提供システム１と話題提供システム１’は、その他の構成については同様であり、詳細な説明については省略する。会話制御端末装置１００２は、受信部１２４０、および送信部１２３０を含む。受信部１２４０は会話制御端末装置２の受信部２４０に対応し、送信部１２３０は会話制御端末装置２の送信部２３０に対応する。会話制御端末装置１００２は、基本的に図４の会話制御端末装置２と同様であり、他の構成要素については表示を省略する。話題提供サーバ１００４は、入力情報分析部１３１０、およびシナリオデータ記憶部１３２０を含み、保守装置１００３は、シナリオデータ送信部１４３０、シナリオデータ編集部１４１０、および端末装置仮想構築部１４２０を含む。話題解析装置１００５は、話題解析部１５１０を含む。

図５１に示す話題提供システム１’において、話題解析装置１００５の話題解析部１５１０は、話題提供サーバ１００４に対してネットワークを介して接続され、話題解析処理により求められたシナリオデータやその他のデータを、話題提供サーバ１００４の入力情報分析部１３１０に提供する。また、話題解析装置１００５の話題解析部１５１０は、保守装置１００３に対してネットワークを介して接続され（または、話題提供サーバ１００４を介して間接的に接続され）、話題解析処理により求められたシナリオデータやその他のデータを、保守装置１００３のシナリオデータ編集部１４１０に提供する。

話題解析装置１００５の話題解析部１５１０は、話題リストを生成し、話題リストに基づくシナリオデータを編集したり検証したりする。話題リストは、話題を関係付ける関連詞を介して話題の近さや繋がり方を付与したデータである。話題解析部１５１０によって、話題に関連付けられる関連詞が話題リストに蓄積されていく。保守装置１００３に提供された話題リストは、話題提供システム１’の契約者に提供されるデータであり、これらのデータは、例えば、シナリオデータを生成する際に用いられる。

また、話題解析装置１００５の話題解析部１５１０は、図２０に示す話題提供サーバ４’の文解析部４３の処理を実現するように構成されてもよいし、入力情報分析部４１の各処理を実現するように構成されてもよい。

さらに、話題解析装置１００５の話題解析部１５１０は、話題提供システム１’の契約者のそれぞれに対応付けられるように複数配置することができる。その場合に、それぞれの話題解析装置１００５で取得した情報を利用（または整理・統合したうえで利用）し、対応する保守装置１００３や話題提供サーバ１００４にデータを提供することもできる。話題解析装置１００５の話題解析部１５１０によりデータが提供されるタイミングとデータの内容は、提供先によって（すなわち、保守装置１００３と、話題提供サーバ１００４とで）異なっていてもよい。

また、契約者（または、契約者に属する担当者）は、保守装置１００３を用いて、話題解析装置１００５から提供されるデータにより、話題リストを構築したりシナリオデータを編集・作成することができるが、図５１に示す話題提供システム１’のような構成により、インターネット上のサービスとして遠隔から利用できるＰａａＳ（Platform as a Service）やＳａａＳ（Software as a Service）といった仕組みにより、保守装置１００３において各機能を実現することもできる。

ここまで、本発明の一実施形態に係る情報検索システム１００について、本発明を実施することができるいくつかの実施例を示しながら説明してきたが、これらの実施例は本発明を説明するための一例に過ぎず、本発明の権利範囲はこれらの実施例に限定されることはない。これらの実施例以外の様々な方法や構成によって、本発明の技術的思想を実現することができる。

話題と会話の流れに合わせた自然な応答を実現することができるとともに、話題制御ルールの変更、追加、修正などの保守作業を別個に行うことのできる話題制御システムであるため、高度な知識を有さずに、話題や話題のなかから抽出した重要なキーワードをユーザに提供したいという用途等がある場合に、このシステムを用いることができる。

１、１’ 話題提供システム
２、１００２会話制御端末装置（Topiclet２０、Topiclet１０２０）
２’、２’’ 会話制御端末装置
３、１００３保守装置（iWA Manager４０、iWA Manager１０４０）
４、４’、１００４話題提供サーバ（iWA３０、iWA１０３０）
１０話題記憶装置
２１入力制御部
２２検索制御部
２３送信制御部
２４受信制御部
２５応答情報決定部
２６出力制御部
４１入力情報分析部
４２外部ログ取得制御部
４３文解析部
４４嗜好解析部
４５話題解析部
４６情報更新部
１００情報検索システム
１００５話題解析装置

Claims

ユーザが入力する入力情報を分析することによって生成された入力特定情報に基づいて話題に関わる応答情報を規定するためのシナリオデータを記憶するシナリオデータ記憶部と、
前記入力特定情報を受信する受信部と、
前記シナリオデータを編集可能にするためのシナリオデータ編集部と、
前記受信部で受信した入力特定情報に基づいて編集したシナリオデータの応答を検証可能にするシナリオデータ検証部と、
編集したシナリオデータを外部に送信するシナリオデータ送信部と、を備え、
ユーザが入力情報を入力するための入力部と、
前記入力情報、及び前記応答情報に関する状態制御指標を記憶する状態制御指標記憶部と、
前記シナリオデータと前記状態制御指標とに基づいて前記応答情報を決定する応答情報決定部と、
前記応答情報決定部によって決定された応答情報を出力する出力部と、を備える会話制御端末装置を仮想的に構築する端末装置仮想構築部を有し、
前記状態制御指標は、過去の前記入力情報、及び過去の前記応答情報の少なくともいずれかに関する指標である保守装置。
ユーザが入力する入力情報を分析することによって生成された入力特定情報に基づいて話題に関わる応答情報を規定するためのシナリオデータを記憶するシナリオデータ記憶部と、
前記入力特定情報を受信する受信部と、
前記シナリオデータを編集可能にするためのシナリオデータ編集部と、
前記受信部で受信した入力特定情報に基づいて編集したシナリオデータの応答を検証可能にするシナリオデータ検証部と、
編集したシナリオデータを外部に送信するシナリオデータ送信部と、
話題を関係付ける関連詞を介して話題の近さや繋がり方を付与した話題リストを生成するための話題解析部とを、備え、
前記シナリオデータ編集部は、前記話題リストと前記関連詞を利用してユーザに話題を紹介するための話題紹介シナリオおよびユーザの入力に応答するための入力関連シナリオを前記シナリオデータとして編集可能にする保守装置。