JP2009151541A

JP2009151541A - 検索システムにおける最適情報の提示方法

Info

Publication number: JP2009151541A
Application number: JP2007328881A
Authority: JP
Inventors: Ryutaro Kishishita; 龍太郎岸下
Original assignee: Individual
Current assignee: Individual
Priority date: 2007-12-20
Filing date: 2007-12-20
Publication date: 2009-07-09

Abstract

【課題】ユーザー端末から所望情報について検索アクセスを、平文形式の音声又は文字で入力することにより、最も適切な情報を迅速に得ることができるようにした検索情報の処理と、処理された検索情報に基づく回答情報の提示に関する方法を提供する。
【解決手段】情報提供システムにおいて、ユーザー端末１は、情報検索のために自由文体乃至は単語を音声で入力すると共に、中央コンピュータ２から検索された回答情報を音声で出力する。検索に当たっては、ウェブ上のデータから作成した全文検索インデックスと、形態素解析結果データから作成した分類検索インデックスを使用する。検索実行時には、クエリに対する関連語展開も行う。
【選択図】図２

Description

本発明は、各ユーザーが夫々のユーザー端末を使用して入力する音声及び／又は文字（以下、説明の便宜のため、入力は単に音声入力と表記する場合もある。）による平文形式（単語を含む。以下、同じ）の検索情報に基づいて、ユーザーが検索している情報に適合する最適情報のみを選択抽出し、回答情報として音声及び／又は文字によりユーザー端末に提示する方法に関する。

従来のホームページ等の検索システムは、検索エンジンを搭載した多種多様な情報サイトがインターネット上に提供されているので、インターネットユーザーはキーボードを操作して各情報サイトを利用し、所望のホームページ等を探している。

これらの情報サイトは、主として、様々なホームページのＵＲＬ等の情報を、ホームページ内のキーワードによって分類した検索ファイルとして予め作成し各情報サイトのデータベースに蓄積しておき、ユーザーが適宜の情報サイトに自分の端末のキーボードを操作して接続し、そのサイトで閲覧したいホームページに関するキーワードになる単語をキーボード操作により一つ又は複数入力すると、情報サイトの検索エンジンが検索するファイルのキーワードにその単語を照合してホームページを絞り込み、絞り込んだホームページのＵＲＬ等の情報を回答情報としてユーザー端末に提示している。

そして、この回答されたホームページが単数であったときには、ユーザーはそのホームページにキーボード操作によりアクセスし、所望の情報を得ることを行っていた。また、回答されたホームページが複数あるときは、それらのホームページはランダムに配列されているため、ユーザーは回答されたホームページに無作為にアクセスするなどの態様で各ホームページにアクセスし、所望のホームページを探し、求めている情報を得ていた。

検索して回答される情報サイトには、そのホームページが利用された回数等を反映した順序で情報サイトが並べられて回答される場合がある。これは各ホームページに対するユーザーのアクセス数を記録し、このアクセス数の多寡を回答に反映することにより、他の多数のユーザー意向が反映された情報サイトのホームページの検索をユーザーに可能としている。

しかしながら、従来技術では、一般にアクセス可能なホームページは膨大な数にのぼり、複数のキーワードによる検索ファイルから回答されるホームページは、時に数千から数万に及ぶこともあるため、仮に回答されたホームページが数十であっても、ユーザーが本来所望しているホームページ情報かどうか確認する方法は、ユーザー端末のキーボードを操作して各ホームページに実際に接続し、各ホームぺージの内容をユーザーがいちいち閲覧して判断している。しかし、このような検索態様であるとユーザーは、膨大なサイト一覧に目を通して確認しなければならず、適切な情報サイトを探すことに多大の時間と手間を浪費する煩わしさがあった。

そこで、本発明は、ユーザーが膨大な情報サイト一覧等から一々キーボードを操作して情報サイトを探さなくても、ユーザー端末から所望情報について検索アクセスを、平文形式の音声又は文字で入力することにより、最も適切な情報を迅速に得ることができるようにした検索情報の処理と、処理された検索情報に基づく回答情報の提示に関する方法、並びに、そのためのシステムを提供することを課題とする。

また、本発明では、ユーザーが所望する場所、時間など、或は、各ユーザーの個々の情報、例えば性格や履歴，嗜好などユーザーの個人情報を、選択すべき情報の抽出要素とし、ユーザーが所望する最適な情報に関する回答が得られる方法を提供することも課題とする。

上記課題を解決することを目的としてなされた本発明の第一の構成は、
(イ) インターネットや通信回線を介して利用できる情報源にアクセス可能な通信機能を備えた種々のユーザー端末と、インターネットや通信回線を介して利用可能な情報源にアクセスでき且つ前記ユーザー端末と相互にアクセス可能な中央コンピュータとを含んで構成された情報提供システムにおいて、
(ロ) ユーザー端末は、情報検索のために自由文体乃至は単語を音声で入力すると共に、中央コンピュータから検索された回答情報を音声で出力する、
(ハ) 中央コンピュータは、適宜インターバルで以下の(a)〜(e)の処理を繰返して実行する。
(a) ウェブ上のデータを、文書フォーマットフィルタを通してから形態素解析器に通し、そこで形態素辞書と参照してからインデックス作成器に通して全文検索インデックスを形成する、
(b) 前記形態素解析器を通したデータを、特徴語作成器と構文解析器に通して、構文解析器を通したデータは概念辞書と参照して意味解析器に通し、特徴語解析器と意味解析器を通ったデータを分類辞書と参照して文書分類器に通し分類検索インデックスを作成する、
(c) ユーザー端末からの音声入力を、音声入力があるたびに文書データに変換して形態素解析器に通し、形態素辞書と参照してクリエ作成器に通してから、前記(a)の全文検索インデックスと(b)の分類検索インデックスの中から回答データを検索しユーザー端末に供給する、
(d) このとき分類検索インデックスに得られる回答データは関連語生成器に通してからクリエ作成器に通し分類検索インデックスにより回答データを検索してユーザー端末に提供する、
(e) 上記処理を実行中に、形態素辞書，概念辞書，分類辞書は、クローラに収集されたウェブ上から得たデータとユーザー端末から供給されるデータをそれぞれ学習データを用いて処理し、前記各辞書を夫々に再構築する、
(ニ) 上記(a)〜(e)の処理をする中央コンピュータと上記(ハ)のユーザー端末において、中央コンピュータがユーザー端末からの音声入力信号の中から特定した特定のテーマ，用語について確認の問合せをユーザー端末に音声出力で行い、その問合せに対するユーザー端末からの応答としての次の音声入力に対して、回答データをユーザー端末に音声出力させ、ユーザー端末からその回答データに対する承認が音声入力されると、次の回答データをユーザー端末に音声出力させ、以上の動作を繰返すことにより、
ユーザー端末へ最適情報を音声情報により提供することを特徴とするものである。

本発明では、ユーザー端末からの音声又は／及び文字の平文による入力による検索アクセスがあると、中央コンピュータは、データベースの中から検索平文に用いられている複数の用語を抽出して一時的にキャッシュメモリに記憶すると共にユーザー端末へ検索テーマの候補として音声又は文字により提供する過程と、ユーザー端末から受信した検索テーマに関する用語を、前記キャッシュメモリにデータベースから抽出されて記憶されているテーマに関する複数の用語と照合し、少なくとも一のテーマを特定する過程を実行する。

本発明では、ユーザー端末からの上記態様での検索アクセスに対し、一の情報源を特定する過程において、検索テーマに関する複数の用語に関連するとして収集された情報のデータベース中にある情報同士を相互に関連付ける。このようにして関連付けられる情報は、もともと各情報が属するグループごとに幾つかのグループに分けられていて、各情報をグループの内で上位のグループから下位のグループへ絞り込みを行い特定した後、取り出すようにしている。

本発明では、中央コンピュータは、ユーザー端末から入力される音声及び／又は文字の平文形式の入力情報に用いられている一又は複数の検索テーマに関連した用語を抽出しこの段階での適合情報を特定するが、この用語の特定のために中央コンピュータは関連語，連想語，類似語，同義語などについての辞書を夫々に備えていることにより、完全に一致適合した用語でなく、曖昧な用語であっても検索ができ、幅の広い検索要素をもつ。

曖昧な用語から適合情報を抽出する方法に関しての詳細であるが、前記で述べた辞書等より関連するテーマに関する用語の適合過程には自動応答対話手法を適用する。この手法の実行においては、仮に適合するテーマの情報が無かった場合、自動応答対話機能部に設置された「聞き返し」テンプレートによりユーザーに対して質問や提案の組み合わせを音声及び／又は文字で提示し、ユーザーの検索に対する中央コンピュータからの問いかけをする機能がある。この問いかけは、ユーザーが検索したい情報に関連する他の用語の提示をユーザーに促す意味を持つ。また、この応答対話機能部では、最初に検索テーマに適合した情報が多数出た場合、その情報の絞り込みを行うための「質問」テンプレート、「相槌」テンプレート、「聞き返し」テンプレートによりユーザーへ絞込みを行うための問いかけをすることにより、ユーザーが持つ検索したいテーマに関連した別の用語の聞き出しを行う。

本発明では、中央コンピュータは、情報源に定期的に且つ自動的にアクセスして、その情報源が有する情報を獲得する手段と、情報記憶部が収集している情報のデータベースを更新する手段とを備えている。

本発明における中央コンピュータの主な機能には、管理機能のほかに、ユーザーに代わって最適合情報を選択収集するための抽出機能を実行することがある。この機能は、ユーザーの使用する携帯電話，ＩＰ電話，ＦＡＸ，ＰＤＡ，一般電話，ＰＣ，ＳＴＢ，ルータ，ＩＣタグ，キオスク端末等の情報端末、或は、カーナビゲーション，CDプレーヤーやヘッドセット等の生活便利製品、又は、ヘルメット等の安全保守製品，家電製品，自動車，自動二輪車，船舶，航空機，電車，ロボット等々、予めインターネットを介して利用可能とされる情報にアクセスできる通信機能を備えた端末と中央コンピュータを結ぶ伝送路上に設置することも可能である。また、中央コンピュータの前記機能は情報源となる通信機能を有する端末への設置も可能であり、従って、玩具等への組み込みも可能である。

本発明では、新たな事例（情報）を中央コンピュータの情報記憶部に知識化して記憶させる。この場合、中央コンピュータに知識化の学習をさせると、該中央コンピュータが自動的に事例情報を知識化する構築を行う。また、本発明において、事例情報の知識化は、いわゆる学習であるが、一度学習した事例情報でも、修正変更や追加更新など、当該コンピュータが自動的に行う。

次に、本発明における知識化構築ツールの機能について詳細を述べる。例えば、個人の持つデータ，資料を知識化する場合には、予め単一的データとするため前記データ，資料から重要語等など形態素用語の抽出をしてツール化しておく。ここで、形態素用語とは、月日，場所，人名，用件，目的などといった事項に関する用語である。次に、この形態素用語を解析ツールとして事例データを入力して解析させると、上記で抽出した形態素用語のうち、抽出される用語と抽出されない用語が解析されて判る。ここで、抽出されなかった用語は観点用語として記憶部にコピーをすることにより観点用語として辞書化ができる。これがドメイン辞書の基本になる。この観点用語辞書が検索のために入力される情報に用いられた用語を観点解析する。

本発明においてユーザーに提供される最適情報は、ユーザー端末へ音声と画面表示により提供される。このようにして提供される情報は、少なくともニュース，天気予報，株式市況，地図情報，音声と映像による内，外国の音楽などの芸能情報を含むの文化情報，スポーツ情報のいずれかであるが、勿論、前記以外の情報であってもよい。

本発明によれば、ユーザーが膨大な情報一覧等から一々探さなくても、検索とそれに対する応答を何度か繰返すことによって、所望情報に最も適合した最適情報を得ることが出来る効果がある。また、検索のための入力は文字や音声など形態を問わないため、コンピュータを意識せず誰もが自由，任意に利用できるという利点がある。更に、通信形態は、有線，無線を問わないため、何処からでもアクセス可能であり、また中央コンピュータはユーザーの所望する端末の場所へ情報提供が可能となる。

本発明による最適情報の選択収集並びに抽出の方法とそのシステム関して、実施の形態に基づいて、更に詳しく説明する。

図１は、本発明方法を実施するシステム全体の構成を示す模式的ブロック図、図２は中央コンピュータを模式的に示したブロック図、図３はインデックス処理部の例を示すブロック図、図４は学習処理部（その１）の例を示すブロック図、図５は学習処理部（その２）の例を示すブロック図、図６は検索処理部の例のブロック図である。

本発明システムは、ユーザー端末１と、中央コンピュータ２と、中央コンピュータ２を管理する管理センタ３を備えて構成される。

図２に例示するように、中央コンピュータ２は、情報記憶部を備え、当該記憶部の中に種々の情報をデータベースにまとめて記録蓄積している。また、他のコンピュータと相互にアクセス可能であり、インターネットを介して種々の情報の利用が可能である。それ故、通常はモニタ、キーボード、マウスを備えたものもあるが、これらのすべてを備えないものもある。

ユーザー端末１は、ユーザーの用いるコンピュータを含んだ通信手段の一つである。従って、本発明におけるユーザー端末には、ユーザーが用いる携帯電話のほか、一般家庭やオフィス等の建物10で使用されるＩＰ電話，ＦＡＸ，ＰＤＡ，一般電話，ＰＣ，ＳＴＢ，ルータ，ＩＣタグ，キオスク端末等の情報端末、或は、カーナビゲーション，CDプレーヤーやヘッドセット９等の生活便利製品、若しくは、ヘルメット等の安全保守製品や家電製品８、これらのほかに自動車，自動二輪車，船舶，航空機，電車などの移動機器11、ロボットや監視カメラ，検知センサー12等のように、予め、インターネットInや通信回線を介して利用可能とされる情報にアクセス可能である通信機能が設置されたユーザー端末（以下、その他のユーザー端末という）であってもよい。勿論、ユーザー端末１がパーソナルコンピュータ等であってもよい。要すれば、ユーザー端末１、並びに、その他のユーザー端末は、電気通信機能を備えてインターネットInや電話回線網（以下、単に通信回線Lnという）を介して少なくとも中央コンピュータ２にアクセス可能であれば足りる。

中央コンピュータ２は、インターネットを含む通信回線Lnを介して利用可能とされている情報にアクセス可能である。本実施の形態では、ネットワークや通信回線Lnを介して各サイトにアクセスして情報を取得することが可能に形成されたものである。より詳細には、回線を介してネットワークに接続され、更に回線を介して各情報サイトにアクセス可能に形成されている。なお、通信回線は、無線通信回線や有線通信回線のいずれかを問わない。

中央コンピュータ２はインターネットやその他の通信回線Lnを介して外部に設置されている情報記録装置４やウェブサイト５に通信可能になっている。ここで言う情報記憶装置４とは、既存のデータベースや提携サイトの情報記憶装置である。

一方、中央コンピュータ２とユーザー端末１、並びに、その他のユーザー端末とは、相互にアクセス可能である。この実施の形態例では、ネットワークを介して各ユーザー端末と相互にアクセスすることが可能とされている。以下の説明では、ユーザー端末１と中央コンピュータ２について述べる。中央コンピュータ２は、回線Ln１を介してネットワークInに接続し、更に回線Ln2を介してユーザー端末１にアクセス可能になっている（図１）。もちろん、逆のアクセスも可能になっている。

次に、中央コンピュータ２やユーザー端末１の有する機能等について説明する。
まず、中央コンピュータ２は情報記憶部を備えている。中央コンピュータ２にはこの中央コンピュータ２を構成する一要素であるソフトウエアが搭載されており、このソフトウエアがコンピュータ２にデータを高速検索させる。即ち、このソフトウェアが情報記憶部のデータに直接アクセスして命令やデータを処理し、命令実行やデータ操作を行う。具体的には、このソフトウエアによって端末１からの入力信号の受信過程、入力用語の抽出過程、入力用語の抽出によるテーマ用語の適合過程、テーマに適合する用語の抽出過程、認識による適合用語の端末１への送信過程、入力信号からユーザー個人を識別をする過程、情報検索の特定過程、特定情報の抽出過程、送信情報の作成過程、送信テンプレートの抽出過程、送信信号の作成過程、作成された送信信号を送信する過程、各ユーザーの検索履歴を管理する過程、複数端末からのアクセスの頻度を管理する過程などの諸過程が実行される。

ユーザー端末１は、ソフトウエアを格納した記憶部とデータベース部と通信装置を少なくとも備えている。端末１のソフトウエアによって当該端末からの命令やデータ処理が実行されて、命令実行やデータ操作が行れる。端末１のソフトウエアによって中央コンピュータ２へのアクセスと、受信過程と、入力信号送信過程とが少なくとも実行される。

次に、第一の実施例における中央コンピュータ２の機構と動作例について説明する。

中央コンピュータ２は、図２に示すインデックス処理部2Aを備えている。
図３のインデックス処理部2Aは、HTMLやPDFなど種々の形式を採ったフォーマットからテキスト情報とそれ以外の情報に分けるフィルタリング処理を行う文書フォーマットフィルタ2aと該フィルタ2aを通して入力されるテキスト情報を形態素辞書2bを参照して形態素に分解する形態素分析器2cを備えている。

形態素（単語の列）に分解された前記テキスト情報の各形態素は、特徴語作成器2dに供給され、その中で名詞に関連する形態素を複合して検索用の特徴語が作成される。

一方、上記分析器2cで分解された各形態素の列は、同時に構文解析器2eに供給されて、前記テキストの構文が解析される。解析された構文データは、概念辞書2fに参照されて意味解析器2gで意味が解析される。

特徴語作成器2dと意味解析器2gの出力データは文書分類器2hに送られ、そこで分類辞書2iに参照されて分類検索用のインデックスが作成される。このとき、同時に、前述の形態素解析器2cの出力データは、全文検索用のインデックス作成器2gに送り込まれて全文検索用のインデックスに作成される。作成された夫々のインデックスデータは、それぞれ分類検索用インデックス並びに全文検索用インデックスとしてのデータベース2kと同2mに格納される。

上記の検索用インデックスのデータベース2kと2mは、中央コンピュータ２が稼働していれば常時動作している前記インデックス処理部2Aにおいて、常時、新しいデータ（情報）が学習されつつ蓄積されるようになっている。この点について、図４により説明する。

図４は、学習処理部2Bの概要を示すブロック図である。
この学習処理部2Bでは、まずリポジトリデータベース2nのデータをメタデータ抽出器2oに送って、各データの抽出履歴，データ構造，データ変換の情報やデータベースの構造と内容に関する属性，特性，意味付けなどの情報から分類に関する情報を抽出し、これらを分類学習器2Pに供給する。

一方、文書フォーマットフィルタ2aを通したリポジトリデータベース2nのデータを文書フォーマットフィルタ2aに通して形態素解析器2cに送り、形態素辞書2bに参照して形態素に分解し、その中から名詞に関する形態素を特徴語作成器2dに送って特徴語を生成してこれを分類学習器2Pに送る。

分類学習器2Pでは、上記のメタデータ抽出器2oからのデータと特徴語作成器2dからのデータによって、分類辞書2iを再構築している。

図５は学習処理部2Cにおける学習処理に関するブロック図である。この学習処理部2Cは、上記の学習処理部2Bと異なる。即ち、リポジトリデータベース2nのデータを文書フォーマットフィルタ２に通してテキストデータを抽出する点は共通しているが、この抽出データをコーパス作成器2qで分類辞書2iに参照し、コーパス（自然言語からなるテキストデータ）を作成する。作成されたコーパスは、概念学習器2rと形態素学習器2sに送り、それぞれの学習器2r，2sにおいて概念辞書2fと形態素辞書2bの再構築をする。

図６は検索処理部2Dのブロック図である。
図６の検索処理部2Dでは、ユーザー端末１からの入力データを検索のために処理する。すなわち入力データを形態素辞書2bに参照して形態素解析器2cで解析する。解析された形態素は、ユーザーに対する問合せなどとなるクリエを作成するクリエ作成器2tに送られる。そこで作成されたクリエ情報は、分類検索インデックスのデータベース2mと全文検索インデックスのデータベース2kに送られて、両インデックスのデータベース2m，2kにかけられ、回答情報を伴う問合せがユーザー端末１に向けて送られる。

このとき、分類検索インデックスのデータベース2mからの回答情報は、関連語生成器2uに送られ、関連語生成器2uが回答情報に関連する語（情報）を出力したり、そこで得られた関連語をクエリ作成器2tへ送り込むことにより、再帰的に分類検索を行うようにしている。

以上に説明した処理機能を備えた中央コンピュータ２に対して、ユーザーはその端末１から次のような操作を行い、中央コンピュータ２との間で、情報検索のためのいわば対話を行う。以下、図２を参照し、検索対話の形態例について説明する。

端末１の所有者であるユーザーは、そのユーザー端末１の操作により中央コンピュータ２に対し、情報検索のために音声又は／及び文字による入力でアクセスをかける。

中央コンピュータ２は、前記アクセスによる音声及び／又は文字による入力信号を入力信号コントロール部に送り、このコントロール部でコンピュータ処理による検索をするための入力情報に変換して当該入力情報を形態素解析器2cにかける。

形態素解析器2cでは、分解した入力情報の各形態素を形態素辞書2bに参照して、例えば最も頻繁に利用されているテーマに関する用語、予め決められていたテーマに関する用語、最新の情報に対応している用語などであって入力情報に対し所定の重みのある用語などを、特徴語作成やクリエ作成のために取り出す。

入力情報から検索のための用語が抽出されると、抽出した用語をテーマ用語と定義付け、このテーマ用語を一時的に情報記憶部に記憶すると共に、当該テーマ用語をユーザー端末１へ検索した情報の候補として提示するために送信する。中央コンピュータ２では、ユーザー端末１に適合情報を提供するため、前記情報（データ）をテンプレートに適合させたり、テンプレートに適合させたデータを所定のデータに変換したりすることが行われる。そしてこのデータはコンピュータに処理させる固有の信号に変換される。これにより、ユーザー端末１のコンピュータで前記信号を受信したユーザーは、その端末１で変換された音声又は／及び文字出力に基づいて中央コンピュータ２と音声又は文字による自動応答対話をすることになる。

これにより、テーマ用語は、ユーザー端末１の受信手段により受信されて、その端末１の画面やスピーカに出力される。この音声又は文字出力に接したユーザーは、その出力情報に対して応答情報をユーザー端末１から音声又は文字によって入力する。中央コンピュータ２に接続されているユーザー端末１は、前記入力を中央コンピュータ２に対する入力信号に変換して、入力信号の送信手段から当該中央コンピュータ２へ送信する。

中央コンピュータ２入力信号の受信手段は、上記の入力信号を受信し、これを形態素分析器2cに再度送る。形態素解析器2cでは、ユーザー端末１からの入力信号を波形分析などにより分解して形態素を取出し、この形態素の中からテーマとなる検索単語を抽出する。

検索単語が解析されて抽出されると、それが分類と全文の検索インデックス2m，2kに照合される。単語の照合は、抽出した単語をキャッシュメモリに記憶されているテーマ用語とも照合し、適合したテーマ用語から少なくとも一のテーマを特定する。ここで、キャッシュメモリに記憶されているテーマ用語と抽出した単語を照合したが、対応するテーマ用語がメモリ内にない場合には、メモリが備えたテーマ用語のデータベース内のテーマ用語と前記単語とを照合し、少なくとも一のテーマ用語を特定する。なお、単語抽出手段は、キャッシュメモリのテーマ用語を参照せずに、直接にテーマ用語のデータベースに蓄えられているテーマ用語と抽出した単語を照合することも可能である。

次に、情報記憶部のメモリが有する情報源となるデータベースにまとめられている情報源の一覧から、テーマ用語に対応する少なくとも一の情報源を特定する。具体的には、情報データベースでは、「アイドル」というテーマ用語に対して、「ｈｔｔｐ：／／ｗｗｗ．アイドル．ｏｒ．ｊｐ」というようなアドレスが対応付けられていたり、またはこのような「アドレス」に対応する番号等が付されていたりして、一の情報源を特定するようにしている。

利用する情報源が特定されると、その中から必要な情報が取出される。また、関連適合する情報の中で絞込をかける。絞込を掛けても、関連して適合する情報がない場合には当該用語の上位概念の情報に絞込をかけ、一の又は複数の情報を、特定した一の情報源に含まれる情報を記録しているメモリの収集情報データベースから取り出す。

この情報の取出過程で絞込をかける場合の具体例は、「この情報に含まれる情報には、何々がありますがどの情報が欲しいですか？」、或は、「このグループにはそのような情報がありませんが、より広いグループには何々の情報がありますよ。」若しくは「この情報に該当する情報は〇〇〇個ありますが絞込みをするために、もう少し特徴とするものはありませんか」等々の質問をユーザーに「問合せ」したり、「相槌」を打ったり、「聞き返し」をする。これが本発明における自動応答対話である。

なお、テーマ用語のデータベースにおける各々のテーマ用語に関連して収集した情報のデータベース中の情報は、相互に関連付けられていると共に、互いに従属するグループの一つのグループに分けられていることが望ましい。これにより、中央コンピュータ２は、情報をグループの内で上位のグループから下位のグループへ絞り込みを行い、絞り込んだグループから情報を取り出すことや、下位のグループに特定の情報が含まれていない場合に、下位のグループから上位のグループへ絞り込みの範囲を広げることが可能になる。

また、中央コンピュータ２は、ウェブサイトなどの外部情報源に定期的に又は任意のタイミングで自動的にアクセスして、各情報源に含まれる新たな情報を獲得し、情報記憶部のメモリ内の収集情報のデータベースの情報を更新する。これにより、中央コンピュータ２は、ユーザーに最新の情報を提供することが可能になる。

次に、テンプレートについて説明する。テンプレートは、対話用のデータベースに、入力情報に対する応答用のテンプレートである。具体的には、「〜を教えてください。」という入力情報に対しては、「〜は、・・・です。」というようなテンプレートの組合せを記録してあり、このテンプレートを応答用のテンプレートとして取り出す。

テンプレートが取出されると応答情報の作成手段が作動する。応答情報の作成手段は、応答テンプレートに取り出した情報を適合させて応答情報を作成する。なお、応答テンプレートは一般的なテンプレートであるので、文書作成データベースを用いて助詞等を調節して滑らかな文章になるように変換を行うことも行う。

次に、送信情報の作成手段が作動する。送信情報の作成手段は、先に特定した情報源に対応する一の送信情報をメモリに有するデータベースから抽出する手段である。具体的には、「アイドル」の「Ａさん」に関する情報源であった場合には、「Ａさん」の情報をデータベースから抽出することが行われる。なお、対応する情報が無い場合には、中央コンピュータ２が備えている情報を用いる。

次に、出力信号の作成手段が作動する。出力信号の作成手段は、選択抽出した情報を応答情報に適合させて出力信号に形成する。これにより、ユーザー端末１に対し情報源に適した送信信号による情報送信が可能になる。

次に、送信手段が作動する。送信手段は、出力信号を、ユーザー端末１へ出力送信する。なお、この送信は、ユーザー端末１の受信信号に適した信号に変換して送信される。

上記の出力信号は、ユーザー端末１の受信手段により受信され、ユーザーに対して画面又はスピーカからの音声として出力される。これにより、ユーザーは、所望の情報を音声又は文字により的確に且つ簡単に取得することが出来る。

これらを繰り返し行うことにより、ユーザーはその端末１を通して中央コンピュータ２と自動応答対話を続け、ユーザーが求めている情報により近付いた内容の情報を入手できることになる。

本発明は、以上の通りであって、検索したい情報に関して自動知識化によるデータベースの構築、及び、ユーザーと中央コンピュータの音声又は文字による自動応答対話に基づく最適合情報の選択，収集，抽出をして最適情報を音声又は文字によってユーザーに提供できるので、キーボードを操作しない情報検索の合理化，迅速化を実現できる。

特に、本発明では情報検索をアクセスするための入力は、音声及び／又は文字その他の信号を問わず可能であるから、例えば、音声での検索入力を選択すると、この他のユーザーの選択アクセス、中央コンピュータの情報源へのアクセス、及び、情報の選択等、音声のみで最適合の情報が選択抽出されてユーザーに提供されるので、きわめて便利である。

本発明方法を実施するシステム全体の構成を示す模式的ブロック図。中央コンピュータを模式的に示したブロック図。インデックス処理部を示すブロック図。学習処理部（その１）のブロック図。学習処理部（その２）のブロック図。検索処理部のブロック図。

符号の説明

１ユーザー携帯端末
２中央コンピュータ
３管理センタ
４ネットワークマネージャ
５既存データベース
６提携データベース
７ウェブサイト

Claims

(イ) インターネットや通信回線を介して利用できる情報源にアクセス可能な通信機能を備えた種々のユーザー端末と、インターネットや通信回線を介して利用可能な情報源にアクセスでき且つ前記ユーザー端末と相互にアクセス可能な中央コンピュータとを含んで構成された情報提供システムにおいて、
(ロ) ユーザー端末は、情報検索のために自由文体乃至は単語を音声で入力すると共に、中央コンピュータから検索された回答情報を音声で出力する、
(ハ) 中央コンピュータは、適宜インターバルで以下の(a)〜(e)の処理を繰返して実行する、
(a) ウェブ上のデータを、文書フォーマットフィルタを通してから形態素解析器に通し、そこで形態素辞書と参照してからインデックス作成器に通して全文検索インデックスを形成する、
(b) 前記形態素解析器を通したデータを、特徴語作成器と構文解析器に通して、構文解析器を通したデータは概念辞書と参照して意味解析器に通し、特徴語解析器と意味解析器を通ったデータを分類辞書と参照して文書分類器に通し分類検索インデックスを作成する、
(c) ユーザー端末からの音声入力を、音声入力があるたびに文書データに変換して形態素解析器に通し、形態素辞書と参照してクリエ作成器に通してから、前記(a)の全文検索インデックスと(b)の分類検索インデックスの中から回答データを検索しユーザー端末に供給する、
(d) このとき分類検索インデックスに得られる回答データは関連語生成器に通してからクリエ作成器に通し分類検索インデックスにより回答データを検索してユーザー端末に提供する、
(e) 上記処理を実行中に、形態素辞書，概念辞書，分類辞書は、クローラに収集されたウェブ上から得たデータとユーザー端末から供給されるデータをそれぞれ学習データを用いて処理し、前記各辞書を夫々に再構築する、
(ニ) 上記(a)〜(e)の処理をする中央コンピュータと上記(ハ)のユーザー端末において、中央コンピュータがユーザー端末からの音声入力信号の中から特定した特定のテーマ，用語について確認の問合せをユーザー端末に音声出力で行い、その問合せに対するユーザー端末からの応答としての次の音声入力に対して、回答データをユーザー端末に音声出力させ、ユーザー端末からその回答データに対する承認が音声入力されると、次の回答データをユーザー端末に音声出力させ、以上の動作を繰返すことにより、
ユーザー端末へ最適情報を音声情報により提供することを特徴とする最適情報提供システム。
最適情報は、ユーザー端末へ音声と画面表示により提供される請求項１の最適情報提供システム。
提供される情報は、少なくともニュース，天気予報，株式市況，地図情報，音声と映像による内，外国の音楽などの芸能情報を含む文化情報，スポーツ情報のいずれかである請求項１又は２の最適情報提供システム。