JP2832678B2

JP2832678B2 - 情報検索装置

Info

Publication number: JP2832678B2
Application number: JP6134217A
Authority: JP
Inventors: 一志西本
Original assignee: Ei Tei Aaru Tsushin Shisutemu Kenkyusho Kk
Current assignee: Ei Tei Aaru Tsushin Shisutemu Kenkyusho Kk
Priority date: 1994-06-16
Filing date: 1994-06-16
Publication date: 1998-12-09
Anticipated expiration: 2013-12-09
Also published as: JPH086965A

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】この発明は、情報検索装置に関
し、特に、検索要求に対して関連はあるが意外な検索結
果を得ることができるような情報検索装置に関する。

【０００２】

【従来の技術】近年、バーチャルリアリティ技術を応用
した臨場感通信会議システムの研究が行なわれている。

【０００３】図１８は、臨場感通信会議の様子を示した
図である。この臨場感通信会議システムは、三次元コン
ピュータグラフィックスによって生成される仮想空間１
を会議の「場」として提供することにより、従来のＴＶ
会議システムのような単なる音声・映像の伝送にとどま
らず、実空間３に存在する人物７に仮想空間１の人物５
ａ，５ｂの雰囲気を伝えることや、また仮想物体９を互
いに遠隔地にいる会議参加者が操作することによる高度
な協調作業を可能としている。

【０００４】また、臨場感通信会議に登場する人物像
は、従来のＴＶ会議などとは異なり、人物の身振りや表
情などの特徴点の動きに関する情報だけが通信され、こ
れを基に三次元グラフィックスによって構成されて表示
される。したがって、仮想空間１に登場する人物５ａ，
５ｂと実際の会議参加者が全く別人物であるような、会
議参加者の匿名化が容易に実現される。これは、さまざ
まな肩書のものが集まって新商品の企画会議などに行な
う際などに有効となる。

【０００５】このように臨場感通信会議システムが提供
する会議空間は非常に創造性に富んだものであり、本質
的に発想の場として優れた素質を備えている。

【０００６】そこでこの臨場感通信会議システムを「発
想の場」としてより高度に応用するための研究も進めら
れており、そのような応用の１つとして、その発想の場
で画期的な発想を得るためのきっかけを与えるようなも
のが望まれる。

【０００７】一方、昨今のデータベースの充実は目覚ま
しく、極めて多岐の分野にわたって膨大な知識が蓄積さ
れつつある。したがってこのデータベースに蓄積された
膨大な知識を発想作業に利用することは非常に有益と思
われる。

【０００８】

【発明が解決しようとする課題】しかしながら、一般的
に、データベースは、情報収集過程でのいわゆるデータ
ベース検索として利用される。したがって、従来のデー
タベース検索では、検索意図と提供される情報とが一致
するような完全想起が望まれていた。ここで、検索意図
とは、たとえば検索者が要求する検索結果である。この
ような情報が新たな発想を得るための基本的な情報とし
て不可欠であるのはもちろんだが、しかしそのような情
報だけでは画期的な発想を得るためには不十分である。
その理由は、従来のデータベース検索で得られる情報は
わかりきっている情報だからである。

【０００９】ゆえに、本発明の目的は、データベースを
用いた検索であり、かつ発想の場に画期的な発想のきっ
かけを提供することができるような情報検索装置を提供
することである。

【００１０】

【課題を解決するための手段】この発明の１つの局面に
従った情報検索装置は、データベースと、連想記憶手段
と、弱連想手段と、抽出手段とを備える。データベース
は、登録文と、登録文に対応付けられ登録文の検索に必
要な登録キーワードとを記憶する。連想記憶手段は、登
録キーワードを相互に連想的に記銘するとともに、入力
キーワードに応じて連想的に想起キーワードを想起す
る。弱連想手段は、連想記憶手段における登録キーワー
ド相互間の連想度合のうち所定の度合よりも強い連想度
合をリセットすることにより、連想記憶手段に入力キー
ワードとの連想度合が所定の度合よりも弱い想起キーワ
ードを想起させる。抽出手段は、データベースの中か
ら、想起キーワードと相関性の高い登録キーワードに対
応する登録文を抽出する。

【００１１】この発明のもう１つの局面に従った情報検
索装置は、データベースと、連想記憶手段と、連鎖連想
手段と、抽出手段とを備える。データベースは、登録文
と、登録文に対応付けられ登録文の検索に必要な登録キ
ーワードとを記憶する。連想記憶手段は、登録キーワー
ドを相互に連想的に記銘するとともに、入力キーワード
に応じて連想的に想起キーワードを想起する。連鎖連想
手段は、連想記憶手段による想起に既に使用された既使
用キーワードを記憶するとともに、想起キーワードに応
じて既使用キーワード以外の未使用キーワードを決定
し、その決定された未使用キーワードならびに最初に設
定されたテーマおよび興味を表わす初期キーワードを入
力キーワードとして連想記憶手段に供給する。抽出手段
は、データベースの中から、未使用キーワードおよび初
期キーワードと相関性の高い登録キーワードに対応する
登録文を抽出する。ここで、上記入力キーワードを入力
キーワードベクトルＱ_ｉ（ここで、ｉは０以上の整数で
ある。）で表わし、上記想起キーワードを想起キーワー
ドベクトルＫ_ｉ（ここで、ｉは０以上の整数である。）
で表わし、上記既使用キーワードを既使用キーワードベ
クトルＰ_ｉ（ここで、ｉは０以上の整数である。）で表
わし、初期キーワードを初期キーワードベクトルＴで表
わし、最初の既使用キーワードベクトルＰ_０をＰ_０＝Ｑ
_０とすると、好ましくは、上記連鎖連想手段は、式［Ｐ
_ｉ＝Ｑ_ｉ＋Ｐ_ｉ−１（ここで、ｉは１以上の整数であ
り、＋は論理和演算子である。）］により既使用キーワ
ードベクトルＰ_ｉを算出するとともに、式［Ｑ_ｉ＋１＝
Ｋ_ｉ＊｛！（Ｐ_ｉ）＋Ｔ｝（ここで、＊は論理積演算子
であり、！は否定演算子であり、＋は論理和演算子であ
る。）］により入力キーワードベクトルＱ_ｉ＋１を算出
する。

【００１２】

【００１３】

【００１４】

【００１５】

【作用】上記１つの情報検索装置は、連想記憶手段によ
って入力キーワードに応じて連想的に想起キーワードを
想起し、弱連想手段によって連想記憶手段における登録
キーワード相互間の連想度合のうち所定の度合よりも強
い連想度合をリセットすることにより、連想記憶審手段
に入力キーワードとの連想度合が所定の度合よりも弱い
想起キーワードを想起させ、抽出手段によってデータベ
ースの中から想起キーワードと相関性の高い登録キーワ
ードに対応する登録文を抽出する。この抽出された登録
文が会議の参加者などに提供される。

【００１６】上記もう１つの情報検索装置は、連想記憶
手段によって入力キーワードに応じて連想的に想起キー
ワードを想起し、連鎖連想手段によって連想記憶手段に
よる想起に既に使用された既使用キーワードを記憶する
とともに、想起キーワードに応じて既使用キーワード以
外の未使用キーワードを決定し、その決定された未使用
キーワードならびに最初に設定されたテーマおよび興味
を表わす初期キーワードを入力キーワードとして連想記
憶手段に供給し、抽出手段によってデータベースの中か
ら未使用キーワードおよび初期キーワードと相関性の高
い登録キーワードに対応する登録文を抽出する。この抽
出された登録文が会議の参加者などに提供される。

【００１７】

【００１８】

【００１９】

【００２０】

【実施例】まず、この発明の実施例による情報検索装置
を説明する前に、発想作業について簡単に説明する。

【００２１】発想作業は、大まかに、４つの過程で構成
される。第１の過程は情報の収集過程であり、第２の過
程は発散的思考の過程であり、第３の過程は収束的思考
の過程であり、第４の過程は評価の過程である。情報の
収集の過程は、たとえば日常の研究・生活、データベー
ス検索、他人の意見を聞くなどから多くの情報を得る過
程である。発散的思考の過程は、何らかのテーマの下で
関連する知識を連想的に自由に抽出する過程である。収
束的思考の過程は、発散的思考過程で抽出された知識
（アイデア断片）を統合し、各アイデア断片間に何らか
の新しい関連を見出す過程である。したがって、ここで
見出された新たな関連は「発想」である。評価の過程は
収束的思考過程で得られた発想を新奇性、実用性などの
面から評価する過程である。

【００２２】このような発想過程において、発散的思考
過程で抽出される相互に全く異質なアイデア断片間に、
収束的思考過程で何らかの関連が発見され統合されると
きに画期的な発想が得られる。

【００２３】そこで、データベースを用いた情報検索装
置によって「門外漢」を人工的に構成し、発散的思考支
援の実現を目標とする。

【００２４】発散的思考過程における門外漢の役割は、
異質な情報の提供によって発想の場を広げ、他の会議参
加者に意外な情報相互の関連への気付きを促すことであ
る。

【００２５】図１は、門外漢について説明するための図
である。たとえば、ある研究室においてブレインストー
ミングを行なう場合、日頃似たような研究を行なってい
る者同士ではどうしても発想の幅が狭まりがちである。
そこで、図１に示すような門外漢１１を一人参加させ
る。

【００２６】門外漢１１は、他の会議参加者である専門
家１３の発言内容（専門的意見）について深く理解する
ことは一般的に不可能である。しかしその発言内容のう
ちから理解可能な断片を用いて自分なりにそれらの発言
を部分的／表面的理解１５する。この場合、門外漢１１
は専門家１３の発言内容を誤解する場合もあり得る。そ
して、この部分的／表面的理解１５を基に、門外漢１１
は、自分の持つ知識１７から現在の話題１９に関連のあ
りそうな情報を取出して時には意外性のある意見２１を
発言する。

【００２７】もちろん浅い理解に基づく発言なので、こ
の内容はまるで的外れである可能性も十分にある。しか
し、ある場合にこの門外漢１１が提供する一見異質で無
関係に見える意外性のある情報２１が他の会議参加者１
３の誰かに現在の話題と結び付けられれば、そこから何
らかの新たな発見が得られる可能性がある。なぜなら
ば、「発想とは、全然性質の違う異質のデータの組合せ
から発見されるものである」からである。

【００２８】このような門外漢１１が会議の話題や各参
加者の発言内容について深い理解を必要とせず、浅い理
解で十分であるとの観点から、後で説明する情報処理検
索装置でも文の意味の理解は避け、表層レベルでの処理
が行なわれる。もちろん文の意味が理解できればより有
効な場面も多いと思われるが、文の理解のためにはドメ
イン知識の構成などの難しい問題が多い。特に門外漢と
して別分野の知識を持ちつつ現在の話題に関する理解を
行なうような情報検索装置を構成することは非常に困難
と思われる。しかも出来上がった情報検索装置が特定分
野でしか対応できなくなる可能性が多い。これらが現在
意味理解を避けている主な理由である。

【００２９】また、キーワードの重み付けは明示的に行
なうことも基本的に避けられる。これは、ある情報のあ
るキーワードに対する重みが、そのときの議論のテーマ
に応じて変化すると予想されるためである。また、話題
の抽出や発言の意味理解が困難な状況、場面に応じた的
確な重み付けを行なうことが実質不可能と思われること
による。人間の対話の話題の変化や発想の飛躍が必ずし
も重みの大きいキーワードから行なわれているとは限ら
ないとも思われる。そこで、キーワードとして扱う単語
すべてが平等な重みで処理される。また、抽出される情
報の関連性は直接的な場合も、極めて間接的な場合もあ
り非常に幅広くなると思われる。これによって、非常に
発散的な情報が提供できる情報検索装置を提供すると思
われる。そこで、以下に装置について説明する。

【００３０】図２は、この発明の一実施例による情報検
索装置の概略ブロック図である。図２を参照して、情報
検索装置２３は、ユーザインタフェース２５と、構文解
析部２７と、想起情報抽出部２９と、データベース３１
とを含む。

【００３１】簡単に動作について説明する。データベー
ス３１に登録されるべきたとえばニューズウィークのよ
うな記事（登録文）３３が構文解析部２７で単語に分解
されて構文解析される。また、記事３３はデータベース
３１に入力される。構文解析部２７で構文解析された記
事２３はキーワードベクトルとなり、想起情報抽出部２
９およびデータベース３１にキーワードベクトルが入力
される。データベース３１は、キーワードベクトルと記
事とを対応させて登録する。これにより、記事データベ
ース３１が構築される。同時に、想起情報抽出部２９
は、入力された記事に対応するキーワードベクトルを用
いて後で説明する連想記憶による検索意図と異なる想起
情報を抽出する。

【００３２】次に、ある利用者が情報検索装置２３と対
話するために、検索文３５をユーザインタフェース２５
に入力する。ここで、検索文３５は、たとえば記事３３
が英文テキストデータであれば、英文テキストデータと
なる。この検索文３５は通常データベース検索に使用さ
れるようなキーワードの羅列、またはＳＱＬのようなも
のである必要はなく、記事３３と同じ通常のテキストデ
ータであればよい。ただし、キーワードの羅列でも問題
はない。

【００３３】ユーザインタフェース２５に入力された検
索文３５は、記事３３と同様に構文解析部２７で単語に
分解され、キーワードベクトルとなる。キーワードベク
トルは、想起情報抽出部２９に入力される。そして、こ
の入力されたキーワードベクトルが用いられて、想起情
報抽出部２９が連想的な想起を行なう。この結果想起情
報抽出部２９は何らかのキーワードベクトルを想起で
き、データベース３１から想起されたキーワードベクト
ルと、データベース３１に登録されている各記事のキー
ワードベクトルとが比較され、最も両者の一致している
記事が連想の末に得られる検索結果としてユーザインタ
フェース２５に入力される。そして、利用者は、ユーザ
インタフェース２５から記事の提供３７を受ける。

【００３４】次に、より詳しく説明する。図３は、図２
の構文解析部２７の動作を説明するための図である。

【００３５】構文解析部２７は、記事３３および検索文
３５（以下では記事３３についてのみ説明するが、検索
文３５についてもキーワードベクトル化処理は全く同様
である）は、単語に分解して構文解析する。このとき、
同じ意味の単語は１つの代表単語に変換される。たとえ
ば、動詞はすべてその基本的現在形に変換される（ｅ
ｘ．ｗａｓ／ａｍ／ｉｓなどはｂｅに、ｇｏｎｅ／ｇ
ｏｉｎｇ／ｇｏｅｓはｇｏに変換される）。また、基本
的に同じ意味であるが、さまざまな品詞のある語は、そ
のうちのどれか１つの代表単語に変換される（ｅｘ．
ａｂｏｌｉｓｈａｂｌｅ／ａｂｏｌｉｓｈｍｅｎｔ／ａ
ｂｏｌｉｓｈｅｒ／ａｂｏｌｉｔｉｏｎａｂｏｌｉｔｉ
ｏｎｉｓｍなどはａｂｏｌｉｓｈに変換される）。

【００３６】そして、記事３３はキーワードベクトル化
される。記事Ａ_iのキーワードベクトルＫ_iは第（１）
式のように構成される。第（１）式の要素ｋ_jは、単語
Ｗ_jが記事Ａ_iに出現しているとき１、出現していない
とき０となる。つまり、記事のキーワードベクトルは、
ある単語がその記事に表われたか否かだけで構成されて
おり、ある記事のその記事における出現頻度、重要度な
どは全く考慮されていない。記事のキーワードベクトル
の長さｎは、構文解析部２７で処理したすべての記事に
出現した総単語種類数となり、新たな単語が出現するた
びにｎの値は大きくなる。

【００３７】記事のキーワードベクトル化についてさら
に図３を用いて具体的に説明する。たとえば記事Ａ₁が
Ａｎａｐｐｌｅｉｓｓｗｅｅｔ．であり、記事Ａ
₂がＩａｍａｂｏｙ．である場合、単語Ｗ₁が
ａ、単語Ｗ₂がａｐｐｌｅ、単語Ｗ₃がｂｅ、単語Ｗ₄
がｓｗｅｅｔ、単語Ｗ₅がＩ、単語Ｗ₆がｂｏｙとな
り、キーワードベクトルの長さｎは６となる。その結果
得られるキーワードベクトルＫ₁，Ｋ₂は、Ｋ₁＝（１
１１１００）、Ｋ₂＝（１０１０１１）となる。

【００３８】次に、想起情報抽出部２９の動作について
説明する。想起情報抽出部２９の具体例としては、アソ
シアトロンがある。以下では、アソシアトロンを用いた
場合の想起情報抽出部２９について説明する。

【００３９】アソシアトロンでは、各記憶事項ごとにベ
クトルｘの自己相関を表わす行列ｘｘ′が求められ、そ
の行列を加え合わせた行列Ｍが保持される。ただし、ｘ
は縦ベクトル、ｘ′はｘの転置ベクトルである。この行
列Ｍが連想記憶行列である。したがって、この装置の場
合には、ｍ個の記事のキーワードベクトルが記銘されて
得られる連想記憶行列Ｍは、第（２）式で与えられる。
なお、以下で使用するベクトルはすべて縦ベクトルとす
る。

【００４０】次に、想起について説明する。検索文３５
から得られたキーワードベクトルをＱとするとき、想起
されるベクトルＲは第（３）式で得られる。第（３）式
で、φ₀は第（４）式で示すような量子化関数であり、
φ^*は第（５）式に示すような量子化関数である。この
φ₀，φ^*はベクトルおよび行列に対しても適用でき、
この場合はそのベクトルおよび行列が要素ごとに量子化
される。θの値が適切に選ばれることで、アソシアトロ
ンは無用なノイズなく記銘した情報をより正確に想起で
きる。

【００４１】想起について具体的に説明する。図３に示
したキーワードベクトルＫ₁，Ｋ₂を記銘した場合、連
想記憶行列Ｍは第（６）式のようになる。データベース
３１にキーワードベクトルＫ₁，Ｋ₂が記銘されている
状態で、利用者が「Ｂｏｙｓｌｉｋｅｓｗｅｅｔａ
ｐｐｌｅｓ」という検索文を入力したとする。このと
き、ｌｉｋｅはすでに記銘されている記事中に表われて
いないので、単語数ｎ＝７、単語Ｗ₇“ｌｉｋｅ”と
し、検索文のキーワードベクトルＱが第（７）式のよう
に作成される。なお、転置を表わす記号′は、このよう
にベクトルを表わす小括弧にも適用できるものとする。
これにより、キーワードベクトルＫ₁，Ｋ ₂は、それぞ
れ第（８）式および第（９）式のように拡張される。同
時に、連想記憶行列Ｍも第（１０）式のように拡張され
る。

【００４２】このキーワードベクトルＱと連想記憶行列
ＭからベクトルＲが想起される。すなわち、第（１１）
式に示すφ₀（Ｍ）Ｑが得られるので、θ＝１とするこ
とによって想起されるベクトルＲは、第（１２）式とな
る。この想起されたベクトルＲは、キーワードベクトル
Ｋ₁に一致している。すなわち、「Ｂｏｙｓｌｉｋｅ
ｓｗｅｅｔａｐｐｌｅｓ」という入力に対して記事
Ａ₁の「Ａｎａｐｐｌｅｉｓｓｗｅｅｔ」が想起
されたことになる。

【００４３】結果的に重要なことは、ｂｏｙ，ｌｉｋ
ｅ，ｓｗｅｅｔ，ａｐｐｌｅという４つのキーワードに
対して、その結合をａｎｄでもｏｒでもない中間的な結
合によって検索が行なわれ、最終的にただ１つの検索結
果が得られていることである。

【００４４】仮に、これらのキーワードすべてがａｎｄ
条件で結ばれれば、記事Ａ₁，Ａ₂のいずれも検索結果
として取出されない。また、すべてをｏｒ条件で結べ
ば、両方の記事が検索結果として取出されてしまう。実
際の使用においては、多くの記事が記銘され、より長い
文章による検索文が入力された場合に、ａｎｄ条件では
おそらく１つの記事も抽出されず、逆にｏｒ条件では膨
大な数の記事が抽出されると予想される。このように、
情報が１つも抽出されなければ装置が役に立たず、逆に
大量に抽出されるものも発想者の思考の妨害となり好ま
しくない。

【００４５】一方、本装置では、文章がキーワードベク
トル化されることによって１種のドットパターンとして
扱われ、検索文から得られるパターンと類似したパター
ンを持つ記事が想起される、パターン認識的な検索処理
が行なわれている。したがって、一部のキーワードは自
動的に削除され、逆に一部のキーワードが自動的に追加
されることになる。これによって、検索生成の自動化が
実現されるとともに、抽出される記事が１つに絞り込ま
れるので、発想者の思考が妨害されない効果が得られ
る。

【００４６】また、記事中に表われる単語に重み付けが
行なわれずすべて等価に扱われているので、ある記事の
意味内容の確信を示す重要語（一般に言うキーワード）
のみならず非重要語による記事抽出も行なわれる。これ
は、検索意図と異なる意外性のある情報の獲得に有効で
ある。なお、検索意図と異なる情報が得られるのであれ
ば、単語に重み付けが行なわれてもよい。

【００４７】通常のデータベース検索では検索結果の適
合率、再現率といった「いかに求めている情報と一致し
たものが検索されたか」が重要視されるが、この装置で
は、「検索意図と異なる意外性のある情報」を求めてい
るので適合率、再現率の評価は必要ない。

【００４８】さらに、似たような単語の多く出現する文
章が多数記憶された場合、完全に一致する１つのキーワ
ードベクトルが想起されることは困難となる。すなわ
ち、想起されるベクトルに若干のノイズ要素が含まれる
ことになる。そこで、実際の利用での最終的なキー抽出
は、想起されたベクトルと各記事のキーワードベクトル
の相互相関の高いものが取出されればよい。すなわち、
想起情報抽出部２９は、第（１３）式に示す相互相関ｒ
_iを求め、その相互相関の高いキーワードベクトルを取
出すことを行なえばよい。第（１３）式でｎ_Rは想起さ
れたベクトルＲの要素のうち値が１のものの個数、ｎ_Ki
はキーワードベクトルＫ_iの要素のうち値が１のものの
個数である。また演算子・はベクトルの内積を示す。

【００４９】なお、より高い異質性を持つ情報を必要と
する場合には、この相互相関の値が所定の値より低いよ
うな情報が取出されて提供されればよい。ただし、この
場合にもあまりにも相互相関の値の低いものは関連性が
極端に弱いと思われるので、必要ならばある所定の値よ
り低いような情報が提供されないようにしてもよい。

【００５０】

【数１】

【００５１】

【数２】

【００５２】ところで、図２に示した構文解析部２７で
は、冠詞や指示代名詞などの、それだけでは一般にほと
んど無意味な語もキーワードとして取出される。このよ
うな語はほとんどの文章に含まれるため、これら以外の
何らかの具体的な意味のある語が他にキーワードとして
含まれていれば、実質そのような意味のある語によって
検索が行なわれる。しかし、検索文に含まれる意味のあ
るキーワードが、データベース３１中のどの記事にも含
まれない場合、冠詞や指示代名詞などの無意味語による
検索が行なわれてしまう。そして、ある検索が意味のあ
る語によってなされたものであるかまたはそうでないの
かの自動的判定が困難となる。

【００５３】具体的に説明する。データベース３１に、
記事Ａ₁：Ａｐｅｎｉｓｕｓｅｄｔｏｗｒｉ
ｔｅ．と、記事Ａ₂：Ａｈｏｒｓｅｉｓｒｕｎｎ
ｉｎｇ．と、記事Ａ₃：Ｗｈｉｃｈｉｓａｈｏｒ
ｓｅ？とが登録されているとする。検索文として、Ｔｈ
ｉｓｉｓａｐｅｎ．が入力されると、記事Ａ₁と
の間でｐｅｎ，ｂｅ，ａの３つ、記事Ａ₂との間でａ，
ｂｅの２つ、記事Ａ₃との間でｂｅ，ａの２つが一致す
る。その結果、記事Ａ₁が検索結果として得られる。つ
まり、ｐｅｎという意味のある語によって記事Ａ₁が選
ばれたことになる。ところが、たとえば検索文としてＷ
ｈｉｃｈｉｓａｐｅｎ？が入力されると、記事Ａ
₁との間で３つ、記事Ａ₃との間で３つのキーワードが
一致する。したがって、記事Ａ₁と記事Ａ₃とが区別で
きず、実際には記事Ａ₁が結果として選ばれるべきであ
るのに決定できないという欠点がある。

【００５４】次に、上記のような欠点を解決した他の実
施例について説明する。図４は、この発明の他の実施例
による情報検索装置の概略ブロック図である。

【００５５】この実施例の情報検索装置３９は、記事４
１およびユーザインタフェース２５を介して入力される
検索文５３を構文解析する構文解析部４３と、構文解析
部４３で変更されたキーワードベクトルに応じて情報の
想起を行なう想起情報抽出部４５と、ユーザインタフェ
ース２５を介して記事の提供５５を行なうデータベース
３１とを含む。さらに、想起情報抽出部４５は、連想記
憶を行なう連想記憶部４７と、キーワードフィルタ４９
と、データベース管理部５１とを含む。

【００５６】動作について簡単に説明する。データベー
ス３１を構築する場合は、登録する記事４１が構文解析
部４３に入力されて、キーワードベクトルに変更され
る。このキーワードベクトルが連想記憶部４７に入力さ
れ、連想記憶部（一例としてアソシアトロン）４７で連
想記憶される。同時に、キーワードベクトルと記事４１
とが対応付けられてデータベース３１に登録される。

【００５７】次に、本装置が門外漢として使用される場
合について説明する。この場合、実際の使用に先立って
上述した手順でデータベース３１が構築されている。記
事４１にある程度の指向性が持たされるため、利用者は
まず始めにユーザインタフェース２５を介して会議のテ
ーマ、各自の興味をテキストで入力する。これは、キー
ワードのリストでもかまわないし、通常の文でもかまわ
ない。続いて、利用者は自分の意見をテキストで入力す
る。

【００５８】入力された意見とテーマおよびその意見の
発話者の興味は、構文解析部４３でキーワードベクトル
に変換される。このキーワードベクトルから、連想記憶
部４７は何らかのキーワードベクトルを想起する。

【００５９】データベース管理部５１は、各会議参加者
の記事提供履歴５７を参照しながら、想起されたキーワ
ードベクトルと、データベース３１に登録されている各
記事のキーワードベクトルとの相互相関を図２に示した
実施例と同様な方法で計算し、相関値の高い記事を抽出
し、データベース３１からユーザインタフェース２５を
介して利用者に記事の提供５５を行なう。

【００６０】また、キーワードフィルタ４９は、検索文
５３のキーワードベクトルと想起されたキーワードベク
トル、または抽出された記事のキーワードベクトルとを
用いてキーワードベクトルをモディファイする。このモ
ディファイされたベクトルによって再想起が行なわれ、
より発散的な情報の抽出が試みられる。

【００６１】次に、各実験について説明するために、各
構成について詳細に説明する。ユーザインタフェース２
５について説明する。ユーザインタフェース２５は、単
独利用者用と複数利用者用の２種類が用意されている。

【００６２】単独利用者用インタフェースでは、利用者
は必要に応じたメニューを選び、テーマおよび興味を登
録し、意見を入力する。記事の抽出方法は３種類（比較
実験も含めると５種類）準備されている。このことにつ
いては、後で連想記憶およびキーワードフィルタのとこ
ろで詳しく説明する。利用者は意見を入力した後連続し
ていずれかの記事抽出方法を指定することによって、連
続して記事を参照できる。

【００６３】複数利用者用ユーザインタフェースには、
パブリックドメインのソフトウェアであるｐｈｏｎｅが
改造されたものが使用された。ｐｈｏｎｅは複数の人間
によるリアルタイムチャートのソフトウェアである。１
つの画面は参加者数分のウィンドウに区切られ、参加者
の発言内容はそれぞれに固有に割当てられたウィンドウ
に表示される。各参加者の発言内容は本装置に入力さ
れ、連想想起された抽出された記事が本装置用のウィン
ドウに表示される。このユーザインタフェース２５を使
用することによって、門外漢を加えた数人による簡単な
会議が行なわれる。

【００６４】次に、構文解析部４３について説明する。
この構文解析部４３は、まず入力された記事４１または
検索文５３を単語に分解し、各単語を正規形に戻す。正
規形とは、たとえば動詞ならその基本形（日本語なら終
止形、英語なら現在形）、名詞なら単数形のことであ
る。そして、簡単な構文解析によって各単語の品詞を決
定する。ただし、文の意味理解は求められていないの
で、この品詞決定はあまり正確なものである必要はな
い。むしろ処理速度の向上のためにアルゴリズムが簡素
化されている。この解析の結果、文に出現した単語は品
詞付リストとして出力される。

【００６５】このリストからキーワードベクトルが生成
される。まず、リストから名詞（代名詞を除く）と、品
詞同定不能であった単語のみが取出されて単語リストの
サブセットが作られる。すなわち、取出される単語の条
件は、特定の品詞の単語であるか否かである。このよう
に特定の品詞のみが取出されるのは、図２に示した構文
解析部２７とは異なる。このような２種類の単語が選択
された理由の１つは、表層処理による話題抽出の研究に
見られるように、一般に文の話題候補はその文に表れる
名詞（句）となることである。また他の理由は、実際に
いくつかの記事に対して構文解析処理が行なわれてみた
結果、品詞同定不能の単語には分野に依存した専門的な
単語や特殊な単語が表われ、文の内容にとって比較的重
要なものが多く含まれると思われたことによる。

【００６６】なお、後で説明するように実験で示した記
事は商用のものであるので、品詞同定不能語によるミス
スペル単語はほとんど含まれていない。

【００６７】こうして抽出された特定の品詞の単語によ
りキーワードベクトルが生成される。記事Ａ_iのキーワ
ードベクトルＫ_iは、前述したように第（１）式で生成
される。ただし、第（１）式で１をセットする要素は、
その記事あるいは発言に出現する順に採用し、その個数
は１記事・発言あたり最大５０個に制限されている。こ
れは、主に処理速度と後述するアソシアトロンの想起の
正確さとの要請による。

【００６８】また、後で説明するように、実験で使用し
た記事はいわゆる新聞記事と同様なものであるので、そ
の主な内容はその記事の最初の部分にあることから、こ
の程度の採用数でよいとされた。この採用数が変えられ
ることで、抽出記事の関連性や意外性が変化する可能性
はある。

【００６９】このキーワードベクトル生成処理におい
て、各名詞および品詞同定不能単語の重要度や出現頻度
などは一切考慮されていない。これは、文中のその文の
内容にとって重要でない単語もいわゆる重要と同等のキ
ーワードとして扱うことによって、関連はあるが、同時
に検索意図と異なる異質な情報が得られることを期待し
たことによる。

【００７０】このことについて具体的に説明する。たと
えば、記事Ａ₁：Ａｐｅｎｉｓｕｓｅｄｔｏｗ
ｒｉｔｅ．と、記事Ａ₂：Ａｈｏｒｓｅｉｓｒｕ
ｎｎｉｎｇ．と、記事Ａ₃：Ｗｈｉｃｈｉｓａｈ
ｏｒｓｅ？とがデータベース３１に登録されていたとす
る。実験と異なるが特定の品詞として名詞とｂｅ動詞以
外の動詞が選択された場合であって、検索文としてＷｈ
ｉｃｈｉｓａｐｅｎ？が入力されると、選択される
べき記事Ａ₁が抽出されることになる。

【００７１】次に、連想記憶部４７について説明する。
この連想記憶部４７は、図２に示した実施例における説
明と同様となるが、意外な情報を獲得するために本質的
にこの装置に必要とされるものであるため、再度詳しく
説明する。

【００７２】まず記銘の方法について説明する。連想記
憶部４７として用いたアソシアトロンでは、ベクトルの
自己相関行列を積算した連想記憶マトリクスを生成する
ことによって記銘を行なう。ｍ個の記事のキーワードベ
クトルＫ_i（１≦ｉ≦ｍ）の記銘は、第（２）式のよう
にして行なわれる。

【００７３】次に、想起の手順について説明する。検索
文５３から得られたキーワードベクトルＱにより、想起
されるキーワードベクトルＲは、第（３）式で得られ
た。

【００７４】そして、第（５）式のθの値が適切に選ば
れることにより、アソシアトロンは記銘した情報をより
正確に想起する。

【００７５】なお、アソシアトロンは、第（４）式およ
び第（５）式に示すように、−１，０，１の３値理論と
なっているが、この装置では、０，１だけの２値化論理
で記銘・想起が行なわれている。また、θの値は、１に
なる要素数が５０かそれ以下で５０にできるだけ小さく
なるように想起ごとに決定されている。

【００７６】すなわち、アソシアトロンは記銘したベク
トルの一部からそのベクトル全体を想起する。したがっ
て、記銘した記事の一部の単語から、その記事に表われ
た他の単語を想起することになる。つまり、シソーラス
的な同義関係に区切らず、１つの文に同時に表われる単
語には相互に何らかの関係があると見なしていることに
よる。

【００７７】多くの記事を記銘させることによって得ら
れる連想記憶行列は、このような単語の相互関係のネッ
トワークを表わしている。これはボトムアップ的に構成
された１種の知識と見なされる。

【００７８】入力される検索文５３のキーワードベクト
ルとデータベース３１に蓄えられた記事４１のキーワー
ドベクトルとの相関が直接計算されず、間に連想記憶が
介されている理由がここにある。すなわち、入力された
検索文５３に表われる単語から一旦連想が行なわれるこ
とによって使用されるキーワードの幅が広げられ、その
広げられたキーワードが用いられて検索が行なわれる。
これによって、入力された検索文に表われるキーワード
と直接関連しない、しかし間接的に関連するような連想
度合が所定の範囲内の「異質な情報」の獲得が期待され
る。

【００７９】記銘させる情報分野を限定すれば、その分
野に応じた特殊なネットワークが出来上がる。たとえ
ば、生物分野に限定した情報のみが記銘されれば、生物
分野に応じた関係知識（たとえばｃａｌｌという単語は
主に細胞関係の単語群と関連する）が、構成される。こ
れに対し、電気分野に限定された情報のみが記銘されれ
ば、電気分野に応じた関係知識（たとえばｃａｌｌとい
う単語は主に電池関係の単語群と関連する）が構成され
る。

【００８０】この機能が用いられれば、たとえばコンピ
ュータ科学者が集まってコンピュータと生物の関連に関
するブレインストーミングが行なわれた場合、予め生物
関連の情報が記銘されて、仮想的な生物学の専門家が構
成される。この構成された仮想的な生物学の専門家を会
議に参加させることによって、コンピュータ科学者の提
供するコンピュータ関連の情報から生物関係方面の話題
や発想の広がりが期待される。

【００８１】次に、キーワードフィルタ４９について説
明する。連想記憶を用いることにより、抽出情報の発散
が期待される。しかし、現実にはこの連想記憶が単純に
用いられただけでは発想の飛躍は起こり難いと予想され
る。比較的少しずつ抽出情報が発散させられることは可
能だが、人間同士の対話に見られるような話題の飛躍は
実現困難であろうと思われる。そこで、話題の飛躍のた
めに２種のキーワードフィルタが用いられる。

【００８２】まず差分フィルタについて説明する。差分
フィルタは、検索キーワードベクトルと想起キーワード
ベクトルとの差分を求める。

【００８３】最初の検索文のキーワードベクトルをＱ₀
とするとき、提供済キーワードベクトルＰ_iは、第（１
４）式および第（１５）式で定義されるとする。ここ
で、第（１５）式の＋はベクトルの要素ごとの論理和を
示す。このとき、ｉ＋１番目の検索キーワードベクトル
Ｑ_i+1は第（１６）式で与えられる。第（１６）式にお
いて、Ｋ_iはＱ_iによる検索で得られた記事のキーワー
ドベクトルである。また、Ｔは最初に設定されたテーマ
と興味だけから生成したキーワードベクトルである。演
算子＊は論理積であり、演算子！は否定である。このＱ
_i+1が用いられてｉ＋１番目の記事が抽出される。

【００８４】この差分フィルタでは、過去に検索キーワ
ードベクトルに使用した単語は、テーマと興味として設
定された単語以外は二度と使用されない。

【００８５】このフィルタリングによって、ある記事か
らその記事に表われた新しい単語をトリガとして新たな
話題へと抽出される記事が早く変化するのではないかと
思われる。

【００８６】

【数３】

【００８７】次に、弱連想フィルタについて説明する。
図５は、弱連想フィルタを説明するための図である。特
に、図５（ａ）は、通常のアソシアトロンにおける想起
を説明するための図であり、図５（ｂ）は、弱連想フィ
ルタによるアソシアトロンの想起を説明するための図で
ある。さらに、図５（ａ）および図５（ｂ）における横
軸は要素番号を示し、縦軸は要素の値を示す。まず、図
２に示した実施例で詳しく説明したように、想起される
ベクトルＲは、第（３）式で得られる。そして、第
（３）式のφ^*は、第（５）式で定義されている。した
がって、通常のアソシアトロンにおける想起では、しき
い値θよりも大きな値をとった要素の値を１としてい
た。すなわち、たとえば第（１１）式における左辺の要
素を０１１２２３３のように小さい順から並べて、図５
（ａ）に示すようなグラフを作成し、必要な個数ａを設
定することで、しきい値θが決定されている。

【００８８】しかし、弱連想フィルタは、図５（ｂ）に
示すようなグラフを作成してθ_Uとθ_Lを決定する。す
なわち、ａ個の幅が要素番号に対してとられ、その両端
ａ₁，ａ₂のグラフの縦軸の値がθ_L，θ_Uとなる。そ
して、２つのしきい値θ_L，θ_Uが定められて、θ_L以
上θ_U以下の値をとった要素が１とされ、それ以外が０
とされてベクトルが構成される。幅ａに対する両端のａ
₁，ａ₂が左右に移動されることで、しきい値θ_L，θ
_Uの値が可変となり、抽出される記事の異質性が制御さ
れる。

【００８９】このように、弱連想フィルタは、強く想起
されたキーワードが捨てられ、弱く想起されたキーワー
ドは取込まれるフィルタである。

【００９０】次に、データベース管理部５１について説
明する。データベース管理部５１は、まず想起されたベ
クトルＲと、データベース３１に登録されている各記事
のキーワードベクトルとの相互相関を計算する。その相
互相関は、第（１３）式で得られる。

【００９１】この結果、相互相関の値の最も高かった記
事ベクトルに対応する記事が提供候補とされる。このよ
うな検索によって、キーワードは通常のデータベース検
索で用いられるａｎｄでもｏｒでもない中間的な条件で
組合される。

【００９２】なお、このデータベース管理部５１は、各
参加者について過去に提供した記事の履歴情報５７を持
っており、すべての参加者に対してすでに提供したこと
のある記事については初めから候補外としてこの相互相
関を計算しない。

【００９３】次に、実験について説明する。実験に使用
した記事は米国ＣｌａｒｉＮｅｔ社が提供する商用ネッ
トワークニュースの記事である。このニュースの記事が
選ばれた理由は、第１に計算機処理が容易な形式で提供
されること、第２に記事に他の記事からの引用部分が存
在しないこと（ノイズが少なく、１つの記事単独で意味
が完結している）、第３に分野が比較的幅広く、かつ情
報が新しいことである。

【００９４】記事の内容で特に多い分野は、コンピュー
タを中心とする電子産業業界関連記事、事件関係記事お
よびスポーツ関係記事であった。記憶させた記事の総数
は１４６５、１記事あたりの抽出キーワード数は最大５
０、処理されたキーワードの種類（すなわちキーワード
ベクトルの次元）は全部で１２６３７であった。

【００９５】そして、実験は単一ユーザ用ユーザインタ
フェースが使用され、５名の被験者に提供される記事に
対する主観評価が求められた。まず、各被験者は、任意
のテーマ、そのテーマに関して特に興味のある分野、お
よびそのテーマに関する意見を入力した。入力する情報
は英語のキーワードリスト、または文（章）に限った。

【００９６】入力されたこれらの記事から、本装置は、
５種類・７通りの異なる検索アルゴリズムを用いて記事
を取出し、相関の強いものから順に、各アルゴリズムご
とに６つの記事を提供した。以下に使用したアルゴリズ
ムについて説明する。

【００９７】第１は、単純連想想起である。この単純連
想想起では、検索文のキーワードベクトルから普通に連
想想起が行なわれ、得られた想起ベクトルと記事ベクト
ルとの相互相関が求められ、相関の高いものから順に６
記事提供される。

【００９８】第２は、連鎖連想想起である。連鎖連想想
起では、差分フィルタが使用され、検索文と想起された
記事のキーワードベクトルとが用いられて差分キーワー
ドベクトルが生成され、これが用いられて順に連想想起
が行なわれる。そして、提供記事履歴が参照されながら
得られた想起ベクトルと記事ベクトルとの相互相関が求
められ、記事が提供される。

【００９９】第３は、弱連想想起である。弱連想想起で
は、弱連想フィルタが使用され、検索キーワードベクト
ルによって想起された想起キーワードベクトルのうち強
く想起された要素がリセットされて、弱く想起された要
素をセット（要素の値を１とする）したベクトルが用い
られて再想起が行なわれる。この再想起の結果得られた
キーワードベクトルの各記事のキーワードベクトルの相
互相関が求められ、相関の強い記事から順に６つ提供さ
れる。３通りのθ_L，θ_Uが用いられて、以下のような
ベクトルが生成される。

【０１００】第１の弱連想想起は、強く想起された要素
３個がリセットされ、弱く想起された要素３個がセット
される。第２の弱連想想起は、強く想起された要素６個
がリセットされ、弱く想起された要素が６個セットされ
る。第３の弱連想想起は、強く想起された要素１２個が
リセットされ、弱く想起された要素が１２個セットされ
る。

【０１０１】第４はランダム抽出である。ランダム抽出
では、比較評価用に全くランダムに６つの記事が取出さ
れて提供される。ただし、同じ記事が６つの記事のうち
含まれることがないようにされる。

【０１０２】第５は、直接相互相関である。直接相互相
関では、連想想起が用いられず、検索文のキーワードベ
クトルと各記事のキーワードベクトルとの相互相関が直
接求められ、相関の高いものから順に６つの記事が提供
される。したがって、この検索で得られた記事には検索
文に表われた単語は少なくとも１つ含まれることにな
る。

【０１０３】各アルゴリズムにおける評価が終わるたび
に提供記事履歴が初期化される。したがって、１つのア
ルゴリズムにおける実験中には同じ記事が提供されるこ
とはないが、別のアルゴリズムの場合は同じ記事が提供
されることはあり得る。

【０１０４】想起に要する時間は単純連想想起で５秒、
２度の連想想起を必要とする弱連想想起で１２秒程度で
あった。現在プログラムのテストの関係などでファイル
アクセスが多く少々長い処理時間が必要とされる。しか
し、これらの処理が削除されてプログラムが整理されれ
ば処理時間は３秒程度となると思われる。

【０１０５】この速度は、一人での使用ではまだ少しも
たつきを感じさせるかもしれないが、複数人の会議での
使用にあたっては、実際の人間でも発言と発言の間に時
間的な間があくことはよくあるため、問題ない程度であ
ると思われる。

【０１０６】被験者は提供された記事を読み、その記事
の内容がどの程度設定したテーマと関連があるか、およ
びそのような内容の記事が提供されることを予想してい
たか（すなわち記事の意外性の逆に相当する）をそれぞ
れ０から１０までの１１段階で評価する。もちろん、実
験に先立ってどのようなアルゴリズムで記事が提供され
るかは被験者には知らされていない。なお、この実験で
は大量の英文が読まれその意味や関連を把握する必要が
ある関係上、被験者には、英文を主に使用している外国
人２名を含む、特に英語力のある者が選ばれている。そ
れぞれの被験者が設定したテーマ、興味および意見は、
表１に示されている。

【０１０７】

【表１】

【０１０８】図６から図１０は、その評価結果を示した
グラフである。図６から図１０における横軸は意外性を
表わし、縦軸は関連性を表わす。特に、図６は、表１の
被験者１に対する評価結果を示したグラフであり、図７
は、表１の被験者２に対する評価結果を示したグラフで
あり、図８は、表１の被験者３に対する評価結果を示し
たグラフであり、図９は、表１の被験者４に対する評価
結果を示したグラフであり、図１０は、表１の被験者５
に対する評価結果を示したグラフである。さらに、図６
（ａ）〜図１０（ａ）は、ランダム抽出および直接相関
の場合を示したグラフであり、図６（ｂ）〜図１０
（ｂ）は単純連想想起、連鎖連想想起、弱連想想起の３
種類を示したグラフである。図１１は、関連性と意外性
について説明するための図である。

【０１０９】一般に関連性と意外性とは相互に対立する
概念と思われる。したがって、前述した評価基準を用い
てさまざまな記事が評価された場合、それらは図１１に
示す線Ａ付近に分布するであろうと予想される。特にラ
ンダム検索で抽出した記事は関連性０、意外性１０の付
近である領域５９に分布すると思われる。逆に通常のデ
ータベース検索によって得られる記事は関連性１０、意
外性０の付近である領域６１に分布するであろうと思わ
れる。

【０１１０】本装置では、まずこの中間の関連性５、意
外性５付近である領域６３に位置する記事が抽出される
ことが目標とされている。さらに本装置では、最終的に
は関連性１０、意外性１０の付近である領域６５にでき
るだけ近い記事が抽出されることも目標とされている。
領域６５に含まれるような記事はもともと少ないことが
一般に予想される。したがって、常にこの領域６５に含
まれるような記事が抽出される装置の構築は困難であ
る。しかし、この領域６５に含まれる情報は議論のテー
マと関連性がありながら参加者がその関連に気付いてい
なかったものであり、新たな発想を得るために非常に重
要なものとなる可能性が大きい。

【０１１１】次に、図６から図１０を参照して、実験結
果について説明する。図６および図７に示す被験者１お
よび２の結果は、比較的うまくいっている。

【０１１２】被験者１の場合テーマがパーソナルコンピ
ュータ、興味がネットワークシステムで、関連記事がデ
ータベースに比較的多く含まれていた。

【０１１３】図６（ａ）を参照して、ランダム検索の場
合、得られた記事はすべて領域５９に含まれていた。直
接相互相関によって抽出された記事は関連性３から７、
意外性３から８の線Ａ付近に分布している。したがっ
て、目標とされる領域６３に分布された結果が得られた
ので、直接相互相関だけによる記事抽出でも、かなり目
標に沿った情報が抽出可能であることが得られた。

【０１１４】次に、図６（ｂ）を参照して、連想想起を
使用した場合の結果では、直接相互相関による場合と比
べて全体的に関連性が低く、意外性の高い方向の分布が
移動している。特に、白丸で示される単純連想想起によ
った記事は、６記事中５記事が線Ａ付近に分布しつつ領
域５９側にシフトしている。これは、連想想起の使用に
よって意外性が向上したことが示されていると思われ
る。また、直接相互相関の場合よりも線Ａから離れて、
わずかであるが領域６５の方向に分布が広がっていると
も見れる。

【０１１５】また、黒丸で示した連鎖連想想起によって
抽出された記事は、矢印で示されるように移動されてい
る。これは、差分ベクトルによって記事の内容が次第に
元のテーマからはずれていったことを示している。具体
的に記事の内容を示すと、最初の記事はＲｅｔｉｘ社の
英国におけるコンピュータネットワーク戦略、次がネッ
トワーク機器で有名なＣＩＳＣＯ社の業績、次いで米国
半導体業界の業績、そして関連性が０となった４つ目の
記事はアメリカのバスケットボールの試合結果記事であ
った。一方、三角で示される弱連想想起であれば、得ら
れた記事はすべて比較的線Ａ付近に分布し、その意外性
は単純連想想起に比べてわずかに高い結果を得ることが
できた。

【０１１６】被験者２の場合は設定したテーマ、興味、
意見に表れるキーワードのすべてがほとんどの記事に含
まれず、特にテーマのキーワードを含む記事は１つしか
存在しなかった。つまり、状況としては被験者１の場合
と逆になっている。

【０１１７】したがって、図７（ａ）に示すように、ラ
ンダム抽出はもちろん、直接相互相関によっても抽出さ
れる記事のほとんどが領域５９に入ってしまい、有効な
記事が得られていない。

【０１１８】一方、図７（ｂ）に示すように、連想想起
を用いた場合も、白丸の単純連想想起では直接相互相関
同様すべての記事が領域５９に含まれている。これはテ
ーマのキーワードが含まれる記事が少ない（この場合は
１つ）のため、これから想起されるキーワード群に偏り
が生じ、かつ想起の程度が弱く、うまくテーマが検索に
反映しなかったことによると思われる。

【０１１９】これに対し、黒丸の連鎖連想想起および三
角の弱連想想起による記事が線Ａから領域６５に近いあ
たりに分布されており、かなりよい結果が得られてい
る。特に、連鎖連想想起の場合、最初に抽出された無関
係の記事から矢印で示すように一気に関連性の高い方向
に移動し、さらにその後少しづつ領域６５の方向へ移動
している。

【０１２０】これらは連鎖によって導入された新しい検
索キーワードや弱く想起されたキーワードが、うまくテ
ーマや興味に関連する語の領域に入ったことによるもの
と思われる。おそらく、この例での脱却は、偶然うまい
方向に向かったのであり、常によい方向に向かうとは限
らないが、このような何らかの新しいキーワードの導入
によって抽出される情報が変化し、かつよい方向に向か
う可能性があることが示されている。

【０１２１】図８に示される被検者３の結果は、あまり
うまくいかなかった例であるため、説明を省略する。

【０１２２】図９に示される被験者４の結果は、逆に連
想想起や弱連想による新キーワードの導入によってもう
まくいかなかった例である。この被験者４の場合も被験
者２と同様設定したテーマは、興味、意見に含まれるキ
ーワードのすべてがほとんどの記事に含まれていなかっ
た。したがって、被験者２同様直接相互相関および単純
連想想起では領域５９から脱却されていない。

【０１２３】一方連鎖連想想起や弱連想想起によっても
この場合はよいキーワードは導入されず、図９（ｂ）に
示すように、連鎖連想では初めから関連性が低く意外性
の高い領域から次第に領域５９方向へ移動し、弱連想で
も領域５９から脱却できていない。

【０１２４】つまり、新たに導入するキーワードの選び
方が重要であることがわかった。図１０に示す被験者５
の例の場合も新たなキーワードの導入がうまくいかなか
った。この被験者５の場合は、被験者４の場合と逆に、
設定したテーマや興味に含まれたキーワードの多く含む
記事が大量にデータベースに含まれたいた。このため、
直接相関による抽出記事はほとんど領域６１に含まれ
た。また、いずれの連想想起方法を採用しても、ほとん
ど結局そのテーマと強い関連のあるキーワードだけが想
起されてしまい、領域６１をうまく脱却できなかった。

【０１２５】ただし、弱連想想起の場合に抽出された領
域５９付近の記事群は、すべてホッケーに関するもので
あった。これらはテーマのバスケットボールとは直接関
係ないが、スポーツという点での関連は認められるの
で、領域６１からの脱却は一応達成されているとも見ら
れる。ただしこの被験者５はその関連性を１と評価した
ためこれらの記事が領域５９に入り、評価結果としては
あまり良いものとなっていない。しかし、人によっては
最も高い関連と評価する可能性も十分あり、このあたり
の値の意味は被験者個人に強く依存する難しい問題であ
る。しかし、少なくとも一人の被験者においてはこの評
価のばらつきはほとんどないと考えられるので、被験者
１，２の結果から、関連性がありかつ意外性もある情報
の抽出の可能性はある。

【０１２６】図１２から図１７は、図６から図１０に示
した各被験者の評価結果を重ねたものを示す図である。
特に、図１２は、単純連想想起に対応した図であり、図
１３は、連鎖連想想起に対応した図であり、図１４は、
第１の弱連想想起に対応した図であり、図１５は、第２
の弱連想想起に対応した図であり、図１６は、第３の弱
連想想起に対応した図であり、図１７は、ランダム抽出
および直接相関に対応した図である。

【０１２７】図１２から図１７を参照して、結果的に連
鎖連想＞単純連想≧単純相関＞＞ランダムという結果が
得られたと思われる。特に、連鎖連想は他のいずれと比
べても分布が領域６５方向にかなり膨らんだよい傾向を
示している。弱連想想起は、図１５に見られるように領
域５０付近に偏る傾向が出たが図１４および図１６に示
すように領域６５の方向に膨らんでいるよい傾向も示さ
れており、よい傾向が得られる可能性はあると思われ
る。

【０１２８】以下に、実験結果から連想記憶を用いた情
報検索によって関連性がありかつ意外性もある情報の抽
出の可能性について簡単にまとめる。

【０１２９】第１は、設定されたテーマに関連する記事
がある程度以上の数記銘されている場合、連想記憶の使
用により、直接相互相関による抽出よりも意外性の高い
記事の抽出が可能となること。しかも、同時に関連性も
高いものが抽出できる可能性がある。特に、連鎖連想的
な使用が有効と思われる。

【０１３０】第２は、テーマや興味、発言に含まれるキ
ーワードそのものが多くの記事に含まれている場合、現
在試みているいずれのアルゴリズムを使用しても意外性
の高い記事の抽出は難しいこと。このような場合には意
外性を導く異質なキーワードを検索キーワードベクトル
に導入する必要がある。

【０１３１】なお、本装置で入力される記事および検索
文は、必ずしも英文である必要はなく、完全な文章であ
る必要はない。

【０１３２】また、構文解析部が構文解析した上で抽出
する単語は、名詞および品詞同定不能語などの品詞によ
る抽出に限る必要ななく、たとえば特定分野の知識に依
存した辞書が準備されて、品詞とは無関係にその辞書に
含まれる語だけが抽出されるような手法も考えられる。
このような手法が取られれば、検索の結果得られる情報
が特定分野指向になると思われる。

【０１３３】さらに、実施例ではバーチャルリアリティ
技術に適用できるような臨場感通信会議システムに対し
ての情報検索装置について説明したが、関連性はある
が、同時に検索意図と異なる異質な情報が抽出されるべ
き検索が必要な場合には、本装置は有効である。

【０１３４】さらに、検索意図として個人の利用者の検
索意図について説明したが、実際に会議などの複数の人
間が本装置を使用する場合も想定され、そのような場合
には必要であればその会議参加者の全員または一部の複
数の人間の検索意図が用いられてもよい。

【０１３５】

【発明の効果】以上のようにこの発明によれば、検索意
図と異なり、かつ、検索文を表わす検索文情報から連想
されるその度合がたとえば間接的に関連するような所定
の範囲内の想起情報を求め、その想起情報に応じた登録
文を表わす登録文情報を検索結果としてデータベースか
ら出力するので、たとえば発想のきっかけとなるような
情報が提供される。

【０１３６】さらに、検索文および登録分が単語で分解
されて構文解析される場合に、所定の条件に従う単語を
抽出して構文解析することで、無意味な想起情報を求め
ることなく、極力最適な検索結果をデータベースから出
力できる。

【０１３７】さらに、設定手段によって連想記憶手段が
連想するその度合が設定されるので、検索結果の異質性
を制御でき、たと発想のきっかけとなるような情報が極
力最適にされる。

【図面の簡単な説明】

【図１】門外漢について説明するための図である。

【図２】この発明の一実施例による情報検索装置の概略
ブロック図である。

【図３】図２の構文解析部について説明するための図で
ある。

【図４】この発明の他の実施例による情報検索装置の概
略ブロック図である。

【図５】図４のキーワードフィルタについて説明するた
めの図である。

【図６】第１の被験者に対する実験結果を示したグラフ
である。

【図７】第２の被験者に対する実験結果を示したグラフ
である。

【図８】第３の被験者に対する実験結果を示したグラフ
である。

【図９】第４の被験者に対する実験結果を示したグラフ
である。

【図１０】第５の被験者に対する実験結果を示したグラ
フである。

【図１１】発想に対する関連性および意外性の関係を説
明するための図である。

【図１２】図６から図１０の単純連想想起のみを抽出し
たグラフである。

【図１３】図６から図１０の連鎖連想想起のみを抽出し
たグラフである。

【図１４】図６から図１０の第１の弱連想想起のみを抽
出したグラフである。

【図１５】図６から図１０の第２の弱連想想起のみを抽
出したグラフである。

【図１６】図６から図１０の第３の弱連想想起のみを抽
出したグラフである。

【図１７】図６から図１０のランダムおよび直接相関を
抽出したグラフである。

【図１８】臨場感通信会議の様子を示す図である。

【符号の説明】

２３３９情報検索装置２７４３構文解析部２９４５想起情報抽出部３１データベース３３４１記事３５５３検索文３７５５記事の提供４７連想記憶部４９キーワードフィルタ５１データベース管理部

フロントページの続き (56)参考文献特開昭63−261424（ＪＰ，Ａ) 特開平３−34028（ＪＰ，Ａ) 特開平６−96118（ＪＰ，Ａ) 西本、望月、宮里、岸野“発散的発想支援−意外性のある情報の提供手法に関する検討−”人工知能学会ヒューマンインターフェースと認知モデル研究会資料Ｖｏｌ．19ｔｈ，Ｎｏ．ＳＩＧ−ＨＩＣＧ9301−１（1993−05−21）ｐｐ．１〜８. 西本、望月、岸野“発想支援システムに関する−考察”情報処理学会第46回全国大会講演論文集Ｖｏｌ．６，Ｎｏ．７Ｒ−２（1993−03−23〜26）ｐｐ．６− 283〜284. 西本、望月、宮里、岸野“発散的発想支援−意外性のある情報の提供手法に関する検討−”人工知能学会ヒューマンインターフェースと認知モデル研究会資料Ｖｏｌ．19ｔｈ，Ｎｏ．ＳＩＧ−ＨＩＣＧ9301−１（1993−05−21）ｐｐ．１〜８. (58)調査した分野(Int.Cl.⁶，ＤＢ名) G06F 17/30 G06F 15/18 520 G06F 15/18 560 ＪＩＣＳＴファイル（ＪＯＩＳ)

Claims

(57)【特許請求の範囲】

【請求項１】登録文と、前記登録文に対応付けられ前
記登録文の検索に必要な登録キーワードとを記憶するデ
ータベースと、前記登録キーワードを相互に連想的に記銘するととも
に、入力キーワードに応じて連想的に想起キーワードを
想起する連想記憶手段と、前記連想記憶手段における登録キーワード相互間の連想
度合のうち所定の度合よりも強い連想度合をリセットす
ることにより、前記連想記憶手段に前記入力キーワード
との連想度合が前記所定の度合よりも弱い想起キーワー
ドを想起させる弱連想手段と、前記データベースの中から、前記想起キーワードと相関
性の高い登録キーワードに対応する登録文を抽出する抽
出手段とを備える、情報検索装置。
【請求項２】登録文と、前記登録文に対応付けられ前
記登録文の検索に必要な登録キーワードとを記憶するデ
ータベースと、前記登録キーワードを相互に連想的に記銘するととも
に、入力キーワードに応じて連想的に想起キーワードを
想起する連想記憶手段と、前記連想記憶手段による想起に既に使用された既使用キ
ーワードを記憶するとともに、前記想起キーワードに応
じて前記既使用キーワード以外の未使用キーワードを決
定し、その決定された未使用キーワードならびに最初に
設定されたテーマおよび興味を表わす初期キーワードを
前記入力キーワードとして前記連想記憶手段に供給する
連鎖連想手段と、前記データベースの中から、前記未使用キーワードおよ
び前記初期キーワードと相関性の高い登録キーワードに
対応する登録文を抽出する抽出手段とを備える、情報検
索装置。
【請求項３】前記入力キーワードを入力キーワードベ
クトルＱ_ｉ（ここで、ｉは０以上の整数である。）で表
わし、前記想起キーワードを想起キーワードベクトルＫ
_ｉ（ここで、ｉは０以上の整数である。）で表わし、前
記既使用キーワードを既使用キーワードベクトルＰ
_ｉ（ここで、ｉは０以上の整数である。）で表わし、前
記初期キーワードを初期キーワードベクトルＴで表わ
し、最初の既使用キーワードベクトルＰ_０をＰ_０＝Ｑ_０
とすると、前記連鎖連想手段は、式［Ｐ_ｉ＝Ｑ_ｉ＋Ｐ_ｉ−１（ここ
で、ｉは１以上の整数であり、＋は論理和演算子であ
る。）］により前記既使用キーワードベクトルＰ_ｉを算
出するとともに、式［Ｑｉ_＋１＝Ｋ_ｉ＊｛！（Ｐ_ｉ）＋
Ｔ｝（ここで、＊は論理積演算子であり、！は否定演算
子であり、＋は論理和演算子である。）］により前記入
力キーワードベクトルＱ_ｉ＋１を算出する、請求項２に
記載の情報検索装置。