JPH07110818A

JPH07110818A - データベースシステム

Info

Publication number: JPH07110818A
Application number: JP5254536A
Authority: JP
Inventors: Jun Toyoura; 潤豊浦
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 1993-10-12
Filing date: 1993-10-12
Publication date: 1995-04-25

Abstract

(57)【要約】【目的】検索者の希望する情報を、格納，検索するデ
ータベースシステムに関し、制約された検索キーワード
でなくても、情報を検索できることを目的とする。【構成】情報から得られる情報キーワードを入力する
と、これと高い関連度を割り当てられた分類部を求め、
これに情報キーワードの抽出元の情報を分類するととも
に、検索キーワードを入力すると、これと高い関連度を
割り当てられた分類部を求め、これに分類されている情
報を検索結果として出力するようにしたものである。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】この発明は、検索者によって入力
された語彙等の検索キーワードを基に、検索者の希望す
る情報をデータベースから検索するデータベースシステ
ムに関するものである。

【０００２】

【従来の技術】従来の検索キーワードを基にして情報を
検索するデータベースシステムは、例えば、文献検索の
場合を例に上げると、基本的に、１．書誌データベースシステム２．フルテキストデータベースシステムの２種類のものに大別される。

【０００３】まず、書誌データベースシステムについて
説明する。書誌データベースシステムは、各文献を格納
する際に、文献に書誌情報およびシソーラスに基づく統
制牽引語を付与して、データベースに蓄積するものであ
る。即ち、書誌データベースシステムは、牽引語を統制
牽引語に制限することで、被検索側の語彙と検索側の語
彙とを近付けて、検索側の意図に応じた文献を検索する
ものである。

【０００４】そして、書誌データベースシステムの検索
時の基本検索条件としては、書誌情報と統制牽引語に関
するものがある。まず、書誌情報に関する基本検索条件
とは、文献が、「著者名」，「出版年」等の決められた
項目を満たしているか否かである。統制牽引語に関する
基本検索条件とは、シソーラスの見出し語から検索語と
して選んだ語が、牽引語として付与されているか否かで
ある。書誌データベースシステムは、これらの基本検索
条件をブーラーン（Ｂｏｏｌｅａｎ）式で組み合わせる
ことによって、複雑な検索を実行するようになってい
る。

【０００５】ところで、書誌データベースシステムにお
ける「統制牽引語の付与」は、文献の内容の意味的解釈
という高度な知的処理が必要とされる。このため、「統
制牽引語の付与」は、機械処理によっては行なわれず、
通常、経験的ノウハウを持つ専門家によって行なわれて
いる。

【０００６】なお、時間の経過に伴って言語が意味変化
するために、書誌データベースシステムでは、言語の意
味変化に応じて、「シソーラスの改定」や「各文献に対
する牽引語の付け変え」を行なう必要がある。

【０００７】また、書誌データベースシステムには、曖
昧文字のデータファイルを備え、文字列照合処理の際に
曖昧文字列照合を行なうようになっているものがある。
さらに、書誌データベースシステムには、同意語辞書を
構成するデータファイルを備えて、文字列照合処理の際
に同意語の照合を行なうようになっているものもある。

【０００８】次に動作について説明する。文献側の語お
よび検索語には、例えば、・「桃」，「もも」，「モモ」等の字種の違い・「コンピューター」，「コンピュータ」等の外来語の
表音記述・「コンピューター」，「計算機」等の言語の違い等による表記の揺れがある。このため、書誌データベー
スシステムは、曖昧文字のデータファイルと同意語辞書
とを備えているのであれば、検索者によって検索語が入
力されると、文字列照合処理の際に、曖昧文字のデータ
と同意語辞書とを参照して、被検索側の語彙と検索側の
語彙との一致を図る。

【０００９】その後、書誌データベースシステムは、検
索語に応じた文献の検索を行なう。例えば、検索者が、
書誌データベースシステムに「視覚認識」に関する文献
を検索する場合は、次のような処理が行なわれる。ま
ず、検索者によって、「視覚」，「認識」，「視覚認
識」等の上記の熟語に対する検索語の候補が上げられ
る。このような検索語の候補を入力されると、書誌デー
タベースシステムは、上記の各語を牽引語として付与さ
れている文献を検索し、その文献を提示するのである。

【００１０】なお、書誌データベースシステムは、検索
洩れを無くすことに重点を置く場合、上記の検索語の全
てのＯＲを検索条件とする。また、書誌データベースシ
ステムは、検索条件を厳しくして検索の質を上げる場
合、上記の各検索語の全てのＡＮＤを採る。

【００１１】また、特開平３−１２２７６８号公報の
「牽引付け支援装置」や、特開平３−１２２７６９号公
報の「キーワード連想検索装置」に示される書誌データ
ベースシステムは、牽引語間の相関度の強さを記録した
相関表を備えたものである。このような書誌データベー
スシステムは、上記の相関表により、文献に付与する牽
引語の洩れを防ごうとするものである。

【００１２】即ち、これらの書誌データベースシステム
では、ある文献Ａに対して検索を行なう場合、以下のよ
うな処理が、先の書誌データベースシステムに追加され
る。まず、これらの書誌データベースシステムは、検索
者から検索語としてのＫＷ１，ＫＷ２を入力すると、上
記相関表を基にして、ＫＷ１，ＫＷ２と相関度の強い牽
引語ＫＷ３を求める。その後、これらの書誌データベー
スシステムは、このＫＷ３を利用者に示すことにより、
文献に付与される牽引語の洩れを防ぐのである。

【００１３】また、特開平２−２２４０６８号公報に示
される書誌データベースシステムは、検索者の入力する
検索語と、文献に付与されている統制牽引語との相関度
の強さを記憶した相関表を備えたものである。このた
め、この書誌データベースシステムでは、検索語が入力
されると、この検索語に応じた牽引語によって文献が検
索される。これにより、この書誌データベースシステム
では、各人の牽引語における語彙と統制牽引語との語彙
とのギャップが解消された上で、文献が検索される。な
お、このシステムでは、検索語に新しい語を追加する度
に、上記相関表を修正する必要がある。

【００１４】なお、これまでに述べてきた各書誌データ
ベースシステムは、フルテキストデータベースシステム
に比べて一件の文献に関する情報量が少ない。このた
め、大容量テキストベースには、書誌データベースシス
テムによるものが採用されることが多かった。しかし、
近年では、記憶装置や演算装置の発達により、フルテキ
ストデータベースシステムによる文献データベースの占
める割合が増加する傾向にある。

【００１５】次にフルテキストデータベースシステムに
ついて説明する。フルテキストデータベースシステムで
は、各文献は、その全文をデータベースに蓄積されるよ
うになっている。検索の基本条件としては、検索者の指
定する語（検索キーワード）が、本文中に出現するか否
かである（本文中の指定する語：情報キーワード）。ま
た、検索時に指定する語は、統制語である必要はなく、
自由に指定できるので、フリータームと呼ばれる。そし
て、複雑な検索は、書誌データベースシステムの場合と
同様に、複数のフリータームの検索条件をブーラーン式
で組み合わせることによって実行されるようになってい
る。

【００１６】そして、特開平１−２３３６２０号公報の
「文章検索方式」に示されるフルテキストデータベース
システムは、同意語辞書を備えたものである。このデー
タベースシステムは、文献中において、検索語に一致す
る語が出現するか否かを調べるだけでなく、同意語辞書
を利用して、検索語と同じ意味を持つ語についても、文
献中に出現するかを調べるものである。つまり、このデ
ータベースシステムは、検索語の同意語も検索対象とす
ることによって、検索語（検索キーワード）と文献中の
牽引語（情報キーワード）との一致率を高めるものであ
る。

【００１７】さらに、特開平２−１０５９号公報の「連
想検索システム」や、特開平３−２５２７６７号公報の
「キーワード連想生成装置」に示されるフルテキストデ
ータベースシステムも、検索語と牽引語との一致率を高
めるものである。即ち、このデータベースシステムは、
検索語と同一文書中に出現する頻度の高い語、つまり、
検索語と共起関係の強い語についても、文献中に出現す
るかを検索し、検索した文献を提示するものである。

【００１８】次に、フルテキストデータベースシステム
の検索システムの再現率，適合率について説明する。一
般に、文献データベースシステムの再現率，適合率は、
下記式（１），式（２）再現率＝Ａ／Ｘ・・・（１）適合率＝Ａ／Ｙ・・・（２）Ａ：検索された情報中で適切な情報の数Ｘ：検索されるべき情報の数Ｙ：検索された情報の数で定義される。また、Ａ，Ｘ，Ｙに関しては、その定義
より、式（３）が成立する。０≦再現率≦Ｘ，Ｙ・・・（３）

【００１９】このため、式（４），式（５）が成立する
ことになる。０≦再現率≦１・・・（４）０≦適合率≦１・・・（５）一般に、検索システムでは、これら２つの評価係数が、
１に近いほど検索能力が高いと評価される。

【００２０】この観点からは、上述した「合成漢字熟語
から切り出される検索語全てのＯＲを検索条件とする方
式」や、「同意語辞書を利用して検索語と牽引語との一
致率を高める方式」は、上記の式（１），式（２）中の
Ａ，Ｙを増加させる方式と言える。以下、これらの方式
を方式Ｂと呼ぶ。ここで、Ｘは検索方式に依存せず、不
変である。以下、方式Ｂについて説明する。

【００２１】いま、方式Ｂの適用による検索洩れが無い
ことから、１．方式Ｂの適用以前に検索された情報は、方式Ｂを適
用して検索される情報に含まれる。２．方式Ｂの適用以前に検索された情報中の適切な情報
は、方式Ｂを適用して検索される情報中の適切な情報に
含まれる。このように仮定すれば、方式Ｂの適用によるＡ，Ｙの増
分であるδＡ，δＹについて、下式（６）が成立する。０≦δＡ≦δＹ・・・（６）よって、方式Ｂの適用による再現率の変化は、下式
（７）が成立する。このため、方式Ｂの適用により再現
率は高くなる。｛（Ａ＋δＡ）／Ｘ｝−（Ａ／Ｘ）＝（δＡ／Ｘ） ≧０・・・（７）

【００２２】一方、方式Ｂの適用による適合率の変化
は、下式（８）となる。｛（Ａ＋δＡ）／（Ｙ＋δＹ）｝−（Ａ／Ｙ）＝｛（δＹ）／（Ｙ＋δＹ）｝×｛（δＡ／δＹ）−（Ａ／Ｙ）｝・・・（８）前記の右辺中の（δＡ／δＹ）は、方式Ｂの適用によ
り、新たに検索された情報に関する適合率である。そし
て、この率が、方式Ｂの適用前の適合率：Ａ／Ｙより高
い場合には、適合率は向上するのである。

【００２３】また、検索システムの検索方式として、
「合成漢字熟語から切り出される検索語全てのＡＮＤを
検索条件とする方式」（以下、方式Ｃという）もある。
この方式は、検索条件を厳しくする方式と言える。検索
条件を厳しくする方式を検索システムに適用する場合で
は、上記の式（３）の代わりに、下式（９）が成立する
と考えられる。０≧δＡ≧δＸ，δＹ・・・（９）このため、上記の式（６）の不等号の向きは逆になり、
方式Ｃの適用により、再現率は低下する。

【００２４】さらに、適合率に関しても、上記の式
（８）から、方式Ｂの場合に検討したのと全く同様の理
由で、方式Ｃの適用により適合率の低下する場合が多
い。

【００２５】このような検索システムにより、フルテキ
ストデータベースシステムは、入力された検索語（検索
キーワード）に応じた文献を、データベースの中から抽
出するのである。

【００２６】

【発明が解決しようとする課題】従来のデータベースシ
ステムは以上のように構成されているので、以下の問題
点があった。まず、書誌データベースシステムでは、上
述した専門家による「統制牽引語の付与」に際して、次
の２つの問題が発生する。１つは、文献の執筆された時
期と、牽引語の付与される時期とが、時間的に隔たって
いることから生じる「情報提供とのタイムラグ」であ
る。もう１つは、同一文献に対する牽引語が、牽引語を
付与する人間の主観の相違により、微妙に違ってくると
いう「牽引語の質の揺れ」である。つまり、書誌データ
ベースシステムは、上記のような「情報提供とのタイム
ラグ」と「牽引語の質の揺れ」との発生を避けれないな
どの問題点があった。

【００２７】また、書誌データベースシステムでは、検
索語は、統制牽引語に限るという制約があるが、シソー
ラスの意味体系で検索者の検索意図を正確に表現するこ
とは、一般には困難である。特に日本語では、漢字熟語
の間に助詞，助動詞を挟まず、直接連係して新しい漢字
熟語を生成することが多く、こうした漢字熟語は、シソ
ーラス中には存在しないので、「検索式の構成」が困難
である。

【００２８】例えば、検索者が、「視覚認識系列決定問
題」に関する文献を検索する場合、この熟語に対して、
「視覚」，「認識」，「視覚認識」，「系列」，「視覚
系列」，「認識系列」，「決定」，「問題」，「決定問
題」等々、様々な検索語の候補が考えられる。しかし、
「視覚認識系列決定問題」に関する文献に対して、どの
ような牽引語が付与されているのかを推測することは困
難である。このため、これらの検索語からの検索式は、
非常に困難になってしまうなどの問題点があった。

【００２９】もし、これらの検索語の全てのＯＲを検索
条件とし、検索洩れを無くすことに重点を置いたなら
ば、誤りでないが不適切に検索される文献の数が増加す
るといった問題点があった。逆に、これらの検索語の全
てのＡＮＤをとる等して検索条件を厳しくすれば、検索
されるべきだが検索されない文献の数が増加するという
問題点があった。

【００３０】更に、書誌データベースでは、上述した
「シソーラスの改定」や「各文献に対する牽引語の付け
変え」といった作業に、莫大な人的労力が必要であると
いう問題点があった。

【００３１】また、書誌データベースシステムでは、文
字列照合処理の際、曖昧文字列照合や同意語辞書が必要
となり、装置の構成を複雑化してしまうなどの問題点が
あった。

【００３２】さらに、文献に牽引語を付与する過程も、
牽引意図を表現する検索語を選び出す過程も、結局は、
各人の語彙と統制牽引語の語彙との対応付けであり、各
人の価値観の相違により一様性が得られない。このた
め、牽引語に質の揺れが発生してしまうなどの問題点が
あった。

【００３３】このような問題に対し、上述の特開平３−
１２２７６８号公報の「牽引付け支援装置」や、特開平
３−１２２７６９号公報の「キーワード連想検索装置」
により、文献に付与する牽引語の洩れを防ぐことができ
る。しかし、このような書誌データベースシステムで
は、相関表の対象が、統制牽引語に限定されているた
め、各人の語彙と統制牽引語との語彙とのギャップを解
消できないなどの問題点があった。

【００３４】また、特開平２−２２４０６８号公報の書
誌データベースシステムは、上記のシステムで問題とな
る各人の語彙と統制牽引語との語彙とのギャップを解消
できるが、一番最初に、自己の相関表を作成するために
莫大な人的労力が掛かってしまう。さらに、この書誌デ
ータベースシステムは、検索語に新しい語を追加する度
に、相関表を修正する必要がある。これらの問題点によ
り、特開平２−２２４０６８号公報の書誌データベース
システムは、相関表の管理に非常な手間が掛かってしま
い、実用化が困難である。

【００３５】また、フルテキストデータベースにおいて
は、以下の問題点がある。即ち、特開平１−２３３６２
０号公報の「文章検索方式」，特開平２−１０５９号公
報「連想検索システム」，特開平３−２５２７６７号公
報の「キーワード連想生成装置」のフルテキストデータ
ベースシステムでは、検索語の語彙と牽引語との語彙の
一致率を高める方向にしか作用しないので、検索の洩れ
が減少する反面、誤った一致が増加するなどの問題点が
あった。

【００３６】さらに、フルテキストデータベースシステ
ムでは、従来例で述べた方式Ｂの適用により、新たに検
索された情報は、多くの不適切な情報を含むため、大抵
の場合、適合率が低下してしまうなどの問題点があっ
た。

【００３７】また、上記の方式Ｂの代わりに、フルテキ
ストデータベースシステムの検索システムに検索条件を
厳しくする方式を適用する場合では、適合率，再現率の
両方が低下してしまうなどの問題点があった。即ち、検
索システムは、この方式の使用により、従来例で説明し
た式（３）の代わりに、上記式（９）が成立すると考え
られる。このため、従来例で説明した式（６）の不等号
の向きは逆になり、この方式の適用により、再現率は低
下してしまう。さらに、この方式では、適合率に関して
も低下する場合が多く、これは、従来例で説明した式
（８）から理解できるように、方式Ｂの場合と同様の理
由のためである。

【００３８】請求項１の発明は、上記のような問題点を
解消するためになされたもので、利用者によって検索キ
ーワードが異なっり、検索側の語彙と被検索側の語彙
に、質の揺れやタイムラグがあっても、それらを補償し
て再現率，適合率を低下することなく、適切な情報を検
索できるデータベースシステムを得ることを目的とす
る。

【００３９】また、請求項２の発明は、これまでに例の
無いような文献・検索条件に対しても、格納・文献検索
できるとともに、文献・検索条件を学習できるデータベ
ースシステムを得ることを目的とする。

【００４０】また、請求項３の発明は、格納された文献
と、この文献の文献キーワードとの関係を強化でき、文
献と文献キーワードの関連度を学習していき、文献のク
ラスタ分類して格納する際に、的確に文献をクラスタ分
類できるデータベースシステムを得ることを目的とす
る。

【００４１】また、請求項４の発明は、上記請求項１の
目的とともに、検索者による検索キーワード洩れを補償
できるデータベースシステムを得ることを目的とする。

【００４２】また、請求項５の発明は、これまでに例の
無いような検索キーワードに対しても、キーワード洩れ
を補償できるとともに、検索条件を学習できるデータベ
ースシステムを得ることを目的とする。

【００４３】また、請求項６の発明は、検索キーワード
をクラスタ分類する際に、分類先のクラスタと分類され
た検索キーワードとの関係を強化でき、クラスタと検索
キーワードの関連度を学習していき、的確に検索キーワ
ードをクラスタ分類できるデータベースシステムを得る
ことを目的とする。

【００４４】また、請求項７の発明は、検索側の検索キ
ーワードの概念と、被検索側の文献キーワードの概念と
を、一致する方向に補正できるデータベースシステムを
得ることを目的とする。

【００４５】また、請求項８の発明は、検索キーワード
を分類するクラスタの概念と、文献を分類するクラスタ
の概念とを一致させることで、検索側の語彙の概念と、
被検索側の語彙の概念とを、一致する方向に補正できる
データベースシステムを得ることを目的とする。

【００４６】

【課題を解決するための手段】請求項１の発明に係るデ
ータベースシステムは、情報から得られる情報キーワー
ドを入力すると、これと高い関連度を割り当てられた分
類部を求め、これに情報キーワードの抽出元の情報を分
類するとともに、検索キーワードを入力すると、これと
高い関連度を割り当てられた分類部を求め、これに分類
されている情報を検索結果として出力するようにしたも
のである。

【００４７】また、請求項２の発明に係るデータベース
システムは、入力した情報キーワードに対して高い関連
度の分類部を見出せなければ、所定の分類部とこの情報
キーワードとに高い関連度を割り当て、この分類部に情
報キーワードの抽出元の情報を分類するようにしたもの
である。

【００４８】また、請求項３の発明に係るデータベース
システムは、入力した情報キーワード群に対して高い関
連度の分類部を見出すと、この分類部と情報キーワード
群の各キーワードとの間の関連度を強化するようにした
ものである。

【００４９】また、請求項４の発明に係るデータベース
システムは、入力した検索キーワードに対する各分類部
の関連度を求め、これらを各分類部の追加度とするとと
もに、キーワードを、キーワードの分類部に対する関連
度と、その分類部に割り当てられた追加度とに応じた比
率で、検索キーワードに追加するようにしたものであ
る。

【００５０】また、請求項５の発明に係るデータベース
システムは、入力した検索キーワードに対する各分類部
の関連度を求めた結果、高い関連度のものを見出せなけ
れば、所定の分類部を選び、選んだ分類部と検索キーワ
ードとに高い関連度を割り当てるようにしたものであ
る。

【００５１】また、請求項６の発明に係るデータベース
システムは、入力した検索キーワード群に対して高い関
連度の分類部を見出すと、この分類部と入力した検索キ
ーワード群の各キーワードとの間の関連度を強化するよ
うにしたものである。

【００５２】また、請求項７の発明に係るデータベース
システムは、検索キーワードが入力されると、これと関
連度の高い情報キーワードを求めるとともに、検索した
情報に対する検索の評価を受けると、検索した情報から
得られる情報キーワードと、この情報の検索に用いた検
索キーワードとの間の関連度を、先の評価に応じて変化
させるようにしたものである。

【００５３】また、請求項８の発明に係るデータベース
システムは、検索キーワードの分類された検索キーワー
ド分類部と関連度の高い情報分類部を求め、これに分類
されている情報を検索結果とするとともに、検索した情
報に対する検索の評価を受けると、検索した情報の分類
された情報分類部と、この情報検索に用いた検索キーワ
ードの分類された検索キーワード分類部との間の関連度
を、先の評価に応じて変化させるようにしたものであ
る。

【００５４】

【作用】請求項１の発明におけるデータベースシステム
は、情報から得られる情報キーワードを入力すると、こ
れと高い関連度を割り当てられた分類部を求め、これに
情報キーワードの抽出元の情報を分類するとともに、検
索キーワードを入力すると、これと高い関連度を割り当
てられた分類部を求め、これに分類されている情報を検
索結果として出力する検索評価出手段を備えたことによ
り、利用者によって検索キーワードが異なっり、検索側
の語彙と被検索側の語彙に、質の揺れやタイムラグがあ
っても、それらが補償される。

【００５５】また、請求項２の発明におけるデータベー
スシステムは、入力した情報キーワードに対して高い関
連度の分類部を見出せなければ、所定の分類部とこの情
報キーワードの各キーワードとに高い関連度を割り当
て、この分類部に情報キーワードの抽出元の情報を分類
する検索評価出手段を備えたことにより、これまでに例
の無いような情報・検索条件に対しても、格納・情報検
索が行なわれる。

【００５６】また、請求項３の発明における検索評価出
手段は、入力した情報キーワード群に対して高い関連度
の分類部を見出すと、この分類部と情報キーワード群の
各キーワードとの間の関連度を強化することにより、分
類部とそこに分類された情報の各情報キーワードとの関
係が強化される。

【００５７】また、請求項４の発明におけるデータベー
スシステムは、入力した検索キーワードに対する各分類
部の関連度を、各分類部の追加度とする追加度抽出手段
と、キーワードの分類部に対する関連度と、その分類部
に割り当てられた追加度とに応じた比率で、キーワード
を前記検索キーワードに追加する追加手段とを備えたこ
とにより、入力された検索キーワードとともに、これに
関連する他のキーワードも、つまり、検索キーワードで
ありながら検索条件として入力されなかったキーワード
も追加されて、適切な情報がデータベースから検索され
る。

【００５８】また、請求項５の発明における追加度抽出
手段は、入力した検索キーワードに対する各分類部の関
連度を求めた結果、高い関連度のものを見出せなけれ
ば、所定の分類部を選び、選んだ分類部と検索キーワー
ドとに高い関連度を割り当てることにより、これまでに
例の無いような検索キーワードに対しても、キーワード
洩れを補償できる。

【００５９】また、請求項６の発明における追加度抽出
手段は、入力した検索キーワード群に対して高い関連度
の分類部を見出すと、この分類部と入力した検索キーワ
ード群の各キーワードとの間の関連度を強化することに
より、分類部と、そこに分類される検索キーワード群の
各キーワードとの関係が強化される。これにより、的確
に検索キーワードが分類部に分類される。

【００６０】また、請求項７の発明における学習手段
は、検索キーワードが入力されると、これと関連度の高
い情報キーワードを求めるとともに、検索した情報に対
する検索の評価を受けると、検索した情報から得られる
情報キーワードと、この情報の検索に用いた検索キーワ
ードとの間の関連度を、先の評価に応じて変化させるこ
とにより、検索側の検索キーワードの概念と、被検索側
の情報キーワードの概念とが、使用される度に一致する
方向に補正される。

【００６１】また、請求項８の発明における学習手段
は、検索キーワードの分類された検索キーワード分類部
と関連度の高い情報分類部を求め、これに分類されてい
る情報を検索結果とするとともに、検索した情報に対す
る検索の評価を受けると、検索した情報の分類された情
報分類部と、この情報検索に用いられた検索キーワード
の分類された検索キーワード分類部との間の関連度を、
先の評価に応じて変化させることにより、検索キーワー
ドを分類するクラスタの概念と、情報を分類するクラス
タの概念とが、使用される度に一致する方向に補正され
る。

【００６２】

【実施例】

実施例１．以下、この発明の実施例１を図について説明
する。図１は本発明のデータベースシステムの構成を示
すブロック図である。図について、１０は、文献入力
（入力された文献）１からキーワードを抽出するキーワ
ード抽出部、２０は、キーワード抽出部１０からの文献
キーワード（情報キーワード）出力を蓄積する文献キー
ワードテーブルである。また、文献キーワードテーブル
２０は、これまでに入力した文献キーワードの種類を記
憶しておくものである。４０は、文献キーワードテーブ
ル２０の内容を参照し、キーワード抽出部１０の出力を
ベクトル表現に変換する第一のエンコーダである。即
ち、第一のエンコーダ４０は、文献キーワードテーブル
２０にあるこれまでに抽出された各文献キーワードの種
類を、ベクトルの次元として、キーワード抽出部１０か
らの文献キーワード群をベクトル変換するものである。
詳述すると、第一のエンコーダ４０は、キーワード抽出
部１０からの各文献キーワードの成分を示す値を、それ
ぞれに応じた次元に置き換えてベクトル化するものであ
る。なお、第一のエンコーダ４０は、ベクトル化する時
に、変換するベクトルのある次元に相当するキーワード
抽出部１０からの文献キーワードが無ければ、その次元
の値は０とするようになっている。つまり、文献から抽
出される文献キーワードは、単数及び不特定な数であっ
ても構わない。

【００６３】９０は、第一の特徴抽出部７０の出力する
各々の特徴量を基準に、第一のエンコーダ４０の出力す
るベクトルをクラスタ分類し、その結果を保持する文献
クラスタ記憶部（分類部）である。即ち、文献クラスタ
記憶部９０は、複数の文献クラスタ（分類部）を備えて
おり、これらに、データベースで格納する文献のデータ
ベースでのポインタアドレスを格納するものである。

【００６４】７０は、第一のエンコーダ４０の出力する
ベクトルから特徴を抽出し、抽出した特徴の特徴量を出
力する第一の特徴抽出部（検索評価出手段）である。こ
の第一の特徴抽出部７０は、第一のエンコーダ４０から
ベクトル化された文献キーワード群を入力すると、入力
したベクトルの示す文献キーワード群と高い類似度（関
連度）を割り当てられた文献クラスタを求めるものであ
る。さらに、第一の特徴抽出部７０は、高い類似度の文
献クラスタを求めると、これに、文献キーワード群と共
に送られて来たポインタアドレスを分類するものであ
る。なお、このポインタアドレスは、第一の特徴抽出部
７０に入力される文献キーワード群の抽出元の文献のデ
ータベースでのアドレスを示すものである。そして、第
一の特徴抽出部７０は、入力したベクトルの示す文献キ
ーワード群と高い類似度の文献クラスタを見出せなけれ
ば、文献クラスタの中からどのキーワードにも類似度を
割り当てられていないものを選び、これと先の文献キー
ワード群との間に高い類似度を割り当てるようになって
いる。また、第一の特徴抽出部７０は、入力したベクト
ルの示す文献キーワード群と高い類似度の文献クラスタ
を見出すと、この文献クラスタと入力した各文献キーワ
ードとの間の類似度を強化するようになっている。さら
に、第一の特徴抽出部７０は、後述する第二のエンコー
ダ５０からベクトル化された検索キーワード群を入力す
ると、この検索キーワード群と高い類似度を割り当てら
れた文献クラスタを求めて、その旨を出力するものであ
る。

【００６５】３０は、検索キーワード入力２を蓄積する
検索キーワードテーブルである。また、検索キーワード
テーブル３０は、これまでに入力した検索キーワードの
種類を記憶しておくものである。５０は、検索キーワー
ドテーブル３０の内容を参照して、検索キーワード入力
２をベクトルに変換する第二のエンコーダである。即
ち、第二のエンコーダ５０は、テーブル３０にあるこれ
までに抽出された各検索キーワードの種類をベクトルの
次元として、検索キーワード入力２をベクトル変換する
ものである。詳述すると、第二のエンコーダ５０は、検
索キーワード入力２による検索キーワードの成分を示す
値を、それぞれに応じた次元に置き換えてベクトル化す
るものである。なお、第二のエンコーダ５０は、ベクト
ル化する時に、変換するベクトルのある次元に相当する
入力した検索キーワードが無ければ、その次元の値は０
とするようになっている。これにより、検索キーワード
入力２のキーワードは、単数及び不特定な数であっても
構わない。

【００６６】１００は、複数の検索キーワードクラスタ
（分類部）を備えた検索キーワードクラスタ記憶部（分
類部，追加度抽出手段）である。この検索キーワードク
ラスタ記憶部１００は、後述する第二の特徴抽出部８０
の出力する各々の特徴量を基準に、第二のエンコーダ５
０の出力するベクトルのクラスタ分類した結果を保持す
るものである。また、検索キーワードクラスタ記憶部１
００は、検索キーワード入力２に対する各検索キーワー
ドクラスタの類似度を、第二の特徴抽出部８０から得る
と、これらを各検索キーワードクラスタにおける追加度
とするようになっている。

【００６７】８０は、第二のエンコーダ５０の出力する
ベクトルから特徴を抽出し、抽出した特徴の特徴量を出
力する第二の特徴抽出部（追加度抽出手段，追加手段）
である。即ち、第二の特徴抽出部８０は、検索キーワー
ド記憶部１００の検索キーワードクラスタの内の幾つか
のものと各キーワードとの間に所定の類似度を割り当て
ておき、ベクトル化された検索キーワードを入力する
と、これに対する各検索キーワードクラスタの類似度を
求めるものである。なお、ここで言う各キーワードと
は、検索キーワードテーブル３０にあるこれまでに抽出
された各検索キーワードのことである。また、第二の特
徴抽出部８０は、上記キーワードを、上記キーワードの
検索キーワードクラスタに対する類似度と、その検索キ
ーワードクラスタに割り当てられた前記追加度とに応じ
た比率で、検索キーワードに追加するものである。

【００６８】さらに、第二の特徴抽出部８０は、入力し
た検索キーワードに対する各検索キーワードクラスタの
類似度を求めた結果、高い類似度のものを見出せなけれ
ば、検索キーワードクラスタの中からどのキーワードに
も類似度を割り当てられていないものを選び、これと入
力した検索キーワードとに、高い類似度を割り当てるよ
うになっている。また、第二の特徴抽出部８０は、入力
した検索キーワード群に対する各検索キーワードクラス
タの類似度を求めた結果、高い類似度のものを見出す
と、このクラスタと入力した各検索キーワードとの間の
類似度を強化するようになっている。

【００６９】１２０は、第一の特徴抽出部７０と文献ク
ラスタ記憶部９０との出力から、文献検索の検索結果出
力を生成する検索評価部（検索評価手段）である。即
ち、検索評価部１２０は、文献クラスタ記憶部９０から
の文献クラスタ情報と、第一の特徴抽出部７０からの出
力の示す文献クラスタ情報とを比較し、高い類似度のも
のを求めるものである。さらに、検索評価部１２０は、
上記比較により高い類似度の文献クラスタを求めると、
そこに分類されている情報を検索結果として出力するも
のである。

【００７０】なお、図示していないが、このデータベー
スシステムには、当然ながら、文献入力１を上述の各構
成部の処理に応じて格納する文献データベースと、上記
の各構成部と文献データベースを制御する制御部が備え
られている。この制御部は、所定のプログラムに応じて
上述の各構成部を制御するものである。なお、上記プロ
グラムに関しては、後に説明する。そして、文献入力１
によりデータベースシステムに入力された文献は、文献
データベースに登録されるように構成されている。以上
が、データベースシステムの各構成部の説明であるが、
これらの構成部のより具体的な構成の説明は、後に各構
成部の動作を説明する際に、共に説明することにする。

【００７１】上記の構成部を用いて、このデータベース
システムは、１．文献蓄積モード２１２．文献検索モード２２の２つの動作モードを持つように構成されている。

【００７２】文献蓄積モード２１は、検索を対象とする
文献を、文献データベースに入力する時の動作モードで
ある。即ち、文献蓄積モード２１では、入力された文献
から特徴が自動的に抽出されて、文献データベース内に
蓄積されるようになっている。

【００７３】文献検索モード２２は、文献データベース
に対する文献検索を、実施される時の動作モードであ
る。即ち、文献検索モード２２では、文献データベース
に文献検索条件（検索キーワード）を入力し、入力され
た検索条件の特徴が、自動的に抽出／蓄積されるように
なっている。さらに、入力された文献検索条件に適合す
る特徴を持つ文献を、これまでに入力された文献から検
索して、その検索を出力するようになっている。

【００７４】即ち、このデータベースシステムは、上記
の各構成部を所定のプログラムによって運用することに
より、上記の各モードを構成して、その機能を果たすも
のである。以下において、各モードの動作を説明するこ
とにより、前記のプログラムの内容を説明する。これと
ともに、前記の各構成部のより具体的な構成と運用方法
とを詳述することにする。

【００７５】次に動作について説明する。まず、図２を
用いて、文献蓄積モード２１の動作手順から説明する。
文献蓄積モード２１では、最初に文献データベースに蓄
積させる文献のポインタアドレス：＊ｐと、蓄積される
文献の本文：Ｂ（＊ｐ）とから成る文献入力１が、キー
ワード抽出部１０に入力される。＊ｐは、検索結果出力
等として、Ｂ（＊ｐ）を参照する時に用いられるもので
ある。

【００７６】キーワード抽出部１０は、入力されたＢ
（＊ｐ）から、キーワード：ベクトルＫＷを抽出する。
この場合、抽出されるキーワードは、シソーラスなどを
参照するような統制語ではなく、文法的観点から文章に
含まれる名詞が全て抽出される。以下、１件の文献から
抽出されたキーワードを式（１０）とおく。ベクトルＫＷ＝｛ｋｗ₁，ｋｗ₂，・・・，ｋｗ_Q｝・・・（１０）ここで、ｋｗの添字は、キーワードが文献中に出現する
順番を表す。同じキーワードが、文献中に複数回出現す
ることも許される。Ｑは、入力された文献の本文に含ま
れていたキーワードの総数である。例えば、図３の文章
による例では、ｋｗ₁＝「未成年者」，ｋｗ₂＝「喫
煙」，ｋｗ₃＝「健康」，ｋｗ₄＝「注意」，Ｑ＝４と
なる。

【００７７】キーワード抽出部１０からのベクトルＫＷ
は、文献キーワードテーブル２０に出力される。文献キ
ーワードテーブル２０には、現在までに入力された文献
に含まれていたキーワード：ベクトルＫＴ＝｛ｋｔ₁，
ｋｔ₂，・・・，ｋｔ_n(k)｝が、蓄積されている。ここ
で、ベクトルＫＴの各成分は、現在までに入力された文
献に含まれていたキーワードである。ｎ_kは、文献キー
ワードテーブル２０の含むキーワードの種類の数であ
る。なお、ｎ（ｋ）とｎ_kとは等しく、ｎ_kをｎ（ｋ）
として示すのは、ｋが添字の添字であることを明確にす
るためである。以下においても、このようにして、添字
の添字を記す。

【００７８】そして、文献キーワードテーブル２０は、
ベクトルＫＷを入力すると、次のようにして、自己の文
献キーワードデータであるベクトルＫＴを、入力された
ベクトルＫＷによって更新するよう構成されている。即
ち、文献キーワードテーブル２０は、ベクトルＫＷと、
このベクトルＫＷの入力される直前の自己のデータ：ベ
クトルＫＴ_oldとを照合する。その結果、文献キーワー
ドテーブル２０は、ベクトルＫＷ上のキーワードで、ベ
クトルＫＴ_old上にないものを見出すと、これを新たに
ベクトルＫＴ_oldに追加する。これにより、更新された
文献キーワードテーブル２０のデータ：ベクトルＫＴ
_newは、現在入力されたベクトルＫＷを含むことにな
る。故に、これまでに入力された文献に含まれていたキ
ーワードの全てが、文献キーワードテーブル２０に登録
される。

【００７９】このような処理の具体例を図４に示す。文
献キーワードテーブル２０は、照合前には、キーワード
「未成年者」，「喫煙」をベクトルＫＴ_oldに含んでい
ない。しかし、文献キーワードテーブル２０は、ベクト
ルＫＷの照合後には、ｋｔ₆＝「未成年者」，ｋｔ₇＝
「喫煙」をベクトルＫＴ_oldに追加するのである。つま
り、文献キーワードテーブル２０は、照合完了後には、
ベクトルＫＷ上のどのキーワードも、必ず、自己の文献
キーワードデータであるベクトルＫＴに含まれるよう
に、ベクトルＫＴを更新するのである。

【００８０】文献キーワードテーブル２０によるベクト
ルＫＴの更新処理が終了すると、第一のエンコーダ４０
は、更新されたベクトルＫＴを参照して、現在処理を行
なっているベクトルＫＷを、ベクトル表現に変換する。
この際、第一のエンコーダ４０は、ベクトルＫＷの各成
分に、文献キーワードの出現頻度を割り当てて変換する
ように構成されている。このような構成により、第一の
エンコーダ４０から下式（１１）に示すベクトルＫＶが
出力される。ベクトルＫＶ＝｛ｋｖ₁，ｋｖ₂，・・・，ｋｖ_n(k)｝・・・（１１）（ｋｖ_i＝「ベクトルＫＷの中のｋｔ_iの個数」）

【００８１】例えば、図５に示すように、ｋｔ₁＝「成
人」は、ベクトルＫＷの中に０回出現するからｋｖ₁＝
０，ｋｖ₂＝「健康」は、ベクトルＫＷの中に１回出現
するからｋｖ₂＝１となる。以下でも、特に断らないか
ぎり、式（１１）の定義で、ベクトルＫＶが生成された
として、説明を続ける。

【００８２】そして、第一のエンコーダ４０の出力ベク
トルＫＶは、＊ｐと共に、第一の特徴抽出部７０へ出力
される。ここで、第一の特徴抽出部７０の詳細な構成を
説明する。第一の特徴抽出部７０は、ｖ個のノードから
構成される入力層：ベクトルＫＩ＝｛ｋｉ₁，ｋｉ₂，
・・・，ｋｉ_v｝と、ｕ個のノードから構成される出力
層：ベクトルＫＯ＝｛ｋｏ₁，ｋｏ₂，・・・，ｋ
ｏ_u｝との２層ネットワーク構成となっている。また、
各々の入力ノード，出力ノード間は、重み付きリンク：
ｗｋ_ijで結合されている。

【００８３】上記のベクトルＫＩの各成分に相当する入
力ノードには、ベクトルＫＶの各成分がエンコードされ
るようになっている。つまり、これらの入力ノードは、
ベクトルＫＶの各成分（文献，検索キーワード）に対応
したものである。また、ベクトルＫＯの各成分に相当す
る各出力ノードは、それぞれ、各入力ノードをエンコー
ドした時の入力パタン（ベクトルＫＶ）に対する典型的
なパタンを示すものである。そして、これらの典型的パ
タン（出力層の各ノード）は、それぞれ、文献クラスタ
記憶部９０の所定の文献クラスタに対応付けられてい
る。先に、第一の特徴抽出部７０の構成の説明で、各文
献キーワードと文献クラスタ記憶部９０の文献クラスタ
との類似度を説明したが、類似度は、入出力間の重み付
きリンクの重みの値に比例したものである。

【００８４】さらに、第一の特徴抽出部７０は、入力層
から出力層への信号伝搬を行なうように構成されてお
り、出力層の各ノードを下式（１２）に従って活性化す
るようになっている。即ち、入力ノードがエンコードさ
れると、第一の特徴抽出部７０は、式（１２）に従って
各出力ノードの値を求めるのである。そして、この出力
ノードの値が、この値を持つ出力ノード（文献クラス
タ）とベクトルＫＶの文献との類似度である。

【００８５】

【数１】

【００８６】また、第一の特徴抽出部７０は、逆に信号
を出力層から入力層へと逆伝搬する場合、入力層の各ノ
ードを下式（１３）に従って、活性化するようになって
いる。

【００８７】

【数２】

【００８８】なお、式（１３）による出力層の各ノード
の値は、ベクトルＫＶに対する出力ノードと、この出力
ノードに相当する文献クラスタとの類似度を表してい
る。

【００８９】また、第一の特徴抽出部７０は、入出力ノ
ードへ伝搬する信号の大きさが発散しないように、全て
のリンクの重みを下式（１４）の値域をとるように設定
されてある。０≦ｗｋ_ij≦ｗｋ_max ・・・（１４）

【００９０】上記の構成により、第一の特徴抽出部７０
は、図６に示すような動作を制御部の制御により行なう
ようになっている。まず、第一の特徴抽出部７０は、ス
テップＳＴ６０１で、一番最初のパタンが入力した時の
み、ステップＳＴ６０２に処理を移す。そして、第一の
特徴抽出部７０は、ステップＳＴ６０２で、全てのリン
クの重みを下式（１５）に示すように、一様に設定す
る。ｗｋ_ij＝ε_k ・・・（１５）（ε_k＜＜ｗｋ_max）

【００９１】また、第一の特徴抽出部７０は、典型的パ
タンの数：ｍ_k＝０と設定する等の初期設定を行ない、
ステップＳＴ６０３へ進む。なお、ステップＳＴ６０１
で、入力パタンが２番目以降であると判断された場合
も、ステップＳＴ６０３へ進む。

【００９２】ステップＳＴ６０３で、第一の特徴抽出部
７０は、ベクトルＫＩを入力パタンでコーディングする
とともに、ベクトルＫＯを０ベクトルとした後、上記の
式（１２）に従って、入力層から出力層への信号伝搬を
実行する。これにより、入力パタンに対する各出力ノー
ドの類似度が得られる。なお、入力パタンとは、入力さ
れた時のベクトルＫＶの成分のパタンのことである。

【００９３】次に、ステップＳＴ６０４で、第一の特徴
抽出部７０は、ｋｏ₁，ｋｏ₂，・・・，ｋｏ_m(k)の中
に、入力パタンに適合するノードがあるかを探する。即
ち、第一の特徴抽出部７０は、文献クラスタの内に、ベ
クトルＫＶと類似度の高いものがあるかどうかを求める
のである。仮に、第一の特徴抽出部７０は、ｊ番目のノ
ードを適合すると判断した場合は、ステップＳＴ６０５
へ進み、Ｌ_k＝ｊとする。なお、Ｌ_kは、適合ノード、
つまり、適合した文献クラスタを示す番号である。

【００９４】また、第一の特徴抽出部７０は、適合する
ノードがないと判断すると、ステップＳＴ６０６へ進
む。ステップＳＴ６０６で第一の特徴抽出部７０は、ｍ
_kに１を加える。即ち、ここで第一の特徴抽出部７０
は、出力層のノードに新たなｋｏ_m(k)を追加して、これ
を入力パタンに適合するノードとする。この結果、Ｌ_k
＝ｍ_kとなる。即ち、第一の特徴抽出部７０は、ベクト
ルＫＶとに対して高い類似度の出力ノード（文献クラス
タ）を見出せなければ、出力ノードの中からどのキーワ
ードにも類似度を割り当てられていないものを、該当す
るものとする。そして、第一の特徴抽出部７０は、この
出力ノードとベクトルＫＶの成分の入力ノードとの間の
リンクの重み（類似度に比例する）を後述するヘッブの
学習規則で強化する。

【００９５】なお、第一の特徴抽出部７０は、ステップ
ＳＴ６０４で適合しているか否かの判断を、各出力ノー
ドの値と、自己の持つ閾値：θ_kとを比較することによ
り行なうようになっている。

【００９６】最後に、ステップＳＴ６０７で、第一の特
徴抽出部７０は、ｋｏ_L(k)に結合するリンクの重みを、
下式（１６）で示すヘッブ（Ｈｅｂｂ）の学習規則に従
って、一定の微小時間だけ変化させて処理を終了する。｛（ｄｗｋ_iL(k)）／（ｄｔ）｝＝−αｗｋ_iL(k)＋ｋｉ_i ・・・（１６）ここで、α＞０は、学習の強度を表すパラメータで、α
が大きい程、１回の学習量は多くなる。

【００９７】図７は、入力パタンが２番目の出力ノード
に適合すると判断された場合のヘッブの学習の例を示す
ものである。即ち、第一の特徴抽出部７０は、入力した
ベクトルＫＶに対して高い類似度の出力ノード（文献ク
ラスタ）を見出すと、ベクトルＫＶの入力ノードの各成
分と、見出した出力ノードとの間の類似度を強化するの
である。即ち、第一の特徴抽出部７０において、現在の
入力パタンのｋｏ_L(k)への適合性は高められ、ｋｏ_L(k)
に伝搬する値は増加する（ｋｏ_L(k)に与えられる適合度
が高くなる）。このため、第一の特徴抽出部７０は、現
在の入力パタンを再び入力した場合、以前よりも強く、
先にこのパタンに適合したｋｏ_L(k)を適合するものとし
て示すのである。

【００９８】一方、観点を変えれば、Ｈｅｂｂの学習
は、ｋｏ_L(k)に結合するリンクの重みのパタン：ｗｋ
_1L(k)，ｗｋ_2L(k)，・・・を、現在の入力パタンに類
似させる方向に変化させるとも言える。つまり、第一の
特徴抽出部７０は、図６の過程を続けることによって、
出力層の１〜ｍ_k番目のノードに対するリンクの重みの
パタンを、現在の入力パタンに対するｍ_k個の典型的パ
タンを表すように変化させる。

【００９９】ところで、第一の特徴抽出部７０によるス
テップＳＴ６０４での適合ノードの判断であるが、これ
を、図８を用いて説明する。図８に示すように、入力パ
タンの第１の典型的パタンに対する類似度：ｋｏ₁＝
０．１、第２の典型的パタンに対する類似度：ｋｏ₂＝
０．６、第３の典型的パタンに対する類似度：ｋｏ₃＝
０．４と出力されている場合では、この入力パタンに対
しては、第２の典型的パタンに最も類似していることに
なる。その次には、第３の典型的パタンが、この入力パ
タンに類似している。

【０１００】この結果に対して、ステップＳＴ６０３
で、もし、θ_k≦０．６が成立するなら、第２の典型的
パタンに対する類似度は、ｋｏ₂＝０．６＞θ_kとな
る。これにより、第一の特徴抽出部７０は、この入力パ
タンを第２の典型的パタンに適合すると判断して、ステ
ップＳＴ６０５に進む。

【０１０１】一方、第一の特徴抽出部７０は、θ_k＞
０．６ならば適合するノードがないと判断して、ステッ
プＳＴ６０６へ進み、新たに、ｋｏ₄が、このパタンに
対する典型的パタンを表すノードとして、コーディング
される。

【０１０２】第一の特徴抽出部７０の入力ノード数は、
文献キーワードテーブル２０の含むキーワードの種類の
数に比べ、多く用意するされており、下式（１７）が成
立する。ｎ_k＜ｖ・・・（１７）

【０１０３】これにより、ベクトルＫＷによる第一の特
徴抽出部７０への入力（入力層へのエンコード）は、下
式（１８）に基づいて行なえばよい。

【０１０４】

【数３】

【０１０５】最後に、第一の特徴抽出部７０は、ベクト
ルＫＯをｍ_k次元の：ベクトルＫＦ＝｛ｋｆ₁，ｋ
ｆ₂，・・・，ｋｆ_u｝にデコードして、文献クラスタ
記憶部９０に出力する。第一の特徴抽出部７０は、この
ようなデコードを、下式（１９）に基づいて行なわれる
ようになっている。また、第一の特徴抽出部７０は、入
力されたベクトルＫＶに対する＊ｐも文献クラスタ記憶
部９０へ出力する。ｋｆ_i＝ｋｏ_j（１≦ｊ≦ｍ_k）・・・（１９）

【０１０６】文献クラスタ記憶部９０は、入力されたベ
クトルＫＦの要素の中で最大であるものを探す。いま、
探された最大要素：ｋｆ_L(k)とすると、文献クラスタ記
憶部９０は、このベクトルＫＦによって示される文献
は、第一の特徴抽出部７０で抽出された典型的パタンの
中で、Ｌ番目の典型的パタンに最も類似していると判断
する。即ち、文献クラスタ記憶部９０は、ベクトルＫＦ
によって示される文献を、自己のＬ番目の文献クラスタ
に最も関連していると判断する。この時、文献クラスタ
記憶部９０は、＊ｐをＬ番目のクラスタに分類し、これ
を記憶する。具体的には、ｉ番目に入力された文献のポ
インタ＝＊ｐ、入力された文献の総数＝ｍ_cとすると、
文献クラスタ記憶部９０は、下式（２０），（２１）＊Ｐ＝｛＊ｐ₁，＊ｐ₂，・・・，＊ｐ_m(c)｝・・・（２０）ＰＣ＝｛ｐｃ₁，ｐｃ₂，・・・，ｐｃ_m(c)｝・・・（２１）（ｐｃ_i＝＊ｐ_iが属するクラスタの番号）で定義されるｍ_c次元の配列の形式で、＊ｐのクラスタ
への帰属関係を記憶するようになっている。

【０１０７】以上の説明のように、文献蓄積モード２１
では、文献の特徴が、第一の特徴抽出部７０上の重み付
きリンクの上に、自動的に蓄積される。文献を特徴付け
るキーワードは、予め決められた言葉の中から選ばれる
のではなく、文献から抽出された名詞が全て用いられる
ので、新しい言葉が出現した場合も、自動的に差別化さ
れた特徴を抽出することができる。また、しかも、ある
文献に対して関連の低い文献キーワードが、この文献と
関連の高い他の文献キーワードと共に入力されると、こ
の文献と関連の低い文献キーワードとの関係を強化でき
る。即ち、あるキーワードに対して共起性の高いキーワ
ードを同じ分類部に関連付けることができる。この結
果、「被検索側の語彙と検索側の語彙」を関係付けるネ
ットワークを成長させることができる。

【０１０８】次に、文献検索モード２２での動作手順を
説明する。図９は、文献検索モード２２でのデータの流
れをの前半分を示している。文献検索モード２２では、
まず、データベースシステムに検索キーワード入力２が
入力される。検索キーワード入力２は、下式（２２）で
表される検索用キーワードの羅列と、下式（２３）で表
される検索用キーワードの検索に対する重要度を示す重
みの数値とからなる。ベクトルＲＷ＝｛ｒｗ₁，ｒｗ₂，・・・，ｒｗ_r｝・・・（２２）ベクトルＲＷＷ＝｛ｒｗｗ₁，ｒｗｗ₂，・・・，ｒｗｗ_r｝，（ｒｗｗ_i＞０）・・・（２３）ｒｗ_i：検索キーワードｒｗｗ_i：ｒｗ_iの重要度

【０１０９】このような、ベクトルＲＷ，ベクトルＲＷ
Ｗは、検索キーワードテーブル３０と第二のエンコーダ
５０とへ出力される。ベクトルＲＷ，ベクトルＲＷＷを
入力した検索キーワードテーブル３０は、現在の自己の
データとベクトルＲＷとの照合を行なう。この検索キー
ワードテーブル３０は、扱うキーワードが検索キーワー
ドであるだけで、先の文献キーワードテーブル２０と基
本的に同じ構成である。即ち、照合前の検索キーワード
テーブル３０上の各キーワードは、下式（２４）ベクトルＲＴ＝｛ｒｔ₁，ｒｔ₂，・・・，ｒｔ_n(r)｝・・・（２４）で表される（ｎ_rは、検索キーワードテーブル３０の含
むキーワードの種類の総数）。そして、ベクトルＲＷ上
のキーワードでベクトルＲＴ上にないものは、新たに、
ベクトルＲＴに追加される。検索キーワードテーブル３
０は、ベクトルＲＴの更新を終えると、更新後のベクト
ルＲＴを第二のエンコーダ５０へ出力する。

【０１１０】ベクトルＲＴを入力した第二のエンコーダ
５０は、これを参照しながら、先に入力したベクトルＲ
Ｗ，ベクトルＲＷＷを下式（２５）に従って、ベクトル
表現（ベクトルＲＶ）に変換する。

【０１１１】

【数４】

【０１１２】即ち、ベクトルＲＴを入力した第二のエン
コーダ５０は、ベクトルＲＷの各成分に対応するベクト
ルＲＷＷの各成分を、ベクトルＲＴの該当する次元に置
き換える。これにより、ベクトルＲＶ＝｛ｒｖ₁，ｒｖ
₂，・・・，ｒｖ_r｝が得られる。つまり、この第二の
エンコーダ５０は、扱うキーワードが検索キーワードで
あるだけで、先の第一のエンコーダ４０と基本的に同じ
構成である。そして、第二のエンコーダ５０は、上記の
ようにして求めたベクトルＲＶを、第二の特徴抽出部８
０へ出力する。

【０１１３】ここで、第二の特徴抽出部８０の構成を詳
述する。第二の特徴抽出部８０は、ｙ個のノードから構
成される入力層：ベクトルＲＩ＝｛ｒｉ₁，ｒｉ₂，・
・・，ｒｉ_y｝と、ｅ個のノードから構成される出力
層：ベクトルＲＯ＝｛ｒｉ₁，ｒｉ₂，・・・，ｒ
ｉ_e｝との２層ネットワーク構成をとり、各々の入力ノ
ード，出力ノード間は、重み付きリンク：ｗｒ_ijで結合
されている。

【０１１４】上記のベクトルＲＩの各成分に相当する入
力ノードには、ベクトルＲＶの各成分がエンコードされ
るようになっており、つまり、これらの入力ノードは、
ベクトルＲＶの各成分（検索キーワード）に対応したも
のである。また、ベクトルＲＯの各成分に相当する各出
力ノードは、それぞれ、各入力ノードをエンコードした
時の入力パタン（ベクトルＲＶ）に対する典型的なパタ
ンを示すものである。そして、これらの典型的パタン
（出力層の各ノード）は、それぞれ、検索キーワードク
ラスタ記憶部１００の所定の検索キーワードクラスタに
対応付けられている。先に、第二の特徴抽出部８０の構
成の説明で、各検索キーワードと検索キーワードクラス
タ記憶部１００の検索キーワードクラスタとの類似度を
説明したが、類似度は、入出力間の重み付きリンクの重
みの値に比例したものである。

【０１１５】さらに、第二の特徴抽出部８０は、入力層
から出力層への信号伝搬を行なう場合、出力層の各ノー
ドを下式（２６）に従い、活性化するようになってい
る。

【０１１６】

【数５】

【０１１７】即ち、入力ノードがエンコードされると、
第二の特徴抽出部８０は、式（２６）に従って、各出力
ノードの値を求めるのである。そして、この出力ノード
の値が、この値を持つ出力ノード（検索キーワードクラ
スタ）とベクトルＲＶとの類似度である。さらに、第二
の特徴抽出部８０は、上記の信号伝搬により、出力層：
ベクトルＲＯの値を得ると、これらを、特徴ベクトル：
ベクトルＲＦ＝｛ｒｆ₁，ｒｆ₂，・・・，ｒｆ_m(r)｝
にデコードして検索キーワードクラスタ記憶部１００へ
出力するようになっている。

【０１１８】また、第二の特徴抽出部８０は、出力ノー
ドの値から入力ベクトルＲＶに適合する出力ノードを判
断すると、この出力ノードと入力ノードとの間のリン
ク：ｗｒ_ijの重みを、先のヘッブの学習規則に従って変
化させるようになっている。

【０１１９】逆に信号を出力層から入力層へと逆伝搬す
る場合、第二の特徴抽出部８０は、入力層の各ノードを
下式（２７）に従い、活性化するようになっている。

【０１２０】

【数６】

【０１２１】即ち、出力ノードがエンコードされると、
第二の特徴抽出部８０は、式（２７）に従って、各入力
ノードの値を求めるのである。そして、この入力ノード
の値が、この値を持つ入力ノード（ベクトルＲＶの各成
分：各検索キーワード）と各検索キーワードクラスタと
の類似度である。さらに、第二の特徴抽出部８０は、上
記の逆伝搬により、入力層：ベクトルＲＩの値を得る
と、これを、後述するベクトルＲＸとして第二のエンコ
ーダ５０へ出力するようになっている。

【０１２２】また、全てのリンクの重みは、入出力ノー
ドへ伝搬する信号の大きさが発散しないように、下式
（２８）の値域をとるようになっている。０≦ｗｒ_ij≦ｗｒ_max ・・・（２８）

【０１２３】上記の構成により、第二の特徴抽出部８０
は、入力パタン：ベクトルＲＶを、入力層：ベクトルＲ
Ｉにエンコードして典型的パタンを抽出する。そして、
第二の特徴抽出部８０は、出力層：ベクトルＲＯの各値
を、特徴ベクトル：ベクトルＲＦ＝｛ｒｆ₁，ｒｆ₂，
・・・，ｒｆ_m(r)｝にデコードする。また、第二の特徴
抽出部８０は、リンク：ｗｒ_ijの重みを、ヘッブの学習
規則に従って変化される。以上の第二の特徴抽出部８０
の動作原理は、第一の特徴抽出部７０と同様であるの
で、その説明は省略する。そして、第二の特徴抽出部８
０は、上記のようなベクトルＲＦを、検索キーワードク
ラスタ記憶部１００に出力する。

【０１２４】また、検索キーワードクラスタ記憶部１０
０は、ベクトルＲＦ＝｛ｒｆ₁，ｒｆ₂，・・・，ｒｆ
_e｝とともに、現在入力されたベクトルＲＷ，ベクトル
ＲＷＷに対するＬ_rと、現時点での典型的パタン数：ｍ
_r入力し、これらを記憶する。なお、Ｌ_rは、適合する
と判定された出力ノード（文献クラスタ）番号である。

【０１２５】この検索キーワードクラスタ記憶部１００
は、ベクトル：ベクトルＡＦ＝｛ａｒ₁，ａｒ₂，・・
・，ａｒ_e｝を、第二の特徴抽出部８０へフィードバッ
ク出力するようになっている。このベクトルＡＦは、ベ
クトルＲＦから連想されるキーワードのクラスタを表現
するベクトルである。ベクトルＡＦの定義は幾つか考え
られるが、検索キーワードクラスタ記憶部１００は、下
式（２９）を用いるようになっている。ａｒ_j＝（１−β）δ_jL(r)＋βｒｆ_j ・・・（２９）（１≧β≧０）

【０１２６】式（２９）のδｉｊは、クロネッカーのデ
ルタで、βは、クラスタ分類の依存度を表すパラメータ
である。例えば、β＝０のときは、現在入力した検索キ
ーワードに適合した典型的検索タームのパタンだけが、
フィードバックされる。また、β＝１のときは、これま
でに抽出された典型的検索タームのパタン全てに対する
現在入力した検索キーワードの適合度が、フィードバッ
クされる。

【０１２７】上述の構成により、検索キーワードクラス
タ記憶部１００は、入力ベクトルＲＦを式（２９）で変
換してベクトルＡＦを生成し、これを第二の特徴抽出部
８０へフィードバックする。

【０１２８】検索キーワードクラスタ記憶部１００で生
成されたベクトルＡＦは、第二の特徴抽出部８０のベク
トルＲＯに入力され、リンクを経由して、ベクトルＲＩ
に逆伝搬する。この時、上記の式（１３）で決定される
逆伝搬後のベクトルＲＩの値は、現在入力した検索キー
ワードから連想された重み付き検索キーワードである。
以下、これをベクトルＲＸと呼ぶ。ベクトルＲＶ_aは、
第二のエンコーダ５０へ出力される。

【０１２９】このように、第二の特徴抽出部８０で、ベ
クトルＲＦに対する出力ノードの類似度を求め、さら
に、記憶部１００で、出力ノードの類似度（追加度）を
成分とするベクトルＡＦを第二の特徴抽出部８０へフィ
ードバックする。なお、上記したように、記憶部１００
は、ベクトルＡＦの成分を適合した出力ノード以外の成
分に関しては、所定の比率で追加する。その後、このベ
クトルＡＦの各成分が、第二の特徴抽出部８０の出力ノ
ードの対応するものにエンコードされる。即ち、第二の
特徴抽出部８０の出力ノードは、先に得た類似度を、記
憶部１００によって所定の比率に変換されたことにな
る。

【０１３０】そして、第二の特徴抽出部８０は、このよ
うな各出力ノードのエンコードによる値を逆伝搬する。
この結果、第二の特徴抽出部８０の各入力ノードには、
自己の出力ノードに対するリンクの重み（関連度）と、
その出力ノードにエンコードされた類似度（追加度）と
に比例した値が出力される。つまり、第二の特徴抽出部
８０の各入力ノードには、入力ベクトルＲＶに対する類
似度（関連度）が得られることになる。そして、第二の
特徴抽出部８０は、これらの入力ノードの値を成分とす
る上記ベクトルＲＸを出力する。言い換えると、ベクト
ルＲＸは、第二の特徴抽出部８０に入力されたベクトル
ＲＶに対する各キーワードの関連度を示すベクトルであ
る。

【０１３１】もし、式（２９）においてβ≧０ならば、
これまでに抽出された典型的検索タームのパタン全てに
対する現在入力した検索キーワードの適合度（追加度）
が、連想される検索キーワードを決定することになる。
また、式（２９）においてβ＝０ならば、現在入力した
検索キーワードに適合した典型的検索タームのパタンの
適合度だけが、連想される検索キーワードを決定するこ
とになる。

【０１３２】このようなベクトルＲＸを入力した第二の
エンコーダ５０は、ベクトルＲＶとベクトルＲＸとか
ら、検索に用いる検索ベクトル：ベクトルＡＶ＝｛ａｖ
₁，ａｖ₂，・・・，ａｖ_e｝を生成する。ベクトルＡ
Ｖは、下式（３０）で定義される。ａｖ_i＝γｒｘ_i＋（１−γ）ｒｖ_i ・・・（３０）（０≦γ≦１）式（３０）のγは、連想の強度を決めるパラメータで、
現在入力した検索キーワードが、過去に入力されたとき
に、共に検索キーワードとして入力された頻度が高かっ
たキーワードを、現在入力した検索キーワードに補足す
る割合である。例えば、γ＝０のときは、現在入力した
検索キーワードのみが、検索タームとして使用され、γ
＝１のときは、過去に行なった検索で、現在入力した検
索キーワードが用いられた際に、一緒に検索キーワード
として入力された頻度が大きかった検索キーワードのみ
が、検索タームとして使用される。なお、ｒｘ_iは、ベ
クトルＲＸの成分である。

【０１３３】最後に、第二のエンコーダ５０は、ベクト
ルＡＶとともに、検索キーワードテーブル３０を参照し
て得られるベクトルＲＴとを出力する。以上の手順によ
り、過去に行なった検索の学習結果を反映して、入力さ
れたベクトルＲＷ，ベクトルＲＷＷに対し、関連するキ
ーワードを付加したベクトルＡＶが生成される。

【０１３４】文献検索モード２２でのデータの流れの後
半部分を図１０に示す。先の図９の前半部分で出力され
たベクトルＡＶ，ベクトルＲＴは、第一のエンコーダ４
０に入力される。すると、第一のエンコーダ４０は、下
式（３１）に従って、ベクトルＡＷ，ベクトルＡＷＷを
ベクトル変換してベクトルＫＶを求め、これを第一の特
徴抽出部７０に出力する。

【０１３５】

【数７】

【０１３６】ベクトルＫＶを入力した第一の特徴抽出部
７０は、文献検索モード２２においては、先の図６のス
テップＳＴ６０３と同様に、ベクトルＦＩからベクトル
ＦＯへの信号伝搬を行なう。そして、第一の特徴抽出部
７０は、この信号伝搬によって得られたベクトルＫＦ，
ベクトルｍ_kを、検索評価部１２０に出力する。また、
これとともに、文献クラスタ記憶部９０は、蓄積してい
る＊ｐ，ＰＣを検索評価部１２０へ出力する。

【０１３７】検索評価部１２０に入力されたベクトルＫ
Ｆの要素：ｋｆ_iは、現在の検索要求に対するｉ番目の
文献クラスタの一致度を表しており、対応する数値が大
きいクラスタ程、一致度が高くなっている。そして、検
索評価部１２０は、ベクトルＫＦと文献のクラスタへの
分類を表す、＊ｐ，ＰＣから、検索要求に適合する文献
のポインタ群：＊ＰＲ＝｛＊ｐｒ₁，＊ｐｒ₂，・・
・，＊ｐｒ_a(r)｝を生成する。ただし、ａ_rは、検索要
求に適合する文献の数である。＊ＰＲは、下式（３２）
で定義される検索評価関数、および以下の式（３３），
式（３４），式（３５）により、決められる。

【０１３８】

【数８】

【０１３９】

【数９】

【０１４０】＊ｐｒ_s(j)＝＊ｐ_j ・・・（３４）（ｓ（ｊ）≠０）・・・（３５）

【０１４１】生成された＊ＰＲは、検索結果出力４とし
て出力される。検索の適合性の判断基準は、１．ｋｆ_j＝ｍａｘ｛ｋｆ_i｝であるような、最も一致
度が高いｊ番目の文献クラスタに分類された文献を出力
する２．ｋｆ_j＞θ_a（θ_aは、適合度の最低基準の閾値）
を満たすようなｊ番目の文献クラスタに分類された文献
を出力する３．＊ＰＲの要素の個数に、最大値：ｎｒ_max／最小
値：ｎｒ_minの制約を課すなどの条件を組み合わせて設定される。

【０１４２】例えば、データベースシステムは、上記の
２の条件を満たす文献クラスタをｋｆ_jの大きい順に出
力する。そして、データベースシステムは、出力した文
献の数が、ｎｒ_minを越えた時点で出力を停止する。こ
れにより、データベースシステムは、一定の水準以上の
一致度を持つ文献を、一定の数以上出力することができ
る。

【０１４３】以上において説明したように、文献検索モ
ード２２では、文献検索条件の特徴が、特徴抽出部上の
重み付きリンクの上に自動的に蓄積される。文献検索条
件を特徴付けるキーワードは、決められた言葉の中から
選ばれるのではないので、文献検索条件の設定の自由度
が高くなる。また、過去に行なった文献検索条件の特徴
をフィードバックして用いることにより、文献検索条件
のキーワードの洩れを補償される。つまり、自動生成手
法により自動的に抽出される、検索キーワードと文献キ
ーワードとの典型的パタンの利用により、キーワードの
設定洩れなどを補償する高機能な連想が可能となる。ま
た、検索キーワードをクラスタに分類する際に、分類先
のクラスタと分類された検索キーワードとの関係を強化
できる。この結果、クラスタと検索キーワードの類似度
が学習されて、的確に検索キーワードを分類できるなど
の効果がある。しかも、ある文献に対して関連の低い検
索キーワードが、この文献と関連の高い他の検索キーワ
ードと共に入力されると、この文献と関連の低い検索キ
ーワードとの関係を強化できる。即ち、ある検索キーワ
ードに対して共起性の高い検索キーワードを同じクラス
タに類似付けることができる。これにより、システムが
使用される度に、検索条件の自由度に対する適応性が向
上していく。また、文献検索条件のキーワードの洩れの
補償が、より高度なものとなるとともに、利用者に応じ
たネットワークを構成できるなどの効果がある。これと
同時に、パタンマッチングの性質により、統計的なノイ
ズが除去されるため、文献検索の観点からは、適合率を
下げることなく、再現率が向上する。また、統制キーワ
ードを使用しないので、自由な検索が可能である一方、
新しい言葉の出現に対しても即座に対応できる。そし
て、キーワードは、全て機械的に自動抽出されるので、
大量文献の自動処理が可能である。

【０１４４】実施例２．以下、この発明の実施例２を図
について説明する。図１１は本発明のデータベースシス
テムの構成を示すブロック図である。図について、１０
はキーワード抽出部、２０は文献キーワードテーブル、
４０は第一のエンコーダ、７０は第一の特徴抽出部、９
０は文献クラスタ記憶部、３０は検索キーワードテーブ
ル、５０は第二のエンコーダ、８０は第二の特徴抽出
部、１００は検索キーワードクラスタ記憶部、１２０は
検索評価部（検索評価手段）である。これらの各構成部
は、実施例１で説明した通りである。

【０１４５】また、６０は、検索者により前記検索結果
出力の適合性を判定された検索結果評価信号３を用い、
第一のエンコーダ４０の出力するベクトルと、第二のエ
ンコーダ５０の出力するベクトルとの相関性（関連度）
を学習する第一の学習部（学習手段）である。即ち、第
一の学習部６０は、検索した文献に対する検索の適合性
の評価を受けると、検索した文献から得られる文献キー
ワードと、検索した文献を得るために入力された検索キ
ーワードとの間の相関度を、前記評価に応じて学習する
ものである。また、第一の学習部６０は、学習結果を記
憶しておくとともに、学習した相関性を基に、入力した
検索キーワード群（ベクトル）と相関性の高い文献キー
ワード群（ベクトル）を求めるものである。

【０１４６】なお、図示していないが、このデータベー
スシステムには、当然ながら、文献入力１を上述の各構
成部の処理に応じて格納する文献データベースと、上記
の各構成部と文献データベースを制御する制御部が備え
られている。この制御部は、所定のプログラムに応じて
上述の各構成部を制御するものである。なお、このプロ
グラムに関しては、後に説明する。そして、文献入力１
によりデータベースシステムに入力された文献は、文献
データベースに登録されるように構成されている。以上
が、データベースシステムの各構成部の説明であるが、
これらの構成部のより具体的な構成の説明は、後に各構
成部の動作を説明する際に、共に説明することにする。

【０１４７】上記の構成部を用いて、このデータベース
システムは、１．文献蓄積モード２３２．文献検索モード２４３．検索結果評価モード２５の３つの動作モードを持つように構成されている。

【０１４８】文献蓄積モード２３は、検索の対象とする
文献を、文献データベースに入力する時の動作モードで
ある。即ち、文献蓄積モード２３は、入力された文献の
特徴を自動的に抽出して、文献データベース内に蓄積す
るようになっている。

【０１４９】文献検索モード２４は、文献データベース
に対する文献検索を実施させる時の動作モードである。
即ち、文献検索モード２４は、データベースシステムに
文献検索条件を入力すると、入力された検索条件の特徴
を自動的に抽出／蓄積するようになっている。さらに、
入力された文献検索条件に適合する特徴を持つ文献を、
これまでに入力された文献から検索し、その結果を出力
するようになっている。

【０１５０】検索結果評価モード２５は、文献検索モー
ド２４で検索を実行した検索者によって、検索された文
献の評価を受けるようになっている。さらに、検索結果
評価モード２５は、その評価結果を以後の検索に反映さ
れるように、文献キーワードテーブル２０上の単語と、
検索キーワードテーブル３０上の単語との相関関係を学
習するようになっている。

【０１５１】即ち、このデータベースシステムは、上記
の各構成部を所定のプログラムによって運用することに
より、上記の各モードを構成して、その機能を果たすも
のである。以下において、各モードの動作を説明するこ
とにより、前記のプログラムの内容を説明する。これに
より、上記の各構成部のより具体的な構成と運用方法を
詳述することにする。

【０１５２】次に動作について説明する。これら３つの
モードの内、文献蓄積モード２３の動作手順は、先の実
施例１で説明した文献蓄積モード２１の動作手順と同じ
なので、その説明を省略する。以下において、文献検索
モード２４と検索結果評価モード２５との動作手順を説
明する。

【０１５３】まず、文献検索モード２４の動作手順から
説明する。最初に検索キーワード入力２が入力されてか
ら、第二のエンコーダ５０によって、ベクトルＡＶ，ベ
クトルＲＴが出力されるまでの文献検索モード２４の動
作手順は、実施例１で図９を用いて説明した文献検索モ
ード２２の動作手順と同様である。

【０１５４】図９以降の文献検索モード２４のデータの
流れを図１２に示す。第二のエンコーダ５０から出力さ
れたベクトルＡＶと、ベクトルＲＴ，ｎ_rと、第一のエ
ンコーダ４０から出力されるベクトルＫＴ，ｎ_kとが、
第一の学習部６０に入力される。

【０１５５】この第一の学習部６０は、ｐ個のノードか
ら構成される入力層：ベクトルＬＲ＝｛ｌｒ₁，ｌ
ｒ₂，・・・，ｌｒ_p｝と、ｑ個のノードから構成され
る出力層：ベクトルＬＫ＝｛ｌｋ₁，ｌｋ₂，・・・，
ｌｋ_q｝との２層ネットワーク構成となっている。ま
た、各々の入力ノード，出力ノード間は、重み付きリン
ク：ｗｌ_ijで結合されている。

【０１５６】上記のベクトルＬＲの各成分に相当する入
力ノードには、ベクトルＡＶ，ベクトルＲＴの各成分が
エンコードされるようになっている。つまり、これらの
入力ノードは、ベクトルの各成分（検索キーワード）に
対応したものである。また、ベクトルＬＫの各成分に相
当する各出力ノードは、第一のエンコーダ４０からのベ
クトルＫＶをエンコードされるようになっており、これ
らの出力ノードは、ベクトルＫＶの各成分（文献キーワ
ード）に対応したものである。先に、第一の学習部６０
の構成の説明で、各文献キーワードと各検索キーワード
との相関度を説明したが、この相関度は、入出力間の重
み付きリンクの重みの値に比例したものである。

【０１５７】文献検索モード２４では、第一の学習部６
０は、入力層から出力層への信号伝搬を行ない、この
際、出力層の各ノードを下式（３６）に従って活性化
し、各出力ノードの値をデコードしたベクトルＫＶを第
一のエンコーダ４０へ出力するようになっている。

【０１５８】

【数１０】

【０１５９】なお、ｎ_k，ｎ_rは、各々文献蓄積モード
２３，文献検索モード２４の動作過程で、単調増加して
いく。このため、第一の学習部６０の入力ノードと出力
ノードとは、下式（３７），（３８）ｎ_r＜ｐ・・・（３７）ｎ_k＜ｑ・・・（３８）が成立するように、十分多く用意されている。

【０１６０】また、第一の学習部６０は、これらの式
（３７），（３８）の下で、ベクトルＡＶ→ベクトルＬ
Ｒへのエンコードを、下式（３９）に基づいて行なうよ
うになっている。なお、ｌｒ_iは、ベクトルＬＲの各成
分である。

【０１６１】

【数１１】

【０１６２】さらに、入力層から出力層への信号伝搬の
際に得られる各出力ノードの値は、つまり、ベクトルＬ
Ｋは、下式（４０），（４１）に基づいて、ベクトルＫ
Ｖへとデコードされるようになっている。ｋｖ_i＝ｌｋ_i ・・・（４０）（１≦ｉ≦ｎ_(k)）・・・（４１）

【０１６３】このような構成により、第一の学習部６０
は、入力層から出力層への信号伝搬を式（３６）に従っ
て活性化した上で行ない、その後、各出力ノード値をベ
クトルＬＫにデコードし、このベクトルＬＫを第一のエ
ンコーダ４０へ出力する。当然ながら、このベクトルＬ
Ｋは、検索キーワード入力２に対して関連の深い文献キ
ーワード群を表すベクトルである。

【０１６４】そして、第一の学習部６０は、以下に示す
ようにして、リンクを設定するようになっている。以
下、第一の学習部６０のリンクの設定方法を、図を用い
て具体的に説明する。実施例１で図４を用いて説明した
ように、文献蓄積モード２３を実行することにより、ベ
クトルＫＴの要素数：ｎ_kは、単調増大する。つまり、
第一の学習部６０は、文献蓄積モード２３の実行により
増えたベクトルＫＴの成分に対応する出力ノードを増加
させる。また、文献検索モード２４の実行により、ベク
トルＲＴの要素数：ｐは、単調増大する。つまり、第一
の学習部６０は、文献検索モード２４の実行により増え
たベクトルＲＴの成分に対応する入力ノードを増加させ
る。このように、各モード２３，２４の実行を繰り返す
毎に、第一の学習部６０でエンコードされる入力ノード
数，デコードされる出力ノード数は、単調増大するので
ある。例えば、図１３では、ベクトルＫＴに、ｋｔ₆＝
「未成年者」，ｋｔ₇＝「禁煙」が追加され、ｎ_k＝５
→７に増大、ベクトルＲＴに、ｒｔ₄＝「注意」，ｒｔ
₅＝「火遊び」が追加され、ｎ_k＝３→５に増大してい
る。

【０１６５】図１３に示す黒丸は、追加された語であ
り、リンク、ｗｌ_iｊ（ｉ＝４，５、ｊ＝１，・・・，
７），ｗｌ_iｊ（ｉ＝１，・・・，５ｊ＝６，７）
は、この語に対応するノードに結合するリンクである。
そして、第一の学習部６０は、ｗｌ_iｊ（ｉ＝４，５、
ｊ＝１，・・・，７），ｗｌ_iｊ（ｉ＝１，・・
・，５ｊ＝６，７）を、下式（４２）によって初期設定
する。例えば、図１３では、新たに追加された語では、
ｒｔ₄＝ｋｔ₄＝「注意」のみが一致し、ｗｌ_４，４＝
１と初期設定される。

【０１６６】

【数１２】

【０１６７】式（４２）の設定方法は、初期設定では、
表記の同じ語を意味的にも同等と見なすという仮定に基
づくものである。もし、初期設定のリンクの重みが変化
しなければ、第一の特徴抽出部７０へ入力されるベクト
ルＫＶは、文献検索モード２２のものと同一となる。

【０１６８】ところで、第一の学習部６０から出力され
たベクトルＫＶは、第一のエンコーダ４０を経由して、
第一の特徴抽出部７０に入力される。第一のエンコーダ
４０は、実施例１の文献検索モード２２の動作とは異な
り、ベクトルＫＶには何の変換も施さない。第一の特徴
抽出部７０へのベクトルＫＶの入力以降は、実施例１の
文献検索モードで説明した図１０での動作と同様であ
る。この結果、検索評価部１２０は、検索キーワード入
力２に対して関連の深い文献キーワード群を表すベクト
ルを基に、適切な文献を選び出す。

【０１６９】以上、説明したように、文献検索モード２
４では、文献検索条件の特徴が、第二の特徴抽出部８０
上の重み付きリンクの上に自動的に蓄積される。文献検
索条件を特徴付けるキーワードは、予め決められた言葉
の中から選ばれるのではないので、文献検索条件の設定
の自由度が高い。また、過去に行なった文献検索条件の
特徴をフィードバックして用いることにより、文献検索
条件のキーワードの洩れが補償される。

【０１７０】次に、検索結果評価モード２５での動作手
順を説明する。検索結果の評価は、文献検索モード２４
での検索者の要求に呼応して出力されたａ_ｒ件の文献
＊ＰＲに対して行なわれる。検索者は、検索要求に対す
る適合性をＢ（＊ｐａ_i）などを参照して行なう。ここ
で、検索者が検索要求に適合するか否かを判断した文
献：＊ＰＡ＝｛＊ｐａ₁，＊ｐａ₂，・・・，＊ｐａ
_a(s)｝、＊ＰＡが検索要求に適合するか否かの判断を数
量化した値：ＡＡ＝｛ａａ₁，ａａ₂，・・・，ａａ
_a(s)｝とする。ただし、ａ_sは検索要求に適合するか否
かを判断した文献の数である。ａａ_iの決定方法は、検
索者の主観に大きく依存するが、検索者毎の主観によ
る、ａａ_iの値のふらつきを抑えるため、ａａ_iには、
一定の値域が与えられている。以下、ａａ_iの値域が
［０，１］の場合について説明する。

【０１７１】検索結果評価モード２５は、評価の対象と
なった＊ＰＡ毎に実行される。まず、最初に評価の対象
とする＊ＰＡに対して、文献検索モード２４で検索を行
なった時の検索条件、ベクトルＲＷ，ベクトルＲＷＷ
が、検索キーワード入力２として入力される。

【０１７２】続けて評価した文献の本文：Ｂ（＊ｐ
ａ_i）が文献入力１として、また、検索者による評価結
果：ａａ_iが検索結果評価信号３として、ｉ＝１，２，
・・・，ａｓの順に逐次システムに入力される。

【０１７３】図１４に検索結果評価モード２５でのデー
タの流れを示す。検索キーワード入力２は、検索キーワ
ードテーブル３０と第二のエンコーダ５０とに入力され
る。第二のエンコーダ５０は、検索キーワードテーブル
３０から出力されるベクトルＲＴを参照しベクトルＲＶ
を得て、これを第一の学習部６０へ出力する。

【０１７４】ベクトルＲＶは、検索結果評価モード２５
で１つの＊ＰＡを処理する間は、一定に保たれる。ベク
トルＲＷ，ベクトルＲＷＷが、検索キーワード入力２と
して入力され、第二のエンコーダ５０からベクトルＲＶ
が出力されるまでの具体的な動作手順、および第一の学
習部６０へのコーディング方法は、文献検索モード２４
の同様であるので、その説明を省略する。

【０１７５】また、文献入力１は、キーワード抽出部１
０に入力される。そして、キーワード抽出部１０は、Ｂ
（＊ｐａ_i）から抽出したキーワード：ベクトルＫＷ
を、文献キーワードテーブル２０と第一のエンコーダ４
０とへ出力する。

【０１７６】その後、第一のエンコーダ４０は、文献キ
ーワードテーブル２０から出力されるベクトルＫＴを参
照してベクトルＫＷを変換し、変換したベクトルＫＶを
第一の学習部６０へ出力する。

【０１７７】なお、Ｂ（＊ｐｒ）が入力されて、第一の
エンコーダ４０からベクトルＫＶが出力されるまでの具
体的な動作手順は、文献蓄積モード２３の同様である。
また、ベクトルＫＶを第一の学習部６０へコーディング
する方法は、文献検索モード２４で示したベクトルＫＶ
を第一の学習部６０へコーディングする方法と同様であ
る。

【０１７８】第一の学習部６０にＢ（＊ｐａ_i）に由来
するベクトルＫＶが出力されるのに同期して、ａａ_iが
検索結果評価信号３として、第一の学習部６０へ出力さ
れる。第一の学習部６０のリンクは、下式（４３）で示
される学習規則に従って、一定の微小時間だけ変化させ
られる。（ｄｗｌ_jk／ｄｔ）＝ｓｇｎ（ｌｒ_j）（−α_aｗｌ_jk＋ａａ_iｓｇｎ（ｌｋ_k）・・・（４３）

【０１７９】ここで、α_a＞０は、学習の強度を表すパ
ラメータで、α_aが大きい程、１回の学習量は多くな
る。また、ｓｇｎ（ｘ）は、下式（４４）で定義され
る。即ち、第一の学習部６０は、式（４３）に従って、
検索評価をリンクの重みに反映するように構成されてい
るのである。

【０１８０】

【数１３】

【０１８１】以下、式（４３）で第一の学習部６０上の
ｗｌ_jkが、検索キーワードテーブル３０上の語と、文献
キーワードテーブル２０上の語との相関を表すように変
化することを説明する。即ち、式（４３）で、ｗｌ
_jkは、ｌｒ_j＞０を満たすｌｒ_jに結合するリンクだけ
が、ｗｌ_lk→ａａ_iｓｇｎ（ｌｋ_k）となるように変化する。

【０１８２】つまり、ベクトルＲＷに含まれるｒｔ_jに
結合するリンクに関して、ａａ_i＝１、即ち、検索文献
が適合すると判断された場合は、ｌｋ_k＞０ならｗｌ_jk→１の方向にｌｋ_k＝０ならｗｌ_jk→０の方向にｗｌ_jkは変化する。言い換えれば、検索文献が適合する
と判断された場合は、検索条件に含まれる語と、検索文
献に出現する語との間のリンクの重みが増加し、検索条
件に含まれる語と、検索文献に出現しなかった語との間
のリンクの重みが減少する。

【０１８３】一方、ａａ_i＝０，即ち、検索文献が適合
しないと判断された場合は、ＲＷに含まれるｒｔ_jに結
合するリンクに関して、ｌｋ_k＞０ならｗｌ_jk→０の方向にｗｌ_jkは変化する。言い換えれば、検索文献が適合しな
いと判断された場合は、検索条件に含まれる語と、検索
文献に出現する語との間のリンクの重みが減少する。

【０１８４】図１５に、検索文献が適合すると判断され
た場合のリンクの重みの変化の例を示す。図１５のリン
クの初期設定は、ｗｌ₂₅＝ｗｌ₄₄＝１以外は０である。
そして、文献検索モード２４の動作過程で検索キーワー
ド：ｒｔ₁＝「禁煙」，ｒｔ₄＝「注意」に対し、文献
キーワード上の語で活性化されたのはｋｔ₄である。ま
た、ベクトルＲＴで検索に寄与したのは、ｒｔ₄であ
る。検索結果評価モード２５時の第一の学習部６０は、
検索結果が適合すると判断された場合、検索された文献
に出現した語、即ち、ベクトルＫＴで正の値を持つノー
ドを、全てｒｔ₄と正の相関性があるとして、ｒｔ₄と
の間のリンクの重みを増加する。

【０１８５】図１５の場合では、初期設定で重み１であ
ったｗｌ₄₄以外のｗｌ₄₂，ｗｌ₄₆，ｗｌ₄₇（初期設定で
重み０）にも、正の重みが与えられることになる。逆
に、ベクトルＫＴで、値が０のノードに関しては、ｒｔ
₄と負の相関性があるとして、ｒｔ₄との間のリンクの
重みが減少させられる。

【０１８６】一方、検索者が、ベクトルＲＴ中に設定し
たものの検索には、寄与しなかったｒｔ₁に関しても、
第一の学習部６０は、ベクトルＫＴで正の値を持つノー
ドを、全てｒｔ₁と正の相関性があるとして、ｒｔ₄と
の間のリンクの重みを増加する。

【０１８７】即ち、図１５の場合では、初期設定で重み
０であった、ｗｌ₁₂，ｗｌ₁₄，ｗｌ₁₆，ｗｌ₁₇にも、正
の重みが与えられることになる。逆に、ベクトルＫＴ
で、値が０のノードに関しては、ｒｔ₁と負の相関性が
あるとして、ｒｔ₁との間のリンクの重みが減少させら
れる。

【０１８８】つまり、ｒｔ₁＝「禁煙」のように、ベク
トルＫＴ中には登場しない検索者特有の語彙に対して
も、上に述べた検索結果評価モード２５のリンクの重み
の更新アルゴリズムにより、ベクトルＫＴ上の語に正の
相関性が設定されうるので、以降の検索に寄与させるこ
とができる。

【０１８９】図１６に、検索文献が適合しないと判断さ
れた場合のリンクの重みの変化の例を示す。この場合
は、ベクトルＲＴで検索キーワードとして用いられた語
と、検索された文献に出現した語には、全て負の相関性
があるとして、それらの語の間のリンクの重みだけが減
少させられる。ベクトルＲＴで検索キーワードとして用
いられた語と、検索された文献に出現しなかった語に
は、相関性に関する情報は無いとして、それらの語の間
のリンクの重みは変化しない。図１５では、ｗｌ₂₂，ｗ
ｌ₂₄，ｗｌ₂₆，ｗｌ₂₇，ｗｌ₅₂，ｗｌ₅₄，ｗｌ₅₆，ｗｌ
₅₇の重みが減少している。これは、以降の検索で適合し
ないと判断された文献を検索されにくくする効果があ
る。

【０１９０】以上述べた、検索結果評価モード２５の操
作で仮定したベクトルＲＴ，ベクトルＫＴのキーワード
間の、正の相関・負の相関は、単語間の意味的関係を考
慮したものではない。しかし、＊ＰＡのａｓ件の文献に
関し、リンクの値の更新を繰り返すことにより、リンク
の重みは、統計的なキーワード間の正の相関・負の相関
を反映することになる。即ち、ｗｌ_ij重みが大きいとい
うことは、ｒｔ_iを検索キーワードに指定した時に、検
索された文献の中で、適切と判断された文献に、ｋｔ_j
が含まれる度数が相対的に高いということである。ま
た、同様に重みが小さいということは、適切と判断され
た文献に、ｋｔ_jの含まれる度数が相対的に低いか、ま
たは不適切であると判断された文献に、ｋｔ_jの含まれ
る度数が相対的に高いということであるといえる。よっ
て、文献検索の観点からは、上に述べたベクトルＲＴ，
ベクトルＫＴのキーワード間の相関性の設定方法は、全
く妥当であるといえる。

【０１９１】以上説明したように、検索結果評価モード
２５では、検索結果の妥当性の評価に基づいて、文献の
キーワードと結果キーワードとの相関性が、ネットワー
クの重みの形式で学習されるため、両者の語彙の違いが
補償される効果がある。つまり、このデータベースシス
テムは、検索文献の適合性の判断に基づき、文献の語彙
と検索者との語彙の相関性を学習するので、両者の語彙
の相違を補償することができ、文献検索における再現率
を上昇できるなどの効果がある。

【０１９２】実施例３．以下、この発明の実施例３を図
について説明する。図１７は本発明のデータベースシス
テムの構成を示すブロック図である。図について、１０
はキーワード抽出部、２０は文献キーワードテーブル、
４０は第一のエンコーダ、７０は第一の特徴抽出部、９
０は文献クラスタ記憶部（情報分類部）、３０は検索キ
ーワードテーブル、５０は第二のエンコーダ、８０は第
二の特徴抽出部、１００は検索キーワードクラスタ記憶
部（検索キーワード分類部）、１２０は検索評価部、６
０は第一の学習部である。これらの各構成部は、実施例
１，２で説明した通りである。

【０１９３】また、１１０は、前記検索結果評価信号３
を用い、前記文献クラスタ記憶部９０の文献クラスタと
検索キーワードクラスタ記憶部１００の検索クラスタと
の相関関係を学習する第二の学習部（学習手段）であ
る。また、第二の学習部１１０は、検索キーワードクラ
スタ情報を入力すると、前記の学習による相関性を基
に、この検索キーワードクラスタと相関性の高い文献ク
ラスタを求めて、その旨を出力するようになっている。

【０１９４】なお、図示していないが、このデータベー
スシステムには、当然ながら、文献入力１を上述の各構
成部の処理に応じて格納する文献データベースと、上記
の各構成部と文献データベースを制御する制御部が備え
られている。この制御部は、所定のプログラムに応じて
上述の各構成部を制御するものである。なお、このプロ
グラムに関しては、後に説明する。そして、文献入力１
によりデータベースシステムに入力された文献は、文献
データベースに登録されるように構成されている。以上
が、データベースシステムの各構成部の説明であるが、
これらの構成部のより具体的な構成の説明は、後に各構
成部の動作を説明する際に、共に説明することにする。

【０１９５】上記の構成部を用いて、このデータベース
システムは、１．文献蓄積モード２６２．文献検索モード２７３．検索結果評価モード２８の３つの動作モードを持つように構成されている。

【０１９６】文献蓄積モード２６は、検索の対象とする
文献を、文献データベースに入力する時の動作モードで
ある。即ち、文献蓄積モード２６は、入力された文献か
らその特徴を自動的に抽出し、文献データベース内に蓄
積するようになっている。

【０１９７】文献検索モード２７は、文献データベース
に対する文献検索を実施させる時の動作モードである。
即ち、文献検索モード２７は、文献検索条件を入力する
と、その検索条件の特徴を自動的に抽出／蓄積するよう
になっている。さらに、文献検索モード２７は、入力さ
れた文献検索条件に適合する特徴を持つ文献を、これま
でに入力された文献から検索し、その結果を出力するよ
うになっている。

【０１９８】検索結果評価モード２８は、文献検索モー
ド２７で検索された文献の評価を入力されるようになっ
ている。さらに、検索結果評価モード２８は、文献の評
価結果が、以後の検索に反映されるように、文献クラス
タ記憶部９０上のクラスタと、検索キーワードクラスタ
記憶部１００上のクラスタとの相関関係を学習するよう
になっている。

【０１９９】即ち、このデータベースシステムは、上記
の各構成部を所定のプログラムによって運用することに
より、上記の各モードを構成して、その機能を果たすも
のである。以下において、各モードの動作を説明するこ
とにより、前記のプログラムの内容を説明する。これに
より、上記の各構成部のより具体的な構成と運用方法を
詳述することにする。

【０２００】これら３つのモードの内、文献蓄積モード
２６の動作手順は、先の実施例１で説明した文献蓄積モ
ード２１の動作手順と同じなので、その説明を省略す
る。以下では、文献検索モード２７と検索結果評価モー
ド２８との動作手順を説明する。

【０２０１】まず、文献検索モード２７の動作手順から
説明する。最初に検索キーワード入力２が入力されてか
ら、検索キーワードクラスタ記憶部１００が、ベクトル
ＡＦを出力するまでの文献検索モード２７の動作手順
は、実施例１で図９を用いて説明した文献検索モード２
２の動作手順と同様である。

【０２０２】図１８に、検索キーワードクラスタ記憶部
１００によるベクトルＡＦの出力以降のモード２７のデ
ータの流れを示す。まず、ベクトルＡＦは、第二の学習
部１１０に入力される。

【０２０３】この第二の学習部１１０は、形式的には、
第一の学習部６０との相似の構成のものである。即ち、
第二の学習部１１０は、ｇ個のノードから構成される入
力層：ベクトルＣＲ＝｛ｃｒ₁，ｃｒ₂，・・・，ｃｒ
_g｝と、ｈ個のノードから構成される出力層：ベクトル
ＣＫ＝｛ｃｋ₁，ｃｋ₂，・・・，ｃｋ_h｝との２層ネ
ットワーク構成となっている。各々の入力ノード，出力
ノード間は、重み付きリンク：ｗｃ_ijで結合されてい
る。

【０２０４】上記のベクトルＣＲの各成分に相当する入
力ノードには、ベクトルＡＦの各成分がエンコードされ
るようになっている。つまり、これらの入力ノードは、
ベクトルＡＦの各成分に対応したものである。即ち、入
力層の各ノードは、検索キーワードクラスタ記憶部１０
０の各検索キーワードクラスタに相当している。また、
ベクトルＣＫの各成分に相当する各出力ノードは、第一
の特徴抽出部７０からのベクトルＫＦをエンコードされ
るようになっている。これらの出力ノードは、ベクトル
ＫＦの各成分に対応したものである。即ち、出力層の各
ノードは、文献クラスタ記憶部９０の各文献クラスタに
相当している。先に、第二の学習部１１０の構成の説明
で、検索キーワードクラスタ記憶部１００の各検索キー
ワードクラスタと、文献クラスタ記憶部９０の各文献ク
ラスタとの相関度を説明したが、この相関度は、入出力
間の重み付きリンクｗｃ_ijの重みの値に比例したもので
ある。つまり、入力層の検索キーワードクラスタに相当
する各ノードと、出力層の文献クラスタに相当する各ノ
ードとは、重み付きリンクｗｃ_ijにより、関連付けられ
ている。

【０２０５】文献検索モード２７では、第二の学習部１
１０は、入力層から出力層への信号伝搬を行ない、この
際、出力層の各ノードを下式（４５）に従って活性化
し、各出力ノードをデコードしたベクトルＫＦを第一の
エンコーダ４０へ出力するようになっている。

【０２０６】

【数１４】

【０２０７】なお、ｍ_k，ｍ_rは、各々文献蓄積モード
２６，文献検索モード２７の動作過程で、単調増加して
いくが、第二の学習部１１０の入力ノードと出力ノード
とは、下式（４６），（４７）ｍ_r＜ｇ・・・（４６）ｍ_k＜ｈ・・・（４７）が成立するように、十分多く用意されている。

【０２０８】また、第一の学習部６０は、これらの式
（４６），（４７）の下で、ベクトルＡＦ→ベクトルＣ
Ｒへのエンコードを、下式（４８）に基づいて行なうよ
うになっている。なお、ｃｒ_iは、ベクトルＬＲの各成
分である。このベクトルＡＦは、先の実施例で説明した
ように、記憶部１００の検索キーワードクラスタに対す
る検索キーワード入力２の適合度を示している。

【０２０９】

【数１５】

【０２１０】第二の学習部１１０は、自己の出力ノード
の値を下式（４９），（５０）に基づいて、ベクトルＣ
ＫをベクトルＫＦへとデコードして、これを検索評価部
１２０への出力するようになっている。ｋｆ_i＝ｃｋ_i ・・・（４９）（１≦ｉ≦ｍ_k）・・・（５０）

【０２１１】このような構成により、第二の学習部１１
０は、入力層から出力層への信号伝搬を式（４５）に従
って活性化した上で行なう。その後、第二の学習部１１
０は、各出力ノード値をベクトルＫＦにデコードし、こ
のベクトルＫＦを検索評価部１２０へ出力する。当然な
がら、このベクトルＫＦは、ベクトルＡＦに対して関連
の深い文献クラスタを表すベクトルである。

【０２１２】そして、第二の学習部１１０は、以下に示
すようにして、リンクを設定するようになっている。以
下、第二の学習部１１０のリンクの設定方法を説明す
る。実施例１で図４を用いて説明したように、文献蓄積
モード２６を実行することにより、ｍ_kは単調増大す
る。また、文献検索モード２７の実行により、ｍ_rも単
調増大する。よって、実施例２のモード２４，２５の第
一の学習部６０の場合と同様、各モード２７，２８の実
行を繰り返す毎に、第二の学習部１１０でエンコードさ
れる入力ノード数，デコードされる出力ノード数は増え
ていく。こうした追加設定された語に対応するノードに
結合するリンクは、第二の学習部１１０では、全て０に
初期設定される。

【０２１３】一方、文献クラスタ記憶部９０は、現時点
までに蓄積された文献の情報＊Ｐ，ＰＣ，ｍ_kを、検索
評価部１２０へ出力する。検索評価部１２０は、これら
の入力から、検索要求に適合する文献のポインタ群：＊
ＰＲ＝｛＊ｐｒ₁，＊ｐｒ₂，・・・，＊ｐｒ_a(r)｝を
生成する。検索評価部１２０が、＊ＰＲを生成する方法
は、実施例１の文献検索モード２２の図１０の説明で示
した通りである。

【０２１４】次に、検索結果評価モード２８の動作手順
を説明する。検索結果の評価は、文献検索モード２７で
の検索者の要求に呼応して出力されたａ_r件の文献＊Ｐ
Ｒに対して行なわれる。即ち、＊ＰＲに対して、実施例
２で定義した＊ＰＡ，ＡＡが、検索の適合性の評価とし
て、最初にシステムに入力される。

【０２１５】検索結果評価モード２８は、評価の対象と
なった＊ＰＡ毎に実行される。まず、最初に評価の対象
とする＊ＰＡに対して、文献検索モード２７で検索を行
なった時の検索条件、ベクトルＲＷ，ベクトルＲＷＷ
が、検索キーワード入力２として入力される。

【０２１６】続けて評価した文献の本文：Ｂ（＊ｐ
ａ_i）が文献入力１として、また、検索者による評価結
果：ａａ_iが検索結果評価信号３として、ｉ＝１，２，
・・・，ａ_sの順に逐次システムに入力される。

【０２１７】図１９に検索結果評価モード２８でのデー
タの流れを示す。検索キーワード入力２は、検索キーワ
ードテーブル３０と第二のエンコーダ５０とに入力され
る。そして、第二のエンコーダ５０は、検索キーワード
テーブル３０から出力されるベクトルＲＴを参照してベ
クトルＲＶを得て、これを第二の特徴抽出部８０へ出力
する。

【０２１８】第二の特徴抽出部８０は、ベクトルＲＶの
特徴ベクトル：ベクトルＲＦなどを検索キーワードクラ
スタ記憶部１００へ出力する。ベクトルＲＦを入力した
検索キーワードクラスタ記憶部１００は、このベクトル
を基にベクトルＡＦを生成して、これを第二の学習部１
１０に出力する。

【０２１９】ベクトルＡＦは、検索結果評価モード２８
で１つの＊ＰＡを処理する間は、一定に保たれる。ベク
トルＲＷ，ベクトルＲＷＷが、検索キーワード入力２と
して入力されてから、検索キーワードクラスタ記憶部１
００からベクトルＲＶが出力されるまでの具体的な動作
手順、および第二の学習部１１０へのコーディング方法
は、文献検索モード２７の同様であるので、その説明を
省略する。

【０２２０】文献入力１を入力したキーワード抽出部１
０は、Ｂ（＊ｐａ_i）からキーワードを抽出し、これら
を示すベクトルＫＷを、文献キーワードテーブル２０と
第一のエンコーダ４０とへ出力する。

【０２２１】第一のエンコーダ４０は、文献キーワード
テーブル２０から出力されるベクトルＫＴを参照して、
ベクトルＫＷをベクトルＫＶに変換し、これを第一の特
徴抽出部７０へ出力する。そして、第一の特徴抽出部７
０は、ベクトルＫＶの特徴ベクトル：ベクトルＫＦを第
二の学習部１１０に出力する。Ｂ（＊ｐｒ）が入力され
て、第一の特徴抽出部７０からベクトルＫＦが出力され
るまでの具体的動作手順は、文献蓄積モード２６と同様
であるので、その説明を省略する。また、ベクトルＫＦ
を第一の学習部６０へコーディングする方法は、文献検
索モード２７で示したベクトルＫＦを第二の学習部１１
０へコーディングする方法と同様であるので、その説明
を省略する。

【０２２２】第二の学習部１１０に、Ｂ（＊ｐａ_i）に
由来するベクトルＫＦが出力されるのに同期して、ａａ
_iが検索結果評価信号３として、第二の学習部１１０へ
出力される。

【０２２３】第二の学習部１１０のリンクは、下式（５
１）で示される学習規則に従って、微小時間だけ変化さ
せられる。（ｄｗｃ_jk／ｄｔ）＝ｓｇｎ（ｃｒ_j）（−α_bｗｃ_jk＋ａａ_iｓｇｎ（ｃｋ_k）・・・（５１）ここで、α_b＞０は、学習の強度を表すパラメータで、
α_bが大きい程、１回の学習量は多くなる。また、ｓｇ
ｎ（ｘ）は、式（４４）で定義されている。即ち、第二
の学習部１１０は、式（４３）に従って、検索評価をリ
ンクの重みに反映するように構成されているのである。

【０２２４】式（５１）による第二の学習部１１０の学
習は、実施例２の検索結果評価モード２５で、式（４
３）による第一の学習部６０の学習と同様の要領で行な
われる。このため、ここでは、詳しい説明を省くが、第
二の学習部１１０の入力層の各ノードには検索キーワー
ドクラスタを示すベクトルＡＦが、また、出力層の各ノ
ードには、文献クラスタを示すベクトルＫＦが入力され
るため、式（５１）によって、第二の学習部１１０上の
ｗｃ_jkは、検索キーワードクラスタと、文献クラスタと
の相関を表すように変化する。

【０２２５】検索キーワードクラスタや文献クラスタの
個々のクラスタは、検索入力の特徴や文献の特徴に対応
している。このため、検索結果評価モード２８によって
学習される検索キーワードクラスタと、文献クラスタと
の個々のクラスタ間の正の相関・負の相関は、特徴間の
統計的相関性を反映することになる。即ち、ｗｃ_ijの重
みが大きいということは、ｒｆ_iを検索キーワードの特
徴とする検索を行なった時に検索された文献の中で、適
切と判断された文献が、ｋｆ_jなる特徴を有する度数が
相対的に高いということである。また、同様に重みが小
さいということは、適切と判断された文献に、ｋｆ_jな
る特徴を有する度数が相対的に低いか、または不適切で
あると判断された文献が、ｋｆ_jなる特徴を有する度数
が相対的に高いということであるといえる。よって、文
献検索の観点からは、上に述べた検索キーワードクラス
タと文献クラスタとの間の相関性の設定方法は、全く妥
当であるといえる。

【０２２６】以上説明したように、検索結果評価モード
２８時の第二の学習部１１０は、検索結果の妥当性の評
価に基づいて、検索キーワードクラスタと文献クラスタ
との間の相関性を、ネットワークの重みの形式で学習す
る。即ち、第一の特徴抽出部７０によって生成されたク
ラスタの特徴（ベクトルＫＦ）と、検索キーワードクラ
スタ記憶部１００によって生成されたクラスタの特徴
（ベクトルＡＦ）とは、検索キーワードと文献キーワー
ドの典型的特徴を表す概念と見倣せる。この概念のパタ
ンを利用して、第二の学習部１１０は、検索の適切性の
評価に基づき、文献の概念と検索者の概念の相関性を学
習するのである。これにより、両者の語彙の違いが、キ
ーワードの分類される検索キーワードクラスタと文献ク
ラスタの特徴レベルで補償でき、高度な概念検索が可能
となる。

【０２２７】

【発明の効果】以上のように、請求項１の発明によれ
ば、情報から得られる情報キーワードを入力すると、こ
れと高い関連度を割り当てられた分類部を求め、ここに
情報キーワードの抽出元の情報を分類するとともに、検
索キーワードを入力すると、これと高い関連度を割り当
てられた分類部を求め、そこに分類されている情報を検
索結果として出力するように構成したので、統制キーワ
ードに束縛されずに、自由な検索が可能である。また、
キーワードは、全て機械的に自動抽出されるので、大量
情報の自動処理が可能である。さらに、情報検索におけ
る統計的なノイズを除去でき、情報検索の適合率を下げ
ることなく、再現率を向上できる効果がある。また、利
用者によって検索キーワードが異なっていても、その違
いを補償できる効果がある。さらに、このような効果を
簡単な構成と管理で実現できる効果がある。

【０２２８】また、請求項２の発明によれば、入力した
情報キーワードに対して高い関連度の分類部を見出せな
ければ、所定の分類部とこの情報キーワードとに高い関
連度を割り当て、この分類部に情報キーワードの抽出元
の情報を分類するように構成したので、これまでに例の
無いような情報・検索条件に対しても、格納・情報検索
できるとともに、情報・検索条件を学習できる効果があ
る。即ち、動的にデータ蓄積を行なう際に、これまでに
例の無いような情報・検索条件に対しても、これを「被
検索側の語彙と検索側の語彙」を関係付けるネットワー
クに反映させることのできる効果がある。

【０２２９】また、請求項３の発明によれば、入力した
情報キーワード群に対して高い関連度の分類部を見出す
と、この分類部と情報キーワード群の各キーワードとの
間の関連度を強化するように構成したので、この分類部
とそこに分類された情報の各キーワードとの間の関連度
を強化できる。この結果、情報と情報キーワードの関連
度を学習でき、的確に情報を認識した上で情報分類でき
る効果がある。しかも、ある情報に対して関連度の低い
キーワードが、この情報と関連度の高い他のキーワード
と共に入力されると、この情報と関連度の低いキーワー
ドとの関係を強化できる。即ち、あるキーワードに対し
て共起性の高いキーワードを同じ分類部に関連付けるこ
とができ、これにより、検索キーワード洩れを補償でき
る。これらの結果、「被検索側の語彙と検索側の語彙」
を関係付けるネットワークを成長させることができる効
果がある。これにより、システムが使用される度に、検
索条件の自由度に対する適応性が向上していく。また、
利用者に応じたネットワークを構成できる効果がある。

【０２３０】また、請求項４の発明によれば、入力した
検索キーワードに対する各分類部の関連度を求め、これ
らを各分類部の追加度とするとともに、キーワードの分
類部に対する関連度と、その分類部に割り当てられた追
加度とに応じた比率で、キーワードを前記検索キーワー
ドに追加するように構成したので、統制キーワードに束
縛されずに、自由な検索が可能である。また、キーワー
ドは、全て機械的に自動抽出されるので、大量情報の自
動処理が可能である。さらに、キーワードの設定洩れな
どを補償する高機能な連想が可能となり、情報検索条件
の設定の自由度が高くなる効果がある。また、利用者に
よって検索キーワードが異なっていても、その違いを補
償できる効果がある。さらに、このような効果を簡単な
構成と管理で実現できる効果がある。

【０２３１】また、請求項５の発明によれば、入力した
検索キーワードに対する各分類部の関連度を求めた結
果、高い関連度のものを見出せなければ、所定の分類部
を選び、選んだ分類部と前記キーワードとに高い関連度
を割り当てるように構成したので、これまでに例の無い
ような検索キーワードに対しても、キーワード洩れを補
償できるとともに、検索条件を学習できる効果がある。
即ち、動的にデータ蓄積を行なう際に、これまでに例の
無いような検索条件に対しても、これを「被検索側の語
彙と検索側の語彙」を関係付けるネットワークに反映さ
せることのできる効果がある。また、情報検索条件のキ
ーワードの洩れの補償が、より高度なものとなるととも
に、利用者に応じたネットワークを構成できる効果があ
る。

【０２３２】また、請求項６の発明によれば、入力した
検索キーワード群に対して高い関連度の分類部を見出す
と、関連度の高い分類部と入力した検索キーワード群の
各キーワードとの間の関連度を強化するように構成した
ので、分類部と、そこに分類される検索キーワード群の
各キーワードとの関係を強化できる。この結果、分類部
と検索キーワードの関連度を学習でき、的確に検索キー
ワードを認識した上で検索キーワードを分類できる効果
がある。しかも、ある情報に対して関連度の低いキーワ
ードが、この情報と関連度の高い他のキーワードと共に
入力されると、この情報と関連度の低いキーワードとの
関係を強化できる。即ち、ある検索キーワードに対して
共起性の高い検索キーワードを、同じ分類部に関連付け
ることができる。これにより、情報検索条件のキーワー
ドの洩れの補償が、より高度なものとなるとともに、
「被検索側の語彙と検索側の語彙」を関係付けるネット
ワークを成長させることができる効果がある。この結
果、システムが使用される度に、検索条件の自由度に対
する適応性が向上していく。即ち、利用者に応じた動的
データ蓄積機能を持つことができ、利用者に応じたネッ
トワークを構成できる効果がある。

【０２３３】また、請求項７の発明によれば、検索キー
ワードが入力されると、これと関連度の高い情報キーワ
ードを求めるとともに、検索した情報に対する検索の評
価を受けると、検索した情報から得られる情報キーワー
ドと、この情報の検索に用いられた検索キーワードとの
間の関連度を、先の評価に応じて変化させるように構成
したので、検索側の検索キーワードの概念と、被検索側
の情報キーワードの概念とを、使用する度に一致する方
向に補正できる効果がある。これにより、情報検索の再
現率を上昇できる。即ち、検索能力を検索に応じて成長
させることが可能となる効果がある。さらに、このよう
な効果を簡単な構成と管理で実現できる効果がある。

【０２３４】また、請求項８の発明によれば、検索キー
ワードの分類された検索キーワード分類部と関連度の高
い情報分類部を求め、これに分類されている情報を検索
結果とするとともに、検索した情報に対する検索の評価
を受けると、検索した情報の分類された情報分類部と、
この情報検索に用いられた検索キーワードの分類された
検索キーワード分類部との間の関連度を、先の評価に応
じて変化させるように構成したので、検索キーワードを
分類する分類部の概念と、情報を分類する分類部の概念
とを一致させることが可能となる。これにより、常時に
おいて、情報の分類と検索条件の分類とを、的確に対応
付けできる効果がある。即ち、検索側の語彙の概念と、
被検索側の語彙の概念とを、使用する度に一致する方向
に補正できる。さらに、利用者によって検索キーワード
が異なっていても、その違いを補償できる効果がある。
そして、このような効果を簡単な構成と管理で実現でき
る効果がある。

【図面の簡単な説明】

【図１】本発明の実施例１におけるデータベースシステ
ムを示すブロック図である。

【図２】本発明の実施例１におけるデータベースシステ
ムの入力文献に対する分類の動作を説明する図である。

【図３】本発明の実施例１におけるデータベースシステ
ムのキーワード抽出の動作を説明する図である。

【図４】本発明の実施例１におけるデータベースシステ
ムの文献から抽出したキーワードをキーワードテーブル
に登録する動作を説明する図である。

【図５】本発明の実施例１におけるデータベースシステ
ムの文献から抽出したキーワードを数量化を説明する図
である。

【図６】本発明の実施例１におけるデータベースシステ
ムの特徴抽出部の動作を示すフローチャートである。

【図７】本発明の実施例１におけるデータベースシステ
ムの特徴抽出部での学習処理を説明する図である。

【図８】本発明の実施例１におけるデータベースシステ
ムの特徴抽出部での信号伝搬を説明する図である。

【図９】本発明の実施例１におけるデータベースシステ
ムの検索キーワードの入力に対する処理を説明する図で
ある。

【図１０】本発明の実施例１におけるデータベースシス
テムの検索結果出力を得る際の動作を説明する図であ
る。

【図１１】本発明の実施例２におけるデータベースシス
テムを示すブロック図である。

【図１２】本発明の実施例２におけるデータベースシス
テムの検索結果出力を得る際の動作を説明する図であ
る。

【図１３】本発明の実施例２におけるデータベースシス
テムの文献キーワードと検索キーワードとの相関性によ
るネットワークを説明する図である。

【図１４】本発明の実施例２におけるデータベースシス
テムの相関性学習の動作を説明する図である。

【図１５】本発明の実施例２におけるデータベースシス
テムの文献検索の評価が適切と判断された場合の相関性
学習を説明する図である。

【図１６】本発明の実施例２におけるデータベースシス
テムの文献検索の評価が不適切と判断された場合の相関
性学習を説明する図である。

【図１７】本発明の実施例３におけるデータベースシス
テムを示すブロック図である。

【図１８】本発明の実施例３におけるデータベースシス
テムの検索結果出力を得る際の動作を説明する図であ
る。

【図１９】本発明の実施例３におけるデータベースシス
テムの相関性学習の動作を説明する図である。

【符号の説明】

６０第一の学習部（学習手段）７０第一の特徴抽出部（検索評価手段）８０第二の特徴抽出部（追加度抽出手段，追加手段）９０文献クラスタ記憶部（分類部，情報分類部）１００検索キーワードクラスタ記憶部（分類部，検索
キーワード分類部，追加度抽出手段）１１０第二の学習部（学習手段）１２０検索評価部（検索評価手段）

Claims

【特許請求の範囲】

【請求項１】入力された検索キーワードを基に情報を
検索するデータベースシステムにおいて、前記情報を分
類される複数の分類部と、前記分類部とキーワードとの
間に関連度を割り当ておき、前記情報から得られる情報
キーワードを入力すると、入力した情報キーワードと高
い関連度を割り当てられた分類部を求め、この分類部に
前記情報キーワードの抽出元の情報を分類するととも
に、検索キーワードを入力すると、入力した検索キーワ
ードと高い関連度を割り当てられた分類部を求め、この
分類部に分類されている情報を検索結果として出力する
検索評価手段とを備えたことを特徴とするデータベース
システム。
【請求項２】前記検索評価手段は、入力した情報キー
ワードに対して高い関連度の分類部を見出せなければ、
前記分類部の中からどのキーワードにも関連度を割り当
てられていないものを選び、選んだ分類部と前記情報キ
ーワードとに高い関連度を割り当てると共に、他のキー
ワードと選んだ分類部とに所定の関連度を割り当て、選
んだ分類部に前記情報キーワードの抽出元の情報を分類
することを特徴とする請求項１記載のデータベースシス
テム。
【請求項３】前記検索評価手段は、入力した情報キー
ワードに対して高い関連度の分類部を見出し、前記情報
キーワードが複数のキーワードからなるキーワード群で
あるならば、このキーワード群の各キーワードと前記の
見出した分類部との間の関連度を強化することを特徴と
する請求項１記載のデータベースシステム。
【請求項４】入力された検索キーワードを基に情報を
検索するデータベースシステムにおいて、複数の分類部
と各キーワードとの間に関連度を割り当てておき、検索
キーワードを入力すると、入力した検索キーワードに対
する分類部の関連度を求め、求めた関連度を分類部の追
加度とする追加度抽出手段と、前記分類部に関連度を割
り当てられたキーワードを、キーワードの分類部に対す
る関連度と、この分類部に割り当てられた前記追加度と
に応じた比率で、前記検索キーワードに追加する追加手
段と、前記追加手段からのキーワードの追加されたキー
ワード情報を基にして前記情報を検索する検索評価手段
とを備えたことを特徴とするデータベースシステム。
【請求項５】前記追加度抽出手段は、入力した検索キ
ーワードに対する前記分類部の関連度を求めた結果、高
い関連度の分類部を見出せなければ、前記分類部の中か
らどのキーワードにも関連度を割り当てられていないも
のを選び、選んだ分類部と前記検索キーワードとに高い
関連度を割り当てると共に、他のキーワードと選んだ分
類部とに所定の関連度を割り当てることを特徴とする請
求項４記載のデータベースシステム。
【請求項６】前記追加度抽出手段は、入力した検索キ
ーワードに対する前記分類部の関連度を求めた結果、高
い関連度の分類部を見出し、前記検索キーワードが複数
のキーワードからなるキーワード群であるならば、この
キーワード群の各キーワードと前記の見出した分類部と
の間の関連度を強化することを特徴とする請求項４記載
のデータベースシステム。
【請求項７】入力された検索キーワードを基に情報を
検索するデータベースシステムにおいて、検索キーワー
ドと情報キーワードとの間に関連度を割り当てておき、
検索キーワードが入力されると、前記関連度を基にし
て、入力された検索キーワードと関連度の高い情報キー
ワードを求めるとともに、検索した情報に対する検索の
適合性の評価を受けると、検索した情報から得られる情
報キーワードと、検索した情報の検索に用いた検索キー
ワードとの間の関連度を前記評価に応じて変化させる学
習手段と、前記学習手段で求めた情報キーワードと関係
の深い幾つかの情報キーワードを持つ情報を検索結果と
して出力する検索評価手段とを備えたことを特徴とする
データベースシステム。
【請求項８】入力された検索キーワードを基に情報を
検索するデータベースシステムにおいて、前記情報を所
定の規則で分類される複数の情報分類部と、検索キーワ
ードを所定の規則で分類される複数の検索キーワード分
類部と、前記情報分類部と前記検索キーワード分類部と
の間に関連度を割り当てておき、検索キーワードが前記
検索キーワード分類部に分類されると、前記関連度を基
に、分類された検索キーワード分類部と関連度の高い情
報分類部を求め、求めた情報分類部に分類されている情
報を検索結果として出力するとともに、検索した情報に
対する検索の適合性の評価を受けると、検索した情報が
分類された情報分類部と、検索した情報の検索に用いた
検索キーワードが分類された検索キーワード分類部との
間の関連度を、前記評価に応じて変化させる学習手段と
を備えたことを特徴とするデータベースシステム。