JP3593750B2 - 情報検索装置 - Google Patents

情報検索装置 Download PDF

Info

Publication number
JP3593750B2
JP3593750B2 JP18539395A JP18539395A JP3593750B2 JP 3593750 B2 JP3593750 B2 JP 3593750B2 JP 18539395 A JP18539395 A JP 18539395A JP 18539395 A JP18539395 A JP 18539395A JP 3593750 B2 JP3593750 B2 JP 3593750B2
Authority
JP
Japan
Prior art keywords
data
reference source
referenced
source data
relationship
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP18539395A
Other languages
English (en)
Other versions
JPH0934774A (ja
Inventor
裕之 金子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP18539395A priority Critical patent/JP3593750B2/ja
Publication of JPH0934774A publication Critical patent/JPH0934774A/ja
Application granted granted Critical
Publication of JP3593750B2 publication Critical patent/JP3593750B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、記憶されている複数のデータの中から所望のデータを検索する情報検索装置に係わり、特にデータ間の関連の強さを表わした関係強度を基にして検索を進める情報検索装置に関する。
【0002】
【従来の技術】
コンピュータやワークステーションなどの情報処理装置では、大量のデータや情報を効率良く管理するために、これらをデータベース化して記憶することが多い。データベースには、データの構造を階層型、すなわち木構造で表現したものがある。木構造の各ノードは、相互に関連性の強いデータ項目の集まりを1つの単位として構成されている。またノードとその下位のノードの間には親と子の関係がある。1つの親ノードは複数の子ノードを持つことができるが、逆に子ノードは複数の親ノードを持つことができない。このような木構造のデータベースでは、データを適切に区分けし、これを階層構造化する作業や、ノードの追加変更が難しい。また通常、データベースでは、キーワードを予め登録しておきこれを基にしてデータの検索が行われる。検索する際にはアンド条件やオア条件によって複数のキーワードの組み合わせを設定し、目的とするデータを検索するようになっている。しかしながら、検索すべきデータについて適切なキーワードを設定できないときは、検索を効率良く進めることができない。
【0003】
そこで、近年、ハイパーテキストと呼ばれるデータ同士の関連性を基にして目的とするデータの検索を行うデータベースが注目されている。ハイパーテキストは、いわゆる網型のデータベースである。網型のデータべースは、木構造と同様に一般的には親・子の関係で階層化されるが、1つの子ノードが複数の親ノードをもつことが出来る点が相違している。従ってノードとノード間のリンクを網目状に構成することができる。ハイパーテキストでは、ユーザが理解可能な小さい単位にデータが細分化される。細分化された個々のデータはボックスと呼ばれている。また、ハイパーテキストでは、ボックスとボックスの間のリンク状態を個別に管理している。また、ボックスとボックスの間の関連性の強さの度合いを管理している。
【0004】
ハイパーテキストでは1つのボックスを出発点とし、これにリンクされているボックスを順次参照して行くことで、適切なキーワードを知らなくても目的とする情報を検索できるようになっている。以後、参照元になるボックスを参照元データと呼び、参照元データから参照されるボックスを被参照データと呼ぶことにする。このような情報検索装置については特開平5−313986号公報に開示されている。
【0005】
図8は、従来から使用されているハイパーテキストで管理されるデータのリンク状態の一例を表わしたものである。この例では、会社案内用の情報がデータベース化されて管理されている。情報は、ユーザによって識別可能な単位に区分されている。ここでは、会社案内用の情報が、業種別、会社別、会社毎の製品別に区分けされている。図中の各長方形が情報を区分した後のボックスを表わしている。
【0006】
業種のボックスとしてはプリンタ会社のボックス101とコピー会社のボックス102とがある。プリンタ会社のボックス101を参照元データとしたときこれにリンクされている被参照データとしてA社、X社、C社のボックス103〜105がある。また、コピー会社のボックス102を参照元データとしたときこれにリンクされている被参照データとしてX社、C社、D社のボックス104〜106がある。さらに、X社を参照元データとしたときこれにリンクされている被参照データとして、ファクシミリ、プリンタ、コピーマシンのボックス107〜109がある。網状にリンクされたデータベースでは、このように上位のボックスが複数の下位のボックスを参照することができるとともに、下位のボックスも複数の上位のボックスから参照され得る。
【0007】
図9は、ボックス間の関連性を管理するための情報を登録するデータ関係テーブルを表わしたものである。この図は、X社のボックスが参照元である場合のデータ関係テーブルを表わしている。データ関係テーブルは参照元データと被参照データの1対1の組み合わせについてそれぞれ個別に用意される。X社から参照されるボックスは、図8に示すように、ファクシミリ、プリンタ、コピーマシンの3つがある。したがって、X社を参照元データとしたときのデータ関係テーブルは被参照データである製品別に3つ作成される。データ関係テーブル111〜113には参照元がどのボックスであるかを識別するための参照元データ識別子114と、参照先がどのボックスであるかを識別するための被参照データ識別子115が登録されている。また参照元データから被参照データを参照する頻度の高さ、すなわちこれらのボックス間の関連性の強さを表わした関係強度116と、被参照データが選択されて読み出された回数を表わした関係読出回数117が登録されている。
【0008】
図10は、ハイパーテキストによってデータを管理している情報検索装置の構成の概要を表わしたものである。この情報検索装置は、各種制御の中枢的な働きをする主制御部121を備えている。主制御部121は、図示しないCPU(中央処理装置)およびCPUの行う処理手順を記述したプログラムや各種固定的データを記憶するこれまた図示しないROM(リード・オンリ・メモリ)を備えている。また、プログラムを実行する上で一時的に必要となる各種データを記憶する図示しないRAM(ランダム・アクセス・メモリ)を有している。主記憶部122は、検索の対象となる各種データの検索を実行する際に一時的に記憶するメモリである。
【0009】
データ記憶部123は、検索の対象となる各種データを保存用として記憶する部分である。ここではデータ記憶部123として磁気ディスク装置を用いている。データ関係記憶部124は、図9に示したデータ関係テーブルを記憶するメモリである。関係強度更新部125は、データ関係テーブルに登録されている関係強度および関係読出回数の更新を行う回路部分である。検索処理部126は、データ関係記憶部124に記憶されているデータ関係テーブルを基にして、関係強度が所定の値よりも大きい被参照データ、すなわち参照元のデータに対して関連性の高い被参照データを検索する部分である。入力出力部127は、オペレータからの各種指示を入力する機能と、検索結果や各種の情報を表示する機能を有しており、図示しないキーボード、マウスおよびディスプレイを備えている。
【0010】
図11は、従来から用いられている情報検索装置がデータを検索する際に行う処理の流れを表わしたものである。ここでは、図8に示した、会社案内用の情報を検索するものとする。また現在の参照元データがX社のボックスであり、X社に対応付けられた被参照データの中から、関連性の強いものを検索するものとする。検索に先立って、操作者は、被参照データを選択する基準として関連強度と比較する閾値を入力出力部127から入力する。データ関係テーブルに登録さている関係強度がこの閾値よりも大きい被参照データが参照すべきデータとして選択される。現在の参照元データを表わす識別子は、主制御部121のRAMに記憶されている。
【0011】
検索処理部126は、参照元データ識別子が現在の参照元データの識別子と等しいデータ関係テーブルをデータ関係記憶部124から1つ検索して読み出す(ステップS101)。読み出したデータ関係テーブルに登録されている関係強度とオペレータにより指定された閾値とを比較する(ステップS102)。関係強度が閾値と等しいか、あるいは閾値よりも大きいとき(ステップS102;Y)、そのデータ関係テーブルに登録されている関係読出回数を“1”だけ増加させる(ステップS103)。データ関係テーブルの被参照データ識別子の示すボックスは、参照元であるX社と関連性が高いのでこれを後に表示することになる。このため、データ関係テーブルの被参照データ識別子を主記憶部122の所定の領域に記憶する(ステップS104)。データ関係テーブルから読み出した関係強度が閾値よりも小さい場合には(ステップS102;N)、関連性の低いデータなので他のデータ関係テーブルの検索に処理を進める。
【0012】
データ関係記憶部124に記憶されている中で、参照元データ識別子がX社のボックスの識別子と一致する全てのデータ関係テーブルの読み出しが終了していないときは(ステップS105;N)、ステップS101に戻り、次のデータ関係テーブルの読み出しを行う。参照元データ識別子がX社のボックスの識別子と一致する全てのデータ関係テーブルの読み出しが終了しているときは(ステップS105;Y)、主記憶部122の所定の領域に記憶しておいた被参照データ識別子を読み出す(ステップS106)。そして、これらに対応するボックスのデータをディスプレイに表示する。
【0013】
関係強度更新部125は、一定時間ごとにデータ関係テーブルに登録されている関係読出回数を読み出した後、これを“0”に初期化する。関係読出回数は、一定時間内にその被参照データが読み出された回数を表わしているので、これが所定値以上の場合には、関係強度を強化、すなわち増加させる。また関係読出回数が所定値以下の場合には関係強度を減少させて弱化させる。これにより検索を行えば行う程、関係強度の値が被参照データの読み出される頻度に応じた値に補正される。
【0014】
【発明が解決しようとする課題】
このように参照元データから読み出された回数を基にして関係強度の更新を周期的に行えば、関係強度は被参照データの読み出される頻度に応じた大きさになるので、目的とするデータを的確に検索できるようになる。しかしながら、参照元データにリンクされている複数の被参照データを読み出す回数が平均的に分散した場合には、各被参照データの関係強度の差が小さくなる。このため関係強度の大きさと閾値を比較しても適切なデータを選択することができなくなり、検索結果の満足度が低下するという問題がある。
【0015】
そこで本発明の目的は、被参照データの読み出し回数が、平均的に分散したような場合であっても、目的とするデータを的確に検索することのできる情報検索装置を提供することにある。
【0016】
【課題を解決するための手段】
請求項1記載の発明では、1つのデータが他の2以上のデータから参照され得る網状にリンクされた検索の対象になる複数のデータについて参照元になる参照元データとこれから参照される1または2以上の被参照データとの間の対応付けを記憶した参照関係記憶手段と、参照元データとこれから参照される被参照データとの間の関連性の強さを表わした関係強度を参照関係記憶手段にその対応付けの記憶されている参照元データと被参照データの1対1の組み合わせのそれぞれについてその参照元データを被参照データとして位置付けている上位の参照元データである前参照元データ別に記憶した関係強度記憶手段と、被参照データを参照する際の参照元データがこれを被参照データとして位置付けている前参照元データの中の何れから参照されたかを表わす前参照元識別情報を記憶するための前参照元情報記憶手段と、任意の参照元データからこれに対応付けられている被参照データを参照するとき関係強度記憶手段に記憶されているその参照元データとこれに対応付けられている被参照データとの間の関係強度のうち前参照元識別情報記憶手段に記憶されている前参照元識別情報の示す前参照元データに対応する関係強度を基にして被参照データの選択を行う被参照データ選択手段と、この被参照データ選択手段によって被参照データが選択されたとき前参照元識別情報記憶手段に記憶されている前参照元識別情報の値を被参照データを選択したときの参照元データを表わす値に更新する前参照元識別情報更新手段とを情報検索装置に具備させている。
【0017】
すなわち請求項1記載の発明では、参照元データと被参照データとの間の関係強度を、参照元データを被参照データとして位置付けている上位の参照元データ別に用意している。そして、現在の参照元データにその上位の参照元データのいずれから到達したかによって、被参照データを選択する際に用いる関係強度を変えている。網型にリンクされたデータベースでは、参照元のデータに到達する経路が2以上存在することがある。
【0018】
たとえば、図8に示したX社のボックスには、プリンタ会社のボックスとコピー会社のボックスのいずれからでも到達することができる。X社の被参照データであるファクシミリ、プリンタ、コピーマシンが参照される回数が互いにほぼ同じ場合であっても、プリンタ会社のボックスからX社に到達したときと、コピー会社からX社に到達したときに分類すれば、読出回数に差が生じることがある。すなわち、プリンタ会社のボックスからX社を選んだオペレータは、X社の被参照データの中でプリンタのボックスを選ぶ頻度が高く、コピー会社のボックスからX社のボックスに到達した者は、コピーマシンのボックスを参照する可能性が高い。そこで、参照元データに到達した経路別に関係強度を設けることで、オペレータの検索意図に沿った被参照データをより的確に選択することができる。
【0019】
請求項2記載の発明では、1つのデータが他の2以上のデータから参照され得る網状にリンクされた検索の対象となる複数のデータについて参照元になる参照元データとこれから参照される1または2以上の被参照データとの間の対応付けを記憶した参照関係記憶手段と、参照元データとこれから参照される被参照データとの間の関連性の強さを表わした関係強度を参照関係記憶手段にその対応付けの記憶されている参照元データと被参照データの1対1の組み合わせのそれぞれについてその参照元データを被参照データとして位置付けている上位の参照元データである前参照元データ別に記憶した関係強度記憶手段と、参照元データから被参照データが参照された回数を表わした関係読出回数を参照関係記憶手段にその対応付けの記憶されている参照元データと被参照データの1対1の組み合わせのそれぞれについてその参照元データを被参照データとして位置付けている前参照元データ別に記憶した関係読出回数記憶手段と、被参照データを参照する際の参照元データがこれを被参照データとして位置付けている前参照元データの中の何れから参照されたかを表わす前参照元識別情報を記憶するための前参照元情報記憶手段と、任意の参照元データからこれに対応付けられている被参照データを参照するとき関係強度記憶手段に記憶されているその参照元データとこれに対応付けられている被参照データとの間の関係強度のうち前参照元識別情報記憶手段に記憶されている前参照元識別情報の示す前参照元データに対応する関係強度を基にして被参照データの選択を行う被参照データ選択手段と、この被参照データ選択手段によって被参照データが選択されたときその参照元データと選択された被参照データの組み合わせに対して割り当てられている関係読出回数のうち前参照元識別情報記憶手段に記憶されている前参照元識別情報の示す前参照元データに対応する関係読出回数を増加させる関係読出回数増加手段と、被参照データ選択手段によって被参照データが選択されたとき前参照元識別情報記憶手段に記憶されている前参照元識別情報の値を被参照データを選択したときの参照元データを表わす値に更新する前参照元識別情報更新手段と、関係強度の対応付けられている前参照元データ、参照元データおよび被参照データと同一の前参照元データ、参照元データおよび被参照データに対応つけられている関係読出回数の値を基にして各関係強度を強化あるいは弱化する関係強度更新手段とを情報検索装置に具備させている。
【0020】
すなわち請求項2記載の発明では、被参照データの読み出された回数をその参照元データに到達した経路別に登録している。そして、この回数を基にして、対応する関係強度の強化あるいは弱化を行っている。このため、参照元データに到達する経路別に設けられた関係強度の値を適切に更新することができる。
【0021】
請求項3記載の発明では、1つのデータが他の2以上のデータから参照され得る網状にリンクされた検索の対象となる複数のデータについて参照元になる参照元データとこれから参照される1または2以上の被参照データとの間の対応付けを記憶した参照関係記憶手段と、参照元データとこれから参照される被参照データとの間の関連性の強さを表わした関係強度を参照関係記憶手段にその対応付けの記憶されている参照元データと被参照データの1対1の組み合わせのそれぞれについてその参照元データを被参照データとして位置付けている上位の参照元データである前参照元データ別に記憶するための関係強度記憶手段と、被参照データを参照する際の参照元データがこれを被参照データとして位置付けている前参照元データの中の何れから参照されたかを表わす前参照元識別情報を記憶するための前参照元情報記憶手段と、任意の参照元データからこれに対応付けられている被参照データを参照するときその参照元データとこれに対応付けられている被参照データとの間の関係強度として前参照元情報記憶手段に記憶されている前参照元識別情報の示す前参照元データに対応する関係強度が関係強度記憶手段に記憶されていないとき、所定の初期値をその関係強度として登録する初期関係強度登録手段と、この初期関係強度登録手段によって初期値が登録されたときはその値を基にして被参照データの選択を行い、任意の参照元データからこれに対応付けられている被参照データを参照したときその参照元データとこれに対応付けられている被参照データとの間の関係強度として前参照元情報記憶手段に記憶されている前参照元識別情報の示す前参照元データに対応する関係強度が関係強度記憶手段に記憶されているときはその関係強度を基にして被参照データの選択を行う被参照データ選択手段と、この被参照データ選択手段によって被参照データが選択されたとき前参照元識別情報記憶手段に記憶されている前参照元識別情報の値を被参照データを選択したときの参照元データを表わす値に更新する前参照元識別情報更新手段とを情報検索装置に具備させている。
【0022】
すなわち請求項3記載の発明では、参照元データから被参照元データの選択を行うときにその参照元データに到達した経路に対応した関係強度が登録されていない場合に所定の初期値を関係強度記憶手段に登録している。参照元データと被参照元データとの間に新たなリンクを設定したときに、その被参照元データの下位の被参照データについて関係強度の登録を行う必要がないので、リンクの設定変更を容易に行うことができる。
【0023】
【発明の実施の形態】
以下実施例につき本発明を詳細に説明する。
【0024】
図1は、本発明の一実施例における情報検索装置の構成の概要を表わしたものである。情報検索装置は、各種データ処理の中枢的機能を果たすCPU(中央処理装置)11を備えている。CPU11には、データバスなどのバス12を通じて各種回路装置が接続されている。このうち、ROM(リード・オンリ・メモリ)13は、データ処理の手順を表わしたプログラムや各種固定的なデータを格納する読み出し専用メモリである。RAM(ランダム・アクセス・メモリ)14は、プログラムを実行する上で必要になるデータを一時的に格納するメモリである。磁気ディスク装置15は、検索の対象となるデータを保存するための記憶装置である。表示部16は、検索したデータのほか各種データの表示を行う。ここでは表示部16としてCRTディスプレイを用いている。キーボード17、およびマウス18は、オペレータの指示を入力するための入力装置である。
【0025】
図2は、図1に示した情報検索装置の構成を機能的に表わしたものである。情報検索装置は、各種制御の中枢的な働きをする主制御部21を備えている。主記憶部22は、検索の対象となる各種データを磁気ディスク装置から読み出した後一時的に記憶するためのメモリである。データ記憶部23は、検索の対象となる各種データを保存用として記憶する部分である。データ関係記憶部24は、データ間の関連の有無およびその強度などを表わしたデータ関係テーブルを記憶するメモリである。関係強度更新部25は、データ関係テーブルに登録されている関係強度および関係読出回数の更新を行う回路部分である。検索処理部26は、データ関係記憶部24に記憶されているデータ関係テーブルを基にして参照元のデータに関連性の高いデータを検索する部分である。入力出力部27は、入力装置としてキーボードとマウスを、出力装置としてディスプレイを備えている。
【0026】
初期関係強度付与部28は、データ関係テーブルに新たな項目を追加する回路部分である。参照履歴保持部29は、1つの被参照データを選択してこれを新たな参照元データとして検索を進める際に、この新たな参照元データがその上位に配置されている中のどの参照元データから参照されたかを示す情報を保持する部分である。
【0027】
図3は、情報検索装置で検索の対象となるデータのリンク状態の一例を表わしたものである。これは会社案内用の情報であり、業種別、会社別、会社毎の製品別に区分けされている。業種には、プリンタ会社とコピー会社がありそれぞれに対応するボックス31、32が設けられている。プリンタ会社としては、A社33、X社34、C社35が存在し、コピー会社としてはX社34、C社35、D社36がある。X社34とC社35は、プリンタ会社であると同時にコピー会社でもある。図では、製品別のボックスはX社についてだけ示してあり、A社、C社、D社の製品別のボックスの記載は省略してある。X社の製品には、ファクシミリ、プリンタ、コピーマシンがあり、それぞれ対応するボックス37〜39が設けられている。
【0028】
これらのボックスは、実線で示した矢印の向きに関連性が存在し、これに従って図中の上から下に向かって検索を進めることができる。関連性を基にして選択される側のボックスを被参照データと呼び、選択する元になるボックスを参照元データと呼ぶことにする。たとえば、プリンタ会社のボックス31を基にして会社を選択する場合には、プリンタ会社のボックス31が参照元データになる。そしてA社33、X社34、C社35のボックスが被参照データになる。これらのボックスには互いを識別するための識別子が与えられいる。会社案内用の情報は、ボックス単位に区分されて、データ記憶部23に格納されている。情報検索装置は、図3の実線で表わしたデータ間のつながりを記憶するために、それぞれの矢印ごとにデータ関係テーブルと呼ばれるデータ間の関連を示す情報を記憶している。データ関係テーブルを基にして、関連性のあるデータを順次検索し、目的とするデータが見い出されるようになっている。
【0029】
図4は、データ関係テーブルの登録内容の一例を表わしたものである。これは図3に示したX社のボックスを参照元データとしたときのデータ関係テーブルを表わしている。1つのデータ関係テーブルは、参照元データと被参照データの関係を1対1で表わしている。このため、X社を参照元とした場合には、ファクシミリとプリンタとコピーマシンのそれぞれについてデータ関係テーブル41、42、43が作成される。データ関係テーブル41〜43のデータ構造は同一であるので、ここではデータ関係テーブル41について説明し、他については適宜その説明を省略する。
【0030】
データ関係テーブル41には、参照元データを示すための参照元データ識別子44と被参照データを示す被参照データ識別子45が登録されている。このエリアには、該当するボックスに割り当てられている識別子が登録される。実際には識別子として識別番号が用いられるが、図では説明の便宜上各ボックスの内容を識別子として表示してある。たとえば、データ関係テーブル41は、図3の矢印61に対応する関係を表わしており、参照元データ識別子としてX社が、被参照データ識別子としてファクシミリが登録されている。
【0031】
データ関係テーブルには、参照元データとの関連の強さを表わす関係強度と被参照データが参照された回数を示す関係読出回数が登録されている。そしてこれらは、参照元データ識別子の示すボックスを被参照データとして位置付けているボックス別に用意されている。参照元データ識別子の示すボックスを被参照データとして位置付けているボックスを前参照元データと呼ぶことにする。たとえば、データ関係テーブル41は、図3に示したX社が参照元データであるので、プリンタ会社のボックス31とコピー会社のボックス32がそれぞれ前参照元データになる。
【0032】
データ関係テーブルには、前参照元データを識別するための前参照元データ識別子46が登録されている。また、この前参照元データと被参照データとの関連の強さを表わした関係強度47と、被参照データの読み出された回数を示す関係読出回数48が登録されている。テータ関係テーブル41には1個の前参照元データに対して、前参照元データ識別子46と関係強度47および関係読出回数48の項目が組になって登録される。これを前参照元別関係項目と呼ぶことにする。データ関係テーブル41には、前参照元データがプリンタ会社の場合の前参照元別関係項目51と、前参照元データがコピー会社の場合の前参照元別関係項目52が登録されている。
【0033】
前参照元別関係項目51における関係強度47は、プリンタ会社のボックス31からX社に到達した場合におけるX社とファクシミリとの関連性の強さを表わしている。また、前参照元別関係項目51における関係読出回数48はプリンタ会社のボックス31からX社に到達した後ファクシミリのボックス37が参照された回数を表わしている。同様に、前参照元別関係項目52の関係強度47および関係読出回数48は、コピー会社のボックスからX社に到達した場合における関係強度および読出回数をそれぞれ表わしている。また、前参照元別関係項目を新たに追加する際に、関係強度としてすべき初期値である初期関係強度53が登録されている。
【0034】
それでは、図4に示したデータ関係テーブルを用いて情報検索装置が目的とするデータを検索する際に行う処理の流れについて説明する。
【0035】
図5は、情報検索装置が行う検索処理の流れを表わしたものである。ここでは、図3に示した会社案内用の情報を検索する場合を例に説明する。また、現在の参照元データはX社のボックス34であり、ファクシミリ、プリンタ、コピーマシンの被参照データの中から参照すべきデータを選択するものとする。X社を参照元とした場合のデータ関係テーブルは、図4に示したものと同一である。また、X社のボックスに到来したときの前参照元データは、プリンタ会社であるものとする。この場合、図2に示した参照履歴保持部29は前参照元データがプリンタ会社であることを記憶している。データの関連性の強さによって参照すべきデータを選択するときの基準となる閾値は、オペレータによりキーボードあるいはマウスにより入力されているものとする。
【0036】
X社のボックスを参照元データとして次に参照するデータを選択する指示がキーボードあるいはマウスから入力されると、CPU11は、データ関係記憶部24に記憶されているデータ関係テーブルの中から参照元データ識別子としてX社が登録されているものを1つ検索して読み出す(ステップS201)。次に、CPU11は、参照履歴保持部が保持している前参照データ識別子と同一の前参照元データ識別子が読み出したデータ関係デーブルに登録されているかどうかを調べる(ステップS202)。一致する前参照元データ識別子が登録されているときは(ステップS202;Y)、該当する前参照元データについての関係強度を読み出す(ステップS203)。一致する前参照元データ識別子が登録されていない場合については後に説明する。
【0037】
ステップS201で、たとえば、図4に示したデータ関係テーブル41を読み出したとすると、関係強度として“10”が読み出される。CPU11は読み出した関係強度と予め入力されている閾値とを比較する。関係強度が閾値と等しいか、あるいは関係強度が閾値よりも大きい場合には(ステップS204;Y)、このデータ関係テーブルに登録さている被参照データ識別子の値をRAM14の所定のエリアに記憶する(ステップS205)。たとえば、オペレータによって入力された閾値が“40”であるとすると、データ関係テーブル41の被参照データ識別子である“ファクシミリ”は、RAM14に記憶されない。
【0038】
次にCPU11は参照元データ識別子としてX社の登録されている他のデータ関係テーブルが存在するか否かを調べる(ステップS206)。図4に示したようにX社が参照元データであるデータ関係テーブルは3つ存在する。これら全てについて読み出しが行われていないときは(ステップS206;N)、ステップS201に戻り、それぞれのデータ関係テーブルについて関係強度を調べる処理を行う。前参照元データは、プリンタ会社であるので、被参照データがプリンタであるデータ関係テーブル42の場合には、関係強度として“80”が閾値と比較される。被参照データがコピーマシンであるデータ関係テーブル43の場合には、関係強度として“20”が閾値と比較される。したがって、RAM14の所定のエリアには、関係強度が“80”であるデータ関係テーブル42の被参照データ識別子、“プリンタ”が登録される。
【0039】
参照元データがX社である全てのデータ関係テーブルについての処理が終了している場合には(ステップS206;Y)、RAM14に格納しておいた被参照データ識別子に対応するデータを表示部16のCRTディスプレイに表示する(ステップS207)。この表示を基に、オペレータは自己の目的とするデータをマウスによって指定する(ステップS208)。これにより、X社から参照できる3つの被参照データの中で、オペレータの望むデータが選択されたことになる。そこで、CPU11は、選択された被参照データに対応するデータ関係テーブルの、該当する前参照データに対応付けられている関係読出回数の値を1だけ増加させる(ステップS209)。ここでは、被参照データがプリンタであり、前参照元データ識別子がプリンタ会社であるので、データ関係テーブル42の欄54に登録されている関係読出回数を“15”から“16”に変更する。
【0040】
次の段階でデータを参照するときには、プリンタのボックス38が参照元データになる。そして、X社のボックス34が前参照元データになる。このため、CPU11は参照履歴保持部29の保持する前参照元データ識別子の値をX社の識別子に変更する(ステップS210)。最後にCPU11は、選択されたボックスであるプリンタについての情報をディスプレイに表示(ステップS211)して、処理を終了する。図3には示していないが、プリンタのボックス38に関連するデータを更に参照したい旨の指示が入力されたときは、プリンタのボックスを参照元データに、X社を前参照元データとして図5に示した流れで検索が行われることになる。
【0041】
図5の流れ図には示していないが、CPU11は、一定時間ごとに、関係読出回数を調べ、これが一定値以上の場合には、対応する関係強度の値を大きくして強化する。逆に、関係読出回数が一定値以下の場合には、対応する関係強度の値を小さくし弱化する。そして、関係読出回数を調べた後、これを“0”に初期化する。このように一定時間ごとの読み出し回数に応じて関係強度を変更することで、参照元データと被参照データの関連性の強さが読み出しの頻度に応じた適切な値になる。
【0042】
プリンタ会社の次にX社を選択してデータの検索を進めるオペレータは、X社の製品の中でプリンタについての情報に関心がある確率が高い。しかし、コピー会社の次にX社を選択したオペレータは、X社の製品の中でコピーマシンについて関心をもっている場合が多い。従って図3の点線、あるいは一点破線で示した順路で検索が進められる確率が高い。すなわち、X社とその製品の関連性の高さは、X社に到達した経路によって異なる。
【0043】
図4に示すように、被参照データがプリンタのデータ関係テーブル42の場合には、前参照元データがプリンタ会社の場合の関係強度は“80”と大きく、前参照元がコピー会社の場合の関係強度は“30”と比較的小さい。逆に、被参照データがコピーマシンのデータ関係テーブル43では、前参照元データがプリンタ会社の場合は関係強度が“20”と小さく、前参照元データがコピー会社の場合には関係強度が“90”と大きくなっている。このように、X社に到達した経路別に関係強度を分けて管理したので、オペレータの目的に合致したデータをより的確に検索することができる。さらに、前参照元データ別に用意された関係強度が関係読出回数を基にして一定時間ごとに更新されるので、検索される回数が増えるに従ってX社に到達した経路に応じた適切な関係強度を得ることができる。
【0044】
次に、図5のステップS202で前参照元データの項目がデータ関係テーブルに登録されていない場合について説明する。
【0045】
図6は、業種にファクシミリ会社を追加したときの会社案内情報におけるデータのリンク状態を表わしたものである。業種の階層に追加されたファクシミリ会社のボックス71は、点線72で示すようにX社との間にリンクが設定されている。いま、ファクシミリ会社からこのリンクをもとにX社が初めて参照されたものとする。このときX社が参照元データになり、ファクシミリ会社71が前参照元データになる。参照履歴保持部は、ファクシミリ会社のボックス71に割り当てられている識別子を保持している。また、X社を参照元データとするデータ関係テーブルは図4に示す状態になっているものとする。
【0046】
図5のステップS201で、図4に示したデータ関係テーブル41を読み込み、CPU11は、前参照元データ識別子としてファクシミリ会社が登録されているがどうかを調べる(ステップS202)。ファクシミリ会社からX社に到達したのは初めてであり未だデータ関係テーブルには前参照元データがファクシミリ会社の項目はないので(ステップS202;N)、CPU11は、データ関係テーブルにこの項目を追加する処理を行う(ステップS212)。
【0047】
図7は、前参照元データとしてファクシミリ会社が追加された状態のデータ関係テーブルを表わしたものである。図4と同一の部分には同一の符号を付してある。データ関係テーブル41のうち前参照元別関係項目81が追加された部分である。前参照元データ識別子82にはファクシミリ会社が、関係強度83には、初期関係強度53の値が複写されて格納される。関係読出回数84は、初期値として“0”がセットされる。データ関係テーブル42、43についてもそれぞれ前参照元データ識別子がファクシミリ会社である前参照元別関係項目85、86がそれぞれ追加されている。
【0048】
図5に戻って説明を続ける。データ関係テーブルに新たな項目を追加した後、初期関係強度を読み出し(ステップS213)、この値と閾値とをステップS204で比較する。以後の処理は前参照元別関係項目を追加しない場合と同様である。以上の処理を図4に示したデータ関係テーブル42、43についても行うことで、図7に示した状態にテーブルが更新される。
【0049】
このように、新たに追加されたファクシミリ会社からX社が参照された時点で、X社を参照元とするデータ関係テーブルの更新が行われるので、ファクシミリ会社のボックスを追加した作業が複雑になることがない。すなわち、業種にファクシミリ会社のボックスを追加登録するときは、ファクシミリ会社を参照元データとするデータ関係テーブルを作成するだけでよい。
【0050】
以上説明した実施例では、関係強度の更新を行うようにしたが、初期設定時点から適切な値が設定できれば必ずしも関係強度を更新しなくてもよい。また、参照元データと被参照データを1対1に対応させて、それぞれ独立したデータ関係テーブルを備えているが、これらが独立に存在する必要はない。たとえば、1つの参照元データから参照されるすべての被参照データをまとめて1つのデータ関係テーブルを構成してもよい。
【0051】
【発明の効果】
このように請求項1記載の発明によれば、参照元データに到達した経路別に関係強度を設けたので、オペレータの検索意図に沿った被参照データを選択することができる。
【0052】
また請求項2記載の発明によれば、被参照データの読み出された回数をその参照元データに到達した経路別に登録し、これを基にして対応する関係強度の強化あるいは弱化を行ったので、各関係強度の値を適切に更新することができる。これにより、検索の行われる回数が増えるに従って、オペレータの検索意図に沿った被参照データを的確に検索することができる。
【0053】
さらに請求項3記載の発明によれば、参照元データから被参照元データの選択を行うときにその参照元データに到達した経路に対応した関係強度が登録されていない場合は対応する関係強度として関係強度記憶手段に所定の初期値を登録している。このため、オペレータの負担を増加させることなく網状のリンク構造の構築あるいは変更を行うことができる。
【図面の簡単な説明】
【図1】本発明の一実施例における情報検索装置の構成の概要を表わしたブロック図である。
【図2】図1に示した情報検索装置の構成を機能的に表わした説明図である。
【図3】情報検索装置で検索の対象となるデータのリンク状態の一例を表わした説明図である。
【図4】データ関係テーブルの登録内容の一例を表わした説明図である。
【図5】情報検索装置が行う検索処理の流れを表わした流れ図である。
【図6】業種にファクシミリ会社を追加したときの会社案内情報におけるデータのリンク状態を表わした説明図である。
【図7】ファクシミリ会社を追加したときのデータ関係テーブルの登録内容の一例を表わした説明図である。
【図8】従来から使用されているハイパーテキストで管理されるデータのリンク状態の一例を表わした説明図である。
【図9】従来から使用されている情報検索装置におけるデータ関係テーブルの登録内容の一例を表わした説明図である。
【図10】従来から使用されている情報検索装置の構成の概要を表わしたブロック図である。
【図11】従来から用いられている情報検索装置がデータを検索する際に行う処理の流れを表わした説明図である。
【符号の説明】
11…CPU、12…バス、13…ROM、14…RAM、15…磁気ディスク装置、16…表示部、17…キーボード、18…マウス、21…主制御部、22…主記憶部、23…データ記憶部、24…データ関係記憶部、25…関係強度更新部、26…検索処理部、27…入力出力部、28…初期関係強度付与部、29…参照履歴保持部、41〜43…データ関係テーブル、44…参照元データ識別子、45…被参照データ識別子、46…前参照元データ識別子、47…関係強度、48…関係読出回数、53…初期関係強度

Claims (3)

  1. 1つのデータが他の2以上のデータから参照され得る網状にリンクされた検索の対象になる複数のデータについて参照元になる参照元データとこれから参照される1または2以上の被参照データとの間の対応付けを記憶した参照関係記憶手段と、
    参照元データとこれから参照される被参照データとの間の関連性の強さを表わした関係強度を前記参照関係記憶手段にその対応付けの記憶されている参照元データと被参照データの1対1の組み合わせのそれぞれについてその参照元データを被参照データとして位置付けている上位の参照元データである前参照元データ別に記憶した関係強度記憶手段と、
    被参照データを参照する際の参照元データがこれを被参照データとして位置付けている前参照元データの中の何れから参照されたかを表わす前参照元識別情報を記憶するための前参照元情報記憶手段と、
    任意の参照元データからこれに対応付けられている被参照データを参照するとき前記関係強度記憶手段に記憶されているその参照元データとこれに対応付けられている被参照データとの間の関係強度のうち前記前参照元識別情報記憶手段に記憶されている前参照元識別情報の示す前参照元データに対応する関係強度を基にして被参照データの選択を行う被参照データ選択手段と、
    この被参照データ選択手段によって被参照データが選択されたとき前記前参照元識別情報記憶手段に記憶されている前参照元識別情報の値を被参照データを選択したときの参照元データを表わす値に更新する前参照元識別情報更新手段
    とを具備することを特徴とする情報検索装置。
  2. 1つのデータが他の2以上のデータから参照され得る網状にリンクされた検索の対象となる複数のデータについて参照元になる参照元データとこれから参照される1または2以上の被参照データとの間の対応付けを記憶した参照関係記憶手段と、
    参照元データとこれから参照される被参照データとの間の関連性の強さを表わした関係強度を前記参照関係記憶手段にその対応付けの記憶されている参照元データと被参照データの1対1の組み合わせのそれぞれについてその参照元データを被参照データとして位置付けている上位の参照元データである前参照元データ別に記憶した関係強度記憶手段と、
    参照元データから被参照データが参照された回数を表わした関係読出回数を前記参照関係記憶手段にその対応付けの記憶されている参照元データと被参照データの1対1の組み合わせのそれぞれについてその参照元データを被参照データとして位置付けている前参照元データ別に記憶した関係読出回数記憶手段と、
    被参照データを参照する際の参照元データがこれを被参照データとして位置付けている前参照元データの中の何れから参照されたかを表わす前参照元識別情報を記憶するための前参照元情報記憶手段と、
    任意の参照元データからこれに対応付けられている被参照データを参照するとき前記関係強度記憶手段に記憶されているその参照元データとこれに対応付けられている被参照データとの間の関係強度のうち前記前参照元識別情報記憶手段に記憶されている前参照元識別情報の示す前参照元データに対応する関係強度を基にして被参照データの選択を行う被参照データ選択手段と、
    この被参照データ選択手段によって被参照データが選択されたときその参照元データと選択された被参照データの組み合わせに対して割り当てられている関係読出回数のうち前記前参照元識別情報記憶手段に記憶されている前参照元識別情報の示す前参照元データに対応する関係読出回数を増加させる関係読出回数増加手段と、
    前記被参照データ選択手段によって被参照データが選択されたとき前記前参照元識別情報記憶手段に記憶されている前参照元識別情報の値を被参照データを選択したときの参照元データを表わす値に更新する前参照元識別情報更新手段と、
    関係強度の対応付けられている前参照元データ、参照元データおよび被参照データと同一の前参照元データ、参照元データおよび被参照データに対応つけられている関係読出回数の値を基にして各関係強度を強化あるいは弱化する関係強度更新手段
    とを具備することを特徴とする情報検索装置。
  3. 1つのデータが他の2以上のデータから参照され得る網状にリンクされた検索の対象となる複数のデータについて参照元になる参照元データとこれから参照される1または2以上の被参照データとの間の対応付けを記憶した参照関係記憶手段と、
    参照元データとこれから参照される被参照データとの間の関連性の強さを表わした関係強度を前記参照関係記憶手段にその対応付けの記憶されている参照元データと被参照データの1対1の組み合わせのそれぞれについてその参照元データを被参照データとして位置付けている上位の参照元データである前参照元データ別に記憶するための関係強度記憶手段と、
    被参照データを参照する際の参照元データがこれを被参照データとして位置付けている前参照元データの中の何れから参照されたかを表わす前参照元識別情報を記憶するための前参照元情報記憶手段と、
    任意の参照元データからこれに対応付けられている被参照データを参照するときその参照元データとこれに対応付けられている被参照データとの間の関係強度として前記前参照元情報記憶手段に記憶されている前参照元識別情報の示す前参照元データに対応する関係強度が前記関係強度記憶手段に記憶されていないとき、所定の初期値をその関係強度として登録する初期関係強度登録手段と、
    この初期関係強度登録手段によって初期値が登録されたときはその値を基にして被参照データの選択を行い、任意の参照元データからこれに対応付けられている被参照データを参照したときその参照元データとこれに対応付けられている被参照データとの間の関係強度として前記前参照元情報記憶手段に記憶されている前参照元識別情報の示す前参照元データに対応する関係強度が前記関係強度記憶手段に記憶されているときはその関係強度を基にして被参照データの選択を行う被参照データ選択手段と、
    この被参照データ選択手段によって被参照データが選択されたとき前記前参照元識別情報記憶手段に記憶されている前参照元識別情報の値を被参照データを選択したときの参照元データを表わす値に更新する前参照元識別情報更新手段
    とを具備することを特徴とする情報検索装置。
JP18539395A 1995-07-21 1995-07-21 情報検索装置 Expired - Fee Related JP3593750B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP18539395A JP3593750B2 (ja) 1995-07-21 1995-07-21 情報検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP18539395A JP3593750B2 (ja) 1995-07-21 1995-07-21 情報検索装置

Publications (2)

Publication Number Publication Date
JPH0934774A JPH0934774A (ja) 1997-02-07
JP3593750B2 true JP3593750B2 (ja) 2004-11-24

Family

ID=16170030

Family Applications (1)

Application Number Title Priority Date Filing Date
JP18539395A Expired - Fee Related JP3593750B2 (ja) 1995-07-21 1995-07-21 情報検索装置

Country Status (1)

Country Link
JP (1) JP3593750B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6751777B2 (en) * 1998-10-19 2004-06-15 International Business Machines Corporation Multi-target links for navigating between hypertext documents and the like

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01177673A (ja) * 1988-01-08 1989-07-13 Nec Corp 文書ファイル方式
JPH0567150A (ja) * 1991-09-06 1993-03-19 Fujitsu Ltd ハイパーメデイアシステムにおけるユーザの操作履歴を蓄積、再利用するプレゼンテーシヨン装置
JPH05313986A (ja) * 1992-05-06 1993-11-26 Nippon Telegr & Teleph Corp <Ntt> 情報リンク装置
JPH06110926A (ja) * 1992-09-29 1994-04-22 Oki Electric Ind Co Ltd 情報検索装置

Also Published As

Publication number Publication date
JPH0934774A (ja) 1997-02-07

Similar Documents

Publication Publication Date Title
JP4098539B2 (ja) プロファイル情報の推薦方法、プログラム及び装置
US6662189B2 (en) Method of performing data mining tasks for generating decision tree and apparatus therefor
US20040083218A1 (en) XML schema evolution
US20030097638A1 (en) Document management system, method thereof, and program thereof
KR20150070395A (ko) 프로그램 및 전자 메뉴얼 표시 장치
JP3593750B2 (ja) 情報検索装置
CN113011146A (zh) 信息处理装置、存储介质及信息处理方法
WO2022018899A1 (ja) Kpiツリーから部分ツリーを抽出するシステム
JP2004046650A (ja) データ管理方法およびデータベース構造
JP2939841B2 (ja) データベース検索装置
JPH03147181A (ja) オブジェクト参照処理装置
JPH0887509A (ja) 情報提示方法
JP3933407B2 (ja) 文書処理装置、文書処理方法および文書処理プログラムが格納された記憶媒体
US20040220901A1 (en) System and method for association itemset mining
JPH09251470A (ja) データベース検索方法及び装置
JPH03269629A (ja) 事例を用いた知識洗練処理方式
JP2008013262A (ja) トレーサビリティ支援装置及びそれに適用されるデータベース構造
JPH0581355A (ja) 設計手順支援装置
JPH0728834A (ja) 情報検索装置
JP2002304414A (ja) 情報検索装置
JP3824468B2 (ja) データ管理システム
JP2001022777A (ja) データ分析方法
JP5048396B2 (ja) データ管理プログラム
JPH0619693A (ja) 情報記憶装置
KR900018805A (ko) 설계수순의 지원장치 및 지원방법

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040810

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040823

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070910

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080910

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090910

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100910

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees