JP2001147936A - 文書検索システム、方法及び記録媒体 - Google Patents

文書検索システム、方法及び記録媒体

Info

Publication number
JP2001147936A
JP2001147936A JP33149999A JP33149999A JP2001147936A JP 2001147936 A JP2001147936 A JP 2001147936A JP 33149999 A JP33149999 A JP 33149999A JP 33149999 A JP33149999 A JP 33149999A JP 2001147936 A JP2001147936 A JP 2001147936A
Authority
JP
Japan
Prior art keywords
document
relation
cited
value
relationship
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP33149999A
Other languages
English (en)
Inventor
Koushi Yamanaka
航史 山中
Kiyoaki Yagi
清晃 八木
Hidekazu Komuro
英一 小室
Masatoshi Nishimura
正寿 西村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Data Group Corp
Original Assignee
NTT Data Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Data Corp filed Critical NTT Data Corp
Priority to JP33149999A priority Critical patent/JP2001147936A/ja
Publication of JP2001147936A publication Critical patent/JP2001147936A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 指定された文書と内容的に関連のある文書を
検索することができる文書検索システム等を提供する。 【解決手段】 関係抽出部13は、文書DB11に登録
されている各文書について、他文書との引用/被引用関
係を示す関係情報を生成する。関連値付与部15は、関
係情報に基づき、各文書について、引用/被引用関係に
ある他文書との関係の度合いを示す関連値を関係毎に付
与して、統計化データ記憶部16に記憶する。検索部1
9は、検索キーとなる文書の指定を受け付け、関係情報
が示す引用/被引用関係と各関係に付与された関連値を
参照して、引用/被引用関係と各関係に付与された関連
値が、指定された文書と近似する文書を検索して出力す
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、指定された文書と
関連性の高い文書を検索する文書検索システム等に関す
る。
【0002】
【従来の技術】従来の検索システムにおいて、ある文書
(検索元文書)と関連性の高い文書の情報を取得したい
場合、検索者がその文書と関連がある用語を検索キーワ
ードとして指定し、その検索キーワードを用いて、ディ
レクトリ検索、キーワード検索、全文検索等の種々の検
索方法により該当する文書の検索を行っていた。
【0003】
【発明が解決しようとする課題】しかし、上記の方法で
は、検索キーワードが含まれていれば、検索元文書と内
容的に関連がない文書であってもヒットしてしまう。ま
た、検索元文書と内容的に関連性がある文書でも、指定
した検索キーワードが含まれていなければ、ヒットしな
い。
【0004】これに対し、指定された文書と同じ文書を
参照している文書を、指定文書と関連のある文書と推定
して該当する文書を検索することにより、指定文書と内
容的に関連のある文書を検索するシステムが、特開平9
−146968号公報に開示されている。
【0005】しかし、上記システムでは、検出される文
書は、指定された文書(検索元文書)が参照する文書を
参照している文書のみである。従って、例えば、検索元
文書が参照する文書を別の文書を介して参照する文書、
検索元文書を参照する文書により参照される文書、他の
観点から検索元文書と関連があると推定される文書等を
検索することができず、結果的に、内容的に関連がある
文書の一部しか検出することができなかった。
【0006】また、上記システムでは、検索元文書が参
照する文書を参照している文書を一律に検出しているた
め、文書間の関連の度合い等を考慮した細かな検索を行
いたいという要求に対応できなかった。
【0007】本発明は、上述した事情に鑑みてなされた
もので、指定された文書と内容的に関連のある文書を検
索することができる文書検索システム等を提供すること
を目的とする。また、文書間の関連の度合い等を考慮し
た検索を行うことができる文書検索システム等を提供す
ることを他の目的とする。
【0008】
【課題を解決するための手段】上記目的を達成するた
め、本発明の第1の観点に係る文書検索システムは、複
数の文書が登録されている文書データベースから、指定
された文書に関連する文書を検索する文書検索システム
であって、文書データベースに登録されている各文書に
ついて、他文書との引用/被引用関係を示す関係情報を
生成する手段と、前記関係情報に基づき、各文書につい
て、引用/被引用関係にある他文書との関係の度合いを
示す関連値を関係毎に付与する関連値付与手段と、検索
キーとなる文書の指定を受け付ける手段と、指定された
文書の引用/被引用関係及び各関係に付与された関連値
と近似する引用/被引用関係及び各関係に付与された関
連値を有する文書を検索して出力する検索手段と、を備
えることを特徴とする。
【0009】このような構成によれば、各文書間の引用
/被引用関係に対して文書間の関係の度合いを示す関連
値が付与される。この各文書間の関係に付与された関連
値等の情報に基づいて、指定された文書の引用/被引用
関係と近似する文書を検索する。これにより、例えば、
同様の文書を引用している、同様の文書から引用されて
いる、引用文書が殆ど重複している等、文書間の関係に
関する種々の観点から、指定された文書と関連性の高い
文書を検索することができる。
【0010】前記関連値付与手段は、引用/被引用関係
にある各文書に所定の関連値を付与する旨の第1ルール
と、文書を介して引用/被引用関係にある各文書に付与
する関連値を、介在する文書数が多いほど低くする旨の
第2ルールと、同一文書を引用する各文書には所定の関
連値を付与する旨の第3ルールと、文書を介して同一文
書を引用する各文書に付与する関連値を、介在する文書
数が多いほど低くする旨の第4ルールと、の少なくとも
1つに従って関連値を付与するようにしてもよい。
【0011】前記検索手段は、引用/被引用関係及び各
関係に付与された関連値が、指定された文書のものと近
似する率が高い順に、指定された文書との関連度が高い
文書として判別してもよい。これにより、例えば、検索
キーの文書と最も関連値が高い文書等を検索者が知るこ
とができる。
【0012】また、前記関係情報に基づいて、各文書の
被引用数を計数し、計数結果に基づいて、該文書の重要
度合いを示す重要値を付与する重要値付与手段と、各文
書に付与された重要値を出力する手段と、をさらに備え
てもよい。これにより、例えば検出された文書のうち、
多数の文書に引用されている文書を検索者が知ることが
できる。
【0013】上記目的を達成するため、本発明の第2の
観点に係る文書検索方法は、複数の文書が登録されてい
る文書データベースから指定された文書に関連する文書
を検索する文書検索方法であって、文書データベースに
登録されている各文書について、他文書との引用/被引
用関係を示す関係情報を生成するステップと、前記関係
情報に基づき、各文書について、引用/被引用関係にあ
る他文書との関係の度合いを示す関連値を関係毎に付与
するステップと、検索キーとなる文書の指定を受け付け
るステップと、指定された文書の引用/被引用関係及び
各関係に付与された関連値と近似する引用/被引用関係
及び各関係に付与された関連値を有する文書を検索して
出力する検索ステップと、を備えることを特徴とする。
【0014】このような構成によれば、各文書間の引用
/被引用関係に対して文書間の関係の度合いを示す関連
値が付与される。この各文書間の関係に付与された関連
値等の情報に基づいて、指定された文書の引用/被引用
関係と近似する文書を検索する。これにより、例えば、
同様の文書を引用している、同様の文書から引用されて
いる、引用文書が殆ど重複している等、文書間の関係に
関する種々の観点から、指定された文書と関連性の高い
文書を検索することができる。
【0015】前記検索ステップは、引用/被引用関係及
び各関係に付与された関連値が、指定文書のものと近似
する率が高い順に、指定文書との関連度が高い文書とし
て判別するようにしてもよい。
【0016】また、前記関係情報を参照して各文書の被
引用数を計数し、計数結果に基づいて、該文書の重要度
合いを示す重要値を付与する重要値付与ステップと、各
文書に付与された重要値を出力するステップと、をさら
に備えてもよい。これにより、例えば検出された文書の
うち、多数の文書に引用されている文書を検索者が知る
ことができる。
【0017】上記目的を達成するため、本発明の第3の
観点に係る記録媒体は、コンピュータを、複数の文書が
登録されている文書データベースから指定された文書に
関連する文書を検索する文書検索システムとして機能さ
せるためのプログラムを記録したコンピュータ読み取り
可能な記録媒体であって、該コンピュータを、文書デー
タベースに登録されている各文書について、他文書との
引用/被引用関係を示す関係情報を生成する手段、前記
関係情報に基づき、各文書について、引用/被引用関係
にある他文書との関係の度合いを示す関連値を関係毎に
付与する手段、検索キーとなる文書の指定を受け付ける
手段、指定された文書の引用/被引用関係及び各関係に
付与された関連値と近似する引用/被引用関係及び各関
係に付与された関連値を有する文書を検索して出力する
手段、として機能させるためのプログラムを記録する。
【0018】
【発明の実施の形態】以下、本発明の実施の形態に係る
文書検索システムを図面を参照して説明する。本実施形
態の文書検索システムは、利用者により指定された文書
と関連性の高い文書を検索するためのシステムであり、
図1に示すように、文書DB11と、関係抽出部13
と、関連値付与部15と、統計化データ記憶部16と、
重要値付与部17と、検索部19と、を備える。
【0019】文書DB11は、検索対象となる各文書を
記憶する。関係抽出部13は、文書DB11に登録され
ている各文書について、それぞれが文書内で引用(参
照)している文書の検索等を行い、各文書間の引用・被
引用関係を示す関係情報を生成する。例えば、図2
(A)に示すように、文書A、B、C、Dがあって、文
書Aが文書B、Cを文書中で引用等しており、また、文
書Cが文書Dを文書中で引用等している場合、関係抽出
部13は、各文書A、B、C、Dについて、それぞれが
引用等している文書を検索し、図2(B)に示すよう
な、各文書間の引用・被引用関係を示す関係情報を生成
する。
【0020】関係値付与部15は、所定のルールに従っ
て、関係抽出部13により生成された関係情報に基づい
て、各文書間の引用・被引用関係に関連値を付与する。
この関連値を付与するための基本ルールについて説明す
る。
【0021】(1)ルール1:「引用・被引用の関係に
ある2つの文書は関連がある。」 例えば、図3に示すように、文書Aと文書Bが、引用側
と被引用側の関係にある場合には、本ルールが適用さ
れ、関連値の初期値を800とすると、文書Aには、文
書Bとの関連の度合いを示す関連値[B]800が付与
され、また、文書Bには、文書Aとの関連の度合いを示
す関連値[A]800が付与される。なお、この数値は
一例である。また、この例で示したように、文書Xとの
関連の度合いを示す関連値を以下[X](数値)と表す
こととする。
【0022】(2)ルール2:「引用の関係が遠くなる
(間に1つ以上の文書を介する)ほど、関連値は小さく
なる。」 例えば、図4に示すように、文書Aを文書Bが引用し、
文書Cが文書Bを引用している場合、文書Cが文書Aと
関連があることは認められるが、その関連値は、文書B
に付与される関連値よりは小さくなる。よって、文書B
に与えられる関連値が[A]800の場合、文書Cに与
えられる関連値は[A]400となる。
【0023】(3)ルール3:「軸となる同じ文書を引
用している2つの文書には関連がある。」 例えば図5に示すように、文書Cをともに引用している
文書Aと文書Bには、文書Cの関連値C[800]がそ
れぞれ半分ずつ([C]400ずつ)与えられる。
【0024】(4)ルール4:「軸となる同じ文書との
引用の関係が遠くなる(間に1つ以上の文書を介する)
ほど、関連値は小さくなる。」 例えば、図6に示すように、文書Aと文書Bが文書Cを
引用等し、文書Dが文書Aを引用等し、文書Eが文書B
を引用等している場合、文書Dと文書Eが文書Cと関連
があることは認められるが、その関連値は、文書Aや文
書Bに付与されれる関連値よりは小さくなる。よって、
例えば、文書A、文書Bに与えられる文書Cの関連値が
それぞれ[C]400の場合、文書D、文書Eに与えら
れる文書Cの関連値はさらに小さい[C]200とな
る。
【0025】関係値付与部15は、上記ルールに従っ
て、各文書間の関係に関連値を付与したものを統計化デ
ータとして、統計化データ記憶部16に記憶する。な
お、上記基本ルールのうち、ルール1とルール2が、直
接的な関連の度合い(直接関連値)についてのルールで
あり、また、ルール3とルール4が、間接的な関連の度
合い(間接関連値)についてのルールである。
【0026】重要値付与部17は、所定のルールに従っ
て、関係抽出部13により生成された関係情報に基づい
て、各文書に対して重要値を付与する。この重要値を付
与するための基本ルールについて説明する。
【0027】(5)ルール5:「多くの文書に引用され
ている文書の重要値は高い。」 例えば、図7に示すように、文書Aが文書Bと文書Cと
文書Dを引用し、文書Eが文書Dを引用している場合、
文書Dは文書Aと文書Eの2文書から引用されており、
文書Bと文書Cは文書Aの1文書のみから引用されてい
る。この場合、文書Dは文書B、文書Cと比して重要値
が高い。具体的には、例えば各文書の引用先の文書に1
00ポイントを付与し、各文書が持つポイントを合算す
ることにより、各文書の重要値が求められる。図7の例
では、文書Bと文書Cが、文書Aから引用されているた
め100ポイントを有し、文書Dが、文書Aと文書Eか
ら引用されているため200ポイントを有することとな
る。
【0028】検索部19は、検索キーとなる文書の入力
を受け付け、指定された文書と関連する文書を検索して
表示する。この検索処理において、検索部19は、統計
化データ記憶部16に記憶される統計化データを参照
し、検索キーである文書の引用関係と近似する引用関係
を有する文書を検索する。この際、引用関係がより重複
する文書ほど、検索キーに近い文書と判断する。なお、
この判断では、重複の絶対数よりも、重複の割合を重視
する。
【0029】例えば図8に示すように、文書C、Gを引
用する文書Aが検索キーとして指定された場合、検索部
19は、例えば、文書Cを引用する文書Dと、文書C、
Gを引用する文書Bと、を検出する。この際、文書Bの
引用関係の方が、文書Aの引用関係と重複する度合いが
高いため、文書Dよりも文書Bの方が文書Aとの関連性
が高いと判断する。
【0030】また、検索部19は、検索結果を所定の表
示形式に従って表示する。例えば、検索キーの文書との
関連性が高い文書の順に表示画面の上部から表示すると
ともに、各文書の横に文書内で引用された文書を表示し
てもよい。例えば、各文書の関係が図8に示すものであ
る場合、検索結果は、図9に示すように、文書Aと関連
する文書として文書B、文書Dの順番に表示され、文書
Bの横に引用文書として文書C、Gが表示される。な
お、文書Dの引用文書Cは文書Bの引用文書として既に
表示されているため、文書Dの箇所では表示しなくても
よい。これにより、利用者は、検索キーの文書につい
て、同様の引用関係を有する文書(関連文書)と、各関
連文書と共通して引用している文書(引用文書)と、を
知ることができる。
【0031】次に、本システムの主処理を具体例を用い
て説明する。本システムは、文書DB11における各文
書に、関連値及び重要値を付与する処理と、外部から指
定された検索キー(文書)に関連する文書等を検索して
表示する処理と、の2つの処理を主に行う。
【0032】まず、文書DB11における各文書に、関
連値及び重要値を付与する処理について説明する。例え
ば、図10に示すように、文書DB11における文書
A、B、C、D、E、F、Gがそれぞれ引用・被引用関
係にあることとする。まず、関係抽出部13が、各文書
について、それぞれが文書内で引用している文書の検索
を行い、引用・被引用関係を示す関係情報を生成する。
生成された関係情報の一例を図11に示す。
【0033】次に、関係値付与部15が、上述したルー
ルに従って、各文書間の引用・被引用関係に関連値を付
与し、統計化データとして統計化データ記憶部16に記
憶する。例えば、文書Aについて説明すると、文書Aは
文書Bと文書Cを引用しているため、文書B、Cとの関
係についての関連値が付与される。この際、文書B、C
は他の文書にも引用されているため、文書Aとの関係に
付与される関連値は例えば[B]400、[C]400
である。また、文書Aは、引用文書Cを介して文書Eを
引用しているため、さらに文書Eとの関係に対して
[E]200が付与される。同様にして、各文書B〜G
について、他文書との関係に対する関連値が付与され
る。上述したルールに従って、各文書について関連値が
付与された結果を図12に示す。
【0034】また、重要度については、図13に示すよ
うに、各文書について、他文書から引用される毎に10
0ポイントが付与される。これにより、文書DB11に
おける各文書A〜Gに、関連値及び重要値が付与され
る。なお、これらの関連値及び重要値の情報は統計化デ
ータ記憶部16に記憶される。
【0035】次に、検索者からの検索キー(文書)の指
定に応じて、検索キーに関連する文書を検索して表示す
る処理について説明する。例えば、検索キーとして文書
Aが指定されたこととする。検索部19は、統計化デー
タ記憶部16を参照して、文書Aの引用関係と近似する
引用関係を有する文書を検索する。この場合、検索部1
9は、各文書についての関連値(図12)を参照し、文
書Aと重複する引用関係を有する文書として、文書C、
D、F等を選出する。そして、検索部19は、例えば図
14に示すように、その重複の割合の高い文書から順
に、すなわち、文書F、D、Cの順に、文書Aと関連す
る関連文書として表示する。そして、各関連文書の横
に、それらが引用する引用文書をならべて表示する。
【0036】また、検索部19は、重要値が所定値以上
の文書については、例えば表示を強調する等して、その
文書の重要度が高いことを利用者に知らせる。例えば、
しきい値が「300」の場合、文書Cの表示が強調等さ
れ、利用者は、文書Cが、被引用回数の多い重要な文書
であることを知ることができる。
【0037】このようにして、本発明では、検索キーと
なる文書と同様の引用関係を有する文書を検索するた
め、内容的にも関連性の高い文書を検出することが可能
となる。また、キーワード検索や全文検索でヒットしな
かった文書も検索できるようになるため、検索者の意図
に対する検索漏れが少なくなる。
【0038】なお、検出された文書の表示方法は任意で
あり、リスト表示、マップ表示等の種々の方法を用いて
もよい。また、マップ表示する場合には、重要度の高い
ものを大きな点として配置してもよい。また、関連する
文書同士を近くに、低い文書同士を遠くに配置するよう
にしてもよい。
【0039】なお、上記説明は、説明を容易にするため
システム構成を簡略化しているが、例えば以下に示すよ
うな、上記ルールを補充するルールをさらに用いて、関
連値、重要値の付与を行うようにしてもよい。
【0040】関連値補充ルール1:「文書Cが同一筆者
の文書A、Bを引用している場合、文書Cに付与される
各文書A、Bについての関連値はより大きくなる。」 関連値補充ルール2:「引用元文書のタイトルと、被引
用文書のタイトルと、に含まれるキーワードが同一であ
り、かつ、その組み合わせが多いほど、各文書に付与さ
れる関連値はより大きくなる。」 関連値補充ルール3:「同一筆者による文書A、Bにお
いて、文書Cを繰り返し引用するほど、各文書A、Bに
付与される文書Cについての関連値はより大きくな
る。」 関連値補充ルール4:「引用・被引用の関係にある文書
A、Bの筆者が同じ場合、各文書に付与される関連値は
より大きくなる。」
【0041】重要値補充ルール1:「同じ筆者による文
書群で繰り返し引用されている文書ほど、その筆者にと
っては重要値が高くなる。」 重要値補充ルール2:「同じ所属の筆者による文書群で
繰り返し引用されている文書ほど、その所属にとっては
重要値が高くなる。」 重要値補充ルール3:「古い文書から新しい文書まで幅
広く引用などされている文書ほど、その分野においては
重要値が高くなる。」 重要値補充ルール4:「特定の時期に集中して、引用さ
れている文書ほど、その時期においては重要値が高くな
る。」
【0042】また、上記実施例では、各文書について、
それぞれが文書内で引用している文書を検索し、主に引
用する側の観点で関連値等を付与するようにしている
が、引用される側の観点から関連値等を付与するように
してもよい。これにより、文書DB11に登録されてい
る文書が例えば図15に示すような被引用関係を有する
場合において、文書b〜eから引用されている文書aを
検索キーとした場合、被引用関係が近似する文書f(文
書b、cから引用されている)が、文書aに関連する文
書として検索される。
【0043】また、上記説明では、検索者からの要求に
応じて、先に付与された関連値及び重要値を参照するよ
うにしているが、検索要求に応じて関連値及び重要値の
付与を行い、その結果に基づいて検索を行うようにして
もよい。
【0044】また、上述のルール、関連値、重要値の数
値等は一例であり、これに限定されず、種々のルール等
を使用可能である。また、指定した文書に関連する文書
を検索するだけでなく、利用者が文書DB11における
各文書の関係を知るために、統計化データを閲覧できる
ようにしてもよい。また、各文書を重要値順にランキン
グ表示等させてもよい。
【0045】また、検索対象となる文書は文書DB11
に格納されている文書に限定されなくてもよく、例え
ば、インターネット、LAN等のネットワークを介して
外部の記憶装置に格納されている文書にアクセスし、上
記の検索処理を行うようにしてもよい。
【0046】なお、この発明の検索システムは、専用の
システムによらず、通常のコンピュータシステムを用い
て実現可能である。例えば、コンピュータに上述の動作
を実行するためのプログラムを格納した媒体(フロッピ
ーディスク、CD−ROM等)から該プログラムをイン
ストールすることにより、上述の処理を実行する検索シ
ステムを構成することができる。なお、上述の機能を、
OSが分担又はOSとアプリケーションの共同により実
現する場合等には、OS以外の部分のみを媒体に格納し
てもよい。
【0047】なお、搬送波にプログラムを重畳して、通
信ネットワークを介して配信することも可能である。例
えば、通信ネットワークの掲示板(BBS)に該プログ
ラムを掲示し、これをネットワークを介して配信しても
よい。そして、このプログラムを起動し、OSの制御下
で、他のアプリケーションプログラムと同様に実行する
ことにより、上述の処理を実行することができる。
【0048】
【発明の効果】以上説明したように、本発明によれば、
各文書間の引用/被引用関係に対して文書間の関係の度
合いを示す関連値が付与される。この各文書間の関係に
付与された関連値等の情報に基づいて、指定された文書
の引用/被引用関係と近似する文書を検索する。これに
より、例えば、同様の文書を引用している、同様の文書
から引用されている、引用文書が殆ど重複している等、
文書間の関係に関する種々の観点から、指定された文書
と関連性の高い文書を検索することができる。
【図面の簡単な説明】
【図1】本発明の実施の形態に係る文書検索システムの
システム構成図である。
【図2】文書間の引用・被引用関係を示す関係情報を説
明するための図である。
【図3】関連値を付与するためのルール1を説明するた
めの図である。
【図4】関連値を付与するためのルール2を説明するた
めの図である。
【図5】関連値を付与するためのルール3を説明するた
めの図である。
【図6】関連値を付与するためのルール4を説明するた
めの図である。
【図7】重要値を付与するためのルール5を説明するた
めの図である。
【図8】指定された文書と関連する文書を検索する処理
を説明するための図である。
【図9】検索処理の結果の表示例を示す図である。
【図10】複数の文書の引用・被引用関係を示す図であ
る。
【図11】図10に示す関係を有する各文書について生
成される関係情報を示す図である。
【図12】図10に示す関係を有する各文書について付
与される関連値を示す図である。
【図13】図10に示す関係を有する各文書について付
与される重要度を示す図である。
【図14】図10に示す関係を有する各文書に対し、文
書Aを検索キーとした場合の検索結果の表示例を示す図
である。
【図15】引用される文書側の観点から関連値を付与す
る場合の処理について説明するための図である。
【符号の説明】
11 文書DB 13 関係抽出部 15 関連値付与部 16 統計化データ記憶部 17 重要値付与部 19 検索部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 小室 英一 東京都江東区豊洲三丁目3番3号 株式会 社エヌ・ティ・ティ・データ内 (72)発明者 西村 正寿 東京都江東区豊洲三丁目3番3号 株式会 社エヌ・ティ・ティ・データ内 Fターム(参考) 5B075 ND03 NK44 PR10 QM05

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】複数の文書が登録されている文書データベ
    ースから、指定された文書に関連する文書を検索する文
    書検索システムであって、 文書データベースに登録されている各文書について、他
    文書との引用/被引用関係を示す関係情報を生成する手
    段と、 前記関係情報に基づき、各文書について、引用/被引用
    関係にある他文書との関係の度合いを示す関連値を関係
    毎に付与する関連値付与手段と、 検索キーとなる文書の指定を受け付ける手段と、 指定された文書の引用/被引用関係及び各関係に付与さ
    れた関連値と近似する引用/被引用関係及び各関係に付
    与された関連値を有する文書を検索して出力する検索手
    段と、 を備えることを特徴とする文書検索システム。
  2. 【請求項2】前記関連値付与手段は、 引用/被引用関係にある各文書に所定の関連値を付与す
    る旨の第1ルールと、 文書を介して引用/被引用関係にある各文書に付与する
    関連値を、介在する文書数が多いほど低くする旨の第2
    ルールと、 同一文書を引用する各文書には所定の関連値を付与する
    旨の第3ルールと、 文書を介して同一文書を引用する各文書に付与する関連
    値を、介在する文書数が多いほど低くする旨の第4ルー
    ルと、の少なくとも1つに従って関連値を付与する、 ことを特徴とする請求項1に記載の文書検索システム。
  3. 【請求項3】前記検索手段は、引用/被引用関係及び各
    関係に付与された関連値が、指定された文書のものと近
    似する率が高い順に、指定された文書との関連度が高い
    文書として判別する、 ことを特徴とする請求項1又は2に記載の文書検索シス
    テム。
  4. 【請求項4】前記関係情報に基づいて、各文書の被引用
    数を計数し、計数結果に基づいて、 該文書の重要度合いを示す重要値を付与する重要値付与
    手段と、 各文書に付与された重要値を出力する手段と、 をさらに備えることを特徴とする請求項1乃至3のいず
    れか1項に記載の文書検索システム。
  5. 【請求項5】複数の文書が登録されている文書データベ
    ースから指定された文書に関連する文書を検索する文書
    検索方法であって、 文書データベースに登録されている各文書について、他
    文書との引用/被引用関係を示す関係情報を生成するス
    テップと、 前記関係情報に基づき、各文書について、引用/被引用
    関係にある他文書との関係の度合いを示す関連値を関係
    毎に付与するステップと、 検索キーとなる文書の指定を受け付けるステップと、 指定された文書の引用/被引用関係及び各関係に付与さ
    れた関連値と近似する引用/被引用関係及び各関係に付
    与された関連値を有する文書を検索して出力する検索ス
    テップと、 を備えることを特徴とする文書検索方法。
  6. 【請求項6】前記検索ステップは、引用/被引用関係及
    び各関係に付与された関連値が、指定された文書のもの
    と近似する率が高い順に、指定された文書との関連度が
    高い文書として判別する、 ことを特徴とする請求項5に記載の文書検索方法。
  7. 【請求項7】前記関係情報を参照して各文書の被引用数
    を計数し、計数結果に基づいて、該文書の重要度合いを
    示す重要値を付与する重要値付与ステップと、 各文書に付与された重要値を出力するステップと、 を備えることを特徴とする請求項5又は6に記載の文書
    検索方法。
  8. 【請求項8】コンピュータを、複数の文書が登録されて
    いる文書データベースから指定された文書に関連する文
    書を検索する文書検索システムとして機能させるための
    プログラムを記録したコンピュータ読み取り可能な記録
    媒体であって、 該コンピュータを、 文書データベースに登録されている各文書について、他
    文書との引用/被引用関係を示す関係情報を生成する手
    段、 前記関係情報に基づき、各文書について、引用/被引用
    関係にある他文書との関係の度合いを示す関連値を関係
    毎に付与する手段、 検索キーとなる文書の指定を受け付ける手段、 指定された文書の引用/被引用関係及び各関係に付与さ
    れた関連値と近似する引用/被引用関係及び各関係に付
    与された関連値を有する文書を検索して出力する手段、 として機能させるためのプログラムを記録したコンピュ
    ータ読み取り可能な記録媒体。
JP33149999A 1999-11-22 1999-11-22 文書検索システム、方法及び記録媒体 Pending JP2001147936A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP33149999A JP2001147936A (ja) 1999-11-22 1999-11-22 文書検索システム、方法及び記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP33149999A JP2001147936A (ja) 1999-11-22 1999-11-22 文書検索システム、方法及び記録媒体

Publications (1)

Publication Number Publication Date
JP2001147936A true JP2001147936A (ja) 2001-05-29

Family

ID=18244332

Family Applications (1)

Application Number Title Priority Date Filing Date
JP33149999A Pending JP2001147936A (ja) 1999-11-22 1999-11-22 文書検索システム、方法及び記録媒体

Country Status (1)

Country Link
JP (1) JP2001147936A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006344118A (ja) * 2005-06-10 2006-12-21 Fuji Xerox Co Ltd 利用状況通知システム
JP2007183864A (ja) * 2006-01-10 2007-07-19 Fujitsu Ltd ファイル検索方法及びそのシステム
JP2008276680A (ja) * 2007-05-07 2008-11-13 Fujitsu Ltd 特許分析プログラム、特許分析方法および特許分析装置
JP2011060228A (ja) * 2009-09-11 2011-03-24 Qinghua Univ 情報伝播を検知するウェブページ関係評価装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006344118A (ja) * 2005-06-10 2006-12-21 Fuji Xerox Co Ltd 利用状況通知システム
JP2007183864A (ja) * 2006-01-10 2007-07-19 Fujitsu Ltd ファイル検索方法及びそのシステム
US7747616B2 (en) 2006-01-10 2010-06-29 Fujitsu Limited File search method and system therefor
JP2008276680A (ja) * 2007-05-07 2008-11-13 Fujitsu Ltd 特許分析プログラム、特許分析方法および特許分析装置
JP2011060228A (ja) * 2009-09-11 2011-03-24 Qinghua Univ 情報伝播を検知するウェブページ関係評価装置

Similar Documents

Publication Publication Date Title
US8635203B2 (en) Systems and methods using query patterns to disambiguate query intent
US9218397B1 (en) Systems and methods for improved searching
US7085761B2 (en) Program for changing search results rank, recording medium for recording such a program, and content search processing method
US6138113A (en) Method for identifying near duplicate pages in a hyperlinked database
KR100898454B1 (ko) 통합 검색 서비스 시스템 및 방법
US7254580B1 (en) System and method for selectively searching partitions of a database
US7657519B2 (en) Forming intent-based clusters and employing same by search
WO2015172490A1 (zh) 一种提供扩展搜索项的方法与装置
US8631026B1 (en) Methods and systems for efficient query rewriting
US8352452B2 (en) Methods and apparatus for employing usage statistics in document retrieval
US8549000B2 (en) Methods and systems for compressing indices
US20020099685A1 (en) Document retrieval system; method of document retrieval; and search server
US20030120645A1 (en) Method and system for improving a text search
KR20090080561A (ko) 검색 결과에 컬렉션 아이템을 포함시키기 위한 기술
KR20060048765A (ko) 페이지 카테고리 정보를 이용하여 검색 엔진 결과를분배하는 방법
US9977816B1 (en) Link-based ranking of objects that do not include explicitly defined links
CA2505294A1 (en) Query to task mapping
JP2000089989A (ja) 文書に付与されたプロパティを用いたサ―ビスの起動方法
EP2638484B1 (en) Dynamic image result stitching
CN111651424A (zh) 一种数据处理方法、装置、数据节点及存储介质
WO2024022180A1 (zh) 网盘文档索引方法、装置、网盘及存储介质
US20160307000A1 (en) Index-side diacritical canonicalization
US20080082516A1 (en) System for and method of searching distributed data base, and information management device
JP2001147936A (ja) 文書検索システム、方法及び記録媒体
CN109117426B (zh) 分布式数据库查询方法、装置、设备及存储介质

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040830

A521 Written amendment

Effective date: 20041029

Free format text: JAPANESE INTERMEDIATE CODE: A523

A521 Written amendment

Effective date: 20041029

Free format text: JAPANESE INTERMEDIATE CODE: A821

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050725