JP2000155758A - 複数文書データベースを対象とした文書検索方法および文書検索サービス - Google Patents

複数文書データベースを対象とした文書検索方法および文書検索サービス

Info

Publication number
JP2000155758A
JP2000155758A JP10328940A JP32894098A JP2000155758A JP 2000155758 A JP2000155758 A JP 2000155758A JP 10328940 A JP10328940 A JP 10328940A JP 32894098 A JP32894098 A JP 32894098A JP 2000155758 A JP2000155758 A JP 2000155758A
Authority
JP
Japan
Prior art keywords
document
search
server
client
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10328940A
Other languages
English (en)
Other versions
JP3760057B2 (ja
Inventor
Makoto Iwayama
真 岩山
Shingo Nishioka
真吾 西岡
Yoshiki Niwa
芳樹 丹羽
Akihiko Takano
明彦 高野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP32894098A priority Critical patent/JP3760057B2/ja
Priority to DE69933187T priority patent/DE69933187T2/de
Priority to EP99122074A priority patent/EP1003111B1/en
Priority to US09/442,147 priority patent/US6584460B1/en
Publication of JP2000155758A publication Critical patent/JP2000155758A/ja
Priority to US10/075,283 priority patent/US7693910B2/en
Application granted granted Critical
Publication of JP3760057B2 publication Critical patent/JP3760057B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • G06F16/345Summarisation for human users
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99934Query formulation, input preparation, or translation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99936Pattern matching access
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99943Generating database or data structure, e.g. via user interface

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 複数の文書データベース間の関連性を調べる
ような文書検索を効率良く実現すること。 【解決手段】 各文書データベースに概略作成機構と検
索機構を持たせ、それぞれサーバとして通信ネットワー
クに接続する。クライアントは指定した文書データベー
ス内の文書群から、その概略を介して、指定した文書デ
ータベース内の関連する文書群を得る。得られた概略を
他のサーバに送り、転送先のサーバの文書データベース
で転送された概略に応じた検索を行う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、複数の文書データ
ベースを切りかえて検索したり、複数の文書データベー
スを関連付けたりするための文書検索方法に関する。
【0002】
【従来の技術】様々な文書情報が電子化されるにつれ、
複数の異質な文書データベースを同時に検索する必要性
が増してきている。例えば、興味を引いた新聞記事から
それに関連する百科辞典の項目を閲覧するといった要求
は多い。
【0003】従来の検索技術においても複数の文書デー
タベースを切りかえて検索することは可能であるが、あ
る文書データベース内の文書群に対して、別の文書デー
タベース内の関連する文書群を検索するといった、文書
データベース間に渡る文書群間の関連性を調べることは
できなかった。
【0004】これに対し、同一文書データベースに限れ
ば、文書群を検索入力として指定して、同じ文書データ
ベース内の関連する文書群を検索することは可能であ
る。この場合、検索に先立って文書間の関連度を計算し
ておくことにより十分な検索速度を得る場合が多い。異
なる文書データベース間においても、このような前計算
を行えば、複数文書データベースを同時に検索すること
も可能であるが、文書データベースの数が増すにつれ、
前計算の必要数も組み合わせ的に増大するため、この方
法も現実的には不可能である。
【0005】また、利用者側で一旦検索元の文書群を解
析し、検索入力を構成して、他の文書データベース内を
検索することも可能であるが、この場合、利用者側が検
索元の文書群に関する全情報を受けとらなければなら
ず、文書データベースが通信ネットワーク上に存在する
場合、通信量が膨大になってしまう。
【0006】
【発明が解決しようとする課題】前記従来技術の問題を
解消し、利用者が、任意の文書データベース中の任意の
文書群を指定し、その文書群に関連する文書群を、更に
任意の文書データベース内から効率よく検索できるよう
にすることである。
【0007】
【課題を解決するための手段】文書群のように検索入力
が大きい場合、検索入力の全情報を検索に使うのではな
く、検索入力内の特徴的な単語のみを概要として検索に
使うことで、検索速度が速く、かつ、通信ネットワーク
への負荷も小さい検索方法を実現する。
【0008】各文書データベースに関しては、指定され
た文書群に対して、その中で特徴的な単語を選択するこ
とで概要を作成する機構と、送られてくる任意の概要に
対して検索を行う機構を有するサーバーとして通信ネッ
トワークに配置する。
【0009】検索を行う利用者は、クライアントを介し
て、まず、検索元の文書データベースが格納されている
サーバーに対して文書群を指定して、その概要を受けと
る。次に受けとった概要を検索先の文書データベースが
格納されているサーバーに送り、検索結果を受けとる。
【0010】クライアントの検索インターフェースとし
ては、まず、文書群の表示エリアを有し、このエリアに
おいて必要な文書群を指定することができるようにす
る。また検索先のデータベースも選択できるようにす
る。これによりクライアントでは、文書群表示エリアに
表示されている文書群の中から、利用者が興味ある文書
群を選択して、必要なら検索先の文書データベースを切
りかえて検索を行うことができる。
【0011】
【発明の実施の形態】図1は、クライアント11がサー
バ13の文書データベース131内の任意の文書群を指
定して、指定した文書群と関連度(類似度)の高い文書
群を別のサーバ14の文書データベース141から得る
ための方法を実現する全体構成の一例を示したものであ
る。ここで、検索元、検索先の文書データベース13
1、141は通信ネットワーク12を介してアクセスで
きる異なった場所にあるサーバ上にそれぞれ配置されて
いる。
【0012】まず、クライアント11は、利用者の入力
に応じて検索元となる文書データベース131内の文書
群を指定し、サーバ13が理解できる文書識別子の集合
として通信ネットワーク12を介してサーバ13に送出
する。文書群の指定は、後述する検索結果表示部(文書
群指定部)P1にて行う。
【0013】サーバ13は、検索機構133により、ク
ライアントから送られてきた文書識別子の集合と関連度
の高い文書群を文書データベース131から検索する。
この際、概略作成機構132により、検索された文書群
に対して文書群の概略を作成し、通信ネットワーク12
を介してクライアント11に返答する。ここでの概略と
は、文書群をよくあらわす単語の集合のことある。概略
作成機構の実施形態は特開平9−62693「確率モデ
ルによる文書分類方法」などの既存の方法が利用でき
る。
【0014】一例を示すと、まず、概略を作成しようと
する文書群中の全文書を単語に分割して頻度集計する。
一般に、ある文書群で良く現れる単語ほどその文書群を
代表する度合も高いため、文書群中で出現頻度が高い単
語ほど概略に含まれやすいことになる。ただし「する」
などのように、どの文書にもよく現れるような一般語は
概略として適当ではない。よって通常は、文書群が属す
る文書データベース中での出現頻度も考慮して概略とし
ての単語選択を行う。つまり、指定された文書群中での
出現頻度が高く、かつ、文書データベース全体での総出
現頻度が低い単語ほど、その文書群中でしか現れないと
いう意味で特徴的な単語であり、その文書群を特徴付け
る概略として適切である。具体的には、文書群中のそれ
ぞれの単語について、文書群中での出現頻度、文書デー
タベース中での出現頻度を入力とする適当な関数により
単語の重みを計算し、ある閾値以上の重みを持つ単語を
概略として採用する。サーバー13は以上の方法で作成
した重み付き単語の集合を通信ネットワーク12を介し
てクライアントに返す。この単語を図2では、「特徴語」
として表示するものとしている。
【0015】次に、クライアント11はサーバ13から
返答された概略(検索元の文書群の概略)を評価しある
いは加工して、通信ネットワーク12を介して検索先の
サーバ14に送出する。
【0016】サーバ14は、検索機構143により、ク
ライアントから送られてきた文書群の概略と関連度の高
い文書群を検索先の文書データベース141から検索
し、検索結果の文書識別子を関連度の重み付きでクライ
アント11に返す。ここでの検索機構は、公知のキーワ
ード検索法により実現できる。つまり、入力である文書
群概略は重み付き単語の集合であるため、各単語を重み
付きの入力キーワードとみなしOR検索すればよい。そ
の際、検索結果の文書の重み(関連度)は以下のように
計算できる。概略および検索先の文書両方に含まれる各
単語について、概略中での重みと、検索先の文書におけ
る重み(例えば頻度)から総合的な重みを計算し(例え
ば両重みの積)、さらにそのような単語全てに関する重
みを集計(例えば総和)することで関連度を得る。
【0017】以上の方法で、クライアント11は文書デ
ータベース131内の任意の文書群に関連する文書デー
タベース141内の文書群を得ることができる。ここで
の特徴は、検索元の文書群に関する処理(概略作成)を
サーバ側に任せることにより、通信ネットワーク中の通
信量が少なくて済む点である。クライアントが検索元の
文書全文情報を一旦受けとって処理する場合に比べると
差は歴然である。クライアントの検索支援機構112で
は、基本的には検索元のサーバから送られてきた文書群
概略を検索先サーバに送るだけでよく、検索に関わる処
理のほとんどを両サーバにまかせることができる。一方
サーバ側は、担当する文書データベースに関して、概略
作成機構、検索機構を持つのみでよく、モジュール化さ
れており、他の文書データベースの情報に関しては全く
考慮しなくてもよい。
【0018】以上、文書データベース131を検索元と
して文書データベース141を検索する手段を説明した
が、全く同様の方法で、逆に文書データベース141を
検索元として文書データベース131を検索することも
可能である。この場合、クライアントは、文書データベ
ース141中の文書群の概略をサーバ14の概略作成機
構142から得て、検索先のサーバ13に送信し、サー
バ13の検索機構133により文書データベース131
中の関連する文書群を得る。以上を一般化すると、新た
な文書データベースに関しては、その概略作成機構、検
索機構を持つサーバを用意し、通信ネットワークに接続
するだけで、その文書データベースは、通信ネットワー
クに接続されている全ての文書データベースに対して検
索元にも検索先にもなり得る。
【0019】最後にクライアントに関する実施形態を図
2で説明する。111はクライアントに塔載されている
検索支援インターフェースの例で、これは基本的には、
特願平9−240963「文書検索支援方法および文書
検索支援サービス」で本願の発明者らによって提案され
たものと同じである。E1は検索要求の入力ウィンドウ
であり、利用者は、ここに検索要求をキーワードの羅
列、または文章形式で入力できる。M1は文書データベ
ース選択ウィンドウであり、利用者が、右端の指示部を
マウスでプルダウンすることにより文書データベースの
一覧があらわれ、所望の文書データベースを選択でき
る。B1は検索の開始を指示するボタンである。よっ
て、利用者はウィンドウE1に任意の検索要求を入力
し、ウィンドウM1で検索対象の文書データベースを選
択し、ボタンB1を押すことで、ウィンドウM1で選択
した文書データベースに対してウィンドウE1に入力し
たキーワードによる通常のキーワード検索を実行させる
ことができる。この検索の実行は図1に示す検索支援機
構112の支援のもとに実行されるが、これの詳細は、
先の出願に詳しいので、ここでは説明を省略する。もち
ろん、一般に行われるキーワード検索によっても良いこ
とは言うまでもない。
【0020】P1は検索結果表示部であり、上段に選択
の結果選択された文書の総数および後述するようにして
利用者に選択された文書の数を表示する窓が、その下
に、利用者の選択/非選択を入力する窓、検索要求との
関連度および選択された文書のタイトルの一覧(リスト
形式で表示)を示す表示部が配置されたものとなってい
る。この表示部はスクロール機能を持っており表示に一
度に表示できない部分もスクロールによって見ることが
できる。選択/非選択を入力する窓はマウスによりクリ
ック可能であり、マウスでクリックする毎に選択/非選
択の状態が反転する。これをクリックして選択にする
と、この文書に対応した文書の概要が、概要表示部P2
に重み付きの単語集合のグラフ形式で表示される。概要
表示部P2にも、上段部に、特徴語の総数および利用者
に選択された特徴語の数を表示する窓が設けられる。な
お、文書タイトルは、通常、関連度の順にソートされて
いる。
【0021】図の検索結果表示部P1は、検索の結果選
択された文書が総数で22あり、利用者が選択された文
書のタイトルから興味ある文書として三つの文書を選択
を選択している状態を示す。選択された文書はクリック
によってチェックマークが表示されている。概要表示部
P2は、これに応じて、選択された文書の検索要求入力
に対応する特徴語が5つ表示されている。
【0022】この実施例では説明を省略するが、概要表
示部P2に表示された特徴語を選択することでこれをキ
ーとする文書を検索結果表示部P1に逆に表示させるこ
ともできる。したがって、利用者が自分の好みにカスタ
マイズした概要によって、よりきめ細かい検索が可能に
なる。これについては、先に引用した特願平9−240
963に詳しく説明されている。
【0023】利用者が、このように、選択された文書の
タイトルを参照しながら、文書の選択/非選択を行い、
興味のある文書を複数個選択することができる。
【0024】その後、利用者が、この検索結果に対応し
た文書群についての他の文書データでの扱い等に興味を
持ったときは、ウィンドウM1により文書データベース
を切りかえて、検索の開始を指示するボタンB1を押
す。
【0025】クライアントは、これに応じて、検索元の
文書データベースが格納されているサーバ(例えばサー
バ13)に選択した複数文書の識別子を送り、それら複
数文書の概要を得て、検索先の文書データベースが格納
されているサーバ(例えばサーバ14)にこの概要を送
り、検索先のサーバ(例えばサーバ14)から検索結果を
得る。新しい検索結果は検索結果表示部P1に表示され
る。つまりこの例の場合、P1は新しく検索された文書
群に書きかえられる。
【0026】新しい検索結果と、先の検索結果とを比較
するため、先の検索結果をふたたび検索結果表示部P1
に表示したければ、利用者はボタンB2を押して、検索
結果表示部P1の表示を検索前の状態に戻すことができ
る。同様にボタンB3を押して、検索結果表示部P1の
表示を新しい検索結果に進めることができる。
【0027】このような検索結果に応じた他の文書デー
タベースでの検索は、検索の任意の段階で実行すること
ができるから、検索サイクルを繰り返すことにより利用
者は文書データベースから文書データベースへと探索を
自由に進めることができる。当然、文書データベースを
切りかえずに同一文書データベース内でこのサイクルを
繰り返すことも可能である。
【0028】
【発明の効果】利用者は、各文書データベースの配置、
構成について意識すること無く、検索対象としての文書
データベースを自由に指定して、探索を自由に進めるこ
とができる。また、文書データベースを保有するサーバ
はモジュール化できるため、新たな文書データベースに
関しては、その概要作成機構、検索機構を有するサーバ
を通信ネットワークに接続するだけで、通信ネットワー
ク上の他の文書データベース全てに対して、検索先にも
検索元にもなることが可能である。
【図面の簡単な説明】
【図1】複数文書データベース検索方法のシステムの全
体構成の一例を示す図。
【図2】クライアントにおける検索支援インターフェー
スの構成の一例を示す図。
【符号の説明】
11:クライアント、111:検索支援インターフェー
ス、112:検索支援機構、12:通信ネットワーク、
13:サーバ、131:文書データベース、132:概
略作成機構、133:検索機構、14:サーバ、14
1:文書データベース、142:概略作成機構、14
3:検索機構、B1:検索ボタン、B2:戻りボタン、
B3:進むボタン、E1:検索要求入力ウィンドウ、M
1:文書データベース選択ウィンドウ、P1:検索結果
表示部、P2:概要表示部。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 丹羽 芳樹 埼玉県比企郡鳩山町赤沼2520番地 株式会 社日立製作所基礎研究所内 (72)発明者 高野 明彦 埼玉県比企郡鳩山町赤沼2520番地 株式会 社日立製作所基礎研究所内 Fターム(参考) 5B075 KK03 KK07 ND03 NS10 PP02 PP03 PP12 PP13 PP22 PP24 PP30 PQ02 PQ05 PQ40 PQ46 PQ66 PQ75 UU06

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】複数の文書データベースを検索対象として
    切りかえる機能およびインターフェースを有し、キーワ
    ード集合、あるいは文書の断片、あるいは任意の文書群
    を検索入力として受けつけ、検索入力と関連度(類似
    度)の高い文書群を、選択した文書データベースから関
    連の強さの順に検索する機能を有する文書検索方法であ
    って、前記一つの文書データベースの検索結果を検索対
    象を切り替えて他のデータベースの検索の検索入力とす
    ることができることを特徴とする文書検索方法。
  2. 【請求項2】一つの文書データベースの検索結果の文書
    群について選択/非選択が指定できるインターフェース
    を有し、選択された検索結果の文書群を、他の検索対象
    のの検索の検索入力とする請求項1記載の文書検索方
    法。
  3. 【請求項3】検索入力中の特徴的な単語のみを選択した
    概要を検索に利用する請求項1または請求項2記載の文
    書検索方法。
  4. 【請求項4】各文書データベースとそれを操作するプロ
    グラムを有するサーバが通信ネットワーク上に分散して
    配置され、クライアントは選択した文書データベースが
    格納されているサーバに対して検索入力の文書群を送信
    し、前記サーバから送信した文書群に関する特徴的な単
    語のみを選択した概要を受信し、受信した概略に対する
    利用者の評価結果を反映した前記概要に対応する検索入
    力を他の文書データベースが格納されているサーバに送
    り、検索結果を受信する機能を有する請求項1または請
    求項2記載の文書検索方法。
  5. 【請求項5】前記サーバはクライアントから送られてき
    た文書群に対しては特徴的な単語からなる概略を作成し
    てクライアントに送信し、クライアントから送られてき
    た任意の概略に対しては関連度の高い文書群を検索しク
    ライアントに送信する請求項4記載の文書検索方法。
  6. 【請求項6】前記クライアントは検索入力の文書群と検
    索先の文書データベースを指定するインターフェースを
    有し、検索入力の文書群を利用者が指定するサーバに送
    り、当該サーバーからそれら文書群の概略を受信し、受
    信した概略を他の文書データベースを含むサーバーに送
    り、当該サーバから検索結果を受信し表示する機能を有
    する請求項4記載の文書検索方法。
  7. 【請求項7】通信ネットワーク上に分散して配置された
    各文書データベースとそれを操作するプログラムを有す
    るサーバを保有し、該サーバに接続されたクライアント
    に文書検索をサービスする文書検索サービスであって、
    前記クライアントは選択した文書データベースが格納さ
    れているサーバに対して検索入力の文書群を送信し、前
    記サーバから送信した文書群に関する特徴的な単語のみ
    を選択した概要を受信し、受信した概略に対する利用者
    の評価結果を反映した前記概要に対応する検索入力を他
    の文書データベースが格納されているサーバに送り、検
    索結果を受信する文書検索方法を可能とするとともに、
    前記サーバはクライアントから送られてきた文書群に対
    しては特徴的な単語からなる概略を作成してクライアン
    トに送信し、クライアントから送られてきた任意の概略
    に対しては関連度の高い文書群を検索しクライアントに
    送信する文書検索サービス。
JP32894098A 1998-11-19 1998-11-19 複数文書データベースを対象とした文書検索方法および文書検索サービス Expired - Lifetime JP3760057B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP32894098A JP3760057B2 (ja) 1998-11-19 1998-11-19 複数文書データベースを対象とした文書検索方法および文書検索サービス
DE69933187T DE69933187T2 (de) 1998-11-19 1999-11-16 Dokumentensuchverfahren und Dienst
EP99122074A EP1003111B1 (en) 1998-11-19 1999-11-16 A method of searching documents and a service for searching documents
US09/442,147 US6584460B1 (en) 1998-11-19 1999-11-18 Method of searching documents and a service for searching documents
US10/075,283 US7693910B2 (en) 1998-11-19 2002-02-15 Method of searching documents and a service for searching documents

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP32894098A JP3760057B2 (ja) 1998-11-19 1998-11-19 複数文書データベースを対象とした文書検索方法および文書検索サービス

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2002269885A Division JP3760148B2 (ja) 2002-09-17 2002-09-17 複数文書データベースを対象とした文書検索方法および文書検索サービス

Publications (2)

Publication Number Publication Date
JP2000155758A true JP2000155758A (ja) 2000-06-06
JP3760057B2 JP3760057B2 (ja) 2006-03-29

Family

ID=18215809

Family Applications (1)

Application Number Title Priority Date Filing Date
JP32894098A Expired - Lifetime JP3760057B2 (ja) 1998-11-19 1998-11-19 複数文書データベースを対象とした文書検索方法および文書検索サービス

Country Status (4)

Country Link
US (2) US6584460B1 (ja)
EP (1) EP1003111B1 (ja)
JP (1) JP3760057B2 (ja)
DE (1) DE69933187T2 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002189754A (ja) * 2000-12-21 2002-07-05 Ricoh Co Ltd 文書検索装置及び文書検索方法
JP2002222210A (ja) * 2001-01-25 2002-08-09 Hitachi Ltd 文書検索システム、文書検索方法及び検索サーバ
JP2006127523A (ja) * 2005-10-27 2006-05-18 Hitachi Ltd 文書情報表示システム
US7277881B2 (en) 2001-05-31 2007-10-02 Hitachi, Ltd. Document retrieval system and search server
US8046368B2 (en) 2007-04-27 2011-10-25 Hitachi, Ltd. Document retrieval system and document retrieval method
JP2019531516A (ja) * 2017-07-24 2019-10-31 マイセレブス カンパニーリミテッド 関心分野別趣向検索案内システム
EP3882785A1 (en) 2020-03-17 2021-09-22 Hitachi, Ltd. Document search system and method
US11397740B2 (en) 2017-07-24 2022-07-26 Mycelebs Co., Ltd. Method and apparatus for providing information by using degree of association between reserved word and attribute language

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7272604B1 (en) * 1999-09-03 2007-09-18 Atle Hedloy Method, system and computer readable medium for addressing handling from an operating system
US7720833B1 (en) 2000-02-02 2010-05-18 Ebay Inc. Method and system for automatically updating search results on an online auction site
JP2001265768A (ja) * 2000-03-16 2001-09-28 Fuji Xerox Co Ltd 文書統合管理装置および文書統合管理方法
US6925457B2 (en) 2001-07-27 2005-08-02 Metatomix, Inc. Methods and apparatus for querying a relational data store using schema-less queries
US7890517B2 (en) * 2001-05-15 2011-02-15 Metatomix, Inc. Appliance for enterprise information integration and enterprise resource interoperability platform and methods
US7058637B2 (en) 2001-05-15 2006-06-06 Metatomix, Inc. Methods and apparatus for enterprise application integration
JP2003029911A (ja) * 2001-07-11 2003-01-31 Sony Corp 情報処理装置および情報処理方法、記録媒体、並びにプログラム
US7146409B1 (en) * 2001-07-24 2006-12-05 Brightplanet Corporation System and method for efficient control and capture of dynamic database content
US6609124B2 (en) 2001-08-13 2003-08-19 International Business Machines Corporation Hub for strategic intelligence
WO2003030033A2 (en) * 2001-10-01 2003-04-10 Delphion, Inc. System and method for generating a work set of patents or other documents
JP3878518B2 (ja) * 2002-07-08 2007-02-07 松下電器産業株式会社 データ検索装置
US9396473B2 (en) * 2002-11-27 2016-07-19 Accenture Global Services Limited Searching within a contact center portal
JP2004310561A (ja) * 2003-04-09 2004-11-04 Hitachi Ltd 情報検索方法、情報検索システム及び検索サーバ
EP1690210A2 (en) * 2003-07-07 2006-08-16 Metatomix, Inc. Surveillance, monitoring and real-time events platform
US20050044076A1 (en) * 2003-08-18 2005-02-24 Yuh-Cherng Wu Information retrieval from multiple sources
JP2005352878A (ja) * 2004-06-11 2005-12-22 Hitachi Ltd 文書検索システム、検索サーバ、及び検索クライアント
US7533074B2 (en) 2004-07-23 2009-05-12 Sap Ag Modifiable knowledge base in a mobile device
US7908260B1 (en) 2006-12-29 2011-03-15 BrightPlanet Corporation II, Inc. Source editing, internationalization, advanced configuration wizard, and summary page selection for information automation systems
US10481878B2 (en) * 2008-10-09 2019-11-19 Objectstore, Inc. User interface apparatus and methods
US8495062B2 (en) 2009-07-24 2013-07-23 Avaya Inc. System and method for generating search terms
EP2354971A1 (en) * 2010-01-29 2011-08-10 E-Therapeutics plc Document analysis system
US8560536B2 (en) * 2010-03-11 2013-10-15 Yahoo! Inc. Methods, systems, and/or apparatuses for use in searching for information using computer platforms
US20130260849A1 (en) * 2012-03-28 2013-10-03 Microsoft Corporation Deriving word-commonness for word-games
US10235989B2 (en) * 2016-03-24 2019-03-19 Oracle International Corporation Sonification of words and phrases by text mining based on frequency of occurrence

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04138563A (ja) * 1990-09-28 1992-05-13 Fujitsu Ltd 文章読解支援装置
JPH09218881A (ja) * 1996-02-09 1997-08-19 Nippon Telegr & Teleph Corp <Ntt> 追加検索語候補提示方法、文書検索方法およびそれらの装置
JPH10269237A (ja) * 1997-03-27 1998-10-09 Hitachi Ltd 文書閲覧システム

Family Cites Families (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6474210A (en) * 1987-09-16 1989-03-20 Hitachi Chemical Co Ltd Polymerizable resin composition for decorative laminate
US5265065A (en) * 1991-10-08 1993-11-23 West Publishing Company Method and apparatus for information retrieval from a database by replacing domain specific stemmed phases in a natural language to create a search query
US5911138A (en) * 1993-06-04 1999-06-08 International Business Machines Corporation Database search facility having improved user interface
WO1995012173A2 (en) * 1993-10-28 1995-05-04 Teltech Resource Network Corporation Database search summary with user determined characteristics
US5590319A (en) * 1993-12-15 1996-12-31 Information Builders, Inc. Query processor for parallel processing in homogenous and heterogenous databases
US5642502A (en) * 1994-12-06 1997-06-24 University Of Central Florida Method and system for searching for relevant documents from a text database collection, using statistical ranking, relevancy feedback and small pieces of text
JP2900832B2 (ja) 1995-04-14 1999-06-02 富士ゼロックス株式会社 情報検索装置
US5659732A (en) * 1995-05-17 1997-08-19 Infoseek Corporation Document retrieval over networks wherein ranking and relevance scores are computed at the client for multiple database documents
US5675710A (en) * 1995-06-07 1997-10-07 Lucent Technologies, Inc. Method and apparatus for training a text classifier
US5963940A (en) * 1995-08-16 1999-10-05 Syracuse University Natural language information retrieval system and method
JPH0962693A (ja) 1995-08-24 1997-03-07 Hitachi Ltd 確率モデルによる文書分類方法
US5873076A (en) * 1995-09-15 1999-02-16 Infonautics Corporation Architecture for processing search queries, retrieving documents identified thereby, and method for using same
US5926811A (en) * 1996-03-15 1999-07-20 Lexis-Nexis Statistical thesaurus, method of forming same, and use thereof in query expansion in automated text searching
US5913215A (en) * 1996-04-09 1999-06-15 Seymour I. Rubinstein Browse by prompted keyword phrases with an improved method for obtaining an initial document set
US5826261A (en) * 1996-05-10 1998-10-20 Spencer; Graham System and method for querying multiple, distributed databases by selective sharing of local relative significance information for terms related to the query
US5859972A (en) * 1996-05-10 1999-01-12 The Board Of Trustees Of The University Of Illinois Multiple server repository and multiple server remote application virtual client computer
US5987460A (en) * 1996-07-05 1999-11-16 Hitachi, Ltd. Document retrieval-assisting method and system for the same and document retrieval service using the same with document frequency and term frequency
JP3614618B2 (ja) 1996-07-05 2005-01-26 株式会社日立製作所 文献検索支援方法及び装置およびこれを用いた文献検索サービス
JP3643470B2 (ja) 1997-09-05 2005-04-27 株式会社日立製作所 文書検索システムおよび文書検索支援方法
US6457004B1 (en) * 1997-07-03 2002-09-24 Hitachi, Ltd. Document retrieval assisting method, system and service using closely displayed areas for titles and topics
US5870740A (en) * 1996-09-30 1999-02-09 Apple Computer, Inc. System and method for improving the ranking of information retrieval results for short queries
US5987446A (en) * 1996-11-12 1999-11-16 U.S. West, Inc. Searching large collections of text using multiple search engines concurrently
JPH10254887A (ja) 1997-03-10 1998-09-25 Toshiba Corp データベースシステム
US5987454A (en) * 1997-06-09 1999-11-16 Hobbs; Allen Method and apparatus for selectively augmenting retrieved text, numbers, maps, charts, still pictures and/or graphics, moving pictures and/or graphics and audio information from a network resource
US5899995A (en) * 1997-06-30 1999-05-04 Intel Corporation Method and apparatus for automatically organizing information
JP3607462B2 (ja) * 1997-07-02 2005-01-05 松下電器産業株式会社 関連キーワード自動抽出装置及びこれを用いた文書検索システム
US6108665A (en) * 1997-07-03 2000-08-22 The Psychological Corporation System and method for optimizing behaviorial health care collection
US5845278A (en) * 1997-09-12 1998-12-01 Inioseek Corporation Method for automatically selecting collections to search in full text searches
US6018733A (en) * 1997-09-12 2000-01-25 Infoseek Corporation Methods for iteratively and interactively performing collection selection in full text searches
US5983216A (en) * 1997-09-12 1999-11-09 Infoseek Corporation Performing automated document collection and selection by providing a meta-index with meta-index values indentifying corresponding document collections
US6442540B2 (en) * 1997-09-29 2002-08-27 Kabushiki Kaisha Toshiba Information retrieval apparatus and information retrieval method
US6163782A (en) * 1997-11-19 2000-12-19 At&T Corp. Efficient and effective distributed information management
US6078917A (en) * 1997-12-18 2000-06-20 International Business Machines Corporation System for searching internet using automatic relevance feedback
US6421675B1 (en) * 1998-03-16 2002-07-16 S. L. I. Systems, Inc. Search engine
US6263342B1 (en) * 1998-04-01 2001-07-17 International Business Machines Corp. Federated searching of heterogeneous datastores using a federated datastore object
US6334131B2 (en) * 1998-08-29 2001-12-25 International Business Machines Corporation Method for cataloging, filtering, and relevance ranking frame-based hierarchical information structures
US6480843B2 (en) * 1998-11-03 2002-11-12 Nec Usa, Inc. Supporting web-query expansion efficiently using multi-granularity indexing and query processing
US6457009B1 (en) * 1998-11-09 2002-09-24 Denison W. Bollay Method of searching multiples internet resident databases using search fields in a generic form
US6347313B1 (en) * 1999-03-01 2002-02-12 Hewlett-Packard Company Information embedding based on user relevance feedback for object retrieval
US6745177B2 (en) * 1999-04-09 2004-06-01 Metro One Telecommunications, Inc. Method and system for retrieving data from multiple data sources using a search routing database
US6321228B1 (en) * 1999-08-31 2001-11-20 Powercast Media, Inc. Internet search system for retrieving selected results from a previous search
US6704722B2 (en) * 1999-11-17 2004-03-09 Xerox Corporation Systems and methods for performing crawl searches and index searches
US6883001B2 (en) * 2000-05-26 2005-04-19 Fujitsu Limited Document information search apparatus and method and recording medium storing document information search program therein

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04138563A (ja) * 1990-09-28 1992-05-13 Fujitsu Ltd 文章読解支援装置
JPH09218881A (ja) * 1996-02-09 1997-08-19 Nippon Telegr & Teleph Corp <Ntt> 追加検索語候補提示方法、文書検索方法およびそれらの装置
JPH10269237A (ja) * 1997-03-27 1998-10-09 Hitachi Ltd 文書閲覧システム

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002189754A (ja) * 2000-12-21 2002-07-05 Ricoh Co Ltd 文書検索装置及び文書検索方法
JP2002222210A (ja) * 2001-01-25 2002-08-09 Hitachi Ltd 文書検索システム、文書検索方法及び検索サーバ
US7277881B2 (en) 2001-05-31 2007-10-02 Hitachi, Ltd. Document retrieval system and search server
JP2006127523A (ja) * 2005-10-27 2006-05-18 Hitachi Ltd 文書情報表示システム
US8046368B2 (en) 2007-04-27 2011-10-25 Hitachi, Ltd. Document retrieval system and document retrieval method
JP2019531516A (ja) * 2017-07-24 2019-10-31 マイセレブス カンパニーリミテッド 関心分野別趣向検索案内システム
US11269964B2 (en) 2017-07-24 2022-03-08 Mycelebs Co., Ltd. Field-of-interest based preference search guidance system
US11397740B2 (en) 2017-07-24 2022-07-26 Mycelebs Co., Ltd. Method and apparatus for providing information by using degree of association between reserved word and attribute language
EP3882785A1 (en) 2020-03-17 2021-09-22 Hitachi, Ltd. Document search system and method

Also Published As

Publication number Publication date
JP3760057B2 (ja) 2006-03-29
US20020078030A1 (en) 2002-06-20
DE69933187D1 (de) 2006-10-26
US7693910B2 (en) 2010-04-06
EP1003111A1 (en) 2000-05-24
EP1003111B1 (en) 2006-09-13
DE69933187T2 (de) 2007-09-13
US6584460B1 (en) 2003-06-24

Similar Documents

Publication Publication Date Title
JP3760057B2 (ja) 複数文書データベースを対象とした文書検索方法および文書検索サービス
JP3225912B2 (ja) 情報検索装置、方法及び記録媒体
Chang et al. Enabling concept-based relevance feedback for information retrieval on the WWW
EP0722145B1 (en) Information retrieval system and method of operation
US5303361A (en) Search and retrieval system
JP3347088B2 (ja) 関連情報検索方法およびシステム
US7743054B2 (en) Information retrieval system
CN103699700B (zh) 一种搜索引导的生成方法、系统及相关服务器
US7024405B2 (en) Method and apparatus for improved internet searching
US20090125504A1 (en) Systems and methods for visualizing web page query results
JP2003345810A (ja) 文書検索方法、文書検索システム及び文書検索結果示方システム
Rasolofo et al. Result merging strategies for a current news metasearcher
JP2002519751A (ja) 文脈に基づきユーザーのプロフィールが駆動する情報検索
US20050278293A1 (en) Document retrieval system, search server, and search client
US6850954B2 (en) Information retrieval support method and information retrieval support system
JP2004287725A (ja) 検索処理方法及びプログラム
JP4025517B2 (ja) 文書検索システムおよびサーバ
KR20000023961A (ko) 정보 모델링방법 및 데이터베이스 검색시스템
US20100031178A1 (en) Computer system, information collection support device, and method for supporting information collection
JPH07152771A (ja) 利用者情報管理装置、情報フィルタ、情報分類装置、情報再生装置、情報検索装置及び仮名漢字変換装置
Dobie et al. A flexible architecture for content and concept based multimedia information exploration
JP3760148B2 (ja) 複数文書データベースを対象とした文書検索方法および文書検索サービス
JP5031416B2 (ja) 検索方法および検索装置
JP2003256472A (ja) 文書検索システム
JPH1185794A (ja) 検索語入力装置および検索語入力プログラムを記録した記録媒体

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050329

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050510

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050823

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051004

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20051004

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20051220

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060106

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090113

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100113

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100113

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110113

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110113

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120113

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130113

Year of fee payment: 7

EXPY Cancellation because of completion of term