JPH11154164A - 全文検索処理における適合度算出方法および該方法に係るプログラムを格納した記憶媒体 - Google Patents

全文検索処理における適合度算出方法および該方法に係るプログラムを格納した記憶媒体

Info

Publication number
JPH11154164A
JPH11154164A JP9337713A JP33771397A JPH11154164A JP H11154164 A JPH11154164 A JP H11154164A JP 9337713 A JP9337713 A JP 9337713A JP 33771397 A JP33771397 A JP 33771397A JP H11154164 A JPH11154164 A JP H11154164A
Authority
JP
Japan
Prior art keywords
search
document
hits
result
term
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9337713A
Other languages
English (en)
Inventor
Yukio Hoshi
幸雄 星
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP9337713A priority Critical patent/JPH11154164A/ja
Publication of JPH11154164A publication Critical patent/JPH11154164A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 (修正有) 【課題】Webページの全テキストから所望の文字列を
検索したり、複数の文書の全テキストから所望の文字列
を検索する全文検索システムにおいて、AND検索でも
OR検索でもユーザの感覚に合った使い勝手のよいテキ
スト検索方法および該方法に係るプログラムを格納した
記憶媒体を提供する。 【解決手段】各検索タームごとに検索を実行し、その検
索タームを含む文書の識別子、および検索された文書に
含まれる検索タームの数を示すヒット件数を、検索結果
として取得し、検索条件としてAND条件が指定されて
いた場合は、取得された各検索タームの検索結果から、
指定されたすべての検索タームを含む文書の識別子を求
めるとともに、その文書のヒット件数を、各検索ターム
ごとのヒット件数を加算した値とし、求めた各文書のヒ
ット件数から、各文書のスコア値を算出する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、全文検索処理にお
ける適合度算出方法および該方法に係るプログラムを格
納した記憶媒体に関する。
【0002】
【従来の技術】近年、インターネットのWWW(World
Wide Web)の検索サービス(サーチ・エンジン)では、
登録したWebページの全テキストから所望の文字列を
検索できる検索システムが用いられているものがある。
また、各種の文書検索システムでも、各文書の全テキス
トから所望の文字列を検索するものが知られている。そ
のような全文検索システムでは、いわゆるランキング検
索を行なうことができるものがある。
【0003】ランキング検索とは、文書検索時、複数の
文書がヒットした場合、それぞれの文書に対し、得点を
付与しその得点により文書のソートを行なう機能であ
る。例えば、文字列Xを含む文書を検索して、文書Aで
はヒット件数が5件(すなわち、文字列Xが文書Aに5
ヶ所出現)で、文書Bではヒット件数が8件(すなわ
ち、文字列Xが文書Bに8ヶ所出現)であったとする。
この場合、ランキング検索機能により、これらのヒット
件数のうちの最大値を100とした各文書のスコア値
(適合度)、すなわち文書Bのスコア値が100、文書
Aのスコア値が5÷8×100≒63を、それぞれ表示
することができる。また、検索結果を表示するときに、
スコア値の大きい順にソートし、文書Bを先に、文書A
を後に、表示することができる。スコア値を表示するこ
とにより、ユーザは、検索された文書Aと文書Bとで
は、文書Bの方が検索文字列Xを多く含んでおり、文書
Aは文書Bの63%程度の出現率で検索文字列Xを含ん
でいることが分かる。また、スコア値の大きい順に表示
されるので、より多くの検索文字列を含む文書が先に表
示され、ユーザにとっては使い勝手がよくなる。
【0004】上述したような検索システムでは、通常、
検索文字列を複数指定することもできる。複数の検索文
字列は、例えば、ANDやORなどの検索条件でつなが
れる。ANDは複数の検索文字列をすべて含む文書を検
索せよという意味であり、ORは複数の検索文字列のう
ちの少なくとも1つを含む文書を検索せよという意味で
ある。
【0005】
【発明が解決しようとする課題】ところで、上記ランキ
ング検索機能を使用した検索で、ANDやORなどの検
索条件を指定して複数の検索文字列で検索を行なう場
合、スコア値の計算は拡張ブーリアン(boolean)に基
づいていた。したがって、AND検索ではヒット件数の
少ない方からスコア値を計算し、OR検索ではヒット件
数の多い方からスコア値を計算していた。例えば、検索
文字列XとYとでAND検索を行なう場合、文書Aでは
検索文字列Xのヒット件数が10件で検索文字列Yのヒ
ット件数が3件であった場合、拡張ブーリアンによれば
X AND Yのヒット件数は3件ということになり、
このヒット件数3件に基づいて文書Aのスコア値が計算
される。しかし、このようなヒット件数の求め方では、
一般的には使い勝手がよくない。上記の例では、文字列
Xのヒット件数が10件もあるのに、X AND Yの
ヒット件数は3件とされてしまい、ユーザの感覚に合わ
ないことが多いからである。
【0006】本発明は、上述の従来形における問題点に
鑑み、AND検索でもOR検索でもユーザの感覚に合っ
た使い勝手のよい全文検索処理における適合度算出方法
および該方法に係るプログラムを格納した記憶媒体を提
供することを目的とする。
【0007】
【課題を解決するための手段】上記目的を達成するため
に、請求項1に係る発明は、指定された複数の検索ター
ムおよび検索条件でテキスト文書を検索し、検索結果を
返す全文検索処理における適合度算出方法であって、各
検索タームごとに検索を実行し、その検索タームを含む
文書の識別子、および検索された文書に含まれる検索タ
ームの数を示すヒット件数を、検索結果として取得する
検索ステップと、検索条件としてAND条件が指定され
ていた場合、前記検索ステップにより取得された各検索
タームの検索結果から、指定されたすべての検索ターム
を含む文書の識別子を求めるとともに、その文書のヒッ
ト件数を、各検索タームごとのヒット件数を加算した値
とする検索結果合成ステップと、前記検索結果合成ステ
ップにより得られた各文書のヒット件数から、各文書の
適合度を算出する適合度算出ステップとを備えたことを
特徴とする。
【0008】請求項2に係る発明は、指定された複数の
検索タームおよび検索条件でテキスト文書を検索し、検
索結果を返す全文検索処理における適合度算出方法に係
るプログラムを格納した記憶媒体であって、該プログラ
ムは、各検索タームごとに検索を実行し、その検索ター
ムを含む文書の識別子、および検索された文書に含まれ
る検索タームの数を示すヒット件数を、検索結果として
取得する検索ステップと、検索条件としてAND条件が
指定されていた場合、前記検索ステップにより取得され
た各検索タームの検索結果から、指定されたすべての検
索タームを含む文書の識別子を求めるとともに、その文
書のヒット件数を、各検索タームごとのヒット件数を加
算した値とする検索結果合成ステップと、前記検索結果
合成ステップにより得られた各文書のヒット件数から、
各文書の適合度を算出する適合度算出ステップとを備え
たことを特徴とする。
【0009】
【発明の実施の形態】以下、図面を使って本発明の実施
の形態を詳細に説明する。
【0010】図1は、本発明に係る全文検索処理におけ
る適合度算出方法を適用したテキスト検索システムのシ
ステム構成図である。WWWブラウザ101とWWWサ
ーバ103が、イントラネットまたはインターネットな
どのネットワーク102に接続されている。WWWサー
バ103には、LAN(ローカルエリアネットワーク)
104を介して全文検索サーバ105が接続されてい
る。全文検索サーバ105には、テキストデータベース
106が接続されている。WWWブラウザ101、WW
Wサーバ103、および全文検索サーバ105は、具体
的には、それぞれの機能を果たす所定のソフトウエアが
動作しているパーソナルコンピュータやワークステーシ
ョンからなる。また、WWWブラウザ101には、ユー
ザが操作するマウスやキーボードなどの入力装置と、各
種の情報を表示する表示装置が備えられているものとす
る。
【0011】WWWブラウザ101は、表示装置に検索
画面を表示し、入力装置によりユーザの入力を受け付け
る。図2は、検索画面の表示例を示す。ウインドウ20
0内の表示領域201に、検索分野見出し211、検索
ボタン212、検索条件見出し213、ANDボタン2
14、ORボタン215、および検索ターム入力領域2
21〜223が表示されている。検索分野見出し211
には、この検索システムで文書検索する分野が表示され
ている。この例は新聞記事の文書を検索するシステムで
あるので、検索分野見出し211には「新聞記事」と表
示されている。ユーザは、この検索画面上で、検索ター
ム入力領域221〜223に検索したい文字列を入力
し、必要に応じてANDボタン214またはORボタン
215をオンしてANDまたはORの検索条件を選択
し、検索ボタン212をオン(マウスでクリック)す
る。これにより、WWWブラウザ101から、ユーザの
入力に応じた検索タームおよび検索条件で、検索要求が
WWWサーバ103に送信される。
【0012】図2において、検索ターム入力領域は22
1〜223の3つが備えられているが、検索タームを1
個だけ入力して検索ボタン212をオンして検索をかけ
てもよいし、検索タームを2個または3個の複数入力し
て検索ボタン212をオンして検索をかけてもよい。検
索タームが1個のみ入力されているときは、ANDボタ
ン214およびORボタン215によるANDまたはO
Rの検索条件の指定は無視される。検索タームが2個ま
たは3個入力されている場合は、ANDボタン214ま
たはORボタン215をオンすることにより、複数の検
索タームをAND条件で検索するか、OR条件で検索す
るかを選択することができる。表示上は、選択されてい
るボタンが黒丸で、選択されていないボタンが白丸で、
それぞれ、表示される。図2では、検索タームが2個入
力され、ANDボタン214が選択状態で、ORボタン
215が非選択状態であるから、この状態で検索ボタン
212をオンすると、「マルチメディア」と「インター
ネット」の両方を含む文書を検索する指示を行なったこ
とになる。
【0013】再び図1に戻って、上記図2の検索画面で
入力された検索タームおよび検索条件の検索要求がWW
Wサーバ103で受信されると、WWWサーバ103
は、その要求に応じて全文検索サーバ105に検索を依
頼する。全文検索サーバ105に接続されているテキス
トデータベース106には、検索対象の複数の文書ファ
イル(この例では新聞記事の文書)、およびそれらの文
書ファイルを検索するためのインデックスが格納されて
いる。インデックスの構造および検索方式については図
4を参照して後述する。全文検索サーバ105は、WW
Wサーバ103からの依頼に基づいて、テキストデータ
ベース106のインデックスを参照し、指示された検索
タームを含む文書を検索し、その結果(文書番号)をW
WWサーバ103に返す。また、全文検索サーバ105
は、検索結果の文書ごとにスコア値(適合度)を算出
し、そのスコア値に基づいて、検索結果である文書番号
をソートしてWWWサーバ103に返す。
【0014】WWWサーバ103は、全文検索サーバ1
05からの検索結果、すなわち検索された文書番号とス
コア値(文書番号はスコア値に基づいてソートされてい
る)を受け、検索結果一覧の画面データを作成し、その
画面データをWWWブラウザ101に送信する。WWW
ブラウザ101は、その検索結果一覧の画面データを受
信して画面表示し、これによりブラウザ101を操作し
ているユーザは検索結果一覧を見ることができる。
【0015】図3は、WWWブラウザ101に表示され
る検索結果一覧の表示画面の例である。ウインドウ30
0内の表示領域301に、検索分野見出し311、結果
一覧見出し312、検索結果である文書に関する表示3
21〜323、および次結果一覧ボタン313が表示さ
れている。検索分野見出し311には、図2の211と
同様に、この検索システムで文書検索する分野が「新聞
記事」と表示されている。結果一覧見出し312は、そ
の下側に検索結果の一覧を表示することを示す見出しで
ある。検索結果である文書に関する表示321〜323
は、文書番号の表示およびスコア値の表示からなり、ス
コア値が大きい順に並べられて表示される。検索された
文書の数が多いときには、次結果一覧ボタン313をオ
ンすることにより、検索結果一覧の次のページが表示さ
れる。
【0016】図4は、このテキスト検索システムにおけ
る検索方式であるn−gramインデックス方式の説明
図である。この方式は、連続するn文字からなる文字列
に対して、それを含む文書の識別子(文書番号)と、そ
の文字列が出現する位置を対応づけるインデックステー
ブルを生成し、それを基に検索タームを含む文書を検索
する全文検索方式である。図4では、1−gramイン
デックスを使用した例を示す。
【0017】図4において、文書001(文書番号が0
01の文書)が「…海洋には数万種の微生物が生息する
といわれ…」という文章を含んでいるとする。この文章
の各文字の出現位置は先頭から何文字目かで表し、例え
ば、「海」は13文字目、「洋」は14文字目、「に」
は15文字目、…である。この文書001を1−gra
mインデックス401に登録すると、各文字のインデッ
クスに文書番号と出現位置が設定される。例えば、文書
001中では「に」が15文字目に出現しているので、
「に」のインデックス411には、文書番号「001」
と出現位置「15」が設定される。また、文書001中
では「微」が21文字目に出現しているので「微」のイ
ンデックス412には、文書番号「001」と出現位置
「21」が設定される。以下同様にして、文書001の
全文字を1−gramインデックス401に登録してお
く。また、他の文書についても同様にしてインデックス
に登録しておく。例えば、「に」のインデックス411
には、文書番号「008」と出現位置「12」および
「35」が登録されているので、文書番号008の文書
の12文字目および35文字目に「に」が出現すること
が分かる。
【0018】全文検索サーバ105では、このインデッ
クス401を用いた検索を以下のように行なう。まずW
WWサーバ103から、検索ターム402として「微生
物」が与えられて検索が指示されたとする。この検索タ
ーム402を1文字ずつインデックス401と照合する
と、「微」のインデックス412に文書番号「001」
の出現位置「21」が登録されており、「生」のインデ
ックス413に文書番号「001」の出現位置「22」
が登録されており、「物」のインデックス414に文書
番号「001」の出現位置「23」が登録されているの
で、文書番号001の文書の出現位置21〜23の位置
に「微生物」という文字列が存在することが分かる。同
様に、文書番号056の出現位置5〜7の位置に「微生
物」という文字列が存在することが分かる。この検索結
果は、文書番号と出現位置の羅列403で表される。
【0019】図4に図示した検索結果403は、この検
索ターム「微生物」402が、文書番号001の文書の
21文字目に出現し、文書番号056の5文字目に出現
することを示しているが、1つの文書中に検索タームが
複数含まれているときには、インデックスからその出現
位置がすべて検索され検索結果403に反映される。例
えば、文書番号001の文書の21文字目のほかに、3
8文字目および45文字目に検索ターム「微生物」40
2が出現するとすると、検索結果403は、文書番号0
01のあとに出現位置21、38、45が続くことにな
る。なお、文書番号とその文書内の出現位置のデータと
の組が1つのまとまりと把握され、そのような組データ
の区切り位置(図4の検索結果403では、出現位置2
1と文書番号056の境界)は、分離記号などにより明
確になっているものとする。
【0020】以上のようにして、検索結果403から、
検索タームを含む文書の文書番号と、検索タームがその
文書中のどこに出現するかが分かるので、出現位置の数
を数えれば、その文書中に検索タームが幾つ含まれるか
(すなわち、ヒット件数が)分かる。そこで、全文検索
サーバ105では、検索結果から各文書ごとのヒット件
数を求め、そのヒット件数に基づいてスコア値を算出
し、WWWサーバ103に返す。
【0021】図5は、全文検索サーバ105における検
索とスコア値算出処理のフローチャートを示す。ステッ
プ501で、WWWサーバ103からの依頼に含まれる
検索タームを1つ取り出し、その検索タームをキーワー
ドとして、図4で説明したようにインデックスを検索す
る。これにより、図4の403に示すような検索結果
(その検索タームを含む文書の文書番号と文書中での出
現位置との羅列)が得られる。次に、ステップ502
で、検索結果があったか否かを判別する。検索結果がな
かったときは、ステップ506に分岐する。検索結果が
あったときは、ステップ503で、その検索結果から各
文書のヒット件数を求める。上述したように、ヒット件
数は各文書の出現位置の数を数えれば分かる。いま、例
えば1個目の検索タームで検索した結果、以下の(検索
結果1)のように文書番号とヒット件数が求められたと
する。
【0022】(検索結果1) 文書番号002:ヒット件数6 文書番号008:ヒット件数9 文書番号016:ヒット件数14
【0023】次に、ステップ504で、前回までの検索
タームの検索結果と今回の検索タームの検索結果とを合
成する。始めは1個目の検索タームの検索であり前回ま
での検索結果はないから、ステップ504では何もせ
ず、上記の検索結果を保持するだけである。次に、ステ
ップ505で、未だ検索すべき検索タームが指定されて
いるか否か判別する。なければ、1個の検索タームの検
索であったということであるから、ステップ506で保
持されている検索結果に基づいて各文書のスコア値を算
出し、求めたスコア値に基づいてソートした検索結果と
該スコア値とをWWWサーバ103に返す。
【0024】ステップ505で未だ検索すべき検索ター
ムが残っていたら、ステップ501に戻って、残ってい
る検索タームで検索を行なう。この場合、ステップ50
4では、前回までに行なわれた検索結果が保持されてい
るので、その検索結果に新たな検索結果を合成する。こ
の合成の処理について具体例で詳しく説明する。いま、
1個目の検索タームXで検索した結果、上記(検索結果
1)が保持されており、次に2個目の検索タームYで検
索して下記の(検索結果2)がステップ503で得られ
たとする。
【0025】(検索結果2) 文書番号005:ヒット件数7 文書番号008:ヒット件数3 文書番号016:ヒット件数21
【0026】検索条件としてAND条件が指示されてい
るとき、ステップ504の合成処理では、前回までの
(検索結果1)と今回の(検索結果2)とのANDを取
って新たな検索結果を作成保持する。いま説明している
検索結果の例では、文書番号008と016が(検索結
果1)と(検索結果2)の両方に存在するので、これら
が抽出される。また、ヒット件数については、各文書ご
とに前回までの(検索結果1)のヒット件数と今回の
(検索結果2)のヒット件数とを加算して新たなヒット
件数にする。したがって、新たに生成される検索結果は
下記の(検索結果3)になる。
【0027】(検索結果3) 文書番号008:ヒット件数12 文書番号016:ヒット件数35
【0028】文書番号008のヒット件数12は、(検
索結果1)の文書番号008のヒット件数9と(検索結
果2)の文書番号008のヒット件数3とを加算した値
である。また、文書番号016のヒット件数35は、
(検索結果1)の文書番号016のヒット件数14と
(検索結果2)の文書番号016のヒット件数21とを
加算した値である。
【0029】さらに、未だ検索すべき検索タームがある
場合は、上記(検索結果3)を前回までの検索結果とし
てステップ501からの処理を繰り返せばよい。すべて
の検索タームについて検索が終了したら、ステップ50
6で、その時点で保持されている検索結果に基づいてス
コア値を算出する。スコア値は、従来と同様にヒット件
数が最大のものを100として、各文書ごとに求める。
【0030】上記はAND条件が指定された場合につい
て説明したが、OR条件が指定された場合も同様であ
る。AND条件では前回までの検索結果と今回の検索結
果との両方に含まれる文書番号を抽出したが、OR条件
では前回までの検索結果と今回の検索結果との少なくと
も何れか一方に含まれる文書番号を抽出すればよい。ま
た、ヒット件数の求めかたは、AND条件の場合と同様
に、各文書のヒット件数を加算して新たなヒット件数と
する。
【0031】上記発明の実施の形態によれば、AND条
件で複数の検索タームで検索した場合でも、各文書のヒ
ット件数を加算した値に基づいてスコア値を算出してい
るので、従来の拡張ブーリアンで実施していたヒット件
数の少ない方からスコア値を計算する方式に比較して、
ユーザにとって、より使い勝手の良い検索システムにな
る。
【0032】なお、上記実施の形態では、AND条件の
ときに各文書のヒット件数を加算した値からスコア値を
算出しているが、加算する代わりに、各文書のヒット件
数のうちの最大値を用いてスコア値を算出してもよい。
また、上記実施の形態では1−gramインデックスの
例で説明したが、nを2以上としたn−gramインデ
ックスでも同様に適用可能である。
【0033】
【発明の効果】以上説明したように、本発明によれば、
AND条件で複数の検索タームを指定して検索する場合
に、各文書のヒット件数を各検索タームのヒット件数の
和としているので、従来、ある検索タームのヒット件数
は多いが別の検索タームのヒット件数が少ないためにス
コア値が大きくならず(ヒット件数が少ない方に基づい
てスコア値を算出していたためである)、上位に表示さ
れなくなる文書があるという不都合が解消され、そのよ
うな文書でも上位に表示されるようになる。したがっ
て、ユーザにとって使い勝手の良いテキスト検索を行な
うことができる。
【図面の簡単な説明】
【図1】本発明に係るテキスト検索システムのシステム
構成図
【図2】検索画面の表示例を示す図
【図3】WWWブラウザに表示される検索結果一覧の表
示画面の例を示す図
【図4】n−gramインデックス方式の説明図
【図5】全文検索サーバにおける検索とスコア値算出処
理のフローチャート図
【符号の説明】
101…WWWブラウザ、102…イントラネットまた
はインターネットなどのネットワーク、103…WWW
サーバ、104…LAN(ローカルエリアネットワー
ク)、105…全文検索サーバ、106…テキストデー
タベース。

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】指定された複数の検索タームおよび検索条
    件でテキスト文書を検索し、検索結果を返す全文検索処
    理における適合度算出方法であって、 各検索タームごとに検索を実行し、その検索タームを含
    む文書の識別子、および検索された文書に含まれる検索
    タームの数を示すヒット件数を、検索結果として取得す
    る検索ステップと、 検索条件としてAND条件が指定されていた場合、前記
    検索ステップにより取得された各検索タームの検索結果
    から、指定されたすべての検索タームを含む文書の識別
    子を求めるとともに、その文書のヒット件数を、各検索
    タームごとのヒット件数を加算した値とする検索結果合
    成ステップと、 前記検索結果合成ステップにより得られた各文書のヒッ
    ト件数から、各文書の適合度を算出する適合度算出ステ
    ップとを備えたことを特徴とする全文検索処理における
    適合度算出方法。
  2. 【請求項2】指定された複数の検索タームおよび検索条
    件でテキスト文書を検索し、検索結果を返す全文検索処
    理における適合度算出方法に係るプログラムを格納した
    記憶媒体であって、 該プログラムは、 各検索タームごとに検索を実行し、その検索タームを含
    む文書の識別子、および検索された文書に含まれる検索
    タームの数を示すヒット件数を、検索結果として取得す
    る検索ステップと、 検索条件としてAND条件が指定されていた場合、前記
    検索ステップにより取得された各検索タームの検索結果
    から、指定されたすべての検索タームを含む文書の識別
    子を求めるとともに、その文書のヒット件数を、各検索
    タームごとのヒット件数を加算した値とする検索結果合
    成ステップと、 前記検索結果合成ステップにより得られた各文書のヒッ
    ト件数から、各文書の適合度を算出する適合度算出ステ
    ップとを備えたことを特徴とする全文検索処理における
    適合度算出方法に係るプログラムを格納した記憶媒体。
JP9337713A 1997-11-21 1997-11-21 全文検索処理における適合度算出方法および該方法に係るプログラムを格納した記憶媒体 Pending JPH11154164A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9337713A JPH11154164A (ja) 1997-11-21 1997-11-21 全文検索処理における適合度算出方法および該方法に係るプログラムを格納した記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9337713A JPH11154164A (ja) 1997-11-21 1997-11-21 全文検索処理における適合度算出方法および該方法に係るプログラムを格納した記憶媒体

Publications (1)

Publication Number Publication Date
JPH11154164A true JPH11154164A (ja) 1999-06-08

Family

ID=18311273

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9337713A Pending JPH11154164A (ja) 1997-11-21 1997-11-21 全文検索処理における適合度算出方法および該方法に係るプログラムを格納した記憶媒体

Country Status (1)

Country Link
JP (1) JPH11154164A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001297089A (ja) * 2000-04-14 2001-10-26 Ricoh Co Ltd 文書検索方法およびその方法を実施するためのプログラムを記憶した記憶媒体
JP2002056022A (ja) * 2000-08-14 2002-02-20 U System:Kk 検索システム
KR20030082109A (ko) * 2002-04-16 2003-10-22 (주)메타웨이브 앤드 연산자를 이용한 색인어 검색 및 정보 제공 시스템및 방법
KR20030082110A (ko) * 2002-04-16 2003-10-22 (주)메타웨이브 앤드 연산자 및 문서 내 연관성을 이용한 색인어 검색 및정보 제공 시스템 및 방법
JP2005346560A (ja) * 2004-06-04 2005-12-15 Hitachi Ltd 検索結果提示方法およびその装置並びに検索結果提示プログラムを格納した記憶媒体
WO2010109594A1 (ja) * 2009-03-24 2010-09-30 三菱電機インフォメーションシステムズ株式会社 文書検索装置、文書検索システム、文書検索プログラム、および文書検索方法
US9471548B2 (en) 2012-08-10 2016-10-18 International Business Machines Corporation Text processing method, system and computer program

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09153051A (ja) * 1995-11-29 1997-06-10 Hitachi Ltd 類似文書検索方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09153051A (ja) * 1995-11-29 1997-06-10 Hitachi Ltd 類似文書検索方法

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001297089A (ja) * 2000-04-14 2001-10-26 Ricoh Co Ltd 文書検索方法およびその方法を実施するためのプログラムを記憶した記憶媒体
JP2002056022A (ja) * 2000-08-14 2002-02-20 U System:Kk 検索システム
KR20030082109A (ko) * 2002-04-16 2003-10-22 (주)메타웨이브 앤드 연산자를 이용한 색인어 검색 및 정보 제공 시스템및 방법
KR20030082110A (ko) * 2002-04-16 2003-10-22 (주)메타웨이브 앤드 연산자 및 문서 내 연관성을 이용한 색인어 검색 및정보 제공 시스템 및 방법
JP2005346560A (ja) * 2004-06-04 2005-12-15 Hitachi Ltd 検索結果提示方法およびその装置並びに検索結果提示プログラムを格納した記憶媒体
WO2010109594A1 (ja) * 2009-03-24 2010-09-30 三菱電機インフォメーションシステムズ株式会社 文書検索装置、文書検索システム、文書検索プログラム、および文書検索方法
JPWO2010109594A1 (ja) * 2009-03-24 2012-09-20 三菱電機インフォメーションシステムズ株式会社 文書検索装置、文書検索システム、文書検索プログラム、および文書検索方法
US9471548B2 (en) 2012-08-10 2016-10-18 International Business Machines Corporation Text processing method, system and computer program
US9652526B2 (en) 2012-08-10 2017-05-16 International Business Machines Corporation Text processing method, system and computer program
US10353932B2 (en) 2012-08-10 2019-07-16 International Business Machines Corporation Text processing method, system and computer program

Similar Documents

Publication Publication Date Title
US10929487B1 (en) Customization of search results for search queries received from third party sites
US6636853B1 (en) Method and apparatus for representing and navigating search results
US7085761B2 (en) Program for changing search results rank, recording medium for recording such a program, and content search processing method
US7693910B2 (en) Method of searching documents and a service for searching documents
US9367588B2 (en) Method and system for assessing relevant properties of work contexts for use by information services
US7096218B2 (en) Search refinement graphical user interface
US6564213B1 (en) Search query autocompletion
JP3099756B2 (ja) 文書処理装置、単語抽出装置及び単語抽出方法
US20020073079A1 (en) Method and apparatus for searching a database and providing relevance feedback
US20050060290A1 (en) Automatic query routing and rank configuration for search queries in an information retrieval system
US20020099685A1 (en) Document retrieval system; method of document retrieval; and search server
US20030078914A1 (en) Search results using editor feedback
EP0960376A2 (en) Text processing and retrieval system and method
US7024405B2 (en) Method and apparatus for improved internet searching
JP2003016089A (ja) 情報検索システム及びサーバ
WO2009152469A1 (en) Systems and methods for classifying search queries
US20050114317A1 (en) Ordering of web search results
JP2000331032A (ja) 文書処理装置、単語抽出装置及び単語抽出方法
JPH11154164A (ja) 全文検索処理における適合度算出方法および該方法に係るプログラムを格納した記憶媒体
JP2001188802A (ja) 情報検索装置及び情報検索方法
JPH11296537A (ja) 情報検索システム、情報提供装置、情報検索端末装置、情報検索方法および記憶媒体
JP2006228072A (ja) 地図情報システム連動サーチエンジンサーバーシステム。
JPH03294964A (ja) 文書検索方法
JP2010282403A (ja) 文書検索方法
JP2005234772A (ja) 文書管理装置および方法