JP3503506B2 - 情報検索方法、情報検索装置及び情報検索プログラムを記録した記録媒体 - Google Patents

情報検索方法、情報検索装置及び情報検索プログラムを記録した記録媒体

Info

Publication number
JP3503506B2
JP3503506B2 JP00149599A JP149599A JP3503506B2 JP 3503506 B2 JP3503506 B2 JP 3503506B2 JP 00149599 A JP00149599 A JP 00149599A JP 149599 A JP149599 A JP 149599A JP 3503506 B2 JP3503506 B2 JP 3503506B2
Authority
JP
Japan
Prior art keywords
similarity
calculating
documents
word
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP00149599A
Other languages
English (en)
Other versions
JP2000200285A (ja
Inventor
茂夫 島田
睦 熊本
恒昭 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP00149599A priority Critical patent/JP3503506B2/ja
Publication of JP2000200285A publication Critical patent/JP2000200285A/ja
Application granted granted Critical
Publication of JP3503506B2 publication Critical patent/JP3503506B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、情報検索技術に係
り、特に、検索者の意図を反映させて情報検索を行な
い、検索意図に適合した文書をより多く検索対象の文書
群から抽出可能な情報検索方法、情報検索装置及び情報
検索プログラムを記録した記録媒体に関する。
【0002】
【従来の技術】従来の技術における情報検索方法には大
きく分けて2種類ある。第1の方法は、検索要求として
文字列を指定し、その文字列を含む文書を検索対象の文
書群から抽出する方法である。第2の方法は、まず、文
書及び検索要求を何らかの基準で特徴付けし、特徴付け
されたもの同士の類似している度合いである類似度を計
算する。次に、類似度の高い対象を適合の度合いが高い
対象とし、類似度が高い順に検索対象の文書群から抽出
する方法である。
【0003】第1の方法の代表的な例は文字列一致方法
である。すなわち、検索要求の文字列と一致する文字列
を含む文書を抽出する方法である。第2の方法の例とし
てはtf・idf方式がある。この方法は、文書に含ま
れる単語を統計的に分析し、単語の出現頻度を利用し
て、それを単語の統計的重要度と見なし、一致した単語
の重要度を用いて文書の適合度を順序付ける方法であ
る。上記の例はいずれも検索対象となる文書が検索要求
の文字列を含むことを前提とする。
【0004】第2の方法の例として検索要求の文字列が
含まれていなくてもよい方法がある。その方法は、単語
に関する意味知識を用意し、文書を構成する単語を意味
知識で展開することにより特徴付けし、その特徴付けさ
れたもの同士の類似度を計算する方法である。
【0005】
【発明が解決しようとする課題】上述した通り、文字列
を含むことを前提とする方法では検索要求に含まれる文
字列と正確に一致する文字列を含む文書が検索される。
また、同義語辞書(シソーラスを含む)を用意し、同義
語が含まれていれば検索できるようにすることにより検
索の漏れを少なくする試みもなされている。
【0006】文字列あるいはその同義語を含む文書を検
索するこの方法は、検索要求の文字列が検索者の検索意
図を明確に表す場合に非常に有効である。しかしなが
ら、この方法によると、文字列の意味と、その文字列を
含む文書の主題とが無関係であっても検索され得るとい
う特性がある。一方、文書を意味知識を用いて特徴付け
る方法によると、必ずしも文字列が含まれていなくても
よく、検索要求で指定された単語でなくともその単語の
意味に関連する文書が検索される。しかしながら、必ず
しも文字列を含む文書が検索されるとは限らず、文字列
を含む文書を検索したい場合にはこの方法は適していな
い。
【0007】本発明は、上記の点に鑑みなされたもので
あり、検索者の意図を反映させて、適合する文書をより
多く検索対象の文書群から抽出する情報検索方法、情報
検索装置及び情報検索プログラムを記録した記録媒体を
提供することを目的とする。
【0008】
【課題を解決するための手段】上記目的を達成するため
に、本発明は次のように構成される。本発明は、複数の
文書を検索対象とし、該検索対象における各文書と1つ
以上の単語からなる単語列との類似度を算出し、該類似
度に従い該検索対象から1つ又は複数の文書を提示する
情報検索方法であり、前記各文書毎に前記類似度を複数
の方法により複数種類算出する第1の算出ステップと、
該複数種類の類似度を合成して1つの合成類似度を算出
する第2の算出ステップと、該合成類似度に従って前記
検索対象から前記1つ又は複数の文書を提示するステッ
プとを有する。
【0009】本発明によれば、複数の異なる方法で類似
度を算出し、それぞれの類似度を合成することにより、
単独の類似度を用いるだけであった従来の技術における
問題点は解消され、検索意図により適合した検索結果を
得ることが可能となる。上記の構成において、本発明は
次のような構成をとることができる。前記第1の算出ス
テップにおける前記複数の方法は、前記各文書と前記単
語列における単語の連想関係を用いて、単語の連想の重
みにより類似度を算出する方法と、前記各文書中に前記
単語列中の単語の文字列と一致する文字列が存在するか
どうかを調べることにより類似度を算出する方法の2つ
の方法である。
【0010】本発明によれば、検索要求の文字列が必ず
しも一致しなくても良い方法と、文字列が一致する文書
のみを検索する方法の2つを使用して結果を合成するこ
ととしたため、従来技術による両方法の利点を取り入れ
ることができ、より検索意図に適合した検索結果を得る
ことが可能となる。また、上記の構成において、本発明
は次のような構成でもよい。
【0011】前記第2の算出ステップは、前記第1の算
出ステップにより算出されたそれぞれの類似度に重み付
けをし、該重み付けされた類似度を合計するステップを
有する。本発明により、複数ある類似度に重み付けして
合成することとしたため、算出方法のそれぞれが得意と
する特性を活かすことができる。
【0012】上記構成において、本発明は次の構成でも
よい。前記重み付けは外部から指定された係数を前記類
似度に掛けることにより行なう。本発明によれば、重み
付けを外部から指定することで行なうことが可能となる
ため、複数ある類似度算出方法のそれぞれが得意とする
特性を活かすことができるとともに、検索意図を反映さ
せることが可能となる。
【0013】上記目的を達成するために、本発明は次に
ように構成してもよい。なお、以下の発明においても、
上記の発明と同様の作用及び効果を有する。本発明は複
数の文書を検索対象とし、該検索対象における各文書と
1つ以上の単語からなる単語列との類似度を算出する手
段を有し、該類似度に従って該検索対象から1つ又は複
数の文書を提示する情報検索装置であり、前記各文書毎
に前記類似度を複数の手段により複数種類算出する第1
の算出手段と、該複数種類の類似度を合成して1つの合
成類似度を算出する第2の算出手段と、該合成類似度に
従って前記検索対象から前記1つ又は複数の文書を提示
する手段とを有する。
【0014】上記構成において、本発明は次のようにも
構成できる。前記第1の算出手段における前記複数の手
段は、前記各文書と前記単語列における単語の連想関係
を用いて、単語の連想の重みにより類似度を算出する手
段と、前記各文書中に前記単語列中の単語の文字列と一
致する文字列が存在するかどうかを調べることにより類
似度を算出する手段とである。
【0015】また、上記構成において、本情報処理装置
は次の構成としてもよい。前記第2の算出手段は、前記
第1の算出手段により算出されたそれぞれの類似度に重
み付けを行なう手段と、該重み付けされた類似度を合計
する手段とを有する。更に、上記構成において、本発明
を次のように構成してもよい。
【0016】前記重み付けを行なう手段は、該重み付け
を表す係数を外部から指定する手段と、該係数を前記類
似度に掛ける手段とを有する。上記目的を達成するため
に、本発明は次のようにも構成できる。本発明は、複数
の文書を検索対象とし、該検索対象における各文書と1
つ以上の単語からなる単語列との類似度を算出し、該類
似度に従い該検索対象から1つ又は複数の文書を提示す
る手順をコンピュータに実行させる情報検索プログラム
を記録した記録媒体であり、前記各文書毎に前記類似度
を複数の手順により複数種類算出する第1の算出手順
と、該複数種類の類似度を合成して1つの合成類似度を
算出する第2の算出手順と、該合成類似度に従って前記
検索対象から前記1つ又は複数の文書を提示する手順と
をコンピュータに実行させるプログラムを記録する。
【0017】上記構成において、本発明は次のようにも
できる。前記第1の算出手順における前記複数の手順
は、前記各文書と前記単語列における単語の連想関係を
用いて、単語の連想の重みにより類似度を算出する手順
と、前記各文書中に前記単語列中の単語の文字列と一致
する文字列が存在するかどうかを調べることにより類似
度を算出する手順とである。
【0018】また、上記構成において、本発明は次の構
成とすることも可能である。前記第2の算出手順は、前
記第1の算出手順により算出されたそれぞれの類似度に
重み付けを行なう手順と、該重み付けされた類似度を合
計する手順とを有する。更に、本発明において、前記重
み付けを行なう手順は、該重み付けを表す係数を外部か
ら指定する手順と、該係数を前記類似度に掛ける手順と
を有する。
【0019】
【発明の実施の形態】以下、図面を参照して本発明の実
施の形態を詳細に説明する。図1は、本発明の一実施例
にかかる装置の構成を示すブロック図である。同図に示
すように、本実施例の情報検索装置は、検索対象蓄積部
11、インデックス部A12、インデックス部B13、
検索要求入力部14、類似度計算部A15、類似度計算
部B16、類似度合成割合入力部17、類似度合成部1
8、類似度順位並替部19、及び検索結果表示部20を
有する。
【0020】インデックス部A12・類似度計算部A1
5とインデックス部B13・類似度計算部B16は検索
要求に対する検索対象文書の適合度合いである類似度の
計算を行う方法(ここでは以下A方法及びB方法と称す
る)にそれぞれ対応して具備される。また、本実施例で
は2種類の方法を使用しているが、何種類であっても実
施可能である。例えば、n種類の方法を使用する場合に
は、それぞれの方法に対応したn組のインデックス部及
び類似度計算部が具備される。なお、1種類であれば単
一方法による情報検索装置に等しい。
【0021】次に本実施例の動作を説明する。検索対象
蓄積部11は検索対象となる文書を保持している。イン
デックス部A12は検索対象文書それぞれに対する識別
子及びA方法における類似度計算時に使用される特徴ベ
クトルを格納し、インデックス部B13は検索対象文書
それぞれに対する識別子及びB方法における類似度計算
時に使用される特徴ベクトルを格納する。
【0022】検索者からの検索要求が検索要求入力部1
4に入力されると、類似度計算部A15は、検索要求を
A方法で分析し、インデックス部A12に格納されたA
方法に対応するインデックスを用いて検索対象の文書と
の類似度を計算し、その類似度を文書を示す識別子との
組のリストとして出力し、類似度計算部B16は、検索
要求をB方法で分析し、インデックス部B13に格納さ
れたB方法に対応するインデックスを用いて検索対象の
文書との類似度を計算し、その類似度を文書を示す識別
子との組のリストとして出力する。
【0023】 類似度合成部18は、類似度計算部A1
5及び類似度計算部B16から出力された類似度計算結
果から類似度と識別子の組を取り出しながら、類似度を
合成し、類似度順位並替部19は合成された類似度に従
って類似度結果を並べ替え、検索結果表示部20が検索
結果を表示する。なお、類似度合成割合入力部17につ
いては後述する。
【0024】図2は、図1に示す類似度合成部18の詳
細な動作を示すフローチャートである。類似度合成には
種々の方法があり、ここで説明する方法はその中の一例
である。また、本実施例では、A方法としては、単語の
連想関係を蓄積した知識ベースを用いて単語の連想の重
みにより類似度を計算する方法を用いており、B方法と
しては文字列一致方法を用いている。本実施例において
文字列一致方法における類似度は、検索対象中に一致す
る文字列が存在する場合を1、存在しない場合を0とし
ている。
【0025】図2中、まず、ステップllでは、図1の
類似度計算部A15の出力である類似度リストから、識
別子と類似度をすべて読み込む。次に、ステップ12で
は、類似度計算部B16の出力である類似度リストか
ら、一つずつの類似度と識別子の対を取り出す。ステッ
プ13では、B方法による類似度リストから取り出した
識別子に同じ識別子を持つ組を先に読み込んだA方法に
よる組から探す。ステップ14で同じ識別子の有無を調
べ、無い場合は、ステップ15で識別子と類似度の組
を、先に読み出したリストの最後に追加する。有る場合
は、ステップ16でA、B両方法の類似度を取り出し、
両方法の類似度から、合成計算式F(s1 ,s2 )に従
って合成類似度s0 を計算する。合成計算式は、例え
ば、 s0 =α・s1 +β・s2 である。ここで、s1 はA方法による類似度、s2 はB
方法による類似度、α、βは前述した図1の類似度合成
割合入力部17から入力されるパラメータである。この
パラメータを調整することにより、それぞれの方法が持
つ特性の重みを変えることができる。合成計算式は上記
式に限られるものではなく、他の式に設定してよい。
【0026】ステップ17では、リスト上の当該識別子
の類似度を上記の式から得られた合成類似度と置換す
る。ステップ18では、B方法による類似度リストにお
いて新しく読み込む組が有るかどうかを調べ、有ればス
テップ12からの処理を行ない、無ければ処理を終了す
る。次に、具体的な例を用いて本実施例を説明する。
【0027】図3は、検索要求を「バブル」として、検
索対象文書をA方法により検索して類似度計算した場合
の出力例であり、類似度と文書の識別子を含むリストで
ある。各行の左から、順位、識別子、類似度、文書表題
を示している。例えば、図3の1行目において、順位が
1、識別子がNK950215−2322、類似度が
0.540805、文書表題が”日本の社長像(3)福
利厚生、バブルは影潜め(なんでもデータ)”である。
図1の類似度計算部A15の出力としては、識別子と類
似度のみでよいが、本実施例では説明のために順位と文
書表題も付加している。
【0028】図4は、B方法により類似度計算された出
力であり、検索要求および出力結果の構成は図3と同様
である。前述した通り、B方法は文字列一致方法である
ため、図4においては文字列「バブル」を含むものしか
現れていない。すなわち、本実施例では類似度=0のも
のは出力されない。次に、図3及び図4の例を用いて本
実施例の動作を具体的に説明する。
【0029】図2のステップ11に従い、A方法による
類似度リストが全て読み込まれる。図3では30件の識
別子及び類似度の組が読み込まれる。次に、図2のステ
ップ12に従い、まず、図4における第1の組、すなわ
ち、識別子=NK950215−2322、類似度=
1.00が読み込まれる。図2のステップ13に従い、
識別子がNK950215−2322であるものを、先
に読み込んだリストから探す。本実施例の場合、図3の
リストの第1番目に見つけることができる。続いて、図
2のステップ16に従いそれぞれの類似度、0.540
805と1.00が合成される。合成式として前述のs
0 =α・s1 +β・s2 を用い、α=1、β=1とする
場合、1.0540805と計算結果が得られ、識別子
=NK950215−2322の欄の類似度が1.05
40805に置き換えられる。
【0030】ここで、例えば、「バブル」という文字列
が含まれていることの重要性が低ければβを1より小さ
くする等が可能である。すなわち、α、βを変更するこ
とにより検索意図に沿った検索を行なうことが可能であ
る。以降、同様に、識別子=NK950207−008
4、識別子=NK950223−2116、について、
合成類似度が計算され、置換される。図4に示すように
B方法の類似度リストは3件であるため、3回で終了す
る。
【0031】次に、図1の類似度順位並替部19が、合
成類似度に従って上述の置換された類似度リストを例え
ば降順に並べ替える。図5は、図1の類似度順位並替部
19の出力例である。この結果に従い、図1の検索結果
表示部20は、識別子を元に、検索対象蓄積部11から
文書を取り出し、検索者に表示する。
【0032】情報検索装置の構成は、図1で示した実施
例の構成に限定されることなく、各々の構成要素を上記
で説明した手順を有するソフトウェア(プログラム)で
構築し、コンピュータシステムにそのプログラムを実行
させることにより一般的なコンピュータシステムを本発
明の情報検索装置とすることが可能である。図6は上記
コンピュータシステムのハードウェア構成の例を示すブ
ロック図である。本コンピュータシステムは、処理を実
行するCPU100、プログラムやデータを記憶するメ
モリ101、メモリ101またはCPU100で使用す
るプログラムやデータを蓄積する外部記憶装置102、
データを表示するディスプレイ103、データまたは命
令を入力するキーボード104、ネットワークを介して
他のコンピュータシステム等と通信を行うための通信処
理装置105から構成される。上記プログラムはメモリ
101又は外部記憶装置102にインストールされCP
U100により実行される。
【0033】また、本発明の記録媒体はメモリ101又
は外部記憶装置102に相当する。更に、電子メモリ、
ハードディスク、又は、フロッピーディスク、CD−R
OM、磁気テープ等の可搬記録媒体等も本発明の記録媒
体として使用可能である。本発明の情報検索プログラム
記録媒体に記録されたプログラムを、図6に示すような
一般的なコンピュータシステムにローディングすること
により、そのコンピュータ上で本発明の情報検索方法を
実施することが可能となる。
【0034】なお、本発明は上記の実施例に限定される
ことなく、特許請求の範囲内で種々変更・応用が可能で
ある。
【0035】
【発明の効果】上述のように本発明によれば、複数の検
索方法を使用してその複数の結果を合成することがで
き、しかも、検索意図によってその合成の割合を変更で
きるので、各方法が持つ特性を、検索意図により検索結
果に組み込むことが可能となる。従って、従来技術での
問題点が解消され、より検索意図に沿った検索結果を得
ることが可能となる。
【図面の簡単な説明】
【図1】本発明の一実施例における情報検索装置の構成
を示すブロック図である。
【図2】図1の類似度合成部の動作を示すフローチャー
トである。
【図3】本発明の一実施例におけるA方法による類似度
計算の結果例である。
【図4】本発明の一実施例におけるB方法による類似度
計算の結果例である。
【図5】本発明の一実施例における類似度合成の結果例
である。
【図6】本発明の一実施例におけるコンピュータシステ
ムの構成図である。
【符号の説明】
11 検索対象蓄積部 12 インデックス部A 13 インデックス部B 14 検索要求入力部 15 類似度計算部A 16 類似度計算部B 17 類似度合成割合入力部 18 類似度合成部 19 類似度順位並替部 20 検索結果表示部 100 CPU 101 メモリ 102 外部記憶装置 103 ディスプレイ 104 キーボード 105 通信処理装置
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平9−212509(JP,A) 特開 平9−114847(JP,A) 特開 平10−63679(JP,A) 望月源 外,語彙的連鎖にもとづくパ ッセージ検索,情報処理学会研究報告 (98−NL−127),1998年 9月18日, 第98巻,第82号,第39〜46頁 (58)調査した分野(Int.Cl.7,DB名) G06F 17/30 JICSTファイル(JOIS)

Claims (6)

    (57)【特許請求の範囲】
  1. 【請求項1】 複数の文書を検索対象とし、該検索対象
    における各文書と1つ以上の単語からなる単語列との類
    似度を算出し、該類似度に従い該検索対象から1つ又は
    複数の文書を提示する情報検索方法において、 前記各文書毎に前記類似度を複数の方法により複数種類
    算出する第1の算出ステップと、 該複数種類の類似度を合成して1つの合成類似度を算出
    する第2の算出ステップと、 該合成類似度に従って前記検索対象から前記1つ又は複
    数の文書を提示するステップとを有し、 前記第1の算出ステップにおける前記複数の方法は、 前記各文書と前記単語列における単語の連想関係を用い
    て、単語の連想の重みにより類似度を算出する方法と、 前記各文書中に前記単語列中の単語の文字列と一致する
    文字列が存在するかどうかを調べることにより類似度を
    算出する方法の2つの方法であり、 前記第2の算出ステップは、 前記第1の算出ステップにより算出されたそれぞれの類
    似度に重み付けをし、該重み付けされた類似度を合計す
    るステップを有することを特徴とする情報検索方法。
  2. 【請求項2】 前記重み付けは外部から指定された係数
    を前記類似度に掛けることにより行なうことを特徴とす
    る請求項1記載の情報検索方法。
  3. 【請求項3】 複数の文書を検索対象とし、該検索対象
    における各文書と1つ以上の単語からなる単語列との類
    似度を算出する手段を有し、該類似度に従って該検索対
    象から1つ又は複数の文書を提示する情報検索装置にお
    いて、 前記各文書毎に前記類似度を複数の手段により複数種類
    算出する第1の算出手段と、 該複数種類の類似度を合成して1つの合成類似度を算出
    する第2の算出手段と、 該合成類似度に従って前記検索対象から前記1つ又は複
    数の文書を提示する手段とを有し、 前記第1の算出手段における前記複数の手段は、 前記各文書と前記単語列における単語の連想関係を用い
    て、単語の連想の重みにより類似度を算出する手段と、 前記各文書中に前記単語列中の単語の文字列と一致する
    文字列が存在するかどうかを調べることにより類似度を
    算出する手段とであり、 前記第2の算出手段は、 前記第1の算出手段により算出されたそれぞれの類似度
    に重み付けを行なう手段と、 該重み付けされた類似度を合計する手段とを有すること
    を特徴とする情報検索装置。
  4. 【請求項4】 前記重み付けを行なう手段は、 該重み付けを表す係数を外部から指定する手段と、 該係数を前記類似度に掛ける手段とを有することを特徴
    とする請求項3記載の情報検索装置。
  5. 【請求項5】 複数の文書を検索対象とし、該検索対象
    における各文書と1つ以上の単語からなる単語列との類
    似度を算出し、該類似度に従い該検索対象から1つ又は
    複数の文書を提示する手順をコンピュータに実行させる
    情報検索プログラムを記録した記録媒体において、該情
    報検索プログラムは、 前記各文書毎に前記類似度を複数の手順により複数種類
    算出する第1の算出手順と、 該複数種類の類似度を合成して1つの合成類似度を算出
    する第2の算出手順と、 該合成類似度に従って前記検索対象から前記1つ又は複
    数の文書を提示する手順とをコンピュータに実行させる
    プログラムであり、 前記第1の算出手順における前記複数の手順は、 前記各文書と前記単語列における単語の連想関係を用い
    て、単語の連想の重みにより類似度を算出する手順と、 前記各文書中に前記単語列中の単語の文字列と一致する
    文字列が存在するかどうかを調べることにより類似度を
    算出する手順とであり、 前記第2の算出手順は、 前記第1の算出手順により算出されたそれぞれの類似度
    に重み付けを行なう手順と、 該重み付けされた類似度を合計する手順とを有すること
    を特徴とする情報検索プログラムを記録した記録媒体。
  6. 【請求項6】 前記重み付けを行なう手順は、 該重み付けを表す係数を外部から指定する手順と、 該係数を前記類似度に掛ける手順とを有することを特徴
    とする請求項5記載の情報検索プログラムを記録した記
    録媒体。
JP00149599A 1999-01-06 1999-01-06 情報検索方法、情報検索装置及び情報検索プログラムを記録した記録媒体 Expired - Lifetime JP3503506B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP00149599A JP3503506B2 (ja) 1999-01-06 1999-01-06 情報検索方法、情報検索装置及び情報検索プログラムを記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP00149599A JP3503506B2 (ja) 1999-01-06 1999-01-06 情報検索方法、情報検索装置及び情報検索プログラムを記録した記録媒体

Publications (2)

Publication Number Publication Date
JP2000200285A JP2000200285A (ja) 2000-07-18
JP3503506B2 true JP3503506B2 (ja) 2004-03-08

Family

ID=11503049

Family Applications (1)

Application Number Title Priority Date Filing Date
JP00149599A Expired - Lifetime JP3503506B2 (ja) 1999-01-06 1999-01-06 情報検索方法、情報検索装置及び情報検索プログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JP3503506B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007133516A (ja) * 2005-11-08 2007-05-31 Shin Etsu Polymer Co Ltd 文書分類方法、文書分類プログラム及び文書分類装置
JP2008090510A (ja) * 2006-09-29 2008-04-17 Shin Etsu Polymer Co Ltd 文書分類装置及び文書分類方法
JP2009277154A (ja) * 2008-05-16 2009-11-26 Ntt Docomo Inc 情報検索装置及び情報検索方法
US8612457B2 (en) * 2011-03-28 2013-12-17 Palo Alto Research Center Incorporated Method and system for comparing documents based on different document-similarity calculation methods using adaptive weighting
JP6426074B2 (ja) * 2015-10-01 2018-11-21 日本電信電話株式会社 関連文書検索装置、モデル作成装置、これらの方法及びプログラム
JP6751675B2 (ja) * 2017-01-11 2020-09-09 株式会社野村総合研究所 情報処理装置、情報処理方法、およびコンピュータプログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09114847A (ja) * 1995-10-16 1997-05-02 Fuji Xerox Co Ltd 情報処理装置
JPH09212509A (ja) * 1996-02-05 1997-08-15 Oki Electric Ind Co Ltd 単文類似度計算装置
JPH1063679A (ja) * 1996-08-23 1998-03-06 Nippon Telegr & Teleph Corp <Ntt> 情報提供装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
望月源 外,語彙的連鎖にもとづくパッセージ検索,情報処理学会研究報告(98−NL−127),1998年 9月18日,第98巻,第82号,第39〜46頁

Also Published As

Publication number Publication date
JP2000200285A (ja) 2000-07-18

Similar Documents

Publication Publication Date Title
US8775410B2 (en) Method for using dual indices to support query expansion, relevance/non-relevance models, blind/relevance feedback and an intelligent search interface
KR100962923B1 (ko) 텍스트에서 키워드를 효율적으로 검색하는 시스템 및 이의방법
US7424469B2 (en) System and method for blending the results of a classifier and a search engine
JP5638031B2 (ja) 格付け方法、検索結果分類方法、格付けシステム及び検索結果分類システム
US7584221B2 (en) Field weighting in text searching
JP4425641B2 (ja) 構造化ドキュメントの検索
US7831910B2 (en) Computer aided authoring, electronic document browsing, retrieving, and subscribing and publishing
US6947920B2 (en) Method and system for response time optimization of data query rankings and retrieval
JP5316158B2 (ja) 情報処理装置、全文検索方法、全文検索プログラム、及び記録媒体
JP3195752B2 (ja) 検索装置
JP6299596B2 (ja) クエリ類似度評価システム、評価方法、及びプログラム
US20090299978A1 (en) Systems and methods for keyword and dynamic url search engine optimization
US20080222138A1 (en) Method and Apparatus for Constructing a Link Structure Between Documents
KR20010042377A (ko) 언어 모델을 근거로 하는 정보 검색 및 음성 인식
JP2001524717A (ja) 情報管理及び検索
WO2008106667A1 (en) Searching heterogeneous interrelated entities
JP4857448B2 (ja) 多義語による情報検索装置及びプログラム
JP3503506B2 (ja) 情報検索方法、情報検索装置及び情報検索プログラムを記録した記録媒体
JP2006178599A (ja) 文書検索装置および方法
JP2000227922A (ja) 情報検索装置、方法及びその方法を実行するプログラムを記録した記録媒体
JP2773682B2 (ja) 適合フィードバック装置
JP2003271648A (ja) 検索装置、検索方法、ならびに、プログラム
JP3100955B2 (ja) 情報検索方法及び情報検索装置
JP2003223465A (ja) 特許文献検索方法
JP2002117043A (ja) 文書検索装置、文書検索方法およびその方法を実施するためのプログラムを記録した記録媒体

Legal Events

Date Code Title Description
A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20031201

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071219

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081219

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091219

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101219

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101219

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111219

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111219

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121219

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121219

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131219

Year of fee payment: 10

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term