JPH0944506A - 文書検索装置 - Google Patents

文書検索装置

Info

Publication number
JPH0944506A
JPH0944506A JP7208554A JP20855495A JPH0944506A JP H0944506 A JPH0944506 A JP H0944506A JP 7208554 A JP7208554 A JP 7208554A JP 20855495 A JP20855495 A JP 20855495A JP H0944506 A JPH0944506 A JP H0944506A
Authority
JP
Japan
Prior art keywords
word
search
related word
relevance
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7208554A
Other languages
English (en)
Inventor
Shinji Kawamoto
真司 川本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP7208554A priority Critical patent/JPH0944506A/ja
Publication of JPH0944506A publication Critical patent/JPH0944506A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 文書データをキーワードにより検索する際、
キーワードを同義語、類義語などのキーワードに関連す
る関連語に展開し、この関連語を用いて検索する文書検
索装置において、ユーザの意図に合った適切な関連語を
得ることができ、文書検索作業をより効率的に行うこ
と。 【解決手段】 キーワード入力手段によりキーワードを
入力し、関連度条件入力手段により、例えば展開する関
連語グループの関連度の範囲などの関連度条件を入力す
る。関連語展開処理手段は、関連語情報記憶手段からキ
ーワードが含まれる関連語グループを抽出する。同義
語、類義語などの語の集まりである関連語グループは関
連語グループ単位に、そのグループに属する関連語同士
の関連の度合いを示す固有の値の関連度を持っている。
関連語展開処理手段は、さらに前記のように抽出した関
連語グループの関連度が関連度条件入力手段により指定
された関連度の条件を満たすかどうかをチェックする。
条件を満たしていればその関連語グループに属する語を
検索語として検索処理手段による検索に用いる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明はキーワードを用いて文書
データベース内から所望の文書を検出する文書検索装置
に関する。
【0002】
【従来の技術】大量の文書が登録された文書データベー
ス内から所望の文書を検索するために、指定したキーワ
ードを含む文書を文書データベース内から検出する文書
検索装置が用いられる。キーワードは文書を文書データ
ベースに登録する際に与える方法もあるが、検索をより
柔軟に行うために、あらかじめキーワードを与えず、検
索時にキーワードを自由に指定する全文検索という方法
がある。しかし、ユーザが自由にキーワードを指定でき
るので、検索漏れが発生しやすいという問題があった。
この問題を解消するために、キーワードの類似語、同義
語等キーワードに関連する語も検索語として検索するこ
とにより、検索漏れを減らすという手法がある。キーワ
ードの関連語まで検索すると、検索漏れが少なくなる一
方で、ユーザの検索意図と異なる思わぬ語まで検索語と
して検索されてしまい、余計なものまで検出されてしま
い、所望の文書と検索された文書との適合率が低くなる
と言う問題があった。このような問題を解決するため
に、キーワードを関連語に展開する際に展開する関連語
の語数、展開する距離などの条件を設定することによ
り、関連語を制限し、不適切なキーワードによる余計な
検索結果が出ないようにすることが提案されている(例
えば、特開平5−028199号公報参照)。
【0003】
【発明が解決しようとする課題】上記従来技術(特開平
5−028199号公報)では、キーワードを関連語に
展開する際に展開する関連語の語数、展開する距離など
を制限する手法を用いているが、この方法では、同じ表
記で複数の意味カテゴリに含まれる語をキーワードとし
て検索した場合、ユーザが意図する語の意味とは異なる
意味カテゴリの語もキーワードの関連語になるため、い
くら展開する関連語の語数などで制限しても、余計なも
のまで検出されてしまうという問題があった。
【0004】本発明は、文書データをキーワードにより
検索する際、キーワードを同義語、類義語などのキーワ
ードに関連する関連語に展開し、この関連語を用いて検
索する文書検索装置において、ユーザの意図に合った適
切な関連語を得ることができ、文書検索作業をより効率
的に行うことを目的とする。
【0005】
【課題を解決するための手段】本発明は、キーワードを
入力するキーワード入力手段と、関連度条件を設定する
関連度条件入力手段と、関連語をグループ化するととも
に、各関連語グループに関連度を対応付けた関連語情報
を保持する関連語情報記憶手段と、前記キーワード入力
手段により入力されたキーワードが含まれる関連語グル
ープを前記関連語情報記憶手段から抽出し、その抽出し
た関連語グループのうち前記関連度条件入力手段により
入力された関連度条件を満たす関連語グループを求め、
求めた関連語グループに含まれる語を検索語とする関連
語展開処理手段と、前記関連語展開処理手段により得ら
れた検索語を用いて検索を行う検索処理手段とを備えた
文書検索装置である。
【0006】
【作用】キーワード入力手段によりキーワードを入力
し、関連度条件入力手段により、例えば展開する関連語
グループの関連度の範囲などの関連度条件を入力する。
関連語展開処理手段は、関連語情報記憶手段からキーワ
ードが含まれる関連語グループを抽出する。同義語、類
義語などの語の集まりである関連語グループは関連語グ
ループ単位に、そのグループに属する関連語同士の関連
の度合いを示す固有の値の関連度を持っている。関連語
展開処理手段は、さらに前記のように抽出した関連語グ
ループの関連度が関連度条件入力手段により指定された
関連度の条件を満たすかどうかをチェックする。条件を
満たしていればその関連語グループに属する語を検索語
として検索処理手段による検索に用いる。このように入
力されたキーワードを関連語に展開する際、キーワード
入力とともに関連度条件入力手段により入力された関連
度の条件を満たす関連語グループに属する語のみを関連
語として検出し、検出された語を検索語として文書検索
を行うようにしたので、関係のない文書が検索されるこ
とが従来に比べ少なくなり、検索作業の効率が向上す
る。
【0007】
【実施例】
(第1の実施例)図1は、本発明による第1の実施例の
文書検索装置の概略の構成を示す図である。この文書検
索装置は、検索のためのキーワードを入力するキーワー
ド入力手段100と、展開する関連語グループの関連度
の範囲などの関連度の条件を設定する関連度条件入力手
段110と、同義語、類義語など何らかの関連を有する
関連語をグループ化するとともに、各関連語グループに
関連度を付与した関連語情報を保持する関連語辞書14
0と、キーワード入力手段100により入力されたキー
ワードが含まれる関連語グループを関連語辞書140か
ら抽出し、その抽出した関連語グループのうち前記関連
度条件入力手段110により入力された関連度条件を満
たす関連語グループを求め、求めた関連語グループに含
まれる語を検索語とする関連語展開処理手段130と、
その関連語展開処理手段130により得られた検索語を
格納する検索語保持手段131と、その検索語保持手段
手段131に保持された検索語を用いて文書データベー
ス160に登録されている文書の検索を行う検索処理手
段150と、献策処理手段150による検索結果を保持
する検索結果保持手段170を備えている。
【0008】図2に示すフローチャートをもとに、以上
のように構成された第1の実施例の動作について説明す
る。まず、キーワード入力手段100からキーワードが
入力される(ステップS210)。次に関連度条件入力
手段110により、展開する関連語グループの関連度の
範囲を入力する(ステップS220)。関連語展開処理
手段130により関連語辞書140からキーワードが含
まれる関連語グループを抽出する(ステップS23
1)。同義語、類義語などの語の集まりである関連語グ
ループは関連語グループ単位に固有の値である関連度を
持っており、抽出された関連語グループの関連度がステ
ップS220で指定された関連度かどうかをチェックす
る(ステップS232)。指定された関連度ならば関連
語グループに属する語を検索語として検索語保持部13
1に保持する(ステップS233)。抽出されたすべて
の関連語グループに対してステップS231〜ステップ
S233の処理を行う。次に検索処理手段150によ
り、検索語保持手段131に保持された検索語の含まれ
る文書を文書データベース160から検索し、検索結果
保持手段170に検索結果を保持する(ステップS24
0)。
【0009】次に、具体例を用いて実際の処理内容を説
明する。例えば『保守』という語をキーワードとして検
索する場合を考える。まず、キーワード入力手段100
からキーワード『保守』を入力し、関連度条件入力手段
110から関連度条件として「関連度2以上」を入力し
たとする。次に関連語展開処理手段130により、キー
ワード『保守』を関連語辞書140内の情報をもとに関
連語に展開する。関連語辞書の概念図を図3に示す。あ
る語と関連する語の情報を保持した関連語辞書の構造と
してはさまざまな構造が考えられるが、ここに挙げた図
3の例では同義語、類義語をまとめた関連語グループ3
03〜307どうしの上位下位関係を定義したシソーラ
ス構造をしている場合を表している。まず、関連辞書内
で『保守』という語を含む同義語グループ303、30
6を検索する。この例では、まず『保守』という語は
「原理・主義」というカテゴリ301に属する関連語グ
ループ(ID、22383)303に含まれるので、該
関連語グループの情報を抽出する。ここで該関連語グル
ープ303の関連度(DIG)は3で関連度条件として
入力された「関連度2以上」を満たすので、該関連語グ
ループ303の語『保守』『与党』『保守党』『保守政
党』『勤王』を検索語として検索語保持部131に保持
する。また『保守』はカテゴリ「作業・処理」に属する
関連語グループ(ID、37573)306にも含まれ
るが、該関連語グループの関連度(DIG)は1で関連
度条件として入力された「関連度2以上」を満たさない
ので、この関連語グループ306に含まれる語は検索語
としては保持されない。このようにしてキーワード『保
守』の関連語の中から選出され、検索語保持部131に
保持された語を検索語として、検索処理手段150によ
りデータベースから該検索語を含む文書を検索する。具
体的には図4に示す3つの文書を検索対象として考えた
場合、従来のキーワードを単に関連語に展開しそれを新
しいキーワードとして検索する方式では、3つの文書と
も検出されることになるが、本実施例によると、展開さ
れたキーワードの関連語のうちカテゴリ「原理・主義」
に含まれる語のみ検索語として検索されるため、文書4
01、402は検出されるが、文書403は検出されな
いことになる。
【0010】この第1の実施例によれば、検索もれを少
なくするため、キーワード『保守』を関連語展開し、そ
の関連語を検索語として検索する際、指定された関連度
条件を満たす関連度グループに含まれる関連語のみを検
索語とし、上記の例の場合『修繕』『修理』などの指定
された関連度条件を満たさない関連度グループに含まれ
る関連語は、『保守』の関連語であっても検索語としな
いことにより、余計な検索結果が検出されることが少な
くなり、検索効率が向上する。
【0011】(第2の実施例)この第2の実施例は、第
1の実施例において関連度条件の入力方式を変形した例
に相当する。図5に第2の実施例の構成を、図6にその
動作のフローチャートを示す。図5に示すように関連度
条件入力手段510内に関連度グループ表示部511を
設けることにより、入力キーワードの属する関連語グル
ープの情報を得た後に、その条件をもとに関連度条件を
設定できるようにすることができる。その他の構成は第
1の実施例と同じである。
【0012】例えば、『保守』というキーワードを検索
する場合、まず、関連語展開処理手段530で入力され
たキーワードが属する関連語グループの情報を関連度辞
書540から抽出し、その情報を関連語グループ表示部
511で表示する(ステップS620)。関連語グルー
プに関する情報の表示例を図7に示す。この情報をもと
にユーザは関連度条件を設定する(ステップS63
0)。例えば、ユーザが「原理・主義」に関する関連語
のみを検索語としたい場合は関連度条件として「関連度
が2以上」と設定し、「作業・処理」に関する関連語の
みを検索語としたい場合は、「関連度が2以下」と設定
する。次に、関連語展開処理手段530でユーザが設定
した関連度条件を満たす関連語グループの関連語を検索
語として検索語保持部531に保持し(ステップS64
2)、その検索語をもとに検索処理手段550で検索を
行い、検索結果を検索結果保持手段570に保持し(ス
テップS650)、検索を終了する。
【0013】第2の実施例は、関連度グループ表示部を
設け、入力キーワードの属する関連語グループの情報を
得た後に関連度条件を設定できるようにしたことによ
り、関連度条件をより効果的に設定することができ、検
索効率の向上につながる。
【0014】(第3の実施例)この第3の実施例は、第
1の実施例において関連語グループごとに複数の関連度
を持つように構成した例である。図8に本実施例の構成
を、図9にその動作のフローチャートを示す。本実施例
は、第1の実施例において、検索対象の分野を指定する
ための検索分野指定手段820を付加するとともに、関
連語展開処理手段830に検索分野の情報を検索分野管
理テーブルに保持した検索分野管理部832を設けた構
成を有する。多種多様の文書が格納された文書内から、
所望の文書を検出する際、無駄な検索を少なくするため
に、例えば、「コンピュータ関連の文書の中からこのよ
うな文書を」とか「新聞の記事の中からこのようなもの
を」という具合に検索分野を指定し、検索範囲を絞りこ
む方法がとられることが多い。また、本発明の関連語グ
ループ単位で保持する関連度という値も文書の種類、分
野と密接な関係がある。本実施例では、ひとつの関連語
グループが分野ごとに複数の関連度を保持する場合の処
理について説明する。
【0015】まず、キーワードと関連度条件をそれぞ
れ、キーワード入力手段800と関連度条件入力手段8
10によって入力する。ここでは、ユーザが保守政党に
関する文書を検索するためキーワードとして『保守』、
関連度条件として「関連度2以上」と設定したと仮定す
る。 次に検索分野指定手段820により、検索対象の
分野を設定する。この場合、検索分野として「政治/経
済関係」を指定する。この検索分野の情報は検索分野管
理部832内の検索分野管理テーブルに保持される。
図10に検索分野管理テーブルの概念図を示す。分野管
理テーブルは、分野番号101と分野名102のフィー
ルドを持ち、分野名が与えられると、対応する分野番号
を求めることができる。これらの情報をもとにキーワー
ドを展開処理していく。
【0016】関連語辞書構造の概念図を図11に示す。
この図に示すように各関連語グループ113〜117ご
とに分野に対応した複数の関連度を保持している。この
例では、『保守』という語は「原理・主義」というカテ
ゴリ111に属する関連語グループ(ID、2238
3)113に含まれるので、該関連語グループ113の
情報を抽出する。ここで検索分野として指定された分野
の分野番号を検索分野管理テーブル(図10)から検出
し、抽出した関連語グループ情報内の複数の関連度の中
から該分野番号に対応する関連度をその関連語グループ
の関連度として展開処理を行う。この例の場合、検索分
野として指定された「政治/経済関係」の分野番号は1
(図10参照)でそれと対応する関連語グループ情報内
の関連度(D−1)は3である。これは関連度条件とし
て入力された「関連度2以上」を満たすので、該関連語
グループ113の語『保守』『与党』『保守党』『保守
政党』『勤王』を検索語として検索語保持部831に保
持する。また、『保守』はカテゴリ「作業・処理」11
2に属する関連語グループ(ID、37573)116
にも含まれるので、該関連語グループ116の情報も抽
出する。上記処理と同様な処理を行うと、この関連語グ
ループ(ID、37573)116の関連度(D−1)
は1で関連度条件として入力された「関連度2以上」を
満たさないので、この関連語グループ116に含まれる
語は検索語としては保持されない。つまりキーワード
『保守』は「原理・主義」というカテゴリに属する関連
語に展開されこの関連語を検索語として、検索処理手段
により文書データベースから該検索語を含む文書を検索
することになる。
【0017】このように関連度を分野に対応して複数持
つことにより、同じキーワードで同じ関連度条件でも検
索分野に応じた検索が可能となる。例えば、上記と同様
のキーワード『保守』、関連度条件「関連度2以上」で
検索した場合でも、検索分野を「コンピュータ関係」で
検索すると、この例ではカテゴリ「作業・処理」に属す
る関連語のみを検索語として検索することになる。ま
た、ここに挙げた例では関連度と検索分野を対応させた
が、複数の関連度は検索分野だけでなく、当然その他の
いろいろな項目を対応させることが考えられる。例え
ば、各ユーザIDと関連度を対応させることにより、ユ
ーザごとに別々の展開処理が可能となる。
【0018】このように関連度を分野に対応して複数持
つことにより、同じキーワードで同じ関連度条件でも検
索分野に応じた検索が可能となる。広い意味では一つの
関連語グループに複数の関連度を持てるようにすること
により、ユーザの意図を反映したより細かい関連語展開
が行えるため、より正確な検索が行えるようになる。
【0019】(第4の実施例)この第4の実施例は、第
3の実施例において関連語辞書の構造を一部変更し、上
位概念の関連度を下位概念が受け継ぐように構成した実
施例である。意味的が距離の近い関連語グループでは同
じ関連度になる場合が多い。このような関連度の特性を
利用して、本実施例では、関連語辞書を関連語グループ
間の意味的な上位下位概念を含んだシソーラス構造で作
成し、関連語グループ間で共通の関連度は上位のノード
で共有するようにする。図12に関連度を共有した場合
の本実施例の関連語辞書の概念を示す。例えば、関連語
グループ(ID.22383)123と関連語グループ
(ID.22384)124はそのノードに関連度を保
持していないので、上位のノード(ID.22380)
121の関連度をその関連語グループの関連度として利
用する。関連語グループ(ID.22385)125
は、関連語グループ123や124と意味的には近いが
別の関連度であるため、そのノード自身が関連度を保持
しており、展開の際にはその関連度を利用する。ID.
22380などの上位のノード121、122において
も、意味的に近いノードと関連度を共有できる場合、そ
のノード自身では関連度を保持せず、さらに上位のノー
ドで関連度を保持することになる。つまり、このような
関連語辞書構造の場合、ある関連語グループの関連度は
そのノード自身も含めたもっとも近い関連度を保持した
上位のノードの関連度ということになる。また、当然の
ことであるが、図13に示すように、あるノード12
5’は上位のノード121で関連度の共有部分だけを保
持し、各ノードで共有部分との差分だけを持つようにし
てもよい。
【0020】第4の実施例によれば、このように意味的
な距離の近い関連語グループが同じ関連度を持ちやすい
特性を活かし、関連語辞書をシソーラス構造にして関連
度を共有することにより、関連度辞書内で同じ情報を重
複して持つことがなくなり、メモリを有効利用できる。
【0021】
【発明の効果】従来の方法では意味的に関連性の強い語
も弱い語もすべて同様に検索対象語として検索してしま
うため、関係ない多くの文書が候補として検出されてし
まい、所望の文書かどうかの判定作業に多くの工数がか
かっていたが、本発明によれば、関連性の強さを示す関
連度を指定して検索を行うことができるので、この段階
で検索の絞りこみが適切に行われ、関係のない文書が候
補として検出されることが従来に比べて少なくなり、検
索作業の効率が向上する。
【図面な簡単な説明】
【図1】 本発明の第1の実施例の構成図
【図2】 (a)および(b)は、第1の実施例の検索
処理の流れを表したフローチャート
【図3】 関連語辞書の概念図
【図4】 (a)(b)(c)は、それぞれ検索対象文
書の具体例を示す図
【図5】 第2の実施例の構成図
【図6】 (a)および(b)は、第2の実施例の検索
処理の流れを表したフローチャート
【図7】 関連語グループに関する情報の表示例を示す
【図8】 第3の実施例の構成図
【図9】 第3の実施例の検索処理の流れを表したフロ
ーチャート
【図10】 検索分野管理テーブルの概念図
【図11】 第3の実施例における関連語辞書の概念図
【図12】 第4の実施例における関連語辞書の概念図
【図13】 図12の関連語辞書の変形例を示す図
【符号の説明】
100…キーワード入力手段、110…関連度条件入力
手段、130…関連語展開処理手段、131…検索語保
持部、140…関連語辞書、150…検索処理手段、1
60…文書データベース、170…検索結果保持手段。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】キーワードを入力するキーワード入力手段
    と、 関連度条件を設定する関連度条件入力手段と、 関連語をグループ化するとともに、各関連語グループに
    関連度を関係づけた関連語情報を保持する関連語情報記
    憶手段と、 前記キーワード入力手段により入力されたキーワードを
    含む関連語グループを前記関連語情報記憶手段から抽出
    し、その抽出した関連語グループのうち前記関連度条件
    入力手段により入力された関連度条件を満たす関連語グ
    ループを求め、その関連語グループに含まれる語を検索
    語とする関連語展開処理手段と、 前記関連語展開処理手段により得られた検索語を用いて
    文書の検索を行う検索処理手段とを備えた文書検索装
    置。
JP7208554A 1995-07-25 1995-07-25 文書検索装置 Pending JPH0944506A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7208554A JPH0944506A (ja) 1995-07-25 1995-07-25 文書検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7208554A JPH0944506A (ja) 1995-07-25 1995-07-25 文書検索装置

Publications (1)

Publication Number Publication Date
JPH0944506A true JPH0944506A (ja) 1997-02-14

Family

ID=16558111

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7208554A Pending JPH0944506A (ja) 1995-07-25 1995-07-25 文書検索装置

Country Status (1)

Country Link
JP (1) JPH0944506A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000123034A (ja) * 1998-10-14 2000-04-28 Toshiba Corp 電子カタログ利用装置および電子カタログシステム
JP2001282828A (ja) * 2000-03-30 2001-10-12 Just Syst Corp 検索装置、検索方法、並びに、記録媒体
JP2008282322A (ja) * 2007-05-14 2008-11-20 Sony Ericsson Mobilecommunications Japan Inc 情報処理装置及び情報処理方法
JP2010140264A (ja) * 2008-12-11 2010-06-24 Nec Corp 情報処理装置、プログラム、及び情報処理方法
JP2011516958A (ja) * 2008-03-31 2011-05-26 エヌエイチエヌ ビジネス プラットフォーム コーポレーション 拡張されたキーワードを登録して検索結果を提供するシステムおよび方法
JP2012194245A (ja) * 2011-03-15 2012-10-11 Fujitsu Ltd 音声認識装置、音声認識方法及び音声認識プログラム
JP2015041386A (ja) * 2013-08-23 2015-03-02 ネイバー コーポレーションNAVER Corporation セマンティックデプス構造基盤の検索語提示システムおよび方法
JP2015118676A (ja) * 2013-12-20 2015-06-25 三菱電機株式会社 ガイド用語抽出装置、設計項目抽出システム、およびガイド用語抽出方法

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000123034A (ja) * 1998-10-14 2000-04-28 Toshiba Corp 電子カタログ利用装置および電子カタログシステム
JP2001282828A (ja) * 2000-03-30 2001-10-12 Just Syst Corp 検索装置、検索方法、並びに、記録媒体
JP2008282322A (ja) * 2007-05-14 2008-11-20 Sony Ericsson Mobilecommunications Japan Inc 情報処理装置及び情報処理方法
JP2011516958A (ja) * 2008-03-31 2011-05-26 エヌエイチエヌ ビジネス プラットフォーム コーポレーション 拡張されたキーワードを登録して検索結果を提供するシステムおよび方法
JP2010140264A (ja) * 2008-12-11 2010-06-24 Nec Corp 情報処理装置、プログラム、及び情報処理方法
JP2012194245A (ja) * 2011-03-15 2012-10-11 Fujitsu Ltd 音声認識装置、音声認識方法及び音声認識プログラム
JP2015041386A (ja) * 2013-08-23 2015-03-02 ネイバー コーポレーションNAVER Corporation セマンティックデプス構造基盤の検索語提示システムおよび方法
US10176261B2 (en) 2013-08-23 2019-01-08 Naver Corporation Keyword presenting system and method based on semantic depth structure
JP2015118676A (ja) * 2013-12-20 2015-06-25 三菱電機株式会社 ガイド用語抽出装置、設計項目抽出システム、およびガイド用語抽出方法

Similar Documents

Publication Publication Date Title
Wu et al. An interactive clustering-based approach to integrating source query interfaces on the deep web
Popescul et al. Statistical relational learning for link prediction
WO2007143899A1 (fr) Système et procédé pour l'extraction intelligente et le traitement d'informations
US6430557B1 (en) Identifying a group of words using modified query words obtained from successive suffix relationships
JPH09319757A (ja) 情報検索システム
JPH04124774A (ja) 関係データベースにおける階層構造のデータ蓄積方法
JPH0944506A (ja) 文書検索装置
US7774353B2 (en) Search templates
CN104778200A (zh) 一种结合历史数据的异构处理大数据检索的方法
Fotouhi et al. Optimal secondary storage access sequence for performing relational join
He et al. Toward a robust data fusion for document retrieval
Burkowski A hardware hashing scheme in the design of a multiterm string comparator
Malhotra et al. An ingenious pattern matching approach to ameliorate web page rank
JPH09212517A (ja) 情報代行検索方法及び装置
JPH08171569A (ja) 文書検索装置
JP3123836B2 (ja) テキスト型データベース装置
JPH09198396A (ja) 文書検索装置
CN114943026A (zh) 一种信息搜索方法及系统
KR20020008096A (ko) 네트워크 기반의 유사어 검색기술 응용시스템 및 방법
JPH0581326A (ja) データベース検索装置
JPH05233704A (ja) キーワード拡張検索方式
JPH0962702A (ja) 情報検索方法
KR100434718B1 (ko) 문서 색인 시스템 및 그 방법
JPH05151273A (ja) シソーラス検索システム
Wang et al. Fast retrieval of electronic messages that contain mistyped words or spelling errors