JP3436109B2 - 関連検索式検索装置及び関連検索式検索プログラムを記録したコンピュータ読み取り可能な記録媒体 - Google Patents

関連検索式検索装置及び関連検索式検索プログラムを記録したコンピュータ読み取り可能な記録媒体

Info

Publication number
JP3436109B2
JP3436109B2 JP00678498A JP678498A JP3436109B2 JP 3436109 B2 JP3436109 B2 JP 3436109B2 JP 00678498 A JP00678498 A JP 00678498A JP 678498 A JP678498 A JP 678498A JP 3436109 B2 JP3436109 B2 JP 3436109B2
Authority
JP
Japan
Prior art keywords
search
expression
search expression
value
formula
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP00678498A
Other languages
English (en)
Other versions
JPH11203289A (ja
Inventor
博 増市
昌一 舘野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP00678498A priority Critical patent/JP3436109B2/ja
Publication of JPH11203289A publication Critical patent/JPH11203289A/ja
Application granted granted Critical
Publication of JP3436109B2 publication Critical patent/JP3436109B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は関連検索式検索装置
及び関連検索式検索プログラムを記録したコンピュータ
読み取り可能な記録媒体に関し、特に入力された検索式
に関連する他の検索式を検索する関連検索式検索装置及
びそのような検索をコンピュータに行わせるための関連
検索式検索プログラムを記録したコンピュータ読み取り
可能な記録媒体に関する。
【0002】
【従来の技術】膨大な量の文書を対象とした検索システ
ムでは、一般にキーワードによる検索方式が用いられて
いる。検索式として任意のキーワード(検索語)を検索
システムに入力すると、文書内容に検索語を含む全ての
文書が検索結果として得られる。この方式による検索
は、全文検索と呼ばれている。また、各文書に対して検
索用のキーワードを予め付加しておき、入力された検索
語と一致するキーワードが付加された文書を検索結果と
する方式も広く用いられている。
【0003】これらの検索システムでは、検索語とキー
ワード間の完全一致が要求される。そのため、全文検索
では、ユーザによって入力された検索語と完全に一致す
る語を含んでいる文書しか検索結果として得ることがで
きない。また、予め各文書にキーワードを付加しておく
方式では、検索語と完全に一致する語が検索用のキーワ
ードとして付加されている文書しか検索結果として得る
ことができない。このような検索では、ユーザが求める
全ての文書を得ることができるものであるとはいえな
い。すなわち、検索漏れの起こる可能性が生じる。
【0004】そこで、「ユーザが入力した検索式と最も
関連性の高い検索式を、検索システムに過去に入力され
た検索式集合の中から選び出し、得られた検索式をユー
ザに提示する」ことが、検索漏れを軽減する観点から有
効であると考えられる。これにより以下のような効果が
期待できる。
【0005】第1の効果は、関連性の高い検索式を参考
にすることによって、より良い(検索意図をより適切に
表現している)検索式へと修正することが容易に行える
ことである。
【0006】第2の効果は、検索目的に応じた事柄に関
して、より知識の深い人を特定できることである。すな
わち、関連性の高い検索式を作成した人物の興味の対象
は互いに類似していると考えられる。また、関連性の高
い検索式によって過去に検索を実行した人物は、その興
味の対象について多くの知識を持っている可能性が高
い。したがって、関連性の高い検索式を作成し検索を実
行した人物が特定できれば、その人物に対して、検索式
の作成あるいは検索結果についての知識を問い合わせる
ことが可能となる。
【0007】与えられた検索式と関連性の高い検索式を
選び出すための従来技術として、関連文書検索の技術を
挙げることができる。関連文書検索は、単語間に、類似
度と呼ばれる「類似性を何らかの尺度で定量化した値」
を設定することによって実現できる。ユーザから検索語
が入力されると、検索語との間で類似度の値が高く設定
されている語(類似語)を多く含む文書を出力すること
によって関連文書検索が実現できる。これと同様に、類
似語を多く含む検索式を出力することによって、検索語
と関連性の高い検索式を得ることが可能である。
【0008】「公開平2−41564号公報」に開示さ
れた発明では、与えられた検索式に対して関連性の高い
文書(与えられた検索式に対して関連性の高い検索式)
を得ることが可能な関連度計算手法の提案を行ってい
る。例えば、「word1」「word2」「word
3」をキーワードとし、検索式が「(word1)or
(word2)or(word3)」である場合の、当
該発明における関連文書検索の手順は以下の通りであ
る。
【0009】[第1のステップ]予め、全てのキーワー
ドの2項間に類似度を設定しておく。キーワード「wo
rd a」と「word b」の間の類似度をS(a,
b)(=S(b,a))と表すものとする。
【0010】[第2のステップ]検索式Siに含まれる
キーワード群{word i1 ,word i2 ,・・
・,word im }と「word1」「word2」
「word3」の各キーワード間の類似度Ri1 ,Ri
2 ,Ri3 を次式によって求める。
【0011】
【数1】
【0012】[第3のステップ]検索式Siと検索式
「(word1)or(word2)or(word
3)」の関連度Kiを次式によって求める。
【0013】
【数2】
【0014】[第4のステップ]検索式Siに対する
「第2のステップ」、「第3のステップ」の処理を、検
索システムに過去に入力された全ての検索式について行
い、Kiの値の大きいものに対応する検索式Siから順
に出力する。
【0015】上記の手順によって、検索式「(word
1)or(word2)or(word3)」に類似す
る検索式を、関連度順に出力することが可能となる。こ
の際に、各検索式を作成した人物を併せて表示すれば、
前述の第2の効果が得られることになる。
【0016】
【発明が解決しようとする課題】しかし、従来技術で
は、単語の2項関係に予め設定された類似度に基づい
て、関連度の計算を行っている。この場合以下のような
問題点が生じ、実用的な精度で関連検索式の決定を行う
ことが困難である。
【0017】一般に、単語が示す意味は、その単語が使
われている文脈に依存する。2つの検索式中に同じ単
語" WordA" が含まれている場合であっても、両検
索式中の他の単語が異なれば、" WordA" によって
検索者(検索式の作成者)が示そうとした意図もまた異
なる。すなわち、従来技術で用いる「単語間の全2項関
係に予め設定された類似度」によっては、このような単
語の文脈依存性を取り扱うことができず、適切な関連度
計算を行うことができない。
【0018】例えば、ある検索者が、「癌の原因となる
要素」について書かれた文献を得るために、「(タバ
コ)and(アルコール)and(放射線)」という検
索式(a)を作成したとする。また、それ以前に、癌に
詳しい別の検索者が、同じ検索意図で、「(トランスフ
ォーミング増殖因子)or(RASタンパク質)or
(アポトーシス)or(ヒスパピローマウィルス)or
(悪性黒色腫細胞)or(MYC遺伝子群)」という検
索式(b)で検索を行っていたとする。この場合、検索
式(a)を作成した検索者に対して、検索式(b)が関
連性の高い検索式として提示されれば、従来の技術で述
べた観点から、検索者にとって効果的な提示であるとい
える。しかしながら、前記従来技術では、検索式(a)
と関連性の高い検索式として、例えば、「((日本酒)
or(ビール)or(ウィスキー))and((タバ
コ)or(葉巻))and(コーヒー)」といった検索
式(c)が提示されてしまう。検索式(c)の検索意図
は「嗜好品」について書かれた文献を得ることであっ
て、検索式(a)の検索意図とは全く異なるものであ
る。このように検索意図が反映されない原因は以下の通
りである。
【0019】従来技術では、予め単語の2項間に設定さ
れた類似度に基づいて関連度計算を行うため、検索式
(a)中の「タバコ」と一般に類似度の高い「葉巻」
や、「アルコール」と一般に類似度の高い「日本酒/ビ
ール/ウィスキー」を含む検索式(c)が関連性の高い
検索式となる。「タバコ」「アルコール」「放射線」
は、これらが同時に現れた場合に、「癌」と関係を持つ
が、単独では「癌」との関連性が低く、予め単語の2項
間に設定された類似度に基づいた関連度計算によって、
検索式(a)と検索式(b)の関連性を見い出すことは
不可能である。
【0020】本発明はこのような点に鑑みてなされたも
のであり、検索式同士の関連度の判定を的確に行うこと
ができる関連検索式検索装置を提供することを目的とす
る。また、本発明の他の目的は、検索式同士の関連度の
的確な判定をコンピュータに行わせることができる関連
検索式検索プログラムを記録したコンピュータ読み取り
可能な記録媒体を提供することである。
【0021】
【課題を解決するための手段】本発明では上記課題を解
決するために、入力された検索式に関連する他の検索式
を検索する関連検索式検索装置において、複数の文書を
格納する文書格納手段と、入力された検索式を受け取る
検索式取得手段と、前記検索式取得手段が取得した検索
式を順次追加格納する検索式格納手段と、前記検索式格
納手段に格納されている各検索式を関連検索式候補と
し、前記文書格納手段中の文書のうち、前記検索式取得
手段に入力された検索式に適合する文書の数である第1
の値と、前記文書格納手段中の文書のうち、前記検索式
取得手段に入力された検索式に適合し、かつ、前記検索
式格納手段に格納されている各関連検索式候補に適合す
る文書の数である関連検索式候補ごとの第2の値と、前
記文書格納手段中の文書のうち、前記検索式格納手段に
格納されている各関連検索式候補に適合する文書の数で
ある関連検索式候補ごとの第3の値とを求める文書数計
算手段と、前記文書数計算手段が算出した第1の値、関
連検索式候補ごとの第2の値及び関連検索式候補ごとの
第3の値を変数とする計算式に基づいて、前記検索式取
得手段が受け取った検索式と各関連検索式候補との間の
関連度を算出する関連度計算手段と、を有することを特
徴とする関連文書検索装置が提供される。
【0022】この関連文書検索装置によれば、検索式が
入力されると、その検索式が検索式取得手段で受け取ら
れる。受け取られた検索式は、検索式格納手段に格納さ
れる。また、関連語判定手段により、検索式取得手段が
取得した検索式に適合する文書格納手段内の文書と、検
索式格納手段に格納されている各検索式に適合する文書
格納手段内の文書とが比較される。そして、検索式取得
手段が取得した検索式と検索式格納手段に格納されてい
る各検索式との間の関連度が判定される。
【0023】
【0024】
【0025】
【発明の実施の形態】以下、本発明の実施の形態を図面
を参照して説明する。図1は、本発明の原理構成図であ
る。本発明の関連検索式検索装置は、以下のような要素
で構成される。
【0026】文書格納手段1は、複数の文書を格納す
る。検索式取得手段2は、入力された検索式を受け取
る。検索式格納手段3は、検索式取得手段2が取得した
検索式を順次追加格納する。関連度判定手段4は、文書
数計算手段4aと関連度計算手段4bとからなる。文書
数計算手段4aは、検索式格納手段3に格納されている
各検索式を関連検索式候補とした上で、文書数に関する
次の3つの値を求める。第1の値は、文書格納手段1中
の文書のうち、検索式取得手段2に入力された検索式に
適合する文書の数である。第2の値は、文書格納手段1
中の文書のうち、検索式取得手段2に入力された検索式
に適合し、かつ、検索式格納手段3に格納されている各
関連検索式候補に適合する文書の数である。この第2の
値は、関連検索式候補ごとに求められる。第3の値は、
文書格納手段1中の文書のうち、検索式格納手段3に格
納されている各関連検索式候補に適合する文書の数であ
る。この第3の値も関連検索式候補ごとに求められる。
関連度計算手段4bは、文書数計算手段4aが算出した
第1の値、関連検索式候補ごとの第2の値及び関連検索
式候補ごとの第3の値を変数とする計算式に基づいて、
検索式取得手段2が受け取った検索式と各関連検索式候
補との間の関連度を算出する。
【0027】このような関連検索式検索装置によれば、
検索式が入力されると、その検索式が検索式取得手段2
で取得される。取得された検索式は、検索式格納手段3
に順次格納されるとともに、関連度判定手段4に渡され
る。すると、関連度判定手段4において、文書数計算手
段4aが文書数に関する前述の3つの値を算出する。そ
して、文書数に関する3つの値を用いて、関連度計算手
段4bが検索式取得手段2が受け取った検索式と各関連
検索式候補との間の関連度を算出する。
【0028】このように本発明では、検索式から得られ
る文書集合が検索意図を示す指標であると捉え、各検索
式に適合する文書集合を基に統計処理を行い、検索式と
検索式の間の関連度を求める。したがって、予め単語間
の類似度を設定しておく必要はなく、検索式全体が持つ
意味を直接反映した関連度計算が実現できる。すなわ
ち、従来技術の問題点は、単語の2項間の類似度を検索
意図を示す指標としていた点に起因して生じるものであ
るため、類似度に代えて、検索式から得られる文書集合
を検索意図を示す指標であると捉えることで、従来技術
の問題点の解決が図られている。
【0029】しかも、検索式間に共通の単語あるいは類
似単語がない場合であっても、関連する検索式を適切に
得ることが可能となり、得られた関連検索式を参照する
ことによって、検索漏れを減少させ、かつ、より検索意
図に沿った検索式を作成することが容易に実現できる。
【0030】なお、本発明では、本来単語間の類似度と
して用いる統計量である相互情報量、Dice−coe
fficentおよびt−scoreを拡張することに
よって、検索式同士の関連度計算を実現する。相互情報
量、Dice−coefficentおよびt−sco
reを単語間の類似度計算に用いた例として、「春野,
山崎:辞書と統計を用いた対訳アライメント,情報処理
学会自然言語処理研究会研究報告,96−NL−11
2,pp.23−30(1996)」、「大森,堤,中
西:統計情報を用いた対訳単語辞書の作成,言語処理学
会第2回年次大会発表論文集,pp.49−52(19
96)」等を挙げることができる。
【0031】以下に、相互情報量などを本発明に適用す
るための拡張方法について説明する。単語word1と
word2の間の相互情報量(MI)は、
【0032】
【数3】
【0033】と定義される。ただし、全検索対象文書数
をM、word1とword2を共に含む文書数をa、
word1のみを含む文書数をb、word2のみを含
む文書数をcとした場合、
【0034】
【数4】
【0035】
【数5】
【0036】
【数6】
【0037】である。これに対して本発明では、検索式
S1と検索式S2の間の相互情報量(MI1 )を、
【0038】
【数7】
【0039】と定義する。ただし、全検索対象文書数を
M、検索式S1から得られ、かつ検索式S2から得られ
る文書の数をa1 、検索式S1から得られる文書のうち
検索式S2から得られない文書の数をb1 、検索式S2
から得られる文書のうち検索式S1から得られない文書
の数をc1 とした場合、
【0040】
【数8】
【0041】
【数9】
【0042】
【数10】
【0043】である。ここで、「a1 +b1 」が図1の
説明における「第1の値」に相当し、「a1 」が「第2
の値」に相当し、「a1 +c1 」が「第3の値」に相当
する。したがって、式(7)は、
【0044】
【数11】
【0045】とすることにより、全検索対象文書数M、
「第1の値」、「第2の値」及び「第3の値」を変数と
する計算式となる。相互情報量と同様に単語間の類似度
を求める統計量として、Dice−coefficen
tおよびt−scoreを挙げることができる。Dic
e−coefficent(DC)およびt−scor
e(TS)は、
【0046】
【数12】
【0047】
【数13】
【0048】と定義される。これらについても、相互情
報量と同様に、検索式と単語の間の類似度計算をするた
めに以下のような拡張を施すことが可能である。
【0049】
【数14】
【0050】
【数15】
【0051】MI1 (S1,S2)、DC1 (S1,S
2)、TS1 (S1,S2)のいずれも、その値が大き
いほど検索式S1と検索式S2の間に高い関連性がある
ことを意味する。ここで、MI1 (S1,S2)を「第
1の拡張相互情報量」、DC 1 (S1,S2)を「第1
の拡張DC」、TS1 (S1,S2)を「第1の拡張T
S」と呼ぶこととする。なお、拡張相互情報量と同様
に、第1の拡張DCと第1の拡張TSとをそれぞれ
【0052】
【数16】
【0053】
【数17】
【0054】と表すことができる。式(16)からわか
るように、第1の拡張DCを求める際には、全検索対象
文書数Mは不要である。以下に、第1の拡張相互情報量
を用いて検索式間の関連度を求める本発明の第1の実施
の形態を具体的に説明する。
【0055】図2は、本発明の第1の実施の形態の構成
を示すブロック図である。第1の実施の形態の関連検索
式検索装置は、以下の各要素で構成されている。文書格
納手段11は、電子化された検索対象文書を格納する。
これは、半導体メモリやハードディスク装置などの記憶
装置である。
【0056】検索式取得手段12は、検索条件としてキ
ーワードから構成される検索式を入力装置から受け付け
ることが可能なユーザインタフェースを持つ処理手段で
ある。
【0057】検索式格納手段13は、過去に検索式取得
手段12に入力された検索式を全て格納する記憶装置で
ある。文書数計算手段14は、検索式取得手段12に入
力された検索式に適合する文書集合を、文書格納手段1
1から取得し、得られた文書集合を検索結果として検索
結果表示手段7に通知する。また、文書格納手段11中
の文書集合を対象として以下の4種の値を取得する。 (1)文書格納手段11に格納されている文書の総数
(=M) (2)検索式取得手段12に入力された検索式に適合す
る文書の数(=A) (3)検索式格納手段13に格納されている各検索式に
関して、その検索式に適合し、かつ、検索式取得手段1
2に入力された検索式に適合する文書の数(=B) (4)検索式格納手段13に格納されている各検索式に
関して、その検索式に適合する文書の数(=C) 相互情報量計算手段15は、文書数計算手段14により
得られた4種の値を、式(7)〜式(10)に代入する
ことにより(ただし、A=a1 +b1 、B=a 1 、C=
1 +c1 )、検索式取得手段12に入力された検索式
と検索式格納手段13に格納されている各検索式との間
の第1の拡張相互情報量を求める。
【0058】関連検索式表示手段16は、相互情報量計
算手段15によって得られた拡張相互情報量の値が大き
いものから順に、検索式格納手段13中の対応する検索
式を、表示装置の画面に表示する。
【0059】検索結果表示手段17は、入力された検索
式に適合する文書の情報を文書数計算手段14から取得
し、その検索結果を表示装置の画面に表示する。このよ
うな構成により、以下のような手順で処理が行われる。
【0060】図3は、入力された検索式の関連検索式の
算出手順を示す図である。これは、検索式取得手段12
に、キーボードなどの入力装置から検索式が入力された
際に実行される。以下、処理手順をステップ番号に沿っ
て説明する。 [S1]検索式取得手段12が、検索式を受け取る。こ
の検索式をSと呼ぶことにする。 [S2]文書数計算手段14が、Sに適合する文書集合
を、文書格納手段11から取得する。得られた文書集合
の要素数をAとする。 [S3]文書数計算手段14と関連検索式表示手段16
とのそれぞれが、ステップS2においてA=0であるか
否かを判断する。ステップS2においてA=0であれば
ステップS9へ進み、そうでなければステップS4へ進
む。 [S4]文書数計算手段14が、検索式格納手段13中
の検索式をSi(i=1,2,・・・・,m、ただしm
は検索式格納手段13中に格納されている検索式の総
数)とし、以下の値を求める。
【0061】第1の値は、文書格納手段11に格納され
ている文書のうち、Siに適合し、かつ、Sに適合する
文書の総数である。文書の総数を「Bi」とする。第2
の値は、文書格納手段11に格納されている文書のう
ち、Siに適合する文書の総数である。この文書数を
「Ci」とする。 [S5]文書数計算手段14が、Si(i=1,2,・
・・,m)について、文書格納手段11に格納されてい
る全文書数をMとして、 prob(S,Si)=Bi/M prob(S)=A/M prob(Si)=Ci/M を計算し、式(7)に従って、第1の拡張相互情報量M
1 (S,Si)(i=1,2,・・・,m)を計算す
る。 [S6]検索式取得手段12が、検索式Sを検索式格納
手段3に格納する。 [S7]関連検索式表示手段16が、予め設定された閾
値Tを越えるMI1 (S,Si)(i=1,2,・・
・,m)が存在するか否かを判断する。存在すればステ
ップS8へ進み、そうでなければステップS9へ進む。 [S8]関連検索式表示手段16が、閾値Tを越えるM
1 (S,Si)に対応する検索式SiをMI1 (S,
Si)の値が大きいものから順に検索式Sの関連検索式
として出力し、処理を終了する。 [S9]関連検索式表示手段16が、S1の関連検索式
がない旨の表示を行い、処理を終了する。
【0062】図4は、関連検索式が提示された検索画面
を示す図である。この検索画面20は、3つのサブウィ
ンドウ21〜23に別れている。サブウィンドウ21
は、検索式入力用のウィンドウであり、テキスト入力フ
ィールド21aと、検索ボタン21bとが設けられてい
る。ユーザは、キーボードなどの入力装置を用いて、テ
キスト入力フィールド21aに検索式を入力し、検索ボ
タン21bを押下することにより、検索指令を入力でき
る。
【0063】サブウィンドウ22は、検索結果表示用の
ウィンドウである。このサブウィンドウ22には、テキ
スト入力フィールド21aに入力された検索式に適合す
る文書に関する情報が表示される。この例では、各適合
文書の表題が表示されている。
【0064】サブウィンドウ23は、関連検索式表示用
のウィンドウである。このサブウィンドウ23には、過
去にテキスト入力フィールド21aに入力された検索式
の中で、検索ボタン21bが押下されたときにテキスト
入力フィールド21aに設定されていた検索式に関連し
たものが表示される。これは、関連度の高い順に表示さ
れる。
【0065】なお、サブウィンドウ21は検索式取得手
段12が提供するウィンドウであり、サブウィンドウ2
2は検索結果表示手段17が提供するウィンドウであ
り、サブウィンドウ23は関連検索式表示手段16が提
供するウィンドウである。
【0066】この図では、ユーザが「ヨットの帆に用い
られている生地の最新の材質について知りたい」という
検索意図にしたがって、検索式「ヨット and 帆
and 生地」によって検索を行った例を示している。
サブウィンドウ22に検索式から得られる検索結果が示
されると共に、サブウィンドウ23には、検索式「ヨッ
ト and 帆 and 生地」と関連度の高い(検索
結果が類似している)検索式が表示される。
【0067】そこでユーザは、サブウィンドウ23に表
示された検索式の例を参照することによって、例えば、
「ヨット and 帆 and (生地 or スペク
トラor ケブラー or ベクトランor PBO
or 液晶ポリマー)」といった、より検索漏れの少な
い検索式を作成することが可能となる。
【0068】以上のように本実施の形態によれば、検索
式間に共通の単語あるいは類似単語がない場合であって
も、検索結果に類似性のある検索式を関連検索式として
得ることが可能となり、より検索意図に近い検索式への
修正が容易となる。なお、第1の拡張相互情報量に変え
て、第1の拡張DCや第1の拡張TSを用いることもで
きる。
【0069】次に第2の実施の形態について説明する。
第2の実施の形態は、検索式に適合する文書に含まれる
単語と当該検索式との間の関連度を用いて、検索式同士
の関連度を判定するものである。検索式と単語との間の
関連度は、相互情報量などを拡張することで求めること
ができる。その方法を以下に示す。
【0070】まず、検索式Sと単語wordとの間の相
互情報量(MI2 )を、
【0071】
【数18】
【0072】と定義する。ただし、全検索対象文書数を
M、wordを含みかつ検索式Sから得られる文書の数
をa2 、検索式Sから得られる文書のうちwordを含
まない文書の数をb2 、wordを含む文書のうち検索
式Sから得られる文書を除いた文書の数をc2 とした場
合、
【0073】
【数19】
【0074】
【数20】
【0075】
【数21】
【0076】である。ここで、「a2 +b2 」は検索式
Sから得られる文書の総数であり、その値を「第4の
値」とする。また、wordを含みかつ検索式Sから得
られる文書の数である「a2 」を「第5の値」とする。
また、「a2 +c2 」はwordを含む文書の総数で
り、その値を「第6の値」とする。そして、式(18)
を、
【0077】
【数22】
【0078】とすることにより、全検索対象文書数M、
「第4の値」、「第5の値」及び「第6の値」を変数と
する計算式となる。同様に、Dice−coeffic
ent(DC)およびt−score(TS)について
も同様に、以下のような拡張を施すことが可能である。
【0079】
【数23】
【0080】
【数24】
【0081】MI2 (S,word)、DC2 (S,w
ord)、TS2 (S,word)のいずれも、その値
が大きいほど検索式Sと単語wordの間に高い類似性
があることを意味する。ここで、MI1 (S,wor
d)を「第2の拡張相互情報量」、DC2 (S,wor
d)を「第2の拡張DC」、TS2 (S,word)を
「第2の拡張TS」と呼ぶこととする。なお、拡張相互
情報量と同様に、第2の拡張DCと第2の拡張TSとを
それぞれ
【0082】
【数25】
【0083】
【数26】
【0084】と表すことができる。式(25)からわか
るように、第2の拡張DCを求める際には、全検索対象
文書数Mは不要である。以下に、第2の拡張相互情報量
を用いて検索式間の関連度を求める本発明の第2の実施
の形態を具体的に説明する。
【0085】図5は、本発明の第2の実施の形態の構成
を示す図である。本実施の形態は、以下に示す要素で構
成されている。文書格納手段31は、電子化された検索
対象文書の内容を、形態素解析手段32によって付加さ
れる文書識別子と対にして格納する記憶装置である。
【0086】形態素解析手段32は、文書格納手段31
に格納されている各文書に文書識別子を付加した上で、
各文書に形態素解析処理を施して自立語を抽出し、対応
する文書識別子と対にして格納する。
【0087】索引構造生成手段33は、形態素解析手段
32での形態素解析処理結果を基に、索引構造として、
単語−単語識別子リスト34a、単語識別子−文書識別
子リスト34b、文書識別子−単語識別子リスト34c
を作成する。
【0088】索引構造格納手段34は、索引構造生成手
段33によって作成された単語−単語識別子リスト34
a、単語識別子−文書識別子リスト34b、文書識別子
−単語識別子リスト34cを格納する記憶装置である。
【0089】単語−単語識別子リスト34aは、単語文
字列あるいは書誌的事項と、該単語あるいは該書誌的事
項を示す単語識別子の対応関係を記述したリストであ
る。単語識別子−文書識別子リスト34bは、各単語識
別子について、その単語識別子で示される単語文字列あ
るいは書誌的事項を含む文書の文書識別子の集合を記述
したリストである。文書識別子−単語識別子リスト34
cは、各文書識別子について、その文書識別子で示され
る文書に含まれる単語あるいは文書に付加された書誌的
事項の単語識別子の集合を記述したリストである。
【0090】検索式取得手段41は、検索式の入力を受
付ることが可能なユーザインタフェースである。入力さ
れた検索式は、文書検索手段42と検索式格納手段48
とに渡す。
【0091】文書検索手段42は、検索式取得手段41
に入力された検索式および、キーワードリスト生成手段
44によって作成されたキーワードリスト中の単語識別
子を受け取り、該検索式に適合する文書あるいは該単語
識別子に対応する単語を含む文書の文書識別子を、単語
−単語識別子リスト34aおよび単語識別子−文書識別
子リスト34bを参照して取得する。
【0092】キーワード検索手段43は、文書検索手段
42によって得られた文書識別子集合で示される文書集
合の各文書に含まれる単語の単語識別子集合を、文書識
別子−単語識別子リスト34cを参照して取得し、それ
らを連接して1つの単語識別子集合とする。
【0093】キーワードリスト生成手段44は、キーワ
ード検索手段43から得られた単語識別子集合中での各
単語識別子の出現回数を計測し、文書検索手段42によ
って取得された文書識別子の総数から、キーワードリス
トを生成する。キーワードリストには、単語識別子、該
単語識別子に対応する単語を含む文書の出現確率、及び
検索式取得手段41に入力された検索式に適合し、かつ
該単語識別子に対応する単語を含む文書の出現確率の3
つの情報が組となって登録されている。
【0094】類似度計算手段45は、キーワードリスト
生成手段44によって作成されたキーワードリストを参
照し、各単語識別子に対応する単語の第2の拡張相互情
報量を式(18)に従って計算する。そして、単語識別
子集合および単語識別子に対応する第1の拡張相互情報
量を検索式格納手段48に渡す。
【0095】関連度計算手段46は、類似度計算手段4
5から得られる各単語の第2の拡張相互情報量と、検索
式格納手段48中に格納されている検索式に対応する各
単語の第2の拡張相互情報量とを比較することによっ
て、検索式取得手段41に入力された検索式と検索式格
納手段48中に格納されている各検索式の間の関連度を
計算する。
【0096】表示手段47は、関連度計算手段46で計
算された関連度が大きい値のものから順に、検索式を出
力するユーザインタフェースである。検索式格納手段4
8は、過去に検索式取得手段41に入力された検索式を
格納する。さらに、各検索式ごとに、類似度計算手段4
5から得られる単語識別子集合および単語識別子に対応
する第2の拡張相互情報量を格納する。
【0097】以上のような構成のシステムにおいて、形
態素解析手段32は、文書格納手段31に格納されてい
る各検索対象文書に識別子を割当てた上で、それぞれの
文書に形態素解析処理を施して自立語を抽出し、対応す
る文書識別子と対にして、形態素解析結果リスト32a
として格納する。ただし、同一文書中から同一の自立語
が複数回抽出された場合は、2回目以降の抽出結果を無
視し、1つの文書識別子に対応する自立語が重複するこ
とはないものとする。
【0098】図6は、形態素解析手段に格納される形態
素解析結果リストの例を示す図である。このように、文
書識別子と抽出単語とが組となって格納される。この形
態素解析結果リスト32aを基に、索引構造生成手段3
3が各種索引構造を生成する。図7〜図9に索引構造生
成手段33により作成され、索引構造格納手段34に格
納される索引構造の例を示す。なお図7〜図9中のデー
タは、図6のデータに基づいて作成された例となってい
る。
【0099】図7は、単語−単語識別子リストの例を示
す図である。単語−単語識別子リスト34aには、抽出
された単語と、その単語に割り当てられた識別子とが組
となって格納されている。
【0100】図8は、単語識別子−文書識別子リストの
例を示す図である。単語識別子−文書識別子リスト34
bには、単語識別子と、その単語識別子が割り当てられ
ている単語を含む文書の識別子(文書識別子)が組とな
って格納されている。
【0101】図9は、文書識別子−単語識別子リストの
例を示す図である。文書識別子−単語識別子リスト34
cには、文書識別子と、その文書識別子が割り当てられ
ている文書に含まれる単語の単語識別子とが組となって
格納されている。
【0102】索引構造生成手段33による索引構造の生
成アルゴリズムは以下の通りである。図10は、索引構
造の生成アルゴリズムを示すフローチャートである。こ
の処理は全て索引構造生成手段33が行う。 [S11]単語−単語識別子リスト34aの生成処理を
行う。すなわち、形態素解析手段32に格納されている
形態素解析結果リスト中の全単語を、重複なく、かつ、
単語文字列の持つ値の順にソートしたリストを作成す
る。そして、各単語に対して、リストの先頭から順に1
で始まる自然数を単語識別子として割当てる。[S1
2]文書識別子−単語識別子リスト34bの生成処理を
行う。すなわち、形態素解析手段32に格納されている
形態素解析結果リスト中の各単語をステップS11で割
当てた単語識別子で置き換え、各文書識別子ごとに対応
する単語識別子を小さい値順にソートする。 [S13]単語識別子−文書識別子リスト34cの生成
処理を行う。すなわち、単語識別子を1から順に並べ、
各単語識別子に対応する単語が含まれる文書の文書識別
子を、ステップS12で作成した文書識別子−単語識別
子リスト34cを参照して抽出し、単語識別子と対にし
て格納する。
【0103】以上のアルゴリズムにより、索引構造が生
成される。索引構造の生成処理が行われた後、検索式取
得手段41に対する検索式の入力が可能となる。そし
て、利用者がキーボードなどの入力装置を用いて所望の
検索式を入力し、検索開始の指令を行うと、関連語の提
示処理が開始される。以下に検索式取得手段41に入力
された検索式から関連検索式を求めるための処理手順の
詳細を説明する。
【0104】図11は、検索式取得手段に入力された検
索式から関連検索式を求めるためのアルゴリズムを示す
フローチャートの前半である。以下、図11の各ステッ
プについて説明する。以下の説明において、単語−単語
識別子リスト34aをL1、単語識別子−文書識別子リ
スト34bをL2、文書識別子−単語識別子リスト34
cをL3と記述することにする。 [S21]検索式取得手段41が検索式を受け取る。こ
の検索式をSと呼ぶことにする。 [S22]文書検索手段42が、Sに適合する文書の文
書識別子を、L1およびL2を参照して取得する。得ら
れた文書識別子集合をXと呼び、集合Xの要素数をNと
する。 [S23]表示手段47及びキーワード検索手段43
が、ステップS22においてN=0であるか否かを判断
する。ステップS22においてN=0であればステップ
S24へ進み、そうでなければステップS25へ進む。 [S24]表示手段47が、Sの関連検索式がない旨の
表示を行い、終了する。 [S25]キーワード検索手段43が、Xに属する各文
書識別子に対応する単語識別子を、L3を参照して取得
する。取得した単語識別子の集合をYとする。 [S26]キーワードリスト生成手段44が、Yに属す
る単語識別子の重複を取り除き、各単語識別子の重複回
数を記録する。重複の取り除かれた単語識別子集合を新
たにYとし、Yの要素Wn(n=1,2,・・・,P)
の重複回数をR(Wn)とする。ただし、PはYの要素
数とする。 [S27]文書検索手段42が、Yに属する全単語識別
子Wn(n=1,2,・・・,P)に関して、Wnに対
応する文書識別子の総数をL2から取得する。Yの要素
Wnに対応する文書識別子数をF(Wn)とする。 [S28]キーワードリスト生成手段44が、Yに属す
る単語識別子Wn(n=1,2,・・・,P)につい
て、全検索対象文書数をMとして、
【0105】
【数27】
【0106】
【数28】 を計算し、これらの値をWnと組にしてリストとする。
また、
【0107】
【数29】 prob(S)=N/M・・・・(29) を計算する。
【0108】図12は、検索式取得手段に入力された検
索式から関連検索式を求めるためのアルゴリズムを示す
フローチャートの後半である。[S29]類似度計算手
段45が、Yに属する各単語識別子Wn(n=1,2,
・・・,P)について、式(18)に従って、第2の拡
張相互情報量MI2 (S,Wn)を計算する。[S3
0]関連度計算手段46が、検索式格納手段48中に格
納されている検索式Si(i=1,2,・・・,Q)の
全てに対して以下のK(S,Si)を計算する。
【0109】
【数30】
【0110】ここで、Wim(m=1,2,・・・,
U)は、検索式格納手段48中に検索式Siに対応して
格納されている単語識別子であり、MI2 (Si,Wi
m)は検索式Siと単語識別子Wimに対応する単語と
の間の第2の拡張相互情報量値である。また、
【0111】
【数31】
【0112】は、WnとWimが等しい場合には、MI
2 (S,Wn)の値とMI2 (Si,Wim)の値の積
であり、等しくない場合は0であるとする。[S31]
類似度計算手段45が、Wn(n=1,2,・・・,
P)およびMI 2 (S,Wn)(n=1,2,・・・,
P)を検索式Sと共に検索式格納手段48の中に追加格
納する。[S32]表示手段47が、予め設定された閾
値Tを越えるK(S,Si)が存在するか否かを判断す
る。予め設定された閾値Tを越えるK(S,Si)が存
在するれば、ステップS33へ進み、そうでなければス
テップS34へ進む。[S33]表示手段47が、閾値
Tを越えるK(S,Si)に対応するSiをK(S,S
i)の値が大きいものから順にSの関連検索式として出
力し、終了する。[S34]表示手段47が、Sの関連
検索式がない旨の表示を行い、終了する。
【0113】以上のアルゴリズムによって、第1の実施
の形態と同様に、検索式間に共通の単語あるいは類似単
語がない場合であっても、検索結果に類似性のある検索
式を関連検索式として得ることが可能となる。なお、第
2の拡張相互情報量に変えて、第2の拡張DCや第2の
拡張TSを用いることもできる。
【0114】なお、上記の処理機能は、コンピュータに
よって実現することができる。その場合、関連検索式検
索装置が有すべき機能の処理内容は、コンピュータで読
み取り可能な記録媒体に記録されたプログラムに記述さ
れており、このプログラムをコンピュータで実行するこ
とにより、上記処理がコンピュータで実現される。コン
ピュータで読み取り可能な記録媒体としては、磁気記録
装置や半導体メモリ等がある。市場を流通させる場合に
は、CD−ROM(Compact Disk Read Only Memory) や
フロッピーディスク等の可搬型記録媒体にプログラムを
格納して流通させたり、ネットワークを介して接続され
たコンピュータの記憶装置に格納しておき、ネットワー
クを通じて他のコンピュータに転送することもできる。
コンピュータで実行する際には、コンピュータ内のハー
ドディスク装置等にプログラムを格納しておき、メイン
メモリにロードして実行する。
【0115】
【発明の効果】以上説明したように本発明の関連検索式
検索装置では、入力された検索式に適合する文書と、検
索式格納手段に格納されている検索式に適合する文書と
を比較することにより、入力された検索式と検索式格納
手段に格納されている各検索式との間の関連度を判定す
るようにしたため、検索式全体が持つ意味を直接反映し
て、検索式同士の関連度が計算できる。
【0116】また、本発明の関連検索式検索プログラム
を記録した記録媒体では、入力された検索式に適合する
文書と、検索式格納手段に格納されている検索式に適合
する文書とを比較することにより、入力された検索式と
検索式格納手段に格納されている各検索式との間の関連
度を判定するような処理をコンピュータで実現するため
の関連検索式検索プログラムを格納したため、格納され
た検索式をコンピュータに実行させることにより、検索
式全体が持つ意味を直接反映した検索式同士の関連度計
算を、コンピュータに実行させることができる。
【図面の簡単な説明】
【図1】本発明の原理構成図である。
【図2】本発明の第1の実施の形態の構成を示すブロッ
ク図である。
【図3】入力された検索式の関連検索式の算出手順を示
す図である。
【図4】関連検索式が提示された検索画面を示す図であ
る。
【図5】本発明の第2の実施の形態の構成を示す図であ
る。
【図6】形態素解析手段に格納される形態素解析結果リ
ストの例を示す図である。
【図7】単語−単語識別子リストの例を示す図である。
【図8】単語識別子−文書識別子リストの例を示す図で
ある。
【図9】文書識別子−単語識別子リストの例を示す図で
ある。
【図10】索引構造の生成アルゴリズムを示すフローチ
ャートである。
【図11】検索式取得手段に入力された検索式から関連
検索式を求めるためのアルゴリズムを示すフローチャー
トの前半である。
【図12】検索式取得手段に入力された検索式から関連
検索式を求めるためのアルゴリズムを示すフローチャー
トの後半である。
【符号の説明】
1 文書格納手段 2 検索式取得手段 3 検索式格納手段 4 関連度判定手段 4a 文書数計算手段 4b 関連度計算手段
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平5−158991(JP,A) 特開 平8−161343(JP,A) 特開 昭62−131333(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06F 17/30

Claims (11)

    (57)【特許請求の範囲】
  1. 【請求項1】 入力された検索式に関連する他の検索式
    を検索する関連検索式検索装置において、 複数の文書を格納する文書格納手段と、 入力された検索式を受け取る検索式取得手段と、 前記検索式取得手段が取得した検索式を順次追加格納す
    る検索式格納手段と、前記検索式格納手段に格納されている各検索式を関連検
    索式候補とし、前記文書格納手段中の文書のうち、前記
    検索式取得手段に入力された検索式に適合する文書の数
    である第1の値と、前記文書格納手段中の文書のうち、
    前記検索式取得手段に入力された検索式に適合し、か
    つ、前記検索式格納手段に格納されている各関連検索式
    候補に適合する文書の数である関連検索式候補ごとの第
    2の値と、前記文書格納手段中の文書のうち、前記検索
    式格納手段に格納されている各関連検索式候補に適合す
    る文書の数である関連検索式候補ごとの第3の値とを求
    める文書数計算手段と、 前記文書数計算手段が算出した第1の値、関連検索式候
    補ごとの第2の値及び関連検索式候補ごとの第3の値を
    変数とする計算式に基づいて、前記検索式取得手段が受
    け取った検索式と各関連検索式候補との間の関連度を算
    出する関連度計算手段と、 を有することを特徴とする関連文書検索装置。
  2. 【請求項2】 前記関連度計算手段は、前記文書格納手
    段に格納されている全ての文書の数をMとし、第1の値
    をα、関連検索式候補ごとの第2の値をβ、関連検索式
    候補ごとの第3の値をγとした場合に、以下の計算式、 拡張相互情報量=log2 {(Mβ)/(αγ)} で求められる拡張相互情報量の値を、前記検索式取得手
    段が受け取った検索条件と各関連検索式候補との間の関
    連度とすることを特徴とする請求項1記載の関連検索式
    検索装置。
  3. 【請求項3】 前記関連度計算手段は、前記文書格納手
    段に格納されている全ての文書の数をMとし、第1の値
    をα、関連検索式候補ごとの第2の値をβ、関連検索式
    候補ごとの第3の値をγとした場合に、 拡張TS(t-score) =M{( Mβ−αγ)/(αγ)} で求められる拡張TSの値を、前記検索式取得手段が受
    け取った検索条件と各関連検索式候補との間の関連度と
    することを特徴とする請求項1記載の関連検索式検索装
    置。
  4. 【請求項4】 前記関連度計算手段は、第1の値をα、
    関連検索式候補ごとの第2の値をβ、関連検索式候補ご
    との第3の値をγとした場合に、以下の計算式、 拡張DC(Dice-coefficient) =2β/( α+γ) で求められる拡張DCの値を、前記検索式取得手段が受
    け取った検索式と各関連検索式候補との間の関連度とす
    ることを特徴とする請求項1記載の関連検索式検索装
    置。
  5. 【請求項5】 入力された検索式に関連する他の検索式
    を検索する関連検索式検索装置において、 複数の文書を格納する文書格納手段と、 入力された検索式を受け取る検索式取得手段と、 前記検索式取得手段が取得した検索式を順次追加格納す
    る検索式格納手段と、 前記検索式格納手段に格納されている各検索式を関連検
    索式候補とし、前記検索式取得手段が取得した検索式に
    適合する前記文書格納手段内の文書から抽出される重要
    語の集合である第1の重要語リストと、前記検索式格納
    手段に格納されている各関連検索式候補に適合する前記
    文書格納手段内の文書から抽出される重要語の集合であ
    る関連検索式候補ごとの第2の重要語リストとを求める
    重要語抽出手段と、 前記重要語抽出手段から得られる第1の重要語リスト内
    の重要語と関連検索式候補ごとの第2の重要語リスト内
    の重要語とを比較することにより、前記検索式取得手段
    に入力された検索式と、前記検索式格納手段に格納され
    ている各関連検索式候補との間の関連度を算出する関連
    度計算手段と、 を有することを特徴とする関連検索式検索装置。
  6. 【請求項6】 前記重要語抽出手段は、前記検索式取得
    手段が取得した検索式から求められる第1の重要語リス
    トに含まれる各重要語に対して、前記検索式 取得手段が
    取得した検索式との間の関連性の度合いを示す重要度を
    算出するとともに、関連検索式候補ごとの第2の重要語
    リストに含まれる各重要語に対して、対応する関連検索
    式候補との間の関連性の度合いを示す重要度を算出し、 前記関連度計算手段は、前記重要語抽出手段から得られ
    る第1の重要語リスト内の重要語の重要度と、関連検索
    式候補ごとの第2の重要語リスト内の重要語の重要度と
    を用いて、前記検索式取得手段に入力された検索式と、
    前記検索式格納手段に格納されている各関連検索式候補
    との間の関連度を算出することを特徴とする請求項5記
    載の関連検索式検索装置。
  7. 【請求項7】 前記重要語抽出手段は、第1の重要語リ
    スト及び関連検索式候補ごとの第2の重要語リストに含
    まれる各重要語の重要度を求める際には、前記検索式取
    得手段が取得した検索式若しくは関連検索式候補を対象
    検索式とするとともに、対象検索式から求められた第1
    の重要語リスト若しくは第2の重要語リストを対象重要
    度リストとし、対象検索式に適合する文書の数である第
    1の値と、前記文書格納手段中の文書の対象検索式に適
    合する文書の中で対象重要語リスト内の各重要語を含ん
    でいる文書の数である重要語ごとの第2の値と、前記文
    書格納手段に格納されている文書の中で対象重要語リス
    ト内の各重要語を含んでいる文書の数である重要語ごと
    の第3の値とを取得し、第1の値と第3の値との積ある
    いは和である第4の値を重要語ごとに計算し、第2の値
    と第4の値との比率に基づいて、各対象検索式に対応す
    る対象検索式リストに含まれる重要語の重要度を計算す
    ることを特徴とする請求項6記載の関連検索式検索装
    置。
  8. 【請求項8】 前記重要語抽出手段は、対象検索式に対
    する重要語を抽出する際には、前記文書格納手段に格納
    されている全ての文書の数をMとし、第1の値をα、重
    要語ごとの第2の値をβ、重要語ごとの第3の値をγと
    した場合に、以下の計算式、 拡張相互情報量=log2 {(Mβ)/(αγ)} で求められる拡張相互情報量の値を、対象検索式から求
    められる対象重要語リスト内の各重要語の重要度とする
    ことを特徴とする請求項7記載の関連検索式検索装置。
  9. 【請求項9】 前記関連度計算手段は、前記文書格納手
    段に格納されている 全ての文書の数をMとし、第1の値
    をα、関連検索式候補ごとの第2の値をβ、関連検索式
    候補ごとの第3の値をγとした場合に、 拡張TS(t-score) =M{( Mβ−αγ)/(αγ)} で求められる拡張TSの値を、対象検索式から求められ
    る対象重要語リスト内の各重要語の重要度とすることを
    特徴とする請求項7記載の関連検索式検索装置。
  10. 【請求項10】 前記関連度計算手段は、第1の値を
    α、関連検索式候補ごとの第2の値をβ、関連検索式候
    補ごとの第3の値をγとした場合に、以下の計算式、 拡張DC(Dice-coefficient) =2β/( α+γ) で求められる拡張DCの値を、対象検索式から求められ
    る対象重要語リスト内の各重要語の重要度とすることを
    特徴とする請求項7記載の関連検索式検索装置。
  11. 【請求項11】 入力された検索式に関連する他の検索
    式を検索する関連検索式検索プログラムを記録したコン
    ピュータ読み取り可能な記録媒体において、 複数の文書を格納する文書格納手段、 入力された検索式を受け取る検索式取得手段、 前記検索式取得手段が取得した検索式を順次追加格納す
    る検索式格納手段、 前記検索式格納手段に格納されている各検索式を関連検
    索式候補とし、前記文書格納手段中の文書のうち、前記
    検索式取得手段に入力された検索式に適合する文書の数
    である第1の値と、前記文書格納手段中の文書のうち、
    前記検索式取得手段に入力された検索式に適合し、か
    つ、前記検索式格納手段に格納されている各関連検索式
    候補に適合する文書の数である関連検索式候補ごとの第
    2の値と、前記文書格納手段中の文書のうち、前記検索
    式格納手段に格納されている各関連検索式候補に適合す
    る文書の数である関連検索式候補ごとの第3の値とを求
    める文書数計算手段、 前記文書数計算手段が算出した第1の値、関連検索式候
    補ごとの第2の値及び関連検索式候補ごとの第3の値を
    変数とする計算式に基づいて、前記検索式取得手段が受
    け取った検索式と各関連検索式候補との間の関連度を算
    出する関連度計算手段、 としてコンピュータを機能させることを特徴とする関連
    検索式検索プログラム を記録したコンピュータ読み取り
    可能な記録媒体。
JP00678498A 1998-01-16 1998-01-16 関連検索式検索装置及び関連検索式検索プログラムを記録したコンピュータ読み取り可能な記録媒体 Expired - Fee Related JP3436109B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP00678498A JP3436109B2 (ja) 1998-01-16 1998-01-16 関連検索式検索装置及び関連検索式検索プログラムを記録したコンピュータ読み取り可能な記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP00678498A JP3436109B2 (ja) 1998-01-16 1998-01-16 関連検索式検索装置及び関連検索式検索プログラムを記録したコンピュータ読み取り可能な記録媒体

Publications (2)

Publication Number Publication Date
JPH11203289A JPH11203289A (ja) 1999-07-30
JP3436109B2 true JP3436109B2 (ja) 2003-08-11

Family

ID=11647809

Family Applications (1)

Application Number Title Priority Date Filing Date
JP00678498A Expired - Fee Related JP3436109B2 (ja) 1998-01-16 1998-01-16 関連検索式検索装置及び関連検索式検索プログラムを記録したコンピュータ読み取り可能な記録媒体

Country Status (1)

Country Link
JP (1) JP3436109B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4698618B2 (ja) * 2007-01-24 2011-06-08 日本電信電話株式会社 関係抽出方法、関係抽出システム
CN110489526A (zh) * 2019-08-13 2019-11-22 上海市儿童医院 一种用于医学检索的检索词扩展方法、装置及存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62131333A (ja) * 1985-12-04 1987-06-13 Hitachi Ltd 情報検索方式
JPH05158991A (ja) * 1991-12-02 1993-06-25 Mitsubishi Electric Corp 情報検索システム
JP3687118B2 (ja) * 1994-12-01 2005-08-24 富士ゼロックス株式会社 関連語辞書作成装置および関連語辞書作成方法

Also Published As

Publication number Publication date
JPH11203289A (ja) 1999-07-30

Similar Documents

Publication Publication Date Title
US6904429B2 (en) Information retrieval apparatus and information retrieval method
JP6461980B2 (ja) 検索結果におけるコヒーレントな質問回答
JP2832988B2 (ja) データ検索システム
JPH0424869A (ja) 文書処理システム
KR20080031262A (ko) 관계 네트워크
JPH10240759A (ja) 検索装置
JP4160548B2 (ja) 文書要約作成システム、方法、及びプログラム
JP3427674B2 (ja) 関連語提示装置及び関連語提示用プログラムを記録した媒体
JP3123836B2 (ja) テキスト型データベース装置
JP3436109B2 (ja) 関連検索式検索装置及び関連検索式検索プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2817103B2 (ja) データ検索装置及びデータ検索方法
JP3385913B2 (ja) 関連語提示装置及び関連語提示用プログラムを記録した媒体
JP3162907B2 (ja) 文書データ検索装置
JP2732661B2 (ja) テキスト型データベース装置
JP2835335B2 (ja) データ検索装置及びデータ検索方法
JPH06124305A (ja) 文書検索方法
JPH07134720A (ja) 文章作成システムにおける関連情報提示方法及び装置
JP3006526B2 (ja) 類似文書検索方法および類似文書検索装置
JPH05314181A (ja) 情報検索装置
JPH08249341A (ja) 文書データベースの文書格納・検索装置
JPH02253474A (ja) テキストベース検索方法
JPH07296005A (ja) 日本語テキスト登録・検索装置
JPH09101951A (ja) 文書検索装置
JPH03229367A (ja) テキストベース検索方式
JPH06161995A (ja) 氏名データ整形方法および装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090606

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100606

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110606

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110606

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120606

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130606

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees