JPH10143521A - 情報検索方法及び情報検索装置 - Google Patents

情報検索方法及び情報検索装置

Info

Publication number
JPH10143521A
JPH10143521A JP8298387A JP29838796A JPH10143521A JP H10143521 A JPH10143521 A JP H10143521A JP 8298387 A JP8298387 A JP 8298387A JP 29838796 A JP29838796 A JP 29838796A JP H10143521 A JPH10143521 A JP H10143521A
Authority
JP
Japan
Prior art keywords
keyword
search
dictionary
synonym
words
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP8298387A
Other languages
English (en)
Inventor
Toshihiko Jiyoufuu
敏彦 城風
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP8298387A priority Critical patent/JPH10143521A/ja
Publication of JPH10143521A publication Critical patent/JPH10143521A/ja
Withdrawn legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 専門用語の類義語を自動的に獲得して、あい
まいな要求からでも、柔軟に検索を行うことができる情
報検索方法及び情報検索装置を提供する。 【解決手段】 情報検索方法及び情報検索装置は、キー
ワードのOR結合を同義、類義、対語のOR結合に拡張
する手段と、論理結合の種類とキーワードの字種から登
録と検索に用いる辞書を選択する手段とを設ける。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、電子化文書の情報
検索方法及び情報検索装置に関する。
【0002】
【従来の技術】従来の情報検索方法としては、例えば、
信学技報AI95−24,PP15−22“統計的シソ
ーラスを用いた分散型ニュース検索システム”(文献
1)、情処研資 自然言語処理 102−7,PP49
−56“単語ベクトルを用いた多義語の意味推定”(文
献2)に記載されたものがある。
【0003】従来の情報検索方法は、キーワードのΑΝ
D、OR、NOT指定の形式による検索要求に応えるキ
ーワード検索、自由なフレーズの検索要求に応える全文
検索が主である。どちらにおいても、利用者が投入した
キーワードやフレーズだけで検索するのでは利用者の負
担が大きい。そこで、既存の辞書や類義語辞書(シソー
ラス)を用いてキーワードやフレーズを拡張して、利用
者の負担を軽減するシステムも存在するが、実用にはま
だ幾つかの課題の克服が必要である。
【0004】更に、従来の検索方法は、検索文書の正答
度を真か偽かの2値としているため、はっきりと正答と
は言えなくとも関係がありそうな文書を切り捨ててしま
っている。本当は適当であった文書を、検索できないこ
とが多々起こっている。そこで、正答度を0から1の間
の連続的な値をとるようにして、正答度が1でなくと
も、柔軟に文書を検索するファジィ検索が提案されてい
る。
【0005】ファジィ検索は、データベースをファジィ
化させる方法と、シソーラスをファジィ化させる方法の
2つが代表的である。
【0006】ファジィデータベースは、例えば年間降雪
量10メートルに対し、雪深さ度0.8などという値を
返すメンバーシップ関数を、自然言語の主に副詞につい
て作成する。これは、常識データベースとも言える巨大
で複雑なものであり、容易には実現できない。
【0007】ファジィシソーラスは、大規模テキスト中
のキーワード間の共起確率を類似度と考えて、シソーラ
スをファジィ化する。利用者が与えたキーワードを直接
含まない文書でも、キーワードと共起確率の高いキーワ
ードを含む文書を、グレード付きで出力する方法が代表
的である。
【0008】上記文献1においては、ファジィシソーラ
スを計算するのに、文書内共起確率、連接確率、連接確
率ベクトルを比較し、連接確率ベクトルが最も検索に有
効であることがわかった。
【0009】ファジィシソーラスを計算するには、もう
1つの方法がある。上記文献2にあるように、辞書の語
義から計算される単語間距離を用いる方法である。この
文献資料からは、語義から計算した単語ベクトルより
も、共起確率から計算した単語ベクトルの方が、多義語
の意味推定(文脈による曖昧性の解消)に有効としてい
る。但し、上記文献2の著者らも記している通り、共起
確率の方がいつでも有効であるということではなく、場
面によって語義の距離を用いたベクトルの方が有効であ
ることもあるとしている。文献2では多義語の意味推定
についてであるが、これを類義語への拡張に置き換えて
も、やはり場面によって異なるのが現状である。
【0010】
【発明が解決しようとする課題】このような従来の情報
検索方法では、以下に述べるような問題点があった。
【0011】図11は従来のキーワード検索のインタフ
ェースの例を示す図であり、検索要求入力インタフェー
スと入力例を示す。
【0012】図11に示すようなインターフェースは、
検索用の論理式を利用者に打ち込ませるものよりも、利
用者にとって入力しやすい。しかし、論理式の入れ子構
造は扱えない。
【0013】例えば、work stationの購入
に関する記事を検索したい場合で、自分にとっての購入
は販売側からは販売であるので、望みの検索条件は、 (workANDstation)AND(購入ΟR販
売) であるが、図11に販売をORで追加すると、 ((workANDstation)AND購入)OR
販売 となってしまい、望みの検索条件と異なったものになっ
てしまう。
【0014】利用者が入力しやすく、かつ、論理結合の
入れ子を容易に指定できるインタニフェースが望まれて
いる。
【0015】また、現在の情報検索システムは、シソー
ラスの十分な整備がないため、未だ実用的とはいえな
い。従来のシソーラスは国語辞典などから作成されるた
め、新しい専門用語などには全く追随できないでいるか
らである。
【0016】例えば、ファジィ論理に関する文献を検索
する場合、利用者は検索条件を、以下のように指定する
ことになる。
【0017】ファジィ OR fuzzy OR 曖昧
OR あいまい これに加えて、 柔軟 アナログ的 やわらか ニューラルネット 等も類義語として必要な場合も多い。しかし、“ファジ
ィ”という言葉が辞書にあっても、この言葉“柔軟”や
“アナログ”が類義語として結び付くことは、従来の辞
書を用いたシソーラスにおいては希である。
【0018】このように、新しい専門用語の場合、一つ
の概念が多くの表現をとることが多く、利用者が入力し
たキーワードだけで検索しては、利用者の要求に応えら
れないことが多々ある。現在の情報検索システムは、類
義語辞書、英語のカタカナ表記、日本語表記と英語表記
などの辞書が整備されていないので、利用者がこれら
(一つの概念を表すいくつかの単語)を自分で打ち込む
必要があるため、利用者にかかる負担が大きい。
【0019】また、1字でもスペルミスがあると、全く
検索されないのが普通であるため、部分一致を使うこと
が多いが、必要でない文書まで検索してしまうことも起
こる。
【0020】上に述べたように、従来の国語辞典などか
らシソーラスを作成する方法は、十分に社会に定着した
一般語にのみ適用できるものであり、情報処理や生命科
学などの、日々新しい専門用語が生み出される分野に適
用することは非常に困難である。新しい製品名や技術の
名称などの専門用語は、斬新なイメージを利用者に与え
るために、その製品や技術がもつ能力とは一見無関係の
分野(例えば、芸術、飲み物など)から引用することが
多い。このため、その専門用語の内容まで知った上で、
その類義語を登録していかなければならない。これらの
専門用語はまた、その数が膨大であり、とても一人で把
握しきれるようなものではない。数人で分担して作成す
るには、作成者間で概念のすりあわせを入念に行う必要
があり、やはり新しい専門用語の増加に追いつくのは難
しい。
【0021】あまりに膨大な新造語の類義語を人手で登
録することは現実的でない。といって、自動的に新造語
の類義語を作成することは、更に困難である。
【0022】近年、新しい専門用語用の類義語辞書の必
要性は増している。例えば、インターネットが提供する
情報には、膨大な新しい専門用語が含まれている。特殊
な専門用語を利用者が知っていれば、望みの文書を検索
することは、比較的容易である。しかし、通常はそのよ
うなキーワードが思い付かない、または、全く知らない
のであるから、検索は容易でない。
【0023】ゆえに、これから情報を収集しようとする
利用者には、必要な情報を、利用者が知っている単語を
用いて、柔軟かつ精度良く抽出できる手段が必要であ
る。特に、インターネットなどの電子化媒体での利用者
の欲求には、日々発生する新しい用語について知りたい
ということが多い。これらの、新しい用語を含む文書を
検索するのに、その新しい用語を与えなければならない
というのでは、いつまでも目的は達することができな
い。
【0024】本発明は、専門用語の類義語を自動的に獲
得して、あいまいな要求からでも、柔軟に検索を行うこ
とができる情報検索方法及び情報検索装置を提供するこ
とを目的とする。
【0025】
【課題を解決するための手段】本発明に係る情報検索方
法は、キーワードのΑΝD、OR、NOT指定の形式に
よる検索要求に応えるキーワード検索を行う情報検索方
法において、キーワードのOR結合を同義、類義、対語
のOR結合に拡張する拡張手段と、論理結合の種類とキ
ーワードの字種から登録と検索に用いる辞書を選択する
選択手段とを備える。
【0026】本発明に係る情報検索方法は、キーワード
のΑΝD、OR、NOT指定の形式による検索要求に応
えるキーワード検索を行う情報検索方法において、キー
ワードのOR結合を同義、類義、対語のOR結合に拡張
する拡張手段と、論理結合の種類から単語間の類似度を
学習する学習手段と、学習手段により学習した単語間の
類似度から各種辞書に登録する手段とを備える。
【0027】本発明に係る情報検索方法は、キーワード
のΑΝD、OR、NOT指定の形式による検索要求に応
えるキーワード検索を行う情報検索方法において、キー
ワードのΑND結合を共起のAND結合と連接のΑND
結合、OR結合を類義のOR結合と略語のOR結合にそ
れぞれ拡張する拡張手段と、論理結合の種類とキーワー
ドの字種から登録と検索に用いる辞書を選択する選択手
段とを備える。
【0028】本発明に係る情報検索方法は、キーワード
のΑΝD、OR、NOT指定の形式による検索要求に応
えるキーワード検索を行う情報検索方法において、キー
ワードのΑND結合を同義、共起のΑND結合と連接の
ΑND結合、OR結合を類義のOR結合と略語のOR結
合にそれぞれ拡張する拡張手段と、論理結合の種類から
単語間の類似度を学習する学習手段と、学習手段により
学習した単語間の類似度から各種辞書に登録する手段と
を備える。
【0029】本発明に係る情報検索装置は、キーワード
のΑΝD、OR、NOT指定の形式による検索要求に応
えるキーワード検索を行う情報検索装置において、キー
ワードのOR結合を同義、類義、対語のOR結合に拡張
する拡張手段と、論理結合の種類とキーワードの字種か
ら登録と検索に用いる辞書を選択する選択手段とを備え
て構成する。
【0030】本発明に係る情報検索装置は、キーワード
のΑΝD、OR、NOT指定の形式による検索要求に応
えるキーワード検索を行う情報検索装置において、キー
ワードのOR結合を同義、類義、対語のOR結合に拡張
する拡張手段と、論理結合の種類から単語間の類似度を
学習する学習手段と、学習手段により学習した単語間の
類似度から各種辞書に登録する手段とを備えて構成す
る。
【0031】本発明に係る情報検索装置は、キーワード
のΑΝD、OR、NOT指定の形式による検索要求に応
えるキーワード検索を行う情報検索装置において、キー
ワードのΑND結合を共起のAND結合と連接のΑND
結合、OR結合を類義のOR結合と略語のOR結合にそ
れぞれ拡張する拡張手段と、論理結合の種類とキーワー
ドの字種から登録と検索に用いる辞書を選択する選択手
段とを備えて構成する。
【0032】本発明に係る情報検索装置は、キーワード
のΑΝD、OR、NOT指定の形式による検索要求に応
えるキーワード検索を行う情報検索装置において、キー
ワードのΑND結合を同義、共起のΑND結合と連接の
ΑND結合、OR結合を類義のOR結合と略語のOR結
合にそれぞれ拡張する拡張手段と、論理結合の種類から
単語間の類似度を学習する学習手段と、学習手段により
学習した単語間の類似度から各種辞書に登録する手段と
を備えて構成する。
【0033】
【発明の実施の形態】本発明に係る情報検索方法及び情
報検索装置は、電子化文書の情報検索システムに適用す
ることができる。
【0034】図1は本発明の第1の実施形態に係る情報
検索方法の構成を示す図であり、ORを拡張した論理結
合を指定したキーワード検索についてのものである。
【0035】図1において、利用者101は、拡張論理
結合つきキーワードを、解釈インターフェース102に
投入する。解釈インターフェース102は、後述する図
2に示すように、ORを3種類に分類(日本語を英語の
単なる表記の違いなどの同義のOR、類義語のOR、そ
して反対語のΟRの3つ)して、利用者に選択させる。
この他にΑNDとNOTを用いる。これらの3種の辞書
を用いて拡張した拡張論理結合つきキーワードを検索系
106に入力し、検索結果を利用者に表示する。
【0036】図2は上記解釈インターフェース102へ
の入力例を示す図である。
【0037】図2において、論理結合の2段の入れ子を
許すために、1行に複数のキーワードを記入できるよう
にし、それらの論理結合を選択できるようにし、1行の
中が優先されることを示すために、行全体を括弧で囲
む。行間にも、拡張した論理結合の選択肢を置いて、2
段の論理結合ができるようにする。
【0038】図1に戻って、類義語辞書103は、日本
語類義語辞書と英語類義語辞書の2つからなり、日英表
記辞書104は、漢字の平仮名読み辞書、英語の片仮名
読み辞書、和英辞書の3つからなる。対語辞書105は
日本語対語辞書と英語対語辞書からなる。
【0039】検索系106は、拡張論理結合つきキーワ
ードを受けとって、あらかじめ格納した索引語との照合
を行い、検索結果を利用者に提示する。
【0040】以下、上述のように構成された情報検索方
法の動作を説明する。
【0041】図3は、この第1の実施形態のアルゴリズ
ムを示すフローチャートであり、図中STはフローの各
ステップを示す。
【0042】まず、ステップST1で拡張論理結合つき
キーワードを入力し、ステップST2でキーワードの字
種に着目したキーワードの解釈を行う。
【0043】利用者が投入する拡張論理結合つきキーワ
ードは、図2に示すように、通常のORを分類して記述
したものであり、論理結合の2段の入れ子を許す。次
に、利用者の投入したキーワードを、種々の類義語辞書
103に登録する。
【0044】次いで、ステップST3でORの種類(同
義、類義、対語)と字種をもとに、登録する辞書を選択
する。論理結合つきキーワードのときはステップST4
でキーワードを拡張し、キーワードのときはステップS
T5で辞書へのキーワード登録を行う。類義語は類義語
辞書103に、漢字の平仮名読み、英語の片仮名読み、
日英翻訳は日英表記辞書104に、反対語は対語辞書1
05に登録する。
【0045】ステップST6では、キーワードに従って
検索して検索文書を出力し、ステップST7で利用者の
再要求の有無を判別して再要求があるときはステップS
T1に戻って次のキーワード入力を待つ。
【0046】同義語のORで指定されたキーワードは、
その字種に着目して類義語辞書(日本語類義語辞書、英
語類義語辞書)、日英表記辞書(漢字の平仮名読み辞
書、英語の片仮名読み辞書、和英辞書)に分けて登録す
る。
【0047】ここで、キーワードの字種を、漢字、平仮
名、アルファベット(半角と全角、大文字と小文字を区
別せず、全て半角小文字とする)、片仮名(すべて全
角)、記号(半角)の5種に分ける。字種が同じであれ
ば、同義を指定しても類義と考えて、類語語辞書に登録
する。字種が異なる場合は、以下のようにペアで登録す
る。
【0048】以下に、それぞれの辞書の登録例を示す。
【0049】1)類義語辞書 日本語類義語辞書: (索引語) (類義語) (類義の種類) 計算機 パソコン 下位語 日本語類義語辞書: (索引語) (類義語) (類義の種類) personal-computer pc 略語 2)日英表記辞書 漢字の平仮名読み辞書: (索引語)(ひらがな読み) 計算機 けいさんき 英語の片仮名読み辞書: (索引語)(ひらがな読み) comouter コンピュータ,コンピューター 和英辞書: (日本語)(英語) 計算機 computer 3)対語辞書 日本語対語辞書: (索引語)(対語) 購入 販売 英語対語辞書: (索引語)(対語) buy sell 次に、これらの辞書をシソーラスとして用いて、受け取
ったキーワードを拡張して検索系に渡す。
【0050】すなわち、ステップST6でキーワードに
従って検索して検索文書を出力し、ステップST7で利
用者の再要求の有無を判別して再要求があるときはステ
ップST1に戻って次のキーワード入力を待つ。
【0051】具体的には、日英表記辞書によって、例え
ば“労働”は、日英表記辞書によって“ろうどう”、
“work”、“ワーク”に拡張され、日本語類義語辞
書によって“勤労”に、英語類義語辞書によって“la
bor”に拡張される。
【0052】すなわち、“労働”という投入キーワード
が、(“労働”ΟR“ろうどう”OR“work”OR
“ワーク”OR“勤労”OR“labor”)に拡張さ
れて、検索系に渡される。検索系はこれらのキーワード
と索引語の一致を調べ、一つ一つのキーワードに対応す
る文書集合を抽出し、ΑND、ΟR、NOTに対応する
集合操作を行って最終文書集合を計算して、利用者に提
示する。
【0053】検索結果を見た利用者は、該当する文書が
多すぎれば追加のキーワードをAND指定で投入し、文
書が少なすぎれば、追加のキーワードをORで指定し
て、目的の文書を再探索する。
【0054】以上説明したように、第1の実施形態に係
る情報検索方法及び情報検索装置は、キーワードのOR
結合を同義、類義、対語のOR結合に拡張する手段と、
論理結合の種類とキーワードの字種から登録と検索に用
いる辞書を選択する手段とを備えているので、利用者の
投入した複数のキーワードを自動的に類義語辞書に登録
することで、次回からの検索時に類似のキーワードを投
入する利用者は、逐一類義語を投入する必要がなくな
り、検索の再現性が向上する。また、利用者が見落とし
ていた側面からのキーワードを連想する手助けとなる。
【0055】図4は本発明の第2の実施形態に係る情報
検索方法の構成を示す図であり、ΟRを拡張した論理結
合つきキーワードによるファジィ検索についてのもので
ある。
【0056】図4において、利用者201は、拡張論理
結合つきキーワードを、解釈インターフェース202に
投入する。検索インターフェース202は、前記図2と
同様に、ORを3種類に分類(日本語を英語の単なる表
記の違いなどの同義のOR、類義語のOR、そして反対
語のΟRの3つ)して、利用者に選択させる。また、検
索インターフェース202は、類似度計算モジュール2
03に対して類似度計算命令を出し、類似度計算モジュ
ール203は共起確率データべース204を参照して類
似度を計算し、類似度の高い順に類義語候補を検索イン
ターフェース202に帰す。
【0057】検索インターフェース202は、類義語候
補を利用者201に表示し、検索インターフェース20
2はそのうち類義語として適切なものを利用者201に
選択させて類義語辞書206に登録する。
【0058】次に、これらの類似度をファジィシソーラ
スとみて、ファジィ検索を行い、グレードの高い順に利
用者に提示する。利用者はこれらの結果を見て、再検索
の必要があれば、キーワードを再投入する。
【0059】以下、上述のように構成された情報検索方
法の動作を説明する。
【0060】図5は、この第2の実施形態のアルゴリズ
ムを示すフローチャートであり、図3に示すフローのス
テップと同一ステップには同一番号を付している。
【0061】まず、ステップST1で拡張論理結合つき
キーワードを入力し、ステップST2でキーワードの字
種に着目したキーワードの解釈を行う。
【0062】利用者が投入する拡張論理結合つきキーワ
ードは、前記図2に示すように、通常のORを分類して
記述したものであり、論理結合の2段の入れ子を許す。
次に、利用者の投入したキーワードを、種々の類義語辞
書に登録する。
【0063】第1の実施形態と異なる部分は、単語間の
類似度とみなす、単語間の1文書内共起確率の学習と、
共起確率をファジィシソーラスとみたファジィ検索を行
うところである。この共起確率の学習については後述す
る。
【0064】次いで、ステップST3でORの種類(同
義、類義、対語)と字種をもとに、登録する辞書を選択
する。論理結合つきキーワードのときはステップST4
でキーワードを拡張し、キーワードのときはステップS
T11で辞書へのキーワード登録及び共起確率の学習を
行う。
【0065】以下、共起確率データベース(ファジィシ
ソーラス)の学習について述べる。キーワードと意味的
に距離が近い単語を検索するために、類義語辞書とは別
の辞書中の全ての単語との類似度を共起確立データベー
ス204を用いて計算する。登録に値する単語候補があ
った場合は、類義語とその附属情報(キーワードの下位
語であるとか、どの文脈で同意味とか)を類義語辞書2
06に登録する。
【0066】共起確率Wijは、数1に示す式(1)に従
って計算する。
【0067】
【数1】 あるキーワードkiとある単語kjとの類似度を、ここ
でのWijとみるのが従来の方法である。
【0068】キーワード“メール”に対して “電子”0.5 “ネットワーク”0.3 “受信”0.2 “mail”0.3 などと候補がでてくるので、登録者は “電子”:種類 “ネットワーク”:要素 “受信”:動作 “mail”:英語 などと付属情報つきで登録していく。“mail”の場
合は、まったくの同義であるので、類似度としての共起
確率を1にセットする。また同義のORもこれと同じで
ある。
【0069】検索システムが実働すると、多くの利用者
からキーワードの組みがシステムに対して与えられる。
通常はキーワードのANDまたはOR結合が与えられ、
このうち、OR結合は同義または類義の単語が与えられ
ることが多い。これに注目して、OR結合指定のキーワ
ードは類似度が高いとして共起確率を大きくする。
【0070】利用者が与えた検索式がマルチメディア
OR multi-media であった場合、新しい共起確率Wij´をKi=マルチメ
ディア、Kj=multi-mediaとして、数2に示す式(2)
に従って計算する。
【0071】
【数2】 とする。これにより、意味の近いキーワード間の類似度
が大きくなるためファジィ検索においては、類似文書の
再現率が向上する。
【0072】類義語辞書への登録の際にも、この新しい
共起確率Wij′を登録者に表示する。
【0073】キーワード“メール”に対して “電子”0.5 “ネットワーク”0.35 “受信”0.2 “mail”0.6 “e−mail”0.1 などと候補がでてくるので、登録者は “電子”:種類 “ネットワーク”:要素 “受信”:動作 “mail”:英語 “e−mail”:種類 などと登録していく。
【0074】以上のようにして、共起確率データベース
が拡張されて、検索系に渡される。検索におけるキーワ
ードと文書の距離は、キーワードと文書に含まれる全索
引語の類似度の中の最大値とする。キーワードを直接含
んでいれば、文書グレードは1とする。
【0075】図5のフローでは、ステップST6でキー
ワードに従って検索して検索文書を出力し、ステップS
T7で利用者の再要求の有無を判別して再要求があると
きはステップST1に戻って次のキーワード入力を待
つ。
【0076】すなわち、検索結果を見た利用者は、該当
する文書が多すぎれば追加のキーワードをAND指定で
投入し、文書が少なすぎれば、追加のキーワードをOR
で指定して、目的の文書を再探索する。
【0077】以上説明したように、第2の実施形態に係
る情報検索方法及び情報検索装置は、キーワードのOR
結合を同義、類義、対語のOR結合に拡張する手段と、
論理結合の種類から単語間の類似度を学習する手段と、
学習した単語間の類似度から各種辞書に登録する手段と
を備えているので、利用者の投入した複数のキーワード
から、自動的にファジィシソーラスを学習し、半自動的
に類義語辞書に登録できるようになる。したがって、次
回からのファジィ検索時に類似のキーワードを投入する
利用者は、逐一類義語を投入する必要がなくなり、検索
の再現性と適合性が向上する。また、利用者が見落とし
ていた側面からのキーワードを連想する手助けとなる。
【0078】図6は本発明の第3の実施形態に係る情報
検索方法の構成を示す図であり、略語や複合語を柔軟に
解釈できるキーワード検索についてのものである。
【0079】図6において、利用者301は、拡張論理
結合つきキーワードを、解釈インターフェース302に
投入する。解釈インターフェース302は、後述する図
7に示すように、ΑNDを2種類に分類(通常の共起を
意味するΑND、そして連接のΑND)、ORを2種類
に分類(通常のOR、略語を示すOR)して、利用者に
選択させる。ここでの連接とは、2つの単語が隣りあっ
て出現することを言う。この他の論理結合としてNOT
を用いる。
【0080】解釈インターフェース302は、キーワー
ドの諭理結合と字種をもとに、キーワードを登録と拡張
をする辞書を選択する。これらの3種の辞書を用いて拡
張した拡張論理結合つきキーワードを検索系306に入
力し、検索結果を利用者に表示する。
【0081】図7は上記解釈インターフェース302へ
の入力例を示す図である。
【0082】図7において、論理結合の2段の入れ子を
許すために、1行に複数のキーワードを記入できるよう
にし、それらの論理結合を選択できるようにし、1行の
中が優先されることを示すために、行全体を括弧で囲
む。行間にも、拡張した論理結合の選択肢を置いて、2
段の論理結合ができるようにする。
【0083】この例では、((“work”連接のΑN
D“station”)略語のOR“ws”)共起のA
ND(“購入”OR“導入”)を指定したことになる。
略語のORは行間の論理結合の中で、最も高い優先度と
し、他は同等とする。
【0084】図6に戻って、類義語辞書303は、日本
語類義語辞書と英語類義語辞書の2つからなり、熟語辞
書304は、日本語熟語辞書、英語熟語辞書の2つから
なる。略語辞書305は日本語略語辞書と英語略語辞書
からなる。
【0085】検索系306は、拡張論理結合つきキーワ
ードを受けとって、あらかじめ格納した索引語との照合
を行い、検索結果を利用者に提示する。
【0086】以下、上述のように構成された情報検索方
法の動作を説明する。
【0087】図8は、この第3の実施形態のアルゴリズ
ムを示すフローチャートであり、図3に示すフローのス
テップと同一ステップには同一番号を付している。
【0088】まず、ステップST1で拡張論理結合つき
キーワードを入力し、ステップST2でキーワードの字
種に着目したキーワードの解釈を行う。
【0089】利用者が投入する拡張論理結合つきキーワ
ードは、前記図7に示すように、通常のORを分類して
記述したものであり、論理結合の2段の入れ子を許す。
次に、利用者の投入したキーワードを、種々の類義語辞
書303に登録する。
【0090】次いで、ステップST3で論理結合の種類
(共起のΑND、連接のAND、略語のOR、通常のO
R、NOT)と字種をもとに、登録する辞書を選択す
る。論理結合つきキーワードのときはステップST4で
キーワードを拡張し、キーワードのときはステップST
5で辞書へのキーワード登録を行う。通常のORで結合
されたキーワードは類義語辞書303に、1行内で連接
のΑNDで結合されたキーワードは熟語辞書304に、
2行にわたって略語のOR結合されたキーワードは略語
辞書305にそれぞれ登録する。
【0091】キーワードは、その字種に着目して類義語
辞書、熟語辞書、略語辞書それぞれについて、英語と日
本語に分けて登録する。ここで、キーワードの字種を、
漢字、平仮名、アルファベット(半角と全角、大文字と
小文字を区別せず、全て半角小文字とする)、片仮名
(すべて全角)、記号(半角)の5種に分ける。アルフ
ァベットを英語とし、その他は日本語とする。
【0092】以下に、それぞれの辞書の登録例を示す。
【0093】1)類義語辞書 日本語類義語辞書: (索引語) (類義語) (類義の種類) 購入 販売 対語 英語類義語辞書: (索引語) (類義語) (類義の種類) personal_computer work_station 同レベルインス
タンス(構成語の区切りを_で表す、以下同様。) 2)熟語辞書 日本語熟語辞書: 卓上_計算機 英語熟語辞書: personal_computer 3)略語辞書 日本語略語辞書: (索引語)(原語) 国連 国際連合 英語略語辞書: (索引語)(対語) ws work_station 次に、これらの辞書と通常の英和/和英辞書をシソーラ
スとして用いて、受け取ったキーワードを拡張して検索
系に渡す。
【0094】すなわち、ステップST21で連接のAN
Dを共起のANDと見た検索して1次検索文書を出力
し、ステップST22でキーワード連接のチェックをし
て2次検索文書を出力し、ステップST7で利用者の再
要求の有無を判別して再要求があるときはステップST
1に戻って次のキーワード入力を待つ。
【0095】具体的には、和英辞書によって、例えば
“労働”は、英和辞書によって“ろうどう”、“wor
k”、“ワーク”に拡張され、日本語類義語辞書によっ
て“勤労”に、英語類義語辞書によって“labor”
に拡張される。
【0096】すなわち、“労働”という投入キーワード
が、(“労働”OR“ろうどう”OR“work”ΟR
“ワーク”OR“勤労”OR“labor”)に拡張さ
れて、検索系306に渡される。
【0097】検索系306では、これらのキーワードと
索引語の一致を調べ、一つ一つのキーワードに対応する
文書集合を抽出し、AND、ΟR、NOTに対応する集
合操作を行って最終文書集合を計算して、利用者に提示
する。ここまでの検索を1次検索とする。
【0098】1次検索では、連接のANDを通常のΑN
Dと評価して検索しているので、連接のΑNDのチエツ
クを2次検索とする。
【0099】検索した文書の一つ一つを再び、索引語抽
出をして、キーワードの連接と対応した索引語のパター
ンが見つかれば正答とする。ここで残った文書を最終的
な検索文書とする。
【0100】検索結果を見た利用者は、該当する文書が
多すぎれば追加のキーワードをAND指定で投入し、文
書が少なすぎれば、追加のキーワードをORで指定し
て、目的の文書を再探索する。
【0101】以上説明したように、第3の実施形態に係
る情報検索方法及び情報検索装置は、キーワードのΑN
D結合を共起のAND結合と連接のΑND結合、OR結
合を類義のOR結合と略語のOR結合にそれぞれ拡張す
る手段と、論理結合の種類とキーワードの字種から登録
と検索に用いる辞書を選択する手段とを備えているの
で、利用者の投入した複数のキーワードを自動的に類義
語辞書、熟語辞書、略語辞書に登録することで、次回か
らの検索時に類似のキーワードを投入する利用者は、逐
一類義語を投入する必要がなくなり、検索の再現性が向
上する。また、利用者が見落としていた側面からのキー
ワードを連想する手助けとなる。
【0102】図9は本発明の第4の実施形態に係る情報
検索方法の構成を示す図であり、ANDを拡張した論理
結合つきキーワードによるファジィ検索についてのもの
である。
【0103】図9において、利用者401は、拡張論理
結合つきキーワードを、解釈インターフェース402に
投入する。検索インターフェース402は、前記図7と
同様に、類似度計算モジュール403に対して類似度計
算命令を出し、類似度計算モジュール403は連接確率
データべース404を参照して類似度を計算し、類似度
の高い順に類義語候補を検索インターフェース402に
帰す。
【0104】検索インターフェース402は、類義語候
補を利用者401に表示し、検索インターフェース40
2はそのうち類義語として適切なものを利用者401に
選択させて類義語,熟語,略語辞書406に登録する。
【0105】次に、これらの類似度をファジィシソーラ
スとみて、ファジィ検索を行い、グレードの高い順に利
用者に提示する。利用者はこれらの結果を見て、再検索
の必要があれば、キーワードを再投入する。
【0106】以下、上述のように構成された情報検索方
法の動作を説明する。
【0107】図10は、この第2の実施形態のアルゴリ
ズムを示すフローチャートであり、前記図3に示すフロ
ーのステップと同一ステップには同一番号を付してい
る。
【0108】まず、ステップST1で拡張論理結合つき
キーワードを入力し、ステップST2でキーワードの字
種に着目したキーワードの解釈を行う。
【0109】利用者が投入する拡張論理結合つきキーワ
ードは、前記図7に示すように、通常のANDを分類し
て記述したものであり、論理結合の2段の入れ子を許
す。次に、利用者の投入したキーワードを、種々の類義
語辞書に登録する。
【0110】第3の実施形態と異なる部分は、単語間の
類似度とみなす、単語間の連接確率の学習と、連接確率
をファジィシソーラスとみたファジィ検索を行うところ
である。この連接確率の学習については後述する。
【0111】次いで、ステップST3でORの種類(同
義、類義、対語)と字種をもとに、登録する辞書を選択
する。論理結合つきキーワードのときはステップST4
でキーワードを拡張し、キーワードのときはステップS
T31で辞書へのキーワード登録及び連接確率の学習を
行う。
【0112】以下、連接確率データベース(ファジィシ
ソーラス)の学習について述べる。キーワードと意味的
に距離が近い単語を検索するために、類義語辞書とは別
の辞書中の全ての単語との類似度を連接確立データベー
ス404を用いて計算する。登録に値する単語候補があ
った場合は、類義語とその付属情報(キーワードの下位
語であるとか、どの文脈で同意味とかの情報)を類義
語,熟語,略語辞書406に登録する。
【0113】連接確率Wijは、数3に示す式(3)に従
って計算する。
【0114】
【数3】 あるキーワードkiとある単語kjとの類似度を、ここ
でのWijとみるのが本実施形態である。
【0115】キーワード“メール”に対して、類似した
(良く連接した)単語が、 “電子”0.5 “ネットワーク”0.3 “受信”0.2 などと候補がでてくる。
【0116】検索システムが実働すると、多くの利用者
からキーワードの組みがシステムに対して与えられる。
通常はキーワードのΑNDまたはOR結合が与えられ、
このうち、ΑND結合は連接する単語が与えられること
が多い。
【0117】これに注目して、ΑND結合指定のキーワ
ードは類似度が高いとして連接確率を大きくする。連接
確率が大きい単語は、類似しているというよりも、連接
して熟語、複合語をつくることが多く、付属情報はほと
んど“種類”や“動作”となる。
【0118】利用者が与えた検索式が、マルチANDメ
ディアであった場合、新しい連接確率Wij´をKi=マ
ルチメディア、Kj=メディアとして、数4に示す式
(4)に従って計算する。
【0119】
【数4】 とする。これにより、良く連接するキーワード間の類似
度が大きくなるためファジィ検索においては、類似文書
の再現率が向上する。
【0120】類義語辞書への登録の際にも、このWij′
を登録者に表示する。
【0121】キーワード“メール”に対して “電子”0.7 “受信”0.4 “ソフト”0.2 などと候補がでてくるので、登録者は “電子”:種類 “受信”:動作 “ソフト”:種類 などと登録していく。
【0122】以上のようにして、連接確率データベース
が拡張されて、検索系に渡される。検索における、キー
ワードと文書の距離は、キーワードと文書に含まれる全
索引語の類似度の中の最大値とする。キーワードを直接
含んでいれば、文書グレードは1とする。
【0123】図10のフローでは、ステップST6でキ
ーワードに従って検索して検索文書を出力し、ステップ
ST7で利用者の再要求の有無を判別して再要求がある
ときはステップST1に戻って次のキーワード入力を待
つ。
【0124】すなわち、検索結果を見た利用者は、該当
する文書が多すぎれば追加のキーワードをAND指定で
投入し、文書が少なすぎれば、追加のキーワードをOR
で指定して、目的の文書を再探索する。
【0125】以上説明したように、第4の実施形態に係
る情報検索方法及び情報検索装置は、キーワードのΑN
D結合を同義、共起のΑND結合と連接のΑND結合、
OR結合を類義のOR結合と略語のOR結合にそれぞれ
拡張する手段と、論理結合の種類から単語間の類似度を
学習する手段と、学習した単語間の類似度から各種辞書
に登録する手段とを備えているので、利用者の投入した
複数のキーワードから、自動的にファジィシソーラスを
学習し、半自動的に類義語辞書に登録できるようにな
る。したがって、次回からのファジィ検索時に類似のキ
ーワードを投入する利用者は、逐一類義語を投入する必
要がなくなり、検索の再現性と適合性が向上する。ま
た、利用者が見落としていた側面からのキーワードを連
想する手助けとなる。
【0126】このような特長を有する情報検索方法を電
子化文書の情報検索システムに適用することで、専門用
語の類義語を自動的に獲得して、柔軟に検索を行うこと
ができる。
【0127】なお、第1の実施形態及び第3の実施形態
では、検索文書のグレードが1か0かの検索を説明した
が、利用者が投入したキーワードの共起確率を、第2の
実施形態のように計算してファジィ検索とすることがで
きる。
【0128】また、第2の実施形態及び第4の実施形態
では、ファジィ検索として説明したが、これを各個人ご
とに作成し、別の利用者に利用させるようにしてもよ
く、このようにすれば、新たな視点からの類義語を得る
ことができるため、検索に限らず発想支援システムとし
て用いることもできる。
【0129】また、上記各実施形態に係る情報検索方法
を、電子化文書の情報検索システムに適用することもで
きるが、勿論これには限定されず、キーワード検索を行
う情報検索方法であれば全てのシステムに適用可能であ
ることは言うまでもない。
【0130】また、上記情報検索方法が適用されるシス
テム等を構成する回路の種類、数及び接続方法などは前
述した実施形態に限られないことは言うまでもない。ま
た、本情報検索方法は、ソフトウェアで容易に実現でき
るので、すでにあるソフトウェアの中に組み込むことに
よっても実現できる。
【0131】
【発明の効果】本発明に係る情報検索方法及び情報検索
装置では、キーワードのOR結合を同義、類義、対語の
OR結合に拡張する拡張手段と、論理結合の種類とキー
ワードの字種から登録と検索に用いる辞書を選択する選
択手段とを備えているので、利用者の投入した複数のキ
ーワードを自動的に類義語辞書に登録することで、次回
からの検索時に類似のキーワードを投入する利用者は、
逐一類義語を投入する必要がなくなり、検索の再現性を
向上させることができる。
【0132】本発明に係る情報検索方法及び情報検索装
置では、キーワードのOR結合を同義、類義、対語のO
R結合に拡張する拡張手段と、論理結合の種類から単語
間の類似度を学習する学習手段と、学習手段により学習
した単語間の類似度から各種辞書に登録する手段とを備
えているので、次回からのファジィ検索時に類似のキー
ワードを投入する利用者は、逐一類義語を投入する必要
がなくなり、検索の再現性と適合性を向上させることが
できる。
【0133】本発明に係る情報検索方法及び情報検索装
置では、キーワードのΑND結合を共起のAND結合と
連接のΑND結合、OR結合を類義のOR結合と略語の
OR結合にそれぞれ拡張する拡張手段と、論理結合の種
類とキーワードの字種から登録と検索に用いる辞書を選
択する選択手段とを備えているので、利用者の投入した
複数のキーワードを自動的に類義語辞書、熟語辞書、略
語辞書に登録することで、次回からの検索時に類似のキ
ーワードを投入する利用者は、逐一類義語を投入する必
要がなくなり、検索の再現性を向上させることができ
る。
【0134】本発明に係る情報検索方法及び情報検索装
置では、キーワードのΑND結合を同義、共起のΑND
結合と連接のΑND結合、OR結合を類義のOR結合と
略語のOR結合にそれぞれ拡張する拡張手段と、論理結
合の種類から単語間の類似度を学習する学習手段と、学
習手段により学習した単語間の類似度から各種辞書に登
録する手段とを備えているので、利用者の投入した複数
のキーワードから、自動的にファジィシソーラスを学習
し、半自動的に類義語辞書に登録でき、次回からのファ
ジィ検索時に類似のキーワードを投入する利用者は、逐
一類義語を投入する必要がなくなり、検索の再現性と適
合性を向上させることができる。
【図面の簡単な説明】
【図1】本発明を適用した第1の実施形態に係る情報検
索方法及び情報検索装置の構成を示すブロック図であ
る。
【図2】上記情報検索方法及び情報検索装置の解釈イン
ターフェースへの入力例を示す図である。
【図3】上記情報検索方法及び情報検索装置のアルゴリ
ズムを示すフローチャートである。
【図4】本発明を適用した第2の実施形態に係る情報検
索方法及び情報検索装置の構成を示すブロック図であ
る。
【図5】上記情報検索方法及び情報検索装置のアルゴリ
ズムを示すフローチャートである。
【図6】本発明を適用した第3の実施形態に係る情報検
索方法及び情報検索装置の構成を示すブロック図であ
る。
【図7】上記情報検索方法及び情報検索装置の解釈イン
ターフェースへの入力例を示す図である。
【図8】上記情報検索方法及び情報検索装置のアルゴリ
ズムを示すフローチャートである。
【図9】本発明を適用した第4の実施形態に係る情報検
索方法及び情報検索装置の構成を示すブロック図であ
る。
【図10】上記情報検索方法及び情報検索装置のアルゴ
リズムを示すフローチャートである。
【図11】従来の情報検索方法の検索要求入力インター
フェースとその入力例を示す図である。
【符号の説明】
101,201,301,401 利用者、102,3
02 解釈インターフェース、103,206,303
類義語辞書、104 日英表記辞書、105対語辞
書、106,306 検索系、202,402 検索イ
ンターフェース、203 類似度計算モジュール、20
4 共起確率データべース、304 熟語辞書、305
略語辞書、403 類似度計算モジュール、404
連接確率データべース、405 検索モジュール、40
6 類義語,熟語,略語辞書

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 キーワードのΑΝD、OR、NOT指定
    の形式による検索要求に応えるキーワード検索を行う情
    報検索方法において、 キーワードのOR結合を同義、類義、対語のOR結合に
    拡張する拡張手段と、 論理結合の種類とキーワードの字種から登録と検索に用
    いる辞書を選択する選択手段とを備えたことを特徴とす
    る情報検索方法。
  2. 【請求項2】 キーワードのΑΝD、OR、NOT指定
    の形式による検索要求に応えるキーワード検索を行う情
    報検索方法において、 キーワードのOR結合を同義、類義、対語のOR結合に
    拡張する拡張手段と、 論理結合の種類から単語間の類似度を学習する学習手段
    と、 前記学習手段により学習した単語間の類似度から各種辞
    書に登録する手段とを備えたことを特徴とする情報検索
    方法。
  3. 【請求項3】 キーワードのΑΝD、OR、NOT指定
    の形式による検索要求に応えるキーワード検索を行う情
    報検索方法において、 キーワードのΑND結合を共起のAND結合と連接のΑ
    ND結合、OR結合を類義のOR結合と略語のOR結合
    にそれぞれ拡張する拡張手段と、 論理結合の種類とキーワードの字種から登録と検索に用
    いる辞書を選択する選択手段とを備えたことを特徴とす
    る情報検索方法。
  4. 【請求項4】 キーワードのΑΝD、OR、NOT指定
    の形式による検索要求に応えるキーワード検索を行う情
    報検索方法において、 キーワードのΑND結合を同義、共起のΑND結合と連
    接のΑND結合、OR結合を類義のOR結合と略語のO
    R結合にそれぞれ拡張する拡張手段と、 論理結合の種類から単語間の類似度を学習する学習手段
    と、 前記学習手段により学習した単語間の類似度から各種辞
    書に登録する手段とを備えたことを特徴とする情報検索
    方法。
  5. 【請求項5】 キーワードのΑΝD、OR、NOT指定
    の形式による検索要求に応えるキーワード検索を行う情
    報検索装置において、 キーワードのOR結合を同義、類義、対語のOR結合に
    拡張する拡張手段と、 論理結合の種類とキーワードの字種から登録と検索に用
    いる辞書を選択する選択手段とを備えたことを特徴とす
    る情報検索装置。
  6. 【請求項6】 キーワードのΑΝD、OR、NOT指定
    の形式による検索要求に応えるキーワード検索を行う情
    報検索装置において、 キーワードのOR結合を同義、類義、対語のOR結合に
    拡張する拡張手段と、 論理結合の種類から単語間の類似度を学習する学習手段
    と、 前記学習手段により学習した単語間の類似度から各種辞
    書に登録する手段とを備えたことを特徴とする情報検索
    装置。
  7. 【請求項7】 キーワードのΑΝD、OR、NOT指定
    の形式による検索要求に応えるキーワード検索を行う情
    報検索装置において、 キーワードのΑND結合を共起のAND結合と連接のΑ
    ND結合、OR結合を類義のOR結合と略語のOR結合
    にそれぞれ拡張する拡張手段と、 論理結合の種類とキーワードの字種から登録と検索に用
    いる辞書を選択する選択手段とを備えたことを特徴とす
    る情報検索装置。
  8. 【請求項8】 キーワードのΑΝD、OR、NOT指定
    の形式による検索要求に応えるキーワード検索を行う情
    報検索装置において、 キーワードのΑND結合を同義、共起のΑND結合と連
    接のΑND結合、OR結合を類義のOR結合と略語のO
    R結合にそれぞれ拡張する拡張手段と、 論理結合の種類から単語間の類似度を学習する学習手段
    と、 前記学習手段により学習した単語間の類似度から各種辞
    書に登録する手段とを備えたことを特徴とする情報検索
    装置。
JP8298387A 1996-11-11 1996-11-11 情報検索方法及び情報検索装置 Withdrawn JPH10143521A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8298387A JPH10143521A (ja) 1996-11-11 1996-11-11 情報検索方法及び情報検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8298387A JPH10143521A (ja) 1996-11-11 1996-11-11 情報検索方法及び情報検索装置

Publications (1)

Publication Number Publication Date
JPH10143521A true JPH10143521A (ja) 1998-05-29

Family

ID=17859048

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8298387A Withdrawn JPH10143521A (ja) 1996-11-11 1996-11-11 情報検索方法及び情報検索装置

Country Status (1)

Country Link
JP (1) JPH10143521A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006046390A1 (ja) * 2004-10-29 2006-05-04 Matsushita Electric Industrial Co., Ltd. 情報検索装置
KR20210028595A (ko) * 2019-09-04 2021-03-12 주식회사 워트인텔리전스 검색 키워드 추천 및 확장 방법
JP2022091122A (ja) * 2020-12-08 2022-06-20 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド 汎化処理方法、装置、デバイス、コンピュータ記憶媒体及びプログラム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006046390A1 (ja) * 2004-10-29 2006-05-04 Matsushita Electric Industrial Co., Ltd. 情報検索装置
US7483921B2 (en) 2004-10-29 2009-01-27 Panasonic Corporation Information retrieval apparatus
US7725486B2 (en) 2004-10-29 2010-05-25 Panasonic Corporation Information retrieval apparatus
KR20210028595A (ko) * 2019-09-04 2021-03-12 주식회사 워트인텔리전스 검색 키워드 추천 및 확장 방법
JP2022091122A (ja) * 2020-12-08 2022-06-20 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド 汎化処理方法、装置、デバイス、コンピュータ記憶媒体及びプログラム
US11704326B2 (en) 2020-12-08 2023-07-18 Beijing Baidu Netcom Science Technology Co., Ltd. Generalization processing method, apparatus, device and computer storage medium

Similar Documents

Publication Publication Date Title
Kowalski et al. Information storage and retrieval systems: theory and implementation
US7113954B2 (en) System and method for generating a taxonomy from a plurality of documents
JP4664076B2 (ja) 言語間検索結果をハイライト化する注釈コールアウトの点滅
US6904429B2 (en) Information retrieval apparatus and information retrieval method
US9135238B2 (en) Disambiguation of named entities
US7890500B2 (en) Systems and methods for using and constructing user-interest sensitive indicators of search results
Arampatzis et al. Web-based delineation of imprecise regions
Sharma et al. Automatic text summarization methods: A comprehensive review
JPH1125129A (ja) テキスト・データベース内の情報の検索方法
JP2009528636A (ja) 複数の書記体系を有する言語に対する関連のクエリーを識別するためのシステム及び方法
EP2206057A1 (en) Nlp-based entity recognition and disambiguation
WO2007071548A1 (en) Method and system for automatically generating multilingual electronic content from unstructured data
JP2000200291A (ja) 選択された文字列をテキスト内で自動検出する方法
CN112989208B (zh) 一种信息推荐方法、装置、电子设备及存储介质
KR100396826B1 (ko) 정보검색에서 질의어 처리를 위한 단어 클러스터 관리장치 및 그 방법
Delboni et al. Semantic expansion of geographic web queries based on natural language positioning expressions
Radoev et al. A language adaptive method for question answering on French and English
Coates-Stephens The analysis and acquisition of proper names for robust text understanding
JPH1049543A (ja) 文書検索装置
WO2002010985A2 (en) Method of and system for automatic document retrieval, categorization and processing
JPH10143521A (ja) 情報検索方法及び情報検索装置
JP4401269B2 (ja) 対訳判断装置及びプログラム
JPH10307837A (ja) 検索装置並びに検索プログラムを記録した記録媒体
King White Roses, Red Backgrounds: Bringing Structured Representations to Search
JPH0793345A (ja) 文書検索装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20040203