JP3779935B2 - 文書検索装置、文書検索方法およびその方法をコンピュータに実行させるプログラム - Google Patents

文書検索装置、文書検索方法およびその方法をコンピュータに実行させるプログラム Download PDF

Info

Publication number
JP3779935B2
JP3779935B2 JP2002120145A JP2002120145A JP3779935B2 JP 3779935 B2 JP3779935 B2 JP 3779935B2 JP 2002120145 A JP2002120145 A JP 2002120145A JP 2002120145 A JP2002120145 A JP 2002120145A JP 3779935 B2 JP3779935 B2 JP 3779935B2
Authority
JP
Japan
Prior art keywords
search
document
electronic
display
electronic document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002120145A
Other languages
English (en)
Other versions
JP2003316810A (ja
Inventor
宏作 有田
Original Assignee
株式会社ジャストシステム
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社ジャストシステム filed Critical 株式会社ジャストシステム
Priority to JP2002120145A priority Critical patent/JP3779935B2/ja
Publication of JP2003316810A publication Critical patent/JP2003316810A/ja
Application granted granted Critical
Publication of JP3779935B2 publication Critical patent/JP3779935B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【発明の属する技術分野】
この発明は、複数の電子文書の中から、自然文により入力された検索条件に合致するものを検索する文書検索装置、文書検索方法およびその方法をコンピュータに実行させるプログラムに関する。
【0002】
【従来の技術】
電子文書の検索においては、検索時の再現率や適合率を向上させることが最も重要かつ基本的な研究テーマである。そして今日までに、検索精度向上のための数々の工夫や改良がなされ、検索エンジンなどに応用されて、一般に広く利用されている。
【0003】
【発明が解決しようとする課題】
しかしながら、そうした試みにもかかわらず検索精度の向上は思うようには進んでいない。相変わらず、検索目的から明らかに外れた文書が検索結果に含まれてしまうこともしばしばである。
【0004】
そして、こうした精度の低下を招く原因の一つに、文書中に含まれる検索条件の反対表現(検索条件とは内容的に逆の表現)がある。たとえば新聞記事データベースから、売り上げの伸びた会社に関する記事を検索しようとして、逆に売り上げの伸びなかった会社に関する記事を引き出してしまうことがある。検索者が意図する文書とはちょうど逆の内容の文書であっても、出現するキーワードなどが似ているとこのようなことが起こりうる。
【0005】
この発明は上記従来技術による問題を解決するため、検索条件の反対表現を含む文書すなわち検索目的から外れた文書が検索結果一覧中に現れるのを阻止・抑制するとともに、現れてしまう場合にもあえて表示しないようにしたり、そうでない文書と区別して表示したりすることが可能な文書検索装置、文書検索方法およびその方法をコンピュータに実行させるプログラムを提供することを目的とする。
【0006】
【課題を解決するための手段】
上述した課題を解決し、目的を達成するため、この発明にかかる文書検索装置は、複数の電子文書の中から、自然文により入力された検索条件に合致するものを検索する文書検索装置において、前記検索条件に対する前記各電子文書の合致度を算出する算出手段と、前記電子文書の中から前記検索条件の反対表現を含むものを検索する検索手段と、前記検索手段により検索された電子文書につき、前記算出手段により算出されたその合致度を補正する補正手段と、前記検索手段により検索されなかった電子文書については前記算出手段により算出された合致度、前記検索手段により検索された電子文書については前記補正手段により補正された合致度にもとづいて、前記各電子文書の順位を特定する順位特定手段と、前記順位特定手段により順位を特定された各電子文書を特定できる情報を表示画面に表示する表示手段と、を備えたことを特徴とする。
【0007】
この発明によれば、検索対象文書のうち特に検索条件の反対表現を含む文書については、通常の手順で算出された合致度が別の値に補正される。
【0008】
また、この発明にかかる文書検索装置は、上記に記載の発明において、前記補正手段が、前記検索手段により検索された各電子文書につき、前記算出手段により算出されたその合致度をより低い値に補正することを特徴とする。
【0009】
この発明によれば、検索対象文書のうち特に検索条件の反対表現を含む文書については、通常の手順で算出された合致度がより低い値に補正される。
【0010】
また、この発明にかかる文書検索装置は、上記に記載の発明において、前記表示手段が、前記順位特定手段により順位を特定された電子文書のうち、前記検索手段により検索されなかった各電子文書を特定できる情報のみを表示画面に表示することを特徴とする。
【0011】
この発明によれば、検索対象文書のうち特に検索条件の反対表現を含む文書は、検索条件との合致度がたとえ高くても検索結果としては表示されない。
【0012】
また、この発明にかかる文書検索装置は、上記に記載の発明において、前記表示手段が、前記順位特定手段により順位を特定された電子文書のうち、前記検索手段により検索された各電子文書を特定できる情報と前記検索手段により検索されなかった各電子文書を特定できる情報とを区別して表示画面に表示することを特徴とする。
【0013】
この発明によれば、検索結果一覧では検索条件の反対表現を含む文書と含まない文書とが区別して表示される。
【0014】
また、この発明にかかる文書検索装置は、上記に記載の発明において、前記表示手段が、前記検索手段により検索された各電子文書を特定できる情報と前記検索手段により検索されなかった各電子文書を特定できる情報とを、表示色もしくは背景色を異ならせるまたは表示領域を異ならせることで区別して表示画面に表示することを特徴とする。
【0015】
この発明によれば、検索結果一覧では検索条件の反対表現を含む文書と含まない文書とが、表示色もしくは背景色、または表示領域を異ならせることで区別して表示される。
【0016】
また、この発明にかかる文書検索方法は、複数の電子文書の中から、自然文により入力された検索条件に合致するものを検索する文書検索方法において、前記検索条件に対する前記各電子文書の合致度を算出する算出工程と、前記電子文書の中から前記検索条件の反対表現を含むものを検索する検索工程と、前記検索工程で検索された電子文書につき、前記算出工程で算出されたその合致度を補正する補正工程と、前記検索工程で検索されなかった電子文書については前記算出工程で算出された合致度、前記検索工程で検索された電子文書については前記補正工程で補正された合致度にもとづいて、前記各電子文書の順位を特定する順位特定工程と、前記順位特定工程で順位を特定された各電子文書を特定できる情報を表示画面に表示する表示工程と、を含んだことを特徴とする。
【0017】
この発明によれば、検索対象文書のうち特に検索条件の反対表現を含む文書については、通常の手順で算出された合致度が別の値に補正される。
【0018】
また、この発明にかかるプログラムによれば、上記に記載された方法がコンピュータによって実行される。
【0019】
【発明の実施の形態】
以下に添付図面を参照して、この発明による文書検索装置、文書検索方法およびその方法をコンピュータに実行させるプログラムの好適な実施の形態を詳細に説明する。
【0020】
図1は、この発明の実施の形態による文書検索装置のハードウエア構成を示す説明図である。同図において、101は装置全体を制御するCPUを、102は基本入出力プログラムを記憶したROMを、103はCPU101のワークエリアとして使用されるRAMを、それぞれ示している。
【0021】
また、104はCPU101の制御にしたがってHD(ハードディスク)105に対するデータのリード/ライトを制御するHDD(ハードディスクドライブ)を、105はHDD104の制御にしたがって書き込まれたデータを記憶するHDを、それぞれ示している。
【0022】
また、106はCPU101の制御にしたがってFD(フレキシブルディスク)107に対するデータのリード/ライトを制御するFDD(フレキシブルディスクドライブ)を、107はFDD106の制御にしたがって書き込まれたデータを記憶する着脱自在のFDを、それぞれ示している。
【0023】
また、108はカーソル、メニュー、ウィンドウ、あるいは文字や画像などの各種データを表示するディスプレイを、109は通信ケーブル110を介してLANなどのネットワークに接続され、当該ネットワークとCPU101とのインターフェースとして機能するネットワークI/Fを、それぞれ示している。
【0024】
また、111は文字、数値、各種指示などの入力のための複数のキーを備えたキーボードを、112は各種指示の選択や実行、処理対象の選択、マウスポインタの移動などをおこなうマウスを、それぞれ示している。また、113は着脱可能な記録媒体であるCD−ROMを、114はCD−ROM113に対するデータのリードを制御するCD−ROMドライブを、100は上記各部を接続するためのバスまたはケーブルを、それぞれ示している。
【0025】
つぎに、図2はこの発明の実施の形態による文書検索装置の構成を機能的に示す説明図である。まず、200は検索条件入力部であり、操作者からの検索条件の入力を受け付けて、後述する形態素解析部201に引き渡す機能部である。なお、本装置において検索条件は自然文により入力されるものとする。
【0026】
201は形態素解析部であり、検索条件入力部200から引き渡された自然文を個々の形態素に分割するとともに、当該解析結果を後述する構文解析部202に引き渡す機能部である。この形態素解析部201における処理は従来技術であるので詳細な説明を省略する。
【0027】
202は構文解析部であり、形態素解析部201から引き渡された解析結果にもとづいて、どの語がどの語にかかるか(係り受け)などの文の構造を解析するとともに、当該解析結果を後述する文書検索部206に引き渡す機能部である。この構文解析部202における処理も従来技術であるので詳細な説明は省略する。
【0028】
203は文書記憶部であり、多数の電子文書を保持する機能部である。個々の文書はその本文と、ファイル名や文書見出し、最終更新日時などといった属性情報とから構成される。
【0029】
204は転置ファイル記憶部であり、後述する文書検索部206による検索の対象となる転置ファイルを保持する機能部である。この転置ファイルとは、文書記憶部203に保持された多数の電子文書を、キーワードから検索できるようにしたものである。すなわち、概念的にはたとえば文書記憶部203内の全文書を行、当該文書群に出現する全キーワードを列とし、行と列の交点に各文書における各キーワードの出現有無あるいは出現頻度などを記録したテーブルである。
【0030】
205は係り受けインデックス記憶部であり、後述する文書検索部206の反対表現検索部206aにより検索される、係り受けインデックスを保持する機能部である。係り受けインデックスとは、文書記憶部203内の全文書につきあらかじめ解析された語の係り受けのパターンと、当該パターンが出現する文書とを対応づけたテーブルである。
【0031】
206は文書検索部であり、構文解析部202から引き渡されたキーワードにより上述の転置ファイルを検索して、文書記憶部203内の各文書を検索条件との合致度の順に順位づけするとともに、順位づけの結果を後述する検索結果表示部207に引き渡す機能部である。
【0032】
この文書検索部206の検索手法としては、一般に「ベクトル空間法」と呼ばれる手法を採用するものとする。ベクトル空間法では、検索条件中に含まれるキーワードの出現有無あるいは出現頻度などを要素値とするベクトル(クエリーベクトル)を作成するとともに、上述の転置ファイル中の各レコードにより各文書の文書ベクトルを作成する。そして、クエリーベクトルと各文書の文書ベクトルとの距離(コサイン距離)を順次算出し、当該距離が小さいほど大きく、当該距離が大きいほど小さくなるように合致度のスコアを算出する。このスコアにより、各文書を検索条件との合致度の順に順位づけすることができる。
【0033】
ただし文書検索部206は、特に検索条件の反対表現を含む文書については、上記で算出したスコアを一律に下げるようなスコアの補正をおこなう。
【0034】
たとえば、検索条件が「売り上げが伸びた会社について知りたい」という自然文であった場合、文書検索部206はその反対表現検索部206aにより、係り受けインデックス記憶部205内の係り受けインデックスを検索して、「売り上げ−伸びない(伸びず)」の係り受けのパターンを含む文書を特定する。ここでは、たとえば「売り上げが伸びず経営が行き詰まった・・・」という一文を含む文書Aが特定されたものとする。
【0035】
そして、この文書Aの合致度のスコアを、たとえばその80%に縮減するなどすることで、通常のベクトル空間法により算出される値よりも小さくなるよう補正する。その結果、たとえば「コメの地位を脅かすようにパン・めん類が売り上げを伸ばしている・・・」という文書B(この文書は反対表現を含まない)があり、普通に計算すると文書Aのほうが文書Bよりもスコアが高くなるような場合にも、補正により文書Aと文書Bとの優劣が逆転し、検索目的から外れた文書Aのほうが文書Bより上位に現れやすくなるのを阻止・抑制することができる。
【0036】
207は検索結果表示部であり、文書検索部206から引き渡された順位づけの結果にしたがって、順位の高いものの順に各文書(厳密には、文書記憶部203から読み出した各文書の見出し)を一覧表示する機能部である。なお、検索結果の表示方法は後述する表示方法指示部208からの指示にしたがう(特に指示がなければデフォルトの表示方法を採用する)。
【0037】
208は表示方法指示部であり、操作者から検索結果の表示方法に関する指示を受け付けて、検索結果表示部207に伝達する機能部である。後述する検索結果画面で「表示オプション」ボタンを押下することにより、操作者は検索結果中、(a)反対表現を含む文書を非表示にしたり、(b)反対表現を含む文書を色別表示したり、あるいは(c)反対表現を含む文書と含まない文書とを分けて表示したりといった、細かな表示方法を指定することができる。なお、画面例については後述する。
【0038】
つぎに、図3はこの発明の実施の形態による文書検索装置における、文書検索処理の手順を示すフローチャートである。
【0039】
検索条件入力部200が、操作者から検索条件となる自然文の入力を受け付けると(ステップS301:Yes)、上記検索条件を引き渡された形態素解析部201で形態素解析(ステップS302)、さらに当該解析結果を引き渡された構文解析部202で構文解析(ステップS303)が実施され、解析済みの検索条件が文書検索部206に引き渡される。
【0040】
つぎに、文書検索部206は検索条件のクエリーベクトルを作成するとともに(ステップS304)、転置ファイル記憶部204内の転置ファイルから各文書の文書ベクトルを順次作成して、ベクトル間の距離を測定することで、各文書の検索条件に対する合致度のスコアを算出する(ステップS305)。
【0041】
さらに、文書検索部206はその反対表現検索部206aにより、係り受けインデックス記憶部205内の係り受けインデックスを参照して、検索条件の反対表現を含む文書を特定する(ステップS306)。そして、特定された文書につき上記で算出されたスコアを、何らかのルールにより小さくなるよう補正する(ステップS307)。その後、この補正後のスコアにもとづいて文書記憶部203内の各文書を順位づけし(ステップS308)、各文書のスコアと順位、および反対表現の有無(当該文書が検索条件と逆の反対表現を含むか否か)を検索結果表示部207に引き渡す。
【0042】
これを受けた検索結果表示部207は、各文書の文書見出しを文書記憶部203から読み出すとともに(ステップS309)、読み出した見出しを順位の高い順に一覧表示する(ステップS310)。
【0043】
図4は、検索結果表示部207により表示される検索結果画面の一例を示す説明図である。図中、第一位の「コメ不足 揺らぐ主食の座 パン・めん類の売り上げ急増」とある文書が、「コメの地位を脅かすようにパン・めん類が売り上げを伸ばしている・・・」という一文を含む上述の文書Bであり、第三位の「安売り服の先駆け「○○○○」が和解申請」とある文書が、「売り上げが伸びず経営が行き詰まった・・・」という一文を含む上述の文書Aである。
【0044】
図中、「表示オプション」ボタン400を押下すると、図5に示すようなダイアログが開いて、反対表現を含む文書の表示形態を(a)表示しない(b)別の色で表示する(c)別枠で表示する(d)区別なく表示する、の4つから選択することができる。
【0045】
図4の例はこのオプションで(d)が選択されている場合の例であるが、たとえば(a)を選択していた場合には、検索結果画面は図6のようになる。図4の画面と比較すると、反対表現を含む第三位の文書が表示されなくなっていることが分かる。また、オプションで(b)を選択すると結果画面は図7のようになり、反対表現を含む第三位の文書だけ、それ以外の文書と異なる背景色で表示される。なお、図示する例は背景色を異ならせたものであるが、文字列の表示色を変えるようにしてもよい。
【0046】
また、オプションで(c)を選択すると結果画面は図8のようになり、反対表現を含む第三位の文書と、それ以外の文書とが別のエリアに分けて表示される。なお、同図のような表示形態のほか、たとえばタブの切り替えで二つの一覧を交互に表示させることもできる。別ウィンドウにそれぞれの一覧を表示するようにしてもよく、要するに反対表現を含む文書群と含まない文書群とが別の箇所にまとめて表示されるのであればよい。
【0047】
なお、いずれの検索結果画面においても、一覧中の文書見出しにはリンクが埋め込まれており、これをクリックすることで当該文書の本文を表示させることができる。このとき、反対表現を含む文書の表示時には、その本文に含まれる反対表現の箇所を表示色や文字サイズの変更などにより強調表示する。
【0048】
以上説明した実施の形態によれば、検索条件とは意味内容が逆の反対表現を含む文書につき、合致度のスコアを下げるような補正をおこなうので、分野などは似ているものの操作者の検索目的に合わない文書は検索結果に現れにくくなり、文書検索の精度を高めることができる。また、反対表現を含む文書は検索結果中に表示しないようにしたり、表示はするもののそれ以外の文書とは区別できるようにしたりするので、検索結果中の文書を操作者が必要とするものだけに容易に絞り込むことができる。
【0049】
なお、「売り上げが伸びた会社について知りたい」という検索条件の反対表現は「売り上げ−伸びない(伸びず)」であるが、逆に「売り上げが伸びなかった会社について知りたい」という検索条件の反対表現は「売り上げ−伸びる」である。したがって、後者の例では文書Bを始めとする、「売り上げ−伸びる」の係り受けパターンを有する文書のスコアが下がり、結果的に「売り上げ−伸びない(伸びず)」の係り受けパターンを有する文書Aのほうが検索結果一覧の上位に現れやすくなる。
【0050】
また、上述した実施の形態では、検索条件の入力から各文書の合致度の計算、順位づけや検索結果の表示までを単一のコンピュータでおこなっているが、たとえば検索条件の入力や検索結果の表示、あるいは表示方法の指示はネットワークにより接続された遠隔のクライアントからおこなうようにしてもよい。
【0051】
なお、上述した検索条件入力部200、形態素解析部201、構文解析部202、文書検索部206、検索結果表示部207および表示方法指示部208は、具体的にはHD105からRAM103に読み出されたプログラムをCPU101が実行することにより実現されるものである。このプログラムはHD105のほか、FD107、CD−ROM113、MOなどの各種の記録媒体に格納して配布することができ、ネットワークを介して配布することも可能である。また、文書記憶部203、転置ファイル記憶部204および係り受けインデックス記憶部205はHD105により実現される。
【0052】
【発明の効果】
以上説明したようにこの発明は、複数の電子文書の中から、自然文により入力された検索条件に合致するものを検索する文書検索装置において、前記検索条件に対する前記各電子文書の合致度を算出する算出手段と、前記電子文書の中から前記検索条件の反対表現を含むものを検索する検索手段と、前記検索手段により検索された電子文書につき、前記算出手段により算出されたその合致度を補正する補正手段と、前記検索手段により検索されなかった電子文書については前記算出手段により算出された合致度、前記検索手段により検索された電子文書については前記補正手段により補正された合致度にもとづいて、前記各電子文書の順位を特定する順位特定手段と、前記順位特定手段により順位を特定された各電子文書を特定できる情報を表示画面に表示する表示手段と、を備えたので、検索対象文書のうち特に検索条件の反対表現を含む文書については、通常の手順で算出された合致度が別の値に補正され、これによって、検索条件の反対表現を含む文書すなわち検索目的から外れた文書が検索結果一覧中に現れるのを阻止・抑制することが可能な文書検索装置が得られるという効果を奏する。
【0053】
また、この発明は、上記に記載の発明において、前記補正手段が、前記検索手段により検索された各電子文書につき、前記算出手段により算出されたその合致度をより低い値に補正するので、検索対象文書のうち特に検索条件の反対表現を含む文書については、通常の手順で算出された合致度がより低い値に補正され、これによって、検索条件の反対表現を含む文書すなわち検索目的から外れた文書が検索結果一覧中に現れるのを阻止・抑制することが可能な文書検索装置が得られるという効果を奏する。
【0054】
また、この発明は、上記に記載の発明において、前記表示手段が、前記順位特定手段により順位を特定された電子文書のうち、前記検索手段により検索されなかった各電子文書を特定できる情報のみを表示画面に表示するので、検索対象文書のうち特に検索条件の反対表現を含む文書は、検索条件との合致度がたとえ高くても検索結果としては表示されず、これによって、検索条件の反対表現を含む文書すなわち検索目的から外れた文書を検索結果一覧から排除することが可能な文書検索装置が得られるという効果を奏する。
【0055】
また、この発明は、上記に記載の発明において、前記表示手段が、前記順位特定手段により順位を特定された電子文書のうち、前記検索手段により検索された各電子文書を特定できる情報と前記検索手段により検索されなかった各電子文書を特定できる情報とを区別して表示画面に表示するので、検索結果一覧では検索条件の反対表現を含む文書と含まない文書とが区別して表示され、これによって、検索条件の反対表現を含む文書(すなわち検索目的から外れた文書)とそうでない文書とを検索結果一覧中で区別することが可能な文書検索装置が得られるという効果を奏する。
【0056】
また、この発明は、上記に記載の発明において、前記表示手段が、前記検索手段により検索された各電子文書を特定できる情報と前記検索手段により検索されなかった各電子文書を特定できる情報とを、表示色もしくは背景色を異ならせるまたは表示領域を異ならせることで区別して表示画面に表示するので、検索結果一覧では検索条件の反対表現を含む文書と含まない文書とが、表示色もしくは背景色、または表示領域を異ならせることで区別して表示され、これによって、検索条件の反対表現を含む文書(すなわち検索目的から外れた文書)とそうでない文書とを検索結果一覧中で区別することが可能な文書検索装置が得られるという効果を奏する。
【0057】
また、この発明は、複数の電子文書の中から、自然文により入力された検索条件に合致するものを検索する文書検索方法において、前記検索条件に対する前記各電子文書の合致度を算出する算出工程と、前記電子文書の中から前記検索条件の反対表現を含むものを検索する検索工程と、前記検索工程で検索された電子文書につき、前記算出工程で算出されたその合致度を補正する補正工程と、前記検索工程で検索されなかった電子文書については前記算出工程で算出された合致度、前記検索工程で検索された電子文書については前記補正工程で補正された合致度にもとづいて、前記各電子文書の順位を特定する順位特定工程と、前記順位特定工程で順位を特定された各電子文書を特定できる情報を表示画面に表示する表示工程と、を含んだので、検索対象文書のうち特に検索条件の反対表現を含む文書については、通常の手順で算出された合致度が別の値に補正され、これによって、検索条件の反対表現を含む文書すなわち検索目的から外れた文書が検索結果一覧中に現れるのを阻止・抑制することが可能な文書検索方法が得られるという効果を奏する。
【0058】
また、この発明によれば、上記に記載された方法をコンピュータに実行させることが可能なプログラムが得られるという効果を奏する。
【図面の簡単な説明】
【図1】 この発明の実施の形態による文書検索装置のハードウエア構成を示す説明図である。
【図2】 この発明の実施の形態による文書検索装置の機能的構成を示す説明図である。
【図3】 この発明の実施の形態による文書検索装置における、文書検索処理の手順を示すフローチャートである。
【図4】 検索結果表示部207により表示される検索結果画面の一例を示す説明図である。
【図5】 検索結果表示部207により表示される表示オプション設定ダイアログの一例を示す説明図である。
【図6】 検索結果表示部207により表示される検索結果画面の一例(非表示設定の場合)を示す説明図である。
【図7】 検索結果表示部207により表示される検索結果画面の一例(色別表示設定の場合)を示す説明図である。
【図8】 検索結果表示部207により表示される検索結果画面の一例(別枠表示設定の場合)を示す説明図である。
【符号の説明】
100 バスまたはケーブル
101 CPU
102 ROM
103 RAM
104 HDD
105 HD
106 FDD
107 FD
108 ディスプレイ
109 ネットワークI/F
110 通信ケーブル
111 キーボード
112 マウス
113 CD−ROM
114 CD−ROMドライブ
200 検索条件入力部
201 形態素解析部
202 構文解析部
203 文書記憶部
204 転置ファイル記憶部
205 係り受けインデックス記憶部
206 文書検索部
206a 反対表現検索部
207 検索結果表示部
208 表示方法指示部

Claims (7)

  1. 複数の電子文書の中から、自然文により入力された検索条件に合致するものを検索する文書検索装置において、
    前記検索条件に対する前記各電子文書の合致度を算出する算出手段と、
    前記電子文書の中から前記検索条件の表現に対してあらかじめ登録されている反対表現を含むものを検索する検索手段と
    前記算出手段により算出された合致度にもとづいて、前記各電子文書の順位を特定する順位特定手段と、
    前記順位特定手段により順位を特定された電子文書のうち、前記検索手段により検索されなかった電子文書を特定できる情報のみを表示画面に表示し、前記検索手段により検索された電子文書を特定できる情報を非表示にする表示手段と、
    を備えたことを特徴とする文書検索装置。
  2. 複数の電子文書の中から、自然文により入力された検索条件に合致するものを検索する文書検索装置において、
    前記検索条件に対する前記各電子文書の合致度を算出する算出手段と、
    前記電子文書の中から前記検索条件の表現に対してあらかじめ登録されている反対表現を含むものを検索する検索手段と、
    前記算出手段により算出された合致度にもとづいて、前記各電子文書の順位を特定する順位特定手段と、
    前記順位特定手段により順位を特定された電子文書のうち、前記検索手段により検索された各電子文書を特定できる情報と前記検索手段により検索されなかった各電子文書を特定できる情報とを区別して表示画面に表示する表示手段と、
    を備えたことを特徴とする文書検索装置。
  3. 前記表示手段は、前記検索手段により検索された各電子文書を特定できる情報と前記検索手段により検索されなかった各電子文書を特定できる情報とを、表示色もしくは背景色を異ならせるまたは表示領域を異ならせることで区別して表示画面に表示することを特徴とする前記請求項に記載の文書検索装置。
  4. コンピュータを用いて、複数の電子文書の中から、自然文により入力された検索条件に合致するものを検索する文書検索方法において、
    前記コンピュータの算出手段が、前記検索条件に対する前記各電子文書の合致度を算出する算出工程と、
    前記コンピュータの検索手段が、前記電子文書の中から前記検索条件の表現に対してあらかじめ登録されている反対表現を含むものを検索する検索工程と、
    前記コンピュータの順位特定手段が、前記算出工程により算出された合致度にもとづいて、前記各電子文書の順位を特定する順位特定工程と、
    前記コンピュータの表示手段が、前記順位特定工程により順位を特定された電子文書のうち、前記検索工程により検索されなかった電子文書を特定できる情報のみを表示画面に表示し、前記検索工程により検索された電子文書を特定できる情報を非表示にする表示工程と、
    を実行することを特徴とする文書検索方法。
  5. コンピュータを用いて、複数の電子文書の中から、自然文により入力された検索条件に合致するものを検索する文書検索方法において、
    前記コンピュータの算出手段が、前記検索条件に対する前記各電子文書の合致度を算出する算出工程と、
    前記コンピュータの検索手段が、前記電子文書の中から前記検索条件の表現に対してあらかじめ登録されている反対表現を含むものを検索する検索工程と、
    前記コンピュータの順位特定手段が、前記算出工程により算出された合致度にもとづい て、前記各電子文書の順位を特定する順位特定工程と、
    前記コンピュータの表示手段が、前記順位特定工程により順位を特定された電子文書のうち、前記検索工程により検索された各電子文書を特定できる情報と前記検索工程により検索されなかった各電子文書を特定できる情報とを区別して表示画面に表示する表示工程と、
    を実行することを特徴とする文書検索方法。
  6. 前記表示工程は、前記コンピュータの表示手段が、前記検索工程により検索された各電子文書を特定できる情報と前記検索工程により検索されなかった各電子文書を特定できる情報とを、表示色もしくは背景色を異ならせるまたは表示領域を異ならせることで区別して表示画面に表示することを特徴とする前記請求項5に記載の文書検索方法。
  7. 前記請求項4〜6のいずれか一つに記載された方法をコンピュータに実行させることを特徴とする文書検索プログラム。
JP2002120145A 2002-04-23 2002-04-23 文書検索装置、文書検索方法およびその方法をコンピュータに実行させるプログラム Expired - Fee Related JP3779935B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002120145A JP3779935B2 (ja) 2002-04-23 2002-04-23 文書検索装置、文書検索方法およびその方法をコンピュータに実行させるプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002120145A JP3779935B2 (ja) 2002-04-23 2002-04-23 文書検索装置、文書検索方法およびその方法をコンピュータに実行させるプログラム

Publications (2)

Publication Number Publication Date
JP2003316810A JP2003316810A (ja) 2003-11-07
JP3779935B2 true JP3779935B2 (ja) 2006-05-31

Family

ID=29536452

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002120145A Expired - Fee Related JP3779935B2 (ja) 2002-04-23 2002-04-23 文書検索装置、文書検索方法およびその方法をコンピュータに実行させるプログラム

Country Status (1)

Country Link
JP (1) JP3779935B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4859456B2 (ja) * 2005-12-27 2012-01-25 株式会社日立製作所 データスキーマのマッピングプログラム及び計算機システム
CN101452459B (zh) * 2007-11-30 2011-01-19 英业达股份有限公司 利用索引查找相似翻译结果的系统及其方法
US8606810B2 (en) 2008-01-30 2013-12-10 Nec Corporation Information analyzing device, information analyzing method, information analyzing program, and search system
JP4960401B2 (ja) * 2009-03-27 2012-06-27 京セラドキュメントソリュ−ションズ株式会社 画像表示プログラム及び画像表示装置
WO2012070228A1 (ja) * 2010-11-22 2012-05-31 日本電気株式会社 対話テキスト解析装置、方法およびプログラム

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH021057A (ja) * 1988-01-20 1990-01-05 Ricoh Co Ltd 文書検索装置
JP3470782B2 (ja) * 1996-01-09 2003-11-25 沖電気工業株式会社 情報検索装置
JP3729222B2 (ja) * 1996-12-24 2005-12-21 富士ゼロックス株式会社 画像デザイン支援装置
JPH10198690A (ja) * 1997-01-10 1998-07-31 Nec Corp 類似文書検索方法および類似文書検索装置
JPH11224262A (ja) * 1998-02-09 1999-08-17 Minolta Co Ltd 画像検索装置及び方法並びに画像検索プログラムを記録した記録媒体
JP2000112957A (ja) * 1998-09-30 2000-04-21 Canon Inc 情報検索装置及びその方法、コンピュータ可読メモリ
JP2003150622A (ja) * 2001-11-13 2003-05-23 Canon Inc 情報検索装置
JP2003150625A (ja) * 2001-11-14 2003-05-23 Canon Inc 情報検索装置

Also Published As

Publication number Publication date
JP2003316810A (ja) 2003-11-07

Similar Documents

Publication Publication Date Title
US20090144262A1 (en) Search query transformation using direct manipulation
US20090083230A1 (en) Apparatus and method for supporting information searches
US20060015509A1 (en) Bookmark management apparatus for dynamic categorization
JP5962277B2 (ja) 文書関連付け装置及びプログラム
JP2010003015A (ja) 文書検索システム
JP2004326216A (ja) 文書検索装置、方法、プログラム、及び記録媒体
JP2009009461A (ja) キーワードの入力支援システム、コンテンツ検索システム、コンテンツ登録システム、コンテンツ検索・登録システム、およびこれらの方法、並びにプログラム
JP2004341753A (ja) 検索支援装置、検索支援方法、およびプログラム
JPH0528190A (ja) 情報検索用端末装置
JP2004054588A (ja) 文書検索装置、文書検索方法およびその方法をコンピュータに実行させるプログラム
JP3779935B2 (ja) 文書検索装置、文書検索方法およびその方法をコンピュータに実行させるプログラム
JP3864235B2 (ja) 情報検索システムおよび情報検索プログラム
JP2012230544A (ja) 画像検索装置およびプログラム
JPH08320882A (ja) 文書処理装置および文書検索装置
JP5640700B2 (ja) 情報検索装置、検索入力方法、及び検索入力プログラム
JP4446715B2 (ja) 文書検索装置、文書検索方法、および文書検索プログラム
JP2939841B2 (ja) データベース検索装置
JP3528541B2 (ja) 検索論理式入力装置
JP2001092850A (ja) 情報検索用端末装置及び情報検索用端末装置にける情報表示・入出力方法
JP2004151957A (ja) 文献調査支援プログラム
JP3710463B2 (ja) 翻訳支援辞書装置
JP2000207422A (ja) 概念シソ―ラスを用いた文書の検索及び格付けシステム並びに方法
JPH10116288A (ja) 情報処理装置及び電子辞書検索方法
JP2005327023A (ja) ヒット数予想を利用した全文検索の検索方式
JP2006039938A (ja) 選択項目表示装置、選択項目表示方法、および選択項目表示プログラム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051025

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051209

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060221

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060303

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120310

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees