JP3627445B2 - 文書検索装置及び文書検索プログラムを記録した記憶媒体 - Google Patents

文書検索装置及び文書検索プログラムを記録した記憶媒体 Download PDF

Info

Publication number
JP3627445B2
JP3627445B2 JP14625897A JP14625897A JP3627445B2 JP 3627445 B2 JP3627445 B2 JP 3627445B2 JP 14625897 A JP14625897 A JP 14625897A JP 14625897 A JP14625897 A JP 14625897A JP 3627445 B2 JP3627445 B2 JP 3627445B2
Authority
JP
Japan
Prior art keywords
document
neighborhood
search
word
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP14625897A
Other languages
English (en)
Other versions
JPH10334114A (ja
Inventor
政之 倉橋
勉 倉持
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP14625897A priority Critical patent/JP3627445B2/ja
Publication of JPH10334114A publication Critical patent/JPH10334114A/ja
Application granted granted Critical
Publication of JP3627445B2 publication Critical patent/JP3627445B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は文書検索装置及び文書検索プログラムを記録した記憶媒体に関し、特に複数の文書から検索意図に合致する文書を検索する文書検索装置及び複数の文書から検索意図に合致する文書を検索する文書検索プログラムを記録した記憶媒体に関する。
【0002】
【従来の技術】
従来、キーワードを指定して必要な文書データを検索する方法として、検索対象である文書データの全文に対してキーワード検索を行う全文検索方法や、文書データの各々から予め抽出した、その文書データの内容を示す内容キーワードに対してキーワード検索を行う方法等がある。通常、文書データの内容キーワードを予め抽出しておいた方が、高速な文書検索が可能である。
【0003】
しかし、この方法では検索対象である文書データの各々から予め内容キーワードを抽出しておかなければならないため、システムのメンテナンスに工数や時間がかかってしまう。また、必要な文書データが存在していても、その内容を簡潔に表すものとして予め抽出された内容キーワードが検索キーワードと合致しない場合、検索もれとなってしまう。
【0004】
このため、最近は必要な文書データが検索もれとなることのない全文検索方法が見直されている。
しかし、全文検索方法で文書検索を行った場合、検索によって検索キーワードを含み必要な文書データである可能性が高いと判断される文書データ(以降、このように判断されることをヒットするという)は膨大な量となってしまうことが多い。検索キーワードを増やしたりして検索処理を繰り返せばヒットする文書は減少するが、安易に検索キーワードを増やすと、今度は、ヒットした文書の中に含まれる必要な文書の割合が低くなってしまうこともある。なお、ヒットした文書データ中に含まれる必要な文書データの割合を、適合率と呼ぶ。
【0005】
検索結果の適合率が下がってしまう大きな原因としては、検索キーワードとして指定される言葉が、使われる場所や状況(以降、これらをまとめて文脈と呼ぶ)によって異なる意味を持ってしまうことが挙げられる。これを、キーワードの多義性と呼ぶ。
【0006】
キーワードの多義性による検索結果の適合率の低下を防ぐ方法としては、検索の際、ヒットの条件として、関連する複数のキーワードの出現する順序や、キーワード間の距離、及び同一の句や文、段落等に対するキーワードの出現条件等を利用する方法があり、この方法の実現及び高速化を実現する技術が、特開平5−189487に示されている。
【0007】
しかし、この方法では関連する複数のキーワードをユーザが指定するため、不用意な指定を行ってしまうと必要な文書が存在しても、検索もれとなってしまうことがある。
【0008】
キーワードの多義性による検索結果の適合率の低下を防ぐ方法としては、スニペット・サーチ(Snippet Search)と呼ばれる方法もあり、特開平4−293161にその詳細が示されている。この方法では文書検索の際、検索キーワードの出現する文の一部を表示してその文を含む文書が必要か(検索キーワードの使われ方が検索意図に合っている)否かをユーザに判断させる。またこのとき、検索キーワード周辺に存在し、意味のある単語を、新たに近接条件制約の付いたキーワードとして追加することができる。このため、必要な文書データが検索もれとなることはあまりないし、適合率は高くなる。
【0009】
しかし、この方法ではユーザはキーワードの出現する文を含む文書データすべてに対して必要か否かの判断を行う必要がある。従って、ヒット件数が多くなった場合には非常に工数がかかってしまう。
【0010】
キーワードの多義性による検索結果の適合率の低下を防ぐ方法としては、意味的に関連性の高い単語同士が、同一文中に出現する可能性が高いことを利用する方法もある。文書の意味的な特徴を表現していると思われる単語を特徴語といい、単語同士が同一文中に出現することを共起するという。文献(丹羽, ” 動的な共起解析を用いた対話的文書検索支援”, 情報処理学会・自然言語処理研究会報告, Vol. 96−NL−115, pp. 99−106, 1996. )では、この共起関係が強い特徴語間にリンクをはり、検索キーワードを頂点に特徴語の共起関係をグラフ化して表示する技術を示している。ユーザは検索意図に合った特徴語の出現に高いスコアを、検索意図に合わない特徴語の出現に低いスコアをつけことにより、検索意図に合った文書データに高いスコアをつけて検索することができる。
【0011】
【発明が解決しようとする課題】
しかし、この方法では文書データ単位で検索キーワードと特徴語との関係を分析しているため、同一文書中に検索キーワードが複数含まれ、各々の意味が異なっているような場合にはスコアが低下してしまい、必要な文書データが検索もれとなってしまうことがある。また、ヒットした文書データすべてに対して特徴語の共起関係を分析する必要があるため、ヒット件数が多い場合にシステムの負荷が大きくなってしまい、レスポンスに問題が生じる。
【0012】
このように、全文検索方法ではキーワードの多義性による検索結果の適合率の低下を防ぐために、検索キーワードと意味的に関連のある単語(以降、このような単語を関連語という)の存在を検索条件とすることが多いが、関連語の抽出やこれを利用した処理には工数や時間がかかるため、検索処理の高速化は難しいという問題点があった。
【0013】
本発明はこのような点に鑑みてなされたものであり、キーワードの多義性による検索結果の適合率の低下を防ぐとともに、高速な文書検索処理を行う文書検索装置を提供することを目的とする。
【0014】
また、本発明の別の目的は、キーワードの多義性による検索結果の適合率の低下を防いだ高速な文書検索処理をコンピュータに行わせるための文書検索プログラムを記録した記憶媒体を提供することである。
【0015】
【課題を解決するための手段】
本発明では上記課題を解決するために、複数の文書から検索意図に合致する文書を検索する文書検索装置において、入力される検索キーワードを保持するキーワード保持手段と、前記複数の文書から前記検索キーワードを含む文書のみを抽出し、候補文書として出力する検索手段と、前記候補文書を保持する候補文書保持手段と、前記候補文書を形態素解析する候補文書解析手段と、前記検索キーワードの前方から抽出する前方単語数と後方から抽出する後方単語数とが個別に入力されることによって近傍範囲が予め指定され、前記候補文書中において、前記検索キーワードから前方に数えて前記前方単語数内に位置する近傍語と、前記検索キーワードから後方に数えて前記後方単語数内に位置する前記近傍語とを抽出する近傍語抽出手段と、前記近傍語から少なくとも一つの選択語の指定、及び前記選択語と前記候補文書との関係を示す近傍語拘束条件の指定を含む近傍条件の入力を受け付ける近傍条件入力手段と、前記検索キーワード及び前記近傍条件入力手段が受け付けた前記近傍条件を保持する近傍条件保持手段と、形態素解析された前記候補文書が前記近傍条件に適合するか否か判断し、適合する前記候補文書を適合文書として出力する適合判断手段と、を有することを特徴とする文書検索装置が提供される。
【0016】
このような文書検索装置にて、複数の文書から検索意図に合致する文書を検索する場合、キーワード保持手段が、入力される検索キーワードを保持する。また、検索手段が、複数の文書から検索キーワードを含む文書のみを抽出し、候補文書として出力する。候補文書保持手段は候補文書を保持する。候補文書解析手段は、候補文書を形態素解析する。近傍語抽出手段は、候補文書中において検索キーワードから予め設定された近傍範囲内に含まれる近傍語を抽出する。近傍条件保持手段は、検索意図を検索キーワード及び近傍語に基づいて表現した近傍語拘束条件を含む近傍条件を保持する。そして適合判断手段は、形態素解析された候補文書が近傍条件に適合するか否か判断し、適合する候補文書を適合文書として出力する。
【0017】
このようにして文書検索を行うと、文書検索装置は一旦検索キーワードにて全文検索を行った後、検索キーワードの近傍にある近傍語を抽出するので、ユーザは検索意図を検索キーワード及び表示された近傍語にて表現した近傍語拘束条件を含んだ近傍条件を入力すれば、この近傍条件に適合した適合文書が検索できる。なお、近傍条件は検索意図に対応して表現できるので、適合率の高い検索結果を少ない工数にて得ることができる。
【0018】
また、本発明では上記課題を解決するために、複数の文書から検索意図に合致する文書を検索する文書検索プログラムを記録した記憶媒体において、コンピュータを、入力される検索キーワードを保持するキーワード保持手段、前記複数の文書から前記検索キーワードを含む文書のみを抽出し、候補文書として出力する検索手段、前記候補文書を保持する候補文書保持手段、前記候補文書を形態素解析する候補文書解析手段、前記検索キーワードの前方から抽出する前方単語数と後方から抽出する後方単語数とが個別に入力されることによって近傍範囲が予め指定され、前記候補文書中において、前記検索キーワードから前方に数えて前記前方単語数内に位置する近傍語と、前記検索キーワードから後方に数えて前記後方単語数内に位置する前記近傍語とを抽出する近傍語抽出手段、前記近傍語から少なくとも一つの選択語の指定、及び前記選択語と前記候補文書との関係を示す近傍語拘束条件の指定を含む近傍条件の入力を受け付ける近傍条件入力手段、前記検索キーワード及び前記近傍条件入力手段が受け付けた前記近傍条件を保持する近傍条件保持手段、形態素解析された前記候補文書が前記近傍条件に適合するか否か判断し、適合する前記候補文書を適合文書として出力する適合判断手段、として機能させるための文書検索プログラムを記録したことを特徴とする記憶媒体が提供される。
【0019】
このような文書検索プログラムを記録した記憶媒体にて、コンピュータを機能させて複数の文書から検索意図に合致する文書を検索する場合、コンピュータは、入力される検索キーワードを保持するキーワード保持手段として機能する。また、複数の文書から検索キーワードを含む文書のみを抽出し、候補文書として出力する検索手段として機能するとともに、候補文書を保持する候補文書保持手段として機能する。さらに、候補文書を形態素解析する候補文書解析手段及び候補文書中において、検索キーワードから予め設定された近傍範囲内に含まれる近傍語を抽出する近傍語抽出手段として機能する。また、検索意図を検索キーワード及び近傍語に基づいて表現した近傍語拘束条件を含む近傍条件を保持する近傍条件保持手段として機能する。そして、コンピュータは、形態素解析された候補文書が近傍条件に適合するか否か判断し、適合する候補文書を適合文書として出力する適合判断手段として機能する。
【0020】
このようにして文書検索を行うと、コンピュータは一旦検索キーワードにて全文検索を行った後、検索キーワードの近傍にある近傍語を抽出するので、ユーザは検索意図を検索キーワード及び表示された近傍語にて表現した近傍語拘束条件を含んだ近傍条件を入力すれば、この近傍条件に適合した適合文書が検索できる。なお、近傍条件は検索意図に対応して表現できるので、適合率の高い検索結果を少ない工数にて得ることができる。
【0021】
【発明の実施の形態】
以下、本発明の実施の形態を図面を参照して説明する。
図1は、本発明の文書検索装置の原理構成を示す機能ブロック図である。
【0022】
文書検索装置2は、キーワード保持手段2aと、検索手段2bと、候補文書保持手段2cと、候補文書解析手段2dと、近傍語抽出手段2eと、近傍条件保持手段2fと、適合判断手段2gと、から構成されており、文書データベース1に格納された文書から、ユーザの検索意図に合致する文書を検索する。
【0023】
キーワード保持手段2aは、ユーザから入力される検索キーワードを保持し、必要に応じてこれを出力する。検索手段2bは、文書データベース1に格納された文書データに対し、キーワード保持手段2aから入力される検索キーワードによる全文検索を行う。そして、この結果検索される文書データを候補文書として出力する。
【0024】
候補文書保持手段2cは、検索手段2bから出力される候補文書をすべて保持する。この際、候補文書のリストを生成してもよい。候補文書解析手段2dは、候補文書保持手段2cに保持された候補文書中の検索キーワードを含んだ文を形態素解析する。
【0025】
近傍語抽出手段2eは、候補文書解析手段2dにて行われた形態素解析の結果を利用して、候補文書保持手段2cに保持された候補文書中における近傍語を抽出する。なお、近傍語とは、候補文書中において、検索キーワードから予め設定された近傍範囲内に含まれ、単独で意味をなす単語を示す。近傍語抽出手段2eにて抽出された近傍語はユーザが閲覧できるよう表示される。
【0026】
近傍条件保持手段2fは、ユーザから入力される近傍条件を保持する。ここで近傍条件には検索キーワードに対する近傍範囲及び近傍語拘束条件が含まれる。なお、近傍範囲とは文中において検索キーワードの出現位置を中心に、近傍語を抽出する範囲を示すもので、最初は初期設定値が設定されている。また、近傍語拘束条件とは、文書検索の意図を検索キーワード及び近傍語に基づいて表現したものである。
【0027】
適合判断手段2gは、候補文書解析手段2dにて行われた形態素解析の結果を利用して、候補文書保持手段2cに保持された候補文書が近傍条件に適合するか否かを判断する。適合した候補文書を適合文書としてユーザに出力する。なお、この際、適合文書のリストを生成してもよい。また、適合文書に含まれていた近傍語のリストを生成してもよい。
【0028】
なお、文書検索装置2にはユーザインタフェース(図示しない)が用意されており、検索キーワードや近傍条件の入力が可能になっている。また、抽出された近傍語や検索結果、適合文書等を表示する。
【0029】
このように本発明の文書検索装置2は一旦検索キーワードにて全文検索を行った後、検索キーワードの近傍にある近傍語を抽出するので、ユーザは検索意図を検索キーワード及び表示された近傍語にて表現した近傍語拘束条件を含んだ近傍条件を入力すれば、この近傍条件に適合した適合文書が検索できる。また、近傍条件は検索意図に対応して表現できるので、適合率の高い検索結果を少ない工数にて得ることができる。
【0030】
なお、文書データベース1を用意する代わりに、文書データを逐次入力してもよい。
次に、この文書検索装置2を実現するハードウェア構成について説明する。
【0031】
図2は、本発明の文書検索装置のハードウェア構成図である。
文書検索装置100は入出力装置130及び文書データベース140と接続されており、入出力装置130を介してデータの入出力を行い、文書データベース140に格納されている文書データを検索する。ここで、文書検索装置100は図1に示した文書検索装置2に、文書データベース140は図1に示した文書データベース1に、それぞれ対応する。
【0032】
この文書検索装置100は、入出力装置130から文書検索装置100へのデータ入力及び文書検索装置100から入出力装置130へのデータ出力を管理する入出力管理機構部111を持つ。
【0033】
また、この文書検索装置100は、データベース管理機構部112、一時候補リスト保持機構部113、キーワード管理機構部114、形態素解析機構部115、近傍条件管理機構部116、近傍語抽出機構部117、検索結果判定機構部118、検索結果リスト保持機構部119、近傍語リスト保持機構部120を持つ。
【0034】
ここで、データベース管理機構部112は図1で示した検索手段2bに対応しており、文書データベース140を管理するとともに、キーワードを用いて文書データベース140内に格納された文書データの全文検索を行う。検索の結果は一時候補リスト保持機構部113に出力する。また、形態素解析機構部115から要求があった場合には、その要求に応じて文書データベース140から必要な文章を抽出する。
【0035】
一時候補リスト保持機構部113は図1に示した候補文書保持手段2cに対応しており、データベース管理機構部112から入力される全文検索の結果を保持する。
【0036】
キーワード管理機構部114は図1で示したキーワード保持手段2aに対応しており、ユーザから入出力装置130、入出力管理機構部111を介して入力される検索キーワードを管理する。
【0037】
形態素解析機構部115は図1で示した候補文書解析手段2dに対応しており、全文検索の結果を一時候補リスト保持機構部113から取得し、この結果からデータベース管理機構部112に文章の要求を行う。そしてデータベース管理機構部112から取得した文章を形態素解析する。
【0038】
近傍条件管理機構部116は図1で示した近傍条件保持手段2fに対応しており、近傍範囲及び近傍語拘束条件を近傍条件として管理している。
近傍語抽出機構部117は図1で示した近傍語抽出手段2eに対応しており、キーワード管理機構部114からキーワードを、近傍条件管理機構部116から近傍範囲を取得して、形態素解析された文章から近傍語を抽出し、検索結果判定機構部118に出力する。
【0039】
検索結果判定機構部118は図1に示した適合判断手段2gに対応しており、近傍条件管理機構部116から近傍語拘束条件を、近傍語抽出機構部117から近傍語を取得し、近傍語が近傍語拘束条件に合致するか否かの判断を行う。判断の結果は検索結果リスト保持機構部119に入力する。また、近傍語が近傍語拘束条件に合致していた場合には、その近傍語を近傍語リスト保持機構部120に入力する。
【0040】
なお、検索結果リスト保持機構部119は検索結果リストを、近傍語リスト保持機構部120は近傍語リストを、それぞれ保持する。
次に、このような構成の文書検索装置100にて文書検索を行う際の処理手順を説明する。
【0041】
図3は、本発明の文書検索装置100にて文書検索を行う際の処理の手順を示したフローチャートである。以下、図中のステップ番号に沿って説明を行う。
[S1]文書検索装置100は、入出力装置130及び入出力管理機構部111を介してユーザから入力されるキーワードを受け付ける。受け付けたキーワードはキーワード管理機構部114にて管理される。
[S2]近傍条件管理機構部116には近傍条件として、予め用意された初期設定パラメータが設定される。初期設定パラメータには少なくとも近傍範囲の設定が含まれており、近傍条件管理機構部116は、この近傍範囲を近傍語抽出機構部117に入力する。
[S3]文書検索装置100は主検索処理を行う。この処理に関しては、後に別のフローチャートにて詳しく説明する。
[S4]文書検索装置100は入出力管理機構部111及び入出力装置130を介して、検索結果リスト保持機構部119に保持されている検索結果と、近傍語リスト保持機構部120に保持されている近傍語を表示する。
[S5]文書検索装置100のキーワード管理機構部114は、ユーザからキーワードの拡張を行う指示が入力されたか否か判断する。キーワード拡張の指示が入力されていればステップS6に進む。また、指示が入力されていなければステップS7に進む。
[S6]キーワード管理機構部114は、キーワード拡張処理を行う。この処理に関しては後に別のフローチャートにて詳しく説明する。なお、この処理の終了によってキーワードは更新されるため、再度ステップS3へ進む。
[S7]文書検索装置100の近傍条件管理機構部116は、ユーザから近傍条件の変更を行う指示が入力されたか否か判断する。近傍条件変更の指示が入力されていればステップS8に進む。また、指示が入力されていなければステップS10に進む。
[S8]近傍条件管理機構部116は、ユーザから新たに設定される近傍範囲を保持する。
[S9]近傍条件管理機構部116は、ユーザから新たに設定される近傍語拘束条件を保持する。なお、ステップS8、S9の処理によって近傍条件は更新されるため、再度ステップS3へ進む。
[S10]文書検索装置100の検索結果リスト保持機構部119は、入出力管理機構部111及び入出力装置130を介して検索結果を出力する。
【0042】
ここで、ステップS3に示した主検索処理について説明する。
図4は、図3に示した主検索を行う際の処理の手順を示したフローチャートである。以下、図中のステップ番号に沿って説明を行う。
[S31]データベース管理機構部112は、キーワード管理機構部114から入力されたキーワードにより文書データベース140に保持されている文書データすべてに対し、全文検索を行う。そして、全文検索の結果ヒットした文章及びその文章を含む文書のID等を一時候補リスト保持機構部113に出力し、ここで一時候補リストとして保持させる。
[S32]形態素解析機構部115は、一時候補リスト保持機構部113の一時候補リストが空か否か判断する。一時候補リストが空ならば、このフローチャートは終了する。一時候補リストが空でなければ、ステップS33に進む。
[S33]形態素解析機構部115は、一時候補リストからヒットした文書を1つ取り出し、データベース管理機構部112に要求を出してこの文書供給を受ける。
[S34]形態素解析機構部115は、取り出した文書からキーワードを含む文章を抽出し、形態素解析を行う。
[S35]近傍語抽出機構部117は、形態素解析の結果を参照し、キーワード及び近傍範囲に基づいて、近傍語を抽出する。
[S36]検索結果判定機構部118は、形態素解析の結果から、抽出した近傍語が近傍語拘束条件に合致するか否かを判断する。近傍語が近傍語拘束条件に合致する場合は、ステップS37に進む。また、近傍語が近傍語拘束条件に合致しない場合は、再度ステップS32に進む。
[S37]検索結果判定機構部118は、近傍語拘束条件に合致すると判断された近傍語を近傍語リストに追加し、この判断の結果ヒットした文書のID等を検索結果リスト保持機構部119の検索結果リストに追加する。
【0043】
次に、ステップS6に示したキーワード拡張処理について説明する。
図5は、図3に示したキーワード拡張を行う際の処理の手順を示したフローチャートである。以下、図中のステップ番号に沿って説明を行う。
[S61]キーワード管理機構部114は、ユーザが拡張を指定した近傍語を受け付け、近傍語リスト保持機構部120から関連データを取得する。
[S62]指定された近傍語が、キーワードに隣接しているか否か判断する。キーワードに隣接していればステップS63に進む。また、隣接していなければステップS64に進む。
[S63]キーワードと指定された近傍語とを接続して、新しいキーワードを生成する。
[S64]キーワードの拡張は不可能なので、ユーザにその旨の通知を行う。
【0044】
このように、本発明の文書検索装置100では、ユーザの入力する近傍条件に適合した文書が検索できる。なお、近傍条件は検索意図に合わせて様々な表現が可能である。
【0045】
図6は、本発明の文書検索装置の操作画面の第1の形態を示した図である。
図2に示した入出力装置130には、本発明の文書検索装置100の操作画面10が設けられる。なお、この操作画面10には、キーワード入力部11、キーワード拡張ボタン11a、検索ボタン12、ヒット件数表示部13、結果表示ボタン14、近傍語(前)表示部15a、近傍語(後)表示部15b、近傍範囲設定部16、選択語(前)入力部17a、選択語(後)入力部17b、出現文脈表示部18、メッセージ表示部19が設けられている。
【0046】
文書検索を行う場合、ユーザはまずこの操作画面10のキーワード入力部11にキーワードの入力を行う。近傍範囲設定部16には予め、前方1語、後方1語の初期設定がなされている。なお、ここで「前方1語」とは、候補文書中においてキーワードの前方に出現し、単独で意味をなす単語1語を近傍語とすることを示す。同様に「後方1語」とは候補文書中においてキーワードの後方に出現し、単独で意味をなす単語1語を近傍語とすることを示す。近傍範囲を初期設定から変更する場合は近傍範囲設定部16に変更を加えてから、検索ボタン12を押下する。
【0047】
ここでキーワードとして「規制」を入力し、近傍範囲の設定を変更せずに検索ボタン12を選択した場合の画面の変化をあげる。
図7は、本発明の文書検索装置の操作画面の第1の形態にて文書検索を実行した場合の、画面の様子を示した図である。
【0048】
ヒット件数表示部13は、このとき対象とした文書データベース中にキーワード「規制」を含む文書データが210件存在することを表示している。また近傍語(前)表示部15aには、「規制」の前方に出現する近傍語が出現頻度の高い順に表示されている。
【0049】
すなわち、図7に示す結果によれば、ヒットした210件の文書中、キーワード「規制」の前方に最も頻繁に出現する近傍語は「数々」であり、次は「義務」である。
【0050】
同様に、近傍語(後)表示部15bには、「規制」の後方に出現する近傍語が出現頻度の高い順に表示されている。図7に示す結果によれば、ヒットした210件の文書中、キーワード「規制」の後方に最も頻繁に出現する近傍語は「行う」であり、次は「環境」である。
【0051】
ここでユーザは表示されている近傍語(前)及び近傍語(後)を参照しながら、選択語(前)入力部17a及び選択語(後)入力部17bに、選択語(前)及び選択語(後)を入力することができる。なお、選択語(前)とは、再検索を行う際、近傍語(前)としてこれを含むことを条件とする単語を示す。同様に選択語(後)とは、再検索を行う際、近傍語(後)としてこれを含むことを条件とする単語を示す。
【0052】
図7では、選択語(前)として「炭水化物」及び「排出」を入力した様子を示している。このように選択語を入力した後、再度検索ボタン12を押下すると、近傍語(前)として「炭水化物」もしくは「排出」を含んだ文書が検索される。この際、近傍範囲を変更してもよい。
【0053】
なお、この操作画面10においてユーザが任意の近傍語を指定すると、出現文脈表示部18には指定された近傍語を含む文が抽出表示される。図7では、近傍語(前)の「炭水化物」が指定され、出現文脈として「炭水化物については、規制の強化と技術開発により・・・」が表示されている様子を示している。この際、出現文脈中のキーワード「規制」は、存在を確認しやすいようマークされる。近傍語の指定にはマウス等のポインティングデバイスが使用される。本発明ではこのように近傍語の出現文脈を確認できるので、選択語入力の際、これを参考とすることができる。
【0054】
キーワードを拡張する場合には、表示されている近傍語を指定してから拡張ボタン11aを押下する。この拡張はキーワードの直前もしくは直後の近傍語を指定した場合にのみ可能で、図7に示した例では近傍語(前)の「総量」等が選択できる。この場合、新たなキーワードは「総量規制」となる。逆に、近傍語(前)の「数々」等の、「規制」と直接接続されない単語を選択して拡張ボタン11aを押下した場合、キーワードの拡張は不可能である。従ってこの場合には、メッセージ表示欄19に「拡張できません」等の警告メッセージが出力される。検索が終了した場合には結果ボタン14を選択すれば、その時点でヒットしている文書を閲覧することができる。
【0055】
このように本発明の文書検索装置の第1の形態では選択語を入力でき、なおかつこの選択語の入力の際、近傍語や近傍語の出現文脈を参照することができるので、ユーザは検索意図に合致した文書を簡単に検索できる。
【0056】
なお、近傍語を表示する際、その傍に出現回数等を表示させてもよい。また、ここでは近傍語及び選択語をキーワードの前方に存在するか後方に存在するかによって(前)、(後)に区別したが、これらの区別を無くしてもよい。
【0057】
次に、本発明の文書検索装置の第2の形態を説明する。
図8は、本発明の文書検索装置の操作画面の第2の形態を示した図である。
図2に示した入出力装置130には、本発明の文書検索装置100の操作画面20が設けられる。なお、この操作画面20にはキーワード入力部21、キーワード拡張ボタン21a、検索ボタン22、ヒット件数表示部23、結果表示ボタン24、近傍語(前)表示部25a、近傍語(後)表示部25b、近傍範囲設定部26、排除語(前)入力部27a、排除語(後)入力部27b、出現文脈表示部28、メッセージ表示部29が設けられている。
【0058】
ここで、キーワード入力部21、キーワード拡張ボタン21a、検索ボタン22、ヒット件数表示部23、結果表示ボタン24、近傍語(前)表示部25a、近傍語(後)表示部25b、近傍範囲設定部26、出現文脈表示部28及びメッセージ表示部29は、図6に示したキーワード入力部11、キーワード拡張ボタン11a、検索ボタン12、ヒット件数表示部13、結果表示ボタン14、近傍語(前)表示部15a、近傍語(後)表示部15b、近傍範囲設定部16、出現文脈表示部18及びメッセージ表示部19と同一のものであるので、説明を省略する。
【0059】
ここでは図7同様、キーワード「規制」を入力して全文検索を行った後の操作画面20の様子を示している。ユーザは排除語(前)入力部27a及び排除語(後)入力部27bに、排除語(前)及び排除語(後)を入力することができる。なお、排除語(前)とは、再検索を行う際、近傍語(前)としてこれを含まないことを条件とする単語を示す。同様に排除語(後)とは、再検索を行う際、近傍語(後)としてこれを含まないことを条件とする単語を示す。
【0060】
図8では、排除語(前)として「炭水化物」及び「排出」を入力した様子を示している。このように排除語を入力した後、再度検索ボタン22を押下すると、キーワード「規制」を含んだ文書のうち、近傍語(前)として「炭水化物」もしくは「排出」を含んだ文書を除いた文書がヒットとなる。この際、近傍範囲を変更してもよい。
【0061】
このように本発明の文書検索装置の第2の形態では排除語を入力でき、なおかつこの排除語の入力の際、近傍語や近傍語の出現文脈を参照することができるので、ユーザは検索意図に合致した文書を簡単に検索できる。
【0062】
次に、本発明の文書検索装置の第3の形態を説明する。
図9は、本発明の文書検索装置の操作画面の第3の形態を示した図である。
図2に示した入出力装置130には、本発明の文書検索装置100の操作画面30が設けられる。なお、この操作画面30にはキーワード入力部31、キーワード拡張ボタン31a、検索ボタン32、ヒット件数表示部33、結果表示ボタン34、近傍語(前)表示部35a、近傍語(後)表示部35b、近傍範囲設定部36、選択語入力部37a、排除語入力部37b、出現文脈表示部38、メッセージ表示部39が設けられている。
【0063】
ここで、キーワード入力部31、キーワード拡張ボタン31a、検索ボタン32、ヒット件数表示部33、結果表示ボタン34、近傍語(前)表示部35a、近傍語(後)表示部35b、近傍範囲設定部36、出現文脈表示部38及びメッセージ表示部39は、図6に示したキーワード入力部11、キーワード拡張ボタン11a、検索ボタン12、ヒット件数表示部13、結果表示ボタン14、近傍語(前)表示部15a、近傍語(後)表示部15b、近傍範囲設定部16、出現文脈表示部18及びメッセージ表示部19と同一のものであるので、説明を省略する。
【0064】
ここでは図7同様、キーワード「規制」を入力して全文検索を行った後の操作画面30の様子を示している。ユーザは選択語入力部37a及び排除語入力部37bに、選択後(前)及び選択語(後)、排除語(前)及び排除語(後)を入力することができる。
【0065】
図9では、選択語(前)として「炭水化物」及び「排出」を、排除語(前)として「着陸」及び「乗り入れ」を入力した様子を示している。このように選択語及び排除語を入力した後、再度検索ボタン32を選択すると、キーワード「規制」を含んだ文書のうち、近傍語(前)として「炭水化物」もしくは「排出」を含んだ文書であって、「着陸」あるいは「乗り入れ」を含まない文書がヒットとなる。この際、近傍範囲を変更してもよい。
【0066】
このように本発明の文書検索装置の第3の形態では選択語と排除語とを同時に入力でき、なおかつこの入力の際、近傍語や近傍語の出現文脈を参照することができるので、ユーザは検索意図に合致した文書を簡単に検索できる。
【0067】
次に、本発明の文書検索装置の第4の形態を説明する。
図10は、本発明の文書検索装置の操作画面の第4の形態を示した図である。
図2に示した入出力装置130には、本発明の文書検索装置100の操作画面40が設けられる。なお、この操作画面40にはキーワード入力部41、キーワード拡張ボタン41a、検索ボタン42、ヒット件数表示部43、結果表示ボタン44、近傍語(前)表示部45a、近傍語(後)表示部45b、近傍範囲設定部46、優先語入力部47a、排除語入力部47b、出現文脈表示部48、メッセージ表示部49が設けられている。
【0068】
ここで、キーワード入力部41、キーワード拡張ボタン41a、検索ボタン42、ヒット件数表示部43、結果表示ボタン44、近傍語(前)表示部45a、近傍語(後)表示部45b、近傍範囲設定部46、出現文脈表示部48及びメッセージ表示部49は、図6に示したキーワード入力部11、キーワード拡張ボタン11a、検索ボタン12、ヒット件数表示部13、結果表示ボタン14、近傍語(前)表示部15a、近傍語(後)表示部15b、近傍範囲設定部16、出現文脈表示部18及びメッセージ表示部19と同一のものであるので、説明を省略する。
【0069】
ここでは図7同様、キーワード「規制」を入力して全文検索を行った後の操作画面40の様子を示している。ユーザは優先語入力部47a及び排除語入力部47bに、優先語(前)及び優先語(後)、排除語(前)及び排除語(後)を入力することができる。なお、優先語(前)とは、再検索を行う際、近傍語(前)としてこれを含む文書を優先する単語を示す。同様に優先語(後)とは、再検索を行う際、近傍語(後)としてこれを含む文書を優先する単語を示す。
【0070】
図9では、優先語(前)として「炭水化物」及び「排出」を、排除語(前)として「着陸」及び「乗り入れ」を入力した様子を示している。このように優先語及び排除語を入力した後、再度検索ボタン42を押下すると、キーワード「規制」を含んだ文書のうち、近傍語(前)として「着陸」あるいは「乗り入れ」を含まない文書がヒットとなる。そして、結果ボタン44を押下してヒットした文書を閲覧する場合には、近傍語(前)として「炭水化物」や「排出」を含んだ文書が優先的に表示される。なお、再検索の際、近傍範囲を変更してもよい。
【0071】
このように本発明の文書検索装置の第4の形態では優先語と排除語とを同時に入力でき、なおかつこの入力の際、近傍語や近傍語の出現文脈を参照することができるので、ユーザは検索意図に合致した文書を簡単に検索できる。
【0072】
次に、本発明の文書検索装置の第5の形態を説明する。
図11は、本発明の文書検索装置の操作画面の第5の形態を示した図である。
図2に示した入出力装置130には、本発明の文書検索装置100の操作画面50が設けられる。なお、この操作画面50にはキーワード入力部51、キーワード拡張ボタン51a、検索ボタン52、ヒット件数表示部53、結果表示ボタン54、近傍語(前)表示部55a、近傍語(後)表示部55b、近傍範囲設定部56、加点設定部57a、加点増減ボタン57b、しきい値設定部57c、しきい値増減ボタン57d、出現文脈表示部58、メッセージ表示部59が設けられている。
【0073】
ここで、キーワード入力部51、キーワード拡張ボタン51a、検索ボタン52、ヒット件数表示部53、結果表示ボタン54、近傍語(前)表示部55a、近傍語(後)表示部55b、近傍範囲設定部56、出現文脈表示部58及びメッセージ表示部59は、図6に示したキーワード入力部11、キーワード拡張ボタン11a、検索ボタン12、ヒット件数表示部13、結果表示ボタン14、近傍語(前)表示部15a、近傍語(後)表示部15b、近傍範囲設定部16、出現文脈表示部18及びメッセージ表示部19と同一のものであるので、説明を省略する。
【0074】
ここでは図7同様、キーワード「規制」を入力して全文検索を行った後の操作画面50の様子を示している。ユーザは各近傍語に対して加点設定部57aにて加点設定を行うことができる。すなわち、検索意図に合致する近傍語が表示されていた場合には、その近傍語を指定し、加点増減ボタン57bの「+」や「−」を押下することによって、その近傍語に点数を設定することができる。なお、すべての近傍語には初期設定点数として0点が設定されているので、検索意図に合致する近傍語に対しては「+」の点数を、検索意図に合致しない近傍語に対しては「−」の点数を設定すればよい。
【0075】
しきい値設定部57cには、検索の際、文書をヒットとみなすか否かの判断の基とするしきい値を設定することができる。この初期設定値は「+1」であるので、設定を変更したい場合はしきい値増減ボタン57dの「+」や「−」を選択することによって、その値を変更することが可能である。
【0076】
図11では、近傍語(前)の「炭水化物」に加点「+1」を設定している。ここで検索ボタン52を押下すると、各文書にはそれぞれの含む近傍語及びそれらに設定された点数に応じた文書単位での評価点が決定する。そして、その評価点がしきい値「+1」以上の文書がヒットとなる。
【0077】
このように、本発明の文書検索装置の第5の形態では近傍語毎の加点及び検索のヒットを判定するしきい値を設定でき、なおかつこの設定の際、近傍語や近傍語の出現文脈を参照することができるので、ユーザは検索意図に合致した文書を簡単に検索できる。
【0078】
次に、本発明の文書検索装置の第6の形態を説明する。
図12は、本発明の文書検索装置の操作画面の第6の形態の第1段階を示した図である。
【0079】
図2に示した入出力装置130には、本発明の文書検索装置100の第1段階の操作画面60が設けられる。なお、この操作画面60には検索式入力部61、近傍設定ボタン62及び検索ボタン63が設けられている。
【0080】
検索式入力部61には、キーワードを+(論理和)や*(論理積)で接続して生成される検索式を入力することができる。ここで、入力した検索式に含まれるキーワードの1つを指定して近傍設定ボタン62を押下すると、図6〜図11に示したような近傍条件を利用した第2段階の操作画面に移る。但し、この際、操作画面10〜50には、操作画面60へ戻るための「戻る」ボタンが付加されているものとする。検索式に含まれたキーワードに対する近傍条件の設定が終了し、操作画面60に戻ってから検索ボタン63を押下すれば、キーワードに対する近傍条件を満たし、なおかつ検索式を満たす文書を検索することができる。
【0081】
ここでは検索式入力部61に検索式「(大気汚染+公害)*(規制+法律)」を入力し、キーワード「規制」を指定した操作画面の様子を示している。ここで近傍設定ボタン62を押下すれば、キーワード「規制」に対する近傍条件の設定を行うことができる。
【0082】
このように、本発明の文書検索装置の第6の形態では検索式に含まれるキーワードへの近傍条件の設定ができるため、ユーザは検索意図に合致した文書を検索するための検索式を簡単に生成することができる。
【0083】
以上説明したように、本発明の文書検索装置100では一旦キーワードにて全文検索を行った後、キーワードの近傍にある近傍語を抽出するので、ユーザは検索意図をキーワード及び表示された近傍語にて表現した近傍語拘束条件を含んだ近傍条件を入力すれば、この近傍条件に適合した文書が検索できる。また、近傍条件は検索意図に対応して表現できるので、適合率の高い検索結果を少ない工数にて得ることができる。
【0084】
ここで、実際に近傍条件を設定して検索を行う場合の処理について説明する。
図13は、キーワード「ワシントン」にて全文検索を行った結果、候補文書となる文書を示す図である。
【0085】
ここでは、同一文字列であるキーワード「ワシントン」に対して、文書ID−1〜6の文書が検索されている。しかし、文書ID−1〜6において、この「ワシントン」という単語は、銀行名として使用されたり、会議名として使用されたり、地名として使用されたり、大学名として使用されたり、天文台名として使用されたり、人名として使用されたり、と様々な意味を持っている。そこで、このキーワード「ワシントン」に対し近傍範囲「前方1語」「後方1語」で近傍語を抽出してみる。
【0086】
図14は、図13に示した候補文書から抽出した近傍語を示す図である。
図13に示した文書ID−1〜6の文書から近傍語を抽出すると、近傍語(前)としては「1934年」、「22年」、「7月」、「渡米」、「つくる」、「ほか」が、近傍語(後)としては「輸出入」、「会議」、「ロンドン」、「大学」、「天文台」、「ナポレオン」が抽出される。
【0087】
ここで例えば人物「ワシントン」について記載のある文書を検索したい場合、キーワード「ワシントン」の近傍語であって、なおかつ人物に関係する「ナポレオン」を優先的に選択し、人物に関係しない「輸出入」、「会議」、「ロンドン」、「大学」、「天文台」を排除するように近傍語拘束条件を設定すれば、人物「ワシントン」について記載のある文書ID−6が優先的にヒットとなる。
【0088】
このように、本発明の文書検索装置ではキーワードに近傍条件を付加することにより、キーワードだけでは多義性の問題から適合率が低下するような場合にも適合率の高い検索結果を得ることができる。
【0089】
また、本発明の文書検索装置では近傍語の処理のみで適合率の高い検索結果を得ることができるため、文書全体を処理したり文脈を逐次チェックしたりする文書検索に比べ、システム及びユーザにかかる負担を軽くすることができる。
【0090】
さらに、一旦使用した近傍条件をデータベース化して、複数のユーザでこれを使用できるようにすれば、個々のユーザにかかる負担をさらに軽減し、なおかつ適合率を向上させることが可能となる。
【0091】
次に、本発明の文書検索プログラムを記録した記憶媒体について説明する。
本発明の文書検索プログラムを記録した記憶媒体は、記録した文書検索プログラムをコンピュータに実行させることにより、複数の文書から検索意図に合致する文書を検索する。
【0092】
この文書検索プログラムによりコンピュータは、入力されるキーワードを保持し、このキーワードにて文書データベースに保持されている文書データを全文検索し、検索の結果、キーワードを含むと判断された文書データを候補文書として保持し、保持した候補文書を形態素解析し、ユーザに設定される近傍条件に基づくと同時に形態素解析の結果を参照して候補文書から近傍語を抽出し、検索意図に合致する文書を出力する。
【0093】
従って、ユーザは検索意図を反映させた近傍条件及びキーワードを入力すれば、検索意図に適合した文書が検索できる。なお、近傍条件は検索意図に対応して表現できるので、適合率の高い検索結果を少ない工数にて得ることができる。
【0094】
【発明の効果】
以上説明したように、本発明の文書検索装置は、一旦検索キーワードにて全文検索を行った後、検索キーワードの近傍にある近傍語を抽出する構成としたので、ユーザは検索意図を検索キーワード及び近傍語にて表現した近傍語拘束条件を含んだ近傍条件を入力すれば、検索意図に適合した適合文書が検索でき、キーワードの多義性による検索結果の適合率の低下を防ぐとともに、高速な文書検索処理を行うことができる。
【0095】
また、本発明の文書検索プログラムを記録した記憶媒体は、コンピュータを、一旦検索キーワードにて全文検索を行ってから検索キーワードの近傍にある近傍語を抽出するように機能させる構成としたので、ユーザは検索意図を検索キーワード及び近傍語にて表現した近傍語拘束条件を含んだ近傍条件を入力すれば検索意図に適合した適合文書が検索でき、キーワードの多義性による検索結果の適合率の低下を防いだ高速な文書検索処理を行うことができる。
【図面の簡単な説明】
【図1】本発明の文書検索装置の原理構成を示す機能ブロック図である。
【図2】本発明の文書検索装置のハードウェア構成図である。
【図3】本発明の文書検索装置にて文書検索を行う際の処理の手順を示したフローチャートである。
【図4】図3に示した主検索を行う際の処理の手順を示したフローチャートである。
【図5】図3に示したキーワード拡張を行う際の処理の手順を示したフローチャートである。
【図6】本発明の文書検索装置の操作画面の第1の形態を示した図である。
【図7】本発明の文書検索装置の操作画面の第1の形態にて文書検索を実行した場合の、画面の様子を示した図である。
【図8】本発明の文書検索装置の操作画面の第2の形態を示した図である。
【図9】本発明の文書検索装置の操作画面の第3の形態を示した図である。
【図10】本発明の文書検索装置の操作画面の第4の形態を示した図である。
【図11】本発明の文書検索装置の操作画面の第5の形態を示した図である。
【図12】本発明の文書検索装置の操作画面の第6の形態の第1段階を示した図である。
【図13】キーワード「ワシントン」にて全文検索を行った結果、候補文書となる文書を示す図である。
【図14】図13に示した候補文書から抽出した近傍語を示す図である。
【符号の説明】
1 文書データベース
2 文書検索装置
2a キーワード保持手段
2b 検索手段
2c 候補文書保持手段
2d 候補文書解析手段
2e 近傍語抽出手段
2f 近傍条件保持手段
2g 適合判断手段

Claims (7)

  1. 複数の文書から検索意図に合致する文書を検索する文書検索装置において、
    入力される検索キーワードを保持するキーワード保持手段と、
    前記複数の文書から前記検索キーワードを含む文書のみを抽出し、候補文書として出力する検索手段と、
    前記候補文書を保持する候補文書保持手段と、
    前記候補文書を形態素解析する候補文書解析手段と、
    前記検索キーワードの前方から抽出する前方単語数と後方から抽出する後方単語数とが個別に入力されることによって近傍範囲が予め指定され、前記候補文書中において、前記検索キーワードから前方に数えて前記前方単語数内に位置する近傍語と、前記検索キーワードから後方に数えて前記後方単語数内に位置する前記近傍語とを抽出する近傍語抽出手段と、
    前記近傍語から少なくとも一つの選択語の指定、及び前記選択語と前記候補文書との関係を示す近傍語拘束条件の指定を含む近傍条件の入力を受け付ける近傍条件入力手段と、
    前記検索キーワード及び前記近傍条件入力手段が受け付けた前記近傍条件を保持する近傍条件保持手段と、
    形態素解析された前記候補文書が前記近傍条件に適合するか否か判断し、適合する前記候補文書を適合文書として出力する適合判断手段と、
    を有することを特徴とする文書検索装置。
  2. 前記近傍条件入力手段は、前記近傍語拘束条件として前記近傍範囲内に含まれてはならない排除語の指定入力を受け付けることを特徴とする請求項1記載の文書検索装置。
  3. 前記近傍条件入力手段は、前記近傍語拘束条件として前記近傍範囲内に含まれるべき選択語の指定入力を受け付けることを特徴とする請求項1記載の文書検索装置。
  4. 前記近傍条件入力手段は、前記近傍語拘束条件として前記近傍範囲内にこれが含まれていた場合には前記候補文書を優先文書とする優先語の指定入力を受け付け、前記適合判断手段は、前記優先文書を優先的に適合と判断することを特徴とする請求項1記載の文書検索装置。
  5. 前記近傍条件入力手段は、前記近傍条件として前記検索キーワードに対する前記近傍範囲の設定、前記近傍範囲内に存在した場合に前記候補文書に対する評価点に加算すべき点数を有する前記近傍語の指定及び閾値の設定入力を受け付け、前記適合判断手段は、前記候補文書の評価点が前記閾値以上となった場合に前記候補文書が前記近傍条件に適合すると判断することを特徴とする請求項1記載の文書検索装置。
  6. 複数の文書から検索意図に合致する文書を検索する文書検索装置において、
    論理演算子及び検索キーワードを含んで構成される検索式を保持する検索式保持手段と、
    前記複数の文書から前記検索式を満たす文書のみを抽出し、候補文書として出力する検索手段と、
    前記候補文書を保持する候補文書保持手段と、
    前記候補文書を形態素解析する候補文書解析手段と、
    前記検索キーワードの前方から抽出する前方単語数と後方から抽出する後方単語数とが個別に入力されることによって近傍範囲が予め指定され、前記候補文書中において、前記検索キーワードから前方に数えて前記前方単語数内に位置する近傍語と、前記検索キーワードから後方に数えて前記後方単語数内に位置する前記近傍語とを抽出する近傍語抽出手段と、
    前記近傍語から少なくとも一つの選択語の指定、及び前記選択語と前記候補文書との関係を示す近傍語拘束条件の指定を含む近傍条件の入力を受け付ける近傍条件入力手段と、
    前記検索キーワード及び前記近傍条件入力手段が受け付けた前記近傍条件を保持する近傍条件保持手段と、
    形態素解析された前記候補文書が前記近傍条件に適合するか否か判断し、適合する前記候補文書を適合文書として出力する適合判断手段と、
    を有することを特徴とする文書検索装置。
  7. 複数の文書から検索意図に合致する文書を検索する文書検索プログラムを記録した記憶媒体において、コンピュータを、
    入力される検索キーワードを保持するキーワード保持手段、
    前記複数の文書から前記検索キーワードを含む文書のみを抽出し、候補文書として出力する検索手段、
    前記候補文書を保持する候補文書保持手段、
    前記候補文書を形態素解析する候補文書解析手段、
    前記検索キーワードの前方から抽出する前方単語数と後方から抽出する後方単語数とが個別に入力されることによって近傍範囲が予め指定され、前記候補文書中において、前記検索キーワードから前方に数えて前記前方単語数内に位置する近傍語と、前記検索キーワードから後方に数えて前記後方単語数内に位置する前記近傍語とを抽出する近傍語抽出手段、
    前記近傍語から少なくとも一つの選択語の指定、及び前記選択語と前記候補文書との関係を示す近傍語拘束条件の指定を含む近傍条件の入力を受け付ける近傍条件入力手段、
    前記検索キーワード及び前記近傍条件入力手段が受け付けた前記近傍条件を保持する近傍条件保持手段、
    形態素解析された前記候補文書が前記近傍条件に適合するか否か判断し、適合する前記候補文書を適合文書として出力する適合判断手段、
    として機能させるための文書検索プログラムを記録したことを特徴とする記憶媒体。
JP14625897A 1997-06-04 1997-06-04 文書検索装置及び文書検索プログラムを記録した記憶媒体 Expired - Fee Related JP3627445B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP14625897A JP3627445B2 (ja) 1997-06-04 1997-06-04 文書検索装置及び文書検索プログラムを記録した記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP14625897A JP3627445B2 (ja) 1997-06-04 1997-06-04 文書検索装置及び文書検索プログラムを記録した記憶媒体

Publications (2)

Publication Number Publication Date
JPH10334114A JPH10334114A (ja) 1998-12-18
JP3627445B2 true JP3627445B2 (ja) 2005-03-09

Family

ID=15403679

Family Applications (1)

Application Number Title Priority Date Filing Date
JP14625897A Expired - Fee Related JP3627445B2 (ja) 1997-06-04 1997-06-04 文書検索装置及び文書検索プログラムを記録した記憶媒体

Country Status (1)

Country Link
JP (1) JP3627445B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4769379B2 (ja) * 2001-07-11 2011-09-07 株式会社リコー 文書検索装置
JP5499835B2 (ja) * 2010-03-30 2014-05-21 富士通株式会社 医療介護インシデント情報管理プログラム、該装置及び該方法
JP5921379B2 (ja) 2012-08-10 2016-05-24 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation テキスト処理方法、システム及びコンピュータ・プログラム。

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3099298B2 (ja) * 1991-03-20 2000-10-16 株式会社日立製作所 文書検索方法および装置
US5278980A (en) * 1991-08-16 1994-01-11 Xerox Corporation Iterative technique for phrase query formation and an information retrieval system employing same

Also Published As

Publication number Publication date
JPH10334114A (ja) 1998-12-18

Similar Documents

Publication Publication Date Title
JP3577819B2 (ja) 情報探索装置及び情報探索方法
JP3691844B2 (ja) 文書処理方法
US6446081B1 (en) Data input and retrieval apparatus
US8370352B2 (en) Contextual searching of electronic records and visual rule construction
JP5550669B2 (ja) 検索装置、検索方法およびプログラム
US20140324808A1 (en) Semantic Segmentation and Tagging and Advanced User Interface to Improve Patent Search and Analysis
KR101723862B1 (ko) 텍스트를 포함하는 문서 분류 및 분석 방법 및 이를 수행하는 문서 분류 및 분석 장치
US5761666A (en) Document retrieval system
JP2004157981A (ja) 要約表現装置
JP2004326216A (ja) 文書検索装置、方法、プログラム、及び記録媒体
US20130254190A1 (en) Search device, search method, and computer program product
US20180246896A1 (en) Corpus Specific Generative Query Completion Assistant
JP3178421B2 (ja) テキスト検索装置及びテキスト検索プログラムを記録したコンピュータ読み取り可能な記録媒体
JP3356519B2 (ja) 文書情報検索装置
JP3385297B2 (ja) 文書の自動分類方法、および情報空間の可視化方法、ならびに情報検索システム
JP2003162531A (ja) 文書検索システムおよび文書検索方法
US20060248037A1 (en) Annotation of inverted list text indexes using search queries
JP3627445B2 (ja) 文書検索装置及び文書検索プログラムを記録した記憶媒体
KR101835994B1 (ko) 키워드 맵을 이용한 전자책 검색 서비스 제공 방법 및 장치
JP4378106B2 (ja) 文書検索装置、文書検索方法及びプログラム
JP4452527B2 (ja) 文書検索装置、文書検索方法、および文書検索プログラム
JPH03132872A (ja) 索引情報生成装置
JP2003099429A (ja) 用語集生成装置及び用語集生成プログラム並びに用語集検索装置
JPH11296528A (ja) ブラウジング検索装置及び記録媒体
JPH1145238A (ja) 文書管理システムおよびそのシステムとしてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040511

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040712

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040810

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040929

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20041004

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20041116

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20041129

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees