JP2005018617A - 文書検索装置 - Google Patents
文書検索装置 Download PDFInfo
- Publication number
- JP2005018617A JP2005018617A JP2003185358A JP2003185358A JP2005018617A JP 2005018617 A JP2005018617 A JP 2005018617A JP 2003185358 A JP2003185358 A JP 2003185358A JP 2003185358 A JP2003185358 A JP 2003185358A JP 2005018617 A JP2005018617 A JP 2005018617A
- Authority
- JP
- Japan
- Prior art keywords
- document
- search
- keyword list
- score
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】文書検索装置は、文書データ蓄積部2と、複数の文書を文書データとして文書データ蓄積部2に格納する文書データ格納部1と、ユーザからの検索要求を入力する検索要求入力部3と、検索要求入力部3から入力された検索要求に応じて文書データ蓄積部1に格納されている文書データから適切な文書を検索する文書検索部4と、複数の単語を含む個人キーワードリストを格納する個人キーワードリスト格納部8と、文書検索部4により検索された文書のスコア付与対象の単語に対し、前記個人キーワードリストの単語群に含まれる単語の出現数または出現の有無に応じたスコアを付与するスコア付与部5と、を備えたことを特徴とする。
【選択図】 図1
Description
【発明の属する技術分野】
本発明は、文書検索技術、より詳細にはユーザ独自の検索観点を加味し、文書検索の精度を向上させることが可能な文書検索装置に関する。特に、図書館の蔵書検索や、インターネット文書検索エンジン、社内の報告書管理システムなどに有用である。
【0002】
【従来の技術】
大量の文書が格納された文書データベースから文書を検索する場合、検索漏れを防ぐためにできるだけ広い範囲の検索を行うと、逆に無関係な文書が検索結果に混入する可能性が高くなる。これを解決するために、文書群に対してなんらかの方法でスコアを付与し、最も適切でありそうなものから順に検索する技術がある。しかしながら、検索意図の具現化したものとしての検索要求(単語あるいは文章)が小規模なもの(例えば1単語だけ)である場合、そもそもスコア付与のヒントとなる情報が少ないため、検索要求だけではユーザの検索意図を十分に反映したものとならないという問題があった。
【0003】
この問題を解決するために、インターネット上の検索エンジンであるgoogle(R)などでは、インターネット上に公開されたその文書への参照数をヒントとして追加し、「より多くのユーザに参照されている文書にいろいろな意図の検索について有効な情報が含まれている」と仮定してスコアを付与し、これを参照した検索が行われている。しかしながら、やはり検索意図によっては、必然的に古い情報(多く参照されやすい)が検索結果の上位になってしまうため、必ずしも参照数の多い文書が有効であるとは限らない。
【0004】
そこで、かかる問題を解決するために、さらにキーワードからなる検索要件の他に何らかの検索観点を加味して検索を実行する技術が提案されている(例えば、下記特許文献1〜4を参照。)。
【0005】
【特許文献1】
特開平10−49549号公報
【特許文献2】
特開2001−134588号公報
【特許文献3】
特開2002−269132号公報
【特許文献4】
特開2002−334107号公報
【0006】
【発明が解決しようとする課題】
上記各特許文献に記載の技術は、例えば、文書データベース上に、あらかじめ種々の検索観点に沿った文書ごとの評価値を格納し、検索時にはその検索観点をユーザが選択することによってユーザの検索意図に沿った検索ができるようにしている。しかしながら、これらの技術でもあらかじめ設定されていた検索観点に基づいた検索しか行うことができず、必ずしもユーザの検索観点を忠実に反映した検索が実現できるわけではないという問題点が残る。
【0007】
本発明は、上記のような従来技術の有する問題点に鑑みてなされたものであり、その目的は、ユーザごとの検索観点を忠実に反映した、検索漏れのない文書検索が可能な文書検索装置を提供することにある。
【0008】
【課題を解決するための手段】
上記目的を達成するため、本発明の請求項1にかかる文書検索装置は、文書データ蓄積手段と、複数の文書を文書データとして前記文書データ蓄積手段に格納する文書データ格納手段と、ユーザからの検索要求を入力する検索要求入力手段と、前記検索要求入力手段から入力された検索要求に応じて前記文書データ蓄積手段に格納されている文書データから適切な文書を検索する文書検索手段と、複数の単語セットを含む個人キーワードリストを格納する個人キーワードリスト格納手段と、前記文書検索手段により検索された文書に対し、前記検索要求に含まれる単語および前記個人キーワードリストに含まれている単語セットの出現数または出現の有無に応じたスコアを付与するスコア付与手段と、を備えたことを特徴とする。
【0009】
この請求項1に記載の発明によれば、個人キーワードリストを保持し、これをスコア計算に用いることによって、ユーザごとの観点の違いを反映した文書検索を実現することができる。
【0010】
また、請求項2にかかる文書検索装置は、請求項1に記載の発明において、前記個人キーワードリストに含まれている単語セットは、各単語セットごとに正あるいは負の重みが付与されており、前記スコア付与手段は、前記個人キーワードリストに含まれている各単語セットごとの前記重みを勘案して、前記文書検索手段により検索された文書に対してスコアを付与することを特徴とする。
【0011】
この請求項2に記載の発明によれば、各ユーザの観点を単語の有無ではなく、さらに単語セットごとの正負の重みで表現することにより、より細やかな観点を反映させた文書検索を行うことができる。特に単語の有無だけでは表現できない、負の観点の表す要素を加味した検索が可能になる。
【0012】
また、請求項3にかかる文書検索装置は、請求項2に記載の発明において、前記検索要求中に、前記個人キーワードリストに含まれている単語セットが存在する場合には、前記スコア付与手段はスコアを上げる効果の高い単語セットのみを選択してスコアを付与することを特徴とする。
【0013】
この請求項3に記載の発明によれば、実際の検索時に発生する可能性の高い、検索語と個人キーワードリストの単語セットの重複について、矛盾を最小にしつつ検索することができる。例えば、負の観点が付与されている個人キーワードリスト中の単語セットであっても、検索語として出現している場合には正の観点での評価が必要であり、単に検索語として挙げられている単語であっても個人キーワードリスト中では大きな重みが付いている場合には、より選択されやすいことを示しているため、高いスコアを与えるべきである。
【0014】
また、請求項4にかかる文書検索装置は、請求項2または3に記載の発明において、前記文書検索手段が検出した文書のうちユーザが選択した文書群を取得するユーザ選択文書取得手段と、該ユーザ選択文書取得手段により取得された文書群と、前記文書データ蓄積手段に格納されている全文書を用いて、候補となる重み付き単語群によって全文書をスコア計算した際に出力される順位が、選択した文書群を上位とした順位と最も差異が少なくなるように単語およびその重みを選択し、これを新たな個人キーワードリストとして前記個人キーワードリスト格納手段に格納するキーワード取得手段と、を備えたことを特徴とする。
【0015】
この請求項4に記載の発明によれば、ユーザごとの検索観点を反映させて個人キーワードリストを作成・更新し、この個人キーワードリストを基にした文書検索を行うことで、よりユーザの検索観点を反映した検索漏れのない文書検索が可能になる。
【0016】
また、請求項5にかかる文書検索装置は、請求項4に記載の発明において、前記文書データは書籍情報であり、前記ユーザ選択文書取得手段は、ユーザごとの書籍貸出情報からユーザが選択した書籍群を取得することを特徴とする。
【0017】
この請求項5に記載の発明によれば、ユーザごとの検索観点を反映させて個人キーワードリストを作成・更新し、この個人キーワードリストを基にした書籍(例えば、図書館の所蔵する書籍など)検索を行うことで、よりユーザの検索観点を反映した検索漏れのない書籍検索が可能になる。
【0018】
また、請求項6にかかる文書検索装置は、請求項5に記載の発明において、前記個人キーワードリストに含まれる単語群は、各書籍のキーワード情報およびタイトル情報であることを特徴とする。
【0019】
この請求項6に記載の発明によれば、検索対象が書籍情報である場合の、検索および個人キーワードリストの作成に用いる具体的な情報に既に管理されている各書籍のキーワード情報およびタイトル情報を用いることにより、システム構築の簡易化が図れる。
【0020】
また、請求項7にかかる文書検索装置は、請求項6に記載の発明において、前記各書籍のキーワード情報およびタイトル情報は、書籍コードまたは該書籍コードを用いたインターネット検索により取得することを特徴とする。
【0021】
この請求項7に記載の発明によれば、検索対象が書籍情報である場合の、検索および個人キーワードリストの作成に用いる具体的な情報にインターネット上に存在する情報を用いることにより、システム構築の簡易化が図れる。
【0022】
【発明の実施の形態】
以下に添付図面を参照して、本発明の好適な実施の形態を詳細に説明する。図1は、本発明の文書検索装置の概略構成を示すブロック図である。この文書検索装置は、文書データ格納部1、文書データ蓄積部2、検索要求入力部3、文書検索部4、スコア付与部5、ユーザ選択文書取得部6、キーワード取得部7、および個人キーワードリスト格納部8により構成される。
【0023】
ここでは、ある図書館が所蔵する図書を検索する場合を例にとって説明する。文書データ格納部1は、図書館があらかじめ作成した所蔵する書籍情報(文書データ)を受け取り、これを文書データ蓄積部2に蓄積する。文書データ蓄積部2は、前記文書データを蓄積したデータベースである。検索要求入力部3は、ユーザから入力された検索すべき単語群あるいは文章を、文書検索部4で処理できるような所定の単語リスト形式に変形し、これを検索要求として文書検索部4に送る。文書検索部4は、検索要求を受け取り文書データ蓄積部2に対して前記単語リストに記述された単語のすべてまたはそれらのうちのいずれかを含むことを条件に検索を実行し、検索された文書群をスコア付与部5に送る。
【0024】
今、検索要求として「ローマ」、「ガイド」が文書検索部4に入力されたとする。文書検索部4は、書籍情報を検索し、図2に示す検索結果をスコア付与部5に送る。なお、図2に示した検索結果のうち、概要情報はインターネットを通じて所定の書籍コードに基づき取得されたものである。スコア付与部5では、「ローマ」、「ガイド」なる検索要求と、図3に示す個人キーワードリストを用いて、図2に示した検索結果にスコアを付与する。
【0025】
スコア付与の方法は種々あるが、本発明では、「単語の重み×ヒット数の累計」による。図2に示した書籍のタイトル情報、キーワード情報、概要情報を用いて、例えば「ローマ・フィレンツェ・・・」なる書籍は、図4に示すようなスコア計算を行う(具体的な計算方法については後述する)。図4では、記載された単語セットのみがヒットしたものとしている。
【0026】
ユーザ選択文書取得部6は、ユーザが希望する書籍情報を調べ、ユーザの希望書籍情報が更新された場合、キーワード取得部7に新規に追加されたユーザ選択書籍を通知する。キーワード取得部7は、ユーザが選択した書籍と、文書データ蓄積部2(データベース)に蓄積されている図書館の所蔵する書籍情報を用いて、個人キーワードリストの更新を行い、更新された個人キーワードを個人キーワードリスト格納部8に蓄積する。
【0027】
以下、個人キーワードの更新手順について説明する。図5は、この個人キーワードの更新手順を示すフローチャートである。まず、キーワード取得部7は、貸し出された書籍のタイトル情報、キーワード情報、概要情報を単語に分割する(ステップS501)。次に、ステップS501で分割された異なり単語の1つを選択し、この単語に重みw−1.0を設定する(ステップS502)。そしてこれをすでに存在する個人キーワードリストとあわせてスコア付与部5に送り、全書籍(全文書)のスコアリング結果を得る(ステップS503)。
【0028】
この結果、全書籍に順位が付加されるが、その結果のスコア順位と、貸し出した本をすべて1位、その他はすべてN位(Nは全冊数)とした選択順位とを比較し、実順位との二乗誤差(Σ(スコア順位−選択順位)^2)を求める(ステップS504)。そして、ここで求めた値が最小になるか否かを判断する(ステップS505)。実順位との二乗誤差が最小である場合は(ステップS505:Yes)、実順位との二乗誤差を求めた単語セットとこの誤差値を記憶した後(ステップS506)、ステップS507へ進む。実順位との二乗誤差が最小でない(ステップS505:No)場合は、そのままステップS507へ進む。
【0029】
ステップS502で設定した重み(w)に対してさらに0.2を加算する(ステップS507)。重みw<1.0であるか否かを判断する(ステップS508)。重みw<1.0である場合は(ステップS508:Yes)、再度ステップS503へ戻り処理を続行する。重みw<1.0でない場合は(ステップS508:No)、検索対象となる単語の残りがあるか否かを判断する(ステップS509)。検索対象となる単語の残りがある場合は(ステップS509:Yes)、再度ステップS502へ戻り処理を続行する。検索対象となる単語の残りがない場合は(ステップS509:No)、ステップS510へ進む。
【0030】
続いて、先にステップS501で分割された異なり単語の2つを選択し、この単語に重みw−1.0を設定する(ステップS510)。そしてこれらをすでに存在する個人キーワードリストとあわせてスコア付与部5に送り、全書籍(全文書)のスコアリング結果を得る(ステップS511)。
【0031】
この結果、全書籍に順位が付加されるが、その結果のスコア順位と、貸し出した本をすべて1位、その他はすべてN位(Nは全冊数)とした選択順位とを比較し、実順位との二乗誤差(Σ(スコア順位−選択順位)^2)を求める(ステップS512)。そして、ここで求めた値が最小となるか否かを判断する(ステップS513)。実順位との二乗誤差が最小である場合は(ステップS513:Yes)、実順位との二乗誤差を求めた単語セットとこの誤差値を記憶した後(ステップS514)、ステップS515へ進む。実順位との二乗誤差が最小でない場合は(ステップS513:No)、そのままステップS515へ進む。
【0032】
ステップS510で設定した重み(w)に対してさらに0.2を加算する(ステップS515)。重みw<1.0であるか否かを判断する(ステップS516)。重みw<1.0である場合は(ステップS516:Yes)、再度ステップS511へ戻り処理を続行する。重みw<1.0でない場合は(ステップS516:No)、さらなる検索対象となる単語があるか否かを判断する(ステップS517)。検索対象となる単語の残りがある場合は(ステップS517:Yes)、再度ステップS510へ戻り処理を続行する。検索対象となる単語の残りがない場合は(ステップS517:No)、ステップS518へ進む。
【0033】
次に、実順位との二乗誤差が最小となった単語セット内の対象単語がすでに個人キーワードリストに存在するか否かを判断する(ステップS518)。実順位との二乗誤差が最小となった単語セット内の対象単語がすでに個人キーワードリストに存在する場合は(ステップS518:Yes)、個人キーワードリスト内の当該単語セットの重み(w)を更新し(ステップS519)、処理終了となる。一方、実順位との二乗誤差が最小となった単語セット内の対象単語が個人キーワードリストに存在しない場合は(ステップS518:No)、個人キーワードリストに当該単語セットを追加し(ステップS520)、処理終了となる。
【0034】
このように、本発明では、貸し出された書籍のタイトル情報、キーワード情報、概要情報を単語に分割する。そして、まず、単語群のなかの1つの単語を選択して、−1.0から0.2ずつを加算した重みを1.0になるまで設定する。残りの単語についても−1.0に0.2ずつ加えた値の重みを1.0になるまで設定し、実順位との二重誤差が最も小さくなる単語と重みのペアを選択する。同様に2単語のキーワード候補について調べるために、個々の異なり単語の組み合わせすべてについて−1.0から1.0までの重みを調べ、この結果が1単語の結果よりもよければ、1単語の結果を却下し、2単語のセットと重みのペアを採用する。採用された単語セットが、すでに個人キーワードリストに存在しているものであればその重みの値のみを置き換え、個人キーワードリストに存在していなければ、当該単語セットを個人キーワードリストに追加する。
【0035】
以下、具体例を示しながら説明する。例えば、「ローマ・フィレンツェ・・・」の単語セットを個人キーワードリストに追加しようとする場合、まず、タイトル、キーワード、概要をそれぞれ単語ごとに分割し、それぞれについて−1.0〜1.0までの重みを考え、それらを個別の検討ケースとして一覧にする。この際、連続する2単語についても「紐/解き」などのように、一覧に追加しておく。これを図6に示す。
【0036】
個々の検討ケースごとに、「単語セット,重み」のペアが存在するが、これを既存の個人キーワードリストの上に上書きする(個人キーワードリストに当該単語セットが存在すれば重みを更新、存在しなければ追加)。この個人キーワードリストを用いて文書データベース中の全文書にスコアを付与する。このスコアは、検討ケースごとに異なってくるが、これを示したものが図7である。
【0037】
スコアの付与結果に基づいて全文書をランキングし、実順位との二乗誤差「(Σ(スコア順位−選択順位)^2」を計算する。これを検討ケースごとに示したものが図8である。この結果、最も小さな値を示す検討ケースが、追加あるいは上書きすべき単語セットとその重みのペアとなる。
【0038】
この結果を踏まえて、図3に示した個人キーワードリストが、書籍貸出情報の更新をトリガとして更新される。この結果、図8に示したような「検討ケース−二乗誤差のリスト」が求まったとし、ケース11が最小のものであるとする。すると、図6より、単語「ローマ」に1.0なる重みを付与したものが、個人キーワードリストに追加される。最終的には、個人キーワードリストは図9のようになる。そして、次回の検索実行時には、図9の個人キーワードリストを使うことにより、特にユーザからの指定がなくとも、「ローマ」なる単語を含む文書が高いスコアを付与されるようになる。
【0039】
以上説明したように、本発明によれば、ユーザごとの検索観点を反映させて個人キーワードリストを更新し、これをスコアリングに用いることによって、ユーザごとの検索観点の違いを忠実に反映させたより細やかな文書検索が可能になる。この結果、検索漏れが防止でき、精度の高い文書検索が実現できる。また、個人キーワードリストの作成の基になる具体的情報に、既に管理されている情報はもとよりインターネット上に存在する情報も用いることができるため、システム構築が簡易である。
【0040】
以上、本発明の一実施形態を図面に沿って説明した。しかしながら本発明はこの実施の形態に示した事項に限定されず、特許請求の範囲の記載に基づいてその変更、改良等が可能である。例えば、図書館に所蔵されている書籍検索の他、各種データベースなどに蓄積されているデータ検索などにも適用可能である。
【0041】
【発明の効果】
上述にように、本発明の文書検索装置は、ユーザごとの検索観点を忠実に反映した、検索漏れのない文書検索が可能になるという効果を奏する。
【図面の簡単な説明】
【図1】本発明の文書検索装置の概略構成を示すブロック図である。
【図2】検索条件の一例の一覧表を示す図である。
【図3】個人キーワードリストの一例の一覧表を示す図である。
【図4】スコア計算の結果を示す図表である。
【図5】個人キーワードの更新手順を示すフローチャートである。
【図6】個人キーワードに新たに追加しようとする単語セットの一例を示す図表である。
【図7】検討する単語セットのケースごとのスコア計算結果を示す一覧表を示す図である。
【図8】検討する単語セットのケースごとの実順位との二重誤差の値を示す一覧表を示す図である。
【図9】更新後の個人キーワードリストの一例の一覧表を示す図である。
【符号の説明】
1 文書データ格納部
2 文書データ蓄積部
3 検索要求入力部
4 文書検索部
5 スコア付与部
6 ユーザ選択文書取得部
7 キーワード取得部
8 個人キーワードリスト格納部
Claims (7)
- 文書データ蓄積手段と、
複数の文書を文書データとして前記文書データ蓄積手段に格納する文書データ格納手段と、
ユーザからの検索要求を入力する検索要求入力手段と、
前記検索要求入力手段から入力された検索要求に応じて前記文書データ蓄積手段に格納されている文書データから適切な文書を検索する文書検索手段と、
複数の単語セットを含む個人キーワードリストを格納する個人キーワードリスト格納手段と、
前記文書検索手段により検索された文書に対し、前記検索要求に含まれる単語および前記個人キーワードリストに含まれている単語セットの出現数または出現の有無に応じたスコアを付与するスコア付与手段と、を備えたことを特徴とする文書検索装置。 - 前記個人キーワードリストに含まれている単語セットは、各単語セットごとに正あるいは負の重みが付与されており、
前記スコア付与手段は、前記個人キーワードリストに含まれている各単語セットごとの前記重みを勘案して、前記文書検索手段により検索された文書に対してスコアを付与することを特徴とする請求項1に記載の文書検索装置。 - 前記検索要求中に、前記個人キーワードリストに含まれている単語セットが存在する場合には、前記スコア付与手段はスコアを上げる効果の高い単語セットのみを選択してスコアを付与することを特徴とする請求項2に記載の文書検索装置。
- 前記文書検索手段が検出した文書のうちユーザが選択した文書群を取得するユーザ選択文書取得手段と、
該ユーザ選択文書取得手段により取得された文書群と、前記文書データ蓄積手段に格納されている全文書を用いて、候補となる重み付き単語群によって全文書をスコア計算した際に出力される順位が、選択した文書群を上位とした順位と最も差異が少なくなるように単語およびその重みを選択し、これを新たな個人キーワードリストとして前記個人キーワードリスト格納手段に格納するキーワード取得手段と、を備えたことを特徴とする請求項2または3に記載の文書検索装置。 - 前記文書データは書籍情報であり、前記ユーザ選択文書取得手段は、ユーザごとの書籍貸出情報からユーザが選択した書籍群を取得することを特徴とする請求項4に記載の文書検索装置。
- 前記個人キーワードリストに含まれる単語群は、各書籍のキーワード情報およびタイトル情報であることを特徴とする請求項5に記載の文書検索装置。
- 前記各書籍のキーワード情報およびタイトル情報は、書籍コードまたは該書籍コードを用いたインターネット検索により取得することを特徴とする請求項6に記載の文書検索装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003185358A JP2005018617A (ja) | 2003-06-27 | 2003-06-27 | 文書検索装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003185358A JP2005018617A (ja) | 2003-06-27 | 2003-06-27 | 文書検索装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005018617A true JP2005018617A (ja) | 2005-01-20 |
Family
ID=34184845
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003185358A Pending JP2005018617A (ja) | 2003-06-27 | 2003-06-27 | 文書検索装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005018617A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10113781B2 (en) | 2011-03-04 | 2018-10-30 | Brooks Automation, Inc. | Helium management control system |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001117937A (ja) * | 1999-10-20 | 2001-04-27 | Hitachi Ltd | 文書検索方法および装置 |
JP2002007461A (ja) * | 2000-06-21 | 2002-01-11 | Nippon Telegr & Teleph Corp <Ntt> | 個人向け情報収集サーバ、個人向け情報収集方法および記録媒体 |
JP2002108924A (ja) * | 2000-09-29 | 2002-04-12 | Dainippon Printing Co Ltd | 情報選択装置とその方法および情報提供装置 |
-
2003
- 2003-06-27 JP JP2003185358A patent/JP2005018617A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001117937A (ja) * | 1999-10-20 | 2001-04-27 | Hitachi Ltd | 文書検索方法および装置 |
JP2002007461A (ja) * | 2000-06-21 | 2002-01-11 | Nippon Telegr & Teleph Corp <Ntt> | 個人向け情報収集サーバ、個人向け情報収集方法および記録媒体 |
JP2002108924A (ja) * | 2000-09-29 | 2002-04-12 | Dainippon Printing Co Ltd | 情報選択装置とその方法および情報提供装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10113781B2 (en) | 2011-03-04 | 2018-10-30 | Brooks Automation, Inc. | Helium management control system |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9165033B1 (en) | Efficient query rewriting | |
US8027974B2 (en) | Method and system for URL autocompletion using ranked results | |
CN102542052B (zh) | 优先散列索引 | |
JP5243167B2 (ja) | 情報検索システム | |
KR100944744B1 (ko) | 원하는 레포지토리의 결정 | |
KR100493688B1 (ko) | 키워드확장장치 및 방법과 키워드확장장치를 이용한검색시스템 | |
JP2008102765A (ja) | 検索処理方法及び検索システム | |
JP2009525520A (ja) | 検索結果リストにおける電子文書を関連性に基づきランク付けおよびソートする評価方法、およびデータベース検索エンジン | |
JP2007515721A (ja) | ドキュメント拡張方法 | |
EP1910943A1 (en) | Method and apparatus for constructing a link structure between documents | |
US11573989B2 (en) | Corpus specific generative query completion assistant | |
CN108475266A (zh) | 用来移除匹配文档的匹配修复 | |
JP4237813B2 (ja) | 構造化文書管理システム | |
US20120124060A1 (en) | Method and system of identifying adjacency data, method and system of generating a dataset for mapping adjacency data, and an adjacency data set | |
JP2009122940A (ja) | 文書関連度算出システム、文書関連度算出方法および文書関連度算出プログラム | |
JP2008117351A (ja) | 検索システム | |
JP2006178599A (ja) | 文書検索装置および方法 | |
JP4824070B2 (ja) | クリックログを利用して専門検索用クローラのシード選択を行う検索処理装置、検索処理方法及びプログラム | |
JP4606548B2 (ja) | 検索システムのメンテナンス方法及び検索システム | |
JP2005018617A (ja) | 文書検索装置 | |
JP2009093581A (ja) | 類義語検索管理システム | |
JP2011108242A (ja) | 利用者の要求に応じて動的にもっとも適したイメージを抽出して提供するための方法、システム及びコンピューター判読可能な記録媒体 | |
JP5303500B2 (ja) | 文書検索装置及び方法及びプログラム | |
US20130091166A1 (en) | Method and apparatus for indexing information using an extended lexicon | |
JP2008234204A (ja) | 文書検索装置、文書検索方法および文書検索プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060510 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090407 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090525 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20090730 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20090915 |