JP2004258832A - 文書検索システムおよび文書検索方法 - Google Patents
文書検索システムおよび文書検索方法 Download PDFInfo
- Publication number
- JP2004258832A JP2004258832A JP2003046799A JP2003046799A JP2004258832A JP 2004258832 A JP2004258832 A JP 2004258832A JP 2003046799 A JP2003046799 A JP 2003046799A JP 2003046799 A JP2003046799 A JP 2003046799A JP 2004258832 A JP2004258832 A JP 2004258832A
- Authority
- JP
- Japan
- Prior art keywords
- document
- search
- condition data
- unit
- acquisition condition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】予め定められた取得条件に基づき外部のシステムから文書を取得する文書検索システムにおいて、取得した文書を対象に検索を行い、検索結果の中に適合文書がなかったときに外部の文書検索システムを利用して文書検索を行い、外部の文書検索システムに適合文書があったときに、その適合文書を取得できるように取得条件を拡張する学習手段を備えたことを特徴とする。
【選択図】 図2
Description
【発明の属する技術分野】
本発明はキーワード検索など検索機能が限られた文書データベースから文書を取得し、取得した文書に対して自然言語検索など高度な検索機能を提供する文書検索システムに関する。
【0002】
【従来の技術】
近年、電子化された文書の増大に伴い、自然言語処理技術を用いて精度の高い検索機能に重点を置いた文書検索システムが登場している。(株)東芝KnowledgeMeister(TM)(非特許文献1)などの文書検索システムでは電子化文書のテキスト部分だけに着目し、全文検索や質問文を受け付ける自然言語検索などの検索機能が実現されている。
【0003】
また、文書検索システムの中には外部のシステムから文書を取得し、検索対象に加える機能を備えたものがある。例えば、インターネットの指定したウェブサイトからウェブ文書や、イントラネットで接続したリレーショナルデータベースやグループウェアの文書データベースの文書を取得し、その検索機能を用いて検索できるようにする。なお、この場合、ウェブサイトも文書検索システムからは文書データベースの一種と見なすことができる。
【0004】
しかし、この機能では当然のことながら、事前に取得範囲に指定されたウェブサイトや文書データベースの文書だけが検索でき、適合文書が取得範囲からもれていたときには対処できない。
【0005】
【非特許文献1】
(株)東芝、ナレッジマイスター(KnowledgeMeister)、[online]、平成14年10月10日、[平成15年1月30日検索]、インターネット<URL:http://km.toshiba.co.jp/>
【0006】
【発明が解決しようとする課題】
上記のように適合文書が取得範囲外にあった場合に、外部の検索機能を利用して適合文書を検索し、かつ、次回の文書情報取得時にはその適合文書も含まれるように、取得条件を検索ニーズに合わせて修正できる文書検索システムを提供することを目的とする。
【0007】
【課題を解決するための手段】
このような課題を解決するために本願発明は、文書データベースから予め指定された取得条件データに合致する文書を取得するための検索システムにおいて、入力された検索要求に基づき取得済みの文書を対象に文書検索を行うための検索手段と、この検索手段で用いた前記検索要求に基づき、外部の文書検索システムから文書検索を行うための拡大検索手段と、この拡大検索手段により得られた検索結果からユーザの選択する適合文書を指定させるための指定手段と、この指定手段で指定された前記適合文書に関する情報を前記取得条件データに追加するための学習手段を備えたことを特徴とする。
【0008】
これにより、取得済みの文書の中から所望の文書を検索し、利用者がその中に適合文書を発見できない場合は、外部の検索システムにより広い範囲で文書を検索することができるようになる。さらに、外部の検索システムの検索結果の中で利用者が適合文書を発見できたときには、それをシステムに通知し、次回の文書取得処理においては通知した適合文書が含まれるように取得条件を修正することができる。
【0009】
【発明の実施の形態】
<第一の実施形態>
【0010】
本願発明の第一の実施例である文書検索システム1は図1に示すようにインターネットに接続して利用することを目的としていて、インターネットと接続した計算機上のソフトウェアとして実現される。図2に、本実施例における文書検索システムの構成を示す。この文書検索システム1は、文書取得部11、取得条件データ記憶部12、文書インデックス記憶部13、文書検索部14、インタフェース部15、拡大検索部16、学習部17から成る。なお、文書取得部11はデーモン、記憶部以外のその他の処理はCGIベースで実現するとよい。
【0011】
文書取得部11は取得条件データ記憶部12に記憶されている取得条件データに基づき、インターネットを通してウェブ文書を取得し、この取得したウェブ文書の文書インデックスを作成し文書インデックス記憶手段に記憶する。ここで、取得条件データは、収集の出発点となるウェブページのURLのリストである。各URLに対してリンクの階層の取得段数を規定してもよい。また、インデックスに関しては後述する。
【0012】
まず文書取得部11は取得条件データにあるウェブページのURLを一つ取り出し、そのURLのウェブ文書をインターネットを通して取得する。文書取得部11は取得したウェブ文書の文書インデックスを作成して文書インデックス記憶部13に記憶させるとともに、他のウェブ文書へのリンク情報を抽出する。
【0013】
リンク情報のURLが同じウェブサイトであり、かつ、まだ文書インデックスを作成していないURLであれば、リンク先のウェブ文書を取得し、同じ処理を繰り返す。取得条件データ中のURLを起点としたこの処理が終了したら、リスト中の次のURLを取り出し同じ収集処理を繰り返す。リスト中のすべてのURLについて収集処理を終了したら、文書取得部11の処理は終了する。
【0014】
文書取得部11はインタフェース部15を通して利用者が起動を指示してもよいし、また、予め定期的に起動するような機能を持たせてもよい。取得したウェブ文書のURLは文書インデックスとして文書インデックス記憶部13に登録し、URLが与えられた時に、そのURLのウェブ文書が取得済みか否かの判断は文書インデックスを参照することにより判別できるようにしておく。
【0015】
ところで、文書インデックス記憶部13に記憶される文書インデックスは、文書を識別するための文書IDとその文書のURL、タイトル(htmlのtitle タグで囲まれた記述)を対応づけた文書データと、後述する文書検索部14での検索処理を実現するための転置ファイルからなる。この転置ファイルは図3のように検索語毎に出現文書と文書中の出現頻度の情報を保持するデータ形式で、tf−idf法に基づく検索を実現するための情報を備えている。
【0016】
ここで、文書取得部11が文書インデックス中の転置ファイルを作成するための処理の流れを図4に示す。まず、取得したウェブ文書中のhtmlタグを取り除く(ステップS41)、htmlタグを取り除いた文書の文字列を形態素解析して形態素(単語単位)に分解する(ステップS42)。
【0017】
次に定められた品詞の語以外を削除する(ステップS43)。例えば、助詞や助動詞などを削除するように定めておき、名詞や動詞の語幹などの自立語を残すようにするとよい。
【0018】
次に、残った語の文書中における出現頻度を計算する(ステップS44)。そして、その語毎に検索語として転置ファイルの該当文書の位置に出現頻度を登録する(ステップS45)。このようにして図3のような転置ファイルが作成される。
【0019】
さて、文書検索部14はインタフェース部15を通して入力された利用者の質問文に対して、文書取得部11が取得した文書を対象に検索を行う。図5に文書検索部14の処理の流れを示す。入力された質問文は形態書解析処理によって形態素に分解され(ステップS51)、定められた品詞の語以外を削除する(ステップS52)。残った品詞の語を検索語として取り出し、この検索語が出現する文書を文書インデックスを用いて取得する(ステップS53)。最後にtf−idf法に基づき文書毎の検索スコアを求め(ステップS54)、この検索スコアの高い順に一定数の文書IDを利用者に提示する(ステップS55)。
【0020】
インタフェース部15はウェブブラウザ上に実現し、検索結果としては文書本体へのリンクとなっているタイトル一覧が表示される。図5のような検索処理の出力である文書IDからタイトルは文書インデックス13の文書データを参照することにより取得することができる。
【0021】
図6にインタフェース部15の表示例を示す。ここでは図6の[検索]ボタンを押された時に図5の検索処理が起動される。本システムの利用者は適合文書と判断したタイトルをクリックし、その文書内容をブラウザ上に表示、参照することになる。適合文書が図6の検索結果にないとき、利用者は図6の[拡大検索]ボタンを押すことでインターネット上の検索サイト(例えばwww.fresheye.com)を利用してWWW全体を検索できるようにする。
【0022】
さて、図6の[拡大検索]ボタンを利用者が押したときに拡大検索部16が呼び出されるが、最初に図7に示す処理手順により、入力されている質問文を検索サイト用の検索命令に変換する。
【0023】
まず拡大検索部16は、図4や図5の処理と同様に質問文に形態素解析を施し(ステップS71)、定められた品詞の語以外を削除し(ステップS72)、残った品詞の語を検索語として取り出す。次に、検索語毎に文書インデックスを元にidfを計算し、それを検索語のウエイトとして、このウエイトが予め定められた値の範囲にあるものだけを残し(ステップS73)、最後にそれらを空白で区切って並べた文字列を作成し(ステップS74)検索命令とする。
【0024】
このように作成された検索命令は、検索サイトにインターネットを通して送信され、その結果を拡大検索の結果として取得する。ここでは、httpプロトコルで送受信を行い、受信した検索結果のhtmlから検索結果の一覧だけを取りだす。検索サイトにより検索結果のhtmlの書式は決まっているので、利用した検索サイトに合わせて検索結果の一覧を取得するプログラムを作り込んでおく。または、www.google.comのようにウェブサービスインタフェースを備えた検索サイトであれば、その仕様に合わせて検索要求の送信と結果の取得を行う。
【0025】
取得した拡大検索の結果は、インタフェース部15にて図8に示すような形式でブラウザ上に提示する。図8には検索結果の各タイトルの横にチェックボックスがついており、利用者によって適合文書と判断されたタイトルの横のチェックボックスをチェックすると、学習部17によってそれらのURLが取得条件データ記憶手段12の取得条件データに追加され、次回の検索対象文書の取り込み時に、それら文書、および、その同じウェブサイトの文書を取得する。
【0026】
その後は、同じ質問文を入力すると、最初に適合文書が表示されるようになるだけでなく、その文書と同じウェブサイトにある関連文書も次回の文書取得処理以降、文書インデックス記憶部12に登録した文書インデックスを用いて検索できるようになる。
【0027】
なお学習部17は、ウェブサイトのトップページのURL(最初の/まで)を取り出して取得条件データ記憶手段12の取得条件データに追加してもよい。
【0028】
また、本実施例の応用としては、図6の拡大検索ボタンを利用者が押したときに生成した検索サイト用の検索命令を利用者に提示し、それを確認、あるいは、修正する機会を利用者に与えるものが考えられる。図10は、図6の[拡大検索]ボタンが押された際に出現する、検索命令の提示,確認するための表示画面である。図4で入力された質問文から図5の処理により抽出された語がチェックボックスを伴って列挙される。チェックボックスの初期状態はチェックマークが表示された状態、すなわち、すべての語が選択された状態になっている。拡大検索を実行する際に不要な語が含まれていれば、利用者はチェックボックスをクリックすることでチェックマークを消し、その語を検索サイトへの検索命令から外すことができる。
【0029】
また、図10の画面の上端には図5の処理で抽出されなかった語、あるいは、元々、図6の画面で入力された質問文にはない語を追加するためのフィールドがある。利用者は望みの語を空白で区切って入力する。利用者が図10の[拡大検索]ボタンを押したときに、チェックボックスにチェックマークが残っている語と上端のテキストフィールドに利用者が入力した語を空白でつないで検索サイトへ検索命令として送信する。
【0030】
また、本実施例の別の応用例としては、図8でチェックされた文書を含むウェブサイトを収集対象に含めるように学習部17が即座に取得条件データを修正するのではなく、ウェブサイト毎に適合文書が含まれていた回数をカウントし、その回数が予め定められた回数を超えたときに取得条件データを修正するようにしてもよい。
【0031】
また、その回数をシステムの管理者に提示することで管理者がウェブサイトの重要度を判断する手段を提供し、かつ、取得条件データに含めるべきウェブサイトを容易に指定できるようにする。そのような管理者用画面の例を図11に示す。
【0032】
ウェブサイトのURLと、そのウェブサイトの文書が図8で適合文書と指定された回数がペアで表示され、その横にウェブサイトを取得条件データに含めるか否かを指定するためのチェックボックスが表示される。管理者は任意の時点で図11の画面を起動することができ、その内容に応じて取得条件データに含めるべきウェブサイトをチェックボックスにより指定することができる。最後に[取得条件拡張]ボタンを押すことで、学習部17に取得条件データの拡張を指示する。
【0033】
<第二の実施形態>
【0034】
本発明の第二の実施例は図9に示すように複数の文書データベースシステムと接続して利用することを目的としている。本実施例では各文書データベースシステムは固有の検索式と全文検索の文書検索を実行できることを前提としている。第一の実施例と同様に計算機上のソフトウェアとして実現し、接続した文書データベースは同一の計算機上、あるいは、ネットワークで接続された他の機器上で動作している。
【0035】
各文書データベースシステムとは、公開されているAPIやウェブプロトコルなど定められた形態で接続している。本実施例の構成は図2に示した第1の実施例と同じであるが、文書取得部11と拡大検索部16、学習部17の処理の流れと取得条件データ記憶部12に記憶される取得条件データの構成が異なる。
【0036】
本実施例の文書取得部11は取得条件データ記憶部12に記憶されている取得条件データの内容に基づき、定められた手順で接続した文書データベースシステムに対して文書の転送を要求する。この取得条件データは図12のように、個々の文書データベースに関する情報を記載した文書データベース情報と、取得対象の文書データベースシステムを識別し、その中の文書の取得範囲を指定する取得範囲情報の二つから成る。
【0037】
文書データベース情報は、文書データベースの種類(製品名)と,接続のための情報、例えば、IPアドレス、ポート番号、プロトコルなどとともに、取得条件データで使用する文書のフィールドと、検索結果の際の表示タイトルとして用いる記述の入ったフィールドと全文検索の対象となるフィールドを記載する。
【0038】
文書フィールドとはリレーショナルデータベースでのカラムに相当し、例えば、「タイトル(Title) 」、「著者(Author)」、「作成日(Date)」、「本文(Body)」の4つのフィールドからなる文書を保持している文書データベースについて、「著者(Author)」と「作成日(Date)」の2つのフィールドを取得条件に用い、かつ、検索結果の表示の文書タイトルとして「タイトル(Title) 」フィールドを取得条件データの文書データベース情報に登録できるようにしておく。
【0039】
取得範囲情報には取得対象の文書データベースの識別子と、取得の条件としてフィールドとその値のペアを記載する。例えば、著者がA、日付がBである文書を取得する場合、「Title=’A’,Date=’B’」を条件(「著者(Author)」フィールドの値がA、または、「日付(Date)」フィールドの値がBである文書を指定)として記載する。ここに記載された条件は文書データベース情報を参照し、文書データベースで受理される構文(例えばSQL言語)に変換して取得要求を送信し、その結果となる文書を取得する。
【0040】
取得した文書から転置ファイルを作成する処理は図4と同じである(ただし、最初のhtmlのタグを除去するステップは取得する文書の書式に合わせて変更する)が、文書毎に取得元の文書データベースの識別情報と、その文書データベースでの文書の識別情報(WWWでのURLに相当するもの)を保持することが異なる。第一の実施例と同様に文書の識別情報を用いて重複して文書を取得しないように抑止する。
【0041】
文書検索部14の処理の流れは図5と同じである。利用者は検索結果を見て、そこに適合文書がなければ拡大検索部16を起動することができる。拡大検索部16は接続しているすべての文書データベースに対して図7と同じ処理により検索命令を作成し、それに基づいた全文検索を各文書データベースで起動、結果をインタフェース部15に提示する。
【0042】
例えば、全文検索用のCONTAINS関数を備えたSQLを受理する文書データベースに対しては、図7で生成された文字列について、空白で区切られた各語を’あるいは”で囲み、かつ、それらを論理積(AND )演算子で結合した条件と、図12の文書データベース情報に記載された検索対象フィールドを検索対象のフィールドとしての引数としてとるCONTAINS関数をWhere句の条件とし、また、SELECT句に図12の文書データベース情報の表示タイトルのフィールドを指定したSQLを検索命令として作成、実行する。
【0043】
提示は図8と同様の形式で行う。チェックされた文書については学習部17から、次回から取得範囲に含めるように取得条件データ12を修正する。
【0044】
まず、インタフェース部15にてチェックされた適合文書の格納された文書データベースについて、取得条件に用いるフィールドを取得条件データ記憶部12に記憶された取得条件データを参照して調べる。次に、チェックされた適合文書がそれらフィールドに保持している値を文書データベースシステムに問い合わせる。例えば、「著者(Author)」と「作成日(Date)」が取得の条件で使用されていて、かつ、指定された適合文書では「著者(Author)」がC、「作成日(Date)」がDであったとき、「Author=’C’,Date=’D’」を追加すべき条件として取得条件データに追加する。
【0045】
このように構成することにより、次回の取得処理以降、同じ質問に対しては適合文書を文書インデックス記憶部12に記憶された文書インデックスを用いて検索できるようになるだけでなく、同じ著者、あるいは、同じ日に作成された関連文書も文書インデックスを用いて検索できるようになる。
【0046】
また、本願発明の実施形態における処理をコンピュータで実行可能なプログラムで実現し、このプログラムをコンピュータで読み取り可能な記憶媒体として実現することも可能である。
【0047】
なお、本願発明における記憶媒体としては、磁気ディスク、フレキシブルディスク、ハードディスク、光ディスク(CD−ROM,CD−R,DVD等)、光磁気ディスク(MO等)、半導体メモリ等、プログラムを記憶でき、かつコンピュータが読み取り可能な記憶媒体であれば、その記憶形式は何れの形態であってもよい。
【0048】
また、記憶媒体からコンピュータにインストールされたプログラムの指示に基づきコンピュータ上で稼動しているOS(オペレーションシステム)や、データベース管理ソフト、ネットワーク等のMW(ミドルウェア)等が本実施形態を実現するための各処理の一部を実行してもよい。
【0049】
さらに、本願発明における記憶媒体は、コンピュータと独立した媒体に限らず、LANやインターネット等により伝送されたプログラムをダウンロードして記憶または一時記憶した記憶媒体も含まれる。
【0050】
また、記憶媒体は1つに限らず、複数の媒体から本実施形態における処理が実行される場合も、本発明における記憶媒体に含まれ、媒体の構成は何れの構成であってもよい。
【0051】
なお、本願発明におけるコンピュータは、記憶媒体に記憶されたプログラムに基づき、本実施形態における各処理を実行するものであって、パソコン等の1つからなる装置、複数の装置がネットワーク接続されたシステム等の何れの構成であってもよい。
【0052】
また、本願発明におけるコンピュータとは、パソコンに限らず、情報処理機器に含まれる演算処理装置、マイコン等も含み、プログラムによって本願発明の機能を実現することが可能な機器、装置を総称している。
【0053】
【発明の効果】
本発明によれば、文書検索システムで取り込んだ文書に適合文書がない場合でも、外部のシステムを利用して幅広く適合文書を検索することができる。かつ、外部のシステムを利用して検索した適合文書は、その後の文書の取り込み時に含めることができ、文書検索システム内での検索の再現率を高めることができる。
【図面の簡単な説明】
【図1】本願発明の一実施形態である文書検索システムをインターネットに接続しての利用形態を示す
【図2】本願発明の一実施形態である文書検索システムの構成を示す。
【図3】本願発明の一実施形態である文書検索システムの文書インデックスに含まれる転置ファイルを示す。
【図4】本願発明の一実施形態である文書検索システムの文書インデックス中の転置ファイルを作成するための処理の流れを示す。
【図5】本願発明の一実施形態である文書検索システムの検索部の文書検索処理の流れを示す。
【図6】本願発明の一実施形態である文書検索システムのインタフェース部の検索結果の表示画面を示す。
【図7】本願発明の一実施形態である文書検索システム拡大検索部の処理の流れを示す。
【図8】本願発明の一実施形態である文書検索システムのインタフェース部の検索結果の表示画面を示す。
【図9】本願発明の一実施形態である文書検索システムを複数の文書データベースシステムと接続しての利用形態を示す。
【図10】本願発明の一実施形態である文書検索システムのインタフェース部の検索結果の表示画面を示す。
【図11】本願発明の一実施形態である文書検索システム取得条件データに含めるべきウェブサイトを指定するための画面を示す。
【図12】本願発明の一実施形態である文書検索システムの取得条件データを示す。
【符号の説明】
1…文書検索システム
11…文書取得部
12…取得条件データ記憶部
13…文書インデックス記憶部
14…文書検索部
15…インタフェース部
16…拡大検索部
17…学習部
Claims (8)
- 文書データベースから予め指定された取得条件データに合致する文書を取得するための文書検索システムにおいて、
入力された検索要求に基づき取得済みの文書を対象に文書検索を行うための検索手段と、
この検索手段で用いた前記検索要求に基づき、外部の文書検索システムから文書検索を行うための拡大検索手段と、
この拡大検索手段により得られた検索結果からユーザの選択する適合文書を指定させるための指定手段と、
この指定手段で指定された前記適合文書に関する情報を前記取得条件データに追加するための学習手段を備えたことを特徴とする文書検索システム。 - 前記指定手段にて取得条件データとして前記適合文書を取得する文書データベースを指定し、前記学習手段にて前記適合文書の取得元の文書データベースを取得条件データに追加することを特徴とする請求項1記載の文書検索システム。
- 前記拡大検索手段において用いる外部の検索システムへの検索命令を編集する編集手段をさらに備えたことを特徴とする請求項1記載の文書検索システム。
- 文書データベース毎に指定手段で指定された適合文書の出現した回数をカウントし、学習手段においてその回数を利用者に提示し、取得条件データに追加する文書データベースを選択できるようにしたことを特徴とする請求項2記載の文書検索システム。
- 複数の文書データベースと接続し、予め指定された取得条件データに合致する文書を文書データベースから取得するための文書検索システムにおいて、
入力された検索要求に基づき取得済みの文書を対象に文書検索を行うための検索手段と、
入力された検索要求に基づき接続されている各文書データベースの検索手段にて検索された検索結果を収集する拡大検索手段と、
この拡大検索手段により得られた検索結果からユーザの選択する適合文書を指定させるための指定手段と、
この指定手段で指定された前記適合文書に関する情報を前記取得条件データに追加するための学習手段を備えたことを特徴とする文書検索システム。 - 前記指定手段にて接続された各文書データベースに対して取得対象の適合文書を検索式で指定させ、前記学習手段にて前記適合文書を含むように取得条件データの検索式を変更することを特徴とする請求項5記載の文書検索システム。
- 文書データベースから予め指定された取得条件データに合致する文書を取得するための文書検索方法において、
入力された検索要求に基づき取得済みの文書を対象に文書検索を検索手段にて行い、
この検索手段で用いた前記検索要求に基づき、外部の文書検索システムから文書検索を拡大検索手段にて行い、
この拡大検索手段により得られた検索結果からユーザの選択する適合文書を指定手段にて指定させ、
この指定手段で指定された前記適合文書に関する情報を学習手段にて前記取得条件データに追加することを特徴とする文書検索方法。 - 文書データベースから予め指定された取得条件データに合致する文書を取得するためコンピュータを文書検索システムとして実行させるプログラムであって、
入力された検索要求に基づき取得済みの文書を対象に文書検索を検索手段にて行わせ、
この検索手段で用いた前記検索要求に基づき、外部の検索システムから文書検索を拡大検索手段にて行わせ、
この拡大検索手段により得られた検索結果からユーザの選択する適合文書を指定手段にて指定させ、
この指定手段で指定された前記適合文書に関する情報を学習手段にて前記取得条件データに追加させるためのコンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003046799A JP2004258832A (ja) | 2003-02-25 | 2003-02-25 | 文書検索システムおよび文書検索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003046799A JP2004258832A (ja) | 2003-02-25 | 2003-02-25 | 文書検索システムおよび文書検索方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004258832A true JP2004258832A (ja) | 2004-09-16 |
Family
ID=33113209
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003046799A Pending JP2004258832A (ja) | 2003-02-25 | 2003-02-25 | 文書検索システムおよび文書検索方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004258832A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008234559A (ja) * | 2007-03-23 | 2008-10-02 | Yahoo Japan Corp | ドキュメント絞り込み検索装置、方法及びプログラム |
JP2009271659A (ja) * | 2008-05-02 | 2009-11-19 | Ricoh Co Ltd | 情報処理装置、情報処理方法、情報処理プログラム及び記録媒体 |
-
2003
- 2003-02-25 JP JP2003046799A patent/JP2004258832A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008234559A (ja) * | 2007-03-23 | 2008-10-02 | Yahoo Japan Corp | ドキュメント絞り込み検索装置、方法及びプログラム |
JP2009271659A (ja) * | 2008-05-02 | 2009-11-19 | Ricoh Co Ltd | 情報処理装置、情報処理方法、情報処理プログラム及び記録媒体 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6094649A (en) | Keyword searches of structured databases | |
KR101450358B1 (ko) | 구조형 지리적 데이터 검색 | |
US8131540B2 (en) | Method and system for extending keyword searching to syntactically and semantically annotated data | |
JP4644420B2 (ja) | ネットワークを介してデータを検索及び提示する方法及びマシン可読記憶装置 | |
US20070094246A1 (en) | System and method for searching dates efficiently in a collection of web documents | |
JP2007122513A (ja) | コンテンツ検索方法、及び、コンテンツ検索サーバ | |
US20120124053A1 (en) | Annotation Framework | |
WO2002101588A1 (fr) | Systeme de gestion de contenus | |
JPH11191114A (ja) | メタ検索方法、画像検索方法、メタ検索エンジン及び画像検索エンジン | |
EP1428139A2 (en) | System and method for extracting content for submission to a search engine | |
JP3501799B2 (ja) | 情報検索支援装置、コンピュータプログラム、プログラム格納媒体 | |
JP2003519844A (ja) | スタイルシートに基づいて構造化されたドキュメントのインデックスを作成する方法および装置 | |
JP2003173280A (ja) | データベース生成装置、データベース生成方法及びデータベース生成プログラム | |
KR20000050225A (ko) | 문서 자동 요약에 의한 인터넷 정보 검색 시스템 및 방법 | |
US20110252313A1 (en) | Document information selection method and computer program product | |
JP4621680B2 (ja) | 定義付けシステムおよび方法 | |
JP3898016B2 (ja) | 情報検索装置、情報検索方法及び情報検索プログラム | |
JP5688754B2 (ja) | 情報検索装置及びコンピュータプログラム | |
JP2004258832A (ja) | 文書検索システムおよび文書検索方法 | |
Maly et al. | Archon-a digital library that federates physics collections | |
JP2002049638A (ja) | 文書情報検索装置、方法、文書情報検索プログラム及び文書情報検索プログラムを格納したコンピュータ可読の記録媒体 | |
JP2005316590A (ja) | 情報検索装置 | |
JP3604069B2 (ja) | 文書間関連度計算装置、その方法およびその記録媒体 | |
JP4384736B2 (ja) | 画像検索装置およびその装置の各手段としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP4034503B2 (ja) | 文書検索システムおよび文書検索方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040609 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20050415 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20050606 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20071214 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080212 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20080307 |