JP2005352878A - Document retrieval system, retrieval server and retrieval client - Google Patents

Document retrieval system, retrieval server and retrieval client Download PDF

Info

Publication number
JP2005352878A
JP2005352878A JP2004174363A JP2004174363A JP2005352878A JP 2005352878 A JP2005352878 A JP 2005352878A JP 2004174363 A JP2004174363 A JP 2004174363A JP 2004174363 A JP2004174363 A JP 2004174363A JP 2005352878 A JP2005352878 A JP 2005352878A
Authority
JP
Japan
Prior art keywords
search
document
plurality
index
documents
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2004174363A
Other languages
Japanese (ja)
Inventor
Osamu Konichi
Yoshiki Niwa
Yoko Oi
芳樹 丹羽
修 今一
洋子 大井
Original Assignee
Hitachi Ltd
株式会社日立製作所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd, 株式会社日立製作所 filed Critical Hitachi Ltd
Priority to JP2004174363A priority Critical patent/JP2005352878A/en
Publication of JP2005352878A publication Critical patent/JP2005352878A/en
Application status is Withdrawn legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems

Abstract

<P>PROBLEM TO BE SOLVED: To provide the summary of a retrieval result in an associative retrieval system based on a plurality of view points. <P>SOLUTION: One document database is indexed in a plurality of manners, whereby a retrieval result can be overview-displayed from a plurality of view points. Respective documents in indexed document databases 403, 503 and 603 are managed with a common identifier, whereby the summary of a document group obtained as the retrieval result can be formed by use of the respective indexes. <P>COPYRIGHT: (C)2006,JPO&NCIPI

Description

本発明は、文書検索システムに関し、特に検索結果を複数の視点から概観表示する連想検索システムに関する。 The present invention relates to a document retrieval system, on Associative retrieval system overview display particular search results from a plurality of viewpoints.

コンピュータやインターネットの普及にともない、文書情報の電子化が急速に進んでいる。 With the spread of computers and the Internet, digitization of document information is progressing rapidly. 入手可能な情報が増加するにつれ、その中から必要な情報を探し出すことが重要な課題となってくる。 As the available information is increased, is to locate the necessary information from them it becomes an important issue. また、複数の文書データベース間での文書群の関連性を調べたいという要求も高まっている。 Further, there is growing demand to examine the relevance of documents among multiple document databases. 例えば、興味のある新聞記事に対して、それに関連する百科事典の項目を検索したいという要求は多い。 For example, for a newspaper article of interest, that the request is often want to find an item in the encyclopedia to be associated with it.

現在実用となっているキーワード検索では、複数の文書データベースを切り替えて検索することは可能であるが、ある文書データベースに含まれる文書群に対して、それに関連する文書群を、同一文書データベース、あるいは、別の文書データベースから検索すること(文書連想検索と呼ばれる検索方式)は不可能である。 The keyword search is currently practical, it is possible to search by switching a plurality of document databases for documents contained in a document database, the document group associated with it, the same document database, or, (search method called document associative search) to find from another document database is not possible.

同一文書データベース内に限れば、文書間の関連度をあらかじめ計算しておくことで、文書群を検索入力とした文書連想検索を実現することはできる。 As far to the same document database, by advance calculating the relevance between documents, it is possible to realize a document associative search with a search input document set. しかし、複数の文書データベースに対しては、あらかじめ計算すべき文書間の関連度が文書データベース数の増加にともなって組み合わせ数が爆発的に増加するため、現実的には不可能となっている。 However, for multiple document databases, because the relevance between documents to be calculated in advance the number of combinations with increasing number of documents database increases explosively, it has become practically impossible.

これに対して、特開2000−155758号公報「複数文書データベースを対象とした文書検索方法及び文書検索サービス」には、利用者が指定した文書データベース中の任意の文書群に対して、その文書群に関連する文書群を任意の文書データベースから効率良く検索する方法が開示されている。 In contrast, the "document search method and document search service for multiple document database" JP 2000-155758, for any group of documents in the document database specified by the user, the document how efficiently search for documents related to the group from any document database is disclosed. この方法では、文書群として入力された検索入力内の特徴的な単語のみを使うことで、高速な文書連想検索を実現している。 In this way, by using only the characteristic words in the inputted search input to a group of documents, and provides fast document associative search. この方法により、利用者は複数の異なる種類の文書データベースを切り替えながら、文書群の関連性を調べることで、高精度かつ効率の良い文書検索を行なうことが可能となる。 In this way, the user while switching a plurality of different types of document database, to investigate the relevance of documents, it is possible to perform a good document Search precision and efficiency. また、この方法では、検索結果として得られた文書群に出現する特徴的な単語を抽出し、それらを検索結果の概観(要約)として利用者に提示することで、利用者が検索結果の可否を判断する際の支援手段も提供している。 Further, in this method, the search resulting extracts characteristic words that appear in documents, they search overview Results Summary As to present to the user, the user search result whether is also providing support means in determining the.

特開2000−155758号公報 JP 2000-155758 JP

単語に基づく文書検索では、文書中に出現する単語でその文書のインデックス付けを行ない、文書検索を実現している。 In the document search based on a word, performs indexing of the document at the words that appear in the document, it is to achieve a document search. 特開2000−155758号公報で開示されている方法でも同様であり、文書から特徴的な単語を抽出するために、その文書に含まれている単語について統計的尺度(tf*idf法などが代表的)を用いてその重要度を計算し、重要度の高い順に単語を抽出している。 Patent is similar in 2000-155758 Patent method disclosed in Japanese in order to extract the characteristic words from the document, such as a statistical measure (tf * idf method for words contained in the document is representative the significance was calculated using the specific), and extracts words in order of importance. インデックス付けは、ひとつの文書データベースに対して一通りの方法で行なうのが一般的である。 Indexing is generally carried out in one ways for one document database. しかし、専門用語(生物医学分野では、疾患名、遺伝子名、タンパク質名など)やファクト情報(例えば、生物医学分野ではタンパク質間相互作用など)は、一般の単語分布中に埋没してしまうため、特徴単語として抽出されにくくなってしまう。 However, since (in the biomedical field, disease name, gene name, the protein name) terminology and fact information (e.g., protein-protein interactions in the biomedical field) is to become buried in the general word distribution, it becomes difficult to extract as the characteristic word. また、インデックス付けが一通りだと、検索結果の概観として表示されるのは、ひとつの視点に限定されたものになるため、その視点が利用者の検索要求や興味に合致していない場合には、適切な概観表示とはなり得ない。 Further, when it indexing one way, it is displayed as an overview of the search results, to become what is limited to one point of view, if the view point does not conform to the search request and the user's interest It is, can not be a proper overview display.

本発明は上記現状を鑑み、利用者の興味に合致した複数の視点から検索結果を概観表示する文書検索システムを提供することを目的とする。 The present invention has been made in view of the above situation, and an object thereof is to provide a document retrieval system overview displaying search results from a plurality of viewpoints that matches the user's interest.

上記課題を解決するために、本発明では、ひとつの文書データベースに対して、複数通りのインデックス付けを行なうことで、検索結果を複数視点から概観表示できるようにする。 In order to solve the above problems, the present invention, for one document database, by performing indexing plurality of ways, to be able to overview display search results from multiple viewpoints.

例えば、ひとつの文書データベースに対して、通常の単語によるインデックス付け、専門用語によるインデックス付け、ファクト情報によるインデックス付けを行なう。 For example, with respect to one document database, perform indexed by ordinary words, indexed by the technical term, indexed by the fact information. それぞれのインデックス付けされた文書データベースの対応をとるために、各文書を共通の識別子によって管理し、ある文書からの概略を、それぞれのインデックスを用いて作成できるようにする。 To take the corresponding respective indexed document database, and manages each document by a common identifier, an outline from a document, to be created using the respective index.

本発明の文書検索システムは、検索要求を入力する入力部、検索された文書群を表示する検索結果表示部、及び検索された文書群の概略を表示する概略表示部を備える検索クライアントと、インデックス付けされた複数の文書を格納した文書データベース、受信した検索要求に対して関連度の高い文書を前記文書データベースから検索する検索部、及び与えられた文書群に対して前記インデックスを用いて概略を作成する概略作成部を備える検索サーバとを含み、インデックスとして種類の異なる複数のインデックスを備える。 Document search system of the present invention, a search client comprising an input unit for inputting a search request, the search result display unit for displaying the retrieved documents, and an outline display unit for displaying an outline of the retrieved documents, the index attached to a plurality of documents documents database storing, retrieval unit for retrieving from said document database with high relevance document to the received search request, and for a given set of documents a schematic using the index and a search server comprising a summary creation unit for creating comprises a plurality of indices of different types as an index.

検索クライアントの概略表示部には、複数の種類の概略が異なる視点毎に区分して表示される。 The schematic representation of the search client, a plurality of kinds of schematic is presented separately for each different viewpoints. 検索結果表示部は、表示された文書群の中から次の検索のキーとなる文書を選択するための文書選択部を有し、概略表示部は、表示された概略の要素の中から次の検索のキーとなる要素を選択するための概略選択部を有する。 Search result display unit from the displayed document group having a document selection section for selecting a document to be key for the next search, schematic display unit from among the elements of the displayed outline follows having a general selection unit for selecting a search key element.

検索結果として得られた文書集合に対して、複数の視点からの概観表示を見ることによって、利用者はより適切に検索結果の性質を把握できるようになる。 The search resulting document set, by looking at the overview display from a plurality of viewpoints, the user will be able to show what kind of better search results. また、各視点間の関連を検索対象文書を仲介として捉えることができるため、検索結果の分析をより詳細に行なうことができる。 Further, it is possible to capture the relationship between the viewpoints of the target document as an intermediary, it is possible to perform the analysis of the search results in greater detail.

以下、図面を参照して本発明の実施の形態を説明する。 Hereinafter, with reference to the drawings illustrating the embodiments of the present invention.

図1は、本発明を実現するためのシステムの構成例を示す概略図である。 Figure 1 is a schematic diagram showing an example of the configuration of a system for implementing the present invention. このシステムは、利用者が検索要求を入力したり、検索結果を表示したりする検索クライアント20、文書データベースを検索するための検索サーバ40、50、60、検索クライアント20と検索サーバ40、50、60の仲介をする連想検索サーバ30を通信ネットワーク10により接続して構成される。 This system, or enter a user search request, the search results or displays the search client 20, the search server 40, 50, 60 for searching a document database, the search client 20 and the search server 40, 50, It constructed an associative search server 30 to the mediation of 60 connected by a communication network 10. 図に示した例では、文書データベースを検索するための検索サーバとして3つの検索サーバが通信ネットワークに接続されているが、通信ネットワークに接続される検索サーバの数は任意でよい。 In the example shown in FIG, three retrieval servers are connected to the communication network as a search server for searching a document database, the number of search server connected to the communication network may be arbitrary. 検索クライアントの数も任意である。 The number of search client is also arbitrary.

検索サーバ40、50、60の備える検索手段402、502、602は、連想検索サーバから送られてきた検索要求に対して、関連度の高い文書群を文書データベース403、503、603から検索し、その検索結果を関連度の重み付きで連想検索サーバ30に返す。 Retrieval means 402, 502, and 602 provided in the search server 40, 50, 60, to the search request sent from the associative search server, it searches the relevant degree document group from the document database 403,503,603, As a return search results to the associative search server 30 in a weighted relevance to. ここでの検索手段は、例えば、公知のキーワード検索手法により実現できる。 Wherein the searching means, for example, it can be realized by a known keyword search technique.

キーワード検索手法では、検索処理の効率を上げるために、文書データベースに含まれる文書を単語に分割し(日本語の文書に対しては形態素解析、英語の文書に対してはstemming処理を行なう)、どの文書にどの単語が含まれるかをインデックスとして作成しておく。 In the keyword search method, in order to increase the efficiency of the search process, divide the documents included in the document database to the word (morphological analysis for Japanese documents, perform stemming processing for the document in English), you create a what word is included in any document as an index. 検索実行時には、作成されたインデックスが主記憶に読み込まれるため、検索処理を高速に実行できる。 Search at runtime, since the index was created is loaded in the main memory, it can perform a search processing at high speed. 図1においては、検索サーバ40、50、60が有する文書データベース403、503、603のそれぞれに対してインデックス404、504、604を作成し、検索処理に利用する。 In Figure 1, it creates indexes 404,504,604 for each document databases 403,503,603 with the search server 40, 50, 60, utilized in the search process.

検索サーバ40、50、60の備える概略作成手段401、501、601は、文書データベース403、503、603から検索された文書群の概略を作成する。 Search server 40, 50, and 60 schematically creating means provided in the 401,501,601 creates an outline of the retrieved documents from the document database 403,503,603. ここで概略とは、文書群の内容をよく表わす単語集合のことである。 Here, the outline is that the set of words representing better the contents of the documents. 概略作成手段としては、特開2000−155758号公報などの既存手法が利用できる。 The schematic creating means, available to existing techniques such as JP-2000-155758. 概略作成時にも、上記インデックスを利用する。 Even at the time of outline creation, to use the index. すなわち、ある文書にどの単語が含まれているかを、インデックスを参照して調べるわけである。 That is, if there is any which words in a document, it is not examined with reference to the index.

一例を示すと、まず、概略を作成しようとする文書群中の全文書に含まれる単語の頻度集計をする。 As an example, first, the frequency totaling of words contained in all the documents in the document group to try to create a schematic. 一般に、ある文書群で良く現れる単語ほどその文書群を代表する度合も高いため、文書群中で出現頻度が高いほど概略に含まれやすいことになる。 Generally, for high degree representing the document group as a word appearing well in some documents, it will be easily included in the schematic higher frequency in the document group. ただし、「する」などのように、どの文書にも良く現れるような一般的な単語は概略単語としては適当ではない。 However, such as "Yes", common words, such as it appears well in any document is not suitable as a general word. よって、通常は、文書群が属する文書データベース中での出現頻度も考慮して概略単語を選択する。 Therefore, usually, you select the topic words in consideration of frequency of occurrence in the document database documents belongs. つまり、指定された文書群での出現頻度が高く、かつ、文書データベース全体での総出現頻度が低い単語ほど、その文書群中でしか現れないという意味で特徴的な単語であり、その文書群を特徴付ける概略として適切である。 In other words, high frequency with the supplied documents, and, as the word total frequency is low in the entire document database, a characteristic word in the sense that only appear in the document group, the group of documents suitable as schematically characterizing. 具体的には、文書群中のそれぞれの単語について、文書群中での出現頻度、文書データベース中での出現頻度を入力とする適当な関数により単語の重みを計算し、ある閾値以上の重みを持つ単語を概略として採用する。 Specifically, for each word in the document group, frequency of occurrence in the document group, the weight of words is calculated by an appropriate function that receives the frequency in a document database, the weight of more than a certain threshold the words that have adopted as the outline.

検索クライアント20は、検索要求入力手段201、検索結果表示手段202、概略表示手段203を備える。 Search client 20 includes retrieval request inputting means 201, the search result display unit 202, an outline display means 203.

図2は検索クライアントにおける初期画面の例を示す図である。 Figure 2 is a diagram showing an example of an initial screen in the search client. 利用者は検索要求入力エリア2011に検索要求を入力し、検索指示ボタン2012をクリックすることで検索を行なう。 The user enters a search request to a search request input area 2011, carried out a search by clicking on the search instruction button 2012.

図3は検索クライアントにおける検索結果の例を示す図である。 Figure 3 is a diagram showing an example of a search result in the search client. 検索結果は検索結果表示手段202によって表示され、検索結果の概略が概略表示手段203によって表示される。 Search results are displayed by the search result display unit 202, summary of search results are displayed by the summary display unit 203. 検索結果表示手段202は文書群指定手段も兼ねており、文書選択チェックボックス2021により、任意個の記事を選択し、連想検索指示ボタン2001をクリックすることで、選択した記事と関連する文書を検索することができる。 Search result display means 202 also serves as documents specifying means, by the document selection check box 2021, select any number of articles, by clicking on the associative search instruction button 2001, search for documents associated with the article you have selected can do. 概略表示手段203は単語群指定手段も兼ねており、単語選択チェックボックス2031、2032により、任意個の単語を選択し、連想検索指示ボタン2001をクリックすることで、概略単語からの検索を行なうことができる。 Schematic representation means 203 also serves as the word group specifying means, by the word selection check box 2031, select any number of words, by clicking the associative search instruction button 2001, to perform a search from topic words can.

連想検索サーバ30は、検索クライアント20から送られてくる検索要求を解析する検索要求解析手段301、検索クライアント20から送られてくる検索要求を、検索サーバ40、50、60に振り分ける機能を持つ検索要求発行手段302、文書群に対する概略単語を検索サーバ40、50、60に要求する概略単語要求手段303を備える。 Associative search server 30 searches with search request analysis unit 301 for analyzing search requests transmitted from the search client 20, the search request transmitted from the search client 20, it distributes to the search server 40, 50 function request issuing unit 302 comprises a general word requesting means 303 for requesting topic words for documents in the search server 40, 50.

検索要求解析手段301は、検索クライアント20から送られてくる検索要求を解析してその中に含まれる単語を同定し検索キーを作成する。 Search request analysis unit 301 analyzes the search transmitted from the search client 20 requests to identify words included therein to create a search key. 検索要求解析手段301は任意のものであってよいが、日本語文に関しては文を単語に分割する形態素解析、英文に対しては単語の原形還元と品詞付けを行なうstemming処理を最低含んで構成される。 Search request analysis means 301 may be any, morphological analysis that divides the sentence into words with respect to Japanese sentences, the stemming processing for original reduction and part of speech with words is configured to include a minimum for English that.

検索要求発行手段302に送られてくる検索要求としては、(1)検索要求解析手段301によって作成された単語集合、(2)検索クライアント20が備える検索結果表示手段(文書群指定手段)から送られてくる文書IDの集合、あるいは(3)検索クライアント20が備える概略表示手段(単語群指定手段)203から送られてくる単語集合、である。 Search The request issuing unit 302 coming search request is sent to, feed from (1) search word set created by the request analysis unit 301, (2) a search result display means the search client 20 comprises (documents specifying means) set of is come document ID, or (3) is a word set, sent from the schematic display means (specified word group means) 203 provided in the search client 20. 検索要求が(1)と(3)の場合、その単語集合を検索要求として検索サーバに送る。 If the search request is for (1) and (3), and sends to the search server that word set as a search request. 検索要求が(2)の場合、概略単語要求手段303が検索サーバに対して、その文書IDの集合に対応する文書群の概略を要求し、送られてきた概略単語集合を検索要求として検索サーバに送る。 If the search request is for (2), the search server for topic words requesting means 303 search server requests a summary of documents corresponding to the set of the document ID, and schematic set of words sent as the retrieval request send to. 検索要求発行手段302がどの検索サーバに検索要求を送るかは、各検索サーバが保持するインデックスの内容に応じて異なるため、後述の例を用いてその動作を示す。 Or send a retrieval request issuing unit 302 is a search request to which search server is different depending on the contents of the index to the search server holds, showing the operation using the examples below.

従来の連想検索システムでは、ひとつの文書データベースに対しては、ひとつの視点からのインデックス付けのみが行なわれていた。 In conventional associative search system, for one document database, only indexed from one viewpoint has been performed. 本発明では、ひとつの文書データベースに対して、複数の視点からのインデックス付けを行なうことで、利用者の利便性を高めることを目的としている。 In the present invention, for one document database, by performing indexing from multiple viewpoints, it is an object to improve the convenience of the user. このことを実現するために、必要な要件は、(1)複数の視点からのインデックス作成すること、(2)複数の、インデックス付き文書データベースに含まれる同一の文書を共通識別子で管理すること、である。 To achieve this, the necessary requirements are (1) to indexing from multiple perspectives, (2) a plurality of, managing the same document included in an indexed document database with a common identifier, it is. 同一文書を共通識別子で管理することによって、検索結果として得られた文書集合のそれぞれのインデックス間における同一性が保持できるため、それぞれの視点から同じ文書集合に対して概略単語を作成することができる。 By managing the same document in a common identifier, because the identity can be maintained between each index of the document set obtained as the search result, it is possible to create topic words for the same document set from each viewpoint .

図4、図5、図6は、ひとつの文書データベースベースに対し、複数の視点からのインデックス付けを行なった場合のインデックスの例である。 4, 5, 6, with respect to one document database based, an example of an index in the case of performing the indexing from multiple viewpoints.

図4は、文書IDが12345である文書のインデックスを、一般語、タンパク質名、タンパク質間相互作用で行なった例である。 4, the index of Docs ID is 12345, the general language, the protein name, an example of performing in protein-protein interactions. インデックス列の各単語の前の数字は、その単語がその文書で出現する頻度である。 The numbers in front of each word in the index column is the frequency with which the word appears in the document. 図5は、文書IDが12345である文書のインデックスを、タンパク質名で行なった例である。 Figure 5 is an example in which a document ID is the index of the document is 12345, it was carried out at the protein name. 図6は、文書IDが12345である文書のインデックスをタンパク質間相互作用で行なった例である。 6, the document ID is an example of performing an index of a document which is 12345 in protein-protein interactions. 上記要件(2)を満たすために、それぞれのインデックス付けにおいて共通の文書ID「12345」を用いている。 To meet the requirement (2) it is used a common document ID "12345" in the respective indexing. それぞれの視点でのインデックスの作成方法は任意でよいが、現実的には、一つのインデックスが、他の複数のインデックスを包含しているように作成するのが便利である。 The method of indexing at each viewpoint is arbitrary but, in reality, a single index, it is convenient to create as include other multiple indexes. 上記の例では、図4のインデックスが図5、図6のインデックスを包含している。 In the above example, the index of FIG. 4 FIG. 5 encompasses the index of Fig. こうすることにより、上述した検索要求発行手段302に送られてくる検索要求はすべて検索サーバ40に送ればよいことになる。 By doing so, so that it can send to all the search sent to the search request issuing unit 302 mentioned above requested search server 40. 検索サーバ50、60は検索結果に対する概略作成時にのみ用いられる。 Search server 50, 60 is used only during schematic create search results.

図3は、図4、図5、図6のインデックスを用いて連想検索を行なった例を示す図である。 3, 4, 5 is a diagram showing an example of performing an associative search using the index of Fig. 検索結果として、記事タイトルが表示されている。 As a search result, article title is displayed. また、検索結果の概略として、これらの記事に含まれるタンパク質名とタンパク質間相互作用が表示されている。 Further, as a summary of search results, the protein name-protein interactions in these articles are displayed.

以下、図7と図8のシーケンス図を用いて処理の流れを説明する。 Hereinafter, the flow of processing will be described with reference to the sequence diagram of FIG. 7 and FIG. 8. 説明のため、検索サーバ40、50、60に備えられた文書データベース403、503、603のインデックス404、504、604を、それぞれ図4、図5、図6のように作成するとする。 For illustration, the index 404,504,604 document database 403,503,603 provided to the search server 40, 50, respectively Figure 4, and Figure 5 is created as shown in FIG. 6. このようなインデックス付けを行なった場合、検索要求発行手段302の動作は以下のようになる。 If you make such indexing, the operation of the retrieval request issuing unit 302 is as follows. 利用者が入力した検索要求に対しては、検索要求発行手段302は、検索サーバ40に対して検索要求を発行する。 For user entered search request, the search request issuing unit 302 issues a search request to the search server 40. 検索サーバ40から得られた検索結果に対する概略単語を作成するときには、検索サーバ50、60に対して概略単語要求手段303が概略単語の作成要求を発行する。 When creating a topic words to the search results from the search server 40 is a schematic word requesting means 303 issues a request to create a topic words to the search server 50 and 60. 利用者が文書群を指定して、文書群からの再検索を実行する場合には、検索サーバ40に対して検索要求を発行する。 User to specify a set of documents when performing search from documents issues a search request to the search server 40. 利用者が単語群を指定して、単語群からの再検索を実行する場合には、検索サーバ40に対して検索要求を発行する。 User to specify a word group, when performing search from word group issues a search request to the search server 40. このように、検索はすべて検索サーバ40で行う。 In this way, carried out in all the search is the search server 40. 検索サーバ50、60は検索結果の概略単語を作成するときだけ使う。 The search server 50 and 60 are used only when you create an outline word of the search results. 「タンパク質名」「タンパク質相互作用」の両方の単語を指定した場合でも、検索サーバ40は、検索サーバ50、60のインデックスを包含しているので、問題なく動作する。 Even if you specify both the words of the "protein name", "protein interaction", the search server 40, because it includes the index of the search server 50 and 60, to work without any problems.

次に処理の流れを、図7のシーケンス図を用いて説明する。 Then the flow of processing will be described with reference to the sequence diagram of FIG. 利用者は検索クライアント20の検索要求入力手段201を用いて、検索要求を入力する。 The user using the retrieval request inputting means 201 of the search client 20 inputs a search request. 入力された検索要求は連想検索サーバに送信される(T11)。 Inputted search request is transmitted to the associative search server (T11). 連想検索サーバ30の検索要求解析手段301は検索要求を解析し、検索サーバに送信するための検索要求を作成する。 Search request analysis means 301 of the associative search server 30 analyzes the search request, to create a search request for transmitting to the search server. 検索要求発行手段302により検索要求が検索サーバ40に送信される(T12)。 Search request is transmitted to the search server 40 by the retrieval request issuing section 302 (T12). 検索サーバ40の検索手段402は、インデックス404を用いて文書データベース403を検索し、その結果を連想検索サーバ30に送信する(T13)。 Retrieval means 402 of the search server 40 searches the document database 403 using the index 404, and transmits the result to the associative search server 30 (T13). 連想検索サーバ30の概略単語要求手段303は、得られた検索結果の概略を作成するための、概略の作成要求を検索サーバ50と検索サーバ60に送信する(T14,T16)。 Topic words requesting means 303 of the associative search server 30 to create an outline of the search results obtained, and transmits the outline of creation request and the search server 50 to search server 60 (T14, T16). 検索サーバ50と検索サーバ60の概略単語作成手段501、601は、それぞれインデックス504、604を利用して概略単語を作成する。 Topic words creating means 501, 601 of the search server 50 and the search server 60, respectively to create a topic words by using the index 504, 604. この例の場合、概略単語作成手段501は、タンパク質名で構成される概略単語を作成し、概略単語作成手段601は、タンパク質間相互作用で構成される概略単語を作成する。 In this example, topic words creation unit 501 creates a topic words composed of protein name, topic words creation unit 601 creates a topic words composed of protein-protein interactions. それぞれの概略単語作成手段で作成された概略単語は、連想検索サーバ30に送信される(T15,T17)。 Topic words created in each of the topic words creation means is transmitted to the associative search server 30 (T15, T17). 最後に、検索結果と概略単語が連想検索サーバ30から検索クライアント20に送信され(T18)、検索クライアント20の検索結果表示手段202と概略表示手段203によって利用者に提示される。 Finally, search results and topic words are transmitted from the associative search server 30 to search the client 20 (T18), it is presented to the user by the search result display unit 202 and the outline display unit 203 of the search client 20.

次に、図8のシーケンス図を用いて説明する。 Next, with reference to the sequence diagram of FIG. このシーケンス図は、検索結果として得られた文書やその概略単語から再検索を行なう場合の処理の流れを示している。 This sequence diagram shows the flow of processing when performing search from the resulting document and its topic words as a search result.

始めに検索結果として得られた文書から再検索を行う場合について説明する。 Description will be given of a case where start to do re-search from the document obtained as the search result. 利用者は、検索クライアント20の文書群指定手段202を用いて、再検索のキーとなる文書を選択する。 The user may use the documents specifying means 202 of the search client 20 selects a document to be a key search. 選択された文書の識別子は連想検索サーバ30に送信される(T21)。 Identifier of the selected document is transmitted to the associative search server 30 (T21). 連想検索サーバ30の概略単語要求手段303は、選択された文書の概略を作成するための、概略の作成要求を検索サーバ40に送信する(T22)。 Topic words requesting means 303 of the associative search server 30 to create an outline of the selected document, and transmits the summary creation request to the search server 40 (T22). 検索サーバ40の概略単語作成手段401は、インデックス404を利用して概略単語を作成する。 Topic words creating means of the search server 40 401 creates a topic words by using the index 404. すなわち、前述のように、特開2000−155758号公報などと同じ手法で、統計的に重要な単語を選択して概略単語を作成する。 That is, as described above, in the same manner as such JP 2000-155758, to create a topic words selected statistically important words. 作成された概略単語は、連想検索サーバ30に送信される(T23)。 Topic words created is transmitted to the associative search server 30 (T23).

利用者が文書のみから再検索を実行する場合は、連想検索サーバ30の検索要求発行手段302により、得られた概略単語が検索サーバ40に送信される(T25)。 If the user performs a search only documents by the retrieval request issuing section 302 of the associative search server 30, the resulting topic words is transmitted to the search server 40 (T25). 検索サーバ40の検索手段402は、インデックス404を用いて文書データベース403を検索し、その結果を連想検索サーバ30に送信する(T26)。 Retrieval means 402 of the search server 40 searches the document database 403 using the index 404, and transmits the result to the associative search server 30 (T26). 以降の処理は図7のシーケンス図における概略単語作成手段以降の処理と同様である。 The subsequent processing is the same as processing after topic words forming means in the sequence diagram of FIG.

利用者が概略単語から再検索を行なう場合は、利用者は検索クライアント20の単語群指定手段203を用いて、再検索のキーとなる単語を選択する。 If the user performs a search from topic words, the user is using a word group designation unit 203 of the search client 20 selects a word as a key search. このとき、複数視点の単語を同時に指定することも可能である。 At this time, it is also possible to specify the words in a plurality of viewpoints at the same time. 選択された単語、あるいは単語の識別子は連想検索サーバ30に送信される(T24)。 Selected word or word identifier are transmitted to the associative search server 30 (T24). 以降の処理は図8のシーケンスにおける検索要求発行手段以降の処理と同様である。 The subsequent processing is the same as the retrieval request issuing means after processing in the sequence of FIG.

ある視点から作成した概略単語を用いて再検索を行なうことにより、その視点と他の視点の関連を、文書データベースを仲介として把握することができる。 By performing search using the topic words created from a certain viewpoint, it is possible to grasp the relation of the viewpoint and other viewpoints, the document database as an intermediary. 一例を挙げると、タンパク質名から構成される概略単語を用いて、再検索を行なった場合、選択したタンパク質名に関連する文書が得られ、さらに、選択したタンパク質名に関連するタンパク質名相互作用を知ることができる。 As an example, with reference to the schematic words composed of protein names, when performing re-search, documents can be obtained related to the selected protein name, further protein names interactions associated with the selected protein name it is possible to know. このことにより、検索結果を多面的な観点から詳細に分析していくことができるようになる。 Thus, it is possible to continue to analyze in detail Results multifaceted perspective.

図9は、インデックスとして、タンパク質名と疾患名を用いた場合の例である。 9, as an index, an example of using the protein name and disease name. 上記説明と同様の手順をとることにより、利用者が興味をもつタンパク質名から、そのタンパク質名と関連する疾患名を知ることができる。 By taking the above description the same procedure, the protein name which the user has an interest, can know the disease name associated with the protein name. また、逆に、利用者が興味をもつ疾患名から、その疾患名と関連するタンパク質名を知ることができる。 Conversely, the disease name which the user has an interest, can know the protein name associated with the disease name.

次に、本発明の変形例を、図10を用いて説明する。 Next, a modification of the present invention will be described with reference to FIG.
実施例1では、どの視点で検索結果の概略を作成するかをあらかじめ固定していた。 In Example 1, whether to create a summary of search results in which the viewpoint has been previously fixed. しかし、あらかじめ複数視点からのインデックスを保持する複数の検索サーバを用意しておき、利用者が自分が利用したい視点を選択することも可能である。 However, it is also possible to advance to prepare a plurality of search server that holds the index of the advance from the plurality of viewpoints, the user selects a point of view you want to use yourself. 図10は、利用者が視点を選択するための初期画面の例である。 Figure 10 is an example of an initial screen for the user to select a viewpoint.

視点選択手段2013には、視点(view1、view2)として、選択可能な3つの視点(遺伝子“gene”によるインデックス、タンパク質“protein”によるインデックス、タンパク質間相互作用“protein interaction”)が提示されている。 The viewpoint selection unit 2013, as the viewpoint (view1, view2), 3 points of view selectable (index by gene "gene", the index by protein "protein", protein-protein interactions "protein interaction") are presented . 利用者は各視点として、どの視点から概観を得たいかを選択する。 The user as each point of view, to select whether you want to give an overview from any point of view. 図10の例では、利用者はview1としてタンパク質“protein”によるインデックス、view2としてタンパク質間相互作用“protein interaction”を選択している。 In the example of FIG. 10, the user index by protein "protein" as view1, has selected the protein-protein interactions "protein interaction" as view2.

利用者はこの後、検索要求入力エリア2011に検索要求を入力し、検索指示ボタン2012をクリックすることで検索を行なう。 After the user is this, enter a search request to a search request input area 2011, carried out a search by clicking on the search instruction button 2012. 以後の処理は実施例1と同様である。 The subsequent processing is the same as the first embodiment.

次に、本発明の別の変形例を図11を用いて説明する。 Next, another modification of the present invention will be described with reference to FIG. 11.
実施例1では、複数視点から作成されたインデックスを別々のサーバが保持していた。 In Example 1, the index created from multiple viewpoints different servers has been held. すなわち、図4のインデックスを検索サーバ40のインデックス404、図5のインデックスを検索サーバ50のインデックス504、図6のインデックスを検索サーバ60のインデックス604が保持している。 In other words, the index 404 of the search index server 40 in FIG. 4, the index 504 of the index search server 50 in FIG. 5, the index 604 of the index search server 60 in FIG. 6 is holding. しかし、検索サーバは必ずしも複数必要というわけではなく、一つの検索サーバに複数のインデックスを保持させることも可能である。 However, the search server is not necessarily the more necessary, it is possible to hold a plurality of index one search server.

図11は、一つの検索サーバに複数のインデックスを保持させる場合の構成図である。 Figure 11 is a block diagram of a case of holding a plurality of indexes into one search server. 検索サーバ70が有する文書データベース703に対して、複数視点から作成したインデックスをインデックス704、705、706として保持している。 The document database 703 the search server 70 has, holds the index created from a plurality of viewpoints as an index 704, 705, 706. ひとつの検索サーバ内に複数のインデックスを保持する場合、それぞれのインデックスは独立に保持するのが普通である。 When holding a plurality of indexes into one search in the server, each index is usually held independently. 個々のインデックスは、例えば、縦に文書、横に単語をとった行列形式とすることができる。 Individual indices can be, for example, vertically to the document, a matrix form taken words next to. 行列の要素には、その単語がその文書に何回出現するかの出現頻度情報を入れておく。 The elements of the matrix, it puts the frequency of occurrence information of whether the word appears many times in the document. この場合、複数のインデックス(行列)間で、縦軸の文書の同一性を保持する必要があるため、複数のインデックス間で同一の文書は同一の識別子によって管理する。 In this case, among a plurality of index (matrix), it is necessary to maintain the integrity of the document on the vertical axis, the same document among a plurality of indexes managed by the same identifier.

実施例1では、連想検索サーバ30が有する検索要求発行手段302が、検索要求のタイプに応じて、どの検索サーバに対して検索要求を発行するかを制御していた。 In Example 1, the retrieval request issuing unit 302 included in the associative search server 30, depending on the type of the search request, it has been controlled or issues a search request to which search server. 図11のように、検索サーバが一つの場合には、検索要求発行手段302は、検索要求のタイプに応じて、検索サーバ70のどのインデックスを用いて検索するかを制御するようにすればよい。 As shown in FIG. 11, when the search server is one, the search request issuing unit 302, depending on the type of the search request may be to control whether to search using the index of the search server 70 throat . 図7、図8のシーケンス図において、検索サーバをすべて同一の検索サーバと見なすことで、実施例1と同様の処理が行なわれる。 7, in the sequence diagram of FIG. 8, all the search servers to regard the same search server, the same treatment as in Example 1 is performed.

本発明を実現するためのシステムの構成例を示す概略図。 Schematic diagram showing a configuration example of a system for implementing the present invention. 検索クライアントにおける初期画面の例を示す図。 It shows an example of an initial screen in the search client. 検索クライアントにおける検索結果の例を示す図。 It shows an example of a search result in the search client. インデックス付けの例を示す図。 Diagram illustrating an example of indexing. インデックス付けの例を示す図。 Diagram illustrating an example of indexing. インデックス付けの例を示す図。 Diagram illustrating an example of indexing. 検索クライアント,連想検索サーバ,検索サーバの間のデータ及び処理の流れを示すシーケンス図。 Search client, associative search server, a sequence diagram showing the flow of data and processing between the search server. 検索クライアント,連想検索サーバ,検索サーバの間のデータ及び処理の流れを示すシーケンス図。 Search client, associative search server, a sequence diagram showing the flow of data and processing between the search server. 検索クライアントにおける検索結果の表示例を示す図。 It shows a display example of the search result in the search client. 検索クライアントにおける初期画面の例を示す図。 It shows an example of an initial screen in the search client. 本発明を実現するためのシステムの他の構成例を示す概略図。 Schematic diagram showing another configuration example of a system for implementing the present invention.

符号の説明 DESCRIPTION OF SYMBOLS

10:通信ネットワーク20:検索クライアント2001:連想検索指示ボタン201:検索要求入力手段2011:検索要求入力エリア2012:検索指示ボタン2013:視点選択手段202:検索結果表示手段(文書群指定手段) 10: Communication Network 20: search client 2001: the associative search instruction button 201: retrieval request inputting means 2011: a search request input area 2012: search instruction button 2013: viewpoint selecting unit 202: search result display means (documents specifying means)
2021:文書選択チェックボックス203:概略表示手段(単語群指定手段) 2021: document selection check box 203: schematic representation means (word groups designating means)
2031:単語選択チェックボックス2032:単語選択チェックボックス30:連想検索サーバ301:検索要求解析手段302:検索要求発行手段303:概略単語要求手段40:検索サーバ401:概略作成手段402:検索手段403:文書データベース404:インデックス50:検索サーバ501:概略作成手段502:検索手段503:文書データベース504:インデックス60:検索サーバ601:概略作成手段602:検索手段603:文書データベース604:インデックス70:検索サーバ701:概略作成手段702:検索手段703:文書データベース704:インデックス705:インデックス706:インデックス 2031: word selection check box 2032: word selection check box 30: the associative search server 301: search request analysis unit 302: search request issuing unit 303: topic words requesting means 40: the search server 401: schematic creation means 402: search means 403: document database 404: index 50: search server 501: schematic creating unit 502: search means 503: the document database 504: index 60: the search server 601: schematic creating unit 602: search means 603: the document database 604: index 70: search server 701 : schematic creating unit 702: search means 703: the document database 704: index 705: index 706: index

Claims (8)

  1. 検索要求を入力する入力部、検索された文書群を表示する検索結果表示部、及び前記検索された文書群の概略を表示する概略表示部を備える検索クライアントと、 An input unit for inputting a search request, a search client with the search result display section for displaying the retrieved documents, and an outline display unit for displaying an outline of the retrieved documents,
    インデックス付けされた複数の文書を格納した文書データベース、受信した検索要求に対して関連度の高い文書を前記文書データベースから検索する検索部、及び与えられた文書群に対して前記インデックスを用いて概略を作成する概略作成部を備える検索サーバとを含み、 Document database that stores indexed plurality of documents, schematically with reference to the index of high relevance document retrieval unit for retrieving from the document database, and for a given document group to the received search request and a search server comprising a summary creation unit for creating,
    前記インデックスとして種類の異なる複数のインデックスを備えることを特徴とする文書検索システム。 Document retrieval system comprising a plurality of indices of different types as the index.
  2. 請求項1記載の文書検索システムにおいて、複数の検索サーバを備え、各検索サーバはそれぞれ種類の異なるインデックスを備え、前記複数の検索サーバの文書データベース間で同一の文書は同一の識別子によって管理されていることを特徴とする文書検索システム。 In claim 1 the document retrieval system, further comprising a plurality of search servers, each search server each with index of different types, the same documents between document database of the plurality of search servers are managed by the same identifier document retrieval system, characterized in that there.
  3. 請求項1記載の文書検索システムにおいて、1つの検索サーバが前記種類の異なる複数のインデックスを備え、前記複数のインデックス間で同一の文書は同一の識別子によって管理されていることを特徴とする文書検索システム。 In claim 1 the document retrieval system according, document retrieval one search server is provided with a plurality of different indices of the type, the same document among the plurality of indexes, characterized in that it is managed by the same identifier system.
  4. 請求項1記載の文書検索システムにおいて、前記複数のインデックスのうちの1つは、残りの複数のインデックスを統合したインデックスであることを特徴とする文書検索システム。 In the document retrieval system according to claim 1, wherein one of the plurality of indexes, the document retrieval system, characterized in that an index obtained by integrating a plurality of remaining indexes.
  5. 請求項1記載の文書検索システムにおいて、前記検索クライアントの概略表示部は、異なるインデックスに対応して異なる概略を表示するインデックス毎の概略表示部を有することを特徴とする文書検索システム。 In the document retrieval system according to claim 1, schematic representation of the search client, a document retrieval system characterized by having a general display unit for each index that displays an outline different corresponding to different index.
  6. 請求項5記載の文書検索システムにおいて、前記検索クライアントは、前記概略表示部に表示された概略の要素を選択する手段を有し、前記選択された要素を前記検索要求として送信することを特徴とする文書検索システム。 In the document retrieval system according to claim 5, wherein the search client, and wherein said comprises means for selecting an element of the displayed schematic in the schematic display unit, and transmits the selected element as the search request document retrieval system.
  7. 複数の文書を格納した文書データベースと、 A document database for storing a plurality of documents,
    前記文書データベース中の文書に対して異なる視点から付与した複数種類のインデックスと、 A plurality of types of index assigned from a different perspective with respect to the document in the document database,
    受信した検索要求に対して関連度の高い文書を前記文書データベースから検索する検索部と、 A search unit to search for relevant degree document from the document database to the received search request,
    与えられた文書群に対して前記インデックスを用いて複数種類の概略を作成する概略作成部とを備え、 Using the index for a given document group and a schematic creation unit that creates a plurality of types of general,
    前記複数のインデックス間で同一の文書は同一の識別子によって管理されていることを特徴とする検索サーバ。 The same document among a plurality of index search server characterized in that it is managed by the same identifier.
  8. 検索要求を入力する入力部と、 An input unit for inputting a search request,
    受信した検索結果である文書群を表示する検索結果表示部と、 A search result display unit for displaying the documents are received search results,
    前記文書群の概略を、複数の異なる視点毎に区分して表示する概略表示部とを備え、 A schematic of the documents, and a schematic representation unit for displaying separately for each of a plurality of different viewpoints,
    前記検索結果表示部は、表示された文書群の中から次の検索のキーとなる文書を選択するための文書選択部を有し、 The search result display unit includes a document selector for selecting a document to be key for the next search from the displayed documents,
    前記概略表示部は、表示された概略の要素の中から次の検索のキーとなる要素を選択するための概略選択部を有し、 The schematic display unit includes a schematic selector for selecting the key for the next search elements among the elements of the displayed outline,
    前記入力部に入力された検索要求、前記文書選択部で選択された文書又は前記概略選択部で選択された概略の要素の情報を検索要求として送信することを特徴とする検索クライアント。 Search client and transmits the input search request to the input unit, the information elements of the outline selected in the Docs selected by the selection unit or the schematic selector as a search request.
JP2004174363A 2004-06-11 2004-06-11 Document retrieval system, retrieval server and retrieval client Withdrawn JP2005352878A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004174363A JP2005352878A (en) 2004-06-11 2004-06-11 Document retrieval system, retrieval server and retrieval client

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2004174363A JP2005352878A (en) 2004-06-11 2004-06-11 Document retrieval system, retrieval server and retrieval client
US11/036,335 US20050278293A1 (en) 2004-06-11 2005-01-18 Document retrieval system, search server, and search client

Publications (1)

Publication Number Publication Date
JP2005352878A true JP2005352878A (en) 2005-12-22

Family

ID=35461712

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004174363A Withdrawn JP2005352878A (en) 2004-06-11 2004-06-11 Document retrieval system, retrieval server and retrieval client

Country Status (2)

Country Link
US (1) US20050278293A1 (en)
JP (1) JP2005352878A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011227932A (en) * 2006-03-17 2011-11-10 Proquest-Csa Llc Method and system to index captioned objects in published literature for information discovery tasks

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100573520C (en) * 2006-08-29 2009-12-23 国际商业机器公司 Method and apparatus for preprocessing multiple documents for retrieval
US7765195B2 (en) * 2006-11-07 2010-07-27 Microsoft Corporation Trimmed and merged search result sets in a versioned data environment
US8671104B2 (en) * 2007-10-12 2014-03-11 Palo Alto Research Center Incorporated System and method for providing orientation into digital information
US8165985B2 (en) * 2007-10-12 2012-04-24 Palo Alto Research Center Incorporated System and method for performing discovery of digital information in a subject area
US8073682B2 (en) * 2007-10-12 2011-12-06 Palo Alto Research Center Incorporated System and method for prospecting digital information
US20090287676A1 (en) * 2008-05-16 2009-11-19 Yahoo! Inc. Search results with word or phrase index
US8015146B2 (en) * 2008-06-16 2011-09-06 Hitachi, Ltd. Methods and systems for assisting information processing by using storage system
US8209616B2 (en) * 2008-08-28 2012-06-26 Palo Alto Research Center Incorporated System and method for interfacing a web browser widget with social indexing
US20100057577A1 (en) * 2008-08-28 2010-03-04 Palo Alto Research Center Incorporated System And Method For Providing Topic-Guided Broadening Of Advertising Targets In Social Indexing
US8010545B2 (en) * 2008-08-28 2011-08-30 Palo Alto Research Center Incorporated System and method for providing a topic-directed search
US20100057536A1 (en) * 2008-08-28 2010-03-04 Palo Alto Research Center Incorporated System And Method For Providing Community-Based Advertising Term Disambiguation
US8452769B2 (en) * 2008-09-19 2013-05-28 International Business Machines Corporation Context aware search document
US8549016B2 (en) * 2008-11-14 2013-10-01 Palo Alto Research Center Incorporated System and method for providing robust topic identification in social indexes
US8356044B2 (en) * 2009-01-27 2013-01-15 Palo Alto Research Center Incorporated System and method for providing default hierarchical training for social indexing
US8239397B2 (en) * 2009-01-27 2012-08-07 Palo Alto Research Center Incorporated System and method for managing user attention by detecting hot and cold topics in social indexes
US8452781B2 (en) * 2009-01-27 2013-05-28 Palo Alto Research Center Incorporated System and method for using banded topic relevance and time for article prioritization
US9031944B2 (en) 2010-04-30 2015-05-12 Palo Alto Research Center Incorporated System and method for providing multi-core and multi-level topical organization in social indexes

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5685003A (en) * 1992-12-23 1997-11-04 Microsoft Corporation Method and system for automatically indexing data in a document using a fresh index table
US6457004B1 (en) * 1997-07-03 2002-09-24 Hitachi, Ltd. Document retrieval assisting method, system and service using closely displayed areas for titles and topics
US6865715B2 (en) * 1997-09-08 2005-03-08 Fujitsu Limited Statistical method for extracting, and displaying keywords in forum/message board documents
JP3696731B2 (en) * 1998-04-30 2005-09-21 株式会社日立製作所 Search methods and apparatus and structured document search program and computer readable recording medium of a structured document
GB9821787D0 (en) * 1998-10-06 1998-12-02 Data Limited Apparatus for classifying or processing data
JP3760057B2 (en) * 1998-11-19 2006-03-29 株式会社日立製作所 Document retrieval method and document search service for a plurality of document databases
US6751606B1 (en) * 1998-12-23 2004-06-15 Microsoft Corporation System for enhancing a query interface
US6691108B2 (en) * 1999-12-14 2004-02-10 Nec Corporation Focused search engine and method
WO2001075728A1 (en) * 2000-03-30 2001-10-11 I411, Inc. Methods and systems for enabling efficient retrieval of data from data collections
CN101382971A (en) * 2000-09-12 2009-03-11 株式会社医药分子设计研究所 Method of generating molecule-function network
JP4025517B2 (en) * 2001-05-31 2007-12-19 株式会社日立製作所 Document retrieval system and the server
US7162465B2 (en) * 2001-12-21 2007-01-09 Tor-Kristian Jenssen System for analyzing occurrences of logical concepts in text documents
JP2006503351A (en) * 2002-09-20 2006-01-26 ボード オブ リージェンツ ユニバーシティ オブ テキサス システム Computer program product for finding the relationship analysis of information, the system and method
JP2004318321A (en) * 2003-04-14 2004-11-11 Nec Corp Biological information retrieval system and its method
JP2004334753A (en) * 2003-05-12 2004-11-25 Hitachi Ltd Information retrieval method

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011227932A (en) * 2006-03-17 2011-11-10 Proquest-Csa Llc Method and system to index captioned objects in published literature for information discovery tasks

Also Published As

Publication number Publication date
US20050278293A1 (en) 2005-12-15

Similar Documents

Publication Publication Date Title
Osinski et al. A concept-driven algorithm for clustering search results
US7941431B2 (en) Electronic document repository management and access system
RU2324220C2 (en) Providing search request extension for user interface
US6920459B2 (en) System and method for context based searching of electronic catalog database, aided with graphical feedback to the user
KR100572797B1 (en) Retrieving matching documents by queries in any national language
US8484184B2 (en) Navigation assistance for search engines
US6980976B2 (en) Combined database index of unstructured and structured columns
US6768997B2 (en) System and method for creating a search query using movable elements in a graphical user interface
US6366956B1 (en) Relevance access of Internet information services
US6904429B2 (en) Information retrieval apparatus and information retrieval method
US20020073079A1 (en) Method and apparatus for searching a database and providing relevance feedback
US6772164B2 (en) Database system
US8352487B2 (en) Identifier vocabulary data access method and system
US5787421A (en) System and method for information retrieval by using keywords associated with a given set of data elements and the frequency of each keyword as determined by the number of data elements attached to each keyword
US20100169299A1 (en) Method and system for information extraction and modeling
JP5074378B2 (en) The user interface of the fact query engine having a snippet from the query terms and information sources, including a reply term
US7676452B2 (en) Method and apparatus for search optimization based on generation of context focused queries
KR101190230B1 (en) Phrase identification in an information retrieval system
US7039625B2 (en) International information search and delivery system providing search results personalized to a particular natural language
US20110055192A1 (en) Full text query and search systems and method of use
US6928452B2 (en) Tiered and content based database searching
JP3717808B2 (en) Information retrieval system
US20040186828A1 (en) Systems and methods for enabling a user to find information of interest to the user
JP3760057B2 (en) Document retrieval method and document search service for a plurality of document databases
CN1278263C (en) System for carrying out universal search management in one or more networks

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070206

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070409

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070904

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071102

A911 Transfer of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20071116

A912 Removal of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20071221

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20090423