JP2004046906A - Information retrieval system, information retrieval method, and recording medium recording program for information retrieval - Google Patents

Information retrieval system, information retrieval method, and recording medium recording program for information retrieval Download PDF

Info

Publication number
JP2004046906A
JP2004046906A JP2003374095A JP2003374095A JP2004046906A JP 2004046906 A JP2004046906 A JP 2004046906A JP 2003374095 A JP2003374095 A JP 2003374095A JP 2003374095 A JP2003374095 A JP 2003374095A JP 2004046906 A JP2004046906 A JP 2004046906A
Authority
JP
Japan
Prior art keywords
index
search
data
information
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003374095A
Other languages
Japanese (ja)
Inventor
Misa Namiuchi
波内 みさ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2003374095A priority Critical patent/JP2004046906A/en
Publication of JP2004046906A publication Critical patent/JP2004046906A/en
Pending legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To retrieve information by using the same retrieving method against pieces of data of a plurality of external information sources. <P>SOLUTION: In the integration type information retrieval system, an external information source searching means 78 reads pieces of data from the external information sources when creating indexes, a data converting means 76 determines whether or not data conversion is necessary with respect to an attribute of an object to be indexed in the data, and if it is necessary, an attribute value is converted. An equation calculating means 75 and an index creating means 77 creates an index and registers it in an index storing part 34 and an index value storing part 35 with respect to the value processed by the data converting means 76. A retrieval equation evaluating means of the information retrieval system carries out specified conditional retrieval of inquiry by index retrieval using the registered indexes. <P>COPYRIGHT: (C)2004,JPO

Description

 本発明は情報検索システム、情報検索方法および情報検索用プログラムを記録した記録媒体に関し、特に大規模情報源から高速に目的の情報を抽出できる情報検索システム、情報検索方法および情報検索用プログラム製品、並びにこれを担持する媒体(特に記録媒体)に関する。 The present invention relates to an information search system, an information search method, and a recording medium on which an information search program is recorded, and more particularly to an information search system, an information search method, and an information search program product that can quickly extract target information from a large-scale information source. Further, the present invention relates to a medium (especially a recording medium) carrying the same.

 従来、情報検索手段は、データベース管理システム、データウェアハウス、データマートなどの情報源において、そこに格納されたデータを検索し、要求された値、データあるいはその集合を返却するために用いられている。 Conventionally, information retrieval means is used to retrieve data stored therein in an information source such as a database management system, a data warehouse, and a data mart, and to return a requested value, data, or a set thereof. I have.

 ある情報源に対する検索要求である問合せは、一般に、検索条件式と、検索結果として何を返却するかを指定する出力式を含む。情報源の一つであるデータベースに対する問合せには、SQL(Structured Query Language)言語が一般に用いられているが、SQLでは例えば、以下のような式により、検索条件式と出力式を含む問合せを記述する。
SELECT <出力式>
FROM <検索対象リスト>
WHERE <検索条件式>
 図1(A)は、問合せを解釈し、検索結果を返却する従来の情報検索システムの構成を示すブロック図である。
A query, which is a search request for a certain information source, generally includes a search condition expression and an output expression for specifying what to return as a search result. SQL (Structured Query Language) language is generally used to query the database, which is one of the information sources. In SQL, for example, a query including a search condition expression and an output expression is described by the following expression. I do.
SELECT <output expression>
FROM <search target list>
WHERE <search condition expression>
FIG. 1A is a block diagram showing a configuration of a conventional information search system that interprets a query and returns a search result.

 図1(A)を参照すると、従来システムは、キーボードなどの入力装置1と、プログラム制御により動作するデータ処理装置2と、情報を記憶する記憶装置3と、ディスプレイ装置や印刷装置などの出力装置4とを含む。 Referring to FIG. 1A, a conventional system includes an input device 1 such as a keyboard, a data processing device 2 operated by program control, a storage device 3 for storing information, and an output device such as a display device or a printing device. And 4 inclusive.

 記憶装置3は、インデックス記憶部31と実データ記憶部30とを備えている。 The storage device 3 includes an index storage unit 31 and an actual data storage unit 30.

 実データ記憶部30は、そのシステムが定めたデータ構造で情報を保持している。 (4) The actual data storage unit 30 holds information in a data structure determined by the system.

 インデックス記憶部31は、実データから抽出した任意の属性値あるいはその組合せと、実データを一意に識別するためのIDとのペアであるインデックス(索引)を保持している。このIDを以下、データID(誤解を生じないであろう場合には単に"ID")と呼ぶ。データIDは、一意な値、あるいは、複数の値の組合せによってシステム中での一意性を確保する。インデックスは、B-木(B-tree)やハッシュ(hashing)などの構造によって管理することが一般的である。 The index storage unit 31 holds an index, which is a pair of an arbitrary attribute value or a combination thereof extracted from actual data and an ID for uniquely identifying the actual data. This ID is hereinafter referred to as a data ID (or simply "ID" if no misunderstanding occurs). The data ID secures uniqueness in the system by a unique value or a combination of a plurality of values. In general, an index is managed by a structure such as a B-tree or a hash.

 データ処理装置2は、検索手段21とインデックス生成手段22を備える。 The data processing device 2 includes a search unit 21 and an index generation unit 22.

 検索手段21は、検索式評価手段211、出力式評価手段212、インデックス検索手段213、実データ検索手段214とを備える。 The search unit 21 includes a search expression evaluation unit 211, an output expression evaluation unit 212, an index search unit 213, and an actual data search unit 214.

 検索式評価手段211は、入力装置1から与えられた問合せ文字列を解析し、インデックス検索手段213あるいは実データ検索手段214を利用して条件を満足するデータIDの集合を取得する。問合せの条件式中にインデックスが生成されている属性が記述されている場合には、インデックス検索手段213を利用し、そうでない場合には、実データ検索手段214を利用して検索する。 The search expression evaluation unit 211 analyzes the query character string provided from the input device 1 and acquires a set of data IDs satisfying the condition using the index search unit 213 or the actual data search unit 214. If the attribute in which the index is generated is described in the conditional expression of the query, the search is performed using the index search means 213; otherwise, the search is performed using the real data search means 214.

 出力式評価手段212は、検索式評価手段211の検索結果であるデータIDの集合について、出力式に指定されている形式の検索結果を作成し、出力装置4に出力する。検索結果作成にあたり、実データ検索手段214により、出力式に指定されている属性値を取得する。 The output expression evaluation unit 212 creates a search result in the format specified by the output expression for the set of data IDs that are the search results of the search expression evaluation unit 211, and outputs the result to the output device 4. In creating the search result, the actual data search means 214 acquires the attribute value specified in the output expression.

 インデックス検索手段213は、インデックス記憶部31を検索し、条件を満足する属性値を持つ実データのIDを取得し、返却する。 (4) The index search means 213 searches the index storage unit 31, acquires the ID of the actual data having the attribute value satisfying the condition, and returns it.

 実データ検索手段214は、実データ記憶部30を検索し、条件を満足する実データのIDを検索する。また、与えられたデータIDに対応する実データあるいは指定された属性値を、実データ記憶部30から取得する。 (4) The actual data search unit 214 searches the actual data storage unit 30 to find an ID of actual data that satisfies the condition. Further, the real data corresponding to the given data ID or the designated attribute value is obtained from the real data storage unit 30.

 インデックス生成手段22は、検索に先立ち、実データ記憶部30から実データを読み出し、指定された属性あるいはその組合せに対してインデックスを生成して、それをインデックス記憶部31に格納する。 The index generation means 22 reads the real data from the real data storage unit 30 prior to the search, generates an index for a specified attribute or a combination thereof, and stores it in the index storage unit 31.

 近年、このような情報検索システムを利用して大量データを検索・分析するOLAP (OnLine Analytical Processing) やデータマイニングなどのアプリケーションが増加している。この種のアプリケーションでは、段階的に変化させた条件による複数の問合せを実行してデータを分類したり、データの持つ属性に計算を施し、得られた値を利用して全体データの特徴を分析するなどの処理を行う。 In recent years, applications such as OLAP (OnLine Analytical Processing) and data mining that search and analyze large amounts of data using such information retrieval systems are increasing. In this type of application, data is classified by executing multiple queries based on gradually changing conditions, calculations are performed on the attributes of the data, and the characteristics of the entire data are analyzed using the obtained values. And other processing.

 特に、データマイニングのように、様々な計算を伴う多様なマイニング手法が提案され、それが改良され続けている分野では、それぞれの手法に必要な計算手法を高速に計算するための支援が必要である。また、そこで扱われるデータの特性に応じた高速なデータ取り出し手法(インデックス)がサポートされることが望ましい。 In particular, in the field where various mining methods involving various calculations have been proposed, such as data mining, and they are being continuously improved, it is necessary to support the high-speed calculation of the calculation methods required for each method. is there. Further, it is desirable that a high-speed data retrieval method (index) corresponding to the characteristics of the data handled therein be supported.

 また、画像や音声などのマルチメディア・データを扱うアプリケーションでは、それぞれのメディア特有のインデックス手法や、多次元データに対する多次元インデックス手法などを柔軟に取り込み、利用できるようにすることが望ましい。 ア プ リ ケ ー シ ョ ン In applications that handle multimedia data such as images and sounds, it is desirable that the index method unique to each medium and the multidimensional index method for multidimensional data be flexibly captured and used.

 さらに、近年の計算機技術の進歩により、種々の情報源で管理可能なデータ量が激増し、数ギガバイトから数テラバイトのサイズを有するものもある。したがって、このような大量データを扱うアプリケーションでは、その検索処理においてインデックスを最大限に利用し、可能な限り実データにアクセスする回数を減らすことが望ましい。 Furthermore, with recent advances in computer technology, the amount of data that can be managed by various information sources has dramatically increased, and some have a size of several gigabytes to several terabytes. Therefore, in an application that handles such a large amount of data, it is desirable to maximize the index in the search processing and reduce the number of times of accessing the actual data as much as possible.

 複数の情報源に対して検索を行う場合には、それぞれの情報源に対応した情報検索システムに対してそれぞれ問合せを発行し、その結果を統合する上位アプリケーションが利用される。この上位アプリケーションを以下、統合型情報検索システムとよぶ。 検 索 When searching for multiple information sources, a higher-level application that issues queries to the information search systems corresponding to each information source and integrates the results is used. This higher-level application is hereinafter referred to as an integrated information search system.

 図1(B)に示すように、従来のこの種の統合型情報検索システム5は、検索仲介手段51を有する。検索仲介手段51では、入力装置1から入力された問合せを、情報検索システム61〜63(情報検索システムの数は任意)に送る。このとき、それぞれの情報検索システムのデータ管理形式や問合せ方式が異なることが一般的であるため、検索仲介手段51では、それぞれの情報検索システムが解釈実行可能な形式に問合せを変換する機能を持つ。 As shown in FIG. 1B, this type of conventional integrated information search system 5 includes a search mediation unit 51. The search mediation unit 51 sends the query input from the input device 1 to the information search systems 61 to 63 (the number of information search systems is arbitrary). At this time, since the data management format and the inquiry method of each information search system are generally different, the search mediation means 51 has a function of converting the query into a format that can be interpreted and executed by each information search system. .

 情報検索システム61〜63の検索結果は、検索仲介手段51に返却される。検索仲介手段51は、この結果を統合し、必要な場合にはデータ形式の変換を行って、結果を出力装置4に出力する。 検 索 The search results of the information search systems 61 to 63 are returned to the search mediation means 51. The search mediation unit 51 integrates the result, converts the data format if necessary, and outputs the result to the output device 4.

 従来の情報検索システムの第1の問題点は、データの特性やアプリケーション特性に応じた多様なインデックス手法を柔軟に適用することができないということである。その理由は、一つの情報検索システムでは、汎用インデックス機能と実データ管理機能が同時に提供されていて、それを自由に変更できないためである。 The first problem of the conventional information retrieval system is that it is not possible to flexibly apply various indexing methods according to data characteristics and application characteristics. The reason is that one information search system provides a general-purpose index function and a real data management function at the same time, and cannot change them freely.

 第2の問題点は、問合せの出力式に含まれる属性すべてにインデックスが生成されている場合にも、問合せ結果を作成するために、検索条件を満足するすべての実データをメモリ中にロードするということである。これにより、検索結果が大量の場合には、問合せ出力を生成するために大きな処理コストが必要となる。その理由は、従来の情報検索システムでは、問合せ出力を生成するためにインデックスを利用する手段を持たないためである。 The second problem is that even when indexes are generated for all attributes included in the output expression of the query, all actual data satisfying the search condition is loaded into the memory in order to create a query result. That's what it means. As a result, when the search results are large, a large processing cost is required to generate the query output. The reason is that the conventional information retrieval system does not have means for using an index to generate an inquiry output.

 第3の問題点は、属性値を加工した値によって高速に実データを検索する手段を持たないということである。その理由は、従来のインデックスが、属性値とその組合せのみを管理するものであり、属性値を加工した値に対してインデックスを生成する手段を持たないためである。 (3) The third problem is that there is no means for retrieving actual data at high speed based on a value obtained by processing an attribute value. The reason is that the conventional index manages only attribute values and combinations thereof, and has no means for generating an index for a value obtained by processing the attribute value.

 第4の問題点は、統合型情報検索システムは実装が困難であるということである。その理由は、与えられた問合せを、任意の情報検索システムの持つデータモデル、データ構造、検索インタフェースに応じた形式に変換し、返却されたデータを統合して出力する処理を共通化、自動化することが難しいからである。 The fourth problem is that the integrated information retrieval system is difficult to implement. The reason is that a given query is converted into a format according to the data model, data structure, and search interface of any information retrieval system, and the process of integrating and outputting the returned data is standardized and automated. Because it is difficult.

 本発明の第一義とする課題は、データ構造に、プログラムによって自動的に変換可能程度の差異がある複数の外部情報源のデータに対し、より統合性の高い統合型情報検索システムを提供すること、特に同じ検索式を使って、検索処理を実行できる情報検索システムを提供することにある。 An object of the present invention is to provide an integrated information search system with higher integration of data from a plurality of external information sources whose data structure has a difference of a degree that can be automatically converted by a program. In particular, an object of the present invention is to provide an information search system that can execute a search process using the same search formula.

 本発明の他の一課題は、データやアプリケーションのそれぞれの特性に最適の多様なインデックス手法を柔軟に適用することができる情報検索システムを提供することである。 Another object of the present invention is to provide an information retrieval system that can flexibly apply various indexing methods that are optimal for characteristics of data and applications.

 本発明のさらに他の一課題は、検索条件を満足する全ての実データをメモリ中にロードする必要のない情報検索システムを提供すること、特に問合せ出力を生成するためにインデックスを利用できる情報検索システムを提供することにある。 It is still another object of the present invention to provide an information retrieval system that does not require loading of all actual data satisfying a retrieval condition into a memory, and in particular, information retrieval that can use an index to generate a query output It is to provide a system.

 本発明のさらに他の一課題は、多様な属性に対応する多数のインデックスを含む情報を、さらに効率的に検索できるようにすること、特に属性値を加工した値に対するインデックスを生成してそれを利用できる情報検索システムを提供することにある。 Still another object of the present invention is to make it possible to more efficiently search information including a large number of indexes corresponding to various attributes, in particular, to generate an index for a value obtained by processing an attribute value, and generate the index. It is to provide an information retrieval system that can be used.

 本発明の第1の視点において、情報検索システムは、複数の情報源中の属性値を予め定めた統一形式に変換するデータ変換手段と、前記データ変換手段により変換された値に対してインデックスを生成するインデックス生成手段と、前記インデックス生成手段により生成されたインデックスを使ってインデックス検索を行うインデックス検索手段と、前記インデックス検索手段を使って問合せの指定する条件検索を実施する検索式評価手段と、を備えたことを特徴とする。 In a first aspect of the present invention, an information search system includes a data conversion unit that converts attribute values in a plurality of information sources into a predetermined unified format, and an index for the value converted by the data conversion unit. Index generation means for generating, index search means for performing an index search using the index generated by the index generation means, search expression evaluation means for performing a conditional search to specify a query using the index search means, It is characterized by having.

 本発明の第2の視点において、情報検索システムは、属性値を指定された方法で加工する式計算手段と、前記式計算手段により生成された値に対してインデックスを生成するインデックス生成手段と、前記インデックス生成手段により生成されたインデックスを使ってインデックス検索を行うインデックス検索手段と、前記インデックス検索手段を使って問合せの指定する条件検索を実施する検索式評価手段と、を備えたことを特徴とする。 In a second aspect of the present invention, an information search system includes: an expression calculating unit that processes an attribute value by a specified method; an index generating unit that generates an index for a value generated by the expression calculating unit; Index search means for performing an index search using the index generated by the index generation means, and search expression evaluation means for performing a conditional search specified by a query using the index search means, I do.

 本発明の第3の視点において、情報検索システムは、複数の情報源中の属性値を予め定めた統一形式に変換するデータ変換手段と、前記データ変換手段により変換された値を指定された方法で加工する式計算手段と、前記式計算手段により加工された値に対してインデックスを生成するインデックス生成手段と、前記インデックス生成手段により生成されたインデックスを使ってインデックス検索を行うインデックス検索手段と、前記インデックス検索手段を使って問合せの指定する条件検索を実施する検索式評価手段と、を備えたことを特徴とする。 In a third aspect of the present invention, an information retrieval system comprises: a data conversion unit for converting attribute values in a plurality of information sources into a predetermined unified format; and a method for specifying a value converted by the data conversion unit. Formula calculation means for processing, index generation means for generating an index for the value processed by the formula calculation means, index search means for performing an index search using the index generated by the index generation means, A search expression evaluation unit for performing a condition search specified by a query using the index search unit.

 本発明の第4の視点において、情報検索システムは、情報源中でデータを一意に識別するIDとインデックスが生成されているすべての属性の値を管理するインデックス値記憶手段と、属性値を前記インデックス値記憶手段から検索するインデックス値検索手段と、前記インデックス値検索手段により問合せ出力式に従った問合せ結果を生成する出力式評価手段と、を備えたことを特徴とする。 In a fourth aspect of the present invention, the information retrieval system comprises: an index value storage unit that manages an ID for uniquely identifying data in an information source and values of all attributes for which an index is generated; An index value search means for searching from an index value storage means, and an output expression evaluation means for generating a query result according to a query output expression by the index value search means.

 本発明の第5の視点において、情報検索システムは、属性値を指定された方法で加工する式計算手段と、前記式計算手段により生成された値と元の属性を持つデータのIDとの組からなるインデックス値情報を生成するインデックスインデックス生成手段と、前記インデックス生成手段により生成されたインデックス値情報から前記式計算手段により加工された値を取得するインデックス値検索手段と、前記インデックス値検索手段を使って問合せの出力式に従った問合せ結果を生成する出力式評価手段と、を備えたことを特徴とする。 In a fifth aspect of the present invention, an information retrieval system comprises: a formula calculating means for processing an attribute value by a designated method; and a set of a value generated by the formula calculating means and an ID of data having an original attribute. Index value generating means for generating index value information comprising: an index value searching means for obtaining a value processed by the formula calculating means from the index value information generated by the index generating means; and the index value searching means. Output expression evaluation means for generating a query result according to the output expression of the query.

 本発明の第6の視点において、情報検索システムは、複数の情報源中の属性値を予め定めた統一形式に変換するデータ変換手段と、前記データ変換手段により変換された値と元の属性を持つデータのIDとの組からなるインデックス値情報をインデックス生成手段と、前記インデックス生成手段により生成されたインデックス値情報から前記データ変換手段により変換された値を取得するインデックス値検索手段と、前記インデックス値検索手段を使って問合せの出力式に従った問合せ結果を生成する出力式評価手段と、を備えたことを特徴とする。 In a sixth aspect of the present invention, an information search system includes: a data conversion unit configured to convert attribute values in a plurality of information sources into a predetermined unified format; and a data conversion unit configured to convert a value converted by the data conversion unit and an original attribute. Index generating means for generating index value information comprising a set of data IDs having the index value searching means for obtaining a value converted by the data converting means from the index value information generated by the index generating means; and Output expression evaluating means for generating a query result in accordance with the output expression of the query using the value search means.

 本発明の第7の視点において、情報検索システムは、複数の情報源中の属性値を予め定めた統一形式に変換するデータ変換手段と、前記データ変換手段により変換された値を指定された方法で加工する式計算手段と、前記式計算手段により加工された値と元の属性を持つデータのIDの組からなるインデックス値情報を生成するインデックス生成手段と、前記インデックス生成手段により生成されたインデックス値情報から前記データ変換手段および式計算手段により変換・加工された値を取得するインデックス値検索手段と、前記インデックス値検索手段を使って問合せの出力式に従った問合せ結果を生成する出力式評価手段と、を備えたことを特徴とする。 In a seventh aspect of the present invention, an information retrieval system comprises: a data conversion unit for converting attribute values in a plurality of information sources into a predetermined unified format; and a method for specifying a value converted by the data conversion unit. Formula calculating means for processing, index generating means for generating index value information comprising a pair of a value processed by the formula calculating means and an ID of data having an original attribute, and an index generated by the index generating means An index value search means for obtaining a value converted and processed by the data conversion means and the expression calculation means from the value information; and an output expression evaluation for using the index value search means to generate a query result according to a query output expression. Means.

 本発明の第8の視点において、本発明は、夫々、第1〜第7の各視点に対応する情報検索方法を提供する。その各特徴は、請求項の各項に記載のとおりであり、長文化を避けるため、ここに各項への引照をもって各記載を本欄に繰込むものとし、重複記載を省略する。 In the eighth aspect of the present invention, the present invention provides an information search method corresponding to each of the first to seventh viewpoints. Each feature is as described in each section of the claim, and to avoid long culture, each section is referred to here with reference to each section, and redundant description is omitted.

 本発明の第9の視点において、本発明は、請求項に対応する情報検索方法を実施するための、コンピュータ読取り可能なプログラム製品を提供する。その各特徴は、請求項に記載のとおりであり、ここに各項への引照をもって各記載を本欄に繰込むものとする。 In a ninth aspect of the present invention, the present invention provides a computer-readable program product for implementing an information retrieval method according to the claims. Each feature is as described in the claims, and each description is incorporated in this section with reference to each section.

 なお、該プログラム製品は、典型的には記録媒体に記録されたプログラム製品として具現化されるが、本発明の開示は、これに止まらず、当該プログラムはあらゆる形態の記憶装置一般(メモリ装置を含む)及び搬送波キャリアを媒体としても担持される。 Note that the program product is typically embodied as a program product recorded on a recording medium, but the disclosure of the present invention is not limited thereto, and the program may be implemented in any form of storage device in general (such as a memory device). ) And a carrier carrier as a medium.

 第1の効果は、複数の情報源に対して、高速に問合せ処理を実行することが出来ることにある。その理由は、データ構造にプログラムによって自動的に変換可能な程度(ないし範囲)に差異がある複数の外部情報源のデータを、データ変換手段によって変換し、統一した形式でインデックス生成できるように構成されており、このインデックスを使って問合せ処理を実行する手段を有しているためである。 (1) The first effect is that an inquiry process can be executed at a high speed for a plurality of information sources. The reason is that data from a plurality of external information sources whose data structures differ in the degree (or range) that can be automatically converted by a program can be converted by data conversion means to generate an index in a unified format. This is because there is a means for executing an inquiry process using this index.

 更に、実データを保持する情報源(のデータやアプリケーションの特性)とは独立に、データやアプリケーションのそれぞれの特性に最適なインデックス手法を柔軟に適用することができるという第2の効果も奏効される。その理由は、情報源とは独立にインデックス検索手段と自己のインデックス検索手段での検索に適したインデックス情報を有しているためである。 Further, the second effect that the index method optimal for each characteristic of the data and the application can be flexibly applied independently of the information source (the characteristic of the data and the application) holding the actual data is also exerted. You. This is because index information suitable for searching by the index searching means and its own index searching means is provided independently of the information source.

 また更に、問合せ中に記述されたすべての属性にインデックスが生成されている場合、実データのロード処理が不要になり、問合せ処理時間が短縮できるという第3の効果も奏効される。その理由は、一つのデータについて、インデックスが生成されているすべての属性値の各値と各データIDを統合して管理しており、インデックス値を利用して問合せ処理を行うためである。 {Circle around (3)} When indexes have been generated for all the attributes described in the query, the third effect that the load processing of the actual data becomes unnecessary and the query processing time can be shortened is also exerted. The reason is that, for one piece of data, each value of all attribute values for which an index is generated and each data ID are integrated and managed, and an inquiry process is performed using the index value.

 また更には、属性を含む式を計算することなく問合せ結果を生成することができるという第4の効果も奏効され、この結果、問合せの応答速度を短縮することができる。その理由は、属性値を加工する式の各値そのものに対するインデックスを生成し、式とインデックスとの対応関係を保持することによって、式の値を取得し利用する手段を有しているためである。 {Circle around (4)} Further, the fourth effect that the query result can be generated without calculating the expression including the attribute is also exerted, and as a result, the response speed of the query can be reduced. The reason is that an index for each value itself of the expression for processing the attribute value is generated, and a means for acquiring and using the value of the expression by maintaining the correspondence between the expression and the index is provided. .

 本発明の第1の情報検索システム形態は、実データを管理する情報源とは独立に、問合せ処理機能とインデックス管理機能を持ち、問合せの検索条件式と出力式に既にインデックスが作成されている属性が指定された場合、インデックス値のみによって問合せ結果を生成する。より具体的には、検索式評価手段(図2の711)、出力式評価手段(図2の712)、インデックス検索手段(図2の213)とインデックス値取得手段(図2の713)とを備え、問合せ中に含まれるすべての属性にインデックスが生成されている場合には、外部情報源(図2の91)にアクセスすることなく、インデックス値記憶部(図2の32)に管理されているインデックス値を利用して、問合せ結果を生成するよう動作する。 The first information retrieval system form of the present invention has a query processing function and an index management function independently of an information source that manages actual data, and an index is already created in a retrieval condition expression and an output expression of a query. When an attribute is specified, a query result is generated using only the index value. More specifically, search expression evaluation means (711 in FIG. 2), output expression evaluation means (712 in FIG. 2), index search means (213 in FIG. 2) and index value acquisition means (713 in FIG. 2) If an index is generated for all attributes included in the query, the index value is managed in the index value storage unit (32 in FIG. 2) without accessing the external information source (91 in FIG. 2). It operates to generate a query result using the index value that exists.

 また、本発明の第2の情報検索システム形態は、問合せ中の属性だけでなく、属性を含む式(加工式)に対するインデックスを管理し、その値を利用して問合せ結果を生成する。より具体的には、属性の値を計算する式計算手段(図5の75)とインデックス情報記憶部(図5の33)とを備え、問合せ中にインデックスが生成されている式が含まれるかどうかの情報をインデックス情報記憶部に調べ、含まれている場合には、インデックス値記憶部(図5の32)に管理されているインデックス値を利用して、問合せ結果を生成するよう動作する。 {Circle around (2)} The second information retrieval system form of the present invention manages not only the attribute in the query but also an index for an expression (processing expression) including the attribute, and generates a query result using the value. More specifically, it is provided with an expression calculating means (75 in FIG. 5) for calculating the value of the attribute and an index information storage unit (33 in FIG. 5), and whether the expression including the index is included in the query. The index information storage unit is checked for information as to whether or not it is included, and if it is included, an operation is performed to generate a query result using the index value managed in the index value storage unit (32 in FIG. 5).

 さらに、本発明の第3の情報検索システム形態は、複数の外部情報源のデータ形式を統一し、同一インデックスによって管理する。より具体的には、データ変換手段(図8の76)を備え、複数の外部情報源中の異なるデータ形式による同じ種類のデータに対し、そのデータ形式を一つに統一し、統一した値に対してインデックスを生成することによって、複数の外部情報源に対して一つの問合せを実行するよう動作する。 In the third information search system according to the present invention, the data formats of a plurality of external information sources are unified and managed by the same index. More specifically, a data conversion means (76 in FIG. 8) is provided, and for the same type of data in different data formats in a plurality of external information sources, the data format is unified into one and the unified values are obtained. By generating an index for the information, an operation is performed to execute one query for a plurality of external information sources.

 次に、本発明の各実施の形態について図面を参照してさらに詳細に説明する。 Next, each embodiment of the present invention will be described in more detail with reference to the drawings.

[実施形態1]
 図2を参照すると、本発明の第1の実施の形態は、キーボードなどの入力装置1と、プログラム制御により動作するデータ処理装置7と、情報を記憶する記憶装置8と、ディスプレイ装置や印刷装置などの出力装置4とから構成されている。
[Embodiment 1]
Referring to FIG. 2, a first embodiment of the present invention includes an input device 1 such as a keyboard, a data processing device 7 operated by program control, a storage device 8 for storing information, a display device and a printing device. And an output device 4.

 記憶装置8は、インデックス記憶部31とインデックス値記憶部32とを備えている。インデックス記憶部31は、実データから抽出した任意の属性値あるいはその組合せと、実データを一意に識別できるデータIDとのペアであるインデックスを保持している。 The storage device 8 includes an index storage unit 31 and an index value storage unit 32. The index storage unit 31 holds an index that is a pair of an arbitrary attribute value or a combination thereof extracted from real data and a data ID that can uniquely identify the real data.

 インデックス値記憶部32は、インデックス記憶部31にインデックスが生成されている属性の値(以下、これをインデックス値とよぶ)と、実データに一意に付加されているIDを保持している。複数の属性に対して別々のインデックスが生成されている場合には、それぞれに対応するすべてのインデックス値をIDに対応させて保持する。 The index value storage unit 32 holds the value of an attribute for which an index is generated in the index storage unit 31 (hereinafter, this is referred to as an index value) and an ID uniquely added to actual data. When different indexes are generated for a plurality of attributes, all index values corresponding to the respective attributes are held in association with the IDs.

 データ処理装置7は、検索手段71、外部情報源検索手段73、インデックス生成手段74とを含む。検索手段71は、検索式評価手段711、出力式評価手段712、インデックス検索手段213、インデックス値取得手段713を含む。 The data processing device 7 includes a search unit 71, an external information source search unit 73, and an index generation unit 74. The search unit 71 includes a search expression evaluation unit 711, an output expression evaluation unit 712, an index search unit 213, and an index value acquisition unit 713.

 検索式評価手段711は、入力装置1から与えられた問合せ文字列を解析し、インデックス検索手段213あるいは外部情報源検索手段73によって条件を満足するデータを検索する。 The search expression evaluation means 711 analyzes the query character string provided from the input device 1 and searches the index search means 213 or the external information source search means 73 for data satisfying the condition.

 出力式評価手段712は、検索式評価手段711の検索結果であるデータIDの集合について、インデックス取得手段713あるいは外部情報源検索手段73によって問合せ出力を生成し、出力装置4に送出する。 (4) The output expression evaluating means 712 generates an inquiry output by the index acquiring means 713 or the external information source searching means 73 for the set of data IDs which are the search results of the search expression evaluating means 711, and sends it to the output device 4.

 インデックス検索手段213は、インデックス記憶部31を検索して、条件式を満足する属性値を持つデータのIDを取得する。 The index search means 213 searches the index storage unit 31 and acquires the ID of data having an attribute value satisfying the conditional expression.

 インデックス値取得手段713は、与えられたID(集合)に対応するデータの指定された属性値をインデックス値記憶部32から取り出し、返却する。 (4) The index value acquisition unit 713 extracts the specified attribute value of the data corresponding to the given ID (set) from the index value storage unit 32 and returns it.

 外部情報源91は、データベースなどの情報源であり、それ自身がデータ検索手段を提供するものとする。 The external information source 91 is an information source such as a database, and provides the data search means by itself.

 外部情報源検索手段73は、与えられた問合せの処理を、実データを保持する外部情報源91に委譲する。また、与えられたデータIDに対応するデータの指定された属性値を、外部情報源から取得する。 (4) The external information source search means 73 transfers the processing of the given inquiry to the external information source 91 that holds the actual data. Further, the designated attribute value of the data corresponding to the given data ID is obtained from the external information source.

 インデックス生成手段74は、検索に先立ち、外部情報源検索手段73を使って実データを読み出し、指定された属性あるいはその組合せに対してインデックスを生成して、それをインデックス記憶部31に格納する。同時に、インデックス値記憶部32にそのインデックス値を登録する。あるデータに対して初めてインデックスが生成されたときには、データIDとインデックス値のペアがインデックス値記憶部32に登録され、それ以降は最初に生成されたデータIDとインデックス値のペアにインデックス値を追加していく。 The index generation unit 74 reads the actual data using the external information source search unit 73, generates an index for the specified attribute or a combination thereof, and stores it in the index storage unit 31 prior to the search. At the same time, the index value is registered in the index value storage unit 32. When an index is generated for a certain data for the first time, a data ID and index value pair is registered in the index value storage unit 32, and thereafter, an index value is added to the first generated data ID and index value pair. I will do it.

 次に、図2および図3のフローチャートを参照して本実施の形態の全体の動作について詳細に説明する。 Next, the overall operation of the present embodiment will be described in detail with reference to the flowcharts of FIGS.

 まず、インデックス生成処理について、図2および図3(B)を用いて説明する。 First, the index generation processing will be described with reference to FIGS. 2 and 3B.

 最初に、外部情報源検索手段73により外部情報源91から所定のデータを読み出す(図3(B)の320)。次に、インデックス生成手段74においてインデックスが生成され(321)、インデックス記憶部31、インデックス値記憶部32に登録される(322)。この「所定データ」の読み出し自体は、公知の仕方で夫々の求める属性と関連する外部情報源に適した夫々の検索分野、対象キーワード等の指定等に基づいて行うことができる。 (4) First, predetermined data is read from the external information source 91 by the external information source searching means 73 (320 in FIG. 3B). Next, an index is generated by the index generating means 74 (321) and registered in the index storage unit 31 and the index value storage unit 32 (322). The reading of the “predetermined data” itself can be performed in a known manner based on the designation of each search field, the target keyword, etc., which is suitable for the external information source associated with each desired attribute.

 次に、検索処理について、図2および図3(A)を用いて説明する。 Next, the search processing will be described with reference to FIGS. 2 and 3A.

 まず、入力装置1から入力された問合せを検索式評価手段711により解析する(図3(A)の301)。そして、インデックス記憶部31を検索して、その問合せの検索条件式中に含まれるすべての属性に事前にインデックスが生成されているかどうかを判定する(302)。もしすべての属性にインデックスが生成されていたとすると、インデックス検索手段213がインデックス記憶部31を検索してインデックス値を取得し、検索条件式を評価する(303)。インデックス未生成の属性が含まれる場合には、外部情報源検索手段73により、問合せ全体の処理を外部情報源91に委譲し(304)、得られた結果をそのまま出力装置4から出力する(310)。 First, the query input from the input device 1 is analyzed by the search expression evaluation means 711 (301 in FIG. 3A). Then, the index storage unit 31 is searched to determine whether indexes have been generated in advance for all attributes included in the search condition expression of the query (302). If indexes have been generated for all attributes, the index search means 213 searches the index storage unit 31 to obtain an index value and evaluates a search condition expression (303). If an attribute for which an index has not been generated is included, the processing of the entire query is transferred to the external information source 91 by the external information source searching means 73 (304), and the obtained result is output from the output device 4 as it is (310). ).

 検索式中のすべての属性にインデックスが生成されている場合、次に、検索結果を出力する処理を行う。まず、出力式評価手段712が問合せ中の出力式に属性が含まれているかどうかを判定する(305)。含まれていない場合には、出力式評価手段712が出力式を評価し(306)、結果を出力する(310)。 (4) If indexes have been generated for all the attributes in the search expression, next, a process of outputting the search results is performed. First, the output expression evaluation means 712 determines whether the output expression being queried includes an attribute (305). If not included, the output expression evaluation means 712 evaluates the output expression (306) and outputs the result (310).

 出力式に属性が含まれている場合には、それらの属性すべてにインデックスが生成されているかどうかを判定する(307)。すべての属性にインデックスが生成されている場合、インデックス値取得手段713によりインデックス値記憶部32を検索し、出力式が指定する属性値を取り出す(308)。インデックス未生成の属性が含まれる場合には、外部情報源検索手段73により、外部情報源91から属性値を取り出す(309)。このとき、外部情報源91から取り出すデータは、検索条件式に対するインデックス検索(303)の結果、抽出されたデータのみを対象とする。最後に、出力式に沿って処理結果を生成し、出力する(310)。 (4) If the output formula includes attributes, it is determined whether or not indexes have been generated for all of the attributes (307). When indexes have been generated for all the attributes, the index value obtaining unit 713 searches the index value storage unit 32 and extracts the attribute value specified by the output expression (308). If an attribute for which an index has not been generated is included, the attribute value is extracted from the external information source 91 by the external information source search means 73 (309). At this time, the data extracted from the external information source 91 targets only the data extracted as a result of the index search (303) for the search condition expression. Finally, a processing result is generated and output according to the output equation (310).

 次に、本実施の形態の効果について説明する。 Next, the effects of the present embodiment will be described.

 本実施の形態では、インデックス記憶部31とインデックス検索手段213を外部情報源91の実データと分離して実装するというように構成されているため、実データを管理する情報源とは独立して様々なインデックス手法を適用することができる。 In the present embodiment, since the index storage unit 31 and the index search unit 213 are configured to be implemented separately from the actual data of the external information source 91, the index storage unit 31 and the index search unit 213 are independent of the information source that manages the actual data. Various indexing techniques can be applied.

 また、本実施の形態では、さらに、問合せの出力式に沿って検索結果を生成する場合に、出力式に含まれる属性すべてにインデックスが生成されているときには、インデックス値記憶部32に格納された値を利用するというように構成されているため、出力を生成するために実データを外部情報源91からロードする必要がなく、ロードにかかる時間を節約することができる。 Further, in the present embodiment, when the search result is generated along the output expression of the query, when the indexes are generated for all the attributes included in the output expression, the search result is stored in the index value storage unit 32. Since the configuration is such that the value is used, it is not necessary to load the actual data from the external information source 91 to generate the output, and the time required for loading can be saved.

[実施例1]
 次に、具体的な実施例を用いて本実施形態1の動作を説明する。
[Example 1]
Next, the operation of the first embodiment will be described using a specific example.

 図4に示すように、外部情報源401中の従業員情報(実データ)を記録した従業員テーブル402に対して、事前にインデックス生成手段74により、インデックス記憶部403に、各種属性(ここでは、名前、生年月日(及び/又は年令)、役職等)に分類したインデックステーブルとしてインデックスが生成されている。即ち、属性「名前」に対する名前インデックス404、属性「生年月日」に対する生年月日インデックス405、属性「役職」に対する役職インデックス406、属性「所属」に対する所属インデックス407が生成されているとする。 As shown in FIG. 4, various attributes (here, in the present embodiment) are stored in the index storage unit 403 by the index generation means 74 in advance for the employee table 402 in which employee information (actual data) in the external information source 401 is recorded. , Name, date of birth (and / or age), position, etc.). That is, it is assumed that a name index 404 for the attribute “name”, a birth date index 405 for the attribute “birth date”, a post index 406 for the attribute “post”, and a belonging index 407 for the attribute “affiliation” have been generated.

 インデックス値記憶部408には、これらすべてのインデックスデータIDと値との対応関係を管理するインデックス値テーブル409を格納する。インデックス値テーブル409中の一行は、一つのデータのIDと、そのデータのうちインデックスが生成されている属性すべての値を保持している。インデックス値テーブル409で持つインデックス値は、インデックス記憶部403に格納された各インデックス中のインデックス値へのポインタでも、それをコピーした値そのものでも、どちらを利用してもよい。コピーしたインデックス値が占めるメモリ領域がマシン環境を圧迫しない限りにおいては、コピー値を保持した方が性能が上がる。 The index value storage unit 408 stores an index value table 409 for managing the correspondence between all of these index data IDs and values. One row in the index value table 409 holds the ID of one data and the values of all the attributes of the data for which an index is generated. The index value held in the index value table 409 may be either a pointer to an index value in each index stored in the index storage unit 403, or a copied value itself. As long as the memory area occupied by the copied index value does not overwhelm the machine environment, the performance is better when the copied value is held.

 ここに、問合せ「従業員の中で、総務部の課長の名前を検索せよ」が入力された場合を考える。これは、SQLでは問合せ1のように表現される。ここで、Eは従業員テーブル402を表現するものとする。
SELECT E.名前
FROM E
WHERE E.所属 = '総務' AND E.役職 = '課長';  [問合せ1]
Here, it is assumed that the query “Search for the name of the section manager of the general affairs department among employees” is input. This is expressed in SQL as Query 1. Here, E represents the employee table 402.
SELECT E. name
FROM E
WHERE E. Affiliation = 'General Affairs' AND E. Title = 'Manager'; [Query 1]

 まず、検索式評価手段711により、インデックス記憶部403が検索され、検索条件式(問合せ1のWHERE以下)中の属性「所属」および「役職」にインデックスが生成されていることが確認される。条件式中に他にインデックスが生成されていない属性は存在しないので、インデックス検索手段213によりインデックス記憶部403の対応するインデックスからインデックス値を取得し、条件判定を実施する。そして、結果として検索条件を満足するデータID集合が得られる。 First, the search expression evaluation means 711 searches the index storage unit 403, and confirms that an index has been generated for the attributes “affiliation” and “post” in the search condition expression (WHERE of query 1 and below). Since there is no other attribute in which no index is generated in the conditional expression, the index search unit 213 acquires an index value from the corresponding index in the index storage unit 403, and performs a condition determination. As a result, a data ID set satisfying the search condition is obtained.

 次に、出力式評価手段712において、検索結果を生成するために出力式「E.名前」を評価する。この中に含まれる属性「名前」にはインデックスが生成されており、この他にインデックスが生成されていない属性は含まれていないので、インデックス値取得手段713により、インデックス値記憶部408から、結果のID集合の要素それぞれに対応する「名前」の値を取り出す。そして、それらを出力装置4に返却する。 Next, the output expression evaluation means 712 evaluates the output expression “E. name” in order to generate a search result. The attribute "name" contained therein has an index generated, and does not include any other attribute for which no index has been generated. Therefore, the index value obtaining unit 713 reads the result from the index value storage unit 408. Extract the value of "name" corresponding to each element of the ID set of. Then, they are returned to the output device 4.

 次の問合せ2の場合は、問合せ1と出力式が異なり、出力式に属性を含まない。このため、検索式の評価は問合せ1と同様の処理を行うが、出力式の評価は、検索式の評価結果を基に、外部情報源401にはアクセスせず、自システム(出力式評価手段712)内で評価を完了することができる(図3(A)の306)。
SELECT COUNT(*) AS N
FROM E
WHERE E.所属 = '総務' AND E.役職 = '課長'; [問合せ2]
In the case of the following query 2, the output expression differs from that of query 1, and the output expression does not include any attributes. For this reason, the evaluation of the search expression performs the same processing as that of the query 1, but the evaluation of the output expression does not access the external information source 401 based on the evaluation result of the search expression, but the own system (output expression evaluation means). The evaluation can be completed within 712) (306 in FIG. 3A).
SELECT COUNT (*) AS N
FROM E
WHERE E. Affiliation = 'General Affairs' AND E. Title = 'Manager'; [Query 2]

 以上の処理においては、問合せ全体を評価するために外部情報源401にアクセスせず、すべて自システム内で評価を完了することができるため、外部情報源401からの実データのロード時間を省略することができる。 In the above processing, since the evaluation can be completed in the own system without accessing the external information source 401 to evaluate the entire query, the load time of the actual data from the external information source 401 is omitted. be able to.

 一方、以下の問合せ3の場合には、検索条件式にインデックスが生成されていない属性「職級」を含むため、検索評価手段711は、外部情報源検索手段73を使って外部情報源401に処理を委譲する(図3(A)の304)。そして外部情報源401から返却された検索結果を、出力装置4に返却する(310)。
SELECT E.名前
FROM E
WHERE E.役職 = '課長' AND E.職級 <> 'A7'; [問合せ3]
On the other hand, in the case of Query 3 below, since the search condition expression includes the attribute “job class” for which no index has been generated, the search evaluation unit 711 processes the external information source 401 using the external information source search unit 73. Is transferred (304 in FIG. 3A). Then, the search result returned from the external information source 401 is returned to the output device 4 (310).
SELECT E. name
FROM E
WHERE E. Position = 'Manager' AND E. Position <>'A7'; [Query 3]

 ここで、他のインデックス手法、例えば、従業員の顔写真データ(属性「顔」)に対し、類似画像検索用インデックスを導入する場合を考える。この場合は、類似画像検索用インデックス生成手段をインデックス生成手段74として組み込み、類似画像検索用インデックス検索手段をインデックス検索手段213およびインデックス値取得手段713に組み込み、インデックス記憶部403およびインデックス値記憶部408に類似画像検索用インデックスの値(情報)を格納すれば良く、外部情報源401に影響を与えることはない。 Here, consider another indexing method, for example, a case where a similar image search index is introduced for employee face photograph data (attribute “face”). In this case, the similar image search index generation unit is incorporated as the index generation unit 74, the similar image search index search unit is incorporated into the index search unit 213 and the index value acquisition unit 713, and the index storage unit 403 and the index value storage unit 408 are used. , The value (information) of the similar image search index may be stored, and the external information source 401 is not affected.

[実施形態2]
 次に、本発明の第2の実施の形態について図面を参照して詳細に説明する。
[Embodiment 2]
Next, a second embodiment of the present invention will be described in detail with reference to the drawings.

 図5を参照すると、本発明の第2の実施の形態は、記憶装置13の構成が、図2に示された第1の実施の形態における記憶装置8の構成に加え、インデックス情報記憶部33を有する点で異なる。また、データ処理装置10の構成が、図2に示された第1の実施の形態における記憶装置7の構成に加え、式計算手段75を有する点で異なる。 Referring to FIG. 5, in the second embodiment of the present invention, the configuration of the storage device 13 is different from the configuration of the storage device 8 in the first embodiment shown in FIG. In that it has Further, the configuration of the data processing device 10 is different from the configuration of the storage device 7 in the first embodiment shown in FIG.

 インデックス情報記憶部33は、インデックスとして登録されている属性とインデックス記憶部31のインデックス集合の対応を管理する。属性を加工した値に対してインデックスを生成する場合には、その加工式とインデックスとの対応を管理する。 The index information storage unit 33 manages the correspondence between the attribute registered as an index and the index set in the index storage unit 31. When an index is generated for a value obtained by processing an attribute, the correspondence between the processing formula and the index is managed.

 式計算手段75は、属性を加工した値に対してインデックスを生成する場合に、属性値を加工(計算)してインデックス値を生成する処理を行う。属性値の加工方法は、予めユーザによって指定されているとする。 When generating an index for a value obtained by processing an attribute, the formula calculation means 75 performs processing for processing (calculating) the attribute value to generate an index value. It is assumed that the attribute value processing method is specified in advance by the user.

 図5および図6、図7のフローチャートを参照して本実施の形態の全体の動作について詳細に説明する。 (5) The overall operation of the present embodiment will be described in detail with reference to the flowcharts of FIGS.

 まず、インデックス生成処理について、図5および図7を用いて説明する。最初に、生成するインデックス情報をインデックス情報記憶部33に登録する(図7の620)。このインデックス情報には、インデックス生成対象データのテーブル名、属性名の他、属性の加工値をインデックス登録する場合には、その加工式の情報を含む。次に、外部情報源検索手段73により外部情報源91からデータを読み出す(320)。そして、属性を加工(計算)した値をインデックス化するよう指定されている場合には(621)、式計算手段74によってインデックス値を計算する(622)。指定されてない場合には、式計算手段74では何もしない。最後に、インデックス生成手段74において、指定された方法でインデックスを生成し(321)、インデックス記憶部31、インデックス値記憶部32に登録する(322)。 First, the index generation processing will be described with reference to FIGS. First, the generated index information is registered in the index information storage unit 33 (620 in FIG. 7). The index information includes, in addition to the table name and the attribute name of the index generation target data, information on the processing formula when a processed value of the attribute is registered in the index. Next, data is read from the external information source 91 by the external information source search means 73 (320). If it is specified that the value obtained by processing (calculating) the attribute is to be indexed (621), the index value is calculated by the formula calculating means 74 (622). If not specified, the formula calculation means 74 does nothing. Finally, the index generation means 74 generates an index by a designated method (321), and registers it in the index storage unit 31 and the index value storage unit 32 (322).

 次に、検索処理について説明する。 Next, search processing will be described.

 まず、検索式評価手段711が入力装置1より入力された問合せを解析し(図6の301)、インデックス情報記憶部33を検索して検索条件式にインデックスが生成されていない式あるいは属性が含まれるどうかを調べる(601)。インデックスが生成されていない式あるいは属性が含まれる場合(YES)には、外部情報源検索手段73により、外部情報源91に検索処理を委譲する(304)。 First, the search expression evaluation means 711 analyzes the query input from the input device 1 (301 in FIG. 6), searches the index information storage unit 33, and includes, in the search condition expression, an expression or attribute for which an index has not been generated. Investigate whether it is possible (601). If an expression or attribute for which an index has not been generated is included (YES), the external information source searching means 73 delegates the search processing to the external information source 91 (304).

 検索条件式中の式にインデックスが生成されている場合には、インデックス記憶部31を検索し、インデックス値を取得する(603)。次に、インデックス値が取得されていないすべての属性について、インデックス検索手段213がインデックス記憶部31を検索してインデックス値を取得し、検索条件式を評価し、条件を満足するデータIDを得る(303)。 (4) If an index is generated for an expression in the search condition expression, the index storage unit 31 is searched to obtain an index value (603). Next, for all attributes for which an index value has not been obtained, the index search means 213 searches the index storage unit 31 to obtain an index value, evaluates a search condition expression, and obtains a data ID satisfying the condition ( 303).

 次に、検索結果を出力する処理を行う。まず、出力式評価手段712が問合せ中の出力式に属性が含まれているかどうかを判定する(305)。含まれていない場合には、出力式評価手段712により出力式を評価し、結果を生成する(306)。 (4) Next, a process of outputting a search result is performed. First, the output expression evaluation means 712 determines whether the output expression being queried includes an attribute (305). If not included, the output expression is evaluated by the output expression evaluation means 712 to generate a result (306).

 出力式に属性が含まれている場合には、すべての属性あるいは式にインデックスが生成されているかどうかを、インデックス情報記憶部33を検索して判定する(604)。インデックスが生成されていない式あるいは属性が含まれる場合には、外部情報源検索手段73により、検索条件を満足したデータ集合に対してのみ、外部情報源91から属性値を取り出し(309)、出力式を生成する(310)インデックスが生成されている場合には、インデックス値取得手段713によりインデックス値記憶部32を検索し、出力式が指定する式の値を取り出す。式に対してインデックスが生成されている場合には(605)、式のインデックス値を取得し(606)、残りの属性値を取り出す(308)。最後に、出力式に沿って処理結果を生成し、出力する(310)。 If the output expression includes an attribute, the index information storage unit 33 is searched to determine whether indexes have been generated for all attributes or expressions (604). If an index or an attribute for which an index has not been generated is included, the external information source searching means 73 extracts an attribute value from the external information source 91 only for a data set that satisfies the search condition (309), and outputs it. Generating an Expression (310) If an index has been generated, the index value obtaining unit 713 searches the index value storage unit 32 and extracts the value of the expression specified by the output expression. If an index has been generated for the expression (605), the index value of the expression is obtained (606), and the remaining attribute values are extracted (308). Finally, a processing result is generated and output according to the output equation (310).

 次に、本実施の形態の効果について説明する。 Next, the effects of the present embodiment will be described.

 本実施の形態では、インデックス情報記憶部33によって属性を含む式に生成されたインデックスが管理されるように構成されているため、属性を含む式の値を計算することなく、条件判定、値の取り出し、および、検索結果生成を行うことができる。 In the present embodiment, since the index information storage unit 33 is configured to manage the index generated in the expression including the attribute, the condition determination and the value determination are performed without calculating the value of the expression including the attribute. Retrieval and search result generation can be performed.

[実施例2]
 次に、具体的な実施例2を用いて本実施の形態の動作を説明する。
[Example 2]
Next, the operation of the present embodiment will be described using a specific example 2.

 図8に示すように、インデックス記憶部702には、式「age(生年月日)」について式計算手段75によって予め値が計算された年齢インデックス705が生成されているものとする。ここで"age()"は、年齢を計算するための関数とする。このとき、インデックス情報記憶部701には、属性に対するインデックス情報だけでなく、この式に対応するインデックス情報が同時に管理されている。本実施例では、インデックス情報テーブル704に、年齢インデックスの情報が格納されている。 年 齢 As shown in FIG. 8, it is assumed that the index storage unit 702 has generated an age index 705 in which the value of the expression “age (date of birth)” is calculated in advance by the expression calculating unit 75. Here, "age ()" is a function for calculating age. At this time, the index information storage unit 701 simultaneously manages not only the index information for the attribute but also the index information corresponding to this expression. In this embodiment, the index information table 704 stores information on the age index.

 ここで、問合せ「従業員の中で、50歳以上の課長の名前を検索せよ」が入力された場合を考える。これは、SQLでは問合せ4のように表現される。
SELECT E.名前
FROM E
WHERE E.役職 = '課長' AND age(E.生年月日) > 50; [問合せ4]
Here, it is assumed that the query “Search for the names of section managers over 50 years old among employees” is input. This is expressed in SQL as Query 4.
SELECT E. name
FROM E
WHERE E. Position = 'Manager' AND age (E. Date of birth)>50; [Query 4]

 このとき検索式評価手段711は、インデックス情報記憶部701のインデックス情報テーブル704を検索し、式「age(E.生年月日)」にインデックスが生成されていると知る(602)。これにより、インデックス検索手段213が「age(E.生年月日)」に対応するインデックスを検索し(603)、検索条件式を評価する。このとき、「age(E.生年月日)」の値は年齢インデックス705より取得するので、属性「生年月日」の値を使って計算する必要はない。 At this time, the search expression evaluation means 711 searches the index information table 704 of the index information storage unit 701, and knows that an index has been generated for the expression "age (E. Birth date)" (602). As a result, the index search means 213 searches the index corresponding to “age (E. birth date)” (603), and evaluates the search condition expression. At this time, since the value of “age (E. date of birth)” is obtained from the age index 705, there is no need to calculate using the value of the attribute “date of birth”.

[実施形態3]
 次に、本発明の第3の実施の形態について図面を参照して詳細に説明する。
[Embodiment 3]
Next, a third embodiment of the present invention will be described in detail with reference to the drawings.

 図9を参照すると、本発明の第3の実施の形態は、データ処理装置12の構成が、図5に示された第2の実施の形態におけるデータ処理装置10の構成に加え、データ変換手段76を有する点で異なる。また、外部情報源検索手段78の検索対象が、単一ではなく複数の情報源(91, 92, 93)を対象とする点で異なる。 Referring to FIG. 9, according to a third embodiment of the present invention, the configuration of the data processing device 12 is different from the configuration of the data processing device 10 in the second embodiment shown in FIG. It differs in having 76. Another difference is that the search target of the external information source search means 78 is not a single target but a plurality of information sources (91, 92, 93).

 データ変換手段76は、複数の外部情報源からインデックス作成用の属性値をそれぞれ取得し、データの形式を統一する。データ形式統一のために変換手段は、情報源ごとに予め与えられているものとする。 The data conversion means 76 acquires the attribute values for index creation from a plurality of external information sources, and unifies the data format. It is assumed that the conversion means is provided in advance for each information source in order to unify the data format.

 インデックス記憶部34では、第1の実施の形態および第2の実施の形態におけるインデックス記憶部31では単一情報源を対象とするため各属性値に対応するデータのIDだけを保持していたのに対し、複数の情報源中のデータに対するインデックスを管理するために、外部情報源を一意に特定するための情報源ID、その情報源の中でデータを特定するためのデータIDを保持する。 In the index storage unit 34, the index storage unit 31 in the first embodiment and the second embodiment holds only the ID of data corresponding to each attribute value because it targets a single information source. In order to manage an index for data in a plurality of information sources, an information source ID for uniquely specifying an external information source and a data ID for specifying data among the information sources are held.

 インデックス値記憶部35も、第1の実施の形態および第2の実施の形態におけるインデックス値記憶部32と異なり、外部情報源を一意に特定するための情報源ID、その情報源の中でデータを特定するためのデータIDおよび形式を統一するために変換した結果の属性値の集合を保持する。 The index value storage unit 35 is also different from the index value storage unit 32 in the first and second embodiments in that an information source ID for uniquely specifying an external information source and data in the information source are stored. Holds a set of attribute values resulting from conversion to unify the data ID and format for specifying

 インデックス生成手段77は、第1の実施の形態および第2の実施の形態におけるインデックス生成手段74では、属性値とデータIDのペアでインデックスを生成しているのに対し、属性値とデータIDおよび情報源IDのセットでインデックスを生成する。 The index generation unit 77 generates an index using a pair of an attribute value and a data ID in the index generation unit 74 according to the first and second embodiments. Generate an index with a set of source IDs.

 外部情報源検索手段78は複数の情報源を検索対象とし、その中の指定された情報源にアクセスする。 (4) The external information source searching means 78 sets a plurality of information sources as search targets, and accesses a specified information source among them.

 インデックス検索手段717では、インデックス記憶部34のインデックスを利用して検索条件を満足するデータ集合を取得するが、このとき、データIDだけではなく情報源IDも同時に取得し、そのペアを結果として返却する。 The index search means 717 uses the index of the index storage unit 34 to obtain a data set satisfying the search condition. At this time, not only the data ID but also the information source ID is obtained at the same time, and the pair is returned as a result. I do.

 出力式評価手段716では、インデックス検索手段717から情報源IDとデータIDのペアの集合を受け取り、それに対応する指定された属性値をインデックス値取得手段718あるいは外部情報源検索手段78により取得する。そして、得られた値から指定された形式の検索結果を生成し、出力装置4に出力する。 The output expression evaluating means 716 receives the set of pairs of the information source ID and the data ID from the index searching means 717, and obtains the specified attribute value corresponding thereto by the index value obtaining means 718 or the external information source searching means 78. Then, a search result in a specified format is generated from the obtained value and output to the output device 4.

 図9、図10のフローチャートを参照して本実施の形態の全体の動作について詳細に説明する。 全体 The overall operation of the present embodiment will be described in detail with reference to the flowcharts of FIGS.

 まず、インデックスを生成するために、外部情報源から外部情報源検索手段78によりデータを読み出す(図10の620)。次に、データ変換手段76において、読み出したデータ中のインデックスを生成する対象の属性に対し、データ変換が必要かどうかを判定する(901)。もしデータ変換が必要ならば、予め登録された変換手段によって属性値を変換する(902)。ある情報源のある属性に対し、インデックス生成に際してデータ変換が必要かどうかの情報と変換手段は、ユーザによって情報源ごと、インデックス化する属性ごとに定義され、提供されているものとする。データ変換が不要の場合には、データ変換手段76では何もしない。 First, in order to generate an index, data is read from the external information source by the external information source search means 78 (620 in FIG. 10). Next, the data conversion means 76 determines whether data conversion is necessary for the attribute for which an index is to be generated in the read data (901). If data conversion is necessary, the attribute value is converted by a conversion means registered in advance (902). It is assumed that information on whether or not data conversion is necessary for index generation for an attribute of a certain information source and conversion means are defined and provided by the user for each information source and each attribute to be indexed. If data conversion is not required, the data conversion means 76 does nothing.

 次に、データ変換手段76で処理された値に対し、式計算手段75およびインデックス生成手段77においてインデックスが生成され(621, 622, 321)、インデックス記憶部34、インデックス値記憶部35に登録される(322)。 Next, for the value processed by the data conversion means 76, an index is generated by the formula calculation means 75 and the index generation means 77 (621, 622, 321) and registered in the index storage part 34 and the index value storage part 35. (322).

 生成されたインデックスを利用した検索方法は、第2の実施の形態における方法と同様である。ただしこのとき、インデックス記憶部34からは外部情報源のIDとデータIDが含まれるので、外部情報源を検索する場合(図6の309)には、外部情報源検索手段78においてこの2つのIDを基にデータの取り出しを行う。 検 索 The search method using the generated index is the same as the method in the second embodiment. However, at this time, since the ID of the external information source and the data ID are included from the index storage unit 34, when searching for the external information source (309 in FIG. 6), the external information source searching means 78 uses the two IDs. Extract data based on

 次に、本実施の形態の効果について説明する。 Next, the effects of the present embodiment will be described.

 本実施の形態では、データ構造にプログラムによって自動的に変換可能程度の差異がある複数の外部情報源のデータを、データ変換手段76によって変換し、統一した形式でインデックス生成できるように構成されているため、複数の情報源にまたがる検索を、同じ検索式を使って、高速に実行することができる。 The present embodiment is configured so that data of a plurality of external information sources having a difference in a data structure that can be automatically converted by a program in a data structure can be converted by a data conversion unit 76 and index generation can be performed in a unified format. Therefore, a search over a plurality of information sources can be executed at high speed using the same search formula.

[実施例3]
 次に、具体的な実施例3を用いて本実施の形態の動作を説明する。
[Example 3]
Next, the operation of this embodiment will be described using a specific example 3.

 図11に示すように、共に従業員情報を管理する外部情報源401と外部情報源1003が存在する場合を考える。外部情報源401と外部情報源1003で管理する従業員情報の内容はほぼ同じだが、生年月日データの管理方法が外部情報源401の従業員テーブル402では西暦であるのに対し、外部情報源1003の従業員テーブル1004が和暦で管理されているように、データ形式が若干異なるものとする。 {Suppose that there is an external information source 401 and an external information source 1003 that both manage employee information as shown in FIG. Although the contents of employee information managed by the external information source 401 and the external information source 1003 are almost the same, the management method of the date of birth data is based on the year in the employee table 402 of the external information source 401, whereas the external information source It is assumed that the data format is slightly different so that the employee table 1004 of 1003 is managed in the Japanese calendar.

 外部情報源401と外部情報源1003からデータを抽出し、属性「生年月日」に対してインデックスを生成する場合、外部情報源検索手段78によって双方の情報源からデータが抽出される。 (4) When data is extracted from the external information source 401 and the external information source 1003 and an index is generated for the attribute “date of birth”, the external information source search unit 78 extracts data from both information sources.

 従業員テーブル402のデータの属性「生年月日」に対しては、変換指定がユーザから与えられていない。よってデータ変換部76では何もせず、そのままインデックス生成手段77によってインデックスが生成される。 変 換 The conversion specification is not given by the user for the attribute “birth date” of the data in the employee table 402. Therefore, the data conversion unit 76 does nothing, and the index is generated by the index generation unit 77 as it is.

 一方、従業員テーブル1004の場合には、データ変換手段76によって、属性「生年月日」のデータ形式を変換する。ここで、予め、従業員テーブル1004の属性「生年月日」に対し、和暦を西暦に変換するプログラムを適用してインデックス生成するよう、ユーザが指定しているとする。データ変換手段76では、この情報を基に、従業員テーブル1004から抽出したデータの属性「生年月日」を西暦に変換する。そして、インデックス生成手段77において、変換した属性値と外部情報源1003のID(ここでは"2"とする)と、データのIDを使ってインデックスを生成し、インデックス記憶部34およびインデックス値記憶部35に登録する。 On the other hand, in the case of the employee table 1004, the data format of the attribute “date of birth” is converted by the data conversion means 76. Here, it is assumed that the user has specified in advance that an attribute is to be generated for the attribute “date of birth” of the employee table 1004 by applying a program for converting the Japanese calendar to the Christian calendar. The data conversion means 76 converts the attribute “date of birth” of the data extracted from the employee table 1004 into the Christian era based on this information. Then, the index generation means 77 generates an index using the converted attribute value, the ID of the external information source 1003 (here, “2”) and the data ID, and stores the index storage unit 34 and the index value storage unit. Register to 35.

 以上の処理により、外部情報源401と外部情報源1003に対し、同じインデックスを利用して検索ができるようになる。 Through the above processing, the external information source 401 and the external information source 1003 can be searched using the same index.

[実施形態4]
 次に、本発明の第4の実施の形態について図面を参照して詳細に説明する。
[Embodiment 4]
Next, a fourth embodiment of the present invention will be described in detail with reference to the drawings.

 図12を参照すると、本発明の第4の実施の形態は、情報検索プログラムを記録した記録媒体11を備える。この記録媒体11は磁気ディスク、半導体メモリその他の記録媒体であってよい。 Referring to FIG. 12, the fourth embodiment of the present invention includes a recording medium 11 on which an information search program is recorded. This recording medium 11 may be a magnetic disk, a semiconductor memory, or another recording medium.

 情報検索プログラムは記録媒体11からデータ処理装置12に読み込まれ、データ処理装置12の動作を制御する。データ処理装置12は検索プログラムの制御により、以下の処理、すなわち第1および第2および第3の実施の形態におけるデータ処理装置および記憶装置による処理と同一の処理、を実行する。 The information search program is read from the recording medium 11 into the data processing device 12, and controls the operation of the data processing device 12. The data processing device 12 executes the following processing, that is, the same processing as the processing by the data processing device and the storage device in the first, second, and third embodiments under the control of the search program.

 入力装置1から問合せが与えられると、まず、この問合せの検索条件式中にインデックスが生成された式あるいは属性が存在するかどうかを、インデックス情報記憶部33を検索して調べる。検索式中のすべての式あるいは属性にインデックスが生成されている場合には、インデックス記憶部34を検索し、条件判定を行う。インデックスが生成されていない属性が含まれる場合には、外部情報源91〜93に問合せ処理を委譲する。 When an inquiry is given from the input device 1, first, the index information storage unit 33 is searched to determine whether an expression or an attribute in which an index is generated exists in the search condition expression of the inquiry. When indexes have been generated for all the expressions or attributes in the search expression, the index storage unit 34 is searched to determine the condition. If an attribute for which an index has not been generated is included, the inquiry processing is delegated to the external information sources 91 to 93.

 インデックス検索を実施した場合には、次に、検索結果を出力する。このとき、出力式中にインデックスが生成された式あるいは属性が存在するかどうかを、インデックス情報記憶部33を検索して調べる。すべての式あるいは属性にインデックスが生成されている場合には、インデックス値記憶部35を検索し、出力を生成する。インデックスが生成されていない属性が含まれる場合には、検索条件を満足するデータのみを外部情報源91〜93から取り出し、それより必要な値を抽出して出力を生成する。 If an index search has been performed, the search result is output next. At this time, the index information storage unit 33 is searched to check whether the output expression includes an expression or attribute for which an index has been generated. If indexes have been generated for all the expressions or attributes, the index value storage unit 35 is searched and an output is generated. When an attribute for which an index has not been generated is included, only data that satisfies the search condition is extracted from the external information sources 91 to 93, and a necessary value is extracted therefrom to generate an output.

 生成された検索結果は、出力装置4に表示させる。 。 The generated search result is displayed on the output device 4.

従来の情報検索システムの構成を示すブロック図(A)と、統合型情報検索システムの構成を示すブロック図(B)である。FIG. 1A is a block diagram illustrating a configuration of a conventional information search system, and FIG. 2B is a block diagram illustrating a configuration of an integrated information search system. 本発明の第1の実施の形態の構成を示すブロック図である。FIG. 1 is a block diagram illustrating a configuration of a first exemplary embodiment of the present invention. 第1の実施の形態の動作を示す流れ図である。5 is a flowchart illustrating an operation of the first exemplary embodiment. 第1の実施の形態の動作の具体例を示す図である。FIG. 4 is a diagram illustrating a specific example of an operation according to the first exemplary embodiment. 本発明の第2の実施の形態の構成を示すプロック図である。It is a block diagram showing composition of a 2nd embodiment of the present invention. 第2の実施の形態の動作を示す流れ図である。9 is a flowchart illustrating the operation of the second embodiment. 第2の実施の形態の動作を示す流れ図である。9 is a flowchart illustrating the operation of the second embodiment. 第2の実施の形態の動作の具体例を示す図である。FIG. 14 is a diagram illustrating a specific example of an operation according to the second embodiment. 本発明の第3の実施の形態の構成を示すプロック図である。FIG. 11 is a block diagram illustrating a configuration of a third exemplary embodiment of the present invention. 第3の実施の形態の動作を示す流れ図である。13 is a flowchart illustrating the operation of the third embodiment. 第3の実施の形態の動作の具体例を示す図である。FIG. 14 is a diagram illustrating a specific example of an operation according to the third embodiment. 本発明の第4の実施の形態の構成を示すブロック図である。FIG. 14 is a block diagram illustrating a configuration of a fourth exemplary embodiment of the present invention.

符号の説明Explanation of reference numerals

 1 入力装置
 2、12 データ処理装置
 3、8、13 記憶装置
 4 出力装置
 5 統合型情報検索システム
 7、10 データ処理装置
 11 記録媒体
 21、71 検索手段
 22、74、77 インデックス生成手段
 30 実データ記憶部
 31、34、403、702、1001 インデックス記憶部
 32、35、408、703、1002 インデックス値記憶部
 33、701 インデックス情報記憶部
 51 検索仲介手段
 61、62、63 情報検索システム
 73、78 外部情報源検索手段
 75 式計算手段
 76 データ変換手段
 91、92、93、401 外部情報源
 211、711、715 検索式評価手段
 212、712、716 出力式評価手段
 213、717 インデックス検索手段
 214 実データ検索手段
 402、1004 従業員テーブル
 404、1005 名前インデックス
 405、1006 生年月日インデックス
 406、1007 役職インデックス
 407 所属インデックス
 409、706、1009 インデックス値テーブル
 704 インデックス情報テーブル
 713、718 インデックス値取得手段
 1003 情報源2
 1008 年齢インデックス
1 Input device 2, 12 Data processing device 3, 8, 13 Storage device 4 Output device 5 Integrated information search system 7, 10 Data processing device 11 Recording medium 21, 71 Search means 22, 74, 77 Index generation means 30 Actual data Storage unit 31, 34, 403, 702, 1001 Index storage unit 32, 35, 408, 703, 1002 Index value storage unit 33, 701 Index information storage unit 51 Search mediation means 61, 62, 63 Information search system 73, 78 External Information source search means 75 Formula calculation means 76 Data conversion means 91, 92, 93, 401 External information sources 211, 711, 715 Search formula evaluation means 212, 712, 716 Output formula evaluation means 213, 717 Index search means 214 Real data search Means 402, 1004 Employee table 404, 1005 Name index 405, 1006 Date of birth index 406, 1007 Position index 407 Affiliation index 409, 706, 1009 Index value table 704 Index information table 7 13,718 Index value acquisition means 1003 Information source 2
1008 Age Index

Claims (3)

 複数の情報源中の属性値を予め定めた統一形式に変換するデータ変換手段と、
 前記データ変換手段により変換された値に対してインデックスを生成するインデックス生成手段と、
 前記インデックス生成手段により生成されたインデックスを使ってインデックス検索を行うインデックス検索手段と、
 前記インデックス検索手段を使って問合せの指定する条件検索を実施する検索式評価手段と、
 を備えたことを特徴とする情報検索システム。
Data conversion means for converting attribute values in a plurality of information sources into a predetermined unified format,
Index generation means for generating an index for the value converted by the data conversion means,
Index search means for performing an index search using the index generated by the index generation means,
Search expression evaluation means for performing a condition search specified by a query using the index search means,
An information retrieval system comprising:
 情報検索システムのデータ変換手段が、複数の情報源中の属性値を予め定めた統一形式に変換し、
 前記情報検索システムのインデックス生成手段が、前記データ変換手段により変換された値に対してインデックスを生成して前記情報検索システムの記憶装置に格納し、
 前記情報検索システムのインデックス検索手段が、前記インデックス生成手段により生成されたインデックスを使ってインデックス検索を行い、
 前記情報検索システムの検索式評価手段が、前記インデックス検索により問合せの指定する条件検索を実施することを特徴とする情報検索方法。
Data conversion means of the information retrieval system converts attribute values in a plurality of information sources into a predetermined unified format,
The index generation means of the information search system generates an index for the value converted by the data conversion means and stores the index in the storage device of the information search system,
The index search means of the information search system performs an index search using the index generated by the index generation means,
An information search method, wherein the search expression evaluation means of the information search system performs a condition search specified by a query by the index search.
 複数の情報源中の属性値を予め定めた統一形式に変換するデータ変換処理と、
 前記データ変換処理により変換された値に対してインデックスを生成するインデックス生成処理と、
 前記インデックス生成処理により生成されたインデックスを使ってインデックス検索を行うインデックス検索処理と、
 前記インデックス検索処理を使って問合せの指定する条件検索を実施する検索式評価処理と、
 をコンピュータに実行させるためのプログラムを格納した記録媒体。
A data conversion process of converting attribute values in a plurality of information sources into a predetermined unified format,
An index generation process for generating an index for the value converted by the data conversion process,
An index search process for performing an index search using the index generated by the index generation process;
A search expression evaluation process for performing a conditional search specified by a query using the index search process;
Recording medium storing a program for causing a computer to execute the program.
JP2003374095A 2003-11-04 2003-11-04 Information retrieval system, information retrieval method, and recording medium recording program for information retrieval Pending JP2004046906A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003374095A JP2004046906A (en) 2003-11-04 2003-11-04 Information retrieval system, information retrieval method, and recording medium recording program for information retrieval

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003374095A JP2004046906A (en) 2003-11-04 2003-11-04 Information retrieval system, information retrieval method, and recording medium recording program for information retrieval

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP24093499A Division JP2001067369A (en) 1999-08-27 1999-08-27 Information retrieval system, information retrieval method and recording medium recording information retrieval probram

Publications (1)

Publication Number Publication Date
JP2004046906A true JP2004046906A (en) 2004-02-12

Family

ID=31712939

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003374095A Pending JP2004046906A (en) 2003-11-04 2003-11-04 Information retrieval system, information retrieval method, and recording medium recording program for information retrieval

Country Status (1)

Country Link
JP (1) JP2004046906A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010108378A (en) * 2008-10-31 2010-05-13 Canon Inc Information search device, information search method, program and storage medium

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10124491A (en) * 1996-10-24 1998-05-15 Fujitsu Ltd System for sharing and aligning document and device for managing shared document and device for performing access to document

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10124491A (en) * 1996-10-24 1998-05-15 Fujitsu Ltd System for sharing and aligning document and device for managing shared document and device for performing access to document

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010108378A (en) * 2008-10-31 2010-05-13 Canon Inc Information search device, information search method, program and storage medium

Similar Documents

Publication Publication Date Title
CN107247808B (en) Distributed NewSQL database system and picture data query method
Wei et al. Analyticdb-v: A hybrid analytical engine towards query fusion for structured and unstructured data
EP1643384B1 (en) Query forced indexing
JP3914662B2 (en) Database processing method and apparatus, and medium storing the processing program
US20070214104A1 (en) Method and system for locking execution plan during database migration
WO2017170459A1 (en) Method, program, and system for automatic discovery of relationship between fields in environment where different types of data sources coexist
US20150006509A1 (en) Incremental maintenance of range-partitioned statistics for query optimization
Vyawahare et al. A hybrid database approach using graph and relational database
CN107491487A (en) A kind of full-text database framework and bitmap index establishment, data query method, server and medium
Banane et al. Storing RDF data into big data NoSQL databases
JP6159908B1 (en) Method, program, and system for automatic discovery of relationships between fields in a heterogeneous data source mixed environment
Guo et al. A new ETL approach based on data virtualization
JPWO2017170459A6 (en) Method, program, and system for automatic discovery of relationships between fields in a heterogeneous data source mixed environment
Hua et al. SANE: Semantic-aware namespacein ultra-large-scale file systems
CN113918605A (en) Data query method, device, equipment and computer storage medium
Liu et al. Using provenance to efficiently improve metadata searching performance in storage systems
CN111708895B (en) Knowledge graph system construction method and device
US11354313B2 (en) Transforming a user-defined table function to a derived table in a database management system
JP2004192657A (en) Information retrieval system, and recording medium recording information retrieval method and program for information retrieval
Awada et al. Cost Estimation Across Heterogeneous SQL-Based Big Data Infrastructures in Teradata IntelliSphere.
WO2023086322A1 (en) Late materialization of queried data in database cache
US20230141902A1 (en) Columnar Cache Query Using Hybrid Query Execution Plan
JP2001067369A (en) Information retrieval system, information retrieval method and recording medium recording information retrieval probram
JP2004046906A (en) Information retrieval system, information retrieval method, and recording medium recording program for information retrieval
EP1480139A2 (en) Searching element-based document descriptions in a database

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040210

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040412

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040921