JPH11175562A - Information retrieving device and method therefor and storage medium - Google Patents

Information retrieving device and method therefor and storage medium

Info

Publication number
JPH11175562A
JPH11175562A JP9348307A JP34830797A JPH11175562A JP H11175562 A JPH11175562 A JP H11175562A JP 9348307 A JP9348307 A JP 9348307A JP 34830797 A JP34830797 A JP 34830797A JP H11175562 A JPH11175562 A JP H11175562A
Authority
JP
Japan
Prior art keywords
information
search
sources
price
integration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP9348307A
Other languages
Japanese (ja)
Inventor
Shiro Ito
史朗 伊藤
Yuji Ikeda
裕治 池田
Takanari Ueda
隆也 上田
Noriko Otani
紀子 大谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP9348307A priority Critical patent/JPH11175562A/en
Publication of JPH11175562A publication Critical patent/JPH11175562A/en
Withdrawn legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PROBLEM TO BE SOLVED: To integrate retrieved results obtained from plural information sources having different data items, and to present them in a batch. SOLUTION: Plural information sources to be retrieved are held in a retrieval object holding part 101, and corresponding slot data indicating a corresponding slot among those plural information sources are held in a corresponding slot data holding part 102. An information retrieving part 104 converts a retrieval condition held in a retrieval condition holding part 103 into a retrieval condition corresponding to each of plural information sources by using the corresponding slot data held in the corresponding slot data holding part 102, and retrieves the plural information sources by using the obtained retrieval condition, and holds them in a retrieved result holding part 105. An information integrating part 106 integrates the plural retrieved results thus obtained by using the substance of each information as a unit.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、複数の情報源間の
表現形式の違いを対応付けて情報の検索処理を行なう情
報処理装置及び方法及びその制御プログラムを格納した
記憶媒体に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an information processing apparatus and method for performing information retrieval processing by associating a difference in expression format between a plurality of information sources, and a storage medium storing a control program therefor.

【0002】[0002]

【従来の技術】項目に分かれた情報を検索する従来の情
報検索装置では、予め定められたスロット(スロットと
は各項目を表現するデータを表す)だけが検索可能であ
った。すなわち、他のスロットを用いて情報検索を行う
ためには、そのスロットを保持する別の情報検索装置か
ら検索しなければならなかった。
2. Description of the Related Art In a conventional information retrieval apparatus for retrieving information divided into items, only predetermined slots (slots represent data representing each item) can be retrieved. That is, in order to perform an information search using another slot, the information must be searched from another information search device holding the slot.

【0003】図5は、情報処理装置における検索可能な
スロットの例を示す図である。また、図6は、情報処理
装置に対する検索条件の例を示す図である。図6におい
て、列601は条件を指定するスロットを示しており、
列602は条件の値を示している。図7は、当該情報処
理装置の検索結果の一例を示す図である。図7におい
て、各列701,702,703が各スロットに対応す
る。各列がどのスロットに対応するかは行711に示さ
れている。行721以降の各行は、夫々一つのデータの
実体に対応しており、当該データのスロット値が夫々対
応する列に示されている。一方、図8、図9、図10
は、別の情報処理装置のそれぞれ、検索可能なスロット
の例、検索条件の例、検索結果の例を示す図である。
FIG. 5 is a diagram showing an example of a searchable slot in an information processing apparatus. FIG. 6 is a diagram illustrating an example of a search condition for the information processing apparatus. In FIG. 6, a column 601 shows slots for specifying conditions,
Column 602 shows the value of the condition. FIG. 7 is a diagram illustrating an example of a search result of the information processing apparatus. In FIG. 7, each row 701, 702, 703 corresponds to each slot. Which slot each column corresponds to is shown in row 711. Each row after the row 721 corresponds to the entity of one data, and the slot value of the data is shown in the corresponding column. On the other hand, FIG. 8, FIG.
FIG. 7 is a diagram illustrating an example of a searchable slot, an example of a search condition, and an example of a search result of another information processing apparatus.

【0004】上述のように、一般的な情報検索装置で
は、その装置が扱うスロットだけを検索可能であって、
それ以外のスロットは、別の情報検索装置を利用して検
索しなければならなかった。例えば、図5に示されるよ
うなスロットを有する情報検索装置では、図6のような
「蔵元」という検索条件で検索を行えるが、図8に示さ
れるようなスロットを有する情報検索装置では「蔵元」
というスロットを用いた検索はできない。ネットワーク
を介して、複数の情報源から検索を行うことが可能な装
置もあるが、この場合でも、異なる情報源に対しては、
別個に検索条件を指定し、それぞれの検索結果が得られ
るだけであった。例えば、図5に示されるようなスロッ
トを有する情報検索装置に対しては「商品名」というス
ロットで検索を行い、図8に示されるようなスロットを
有する情報検索装置に対しては「銘柄」というスロット
で検索を行う、というように、別々に検索条件を設定す
る必要があった。
As described above, a general information retrieval device can retrieve only the slots handled by the device,
Other slots must be searched using another information search device. For example, an information search device having a slot as shown in FIG. 5 can perform a search under a search condition of "Kuramoto" as shown in FIG. 6, but an information search device having a slot as shown in FIG. "
Search using the slot cannot be performed. Some devices can search from multiple sources over a network, but even in this case,
The search conditions were specified separately, and only the respective search results were obtained. For example, for an information search device having a slot as shown in FIG. 5, a search is performed using a slot of "product name", and for an information search device having a slot as shown in FIG. It was necessary to set search conditions separately, such as performing a search in the slot.

【0005】そのため、上述のような情報検索装置を用
いた場合、利用者は、検索条件を複数回指定しなければ
ならず、操作が煩わしくなるという問題が生じる。
[0005] Therefore, when the above-described information retrieval apparatus is used, the user must specify the retrieval condition a plurality of times, which causes a problem that the operation becomes cumbersome.

【0006】係る問題を解決するための技術として、複
数の情報源の情報を処理するために、情報源間のフレー
ムの対応するスロットを対応づけた対応スロットデータ
を人手で作成し、対応スロットデータを利用して異なる
フレームで表現された情報検索を可能とすることが提案
されている。例えば、図5と図8に示したようなスロッ
トを有する情報源間に関して、「商品名」と「銘柄」
を、「価格」と「値段」を夫々対応づけた、図4のよう
な対応スロットデータを参照して、情報検索を行う。こ
のようにすれば、「商品名○○○」で検索を指示するだ
けで、図5のスロットを有する情報源においては「商品
名○○○」によって検索を行うと共に、図8のスロット
を有する情報源においては「銘柄○○○」によって検索
を行うようにできる。
As a technique for solving this problem, in order to process information from a plurality of information sources, corresponding slot data in which corresponding slots of frames between information sources are associated with each other is manually created, and the corresponding slot data is created. It has been proposed to make it possible to search for information expressed in different frames by utilizing the information. For example, regarding information sources having slots as shown in FIG. 5 and FIG. 8, "product name" and "brand"
The information search is performed by referring to the corresponding slot data as shown in FIG. 4 in which "price" and "price" are associated with each other. In this way, by simply instructing a search with "product name xxx", an information source having the slot of FIG. 5 performs a search by "product name xxx" and has a slot of FIG. In the information source, the search can be performed by “brand XXX”.

【0007】[0007]

【発明が解決しようとする課題】しかしながら、対応ス
ロットデータを用いて異なる情報源からデータ検索を行
えたとしても、基本的には、各情報源について個別に検
索処理が行われるに過ぎない。従って、検索結果は、ば
らばらに得られることになり、非常にみにくくなってし
まうという問題があった。
However, even if data can be searched from different information sources using the corresponding slot data, basically, only the search process is individually performed for each information source. Therefore, the search results are obtained separately and there is a problem that it becomes very difficult to see.

【0008】また、先の図5と図8のスロットを有する
情報検索装置の例で、利用者が商品名「○○○」の蔵元
と容量を調べたいと思った場合、利用者は、図5のスロ
ットを検索可能な情報検索装置で検索を行なって「蔵
元」を得、次に図8のスロットを検索可能な情報検索装
置で(検索条件を「銘柄、○○○」として)検索を行な
って「容量」を得る必要がある。そして、利用者は、両
者の検索結果を別々に見なければならない。
Further, in the example of the information retrieval apparatus having the slots shown in FIGS. 5 and 8, if the user wants to check the storage and the capacity of the product name "XXX", 5 is searched using an information search device capable of searching for slots, and “Kuramoto” is obtained. Next, a search is performed using an information search device capable of searching for slots in FIG. 8 (with search conditions of “brand, xxx”). Need to get "capacity". Then, the user must look at both search results separately.

【0009】本発明は上記の問題に鑑みてなされたもの
であり、異なるデータ項目を有する複数の情報源から得
られた検索結果を統合し、まとめて提示することが可能
な情報検索装置及び方法を提供することを目的とする。
The present invention has been made in view of the above problems, and has an information retrieval apparatus and method capable of integrating search results obtained from a plurality of information sources having different data items and presenting them collectively. The purpose is to provide.

【0010】また、本発明の他の目的は、異なるデータ
項目を有する複数の情報源から、一つの情報源では不足
するデータ項目を他の情報源から補足し、得られる複数
の検索結果をまとめて提示可能とすることにある。
[0010] Another object of the present invention is to supplement a data item that is insufficient for one information source from another information source from a plurality of information sources having different data items, and to collect a plurality of obtained retrieval results. To be presented.

【0011】[0011]

【課題を解決するための手段】上記の目的を達成するた
めの本発明の一態様によれば、検索対象となる複数の情
報源について情報検索を行う情報検索装置が提供され、
該情報検索装置は例えば次の構成を備える。すなわち、
前記複数の情報源間において対応するデータ項目を示す
対応情報を保持する保持手段と、与えられた検索条件
を、前記保持手段によって保持されている前記対応情報
を用いて前記複数の情報源のそれぞれに応じた検索条件
に変換する変換手段と、前記変換手段で得られた検索条
件でもって前記複数の情報源を検索し、得られた複数の
検索結果を、各情報の実体を単位として統合する統合手
段とを備える。
According to one aspect of the present invention for achieving the above object, there is provided an information search apparatus for performing information search on a plurality of information sources to be searched,
The information search device has, for example, the following configuration. That is,
Holding means for holding correspondence information indicating data items corresponding to the plurality of information sources; and a given search condition, each of the plurality of information sources using the correspondence information held by the holding means A conversion unit that converts the search condition into search conditions according to the search condition, and searches the plurality of information sources based on the search conditions obtained by the conversion unit, and integrates the obtained plurality of search results with each entity of information as a unit Integration means.

【0012】また、上記の目的を達成するための本発明
の他の態様によれば、検索対象となる複数の情報源につ
いて情報検索を行うための情報検索方法が提供され、該
情報検索方法は例えば次のような工程からなる。すなわ
ち、与えられた検索条件を、複数の情報源について対応
するデータ項目を示す対応情報を用いて前記複数の情報
源のそれぞれに応じた検索条件に変換する変換工程と、
前記変換工程で得られた検索条件でもって前記複数の情
報源を検索し、得られた複数の検索結果を、各情報の実
体を単位として統合する統合工程とを備える。
According to another aspect of the present invention for achieving the above object, there is provided an information search method for performing information search on a plurality of information sources to be searched. For example, it comprises the following steps. That is, a conversion step of converting a given search condition into a search condition corresponding to each of the plurality of information sources using correspondence information indicating data items corresponding to the plurality of information sources,
An integration step of searching the plurality of information sources based on the search conditions obtained in the conversion step, and integrating the obtained plurality of search results for each entity of information.

【0013】[0013]

【発明の実施の形態】以下、図面を参照して本発明の実
施形態を詳細に説明する。
Embodiments of the present invention will be described below in detail with reference to the drawings.

【0014】<第1の実施形態>図1は、第1の実施形
態に係る装置の基本的な機能構成を示すブロック図であ
る。同図において、101は検索対象保持部であり、検
索対象の情報源を特定する情報を保持する。本例では、
図15のような第1情報源と図16のような第2情報源
の2つの情報源を有するものとして説明する。102は
対応スロットデータ保持部であり、検索対象保持部10
1に保持されている検索対象の情報源間において対応す
るスロットの情報を保持する対応スロットデータ保持部
である。本例では、第1情報源と第2情報源のスロット
の対応を示す、図4のような対応スロットデータが保持
されているものとして説明する。103は検索条件保持
部であり、検索条件を保持する。104は情報検索部で
あり、検索対象保持部101に保持されている情報で特
定される情報源から、対応スロットデータ保持部102
に保持されている対応スロットデータを用いて、検索条
件保持部103に保持されている検索条件を各情報源に
応じて変換して検索を行なう。
<First Embodiment> FIG. 1 is a block diagram showing a basic functional configuration of an apparatus according to a first embodiment. In FIG. 1, reference numeral 101 denotes a search target holding unit, which holds information for specifying an information source to be searched. In this example,
The description will be made assuming that there are two information sources, a first information source as shown in FIG. 15 and a second information source as shown in FIG. Reference numeral 102 denotes a corresponding slot data holding unit.
1 is a corresponding slot data holding unit that holds information of a corresponding slot among the information sources to be searched held in 1. In this example, a description will be given assuming that corresponding slot data as shown in FIG. 4 indicating the correspondence between the slots of the first information source and the second information source is held. A search condition storage unit 103 stores search conditions. Reference numeral 104 denotes an information search unit, which outputs information from the information source specified by the information held in the search target holding unit 101 to the corresponding slot data holding unit 102.
The search condition held in the search condition holding unit 103 is converted according to each information source using the corresponding slot data held in the search condition.

【0015】105は検索結果保持部であり、情報検索
部104で検索された結果を保持する。106は情報統
合部であり、検索結果保持部105に保持されている情
報について、対応スロットデータ保持部102に保持さ
れている対応スロットデータを用いて検索結果の統合を
行う。すなわち、対応スロットデータに基づいて複数の
情報源から得られる検索結果から同一の実体を表わす情
報を特定し、ある情報源では欠落しているスロットの値
を他の情報源からの検索結果によって補完して統合情報
を作成する。107は統合結果保持部であり、情報統合
部106で作成された統合情報を保持する。
Reference numeral 105 denotes a search result holding unit which holds the result searched by the information search unit 104. An information integration unit 106 integrates search results of the information held in the search result holding unit 105 using the corresponding slot data held in the corresponding slot data holding unit 102. That is, information representing the same entity is specified from search results obtained from a plurality of information sources based on the corresponding slot data, and the value of a slot missing in one information source is complemented by search results from another information source. To create integrated information. Reference numeral 107 denotes an integration result holding unit, which holds the integration information created by the information integration unit 106.

【0016】図2は、第1の実施形態の情報処理装置の
具体的構成を示す図である。同図において、201はC
PUであり、後述する手順を実現するプログラムに従っ
て動作する。202はRAMであり、検索条件保持部1
03と検索結果保持部105と統合結果保持部107を
実現し、上記プログラムの動作に必要な記憶領域とを提
供する。203はROMであり、後述する手順を実現す
るプログラムを保持する。204はディスク装置であ
り、検索対象保持部101と対応スロットデータ保持部
102を実現する。205はネットワークを介して他の
装置に存在する情報源から情報を獲得するためのネット
ワークインタフェースである。206はバスである。
FIG. 2 is a diagram showing a specific configuration of the information processing apparatus according to the first embodiment. In the figure, 201 is C
It is a PU and operates according to a program that implements a procedure described below. Reference numeral 202 denotes a RAM, which is a search condition holding unit 1
03, the search result holding unit 105, and the integrated result holding unit 107, and provide a storage area necessary for the operation of the program. Reference numeral 203 denotes a ROM, which stores a program that implements a procedure described below. Reference numeral 204 denotes a disk device, which implements the search target holding unit 101 and the corresponding slot data holding unit 102. Reference numeral 205 denotes a network interface for acquiring information from an information source existing in another device via a network. 206 is a bus.

【0017】図3は第1の実施形態による検索処理の手
順を説明するフローチャートである。以下、図3のフロ
ーチャートを参照して、第1の実施形態による情報処理
装置の処理の手順を説明する。なお、図3で示される制
御手順を実現するための制御プログラムはROM203
に格納され、CPU201によって実行される。
FIG. 3 is a flowchart for explaining the procedure of the search process according to the first embodiment. Hereinafter, the procedure of the process of the information processing apparatus according to the first embodiment will be described with reference to the flowchart of FIG. The control program for realizing the control procedure shown in FIG.
And executed by the CPU 201.

【0018】ステップS301では、検索対象保持部1
01に保持されている検索対象の情報源について、未処
理の情報源が残っているか否かを調べ、残っている場合
はステップS302に移る。一方、ステップS301で
未処理の情報源が残っていないと判定された場合は本処
理を終了する。
In step S301, the search target holding unit 1
Regarding the information source to be searched held in 01, it is checked whether or not an unprocessed information source remains. If the information source remains, the process proceeds to step S302. On the other hand, if it is determined in step S301 that there is no unprocessed information source, this processing ends.

【0019】ステップS302では、検索対象保持部1
01に保持されている検索対象の情報源から未処理の情
報源を一つ選択する。例えば、まず、第1情報源が選択
される。そしてステップS303に移る。ステップS3
03では、ステップS302で選択された情報源に応じ
て、検索条件保持部103に保持されている検索条件を
変換する。具体的には、対応スロットデータ保持部10
2に保持されている対応スロットの情報を用いて、検索
条件のスロットを、選択された情報源のスロットに変換
する。そしてステップS304に移る。
In step S302, the search target holding unit 1
One unprocessed information source is selected from among the information sources to be searched held in 01. For example, first, the first information source is selected. Then, control goes to a step S303. Step S3
In step 03, the search condition held in the search condition holding unit 103 is converted according to the information source selected in step S302. Specifically, the corresponding slot data holding unit 10
The slot of the search condition is converted into the slot of the selected information source by using the information of the corresponding slot held in 2. Then, control goes to a step S304.

【0020】図4は、第1の実施形態による対応スロッ
トデータ保持部102に保持される対応スロットデータ
の一例を示した図である。ここで、列401と402
は、それぞれ第1情報源と第2情報源に対応する。行4
11と412は、各情報源間で対応するスロットを保持
する。また、上述したように、検索対象保持部101に
は、図5に示されるようなスロットを有する第1情報源
(図15)と、図8に示されるようなスロットを有する
第2情報源(図16)が保持されている。
FIG. 4 is a diagram showing an example of corresponding slot data held in the corresponding slot data holding unit 102 according to the first embodiment. Here, columns 401 and 402
Respectively correspond to a first information source and a second information source. Row 4
11 and 412 hold corresponding slots between the information sources. Further, as described above, the search target holding unit 101 has the first information source (FIG. 15) having a slot as shown in FIG. 5 and the second information source (FIG. 8) having a slot as shown in FIG. FIG. 16) is held.

【0021】今、対応スロットデータ保持部102に保
持されている対応スロットデータが図4のようになって
おり、検索条件保持部103には、図9で示される検索
条件、「銘柄○○○」が保持されているものとする。こ
のような状態で、図9に示した検索条件について、図5
で示されるスロットを検索できる第1情報源での検索を
行うための変換を行なうと、図11に示す検索条件
(「商品名○○○」)となる。
Now, the corresponding slot data held in the corresponding slot data holding unit 102 is as shown in FIG. 4, and the search condition holding unit 103 stores the search conditions shown in FIG. Is held. In this state, the search condition shown in FIG.
When the conversion for performing the search in the first information source capable of searching for the slot indicated by is performed, the search condition (“product name OO”) shown in FIG. 11 is obtained.

【0022】ステップS304では、ステップS303
で変換した検索条件を用いて、選択された情報源(ここ
では第1情報源)から検索を行ない、検索結果を検索結
果保持部105に保持する。この場合の検索結果は図1
2の(a)のようになる。そして、ステップS305に
移る。
In step S304, step S303
The search is performed from the selected information source (here, the first information source) using the search conditions converted in step (1), and the search result is stored in the search result storage unit 105. The search result in this case is shown in FIG.
As shown in FIG. Then, the process proceeds to step S305.

【0023】ステップS305以降では、検索結果につ
いて統合処理を行う。まず、ステップS305におい
て、検索結果保持部105に未処理の検索結果が残って
いるか否かを調べ、残っている場合はステップS306
に移る。ステップS306では、検索結果保持部105
に保持されている検索結果から未処理の検索結果を一つ
選択する。そしてステップS307に移る。ステップS
307では、統合結果保持部107に保持されている結
果の中から、ステップS306で選択された結果と同一
の実体を指す情報を同定する。例えば、対応スロットデ
ータ保持部102に保持されている対応スロットを参照
して、ステップS306で選択された結果と統合結果保
持部107に保持されている結果との間で対応するスロ
ットを得て、これら対応するスロットで値が一致するも
のを同一の実体を指す情報と同定する。そして、同定さ
れた結果がある場合はステップS308に、同定された
結果がない場合はステップS309に夫々移る。ステッ
プS309では、当該検索結果をそのまま統合結果保持
部107に保持させる。
After step S305, an integration process is performed on the search results. First, in step S305, it is checked whether or not unprocessed search results remain in the search result holding unit 105.
Move on to In step S306, the search result holding unit 105
One unprocessed search result is selected from the search results stored in. Then, control goes to a step S307. Step S
In 307, information indicating the same entity as the result selected in step S306 is identified from the results held in the integration result holding unit 107. For example, by referring to the corresponding slot held in the corresponding slot data holding unit 102, a corresponding slot between the result selected in step S306 and the result held in the integration result holding unit 107 is obtained, Those corresponding values of the corresponding slots are identified as information indicating the same entity. If there is an identified result, the process proceeds to step S308. If there is no identified result, the process proceeds to step S309. In step S309, the integration result storage unit 107 stores the search result as it is.

【0024】同定された結果がある場合、すなわち同一
の実体を表す検索結果がある場合は、ステップS308
において、その同一の実体に係る検索結果の統合を行
う。この統合処理では、同一の実体であると同定された
統合結果には存在せず、検索結果には存在するスロット
を抽出し、そのようなスロットが抽出された場合はそれ
を統合結果に追加する。そしてステップS305に戻
る。また、ステップS309では、検索された結果を、
対応するスロットに応じて統合結果保持部107に保持
する。そしてステップS305に戻る。
If there is an identified result, that is, if there is a search result representing the same entity, step S308
, The search results related to the same entity are integrated. In this integration process, a slot that does not exist in the integration result identified as the same entity but exists in the search result is extracted, and when such a slot is extracted, it is added to the integration result. . Then, the process returns to step S305. In step S309, the searched result is
The result is stored in the integration result storage unit 107 according to the corresponding slot. Then, the process returns to step S305.

【0025】当該情報源に関する全検索結果についてス
テップS306〜S309の処理を終えた場合は、ステ
ップS305からステップS301へ戻り、次の情報源
について処理を行う。例えば、第1情報源の全検索結果
について処理を終えたら、ステップS301へ戻り、第
2情報源について「銘柄○○○」の検索処理を行い、ス
テップS306〜S309で示される統合処理を行う。
When the processing of steps S306 to S309 has been completed for all the search results for the information source, the process returns from step S305 to step S301, and the processing is performed for the next information source. For example, when the processing is completed for all the search results of the first information source, the process returns to step S301, the search processing of "brand OO" is performed for the second information source, and the integration processing shown in steps S306 to S309 is performed.

【0026】図12は第1の実施形態による2つの情報
源による検索結果の統合結果を示す図である。上記の例
では、まず第1情報源が「商品名、○○○」によって検
索され、図12の(a)が検索結果として得られる。こ
の時点では、ステップS306〜S309の統合処理に
よって、統合結果として図12の(a)の検索結果がそ
のまま保持される。次に、第2情報源が、「銘柄、○○
○」によって検索され、図12(b)の検索結果を得
る。ここで、図12(a)の検索結果と、図12(b)
の検索結果を比べると、図4の対応スロットデータに登
録されている[商品名、銘柄」のスロットが共に○○○
であり、「価格、値段」がともに4000円であるの
で、両検索結果は同一の実体をさすものと同定される
(S307)。そして、ステップS308では、図12
(a)の検索結果(すなわち、統合結果)に存在せず、
図12(b)の検索結果に存在するスロット「容量」を
抽出し、これを統合結果に追加する。この結果図12の
(C)に示すような統合結果が得られる。このように、
従来では、「銘柄○○○」という検索条件からそれぞれ
の情報源を検索するだけで、「容量」や「蔵元」スロッ
トは夫々の検索結果によって別々に得ることしかできな
かったが、本実施形態によれば、図12の(c)ように
これらのスロットを統合した結果を得ることができる。
FIG. 12 is a diagram showing a result of integrating search results by two information sources according to the first embodiment. In the above example, first, the first information source is searched for “product name, xxx”, and FIG. 12A is obtained as a search result. At this time, by the integration processing of steps S306 to S309, the search result of FIG. Next, the second information source is “brand, xx
The search result shown in FIG. 12B is obtained. Here, the search result of FIG. 12A and the search result of FIG.
When the search results are compared, the slots of [Product name and brand] registered in the corresponding slot data of FIG.
Since both “price and price” are 4000 yen, both search results are identified as indicating the same entity (S307). Then, in step S308, FIG.
(A) does not exist in the search result (that is, the integration result),
The slot “capacity” existing in the search result of FIG. 12B is extracted and added to the integrated result. As a result, an integrated result as shown in FIG. in this way,
In the past, the "capacity" and "Kuramoto" slots could only be obtained separately for each search result by simply searching for each information source from the search condition "brand xxx". According to FIG. 12, it is possible to obtain a result obtained by integrating these slots as shown in FIG.

【0027】なお、上記実施形態において、同一の実体
か否かを同定するためのスロットの決定方法として、後
述の第3の実施形態で示すような類似度を用いることも
できる。
In the above embodiment, a similarity as shown in a third embodiment described later can be used as a method of determining a slot for identifying whether or not the entity is the same entity.

【0028】<第2の実施形態>上記第1の実施形態に
おいては、対応スロットデータ保持部102には、別途
作成された対応スロットの情報が保持されていることを
前提に動作する場合について説明したが、これに限定さ
れるものではない。第2の実施形態では、検索対象保持
部101に保持されている情報源間での対応スロット情
報を自動的に作成する構成を説明する。
<Second Embodiment> In the first embodiment described above, a case will be described in which the operation is performed on the premise that the corresponding slot data holding unit 102 holds information of a separately created corresponding slot. However, the present invention is not limited to this. In the second embodiment, a configuration in which corresponding slot information between information sources held in the search target holding unit 101 is automatically created will be described.

【0029】図13は第2の実施形態に係る装置の基本
的な機能構成を示すブロック図である。図13におい
て、第1の実施形態(図1)と同様の構成には同一の参
照番号を付し、ここでは説明を省略する。110は対応
スロットデータ作成部であり、検索対象保持部101に
保持されている各情報源間で対応するスロットを示す対
応スロットデータを作成し、これを対応スロットデータ
保持部102に保持させる。
FIG. 13 is a block diagram showing a basic functional configuration of the device according to the second embodiment. In FIG. 13, the same components as those in the first embodiment (FIG. 1) are denoted by the same reference numerals, and description thereof will be omitted. Reference numeral 110 denotes a corresponding slot data creating unit that creates corresponding slot data indicating a corresponding slot among the information sources held in the search target holding unit 101 and causes the corresponding slot data holding unit 102 to hold the corresponding slot data.

【0030】対応スロットデータ作成部110による対
応スロットデータの作成処理手順について以下に説明す
る。図14は対応スロットデータの作成処理手順を説明
するフローチャートである。
The procedure for creating the corresponding slot data by the corresponding slot data creating section 110 will be described below. FIG. 14 is a flowchart for explaining the procedure for creating the corresponding slot data.

【0031】まず、ステップS31では、フレーム定義
保持部101に保持されている一方のフレームをf、も
う一方のフレームをf’とし、フレームfのスロットの
集合をSf(f)で表わしたとき、双方のフレームのス
ロットを任意に組み合わせた 仮説Ps={(s,s’)|s∈Sf(f)、 s’∈S
f(f’)} を生成し、仮説を集めた仮説集合Hを作成する。
First, in step S31, one frame held in the frame definition holding unit 101 is denoted by f, the other frame is denoted by f ', and a set of slots of the frame f is represented by Sf (f). Hypothesis Ps = {(s, s ') | s {Sf (f), s'} S where slots of both frames are arbitrarily combined
f (f ′)} is generated, and a hypothesis set H in which hypotheses are collected is created.

【0032】例えば、図5と図8に示すフレームに対し
ては、Hの内容は以下の通りになる。この場合、1〜3
組のスロット対がある。
For example, for the frames shown in FIGS. 5 and 8, the contents of H are as follows. In this case, 1-3
There are a pair of slot pairs.

【0033】まず、1組のスロット対としては、以下の
9種類の組み合わせがある。すなわち、{(商品名、銘
柄)}、{(商品名、値段)}、{(商品名、容
量)}、{(価格、銘柄)}、{(価格、値段)}、
{(価格、容量)}、{(蔵元、銘柄)}、{(蔵元、
値段)}、{(蔵元、容量)}となる。
First, there are the following nine combinations as one set of slot pairs. That is, {(product name, brand)}, {(product name, price)}, {(product name, capacity)}, {(price, brand)}, {(price, price)},
{(Price, capacity)}, {(Kuramoto, brand)}, {(Kuramoto,
Price)}, {(brewery, capacity)}.

【0034】また、2組のスロット対としては、以下の
18種類の組み合わせがある。すなわち、{(商品名、
銘柄)、(価格、値段)}、{(商品名、銘柄)、(価
格、容量)}、{(商品名、値段)、(価格、銘
柄)}、{(商品名、値段)、(価格、容量)}、
{(商品名、容量)、(価格、銘柄)}、{(商品名、
容量)、(価格、値段)}、{(商品名、銘柄)、(蔵
元、値段)}、{(商品名、銘柄)、(蔵元、容
量)}、{(商品名、値段)、(蔵元、銘柄)}、
{(商品名、値段)、(蔵元、容量)}、{(商品名、
容量)、(蔵元、銘柄)}、{(商品名、容量)、(蔵
元、値段)}、{(価格、銘柄)、(蔵元、値段)}、
{(価格、銘柄)、(蔵元、容量)}、{(価格、値
段)、(蔵元、銘柄)}、{(価格、値段)、(蔵元、
容量)}、{(価格、容量)、(蔵元、銘柄)}、
{(価格、容量)、(蔵元、値段)}となる。
As the two slot pairs, there are the following 18 combinations. That is, {(product name,
(Brand), (price, price)}, {(brand name, brand), (price, capacity)}, {(brand name, price), (price, brand)}, {(brand name, price), (price) ,capacity)},
{(Product name, capacity), (price, brand)}, {(product name,
(Capacity), (Price, Price)}, {(Product Name, Brand), (Kuramoto, Price)}, {(Product Name, Brand), (Kuramoto, Capacity)}, {(Product Name, Price), (Kuramoto , Brand)},
{(Product name, price), (brewery, capacity)}, {(product name,
(Capacity), (Kuramoto, Brand)}, {(Product Name, Capacity), (Kuramoto, Price)}, {(Price, Brand), (Kuramoto, Price)},
{(Price, Brand), (Kuramoto, Capacity)}, {(Price, Price), (Kuramoto, Brand)}, {(Price, Price), (Kuramoto,
(Capacity)}, 容量 (Price, Capacity), (Kuramoto, Brand)},
{(Price, capacity), (brewery, price)}.

【0035】また、3組のスロット対としては、以下の
6種類の組み合わせがある。すなわち、{(商品名、銘
柄)、(価格、値段)、(蔵元、容量)}、{(商品
名、銘柄)、(価格、容量)、(蔵元、値段)}、
{(商品名、値段)、(価格、銘柄)、(蔵元、容
量)}、{(商品名、値段)、(価格、容量)、(蔵
元、銘柄)}、{(商品名、容量)、(価格、銘柄)、
(蔵元、値段)}、{(商品名、容量)、(価格、値
段)、(蔵元、銘柄)}となる。
As the three slot pairs, there are the following six combinations. That is, {(product name, brand), (price, price), (brewery, volume)}, {(product name, brand), (price, volume), (brewery, price)},
{(Product name, price), (price, brand), (brewery, capacity)}, {(product name, price), (price, capacity), (brewery, brand)}, {(product name, capacity), (Price, brand),
(Kuramoto, price)}, {(product name, capacity), (price, price), (Kuramoto, brand)}.

【0036】このように、ステップS31により、33
種類の仮説集合Hが得られる。そして、ステップS32
に移る。
As described above, in step S31, 33
A type of hypothesis set H is obtained. Then, step S32
Move on to

【0037】ステップS32では、上で求めた仮説集合
Hから、仮説を構成するスロットの集合のうち、一方の
フレームに関するスロット対の集合をとったときに、そ
のスロット値の組み合わせが、情報源中の情報(以下、
インスタンスと呼ぶ)において全て異なるような仮説だ
けを残す。
In step S32, when a set of slot pairs for one frame is selected from the set of slots constituting the hypothesis from the set of hypotheses H obtained above, the combination of the slot values is stored in the information source. Information (below,
Only the hypotheses that are all different from each other are called.

【0038】以下に、図15および図16を用いて、ス
テップS32について具体的に説明する。特に、1組の
スロットについては、ステップS31で得られた{(商
品名、銘柄)}、2組のスロットについては、ステップ
S31で得られた{(商品名、銘柄)、(価格、値
段)}と{(価格、銘柄)、(蔵元、値段)}、3組の
スロットについては、ステップS31で得られた{(商
品名、銘柄)、(価格、値段)、(蔵元、容量)}を用
いて説明する。
Hereinafter, step S32 will be specifically described with reference to FIGS. In particular, for one set of slots, {(product name, brand) obtained in step S31}, and for two sets of slots, {(product name, brand), (price, price) obtained in step S31. } And {(price, brand), (brewery, price)} For three sets of slots, {(product name, brand), (price, price), (brewery, capacity)} obtained in step S31 It will be described using FIG.

【0039】まず、1組のスロット対{(商品名、銘
柄)}について、商品名(一方のフレーム)のスロット
値で図15の1301〜1304の値が全て異なるか否
かを判断する。商品名について図15を見ると、それぞ
れ○○○、△△△、☆☆☆、▽▽▽であり、全て異なっ
ている。また、他方のフレームにおける銘柄のスロット
値についても、図16について同様に比較をすると全て
異なっているので、{(商品名、銘柄)}は仮説として
残ることになる。以下、他の「1組のスロット」につい
て同様に比較をすると、{(商品名、銘柄)}の仮説が
残る。
First, for one set of slot pairs {(product name, brand)}, it is determined whether or not the values of 1301 to 1304 in FIG. 15 are all different depending on the slot value of the product name (one frame). Looking at the product names in FIG. 15, they are OO, △△△, ☆, ▽▽▽, and ▽▽▽, which are all different. Also, regarding the slot value of the brand in the other frame, if the comparison is made in the same manner as in FIG. 16, all are different, so that {(product name, brand)} remains as a hypothesis. Hereinafter, if the same comparison is made for the other “one set of slots”, the hypothesis of {(product name, brand)} remains.

【0040】また、2組のスロット{(商品名、銘
柄)、(価格、値段)}についても1組のスロットと同
様に比較をすればよいが、2組の場合は、商品名と価
格、或いは銘柄と値段の両方を組み合わせた値につい
て、図15の1301〜1304の全てで異なる必要が
ある。この場合、商品名と価格のスロット値の組み合わ
せにおいて、1303と1304の価格が6000円で
同じ値であるが、商品名が☆☆☆と▽▽▽で異なる。同
様に、銘柄と値段のスロット値の組み合わせについて調
べると、図16の1401〜1403においてすべての
組み合わせ値が異なる。従って、{(商品名、銘柄)、
(価格、値段)}の仮説は残ることになる。
In addition, two sets of slots {(product name, brand), (price, price)} may be compared in the same manner as one set of slots. In the case of two sets, the product name and price, Alternatively, the value obtained by combining both the brand and the price needs to be different in all of 1301 to 1304 in FIG. In this case, in the combination of the merchandise name and the price slot value, the prices of 1303 and 1304 are the same value at 6000 yen, but the merchandise names are different between ☆ and ▽▽▽. Similarly, when examining combinations of brand and price slot values, all the combination values are different in 1401 to 1403 in FIG. Therefore, {(product name, brand),
The hypothesis of (price, price)} remains.

【0041】一方、{(商品名、容量)、(価格、値
段)}について調べると、容量と値段のスロット値の組
み合わせが同じもの(容量:720ml、値段:400
0円)が図16に2つ(1401,1402)あるの
で、情報が唯一に定まらず、{(価格、銘柄)、(蔵
元、値段)}は仮説として残らない。
On the other hand, when examining {(product name, capacity), (price, price)}, the combination of the capacity and the price slot value is the same (capacity: 720 ml, price: 400).
Since two (0 yen) are shown in FIG. 16 (1401, 1402), the information is not uniquely determined, and {(price, brand), (brewery, price)} does not remain as a hypothesis.

【0042】以下同様に、他の2組のスロットについて
調べていくと、{(商品名、銘柄)、(価格、値
段)}、{(商品名、銘柄)、(価格、容量)}、
{(商品名、値段)、(価格、銘柄)}、{(商品名、
容量)、(価格、銘柄)}、{(商品名、銘柄)、(蔵
元、値段)}、{(商品名、銘柄)、(蔵元、容
量)}、{(商品名、値段)、(蔵元、銘柄)}、
{(商品名、容量)、(蔵元、銘柄)}という仮説が残
る。
Similarly, when the other two sets of slots are examined, {(product name, brand), (price, price)}, {(product name, brand), (price, capacity)},
{(Product name, price), (price, brand)}, {(product name,
(Capacity), (Price, Brand)}, {(Product Name, Brand), (Kuramoto, Price)}, {(Product Name, Brand), (Kuramoto, Capacity)}, {(Product Name, Price), (Kuramoto , Brand)},
The hypothesis of {(product name, capacity), (brewery, brand)} remains.

【0043】また、3組のスロット{(商品名、銘
柄)、(価格、値段)、(蔵元、容量)}については、
商品名、価格、蔵元のスロット値の組み合わせが図15
の1301〜1304で全て異なっており、銘柄、値
段、容量のスロット値の組み合わせが図16の1401
〜1403で全て異なっている。従って、{(商品名、
銘柄)、(価格、値段)、(蔵元、容量)}の仮説は残
ることになる。
For three sets of slots {(product name, brand), (price, price), (brewery, capacity)},
Combination of product name, price and brewery slot value is shown in FIG.
1301 to 1304 are different, and the combination of the brand, price, and slot value of the capacity is 1401 in FIG.
~ 1403 are all different. Therefore, {(product name,
(Brand), (price, price), (brewery, capacity)} hypothesis will remain.

【0044】結局、本例の場合は、3組のスロットに関
しては上述した6つの組み合わせの全てが仮説として残
ることになる。
After all, in the case of this example, with respect to three sets of slots, all of the above six combinations remain as hypotheses.

【0045】以上のようにして、ステップS32では、
情報が唯一に定まる仮説だけを残す処理を行っている。
そして、ステップS33に移るステップS33では、集
合H中の全ての仮説について、仮説中の全てのスロット
対において、スロット値が一致するインスタンスを求
め、それを仮説のインスタンス対集合とする。例えば、
{(商品名、銘柄)、(価格、値段)、(蔵元、容
量)}において、(商品名、銘柄)のスロット対は、○
○○と☆☆☆が両情報源に存在し、一致するインスタン
スとなっている。また、(価格、容量)のスロット対に
おいても、4000円と6000円とで一致している。
しかし、(蔵元、容量)のスロット対においては、一致
する値は存在しない。
As described above, in step S32,
Processing is performed to leave only hypotheses for which information is uniquely determined.
Then, in step S33, the process proceeds to step S33. For all the hypotheses in the set H, an instance having the same slot value is obtained in every slot pair in the hypothesis, and the instance is set as a hypothesis instance pair set. For example,
In {(product name, brand), (price, price), (brewery, capacity)}, the slot pair of (product name, brand)
OO and ☆☆☆ exist in both sources and are the matching instances. Also, in the (price, capacity) slot pair, they match at 4000 yen and 6000 yen.
However, there is no matching value in the (storage, capacity) slot pair.

【0046】(蔵元、容量)のように、一致するインス
タンスが一つも存在しないスロット対を有する組を仮説
集合Hから除く。その結果、残る仮説は、{(商品名、
銘柄)} {(商品名、銘柄)、(価格、値段)}となる。そし
て、ステップS34に移る。
A set having a slot pair in which no matching instance exists, such as (stock, capacity), is removed from the hypothesis set H. As a result, the remaining hypothesis is {(product name,
(Brand)} {(product name, brand), (price, price)}. Then, the process proceeds to step S34.

【0047】ステップS34では、仮説中のスロット対
の数が同じ仮説で、求まったインスタンス対の数が最大
のものをとる。最大値を有するものが複数ある場合は、
例えば先に生成された仮説をとる。これを、要素数(ス
ロット対の組数)の昇順でKに並べる。本例の場合で
は、ステップS33において、1組のスロット対、2組
みのスロット対で夫々1つずつしか仮説が残らないの
で、ステップS33で残された仮説がそのままKに並べ
られる。
In step S34, the hypothesis having the same number of slot pairs in the hypothesis and the largest number of instance pairs found is taken. If there is more than one with the maximum value,
For example, take the hypothesis generated earlier. These are arranged in K in ascending order of the number of elements (the number of pairs of slot pairs). In the case of the present example, in step S33, only one hypothesis remains in each of one set of slot pairs and two sets of slot pairs, so the hypotheses left in step S33 are arranged in K as they are.

【0048】次に、ステップS35では、Kに仮説が残
ったか否かを調べ、残っている場合はステップS36に
移る。ここで、Kに仮説が残っていない場合は、全ての
処理を終了する。この場合、対応スロットデータは得ら
れない。
Next, in step S35, it is checked whether or not a hypothesis remains in K, and if it remains, the process proceeds to step S36. Here, if no hypothesis remains in K, all the processing ends. In this case, the corresponding slot data cannot be obtained.

【0049】ステップS36では、Kのj番目の仮説h
jに対して求まったインスタンス対の数をnjとした時、
nj-1/nj<1/2を満足する最大のhjを対応スロッ
トデータとする。このようにして、誤ったスロット対を
減少させる。また、そのような仮説がなければj=1と
する。
In step S36, the j-th hypothesis h of K
When the number of instance pairs obtained for j is nj,
The maximum hj satisfying nj-1 / nj <1/2 is defined as the corresponding slot data. In this way, false slot pairs are reduced. If there is no such hypothesis, j = 1.

【0050】そして、ステップS37に移る。ステップ
S37では、hjのスロット対を対応スロット対データ
として、対応スロット対データ保持部104に保有す
る。そして、全ての処理を終了する。
Then, the process proceeds to a step S37. In step S37, the slot pair of hj is held in the corresponding slot pair data holding unit 104 as the corresponding slot pair data. Then, all processing ends.

【0051】先の例では、{(商品名、銘柄)、(価
格、値段)}が最終的な仮説として残るので、図4に示
すような対応スロットデータが得られる。
In the above example, {(product name, brand), (price, price)} remains as a final hypothesis, and corresponding slot data as shown in FIG. 4 is obtained.

【0052】このように、異なるフレーム形式で記述さ
れた情報源の情報の処理を、人手で対応スロットデータ
を与えることなく、自動的に実行できるという効果が得
られる。
As described above, there is an effect that the processing of the information of the information source described in the different frame format can be automatically executed without manually giving the corresponding slot data.

【0053】<第3の実施形態>上記第1の実施形態に
おいては、検索条件保持部103に保持されている検索
条件を変換して直接検索できる情報だけを統合する場合
について説明したが、これに限定されるものではない。
検索された結果を用いて、その結果と同一の実体につい
ての情報を他の情報源から検索して統合することも可能
である。
Third Embodiment In the first embodiment, a case has been described in which the search conditions held in the search condition holding unit 103 are converted and only information that can be directly searched is integrated. However, the present invention is not limited to this.
Using the searched result, information about the same entity as the result can be searched from another information source and integrated.

【0054】図17は第3の実施形態に係る装置の基本
的な機能構成を示すブロック図である。図17におい
て、第1の実施形態(図1)と同様の構成には同一の参
照番号を付し、ここでは説明を省略する。120は再検
索部であり、検索条件保持部103に保持されている検
索条件では直接検索できなかった情報源に対して、統合
結果保持部107に保持されている結果を参照して検索
条件を作成し、再検索を行なう。
FIG. 17 is a block diagram showing a basic functional configuration of the device according to the third embodiment. 17, the same components as those in the first embodiment (FIG. 1) are denoted by the same reference numerals, and description thereof will be omitted. Reference numeral 120 denotes a re-search unit. The re-search unit 120 refers to the result held in the integration result holding unit 107 and searches the information source that cannot be directly searched by the search condition held in the search condition holding unit 103. Create and search again.

【0055】検索条件保持部103に保持された検索条
件では、検索対象保持部101に保持されている情報源
を全て検索できるとは限らない。情報源に対応するスロ
ットがない場合には検索できない。例えば、図6に示さ
れる検索条件が検索条件保持部103に保持されていた
とする。このとき、図8で示されるスロットを検索可能
な情報源では、「蔵元」に対応するスロットがないため
検索できない。そこで、図6の検索条件によって一通り
の統合結果が得られた後に、統合結果の情報から新たな
検索条件を作成し、検索できなかった情報源から再度検
索を行ない、情報の統合を行なう。
With the search conditions held in the search condition holding unit 103, not all information sources held in the search object holding unit 101 can be searched. If there is no slot corresponding to the information source, it cannot be searched. For example, it is assumed that the search condition shown in FIG. At this time, the information source that can search for the slot shown in FIG. 8 cannot be searched because there is no slot corresponding to “Kuramoto”. Therefore, after one kind of integration result is obtained by the search condition of FIG. 6, a new search condition is created from the information of the integration result, and the search is performed again from the information source that could not be searched to integrate the information.

【0056】前述の例では、図6の検索条件「蔵元、×
××酒造」によって図15の情報源が検索されて、図7
に示す結果が得られる。そこで、「商品名」が「○○
○」であるという条件と「商品名」が「△△△」である
という条件で再検索を行なえば、図16の第2情報源か
ら「商品名(銘柄)」が「○○○」である実体につい
て、図10に示すような検索結果が得られる。そして、
図10の検索結果から、銘柄が○○○のものについて、
「容量」という別の情報が得られる。この結果から、上
述のステップS305〜S309で説明したような情報
の統合処理を行なえば、図18に示す統合結果が得られ
る。
In the above example, the search condition “Kuramoto, ×
Xx brewing ”is searched for the information source of FIG.
The result shown in FIG. Therefore, "Product name" is changed to "XX
If a re-search is performed under the condition of "○" and the condition of "product name" is "△△△", "product name (brand)" is changed to "○○○" from the second information source in FIG. A search result as shown in FIG. 10 is obtained for a certain entity. And
From the search results in FIG. 10, for brands with
Another information "capacity" is obtained. From this result, if the information integration processing described in steps S305 to S309 is performed, the integration result shown in FIG. 18 is obtained.

【0057】さて、第3の実施形態では、得られた統合
結果から他の情報源において検索を行うための検索条件
を自動的に生成する。検索条件は、既に得られている統
合結果に検索結果を付加するので、統合結果の表す情報
の実体と同一の実体を同定することが可能な検索条件を
設定する必要がある。
In the third embodiment, a search condition for performing a search in another information source is automatically generated from the obtained integration result. Since the search condition adds the search result to the already obtained integration result, it is necessary to set a search condition capable of identifying the same entity as the entity of the information represented by the integration result.

【0058】このような検索条件の生成の方法として2
とおり説明する。
As a method for generating such a search condition, 2
It is explained as follows.

【0059】まず、第1の方法として、得られた統合結
果の有するスロットのうち、対応スロットデータにおい
て対応スロットが設定されているスロットを抽出し、こ
れらのスロットのANDを検索条件とすることがあげら
れる。例えば、図7の検索結果では、「商品名」、「価
格」、「蔵元」の3つのスロットが存在し、これらのス
ロットのうち図4の対応スロットデータには「商品名」
と「価格」が存在する。従って、再検索部120では、
「商品名」と「価格」のANDを用いて、「(商品名:
○○○)&(価格:4000円)」および「(商品名:
△△△)&(価格:4000円)」という新たな検索条
件を生成する。
First, as a first method, of the slots of the obtained integration result, the slots in which the corresponding slots are set in the corresponding slot data are extracted, and AND of these slots is set as a search condition. can give. For example, in the search result of FIG. 7, there are three slots of “product name”, “price”, and “brewery”, and among these slots, the corresponding slot data of FIG.
And "price" exist. Therefore, in the re-search unit 120,
Using the AND of "Product Name" and "Price", "(Product Name:
○○○) & (Price: 4000 yen) ”and“ (Product name:
Δ △△) & (price: 4000 yen) ".

【0060】また、第2の方法として、各スロットにつ
いてユニーク度を定義し、ユニーク度が一定値以上のス
ロットを統合結果から抽出して検索条件とすることがあ
げられる。ここで、情報源rのスロットsのユニーク度
uniq(s,r)は、例えば以下のように定義でき
る。
As a second method, a uniqueness is defined for each slot, and a slot having a uniqueness equal to or more than a certain value is extracted from the integration result as a search condition. Here, the uniqueness uniq (s, r) of the slot s of the information source r can be defined as follows, for example.

【0061】今、情報源rのインスタンス集合Irの各
インスタンスikが生起する確率p(ik)は全て1/n
(Ir)で等しいと考える。ここで、集合Aの要素をn
(A)で表わしている。
Now, the probability p (ik) of occurrence of each instance ik of the instance set Ir of the information source r is all 1 / n
(Ir). Here, the elements of the set A are represented by n
(A).

【0062】このとき、Irの各インスタンスが生起す
る事象のX平均情報量はエントロピーH(X)に等し
く、
At this time, the X average information amount of the event that occurs in each instance of Ir is equal to the entropy H (X),

【0063】[0063]

【数1】 (Equation 1)

【0064】である。Is as follows.

【0065】次に、スロットsに対して、集合Vを V={va1(s,ik)|1≦k≦n(Ir)} と定める。ここで、va1(s,i)はインスタンスi
のスロットsの値である。Vのj番目の要素をvVjで、
Irにおいてvk=vVjとなるインスタンスikの個数を
cjと表すと、値vVjが生起する確率は p(vVj)=cj/n(Ir) である。
Next, for the slot s, the set V is defined as V = {va1 (s, ik) | 1 ≦ k ≦ n (Ir)}. Here, va1 (s, i) is an instance i
Is the value of the slot s. The j-th element of V is vVj,
Assuming that the number of instances ik satisfying vk = vVj in Ir is cj, the probability of occurrence of the value vVj is p (vVj) = cj / n (Ir).

【0066】従って、値Vが生起する事象Yと事象Xと
の相互情報量I(X;Y)は、vVjとikが同時に生起
する確率p(vVj,ik)が、
Therefore, the mutual information I (X; Y) between the event Y and the event X at which the value V occurs is the probability p (vVj, ik) at which vVj and ik occur simultaneously.

【0067】[0067]

【数2】 (Equation 2)

【0068】であることを考えると、Considering that

【0069】[0069]

【数3】 (Equation 3)

【0070】となる。Is obtained.

【0071】以上の準備の上で、情報源rにおけるスロ
ットsのユニーク度uniq(s,r)をi(X;Y)
/H(X)と定義する。すなわち、以下のようになる。
With the above preparation, the uniqueness uniq (s, r) of the slot s in the information source r is represented by i (X; Y)
/ H (X). That is, it becomes as follows.

【0072】[0072]

【数4】 (Equation 4)

【0073】定義から明らかなように、情報源rにおい
て、例えばスロットsの値が全て異なる場合にユニーク
度は1になり、全て同じ場合に0になる。よって、ユニ
ーク度が1のスロットを用いて統合結果から新たな検索
条件を生成する。上記の例では、「(商品名:○○
○)」および「(商品名:△△△)」が新たな検索条件
として生成されることになる。なお、上記類似度の算出
は1つのスロットsについて行っているが、複数のスロ
ットの組についても同様に類似度を求めることができ、
第3の実施形態において複数のスロットの組を新たな検
索条件とすることも可能である。
As is clear from the definition, in the information source r, for example, the uniqueness becomes 1 when the values of the slots s are all different, and becomes 0 when they are all the same. Therefore, a new search condition is generated from the integration result using the slot having the uniqueness of 1. In the above example, "(Product name: XX
○) ”and“ (product name: △△△) ”are generated as new search conditions. Although the similarity is calculated for one slot s, the similarity can be similarly calculated for a plurality of sets of slots.
In the third embodiment, a set of a plurality of slots can be used as a new search condition.

【0074】[他の実施形態]なお、図3で説明した処
理においては、同一の実体を指す情報の同定を検索結果
の統合時に行なっているが、これに限定されるものでは
なく、予め同一の実体を指す情報を求めておいてもよ
い。例えば、各インスタンスにユニークな番号を付して
おき、同一の実体を指すインスタンスの番号の組を保持
しておくことがあげられる。このようなインスタンスの
組は、第2の実施形態で求めた対応スロットの情報を用
いて予め求めておくことが可能である。
[Other Embodiments] In the processing described with reference to FIG. 3, information indicating the same entity is identified at the time of integrating search results. However, the present invention is not limited to this. The information indicating the entity of may be obtained. For example, a unique number may be assigned to each instance, and a set of instance numbers indicating the same entity may be held. Such a set of instances can be obtained in advance using the information of the corresponding slot obtained in the second embodiment.

【0075】また、図3では、全てのスロットについて
統合する場合について説明したが、これに限定されるも
のではなく、予め特定されたスロットについてのみ統合
を行うようにしてもよい。
In FIG. 3, a case where all slots are integrated is described. However, the present invention is not limited to this case, and integration may be performed only for a previously specified slot.

【0076】また、図3においては、情報の統合を検索
ごとに行なう場合について説明したが、これに限定され
るものではない。全ての検索が終わってから、まとめて
統合処理を行なってもよい。
FIG. 3 illustrates the case where the integration of information is performed for each search, but the present invention is not limited to this. After all the searches are completed, the integration process may be performed collectively.

【0077】また、図3においては、検索処理と統合処
理を逐次行なう場合について説明したが、これに限定さ
れるものではない。並行して処理を行なってもよいし、
一部の検索処理や統合処理を部分的にまとめて行なって
もよい。例えば、第1と第2の検索結果を統合しなが
ら、第3の検索を実行するようにしてもよい。また、情
報源A,B,C,Dがある場合に、情報源AとBを検索
して統合結果Eを出し、情報源CとDを検索して統合結
果Fを出し、最後に統合結果EとFを統合するようにし
てもよい。
In FIG. 3, the case where the search process and the integration process are sequentially performed has been described, but the present invention is not limited to this. Processing may be performed in parallel,
Some search processing and integration processing may be partially performed collectively. For example, the third search may be executed while integrating the first and second search results. Further, when there are information sources A, B, C, and D, the information sources A and B are searched for an integrated result E, the information sources C and D are searched for an integrated result F, and finally the integrated result is obtained. E and F may be integrated.

【0078】また、上記実施形態においては、同一の実
体を指す情報の同定において利用する対応スロットは、
1組でも複数組でもよい。また、同定に用いるスロット
の候補を予め定めておいてもよい。
In the above embodiment, the corresponding slot used for identifying information indicating the same entity is:
One set or a plurality of sets may be used. Further, a candidate for a slot used for identification may be determined in advance.

【0079】また、上記実施形態においては、スロット
値が完全に一致するときに、同一実体の情報と同定して
いたが、これに限定されるものではなく、スロット値の
類似性(類似度)が高い場合に、同一実体を指すものと
同定してもよい。
In the above embodiment, when the slot values completely match, the information is identified as the same entity. However, the present invention is not limited to this, and the similarity (similarity) of the slot values is determined. May be identified as pointing to the same entity.

【0080】このような類似度を使用する場合、類似度
から計算するスコアが一定値以上の場合に、同一情報と
同定する。このスコアsの算出方法としては、例えば、
次の式を用いることができる。
When such a similarity is used, if the score calculated from the similarity is a certain value or more, it is identified as the same information. As a method of calculating the score s, for example,
The following equation can be used:

【0081】[0081]

【数5】 (Equation 5)

【0082】ここで、υとυ’は、それぞれのスロット
の値を表わす。スロット値υ,υ’の類似度sim
(υ,υ’)としては、例えば、長尾真編「自然言語処
理」岩波書店,1996年,431頁から434頁で述
べられている最適照合検索のスコアを0から1の間に正
規化したものを用いる。
Here, υ and υ ′ represent the value of each slot. Similarity sim of slot values υ and υ '
For example, (υ, 、 ′) is obtained by normalizing the score of the optimal collation search described in “Natural Language Processing”, edited by Makoto Nagao, Iwanami Shoten, 1996, pp. 431 to 434, between 0 and 1. Use something.

【0083】また、上記においては、スロット値の類似
度として、文字列と似ている尺度を出す最適照合検索を
用いる場合について説明したが、これに限定されるもの
ではなく、他の尺度を用いてもよい。例えば、数字から
構成されるスロット値では、数値としての類似度を利用
する方法が考えられる。また、アルファベットのスロッ
ト値とカタカナのスロット値の類似度は、アルファベッ
トで表記された英単語などをカタカナ表記に変換し(例
えば、情報処理学会誌Vol.35,No.1,住吉,
相澤「英語固有名詞の片カナ変換」に記載の方法があ
る)、変換したカタカナ文字列ともう一方のカタカナ文
字列の類似度を利用する方法がある。あるいは、シソー
ラスを用いて、シソーラス上での距粧が短い方が、類似
度が高いとする方法がある。
Further, in the above description, the case where the optimal collation search that produces a measure similar to a character string is used as the similarity of the slot value has been described. However, the present invention is not limited to this. You may. For example, for a slot value composed of numbers, a method of using the similarity as a numerical value can be considered. In addition, the similarity between the slot value of the alphabet and the slot value of the katakana is obtained by converting an English word or the like written in the alphabet into katakana notation (for example, IPSJ Journal Vol. 35, No. 1, Sumiyoshi,
There is a method described in Aizawa "Katakana conversion of English proper nouns"), and a method of using the similarity between the converted katakana character string and the other katakana character string. Alternatively, there is a method in which the similarity is higher when the distance on the thesaurus is shorter, using a thesaurus.

【0084】さらには、こうした複数の類似度を全て求
めて、そのうち最も高い値を採用する方法もある。
Further, there is a method in which all of the plurality of similarities are obtained, and the highest value is employed.

【0085】また、上記実施形態においては、各部を同
一の計算機上で構成する場合について説明したが、これ
に限定されるものではなく、ネットワーク上に分散した
計算機や処理装置などに分かれて各部を構成してもよ
い。
Further, in the above embodiment, the case where each unit is configured on the same computer has been described. However, the present invention is not limited to this, and each unit is divided into computers and processing devices distributed on a network. You may comprise.

【0086】また、上記実施形態においては、検索条件
保持部103と検索結果保持部105と統合結果保持部
107をRAMで、対応スロットデータ保持部102を
ディスク装置で実現する場合について説明したが、これ
に限定されるものではなく、任意の記憶媒体を用いて実
現してもよい。他の実施形態についても同様である。
In the above embodiment, the case where the search condition holding unit 103, the search result holding unit 105, and the integration result holding unit 107 are implemented by a RAM and the corresponding slot data holding unit 102 is implemented by a disk device has been described. The present invention is not limited to this, and may be realized using an arbitrary storage medium. The same applies to other embodiments.

【0087】また、上記実施形態においては、プログラ
ムをROMに保持する場合について説明したが、これに
限定されるものではなく、任意の記憶媒体を用いて実現
してもよい。また、同様の動作をする回路で実現しても
よい。
In the above embodiment, the case where the program is stored in the ROM has been described. However, the present invention is not limited to this, and may be realized by using an arbitrary storage medium. Further, it may be realized by a circuit that performs the same operation.

【0088】なお、本発明は、複数の機器から構成され
るシステムに適用しても、1つの槻器からなる装置に適
用してもよい。前述した実施形態の機能を実現するソフ
トウェアのプログラムコードを記録した記録媒体を、シ
ステム或いは装置に供給し、そのシステム或いは装置の
コンピュータ(またはCPUやMPU)が記録媒体に格
納されたプログラムコードを読み出し実行することによ
っても、達成されることは言うまでもない。
The present invention may be applied to a system composed of a plurality of devices or an apparatus composed of a single device. A recording medium storing the software program code for realizing the functions of the above-described embodiments is supplied to a system or an apparatus, and a computer (or CPU or MPU) of the system or the apparatus reads out the program code stored in the recording medium. Needless to say, it can also be achieved by executing.

【0089】この場合、記録媒体から読み出されたプロ
グラムコード自体が前述した実施形態の機能を実現する
ことになり、そのプログラムコードを記録した記録媒体
は本発明を構成することになる。
In this case, the program code itself read from the recording medium implements the functions of the above-described embodiment, and the recording medium on which the program code is recorded constitutes the present invention.

【0090】プログラムコードを供給するための記録媒
体としては、例えば、フロッピーディスク,ハードディ
スク,光ディスク,光磁気ディスク,CD−ROM,C
D−R,磁気テープ,不揮発性のメモリカード,ROM
などを用いることができる。また、コンピュータが読み
出したプログラムコードを実行することにより、前述し
た実施形態の機能が実現されるだけでなく、そのプログ
ラムコードの指示に基づき、コンピュータ上で稼働して
いるOSなどが実際の処理の一部または全部を行ない、
その処理によって前述した実施形態の機能が実現される
場合も含まれることは言うまでもない。
Examples of a recording medium for supplying the program code include a floppy disk, hard disk, optical disk, magneto-optical disk, CD-ROM,
DR, magnetic tape, nonvolatile memory card, ROM
Etc. can be used. When the computer executes the readout program code, not only the functions of the above-described embodiments are realized, but also the OS or the like running on the computer performs actual processing based on the instruction of the program code. Do some or all,
It goes without saying that a case where the function of the above-described embodiment is realized by the processing is also included.

【0091】更に、記録媒体から読み出されたプログラ
ムコードが、コンピュータに挿入された機能拡張ボード
やコンピュータに接続された機能拡張ユニットに備わる
メモリに書き込まれた後、そのプログラムコードの指示
に基づき、その機能拡張ボードや機能拡張ユニットに備
わるCPUなどが実際の処理の一部または全部を行な
い、その処理によって前述した実施形態の機能が実現さ
れる場合も含まれることは言うまでもない。
Further, after the program code read from the recording medium is written into a memory provided in a function expansion board inserted into the computer or a function expansion unit connected to the computer, based on the instruction of the program code, It goes without saying that the CPU provided in the function expansion board or the function expansion unit performs a part or all of the actual processing, and the processing realizes the functions of the above-described embodiments.

【0092】[0092]

【発明の効果】以上説明したように本発明によれば、異
なるデータ項目を有する複数の情報源から得られた検索
結果を統合し、まとめて提示することが可能となる。こ
のため、利用者は複数の情報源の検索結果を一覧するこ
とができ便利である。
As described above, according to the present invention, search results obtained from a plurality of information sources having different data items can be integrated and presented together. For this reason, the user can conveniently view the search results of a plurality of information sources.

【0093】[0093]

【図面の簡単な説明】[Brief description of the drawings]

【図1】第1の実施形態に係る装置の基本的な機能構成
を示すブロック図である。
FIG. 1 is a block diagram illustrating a basic functional configuration of an apparatus according to a first embodiment.

【図2】第1の実施形態の情報処理装置の具体的構成を
示す図である。
FIG. 2 is a diagram illustrating a specific configuration of the information processing apparatus according to the first embodiment.

【図3】第1の実施形態による検索処理の手順を説明す
るフローチャートである。
FIG. 3 is a flowchart illustrating a procedure of a search process according to the first embodiment.

【図4】第1の実施形態による第1情報源の、対応スロ
ットデータ保持部102に保持される対応スロットデー
タの一例を示した図である。
FIG. 4 is a diagram showing an example of corresponding slot data held in a corresponding slot data holding unit 102 of the first information source according to the first embodiment.

【図5】第1の実施形態による第1情報源のスロットを
示す図である。
FIG. 5 is a diagram showing slots of a first information source according to the first embodiment.

【図6】検索条件の一例を示す図である。FIG. 6 is a diagram showing an example of a search condition.

【図7】第1情報源の検索結果例を示す図である。FIG. 7 is a diagram illustrating an example of a search result of a first information source.

【図8】第1の実施形態による第2情報源のスロットを
示す図である。
FIG. 8 is a diagram illustrating slots of a second information source according to the first embodiment.

【図9】検索条件の一例を示す図である。FIG. 9 is a diagram illustrating an example of a search condition.

【図10】第2情報源の検索結果例を示す図である。FIG. 10 is a diagram illustrating an example of a search result of a second information source.

【図11】検索条件を示す図である。FIG. 11 is a diagram showing search conditions.

【図12】第1の実施形態による2つの情報源による検
索結果の統合結果を示す図である。
FIG. 12 is a diagram showing a result of integrating search results by two information sources according to the first embodiment.

【図13】第2の実施形態に係る装置の基本的な機能構
成を示すブロック図である。
FIG. 13 is a block diagram illustrating a basic functional configuration of an apparatus according to a second embodiment.

【図14】対応スロットデータの作成処理手順を説明す
るフローチャートである。
FIG. 14 is a flowchart illustrating a procedure for creating corresponding slot data.

【図15】第2の実施形態における第1情報源の内容を
示す図である。
FIG. 15 is a diagram illustrating contents of a first information source according to the second embodiment.

【図16】第2の実施形態における第2情報源の内容を
示す図である。
FIG. 16 is a diagram illustrating contents of a second information source according to the second embodiment.

【図17】第3の実施形態に係る装置の基本的な機能構
成を示すブロック図である。
FIG. 17 is a block diagram illustrating a basic functional configuration of an apparatus according to a third embodiment.

【図18】第3の実施形態による2つの情報源の検索結
果の統合結果を示す図である。
FIG. 18 is a diagram illustrating a result of integrating search results of two information sources according to the third embodiment.

【符号の説明】[Explanation of symbols]

101 検索対象保持部 102 対応スロットデータ保持部 103 検索条件保持部 104 情報検索部 105 検索結果保持部 106 情報統合部 107 統合結果保持部 101 search target holding unit 102 corresponding slot data holding unit 103 search condition holding unit 104 information search unit 105 search result holding unit 106 information integrating unit 107 integrated result holding unit

───────────────────────────────────────────────────── フロントページの続き (72)発明者 大谷 紀子 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内 ────────────────────────────────────────────────── ─── Continued on the front page (72) Inventor Noriko Otani 3-30-2 Shimomaruko, Ota-ku, Tokyo Inside Canon Inc.

Claims (19)

【特許請求の範囲】[Claims] 【請求項1】 検索対象となる複数の情報源について情
報検索を行う情報検索装置であって、 前記複数の情報源間において対応するデータ項目を示す
対応情報を保持する保持手段と、 与えられた検索条件を、前記保持手段によって保持され
ている前記対応情報を用いて前記複数の情報源のそれぞ
れに応じた検索条件に変換する変換手段と、 前記変換手段で得られた検索条件でもって前記複数の情
報源を検索し、得られた複数の検索結果を、各情報の実
体を単位として統合する統合手段とを備えることを特徴
とする情報検索装置。
1. An information search apparatus for performing information search on a plurality of information sources to be searched, comprising: holding means for holding corresponding information indicating data items corresponding to the plurality of information sources; Conversion means for converting a search condition into search conditions corresponding to each of the plurality of information sources using the correspondence information held by the holding means; and And an integrating means for integrating the plurality of obtained search results for each information entity as a unit.
【請求項2】 前記統合手段は、前記複数の検索結果か
ら同一の実体に関する情報を同定し、同一の実体である
と同定された情報について統合を行うことを特徴とする
請求項1に記載の情報検索装置。
2. The apparatus according to claim 1, wherein the integration unit identifies information on the same entity from the plurality of search results, and integrates information identified as the same entity. Information retrieval device.
【請求項3】 前記統合手段は、2つの情報源から得ら
れた検索結果について、前記保持手段に保持されている
対応情報で対応が設定されているデータ項目において値
が一致している場合に、該2つの検索結果が同一の実体
の情報であると同定することを特徴とする請求項2に記
載の情報検索装置。
3. The integration unit according to claim 1, wherein the search results obtained from the two information sources have matching values in the data items for which correspondence is set in the correspondence information held in the holding unit. 3. The information search apparatus according to claim 2, wherein the two search results are identified as information of the same entity.
【請求項4】 前記統合手段によって得られた検索結果
から新たな検索条件を生成する生成手段と、 前記生成手段で生成された検索条件に従って前記複数の
情報源について再度の検索を行う再検索手段とを更に備
えることを特徴とする請求項1乃至3のいずれかに記載
の情報検索装置。
4. A generating means for generating a new search condition from a search result obtained by said integrating means, and a re-searching means for performing a search again for said plurality of information sources in accordance with the search condition generated by said generating means. The information retrieval apparatus according to claim 1, further comprising:
【請求項5】 前記生成手段は、前記統合手段で得られ
た検索結果に基づいて、情報の実体をユニークに特定す
る検索条件を生成することを特徴とする請求項4に記載
の情報検索装置。
5. The information search apparatus according to claim 4, wherein the generation unit generates a search condition for uniquely specifying an entity of information based on a search result obtained by the integration unit. .
【請求項6】 前記生成手段は、前記統合手段で得られ
た検索結果に存在するデータ項目のうち前記対応情報に
保持されているデータ項目を抽出し、抽出したデータ項
目の論理積によって新たな検索条件を生成することを特
徴とする請求項5に記載の情報検索装置。
6. The generation unit extracts a data item held in the correspondence information from among data items present in the search result obtained by the integration unit, and generates a new product by logical product of the extracted data items. The information search device according to claim 5, wherein a search condition is generated.
【請求項7】 前記生成手段は、前記統合手段で得られ
た検索結果の各データ項目についてユニーク度を計算
し、情報の実体のそれぞれが唯一のデータを有するデー
タ項目を抽出し、抽出されたデータ項目に基づいて新た
な検索条件を生成することを特徴とする請求項5に記載
の情報検索装置。
7. The generating means calculates uniqueness for each data item of the search result obtained by the integrating means, extracts data items in which each entity of information has unique data, and extracts the extracted data items. The information search device according to claim 5, wherein a new search condition is generated based on the data item.
【請求項8】 前記情報統合手段は、予め指定された特
定のデータ項目に限定して統合を行なうことを特徴とす
る請求項1乃至7のいずれかに記載の情報検索装置。
8. The information retrieval apparatus according to claim 1, wherein said information integration means performs integration only for a specific data item specified in advance.
【請求項9】 前記複数の情報源のデータに基づいて、
前記保持手段に保持させる対応情報を生成する対応情報
生成手段を更に備えることを特徴とする請求項1乃至8
の何れかに記載の情報検索装置。
9. Based on the data of the plurality of information sources,
9. The apparatus according to claim 1, further comprising correspondence information generation means for generating correspondence information to be held by said holding means.
An information retrieval device according to any one of the above.
【請求項10】 検索対象となる複数の情報源について
情報検索を行うための情報検索方法であって、 与えられた検索条件を、複数の情報源について対応する
データ項目を示す対応情報を用いて前記複数の情報源の
それぞれに応じた検索条件に変換する変換工程と、 前記変換工程で得られた検索条件でもって前記複数の情
報源を検索し、得られた複数の検索結果を、各情報の実
体を単位として統合する統合工程とを備えることを特徴
とする情報検索方法。
10. An information search method for performing an information search on a plurality of information sources to be searched, wherein a given search condition is determined using correspondence information indicating data items corresponding to the plurality of information sources. A conversion step of converting to a search condition corresponding to each of the plurality of information sources; and searching the plurality of information sources using the search conditions obtained in the conversion step, and obtaining a plurality of search results obtained by each information. An integration step of integrating the entities of the information as a unit.
【請求項11】 前記統合工程は、前記複数の検索結果
から同一の実体に関する情報を同定し、同一の実体であ
ると同定された情報について統合を行うことを特徴とす
る請求項10に記載の情報検索方法。
11. The method according to claim 10, wherein the integrating step identifies information on the same entity from the plurality of search results, and integrates information identified as the same entity. Information retrieval method.
【請求項12】 前記統合工程は、2つの情報源から得
られた検索結果について、前記保持工程に保持されてい
る対応情報で対応が設定されているデータ項目において
値が一致している場合に、該2つの検索結果が同一の実
体の情報であると同定することを特徴とする請求項11
に記載の情報検索方法。
12. The integration step according to claim 1, wherein the search results obtained from the two information sources have matching values in the data items for which correspondence is set in the correspondence information held in the holding step. And identifying the two search results as information of the same entity.
Information search method described in.
【請求項13】 前記統合工程によって得られた検索結
果から新たな検索条件を生成する生成工程と、 前記生成工程で生成された検索条件に従って前記複数の
情報源について再度の検索を行う再検索工程とを更に備
えることを特徴とする請求項10乃至12のいずれかに
記載の情報検索方法。
13. A generating step of generating a new search condition from a search result obtained in the integrating step, and a re-searching step of performing a search again for the plurality of information sources according to the search condition generated in the generating step. 13. The information search method according to claim 10, further comprising:
【請求項14】 前記生成工程は、前記統合工程で得ら
れた検索結果に基づいて、情報の実体をユニークに特定
する検索条件を生成することを特徴とする請求項13に
記載の情報検索方法。
14. The information search method according to claim 13, wherein the generating step generates a search condition for uniquely specifying an entity of information based on a search result obtained in the integrating step. .
【請求項15】 前記生成工程は、前記統合工程で得ら
れた検索結果に存在するデータ項目のうち前記対応情報
に保持されているデータ項目を抽出し、抽出したデータ
項目の論理積によって新たな検索条件を生成することを
特徴とする請求項14に記載の情報検索方法。
15. The generating step extracts a data item held in the correspondence information from data items present in the search result obtained in the integrating step, and creates a new logical product of the extracted data items. The information search method according to claim 14, wherein a search condition is generated.
【請求項16】 前記生成工程は、前記統合工程で得ら
れた検索結果の各データ項目についてユニーク度を計算
し、情報の実体のそれぞれが唯一のデータを有するデー
タ項目を抽出し、抽出されたデータ項目に基づいて新た
な検索条件を生成することを特徴とする請求項14に記
載の情報検索方法。
16. The generating step calculates a uniqueness for each data item of the search result obtained in the integrating step, extracts a data item in which each entity of information has only one data, and extracts the extracted data item. The information search method according to claim 14, wherein a new search condition is generated based on the data item.
【請求項17】 前記情報統合工程は、予め指定された
特定のデータ項目に限定して統合を行なうことを特徴と
する請求項10乃至16のいずれかに記載の情報検索方
法。
17. The information search method according to claim 10, wherein in the information integration step, the integration is performed only for a specific data item specified in advance.
【請求項18】 前記複数の情報源のデータに基づい
て、前記保持手段に保持するための対応情報を生成する
対応情報生成工程を更に備えることを特徴とする請求項
10乃至17のいずれかに記載の情報検索方法。
18. The apparatus according to claim 10, further comprising a correspondence information generating step of generating correspondence information to be held in said holding means based on data of said plurality of information sources. Information search method described.
【請求項19】 コンピュータに、検索対象となる複数
の情報源について情報検索を行わせる制御プログラムを
格納する記憶媒体であって、該制御プログラムが、 与えられた検索条件を、複数の情報源について対応する
データ項目を示す対応情報を用いて前記複数の情報源の
それぞれに応じた検索条件に変換する変換工程のコード
と、 前記変換工程で得られた検索条件でもって前記複数の情
報源を検索し、得られた複数の検索結果を、各情報の実
体を単位として統合する統合工程のコードとを備えるこ
とを特徴とする記憶媒体。
19. A storage medium for storing a control program for causing a computer to perform information search on a plurality of information sources to be searched, wherein the control program stores a given search condition for a plurality of information sources. A code for a conversion step of converting the information into search conditions corresponding to each of the plurality of information sources using the corresponding information indicating the corresponding data items; and searching the plurality of information sources using the search conditions obtained in the conversion step And a code for an integration step of integrating a plurality of obtained search results in units of each entity of information.
JP9348307A 1997-12-17 1997-12-17 Information retrieving device and method therefor and storage medium Withdrawn JPH11175562A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9348307A JPH11175562A (en) 1997-12-17 1997-12-17 Information retrieving device and method therefor and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9348307A JPH11175562A (en) 1997-12-17 1997-12-17 Information retrieving device and method therefor and storage medium

Publications (1)

Publication Number Publication Date
JPH11175562A true JPH11175562A (en) 1999-07-02

Family

ID=18396153

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9348307A Withdrawn JPH11175562A (en) 1997-12-17 1997-12-17 Information retrieving device and method therefor and storage medium

Country Status (1)

Country Link
JP (1) JPH11175562A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002082982A (en) * 2000-09-06 2002-03-22 Nippon Telegr & Teleph Corp <Ntt> Device and method for providing information and recording medium with information providing program recorded thereon
JP2010231665A (en) * 2009-03-27 2010-10-14 Dainippon Printing Co Ltd Method for setting network equipment

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002082982A (en) * 2000-09-06 2002-03-22 Nippon Telegr & Teleph Corp <Ntt> Device and method for providing information and recording medium with information providing program recorded thereon
JP2010231665A (en) * 2009-03-27 2010-10-14 Dainippon Printing Co Ltd Method for setting network equipment

Similar Documents

Publication Publication Date Title
US8577882B2 (en) Method and system for searching multilingual documents
JP4366108B2 (en) Document search apparatus, document search method, and computer program
CN100424695C (en) Document processing apparatus for searching documents control method therefor,
JPH11175562A (en) Information retrieving device and method therefor and storage medium
JP2004334341A (en) Document retrieval system, document retrieval method, and recording medium
JP2000112959A (en) Information retrieval device/method
JPH10307837A (en) Retrieval device and recording medium recording retrieval program
JPH09198404A (en) Method and device for processing document
JP3897409B2 (en) Information processing apparatus and method, and storage medium storing program
JPH11213008A (en) Device and method for retrieving text and device and method for grouping url
JP4086377B2 (en) Information retrieval apparatus and method
JP3787384B2 (en) Document retrieval apparatus and method
JP2002108887A (en) Document retriever, method for adding keyword to the retriever, document retrieval method and computer readable storage medium
JP4034503B2 (en) Document search system and document search method
JP2008203997A (en) Document retrieval device and program
JP4983397B2 (en) Document search apparatus, document search method, and computer program
JP2003228578A (en) Method and device for retrieving information, and control program for device for retrieving information
JPH09265472A (en) Picture database system
JPH1011424A (en) Document preparation support device
JP3949874B2 (en) Translation translation learning method, translation translation learning device, storage medium, and translation system
JP2004326302A (en) Translation support device and translation support program
JP2000076254A (en) Keyword extraction device, similar document retrieval device using the same, keyword extraction method and record medium
JPH0991305A (en) Method and device for information processing
JP4390039B2 (en) Search system and method
JP2009123033A (en) Document retrieval support apparatus and program

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20050301