JP2010267075A - Apparatus and method for processing information, program, and storage medium - Google Patents

Apparatus and method for processing information, program, and storage medium Download PDF

Info

Publication number
JP2010267075A
JP2010267075A JP2009117859A JP2009117859A JP2010267075A JP 2010267075 A JP2010267075 A JP 2010267075A JP 2009117859 A JP2009117859 A JP 2009117859A JP 2009117859 A JP2009117859 A JP 2009117859A JP 2010267075 A JP2010267075 A JP 2010267075A
Authority
JP
Japan
Prior art keywords
search
search engine
data source
engine
engines
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009117859A
Other languages
Japanese (ja)
Inventor
Hajime Futaki
一 二木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2009117859A priority Critical patent/JP2010267075A/en
Publication of JP2010267075A publication Critical patent/JP2010267075A/en
Pending legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To automatically select an appropriate search engine. <P>SOLUTION: An information processing apparatus includes a search engine identification means for identifying the kind of a search relating to an input search query according to the input search query and identifying a search engine based on the kind of the search; a data source selection means for selecting a data source based on association information associating the search engine with a data source containing a plurality of contents, and on the search engine identified by the search engine identification means; and a determination means for determining the search engine that requests the search from a plurality of search engines identified by the identification means, based on whether or not the kind of the search relating to the search engine for which the plurality of search engines are identified by the search engine identification means overlaps, and on whether or not the data source identified by the data source selection means overlaps. <P>COPYRIGHT: (C)2011,JPO&INPIT

Description

本発明は、情報処理装置、情報処理方法、プログラム及び記憶媒体に関する。   The present invention relates to an information processing apparatus, an information processing method, a program, and a storage medium.

複数の検索エンジンを統合して検索を行う統合検索技術が用いられている。例えばインターネット上の複数の検索サイトを同時に検索して結果を統合するメタ検索サービスや、企業内データベースを横断検索するシステムなどが既に実用化されている。統合検索においては、複数の検索エンジンをどのように用いて検索を実行するかに検索結果が依存するため、適切な結果を得るには適切な検索の実行方法を選択する必要がある。これに対する従来技術として、例えば特許文献1では複数の検索エンジン相互に関する検索条件をユーザが指定する方法が提案されている。この方法は、検索に使用する検索エンジンと、それらの間の論理演算の方法とをユーザが指定することにより所望の検索結果を得るものである。   An integrated search technology that performs search by integrating a plurality of search engines is used. For example, a meta search service for simultaneously searching a plurality of search sites on the Internet and integrating the results, a system for cross-searching an in-company database, and the like have already been put into practical use. In the integrated search, the search result depends on how the search is executed using a plurality of search engines. Therefore, in order to obtain an appropriate result, it is necessary to select an appropriate search execution method. As a conventional technique for this, for example, Patent Document 1 proposes a method in which a user specifies search conditions relating to a plurality of search engines. In this method, the user designates a search engine used for the search and a logical operation method between them, thereby obtaining a desired search result.

特開2002−024265号公報JP 2002-024265 A

インターネットのメタ検索においては、ユーザが求めるコンテンツが所在するデータソースはWebサイトの全体集合であり、検索エンジンが検索対象とするデータソースはWebサイトの部分集合である。ここで、各検索エンジンが検索対象とするWebサイトの部分集合が十分に広範であれば、実行上はWebサイトの全体集合という単一のデータソースを検索対象としていると見なすことができる。このように、検索エンジンが検索対象とするデータソースと、ユーザの求めるコンテンツが所在するデータソースとが、共にユーザにとって既知又は既知と見なせる場合は、ユーザが検索エンジンの組み合わせ方を指定する方法に検索結果の改善効果が期待できた。   In the meta search on the Internet, the data source where the content desired by the user is located is a whole set of websites, and the data source to be searched by the search engine is a subset of websites. Here, if a subset of Web sites to be searched by each search engine is sufficiently wide, it can be considered that a single data source called the entire set of Web sites is a search target in terms of execution. As described above, when the data source to be searched by the search engine and the data source where the content desired by the user is located can be both known or known to the user, the user can specify how to combine the search engines. Expected to improve search results.

しかしながら、検索エンジンが検索対象とするデータソースや、求めるコンテンツが所在するデータソースが未知の場合、ユーザが最適な検索エンジンの組み合わせを指定することは困難となる。例えば、インターネットやイントラネット等を含む様々なネットワーク上に分散したコンテンツを検索する統合検索を考える。このような場合、一般にユーザは所望のコンテンツがネットワーク上のどこに所在しているかを知り得ないので、統合検索には幅広く検索を行うことが求められる。それと同時に、分散した大量のコンテンツから所望のコンテンツを効率よく取得することが求められる。   However, when the data source to be searched by the search engine or the data source where the desired content is located is unknown, it is difficult for the user to specify an optimal combination of search engines. For example, consider an integrated search that searches for content distributed on various networks including the Internet and an intranet. In such a case, since the user generally cannot know where the desired content is located on the network, the integrated search is required to perform a wide search. At the same time, it is required to efficiently acquire desired content from a large amount of distributed content.

しかしながら、コンテンツの所在に関する事前知識のないユーザにとって、検索対象とするデータソースを特定することは有効な手段とは成り得ない。更に、各検索エンジンが検索対象とするデータソースについての知識をコンテンツの所在と結びつけることができない。したがって、所望のコンテンツが得られるよう検索に利用するデータソースや検索エンジンを適切に選択することも、検索エンジン間の論理演算の方法を適切に指定することもユーザに期待することはできない。ユーザの事前知識を前提とした従来技術はこの点において課題があった。   However, for users who do not have prior knowledge about the location of content, specifying a data source to be searched cannot be an effective means. Furthermore, it is not possible to link knowledge about the data source to be searched by each search engine with the location of the content. Therefore, it is impossible to expect the user to appropriately select a data source or a search engine used for the search so as to obtain a desired content, or to appropriately specify a logical operation method between the search engines. The prior art based on the prior knowledge of the user has a problem in this respect.

更に、共通のデータソースを検索対象とする複数の検索エンジンそれぞれに対して同じ検索を実行させることは無駄である。このような場合は得られる結果もまた同一であって、複数のエンジン統合することによる効果は得られない。したがって、検索に利用する検索エンジンを限定して通信帯域やマシンリソースの浪費を回避することが望まれるが、ユーザの指定した検索エンジンに検索を実行させる従来技術では、こうした要求に対応することは困難であった。   Furthermore, it is useless to execute the same search for each of a plurality of search engines that search for a common data source. In such a case, the results obtained are also the same, and the effect of integrating a plurality of engines cannot be obtained. Therefore, it is desirable to limit the search engines used for the search to avoid wasting communication bandwidth and machine resources. However, the conventional technology that allows the search engine specified by the user to execute the search does not meet such demands. It was difficult.

本発明はこのような問題点に鑑みなされたもので、適切な検索エンジンを自動的に選択することを目的とする。   The present invention has been made in view of such problems, and an object thereof is to automatically select an appropriate search engine.

そこで、本発明は、入力された検索クエリに基づいて前記検索クエリに係る1又は複数の検索種別を特定し、前記検索種別に基づいて1又は複数の検索エンジンを特定する検索エンジン特定手段と、検索エンジンと、前記検索エンジンが検索対象とする複数のコンテンツを含むデータソースと、を対応付ける対応付け情報と、前記検索エンジン特定手段で特定された1又は複数の検索エンジンと、に基づいて1又は複数のデータソースを選択するデータソース選択手段と、前記検索エンジン特定手段で複数の検索エンジンが特定された検索エンジンに係る検索種別が重複しているか否か、及び前記データソース選択手段で特定されたデータソースが重複しているか否かに基づいて、前記特定手段で特定された複数の検索エンジンの中から、検索を要求する検索エンジンを決定する決定手段と、を有する。
かかる構成とすることにより、適切な検索エンジンを自動的に選択することができる。
また、本発明は、情報処理方法、プログラム及び記憶媒体としてもよい。
Therefore, the present invention specifies one or more search types related to the search query based on the input search query, and specifies one or more search engines based on the search type; 1 or based on association information associating a search engine with a data source including a plurality of contents to be searched by the search engine and one or more search engines specified by the search engine specifying means The data source selection means for selecting a plurality of data sources, whether or not the search types related to the search engines for which the plurality of search engines are specified by the search engine specifying means are duplicated, and specified by the data source selection means. From the plurality of search engines specified by the specifying means based on whether or not the data sources overlapped. Having a determination means for determining a search engine requesting.
With this configuration, an appropriate search engine can be automatically selected.
The present invention may be an information processing method, a program, and a storage medium.

本発明によれば、適切な検索エンジンを自動的に選択することができる。   According to the present invention, an appropriate search engine can be automatically selected.

統合検索を行うシステムのシステム構成の一例を示す図(その1)である。1 is a diagram (part 1) illustrating an example of a system configuration of a system that performs an integrated search; FIG. 統合検索装置のモジュール構成の一例を示す図である。It is a figure which shows an example of the module structure of an integrated search apparatus. 統合検索装置のハードウェア構成の一例を示す図である。It is a figure which shows an example of the hardware constitutions of an integrated search apparatus. 統合検索を行うシステムのシステム構成の一例を示す図(その2)である。FIG. 2 is a diagram (part 2) illustrating an example of a system configuration of a system that performs an integrated search; 検索エンジンの登録処理の一例を示すフローチャートである。It is a flowchart which shows an example of the registration process of a search engine. 検索エンジン管理部が保管するデータの構造を示す図である。It is a figure which shows the structure of the data which a search engine management part stores. データソース管理部が保管するデータの構造を示す図である。It is a figure which shows the structure of the data which a data source management part stores. 検索エンジン=データソース対応付け管理部が保管するデータの構造を示す図である。It is a figure which shows the structure of the data which a search engine = data source matching management part stores. 検索処理の一例を示すフローチャートである。It is a flowchart which shows an example of a search process. 統合検索を行うシステムのシステム構成の一例を示す図(その3)である。FIG. 3 is a diagram (part 3) illustrating an example of a system configuration of a system that performs an integrated search; 統合検索装置101内の保管データの構成の一例を示す図である。3 is a diagram illustrating an example of a configuration of storage data in an integrated search device 101. FIG. 検索結果統合処理の一例を示すフローチャートである。It is a flowchart which shows an example of a search result integration process.

以下、本発明の実施形態について図面に基づいて説明する。   Hereinafter, embodiments of the present invention will be described with reference to the drawings.

<実施形態1>
図1は、統合検索を行うシステムのシステム構成の一例を示す図(その1)である。情報処理装置(コンピュータ)の一例である統合検索装置101は、ユーザからの検索要求を受けて複数の検索エンジンに対して検索の実行を指示し、それぞれの検索エンジンから取得した検索結果を統合する。検索エンジン102〜104は、データソース105〜107に含まれるコンテンツの検索を行う。検索エンジンには属性検索や全文検索等が存在し得るが、本実施形態はその種別は問わない。同様に、データソースにはデータベースやファイルサーバ等が存在し得るがその種別は問わない。各検索エンジンが検索対象とするデータソースは1つには限られず、更には複数の検索エンジンが同一のデータソースを検索対象としていてもよい。また、各検索エンジンの内部においてMapReduceに代表される並列分散化が行われていても構わない。
<Embodiment 1>
FIG. 1 is a diagram (part 1) illustrating an example of a system configuration of a system that performs an integrated search. An integrated search apparatus 101, which is an example of an information processing apparatus (computer), receives a search request from a user, instructs a plurality of search engines to execute a search, and integrates search results acquired from the respective search engines. . The search engines 102 to 104 search for contents included in the data sources 105 to 107. There may be attribute search, full-text search, and the like in the search engine, but the type of this embodiment is not limited. Similarly, a data source may include a database, a file server, etc., but its type is not limited. The number of data sources to be searched by each search engine is not limited to one, and a plurality of search engines may search for the same data source. In addition, parallel distribution represented by MapReduce may be performed inside each search engine.

統合検索装置と各検索エンジンとは通信手段108によって接続され、各検索エンジンとデータソースとは通信手段109によって接続されている。ここで通信手段108、109には、統合検索装置と検索エンジンとの接続方法ならびに検索エンジンとデータソースとの接続方法に応じて、様々なものが適用可能である。例えば、インターネットやLANのような通信網、コンピュータシステム内のバス、更にはコンピュータプログラムのAPI等である。   The integrated search device and each search engine are connected by communication means 108, and each search engine and data source are connected by communication means 109. Here, various means can be applied to the communication means 108 and 109 according to the connection method between the integrated search device and the search engine and the connection method between the search engine and the data source. For example, a communication network such as the Internet or a LAN, a bus in a computer system, and an API of a computer program.

図2は、統合検索装置のモジュール構成の一例を示す図である。
検索エンジン管理部201は、統合検索装置が利用可能な検索エンジンを登録して保管する。検索エンジンを登録する方法については本実施形態が規定する所ではない。データソース管理部202は、検索エンジン管理部201に登録されている各検索エンジンが検索対象とするデータソースを識別するデータソース特定情報を取得して保管する。検索エンジン=データソース対応付け管理部203は、検索エンジン管理部201とデータソース管理部202に保管されている情報を対応付けて統括管理する。データソース関係検証部204は、データソース管理部202で管理されているデータソース特定情報に基づいて検索エンジン管理部201に登録されている検索エンジンが、共通のコンテンツを検索対象としているか否かを検証する。
FIG. 2 is a diagram illustrating an example of a module configuration of the integrated search device.
The search engine management unit 201 registers and stores search engines that can be used by the integrated search device. The method for registering a search engine is not defined by this embodiment. The data source management unit 202 acquires and stores data source specifying information for identifying a data source to be searched by each search engine registered in the search engine management unit 201. The search engine = data source association management unit 203 associates and manages the information stored in the search engine management unit 201 and the data source management unit 202 in an integrated manner. The data source relationship verification unit 204 determines whether or not the search engines registered in the search engine management unit 201 based on the data source identification information managed by the data source management unit 202 search for common content. Validate.

共通検索クエリ設定部205は、ユーザからの検索クエリ入力を受け付ける。個別検索クエリ生成部206は、共通検索クエリ設定部205においてユーザが入力した検索クエリと、データソース関係検証部204の検証結果と、から、検索エンジン管理部201に登録されている各検索エンジンに応じた検索クエリを生成する。個別検索実行部207は、個別検索クエリを用いて検索エンジン管理部201に登録されている各検索エンジンに検索の実行を要求し、検索結果を取得する。なお、図2において共通検索クエリ設定部205と個別検索クエリ生成部206とはそれぞれ1つであるように示されているが、検索エンジン毎に分かれている構成をとるようにしてもよい。検索結果統合部208は、個別検索実行部207で取得した検索結果を統合する。入出力管理部209は、検索クエリの入力や検索結果の表示のためのユーザインタフェースを管理する。   The common search query setting unit 205 receives a search query input from a user. The individual search query generation unit 206 uses each search engine registered in the search engine management unit 201 based on the search query input by the user in the common search query setting unit 205 and the verification result of the data source relationship verification unit 204. Generate corresponding search query. The individual search execution unit 207 requests each search engine registered in the search engine management unit 201 to execute a search using the individual search query, and acquires the search result. In FIG. 2, the common search query setting unit 205 and the individual search query generation unit 206 are shown as being one each, but may be configured to be separated for each search engine. The search result integration unit 208 integrates the search results acquired by the individual search execution unit 207. The input / output management unit 209 manages a user interface for inputting a search query and displaying a search result.

図3は、統合検索装置のハードウェア構成の一例を示す図である。
CPU301は、OS(Operating System)及び各種アプリケーションプログラムを実行し統合検索装置各部の制御を行う。ROM302は、CPU301が実行するプログラムや演算用のパラメータのうちの固定的なデータを格納する。RAM303は、CPU301の作業領域やデータの一時記憶領域を提供する。ROM302及びRAM303は、バス304を介してCPU301に接続される。キーボード等の入力装置305、CRT、液晶ディスプレイ等の表示装置306、ハードディスク装置、MO、CD−ROM等の外部記憶装置307は、インタフェース308を介してバス304に接続される。また、バス304は、通信部309を介してネットワークと接続される。
CPU301が、プログラムに基づく処理を実行することによって、上述したモジュール構成や後述するフローチャートに係る処理が実現される。
FIG. 3 is a diagram illustrating an example of a hardware configuration of the integrated search device.
The CPU 301 executes an OS (Operating System) and various application programs to control each unit of the integrated search device. The ROM 302 stores fixed data of programs executed by the CPU 301 and calculation parameters. A RAM 303 provides a work area for the CPU 301 and a temporary storage area for data. The ROM 302 and the RAM 303 are connected to the CPU 301 via the bus 304. An input device 305 such as a keyboard, a display device 306 such as a CRT and a liquid crystal display, and an external storage device 307 such as a hard disk device, MO, and CD-ROM are connected to the bus 304 via an interface 308. The bus 304 is connected to a network via the communication unit 309.
When the CPU 301 executes processing based on the program, the above-described module configuration and processing according to a flowchart described later are realized.

続いて、本実施形態における各モジュールの処理について説明する。
[第1のシステム構成]
ここでは簡単のため図4に示すシステム構成を用いる。図4は、統合検索を行うシステムのシステム構成の一例を示す図(その2)である。図4のシステム構成は、図1で示したシステム構成のうち、検索エンジン2つとデータソース1つとだけを持つ場合のシステム構成に該当する。検索エンジン1と検索エンジン2とは何れもデータソース1を検索対象とするものとする。また、Webプロトコルによりアクセス可能であり、それぞれ、アクセスURLとして
http://search.aaa.net/
http://search.bbb.net/
を持つものとする。更に、何れも全文検索を行う検索エンジンであるとする。一方、データソース1は、Webプロトコルによりアクセス可能であり、アクセスURLとして
http://xxx.yyy.com/
を持つものとする。
Subsequently, processing of each module in the present embodiment will be described.
[First system configuration]
Here, for simplicity, the system configuration shown in FIG. 4 is used. FIG. 4 is a diagram (part 2) illustrating an example of a system configuration of a system that performs an integrated search. The system configuration in FIG. 4 corresponds to the system configuration having only two search engines and one data source in the system configuration shown in FIG. Both the search engine 1 and the search engine 2 are intended to search the data source 1. In addition, it can be accessed by a Web protocol, and the access URL is http: // search. aaa. net /
http: // search. bbb. net /
Shall have. Furthermore, it is assumed that both are search engines that perform full-text search. On the other hand, the data source 1 can be accessed by a Web protocol, and the access URL is http: // xxx. yyy. com /
Shall have.

以上のシステム構成の下、初めに図5のフローチャートを参照して検索エンジンの登録処理について述べる。本実施形態では説明の簡略化のためユーザが手動で検索エンジンの登録を行うものとする。図5は、検索エンジンの登録処理の一例を示すフローチャートである。
まず、検索エンジン管理部201は、入出力管理部209を介して、ユーザが入力装置305等を用いて指示した、検索エンジンのアクセスURLと、検索エンジンの種別と、を指定して検索エンジンを登録する(S501)。検索エンジンの登録が指示されると、検索エンジン管理部201は、一意の検索エンジンIDを発行し、これを保管する(S502)。図6は、検索エンジン管理部が保管するデータの構造を示す図である。601は、検索エンジンIDである。602は、アクセスURLである。603は、検索エンジン種別である。
With the above system configuration, search engine registration processing will be described first with reference to the flowchart of FIG. In this embodiment, it is assumed that the user manually registers a search engine for the sake of simplification of description. FIG. 5 is a flowchart illustrating an example of search engine registration processing.
First, the search engine management unit 201 designates the search engine access URL and the type of the search engine that the user has instructed via the input / output management unit 209 using the input device 305 or the like. Register (S501). When the search engine registration is instructed, the search engine management unit 201 issues a unique search engine ID and stores it (S502). FIG. 6 is a diagram illustrating a structure of data stored in the search engine management unit. Reference numeral 601 denotes a search engine ID. Reference numeral 602 denotes an access URL. Reference numeral 603 denotes a search engine type.

検索エンジン管理部201は、検索エンジンの登録が完了すると、データソース管理部202に対してデータソース情報の取得を要求する(S503)。要求を受けたデータソース管理部202は、データソース特定情報の取得を行う。本実施形態では、データソース特定情報の取得先は各検索エンジンであるものとし、データソース管理部202は、HTTP(HyperText Transfer Protocol)を用いてアクセスする。
データソース管理部202は、検索エンジン管理部201から検索エンジンの登録データを取得し(S504)、アクセスURLにアクセスして検索エンジンからデータソース特定情報を取得する。続いて、データソース管理部202は、取得したデータソース特定情報とデータソース記述が同一のデータソース特定情報が既に保管されているか否かを確認する(S505)。データソース管理部202は、保管されていなければ一意のデータソースIDを発行してこれを保管する(S506)。データソース管理部202は、保管されている場合、そのデータソースIDを取得する(S507)。図7は、データソース管理部が保管するデータの構造を示す図である。701は、データソースIDである。702は、データソース記述である。本実施形態ではデータソース記述にもURLを用いることとする。
When the search engine registration is completed, the search engine management unit 201 requests the data source management unit 202 to acquire data source information (S503). Upon receiving the request, the data source management unit 202 acquires data source specifying information. In the present embodiment, it is assumed that the acquisition source of the data source specific information is each search engine, and the data source management unit 202 accesses using HTTP (HyperText Transfer Protocol).
The data source management unit 202 acquires search engine registration data from the search engine management unit 201 (S504), accesses the access URL, and acquires data source identification information from the search engine. Subsequently, the data source management unit 202 checks whether or not data source identification information having the same data source description as the acquired data source identification information is already stored (S505). If not stored, the data source management unit 202 issues a unique data source ID and stores it (S506). If it is stored, the data source management unit 202 acquires the data source ID (S507). FIG. 7 is a diagram illustrating the structure of data stored in the data source management unit. Reference numeral 701 denotes a data source ID. Reference numeral 702 denotes a data source description. In the present embodiment, a URL is also used for the data source description.

データソース管理部202は、データソース特定情報を保管すると、検索エンジン=データソース対応付け管理部203に、検索エンジンIDとデータソースIDとを指定して登録を要求する(S508)。ここで、データソースIDは、S506で発行したものか、S507で取得したものの何れかである。検索エンジン=データソース対応付け管理部203では、指定された検索エンジンIDとデータソースIDとを一組で保管する(S509)。図8は、検索エンジン=データソース対応付け管理部が保管するデータの構造を示す図である。
以上が検索エンジンの登録処理の説明である。
After storing the data source specifying information, the data source management unit 202 requests the registration to the search engine = data source association management unit 203 by specifying the search engine ID and the data source ID (S508). Here, the data source ID is either issued in S506 or acquired in S507. The search engine = data source association management unit 203 stores the specified search engine ID and data source ID as a set (S509). FIG. 8 is a diagram showing the structure of data stored in the search engine = data source association management unit.
This completes the description of the search engine registration process.

続いて、図9のフローチャートを参照して、検索処理の説明を行う。
図9は、検索処理の一例を示すフローチャートである。
まず、共通検索クエリ設定部205は、入出力管理部209を介して、ユーザが入力装置305等を用いて指示した、共通検索クエリを指定する(S901)。ここでは、
検索キーワード="カメラ"
を指定したものとする。次に、共通検索クエリ設定部205は、入力された検索クエリを解析して、検索を要求する必要のある検索エンジンの種別を判定する(S902)。ここでは共通検索クエリとしてキーワードのみが指定されているので、共通検索クエリ設定部205は、検索種別として全文検索と判定する。続いて、共通検索クエリ設定部205は、検索エンジン管理部201に対して検索エンジン種別が全文検索である検索エンジンの情報を要求する(S903)。
Next, the search process will be described with reference to the flowchart of FIG.
FIG. 9 is a flowchart illustrating an example of search processing.
First, the common search query setting unit 205 designates a common search query that the user instructs using the input device 305 or the like via the input / output management unit 209 (S901). here,
Search keyword = "Camera"
Is specified. Next, the common search query setting unit 205 analyzes the input search query and determines the type of search engine that needs to request a search (S902). Here, since only a keyword is specified as the common search query, the common search query setting unit 205 determines that the search type is a full-text search. Subsequently, the common search query setting unit 205 requests the search engine management unit 201 for information on a search engine whose search engine type is a full-text search (S903).

検索エンジン管理部201は、保管している検索エンジンの登録データから、検索種別が全文検索であるデータを取得し(S904)、これを共通検索クエリ設定部205に返す。ここでは検索エンジン1と検索エンジン2との2つの登録データが返ることになる。
例えば、S902〜S904における共通検索クエリ設定部205の処理は、検索エンジンを特定する処理である(検索エンジン特定)。
共通検索クエリ設定部205は取得した検索エンジンの登録データから検索エンジンIDを抽出し、検索エンジン=データソース対応付け管理部203に対して前記検索エンジンIDの検索エンジンが検索対象としているデータソースの情報を要求する(S905)。検索エンジン=データソース対応付け管理部203は、保管しているデータから、指定された検索エンジンIDに対応付けられているデータソースIDを取得し(S906)、これを共通検索クエリ設定部205に返す。ここでは検索エンジンIDとして001と002とが指定され、両者は何れもデータソースIDが001に対応付けられているので、データソースID001が選択され、共通検索クエリ設定部205は、データソースIDとして001のみを取得する。
例えば、S905及びS906における共通検索クエリ設定部205の処理は、データソースを選択する処理である(データソース選択)。
The search engine management unit 201 acquires data whose search type is a full-text search from stored search engine registration data (S904), and returns this to the common search query setting unit 205. Here, two registration data of the search engine 1 and the search engine 2 are returned.
For example, the process of the common search query setting unit 205 in S902 to S904 is a process of specifying a search engine (search engine specification).
The common search query setting unit 205 extracts the search engine ID from the acquired registration data of the search engine, and searches the search engine = data source association management unit 203 for the data source that is the search target of the search engine ID. Information is requested (S905). The search engine = data source association management unit 203 acquires the data source ID associated with the designated search engine ID from the stored data (S906), and sends this to the common search query setting unit 205. return. Here, 001 and 002 are designated as the search engine IDs, and since both are associated with the data source ID 001, the data source ID 001 is selected, and the common search query setting unit 205 sets the data source ID as the data source ID. Get only 001.
For example, the process of the common search query setting unit 205 in S905 and S906 is a process of selecting a data source (data source selection).

続いて、共通検索クエリ設定部205は、実際に検索を要求する検索エンジンの決定を行う。まず、共通検索クエリ設定部205は、検索エンジン種別に基づく検索エンジンの重複判定を行う(S907)。ここでは検索エンジン1と検索エンジン2との検索エンジン種別は共に全文検索と判定される。
次に、共通検索クエリ設定部205は、データソースの重複を判定するために、取得したデータソースIDを指定してデータソース関係検証部204に判定を要求する(S908)。ここではデータソースIDとして001のみが取得されているので、検索エンジン1と検索エンジン2とは共通のデータソースを検索対象としていることが判定される(S909)。以上の判定結果により、共通検索クエリ設定部205は、検索エンジン1と検索エンジン2とは、検索エンジン種別とデータソースとの両方が共通であり、何れか一方の検索エンジンでのみ検索を実行すれば必要な検索結果が得られることが分かる。そこで、共通検索クエリ設定部205は、検索エンジン1と検索エンジン2とのうち、検索エンジンIDが小さい検索エンジン1に検索を要求することを決定する(S910)。なお、ここでは、共通検索クエリ設定部205は、単純に検索エンジンIDの値に基づいて検索エンジンの決定を行うとしたが、過去のアクセス頻度や検索エンジンの負荷等に応じて選択するようにしてもよい。
Subsequently, the common search query setting unit 205 determines a search engine that actually requests the search. First, the common search query setting unit 205 performs search engine duplication determination based on the search engine type (S907). Here, the search engine types of the search engine 1 and the search engine 2 are both determined to be full-text search.
Next, the common search query setting unit 205 specifies the acquired data source ID and requests the data source relationship verification unit 204 to make a determination in order to determine duplication of data sources (S908). Here, since only 001 is acquired as the data source ID, it is determined that the search engine 1 and the search engine 2 use a common data source as a search target (S909). Based on the above determination results, the common search query setting unit 205 allows the search engine 1 and the search engine 2 to share both the search engine type and the data source, and the search is executed only by one of the search engines. It turns out that the necessary search results can be obtained. Therefore, the common search query setting unit 205 determines to request the search from the search engine 1 having the smaller search engine ID, among the search engines 1 and 2 (S910). Here, the common search query setting unit 205 simply determines the search engine based on the value of the search engine ID. However, the common search query setting unit 205 selects the search engine according to the past access frequency, the load of the search engine, and the like. May be.

次に、共通検索クエリ設定部205は、検索エンジン1に対応する個別検索クエリの生成を個別検索クエリ生成部206に要求する(S911)。個別検索クエリ生成部206は、共通検索クエリ設定部205から共通検索クエリと検索を要求する検索エンジンの検索エンジンID(001)とを取得し、検索エンジンに応じた検索エンジン個別の検索クエリを生成する。ここでは、共通検索クエリとしてキーワードのみが指定されているので、個別検索クエリは共通検索クエリと同じ
検索キーワード="カメラ"
となる。個別検索クエリ生成部206は、生成した個別検索クエリと検索エンジンIDと組にして共通検索クエリ設定部205に返す。
Next, the common search query setting unit 205 requests the individual search query generation unit 206 to generate an individual search query corresponding to the search engine 1 (S911). The individual search query generation unit 206 acquires the common search query and the search engine ID (001) of the search engine requesting the search from the common search query setting unit 205, and generates a search query for each search engine corresponding to the search engine. To do. Here, only the keyword is specified as the common search query, so the individual search query is the same as the common search query. Search keyword = "Camera"
It becomes. The individual search query generation unit 206 returns the pair of the generated individual search query and the search engine ID to the common search query setting unit 205.

共通検索クエリ設定部205は、取得した個別検索クエリと検索エンジンIDとの組を個別検索実行部207に引き渡して検索の実行を要求する(S912)。個別検索実行部207は、指定された検索エンジンIDに対応する検索エンジンのアクセスURLを検索エンジン管理部201から取得する(S913)。続いて、個別検索実行部207は、取得したアクセスURLにアクセスして、指定された個別検索クエリで検索の実行を要求し(S914)、検索エンジンから検索結果を取得する(S915)。検索要求及び結果の送受信にはHTTPを用いるものとする。ここではデータソース1は、Webプロトコルでアクセス可能としたので、検索結果としてコンテンツのURLのリストが取得されるものとする。   The common search query setting unit 205 passes the set of the acquired individual search query and the search engine ID to the individual search execution unit 207 and requests execution of the search (S912). The individual search execution unit 207 acquires an access URL of the search engine corresponding to the designated search engine ID from the search engine management unit 201 (S913). Subsequently, the individual search execution unit 207 accesses the acquired access URL, requests execution of the search with the specified individual search query (S914), and acquires a search result from the search engine (S915). It is assumed that HTTP is used for transmission / reception of search requests and results. Here, since the data source 1 is accessible by the Web protocol, it is assumed that a list of content URLs is acquired as a search result.

次に、個別検索実行部207は、取得した検索結果を共通検索クエリ設定部205に返し、続いて共通検索クエリ設定部205がこれを検索結果統合部208に引き渡して検索結果の統合を要求する(S916)。ここでは検索を実行した検索エンジンは1つのみであるので、検索結果統合部208は何もせずに取得した結果を入出力管理部209に引き渡す(S917)。最後に入出力管理部209が検索結果を表示装置306に表示する(統合結果表示)(S918)。
以上説明したように、統合検索装置101は、同一のデータソースに対し同一の検索を行う検索エンジンが複数存在した場合に、何れか1つの検索エンジンを自動で選択して検索を実行することができる。これにより、ネットワークトラヒックや検索エンジンのマシンリソースの消費を削減することができる。
Next, the individual search execution unit 207 returns the acquired search results to the common search query setting unit 205, and then the common search query setting unit 205 hands over the search results to the search result integration unit 208 to request integration of the search results. (S916). Here, since only one search engine has executed the search, the search result integration unit 208 delivers the result obtained without doing anything to the input / output management unit 209 (S917). Finally, the input / output management unit 209 displays the search result on the display device 306 (integrated result display) (S918).
As described above, when there are a plurality of search engines that perform the same search for the same data source, the integrated search apparatus 101 can automatically select any one search engine and execute the search. it can. As a result, it is possible to reduce consumption of machine resources of network traffic and search engines.

[第2のシステム構成]
引き続いて、図10のシステム構成に基づいて検索処理について説明する。図10は、統合検索を行うシステムのシステム構成の一例を示す図(その3)である。
図10において、検索エンジン1(1001)は、全文検索エンジン、検索エンジン2(1002)は、属性検索エンジンで、データソース1を検索対象としている。また検索エンジン3(1003)は、全文検索エンジンでデータソース2を検索対象としている。図11に、これらの検索エンジンを登録した状態の統合検索装置101内の保管データ構成を示す。図11は、統合検索装置101内の保管データの構成の一例を示す図である。11aが検索エンジン登録データである。11bがデータソース登録データである。11cが検索エンジン=データソース対応付けデータである。
[Second system configuration]
Subsequently, search processing will be described based on the system configuration of FIG. FIG. 10 is a diagram (part 3) illustrating an example of a system configuration of a system that performs an integrated search.
In FIG. 10, search engine 1 (1001) is a full-text search engine, search engine 2 (1002) is an attribute search engine, and data source 1 is a search target. The search engine 3 (1003) is a full-text search engine and the data source 2 is a search target. FIG. 11 shows a storage data configuration in the integrated search apparatus 101 in a state where these search engines are registered. FIG. 11 is a diagram illustrating an example of a configuration of storage data in the integrated search device 101. 11a is search engine registration data. 11b is data source registration data. 11c is search engine = data source association data.

次に検索処理について図9、図12のフローチャートを参照して説明する。基本的な処理の流れは第1のシステム構成で説明した処理に準じるので、ここでは差異がある部分についてのみ説明を行う。なお、図12は、検索結果統合処理の一例を示すフローチャートである。
まず、ユーザが共通検索クエリを入力するが、ここでは
検索キーワード="カメラ" AND 作成日時 ≧ 2008/01/01
が指定されたものとする。共通検索クエリ設定部205は、この共通検索クエリに対し、検索を要求する必要のある検索エンジンの種別を判定する。ここでは、検索キーワードに対する検索条件が指定されていることから、共通検索クエリ設定部205は、全文検索と判定する。そして、共通検索クエリ設定部205は、日付属性に対する検索条件が指定されていることから属性検索と判定する(S902)。
Next, the search process will be described with reference to the flowcharts of FIGS. Since the basic processing flow conforms to the processing described in the first system configuration, only the differences will be described here. FIG. 12 is a flowchart illustrating an example of the search result integration process.
First, the user inputs a common search query. Here, search keyword = “camera” AND creation date ≧ 2008/01/01
Is specified. The common search query setting unit 205 determines the type of search engine that needs to request a search for the common search query. Here, since the search condition for the search keyword is specified, the common search query setting unit 205 determines that the search is a full-text search. The common search query setting unit 205 determines that the search is attribute search because the search condition for the date attribute is specified (S902).

続いて検索エンジン管理部201が全文検索を検索エンジン種別に持つ検索エンジンの登録データ及び属性検索を検索エンジン種別に持つ検索エンジンの登録データとして検索エンジン1〜3を取得し(S904)、これを共通検索クエリ設定部205が受け取る。続けて、共通検索クエリ設定部205は、検索エンジン=データソース対応付け管理部203からそれぞれの検索エンジンが検索対象とするデータソースとしてデータソース1〜2を取得する(S905、S906)。
次に、共通検索クエリ設定部205は、実際に検索を要求する検索エンジンの判定(又は決定)を行う。共通検索クエリ設定部205は、検索エンジン1と検索エンジン2とは検索エンジン種別が異なり共通のデータソースを検索対象としているので両方へ検索を要求する。また共通検索クエリ設定部205は、検索エンジン3と検索エンジン1とは検索エンジン種別が同種であるがデータソースが異なっているため、これにも検索を要求する(S907〜S910)。
Subsequently, the search engine management unit 201 acquires search engines 1 to 3 as registration data of a search engine having a full-text search as a search engine type and search engine registration data having an attribute search as a search engine type (S904). The common search query setting unit 205 receives it. Subsequently, the common search query setting unit 205 acquires the data sources 1 and 2 as the data sources to be searched by each search engine from the search engine = data source association management unit 203 (S905 and S906).
Next, the common search query setting unit 205 determines (or determines) a search engine that actually requests a search. The common search query setting unit 205 requests a search to both the search engine 1 and the search engine 2 because the search engine types are different and a common data source is a search target. Further, the common search query setting unit 205 requests the search because the search engine 3 and the search engine 1 have the same search engine type but different data sources (S907 to S910).

次に個別検索クエリ生成部206は、共通検索クエリ設定部205からの要求に応じて、個別検索クエリを生成する。個別検索クエリ生成部206は、ここでは検索エンジン1と検索エンジン3とに対して全文検索のための検索条件
検索キーワード="カメラ"
を生成し、検索エンジン2に対して属性検索のための検索条件
作成日時 ≧ 2008/01/01
を生成する(S911)。共通検索クエリ設定部205は、これらの個別検索クエリを用いて個別検索実行部207に検索の実行を要求し(S912)、個別検索実行部207が検索エンジン1〜3に対して検索を実行させ、検索結果を取得する(S913〜S915)。なお、本構成においても検索結果はコンテンツのURLのリストで取得されるものとする。
続いて、検索結果統合部208が、検索結果の統合を行う。個別検索実行部207は、取得した検索結果を共通検索クエリ設定部205に返し、共通検索クエリ設定部205が検索結果と共通検索クエリとを検索結果統合部208に引き渡して検索結果の統合を要求する(S916)。
Next, the individual search query generation unit 206 generates an individual search query in response to a request from the common search query setting unit 205. Here, the individual search query generation unit 206 searches the search engine 1 and the search engine 3 for search conditions for full-text search. Search keyword = “camera”
And the search condition for the attribute search for the search engine 2 creation date and time ≧ 2008/01/01
Is generated (S911). The common search query setting unit 205 requests the individual search execution unit 207 to execute a search using these individual search queries (S912), and the individual search execution unit 207 causes the search engines 1 to 3 to execute the search. The search result is acquired (S913 to S915). In this configuration as well, the search result is acquired as a list of content URLs.
Subsequently, the search result integration unit 208 integrates the search results. The individual search execution unit 207 returns the acquired search results to the common search query setting unit 205, and the common search query setting unit 205 passes the search results and the common search query to the search result integration unit 208 to request integration of the search results. (S916).

すると、検索結果統合部208は、共通のデータソースを検索対象としている検索エンジンの検索結果の間で論理積を取ることの要否及び可否を判定する(S1201、S1202)。ここでは共通検索クエリにおいて全文検索条件と属性検索条件との論理積が指定されているので論理積を取ることが必要である。また、それぞれの条件に該当する検索エンジン1と検索エンジン2とは共通のデータソースを検索対象としているので論理積を取ることが可能である。したがって、検索結果統合部208は、検索エンジン1と検索エンジン2との検索結果の論理積を取って第1の統合結果を得る(S1203)。一方、検索エンジン3は他の検索エンジンとデータソースを共有していないので他の検索エンジンの結果と論理積を取るのは不可である。そこで、検索結果統合部208は、第1の統合結果との論理和を取って最終の統合結果を得る(S1204)。
つまり、検索結果統合部208は、検索クエリに基づいて、共通のデータソースを検索対象としている検索エンジンの検索結果の間で論理積を取ることが指定されているか否かを判定する。そして、検索結果統合部208は、前記判定の結果に基づいて、前記取得手段で取得された検索の結果の統合方法を決定(統合方法決定)し、検索の結果を統合し、最終の統合結果を得る。
Then, the search result integration unit 208 determines whether or not it is necessary to perform a logical product between search results of search engines that search for a common data source (S1201, S1202). Here, since the logical product of the full text search condition and the attribute search condition is specified in the common search query, it is necessary to take the logical product. In addition, since the search engine 1 and the search engine 2 corresponding to each condition have a common data source as a search target, it is possible to take a logical product. Therefore, the search result integration unit 208 obtains a first integration result by taking the logical product of the search results of the search engine 1 and the search engine 2 (S1203). On the other hand, since the search engine 3 does not share a data source with other search engines, it is impossible to perform a logical product with the results of other search engines. Therefore, the search result integration unit 208 obtains a final integration result by performing a logical sum with the first integration result (S1204).
That is, the search result integration unit 208 determines based on the search query whether or not it is designated to perform a logical product between search results of search engines that search for a common data source. Then, the search result integration unit 208 determines an integration method for the search results acquired by the acquisition unit (integration method determination) based on the determination result, integrates the search results, and obtains a final integration result. Get.

検索結果統合部208は、最終の統合結果を入出力管理部209に引渡し(S917)、最後に入出力管理部209が検索結果を表示装置306に表示する。
以上説明したように、統合検索装置101は、複数の検索エンジンが複数のデータソースを検索対象としている場合において、検索を実行する検索エンジンを自動で選択し、データソースの関係に応じて検索結果を統合することができる。これにより、ユーザが検索エンジンやデータソースに関する事前知識を持ち得なくとも、共通検索クエリを指定するだけで効率的に統合検索を行うことができる。
以上が、実施形態1の説明である。
The search result integration unit 208 delivers the final integration result to the input / output management unit 209 (S917). Finally, the input / output management unit 209 displays the search result on the display device 306.
As described above, the integrated search apparatus 101 automatically selects a search engine for executing a search when a plurality of search engines target a plurality of data sources, and performs a search result according to the relationship between the data sources. Can be integrated. Thereby, even if a user does not have prior knowledge about a search engine or a data source, an integrated search can be efficiently performed only by specifying a common search query.
The above is the description of the first embodiment.

<実施形態2>
実施形態1では、共通検索クエリの一部しか検索条件として適用できないデータソースも検索対象としていた。この場合、ユーザが指定した条件よりも緩い条件で検索が行われることになり、検索結果にノイズが含まれる場合がある。
本実施形態の統合検索装置101は、共通検索クエリの一部のみを使用して検索されるデータソースが存在する場合は、事前にユーザに問い合わせを行い、ユーザが検索の実行を指示した場合に限りそれらのデータソースを検索するものとする。
<Embodiment 2>
In the first embodiment, a data source to which only a part of the common search query can be applied as a search condition is also set as a search target. In this case, the search is performed under conditions that are looser than the conditions specified by the user, and the search results may include noise.
When there is a data source searched using only a part of the common search query, the integrated search apparatus 101 of the present embodiment makes an inquiry to the user in advance and the user instructs execution of the search. As long as you search those data sources.

<実施形態3>
実施形態2では、共通検索クエリの一部しか検索条件として適用できない場合は、事前にユーザに問い合わせを行うものとした。
本実施形態の統合検索装置101は、共通検索クエリで指定された検索条件を全て使って検索を行うことのできるデータソースのみを検索対象として、検索の実行を要求する検索エンジンを決定するものとする。
<Embodiment 3>
In the second embodiment, when only a part of the common search query can be applied as a search condition, the user is inquired in advance.
The integrated search apparatus 101 according to the present embodiment determines a search engine that requests execution of a search only for data sources that can be searched using all the search conditions specified in the common search query. To do.

<実施形態4>
本実施形態の統合検索装置101は、実施形態3の処理に加えて、共通検索クエリの一部のみを使用すれば検索可能なデータソースが存在する旨を検索結果と合わせて表示するものとする。
<Embodiment 4>
In addition to the processing of the third embodiment, the integrated search device 101 of the present embodiment displays, together with the search result, that a searchable data source exists if only a part of the common search query is used. .

<実施形態5>
上述した実施形態では、検索エンジン管理部201への検索エンジンの登録方法をユーザが手動で行うとしていたが、本実施形態では、検索エンジン管理部201がサービスディスカバリを用いて自動で検索エンジンの登録を行う。検索エンジン管理部201は、サービスディスカバリを行う方法としては、UDDIやSSDP等の既存のプロトコルや、その他の任意の手段を用いるものとする。ここで、UDDIとは、Universal Description, Discovery and Integrationの略である。また、SSDPとは、Simple Service Discovery Protocolの略である。また、検索ディスカバリの問い合わせ先は、検索エンジンであっても、検索エンジン以外の装置であってもよい。
<Embodiment 5>
In the above-described embodiment, the user manually performs a search engine registration method in the search engine management unit 201. However, in this embodiment, the search engine management unit 201 automatically registers a search engine using service discovery. I do. The search engine management unit 201 uses an existing protocol such as UDDI or SSDP, or any other means as a method for performing service discovery. Here, UDDI is an abbreviation for Universal Description, Discovery and Integration. SSDP is an abbreviation for Simple Service Discovery Protocol. Further, the search discovery inquiry destination may be a search engine or a device other than the search engine.

<実施形態6>
上述した実施形態では、データソース記述にデータソースのURLを用いて説明を行った。しかしながら、本実施形態の統合検索装置101は、UNC(Universal Naming Convention)やデータベース名、或いはコンテンツ識別子のリスト等、データソースの種別に応じた記述方式を用いてもよい。
<Embodiment 6>
In the above-described embodiment, the data source description has been described using the data source URL. However, the federated search apparatus 101 of the present embodiment may use a description method according to the type of data source, such as a UNC (Universal Naming Convention), a database name, or a list of content identifiers.

<実施形態7>
上述した実施形態では、データソースの重複判定にデータソースIDを用いた。しかしながら、本実施形態の統合検索装置101は、URLやUNC等の文字列を比較する方法や、コンテンツ識別子の集合の要素を比較する方法等を用いてもよい。
<Embodiment 7>
In the above-described embodiment, the data source ID is used for the data source duplication determination. However, the federated search apparatus 101 of this embodiment may use a method of comparing character strings such as URL and UNC, a method of comparing elements of a set of content identifiers, and the like.

<実施形態8>
上述した実施形態では、データソース記述に単一のURLを用い、URLが一致するか否かによって、データソース間の関係を等価か独立の何れかに判定していた。本実施形態の統合検索装置101は、これに加えて、重複と包含との関係も判定する。例えば、データソース1のデータソース記述が
http://xxx.yyy.net/
であり、データソース2のデータソース記述が
http://xxx.yyy.net/AAA/
であった場合、統合検索装置101は、これらのURLの関係によりデータソース1はデータソース2を包含すると判定する。
<Eighth embodiment>
In the embodiment described above, a single URL is used for the data source description, and the relationship between the data sources is determined as equivalent or independent depending on whether the URLs match. In addition to this, the integrated search apparatus 101 of this embodiment also determines the relationship between duplication and inclusion. For example, if the data source description of data source 1 is http: // xxx. yyy. net /
And the data source description of the data source 2 is http: // xxx. yyy. net / AAA /
In the case, the integrated search apparatus 101 determines that the data source 1 includes the data source 2 based on the relationship between these URLs.

また、例えばデータソース1のデータソース記述が
http://xxx.yyy.net/
http://ABC.DEF.com/
であり、データソース2のデータソース記述が
http://xxx.yyy.net/
http://LMN.OPQ.com/
であった場合、http://xxx.yyy.net/が両者に共通に存在するので、統合検索装置101は、データソース1とデータソース2とは重複関係と判定する。
For example, if the data source description of the data source 1 is http: // xxx. yyy. net /
http: // ABC. DEF. com /
And the data source description of the data source 2 is http: // xxx. yyy. net /
http: // LMN. OPQ. com /
In this case, http: // xxx. yyy. Since net / exists in both, the integrated search apparatus 101 determines that the data source 1 and the data source 2 have an overlapping relationship.

<実施形態9>
上述した実施形態では、データソース特定情報を検索エンジンから取得するとしていた。しかしながら、検索エンジンの外部にデータソース特定情報を管理するサーバを設け、本実施形態の統合検索装置101は、前記サーバからデータソース特定情報を取得するものとしてもよい。
<Ninth Embodiment>
In the above-described embodiment, the data source specifying information is acquired from the search engine. However, a server for managing data source identification information may be provided outside the search engine, and the integrated search apparatus 101 of this embodiment may acquire the data source identification information from the server.

<実施形態10>
上述した実施形態では、データソース特定情報の取得、検索の実行要求の送信、及び検索結果の取得にHTTPを用いるとしていた。しかしながら、本実施形態の統合検索装置101は、他の任意のプロトコルを用いてもよい。
<Embodiment 10>
In the above-described embodiment, HTTP is used for acquiring data source specifying information, transmitting a search execution request, and acquiring search results. However, the integrated search apparatus 101 of this embodiment may use any other protocol.

<その他の実施形態>
また、上述した実施形態の目的は、以下のようにすることによって達成される。即ち、上述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体(又は記録媒体)を、システム或いは装置に供給する。そして、そのシステム或いは装置の中央演算処理手段(CPUやMPU)が記憶媒体に格納されたプログラムコードを読み出し実行する。この場合、記憶媒体から読み出されたプログラムコード自体が上述した実施形態の機能を実現することになり、そのプログラムコードを記録した記憶媒体は上述した実施形態を構成することになる。
<Other embodiments>
The object of the above-described embodiment is achieved by the following. That is, a storage medium (or recording medium) in which a program code of software that realizes the functions of the above-described embodiments is recorded is supplied to the system or apparatus. Then, the central processing means (CPU or MPU) of the system or apparatus reads and executes the program code stored in the storage medium. In this case, the program code itself read from the storage medium realizes the functions of the above-described embodiment, and the storage medium recording the program code constitutes the above-described embodiment.

また、システム或いは装置の前記中央演算処理手段が読み出したプログラムコードを実行することにより、そのプログラムコードの指示に基づき、システム或いは装置上で稼働しているオペレーティングシステム(OS)等が実際の処理の一部又は全部を行う。その処理によって上述した実施形態の機能が実現される場合も含まれる。   In addition, by executing the program code read by the central processing means of the system or apparatus, an operating system (OS) or the like operating on the system or apparatus performs actual processing based on the instruction of the program code. Do some or all. The case where the function of the above-described embodiment is realized by the processing is also included.

更に、記憶媒体から読み出されたプログラムコードが、前記システム或いは装置に挿入された機能拡張カードや、接続された機能拡張ユニットに備わるメモリに書込まれたとする。その後、そのプログラムコードの指示に基づき、その機能拡張カードや機能拡張ユニットに備わるCPU等が実際の処理の一部又は全部を行い、その処理によって上述した実施形態の機能が実現される場合も含まれる。   Furthermore, it is assumed that the program code read from the storage medium is written to a memory provided in a function expansion card inserted into the system or apparatus or a function expansion unit connected thereto. After that, based on the instruction of the program code, the CPU of the function expansion card or function expansion unit performs part or all of the actual processing, and the function of the above-described embodiment is realized by the processing. It is.

上述した実施形態を前記記憶媒体に適用する場合、その記憶媒体には、先に説明したフローチャートに対応するプログラムコードが格納されることになる。   When the above-described embodiment is applied to the storage medium, the storage medium stores program codes corresponding to the flowcharts described above.

上述した各実施形態によれば、検索エンジンやデータソースに関する事前知識をユーザが持ち得ない場合においても、複数の検索エンジンを適切に組み合わせて統合検索を実行することができる。したがって、ユーザが所望のデータを発見することを容易ならしめることができる。特に、インターネットやイントラネット等の複数のデータソースに分散したコンテンツを、複数の検索エンジンを用いて検索する場合において効果が見込まれる。
更には、共通のデータソースを検索対象とする同種の検索エンジンが複数存在する場合においては、ユーザの事前知識が無くても検索を実行する検索エンジンを限定することができ、ネットワークやマシンリソースに対する負荷を軽減する効果が見込まれる。
According to each embodiment mentioned above, even when a user cannot have prior knowledge about a search engine or a data source, a combined search can be performed by appropriately combining a plurality of search engines. Therefore, the user can easily find desired data. In particular, it is expected to be effective when searching for content distributed in a plurality of data sources such as the Internet and an intranet using a plurality of search engines.
Furthermore, when there are multiple search engines of the same type that search for a common data source, it is possible to limit the search engines that perform searches without prior knowledge of the user. The effect of reducing the load is expected.

以上、本発明の好ましい実施形態について詳述したが、本発明は係る特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。
例えば、上述した各実施形態を組み合わせて実施可能なものは、任意に組み合わせて実施してもよい。
The preferred embodiments of the present invention have been described in detail above, but the present invention is not limited to such specific embodiments, and various modifications can be made within the scope of the gist of the present invention described in the claims.・ Change is possible.
For example, what can be implemented combining each embodiment mentioned above may be implemented combining arbitrarily.

101 統合検索装置、301 CPU 101 Integrated search device, 301 CPU

Claims (8)

入力された検索クエリに基づいて前記検索クエリに係る1又は複数の検索種別を特定し、前記検索種別に基づいて1又は複数の検索エンジンを特定する検索エンジン特定手段と、
検索エンジンと、前記検索エンジンが検索対象とする複数のコンテンツを含むデータソースと、を対応付ける対応付け情報と、前記検索エンジン特定手段で特定された1又は複数の検索エンジンと、に基づいて1又は複数のデータソースを選択するデータソース選択手段と、
前記検索エンジン特定手段で複数の検索エンジンが特定された検索エンジンに係る検索種別が重複しているか否か、及び前記データソース選択手段で特定されたデータソースが重複しているか否かに基づいて、前記特定手段で特定された複数の検索エンジンの中から、検索を要求する検索エンジンを決定する決定手段と、
を有する情報処理装置。
Search engine specifying means for specifying one or more search types related to the search query based on the input search query, and specifying one or more search engines based on the search type;
1 or based on association information associating a search engine with a data source including a plurality of contents to be searched by the search engine and one or more search engines specified by the search engine specifying means A data source selection means for selecting a plurality of data sources;
Based on whether or not the search types related to the search engines for which a plurality of search engines are specified by the search engine specifying means are duplicated and whether or not the data sources specified by the data source selection means are duplicated Deciding means for deciding a search engine that requests a search from among a plurality of search engines specified by the specifying means;
An information processing apparatus.
入力された検索クエリに基づいて、前記決定手段で決定された検索エンジンに応じた検索エンジン個別の検索クエリを生成する生成手段と、
前記生成手段で生成された検索エンジン個別の検索クエリを、対応する各検索エンジンに渡し、検索の実行を要求する要求手段と、
前記要求手段で検索の実行を要求された各検索エンジンにおける検索の結果を取得する取得手段と、
前記取得手段で取得された検索の結果を統合する検索結果統合手段と、
前記検索結果統合手段で統合された検索の結果を表示する統合結果表示手段と、
を更に有する請求項1記載の情報処理装置。
Generating means for generating a search query for each search engine according to the search engine determined by the determining means based on the input search query;
A request unit that passes a search query for each search engine generated by the generation unit to each corresponding search engine and requests execution of the search;
Obtaining means for obtaining a search result in each search engine requested to execute the search by the request means;
Search result integration means for integrating the search results acquired by the acquisition means;
Integrated result display means for displaying the search results integrated by the search result integration means;
The information processing apparatus according to claim 1, further comprising:
入力された検索クエリに基づいて、共通のデータソースを検索対象としている検索エンジンの検索結果の間で論理積を取ることが指定されているか否かを判定し、前記判定の結果に基づいて、前記取得手段で取得された検索の結果の統合方法を決定する統合方法決定手段を更に有する請求項2記載の情報処理装置。   Based on the input search query, it is determined whether or not the logical product is specified between the search results of search engines that search for a common data source, and based on the result of the determination, The information processing apparatus according to claim 2, further comprising an integration method determination unit that determines an integration method of search results acquired by the acquisition unit. 情報処理装置が、入力された検索クエリに基づいて前記検索クエリに係る1又は複数の検索種別を特定し、前記検索種別に基づいて1又は複数の検索エンジンを特定する検索エンジン特定ステップと、
前記情報処理装置が、検索エンジンと、前記検索エンジンが検索対象とする複数のコンテンツを含むデータソースと、を対応付ける対応付け情報と、前記検索エンジン特定ステップで特定された1又は複数の検索エンジンと、に基づいて1又は複数のデータソースを選択するデータソース選択ステップと、
前記情報処理装置が、前記検索エンジン特定ステップで複数の検索エンジンが特定された前記検索エンジンに係る検索種別が重複しているか否か、及び前記データソース選択ステップで特定されたデータソースが重複しているか否かに基づいて、前記特定ステップで特定された複数の検索エンジンの中から、検索を要求する検索エンジンを決定する決定ステップと、
を有する情報処理方法。
A search engine specifying step in which the information processing device specifies one or more search types related to the search query based on the input search query, and specifies one or more search engines based on the search type;
The information processing apparatus, associating information associating a search engine with a data source including a plurality of contents to be searched by the search engine, and one or a plurality of search engines specified in the search engine specifying step; A data source selection step of selecting one or more data sources based on
In the information processing apparatus, whether or not the search types related to the search engines for which a plurality of search engines have been specified in the search engine specifying step overlaps, and the data sources specified in the data source selection step overlap. A determination step of determining a search engine that requests a search from among the plurality of search engines specified in the specifying step based on whether or not
An information processing method comprising:
前記情報処理装置が、入力された検索クエリに基づいて、前記決定ステップで決定された検索エンジンに応じた検索エンジン個別の検索クエリを生成する生成ステップと、
前記情報処理装置が、前記生成ステップで生成された検索エンジン個別の検索クエリを、対応する各検索エンジンに渡し、検索の実行を要求する要求ステップと、
前記情報処理装置が、前記要求ステップで検索の実行を要求された各検索エンジンにおける検索の結果を取得する取得ステップと、
前記情報処理装置が、前記取得ステップで取得された検索の結果を統合する検索結果統合ステップと、
前記情報処理装置が、前記検索結果統合ステップで統合された検索の結果を表示する統合結果表示ステップと、
を更に有する請求項4記載の情報処理方法。
The information processing apparatus generates a search query for each search engine according to the search engine determined in the determination step based on the input search query;
The information processing apparatus, a request step for requesting execution of a search by passing a search query for each search engine generated in the generation step to each corresponding search engine;
The information processing apparatus obtains a search result in each search engine requested to execute a search in the request step;
A search result integration step in which the information processing apparatus integrates the search results acquired in the acquisition step;
An integrated result display step in which the information processing apparatus displays a search result integrated in the search result integration step;
The information processing method according to claim 4, further comprising:
前記情報処理装置が、入力された検索クエリに基づいて、共通のデータソースを検索対象としている検索エンジンの検索結果の間で論理積を取ることが指定されているか否かを判定し、前記判定の結果に基づいて、前記取得ステップで取得された検索の結果の統合方法を決定する統合方法決定ステップを更に有する請求項5記載の情報処理方法。   The information processing apparatus determines, based on the input search query, whether or not a logical product is specified between search results of search engines that search for a common data source, and the determination The information processing method according to claim 5, further comprising an integration method determination step for determining an integration method for the search results acquired in the acquisition step based on the result of the acquisition. コンピュータを、
入力された検索クエリに基づいて前記検索クエリに係る1又は複数の検索種別を特定し、前記検索種別に基づいて1又は複数の検索エンジンを特定する検索エンジン特定手段と、
検索エンジンと、複数のコンテンツを含むデータソースと、を対応付ける対応付け情報と、前記検索エンジン特定手段で特定された1又は複数の検索エンジンと、に基づいて1又は複数のデータソースを選択するデータソース選択手段と、
前記検索エンジン特定手段で複数の検索エンジンが特定された前記検索エンジンに係る検索種別が重複しているか否か、及び前記データソース選択手段で特定されたデータソースが重複しているか否かに基づいて、前記特定手段で特定された複数の検索エンジンの中から、検索を要求する検索エンジンを決定する決定手段と、
して機能させるプログラム。
Computer
Search engine specifying means for specifying one or more search types related to the search query based on the input search query, and specifying one or more search engines based on the search type;
Data for selecting one or a plurality of data sources based on association information that associates a search engine with a data source including a plurality of contents, and one or a plurality of search engines specified by the search engine specifying means Source selection means;
Based on whether or not the search types related to the search engines for which a plurality of search engines have been specified by the search engine specifying means are duplicated, and whether or not the data sources specified by the data source selection means are duplicated Determining means for determining a search engine that requests a search from among a plurality of search engines specified by the specifying means;
Program to make it work.
請求項7記載のプログラムを記憶したコンピュータが読み取り可能な記憶媒体。   A computer-readable storage medium storing the program according to claim 7.
JP2009117859A 2009-05-14 2009-05-14 Apparatus and method for processing information, program, and storage medium Pending JP2010267075A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009117859A JP2010267075A (en) 2009-05-14 2009-05-14 Apparatus and method for processing information, program, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009117859A JP2010267075A (en) 2009-05-14 2009-05-14 Apparatus and method for processing information, program, and storage medium

Publications (1)

Publication Number Publication Date
JP2010267075A true JP2010267075A (en) 2010-11-25

Family

ID=43363994

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009117859A Pending JP2010267075A (en) 2009-05-14 2009-05-14 Apparatus and method for processing information, program, and storage medium

Country Status (1)

Country Link
JP (1) JP2010267075A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012252654A (en) * 2011-06-06 2012-12-20 Toshiba Corp Face image retrieval system and face image retrieval method
JP2016212908A (en) * 2013-04-08 2016-12-15 フェイスブック,インク. Vertical-based query optionalizing
JP6375083B1 (en) * 2017-03-30 2018-08-15 株式会社オプティム Search system, method and program
US11843737B2 (en) * 2021-08-30 2023-12-12 Canon Kabushiki Kaisha Information processing apparatus, control method therefor, and storage medium

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012252654A (en) * 2011-06-06 2012-12-20 Toshiba Corp Face image retrieval system and face image retrieval method
JP2016212908A (en) * 2013-04-08 2016-12-15 フェイスブック,インク. Vertical-based query optionalizing
CN107729525A (en) * 2013-04-08 2018-02-23 脸谱公司 Based on vertical inquiry selectionization
US10649992B2 (en) 2013-04-08 2020-05-12 Facebook, Inc. Vertical-based query optionalizing
JP6375083B1 (en) * 2017-03-30 2018-08-15 株式会社オプティム Search system, method and program
WO2018179228A1 (en) * 2017-03-30 2018-10-04 株式会社オプティム Search system, method and program
US10642920B2 (en) 2017-03-30 2020-05-05 Optim Corporation System, method, and program for search
US11843737B2 (en) * 2021-08-30 2023-12-12 Canon Kabushiki Kaisha Information processing apparatus, control method therefor, and storage medium

Similar Documents

Publication Publication Date Title
US7370036B2 (en) Facilitating identification of entire web pages when each web page is rendered from multiple portions and interest is expressed based on content of the portions
US8930807B2 (en) Web content management based on timeliness metadata
JP2010026653A (en) Data access control method, data access control apparatus, and program
JP2017528782A (en) System and method for connecting data by routing data through interaction between user and content data
US20050144285A1 (en) Finding of tv anytime web services
US20130013408A1 (en) Method and Arrangement for Network Searching
Schade et al. Augmenting SDI with linked data
WO2014108038A1 (en) Frequently-used website generation client terminal, server, system and method
JP5964847B2 (en) Connecting dynamic image results
JP5869010B2 (en) System and method for providing mobile URL in mobile search environment
JP2010267075A (en) Apparatus and method for processing information, program, and storage medium
JP2022105567A (en) Web page translation system, web page translation device, web page provision device, and web page translation method
CN109428872B (en) Data transmission method, equipment, server, starting method and system
JP5283600B2 (en) Information search program, information search system
WO2016201547A1 (en) A computer-implemented method of aggregating and presenting digital photos from numerous sources
JP2009187401A (en) Document management system, document management apparatus, and document managing method and program
JP2009251754A (en) Page customizing server, page customizing program, and page customizing method
CN115269527A (en) Sharing data sharing metrics to clients
US11403315B2 (en) Reporting and knowledge discovery for databases
Stadtmüller Dynamic Interaction and Manipulation of Web Resources
JP2004348676A (en) Information resource server and information resource provision method
EP4345639A1 (en) Background service to generate data dictionary metadata
JP2005210513A (en) View access control method classified by domain name, dns server system device, view access control program classified by domain name, and storage medium storing view access control program classified by domain name
EP4345643A1 (en) Distributing large amounts of global metadata using object files
JP2012146076A (en) Cache server, cache management method, and cache management program