JP2010267075A - Apparatus and method for processing information, program, and storage medium - Google Patents
Apparatus and method for processing information, program, and storage medium Download PDFInfo
- Publication number
- JP2010267075A JP2010267075A JP2009117859A JP2009117859A JP2010267075A JP 2010267075 A JP2010267075 A JP 2010267075A JP 2009117859 A JP2009117859 A JP 2009117859A JP 2009117859 A JP2009117859 A JP 2009117859A JP 2010267075 A JP2010267075 A JP 2010267075A
- Authority
- JP
- Japan
- Prior art keywords
- search
- search engine
- data source
- engine
- engines
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
Description
本発明は、情報処理装置、情報処理方法、プログラム及び記憶媒体に関する。 The present invention relates to an information processing apparatus, an information processing method, a program, and a storage medium.
複数の検索エンジンを統合して検索を行う統合検索技術が用いられている。例えばインターネット上の複数の検索サイトを同時に検索して結果を統合するメタ検索サービスや、企業内データベースを横断検索するシステムなどが既に実用化されている。統合検索においては、複数の検索エンジンをどのように用いて検索を実行するかに検索結果が依存するため、適切な結果を得るには適切な検索の実行方法を選択する必要がある。これに対する従来技術として、例えば特許文献1では複数の検索エンジン相互に関する検索条件をユーザが指定する方法が提案されている。この方法は、検索に使用する検索エンジンと、それらの間の論理演算の方法とをユーザが指定することにより所望の検索結果を得るものである。 An integrated search technology that performs search by integrating a plurality of search engines is used. For example, a meta search service for simultaneously searching a plurality of search sites on the Internet and integrating the results, a system for cross-searching an in-company database, and the like have already been put into practical use. In the integrated search, the search result depends on how the search is executed using a plurality of search engines. Therefore, in order to obtain an appropriate result, it is necessary to select an appropriate search execution method. As a conventional technique for this, for example, Patent Document 1 proposes a method in which a user specifies search conditions relating to a plurality of search engines. In this method, the user designates a search engine used for the search and a logical operation method between them, thereby obtaining a desired search result.
インターネットのメタ検索においては、ユーザが求めるコンテンツが所在するデータソースはWebサイトの全体集合であり、検索エンジンが検索対象とするデータソースはWebサイトの部分集合である。ここで、各検索エンジンが検索対象とするWebサイトの部分集合が十分に広範であれば、実行上はWebサイトの全体集合という単一のデータソースを検索対象としていると見なすことができる。このように、検索エンジンが検索対象とするデータソースと、ユーザの求めるコンテンツが所在するデータソースとが、共にユーザにとって既知又は既知と見なせる場合は、ユーザが検索エンジンの組み合わせ方を指定する方法に検索結果の改善効果が期待できた。 In the meta search on the Internet, the data source where the content desired by the user is located is a whole set of websites, and the data source to be searched by the search engine is a subset of websites. Here, if a subset of Web sites to be searched by each search engine is sufficiently wide, it can be considered that a single data source called the entire set of Web sites is a search target in terms of execution. As described above, when the data source to be searched by the search engine and the data source where the content desired by the user is located can be both known or known to the user, the user can specify how to combine the search engines. Expected to improve search results.
しかしながら、検索エンジンが検索対象とするデータソースや、求めるコンテンツが所在するデータソースが未知の場合、ユーザが最適な検索エンジンの組み合わせを指定することは困難となる。例えば、インターネットやイントラネット等を含む様々なネットワーク上に分散したコンテンツを検索する統合検索を考える。このような場合、一般にユーザは所望のコンテンツがネットワーク上のどこに所在しているかを知り得ないので、統合検索には幅広く検索を行うことが求められる。それと同時に、分散した大量のコンテンツから所望のコンテンツを効率よく取得することが求められる。 However, when the data source to be searched by the search engine or the data source where the desired content is located is unknown, it is difficult for the user to specify an optimal combination of search engines. For example, consider an integrated search that searches for content distributed on various networks including the Internet and an intranet. In such a case, since the user generally cannot know where the desired content is located on the network, the integrated search is required to perform a wide search. At the same time, it is required to efficiently acquire desired content from a large amount of distributed content.
しかしながら、コンテンツの所在に関する事前知識のないユーザにとって、検索対象とするデータソースを特定することは有効な手段とは成り得ない。更に、各検索エンジンが検索対象とするデータソースについての知識をコンテンツの所在と結びつけることができない。したがって、所望のコンテンツが得られるよう検索に利用するデータソースや検索エンジンを適切に選択することも、検索エンジン間の論理演算の方法を適切に指定することもユーザに期待することはできない。ユーザの事前知識を前提とした従来技術はこの点において課題があった。 However, for users who do not have prior knowledge about the location of content, specifying a data source to be searched cannot be an effective means. Furthermore, it is not possible to link knowledge about the data source to be searched by each search engine with the location of the content. Therefore, it is impossible to expect the user to appropriately select a data source or a search engine used for the search so as to obtain a desired content, or to appropriately specify a logical operation method between the search engines. The prior art based on the prior knowledge of the user has a problem in this respect.
更に、共通のデータソースを検索対象とする複数の検索エンジンそれぞれに対して同じ検索を実行させることは無駄である。このような場合は得られる結果もまた同一であって、複数のエンジン統合することによる効果は得られない。したがって、検索に利用する検索エンジンを限定して通信帯域やマシンリソースの浪費を回避することが望まれるが、ユーザの指定した検索エンジンに検索を実行させる従来技術では、こうした要求に対応することは困難であった。 Furthermore, it is useless to execute the same search for each of a plurality of search engines that search for a common data source. In such a case, the results obtained are also the same, and the effect of integrating a plurality of engines cannot be obtained. Therefore, it is desirable to limit the search engines used for the search to avoid wasting communication bandwidth and machine resources. However, the conventional technology that allows the search engine specified by the user to execute the search does not meet such demands. It was difficult.
本発明はこのような問題点に鑑みなされたもので、適切な検索エンジンを自動的に選択することを目的とする。 The present invention has been made in view of such problems, and an object thereof is to automatically select an appropriate search engine.
そこで、本発明は、入力された検索クエリに基づいて前記検索クエリに係る1又は複数の検索種別を特定し、前記検索種別に基づいて1又は複数の検索エンジンを特定する検索エンジン特定手段と、検索エンジンと、前記検索エンジンが検索対象とする複数のコンテンツを含むデータソースと、を対応付ける対応付け情報と、前記検索エンジン特定手段で特定された1又は複数の検索エンジンと、に基づいて1又は複数のデータソースを選択するデータソース選択手段と、前記検索エンジン特定手段で複数の検索エンジンが特定された検索エンジンに係る検索種別が重複しているか否か、及び前記データソース選択手段で特定されたデータソースが重複しているか否かに基づいて、前記特定手段で特定された複数の検索エンジンの中から、検索を要求する検索エンジンを決定する決定手段と、を有する。
かかる構成とすることにより、適切な検索エンジンを自動的に選択することができる。
また、本発明は、情報処理方法、プログラム及び記憶媒体としてもよい。
Therefore, the present invention specifies one or more search types related to the search query based on the input search query, and specifies one or more search engines based on the search type; 1 or based on association information associating a search engine with a data source including a plurality of contents to be searched by the search engine and one or more search engines specified by the search engine specifying means The data source selection means for selecting a plurality of data sources, whether or not the search types related to the search engines for which the plurality of search engines are specified by the search engine specifying means are duplicated, and specified by the data source selection means. From the plurality of search engines specified by the specifying means based on whether or not the data sources overlapped. Having a determination means for determining a search engine requesting.
With this configuration, an appropriate search engine can be automatically selected.
The present invention may be an information processing method, a program, and a storage medium.
本発明によれば、適切な検索エンジンを自動的に選択することができる。 According to the present invention, an appropriate search engine can be automatically selected.
以下、本発明の実施形態について図面に基づいて説明する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings.
<実施形態1>
図1は、統合検索を行うシステムのシステム構成の一例を示す図(その1)である。情報処理装置(コンピュータ)の一例である統合検索装置101は、ユーザからの検索要求を受けて複数の検索エンジンに対して検索の実行を指示し、それぞれの検索エンジンから取得した検索結果を統合する。検索エンジン102〜104は、データソース105〜107に含まれるコンテンツの検索を行う。検索エンジンには属性検索や全文検索等が存在し得るが、本実施形態はその種別は問わない。同様に、データソースにはデータベースやファイルサーバ等が存在し得るがその種別は問わない。各検索エンジンが検索対象とするデータソースは1つには限られず、更には複数の検索エンジンが同一のデータソースを検索対象としていてもよい。また、各検索エンジンの内部においてMapReduceに代表される並列分散化が行われていても構わない。
<Embodiment 1>
FIG. 1 is a diagram (part 1) illustrating an example of a system configuration of a system that performs an integrated search. An integrated
統合検索装置と各検索エンジンとは通信手段108によって接続され、各検索エンジンとデータソースとは通信手段109によって接続されている。ここで通信手段108、109には、統合検索装置と検索エンジンとの接続方法ならびに検索エンジンとデータソースとの接続方法に応じて、様々なものが適用可能である。例えば、インターネットやLANのような通信網、コンピュータシステム内のバス、更にはコンピュータプログラムのAPI等である。 The integrated search device and each search engine are connected by communication means 108, and each search engine and data source are connected by communication means 109. Here, various means can be applied to the communication means 108 and 109 according to the connection method between the integrated search device and the search engine and the connection method between the search engine and the data source. For example, a communication network such as the Internet or a LAN, a bus in a computer system, and an API of a computer program.
図2は、統合検索装置のモジュール構成の一例を示す図である。
検索エンジン管理部201は、統合検索装置が利用可能な検索エンジンを登録して保管する。検索エンジンを登録する方法については本実施形態が規定する所ではない。データソース管理部202は、検索エンジン管理部201に登録されている各検索エンジンが検索対象とするデータソースを識別するデータソース特定情報を取得して保管する。検索エンジン=データソース対応付け管理部203は、検索エンジン管理部201とデータソース管理部202に保管されている情報を対応付けて統括管理する。データソース関係検証部204は、データソース管理部202で管理されているデータソース特定情報に基づいて検索エンジン管理部201に登録されている検索エンジンが、共通のコンテンツを検索対象としているか否かを検証する。
FIG. 2 is a diagram illustrating an example of a module configuration of the integrated search device.
The search
共通検索クエリ設定部205は、ユーザからの検索クエリ入力を受け付ける。個別検索クエリ生成部206は、共通検索クエリ設定部205においてユーザが入力した検索クエリと、データソース関係検証部204の検証結果と、から、検索エンジン管理部201に登録されている各検索エンジンに応じた検索クエリを生成する。個別検索実行部207は、個別検索クエリを用いて検索エンジン管理部201に登録されている各検索エンジンに検索の実行を要求し、検索結果を取得する。なお、図2において共通検索クエリ設定部205と個別検索クエリ生成部206とはそれぞれ1つであるように示されているが、検索エンジン毎に分かれている構成をとるようにしてもよい。検索結果統合部208は、個別検索実行部207で取得した検索結果を統合する。入出力管理部209は、検索クエリの入力や検索結果の表示のためのユーザインタフェースを管理する。
The common search
図3は、統合検索装置のハードウェア構成の一例を示す図である。
CPU301は、OS(Operating System)及び各種アプリケーションプログラムを実行し統合検索装置各部の制御を行う。ROM302は、CPU301が実行するプログラムや演算用のパラメータのうちの固定的なデータを格納する。RAM303は、CPU301の作業領域やデータの一時記憶領域を提供する。ROM302及びRAM303は、バス304を介してCPU301に接続される。キーボード等の入力装置305、CRT、液晶ディスプレイ等の表示装置306、ハードディスク装置、MO、CD−ROM等の外部記憶装置307は、インタフェース308を介してバス304に接続される。また、バス304は、通信部309を介してネットワークと接続される。
CPU301が、プログラムに基づく処理を実行することによって、上述したモジュール構成や後述するフローチャートに係る処理が実現される。
FIG. 3 is a diagram illustrating an example of a hardware configuration of the integrated search device.
The
When the
続いて、本実施形態における各モジュールの処理について説明する。
[第1のシステム構成]
ここでは簡単のため図4に示すシステム構成を用いる。図4は、統合検索を行うシステムのシステム構成の一例を示す図(その2)である。図4のシステム構成は、図1で示したシステム構成のうち、検索エンジン2つとデータソース1つとだけを持つ場合のシステム構成に該当する。検索エンジン1と検索エンジン2とは何れもデータソース1を検索対象とするものとする。また、Webプロトコルによりアクセス可能であり、それぞれ、アクセスURLとして
http://search.aaa.net/
http://search.bbb.net/
を持つものとする。更に、何れも全文検索を行う検索エンジンであるとする。一方、データソース1は、Webプロトコルによりアクセス可能であり、アクセスURLとして
http://xxx.yyy.com/
を持つものとする。
Subsequently, processing of each module in the present embodiment will be described.
[First system configuration]
Here, for simplicity, the system configuration shown in FIG. 4 is used. FIG. 4 is a diagram (part 2) illustrating an example of a system configuration of a system that performs an integrated search. The system configuration in FIG. 4 corresponds to the system configuration having only two search engines and one data source in the system configuration shown in FIG. Both the search engine 1 and the search engine 2 are intended to search the data source 1. In addition, it can be accessed by a Web protocol, and the access URL is http: // search. aaa. net /
http: // search. bbb. net /
Shall have. Furthermore, it is assumed that both are search engines that perform full-text search. On the other hand, the data source 1 can be accessed by a Web protocol, and the access URL is http: // xxx. yyy. com /
Shall have.
以上のシステム構成の下、初めに図5のフローチャートを参照して検索エンジンの登録処理について述べる。本実施形態では説明の簡略化のためユーザが手動で検索エンジンの登録を行うものとする。図5は、検索エンジンの登録処理の一例を示すフローチャートである。
まず、検索エンジン管理部201は、入出力管理部209を介して、ユーザが入力装置305等を用いて指示した、検索エンジンのアクセスURLと、検索エンジンの種別と、を指定して検索エンジンを登録する(S501)。検索エンジンの登録が指示されると、検索エンジン管理部201は、一意の検索エンジンIDを発行し、これを保管する(S502)。図6は、検索エンジン管理部が保管するデータの構造を示す図である。601は、検索エンジンIDである。602は、アクセスURLである。603は、検索エンジン種別である。
With the above system configuration, search engine registration processing will be described first with reference to the flowchart of FIG. In this embodiment, it is assumed that the user manually registers a search engine for the sake of simplification of description. FIG. 5 is a flowchart illustrating an example of search engine registration processing.
First, the search
検索エンジン管理部201は、検索エンジンの登録が完了すると、データソース管理部202に対してデータソース情報の取得を要求する(S503)。要求を受けたデータソース管理部202は、データソース特定情報の取得を行う。本実施形態では、データソース特定情報の取得先は各検索エンジンであるものとし、データソース管理部202は、HTTP(HyperText Transfer Protocol)を用いてアクセスする。
データソース管理部202は、検索エンジン管理部201から検索エンジンの登録データを取得し(S504)、アクセスURLにアクセスして検索エンジンからデータソース特定情報を取得する。続いて、データソース管理部202は、取得したデータソース特定情報とデータソース記述が同一のデータソース特定情報が既に保管されているか否かを確認する(S505)。データソース管理部202は、保管されていなければ一意のデータソースIDを発行してこれを保管する(S506)。データソース管理部202は、保管されている場合、そのデータソースIDを取得する(S507)。図7は、データソース管理部が保管するデータの構造を示す図である。701は、データソースIDである。702は、データソース記述である。本実施形態ではデータソース記述にもURLを用いることとする。
When the search engine registration is completed, the search
The data
データソース管理部202は、データソース特定情報を保管すると、検索エンジン=データソース対応付け管理部203に、検索エンジンIDとデータソースIDとを指定して登録を要求する(S508)。ここで、データソースIDは、S506で発行したものか、S507で取得したものの何れかである。検索エンジン=データソース対応付け管理部203では、指定された検索エンジンIDとデータソースIDとを一組で保管する(S509)。図8は、検索エンジン=データソース対応付け管理部が保管するデータの構造を示す図である。
以上が検索エンジンの登録処理の説明である。
After storing the data source specifying information, the data
This completes the description of the search engine registration process.
続いて、図9のフローチャートを参照して、検索処理の説明を行う。
図9は、検索処理の一例を示すフローチャートである。
まず、共通検索クエリ設定部205は、入出力管理部209を介して、ユーザが入力装置305等を用いて指示した、共通検索クエリを指定する(S901)。ここでは、
検索キーワード="カメラ"
を指定したものとする。次に、共通検索クエリ設定部205は、入力された検索クエリを解析して、検索を要求する必要のある検索エンジンの種別を判定する(S902)。ここでは共通検索クエリとしてキーワードのみが指定されているので、共通検索クエリ設定部205は、検索種別として全文検索と判定する。続いて、共通検索クエリ設定部205は、検索エンジン管理部201に対して検索エンジン種別が全文検索である検索エンジンの情報を要求する(S903)。
Next, the search process will be described with reference to the flowchart of FIG.
FIG. 9 is a flowchart illustrating an example of search processing.
First, the common search
Search keyword = "Camera"
Is specified. Next, the common search
検索エンジン管理部201は、保管している検索エンジンの登録データから、検索種別が全文検索であるデータを取得し(S904)、これを共通検索クエリ設定部205に返す。ここでは検索エンジン1と検索エンジン2との2つの登録データが返ることになる。
例えば、S902〜S904における共通検索クエリ設定部205の処理は、検索エンジンを特定する処理である(検索エンジン特定)。
共通検索クエリ設定部205は取得した検索エンジンの登録データから検索エンジンIDを抽出し、検索エンジン=データソース対応付け管理部203に対して前記検索エンジンIDの検索エンジンが検索対象としているデータソースの情報を要求する(S905)。検索エンジン=データソース対応付け管理部203は、保管しているデータから、指定された検索エンジンIDに対応付けられているデータソースIDを取得し(S906)、これを共通検索クエリ設定部205に返す。ここでは検索エンジンIDとして001と002とが指定され、両者は何れもデータソースIDが001に対応付けられているので、データソースID001が選択され、共通検索クエリ設定部205は、データソースIDとして001のみを取得する。
例えば、S905及びS906における共通検索クエリ設定部205の処理は、データソースを選択する処理である(データソース選択)。
The search
For example, the process of the common search
The common search
For example, the process of the common search
続いて、共通検索クエリ設定部205は、実際に検索を要求する検索エンジンの決定を行う。まず、共通検索クエリ設定部205は、検索エンジン種別に基づく検索エンジンの重複判定を行う(S907)。ここでは検索エンジン1と検索エンジン2との検索エンジン種別は共に全文検索と判定される。
次に、共通検索クエリ設定部205は、データソースの重複を判定するために、取得したデータソースIDを指定してデータソース関係検証部204に判定を要求する(S908)。ここではデータソースIDとして001のみが取得されているので、検索エンジン1と検索エンジン2とは共通のデータソースを検索対象としていることが判定される(S909)。以上の判定結果により、共通検索クエリ設定部205は、検索エンジン1と検索エンジン2とは、検索エンジン種別とデータソースとの両方が共通であり、何れか一方の検索エンジンでのみ検索を実行すれば必要な検索結果が得られることが分かる。そこで、共通検索クエリ設定部205は、検索エンジン1と検索エンジン2とのうち、検索エンジンIDが小さい検索エンジン1に検索を要求することを決定する(S910)。なお、ここでは、共通検索クエリ設定部205は、単純に検索エンジンIDの値に基づいて検索エンジンの決定を行うとしたが、過去のアクセス頻度や検索エンジンの負荷等に応じて選択するようにしてもよい。
Subsequently, the common search
Next, the common search
次に、共通検索クエリ設定部205は、検索エンジン1に対応する個別検索クエリの生成を個別検索クエリ生成部206に要求する(S911)。個別検索クエリ生成部206は、共通検索クエリ設定部205から共通検索クエリと検索を要求する検索エンジンの検索エンジンID(001)とを取得し、検索エンジンに応じた検索エンジン個別の検索クエリを生成する。ここでは、共通検索クエリとしてキーワードのみが指定されているので、個別検索クエリは共通検索クエリと同じ
検索キーワード="カメラ"
となる。個別検索クエリ生成部206は、生成した個別検索クエリと検索エンジンIDと組にして共通検索クエリ設定部205に返す。
Next, the common search
It becomes. The individual search
共通検索クエリ設定部205は、取得した個別検索クエリと検索エンジンIDとの組を個別検索実行部207に引き渡して検索の実行を要求する(S912)。個別検索実行部207は、指定された検索エンジンIDに対応する検索エンジンのアクセスURLを検索エンジン管理部201から取得する(S913)。続いて、個別検索実行部207は、取得したアクセスURLにアクセスして、指定された個別検索クエリで検索の実行を要求し(S914)、検索エンジンから検索結果を取得する(S915)。検索要求及び結果の送受信にはHTTPを用いるものとする。ここではデータソース1は、Webプロトコルでアクセス可能としたので、検索結果としてコンテンツのURLのリストが取得されるものとする。
The common search
次に、個別検索実行部207は、取得した検索結果を共通検索クエリ設定部205に返し、続いて共通検索クエリ設定部205がこれを検索結果統合部208に引き渡して検索結果の統合を要求する(S916)。ここでは検索を実行した検索エンジンは1つのみであるので、検索結果統合部208は何もせずに取得した結果を入出力管理部209に引き渡す(S917)。最後に入出力管理部209が検索結果を表示装置306に表示する(統合結果表示)(S918)。
以上説明したように、統合検索装置101は、同一のデータソースに対し同一の検索を行う検索エンジンが複数存在した場合に、何れか1つの検索エンジンを自動で選択して検索を実行することができる。これにより、ネットワークトラヒックや検索エンジンのマシンリソースの消費を削減することができる。
Next, the individual
As described above, when there are a plurality of search engines that perform the same search for the same data source, the
[第2のシステム構成]
引き続いて、図10のシステム構成に基づいて検索処理について説明する。図10は、統合検索を行うシステムのシステム構成の一例を示す図(その3)である。
図10において、検索エンジン1(1001)は、全文検索エンジン、検索エンジン2(1002)は、属性検索エンジンで、データソース1を検索対象としている。また検索エンジン3(1003)は、全文検索エンジンでデータソース2を検索対象としている。図11に、これらの検索エンジンを登録した状態の統合検索装置101内の保管データ構成を示す。図11は、統合検索装置101内の保管データの構成の一例を示す図である。11aが検索エンジン登録データである。11bがデータソース登録データである。11cが検索エンジン=データソース対応付けデータである。
[Second system configuration]
Subsequently, search processing will be described based on the system configuration of FIG. FIG. 10 is a diagram (part 3) illustrating an example of a system configuration of a system that performs an integrated search.
In FIG. 10, search engine 1 (1001) is a full-text search engine, search engine 2 (1002) is an attribute search engine, and data source 1 is a search target. The search engine 3 (1003) is a full-text search engine and the data source 2 is a search target. FIG. 11 shows a storage data configuration in the
次に検索処理について図9、図12のフローチャートを参照して説明する。基本的な処理の流れは第1のシステム構成で説明した処理に準じるので、ここでは差異がある部分についてのみ説明を行う。なお、図12は、検索結果統合処理の一例を示すフローチャートである。
まず、ユーザが共通検索クエリを入力するが、ここでは
検索キーワード="カメラ" AND 作成日時 ≧ 2008/01/01
が指定されたものとする。共通検索クエリ設定部205は、この共通検索クエリに対し、検索を要求する必要のある検索エンジンの種別を判定する。ここでは、検索キーワードに対する検索条件が指定されていることから、共通検索クエリ設定部205は、全文検索と判定する。そして、共通検索クエリ設定部205は、日付属性に対する検索条件が指定されていることから属性検索と判定する(S902)。
Next, the search process will be described with reference to the flowcharts of FIGS. Since the basic processing flow conforms to the processing described in the first system configuration, only the differences will be described here. FIG. 12 is a flowchart illustrating an example of the search result integration process.
First, the user inputs a common search query. Here, search keyword = “camera” AND creation date ≧ 2008/01/01
Is specified. The common search
続いて検索エンジン管理部201が全文検索を検索エンジン種別に持つ検索エンジンの登録データ及び属性検索を検索エンジン種別に持つ検索エンジンの登録データとして検索エンジン1〜3を取得し(S904)、これを共通検索クエリ設定部205が受け取る。続けて、共通検索クエリ設定部205は、検索エンジン=データソース対応付け管理部203からそれぞれの検索エンジンが検索対象とするデータソースとしてデータソース1〜2を取得する(S905、S906)。
次に、共通検索クエリ設定部205は、実際に検索を要求する検索エンジンの判定(又は決定)を行う。共通検索クエリ設定部205は、検索エンジン1と検索エンジン2とは検索エンジン種別が異なり共通のデータソースを検索対象としているので両方へ検索を要求する。また共通検索クエリ設定部205は、検索エンジン3と検索エンジン1とは検索エンジン種別が同種であるがデータソースが異なっているため、これにも検索を要求する(S907〜S910)。
Subsequently, the search
Next, the common search
次に個別検索クエリ生成部206は、共通検索クエリ設定部205からの要求に応じて、個別検索クエリを生成する。個別検索クエリ生成部206は、ここでは検索エンジン1と検索エンジン3とに対して全文検索のための検索条件
検索キーワード="カメラ"
を生成し、検索エンジン2に対して属性検索のための検索条件
作成日時 ≧ 2008/01/01
を生成する(S911)。共通検索クエリ設定部205は、これらの個別検索クエリを用いて個別検索実行部207に検索の実行を要求し(S912)、個別検索実行部207が検索エンジン1〜3に対して検索を実行させ、検索結果を取得する(S913〜S915)。なお、本構成においても検索結果はコンテンツのURLのリストで取得されるものとする。
続いて、検索結果統合部208が、検索結果の統合を行う。個別検索実行部207は、取得した検索結果を共通検索クエリ設定部205に返し、共通検索クエリ設定部205が検索結果と共通検索クエリとを検索結果統合部208に引き渡して検索結果の統合を要求する(S916)。
Next, the individual search
And the search condition for the attribute search for the search engine 2 creation date and time ≧ 2008/01/01
Is generated (S911). The common search
Subsequently, the search
すると、検索結果統合部208は、共通のデータソースを検索対象としている検索エンジンの検索結果の間で論理積を取ることの要否及び可否を判定する(S1201、S1202)。ここでは共通検索クエリにおいて全文検索条件と属性検索条件との論理積が指定されているので論理積を取ることが必要である。また、それぞれの条件に該当する検索エンジン1と検索エンジン2とは共通のデータソースを検索対象としているので論理積を取ることが可能である。したがって、検索結果統合部208は、検索エンジン1と検索エンジン2との検索結果の論理積を取って第1の統合結果を得る(S1203)。一方、検索エンジン3は他の検索エンジンとデータソースを共有していないので他の検索エンジンの結果と論理積を取るのは不可である。そこで、検索結果統合部208は、第1の統合結果との論理和を取って最終の統合結果を得る(S1204)。
つまり、検索結果統合部208は、検索クエリに基づいて、共通のデータソースを検索対象としている検索エンジンの検索結果の間で論理積を取ることが指定されているか否かを判定する。そして、検索結果統合部208は、前記判定の結果に基づいて、前記取得手段で取得された検索の結果の統合方法を決定(統合方法決定)し、検索の結果を統合し、最終の統合結果を得る。
Then, the search
That is, the search
検索結果統合部208は、最終の統合結果を入出力管理部209に引渡し(S917)、最後に入出力管理部209が検索結果を表示装置306に表示する。
以上説明したように、統合検索装置101は、複数の検索エンジンが複数のデータソースを検索対象としている場合において、検索を実行する検索エンジンを自動で選択し、データソースの関係に応じて検索結果を統合することができる。これにより、ユーザが検索エンジンやデータソースに関する事前知識を持ち得なくとも、共通検索クエリを指定するだけで効率的に統合検索を行うことができる。
以上が、実施形態1の説明である。
The search
As described above, the
The above is the description of the first embodiment.
<実施形態2>
実施形態1では、共通検索クエリの一部しか検索条件として適用できないデータソースも検索対象としていた。この場合、ユーザが指定した条件よりも緩い条件で検索が行われることになり、検索結果にノイズが含まれる場合がある。
本実施形態の統合検索装置101は、共通検索クエリの一部のみを使用して検索されるデータソースが存在する場合は、事前にユーザに問い合わせを行い、ユーザが検索の実行を指示した場合に限りそれらのデータソースを検索するものとする。
<Embodiment 2>
In the first embodiment, a data source to which only a part of the common search query can be applied as a search condition is also set as a search target. In this case, the search is performed under conditions that are looser than the conditions specified by the user, and the search results may include noise.
When there is a data source searched using only a part of the common search query, the
<実施形態3>
実施形態2では、共通検索クエリの一部しか検索条件として適用できない場合は、事前にユーザに問い合わせを行うものとした。
本実施形態の統合検索装置101は、共通検索クエリで指定された検索条件を全て使って検索を行うことのできるデータソースのみを検索対象として、検索の実行を要求する検索エンジンを決定するものとする。
<Embodiment 3>
In the second embodiment, when only a part of the common search query can be applied as a search condition, the user is inquired in advance.
The
<実施形態4>
本実施形態の統合検索装置101は、実施形態3の処理に加えて、共通検索クエリの一部のみを使用すれば検索可能なデータソースが存在する旨を検索結果と合わせて表示するものとする。
<Embodiment 4>
In addition to the processing of the third embodiment, the
<実施形態5>
上述した実施形態では、検索エンジン管理部201への検索エンジンの登録方法をユーザが手動で行うとしていたが、本実施形態では、検索エンジン管理部201がサービスディスカバリを用いて自動で検索エンジンの登録を行う。検索エンジン管理部201は、サービスディスカバリを行う方法としては、UDDIやSSDP等の既存のプロトコルや、その他の任意の手段を用いるものとする。ここで、UDDIとは、Universal Description, Discovery and Integrationの略である。また、SSDPとは、Simple Service Discovery Protocolの略である。また、検索ディスカバリの問い合わせ先は、検索エンジンであっても、検索エンジン以外の装置であってもよい。
<Embodiment 5>
In the above-described embodiment, the user manually performs a search engine registration method in the search
<実施形態6>
上述した実施形態では、データソース記述にデータソースのURLを用いて説明を行った。しかしながら、本実施形態の統合検索装置101は、UNC(Universal Naming Convention)やデータベース名、或いはコンテンツ識別子のリスト等、データソースの種別に応じた記述方式を用いてもよい。
<Embodiment 6>
In the above-described embodiment, the data source description has been described using the data source URL. However, the
<実施形態7>
上述した実施形態では、データソースの重複判定にデータソースIDを用いた。しかしながら、本実施形態の統合検索装置101は、URLやUNC等の文字列を比較する方法や、コンテンツ識別子の集合の要素を比較する方法等を用いてもよい。
<Embodiment 7>
In the above-described embodiment, the data source ID is used for the data source duplication determination. However, the
<実施形態8>
上述した実施形態では、データソース記述に単一のURLを用い、URLが一致するか否かによって、データソース間の関係を等価か独立の何れかに判定していた。本実施形態の統合検索装置101は、これに加えて、重複と包含との関係も判定する。例えば、データソース1のデータソース記述が
http://xxx.yyy.net/
であり、データソース2のデータソース記述が
http://xxx.yyy.net/AAA/
であった場合、統合検索装置101は、これらのURLの関係によりデータソース1はデータソース2を包含すると判定する。
<Eighth embodiment>
In the embodiment described above, a single URL is used for the data source description, and the relationship between the data sources is determined as equivalent or independent depending on whether the URLs match. In addition to this, the
And the data source description of the data source 2 is http: // xxx. yyy. net / AAA /
In the case, the
また、例えばデータソース1のデータソース記述が
http://xxx.yyy.net/
http://ABC.DEF.com/
であり、データソース2のデータソース記述が
http://xxx.yyy.net/
http://LMN.OPQ.com/
であった場合、http://xxx.yyy.net/が両者に共通に存在するので、統合検索装置101は、データソース1とデータソース2とは重複関係と判定する。
For example, if the data source description of the data source 1 is http: // xxx. yyy. net /
http: // ABC. DEF. com /
And the data source description of the data source 2 is http: // xxx. yyy. net /
http: // LMN. OPQ. com /
In this case, http: // xxx. yyy. Since net / exists in both, the
<実施形態9>
上述した実施形態では、データソース特定情報を検索エンジンから取得するとしていた。しかしながら、検索エンジンの外部にデータソース特定情報を管理するサーバを設け、本実施形態の統合検索装置101は、前記サーバからデータソース特定情報を取得するものとしてもよい。
<Ninth Embodiment>
In the above-described embodiment, the data source specifying information is acquired from the search engine. However, a server for managing data source identification information may be provided outside the search engine, and the
<実施形態10>
上述した実施形態では、データソース特定情報の取得、検索の実行要求の送信、及び検索結果の取得にHTTPを用いるとしていた。しかしながら、本実施形態の統合検索装置101は、他の任意のプロトコルを用いてもよい。
<Embodiment 10>
In the above-described embodiment, HTTP is used for acquiring data source specifying information, transmitting a search execution request, and acquiring search results. However, the
<その他の実施形態>
また、上述した実施形態の目的は、以下のようにすることによって達成される。即ち、上述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体(又は記録媒体)を、システム或いは装置に供給する。そして、そのシステム或いは装置の中央演算処理手段(CPUやMPU)が記憶媒体に格納されたプログラムコードを読み出し実行する。この場合、記憶媒体から読み出されたプログラムコード自体が上述した実施形態の機能を実現することになり、そのプログラムコードを記録した記憶媒体は上述した実施形態を構成することになる。
<Other embodiments>
The object of the above-described embodiment is achieved by the following. That is, a storage medium (or recording medium) in which a program code of software that realizes the functions of the above-described embodiments is recorded is supplied to the system or apparatus. Then, the central processing means (CPU or MPU) of the system or apparatus reads and executes the program code stored in the storage medium. In this case, the program code itself read from the storage medium realizes the functions of the above-described embodiment, and the storage medium recording the program code constitutes the above-described embodiment.
また、システム或いは装置の前記中央演算処理手段が読み出したプログラムコードを実行することにより、そのプログラムコードの指示に基づき、システム或いは装置上で稼働しているオペレーティングシステム(OS)等が実際の処理の一部又は全部を行う。その処理によって上述した実施形態の機能が実現される場合も含まれる。 In addition, by executing the program code read by the central processing means of the system or apparatus, an operating system (OS) or the like operating on the system or apparatus performs actual processing based on the instruction of the program code. Do some or all. The case where the function of the above-described embodiment is realized by the processing is also included.
更に、記憶媒体から読み出されたプログラムコードが、前記システム或いは装置に挿入された機能拡張カードや、接続された機能拡張ユニットに備わるメモリに書込まれたとする。その後、そのプログラムコードの指示に基づき、その機能拡張カードや機能拡張ユニットに備わるCPU等が実際の処理の一部又は全部を行い、その処理によって上述した実施形態の機能が実現される場合も含まれる。 Furthermore, it is assumed that the program code read from the storage medium is written to a memory provided in a function expansion card inserted into the system or apparatus or a function expansion unit connected thereto. After that, based on the instruction of the program code, the CPU of the function expansion card or function expansion unit performs part or all of the actual processing, and the function of the above-described embodiment is realized by the processing. It is.
上述した実施形態を前記記憶媒体に適用する場合、その記憶媒体には、先に説明したフローチャートに対応するプログラムコードが格納されることになる。 When the above-described embodiment is applied to the storage medium, the storage medium stores program codes corresponding to the flowcharts described above.
上述した各実施形態によれば、検索エンジンやデータソースに関する事前知識をユーザが持ち得ない場合においても、複数の検索エンジンを適切に組み合わせて統合検索を実行することができる。したがって、ユーザが所望のデータを発見することを容易ならしめることができる。特に、インターネットやイントラネット等の複数のデータソースに分散したコンテンツを、複数の検索エンジンを用いて検索する場合において効果が見込まれる。
更には、共通のデータソースを検索対象とする同種の検索エンジンが複数存在する場合においては、ユーザの事前知識が無くても検索を実行する検索エンジンを限定することができ、ネットワークやマシンリソースに対する負荷を軽減する効果が見込まれる。
According to each embodiment mentioned above, even when a user cannot have prior knowledge about a search engine or a data source, a combined search can be performed by appropriately combining a plurality of search engines. Therefore, the user can easily find desired data. In particular, it is expected to be effective when searching for content distributed in a plurality of data sources such as the Internet and an intranet using a plurality of search engines.
Furthermore, when there are multiple search engines of the same type that search for a common data source, it is possible to limit the search engines that perform searches without prior knowledge of the user. The effect of reducing the load is expected.
以上、本発明の好ましい実施形態について詳述したが、本発明は係る特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。
例えば、上述した各実施形態を組み合わせて実施可能なものは、任意に組み合わせて実施してもよい。
The preferred embodiments of the present invention have been described in detail above, but the present invention is not limited to such specific embodiments, and various modifications can be made within the scope of the gist of the present invention described in the claims.・ Change is possible.
For example, what can be implemented combining each embodiment mentioned above may be implemented combining arbitrarily.
101 統合検索装置、301 CPU 101 Integrated search device, 301 CPU
Claims (8)
検索エンジンと、前記検索エンジンが検索対象とする複数のコンテンツを含むデータソースと、を対応付ける対応付け情報と、前記検索エンジン特定手段で特定された1又は複数の検索エンジンと、に基づいて1又は複数のデータソースを選択するデータソース選択手段と、
前記検索エンジン特定手段で複数の検索エンジンが特定された検索エンジンに係る検索種別が重複しているか否か、及び前記データソース選択手段で特定されたデータソースが重複しているか否かに基づいて、前記特定手段で特定された複数の検索エンジンの中から、検索を要求する検索エンジンを決定する決定手段と、
を有する情報処理装置。 Search engine specifying means for specifying one or more search types related to the search query based on the input search query, and specifying one or more search engines based on the search type;
1 or based on association information associating a search engine with a data source including a plurality of contents to be searched by the search engine and one or more search engines specified by the search engine specifying means A data source selection means for selecting a plurality of data sources;
Based on whether or not the search types related to the search engines for which a plurality of search engines are specified by the search engine specifying means are duplicated and whether or not the data sources specified by the data source selection means are duplicated Deciding means for deciding a search engine that requests a search from among a plurality of search engines specified by the specifying means;
An information processing apparatus.
前記生成手段で生成された検索エンジン個別の検索クエリを、対応する各検索エンジンに渡し、検索の実行を要求する要求手段と、
前記要求手段で検索の実行を要求された各検索エンジンにおける検索の結果を取得する取得手段と、
前記取得手段で取得された検索の結果を統合する検索結果統合手段と、
前記検索結果統合手段で統合された検索の結果を表示する統合結果表示手段と、
を更に有する請求項1記載の情報処理装置。 Generating means for generating a search query for each search engine according to the search engine determined by the determining means based on the input search query;
A request unit that passes a search query for each search engine generated by the generation unit to each corresponding search engine and requests execution of the search;
Obtaining means for obtaining a search result in each search engine requested to execute the search by the request means;
Search result integration means for integrating the search results acquired by the acquisition means;
Integrated result display means for displaying the search results integrated by the search result integration means;
The information processing apparatus according to claim 1, further comprising:
前記情報処理装置が、検索エンジンと、前記検索エンジンが検索対象とする複数のコンテンツを含むデータソースと、を対応付ける対応付け情報と、前記検索エンジン特定ステップで特定された1又は複数の検索エンジンと、に基づいて1又は複数のデータソースを選択するデータソース選択ステップと、
前記情報処理装置が、前記検索エンジン特定ステップで複数の検索エンジンが特定された前記検索エンジンに係る検索種別が重複しているか否か、及び前記データソース選択ステップで特定されたデータソースが重複しているか否かに基づいて、前記特定ステップで特定された複数の検索エンジンの中から、検索を要求する検索エンジンを決定する決定ステップと、
を有する情報処理方法。 A search engine specifying step in which the information processing device specifies one or more search types related to the search query based on the input search query, and specifies one or more search engines based on the search type;
The information processing apparatus, associating information associating a search engine with a data source including a plurality of contents to be searched by the search engine, and one or a plurality of search engines specified in the search engine specifying step; A data source selection step of selecting one or more data sources based on
In the information processing apparatus, whether or not the search types related to the search engines for which a plurality of search engines have been specified in the search engine specifying step overlaps, and the data sources specified in the data source selection step overlap. A determination step of determining a search engine that requests a search from among the plurality of search engines specified in the specifying step based on whether or not
An information processing method comprising:
前記情報処理装置が、前記生成ステップで生成された検索エンジン個別の検索クエリを、対応する各検索エンジンに渡し、検索の実行を要求する要求ステップと、
前記情報処理装置が、前記要求ステップで検索の実行を要求された各検索エンジンにおける検索の結果を取得する取得ステップと、
前記情報処理装置が、前記取得ステップで取得された検索の結果を統合する検索結果統合ステップと、
前記情報処理装置が、前記検索結果統合ステップで統合された検索の結果を表示する統合結果表示ステップと、
を更に有する請求項4記載の情報処理方法。 The information processing apparatus generates a search query for each search engine according to the search engine determined in the determination step based on the input search query;
The information processing apparatus, a request step for requesting execution of a search by passing a search query for each search engine generated in the generation step to each corresponding search engine;
The information processing apparatus obtains a search result in each search engine requested to execute a search in the request step;
A search result integration step in which the information processing apparatus integrates the search results acquired in the acquisition step;
An integrated result display step in which the information processing apparatus displays a search result integrated in the search result integration step;
The information processing method according to claim 4, further comprising:
入力された検索クエリに基づいて前記検索クエリに係る1又は複数の検索種別を特定し、前記検索種別に基づいて1又は複数の検索エンジンを特定する検索エンジン特定手段と、
検索エンジンと、複数のコンテンツを含むデータソースと、を対応付ける対応付け情報と、前記検索エンジン特定手段で特定された1又は複数の検索エンジンと、に基づいて1又は複数のデータソースを選択するデータソース選択手段と、
前記検索エンジン特定手段で複数の検索エンジンが特定された前記検索エンジンに係る検索種別が重複しているか否か、及び前記データソース選択手段で特定されたデータソースが重複しているか否かに基づいて、前記特定手段で特定された複数の検索エンジンの中から、検索を要求する検索エンジンを決定する決定手段と、
して機能させるプログラム。 Computer
Search engine specifying means for specifying one or more search types related to the search query based on the input search query, and specifying one or more search engines based on the search type;
Data for selecting one or a plurality of data sources based on association information that associates a search engine with a data source including a plurality of contents, and one or a plurality of search engines specified by the search engine specifying means Source selection means;
Based on whether or not the search types related to the search engines for which a plurality of search engines have been specified by the search engine specifying means are duplicated, and whether or not the data sources specified by the data source selection means are duplicated Determining means for determining a search engine that requests a search from among a plurality of search engines specified by the specifying means;
Program to make it work.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009117859A JP2010267075A (en) | 2009-05-14 | 2009-05-14 | Apparatus and method for processing information, program, and storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009117859A JP2010267075A (en) | 2009-05-14 | 2009-05-14 | Apparatus and method for processing information, program, and storage medium |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2010267075A true JP2010267075A (en) | 2010-11-25 |
Family
ID=43363994
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009117859A Pending JP2010267075A (en) | 2009-05-14 | 2009-05-14 | Apparatus and method for processing information, program, and storage medium |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2010267075A (en) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012252654A (en) * | 2011-06-06 | 2012-12-20 | Toshiba Corp | Face image retrieval system and face image retrieval method |
JP2016212908A (en) * | 2013-04-08 | 2016-12-15 | フェイスブック,インク. | Vertical-based query optionalizing |
JP6375083B1 (en) * | 2017-03-30 | 2018-08-15 | 株式会社オプティム | Search system, method and program |
US11843737B2 (en) * | 2021-08-30 | 2023-12-12 | Canon Kabushiki Kaisha | Information processing apparatus, control method therefor, and storage medium |
-
2009
- 2009-05-14 JP JP2009117859A patent/JP2010267075A/en active Pending
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012252654A (en) * | 2011-06-06 | 2012-12-20 | Toshiba Corp | Face image retrieval system and face image retrieval method |
JP2016212908A (en) * | 2013-04-08 | 2016-12-15 | フェイスブック,インク. | Vertical-based query optionalizing |
CN107729525A (en) * | 2013-04-08 | 2018-02-23 | 脸谱公司 | Based on vertical inquiry selectionization |
US10649992B2 (en) | 2013-04-08 | 2020-05-12 | Facebook, Inc. | Vertical-based query optionalizing |
JP6375083B1 (en) * | 2017-03-30 | 2018-08-15 | 株式会社オプティム | Search system, method and program |
WO2018179228A1 (en) * | 2017-03-30 | 2018-10-04 | 株式会社オプティム | Search system, method and program |
US10642920B2 (en) | 2017-03-30 | 2020-05-05 | Optim Corporation | System, method, and program for search |
US11843737B2 (en) * | 2021-08-30 | 2023-12-12 | Canon Kabushiki Kaisha | Information processing apparatus, control method therefor, and storage medium |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7370036B2 (en) | Facilitating identification of entire web pages when each web page is rendered from multiple portions and interest is expressed based on content of the portions | |
US8930807B2 (en) | Web content management based on timeliness metadata | |
JP2010026653A (en) | Data access control method, data access control apparatus, and program | |
JP2017528782A (en) | System and method for connecting data by routing data through interaction between user and content data | |
US20050144285A1 (en) | Finding of tv anytime web services | |
US20130013408A1 (en) | Method and Arrangement for Network Searching | |
Schade et al. | Augmenting SDI with linked data | |
WO2014108038A1 (en) | Frequently-used website generation client terminal, server, system and method | |
JP5964847B2 (en) | Connecting dynamic image results | |
JP5869010B2 (en) | System and method for providing mobile URL in mobile search environment | |
JP2010267075A (en) | Apparatus and method for processing information, program, and storage medium | |
JP2022105567A (en) | Web page translation system, web page translation device, web page provision device, and web page translation method | |
CN109428872B (en) | Data transmission method, equipment, server, starting method and system | |
JP5283600B2 (en) | Information search program, information search system | |
WO2016201547A1 (en) | A computer-implemented method of aggregating and presenting digital photos from numerous sources | |
JP2009187401A (en) | Document management system, document management apparatus, and document managing method and program | |
JP2009251754A (en) | Page customizing server, page customizing program, and page customizing method | |
CN115269527A (en) | Sharing data sharing metrics to clients | |
US11403315B2 (en) | Reporting and knowledge discovery for databases | |
Stadtmüller | Dynamic Interaction and Manipulation of Web Resources | |
JP2004348676A (en) | Information resource server and information resource provision method | |
EP4345639A1 (en) | Background service to generate data dictionary metadata | |
JP2005210513A (en) | View access control method classified by domain name, dns server system device, view access control program classified by domain name, and storage medium storing view access control program classified by domain name | |
EP4345643A1 (en) | Distributing large amounts of global metadata using object files | |
JP2012146076A (en) | Cache server, cache management method, and cache management program |