JP2011076264A - Retrieval control device, retrieval control method, and program - Google Patents

Retrieval control device, retrieval control method, and program Download PDF

Info

Publication number
JP2011076264A
JP2011076264A JP2009225459A JP2009225459A JP2011076264A JP 2011076264 A JP2011076264 A JP 2011076264A JP 2009225459 A JP2009225459 A JP 2009225459A JP 2009225459 A JP2009225459 A JP 2009225459A JP 2011076264 A JP2011076264 A JP 2011076264A
Authority
JP
Japan
Prior art keywords
search
preliminary
query
result
web
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009225459A
Other languages
Japanese (ja)
Other versions
JP2011076264A5 (en
JP5379627B2 (en
Inventor
Naoto Abe
直人 阿部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Communications Corp
Original Assignee
NTT Communications Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Communications Corp filed Critical NTT Communications Corp
Priority to JP2009225459A priority Critical patent/JP5379627B2/en
Publication of JP2011076264A publication Critical patent/JP2011076264A/en
Publication of JP2011076264A5 publication Critical patent/JP2011076264A5/ja
Application granted granted Critical
Publication of JP5379627B2 publication Critical patent/JP5379627B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To automatically acquire retrieval results whose contents have the high degree of centralization in Web retrieval. <P>SOLUTION: The retrieval control device connected to a network includes a preliminary retrieval means for generating a plurality of preliminary retrieval queries on the basis of a retrieval query, for performing Web retrieval by using each preliminary retrieval query, and for storing preliminary retrieval results in the preliminary retrieval result storage means for each preliminary retrieval query; a preliminary retrieval result evaluation means for reading the preliminary retrieval results from the preliminary result storage means, for executing processing to evaluate the degree of concentration of the contents of the preliminary retrieval results for each preliminary retrieval query, and for storing the preliminary retrieval query corresponding to the preliminary retrieval results whose contents have the highest degree of centralization as a retrieval query in the retrieval query storage means; and a Web retrieval means for performing Web retrieval by using the retrieval query stored in the retrieval query storage means, and for output of the retrieval results when prescribed conditions are satisfied by the retrieval results of the Web retrieval. <P>COPYRIGHT: (C)2011,JPO&INPIT

Description

本発明は、検索語を用いてウェブ検索を行う技術に関し、特に、検索語に関連した内容を多く含む適切な検索結果を自動的に得るための技術に関するものである。   The present invention relates to a technique for performing a web search using a search word, and more particularly to a technique for automatically obtaining an appropriate search result including a lot of contents related to a search word.

新聞や番組、映像、写真など様々なコンテンツをネットワーク上で提供するサービスが広く普及している。このようなサービスでは、コンテンツに、その詳細が記載されたメタデータが付与されている。メタデータにより、サービス利用者は容易に所望のコンテンツを取得できる。   Services that provide various contents such as newspapers, programs, videos, photos, etc. on the network are widespread. In such a service, metadata describing the details is added to the content. With the metadata, the service user can easily obtain desired content.

このようなサービスでは、一般に、メタデータはサービス提供者により作成され、コンテンツと共に管理される。しかし、コンテンツの数は膨大になってきており、各コンテンツに対して詳細なメタデータを付与し、管理することを人手で行うことは困難になりつつある。そこで、人手でごく僅かなメタデータを作成し、それを自動的に拡張する技術が提案されている。   In such services, in general, metadata is created by the service provider and managed with the content. However, the number of contents has become enormous, and it is becoming difficult to manually assign and manage detailed metadata for each content. Therefore, a technique has been proposed in which a very small amount of metadata is created manually and automatically expanded.

メタデータを自動的に拡張する技術として、ウェブ検索を利用する技術がある。例えば、特許文献1に記載された技術では、ファイアウォールにおけるアクセスログを利用して、メタデータの情報源(ウェブサーバ等)を限定し、当該情報源に対して検索語(基となるメタデータ)に基づき検索を行って、検索語に関連するコンテンツを取得し、当該コンテンツから拡張に用いる新たなメタデータを抽出している。   As a technique for automatically extending metadata, there is a technique using web search. For example, in the technique described in Patent Document 1, an access log in a firewall is used to limit the information source of metadata (such as a web server), and a search term (basic metadata) for the information source. The content related to the search term is acquired based on the search, and new metadata used for expansion is extracted from the content.

特開2007−149036号公報JP 2007-149036 A

さて、一般的にネットワーク上で提供されているウェブ検索サービスにおけるウェブ検索は、入力された検索語を含む情報を、検索語に関連する内容を有する情報としてウェブ上から収集するものである。しかし、現状のウェブ検索は、使用する検索語の選び方によっては、検索語と関連性が低い多くの様々なコンテンツ情報が検索結果に含まれることがある。このような場合、特許文献1に記載された技術では、適切な拡張用メタデータを得ることができない。   A web search in a web search service generally provided on a network collects information including an input search word from the web as information having contents related to the search word. However, in the current web search, depending on how to select a search word to be used, a lot of various pieces of content information having low relevance to the search word may be included in the search result. In such a case, the technique described in Patent Document 1 cannot obtain appropriate extension metadata.

また、ウェブブラウザを備えたPC端末からウェブ検索を行うなどの一般のウェブ検索においては、1回の検索で適切な検索結果を得られない場合が少なからず発生し、このような場合、利用者は、目的とする内容を多く含む検索結果を得るために、様々な検索語を用いて検索を試行しなければならず、時間と手間がかかるという問題がある。   In addition, in general web searches such as web searches from PC terminals equipped with web browsers, there are not a few cases where appropriate search results cannot be obtained in a single search. However, in order to obtain a search result including a large amount of target content, it is necessary to try a search using various search terms, which is time consuming and troublesome.

ここで、ウェブ検索は、基本的に検索語に関連する情報を収集するものであるから、ウェブ検索結果の内容の散らばり度合いが小さく、ある内容に集中している場合、そのウェブ検索結果は、入力した検索語に関する内容に集中した適切な検索結果である蓋然性が極めて高い。このような適切な検索結果を、人手による再検索を行うことなく自動的に取得することはウェブ検索における課題である。   Here, since the web search basically collects information related to the search term, when the degree of dispersion of the content of the web search result is small and concentrated on a certain content, the web search result is There is an extremely high probability that the search result is an appropriate search result concentrated on the contents related to the input search word. It is an issue in web search to automatically obtain such an appropriate search result without performing a manual search again.

本発明は上記の点に鑑みてなされたものであり、入力された検索語を用いてウェブ検索を実行し、検索結果を出力する技術において、内容の集中度の高い検索結果を自動的に取得する技術を提供することを目的とする。   The present invention has been made in view of the above points, and in a technique for executing a web search using an input search word and outputting the search result, a search result with high concentration of contents is automatically acquired. It aims at providing the technology to do.

上記の課題を解決するために、本発明は、ウェブ検索サービスが提供されるネットワークに接続される検索制御装置であって、入力された検索語から生成された検索クエリに基づき、予備検索クエリを複数個生成し、各予備検索クエリを用いてウェブ検索を行い、当該ウェブ検索の検索結果を、予備検索結果として予備検索クエリ毎に予備検索結果記憶手段に格納する予備検索手段と、前記予備検索結果記憶手段から予備検索結果を読み出し、当該予備検索結果の内容の集中度を評価する処理を予備検索クエリ毎に実行し、内容の集中度が最も高い予備検索結果に対応する予備検索クエリを、検索クエリとして検索クエリ記憶手段に格納する予備検索結果評価手段と、前記検索クエリ記憶手段に格納された前記検索クエリを用いてウェブ検索を行い、当該ウェブ検索の検索結果が所定の条件を満たす場合に、当該検索結果を出力するウェブ検索手段とを備えたことを特徴とする検索制御装置として構成される。   In order to solve the above-described problems, the present invention provides a search control apparatus connected to a network provided with a web search service, which performs a preliminary search query based on a search query generated from an input search term. A plurality of preliminary search means for performing a web search using each preliminary search query, and storing the search result of the web search in the preliminary search result storage means for each preliminary search query as a preliminary search result; and the preliminary search Read the preliminary search result from the result storage means, execute the process for evaluating the concentration level of the content of the preliminary search result for each preliminary search query, the preliminary search query corresponding to the preliminary search result with the highest concentration of content, Preliminary search result evaluation means stored in the search query storage means as a search query, and web search using the search query stored in the search query storage means Performed, if the search results of the Web search satisfies a predetermined condition, and a search control device being characterized in that a web search means for outputting the retrieval result.

本発明によれば、入力された検索語を用いてウェブ検索を実行し、検索結果を出力する技術において、内容の集中度の高い検索結果を自動的に取得することが可能となる。   According to the present invention, it is possible to automatically acquire a search result having a high degree of content concentration in a technique of executing a web search using an input search word and outputting the search result.

本発明の実施の形態に係る検索システムの構成図である。It is a block diagram of the search system which concerns on embodiment of this invention. 本発明の実施の形態に係る検索システムの動作を示すフローチャートである。It is a flowchart which shows operation | movement of the search system which concerns on embodiment of this invention. 検索クエリ生成部13の処理を示すフローチャートである。5 is a flowchart showing processing of a search query generation unit 13. 検索語と検索クエリの例を示す図である。It is a figure which shows the example of a search term and a search query. ウェブ検索部15の処理を示すフローチャートである。4 is a flowchart showing processing of a web search unit 15. 予備検索実行部16の処理を示すフローチャートである。3 is a flowchart showing processing of a preliminary search execution unit 16. ウェブ検索の検索結果をブラウザ表示した場合の例を示す図である。It is a figure which shows the example at the time of displaying the search result of a web search with a browser. 検索結果であるHTMLテキストの一部を示す図である。It is a figure which shows a part of HTML text which is a search result. 予備検索結果の例を示す図である。It is a figure which shows the example of a preliminary | backup search result. 予備検索結果評価部18の処理を示すフローチャートである。It is a flowchart which shows the process of the preliminary | backup search result evaluation part. 予備検索結果評価部18における評価処理を説明するための図である。It is a figure for demonstrating the evaluation process in the preliminary search result evaluation part. 予備検索結果評価部18による出力結果の例を示す図である。It is a figure which shows the example of the output result by the preliminary search result evaluation part.

以下、図面を参照して本発明の実施の形態を説明する。   Embodiments of the present invention will be described below with reference to the drawings.

(システム構成)
図1に、本発明の実施の形態に係る検索システムの構成を示す。図1に示すとおり、本実施の形態に係る検索システムは、検索制御装置1、及び検索利用装置3を有する。検索制御装置1は、ウェブ検索サービスが提供されるインターネット等のネットワーク4に接続される。
(System configuration)
FIG. 1 shows a configuration of a search system according to an embodiment of the present invention. As shown in FIG. 1, the search system according to the present embodiment includes a search control device 1 and a search utilization device 3. The search control device 1 is connected to a network 4 such as the Internet where a web search service is provided.

検索利用装置3と検索制御装置1との間はWANやインターネット等の広域ネットワークで接続してもよいし、LAN等のローカルなネットワークで接続してもよい。また、検索利用装置3の中に、検索制御装置1の機能を含めて構成してもよい。もしくは、検索利用装置3を用いず、検索制御装置1内に、情報の入出力を行うためのユーザインタフェースを備え、利用者が検索制御装置1に対して検索語を入力し、検索制御装置1が検索結果を利用者に対して表示する構成としてもよい。   The search utilization device 3 and the search control device 1 may be connected via a wide area network such as a WAN or the Internet, or may be connected via a local network such as a LAN. Further, the search utilization device 3 may be configured to include the function of the search control device 1. Alternatively, a user interface for inputting / outputting information is provided in the search control device 1 without using the search utilization device 3, and a user inputs a search word to the search control device 1, and the search control device 1 May be configured to display the search result to the user.

検索利用装置3は、検索語を検索制御装置1に送信し、検索結果を検索制御装置1から受信する装置である。検索利用装置3は、例えば、ウェブブラウザを備えたPC端末や、特許文献1に記載されたメタデータ生成装置のような、ウェブ検索結果を利用して、メタデータを拡張するための装置である。   The search utilization device 3 is a device that transmits a search word to the search control device 1 and receives a search result from the search control device 1. The search utilization device 3 is a device for extending metadata using a web search result, such as a PC terminal having a web browser or a metadata generation device described in Patent Document 1. .

図1に示すように、検索制御装置1は、入力部11、検索語記憶部12、検索クエリ生成部13、検索クエリ記憶部14、ウェブ検索部15、予備検索実行部16、予備検索結果記憶部17、予備検索結果評価部18、評価結果記憶部19、出力部20、及び制御部21を備える。   As shown in FIG. 1, the search control device 1 includes an input unit 11, a search word storage unit 12, a search query generation unit 13, a search query storage unit 14, a web search unit 15, a preliminary search execution unit 16, and a preliminary search result storage. Unit 17, preliminary search result evaluation unit 18, evaluation result storage unit 19, output unit 20, and control unit 21.

入力部11は、検索利用装置3から受信した検索語を、制御部21を介して検索語記憶部12に格納する。検索語記憶部12には、入力部11から入力された検索語が格納される。   The input unit 11 stores the search word received from the search utilization device 3 in the search word storage unit 12 via the control unit 21. The search term storage unit 12 stores a search term input from the input unit 11.

検索クエリ生成部13は、メモリ等の記憶装置に格納された設定ファイルの内容に基づき、検索語から、ウェブ検索に不適な文字や記号を削除し、検索制御装置1からウェブ検索を行う際に使用する検索クエリを生成する。そして、生成した検索クエリを制御部21を介して検索クエリ記憶部14に格納する。検索クエリ記憶部14には、検索クエリ生成部13で作成された検索クエリが格納される。   The search query generation unit 13 deletes characters and symbols that are inappropriate for the web search from the search word based on the contents of the setting file stored in a storage device such as a memory, and performs a web search from the search control device 1. Generate a search query to use. Then, the generated search query is stored in the search query storage unit 14 via the control unit 21. The search query storage unit 14 stores the search query created by the search query generation unit 13.

ウェブ検索部15は、検索クエリ記憶部14に格納されている検索クエリを使用して、ネットワーク4を介してウェブ検索を行い、検索結果と、検索結果に含まれるコンテンツ情報の件数を取得する。本実施の形態において、検索結果は、HTMLで記述されたテキストとして得られるものである。ここでの検索件数に応じて、制御部21は、検索結果を出力部20に出力するか、もしくは、予備検索実行部16に処理を移すかの制御を行なう。   The web search unit 15 uses the search query stored in the search query storage unit 14 to perform a web search via the network 4 and obtains the search result and the number of content information included in the search result. In the present embodiment, the search result is obtained as text described in HTML. The control unit 21 controls whether to output the search result to the output unit 20 or to transfer the process to the preliminary search execution unit 16 according to the number of searches here.

予備検索実行部16は、検索クエリ記憶部14に格納されている検索クエリから、複数の単語からなる予備検索クエリを複数個生成し、各予備検索クエリを用いてネットワーク4を介してウェブ検索(予備検索という)を実行し、予備検索結果を得る。後に詳細に説明するように、予備検索結果には、上記ウェブ検索の検索結果から抽出された複数の要約文が含まれる。   The preliminary search execution unit 16 generates a plurality of preliminary search queries including a plurality of words from the search query stored in the search query storage unit 14, and performs a web search via the network 4 using each preliminary search query ( A preliminary search result is obtained. As will be described in detail later, the preliminary search result includes a plurality of summary sentences extracted from the search result of the web search.

予備検索実行後、予備検索実行部16は、予備検索結果を制御部21を介して予備検索結果記憶部17に格納する。予備検索結果記憶部17には、予備検索実行部16で得られた予備検索結果が予備検索クエリ毎に格納される。   After executing the preliminary search, the preliminary search execution unit 16 stores the preliminary search result in the preliminary search result storage unit 17 via the control unit 21. The preliminary search result storage unit 17 stores the preliminary search results obtained by the preliminary search execution unit 16 for each preliminary search query.

予備検索結果評価部18は、予備検索結果記憶部17に格納されている予備検索結果に対し、評価関数を用いて内容の集中度を評価し、集中度の高い予備検索結果を特定し、評価結果を評価結果記憶部19に格納する。評価結果記憶部19には、予備検索結果評価部18で得られた評価結果が格納される。出力部20は、検索結果を検索利用装置3に対して出力する機能部である。   The preliminary search result evaluation unit 18 evaluates the concentration level of the content using the evaluation function for the preliminary search result stored in the preliminary search result storage unit 17, identifies the preliminary search result having a high concentration level, and evaluates the evaluation result. The result is stored in the evaluation result storage unit 19. The evaluation result storage unit 19 stores the evaluation result obtained by the preliminary search result evaluation unit 18. The output unit 20 is a functional unit that outputs search results to the search utilization device 3.

制御部21は、予め定めた処理手順に従って、各機能部に処理実行を指示する等の処理制御を行う機能部である。つまり、例えば、各機能部が、プログラムのモジュール(関数の実体等)で実現される場合において、制御部21は、処理手順に応じた機能部に対応するプログラムを呼び出し、実行する処理を行う。   The control unit 21 is a functional unit that performs processing control such as instructing each functional unit to execute processing according to a predetermined processing procedure. That is, for example, when each functional unit is realized by a program module (function entity or the like), the control unit 21 performs a process of calling and executing a program corresponding to the functional unit corresponding to the processing procedure.

図1に示す検索制御装置1は、記憶装置及びCPUを備える一般的なコンピュータに、上記各機能部に対応する処理を行うためのプログラムを搭載することにより実現できる。当該プログラムは、メモリやディスク等の記録媒体から上記コンピュータにインストールしてもよいし、ネットワーク上のサーバから上記コンピュータにダウンロードし、インストールすることとしてもよい。   The search control device 1 shown in FIG. 1 can be realized by mounting a program for performing processing corresponding to each of the above functional units on a general computer including a storage device and a CPU. The program may be installed in the computer from a recording medium such as a memory or a disk, or may be downloaded from a server on a network to the computer and installed.

また、検索制御装置1の上記各機能部は、1つのコンピュータ内に備える必要はなく、例えば、上記機能部のうちの1つ又は複数の機能部を有するコンピュータを、複数個ネットワーク接続した構成を、検索制御装置1として用いてもよい。   The functional units of the search control device 1 do not need to be provided in one computer. For example, a configuration in which a plurality of computers having one or a plurality of functional units among the functional units are connected via a network. Alternatively, the search control device 1 may be used.

(システムの動作)
次に、本実施の形態に係る検索システム(主に検索制御装置1)の処理動作を、図2に示す処理の流れに沿って詳細に説明する。なお、図2には、各ステップを実行する処理の主体と、処理に関わる情報を格納する各記憶部が示されている。
(System operation)
Next, the processing operation of the search system (mainly the search control device 1) according to the present embodiment will be described in detail along the flow of processing shown in FIG. Note that FIG. 2 shows a main body of processing for executing each step and each storage unit for storing information related to the processing.

まず、入力部11が、検索利用装置3から検索語を受信し、当該検索語を制御部21を介して検索語記憶部12に格納する(ステップ1)。   First, the input unit 11 receives a search word from the search utilization device 3, and stores the search word in the search word storage unit 12 via the control unit 21 (step 1).

次に、制御部21による制御に基づき、検索クエリ生成部13が検索クエリの生成を行う(ステップ2)。検索クエリ生成部13の処理を、図3のフローチャートを参照して説明する。   Next, based on the control by the control unit 21, the search query generation unit 13 generates a search query (step 2). The processing of the search query generation unit 13 will be described with reference to the flowchart of FIG.

まず、検索クエリ生成部13は、制御部21を介して検索語記憶部12に格納された検索語を読み出す(図3のステップ21)。そして、検索クエリ生成部13は、設定ファイルに設定された区切り文字で指定された表現と一致する箇所で検索語を分割し(ステップ22)、設定ファイルに不要文字列として指定された表現に一致する文字列を検索語から削除し(ステップ23)、これらの処理を施した検索語を検索クエリとして出力し、検索クエリ記憶部14に格納する。(ステップ24)。   First, the search query generation unit 13 reads a search word stored in the search word storage unit 12 via the control unit 21 (step 21 in FIG. 3). Then, the search query generation unit 13 divides the search word at a location that matches the expression specified by the delimiter character set in the setting file (step 22), and matches the expression specified as an unnecessary character string in the setting file. The character string to be deleted is deleted from the search word (step 23), and the search word subjected to these processes is output as a search query and stored in the search query storage unit 14. (Step 24).

例えば、設定ファイルとして図3に示す設定ファイルを使用し、検索語として図4(a)に示す検索語が入力されたものとすると、検索クエリ生成部13は、図4(b)に示す検索クエリを生成し、検索クエリ記憶部14に格納する。   For example, assuming that the setting file shown in FIG. 3 is used as the setting file and the search word shown in FIG. 4A is input as the search word, the search query generation unit 13 performs the search shown in FIG. A query is generated and stored in the search query storage unit 14.

次に、図2のステップ3において、ウェブ検索部15が検索処理を実行する。図5のフローチャートを参照して、ウェブ検索部15の検索処理を説明する。   Next, in Step 3 of FIG. 2, the web search unit 15 executes a search process. The search process of the web search unit 15 will be described with reference to the flowchart of FIG.

まず、ウェブ検索部15は、制御部21を介して検索クエリ記憶部14から検索クエリを読み出す(ステップ31)。そして、ネットワーク4を介して、検索クエリを用いてウェブ検索を行い、HTMLのテキストである検索結果を取得し、更に、検索されたコンテンツ情報の件数(検索件数)も取得する(ステップ32)。   First, the web search unit 15 reads a search query from the search query storage unit 14 via the control unit 21 (step 31). Then, a web search is performed using a search query via the network 4 to acquire a search result that is an HTML text, and further, the number of searched content information (number of searches) is acquired (step 32).

図2のステップ3の後、ウェブ検索部15もしくは制御部21は、検索件数が予め定めた閾値以上がどうか判定する(ステップ4)。判定の結果、検索件数が予め定めた閾値未満であればステップ5に進み、検索件数が閾値以上であれば、ステップ7に進む。   After step 3 in FIG. 2, the web search unit 15 or the control unit 21 determines whether the number of search cases is equal to or greater than a predetermined threshold (step 4). As a result of the determination, if the number of searches is less than a predetermined threshold value, the process proceeds to step 5;

ステップ5において、予備検索実行部16が、ステップ3で使用した検索クエリから複数の予備検索クエリを生成し、複数の予備検索クエリを用いて予備検索結果を取得する予備検索処理を実行する。図6のフローチャートを参照して、予備検索実行部16の処理を詳細に説明する。   In step 5, the preliminary search execution unit 16 generates a plurality of preliminary search queries from the search query used in step 3, and executes a preliminary search process for acquiring preliminary search results using the plurality of preliminary search queries. The process of the preliminary search execution unit 16 will be described in detail with reference to the flowchart of FIG.

まず、予備検索実行部16は、制御部21を介して検索クエリ記憶部14から検索クエリを読み出す(ステップ51)。ここで、読み出された検索クエリに含まれる単語の数をKとする。予備検索実行部16は、K個の単語からなる検索クエリから、当該検索クエリの中のK−1個の単語を含む検索クエリである予備検索クエリを複数個生成し、生成した複数の予備検索クエリを予備検索結果記憶部に格納しておく(ステップ52)。   First, the preliminary search execution unit 16 reads a search query from the search query storage unit 14 via the control unit 21 (step 51). Here, K is the number of words included in the read search query. The preliminary search execution unit 16 generates a plurality of preliminary search queries that are search queries including K-1 words in the search query from a search query including K words, and generates the plurality of preliminary searches. The query is stored in the preliminary search result storage unit (step 52).

例えば、検索クエリが、(「ABCde郷土料理」、「ニッポン全国」、「ぎゅう・とり・ぶう〜」)の3つの単語を有するものであった場合(K=3)、予備検索実行部16は、(「ABCde郷土料理」、「ニッポン全国」)、(「ニッポン全国」、「ぎゅう・とり・ぶう〜」)、及び(「ABCde郷土料理」、「ぎゅう・とり・ぶう〜」)という3つの予備検索クエリを生成する。   For example, when the search query includes three words (“ABCde local cuisine”, “Nippon Nationwide”, “Gyu / Tori / Buu ~”) (K = 3), the preliminary search execution unit 16 ("ABCde local cuisine", "Nippon Nation"), ("Nippon national", "Gyu Tori Buu"), and ("ABCde local cuisine", "Gyu Tori Buu") Three preliminary search queries are generated.

単語の数をK−1とした予備検索クエリを複数生成した後、予備検索実行部16は、生成した複数の予備検索クエリの中の1つの予備検索クエリを用いてウェブ検索を行い、検索結果を得る(ステップ53)。そして、予備検索実行部16は、HTMLで記述されたテキストからなる検索結果の中のHTMLタグを解析し、予め定めた1以上の数であるN個のコンテンツ情報の各々から要約文を抽出する(ステップ54)。   After generating a plurality of preliminary search queries with the number of words as K−1, the preliminary search execution unit 16 performs a web search using one preliminary search query among the generated plurality of preliminary search queries, and the search result Is obtained (step 53). Then, the preliminary search execution unit 16 analyzes the HTML tag in the search result composed of text described in HTML, and extracts a summary sentence from each of N pieces of content information that is a predetermined number of 1 or more. (Step 54).

図7に、ウェブ検索の検索結果をブラウザ表示した場合の例を示す。本実施の形態において、要約文とは、図7の例において四角の枠で囲んだ部分に対応するHTMLテキストであり、コンテンツ情報とは、図7の例の中の下線が引かれたタイトルから、要約文の下にあるURLが記載された行までの情報に対応するHTMLテキストのことである。   FIG. 7 shows an example when the search result of the web search is displayed in the browser. In the present embodiment, the summary sentence is an HTML text corresponding to a portion surrounded by a square frame in the example of FIG. 7, and the content information is from a title underlined in the example of FIG. The HTML text corresponding to the information up to the line where the URL below the summary sentence is described.

図8に、図7の検索結果の最上段にあるコンテンツ情報に対応するHTMLテキストの一部を示す。図8における<div class="abs">から</div>までのテキストが要約文に相当する。予備検索実行部16は、この要約文を、N個のコンテンツ情報から取得することにより、N個の要約文を予備検索結果として取得する。   FIG. 8 shows a part of the HTML text corresponding to the content information at the top of the search result of FIG. The text from <div class = "abs"> to </ div> in FIG. 8 corresponds to a summary sentence. The preliminary search execution unit 16 acquires N summary sentences as preliminary search results by acquiring the summary sentences from the N pieces of content information.

その後、図6のステップ54において、予備検索実行部16は、各要約文に含まれる不要なタグを除去し(ステップ55)、不要なタグを除去した要約文を、予備検索結果として処理対象の予備検索クエリと対応付けて予備検索結果記憶部17に格納する(ステップ56)。予備検索実行部16は、全ての予備検索クエリについての処理が終了するまで、1つづつステップ53からステップ56の処理を実行する(ステップ57)。   Thereafter, in step 54 of FIG. 6, the preliminary search execution unit 16 removes unnecessary tags included in each summary sentence (step 55), and uses the summary sentence from which unnecessary tags are removed as a result of the preliminary search. The data is stored in the preliminary search result storage unit 17 in association with the preliminary search query (step 56). The preliminary search execution unit 16 executes the processing from step 53 to step 56 one by one until the processing for all the preliminary search queries is completed (step 57).

検索クエリが(「ABCde郷土料理」、「ニッポン全国」、「ぎゅう・とり・ぶう〜」)である場合において、上記の処理の結果、予備検索結果記憶部17に格納される予備検索クエリ毎の予備検索結果の例を図9に示す。   When the search query is (“ABCde local cuisine”, “Nippon Nationwide”, “Gyu / Tori / Buu ~”), each preliminary search query stored in the preliminary search result storage unit 17 as a result of the above processing. An example of the preliminary search result is shown in FIG.

次に、図2のステップ6において、制御部21による制御に基づき、予備検索結果評価部18が、予備検索結果評価処理を実行する。図10のフローチャートを参照して、予備検索結果評価部18による予備検索結果評価処理を説明する。   Next, in step 6 of FIG. 2, the preliminary search result evaluation unit 18 executes the preliminary search result evaluation process based on the control by the control unit 21. The preliminary search result evaluation process by the preliminary search result evaluation unit 18 will be described with reference to the flowchart of FIG.

まず、予備検索結果評価部18は、制御部21を介して予備検索結果記憶部17から1つの予備検索クエリに対応する予備検索結果を読み出す(ステップ61)。そして、予備検索結果評価部18は、処理対象の予備検索結果におけるN個の要約文のそれぞれを単語ベクトルに変換する(ステップ62)。ここでの単語とは、名詞、形容詞、形容動詞、動詞、副詞のものを指し、活用形の無い単語はそのまま利用し、活用形のある単語は原形のものを利用する。   First, the preliminary search result evaluation unit 18 reads a preliminary search result corresponding to one preliminary search query from the preliminary search result storage unit 17 via the control unit 21 (step 61). Then, the preliminary search result evaluation unit 18 converts each of the N summary sentences in the processing target preliminary search result into a word vector (step 62). The word here refers to nouns, adjectives, adjective verbs, verbs, and adverbs. Words that do not have a usage form are used as they are, and words that have a usage form use the original form.

例えば、図11(a)に示すようなN=10個の要約文(T〜T10)を有する予備検索結果に対する単語ベクトルとして、図11(b)に示すように10個の単語ベクトルが得られる。 For example, as a word vector for a preliminary search result having N = 10 summary sentences (T 1 to T 10 ) as shown in FIG. 11A, 10 word vectors as shown in FIG. can get.

本実施の形態における単語ベクトルとは、予備検索結果について定めた特定の複数の単語の各々について、要約文における当該単語の有無を0(含まれない)または1(含む)で表現したベクトルである。   The word vector in the present embodiment is a vector in which the presence or absence of the word in the summary sentence is expressed by 0 (not included) or 1 (included) for each of a plurality of specific words defined for the preliminary search result. .

例えば、上記特定の複数の単語が、単語ベクトルの要素の並びの順に、「天気」、「日食」、「キャンプ」、「晴れる」....である場合、図11(a)に示す要約文Tは、「天気」、「日食」という単語を含むため、Tに対してV=(1,1,0,0,…)という単語ベクトルが得られる。 For example, the plurality of specific words are arranged in the order of word vector elements in the order of “weather”, “eclipse”, “camp”, “clear”,. 11, the summary sentence T 1 shown in FIG. 11A includes the words “weather” and “solar eclipse”, so that V 1 = (1,1,0,0,...) With respect to T 1 . Is obtained.

単語ベクトルの生成後、図10のステップ63において、予備検索結果評価部18は、生成された単語ベクトル同士の距離を測り、単語ベクトルのグループ化を行う。つまり、ここでは実質的に、要約文の内容の近さに応じてグループ化が行われる。ここでの処理において、本実施の形態では、2つの単語ベクトル間の距離を以下の式を用いて測る。   After the word vectors are generated, in step 63 of FIG. 10, the preliminary search result evaluation unit 18 measures the distance between the generated word vectors and groups the word vectors. That is, here, grouping is performed substantially according to the content of the summary sentence. In this processing, in this embodiment, the distance between two word vectors is measured using the following equation.

Figure 2011076264
上記の式において、i = 1,2,…N, j = 1,2,…, N, i ≠ jである。wi tは単語tの要素位置における単語ベクトルの値である。例えば、図11の例において、i=1, j=2とすると、t=日食に対して、w1 日食=1、w2 日食=0である。この式は、コサイン距離を求める式であり、0以上1以下の値をとり、2つの単語ベクトルの近さを測る際によく用いられる式である。 より詳細には、2つの単語ベクトルの共通性が高い場合には1に近い値をとり、共通性が低い場合は、0に近い値をとる。2つの単語ベクトル間の共通性が高いということは、単語ベクトルの元となった2つの要約文の内容が似ていると解釈できる。図11(c)に、図11(a)の予備検索結果に対してグループ化をした結果の例を示す。
Figure 2011076264
In the above equation, i = 1, 2,... N, j = 1, 2,. w i t is the value of the word vector at the element position of the word t. For example, in the example of FIG. 11, when i = 1, j = 2, t = relative eclipse is w 1 eclipse = 1, w 2 eclipse = 0. This expression is an expression for obtaining a cosine distance, and is an expression often used when taking a value of 0 or more and 1 or less and measuring the proximity of two word vectors. More specifically, when the commonality between two word vectors is high, a value close to 1 is taken, and when the commonality is low, a value close to 0 is taken. The high commonality between the two word vectors can be interpreted that the contents of the two summary sentences that are the basis of the word vectors are similar. FIG. 11C shows an example of the result of grouping the preliminary search results shown in FIG.

なお、要約文をグループ化する手法は上記の手法に限られるわけでない。要約文の内容の近さに応じてグループ化を行うことができる手法であればどのような手法を用いてもよい。   Note that the method of grouping summary sentences is not limited to the above method. Any technique can be used as long as it can perform grouping according to the closeness of the contents of the summary sentence.

続いて、図10のステップ64において、予備検索結果評価部18は、得られたグループ化結果を用いて、予備検索結果における要約文の内容の異なり度合い(すなわち、予備検索結果の内容の集中度)を評価し(ステップ64)、評価値を対象の予備検索結果に対応する予備検索クエリとともに評価結果格納部19に格納する(ステップ65)。   Subsequently, in step 64 of FIG. 10, the preliminary search result evaluation unit 18 uses the obtained grouping result to determine the degree of difference in the summary sentence content in the preliminary search result (that is, the concentration level of the content of the preliminary search result). ) Is evaluated (step 64), and the evaluation value is stored in the evaluation result storage unit 19 together with the preliminary search query corresponding to the target preliminary search result (step 65).

そして、予備検索結果評価部18は、全ての予備検索結果に対する処理が終了するまで、ステップ61〜ステップ65の処理を繰り返す(ステップ66)。   Then, the preliminary search result evaluation unit 18 repeats the processing from step 61 to step 65 until the processing for all the preliminary search results is completed (step 66).

本実施の形態では、以下の評価式を用いて予備検索結果内の要約文の異なり度合い(予備検索結果の内容の集中度)を評価している。   In the present embodiment, the degree of difference in summary sentences in the preliminary search results (the degree of concentration of the contents of the preliminary search results) is evaluated using the following evaluation formula.

Figure 2011076264
上記の評価式において、Mは、対象とする予備検索結果から生成されたグループの個数、njはグループiに含まれる単語ベクトルの数である。例えば、図11(c)に示す例では、10個の単語ベクトルが4つのグループに分けられており、グループの個数は4である。つまり、N=10, M=4である。また、n1= 2, n2=3, n3=1, n4=4である。
Figure 2011076264
In the above evaluation formula, M is the number of groups generated from the target preliminary search results, and n j is the number of word vectors included in group i. For example, in the example shown in FIG. 11C, ten word vectors are divided into four groups, and the number of groups is four. That is, N = 10 and M = 4. N 1 = 2, n 2 = 3, n 3 = 1, n 4 = 4.

上記の評価式は、情報エントロピーを求めるための式であり、ある事象が起こる確率を用いて事象全体の偏りを評価するための式である。全ての事象が均等に起こる場合に最大値をとり、特定の事象だけが起こる場合に最小値をとる。この性質を利用して、本実施の形態では予備検索結果の内容の偏りを判定している。すなわち、各グループにおける単語ベクトル数のNに対する割合(ni/N (i=1,2,…,M))を、事象の出現確率とみなし、上記の評価式に代入して、予備検索結果の内容の偏りを評価している。 The above evaluation expression is an expression for obtaining information entropy, and is an expression for evaluating the bias of the entire event using the probability that a certain event occurs. The maximum is taken when all events occur equally, and the minimum is taken when only certain events occur. By utilizing this property, the bias of the content of the preliminary search result is determined in the present embodiment. That is, the ratio of the number of word vectors in each group to N (n i / N (i = 1, 2,..., M)) is regarded as the occurrence probability of the event, and is substituted into the above evaluation formula to obtain the preliminary search result. The content bias is evaluated.

例えば、N個の要約文が、ある1つの内容に関するものであれば、グループ化を行うとN個の単語ベクトルは全て1つのグループにまとまる。このとき、M=1,n1/N=1となり、評価式は最小値0をとる。 For example, if N summary sentences are related to one content, when grouping is performed, all N word vectors are grouped into one group. At this time, M = 1, n 1 / N = 1, and the evaluation formula takes the minimum value 0.

逆に、N個の要約文が全て異なる内容であれば、1つの単語ベクトルが1つのグループとなり、N個のグループができる。このとき、M=N, n1/N=1/N, n2/N=1/N,….nM/N=1/Nとなり、評価式の値は最大値1をとる。 On the other hand, if all N summary sentences have different contents, one word vector becomes one group, and N groups are formed. At this time, M = N, n 1 / N = 1 / N, n 2 / N = 1 / N,... N M / N = 1 / N, and the value of the evaluation formula has a maximum value of 1.

より具体的に説明すると、図9に示すような予備検索結果が得られた場合、予備検索結果評価部18は、図12に示す結果を算出し、これを評価結果記憶部19に格納する。図12に示すように、予備検索クエリ:(「ABCde郷土料理」、「ニッポン全国」)に対する評価値が最小である。   More specifically, when a preliminary search result as shown in FIG. 9 is obtained, the preliminary search result evaluation unit 18 calculates the result shown in FIG. 12 and stores it in the evaluation result storage unit 19. As shown in FIG. 12, the evaluation value for the preliminary search query: (“ABCde local cuisine”, “Nippon Nationwide”) is the smallest.

実際に、図9に示すように、予備検索クエリ:(「ABCde郷土料理」、「ニッポン全国」)に対する予備検索結果が、他の予備検索結果に比べて、クエリに関連する内容が多く含まれていることがわかる。予備検索クエリ:(「ニッポン全国」、「ぎゅう・とり・ぶう〜」)については、複数の要約文が予備検索結果として得られているものの、要約文にはクエリとは異なる内容が多く含まれており、内容の集中度が低いため、評価値が高くなっている。   Actually, as shown in FIG. 9, the preliminary search results for the preliminary search query: (“ABCde local cuisine”, “Nippon Nationwide”) contain more contents related to the query than other preliminary search results. You can see that Preliminary search queries: (“Nippon Nationwide”, “Gyu / Tori / Bu ~”), although multiple summary sentences are obtained as preliminary search results, the summary sentences contain many contents that differ from the query. Since the concentration of content is low, the evaluation value is high.

以上の結果から、複数の予備検索結果において、評価式の値が最小となる予備検索結果が、内容の集中度が最も高い予備検索結果であるといえる。なお、内容の集中度を評価する手法は上記の手法に限られるわけでない。内容の集中度を適切に評価できる手法であればどのような手法を用いてもよい。   From the above results, it can be said that the preliminary search result having the smallest evaluation formula value is the preliminary search result having the highest degree of concentration of the contents among the plurality of preliminary search results. Note that the method for evaluating the concentration of contents is not limited to the above method. Any method may be used as long as it can appropriately evaluate the content concentration.

全ての予備検索結果について図10に示すステップ61〜ステップ65の処理が終了すると、予備検索結果評価部18は、評価結果記憶部19から、評価値が最小となった予備検索クエリを読み出し、当該予備検索クエリを、制御部21を介して検索クエリとして検索クエリ記憶部14に格納する(ステップ67)。図12の例では、予備検索クエリ:(「ABCde郷土料理」、「ニッポン全国」)が読み出され、検索クエリ記憶部14に格納される。   When the processing of step 61 to step 65 shown in FIG. 10 is completed for all the preliminary search results, the preliminary search result evaluation unit 18 reads the preliminary search query having the smallest evaluation value from the evaluation result storage unit 19, and The preliminary search query is stored in the search query storage unit 14 as a search query via the control unit 21 (step 67). In the example of FIG. 12, the preliminary search query: (“ABCde local cuisine”, “Nippon Nationwide”) is read and stored in the search query storage unit 14.

その後、図2のステップ3において、ウェブ検索部15は、予備検索結果評価部18により検索クエリ記憶部14に格納された検索クエリを読み出し、ウェブ検索を行う。   Thereafter, in step 3 of FIG. 2, the web search unit 15 reads the search query stored in the search query storage unit 14 by the preliminary search result evaluation unit 18 and performs a web search.

このウェブ検索の結果、ステップ4において、Yesの判定結果が得られれば、出力部20が、検索結果を検索利用装置3に対して出力する(図2のステップ7)。判定結果がNoであれば、今回の検索クエリに基づいて、再びステップ5からの処理が行われる。この処理は、ステップ4において、Yesの判定結果が得られるまで繰り返し行われる。   As a result of this web search, if a Yes determination result is obtained in step 4, the output unit 20 outputs the search result to the search utilization device 3 (step 7 in FIG. 2). If the determination result is No, the processing from step 5 is performed again based on the current search query. This process is repeated until a determination result of Yes is obtained in step 4.

ステップ7の後、検索利用装置3は、例えば、検索結果を利用してメタデータの拡張を行う。また、検索利用装置3が一般的なウェブ検索を行うブラウザを備えたPC端末である場合、当該検索利用装置3は、検索結果の表示を行う。   After step 7, the search using device 3 expands the metadata using the search result, for example. When the search using device 3 is a PC terminal having a browser for performing a general web search, the search using device 3 displays a search result.

(実施の形態の効果)
本実施の形態で説明した検索制御装置1によれば、ある検索語から、内容の集中度の高い検索結果を自動的に取得することができる。
(Effect of embodiment)
According to the search control device 1 described in the present embodiment, a search result with a high concentration of contents can be automatically acquired from a certain search word.

例えば、検索利用装置3として、ウェブ検索を用いたメタデータ拡張用の装置を適用した場合、従来であればウェブ検索に失敗した場合には、コンテンツの管理者が検索語の再入力等の人手による操作を行うことが必要であったところ、本実施の形態の技術では、自動的に再検索を行うので、人手による操作を一切行うことなくメタデータの拡張を適切に行うことができる。   For example, when a metadata expansion device using web search is applied as the search utilization device 3, if the web search fails in the past, the content manager may manually input the search word again. However, since the technique according to the present embodiment automatically performs a re-search, the metadata can be appropriately expanded without any manual operation.

また、例えば、検索利用装置3として、一般的なウェブ検索を行うPC端末を適用した場合、本実施の形態によれば、利用者は検索語の再入力を行うことなく適切な検索結果を迅速に得ることができる。   For example, when a PC terminal that performs a general web search is applied as the search utilization device 3, according to the present embodiment, the user can quickly obtain an appropriate search result without re-entering a search term. Can get to.

本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において、種々変更・応用が可能である。   The present invention is not limited to the above-described embodiments, and various modifications and applications are possible within the scope of the claims.

1 検索制御装置
3 検索利用装置
4 ネットワーク
11 入力部
12 検索語記憶部
13 検索クエリ生成部
14 検索クエリ記憶部
15 ウェブ検索部
16 予備検索実行部
17 予備検索結果記憶部
18 予備検索結果評価部
19 評価結果記憶部
20 出力部
21 制御部
DESCRIPTION OF SYMBOLS 1 Search control apparatus 3 Search utilization apparatus 4 Network 11 Input part 12 Search term memory | storage part 13 Search query production | generation part 14 Search query memory | storage part 15 Web search part 16 Preliminary search execution part 17 Preliminary search result storage part 18 Preliminary search result evaluation part 19 Evaluation result storage unit 20 Output unit 21 Control unit

Claims (8)

ウェブ検索サービスが提供されるネットワークに接続される検索制御装置であって、
入力された検索語から生成された検索クエリに基づき、予備検索クエリを複数個生成し、各予備検索クエリを用いてウェブ検索を行い、当該ウェブ検索の検索結果を、予備検索結果として予備検索クエリ毎に予備検索結果記憶手段に格納する予備検索手段と、
前記予備検索結果記憶手段から予備検索結果を読み出し、当該予備検索結果の内容の集中度を評価する処理を予備検索クエリ毎に実行し、内容の集中度が最も高い予備検索結果に対応する予備検索クエリを、検索クエリとして検索クエリ記憶手段に格納する予備検索結果評価手段と、
前記検索クエリ記憶手段に格納された前記検索クエリを用いてウェブ検索を行い、当該ウェブ検索の検索結果が所定の条件を満たす場合に、当該検索結果を出力するウェブ検索手段と
を備えたことを特徴とする検索制御装置。
A search control device connected to a network provided with a web search service,
A plurality of preliminary search queries are generated based on the search query generated from the input search term, a web search is performed using each preliminary search query, and the search result of the web search is used as a preliminary search query. Preliminary search means for storing in the preliminary search result storage means for each;
A preliminary search result corresponding to the preliminary search result having the highest content concentration is obtained by reading the preliminary search result from the preliminary search result storage unit and executing a process of evaluating the concentration of the content of the preliminary search result for each preliminary search query. Preliminary search result evaluation means for storing the query in the search query storage means as a search query;
Web search means for performing a web search using the search query stored in the search query storage means, and outputting the search result when the search result of the web search satisfies a predetermined condition. A featured search control device.
前記予備検索手段は、複数の単語を含む前記検索クエリから1つの単語を削除し、1つの単語を削除した当該検索クエリを前記予備検索クエリとすることを特徴とする請求項1に記載の検索制御装置。   2. The search according to claim 1, wherein the preliminary search unit deletes one word from the search query including a plurality of words and uses the search query from which one word is deleted as the preliminary search query. Control device. 前記予備検索手段は、前記予備検索クエリに基づく検索結果に含まれる所定数のコンテンツ情報の各々から要約文を抽出し、当該所定数の要約文を前記予備検索結果として前記予備検索結果記憶手段に格納することを特徴とする請求項1または2に記載の検索制御装置。   The preliminary search means extracts a summary sentence from each of a predetermined number of contents information included in a search result based on the preliminary search query, and stores the predetermined number of summary sentences as the preliminary search result in the preliminary search result storage means. The search control device according to claim 1, wherein the search control device stores the search control device. 前記予備検索結果評価手段は、前記所定数の要約文の各々から単語ベクトルを抽出し、当該所定数の単語ベクトルをグループ化し、当該グループ化の結果を用いて前記集中度を評価することを特徴とする請求項3に記載の検索制御装置。   The preliminary search result evaluating means extracts word vectors from each of the predetermined number of summary sentences, groups the predetermined number of word vectors, and evaluates the concentration using the grouping result. The search control device according to claim 3. 前記予備検索結果評価手段は、前記所定数に対する各グループ内の単語ベクトルの数の割合を単語ベクトルの出現確率とし、当該出現確率を用いて情報エントロピーを算出することにより前記集中度を評価することを特徴とする請求項4に記載の検索制御装置。   The preliminary search result evaluating means uses the ratio of the number of word vectors in each group to the predetermined number as the word vector appearance probability, and evaluates the concentration by calculating information entropy using the appearance probability. The search control device according to claim 4. 前記ウェブ検索手段において、前記所定の条件は、前記検索結果に含まれるコンテンツ情報の件数が所定の閾値以上であることであり、
前記検索結果が当該条件を満たさない場合に、前記ウェブ検索手段で用いた検索クエリに基づき、前記予備検索手段、前記予備検索結果評価手段、及び前記ウェブ検索手段による処理を再度実行することを特徴とする請求項1ないし5のうちいずれか1項に記載の検索制御装置。
In the web search means, the predetermined condition is that the number of content information included in the search result is equal to or greater than a predetermined threshold value,
When the search result does not satisfy the condition, the process by the preliminary search unit, the preliminary search result evaluation unit, and the web search unit is executed again based on the search query used by the web search unit. The search control device according to any one of claims 1 to 5.
ウェブ検索サービスが提供されるネットワークに接続される検索制御装置が実行する検索制御方法であって、
入力された検索語から生成された検索クエリに基づき、予備検索クエリを複数個生成し、各予備検索クエリを用いてウェブ検索を行い、当該ウェブ検索の検索結果を、予備検索結果として予備検索クエリ毎に予備検索結果記憶手段に格納する予備検索ステップと、
前記予備検索結果記憶手段から予備検索結果を読み出し、当該予備検索結果の内容の集中度を評価する処理を予備検索クエリ毎に実行し、内容の集中度が最も高い予備検索結果に対応する予備検索クエリを、検索クエリとして検索クエリ記憶手段に格納する予備検索結果評価ステップと、
前記検索クエリ記憶手段に格納された前記検索クエリを用いてウェブ検索を行い、当該ウェブ検索の検索結果が所定の条件を満たす場合に、当該検索結果を出力するウェブ検索ステップと
を備えたことを特徴とする検索制御方法。
A search control method executed by a search control device connected to a network provided with a web search service,
A plurality of preliminary search queries are generated based on the search query generated from the input search term, a web search is performed using each preliminary search query, and the search result of the web search is used as a preliminary search query. A preliminary search step for storing in the preliminary search result storage means for each;
A preliminary search result corresponding to the preliminary search result having the highest content concentration is obtained by reading the preliminary search result from the preliminary search result storage unit and executing a process of evaluating the concentration of the content of the preliminary search result for each preliminary search query. A preliminary search result evaluation step of storing the query as a search query in the search query storage means;
A web search step of performing a web search using the search query stored in the search query storage means and outputting the search result when the search result of the web search satisfies a predetermined condition. A characteristic search control method.
コンピュータを、ウェブ検索サービスが提供されるネットワークに接続される検索制御装置として機能させるプログラムであって、コンピュータを、
入力された検索語から生成された検索クエリに基づき、予備検索クエリを複数個生成し、各予備検索クエリを用いてウェブ検索を行い、当該ウェブ検索の検索結果を、予備検索結果として予備検索クエリ毎に予備検索結果記憶手段に格納する予備検索手段、
前記予備検索結果記憶手段から予備検索結果を読み出し、当該予備検索結果の内容の集中度を評価する処理を予備検索クエリ毎に実行し、内容の集中度が最も高い予備検索結果に対応する予備検索クエリを、検索クエリとして検索クエリ記憶手段に格納する予備検索結果評価手段、
前記検索クエリ記憶手段に格納された前記検索クエリを用いてウェブ検索を行い、当該ウェブ検索の検索結果が所定の条件を満たす場合に、当該検索結果を出力するウェブ検索手段、
として機能させるプログラム。
A program for causing a computer to function as a search control device connected to a network provided with a web search service,
A plurality of preliminary search queries are generated based on the search query generated from the input search term, a web search is performed using each preliminary search query, and the search result of the web search is used as a preliminary search query. Preliminary search means for storing in the preliminary search result storage means for each
A preliminary search result corresponding to the preliminary search result having the highest content concentration is obtained by reading the preliminary search result from the preliminary search result storage unit and executing a process of evaluating the concentration of the content of the preliminary search result for each preliminary search query. Preliminary search result evaluation means for storing the query in the search query storage means as a search query;
Web search means for performing a web search using the search query stored in the search query storage means, and outputting the search result when the search result of the web search satisfies a predetermined condition;
Program to function as.
JP2009225459A 2009-09-29 2009-09-29 Search control apparatus, search control method, and program Active JP5379627B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009225459A JP5379627B2 (en) 2009-09-29 2009-09-29 Search control apparatus, search control method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009225459A JP5379627B2 (en) 2009-09-29 2009-09-29 Search control apparatus, search control method, and program

Publications (3)

Publication Number Publication Date
JP2011076264A true JP2011076264A (en) 2011-04-14
JP2011076264A5 JP2011076264A5 (en) 2012-03-01
JP5379627B2 JP5379627B2 (en) 2013-12-25

Family

ID=44020197

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009225459A Active JP5379627B2 (en) 2009-09-29 2009-09-29 Search control apparatus, search control method, and program

Country Status (1)

Country Link
JP (1) JP5379627B2 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012234133A (en) * 2011-05-09 2012-11-29 Mic Ware:Kk Map output device, map output method, and program
JP2018506113A (en) * 2014-12-30 2018-03-01 マイクロソフト テクノロジー ライセンシング,エルエルシー Distinguish ambiguous expressions to improve the user experience
KR20180078428A (en) * 2016-12-29 2018-07-10 서울대학교산학협력단 Method for estimating updated multiple ranking using pairwise comparison data to additional queries

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH086970A (en) * 1994-06-15 1996-01-12 Ado In Kenkyusho:Kk Information retrieval device
JP2003281183A (en) * 2002-03-20 2003-10-03 Fuji Xerox Co Ltd Document information retrieval device, document information retrieval method and document information retrieval program
JP2005173847A (en) * 2003-12-10 2005-06-30 Fujitsu Ltd Information retrieval device, information retrieval method, program, and recording medium recorded with the program
JP2007172179A (en) * 2005-12-20 2007-07-05 Nec Corp Opinion extraction device, opinion extraction method and opinion extraction program
JP2009015796A (en) * 2007-07-09 2009-01-22 Nippon Telegr & Teleph Corp <Ntt> Apparatus and method for extracting multiplex topics in text, program, and recording medium
WO2009019860A1 (en) * 2007-08-09 2009-02-12 Panasonic Corporation Content retrieval device

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH086970A (en) * 1994-06-15 1996-01-12 Ado In Kenkyusho:Kk Information retrieval device
JP2003281183A (en) * 2002-03-20 2003-10-03 Fuji Xerox Co Ltd Document information retrieval device, document information retrieval method and document information retrieval program
JP2005173847A (en) * 2003-12-10 2005-06-30 Fujitsu Ltd Information retrieval device, information retrieval method, program, and recording medium recorded with the program
JP2007172179A (en) * 2005-12-20 2007-07-05 Nec Corp Opinion extraction device, opinion extraction method and opinion extraction program
JP2009015796A (en) * 2007-07-09 2009-01-22 Nippon Telegr & Teleph Corp <Ntt> Apparatus and method for extracting multiplex topics in text, program, and recording medium
WO2009019860A1 (en) * 2007-08-09 2009-02-12 Panasonic Corporation Content retrieval device

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012234133A (en) * 2011-05-09 2012-11-29 Mic Ware:Kk Map output device, map output method, and program
JP2018506113A (en) * 2014-12-30 2018-03-01 マイクロソフト テクノロジー ライセンシング,エルエルシー Distinguish ambiguous expressions to improve the user experience
US11386268B2 (en) 2014-12-30 2022-07-12 Microsoft Technology Licensing, Llc Discriminating ambiguous expressions to enhance user experience
KR20180078428A (en) * 2016-12-29 2018-07-10 서울대학교산학협력단 Method for estimating updated multiple ranking using pairwise comparison data to additional queries
KR101953839B1 (en) * 2016-12-29 2019-03-06 서울대학교산학협력단 Method for estimating updated multiple ranking using pairwise comparison data to additional queries

Also Published As

Publication number Publication date
JP5379627B2 (en) 2013-12-25

Similar Documents

Publication Publication Date Title
US10235681B2 (en) Text extraction module for contextual analysis engine
US10430806B2 (en) Input/output interface for contextual analysis engine
JP5307417B2 (en) System and method for annotating documents
JP5222581B2 (en) System and method for annotating documents
US8150846B2 (en) Content searching and configuration of search results
US20150106078A1 (en) Contextual analysis engine
US7861151B2 (en) Web site structure analysis
US8402034B2 (en) Using a dynamically-generated content-level newsworthiness rating to provide content recommendations
JP4878624B2 (en) Document processing apparatus and document processing method
US20110302148A1 (en) System and Method for Indexing Food Providers and Use of the Index in Search Engines
JP2010501096A (en) Cooperative optimization of wrapper generation and template detection
CN108021598B (en) Page extraction template matching method and device and server
US20190259040A1 (en) Information aggregator and analytic monitoring system and method
CN107526718B (en) Method and device for generating text
CN103530339A (en) Mobile application information push method and device
BRPI0618997A2 (en) focused search using network addresses
JP5379627B2 (en) Search control apparatus, search control method, and program
JP2020098596A (en) Method, device and storage medium for extracting information from web page
JP2007193697A (en) Information collection apparatus, information collection method and program
JP5200750B2 (en) Information search apparatus, information search method, program, and recording medium
JP5317638B2 (en) Web document main content extraction apparatus and program
JPWO2018056299A1 (en) INFORMATION COLLECTION SYSTEM, INFORMATION COLLECTION METHOD, AND PROGRAM
US9530094B2 (en) Jabba-type contextual tagger
JP2008102790A (en) Retrieval system
JP2010015394A (en) Link destination presentation device and computer program

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120111

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120111

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130527

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130604

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130805

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130903

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130927

R150 Certificate of patent or registration of utility model

Ref document number: 5379627

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250