JP5133946B2 - Information search apparatus and information search method - Google Patents

Information search apparatus and information search method Download PDF

Info

Publication number
JP5133946B2
JP5133946B2 JP2009144827A JP2009144827A JP5133946B2 JP 5133946 B2 JP5133946 B2 JP 5133946B2 JP 2009144827 A JP2009144827 A JP 2009144827A JP 2009144827 A JP2009144827 A JP 2009144827A JP 5133946 B2 JP5133946 B2 JP 5133946B2
Authority
JP
Japan
Prior art keywords
search
genre
query
information
search result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009144827A
Other languages
Japanese (ja)
Other versions
JP2011002972A (en
Inventor
基裕 小間
健吾 海老原
達洋 丹羽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2009144827A priority Critical patent/JP5133946B2/en
Publication of JP2011002972A publication Critical patent/JP2011002972A/en
Application granted granted Critical
Publication of JP5133946B2 publication Critical patent/JP5133946B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、インターネットを利用した情報検索の分野に属し、特に、ユーザによって指定されたクエリに基づいて有用な情報を提供するための情報検索装置及び情報検索方法に関する。 The present invention belongs to the field of information search using the Internet, and particularly relates to an information search apparatus and an information search method for providing useful information based on a query specified by a user.

従来、インターネットを利用した一般的な検索サービスでは、ユーザがクエリ(キーワードなどの検索条件)による検索要求を行うと、これに応答してクエリに適合するウェブページの情報(例えば、タイトル、URL、スニペットなど)が検索結果として提供されるようになっている。このとき、検索結果とともにクエリに関連する情報を提供することが行われている。例えば、検索サービスの他、ショッピング、オークション、天気、ニュース等の様々なジャンルのサービス(以下、プロパティ)を提供するポータルサイトでは、検索結果とともにクエリに関連するポータルサイト内のプロパティに誘導するための情報を提供することが試みられている。
また、特許文献1には、種類キーワード(ジャンルキーワード)と行為キーワード(目的キーワード)からなるクエリを指定することで、ユーザの目的にあった情報を検索できる情報検索方法が開示されている。
Conventionally, in a general search service using the Internet, when a user makes a search request based on a query (a search condition such as a keyword), information on a web page (for example, a title, URL, Snippets) are provided as search results. At this time, information related to the query is provided together with the search result. For example, in a portal site that provides services (hereinafter referred to as properties) of various genres such as shopping, auctions, weather, news, etc. in addition to a search service, to guide to the properties in the portal site related to the query together with the search results Attempts have been made to provide information.
Patent Document 1 discloses an information search method capable of searching for information suitable for a user's purpose by specifying a query including a type keyword (genre keyword) and an action keyword (target keyword).

特開2002−183203号公報JP 2002-183203 A

ところで、インターネットによる検索サービスの利用価値は、情報の豊富さと新しさ(更新頻度の高さ)にあるといえる。つまり、ユーザが検索サービスを利用するのは、時事・流行に応じた旬な情報を入手したい場合が多く、同じクエリにより検索したユーザの検索意図(どのようなジャンルの情報を入手したいかということ)はほぼ同じであると考えることができる。したがって、クエリごとにユーザの検索意図を把握できれば、同じクエリにより検索したユーザに対して、その検索意図に応じた有用な情報を提供することができる。   By the way, it can be said that the use value of the search service by the Internet is rich in information and novelty (high update frequency). In other words, users often use search services because they often want to obtain seasonal information according to current affairs and trends, and the search intent (what genre information they want to obtain) ) Can be considered to be almost the same. Therefore, if the search intention of the user can be grasped for each query, useful information corresponding to the search intention can be provided to the user who has searched by the same query.

しかしながら、従来の検索サービスでは、あるクエリが属するジャンルを一意に決定できないため、クエリに連動してユーザに有用な情報を提供することは困難となっている。
例えば、“ABC”というタイトルの小説が出版された後、テレビドラマ化又は映画化された場合、検索サービスにおいて“ABC”というクエリが指定されると、少なくとも書籍販売、テレビ、映画がこのクエリに関連するジャンルに該当する。このような場合、どのジャンルの情報がユーザにとって有用なのか(検索意図に合致しているか)は、ジャンルに関するクエリが指定されない限り、検索サービス側で判断することは困難である。また、“ABC”というクエリによる大多数のユーザの検索意図は、小説が出版された直後は“書籍販売”、テレビドラマ化された直後は“テレビ”、映画化された直後は”映画”というように、時事・流行に応じて変化することとなる。
However, in the conventional search service, since the genre to which a certain query belongs cannot be determined uniquely, it is difficult to provide useful information to the user in conjunction with the query.
For example, when a novel titled “ABC” is published and then converted into a TV drama or movie, if the query “ABC” is specified in the search service, at least book sales, TV, and movies are included in this query. Corresponds to the related genre. In such a case, it is difficult for the search service side to determine which genre information is useful for the user (whether it matches the search intention) unless a genre query is specified. In addition, the search intention of the majority of users by the query “ABC” is “book sales” immediately after the novel is published, “TV” immediately after being converted into a TV drama, and “movie” immediately after being converted into a movie. As such, it will change according to current events and trends.

一方で、ポータルサイトのプロパティには、サイト内検索可能となっているプロパティがある。このような場合、クエリの使用頻度を解析することで、クエリの盛り上がりを把握することができる。例えば、映画のプロパティにおいて、“ABC”というクエリによる検索頻度が高ければ、“ABC”の映画に関する情報を入手したいユーザが多数いると判断できる。
しかしながら、プロパティによってはサイト内検索可能となっていないプロパティや、サイト内検索の利用頻度が低いプロパティもあるため、プロパティごとにクエリの利用状況の記録(クエリログ)を取っても、単純に比較することはできない。また、プロパティで提供されるサイト内検索を行うユーザは、ネット知識が豊富で自分が入手したい情報を明確に認識している一部のユーザであると考えられる。
したがって、プロパティごとのクエリログを解析しても、世間一般のユーザの検索意図が反映されるとはいえないので、クエリに連動してユーザに有用な情報を提供することは困難となっている。
On the other hand, the properties of the portal site include properties that can be searched within the site. In such a case, the excitement of the query can be grasped by analyzing the frequency of use of the query. For example, in the movie property, if the search frequency by the query “ABC” is high, it can be determined that there are many users who want to obtain information on the movie “ABC”.
However, some properties are not searchable within the site, and some properties are not frequently used for site search, so even if you record the query usage status (query log) for each property, simply compare them. It is not possible. In addition, users who perform site searches provided by properties are considered to be some users who have abundant internet knowledge and clearly recognize the information that they want to obtain.
Therefore, even if the query log for each property is analyzed, it cannot be said that the general user's search intention is reflected, so it is difficult to provide useful information to the user in conjunction with the query.

本発明は、ユーザによって指定されたクエリに連動して有用な情報を提供するために、ユーザの検索意図を適切に判定できるクエリ分析装置、クエリ分析方法及びプログラム、並びに情報検索装置を提供することを目的とする。   The present invention provides a query analysis device, a query analysis method and program, and an information search device that can appropriately determine a user's search intention in order to provide useful information in conjunction with a query specified by the user. With the goal.

上記目的を達成するため、請求項1に記載の発明は、インターネット上で公開されているサイトのドメイン情報を予めジャンル別に分類して登録したサイト分類データベースと、
検索サービスにおいて指定されたクエリに対するクリックログに基づいて、検索結果ごとの選択頻度を算出し、この選択頻度から前記クエリと関連性の高いウェブページを抽出する関連ページ抽出手段と、
前記関連ページ抽出手段により抽出されたそれぞれのウェブページのドメイン情報と、前記サイト分類データベースに登録されたドメイン情報に対応付けられたジャンルに基づいて、前記クエリのジャンルを判定するジャンル決定手段と、
インターネットを介して接続されたクライアント端末からの検索要求を受け付ける検索要求受付手段と、
前記検索要求受付手段により受け付けた検索要求に含まれるクエリに適合するサイトを検索する検索実行手段と、
前記検索実行手段により取得された検索結果を前記クライアント端末に提供する検索結果提供手段と、を備えた情報検索装置であって、
前記検索結果提供手段は、前記ジャンル決定手段により判定されたクエリのジャンルに基づいて、前記検索要求に含まれるクエリのジャンルに関連する情報と前記検索結果とを含む検索結果画面の情報を生成して提供することを特徴とする情報検索装置である。
In order to achieve the above object, the invention described in claim 1 includes a site classification database in which domain information of sites published on the Internet is classified and registered in advance by genre,
A related page extracting means for calculating a selection frequency for each search result based on a click log for a query specified in the search service, and extracting a web page highly relevant to the query from the selection frequency;
Genre determining means for determining the genre of the query based on the domain information of each web page extracted by the related page extracting means and the genre associated with the domain information registered in the site classification database;
Search request accepting means for accepting a search request from a client terminal connected via the Internet;
Search execution means for searching for a site that matches the query included in the search request received by the search request receiving means;
A search result providing means for providing a search result acquired by the search execution means to the client terminal;
The search result providing unit generates information on a search result screen including information related to the genre of the query included in the search request and the search result based on the genre of the query determined by the genre determining unit. It is an information search device characterized by being provided .

請求項2に記載の発明は、請求項1に記載の情報検索装置において、前記関連ページ抽出手段は、前記クリックログを一定期間ごとに取得して、関連ページを抽出することを特徴とする。 According to a second aspect of the present invention, in the information search device according to the first aspect , the related page extracting unit acquires the click log at regular intervals and extracts a related page.

請求項3に記載の発明は、請求項1又は2に記載の情報検索装置において、前記関連ページ抽出手段は、前記選択頻度がしきい値以上のウェブページを抽出することを特徴とする。 According to a third aspect of the present invention, in the information search device according to the first or second aspect, the related page extracting unit extracts a web page having the selection frequency equal to or higher than a threshold value.

請求項4に記載の発明は、請求項1から3のいずれか一項に記載の情報検索装置において、前記ジャンル決定手段は、前記関連ページ抽出手段により抽出されたそれぞれのウェブページを各ジャンルに分類したジャンル分布を算出し、このジャンル分布における分布度に基づいて当該クエリのジャンルを判定することを特徴とする。 According to a fourth aspect of the present invention, in the information search device according to any one of the first to third aspects, the genre determining unit sets each web page extracted by the related page extracting unit to each genre. The classified genre distribution is calculated, and the genre of the query is determined based on the distribution degree in the genre distribution.

請求項5に記載の発明は、請求項1から4のいずれか一項に記載の情報検索装置において、前記クエリのジャンルに関連する情報は、当該クエリのジャンルに対応するプロパティに誘導するための情報であることを特徴とする。 According to a fifth aspect of the present invention, in the information search device according to any one of the first to fourth aspects, information related to the genre of the query is guided to a property corresponding to the genre of the query. It is characterized by being information .

請求項6に記載の発明は、請求項1から5のいずれか一項に記載の情報検索装置において、前記検索結果提供手段は、前記ジャンル決定手段により判定されたクエリのジャンルに基づいて、前記検索実行手段により取得された検索結果の絞込み又は並べ替えを行うことを特徴とするAccording to a sixth aspect of the present invention, in the information search device according to any one of the first to fifth aspects, the search result providing means is based on the genre of the query determined by the genre determining means. The search results acquired by the search execution means are narrowed down or rearranged .

請求項7に記載の発明は、インターネット上で公開されているサイトのドメイン情報を予めジャンル別に分類して登録したサイト分類データベースを備えた情報検索装置における情報検索方法であって、
検索サービスにおいて指定されたクエリに対するクリックログに基づいて、検索結果ごとの選択頻度を算出するステップと、
この選択頻度から前記クエリと関連性の高いウェブページを抽出するステップと、
前記抽出されたそれぞれのウェブページのドメイン情報と、前記サイト分類データベースに登録されたドメイン情報に対応付けられたジャンルに基づいて、前記クエリのジャンルを判定するジャンル決定ステップと、
インターネットを介して接続されたクライアント端末からの検索要求を受け付ける検索要求受付ステップと、
前記検索要求受付ステップで受け付けた検索要求に含まれるクエリに適合するサイトを検索する検索実行ステップと、
前記検索実行ステップで取得された検索結果を前記クライアント端末に提供する検索結果提供ステップと、を有し、
前記検索結果提供ステップにおいて、前記ジャンル決定ステップで判定されたクエリのジャンルに基づいて、前記検索要求に含まれるクエリのジャンルに関連する情報と前記検索結果とを含む検索結果画面の情報を生成して提供することを特徴とする。
The invention according to claim 7 is an information search method in an information search apparatus including a site classification database in which domain information of sites published on the Internet is classified and registered in advance by genre.
Calculating a selection frequency for each search result based on a click log for a query specified in the search service;
Extracting a web page highly relevant to the query from the selection frequency;
A genre determination step of determining a genre of the query based on domain information of each extracted web page and a genre associated with domain information registered in the site classification database;
A search request receiving step for receiving a search request from a client terminal connected via the Internet;
A search execution step of searching for a site that matches a query included in the search request received in the search request reception step;
A search result providing step of providing the client terminal with the search result acquired in the search execution step,
In the search result providing step, based on the genre of the query determined in the genre determination step, information on a search result screen including information related to the genre of the query included in the search request and the search result is generated. It is characterized by providing .

本発明によれば、ユーザがクエリによりどのような情報を入手したいのかを適切に判定できるので、そのクエリに連動して有用な情報を提供することができる。   According to the present invention, it is possible to appropriately determine what information the user wants to obtain through a query, and thus useful information can be provided in conjunction with the query.

本発明に係る情報検索装置を適用したネットワーク構成の一例について示す図である。It is a figure shown about an example of the network structure to which the information retrieval apparatus which concerns on this invention is applied. 検索サーバのクエリ分析装置としての機能を実現するハードウェア構成の一例を示す図である。It is a figure which shows an example of the hardware constitutions which implement | achieve the function as a query analysis apparatus of a search server. サイト分類データベースのデータ構成の一例を示す図である。It is a figure which shows an example of a data structure of a site classification database. クエリ分類データベースのデータ構成の一例を示す図である。It is a figure which shows an example of a data structure of a query classification | category database. 検索データベースのデータ構成の一例を示す図である。It is a figure which shows an example of the data structure of a search database. クリックログデータベースのデータ構成の一例を示す図である。It is a figure which shows an example of a data structure of a click log database. 一般的な検索結果画面の表示例について示す図である。It is a figure shown about the example of a display of a general search result screen. クエリ分析処理の一例について示すフローチャートである。It is a flowchart shown about an example of a query analysis process. 検索処理の一例について示すフローチャートである。It is a flowchart shown about an example of a search process. 本発明が適用された検索結果画面の表示例について示す図である。It is a figure shown about the example of a display of the search result screen to which this invention was applied.

以下、本発明の実施の形態について、図面を参照して詳細に説明する。
図1は、本発明に係る情報検索装置を適用したネットワーク構成の概要について示す図である。本実施形態では、検索サーバ1が本発明に係る情報検索装置を構成している。
図1に示すように、検索サーバ1には、パーソナルコンピュータ2aや携帯端末2b等のクライアント端末2、及び様々な情報を公開しているウェブサーバ3が通信ネットワークNを介して接続され、互いにデータ通信可能となっている。通信ネットワークNは、インターネットや電気通信事業者等の電話回線網、携帯電話通信網等である。
Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
FIG. 1 is a diagram showing an outline of a network configuration to which an information search apparatus according to the present invention is applied. In the present embodiment, the search server 1 constitutes an information search device according to the present invention.
As shown in FIG. 1, a client terminal 2 such as a personal computer 2a or a portable terminal 2b and a web server 3 that discloses various information are connected to the search server 1 via a communication network N, and data is mutually transmitted. Communication is possible. The communication network N is a telephone line network such as the Internet or a telecommunication carrier, a mobile phone communication network, or the like.

図1において、検索サーバ1は、クライアント端末2に対して一般的な検索サービスを提供する。具体的には、クライアント端末2においてクエリによる検索要求がなされると、検索サーバ1は指定されたクエリに適合する検索結果(例えば、ウェブサーバ3が提供するウェブページ等)をクライアント端末2に提供する。そして、クライアント端末2においてユーザが所望の検索結果を選択すると、そのウェブページに遷移するようになっている。
検索サーバ1は、本発明に係るクエリ分析装置1Aとしての機能、及びクエリによる検索を実行する検索エンジン1Bとしての機能を備えている。検索サーバ1にクエリ分析装置1Aとしての機能を設けることで、検索エンジン1Bがクライアント端末2に検索結果を提供するときに、ユーザにとって有用な情報を付加できるようにしている。
In FIG. 1, the search server 1 provides a general search service to the client terminal 2. Specifically, when a search request by a query is made in the client terminal 2, the search server 1 provides the client terminal 2 with a search result (for example, a web page provided by the web server 3) that matches the specified query. To do. When the user selects a desired search result at the client terminal 2, the web page is transitioned to.
The search server 1 has a function as a query analysis apparatus 1A according to the present invention and a function as a search engine 1B that executes a search by a query. By providing the search server 1 with a function as the query analysis device 1A, when the search engine 1B provides a search result to the client terminal 2, information useful for the user can be added.

ここで、検索サーバ1による検索サービスは、例えば、ポータルサイトの1サービスとして提供されるものとする。すなわち、ポータルサイトは、検索サービスの他、ショッピング、オークション、天気、ニュース等の様々なジャンルのサービス(プロパティ)を提供する。そして、本実施形態では、検索サーバ1は、クエリによる検索要求に応答してクエリに適合する検索結果を提供するとともに、クエリが属するジャンルに対応するプロパティに誘導するための情報を提供するようになっている。   Here, the search service by the search server 1 is provided as one service of a portal site, for example. That is, the portal site provides services (properties) of various genres such as shopping, auction, weather, news, etc. in addition to the search service. In the present embodiment, the search server 1 provides a search result that matches the query in response to a search request by the query, and provides information for guiding to a property corresponding to the genre to which the query belongs. It has become.

図2は、検索サーバ1のクエリ分析装置1Aとしての機能を実現するハードウェア構成の一例を示す図である。
図2に示すように、クエリ分析装置1Aは、制御部11、記憶部(補助記憶)12、入出力部13、通信部14、サイト分類データベース15及びクエリ分類データベース16等を備えた一般的なコンピュータによって実現される。各ブロックはバスライン20により電気的に接続されている。
FIG. 2 is a diagram illustrating an example of a hardware configuration that implements the function of the search server 1 as the query analysis device 1A.
As shown in FIG. 2, the query analysis apparatus 1 </ b> A includes a general control unit 11, a storage unit (auxiliary storage) 12, an input / output unit 13, a communication unit 14, a site classification database 15, a query classification database 16, and the like. Realized by computer. Each block is electrically connected by a bus line 20.

制御部11は、演算/制御装置としてのCPU(Central Processing Unit)111、主記憶装置としてのRAM(Random Access Memory)112及びROM(Read Only Memory)113で構成される。
ROM113には、BIOS(Basic Input Output System)と呼ばれるプログラムや基本的な設定データが記憶されている。RAM112には、記憶部12から読み出されたOSや各種アプリケーションなどのプログラムが展開される。
CPU111は、RAM112に展開されたプログラムに従って各種処理を実行し、各ブロックを制御する。
The control unit 11 includes a CPU (Central Processing Unit) 111 as an arithmetic / control device, a RAM (Random Access Memory) 112 and a ROM (Read Only Memory) 113 as a main storage device.
The ROM 113 stores a program called BIOS (Basic Input Output System) and basic setting data. The RAM 112 is loaded with programs such as an OS and various applications read from the storage unit 12.
The CPU 111 executes various processes in accordance with programs developed in the RAM 112 and controls each block.

記憶部12は、例えばハードディスク等で構成され、OS、各種アプリケーションプログラム(例えば、サーバ用プログラムやウェブアプリケーションプログラム)、及び各種データ等が記憶されている。
入出力部13は、検索サーバ1の管理者が利用するためのユーザインターフェースを構成する。
通信部14は、TCP/IP等の通信プロトコルに従って処理を行い、通信ネットワークNを介してクライアント端末2とデータの送受信を行う。
The storage unit 12 includes, for example, a hard disk and stores an OS, various application programs (for example, a server program and a web application program), various data, and the like.
The input / output unit 13 constitutes a user interface for use by the administrator of the search server 1.
The communication unit 14 performs processing according to a communication protocol such as TCP / IP, and transmits / receives data to / from the client terminal 2 via the communication network N.

サイト分類データベース15は、個々のウェブページが属するジャンル、ここではクエリに対応する検索結果が属するジャンルを判定するときに参照される。クエリに対応する検索結果とは、クエリによる検索要求に応答して実行された検索の結果である。このサイト分類データベース15は、例えば、予めポータルサイト運営者によって構築される。
図3は、サイト分類データベースのデータ構成の一例を示す図である。図3に示すように、ジャンルとそのジャンルを代表するウェブサイトのドメイン情報、及びそのジャンルに関する有用な情報(推奨サイト)が対応付けて登録されている。
ここで、ドメイン情報とは、ウェブサイトを公開しているコンピュータ(ウェブサーバ)を識別するための情報である。したがって、同一ウェブサイトを構成するウェブページであれば、URLには同じドメイン情報が含まれることになる。
また、サイト分類データベース15におけるジャンルは、ポータルサイトが提供するプロパティに対応して設けられている。すなわち、図3に示すジャンル“映画”は劇場公開されている話題の映画に関する情報などを提供するプロパティに対応し、“仕事探し”は就職、転職、求人募集に関する情報などを提供するプロパティに対応し、“お笑い”はお笑い芸人のおすすめ動画などを配信するプロパティに対応し、“書籍販売”は出版されている本・雑誌に関する情報の提供及び本・雑誌を販売するプロパティに対応している。
The site classification database 15 is referred to when determining the genre to which each web page belongs, here the genre to which the search result corresponding to the query belongs. The search result corresponding to the query is the result of the search executed in response to the search request by the query. This site classification database 15 is constructed in advance by a portal site operator, for example.
FIG. 3 is a diagram illustrating an example of a data configuration of the site classification database. As shown in FIG. 3, a genre, domain information of a website representing the genre, and useful information (recommended site) regarding the genre are registered in association with each other.
Here, the domain information is information for identifying a computer (web server) that publishes a website. Therefore, the URL includes the same domain information as long as the web pages make up the same website.
Further, the genre in the site classification database 15 is provided corresponding to the property provided by the portal site. That is, the genre “movie” shown in FIG. 3 corresponds to a property that provides information on a topical movie released in the theater, and “job search” corresponds to a property that provides information on job hunting, job change, recruitment, etc. “Comedy” corresponds to a property that distributes recommended videos of comedians, etc., and “Book sale” corresponds to the provision of information about published books and magazines and the property that sells books and magazines.

図3におけるジャンル“映画”について説明すると、代表サイトのドメイン情報として“eiga.com”、“movies.co.jp”、“cinema.co.jp”、・・が登録されている。このようなドメイン情報をURLに含んでいるウェブページ、すなわち、代表サイトを構成しているウェブページは、ジャンル“映画”に分類されることとなる。また、ジャンル“映画”の推奨サイトとして“yah!映画”(ポータルサイトが提供するプロパティ)が登録されている。クライアント端末2からジャンル“映画”に属するクエリによる検索要求がなされたときに、この推奨サイトの情報が提供されることとなる。
なお、ジャンルごとの代表サイトとしては、例えば、そのジャンルに関連する情報を提供しているウェブサイトであってページビューが多いウェブサイトや、主要企業が提供しているウェブサイト(例えば、ジャンル“映画”に対しては映画配給会社のウェブサイトなど)が選定される。
Referring to the genre “movie” in FIG. 3, “eiga.com”, “movies.co.jp”, “cinema.co.jp”,... Are registered as domain information of the representative site. A web page including such domain information in a URL, that is, a web page constituting a representative site is classified into a genre “movie”. In addition, “yah! Movie” (property provided by the portal site) is registered as a recommended site of the genre “movie”. When the client terminal 2 makes a search request based on a query belonging to the genre “movie”, the recommended site information is provided.
The representative site for each genre is, for example, a website that provides information related to the genre and has many page views, or a website provided by a major company (for example, the genre “ A movie distributor's website is selected for “movie”.

図2において、クエリ分類データベース16は、クエリが属するジャンルを判定するときに参照される。このクエリ分類データベース16は、検索エンジン1Bで蓄積されているクリックログに基づいて、後述するクエリ分析処理によって所定期間ごとに更新される。
図4は、クエリ分類データベース16のデータ構成の一例を示す図である。図4に示すように、クエリ別にジャンルとその分布度が登録されている。すなわち、クエリ分類データベース16では、検索サービスにおいて、個々のクエリがどのようなジャンルの情報検索に用いられたかが示される。
In FIG. 2, the query classification database 16 is referred to when determining the genre to which the query belongs. The query classification database 16 is updated at predetermined intervals by a query analysis process described later based on the click log accumulated in the search engine 1B.
FIG. 4 is a diagram illustrating an example of a data configuration of the query classification database 16. As shown in FIG. 4, a genre and its distribution degree are registered for each query. That is, the query classification database 16 indicates what genre information search is used for each query in the search service.

図4におけるクエリ“ABC”について説明すると、映画20%、お笑い5%、書籍販売70%という分布になっている。この分布は、クエリ“ABC”による検索結果から、映画関連のウェブページにアクセスしたユーザが20%、お笑い関連のウェブページにアクセスしたユーザが5%、書籍販売関連のウェブページにアクセスしたユーザが70%であったことを示している。
それぞれのクエリについて分布度が最も高いジャンルが、そのクエリによるユーザの検索意図を表すジャンルであると判断できる。例えば、クエリ“ABC”についていえば、“書籍販売”がクエリ“ABC”によるユーザの検索意図を表している、すなわち書籍を購入(又は購入検討)するために“ABC”というクエリで検索を行ったユーザが最も多かったということになる。
Referring to the query “ABC” in FIG. 4, the distribution is 20% for movies, 5% for comedy, and 70% for book sales. This distribution shows that 20% of users who access movie-related web pages, 5% of users who access comedy-related web pages, and 5% of users who access book sales-related web pages from the search result by the query “ABC”. It shows that it was 70%.
It can be determined that the genre having the highest distribution degree for each query is a genre representing the user's search intention according to the query. For example, for the query “ABC”, “book sale” indicates the user's search intention by the query “ABC”, that is, a search is performed with the query “ABC” in order to purchase (or consider purchasing) a book. This means that there were the most users.

検索サーバ1の検索エンジン1Bとしての機能は、図2に示すクエリ分析装置1Aを実現するハードウェア構成とほぼ同様の構成により実現される。図2におけるサイト分類データベース15及びクエリ分類データベース16の代わりに、検索データベース(図5参照)及びクリックログデータベース(図6参照)を備えている。すなわち、検索エンジン1Bは、制御部11、記憶部(補助記憶)12、入出力部13、通信部14、検索データベース及びクリックログデータベース等を備えた一般的なコンピュータによって実現される。   The function of the search server 1 as the search engine 1B is realized by a configuration substantially similar to the hardware configuration that implements the query analysis device 1A shown in FIG. Instead of the site classification database 15 and the query classification database 16 in FIG. 2, a search database (see FIG. 5) and a click log database (see FIG. 6) are provided. That is, the search engine 1B is realized by a general computer including a control unit 11, a storage unit (auxiliary storage) 12, an input / output unit 13, a communication unit 14, a search database, a click log database, and the like.

図5は、検索データベースのデータ構成の一例を示す図である。
検索データベースは、クエリによる検索要求に応答して情報を検索するときに参照される。この検索データベースには、個々のクエリに対して、このクエリに適合する複数のウェブページが登録されている。例えば、データ収集プログラムがインターネット上を巡回して公開されているウェブページを自動収集し、収集したウェブページを登録することによって検索データベースが構築される。
FIG. 5 is a diagram illustrating an example of a data structure of the search database.
The search database is referred to when searching for information in response to a search request by a query. In this search database, a plurality of web pages that match this query are registered for each query. For example, a search database is constructed by automatically collecting web pages that are opened by a data collection program that circulates on the Internet and registering the collected web pages.

図5に示すように、検索データベースは、例えばインデックス部IDXとデータベース部DBで構成されている。
インデックス部IDXには、キーワードごとにウェブIDが登録されている。図5(a)では、キーワード“YAH”に対してウェブID“#01,#02,#11,・・”が登録され、キーワード“XYZ”に対してウェブID“#21,#03,#211,・・”が登録されている。
データベース部DBにはウェブIDごとに、例えばウェブページのタイトル、URL、サイト説明(本文の抜粋、スニペット)などが登録されている。なお、データベース部DBに含まれるデータはこれに限定されず、検索結果としてクライアント端末2に提供する内容(例えば、画像ファイル等)が適宜登録されている。図5(b)では、ウェブID“#01”の内容として、タイトル“YAH!Japan”、URL“http://www.yah.co.jp”、“最大級のポータルサイト!・・”という説明が登録されている。
As shown in FIG. 5, the search database is composed of, for example, an index part IDX and a database part DB.
In the index part IDX, a web ID is registered for each keyword. In FIG. 5A, web IDs “# 01, # 02, # 11,...” Are registered for the keyword “YAH”, and web IDs “# 21, # 03, #” are registered for the keyword “XYZ”. 211, ... "are registered.
For example, a web page title, URL, site description (extract of text, snippet), and the like are registered in the database unit DB for each web ID. Note that the data included in the database unit DB is not limited to this, and contents (for example, image files) provided to the client terminal 2 as search results are registered as appropriate. In FIG. 5B, the contents of the web ID “# 01” are the title “YAH! Japan”, the URL “http://www.yah.co.jp”, and “the largest portal site! The description is registered.

図6は、クリックログデータベースのデータ構成の一例を示す図である。
クリックログデータベースには、クエリごとに、そのクエリに対応する検索結果の中から選択(クリック)されたウェブページ及びクリック日時が逐一記録されて蓄積される。図6では、例えば、クエリ“ABC”による検索結果の中から“URL1”のウェブページが“2009/06/06/10:00”に選択されたこと、“URL2”のウェブページが“2009/06/06/12:30”に選択されたこと等々が記録されている。このクリックログデータベースを利用して、ウェブページごとのクリック率(CTR,クリック回数÷表示回数)を算出することができる。
FIG. 6 is a diagram illustrating an example of the data configuration of the click log database.
In the click log database, for each query, the web page selected from the search result corresponding to the query and the click date and time are recorded and stored one by one. In FIG. 6, for example, the “URL1” web page is selected as “2009/06/06/10: 00: 00” from the search result by the query “ABC”, and the “URL2” web page is “2009 / “06/06/12: 30” is selected and the like are recorded. Using this click log database, the click rate (CTR, number of clicks / number of displays) for each web page can be calculated.

検索サーバ1のクエリ分析装置1A及び検索エンジン1Bとしての機能は、上述した構成により実現されている。すなわち、検索エンジン1Bとしての検索サーバ1のCPU111は、サーバ用ソフトウェアを実行することにより、クライアント端末2で起動されたウェブブラウザからの検索要求に応答してウェブページの検索を実行し、検索結果を提供する。クライアント端末2において検索結果の選択が行われると、このクリック状況をクリックログに記録する。
例えば、図7(a)に示すように、検索窓に“ABC”と入力されクエリ“ABC”による検索要求がなされると、検索データベースを参照して適合するウェブページを抽出し、検索結果をクライアント端末2に提供する。図7(a)では、クエリ“ABC”による検索結果として、(1)ドラマ“ABC”に関する情報が公開されているウェブページ、(2)小説“ABC”に関する情報が公開されているウェブページ、(3)小説“ABC”を購入できる書籍販売のウェブページが提供されている。
図7(a)に示す検索結果画面において、(3)書籍販売のウェブページが選択されると、図7(b)に示す書籍販売のウェブページに遷移する。このとき、検索結果の中から書籍販売のウェブページがクリックされたことを示すクリックログが記録される。
The functions of the search server 1 as the query analysis device 1A and the search engine 1B are realized by the above-described configuration. That is, the CPU 111 of the search server 1 as the search engine 1B executes server software to execute a search for a web page in response to a search request from a web browser activated on the client terminal 2, and the search result I will provide a. When a search result is selected in the client terminal 2, this click status is recorded in the click log.
For example, as shown in FIG. 7A, when “ABC” is entered in the search window and a search request by the query “ABC” is made, a matching web page is extracted by referring to the search database, and the search result is displayed. Provided to the client terminal 2. In FIG. 7A, as a search result by the query “ABC”, (1) a web page on which information on the drama “ABC” is disclosed, (2) a web page on which information on the novel “ABC” is disclosed, (3) A book sales web page is provided where the novel “ABC” can be purchased.
When a (3) book sales web page is selected on the search result screen shown in FIG. 7 (a), a transition is made to the book sales web page shown in FIG. 7 (b). At this time, a click log indicating that the book sales web page is clicked from the search result is recorded.

さらに本実施形態では、クエリ分析装置1Aとしての検索サーバ1のCPU111が、検索エンジン1Bにより生成されるクリックログに基づいてクエリのジャンル分布を解析し、クエリのジャンルを判定するようになっている。これにより、クエリによる検索要求がなされたときに、検索結果とともにクエリに関連する有用な情報を提供することが可能となる。   Furthermore, in the present embodiment, the CPU 111 of the search server 1 as the query analysis device 1A analyzes the genre distribution of the query based on the click log generated by the search engine 1B, and determines the genre of the query. . Thereby, when a search request by a query is made, it is possible to provide useful information related to the query together with the search result.

図8は、検索サーバ1におけるクエリ分析処理の一例について示すフローチャートである。このクエリ分析処理がクエリ分析装置1Aとしての機能に他ならない。このクエリ分析処理は、所定期間ごとに実行されるようになっている。
ステップS101では、クリックログデータベース(図6参照)からクエリごとに蓄積されたクリックログを取得する。なお、図6では省略しているが、クリックログデータベースには、検索結果の累積表示回数も記録されている。
ステップS102では、個々のクエリについて、検索結果ごと、すなわちウェブページ(URL)ごとにクリック率を算出する。具体的には、クリックログに記録されているウェブページごとのクリック回数を、当該クエリの検索結果として表示された回数で除算した値がクリック率となる。クリック率が高いほどユーザによる選択頻度が高いウェブページとなる。
FIG. 8 is a flowchart illustrating an example of query analysis processing in the search server 1. This query analysis process is nothing but the function as the query analysis apparatus 1A. This query analysis process is executed every predetermined period.
In step S101, the click log accumulated for each query is acquired from the click log database (see FIG. 6). Although omitted in FIG. 6, the click log database also records the cumulative number of search results.
In step S102, a click rate is calculated for each search result, that is, for each web page (URL) for each query. Specifically, the click rate is obtained by dividing the number of clicks for each web page recorded in the click log by the number of times displayed as the search result of the query. The higher the click rate, the more frequently the web page is selected by the user.

ステップS103では、クエリごとにクリック率の高いウェブページ、例えばクリック率が上位所定数分のウェブページ又はクリック率がしきい値以上のウェブページを抽出する。つまり、クエリに対応する検索結果の中でユーザの選択頻度が高いウェブページが、当該クエリによるユーザの検索意図を反映しているウェブページとなるのでこのようなウェブページを抽出する。
ステップS104では、ステップS103で抽出したウェブページのURLからドメイン情報を特定する。例えば、抽出したウェブページのURLが“http://www.eiga.com/roadshow/featured/ABC・・”であれば、“eiga.com”の部分をドメイン情報として特定する。このドメイン情報は、例えば、URLの記述に基づいて‘/’の位置に基づいて特定してもよいし、正規表現を用いて特定することとしてもよい。
In step S103, a web page with a high click rate for each query, for example, a web page with a predetermined number of click rates or a web page with a click rate equal to or higher than a threshold is extracted. That is, since a web page with a high user selection frequency in the search result corresponding to the query is a web page reflecting the user's search intention according to the query , such a web page is extracted.
In step S104, domain information is specified from the URL of the web page extracted in step S103. For example, if the URL of the extracted web page is “http://www.eiga.com/roadshow/featured/ABC...”, The “eiga.com” portion is specified as domain information. For example, the domain information may be specified based on the position of “/” based on the description of the URL, or may be specified using a regular expression.

ステップS105では、サイト分類データベース15を参照して、ステップS104で特定したドメインが属するジャンルを判定する。つまり、ステップS103で抽出したウェブページが属するジャンルを、そのドメイン情報に基づいて判定する。例えば、特定したドメイン情報が“eiga.com”となる場合、図3に示すサイト分類データベース15に従うと、このドメインが属するジャンルは“映画”となる。したがって、ドメイン情報として“eiga.com”がURLに含まれているウェブページのジャンルは“映画”となる。URLの細部が異なっていてもドメイン情報が同じであれば、同じジャンルに分類されることとなる。
ステップS103で抽出したウェブページのすべてについて、これらが属するジャンルを判定する。ステップS105までの処理により、クエリによるユーザの検索意図を反映しているウェブページ(クリック率の高いウェブページ)がどのジャンルに属するか判定されることとなる。
In step S105, the genre to which the domain specified in step S104 belongs is determined with reference to the site classification database 15. That is, the genre to which the web page extracted in step S103 belongs is determined based on the domain information. For example, when the identified domain information is “eiga.com”, according to the site classification database 15 shown in FIG. 3, the genre to which this domain belongs is “movie”. Therefore, the genre of the web page in which “eiga.com” is included in the URL as domain information is “movie”. If the domain information is the same even if the URL details are different, the URLs are classified into the same genre.
For all the web pages extracted in step S103, the genre to which these belong is determined. By the processing up to step S105, it is determined to which genre the web page (web page with a high click rate) reflecting the user's search intention by the query belongs.

ステップS106では、クエリごとにジャンル分布を算出する。具体的には、各ジャンルに属するウェブページを計数し、それに基づいて分布度(ジャンル別の計数値/全ジャンルの計数値)を算出する。このとき、ウェブページごとのクリック率により重み付けして分布度を算出するようにしてもよい。
ステップS107では、算出したジャンル分布をクエリ分類データベース16に反映して更新する。クエリ分類データベースに登録されているクエリごとのジャンル分布により、そのクエリが属するジャンル、すなわちそのクエリによるユーザの検索意図を適切に把握することができる。
例えば、“ABC”というタイトルの小説が出版された後、テレビドラマ化又は映画化された場合、検索サービスにおいて“ABC”というクエリが指定されると、少なくとも書籍販売、テレビ、映画がこのクエリに関連するジャンルに該当する。このような場合であっても、クエリ“ABC”による検索意図を適切に把握することができる。
例えば、映画化された直後には、クエリ“ABC”によるジャンル分布において“映画”が大きな割合を占めることとなるので、クエリ“ABC”の映画に関する情報を検索したいというユーザの検索意図を認識できる。すなわち、時事・流行に応じてクエリによるユーザの検索意図が変化した場合に対応することができる。
In step S106, a genre distribution is calculated for each query. Specifically, the web pages belonging to each genre are counted, and the distribution degree (count value for each genre / count value for all genres) is calculated based thereon. At this time, the distribution degree may be calculated by weighting the click rate for each web page.
In step S107, the calculated genre distribution is reflected in the query classification database 16 and updated. Based on the genre distribution for each query registered in the query classification database, the genre to which the query belongs, that is, the user's search intention by the query can be appropriately grasped.
For example, when a novel titled “ABC” is published and then converted into a TV drama or movie, if the query “ABC” is specified in the search service, at least book sales, TV, and movies are included in this query. Corresponds to the related genre. Even in such a case, it is possible to appropriately grasp the search intention by the query “ABC”.
For example, immediately after being converted into a movie, since “movie” occupies a large proportion in the genre distribution by the query “ABC”, it is possible to recognize the user's search intention to search for information related to the movie of the query “ABC”. . That is, it is possible to cope with a case where the user's search intention by the query changes according to current affairs / fashion.

このように、実施形態に係るクエリ分析装置としての検索サーバ1は、インターネット上で公開されているサイトのドメイン情報を予めジャンル別に分類して登録したサイト分類データベース(15)と、検索サービスにおいて指定されたクエリに対するクリックログに基づいて、検索結果ごとの選択頻度(クリック率)を算出し、この選択頻度からクエリと関連性の高いウェブページを抽出する関連ページ抽出手段(図8のステップS102,S103)と、関連ページ抽出手段により抽出されたそれぞれのウェブページのドメイン情報と、サイト分類データベースに登録されたドメイン情報に対応付けられたジャンルに基づいて、クエリのジャンルを判定するジャンル決定手段(図8のステップS104〜S106)と、を備えている。   As described above, the search server 1 as a query analysis apparatus according to the embodiment includes a site classification database (15) in which domain information of sites published on the Internet is classified and registered in advance by genre, and designated in the search service. Based on the click log for the query that has been made, the selection frequency (click rate) for each search result is calculated, and related page extraction means for extracting a web page highly relevant to the query from this selection frequency (step S102 in FIG. 8, S103), genre determining means for determining the genre of the query based on the domain information of each web page extracted by the related page extracting means and the genre associated with the domain information registered in the site classification database ( Steps S104 to S106) of FIG.

これにより、クエリによるユーザの検索意図(検索傾向、どのジャンルの情報を入手したいか)を示すクリックログに基づいて、当該クエリと関連性の高いジャンル、つまりユーザがクエリによりどのような情報を入手したいのかを適切に判定できるので、そのクエリに連動して有用な情報を提供することができる。また、ドメイン情報を利用してジャンルを特定するので、サイト分類データベース15の構築が簡単(ウェブページごとのURLを登録しておく必要はない)で、検索結果の中から選択されたウェブページがいずれかのジャンルに属する可能性も高くなる。したがって、クリックログに基づく正確なクエリの分析が可能となり、クエリのジャンルを適切に決定することができる。   Thus, based on the click log indicating the user's search intention (search tendency, which genre information he / she wants to obtain) based on the query, the genre highly relevant to the query, that is, what information the user obtains by the query It is possible to appropriately determine whether the user wants to do so, so that useful information can be provided in conjunction with the query. Moreover, since the genre is specified using the domain information, the construction of the site classification database 15 is easy (there is no need to register the URL for each web page), and the web page selected from the search result is The possibility of belonging to any genre increases. Therefore, an accurate query analysis based on the click log can be performed, and the genre of the query can be appropriately determined.

また、検索サーバ1が備える関連ページ抽出手段は、クリックログを一定期間ごとに取得して、関連ページを抽出する。すなわち、図8に示すクエリ分析処理は、一定期間ごとに更新される。これにより、時々刻々と変化するクリックログに基づいてクエリのジャンルが判定されることとなるので、時事・流行に応じてクエリによるユーザの検索意図が変化しても、現時点で最適なクエリのジャンルを判定することができる。   Moreover, the related page extraction means with which the search server 1 is provided acquires a click log for every fixed period, and extracts a related page. That is, the query analysis process shown in FIG. 8 is updated at regular intervals. As a result, the genre of the query is determined based on the click log that changes from moment to moment. Therefore, even if the user's search intention by the query changes according to current events and trends, the genre of the query that is currently optimal Can be determined.

さらに、検索サーバ1が備える関連ページ抽出手段は、選択頻度がしきい値以上の(検索意図が表れていると考えられる)ウェブページを抽出する。すなわち、クエリによるユーザの検索意図が表れていると考えられる場合にだけ、そのウェブページを抽出して分析するようにしている。これにより、判定されたクエリのジャンルが的外れなものとなるのを防止できる。   Further, the related page extracting means included in the search server 1 extracts a web page whose selection frequency is equal to or higher than a threshold value (it is considered that the search intention appears). In other words, the web page is extracted and analyzed only when it is considered that the user's search intention by the query appears. Thereby, it is possible to prevent the determined query genre from being inappropriate.

またさらに、検索サーバ1が備えるジャンル決定手段は、関連ページ抽出手段により抽出されたそれぞれのウェブページを各ジャンルに分類したジャンル分布を算出し、このジャンル分布における分布度に基づいて当該クエリのジャンルを判定する。これにより、ジャンル分布を考慮したうえでクエリのジャンルを適切に判定でき、例えば、分布度が突出しているジャンルが複数あるときには、この複数のジャンルをクエリのジャンルとして判定することもできる。   Furthermore, the genre determining means provided in the search server 1 calculates a genre distribution in which each web page extracted by the related page extracting means is classified into each genre, and based on the distribution degree in the genre distribution, the genre of the query Determine. Accordingly, it is possible to appropriately determine the genre of the query in consideration of the genre distribution. For example, when there are a plurality of genres having a prominent distribution degree, the plurality of genres can be determined as the genre of the query.

図9は、検索サーバ1における検索処理の一例について示すフローチャートである。この検索処理が検索エンジン1Bとしての機能に他ならない。
ステップS201では、クライアント端末2からクエリによる検索要求があったか否かを判定する。具体的には、クライアント端末2において起動されたウェブブラウザにより、検索サーバ1により提供される検索サービス(例えば、ポータルサイトのトップページ)にアクセスされ、検索窓にクエリが入力されて検索を指示する操作(検索ボタンのクリック操作)が行われると、検索サーバ1に対してクエリによる検索要求が送信される。ステップS201では、この検索要求の有無を判定することとなる。そして、クライアント端末2から検索要求があったと判定した場合はステップS202に移行し、検索要求がないと判定した場合は処理を終了する。
FIG. 9 is a flowchart illustrating an example of search processing in the search server 1. This search process is nothing but the function as the search engine 1B.
In step S201, it is determined whether or not there is a search request by a query from the client terminal 2. Specifically, a search service provided by the search server 1 (for example, a top page of a portal site) is accessed by a web browser activated on the client terminal 2, and a query is input to the search window to instruct a search. When an operation (click operation of the search button) is performed, a search request by a query is transmitted to the search server 1. In step S201, the presence / absence of this search request is determined. If it is determined that there is a search request from the client terminal 2, the process proceeds to step S202. If it is determined that there is no search request, the process ends.

ステップS202では、検索要求に含まれるクエリを取得する。
ステップS203では、検索データベースを参照して、クエリに適合するウェブページを検索結果として抽出する。例えば、クエリ“YAH”が指定された場合、図5に示す検索データベースに従うと、ウェブID“#01,#02,・・”に対応するウェブページ、すなわち“YAH!Japan”や“YAHメール”などがクエリ“YAH”に適合するウェブページとして抽出される。
ステップS204では、クエリ分類データベース16を参照して、クエリのジャンルを取得する。例えば、クエリ“ABC”が指定された場合、図4に示すクエリ分類データベースに従うと、分布度が最も高い“書籍販売”というジャンルが取得される。
In step S202, a query included in the search request is acquired.
In step S203, referring to the search database, a web page that matches the query is extracted as a search result. For example, when the query “YAH” is specified, according to the search database shown in FIG. 5, the web page corresponding to the web ID “# 01, # 02,...”, That is, “YAH! Japan” or “YAH mail”. Are extracted as web pages that match the query “YAH”.
In step S204, the genre of the query is acquired with reference to the query classification database 16. For example, when the query “ABC” is designated, according to the query classification database shown in FIG. 4, the genre “book sales” having the highest distribution is acquired.

ステップS205では、抽出した検索結果を含めて提供する情報を編集し、検索結果画面を生成する。このとき、ステップS204で取得されたクエリのジャンルに関連する情報であって、ユーザに有用な情報(例えば、クエリのジャンルに対応するプロパティに誘導するための情報)を検索結果画面において提供する。本実施形態では、クエリ分析装置1Aによりクエリのジャンルが判定されているので、このような情報の提供が可能となる。
例えば、クエリ“ABC”のジャンルが“書籍販売”となっていれば、ポータルサイトが提供する書籍販売のプロパティに誘導するための情報をサイト分類データベース15から読み出して、検索結果画面内に配置する。
In step S205, the provided information including the extracted search result is edited to generate a search result screen. At this time, information related to the genre of the query acquired in step S204 and useful to the user (for example, information for guiding to a property corresponding to the genre of the query) is provided on the search result screen. In the present embodiment, since the genre of the query is determined by the query analysis device 1A, such information can be provided.
For example, if the genre of the query “ABC” is “book sales”, information for guiding to the property of book sales provided by the portal site is read from the site classification database 15 and arranged in the search result screen. .

ステップS206では、検索要求したクライアント端末2に対して検索結果画面のファイルを送信する。クライアント端末2のウェブブラウザ上では、クエリによる検索結果と、クエリのジャンルに対応するプロパティに誘導するための情報を含んで構成された検索結果画面が表示されることとなる(図10参照)。
ステップS207では、検索結果画面においてユーザが検索結果を選択する操作を行ったか否かを判定する。そして、検索結果が選択されたと判定した場合はステップS208に移行し、検索結果が選択されないと判定した場合は処理を終了(又は選択されるまで待機)する。
ステップS208では、指定されたクエリに対応するクリックログに、選択された検索結果とその日時を記録する。
In step S206, the search result screen file is transmitted to the client terminal 2 that requested the search. On the web browser of the client terminal 2, a search result screen including a search result by the query and information for guiding to a property corresponding to the genre of the query is displayed (see FIG. 10).
In step S207, it is determined whether or not the user has performed an operation of selecting a search result on the search result screen. If it is determined that the search result is selected, the process proceeds to step S208. If it is determined that the search result is not selected, the process ends (or waits until it is selected).
In step S208, the selected search result and the date and time are recorded in the click log corresponding to the designated query.

例えば、図10に示すように、クエリ“ABC”による検索要求がなされると、ウェブ検索結果の他に、おすすめサイトとしてポータルサイトが提供する書籍販売プロパティに誘導するための広告情報が提供される。なお、図10に示す広告情報は、サイト分類データベース15にて特定される推奨サイトにおいて、クエリ“ABC”で検索したサイト内検索の検索結果である。この広告情報が選択されると、書籍販売プロパティで小説“ABC”を紹介し、容易に購入可能となっているウェブページに遷移することとなる。クエリ“ABC”により小説“ABC”を購入するための情報を検索しようとしていたユーザにとっては、極めて有用な情報となる。   For example, as shown in FIG. 10, when a search request by the query “ABC” is made, advertisement information for guiding to a book sales property provided by the portal site as a recommended site is provided in addition to the web search result. . Note that the advertisement information shown in FIG. 10 is a search result of an in-site search that is searched by the query “ABC” in the recommended site specified in the site classification database 15. When this advertisement information is selected, the novel “ABC” is introduced in the book sales property, and a transition is made to a web page that can be easily purchased. This is extremely useful information for a user who is searching for information for purchasing the novel “ABC” by the query “ABC”.

このように、情報検索装置としての検索サーバ1は、クエリ分析装置(1A)と、インターネットを介して接続されたクライアント端末(2)からの検索要求を受け付ける検索要求受付手段(図9のステップS201,S202)と、検索要求受付手段により受け付けた検索要求に含まれるクエリに適合するサイトを検索する検索実行手段(ステップS203)と、検索実行手段により取得された検索結果(ウェブ検索結果)をクライアント端末に提供する検索結果提供手段(ステップS204〜S206)と、を備えて構成されている。
そして、検索結果提供手段は、クエリ分析装置により決定されたクエリのジャンルに基づいて検索結果を編集して提供する。具体的には、クエリのジャンルに対応するプロパティに誘導するための情報を検索結果に追加する。
As described above, the search server 1 as an information search device includes a query analysis device (1A) and search request reception means for receiving a search request from a client terminal (2) connected via the Internet (step S201 in FIG. 9). , S202), search execution means for searching for a site matching the query included in the search request received by the search request reception means (step S203), and the search result (web search result) acquired by the search execution means as the client Search result providing means (steps S204 to S206) provided to the terminal.
The search result providing means edits and provides the search result based on the genre of the query determined by the query analysis device. Specifically, information for guiding to the property corresponding to the genre of the query is added to the search result.

これにより、クエリによる検索に伴い、ユーザに有用な情報が効果的に提供されることとなるので、ユーザにとって利便性に優れた検索サービスが実現される。一方、検索サービスを提供するポータルサイトにとっては、ユーザに有用な自社サイト(プロパティ)を推薦することにより潜在的な顧客を誘導することができるので、新規顧客の獲得に有効であるとともに、広告効果も期待できる。   As a result, useful information is effectively provided to the user in accordance with the search by the query, so that a search service excellent in convenience for the user is realized. On the other hand, portal sites that provide search services can guide potential customers by recommending their own sites (property) that are useful to users, which is effective in acquiring new customers and advertising effectiveness. Can also be expected.

以上、本発明者によってなされた発明を実施形態に基づいて具体的に説明したが、本発明は上記実施形態に限定されるものではなく、その要旨を逸脱しない範囲で変更可能である。
例えば、上記実施形態では、検索結果の編集の一例として、クエリのジャンルに対応するプロパティに誘導するための情報を検索結果に追加する場合について説明したが、クエリのジャンルに基づいて検索結果の絞込み又は並び替えを行うようにしてもよい。
As mentioned above, although the invention made by this inventor was concretely demonstrated based on embodiment, this invention is not limited to the said embodiment, It can change in the range which does not deviate from the summary.
For example, in the above embodiment, as an example of editing the search result, a case has been described in which information for guiding to a property corresponding to the query genre is added to the search result. However, the search result is narrowed down based on the query genre. Alternatively, rearrangement may be performed.

今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。   The embodiment disclosed this time should be considered as illustrative in all points and not restrictive. The scope of the present invention is defined by the terms of the claims, rather than the description above, and is intended to include any modifications within the scope and meaning equivalent to the terms of the claims.

1 検索サーバ(クエリ分析装置、情報検索装置)
2 クライアント端末
3 ウェブサーバ
N 通信ネットワーク
11 制御部(関連ページ抽出手段、ジャンル判定手段、検索要求受付手段、検索実行手段、検索結果提供手段)
12 記憶部
13 入出力部
14 通信部
15 サイト分類データベース
16 クエリ分類データベース
20 バスライン
1 Search server (query analysis device, information search device)
2 Client terminal 3 Web server N Communication network 11 Control unit (related page extracting means, genre determining means, search request receiving means, search executing means, search result providing means)
12 storage unit 13 input / output unit 14 communication unit 15 site classification database 16 query classification database 20 bus line

Claims (7)

インターネット上で公開されているサイトのドメイン情報を予めジャンル別に分類して登録したサイト分類データベースと、
検索サービスにおいて指定されたクエリに対するクリックログに基づいて、検索結果ごとの選択頻度を算出し、この選択頻度から前記クエリと関連性の高いウェブページを抽出する関連ページ抽出手段と、
前記関連ページ抽出手段により抽出されたそれぞれのウェブページのドメイン情報と、前記サイト分類データベースに登録されたドメイン情報に対応付けられたジャンルに基づいて、前記クエリのジャンルを判定するジャンル決定手段と、
インターネットを介して接続されたクライアント端末からの検索要求を受け付ける検索要求受付手段と、
前記検索要求受付手段により受け付けた検索要求に含まれるクエリに適合するサイトを検索する検索実行手段と、
前記検索実行手段により取得された検索結果を前記クライアント端末に提供する検索結果提供手段と、を備えた情報検索装置であって、
前記検索結果提供手段は、前記ジャンル決定手段により判定されたクエリのジャンルに基づいて、前記検索要求に含まれるクエリのジャンルに関連する情報と前記検索結果とを含む検索結果画面の情報を生成して提供することを特徴とする情報検索装置。
A site classification database in which domain information of sites published on the Internet is classified and registered in advance by genre,
A related page extracting means for calculating a selection frequency for each search result based on a click log for a query specified in the search service, and extracting a web page highly relevant to the query from the selection frequency;
Genre determining means for determining the genre of the query based on the domain information of each web page extracted by the related page extracting means and the genre associated with the domain information registered in the site classification database;
Search request accepting means for accepting a search request from a client terminal connected via the Internet;
Search execution means for searching for a site that matches the query included in the search request received by the search request receiving means;
A search result providing means for providing a search result acquired by the search execution means to the client terminal;
The search result providing unit generates information on a search result screen including information related to the genre of the query included in the search request and the search result based on the genre of the query determined by the genre determining unit. An information retrieval device characterized by being provided.
前記関連ページ抽出手段は、前記クリックログを一定期間ごとに取得して、関連ページを抽出することを特徴とする請求項1に記載の情報検索装置The information search apparatus according to claim 1, wherein the related page extracting unit acquires the click log at regular intervals and extracts a related page. 前記関連ページ抽出手段は、前記選択頻度がしきい値以上のウェブページを抽出することを特徴とする請求項1又は2に記載の情報検索装置The information search apparatus according to claim 1, wherein the related page extracting unit extracts a web page having the selection frequency equal to or higher than a threshold value. 前記ジャンル決定手段は、前記関連ページ抽出手段により抽出されたそれぞれのウェブページを各ジャンルに分類したジャンル分布を算出し、このジャンル分布における分布度に基づいて当該クエリのジャンルを判定することを特徴とする請求項1から3のいずれか一項に記載の情報検索装置The genre determining unit calculates a genre distribution in which each web page extracted by the related page extracting unit is classified into each genre, and determines a genre of the query based on a distribution degree in the genre distribution. The information search device according to any one of claims 1 to 3. 前記クエリのジャンルに関連する情報は、当該クエリのジャンルに対応するプロパティに誘導するための情報であることを特徴とする請求項1から4のいずれか一項に記載の情報検索装置。5. The information search apparatus according to claim 1, wherein the information related to the genre of the query is information for guiding to a property corresponding to the genre of the query. 前記検索結果提供手段は、前記ジャンル決定手段により判定されたクエリのジャンルに基づいて、前記検索実行手段により取得された検索結果の絞込み又は並べ替えを行うことを特徴とする請求項1から5のいずれか一項に記載の情報検索装置。The search result providing means narrows down or sorts the search results acquired by the search execution means based on the genre of the query determined by the genre determination means. The information search device according to any one of the above. インターネット上で公開されているサイトのドメイン情報を予めジャンル別に分類して登録したサイト分類データベースを備えた情報検索装置における情報検索方法であって、
検索サービスにおいて指定されたクエリに対するクリックログに基づいて、検索結果ごとの選択頻度を算出するステップと、
この選択頻度から前記クエリと関連性の高いウェブページを抽出するステップと、
前記抽出されたそれぞれのウェブページのドメイン情報と、前記サイト分類データベースに登録されたドメイン情報に対応付けられたジャンルに基づいて、前記クエリのジャンルを判定するジャンル決定ステップと、
インターネットを介して接続されたクライアント端末からの検索要求を受け付ける検索要求受付ステップと、
前記検索要求受付ステップで受け付けた検索要求に含まれるクエリに適合するサイトを検索する検索実行ステップと、
前記検索実行ステップで取得された検索結果を前記クライアント端末に提供する検索結果提供ステップと、を有し、
前記検索結果提供ステップにおいて、前記ジャンル決定ステップで判定されたクエリのジャンルに基づいて、前記検索要求に含まれるクエリのジャンルに関連する情報と前記検索結果とを含む検索結果画面の情報を生成して提供することを特徴とする情報検索方法
An information search method in an information search apparatus having a site classification database in which domain information of sites published on the Internet is classified and registered in advance by genre,
Calculating a selection frequency for each search result based on a click log for a query specified in the search service;
Extracting a web page highly relevant to the query from the selection frequency;
A genre determination step of determining a genre of the query based on domain information of each extracted web page and a genre associated with domain information registered in the site classification database;
A search request receiving step for receiving a search request from a client terminal connected via the Internet;
A search execution step of searching for a site that matches a query included in the search request received in the search request reception step;
A search result providing step of providing the client terminal with the search result acquired in the search execution step,
In the search result providing step, based on the genre of the query determined in the genre determination step, information on a search result screen including information related to the genre of the query included in the search request and the search result is generated. An information search method characterized by being provided .
JP2009144827A 2009-06-18 2009-06-18 Information search apparatus and information search method Active JP5133946B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009144827A JP5133946B2 (en) 2009-06-18 2009-06-18 Information search apparatus and information search method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009144827A JP5133946B2 (en) 2009-06-18 2009-06-18 Information search apparatus and information search method

Publications (2)

Publication Number Publication Date
JP2011002972A JP2011002972A (en) 2011-01-06
JP5133946B2 true JP5133946B2 (en) 2013-01-30

Family

ID=43560885

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009144827A Active JP5133946B2 (en) 2009-06-18 2009-06-18 Information search apparatus and information search method

Country Status (1)

Country Link
JP (1) JP5133946B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017059184A (en) * 2015-09-18 2017-03-23 ヤフー株式会社 Searching device, searching method, and program

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI609917B (en) * 2011-05-31 2018-01-01 Ajinomoto Co., Inc. Resin composition
CN105512156B (en) * 2014-10-20 2020-02-07 腾讯科技(深圳)有限公司 Click model generation method and device
CN106951422B (en) * 2016-01-07 2021-05-28 腾讯科技(深圳)有限公司 Webpage training method and device, and search intention identification method and device
JP6900158B2 (en) * 2016-05-24 2021-07-07 ヤフー株式会社 Classification device, classification method and classification program
JP6723182B2 (en) * 2017-03-17 2020-07-15 ヤフー株式会社 Information processing apparatus, information processing method, and program
WO2018198268A1 (en) * 2017-04-27 2018-11-01 楽天株式会社 Information processing device, information processing method, program, and storage medium
JP7017865B2 (en) * 2017-05-17 2022-02-09 ヤフー株式会社 Judgment device, judgment method and judgment program
JP6479239B1 (en) * 2018-04-19 2019-03-06 ヤフー株式会社 Information processing apparatus, information processing system, information processing method, and program
JP7174551B2 (en) * 2018-07-23 2022-11-17 ヤフー株式会社 Estimation device, estimation method and estimation program
JP6871208B2 (en) * 2018-09-06 2021-05-12 ヤフー株式会社 Monitoring devices, shopping servers, monitoring methods, and programs
JP6971210B2 (en) * 2018-09-20 2021-11-24 ヤフー株式会社 Information processing equipment, information processing methods, and programs
JP6568284B1 (en) * 2018-10-02 2019-08-28 ヤフー株式会社 Providing device, providing method, and providing program

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4423841B2 (en) * 2002-08-14 2010-03-03 日本電気株式会社 Keyword determination device, determination method, document search device, search method, document classification device, classification method, and program
JP2008181186A (en) * 2007-01-23 2008-08-07 Yahoo Japan Corp Method for determining relevancy between keyword and web site using query log
JP5115059B2 (en) * 2007-07-03 2013-01-09 大日本印刷株式会社 Keyword classifier
KR101049889B1 (en) * 2007-10-22 2011-07-19 주식회사 이베이지마켓 Web site operation method and online system to receive and target advertisements for keyword groups based on behavioral analysis through search

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017059184A (en) * 2015-09-18 2017-03-23 ヤフー株式会社 Searching device, searching method, and program

Also Published As

Publication number Publication date
JP2011002972A (en) 2011-01-06

Similar Documents

Publication Publication Date Title
JP5133946B2 (en) Information search apparatus and information search method
US8768772B2 (en) System and method for selecting advertising in a social bookmarking system
US8015065B2 (en) Systems and methods for assigning monetary values to search terms
US7631007B2 (en) System and method for tracking user activity related to network resources using a browser
US7930290B2 (en) Providing virtual really simple syndication (RSS) feeds
US9824154B1 (en) Search engine query customization and search site rating system
US20060064411A1 (en) Search engine using user intent
US20130060747A1 (en) Web search system with group interaction support
US20070067217A1 (en) System and method for selecting advertising
CN102037464A (en) Search results with most clicked next objects
US20120246139A1 (en) System and method for resume, yearbook and report generation based on webcrawling and specialized data collection
JP2010113542A (en) Information provision system, information processing apparatus and program for the information processing apparatus
US20170287041A1 (en) Information processing apparatus, information processing method, and information processing program
JP5511782B2 (en) New advertisement capable URL providing system and new advertisement capable URL providing method
TWI417751B (en) Information providing device, information providing method, information application program, and information recording medium
JP5548900B2 (en) Web page recommendation method using multiple attributes
US10262064B2 (en) Information processing apparatus, information processing method, information processing program, recording medium having stored therein information processing program
TWI399657B (en) A provider, a method of providing information, a program, and an information recording medium
JP5185891B2 (en) Content providing apparatus, content providing method, and content providing program
KR20020014026A (en) News tracker and analysis service based on web personalization
KR20130065779A (en) Apparatus and method for providing contents service using social characteristics of user
CN102930018B (en) Information on Collection processing system
JP5382601B2 (en) Information presenting apparatus, information presenting method, and information presenting program
JP4934154B2 (en) Content providing device
JP2008276640A (en) Keyword prediction system and keyword prediction method

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120409

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120417

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120611

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121030

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121108

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151116

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5133946

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350