JP2011192102A - Device and method for creating summary, and program - Google Patents

Device and method for creating summary, and program Download PDF

Info

Publication number
JP2011192102A
JP2011192102A JP2010058651A JP2010058651A JP2011192102A JP 2011192102 A JP2011192102 A JP 2011192102A JP 2010058651 A JP2010058651 A JP 2010058651A JP 2010058651 A JP2010058651 A JP 2010058651A JP 2011192102 A JP2011192102 A JP 2011192102A
Authority
JP
Japan
Prior art keywords
link
information
link information
search result
sublink
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010058651A
Other languages
Japanese (ja)
Other versions
JP5084858B2 (en
Inventor
Keita Hakoda
慶太 箱田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2010058651A priority Critical patent/JP5084858B2/en
Publication of JP2011192102A publication Critical patent/JP2011192102A/en
Application granted granted Critical
Publication of JP5084858B2 publication Critical patent/JP5084858B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To improve clarity of a search result screen by reducing useless link display in summary display. <P>SOLUTION: A navigation query and a specific site are identified on the basis of a click log DB70 to obtain an URL of a search result in lower order than the specific site in the URL of a search result searched for in the query. A link URL is obtained from a Web page of the specific site. The obtained URL of the search result is compared with the link URL and a coincident URL is decided as a sub-link to the specific site. Also, the Web page of the sub-link is obtained to generate a title of the sub-link on the basis of a character string in the Web page. <P>COPYRIGHT: (C)2011,JPO&INPIT

Description

本発明は、サマリ作成装置、サマリ作成方法及びプログラムに関する。   The present invention relates to a summary creation device, a summary creation method, and a program.

インターネット上には膨大な量の情報の中から所望の情報を効率的に発見するツールとして、各種の検索サービスが提供されている。ユーザは、クエリ(キーワード、ターム)を入力して検索を行い、検索結果の一覧リストの中からウェブページを閲覧するURL(Uniform Resource Locator)を選択するといった操作により該ウェブページを閲覧する。   Various search services are provided on the Internet as tools for efficiently finding desired information from a vast amount of information. The user performs a search by inputting a query (keyword, term), and browses the web page by an operation such as selecting a URL (Uniform Resource Locator) for browsing the web page from the list of search results.

検索結果の一覧リストを表示する検索結果画面には、該検索結果であるURLと共にウェブページのタイトルやサマリ(概要)が表示される。サマリには、ウェブページの要約となるテキストや、該ウェブページ中に挿入されているリンク(URL)が含まれる。   On the search result screen displaying the list of search results, the title and summary (summary) of the web page are displayed together with the URL as the search result. The summary includes text that is a summary of the web page and a link (URL) inserted in the web page.

また、検索結果の表示方法としては、あるウェブページが存在するサイトと同一のサイト内のウェブページをリスト化して、次候補として表示する技術が知られている(例えば、特許文献1参照)。このような表示方法を検索結果のサマリに導入することで、検索結果画面上に各ウェブページと同一ドメインのウェブページへのリンクを表示することができる。   Further, as a search result display method, a technique is known in which web pages in the same site as a site where a certain web page exists are listed and displayed as the next candidate (for example, see Patent Document 1). By introducing such a display method into the search result summary, a link to a web page of the same domain as each web page can be displayed on the search result screen.

特許3539354号公報Japanese Patent No. 3539354

しかし、クエリに対する複数の検索結果には、同一ドメインのURLが複数含まれていることが多い。特許文献1の技術のように、同一ドメインか否かによってウェブページのリンクをサマリに表示すると、複数の検索結果に渡って重複した同じリンクが表示されることがある。このため、無駄なリンク表示が増えてしまい検索結果画面の見易さを悪くしてしまった。   However, a plurality of search results for a query often includes a plurality of URLs of the same domain. When the web page link is displayed in the summary depending on whether or not the domain is the same as in the technique of Patent Document 1, the same duplicate link may be displayed over a plurality of search results. For this reason, useless link display increases and the search result screen is not easily viewed.

本発明は、上記課題に鑑みて為されたものであり、その目的とするところは、サマリ表示での無駄なリンク表示を低減して、検索結果画面の見易さを向上することである。   The present invention has been made in view of the above problems, and an object of the present invention is to reduce useless link display in the summary display and improve the visibility of the search result screen.

上記の課題を解決するため、第1の発明にあっては、
クエリに対する検索結果である複数のランク付けされたリンク情報毎に表示するサマリ情報を作成するサマリ作成装置において、
前記検索結果内の特定のリンク情報よりも下位にランク付けされたリンク情報を該検索結果から取得する下位リンク取得手段と、
前記選択されたリンク情報が指し示すページ情報内に含まれるリンク情報を取得するページ内リンク取得手段と、
前記下位リンク取得手段が取得したリンク情報と、前記ページ内リンク取得手段が取得したリンク情報とが一致するリンク情報を前記特定のリンク情報のサブリンクとして収集して、該サブリンクを含む前記サマリ情報を作成するサマリ情報作成手段と、
を備えることを特徴としている。
In order to solve the above problem, in the first invention,
In a summary creation device that creates summary information to be displayed for each of a plurality of ranked link information that is a search result for a query,
Lower link acquisition means for acquiring link information ranked lower than the specific link information in the search result, from the search result;
In-page link acquisition means for acquiring link information included in the page information indicated by the selected link information;
The link information that the link information acquired by the lower link acquisition unit and the link information acquired by the in-page link acquisition unit match is collected as a sublink of the specific link information, and the summary including the sublink is collected. Summary information creation means for creating information;
It is characterized by having.

第1の発明によれば、特定のリンク情報よりも下位にランク付けされる検索結果のうち、該リンク情報のページ情報内に設定されているリンク情報をサブリンクとして収集して、サマリ情報を作成するため、各検索結果の下位からリンク情報が纏め上げられるようにサブリンクが収集されることとなる。このため、各検索結果間で表示するサブリンクについて重複が発生することを防止できる。従って、無駄なリンク表示を低減して、検索結果画面の見易さを向上することができる。   According to the first invention, among the search results ranked lower than the specific link information, the link information set in the page information of the link information is collected as a sublink, and the summary information is obtained. In order to create, sublinks are collected so that link information is collected from the lower order of each search result. For this reason, it can prevent duplication about the sublink displayed between each search result. Therefore, it is possible to reduce useless link display and improve the visibility of the search result screen.

また、第2の発明において、前記サマリ情報作成手段は、前記リンク情報に対する個々のユーザ選択の履歴であるクリックログに基づいて、前記一致するリンク情報のうち、前記ユーザ選択の回数が上位所定数のリンク情報を前記サブリンクとして収集することを特徴としている。   Further, in the second invention, the summary information creating means is configured such that, based on a click log that is a history of individual user selection with respect to the link information, the number of times of user selection among the matching link information is the upper predetermined number. The link information is collected as the sublink.

第2の発明によれば、ユーザにより選択の頻度の高いリンク情報をサブリンクとして収集するため、ユーザによる閲覧の可能性の高いサブリンクを検索結果画面に表示させることができる。   According to the second invention, since link information that is frequently selected by the user is collected as a sublink, a sublink that is highly likely to be browsed by the user can be displayed on the search result screen.

また、第3の発明において、前記サマリ情報は、前記サブリンクのリンク情報と表示タイトルとを含み、前記サマリ情報作成手段は、前記サブリンクが指し示すページ情報内に含まれる文字列に基づいて該サブリンクの表示タイトルを生成することを特徴としている。   In the third invention, the summary information includes link information of the sublink and a display title, and the summary information creating means is configured to generate the summary information based on a character string included in page information indicated by the sublink. A display title of a sublink is generated.

第3の発明によれば、サブリンクのページ情報から表示タイトルを生成するため、該サブリンクの内容を表すタイトルを生成することができる。   According to the third aspect, since the display title is generated from the page information of the sublink, a title representing the content of the sublink can be generated.

また、第4の発明において、前記クエリと、該クエリに対する検索結果としての前記リンク情報に対する個々のユーザ選択の履歴とを対応付けて記憶したクリックログに基づいて、前記クエリに対する検索結果内で選択回数が最上位のリンク情報を前記特定のリンク情報として決定する特定リンク決定手段を更に備えることを特徴としている。   In the fourth invention, the query is selected in the search result for the query based on the click log stored in association with the query and the history of individual user selection for the link information as the search result for the query. It is further characterized by further comprising specific link determining means for determining link information having the highest number of times as the specific link information.

第4の発明によれば、検索結果内で選択回数が最上位のリンク情報を特定のリンク情報としてサブリンクを収集するため、検索結果内でも主要なリンク情報についてサブリンクを作成することができる。   According to the fourth invention, since the sublink is collected with the link information having the highest selection frequency in the search result as the specific link information, the sublink can be created for the main link information in the search result. .

本発明によれば、各々の検索結果に表示するサマリ情報内のサブリンクとして、各検索結果間の重複を防止して、無駄なリンク表示を低減することで、検索結果画面の見易さを向上することができる。   According to the present invention, as a sublink in the summary information displayed in each search result, duplication between each search result is prevented and useless link display is reduced, thereby making it easy to view the search result screen. Can be improved.

本発明の一実施形態にかかるシステムの構成例を示す図。The figure which shows the structural example of the system concerning one Embodiment of this invention. クリックログDBのデータ構造例を示す図。The figure which shows the data structure example of click log DB. リンク情報DBのデータ構造例を示す図。The figure which shows the data structure example of link information DB. サブリンク作成処理の処理例を示すフローチャート。The flowchart which shows the process example of a sublink creation process. ナビゲーショナルクエリ抽出処理の処理例を示すフローチャート。The flowchart which shows the process example of a navigational query extraction process. サブリンクタイトル生成処理の処理例を示すフローチャート。The flowchart which shows the process example of a sublink title production | generation process. 検索結果画面の表示例を示す図。The figure which shows the example of a display of a search result screen.

以下、本発明の好適な実施形態につき説明する。図1は、本発明のサマリ作成装置を検索サーバ1に適用した場合のシステム構成の一例を示すブロック図である。   Hereinafter, preferred embodiments of the present invention will be described. FIG. 1 is a block diagram showing an example of a system configuration when the summary creation device of the present invention is applied to a search server 1.

〔システム構成〕
図1によれば、検索サーバ1は、ユーザ端末Tとインターネット等のネットワークを介して接続され、HTTPプロトコル等に応じたデータ通信を該ユーザ端末Tとの間で行う。
〔System configuration〕
According to FIG. 1, the search server 1 is connected to a user terminal T via a network such as the Internet, and performs data communication with the user terminal T according to the HTTP protocol or the like.

〔ユーザ端末〕
ユーザ端末Tは、パーソナルコンピュータ等のコンピュータハードウェア上で実行されるソフトウェア(プログラム)により実現され、図1に示すように、ユーザがクエリや検索の実行指示等を入力する入力部100、入力されたクエリに対応した検索要求やウェブページの閲覧要求等のリクエストを送信するリクエスト送信部110、該リクエストに応じてサーバから送信される応答を受信する応答受信部120と、該応答と共に受信するウェブページをディスプレイ等に表示する表示部130と、を備えて構成される。リクエスト送信部110、応答受信部120は所謂ウェブブラウザによって実現可能である。
[User terminal]
The user terminal T is realized by software (program) executed on computer hardware such as a personal computer. As shown in FIG. 1, the user terminal T is input by an input unit 100 for inputting a query, a search execution instruction, and the like. Request transmission unit 110 for transmitting a request such as a search request corresponding to the received query or a web page browsing request, a response reception unit 120 for receiving a response transmitted from the server in response to the request, and a web received together with the response And a display unit 130 for displaying the page on a display or the like. The request transmission unit 110 and the response reception unit 120 can be realized by a so-called web browser.

〔検索サーバ〕
検索サーバ1は、ユーザ端末Tからのクエリの受け付けと、検索処理の実行と、検索結果を表示するためのウェブページの作成・送信とを行なう。
[Search Server]
The search server 1 receives a query from the user terminal T, executes a search process, and creates / transmits a web page for displaying a search result.

図1に示されるように、検索サーバ1は、リクエスト受信部10、検索エンジン20、ページ生成部40、検索結果送信部50、ナビゲーショナルクエリ抽出部60、クリックログDB70、ナビゲーショナルクエリDB80及び検索インデックス90を備えて構成される。   As shown in FIG. 1, the search server 1 includes a request receiving unit 10, a search engine 20, a page generating unit 40, a search result transmitting unit 50, a navigational query extracting unit 60, a click log DB 70, a navigational query DB 80, and a search. An index 90 is provided.

リクエスト受信部10は、ユーザ端末Tからクエリを含む検索要求やウェブページの送信要求等のリクエストを受け付ける機能部であって、クエリ取得部12と、リダイレクト処理部14とを有して構成される。   The request receiving unit 10 is a functional unit that receives a request such as a search request including a query or a transmission request for a web page from the user terminal T, and includes a query acquisition unit 12 and a redirect processing unit 14. .

クエリ取得部12は、受信したリクエストが検索要求である場合に、その検索要求に含まれるクエリを取得して、検索エンジン20に送信する。   When the received request is a search request, the query acquisition unit 12 acquires a query included in the search request and transmits it to the search engine 20.

検索エンジン20は、クエリに基づいて検索インデックス90を検索して、その検索結果となるURLの一覧を出力する。検索インデックス90は、インターネット上のウェブページを検索可能なようにインデックス化して記憶したデータベースであり、図3に示すように、インデックスとなるキーワードと、URLと、ランクと、メインタイトルと、サマリテキストと、サブリンクタイトルとを対応付けて記憶する。   The search engine 20 searches the search index 90 based on the query, and outputs a list of URLs that are the search results. The search index 90 is a database in which web pages on the Internet are indexed and stored so as to be searchable. As shown in FIG. 3, the index keyword, URL, rank, main title, and summary text are stored. And the sublink title are stored in association with each other.

メインタイトルは、検索結果のURLに対応する表示情報(文字列)であり、該URLに代えて表示される。サマリテキストは、検索結果毎のウェブページの概要を記したコンテンツである。検索結果の表示では、図7に示すようにメインタイトルにURLへのリンクが設定され、サマリテキスト(例えば、サマリSM)が関係付けられて表示される。   The main title is display information (character string) corresponding to the URL of the search result, and is displayed instead of the URL. The summary text is content describing an outline of the web page for each search result. In the display of the search result, as shown in FIG. 7, a link to the URL is set in the main title, and summary text (for example, summary SM) is displayed in association with it.

また、検索結果のURLが指し示すウェブページ内にリンクが含まれている場合には、そのリンクがサブリンク(例えば、図7のサブリンクSL)として表示される。検索インデックス90のサブリンクタイトルは、サブリンクへのURLに代えて表示する際の表示情報(文字列)である。   In addition, when a link is included in the web page indicated by the URL of the search result, the link is displayed as a sublink (for example, sublink SL in FIG. 7). The sublink title of the search index 90 is display information (character string) for display instead of the URL to the sublink.

検索エンジン20は、インターネット上からウェブページを収集するクローラ(図示略)と、該ウェブページを検索可能にインデクシングするインデクサ(図示略)と、サブリンクタイトル生成部22とを備えて構成される。   The search engine 20 includes a crawler (not shown) that collects web pages from the Internet, an indexer (not shown) that indexes the web pages so as to be searchable, and a sublink title generation unit 22.

クローラは、各ウェブページにリンク付けされた他のウェブページを辿るように巡回することで、インターネット上に存在するウェブページを収集する。   The crawler collects web pages that exist on the Internet by going around other web pages linked to each web page.

インデクサは、クローラによって収集されたウェブページに言語処理等を施してインデックス(索引)を生成して、そのインデックスに対応付けてウェブページのURL(リンク情報)を蓄積記憶する。このインデックスの際には、ウェブページ中のキーワードの重要度や、ページ間のリンク関係による重み付け等を用いた各種ランキングアルゴリズムによってランクが付与される。   The indexer performs language processing or the like on the web pages collected by the crawler to generate an index (index), and stores and stores the URL (link information) of the web page in association with the index. In the case of this index, ranks are given by various ranking algorithms using the importance of keywords in a web page, weights based on link relationships between pages, and the like.

また、検索エンジン20は、検索結果として表示するURLに対応したウェブページからタイトルとなる文字列を抽出して、メインタイトルを作成する。具体的には、ウェブページを取得して、そのウェブページ内のタイトル部分(例えば、titleタグで囲まれた文字列)を抽出し、URLに対応付けてメインタイトルとする。   Further, the search engine 20 extracts a character string as a title from a web page corresponding to a URL displayed as a search result, and creates a main title. Specifically, a web page is acquired, a title portion (for example, a character string enclosed by title tags) in the web page is extracted, and the main title is associated with the URL.

また、各検索結果のURLに対応したウェブページからサマリテキストとなり得るテキストを抽出してサマリテキストとして設定する。例えば、ウェブページに対して言語処理を行うことで特徴語を抽出し、その特徴語を含む所定数の文字列をサマリテキストとして抽出してもよいし、ウェブページ内の表示対象の文字列のうち先頭から所定数の文字列を抽出してもよい。   In addition, text that can be summary text is extracted from the web page corresponding to the URL of each search result and set as summary text. For example, a feature word may be extracted by performing language processing on a web page, a predetermined number of character strings including the feature word may be extracted as summary text, or a character string to be displayed in the web page may be extracted. A predetermined number of character strings may be extracted from the beginning.

また、検索エンジン20のサブリンクタイトル生成部22は、後述するサブリンクタイトル生成処理(図6参照)に基づいて、サブリンクタイトルを生成する。   The sublink title generation unit 22 of the search engine 20 generates a sublink title based on a sublink title generation process (see FIG. 6) described later.

検索エンジン20は、検索サーバ1からの検索要求に応じて、クエリと一致するインデクスに関連付けられたURLを読み出して、各検索結果にランク付けを行って一覧リストを生成し、検索サーバ1に返す。   In response to a search request from the search server 1, the search engine 20 reads URLs associated with indexes that match the query, ranks the search results, generates a list, and returns the list to the search server 1. .

リダイレクト処理部14は、ユーザ端末TからリダイレクトURLによるアクセスを受け付け、リダイレクトレスポンスを返送するリダイレクト処理を行う。リダイレクト処理は、検索結果の一覧リスト等のウェブページに埋め込まれたリダイレクトURLに基づいて、検索サーバ1へのアクセスを受けて、そのリダイレクトURLに含まれる目的のサイトの本来のURLへのアクセス切り替えを指示するリダイレクトレスポンスをユーザ端末Tに送信する処理である。   The redirect processing unit 14 receives a redirect URL access from the user terminal T and performs a redirect process for returning a redirect response. The redirect process receives access to the search server 1 based on the redirect URL embedded in a web page such as a list of search results, and switches the access to the original URL of the target site included in the redirect URL. Is a process of transmitting a redirect response to the user terminal T.

ユーザ端末Tの応答受信部120は、検索サーバ1からリダイレクトレスポンスを受け取ると、リクエスト送信部110が、この応答に基づいたURLで示されるウェブサイトへインターネットNを介してアクセスしてウェブページの要求を送信する。   When the response reception unit 120 of the user terminal T receives the redirect response from the search server 1, the request transmission unit 110 accesses the website indicated by the URL based on this response via the Internet N to request a web page. Send.

検索サーバ1は、検索結果のURLと、該検索サーバ1を指し示すURLと、クエリとをパラメータとして含むリダイレクトURLを生成し、各検索結果に対応したリダイレクトURLをウェブページに埋め込む。このウェブページをユーザ端末Tに送信することで、検索結果の一覧リストが該ユーザ端末Tで表示される。   The search server 1 generates a redirect URL including, as parameters, a URL of the search result, a URL indicating the search server 1, and a query, and embeds the redirect URL corresponding to each search result in the web page. By transmitting this web page to the user terminal T, a list of search results is displayed on the user terminal T.

これにより、ユーザが検索結果を閲覧するための選択操作を行うと、先ず、ユーザ端末Tから検索サーバ1にアクセスされる。そして、検索サーバ1が返送するリダイレクトレスポンスによってユーザ端末Tは、その検索結果に対応したウェブサイトにアクセスして、該URLに対応したウェブページを表示する。   Thus, when the user performs a selection operation for browsing the search result, the search server 1 is first accessed from the user terminal T. Then, the user terminal T accesses the website corresponding to the search result by the redirect response returned by the search server 1, and displays the web page corresponding to the URL.

また、リダイレクト処理部14は、クリックログ収集部16を有して構成される。クリックログ収集部16は、リダイレクト処理を行ったタイミングで、ユーザ端末Tにおいて選択(クリック)されたリダイレクトURLからクエリと検索結果のURLとの組み合わせを取得してクリックログとしてクリックログDB70に記録する。このクリックログを収集することで、検索結果へのクリックの頻度を算出することができる。   The redirect processing unit 14 includes a click log collection unit 16. The click log collection unit 16 acquires the combination of the query and the URL of the search result from the redirect URL selected (clicked) at the user terminal T at the timing when the redirect process is performed, and records it in the click log DB 70 as a click log. . By collecting this click log, the frequency of clicks on search results can be calculated.

クリックログDB70は、クリックログ収集部16により取得されたクリックログを蓄積記憶するデータベースであり、図2に示すように、クエリと、クリックURLと、クリック回数とを対応付けて記憶する。   The click log DB 70 is a database for accumulating and storing click logs acquired by the click log collection unit 16, and stores a query, a click URL, and the number of clicks in association with each other as shown in FIG.

即ち、クリックログ収集部16により、ユーザがウェブ検索で検索したクエリと、その検索結果内で選択されたURL(クリックURL)との組み合わせをクリックログDB70に記憶すると共に、該組み合わせに対応するクリック回数を計上して更新する。   That is, the click log collection unit 16 stores in the click log DB 70 a combination of a query searched by the user through a web search and a URL (click URL) selected in the search result, and clicks corresponding to the combination. Count and update the number of times.

ページ生成部40は、ランク付けされたURLの一覧である検索結果を検索エンジン20から得て、該検索結果を表示するためのウェブページを生成する。ページ生成部40は、検索結果取得部42と、サブリンク作成部44とを有して構成される。   The page generation unit 40 obtains a search result that is a list of ranked URLs from the search engine 20 and generates a web page for displaying the search result. The page generation unit 40 includes a search result acquisition unit 42 and a sublink creation unit 44.

検索結果取得部42は、クエリに対する検索結果であるURLの一覧を検索エンジン20から取得する。この際、検索結果のURLに対応付けられたメインタイトル、サマリテキスト、サブリンクタイトルも取得する。   The search result acquisition unit 42 acquires a list of URLs that are search results for the query from the search engine 20. At this time, the main title, summary text, and sublink title associated with the URL of the search result are also acquired.

サブリンク作成部44は、後述するサブリンク作成処理(図4)に基づいて、検索結果取得部42によって取得されたURLに対応して表示するサブリンクを作成する。   The sublink creation unit 44 creates a sublink to be displayed corresponding to the URL acquired by the search result acquisition unit 42 based on a sublink creation process (FIG. 4) described later.

ページ生成部40は、検索結果を表示するためのウェブページ(以下「検索結果ページ」という。)を生成する際に、検索結果取得部42によって取得された検索結果のURLに対応付けられたメインタイトルのリンク先として該URLを設定して、検索結果ページに含める。   When the page generation unit 40 generates a web page for displaying the search result (hereinafter referred to as “search result page”), the page generation unit 40 is associated with the URL of the search result acquired by the search result acquisition unit 42. The URL is set as a title link destination and included in the search result page.

また、検索結果のURLに対応付けられたサマリ情報を読み出し、該URLに関連付けて検索結果ページに含める。この際、サブリンク作成部44によって作成されたサブリンクのURLに対応したサブリンクタイトルのリンク先としてサブリンクのURLを設定する。このように生成した検索結果ページの表示例を図7に示す。図7のように、検索結果ページに基づいて表示した検索結果画面Wには、各検索結果に関連付けられたサマリSMとサブリンクSLとが表示される。   Further, summary information associated with the URL of the search result is read out and included in the search result page in association with the URL. At this time, the URL of the sublink is set as the link destination of the sublink title corresponding to the URL of the sublink created by the sublink creating unit 44. A display example of the search result page generated in this way is shown in FIG. As shown in FIG. 7, the summary SM and the sublink SL associated with each search result are displayed on the search result screen W displayed based on the search result page.

検索結果送信部50は、ページ生成部40によって生成された検索結果ページをリクエスト受信部10が検索要求を受信したユーザ端末Tに対して送信する。   The search result transmission unit 50 transmits the search result page generated by the page generation unit 40 to the user terminal T from which the request reception unit 10 has received the search request.

〔ナビゲーショナルクエリ〕
本実施形態において、サブリンク作成部44は、各検索結果に対するサブリンクを、ナビゲーショナルクエリを有する特定サイト(URL)を対象として作成する。
[Navigation Query]
In the present embodiment, the sublink creation unit 44 creates a sublink for each search result for a specific site (URL) having a navigational query.

ナビゲーショナルクエリとは、ある特定のサイトへのアクセス(移動)を目的として検索されるクエリであり、例えば、会社名、サイト名、大学名、個人名等が多い。ナビゲーショナルクエリ抽出部60は、クリックログDB70に基づいてナビゲーショナルクエリと、該クエリに対応する特定サイトとなるURLとの組み合わせを抽出する。   The navigational query is a query that is searched for the purpose of accessing (moving) to a specific site. For example, there are many company names, site names, university names, personal names, and the like. The navigational query extraction unit 60 extracts a combination of a navigational query and a URL serving as a specific site corresponding to the query based on the click log DB 70.

ナビゲーショナルクエリ抽出部60は、図5に示すナビゲーショナルクエリ抽出処理に基づいて、大きくは、クエリ毎のクリック回数によるナビゲーショナルクエリとしての確からしさを示す指標である第1スコアの算出と、クエリ毎にクリック回数率によるナビゲーショナルクエリとしての確からしさを示す指標である第2スコアの算出とを行い、クエリ毎のスコアに基づいて抽出したクエリとURLとの組み合わせをナビゲーショナルクエリDB80に記憶する。   Based on the navigational query extraction process shown in FIG. 5, the navigational query extraction unit 60 calculates a first score, which is an index indicating the probability as a navigational query based on the number of clicks for each query, The second score, which is an index indicating the probability of the navigational query based on the click rate, is calculated every time, and the combination of the query and URL extracted based on the score for each query is stored in the navigational query DB 80. .

ナビゲーショナルクエリDB80(図示略)は、ナビゲーショナルクエリと、該ナビゲーショナルクエリに対応する特定サイトのURLとを対応付けて記憶するデータベースである。   The navigational query DB 80 (not shown) is a database that stores a navigational query and a URL of a specific site corresponding to the navigational query in association with each other.

以下、ナビゲーショナルクエリ抽出処理は、所定のタイミングのバッチ処理等によりクリックログDB70内の各クエリに対して行われる。以下、具体的な処理について説明する。   Hereinafter, the navigational query extraction process is performed for each query in the click log DB 70 by a batch process or the like at a predetermined timing. Specific processing will be described below.

先ず、ナビゲーショナルクエリ抽出部60は、クリックログDB70から一のクエリを選択し(ステップS21)、該クエリに対応付けられたクリックURLの1件目〜N件目のクリック回数の中で最大のものを変数MAX1として取得する(ステップS22)。   First, the navigational query extraction unit 60 selects one query from the click log DB 70 (step S21), and the largest number of clicks of the first to Nth clicks of the click URL associated with the query. A thing is acquired as a variable MAX1 (step S22).

次いで、クリック回数の平均値を変数AVE1に設定し(ステップS23)、クリック回数が最大のものを除く1件目〜N件目のURLに対応するクリック回数それぞれをΣの計算における変数EACH1として、次式で第1スコアを計算する(ステップS24)。   Next, the average value of the number of clicks is set in the variable AVE1 (step S23), and the number of clicks corresponding to the first to Nth URLs except the one with the largest number of clicks is set as the variable EACH1 in the calculation of Σ. The first score is calculated by the following formula (step S24).

〔式1〕
第1スコア=(MAX1−AVE1)−Σ(EACH1−AVE1)
[Formula 1]
First score = (MAX1-AVE1) 2 −Σ (EACH1-AVE1) 2

次いで、ナビゲーショナルクエリ抽出部60は、1件目〜N件目のURLのクリック回数率の中で最大のものを変数MAX2として算出し(ステップS25)、クリック回数率の平均値を変数AVE2に設定する(ステップS26)。クリック回数率は、クエリに対応付けられた全URLのクリック回数の合計値に対する各URLのクリック回数の比率である。   Next, the navigational query extraction unit 60 calculates the maximum click frequency rate of the first to Nth URLs as the variable MAX2 (step S25), and sets the average value of the click frequency rate to the variable AVE2. Set (step S26). The click frequency rate is the ratio of the number of clicks of each URL to the total value of the clicks of all URLs associated with the query.

そして、クリック回数率が最大のものを除く1件目〜N件目のURLそれぞれのクリック回数率をΣの計算における変数EACH2として、次式で第2スコアを計算する(ステップS27)。   Then, the second score is calculated by the following equation using the click frequency rate of each of the first to Nth URLs except the one with the maximum click frequency rate as a variable EACH2 in the calculation of Σ (step S27).

〔式2〕
第2スコア=(MAX2−AVE2)−Σ(EACH2−AVE2)
[Formula 2]
Second score = (MAX2-AVE2) 2 −Σ (EACH2-AVE2) 2

次いで、ナビゲーショナルクエリ抽出部60は、第1スコア及び第2スコアがそれぞれ所定の閾値以上であるか否かを判定し、第1スコア、第2スコアのそれぞれが該閾値以上であれば、ステップS21で選択した処理対象のクエリと、最大クリック回数(率)を有するクリックURLとを対応付けてナビゲーショナルクエリDB80に記憶する(ステップS28)。   Next, the navigational query extraction unit 60 determines whether or not each of the first score and the second score is equal to or greater than a predetermined threshold, and if each of the first score and the second score is equal to or greater than the threshold, the step The query to be processed selected in S21 and the click URL having the maximum number of clicks (rate) are associated with each other and stored in the navigational query DB 80 (step S28).

以上の一連の処理をクリックログDB70に記憶された全てのクエリに対して行うことで、各クエリがナビゲーショナルクエリである場合には、対応するクリックURL(特定サイト)と共に、ナビゲーショナルクエリDB80に記憶される。   By performing the above series of processes for all queries stored in the click log DB 70, if each query is a navigational query, the corresponding query URL (specific site) and the corresponding navigation URL are stored in the navigational query DB 80. Remembered.

上述のように、ナビゲーショナルクエリ抽出処理では、検索サービスにおけるクリックログのデータを解析し、ナビゲーショナルクエリと非ナビゲーショナルクエリの自動的な選別を行なっている。この際、分散値の計算方法を応用して、ナビゲーショナルクエリとしての確からしさを示す指標である第1スコアおよび第2スコアを算出し、その両者が所定の閾値を超えるものをナビゲーショナルクエリとして抽出している。   As described above, in the navigational query extraction process, click log data in the search service is analyzed to automatically select a navigational query and a non-navigational query. At this time, by applying a method of calculating the variance value, the first score and the second score, which are indexes indicating the probability as the navigational query, are calculated, and those whose both exceed a predetermined threshold are used as the navigational query. Extracting.

ここで、ナビゲーショナルクエリの場合は、検索一覧における一箇所のサイトが集中してクリックされる、という特性があるので、ナビゲーショナルクエリであるか否かの判定に、第1スコア及び第2スコアの分散値を用いる。一つの要素が他の要素と比べて突出していれば分散値は高くなるので、ナビゲーショナルクエリである場合は分散値が高くなる。また、全ての要素が平均値に近ければ分散値は小さくなる。   Here, in the case of a navigational query, there is a characteristic that one site in the search list is clicked in a concentrated manner. Therefore, the first score and the second score are used for determining whether the site is a navigational query. Is used. If one element is prominent compared to the other elements, the variance value is high. Therefore, in the case of a navigational query, the variance value is high. Moreover, if all the elements are close to the average value, the variance value becomes small.

しかし、それぞれの要素にバラつきがあれば、平均値との偏差が大きくなり、分散値も大きくなる。そのため、クリックされる箇所とされない箇所が数箇所に分かれる場合も分散値が高くなってしまい、ナビゲーショナルクエリであるか否かを正確に判定することができない。   However, if each element varies, the deviation from the average value increases and the variance value also increases. For this reason, even when a portion that is not clicked is divided into several locations, the variance value becomes high, and it is not possible to accurately determine whether or not it is a navigational query.

そこで、分散値をそのまま適用するのではなく、最大クリック回数の偏差2乗からその他のクリック回数の偏差2乗和を差し引くようにしている。これにより、ある特定のサイトが集中してクリックされるナビゲーショナルクエリの場合、クリック回数による偏差2乗の値は大きくなり、その他のクリック回数の偏差2乗和の値は相対的に小さくなり、全体のスコア値は大きくなる。   Therefore, the variance value is not applied as it is, but the deviation square sum of other clicks is subtracted from the deviation square of the maximum clicks. As a result, in the case of a navigational query where a specific site is clicked in a concentrated manner, the value of deviation squared by the number of clicks increases, and the value of the sum of deviation squared of other clicks becomes relatively small. The overall score value increases.

また、クリックされる箇所とされない箇所が数箇所に分かれる場合(ナビゲーショナルクエリではない場合)、その他のクリック回数の偏差2乗和が大きくなり、スコア値を引き下げる。この手法の利点としては、クリック回数にバラつきがある場合は差分が小さくなり、均等にクリックされるような場合は、差分値が負の値となることである。その結果、一箇所のサイトのみが集中してクリックされている状態を示す指標とすることができる。   In addition, when the clicked part is not divided into several parts (in the case of not being a navigational query), the deviation sum of squares of other clicks becomes large, and the score value is lowered. The advantage of this method is that the difference becomes smaller when the number of clicks varies, and the difference value becomes a negative value when clicked equally. As a result, it can be used as an index indicating a state where only one site is clicked in a concentrated manner.

第2スコアは、第1スコアがクリック回数に基づいて算出するのに対し、クリック回数率に基づいて算出するものである。即ち、検索要求が高いクエリではスコアが高くなり得ることから、第2スコアによりその影響を除去する。   The second score is calculated based on the click frequency rate, whereas the first score is calculated based on the click frequency. That is, since the score of a query with a high search request can be high, the influence is removed by the second score.

例えば、検索回数のうちの1%がクリックされた場合を考えたとき、人気のあるサイトであるが故に検索回数が日頃から多いクエリの場合と、そうでないクエリ(検索回数が低い)の場合、クリック回数のみでスコアリングした場合では、検索回数が多いクエリの方のスコアが高くなる。   For example, when 1% of the number of searches is clicked, a query that is popular because it is a popular site, and a query that is not frequent (low search) When scoring is performed only by the number of clicks, the score of a query with a higher number of searches is higher.

そこで、第1スコアの算出式と同様の式において、クリック回数をクリック回数率に置き換えて第2スコアを算出することで、クリック分散の形状に関してスコアリングを行なう。但し、クリック回数率に基づいて算出する場合、露出が低いクエリのスコアが高くなってしまうため、単独で用いるのではなく、第1スコアが所定の閾値より大きいものにつき、更に第2スコアが所定の閾値より大きいか否かを確認するのに用いる。これにより、ナビゲーショナルクエリの判定精度を高めることができる。   Therefore, scoring is performed on the shape of the click dispersion by calculating the second score by replacing the click frequency with the click frequency rate in the same formula as the first score calculation formula. However, when calculating based on the click frequency rate, the score of a query with low exposure will be high, so it is not used alone, but a second score is predetermined for those whose first score is greater than a predetermined threshold. It is used to confirm whether or not it is larger than the threshold value. Thereby, the determination accuracy of the navigational query can be increased.

以上のようにして、ナビゲーショナルクエリと対応する特定サイトを抽出して、該特定サイトをサブリンク作成の対象とする。これにより、全てのURLに対してサブリンクを作成するのではなく、クエリに対してアクセス頻度の高い特定サイトについてサブリンクを表示できるようになる。   As described above, the specific site corresponding to the navigational query is extracted, and the specific site is set as a sublink creation target. This makes it possible to display sublinks for specific sites that are frequently accessed for queries rather than creating sublinks for all URLs.

〔サブリンク作成処理〕
次に、サブリンク作成部44によるサブリンク作成処理を図4に基づいて説明する。
[Sublink creation processing]
Next, sublink creation processing by the sublink creation unit 44 will be described with reference to FIG.

先ず、サブリンク作成部44は、サブリンクの作成対象としてのURLを特定する(ステップS11)。本実施形態においては、クエリ取得部12が取得したクエリがナビゲーショナルクエリである場合に、上述したナビゲーショナルクエリDB80においてクエリに対応付けられたURLを作成対象として特定する。   First, the sublink creation unit 44 identifies a URL as a sublink creation target (step S11). In the present embodiment, when the query acquired by the query acquisition unit 12 is a navigational query, the URL associated with the query in the navigational query DB 80 described above is specified as a creation target.

そして、その特定したURLが指し示すウェブページをインターネット上から取得して、該ウェブページ内のhrefタグ等により設定されているリンクURLを抽出する(ステップS12)。   Then, the web page indicated by the specified URL is acquired from the Internet, and the link URL set by the href tag or the like in the web page is extracted (step S12).

また、検索結果取得部42から検索結果のURL(検索URL)を検索エンジン20から取得して(ステップS13)、その検索URLの中から、サブリンクの作成対象のURLよりも下位の検索URLを選出する(ステップS14)。   In addition, a search result URL (search URL) is acquired from the search engine 20 from the search result acquisition unit 42 (step S13), and a search URL lower than the URL of the sublink creation target is selected from the search URL. Selected (step S14).

サブリンク作成部44は、ステップS11において抽出したリンクURLと、ステップS14において選出した検索URLとを比較し、一致すると判定したURLを収集する(ステップS15)。即ち、ナビゲーショナルクエリで検索したURLの中でも、作成対象のURLよりも下位にランキングされるURLが収集される。   The sublink creation unit 44 compares the link URL extracted in step S11 with the search URL selected in step S14, and collects URLs determined to match (step S15). That is, URLs that are ranked lower than the URL to be created are collected from the URLs searched by the navigational query.

そして、収集したリンクそれぞれと、クエリ取得部12から取得したクエリとの組み合わせに対応付けられたクリック回数をクリックログDB70から取得し、該リンクの中でクリック回数が上位のもの所定数(例えば3件)を、サブリンクとして決定する(ステップS16)。   Then, the number of clicks associated with the combination of each collected link and the query acquired from the query acquisition unit 12 is acquired from the click log DB 70, and a predetermined number (for example, 3) with the highest number of clicks in the link is acquired. Is determined as a sublink (step S16).

そして、作成対象のURLに対して決定したサブリンクに対応したサブリンクタイトルを検索結果取得部42が取得しているサブリンクタイトルの中から取得する(ステップS17)。尚、ステップS16において決定したサブリンクのURLに対応付けられたサブリンクタイトルをサブリンク作成部44が検索インデックス90に直接アクセスして取得することとしてもよい。   Then, a sublink title corresponding to the sublink determined for the URL to be created is acquired from the sublink titles acquired by the search result acquisition unit 42 (step S17). Note that the sublink creation unit 44 may directly access the search index 90 to obtain the sublink title associated with the sublink URL determined in step S16.

サブリンク作成部44は、作成対象のURLのサマリに表示するサブリンクを追加して、検索結果ページを生成する(ステップS18)。   The sublink creation unit 44 adds a sublink to be displayed in the summary of the URL to be created, and generates a search result page (step S18).

〔サブリンクタイトル生成処理〕
次に、サブリンクタイトル作成部22が行うサブリンクタイトル生成処理について図6を用いて説明する。
[Sublink title generation processing]
Next, sublink title generation processing performed by the sublink title creation unit 22 will be described with reference to FIG.

先ず、検索インデックス90に格納されているURLで示されるウェブページを取得する(ステップS31)。そして、該URLに対応付けられたクエリ、即ち、該URLに辿り着くために入力されたクエリをクリックログDB70から読み出す(ステップS32)。   First, the web page indicated by the URL stored in the search index 90 is acquired (step S31). Then, the query associated with the URL, that is, the query input to reach the URL is read from the click log DB 70 (step S32).

そして、読み出したクエリ中の文字列と、ウェブページ内の文字列とを比較し、類似する文字列をウェブページ内から抽出する(ステップS33)。具体的には、クエリに含まれる文字列と、ウェブページ内の文字列とをN−gram等により分割して、その分割した文字列内の一致する文字数によって類似度を算出することで、該類似度が高いクエリ内の文字列を抽出する。このように抽出した文字列をURLに対応するサブリンクタイトルとして、検索インデックス90に記憶する(ステップS34)。   Then, the character string in the read query is compared with the character string in the web page, and a similar character string is extracted from the web page (step S33). Specifically, the character string included in the query and the character string in the web page are divided by N-gram or the like, and the similarity is calculated by the number of matching characters in the divided character string. Extract strings in queries with high similarity. The character string extracted in this way is stored in the search index 90 as a sublink title corresponding to the URL (step S34).

例えば、図3に示すようにURL「http://www.yaho.co.jp/corp」のウェブページを取得する。そして、このURLに対応付けられたクエリとして図2に例示する「ヤホー」と「ヤホー 会社情報」とを読み出し、このクエリに含まれる「ヤホー」「会社情報」といった文字列に類似する文字列を「http://www.yaho.co.jp/corp」のウェブページから抽出する。   For example, as shown in FIG. 3, the web page of URL “http://www.yaho.co.jp/corp” is acquired. Then, “Yahoo” and “Yahoo company information” illustrated in FIG. 2 are read as queries associated with this URL, and character strings similar to the character strings such as “Yahoo” and “Company information” included in this query are read. Extract from "http://www.yaho.co.jp/corp" web page.

このとき、類似度が高い文字列として例えば「ヤホー」と「会社情報」との両方が抽出される場合には、それぞれを連結した文字列をサブリンクタイトルとしてよいが、一のURLに対応付けられた複数のサブリンクタイトル間やメインタイトルとの間に重複する文字列がある場合には、その重複箇所の文字列を削除することとしてもよい。これにより、ユーザがサブリンクにアクセスする際に用いられるクエリに基づいてサブリンクタイトルを生成することができる。   At this time, for example, when both “Yahoo” and “Company information” are extracted as character strings having a high degree of similarity, the concatenated character strings may be used as sublink titles, but they are associated with one URL. When there is an overlapping character string between a plurality of sublink titles and the main title, the character string at the overlapping portion may be deleted. Thereby, a sublink title can be generated based on a query used when a user accesses a sublink.

尚、サブリンクタイトル生成処理としては、次のようにしてもよい。即ち、URLで示されるウェブページを取得して、そのウェブページに形態素解析を施して出現頻度の高い語句やTF/IDFによる特徴的な単語を抽出して、その単語をサブリンクタイトルする。これにより、ウェブページの特徴を表す単語によりサブリンクが表されるようになる。また、検索結果と共に表示するサブリンクタイトルは、短いワードで表現されることが望ましいため、上述の方法のように単語単位でタイトルを生成することで、簡潔なサマリを作成することができる。   The sublink title generation process may be as follows. That is, a web page indicated by a URL is acquired, and morphological analysis is performed on the web page to extract words with high appearance frequency and characteristic words based on TF / IDF, and the words are sub-linked titles. Thereby, a sublink comes to be represented by the word showing the characteristic of a web page. Further, since it is desirable that the sublink title displayed together with the search result is expressed by a short word, a simple summary can be created by generating a title in units of words as described above.

以上のように作成されたサマリ情報を用いて生成した検索結果画面Wの表示例を図7に示す。図7によれば、検索結果画面内には検索結果のURL毎にサマリSMが表示されている。   A display example of the search result screen W generated using the summary information created as described above is shown in FIG. According to FIG. 7, the summary SM is displayed for each URL of the search result in the search result screen.

また、「ヤホー」というナビゲーショナルクエリに対して記憶されたサイトとして特定された「ヤホーホームページ」に対してはサブリンクSLが表示される。このサブリンクSLは、この検索結果の中でも、「ヤホーホームページ」よりも下位にランク付けされているURL(検索結果)のうちのクリック回数が高いものである。   Further, the sublink SL is displayed for the “Yahoo home page” specified as the site stored for the navigational query “Yahoo”. The sublink SL has a high click count among URLs (search results) ranked lower than the “Yahoo homepage” in the search results.

このように、サマリとして表示されるサブリンクでも、その表示対象の検索結果に対して下位にランク付けされ、且つ、ユーザの閲覧頻度の高いURLが該検索結果に対して纏め上げられて表示されるようになる。従って、検索結果のサマリ表示において、各検索結果間で重複したリンク表示を行わずに、無駄なリンク表示を低減して、検索結果画面の見易さを向上することができる。   In this way, even in the sublink displayed as a summary, URLs that are ranked lower than the search results to be displayed and that are frequently viewed by the user are collected and displayed for the search results. Become so. Therefore, in the summary display of the search results, it is possible to reduce the useless link display without performing the duplicate link display between the search results, and to improve the visibility of the search result screen.

<変形例>
以上、本発明の好適な実施の形態により本発明を説明した。ここでは特定の具体例を示して本発明を説明したが、特許請求の範囲に定義された本発明の広範な趣旨および範囲から逸脱することなく、これら具体例に様々な修正および変更を加えることができることは明らかである。すなわち、具体例の詳細および添付の図面により本発明が限定されるものと解釈してはならない。
<Modification>
The present invention has been described above by the preferred embodiments of the present invention. While the invention has been described with reference to specific embodiments, various modifications and changes may be made to the embodiments without departing from the broad spirit and scope of the invention as defined in the claims. Obviously you can. In other words, the present invention should not be construed as being limited by the details of the specific examples and the accompanying drawings.

例えば、サブリンクを作成する対象URLを、ナビゲーショナルクエリに対するサイトとして特定したが、クエリに対してクリック回数の高いURLを特定して、そのURLに対してサブリンクを作成することとしてもよいし、各検索結果のURLに対して作成することとしてもよい。この場合も、各検索結果の下位にランキングされた検索結果のURLが纏め上げられるようにしてサブリンクが作成されるため、重複したサブリンクの表示を防止することができる。   For example, the target URL for creating a sublink is specified as a site for a navigational query, but a URL with a high number of clicks may be specified for the query, and a sublink may be created for the URL. The URL may be created for each search result URL. Also in this case, since the sublinks are created so that the URLs of the search results ranked below each search result are collected, it is possible to prevent display of duplicate sublinks.

1 検索サーバ
10 リクエスト受信部
12 クエリ取得部
14 リダイレクト処理部
16 クリックログ収集部
20 検索エンジン
40 ページ生成部
42 検索結果取得部
44 サブリンク作成部
50 検索結果送信部
60 ナビゲーショナルクエリ抽出部
70 クリックログDB
80 ナビゲーショナルクエリDB
90 検索インデックス
SL サブリンク
SM サマリ
T ユーザ端末
DESCRIPTION OF SYMBOLS 1 Search server 10 Request receiving part 12 Query acquisition part 14 Redirect process part 16 Click log collection part 20 Search engine 40 Page generation part 42 Search result acquisition part 44 Sublink creation part 50 Search result transmission part 60 Navigational query extraction part 70 Click Log DB
80 Navigational Query DB
90 Search index SL Sublink SM Summary T User terminal

Claims (6)

クエリに対する検索結果である複数のランク付けされたリンク情報毎に表示するサマリ情報を作成するサマリ作成装置において、
前記検索結果内の特定のリンク情報よりも下位にランク付けされたリンク情報を該検索結果から取得する下位リンク取得手段と、
前記選択されたリンク情報が指し示すページ情報内に含まれるリンク情報を取得するページ内リンク取得手段と、
前記下位リンク取得手段が取得したリンク情報と、前記ページ内リンク取得手段が取得したリンク情報とが一致するリンク情報を前記特定のリンク情報のサブリンクとして収集して、該サブリンクを含む前記サマリ情報を作成するサマリ情報作成手段と、
を備えることを特徴とするサマリ作成装置。
In a summary creation device that creates summary information to be displayed for each of a plurality of ranked link information that is a search result for a query,
Lower link acquisition means for acquiring link information ranked lower than the specific link information in the search result, from the search result;
In-page link acquisition means for acquiring link information included in the page information indicated by the selected link information;
The link information that the link information acquired by the lower link acquisition unit and the link information acquired by the in-page link acquisition unit match is collected as a sublink of the specific link information, and the summary including the sublink is collected. Summary information creation means for creating information;
A summary creation device comprising:
前記サマリ情報作成手段は、
前記リンク情報に対する個々のユーザ選択の履歴であるクリックログに基づいて、前記一致するリンク情報のうち、前記ユーザ選択の回数が上位所定数のリンク情報を前記サブリンクとして収集することを特徴とする請求項1に記載のサマリ作成装置。
The summary information creating means includes:
Based on a click log that is a history of individual user selection with respect to the link information, among the matching link information, link information having a predetermined number of higher user selections is collected as the sublink. The summary creation apparatus according to claim 1.
前記サマリ情報は、前記サブリンクのリンク情報と表示タイトルとを含み、
前記サマリ情報作成手段は、
前記サブリンクが指し示すページ情報内に含まれる文字列に基づいて該サブリンクの表示タイトルを生成することを特徴とする請求項1又は2に記載のサマリ作成装置。
The summary information includes link information and a display title of the sublink,
The summary information creating means includes:
The summary creation device according to claim 1, wherein a display title of the sublink is generated based on a character string included in page information indicated by the sublink.
前記クエリと、該クエリに対する検索結果としての前記リンク情報に対する個々のユーザ選択の履歴とを対応付けて記憶したクリックログに基づいて、
前記クエリに対する検索結果内で選択回数が最上位のリンク情報を前記特定のリンク情報として決定する特定リンク決定手段を更に備えることを特徴とする請求項1〜3の何れかに記載のサマリ作成装置。
Based on the click log stored in association with the query and the history of individual user selection for the link information as a search result for the query,
The summary creation device according to any one of claims 1 to 3, further comprising specific link determination means for determining, as the specific link information, link information having the highest number of selections in a search result for the query. .
コンピュータが、クエリに対する検索結果である複数のランク付けされたリンク情報毎に表示するサマリ情報を作成するサマリ作成方法において、
前記検索結果内の特定のリンク情報よりも下位にランク付けされたリンク情報を該検索結果から取得する下位リンク取得ステップと、
前記選択されたリンク情報が指し示すページ情報内に含まれるリンク情報を取得するページ内リンク取得ステップと、
前記下位リンク取得ステップにおいて取得したリンク情報と、前記ページ内リンク取得ステップにおいて取得したリンク情報とが一致するリンク情報を前記特定のリンク情報のサブリンクとして収集して、該サブリンクを含む前記サマリ情報を作成するサマリ情報作成ステップと、
を前記コンピュータが行うことを特徴とサマリ作成方法。
In a summary creation method in which a computer creates summary information to be displayed for each of a plurality of ranked link information that is a search result for a query,
A lower link acquisition step of acquiring link information ranked lower than the specific link information in the search result from the search result;
In-page link acquisition step of acquiring link information included in the page information indicated by the selected link information;
Collecting link information in which the link information acquired in the lower link acquisition step matches the link information acquired in the intra-page link acquisition step as a sublink of the specific link information, and the summary including the sublink Summary information creation step to create information,
And a summary creation method.
クエリに対する検索結果である複数のランク付けされたリンク情報毎に表示するサマリ情報を作成するサマリ作成装置のコンピュータを機能させるためのプログラムであって、
前記検索結果内の特定のリンク情報よりも下位にランク付けされたリンク情報を該検索結果から取得する下位リンク取得ステップと、
前記選択されたリンク情報が指し示すページ情報内に含まれるリンク情報を取得するページ内リンク取得ステップと、
前記下位リンク取得ステップにおいて取得したリンク情報と、前記ページ内リンク取得ステップにおいて取得したリンク情報とが一致するリンク情報を前記特定のリンク情報のサブリンクとして収集して、該サブリンクを含む前記サマリ情報を作成するサマリ情報作成ステップと、
を前記コンピュータに実行させるためのプログラム。
A program for causing a computer of a summary creation device to create summary information to be displayed for each of a plurality of ranked link information, which is a search result for a query,
A lower link acquisition step of acquiring link information ranked lower than the specific link information in the search result from the search result;
In-page link acquisition step of acquiring link information included in the page information indicated by the selected link information;
Collecting link information in which the link information acquired in the lower link acquisition step matches the link information acquired in the intra-page link acquisition step as a sublink of the specific link information, and the summary including the sublink Summary information creation step to create information,
For causing the computer to execute.
JP2010058651A 2010-03-16 2010-03-16 Summary creation device, summary creation method and program Active JP5084858B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010058651A JP5084858B2 (en) 2010-03-16 2010-03-16 Summary creation device, summary creation method and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010058651A JP5084858B2 (en) 2010-03-16 2010-03-16 Summary creation device, summary creation method and program

Publications (2)

Publication Number Publication Date
JP2011192102A true JP2011192102A (en) 2011-09-29
JP5084858B2 JP5084858B2 (en) 2012-11-28

Family

ID=44796921

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010058651A Active JP5084858B2 (en) 2010-03-16 2010-03-16 Summary creation device, summary creation method and program

Country Status (1)

Country Link
JP (1) JP5084858B2 (en)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013222429A (en) * 2012-04-19 2013-10-28 Nippon Telegr & Teleph Corp <Ntt> Link area highlighting device and operating method thereof
WO2014120372A1 (en) * 2013-01-31 2014-08-07 Google Inc. Enhancing sitelinks with creative content
JP2017528782A (en) * 2015-07-08 2017-09-28 バイドゥ・ユーエスエイ・リミテッド・ライアビリティ・カンパニーBaidu USA LLC System and method for connecting data by routing data through interaction between user and content data
US9922334B1 (en) 2012-04-06 2018-03-20 Google Llc Providing an advertisement based on a minimum number of exposures
US10032452B1 (en) 2016-12-30 2018-07-24 Google Llc Multimodal transmission of packetized data
JP2018533136A (en) * 2015-09-22 2018-11-08 アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited Information retrieval method and apparatus
US10152723B2 (en) 2012-05-23 2018-12-11 Google Llc Methods and systems for identifying new computers and providing matching services
JP2019153323A (en) * 2012-01-19 2019-09-12 グーグル エルエルシー System, method and storage medium for improving access to search result
US10593329B2 (en) 2016-12-30 2020-03-17 Google Llc Multimodal transmission of packetized data
US10708313B2 (en) 2016-12-30 2020-07-07 Google Llc Multimodal transmission of packetized data
US10735552B2 (en) 2013-01-31 2020-08-04 Google Llc Secondary transmissions of packetized data
US10776830B2 (en) 2012-05-23 2020-09-15 Google Llc Methods and systems for identifying new computers and providing matching services

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09204436A (en) * 1996-01-26 1997-08-05 Nippon Telegr & Teleph Corp <Ntt> Method and device for searching information space
JP2002149668A (en) * 2000-11-10 2002-05-24 Mieko Tsuyusaki Internet auxiliary software and recording medium having the same software recorded

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09204436A (en) * 1996-01-26 1997-08-05 Nippon Telegr & Teleph Corp <Ntt> Method and device for searching information space
JP2002149668A (en) * 2000-11-10 2002-05-24 Mieko Tsuyusaki Internet auxiliary software and recording medium having the same software recorded

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019153323A (en) * 2012-01-19 2019-09-12 グーグル エルエルシー System, method and storage medium for improving access to search result
US9922334B1 (en) 2012-04-06 2018-03-20 Google Llc Providing an advertisement based on a minimum number of exposures
JP2013222429A (en) * 2012-04-19 2013-10-28 Nippon Telegr & Teleph Corp <Ntt> Link area highlighting device and operating method thereof
US10152723B2 (en) 2012-05-23 2018-12-11 Google Llc Methods and systems for identifying new computers and providing matching services
US10776830B2 (en) 2012-05-23 2020-09-15 Google Llc Methods and systems for identifying new computers and providing matching services
US10776435B2 (en) 2013-01-31 2020-09-15 Google Llc Canonicalized online document sitelink generation
WO2014120372A1 (en) * 2013-01-31 2014-08-07 Google Inc. Enhancing sitelinks with creative content
US10735552B2 (en) 2013-01-31 2020-08-04 Google Llc Secondary transmissions of packetized data
US10650066B2 (en) 2013-01-31 2020-05-12 Google Llc Enhancing sitelinks with creative content
JP2017528782A (en) * 2015-07-08 2017-09-28 バイドゥ・ユーエスエイ・リミテッド・ライアビリティ・カンパニーBaidu USA LLC System and method for connecting data by routing data through interaction between user and content data
JP2018533136A (en) * 2015-09-22 2018-11-08 アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited Information retrieval method and apparatus
US10593329B2 (en) 2016-12-30 2020-03-17 Google Llc Multimodal transmission of packetized data
US10535348B2 (en) 2016-12-30 2020-01-14 Google Llc Multimodal transmission of packetized data
US10708313B2 (en) 2016-12-30 2020-07-07 Google Llc Multimodal transmission of packetized data
US10032452B1 (en) 2016-12-30 2018-07-24 Google Llc Multimodal transmission of packetized data
US10748541B2 (en) 2016-12-30 2020-08-18 Google Llc Multimodal transmission of packetized data
US11087760B2 (en) 2016-12-30 2021-08-10 Google, Llc Multimodal transmission of packetized data
US11381609B2 (en) 2016-12-30 2022-07-05 Google Llc Multimodal transmission of packetized data
US11705121B2 (en) 2016-12-30 2023-07-18 Google Llc Multimodal transmission of packetized data
US11930050B2 (en) 2016-12-30 2024-03-12 Google Llc Multimodal transmission of packetized data

Also Published As

Publication number Publication date
JP5084858B2 (en) 2012-11-28

Similar Documents

Publication Publication Date Title
JP5084858B2 (en) Summary creation device, summary creation method and program
US8515954B2 (en) Displaying autocompletion of partial search query with predicted search results
US8271546B2 (en) Method and system for URL autocompletion using ranked results
JP5638031B2 (en) Rating method, search result classification method, rating system, and search result classification system
US7475074B2 (en) Web search system and method thereof
KR20130132757A (en) Predictive query suggestion caching
US8180751B2 (en) Using an encyclopedia to build user profiles
KR20090006464A (en) Device, method, recording medium for providing customized content
JP2015525929A (en) Weight-based stemming to improve search quality
JP2009037501A (en) Information retrieval apparatus, information retrieval method and program
JP2010128928A (en) Retrieval system and retrieval method
JP2011138248A (en) Search supporting program, search supporting device, and method for search supporting
JP2007256992A (en) Content specifying method and device
KR100455439B1 (en) Internet resource retrieval and browsing method based on expanded web site map and expanded natural domain names assigned to all web resources
KR20100132376A (en) Apparatus and method for providing snippet
JP4839295B2 (en) Query extraction method, query extraction device, and query extraction program
JP4824070B2 (en) Search processing apparatus, search processing method and program for selecting seed of crawler for specialized search using click log
KR20140091375A (en) System and method for searching semantic contents using user query expansion
JP2004280569A (en) Information monitoring device
JP5297295B2 (en) WWW information browsing system and method, and Web browser and program
JP5286007B2 (en) Document search device, document search method, and document search program
JP2007034464A5 (en)
JP5416023B2 (en) Reading terminal and method
JP5002631B2 (en) Word information collection device, word information collection method, and word information collection program
EP2662785A2 (en) A method and system for non-ephemeral search

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120802

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120814

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120904

R150 Certificate of patent or registration of utility model

Ref document number: 5084858

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150914

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250