JP2011100302A - ランキング関数生成装置、ランキング関数生成方法、ランキング関数生成プログラム - Google Patents
ランキング関数生成装置、ランキング関数生成方法、ランキング関数生成プログラム Download PDFInfo
- Publication number
- JP2011100302A JP2011100302A JP2009254517A JP2009254517A JP2011100302A JP 2011100302 A JP2011100302 A JP 2011100302A JP 2009254517 A JP2009254517 A JP 2009254517A JP 2009254517 A JP2009254517 A JP 2009254517A JP 2011100302 A JP2011100302 A JP 2011100302A
- Authority
- JP
- Japan
- Prior art keywords
- database
- page
- search query
- identifier
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】特徴抽出機能部20は、DB10のページ識別子ごとにDB30の格納情報を取得し、検索クエリが本文中に出現する頻度とDB30のランクとから特徴値を算出し、DB40に格納する。DB50にはページ識別子・検索クエリ・Webページのクリック情報が格納されている。推定器生成機能部60は、DB50のページ識別子と検索クエリごとにクリック情報と特徴値との関係を示す1変数関数/多変数関数を持つ推定器を生成する。推定器の関数に特徴データベースの特徴値を入力して算出した推定クリック情報がDB80に格納されている。ランキング関数生成機能部90は、DB30のランクとDB40の特徴値とDB80の推定クリック情報とから順序付き学習をし、ランキング関数を生成する。
【選択図】図1
Description
図1に基づき本発明の実施形態に係るランキング関数生成装置を説明する。このランキング関数生成装置1は、図示省略のユーザ端末からの検索命令に従ってWebページ集合を検索するWeb検索システム(いわゆる検索エンジン)を構成する。
(1)クリックログDB50
推定器生成機能部60は、クリックログDB50の格納データと特徴DB40の格納データとを入力として推定器生成ステップを実施し、クリック数を推定するための特徴推定器70を生成する。特徴推定器70の生成は以下のように行う。
推定器生成機能部60により生成された特徴推定器70は、特徴DB40の格納情報、即ちWebページの特徴値を入力として、推定クリック数算出ステップを実施し、1変数関数あるいは多変数関数を用いて推定クリック数を算出する。
ランキング関数生成機能部90は、ランキング関数生成ステップを実施し、人手正解DB30の格納データと、特徴DB40の格納データと、推定クリックログDB80の格納データとを入力として、ランキング関数100を生成する。通常は、<クエリ,ページ識別子>ペアに対して表2の評価点数(ランク)および表3の特徴値が付与されていれば、非特許文献1のようなランキング関数生成手法を用いて、ランキング関数100を生成できる。
本発明は、ランキング関数生成装置1の各部10〜90の一部もしくは全部として、コンピュータを機能させるプログラムとして構成することもできる。このプログラムによれば、前記各ステップの全てあるいは一部がコンピュータにより実行される。
2…特徴推定機能手段
10…WebページDB(第1データベース)
20…特徴抽出機能部(特徴推定手段)
30…人手正解DB(第2データベース、評価データベース)
40…特徴DB
50…クリックログDB(第3データベース)
60…推定器生成機能部(推定器生成手段)
70…特徴推定器(推定器)
80…推定クリックログDB
90…ランキング関数生成機能部(ランキング関数生成手段)
100…ランキング関数
Claims (5)
- 検索クエリに基づきWebページの集合を検索した検索結果をランキングするためのランキング関数を生成する装置であって、
検索対象の各Webページのページ識別子と該ページの本文とを対応付けて格納する第1データベースと、
検索ログに基づき検索クエリに対する検索対象のWebページのランクを前記ページ識別子と対応付けて格納する第2データベースと、
第1データベースのページ識別子ごとに第2データベースの格納情報を取得し、該識別子に対応する検索クエリの前記ページ本文への関連度と、第2データベースの該識別子に応じたランクとから特徴値を算出し、算出された特徴値を前記ページ識別子と前記クエリとに対応付ける手段と、
前記ページ識別子、前記検索クエリ、Webページの利用情報をそれぞれ対応付けて格納する第3データベースと、
第3データベースのページ識別子と検索クエリごとに前記特徴値および前記利用情報に基づき該両者の関係を示す関数を持つ推定器を生成し、該推定器の関数に前記特徴値を入力して前記利用情報の推定結果を算出し、該推定結果を前記ページ識別子と前記検索クエリとに対応付ける手段と、
第2データベースのページ識別子と検索クエリごとに、それぞれ対応する前記ランク、前記特徴値、前記推定結果に基づき順序付き学習を行ってランキング関数を生成する手段と、
を備えることを特徴とするランキング関数生成装置。 - 検索クエリに基づきWebページの集合を検索した検索結果をランキングするためのランキング関数を生成する装置であって、
検索対象の各Webページのページ識別子と該ページの本文とを対応付けて格納するWebページデータベースと、
検索ログに基づき検索クエリに対する検索対象のWebページのランクを前記ページ識別子と対応付けて格納する評価データベースと、
Webデータベースのページ識別子ごとに評価データベースの格納情報を取得し、該識別子に対応する検索クエリの前記ページ本文への関連度と、評価データベースの該識別子に応じたランクとから特徴値を算出し、該特徴値を前記ページ識別子と前記クエリに対応付けて特徴データベースに格納する特徴抽出手段と、
前記ページ識別子、検索クエリ、Webページのクリック情報をそれぞれ対応付けて格納するクリックログデータベースと、
クリックログデータベースのページ識別子と検索クエリごとに、該データベースのクリック情報と特徴データベースの特徴値との関係を示す関数を持つ推定器を生成する推定器生成手段と、
クリックログデータベースのページ識別子と検索クエリごとに推定器の関数に特徴データベースの特徴値を入力して算出した推定クリック情報を、前記ページ識別子と前記検索クエリとに対応付けて格納する推定クリッログデータベースと、
評価データベースのページ識別子と検索クエリごとに、それぞれ対応する評価データベースのランクと特徴データベースの特徴値と推定クリックログデータベースの推定クリック情報とから順序付き学習を行ってランキング関数を生成するランキング関数生成手段と、
を備えることを特徴とするランキング関数生成装置。 - 検索対象の各Webページのページ識別子と該ページの本文とを対応付けて格納する第1データベースと、
検索ログに基づき検索クエリに対する検索対象のWebページのランクを前記ページ識別子と対応付けて格納する第2データベースと、
前記ページ識別子、前記検索クエリ、Webページの利用情報をそれぞれ対応付けて格納する第3データベースと、を備えたランキング関数生成装置を通じて、検索クエリに基づきWebページの集合を検索した検索結果をランキングするためのランキング関数を生成する方法であって、
特徴抽出手段が、第1データベースのページ識別子ごとに第2データベースの格納情報を取得し、該識別子に対応する検索クエリの前記ページ本文への関連度と、第2データベースの該識別子に応じたランクとから特徴値を算出し、算出された特徴値を前記ページ識別子と前記クエリとに対応付けるステップと、
推定器生成手段が、第3データベースのページ識別子と検索クエリごとに前記特徴値および前記利用情報に基づき該両者の関係を示す関数を持つ推定器を生成し、該推定器の関数に前記特徴値を入力して前記利用情報の推定結果を算出し、該推計結果を前記ページ識別子と前記検索クエリとに対応付けるステップと、
ランキング関数生成手段が、第2データベースのページ識別子と検索クエリごとに、それぞれ対応する前記ランク、前記特徴値、前記推定結果に基づき順序付き学習を行ってランキング関数を生成するステップと、
を有することを特徴とするランキング関数生成方法。 - 検索対象の各Webページのページ識別子と該ページの本文とを対応付けて格納するWebページデータベースと、
検索ログに基づき検索クエリに対する検索対象のWebページのランクを前記ページ識別子と対応付けて格納する評価データベースと、
前記ページ識別子、検索クエリ、Webページのクリック情報をそれぞれ対応付けて格納するクリックログデータベースと、を備えたランキング関数生成装置を通じて、検索クエリに基づきWebページの集合を検索した検索結果をランキングするためのランキング関数を生成する方法であって、
特徴抽出手段が、Webデータベースのページ識別子ごとに評価データベースの格納情報を取得し、該識別子に対応する検索クエリの前記ページ本文への関連度と、評価データベースの該識別子に応じたランクとから特徴値を算出し、該特徴値を前記ページ識別子と前記クエリとに対応付けて特徴データベースに格納するステップと、
推定器生成手段が、クリックログデータベースのページ識別子と検索クエリごとに、該データベースのクリック情報と特徴データベースの特徴値との関係を示す関数を持つ推定器を生成するステップと、
クリックログデータベースのページ識別子と検索クエリごとに推定器の関数に特徴データベースの特徴値を入力して算出した推定クリック情報を、前記ページ識別子と前記検索クエリとに対応付けて推定クリッログデータベースに格納するステップと、
ランキング関数生成手段が、評価データベースのページ識別子と検索クエリごとに、それぞれ対応する評価データベースのランクと特徴データベースの特徴値と推定クリックログデータベースの推定クリック情報とから順序付き学習を行ってランキング関数を生成するステップと、
を有することを特徴とするランキング関数生成方法。 - 請求項1または2のいずれか1項に記載のランキング関数生成装置としてコンピュータを機能させるためのランキング関数生成プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009254517A JP5416552B2 (ja) | 2009-11-06 | 2009-11-06 | ランキング関数生成装置、ランキング関数生成方法、ランキング関数生成プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009254517A JP5416552B2 (ja) | 2009-11-06 | 2009-11-06 | ランキング関数生成装置、ランキング関数生成方法、ランキング関数生成プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011100302A true JP2011100302A (ja) | 2011-05-19 |
JP5416552B2 JP5416552B2 (ja) | 2014-02-12 |
Family
ID=44191424
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009254517A Expired - Fee Related JP5416552B2 (ja) | 2009-11-06 | 2009-11-06 | ランキング関数生成装置、ランキング関数生成方法、ランキング関数生成プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5416552B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013061718A (ja) * | 2011-09-12 | 2013-04-04 | Nippon Telegr & Teleph Corp <Ntt> | サポートベクタ選択装置、方法、及びプログラム |
JP2017535866A (ja) * | 2014-11-21 | 2017-11-30 | マイクロソフト テクノロジー ライセンシング,エルエルシー | ランキング関数のオフライン評価 |
JPWO2021234775A1 (ja) * | 2020-05-18 | 2021-11-25 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008097546A (ja) * | 2006-10-16 | 2008-04-24 | Cirius Technologies Inc | 広告方法、広告システム及び広告プログラム |
-
2009
- 2009-11-06 JP JP2009254517A patent/JP5416552B2/ja not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008097546A (ja) * | 2006-10-16 | 2008-04-24 | Cirius Technologies Inc | 広告方法、広告システム及び広告プログラム |
Non-Patent Citations (1)
Title |
---|
JPN7013002099; Thorsten Joachims: 'Optimizing Search Engines using Clickthrough Data' '02 Proceedings of the eighth ACM SIGKDD international conference on Knowledge discovery and data mi , 2002, page133-142, ACM * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013061718A (ja) * | 2011-09-12 | 2013-04-04 | Nippon Telegr & Teleph Corp <Ntt> | サポートベクタ選択装置、方法、及びプログラム |
JP2017535866A (ja) * | 2014-11-21 | 2017-11-30 | マイクロソフト テクノロジー ライセンシング,エルエルシー | ランキング関数のオフライン評価 |
US11636120B2 (en) | 2014-11-21 | 2023-04-25 | Microsoft Technology Licensing, Llc | Offline evaluation of ranking functions |
JPWO2021234775A1 (ja) * | 2020-05-18 | 2021-11-25 | ||
WO2021234775A1 (ja) * | 2020-05-18 | 2021-11-25 | 日本電信電話株式会社 | ランキング関数生成装置、ランキング関数生成方法及びプログラム |
JP7355237B2 (ja) | 2020-05-18 | 2023-10-03 | 日本電信電話株式会社 | ランキング関数生成装置、ランキング関数生成方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP5416552B2 (ja) | 2014-02-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5492187B2 (ja) | 編集距離および文書情報を使用する検索結果順位付け | |
US8990241B2 (en) | System and method for recommending queries related to trending topics based on a received query | |
RU2517271C2 (ru) | Длина документа в качестве статического признака релевантности для ранжирования результатов поиска | |
US20110314011A1 (en) | Automatically generating training data | |
US8977625B2 (en) | Inference indexing | |
WO2016000555A1 (zh) | 基于社交网络的内容、新闻推荐方法和系统 | |
US8515986B2 (en) | Query pattern generation for answers coverage expansion | |
US20120016863A1 (en) | Enriching metadata of categorized documents for search | |
JP5237353B2 (ja) | 検索装置、検索システム、検索方法、検索プログラム、及び検索プログラムを記憶するコンピュータ読取可能な記録媒体 | |
US9251202B1 (en) | Corpus specific queries for corpora from search query | |
US20160063061A1 (en) | Ranking documents with topics within graph | |
JP5416552B2 (ja) | ランキング関数生成装置、ランキング関数生成方法、ランキング関数生成プログラム | |
JP4912384B2 (ja) | 文書検索装置、文書検索方法、および文書検索プログラム | |
JP2007334590A (ja) | 情報ランキング方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体 | |
US10176264B2 (en) | Generating topic pages based on data sources | |
JP4759600B2 (ja) | 文章検索装置、文章検索方法、文章検索プログラムおよびその記録媒体 | |
JP5292336B2 (ja) | 検索システムユーザの分野ごとにおける知識量推定装置、知識量推定方法および知識量推定プログラム | |
JP2011100191A (ja) | 文書検索装置、文書検索方法、及び文書検索プログラム | |
JP2006228116A (ja) | ウェブページリンク判定方法およびウェブページリンク判定装置 | |
JP5393392B2 (ja) | 時間表現抽出装置、時間表現抽出方法および時間表現抽出プログラム | |
TW201209744A (en) | Method of recording information of merchandise visited by consumers, and searching method and server | |
JP5358481B2 (ja) | 文書検索装置、文書検索方法、文書検索プログラム | |
JP5235730B2 (ja) | 文書検索装置、文書検索方法および文書検索プログラム | |
JP2011022624A (ja) | ウェブページ検索システム、ウェブページ検索方法、ウェブページ検索サーバ及びウェブページ検索プログラム | |
JP5378272B2 (ja) | クエリ特徴量算出方法及び装置及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120130 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130530 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130611 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130809 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130903 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131025 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131112 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131115 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5416552 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |