JP5416552B2 - ランキング関数生成装置、ランキング関数生成方法、ランキング関数生成プログラム - Google Patents
ランキング関数生成装置、ランキング関数生成方法、ランキング関数生成プログラム Download PDFInfo
- Publication number
- JP5416552B2 JP5416552B2 JP2009254517A JP2009254517A JP5416552B2 JP 5416552 B2 JP5416552 B2 JP 5416552B2 JP 2009254517 A JP2009254517 A JP 2009254517A JP 2009254517 A JP2009254517 A JP 2009254517A JP 5416552 B2 JP5416552 B2 JP 5416552B2
- Authority
- JP
- Japan
- Prior art keywords
- database
- feature
- page
- identifier
- search query
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
検索対象の各Webページのページ識別子と該ページの本文とを対応付けて格納するWebページデータベースと、検索ログに基づき検索クエリに対する検索対象のWebページのランクを前記ページ識別子と対応付けて格納する評価データベースと、Webページデータベースのページ識別子ごとに評価データベースの格納情報を取得し、該識別子に対応する検索クエリの前記ページ本文への関連度と、評価データベースの該識別子に応じたクエリとページ識別子とのペアについて特徴値を算出し、該特徴値を前記ページ識別子と前記クエリに対応付けて特徴データベースに格納する特徴抽出手段と、前記ページ識別子、検索クエリ、Webページのクリック情報をそれぞれ対応付けて格納するクリックログデータベースと、前記特徴データベースと前記クリックログデータベースのいずれにも格納されているページ識別子と検索クエリのペアを使って、該クリックログデータベースのクリック情報と特徴データベースの特徴値との関係を示す関数を持つ推定器を生成する推定器生成手段と、クリックログデータベースのページ識別子と検索クエリごとに推定器の関数に特徴データベースの特徴値を入力して算出した推定クリック情報を、前記ページ識別子と前記検索クエリとに対応付けて格納する推定クリックログデータベースと、評価データベースのページ識別子と検索クエリごとに、それぞれ対応する評価データベースのランクと特徴データベースの特徴値と推定クリックログデータベースの推定クリック情報とから順序付き学習を行ってランキング関数を生成するランキング関数生成手段と、を備える。
図1に基づき本発明の実施形態に係るランキング関数生成装置を説明する。このランキング関数生成装置1は、図示省略のユーザ端末からの検索命令に従ってWebページ集合を検索するWeb検索システム(いわゆる検索エンジン)を構成する。
(1)クリックログDB50
推定器生成機能部60は、クリックログDB50の格納データと特徴DB40の格納データとを入力として推定器生成ステップを実施し、クリック数を推定するための特徴推定器70を生成する。特徴推定器70の生成は以下のように行う。
推定器生成機能部60により生成された特徴推定器70は、特徴DB40の格納情報、即ちWebページの特徴値を入力として、推定クリック数算出ステップを実施し、1変数関数あるいは多変数関数を用いて推定クリック数を算出する。
ランキング関数生成機能部90は、ランキング関数生成ステップを実施し、人手正解DB30の格納データと、特徴DB40の格納データと、推定クリックログDB80の格納データとを入力として、ランキング関数100を生成する。通常は、<クエリ,ページ識別子>ペアに対して表2の評価点数(ランク)および表3の特徴値が付与されていれば、非特許文献1のようなランキング関数生成手法を用いて、ランキング関数100を生成できる。
本発明は、ランキング関数生成装置1の各部10〜90の一部もしくは全部として、コンピュータを機能させるプログラムとして構成することもできる。このプログラムによれば、前記各ステップの全てあるいは一部がコンピュータにより実行される。
2…特徴推定機能手段
10…WebページDB(第1データベース)
20…特徴抽出機能部(特徴推定手段)
30…人手正解DB(第2データベース、評価データベース)
40…特徴DB
50…クリックログDB(第3データベース)
60…推定器生成機能部(推定器生成手段)
70…特徴推定器(推定器)
80…推定クリックログDB
90…ランキング関数生成機能部(ランキング関数生成手段)
100…ランキング関数
Claims (3)
- 検索クエリに基づきWebページの集合を検索した検索結果をランキングするためのランキング関数を生成する装置であって、
検索対象の各Webページのページ識別子と該ページの本文とを対応付けて格納するWebページデータベースと、
検索ログに基づき検索クエリに対する検索対象のWebページのランクを前記ページ識別子と対応付けて格納する評価データベースと、
Webページデータベースのページ識別子ごとに評価データベースの格納情報を取得し、該識別子に対応する検索クエリの前記ページ本文への関連度と、評価データベースの該識別子に応じたクエリとページ識別子とのペアについて特徴値を算出し、該特徴値を前記ページ識別子と前記クエリに対応付けて特徴データベースに格納する特徴抽出手段と、
前記ページ識別子、検索クエリ、Webページのクリック情報をそれぞれ対応付けて格納するクリックログデータベースと、
前記特徴データベースと前記クリックログデータベースのいずれにも格納されているページ識別子と検索クエリのペアを使って、該クリックログデータベースのクリック情報と特徴データベースの特徴値との関係を示す関数を持つ推定器を生成する推定器生成手段と、
クリックログデータベースのページ識別子と検索クエリごとに推定器の関数に特徴データベースの特徴値を入力して算出した推定クリック情報を、前記ページ識別子と前記検索クエリとに対応付けて格納する推定クリックログデータベースと、
評価データベースのページ識別子と検索クエリごとに、それぞれ対応する評価データベースのランクと特徴データベースの特徴値と推定クリックログデータベースの推定クリック情報とから順序付き学習を行ってランキング関数を生成するランキング関数生成手段と、
を備えることを特徴とするランキング関数生成装置。 - 検索対象の各Webページのページ識別子と該ページの本文とを対応付けて格納するWebページデータベースと、
検索ログに基づき検索クエリに対する検索対象のWebページのランクを前記ページ識別子と対応付けて格納する評価データベースと、
前記ページ識別子、検索クエリ、Webページのクリック情報をそれぞれ対応付けて格納するクリックログデータベースと、を備えたランキング関数生成装置を通じて、検索クエリに基づきWebページの集合を検索した検索結果をランキングするためのランキング関数を生成する方法であって、
特徴抽出手段が、Webページデータベースのページ識別子ごとに評価データベースの格納情報を取得し、該識別子に対応する検索クエリの前記ページ本文への関連度と、評価データベースの該識別子に応じたクエリとページ識別子とのペアについて特徴値を算出し、該特徴値を前記ページ識別子と前記クエリとに対応付けて特徴データベースに格納するステップと、
推定器生成手段が、前記特徴データベースと前記クリックログデータベースのいずれにも格納されているページ識別子と検索クエリのペアを使って、該クリックログデータベースのクリック情報と特徴データベースの特徴値との関係を示す関数を持つ推定器を生成するステップと、
クリックログデータベースのページ識別子と検索クエリごとに推定器の関数に特徴データベースの特徴値を入力して算出した推定クリック情報を、前記ページ識別子と前記検索クエリとに対応付けて推定クリックログデータベースに格納するステップと、
ランキング関数生成手段が、評価データベースのページ識別子と検索クエリごとに、それぞれ対応する評価データベースのランクと特徴データベースの特徴値と推定クリックログデータベースの推定クリック情報とから順序付き学習を行ってランキング関数を生成するステップと、
を有することを特徴とするランキング関数生成方法。 - 請求項1記載のランキング関数生成装置としてコンピュータを機能させるためのランキング関数生成プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009254517A JP5416552B2 (ja) | 2009-11-06 | 2009-11-06 | ランキング関数生成装置、ランキング関数生成方法、ランキング関数生成プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009254517A JP5416552B2 (ja) | 2009-11-06 | 2009-11-06 | ランキング関数生成装置、ランキング関数生成方法、ランキング関数生成プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011100302A JP2011100302A (ja) | 2011-05-19 |
JP5416552B2 true JP5416552B2 (ja) | 2014-02-12 |
Family
ID=44191424
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009254517A Expired - Fee Related JP5416552B2 (ja) | 2009-11-06 | 2009-11-06 | ランキング関数生成装置、ランキング関数生成方法、ランキング関数生成プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5416552B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5684077B2 (ja) * | 2011-09-12 | 2015-03-11 | 日本電信電話株式会社 | サポートベクタ選択装置、方法、及びプログラム |
US11636120B2 (en) * | 2014-11-21 | 2023-04-25 | Microsoft Technology Licensing, Llc | Offline evaluation of ranking functions |
US20230196097A1 (en) * | 2020-05-18 | 2023-06-22 | Nippon Telegraph And Telephone Corporation | Ranking function generating apparatus, ranking function generating method and program |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008097546A (ja) * | 2006-10-16 | 2008-04-24 | Cirius Technologies Inc | 広告方法、広告システム及び広告プログラム |
-
2009
- 2009-11-06 JP JP2009254517A patent/JP5416552B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2011100302A (ja) | 2011-05-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8990241B2 (en) | System and method for recommending queries related to trending topics based on a received query | |
CN101828185B (zh) | 部分地基于多个点进特征来排名并提供搜索结果 | |
RU2517271C2 (ru) | Длина документа в качестве статического признака релевантности для ранжирования результатов поиска | |
JP2011516989A (ja) | 編集距離および文書情報を使用する検索結果順位付け | |
JP4930153B2 (ja) | 文書検索システム、文書番号部分列取得装置、および文書検索方法 | |
US8977625B2 (en) | Inference indexing | |
US20070162408A1 (en) | Content Object Indexing Using Domain Knowledge | |
JP5237353B2 (ja) | 検索装置、検索システム、検索方法、検索プログラム、及び検索プログラムを記憶するコンピュータ読取可能な記録媒体 | |
JP2009122807A (ja) | 連想検索システム | |
JP5416552B2 (ja) | ランキング関数生成装置、ランキング関数生成方法、ランキング関数生成プログラム | |
JP4912384B2 (ja) | 文書検索装置、文書検索方法、および文書検索プログラム | |
JP4759600B2 (ja) | 文章検索装置、文章検索方法、文章検索プログラムおよびその記録媒体 | |
JP2007334590A (ja) | 情報ランキング方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体 | |
US10176264B2 (en) | Generating topic pages based on data sources | |
JP5292336B2 (ja) | 検索システムユーザの分野ごとにおける知識量推定装置、知識量推定方法および知識量推定プログラム | |
JP2011100191A (ja) | 文書検索装置、文書検索方法、及び文書検索プログラム | |
JP5286007B2 (ja) | 文書検索装置、文書検索方法、および文書検索プログラム | |
JP2006228116A (ja) | ウェブページリンク判定方法およびウェブページリンク判定装置 | |
JP5358481B2 (ja) | 文書検索装置、文書検索方法、文書検索プログラム | |
JP5235730B2 (ja) | 文書検索装置、文書検索方法および文書検索プログラム | |
JP5393392B2 (ja) | 時間表現抽出装置、時間表現抽出方法および時間表現抽出プログラム | |
JP5378272B2 (ja) | クエリ特徴量算出方法及び装置及びプログラム | |
JP2010122932A (ja) | 文書検索装置、文書検索方法、および文書検索プログラム | |
JP5292322B2 (ja) | 文書検索方法、文書検索装置、文書検索プログラム | |
JP5399988B2 (ja) | 重要日時表現判定方法、重要日時表現判定装置、重要日時表現判定プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120130 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130530 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130611 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130809 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130903 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131025 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131112 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131115 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5416552 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |