JP2013061718A - サポートベクタ選択装置、方法、及びプログラム - Google Patents
サポートベクタ選択装置、方法、及びプログラム Download PDFInfo
- Publication number
- JP2013061718A JP2013061718A JP2011198368A JP2011198368A JP2013061718A JP 2013061718 A JP2013061718 A JP 2013061718A JP 2011198368 A JP2011198368 A JP 2011198368A JP 2011198368 A JP2011198368 A JP 2011198368A JP 2013061718 A JP2013061718 A JP 2013061718A
- Authority
- JP
- Japan
- Prior art keywords
- search
- support vector
- support
- training
- vectors
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】ランキング関数生成部21によって、訓練データデータベース21に記憶された訓練データに基づいて、ランキング関数における複数のサポートベクタ及びサポートベクタの各ペアに対する重みを学習する。検索評価部25によって、サポートベクタの各ペアについて、該サポートベクタペアを使わないランキング関数により算出される検索スコアに基づいて、各検索クエリに対する検索結果をランキングし、各検索クエリに対してランキングされた検索結果に基づいて、該サポートベクタペアを使わない場合の評価指標の減少への影響を示す影響度スコアを算出する。サポートベクタ選択部27によって、影響度スコアが小さいサポートベクタペアの重みを0に設定する。
【選択図】図1
Description
<システム構成>
本発明の第1の実施の形態に係るランキング関数生成装置100は、学習時に学習用として与えられた訓練データを入力として受け取り、後述するサポートベクタデータベース23とサポートベクタペア重みデータベース24の記憶内容を出力する。このランキング関数生成装置100は、CPUと、RAMと、後述する検索評価処理ルーチン及びサポートベクタペア選択処理ルーチンを実行するためのプログラムを記憶したROMとを備えたコンピュータで構成され、機能的には次に示すように構成されている。図1に示すように、ランキング関数生成装置100は、入力部10と、演算部20と、出力部30とを備えている。
次に、本実施の形態に係るランキング関数生成装置100の作用について説明する。まず、複数の訓練データがランキング関数生成装置100に入力されると、ランキング関数生成装置100によって、入力された複数の訓練データが、訓練データデータベース21へ記憶される。そして、ランキング関数生成装置100において、ランキング関数生成部22によって、訓練データデータベース21の訓練データに基づいて、暫定ランキング関数のサポートベクタ及び各サポートベクタペアの重みが学習され、得られた各サポートベクタのデータがサポートベクタデータベース23に記憶され、各サポートベクタペアの重みがサポートベクタペア重みデータベース24に記憶される。
上記の暫定ランキング関数の学習処理、上記の検索評価処理ルーチンの実行、及び上記のサポートベクタペア選択処理ルーチンの実行が、繰り返し行われると、サポートベクタデータベース23及びサポートベクタペア重みデータベース24の記憶内容が、出力部30により出力され、文書検索装置150に入力される。文書検索装置150のサポートベクタデータベース63及びサポートベクタペア重みデータベース64に、入力されたデータが記憶される。
次に、第2の実施の形態について説明する。なお、第2実施の形態に係るランキング関数生成装置及び文書検索装置の構成は、サポートベクタペア重みDB24の代わりにサポートベクタ重みDBを備え、サポートベクタペアスコアデータベース26の代わりにサポートベクタスコアデータベースを備える以外は第1の実施の形態と同様であるため、同一符号を付して説明を省略する。
次に、第3の実施の形態について説明する。なお、第3の実施の形態に係るランキング関数生成装置及び文書検索装置の構成は、第1の実施の形態と同様であるため、同一符号を付して説明を省略する。
次に、第4の実施の形態について説明する。なお、第4の実施の形態に係るランキング関数生成装置及び文書検索装置の構成は、第2の実施の形態と同様であるため、説明を省略する。
22 ランキング関数生成部
23 サポートベクタデータベース
24 サポートベクタペア重みデータベース
25 検索評価部
26 サポートベクタペアスコアデータベース
27 サポートベクタ選択部
63 サポートベクタデータベース
64 サポートベクタペア重みデータベース
65 検索スコア計算部
100 ランキング関数生成装置
150 文書検索装置
Claims (7)
- 入力された検索クエリに基づき文書の集合を検索した検索結果をランキングするための、複数のサポートベクタと前記複数のサポートベクタの各々または前記サポートベクタの組各々に対する重みとを用いて検索スコアを算出する検索用ランキング関数で用いるサポートベクタまたはサポートベクタの組を生成する装置であって、
訓練用検索クエリに対する検索結果の各文書について求められた特徴値及び前記訓練用検索クエリに対する適合度を、各訓練用検索クエリについて記憶した訓練データベースと、
前記訓練データベースに記憶された各訓練用検索クエリに対する検索結果の各文書の特徴値及び適合度に基づいて、複数の文書を示す複数のサポートベクタと前記複数のサポートベクタの各々または前記サポートベクタの組各々に対する重みとを用いて検索スコアを算出する暫定ランキング関数における前記複数のサポートベクタ及び前記複数のサポートベクタの各々または前記サポートベクタの組各々に対する重みを学習するランキング関数生成手段と、
各サポートベクタまたはサポートベクタの組について、該サポートベクタまたはサポートベクタの組を使わない前記暫定ランキング関数により算出される検索スコアに基づいて、各訓練用検索クエリに対する検索結果をランキングし、各訓練用検索クエリに対してランキングされた検索結果と、前記訓練データベースに記憶された各訓練用検索クエリに対する検索結果の各文書の適合度とに基づいて、該サポートベクタまたはサポートベクタの組を使わない場合の、ランキングされた検索結果に対する評価を示す評価指標の減少への影響を評価する検索評価手段と、
前記検索評価手段によって評価された前記評価指標の減少への影響が少ないサポートベクタまたはサポートベクタの組を、前記暫定ランキング関数から除外したものを、前記検索用ランキング関数で用いるサポートベクタまたはサポートベクタの組とするサポートベクタ選択手段と、
を含むサポートベクタ選択装置。 - 入力された検索クエリに基づき文書の集合を検索した検索結果をランキングするための、複数のサポートベクタと前記複数のサポートベクタの各々または前記サポートベクタの組各々に対する重みとを用いて検索スコアを算出する検索用ランキング関数で用いる重みを生成する装置であって、
訓練用検索クエリに対する検索結果の各文書について求められた特徴値及び前記訓練用検索クエリに対する適合度を、各検索クエリについて記憶した訓練データベースと、
前記訓練データベースに記憶された各訓練用検索クエリに対する検索結果の各文書の特徴値及び適合度に基づいて、複数の文書を示す複数のサポートベクタと前記複数のサポートベクタの各々または前記サポートベクタの組各々に対する重みとを用いて検索スコアを算出する暫定ランキング関数における前記複数のサポートベクタ及び前記複数のサポートベクタの各々または前記サポートベクタの組各々に対する重みを学習するランキング関数生成手段と、
各サポートベクタまたはサポートベクタの組について、該サポートベクタまたはサポートベクタの組を使わない前記暫定ランキング関数により算出される検索スコアに基づいて、各訓練用検索クエリに対する検索結果をランキングし、各訓練用検索クエリに対してランキングされた検索結果と、前記訓練データベースに記憶された各訓練用検索クエリに対する検索結果の各文書の適合度とに基づいて、該サポートベクタまたはサポートベクタの組を使わない場合の、ランキングされた検索結果に対する評価を示す評価指標の減少への影響を評価する検索評価手段と、
前記検索評価手段によって評価された前記評価指標の減少への影響が少ないサポートベクタまたはサポートベクタの組に対する前記重みを0に設定するサポートベクタ選択手段と、
を含むサポートベクタ選択装置。 - 前記検索評価手段は、各サポートベクタまたはサポートベクタの各組について、該サポートベクタまたはサポートベクタの組を使わない前記ランキング関数により算出される検索スコアに基づいて、各訓練用検索クエリに対する検索結果をランキングし、各訓練用検索クエリに対してランキングされた検索結果と、前記訓練データベースに記憶された各訓練用検索クエリに対する検索結果の各文書の適合度とに基づいて、各訓練用検索クエリに対して該サポートベクタまたはサポートベクタの組を使わない場合の評価指標を算出し、前記評価指標の平均値を、前記評価指標の最大値から減算した値を、該サポートベクタまたはサポートベクタの組の影響度スコアとして算出し、
前記サポートベクタ選択手段は、前記検索評価手段によって算出された前記影響度スコアが小さいサポートベクタまたはサポートベクタの組を、前記ランキング関数で用いるサポートベクタまたはサポートベクタの組から除外する請求項1記載のサポートベクタ選択装置。 - 前記検索評価手段は、各サポートベクタまたはサポートベクタの各組について、該サポートベクタまたはサポートベクタの組を使わない前記ランキング関数により算出される検索スコアに基づいて、各訓練用検索クエリに対する検索結果をランキングし、各訓練用検索クエリに対してランキングされた検索結果と、前記訓練データベースに記憶された各訓練用検索クエリに対する検索結果の各文書の適合度とに基づいて、各訓練用検索クエリに対して該サポートベクタまたはサポートベクタの組を使わない場合の評価指標を算出し、前記評価指標の平均値を、前記評価指標の最大値から減算した値を、該サポートベクタまたはサポートベクタの組の影響度スコアとして算出し、
前記サポートベクタ選択手段は、前記検索評価手段によって算出された前記影響度スコアが小さいサポートベクタまたはサポートベクタの組に対する前記重みを0に設定する請求項2記載のサポートベクタ選択装置。 - 訓練用検索クエリに対する検索結果の各文書について求められた特徴値及び前記訓練用検索クエリに対する適合度を、各訓練用検索クエリについて記憶した訓練データベース、ランキング関数生成手段、検索評価手段、及びサポートベクタ選択手段を含み、入力された検索クエリに基づき文書の集合を検索した検索結果をランキングするための、複数のサポートベクタと前記複数のサポートベクタの各々または前記サポートベクタの組各々に対する重みとを用いて検索スコアを算出する検索用ランキング関数で用いるサポートベクタまたはサポートベクタの組を生成する装置におけるサポートベクタ選択方法であって、
前記装置は、
前記ランキング関数生成手段によって、前記訓練データベースに記憶された各訓練用検索クエリに対する検索結果の各文書の特徴値及び適合度に基づいて、複数の文書を示す複数のサポートベクタと前記複数のサポートベクタの各々または前記サポートベクタの組各々に対する重みとを用いて検索スコアを算出する暫定ランキング関数における前記複数のサポートベクタ及び前記複数のサポートベクタの各々または前記サポートベクタの組各々に対する重みを学習するステップと、
前記検索評価手段によって、各サポートベクタまたはサポートベクタの組について、該サポートベクタまたはサポートベクタの組を使わない前記暫定ランキング関数により算出される検索スコアに基づいて、各訓練用検索クエリに対する検索結果をランキングし、各訓練用検索クエリに対してランキングされた検索結果と、前記訓練データベースに記憶された各検索クエリに対する検索結果の各文書の適合度とに基づいて、該サポートベクタまたはサポートベクタの組を使わない場合の、ランキングされた検索結果に対する評価を示す評価指標の減少への影響を評価するステップと、
前記サポートベクタ選択手段によって、前記検索評価手段によって評価された前記評価指標の減少への影響が少ないサポートベクタまたはサポートベクタの組を、前記暫定ランキング関数から除外したものを、前記検索用ランキング関数で用いるサポートベクタまたはサポートベクタの組とするステップと、
を含んで実行することを特徴とするサポートベクタ選択方法。 - 訓練用検索クエリに対する検索結果の各文書について求められた特徴値及び前記訓練用検索クエリに対する適合度を、各検索クエリについて記憶した訓練データベース、ランキング関数生成手段、検索評価手段、及びサポートベクタ選択手段を含み、入力された検索クエリに基づき文書の集合を検索した検索結果をランキングするための、複数のサポートベクタと前記複数のサポートベクタの各々または前記サポートベクタの組各々に対する重みとを用いて検索スコアを算出する検索用ランキング関数で用いる重みを生成する装置におけるサポートベクタ選択方法であって、
前記装置は、
前記ランキング関数生成手段によって、前記訓練データベースに記憶された各訓練用検索クエリに対する検索結果の各文書の特徴値及び適合度に基づいて、複数の文書を示す複数のサポートベクタと前記複数のサポートベクタの各々または前記サポートベクタの組各々に対する重みとを用いて検索スコアを算出する暫定ランキング関数における前記複数のサポートベクタ及び前記複数のサポートベクタの各々または前記サポートベクタの組各々に対する重みを学習するステップと、
前記検索評価手段によって、各サポートベクタまたはサポートベクタの組について、該サポートベクタまたはサポートベクタの組を使わない前記暫定ランキング関数により算出される検索スコアに基づいて、各訓練用検索クエリに対する検索結果をランキングし、各訓練用検索クエリに対してランキングされた検索結果と、前記訓練データベースに記憶された各訓練用検索クエリに対する検索結果の各文書の適合度とに基づいて、該サポートベクタまたはサポートベクタの組を使わない場合の、ランキングされた検索結果に対する評価を示す評価指標の減少への影響を評価するステップと、
前記サポートベクタ選択手段によって、前記検索評価手段によって評価された前記評価指標の減少への影響が少ないサポートベクタまたはサポートベクタの組に対する前記重みを0に設定するステップと、
を含んで実行することを特徴とするサポートベクタ選択方法。 - コンピュータを、請求項1〜請求項4の何れか1項記載のサポートベクタ選択装置の各手段として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011198368A JP5684077B2 (ja) | 2011-09-12 | 2011-09-12 | サポートベクタ選択装置、方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011198368A JP5684077B2 (ja) | 2011-09-12 | 2011-09-12 | サポートベクタ選択装置、方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013061718A true JP2013061718A (ja) | 2013-04-04 |
JP5684077B2 JP5684077B2 (ja) | 2015-03-11 |
Family
ID=48186357
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011198368A Active JP5684077B2 (ja) | 2011-09-12 | 2011-09-12 | サポートベクタ選択装置、方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5684077B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015040860A1 (ja) * | 2013-09-18 | 2015-03-26 | 日本電気株式会社 | 分類辞書生成装置、分類辞書生成方法及び記録媒体 |
JP2020071678A (ja) * | 2018-10-31 | 2020-05-07 | キヤノンマーケティングジャパン株式会社 | 情報処理装置、制御方法、プログラム |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009080557A (ja) * | 2007-09-25 | 2009-04-16 | Seiko Epson Corp | 識別方法及びプログラム |
JP2011100302A (ja) * | 2009-11-06 | 2011-05-19 | Nippon Telegr & Teleph Corp <Ntt> | ランキング関数生成装置、ランキング関数生成方法、ランキング関数生成プログラム |
-
2011
- 2011-09-12 JP JP2011198368A patent/JP5684077B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009080557A (ja) * | 2007-09-25 | 2009-04-16 | Seiko Epson Corp | 識別方法及びプログラム |
JP2011100302A (ja) * | 2009-11-06 | 2011-05-19 | Nippon Telegr & Teleph Corp <Ntt> | ランキング関数生成装置、ランキング関数生成方法、ランキング関数生成プログラム |
Non-Patent Citations (3)
Title |
---|
CSNG201100237195; 数原 良彦 他: '評価指標をマージンに反映したオンラインランキング学習' 言語処理学会第17回年次大会発表論文集 Vol.NLP2011,No.F3-5., 20110331, pp.872-875., 言語処理学会 * |
JPN6014017460; 数原 良彦 他: '評価指標をマージンに反映したオンラインランキング学習' 言語処理学会第17回年次大会発表論文集 Vol.NLP2011,No.F3-5., 20110331, pp.872-875., 言語処理学会 * |
JPN6014017461; Weston et al.,: 'Online (and Offline) on an Even Tighter Budget' AI & Statistics 2005 , 20050106 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015040860A1 (ja) * | 2013-09-18 | 2015-03-26 | 日本電気株式会社 | 分類辞書生成装置、分類辞書生成方法及び記録媒体 |
JPWO2015040860A1 (ja) * | 2013-09-18 | 2017-03-02 | 日本電気株式会社 | 分類辞書生成装置、分類辞書生成方法及びプログラム |
JP2020071678A (ja) * | 2018-10-31 | 2020-05-07 | キヤノンマーケティングジャパン株式会社 | 情報処理装置、制御方法、プログラム |
JP7256357B2 (ja) | 2018-10-31 | 2023-04-12 | キヤノンマーケティングジャパン株式会社 | 情報処理装置、制御方法、プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP5684077B2 (ja) | 2015-03-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Volkovs et al. | Boltzrank: learning to maximize expected ranking gain | |
Lucchese et al. | Post-learning optimization of tree ensembles for efficient ranking | |
Culpepper et al. | Dynamic cutoff prediction in multi-stage retrieval systems | |
JP6267199B2 (ja) | 検索結果をランク付ける方法およびシステム、ならびに検索結果の順位付けを最適化する方法およびシステム | |
US8606786B2 (en) | Determining a similarity measure between queries | |
JP5351182B2 (ja) | 関心領域についての関連情報の決定 | |
US20200372472A1 (en) | Multi-level ranking for mitigating machine learning model bias | |
US8250092B2 (en) | Search result diversification | |
US9110923B2 (en) | Ranking over hashes | |
US8005774B2 (en) | Determining a relevance function based on a query error derived using a structured output learning technique | |
US20140229476A1 (en) | System for Information Discovery & Organization | |
US7925644B2 (en) | Efficient retrieval algorithm by query term discrimination | |
CN105917364B (zh) | 对问答论坛中讨论话题的排名 | |
US20200372435A1 (en) | Achieving fairness across multiple attributes in rankings | |
US20200372304A1 (en) | Quantifying bias in machine learning models | |
JP5831143B2 (ja) | 検索支援装置、検索支援方法および検索支援プログラム | |
US9336495B2 (en) | Query generation and time difference features for supervised semantic indexing | |
JP5682448B2 (ja) | 因果単語対抽出装置、因果単語対抽出方法および因果単語対抽出用プログラム | |
JP5684077B2 (ja) | サポートベクタ選択装置、方法、及びプログラム | |
JP5432936B2 (ja) | ランキングモデル選択機能を有する文書検索装置、ランキングモデル選択機能を有する文書検索方法およびランキングモデル選択機能を有する文書検索プログラム | |
JP2011232996A (ja) | 機械学習方法および機械学習システム | |
US11093512B2 (en) | Automated selection of search ranker | |
CN116245146A (zh) | 基于进化条件生成对抗网络的排序学习方法、系统及应用 | |
US20220108071A1 (en) | Information processing device, information processing system, and non-transitory computer readable medium | |
Ruiz Alonso et al. | Hyperparameter tuning for multi-label classification of feedbacks in online courses |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130902 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140320 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140507 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140707 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20141216 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150114 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5684077 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |