JPWO2015155820A1 - 情報処理装置、情報処理方法、プログラム、記憶媒体 - Google Patents
情報処理装置、情報処理方法、プログラム、記憶媒体 Download PDFInfo
- Publication number
- JPWO2015155820A1 JPWO2015155820A1 JP2014536463A JP2014536463A JPWO2015155820A1 JP WO2015155820 A1 JPWO2015155820 A1 JP WO2015155820A1 JP 2014536463 A JP2014536463 A JP 2014536463A JP 2014536463 A JP2014536463 A JP 2014536463A JP WO2015155820 A1 JPWO2015155820 A1 JP WO2015155820A1
- Authority
- JP
- Japan
- Prior art keywords
- search
- test
- evaluation value
- query
- algorithm
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
- G06F16/24578—Query processing with adaptation to user needs using ranking
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
このような検索技術としては、検索ヒットしたコンテンツデータを所定のアルゴリズムに従ってスコアリングして順位付けするものもある。この場合、検索結果画面においては、当該順位に従った表示順序で検索ヒットしたコンテンツデータが表示される。
検索エンジンのバージョンアップを行う場合は、新バージョンの検索アルゴリズム(以下「新アルゴリズム」と表記)を即座に現行バージョンの検索アルゴリズム(以下「現行アルゴリズム」と表記)と置き換えるのではなく、事前のテストを経て合格した新アルゴリズムを現行アルゴリズムと置き換えることが望ましい。
本番環境におけるテストでは、検索アルゴリズムの性能評価指標として、例えばCTR(Click Through Rate)やCVR(ConVersion Rate)などの売上への寄与に係る評価指標が用いられる。
しかし、仮に、新アルゴリズムとして上記の順付け性能等の基本的な性能面で不備のあるアルゴリズムが用いられてしまうと、本番環境のテストで本来確かめたい売り上げ寄与の面での性能とは異なる性能に関してアルゴリズムの修正及び再度のテスト施行を要してしまい、望ましくない。
また、順位付けに係る評価値の計算は、予めテスト用クエリとこれに関連するテスト用コンテンツデータの組み合わせごとに関連度スコアが対応づけられた関連度対応情報を用いて行われるので、例えば関連度スコアを都度計算する場合等と比較して処理が簡易化される。
このように複数の選択テスト用クエリの個々についての第一テスト検索及び第二テスト検索を実行させ、それに応じて選択テスト用クエリごとに計算された第一評価値、第二評価値を取得することで、様々なテスト用クエリを用いた多面的な評価を行うことを可能としている。
これにより、選択テスト用クエリごとに得られた複数の評価値同士の相対的評価情報ではなく、統合した一つの評価値についての相対的評価情報が提示される。
あまり重要でないクエリを用いた検索結果の評価値が高くてもその検索アルゴリズムの検索性能が高いとは言えない。このため、テスト検索に用いたクエリの重要度に応じて、第一評価値、第二評価値が調整されるようにしている。
検索アルゴリズムの適用先環境が異なれば、同じクエリであってもその環境に対する重要度が異なることが想定される。これに対応するため、適用先環境の別に応じて異なるクエリ重要度を用いた新アルゴリズムの評価が可能となるようにしている。
さらにまた、本発明に係る記憶媒体は、上記プログラムを記憶したプログラムである。これらのプログラムや記憶媒体により上記の情報処理装置を実現する。
<1.第1の実施の形態>
[1-1.本番環境]
[1-2.本番環境における比較テスト]
[1-3.予備環境における評価システム]
[1-4.ハードウェア構成]
[1-5.処理手順]
[1-6.第1の実施の形態のまとめ>
<2.第2の実施の形態>
[2-1.評価システム及び制御装置の機能]
[2-2.処理手順]
[2-3.第2の実施の形態のまとめ]
<3.プログラム及び記憶媒体>
<4.変形例>
[1-1.本番環境]
図1に、本番環境に形成されたネットワークシステム50の例を示す。このネットワークシステム50はEC(EC:electronic commerce(電子商取引))システムとして機能する。本番環境は、後述するユーザ端末54を介した一般ユーザによる利用が行われる環境を意味する。
ユーザ端末54は、HTTP(Hypertext Transfer Protocol)リクエストをショッピングサイト運営システム53に送信することでウェブページや所定の処理を要求する。またユーザ端末54は、HTTPリクエストに応じて送られてきたウェブページを受信してウェブブラウザ上に表示する。これにより、ユーザは所望のウェブページを閲覧したり操作したりすることができる。
この実行指示に応じて、入力キーワードが検索のクエリとしてユーザ端末54からショッピングサーバ53aに送信される。
商品DB53cには、商品を識別するための識別子である商品IDに対応づけられて、商品名、種類、商品の画像、スペック、商品紹介の要約文等の商品情報や、広告情報等が記憶されている。また、商品DB53cには、HTML(HyperText Markup Language)、XML(Extensible Markup Language)等のマークアップ言語等により記述された商品ウェブページのファイル等が記憶されている。
検索装置53bは、商品DB53cに記憶されている上記の商品情報や商品ウェブページのファイルに含まれる文字情報(テキスト情報)等に基づき、受信したクエリに関連する商品ウェブページ、例えばクエリと一致する文字情報を含む商品ウェブページを検索する。また、検索装置53bは、検索ヒットした商品ウェブページを所定のアルゴリズムに従ってスコアリングして順位付けする。検索装置53bによる検索結果には、検索ヒットした商品ウェブページのそれぞれの順位情報が含まれる。
検索装置53bによる検索結果に基づきユーザに提示される検索結果画面上には、検索ヒットした商品ウェブページが上記の順位情報に従った表示順序で表示される。
ここで、上記のような本番環境においては、検索装置53bにおける検索アルゴリズムをバージョンアップする際に、現行バージョンの検索アルゴリズム(以下「新アルゴリズム」と表記)と新バーションの検索アルゴリズム(以下「新アルゴリズム」と表記)の比較テストが行われる。
なお図2において、既に図1で説明した部分と同様となる部分については同一符号を付して説明を省略する。
ショッピングサイト運営システム53’において、第一検索装置53b1は、現行アルゴリズムによる検索を行う検索装置53bであり、第二検索装置53b2は新アルゴリズムによる検索を行う検索装置53bである。
なお、この場合における現行アルゴリズム:新アルゴリズムの利用割合は、例えば9:1にするなど、新アルゴリズムの利用割合の方が大幅に少なくなるように調整されている。すなわち、このような利用割合が実現されるように、ショッピングサーバ53aによる第一検索装置53b1、第二検索装置53b2に対するクエリの割り振り率が調整されている。
本番環境検索評価装置56は、第一検索装置53b1で用いられている現行アルゴリズム、第二検索装置53b2で用いられている新アルゴリズムのそれぞれについて、所定の評価値を計算する。具体的には、CTR(Click Through Rate)、CVR(ConVersion Rate)、総売上など、ECサイトでの販売商品の売上への寄与に係る評価値を計算する。
ここで言うCTRは、第一検索装置53b1、第二検索装置53b2による検索結果として提示された商品ウェブページ(URL(Uniform Resource Locator)リンク)に対して行われたクリックについてのCTRである。
また、ここで言うCVRは、第一検索装置53b1、第二検索装置53b2による単位検索回数を基準として、第一検索装置53b1、第二検索装置53b2による検索結果として提示された商品ウェブページがクリックされ該商品ウェブページの掲載商品が購入された割合を意味する。
さらに、上記の総売上は、第一検索装置53b1、第二検索装置53b2による検索結果として提示された商品ウェブページを経由して購入された商品を対象として、それらの総売上を計算したものである。
上記のような本番環境での比較テストは、実践的で望ましいものであるが、一般ユーザによる利用が行われることからテストの施行回数はできる限り少なくすべきである。
しかし、仮に、新アルゴリズムとして上記の順付け性能等の基本的な性能面で不備のあるアルゴリズムが用いられてしまうと、本番環境のテストで本来確かめたい売り上げ寄与の面での性能とは異なる性能に関してアルゴリズムの修正及び再度のテスト施行を要してしまい、望ましくない。
予備環境評価システム1は、予備環境評価用DB2、予備環境評価用DB2、第一予備環境検索装置3−1、第二予備環境検索装置3−2、順位付け評価値計算装置4、順位付け評価値計算装置4、及び制御装置5を備えている。
これらの各装置はコンピュータ装置で構成され、例えばLANなどのネットワーク又は所定の無線若しくは有線通信方式により互いに通信可能とされている。
なお、予備環境評価用DB2に記憶されているテスト用コンテンツデータの個数は、例えば100万個程度とされている。
関連度対応情報2aは、予めテスト用として選出された複数のテスト用クエリ(図中Q1〜Qn)と、予備環境評価用DB2に記憶されている複数のテスト用コンテンツデータ(図中D1〜Dm)とについて、テスト用クエリと該テスト用クエリに関連するテスト用コンテンツデータの組ごとに関連度スコアRが対応づけられた情報とされている。
図4の例において、「Q1」のテスト用クエリについては、D1〜Dmの複数のテスト用コンテンツデータのうち「D1」と「Dm」が関連するテスト用コンテンツデータとされている。すなわち、「Q1」をクエリとした検索が行われた場合、「D1」と「Dm」のテスト用コンテンツデータが検索ヒットする。
関連度対応情報2aでは、このようなテスト用クエリと該テスト用クエリに関連するテスト用コンテンツデータの組ごとに、関連度スコアR、すなわちテスト用コンテンツデータのテスト用クエリに対する関連度を表すスコアが対応づけられている。図4の例では、「Q1」のテスト用クエリと「D1」のテスト用コンテンツデータの組に対し、「D1」の「Q1」に対する関連度スコアRとして「3」が対応づけられ、「Q1」のテスト用クエリと「Dm」のテスト用コンテンツデータの組に対しては「Dm」の「Q1」に対する関連度スコアRとして「7」が対応づけられている。
関連度スコアRは、例えばテスト用コンテンツデータの文書内容から人手により求めた値とされている。
第二予備環境検索装置3−2は、他方の予備環境評価用DB2に記憶されている複数のテスト用コンテンツデータを検索対象として、新アルゴリズムによる検索を行う検索装置とされている。
これら第一予備環境検索装置3−1、第二予備環境検索装置3−2は、それぞれ現行アルゴリズム、新アルゴリズムを用いていることからも理解されるように、前述した第一検索装置53b1、第二検索装置53b2と同様に検索ヒットしたコンテンツデータの順位付けも行う。
順位付け評価値Vrは、検索ヒットしたテスト用コンテンツデータの順位付けに係る評価値である。例えば、順位付けが理想の順位付けに対してどの程度近いかを表す評価値である。
本例において、順位付け評価値計算装置4は、順位付け評価値VrとしてnDCG(Normalized Discounted Cumulative Gain)を計算する。周知のようにnDCGは、あるクエリに対して行った検索でヒットしたコンテンツデータの順位付けが、そのクエリについて予め定めた理想の順位付けに対してどの程度近いかを表す評価指標である。具体的に、nDCGは、検索ヒットした各コンテンツデータの関連度スコアRをそのコンテンツデータの順位に応じてディスカウントしてそれらを足し込んだ値としてのDCGを、理想のDCGにより除して正規化したものである。
なお、順位付け評価値VrとしてはDCGを計算してもよく、検索結果として求まった順位付けが理想の順位付けに対してどの程度近いかを表すものであればnDCGに限定されるものではない。
本実施の形態の制御装置5は、図5に示す各機能ブロックで表される機能を有している。
検索実行制御部5aは、例えばテスト施行者等による操作入力に基づき、第一予備環境検索装置3−1、第二予備環境検索装置3−2に検索の実行指示を行う。本実施の形態の場合、比較テストでは、n(nは2以上の自然数)個のテスト用クエリの個々について第一予備環境検索装置3−1、第二予備環境検索装置3−2による検索を順次実行させる。このため、検索実行制御部5aは、テスト施行者等によるテスト開始を指示する操作入力に基づき、n個のテスト用クエリのうちから順次1つのテスト用クエリを選択し、選択した同一のテスト用クエリを第一予備環境検索装置3−1、第二予備環境検索装置3−2に順次送信してそれぞれ検索を実行させる。
本例では、現行アルゴリズム、新アルゴリズムについての順位付け評価値Vrがそれぞれ複数得られることに対応して、第一評価値、第二評価値としては、それぞれ複数の順位付け評価値Vrを1つに統合した値に変換する。具体的に、本例における評価値取得部5bは、一方の順位付け評価値計算装置4によって現行アルゴリズムについて計算された複数の順位付け評価値Vrの合計値を第一評価値として取得し、他方の順位付け評価値計算装置4によって新アルゴリズムについて計算された複数の順位付け評価値Vrの合計値を第二評価値として取得する。
このように第一評価値、第二評価値としてそれぞれ一値に統合した値を取得することで、現行アルゴリズム、新アルゴリズムについての評価値の把握が容易となる。
なお、このような統合評価値としては、例えば複数の順位付け評価値Vrの平均値などでもよく、一値に統合した値であれば特に限定されない。
具体的に、本例における提示制御部5cは、評価値取得部5bが取得した第一評価値と第二評価値が制御装置5に接続された表示装置、或いは制御装置5が備えるディスプレイ上に対比可能に表示されるように制御を行う。
また、相対的評価情報の提示としては、視覚的な提示に限らず、例えばスピーカ等を用いた聴覚的な提示など他の手法による提示とすることもできる。
図6に、図3で示した制御装置5をはじめとした各装置(予備環境評価用DB2、第一予備環境検索装置3−1、第二予備環境検索装置3−2、順位付け評価値計算装置4)を構成するコンピュータ装置のハードウエア構成を示す。
なお、図1や図2で説明した各装置(ユーザ端末54、店舗端末55、ショッピングサーバ53a、検索装置53b、商品DB53c、第一検索装置53b1、第二検索装置53b2、本番環境検索評価装置56)を構成するコンピュータ装置についても、同様のハードウェア構成である。
CPU101、ROM102、及びRAM103は、バス104を介して相互に接続されている。このバス104には、入出力インターフェース105も接続されている。
入出力インターフェース105には、キーボード、マウス、タッチパネルなどよりなる入力装置106、LCD(Liquid Crystal Display)、CRT(Cathode Ray Tube)、有機EL(Electroluminescence)パネルなどよりなるディスプレイ(表示装置)、並びにスピーカなどよりなる出力装置107、HDD(Hard Disk Drive)やフラッシュメモリ装置などより構成される記憶部108、外部装置との間で相互通信を行うための通信部109が接続されている。
入出力インターフェース105にはまた、必要に応じてメディアドライブ110が接続され、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブルメディア111が適宜装着され、リムーバブルメディア111に対する情報の書込や読出が行われる。
CPU101が各種のプログラムに基づいて処理動作を行うことで、特に制御装置5としてのコンピュータ装置において以下で説明する情報処理や通信が実行される。
上記で説明した制御装置5の各機能を実現するための具体的な処理手順を図7及び図8のフローチャートを参照して説明する。
図7は、検索実行制御部5aに対応する処理を示している。
なお、図7に示す処理は、例えばテスト施行者等による比較テストの開始を指示する操作入力が行われたことに応じて開始される。
また、図7に示す処理は、現行アルゴリズム側(第一予備環境検索装置3−1及び一方の順位付け評価値計算装置4)、新アルゴリズム側(第二予備環境検索装置3−2及び他方の順位付け評価値計算装置4)の一方について実行される処理を示している。制御装置5は、図7に示す処理を現行アルゴリズム側、新アルゴリズム側の双方について例えば並行して行う。
続くステップS102で制御装置5は、i番目のテスト用クエリでの検索を第一予備環境検索装置3−1、第二予備環境検索装置3−2の何れか対応する一方に指示する処理を実行する。すなわち、n個のテスト用クエリのうちから選択したi番目のテスト用クエリを第一予備環境検索装置3−1、第二予備環境検索装置3−2の何れか対応する一方に指示して、該テスト用クエリでの検索を実行させる。
図8において、制御装置5は、ステップS201で現行アルゴリズム側、新アルゴリズム側の双方で全クエリの順位付け評価値Vrが得られるまで待機する。すなわち、図7に示した処理を現行アルゴリズム側、新アルゴリズム側の双方について行ったことに伴い、現行アルゴリズム側でのn個、新アルゴリズム側でのn個の計2n個の順位付け評価値Vrが順位付け評価値計算装置4,4から取得されるまで待機する。
上記のように第1の実施の形態の情報処理装置(制御装置5)は、文字情報を含む複数のコンテンツデータのうちから入力されたクエリに関連するコンテンツデータを検索し、検索ヒットしたコンテンツデータをスコアリングして順位付けする検索アルゴリズムとして、本番環境にて使用中の検索アルゴリズムを第一検索アルゴリズム(現行アルゴリズム)、本番環境における第一検索アルゴリズムとの比較テストに用いられる検索アルゴリズムを第二検索アルゴリズム(新アルゴリズム)としたときに、本番環境とは異なる予備環境にて本番環境とは異なる評価指標に基づき行われる第一検索アルゴリズムと第二検索アルゴリズムとの比較テストに用いられる情報処理装置とされている。
そして、第1の実施の形態の情報処理装置は、文字情報を含む複数のテスト用コンテンツデータを検索対象として第一検索アルゴリズムを用いて行われる第一テスト検索(第一予備環境検索装置3−1による検索)、及び複数のテスト用コンテンツデータを検索対象として第二検索アルゴリズムを用いて行われる第二テスト検索(第2予備環境検索装置3−2による検索)として、予め選出された複数のテスト用クエリのうちから選択した同一の選択テスト用クエリについての検索をそれぞれ実行させる検索実行制御部5aを備える。
また、第一テスト検索、第二テスト検索のそれぞれにより得られた、検索ヒットしたテスト用コンテンツデータの順位情報と、テスト用クエリと該テスト用クエリに関連するテスト用コンテンツデータの組み合わせごとにテスト用コンテンツデータのテスト用クエリに対する関連度スコアRが対応づけられている関連度対応情報2aとに基づいて計算された、第一テスト検索、第二テスト検索についての順位付けに係る評価値(順位付け評価値Vr)に基づいて、第一検索アルゴリズムについての第一評価値、第二検索アルゴリズムについての第二評価値を取得する評価値取得部5bを備える。
さらに、第一評価値と第二評価値とに基づき、第一検索アルゴリズムに対する第二検索アルゴリズムの相対的評価情報が提示されるように制御を行う提示制御部5cを備えるものである。
従って、新アルゴリズムが本番環境での比較テストで使用できる最低限の検索性能を有するか否かの合否判定が適切に行われるようにできる。
また、順位付け評価値Vrの計算は、予めテスト用クエリとこれに関連するテスト用コンテンツデータの組み合わせごとに関連度スコアRが対応づけられた関連度対応情報2aを用いて行われるので、例えば関連度スコアRを都度計算する場合等と比較して処理が簡易化される。
従って、新アルゴリズムの合否判定がより適正に行われるようにすることができる。
従って、相対的評価情報の把握が容易となり、新アルゴリズムについての合否判定が容易に行われるようにできる。
[2-1.評価システム及び制御装置の機能]
続いて、第2の実施の形態について説明する。
第2の実施の形態は、テスト用クエリの個々の重要度を表すクエリ重要度αに基づき、順位付け評価値Vrの調整を行うものである。
なお、以下の説明において、既に第1の実施の形態で説明した部分と同様となる部分については同一符号を付して説明を省略する。
予備環境評価システム1’は、制御装置5に替えて制御装置5’が設けられた点が予備環境評価システム1と異なる。
制御装置5’には、個々のテスト用クエリとクエリ重要度αとの対応関係を表す重要度対応情報5’dが記憶されている。
ここで、クエリには重要度がある。例えば、クエリが著名な商品名、書籍タイトル等である場合には、そのクエリの重要度は高いと言える。クエリ重要度αは、このようなクエリ自体がもつ重要度を表す指標である。クエリ重要度αは、例えばテスト用クエリごとに人手により求められる。
例えば、クエリが「ワンピース」のように著名な書籍のタイトルと衣服の種類の名称の双方に該当するものであって、書籍のタイトルとしての重要度の方が高いものであった場合には、新アルゴリズムの適用先環境が書籍類を主に販売するショップピングサイトとされる場合とそれ以外の商品を主に扱うショッピングサイトとされる場合とでクエリ重要度αは変更すべきである。具体的に、この場合におけるクエリ重要度αは、適用先環境が書籍類を主に販売するショップピングサイトとされる場合の方が、それ以外の商品を主に販売するショッピングサイトとされる場合よりも高くされるべきである。
具体的に、本例の重要度対応情報5’dにおいては、テスト用クエリの個々に対し、一般商品ショッピングサイト、書籍類ショッピングサイト、旅行商品ショッピングサイトの別に応じた複数のクエリ重要度αが対応づけられている。
一般商品ショッピングサイトは、例えば食品、飲料、日用雑貨、家具、電子機器等の一般商品を主に販売するショッピングサイトであり、書籍類ショッピングサイトは、紙媒体による書籍、電子書籍、音楽や映像等のコンテンツを収録したパッケージメディア等を主に販売するショッピングサイトである。また、旅行商品ショッピングサイトは、ホテルや旅館等での宿泊サービスを受けるための宿泊サービス商品、電車、バス、飛行機等の各種交通機関サービスを利用するための交通機関チケット商品、宿泊サービス商品や交通機関チケット商品がパックとなったパック旅行商品等を主に販売するショッピングサイトである。
先の図5と比較して分かるように、制御装置5’は、評価値取得部5bに替えて評価値取得部5b’が設けられた点が制御装置5と異なる。
本例の場合、制御装置5’に対しては、テスト施行者等による操作入力により、比較テストの開始の指示と併せて新アルゴリズムの適用先環境の別を表す適用先識別情報の指示が為される。評価値取得部5b’は、このように指示された適用先識別情報に基づき、重要度対応情報5’dにおいて第一予備環境検索装置3−1、第二予備環境検索装置3−2の検索で用いられたテスト用クエリと同一のテスト用クエリに対応づけられた複数のクエリ重要度αのうちから1つのクエリ重要度αを取得し、取得したクエリ重要度αに基づき順位付け評価値計算装置4,4で計算された順位付け評価値Vrを調整する。
評価値取得部5b’は、このような重要度対応情報5’dからのクエリ重要度αの取得、及び取得したクエリ重要度αに基づく順位付け評価値Vrの調整を、順位付け評価値計算装置4,4から順次受信されるテスト用クエリごとの順位付け評価値Vrのそれぞれについて行う。
この場合の調整は、順位付け評価値Vrに対しクエリ重要度αを乗じることで行う。
なお、この場合も統合評価値は、第1の実施の形態で例示したように例えば合計値や平均値等を計算する。
図12は、上記により説明した制御装置5’の機能を実現するための具体的な処理手順を示したフローチャートである。
なお、図12に示す処理としても、例えばテスト施行者等による比較テストの開始を指示する操作入力が行われたことに応じて開始される。前述のように、第2の実施の形態の制御装置5’には、比較テストの開始の指示と併せて適用先識別情報の指示も行われる。
また、図12に示す処理は、先の図7と同様に現行アルゴリズム側、新アルゴリズム側の一方について実行される処理を示しており、制御装置5’は、図12に示す処理を現行アルゴリズム側、新アルゴリズム側の双方について例えば並行して行う。
制御装置5’は、ステップS106で順位付け評価値Vrを取得したことに応じ、ステップS301でi番目のテスト用クエリに対応するクエリ重要度αに基づいて順位付け評価値Vrを調整する。すなわち、本例においては、重要度対応情報5’dにおいてi番目のテスト用クエリと対応づけられている複数のクエリ重要度αのうちから、指示された適用先識別情報に基づく1つのクエリ重要度αを取得し、取得したクエリ重要度αに基づきステップS106で取得した順位付け評価値Vrを調整する。
これら評価値取得部5b’及び提示制御部5cの機能を実現するための処理手順については、先の図8に示したものと同様となるため重複説明は避ける。
上記のように第2の実施の形態の情報処理装置(制御装置5’)においては、評価値取得部5b’は、テスト用クエリの個々の重要度を表すクエリ重要度αがテスト用クエリごとに対応づけられた重要度対応情報5’dに基づき、選択テスト用クエリに対応したクエリ重要度を取得し、取得したクエリ重要度に基づき、第一テスト検索、第二テスト検索について計算された順位付けに係る評価値をそれぞれ調整し、調整したそれぞれの評価値に基づいて第一評価値、第二評価値を取得している。
これにより、重要なクエリを用いたテスト検索の評価値が高くなり、重要でないクエリを用いたテスト検索の評価値が低くなるように調整することが可能となるため、テスト検索についての評価がより適切に行われるようにできる。
この結果、新アルゴリズムの合否判定がテスト検索に用いたクエリの重要度を加味してより適正に行われるようにすることができる。
従って、新アルゴリズムの評価がより適正に行われるようにでき、新アルゴリズムについての合否判定が該新アルゴリズムの適用先環境を加味してより適切に行われるようにすることができる。
以上、本発明に係る情報処理装置の実施の形態としての制御装置5,5’を説明してきたが、実施の形態のプログラムは、制御装置5,5’の処理を情報処理装置(CPU等)に実行させるプログラムである。
すなわち、このプログラムは、情報処理装置(制御装置5,5’)に図7や図8で説明した処理を実行させるプログラムに相当する。
そして、このようなプログラムはコンピュータ装置等の機器に内蔵されている記憶媒体としてのHDDや、CPUを有するマイクロコンピュータ内のROM等に予め記憶しておくことができる。或いはまた、半導体メモリ、メモリカード、光ディスク、光磁気ディスク、磁気ディスクなどのリムーバブル記憶媒体に、一時的あるいは永続的に格納(記憶)しておくことができる。またこのようなリムーバブル記憶媒体は、いわゆるパッケージソフトウェアとして提供することができる。
また、このようなプログラムは、リムーバブル記憶媒体からパーソナルコンピュータ等にインストールする他、ダウンロードサイトから、LAN、インターネットなどのネットワークを介してダウンロードすることもできる。
本発明は上記により説明した具体例に限定されず、各種の変形例が考えられる。
例えば上記では、本発明が商品ウェブページの検索を前提としたシステムに適用される場合を例示したが、本発明は、文字情報を含むコンテンツデータの検索を行うシステムに広く好適に適用できる。
さらに、第一テスト検索、第二テスト検索は、例えば時分割処理や並行処理などにより一つの装置によって行うこともでき、同様に、現行アルゴリズム側と新アルゴリズム側の順位付け評価値Vrの計算についても時分割処理や並行処理などにより一つの装置によって行うこともできる。
Claims (8)
- 文字情報を含む複数のコンテンツデータのうちから入力されたクエリに関連するコンテンツデータを検索し、検索ヒットしたコンテンツデータをスコアリングして順位付けする検索アルゴリズムとして、本番環境にて使用中の前記検索アルゴリズムを第一検索アルゴリズム、前記本番環境における前記第一検索アルゴリズムとの比較テストに用いられる前記検索アルゴリズムを第二検索アルゴリズムとしたときに、前記本番環境とは異なる予備環境にて前記本番環境とは異なる評価指標に基づき行われる前記第一検索アルゴリズムと前記第二検索アルゴリズムとの比較テストに用いられる情報処理装置であって、
文字情報を含む複数のテスト用コンテンツデータを検索対象として前記第一検索アルゴリズムを用いて行われる第一テスト検索、及び前記複数のテスト用コンテンツデータを検索対象として前記第二検索アルゴリズムを用いて行われる第二テスト検索として、予め選出された複数のテスト用クエリのうちから選択した同一の選択テスト用クエリについての検索をそれぞれ実行させる検索実行制御部と、
前記第一テスト検索、前記第二テスト検索のそれぞれにより得られた、検索ヒットした前記テスト用コンテンツデータの順位情報と、テスト用クエリと該テスト用クエリに関連するテスト用コンテンツデータの組み合わせごとにテスト用コンテンツデータのテスト用クエリに対する関連度スコアが対応づけられている関連度対応情報とに基づいて計算された、前記第一テスト検索、前記第二テスト検索についての前記順位付けに係る評価値に基づいて、前記第一検索アルゴリズムについての第一評価値、前記第二検索アルゴリズムについての第二評価値を取得する評価値取得部と、
前記第一評価値と前記第二評価値とに基づき、前記第一検索アルゴリズムに対する前記第二検索アルゴリズムの相対的評価情報が提示されるように制御を行う提示制御部とを備える
情報処理装置。 - 前記検索実行制御部は、
複数の前記選択テスト用クエリの個々についての前記第一テスト検索及び前記第二テスト検索が実行されるように制御を行い、
前記評価値取得部は、
前記検索実行制御部による前記制御に伴い前記選択テスト用クエリごとに計算された前記第一テスト検索、前記第二テスト検索についての前記順位付けに係る評価値に基づき、前記第一評価値及び前記第二評価値を取得する
請求項1に記載の情報処理装置。 - 前記評価値取得部は、
前記選択テスト用クエリごとに計算された前記第一テスト検索についての前記順位付けに係る評価値を一つに統合した値を前記第一評価値として取得し、前記選択テスト用クエリごとに計算された前記第二テスト検索についての前記順位付けに係る評価値を一つに統合した値を前記第二評価値として取得する
請求項2に記載の情報処理装置。 - 前記評価値取得部は、
前記テスト用クエリの個々の重要度を表すクエリ重要度が前記テスト用クエリごとに対応づけられた重要度対応情報に基づき、前記選択テスト用クエリに対応した前記クエリ重要度を取得し、取得したクエリ重要度に基づき、前記第一テスト検索、前記第二テスト検索について計算された前記順位付けに係る評価値をそれぞれ調整し、調整したそれぞれの評価値に基づいて前記第一評価値、前記第二評価値を取得する
請求項1に記載の情報処理装置。 - 前記重要度対応情報は、
前記テスト用クエリの個々に対し、前記第二検索アルゴリズムの適用先環境の別に応じた複数の前記クエリ重要度が対応づけられており、
前記評価値取得部は、
前記重要度対応情報において前記選択テスト用クエリと同一のテスト用クエリに対応づけられている複数の前記クエリ重要度のうち、指示された適用先識別情報に基づいて1つの前記クエリ重要度を取得し、取得したクエリ重要度に基づき前記第一テスト検索、前記第二テスト検索について計算された前記順位付けに係る評価値をそれぞれ調整し、調整したそれぞれの評価値に基づいて前記第一評価値、前記第二評価値を取得する
請求項4に記載の情報処理装置。 - 文字情報を含む複数のコンテンツデータのうちから入力されたクエリに関連するコンテンツデータを検索し、検索ヒットしたコンテンツデータをスコアリングして順位付けする検索アルゴリズムとして、本番環境にて使用中の前記検索アルゴリズムを第一検索アルゴリズム、前記本番環境における前記第一検索アルゴリズムとの比較テストに用いられる前記検索アルゴリズムを第二検索アルゴリズムとしたときに、前記本番環境とは異なる予備環境にて前記本番環境とは異なる評価指標に基づき行われる前記第一検索アルゴリズムと前記第二検索アルゴリズムとの比較テストに用いられる情報処理方法であって、
文字情報を含む複数のテスト用コンテンツデータを検索対象として前記第一検索アルゴリズムを用いて行われる第一テスト検索、及び前記複数のテスト用コンテンツデータを検索対象として前記第二検索アルゴリズムを用いて行われる第二テスト検索として、予め選出された複数のテスト用クエリのうちから選択した同一の選択テスト用クエリについての検索をそれぞれ実行させる検索実行制御手順と、
前記第一テスト検索、前記第二テスト検索のそれぞれにより得られた、検索ヒットした前記テスト用コンテンツデータの順位情報と、テスト用クエリと該テスト用クエリに関連するテスト用コンテンツデータの組み合わせごとにテスト用コンテンツデータのテスト用クエリに対する関連度スコアが対応づけられている関連度対応情報とに基づいて計算された、前記第一テスト検索、前記第二テスト検索についての前記順位付けに係る評価値に基づいて、前記第一検索アルゴリズムについての第一評価値、前記第二検索アルゴリズムについての第二評価値を取得する評価値取得手順と、
前記第一評価値と前記第二評価値とに基づき、前記第一検索アルゴリズムに対する前記第二検索アルゴリズムの相対的評価情報が提示されるように制御を行う提示制御手順とを有する
情報処理方法。 - 文字情報を含む複数のコンテンツデータのうちから入力されたクエリに関連するコンテンツデータを検索し、検索ヒットしたコンテンツデータをスコアリングして順位付けする検索アルゴリズムとして、本番環境にて使用中の前記検索アルゴリズムを第一検索アルゴリズム、前記本番環境における前記第一検索アルゴリズムとの比較テストに用いられる前記検索アルゴリズムを第二検索アルゴリズムとしたときに、前記本番環境とは異なる予備環境にて前記本番環境とは異なる評価指標に基づき行われる前記第一検索アルゴリズムと前記第二検索アルゴリズムとの比較テストに用いられる情報処理装置に処理を実行させるプログラムであって、
文字情報を含む複数のテスト用コンテンツデータを検索対象として前記第一検索アルゴリズムを用いて行われる第一テスト検索、及び前記複数のテスト用コンテンツデータを検索対象として前記第二検索アルゴリズムを用いて行われる第二テスト検索として、予め選出された複数のテスト用クエリのうちから選択した同一の選択テスト用クエリについての検索をそれぞれ実行させる検索実行制御処理と、
前記第一テスト検索、前記第二テスト検索のそれぞれにより得られた、検索ヒットした前記テスト用コンテンツデータの順位情報と、テスト用クエリと該テスト用クエリに関連するテスト用コンテンツデータの組み合わせごとにテスト用コンテンツデータのテスト用クエリに対する関連度スコアが対応づけられている関連度対応情報とに基づいて計算された、前記第一テスト検索、前記第二テスト検索についての前記順位付けに係る評価値に基づいて、前記第一検索アルゴリズムについての第一評価値、前記第二検索アルゴリズムについての第二評価値を取得する評価値取得処理と、
前記第一評価値と前記第二評価値とに基づき、前記第一検索アルゴリズムに対する前記第二検索アルゴリズムの相対的評価情報が提示されるように制御を行う提示制御処理と
を前記情報処理装置に実行させる
プログラム。 - 文字情報を含む複数のコンテンツデータのうちから入力されたクエリに関連するコンテンツデータを検索し、検索ヒットしたコンテンツデータをスコアリングして順位付けする検索アルゴリズムとして、本番環境にて使用中の前記検索アルゴリズムを第一検索アルゴリズム、前記本番環境における前記第一検索アルゴリズムとの比較テストに用いられる前記検索アルゴリズムを第二検索アルゴリズムとしたときに、前記本番環境とは異なる予備環境にて前記本番環境とは異なる評価指標に基づき行われる前記第一検索アルゴリズムと前記第二検索アルゴリズムとの比較テストに用いられる情報処理装置に処理を実行させるプログラムを記憶した記憶媒体であって、
文字情報を含む複数のテスト用コンテンツデータを検索対象として前記第一検索アルゴリズムを用いて行われる第一テスト検索、及び前記複数のテスト用コンテンツデータを検索対象として前記第二検索アルゴリズムを用いて行われる第二テスト検索として、予め選出された複数のテスト用クエリのうちから選択した同一の選択テスト用クエリについての検索をそれぞれ実行させる検索実行制御処理と、
前記第一テスト検索、前記第二テスト検索のそれぞれにより得られた、検索ヒットした前記テスト用コンテンツデータの順位情報と、テスト用クエリと該テスト用クエリに関連するテスト用コンテンツデータの組み合わせごとにテスト用コンテンツデータのテスト用クエリに対する関連度スコアが対応づけられている関連度対応情報とに基づいて計算された、前記第一テスト検索、前記第二テスト検索についての前記順位付けに係る評価値に基づいて、前記第一検索アルゴリズムについての第一評価値、前記第二検索アルゴリズムについての第二評価値を取得する評価値取得処理と、
前記第一評価値と前記第二評価値とに基づき、前記第一検索アルゴリズムに対する前記第二検索アルゴリズムの相対的評価情報が提示されるように制御を行う提示制御処理と
を前記情報処理装置に実行させるプログラムを記憶した
記憶媒体。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2014/060092 WO2015155820A1 (ja) | 2014-04-07 | 2014-04-07 | 情報処理装置、情報処理方法、プログラム、記憶媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP5639319B1 JP5639319B1 (ja) | 2014-12-10 |
JPWO2015155820A1 true JPWO2015155820A1 (ja) | 2017-04-13 |
Family
ID=52145691
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014536463A Active JP5639319B1 (ja) | 2014-04-07 | 2014-04-07 | 情報処理装置、情報処理方法、プログラム、記憶媒体 |
Country Status (4)
Country | Link |
---|---|
US (1) | US10430475B2 (ja) |
EP (1) | EP3131019A1 (ja) |
JP (1) | JP5639319B1 (ja) |
WO (1) | WO2015155820A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10430475B2 (en) | 2014-04-07 | 2019-10-01 | Rakuten, Inc. | Information processing device, information processing method, program and storage medium |
CN107291607A (zh) * | 2016-03-31 | 2017-10-24 | 高德信息技术有限公司 | 一种针对搜索引擎的评测方法及装置 |
CN111339394B (zh) * | 2020-02-19 | 2023-08-22 | 北京百度网讯科技有限公司 | 用于获取信息的方法及装置 |
CN111475409B (zh) * | 2020-03-30 | 2023-06-30 | 深圳追一科技有限公司 | 系统测试方法、装置、电子设备以及存储介质 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3383961B2 (ja) * | 1994-03-30 | 2003-03-10 | 日本電信電話株式会社 | 情報検索手法評価方法及びその装置 |
JP2001084271A (ja) * | 1999-09-16 | 2001-03-30 | Canon Inc | 情報検索装置及びそのアルゴリズム更新方法及びコンピュータ読み取り可能な記憶媒体 |
GB0212184D0 (en) * | 2002-05-27 | 2002-07-03 | Rontech Ltd | Service assessment system |
US7483877B2 (en) * | 2003-04-11 | 2009-01-27 | International Business Machines Corporation | Dynamic comparison of search systems in a controlled environment |
US7444327B2 (en) * | 2004-01-09 | 2008-10-28 | Microsoft Corporation | System and method for automated optimization of search result relevance |
US7761448B2 (en) * | 2004-09-30 | 2010-07-20 | Microsoft Corporation | System and method for ranking search results using click distance |
US20060212265A1 (en) * | 2005-03-17 | 2006-09-21 | International Business Machines Corporation | Method and system for assessing quality of search engines |
US7599917B2 (en) * | 2005-08-15 | 2009-10-06 | Microsoft Corporation | Ranking search results using biased click distance |
US20070094250A1 (en) * | 2005-10-20 | 2007-04-26 | Yahoo! Inc. | Using matrix representations of search engine operations to make inferences about documents in a search engine corpus |
US20070260601A1 (en) * | 2006-05-08 | 2007-11-08 | Thompson Henry S | Distributed human improvement of search engine results |
US20080027913A1 (en) * | 2006-07-25 | 2008-01-31 | Yahoo! Inc. | System and method of information retrieval engine evaluation using human judgment input |
US20090037402A1 (en) * | 2007-07-31 | 2009-02-05 | Rosie Jones | System and method for predicting clickthrough rates and relevance |
US20110004588A1 (en) * | 2009-05-11 | 2011-01-06 | iMedix Inc. | Method for enhancing the performance of a medical search engine based on semantic analysis and user feedback |
JP2012128802A (ja) | 2010-12-17 | 2012-07-05 | Kansai Electric Power Co Inc:The | 検索アルゴリズム評価システム |
US10430475B2 (en) | 2014-04-07 | 2019-10-01 | Rakuten, Inc. | Information processing device, information processing method, program and storage medium |
-
2014
- 2014-04-07 US US15/022,040 patent/US10430475B2/en active Active
- 2014-04-07 WO PCT/JP2014/060092 patent/WO2015155820A1/ja active Application Filing
- 2014-04-07 EP EP14888998.3A patent/EP3131019A1/en not_active Ceased
- 2014-04-07 JP JP2014536463A patent/JP5639319B1/ja active Active
Also Published As
Publication number | Publication date |
---|---|
US20160232249A1 (en) | 2016-08-11 |
EP3131019A4 (en) | 2017-02-15 |
EP3131019A1 (en) | 2017-02-15 |
WO2015155820A1 (ja) | 2015-10-15 |
US10430475B2 (en) | 2019-10-01 |
JP5639319B1 (ja) | 2014-12-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4962970B2 (ja) | プロフィールを利用した商品情報提供サーバ、システム及び方法 | |
JP6754811B2 (ja) | 情報処理装置、情報処理方法および情報処理プログラム | |
JP2015046010A (ja) | 評価算出装置、評価算出方法及び評価算出プログラム | |
EP2784701A1 (en) | Method and system for re-ranking search results in a product search engine | |
JP2009282600A5 (ja) | ||
JP5639319B1 (ja) | 情報処理装置、情報処理方法、プログラム、記憶媒体 | |
CN106462613A (zh) | 基于用户属性来对建议进行排名 | |
US9542077B2 (en) | Information processing apparatus, information processing method, information processing program, and recording medium | |
JP5728630B1 (ja) | 情報処理装置、情報処理方法、プログラム、記憶媒体 | |
JP6933443B2 (ja) | 情報処理装置、情報処理方法および情報処理プログラム | |
JP6085730B1 (ja) | 情報処理装置、情報処理方法、プログラム、記憶媒体 | |
US20210240722A1 (en) | Methods and apparatus for automatically providing a ranking of items in response to a search request | |
JP2013061796A5 (ja) | ||
JP6027468B2 (ja) | レコメンド情報取得装置、レコメンド情報取得方法、及びレコメンド情報提供システム | |
JPWO2015029168A1 (ja) | 情報処理装置、情報処理方法、情報処理装置用プログラム、および、記録媒体 | |
JP2015026145A (ja) | 試し読み用コンテンツ配信システム、サーバ装置、コンピュータプログラム及びコンテンツの配信方法 | |
JP5573722B2 (ja) | アプリ配布システム及びアプリ配布サーバ | |
JP2009129066A (ja) | 商品流通システム | |
JP6059595B2 (ja) | コンテンツ検索結果提供装置、コンテンツ検索結果提供方法、及びコンテンツ検索結果提供システム | |
JP2013077262A (ja) | コンテンツを媒介としたユーザ属性情報拡張装置、ユーザ属性情報拡張方法及びユーザ属性情報拡張システム | |
JP2019219731A (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP2013003670A (ja) | 検索サーバ及び方法 | |
JP5506969B1 (ja) | データ記録方法、データ検索方法、データ記録装置、およびデータ検索装置 | |
US20100169978A1 (en) | Content usage managing apparatus, content usage managing method and program | |
JP6483734B2 (ja) | 生成装置、生成方法及び生成プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20140926 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20141007 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20141023 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5639319 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |