JP7321977B2

JP7321977B2 - 情報処理装置、情報処理方法および情報処理プログラム

Info

Publication number: JP7321977B2
Application number: JP2020101290A
Authority: JP
Inventors: 洋平井関; 翔吾鈴木
Original assignee: Yahoo Japan Corp
Current assignee: Yahoo Japan Corp
Priority date: 2020-06-10
Filing date: 2020-06-10
Publication date: 2023-08-07
Anticipated expiration: 2040-06-10
Also published as: JP2021196722A

Description

特許法第３０条第２項適用公開日令和１年１２月４日外部登壇ｈｔｔｐｓ：／／ｓｅａｒｃｈ－ｔｅｃｈ．ｃｏｎｎｐａｓｓ．ｃｏｍ／ｅｖｅｎｔ／１５６０１４／公開日令和２年３月１８日投稿情報ｈｔｔｐｓ：／／ｔｅｃｈｂｌｏｇ．ｙａｈｏｏ．ｃｏ．ｊｐ／ｅｎｔｒｙ／２０２００３１８８１９０６１／

本発明は、情報処理装置、情報処理方法および情報処理プログラムに関する。

電子商取引などの分野において、入力された検索クエリ（キーワード）に基づく検索結果についてランキング対象（例えば商品）のランキング処理を行い、ランキング結果が上位のランキング対象を利用者に提示することが行われている。

特表２０１５－５１８２２０号公報

しかしながら、従来の技術では、「人気順」といった観点からランキング処理が行われていたため、例えば、提示されるランキング対象が利用者の意図とかけ離れているにも関わらず上位になるケースが多く、検索結果が利用者の意図を十分に反映していないものとなる場合があった。

本願は、上記に鑑みてなされたものであって、利用者の検索意図を反映した適切な検索結果を提供することを目的とする。

本願に係る情報処理装置は、検索クエリにマッチする検索結果を取得する取得部と、取得された前記検索結果に、前記検索結果に対するユーザの行動ログに応じたラベルを付与して学習データを生成する生成部と、生成された前記学習データにフィルタをかけ、前記学習データを選別する選別部と、選別された前記学習データを用いて機械学習を行う学習部と、前記機械学習の結果得られた学習モデルを用いて前記検索結果の表示順位を設定する設定部と、を備え、前記生成部は、コンバージョンへと至る段階的な行動のそれぞれに基づいて、前記検索結果として取得された文書のうち、前記ユーザがクリックし、コンバージョンに至った文書であれば第１のラベルを付与し、前記ユーザがクリックしたが、コンバージョンには至らなかった文書であれば第２のラベルを付与し、前記ユーザがクリックすらしなかった文書であれば第３のラベルを付与することで、各行動が行われた文書にラベルを付与し、文書ごとの特徴量を分散処理クラスタに蓄積し、前記分散処理クラスタに蓄積された文書ごとの特徴量から、分散処理フレームワークを用いて前記学習データを生成し、前記選別部は、前記学習データの数を制限するためにトランスフィルタを間に入れて、生成された前記学習データにフィルタをかけ、前記学習データを選別し、前記学習部は、選別された前記学習データを用いて、勾配ブースティング決定木を用いたランキング学習により前記学習モデルを構築する際に、前記学習モデルが大きくなり過ぎないように前記学習モデルのモデルサイズを所定の大きさに限定することを特徴とする。

実施形態の一態様によれば、利用者の検索意図を反映した適切な検索結果を提供することができる。

図１は、実施形態に係る情報処理方法の概要を示す説明図である。図２は、実施形態に係る学習データの作成例を示す図である。図３は、実施形態に係る機械学習モデルの構築例を示す図である。図４は、実施形態に係る情報処理システムの構成例を示す図である。図５は、実施形態に係る情報処理装置の構成例を示す図である。図６は、ユーザ情報データベースの一例を示す図である。図７は、ログ情報データベースの一例を示す図である。図８は、学習モデルデータベースの一例を示す図である。図９は、機械学習モデルの構築に係る処理手順を示すフローチャートである。図１０は、多段階ランキングに係る処理手順を示すフローチャートである。図１１は、高速なランキングについての説明図である。図１２は、高精度なランキングについての説明図である。図１３は、さらに高精度なランキングについての説明図である。図１４は、さらにさらに高精度なランキングについての説明図である。図１５は、ランキング結果の提供についての説明図である。図１６は、ハードウェア構成の一例を示す図である。

以下に、本願に係る情報処理装置、情報処理方法、および情報処理プログラムを実施するための形態（以下、「実施形態」と記載する）について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る情報処理装置、情報処理方法、および情報処理プログラムが限定されるものではない。また、以下の実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。

〔１．情報処理方法の概要〕
まず、図１を参照し、実施形態に係る情報処理装置が行う情報処理方法の概要について説明する。図１は、実施形態に係る情報処理方法の概要を示す説明図である。なお、図１では、機械学習モデルによる文書の順位付けを行った文書検索結果を表示する場合を例に挙げて説明する。

図１に示すように、情報処理システム１は、端末装置１０と情報提供装置１００とを含む。端末装置１０と情報提供装置１００とは、それぞれネットワークＮ（図４参照）を介して有線又は無線で互いに通信可能に接続される。

端末装置１０は、ユーザＵにより利用されるスマートフォンやタブレット等のスマートデバイスであり、４Ｇ（Generation）やＬＴＥ（Long Term Evolution）等の無線通信網を介して任意のサーバ装置と通信を行うことができる携帯端末装置である。また、端末装置１０は、液晶ディスプレイ等の画面であって、タッチパネルの機能を有する画面を有し、ユーザから指やスタイラス等によりタップ操作、スライド操作、スクロール操作等、コンテンツ等の表示データに対する各種の操作を受付ける。なお、画面のうち、コンテンツが表示されている領域上で行われた操作を、コンテンツに対する操作としてもよい。また、端末装置１０は、スマートデバイスのみならず、デスクトップＰＣ（Personal Computer）やノートＰＣ等の情報処理装置であってもよい。ここでは、スマートフォンを例に説明する。

情報提供装置１００は、ユーザＵの端末装置１０から受け付けた検索クエリ（キーワード）に基づいて検索を行い、その検索結果を端末装置１０に提供する情報処理装置であり、サーバ装置やクラウドシステム等により実現される。ここでは、情報提供装置１００は、検索エンジンを介して、ユーザＵが探している商品をキーワードで検索できる仕組みを提供する。なお、商品は取引対象の一例に過ぎない。実際には、商品に限らず、サービス等を対象としてもよい。また、商品の代わりに、人物やデータ等をキーワードで検索してもよい。

検索エンジンは、まず検索キーワードに合致する商品に関する文書（ウェブページ等）を取得し、次に取得した文書を何らかの基準で順位付けして、検索結果として返却する。文書の順位付けは、そのまま商品の順位付けとなる。文書は、例えばＨＴＭＬ（HyperText Markup Language）文書、ＸＭＬ（Extensible Markup Language）文書、ＸＨＴＭＬ（Extensible HyperText Markup Language）文書等である。なお、実際には、文書に限らず、検索可能な他の形式のデータ、例えば動画等の画像データや、ＳＮＳ（Social Networking Service）のメッセージ、あるいはアプリケーションプログラム（アプリ）等であってもよい。

ここで、オンラインモールやオークションサイトを含む様々なＥＣ（Electronic Commerce：電子商取引）サイトにおいて、ユーザＵによる購入が期待される商品を検索結果の上位に出すために、様々な順位付けの方法が模索されているが、いずれも一長一短である。

例えば、検索キーワード「しょうゆ」に対して合致した商品を順位付けする際に、「売り上げ順」に順位付けすると、人気のあるしょうゆ商品が検索結果の上位に出る。しかし、しょうゆ味のラーメン商品やしょうゆ差し商品なども、商品タイトルに「しょうゆ」を含んでいるため、検索キーワード「しょうゆ」に合致する。そのため、検索キーワードとは意図が違う商品が、検索結果上位に出てしまう可能性がある。

あるいは、検索キーワード「しょうゆ」に対して合致した商品を順位付けする際に、「キーワードと商品タイトルの関連度順」に順位付けすると、検索結果にはしょうゆ商品が並ぶが、商品の売り上げは考慮していないため、人気のあるしょうゆ商品が検索結果上位に出ない可能性がある。

また、「売り上げ順」と「関連度順」をともに考慮して検索結果を調整（チューニング）するとしても、現実には多種多様なキーワードで商品が検索されている。例えば、検索キーワードには、特定の商品やブランド名を指す検索キーワードの他にも、「５００円ポイント消化」や「タレントＡ化粧品」といった特定の商品を指さない検索キーワードや、「米２ｋｇ」といった商品カテゴリおよびスペックを指す検索キーワード等が存在する。そのため、検索キーワード１つ１つに対して、人為的に検索結果を調整していくのは非現実的である。

このように、現状では、良い順位付けを行うのは困難である。そこで、本実施形態では、「機械学習モデルによる文書の順位付け」を提案する。

〔１－１．機械学習モデルによる文書の順位付け〕
例えば、図１に示すように、検索ＦＥ（Front End：フロントエンド）から検索エンジンへ検索リクエストが送信される。なお、検索ＦＥは、検索においてユーザＵと直接データのやり取りをするソフトウェアシステムの部分を指す。例えば、検索ＦＥは、Ｗｅｂブラウザ側（クライアント側）を指す。また、検索リクエストには、検索キーワードが含まれている。

検索エンジンは、まず検索キーワードに合致する商品に関する文書を取得し、次に取得した文書を何らかの基準で順位付けして、検索結果として返却する。

このとき、検索ＦＥおよび検索エンジンから、クリックをはじめとする行動ログおよび文書ごとの特徴量（ランキングログ）がHadoop（登録商標）クラスタ等の分散処理クラスタへ送信される。ここでは、検索ＦＥから行動ログが送信され、検索エンジンから特徴量（ランキングログ）が送信される。文書ごとの特徴量は、商品ごとの特徴量でもある。Hadoop（登録商標）は、大規模データ（ビッグデータ）の取り扱いを目的とした分散処理のプラットフォームである。

次に、情報提供装置１００は、Hadoop（登録商標）クラスタ等の分散処理クラスタに蓄積されたログから、Hive等のデータウェアハウス及びSpark等の分散処理フレームワークを用いて、学習データを作成する。Hiveは、Hadoop（登録商標）の上に構築されたデータウェアハウス構築環境であり、大規模データの集約や分析を行う。Sparkは、大規模データに対して高速に分散処理を行う高速分散処理フレームワークである。

このとき、文書ごとの特徴量を直接Hadoop（登録商標）クラスタ等の分散処理クラスタに蓄積している。そのため、学習データの作成はテーブルの結合だけで完了する。図２は、実施形態に係る学習データの作成例を示す図である。図２に示すように、情報提供装置１００は、検索ＦＥから送信されたユーザの行動ログと、検索エンジンから送信された検索結果のランキングログとに基づいて、学習データを生成する。

また、図２に示すように、学習データは、クリックをはじめとする行動ログに基づくラベルと、文書ごとの特徴量（ランキングログ）とを含む。図２では、文書に対してクリックがあった場合のラベルを「１」、文書に対して何も行動がなかった場合のラベルを「０」として例示している。但し、これらは一例に過ぎない。ラベルの詳細については後述する。

次に、情報提供装置１００は、学習データを作成した後、ＧＢＤＴ（Gradient Boosting Decision Tree：勾配ブースティング決定木）を用いたランキング学習により、機械学習モデルを構築する。ＧＢＤＴとは「勾配降下法（Gradient）」と「Boosting（アンサンブル）」、「決定木（Decision Tree）」を組み合わせた教師有り機械学習の一つである。例えば、情報提供装置１００は、LightGBM等の勾配ブースティング決定木を用いたランキング学習により、機械学習モデルを構築する。LightGBMは、決定木アルゴリズムに基づいた勾配ブースティング（Gradient Boosting）の機械学習フレームワークである。なお、機械学習モデルの構築には、機械学習モデルの新規作成のみならず、既存の機械学習モデルの更新も含まれる。

ここで、機械学習モデルは、リアルタイムに商品の順位付けを行うため、あまりにも大きい機械学習モデルは予測時間の問題から検索エンジンに乗せることができない。学習モデルが複雑になると精度が向上する一方で、リアルタイムのレスポンスが悪くなるという事態が生じる。そのため、精度だけでなくモデルのサイズ（LightGBMであれば、決定木の本数や深さなど）にも注意を払って、機械学習モデルを構築する必要がある。例えば、モデルが大きくなり過ぎないように、モデルサイズ（LightGBMであれば、分岐する木の数）を所定の大きさに限定する。また、学習データの数を制限するために、トランスフィルタを間に入れて学習データにフィルタをかけ、学習データを選別する。

また、機械学習モデルにおける一部の特徴量は、Hadoop（登録商標）クラスタ等の分散処理クラスタで集計した結果を利用している。そのため、情報提供装置１００は、Hadoop（登録商標）クラスタ等の分散処理クラスタで定常的に集計ジョブを走らせ、検索エンジンに集計結果をフィード（供給）する仕組みも構築する。

次に、情報提供装置１００は、構築された機械学習モデル（学習済モデル）をプラグイン形式に変換して検索エンジン上にデプロイ（deploy：配置・展開）する。検索結果中の文書が示す商品の特徴量は検索エンジンにフィードされており、検索時にリアルタイムで機械学習モデルによる自動的な商品の順位付けが行われる。

〔１－２．ランキング学習〕
機械学習の手法の１つに、文書間の順序関係を学習するランキング学習という手法がある。図３は、実施形態に係る機械学習モデルの構築例を示す図である。図３に示すように、検索キーワードに対し、各文書に「優」、「良」、「悪」の３段階のラベルが振られているとする。

「優」（Excellent）は、検索結果の上位に出て欲しい文書に振られるラベルである。例えば、ユーザＵがクリックし、さらに購入等のコンバージョン（conversion：CV）に至った文書であれば、「優」のラベルが振られる。「優」のラベルは、数値「２」であってもよい。

「良」（Good）は、検索結果の上位に出ていても違和感はない程度の文書に振られるラベルである。例えば、ユーザＵがクリックしたが、コンバージョンには至らなかった文書であれば、「良」のラベルが振られる。「良」のラベルは、数値「１」であってもよい。

「悪」（Bad）は、検索結果に出て欲しくない文書に振られるラベルである。例えば、ユーザＵがクリックすらしなかった文書であれば、「悪」のラベルが振られる。「悪」のラベルは、数値「０」であってもよい。

ラベルの順序関係は、「優」＞「良」＞「悪」の順である。なお、上記の３段階のラベルは一例に過ぎない。実際には、「必」＞「優」＞「良」＞「可」＞「悪」のような５段階のラベルであってもよい。すなわち、ラベルの種類および段階の数は任意である。

「必」（Perfect）は、検索結果の最上位に出て欲しい文書に振られるラベルである。例えば、ユーザＵが商品購入のために普段使いしているサイト等、クリックした際には必ず（又は高確率で）コンバージョンに至る文書であれば、「必」のラベルが振られる。

「可」（Fair）は、検索結果に出ていても許される程度の文書に振られるラベルである。例えば、単にユーザＵがクリックしただけの文書であれば、「可」のラベルが振られる。なお、最終的にコンバージョンには至らなかったが、ユーザＵがコンバージョンを検討（商品をカートに入れる等）した文書や、ユーザＵが長時間（所定時間以上）滞在・視聴した文書であれば、「良」のラベルが振られる。

また、同じ行動についても、文書に対してその行動が行われた回数（行動階数）に応じてラベルを分けてもよい。例えば、購入が１回だけなら「優１」、複数回であれば「優２」、定期的に繰り返し購入されている場合は「優３」等のラベルが振られるようにしてもよい。この場合、ラベルの順序関係は、「優３」＞「優２」＞「優１」の順である。

また、情報提供装置１００は、同一の文章について、検索クエリごとに異なるラベルを付与する。例えば、「しょうゆさし」の文章について、検索クエリに「しょうゆ」と入れたときに「しょうゆさし」の文章は「良」もしくは「悪」のラベルとなるが、検索クエリに「しょうゆさし」と入れたときに「しょうゆさし」の文章は「優」のラベルとなる。すなわち、同一の「しょうゆさし」の文章について、検索クエリが「しょうゆ」の場合には「良」もしくは「悪」のラベルが付与され、検索クエリが「しょうゆさし」の場合には「優」のラベルが付与される。このように、同一の文章であっても、検索クエリごとに異なるラベルが付与されて学習がなされる。

ラベルの付与は、ガイドラインを定めて付与する、ユーザＵの行動ログ（文書のクリックログなど）を活用して付与する、などの方法が取られる。

また、各文書には、その文書の情報を表す特徴量が与えられている。

図３に示すように、ランキング学習では、ラベルの順序関係に従ってモデルの出力するスコアが高くなるように、学習が進む。スコアは、例えばラベル値の合計値等である。

本実施形態では、ランキング学習を用いた機械学習モデル（ランキングモデル）をユーザＵの行動ログから構築し、商品の順位付けを行う。

情報提供装置１００は、ユーザＵに所定のアルゴリズムで、複数の文書を含む検索結果を提供する。そして、検索結果中の文書に対するユーザＵの行動に基づいて、各文書にラベル付与する。このとき、少なくとも２つ以上の文書にラベル付与する。また、２種類以上の異なるラベルを付与する。

例えば、購入等のコンバージョン（最終的な行動）へと至る段階的な行動（クリックする、カートに入れる、購入ボタンを押す等）のそれぞれに基づいて、その行動が行われた文書にラベルが設定される。

具体的には、「購入ボタンを押す」という行動に基づいて、文書に「優」（Excellent）のラベルが設定される。「クリックする」や「カートに入れる」という行動に基づいて、文書に「良」（Good）のラベルが設定される。その他（何もしない等）については、「悪」（Bad）のラベルが設定される。

なお、購入ボタンの押下は、コンバージョンの一例に過ぎない。例えば、コンバージョンは、ファイルのダウンロード（又はアップロード）、資料請求、ユーザ登録、お気に入り登録、確認事項や契約事項の同意、アンケート回答、動画再生ボタンの押下、所定時間以上の視聴等であってもよい。また、文書が所望の情報であった旨の回答、商品の満足度の回答、商品レビューの投稿等であってもよい。

情報提供装置１００は、検索クエリと、検索結果に含まれる文書のＩＤとを入力した際に、ラベルが良い順で文書をランク付けするようにモデルを学習させる。

〔１－３．多段階ランキング〕
多数の文書が検索クエリ（キーワード）にマッチした場合、それらの文書全てについて機械学習モデル（学習済モデル）を用いてリアルタイムでランキングするのは、処理が重くて現実的には無理がある。そこで、多段階ランキングを行う。

例えば、２段階ランキングの場合、前段では、キーワードにマッチした文書に対して機械学習モデル（学習済モデル）を使用せずに軽い計算で荒くフィルタリングする（軽量モデル：light-model）。すなわち、ランキング対象の絞り込みを行う。そして、後段では、フィルタリングした結果に対して機械学習モデル（学習済モデル）を使用してランキングする（重量モデル：heavy-model）。無論、３段階以上にすることも可能である。

〔２．情報処理システムの構成例〕
次に、図４を用いて、実施形態に係る情報提供装置１００が含まれる情報処理システム１の構成について説明する。図４は、実施形態に係る情報処理システム１の構成例を示す図である。図４に示すように、実施形態に係る情報処理システム１は、端末装置１０と情報提供装置１００とを含む。これらの各種装置は、ネットワークＮを介して、有線又は無線により通信可能に接続される。ネットワークＮは、例えば、ＬＡＮ（Local Area Network）や、インターネット等のＷＡＮ（Wide Area Network）である。

また、図４に示す情報処理システム１に含まれる各装置の数は図示したものに限られない。例えば、図４では、図示の簡略化のため、端末装置１０を１台のみ示したが、これはあくまでも例示であって限定されるものではなく、２台以上であってもよい。

端末装置１０は、ユーザＵによって使用される情報処理装置である。例えば、端末装置１０は、スマートフォンやタブレット端末等のスマートデバイス、フィーチャーフォン、ＰＣ（Personal Computer）、ＰＤＡ（Personal Digital Assistant）、カーナビゲーションシステム、スマートウォッチやヘッドマウントディスプレイ等のウェアラブルデバイス（Wearable Device）、スマートグラス等である。

また、かかる端末装置１０は、ＬＴＥ（Long Term Evolution）、４Ｇ（4th Generation）、５Ｇ（5th Generation：第５世代移動通信システム）等の無線通信網や、Ｂｌｕｅｔｏｏｔｈ（登録商標）、無線ＬＡＮ（Local Area Network）等の近距離無線通信を介してネットワークＮに接続し、情報提供装置１００と通信することができる。

情報提供装置１００は、例えばＰＣやサーバ装置、あるいはメインフレーム又はワークステーション等である。なお、情報提供装置１００は、クラウドコンピューティングにより実現されてもよい。また、情報提供装置１００は、検索エンジンとしての検索サーバや、各種のログデータを取得するログサーバのように、役割に応じた個々のサーバ装置により構成されていてもよい。

〔３．情報処理装置の構成例〕
次に、図５を用いて、実施形態に係る情報提供装置１００の構成について説明する。図５は、実施形態に係る情報提供装置１００の構成例を示す図である。図５に示すように、情報提供装置１００は、通信部１１０と、記憶部１２０と、制御部１３０とを有する。

（通信部１１０）
通信部１１０は、例えば、ＮＩＣ（Network Interface Card）等によって実現される。また、通信部１１０は、ネットワークＮ（図４参照）と有線又は無線で接続される。

（記憶部１２０）
記憶部１２０は、例えば、ＲＡＭ（Random Access Memory）、フラッシュメモリ（Flash Memory）等の半導体メモリ素子、又は、ハードディスク、光ディスク等の記憶装置によって実現される。図５に示すように、記憶部１２０は、ユーザ情報データベース１２１と、ログ情報データベース１２２と、学習モデルデータベース１２３とを有する。

（ユーザ情報データベース１２１）
ユーザ情報データベース１２１は、ユーザＵに関する各種情報を記憶する。例えば、ユーザ情報データベース１２１は、ユーザＵの属性等の種々の情報を記憶する。図６は、ユーザ情報データベース１２１の一例を示す図である。図６に示した例では、ユーザ情報データベース１２１は、「ユーザＩＤ（Identifier）」、「年齢」、「性別」、「自宅」、「勤務地」、「興味」といった項目を有する。

「ユーザＩＤ」は、ユーザＵを識別するための識別情報を示す。また、「年齢」は、ユーザＩＤにより識別されるユーザＵの年齢を示す。なお、「年齢」は、例えば３５歳など、ユーザＩＤにより識別されるユーザＵの具体的な年齢であってもよい。また、「性別」は、ユーザＩＤにより識別されるユーザＵの性別を示す。

また、「自宅」は、ユーザＩＤにより識別されるユーザＵの自宅の位置情報を示す。なお、図６に示す例では、「自宅」は、「ＬＣ１１」といった抽象的な符号を図示するが、緯度経度情報等であってもよい。また、例えば、「自宅」は、地域名や住所であってもよい。

また、「勤務地」は、ユーザＩＤにより識別されるユーザＵの勤務地（学生の場合は学校）の位置情報を示す。なお、図６に示す例では、「勤務地」は、「ＬＣ１２」といった抽象的な符号を図示するが、緯度経度情報等であってもよい。また、例えば、「勤務地」は、地域名や住所であってもよい。

また、「興味」は、ユーザＩＤにより識別されるユーザＵの興味を示す。すなわち、「興味」は、ユーザＩＤにより識別されるユーザＵが関心の高い対象を示す。なお、図６に示す例では、「興味」は、各ユーザＵに１つずつ図示するが、複数であってもよい。

例えば、図６に示す例において、ユーザＩＤ「Ｕ１」により識別されるユーザＵの年齢は、「２０代」であり、性別は、「男性」であることを示す。また、例えば、ユーザＩＤ「Ｕ１」により識別されるユーザＵは、自宅が「ＬＣ１１」であることを示す。また、例えば、ユーザＩＤ「Ｕ１」により識別されるユーザＵは、勤務地が「ＬＣ１２」であることを示す。また、例えば、ユーザＩＤ「Ｕ１」により識別されるユーザＵは、「スポーツ」に興味があることを示す。

ここで、図６に示す例では、「Ｕ１」、「ＬＣ１１」および「ＬＣ１２」といった抽象的な値を用いて図示するが、「Ｕ１」、「ＬＣ１１」および「ＬＣ１２」には、具体的な文字列や数値等の情報が記憶されるものとする。以下、他の情報に関する図においても、抽象的な値を図示する場合がある。

なお、ユーザ情報データベース１２１は、上記に限らず、目的に応じて種々の情報を記憶してもよい。例えば、ユーザ情報データベース１２１は、ユーザＵの端末装置１０に関する各種情報を記憶してもよい。また、ユーザ情報データベース１２１は、ユーザＵのデモグラフィック（人口統計学的属性）、サイコグラフィック（心理学的属性）、ジオグラフィック（地理学的属性）、ベヘイビオラル（行動学的属性）等の属性に関する情報を記憶してもよい。例えば、ユーザ情報データベース１２１は、氏名、家族構成、職業、職位、収入、資格、居住形態（戸建、マンション等）、車の有無、通学・通勤時間、通学・通勤経路、定期券区間（駅、路線等）、利用頻度の高い駅（自宅・勤務地の最寄駅以外）、習い事（場所、時間帯等）、趣味、興味、ライフスタイル等の情報を記憶してもよい。

（ログ情報データベース１２２）
ログ情報データベース１２２は、ユーザＵの行動ログに関する各種情報を記憶する。図７は、ログ情報データベース１２２の一例を示す図である。図７に示した例では、ログ情報データベース１２２は、「ユーザＩＤ」、「検索クエリ」、「文書ＩＤ」、「行動」、「ラベル」といった項目を有する。

「ユーザＩＤ」は、ユーザＵを識別するための識別情報を示す。「検索クエリ」は、ユーザＵが検索エンジン等に入力した検索クエリ（キーワード）を示す。「文書ＩＤ」は、検索クエリ（キーワード）に基づく検索結果に含まれる文書（ウェブページ等）を識別するための識別情報を示す。

「行動」は、検索結果中の文書に対するユーザＵの行動を示す。例えば、「行動」は、購入等のコンバージョン（最終的な行動）へと至る段階的な行動（クリックする、カートに入れる、購入ボタンを押す等）である。文書に対して何も行動しない場合には、未入力を示す「－」が記憶される。ここで、初期状態（デフォルト）として、事前に全項目に未入力を示す「－」が記憶されていてもよい。なお、「－」は一例に過ぎない。実際には、行動しなかったことを示す「何もしない」や空欄（空白）等でもよい。

「ラベル」は、検索結果中の文書に対するユーザＵの行動に基づいて、文書に付与されるラベルを示す。例えば、「ラベル」は、「優」、「良」、「悪」の３段階のラベル等である。具体的には、「購入」に基づいて文書に「優」のラベルが付与される。「クリック」や「カート」に基づいて文書に「良」のラベルが付与される。「－」に基づいて文書に「悪」のラベルが付与される。

例えば、図７に示す例において、ユーザＩＤ「Ｕ１」により識別されるユーザＵは、入力した検索クエリ「検索クエリ＃１１」に基づく検索結果中の文書を示す文書ＩＤ「文書＃１１Ａ」に対応する文書に対して行動「購入」を行ったため、当該文書にラベル「優」が付与されたことを示す。

ここで、図７に示す例では、「Ｕ１」、「検索クエリ＃１１」および「文書＃１１Ａ」といった抽象的な値を用いて図示するが、「Ｕ１」、「検索クエリ＃１１」および「文書＃１１Ａ」には、具体的な文字列や数値等の情報が記憶されるものとする。

なお、ログ情報データベース１２２は、上記に限らず、目的に応じて種々の情報を記憶してもよい。例えば、ログ情報データベース１２２は、ユーザＵの位置履歴、検索履歴、閲覧履歴、購買履歴、投稿履歴等の情報を記憶してもよい。

（学習モデルデータベース１２３）
学習モデルデータベース１２３は、機械学習モデルに関する各種情報を記憶する。図８は、学習モデルデータベース１２３の一例を示す図である。図８に示した例では、学習モデルデータベース１２３は、「ユーザＩＤ」、「学習モデル」、「学習データ」、「制限」、「モデルサイズ」といった項目を有する。

「ユーザＩＤ」は、ユーザＵを識別するための識別情報を示す。なお、ユーザＵを識別する必要がなければ、学習モデルデータベース１２３に「ユーザＩＤ」は無くてもよい。

「学習モデル」は、学習データを入力する機械学習モデルを識別するための識別情報を示す。機械学習モデルは、例えばLightGBM等の勾配ブースティング決定木を用いたランキング学習により構築される。ここでは、機械学習モデルは、全ユーザに共通の学習モデルであるものとする。但し、実際には、ユーザごとに個別の学習モデルであってもよい。

「学習データ」は、機械学習モデルに入力される学習データを示す。学習データは、例えばHadoop（登録商標）クラスタ等の分散処理クラスタに蓄積されたログから、Hive等のデータウェアハウス及びSpark等の分散処理フレームワークを用いて作成される。学習データは、直近に入力された最新のデータであってもよいし、過去に入力されたデータの履歴であってもよい。また、不要であれば、学習モデルデータベース１２３に「学習データ」の欄は無くてもよい。

「制限」は、機械学習モデルに入力される学習データを制限するための情報を示す。例えば、「制限」は、機械学習モデルに入力される学習データの数の上限値（閾値）を示す。さらに、「制限」は、機械学習モデルに入力される学習データの数の下限値を示してもよい。なお、実際には、「制限」は、学習データの数に限らず、機械学習モデルに入力される学習データのカテゴリ等の種別を指定する情報を示してもよい。情報提供装置１００は、この「制限」に従い、学習データの数を制限するために、トランスフィルタを間に入れて学習データにフィルタをかけ、学習データを選別する。

「モデルサイズ」は、学習モデルのサイズを示す。例えば、情報提供装置１００は、この「モデルサイズ」が、学習モデルとして許容されるサイズの上限値を超えないように限定する。すなわち、情報提供装置１００は、学習モデルのサイズを所定の大きさに限定する。なお、「モデルサイズ」は、学習モデルとして許容されるサイズの上限値（閾値）を示してもよい。

例えば、図８に示す例において、ユーザＩＤ「Ｕ１」により識別されるユーザＵに対して、学習モデル「学習モデル＃１」が構築され、その学習モデルには学習データ「学習データ＃１」が制限「制限＃１」に応じた数だけ入力され、学習モデルがモデルサイズ「モデルサイズ＃１」の大きさであることを示す。

ここで、図８に示す例では、「Ｕ１」、「学習モデル＃１」、「学習データ＃１」、「制限＃１」および「モデルサイズ＃１」といった抽象的な値を用いて図示するが、「Ｕ１」、「学習モデル＃１」、「学習データ＃１」、「制限＃１」および「モデルサイズ＃１」には、具体的な文字列や数値等の情報が記憶されるものとする。

なお、学習モデルデータベース１２３は、上記に限らず、目的に応じて種々の情報を記憶してもよい。例えば、学習モデルデータベース１２３は、ユーザＵが利用する検索エンジンや検索サイトごとに機械学習モデルを記憶してもよい。これに伴い、検索エンジンや検索サイトに関する情報を記憶してもよい。

（制御部１３０）
図５に戻り、説明を続ける。制御部１３０は、コントローラ（Controller）であり、例えば、ＣＰＵ（Central Processing Unit）、ＭＰＵ（Micro Processing Unit）、ＡＳＩＣ（Application Specific Integrated Circuit）やＦＰＧＡ（Field Programmable Gate Array）等によって、情報提供装置１００の内部の記憶装置に記憶されている各種プログラム（情報処理プログラムの一例に相当）がＲＡＭ等の記憶領域を作業領域として実行されることにより実現される。図５に示す例では、制御部１３０は、取得部１３１と、生成部１３２と、選別部１３３と、学習部１３４と、設定部１３５と、提供部１３６とを有する。

（取得部１３１）
取得部１３１は、通信部１１０を介して、ユーザＵの端末装置１０から検索クエリ（検索キーワード）を含む検索リクエストを取得する。また、取得部１３１は、通信部１１０を介して、検索クエリに基づいて検索を行い、検索クエリにマッチする検索結果を取得する。

例えば、取得部１３１は、検索クエリを検索エンジンに入力して検索を行い、検索結果として取得した文書を順位付けして、ユーザＵの端末装置１０に提供する。なお、取得部１３１は、検索クエリに応じて検索処理を行う検索部であってもよい。

（生成部１３２）
生成部１３２は、取得部１３１により取得された検索結果にラベルを付与して学習データを生成する。

例えば、生成部１３２は、検索結果のうち、表示すべきものに最上位のラベルを付与し、表示しても違和感がないものに次点のラベルを付与し、表示すべきでないものに最下位のラベルを付与する。

ここでは、生成部１３２は、検索結果に対するユーザの行動ログに応じたラベルを付与する。具体的には、生成部１３２は、検索結果のうち、コンバージョンに至ったものに最上位のラベルを付与し、クリックされたものに次点のラベルを付与し、クリックされなかったものに最下位のラベルを付与する。

また、生成部１３２は、検索ＦＥから送信されたユーザの行動ログと、検索エンジンから送信された検索結果のランキングログとに基づいて、学習データを生成する。このとき、ユーザの行動ログとランキングログとはHadoop（登録商標）クラスタ等の分散処理クラスタに蓄積される。生成部１３２は、Hadoop（登録商標）クラスタ等の分散処理クラスタに蓄積されたログから、Hive等のデータウェアハウス及びSpark等の分散処理フレームワークを用いて、学習データを生成する。

（選別部１３３）
選別部１３３は、学習データの数を制限するために、トランスフィルタを間に入れて、生成部１３２により生成された学習データにフィルタをかけ、学習データを選別する。

また、選別部１３３は、構築された機械学習モデル（学習済モデル）への入力データの数を制限するために、トランスフィルタを間に入れて、取得部１３１により取得された検索結果にフィルタをかけ、検索結果を選別する。

（学習部１３４）
学習部１３４は、生成部１３２により生成された学習データを用いて機械学習を行う。具体的には、選別部１３３により選別（フィルタリング）された学習データを用いて機械学習を行う。例えば、学習部１３４は、LightGBM等の勾配ブースティング決定木を用いたランキング学習により、機械学習モデルを構築する。このとき、学習部１３４は、機械学習モデルのモデルサイズを所定の大きさに限定する。

（設定部１３５）
設定部１３５は、機械学習の結果得られた機械学習モデルを用いて検索結果の表示順位を設定する。例えば、設定部１３５は、構築された機械学習モデル（学習済モデル）をプラグイン形式に変換して検索エンジン上にデプロイする。そして、設定部１３５は、選別部１３３により選別（フィルタリング）された検索結果を学習済モデルに入力し、学習済モデルから出力された検索結果の表示順位を設定する。

（提供部１３６）
提供部１３６は、通信部１１０を介して、検索クエリを入力したユーザＵの端末装置１０に対して、構築された機械学習モデル（学習済モデル）を用いて表示順位が設定された検索結果を提供する。

〔４．処理手順〕
次に、図９～図１５を用いて実施形態に係る情報提供装置１００による処理手順について説明する。

〔４－１．機械学習モデルの構築に係る処理手順〕
まず、図９を用いて、機械学習モデルの構築に係る処理手順について説明する。図９は、機械学習モデルの構築に係る処理手順を示すフローチャートである。なお、以下に示す処理手順は、情報提供装置１００の制御部１３０によって繰り返し実行される。

例えば、情報提供装置１００は、ネットワークＮ（図４参照）を介して、ユーザの端末装置１０から検索クエリ（キーワード）を取得する（ステップＳ１０１）。

そして、情報提供装置１００は、検索クエリを検索エンジンに入力して検索を行い、検索結果として取得した文書を順位付けして、ユーザＵの端末装置１０に提供する（ステップＳ１０２）。

そして、情報提供装置１００は、検索結果中の文書に対するユーザＵの行動に基づいて、各文書にラベル付与し、学習データを作成する（ステップＳ１０３）。

ここで、情報提供装置１００は、学習データの数を制限するために、トランスフィルタを間に入れて学習データにフィルタをかけ、学習データを選別する（ステップＳ１０４）。

そして、情報提供装置１００は、学習データを用いて、例えばLightGBM等の勾配ブースティング決定木を用いたランキング学習により、機械学習モデルを構築する（ステップＳ１０５）。

このとき、情報提供装置１００は、機械学習モデルが大きくなり過ぎないように、モデルサイズ（LightGBMであれば、分岐する木の数）を所定の大きさに限定する。

そして、情報提供装置１００は、構築された機械学習モデル（学習済モデル）をプラグイン形式に変換して検索エンジン上にデプロイする（ステップＳ１０６）。

これにより、次回以降の検索において、検索結果中の文書が機械学習モデル（学習済モデル）により順位付けされる。

〔４－２．多段階ランキングに係る処理手順〕
次に、図１０～図１５を用いて、多段階ランキングに係る処理手順について説明する。図１０は、多段階ランキングに係る処理手順を示すフローチャートである。図１１は、高速なランキングについての説明図である。図１２は、高精度なランキングについての説明図である。図１３は、さらに高精度なランキングについての説明図である。図１４は、さらにさらに高精度なランキングについての説明図である。図１５は、ランキング結果の提供についての説明図である。なお、以下に示す処理手順は、情報提供装置１００の制御部１３０によって繰り返し実行される。

例えば、情報提供装置１００は、ネットワークＮ（図４参照）を介して、ユーザの端末装置１０から検索クエリ（キーワード）を取得する（ステップＳ２０１）。

そして、情報提供装置１００は、検索クエリを検索エンジンに入力して検索を行い、検索結果として取得した文書に対して、高速で低精度なランキングを行う（ステップＳ２０２）。

例えば、図１１に示すように、情報提供装置１００は、検索クエリが「スマホケース」である場合、「スマホ」の索引と「ケース」の索引とをマッチングし、「スマホ」と「ケース」とを両方含む所定の件数（例えば１００万件）の文書のリストを取得し、これらの文書のリストに基づいて高速なランキングを行う。すなわち、軽い計算で荒くフィルタリングする（軽量モデル：light-model）。

このとき、情報提供装置１００は、高速なランキングの結果のうち、上位の所定の件数（例えば上位１０００件）の文書を保持する。

そして、情報提供装置１００は、既に実施したランキング手法とは精度と速度が異なるランキング手法を適用する（ステップＳ２０３）。

精度とは、利用者の検索意図に合致している度合い（合致度）を指す。利用者の検索意図により合致させるためには、検索クエリと商品情報との一致度のみならず、利用者の属性や閲覧履歴、商品の閲覧回数や購入回数等、各種の情報をより多く用いて、ランキングを生成する必要がある。このような情報の数や、情報同士のマッチングに要する処理（例えば、文字解析や特徴量比較等）に用いる計算リソース（計算資源）が多ければ多いほど、より精度が向上する。このため、情報提供装置１００は、ランキング手法について、必要な計算リソースが少ないものから、徐々に重いものへと段階的に適用していく。

計算リソースとは、例えばＣＰＵの数、処理時間、メモリ量、消費電力量等である。

そして、情報提供装置１００は、上位の文書だけに対して、低速だが高精度なランキングを行う（ステップＳ２０４）。

そして、情報提供装置１００は、さらに上位の文書に対する高精度なランキングを行うか否かを判定する（ステップＳ２０５）。

そして、情報提供装置１００は、さらに上位の文書に対する高精度なランキングを行う場合（ステップＳ２０５；Ｙｅｓ）、さらに上位の文書だけに対して、既に実施したランキング手法とは精度と速度が異なるランキング手法を用いて、低速だが高精度なランキングを行う（ステップＳ２０３に戻る）。

例えば、図１２に示すように、情報提供装置１００は、上位１０００件の文書に対して、精度と速度が異なるランキング手法を用いて、高精度なランキングを行う。すなわち、検索エンジン上にデプロイされた機械学習モデル（学習済モデル）を使用してランキングする（重量モデル：heavy-model）。

次に、図１３に示すように、情報提供装置１００は、上位１０００件の文書のうち、上位１００件の文書に対して、さらに精度と速度が異なるランキング手法を用いて、高精度なランキングを行う。また、上位１０００件の文書のうち、上位１００件以外（上位１００位未満：上位１０１位～１０００位）の文書については、そのまま再利用する。

次に、図１４に示すように、情報提供装置１００は、上位１００件の文書のうち、上位１０件の文書に対して、さらにさらに精度と速度が異なるランキング手法を用いて、高精度なランキングを行う。また、上位１００件の文書のうち、上位１０件以外（上位１０位未満：上位１１位～１００位）の文書については、そのまま再利用する。

そして、情報提供装置１００は、さらに上位の文書に対する高精度なランキングを行わない場合（ステップＳ２０５；Ｎｏ）、最終的なランキング結果のうち、ユーザが指定した部分を提供する（ステップＳ２０６）。

例えば、図１５に示すように、情報提供装置１００は、上位１０００件の文書のうち、ユーザにより６件目から５件分（上位６位～１０位）の文書が指定された場合、ランキング結果として、６件目から５件分の文書をユーザに提供する。

〔５．変形例〕
上述した端末装置１０および情報提供装置１００は、上記実施形態以外にも種々の異なる形態にて実施されてよい。そこで、以下では、実施形態の変形例について説明する。

上記実施形態において、情報提供装置１００は、ユーザのネットワーク上の行動を示すログデータを取得してもよい。例えば、情報提供装置１００は、ユーザの位置の履歴である位置履歴を端末装置１０から取得する。また、情報提供装置１００は、ユーザが入力した検索クエリの履歴である検索履歴を検索サーバ（検索エンジン）から取得する。また、情報提供装置１００は、ユーザが閲覧したコンテンツの履歴である閲覧履歴をコンテンツサーバから取得する。また、情報提供装置１００は、ユーザによる決済の履歴である決済履歴を電子商取引サーバや電子決済サーバから取得する。また、情報提供装置１００は、ユーザによる投稿の履歴である投稿履歴を口コミの投稿サービスを提供する投稿サーバやＳＮＳ（Social Networking Service）サーバから取得する。なお、情報提供装置１００は、上述した情報の他にも各種の情報を取得可能である。例えば、情報提供装置１００は、ユーザの年齢、性別、家族構成、経済状況といったユーザの属性に関する情報を取得する。

なお、情報提供装置１００は、ユーザの端末装置１０内の一機能として実装されてもよい。例えば、情報提供装置１００は、ユーザの端末装置１０のうちの一台であってもよい。また、ユーザの端末装置１０として、情報提供装置１００を直接操作してもよい。すなわち、端末装置１０と情報提供装置１００とは、同一の装置であってもよい。

また、上記実施形態において、情報提供装置１００は、全ユーザに共通の機械学習モデルを構築しているが、実際には、ユーザごとに個別の機械学習モデルを構築してもよい。また、各ユーザの行動ログを比較照合し、行動ログに共通点又は類似性があるユーザ同士をグループ化（グルーピング）し、グループごとの機械学習モデルを構築してもよい。

また、上記実施形態においては、ＥＣサイト等での商品検索を例に説明しているが、実際には、アプリストアでのアプリ検索や、動画検索サイトでの動画検索、イラスト／漫画／小説の投稿サイトでの作品検索、学術論文サイトでの論文検索、ニュースサイトでのニュース検索等であってもよい。

また、上記実施形態において、モデルの学習手法は、例えばディープニューラルネットワーク（ＤＮＮ：Deep Neural Network）を利用したディープラーニング（深層学習）等であってもよい。また、データマイニングやその他の機械学習アルゴリズムを利用してもよい。情報提供装置１００は、上述した各種の学習手法により、モデルの学習を行う。

〔６．効果〕
上述してきたように、本願に係る情報提供装置１００は、取得部１３１と、生成部１３２と、学習部１３４と、設定部１３５と、を備える。取得部１３１は、検索クエリにマッチする検索結果（文書等）を取得する。生成部１３２は、取得された検索結果に、当該検索結果に対するユーザの行動ログに応じたラベルを付与して学習データを生成する。学習部１３４は、生成された学習データを用いて機械学習を行う。設定部１３５は、機械学習の結果得られた学習モデルを用いて検索結果の表示順位を設定する。これにより、利用者の検索意図を反映した適切な検索結果を提供することができる。

〔７．ハードウェア構成〕
また、上述した実施形態に係る端末装置１０や情報提供装置１００は、例えば図１６に示すような構成のコンピュータ１０００によって実現される。以下、情報提供装置１００を例に挙げて説明する。図１６は、ハードウェア構成の一例を示す図である。コンピュータ１０００は、出力装置１０１０、入力装置１０２０と接続され、演算装置１０３０、一次記憶装置１０４０、二次記憶装置１０５０、出力Ｉ／Ｆ（Interface）１０６０、入力Ｉ／Ｆ１０７０、ネットワークＩ／Ｆ１０８０がバス１０９０により接続された形態を有する。

演算装置１０３０は、一次記憶装置１０４０や二次記憶装置１０５０に格納されたプログラムや入力装置１０２０から読み出したプログラム等に基づいて動作し、各種の処理を実行する。演算装置１０３０は、例えばＣＰＵ（Central Processing Unit）、ＭＰＵ（Micro Processing Unit）、ＡＳＩＣ（Application Specific Integrated Circuit）やＦＰＧＡ（Field Programmable Gate Array）等により実現される。

一次記憶装置１０４０は、ＲＡＭ（Random Access Memory）等、演算装置１０３０が各種の演算に用いるデータを一次的に記憶するメモリ装置である。また、二次記憶装置１０５０は、演算装置１０３０が各種の演算に用いるデータや、各種のデータベースが登録される記憶装置であり、ＲＯＭ（Read Only Memory）、ＨＤＤ（Hard Disk Drive）、ＳＳＤ（Solid State Drive）、フラッシュメモリ等により実現される。二次記憶装置１０５０は、内蔵ストレージであってもよいし、外付けストレージであってもよい。また、二次記憶装置１０５０は、ＵＳＢメモリやＳＤ（Secure Digital）メモリカード等の取り外し可能な記憶媒体であってもよい。また、二次記憶装置１０５０は、クラウドストレージ（オンラインストレージ）やＮＡＳ（Network Attached Storage）、ファイルサーバ等であってもよい。

出力Ｉ／Ｆ１０６０は、ディスプレイ、プロジェクタ、およびプリンタ等といった各種の情報を出力する出力装置１０１０に対し、出力対象となる情報を送信するためのインターフェイスであり、例えば、ＵＳＢ（Universal Serial Bus）やＤＶＩ（Digital Visual Interface）、ＨＤＭＩ（登録商標）（High Definition Multimedia Interface）といった規格のコネクタにより実現される。また、入力Ｉ／Ｆ１０７０は、マウス、キーボード、キーパッド、ボタン、およびスキャナ等といった各種の入力装置１０２０から情報を受信するためのインターフェイスであり、例えば、ＵＳＢ等により実現される。

また、出力Ｉ／Ｆ１０６０および入力Ｉ／Ｆ１０７０はそれぞれ出力装置１０１０および入力装置１０２０と無線で接続してもよい。すなわち、出力装置１０１０および入力装置１０２０は、ワイヤレス機器であってもよい。

また、出力装置１０１０および入力装置１０２０は、タッチパネルのように一体化していてもよい。この場合、出力Ｉ／Ｆ１０６０および入力Ｉ／Ｆ１０７０も、入出力Ｉ／Ｆとして一体化していてもよい。

なお、入力装置１０２０は、例えば、ＣＤ（Compact Disc）、ＤＶＤ（Digital Versatile Disc）、ＰＤ（Phase change rewritable Disk）等の光学記録媒体、ＭＯ（Magneto-Optical disk）等の光磁気記録媒体、テープ媒体、磁気記録媒体、又は半導体メモリ等から情報を読み出す装置であってもよい。

ネットワークＩ／Ｆ１０８０は、ネットワークＮを介して他の機器からデータを受信して演算装置１０３０へ送り、また、ネットワークＮを介して演算装置１０３０が生成したデータを他の機器へ送信する。

演算装置１０３０は、出力Ｉ／Ｆ１０６０や入力Ｉ／Ｆ１０７０を介して、出力装置１０１０や入力装置１０２０の制御を行う。例えば、演算装置１０３０は、入力装置１０２０や二次記憶装置１０５０からプログラムを一次記憶装置１０４０上にロードし、ロードしたプログラムを実行する。

例えば、コンピュータ１０００が情報提供装置１００として機能する場合、コンピュータ１０００の演算装置１０３０は、一次記憶装置１０４０上にロードされたプログラムを実行することにより、制御部１３０の機能を実現する。また、コンピュータ１０００の演算装置１０３０は、ネットワークＩ／Ｆ１０８０を介して他の機器から取得したプログラムを一次記憶装置１０４０上にロードし、ロードしたプログラムを実行してもよい。また、コンピュータ１０００の演算装置１０３０は、ネットワークＩ／Ｆ１０８０を介して他の機器と連携し、プログラムの機能やデータ等を他の機器の他のプログラムから呼び出して利用してもよい。

〔８．その他〕
以上、本願の実施形態を説明したが、これら実施形態の内容により本発明が限定されるものではない。また、前述した構成要素には、当業者が容易に想定できるもの、実質的に同一のもの、いわゆる均等の範囲のものが含まれる。さらに、前述した構成要素は適宜組み合わせることが可能である。さらに、前述した実施形態の要旨を逸脱しない範囲で構成要素の種々の省略、置換又は変更を行うことができる。

また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部又は一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部又は一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。

また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部又は一部を、各種の負荷や使用状況等に応じて、任意の単位で機能的又は物理的に分散・統合して構成することができる。

例えば、上述した情報提供装置１００は、複数のサーバコンピュータで実現してもよく、また、機能によっては外部のフレームワーク等をＡＰＩ（Application Programming Interface）やネットワークコンピューティング等で呼び出して実現する等、構成は柔軟に変更できる。

また、上述してきた実施形態および変形例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。

また、上述してきた「部（section、module、unit）」は、「手段」や「回路」等に読み替えることができる。例えば、取得部は、取得手段や取得回路に読み替えることができる。

１情報処理システム
１０端末装置
１００情報提供装置
１１０通信部
１２０記憶部
１２１ユーザ情報データベース
１２２ログ情報データベース
１２３学習モデルデータベース
１３０制御部
１３１取得部
１３２生成部
１３３選別部
１３４学習部
１３５設定部
１３６提供部

Claims

検索クエリにマッチする検索結果を取得する取得部と、
取得された前記検索結果に、前記検索結果に対するユーザの行動ログに応じたラベルを付与して学習データを生成する生成部と、
生成された前記学習データにフィルタをかけ、前記学習データを選別する選別部と、
選別された前記学習データを用いて機械学習を行う学習部と、
前記機械学習の結果得られた学習モデルを用いて前記検索結果の表示順位を設定する設定部と、
を備え、
前記生成部は、コンバージョンへと至る段階的な行動のそれぞれに基づいて、前記検索結果として取得された文書のうち、
前記ユーザがクリックし、コンバージョンに至った文書であれば第１のラベルを付与し、
前記ユーザがクリックしたが、コンバージョンには至らなかった文書であれば第２のラベルを付与し、
前記ユーザがクリックすらしなかった文書であれば第３のラベルを付与することで、各行動が行われた文書にラベルを付与し、文書ごとの特徴量を分散処理クラスタに蓄積し、前記分散処理クラスタに蓄積された文書ごとの特徴量から、分散処理フレームワークを用いて前記学習データを生成し、
前記選別部は、前記学習データの数を制限するためにトランスフィルタを間に入れて、生成された前記学習データにフィルタをかけ、前記学習データを選別し、
前記学習部は、選別された前記学習データを用いて、勾配ブースティング決定木を用いたランキング学習により前記学習モデルを構築する際に、前記学習モデルが大きくなり過ぎないように前記学習モデルのモデルサイズを所定の大きさに限定する
ことを特徴とする情報処理装置。
前記生成部は、前記検索結果として取得された同一の文書に対して、検索クエリごとに異なるラベルを付与する
ことを特徴とする請求項１に記載の情報処理装置。
前記生成部は、前記検索結果として取得された文書のうち、優先的に表示すべきものに前記第１のラベルとして最上位のラベルを付与し、表示しても違和感がないものに前記第２のラベルとして次点のラベルを付与し、表示すべきでないものに前記第３のラベルとして最下位のラベルを付与する
ことを特徴とする請求項１又は２に記載の情報処理装置。
前記生成部は、前記検索結果として取得された文書のうち、コンバージョンに至ったものに前記第１のラベルとして最上位のラベルを付与し、前記ユーザにクリックされたものに前記第２のラベルとして次点のラベルを付与し、前記ユーザにクリックされなかったものに前記第３のラベルとして最下位のラベルを付与する
ことを特徴とする請求項１～３のうちいずれか１つに記載の情報処理装置。
前記選別部は、取得された前記検索結果にフィルタをかけ、前記検索結果を選別し、
前記設定部は、選別された前記検索結果を前記学習モデルに入力して前記検索結果の表示順位を設定する
ことを特徴とする請求項１～４のうちいずれか１つに記載の情報処理装置。
前記選別部は、構築された前記学習モデルへの入力データの数を制限するためにトランスフィルタを間に入れて、取得された前記検索結果にフィルタをかけ、前記検索結果を選別する
ことを特徴とする請求項５に記載の情報処理装置。
前記設定部は、選別された前記検索結果を前記学習モデルに入力し、前記学習モデルから出力された前記検索結果の表示順位を設定する
ことを特徴とする請求項５又は６に記載の情報処理装置。
前記設定部は、前記検索結果の表示順位の上位の所定順位以内のものを、より高精度な学習モデルに入力して、再度、前記検索結果の表示順位を設定する
ことを特徴とする請求項５～７のうちいずれか１つに記載の情報処理装置。
前記生成部は、検索フロントエンドから送信されたユーザの行動ログと、検索エンジンから送信された前記検索結果のランキングログとに基づいて、前記学習データを生成する
ことを特徴とする請求項１～８のうちいずれか１つに記載の情報処理装置。
前記検索フロントエンドから送信されたユーザの行動ログと、前記検索エンジンから送信された前記検索結果のランキングログとは分散処理クラスタに蓄積され、
前記生成部は、前記分散処理クラスタに蓄積された前記ユーザの行動ログと前記ランキングログとから、分散処理フレームワークを用いて、前記学習データを生成する
ことを特徴とする請求項９に記載の情報処理装置。
前記生成部は、購入又はボタンの押下というコンバージョンへと至る段階的な行動のそれぞれに基づいて、前記検索結果として取得された文書のうち、
前記ユーザがクリックし、購入又はボタンの押下というコンバージョンに至った文書であれば前記第１のラベルを付与し、
前記ユーザがクリックしたが、購入又はボタンの押下というコンバージョンには至らなかった文書であれば前記第２のラベルを付与し、
前記ユーザがクリックすらしなかった文書であれば前記第３のラベルを付与することで、各行動が行われた文書にラベルを付与し、文書ごとの特徴量を分散処理クラスタに蓄積し、前記分散処理クラスタに蓄積された文書ごとの特徴量から、分散処理フレームワークを用いて前記学習データを生成し、
前記学習部は、生成された前記学習データを用いて、勾配ブースティング決定木を用いたランキング学習により、前記学習モデルを構築する
ことを特徴とする請求項１～１０のうちいずれか１つに記載の情報処理装置。
前記検索結果には、前記検索結果の情報を表す特徴量が与えられている
ことを特徴とする請求項１～１１のうちいずれか１つに記載の情報処理装置。
情報処理装置が実行する情報処理方法であって、
検索クエリにマッチする検索結果を取得する取得工程と、
取得された前記検索結果に、前記検索結果に対するユーザの行動ログに応じたラベルを付与して学習データを生成する生成工程と、
生成された前記学習データにフィルタをかけ、前記学習データを選別する選別工程と、
選別された前記学習データを用いて機械学習を行う学習工程と、
前記機械学習の結果得られた学習モデルを用いて前記検索結果の表示順位を設定する設定工程と、
を含み、
前記生成工程では、コンバージョンへと至る段階的な行動のそれぞれに基づいて、前記検索結果として取得された文書のうち、
前記ユーザがクリックし、コンバージョンに至った文書であれば第１のラベルを付与し、
前記ユーザがクリックしたが、コンバージョンには至らなかった文書であれば第２のラベルを付与し、
前記ユーザがクリックすらしなかった文書であれば第３のラベルを付与することで、各行動が行われた文書にラベルを付与し、文書ごとの特徴量を分散処理クラスタに蓄積し、前記分散処理クラスタに蓄積された文書ごとの特徴量から、分散処理フレームワークを用いて前記学習データを生成し、
前記選別工程では、前記学習データの数を制限するためにトランスフィルタを間に入れて、生成された前記学習データにフィルタをかけ、前記学習データを選別し、
前記学習工程では、選別された前記学習データを用いて、勾配ブースティング決定木を用いたランキング学習により前記学習モデルを構築する際に、前記学習モデルが大きくなり過ぎないように前記学習モデルのモデルサイズを所定の大きさに限定する
ことを特徴とする情報処理方法。
検索クエリにマッチする検索結果を取得する取得手順と、
取得された前記検索結果に、前記検索結果に対するユーザの行動ログに応じたラベルを付与して学習データを生成する生成手順と、
生成された前記学習データにフィルタをかけ、前記学習データを選別する選別手順と、
選別された前記学習データを用いて機械学習を行う学習手順と、
前記機械学習の結果得られた学習モデルを用いて前記検索結果の表示順位を設定する設定手順と、
をコンピュータに実行させ、
前記生成手順では、コンバージョンへと至る段階的な行動のそれぞれに基づいて、前記検索結果として取得された文書のうち、
前記ユーザがクリックし、コンバージョンに至った文書であれば第１のラベルを付与し、
前記ユーザがクリックしたが、コンバージョンには至らなかった文書であれば第２のラベルを付与し、
前記ユーザがクリックすらしなかった文書であれば第３のラベルを付与することで、各行動が行われた文書にラベルを付与し、文書ごとの特徴量を分散処理クラスタに蓄積し、前記分散処理クラスタに蓄積された文書ごとの特徴量から、分散処理フレームワークを用いて前記学習データを生成し、
前記選別手順では、前記学習データの数を制限するためにトランスフィルタを間に入れて、生成された前記学習データにフィルタをかけ、前記学習データを選別し、
前記学習手順では、選別された前記学習データを用いて、勾配ブースティング決定木を用いたランキング学習により前記学習モデルを構築する際に、前記学習モデルが大きくなり過ぎないように前記学習モデルのモデルサイズを所定の大きさに限定する
ことを特徴とする情報処理プログラム。