WO2019159288A1

WO2019159288A1 - 情報処理システム、情報処理方法、及びプログラム

Info

Publication number: WO2019159288A1
Application number: PCT/JP2018/005315
Authority: WO
Inventors: ドンフンシン
Original assignee: 楽天株式会社
Priority date: 2018-02-15
Filing date: 2018-02-15
Publication date: 2019-08-22
Also published as: JP6805340B2; JPWO2019159288A1

Abstract

ユーザに提示する情報の精度を高める。情報処理システム（１）の第１取得手段（１０１）は、複数のデータ項目の各々の特徴に関するデータ項目特徴情報を取得する。第２取得手段（１０２）は、各データ項目に対するユーザの行動履歴に関する行動履歴情報を取得する。クラスタリング手段（１０３）は、行動履歴情報が示す各データ項目のデータ項目特徴情報に基づいて、各データ項目のクラスタリングを行う。提示手段（１０４）は、クラスタリング手段（１０３）の処理結果に基づいて、複数のデータ項目のうちの少なくとも１つに関するデータ項目情報を、ユーザに提示する。

Description

情報処理システム、情報処理方法、及びプログラム

　本発明は、情報処理システム、情報処理方法、及びプログラムに関する。

　従来、ユーザによるウェブサイトの閲覧や商品の購入などの行動履歴を解析する技術が知られている。例えば、特許文献１には、複数のユーザの各々のコンテンツ履歴に基づいて、嗜好が似たユーザのグループであるクラスタに各ユーザを割り当て、各クラスタの代表ユーザのコンテンツ履歴特性と、新規ユーザのコンテンツ履歴特性と、に基づいて新規ユーザを何れかのクラスタに割り当てることで、新規ユーザの嗜好に合ったコンテンツを提供するシステムが記載されている。

特開２０１３－２００６１２号公報

　しかしながら、特許文献１のコンテンツ履歴特性は、互いに特性の異なる種々の分野全体における行動履歴から算出されるものであり、分野ごとの細かな嗜好を示すものではない。例えば、コンテンツ履歴特性を算出する際に、ある分野における嗜好と、他の分野における嗜好と、が相殺されてしまい、分野特有の嗜好を示す情報とはならない。このため、特許文献１の技術では、コンテンツ履歴特性を利用して新規ユーザをクラスタに割り当てたとしても、ユーザに提示する情報の精度を十分に高めることができない。

　本発明は上記課題に鑑みてなされたものであって、その目的は、ユーザに提示する情報の精度を高めることが可能な情報処理システム、情報処理方法、及びプログラムを提供することである。

　上記課題を解決するために、本発明に係る情報処理システムは、複数のデータ項目の各々の特徴に関するデータ項目特徴情報を取得する第１取得手段と、各データ項目に対するユーザの行動履歴に関する行動履歴情報を取得する第２取得手段と、前記行動履歴情報が示す各データ項目の前記データ項目特徴情報に基づいて、各データ項目のクラスタリングを行うクラスタリング手段と、前記クラスタリング手段の処理結果に基づいて、前記複数のデータ項目のうちの少なくとも１つに関するデータ項目情報を、前記ユーザに提示する提示手段と、を含むことを特徴とする。

　本発明に係る情報処理方法は、複数のデータ項目の各々の特徴に関するデータ項目特徴情報を取得する第１取得ステップと、各データ項目に対するユーザの行動履歴に関する行動履歴情報を取得する第２取得ステップと、前記行動履歴情報が示す各データ項目の前記データ項目特徴情報に基づいて、各データ項目のクラスタリングを行うクラスタリングステップと、前記クラスタリングステップの処理結果に基づいて、前記複数のデータ項目のうちの少なくとも１つに関するデータ項目情報を、前記ユーザに提示する提示ステップと、を含むことを特徴とする。

　本発明に係るプログラムは、複数のデータ項目の各々の特徴に関するデータ項目特徴情報を取得する第１取得手段、各データ項目に対するユーザの行動履歴に関する行動履歴情報を取得する第２取得手段、前記行動履歴情報が示す各データ項目の前記データ項目特徴情報に基づいて、各データ項目のクラスタリングを行うクラスタリング手段、前記クラスタリング手段の処理結果に基づいて、前記複数のデータ項目のうちの少なくとも１つに関するデータ項目情報を、前記ユーザに提示する提示手段、としてコンピュータを機能させる。

　また、本発明に係る情報記憶媒体は、上記のプログラムが記憶されたコンピュータ読み取り可能な情報記憶媒体である。

　また、本発明の一態様では、前記クラスタリング手段は、クラスタごとに、当該クラスタに属する各データ項目の前記データ項目特徴情報に基づいて、ユーザ特徴情報を取得し、前記提示手段は、各クラスタの前記ユーザ特徴情報と、各データ項目の前記データ項目特徴情報と、に基づいて、前記データ項目情報を提示する、ことを特徴とする。

　また、本発明の一態様では、各クラスタの前記ユーザ特徴情報と、各データ項目の前記データ項目特徴情報と、はそれぞれベクトルで示されており、前記提示手段は、各クラスタの前記ユーザ特徴情報が示すベクトルと、各データ項目の前記データ項目特徴情報が示すベクトルと、の比較結果に基づいて、前記データ項目情報を提示する、ことを特徴とする。

　また、本発明の一態様では、前記クラスタリング手段は、各クラスタに属する各データ項目の前記データ項目特徴情報が示すベクトルの平均値を、当該クラスタの前記ユーザ特徴情報として取得する、ことを特徴とする。

　また、本発明の一態様では、前記提示手段は、前記複数のデータ項目のうち、各クラスタ内のデータ項目の前記データ項目特徴情報を、当該クラスタの前記ユーザ特徴情報との比較対象とする、ことを特徴とする。

　また、本発明の一態様では、前記第１取得手段は、複数のユーザの各々の前記行動履歴情報に基づいて、各データ項目の前記データ項目特徴情報を取得する、ことを特徴とする。

　また、本発明の一態様では、各データ項目の前記データ項目特徴情報は、予め設定された当該データ項目の分類情報を含む、ことを特徴とする。

　また、本発明の一態様では、前記クラスタリング手段は、前記行動履歴情報に基づいて、クラスタサイズを変化させる、ことを特徴とする。

　また、本発明の一態様では、前記行動履歴情報は、各データ項目に対する前記ユーザの行動の種類に関する行動種類情報を含み、前記提示手段は、前記行動種類情報に更に基づいて、前記データ項目情報を提示する、ことを特徴とする。

　また、本発明の一態様では、前記行動履歴情報は、各データ項目に対する前記ユーザの行動時間に関する行動時間情報を含み、前記提示手段は、前記行動時間情報に更に基づいて、前記データ項目情報を提示する、ことを特徴とする。

　また、本発明の一態様では、前記データ項目情報は、前記複数のデータ項目の少なくとも１つに関するクーポン情報又はリコメンド情報である、ことを特徴とする。

　また、本発明の一態様では、各データ項目は、商品に関するデータ項目であり、前記第１取得手段は、複数の商品の各々の特徴に関する前記データ項目特徴情報を取得し、前記第２取得手段は、各商品に対する前記ユーザの行動履歴に関する前記行動履歴情報を取得し、前記クラスタリング手段は、前記行動履歴情報が示す各商品の前記データ項目特徴情報に基づいて、各商品のクラスタリングを行い、前記提示手段は、前記複数の商品のうちの少なくとも１つに関する前記データ項目情報を前記ユーザに提示する、ことを特徴とする。

　本発明によれば、ユーザに提示する情報の精度を高めることができる。

情報処理システムの全体構成を示す図である。情報処理システムで実現される機能の一例を示す機能ブロック図である。商品データベースの一例を示す図である。ユーザデータベースの一例を示す図である。クーポンデータベースの一例を示す図である。クラスタリング部の処理内容を示す図である。事前準備処理を示すフロー図である。Ｓ２の処理の詳細を示す図である。クーポン提示処理を示すフロー図である。商品ページの画面例を示す図である。

［１．情報処理システムの全体構成］
　以下、本発明に関わる情報処理システムの実施形態の例を説明する。図１は、情報処理システムの全体構成を示す図である。図１に示すように、情報処理システム１は、サーバ１０及びユーザ端末２０を含み、これらはネットワークを介してデータ送受信可能に接続される。なお、図１では、サーバ１０及びユーザ端末２０を１台ずつ示しているが、これらは複数台あってもよい。また、情報処理システム１は、サーバ１０及びユーザ端末２０以外のコンピュータを含んでいてもよい。

　サーバ１０は、サーバコンピュータであり、例えば、制御部１１、記憶部１２、及び通信部１３を含む。制御部１１は、少なくとも１つのプロセッサを含む。制御部１１は、記憶部１２に記憶されたプログラムやデータに従って処理を実行する。記憶部１２は、主記憶部及び補助記憶部を含む。例えば、主記憶部はＲＡＭなどの揮発性メモリであり、補助記憶部は、ハードディスクやフラッシュメモリなどの不揮発性メモリである。通信部１３は、有線通信又は無線通信用の通信インタフェースを含み、例えば、ネットワークを介してデータ通信を行う。

　ユーザ端末２０は、ユーザが操作するコンピュータであり、例えば、パーソナルコンピュータ、携帯情報端末（タブレット型コンピュータを含む）、又は携帯電話機（スマートフォンを含む）等である。ユーザ端末２０は、制御部２１、記憶部２２、通信部２３、操作部２４、及び表示部２５を含む。制御部２１、記憶部２２、及び通信部２３のハードウェア構成は、それぞれ制御部１１、記憶部１２、及び通信部１３と同様であってよい。操作部２４は、ユーザが操作を行うための入力デバイスであり、例えば、タッチパネルやマウス等のポインティングデバイスやキーボード等である。操作部２４は、ユーザの操作内容を制御部２１に伝達する。表示部２５は、例えば、液晶表示部又は有機ＥＬ表示部等である。

　なお、記憶部１２，２２に記憶されるものとして説明するプログラム及びデータは、ネットワークを介してこれらに供給されるようにしてもよい。また、サーバ１０及びユーザ端末２０のハードウェア構成は、上記の例に限られず、種々のハードウェアを適用可能である。例えば、サーバ１０及びユーザ端末２０は、それぞれコンピュータ読み取り可能な情報記憶媒体を読み取る読取部（例えば、光ディスクドライブやメモリカードスロット）や外部機器と直接的に接続するための入出力部（例えば、ＵＳＢ端子）を含んでもよい。この場合、情報記憶媒体に記憶されたプログラムやデータが読取部又は入出力部を介して、サーバ１０又はユーザ端末２０に供給されるようにしてもよい。

［２．情報処理システムの概要］
　情報処理システム１では、複数のデータ項目がサーバ１０に記憶されており、任意のデータ項目がユーザに提供される。データ項目は、ユーザに所定の情報を提供するためのデータである。データ項目の内容は、任意であってよく、例えば、商品、サービス、又はコンテンツに関する内容であってもよい。

　商品は、取引の対象となる物であればよく、例えば、食料品、衣料品、家具、家電、又は電子機器などの有体物であってもよいし、後述するコンテンツのような無体物であってもよい。例えば、データ項目は、商品ページをユーザ端末２０に表示させるためのデータである。データ項目は、商品ページのＨＴＭＬであってもよいし、商品ページのフレームに挿入する画像やテキストであってもよい。なお、フレームは、アプリケーション内で画面を表示させる場合の画面レイアウトを定義したデータである。

　サービスは、任意の内容のサービスであってよく、例えば、旅行予約、保険の申し込み、レストラン予約、宝くじの購入、又は金融サービスなどである。例えば、データ項目は、サービスの利用申込ページをユーザ端末２０に表示させるためのデータである。データ項目は、利用申込ページのＨＴＭＬであってもよいし、利用申込ページのフレームに挿入する画像やテキストであってもよい。

　コンテンツは、任意の内容のコンテンツであってよく、例えば、ウェブサイト、クーポン、広告、電子書籍、動画、画像、楽曲、又はアプリケーションなどである。例えば、商品ページ及びサービスの利用申込ページも、コンテンツの一例ということもできる。例えば、データ項目は、コンテンツデータそのものであってもよいし、コンテンツのダウンロードページをユーザ端末２０に表示させるためのデータであってもよい。データ項目は、ダウンロードページのＨＴＭＬであってもよいし、ダウンロードページのフレームに挿入する画像やテキストであってもよい。

　本実施形態では、各データ項目が商品に関するデータ項目である場合を一例として説明する。以降の説明では、記載の簡略化のために「データ項目」を単に「商品」と記載する。このため、本実施形態で「商品」と記載した箇所は、「データ項目」と読み替えることができる。

　本実施形態では、ユーザは、ユーザ端末２０を操作してサーバ１０にアクセスし、インターネット上の仮想的な店舗が取り扱う商品を閲覧したり購入したりする。ユーザの閲覧履歴及び購入履歴は、行動履歴として記録される。情報処理システム１は、各商品に対するユーザの行動履歴を解析し、ユーザごとに、商品のクラスタリングを実行する。

　クラスタリングは、観測データをグループ分け（分類）するための処理である。本実施形態では、個々の商品が観測データに相当する。クラスタは、個々のグループであり、分類の単位である。クラスタは、商品の分類という意味では、カテゴリと概念的に少し似ている。ただし、カテゴリが全ユーザで共通の情報である一方で、クラスタは、ユーザごとに異なり、ユーザ特有の好みが反映されている。

　本実施形態の情報処理システム１は、クラスタごとに、当該クラスタに属する商品の商品特徴情報に基づいて、ユーザの嗜好に関するユーザ特徴情報を計算する。そして、情報処理システム１は、各クラスタのユーザ特徴情報に基づいて、商品のクーポン情報を提示することによって、ユーザ特有の嗜好をクラスタごとに分析し、ユーザに提示するクーポン情報の精度を高めるようにしている。以降、当該構成の詳細を説明する。

［３．本実施形態において実現される機能］
　図２は、情報処理システム１で実現される機能の一例を示す機能ブロック図である。図２に示すように、本実施形態では、データ記憶部１００、第１取得部１０１、第２取得部１０２、クラスタリング部１０３、及び提示部１０４がサーバ１０で実現される。データ記憶部１００は、記憶部１２を主として実現され、第１取得部１０１、第２取得部１０２、クラスタリング部１０３、及び提示部１０４の各々は、制御部１１を主として実現される。

［３－１．データ記憶部］
　データ記憶部１００は、本実施形態に係る処理を実行するために必要なデータを記憶する。ここでは、データ記憶部１００が記憶するデータの一例として、商品データベースＤＢ１、ユーザデータベースＤＢ２、及びクーポンデータベースＤＢ３を説明する。

　図３は、商品データベースＤＢ１の一例を示す図である。図３に示すように、商品データベースＤＢ１は、商品に関する種々の情報が格納されるデータベースである。例えば、商品データベースＤＢ１には、店舗ＩＤ、商品ＩＤ、商品の基本情報、及び商品特徴情報が格納される。店舗ＩＤは、インターネット上の店舗を一意に識別する情報である。商品ＩＤは、当該店舗が取り扱う商品を一意に識別する情報である。

　商品の基本情報は、商品の内容に関する基本的な情報であり、例えば、商品名（商品タイトル）、カテゴリ（ジャンル）、属性、単価、在庫数、キーワード、及び商品説明を含む。属性は、商品の性質であり、例えば、商品の色、サイズ、素材、状態、産地、又はメーカといった情報である。キーワードは、商品の検索用の単語であり、例えば、商品名又は商品説明の中から抽出された単語であってもよいし、店舗の担当者がキーワードとして入力した単語であってもよい。商品説明は、商品の詳細な説明であり、例えば、テキスト、表、及び画像の少なくとも１つによって示される。

　例えば、商品の基本情報は、店舗の担当者により入力される。なお、商品の基本情報は、他の情報が含まれていてもよく、例えば、商品ページのＵＲＬ、商品ページのＨＴＭＬデータ、フレーム、又は画像データなどの種々の情報が含まれていてもよい。なお、商品ページは、商品を購入するための画面であればよく、例えば、商品名、商品画像、商品説明、及び単価といった商品の基本情報と、商品を買い物かごに入れるためのボタンと、を含む。商品ページは、ユーザ端末２０のウェブブラウザ内で表示されてもよいし、ユーザ端末２０にインストールされたアプリケーション内で表示されてもよい。

　商品特徴情報は、商品の特徴に関する情報であり、例えば、複数の項目の各々の特徴量を含む。項目は、商品の特徴を評価するための任意の項目であればよく、例えば、商品の基本情報に関する項目であってもよいし、商品を閲覧したり購入したりしたユーザの基本情報に関する項目であってもよい。例えば、特徴量は、各項目の商品の特徴を数値化した情報である。なお、特徴量は、数値ではなく、文字によって示されてもよいし、数値と文字の組み合わせで示されてもよい。

　例えば、商品特徴情報は、商品名・キーワード・商品説明に含まれる単語が項目となってもよいし、カテゴリ、属性、又は価格帯が項目となってもよい。単語が商品特徴情報の項目となる場合には、当該項目の特徴量は、単語の特徴ベクトルであってもよい。単語の特徴ベクトルの取得方法自体は、公知の種々の手法を適用可能であり、例えば、Word2vecなどのニューラルネットワークを利用してもよい。また例えば、商品特徴情報は、商品を閲覧又は購入したユーザの年齢、性別、又は地域が項目になってもよい。

　本実施形態では、商品特徴情報がｎ（ｎは自然数）次元のベクトルで示される場合を例に挙げて説明する。即ち、商品特徴情報は、ｎ個の項目の特徴量を含んでおり、各項目の特徴量は、ベクトルの各要素の値として示される。なお、商品特徴情報は、ベクトル以外の形式であってもよく、任意の形式で表現可能である。例えば、商品特徴情報は、配列形式、画像形式、テキスト形式、又は表形式といった任意の形式の情報であってもよい。

　また、本実施形態では、各商品の商品特徴情報は、予め設定された当該商品の分類情報を含む場合を説明する。例えば、商品特徴情報が示すｎ次元のベクトルのうち、ｋ（ｋは１以上ｎ以下の整数）個目の要素は、商品の分類情報を示す値となる。分類情報は、複数の分類情報の中から予め設定された少なくとも１つであり、例えば、カテゴリ（ジャンル）、属性、又は価格帯などの情報である。価格帯は、複数の価格帯の中から単価が属する価格帯である。

　本実施形態では、分類情報の一例として、商品の基本情報に格納されたカテゴリ（即ち、店舗の担当者が入力したカテゴリ）を説明する。このため、本実施形態でカテゴリと記載した箇所については、分類情報と読み替えることができる。商品特徴情報のうち、ｋ個目の要素は、カテゴリを示す特徴量となる。どの数値がどのカテゴリを示すかは、予めデータ記憶部１００に定めておけばよい。

　なお、本実施形態では、店舗の担当者により入力された情報と、サーバ１０により生成された情報と、の両方が商品特徴情報に含まれる場合を説明するが、商品特徴情報は、店舗の担当者により入力された情報だけを含んでもよいし、サーバ１０により生成された情報だけを含んでもよい。また、商品特徴情報に含まれる項目は、上記の例に限られず、任意の項目を適用可能である。例えば、商品が閲覧又は購入された日時に関する項目であってもよいし、商品が閲覧又は購入された場合に使用された検索式に関する項目であってもよい。検索式とは、検索条件であり、例えば、キーワード、カテゴリ、属性、価格帯、及び在庫の有無のうちの少なくとも１つである。

　図４は、ユーザデータベースＤＢ２の一例を示す図である。図４に示すように、ユーザデータベースＤＢ２は、ユーザに関する種々の情報が格納されるデータベースである。例えば、ユーザデータベースＤＢ２には、ユーザＩＤ、ユーザの基本情報、行動履歴情報、及び、クラスタ情報が格納される。ユーザＩＤは、ユーザを一意に識別する情報である。

　ユーザの基本情報は、ユーザの登録情報であり、例えば、ユーザ名、年齢、性別、及び地域などの情報が格納される。なお、ユーザの基本情報は、他の情報が含まれていてもよく、例えば、ユーザのお気に入りのカテゴリなどの情報が含まれていてもよい。

　行動履歴情報は、各商品に対するユーザの行動履歴に関する情報であり、例えば、行動対象の商品の識別情報（ここでは、店舗ＩＤと商品ＩＤの組み合わせ）、行動種類情報、及び行動時間情報といった情報が時系列的に格納される。

　行動対象とは、ユーザによる行動の対象になることであり、例えば、閲覧、購入、又はダウンロードなどの対象になることである。行動種類情報は、行動の種類に関する情報であり、例えば、閲覧・購入・ダウンロードといった複数の種類のうち、ユーザが取った行動の種類を示す情報である。行動時間情報は、ユーザが行動した日時を示す情報であり、例えば、閲覧日時、購入日時、又はダウンロード日時といった情報である。

　サーバ１０は、ユーザ端末２０との通信内容に基づいて、行動履歴情報を更新する。例えば、サーバ１０は、ユーザから商品ページの閲覧要求を受け付けると、当該商品ページの表示データをユーザ端末２０に送信する。そして、サーバ１０は、当該ユーザのユーザＩＤが格納されたレコードの行動履歴情報に、当該商品ページが示す商品の店舗ＩＤ及び商品ＩＤを格納し、行動種類情報に「閲覧」を設定し、行動時間情報に現在日時を設定する。

　また例えば、サーバ１０は、ユーザから商品の購入要求を受け付けると、当該商品の購入処理を実行する。購入処理自体は、公知の種々の処理を適用可能であり、例えば、クレジットカードによる決済処理が実行される。そして、サーバ１０は、当該ユーザのユーザＩＤが格納されたレコードの行動履歴情報に、当該商品ページが示す商品の店舗ＩＤ及び商品ＩＤを格納し、行動種類情報に「購入」を設定し、行動時間情報に現在日時を設定する。

　クラスタ情報は、クラスタリング部１０３が特定したクラスタに関する情報であり、例えば、クラスタ番号、ユーザ特徴情報、重み係数、行動種類情報、及び行動時間情報を含む。クラスタ番号は、クラスタを一意に識別する情報である。クラスタは、ユーザごとに取得されるので、クラスタ番号は、あるユーザに対して取得された複数のクラスタの中で、クラスタを一意に識別する情報といえる。

　ユーザ特徴情報は、クラスタ内の商品の特徴を総合的に示す情報である。ユーザ特徴情報は、クラスタごとに生成され、例えば、クラスタに属する行動対象の商品の商品特徴情報を所定の数式に代入することで得られた値となる。この数式は、任意の数式であってよく、例えば、単純平均又は加重平均を求める式である。本実施形態では、商品特徴情報がベクトルで示されるので、ユーザ特徴情報もベクトルで示される場合を一例として説明する。

　重み係数は、クラスタの重要度（蓋然性）であり、例えば、重み係数が高いほどクラスタが重要であり、重み係数が低いほどクラスタが重要ではないことを示す。

　行動種類情報は、クラスタに属する商品に対する行動の種類に関する情報である。ここでは、行動種類情報は、「購入済み」又は「閲覧のみ」の何れかの値を取るものとする。クラスタに属する行動対象の商品が１つでも購入されていれば、当該クラスタの行動種類情報は「購入済み」となり、そうでなければ、当該クラスタの行動種類情報は「閲覧のみ」となる。なお、行動の種類は、購入と閲覧に限られず、例えば、商品を買い物かごに入れるといった行動であってもよい。

　行動時間情報は、クラスタに属する商品に対する行動時間に関する情報である。ここでは、行動時間情報は、「購入済み」の商品に対する行動時間が格納される。

　なお、行動履歴情報に含まれる項目は、上記の例に限られず、任意の項目を適用可能である。例えば、行動履歴情報は、商品が閲覧又は購入された際に使用された検索式を含んでいてもよい。また、ユーザデータベースＤＢ２には、ユーザが獲得したクーポン情報などの情報を含んでいてもよい。

　図５は、クーポンデータベースＤＢ３の一例を示す図である。図５に示すように、クーポンデータベースＤＢ３は、クーポンに関する種々の情報が格納されるデータベースである。例えば、クーポンデータベースＤＢ３には、クーポンＩＤ、クーポンの対象となる店舗又は商品の識別情報（ここでは、店舗ＩＤと商品ＩＤの組み合わせ）、クーポン内容、及び商品特徴情報が格納される。クーポンＩＤは、クーポンを一意に識別する情報である。

　クーポン内容は、クーポン使用時の効果であり、例えば、値引き額、値引きパーセント（割合）、おまけの商品といった情報が格納される。商品特徴情報は、クーポンの対象となる商品の商品特徴情報である。クーポン対象が店舗となる場合には、当該店舗が取り扱う特定の商品の商品特徴情報であってもよいし、当該店舗の複数の商品の各々の商品特徴情報から算出されるようにしてもよい。なお、クーポンデータベースＤＢ３には、クーポンの有効期間などの情報が格納されていてもよい。

　例えば、クーポンデータベースＤＢ３は、各店舗の担当者によって更新される。例えば、クーポンを発行する店舗の担当者は、サーバ１０に対し、自身の店舗の店舗ＩＤ、クーポンの対象となる商品の商品ＩＤ、及びクーポンの内容の登録要求を送信する。サーバ１０は、店舗の担当者からの登録要求を受信すると、クーポンＩＤを発行し、店舗ＩＤ、商品ＩＤ、及びクーポンの内容と関連付けてクーポンデータベースＤＢ３に格納する。そして、サーバ１０は、商品データベースＤＢ１を参照し、当該店舗ＩＤ及び当該商品ＩＤに関連付けられた商品特徴情報を取得し、上記発行したクーポンＩＤと関連付けてクーポンデータベースＤＢ３に格納する。

　なお、データ記憶部１００に記憶されるデータは、上記の例に限られない。データ記憶部１００は、実施形態に係る処理のために必要なデータを記憶すればよい。例えば、データ記憶部１００は、行動履歴情報と商品特徴情報との関係（詳細後述）を記憶してもよい。

［３－２．第１取得部］
　第１取得部１０１は、複数の商品の各々の特徴に関する商品特徴情報を取得する。本実施形態では、商品データベースＤＢ１に商品特徴情報が格納されているので、第１取得部１０１は、データ記憶部１００に記憶された各商品の商品特徴情報を取得する。なお、サーバ１０以外のコンピュータ（例えば、外部のデータベースサーバ）に商品特徴情報が記憶されている場合には、第１取得部１０１は、当該コンピュータから各商品の商品特徴情報を取得すればよい。

　例えば、第１取得部１０１は、複数のユーザの各々の行動履歴情報に基づいて、各商品の商品特徴情報を取得してもよい。この場合、第１取得部１０１は、情報処理システム１の全ユーザの行動履歴情報に基づいて、各商品の商品特徴情報を取得してもよいし、情報処理システム１の一部のユーザの行動履歴情報に基づいて、各商品の商品特徴情報を取得してもよい。また例えば、第１取得部は、各ユーザの行動履歴情報に基づいて、商品特徴情報の全項目の特徴量を取得してもよいし、商品特徴情報の一部の項目の特徴量を取得してもよい。

　各ユーザの行動履歴情報と、各商品の商品特徴情報と、の関係は、予めデータ記憶部１００に記憶されているものとする。この関係は、数式形式又はテーブル形式で定義されていてもよいし、プログラムコードの一部として定義されていてもよい。第１取得部１０１は、各ユーザの行動履歴情報に関連付けられた各商品の商品特徴情報を取得する。即ち、第１取得部１０１は、各ユーザの行動履歴情報を上記関係の入力とし、上記関係の出力として各商品の商品特徴情報を取得する。

　例えば、第１取得部１０１は、ある検索式で得られた検索結果から閲覧又は購入された商品同士の商品特徴情報が似るように、各商品の商品特徴情報を取得する。また例えば、第１取得部１０１は、商品が閲覧又は購入された場合に使用されたキーワードを参照し、当該キーワードに含まれる単語に基づいて、当該商品の商品特徴情報を取得してもよい。この場合、第１取得部１０１は、キーワードに含まれる単語の特徴ベクトルを、商品特徴情報の一部の項目の特徴量としてもよい。

　また例えば、商品特徴情報が、ユーザに関する情報を含む場合には、第１取得部１０１は、各ユーザの基本情報に基づいて、各商品の商品特徴情報を取得してもよい。例えば、商品特徴情報の項目として、商品を閲覧又は購入するユーザの年齢、性別、及び地域の少なくとも１つを含む場合には、第１取得部１０１は、ユーザデータベースＤＢ２を参照し、各商品の商品特徴情報の当該項目の特徴量を、当該商品を行動対象にしたユーザの年齢、性別、及び地域に基づいて取得してもよい。

　なお、各商品の商品特徴情報は、行動履歴情報に基づいて取得されるのではなく、店舗の担当者によって入力された情報をそのまま商品特徴情報としてもよいし、店舗の担当者によって入力された情報をもとに生成された情報を商品特徴情報としてもよい。

［３－３．第２取得部］
　第２取得部１０２は、各商品に対するユーザの行動履歴に関する行動履歴情報を取得する。本実施形態では、ユーザデータベースＤＢ２に行動履歴情報が格納されているので、第２取得部１０２は、データ記憶部１００に記憶された行動履歴情報を取得する。例えば、第２取得部１０２は、ユーザデータベースＤＢ２に格納された各ユーザの行動履歴情報を取得する。なお、サーバ１０以外のコンピュータ（例えば、外部のデータベースサーバ）に行動履歴情報が記憶されている場合には、第２取得部１０２は、当該コンピュータから各ユーザの行動履歴情報を取得すればよい。

［３－４．クラスタリング部］
　クラスタリング部１０３は、行動履歴情報が示す各商品の商品特徴情報に基づいて、各商品のクラスタリングを行う。本実施形態では、クラスタリングは、商品特徴情報が似た商品をグループ化するための処理となる。クラスタリングは、データ・クラスタリング、教師なし学習、又はデータマイニングと呼ばれることもある。

　クラスタリング部１０３は、ユーザごとに、当該ユーザの行動履歴情報に基づいて、クラスタリングを行う。別の言い方をすれば、クラスタリング部１０３は、各ユーザの行動履歴情報に基づいて、当該ユーザのためのクラスタリングを行う。例えば、クラスタリング部１０３は、各ユーザの行動履歴情報に基づいて、当該ユーザによる行動対象の商品を特定し、特定した各商品の商品特徴情報に基づいて、当該ユーザのためのクラスタリングを実行する。このため、クラスタリング部１０３は、あるユーザのクラスタリングを実行する場合、当該ユーザの行動履歴情報は参照するが、他のユーザの行動履歴情報は参照しない。

　なお、クラスタリングのアルゴリズム自体は、公知の種々の手法を適用可能であり、例えば、最短距離法・最長距離法・群平均法・ウォード法などの階層型手法を利用したアルゴリズムであってもよいし、Ｋ平均法などの非階層的手法を利用したアルゴリズムであってもよい。例えば、DBSCAN (Density-based spatial clustering of applications with noise )が用いられてもよい。

　図６は、クラスタリング部１０３の処理内容を示す図である。図６に示すように、本実施形態では、商品特徴情報がｎ次元のベクトルで示されるので、クラスタリング部１０３は、行動対象の商品の商品特徴情報が示すｎ次元のベクトルをｎ次元空間ＳＰにマッピングし、階層的手法又は非階層的手法のアルゴリズムに基づいて、各商品のクラスタリングを実行する。

　図６の例では、クラスタリング部１０３は、４０個の商品の商品特徴情報が示すベクトルＶ１～Ｖ４０をｎ次元空間ＳＰにマッピングし、３つのクラスタＣＬ１～ＣＬ３を設定している。クラスタＣＬ１には、ベクトルＶ１～Ｖ１３に対応する商品が属する。クラスタＣＬ２には、ベクトルＶ１４～Ｖ２６に対応する商品が属する。クラスタＣＬ３には、ベクトルＶ２７～Ｖ３９に対応する商品が属する。

　例えば、クラスタリング部１０３は、所定のルールに基づいて、各クラスタＣＬ１～ＣＬ３のクラスタ番号を発行し、行動対象の各商品の商品特徴情報に基づいて、当該商品にクラスタ番号を関連付けることによって、クラスタ情報を更新する。なお、クラスタリング部１０３は、何れのクラスタＣＬ１～ＣＬ３からも距離が遠い商品（図６の例では、ベクトルＶ４０に対応する商品）については、ノイズとして除去してもよい。なお、以降の説明では、特に図６を参照する必要のないときは、クラスタとベクトルの符号を省略する。

　例えば、クラスタリング部１０３は、クラスタごとに、当該クラスタに属する各商品の商品特徴情報に基づいて、ユーザ特徴情報を取得してもよい。クラスタリング部１０３は、クラスタごとに、当該クラスタに属する各商品の商品特徴情報を所定の数式に代入することによって、ユーザ特徴情報を取得する。先述したように、この数式は、任意の内容であってよく、例えば、単純平均又は加重平均を求める式であってもよい。

　本実施形態では、商品特徴情報がベクトルで示されるので、例えば、クラスタリング部１０３は、各クラスタに属する各商品の商品特徴情報が示すベクトルの平均値を、当該クラスタのユーザ特徴情報として取得してもよい。当該平均値は、別の言い方をすれば、クラスタに属する各商品の商品特徴情報が示すベクトルのジョイントベクトルである。

　図６の例では、クラスタリング部１０３は、ベクトルＶ１～Ｖ１３の平均値であるジョイントベクトルを、クラスタＣＬ１のユーザ特徴情報として取得し、クラスタ情報に格納する。クラスタリング部１０３は、ベクトルＶ１４～Ｖ２６の平均値であるジョイントベクトルを、クラスタＣＬ２のユーザ特徴情報として取得し、クラスタ情報に格納する。クラスタリング部１０３は、ベクトルＶ２７～Ｖ３９の平均値であるジョイントベクトルを、クラスタＣＬ３のユーザ特徴情報として取得し、クラスタ情報に格納する。

　本実施形態では、クラスタ情報に、ユーザ特徴情報だけではなく、重み係数も含まれるので、クラスタリング部１０３は、各ユーザの行動履歴情報に基づいて、当該ユーザのクラスタ情報に格納される重み係数を決定してもよい。

　また例えば、クラスタリング部１０３は、クラスタに含まれる商品の数が多いほど、当該クラスタ内の商品にユーザが強く関心を持っている可能性があるので、重み係数を大きくし、クラスタに含まれる商品の数が少ないほど、当該クラスタ内の商品にユーザがさほど関心を持っていない可能性があるので、重み係数を小さくしてもよい。

　また例えば、クラスタリング部１０３は、クラスタのクラスタサイズが大きいほど、当該クラスタに多数の商品が含まれておりユーザが強く関心を持っている可能性があるので、重み係数を大きくし、クラスタのクラスタサイズが小さいほど、当該クラスタに商品があまり含まれておらずユーザがさほど関心を持っていない可能性があるので、重み係数を小さくしてもよい。

　また、本実施形態では、クラスタ情報に、ユーザ特徴情報だけではなく、行動種類情報も含まれるので、クラスタリング部１０３は、各ユーザの行動履歴情報に基づいて、当該ユーザのクラスタ情報に格納される行動種類情報を決定してもよい。

　例えば、クラスタリング部１０３は、クラスタに含まれる商品の行動種類情報に基づいて、当該クラスタの行動種類情報を決定してもよい。例えば、クラスタリング部１０３は、クラスタに含まれる商品の行動種類情報が閲覧のみであれば、当該クラスタの行動種類情報を閲覧のみとし、購入済みの商品を所定個数（例えば、１つ又は２つ以上の任意の数）含むのであれば、当該クラスタの行動種類情報を購入済みとしてもよい。

　例えば、クラスタリング部１０３は、クラスタに含まれる商品の行動種類情報を参照し、閲覧の商品のみを含むクラスタであれば、まだ商品が購入されておらずユーザの関心が高い可能性があるので、重み係数を大きくし、購入済みの商品を含むクラスタであれば、既に商品が購入されておりユーザの関心が低い可能性があるので、重み係数を小さくしてもよい。

　また例えば、クラスタリング部１０３は、購入済みの商品を含むクラスタであったとしても、当該クラスタ内の商品が購入された後に、同じクラスタ内の商品が再度閲覧された場合には、ユーザが再び関心を示した可能性があるので、重み係数を大きくしてもよい。

　また、本実施形態では、クラスタ情報に、ユーザ特徴情報だけではなく、行動時間情報も含まれるので、クラスタリング部１０３は、各ユーザの行動履歴情報に基づいて、当該ユーザのクラスタ情報に格納される行動時間情報を決定してもよい。

　例えば、クラスタリング部１０３は、クラスタに含まれる商品の行動時間情報に基づいて、当該クラスタの行動時間情報を決定してもよい。例えば、クラスタリング部１０３は、クラスタに含まれる商品の行動時間情報の平均値を当該クラスタの行動時間情報としてもよいし、クラスタに含まれる商品のうち、購入済みの商品の行動時間情報を当該クラスタの行動時間情報としてもよい。

　また例えば、クラスタリング部１０３は、クラスタに含まれる商品の行動時間情報を参照し、ユーザが閲覧した日時からの経過時間が短いほど、ユーザの関心がまだ薄れていない可能性があるので、重み係数を大きくし、ユーザが閲覧した日時からの経過時間が長いほど、ユーザの関心が薄れてしまった可能性があるので、重み係数を小さくしてもよい。

　また例えば、クラスタリング部１０３は、クラスタに含まれる商品の行動時間情報を参照し、ユーザが購入した日時からの経過時間が長いほど、ユーザが再び商品を購入する可能性があるので、重み係数を大きくし、ユーザが購入した日時からの経過時間が短いほど、ユーザがまだ商品を購入しない可能性があるので、重み係数を小さくしてもよい。

　また例えば、クラスタリング部１０３は、行動履歴情報に基づいて、クラスタサイズを変化させてもよい。クラスタサイズは、クラスタの大きさ（範囲の広さ）であり、粒度とも呼ばれる。例えば、クラスタリング部１０３は、クラスタに属する商品の数が多いほどクラスタサイズを小さくし、クラスタに属する商品の数が少ないほどクラスタサイズを大きくしてもよい。また例えば、クラスタリング部１０３は、行動対象の各商品の商品特徴情報のマッピング結果を参照し、商品の密度が高いほどクラスタサイズを小さくし、商品の密度が低いほどクラスタサイズを大きくしてもよい。

［３－５．提示部］
　提示部１０４は、クラスタリング部１０３の処理結果に基づいて、複数の商品のうちの少なくとも１つに関する商品情報を、ユーザに提示する。提示部１０４は、クラスタリング部１０３の処理結果に基づいて、複数の商品の中から少なくとも１つを選出し、当該少なくとも１つの商品に関する商品情報を、ユーザに提示する。

　商品情報は、商品に関する情報であればよく、例えば、複数の商品の少なくとも１つに関するクーポン情報又はリコメンド情報であってもよいし、商品ページそのものであってもよいし、商品ページとは異なる内容の説明文又は商品画像であってもよい。

　クーポン情報は、所定の特典をユーザに与えるための情報であればよく、例えば、商品を割引価格で購入するための情報であってもよいし、商品以外のおまけを獲得するための情報であってもよい。リコメンド情報は、商品をユーザに提案するための情報であればよく、例えば、商品ページへのリンクであってもよいし、当該リンクが埋め込まれた画像であってもよい。本実施形態では、商品情報の一例としてクーポン情報を説明する。このため、本実施形態でクーポン情報と記載した箇所は、商品情報と読み替えることができる。

　提示とは、視覚的な提示であり、商品情報を表示させるための処理である。提示部１０４による提示方法は、任意の方法を適用可能であり、例えば、ページ内における画像の表示、電子メールの送信、メッセージアプリを利用したメッセージの送信、又はプッシュ通知であってもよい。本実施形態では、提示部１０４が、仮想市場のトップページ、店舗のトップページ、又は商品ページなどの任意のページにおいて、クーポン情報を表示させる場合を一例として説明する。

　例えば、提示部１０４は、各クラスタのユーザ特徴情報と、各商品の商品特徴情報と、に基づいて、クーポン情報を提示する。本実施形態では、各クラスタのユーザ特徴情報は、当該クラスタに属する商品の特徴を平均化した情報なので、提示部１０４は、クーポンデータベースＤＢ３に登録された複数の商品の中から、各クラスタのユーザ特徴情報と似た商品特徴情報を有する商品を特定し、当該特定した商品のクーポン情報を提示することになる。

　また、本実施形態では、各クラスタのユーザ特徴情報と、各商品の商品特徴情報と、はそれぞれベクトルで示されているので、提示部１０４は、各クラスタのユーザ特徴情報が示すベクトルと、各商品の商品特徴情報が示すベクトルと、の比較結果に基づいて、クーポン情報を提示する。例えば、提示部１０４は、各クラスタのユーザ特徴情報が示すベクトルと、各商品の商品特徴情報が示すベクトルと、の距離に基づいて、クーポン情報を提示する。

　例えば、提示部１０４は、距離が短い順に所定の個数だけ商品を特定し、当該商品のクーポン情報を提示する。この個数は、クラスタに関係なく固定値であってもよいが、本実施形態では、各クラスタの重み付け係数によって変化するものとする。例えば、重み付け係数が大きいほど個数が多くなり、重み付け係数が小さいほど個数が少なくなる。重み付け係数と個数との関係は、予めデータ記憶部１００に記憶させておけばよい。この関係は、数式形式又はテーブル形式で定義されていてもよいし、プログラムコードの一部として定義されていてもよい。例えば、提示部１０４は、クラスタごとに、当該クラスタの重み付け係数によって定まる個数だけ、上記距離が短い順番にクーポン情報を取得して提示する。

　例えば、図４のようなデータ格納例の場合、「ユーザＸ」のクラスタ情報は、クラスタ番号が「１」のクラスタの重み係数は「２」であり、クラスタ番号が「２」のクラスタの重み係数は「５」であり、クラスタ番号が「３」のクラスタの重み係数は「３」である。このため、ユーザに提示するクーポン情報の総数を１０個とすると、提示部１０４は、クラスタ番号が「１」のユーザ特徴情報と距離が近い順に２つのクーポン情報を取得し、クラスタ番号が「２」のユーザ特徴情報と距離が近い順に５つのクーポン情報を取得し、クラスタ番号が「３」のユーザ特徴情報と距離が近い順に３つのクーポン情報を取得する。提示部１０４は、これら取得した１０個のクーポイン情報を商品ページなどに含ませることによって提示する。

　例えば、全商品の商品特徴情報が各クラスタのユーザ特徴情報との比較対象になってもよいが、提示部１０４は、複数の商品のうち、各クラスタ内の商品の商品特徴情報を、当該クラスタのユーザ特徴情報との比較対象としてもよい。例えば、提示部１０４は、クラスタごとに、各商品の商品特徴情報に基づいて、当該クラスタに属する商品を特定する。提示部１０４は、特定した当該商品を比較対象とする。別の言い方をすれば、提示部１０４は、クーポンデータベースＤＢ３に登録された複数の商品のうち、クラスタ内の商品は比較対象とし、クラスタ外の商品は比較対象から除外する。

　本実施形態では、行動履歴情報は、各商品に対するユーザの行動の種類に関する行動種類情報を含むので、提示部１０４は、行動種類情報に更に基づいて、クーポン情報を提示してもよい。例えば、提示部１０４は、行動種類情報が所定の種類を示す商品については、クーポン情報を提示しないようにしてもよい。所定の種類は、ユーザが商品に対する興味がなくなる蓋然性の高い行動であり、例えば、購入である。

　提示部１０４は、行動種類情報が購入を示す商品を含むクラスタについては、クーポン情報の提示対象から除外してもよい。なお、提示部１０４は、行動種類情報が購入を示す商品を含むクラスタであったとしても、購入後にユーザが閲覧した場合には、当該クラスタを再びクーポン情報の提示対象としてもよい。また、各クラスタの重み係数を行動種類情報に基づいて決定する場合には、提示部１０４は、重み係数に基づいてクーポン情報の提示対象となる商品を決定することによって、行動種類情報に基づいてクーポン情報を提示していることになる。

　本実施形態では、行動履歴情報は、各商品に対するユーザの行動時間に関する行動時間情報を含むので、提示部１０４は、行動時間情報に更に基づいて、クーポン情報を提示する。例えば、提示部１０４は、行動時間情報が示す行動時間からの経過時間が閾値未満であれば、クーポン情報を提示しないようにして、経過時間が閾値以上であれば、クーポン情報を提示するようにしてもよい。また、各クラスタの重み係数を行動時間情報に基づいて決定する場合には、提示部１０４は、重み係数に基づいてクーポン情報の提示対象となる商品を決定することによって、行動時間情報に基づいてクーポン情報を提示していることになる。

［４．本実施形態において実行される処理］
　次に、情報処理システム１で実行される処理の流れを説明する。ここでは、クーポン提示の事前準備をするための事前準備処理と、ユーザにクーポンを提示するためのクーポン提示処理と、を説明する。事前準備処理及びクーポン提示処理は、図２に示す機能ブロックにより実行される処理の一例である。

［４－１．事前準備処理］
　図７は、事前準備処理を示すフロー図である。事前準備処理は、制御部１１が、記憶部１２に記憶されたプログラムに従って動作することによって実行される。事前準備処理は、所定のタイミングで実行されるようにすればよく、例えば、システム管理者の指示に応じて実行されてもよいし、予め定められた日時に実行されてもよい。

　図７に示すように、まず、制御部１１は、ユーザデータベースＤＢ２に格納された複数のユーザの各々の行動履歴情報に基づいて、各商品の商品特徴情報を生成する（Ｓ１）。Ｓ１においては、制御部１１は、全ユーザ又は一部のユーザの行動履歴情報を参照し、各ユーザの行動対象となった商品に基づいて、当該商品の商品特徴情報を生成する。行動履歴情報から商品特徴情報を生成する処理は先述した通りである。

　制御部１１は、ユーザごとに、各クラスタのユーザ特徴情報を生成する（Ｓ２）。図８は、Ｓ２の処理の詳細を示す図である。図８に示すように、制御部１１は、ユーザデータベースＤＢ２に基づいて、処理対象のユーザを決定する（Ｓ２１）。Ｓ２１においては、制御部１１は、ユーザＩＤが最も若いユーザを処理対象のユーザとして決定してもよいし、ユーザデータベースＤＢ２の最初のレコードに対応するユーザを処理対象のユーザとして決定してもよい。

　制御部１１は、ユーザデータベースＤＢ２を参照し、Ｓ２１で決定した処理対象のユーザの行動履歴情報を取得する（Ｓ２２）。Ｓ２２においては、制御部１１は、ユーザデータベースＤＢ２のうち、処理対象のユーザのユーザＩＤが格納されたレコードの行動履歴情報を取得する。なお、制御部１１は、処理対象のユーザの全ての行動履歴情報を参照してもよいし、直近の所定日数（例えば、３０日～１２０日程度）の行動履歴情報だけを参照するといった一部のみを参照してもよい。

　制御部１１は、Ｓ２２で取得した行動履歴情報に基づいて、処理対象のユーザの行動対象となった各商品の商品特徴情報を、ｎ次元空間にマッピングする（Ｓ２３）。Ｓ２３においては、制御部１１は、商品データベースＤＢ１を参照し、行動履歴情報に店舗ＩＤ及び商品ＩＤが格納された商品の商品特徴情報を取得し、クラスタリングの観測データとして設定することになる。

　制御部１１は、Ｓ２３におけるマッピング結果に基づいて、各商品のクラスタリングを実行する（Ｓ２４）。Ｓ２４においては、制御部１１は、先述したクラスタリングのアルゴリズムに基づいて、ｎ次元空間にマッピングされた商品特徴情報のクラスタリングを実行する。制御部１１は、各クラスタのクラスタ番号を発行し、処理対象のユーザのクラスタ情報にクラスタ番号を格納する。そして、制御部１１は、ｎ次元空間に商品特徴情報がマッピングされた各商品に対し、何れかのクラスタ番号を関連付ける。

　制御部１１は、処理対象のユーザのクラスタ情報に基づいて、処理対象のクラスタを決定する（Ｓ２５）。Ｓ２５においては、制御部１１は、クラスタ番号が最も若いクラスタを処理対象のクラスタとして決定してもよいし、クラスタ情報における最初のレコードに対応するクラスタを処理対象のクラスタとして決定してもよい。

　制御部１１は、処理対象のクラスタに属する各商品の商品特徴情報に基づいて、処理対象のクラスタのユーザ特徴情報を取得する（Ｓ２６）。Ｓ２６においては、制御部１１は、処理対象のクラスタに属する各商品の商品特徴情報の平均値を、処理対象のクラスタのユーザ特徴情報として取得する。

　制御部１１は、全てのクラスタについてユーザ特徴情報を取得したか否かを判定する（Ｓ２７）。Ｓ２７においては、制御部１１は、Ｓ２４のクラスタリングでクラスタ番号が生成された複数のクラスタの全てに対し、Ｓ２６の処理を実行したか否かを判定することになる。

　ユーザ特徴情報を取得していないクラスタがあると判定された場合（Ｓ２７；Ｎ）、Ｓ２６の処理に戻り、次のクラスタのユーザ特徴情報が取得される。以降、制御部１１は、処理対象のユーザに対して取得された全てのクラスタのユーザ特徴情報を取得するまで、Ｓ２６の処理を繰り返す。

　一方、全てのクラスタについてユーザ特徴情報を取得したと判定された場合（Ｓ２７；Ｙ）、制御部１１は、全てのユーザに対し、クラスタリングを実行したか否かを判定する（Ｓ２８）。

　クラスタリングを実行していないユーザがいると判定された場合（Ｓ２８；Ｎ）、Ｓ２１の処理に戻り、次の処理対象のユーザに対し、クラスタリングが実行される。以降、制御部１１は、次の処理対象のユーザに対して取得された全てのクラスタのユーザ特徴情報を取得する。一方、全てのユーザについてクラスタリングを実行したと判定された場合（Ｓ２８；Ｙ）、Ｓ２の処理は終了してＳ３の処理に移行する。

　制御部１１は、商品データベースＤＢ１とクーポンデータベースＤＢ３とに基づいて、クーポンと商品特徴情報とを関連付けて（Ｓ３）、本処理は終了する。Ｓ３においては、制御部１１は、クーポンデータベースＤＢ３を参照し、現時点で登録されているクーポンを特定する。制御部１１は、特定したクーポンの店舗ＩＤと商品ＩＤを参照し、商品データベースＤＢ１に格納された商品特徴情報を取得し、クーポンデータベースＤＢ３に格納する。

［４－２．クーポン提示処理］
　図９は、クーポン提示処理を示すフロー図である。クーポン提示処理は、制御部１１が、記憶部１２に記憶されたプログラムに従って動作し、制御部２１が、記憶部２２に記憶されたプログラムに従って動作することによって実行される。

　図９に示すように、まず、ユーザ端末２０において、ユーザが操作部２４から所定の操作を行うと、制御部２１は、サーバ１０に対し、ユーザＩＤとともにアクセス要求を送信する（Ｓ３１）。アクセス要求は、所定形式の要求であればよく、例えば、仮想市場のトップページや商品ページなどの表示要求である。ウェブブラウザ内でページを表示させる場合には、アクセス要求はページのＵＲＬを含んでもよいし、アプリケーション内でページを表示させる場合には、アクセス要求はページを識別するＩＤを含んでもよい。なお、ユーザＩＤは、予め記憶部２２に記憶されていてもよいし、操作部２４から入力されてもよい。

　サーバ１０においては、ユーザＩＤとアクセス要求を受信すると、制御部１１は、ユーザデータベースＤＢ２を参照し、アクセス要求をしたユーザのクラスタ情報を取得する（Ｓ３２）。Ｓ３２においては、制御部１１は、アクセス要求とともに受信したユーザＩＤが格納されたレコードのクラスタ情報を取得する。

　制御部１１は、Ｓ３２で取得したクラスタ情報と、クーポンデータベースＤＢ３と、に基づいて、ユーザに提示すべきクーポン情報を決定する（Ｓ３３）。Ｓ３３においては、制御部１１は、重み係数、行動種類情報、及び行動時間情報に基づいて、各クラスタのクーポン情報の数を決定する。そして、制御部１１は、クラスタごとに、当該クラスタのユーザ特徴情報と商品特徴情報との距離が近い順に所定個数だけクーポンを取得する。

　制御部１１は、Ｓ３３で決定したクーポン情報を含むページの表示データを生成し、ユーザ端末２０に送信する（Ｓ３４）。Ｓ３４においては、制御部１１は、Ｓ３３で決定したクーポン情報を、仮想市場のトップページや商品ページなどに埋め込む。

　ユーザ端末２０においては、表示データを受信すると、制御部２１は、受信した表示データに基づいて、クーポン情報を含むページを表示部２５に表示させ（Ｓ３５）、本処理は終了する。

　図１０は、クーポン情報を含むページの画面例を示す図である。図１０に示す例では、仮想市場のトップページＰにクーポン情報ＣＰ１～ＣＰ２が埋め込まれた場合を示している。クーポン情報ＣＰ１～ＣＰ２は、それぞれ、クーポン対象の商品の画像、クーポンの適用期間、クーポンの内容、クーポン対象の店舗といった情報を含む。例えば、トップページＰからユーザが選択したクーポン情報を獲得することができる。

　以上説明した情報処理システム１によれば、ユーザの行動対象になった各商品のクラスタリング結果に基づいて、ユーザの嗜好をより細かく分析したうえでクーポン情報を提示するので、ユーザに提示するクーポン情報の精度を高めることができる。例えば、従来の技術では、分野に関係なくユーザの嗜好を示す情報を算出していたため、ある分野における嗜好と、他の分野における嗜好と、を平均化すると、互いの特徴が相殺されてしまい、全く関係のない商品を示す特徴量となってしまう可能性があったが、ユーザごとにクラスタを設定することで、ユーザの嗜好をより細かく分析し、クーポン情報の精度を高めることが可能となる。また例えば、ユーザの好みの商品が複数のカテゴリにまたがって存在することがあるが、クラスタリングによって、これら複数のカテゴリをまたぐようなクラスタを設定することができ、クラスタによって、ユーザの好みを漏れなく特定することができる。これとは逆に、ユーザが、あるカテゴリ内の商品全部を好むのではなく、このカテゴリ内の特定分野の商品のみを好む場合には、カテゴリは広すぎてユーザの嗜好をピンポイントで表すものとはならないが、クラスタは、このような場合であっても、ユーザの嗜好をピンポイントで表すことができる。このため、クラスタは、ユーザ固有の嗜好を表現したものとなるので、ユーザに提示するクーポン情報の精度を高めることができる。

　また、情報処理システム１は、クラスタごとに取得したユーザ特徴情報に基づいてクーポン情報を提示し、より簡易な処理によってクーポン情報の精度を高めることができるので、情報処理システム１の処理負荷を軽減することができる。

　また、ユーザ特徴情報と商品特徴情報とをそれぞれベクトルで示し、各クラスタのユーザ特徴情報が示すベクトルと、各商品の商品特徴情報が示すベクトルと、の比較結果に基づいてクーポン情報を提示し、より簡易な処理によってクーポン情報の精度を高めることができるので、情報処理システム１の処理負荷を効果的に軽減することができる。また、ユーザ特徴情報と商品特徴情報の各々を、ベクトルという簡易な形式を利用することで、情報処理システム１内のメモリ消費量を抑制することもできる。

　また、各クラスタのユーザ特徴情報を、当該クラスタ内の商品の商品特徴情報の平均値とすることで、ユーザ特徴情報の精度が向上するので、ユーザに提示するクーポン情報の精度を効果的に高めることができる。また、より簡易な処理によってユーザ特徴情報を取得することができるので、ユーザ特徴情報を取得するための情報処理システム１の処理負荷を軽減することができる。

　また、各クラスタのユーザ特徴情報との比較対象として、当該クラスタ内の商品の商品特徴情報とすることによって、比較対象となる商品が少なくなるので、情報処理システム１の処理負荷を軽減することができる。また、比較対象となる商品が少なくなることで、クーポン情報を提示する処理を高速化することもできる。

　また、各ユーザの行動履歴情報から各商品の商品特徴情報を取得することで、ユーザの行動を踏まえた商品特徴情報とすることができ、商品特徴情報の精度が向上するので、ユーザに提示するクーポン情報の精度を効果的に高めることができる。

　また、商品特徴情報に商品のカテゴリを含めておくことで、商品特徴情報の精度が向上するので、ユーザに提示するクーポン情報の精度を効果的に高めることができる。

　また、各ユーザの行動履歴情報に基づいてクラスタサイズを変化させることで、商品特徴情報が密集している部分については、より細かなクラスタを設定するといったことが可能となり、クラスタの精度が向上するので、ユーザに提示するクーポン情報の精度を効果的に高めることができる。

　また、ユーザの行動の種類に基づいてクーポン情報を提示することで、ユーザに提示するクーポン情報の精度を効果的に高めることができる。

　また、各商品に対するユーザの行動時間に基づいてクーポン情報を提示することで、ユーザに提示するクーポン情報の精度を効果的に高めることができる。

　また、ユーザに提示する情報として、各商品のクーポン情報を提示することによって、ユーザにとって有益な情報を提示することができる。

　また、データ項目として、商品に関するデータ項目とすることで、商品を購入するユーザに有益な情報を提示することができる。

［５．変形例］
　なお、本発明は、以上に説明した実施の形態に限定されるものではない。本発明の趣旨を逸脱しない範囲で、適宜変更可能である。

　例えば、クラスタごとにユーザ特徴情報が取得される場合を説明したが、特にユーザ特徴情報が取得されなくてもよい。この場合、提示部１０４は、各クラスタに含まれる商品のうちの任意の商品特徴情報に基づいて、クーポン情報を提示すべき商品を決定してもよい。また例えば、提示部１０４は、各クラスタに含まれる商品のうちの少なくとも１つの商品を、クーポン情報の提示対象としてもよい。

　また例えば、商品情報は、クーポン情報ではなく、リコメンド情報であってもよい。例えば、提示部１０４は、ユーザがサーバ１０にアクセスした場合に、トップページ又は商品ページ内にリコメンド対象の商品の画像を表示させてもよい。また例えば、提示部１０４は、リコメンド対象の商品のＵＲＬを含む電子メールを送信してもよいし、リコメンド対象の商品のＵＲＬを含むメッセージ又はプッシュ通知を表示部２５に表示させてもよい。

　また例えば、データ項目は、商品に関するデータ項目でなくてもよい。例えば、本発明に係る処理を、サービスに関するデータ項目に適用してもよい。この場合、実施形態で「商品」と記載した箇所は「サービス」と読み替えることができる。例えば、データ項目特徴情報は、サービスの特徴に関するサービス特徴情報となり、各サービスに対するユーザの行動履歴に関する情報となる。クラスタリング部１０３は、行動履歴情報が示す各サービスのサービス特徴情報に基づいて、各サービスのクラスタリングを行う。提示部１０４は、複数のサービスのうちの少なくとも１つに関するサービス情報を、ユーザに提示する。例えば、提示部１０４は、サービスのクーポン情報又はリコメンド情報を所定のページに埋め込んで提示する。

　また例えば、本発明に係る処理を、コンテンツに関するデータ項目に適用してもよい。この場合、実施形態で「商品」と記載した箇所は「コンテンツ」と読み替えることができる。例えば、データ項目特徴情報は、コンテンツの特徴に関するサービス特徴情報となり、各コンテンツに対するユーザの行動履歴に関する情報となる。クラスタリング部１０３は、行動履歴情報が示す各コンテンツのコンテンツ特徴情報に基づいて、各コンテンツのクラスタリングを行う。提示部１０４は、複数のコンテンツのうちの少なくとも１つに関するサービス情報を、ユーザに提示することになる。例えば、提示部１０４は、コンテンツのクーポン情報又はリコメンド情報を所定のページに埋め込んで提示する。

　また例えば、第１取得部１０１、第２取得部１０２、クラスタリング部１０３、及び提示部１０４は、それぞれユーザ端末２０で実現されるようにしてもよい。この場合、これら各機能は、制御部１１を主として実現される。例えば、第１取得部１０１は、ネットワークを介してサーバ１０から商品特徴情報を取得すればよい。また例えば、第２取得部１０２は、ネットワークを介してサーバ１０から行動履歴情報を取得すればよい。また例えば、クラスタリング部１０３は、これら取得された商品特徴情報と行動履歴情報とに基づいて、クラスタリングを実行すればよい。また例えば、提示部１０４は、ネットワークを介してサーバ１０から受信した情報に基づいて、商品情報を提示すればよい。

Claims

　複数のデータ項目の各々の特徴に関するデータ項目特徴情報を取得する第１取得手段と、
　各データ項目に対するユーザの行動履歴に関する行動履歴情報を取得する第２取得手段と、
　前記行動履歴情報が示す各データ項目の前記データ項目特徴情報に基づいて、各データ項目のクラスタリングを行うクラスタリング手段と、
　前記クラスタリング手段の処理結果に基づいて、前記複数のデータ項目のうちの少なくとも１つに関するデータ項目情報を、前記ユーザに提示する提示手段と、
　を含むことを特徴とする情報処理システム。
　前記クラスタリング手段は、クラスタごとに、当該クラスタに属する各データ項目の前記データ項目特徴情報に基づいて、ユーザ特徴情報を取得し、
　前記提示手段は、各クラスタの前記ユーザ特徴情報と、各データ項目の前記データ項目特徴情報と、に基づいて、前記データ項目情報を提示する、
　ことを特徴とする請求項１に記載の情報処理システム。
　各クラスタの前記ユーザ特徴情報と、各データ項目の前記データ項目特徴情報と、はそれぞれベクトルで示されており、
　前記提示手段は、各クラスタの前記ユーザ特徴情報が示すベクトルと、各データ項目の前記データ項目特徴情報が示すベクトルと、の比較結果に基づいて、前記データ項目情報を提示する、
　ことを特徴とする請求項２に記載の情報処理システム。
　前記クラスタリング手段は、各クラスタに属する各データ項目の前記データ項目特徴情報が示すベクトルの平均値を、当該クラスタの前記ユーザ特徴情報として取得する、
　ことを特徴とする請求項３に記載の情報処理システム。
　前記提示手段は、前記複数のデータ項目のうち、各クラスタ内のデータ項目の前記データ項目特徴情報を、当該クラスタの前記ユーザ特徴情報との比較対象とする、
　ことを特徴とする請求項３又は４の何れかに記載の情報処理システム。
　前記第１取得手段は、複数のユーザの各々の前記行動履歴情報に基づいて、各データ項目の前記データ項目特徴情報を取得する、
　ことを特徴とする請求項１～５の何れかに記載の情報処理システム。
　各データ項目の前記データ項目特徴情報は、予め設定された当該データ項目の分類情報を含む、
　ことを特徴とする請求項１～６の何れかに記載の情報処理システム。
　前記クラスタリング手段は、前記行動履歴情報に基づいて、クラスタサイズを変化させる、
　ことを特徴とする請求項１～７の何れかに記載の情報処理システム。
　前記行動履歴情報は、各データ項目に対する前記ユーザの行動の種類に関する行動種類情報を含み、
　前記提示手段は、前記行動種類情報に更に基づいて、前記データ項目情報を提示する、
　ことを特徴とする請求項１～８の何れかに記載の情報処理システム。
　前記行動履歴情報は、各データ項目に対する前記ユーザの行動時間に関する行動時間情報を含み、
　前記提示手段は、前記行動時間情報に更に基づいて、前記データ項目情報を提示する、
　ことを特徴とする請求項１～９の何れかに記載の情報処理システム。
　前記データ項目情報は、前記複数のデータ項目の少なくとも１つに関するクーポン情報又はリコメンド情報である、
　ことを特徴とする請求項１～１０の何れかに記載の情報処理システム。
　各データ項目は、商品に関するデータ項目であり、
　前記第１取得手段は、複数の商品の各々の特徴に関する前記データ項目特徴情報を取得し、
　前記第２取得手段は、各商品に対する前記ユーザの行動履歴に関する前記行動履歴情報を取得し、
　前記クラスタリング手段は、前記行動履歴情報が示す各商品の前記データ項目特徴情報に基づいて、各商品のクラスタリングを行い、
　前記提示手段は、前記複数の商品のうちの少なくとも１つに関する前記データ項目情報を前記ユーザに提示する、
　ことを特徴とする請求項１～１１の何れかに記載の情報処理システム。
　複数のデータ項目の各々の特徴に関するデータ項目特徴情報を取得する第１取得ステップと、
　各データ項目に対するユーザの行動履歴に関する行動履歴情報を取得する第２取得ステップと、
　前記行動履歴情報が示す各データ項目の前記データ項目特徴情報に基づいて、各データ項目のクラスタリングを行うクラスタリングステップと、
　前記クラスタリングステップの処理結果に基づいて、前記複数のデータ項目のうちの少なくとも１つに関するデータ項目情報を、前記ユーザに提示する提示ステップと、
　を含むことを特徴とする情報処理方法。
　複数のデータ項目の各々の特徴に関するデータ項目特徴情報を取得する第１取得手段、
　各データ項目に対するユーザの行動履歴に関する行動履歴情報を取得する第２取得手段、
　前記行動履歴情報が示す各データ項目の前記データ項目特徴情報に基づいて、各データ項目のクラスタリングを行うクラスタリング手段、
　前記クラスタリング手段の処理結果に基づいて、前記複数のデータ項目のうちの少なくとも１つに関するデータ項目情報を、前記ユーザに提示する提示手段、
　としてコンピュータを機能させるためのプログラム。