JPWO2019159288A1 - 情報処理システム、情報処理方法、及びプログラム - Google Patents

情報処理システム、情報処理方法、及びプログラム Download PDF

Info

Publication number
JPWO2019159288A1
JPWO2019159288A1 JP2019519354A JP2019519354A JPWO2019159288A1 JP WO2019159288 A1 JPWO2019159288 A1 JP WO2019159288A1 JP 2019519354 A JP2019519354 A JP 2019519354A JP 2019519354 A JP2019519354 A JP 2019519354A JP WO2019159288 A1 JPWO2019159288 A1 JP WO2019159288A1
Authority
JP
Japan
Prior art keywords
information
data item
user
product
cluster
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019519354A
Other languages
English (en)
Other versions
JP6805340B2 (ja
Inventor
ドンフン シン
ドンフン シン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Rakuten Group Inc
Original Assignee
Rakuten Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Rakuten Inc filed Critical Rakuten Inc
Publication of JPWO2019159288A1 publication Critical patent/JPWO2019159288A1/ja
Application granted granted Critical
Publication of JP6805340B2 publication Critical patent/JP6805340B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification

Abstract

ユーザに提示する情報の精度を高める。情報処理システム(1)の第1取得手段(101)は、複数のデータ項目の各々の特徴に関するデータ項目特徴情報を取得する。第2取得手段(102)は、各データ項目に対するユーザの行動履歴に関する行動履歴情報を取得する。クラスタリング手段(103)は、行動履歴情報が示す各データ項目のデータ項目特徴情報に基づいて、各データ項目のクラスタリングを行う。提示手段(104)は、クラスタリング手段(103)の処理結果に基づいて、複数のデータ項目のうちの少なくとも1つに関するデータ項目情報を、ユーザに提示する。

Description

本発明は、情報処理システム、情報処理方法、及びプログラムに関する。
従来、ユーザによるウェブサイトの閲覧や商品の購入などの行動履歴を解析する技術が知られている。例えば、特許文献1には、複数のユーザの各々のコンテンツ履歴に基づいて、嗜好が似たユーザのグループであるクラスタに各ユーザを割り当て、各クラスタの代表ユーザのコンテンツ履歴特性と、新規ユーザのコンテンツ履歴特性と、に基づいて新規ユーザを何れかのクラスタに割り当てることで、新規ユーザの嗜好に合ったコンテンツを提供するシステムが記載されている。
特開2013−200612号公報
しかしながら、特許文献1のコンテンツ履歴特性は、互いに特性の異なる種々の分野全体における行動履歴から算出されるものであり、分野ごとの細かな嗜好を示すものではない。例えば、コンテンツ履歴特性を算出する際に、ある分野における嗜好と、他の分野における嗜好と、が相殺されてしまい、分野特有の嗜好を示す情報とはならない。このため、特許文献1の技術では、コンテンツ履歴特性を利用して新規ユーザをクラスタに割り当てたとしても、ユーザに提示する情報の精度を十分に高めることができない。
本発明は上記課題に鑑みてなされたものであって、その目的は、ユーザに提示する情報の精度を高めることが可能な情報処理システム、情報処理方法、及びプログラムを提供することである。
上記課題を解決するために、本発明に係る情報処理システムは、複数のデータ項目の各々の特徴に関するデータ項目特徴情報を取得する第1取得手段と、各データ項目に対するユーザの行動履歴に関する行動履歴情報を取得する第2取得手段と、前記行動履歴情報が示す各データ項目の前記データ項目特徴情報に基づいて、各データ項目のクラスタリングを行うクラスタリング手段と、前記クラスタリング手段の処理結果に基づいて、前記複数のデータ項目のうちの少なくとも1つに関するデータ項目情報を、前記ユーザに提示する提示手段と、を含むことを特徴とする。
本発明に係る情報処理方法は、複数のデータ項目の各々の特徴に関するデータ項目特徴情報を取得する第1取得ステップと、各データ項目に対するユーザの行動履歴に関する行動履歴情報を取得する第2取得ステップと、前記行動履歴情報が示す各データ項目の前記データ項目特徴情報に基づいて、各データ項目のクラスタリングを行うクラスタリングステップと、前記クラスタリングステップの処理結果に基づいて、前記複数のデータ項目のうちの少なくとも1つに関するデータ項目情報を、前記ユーザに提示する提示ステップと、を含むことを特徴とする。
本発明に係るプログラムは、複数のデータ項目の各々の特徴に関するデータ項目特徴情報を取得する第1取得手段、各データ項目に対するユーザの行動履歴に関する行動履歴情報を取得する第2取得手段、前記行動履歴情報が示す各データ項目の前記データ項目特徴情報に基づいて、各データ項目のクラスタリングを行うクラスタリング手段、前記クラスタリング手段の処理結果に基づいて、前記複数のデータ項目のうちの少なくとも1つに関するデータ項目情報を、前記ユーザに提示する提示手段、としてコンピュータを機能させる。
また、本発明に係る情報記憶媒体は、上記のプログラムが記憶されたコンピュータ読み取り可能な情報記憶媒体である。
また、本発明の一態様では、前記クラスタリング手段は、クラスタごとに、当該クラスタに属する各データ項目の前記データ項目特徴情報に基づいて、ユーザ特徴情報を取得し、前記提示手段は、各クラスタの前記ユーザ特徴情報と、各データ項目の前記データ項目特徴情報と、に基づいて、前記データ項目情報を提示する、ことを特徴とする。
また、本発明の一態様では、各クラスタの前記ユーザ特徴情報と、各データ項目の前記データ項目特徴情報と、はそれぞれベクトルで示されており、前記提示手段は、各クラスタの前記ユーザ特徴情報が示すベクトルと、各データ項目の前記データ項目特徴情報が示すベクトルと、の比較結果に基づいて、前記データ項目情報を提示する、ことを特徴とする。
また、本発明の一態様では、前記クラスタリング手段は、各クラスタに属する各データ項目の前記データ項目特徴情報が示すベクトルの平均値を、当該クラスタの前記ユーザ特徴情報として取得する、ことを特徴とする。
また、本発明の一態様では、前記提示手段は、前記複数のデータ項目のうち、各クラスタ内のデータ項目の前記データ項目特徴情報を、当該クラスタの前記ユーザ特徴情報との比較対象とする、ことを特徴とする。
また、本発明の一態様では、前記第1取得手段は、複数のユーザの各々の前記行動履歴情報に基づいて、各データ項目の前記データ項目特徴情報を取得する、ことを特徴とする。
また、本発明の一態様では、各データ項目の前記データ項目特徴情報は、予め設定された当該データ項目の分類情報を含む、ことを特徴とする。
また、本発明の一態様では、前記クラスタリング手段は、前記行動履歴情報に基づいて、クラスタサイズを変化させる、ことを特徴とする。
また、本発明の一態様では、前記行動履歴情報は、各データ項目に対する前記ユーザの行動の種類に関する行動種類情報を含み、前記提示手段は、前記行動種類情報に更に基づいて、前記データ項目情報を提示する、ことを特徴とする。
また、本発明の一態様では、前記行動履歴情報は、各データ項目に対する前記ユーザの行動時間に関する行動時間情報を含み、前記提示手段は、前記行動時間情報に更に基づいて、前記データ項目情報を提示する、ことを特徴とする。
また、本発明の一態様では、前記データ項目情報は、前記複数のデータ項目の少なくとも1つに関するクーポン情報又はリコメンド情報である、ことを特徴とする。
また、本発明の一態様では、各データ項目は、商品に関するデータ項目であり、前記第1取得手段は、複数の商品の各々の特徴に関する前記データ項目特徴情報を取得し、前記第2取得手段は、各商品に対する前記ユーザの行動履歴に関する前記行動履歴情報を取得し、前記クラスタリング手段は、前記行動履歴情報が示す各商品の前記データ項目特徴情報に基づいて、各商品のクラスタリングを行い、前記提示手段は、前記複数の商品のうちの少なくとも1つに関する前記データ項目情報を前記ユーザに提示する、ことを特徴とする。
本発明によれば、ユーザに提示する情報の精度を高めることができる。
情報処理システムの全体構成を示す図である。 情報処理システムで実現される機能の一例を示す機能ブロック図である。 商品データベースの一例を示す図である。 ユーザデータベースの一例を示す図である。 クーポンデータベースの一例を示す図である。 クラスタリング部の処理内容を示す図である。 事前準備処理を示すフロー図である。 S2の処理の詳細を示す図である。 クーポン提示処理を示すフロー図である。 商品ページの画面例を示す図である。
[1.情報処理システムの全体構成]
以下、本発明に関わる情報処理システムの実施形態の例を説明する。図1は、情報処理システムの全体構成を示す図である。図1に示すように、情報処理システム1は、サーバ10及びユーザ端末20を含み、これらはネットワークを介してデータ送受信可能に接続される。なお、図1では、サーバ10及びユーザ端末20を1台ずつ示しているが、これらは複数台あってもよい。また、情報処理システム1は、サーバ10及びユーザ端末20以外のコンピュータを含んでいてもよい。
サーバ10は、サーバコンピュータであり、例えば、制御部11、記憶部12、及び通信部13を含む。制御部11は、少なくとも1つのプロセッサを含む。制御部11は、記憶部12に記憶されたプログラムやデータに従って処理を実行する。記憶部12は、主記憶部及び補助記憶部を含む。例えば、主記憶部はRAMなどの揮発性メモリであり、補助記憶部は、ハードディスクやフラッシュメモリなどの不揮発性メモリである。通信部13は、有線通信又は無線通信用の通信インタフェースを含み、例えば、ネットワークを介してデータ通信を行う。
ユーザ端末20は、ユーザが操作するコンピュータであり、例えば、パーソナルコンピュータ、携帯情報端末(タブレット型コンピュータを含む)、又は携帯電話機(スマートフォンを含む)等である。ユーザ端末20は、制御部21、記憶部22、通信部23、操作部24、及び表示部25を含む。制御部21、記憶部22、及び通信部23のハードウェア構成は、それぞれ制御部11、記憶部12、及び通信部13と同様であってよい。操作部24は、ユーザが操作を行うための入力デバイスであり、例えば、タッチパネルやマウス等のポインティングデバイスやキーボード等である。操作部24は、ユーザの操作内容を制御部21に伝達する。表示部25は、例えば、液晶表示部又は有機EL表示部等である。
なお、記憶部12,22に記憶されるものとして説明するプログラム及びデータは、ネットワークを介してこれらに供給されるようにしてもよい。また、サーバ10及びユーザ端末20のハードウェア構成は、上記の例に限られず、種々のハードウェアを適用可能である。例えば、サーバ10及びユーザ端末20は、それぞれコンピュータ読み取り可能な情報記憶媒体を読み取る読取部(例えば、光ディスクドライブやメモリカードスロット)や外部機器と直接的に接続するための入出力部(例えば、USB端子)を含んでもよい。この場合、情報記憶媒体に記憶されたプログラムやデータが読取部又は入出力部を介して、サーバ10又はユーザ端末20に供給されるようにしてもよい。
[2.情報処理システムの概要]
情報処理システム1では、複数のデータ項目がサーバ10に記憶されており、任意のデータ項目がユーザに提供される。データ項目は、ユーザに所定の情報を提供するためのデータである。データ項目の内容は、任意であってよく、例えば、商品、サービス、又はコンテンツに関する内容であってもよい。
商品は、取引の対象となる物であればよく、例えば、食料品、衣料品、家具、家電、又は電子機器などの有体物であってもよいし、後述するコンテンツのような無体物であってもよい。例えば、データ項目は、商品ページをユーザ端末20に表示させるためのデータである。データ項目は、商品ページのHTMLであってもよいし、商品ページのフレームに挿入する画像やテキストであってもよい。なお、フレームは、アプリケーション内で画面を表示させる場合の画面レイアウトを定義したデータである。
サービスは、任意の内容のサービスであってよく、例えば、旅行予約、保険の申し込み、レストラン予約、宝くじの購入、又は金融サービスなどである。例えば、データ項目は、サービスの利用申込ページをユーザ端末20に表示させるためのデータである。データ項目は、利用申込ページのHTMLであってもよいし、利用申込ページのフレームに挿入する画像やテキストであってもよい。
コンテンツは、任意の内容のコンテンツであってよく、例えば、ウェブサイト、クーポン、広告、電子書籍、動画、画像、楽曲、又はアプリケーションなどである。例えば、商品ページ及びサービスの利用申込ページも、コンテンツの一例ということもできる。例えば、データ項目は、コンテンツデータそのものであってもよいし、コンテンツのダウンロードページをユーザ端末20に表示させるためのデータであってもよい。データ項目は、ダウンロードページのHTMLであってもよいし、ダウンロードページのフレームに挿入する画像やテキストであってもよい。
本実施形態では、各データ項目が商品に関するデータ項目である場合を一例として説明する。以降の説明では、記載の簡略化のために「データ項目」を単に「商品」と記載する。このため、本実施形態で「商品」と記載した箇所は、「データ項目」と読み替えることができる。
本実施形態では、ユーザは、ユーザ端末20を操作してサーバ10にアクセスし、インターネット上の仮想的な店舗が取り扱う商品を閲覧したり購入したりする。ユーザの閲覧履歴及び購入履歴は、行動履歴として記録される。情報処理システム1は、各商品に対するユーザの行動履歴を解析し、ユーザごとに、商品のクラスタリングを実行する。
クラスタリングは、観測データをグループ分け(分類)するための処理である。本実施形態では、個々の商品が観測データに相当する。クラスタは、個々のグループであり、分類の単位である。クラスタは、商品の分類という意味では、カテゴリと概念的に少し似ている。ただし、カテゴリが全ユーザで共通の情報である一方で、クラスタは、ユーザごとに異なり、ユーザ特有の好みが反映されている。
本実施形態の情報処理システム1は、クラスタごとに、当該クラスタに属する商品の商品特徴情報に基づいて、ユーザの嗜好に関するユーザ特徴情報を計算する。そして、情報処理システム1は、各クラスタのユーザ特徴情報に基づいて、商品のクーポン情報を提示することによって、ユーザ特有の嗜好をクラスタごとに分析し、ユーザに提示するクーポン情報の精度を高めるようにしている。以降、当該構成の詳細を説明する。
[3.本実施形態において実現される機能]
図2は、情報処理システム1で実現される機能の一例を示す機能ブロック図である。図2に示すように、本実施形態では、データ記憶部100、第1取得部101、第2取得部102、クラスタリング部103、及び提示部104がサーバ10で実現される。データ記憶部100は、記憶部12を主として実現され、第1取得部101、第2取得部102、クラスタリング部103、及び提示部104の各々は、制御部11を主として実現される。
[3−1.データ記憶部]
データ記憶部100は、本実施形態に係る処理を実行するために必要なデータを記憶する。ここでは、データ記憶部100が記憶するデータの一例として、商品データベースDB1、ユーザデータベースDB2、及びクーポンデータベースDB3を説明する。
図3は、商品データベースDB1の一例を示す図である。図3に示すように、商品データベースDB1は、商品に関する種々の情報が格納されるデータベースである。例えば、商品データベースDB1には、店舗ID、商品ID、商品の基本情報、及び商品特徴情報が格納される。店舗IDは、インターネット上の店舗を一意に識別する情報である。商品IDは、当該店舗が取り扱う商品を一意に識別する情報である。
商品の基本情報は、商品の内容に関する基本的な情報であり、例えば、商品名(商品タイトル)、カテゴリ(ジャンル)、属性、単価、在庫数、キーワード、及び商品説明を含む。属性は、商品の性質であり、例えば、商品の色、サイズ、素材、状態、産地、又はメーカといった情報である。キーワードは、商品の検索用の単語であり、例えば、商品名又は商品説明の中から抽出された単語であってもよいし、店舗の担当者がキーワードとして入力した単語であってもよい。商品説明は、商品の詳細な説明であり、例えば、テキスト、表、及び画像の少なくとも1つによって示される。
例えば、商品の基本情報は、店舗の担当者により入力される。なお、商品の基本情報は、他の情報が含まれていてもよく、例えば、商品ページのURL、商品ページのHTMLデータ、フレーム、又は画像データなどの種々の情報が含まれていてもよい。なお、商品ページは、商品を購入するための画面であればよく、例えば、商品名、商品画像、商品説明、及び単価といった商品の基本情報と、商品を買い物かごに入れるためのボタンと、を含む。商品ページは、ユーザ端末20のウェブブラウザ内で表示されてもよいし、ユーザ端末20にインストールされたアプリケーション内で表示されてもよい。
商品特徴情報は、商品の特徴に関する情報であり、例えば、複数の項目の各々の特徴量を含む。項目は、商品の特徴を評価するための任意の項目であればよく、例えば、商品の基本情報に関する項目であってもよいし、商品を閲覧したり購入したりしたユーザの基本情報に関する項目であってもよい。例えば、特徴量は、各項目の商品の特徴を数値化した情報である。なお、特徴量は、数値ではなく、文字によって示されてもよいし、数値と文字の組み合わせで示されてもよい。
例えば、商品特徴情報は、商品名・キーワード・商品説明に含まれる単語が項目となってもよいし、カテゴリ、属性、又は価格帯が項目となってもよい。単語が商品特徴情報の項目となる場合には、当該項目の特徴量は、単語の特徴ベクトルであってもよい。単語の特徴ベクトルの取得方法自体は、公知の種々の手法を適用可能であり、例えば、Word2vecなどのニューラルネットワークを利用してもよい。また例えば、商品特徴情報は、商品を閲覧又は購入したユーザの年齢、性別、又は地域が項目になってもよい。
本実施形態では、商品特徴情報がn(nは自然数)次元のベクトルで示される場合を例に挙げて説明する。即ち、商品特徴情報は、n個の項目の特徴量を含んでおり、各項目の特徴量は、ベクトルの各要素の値として示される。なお、商品特徴情報は、ベクトル以外の形式であってもよく、任意の形式で表現可能である。例えば、商品特徴情報は、配列形式、画像形式、テキスト形式、又は表形式といった任意の形式の情報であってもよい。
また、本実施形態では、各商品の商品特徴情報は、予め設定された当該商品の分類情報を含む場合を説明する。例えば、商品特徴情報が示すn次元のベクトルのうち、k(kは1以上n以下の整数)個目の要素は、商品の分類情報を示す値となる。分類情報は、複数の分類情報の中から予め設定された少なくとも1つであり、例えば、カテゴリ(ジャンル)、属性、又は価格帯などの情報である。価格帯は、複数の価格帯の中から単価が属する価格帯である。
本実施形態では、分類情報の一例として、商品の基本情報に格納されたカテゴリ(即ち、店舗の担当者が入力したカテゴリ)を説明する。このため、本実施形態でカテゴリと記載した箇所については、分類情報と読み替えることができる。商品特徴情報のうち、k個目の要素は、カテゴリを示す特徴量となる。どの数値がどのカテゴリを示すかは、予めデータ記憶部100に定めておけばよい。
なお、本実施形態では、店舗の担当者により入力された情報と、サーバ10により生成された情報と、の両方が商品特徴情報に含まれる場合を説明するが、商品特徴情報は、店舗の担当者により入力された情報だけを含んでもよいし、サーバ10により生成された情報だけを含んでもよい。また、商品特徴情報に含まれる項目は、上記の例に限られず、任意の項目を適用可能である。例えば、商品が閲覧又は購入された日時に関する項目であってもよいし、商品が閲覧又は購入された場合に使用された検索式に関する項目であってもよい。検索式とは、検索条件であり、例えば、キーワード、カテゴリ、属性、価格帯、及び在庫の有無のうちの少なくとも1つである。
図4は、ユーザデータベースDB2の一例を示す図である。図4に示すように、ユーザデータベースDB2は、ユーザに関する種々の情報が格納されるデータベースである。例えば、ユーザデータベースDB2には、ユーザID、ユーザの基本情報、行動履歴情報、及び、クラスタ情報が格納される。ユーザIDは、ユーザを一意に識別する情報である。
ユーザの基本情報は、ユーザの登録情報であり、例えば、ユーザ名、年齢、性別、及び地域などの情報が格納される。なお、ユーザの基本情報は、他の情報が含まれていてもよく、例えば、ユーザのお気に入りのカテゴリなどの情報が含まれていてもよい。
行動履歴情報は、各商品に対するユーザの行動履歴に関する情報であり、例えば、行動対象の商品の識別情報(ここでは、店舗IDと商品IDの組み合わせ)、行動種類情報、及び行動時間情報といった情報が時系列的に格納される。
行動対象とは、ユーザによる行動の対象になることであり、例えば、閲覧、購入、又はダウンロードなどの対象になることである。行動種類情報は、行動の種類に関する情報であり、例えば、閲覧・購入・ダウンロードといった複数の種類のうち、ユーザが取った行動の種類を示す情報である。行動時間情報は、ユーザが行動した日時を示す情報であり、例えば、閲覧日時、購入日時、又はダウンロード日時といった情報である。
サーバ10は、ユーザ端末20との通信内容に基づいて、行動履歴情報を更新する。例えば、サーバ10は、ユーザから商品ページの閲覧要求を受け付けると、当該商品ページの表示データをユーザ端末20に送信する。そして、サーバ10は、当該ユーザのユーザIDが格納されたレコードの行動履歴情報に、当該商品ページが示す商品の店舗ID及び商品IDを格納し、行動種類情報に「閲覧」を設定し、行動時間情報に現在日時を設定する。
また例えば、サーバ10は、ユーザから商品の購入要求を受け付けると、当該商品の購入処理を実行する。購入処理自体は、公知の種々の処理を適用可能であり、例えば、クレジットカードによる決済処理が実行される。そして、サーバ10は、当該ユーザのユーザIDが格納されたレコードの行動履歴情報に、当該商品ページが示す商品の店舗ID及び商品IDを格納し、行動種類情報に「購入」を設定し、行動時間情報に現在日時を設定する。
クラスタ情報は、クラスタリング部103が特定したクラスタに関する情報であり、例えば、クラスタ番号、ユーザ特徴情報、重み係数、行動種類情報、及び行動時間情報を含む。クラスタ番号は、クラスタを一意に識別する情報である。クラスタは、ユーザごとに取得されるので、クラスタ番号は、あるユーザに対して取得された複数のクラスタの中で、クラスタを一意に識別する情報といえる。
ユーザ特徴情報は、クラスタ内の商品の特徴を総合的に示す情報である。ユーザ特徴情報は、クラスタごとに生成され、例えば、クラスタに属する行動対象の商品の商品特徴情報を所定の数式に代入することで得られた値となる。この数式は、任意の数式であってよく、例えば、単純平均又は加重平均を求める式である。本実施形態では、商品特徴情報がベクトルで示されるので、ユーザ特徴情報もベクトルで示される場合を一例として説明する。
重み係数は、クラスタの重要度(蓋然性)であり、例えば、重み係数が高いほどクラスタが重要であり、重み係数が低いほどクラスタが重要ではないことを示す。
行動種類情報は、クラスタに属する商品に対する行動の種類に関する情報である。ここでは、行動種類情報は、「購入済み」又は「閲覧のみ」の何れかの値を取るものとする。クラスタに属する行動対象の商品が1つでも購入されていれば、当該クラスタの行動種類情報は「購入済み」となり、そうでなければ、当該クラスタの行動種類情報は「閲覧のみ」となる。なお、行動の種類は、購入と閲覧に限られず、例えば、商品を買い物かごに入れるといった行動であってもよい。
行動時間情報は、クラスタに属する商品に対する行動時間に関する情報である。ここでは、行動時間情報は、「購入済み」の商品に対する行動時間が格納される。
なお、行動履歴情報に含まれる項目は、上記の例に限られず、任意の項目を適用可能である。例えば、行動履歴情報は、商品が閲覧又は購入された際に使用された検索式を含んでいてもよい。また、ユーザデータベースDB2には、ユーザが獲得したクーポン情報などの情報を含んでいてもよい。
図5は、クーポンデータベースDB3の一例を示す図である。図5に示すように、クーポンデータベースDB3は、クーポンに関する種々の情報が格納されるデータベースである。例えば、クーポンデータベースDB3には、クーポンID、クーポンの対象となる店舗又は商品の識別情報(ここでは、店舗IDと商品IDの組み合わせ)、クーポン内容、及び商品特徴情報が格納される。クーポンIDは、クーポンを一意に識別する情報である。
クーポン内容は、クーポン使用時の効果であり、例えば、値引き額、値引きパーセント(割合)、おまけの商品といった情報が格納される。商品特徴情報は、クーポンの対象となる商品の商品特徴情報である。クーポン対象が店舗となる場合には、当該店舗が取り扱う特定の商品の商品特徴情報であってもよいし、当該店舗の複数の商品の各々の商品特徴情報から算出されるようにしてもよい。なお、クーポンデータベースDB3には、クーポンの有効期間などの情報が格納されていてもよい。
例えば、クーポンデータベースDB3は、各店舗の担当者によって更新される。例えば、クーポンを発行する店舗の担当者は、サーバ10に対し、自身の店舗の店舗ID、クーポンの対象となる商品の商品ID、及びクーポンの内容の登録要求を送信する。サーバ10は、店舗の担当者からの登録要求を受信すると、クーポンIDを発行し、店舗ID、商品ID、及びクーポンの内容と関連付けてクーポンデータベースDB3に格納する。そして、サーバ10は、商品データベースDB1を参照し、当該店舗ID及び当該商品IDに関連付けられた商品特徴情報を取得し、上記発行したクーポンIDと関連付けてクーポンデータベースDB3に格納する。
なお、データ記憶部100に記憶されるデータは、上記の例に限られない。データ記憶部100は、実施形態に係る処理のために必要なデータを記憶すればよい。例えば、データ記憶部100は、行動履歴情報と商品特徴情報との関係(詳細後述)を記憶してもよい。
[3−2.第1取得部]
第1取得部101は、複数の商品の各々の特徴に関する商品特徴情報を取得する。本実施形態では、商品データベースDB1に商品特徴情報が格納されているので、第1取得部101は、データ記憶部100に記憶された各商品の商品特徴情報を取得する。なお、サーバ10以外のコンピュータ(例えば、外部のデータベースサーバ)に商品特徴情報が記憶されている場合には、第1取得部101は、当該コンピュータから各商品の商品特徴情報を取得すればよい。
例えば、第1取得部101は、複数のユーザの各々の行動履歴情報に基づいて、各商品の商品特徴情報を取得してもよい。この場合、第1取得部101は、情報処理システム1の全ユーザの行動履歴情報に基づいて、各商品の商品特徴情報を取得してもよいし、情報処理システム1の一部のユーザの行動履歴情報に基づいて、各商品の商品特徴情報を取得してもよい。また例えば、第1取得部は、各ユーザの行動履歴情報に基づいて、商品特徴情報の全項目の特徴量を取得してもよいし、商品特徴情報の一部の項目の特徴量を取得してもよい。
各ユーザの行動履歴情報と、各商品の商品特徴情報と、の関係は、予めデータ記憶部100に記憶されているものとする。この関係は、数式形式又はテーブル形式で定義されていてもよいし、プログラムコードの一部として定義されていてもよい。第1取得部101は、各ユーザの行動履歴情報に関連付けられた各商品の商品特徴情報を取得する。即ち、第1取得部101は、各ユーザの行動履歴情報を上記関係の入力とし、上記関係の出力として各商品の商品特徴情報を取得する。
例えば、第1取得部101は、ある検索式で得られた検索結果から閲覧又は購入された商品同士の商品特徴情報が似るように、各商品の商品特徴情報を取得する。また例えば、第1取得部101は、商品が閲覧又は購入された場合に使用されたキーワードを参照し、当該キーワードに含まれる単語に基づいて、当該商品の商品特徴情報を取得してもよい。この場合、第1取得部101は、キーワードに含まれる単語の特徴ベクトルを、商品特徴情報の一部の項目の特徴量としてもよい。
また例えば、商品特徴情報が、ユーザに関する情報を含む場合には、第1取得部101は、各ユーザの基本情報に基づいて、各商品の商品特徴情報を取得してもよい。例えば、商品特徴情報の項目として、商品を閲覧又は購入するユーザの年齢、性別、及び地域の少なくとも1つを含む場合には、第1取得部101は、ユーザデータベースDB2を参照し、各商品の商品特徴情報の当該項目の特徴量を、当該商品を行動対象にしたユーザの年齢、性別、及び地域に基づいて取得してもよい。
なお、各商品の商品特徴情報は、行動履歴情報に基づいて取得されるのではなく、店舗の担当者によって入力された情報をそのまま商品特徴情報としてもよいし、店舗の担当者によって入力された情報をもとに生成された情報を商品特徴情報としてもよい。
[3−3.第2取得部]
第2取得部102は、各商品に対するユーザの行動履歴に関する行動履歴情報を取得する。本実施形態では、ユーザデータベースDB2に行動履歴情報が格納されているので、第2取得部102は、データ記憶部100に記憶された行動履歴情報を取得する。例えば、第2取得部102は、ユーザデータベースDB2に格納された各ユーザの行動履歴情報を取得する。なお、サーバ10以外のコンピュータ(例えば、外部のデータベースサーバ)に行動履歴情報が記憶されている場合には、第2取得部102は、当該コンピュータから各ユーザの行動履歴情報を取得すればよい。
[3−4.クラスタリング部]
クラスタリング部103は、行動履歴情報が示す各商品の商品特徴情報に基づいて、各商品のクラスタリングを行う。本実施形態では、クラスタリングは、商品特徴情報が似た商品をグループ化するための処理となる。クラスタリングは、データ・クラスタリング、教師なし学習、又はデータマイニングと呼ばれることもある。
クラスタリング部103は、ユーザごとに、当該ユーザの行動履歴情報に基づいて、クラスタリングを行う。別の言い方をすれば、クラスタリング部103は、各ユーザの行動履歴情報に基づいて、当該ユーザのためのクラスタリングを行う。例えば、クラスタリング部103は、各ユーザの行動履歴情報に基づいて、当該ユーザによる行動対象の商品を特定し、特定した各商品の商品特徴情報に基づいて、当該ユーザのためのクラスタリングを実行する。このため、クラスタリング部103は、あるユーザのクラスタリングを実行する場合、当該ユーザの行動履歴情報は参照するが、他のユーザの行動履歴情報は参照しない。
なお、クラスタリングのアルゴリズム自体は、公知の種々の手法を適用可能であり、例えば、最短距離法・最長距離法・群平均法・ウォード法などの階層型手法を利用したアルゴリズムであってもよいし、K平均法などの非階層的手法を利用したアルゴリズムであってもよい。例えば、DBSCAN (Density-based spatial clustering of applications with noise )が用いられてもよい。
図6は、クラスタリング部103の処理内容を示す図である。図6に示すように、本実施形態では、商品特徴情報がn次元のベクトルで示されるので、クラスタリング部103は、行動対象の商品の商品特徴情報が示すn次元のベクトルをn次元空間SPにマッピングし、階層的手法又は非階層的手法のアルゴリズムに基づいて、各商品のクラスタリングを実行する。
図6の例では、クラスタリング部103は、40個の商品の商品特徴情報が示すベクトルV1〜V40をn次元空間SPにマッピングし、3つのクラスタCL1〜CL3を設定している。クラスタCL1には、ベクトルV1〜V13に対応する商品が属する。クラスタCL2には、ベクトルV14〜V26に対応する商品が属する。クラスタCL3には、ベクトルV27〜V39に対応する商品が属する。
例えば、クラスタリング部103は、所定のルールに基づいて、各クラスタCL1〜CL3のクラスタ番号を発行し、行動対象の各商品の商品特徴情報に基づいて、当該商品にクラスタ番号を関連付けることによって、クラスタ情報を更新する。なお、クラスタリング部103は、何れのクラスタCL1〜CL3からも距離が遠い商品(図6の例では、ベクトルV40に対応する商品)については、ノイズとして除去してもよい。なお、以降の説明では、特に図6を参照する必要のないときは、クラスタとベクトルの符号を省略する。
例えば、クラスタリング部103は、クラスタごとに、当該クラスタに属する各商品の商品特徴情報に基づいて、ユーザ特徴情報を取得してもよい。クラスタリング部103は、クラスタごとに、当該クラスタに属する各商品の商品特徴情報を所定の数式に代入することによって、ユーザ特徴情報を取得する。先述したように、この数式は、任意の内容であってよく、例えば、単純平均又は加重平均を求める式であってもよい。
本実施形態では、商品特徴情報がベクトルで示されるので、例えば、クラスタリング部103は、各クラスタに属する各商品の商品特徴情報が示すベクトルの平均値を、当該クラスタのユーザ特徴情報として取得してもよい。当該平均値は、別の言い方をすれば、クラスタに属する各商品の商品特徴情報が示すベクトルのジョイントベクトルである。
図6の例では、クラスタリング部103は、ベクトルV1〜V13の平均値であるジョイントベクトルを、クラスタCL1のユーザ特徴情報として取得し、クラスタ情報に格納する。クラスタリング部103は、ベクトルV14〜V26の平均値であるジョイントベクトルを、クラスタCL2のユーザ特徴情報として取得し、クラスタ情報に格納する。クラスタリング部103は、ベクトルV27〜V39の平均値であるジョイントベクトルを、クラスタCL3のユーザ特徴情報として取得し、クラスタ情報に格納する。
本実施形態では、クラスタ情報に、ユーザ特徴情報だけではなく、重み係数も含まれるので、クラスタリング部103は、各ユーザの行動履歴情報に基づいて、当該ユーザのクラスタ情報に格納される重み係数を決定してもよい。
また例えば、クラスタリング部103は、クラスタに含まれる商品の数が多いほど、当該クラスタ内の商品にユーザが強く関心を持っている可能性があるので、重み係数を大きくし、クラスタに含まれる商品の数が少ないほど、当該クラスタ内の商品にユーザがさほど関心を持っていない可能性があるので、重み係数を小さくしてもよい。
また例えば、クラスタリング部103は、クラスタのクラスタサイズが大きいほど、当該クラスタに多数の商品が含まれておりユーザが強く関心を持っている可能性があるので、重み係数を大きくし、クラスタのクラスタサイズが小さいほど、当該クラスタに商品があまり含まれておらずユーザがさほど関心を持っていない可能性があるので、重み係数を小さくしてもよい。
また、本実施形態では、クラスタ情報に、ユーザ特徴情報だけではなく、行動種類情報も含まれるので、クラスタリング部103は、各ユーザの行動履歴情報に基づいて、当該ユーザのクラスタ情報に格納される行動種類情報を決定してもよい。
例えば、クラスタリング部103は、クラスタに含まれる商品の行動種類情報に基づいて、当該クラスタの行動種類情報を決定してもよい。例えば、クラスタリング部103は、クラスタに含まれる商品の行動種類情報が閲覧のみであれば、当該クラスタの行動種類情報を閲覧のみとし、購入済みの商品を所定個数(例えば、1つ又は2つ以上の任意の数)含むのであれば、当該クラスタの行動種類情報を購入済みとしてもよい。
例えば、クラスタリング部103は、クラスタに含まれる商品の行動種類情報を参照し、閲覧の商品のみを含むクラスタであれば、まだ商品が購入されておらずユーザの関心が高い可能性があるので、重み係数を大きくし、購入済みの商品を含むクラスタであれば、既に商品が購入されておりユーザの関心が低い可能性があるので、重み係数を小さくしてもよい。
また例えば、クラスタリング部103は、購入済みの商品を含むクラスタであったとしても、当該クラスタ内の商品が購入された後に、同じクラスタ内の商品が再度閲覧された場合には、ユーザが再び関心を示した可能性があるので、重み係数を大きくしてもよい。
また、本実施形態では、クラスタ情報に、ユーザ特徴情報だけではなく、行動時間情報も含まれるので、クラスタリング部103は、各ユーザの行動履歴情報に基づいて、当該ユーザのクラスタ情報に格納される行動時間情報を決定してもよい。
例えば、クラスタリング部103は、クラスタに含まれる商品の行動時間情報に基づいて、当該クラスタの行動時間情報を決定してもよい。例えば、クラスタリング部103は、クラスタに含まれる商品の行動時間情報の平均値を当該クラスタの行動時間情報としてもよいし、クラスタに含まれる商品のうち、購入済みの商品の行動時間情報を当該クラスタの行動時間情報としてもよい。
また例えば、クラスタリング部103は、クラスタに含まれる商品の行動時間情報を参照し、ユーザが閲覧した日時からの経過時間が短いほど、ユーザの関心がまだ薄れていない可能性があるので、重み係数を大きくし、ユーザが閲覧した日時からの経過時間が長いほど、ユーザの関心が薄れてしまった可能性があるので、重み係数を小さくしてもよい。
また例えば、クラスタリング部103は、クラスタに含まれる商品の行動時間情報を参照し、ユーザが購入した日時からの経過時間が長いほど、ユーザが再び商品を購入する可能性があるので、重み係数を大きくし、ユーザが購入した日時からの経過時間が短いほど、ユーザがまだ商品を購入しない可能性があるので、重み係数を小さくしてもよい。
また例えば、クラスタリング部103は、行動履歴情報に基づいて、クラスタサイズを変化させてもよい。クラスタサイズは、クラスタの大きさ(範囲の広さ)であり、粒度とも呼ばれる。例えば、クラスタリング部103は、クラスタに属する商品の数が多いほどクラスタサイズを小さくし、クラスタに属する商品の数が少ないほどクラスタサイズを大きくしてもよい。また例えば、クラスタリング部103は、行動対象の各商品の商品特徴情報のマッピング結果を参照し、商品の密度が高いほどクラスタサイズを小さくし、商品の密度が低いほどクラスタサイズを大きくしてもよい。
[3−5.提示部]
提示部104は、クラスタリング部103の処理結果に基づいて、複数の商品のうちの少なくとも1つに関する商品情報を、ユーザに提示する。提示部104は、クラスタリング部103の処理結果に基づいて、複数の商品の中から少なくとも1つを選出し、当該少なくとも1つの商品に関する商品情報を、ユーザに提示する。
商品情報は、商品に関する情報であればよく、例えば、複数の商品の少なくとも1つに関するクーポン情報又はリコメンド情報であってもよいし、商品ページそのものであってもよいし、商品ページとは異なる内容の説明文又は商品画像であってもよい。
クーポン情報は、所定の特典をユーザに与えるための情報であればよく、例えば、商品を割引価格で購入するための情報であってもよいし、商品以外のおまけを獲得するための情報であってもよい。リコメンド情報は、商品をユーザに提案するための情報であればよく、例えば、商品ページへのリンクであってもよいし、当該リンクが埋め込まれた画像であってもよい。本実施形態では、商品情報の一例としてクーポン情報を説明する。このため、本実施形態でクーポン情報と記載した箇所は、商品情報と読み替えることができる。
提示とは、視覚的な提示であり、商品情報を表示させるための処理である。提示部104による提示方法は、任意の方法を適用可能であり、例えば、ページ内における画像の表示、電子メールの送信、メッセージアプリを利用したメッセージの送信、又はプッシュ通知であってもよい。本実施形態では、提示部104が、仮想市場のトップページ、店舗のトップページ、又は商品ページなどの任意のページにおいて、クーポン情報を表示させる場合を一例として説明する。
例えば、提示部104は、各クラスタのユーザ特徴情報と、各商品の商品特徴情報と、に基づいて、クーポン情報を提示する。本実施形態では、各クラスタのユーザ特徴情報は、当該クラスタに属する商品の特徴を平均化した情報なので、提示部104は、クーポンデータベースDB3に登録された複数の商品の中から、各クラスタのユーザ特徴情報と似た商品特徴情報を有する商品を特定し、当該特定した商品のクーポン情報を提示することになる。
また、本実施形態では、各クラスタのユーザ特徴情報と、各商品の商品特徴情報と、はそれぞれベクトルで示されているので、提示部104は、各クラスタのユーザ特徴情報が示すベクトルと、各商品の商品特徴情報が示すベクトルと、の比較結果に基づいて、クーポン情報を提示する。例えば、提示部104は、各クラスタのユーザ特徴情報が示すベクトルと、各商品の商品特徴情報が示すベクトルと、の距離に基づいて、クーポン情報を提示する。
例えば、提示部104は、距離が短い順に所定の個数だけ商品を特定し、当該商品のクーポン情報を提示する。この個数は、クラスタに関係なく固定値であってもよいが、本実施形態では、各クラスタの重み付け係数によって変化するものとする。例えば、重み付け係数が大きいほど個数が多くなり、重み付け係数が小さいほど個数が少なくなる。重み付け係数と個数との関係は、予めデータ記憶部100に記憶させておけばよい。この関係は、数式形式又はテーブル形式で定義されていてもよいし、プログラムコードの一部として定義されていてもよい。例えば、提示部104は、クラスタごとに、当該クラスタの重み付け係数によって定まる個数だけ、上記距離が短い順番にクーポン情報を取得して提示する。
例えば、図4のようなデータ格納例の場合、「ユーザX」のクラスタ情報は、クラスタ番号が「1」のクラスタの重み係数は「2」であり、クラスタ番号が「2」のクラスタの重み係数は「5」であり、クラスタ番号が「3」のクラスタの重み係数は「3」である。このため、ユーザに提示するクーポン情報の総数を10個とすると、提示部104は、クラスタ番号が「1」のユーザ特徴情報と距離が近い順に2つのクーポン情報を取得し、クラスタ番号が「2」のユーザ特徴情報と距離が近い順に5つのクーポン情報を取得し、クラスタ番号が「3」のユーザ特徴情報と距離が近い順に3つのクーポン情報を取得する。提示部104は、これら取得した10個のクーポイン情報を商品ページなどに含ませることによって提示する。
例えば、全商品の商品特徴情報が各クラスタのユーザ特徴情報との比較対象になってもよいが、提示部104は、複数の商品のうち、各クラスタ内の商品の商品特徴情報を、当該クラスタのユーザ特徴情報との比較対象としてもよい。例えば、提示部104は、クラスタごとに、各商品の商品特徴情報に基づいて、当該クラスタに属する商品を特定する。提示部104は、特定した当該商品を比較対象とする。別の言い方をすれば、提示部104は、クーポンデータベースDB3に登録された複数の商品のうち、クラスタ内の商品は比較対象とし、クラスタ外の商品は比較対象から除外する。
本実施形態では、行動履歴情報は、各商品に対するユーザの行動の種類に関する行動種類情報を含むので、提示部104は、行動種類情報に更に基づいて、クーポン情報を提示してもよい。例えば、提示部104は、行動種類情報が所定の種類を示す商品については、クーポン情報を提示しないようにしてもよい。所定の種類は、ユーザが商品に対する興味がなくなる蓋然性の高い行動であり、例えば、購入である。
提示部104は、行動種類情報が購入を示す商品を含むクラスタについては、クーポン情報の提示対象から除外してもよい。なお、提示部104は、行動種類情報が購入を示す商品を含むクラスタであったとしても、購入後にユーザが閲覧した場合には、当該クラスタを再びクーポン情報の提示対象としてもよい。また、各クラスタの重み係数を行動種類情報に基づいて決定する場合には、提示部104は、重み係数に基づいてクーポン情報の提示対象となる商品を決定することによって、行動種類情報に基づいてクーポン情報を提示していることになる。
本実施形態では、行動履歴情報は、各商品に対するユーザの行動時間に関する行動時間情報を含むので、提示部104は、行動時間情報に更に基づいて、クーポン情報を提示する。例えば、提示部104は、行動時間情報が示す行動時間からの経過時間が閾値未満であれば、クーポン情報を提示しないようにして、経過時間が閾値以上であれば、クーポン情報を提示するようにしてもよい。また、各クラスタの重み係数を行動時間情報に基づいて決定する場合には、提示部104は、重み係数に基づいてクーポン情報の提示対象となる商品を決定することによって、行動時間情報に基づいてクーポン情報を提示していることになる。
[4.本実施形態において実行される処理]
次に、情報処理システム1で実行される処理の流れを説明する。ここでは、クーポン提示の事前準備をするための事前準備処理と、ユーザにクーポンを提示するためのクーポン提示処理と、を説明する。事前準備処理及びクーポン提示処理は、図2に示す機能ブロックにより実行される処理の一例である。
[4−1.事前準備処理]
図7は、事前準備処理を示すフロー図である。事前準備処理は、制御部11が、記憶部12に記憶されたプログラムに従って動作することによって実行される。事前準備処理は、所定のタイミングで実行されるようにすればよく、例えば、システム管理者の指示に応じて実行されてもよいし、予め定められた日時に実行されてもよい。
図7に示すように、まず、制御部11は、ユーザデータベースDB2に格納された複数のユーザの各々の行動履歴情報に基づいて、各商品の商品特徴情報を生成する(S1)。S1においては、制御部11は、全ユーザ又は一部のユーザの行動履歴情報を参照し、各ユーザの行動対象となった商品に基づいて、当該商品の商品特徴情報を生成する。行動履歴情報から商品特徴情報を生成する処理は先述した通りである。
制御部11は、ユーザごとに、各クラスタのユーザ特徴情報を生成する(S2)。図8は、S2の処理の詳細を示す図である。図8に示すように、制御部11は、ユーザデータベースDB2に基づいて、処理対象のユーザを決定する(S21)。S21においては、制御部11は、ユーザIDが最も若いユーザを処理対象のユーザとして決定してもよいし、ユーザデータベースDB2の最初のレコードに対応するユーザを処理対象のユーザとして決定してもよい。
制御部11は、ユーザデータベースDB2を参照し、S21で決定した処理対象のユーザの行動履歴情報を取得する(S22)。S22においては、制御部11は、ユーザデータベースDB2のうち、処理対象のユーザのユーザIDが格納されたレコードの行動履歴情報を取得する。なお、制御部11は、処理対象のユーザの全ての行動履歴情報を参照してもよいし、直近の所定日数(例えば、30日〜120日程度)の行動履歴情報だけを参照するといった一部のみを参照してもよい。
制御部11は、S22で取得した行動履歴情報に基づいて、処理対象のユーザの行動対象となった各商品の商品特徴情報を、n次元空間にマッピングする(S23)。S23においては、制御部11は、商品データベースDB1を参照し、行動履歴情報に店舗ID及び商品IDが格納された商品の商品特徴情報を取得し、クラスタリングの観測データとして設定することになる。
制御部11は、S23におけるマッピング結果に基づいて、各商品のクラスタリングを実行する(S24)。S24においては、制御部11は、先述したクラスタリングのアルゴリズムに基づいて、n次元空間にマッピングされた商品特徴情報のクラスタリングを実行する。制御部11は、各クラスタのクラスタ番号を発行し、処理対象のユーザのクラスタ情報にクラスタ番号を格納する。そして、制御部11は、n次元空間に商品特徴情報がマッピングされた各商品に対し、何れかのクラスタ番号を関連付ける。
制御部11は、処理対象のユーザのクラスタ情報に基づいて、処理対象のクラスタを決定する(S25)。S25においては、制御部11は、クラスタ番号が最も若いクラスタを処理対象のクラスタとして決定してもよいし、クラスタ情報における最初のレコードに対応するクラスタを処理対象のクラスタとして決定してもよい。
制御部11は、処理対象のクラスタに属する各商品の商品特徴情報に基づいて、処理対象のクラスタのユーザ特徴情報を取得する(S26)。S26においては、制御部11は、処理対象のクラスタに属する各商品の商品特徴情報の平均値を、処理対象のクラスタのユーザ特徴情報として取得する。
制御部11は、全てのクラスタについてユーザ特徴情報を取得したか否かを判定する(S27)。S27においては、制御部11は、S24のクラスタリングでクラスタ番号が生成された複数のクラスタの全てに対し、S26の処理を実行したか否かを判定することになる。
ユーザ特徴情報を取得していないクラスタがあると判定された場合(S27;N)、S26の処理に戻り、次のクラスタのユーザ特徴情報が取得される。以降、制御部11は、処理対象のユーザに対して取得された全てのクラスタのユーザ特徴情報を取得するまで、S26の処理を繰り返す。
一方、全てのクラスタについてユーザ特徴情報を取得したと判定された場合(S27;Y)、制御部11は、全てのユーザに対し、クラスタリングを実行したか否かを判定する(S28)。
クラスタリングを実行していないユーザがいると判定された場合(S28;N)、S21の処理に戻り、次の処理対象のユーザに対し、クラスタリングが実行される。以降、制御部11は、次の処理対象のユーザに対して取得された全てのクラスタのユーザ特徴情報を取得する。一方、全てのユーザについてクラスタリングを実行したと判定された場合(S28;Y)、S2の処理は終了してS3の処理に移行する。
制御部11は、商品データベースDB1とクーポンデータベースDB3とに基づいて、クーポンと商品特徴情報とを関連付けて(S3)、本処理は終了する。S3においては、制御部11は、クーポンデータベースDB3を参照し、現時点で登録されているクーポンを特定する。制御部11は、特定したクーポンの店舗IDと商品IDを参照し、商品データベースDB1に格納された商品特徴情報を取得し、クーポンデータベースDB3に格納する。
[4−2.クーポン提示処理]
図9は、クーポン提示処理を示すフロー図である。クーポン提示処理は、制御部11が、記憶部12に記憶されたプログラムに従って動作し、制御部21が、記憶部22に記憶されたプログラムに従って動作することによって実行される。
図9に示すように、まず、ユーザ端末20において、ユーザが操作部24から所定の操作を行うと、制御部21は、サーバ10に対し、ユーザIDとともにアクセス要求を送信する(S31)。アクセス要求は、所定形式の要求であればよく、例えば、仮想市場のトップページや商品ページなどの表示要求である。ウェブブラウザ内でページを表示させる場合には、アクセス要求はページのURLを含んでもよいし、アプリケーション内でページを表示させる場合には、アクセス要求はページを識別するIDを含んでもよい。なお、ユーザIDは、予め記憶部22に記憶されていてもよいし、操作部24から入力されてもよい。
サーバ10においては、ユーザIDとアクセス要求を受信すると、制御部11は、ユーザデータベースDB2を参照し、アクセス要求をしたユーザのクラスタ情報を取得する(S32)。S32においては、制御部11は、アクセス要求とともに受信したユーザIDが格納されたレコードのクラスタ情報を取得する。
制御部11は、S32で取得したクラスタ情報と、クーポンデータベースDB3と、に基づいて、ユーザに提示すべきクーポン情報を決定する(S33)。S33においては、制御部11は、重み係数、行動種類情報、及び行動時間情報に基づいて、各クラスタのクーポン情報の数を決定する。そして、制御部11は、クラスタごとに、当該クラスタのユーザ特徴情報と商品特徴情報との距離が近い順に所定個数だけクーポンを取得する。
制御部11は、S33で決定したクーポン情報を含むページの表示データを生成し、ユーザ端末20に送信する(S34)。S34においては、制御部11は、S33で決定したクーポン情報を、仮想市場のトップページや商品ページなどに埋め込む。
ユーザ端末20においては、表示データを受信すると、制御部21は、受信した表示データに基づいて、クーポン情報を含むページを表示部25に表示させ(S35)、本処理は終了する。
図10は、クーポン情報を含むページの画面例を示す図である。図10に示す例では、仮想市場のトップページPにクーポン情報CP1〜CP2が埋め込まれた場合を示している。クーポン情報CP1〜CP2は、それぞれ、クーポン対象の商品の画像、クーポンの適用期間、クーポンの内容、クーポン対象の店舗といった情報を含む。例えば、トップページPからユーザが選択したクーポン情報を獲得することができる。
以上説明した情報処理システム1によれば、ユーザの行動対象になった各商品のクラスタリング結果に基づいて、ユーザの嗜好をより細かく分析したうえでクーポン情報を提示するので、ユーザに提示するクーポン情報の精度を高めることができる。例えば、従来の技術では、分野に関係なくユーザの嗜好を示す情報を算出していたため、ある分野における嗜好と、他の分野における嗜好と、を平均化すると、互いの特徴が相殺されてしまい、全く関係のない商品を示す特徴量となってしまう可能性があったが、ユーザごとにクラスタを設定することで、ユーザの嗜好をより細かく分析し、クーポン情報の精度を高めることが可能となる。また例えば、ユーザの好みの商品が複数のカテゴリにまたがって存在することがあるが、クラスタリングによって、これら複数のカテゴリをまたぐようなクラスタを設定することができ、クラスタによって、ユーザの好みを漏れなく特定することができる。これとは逆に、ユーザが、あるカテゴリ内の商品全部を好むのではなく、このカテゴリ内の特定分野の商品のみを好む場合には、カテゴリは広すぎてユーザの嗜好をピンポイントで表すものとはならないが、クラスタは、このような場合であっても、ユーザの嗜好をピンポイントで表すことができる。このため、クラスタは、ユーザ固有の嗜好を表現したものとなるので、ユーザに提示するクーポン情報の精度を高めることができる。
また、情報処理システム1は、クラスタごとに取得したユーザ特徴情報に基づいてクーポン情報を提示し、より簡易な処理によってクーポン情報の精度を高めることができるので、情報処理システム1の処理負荷を軽減することができる。
また、ユーザ特徴情報と商品特徴情報とをそれぞれベクトルで示し、各クラスタのユーザ特徴情報が示すベクトルと、各商品の商品特徴情報が示すベクトルと、の比較結果に基づいてクーポン情報を提示し、より簡易な処理によってクーポン情報の精度を高めることができるので、情報処理システム1の処理負荷を効果的に軽減することができる。また、ユーザ特徴情報と商品特徴情報の各々を、ベクトルという簡易な形式を利用することで、情報処理システム1内のメモリ消費量を抑制することもできる。
また、各クラスタのユーザ特徴情報を、当該クラスタ内の商品の商品特徴情報の平均値とすることで、ユーザ特徴情報の精度が向上するので、ユーザに提示するクーポン情報の精度を効果的に高めることができる。また、より簡易な処理によってユーザ特徴情報を取得することができるので、ユーザ特徴情報を取得するための情報処理システム1の処理負荷を軽減することができる。
また、各クラスタのユーザ特徴情報との比較対象として、当該クラスタ内の商品の商品特徴情報とすることによって、比較対象となる商品が少なくなるので、情報処理システム1の処理負荷を軽減することができる。また、比較対象となる商品が少なくなることで、クーポン情報を提示する処理を高速化することもできる。
また、各ユーザの行動履歴情報から各商品の商品特徴情報を取得することで、ユーザの行動を踏まえた商品特徴情報とすることができ、商品特徴情報の精度が向上するので、ユーザに提示するクーポン情報の精度を効果的に高めることができる。
また、商品特徴情報に商品のカテゴリを含めておくことで、商品特徴情報の精度が向上するので、ユーザに提示するクーポン情報の精度を効果的に高めることができる。
また、各ユーザの行動履歴情報に基づいてクラスタサイズを変化させることで、商品特徴情報が密集している部分については、より細かなクラスタを設定するといったことが可能となり、クラスタの精度が向上するので、ユーザに提示するクーポン情報の精度を効果的に高めることができる。
また、ユーザの行動の種類に基づいてクーポン情報を提示することで、ユーザに提示するクーポン情報の精度を効果的に高めることができる。
また、各商品に対するユーザの行動時間に基づいてクーポン情報を提示することで、ユーザに提示するクーポン情報の精度を効果的に高めることができる。
また、ユーザに提示する情報として、各商品のクーポン情報を提示することによって、ユーザにとって有益な情報を提示することができる。
また、データ項目として、商品に関するデータ項目とすることで、商品を購入するユーザに有益な情報を提示することができる。
[5.変形例]
なお、本発明は、以上に説明した実施の形態に限定されるものではない。本発明の趣旨を逸脱しない範囲で、適宜変更可能である。
例えば、クラスタごとにユーザ特徴情報が取得される場合を説明したが、特にユーザ特徴情報が取得されなくてもよい。この場合、提示部104は、各クラスタに含まれる商品のうちの任意の商品特徴情報に基づいて、クーポン情報を提示すべき商品を決定してもよい。また例えば、提示部104は、各クラスタに含まれる商品のうちの少なくとも1つの商品を、クーポン情報の提示対象としてもよい。
また例えば、商品情報は、クーポン情報ではなく、リコメンド情報であってもよい。例えば、提示部104は、ユーザがサーバ10にアクセスした場合に、トップページ又は商品ページ内にリコメンド対象の商品の画像を表示させてもよい。また例えば、提示部104は、リコメンド対象の商品のURLを含む電子メールを送信してもよいし、リコメンド対象の商品のURLを含むメッセージ又はプッシュ通知を表示部25に表示させてもよい。
また例えば、データ項目は、商品に関するデータ項目でなくてもよい。例えば、本発明に係る処理を、サービスに関するデータ項目に適用してもよい。この場合、実施形態で「商品」と記載した箇所は「サービス」と読み替えることができる。例えば、データ項目特徴情報は、サービスの特徴に関するサービス特徴情報となり、各サービスに対するユーザの行動履歴に関する情報となる。クラスタリング部103は、行動履歴情報が示す各サービスのサービス特徴情報に基づいて、各サービスのクラスタリングを行う。提示部104は、複数のサービスのうちの少なくとも1つに関するサービス情報を、ユーザに提示する。例えば、提示部104は、サービスのクーポン情報又はリコメンド情報を所定のページに埋め込んで提示する。
また例えば、本発明に係る処理を、コンテンツに関するデータ項目に適用してもよい。この場合、実施形態で「商品」と記載した箇所は「コンテンツ」と読み替えることができる。例えば、データ項目特徴情報は、コンテンツの特徴に関するサービス特徴情報となり、各コンテンツに対するユーザの行動履歴に関する情報となる。クラスタリング部103は、行動履歴情報が示す各コンテンツのコンテンツ特徴情報に基づいて、各コンテンツのクラスタリングを行う。提示部104は、複数のコンテンツのうちの少なくとも1つに関するサービス情報を、ユーザに提示することになる。例えば、提示部104は、コンテンツのクーポン情報又はリコメンド情報を所定のページに埋め込んで提示する。
また例えば、第1取得部101、第2取得部102、クラスタリング部103、及び提示部104は、それぞれユーザ端末20で実現されるようにしてもよい。この場合、これら各機能は、制御部11を主として実現される。例えば、第1取得部101は、ネットワークを介してサーバ10から商品特徴情報を取得すればよい。また例えば、第2取得部102は、ネットワークを介してサーバ10から行動履歴情報を取得すればよい。また例えば、クラスタリング部103は、これら取得された商品特徴情報と行動履歴情報とに基づいて、クラスタリングを実行すればよい。また例えば、提示部104は、ネットワークを介してサーバ10から受信した情報に基づいて、商品情報を提示すればよい。

Claims (14)

  1. 複数のデータ項目の各々の特徴に関するデータ項目特徴情報を取得する第1取得手段と、
    各データ項目に対するユーザの行動履歴に関する行動履歴情報を取得する第2取得手段と、
    前記行動履歴情報が示す各データ項目の前記データ項目特徴情報に基づいて、各データ項目のクラスタリングを行うクラスタリング手段と、
    前記クラスタリング手段の処理結果に基づいて、前記複数のデータ項目のうちの少なくとも1つに関するデータ項目情報を、前記ユーザに提示する提示手段と、
    を含むことを特徴とする情報処理システム。
  2. 前記クラスタリング手段は、クラスタごとに、当該クラスタに属する各データ項目の前記データ項目特徴情報に基づいて、ユーザ特徴情報を取得し、
    前記提示手段は、各クラスタの前記ユーザ特徴情報と、各データ項目の前記データ項目特徴情報と、に基づいて、前記データ項目情報を提示する、
    ことを特徴とする請求項1に記載の情報処理システム。
  3. 各クラスタの前記ユーザ特徴情報と、各データ項目の前記データ項目特徴情報と、はそれぞれベクトルで示されており、
    前記提示手段は、各クラスタの前記ユーザ特徴情報が示すベクトルと、各データ項目の前記データ項目特徴情報が示すベクトルと、の比較結果に基づいて、前記データ項目情報を提示する、
    ことを特徴とする請求項2に記載の情報処理システム。
  4. 前記クラスタリング手段は、各クラスタに属する各データ項目の前記データ項目特徴情報が示すベクトルの平均値を、当該クラスタの前記ユーザ特徴情報として取得する、
    ことを特徴とする請求項3に記載の情報処理システム。
  5. 前記提示手段は、前記複数のデータ項目のうち、各クラスタ内のデータ項目の前記データ項目特徴情報を、当該クラスタの前記ユーザ特徴情報との比較対象とする、
    ことを特徴とする請求項3又は4の何れかに記載の情報処理システム。
  6. 前記第1取得手段は、複数のユーザの各々の前記行動履歴情報に基づいて、各データ項目の前記データ項目特徴情報を取得する、
    ことを特徴とする請求項1〜5の何れかに記載の情報処理システム。
  7. 各データ項目の前記データ項目特徴情報は、予め設定された当該データ項目の分類情報を含む、
    ことを特徴とする請求項1〜6の何れかに記載の情報処理システム。
  8. 前記クラスタリング手段は、前記行動履歴情報に基づいて、クラスタサイズを変化させる、
    ことを特徴とする請求項1〜7の何れかに記載の情報処理システム。
  9. 前記行動履歴情報は、各データ項目に対する前記ユーザの行動の種類に関する行動種類情報を含み、
    前記提示手段は、前記行動種類情報に更に基づいて、前記データ項目情報を提示する、
    ことを特徴とする請求項1〜8の何れかに記載の情報処理システム。
  10. 前記行動履歴情報は、各データ項目に対する前記ユーザの行動時間に関する行動時間情報を含み、
    前記提示手段は、前記行動時間情報に更に基づいて、前記データ項目情報を提示する、
    ことを特徴とする請求項1〜9の何れかに記載の情報処理システム。
  11. 前記データ項目情報は、前記複数のデータ項目の少なくとも1つに関するクーポン情報又はリコメンド情報である、
    ことを特徴とする請求項1〜10の何れかに記載の情報処理システム。
  12. 各データ項目は、商品に関するデータ項目であり、
    前記第1取得手段は、複数の商品の各々の特徴に関する前記データ項目特徴情報を取得し、
    前記第2取得手段は、各商品に対する前記ユーザの行動履歴に関する前記行動履歴情報を取得し、
    前記クラスタリング手段は、前記行動履歴情報が示す各商品の前記データ項目特徴情報に基づいて、各商品のクラスタリングを行い、
    前記提示手段は、前記複数の商品のうちの少なくとも1つに関する前記データ項目情報を前記ユーザに提示する、
    ことを特徴とする請求項1〜11の何れかに記載の情報処理システム。
  13. 複数のデータ項目の各々の特徴に関するデータ項目特徴情報を取得する第1取得ステップと、
    各データ項目に対するユーザの行動履歴に関する行動履歴情報を取得する第2取得ステップと、
    前記行動履歴情報が示す各データ項目の前記データ項目特徴情報に基づいて、各データ項目のクラスタリングを行うクラスタリングステップと、
    前記クラスタリングステップの処理結果に基づいて、前記複数のデータ項目のうちの少なくとも1つに関するデータ項目情報を、前記ユーザに提示する提示ステップと、
    を含むことを特徴とする情報処理方法。
  14. 複数のデータ項目の各々の特徴に関するデータ項目特徴情報を取得する第1取得手段、
    各データ項目に対するユーザの行動履歴に関する行動履歴情報を取得する第2取得手段、
    前記行動履歴情報が示す各データ項目の前記データ項目特徴情報に基づいて、各データ項目のクラスタリングを行うクラスタリング手段、
    前記クラスタリング手段の処理結果に基づいて、前記複数のデータ項目のうちの少なくとも1つに関するデータ項目情報を、前記ユーザに提示する提示手段、
    としてコンピュータを機能させるためのプログラム。
JP2019519354A 2018-02-15 2018-02-15 情報処理システム、情報処理方法、及びプログラム Active JP6805340B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2018/005315 WO2019159288A1 (ja) 2018-02-15 2018-02-15 情報処理システム、情報処理方法、及びプログラム

Publications (2)

Publication Number Publication Date
JPWO2019159288A1 true JPWO2019159288A1 (ja) 2020-04-02
JP6805340B2 JP6805340B2 (ja) 2020-12-23

Family

ID=67619798

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019519354A Active JP6805340B2 (ja) 2018-02-15 2018-02-15 情報処理システム、情報処理方法、及びプログラム

Country Status (2)

Country Link
JP (1) JP6805340B2 (ja)
WO (1) WO2019159288A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110909222B (zh) * 2019-10-12 2023-07-25 中国平安人寿保险股份有限公司 基于聚类的用户画像建立方法、装置、介质及电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011060182A (ja) * 2009-09-14 2011-03-24 Aim Co Ltd コンテンツ選択システム
JP2011095814A (ja) * 2009-10-27 2011-05-12 Hitachi Solutions Ltd ユーザ嗜好適合アイテム推薦装置
JP2015088089A (ja) * 2013-11-01 2015-05-07 株式会社Nttドコモ レコメンドサーバ及びレコメンド方法
US20150293925A1 (en) * 2014-04-09 2015-10-15 Apple Inc. Automatic generation of online media stations customized to individual users
JP2016103107A (ja) * 2014-11-27 2016-06-02 株式会社豊田中央研究所 クラスタリング装置、情報端末、情報提示システム、及びプログラム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101802332B1 (ko) * 2010-11-25 2017-12-29 삼성전자주식회사 컨텐츠 제공 방법 및 그 시스템

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011060182A (ja) * 2009-09-14 2011-03-24 Aim Co Ltd コンテンツ選択システム
JP2011095814A (ja) * 2009-10-27 2011-05-12 Hitachi Solutions Ltd ユーザ嗜好適合アイテム推薦装置
JP2015088089A (ja) * 2013-11-01 2015-05-07 株式会社Nttドコモ レコメンドサーバ及びレコメンド方法
US20150293925A1 (en) * 2014-04-09 2015-10-15 Apple Inc. Automatic generation of online media stations customized to individual users
JP2016103107A (ja) * 2014-11-27 2016-06-02 株式会社豊田中央研究所 クラスタリング装置、情報端末、情報提示システム、及びプログラム

Also Published As

Publication number Publication date
JP6805340B2 (ja) 2020-12-23
WO2019159288A1 (ja) 2019-08-22

Similar Documents

Publication Publication Date Title
US11836780B2 (en) Recommendations based upon explicit user similarity
US9904949B1 (en) Product recommendations
US11061973B2 (en) Incorporating user usage of consumable content into recommendations
JP7117826B2 (ja) 検索装置、検索方法及び検索プログラム
US20200273054A1 (en) Digital receipts economy
US20140074649A1 (en) Grocery recommendation engine
JP6669244B2 (ja) 情報処理装置、情報配信システム、情報処理方法、および情報処理プログラム
TW200951859A (en) Method and apparatus for social network marketing with consumer referral
JP2010073170A (ja) 推薦商品選択装置、推薦商品選択プログラムおよび商品検索装置
JP2007265077A (ja) 子供衣類管理装置および子供衣類管理システム
Guo et al. Recommend products with consideration of multi-category inter-purchase time and price
JP2018045505A (ja) 判定装置、判定方法および判定プログラム
JP6754808B2 (ja) 情報処理装置、情報処理方法
JP6079479B2 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
JP6805340B2 (ja) 情報処理システム、情報処理方法、及びプログラム
JP6655223B1 (ja) 情報処理システム、情報処理方法、及びプログラム
CN110020918A (zh) 一种推荐信息生成方法和系统
US20150006527A1 (en) Information processing apparatus, information processing method, and information processing program
JP6585998B2 (ja) コンテンツ決定装置
JP7039500B2 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
US20230237513A1 (en) Server and program for a store introduction system
JP6269864B2 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
JP2018077636A (ja) プログラムおよび組み合わせ抽出システム
JP6443431B2 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
JP2023121023A (ja) 情報処理装置、情報処理方法、および情報処理プログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190409

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190409

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20190409

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20190614

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190625

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190822

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20191015

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200114

C60 Trial request (containing other claim documents, opposition documents)

Free format text: JAPANESE INTERMEDIATE CODE: C60

Effective date: 20200114

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20200122

C21 Notice of transfer of a case for reconsideration by examiners before appeal proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C21

Effective date: 20200128

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20200214

C211 Notice of termination of reconsideration by examiners before appeal proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C211

Effective date: 20200218

C22 Notice of designation (change) of administrative judge

Free format text: JAPANESE INTERMEDIATE CODE: C22

Effective date: 20200825

C302 Record of communication

Free format text: JAPANESE INTERMEDIATE CODE: C302

Effective date: 20200930

C13 Notice of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: C13

Effective date: 20201006

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201009

C23 Notice of termination of proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C23

Effective date: 20201020

C03 Trial/appeal decision taken

Free format text: JAPANESE INTERMEDIATE CODE: C03

Effective date: 20201124

C30A Notification sent

Free format text: JAPANESE INTERMEDIATE CODE: C3012

Effective date: 20201124

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20201203

R150 Certificate of patent or registration of utility model

Ref document number: 6805340

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350