JP6899350B2

JP6899350B2 - 情報処理装置、情報処理方法、およびプログラム

Info

Publication number: JP6899350B2
Application number: JP2018084768A
Authority: JP
Inventors: 知加野村; 信一郎瀬賀; 勇紀山中
Original assignee: Yahoo Japan Corp
Current assignee: Yahoo Japan Corp
Priority date: 2018-04-26
Filing date: 2018-04-26
Publication date: 2021-07-07
Anticipated expiration: 2038-04-26
Also published as: JP2019191984A

Description

本発明は、情報処理装置、情報処理方法、およびプログラムに関する。

ユーザが過去に利用したクーポンやポイントなどのインセンティブの利用履歴から、より効果的なユーザに対してインセンティブを付与する技術が知られている（例えば特許文献１、２参照）。

特許第６２５３７４４号公報特許第６２５３７４５号公報

しかしながら、従来の技術では、付与されたインセンティブが、オークションやショッピングなどの互いに種類の異なる複数のサービス間において横断的あるいは相互に利用可能な場合、ある特定のサービスに介して商品を購入するように促す目的でインセンティブを付与しても、特定のサービスとは異なる他のサービスを介して、付与したインセンティブが利用されてしまう場合があった。このように、ユーザに付与したインセンティブが意図した目的と異なった用途で利用され、インセンティブの付与が効果的でない場合があった。

本発明は、このような事情を考慮してなされたものであり、より効果的にインセンティブを付与することを目的の一つとする。

本発明の一態様は、複数のユーザの行動履歴と、前記複数のユーザの素性情報とを取得する取得部と、前記取得部により取得された前記複数のユーザの行動履歴および素性情報に基づいて、前記複数のユーザのうち、互いに異なる複数のサービスのうちターゲットとするサービスを利用して所定の行動に至りやすい、または互いに異なる複数の商品のうちターゲットとする商品について所定の行動に至りやすい対象ユーザに対して、前記複数のサービス間、または前記複数の商品間において利用可能な複数のインセンティブのうち、いずれか一つ以上のインセンティブを付与することを決定する決定部と、を備える情報処理装置である。

本発明の一態様によれば、より効果的にインセンティブを付与することができる。

第１の実施形態における情報処理装置１００を含む情報処理システム１の一例を示す図である。第１の実施形態における情報処理装置１００の構成の一例を示す図である。行動履歴情報１３２の一例を示す図である。行動履歴情報１３２の他の例を示す図である。行動履歴情報１３２の他の例を示す図である。行動履歴情報１３２の他の例を示す図である。行動履歴情報１３２の他の例を示す図である。素性情報１３４の一例を示す図である。ユーザ行動履歴の素性をより具体的に例示した図である。予測モデル情報１３６の一例を示す図である。アカウント情報１３８の一例を示す図である。第１の実施形態における制御部１１０による一連の処理の一例を示すフローチャートである。ポイントごとに導出されたスコアの一例を示す図である。ある期間において、販売サイトを利用した全ユーザの購入履歴に関する情報を示す図である。パラメータＡの決定方法を模式的に示す図である。パラメータＢの決定方法を模式的に示す図である。スコアから将来の行動確率を導出する様子を示す図である。線形計画緩和を説明するための図である。第３の実施形態における目的関数ｆを説明するための図である。第３の実施形態における目的関数ｆを説明するための図である。第３の実施形態における目的関数ｆを説明するための図である。インセンティブが付与されることが事前に通知される様子を模式的に示す図である。第４の実施形態における制御部１１０による一連の処理の一例を示すフローチャートである。実施形態の情報処理装置１００のハードウェア構成の一例を示す図である。

以下、図面を参照し、本発明の情報処理装置、情報処理方法、およびプログラムの実施形態について説明する。

［概要］
実施形態の情報処理装置は、一以上のプロセッサによって実現される。情報処理装置は、複数のユーザの行動履歴と、複数のユーザの素性情報とを取得し、取得した複数のユーザの行動履歴および素性情報に基づいて、複数のユーザのうち、互いに異なる複数のサービスのうちターゲットとするサービスを利用して所定の行動に至りやすい対象ユーザに対して、複数のサービス間において利用可能な複数のインセンティブのうち、いずれか一つ以上のインセンティブを付与することを決定する。

インセンティブとは、例えば、ショッピングなどにおいて販売される商品またはサービス（以下、アイテムと称する）の購入に利用可能なポイントである。また、インセンティブは、ポイントと同様の効果をもたらすクーポンやチケット、割引券などであってもよいし、特定のアイテムを優先的に購入できる権利（先着何名様限定の購入権）などであってもよい。このようなインセンティブは、予め提携した種々のサービス間で横断的あるいは相互に利用することができる。本実施形態では、一例として、インセンティブがアイテムの購入などに利用可能なポイントであるものとして説明する。

また、情報処理装置は、取得した複数のユーザの行動履歴および素性情報に基づいて、複数のユーザのうち、互いに異なる複数の商品のうちターゲットとする商品について所定の行動に至りやすい対象ユーザに対して、複数の商品間において利用可能な複数のインセンティブのうち、いずれか一つ以上のインセンティブを付与することを決定してもよい。

＜第１の実施形態＞
［全体構成］
第１の実施形態では、互いに異なる複数のサービスのうちターゲットとするサービスを利用して所定の行動に至りやすい対象ユーザに対してインセンティブ（例えばポイント）を付与する例について説明する。図１は、第１の実施形態における情報処理装置１００を含む情報処理システム１の一例を示す図である。第１の実施形態における情報処理システム１は、一以上の端末装置１０と、一以上のサーバ装置２０と、情報処理装置１００とを備える。これらの装置は、ネットワークＮＷを介して互いに接続される。ネットワークＮＷは、例えば、無線基地局、Ｗｉ−Ｆｉアクセスポイント、通信回線、プロバイダ、インターネットなどを含む。なお、図１に示す各装置の全ての組み合わせが相互に通信可能である必要はなく、ネットワークＮＷは、一部にローカルなネットワークを含んでもよい。

端末装置１０は、ユーザにより利用される端末装置である。端末装置１０は、例えば、スマートフォンなどの携帯電話、タブレット端末、ＰＤＡ、パーソナルコンピュータである。例えば、端末装置１０は、ユーザによる操作を受け付けて、所定のウェブブラウザを介して、サーバ装置２０が提供するウェブサイトにアクセスしてもよいし、予めインストールされたアプリケーションを介してサーバ装置２０と通信を行い、アプリケーション上で表示或いは再生するコンテンツ（例えば画像や動画、テキストなど）を取得してもよい。このアプリケーションは、例えば、ショッピングアプリなどのアイテムを購入可能なアプリケーションであってもよいし、アプリ内で課金し動画等を再生するコンテンツ配信アプリケーションなどであってもよい。

サーバ装置２０は、例えば、販売サイトを提供するウェブサーバ装置であってよい。販売サイトは、例えば、インターネット上において、アイテムを販売する複数の店舗が出店したショッピングサイトや、アイテムを出品したり落札したりすることが可能なオークションの場を提供するオークションサイト、個人がアイテムを売買可能なマーケットを提供するフリーマーケットサイト、電子書籍を専門に販売するブックストアサイト、動画を配信する動画配信サイト、旅行商品（ホテルの宿泊予約や航空券のチケットなど）を販売するトラベルサイト等のウェブサイトを含む。このような販売サイトでは、例えば、アイテムの購入時などにポイントが利用可能であり、アイテムの購入金額の一部または全部をポイントによって支払うことができる。

また、サーバ装置２０は、販売サイトに加えて、或いは代えて、クレジットカードの会員登録を受け付けるウェブサイト（以下、クレジットカード登録サイト）や、銀行口座を開設するためのウェブサイト（以下、銀行口座開設サイト）、上記の販売サイトにおいて他の利用者よりも種々のメリット（例えばポイントの付与率が増大するメリット）を享受可能なプレミアム会員の登録を受け付けるウェブサイト（以下、プレミアム会員登録サイト）、アカウント登録を受け付けるコンテンツ配信サイト、携帯電話キャリアの契約または解約を受け付けるウェブサイト（以下、携帯電話キャリア契約サイト）、インターネットプロバイダなどの契約または解約を受け付けるウェブサイト（以下、プロバイダ契約サイト）、株、為替、先物、仮想通貨などが売り買いされるウェブサイト（以下、金融商品取引サイト）などを提供してもよい。

また、サーバ装置２０は、アプリケーションが起動された端末装置１０と通信を行って、各種情報の受け渡しを行うアプリケーションサーバ装置であってもよい。アプリケーションサーバ装置が提供する情報に基づいて端末装置１０のアプリケーションプログラムが生成する画面は、販売サイトやクレジットカード登録サイト、銀行口座開設サイト、プレミアム会員登録サイト、コンテンツ配信サイト、携帯電話キャリア契約サイト、プロバイダ契約サイト、金融商品取引サイトなどの各種ウェブサイトと同様のサービスを提供する。

情報処理装置１００は、端末装置１０およびサーバ装置２０の一方または双方とネットワークＮＷを介して通信を行って、ユーザに関する各種情報を取得する。情報処理装置１００は、取得した情報に基づいて、過去にポイントが付与されたユーザの購入傾向から、ポイントを付与したときにユーザが所定の行動に至る確率（以下、行動確率と称する）を予測する。そして、情報処理装置１００は、予測した確率に基づいて、これからポイントを付与する予定のユーザに対してより効果的にポイントを付与するためにはどうすべきかを解析する。

所定の行動とは、ウェブサイトの提供主、アプリケーションの提供主、またはインセンティブを付与する付与主がユーザに対して期待する行動である。例えば、サーバ装置２０により提供されるウェブサイトがショッピングサイトである場合、所定の行動は、ショッピングサイトで販売されるアイテムを購入することなどである。

また、サーバ装置２０により提供されるウェブサイトがオークションサイトである場合、所定の行動は、オークションサイトにアイテムを出品することや、オークションサイトに出品されたアイテムを入札または落札することなどである。

また、サーバ装置２０により提供されるウェブサイトがフリーマーケットサイトである場合、所定の行動は、アイテムを販売することや購入することなどである。

また、サーバ装置２０により提供されるウェブサイトがクレジットカード登録サイトである場合、所定の行動は、クレジットカードの新規会員登録を行うこと、或いはクレジットカードの会員登録を解消しないことなどである。

また、サーバ装置２０により提供されるウェブサイトが銀行口座開設サイトである場合、所定の行動は、口座を新規に開設すること、或いは既に開設した口座を解約しないことなどである。

また、サーバ装置２０により提供されるウェブサイトがプレミアム会員登録サイトである場合、所定の行動は、新規にプレミアム会員を登録すること、或いは既に登録したプレミアム会員を解消しないことなどである。

また、サーバ装置２０により提供されるウェブサイトがコンテンツ配信サイトである場合、所定の行動は、新規にアカウント登録を行うこと、或いは既に登録したアカウントを解消しないことなどである。

また、サーバ装置２０により提供されるウェブサイトが携帯電話キャリア契約サイトやプロバイダ契約サイトなどである場合、所定の行動は、新規に契約すること、或いは既に契約していれば解約しないことなどである。

また、サーバ装置２０により提供されるウェブサイトが金融商品取引サイトである場合、所定の行動は、アイテムの一例である金融商品や仮想通貨などをトレード（売買）することなどである。

［情報処理装置の構成］
以下、情報処理装置１００の構成について説明する。図２は、第１の実施形態における情報処理装置１００の構成の一例を示す図である。情報処理装置１００は、例えば、通信部１０２と、制御部１１０と、記憶部１３０とを備える。

通信部１０２は、例えば、ＮＩＣ等の通信インターフェースを含む。通信部１０２は、ネットワークＮＷを介して、端末装置１０やサーバ装置２０などの他装置と通信する。例えば、通信部１０２は、端末装置１０から端末側管理情報を受信する。端末側管理情報は、例えば、ウェブブラウザごとに管理されるクッキー（HTTP cookie）である。このクッキーには、例えば、販売サイトなどの各種ウェブサイトにおける行動履歴やウェブページの閲覧履歴などが含まれる。また、通信部１０２は、サーバ装置２０から、上述した端末側管理情報に相当し、販売サイトなどの各種ウェブサイトにおける行動履歴やウェブページの閲覧履歴などが含まれるサーバ側管理情報を受信してもよい。通信部１０２により受信された端末側管理情報やサーバ側管理情報は、後述する行動履歴情報１３２として記憶部１３０に記憶される。

制御部１１０は、例えば、取得部１１２と、モデル生成部１１４と、確率予測部１１６と、付与ポイント決定部１１８とを備える。これらの構成要素の一部または全部は、例えば、ＣＰＵ（Central Processing Unit）などのプロセッサが記憶部１３０に格納されたプログラムを実行することにより実現される。また、制御部１１０の構成要素のうち一部または全部は、ＧＰＵ（Graphics Processing Unit）、ＬＳＩ（Large Scale Integration）、ＡＳＩＣ（Application Specific Integrated Circuit）、またはＦＰＧＡ（Field-Programmable Gate Array）などのハードウェアにより実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。

記憶部１３０は、例えば、ＨＤＤ（Hard Disc Drive）、フラッシュメモリ、ＥＥＰＲＯＭ（Electrically Erasable Programmable Read Only Memory）、ＲＯＭ（Read Only Memory）、またはＲＡＭ（Random Access Memory）などの記憶装置により実現される。記憶部１３０には、プロセッサが読み出すプログラムの他、行動履歴情報１３２、素性情報１３４、予測モデル情報１３６、アカウント情報１３８などの情報が記憶される。

図３は、行動履歴情報１３２の一例を示す図である。行動履歴情報１３２は、各ユーザを識別可能なユーザＩＤに対して、複数種類のインセンティブ（ポイント）のそれぞれをユーザに付与したときに、そのユーザが所定期間（例えばポイントの有効期間）内に、インセンティブ（ポイント）を利用して所定の行動（例えばアイテムの購入など）に至ったのか否かを示す情報が対応付けられた情報である。図示の例では、行動履歴情報１３２において、ある販売サイトにおいてアイテムを購入することが所定の行動として扱われており、販売サイトで販売されるアイテムを購入していれば「購入」という情報が対応付けられており、アイテムを購入していなければ「非購入」という情報が対応付けられている。

ユーザＩＤは、例えば、販売サイトなどの各種ウェブサイトや各種アプリケーションを利用する複数のユーザのそれぞれを識別するために、サーバ装置２０によって発行されるＩＤである。複数種類のインセンティブは、ユーザに与える影響度（例えば購入意欲を向上させる度合など）が互いに異なるものであり、例えば、５００ポイント、３００ポイント、１００ポイント、３ポイント、０ポイントというように、ポイントの効力（使用可能額面）が異なるインセンティブを含む。０ポイントとは、ポイントが付与されないことである。そのため、０ポイントにおける所定の行動の有無（例えば購入または非購入）とは、ユーザが、ポイントが付与されなくとも所定の行動に至ったのかどうかを表している。なお、所定の行動が「アイテムの購入」である場合、各ポイントにおける「購入」は、その購入時にポイントが利用されたことを要件としてもよいし、要件としなくてもよい。

上述した図の例では、各ユーザＩＤに対して、５００ポイント、３００ポイント、１００ポイント、３ポイント、０ポイントの全種類のインセンティブを付与することで、各インセンティブにおいて購入の有無（購入／非購入）を示す情報が取得されているがこれに限られず、一部のインセンティブのみを付与することで、特定のインセンティブについての購入の有無を示す情報が取得されてもよい。例えば、ある母集団（例えば１００万人程度のユーザの集合）のユーザＩＤに対して、所定数（例えば２０万人）ごとに互いに異なるポイントを付与して、購入の有無を示す情報を取得してよい。すなわち、５００ポイント、３００ポイント、１００ポイント、３ポイント、０ポイントのうち、いずれか一つのポイントについての購入の有無が判断できればよい。

また、年齢や性別などのユーザの属性を示す情報が得られる任意のユーザＩＤ（後述する機械学習などの学習データとして利用しなかったユーザＩＤを含む）に対して、各ポイントについて購入傾向をモデル化した予測モデルを生成することができる。例えば、２０万件ずつの５００ポイント、３００ポイント、１００ポイント、３ポイント、０ポイントのそれぞれの所定の行動の有無を示す情報を用いて、各ポイントにおける予測モデルを生成した後、次回以降にインセンティブを付与する対象となる全ユーザＩＤに対して、各ユーザＩＤの属性情報だけを各ポイントの予測モデルの入力することで、各ユーザＩＤの全ポイントの所定の行動に至る行動確率を算出する。従って、本実施形態では、例えば、２０万件ずつ合計１００万件の学習データを使って予測モデルを構築した後、学習に使わなかったユーザＩＤも含めて、例えば、１０００万件のユーザＩＤの行動確率を算出することができる。これらの具体的な処理内容については、フローチャート等を用いて後述する。

また、行動履歴情報１３２を取得する段階において、各ポイントは、有効期間が重ならないように付与される。例えば、５００ポイントを付与した後に、当該５００ポイントの付与によってアイテムの購入に至ったのかどうかを判断するために、例えば、５００ポイントの失効期間を待ってから他の種類のポイントが付与される。なお、一人のユーザに対して全種類のポイントを付与せずに、上述したように、例えば、特定のポイントのみを付与する場合には、ポイントの失効期間等を考慮せずに任意のタイミングでポイントが付与されてよい。

また、行動履歴情報１３２には、ポイントを利用して購入されたアイテムの購入金額を示す情報が含まれていてもよい。図４は、行動履歴情報１３２の他の例を示す図である。図に例示する行動履歴情報１３２では、各ユーザＩＤに対して、複数種類のポイントのそれぞれをユーザに付与したときに、ユーザがアイテムを購入した場合、そのアイテムの購入金額を示す情報が対応付けられており、ユーザがアイテムを購入しなかった場合、ゼロ円が対応付けられている。なお、ポイントが使用された結果、アイテムがゼロ円で購入された場合、その旨を示すフラグなどが付与されてもよい。なお、上述した図３と同様に、図４においても、各ユーザＩＤに対して、５００ポイント、３００ポイント、１００ポイント、３ポイント、０ポイントの全種類のインセンティブを付与することで、各インセンティブにおいて購入の有無（購入／非購入）を示す情報が取得される必要はなく、一部のインセンティブのみを付与することで、特定のインセンティブについての購入の有無を示す情報のみが取得されてよい。

また、行動履歴情報１３２は、販売サイトでのアイテムの購入の有無を示す情報に限られず、上述したクレジットカード登録サイト、銀行口座開設サイト、プレミアム会員登録サイト、コンテンツ配信サイト、携帯電話キャリア契約サイト、プロバイダ契約サイト、金融商品取引サイトに対する所定の行動の有無を示す情報であってもよい。

図５は、行動履歴情報１３２の他の例を示す図である。図に例示する行動履歴情報１３２では、各ユーザＩＤに対して、ポイントごとに携帯電話キャリア契約サイトにおける契約の有無が対応付けられた情報である。

また、例えば、ポイントが付与されたユーザが所定の行動としてクレジットカードを新規に登録した場合、行動履歴情報１３２には、クレジットカードの登録の有無に加えて、更に、クレジットカードのランク（種類）を示す情報が含まれていてもよい。ランクは、例えば、ゴールドカード、プラチナカード、ブラックカードといったカードの格付けを表してよい。また、例えば、ポイントが付与されたユーザが所定の行動として銀行口座を開設した場合、行動履歴情報１３２には、銀行口座の開設の有無に加えて、更に、銀行口座のランク（種類）を示す情報が含まれていてもよい。この場合、ランクは、普通預金口座、定期預金口座、貯蓄預金口座等のように、口座ごとの支払われる金利の大きさなどを表してよい。

図６は、行動履歴情報１３２の他の例を示す図である。図に例示する行動履歴情報１３２では、ポイントが付与されたユーザがカードの新規登録や口座の新規開設といった所定の行動を起こした場合、そのユーザの行動対象にランクを示す情報が、各ユーザＩＤに対して対応付けられている。例えば、ポイントが付与されたユーザがブラックカードのクレジットカードを登録した場合、そのユーザのユーザＩＤには、「高ランク」が対応付けられ、プラチナカードのクレジットカードを登録した場合、「中ランク」が対応付けられ、ゴールドカードのクレジットカードを登録した場合、「低ランク」が対応付けられてよい。これらのランクは、購入金額のように数値換算されてもよい。

また、行動履歴情報１３２には、アイテムの購入時に利用されたポイントの利用額を示す情報が含まれていてもよい。図７は、行動履歴情報１３２の他の例を示す図である。図に例示する行動履歴情報１３２では、各ユーザＩＤに対して、複数種類のポイントのそれぞれをユーザに付与したときに、そのユーザが、付与されたポイントの一部または全部、或いは元々保有していたポイントの一部または全部を利用してアイテムを購入した場合、そのアイテムの購入時に利用されたポイントの利用額を示す情報が対応付けられている。また、行動履歴情報１３２は、ポイントの利用額に代えて、或いは加えて、ポイントの利用率がユーザＩＤに対応付けられていてもよい。ポイントの利用率は、例えば、ポイントの利用額に対するアイテムの購入金額の比率である。

図８は、素性情報１３４の一例を示す図である。図の例のように、素性情報１３４は、ポイントが付与されたユーザ（ユーザＩＤ）に対して、ユーザ属性を示す素性、ユーザ行動履歴を示す素性、およびポイントに関連した素性が対応付けられた情報である。

ユーザ属性を示す素性は、例えば、性別、年代（年齢）、ユーザＩＤの登録年月日、電子マネーのチャージ額、保有ポイント数などの各種素性を含む。ユーザＩＤの登録年月日は、サーバ装置２０によってユーザＩＤが発行された後に登録された年月日である。電子マネーのチャージ額は、販売サイトや販売サイトと提携したウェブサイトにおいて利用可能な電子マネーのチャージ残高を示す情報である。

ユーザ行動履歴を示す素性は、例えば、販売サイトなどの各ウェブサイト、或いはこれらのウェブサイトで提供されるサービスと同様のサービスを提供するアプリケーションの利用に関する素性や、各ウェブサイトを構成するウェブページや、アプリケーション用のページの閲覧に関する素性などを含む。以下、ウェブページとアプリケーション用のページとを区別しない場合、「電子ページ」と称して説明する。

ウェブサイトやアプリケーションに関する素性には、例えば、販売サイトでどのようなアイテムを購入等したのか否か、クレジットカード登録サイトでクレジットカードを登録したのか否か、銀行口座開設サイトで新規に口座を開設したのか否か、プレミアム会員登録サイトで新規に会員登録したのか否か、コンテンツ配信サイトでアカウント登録したのか否か、携帯電話キャリア契約サイトやプロバイダ契約サイトなどで新規に契約したのか否か、現在契約している携帯電話キャリアやプロバイダから他の携帯電話キャリアやプロバイダに契約先を変更したのか否か、金融商品取引サイトで金融商品をトレードしたのか否か、といった素性が含まれる。

また、例えば、ユーザが、クレジットカードの会員登録をしていたり、銀行口座を開設していたり、プレミアム会員を登録していたり、コンテンツ配信サイトでアカウント登録をしていたり、携帯電話キャリアやプロバイダと契約していたりした場合、ウェブサイトやアプリケーションに関する素性には、それらの登録、開設、契約が行われた日付からの経過日数や、契約更新月までの日数などを示す素性などが含まれてもよい。

また、電子ページの閲覧に関する素性には、例えば、上述したクレジットカード登録や銀行口座開設、プレミアム会員登録、アカウント登録、キャリアやプロバイダの契約などを、解消や解約するための電子ページにアクセスしたか否か、といった素性が含まれる。

ポイントに関連した素性は、過去にユーザに付与されたポイントに関する素性であり、例えば、ポイントの利用回数、ポイントの利用額、ポイントの獲得回数、ポイントの獲得額、ポイントの残高などの素性を含む。

図９は、ユーザ行動履歴の素性をより具体的に例示した図である。図示のように、例えば、ショッピングサイトの利用に関する素性には、購入回数、購入金額、購入月日、購入したアイテムのカテゴリ（例えばファッション、家電、食品など）等の素性が含まれる。また、オークションサイトの利用に関する素性には、入札回数、落札回数、出品回数等の素性が含まれる。また、クレジットカード登録サイトの利用に関する素性には、クレジットカードの登録有無、登録したカードの種類、限度額、登録した日付からの経過日数、契約更新月等の素性が含まれる。

また、電子ページの閲覧に関する素性には、例えば、ページビュー、ウェブページのアクセス日数、直近のアクセス日時、検索時に入力された検索クエリ（検索用のキーワード）等の素性が含まれる。例えば、ページビューは、検索サイトからの販売サイトへのアクセス数を表してもよいし、検索サイトから、販売サイトと異なる他のウェブサイト（例えばニュースサイトなど）へのアクセス数を表してもよい。また、ページビューは、検索サイトを介さずに、ウェブブラウザ等によって自動的に提供されたウェブサイトへのアクセス数を表してもよい。すなわち、ページビューは、ユーザが自発的にアクセスしたウェブサイトへのアクセス数と受動的にアクセスしたウェブサイトへのアクセス数を区別した指標であってよい。また、電子ページの閲覧に関する素性には、例えば、上述したクレジットカード登録や銀行口座開設、プレミアム会員登録、アカウント登録、キャリアやプロバイダの契約などを、解消または解約するための電子ページ（図中契約解消ページ）にアクセスしたか否か、といった素性が含まれる。

図１０は、予測モデル情報１３６の一例を示す図である。図示の例のように、予測モデル情報１３６は、各ポイントに対して、予測モデルが対応付けられた情報である。予測モデルとは、後述するモデル生成部１１４により生成されるパターン認識モデルである。

図１１は、アカウント情報１３８の一例を示す図である。図示の例のように、アカウント情報１３８は、ユーザごとに、ユーザＩＤ、パスワード、メールアドレス、ポイント残高などが互いに対応付けられた情報である。

以下、第１の実施形態における制御部１１０の各構成要素による処理をフローチャートに即して説明する。図１２は、第１の実施形態における制御部１１０による一連の処理の一例を示すフローチャートである。

まず、取得部１１２は、通信部１０２を介して、端末装置１０またはサーバ装置２０から、行動履歴情報１３２および素性情報１３４を取得し（Ｓ１００）、取得したこれらの情報を記憶部１３０に記憶させる。例えば、取得部１１２は、素性情報１３４に含まれる素性のうち、ユーザ属性を示す素性を端末装置１０から取得し、ユーザ行動履歴を示す素性をサーバ装置２０から取得し、ポイントに関連した素性を端末装置１０およびサーバ装置２０から取得し、各装置から取得した素性をユーザＩＤごとに合わせて一つの素性情報１３４としてもよい。

次に、モデル生成部１１４は、取得部１１２により取得された行動履歴情報１３２および素性情報１３４に基づいて、ポイントごとのユーザの行動傾向をモデル化した予測モデルを生成する（Ｓ１０２）。ユーザの行動傾向とは、例えば、販売サイトでどのようなアイテムを購入したのか、またはアイテムの購入にどの程度の金額を費やしたのかなどを表す。また、ユーザの行動傾向は、例えば、クレジットカード登録サイトや銀行口座開設サイト、プレミアム会員登録サイト、コンテンツ配信サイト、携帯電話キャリア契約サイト、プロバイダ契約サイト、金融商品取引サイトなどにおいて、所定の行動をとったか否かを表す。

例えば、モデル生成部１１４は、ＳＶＭ（Support Vector Machine）を用いて、素性情報１３４に含まれる複数の素性の一部または全部、あるいはそれらの組み合わせを要素とする特徴ベクトルを、ある特徴空間に分布させ、その特徴空間において各特徴ベクトルを正例または負例に分類する超平面（特徴空間の次元数から１低下した次元を有する空間）を導出する。なお、モデル生成部１１４は、素性に対して正規化処理を行って、特徴ベクトルの各要素の値のオーダーを揃えてもよい。

例えば、二値分類問題を、アイテムを購入するかどうかという問題と捉えた場合、正例は、ポイントが付与された後にアイテムを購入したユーザの素性を示す特徴ベクトルとなり、負例は、ポイントが付与された後にアイテムを購入しなかったユーザの素性を示す特徴ベクトルとなる。また、例えば、二値分類問題を、クレジットカードを新規登録するかどうかという問題と捉えた場合、正例は、ポイントが付与された後にクレジットカードの新規登録を行ったユーザの素性を示す特徴ベクトルとなり、負例は、ポイントが付与された後にクレジットカードの新規登録を行わなかったユーザの素性を示す特徴ベクトルとなる。特徴空間において超平面を表す関数は、予測モデルの一例である。

例えば、素性情報１３４に含まれる複数のユーザの素性のうち、半数程度のユーザの素性は、ＳＶＭにおける教師データ（正解データ）として扱われ、残りのユーザの素性は、学習データとして扱われる。教師データは、上述した超平面を導出するためのデータであり、学習データは、教師データにより導出された超平面によって正例負例のいずれかに分類される対象のデータである。

例えば、モデル生成部１１４は、各ポイントにおけるユーザの素性から、正例負例のいずれかに分離するための超平面を導出することで、５００ポイント、３００ポイント、１００ポイントといったように各ポイントでの予測モデル（超平面を示す関数）を生成する。

このとき、モデル生成部１１４は、学習データの正例と負例の比率を、教師データの正例と負例の比率と同程度（好ましくは同じ比率）にするように超平面を導出する。

そして、モデル生成部１１４は、教師データを用いて生成した各ポイントでの予測モデルに従って、学習データであるユーザの素性を正例負例のいずれかに分類し、分類した各素性のスコアを導出する（Ｓ１０４）。ここでのスコアは、例えば、予測モデルとして導出された超平面と、素性を示す特徴ベクトルとの間の距離を数値化した情報である。

図１３は、ポイントごとに導出されたスコアの一例を示す図である。図示の例のように、スコアは、各ユーザのポイントごとに導出される。例えば、ユーザＩＤ「ＡＢＣ０１」の５００ポイントにおけるスコア「０．４６５２８３」は、ユーザＩＤ「ＡＢＣ０１」に対応するユーザの素性から求められた複数の特徴ベクトルのそれぞれと、５００ポイントの予測モデルとして導出された超平面との間の距離を平均した値として導出される。

なお、モデル生成部１１４は、ＳＶＭの代わりに、ロジスティック回帰等の学習手法を用いて、ユーザ毎に各ポイントにおけるスコアを導出してもよい。この場合、スコアは、Ｗａｌｄ統計量（（標準誤差／回帰係数）＾２）またはＷａｌｄ統計量から求めた予測確率（所謂傾向スコアに相当する）などである。

また、モデル生成部１１４は、ＳＶＭを用いてニ値分類問題（正例または負例のいずれかに分類する問題）を解くことで、学習データをスコア化するものとしたがこれに限られない。例えば、モデル生成部１１４は、図５に示す行動履歴情報１３２を参照して、各ユーザのポイントごとの購入金額を予測モデルにモデル化することで、各ポイントでのスコアを導出してもよい。より具体的には、モデル生成部１１４は、図４に示す行動履歴情報１３２に含まれる各ユーザのポイントごとの購入金額を教師データとして扱って重回帰分析を行い、教師データの購入金額をモデル化する。そして、モデル生成部１１４は、学習データの購入金額を、重回帰分析によって教師データから導出された予測モデルに近似させることで、学習データの購入金額を評価したスコアを導出する。この場合、スコアは、重回帰分析により求められる購入金額である。

また、モデル生成部１１４は、図６に示す行動履歴情報１３２を参照して、各ユーザのポイントごとのランクを数値に換算し、その換算した数値を予測モデルにモデル化することで、各ポイントでのスコアを導出してもよい。

また、モデル生成部１１４は、図７に示す行動履歴情報１３２を参照して、各ユーザのポイントごとの、アイテム購入時に利用されたポイントの利用額や利用率を数値に換算し、その換算した数値を予測モデルにモデル化することで、各ポイントでのスコアを導出してもよい。

次に、確率予測部１１６は、過去のユーザの行動実績に基づいて、目的関数ｆを最適化にするためのユーザの行動確率を予測する（Ｓ１０６）。目的関数ｆは、例えば、オークションサイトや、ショッピングサイト、ブックストアサイト、動画配信サイト、トラベルサイトといった、ウェブサイトやアプリケーションを介して（媒体として）提供される複数のサービスのうち、あるターゲットとするサービスを利用して、ポイントが付与されたユーザが所定の行動に至る行動確率と、複数のサービスのうち、ターゲットとするサービス以外の他のサービスを利用して、ポイントが付与されたユーザが所定の行動に至る行動確率との差分に基づく関数である。ターゲットとするサービスは、例えば、他のサービスに比して集客力の弱いサービスであり、具体的には、オークションなどである。また、ターゲットとするサービスは、集客力を考慮せずに、単に、他のサービスよりも利用者の数などを増加させることを目的として決められてもよい。なお、ターゲットとするサービスは、オークションやショッピングなどのアイテムの売買の場を提供するものであり、アイテムの一例であるサービス（購入や契約などの所定の行動の直接的な対象となるサービス）とは異なるものである。

例えば、ターゲットとするサービスをオークションとする場合、目的関数ｆは、数式（１）によって表されてよい。式中のΣは、括弧内の式を各ポイントについて求め、更にポイントごとに求めた値の総和を求めることを表している。

確率予測部１１６は、数式（１）に示すように、各ユーザに付与されたポイントごとに、オークションサイトでのアイテムの落札確率と、オークション以外の他のサービス（例えばショッピングサイトやブックストアサイト）でのユーザの所定の行動の行動確率との差分を導出し、それらの差分の総和を導出する。例えば、５００ポイント、３００ポイント、１００ポイント、３ポイント、０ポイントが其々付与されている場合、確率予測部１１６は、５００ポイント、３００ポイント、１００ポイント、３ポイント、０ポイントの其々について、オークションサイトでのアイテムの落札確率と、オークション以外の他のサービスでのユーザの所定の行動の行動確率との差分を求める。

そして、確率予測部１１６は、ポイントごとに求めたサービス間の行動確率の差分の総和を全て足し合わせものを、目的関数ｆとして導出する。例えば、ターゲットとするサービスを除く他のサービスの数がＫ個である場合、サービス間の行動確率の差分の総和は、Ｋ個導出される。この場合、確率予測部１１６は、Ｋ個の行動確率の差分の総和を全て足し合わせて目的関数ｆとする。

また、目的関数ｆは、数式（１）の代わりに数式（２）によって表されてもよい。

また、目的関数ｆは、数式（１）や（２）のように、ユーザの所定の行動に至る行動確率の差分に基づく関数であることに限られない。例えば、目的関数ｆは、ポイントが付与されたユーザが、ターゲットとするサービスを利用して所定の行動に至った場合にもたらされた成果と、ターゲットとしないサービスを利用して所定の行動に至った場合にもたらされた成果との差分に基づく関数であってもよい。所定の行動に至った場合にもたらされた「成果」は、例えば、所定の行動がアイテムの購入であれば、上述したようにアイテムの購入金額のような金銭的な成果であってよい。また、例えば、「成果」は、所定の行動が金融商品のトレードであれば、トレード回数であってよく、所定の行動が携帯電話のキャリア契約であれば、携帯電話会社が提供するサービスの利用期間（サービス契約継続期間）であってもよい。目的関数ｆが成果に基づく関数である場合、例えば、目的関数ｆは、数式（３）によって表されてよい。

例えば、確率予測部１１６は、数式（３）に示すように、各ユーザに付与されたポイントごとに、オークションサイトでのアイテムの落札金額と、ショッピングサイトやブックストアサイトでのアイテムの購入金額との差分を導出し、それらの差分の総和を導出する。そして、確率予測部１１６は、ポイントごとに求めたサービス間の落札金額と購入金額との差分の総和を全て足し合わせものを、目的関数ｆとして導出する。

また、目的関数ｆは、ポイントを付与されたユーザが、ターゲットとするサービスを利用して所定の行動に至った場合に、その行動に伴って利用されたポイントの利用率と、ターゲットとするサービス以外の他のサービスを利用して所定の行動に至った場合に、その行動に伴って利用されたポイントの利用率との差分に基づく関数であってもよい。この場合、例えば、目的関数ｆは、数式（４）によって表されてよい。

例えば、確率予測部１１６は、数式（４）に示すように、各ユーザに付与されたポイントごとに、オークションサイトでアイテムを落札した時に利用されたポイントの利用率（例えばポイント利用額／落札金額）と、ショッピングサイトやブックストアサイトでアイテムを購入した時に利用されたポイントの利用率との差分をポイントごとに導出し、それらの差分の総和を導出する。そして、確率予測部１１６は、ポイントごとに求めたサービス間のポイント利用率の差分の総和を全て足し合わせものを、目的関数ｆとして導出する。

また、目的関数ｆは、ポイントを付与されたユーザが、ターゲットとするサービスを利用して所定の行動に至った場合に、その行動に伴って利用されたポイントの利用額と、ターゲットとするサービス以外の他のサービスを利用して所定の行動に至った場合に、その行動に伴って利用されたポイントの利用額との差分に基づく関数であってもよい。この場合、例えば、目的関数ｆは、数式（５）によって表されてよい。

例えば、確率予測部１１６は、数式（５）に示すように、各ユーザに付与されたポイントごとに、オークションサイトでアイテムを落札した時に利用されたポイントの利用額と、ショッピングサイトやブックストアサイトでアイテムを購入した時に利用されたポイントの利用額との差分を導出し、それらの差分の総和を導出する。そして、確率予測部１１６は、ポイントごとに求めたサービス間のポイント利用額の差分の総和を全て足し合わせものを、目的関数ｆとして導出する。

また、目的関数ｆは、上述した数式（１）〜（５）に代えて、数式（６）〜（９）のいずれかによって表されてもよい。数式（６）〜（９）は、ウェブサイトやアプリケーションを介して（媒体として）提供される複数のサービスのうち、あるターゲットとするサービス（式中の例ではオークション）に関する一つの指標値と、ターゲットとしない複数の他のサービスの中で最も値が大きい指標値との差分を各ポイントごとに導出し、更にポイントごとに導出した差分を全て足し合わせた総和を表している。なお、数式（１）〜（９）はあくまでも一例であり、適時種々の変更を加えてよい。

また、目的関数ｆは、上述した購入確率や購入金額、ポイント利用率、ポイント利用額以外にも、オークションの落札者数、入札者数、出品者数、落札合計金額、入札合計金額並びに出品合計金額や、クレジットカードの新規登録数並びに登録解消数、銀行口座の新規開設数並びに口座解約数、プレミアム会員の新規獲得数並びに会員登録解消数、コンテンツ配信サイトにおける新規アカウント登録数並びにアカウント解約数、携帯電話キャリアやインターネットプロバイダの新規契約数、解約数並びに契約継続月数、金融商品のトレード（売買）回数並びにトレード金額、といった種々の指標値の差分に基づく関数であってもよい。

確率予測部１１６は、上述した目的関数ｆが最適となるようなユーザの行動確率を予測する。例えば、所定の行動がアイテムの購入であり、目的関数ｆが数式（１）に示すようなサービス間での購入（落札）確率の差分に基づく関数である場合、確率予測部１１６は、目的関数ｆが最大化するようなユーザの行動確率を予測する。

より具体的には、確率予測部１１６は、モデル生成部１１４により導出された各ユーザのポイントごとのスコアと、教師データの正例および負例の比率とに基づいて、ユーザの将来の行動傾向を表す確率密度関数を予測する。この確率密度関数は、各ユーザのポイントごとのスコアを変数として、ユーザの将来の行動確率を返す関数である。例えば、予測される確率密度関数は、スコアが増加するのに応じて確率が１に近づくと共に、スコアが減少するのに応じて確率が０に近づく奇関数である。このような関数は、例えば、シグモイド関数や、ステップ関数、一次関数、アークタンジェント関数、その他の多項式関数などである。以下、一例として、ユーザの将来の行動傾向を表す確率密度関数を、数式（１０）に示すシグモイド関数であるものとして説明する。

数式（１０）のＳＶＭＳｃｏｒｅは、モデル生成部１１４により導出された各ユーザのポイントごとのスコアを表している。また、パラメータＡは、ＳＶＭＳｃｏｒｅに応じて変動する行動確率Ｐの増加または減少の程度の大きさを表し、パラメータＢは、シグモイド関数をＳＶＭＳｃｏｒｅ軸方向に平行移動（シフト）させる成分を表している。

以下、ユーザの将来の行動傾向を表す確率密度関数の導出方法について説明する。図１４は、ある期間において、販売サイトを利用した全ユーザの購入履歴に関する情報を示す図である。図示の獲得率［％］（＝Ａ）は、付与されたポイントがユーザの意思によってどの程度獲得されたのかを表す指標である。例えば、獲得率は、ポイントが付与されることが、ウェブサイト上で不特定多数向けに通知されたり、電子メールやダイレクトメール、プッシュ通知などによって個別に通知されたりしたユーザのうち、その通知の案内に従ってポイントを受け取ったユーザの人数の割合を示している。すなわち、獲得率は、ポイント付与の候補としてカウントされたユーザのうち、実際にポイントを受け取ったユーザの人数の割合を示している。また、購入率［％］（＝Ｂ）は、ポイントを獲得した全ユーザのうち、そのポイントが失効するまでの期間に販売サイトなどでアイテムを購入したユーザの人数の割合を表している。なお、所定の行動の対象先がクレジットカード登録サイトや、銀行口座開設サイトなどである場合、購入率は、登録率や開設率などに置き換わってよい。

例えば、確率予測部１１６は、シグモイド関数により返される行動確率Ｐの平均値が、上述した図１４における購入率（＝Ｂ）と等しくなるように、数式（１０）のパラメータＡを決定する。

図１５は、パラメータＡの決定方法を模式的に示す図である。図示の（ａ）から（ｃ）のように、確率予測部１１６は、パラメータＡの大きさを変更しながら、シグモイド関数により返される行動確率Ｐの平均値が、購入率（＝Ｂ）と等しくなるパラメータＡを探索する。図示のように、パラメータＡを探索することは、ＳＶＭＳｃｏｒｅ軸方向にシグモイド関数を拡縮することを意味する。すなわち、パラメータＡを探索することは、シグモイド関数の分散の度合を変更することを意味する。

なお、数式（１０）におけるパラメータＢは、ＳＶＭにおける学習データの正例と負例の比率と、教師データの正例と負例の比率とを同程度にする際に、モデル生成部１１４によって好適な値に決定される。

図１６は、パラメータＢの決定方法を模式的に示す図である。例えば、図示のように、ＳＶＭによる学習段階において、教師データの正例と負例の比率が１５：８５であった場合、モデル生成部１１４は、学習データの正例と負例の比率を１５：８５に近づけるようにパラメータＢを設定する。すなわち、パラメータＢを決定することは、特徴空間内において超平面（図中ＨＰ）の位置を動かしながら、正例と負例の数を調整することを意味する。

このようにして、確率予測部１１６は、シグモイド関数のような確率密度関数を予測し、この予測した関数に、モデル生成部１１４により導出されたスコアを代入することで、ユーザの将来の行動確率（図１４の例ではアイテムの購入確率）を予測する。

図１７は、スコアから将来の行動確率を導出する様子を示す図である。図示のように、確率予測部１１６は、ユーザ（ユーザＩＤ）ごとに、各ポイントのスコア（図示の例では、ＳＶＭによるスコア）を、シグモイド関数のような確率密度関数に従って行動確率に変換する。一般的に、単にＳＶＭやロジスティック回帰等の学習手法を適用して得られたスコアを確率とした場合、その確率を示す確率密度分布では、局所的に解が集まって分布する傾向があることが知られている。これに対して、本実施形態では、単に予測モデルのスコアを行動確率とするのではなく、ニューラルネットワークなどを利用した機械学習の分野において実際の事象を表すのに利用されているシグモイド関数のような確率密度関数にスコアをフィッティングさせることによって、ｅコマースの分野においても実際の事象によりマッチした確率分布を得ることができる。例えば、シグモイド関数により返される行動確率の平均値が、実際の過去の購入率と等しくなるように上述したパラメータＡを探索することによって、シグモイド関数がＳＶＭＳｃｏｒｅ軸方向に拡縮するため、解が局所的に集まった場合でも実際の事象に合わせながら確率分布を分散させることができる。この結果、精度良く将来の行動確率を予測することができる。

ここで、図１２のフローチャートの説明に戻る。次に、付与ポイント決定部１１８は、確率予測部１１６により予測された、ユーザごとの各ポイントでの行動確率に基づいて、ポイントを付与可能な予算内で、上述した目的関数ｆを最大化にするように各ユーザに割り振るポイントの配分を決定する（Ｓ１０８）。

例えば、付与ポイント決定部１１８は、整数計画法を用いて、ポイントを付与可能な予算内で、目的関数ｆを最大化にするように各ユーザに割り振るポイントの配分を決定する。本実施形態における整数計画法とは、ポイントの種類ｎ（本実施形態では、ｎ＝５）分のベクトル成分を要素ｅとしてもつ高次元ベクトル（以下、ポイント配分用ベクトルＶと称する）を、各ユーザのポイントごとの行動確率（販売サイトの場合、購入確率）に乗算することで、予め決められた制約条件を満たし、且つ目的関数ｆが最大となる解（ユーザに割り振るポイントの組み合わせ）を探す処理をいう。ポイント配分用ベクトルＶの要素ｅは、１または０のいずれか一方の値をとり、全ての要素の和は１となる。言い換えれば、ポイント配分用ベクトルＶの要素ｅは、いずれか一つの要素だけが１の値をとり、それ以外の要素の値は０となる。

制約条件とは、例えば、以下の条件を含む。
（１）付与可能なポイントの予算内に、付与するポイントの総額を収めること（予算≦付与ポイントの総額）。
（２）ポイント配分用ベクトルＶの要素ｅが、１または０のいずれか一方の整数をとること。
（３）ポイント配分用ベクトルＶの要素ｅは、全ての要素の和が１となること。
（４）（ｉ）ターゲットとするサービスを利用して所定の行動に至る行動確率が、ターゲットとしないサービスを利用して所定の行動に至る行動確率よりも大きいこと、（ｉｉ）ターゲットとするサービスを利用して所定の行動に至った場合に得られる成果が、ターゲットとしないサービスを利用して所定の行動に至った場合に得られる成果よりも大きいこと、（ｉｉｉ）ターゲットとするサービスを利用して所定の行動に至った場合の所定の行動に伴うインセンティブの利用結果が、ターゲットとしないサービスを利用して所定の行動に至った場合の所定の行動に伴うインセンティブの利用結果よりも大きいこと、のいずれかを満たすこと。

例えば、（ｉ）の条件は、数式（１１）または（１２）によって表現され、（ｉｉ）の条件は、数式（１３）または（１４）によって表現され、（ｉｉｉ）の条件は、数式（１５）から（１８）によって表現される。各数式のａ、ｂ、ｃ、…は、任意の定数である。

例えば、付与ポイント決定部１１８は、目的関数ｆとして上述した数式（１）または（２）を用いる場合、ユーザに割り振るポイントの候補となる複数の組み合わせの中から、制約条件として（１）〜（３）の条件を満たすと共に、（４）の（ｉ）の条件を表す数式（１１）または数式（１２）を満たす組み合わせを最適解として選択する。例えば、数式（１１）に示す制約条件は、オークションサイトでのアイテムの落札（購入）確率が、ショッピングサイトでのアイテムの購入確率に定数ａを乗算した確率よりも大きく、且つブックストアサイトでの電子書籍の購入確率に定数ｂを乗算した確率よりも大きく、且つその他サイトでのアイテムの購入確率に任意の定数ｃを乗算した確率よりも大きいことを表している。

また、付与ポイント決定部１１８は、目的関数ｆとして上述した数式（３）を用いる場合、ユーザに割り振るポイントの候補となる複数の組み合わせの中から、制約条件として（１）〜（３）の条件を満たすと共に、（４）の（ｉｉ）の条件を表す数式（１３）または数式（１４）を満たす組み合わせを最適解として選択する。例えば、数式（１３）に示す制約条件は、オークションサイトでのアイテムの落札（購入）金額が、ショッピングサイトでのアイテムの購入金額に定数ａを乗算した金額よりも大きく、且つブックストアサイトでの電子書籍の購入金額率に定数ｂを乗算した金額よりも大きく、且つその他サイトでのアイテムの購入金額に任意の定数ｃを乗算した金額よりも大きいことを表している。

また、付与ポイント決定部１１８は、目的関数ｆとして上述した数式（４）を用いる場合、ユーザに割り振るポイントの候補となる複数の組み合わせの中から、制約条件として（１）〜（３）の条件を満たすと共に、（４）の（ｉｉｉ）の条件を表す数式（１５）または数式（１６）を満たす組み合わせを最適解として選択する。例えば、数式（１５）に示す制約条件は、オークションサイトでのアイテムの落札（購入）時に利用されたポイントの利用率が、ショッピングサイトでのアイテムの購入時に利用されたポイントの利用率に定数ａを乗算した値よりも大きく、且つブックストアサイトでの電子書籍の購入時に利用されたポイントの利用率に定数ｂを乗算した値よりも大きく、且つその他サイトでのアイテムの購入時に利用されたポイントの利用率に任意の定数ｃを乗算した値よりも大きいことを表している。

また、付与ポイント決定部１１８は、目的関数ｆとして上述した数式（５）を用いる場合、ユーザに割り振るポイントの候補となる複数の組み合わせの中から、制約条件として（１）〜（３）の条件を満たすと共に、（４）の（ｉｉｉ）の条件を表す数式（１７）または数式（１８）を満たす組み合わせを最適解として選択する。例えば、数式（１７）に示す制約条件は、オークションサイトでのアイテムの落札（購入）時に利用されたポイントの利用額が、ショッピングサイトでのアイテムの購入時に利用されたポイントの利用額に定数ａを乗算した値よりも大きく、且つブックストアサイトでの電子書籍の購入時に利用されたポイントの利用額に定数ｂを乗算した値よりも大きく、且つその他サイトでのアイテムの購入時に利用されたポイントの利用額に任意の定数ｃを乗算した値よりも大きいことを表している。

なお、プロセッサの処理能力に制限がある場合、付与ポイント決定部１１８は、全ユーザ数のデータの一部のデータについて目的関数ｆの最適解を求める処理を行って、一部データの処理結果を全データの処理結果として扱ってもよい。一部のデータとは、例えば、統計学的に十分信頼できる程度のサンプル数（ユーザ数）を含むデータである。具体的には、全ユーザ数が１千万人程度であれば、一部のデータに、５０万人程度のユーザ数が含まれていればよい。

また、付与ポイント決定部１１８は、更に、整数計画法の一手法として、線形計画緩和の手法を用いて、割り振るポイントの配分の最適解を求めてもよい。本実施形態における線形計画緩和とは、上述したポイント配分用ベクトルＶの要素ｅを、０から１の間において取り得る小数（例えば０．５など）として扱いながら、ポイントごとの最適解を探し、最終的な計算過程において、解が整数であるという条件を追加して、小数となっている変数（例えば行動確率×要素値）を整数に変換し、変換した整数のうち、最も大きい整数を最適解として求める手法である。このとき、個々の要素が小数であっても要素の和は１であるものとする。

図１８は、線形計画緩和を説明するための図である。図示のように、例えば、５００、３００、１００、３、０の計５種類のポイントを付与した場合、付与ポイント決定部１１８は、ユーザＩＤごとに、上記５種類のポイントごとの行動確率を求め、最適化計算を行って、最適化する過程で求めた変数（行動確率×要素値）が極端に小さくなったり、要素値が０に近似できる程度に小さくなったりする場合には、そのポイントは考慮せずに残りのポイントで再度、最適化計算を行う。

より具体的には、５００ポイントの行動確率Ｐ１に乗算するベクトル要素ｅ１の値が０．３０、３００ポイントの行動確率Ｐ２に乗算するベクトル要素ｅ２の値が０．２０、１００ポイントの行動確率Ｐ３に乗算するベクトル要素ｅ３の値が０．２９、３ポイントの行動確率Ｐ４に乗算するベクトル要素ｅ４の値が０．０１、０ポイントの行動確率Ｐ５に乗算するベクトル要素ｅ５の値が０．２０であった場合、付与ポイント決定部１１８は、３ポイントを付与することは考慮せずに、残りの５００ポイント、３００ポイント、１００ポイント、０ポイントで再度、最適化計算を行う。これによって、残りのポイントに対するベクトル要素ｅの配分比率を変更することができる。なお、いずれかのポイントに配分するベクトル要素ｅの値が０であった場合、再度の計算は省略してよい。なお、図１８の例において、いずれかのベクトル要素ｅは０であってもよい。この場合、付与ポイント決定部１１８は、このベクトル要素ｅが乗算される対象のポイントを、最適化計算の対象から除外してよい。

また、上述した例では、５００、３００、１００、３、０の計５種類のポイントが用意されているものとして説明したがこれに限られない。例えば、４００ポイントや２００ポイントといった他の種類のポイント（過去に付与したことがないポイント）を追加してもよいし、上記いずれかを省略してもよい。

また、過去に付与したことがないポイント（例えば４００ポイントや２００ポイントなど）の行動確率については、線形補完や直線近似補完、曲線近似補完などを行うことで補完してもよい。例えば、付与ポイント決定部１１８は、未付与の２００ポイントの行動確率を、線形補完を行って推定する場合、３００ポイントの行動確率と、１００ポイントの行動確率との平均を、未付与の２００ポイントの行動確率として導出してよい。

これによって、付与ポイント決定部１１８は、過去に付与されたことがないポイントとして、例えば、４５０、３５０、２５０、５０、３、０ポイントといった種々のポイントを組み合わせて目的関数ｆを最適化（例えば最大化）する処理を繰り返し行い、最適なポイントの組み合わせを探索することができる。上述した例のように、実際に付与されたことがあるポイントとして、５００、３００、１００、３、０ポイントの履歴しかない場合においても、これらの５種類のポイントのそれぞれの予測モデルに従って導出された５つの行動確率を用いて、過去に付与されたことがないポイントを線形補完等によって求めることができる。例えば、付与ポイント決定部１１８は、０ポイントを下限とし、５００ポイントを上限とした範囲の中でとりうるすべての自然数（０、１、２、３、…、４９９、５００）をポイントとして扱い、これらの５０１種類のポイントに対応した行動確率を線形補完等によって求める。そして、付与ポイント決定部１１８は、ユーザＩＤごとに、５０１種類のポイントの中から目的関数ｆを最大化し、且つ制約条件を満たすポイントを選択して、選択したポイントをユーザに付与することを決定する。この場合、ポイント配分用ベクトルＶの要素ｅの要素数は５０１個であり、いずれか１個の要素の値だけ１となる。なお、補完によって補うポイントの種類は、５０１個に限らず、例えば、上記０から５００までの範囲において５刻みの１０１種類（０、５、１０、…、４９５、５００）にしてもよい。

また、付与ポイント決定部１１８は、５００、３００、１００、３、０の各ポイントの行動確率と、各ポイント値とを、最小二乗法などを用いて、ポイント値を変数として行動確率を返す近似関数を導出してもよい。この場合、付与ポイント決定部１１８は、導出した関数に未付与のポイント値を代入することで、その未付与のポイントに対応した行動確率を求めてよい。

このようにして、線形補完や直線近似補完などによって、過去に付与されたことがないポイントに対応する行動確率を推定することができる。この結果、過去に付与されたことがない種類のポイント（額の異なるポイント）を今回新たに付与しようとする場合、新たな種類のポイントをユーザに付与することを想定した場合の目的関数ｆが最大になるように、付与するポイントの好適な組み合わせを導出することができる。

また、付与ポイント決定部１１８は、線形計画緩和手法の他に、例えば、ラグランジュ緩和手法を用いてもよいし、アニーリング法、タブー探索法、ランダム多スタート局所最適化法、遺伝的アルゴリズムなどのヒューリステクス手法を用いることで、購入者数または購入金額などの目的関数を最適化にするように各ユーザに割り振るポイントの配分を決定してよい。

次に、付与ポイント決定部１１８は、整数計画法を用いて決定したポイントが付与されたことを示す案内を、通信部１０２を介してユーザに通知する（Ｓ１１０）。例えば、付与ポイント決定部１１８は、アカウント情報１３８を参照して、ユーザＩＤに対応付けられたメールアドレスに電子メールを送信することで、ポイント付与の案内をユーザに通知する。このメールには、例えば、ポイントを受け取ることが可能なウェブサイトへのＵＲＬ（Uniform Resource Locator）が記載されている。このＵＲＬ先のウェブサイトは、例えば、販売サイトで使用されるユーザＩＤを入力することでログインがなされるウェブサイトであってよい。例えば、ユーザは、端末装置１０を操作して、このＵＲＬから所定のウェブサイトにアクセスすると、ログイン時に入力されたユーザＩＤに対して割り振られたポイントが付与される。これによって、アカウント情報１３８において、ユーザＩＤに対応するポイント残高に、付与されたポイントが加算される。なお、付与ポイント決定部１１８は、電子メールの代わりに、プッシュ通知などによってユーザが操作可能な端末装置１０に案内を通知してもよいし、ユーザが販売サイトにおいて予め設定した住所にダイレクトメールを郵送したりすることで、案内を通知してもよい。なお、付与ポイント決定部１１８は、ユーザごとに決定した最適なポイントを、ユーザの受け取る意思に関わらず付与し、事後的に、ポイントが付与されたことをメール等でユーザに通知してもよい。

以上説明した第１の実施形態によれば、互いに異なる複数のサービスのうちターゲットとするサービスを利用して所定の行動に至りやすい対象ユーザに対して、複数のサービス間において利用可能な複数のインセンティブのうち、いずれか一つ以上のインセンティブを付与することを決定するため、効果的にインセンティブを付与することができる。

例えば、オークションやショッピングなどの互いに異なる複数のサービス間で共通のポイントが相互に利用可能な場合、それらの複数のサービス間で集客力に差異があると、ターゲットとするサービスにおいてユーザにポイントを付与しても、そのターゲットのサービスの集客力が他のサービスよりも弱ければ、付与したポイントが集客力のより強い他のサービスで利用されてしまい、ターゲットのサービスを介してアイテムの購入などを促す目的が達成されず、ポイントを付与することが無駄になってしまう場合がある。

また、単に、ターゲットのサービスを介して所定の行動に至りやすいユーザ（例えば、オークションで落札確率の高いユーザ）にポイントを付与しても、そのユーザが他のサービスでも所定の行動に至りやすい（例えば、ショッピングでの購入確率も高い）場合、ターゲットのサービスで付与したポイントが他のサービスで利用されてしまう場合がある。

これに対して、本実施形態では、例えば、ターゲットとするサービスでの所定の行動の行動確率と、ターゲットとしない他のサービスでの所定の行動の行動確率との差分に基づく関数を目的関数ｆとし、その目的関数ｆが最大となるように、ポイントを付与するユーザを決定するため、ターゲットとするサービスに対しては所定の行動に至りにくく、ターゲットとしないサービスに対しては所定の行動に至りやすいユーザや、ターゲットとするサービスとターゲットとしないサービスとの双方で所定の行動に至りやすいユーザについては、ポイントを付与する対象から除外することができる。この結果、効果的にインセンティブを付与することができる。

また、上述した第１の実施形態によれば、性別、年齢、住所といったユーザの属性を素性として予測モデルを生成するため、例えば、男性の方がオークションの利用頻度が高いといった傾向があった場合、その傾向を予測モデルに反映することができるため、オークション利用者のうち、男性利用者の方がより多くのポイントを付与するといった運用を行うことができる。

＜第２の実施形態＞
以下、第２の実施形態について説明する。上述した第１の実施形態では、互いに異なる複数のサービスのうちターゲットとするサービスを利用して所定の行動に至りやすい対象ユーザに対してインセンティブを付与するものとして説明した。これに対して、第２の実施形態では、互いに異なる複数の商品またはサービスのうちターゲットとする商品またはサービスについて所定の行動に至りやすい対象ユーザに対してインセンティブを付与する点で上述した第１実施形態と相違する。ターゲットとする商品またはサービス（すなわちアイテム）とは、例えば、複数のアイテムのうち、特定のカテゴリのアイテム、または特定の金額帯（価格帯）のアイテムである。以下、第１の実施形態との相違点を中心に説明し、第１の実施形態と共通する点については説明を省略する。なお、第２の実施形態の説明において、第１の実施形態と同じ部分については同一符号を付して説明する。

第２の実施形態における目的関数ｆは、例えば、ポイントが付与されたユーザが、ターゲットとするアイテムについて所定の行動に至る行動確率と、ターゲットとしないアイテムについて所定の行動に至る行動確率との差分に基づく関数である。

例えば、ターゲットとするアイテムを、特定の金額帯Ａのアイテムとする場合、目的関数ｆは、数式（１９）によって表されてよい。特定の金額帯Ａは、例えば、ユーザに付与したポイントの利用額よりも大きい金額帯である。より具体的には、５００円相当の５００ポイントを付与した場合、特定の金額帯Ａは、５０１円以上の金額帯となる。また、特定の金額帯Ａは、付与したポイントの利用額に関わらず、単に、○○円以上、といったように予め決められた金額帯であってもよい。

第２の実施形態における確率予測部１１６は、数式（１９）に示すように、各ユーザに付与されたポイントごとに、ターゲットとする金額帯Ａでのアイテムの購入確率と、その他金額帯（例えば金額帯ＢやＣ、Ｄ）でのアイテムの購入確率との差分とを導出し、それらの差分の総和を導出する。例えば、金額帯Ａを０円から１０００円までとした場合、金額帯Ｂを、１００１円から５０００円までとし、金額帯Ｃを、５００１円から１００００円までとし、金額帯Ｄを、１０００１円から５００００円までとする、といったように決めてよい。例えば、５００ポイント、３００ポイント、１００ポイント、３ポイント、０ポイントが其々付与されている場合、確率予測部１１６は、５００ポイント、３００ポイント、１００ポイント、３ポイント、０ポイントの其々について、ターゲットとする金額帯Ａでのアイテムの購入確率と、その他金額帯でのアイテムの購入確率との差分との差分を求める。そして、確率予測部１１６は、ポイントごとに求めた互いに異なる金額帯間の行動確率の差分の総和を全て足し合わせものを、目的関数ｆとして導出する。

なお、数式（１９）では、特定の金額帯のアイテムをターゲットのアイテムとしているがこれに限られず、例えば、特定のカテゴリのアイテムをターゲットのアイテムとした数式であってよい。特定のカテゴリは、例えば、商品券や旅行券、金券といった換金性の高いアイテムが分類されるカテゴリ以外のカテゴリであってよいし、継続して購入されやすいカテゴリ（例えば日用品や食料品など）であってもよい。この場合、例えば、数式（１９）において、ターゲットとする金額帯Ａのアイテムの購入確率を、ターゲットとするカテゴリＡのアイテムの購入確率、ターゲットとしない金額帯Ｂ、Ｃ、Ｄ、…のアイテムの購入確率を、ターゲットとしないカテゴリＢ、Ｃ、Ｄ、…のアイテムの購入確率と読み替えてよい。

また、第２の実施形態における目的関数ｆは、ポイントが付与されたユーザが、ターゲットとするアイテムについて所定の行動に至った場合に得られる成果と、ターゲットとしないアイテムについて所定の行動に至った場合に得られる成果との差分に基づく関数であってもよい。第２の実施形態における「成果」は、例えば、所定の行動がアイテムの購入であれば、第１の実施形態と同様に、アイテムの購入金額のような金銭的な成果であってよい。この場合、例えば、数式（１９）において、第１の実施形態において例示した数式（３）のように、ターゲットとする金額帯Ａのアイテムの購入確率を、ターゲットとする金額帯Ａのアイテムの購入確率、ターゲットとしない金額帯Ｂ、Ｃ、Ｄ、…のアイテムの購入確率を、ターゲットとしない金額帯Ｂ、Ｃ、Ｄ、…のアイテムの購入金額と読み替えてよい。

また、第２の実施形態における目的関数ｆは、ポイントが付与されたユーザが、ターゲットとするアイテムについて所定の行動に至った場合に、その行動に伴って利用されたポイントの利用率と、ターゲットとしない他のアイテムについて所定の行動に至った場合に、その行動に伴って利用されたポイントの利用率との差分に基づく関数であってもよい。この場合、例えば、数式（１９）において、第１の実施形態において例示した数式（４）のように、ターゲットとする金額帯Ａのアイテムの購入確率を、ターゲットとする金額帯Ａのアイテムの購入時に利用されたポイントの利用率、ターゲットとしない金額帯Ｂ、Ｃ、Ｄ、…のアイテムの購入確率を、ターゲットとしない金額帯Ｂ、Ｃ、Ｄ、…のアイテムの購入時に利用されたポイントの利用率と読み替えてよい。

なお、目的関数ｆは、ポイントの利用率に限られず、ポイントの利用額であってもよい。この場合、例えば、数式（１９）において、第１の実施形態において例示した数式（５）のように、ターゲットとする金額帯Ａのアイテムの購入確率を、ターゲットとする金額帯Ａのアイテムの購入時に利用されたポイントの利用額、ターゲットとしない金額帯Ｂ、Ｃ、Ｄ、…のアイテムの購入確率を、ターゲットとしない金額帯Ｂ、Ｃ、Ｄ、…のアイテムの購入時に利用されたポイントの利用額と読み替えてよい。

第２の実施形態における確率予測部１１６は、上述した目的関数ｆが最適となるようなユーザの行動確率を予測する。例えば、所定の行動がアイテムの購入であり、目的関数ｆが数式（１９）に示すようなアイテム間での購入確率の差分に基づく関数である場合、確率予測部１１６は、目的関数ｆが最大化するようなユーザの行動確率を予測する。

また、第２の実施形態では、第１の実施形態において例示した制約条件の（４）が、（ｉ）ターゲットとするアイテムについて所定の行動に至る行動確率が、ターゲットとしないアイテムについて所定の行動に至る行動確率よりも大きいこと、（ｉｉ）ターゲットとするアイテムについて所定の行動に至った場合に得られる成果（例えば購入金額など）が、ターゲットとしないアイテムについて所定の行動に至った場合に得られる成果よりも大きいこと、（ｉｉｉ）ターゲットとするアイテムについて所定の行動に至った場合の所定の行動に伴うインセンティブの利用結果（例えば、ポイントの利用率や利用額）が、ターゲットとしないアイテムについて所定の行動に至った場合の所定の行動に伴うインセンティブの利用結果よりも大きいこと、のいずれかを満たすという条件である。

例えば、ターゲットとするアイテムを特定の金額帯のアイテムとし、目的関数ｆとして上述した数式（１９）を用いる場合、第２の実施形態における付与ポイント決定部１１８は、数式（２０）を満たすようにユーザに割り振るポイントを決定する。

以上説明した第２の実施形態によれば、互いに異なる複数のアイテムのうちターゲットとするアイテムについて所定の行動に至りやすい対象ユーザに対して、複数のアイテム間において利用可能な複数のインセンティブのうち、いずれか一つ以上のインセンティブを付与することを決定するため、効果的にインセンティブを付与することができる。

一般的に、ユーザを限定せずにポイントを付与した場合、商品券や旅行券、金券などの換金性が高く、現金への交換がしやすい商品（特定のカテゴリのアイテム）の購入に対してポイントが利用されたり、購入金額が少額の商品に対して、その購入金額と同額のポイントが使用され、現金での支払いが生じなかったりする（自腹を切らない）場合があった。このような方法でポイントを利用するユーザは、サービスを継続して利用せずに、ポイントが付与されたときだけサービスを利用したり、ポイントを付与しても自費が少なくなるような少額の商品を購入したりする傾向がある。このようなユーザにポイントを付与した場合、ターゲットとするアイテムをユーザに購入させるというような目的が達成されず、ポイントを付与することの費用対効果が小さくなりやすい。

これに対して、第２の実施形態では、上記のような傾向を有するユーザを除くユーザ、すなわち、特定の金額帯や特定のカテゴリのアイテムをターゲットとし、そのターゲットのアイテムについては所定の行動に至りやすく、ターゲットとしないアイテムについては所定の行動に至りにくいユーザに対してインセンティブを付与するため、効果的にインセンティブを付与することができる。

＜第３の実施形態＞
以下、第３の実施形態について説明する。第３の実施形態では、複数のサービスの中からターゲットとするサービスを選択すると共に、複数のアイテムの中からターゲットとするアイテムを選択する点で上述した第１の実施形態または第２の実施形態と相違する。以下、第１の実施形態または第２の実施形態との相違点を中心に説明し、第１の実施形態または第２の実施形態と共通する点については説明を省略する。なお、第３の実施形態の説明において、第１の実施形態または第２の実施形態と同じ部分については同一符号を付して説明する。

第３の実施形態における目的関数ｆは、例えば、インセンティブが付与されたユーザが、ターゲットとするサービスにおいて扱われる（例えば販売される）アイテムの中でターゲットとするアイテム（特定の金額帯または特定のカテゴリのアイテム）について所定の行動に至る行動確率と、ターゲットとしないサービスにおいて扱われるアイテムの中でターゲットとするアイテムについて所定の行動に至る行動確率との差分に基づく関数である。

また、第３の実施形態における目的関数ｆは、例えば、インセンティブが付与されたユーザが、ターゲットとするサービスにおいて扱われるアイテムの中でターゲットとするアイテムについて所定の行動に至る行動確率と、ターゲットとするサービスおよびターゲットとしないサービスを問わず、ターゲットとしないアイテムについて所定の行動に至る行動確率との差分に基づく関数であってもよい。

なお、第３の実施形態における目的関数ｆの「所定の行動に至る行動確率」は、第１の実施形態や第２の実施形態と同様に、所定の行動に至った場合に得られた購入金額などの成果や、所定の行動に伴うインセンティブの利用額、所定の行動に伴うインセンティブの利用率であってもよい。

図１９から図２１は、第３の実施形態における目的関数ｆを説明するための図である。例えば、図１９に示すように、オークションやショッピングなどのサービスがＸ、Ｙ、Ｚの３種類存在し、各サービスを介して販売されるアイテム（図中では商品）が、１０００円以下の金額帯、１００１円から５０００円までの金額帯、５００１円から１００００円までの金額帯、１０００１円から５００００円までの金額帯、５０００１円以上の金額帯の合計５種類あるものとする。なお、ターゲットとするアイテムを、特定のカテゴリのアイテムとする場合、図中の各金額帯を、カテゴリと読み替えてよい。

例えば、ターゲットとするサービスを「サービスＸ」とし、更に、ターゲットとするアイテムを「１０００円以下の金額帯のアイテム」とした場合、目的関数ｆは、図２０に示すように、サービスＸで扱われる１０００円以下の金額帯のアイテムについての所定の行動に至る行動確率から、サービスＹおよびＺで扱われる１０００円以下の金額帯のアイテム（図中ハイライト表示した金額帯のアイテム）についての所定の行動に至る行動確率を減算した差分に基づく関数となる。

また、ターゲットとするサービスを「サービスＸ」とし、更に、ターゲットとするアイテムを「１０００円以下の金額帯のアイテム」とした場合、目的関数ｆは、図２１に示すように、サービスＸで扱われる１０００円以下の金額帯のアイテムについての所定の行動に至る行動確率から、サービスＸで扱われる１０００円以下の金額帯以外の他の金額帯のアイテムについての所定の行動に至る行動確率と、サービスＹおよびＺで扱われる全ての金額帯のアイテムについての所定の行動に至る行動確率との和を減算した差分に基づく関数であってよい。

以上説明した第３の実施形態によれば、複数のサービスの中からターゲットとするサービスを選択すると共に、複数のアイテムの中からターゲットとするアイテムを選択して、それらの双方のターゲットに対して所定の行動に至りやすい対象ユーザに対してインセンティブを付与することを決定するため、第１の実施形態または第２の実施形態に比べて、更に効果的にインセンティブを付与することができる。

＜第４の実施形態＞
以下、第４の実施形態について説明する。上述した第１の実施形態から第３の実施形態では、ユーザが所定の行動（アイテムの購入など）に至る前に、インセンティブが付与されるものとして説明した。これに対して、第４の実施形態では、ユーザが所定の行動に至る前にはインセンティブが付与されず、所定の行動に至ればインセンティブが付与されることがユーザに事前に通知される上述した第１の実施形態から第３の実施形態と相違する。以下、第１の実施形態から第３の実施形態との相違点を中心に説明し、第１の実施形態から第３の実施形態と共通する点については説明を省略する。なお、第４の実施形態の説明において、第１の実施形態から第３の実施形態と同じ部分については同一符号を付して説明する。

図２２は、インセンティブが付与されることが事前に通知される様子を模式的に示す図である。図示の例では、販売サイトおけるアイテムの購入ページを表している。このようなアイテムの購入ページには、アイテムの価格や写真と共に、そのアイテムを購入した場合に付与されるポイント額（図中ＰＮＴ）が表示される。これによって、アイテムの購入ページにアクセスしたユーザに対して、このページで紹介されているアイテムを購入すれば、その購入額に応じたポイントが付与されることを、アイテムが購入されるよりも前に通知することができる。この結果、アイテム購入ページにアクセスしたユーザの購買意欲を高めることができる。ユーザが、ポイント付与が事前に通知されているアイテムを購入した場合、すなわち、所定の行動に至った場合、そのユーザには、アイテムの購入後に、通知されたポイント（図示の例では１５０ポイント）が付与される。このポイントは、例えば、次回以降のアイテム購入に利用できるものとする。

なお、ポイントなどのインセンティブが付与されるタイミングは、少なくとも所定の行動がなされた以降（例えばアイテムの購入以降）であればよく、例えば、行動した日の翌日や、１か月後、２年後など任意のタイミングであってよい。また、図２２の例では、不特定多数のユーザが閲覧可能なウェブページ上に、付与ポイント額を掲載することで、アイテム購入の前にインセンティブが付与されることを通知しているがこれに限られず、例えば、各ユーザのメールアドレスにメールを配信することで、不特定多数ではなく個別にインセンティブが付与されることを通知してもよい。

図２３は、第４の実施形態における制御部１１０による一連の処理の一例を示すフローチャートである。まず、取得部１１２は、通信部１０２を介して、端末装置１０またはサーバ装置２０から、行動履歴情報１３２および素性情報１３４を取得し（Ｓ２００）、取得したこれらの情報を記憶部１３０に記憶させる。

次に、モデル生成部１１４は、取得部１１２により取得された行動履歴情報１３２および素性情報１３４に基づいて、ポイントごとのユーザの行動傾向をモデル化した予測モデルを生成する（Ｓ２０２）。例えば、二値分類問題を、アイテムを購入するかどうかという問題と捉えた場合、ＳＶＭの正例とする素性は、アイテムの購入に応じてポイントが付与されることが事前に通知された後にアイテムを購入したユーザの素性を示す特徴ベクトルとなり、ＳＶＭの負例とする素性は、アイテムの購入に応じてポイントが付与されることが事前に通知された後にアイテムを購入しなかったユーザの素性を示す特徴ベクトルとなる。

次に、モデル生成部１１４は、教師データを用いて生成した各ポイントでの予測モデルに従って、学習データであるユーザの素性を正例負例のいずれかに分類し、分類した各素性のスコアを導出する（Ｓ２０４）。

次に、確率予測部１１６は、過去のユーザの行動実績に基づいて、目的関数ｆを最適化（最大化）にするためのユーザの行動確率を予測する（Ｓ２０６）。例えば、ある複数のユーザに、「所定の行動をとればインセンティブが付与される」ということを事前に通知した場合、第４の実施形態における目的関数ｆは、通知を受けたユーザが、ターゲットとするサービスを利用して所定の行動に至る行動確率と、ターゲットとしないサービスを利用して所定の行動に至る行動確率との差分に基づく関数であってよい。第４の実施形態における目的関数ｆの「所定の行動に至る行動確率」は、他の実施形態と同様に、所定の行動に至った場合に得られた購入金額などの成果や、所定の行動に伴うインセンティブの利用額、所定の行動に伴うインセンティブの利用率であってもよい。

例えば、確率予測部１１６は、シグモイド関数のような確率密度関数を予測し、この予測した関数に、モデル生成部１１４により導出されたスコアを代入することで、ユーザの将来の行動確率を予測する。

次に、付与ポイント決定部１１８は、確率予測部１１６により予測された、ユーザごとの各ポイントでの行動確率に基づいて、ポイントを付与可能な予算内で、上述した目的関数ｆを最適化（例えば最大化）にするように各ユーザに割り振るポイントの配分を決定する（Ｓ２０８）。

次に、付与ポイント決定部１１８は、整数計画法を用いて決定した配分に応じたポイント額を、通信部１０２を介してサーバ装置２０に送信する（Ｓ２１０）。これを受けて、サーバ装置２０は、自身が提供するウェブサイトやアプリケーションを介して、付与ポイント決定部１１８により決定された額のポイントが所定の行動を取った場合に付与されることを、ユーザに通知する。例えば、サーバ装置２０は、ウェブサイト上で、「アイテムを購入すると、購入額の１０［％］分のポイントが付与されます」等といった文字を表示する。サーバ装置２０は、ユーザにポイントが付与されることを通知した後、そのユーザが所定の行動を取った場合、その旨を示す情報を情報処理装置１００に送信する。

次に、情報処理装置１００の制御部１１０は、サーバ装置２０からの情報の受信有無に基づいて、ポイントの付与が通知されたユーザによって所定の行動がなされたか否かを判定し（Ｓ２１２）、所定の行動がなされたと判定した場合、ポイント付与の案内を、通信部１０２を介してユーザの端末装置１０に送信する（Ｓ２１４）。

以上説明した第４の実施形態によれば、インセンティブが付与されることが事前に通知されたユーザのうち、互いに異なる複数のサービスのうちターゲットとするサービスを利用して所定の行動に至りやすい、または互いに異なる複数のアイテムのうちターゲットとするアイテムについて所定の行動に至りやすい対象ユーザに対してインセンティブを付与することを決定するため、上述した第１の実施形態から第３の実施形態と同様に、効果的にインセンティブを付与することができる。

＜その他の実施形態＞
以下、その他の実施形態として、上述した実施形態の変形例について説明する。上述した実施形態では、整数計画法を行うことによって、ユーザに割り振るポイントを決定したがこれに限られない。例えば、上述したヒューリスティック手法を用いて、ユーザに割り振るポイントを決定してもよい。付与ポイント決定部１１８は、例えば、ある任意のポイントを暫定的な最適解（近似解）と仮定し、この最適解を変更したとき、制約条件を満たしながら、目的関数ｆがより大きくなるポイントを探索する。この手法は、所謂局所探索と呼ばれる手法である。例えば、付与ポイント決定部１１８は、３ポイントを暫定的な最適解として仮定し、３ポイントから１００ポイントに変更したときの目的関数ｆの値が３ポイントでの目的関数ｆの値よりも大きければ、暫定的な最適解を３ポイントから１００ポイントに変更する。さらに、付与ポイント決定部１１８は、３００ポイント、５００ポイントといったように対象となるポイントを順次変更しながら、目的関数ｆの値がより大きくなるものを探索する。これによって、付与ポイント決定部１１８は、最も目的関数ｆの値が大きくなったポイントを最適解として導出する。なお、上述したヒューリスティック手法は、あくまでも一例であり、他の手法を用いてもよい。

＜ハードウェア構成＞
上述した実施形態の情報処理システム１に含まれる複数の装置のうち、少なくとも情報処理装置１００は、例えば、図２４に示すようなハードウェア構成により実現される。図２４は、実施形態の情報処理装置１００のハードウェア構成の一例を示す図である。

情報処理装置１００は、ＮＩＣ１００−１、ＣＰＵ１００−２、ＲＡＭ１００−３、ＲＯＭ１００−４、フラッシュメモリやＨＤＤなどの二次記憶装置１００−５、およびドライブ装置１００−６が、内部バスあるいは専用通信線によって相互に接続された構成となっている。ドライブ装置１００−６には、光ディスクなどの可搬型記憶媒体が装着される。二次記憶装置１００−５、またはドライブ装置１００−６に装着された可搬型記憶媒体に格納されたプログラムがＤＭＡコントローラ（不図示）などによってＲＡＭ１００−３に展開され、ＣＰＵ１００−２によって実行されることで、制御部１１０が実現される。制御部１１０が参照するプログラムは、ネットワークＮＷを介して他の装置からダウンロードされてもよい。

以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何ら限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。

１…情報処理システム、１０…端末装置、２０…サーバ装置、１００…情報処理装置、
１０２…通信部、１１０…制御部、１１２…取得部、１１４…モデル生成部、１１６…確率予測部、１１８…付与ポイント決定部、１３０…記憶部、１３２…行動履歴情報、１３４…素性情報、１３６…予測モデル情報、１３８…アカウント情報、ＮＷ…ネットワーク

Claims

複数のユーザの行動履歴と、前記複数のユーザの素性情報とを取得する取得部と、
前記取得部により取得された前記複数のユーザの行動履歴および素性情報に基づいて、前記複数のユーザのうち、互いに異なる複数のサービスのうちターゲットとするサービスを利用して当該サービスの提供主またはインセンティブの付与主が期待する所定の行動に至りやすい、または互いに異なる複数の商品のうちターゲットとする商品について当該商品の提供主またはインセンティブの付与主が期待する所定の行動に至りやすい対象ユーザを決定し、当該対象ユーザに対して、前記複数のサービス間、または前記複数の商品間において利用可能な複数のインセンティブのうち、いずれか一つ以上のインセンティブを付与することを決定する決定部と、
を備える情報処理装置。
前記複数のインセンティブは、ユーザに与える影響度が互いに異なり、
前記取得部は、前記複数のインセンティブのうちいずれか一つ以上のインセンティブが付与されたユーザの行動履歴および素性情報を取得し、
前記決定部は、前記インセンティブが付与されたユーザの行動履歴および素性情報に基づいて、前記対象ユーザが起こす前記所定の行動に関する事象が最適化されるインセンティブの配分を予算内で決定する、
請求項１に記載の情報処理装置。
前記複数のインセンティブは、ユーザに与える影響度が互いに異なり、
前記取得部は、前記所定の行動を起こした場合に、前記複数のインセンティブのうちいずれか一つ以上のインセンティブが付与されることが事前に通知されたユーザの行動履歴および素性情報を取得し、
前記決定部は、前記インセンティブが付与されることが事前に通知されたユーザの行動履歴および素性情報に基づいて、前記対象ユーザが起こす前記所定の行動に関する事象が最適化されるインセンティブの配分を予算内で決定する、
請求項１に記載の情報処理装置。
前記決定部は、前記ターゲットとするサービスを利用して前記所定の行動に至る確率と、前記ターゲットとしないサービスを利用して前記所定の行動に至る確率との差分、または前記ターゲットとする商品について前記所定の行動に至る確率と、前記ターゲットとしない商品について前記所定の行動に至る確率との差分を目的関数とした整数計画問題を解くことで、前記予算内で前記インセンティブの配分を決定する、
請求項２または３に記載の情報処理装置。
前記決定部は、前記ターゲットとするサービスを利用して前記所定の行動に至った場合に得られる成果と、前記ターゲットとしないサービスを利用して前記所定の行動に至った場合に得られる成果との差分、または前記ターゲットとする商品について前記所定の行動に至った場合に得られる成果と、前記ターゲットとしない商品について前記所定の行動に至った場合に得られる成果との差分を目的関数とした整数計画問題を解くことで、前記予算内で前記インセンティブの配分を決定する、
請求項２から４のうちいずれか１項に記載の情報処理装置。
前記決定部は、前記ターゲットとするサービスを利用して前記所定の行動に至った場合の前記所定の行動に伴う前記インセンティブの利用結果と、前記ターゲットとしないサービスを利用して前記所定の行動に至った場合の前記所定の行動に伴う前記インセンティブの利用結果との差分、または前記ターゲットとする商品について前記所定の行動に至った場合の前記所定の行動に伴う前記インセンティブの利用結果と、前記ターゲットとしない商品について前記所定の行動に至った場合の前記所定の行動に伴う前記インセンティブの利用結果との差分を目的関数とした整数計画問題を解くことで、前記予算内で前記インセンティブの配分を決定する、
請求項２から５のうちいずれか１項に記載の情報処理装置。
前記決定部は、所定の制約条件下で、前記整数計画問題を解く、
請求項４から６のうちいずれか１項に記載の情報処理装置。
前記所定の制約条件には、前記ターゲットとするサービスを利用して前記所定の行動に至る確率が、前記ターゲットとしないサービスを利用して前記所定の行動に至る確率よりも大きいこと、または前記ターゲットとする商品について前記所定の行動に至る確率が、前記ターゲットとしない商品について前記所定の行動に至る確率よりも大きいことが含まれる、
請求項７に記載の情報処理装置。
前記所定の制約条件には、前記ターゲットとするサービスを利用して前記所定の行動に至った場合に得られる成果が、前記ターゲットとしないサービスを利用して前記所定の行動に至った場合に得られる成果よりも大きいこと、または前記ターゲットとする商品について前記所定の行動に至った場合に得られる成果が、前記ターゲットとしない商品について前記所定の行動に至った場合に得られる成果よりも大きいことが含まれる、
請求項７または８に記載の情報処理装置。
前記所定の制約条件には、前記ターゲットとするサービスを利用して前記所定の行動に至った場合の前記所定の行動に伴う前記インセンティブの利用結果が、前記ターゲットとしないサービスを利用して前記所定の行動に至った場合の前記所定の行動に伴う前記インセンティブの利用結果よりも大きいこと、または前記ターゲットとする商品について前記所定の行動に至った場合の前記所定の行動に伴う前記インセンティブの利用結果が、前記ターゲットとしない商品について前記所定の行動に至った場合の前記所定の行動に伴う前記インセンティブの利用結果よりも大きいことが含まれる、
請求項７から９のうちいずれか１項に記載の情報処理装置。
前記所定の制約条件には、前記インセンティブの配分の比率を整数とすることが含まれる、
請求項７から１０のうちいずれか１項に記載の情報処理装置。
前記決定部は、前記インセンティブの配分の比率を整数とする条件を緩和して、前記整数計画問題を解く、
請求項１１に記載の情報処理装置。
コンピュータが、
複数のユーザの行動履歴と、前記複数のユーザの素性情報とを取得し、
前記取得した前記複数のユーザの行動履歴および素性情報に基づいて、前記複数のユーザのうち、互いに異なる複数のサービスのうちターゲットとするサービスを利用して当該サービスの提供主またはインセンティブの付与主が期待する所定の行動に至りやすい、または互いに異なる複数の商品のうちターゲットとする商品について当該商品の提供主またはインセンティブの付与主が期待する所定の行動に至りやすい対象ユーザを決定し、当該対象ユーザに対して、前記複数のサービス間、または前記複数の商品間において利用可能な複数のインセンティブのうち、いずれか一つ以上のインセンティブを付与することを決定する、
情報処理方法。
コンピュータに、
複数のユーザの行動履歴と、前記複数のユーザの素性情報とを取得させ、
前記取得させた前記複数のユーザの行動履歴および素性情報に基づいて、前記複数のユーザのうち、互いに異なる複数のサービスのうちターゲットとするサービスを利用して当該サービスの提供主またはインセンティブの付与主が期待する所定の行動に至りやすい、または互いに異なる複数の商品のうちターゲットとする商品について当該商品の提供主またはインセンティブの付与主が期待する所定の行動に至りやすい対象ユーザを決定し、当該対象ユーザに対して、前記複数のサービス間、または前記複数の商品間において利用可能な複数のインセンティブのうち、いずれか一つ以上のインセンティブを付与することを決定させる、
プログラム。