JP2013156691A - 購買予測装置、方法、及びプログラム - Google Patents

購買予測装置、方法、及びプログラム Download PDF

Info

Publication number
JP2013156691A
JP2013156691A JP2012014432A JP2012014432A JP2013156691A JP 2013156691 A JP2013156691 A JP 2013156691A JP 2012014432 A JP2012014432 A JP 2012014432A JP 2012014432 A JP2012014432 A JP 2012014432A JP 2013156691 A JP2013156691 A JP 2013156691A
Authority
JP
Japan
Prior art keywords
model
purchase
prediction
product
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012014432A
Other languages
English (en)
Other versions
JP5835802B2 (ja
Inventor
Yusuke Kumagai
雄介 熊谷
Shinya Murata
眞哉 村田
Noriko Takaya
典子 高屋
Masashi Uchiyama
匡 内山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2012014432A priority Critical patent/JP5835802B2/ja
Publication of JP2013156691A publication Critical patent/JP2013156691A/ja
Application granted granted Critical
Publication of JP5835802B2 publication Critical patent/JP5835802B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】他のサイトのデータを用いた場合でも、対象サイトの商品の購買予測の精度を向上させる。
【解決手段】モデル生成部12aで、対象ECサイトの商品・購買情報20の集合D、及び他ECサイトの商品・購買情報22の集合Dから抽出したデータ集合D'i,S+T、及びデータ集合D'i,S+Tとデータ集合Dとに共通して含まれるデータ集合D'i,Tを抽出し(206)、データ集合D'i,S+T及びD'i,T各々を用いて、モデルf^i,S+T及びf^i,Tを生成する(208)。モデル選択部12bで、二つのモデルf^i,S+T及びf^i,Tについて、データ集合Dを用いて予測誤差を計算し(210)、予測誤差が小さい方をモデルf^として選択する(212〜216)。購買予測モデル第2処理部14で、モデル集合F={f^,・・・,f^}の各モデルを選択及び統合して、最終的な購買予測モデルFを構築する。
【選択図】図4

Description

本発明は、購買予測装置、方法、及びプログラムに係り、特に、ECサイトで扱われる商品の購買予測を行う購買予測装置、方法、及びプログラムに関する。
従来、EC(electronic commerce)サイトで扱われている商品が購買されるか否かを予測するための判別モデルを、予測対象の商品を取り扱うECサイトでの過去の購買情報及び商品情報を用いて構築し、そのモデルを用いて商品が購買されるか否かを予測することが行われている。
例えば、ネットオークションサイトにおける商品の購買予測モデルを、出品された商品が購買されるかどうかを、商品の価格、同カテゴリ中の商品の平均価格との差等を用いてモデリングする手法が提案されている(例えば、非特許文献1参照)。
しかし、予測対象のサイトだけでは、収集可能なデータ数が少なくなる場合があり、十分な精度を持つモデルを構築することが困難な場合もある。このような問題を解消するために、予測対象ではないデータも含めてモデルを構築し、精度を向上させることが考えられる。
また、ある商品について、似たブランド、似た価格、似た属性を持つ商品が複数のECサイトで販売されていることが多くある。このような場合、対象サイトで取り扱っている商品が他のサイトで購買されているか否かという情報を用いてモデルを構築することにより、精度がより向上すると考えられる。また、予測対象のデータと予測対象でないデータとをモデル構築に用いることによって、両者に共通したモデルの性質を効率よく得ることができるというメリットもある。
そこで、対象サイトとは異なる他のサイトにおけるデータも用いて、商品の購買予測を行うためのモデルを構築する手法が提案されている(例えば、非特許文献2参照)。非特許文献2の手法では、ソーシャルブックマークにおける記事に対するタグ付の予測モデルとして、TrBaggモデルを提案している。このモデルでは、高品質少数のデータと低品質多数のデータとの二種類を用いて複数の予測モデルを作り、それらを組み合わせて購買予測を行なっている。
X. Wu, and A. Bolivar, "Predicting the conversion probability for items on C2C ecommerce sites", Proceeding of the 18th ACM conference on Information and knowledge management, p1377 - 1386, 2009. T. Kamishima et al., "TrBagg: A Simple Transfer Learning Method and its Application to Personalization in Collaborative Tagging", Proceedings of the 2009 Ninth IEEE International Conference on Data Mining, p219 - 228, 2009.
しかしながら、非特許文献2に記載の手法のように、対象のECサイトとは異なる他のECサイトのデータを用いた場合には、対象のECサイトと他のECサイトとの性質の相違などが影響して、対象のECサイトのデータのみを用いて構築したモデルに比べて予測精度が劣化する場合がある、という問題がある。
本発明は上記事情に鑑みてなされたものであり、購買予測の対象となる商品を取り扱う対象サイトとは異なる他のサイトのデータを用いた場合でも、対象商品の購買予測の精度を向上させることができる購買予測装置、方法、及びプログラムを提供することを目的とする。
上記目的を達成するために、本発明の購買予測装置は、商品に関する情報を示す商品情報及び該商品が購買されたか否かを示す購買情報を含み、かつ購買予測の対象となる商品を取り扱う対象サイトから収集された複数の対象サイトデータと、前記商品情報及び前記購買情報を含み、かつ前記対象サイトとは異なる他のサイトから収集された複数の他サイトデータとを取得する取得手段と、前記取得手段により取得された前記対象サイトデータ及び前記他サイトデータの両方を含むように抽出された複数のデータを用いて、前記商品に対する購買予測を行うための第1モデルを学習すると共に、前記第1モデルの学習に用いた複数のデータに含まれる前記対象サイトデータを用いて前記商品に対する購買予測を行うための第2モデルを学習し、前記複数のデータの抽出を複数回繰り返すことにより、前記第1モデルと前記第2モデルとの組を複数生成する生成手段と、前記生成手段により生成された前記第1モデルと前記第2モデルとの組毎に、前記第1モデル及び前記第2モデル各々に前記対象サイトデータを適用した場合の予測誤差が小さいモデルを選択する選択手段と、前記選択手段により選択された複数のモデル各々に前記対象サイトデータを適用した場合の予測誤差に基づいて、前記複数のモデルを選択及び統合した購買予測モデルを構築する構築手段と、前記構築手段により構築された前記購買予測モデルに、前記購買予測の対象となる商品の商品情報を適用して、前記対象となる商品が購買されるか否かを予測する予測手段と、を含んで構成されている。
本発明の購買予測装置によれば、取得手段が、商品に関する情報を示す商品情報及びその商品が購買されたか否かを示す購買情報を含み、かつ購買予測の対象となる商品を取り扱う対象サイトから収集された複数の対象サイトデータと、商品情報及び購買情報を含み、かつ対象サイトとは異なる他のサイトから収集された複数の他サイトデータとを取得する。
そして、生成手段が、取得手段により取得された対象サイトデータ及び他サイトデータの両方を含むように抽出された複数のデータを用いて、商品に対する購買予測を行うための第1モデルを学習すると共に、第1モデルの学習に用いた複数のデータに含まれる対象サイトデータを用いて商品に対する購買予測を行うための第2モデルを学習し、複数のデータの抽出を複数回繰り返すことにより、第1モデルと第2モデルとの組を複数生成する。また、選択手段が、生成手段により生成された第1モデルと第2モデルとの組毎に、第1モデル及び第2モデル各々に対象サイトデータを適用した場合の予測誤差が小さいモデルを選択する。
そして、構築手段が、選択手段により選択された複数のモデル各々に対象サイトデータを適用した場合の予測誤差に基づいて、複数のモデルを選択及び統合した購買予測モデルを構築し、予測手段が、構築手段により構築された購買予測モデルに、購買予測の対象となる商品の商品情報を適用して、対象となる商品が購買されるか否かを予測する。
このように、対象サイトデータ及び他サイトデータを用いて学習された第1モデルと、対象サイトデータを用いて学習された第2モデルとの予測誤差が小さいモデルを選択して購買予測モデルを構築するため、精度向上につながる他サイトデータのみを利用することができ、購買予測の対象となる商品を取り扱う対象サイトとは異なる他のサイトのデータを用いた場合でも、対象商品の購買予測の精度を向上させることができる。
また、本発明の購買予測方法は、取得手段と、生成手段と、選択手段と、構築手段と、予測手段とを含む購買予測装置における購買予測方法であって、前記取得手段は、商品に関する情報を示す商品情報及び該商品が購買されたか否かを示す購買情報を含み、かつ購買予測の対象となる商品を取り扱う対象サイトから収集された複数の対象サイトデータと、前記商品情報及び前記購買情報を含み、かつ前記対象サイトとは異なる他のサイトから収集された複数の他サイトデータとを取得し、前記生成手段は、前記取得手段により取得された前記対象サイトデータ及び前記他サイトデータの両方を含むように抽出された複数のデータを用いて、前記商品に対する購買予測を行うための第1モデルを学習すると共に、前記第1モデルの学習に用いた複数のデータに含まれる前記対象サイトデータを用いて前記商品に対する購買予測を行うための第2モデルを学習し、前記複数のデータの抽出を複数回繰り返すことにより、前記第1モデルと前記第2モデルとの組を複数生成し、前記選択手段は、前記生成手段により生成された前記第1モデルと前記第2モデルとの組毎に、前記第1モデル及び前記第2モデル各々に前記対象サイトデータを適用した場合の予測誤差が小さいモデルを選択し、前記構築手段は、前記選択手段により選択された複数のモデル各々に前記対象サイトデータを適用した場合の予測誤差に基づいて、前記複数のモデルを選択及び統合した購買予測モデルを構築し、前記予測手段は、前記構築手段により構築された前記購買予測モデルに、前記購買予測の対象となる商品の商品情報を適用して、前記対象となる商品が購買されるか否かを予測する方法である。
また、本発明の購買予測プログラムは、コンピュータを、上記の購買予測装置を構成する各手段として機能させるためのプログラムである。
以上説明したように、本発明の購買予測装置、方法、及びプログラムによれば、対象サイトデータ及び他サイトデータを用いて学習された第1モデルと、対象サイトデータを用いて学習された第2モデルとの予測誤差が小さいモデルを選択して購買予測モデルを構築するため、精度向上につながる他サイトデータのみを利用することができ、購買予測の対象となる商品を取り扱う対象サイトとは異なる他のサイトのデータを用いた場合でも、対象商品の購買予測の精度を向上させることができる、という効果が得られる。
本実施の形態の購買予測装置の機能的構成を示すブロック図である。 各種データのデータ構造を示す図である。 本実施の形態の購買予測装置における購買予測処理ルーチンの内容を示すフローチャートである。 本実施の形態における購買予測モデル構築に関する第1処理ルーチンの内容を示すフローチャートである。 本実施の形態における購買予測モデル構築に関する第2処理ルーチンの内容を示すフローチャートである。 サイトAを対象ECサイトとした場合における、本実施の形態と既存手法との精度比較を示す図である。 サイトCを対象ECサイトとした場合における、本実施の形態と既存手法との精度比較を示す図である。 サイトDを対象ECサイトとした場合における、本実施の形態と既存手法との精度比較を示す図である。
以下、図面を参照して本発明の実施の形態を詳細に説明する。
第1の実施の形態に係る購買予測装置10は、CPU(Central Processing Unit)と、RAM(Random Access Memory)と、後述する購買予測処理ルーチンを実行するためのプログラムを記憶したROM(Read Only Memory)とを備えたコンピュータで構成されている。このコンピュータは、機能的には、図1に示すように、購買予測モデル第1処理部12と、購買予測モデル第2処理部14と、購買予測部16とを含んだ構成で表すことができる。さらに、購買予測モデル第1処理部12は、モデル生成部12aとモデル選択部12bとを含んだ構成で表すことができる。
購買予測モデル第1処理部12は、購買予測の対象となる商品を取り扱うECサイト(以下、「対象ECサイト」という)から収集された商品・購買情報20と、対象ECサイトとは異なる他のECサイト(以下、「他ECサイト」という)から収集された商品・購買情報22を受け付ける。
図2に示すように、対象ECサイトの商品・購買情報20及び他ECサイトの商品・購買情報22のデータ構造は、商品毎の価格、その商品と同じカテゴリの商品の平均価格、・・・等の商品に関する情報を示す商品情報と、その商品が購買されたか否かを示す購買情報とを含む。
モデル生成部12aでは、受け付けた対象ECサイトの商品・購買情報20の集合D、及び他ECサイトの商品・購買情報22の集合Dから、復元抽出によってデータ集合D'i,S+Tを抽出する。ここで、Tは対象ECサイトのデータ、Sは他ECサイトのデータを表し、S+Tは両サイトのデータを合わせたものであることを意味する。すなわち、データ集合D'i,S+TはECサイトの商品・購買情報20及び他ECサイトの商品・購買情報22の両方を含む。iはi個目のモデル生成に用いるデータ集合であることを表す。復元抽出とは、ある集合からランダムに要素を取り出す試行を繰り返す際、一度取り出した要素が、その後の試行において取り出される候補となるようなサンプリング法である。データ集合D'i,S+Tの要素数は、対象ECサイトの商品・購買情報20の集合Dと同じ要素数とする。
また、モデル生成部12aは、データ集合D'i,S+Tと対象ECサイトの商品・購買情報20の集合Dとに共通して含まれるデータの集合をD'i,Tとして抽出する。
また、モデル生成部12aは、抽出した二つのデータ集合D'i,S+T及びD'i,T各々について、CARTアルゴリズム(参考文献「“Classification and Regression Trees”, Leo Breiman, J. H. Friedman, R. A. Olshen, and C. J. Stone., Monterey Workshop, 1984」を参照)を用いて、説明変数を商品情報、目的変数を購買情報として学習し、モデルf^i,S+T及びf^i,Tをそれぞれ生成する。モデルf^i,S+T及びf^i,Tは、共に商品情報を入力とし、その商品が購買されるか否かの二値情報を出力する関数となる。
モデル選択部12bは、モデル生成部12aで生成された二つのモデルf^i,S+T及びf^i,Tについて、対象ECサイトの商品・購買情報20の集合Dを用いて予測誤差を計算する。予測誤差は、例えば下記(1)式により計算することができる。
Figure 2013156691
ここで、D及び|D|は予測に用いるデータ及びその個数であり、x及びyはそれぞれ説明変数及び目的変数である。I( )は引数が真であれば1を、偽であれば0を返す関数である。二つのモデルf^i,S+T及びf^i,Tに対す予測誤差はそれぞれErr(f^i,S+T,D) 及びErr(f^i,T,D)であり、この予測誤差が小さいモデルをモデルf^として選択する。
なお、既存技術であるTrBagg(非特許文献2)では、モデルf^として、データ集合D'i,S+Tから学習したモデルをそのまま使うのに対し、本実施の形態では、データ集合D'i,S+TだけでなくD'i,Tからもモデルを生成し、どちらのモデルの精度が良いかを判別した上で、モデルf^として採用している。
購買予測モデル第1処理部12は、モデル生成部12a及びモデル選択部12bでの処理をN回繰り返し、結果として複数の異なるモデル集合F={f^,・・・,f^}を構築し、購買予測モデル第2処理部14へ送出する。
購買予測モデル第2処理部14は、購買予測モデル第1処理部12で構築されたモデル集合F={f^,・・・,f^}の各モデルを選択及び統合して、最終的な購買予測モデルFを構築する。
具体的には、対象ECサイトの商品・購買情報20の集合Dについて、CARTアルゴリズムを用いることにより、モデルf^を生成し、モデル集合F={f^,・・・,f^}に追加する。モデルf^が追加されたモデル集合Fの全ての要素(各モデル)に対し、対象ECサイトの商品・購買情報20の集合Dに対する予測誤差を計算する。予測誤差の計算は、モデル選択部12bと同様に、(1)式を用いて計算することができる。
各モデルについて予測誤差が計算されると、その予測誤差の昇順にモデル集合Fの要素を並べ替え、Fsort=<f^i0,・・・,f^iN>とする。また、e、F'、及びFを、e=Err(f^i0,D)、F'←{f^i0}、及びF←{f^i0}のように初期化し、モデルf^it(t=1,・・・,N)について、F'←F'∪{f^i0}とし、モデル集合F'の予測誤差e'を計算する。なお、データxに対するモデル集合F'による予測を下記(2)式により定義する。すなわち、モデル集合F'に含まれる各モデルによる予測結果として最も多く現れたものを、モデル集合F'による予測結果と定義する。
Figure 2013156691
(2)式によるモデル集合F'の予測を用いて予測誤差e'=Err(F',D)を計算し、e'≦eとなった場合に、F←F∪F'とし、また、e=e'とする。この処理によって最終的な購買予測モデルに含まれるモデルが選択される。モデル集合F⊆F'が学習の結果構築された最終的な購買予測モデルであり、これを購買予測部16へ送出する。
購買予測部16は、購買予測モデル第2処理部14で構築された購買予測モデルFと、予測を行いたい対象ECサイトの商品情報24の集合Dunknownを受け取り、下記(3)式により、商品情報に対応した商品の購買予測を行って、対象ECサイトの購買予測26として出力する。
Figure 2013156691
図2に示すように、対象ECサイトの商品情報24のデータ構造は、商品毎の価格、その商品と同じカテゴリの商品の平均価格、・・・等の商品に関する情報を示す商品情報を含む。また、対象ECサイトの購買予測26のデータ構造は、商品が購買されるか否かを示す商品毎の購買予測を含む。
次に、図3を参照して、本実施の形態の購買予測装置10において実行される購買予測処理ルーチンについて説明する。
ステップ100で、対象ECサイトの商品・購買情報20の集合D、及び他ECサイトの商品・購買情報22の集合Dを取得する。
次に、ステップ200で、購買予測モデル構築に関する第1処理を実行する。ここで、図4を参照して、購買予測モデル構築に関する第1処理ルーチンについて説明する。
ステップ202で、変数iに0をセットし、次に、ステップ204で、変数iを1インクリメントする。次に、ステップ206で、i個目のモデル生成に用いるデータ集合として、上記ステップ100で取得した対象ECサイトの商品・購買情報20の集合D、及び他ECサイトの商品・購買情報22の集合Dから、復元抽出によってデータ集合D'i,S+Tを抽出する。また、データ集合D'i,S+Tと対象ECサイトの商品・購買情報20の集合Dとに共通して含まれるデータの集合をD'i,Tとして抽出する。
次に、ステップ208で、上記ステップ206で抽出された二つのデータ集合D'i,S+T及びD'i,T各々について、CARTアルゴリズムを用いて、説明変数を商品情報、目的変数を購買情報として学習し、モデルf^i,S+T及びf^i,Tをそれぞれ生成する。
次に、ステップ210で、上記ステップ208で生成された二つのモデルf^i,S+T及びf^i,Tについて、対象ECサイトの商品・購買情報20の集合Dを用いて、(1)式により予測誤差Err(f^i,S+T,D) 及びErr(f^i,T,D)を計算する。
次に、ステップ212で、上記ステップ210で計算された予測誤差Err(f^i,S+T,D) が予測誤差Err(f^i,T,D)より小さいか否かを判定する。Err(f^i,S+T,D)<Err(f^i,T,D)の場合は、対象ECサイトの商品・購買情報20の集合D、及び他ECサイトの商品・購買情報22の集合Dの両方を用いて学習されたモデルf^i,S+Tの方が、データ集合Dのみで学習されたモデルf^i,Tより精度が良いことを示しているため、ステップ214へ移行して、モデルf^i,S+Tをモデルf^として選択する。一方、Err(f^i,S+T,D)>Err(f^i,T,D)の場合は、モデルf^i,Tの方がモデルf^i, S+Tより精度が良いことを示しているため、ステップ216へ移行して、モデルf^i,Tをモデルf^として選択する。
次に、ステップ218で、変数iが予め定めた所定数Nとなったか否かを判定する。iが所定数Nに到達していない場合には、ステップ204へ戻り、処理を繰り返す。i=Nとなった場合には、ステップ220へ移行して、上記ステップ214または216で選択された複数の異なるモデルf^により、モデル集合F={f^,・・・,f^}を構築し、後段の処理へ送出し、購買予測処理ルーチンへリターンする。
次に、ステップ300で、購買予測モデル構築に関する第2処理を実行する。ここで、図5を参照して、購買予測モデル構築に関する第2処理ルーチンについて説明する。
ステップ302で、対象ECサイトの商品・購買情報20の集合Dについて、CARTアルゴリズムを用いることにより、モデルf^を生成し、モデル集合F={f^,・・・,f^}に追加する。
次に、ステップ304で、モデル集合Fの全ての要素(各モデル)に対し、対象ECサイトの商品・購買情報20の集合Dに対する予測誤差を(1)式を用いて計算する。そして、予測誤差の昇順にモデル集合Fの要素を並び替え、Fsort=<f^i0,・・・,f^iN>とする。
次に、ステップ306で、e、F'、及びFを、e=Err(f^i0,D)、F'←{f^i0}、及びF←{f^i0}のように初期化する。
次に、ステップ308で、変数tに0をセットし、次に、ステップ310で、変数tを1インクリメントする。次に、ステップ312で、モデルf^it(t=1,・・・,N)について、F'←F'∪{f^i0}とし、モデル集合F'による予測結果を(2)式で定義した上で、モデル集合F'の予測誤差e'を計算する。
次に、ステップ314で、上記ステップ312で計算されたモデル集合F'の予測誤差e'が、現在のモデル集合Fの予測誤差e以下か否かを判定する。e'≦eの場合には、モデルf^itをモデル集合F'に追加した方が精度が良いことを示しているため、ステップ316へ移行して、F←F∪F'とし、また、e=e'とする。一方、e'>eの場合は、モデルf^itをモデル集合F'に追加しても精度が向上しないことを示しているため、モデルf^itをモデル集合F'に追加することなく、ステップ310へ戻る。
次に、ステップ318で、変数tがNとなったか否かを判定することにより、モデル集合Fに含まれる全てのモデルについて処理が終了したか否かを判定する。未処理のモデルf^itが存在する場合には、ステップ310へ戻り、処理を繰り返す。i=Nとなった場合には、ステップ320へ移行して、上記ステップ316で更新された現在のモデル集合Fを最終的な購買予測モデルとして後段の処理へ送出し、購買予測処理ルーチンへリターンする。
次に、ステップ400で、予測を行いたい対象ECサイトの商品情報24の集合Dunknownを取得する。次に、ステップ500で、上記ステップ320で送出された購買予測モデルFと、上記ステップ400で取得した対象ECサイトの商品情報24の集合Dunknownとを用いて、(3)式により、商品情報に対応した商品の購買予測を行って、対象ECサイトの購買予測26として出力し、購買予測処理を終了する。
ここで、本実施の形態の有効性を実験で示す。ここでは、ECサイト4サイトの購買ログ(商品情報及び購買情報)を用いて実験を行った。データ数はそれぞれAサイト4304件、Bサイト14442件、Cサイト4756件、Dサイト4700件である。本実験では、データ数が最も多いBサイトを対象ECサイトとする予測は行わず、A、C、Dサイトそれぞれを対象ECサイトとして、各サイトの商品について購買予測を行った。
予測の際には、予測対象であるECサイト以外のECサイトのデータについて、取りうる全ての組み合わせでデータを結合し、他ECサイトの商品・購買情報22として利用した。具体的にはサイトAを対象ECサイトとして予測を行う場合には、他ECサイトの商品・購買情報22として、Bサイト、Cサイト、Dサイト、BサイトとCサイト、BサイトとDサイト、CサイトとDサイト、BサイトとCサイトとDサイトをそれぞれ結合したものの計7データを利用した。また、対象ECサイトの商品・購買情報20の件数を1/1、1/2、1/4、1/8、1/16、1/32と削減することによって性能劣化への影響を確認した。よって、1サイトあたり42件の購買予測モデルが得られた。
図6〜8は、サイトA、C、及びD各々を対象ECサイトとした場合における、本実施の形態の購買予測装置と、非特許文献1で挙げられた既存手法とについて、上述の42モデルを生成し、精度比較を行った結果である。対象ECサイトをサイトCとした場合において、既存手法と比較して本実施の形態の精度が9モデルにおいて劣化しているものの、19モデルで精度が改善している。サイトA及びサイトD各々を対象ECサイトとした場合における予測では精度がそれぞれ28モデル、25モデルで改善し、精度の劣化は生じなかった。
以上説明したように、本実施の形態の購買予測装置によれば、対象ECサイトのデータと他ECサイトのデータとを用いて学習されたモデルが、対象ECサイトのデータのみで学習されたモデルよりも精度が悪い場合には、そのモデルを棄却するため、精度向上につながる他ECサイトのデータのみを利用することができ、他ECサイトのデータを用いた場合でも、対象ECサイトの商品の購買予測の精度を向上させることができる。
なお、上述の購買予測装置は、内部にコンピュータシステムを有しているが、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、本願明細書中において、プログラムが予めインストールされている実施形態として説明したが、当該プログラムを、コンピュータ読み取り可能な記録媒体に格納して提供することも可能である。
10 購買予測装置
12 購買予測モデル第1処理部
12a モデル生成部
12b モデル選択部
14 購買予測モデル第2処理部
16 購買予測部
20 対象ECサイトの商品・購買情報
22 他ECサイトの商品・購買情報
24 対象ECサイトの商品情報
26 対象ECサイトの購買予測

Claims (3)

  1. 商品に関する情報を示す商品情報及び該商品が購買されたか否かを示す購買情報を含み、かつ購買予測の対象となる商品を取り扱う対象サイトから収集された複数の対象サイトデータと、前記商品情報及び前記購買情報を含み、かつ前記対象サイトとは異なる他のサイトから収集された複数の他サイトデータとを取得する取得手段と、
    前記取得手段により取得された前記対象サイトデータ及び前記他サイトデータの両方を含むように抽出された複数のデータを用いて、前記商品に対する購買予測を行うための第1モデルを学習すると共に、前記第1モデルの学習に用いた複数のデータに含まれる前記対象サイトデータを用いて前記商品に対する購買予測を行うための第2モデルを学習し、前記複数のデータの抽出を複数回繰り返すことにより、前記第1モデルと前記第2モデルとの組を複数生成する生成手段と、
    前記生成手段により生成された前記第1モデルと前記第2モデルとの組毎に、前記第1モデル及び前記第2モデル各々に前記対象サイトデータを適用した場合の予測誤差が小さいモデルを選択する選択手段と、
    前記選択手段により選択された複数のモデル各々に前記対象サイトデータを適用した場合の予測誤差に基づいて、前記複数のモデルを選択及び統合した購買予測モデルを構築する構築手段と、
    前記構築手段により構築された前記購買予測モデルに、前記購買予測の対象となる商品の商品情報を適用して、前記対象となる商品が購買されるか否かを予測する予測手段と、
    を含む購買予測装置。
  2. 取得手段と、生成手段と、選択手段と、構築手段と、予測手段とを含む購買予測装置における購買予測方法であって、
    前記取得手段は、商品に関する情報を示す商品情報及び該商品が購買されたか否かを示す購買情報を含み、かつ購買予測の対象となる商品を取り扱う対象サイトから収集された複数の対象サイトデータと、前記商品情報及び前記購買情報を含み、かつ前記対象サイトとは異なる他のサイトから収集された複数の他サイトデータとを取得し、
    前記生成手段は、前記取得手段により取得された前記対象サイトデータ及び前記他サイトデータの両方を含むように抽出された複数のデータを用いて、前記商品に対する購買予測を行うための第1モデルを学習すると共に、前記第1モデルの学習に用いた複数のデータに含まれる前記対象サイトデータを用いて前記商品に対する購買予測を行うための第2モデルを学習し、前記複数のデータの抽出を複数回繰り返すことにより、前記第1モデルと前記第2モデルとの組を複数生成し、
    前記選択手段は、前記生成手段により生成された前記第1モデルと前記第2モデルとの組毎に、前記第1モデル及び前記第2モデル各々に前記対象サイトデータを適用した場合の予測誤差が小さいモデルを選択し、
    前記構築手段は、前記選択手段により選択された複数のモデル各々に前記対象サイトデータを適用した場合の予測誤差に基づいて、前記複数のモデルを選択及び統合した購買予測モデルを構築し、
    前記予測手段は、前記構築手段により構築された前記購買予測モデルに、前記購買予測の対象となる商品の商品情報を適用して、前記対象となる商品が購買されるか否かを予測する
    購買予測方法。
  3. コンピュータを、請求項1記載の購買予測装置を構成する各手段として機能させるための購買予測プログラム。
JP2012014432A 2012-01-26 2012-01-26 購買予測装置、方法、及びプログラム Active JP5835802B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012014432A JP5835802B2 (ja) 2012-01-26 2012-01-26 購買予測装置、方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012014432A JP5835802B2 (ja) 2012-01-26 2012-01-26 購買予測装置、方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2013156691A true JP2013156691A (ja) 2013-08-15
JP5835802B2 JP5835802B2 (ja) 2015-12-24

Family

ID=49051842

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012014432A Active JP5835802B2 (ja) 2012-01-26 2012-01-26 購買予測装置、方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP5835802B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019511037A (ja) * 2016-02-19 2019-04-18 アリババ グループ ホウルディング リミテッド 機械学習モデルのモデリング方法及びデバイス
WO2023234182A1 (ja) * 2022-06-01 2023-12-07 日本電気株式会社 データ処理装置、データ処理システム、データ処理方法およびプログラムが格納された非一時的なコンピュータ可読媒体
WO2023234184A1 (ja) * 2022-06-01 2023-12-07 日本電気株式会社 連合学習モデル生成装置、連合学習モデル生成システム、連合学習モデル生成方法、コンピュータ可読媒体および連合学習モデル
JP7500123B1 (ja) 2024-04-10 2024-06-17 DART’s株式会社 情報処理システム、情報処理方法及びプログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002157394A (ja) * 2000-11-20 2002-05-31 Sheena Kk ネットワークマーケティングシステム
JP2005024689A (ja) * 2003-06-30 2005-01-27 Xing Inc 音楽再生装置及びその演奏待ち情報通知システム
JP2008065500A (ja) * 2006-09-06 2008-03-21 Dainippon Printing Co Ltd リコメンドエンジン導入効果予測システム
JP2010134733A (ja) * 2008-12-05 2010-06-17 Dainippon Printing Co Ltd 情報推薦装置、情報推薦方法、及びプログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002157394A (ja) * 2000-11-20 2002-05-31 Sheena Kk ネットワークマーケティングシステム
JP2005024689A (ja) * 2003-06-30 2005-01-27 Xing Inc 音楽再生装置及びその演奏待ち情報通知システム
JP2008065500A (ja) * 2006-09-06 2008-03-21 Dainippon Printing Co Ltd リコメンドエンジン導入効果予測システム
JP2010134733A (ja) * 2008-12-05 2010-06-17 Dainippon Printing Co Ltd 情報推薦装置、情報推薦方法、及びプログラム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
元田 浩, データマイニングの基礎, vol. 第1版, JPN6014049380, 20 December 2006 (2006-12-20), pages 51 - 72, ISSN: 0002945670 *
神嶌 敏弘: "転移学習", 人工知能学会誌, vol. 第25巻第4号, JPN6014049378, 1 July 2010 (2010-07-01), JP, pages 572 - 580, ISSN: 0002945669 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019511037A (ja) * 2016-02-19 2019-04-18 アリババ グループ ホウルディング リミテッド 機械学習モデルのモデリング方法及びデバイス
JP7102344B2 (ja) 2016-02-19 2022-07-19 アリババ グループ ホウルディング リミテッド 機械学習モデルのモデリング方法及びデバイス
WO2023234182A1 (ja) * 2022-06-01 2023-12-07 日本電気株式会社 データ処理装置、データ処理システム、データ処理方法およびプログラムが格納された非一時的なコンピュータ可読媒体
WO2023234184A1 (ja) * 2022-06-01 2023-12-07 日本電気株式会社 連合学習モデル生成装置、連合学習モデル生成システム、連合学習モデル生成方法、コンピュータ可読媒体および連合学習モデル
JP7500123B1 (ja) 2024-04-10 2024-06-17 DART’s株式会社 情報処理システム、情報処理方法及びプログラム

Also Published As

Publication number Publication date
JP5835802B2 (ja) 2015-12-24

Similar Documents

Publication Publication Date Title
CN109509054B (zh) 海量数据下商品推荐方法、电子装置及存储介质
US8312056B1 (en) Method and system for identifying a key influencer in social media utilizing topic modeling and social diffusion analysis
CN110555469B (zh) 处理交互序列数据的方法及装置
WO2018040944A1 (zh) 恶意地址/恶意订单的识别系统、方法及装置
US20190272553A1 (en) Predictive Modeling with Entity Representations Computed from Neural Network Models Simultaneously Trained on Multiple Tasks
US10936950B1 (en) Processing sequential interaction data
US9449283B1 (en) Selecting a training strategy for training a machine learning model
CN109189921B (zh) 评论评估模型的训练方法和装置
CN111444334A (zh) 数据处理方法、文本识别方法、装置及计算机设备
WO2019212006A1 (ja) 事象予測装置、予測モデル生成装置および事象予測用プログラム
CN108984555B (zh) 用户状态挖掘和信息推荐方法、装置以及设备
JP6311851B2 (ja) 共クラスタリングシステム、方法およびプログラム
JP6506360B2 (ja) 教師データを生成する方法、学習済みモデルを生成する方法、学習済みモデル、コンピュータおよびプログラム
JP5835802B2 (ja) 購買予測装置、方法、及びプログラム
CN110288362A (zh) 刷单的预测方法、装置及电子设备
JP7559762B2 (ja) 情報処理装置、情報処理方法、及びプログラム
JP6101620B2 (ja) 購買予測装置、方法、及びプログラム
CN110689110A (zh) 处理交互事件的方法及装置
CN115511546A (zh) 一种电商用户的行为分析方法、系统、设备及可读介质
CN106933798B (zh) 信息分析的方法及装置
CN114417161A (zh) 基于异构图的虚拟物品时序推荐方法、装置、介质及设备
CN111026973B (zh) 一种商品兴趣度预测方法、装置及电子设备
CN116629956A (zh) 一种基于用户动态交互行为的商品点击动机预测方法
CN116579803A (zh) 基于替代和关联作用的多品类联合需求预测方法及装置
CN110807646A (zh) 数据分析方法、装置和计算机可读存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140226

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20141010

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20141125

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20150630

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150903

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20150910

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151028

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20151029

R150 Certificate of patent or registration of utility model

Ref document number: 5835802

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150