JP7286259B2

JP7286259B2 - 特徴ベクトル生成装置、特徴ベクトル生成方法及び特徴ベクトル生成プログラム

Info

Publication number: JP7286259B2
Application number: JP2020149783A
Authority: JP
Inventors: 慧米川; コウ牛; 茂莉黒川
Original assignee: KDDI Corp
Current assignee: KDDI Corp
Priority date: 2020-09-07
Filing date: 2020-09-07
Publication date: 2023-06-05
Anticipated expiration: 2040-09-07
Also published as: JP2022044249A

Description

本発明は、特徴ベクトル生成装置、特徴ベクトル生成方法及び特徴ベクトル生成プログラムに関する。

幅広い業種で時系列データ分析が使われている。時系列データ分析では、過去のデータに基づいて将来のデータを推定する場面が多い。従来、線形の時系列解析手法（例えば、自己回帰和分移動平均モデル）がよく使われてきたが、機械学習手法も提案されている。機械学習技術は非線形な時系列データや複雑な周期の時系列データにも効果的に対応できる。

近年、時系列データの各アイテムに特徴ベクトルを割り当てることにより、アイテムのクラスタリングや時系列パターンの分類等を行う機械学習技術が提案されている。例えば、非特許文献１には、Ｗｏｒｄ２Ｖｅｃ（Ｄｏｃ２Ｖｅｃ）を利用して、全ユーザの時系列データセットの各アイテムに特徴ベクトルを割り当て、当該特徴ベクトルに基づいて、ユーザにアイテムの推薦を行うことが開示されている。また、非特許文献２には、時系列データのアイテム間の間隔を考慮して、各アイテムに特徴ベクトルの割り当てを行うことが開示されている。さらには、特許文献１には、異なるドメインに対応する時系列データのアイテムに関連性を持たせて特徴ベクトルを生成することが開示されている。

特開２０２０－５２５１８号公報

Ozsoy, Makbule Gulcin. "From word embeddings to item recommendation." arXiv preprint arXiv:1601.01356, ２０１６年 Hong, Shenda, et al. "Event2vec: Learning Representations of Events on Temporal Sequences." Asia-Pacific Web (APWeb) and Web-Age Information Management (WAIM) Joint Conference on Web and Big Data. Springer, Cham,２０１７年

特許文献１に示される、異なるドメインに対応する時系列データのアイテムに関連性を持たせて特徴ベクトルを生成する技術では、異なるドメイン間の時系列データセットの量的な不均衡が考慮されていないという問題があった。例えば、第１ドメインのデータの件数と第２ドメインのデータの件数に大きく差がある場合、データの件数が多く、アイテムの件数が多いドメインに偏って特徴ベクトルが生成されることにより、異なるドメインのアイテム間の関連性を十分に捉えられず、転移学習を精度良く行うことができないという問題がある。

そこで、本発明はこれらの点に鑑みてなされたものであり、一方のドメインに偏ることなく特徴ベクトルを生成することを目的とする。

本発明の第１の態様に係る特徴ベクトル生成装置は、所定のユーザが発生させたイベントに対応するアイテムを示すアイテム情報と、前記イベントが発生した時刻を示すイベント発生時刻とを含む時系列データであって、第１ドメインの時系列データである第１時系列データと、第２ドメインの時系列データである第２時系列データとを取得する時系列データ取得部と、前記第１時系列データに含まれる前記アイテム情報の件数と、前記第２時系列データに含まれる前記アイテム情報の件数とが略同一となるように、前記第１時系列データに含まれる当該アイテム情報の件数と前記第２時系列データに含まれる当該アイテム情報の件数の少なくともいずれかを調整する調整部と、前記調整部により前記件数が調整された後の前記第１時系列データである第１調整データに含まれる前記イベント発生時刻と、前記調整部により前記件数が調整された後の前記第２時系列データである第２調整データに含まれる前記イベント発生時刻に基づいて、前記第１調整データの一部と前記第２調整データの一部とを統合することにより統合データを複数生成する統合部と、前記統合部により統合された複数の前記統合データに基づいて、複数の前記統合データのそれぞれに含まれる複数の前記アイテム情報のそれぞれが示すアイテムの特徴を示す特徴ベクトルを生成する特徴ベクトル生成部と、を有する。

前記調整部は、前記第１時系列データに含まれる前記アイテム情報の件数である第１件数と、前記第２時系列データに含まれる前記アイテム情報の件数である第２件数とを算出し、当該アイテム情報が含まれる件数が多い時系列データに含まれる当該アイテム情報を前記第１件数と前記第２件数とに基づいて設定される確率で消去することにより、前記第１時系列データに含まれる前記アイテム情報の件数と前記第２時系列データに含まれる前記アイテム情報の件数のいずれかを調整してもよい。

前記調整部は、前記第１時系列データと前記第２時系列データとを統合した場合に、同じドメインの前記アイテム情報が連続して出現するとき、当該アイテム情報のいずれかを前記第１件数と前記第２件数とに基づいて設定される確率で消去し、異なるドメインの前記アイテム情報が連続して出現するとき、当該アイテム情報を消去しないように制御してもよい。

前記調整部は、前記第１時系列データに含まれる前記アイテム情報の件数である第１件数と、前記第２時系列データに含まれる前記アイテム情報の件数である第２件数とを算出し、前記第１件数と前記第２件数とに基づいて、当該アイテム情報が含まれる件数が少ない時系列データに当該アイテム情報を追加することにより、前記第１時系列データに含まれる前記アイテム情報の件数と前記第２時系列データに含まれる前記アイテム情報の件数のいずれかを調整してもよい。

本発明の第２の態様に係る特徴ベクトル生成方法は、コンピュータが実行する、所定のユーザが発生させたイベントに対応するアイテムを示すアイテム情報と、前記イベントが発生した時刻を示すイベント発生時刻とを含む時系列データであって、第１ドメインの時系列データである第１時系列データと、第２ドメインの時系列データである第２時系列データとを取得するステップと、前記第１時系列データに含まれる前記アイテム情報の件数と、前記第２時系列データに含まれる前記アイテム情報の件数とが略同一となるように、前記第１時系列データに含まれる当該アイテム情報の件数と前記第２時系列データに含まれる当該アイテム情報の件数の少なくともいずれかを調整するステップと、前記件数が調整された後の前記第１時系列データである第１調整データに含まれる前記イベント発生時刻と、前記件数が調整された後の前記第２時系列データである第２調整データに含まれる前記イベント発生時刻に基づいて、前記第１調整データの一部と前記第２調整データの一部とを統合することにより統合データを複数生成するステップと、複数の前記統合データに基づいて、複数の前記統合データのそれぞれに含まれる複数の前記アイテム情報のそれぞれが示すアイテムの特徴を示す特徴ベクトルを生成するステップと、を有する。

本発明の第３の態様に係る特徴ベクトル生成プログラムは、コンピュータを、所定のユーザが発生させたイベントに対応するアイテムを示すアイテム情報と、前記イベントが発生した時刻を示すイベント発生時刻とを含む時系列データであって、第１ドメインの時系列データである第１時系列データと、第２ドメインの時系列データである第２時系列データとを取得する時系列データ取得部、前記第１時系列データに含まれる前記アイテム情報の件数と、前記第２時系列データに含まれる前記アイテム情報の件数とが略同一となるように、前記第１時系列データに含まれる当該アイテム情報の件数と前記第２時系列データに含まれる当該アイテム情報の件数の少なくともいずれかを調整する調整部、前記調整部により前記件数が調整された後の前記第１時系列データである第１調整データに含まれる前記イベント発生時刻と、前記調整部により前記件数が調整された後の前記第２時系列データである第２調整データに含まれる前記イベント発生時刻に基づいて、前記第１調整データの一部と前記第２調整データの一部とを統合することにより統合データを複数生成する統合部、及び、前記統合部により統合された複数の前記統合データに基づいて、複数の前記統合データのそれぞれに含まれる複数の前記アイテム情報のそれぞれが示すアイテムの特徴を示す特徴ベクトルを生成する特徴ベクトル生成部、として機能させる。

本発明によれば、一方のドメインに偏ることなく特徴ベクトルを生成することができるという効果を奏する。

第１実施形態に係る特徴ベクトル生成装置の概要を説明する図である。第１実施形態に係る特徴ベクトル生成装置の構成を示す図である。第１実施形態に係る第１時系列データ及び第２時系列データの例を示す図である。第１実施形態に係る調整部による時系列データの調整例を示す図である。第１実施形態に係る統合データの生成例を示す図である。第１実施形態に係る第１特徴ベクトルに基づいて分類器を学習させた例を示す図である。第１実施形態に係る第２部分時系列データを含む部分時系列データに基づいて生成された第１特徴ベクトルを含めて分類器を学習させた例を示す図である。第１実施形態に係る分類器により第２特徴ベクトルが分類された例を示す図である。第１実施形態に係る特徴ベクトル生成装置がアイテムの特徴ベクトルを生成するときの処理の流れを示すフローチャートである。第１実施形態に係る特徴ベクトル生成装置が所定のイベントを発生させるユーザを予測するときの処理の流れを示すフローチャートである。

＜第１実施形態＞
［特徴ベクトル生成装置の概要］
図１は、第１実施形態に係る特徴ベクトル生成装置の概要を説明する図である。特徴ベクトル生成装置は、異なるドメインの時系列データを統合し、当該時系列データに含まれるアイテムの特徴を示す特徴ベクトルを生成するコンピュータである。

特徴ベクトル生成装置は、第１ドメインの時系列データである第１時系列データを取得するとともに、第２ドメインの時系列データである第２時系列データを取得する（図１の（１））。第１実施形態においてドメインは、時系列データの種別に基づいて時系列データを分類するための領域である。第１実施形態では、第１ドメインは、例えば、ＥＣ（Electronic Commerce）サイトにおけるアイテムの購入に関するユーザの行動を示す時系列データを含む領域であり、第２ドメインは、例えば、任意のウェブサイトにおけるユーザの閲覧行動を示す時系列データを含む領域である。

また、時系列データには、所定のユーザが発生させたイベントに対応するアイテムを示すアイテム情報と、当該イベントが発生した時刻を示すイベント発生時刻とが含まれている。

第１時系列データと第２時系列データとにおいて、アイテム情報の件数が大幅に異なる場合、アイテム情報が含まれている件数が多いドメインに偏って特徴ベクトルが生成されることにより、第１ドメインと第２ドメインとのアイテム間の関連性を十分に捉えられず、転移学習を精度良く行うことができないという問題がある。そこで、第１実施形態に係る特徴ベクトル生成装置１は、第１時系列データに含まれるアイテム情報の件数と第２時系列データに含まれるアイテム情報の件数とが略同一となるように、第１時系列データに含まれる当該アイテム情報の件数と第２時系列データに含まれる当該アイテム情報の件数の少なくともいずれかを調整する（図１の（２））。

特徴ベクトル生成装置は、件数が調整された後の第１時系列データである第１調整データに含まれるイベント発生時刻と、件数が調整された後の第２時系列データである第２調整データに含まれるイベント発生時刻とに基づいて、第１調整データの一部と、第２調整データの一部とを統合することにより、統合データを複数生成する（図１の（３））。

その後、特徴ベクトル生成装置は、生成した複数の統合データのそれぞれに含まれる複数のアイテム情報のそれぞれが示すアイテムの特徴を示す特徴ベクトルを生成する（図１の（４））。このようにすることで、特徴ベクトル生成装置は、取得した第１時系列データと第２時系列データに含まれるアイテム情報の件数が大幅に異なる場合であっても、第１時系列データと第２時系列データとにおける当該アイテム情報の件数を調整し、一方のドメインに偏ることなく特徴ベクトルを生成することができる。これにより、特徴ベクトル生成装置は、異なるドメインに対応する時系列データ間の転移学習を精度良く行うことができる。
以下、特徴ベクトル生成装置の構成について説明する。

［特徴ベクトル生成装置１の構成例］
図２は、第１実施形態に係る特徴ベクトル生成装置１の構成を示す図である。特徴ベクトル生成装置１は、記憶部１１と、制御部１２とを備える。

記憶部１１は、例えば、ＲＯＭ（Read Only Memory）及びＲＡＭ（Random Access Memory）等である。記憶部１１は、特徴ベクトル生成装置１を機能させるための各種プログラムを記憶する。例えば、記憶部１１は、特徴ベクトル生成装置１の制御部１２を、時系列データ取得部１２１、調整部１２２、統合部１２３、特徴ベクトル生成部１２４及び予測部１２５として機能させる特徴ベクトル生成プログラムを記憶する。

制御部１２は、例えばＣＰＵ（Central Processing Unit）である。制御部１２は、記憶部１１に記憶されている各種プログラムを実行することにより、特徴ベクトル生成装置１に係る機能を制御する。制御部１２は、記憶部１１に記憶されているプログラムを実行することにより、時系列データ取得部１２１、調整部１２２、統合部１２３、特徴ベクトル生成部１２４及び予測部１２５として機能する。

［アイテムの特徴ベクトルの生成］
第１実施形態において、時系列データ取得部１２１、調整部１２２、統合部１２３、特徴ベクトル生成部１２４は、協働することにより、時系列データに含まれるアイテムの特徴ベクトルを生成する。以下、アイテムの特徴ベクトルの生成に係る時系列データ取得部１２１、調整部１２２、統合部１２３及び特徴ベクトル生成部１２４の機能について説明する。

時系列データ取得部１２１は、所定のユーザが発生させたイベントに対応するアイテム情報と、当該イベントが発生した時刻を示すイベント発生時刻とを含む時系列データであって、第１ドメインの時系列データである第１時系列データと、第２ドメインの時系列データである第２時系列データとを取得する。例えば、時系列データ取得部１２１は、所定のユーザのＥＣサイトにおけるアイテムの閲覧及び購買履歴を示す情報を第１時系列データとして取得するとともに、当該所定のユーザのウェブサイトの閲覧履歴を示す情報を第２時系列データとして取得する。時系列データ取得部１２１は、例えば、第１時系列データと第２時系列データとを収集する情報収集サーバ（不図示）から、所定のユーザの第１時系列データと、第２時系列データとを取得する。

図３は、第１実施形態に係る第１時系列データ及び第２時系列データの例を示す図である。図３（ａ）には、第１時系列データＤ１が示されており、図３（ｂ）には、第２時系列データＤ２が示されている。

第１時系列データには、イベントに対応するアイテムを示すアイテム情報と、イベント発生時刻と、イベントを発生させたユーザを識別するためのユーザ識別情報とを関連付けたイベントデータが複数含まれている。図３に示す例において、ｖ１～ｖ７、ｐ１、ｗ１～ｗ３は、イベントデータを示している。図３に示す例において、イベントデータの表示形態は、イベントの種別を示している。

ここで、アイテムは、例えば、商品やサービスである。第１実施形態において、イベントデータに付した符号を、アイテムを識別するための識別情報とする。なお、異なる符号のアイテムは、同じアイテムであってもよいし、異なるアイテムであってもよい。例えば、イベントデータｐ１に対応するアイテムと、イベントデータｖ１に対応するアイテムは、同じであってもよいし、異なっていてもよい。

第１時系列データには、所定のイベントに対応するアイテム情報と、所定のイベントとは異なるイベントに対応するアイテム情報との少なくともいずれかが含まれている。また、第２時系列データにも、所定のイベントとは異なるイベントに対応するアイテム情報が含まれている。

例えば、第１時系列データにおいて、所定のイベントは、ユーザがＥＣサイト上でアイテムを購入するイベントである。また、第１時系列データにおいて、所定のイベントとは異なるイベントは、ユーザがＥＣサイトを閲覧するイベントである。図３（ａ）に示す例では、イベントデータｖ１～ｖ７に対応するイベントは、ＥＣサイトを閲覧するイベントであり、イベントデータｐ１に対応するイベントは、ＥＣサイト上でアイテムを購入するイベントである。また、第２ドメインにおいて、所定のイベントとは異なるイベントは、ウェブサイトを閲覧するイベントである。図３（ｂ）に示す例では、イベントデータｗ１～ｗ３に対応するイベントは、ウェブサイトを閲覧するイベントである。

また、図３に示される矢印は、イベントの発生時刻に対応している。例えば、第１時系列データＤ１では、ＥＣサイト上で、イベントデータｖ１～ｖ７に対応するアイテムが順番に閲覧され、その後、イベントデータｐ１に対応するアイテムが購入されたことを示している。

ユーザ識別情報は、ユーザを一意に特定するための情報であり、例えば、ユーザが使用する端末に割り当てられたＩＰアドレスである。なお、ユーザ識別情報として、ＥＣサイトにおいてユーザを識別するために用いられるユーザＩＤが用いられてもよいし、各ウェブサイトにおいてユーザを識別するために用いられるユーザＩＤが用いられてもよい。

第１時系列データは、例えば、ＥＣサイトにおけるアクセス履歴であり、ＥＣサイトにアクセスした所定のユーザが使用する端末のＩＰアドレスと、ＥＣサイトにおけるＵＲＬと、当該ＵＲＬへのアクセス時刻とを関連付けたイベントデータが複数含まれている。ＥＣサイトにおけるＵＲＬには、アイテムが購入された場合に端末に表示される購入完了ページのＵＲＬ及びアイテムを説明するページのＵＲＬが含まれている。アイテムが購入された場合に端末に表示される購入完了ページのＵＲＬは、アイテムの購入イベントに対応するアイテム情報に対応しており、アイテムを説明するページのＵＲＬは、アイテムの閲覧イベントを示すアイテム情報に対応している。また、ＵＲＬへのアクセス時刻が、イベントが発生した時刻に対応している。

第２時系列データは、例えば、ウェブサイトにおけるアクセス履歴であり、ウェブサイトにアクセスした所定のユーザが使用する端末のＩＰアドレスと、ウェブサイトにおけるＵＲＬと、当該ＵＲＬへのアクセス時刻とを関連付けたイベントデータが複数含まれている。ウェブサイトにおけるＵＲＬには、アイテムを説明するページのＵＲＬが含まれている。アイテムを説明するページのＵＲＬは、ウェブサイトにおけるアイテムの閲覧イベントに対応するアイテム情報に対応しており、ＵＲＬへのアクセス時刻が、イベントが発生した時刻に対応している。

調整部１２２は、第１時系列データに含まれるアイテム情報の件数と、第２時系列データに含まれるアイテム情報の件数とが略同一となるように、第１時系列データに含まれる当該アイテム情報の件数と第２時系列データに含まれる当該アイテム情報の件数の少なくともいずれかを調整する。

具体的には、まず、調整部１２２は、第１時系列データに含まれるアイテム情報の件数である第１件数と、第２時系列データに含まれるアイテム情報の件数である第２件数とを算出する。続いて、調整部１２２は、第１時系列データ及び第２時系列データのうち、アイテム情報が含まれる件数が多い時系列データに含まれるアイテム情報を、第１件数と第２件数とに基づいて設定される確率で消去することにより、第１時系列データに含まれるアイテム情報の件数と第２時系列データに含まれるアイテム情報の件数のいずれかを調整する。

より具体的には、調整部１２２は、第１時系列データと第２時系列データとを統合して１つの統合データを生成した場合に、当該統合データにおいて第１ドメインに対応するアイテム情報が含まれる確率である第１生起確率ｐ１と、第２ドメインに対応するアイテム情報が含まれる確率である第２生起確率ｐ２とを算出する。第１件数をｆ１、第２件数をｆ２とすると、第１生起確率ｐ１、第２生起確率ｐ２は、以下の式（１）、（２）で示される。

調整部１２２は、第１生起確率ｐ１が第２生起確率ｐ２よりも高い場合、以下の式（３）に示すように、第１時系列データに含まれる複数のアイテム情報ｗｉそれぞれを消去する消去確率Ｐ_ｄ（ｗｉ）を定義する。ここで、アイテム情報の数はｎ個であるものとし、ｉは０からｎまでの任意の整数であるものとする。

そして、調整部１２２は、第１生起確率ｐ１が第２生起確率ｐ２よりも高い場合、第１時系列データに含まれる複数のアイテム情報ｗｉのそれぞれに対し、式（３）により定義された消去確率Ｐ_ｄ（ｗｉ）に基づいて消去するか否かを決定する。調整部１２２は、消去することを決定したアイテム情報ｗｉを第１時系列データから消去する。

また、調整部１２２は、第２生起確率ｐ２が第１生起確率ｐ１よりも高い場合、以下の式（４）に示すように、対象アイテムｗｉに対応する消去確率Ｐ_ｄ（ｗｉ）を定義する。

そして、調整部１２２は、第２生起確率ｐ２が第１生起確率ｐ１よりも高い場合、第２時系列データに含まれる複数のアイテム情報ｗｉのそれぞれに対し、式（４）により定義された消去確率Ｐ_ｄ（ｗｉ）に基づいて消去するか否かを決定する。調整部１２２は、消去することを決定したアイテム情報ｗｉを第２時系列データから消去する。

これにより、アイテム情報ｗｉが消去された後の第１時系列データに含まれるアイテム情報の数と、第２時系列データに含まれるアイテム情報の数とは略同一となる。図４は、第１実施形態に係る調整部１２２による時系列データの調整例を示す図である。図４（ａ）は、調整部１２２による調整が行われる前の第１時系列データと第２時系列データとを統合して一つの統合データを生成したときの、当該統合データに含まれる複数のアイテム情報それぞれの生起確率を示すグラフである。図４（ｂ）は、調整部１２２による調整が行われた後の第１時系列データと第２時系列データとを統合して一つの統合データを生成したときの、当該統合データに含まれる複数のアイテム情報それぞれの生起確率を示すグラフである。

図４に示す例では、説明を簡単にするため、第１時系列データに７種類のアイテム情報が含まれ、第２時系列データに３種類のアイテム情報が含まれるものとする。図４（ａ）、（ｂ）に示すグラフの縦軸は、各アイテム情報の生起確率を示し、横軸は、各アイテム情報が属するドメインを示す値を示している。アイテム情報が属するドメインが第１ドメインである場合、ドメインを示す値は１であり、アイテム情報が属するドメインが第２ドメインである場合、ドメインを示す値は２である。

図４（ａ）に示すように、第１時系列データに含まれるアイテム情報の件数が、第２時系列データに含まれるアイテム情報の件数よりも多い場合、第２時系列データに含まれるアイテム情報の生起確率が低いことが確認できる。これに対し、調整部１２２による調整が行われた後では、第１時系列データに含まれるアイテム情報の件数と、第２時系列データに含まれるアイテム情報の件数とが略同一となり、第１時系列データに含まれる７種類のアイテム情報の生起確率の合計と、第２時系列データに含まれる３種類のアイテム情報の生起確率の合計とがともに約０．５となっていることが確認できる。

なお、調整部１２２は、アイテム情報が含まれる件数が多い時系列データからアイテム情報を消去する際に、同一の長さの複数の期間それぞれに含まれるアイテム情報がほぼ同数となるようにアイテム情報を消去してもよい。

また、調整部１２２は、アイテム情報が含まれる件数が多い時系列データから、アイテム情報を消去することにより、第１時系列データに含まれるアイテム情報の件数と第２時系列データに含まれるアイテム情報の件数のいずれかを調整したが、これに限らない。

調整部１２２は、第１件数と第２件数とに基づいて、アイテム情報が含まれる件数が少ない時系列データに当該アイテム情報を追加することにより、第１時系列データに含まれるアイテム情報の件数と前記第２時系列データに含まれるアイテム情報の件数の少なくともいずれかを調整してもよい。

例えば、調整部１２２は、第１時系列データに含まれるアイテム情報の件数である第１件数が、第２時系列データに含まれるアイテム情報の件数である第２件数に比べて少ない場合、第１時系列データに当該アイテム情報を追加し、第１件数と第２件数とが等しくなるようにしてもよい。調整部１２２は、第１時系列データにアイテム情報を追加する場合に、第１時系列データに既に含まれているアイテム情報と同じアイテム情報を追加する。また、調整部１２２は、同一の長さの複数の期間それぞれに含まれるアイテム情報がほぼ同数となるようにアイテム情報を追加してもよい。このようにすることで、一方の時系列データにおいてアイテム情報の件数が著しく少ない場合に、アイテム情報の数を増加させて、双方の時系列データに含まれるアイテム情報の件数のバランスをとることができる。

また、調整部１２２は、第１時系列データ及び第２時系列データのうち、いずれか一方の時系列データのアイテム情報を消去したり追加したりしてアイテム情報の件数を調整したが、これに限らない。調整部１２２は、第１時系列データ及び第２時系列データの双方のアイテム情報を消去したり追加したりしてアイテム情報の件数を調整してもよい。

統合部１２３は、調整部１２２により件数が調整された後の第１時系列データである第１調整データに含まれるイベント発生時刻と、調整部１２２により件数が調整された後の第２時系列データである第２調整データに含まれるイベント発生時刻に基づいて、第１調整データの一部と第２調整データの一部とを統合することにより統合データを複数生成する。

具体的には、統合部１２３は、第１調整データから、当該第１調整データに含まれる所定のイベントの発生時刻を含み、当該発生時刻以前の期間に対応する時系列データである第１部分時系列データを抽出する。例えば、統合部１２３は、第１調整データから、所定のイベントの発生時刻から３０分前までの期間をデータ抽出期間に特定し、データ抽出期間に対応する時系列データを第１部分時系列データとして抽出する。

続いて、統合部１２３は、第２調整データから、当該所定のイベントの発生時刻以前の期間に対応する時系列データである第２部分時系列データを抽出する。例えば、統合部１２３は、当該第２調整データから、第１部分時系列データに対して特定されたデータ抽出期間と同じ期間に対応する時系列データを第２部分時系列データとして抽出する。そして、統合部１２３は、当該第１部分時系列データと、当該第２部分時系列データとを統合することにより統合データを生成する。

図５は、第１実施形態に係る統合データの生成例を示す図である。図５では、第１調整データから抽出された第１部分時系列データＤ１Ａと、第２調整データから抽出された第２部分時系列データＤ２Ａが統合され、統合データｄ１が生成されていることが確認できる。

ここで、統合部１２３は、統合データに含まれるアイテム情報の数が予め定められた数となるように統合データを生成してもよい。例えば、統合部１２３は、第１部分時系列データに含まれるアイテム情報の数が第１の数になるように第１部分時系列データを抽出するとともに、第２部分時系列データに含まれるアイテム情報の数が第２の数になるよう第２部分時系列データを抽出してもよい。

例えば、統合部１２３は、第１調整データにおいて、第１部分時系列データに含まれるアイテム情報の数が第１の数となるデータ抽出期間を特定する。そして、統合部１２３は、特定したデータ抽出期間に対応する第２調整データを第２部分時系列データとして抽出する。

なお、統合部１２３は、第１調整データにおいて、第１部分時系列データに含まれるアイテム情報の数が第１の数となるようにデータ抽出期間を特定し、当該データ抽出期間に基づいて統合データを生成したが、これに限らない。統合部１２３は、統合データに含まれるイベントデータに対応するイベントが発生した期間が予め定められた所定期間となるように統合データを生成してもよい。このようにすることで、特徴ベクトル生成装置１は、第１の数及び第２の数に基づいてデータ抽出期間を設定することにより、当該期間が大幅に長くなり、所定のイベントとは関係がないイベントに対応するアイテム情報が統合データに含まれてしまうことを抑制することができる。

また、統合部１２３は、統合データに含まれる所定のイベントとしてのアイテムの購入イベントに対応するイベントデータが予め定められた数となるように統合データを生成するようにしてもよい。例えば、統合部１２３は、購入イベントに対応するイベントデータが統合データに１つのみ含まれるように統合データを生成してもよい。例えば、アイテムの購入が短期間に連続した場合、第１のアイテムの購入前のアイテムの閲覧イベントと、第２のアイテムの購入前のアイテムの閲覧イベントとは関係がない可能性が高い。これに対し、特徴ベクトル生成装置１は、アイテムの購入イベントが短期間に連続した場合に、アイテムの購入イベントに関係する可能性が高いアイテムの閲覧イベントに対応するイベントデータのみを統合データに含めることができる。

また、統合部１２３は、所定のイベントに対応するイベントデータが含まれるように統合データを生成したが、これに限らない。統合部１２３は、第１調整データに所定のイベントに対応するイベントデータが含まれていない場合には、第１調整データから、任意の期間に対応する時系列データを第１部分時系列データとして抽出してもよい。この場合、統合部１２３は、第２調整データから、当該任意の期間に対応する時系列データを第２部分時系列データとして抽出し、当該第１部分時系列データと当該第２部分時系列データとを統合することにより統合データを生成してもよい。このようにすることで、特徴ベクトル生成装置１は、アイテムの購入が行われなかった場合におけるアイテム閲覧状況に基づく特徴ベクトルを生成することができる。

特徴ベクトル生成部１２４は、統合部１２３により統合された複数の統合データに基づいて、複数の統合データのそれぞれに含まれる複数のアイテム情報のそれぞれが示すアイテムの特徴を示す特徴ベクトルを生成する。

具体的には、特徴ベクトル生成部１２４は、複数の統合データに含まれるイベントデータに含まれているアイテム情報を抽出する。特徴ベクトル生成部１２４は、抽出した複数のアイテム情報が示すアイテムの関係を解析することにより、複数のアイテムのそれぞれの特徴を示す特徴ベクトルを生成する。

例えば、特徴ベクトル生成部１２４は、複数のアイテムのそれぞれを１つの単語とみなし、複数の統合データのそれぞれにおいて、当該単語を連結した文章を生成する。特徴ベクトル生成部１２４は、生成した複数の文章について、例えば、Ｗｏｒｄ２Ｖｅｃを用いることにより、複数のアイテムのそれぞれの特徴ベクトルを生成する。特徴ベクトルの要素数は、例えば、アイテムの数に対応するものとする。

［転移学習及び所定のイベントの発生予測］
第１実施形態において、特徴ベクトル生成部１２４及び予測部１２５は、協働することにより、異なるドメインに対応する時系列データ間の転移学習を行うとともに、第２調整データに対応するユーザが、所定のイベントを発生させるか否かを予測する。これにより、特徴ベクトル生成装置１は、異なるドメインに対応する時系列データ間の転移学習を行う学習装置、及び第２調整データに対応するユーザが所定のイベントを発生させるか否かを予測する予測装置として機能する。以下、転移学習及び所定のイベントの発生予測に係る特徴ベクトル生成部１２４及び予測部１２５の機能について説明する。

特徴ベクトル生成部１２４は、第１調整データに含まれる複数のアイテム情報が示す複数のアイテムのそれぞれの特徴ベクトルに基づいて、第１調整データに対応するユーザの特徴ベクトルを第１特徴ベクトルとして生成する。

例えば、特徴ベクトル生成部１２４は、統合部１２３と同様に、第１調整データから、当該第１調整データに含まれる所定のイベントであるアイテムの購入イベントの発生時刻を含み、当該発生時刻以前の期間に対応する時系列データである第１部分時系列データを抽出する。ここで、特徴ベクトル生成部１２４は、第１部分時系列データに含まれるイベントデータの数が第１の数となるように第１部分時系列データを抽出する。

また、特徴ベクトル生成部１２４は、第１調整データから、所定のイベントであるアイテムの購入イベントに対応するイベントデータが含まれていない期間に対応し、第１の数のイベントデータを含む第１部分時系列データを抽出する。

そして、特徴ベクトル生成部１２４は、第１部分時系列データに含まれる複数のアイテム情報のそれぞれに対して生成された特徴ベクトルの平均値（例えば、算出平均値や加重平均値）を算出することにより、第１特徴ベクトルを生成する。

予測部１２５は、複数の第１特徴ベクトルと、当該第１特徴ベクトルに対応するユーザが所定のイベントを発生させたか否かの結果とに基づいて、ユーザの特徴ベクトルの入力に対して、当該ユーザを、所定のイベントを発生させたユーザと、当該所定のイベントを発生させなかったユーザとに分類する分類器を生成する。

例えば、予測部１２５は、第１特徴ベクトルの生成元となった第１部分時系列データのうち、アイテムの購入イベントを含む部分時系列データを正例データとし、アイテムの購入イベントを含まない部分時系列データを負例データとする。そして、予測部１２５は、これらの正例データ及び負例データに基づいて機械学習を行うことにより、ユーザの特徴ベクトルの入力に対して、当該ユーザを、アイテムの購入イベントを発生させたユーザと、アイテムの購入イベントを発生させなかったユーザとに分類する分類器を生成する。

図６は、第１実施形態に係る第１特徴ベクトルに基づいて分類器を学習させた例を示す図である。なお、図６では、説明の便宜上、第１特徴ベクトルを二次元に圧縮して特徴空間に配置した例を示している。図６に示すマークＭ３は、正例データに対応する第１特徴ベクトルを示し、マークＭ４は、負例データに対応する第１特徴ベクトルを示している。また、境界線Ｌは、分類器により第１特徴ベクトルを正例データと負例データとを分類したときの境界線を示している。なお、境界線は、説明の便宜上示すものであり、実際には境界線は生成されるものではない。

なお、予測部１２５は、分類器を生成するにあたり、統合部１２３が生成した、第２部分時系列データを含む統合データに基づいて第１特徴ベクトルを生成し、当該第１特徴ベクトルを含めて分類器を生成してもよい。図７は、第１実施形態に係る第２部分時系列データを含む統合データに基づいて生成された第１特徴ベクトルを含めて分類器を学習させた例を示す図である。図７には、図６と同様に正例データに対応する第１特徴ベクトルを示すマークＭ３と、負例データに対応する第１特徴ベクトルを示すマークＭ４とともに、これらのマークと異なるマークＭ５と、マークＭ６とが表示されている。

図７に示すマークＭ５は、正例データに対応する第１特徴ベクトルであって、第２部分時系列データを含む統合データに基づいて生成された第１特徴ベクトルを示している。また、マークＭ６は、負例データに対応する第１特徴ベクトルであって、第２部分時系列データを含む統合データに基づいて生成された第１特徴ベクトルを示している。また、境界線Ｌ２は、分類器により第１特徴ベクトルを正例データと負例データとを分類したときの境界線を示している。図７に示す例は、図６に示す例に比べて正例データと負例データとが増加したことにより、境界線Ｌ２の位置が境界線Ｌに比べて若干異なっていることが確認できる。

特徴ベクトル生成部１２４は、調整部１２２が調整した第２調整データに含まれる複数のアイテム情報が示す複数のアイテムのそれぞれの特徴ベクトルに基づいて、第２調整データに対応するユーザの特徴ベクトルを第２特徴ベクトルとして生成する。例えば、特徴ベクトル生成部１２４は、第２調整データのうち、最新の時刻から所定期間に含まれるイベントデータに基づいて第２部分時系列データを生成する。そして、特徴ベクトル生成部１２４は、第２部分時系列データに含まれる複数のアイテム情報のそれぞれに対して生成された特徴ベクトルの平均値を算出することにより、第２特徴ベクトルを生成する。

予測部１２５は、生成した分類器に第２特徴ベクトルを入力することにより、第２特徴ベクトルに対応するユーザを、所定のイベントを発生させると予測されるユーザと、所定のイベントを発生させないと予測されるユーザとに分類し、分類結果を示す情報を出力する。

図８は、第１実施形態に係る分類器により第２特徴ベクトルが分類された例を示す図である。図８に示す例は、図６に対応する分類器により第２特徴ベクトルを分類した例を示しており、図６と同じ境界線Ｌが表示されている。図８に示すマークＭ７は、所定のイベントを発生させると予測されたユーザに対応する第２特徴ベクトルを示している。また、マークＭ８は、所定のイベントを発生させないと予測されたユーザに対応する第２特徴ベクトルを示している。このようにすることで、特徴ベクトル生成装置１は、異なるドメインに対応する時系列データ間の転移学習を精度良く行うことができる。

［特徴ベクトル生成装置１における処理の流れ］
続いて、特徴ベクトル生成装置１における処理の流れの一例について説明する。まず、特徴ベクトル生成装置１がアイテムの特徴ベクトルを生成するときの処理の流れについて説明する。図９は、第１実施形態に係る特徴ベクトル生成装置１がアイテムの特徴ベクトルを生成するときの処理の流れを示すフローチャートである。

まず、時系列データ取得部１２１は、所定ユーザの第１時系列データと第２時系列データを取得する（Ｓ１）。
続いて、調整部１２２は、第１時系列データに含まれるアイテム情報の件数と、第２時系列データに含まれるアイテム情報の件数とが略同一となるように、第１時系列データ又は第２時系列データに含まれるアイテム情報の件数を調整する（Ｓ２）。

続いて、統合部１２３は、調整部１２２により調整が行われた後の第１時系列データである第１調整データ及び第２調整データに含まれるイベント発生時刻に基づいて、第１調整データの一部と第２調整データの一部とを統合することにより統合データを複数生成する（Ｓ３）。

続いて、特徴ベクトル生成部１２４は、複数の統合データのそれぞれに含まれる複数のアイテム情報のそれぞれが示すアイテムの特徴を示す特徴ベクトルを生成する（Ｓ４）。

続いて、特徴ベクトル生成装置１が所定のイベントを発生させるユーザを予測するときの処理の流れについて説明する。図１０は、第１実施形態に係る特徴ベクトル生成装置１が所定のイベントを発生させるユーザを予測するときの処理の流れを示すフローチャートである。なお、本フローチャートの開始時に、調整部１２２が第１調整データ及び第２調整データを生成しており、特徴ベクトル生成部１２４が複数のアイテムの特徴ベクトルを生成しているものとする。

まず、特徴ベクトル生成部１２４は、第１調整データに基づいて第１部分時系列データを複数生成する（Ｓ１１）。
続いて、特徴ベクトル生成部１２４は、Ｓ１１において生成された複数の第１部分時系列データのそれぞれについて、当該第１部分時系列データに含まれるアイテム情報が示すアイテムの特徴ベクトルに基づいて第１特徴ベクトルを複数生成する（Ｓ１２）。

続いて、予測部１２５は、Ｓ１２において生成された複数の第１特徴ベクトルと、当該第１特徴ベクトルに対応するユーザが所定のイベント（アイテムの購入イベント）を発生させたか否かの結果とに基づいて、ユーザの特徴ベクトルの入力に対して、当該ユーザを、所定のイベントを発生させたユーザと、当該所定のイベントを発生させなかったユーザとに分類する分類器を生成する（Ｓ１３）。

続いて、特徴ベクトル生成部１２４は、第２調整データに基づいて第２部分時系列データを生成する（Ｓ１４）。
続いて、特徴ベクトル生成部１２４は、Ｓ１４において生成された複数の第２部分時系列データのそれぞれについて、当該第２部分時系列データに含まれるアイテム情報が示すアイテムの特徴ベクトルに基づいて第２特徴ベクトルを複数生成する（Ｓ１５）。

続いて、予測部１２５は、Ｓ１３において生成された分類器に、Ｓ１５において生成された第２特徴ベクトルを入力することにより、当該第２特徴ベクトルに対応するユーザを、所定のイベントを発生させると予測されるユーザと、所定のイベントを発生させないと予測されるユーザとに分類する（Ｓ１６）。
続いて、予測部１２５は、Ｓ１６における分類結果を出力する（Ｓ１７）。例えば、予測部１２５は、分類結果を示す情報を含むファイルを生成し、当該ファイルを記憶部１１に記憶させる。

［第１実施形態における効果］
以上の通り、第１実施形態に係る特徴ベクトル生成装置１は、複数の第１時系列データ及び第２時系列データに含まれる時刻と、第１時系列データ及び第２時系列データに含まれるユーザ識別情報の対応関係とに基づいて、第１時系列データの一部と第２時系列データの一部とを統合することにより統合データを複数生成する。そして、特徴ベクトル生成装置１は、統合された複数の統合データに基づいて、複数の統合データのそれぞれに含まれる複数のアイテム情報のそれぞれが示すアイテムの特徴を示す特徴ベクトルを生成する。このようにすることで、特徴ベクトル生成装置１は、異なるドメインに対応する時系列データのアイテムに関連性を持たせて特徴ベクトルを生成することができる。これにより、特徴ベクトル生成装置１は、異なるドメインに対応する時系列データ間の転移学習を精度良く行うことができる。

＜第２実施形態＞
続いて、第２実施形態に係る特徴ベクトル生成装置１の説明を行う。第１実施形態に係る特徴ベクトル生成装置１の調整部１２２は、第１時系列データに含まれる前記アイテム情報の件数と、第２時系列データに含まれるアイテム情報の件数とが略同一となるように、第１時系列データに含まれる当該アイテム情報の件数と第２時系列データに含まれる当該アイテム情報の件数の少なくともいずれかを調整した。

しかしながら、第１時系列データに含まれるアイテム情報の件数と、第２時系列データに含まれるアイテム情報の件数とが略同一となっても、異なるドメインのアイテムに遷移する確率が少ないと、ドメイン間の遷移を考慮した学習を十分に行うことができないという問題が発生する。これに対し、第２実施形態に係る特徴ベクトル生成装置１は、異なるドメインのアイテムに遷移する確率である遷移確率を第１実施形態における当該遷移確率に比べて高くする。以下、第２実施形態に係る特徴ベクトル生成装置１について説明する。なお、第１実施形態と同じ部分については、説明を適宜省略する。

第２実施形態において、調整部１２２は、第１時系列データと第２時系列データとを統合した場合に、同じドメインのアイテム情報が連続して出現するとき、当該アイテム情報のいずれかを第１件数と第２件数とに基づいて設定される確率で消去し、異なるドメインのアイテム情報が連続して出現するとき、当該アイテム情報を消去しないように制御する。

具体的には、まず、調整部１２２は、式（５）に基づいて、第１時系列データと第２時系列データとを統合した場合に異なるドメインに遷移する確率ｐ_ｋ｜ｌを算出する。

そして、調整部１２２は、第１生起確率ｐ１が第２生起確率ｐ２よりも高い場合において、第１時系列データと第２時系列データとを統合した時系列データに含まれるアイテム情報ｗｉが、先頭のアイテム情報であるとき、式（３）に基づいて消去確率を定義する。また、調整部１２２は、第２生起確率ｐ２が第１生起確率ｐ１よりも高い場合において、第１時系列データと第２時系列データとを統合した時系列データに含まれるアイテム情報ｗｉが、先頭のアイテム情報であるとき、式（４）に基づいて消去確率を定義する。

また、調整部１２２は、アイテム情報が先頭ではない場合において、アイテム情報ｗｉが属するドメインと、アイテム情報ｗｊが属するドメインとが異なるときにはアイテム情報ｗｉを消去しない。他方、調整部１２２は、アイテム情報ｗｉが属するドメインと、アイテム情報ｗｊが属するドメインとが同じであるとき、式（５）に示される遷移確率と、以下の式（６）とに基づいて、アイテム情報ｗｊの後にアイテム情報ｗｉが出現したときの消去確率を算出する。ここで、ｄ（ｗｉ）は、アイテム情報のドメインを返す関数であるものとする。

例えば、第１生起確率ｐ１が第２生起確率ｐ２よりも高い場合、式（６）に基づき、第１ドメインに属するアイテム情報が連続して出現するときの消去確率は、第２ドメインに属するアイテム情報が連続して出現するときの消去確率に比べて高くなる。

なお、本実施形態では、調整部１２２は、アイテム情報ｗｉと、アイテム情報ｗｉの直前のアイテム情報ｗｊの属するドメインが異なるか否かで消去確率を調整したが、これに限らない。例えば、調整部１２２は、アイテム情報ｗｉと、アイテム情報ｗｉの直前に出現する複数のアイテム情報の属するドメインが異なるか否かで消去確率を調整してもよい。また、調整部１２２は、アイテム情報ｗｉの直前の複数のアイテム情報が属するドメインから、アイテム情報ｗｉの直後のアイテム情報のドメインを予測するように学習したＬＳＴＭ（Long Short Term Memory）等の機械学習のモデルを用いて、アイテム情報のドメインを予測し、当該予測の結果に基づくドメインの遷移状況に基づいて消去確率を調整してもよい。

［第２実施形態における効果］
以上の通り、第２実施形態に係る特徴ベクトル生成装置１は、調整部１２２は、第１時系列データと第２時系列データとを統合した場合に、同じドメインのアイテム情報が連続して出現するとき、当該アイテム情報のいずれかを第１件数と第２件数とに基づいて設定される確率で消去し、異なるドメインのアイテム情報が連続して出現するとき、当該アイテム情報を消去しないように制御する。このようにすることで、特徴ベクトル生成装置１は、第１実施形態に係る特徴ベクトル生成装置１に比べて、異なるドメインのアイテムに遷移する遷移確率を高めて、ドメイン間の遷移を考慮した学習を適切に行うことができる。

以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されず、その要旨の範囲内で種々の変形及び変更が可能である。例えば、装置の全部又は一部は、任意の単位で機能的又は物理的に分散・統合して構成することができる。

また、例えば、上述の実施形態では、イベントデータをユーザが発生させたものとしたが、これに限らず、デバイスが発生させたものであってもよい。この場合、イベントデータに対応するユーザ識別情報は、デバイスを識別するデバイス識別情報であってもよい。

また、上述の実施形態では、特徴ベクトル生成装置１は、第１ドメインの第１時系列データの一部と、第２ドメインの第２時系列データの一部とを統合することにより統合データを生成し、当該統合データに基づいて、アイテムの特徴を示す特徴ベクトルを生成したが、これに限らない。特徴ベクトル生成装置１は、３つ以上のドメインのそれぞれに対応する時系列データの一部を統合することにより統合データを生成し、当該統合データに基づいて、アイテムの特徴を示す特徴ベクトルを生成してもよい。

また、複数の実施の形態の任意の組み合わせによって生じる新たな実施の形態も、本発明の実施の形態に含まれる。組み合わせによって生じる新たな実施の形態の効果は、もとの実施の形態の効果を併せ持つ。

１・・・特徴ベクトル生成装置、１１・・・記憶部、１２・・・制御部、１２１・・・時系列データ取得部、１２２・・・調整部、１２３・・・統合部、１２４・・・特徴ベクトル生成部、１２５・・・予測部

Claims

所定のユーザが発生させたイベントに対応するアイテムを示すアイテム情報と、前記イベントが発生した時刻を示すイベント発生時刻とを含む時系列データであって、第１ドメインの時系列データである第１時系列データと、第２ドメインの時系列データである第２時系列データとを取得する時系列データ取得部と、
前記第１時系列データに含まれる前記アイテム情報の件数と、前記第２時系列データに含まれる前記アイテム情報の件数とが略同一となるように、前記第１時系列データに含まれる当該アイテム情報の件数と前記第２時系列データに含まれる当該アイテム情報の件数の少なくともいずれかを調整する調整部と、
前記調整部により前記件数が調整された後の前記第１時系列データである第１調整データに含まれる前記イベント発生時刻と、前記調整部により前記件数が調整された後の前記第２時系列データである第２調整データに含まれる前記イベント発生時刻に基づいて、前記第１調整データの一部と前記第２調整データの一部とを統合することにより統合データを複数生成する統合部と、
前記統合部により統合された複数の前記統合データに基づいて、複数の前記統合データのそれぞれに含まれる複数の前記アイテム情報のそれぞれが示すアイテムの特徴を示す特徴ベクトルを生成する特徴ベクトル生成部と、
を有する特徴ベクトル生成装置。
前記調整部は、前記第１時系列データに含まれる前記アイテム情報の件数である第１件数と、前記第２時系列データに含まれる前記アイテム情報の件数である第２件数とを算出し、当該アイテム情報が含まれる件数が多い時系列データに含まれる当該アイテム情報を前記第１件数と前記第２件数とに基づいて設定される確率で消去することにより、前記第１時系列データに含まれる前記アイテム情報の件数と前記第２時系列データに含まれる前記アイテム情報の件数のいずれかを調整する、
請求項１に記載の特徴ベクトル生成装置。
前記調整部は、前記第１時系列データと前記第２時系列データとを統合した場合に、同じドメインの前記アイテム情報が連続して出現するとき、当該アイテム情報のいずれかを前記第１件数と前記第２件数とに基づいて設定される確率で消去し、異なるドメインの前記アイテム情報が連続して出現するとき、当該アイテム情報を消去しないように制御する、
請求項２に記載の特徴ベクトル生成装置。
前記調整部は、前記第１時系列データに含まれる前記アイテム情報の件数である第１件数と、前記第２時系列データに含まれる前記アイテム情報の件数である第２件数とを算出し、前記第１件数と前記第２件数とに基づいて、当該アイテム情報が含まれる件数が少ない時系列データに当該アイテム情報を追加することにより、前記第１時系列データに含まれる前記アイテム情報の件数と前記第２時系列データに含まれる前記アイテム情報の件数のいずれかを調整する、
請求項１に記載の特徴ベクトル生成装置。
コンピュータが実行する、
所定のユーザが発生させたイベントに対応するアイテムを示すアイテム情報と、前記イベントが発生した時刻を示すイベント発生時刻とを含む時系列データであって、第１ドメインの時系列データである第１時系列データと、第２ドメインの時系列データである第２時系列データとを取得するステップと、
前記第１時系列データに含まれる前記アイテム情報の件数と、前記第２時系列データに含まれる前記アイテム情報の件数とが略同一となるように、前記第１時系列データに含まれる当該アイテム情報の件数と前記第２時系列データに含まれる当該アイテム情報の件数の少なくともいずれかを調整するステップと、
前記件数が調整された後の前記第１時系列データである第１調整データに含まれる前記イベント発生時刻と、前記件数が調整された後の前記第２時系列データである第２調整データに含まれる前記イベント発生時刻に基づいて、前記第１調整データの一部と前記第２調整データの一部とを統合することにより統合データを複数生成するステップと、
複数の前記統合データに基づいて、複数の前記統合データのそれぞれに含まれる複数の前記アイテム情報のそれぞれが示すアイテムの特徴を示す特徴ベクトルを生成するステップと、
を有する特徴ベクトル生成方法。
コンピュータを、
所定のユーザが発生させたイベントに対応するアイテムを示すアイテム情報と、前記イベントが発生した時刻を示すイベント発生時刻とを含む時系列データであって、第１ドメインの時系列データである第１時系列データと、第２ドメインの時系列データである第２時系列データとを取得する時系列データ取得部、
前記第１時系列データに含まれる前記アイテム情報の件数と、前記第２時系列データに含まれる前記アイテム情報の件数とが略同一となるように、前記第１時系列データに含まれる当該アイテム情報の件数と前記第２時系列データに含まれる当該アイテム情報の件数の少なくともいずれかを調整する調整部、
前記調整部により前記件数が調整された後の前記第１時系列データである第１調整データに含まれる前記イベント発生時刻と、前記調整部により前記件数が調整された後の前記第２時系列データである第２調整データに含まれる前記イベント発生時刻に基づいて、前記第１調整データの一部と前記第２調整データの一部とを統合することにより統合データを複数生成する統合部、及び、
前記統合部により統合された複数の前記統合データに基づいて、複数の前記統合データのそれぞれに含まれる複数の前記アイテム情報のそれぞれが示すアイテムの特徴を示す特徴ベクトルを生成する特徴ベクトル生成部、
として機能させる特徴ベクトル生成プログラム。