JP7286259B2 - 特徴ベクトル生成装置、特徴ベクトル生成方法及び特徴ベクトル生成プログラム - Google Patents
特徴ベクトル生成装置、特徴ベクトル生成方法及び特徴ベクトル生成プログラム Download PDFInfo
- Publication number
- JP7286259B2 JP7286259B2 JP2020149783A JP2020149783A JP7286259B2 JP 7286259 B2 JP7286259 B2 JP 7286259B2 JP 2020149783 A JP2020149783 A JP 2020149783A JP 2020149783 A JP2020149783 A JP 2020149783A JP 7286259 B2 JP7286259 B2 JP 7286259B2
- Authority
- JP
- Japan
- Prior art keywords
- time
- series data
- data
- item information
- items
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
[特徴ベクトル生成装置の概要]
図1は、第1実施形態に係る特徴ベクトル生成装置の概要を説明する図である。特徴ベクトル生成装置は、異なるドメインの時系列データを統合し、当該時系列データに含まれるアイテムの特徴を示す特徴ベクトルを生成するコンピュータである。
以下、特徴ベクトル生成装置の構成について説明する。
図2は、第1実施形態に係る特徴ベクトル生成装置1の構成を示す図である。特徴ベクトル生成装置1は、記憶部11と、制御部12とを備える。
第1実施形態において、時系列データ取得部121、調整部122、統合部123、特徴ベクトル生成部124は、協働することにより、時系列データに含まれるアイテムの特徴ベクトルを生成する。以下、アイテムの特徴ベクトルの生成に係る時系列データ取得部121、調整部122、統合部123及び特徴ベクトル生成部124の機能について説明する。
第1実施形態において、特徴ベクトル生成部124及び予測部125は、協働することにより、異なるドメインに対応する時系列データ間の転移学習を行うとともに、第2調整データに対応するユーザが、所定のイベントを発生させるか否かを予測する。これにより、特徴ベクトル生成装置1は、異なるドメインに対応する時系列データ間の転移学習を行う学習装置、及び第2調整データに対応するユーザが所定のイベントを発生させるか否かを予測する予測装置として機能する。以下、転移学習及び所定のイベントの発生予測に係る特徴ベクトル生成部124及び予測部125の機能について説明する。
続いて、特徴ベクトル生成装置1における処理の流れの一例について説明する。まず、特徴ベクトル生成装置1がアイテムの特徴ベクトルを生成するときの処理の流れについて説明する。図9は、第1実施形態に係る特徴ベクトル生成装置1がアイテムの特徴ベクトルを生成するときの処理の流れを示すフローチャートである。
続いて、調整部122は、第1時系列データに含まれるアイテム情報の件数と、第2時系列データに含まれるアイテム情報の件数とが略同一となるように、第1時系列データ又は第2時系列データに含まれるアイテム情報の件数を調整する(S2)。
続いて、特徴ベクトル生成部124は、S11において生成された複数の第1部分時系列データのそれぞれについて、当該第1部分時系列データに含まれるアイテム情報が示すアイテムの特徴ベクトルに基づいて第1特徴ベクトルを複数生成する(S12)。
続いて、特徴ベクトル生成部124は、S14において生成された複数の第2部分時系列データのそれぞれについて、当該第2部分時系列データに含まれるアイテム情報が示すアイテムの特徴ベクトルに基づいて第2特徴ベクトルを複数生成する(S15)。
続いて、予測部125は、S16における分類結果を出力する(S17)。例えば、予測部125は、分類結果を示す情報を含むファイルを生成し、当該ファイルを記憶部11に記憶させる。
以上の通り、第1実施形態に係る特徴ベクトル生成装置1は、複数の第1時系列データ及び第2時系列データに含まれる時刻と、第1時系列データ及び第2時系列データに含まれるユーザ識別情報の対応関係とに基づいて、第1時系列データの一部と第2時系列データの一部とを統合することにより統合データを複数生成する。そして、特徴ベクトル生成装置1は、統合された複数の統合データに基づいて、複数の統合データのそれぞれに含まれる複数のアイテム情報のそれぞれが示すアイテムの特徴を示す特徴ベクトルを生成する。このようにすることで、特徴ベクトル生成装置1は、異なるドメインに対応する時系列データのアイテムに関連性を持たせて特徴ベクトルを生成することができる。これにより、特徴ベクトル生成装置1は、異なるドメインに対応する時系列データ間の転移学習を精度良く行うことができる。
続いて、第2実施形態に係る特徴ベクトル生成装置1の説明を行う。第1実施形態に係る特徴ベクトル生成装置1の調整部122は、第1時系列データに含まれる前記アイテム情報の件数と、第2時系列データに含まれるアイテム情報の件数とが略同一となるように、第1時系列データに含まれる当該アイテム情報の件数と第2時系列データに含まれる当該アイテム情報の件数の少なくともいずれかを調整した。
以上の通り、第2実施形態に係る特徴ベクトル生成装置1は、調整部122は、第1時系列データと第2時系列データとを統合した場合に、同じドメインのアイテム情報が連続して出現するとき、当該アイテム情報のいずれかを第1件数と第2件数とに基づいて設定される確率で消去し、異なるドメインのアイテム情報が連続して出現するとき、当該アイテム情報を消去しないように制御する。このようにすることで、特徴ベクトル生成装置1は、第1実施形態に係る特徴ベクトル生成装置1に比べて、異なるドメインのアイテムに遷移する遷移確率を高めて、ドメイン間の遷移を考慮した学習を適切に行うことができる。
Claims (6)
- 所定のユーザが発生させたイベントに対応するアイテムを示すアイテム情報と、前記イベントが発生した時刻を示すイベント発生時刻とを含む時系列データであって、第1ドメインの時系列データである第1時系列データと、第2ドメインの時系列データである第2時系列データとを取得する時系列データ取得部と、
前記第1時系列データに含まれる前記アイテム情報の件数と、前記第2時系列データに含まれる前記アイテム情報の件数とが略同一となるように、前記第1時系列データに含まれる当該アイテム情報の件数と前記第2時系列データに含まれる当該アイテム情報の件数の少なくともいずれかを調整する調整部と、
前記調整部により前記件数が調整された後の前記第1時系列データである第1調整データに含まれる前記イベント発生時刻と、前記調整部により前記件数が調整された後の前記第2時系列データである第2調整データに含まれる前記イベント発生時刻に基づいて、前記第1調整データの一部と前記第2調整データの一部とを統合することにより統合データを複数生成する統合部と、
前記統合部により統合された複数の前記統合データに基づいて、複数の前記統合データのそれぞれに含まれる複数の前記アイテム情報のそれぞれが示すアイテムの特徴を示す特徴ベクトルを生成する特徴ベクトル生成部と、
を有する特徴ベクトル生成装置。 - 前記調整部は、前記第1時系列データに含まれる前記アイテム情報の件数である第1件数と、前記第2時系列データに含まれる前記アイテム情報の件数である第2件数とを算出し、当該アイテム情報が含まれる件数が多い時系列データに含まれる当該アイテム情報を前記第1件数と前記第2件数とに基づいて設定される確率で消去することにより、前記第1時系列データに含まれる前記アイテム情報の件数と前記第2時系列データに含まれる前記アイテム情報の件数のいずれかを調整する、
請求項1に記載の特徴ベクトル生成装置。 - 前記調整部は、前記第1時系列データと前記第2時系列データとを統合した場合に、同じドメインの前記アイテム情報が連続して出現するとき、当該アイテム情報のいずれかを前記第1件数と前記第2件数とに基づいて設定される確率で消去し、異なるドメインの前記アイテム情報が連続して出現するとき、当該アイテム情報を消去しないように制御する、
請求項2に記載の特徴ベクトル生成装置。 - 前記調整部は、前記第1時系列データに含まれる前記アイテム情報の件数である第1件数と、前記第2時系列データに含まれる前記アイテム情報の件数である第2件数とを算出し、前記第1件数と前記第2件数とに基づいて、当該アイテム情報が含まれる件数が少ない時系列データに当該アイテム情報を追加することにより、前記第1時系列データに含まれる前記アイテム情報の件数と前記第2時系列データに含まれる前記アイテム情報の件数のいずれかを調整する、
請求項1に記載の特徴ベクトル生成装置。 - コンピュータが実行する、
所定のユーザが発生させたイベントに対応するアイテムを示すアイテム情報と、前記イベントが発生した時刻を示すイベント発生時刻とを含む時系列データであって、第1ドメインの時系列データである第1時系列データと、第2ドメインの時系列データである第2時系列データとを取得するステップと、
前記第1時系列データに含まれる前記アイテム情報の件数と、前記第2時系列データに含まれる前記アイテム情報の件数とが略同一となるように、前記第1時系列データに含まれる当該アイテム情報の件数と前記第2時系列データに含まれる当該アイテム情報の件数の少なくともいずれかを調整するステップと、
前記件数が調整された後の前記第1時系列データである第1調整データに含まれる前記イベント発生時刻と、前記件数が調整された後の前記第2時系列データである第2調整データに含まれる前記イベント発生時刻に基づいて、前記第1調整データの一部と前記第2調整データの一部とを統合することにより統合データを複数生成するステップと、
複数の前記統合データに基づいて、複数の前記統合データのそれぞれに含まれる複数の前記アイテム情報のそれぞれが示すアイテムの特徴を示す特徴ベクトルを生成するステップと、
を有する特徴ベクトル生成方法。 - コンピュータを、
所定のユーザが発生させたイベントに対応するアイテムを示すアイテム情報と、前記イベントが発生した時刻を示すイベント発生時刻とを含む時系列データであって、第1ドメインの時系列データである第1時系列データと、第2ドメインの時系列データである第2時系列データとを取得する時系列データ取得部、
前記第1時系列データに含まれる前記アイテム情報の件数と、前記第2時系列データに含まれる前記アイテム情報の件数とが略同一となるように、前記第1時系列データに含まれる当該アイテム情報の件数と前記第2時系列データに含まれる当該アイテム情報の件数の少なくともいずれかを調整する調整部、
前記調整部により前記件数が調整された後の前記第1時系列データである第1調整データに含まれる前記イベント発生時刻と、前記調整部により前記件数が調整された後の前記第2時系列データである第2調整データに含まれる前記イベント発生時刻に基づいて、前記第1調整データの一部と前記第2調整データの一部とを統合することにより統合データを複数生成する統合部、及び、
前記統合部により統合された複数の前記統合データに基づいて、複数の前記統合データのそれぞれに含まれる複数の前記アイテム情報のそれぞれが示すアイテムの特徴を示す特徴ベクトルを生成する特徴ベクトル生成部、
として機能させる特徴ベクトル生成プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020149783A JP7286259B2 (ja) | 2020-09-07 | 2020-09-07 | 特徴ベクトル生成装置、特徴ベクトル生成方法及び特徴ベクトル生成プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020149783A JP7286259B2 (ja) | 2020-09-07 | 2020-09-07 | 特徴ベクトル生成装置、特徴ベクトル生成方法及び特徴ベクトル生成プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022044249A JP2022044249A (ja) | 2022-03-17 |
JP7286259B2 true JP7286259B2 (ja) | 2023-06-05 |
Family
ID=80679018
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020149783A Active JP7286259B2 (ja) | 2020-09-07 | 2020-09-07 | 特徴ベクトル生成装置、特徴ベクトル生成方法及び特徴ベクトル生成プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7286259B2 (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010204966A (ja) | 2009-03-03 | 2010-09-16 | Nippon Telegr & Teleph Corp <Ntt> | サンプリング装置、サンプリング方法、サンプリングプログラム、クラス判別装置およびクラス判別システム。 |
JP2018205860A (ja) | 2017-05-31 | 2018-12-27 | 株式会社Screenホールディングス | 分類器構築方法、分類器および分類器構築装置 |
JP2020052518A (ja) | 2018-09-25 | 2020-04-02 | Kddi株式会社 | 特徴ベクトル生成装置、特徴ベクトル生成方法及び特徴ベクトル生成プログラム |
-
2020
- 2020-09-07 JP JP2020149783A patent/JP7286259B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010204966A (ja) | 2009-03-03 | 2010-09-16 | Nippon Telegr & Teleph Corp <Ntt> | サンプリング装置、サンプリング方法、サンプリングプログラム、クラス判別装置およびクラス判別システム。 |
JP2018205860A (ja) | 2017-05-31 | 2018-12-27 | 株式会社Screenホールディングス | 分類器構築方法、分類器および分類器構築装置 |
JP2020052518A (ja) | 2018-09-25 | 2020-04-02 | Kddi株式会社 | 特徴ベクトル生成装置、特徴ベクトル生成方法及び特徴ベクトル生成プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2022044249A (ja) | 2022-03-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110163647B (zh) | 一种数据处理方法及装置 | |
US8082247B2 (en) | Best-bet recommendations | |
EP3499384A1 (en) | Word and sentence embeddings for sentence classification | |
CN113240130B (zh) | 数据分类方法及装置、计算机可读存储介质和电子设备 | |
JP2007052744A (ja) | 分類ルール作成支援方法 | |
JP6842111B2 (ja) | モデル変数候補生成装置および方法 | |
Moniz et al. | Resampling strategies for imbalanced time series | |
CN112801712B (zh) | 一种广告投放策略的优化方法及装置 | |
JP6933623B2 (ja) | 特徴ベクトル生成装置、特徴ベクトル生成方法及び特徴ベクトル生成プログラム | |
JP4143234B2 (ja) | 文書分類装置、文書分類方法及び記憶媒体 | |
CN114222000A (zh) | 信息推送方法、装置、计算机设备和存储介质 | |
JP6868576B2 (ja) | 事象提示システムおよび事象提示装置 | |
JP7286259B2 (ja) | 特徴ベクトル生成装置、特徴ベクトル生成方法及び特徴ベクトル生成プログラム | |
JP7061088B2 (ja) | 特徴ベクトル生成装置、特徴ベクトル生成方法及び特徴ベクトル生成プログラム | |
CN115471271A (zh) | 广告的归因方法、装置、计算机设备及可读存储介质 | |
JP7212609B2 (ja) | 予測プログラム、学習装置、予測装置、及び予測方法 | |
CN113065067A (zh) | 一种物品推荐方法、装置、计算机设备及存储介质 | |
CN113591986A (zh) | 用于生成推荐模型的对象权值的方法和个性化推荐方法 | |
JP7039525B2 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
JP5802597B2 (ja) | 分類装置、分類システム、分類方法及び分類プログラム | |
Li et al. | CTR prediction with user behavior: An augmented method of deep factorization machines | |
EP4124984A1 (en) | Machine learning model generating system, machine learning model generating method | |
JP7355375B2 (ja) | 入力項目表示制御システム、および入力項目表示制御方法 | |
Srivastava et al. | The impact on society of false news spreading on social media with the help of predictive modelling | |
JP2013214149A (ja) | 分類装置、分類システム、分類方法及び分類プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220616 |
|
TRDD | Decision of grant or rejection written | ||
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230522 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230523 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230523 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7286259 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |