JP2019503006A

JP2019503006A - ユーザー似顔絵を取得する方法及び装置

Info

Publication number: JP2019503006A
Application number: JP2018535169A
Authority: JP
Inventors: ル，メンピン
Original assignee: テンセント・テクノロジー・（シェンジェン）・カンパニー・リミテッド
Priority date: 2016-04-29
Filing date: 2017-04-25
Publication date: 2019-01-31
Anticipated expiration: 2037-04-25
Also published as: KR20180091043A; JP6615362B2; KR102122373B1; US11394798B2; CN110378731B; WO2017186106A1; US20180316776A1; CN110378731A; CN107341679A

Abstract

ユーザー似顔絵を取得する方法及び装置であって、情報処理技術分野に属する。前記方法は、ユーザー行動ログに基づいて、訓練サンプル＜ｕ，ｉ，ｊ＞がユーザーｕの品物ｉ及び品物ｊに対する嗜好度の差を反映するＭ（Ｍは正の整数である）個の訓練サンプルを取得すること（１０１）と、Ｍ個の訓練サンプルに基づいて、データフィッティングモデルを用いて、初期化されたユーザーパラメータ行列Ｗ_ｍ×ｋ及びタグパラメータ行列Ｈ_ｋ×ｎを修正し、最終のユーザーパラメータ行列Ｗ_ｍ×ｋ及び最終のタグパラメータ行列Ｈ_ｋ×ｎを得ること（１０２）と、最終のユーザーパラメータ行列Ｗ_ｍ×ｋ及び最終のタグパラメータ行列Ｈ_ｋ×ｎに基づいて、ユーザー似顔絵行列Ｐ_ｍ×ｎを取得すること（１０３）と、を含む。ユーザー及びタグをパラメータ化するとともに、データフィッティングモデルを用いて、ユーザーパラメータ行列及びタグパラメータ行列を訓練サンプルにフィッティングするように修正することで、タグに対して対応するタグウェイトを人為的に設定する必要がなく、ユーザー行動ログに基づいて、データフィッティング方法によりユーザー似顔絵を自動的に取得し、時間や労働コストの節約を図り、ユーザー似顔絵を正確かつ高効率に取得する技術効果を達成する。

Description

本発明の実施例は情報処理技術分野に関し、特に、ユーザー似顔絵を取得する方法及び装置に関する。本願は、２０１６年４月２９日にて中国特許庁へ出願した、出願番号が２０１６１０２８４１２４．６で、発明の名称が「ユーザー似顔絵を取得する方法及び装置」である中国特許出願の優先権を主張し、その内容を全て参照により本願に組み込むものとする。

ユーザー似顔絵は、ユーザーペルソナ（Persona）とも呼ばれ、ターゲットユーザーの輪郭を描き、ユーザーの需要と設計方向とを関連付ける有効な道具であり、各分野に広く適用されている。具体的な実現にあたり、ユーザー似顔絵は、ユーザーを特徴付けるタグ（tag）セットによって示されることができ、該タグセットは、ユーザーの社会的属性、生活習慣、消費行動などからユーザーを特徴付けるタグを含むことができる。例えば、年齢、性別、地域、学歴及びユーザー嗜好等のタグを含む。

関連技術には、ユーザー似顔絵を取得する方法が提供されている。複数のタグを予め設定し、各タグごとに対応するタグウェイトを人為的に設定し、タグウェイトは、実際の適用の需要に応じて、又は人間の経験に基づいて予め設定されることができる。オプションとして、各タグごとに、該タグを持つ品物がすべての品物に占める割合に基づいて、該タグに対応するタグウェイトを設定してもよい。通常、上記割合とタグウェイトとは負の相関関係を呈しており、つまり、上記割合が大きければ大きいほどタグウェイトが小さくなり、上記割合が小さければ小さいほどタグウェイトが大きくなる。その後、ユーザー行動ログを取得し、ユーザー行動ログには、ユーザーが各品物に対して実行した様々な行動が記録されており、例えば、ユーザー１が品物１を閲覧した、ユーザー２が品物１を購入した、ユーザー１が品物２を購入した等が記録される。そして、各品物が持つタグ及びユーザーが各品物に対して実行した行動に基づいて、ユーザーの各タグに対する行動ウェイトを決定する。最後に、各タグに対応するタグウェイト及び行動ウェイトそれぞれに基づいて、ユーザーの該タグに対する嗜好度を算出し、ユーザーの各タグに対する嗜好度をまとめてユーザー似顔絵を得る。例えば、ユーザーのあるタグに対する嗜好度は、該タグに対応するタグウェイトと行動ウェイトとの積によって示されることができる。

しかしながら、関連技術において、各タグごとに対応するタグウェイトを人為的に設定する必要があり、タグの数が多いのがほとんどであるため、大量の時間や人的資源が必要となり、ユーザー似顔絵を取得するための所要時間や労働コストが高くなる。そして、タグウェイトを人為的に設定する方法は誤差が避けられず、人為的に設定したタグウェイトと実際のサービスとが一致するのを確保しにくいため、最終的に取得されたユーザー似顔絵の正確度が低い。

関連技術に提供されるユーザー似顔絵を取得する方法では、所要時間や労働コストが高く、取得されたユーザー似顔絵の正確度が低い問題を解決するために、本発明の実施例は、ユーザー似顔絵を取得する方法及び装置を提供する。その技術思想は以下の通りである。

本発明の実施例の第１の態様は、ユーザー似顔絵を取得する方法であって、
ユーザー行動ログに基づいて、訓練サンプル＜ｕ，ｉ，ｊ＞がユーザーｕの品物ｉ及び品物ｊに対する嗜好度の差を反映するＭ（Ｍは正の整数である）個の訓練サンプルを取得することと、
前記Ｍ個の訓練サンプルに基づいて、データフィッティングモデルを用いて、初期化されたユーザーパラメータ行列Ｗ_ｍ×ｋ及び初期化されたタグパラメータ行列Ｈ_ｋ×ｎを修正し、最終のユーザーパラメータ行列Ｗ_ｍ×ｋ及び最終のタグパラメータ行列Ｈ_ｋ×ｎを得て、ただし、ｍ（ｍは正の整数である）はユーザーの数を示し、ｋ（ｋは正の整数である）は因子の数を示し、ｎ（ｎは１よりも大きい整数である）はタグの数を示すことと、
前記最終のユーザーパラメータ行列Ｗ_ｍ×ｋ及び前記最終のタグパラメータ行列Ｈ_ｋ×ｎに基づいて、ｕ（ｕは１以上ｍ以下の整数である）行目のｔ（ｔは１以上ｎ以下の整数である）列目の要素Ｐ_ｕｔがユーザーｕのタグｔに対する嗜好度を示すユーザー似顔絵行列Ｐ_ｍ×ｎを取得することと、を含む方法が提供される。

本発明の実施例的第２の態様は、ユーザー似顔絵を取得する装置であって、
ユーザー行動ログに基づいて、訓練サンプル＜ｕ，ｉ，ｊ＞がユーザーｕの品物ｉ及び品物ｊに対する嗜好度の差を反映するＭ（Ｍは正の整数である）個の訓練サンプルを取得するサンプル取得モジュールと、
前記Ｍ個の訓練サンプルに基づいて、データフィッティングモデルを用いて、初期化されたユーザーパラメータ行列Ｗ_ｍ×ｋ及び初期化されたタグパラメータ行列Ｈ_ｋ×ｎを修正し、最終のユーザーパラメータ行列Ｗ_ｍ×ｋ及び最終のタグパラメータ行列Ｈ_ｋ×ｎを得て、ただし、ｍ（ｍは正の整数である）はユーザーの数を示し、ｋ（ｋは正の整数である）は因子の数を示し、ｎ（ｎは１よりも大きい整数である）はタグの数を示す行列修正モジュールと、
前記最終のユーザーパラメータ行列Ｗ_ｍ×ｋ及び前記最終のタグパラメータ行列Ｈ_ｋ×ｎに基づいて、ｕ（ｕは１以上ｍ以下の整数である）行目のｔ（ｔは１以上ｎ以下の整数である）列目の要素Ｐ_ｕｔがユーザーｕのタグｔに対する嗜好度を示すユーザー似顔絵行列Ｐ_ｍ×ｎを取得する画像取得モジュールと、を備える装置が提供される。

本発明の実施例的第３の態様は、ユーザー似顔絵を取得する装置であって、
１つ又は複数のプロセッサと、
前記１つ又は複数のプロセッサに接続されるメモリであって、前記１つ又は複数のプロセッサによって実行される１つ又は複数のプログラムが記憶されたメモリと、を備え、
前記１つ又は複数のプログラムは、
ユーザー行動ログに基づいて、訓練サンプル＜ｕ，ｉ，ｊ＞がユーザーｕの品物ｉ及び品物ｊに対する嗜好度の差を反映するＭ（Ｍは正の整数である）個の訓練サンプルを取得する動作と、
前記Ｍ個の訓練サンプルに基づいて、データフィッティングモデルを用いて、初期化されたユーザーパラメータ行列Ｗ_ｍ×ｋ及び初期化されたタグパラメータ行列Ｈ_ｋ×ｎを修正し、最終のユーザーパラメータ行列Ｗ_ｍ×ｋ及び最終のタグパラメータ行列Ｈ_ｋ×ｎを得て、ただし、ｍ（ｍは正の整数である）はユーザーの数を示し、ｋ（ｋは正の整数である）は因子の数を示し、ｎ（ｎは１よりも大きい整数である）はタグの数を示す動作と、
前記最終のユーザーパラメータ行列Ｗ_ｍ×ｋ及び前記最終のタグパラメータ行列Ｈ_ｋ×ｎに基づいて、ｕ（ｕは１以上ｍ以下の整数である）行目のｔ（ｔは１以上ｎ以下の整数である）列目の要素Ｐ_ｕｔがユーザーｕのタグｔに対する嗜好度を示すユーザー似顔絵行列Ｐ_ｍ×ｎを取得する動作と、を実行するための命令を含む装置が提供される。

本発明の実施例に提供される技術思想は、以下の有益な効果をもたらす。

ユーザー行動ログに基づいてＭ個の訓練サンプルを取得し、Ｍ個の訓練サンプルに基づいて、データフィッティングモデルを用いて、初期化されたユーザーパラメータ行列Ｗ_ｍ×ｋ及びタグパラメータ行列Ｈ_ｋ×ｎを修正し、最終のユーザーパラメータ行列Ｗ_ｍ×ｋ及び最終のタグパラメータ行列Ｈ_ｋ×ｎを得て、そして、最終のユーザーパラメータ行列Ｗ_ｍ×ｋ及び最終のタグパラメータ行列Ｈ_ｋ×ｎに基づいて、ユーザー似顔絵行列Ｐ_ｍ×ｎを取得することにより、関連技術に提供されるユーザー似顔絵を取得する方法では、所要時間や労働コストが高く、取得されたユーザー似顔絵の正確度が低い問題を解決する。ユーザー及びタグをパラメータ化するとともに、データフィッティングモデルを用いて、ユーザーパラメータ行列及びタグパラメータ行列を訓練サンプルにフィッティングするように修正することで、タグに対して対応するタグウェイトを人為的に設定する必要がなく、ユーザー行動ログに基づいて、データフィッティング方法によりユーザー似顔絵を自動的に取得し、時間や労働コストの節約を図り、ユーザー似顔絵を正確かつ高効率に取得する技術効果を達成する。

本発明の実施例の構成をより明りょうに説明するために、以下、実施例の説明に必要な図面を簡単に紹介する。以下に説明される図面は、本発明の実施例の一部に過ぎず、当業者であれば、創造的な労働なしにこれらの図面に基づいて他の図面を得ることもできるのは、明らかである。
本発明の一実施例に提供されるユーザー似顔絵を取得する方法のフローチャートである。本発明の別の実施例に提供されるユーザー似顔絵を取得する方法のフローチャートである。図２に示される実施例におけるステップ２０１のサブステップのフローチャートである。本発明の一実施例に提供されるユーザー類似度行列を生成するフローチャートである。本発明の一実施例に提供されるユーザー似顔絵を取得する装置の構成ブロック図である。本発明の別の実施例に提供されるユーザー似顔絵を取得する装置の構成ブロック図である。本発明の一実施例に提供されるサーバの構成を示す図である。

本発明の目的、技術案及び利点をより明りょうにするために、以下、図面を結合して本発明の実施形態をさらに詳しく説明する。

理解しやすくするために、まず、本文に言及される一部の名詞を紹介し説明する。

品物
品物は、物理的な品物及び仮想的な品物を含む。物理的な品物とは、リアルな品物を指し示し、事務、生活消費に関する品物であり、例えば、衣類、食料、事務用品などがある。仮想的な品物とは、実生活では触れることができない品物を指し示し、例えば、ビデオ、オーディオ、イメージ、アプリケーションソフトウェア、ミニブログのようなインターネット製品又はコンテンツ、或いは、仮想的なネットワーク世界から派生した品物、例えば、ゲーム小道具、メンバー、アイコンなどがある。

タグ
タグとは、品物の属性を記述するためのキーワードである。例えば、衣類のタグは、色、スタイル、サイズなどから記述するキーワードを含むことができる。また、例えば、ビデオのタグは、年別、国別、パターン、俳優などから記述するキーワードを含むことができる。また、例えば、ゲーム小道具のタグは、種別、機能、クラスなどから記述するキーワードを含むことができる。

ユーザーの行動パターン
ユーザーの行動パターンとは、ユーザーが品物に対して実行する行動である。例：閲覧、購入、お気に入り、削除、使用、リツイート、「いいね」ボタンを押す、「ヤダネ」ボタンを押す、コメントなど。異なる品物に対してユーザーが実行可能な行動は同じであってもよいし、異なってもよい。例えば、衣類の場合、ユーザーが該品物に対して実行可能な行動は、閲覧、購入、お気に入りなどを含むことができる。また、例えば、ビデオの場合、ユーザーが該品物に対して実行可能な行動は、閲覧、プレビュー、ウォッチ、購入、お気に入りなどを含むことができる。また、例えば、ミニブログの場合、ユーザーが該品物に対して実行可能な行動は、閲覧、リツイート、お気に入りなどを含むことができる。オプションとして、ユーザーの行動パターンは、ユーザーが品物に対して何らの行動も実行していないことを示す「未知」パターンをさらに含んでもよい。ユーザーの品物に対する行動パターンは、ユーザーの品物に対する嗜好度を反映し、ユーザーの２つの品物に対する行動パターンから、ユーザーの該２つの品物に対する嗜好度の差が分かる。

本発明の実施例を詳しく解釈し説明する前に、まず本発明の実施例の応用場面を紹介する。ユーザー似顔絵は、ユーザーを特徴付けるためのタグセットによって示されることができ、且つ該タグセットは、ユーザーの社会的属性、生活習慣、消費行動などからユーザーを特徴付けるタグを含むことができるため、ユーザー似顔絵は、ユーザーの特徴を示すことができる。ユーザーの特徴からユーザーの嗜好、習慣などを判定することができるため、ユーザー似顔絵を取得した後、ユーザー似顔絵を様々な応用場面に適用することができる。

例えば、１つの応用場面において、ユーザー似顔絵によってユーザーの嗜好を判定し、ユーザーに対して、例えば、衣類、食料、電子製品等の品物を推薦することができ、これにより、ユーザー別に異なる品物を推薦し、個人化された推薦を達成し、品物推薦の正確度を高める。また、例えば、もう１つの応用場面において、ユーザー似顔絵によって、ユーザーが電子製品等を使用する習慣を判定することができ、仮に、ユーザーが電子製品の安全性検査をどのくらいの頻度で行う必要があるか、電子製品でウェブページを閲覧した後、閲覧履歴をどのくらいの頻度で削除する必要があるか等を判定することができれば、ユーザーが手動で操作することなく、ユーザーの使用習慣にしたがってこれらの操作を自動的に実行し、ユーザーのロイヤリティを向上させる。

もちろん、実際の適用において、ユーザー似顔絵は他の応用場面にも適用され、本発明の実施例では、上記２つの応用場面を例として説明するが、ここでは他の応用場面を一々挙げない。

本発明の実施例に提供される方法では、各ステップの実行主体は、データ記憶及び計算能力を備える電子機器、例えば、サーバであることができる。下記方法実施例において、各ステップの実行主体としてサーバを例に説明するが、これに限られない。

図１を参照し、本発明の一実施例に提供されるユーザー似顔絵を取得する方法のフローチャートが示されている。該方法は以下のステップを含むことができる。

ステップ１０１：ユーザー行動ログに基づいてＭ個の訓練サンプルを取得する。訓練サンプル＜ｕ，ｉ，ｊ＞は、ユーザーｕの品物ｉ及び品物ｊに対する嗜好度の差を反映し、Ｍは正の整数である。

ステップ１０２：Ｍ個の訓練サンプルに基づいて、データフィッティングモデルを用いて、初期化されたユーザーパラメータ行列Ｗ_ｍ×ｋ及び初期化されたタグパラメータ行列Ｈ_ｋ×ｎを修正し、最終のユーザーパラメータ行列Ｗ_ｍ×ｋ及び最終のタグパラメータ行列Ｈ_ｋ×ｎを得る。

ただし、ｍはユーザーの数を示し、ｋは因子の数を示し、ｎはタグの数を示し、ｍは正の整数であり、ｋは正の整数であり、ｎは１よりも大きい整数である。

ステップ１０３：最終のユーザーパラメータ行列Ｗ_ｍ×ｋ及び最終のタグパラメータ行列Ｈ_ｋ×ｎに基づいて、ユーザー似顔絵行列Ｐ_ｍ×ｎを取得する。

ただし、ユーザー似顔絵行列Ｐ_ｍ×ｎのｕ行目のｔ列目の要素Ｐ_ｕｔは、ユーザーｕのタグｔに対する嗜好度を示し、ｕは１以上ｍ以下の整数であり、ｔは１以上ｎ以下の整数である。

上述したように、本実施例に提供される方法では、ユーザー行動ログに基づいてＭ個の訓練サンプルを取得し、訓練サンプルに基づいて、データフィッティングモデルを用いて、初期化されたユーザーパラメータ行列Ｗ_ｍ×ｋ及びタグパラメータ行列Ｈ_ｋ×ｎを修正し、最終のユーザーパラメータ行列Ｗ_ｍ×ｋ及び最終のタグパラメータ行列Ｈ_ｋ×ｎを得て、そして、最終のユーザーパラメータ行列Ｗ_ｍ×ｋ及び最終のタグパラメータ行列Ｈ_ｋ×ｎに基づいて、ユーザー似顔絵行列Ｐ_ｍ×ｎを取得することにより、関連技術に提供されるユーザー似顔絵を取得する方法では、所要時間や労働コストが高く、取得されたユーザー似顔絵の正確度が低い問題を解決する。ユーザー及びタグをパラメータ化するとともに、データフィッティングモデルを用いて、ユーザーパラメータ行列及びタグパラメータ行列を訓練サンプルにフィッティングするように修正することで、タグに対して対応するタグウェイトを人為的に設定する必要がなく、ユーザー行動ログに基づいて、データフィッティング方法によりユーザー似顔絵を自動的に取得し、時間や労働コストの節約を図り、ユーザー似顔絵を正確かつ高効率に取得する技術効果を達成する。

図２を参照し、本発明の別の実施例に提供されるユーザー似顔絵を取得する方法のフローチャートが示されている。本実施例において、各ステップの実行主体としてサーバを例に説明する。該方法は以下のステップを含むことができる。

ステップ２０１：ユーザー行動ログに基づいてＭ個の訓練サンプルを取得する。

訓練サンプルは＜ｕ，ｉ，ｊ＞で示されることができ、且つ訓練サンプル＜ｕ，ｉ，ｊ＞は、ユーザーｕの品物ｉ及び品物ｊに対する嗜好度の差を反映し、Ｍは正の整数である。

ユーザー行動ログは、ユーザーの品物に対する操作行動を記録する。ユーザー行動ログには、ユーザー識別子、ユーザーの行動パターン、品物識別子及び品物タグ情報が含まれている。ユーザー識別子は、ユーザーの身元を識別するための識別子番号であり、ユーザーアカウントとも呼ばれ、あるシステムにおける相対的に唯一のコードである。ユーザーの行動パターンとは、ユーザーが品物に対して実行する行動であり、例えば閲覧、購入、お気に入り、削除、使用、リツイート、「いいね」ボタンを押す、「ヤダネ」ボタンを押す、コメント、未知等がある。ユーザーの行動パターンの種別は、実際の適用時のニーズに応じて設定されることができる。品物識別子は、品物を識別するための識別子番号であり、ユーザー識別子に類似して、各品物ごとに唯一の品物識別子が対応している。品物タグ情報は、品物属性を記述するためのキーワードであり、１つの品物は１つ又は複数のタグを含むことができる。ユーザー行動ログの取得方法は、サーバが端末におけるユーザー操作行動を収集するか、端末が自らユーザー操作行動をサーバに報告することであることができる。

訓練サンプル＜ｕ，ｉ，ｊ＞は、ユーザーｕの品物ｉ及び品物ｊに対する嗜好度の差を反映する。考えられる１つの実施形態において、訓練サンプル＜ｕ，ｉ，ｊ＞は、ユーザーｕの品物ｉに対する嗜好度が品物ｊに対する嗜好度よりも大きいことを反映する。考えられる別の実施形態において、訓練サンプル＜ｕ，ｉ，ｊ＞は、ユーザーｕの品物ｉに対する嗜好度が品物ｊに対する嗜好度よりも小さいことを反映する。ユーザーの品物に対する行動パターンは、ユーザーの品物に対する嗜好度を反映し、ユーザーの２つの品物に対する行動パターンから、ユーザーの該２つの品物に対する嗜好度の差が分かる。

オプションとして、ユーザーが払った代償に基づいて、行動パターンのウェイトのルールを決定し、行動パターンのウェイトに応じて、すべての行動パターン間の相対的な大きさ関係を決定してもよい。例えば、「購入」行動パターンのウェイトが「閲覧」行動パターンのウェイトよりも大きい。ユーザーが品物に対して何らの行動も実行していなければ、ユーザーの行動パターンとして「未知」パターンを取得する。一般的には、ユーザーがある行動を実行したことがある品物に対する嗜好度は、何らの行動も実行していない品物に対する嗜好度よりも大きいため、「未知」行動パターンのウェイトが一番小さく、「閲覧」、「購入」等の行動パターンのウェイトよりも小さい。例えば、ユーザーｕが品物ｉに対してある行動を実行したことがあるが、品物ｊに対して何らの行動も実行していなければ、ユーザーｕの品物ｉに対する嗜好度が品物ｊに対する嗜好度よりも大きい。

例えば、訓練サンプル＜ｕ，ｉ，ｊ＞は、ユーザーｕの品物ｉに対する嗜好度が品物ｊに対する嗜好度よりも大きいことを例として、ユーザーｕの品物ｉに対する嗜好度が品物ｊに対する嗜好度よりも大きければ、＜ｕ，ｉ，ｊ＞の訓練サンプルを得る。逆の場合には、＜ｕ，ｊ，ｉ＞の訓練サンプルを得る。例えば、ユーザーｕが品物ｉを購入し、品物ｊを閲覧したとすれば、＜ｕ，ｉ，ｊ＞の訓練サンプルを取得する。ユーザーが品物ｉを閲覧し、品物ｊを購入したとすれば、＜ｕ，ｊ，ｉ＞の訓練サンプルを取得する。また、例えば、ユーザーが品物ｉを閲覧したが、品物ｊに対して何らの行動も実行していなければ、＜ｕ，ｉ，ｊ＞の訓練サンプルを取得する。各ユーザーごとに１つ又は複数の訓練サンプルを取得することができ、ユーザー１が品物２を閲覧したが、品物１、品物３及び品物４に対して何らの行動も実行していなければ、＜１，２，１＞、＜１，２，３＞及び＜１，２，４＞を含む訓練サンプルを取得する。

考えられる１つの実施形態において、図３に示すように、ステップ２０１は以下のサブステップを含むことができる。

ステップ２０１ａ：ユーザー行動ログに基づいて、ｍ人の個々のユーザーの、ｈ個の品物のそれぞれに対する行動パターンを取得する。

ただし、ｍはユーザーの数を示し、ｈは品物の数を示し、ｍは正の整数であり、ｈは１よりも大きい整数である。

ステップ２０１ｂ：個々のユーザーの各品物に対する行動パターンに基づいて、Ｍ個の訓練サンプルを取得する。

考えられる１つの実施形態として、ステップ２０１ｂは以下を含むことができる。

１、ユーザーの行動パターンに基づいてユーザー品物行列を取得する。

オプションとして、ユーザー品物行列はＲ_ｍ×ｈで示され、且つユーザー品物行列Ｒ_ｍ×ｈの行はユーザーを示し、列は品物を示し、ｍはユーザーの数を示し、ｈは品物の数を示し、要素Ｒ_ｕｉはユーザーｕが品物ｉに対してある行動を実行したことがあるか否かを示すようにしてもよい。例示的には、ユーザー品物行列Ｒ_ｍ×ｈにおける要素を０又は１で表す。１は、ユーザーが品物に対してある行動を実行したことがあることを表し、０は、ユーザーが品物に対して何らの行動も実行していないことを表す。例示的には、ユーザーの数が３であり、品物の数が４である場合、ユーザー品物行列Ｒ_ｍ×ｈは、

である。

１行目の２列目の１は、ユーザー１が品物２に対してある行動を実行したことを表す。

２、ユーザーの行動パターン及びユーザー品物行列に基づいて、Ｍ個の訓練サンプルを取得する。

ユーザー品物行列から、ユーザーが品物に対してある行動を実行したことがあるか否かを把握することができ、ユーザーｕの場合、行動パターンに基づいて、ユーザーｕの品物ｉに対する嗜好度が品物ｊに対する嗜好度よりも大きいか否かを決定することができ、これにより、１つの訓練サンプルを得る。例示的には、ユーザー品物行列Ｒ_３×４の１行目から、ユーザー１が品物２に対してある行動を実行したが、ユーザー１が品物１、品物３及び品物４に対して何らの行動も実行していないことが示され、訓練サンプル＜ｕ，ｉ，ｊ＞は、ユーザーｕの品物ｉに対する嗜好度が品物ｊに対する嗜好度よりも大きいことを反映することを例とすれば、＜１，２，１＞、＜１，２，３＞及び＜１，２，４＞を含むユーザー１の訓練サンプルを取得する。

なお、一般的には、ユーザーの、ある行動を実行したことがある品物に対する嗜好度は、何らの行動も実行していない品物に対する嗜好度よりも大きい。しかし、他の考えられる場合には、ユーザーの、ある行動を実行したことがある品物に対する嗜好度は、何らの行動も実行していない品物に対する嗜好度よりも小さい可能性もある。品物としてビデオを例に、ユーザーは、ビデオＡに対して「ヤダネ」ボタンを押すという行動を実行したが、ビデオＢに対して何らの行動も実行していなければ、ユーザーのビデオＡに対する嗜好度は、ビデオＢに対する嗜好度よりも小さいと判定する。

また、ユーザーの数がｍであり、品物の数がｈであるため、理論上、

個のサンプルを作ることができ、実際の操作時に、サンプリング方式により上記

個のサンプルから一部の信頼性のあるサンプルを選んで訓練サンプルとする。例えば、ユーザーｕは品物ｉ及び品物ｊのいずれにも何らの行動も実行していなければ、或いは、ユーザーｕが品物ｉ及び品物ｊに対して実行した行動パターンが同じであれば、ユーザーｕの品物ｉ及び品物ｊに対する嗜好度の差を決定することができず、このようなサンプルを訓練サンプルとしない。また、例えば、品物毎の実行可能性を取得し、１つの品物の実行可能性とは、ユーザーが該品物に対して行動を実行する可能性である。実行可能性は、システム全体における品物の発生率、流行度、推薦度、表示順位等の要素に基づいて決定されることができる。例えば、システム全体における品物の発生率が大きければ大きいほど、ユーザーは該品物を容易に取得することができ、該品物の実行可能性が高いことが示唆される。逆に、システム全体における品物の発生率が小さければ小さいほど、ユーザーが該品物を取得することが困難であり、該品物の実行可能性が低いことが示唆される。訓練サンプルの取得時に、ユーザーｕが行動を実行したことのある品物及びユーザーｕが行動を実行していない品物をそれぞれ１つ選んで訓練サンプルを作ろうとすれば、ユーザーｕが行動を実行していない品物から、実行可能性が高い品物を選んで、訓練サンプルを作る。上記方式により、取得された訓練サンプルは、ユーザーの２つの品物に対する嗜好度の差をより正確に反映することを確保することができ、訓練サンプルの誤りリスクを低減し、訓練サンプルの信頼度を向上させる。

ステップ２０２：初期化されたユーザーパラメータ行列Ｗ_ｍ×ｋ及び初期化されたタグパラメータ行列Ｈ_ｋ×ｎを生成する。

ただし、ｍはユーザーの数を示し、ｋは因子の数を示し、ｎはタグの数を示し、ｍは正の整数であり、ｋは正の整数であり、ｎは１よりも大きい整数である。考えられる１つの実施形態において、正規分布する乱数を生成する方式により、初期化されたユーザーパラメータ行列Ｗ_ｍ×ｋ及び初期化されたタグパラメータ行列Ｈ_ｋ×ｎを構築する。つまり、初期化されたユーザーパラメータ行列Ｗ_ｍ×ｋにおける要素は正規分布する乱数であり、初期化されたタグパラメータ行列Ｈ_ｋ×ｎにおける要素は正規分布する乱数である。

オプションとして、因子の数ｋは、予め設定された値であるか、大量の実験による経験値であってもよい。

オプションとして、正規分布する平均値を０に設定し、分散値を０．０１に設定してもよい。

例示的には、ランダムに生成されたユーザーパラメータ行列Ｗ_ｍ×ｋ及びタグパラメータ行列Ｈ_ｋ×ｎは以下のようなものである。

ユーザーパラメータ行列Ｗ_ｍ×ｋの各行が１つのユーザーの因子ベクトルに対応し、タグパラメータ行列Ｈ_ｋ×ｎの各列が１つのタグの因子ベクトルに対応する。

以下、下記ステップ２０３乃至ステップ２０７によって、初期化されたユーザーパラメータ行列Ｗ_ｍ×ｋ及び初期化されたタグパラメータ行列Ｈ_ｋ×ｎを修正する。まず、ａ＝０とし、以下のステップ２０３を実行する。

ステップ２０３：ａ回目修正されたユーザーパラメータ行列Ｗ_ｍ×ｋ及びａ回目修正されたタグパラメータ行列Ｈ_ｋ×ｎに基づいて、ｍ人の個々のユーザーの、ｎ個のタグのそれぞれに対する嗜好度を算出する。

ただし、ａは０以上の整数であり、０回目修正されたユーザーパラメータ行列Ｗ_ｍ×ｋは初期化されたユーザーパラメータ行列Ｗ_ｍ×ｋとなり、０回目修正されたタグパラメータ行列Ｈ_ｋ×ｎは初期化されたタグパラメータ行列Ｈ_ｋ×ｎとなる。

ａ＝０の場合、初期化されたユーザーパラメータ行列Ｗ_ｍ×ｋ及び初期化されたタグパラメータ行列Ｈ_ｋ×ｎに基づいて、ｍ人の個々のユーザーの、ｎ個のタグのそれぞれに対する嗜好度を算出する。

オプションとして、ユーザーｕのタグｔに対する嗜好度は以下のような計算式から求められてもよい。

例えば、以上で例示した初期化されたユーザーパラメータ行列Ｗ及び初期化されたタグパラメータ行列Ｈにおいて、ユーザー１のタグ１に対する嗜好度は、

であり、ユーザー３のタグ５に対する嗜好度は、

である。

ステップ２０４：ｍ人の個々のユーザーの、ｎ個のタグのそれぞれに対する嗜好度及び品物タグ行列Ａ_ｈ×ｎに基づいて、ｍ人の個々のユーザーの、ｈ個の品物のそれぞれに対する嗜好度を算出する。

初期化されたユーザーパラメータ行列Ｗ_ｍ×ｋ及び初期化されたタグパラメータ行列Ｈ_ｋ×ｎに基づいて、個々のユーザーの各タグに対する嗜好度を算出した後、品物タグ行列Ａ_ｈ×ｎを結合して、ｍ人の個々のユーザーの、ｈ個の品物のそれぞれに対する嗜好度を算出する。

品物タグ行列Ａ_ｈ×ｎは、ユーザー行動ログに付加される品物識別子及び品物タグによる行列である。

オプションとして、品物タグ行列Ａ_ｈ×ｎの行は品物を表し、列はタグを表してもよい。例示的には、品物タグ行列Ａ_ｈ×ｎにおける要素を０又は１で表す。０は、品物がタグによって記述される属性を有しないことを表し、１は、品物がタグによって記述される属性を有することを表す。品物の数は４であり、タグの数は５であるとすると、例示的には、品物タグ行列Ａ_h×ｎは、

である。

品物タグ行列

は、品物タグ行列の１行目を表し、品物１がタグ１及びタグ２によって記述される属性を有するが、タグ３、タグ４及びタグ５によって記述される属性を有しないことが示唆される。

ユーザーがある品物を嗜好する場合は、大抵、該品物は、ユーザーが嗜好するタグ（つまり、タグによって記述される属性）を有するためであり、ユーザーが品物を嗜好することは、ユーザーの該品物が持つタグに対する嗜好度のまとめと理解されることができる。ユーザーｕの品物ｉに対する嗜好度は、ユーザーｕの品物ｉが持つタグに対する嗜好度から算出されることができる。

オプションとして、本発明の実施例では、ユーザーｕの品物ｉが持つタグに対する嗜好度を合算することで、ユーザーｕの品物ｉに対する嗜好度を算出し、計算式は

であるようにしてもよい。

例えば、以上で例示した初始化されたユーザーパラメータ行列Ｗ_ｍ×ｋ、初始化されたタグパラメータ行列Ｈ_ｋ×ｎにおいて、ユーザー１の品物１に対する嗜好度は

であり、ユーザー３の品物２に対する嗜好度は

である。

ステップ２０５：ｍ人の個々のユーザーの、ｈ個の品物のそれぞれに対する嗜好度に基づいて、各訓練サンプルに対応する確率を取得する。

ただし、訓練サンプル＜ｕ，ｉ，ｊ＞に対応する確率とは、ユーザーｕの品物ｉに対する嗜好度が品物ｊに対する嗜好度よりも大きい確率である。

オプションとして、ユーザーｕの品物ｉに対する嗜好度が品物ｊに対する嗜好度よりも大きい確率を以下のように算出してもよい。

ステップ１：算出された個々のユーザーの各品物に対する嗜好度に基づいて、ユーザーｕの品物ｉに対する嗜好度とユーザーｕの品物ｊに対する嗜好度との差である

を算出する。

ステップ２：ロジスティック関数

から、ユーザーｕの品物ｉに対する嗜好度が品物ｊに対する嗜好度よりも大きい確率である

を算出する。

ステップ２０６：Ｍ個の訓練サンプルそれぞれに対応する確率をデータフィッティングモデルの入力パラメータとして、データフィッティングモデルの出力結果を算出する。

オプションとして、データフィッティングモデルはベイズ最尤推定法を用いて構築されたモデルであってもよく、具体的なデータフィッティングモデルは以下のようなものである。

ただし、

、

及び

は、オーバーフィッティングを防止するための正規化パラメータであり、

、

及び

は正の実数であり、

は行列の２ノルムを示し、

はＭ個の訓練サンプルの集合を示し、訓練サンプル＜ｕ，ｉ，ｊ＞に対応する確率は

であり、

はロジスティック関数を示し、

はユーザーｕの関連ユーザーの集合を示し、Ｓ_ｕｖはユーザー類似度行列Ｓ_ｍ×ｍのｕ行目のｖ列目の要素であり、Ｓ_ｕｖは、ユーザーｕとユーザーｖ間の類似度を示し、

は前記ａ回目修正されたユーザーパラメータ行列Ｗ_ｍ×ｋのｕ行目に対応する行ベクトルを示し、

は前記ａ回目修正されたユーザーパラメータ行列Ｗ_ｍ×ｋのｖ行目に対応する行ベクトルを示す。

はユーザーｕの関連ユーザーの集合を示し、つまり、ユーザーｕと関連付けられている他のユーザーの集合を示す。関連付けは友人関係であることができ、例えば、あるユーザーｖとユーザーｕとがソーシャルアプリケーションでの友人であれば、ユーザーｕとユーザーｖとは友人関係を有し、ユーザーｕとユーザーｖとが互いに関連ユーザーである。或いは、関連付けは非友人関係であってもよく、例えば、あるユーザーｖとユーザーｕとがソーシャルアプリケーションでの同じグループに属すれば、ユーザーｕとユーザーｖとが互いに関連ユーザーである。なお、ユーザー類似度行列Ｓ_ｍ×ｍを構築する際に、ユーザー類似度行列Ｓ_ｍ×ｍにおける任意の２人のユーザーは、友人関係を有するユーザーであってもよいし、友人関係を確立していないユーザー（例えば、同じグループに属し、さらには、お互いを知らない見知らぬユーザー）であってもよい。

となるように１行ずつ正規化してもよい。

ステップ２０７：出力結果が予め設定された条件を満たしていなければ、ａ回目修正されたユーザーパラメータ行列Ｗ_ｍ×ｋを修正してａ＋１回目修正されたユーザーパラメータ行列Ｗ_ｍ×ｋを得るとともに、ａ回目修正されたタグパラメータ行列Ｈ_ｋ×ｎを修正してａ＋１回目修正されたタグパラメータ行列Ｈ_ｋ×ｎを得て、ａ＝ａ＋１とし、上記ステップ２０３乃至ステップ２０６に戻ってこれらのステップを実行する。

予め設定された条件は、今回の出力結果と前回の出力結果との差が所定の閾値未満であること、及び／又は、ユーザーパラメータ行列及びタグパラメータ行列の修正回数が所定の回数に達していることを含む。所定の閾値及び所定の回数は、修正精度及び修正効率を包括して測定した後に設定される。

オプションとして、ａ回目修正されたユーザーパラメータ行列Ｗ_ｍ×ｋに基づいて、下記式によりａ＋１回目修正されたユーザーパラメータ行列Ｗ_ｍ×ｋを算出してもよい。

ただし、

は、ａ＋１回目修正されたユーザーパラメータ行列Ｗ_ｍ×ｋのｕ行目に対応する行ベクトルを示し、

は、ａ回目修正されたユーザーパラメータ行列Ｗ_ｍ×ｋのｕ行目に対応する行ベクトルを示し、

は、ａ回目修正されたタグパラメータ行列Ｈ_ｋ×ｎの

列目に対応する列ベクトルの転置ベクトルを示し、

は１以上ｎ以下の整数であり、

は学習効率であり、

は正の実数である。

は予め設定された経験値であり、

は、修正速度及び修正精度を包括して測定した後に設定されることができる。

オプションとして、ａ回目修正されたタグパラメータ行列Ｈ_ｋ×ｎに基づいて、下記式によりａ＋１回目修正されたタグパラメータ行列Ｈ_ｋ×ｎを算出してもよい。

ただし、

は、ａ＋１回目修正されたタグパラメータ行列Ｈ_ｋ×ｎのｆ行目に対応する行ベクトルを示し、

は、ａ回目修正されたタグパラメータ行列Ｈ_ｋ×ｎのｆ行目に対応する行ベクトルを示し、ｆは１以上ｋ以下の整数であり、

は学習効率であり、

は正の実数である。

は予め設定された経験値であり、

修正するたびに、Ｍ個の訓練サンプルのそれぞれに対応する

を１つずつ上記式に順に代入し、ユーザーパラメータ行列及びタグパラメータ行列に対してＭ回にわたる修正を実行する。

つまり、ユーザーパラメータ行列及びタグパラメータ行列に対してａ回目の修正を実行する中、ｘ＝１とし、ｘ個目の訓練サンプルに対応する

、ｘ−１回目修正されたユーザーパラメータ行列及びｘ−１回目修正されたタグパラメータ行列を上記ユーザーパラメータ行列の修正式に代入して、ｘ回目修正されたユーザーパラメータ行列を得る。ｘ個目の訓練サンプルに対応する

、ｘ−１回目修正されたタグパラメータ行列及びｘ回目修正されたユーザーパラメータ行列を上記タグパラメータ行列の修正式に代入して、ｘ回目修正されたタグパラメータ行列を得る。ｘ＝ｘ＋１とし、ｘがＭよりも大きいか否かを検出する。ＮＯであれば、ｘ個目の訓練サンプルに対応する

、ｘ−１回目修正されたユーザーパラメータ行列及びｘ−１回目修正されたタグパラメータ行列を上記ユーザーパラメータ行列の修正式に代入して、ｘ回目修正されたユーザーパラメータ行列を得るステップから再実行する。ＹＥＳであれば、そのフローが終了し、ａ回目の修正が完了する。０回目修正されたユーザーパラメータ行列は、ａ−１回目修正されたユーザーパラメータ行列であり、０回目修正されたユーザーパラメータ行列は、初期化されたユーザーパラメータ行列となり、ａ回目の修正過程に得られるＭ回目修正されたユーザーパラメータ行列は、ａ回目修正されたユーザーパラメータ行列である。０回目修正されたタグパラメータ行列は、ａ−１回目修正されたタグパラメータ行列であり、０回目修正されたタグパラメータ行列は、初期化されたタグパラメータ行列となり、ａ回目の修正過程に得られるＭ回目修正されたタグパラメータ行列は、ａ回目修正されたタグパラメータ行列である。

ステップ２０８：出力結果が予め設定された条件を満たしていれば、ａ回目修正されたユーザーパラメータ行列Ｗ_ｍ×ｋ及びａ回目修正されたタグパラメータ行列Ｈ_ｋ×ｎをそれぞれ、最終のユーザーパラメータ行列Ｗ_ｍ×ｋ及び最終のタグパラメータ行列Ｈ_ｋ×ｎとして決定する。

データフィッティングモデルの出力結果が予め設定された条件を満たす場合、ユーザーパラメータ行列Ｗ_ｍ×ｋ及びタグパラメータ行列Ｈ_ｋ×ｎの修正を停止し、現在のユーザーパラメータ行列Ｗ_ｍ×ｋを最終のユーザーパラメータ行列Ｗ_ｍ×ｋとして決定し、現在のタグパラメータ行列Ｈ_ｋ×ｎを最終のタグパラメータ行列Ｈ_ｋ×ｎとして決定する。

ステップ２０９：最終のユーザーパラメータ行列Ｗ_ｍ×ｋ及び最終のタグパラメータ行列Ｈ_ｋ×ｎに基づいて、ユーザー似顔絵行列Ｐ_ｍ×ｎを取得する。

ユーザーパラメータ行列及びタグパラメータ行列を繰り返して修正した後、最終のユーザーパラメータ行列及び最終のタグパラメータ行列を得て、最終のユーザーパラメータ行列及び最終のタグパラメータ行列に基づいて、ユーザーのタグに対する嗜好度を出力する。

例示的には、仮にフィッティング訓練サンプルから得られる最終のユーザーパラメータ行列及び最終のタグパラメータ行列はそれぞれ

であり、ｍ＝３、ｋ＝２、ｎ＝５であるとすれば、ユーザー似顔絵行列を算出すると、

になる。

オプションとして、本実施例に提供される方法は、以下のステップ２１０をさらに含んでもよい。

ステップ２１０：取得されたユーザー似顔絵行列Ｐ_ｍ×ｎ及びターゲット品物が持つタグに基づいて、ユーザーｕのターゲット品物に対する嗜好度を算出する。

オプションとして、ユーザーｕのターゲット品物が持つ各タグに対する嗜好度を合算して、ユーザーｕのターゲット品物に対する嗜好度を算出してもよい。

上述したように、本実施例に提供される方法では、ユーザー行動ログに基づいてＭ個の訓練サンプルを取得し、Ｍ個の訓練サンプルに基づいて、データフィッティングモデルを用いて、初期化されたユーザーパラメータ行列Ｗ_ｍ×ｋ及びタグパラメータ行列Ｈ_ｋ×ｎを修正し、最終のユーザーパラメータ行列Ｗ_ｍ×ｋ及び最終のタグパラメータ行列Ｈ_ｋ×ｎを得て、そして、最終のユーザーパラメータ行列Ｗ_ｍ×ｋ及び最終のタグパラメータ行列Ｈ_ｋ×ｎに基づいて、ユーザー似顔絵行列Ｐ_ｍ×ｎを取得することにより、関連技術に提供されるユーザー似顔絵を取得する方法では、所要時間や労働コストが高く、取得されたユーザー似顔絵の正確度が低い問題を解決する。ユーザー及びタグをパラメータ化するとともに、データフィッティングモデルを用いて、ユーザーパラメータ行列及びタグパラメータ行列を訓練サンプルにフィッティングするように修正することで、タグに対して対応するタグウェイトを人為的に設定する必要がなく、ユーザー行動ログに基づいて、データフィッティング方法によりユーザー似顔絵を自動的に取得し、時間や労働コストの節約を図り、ユーザー似顔絵を正確かつ高効率に取得する技術効果を達成する。

また、機械学習方式によりユーザーパラメータ行列及びタグパラメータ行列を訓練サンプルにフィッティングするように修正し、さらにユーザー似顔絵を自動的に取得し、より正確であり、高効率である。

また、似た者同士が集まる法則に基づいて、２人のユーザーは、類似度が高ければ高いほど、そのユーザー嗜好度も近づくはずであり、単にユーザー行動ログのみに基づいてユーザー似顔絵を取得するのではなく、データフィッティングモデルにユーザー類似度行列を制約条件として追加するとともに、ユーザーパラメータ行列の修正時にユーザー類似度行列をも考慮に入れることで、ユーザーパラメータベクトルとその関連ユーザーのユーザーパラメータベクトルとの間の強い相関性が示され、ユーザー似顔絵をより正確に取得する。

オプションとして、図４に示すように、以下のステップによってユーザー類似度行列Ｓ_ｍ×ｍを取得してもよい。

ステップ４０１：ｍ人の個々のユーザーのソーシャルネットワーク情報を取得する。

ソーシャルネットワーク情報には、ユーザー識別子、ユーザーの関連ユーザーリスト、ユーザーと関連ユーザー間の類似度が含まれている。

ユーザー識別子は、ユーザーの身元を識別するための識別子番号であり、ユーザーアカウントとも呼ばれ、あるシステムにおける相対的に唯一のコードである。ユーザーの関連ユーザーリストには、ユーザーの各関連ユーザー、即ち、ユーザーと関連付けられた他のユーザーが含まれている。ユーザーと関連ユーザー間の類似度とは、ユーザーと関連ユーザー間の相関性を意味する。ユーザーと関連ユーザー間の類似度は、ユーザーと関連ユーザー間のコミュニケーション頻度、ユーザーと関連ユーザーとが友人関係であるか、ユーザーと関連ユーザーとが同じソーシャルサークルを持っているか、ユーザーと関連ユーザーとが同じ人口属性を有するか、ユーザーと関連ユーザーとが同じ嗜好を有するか、等のうちの１つ又は複数のパラメータに基づいて決定されることができる。

ステップ４０２：ｍ人のユーザーのソーシャルネットワーク情報に基づいて、ユーザー類似度行列Ｓ_ｍ×ｍを生成する。

ｍ人のユーザーのソーシャルネットワーク情報に基づいて、２人のユーザー毎の類似度を取得し、ユーザー類似度行列Ｓ_ｍ×ｍを生成する。ユーザー類似度行列Ｓ_ｍ×ｍの行及び列はそれぞれユーザーを示し、例えば、ユーザー類似度行列Ｓ_ｍ×ｍの２行目の３列目はユーザー２とユーザー３間の類似度を示す。

例示的には、ユーザーの数が３である場合、ユーザー類似度行列Ｓ_ｍ×ｍは、

である。

１行目の０．６はユーザー１とユーザー２間の類似度を示し、０．４はユーザー１とユーザー３間の類似度を示す。ユーザー類似度行列Ｓ_ｍ×ｍの生成時に、ユーザーと関連ユーザー間の類似度のみを考え、ユーザーとそれ自体の類似度を考えないため、ユーザー類似度行列Ｓ_ｍ×ｍの対角要素Ｓ_ｕｕを０に設定する。

上述したように、ユーザー類似度行列を導入して、データフィッティングモデルの制約条件とすると同時に、ユーザーパラメータ行列を修正する１つのパラメータとし、最終的に取得されたユーザー似顔絵の正確度をさらに向上させる。また、上記実施例において、ユーザーパラメータベクトルとその関連ユーザーのユーザーパラメータベクトル間の強い相関性を示すように、ユーザー間の類似度のみを制約条件としてデータフィッティングモデルに組み込む。他の考えられる実施例において、必要に応じて、他のデータを制約条件としてデータフィッティングモデルに組み込んでもよい。例えば、タグ間の類似度を制約条件としてデータフィッティングモデルに組み込み、タグ類似度行列を構築し、タグ類似度行列の行及び列はそれぞれタグを示し、各要素は対応する行及び列に示される２つのタグ間の類似度を示し、タグ間の類似度はタグの示す意味の類似性によって決められることができ、例えば、２つのタグは意味が近づければ近づくほど、類似度が高く、これにより、タグパラメータベクトルとそれに類似するタグのタグパラメータベクトル間の強い相関性が示される。従って、上記データフィッティングモデルは、相対的に一般的な、ユーザーパラメータベクトル及びタグパラメータベクトルを自動的に学習することで、ユーザーのタグに対する嗜好度を取得するフレームワークであり、必要に応じて、他のデータを該モデルに追加してもよい。

図５を参照し、本発明の一実施例に提供されるユーザー似顔絵を取得する装置の構成ブロック図が示される。該装置は、ソフトウェア、ハーウェア又はそれらの組み合わせによりサーバの一部又は全部として実現されることができる。該装置は、サンプル取得モジュール５２０と、行列修正モジュール５４０と、似顔絵取得モジュール５６０とを備えることができる。

サンプル取得モジュール５２０は、ユーザー行動ログに基づいてＭ個の訓練サンプルを取得する。訓練サンプル＜ｕ，ｉ，ｊ＞は、ユーザーｕの品物ｉ及び品物ｊに対する嗜好度の差を反映し、Ｍは正の整数である。

行列修正モジュール５４０は、サンプル取得モジュール５２０で取得された訓練サンプルに基づいて、データフィッティングモデルを用いて、初期化されたユーザーパラメータ行列Ｗ_ｍ×ｋ及び初期化されたタグパラメータ行列Ｈ_ｋ×ｎを修正し、最終のユーザーパラメータ行列Ｗ_ｍ×ｋ及び最終のタグパラメータ行列Ｈ_ｋ×ｎを得る。ただし、ｍはユーザーの数を示し、ｋは因子の数を示し、ｎはタグの数を示し、ｍは正の整数であり、ｋは正の整数であり、ｎは１よりも大きい整数である。

似顔絵取得モジュール５６０は、行列修正モジュール５４０で得られた最終のユーザーパラメータ行列Ｗ_ｍ×ｋ及び最終のタグパラメータ行列Ｈ_ｋ×ｎに基づいて、ユーザー似顔絵行列Ｐ_ｍ×ｎを取得する。ユーザー似顔絵行列Ｐ_ｍ×ｎのｕ行目のｔ列目の要素Ｐ_ｕｔは、ユーザーｕのタグｔに対する嗜好度を示し、ｕは１以上ｍ以下の整数であり、ｔは１以上ｎ以下の整数である。

上述したように、本実施例に提供される装置では、ユーザー行動ログに基づいてＭ個の訓練サンプルを取得し、訓練サンプルに基づいて、データフィッティングモデルを用いて、初期化されたユーザーパラメータ行列Ｗ_ｍ×ｋ及びタグパラメータ行列Ｈ_ｋ×ｎを修正し、最終のユーザーパラメータ行列Ｗ_ｍ×ｋ及び最終のタグパラメータ行列Ｈ_ｋ×ｎを得て、そして、最終のユーザーパラメータ行列Ｗ_ｍ×ｋ及び最終のタグパラメータ行列Ｈ_ｋ×ｎに基づいて、ユーザー似顔絵行列Ｐ_ｍ×ｎを取得することにより、関連技術に提供されるユーザー似顔絵を取得する方法では、所要時間や労働コストが高く、取得されたユーザー似顔絵の正確度が低い問題を解決する。ユーザー及びタグをパラメータ化するとともに、データフィッティングモデルを用いて、ユーザーパラメータ行列及びタグパラメータ行列を訓練サンプルにフィッティングするように修正し、タグに対して対応するタグウェイトを人為的に設定する必要がなく、ユーザー行動ログに基づいて、データフィッティング方法によりユーザー似顔絵を自動的に取得し、時間や労働コストの節約を図り、ユーザー似顔絵を正確かつ高効率に取得する技術効果を達成する。

図６を参照し、本発明の別の実施例に提供されるユーザー似顔絵を取得する装置の構成ブロック図が示される。該装置は、ソフトウェア、ハーウェア又はそれらの組み合わせによりサーバの一部又は全部として実現されることができる。該装置は、サンプル取得モジュール６１０と、行列修正モジュール６５０と、似顔絵取得モジュール６６０とを備えることができる。

サンプル取得モジュール６１０は、ユーザー行動ログに基づいてＭ個の訓練サンプルを取得する。訓練サンプル＜ｕ，ｉ，ｊ＞は、ユーザーｕの品物ｉ及び品物ｊに対する嗜好度の差を反映し、Ｍは正の整数である。

考えられる１つの実施形態において、サンプル取得モジュール６１０は、行動取得ユニット６１１とサンプル取得ユニット６１２とを含む。

行動取得ユニット６１１は、ユーザー行動ログに基づいて、ｍ人の個々のユーザーの、ｈ個の品物のそれぞれに対する行動パターンを取得し、ｈは１よりも大きい整数である。

サンプル取得ユニット６１２は、行動取得ユニット６１１で取得された個々のユーザーの各品物に対する行動パターンに基づいて、Ｍ個の訓練サンプルを取得する。

オプションとして、該装置は、第２の生成モジュール６２０をさらに備えてもよい。

第２の生成モジュール６２０は、初期化されたユーザーパラメータ行列Ｗ_ｍ×ｋ及び初期化されたタグパラメータ行列Ｈ_ｋ×ｎを生成する。初期化されたユーザーパラメータ行列Ｗ_ｍ×ｋにおける要素は正規分布する乱数であり、初期化されたタグパラメータ行列Ｈ_ｋ×ｎにおける要素は正規分布する乱数である。

オプションとして、該装置は、情報取得モジュール６３０と第１の生成モジュール６４０とをさらに備えてもよい。

情報取得モジュール６３０は、ｍ人の個々のユーザーのソーシャルネットワーク情報を取得する。

第１の生成モジュール６４０は、情報取得モジュール６３０で取得されたｍ人のユーザーのソーシャルネットワーク情報に基づいて、ユーザー類似度行列Ｓ_ｍ×ｍを生成する。

行列修正モジュール６５０は、サンプル取得モジュール６１０で取得された訓練サンプルに基づいて、データフィッティングモデルを用いて、第２の生成モジュール６２０で生成された初期化されたユーザーパラメータ行列Ｗ_ｍ×ｋ及び初期化されたタグパラメータ行列Ｈ_ｋ×ｎを修正し、最終のユーザーパラメータ行列Ｗ_ｍ×ｋ及び最終のタグパラメータ行列Ｈ_ｋ×ｎを得る。ただし、ｍはユーザーの数を示し、ｋは因子の数を示し、ｎはタグの数を示し、ｍは正の整数であり、ｋは正の整数であり、ｎは１よりも大きい整数である。

考えられる１つの実施形態において、行列修正モジュール６５０は、第１の算出ユニット６５１と、第２の算出ユニット６５２と、確率取得ユニット６５３と、第３の算出ユニット６５４と、行列決定ユニット６５５と、行列修正ユニット６５６とを含む。

第１の算出ユニット６５１は、ａ＝０とし、ａ回目修正されたユーザーパラメータ行列Ｗ_ｍ×ｋ及びａ回目修正されたタグパラメータ行列Ｈ_ｋ×ｎに基づいて、ｍ人の個々のユーザーの、ｎ個のタグのそれぞれに対する嗜好度を算出する。ただし、ａは０以上の整数であり、０回目修正されたユーザーパラメータ行列Ｗ_ｍ×ｋは初期化されたユーザーパラメータ行列Ｗ_ｍ×ｋとなり、０回目修正されたタグパラメータ行列Ｈ_ｋ×ｎは初期化されたタグパラメータ行列Ｈ_ｋ×ｎとなる。

第２の算出ユニット６５２は、ｍ人の個々のユーザーの、ｎ個のタグのそれぞれに対する嗜好度及び品物タグ行列Ａ_ｈ×ｎに基づいて、ｍ人の個々のユーザーの、ｈ個の品物のそれぞれに対する嗜好度を算出する。ただし、ｈは品物の数を示し、ｈは１よりも大きい整数である。

確率取得ユニット６５３は、ｍ人の個々のユーザーの、ｈ個の品物のそれぞれに対する嗜好度に基づいて、Ｍ個の訓練サンプルのそれぞれに対応する確率を取得する。訓練サンプル＜ｕ，ｉ，ｊ＞に対応する確率とは、ユーザーｕの品物ｉに対する嗜好度が品物ｊに対する嗜好度よりも大きい確率である。

第３の算出ユニット６５４は、Ｍ個の訓練サンプルそれぞれに対応する確率をデータフィッティングモデルの入力パラメータとして、データフィッティングモデルの出力結果を算出する。

オプションとして、データフィッティングモデルは、

であってもよい。

ただし、

、

及び

、

及び

は正の実数であり、

は行列の２ノルムを示し、

であり、

はロジスティック関数を示し、

はユーザーｕの関連ユーザーの集合を示し、Ｓ_ｕｖはユーザー類似度行列Ｓ_ｍ×ｍのｕ行目のｖ列目の要素であり、Ｓ_ｕｖはユーザーｕとユーザーｖ間の類似度を示し、

行列決定ユニット６５５は、出力結果が予め設定された条件を満たしていれば、ａ回目修正されたユーザーパラメータ行列Ｗ_ｍ×ｋ及びａ回目修正されたタグパラメータ行列Ｈ_ｋ×ｎをそれぞれ、最終のユーザーパラメータ行列Ｗ_ｍ×ｋ及び最終のタグパラメータ行列Ｈ_ｋ×ｎとして決定する。

行列修正ユニット６５６は、出力結果が予め設定された条件を満たしていなければ、ａ回目修正されたユーザーパラメータ行列Ｗ_ｍ×ｋを修正してａ＋１回目修正されたユーザーパラメータ行列Ｗ_ｍ×ｋを得るとともに、ａ回目修正されたタグパラメータ行列Ｈ_ｋ×ｎを修正してａ＋１回目修正されたタグパラメータ行列Ｈ_ｋ×ｎを得て、ａ＝ａ＋１とし、ａ回目修正されたユーザーパラメータ行列Ｗ_ｍ×ｋ及びａ回目修正されたタグパラメータ行列Ｈ_ｋ×ｎに基づいて、ｍ人の個々のユーザーの、ｎ個のタグのそれぞれに対する嗜好度を算出するステップから再実行する。

考えられる１つの実施形態において、行列修正ユニット６５６は、具体的には、下記式によりａ＋１回目修正されたユーザーパラメータ行列Ｗ_ｍ×ｋを算出する。

ただし、

は、ａ回目修正されたタグパラメータ行列Ｈ_ｋ×ｎの

列目に対応する列ベクトルの転置ベクトルを示し、

は１以上ｎ以下の整数であり、

は学習効率であり、

は正の実数である。

考えられる１つの実施形態において、行列修正ユニット６５６は、具体的には、下記式によりａ＋１回目修正されたタグパラメータ行列Ｈ_ｋ×ｎを算出する。

ただし、

はａ回目修正されたタグパラメータ行列Ｈ_ｋ×ｎのｆ行目に対応する行ベクトルを示し、fは１以上ｋ以下の整数であり、

は学習効率であり、

は正の実数である。

似顔絵取得モジュール６６０は、行列修正モジュール６５０で得られた最終のユーザーパラメータ行列Ｗ_ｍ×ｋ及び最終のタグパラメータ行列Ｈ_ｋ×ｎに基づいて、ユーザー似顔絵行列Ｐ_ｍ×ｎを取得する。ユーザー似顔絵行列Ｐ_ｍ×ｎのｕ行目のｔ列目の要素Ｐ_ｕｔは、ユーザーｕのタグｔに対する嗜好度を示し、ｕは１以上ｍ以下の整数であり、ｔは１以上ｎ以下の整数である。

オプションとして、該装置は、嗜好度算出モジュール６７０をさらに備えてもよい。

嗜好度算出モジュール６７０は、似顔絵取得モジュール６６０で取得されたユーザー似顔絵行列Ｐ_ｍ×ｎ及びターゲット品物が持つタグに基づいて、ユーザーｕのターゲット品物に対する嗜好度を算出する。

上述したように、本実施例に提供される装置では、ユーザー行動ログに基づいてＭ個の訓練サンプルを取得し、訓練サンプルに基づいて、データフィッティングモデルを用いて、初期化されたユーザーパラメータ行列Ｗ_ｍ×ｋ及びタグパラメータ行列Ｈ_ｋ×ｎを修正し、最終のユーザーパラメータ行列Ｗ_ｍ×ｋ及び最終のタグパラメータ行列Ｈ_ｋ×ｎを得て、そして、最終のユーザーパラメータ行列Ｗ_ｍ×ｋ及び最終のタグパラメータ行列Ｈ_ｋ×ｎに基づいて、ユーザー似顔絵行列Ｐ_ｍ×ｎを取得することにより、関連技術に提供されるユーザー似顔絵を取得する方法では、所要時間や労働コストが高く、取得されたユーザー似顔絵の正確度が低い問題を解決する。ユーザー及びタグをパラメータ化するとともに、データフィッティングモデルを用いて、ユーザーパラメータ行列及びタグパラメータ行列を訓練サンプルにフィッティングするように修正することで、タグに対して対応するタグウェイトを人為的に設定する必要がなく、ユーザー行動ログに基づいて、データフィッティング方法によりユーザー似顔絵を自動的に取得し、時間や労働コストの節約を図り、ユーザー似顔絵を正確かつ高効率に取得する技術効果を達成する。

なお、上記実施例に提供される装置は、その機能を実現する際に、上記各機能モジュールに分割されることのみを例として説明したが、実際の適用において、必要に応じて、上記機能を異なる機能モジュールに完成させてもよく、つまり、以上で説明する機能の全部又は一部を完成するように、機器の内部構成を異なる機能モジュールに分割する。また、上記実施例に提供されるユーザー似顔絵を取得する装置は、ユーザー似顔絵を取得する方法実施例と同一の発想であり、その具体的な実現過程について方法実施例を詳しく参照するが、ここではその詳細を省略する。

図７を参照し、本発明の一実施例に提供されるサーバの構成を示す図が示されている。該サーバは、上記実施例に提供されるユーザー似顔絵を取得する方法を実施する。具体的には、
前記サーバ７００は、中央処理装置（ＣＰＵ）７０１と、ランダムアクセスメモリ（ＲＡＭ）７０２及びリードオンリーメモリ（ＲＯＭ）７０３を含むシステムメモリ７０４と、システムメモリ７０４と中央処理装置７０１とを接続するシステムバス７０５と、を備える。前記サーバ７００は、コンピュータ内の各素子間での情報伝送を支援する基本入出力システム（Ｉ／Ｏシステム）７０６と、操作システム７１３、アプリケーションプログラム７１４及び他のプログラムモジュール７１５を記憶するための大容量記憶装置７０７とをさらに備える。

前記基本入出力システム７０６は、情報を表示するための表示装置７０８と、ユーザーが情報を入力するための、マウス、キーボードのような入力装置７０９とを備える。前記表示装置７０８及び入力装置７０９は、それぞれ、システムバス７０５に接続される入出力コントローラ７１０を介して中央処理装置７０１に接続される。前記基本入出力システム７０６は、キーボード、マウス、又は電子スタイラス等、複数の他のデバイスからの入力を受信し処理するための入出力コントローラ７１０をさらに備えてもよい。これに類似して、入出力コントローラ７１０は、ディスプレイ、プリンタ又は他のタイプの出力デバイスへの出力をさらに提供する。

前記大容量記憶装置７０７は、システムバス７０５に接続される大容量記憶コントローラ（未図示）を介して中央処理装置７０１に接続される。前記大容量記憶装置７０７及びその関連するコンピュータ読取可能な媒体は、サーバ７００に不揮発性記憶を提供する。つまり、前記大容量記憶装置７０７は、ハードディスク又はＣＤ−ＲＯＭドライバのようなコンピュータ読取可能な媒体（未図示）を備えてもよい。

一般性を失うことなく、前記コンピュータ読取可能な媒体は、コンピュータ記憶媒体及び通信媒体を備えることができる。コンピュータ記憶媒体は、コンピュータ読取可能な命令、データ構成、プログラムモジュール又は他のデータのような情報を記憶する如何なる方法又は技術で実現される揮発性及び不揮発性、リムーバブル及びノンリムーバブルメディアを含む。コンピュータ記憶媒体は、ＲＡＭ、ＲＯＭ、ＥＰＲＯＭ、ＥＥＰＲＯＭ、フラッシュメモリ又は他のソリッドステート記憶技術、ＣＤ−ＲＯＭ、ＤＶＤ又は他の光学記憶、テープカセット、テープ、磁気ディスク記憶又は他の磁気記憶装置を含む。もちろん、前記コンピュータ記憶媒体は上述したいくつかに限られないのは、当業者が分かっている。上述したシステムメモリ７０４及び大容量記憶装置７０７はメモリと総称されることができる。

本発明の様々な実施例によれば、前記サーバ７００は、インターネットのようなネットワークを介してネットワーク上のリモートコンピュータに接続されて実行されてもよい。つまり、サーバ７００は、前記システムバス７０５に接続されるネットワークインターフェースユニット７１１を介してネットワーク７１２に接続されるか、ネットワークインターフェースユニット７１１を用いて他のタイプのネットワーク又はリモートコンピュータシステム（未図示）に接続されてもよい。

前記メモリは、１つ又は１つ以上のプログラムをさらに備え、前記１つ又は１つ以上のプログラムはメモリに記憶され、且つ、１つ又は１つ以上のプロセッサによって実行されるように構成される。上記１つ又は１つ以上のプログラムは、上記方法を実行するための命令を含む。

例示的な実施例において、命令を含む一時的でないコンピュータ読取可能な記憶媒体、例えば、命令を含むメモリがさらに提供され、上記命令は、サーバのプロセッサによって実行されて上記ユーザー似顔絵を取得する方法を完成する。例えば、前記一時的でないコンピュータ読取可能な記憶媒体は、ＲＯＭ、ランダムアクセスメモリ（ＲＡＭ）、ＣＤ−ＲＯＭ、テープ、ソフトディスク及び光データ記憶装置等であることができる。

本文に言及された「複数」とは、２つ又は２つ以上を意味することは、理解されるべきである。「及び／又は」は、関連対象の関連付けを記述し、３つの関係が可能であることを表し、例えば、Ａ及び／又はＢは、Ａが単独に存在するか、Ａ及びＢが同時に存在するか、Ｂが同時に存在するという３つの場合を表すことができる。キャラクタ「／」は、一般的には、関連付けられている対象が「又は」の関係にあることを表す。

上記本発明の実施例の番号は説明のためのものに過ぎず、実施例の優劣を示すものではない。

上記実施例のステップの全部又は一部は、ハードウェアによって完成されることができれば、プログラムによって関連するハードウェアに完成させることもでき、前記プログラムはコンピュータ読取可能な記憶媒体に記憶されることができ、上述した記憶媒体はリードオンリーメモリ、磁気ディスク又は光ディスク等であることができるのは、当業者が理解されることができる。

以上は、本発明の好適な実施例に過ぎず、本発明を限定することは意図していない。本発明の思想や原則内の如何なる修正、均等の置き換え、改良などは、本発明の保護範囲内に含まれるべきである。

図７を参照し、本発明の一実施例に提供されるサーバの構成を示す図が示されている。該サーバは、上記実施例に提供されるユーザー似顔絵を取得する方法を実施する。
具体的には、前記サーバ７００は、中央処理装置（ＣＰＵ）７０１と、ランダムアクセスメモリ（ＲＡＭ）７０２及びリードオンリーメモリ（ＲＯＭ）７０３を含むシステムメモリ７０４と、システムメモリ７０４と中央処理装置７０１とを接続するシステムバス７０５と、を備える。前記サーバ７００は、コンピュータ内の各素子間での情報伝送を支援する基本入出力システム（Ｉ／Ｏシステム）７０６と、操作システム７１３、アプリケーションプログラム７１４及び他のプログラムモジュール７１５を記憶するための大容量記憶装置７０７とをさらに備える。

Claims

ユーザー似顔絵を取得する方法であって、
ユーザー行動ログに基づいて、訓練サンプル＜ｕ，ｉ，ｊ＞がユーザーｕの品物ｉ及び品物ｊに対する嗜好度の差を反映するＭ（Ｍは正の整数である）個の訓練サンプルを取得することと、
前記Ｍ個の訓練サンプルに基づいて、データフィッティングモデルを用いて、初期化されたユーザーパラメータ行列Ｗ_ｍ×ｋ及び初期化されたタグパラメータ行列Ｈ_ｋ×ｎを修正し、最終のユーザーパラメータ行列Ｗ_ｍ×ｋ及び最終のタグパラメータ行列Ｈ_ｋ×ｎを得て、ただし、ｍ（ｍは正の整数である）はユーザーの数を示し、ｋ（ｋは正の整数である）は因子の数を示し、ｎ（ｎは１よりも大きい整数である）はタグの数を示すことと、
前記最終のユーザーパラメータ行列Ｗ_ｍ×ｋ及び前記最終のタグパラメータ行列Ｈ_ｋ×ｎに基づいて、ｕ（ｕは１以上ｍ以下の整数である）行目のｔ（ｔは１以上ｎ以下の整数である）列目の要素Ｐ_ｕｔがユーザーｕのタグｔに対する嗜好度を示すユーザー似顔絵行列Ｐ_ｍ×ｎを取得することと、
を含むことを特徴とする方法。
前記Ｍ個の訓練サンプルに基づいて、データフィッティングモデルを用いて、初期化されたユーザーパラメータ行列Ｗ_ｍ×ｋ及びタグパラメータ行列Ｈ_ｋ×ｎを修正し、最終のユーザーパラメータ行列Ｗ_ｍ×ｋ及び最終のタグパラメータ行列Ｈ_ｋ×ｎを得ることは、
ａ＝０とし、ａ（ａは０以上の整数である）回目修正されたユーザーパラメータ行列Ｗ_ｍ×ｋ及びａ回目修正されたタグパラメータ行列Ｈ_ｋ×ｎに基づいて、前記ｍ人の個々のユーザーの、前記ｎ個のタグのそれぞれに対する嗜好度を算出し、ただし、０回目修正されたユーザーパラメータ行列Ｗ_ｍ×ｋは前記初期化されたユーザーパラメータ行列Ｗ_ｍ×ｋとなり、０回目修正されたタグパラメータ行列Ｈ_ｋ×ｎは前記初期化されたタグパラメータ行列Ｈ_ｋ×ｎとなることと、
前記ｍ人の個々のユーザーの、前記ｎ個のタグのそれぞれに対する嗜好度及び品物タグ行列Ａ_ｈ×ｎに基づいて、前記ｍ人の個々のユーザーの、前記ｈ個の品物のそれぞれに対する嗜好度を算出し、ただし、ｈ（ｈは１よりも大きい整数である）は品物の数を示すことと、
前記ｍ人の個々のユーザーの、前記ｈ個の品物のそれぞれに対する嗜好度に基づいて、前記Ｍ個の訓練サンプルのそれぞれに対応する確率を取得し、ただし、前記訓練サンプル＜ｕ，ｉ，ｊ＞に対応する確率とは、前記ユーザーｕの前記品物ｉに対する嗜好度が前記品物ｊに対する嗜好度よりも大きい確率であることと、
前記Ｍ個の訓練サンプルそれぞれに対応する確率を前記データフィッティングモデルの入力パラメータとして、前記データフィッティングモデルの出力結果を算出することと、
前記出力結果が予め設定された条件を満たしていれば、前記ａ回目修正されたユーザーパラメータ行列Ｗ_ｍ×ｋ及び前記ａ回目修正されたタグパラメータ行列Ｈ_ｋ×ｎをそれぞれ、前記最終のユーザーパラメータ行列Ｗ_ｍ×ｋ及び前記最終のタグパラメータ行列Ｈ_ｋ×ｎとして決定することと、
前記出力結果が前記予め設定された条件を満たしていなければ、前記ａ回目修正されたユーザーパラメータ行列Ｗ_ｍ×ｋを修正してａ＋１回目修正されたユーザーパラメータ行列Ｗ_ｍ×ｋを得るとともに、前記ａ回目修正されたタグパラメータ行列Ｈ_ｋ×ｎを修正してａ＋１回目修正されたタグパラメータ行列Ｈ_ｋ×ｎを得て、ａ＝ａ＋１とし、ａ回目修正されたユーザーパラメータ行列Ｗ_ｍ×ｋ及びａ回目修正されたタグパラメータ行列Ｈ_ｋ×ｎに基づいて、前記ｍ人の個々のユーザーの、前記ｎ個のタグのそれぞれに対する嗜好度を算出するステップから再実行することと、を含む、
ことを特徴とする請求項１に記載の方法。
前記データフィッティングモデルは下記式である、ことを特徴とする請求項２に記載の方法。

（ただし、

、

及び

は、オーバーフィッティングを防止するための正規化パラメータであり、

、

及び

は正の実数であり、

は行列の２ノルムを示し、

は前記Ｍ個の訓練サンプルの集合を示し、前記訓練サンプル＜ｕ，ｉ，ｊ＞に対応する確率は

であり、

は前記ユーザーｕの前記品物ｉに対する嗜好度と前記ユーザーｕの前記品物ｊに対する嗜好度との差を示し、

はロジスティック関数を示し、

は前記ａ回目修正されたユーザーパラメータ行列Ｗ_ｍ×ｋのｕ行目に対応する行ベクトルを示し、

は前記ａ回目修正されたユーザーパラメータ行列Ｗ_ｍ×ｋのｖ行目に対応する行ベクトルを示す。）
前記ｍ人の個々のユーザーのソーシャルネットワーク情報を取得することと、
前記ｍ人のユーザーのソーシャルネットワーク情報に基づいて、前記ユーザー類似度行列Ｓ_ｍ×ｍを生成することと、をさらに含む、
ことを特徴とする請求項３に記載の方法。
前記ａ回目修正されたユーザーパラメータ行列Ｗ_ｍ×ｋを修正してａ＋１回目修正されたユーザーパラメータ行列Ｗ_ｍ×ｋを得ることは、
下記式により前記ａ＋１回目修正されたユーザーパラメータ行列Ｗ_ｍ×ｋを算出することを含む、ことを特徴とする請求項３に記載の方法。

（ただし、

は、前記ａ＋１回目修正されたユーザーパラメータ行列Ｗ_ｍ×ｋのｕ行目に対応する行ベクトルを示し、

は、前記ａ回目修正されたユーザーパラメータ行列Ｗ_ｍ×ｋのｕ行目に対応する行ベクトルを示し、

は、前記ａ回目修正されたタグパラメータ行列Ｈ_ｋ×ｎの

列目に対応する列ベクトルの転置ベクトルを示し、

は１以上ｎ以下の整数であり、

は学習効率であり、

は正の実数である。）
前記ａ回目修正されたタグパラメータ行列Ｈ_ｋ×ｎを修正してａ＋１回目修正されたタグパラメータ行列Ｈ_ｋ×ｎを得ることは、
下記式により前記ａ＋１回目修正されたタグパラメータ行列Ｈ_ｋ×ｎを算出することを含む、ことを特徴とする請求項３に記載の方法。

（ただし、

は、前記ａ＋１回目修正されたタグパラメータ行列Ｈ_ｋ×ｎのｆ行目に対応する行ベクトルを示し、

は、前記ａ回目修正されたタグパラメータ行列Ｈ_ｋ×ｎのｆ行目に対応する行ベクトルを示し、ｆは１以上ｋ以下の整数であり、

は学習効率であり、

は正の実数である。）
ユーザー行動ログに基づいてＭ個の訓練サンプルを取得することは、
前記ユーザー行動ログに基づいて、前記ｍ人の個々のユーザーの、ｈ（ｈは１よりも大きい整数である）個の品物のそれぞれに対する行動パターンを取得することと、
個々のユーザーの各品物に対する行動パターンに基づいて、前記Ｍ個の訓練サンプルを取得することと、を含む、
ことを特徴とする請求項１乃至６のいずれかに記載の方法。
前記Ｍ個の訓練サンプルに基づいて、データフィッティングモデルを用いて、初期化されたユーザーパラメータ行列Ｗ_ｍ×ｋ及びタグパラメータ行列Ｈ_ｋ×ｎを修正し、最終のユーザーパラメータ行列Ｗ_ｍ×ｋ及び最終のタグパラメータ行列Ｈ_ｋ×ｎを得る前に、
要素が正規分布する乱数である前記初期化されたユーザーパラメータ行列Ｗ_ｍ×ｋ、及び、要素が正規分布する乱数である前記初期化されたタグパラメータ行列Ｈ_ｋ×ｎを生成すること、をさらに含む、
ことを特徴とする請求項１乃至６のいずれかに記載の方法。
前記最終のユーザーパラメータ行列Ｗ_ｍ×ｋ及び前記最終のタグパラメータ行列Ｈ_ｋ×ｎに基づいて、ユーザー似顔絵行列Ｐ_ｍ×ｎを取得した後、
前記ユーザー似顔絵行列Ｐ_ｍ×ｎ及びターゲット品物が持つタグに基づいて、前記ユーザーｕの前記ターゲット品物に対する嗜好度を算出すること、をさらに含む、
ことを特徴とする請求項１乃至６のいずれかに記載の方法。
ユーザー似顔絵を取得する装置であって、
ユーザー行動ログに基づいて、訓練サンプル＜ｕ，ｉ，ｊ＞がユーザーｕの品物ｉ及び品物ｊに対する嗜好度の差を反映するＭ（Ｍは正の整数である）個の訓練サンプルを取得するサンプル取得モジュールと、
前記Ｍ個の訓練サンプルに基づいて、データフィッティングモデルを用いて、初期化されたユーザーパラメータ行列Ｗ_ｍ×ｋ及び初期化されたタグパラメータ行列Ｈ_ｋ×ｎを修正し、最終のユーザーパラメータ行列Ｗ_ｍ×ｋ及び最終のタグパラメータ行列Ｈ_ｋ×ｎを得て、ただし、ｍ（ｍは正の整数である）はユーザーの数を示し、ｋ（ｋは正の整数である）は因子の数を示し、ｎ（ｎは１よりも大きい整数である）はタグの数を示す行列修正モジュールと、
前記最終のユーザーパラメータ行列Ｗ_ｍ×ｋ及び前記最終のタグパラメータ行列Ｈ_ｋ×ｎに基づいて、ｕ（ｕは１以上ｍ以下の整数である）行目のｔ（ｔは１以上ｎ以下の整数である）列目の要素Ｐ_ｕｔがユーザーｕのタグｔに対する嗜好度を示すユーザー似顔絵行列Ｐ_ｍ×ｎを取得する画像取得モジュールと、
を備えることを特徴とする装置。
前記行列修正モジュールは、
ａ＝０とし、ａ（ａは０以上の整数である）回目修正されたユーザーパラメータ行列Ｗ_ｍ×ｋ及びａ回目修正されたタグパラメータ行列Ｈ_ｋ×ｎに基づいて、前記ｍ人の個々のユーザーの、前記ｎ個のタグのそれぞれに対する嗜好度を算出し、ただし、０回目修正されたユーザーパラメータ行列Ｗ_ｍ×ｋは前記初期化されたユーザーパラメータ行列Ｗ_ｍ×ｋとなり、０回目修正されたタグパラメータ行列Ｈ_ｋ×ｎは前記初期化されたタグパラメータ行列Ｈ_ｋ×ｎとなる第１の算出ユニットと、
前記ｍ人の個々のユーザーの、前記ｎ個のタグのそれぞれに対する嗜好度及び品物タグ行列Ａ_ｈ×ｎに基づいて、前記ｍ人の個々のユーザーの、前記ｈ個の品物のそれぞれに対する嗜好度を算出し、ただし、ｈ（ｈは１よりも大きい整数である）は品物の数を示す第２の算出ユニットと、
前記ｍ人の個々のユーザーの、前記ｈ個の品物のそれぞれに対する嗜好度に基づいて、前記Ｍ個の訓練サンプルのそれぞれに対応する確率を取得し、ただし、前記訓練サンプル＜ｕ，ｉ，ｊ＞に対応する確率とは、前記ユーザーｕの前記品物ｉに対する嗜好度が前記品物ｊに対する嗜好度よりも大きい確率である確率取得ユニットと、
前記Ｍ個の訓練サンプルそれぞれに対応する確率を前記データフィッティングモデルの入力パラメータとして、前記データフィッティングモデルの出力結果を算出する第３の算出ユニットと、
前記出力結果が予め設定された条件を満たしていれば、前記ａ回目修正されたユーザーパラメータ行列Ｗ_ｍ×ｋ及び前記ａ回目修正されたタグパラメータ行列Ｈ_ｋ×ｎをそれぞれ、前記最終のユーザーパラメータ行列Ｗ_ｍ×ｋ及び前記最終のタグパラメータ行列Ｈ_ｋ×ｎとして決定する行列決定ユニットと、
前記出力結果が前記予め設定された条件を満たしていなければ、前記ａ回目修正されたユーザーパラメータ行列Ｗ_ｍ×ｋを修正してａ＋１回目修正されたユーザーパラメータ行列Ｗ_ｍ×ｋを得るとともに、前記ａ回目修正されたタグパラメータ行列Ｈ_ｋ×ｎを修正してａ＋１回目修正されたタグパラメータ行列Ｈ_ｋ×ｎを得て、ａ＝ａ＋１とし、ａ回目修正されたユーザーパラメータ行列Ｗ_ｍ×ｋ及びａ回目修正されたタグパラメータ行列Ｈ_ｋ×ｎに基づいて、前記ｍ人の個々のユーザーの、前記ｎ個のタグのそれぞれに対する嗜好度を算出するステップから再実行する行列修正ユニットと、を含む、
ことを特徴とする請求項１０に記載の装置。
前記データフィッティングモデルは下記式である、ことを特徴とする請求項１１に記載の装置。

（ただし、

、

及び

は、オーバーフィッティングを防止するための正規化パラメータであり、

、

及び

は正の実数であり、

は行列の２ノルムを示し、

は前記Ｍ個の訓練サンプルの集合を示し、前記訓練サンプル＜ｕ，ｉ，ｊ＞に対応する確率は

であり、

は前記ユーザーｕの前記品物ｉに対する嗜好度と前記ユーザーｕの前記品物ｊに対する嗜好度との差を示し

はロジスティック関数を示し、

は前記ａ回目修正されたユーザーパラメータ行列Ｗ_ｍ×ｋのｕ行目に対応する行ベクトルを示し、

は前記ａ回目修正されたユーザーパラメータ行列Ｗ_ｍ×ｋのｖ行目に対応する行ベクトルを示す。）
前記ｍ人の個々のユーザーのソーシャルネットワーク情報を取得する情報取得モジュールと、
前記ｍ人のユーザーのソーシャルネットワーク情報に基づいて、前記ユーザー類似度行列Ｓ_ｍ×ｍを生成する第１の生成モジュールと、をさらに備える、
ことを特徴とする請求項１２に記載の装置。
前記行列修正ユニットは、具体的には、下記式により前記ａ＋１回目修正されたユーザーパラメータ行列Ｗ_ｍ×ｋを算出する、ことを特徴とする請求項１２に記載の装置。

（ただし、

は、前記ａ＋１回目修正されたユーザーパラメータ行列Ｗ_ｍ×ｋのｕ行目に対応する行ベクトルを示し、

は、前記ａ回目修正されたユーザーパラメータ行列Ｗ_ｍ×ｋのｕ行目に対応する行ベクトルを示し、

は、前記ａ回目修正されたタグパラメータ行列Ｈ_ｋ×ｎの

列目に対応する列ベクトルの転置ベクトルを示し、

は１以上ｎ以下の整数であり、

は学習効率であり、

は正の実数である。）
前記行列修正ユニットは、具体的には、下記式により前記ａ＋１回目修正されたタグパラメータ行列Ｈ_ｋ×ｎを算出する、ことを特徴とする請求項１２に記載の装置。

（ただし、

は、前記ａ＋１回目修正されたタグパラメータ行列Ｈ_ｋ×ｎのｆ行目に対応する行ベクトルを示し、

は、前記ａ回目修正されたタグパラメータ行列Ｈ_ｋ×ｎのｆ行目に対応する行ベクトルを示し、ｆは１以上ｋ以下の整数であり、

は学習効率であり、

は正の実数である。）
前記サンプル取得モジュールは、
前記ユーザー行動ログに基づいて、前記ｍ人の個々のユーザーの、ｈ（ｈは１よりも大きい整数である）個の品物のそれぞれに対する行動パターンを取得する行動取得ユニットと、
個々のユーザーの各品物に対する行動パターンに基づいて、前記Ｍ個の訓練サンプルを取得するサンプル取得ユニットと、を含む、
ことを特徴とする請求項１０乃至１５のいずれかに記載の装置。
要素が正規分布する乱数である前記初期化されたユーザーパラメータ行列Ｗ_ｍ×ｋ、及び、要素が正規分布する乱数である前記初期化されたタグパラメータ行列Ｈ_ｋ×ｎを生成する第２の生成モジュール、をさらに備える、
ことを特徴とする請求項１０乃至１５のいずれかに記載の装置。
前記ユーザー似顔絵行列Ｐ_ｍ×ｎ及びターゲット品物が持つタグに基づいて、前記ユーザーｕの前記ターゲット品物に対する嗜好度を算出する嗜好度算出モジュール、をさらに備える、
ことを特徴とする請求項１０乃至１５のいずれかに記載の装置。
ユーザー似顔絵を取得する装置であって、
１つ又は複数のプロセッサと、
前記１つ又は複数のプロセッサに接続されるメモリであって、前記１つ又は複数のプロセッサによって実行される１つ又は複数のプログラムが記憶されたメモリと、を備え、
前記１つ又は複数のプログラムは、
ユーザー行動ログに基づいて、訓練サンプル＜ｕ，ｉ，ｊ＞がユーザーｕの品物ｉ及び品物ｊに対する嗜好度の差を反映するＭ（Ｍは正の整数である）個の訓練サンプルを取得する動作と、
前記Ｍ個の訓練サンプルに基づいて、データフィッティングモデルを用いて、初期化されたユーザーパラメータ行列Ｗ_ｍ×ｋ及び初期化されたタグパラメータ行列Ｈ_ｋ×ｎを修正し、最終のユーザーパラメータ行列Ｗ_ｍ×ｋ及び最終のタグパラメータ行列Ｈ_ｋ×ｎを得て、ただし、ｍ（ｍは正の整数である）はユーザーの数を示し、ｋ（ｋは正の整数である）は因子の数を示し、ｎ（ｎは１よりも大きい整数である）はタグの数を示す動作と、
前記最終のユーザーパラメータ行列Ｗ_ｍ×ｋ及び前記最終のタグパラメータ行列Ｈ_ｋ×ｎに基づいて、ｕ（ｕは１以上ｍ以下の整数である）行目のｔ（ｔは１以上ｎ以下の整数である）列目の要素Ｐ_ｕｔがユーザーｕのタグｔに対する嗜好度を示すユーザー似顔絵行列Ｐ_ｍ×ｎを取得する動作と、を実行するための命令を含む、ことを特徴とする装置。
前記１つ又は複数のプログラムは、
ａ＝０とし、ａ（ａは０以上の整数である）回目修正されたユーザーパラメータ行列Ｗ_ｍ×ｋ及びａ回目修正されたタグパラメータ行列Ｈ_ｋ×ｎに基づいて、前記ｍ人の個々のユーザーの、前記ｎ個のタグのそれぞれに対する嗜好度を算出し、ただし、０回目修正されたユーザーパラメータ行列Ｗ_ｍ×ｋは前記初期化されたユーザーパラメータ行列Ｗ_ｍ×ｋとなり、０回目修正されたタグパラメータ行列Ｈ_ｋ×ｎは前記初期化されたタグパラメータ行列Ｈ_ｋ×ｎとなる動作と、
前記ｍ人の個々のユーザーの、前記ｎ個のタグのそれぞれに対する嗜好度及び品物タグ行列Ａ_ｈ×ｎに基づいて、前記ｍ人の個々のユーザーの、前記ｈ個の品物のそれぞれに対する嗜好度を算出し、ただし、ｈ（ｈは１よりも大きい整数である）は品物の数を示す動作と、
前記ｍ人の個々のユーザーの、前記ｈ個の品物のそれぞれに対する嗜好度に基づいて、前記Ｍ個の訓練サンプルのそれぞれに対応する確率を取得し、ただし、前記訓練サンプル＜ｕ，ｉ，ｊ＞に対応する確率とは、前記ユーザーｕの前記品物ｉに対する嗜好度が前記品物ｊに対する嗜好度よりも大きい確率である動作と、
前記Ｍ個の訓練サンプルそれぞれに対応する確率を前記データフィッティングモデルの入力パラメータとして、前記データフィッティングモデルの出力結果を算出する動作と、
前記出力結果が予め設定された条件を満たしていれば、前記ａ回目修正されたユーザーパラメータ行列Ｗ_ｍ×ｋ及び前記ａ回目修正されたタグパラメータ行列Ｈ_ｋ×ｎをそれぞれ、前記最終のユーザーパラメータ行列Ｗ_ｍ×ｋ及び前記最終のタグパラメータ行列Ｈ_ｋ×ｎとして決定する動作と、
前記出力結果が前記予め設定された条件を満たしていなければ、前記ａ回目修正されたユーザーパラメータ行列Ｗ_ｍ×ｋを修正してａ＋１回目修正されたユーザーパラメータ行列Ｗ_ｍ×ｋを得るとともに、前記ａ回目修正されたタグパラメータ行列Ｈ_ｋ×ｎを修正してａ＋１回目修正されたタグパラメータ行列Ｈ_ｋ×ｎを得て、ａ＝ａ＋１とし、ａ回目修正されたユーザーパラメータ行列Ｗ_ｍ×ｋ及びａ回目修正されたタグパラメータ行列Ｈ_ｋ×ｎに基づいて、前記ｍ人の個々のユーザーの、前記ｎ個のタグのそれぞれに対する嗜好度を算出するステップから再実行する動作と、を実行するための命令をさらに含む、
ことを特徴とする請求項１９に記載の装置。
前記データフィッティングモデルは下記式である、ことを特徴とする請求項２０に記載の装置。

（ただし、

、

及び

は、オーバーフィッティングを防止するための正規化パラメータであり、

、

及び

は正の実数であり、

は行列の２ノルムを示し、

は前記Ｍ個の訓練サンプルの集合を示し、前記訓練サンプル＜ｕ，ｉ，ｊ＞に対応する確率は

であり、

は前記ユーザーｕの前記品物ｉに対する嗜好度と前記ユーザーｕの前記品物ｊに対する嗜好度との差を示し、

はロジスティック関数を示し、

は前記ａ回目修正されたユーザーパラメータ行列Ｗ_ｍ×ｋのｕ行目に対応する行ベクトルを示し、

は前記ａ回目修正されたユーザーパラメータ行列Ｗ_ｍ×ｋのｖ行目に対応する行ベクトルを示す。）
前記１つ又は複数のプログラムは、
前記ｍ人の個々のユーザーのソーシャルネットワーク情報を取得する動作と、
前記ｍ人のユーザーのソーシャルネットワーク情報に基づいて、前記ユーザー類似度行列Ｓ_ｍ×ｍを生成する動作と、を実行するための命令をさらに含む、
ことを特徴とする請求項２１に記載の装置。
前記１つ又は複数のプログラムは、
下記式により前記ａ＋１回目修正されたユーザーパラメータ行列Ｗ_ｍ×ｋを算出する動作を実行するための命令をさらに含む、ことを特徴とする請求項２１に記載の装置。

（ただし、

は、前記ａ＋１回目修正されたユーザーパラメータ行列Ｗ_ｍ×ｋのｕ行目に対応する行ベクトルを示し、

は、前記ａ回目修正されたユーザーパラメータ行列Ｗ_ｍ×ｋのｕ行目に対応する行ベクトルを示し、

は、前記ａ回目修正されたタグパラメータ行列Ｈ_ｋ×ｎの

列目に対応する列ベクトルの転置ベクトルを示し、

は１以上ｎ以下の整数であり、

は学習効率であり、

は正の実数である。）
前記１つ又は複数のプログラムは、
下記式により前記ａ＋１回目修正されたタグパラメータ行列Ｈ_ｋ×ｎを算出する動作を実行するための命令をさらに含む、ことを特徴とする請求項２１に記載の装置。

（ただし、

は、前記ａ＋１回目修正されたタグパラメータ行列Ｈ_ｋ×ｎのｆ行目に対応する行ベクトルを示し、

は、前記ａ回目修正されたタグパラメータ行列Ｈ_ｋ×ｎのｆ行目に対応する行ベクトルを示し、ｆは１以上ｋ以下の整数であり、

は学習効率であり、

は正の実数である。）
前記１つ又は複数のプログラムは、
前記ユーザー行動ログに基づいて、前記ｍ人の個々のユーザーの、ｈ（ｈは１よりも大きい整数である）個の品物のそれぞれに対する行動パターンを取得する動作と、
個々のユーザーの各品物に対する行動パターンに基づいて、前記Ｍ個の訓練サンプルを取得する動作と、を実行するための命令をさらに含む、
ことを特徴とする請求項１９乃至２４のいずれかに記載の装置。
前記１つ又は複数のプログラムは、
要素が正規分布する乱数である前記初期化されたユーザーパラメータ行列Ｗ_ｍ×ｋ、及び、要素が正規分布する乱数である前記初期化されたタグパラメータ行列Ｈ_ｋ×ｎを生成する動作を実行するための命令をさらに含む、
ことを特徴とする請求項１９乃至２４のいずれかに記載の装置。
前記１つ又は複数のプログラムは、
前記ユーザー似顔絵行列Ｐ_ｍ×ｎ及びターゲット品物が持つタグに基づいて、前記ユーザーｕの前記ターゲット品物に対する嗜好度を算出する動作を実行するための命令をさらに含む、
ことを特徴とする請求項１９乃至２４のいずれかに記載の装置。