JP2019503006A - ユーザー似顔絵を取得する方法及び装置 - Google Patents

ユーザー似顔絵を取得する方法及び装置 Download PDF

Info

Publication number
JP2019503006A
JP2019503006A JP2018535169A JP2018535169A JP2019503006A JP 2019503006 A JP2019503006 A JP 2019503006A JP 2018535169 A JP2018535169 A JP 2018535169A JP 2018535169 A JP2018535169 A JP 2018535169A JP 2019503006 A JP2019503006 A JP 2019503006A
Authority
JP
Japan
Prior art keywords
user
parameter matrix
tag
matrix
preference
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018535169A
Other languages
English (en)
Other versions
JP6615362B2 (ja
Inventor
ル,メンピン
Original Assignee
テンセント・テクノロジー・(シェンジェン)・カンパニー・リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by テンセント・テクノロジー・(シェンジェン)・カンパニー・リミテッド filed Critical テンセント・テクノロジー・(シェンジェン)・カンパニー・リミテッド
Publication of JP2019503006A publication Critical patent/JP2019503006A/ja
Application granted granted Critical
Publication of JP6615362B2 publication Critical patent/JP6615362B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/76Architectures of general purpose stored program computers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24317Piecewise classification, i.e. whereby each classification requires several discriminant rules
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/2866Architectures; Arrangements
    • H04L67/30Profiles
    • H04L67/306User profiles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/535Tracking the activity of the user
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Mathematical Physics (AREA)
  • Computer Hardware Design (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Primary Health Care (AREA)
  • Human Resources & Organizations (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Medical Informatics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Game Theory and Decision Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Heterocyclic Carbon Compounds Containing A Hetero Ring Having Oxygen Or Sulfur (AREA)

Abstract

ユーザー似顔絵を取得する方法及び装置であって、情報処理技術分野に属する。前記方法は、ユーザー行動ログに基づいて、訓練サンプル<u,i,j>がユーザーuの品物i及び品物jに対する嗜好度の差を反映するM(Mは正の整数である)個の訓練サンプルを取得すること(101)と、M個の訓練サンプルに基づいて、データフィッティングモデルを用いて、初期化されたユーザーパラメータ行列Wm×k及びタグパラメータ行列Hk×nを修正し、最終のユーザーパラメータ行列Wm×k及び最終のタグパラメータ行列Hk×nを得ること(102)と、最終のユーザーパラメータ行列Wm×k及び最終のタグパラメータ行列Hk×nに基づいて、ユーザー似顔絵行列Pm×nを取得すること(103)と、を含む。ユーザー及びタグをパラメータ化するとともに、データフィッティングモデルを用いて、ユーザーパラメータ行列及びタグパラメータ行列を訓練サンプルにフィッティングするように修正することで、タグに対して対応するタグウェイトを人為的に設定する必要がなく、ユーザー行動ログに基づいて、データフィッティング方法によりユーザー似顔絵を自動的に取得し、時間や労働コストの節約を図り、ユーザー似顔絵を正確かつ高効率に取得する技術効果を達成する。

Description

本発明の実施例は情報処理技術分野に関し、特に、ユーザー似顔絵を取得する方法及び装置に関する。 本願は、2016年4月29日にて中国特許庁へ出願した、出願番号が201610284124.6で、発明の名称が「ユーザー似顔絵を取得する方法及び装置」である中国特許出願の優先権を主張し、その内容を全て参照により本願に組み込むものとする。
ユーザー似顔絵は、ユーザーペルソナ(Persona)とも呼ばれ、ターゲットユーザーの輪郭を描き、ユーザーの需要と設計方向とを関連付ける有効な道具であり、各分野に広く適用されている。具体的な実現にあたり、ユーザー似顔絵は、ユーザーを特徴付けるタグ(tag)セットによって示されることができ、該タグセットは、ユーザーの社会的属性、生活習慣、消費行動などからユーザーを特徴付けるタグを含むことができる。例えば、年齢、性別、地域、学歴及びユーザー嗜好等のタグを含む。
関連技術には、ユーザー似顔絵を取得する方法が提供されている。複数のタグを予め設定し、各タグごとに対応するタグウェイトを人為的に設定し、タグウェイトは、実際の適用の需要に応じて、又は人間の経験に基づいて予め設定されることができる。オプションとして、各タグごとに、該タグを持つ品物がすべての品物に占める割合に基づいて、該タグに対応するタグウェイトを設定してもよい。通常、上記割合とタグウェイトとは負の相関関係を呈しており、つまり、上記割合が大きければ大きいほどタグウェイトが小さくなり、上記割合が小さければ小さいほどタグウェイトが大きくなる。その後、ユーザー行動ログを取得し、ユーザー行動ログには、ユーザーが各品物に対して実行した様々な行動が記録されており、例えば、ユーザー1が品物1を閲覧した、ユーザー2が品物1を購入した、ユーザー1が品物2を購入した等が記録される。そして、各品物が持つタグ及びユーザーが各品物に対して実行した行動に基づいて、ユーザーの各タグに対する行動ウェイトを決定する。最後に、各タグに対応するタグウェイト及び行動ウェイトそれぞれに基づいて、ユーザーの該タグに対する嗜好度を算出し、ユーザーの各タグに対する嗜好度をまとめてユーザー似顔絵を得る。例えば、ユーザーのあるタグに対する嗜好度は、該タグに対応するタグウェイトと行動ウェイトとの積によって示されることができる。
しかしながら、関連技術において、各タグごとに対応するタグウェイトを人為的に設定する必要があり、タグの数が多いのがほとんどであるため、大量の時間や人的資源が必要となり、ユーザー似顔絵を取得するための所要時間や労働コストが高くなる。そして、タグウェイトを人為的に設定する方法は誤差が避けられず、人為的に設定したタグウェイトと実際のサービスとが一致するのを確保しにくいため、最終的に取得されたユーザー似顔絵の正確度が低い。
関連技術に提供されるユーザー似顔絵を取得する方法では、所要時間や労働コストが高く、取得されたユーザー似顔絵の正確度が低い問題を解決するために、本発明の実施例は、ユーザー似顔絵を取得する方法及び装置を提供する。その技術思想は以下の通りである。
本発明の実施例の第1の態様は、ユーザー似顔絵を取得する方法であって、
ユーザー行動ログに基づいて、訓練サンプル<u,i,j>がユーザーuの品物i及び品物jに対する嗜好度の差を反映するM(Mは正の整数である)個の訓練サンプルを取得することと、
前記M個の訓練サンプルに基づいて、データフィッティングモデルを用いて、初期化されたユーザーパラメータ行列Wm×k及び初期化されたタグパラメータ行列Hk×nを修正し、最終のユーザーパラメータ行列Wm×k及び最終のタグパラメータ行列Hk×nを得て、ただし、m(mは正の整数である)はユーザーの数を示し、k(kは正の整数である)は因子の数を示し、n(nは1よりも大きい整数である)はタグの数を示すことと、
前記最終のユーザーパラメータ行列Wm×k及び前記最終のタグパラメータ行列Hk×nに基づいて、u(uは1以上m以下の整数である)行目のt(tは1以上n以下の整数である)列目の要素Putがユーザーuのタグtに対する嗜好度を示すユーザー似顔絵行列Pm×nを取得することと、を含む方法が提供される。
本発明の実施例的第2の態様は、ユーザー似顔絵を取得する装置であって、
ユーザー行動ログに基づいて、訓練サンプル<u,i,j>がユーザーuの品物i及び品物jに対する嗜好度の差を反映するM(Mは正の整数である)個の訓練サンプルを取得するサンプル取得モジュールと、
前記M個の訓練サンプルに基づいて、データフィッティングモデルを用いて、初期化されたユーザーパラメータ行列Wm×k及び初期化されたタグパラメータ行列Hk×nを修正し、最終のユーザーパラメータ行列Wm×k及び最終のタグパラメータ行列Hk×nを得て、ただし、m(mは正の整数である)はユーザーの数を示し、k(kは正の整数である)は因子の数を示し、n(nは1よりも大きい整数である)はタグの数を示す行列修正モジュールと、
前記最終のユーザーパラメータ行列Wm×k及び前記最終のタグパラメータ行列Hk×nに基づいて、u(uは1以上m以下の整数である)行目のt(tは1以上n以下の整数である)列目の要素Putがユーザーuのタグtに対する嗜好度を示すユーザー似顔絵行列Pm×nを取得する画像取得モジュールと、を備える装置が提供される。
本発明の実施例的第3の態様は、ユーザー似顔絵を取得する装置であって、
1つ又は複数のプロセッサと、
前記1つ又は複数のプロセッサに接続されるメモリであって、前記1つ又は複数のプロセッサによって実行される1つ又は複数のプログラムが記憶されたメモリと、を備え、
前記1つ又は複数のプログラムは、
ユーザー行動ログに基づいて、訓練サンプル<u,i,j>がユーザーuの品物i及び品物jに対する嗜好度の差を反映するM(Mは正の整数である)個の訓練サンプルを取得する動作と、
前記M個の訓練サンプルに基づいて、データフィッティングモデルを用いて、初期化されたユーザーパラメータ行列Wm×k及び初期化されたタグパラメータ行列Hk×nを修正し、最終のユーザーパラメータ行列Wm×k及び最終のタグパラメータ行列Hk×nを得て、ただし、m(mは正の整数である)はユーザーの数を示し、k(kは正の整数である)は因子の数を示し、n(nは1よりも大きい整数である)はタグの数を示す動作と、
前記最終のユーザーパラメータ行列Wm×k及び前記最終のタグパラメータ行列Hk×nに基づいて、u(uは1以上m以下の整数である)行目のt(tは1以上n以下の整数である)列目の要素Putがユーザーuのタグtに対する嗜好度を示すユーザー似顔絵行列Pm×nを取得する動作と、を実行するための命令を含む装置が提供される。
本発明の実施例に提供される技術思想は、以下の有益な効果をもたらす。
ユーザー行動ログに基づいてM個の訓練サンプルを取得し、M個の訓練サンプルに基づいて、データフィッティングモデルを用いて、初期化されたユーザーパラメータ行列Wm×k及びタグパラメータ行列Hk×nを修正し、最終のユーザーパラメータ行列Wm×k及び最終のタグパラメータ行列Hk×nを得て、そして、最終のユーザーパラメータ行列Wm×k及び最終のタグパラメータ行列Hk×nに基づいて、ユーザー似顔絵行列Pm×nを取得することにより、関連技術に提供されるユーザー似顔絵を取得する方法では、所要時間や労働コストが高く、取得されたユーザー似顔絵の正確度が低い問題を解決する。ユーザー及びタグをパラメータ化するとともに、データフィッティングモデルを用いて、ユーザーパラメータ行列及びタグパラメータ行列を訓練サンプルにフィッティングするように修正することで、タグに対して対応するタグウェイトを人為的に設定する必要がなく、ユーザー行動ログに基づいて、データフィッティング方法によりユーザー似顔絵を自動的に取得し、時間や労働コストの節約を図り、ユーザー似顔絵を正確かつ高効率に取得する技術効果を達成する。
本発明の実施例の構成をより明りょうに説明するために、以下、実施例の説明に必要な図面を簡単に紹介する。以下に説明される図面は、本発明の実施例の一部に過ぎず、当業者であれば、創造的な労働なしにこれらの図面に基づいて他の図面を得ることもできるのは、明らかである。
本発明の一実施例に提供されるユーザー似顔絵を取得する方法のフローチャートである。 本発明の別の実施例に提供されるユーザー似顔絵を取得する方法のフローチャートである。 図2に示される実施例におけるステップ201のサブステップのフローチャートである。 本発明の一実施例に提供されるユーザー類似度行列を生成するフローチャートである。 本発明の一実施例に提供されるユーザー似顔絵を取得する装置の構成ブロック図である。 本発明の別の実施例に提供されるユーザー似顔絵を取得する装置の構成ブロック図である。 本発明の一実施例に提供されるサーバの構成を示す図である。
本発明の目的、技術案及び利点をより明りょうにするために、以下、図面を結合して本発明の実施形態をさらに詳しく説明する。
理解しやすくするために、まず、本文に言及される一部の名詞を紹介し説明する。
品物
品物は、物理的な品物及び仮想的な品物を含む。物理的な品物とは、リアルな品物を指し示し、事務、生活消費に関する品物であり、例えば、衣類、食料、事務用品などがある。仮想的な品物とは、実生活では触れることができない品物を指し示し、例えば、ビデオ、オーディオ、イメージ、アプリケーションソフトウェア、ミニブログのようなインターネット製品又はコンテンツ、或いは、仮想的なネットワーク世界から派生した品物、例えば、ゲーム小道具、メンバー、アイコンなどがある。
タグ
タグとは、品物の属性を記述するためのキーワードである。例えば、衣類のタグは、色、スタイル、サイズなどから記述するキーワードを含むことができる。また、例えば、ビデオのタグは、年別、国別、パターン、俳優などから記述するキーワードを含むことができる。また、例えば、ゲーム小道具のタグは、種別、機能、クラスなどから記述するキーワードを含むことができる。
ユーザーの行動パターン
ユーザーの行動パターンとは、ユーザーが品物に対して実行する行動である。例:閲覧、購入、お気に入り、削除、使用、リツイート、「いいね」ボタンを押す、「ヤダネ」ボタンを押す、コメントなど。異なる品物に対してユーザーが実行可能な行動は同じであってもよいし、異なってもよい。例えば、衣類の場合、ユーザーが該品物に対して実行可能な行動は、閲覧、購入、お気に入りなどを含むことができる。また、例えば、ビデオの場合、ユーザーが該品物に対して実行可能な行動は、閲覧、プレビュー、ウォッチ、購入、お気に入りなどを含むことができる。また、例えば、ミニブログの場合、ユーザーが該品物に対して実行可能な行動は、閲覧、リツイート、お気に入りなどを含むことができる。オプションとして、ユーザーの行動パターンは、ユーザーが品物に対して何らの行動も実行していないことを示す「未知」パターンをさらに含んでもよい。ユーザーの品物に対する行動パターンは、ユーザーの品物に対する嗜好度を反映し、ユーザーの2つの品物に対する行動パターンから、ユーザーの該2つの品物に対する嗜好度の差が分かる。
本発明の実施例を詳しく解釈し説明する前に、まず本発明の実施例の応用場面を紹介する。ユーザー似顔絵は、ユーザーを特徴付けるためのタグセットによって示されることができ、且つ該タグセットは、ユーザーの社会的属性、生活習慣、消費行動などからユーザーを特徴付けるタグを含むことができるため、ユーザー似顔絵は、ユーザーの特徴を示すことができる。ユーザーの特徴からユーザーの嗜好、習慣などを判定することができるため、ユーザー似顔絵を取得した後、ユーザー似顔絵を様々な応用場面に適用することができる。
例えば、1つの応用場面において、ユーザー似顔絵によってユーザーの嗜好を判定し、ユーザーに対して、例えば、衣類、食料、電子製品等の品物を推薦することができ、これにより、ユーザー別に異なる品物を推薦し、個人化された推薦を達成し、品物推薦の正確度を高める。また、例えば、もう1つの応用場面において、ユーザー似顔絵によって、ユーザーが電子製品等を使用する習慣を判定することができ、仮に、ユーザーが電子製品の安全性検査をどのくらいの頻度で行う必要があるか、電子製品でウェブページを閲覧した後、閲覧履歴をどのくらいの頻度で削除する必要があるか等を判定することができれば、ユーザーが手動で操作することなく、ユーザーの使用習慣にしたがってこれらの操作を自動的に実行し、ユーザーのロイヤリティを向上させる。
もちろん、実際の適用において、ユーザー似顔絵は他の応用場面にも適用され、本発明の実施例では、上記2つの応用場面を例として説明するが、ここでは他の応用場面を一々挙げない。
本発明の実施例に提供される方法では、各ステップの実行主体は、データ記憶及び計算能力を備える電子機器、例えば、サーバであることができる。下記方法実施例において、各ステップの実行主体としてサーバを例に説明するが、これに限られない。
図1を参照し、本発明の一実施例に提供されるユーザー似顔絵を取得する方法のフローチャートが示されている。該方法は以下のステップを含むことができる。
ステップ101:ユーザー行動ログに基づいてM個の訓練サンプルを取得する。訓練サンプル<u,i,j>は、ユーザーuの品物i及び品物jに対する嗜好度の差を反映し、Mは正の整数である。
ステップ102:M個の訓練サンプルに基づいて、データフィッティングモデルを用いて、初期化されたユーザーパラメータ行列Wm×k及び初期化されたタグパラメータ行列Hk×nを修正し、最終のユーザーパラメータ行列Wm×k及び最終のタグパラメータ行列Hk×nを得る。
ただし、mはユーザーの数を示し、kは因子の数を示し、nはタグの数を示し、mは正の整数であり、kは正の整数であり、nは1よりも大きい整数である。
ステップ103:最終のユーザーパラメータ行列Wm×k及び最終のタグパラメータ行列Hk×nに基づいて、ユーザー似顔絵行列Pm×nを取得する。
ただし、ユーザー似顔絵行列Pm×nのu行目のt列目の要素Putは、ユーザーuのタグtに対する嗜好度を示し、uは1以上m以下の整数であり、tは1以上n以下の整数である。
上述したように、本実施例に提供される方法では、ユーザー行動ログに基づいてM個の訓練サンプルを取得し、訓練サンプルに基づいて、データフィッティングモデルを用いて、初期化されたユーザーパラメータ行列Wm×k及びタグパラメータ行列Hk×nを修正し、最終のユーザーパラメータ行列Wm×k及び最終のタグパラメータ行列Hk×nを得て、そして、最終のユーザーパラメータ行列Wm×k及び最終のタグパラメータ行列Hk×nに基づいて、ユーザー似顔絵行列Pm×nを取得することにより、関連技術に提供されるユーザー似顔絵を取得する方法では、所要時間や労働コストが高く、取得されたユーザー似顔絵の正確度が低い問題を解決する。ユーザー及びタグをパラメータ化するとともに、データフィッティングモデルを用いて、ユーザーパラメータ行列及びタグパラメータ行列を訓練サンプルにフィッティングするように修正することで、タグに対して対応するタグウェイトを人為的に設定する必要がなく、ユーザー行動ログに基づいて、データフィッティング方法によりユーザー似顔絵を自動的に取得し、時間や労働コストの節約を図り、ユーザー似顔絵を正確かつ高効率に取得する技術効果を達成する。
図2を参照し、本発明の別の実施例に提供されるユーザー似顔絵を取得する方法のフローチャートが示されている。本実施例において、各ステップの実行主体としてサーバを例に説明する。該方法は以下のステップを含むことができる。
ステップ201:ユーザー行動ログに基づいてM個の訓練サンプルを取得する。
訓練サンプルは<u,i,j>で示されることができ、且つ訓練サンプル<u,i,j>は、ユーザーuの品物i及び品物jに対する嗜好度の差を反映し、Mは正の整数である。
ユーザー行動ログは、ユーザーの品物に対する操作行動を記録する。ユーザー行動ログには、ユーザー識別子、ユーザーの行動パターン、品物識別子及び品物タグ情報が含まれている。ユーザー識別子は、ユーザーの身元を識別するための識別子番号であり、ユーザーアカウントとも呼ばれ、あるシステムにおける相対的に唯一のコードである。ユーザーの行動パターンとは、ユーザーが品物に対して実行する行動であり、例えば閲覧、購入、お気に入り、削除、使用、リツイート、「いいね」ボタンを押す、「ヤダネ」ボタンを押す、コメント、未知等がある。ユーザーの行動パターンの種別は、実際の適用時のニーズに応じて設定されることができる。品物識別子は、品物を識別するための識別子番号であり、ユーザー識別子に類似して、各品物ごとに唯一の品物識別子が対応している。品物タグ情報は、品物属性を記述するためのキーワードであり、1つの品物は1つ又は複数のタグを含むことができる。ユーザー行動ログの取得方法は、サーバが端末におけるユーザー操作行動を収集するか、端末が自らユーザー操作行動をサーバに報告することであることができる。
訓練サンプル<u,i,j>は、ユーザーuの品物i及び品物jに対する嗜好度の差を反映する。考えられる1つの実施形態において、訓練サンプル<u,i,j>は、ユーザーuの品物iに対する嗜好度が品物jに対する嗜好度よりも大きいことを反映する。考えられる別の実施形態において、訓練サンプル<u,i,j>は、ユーザーuの品物iに対する嗜好度が品物jに対する嗜好度よりも小さいことを反映する。ユーザーの品物に対する行動パターンは、ユーザーの品物に対する嗜好度を反映し、ユーザーの2つの品物に対する行動パターンから、ユーザーの該2つの品物に対する嗜好度の差が分かる。
オプションとして、ユーザーが払った代償に基づいて、行動パターンのウェイトのルールを決定し、行動パターンのウェイトに応じて、すべての行動パターン間の相対的な大きさ関係を決定してもよい。例えば、「購入」行動パターンのウェイトが「閲覧」行動パターンのウェイトよりも大きい。ユーザーが品物に対して何らの行動も実行していなければ、ユーザーの行動パターンとして「未知」パターンを取得する。一般的には、ユーザーがある行動を実行したことがある品物に対する嗜好度は、何らの行動も実行していない品物に対する嗜好度よりも大きいため、「未知」行動パターンのウェイトが一番小さく、「閲覧」、「購入」等の行動パターンのウェイトよりも小さい。例えば、ユーザーuが品物iに対してある行動を実行したことがあるが、品物jに対して何らの行動も実行していなければ、ユーザーuの品物iに対する嗜好度が品物jに対する嗜好度よりも大きい。
例えば、訓練サンプル<u,i,j>は、ユーザーuの品物iに対する嗜好度が品物jに対する嗜好度よりも大きいことを例として、ユーザーuの品物iに対する嗜好度が品物jに対する嗜好度よりも大きければ、<u,i,j>の訓練サンプルを得る。逆の場合には、<u,j,i>の訓練サンプルを得る。例えば、ユーザーuが品物iを購入し、品物jを閲覧したとすれば、<u,i,j>の訓練サンプルを取得する。ユーザーが品物iを閲覧し、品物jを購入したとすれば、<u,j,i>の訓練サンプルを取得する。また、例えば、ユーザーが品物iを閲覧したが、品物jに対して何らの行動も実行していなければ、<u,i,j>の訓練サンプルを取得する。各ユーザーごとに1つ又は複数の訓練サンプルを取得することができ、ユーザー1が品物2を閲覧したが、品物1、品物3及び品物4に対して何らの行動も実行していなければ、<1,2,1>、<1,2,3>及び<1,2,4>を含む訓練サンプルを取得する。
考えられる1つの実施形態において、図3に示すように、ステップ201は以下のサブステップを含むことができる。
ステップ201a:ユーザー行動ログに基づいて、m人の個々のユーザーの、h個の品物のそれぞれに対する行動パターンを取得する。
ただし、mはユーザーの数を示し、hは品物の数を示し、mは正の整数であり、hは1よりも大きい整数である。
ステップ201b:個々のユーザーの各品物に対する行動パターンに基づいて、M個の訓練サンプルを取得する。
考えられる1つの実施形態として、ステップ201bは以下を含むことができる。
1、ユーザーの行動パターンに基づいてユーザー品物行列を取得する。
オプションとして、ユーザー品物行列はRm×hで示され、且つユーザー品物行列Rm×hの行はユーザーを示し、列は品物を示し、mはユーザーの数を示し、hは品物の数を示し、要素Ruiはユーザーuが品物iに対してある行動を実行したことがあるか否かを示すようにしてもよい。例示的には、ユーザー品物行列Rm×hにおける要素を0又は1で表す。1は、ユーザーが品物に対してある行動を実行したことがあることを表し、0は、ユーザーが品物に対して何らの行動も実行していないことを表す。例示的には、ユーザーの数が3であり、品物の数が4である場合、ユーザー品物行列Rm×hは、
Figure 2019503006
である。
1行目の2列目の1は、ユーザー1が品物2に対してある行動を実行したことを表す。
2、ユーザーの行動パターン及びユーザー品物行列に基づいて、M個の訓練サンプルを取得する。
ユーザー品物行列から、ユーザーが品物に対してある行動を実行したことがあるか否かを把握することができ、ユーザーuの場合、行動パターンに基づいて、ユーザーuの品物iに対する嗜好度が品物jに対する嗜好度よりも大きいか否かを決定することができ、これにより、1つの訓練サンプルを得る。例示的には、ユーザー品物行列R3×4の1行目から、ユーザー1が品物2に対してある行動を実行したが、ユーザー1が品物1、品物3及び品物4に対して何らの行動も実行していないことが示され、訓練サンプル<u,i,j>は、ユーザーuの品物iに対する嗜好度が品物jに対する嗜好度よりも大きいことを反映することを例とすれば、<1,2,1>、<1,2,3>及び<1,2,4>を含むユーザー1の訓練サンプルを取得する。
なお、一般的には、ユーザーの、ある行動を実行したことがある品物に対する嗜好度は、何らの行動も実行していない品物に対する嗜好度よりも大きい。しかし、他の考えられる場合には、ユーザーの、ある行動を実行したことがある品物に対する嗜好度は、何らの行動も実行していない品物に対する嗜好度よりも小さい可能性もある。品物としてビデオを例に、ユーザーは、ビデオAに対して「ヤダネ」ボタンを押すという行動を実行したが、ビデオBに対して何らの行動も実行していなければ、ユーザーのビデオAに対する嗜好度は、ビデオBに対する嗜好度よりも小さいと判定する。
また、ユーザーの数がmであり、品物の数がhであるため、理論上、
Figure 2019503006
個のサンプルを作ることができ、実際の操作時に、サンプリング方式により上記
Figure 2019503006
個のサンプルから一部の信頼性のあるサンプルを選んで訓練サンプルとする。例えば、ユーザーuは品物i及び品物jのいずれにも何らの行動も実行していなければ、或いは、ユーザーuが品物i及び品物jに対して実行した行動パターンが同じであれば、ユーザーuの品物i及び品物jに対する嗜好度の差を決定することができず、このようなサンプルを訓練サンプルとしない。また、例えば、品物毎の実行可能性を取得し、1つの品物の実行可能性とは、ユーザーが該品物に対して行動を実行する可能性である。実行可能性は、システム全体における品物の発生率、流行度、推薦度、表示順位等の要素に基づいて決定されることができる。例えば、システム全体における品物の発生率が大きければ大きいほど、ユーザーは該品物を容易に取得することができ、該品物の実行可能性が高いことが示唆される。逆に、システム全体における品物の発生率が小さければ小さいほど、ユーザーが該品物を取得することが困難であり、該品物の実行可能性が低いことが示唆される。訓練サンプルの取得時に、ユーザーuが行動を実行したことのある品物及びユーザーuが行動を実行していない品物をそれぞれ1つ選んで訓練サンプルを作ろうとすれば、ユーザーuが行動を実行していない品物から、実行可能性が高い品物を選んで、訓練サンプルを作る。上記方式により、取得された訓練サンプルは、ユーザーの2つの品物に対する嗜好度の差をより正確に反映することを確保することができ、訓練サンプルの誤りリスクを低減し、訓練サンプルの信頼度を向上させる。
ステップ202:初期化されたユーザーパラメータ行列Wm×k及び初期化されたタグパラメータ行列Hk×nを生成する。
ただし、mはユーザーの数を示し、kは因子の数を示し、nはタグの数を示し、mは正の整数であり、kは正の整数であり、nは1よりも大きい整数である。考えられる1つの実施形態において、正規分布する乱数を生成する方式により、初期化されたユーザーパラメータ行列Wm×k及び初期化されたタグパラメータ行列Hk×nを構築する。つまり、初期化されたユーザーパラメータ行列Wm×kにおける要素は正規分布する乱数であり、初期化されたタグパラメータ行列Hk×nにおける要素は正規分布する乱数である。
オプションとして、因子の数kは、予め設定された値であるか、大量の実験による経験値であってもよい。
オプションとして、正規分布する平均値を0に設定し、分散値を0.01に設定してもよい。
例示的には、ランダムに生成されたユーザーパラメータ行列Wm×k及びタグパラメータ行列Hk×nは以下のようなものである。
Figure 2019503006
ユーザーパラメータ行列Wm×kの各行が1つのユーザーの因子ベクトルに対応し、タグパラメータ行列Hk×nの各列が1つのタグの因子ベクトルに対応する。
以下、下記ステップ203乃至ステップ207によって、初期化されたユーザーパラメータ行列Wm×k及び初期化されたタグパラメータ行列Hk×nを修正する。まず、a=0とし、以下のステップ203を実行する。
ステップ203:a回目修正されたユーザーパラメータ行列Wm×k及びa回目修正されたタグパラメータ行列Hk×nに基づいて、m人の個々のユーザーの、n個のタグのそれぞれに対する嗜好度を算出する。
ただし、aは0以上の整数であり、0回目修正されたユーザーパラメータ行列Wm×kは初期化されたユーザーパラメータ行列Wm×kとなり、0回目修正されたタグパラメータ行列Hk×nは初期化されたタグパラメータ行列Hk×nとなる。
a=0の場合、初期化されたユーザーパラメータ行列Wm×k及び初期化されたタグパラメータ行列Hk×nに基づいて、m人の個々のユーザーの、n個のタグのそれぞれに対する嗜好度を算出する。
オプションとして、ユーザーuのタグtに対する嗜好度は以下のような計算式から求められてもよい。
Figure 2019503006

例えば、以上で例示した初期化されたユーザーパラメータ行列W及び初期化されたタグパラメータ行列Hにおいて、ユーザー1のタグ1に対する嗜好度は、
Figure 2019503006
であり、ユーザー3のタグ5に対する嗜好度は、
Figure 2019503006
である。
ステップ204:m人の個々のユーザーの、n個のタグのそれぞれに対する嗜好度及び品物タグ行列Ah×nに基づいて、m人の個々のユーザーの、h個の品物のそれぞれに対する嗜好度を算出する。
初期化されたユーザーパラメータ行列Wm×k及び初期化されたタグパラメータ行列Hk×nに基づいて、個々のユーザーの各タグに対する嗜好度を算出した後、品物タグ行列Ah×nを結合して、m人の個々のユーザーの、h個の品物のそれぞれに対する嗜好度を算出する。
品物タグ行列Ah×nは、ユーザー行動ログに付加される品物識別子及び品物タグによる行列である。
オプションとして、品物タグ行列Ah×nの行は品物を表し、列はタグを表してもよい。例示的には、品物タグ行列Ah×nにおける要素を0又は1で表す。0は、品物がタグによって記述される属性を有しないことを表し、1は、品物がタグによって記述される属性を有することを表す。品物の数は4であり、タグの数は5であるとすると、例示的には、品物タグ行列Ah×nは、
Figure 2019503006
である。
品物タグ行列
Figure 2019503006

は、品物タグ行列の1行目を表し、品物1がタグ1及びタグ2によって記述される属性を有するが、タグ3、タグ4及びタグ5によって記述される属性を有しないことが示唆される。
ユーザーがある品物を嗜好する場合は、大抵、該品物は、ユーザーが嗜好するタグ(つまり、タグによって記述される属性)を有するためであり、ユーザーが品物を嗜好することは、ユーザーの該品物が持つタグに対する嗜好度のまとめと理解されることができる。ユーザーuの品物iに対する嗜好度は、ユーザーuの品物iが持つタグに対する嗜好度から算出されることができる。
オプションとして、本発明の実施例では、ユーザーuの品物iが持つタグに対する嗜好度を合算することで、ユーザーuの品物iに対する嗜好度を算出し、計算式は
Figure 2019503006

であるようにしてもよい。
例えば、以上で例示した初始化されたユーザーパラメータ行列Wm×k、初始化されたタグパラメータ行列Hk×nにおいて、ユーザー1の品物1に対する嗜好度は
Figure 2019503006

であり、ユーザー3の品物2に対する嗜好度は
Figure 2019503006

である。
ステップ205:m人の個々のユーザーの、h個の品物のそれぞれに対する嗜好度に基づいて、各訓練サンプルに対応する確率を取得する。
ただし、訓練サンプル<u,i,j>に対応する確率とは、ユーザーuの品物iに対する嗜好度が品物jに対する嗜好度よりも大きい確率である。
オプションとして、ユーザーuの品物iに対する嗜好度が品物jに対する嗜好度よりも大きい確率を以下のように算出してもよい。
ステップ1:算出された個々のユーザーの各品物に対する嗜好度に基づいて、ユーザーuの品物iに対する嗜好度とユーザーuの品物jに対する嗜好度との差である
Figure 2019503006

を算出する。
ステップ2:ロジスティック関数
Figure 2019503006

から、ユーザーuの品物iに対する嗜好度が品物jに対する嗜好度よりも大きい確率である
Figure 2019503006

を算出する。
ステップ206:M個の訓練サンプルそれぞれに対応する確率をデータフィッティングモデルの入力パラメータとして、データフィッティングモデルの出力結果を算出する。
オプションとして、データフィッティングモデルはベイズ最尤推定法を用いて構築されたモデルであってもよく、具体的なデータフィッティングモデルは以下のようなものである。
Figure 2019503006

ただし、
Figure 2019503006
Figure 2019503006

及び
Figure 2019503006

は、オーバーフィッティングを防止するための正規化パラメータであり、
Figure 2019503006
Figure 2019503006

及び
Figure 2019503006

は正の実数であり、
Figure 2019503006

は行列の2ノルムを示し、
Figure 2019503006

はM個の訓練サンプルの集合を示し、訓練サンプル<u,i,j>に対応する確率は
Figure 2019503006

であり、
Figure 2019503006

Figure 2019503006

はロジスティック関数を示し、
Figure 2019503006

はユーザーuの関連ユーザーの集合を示し、Suvはユーザー類似度行列Sm×mのu行目のv列目の要素であり、Suvは、ユーザーuとユーザーv間の類似度を示し、
Figure 2019503006

は前記a回目修正されたユーザーパラメータ行列Wm×kのu行目に対応する行ベクトルを示し、
Figure 2019503006

は前記a回目修正されたユーザーパラメータ行列Wm×kのv行目に対応する行ベクトルを示す。
Figure 2019503006

はユーザーuの関連ユーザーの集合を示し、つまり、ユーザーuと関連付けられている他のユーザーの集合を示す。関連付けは友人関係であることができ、例えば、あるユーザーvとユーザーuとがソーシャルアプリケーションでの友人であれば、ユーザーuとユーザーvとは友人関係を有し、ユーザーuとユーザーvとが互いに関連ユーザーである。或いは、関連付けは非友人関係であってもよく、例えば、あるユーザーvとユーザーuとがソーシャルアプリケーションでの同じグループに属すれば、ユーザーuとユーザーvとが互いに関連ユーザーである。なお、ユーザー類似度行列Sm×mを構築する際に、ユーザー類似度行列Sm×mにおける任意の2人のユーザーは、友人関係を有するユーザーであってもよいし、友人関係を確立していないユーザー(例えば、同じグループに属し、さらには、お互いを知らない見知らぬユーザー)であってもよい。
Figure 2019503006

となるように1行ずつ正規化してもよい。
ステップ207:出力結果が予め設定された条件を満たしていなければ、a回目修正されたユーザーパラメータ行列Wm×kを修正してa+1回目修正されたユーザーパラメータ行列Wm×kを得るとともに、a回目修正されたタグパラメータ行列Hk×nを修正してa+1回目修正されたタグパラメータ行列Hk×nを得て、a=a+1とし、上記ステップ203乃至ステップ206に戻ってこれらのステップを実行する。
予め設定された条件は、今回の出力結果と前回の出力結果との差が所定の閾値未満であること、及び/又は、ユーザーパラメータ行列及びタグパラメータ行列の修正回数が所定の回数に達していることを含む。所定の閾値及び所定の回数は、修正精度及び修正効率を包括して測定した後に設定される。
オプションとして、a回目修正されたユーザーパラメータ行列Wm×kに基づいて、下記式によりa+1回目修正されたユーザーパラメータ行列Wm×kを算出してもよい。
Figure 2019503006
ただし、
Figure 2019503006

は、a+1回目修正されたユーザーパラメータ行列Wm×kのu行目に対応する行ベクトルを示し、
Figure 2019503006
は、a回目修正されたユーザーパラメータ行列Wm×kのu行目に対応する行ベクトルを示し、
Figure 2019503006
は、a回目修正されたタグパラメータ行列Hk×n
Figure 2019503006
列目に対応する列ベクトルの転置ベクトルを示し、
Figure 2019503006
は1以上n以下の整数であり、
Figure 2019503006
は学習効率であり、
Figure 2019503006
は正の実数である。
Figure 2019503006
は予め設定された経験値であり、
Figure 2019503006
は、修正速度及び修正精度を包括して測定した後に設定されることができる。
オプションとして、a回目修正されたタグパラメータ行列Hk×nに基づいて、下記式によりa+1回目修正されたタグパラメータ行列Hk×nを算出してもよい。
Figure 2019503006

ただし、
Figure 2019503006

は、a+1回目修正されたタグパラメータ行列Hk×nのf行目に対応する行ベクトルを示し、
Figure 2019503006
は、a回目修正されたタグパラメータ行列Hk×nのf行目に対応する行ベクトルを示し、fは1以上k以下の整数であり、
Figure 2019503006
は学習効率であり、
Figure 2019503006
は正の実数である。
Figure 2019503006
は予め設定された経験値であり、
Figure 2019503006
は、修正速度及び修正精度を包括して測定した後に設定されることができる。
修正するたびに、M個の訓練サンプルのそれぞれに対応する
Figure 2019503006
を1つずつ上記式に順に代入し、ユーザーパラメータ行列及びタグパラメータ行列に対してM回にわたる修正を実行する。
つまり、ユーザーパラメータ行列及びタグパラメータ行列に対してa回目の修正を実行する中、x=1とし、x個目の訓練サンプルに対応する
Figure 2019503006
、x−1回目修正されたユーザーパラメータ行列及びx−1回目修正されたタグパラメータ行列を上記ユーザーパラメータ行列の修正式に代入して、x回目修正されたユーザーパラメータ行列を得る。x個目の訓練サンプルに対応する
Figure 2019503006
、x−1回目修正されたタグパラメータ行列及びx回目修正されたユーザーパラメータ行列を上記タグパラメータ行列の修正式に代入して、x回目修正されたタグパラメータ行列を得る。x=x+1とし、xがMよりも大きいか否かを検出する。NOであれば、x個目の訓練サンプルに対応する
Figure 2019503006
、x−1回目修正されたユーザーパラメータ行列及びx−1回目修正されたタグパラメータ行列を上記ユーザーパラメータ行列の修正式に代入して、x回目修正されたユーザーパラメータ行列を得るステップから再実行する。YESであれば、そのフローが終了し、a回目の修正が完了する。0回目修正されたユーザーパラメータ行列は、a−1回目修正されたユーザーパラメータ行列であり、0回目修正されたユーザーパラメータ行列は、初期化されたユーザーパラメータ行列となり、a回目の修正過程に得られるM回目修正されたユーザーパラメータ行列は、a回目修正されたユーザーパラメータ行列である。0回目修正されたタグパラメータ行列は、a−1回目修正されたタグパラメータ行列であり、0回目修正されたタグパラメータ行列は、初期化されたタグパラメータ行列となり、a回目の修正過程に得られるM回目修正されたタグパラメータ行列は、a回目修正されたタグパラメータ行列である。
ステップ208:出力結果が予め設定された条件を満たしていれば、a回目修正されたユーザーパラメータ行列Wm×k及びa回目修正されたタグパラメータ行列Hk×nをそれぞれ、最終のユーザーパラメータ行列Wm×k及び最終のタグパラメータ行列Hk×nとして決定する。
データフィッティングモデルの出力結果が予め設定された条件を満たす場合、ユーザーパラメータ行列Wm×k及びタグパラメータ行列Hk×nの修正を停止し、現在のユーザーパラメータ行列Wm×kを最終のユーザーパラメータ行列Wm×kとして決定し、現在のタグパラメータ行列Hk×nを最終のタグパラメータ行列Hk×nとして決定する。
ステップ209:最終のユーザーパラメータ行列Wm×k及び最終のタグパラメータ行列Hk×nに基づいて、ユーザー似顔絵行列Pm×nを取得する。
ただし、ユーザー似顔絵行列Pm×nのu行目のt列目の要素Putは、ユーザーuのタグtに対する嗜好度を示し、uは1以上m以下の整数であり、tは1以上n以下の整数である。
ユーザーパラメータ行列及びタグパラメータ行列を繰り返して修正した後、最終のユーザーパラメータ行列及び最終のタグパラメータ行列を得て、最終のユーザーパラメータ行列及び最終のタグパラメータ行列に基づいて、ユーザーのタグに対する嗜好度を出力する。
例示的には、仮にフィッティング訓練サンプルから得られる最終のユーザーパラメータ行列及び最終のタグパラメータ行列はそれぞれ
Figure 2019503006

であり、m=3、k=2、n=5であるとすれば、ユーザー似顔絵行列を算出すると、
Figure 2019503006

になる。
オプションとして、本実施例に提供される方法は、以下のステップ210をさらに含んでもよい。
ステップ210:取得されたユーザー似顔絵行列Pm×n及びターゲット品物が持つタグに基づいて、ユーザーuのターゲット品物に対する嗜好度を算出する。
オプションとして、ユーザーuのターゲット品物が持つ各タグに対する嗜好度を合算して、ユーザーuのターゲット品物に対する嗜好度を算出してもよい。
上述したように、本実施例に提供される方法では、ユーザー行動ログに基づいてM個の訓練サンプルを取得し、M個の訓練サンプルに基づいて、データフィッティングモデルを用いて、初期化されたユーザーパラメータ行列Wm×k及びタグパラメータ行列Hk×nを修正し、最終のユーザーパラメータ行列Wm×k及び最終のタグパラメータ行列Hk×nを得て、そして、最終のユーザーパラメータ行列Wm×k及び最終のタグパラメータ行列Hk×nに基づいて、ユーザー似顔絵行列Pm×nを取得することにより、関連技術に提供されるユーザー似顔絵を取得する方法では、所要時間や労働コストが高く、取得されたユーザー似顔絵の正確度が低い問題を解決する。ユーザー及びタグをパラメータ化するとともに、データフィッティングモデルを用いて、ユーザーパラメータ行列及びタグパラメータ行列を訓練サンプルにフィッティングするように修正することで、タグに対して対応するタグウェイトを人為的に設定する必要がなく、ユーザー行動ログに基づいて、データフィッティング方法によりユーザー似顔絵を自動的に取得し、時間や労働コストの節約を図り、ユーザー似顔絵を正確かつ高効率に取得する技術効果を達成する。
また、機械学習方式によりユーザーパラメータ行列及びタグパラメータ行列を訓練サンプルにフィッティングするように修正し、さらにユーザー似顔絵を自動的に取得し、より正確であり、高効率である。
また、似た者同士が集まる法則に基づいて、2人のユーザーは、類似度が高ければ高いほど、そのユーザー嗜好度も近づくはずであり、単にユーザー行動ログのみに基づいてユーザー似顔絵を取得するのではなく、データフィッティングモデルにユーザー類似度行列を制約条件として追加するとともに、ユーザーパラメータ行列の修正時にユーザー類似度行列をも考慮に入れることで、ユーザーパラメータベクトルとその関連ユーザーのユーザーパラメータベクトルとの間の強い相関性が示され、ユーザー似顔絵をより正確に取得する。
オプションとして、図4に示すように、以下のステップによってユーザー類似度行列Sm×mを取得してもよい。
ステップ401:m人の個々のユーザーのソーシャルネットワーク情報を取得する。
ソーシャルネットワーク情報には、ユーザー識別子、ユーザーの関連ユーザーリスト、ユーザーと関連ユーザー間の類似度が含まれている。
ユーザー識別子は、ユーザーの身元を識別するための識別子番号であり、ユーザーアカウントとも呼ばれ、あるシステムにおける相対的に唯一のコードである。ユーザーの関連ユーザーリストには、ユーザーの各関連ユーザー、即ち、ユーザーと関連付けられた他のユーザーが含まれている。ユーザーと関連ユーザー間の類似度とは、ユーザーと関連ユーザー間の相関性を意味する。ユーザーと関連ユーザー間の類似度は、ユーザーと関連ユーザー間のコミュニケーション頻度、ユーザーと関連ユーザーとが友人関係であるか、ユーザーと関連ユーザーとが同じソーシャルサークルを持っているか、ユーザーと関連ユーザーとが同じ人口属性を有するか、ユーザーと関連ユーザーとが同じ嗜好を有するか、等のうちの1つ又は複数のパラメータに基づいて決定されることができる。
ステップ402:m人のユーザーのソーシャルネットワーク情報に基づいて、ユーザー類似度行列Sm×mを生成する。
m人のユーザーのソーシャルネットワーク情報に基づいて、2人のユーザー毎の類似度を取得し、ユーザー類似度行列Sm×mを生成する。ユーザー類似度行列Sm×mの行及び列はそれぞれユーザーを示し、例えば、ユーザー類似度行列Sm×mの2行目の3列目はユーザー2とユーザー3間の類似度を示す。
例示的には、ユーザーの数が3である場合、ユーザー類似度行列Sm×mは、
Figure 2019503006

である。
1行目の0.6はユーザー1とユーザー2間の類似度を示し、0.4はユーザー1とユーザー3間の類似度を示す。ユーザー類似度行列Sm×mの生成時に、ユーザーと関連ユーザー間の類似度のみを考え、ユーザーとそれ自体の類似度を考えないため、ユーザー類似度行列Sm×mの対角要素Suuを0に設定する。
上述したように、ユーザー類似度行列を導入して、データフィッティングモデルの制約条件とすると同時に、ユーザーパラメータ行列を修正する1つのパラメータとし、最終的に取得されたユーザー似顔絵の正確度をさらに向上させる。また、上記実施例において、ユーザーパラメータベクトルとその関連ユーザーのユーザーパラメータベクトル間の強い相関性を示すように、ユーザー間の類似度のみを制約条件としてデータフィッティングモデルに組み込む。他の考えられる実施例において、必要に応じて、他のデータを制約条件としてデータフィッティングモデルに組み込んでもよい。例えば、タグ間の類似度を制約条件としてデータフィッティングモデルに組み込み、タグ類似度行列を構築し、タグ類似度行列の行及び列はそれぞれタグを示し、各要素は対応する行及び列に示される2つのタグ間の類似度を示し、タグ間の類似度はタグの示す意味の類似性によって決められることができ、例えば、2つのタグは意味が近づければ近づくほど、類似度が高く、これにより、タグパラメータベクトルとそれに類似するタグのタグパラメータベクトル間の強い相関性が示される。従って、上記データフィッティングモデルは、相対的に一般的な、ユーザーパラメータベクトル及びタグパラメータベクトルを自動的に学習することで、ユーザーのタグに対する嗜好度を取得するフレームワークであり、必要に応じて、他のデータを該モデルに追加してもよい。
図5を参照し、本発明の一実施例に提供されるユーザー似顔絵を取得する装置の構成ブロック図が示される。該装置は、ソフトウェア、ハーウェア又はそれらの組み合わせによりサーバの一部又は全部として実現されることができる。該装置は、サンプル取得モジュール520と、行列修正モジュール540と、似顔絵取得モジュール560とを備えることができる。
サンプル取得モジュール520は、ユーザー行動ログに基づいてM個の訓練サンプルを取得する。訓練サンプル<u,i,j>は、ユーザーuの品物i及び品物jに対する嗜好度の差を反映し、Mは正の整数である。
行列修正モジュール540は、サンプル取得モジュール520で取得された訓練サンプルに基づいて、データフィッティングモデルを用いて、初期化されたユーザーパラメータ行列Wm×k及び初期化されたタグパラメータ行列Hk×nを修正し、最終のユーザーパラメータ行列Wm×k及び最終のタグパラメータ行列Hk×nを得る。ただし、mはユーザーの数を示し、kは因子の数を示し、nはタグの数を示し、mは正の整数であり、kは正の整数であり、nは1よりも大きい整数である。
似顔絵取得モジュール560は、行列修正モジュール540で得られた最終のユーザーパラメータ行列Wm×k及び最終のタグパラメータ行列Hk×nに基づいて、ユーザー似顔絵行列Pm×nを取得する。ユーザー似顔絵行列Pm×nのu行目のt列目の要素Putは、ユーザーuのタグtに対する嗜好度を示し、uは1以上m以下の整数であり、tは1以上n以下の整数である。
上述したように、本実施例に提供される装置では、ユーザー行動ログに基づいてM個の訓練サンプルを取得し、訓練サンプルに基づいて、データフィッティングモデルを用いて、初期化されたユーザーパラメータ行列Wm×k及びタグパラメータ行列Hk×nを修正し、最終のユーザーパラメータ行列Wm×k及び最終のタグパラメータ行列Hk×nを得て、そして、最終のユーザーパラメータ行列Wm×k及び最終のタグパラメータ行列Hk×nに基づいて、ユーザー似顔絵行列Pm×nを取得することにより、関連技術に提供されるユーザー似顔絵を取得する方法では、所要時間や労働コストが高く、取得されたユーザー似顔絵の正確度が低い問題を解決する。ユーザー及びタグをパラメータ化するとともに、データフィッティングモデルを用いて、ユーザーパラメータ行列及びタグパラメータ行列を訓練サンプルにフィッティングするように修正し、タグに対して対応するタグウェイトを人為的に設定する必要がなく、ユーザー行動ログに基づいて、データフィッティング方法によりユーザー似顔絵を自動的に取得し、時間や労働コストの節約を図り、ユーザー似顔絵を正確かつ高効率に取得する技術効果を達成する。
図6を参照し、本発明の別の実施例に提供されるユーザー似顔絵を取得する装置の構成ブロック図が示される。該装置は、ソフトウェア、ハーウェア又はそれらの組み合わせによりサーバの一部又は全部として実現されることができる。該装置は、サンプル取得モジュール610と、行列修正モジュール650と、似顔絵取得モジュール660とを備えることができる。
サンプル取得モジュール610は、ユーザー行動ログに基づいてM個の訓練サンプルを取得する。訓練サンプル<u,i,j>は、ユーザーuの品物i及び品物jに対する嗜好度の差を反映し、Mは正の整数である。
考えられる1つの実施形態において、サンプル取得モジュール610は、行動取得ユニット611とサンプル取得ユニット612とを含む。
行動取得ユニット611は、ユーザー行動ログに基づいて、m人の個々のユーザーの、h個の品物のそれぞれに対する行動パターンを取得し、hは1よりも大きい整数である。
サンプル取得ユニット612は、行動取得ユニット611で取得された個々のユーザーの各品物に対する行動パターンに基づいて、M個の訓練サンプルを取得する。
オプションとして、該装置は、第2の生成モジュール620をさらに備えてもよい。
第2の生成モジュール620は、初期化されたユーザーパラメータ行列Wm×k及び初期化されたタグパラメータ行列Hk×nを生成する。初期化されたユーザーパラメータ行列Wm×kにおける要素は正規分布する乱数であり、初期化されたタグパラメータ行列Hk×nにおける要素は正規分布する乱数である。
オプションとして、該装置は、情報取得モジュール630と第1の生成モジュール640とをさらに備えてもよい。
情報取得モジュール630は、m人の個々のユーザーのソーシャルネットワーク情報を取得する。
第1の生成モジュール640は、情報取得モジュール630で取得されたm人のユーザーのソーシャルネットワーク情報に基づいて、ユーザー類似度行列Sm×mを生成する。
行列修正モジュール650は、サンプル取得モジュール610で取得された訓練サンプルに基づいて、データフィッティングモデルを用いて、第2の生成モジュール620で生成された初期化されたユーザーパラメータ行列Wm×k及び初期化されたタグパラメータ行列Hk×nを修正し、最終のユーザーパラメータ行列Wm×k及び最終のタグパラメータ行列Hk×nを得る。ただし、mはユーザーの数を示し、kは因子の数を示し、nはタグの数を示し、mは正の整数であり、kは正の整数であり、nは1よりも大きい整数である。
考えられる1つの実施形態において、行列修正モジュール650は、第1の算出ユニット651と、第2の算出ユニット652と、確率取得ユニット653と、第3の算出ユニット654と、行列決定ユニット655と、行列修正ユニット656とを含む。
第1の算出ユニット651は、a=0とし、a回目修正されたユーザーパラメータ行列Wm×k及びa回目修正されたタグパラメータ行列Hk×nに基づいて、m人の個々のユーザーの、n個のタグのそれぞれに対する嗜好度を算出する。ただし、aは0以上の整数であり、0回目修正されたユーザーパラメータ行列Wm×kは初期化されたユーザーパラメータ行列Wm×kとなり、0回目修正されたタグパラメータ行列Hk×nは初期化されたタグパラメータ行列Hk×nとなる。
第2の算出ユニット652は、m人の個々のユーザーの、n個のタグのそれぞれに対する嗜好度及び品物タグ行列Ah×nに基づいて、m人の個々のユーザーの、h個の品物のそれぞれに対する嗜好度を算出する。ただし、hは品物の数を示し、hは1よりも大きい整数である。
確率取得ユニット653は、m人の個々のユーザーの、h個の品物のそれぞれに対する嗜好度に基づいて、M個の訓練サンプルのそれぞれに対応する確率を取得する。訓練サンプル<u,i,j>に対応する確率とは、ユーザーuの品物iに対する嗜好度が品物jに対する嗜好度よりも大きい確率である。
第3の算出ユニット654は、M個の訓練サンプルそれぞれに対応する確率をデータフィッティングモデルの入力パラメータとして、データフィッティングモデルの出力結果を算出する。
オプションとして、データフィッティングモデルは、
Figure 2019503006

であってもよい。
ただし、
Figure 2019503006

Figure 2019503006

及び
Figure 2019503006

は、オーバーフィッティングを防止するための正規化パラメータであり、
Figure 2019503006

Figure 2019503006

及び
Figure 2019503006

は正の実数であり、
Figure 2019503006

は行列の2ノルムを示し、
Figure 2019503006

はM個の訓練サンプルの集合を示し、訓練サンプル<u,i,j>に対応する確率は
Figure 2019503006

であり、
Figure 2019503006

Figure 2019503006

はロジスティック関数を示し、
Figure 2019503006

はユーザーuの関連ユーザーの集合を示し、Suvはユーザー類似度行列Sm×mのu行目のv列目の要素であり、Suvはユーザーuとユーザーv間の類似度を示し、
Figure 2019503006

は前記a回目修正されたユーザーパラメータ行列Wm×kのu行目に対応する行ベクトルを示し、
Figure 2019503006

は前記a回目修正されたユーザーパラメータ行列Wm×kのv行目に対応する行ベクトルを示す。
行列決定ユニット655は、出力結果が予め設定された条件を満たしていれば、a回目修正されたユーザーパラメータ行列Wm×k及びa回目修正されたタグパラメータ行列Hk×nをそれぞれ、最終のユーザーパラメータ行列Wm×k及び最終のタグパラメータ行列Hk×nとして決定する。
行列修正ユニット656は、出力結果が予め設定された条件を満たしていなければ、a回目修正されたユーザーパラメータ行列Wm×kを修正してa+1回目修正されたユーザーパラメータ行列Wm×kを得るとともに、a回目修正されたタグパラメータ行列Hk×nを修正してa+1回目修正されたタグパラメータ行列Hk×nを得て、a=a+1とし、a回目修正されたユーザーパラメータ行列Wm×k及びa回目修正されたタグパラメータ行列Hk×nに基づいて、m人の個々のユーザーの、n個のタグのそれぞれに対する嗜好度を算出するステップから再実行する。
考えられる1つの実施形態において、行列修正ユニット656は、具体的には、下記式によりa+1回目修正されたユーザーパラメータ行列Wm×kを算出する。
Figure 2019503006
ただし、
Figure 2019503006

は、a+1回目修正されたユーザーパラメータ行列Wm×kのu行目に対応する行ベクトルを示し、
Figure 2019503006

は、a回目修正されたユーザーパラメータ行列Wm×kのu行目に対応する行ベクトルを示し、
Figure 2019503006

は、a回目修正されたタグパラメータ行列Hk×n
Figure 2019503006

列目に対応する列ベクトルの転置ベクトルを示し、
Figure 2019503006


は1以上n以下の整数であり、
Figure 2019503006

は学習効率であり、
Figure 2019503006

は正の実数である。
考えられる1つの実施形態において、行列修正ユニット656は、具体的には、下記式によりa+1回目修正されたタグパラメータ行列Hk×nを算出する。
Figure 2019503006
ただし、
Figure 2019503006

は、a+1回目修正されたタグパラメータ行列Hk×nのf行目に対応する行ベクトルを示し、
Figure 2019503006

はa回目修正されたタグパラメータ行列Hk×nのf行目に対応する行ベクトルを示し、fは1以上k以下の整数であり、
Figure 2019503006

は学習効率であり、
Figure 2019503006

は正の実数である。
似顔絵取得モジュール660は、行列修正モジュール650で得られた最終のユーザーパラメータ行列Wm×k及び最終のタグパラメータ行列Hk×nに基づいて、ユーザー似顔絵行列Pm×nを取得する。ユーザー似顔絵行列Pm×nのu行目のt列目の要素Putは、ユーザーuのタグtに対する嗜好度を示し、uは1以上m以下の整数であり、tは1以上n以下の整数である。
オプションとして、該装置は、嗜好度算出モジュール670をさらに備えてもよい。
嗜好度算出モジュール670は、似顔絵取得モジュール660で取得されたユーザー似顔絵行列Pm×n及びターゲット品物が持つタグに基づいて、ユーザーuのターゲット品物に対する嗜好度を算出する。
上述したように、本実施例に提供される装置では、ユーザー行動ログに基づいてM個の訓練サンプルを取得し、訓練サンプルに基づいて、データフィッティングモデルを用いて、初期化されたユーザーパラメータ行列Wm×k及びタグパラメータ行列Hk×nを修正し、最終のユーザーパラメータ行列Wm×k及び最終のタグパラメータ行列Hk×nを得て、そして、最終のユーザーパラメータ行列Wm×k及び最終のタグパラメータ行列Hk×nに基づいて、ユーザー似顔絵行列Pm×nを取得することにより、関連技術に提供されるユーザー似顔絵を取得する方法では、所要時間や労働コストが高く、取得されたユーザー似顔絵の正確度が低い問題を解決する。ユーザー及びタグをパラメータ化するとともに、データフィッティングモデルを用いて、ユーザーパラメータ行列及びタグパラメータ行列を訓練サンプルにフィッティングするように修正することで、タグに対して対応するタグウェイトを人為的に設定する必要がなく、ユーザー行動ログに基づいて、データフィッティング方法によりユーザー似顔絵を自動的に取得し、時間や労働コストの節約を図り、ユーザー似顔絵を正確かつ高効率に取得する技術効果を達成する。
また、機械学習方式によりユーザーパラメータ行列及びタグパラメータ行列を訓練サンプルにフィッティングするように修正し、さらにユーザー似顔絵を自動的に取得し、より正確であり、高効率である。
また、似た者同士が集まる法則に基づいて、2人のユーザーは、類似度が高ければ高いほど、そのユーザー嗜好度も近づくはずであり、単にユーザー行動ログのみに基づいてユーザー似顔絵を取得するのではなく、データフィッティングモデルにユーザー類似度行列を制約条件として追加するとともに、ユーザーパラメータ行列の修正時にユーザー類似度行列をも考慮に入れることで、ユーザーパラメータベクトルとその関連ユーザーのユーザーパラメータベクトルとの間の強い相関性が示され、ユーザー似顔絵をより正確に取得する。
なお、上記実施例に提供される装置は、その機能を実現する際に、上記各機能モジュールに分割されることのみを例として説明したが、実際の適用において、必要に応じて、上記機能を異なる機能モジュールに完成させてもよく、つまり、以上で説明する機能の全部又は一部を完成するように、機器の内部構成を異なる機能モジュールに分割する。また、上記実施例に提供されるユーザー似顔絵を取得する装置は、ユーザー似顔絵を取得する方法実施例と同一の発想であり、その具体的な実現過程について方法実施例を詳しく参照するが、ここではその詳細を省略する。
図7を参照し、本発明の一実施例に提供されるサーバの構成を示す図が示されている。該サーバは、上記実施例に提供されるユーザー似顔絵を取得する方法を実施する。具体的には、
前記サーバ700は、中央処理装置(CPU)701と、ランダムアクセスメモリ(RAM)702及びリードオンリーメモリ(ROM)703を含むシステムメモリ704と、システムメモリ704と中央処理装置701とを接続するシステムバス705と、を備える。前記サーバ700は、コンピュータ内の各素子間での情報伝送を支援する基本入出力システム(I/Oシステム)706と、操作システム713、アプリケーションプログラム714及び他のプログラムモジュール715を記憶するための大容量記憶装置707とをさらに備える。
前記基本入出力システム706は、情報を表示するための表示装置708と、ユーザーが情報を入力するための、マウス、キーボードのような入力装置709とを備える。前記表示装置708及び入力装置709は、それぞれ、システムバス705に接続される入出力コントローラ710を介して中央処理装置701に接続される。前記基本入出力システム706は、キーボード、マウス、又は電子スタイラス等、複数の他のデバイスからの入力を受信し処理するための入出力コントローラ710をさらに備えてもよい。これに類似して、入出力コントローラ710は、ディスプレイ、プリンタ又は他のタイプの出力デバイスへの出力をさらに提供する。
前記大容量記憶装置707は、システムバス705に接続される大容量記憶コントローラ(未図示)を介して中央処理装置701に接続される。前記大容量記憶装置707及びその関連するコンピュータ読取可能な媒体は、サーバ700に不揮発性記憶を提供する。つまり、前記大容量記憶装置707は、ハードディスク又はCD−ROMドライバのようなコンピュータ読取可能な媒体(未図示)を備えてもよい。
一般性を失うことなく、前記コンピュータ読取可能な媒体は、コンピュータ記憶媒体及び通信媒体を備えることができる。コンピュータ記憶媒体は、コンピュータ読取可能な命令、データ構成、プログラムモジュール又は他のデータのような情報を記憶する如何なる方法又は技術で実現される揮発性及び不揮発性、リムーバブル及びノンリムーバブルメディアを含む。コンピュータ記憶媒体は、RAM、ROM、EPROM、EEPROM、フラッシュメモリ又は他のソリッドステート記憶技術、CD−ROM、DVD又は他の光学記憶、テープカセット、テープ、磁気ディスク記憶又は他の磁気記憶装置を含む。もちろん、前記コンピュータ記憶媒体は上述したいくつかに限られないのは、当業者が分かっている。上述したシステムメモリ704及び大容量記憶装置707はメモリと総称されることができる。
本発明の様々な実施例によれば、前記サーバ700は、インターネットのようなネットワークを介してネットワーク上のリモートコンピュータに接続されて実行されてもよい。つまり、サーバ700は、前記システムバス705に接続されるネットワークインターフェースユニット711を介してネットワーク712に接続されるか、ネットワークインターフェースユニット711を用いて他のタイプのネットワーク又はリモートコンピュータシステム(未図示)に接続されてもよい。
前記メモリは、1つ又は1つ以上のプログラムをさらに備え、前記1つ又は1つ以上のプログラムはメモリに記憶され、且つ、1つ又は1つ以上のプロセッサによって実行されるように構成される。上記1つ又は1つ以上のプログラムは、上記方法を実行するための命令を含む。
例示的な実施例において、命令を含む一時的でないコンピュータ読取可能な記憶媒体、例えば、命令を含むメモリがさらに提供され、上記命令は、サーバのプロセッサによって実行されて上記ユーザー似顔絵を取得する方法を完成する。例えば、前記一時的でないコンピュータ読取可能な記憶媒体は、ROM、ランダムアクセスメモリ(RAM)、CD−ROM、テープ、ソフトディスク及び光データ記憶装置等であることができる。
本文に言及された「複数」とは、2つ又は2つ以上を意味することは、理解されるべきである。「及び/又は」は、関連対象の関連付けを記述し、3つの関係が可能であることを表し、例えば、A及び/又はBは、Aが単独に存在するか、A及びBが同時に存在するか、Bが同時に存在するという3つの場合を表すことができる。キャラクタ「/」は、一般的には、関連付けられている対象が「又は」の関係にあることを表す。
上記本発明の実施例の番号は説明のためのものに過ぎず、実施例の優劣を示すものではない。
上記実施例のステップの全部又は一部は、ハードウェアによって完成されることができれば、プログラムによって関連するハードウェアに完成させることもでき、前記プログラムはコンピュータ読取可能な記憶媒体に記憶されることができ、上述した記憶媒体はリードオンリーメモリ、磁気ディスク又は光ディスク等であることができるのは、当業者が理解されることができる。
以上は、本発明の好適な実施例に過ぎず、本発明を限定することは意図していない。本発明の思想や原則内の如何なる修正、均等の置き換え、改良などは、本発明の保護範囲内に含まれるべきである。
図7を参照し、本発明の一実施例に提供されるサーバの構成を示す図が示されている。該サーバは、上記実施例に提供されるユーザー似顔絵を取得する方法を実施する。
具体的には、前記サーバ700は、中央処理装置(CPU)701と、ランダムアクセスメモリ(RAM)702及びリードオンリーメモリ(ROM)703を含むシステムメモリ704と、システムメモリ704と中央処理装置701とを接続するシステムバス705と、を備える。前記サーバ700は、コンピュータ内の各素子間での情報伝送を支援する基本入出力システム(I/Oシステム)706と、操作システム713、アプリケーションプログラム714及び他のプログラムモジュール715を記憶するための大容量記憶装置707とをさらに備える。

Claims (27)

  1. ユーザー似顔絵を取得する方法であって、
    ユーザー行動ログに基づいて、訓練サンプル<u,i,j>がユーザーuの品物i及び品物jに対する嗜好度の差を反映するM(Mは正の整数である)個の訓練サンプルを取得することと、
    前記M個の訓練サンプルに基づいて、データフィッティングモデルを用いて、初期化されたユーザーパラメータ行列Wm×k及び初期化されたタグパラメータ行列Hk×nを修正し、最終のユーザーパラメータ行列Wm×k及び最終のタグパラメータ行列Hk×nを得て、ただし、m(mは正の整数である)はユーザーの数を示し、k(kは正の整数である)は因子の数を示し、n(nは1よりも大きい整数である)はタグの数を示すことと、
    前記最終のユーザーパラメータ行列Wm×k及び前記最終のタグパラメータ行列Hk×nに基づいて、u(uは1以上m以下の整数である)行目のt(tは1以上n以下の整数である)列目の要素Putがユーザーuのタグtに対する嗜好度を示すユーザー似顔絵行列Pm×nを取得することと、
    を含むことを特徴とする方法。
  2. 前記M個の訓練サンプルに基づいて、データフィッティングモデルを用いて、初期化されたユーザーパラメータ行列Wm×k及びタグパラメータ行列Hk×nを修正し、最終のユーザーパラメータ行列Wm×k及び最終のタグパラメータ行列Hk×nを得ることは、
    a=0とし、a(aは0以上の整数である)回目修正されたユーザーパラメータ行列Wm×k及びa回目修正されたタグパラメータ行列Hk×nに基づいて、前記m人の個々のユーザーの、前記n個のタグのそれぞれに対する嗜好度を算出し、ただし、0回目修正されたユーザーパラメータ行列Wm×kは前記初期化されたユーザーパラメータ行列Wm×kとなり、0回目修正されたタグパラメータ行列Hk×nは前記初期化されたタグパラメータ行列Hk×nとなることと、
    前記m人の個々のユーザーの、前記n個のタグのそれぞれに対する嗜好度及び品物タグ行列Ah×nに基づいて、前記m人の個々のユーザーの、前記h個の品物のそれぞれに対する嗜好度を算出し、ただし、h(hは1よりも大きい整数である)は品物の数を示すことと、
    前記m人の個々のユーザーの、前記h個の品物のそれぞれに対する嗜好度に基づいて、前記M個の訓練サンプルのそれぞれに対応する確率を取得し、ただし、前記訓練サンプル<u,i,j>に対応する確率とは、前記ユーザーuの前記品物iに対する嗜好度が前記品物jに対する嗜好度よりも大きい確率であることと、
    前記M個の訓練サンプルそれぞれに対応する確率を前記データフィッティングモデルの入力パラメータとして、前記データフィッティングモデルの出力結果を算出することと、
    前記出力結果が予め設定された条件を満たしていれば、前記a回目修正されたユーザーパラメータ行列Wm×k及び前記a回目修正されたタグパラメータ行列Hk×nをそれぞれ、前記最終のユーザーパラメータ行列Wm×k及び前記最終のタグパラメータ行列Hk×nとして決定することと、
    前記出力結果が前記予め設定された条件を満たしていなければ、前記a回目修正されたユーザーパラメータ行列Wm×kを修正してa+1回目修正されたユーザーパラメータ行列Wm×kを得るとともに、前記a回目修正されたタグパラメータ行列Hk×nを修正してa+1回目修正されたタグパラメータ行列Hk×nを得て、a=a+1とし、a回目修正されたユーザーパラメータ行列Wm×k及びa回目修正されたタグパラメータ行列Hk×nに基づいて、前記m人の個々のユーザーの、前記n個のタグのそれぞれに対する嗜好度を算出するステップから再実行することと、を含む、
    ことを特徴とする請求項1に記載の方法。
  3. 前記データフィッティングモデルは下記式である、ことを特徴とする請求項2に記載の方法。
    Figure 2019503006

    (ただし、
    Figure 2019503006


    Figure 2019503006

    及び
    Figure 2019503006

    は、オーバーフィッティングを防止するための正規化パラメータであり、
    Figure 2019503006


    Figure 2019503006

    及び
    Figure 2019503006

    は正の実数であり、
    Figure 2019503006

    は行列の2ノルムを示し、
    Figure 2019503006

    は前記M個の訓練サンプルの集合を示し、前記訓練サンプル<u,i,j>に対応する確率は
    Figure 2019503006

    であり、
    Figure 2019503006

    は前記ユーザーuの前記品物iに対する嗜好度と前記ユーザーuの前記品物jに対する嗜好度との差を示し、
    Figure 2019503006

    はロジスティック関数を示し、
    Figure 2019503006

    Figure 2019503006

    は前記a回目修正されたユーザーパラメータ行列Wm×kのu行目に対応する行ベクトルを示し、
    Figure 2019503006

    は前記a回目修正されたユーザーパラメータ行列Wm×kのv行目に対応する行ベクトルを示す。)
  4. 前記m人の個々のユーザーのソーシャルネットワーク情報を取得することと、
    前記m人のユーザーのソーシャルネットワーク情報に基づいて、前記ユーザー類似度行列Sm×mを生成することと、をさらに含む、
    ことを特徴とする請求項3に記載の方法。
  5. 前記a回目修正されたユーザーパラメータ行列Wm×kを修正してa+1回目修正されたユーザーパラメータ行列Wm×kを得ることは、
    下記式により前記a+1回目修正されたユーザーパラメータ行列Wm×kを算出することを含む、ことを特徴とする請求項3に記載の方法。
    Figure 2019503006
    (ただし、
    Figure 2019503006

    は、前記a+1回目修正されたユーザーパラメータ行列Wm×kのu行目に対応する行ベクトルを示し、
    Figure 2019503006


    は、前記a回目修正されたユーザーパラメータ行列Wm×kのu行目に対応する行ベクトルを示し、
    Figure 2019503006

    は、前記a回目修正されたタグパラメータ行列Hk×n
    Figure 2019503006

    列目に対応する列ベクトルの転置ベクトルを示し、
    Figure 2019503006

    は1以上n以下の整数であり、
    Figure 2019503006

    は学習効率であり、
    Figure 2019503006

    は正の実数である。)
  6. 前記a回目修正されたタグパラメータ行列Hk×nを修正してa+1回目修正されたタグパラメータ行列Hk×nを得ることは、
    下記式により前記a+1回目修正されたタグパラメータ行列Hk×nを算出することを含む、ことを特徴とする請求項3に記載の方法。
    Figure 2019503006
    (ただし、
    Figure 2019503006

    は、前記a+1回目修正されたタグパラメータ行列Hk×nのf行目に対応する行ベクトルを示し、
    Figure 2019503006

    は、前記a回目修正されたタグパラメータ行列Hk×nのf行目に対応する行ベクトルを示し、fは1以上k以下の整数であり、
    Figure 2019503006

    は学習効率であり、
    Figure 2019503006

    は正の実数である。)
  7. ユーザー行動ログに基づいてM個の訓練サンプルを取得することは、
    前記ユーザー行動ログに基づいて、前記m人の個々のユーザーの、h(hは1よりも大きい整数である)個の品物のそれぞれに対する行動パターンを取得することと、
    個々のユーザーの各品物に対する行動パターンに基づいて、前記M個の訓練サンプルを取得することと、を含む、
    ことを特徴とする請求項1乃至6のいずれかに記載の方法。
  8. 前記M個の訓練サンプルに基づいて、データフィッティングモデルを用いて、初期化されたユーザーパラメータ行列Wm×k及びタグパラメータ行列Hk×nを修正し、最終のユーザーパラメータ行列Wm×k及び最終のタグパラメータ行列Hk×nを得る前に、
    要素が正規分布する乱数である前記初期化されたユーザーパラメータ行列Wm×k、及び、要素が正規分布する乱数である前記初期化されたタグパラメータ行列Hk×nを生成すること、をさらに含む、
    ことを特徴とする請求項1乃至6のいずれかに記載の方法。
  9. 前記最終のユーザーパラメータ行列Wm×k及び前記最終のタグパラメータ行列Hk×nに基づいて、ユーザー似顔絵行列Pm×nを取得した後、
    前記ユーザー似顔絵行列Pm×n及びターゲット品物が持つタグに基づいて、前記ユーザーuの前記ターゲット品物に対する嗜好度を算出すること、をさらに含む、
    ことを特徴とする請求項1乃至6のいずれかに記載の方法。
  10. ユーザー似顔絵を取得する装置であって、
    ユーザー行動ログに基づいて、訓練サンプル<u,i,j>がユーザーuの品物i及び品物jに対する嗜好度の差を反映するM(Mは正の整数である)個の訓練サンプルを取得するサンプル取得モジュールと、
    前記M個の訓練サンプルに基づいて、データフィッティングモデルを用いて、初期化されたユーザーパラメータ行列Wm×k及び初期化されたタグパラメータ行列Hk×nを修正し、最終のユーザーパラメータ行列Wm×k及び最終のタグパラメータ行列Hk×nを得て、ただし、m(mは正の整数である)はユーザーの数を示し、k(kは正の整数である)は因子の数を示し、n(nは1よりも大きい整数である)はタグの数を示す行列修正モジュールと、
    前記最終のユーザーパラメータ行列Wm×k及び前記最終のタグパラメータ行列Hk×nに基づいて、u(uは1以上m以下の整数である)行目のt(tは1以上n以下の整数である)列目の要素Putがユーザーuのタグtに対する嗜好度を示すユーザー似顔絵行列Pm×nを取得する画像取得モジュールと、
    を備えることを特徴とする装置。
  11. 前記行列修正モジュールは、
    a=0とし、a(aは0以上の整数である)回目修正されたユーザーパラメータ行列Wm×k及びa回目修正されたタグパラメータ行列Hk×nに基づいて、前記m人の個々のユーザーの、前記n個のタグのそれぞれに対する嗜好度を算出し、ただし、0回目修正されたユーザーパラメータ行列Wm×kは前記初期化されたユーザーパラメータ行列Wm×kとなり、0回目修正されたタグパラメータ行列Hk×nは前記初期化されたタグパラメータ行列Hk×nとなる第1の算出ユニットと、
    前記m人の個々のユーザーの、前記n個のタグのそれぞれに対する嗜好度及び品物タグ行列Ah×nに基づいて、前記m人の個々のユーザーの、前記h個の品物のそれぞれに対する嗜好度を算出し、ただし、h(hは1よりも大きい整数である)は品物の数を示す第2の算出ユニットと、
    前記m人の個々のユーザーの、前記h個の品物のそれぞれに対する嗜好度に基づいて、前記M個の訓練サンプルのそれぞれに対応する確率を取得し、ただし、前記訓練サンプル<u,i,j>に対応する確率とは、前記ユーザーuの前記品物iに対する嗜好度が前記品物jに対する嗜好度よりも大きい確率である確率取得ユニットと、
    前記M個の訓練サンプルそれぞれに対応する確率を前記データフィッティングモデルの入力パラメータとして、前記データフィッティングモデルの出力結果を算出する第3の算出ユニットと、
    前記出力結果が予め設定された条件を満たしていれば、前記a回目修正されたユーザーパラメータ行列Wm×k及び前記a回目修正されたタグパラメータ行列Hk×nをそれぞれ、前記最終のユーザーパラメータ行列Wm×k及び前記最終のタグパラメータ行列Hk×nとして決定する行列決定ユニットと、
    前記出力結果が前記予め設定された条件を満たしていなければ、前記a回目修正されたユーザーパラメータ行列Wm×kを修正してa+1回目修正されたユーザーパラメータ行列Wm×kを得るとともに、前記a回目修正されたタグパラメータ行列Hk×nを修正してa+1回目修正されたタグパラメータ行列Hk×nを得て、a=a+1とし、a回目修正されたユーザーパラメータ行列Wm×k及びa回目修正されたタグパラメータ行列Hk×nに基づいて、前記m人の個々のユーザーの、前記n個のタグのそれぞれに対する嗜好度を算出するステップから再実行する行列修正ユニットと、を含む、
    ことを特徴とする請求項10に記載の装置。
  12. 前記データフィッティングモデルは下記式である、ことを特徴とする請求項11に記載の装置。
    Figure 2019503006
    (ただし、
    Figure 2019503006


    Figure 2019503006

    及び
    Figure 2019503006

    は、オーバーフィッティングを防止するための正規化パラメータであり、
    Figure 2019503006


    Figure 2019503006

    及び
    Figure 2019503006

    は正の実数であり、
    Figure 2019503006

    は行列の2ノルムを示し、
    Figure 2019503006

    は前記M個の訓練サンプルの集合を示し、前記訓練サンプル<u,i,j>に対応する確率は
    Figure 2019503006

    であり、
    Figure 2019503006

    は前記ユーザーuの前記品物iに対する嗜好度と前記ユーザーuの前記品物jに対する嗜好度との差を示し
    Figure 2019503006

    はロジスティック関数を示し、
    Figure 2019503006

    Figure 2019503006

    は前記a回目修正されたユーザーパラメータ行列Wm×kのu行目に対応する行ベクトルを示し、
    Figure 2019503006

    は前記a回目修正されたユーザーパラメータ行列Wm×kのv行目に対応する行ベクトルを示す。)
  13. 前記m人の個々のユーザーのソーシャルネットワーク情報を取得する情報取得モジュールと、
    前記m人のユーザーのソーシャルネットワーク情報に基づいて、前記ユーザー類似度行列Sm×mを生成する第1の生成モジュールと、をさらに備える、
    ことを特徴とする請求項12に記載の装置。
  14. 前記行列修正ユニットは、具体的には、下記式により前記a+1回目修正されたユーザーパラメータ行列Wm×kを算出する、ことを特徴とする請求項12に記載の装置。
    Figure 2019503006
    (ただし、
    Figure 2019503006

    は、前記a+1回目修正されたユーザーパラメータ行列Wm×kのu行目に対応する行ベクトルを示し、
    Figure 2019503006

    は、前記a回目修正されたユーザーパラメータ行列Wm×kのu行目に対応する行ベクトルを示し、
    Figure 2019503006

    は、前記a回目修正されたタグパラメータ行列Hk×n
    Figure 2019503006

    列目に対応する列ベクトルの転置ベクトルを示し、
    Figure 2019503006

    は1以上n以下の整数であり、
    Figure 2019503006

    は学習効率であり、
    Figure 2019503006

    は正の実数である。)
  15. 前記行列修正ユニットは、具体的には、下記式により前記a+1回目修正されたタグパラメータ行列Hk×nを算出する、ことを特徴とする請求項12に記載の装置。
    Figure 2019503006

    (ただし、
    Figure 2019503006

    は、前記a+1回目修正されたタグパラメータ行列Hk×nのf行目に対応する行ベクトルを示し、
    Figure 2019503006

    は、前記a回目修正されたタグパラメータ行列Hk×nのf行目に対応する行ベクトルを示し、fは1以上k以下の整数であり、
    Figure 2019503006

    は学習効率であり、
    Figure 2019503006

    は正の実数である。)
  16. 前記サンプル取得モジュールは、
    前記ユーザー行動ログに基づいて、前記m人の個々のユーザーの、h(hは1よりも大きい整数である)個の品物のそれぞれに対する行動パターンを取得する行動取得ユニットと、
    個々のユーザーの各品物に対する行動パターンに基づいて、前記M個の訓練サンプルを取得するサンプル取得ユニットと、を含む、
    ことを特徴とする請求項10乃至15のいずれかに記載の装置。
  17. 要素が正規分布する乱数である前記初期化されたユーザーパラメータ行列Wm×k、及び、要素が正規分布する乱数である前記初期化されたタグパラメータ行列Hk×nを生成する第2の生成モジュール、をさらに備える、
    ことを特徴とする請求項10乃至15のいずれかに記載の装置。
  18. 前記ユーザー似顔絵行列Pm×n及びターゲット品物が持つタグに基づいて、前記ユーザーuの前記ターゲット品物に対する嗜好度を算出する嗜好度算出モジュール、をさらに備える、
    ことを特徴とする請求項10乃至15のいずれかに記載の装置。
  19. ユーザー似顔絵を取得する装置であって、
    1つ又は複数のプロセッサと、
    前記1つ又は複数のプロセッサに接続されるメモリであって、前記1つ又は複数のプロセッサによって実行される1つ又は複数のプログラムが記憶されたメモリと、を備え、
    前記1つ又は複数のプログラムは、
    ユーザー行動ログに基づいて、訓練サンプル<u,i,j>がユーザーuの品物i及び品物jに対する嗜好度の差を反映するM(Mは正の整数である)個の訓練サンプルを取得する動作と、
    前記M個の訓練サンプルに基づいて、データフィッティングモデルを用いて、初期化されたユーザーパラメータ行列Wm×k及び初期化されたタグパラメータ行列Hk×nを修正し、最終のユーザーパラメータ行列Wm×k及び最終のタグパラメータ行列Hk×nを得て、ただし、m(mは正の整数である)はユーザーの数を示し、k(kは正の整数である)は因子の数を示し、n(nは1よりも大きい整数である)はタグの数を示す動作と、
    前記最終のユーザーパラメータ行列Wm×k及び前記最終のタグパラメータ行列Hk×nに基づいて、u(uは1以上m以下の整数である)行目のt(tは1以上n以下の整数である)列目の要素Putがユーザーuのタグtに対する嗜好度を示すユーザー似顔絵行列Pm×nを取得する動作と、を実行するための命令を含む、ことを特徴とする装置。
  20. 前記1つ又は複数のプログラムは、
    a=0とし、a(aは0以上の整数である)回目修正されたユーザーパラメータ行列Wm×k及びa回目修正されたタグパラメータ行列Hk×nに基づいて、前記m人の個々のユーザーの、前記n個のタグのそれぞれに対する嗜好度を算出し、ただし、0回目修正されたユーザーパラメータ行列Wm×kは前記初期化されたユーザーパラメータ行列Wm×kとなり、0回目修正されたタグパラメータ行列Hk×nは前記初期化されたタグパラメータ行列Hk×nとなる動作と、
    前記m人の個々のユーザーの、前記n個のタグのそれぞれに対する嗜好度及び品物タグ行列Ah×nに基づいて、前記m人の個々のユーザーの、前記h個の品物のそれぞれに対する嗜好度を算出し、ただし、h(hは1よりも大きい整数である)は品物の数を示す動作と、
    前記m人の個々のユーザーの、前記h個の品物のそれぞれに対する嗜好度に基づいて、前記M個の訓練サンプルのそれぞれに対応する確率を取得し、ただし、前記訓練サンプル<u,i,j>に対応する確率とは、前記ユーザーuの前記品物iに対する嗜好度が前記品物jに対する嗜好度よりも大きい確率である動作と、
    前記M個の訓練サンプルそれぞれに対応する確率を前記データフィッティングモデルの入力パラメータとして、前記データフィッティングモデルの出力結果を算出する動作と、
    前記出力結果が予め設定された条件を満たしていれば、前記a回目修正されたユーザーパラメータ行列Wm×k及び前記a回目修正されたタグパラメータ行列Hk×nをそれぞれ、前記最終のユーザーパラメータ行列Wm×k及び前記最終のタグパラメータ行列Hk×nとして決定する動作と、
    前記出力結果が前記予め設定された条件を満たしていなければ、前記a回目修正されたユーザーパラメータ行列Wm×kを修正してa+1回目修正されたユーザーパラメータ行列Wm×kを得るとともに、前記a回目修正されたタグパラメータ行列Hk×nを修正してa+1回目修正されたタグパラメータ行列Hk×nを得て、a=a+1とし、a回目修正されたユーザーパラメータ行列Wm×k及びa回目修正されたタグパラメータ行列Hk×nに基づいて、前記m人の個々のユーザーの、前記n個のタグのそれぞれに対する嗜好度を算出するステップから再実行する動作と、を実行するための命令をさらに含む、
    ことを特徴とする請求項19に記載の装置。
  21. 前記データフィッティングモデルは下記式である、ことを特徴とする請求項20に記載の装置。
    Figure 2019503006

    (ただし、
    Figure 2019503006


    Figure 2019503006

    及び
    Figure 2019503006

    は、オーバーフィッティングを防止するための正規化パラメータであり、
    Figure 2019503006



    Figure 2019503006

    及び
    Figure 2019503006

    は正の実数であり、
    Figure 2019503006

    は行列の2ノルムを示し、
    Figure 2019503006

    は前記M個の訓練サンプルの集合を示し、前記訓練サンプル<u,i,j>に対応する確率は
    Figure 2019503006

    であり、
    Figure 2019503006

    は前記ユーザーuの前記品物iに対する嗜好度と前記ユーザーuの前記品物jに対する嗜好度との差を示し、
    Figure 2019503006

    はロジスティック関数を示し、
    Figure 2019503006

    Figure 2019503006

    は前記a回目修正されたユーザーパラメータ行列Wm×kのu行目に対応する行ベクトルを示し、
    Figure 2019503006

    は前記a回目修正されたユーザーパラメータ行列Wm×kのv行目に対応する行ベクトルを示す。)
  22. 前記1つ又は複数のプログラムは、
    前記m人の個々のユーザーのソーシャルネットワーク情報を取得する動作と、
    前記m人のユーザーのソーシャルネットワーク情報に基づいて、前記ユーザー類似度行列Sm×mを生成する動作と、を実行するための命令をさらに含む、
    ことを特徴とする請求項21に記載の装置。
  23. 前記1つ又は複数のプログラムは、
    下記式により前記a+1回目修正されたユーザーパラメータ行列Wm×kを算出する動作を実行するための命令をさらに含む、ことを特徴とする請求項21に記載の装置。
    Figure 2019503006
    (ただし、
    Figure 2019503006

    は、前記a+1回目修正されたユーザーパラメータ行列Wm×kのu行目に対応する行ベクトルを示し、
    Figure 2019503006

    は、前記a回目修正されたユーザーパラメータ行列Wm×kのu行目に対応する行ベクトルを示し、
    Figure 2019503006

    は、前記a回目修正されたタグパラメータ行列Hk×n
    Figure 2019503006

    列目に対応する列ベクトルの転置ベクトルを示し、
    Figure 2019503006

    は1以上n以下の整数であり、
    Figure 2019503006

    は学習効率であり、
    Figure 2019503006

    は正の実数である。)
  24. 前記1つ又は複数のプログラムは、
    下記式により前記a+1回目修正されたタグパラメータ行列Hk×nを算出する動作を実行するための命令をさらに含む、ことを特徴とする請求項21に記載の装置。
    Figure 2019503006

    (ただし、
    Figure 2019503006

    は、前記a+1回目修正されたタグパラメータ行列Hk×nのf行目に対応する行ベクトルを示し、
    Figure 2019503006

    は、前記a回目修正されたタグパラメータ行列Hk×nのf行目に対応する行ベクトルを示し、fは1以上k以下の整数であり、
    Figure 2019503006

    は学習効率であり、
    Figure 2019503006

    は正の実数である。)
  25. 前記1つ又は複数のプログラムは、
    前記ユーザー行動ログに基づいて、前記m人の個々のユーザーの、h(hは1よりも大きい整数である)個の品物のそれぞれに対する行動パターンを取得する動作と、
    個々のユーザーの各品物に対する行動パターンに基づいて、前記M個の訓練サンプルを取得する動作と、を実行するための命令をさらに含む、
    ことを特徴とする請求項19乃至24のいずれかに記載の装置。
  26. 前記1つ又は複数のプログラムは、
    要素が正規分布する乱数である前記初期化されたユーザーパラメータ行列Wm×k、及び、要素が正規分布する乱数である前記初期化されたタグパラメータ行列Hk×nを生成する動作を実行するための命令をさらに含む、
    ことを特徴とする請求項19乃至24のいずれかに記載の装置。
  27. 前記1つ又は複数のプログラムは、
    前記ユーザー似顔絵行列Pm×n及びターゲット品物が持つタグに基づいて、前記ユーザーuの前記ターゲット品物に対する嗜好度を算出する動作を実行するための命令をさらに含む、
    ことを特徴とする請求項19乃至24のいずれかに記載の装置。
JP2018535169A 2016-04-29 2017-04-25 ユーザー似顔絵を取得する方法及び装置 Active JP6615362B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201610284124.6A CN107341679A (zh) 2016-04-29 2016-04-29 获取用户画像的方法及装置
CN201610284124.6 2016-04-29
PCT/CN2017/081928 WO2017186106A1 (zh) 2016-04-29 2017-04-25 获取用户画像的方法及装置

Publications (2)

Publication Number Publication Date
JP2019503006A true JP2019503006A (ja) 2019-01-31
JP6615362B2 JP6615362B2 (ja) 2019-12-04

Family

ID=60160755

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018535169A Active JP6615362B2 (ja) 2016-04-29 2017-04-25 ユーザー似顔絵を取得する方法及び装置

Country Status (5)

Country Link
US (1) US11394798B2 (ja)
JP (1) JP6615362B2 (ja)
KR (1) KR102122373B1 (ja)
CN (2) CN110378731B (ja)
WO (1) WO2017186106A1 (ja)

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210081792A1 (en) * 2018-04-26 2021-03-18 Nippon Telegraph And Telephone Corporation Neural network learning apparatus, neural network learning method and program
CN109063059B (zh) * 2018-07-20 2021-07-27 腾讯科技(深圳)有限公司 行为日志处理方法、装置及电子设备
CN109241461B (zh) * 2018-08-10 2020-05-22 新华三信息安全技术有限公司 一种用户画像构建方法及装置
CN109447717A (zh) * 2018-11-12 2019-03-08 万惠投资管理有限公司 一种标签的确定方法及系统
CN109785034A (zh) * 2018-11-13 2019-05-21 北京码牛科技有限公司 用户画像生成方法、装置、电子设备及计算机可读介质
CN111506617B (zh) * 2019-01-31 2023-10-20 华为技术有限公司 一种基于用户数据生成标签的方法及装置
CN109949076B (zh) * 2019-02-26 2022-02-18 北京首钢自动化信息技术有限公司 建立超球面映射模型的方法、信息推荐方法及装置
CN110049446B (zh) * 2019-03-25 2020-12-29 每日互动股份有限公司 一种基于移动终端数据获取终端用户属性标签的服务器
CN110069706A (zh) * 2019-03-25 2019-07-30 华为技术有限公司 数据处理的方法、端侧设备、云侧设备和端云协同系统
CN110020201B (zh) * 2019-03-26 2021-05-25 中国科学院软件研究所 一种基于用户画像聚类的用户类型自动化标注系统
CN110196849B (zh) * 2019-06-05 2023-04-18 普元信息技术股份有限公司 基于大数据治理技术实现用户画像构建处理的系统及其方法
CN110245296A (zh) * 2019-06-14 2019-09-17 浙江华坤道威数据科技有限公司 一种基于大数据的pas用户画像分析系统及其方法
CN110852338A (zh) * 2019-07-26 2020-02-28 平安科技(深圳)有限公司 用户画像的构建方法及装置
CN110765170A (zh) * 2019-09-26 2020-02-07 维沃移动通信有限公司 一种用户画像的生成方法及可穿戴设备
CN110851581B (zh) * 2019-11-19 2022-11-11 东软集团股份有限公司 一种模型参数确定方法、装置、设备及存储介质
CN110992096B (zh) * 2019-12-03 2023-08-29 秒针信息技术有限公司 预测模型训练方法、装置以及媒体标识预测方法及装置
CN112989179B (zh) * 2019-12-13 2023-07-28 北京达佳互联信息技术有限公司 模型训练、多媒体内容推荐方法和装置
CN111652767B (zh) * 2020-05-21 2021-12-31 上海松鼠课堂人工智能科技有限公司 用户画像构建方法、装置、计算机设备和存储介质
CN111881191B (zh) * 2020-08-05 2021-06-11 留洋汇(厦门)金融技术服务有限公司 移动互联网下的客户画像关键特征挖掘系统与方法
CN112507185B (zh) * 2020-10-22 2022-08-19 复旦大学 用户肖像的确定方法和装置
CN112364008A (zh) * 2020-11-20 2021-02-12 国网江苏省电力有限公司营销服务中心 一种面向电力物联网智能终端的设备画像构建方法
CN112732880A (zh) * 2020-12-30 2021-04-30 平安科技(深圳)有限公司 用户画像生成方法、装置、计算机设备及存储介质
CN113781088A (zh) * 2021-02-04 2021-12-10 北京沃东天骏信息技术有限公司 一种用户标签处理方法、装置和系统
CN114492612A (zh) * 2021-03-23 2022-05-13 耿赛 基于大数据的用户行为分析方法及服务器
CN113033685A (zh) * 2021-04-01 2021-06-25 安徽理工大学 一种航空旅客付费选座意愿画像及分析的方法
CN113065069B (zh) * 2021-04-21 2023-02-28 山大地纬软件股份有限公司 一种基于数据画像的双向就业推荐方法和装置
CN113592590A (zh) * 2021-07-27 2021-11-02 中国联合网络通信集团有限公司 一种用户画像生成方法及装置
US11556935B1 (en) 2021-07-28 2023-01-17 International Business Machines Corporation Financial risk management based on transactions portrait
CN114119058B (zh) * 2021-08-10 2023-09-26 国家电网有限公司 用户画像模型的构建方法、设备及存储介质
CN114722281B (zh) * 2022-04-07 2024-04-12 平安科技(深圳)有限公司 基于用户画像及用户选课行为的培训课程配置方法、装置
CN115567227B (zh) * 2022-12-02 2023-04-07 华南师范大学 一种基于大数据安全的身份认证方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070083651A1 (en) * 2005-10-11 2007-04-12 Sony Ericsson Mobile Communications Japan, Inc. Communication apparatus and computer program
JP2007200159A (ja) * 2006-01-30 2007-08-09 Nec Corp メッセージ作成支援方法及び携帯端末
JP2009289092A (ja) * 2008-05-30 2009-12-10 Sony Corp 情報処理装置、推薦方法、プログラム及び記録媒体
JP2012123488A (ja) * 2010-12-06 2012-06-28 Fujitsu Ten Ltd コンテンツ提供サーバ、及び端末装置
JP2014115839A (ja) * 2012-12-10 2014-06-26 Nippon Hoso Kyokai <Nhk> コンテンツ推薦装置、及びプログラム

Family Cites Families (53)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7240055B2 (en) * 2003-12-11 2007-07-03 Xerox Corporation Method and system for expertise mapping based on user activity in recommender systems
US7698270B2 (en) * 2004-12-29 2010-04-13 Baynote, Inc. Method and apparatus for identifying, extracting, capturing, and leveraging expertise and knowledge
GB0506618D0 (en) * 2005-04-01 2005-05-11 Wine Science Ltd A method of supplying information articles at a website and system for supplying such articles
US20080235216A1 (en) * 2007-03-23 2008-09-25 Ruttenberg Steven E Method of predicitng affinity between entities
WO2009104324A1 (ja) * 2008-02-22 2009-08-27 日本電気株式会社 能動計量学習装置、能動計量学習方法およびプログラム
US20090265328A1 (en) * 2008-04-16 2009-10-22 Yahool Inc. Predicting newsworthy queries using combined online and offline models
US8386519B2 (en) * 2008-12-30 2013-02-26 Expanse Networks, Inc. Pangenetic web item recommendation system
US8108406B2 (en) * 2008-12-30 2012-01-31 Expanse Networks, Inc. Pangenetic web user behavior prediction system
US9600581B2 (en) * 2009-02-19 2017-03-21 Yahoo! Inc. Personalized recommendations on dynamic content
US8812362B2 (en) * 2009-02-20 2014-08-19 Yahoo! Inc. Method and system for quantifying user interactions with web advertisements
US8306940B2 (en) * 2009-03-20 2012-11-06 Microsoft Corporation Interactive visualization for generating ensemble classifiers
CN101751448B (zh) * 2009-07-22 2012-06-27 中国科学院自动化研究所 一种基于情景信息的个性化资源信息的推荐方法
US8838587B1 (en) * 2010-04-19 2014-09-16 Google Inc. Propagating query classifications
US8874727B2 (en) * 2010-05-31 2014-10-28 The Nielsen Company (Us), Llc Methods, apparatus, and articles of manufacture to rank users in an online social network
US8606787B1 (en) * 2010-09-15 2013-12-10 Google Inc. Social network node clustering system and method
US20140164172A1 (en) * 2011-04-19 2014-06-12 Nokia Corporation Method and apparatus for providing feature-based collaborative filtering
US20120297038A1 (en) * 2011-05-16 2012-11-22 Microsoft Corporation Recommendations for Social Network Based on Low-Rank Matrix Recovery
WO2013024338A1 (en) * 2011-08-15 2013-02-21 Equal Media Limited System and method for managing opinion networks with interactive opinion flows
US8793593B2 (en) * 2011-09-21 2014-07-29 Facebook, Inc. Integrating structured objects and actions generated on external systems into a social networking system
US9116997B2 (en) * 2011-09-22 2015-08-25 Alibaba.Com Limited Presenting user preference activities
US9082082B2 (en) * 2011-12-06 2015-07-14 The Trustees Of Columbia University In The City Of New York Network information methods devices and systems
US8463295B1 (en) * 2011-12-07 2013-06-11 Ebay Inc. Systems and methods for generating location-based group recommendations
US20130159100A1 (en) * 2011-12-19 2013-06-20 Rajat Raina Selecting advertisements for users of a social networking system using collaborative filtering
US20130246300A1 (en) * 2012-03-13 2013-09-19 American Express Travel Related Services Company, Inc. Systems and Methods for Tailoring Marketing
US20130268595A1 (en) * 2012-04-06 2013-10-10 Telefonaktiebolaget L M Ericsson (Publ) Detecting communities in telecommunication networks
CN103377200B (zh) * 2012-04-17 2018-09-04 腾讯科技(深圳)有限公司 用户偏好信息采集方法和装置
US20130311222A1 (en) * 2012-05-21 2013-11-21 Vantage Agora Inc. Social Networking System For Organization Management
CN102722552B (zh) * 2012-05-28 2014-02-26 重庆大学 一种协同过滤推荐模型中调整学习速率的方法
US8984082B2 (en) * 2012-08-29 2015-03-17 Wetpaint.Com, Inc. Personalization based upon social value in online media
CN104395901B (zh) * 2012-09-18 2018-05-22 北京一点网聚科技有限公司 用于促进用户获得内容的方法和系统
US9058303B2 (en) * 2012-11-30 2015-06-16 Xerox Corporation Convex collective matrix factorization
US9721019B2 (en) * 2012-12-10 2017-08-01 Aol Inc. Systems and methods for providing personalized recommendations for electronic content
US20140214895A1 (en) * 2013-01-31 2014-07-31 Inplore Systems and method for the privacy-maintaining strategic integration of public and multi-user personal electronic data and history
US9002755B2 (en) * 2013-02-05 2015-04-07 scenarioDNA System and method for culture mapping
US10467327B1 (en) * 2013-03-15 2019-11-05 Matan Arazi Real-time event transcription system and method
EP2860940B1 (en) * 2013-09-27 2016-09-14 Alcatel Lucent Method for caching
CN104090886B (zh) * 2013-12-09 2015-09-09 深圳市腾讯计算机系统有限公司 构建用户实时画像的方法及装置
US20150178282A1 (en) * 2013-12-23 2015-06-25 Yahoo! Inc. Fast and dynamic targeting of users with engaging content
CN104750731B (zh) * 2013-12-30 2018-09-21 华为技术有限公司 一种获取完整用户画像的方法及装置
CN103744966B (zh) * 2014-01-07 2018-06-22 Tcl集团股份有限公司 一种物品推荐方法、装置
US9852208B2 (en) * 2014-02-25 2017-12-26 International Business Machines Corporation Discovering communities and expertise of users using semantic analysis of resource access logs
WO2015153380A1 (en) * 2014-03-31 2015-10-08 Kountable, Inc. Multi-variable assessment systems and methods that evaluate and predict entrepreneurial behavior
US20190066020A1 (en) * 2014-03-31 2019-02-28 Kountable, Inc. Multi-Variable Assessment Systems and Methods that Evaluate and Predict Entrepreneurial Behavior
US10832349B2 (en) * 2014-06-02 2020-11-10 International Business Machines Corporation Modeling user attitudes toward a target from social media
CN104111969B (zh) * 2014-06-04 2017-06-20 百度移信网络技术(北京)有限公司 一种相似性度量的方法以及系统
US20150379609A1 (en) * 2014-06-30 2015-12-31 Kobo Incorporated Generating recommendations for unfamiliar users by utilizing social side information
US9953086B2 (en) * 2014-07-15 2018-04-24 Microsoft Technology Licensing, Llc Prioritizing media based on social data and user behavior
CN105574730A (zh) * 2014-10-10 2016-05-11 中兴通讯股份有限公司 基于物联网大数据平台的智能用户画像方法及装置
US20160191450A1 (en) * 2014-12-31 2016-06-30 Socialtopias, Llc Recommendations Engine in a Layered Social Media Webpage
US20170098242A1 (en) * 2015-10-02 2017-04-06 American Express Travel Related Services Company, Inc. Systems and methods for generating curated and custom content for data-driven applications using closed-loop data
CN105302890A (zh) * 2015-10-16 2016-02-03 海信集团有限公司 一种多媒体内容在线推荐的方法及其辅助方法和装置
US10191988B2 (en) * 2015-10-28 2019-01-29 Sony Mobile Communications Inc. System and method for returning prioritized content
CN106530010B (zh) * 2016-11-15 2017-12-12 平安科技(深圳)有限公司 融合时间因素的协同过滤方法和装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070083651A1 (en) * 2005-10-11 2007-04-12 Sony Ericsson Mobile Communications Japan, Inc. Communication apparatus and computer program
JP2007110199A (ja) * 2005-10-11 2007-04-26 Sony Ericsson Mobilecommunications Japan Inc 通信装置およびコンピュータプログラム
JP2007200159A (ja) * 2006-01-30 2007-08-09 Nec Corp メッセージ作成支援方法及び携帯端末
JP2009289092A (ja) * 2008-05-30 2009-12-10 Sony Corp 情報処理装置、推薦方法、プログラム及び記録媒体
JP2012123488A (ja) * 2010-12-06 2012-06-28 Fujitsu Ten Ltd コンテンツ提供サーバ、及び端末装置
JP2014115839A (ja) * 2012-12-10 2014-06-26 Nippon Hoso Kyokai <Nhk> コンテンツ推薦装置、及びプログラム

Also Published As

Publication number Publication date
KR20180091043A (ko) 2018-08-14
JP6615362B2 (ja) 2019-12-04
KR102122373B1 (ko) 2020-06-12
US11394798B2 (en) 2022-07-19
CN110378731B (zh) 2021-04-20
WO2017186106A1 (zh) 2017-11-02
US20180316776A1 (en) 2018-11-01
CN110378731A (zh) 2019-10-25
CN107341679A (zh) 2017-11-10

Similar Documents

Publication Publication Date Title
JP6615362B2 (ja) ユーザー似顔絵を取得する方法及び装置
US11995564B2 (en) System and method for generating aspect-enhanced explainable description-based recommendations
US10609433B2 (en) Recommendation information pushing method, server, and storage medium
US10699321B2 (en) Global vector recommendations based on implicit interaction and profile data
US20180096073A1 (en) Recommendations Based On User Preference And Activities
AU2016225947B2 (en) System and method for multimedia document summarization
US11921777B2 (en) Machine learning for digital image selection across object variations
CN108287857B (zh) 表情图片推荐方法及装置
EP4181026A1 (en) Recommendation model training method and apparatus, recommendation method and apparatus, and computer-readable medium
US20160055159A1 (en) Presenting Groups of Content Item Selected for a Social Networking System User Based on Content Item Characteristics
Oosterhuis et al. Ranking for relevance and display preferences in complex presentation layouts
US11651255B2 (en) Method and apparatus for object preference prediction, and computer readable medium
CN111125376A (zh) 知识图谱生成方法、装置、数据处理设备及存储介质
JP5945206B2 (ja) 商品推薦装置及び方法及びプログラム
US10579752B2 (en) Generating a model based on input
US20170286473A1 (en) Element identifier generation
US11062371B1 (en) Determine product relevance
US20180137587A1 (en) Contextual personalized list of recommended courses
JP6700146B2 (ja) 評価値に基づいて推奨するコンテンツを決定するシステム
KR101663359B1 (ko) 업데이트된 뉴스 콘텐츠 제공 방법 및 장치
WO2016029705A1 (zh) 一种网页工具条的插入方法、装置及存储介质
CN110555131B (zh) 内容推荐方法、内容推荐装置和电子设备
CN111915339A (zh) 数据的处理方法、装置及设备
JP2013029896A (ja) アイテム推薦装置及び方法及びプログラム
WO2018133680A1 (zh) 一种基于用户已安装应用来推荐热词的方法、装置、终端设备及计算机可读存储介质

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180705

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180705

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190426

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190521

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190725

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20191008

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20191105

R150 Certificate of patent or registration of utility model

Ref document number: 6615362

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250