JP2019507398A - 時間因子を融合させる協調フィルタリング方法、装置、サーバおよび記憶媒体 - Google Patents

時間因子を融合させる協調フィルタリング方法、装置、サーバおよび記憶媒体 Download PDF

Info

Publication number
JP2019507398A
JP2019507398A JP2017566628A JP2017566628A JP2019507398A JP 2019507398 A JP2019507398 A JP 2019507398A JP 2017566628 A JP2017566628 A JP 2017566628A JP 2017566628 A JP2017566628 A JP 2017566628A JP 2019507398 A JP2019507398 A JP 2019507398A
Authority
JP
Japan
Prior art keywords
user
model
obtaining
classification
time period
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017566628A
Other languages
English (en)
Other versions
JP6484730B2 (ja
Inventor
路洋 曹
路洋 曹
建明 王
建明 王
京 肖
京 肖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Application granted granted Critical
Publication of JP6484730B2 publication Critical patent/JP6484730B2/ja
Publication of JP2019507398A publication Critical patent/JP2019507398A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0255Targeted advertisements based on user history
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0269Targeted advertisements based on user profile or attribute
    • G06Q30/0271Personalized advertisement
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Complex Calculations (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

時間因子を融合させる協調フィルタリング方法であって、指数平滑化モデルを作成することと、指数平滑化モデルに対して制定した時間帯を取得し、時間帯には複数の時間周期が含まれていることと、複数のユーザ識別子およびユーザ識別子の複数の時間周期内における指定の製品に対するユーザの好み度合値を取得することと、指数平滑化モデルを利用してユーザの好み度合値に対して反復計算を行うことにより、時間周期に対応する平滑化結果を取得することと、ユーザ識別子および時間周期に対応する平滑化結果を利用して疏行列を生成し、疏行列には複数の予測待ちユーザの好み度合が含まれていることと、協調フィルタリングモデルを取得し、時間周期に対応する平滑化結果を協調フィルタリングモデルに入力することと、協調フィルタリングモデルによってトレーニングを行い、疎行列における複数の予測待ちユーザの好み度合の予測値を算出することとを含む。【選択図】図2

Description

本願は、2016年11月15日に中国専利局に出願された出願番号が201611005200.1であり、発明の名称が「時間因子を融合させる協調フィルタリング方法および装置」である中国特許出願の優先権を主張する。該中国特許出願の全ての内容は、本明細書中において参考として援用される。
本発明は、コンピュータ技術分野に関し、特に時間因子を融合させる協調フィルタリング方法、装置、サーバおよび記憶媒体に関する。
ユーザの製品に対する好みを収集し、データ解析およびマイニングを行うことによって製品情報を推奨する正確度を効果的に向上させることができる。従来の形態において、ユーザのある製品に対する好み度合は、通常はユーザの行為のみにより構築される。例えば、ユーザの行為にはクリック、お気に入りに格納および購買等が含まれる。未知のユーザの好み度合値を予測する場合、時間因子に対する考慮が欠けている。ユーザが1年前にある製品を購入したが、今年は該製品を続けて購入していないと想定する。この場合、該ユーザの該製品に対する1年前の好み度合を利用して他のユーザの該製品に対する今年の好み度合を予測すると、予測結果は明らかに実際の状況を反映できない。如何に時間因子に結び付けて指定の製品に対するユーザの好み度合値を効果的に予測するかは、現在解決しなければならない技術問題の一つとなっている。
本発明は、様々な実施例を開示することにより、時間因子を融合させる協調フィルタリング方法、装置、サーバおよび記憶媒体を提供することを目的とする。
時間因子を融合させる協調フィルタリング方法であって、
指数平滑化モデルを作成することと、
前記指数平滑化モデルに対して制定した時間帯を取得し、前記時間帯には複数の時間周期が含まれていることと、
複数のユーザ識別子およびユーザ識別子の複数の時間周期内における指定の製品に対するユーザの好み度合値を取得することと、
前記指数平滑化モデルを利用して前記ユーザの好み度合値に対して反復計算を行うことにより、時間周期に対応する平滑化結果を取得することと、
前記ユーザ識別子および前記時間周期に対応する平滑化結果を利用して疏行列を生成し、前記疏行列には複数の予測待ちユーザの好み度合が含まれていることと、
協調フィルタリングモデルを取得し、前記時間周期に対応する平滑化結果を前記協調フィルタリングモデルに入力することと、
前記協調フィルタリングモデルによってトレーニングを行い、前記疎行列における複数の予測待ちユーザの好み度合の予測値を算出することと、を含む。
時間因子を融合させる協調フィルタリング装置であって、
指数平滑化モデルを作成するモデル作成モジュールと、
前記指数平滑化モデルに対して制定した時間帯を取得し、前記時間帯には複数の時間周期が含まれており、複数のユーザ識別子およびユーザ識別子の複数の時間周期内における指定の製品に対するユーザの好み度合値を取得する取得モジュールと、
前記指数平滑化モデルを利用して前記ユーザの好み度合値に対して反復計算を行うことにより、時間周期に対応する平滑化結果を取得する平滑化モジュールと、
前記ユーザ識別子および前記時間周期に対応する平滑化結果を利用して疏行列を生成し、前記疏行列には複数の予測待ちユーザの好み度合が含まれている行列生成モジュールと、
前記取得モジュールは、さらに協調フィルタリングモデルの取得に用いられ、
前記時間周期に対応する平滑化結果を前記協調フィルタリングモデルに入力し、前記協調フィルタリングモデルによってトレーニングを行い、前記疎行列における複数の予測待ちユーザの好み度合の予測値を算出する第1トレーニングモジュールと、
を含む。
コンピュータで実行可能な命令が記憶されているメモリおよびプロセッサを含むサーバであって、前記コンピュータで実行可能な命令が前記プロセッサにより実行される場合、前記プロセッサは、
指数平滑化モデルを作成する手順と、
前記指数平滑化モデルに対して制定した時間帯を取得し、前記時間帯には複数の時間周期が含まれている手順と、
複数のユーザ識別子およびユーザ識別子の複数の時間周期内における指定の製品に対するユーザの好み度合値を取得する手順と、
前記指数平滑化モデルを利用して前記ユーザの好み度合値に対して反復計算を行うことにより、時間周期に対応する平滑化結果を取得する手順と、
前記ユーザ識別子および前記時間周期に対応する平滑化結果を利用して疏行列を生成し、前記疏行列には複数の予測待ちユーザの好み度合が含まれている手順と、
協調フィルタリングモデルを取得し、前記時間周期に対応する平滑化結果を前記協調フィルタリングモデルに入力する手順と、
前記協調フィルタリングモデルによってトレーニングを行い、前記疎行列における複数の予測待ちユーザの好み度合の予測値を算出する手順と、を実行する。
1つまたは複数のコンピュータで実行可能な命令が記憶されている不揮発性読み取り可能な記憶媒体であって、前記コンピュータで実行可能な命令が1つまたは複数のプロセッサにより実行される場合、前記1つまたは複数のプロセッサは、
指数平滑化モデルを作成する手順と、
前記指数平滑化モデルに対して制定した時間帯を取得し、前記時間帯には複数の時間周期が含まれている手順と、
複数のユーザ識別子およびユーザ識別子の複数の時間周期内における指定の製品に対するユーザの好み度合値を取得する手順と、
前記指数平滑化モデルを利用して前記ユーザの好み度合値に対して反復計算を行うことにより、時間周期に対応する平滑化結果を取得する手順と、
前記ユーザ識別子および前記時間周期に対応する平滑化結果を利用して疏行列を生成し、前記疏行列には複数の予測待ちユーザの好み度合が含まれている手順と、
協調フィルタリングモデルを取得し、前記時間周期に対応する平滑化結果を前記協調フィルタリングモデルに入力する手順と、
前記協調フィルタリングモデルによってトレーニングを行い、前記疎行列における複数の予測待ちユーザの好み度合の予測値を算出する手順と、を実行する。
本願の1つまたは複数の実施例は以下の図面と記載において詳細に説明される。本願のその他の特徴、目的および利点は明細書、図面および特許請求の範囲によって明らかになる。
本発明に係る実施例または従来技術における技術的解決手段をより明らかに説明するため、以下、実施例または従来技術の説明において使用される必要のある図面について簡単に説明する。明らかに、下記の図面は本発明の一部の実施例に過ぎず、当業者にとって、創造的な労働を付しない前提で、さらにこれらの図面によってその他の図面を取得することができる。
一実施例における時間因子を融合させる協調フィルタリング方法の応用シーンを示す図である。 一実施例における時間因子を融合させる協調フィルタリング方法のフローチャートである。 一実施例における二次元空間の記録点を示す図である。 一実施例におけるサーバのブロック図である。 一実施例における時間因子を融合させる協調フィルタリング装置のブロック図である。 他の一実施例における時間因子を融合させる協調フィルタリング装置のブロック図である。 更なる他の一実施例における時間因子を融合させる協調フィルタリング装置のブロック図である。 更なる他の一実施例における時間因子を融合させる協調フィルタリング装置のブロック図である。
本発明の目的、技術的解決手段および利点をさらに明らかにするため、以下、図面および実施例を参照しながら、本発明についてさらに詳細に説明する。以下に説明する具体的な実施例は、本願をわかりやすく説明するためのものに過ぎず、本願を限定するものではないことには理解すべきである。
本発明の実施例により提供される時間因子を融合させる協調フィルタリング方法は、図1に示すようなシーンに応用することができる。端末102とサーバ104とはネットワークを介して接続されている。端末102は、複数有しても良い。端末102にはサーバにアクセス可能なアプリケーションがインストールされており、ユーザが該アプリケーションによってサーバ104にアクセスする場合、サーバ104は端末102に対して対応するページ画面を返す。ユーザは、ページ画面に表示された製品に対してクリック、お気に入りに格納および購買等を行うことができる。ユーザが端末102を介して操作する場合、サーバ104はユーザ識別子および上記ユーザ行為を収集することができる。サーバ104は、予め設けた時間周期内において、指定の製品に対してユーザ行為を収集することによってユーザの好み度合値を取得する。サーバ104は、指数平滑化モデルを作成する。サーバ104は、指数平滑化モデルに対して対応する時間帯を制定することができ、時間帯内には複数の時間周期があっても良い。サーバ104は、複数のユーザ識別子およびユーザ識別子の複数の時間周期内における指定の製品に対するユーザの好み度合値を取得する。サーバ104は、複数の時間周期に対応するユーザの好み度合値を指数平滑化モデルに入力し、複数の時間周期におけるユーザの好み度合値に対して反復計算(iterative computation)を行うことにより、時間周期に対応する複数の平滑化結果を取得する。サーバ104は、ユーザ識別子および時間周期に対応する平滑化結果を利用してユーザ識別子および製品識別子に対応する疏行列を生成し、疏行列には複数の予測待ちユーザの好み度合が含まれている。サーバ104は、協調フィルタリングモデルを取得し、時間周期に対応する平滑化結果を協調フィルタリングモデルに入力する。協調フィルタリングモデルによってトレーニングを行い、疎行列における複数の予測待ちユーザの好み度合の予測値を算出する。
一実施例において、図2に示すように、時間因子を融合させる協調フィルタリング方法を提供する。理解すべきことは、図2のフローチャートにおける各ステップは矢印の指示に従って順次に表示されているが、これらのステップは必ずしも矢印により指示された順次に従って実行されるわけではない。本明細書において明確に説明されていない限り、これらのステップの実行は順番に対する厳しい制限がなく、他の順番で実行されてもよい。また、図2における少なくとも一部のステップは、複数のサブステップまたは複数の段階を含むことができる。これらのサブステップまたは段階は、必ずしも同じ時刻において実行されるわけではなく、異なる時刻において実行されてもよく、その実行の順番も必ずしも順次に実行されるわけではなく、他のステップまたは他のステップのサブステップまたは段階の少なくとも一部と順番にまたは交互に実行されてもよい。該方法がサーバに応用される例を挙げて説明する。該方法は、具体的には、以下のステップを含む。
(ステップ202)
指数平滑化モデルを作成する。
(ステップ204)
指数平滑化モデルに対して制定した時間帯を取得し、時間帯には複数の時間周期が含まれている。
ユーザの好み度合とは、ユーザの指定の製品に対する好み度合を指す。ユーザの好み度合は、数値を採用して表示することができる。サーバには、ユーザの好みデータが予め記憶されている。ここで、ユーザの好みデータにはユーザ識別子、製品識別子および対応するユーザの好み度合値等が含まれる。ユーザの好み度合値は、サーバにより予め設定した時間周期内において指定の製品に対してユーザ行為を収集して取得できるものであってもよく、ユーザ行為にはクリック、購買およびお気に入りに格納等が含まれる。ユーザの好み度合は、時間周期に対応するものであってもよい。異なる指定の製品に対して、ユーザの好み度合に対応する時間周期は同じものであってもよく、異なるものであってもよい。例えば、ゲーム商品に対して、ユーザの好み度合に対応する時間周期は1日であってもよい。一方、保険商品に対して、ユーザの好み度合に対応する時間周期は1ヵ月または1ヵ月等であってもよい。
ユーザの指定の製品に対するユーザの好み度合と時間因子とを効果的に結合させるため、サーバにより指数平滑化モデルを作成する。指数平滑化モデルによって、複数の時間周期のユーザの好み度合を融合させる。
そのうちの一つの実施例において、平滑化モデルの計算式はPt+1=a*P+(1−a)*Pt−1を含み、ここで、aは製品識別子に対応する指数係数を示し、Pt+1は次の時間周期に対応するユーザの好み度合値を示し、Pは現在の時間周期に対応するユーザの好み度合値を示し、Pt−1は一つ前の時間周期に対応するユーザの好み度合値を示す。
サーバは、指数平滑化モデルに対して対応する時間帯を制定することができ、時間帯内には複数の時間周期があってもよい。時間帯は指定の製品の特性に基づいて制定することができ、異なる指定の製品は異なる時間帯を制定することができる。例えば、金融商品の指数平滑化モデルに対して制定する時間帯は1ヶ月であってもよく、該時間帯内の時間周期は日を単位としてもよい。一方、保険商品の指数平滑化モデルに対して制定する時間帯は1年であってもよく、該時間帯内の時間周期は月を単位としてもよい。
異なる指定の製品は、異なる指数係数に対応することができる。指数係数は、時間周期のユーザの好み度合に与える影響の重要性を反映することができる。指数係数が大きいほど、時間周期のユーザの好み度合に与える影響の重要性は高くなる。時間周期同士が近いほど、ユーザの好み度合に与える影響も大きくなる。
(ステップ206)
複数のユーザ識別子およびユーザ識別子の複数の時間周期内における指定の製品に対するユーザの好み度合値を取得する。
サーバの指数平滑化モデルに対して制定する時間帯には複数の時間周期が含まれており、サーバは複数のユーザ識別子およびユーザ識別子の複数の時間周期内における指定の製品に対するユーザの好み度合値を取得する。ここで、複数の時間周期内における指定の製品に対するユーザの好み度合値は、ユーザの一つの指定の製品に対するユーザの好み度合値であってもよく、ユーザの複数の指定の製品に対するユーザの好み度合値であってもよい。
(ステップ208)
指数平滑化モデルを利用してユーザの好み度合値に対して反復計算を行うことにより、時間周期に対応する平滑化結果を取得する。
サーバは、複数の時間周期に対応するユーザの好み度合値を指数平滑化モデルに入力し、複数の時間周期におけるユーザの好み度合値に対して反復計算を行うことにより、時間周期に対応する複数の平滑化結果を取得する。具体的には、サーバは製品識別子に基づいて指数平滑化モデルに対応する指数係数を取得する。サーバは、制定した時間帯における第1の時間周期に対応するユーザの好み度合値と指数係数とを乗算し、乗算した積を指数平滑化モデルの初期値とする。該初期値は、第1の時間周期に対応する平滑化結果とも称される。サーバは、第1の時間周期に対応する平滑化結果、第2の時間周期に対応するユーザの好み度合値、指数係数を指数平滑化モデルに入力して反復計算を行うことにより、第2の時間周期に対応する平滑化結果を取得する。同様にして、サーバは複数の時間周期に対応する平滑化結果を算出する。
指定の製品を製品1とし、時間周期を1日とし、指数平滑化モデルにおける指数係数を0.3とし、制定する時間帯を4日とし、現在5日目のユーザの好み度合値を予測しなければならないと想定する場合、まず指数平滑化モデルを利用して前4日間のユーザの好み度合値に対してそれぞれ反復計算を行わなければならず、取得した対応する平滑化結果は表1に示す通りである。
ここで、1日目の平滑化結果は0.3*8=2.4であり、2日目の平滑化結果は0.3*9+(1−0.3)*2.4=4.38であり、3日目の平滑化結果は0.3*5+(1−0.3)*4.38=4.566であり、4日目の平滑化結果は0.3*3+(1−0.3)*4.566=4.096である。このように、指数平滑化モデルを介して指定の製品のユーザの好み度合値と時間因子とを融合する。
(ステップ210)
ユーザ識別子および時間周期に対応する平滑化結果を利用して疏行列を生成し、疏行列には複数の予測待ちユーザの好み度合が含まれている。
サーバは、ユーザ識別子および時間周期に対応する平滑化結果を利用してユーザ識別子および製品識別子に対応する疎行列を生成する。疎行列には複数のユーザ識別子および一つの製品識別子が含まれてもよく、複数のユーザ識別子および複数の製品識別子が含まれてもよい。係数行列には既知のユーザの好み度合値および未知のユーザの好み度合値が含まれており、ここで、未知のユーザの好み度合値は予測待ちユーザの好み度合の予測値でもある。
疎行列において、予測待ちユーザの好み度合の予測値を予め設けた文字で表示することができる。例えば、「?」で表示することができる。例えば、以下の表2に示されるように、疎行列における行は製品識別子を示し、列はユーザ識別子を示し、疎行列における数値はユーザの製品に対するユーザの好み度合値を示す。
疎行列におけるユーザの好み度合値に時間周期に対応する平滑化結果を採用するため、疎行列も時間因子と効果的に融合される。次の時間周期内における未知のユーザの好み度合値を予測しなければならない場合、サーバは、現在の時間周期内における製品識別子、ユーザ識別子およびユーザの好み度合値の現在の時間周期における平滑化結果を取得することによりユーザ識別子と製品識別子に対応する疎行列を生成する。
(ステップ212)
協調フィルタリングモデルを取得し、時間周期に対応する平滑化結果を協調フィルタリングモデルに入力する。
(ステップ214)
協調フィルタリングモデルによってトレーニングを行い、疎行列における複数の予測待ちユーザの好み度合の予測値を算出する。
協調フィルタリングモデルは、従来の協調フィルタリングモデルを採用することができる。サーバは、協調フィルタリングモデルを取得し、時間周期に対応する平滑化結果を協調フィルタリングモデルに入力する。協調フィルタリングモデルによってトレーニングを行い、疎行列における複数の予測待ちユーザの好み度合の予測値を算出する。
具体的には、次の時間周期内における未知のユーザの好み度合値を予測する場合、サーバは複数のユーザ識別子の一つ前の時間周期における平滑化結果を取得し、一つ前の時間周期の平滑化処理結果を協調フィルタリングモデルに入力する。協調フィルタリングモデルによってトレーニングを行い、ユーザ識別子と製品識別子に対応する疎行列における予測待ちユーザの好み度合の次の時間周期における予測値を算出する。
本実施例において、指数平滑化モデルを作成することにより、複数の時間周期内におけるユーザの好み度合値に対して反復計算を行い、時間周期に対応する平滑化結果を取得し、よって指定の製品に対するユーザの好み度合値と時間因子とを効果的に融合させている。次の時間周期内における未知のユーザの好み度合値を予測する場合、ユーザ識別子および時間周期に対応する平滑化結果を利用して疎行列を生成し、時間周期に対応する平滑化結果を協調フィルタリングモデルに入力することができ、協調フィルタリングモデルによってトレーニングを行うことにより、疎行列における複数の予測待ちユーザの好み度合の予測値を算出する。協調フィルタリングモデルに入力された平滑化結果が時間因子と融合されたものであるため、指定の製品に対して時間因子に関連するユーザの好み度合値を予測することができる。従って、時間因子を結合して指定の製品に対するユーザの好み度合を効果的に予測することができる。
一実施例において、疎行列における複数の予測待ちユーザの好み度合の予測値を算出するステップの後に、さらに、ユーザの好み度合値に対応する次元を取得することと、ユーザ識別子に基づいて複数の次元のユーザの好み度合値を統計することと、統計結果に対して正則化処理を行い、ユーザ識別子に対応する多次元ベクトルを取得することと、多次元ベクトルに基づいてユーザ識別子同士の間のユーザの好み類似度を算出することと、を含む。
本実施例において、サーバは疎行列における複数の予測待ちユーザの好み度合に対して対応する予測値を算出した後、さらに、全ての既知のおよび予測したユーザの好み度合値に対して類似度を算出することによって、ユーザの好み度合が類似する複数のユーザ識別子を取得することができる。
サーバは、製品識別子をユーザの好み度合値に対応する次元とすることができる。異なる製品識別子は、異なる次元である。なお、ユーザの好み度合値を空間に散在する記録点と見なすことができる。空間が2次元空間である地図を例とする場合、図3に示すように、各記録点は経度と緯度によって表示されることができる。図3におけるX軸は緯度を表示し、Y軸は経度を表示することができる。ユーザ識別子1のユーザの好み度合値の図3における記録点を、黒色点にて表示し、ユーザ識別子2のユーザの好み度合値の図3における記録点を、灰色点にて表示すると想定する。ユーザ識別子1の記録点は4つであり、ユーザ識別子2の記録点は3つである。各記録点の経度と緯度が異なるため、類似度を直接比較することができない。経度の平均値と緯度の平均値により構成される平均値点を利用して比較する場合、平均値点は明らかにユーザの記録点から遠く離れており、実際のユーザの好み度合値を表現することができない。
ユーザの好み度合値を効果的に比較するため、サーバは全ての記録点をクラスタ化し、例えば、サーバはKMeansアルゴリズム(クラスタ化アルゴリズム)を採用してクラスタ化することにより複数の類を取得することができる。各類には、対応する次元がある。各類には、複数のユーザ識別子に対応するユーザの好み度合値の記録点が含まれている。
サーバは、ユーザ識別子に基づいて複数の次元のユーザの好み度合値を統計し、ユーザの好み度合値の統計結果を取得する。サーバは、統計結果に対して正則化処理を行い、ユーザ識別子に対応する多次元ベクトルを取得し、多次元ベクトルに基づいてユーザ識別子同士の間の類似距離を算出し、類似距離をユーザの好みの類似度とする。
図3におけるユーザ識別子1およびユーザ識別子2に対応する記録点を例として説明する。サーバは、図3における記録点をクラスタ化し、3つの次元を取得する。ここで、ユーザ識別子1は、第1次元において2つの記録点を有し、第2次元において1つの記録点を有し、第3次元において1つの記録点を有する。ユーザ識別子2は、第1次元において2つの記録点を有し、第2次元において1つの記録点を有し、第3次元において記録点を有しない。サーバにより統計されたユーザ識別子1に対応するユーザの好み度合値の記録点の総数は4つであり、ユーザ識別子2に対応するユーザの好み度合値の記録点の総数は3つである。サーバは、統計結果に対して正則化処理を行うことにより、ユーザ識別子1に対応する多次元ベクトル(2/4、1/4、1/4)およびユーザ識別子2に対応する多次元ベクトル(2/4、1/4、1/4)を取得する。多次元ベクトルに基づいてユーザ識別子1とユーザ識別子2との間の類似距離を算出し、該類似距離をユーザの好みの類似度とする。類似距離の計算方法は様々あり、例えば、ユークリッド距離の計算方法等を採用して類似距離を算出することができる。
ユーザ識別子同士のユーザの好みの類似度を算出することにより、大量のユーザからユーザの好みが類似しているユーザを効果的に抽出することができる。さらに、ユーザの好みが類似しているユーザに対してメッセージを推奨し、消費の傾向を予測することに便利である。
一実施例において、該方法は、さらに、製品識別子およびユーザ識別子に基づいてユーザの好み度合値に対応するポジティブサンプルとネガティブサンプルを取得することと、ネガティブサンプルを分解して、複数の分解後のネガティブサンプルを取得し、分解後のネガティブサンプル数とポジティブサンプル数との差は予め設けられる範囲内にあることと、分類モデルを取得し、ポジティブサンプルおよび分解後のネガティブサンプルを利用して分類モデルに対してトレーニングを行い、複数のトレーニングされた後の分類モデルを取得することと、複数のトレーニングされた後の分類モデルに対してフィッティングを行い、各トレーニングされた後の分類モデルに対応する分類重み付けを算出することと、を含む。
本実施例において、サーバは、さらに製品識別子およびユーザ識別子に基づいてユーザの好み度合値に対応するポジティブサンプルおよびネガティブサンプルを取得することができる。ポジティブサンプルはユーザがある製品を好むことを表示し、ネガティブサンプルはユーザがある製品を好まないことを表示する。例えば、ポジティブサンプルはユーザ1がiPhone7(携帯電話の一種)を好むことを示し、ネガティブサンプルはユーザ2がiPhone7を好まないことを示す。ユーザの好み度合値には、既知のユーザの好み度合値および予測されたユーザの好み度合値が含まれている。サーバは、既知のユーザの好み度合値を採用して分類トレーニング(disaggregated training)を行うことができ、既知のユーザの好み度合値と予測されたユーザの好み度合値を採用して分類トレーニングを行うこともできる。
ポジティブサンプルおよびネガティブサンプルをサンプルと総称することができる。サーバには対応するサンプルデータが予め記憶され、サンプルデータにはユーザ特徴データおよび製品特徴データが含まれており、ここで、ユーザ特徴データはユーザの年齢および性別などを含み、製品特徴データは製品識別子および製品類別などを含む。
通常、一つの新製品を発売する場合、該新製品を好むユーザの数は、該新製品を好まないユーザの数より遥かに少ない。従って、ユーザのある製品に対するポジティブサンプル数は、ネガティブサンプル数より少なくなる。
従来の分類トレーニング方式は主に2種類である。従来の方式1は、ネガティブサンプルにおいてアンダーサンプリング(under−sampling)を行うことにより、ポジティブサンプルの数に相当するネガティブサンプルを取得し、アンダーサンプリングされたネガティブサンプルおよびポジティブサンプルを利用して分類トレーニングを行うことである。但し、アンダーサンプリングされたネガティブサンプルはネガティブサンプルにおける少ない一部のデータだけであり、全てのサンプルデータを完全に利用していないため、分類モデルはそれほど正しくない。従来の方式2は、ポジティブサンプルをコピーすることによって、ポジティブサンプルの数をネガティブサンプルの数とほぼ同様にさせることである。従来の方式2において余計なサンプル情報を追加していないが、ネガティブサンプル数がポジティブサンプル数より遥かに大きいため、ポジティブサンプルがコピーされた後、計算を必要とするデータ量は激増し、サーバの計算負荷が重くなる。
従来の方式におけるサンプルデータが十分に利用されておらずおよびサンプルデータが全て採用された後にサーバの計算負荷が重くなる問題を効果的に解決するため、本実施例では新たな分類トレーニング方式を提供する。
具体的には、サーバは、製品識別子およびユーザ識別子に基づいてユーザの好み度合値に対応するポジティブサンプルおよびネガティブサンプルを取得する。サーバは、ポジティブサンプルの数に基づいてネガティブサンプルを分解する。分解後のネガティブサンプル数とポジティブサンプル数との差は、予め設けられた範囲内にある。分解後のネガティブサンプル数とポジティブサンプル数とは、等しいまたはほぼ等しい。サーバは、分類モデルを取得し、ここで、分類モデルは従来の分類モデルを採用することができる。サーバは、各分解後のネガティブサンプルおよびポジティブサンプルを分類モデルに入力してトレーニングさせることによって、分解後のネガティブサンプルと数が同じであるトレーニングされた後の分類モデルを取得する。
サーバは、回帰モデルを取得し、ここで、回帰モデルは従来の回帰モデルを採用することができ、複数のトレーニングされた後の分類モデルの出力結果を回帰モデルに入力し、回帰モデルによって複数のトレーニングされた後の分類モデルに対してフィッティングを行い、各トレーニングされた後の分類モデルに対応する分類重み付け(disaggregating weight)を算出する。全過程において、全てのサンプルデータを十分に利用しただけでなく、計算を必要とするデータも激増していないため、サーバの計算負荷を効果的に緩和している。
そのうちの一実施例において、各トレーニングされた後の分類モデルに対応する分類重み付けを算出するステップの後に、さらに、分類待ちサンプルデータを取得することと、トレーニングされた後の分類モデルおよび分類重み付けを利用して分類待ちサンプルデータを分類することとを含む。
サーバは、分類待ちサンプルデータを取得し、分類待ちサンプルデータをそれぞれトレーニングされた後の分類モデルに入力し、各トレーニングされた後の分類モデルおよび分類重み付けを利用して分類待ちサンプルデータを分類することができる。従って、分類待ちサンプルデータを迅速且つ効果的に分類することができる。
一実施例において、図4に示すように、サーバを提供し、内部バス(System Bus)を介して接続されるプロセッサ、内部メモリ、不揮発性記憶媒体およびネットワークインターフェースを含む。ここで、該サーバの不揮発性記憶媒体にはオペレーティングシステムおよびコンピュータで実行可能な命令が記憶されており、該コンピュータで実行可能な命令は、サーバに適する時間因子を融合させる協調フィルタリング方法を実現するために用いられる。プロセッサは、計算および制御能力を提供し、サーバ全体の動作をサポートする。ネットワークインターフェースは、ネットワークを介して外部の端末に接続され通信するために用いられる。サーバは、独立したサーバまたは複数のサーバにより構成されたサーバクラスタにより実現されることができる。当業者であれば、図4に示された構造は、本発明の技術的解決手段に関連する一部の構造を示したブロック図に過ぎず、本発明の技術的解決手段を適用可能なサーバを限定するものではないことを理解できる。具体的なサーバは、図示されるものよりさらに多いまたはさらに少ない部品を含み、あるいは幾つかの部品の組み合わせ、あるいは異なる部品配置を有することができる。
一実施例において、図5に示すように、時間因子を融合させる協調フィルタリング装置を提供し、
指数平滑化モデルを作成するモデル作成モジュール502と、
指数平滑化モデルに対して制定した時間帯を取得し、時間帯には複数の時間周期が含まれており、複数のユーザ識別子およびユーザ識別子の複数の時間周期内における指定の製品に対するユーザの好み度合値を取得する取得モジュール504と、
指数平滑化モデルを利用してユーザの好み度合値に対して反復計算を行うことにより、時間周期に対応する平滑化結果を取得する平滑化モジュール506と、
ユーザ識別子および時間周期に対応する平滑化結果を利用して疏行列を生成し、疏行列には複数の予測待ちユーザの好み度合が含まれている行列生成モジュール508と、
取得モジュール504は、さらに協調フィルタリングモデルの取得に用いられ、
時間周期に対応する平滑化結果を協調フィルタリングモデルに入力し、協調フィルタリングモデルによってトレーニングを行うことにより、疎行列における複数の予測待ちユーザの好み度合の予測値を算出する第1トレーニングモジュール510と、を含む。
一実施例において、平滑化モデルの計算式は、Pt+1=a*P+(1−a)*Pt−1を含み、ここで、aは製品識別子に対応する指数係数を示し、Pt+1は次の時間周期に対応するユーザの好み度合値を示し、Pは現在の時間周期に対応するユーザの好み度合値を示し、Pt−1は一つ前の時間周期に対応するユーザの好み度合値を示す。
一実施例において、取得モジュール504は、さらにユーザの好み度合値に対応する次元を取得するために用いられ、図5に示すように、該装置は、さらに、
ユーザ識別子に基づいて複数の次元のユーザの好み度合値を統計する統計モジュール512と、
統計結果に対して正則化処理を行い、ユーザ識別子に対応する多次元ベクトルを取得する正則化モジュール514と、
多次元ベクトルに基づいてユーザ識別子同士の間のユーザの好みの類似度を算出する類似度計算モジュール516と、を含む。
一実施例において、取得モジュール504は、さらに、製品識別子およびユーザ識別子に基づいてユーザの好み度合値に対応するポジティブサンプルおよびネガティブサンプルを取得し、図6に示すように、該装置は、さらに、
ネガティブサンプルを分解し、複数の分解後のネガティブサンプルを取得し、分解後のネガティブサンプル数と前記ポジティブサンプル数との差は予め設けられる範囲内にある分解モジュール518と、
取得モジュール504は、さらに、分類モデルの取得に用いられ、
ポジティブサンプルおよび分類後のネガティブサンプルを利用して分類モデルに対してトレーニングを行い、複数のトレーニングされた後の分類モデルを取得する第2トレーニングモジュール520と、
複数のトレーニングされた後の分類モデルに対してフィッティングを行い、各トレーニングされた後の分類モデルに対応する分類重み付けを算出するフィッティングモジュール522と、を含む。
一実施例において、取得モジュール504は、さらに分類待ちサンプルデータを取得するために用いられ、図7に示すように、該装置は、さらに、トレーニングされた後の分類モデルおよび分類重み付けを利用して分類待ちサンプルデータを分類する分類モデル524を含む。
上記時間因子を融合させる協調フィルタリング装置における各モジュールの全部または一部は、ソフトウェア、ハードウェアおよびその組み合わせによって実現されることができる。上記各モジュールは、プロセッサによって以上の各モジュールに対応する操作を呼び出して便利に実行するように、ハードウェアの形態で基地局のプロセッサに組み込まれまたは基地局のプロセッサから独立してもよく、ソフトウェアの形態で基地局のメモリに記憶されてもよい。ここで、プロセッサは、中央処理装置(CPU)またはマイクロプロセッサ等であってもよい。
一実施例において、1つまたは複数のコンピュータで実行可能な命令が記憶されている不揮発性読み取り可能な記憶媒体を提供し、上記コンピュータで実行可能な命令が1つまたは複数のプロセッサにより実行される場合、上記1つまたは複数のプロセッサは、
指数平滑化モデルを作成する手順と、
上記指数平滑化モデルに対して制定した時間帯を取得し、上記時間帯には複数の時間周期が含まれている手順と、
複数のユーザ識別子およびユーザ識別子の複数の時間周期内おけるに指定の製品に対するユーザの好み度合値を取得する手順と、
上記指数平滑化モデルを利用して上記ユーザの好み度合値に対して反復計算を行うことにより、時間周期に対応する平滑化結果を取得する手順と、
上記ユーザ識別子および上記時間周期に対応する平滑化結果を利用して疏行列を生成し、上記疏行列には複数の予測待ちユーザの好み度合が含まれている手順と、
協調フィルタリングモデルを取得し、上記時間周期に対応する平滑化結果を上記協調フィルタリングモデルに入力する手順と、
上記協調フィルタリングモデルによってトレーニングを行い、上記疎行列における複数の予測待ちユーザの好み度合の予測値を算出する手順と、を実行する。
一実施例において、上記平滑化モデルの計算式は、Pt+1=a*P+(1−a)*Pt−1を含み、ここで、aは製品識別子に対応する指数係数を示し、Pt+1は次の時間周期に対応するユーザの好み度合値を示し、Pは現在の時間周期に対応するユーザの好み度合値を示し、Pt−1は一つ前の時間周期に対応するユーザの好み度合値を示す。
一実施例において、上記疎行列における複数の予測待ちユーザの好み度合の予測値を算出する手順の後に、上記コンピュータで実行可能な命令が1つまたは複数のプロセッサにより実行される場合、さらに上記1つまたは複数のプロセッサは、ユーザの好み度合値に対応する次元を取得する手順と、ユーザ識別子に基づいて複数の次元のユーザの好み度合値を統計する手順と、統計結果に対して正則化処理を行い、ユーザ識別子に対応する多次元ベクトルを取得する手順と、上記多次元ベクトルに基づいてユーザ識別子同士の間のユーザの好み類似度を算出する手順と、を実行する。
一実施例において、上記コンピュータで実行可能な命令が1つまたは複数のプロセッサにより実行される場合、上記1つまたは複数のプロセッサは、さらに、製品識別子およびユーザ識別子に基づいてユーザの好み度合値に対応するポジティブサンプルおよびネガティブサンプルを取得する手順と、上記ネガティブサンプルを分解し、分解後の複数のネガティブサンプルを取得し、上記分解後のネガティブサンプル数と上記ポジティブサンプル数との差は予め設けられる範囲内にある手順と、分類モデルを取得し、上記ポジティブサンプルおよび上記分解後のネガティブサンプルを利用して上記分類モデルに対してトレーニングを行い、複数のトレーニングされた後の分類モデルを取得する手順と、上記複数のトレーニングされた後の分類モデルに対してフィッティングを行い、各トレーニングされた後の分類モデルに対応する分類重み付けを算出する手順と、を実行する。
一実施例において、上記各トレーニングされた後の分類モデルに対応する分類重み付けを算出する手順の後に、上記コンピュータで実行可能な命令が1つまたは複数のプロセッサにより実行される場合、上記1つまたは複数のプロセッサは、さらに、分類待ちサンプルデータを取得する手順と、上記トレーニングされた後の分類モデルおよび上記分類重み付けを利用して上記分類待ちサンプルデータを分類する手順と、を実行する。
当業者であれば、上記実施例の方法における全てまたは一部のプロセスを実現するには、コンピュータプログラムにより関連するハードウェアを命令して遂行することができ、当該プログラムは不揮発性コンピュータの読み取り可能な記憶媒体に記憶されることができ、該プログラムが実行される際に、上記のような各方法の実施例のプロセスを含むことができることを理解できる。ここで、記憶媒体には、磁気ディスク、光ディスク、読み出し専用メモリ(Read−Only Memory、ROM)などであってもよい。
上記実施例の各技術的特徴は任意に組み合わせることができ、説明を簡単にするために、上記実施例における各技術的特徴の全ての可能な組み合わせを説明していないが、こられの技術的特徴の組み合わせが矛盾しない限り、いずれも本説明書に記載の範囲であると見なされるべきである。
上記実施例は本発明の幾つかの実施形態を示したものに過ぎず、その説明が具体的且つ詳細であるが、これらが発明の特許請求の範囲を制限するものであると理解してはならない。当業者であれば、本発明の技術的思想から逸脱しない限り、さらにいくつかの変形や改良を行うことができ、これらはいずれも本発明の保護範囲に属することを理解すべきである。従って、本発明の特許の保護範囲は特許請求の範囲に準ずるべきである。
時間因子を融合させる協調フィルタリング方法であって、
指数平滑化モデルを作成することと、
前記指数平滑化モデルに対して制定した時間帯を取得し、前記時間帯には複数の時間周期が含まれていることと、
複数のユーザ識別子およびユーザ識別子の複数の時間周期内における指定の製品に対するユーザの好み度合値を取得することと、
前記指数平滑化モデルを利用して前記ユーザの好み度合値に対して反復計算を行うことにより、時間周期に対応する平滑化結果を取得することと、
前記ユーザ識別子および前記時間周期に対応する平滑化結果を利用して行列を生成し、前記行列には複数の予測待ちユーザの好み度合が含まれていることと、
協調フィルタリングモデルを取得し、前記時間周期に対応する平滑化結果を前記協調フィルタリングモデルに入力することと、
前記協調フィルタリングモデルによってトレーニングを行い、前記疎行列における複数の予測待ちユーザの好み度合の予測値を算出することと、を含む。
時間因子を融合させる協調フィルタリング装置であって、
指数平滑化モデルを作成するモデル作成モジュールと、
前記指数平滑化モデルに対して制定した時間帯を取得し、前記時間帯には複数の時間周期が含まれており、複数のユーザ識別子およびユーザ識別子の複数の時間周期内における指定の製品に対するユーザの好み度合値を取得する取得モジュールと、
前記指数平滑化モデルを利用して前記ユーザの好み度合値に対して反復計算を行うことにより、時間周期に対応する平滑化結果を取得する平滑化モジュールと、
前記ユーザ識別子および前記時間周期に対応する平滑化結果を利用して行列を生成し、前記行列には複数の予測待ちユーザの好み度合が含まれている行列生成モジュールと、
前記取得モジュールは、さらに協調フィルタリングモデルの取得に用いられ、
前記時間周期に対応する平滑化結果を前記協調フィルタリングモデルに入力し、前記協調フィルタリングモデルによってトレーニングを行い、前記疎行列における複数の予測待ちユーザの好み度合の予測値を算出する第1トレーニングモジュールと、
を含む。
コンピュータで実行可能な命令が記憶されているメモリおよびプロセッサを含むサーバであって、前記コンピュータで実行可能な命令が前記プロセッサにより実行される場合、前記プロセッサは、
指数平滑化モデルを作成する手順と、
前記指数平滑化モデルに対して制定した時間帯を取得し、前記時間帯には複数の時間周期が含まれている手順と、
複数のユーザ識別子およびユーザ識別子の複数の時間周期内における指定の製品に対するユーザの好み度合値を取得する手順と、
前記指数平滑化モデルを利用して前記ユーザの好み度合値に対して反復計算を行うことにより、時間周期に対応する平滑化結果を取得する手順と、
前記ユーザ識別子および前記時間周期に対応する平滑化結果を利用して行列を生成し、前記行列には複数の予測待ちユーザの好み度合が含まれている手順と、
協調フィルタリングモデルを取得し、前記時間周期に対応する平滑化結果を前記協調フィルタリングモデルに入力する手順と、
前記協調フィルタリングモデルによってトレーニングを行い、前記疎行列における複数の予測待ちユーザの好み度合の予測値を算出する手順と、を実行する。
1つまたは複数のコンピュータで実行可能な命令が記憶されている不揮発性読み取り可能な記憶媒体であって、前記コンピュータで実行可能な命令が1つまたは複数のプロセッサにより実行される場合、前記1つまたは複数のプロセッサは、
指数平滑化モデルを作成する手順と、
前記指数平滑化モデルに対して制定した時間帯を取得し、前記時間帯には複数の時間周期が含まれている手順と、
複数のユーザ識別子およびユーザ識別子の複数の時間周期内における指定の製品に対するユーザの好み度合値を取得する手順と、
前記指数平滑化モデルを利用して前記ユーザの好み度合値に対して反復計算を行うことにより、時間周期に対応する平滑化結果を取得する手順と、
前記ユーザ識別子および前記時間周期に対応する平滑化結果を利用して行列を生成し、前記行列には複数の予測待ちユーザの好み度合が含まれている手順と、
協調フィルタリングモデルを取得し、前記時間周期に対応する平滑化結果を前記協調フィルタリングモデルに入力する手順と、
前記協調フィルタリングモデルによってトレーニングを行い、前記疎行列における複数の予測待ちユーザの好み度合の予測値を算出する手順と、を実行する。
本発明の実施例により提供される時間因子を融合させる協調フィルタリング方法は、図1に示すようなシーンに応用することができる。端末102とサーバ104とはネットワークを介して接続されている。端末102は、複数有しても良い。端末102にはサーバにアクセス可能なアプリケーションがインストールされており、ユーザが該アプリケーションによってサーバ104にアクセスする場合、サーバ104は端末102に対して対応するページ画面を返す。ユーザは、ページ画面に表示された製品に対してクリック、お気に入りに格納および購買等を行うことができる。ユーザが端末102を介して操作する場合、サーバ104はユーザ識別子および上記ユーザ行為を収集することができる。サーバ104は、予め設けた時間周期内において、指定の製品に対してユーザ行為を収集することによってユーザの好み度合値を取得する。サーバ104は、指数平滑化モデルを作成する。サーバ104は、指数平滑化モデルに対して対応する時間帯を制定することができ、時間帯内には複数の時間周期があっても良い。サーバ104は、複数のユーザ識別子およびユーザ識別子の複数の時間周期内における指定の製品に対するユーザの好み度合値を取得する。サーバ104は、複数の時間周期に対応するユーザの好み度合値を指数平滑化モデルに入力し、複数の時間周期におけるユーザの好み度合値に対して反復計算(iterative computation)を行うことにより、時間周期に対応する複数の平滑化結果を取得する。サーバ104は、ユーザ識別子および時間周期に対応する平滑化結果を利用してユーザ識別子および製品識別子に対応する行列を生成し、行列には複数の予測待ちユーザの好み度合が含まれている。サーバ104は、協調フィルタリングモデルを取得し、時間周期に対応する平滑化結果を協調フィルタリングモデルに入力する。協調フィルタリングモデルによってトレーニングを行い、疎行列における複数の予測待ちユーザの好み度合の予測値を算出する。
(ステップ210)
ユーザ識別子および時間周期に対応する平滑化結果を利用して行列を生成し、行列
には複数の予測待ちユーザの好み度合が含まれている。
一実施例において、図5に示すように、時間因子を融合させる協調フィルタリング装置を提供し、
指数平滑化モデルを作成するモデル作成モジュール502と、
指数平滑化モデルに対して制定した時間帯を取得し、時間帯には複数の時間周期が含まれており、複数のユーザ識別子およびユーザ識別子の複数の時間周期内における指定の製品に対するユーザの好み度合値を取得する取得モジュール504と、
指数平滑化モデルを利用してユーザの好み度合値に対して反復計算を行うことにより、時間周期に対応する平滑化結果を取得する平滑化モジュール506と、
ユーザ識別子および時間周期に対応する平滑化結果を利用して行列を生成し、行列には複数の予測待ちユーザの好み度合が含まれている行列生成モジュール508と、
取得モジュール504は、さらに協調フィルタリングモデルの取得に用いられ、
時間周期に対応する平滑化結果を協調フィルタリングモデルに入力し、協調フィルタリングモデルによってトレーニングを行うことにより、疎行列における複数の予測待ちユーザの好み度合の予測値を算出する第1トレーニングモジュール510と、を含む。
一実施例において、取得モジュール504は、さらに、製品識別子およびユーザ識別子に基づいてユーザの好み度合値に対応するポジティブサンプルおよびネガティブサンプルを取得し、図6に示すように、該装置は、さらに、
ネガティブサンプルを分解し、複数の分解後のネガティブサンプルを取得し、分解後のネガティブサンプル数と前記ポジティブサンプル数との差は予め設けられる範囲内にある分解モジュール518と、
取得モジュール504は、さらに、分類モデルの取得に用いられ、
ポジティブサンプルおよび分後のネガティブサンプルを利用して分類モデルに対してトレーニングを行い、複数のトレーニングされた後の分類モデルを取得する第2トレーニングモジュール520と、
複数のトレーニングされた後の分類モデルに対してフィッティングを行い、各トレーニングされた後の分類モデルに対応する分類重み付けを算出するフィッティングモジュール522と、を含む。
一実施例において、1つまたは複数のコンピュータで実行可能な命令が記憶されている不揮発性読み取り可能な記憶媒体を提供し、上記コンピュータで実行可能な命令が1つまたは複数のプロセッサにより実行される場合、上記1つまたは複数のプロセッサは、
指数平滑化モデルを作成する手順と、
上記指数平滑化モデルに対して制定した時間帯を取得し、上記時間帯には複数の時間周期が含まれている手順と、
複数のユーザ識別子およびユーザ識別子の複数の時間周期内おけるに指定の製品に対するユーザの好み度合値を取得する手順と、
上記指数平滑化モデルを利用して上記ユーザの好み度合値に対して反復計算を行うことにより、時間周期に対応する平滑化結果を取得する手順と、
上記ユーザ識別子および上記時間周期に対応する平滑化結果を利用して行列を生成し、上記行列には複数の予測待ちユーザの好み度合が含まれている手順と、
協調フィルタリングモデルを取得し、上記時間周期に対応する平滑化結果を上記協調フィルタリングモデルに入力する手順と、
上記協調フィルタリングモデルによってトレーニングを行い、上記疎行列における複数の予測待ちユーザの好み度合の予測値を算出する手順と、を実行する。

Claims (20)

  1. 時間因子を融合させる協調フィルタリング方法であって、
    指数平滑化モデルを作成することと、
    前記指数平滑化モデルに対して制定した時間帯を取得し、前記時間帯には複数の時間周期が含まれていることと、
    複数のユーザ識別子およびユーザ識別子の複数の時間周期内における指定の製品に対するユーザの好み度合値を取得することと、
    前記指数平滑化モデルを利用して前記ユーザの好み度合値に対して反復計算を行うことにより、時間周期に対応する平滑化結果を取得することと、
    前記ユーザ識別子および前記時間周期に対応する平滑化結果を利用して疏行列を生成し、前記疏行列には複数の予測待ちユーザの好み度合が含まれていることと、
    協調フィルタリングモデルを取得し、前記時間周期に対応する平滑化結果を前記協調フィルタリングモデルに入力することと、
    前記協調フィルタリングモデルによってトレーニングを行い、前記疎行列における複数の予測待ちユーザの好み度合の予測値を算出することと、
    を含む、ことを特徴とする時間因子を融合させる協調フィルタリング方法。
  2. 前記平滑化モデルの計算式は、Pt+1=a*P+(1−a)*Pt−1を含み、ここで、aは製品識別子に対応する指数係数を示し、Pt+1は次の時間周期に対応するユーザの好み度合値を示し、Pは現在の時間周期に対応するユーザの好み度合値を示し、Pt−1は一つ前の時間周期に対応するユーザの好み度合値を示す、ことを特徴とする請求項1に記載の方法。
  3. 前記疎行列における複数の予測待ちユーザの好み度合の予測値を算出した後、前記方法は、
    ユーザの好み度合値に対応する次元を取得することと、
    ユーザ識別子に基づいて複数の次元のユーザの好み度合値を統計することと、
    統計結果に対して正則化処理を行い、ユーザ識別子に対応する多次元ベクトルを取得することと、
    前記多次元ベクトルに基づいてユーザ識別子同士の間のユーザの好みの類似度を算出することと、
    をさらに含む、ことを特徴とする請求項1に記載の方法。
  4. 製品識別子およびユーザ識別子に基づいてユーザの好み度合値に対応するポジティブサンプルおよびネガティブサンプルを取得することと、
    前記ネガティブサンプルを分解し、複数の分解後のネガティブサンプルを取得し、前記分解後のネガティブサンプル数と前記ポジティブサンプル数との差は予め設けられる範囲内にあることと、
    分類モデルを取得し、前記ポジティブサンプルおよび前記分類後のネガティブサンプルを利用して前記分類モデルに対してトレーニングを行い、複数のトレーニングされた後の分類モデルを取得することと、
    前記複数のトレーニングされた後の分類モデルに対してフィッティングを行い、各トレーニングされた後の分類モデルに対応する分類重み付けを算出することと、
    をさらに含む、ことを特徴とする請求項1に記載の方法。
  5. 前記各トレーニングされた後の分類モデルに対応する分類重み付けを算出した後、前記方法は、
    分類待ちサンプルデータを取得することと、
    前記トレーニングされた後の分類モデルおよび前記分類重み付けを利用して前記分類待ちサンプルデータを分類することと、
    をさらに含む、ことを特徴とする請求項4に記載の方法。
  6. 時間因子を融合させる協調フィルタリング装置であって、
    指数平滑化モデルを作成するモデル作成モジュールと、
    前記指数平滑化モデルに対して制定した時間帯を取得し、前記時間帯には複数の時間周期が含まれており、複数のユーザ識別子およびユーザ識別子の複数の時間周期内における指定の製品に対するユーザの好み度合値を取得する取得モジュールと、
    前記指数平滑化モデルを利用して前記ユーザの好み度合値に対して反復計算を行うことにより、時間周期に対応する平滑化結果を取得する平滑化モジュールと、
    前記ユーザ識別子および前記時間周期に対応する平滑化結果を利用して疏行列を生成し、前記疏行列には複数の予測待ちユーザの好み度合が含まれている行列生成モジュールと、
    前記取得モジュールは、さらに協調フィルタリングモデルの取得に用いられ、
    前記時間周期に対応する平滑化結果を前記協調フィルタリングモデルに入力し、前記協調フィルタリングモデルによってトレーニングを行い、前記疎行列における複数の予測待ちユーザの好み度合の予測値を算出する第1トレーニングモジュールと、
    を含む、ことを特徴とする時間因子を融合させる協調フィルタリング装置。
  7. 前記平滑化モデルの計算式は、Pt+1=a*P+(1−a)*Pt−1を含み、ここで、aは製品識別子に対応する指数係数を示し、Pt+1は次の時間周期に対応するユーザの好み度合値を示し、Pは現在の時間周期に対応するユーザの好み度合値を示し、Pt−1は一つ前の時間周期に対応するユーザの好み度合値を示す、ことを特徴とする請求項6に記載の装置。
  8. 前記取得モジュールは、さらにユーザの好み度合値に対応する次元を取得し、
    前記装置は、
    ユーザ識別子に基づいて複数の次元のユーザの好み度合値を統計する統計モジュールと、
    統計結果に対して正則化処理を行い、ユーザ識別子に対応する多次元ベクトルを取得する正則化モジュールと、
    前記多次元ベクトルに基づいてユーザ識別子同士の間のユーザの好みの類似度を算出する類似度計算モジュールと、
    をさらに含む、ことを特徴とする請求項6に記載の装置。
  9. 前記取得モジュールは、さらに製品識別子およびユーザ識別子に基づいてユーザの好み度合値に対応するポジティブサンプルおよびネガティブサンプルを取得し、
    前記装置は、
    前記ネガティブサンプルを分解し、複数の分解後のネガティブサンプルを取得し、前記分解後のネガティブサンプル数と前記ポジティブサンプル数との差は予め設けられる範囲内にある分解モジュールと、
    前記取得モジュールは、さらに分類モデルを取得し、
    前記ポジティブサンプルおよび前記分類後のネガティブサンプルを利用して前記分類モデルに対してトレーニングを行い、複数のトレーニングされた後の分類モデルを取得する第2トレーニングモジュールと、
    前記複数のトレーニングされた後の分類モデルに対してフィッティングを行い、各トレーニングされた後の分類モデルに対応する分類重み付けを算出するフィッティングモジュールと、
    をさらに含む、ことを特徴とする請求項6に記載の装置。
  10. 前記取得モジュールは、さらに分類待ちサンプルデータを取得し、
    前記装置は、
    前記トレーニングされた後の分類モデルおよび前記分類重み付けを利用して前記分類待ちサンプルデータを分類する分類モジュールと、
    をさらに含む、ことを特徴とする請求項9に記載の装置。
  11. コンピュータで実行可能な命令が記憶されているメモリおよびプロセッサを含むサーバであって、
    前記コンピュータで実行可能な命令が前記プロセッサにより実行される場合、前記プロセッサは、
    指数平滑化モデルを作成する手順と、
    前記指数平滑化モデルに対して制定した時間帯を取得し、前記時間帯には複数の時間周期が含まれている手順と、
    複数のユーザ識別子およびユーザ識別子の複数の時間周期内における指定の製品に対するユーザの好み度合値を取得する手順と、
    前記指数平滑化モデルを利用して前記ユーザの好み度合値に対して反復計算を行うことにより、時間周期に対応する平滑化結果を取得する手順と、
    前記ユーザ識別子および前記時間周期に対応する平滑化結果を利用して疏行列を生成し、前記疏行列には複数の予測待ちユーザの好み度合が含まれている手順と、
    協調フィルタリングモデルを取得し、前記時間周期に対応する平滑化結果を前記協調フィルタリングモデルに入力する手順と、
    前記協調フィルタリングモデルによってトレーニングを行い、前記疎行列における複数の予測待ちユーザの好み度合の予測値を算出する手順と、
    を実行する、ことを特徴とするサーバ。
  12. 前記平滑化モデルの計算式は、Pt+1=a*P+(1−a)*Pt−1を含み、ここで、aは製品識別子に対応する指数係数を示し、Pt+1は次の時間周期に対応するユーザの好み度合値を示し、Pは現在の時間周期に対応するユーザの好み度合値を示し、Pt−1は一つ前の時間周期に対応するユーザの好み度合値を示す、ことを特徴とする請求項11に記載のサーバ。
  13. 前記疎行列における複数の予測待ちユーザの好み度合の予測値を算出する手順の後に、前記プロセッサは、さらに、
    ユーザの好み度合値に対応する次元を取得する手順と、
    ユーザ識別子に基づいて複数の次元のユーザの好み度合値を統計する手順と、
    統計結果に対して正則化処理を行い、ユーザ識別子に対応する多次元ベクトルを取得する手順と、
    前記多次元ベクトルに基づいてユーザ識別子同士の間のユーザの好みの類似度を算出する手順と、
    を実行する、ことを特徴とする請求項11に記載のサーバ。
  14. 前記プロセッサは、さらに、
    製品識別子およびユーザ識別子に基づいてユーザの好み度合値に対応するポジティブサンプルおよびネガティブサンプルを取得する手順と、
    前記ネガティブサンプルを分解し、複数の分解後のネガティブサンプルを取得し、前記分解後のネガティブサンプル数と前記ポジティブサンプル数との差は予め設けられる範囲内にある手順と、
    分類モデルを取得し、前記ポジティブサンプルおよび前記分類後のネガティブサンプルを利用して前記分類モデルに対してトレーニングを行い、複数のトレーニングされた後の分類モデルを取得する手順と、
    前記複数のトレーニングされた後の分類モデルに対してフィッティングを行い、各トレーニングされた後の分類モデルに対応する分類重み付けを算出する手順と、
    を実行する、ことを特徴とする請求項11に記載のサーバ。
  15. 前記各トレーニングされた後の分類モデルに対応する分類重み付けを算出する手順の後に、前記プロセッサは、さらに、
    分類待ちサンプルデータを取得する手順と、
    前記トレーニングされた後の分類モデルおよび前記分類重み付けを利用して前記分類待ちサンプルデータを分類する手順と、
    を実行する、ことを特徴とする請求項14に記載のサーバ。
  16. 1つまたは複数のコンピュータで実行可能な命令が記憶されている不揮発性読み取り可能な記憶媒体であって、
    前記コンピュータで実行可能な命令が1つまたは複数のプロセッサにより実行される場合、前記1つまたは複数のプロセッサは、
    指数平滑化モデルを作成する手順と、
    前記指数平滑化モデルに対して制定した時間帯を取得し、前記時間帯には複数の時間周期が含まれている手順と、
    複数のユーザ識別子およびユーザ識別子の複数の時間周期内における指定の製品に対するユーザの好み度合値を取得する手順と、
    前記指数平滑化モデルを利用して前記ユーザの好み度合値に対して反復計算を行うことにより、時間周期に対応する平滑化結果を取得する手順と、
    前記ユーザ識別子および前記時間周期に対応する平滑化結果を利用して疏行列を生成し、前記疏行列には複数の予測待ちユーザの好み度合が含まれている手順と、
    協調フィルタリングモデルを取得し、前記時間周期に対応する平滑化結果を前記協調フィルタリングモデルに入力する手順と、
    前記協調フィルタリングモデルによってトレーニングを行い、前記疎行列における複数の予測待ちユーザの好み度合の予測値を算出する手順と、
    を実行する、ことを特徴とするサーバ。
  17. 前記平滑化モデルの計算式は、Pt+1=a*P+(1−a)*Pt−1を含み、ここで、aは製品識別子に対応する指数係数を示し、Pt+1は次の時間周期に対応するユーザの好み度合値を示し、Pは現在の時間周期に対応するユーザの好み度合値を示し、Pt−1は一つ前の時間周期に対応するユーザの好み度合値を示す、ことを特徴とする請求項16に記載の不揮発性読み取り可能な記憶媒体。
  18. 前記疎行列における複数の予測待ちユーザの好み度合の予測値を算出する手順の後に、前記コンピュータで実行可能な命令が1つまたは複数のプロセッサにより実行される場合、前記1つまたは複数のプロセッサは、さらに、
    ユーザの好み度合値に対応する次元を取得する手順と、
    ユーザ識別子に基づいて複数の次元のユーザの好み度合値を統計する手順と、
    統計結果に対して正則化処理を行い、ユーザ識別子に対応する多次元ベクトルを取得する手順と、
    前記多次元ベクトルに基づいてユーザ識別子同士の間のユーザの好みの類似度を算出する手順と、
    を実行する、ことを特徴とする請求項16に記載の不揮発性読み取り可能な記憶媒体。
  19. 前記コンピュータで実行可能な命令が1つまたは複数のプロセッサにより実行される場合、前記1つまたは複数のプロセッサは、さらに、
    製品識別子およびユーザ識別子に基づいてユーザの好み度合値に対応するポジティブサンプルおよびネガティブサンプルを取得する手順と、
    前記ネガティブサンプルを分解し、複数の分解後のネガティブサンプルを取得し、前記分解後のネガティブサンプル数と前記ポジティブサンプル数との差は予め設けられる範囲内にある手順と、
    分類モデルを取得し、前記ポジティブサンプルおよび前記分類後のネガティブサンプルを利用して前記分類モデルに対してトレーニングを行い、複数のトレーニングされた後の分類モデルを取得する手順と、
    前記複数のトレーニングされた後の分類モデルに対してフィッティングを行い、各トレーニングされた後の分類モデルに対応する分類重み付けを算出する手順と、
    を実行する、ことを特徴とする請求項16に記載の不揮発性読み取り可能な記憶媒体。
  20. 前記各トレーニングされた後の分類モデルに対応する分類重み付けを算出する手順の後に、前記コンピュータで実行可能な命令が1つまたは複数のプロセッサにより実行される場合、前記1つまたは複数のプロセッサは、さらに、
    分類待ちサンプルデータを取得する手順と、
    前記トレーニングされた後の分類モデルおよび前記分類重み付けを利用して前記分類待ちサンプルデータを分類する手順と、
    を実行する、ことを特徴とする請求項19に記載の不揮発性読み取り可能な記憶媒体。
JP2017566628A 2016-11-15 2017-04-06 時間因子を融合させる協調フィルタリング方法、装置、サーバおよび記憶媒体 Active JP6484730B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201611005200.1A CN106530010B (zh) 2016-11-15 2016-11-15 融合时间因素的协同过滤方法和装置
CN201611005200.1 2016-11-15
PCT/CN2017/079565 WO2018090545A1 (zh) 2016-11-15 2017-04-06 融合时间因素的协同过滤方法、装置、服务器和存储介质

Publications (2)

Publication Number Publication Date
JP6484730B2 JP6484730B2 (ja) 2019-03-13
JP2019507398A true JP2019507398A (ja) 2019-03-14

Family

ID=58353220

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017566628A Active JP6484730B2 (ja) 2016-11-15 2017-04-06 時間因子を融合させる協調フィルタリング方法、装置、サーバおよび記憶媒体

Country Status (9)

Country Link
US (1) US10565525B2 (ja)
EP (1) EP3543941A4 (ja)
JP (1) JP6484730B2 (ja)
KR (1) KR102251302B1 (ja)
CN (1) CN106530010B (ja)
AU (2) AU2017101862A4 (ja)
SG (1) SG11201709930TA (ja)
TW (1) TWI658420B (ja)
WO (1) WO2018090545A1 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110378731B (zh) * 2016-04-29 2021-04-20 腾讯科技(深圳)有限公司 获取用户画像的方法、装置、服务器及存储介质
CN106530010B (zh) * 2016-11-15 2017-12-12 平安科技(深圳)有限公司 融合时间因素的协同过滤方法和装置
CN107633254A (zh) * 2017-07-25 2018-01-26 平安科技(深圳)有限公司 建立预测模型的装置、方法及计算机可读存储介质
CN109060332A (zh) * 2018-08-13 2018-12-21 重庆工商大学 一种基于协同过滤融合进行声波信号分析的机械设备诊断法
CN109800359B (zh) * 2018-12-20 2021-08-17 北京百度网讯科技有限公司 信息推荐处理方法、装置、电子设备及可读存储介质
US10984461B2 (en) * 2018-12-26 2021-04-20 Paypal, Inc. System and method for making content-based recommendations using a user profile likelihood model
CN111582895A (zh) * 2019-02-15 2020-08-25 北京京东尚科信息技术有限公司 产品性别偏好的预测方法、系统、设备和存储介质
CN110580311B (zh) * 2019-06-21 2023-08-01 东华大学 动态时间感知协同过滤方法
CN110458664B (zh) * 2019-08-06 2021-02-02 上海新共赢信息科技有限公司 一种用户出行信息预测方法、装置、设备及存储介质
CN110992127B (zh) * 2019-11-14 2023-09-29 北京沃东天骏信息技术有限公司 一种物品推荐方法及装置
CN111209977B (zh) * 2020-01-16 2024-01-05 北京百度网讯科技有限公司 分类模型的训练和使用方法、装置、设备和介质
CN111178986B (zh) * 2020-02-18 2023-04-07 电子科技大学 用户-商品偏好的预测方法及系统
CN111652741B (zh) * 2020-04-30 2023-06-09 中国平安财产保险股份有限公司 用户偏好分析方法、装置及可读存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103473354A (zh) * 2013-09-25 2013-12-25 焦点科技股份有限公司 基于电子商务平台的保险推荐系统框架及保险推荐方法
JP2014002562A (ja) * 2012-06-18 2014-01-09 Nippon Telegr & Teleph Corp <Ntt> アイテム利用促進装置、アイテム利用促進装置の動作方法およびコンピュータプログラム
US20140279727A1 (en) * 2013-03-15 2014-09-18 William Marsh Rice University Sparse Factor Analysis for Analysis of User Content Preferences
US20140280251A1 (en) * 2013-03-15 2014-09-18 Yahoo! Inc. Almost online large scale collaborative filtering based recommendation system
CN104166668A (zh) * 2014-06-09 2014-11-26 南京邮电大学 基于folfm模型的新闻推荐系统及方法
JP2016505951A (ja) * 2012-12-17 2016-02-25 アマデウス エス.アー.エス.Amadeus S.A.S. インタラクティブ検索フォーム用の推奨エンジン

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1346299A1 (en) * 2000-10-18 2003-09-24 Johnson &amp; Johnson Consumer Companies, Inc. Intelligent performance-based product recommendation system
US8392228B2 (en) * 2010-03-24 2013-03-05 One Network Enterprises, Inc. Computer program product and method for sales forecasting and adjusting a sales forecast
US8380726B2 (en) * 2006-03-06 2013-02-19 Veveo, Inc. Methods and systems for selecting and presenting content based on a comparison of preference signatures from multiple users
CN103235823A (zh) * 2013-05-06 2013-08-07 上海河广信息科技有限公司 根据相关网页和当前行为确定用户当前兴趣的方法和系统
US9684656B2 (en) 2013-07-31 2017-06-20 Google Inc. Creating personalized and continuous playlists for a content sharing platform based on user history
CN104021163B (zh) * 2014-05-28 2017-10-24 深圳市盛讯达科技股份有限公司 产品推荐系统及方法
KR101658714B1 (ko) * 2014-12-22 2016-09-21 연세대학교 산학협력단 온라인 활동 이력에 기초한 사용자의 온라인 활동 예측 방법 및 시스템
CN105205128B (zh) * 2015-09-14 2018-08-28 清华大学 基于评分特征的时序推荐方法及推荐装置
CN106960354A (zh) * 2016-01-11 2017-07-18 中国移动通信集团河北有限公司 一种基于客户生命周期的精准化推荐方法及装置
CN105975483B (zh) * 2016-04-25 2020-02-14 北京三快在线科技有限公司 一种基于用户偏好的消息推送方法和平台
CN106530010B (zh) * 2016-11-15 2017-12-12 平安科技(深圳)有限公司 融合时间因素的协同过滤方法和装置
CN107194754A (zh) * 2017-04-11 2017-09-22 美林数据技术股份有限公司 基于混合协同过滤的券商产品推荐方法
CN107169052B (zh) * 2017-04-26 2019-03-05 北京小度信息科技有限公司 推荐方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014002562A (ja) * 2012-06-18 2014-01-09 Nippon Telegr & Teleph Corp <Ntt> アイテム利用促進装置、アイテム利用促進装置の動作方法およびコンピュータプログラム
JP2016505951A (ja) * 2012-12-17 2016-02-25 アマデウス エス.アー.エス.Amadeus S.A.S. インタラクティブ検索フォーム用の推奨エンジン
US20140279727A1 (en) * 2013-03-15 2014-09-18 William Marsh Rice University Sparse Factor Analysis for Analysis of User Content Preferences
US20140280251A1 (en) * 2013-03-15 2014-09-18 Yahoo! Inc. Almost online large scale collaborative filtering based recommendation system
CN103473354A (zh) * 2013-09-25 2013-12-25 焦点科技股份有限公司 基于电子商务平台的保险推荐系统框架及保险推荐方法
CN104166668A (zh) * 2014-06-09 2014-11-26 南京邮电大学 基于folfm模型的新闻推荐系统及方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
原 隆: "商品のレコメンド機能を刷新 買い忘れ指摘し売上げ1割増", 日経コンピュータ, JPN6018043807, 12 November 2015 (2015-11-12), JP, pages 58 - 61, ISSN: 0003914625 *
関根 琴美: "季節性を考慮した協調フィルタリング", 2014年秋季研究発表会アブストラクト集 (第34回企業事例交流会), JPN6018043805, 24 August 2014 (2014-08-24), pages 228 - 229, ISSN: 0003914624 *

Also Published As

Publication number Publication date
KR102251302B1 (ko) 2021-05-13
JP6484730B2 (ja) 2019-03-13
CN106530010A (zh) 2017-03-22
KR20190084866A (ko) 2019-07-17
US10565525B2 (en) 2020-02-18
AU2017101862A4 (en) 2019-10-31
US20180300648A1 (en) 2018-10-18
WO2018090545A1 (zh) 2018-05-24
EP3543941A4 (en) 2020-07-29
SG11201709930TA (en) 2018-06-28
TWI658420B (zh) 2019-05-01
TW201820231A (zh) 2018-06-01
EP3543941A1 (en) 2019-09-25
AU2017268629A1 (en) 2018-05-31
CN106530010B (zh) 2017-12-12

Similar Documents

Publication Publication Date Title
JP6484730B2 (ja) 時間因子を融合させる協調フィルタリング方法、装置、サーバおよび記憶媒体
US20250028736A1 (en) Systems and methods for combining data analyses
CN107358247B (zh) 一种确定流失用户的方法及装置
Chen et al. Exploiting Web service geographical neighborhood for collaborative QoS prediction
CN111046237B (zh) 用户行为数据处理方法、装置、电子设备及可读介质
CN104077723B (zh) 一种社交网络推荐系统及方法
CN111931053A (zh) 一种基于聚类和矩阵分解的事项推送方法和装置
CN114118192A (zh) 用户预测模型的训练方法、预测方法、装置及存储介质
WO2022148186A1 (zh) 行为序列数据处理方法及装置
WO2019061664A1 (zh) 电子装置、基于用户上网数据的产品推荐方法及存储介质
CN108052670A (zh) 一种相机特效的推荐方法及装置
CN113065880A (zh) 群体不满意用户识别方法、装置、设备及存储介质
CN110503482B (zh) 一种物品处理方法、装置、终端及存储介质
CN114118388B (zh) 面向用户隐私保护的异构网络图链接预测方法及相关设备
CN113705822A (zh) 一种自动建模方法、系统、计算设备及存储介质
CN117421462B (zh) 一种数据处理方法、装置及电子设备
CN116127183A (zh) 业务推荐方法、装置、计算机设备和存储介质
Mallik The Parallel Fuzzy C-Median Clustering Algorithm Using the Spark for the Big Data
Vlasic et al. Modeling stochastic anomalies in an SIS system
CN117573387A (zh) 消息推送方法、装置、计算机设备和存储介质
CN118672555A (zh) 任务流创建方法、装置、计算机设备和可读存储介质
CN117391490A (zh) 金融业务的评价信息处理方法、装置和计算机设备
CN118353791A (zh) 资源交互等级的输出方法、装置、计算机设备、可读存储介质
CN116501993A (zh) 房源数据推荐方法及装置
CN117634751A (zh) 数据要素评估方法、装置、计算机设备以及存储介质

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190124

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190205

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190218

R150 Certificate of patent or registration of utility model

Ref document number: 6484730

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250