JP7312780B2 - オンライン予測モデルのトレーニング方法、装置、電子デバイス、コンピュータ可読記憶媒体及びコンピュータプログラム - Google Patents

オンライン予測モデルのトレーニング方法、装置、電子デバイス、コンピュータ可読記憶媒体及びコンピュータプログラム Download PDF

Info

Publication number
JP7312780B2
JP7312780B2 JP2021056033A JP2021056033A JP7312780B2 JP 7312780 B2 JP7312780 B2 JP 7312780B2 JP 2021056033 A JP2021056033 A JP 2021056033A JP 2021056033 A JP2021056033 A JP 2021056033A JP 7312780 B2 JP7312780 B2 JP 7312780B2
Authority
JP
Japan
Prior art keywords
online
offline
model
features
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021056033A
Other languages
English (en)
Other versions
JP2022023776A (ja
Inventor
リウ・ハオチョン
リー・ユエン
シエ・グオビン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Publication of JP2022023776A publication Critical patent/JP2022023776A/ja
Application granted granted Critical
Publication of JP7312780B2 publication Critical patent/JP7312780B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0255Targeted advertisements based on user history
    • G06Q30/0256User search
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0269Targeted advertisements based on user profile or attribute
    • G06Q30/0271Personalized advertisement
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0277Online advertisement
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0282Rating or review of business operators or products
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/535Tracking the activity of the user
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Evolutionary Computation (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Medical Informatics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computer Hardware Design (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Description

本願は、コンピュータ技術分野に関し、具体的には,機械学習の技術分野に関し、特にオンライン予測モデルのトレーニング方法、装置、電子デバイス、コンピュータ可読記憶媒体及びコンピュータプログラムに関する。
リコメンドシステムは、電子取引サイトを利用してユーザに物品情報及びアドバイスを提供し、ユーザがどのような製品を購入すべきかを決定するようにサポートするものであり、販売者をシミュレーションしてクライアントが購入手続きを完了することに寄与する。個性化リコメンドは、ユーザの興味の特点や購入行動に応じて、ユーザが興味を持った情報や商品をユーザにリコメンドすることである。
従来のリコメンドシステムは、固定リコメンドアルゴリズムに基づいて、ユーザオンラインリアルタイム行動を考慮せず、かつ、異なるチャネルの特徴に対して個性化処理を行わないことにより、リコメンドモデルの汎化能力が制限され、リコメンドシステムの応答率やクリック率が低減される。
本願の実施例は、オンライン予測モデルのトレーニング方法、装置、電子デバイス、コンピュータ可読記憶媒体及びコンピュータプログラムを提供する。
第1態様によれば、オンライン予測モデルのトレーニング方法を提供しており、該方法は、ユーザのユーザ肖像画特徴を含むオフラインサンプル特徴と、オンラインサンプル特徴とを取得するステップと、ユーザのオフラインサンプル特徴とオンラインサンプル特徴に基づいて、オフライントレーニングしてオフラインリコメンドモデルを取得するステップと、ユーザの最新オンライン特徴を取得し、且つユーザの前記最新オンライン特徴に基づいて、オンライントレーニングしてオンライン学習モデルを取得するステップと、前記オフラインリコメンドモデルをオンラインに同期し、前記オンライン学習モデルによって出力された前記最新オンライン特徴を前記オフラインリコメンドモデルに入力し、オンライン予測モデルを生成するステップと、を含み、前記オンライン学習モデルは、前記最新オンライン特徴をオンラインサンプル特徴としてトレーニング済みのオフラインリコメンドモデルに入力されることに適応させることに用いられる。
第2態様によれば、オンライン予測モデルのトレーニング装置を提供しており、該装置は、ユーザのユーザ肖像画特徴を含むオフラインサンプル特徴と、オンラインサンプル特徴とを取得するように構成される取得ユニットと、ユーザのオフラインサンプル特徴とオンラインサンプル特徴に基づいて、オフライントレーニングしてオフラインリコメンドモデルを取得するように構成されるオフライントレーニングユニットと、ユーザの最新オンライン特徴を取得し、且つユーザの前記最新オンライン特徴に基づいて、オンライントレーニングしてオンライン学習モデルを取得するように構成されるオンライントレーニングユニットと、前記オフラインリコメンドモデルをオンラインに同期し、前記オンライン学習モデルによって出力された前記最新オンライン特徴を前記オフラインリコメンドモデルに入力し、オンライン予測モデルを生成するように構成されるモデル生成ユニットと、を備え、前記オンライン学習モデルは、前記最新オンライン特徴をオンラインサンプル特徴としてトレーニング済みのオフラインリコメンドモデルに入力されることに適応させることに用いられる。
第3態様によれば、本願の実施例は電子デバイスを提供しており、該電子デバイスは、少なくとも1つのプロセッサと、少なくとも1つのプロセッサと通信接続されるメモリと、を備え、メモリは、少なくとも1つのプロセッサによって実行可能な命令を記憶し、少なくとも1つのプロセッサが第1の態様のいずれかの実施形態に記載の方法を実行できるように、命令が前記少なくとも1つのプロセッサに実行される。
第4態様によれば、本願の実施例は、コンピュータ命令を記憶する非一時的なコンピュータ可読記憶媒体を提供しており、コンピュータ命令は、コンピュータに第1の態様のいずれかの実施形態に記載の方法を実行させる。
第5態様によれば、本願の実施例は、コンピュータプログラムを提供しており、当該コンピュータプログラムは、プロセッサにより実行されると、第1の態様のいずれかの実施形態に記載の方法を実行させる。
本願の実施例によるオンライン予測モデルのトレーニング方法、装置、デバイス及び記憶媒体は、まず、ユーザ肖像画特徴を含むユーザのオフラインサンプル特徴とオンラインサンプル特徴を取得し、次に、ユーザのオフラインサンプル特徴とオンラインサンプル特徴に基づいて、オフライントレーニングしてオフラインリコメンドモデルを取得し、さらに、ユーザの最新オンライン特徴を取得し、且つユーザの前記最新オンライン特徴に基づいて、オンライントレーニングしてオンライン学習モデルを取得し、前記オンライン学習モデルは、前記最新オンライン特徴をオンラインサンプル特徴としてトレーニング済みのオフラインリコメンドモデルに入力されることに適応させることに用いられ、その後、前記オフラインリコメンドモデルをオンラインに同期し、前記オンライン学習モデルによって出力された前記最新オンライン特徴を前記オフラインリコメンドモデルに入力し、オンライン予測モデルを生成する。それによりユーザのオンラインサンプルデータを用いてオンライン予測モデルを最適化し、リコメンドモデルフィッティング効果と汎化効果を向上させ、クラウドコンピューティングシーンに適用可能であるがこれらに限定されるものではない。
なお、この部分で説明する内容は、本開示の実施例の肝心なまたは重要な特徴を特定することを意図するものではなく、本開示の範囲を限定することを意図するものでもない。本開示の他の特徴は以下の明細書を通じて容易に理解される。
図面は、本解決手段をより良く理解するためのものであり、本願を限定するものではない。
本願の適用可能で例示的なシステムアーキテクチャの図である。 本願によるオンライン予測モデルのトレーニング方法の一実施例のフロ概略図である。 XGBboostモデルに従ってオフラインリコメンドモデルをトレーニングする一実施例の方法概略図である。 Wide&Deepモデルに従ってオフラインリコメンドモデルをトレーニングする一実施例の方法概略図である。 本願によるオンライン予測モデルのトレーニング方法の適用シーン概略図である。 本願によるオンライン予測モデルのトレーニング装置の一実施例の構成概略図である。 本願の実施例のオンライン予測モデルのトレーニング方法を実現する電子デバイスのブロック図である。
以下、図面を参照して、本願の例示的な実施例を説明し、理解に役に立つように、本願の実施例の様々な詳細を含み、単に例示的なものと見なされる。従って、当業者は、本願の範囲と精神から逸脱せずに、ここで説明する実施例に様々な変更と修正を加えることができることを認識すべきである。同様に、明確かつ簡潔にするために、以下の説明では、既知の機能と構造の説明を省略する。
図1は、本願のオンライン予測モデルのトレーニング方法またはオンライン予測モデルのトレーニング装置を適用できる実施例の例示的なシステムアーキテクチャ100を示す。
図1に示すように、システムアーキテクチャ100は、記憶デバイス101、ネットワーク102とサーバー103を備えてもよい。ネットワーク102は、記憶デバイス101とサーバー103との間の通信リンクの媒体を提供するために使用される。ネットワーク102有線、無線通信リンク、または光ファイバケーブルなどの様々な接続タイプを含んでもよい。
記憶デバイス101はネットワーク102を介してサーバー103とインタラクティブする。ネットワーク102はオフ状態である場合、サーバー103は記憶デバイス101によって発行された命令を直接実行できる。記憶デバイス101は、ユーザ端末、データライブラリなどを含むがこれらに限定されないオフラインリコメンドモデル、ユーザオフラインデータなどを提供できる。ネットワーク102はオフ状態である場合、サーバー103は、ユーザのユーザ肖像画特徴を含むオフラインサンプル特徴とオンラインサンプル特徴を取得するステップと、ユーザのオフラインサンプル特徴とオンラインサンプル特徴に基づいて、オフライントレーニングしてオフラインリコメンドモデルを取得するステップと、を含むトレーニングオフラインリコメンドモデルのステップを実行できる。
サーバー103は様々なサービスを提供できる、例えばサーバー103はネットワーク102を介して記憶デバイス101からユーザのオンラインデータを取得することができる。サーバー103は、さらに、記憶デバイス101から取得されたオフラインリコメンドモデル及びネットワーク102を介して記憶デバイス101から取得されたユーザオンラインデータなどに対して、総合分析など処理を行い、処理結果を生成する(例えばオンライン予測モデルを生成する)。
なお、サーバー103は、ハードウェアであってもよいし、ソフトウェアであってもよい。サーバー103はハードウェアである場合、それは、複数のサーバーからなる分散サーバークラスターとして実装されてもよいし、単一のサーバーとして実装されてもよい。サーバーはソフトウェアである場合、それは、複数のソフトウェアまたはソフトウェアモジュール(例えば分散サービスを提供するため)として、または単一のソフトウェアまたはソフトウェアモジュールとして実装されてもよい。ここでは、具体的には限定しない。
なお、本願の実施例によるオンライン予測モデルのトレーニング方法は、一般的にサーバー103により実行され、それに対応して、オンライン予測モデルのトレーニング装置は、一般的にサーバー103に設けられる。
なお、図1の記憶デバイス、ネットワークとサーバーの数は、単なる例示であることを理解されるべきであり、実装のニーズに応じて、任意の数の記憶デバイス、ネットワークとサーバーを備えてもよい。サーバー103には、オフラインリコメンドモデル、ユーザオフラインデータが記憶される場合、システムアーキテクチャ100には、記憶デバイス101とネットワーク102が設けられなくてもよい。
図2をさらに参照して、それは、本願によるオンライン予測モデルのトレーニング方法の一実施例のプロ200を示す。該オンライン予測モデルのトレーニング方法は、次のステップを含み、
ステップ201、ユーザのオフラインサンプル特徴とオンラインサンプル特徴を取得する。
本実施例では、ユーザのオフラインラインサンプル特徴は、ユーザがネットワークに繋がらず状態である場合、ユーザのオフラインラインサンプルに対して処理を行って取得された特徴を指すが、ユーザのオンラインサンプル特徴は、ユーザがネットワークに繋がる状態で取得されたユーザオンラインサンプルをユーザのオフラインサンプルとして同期した後、ユーザがネットワークに繋がらず状態である場合、同期されたユーザのオフラインサンプルに対して処理を行って取得された特徴を指す。ここでは、ユーザオンラインサンプルをユーザのオフラインサンプルとして同期するのは、ネットワークまたはデータ同期システムに基づいてユーザのあるオンラインサンプルがユーザのオフライン状態で依然として使用できることを指す。例示的には、ユーザのオンラインサンプルをローカルデバイスにコピーできる。ここでは、ユーザのオンラインサンプルは、オンライン状態でのユーザのオペレーション行動であってもよく、例えばユーザがネットワークで「中華風しゃぶしゃぶ」検索すると、今回ユーザが検索したキーワードをオンラインサンプルとしてもよい。
ここでは、ユーザのオフラインサンプル特徴またはオンラインサンプル特徴は、ユーザ肖像画特徴を含むがこれに限定されない。実行主体(例えば、図1中のネットワーク102がオフ状態であるサーバー103)は、ユーザオフラインサンプルに対して処理を行うことで、該オフラインサンプルの特徴を取得することができる。例示的には、上記の実行主体は、機械学習の特徴プロセスを用いてユーザオフラインサンプルを、コンピュータが処理できる特徴に変換することができる。ここでは、ユーザオフラインサンプルは、ユーザ肖像画などを含むがこれらに限定されなく、ここでは、ユーザ肖像画は、ユーザの性別、ユーザの年齢、ユーザの収入、ユーザのネットサーフィン回数、ユーザの検索回数、ユーザの検索キーワード、ユーザがクリックしたサイトのアドレス、ユーザの興味タグ、ユーザのAPPリストなどを含むがこれらに限定されない。
ステップ202、ユーザのオフラインサンプル特徴とオンラインサンプル特徴に基づいて、オフライントレーニングしてオフラインリコメンドモデルを取得する。
本実施例では、取得されたユーザのオフラインサンプル特徴をトレーニングサンプルセットとする。オフラインリコメンドモデルは、機械学習方法とトレーニングサンプルセットを利用して従来の機械学習モデルをトレーニングして取得されてもよく、例示的には、「XGBboost+ロジスティック回帰器」モデルまたはWide&Deepモデルを採用してもよい。エクストリーム勾配ブースティング(Extreme Gradient Boosting、XGBboost)は、ツリーの拡張可能性を向上する機械学習システムであり、XGBboostモデルはツリーの統合モデルである。Wide&Deepモデルは、Wideレイヤー/モデルとDeepレイヤー/モデルを備え、Wideモデルは一般化線形モデル(Wide Linear Model)であり、Deepモデルはディープニューラルネットワーク(Deep Netural Network)である。
本実施例では、オフラインサンプル特徴をXGBboostモデルまたはWide&DeepモデルのDeepレイヤーに入力してトレーニングし、XGBboostモデルまたはDeepモデルのパラメーターを調整することができ、例えば勾配降下法、逆伝搬法などによりパラメーターを調整する。例示的には、オフラインリコメンドモデルは「XGBboost+ロジスティック回帰器」モデルを採用すると、オフラインリコメンドモデルのトレーニングプロセスは以下のとおりであり、オフラインサンプル特徴をXGBboost入力して特徴組み合わせコードし、オンラインサンプル特徴を特徴コードし、オンラインサンプル特徴は、特徴コード化された後にXGBboostによって出力されたオフラインサンプル特徴の組み合わせコードとスティッチングし、スティッチングされたコードをロジスティック回帰器に入力して予測トレーニングする。例示的には、オフラインリコメンドモデルはWide&Deepモデルを採用すると、オフラインリコメンドモデルのトレーニングプロセスは以下のとおりであり、オフラインサンプル特徴をDeepレイヤーに入力してオンラインサンプル特徴に対して特徴プロセス処理を行い、オンラインサンプル特徴は特徴プロセスを経てWideレイヤーに直接入力され、Wideレイヤーの出力とDeepレイヤーの出力をスティッチングしてロジスティック回帰器に入力して予測トレーニングする。
本実施例では、オフラインリコメンドモデルは、ユーザのクリック率(Click-Through-Rate)またはリコメンドソートを出力することができる。好ましくは、オフラインリコメンドモデルによって出力されたクリック率またはリコメンドソートと実際クリック率またはリコメンドソートとの間に基づいて1つの損失を計算し、その損失に従って勾配降下法を使用してオフラインリコメンドモデルパラメーターを反復して最適化することで、トレーニングによって取得されたオフラインリコメンドモデルの出力結果をより正確にする。
本実施例では、オフラインサンプル特徴は比較的安定しているため、オフラインサンプル特徴によってトレーニングされたXGBboostモデルまたはDeepモデルも比較的安定しており、トレーニング済みのXGBboostモデルまたはDeepモデルを使用するとき、モデルパラメーターを調整する必要がなければ使用できる。
ステップ203、ユーザの最新オンライン特徴を取得し、且つユーザの最新オンライン特徴に基づいて、オンライントレーニングしてオンライン学習モデルを取得する。
本実施例では、ユーザの最新オンライン特徴は、ユーザが、ネットワークユーザがネットワークに繋がるオンライン状態で取得されたユーザ現在オンラインサンプルに対して処理を行って取得された特徴を指す。例示的には、ユーザの現在オンラインサンプルはユーザの現在リアルタイムオペレーション行動(ユーザのオンラインリアルタイム行動データ)を分析して取得され、例えば、ユーザの現在のリアルタイムオペレーション行動は、ユーザの現在検索しているキーワード、ユーザの現在クリックしているサイトアドレス、広告表示状況に関するユーザのフィードバックなどを含む。オンライン学習モデルは、機械学習方法と最新オンライン特徴を用いて従来の機械学習モデルをトレーニングしてオンライン学習モデルを取得する。好ましくは、最新オンライン特徴をオフライン特徴ライブラリに同期してもよく、そのオフライン特徴ライブラリにはオフラインサンプル特徴が記憶される。オフライン特徴ライブラリを同期するのは、ネットワークまたはデータ同期システムに基づいて最新オンライン特徴をオフライン特徴ライブラリにコピーすることを指す。同期された最新オンライン特徴はオンラインサンプル特徴として続いてオフラインリコメンドモデルをオフライントレーニングし、それによりユーザオンラインリアルタイム行動データを十分に利用してモデルを微調整し、モデルの汎化効果を向上させる。
ステップ204、オフラインリコメンドモデルをオンラインに同期し、且つオンライン学習モデルによって出力された最新オンライン特徴をオフラインリコメンドモデルに入力し、オンライン予測モデルを生成する。
本実施例では、オフラインリコメンドモデルをオンラインに同期するのは、ネットワークまたはデータ同期システムに基づいて、トレーニング済みのオフラインリコメンドモデルとオンラインのリコメンドモデルと一致させることを指し、すなわちトレーニング済みのオフラインリコメンドモデルをオンラインリコメンドモデルに変換する。その後、オンライン学習モデルによって出力された最新オンライン特徴をオフラインリコメンドモデル/オンラインリコメンドモデルに入力して予測トレーニングし、オンライン予測モデルを生成する。好ましくは、「XGBboost+ロジスティック回帰器」オフラインリコメンドモデルを採用する場合、オンライン機械学習アルゴリズム(FTRL)でユーザの最新オンライン特徴を調整することにより、最新オンライン特徴をオンラインサンプル特徴として特徴コードすることに適応させ、さらにユーザの最新オンライン特徴への微調整を実現し、あるいは、Wide&Deepオフラインリコメンドモデルを採用する場合、Wideレイヤーパラメーターを調整することにより、最新オンライン特徴をオンラインサンプル特徴としてWideレイヤーに入力させ、さらにユーザの最新オンライン特徴への微調整を実現する。この好ましい実施例では、「XGBboost+ロジスティック回帰器」またはWide&Deepオフラインリコメンドモデルでオンライン学習するとき、モデルの既存パラメーターを調整する必要く、ユーザの最新オンライン特徴のみへ微調整すれば、オンライン予測モデルのトレーニングを完成し、それにより、ユーザオンラインリアルタイム行動データを十分に利用してモデルを微調整し、モデルの汎化効果を向上させる。
本願の実施例は、従来技術と比較して、オンライン予測モデルの生成アルゴリズムをオフライン学習、オンライン学習の2部分に分け、ユーザオンラインのオンラインリアルタイム行動データを使用してオンライン予測モデルを最適化し、モデルフィッティング効果を向上させる。
図3をさらに参照して、それは、XGBboostモデルに従ってオフラインリコメンドモデルをトレーニングする一実施例の方法を示す概略図である。
本実施例では、XGBboostモデルで決定ツリーモデルを基底分類器とし、2つのツリー(構成ツリー1と構成ツリー2)を使用して、ここでは、モデルの入力はユーザのオフラインサンプル特徴であり、各特徴データを、まず第1のツリー(構成ツリー1)で分類し、最終的に一つのリーフノードに落とし、その得られたリーフノードの値が第1ツリーの出力値であり、その後、第2のツリー(構成ツリー2)を使用して同様のオペレーションを行い、最後に全てのツリーの出力値を加算する。ユーザのオンラインサンプル特徴は特徴コードされた後に全てのツリーの出力値を加算し、最後に加算結果をロジスティック回帰器(logic Regression)に入力して予測トレーニングを行う。
本実施例を採用して、オフラインリコメンドモデルでオンライン学習するとき、XGBboostモデルは予めトレーニング済みで、モデルパラメーターを更新する必要がなく、ユーザの最新オンライン特徴パラメーターのみへオンライン微調整すればよく、それによりユーザオンラインリアルタイム行動データを十分に利用してモデルを微調整し、モデルの汎化効果を向上させる。
図4をさらに参照して、それは、Wide&Deepモデルに従ってオフラインリコメンドモデルをトレーニングする一実施例の方法を示す概略図である。
本実施例では、Wide&Deepモデルを使用して、ここでは、モデルのDeepレイヤー(例えばDNN)入力はユーザのオフラインサンプル特徴であり、モデルのWideレイヤー入力はユーザのオンラインサンプル特徴である。Wideレイヤーは線形モデルに対応し、入力特徴は連続特徴であってもよく、スパース離散特徴であってもよい。DeepレイヤーはDNNモデルに対応し、特徴のそれぞれは1つの低次元の実数ベクトルに対応し、これは特徴のembeddingと呼ばれる。DNNモデルは逆伝搬を介して隠れレイヤーの重みを調整し、特徴のembeddingを更新する。Wide&Deepモデル全体の出力は線形出力とDNNモデル出力とのオーバーレイである。WideレイヤーとDeepレイヤーは得意なことに焦点を当てるだけでよく、Wideレイヤーは離散特徴のクロス組み合わせによって記憶され、Deepレイヤーは特徴のembeddingによって汎化され、単一のモデルのサイズと複雑さも制御でき、モデル全体のパフォーマンスを向上させる。
本実施例では、ユーザのオフラインサンプル特徴は、連続型特徴と離散型特徴を含み、連続型特徴については、embeddingを行う必要がなく、離散型オフラインサンプル特徴(例えば高次元スパース特徴)にていては、先にembeddingを行う必要がある。図4に示すように、連続型オフラインサンプル特徴にていては、横方向スティッチングを直接行うことができるが、離散型オフラインサンプル特徴にていては、先にembeddingを行い、さらに連続型オフラインサンプル特徴と横方向スティッチングする。例示的には、連続型オフラインサンプル特徴は、年齢、収入、ネットサーフィン回数、検索回数などを含み、離散型オフラインサンプル特徴は、検索キーワード、クリックしたサイトのID、興味タグ、APPリストなどを含む。連続型オフラインサンプル特徴と離散型オフラインサンプル特徴(embeddingした後)に対して横方向スティッチングを行って2000次元のベクトルを形成した後、スティッチングの特徴ベクトルを三層全結合層DNNと活性化関数に入力し、最後にDeepレイヤーの出力値をロジスティック回帰器に入力して予測トレーニングする。ユーザのオンラインサンプル特徴はWideレイヤーに入力され、オンラインサンプル特徴は特徴プロセスを経てロジスティック回帰器に入力され予測トレーニングされる。
本実施例を採用して、オフラインリコメンドモデルでオンライン学習するとき、Wide&DeepモデルのDeepレイヤーは予めトレーニング済みで、Deepレイヤーパラメーターを更新する必要がなく、Wideレイヤーパラメーターを微調整し、ユーザの最新オンライン特徴をWideレイヤーに入力すればよく、それによりユーザオンラインリアルタイム行動データを十分に利用してモデルを微調整し、モデルの汎化効果を向上させる。
図5をさらに参照して、それは、本願によるオンライン予測モデルのトレーニング方法を示す適用シーン概略図である。
本実施例では、マーケティング領域の個性化リコメンドシステムのアーキテクチャを示す。そのリコメンドシステムは、オンライン学習、オフライン学習の2部分を含む。そのシステムは、ユーザのオンラインリアルタイム行動によりユーザオンラインデータを取得し、ここでは、ユーザのオンラインリアルタイム行動は、ユーザのクリック行動及び広告表示状況を含む。ユーザのオンラインデータは、ユーザのオンラインサンプルを含み、オンラインサンプルに対して分析処理を行うことでユーザのオンラインサンプル特徴を取得する。データ同期サービスによりユーザのオンラインサンプル特徴をユーザのオフラインデータに同期し、それをユーザのオンラインサンプル特徴としてオフラインリコメンドモデルをトレーニングすることができる。ユーザのオフラインデータは、ユーザのオフラインサンプルを含み、オフラインサンプルに対して分析処理を行うことでユーザのオフラインサンプル特徴を取得する。ユーザのオフラインサンプルは主にユーザ肖像画などを含む。オフライン学習はユーザオフラインデータ(ユーザオフラインデータに同期されたユーザオフンインサンプル特徴を含む)に基づいて、オフラインリコメンドモデルをトレーニングする。オンライン学習するとき、トレーニング済みのオフラインリコメンドモデルをオンライン(モデル同期サービスにより)に同期し、同時に、システムは、ユーザの最新オンラインリアルタイム行動を取得し、最新のオンラインリアルタイム行動からユーザの最新オンライン特徴を抽出し、ここでは、そのユーザの最新オンライン特徴もユーザのオンラインデータに属し、ユーザの最新オンライン特徴に基づいてトレーニングし、オンライン学習モデルを取得する。トレーニング済みのオンライン学習モデルは、オフラインリコメンドモデルを最適化し、モデルのフィッティング効果を向上させることに用いられる。最適化されたオフラインリコメンドモデルはすなわちオンライン予測モデルであり、そのモデルはリコメンドシステムの業務プロセスのリコメンドソートとクリック率推定を活発化させる。ユーザのそのリコメンドシステムでのクリック行動と広告表示状況を新たなユーザオンラインサンプルとすることができ、それにより、ユーザオンラインリアルタイム行動データは、継続的にオンラインモデルを最適化することに用いられる。そのリコメンドシステムは、従来リコメンドエンジンと比較して、応答率及びクリック率に顕著な向上がある。
さらに図6を参照して、上記の各図に示される方法の実施として、本願は、オンライン予測モデルのトレーニング装置の一実施例を提供し、その装置実施例は図2に示される方法実施例に対応し、その装置は、具体的には、様々電子デバイスに適用することができる。
図6に示すように、本実施例のオンライン予測モデルのトレーニング装置は、ユーザのユーザ肖像画特徴を含むオフラインサンプル特徴と、オンラインサンプル特徴とを取得するように構成される取得ユニット601と、ユーザのオフラインサンプル特徴とオンラインサンプル特徴に基づいて、オフライントレーニングしてオフラインリコメンドモデルを取得するように構成されるオフライントレーニングユニット602と、ユーザの最新オンライン特徴を取得し、且つユーザの最新オンライン特徴に基づいて、オンライントレーニングしてオンライン学習モデルを取得するように構成されるオンライントレーニングユニット603と、オフラインリコメンドモデルをオンラインに同期し、オンライン学習モデルによって出力された最新オンライン特徴をオフラインリコメンドモデルに入力し、オンライン予測モデルを生成するように構成されるモデル生成ユニット604と、を備え、オンライン学習モデルは、前記最新オンライン特徴をオンラインサンプル特徴としてトレーニング済みのオフラインリコメンドモデルに入力されることに適応させることに用いられる。
本実施例では、オンライン予測モデルのトレーニング装置において、取得ユニット601、オフライントレーニングユニット602、オンライントレーニングユニット603、モデル生成ユニット604の具体的な処理及びその技術効果はそれぞれ図2に対応する実施例のステップ201~204の関連説明を参照でき、ここでは繰り返し説明しない。
本実施例のいくつの選択可能な実施形態では、前記オフラインリコメンドモデルは、XGBboostモデルまたはWide&Deepモデルを備える。
本実施例のいくつの選択可能な実施形態では、前記装置は、さらに、ユーザの前記最新オンライン特徴またはオンラインサンプル特徴を、ユーザの前記オフラインサンプル特徴を記憶するオフライン特徴ライブラリに同期するように構成されるデータ同期ユニットを備える。
本実施例のいくつの選択可能な実施形態では、前記装置は、さらに、ユーザオンラインオペレーション行動を含むユーザオンラインリアルタイム行動に従って、ユーザのオンラインサンプル特徴を決定するように構成されるオンラインサンプル特徴生成ユニットを備える。
本実施例のいくつの選択可能な実施形態では、前記装置は、さらに、前記オンライン予測モデルの出力に従ってリコメンドシステムのリコメンドソートまたはクリック率推定を決定するように構成される結果出力ユニットを備える。
本実施例のいくつの選択可能な実施形態では、前記オフラインリコメンドモデルはXGBboostモデルであり、前記オフライントレーニングユニットは、さらに、前記オフラインサンプル特徴をXGBboostに入力し、前記オフラインサンプル特徴の特徴コードを生成し、前記オンラインサンプル特徴を特徴コードし、且つ前記オンラインサンプル特徴の特徴コードとオフラインサンプル特徴の組み合わせコードをスティッチングし、スティッチング結果をロジスティック回帰器に入力して予測トレーニングし、トレーニング済みのオフラインリコメンドモデルを取得するように構成される。
本実施例のいくつの選択可能な実施形態では、前記オンライントレーニングユニットは、さらに、オンライン機械学習アルゴリズム(FTRL)で前記最新オンライン特徴を調整することにより、前記最新オンライン特徴をオンラインサンプル特徴として特徴コードすることに適応させるように構成される。
本実施例のいくつの選択可能な実施形態では、前記オフラインリコメンドモデルはWide&Deepモデルであり、前記オフライントレーニングユニットは、さらに、ユーザの前記オフラインサンプル特徴をDeepレイヤーに入力し、特徴プロセスを経た前記オンラインサンプル特徴をWideレイヤーに入力し、Deepレイヤー特徴とスティッチングされたWideレイヤー特徴をロジスティック回帰器に入力して予測トレーニングし、トレーニング済みのオフラインリコメンドモデルを取得するように構成される。
本実施例のいくつの選択可能な実施形態では、前記オンライントレーニングユニットは、さらに、Wideレイヤーパラメーターを調整することにより、前記最新オンライン特徴をオンラインサンプル特徴としてWideレイヤーに入力されることに適応させるように構成される。
本願の実施例によれば、さらに、本願は電子デバイスと読み取り可能な記憶媒体を提供する。
図7に示すように、本願の実施例によるオンライン予測モデルのトレーニング方法の電子デバイスのブロック図である。電子デバイスは、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、パーソナルデジタルアシスタント、サーバー、ブレードサーバー、メインフレーム、その他の適切なコンピュータなどのさまざまな態様のデジタルコンピュータを表すことを目的とする。電子デバイスは、パーソナルデジタル処理、セルラー方式の携帯電話、スマートフォン、ウェアラブルデバイス、及び他の類似するコンピューティング装置などのさまざまな態様のモバイル装置を表すこともできる。本文に示されるコンポーネント、それらの接続及び関係、ならびにそれらの機能は、単なる例であり、本文に記載されるおよび/または主張される本願の実現を限定することを意図しない。
図7に示すように、該電子デバイスは、1つまたは複数のプロセッサ701、メモリ702、及び高速インターフェース及び低速インターフェースを備える各コンポーネントを接続するためのインターフェースを備える。各コンポーネントは、異なるバスで相互に接続されており、共通のマザーボードにインストールしてもよいし、必要に応じて、他の方法でインストールしてもよい。プロセッサは、GUIのグラフィック情報を外部入/出力装置(インターフェースに結合されたディスプレイデバイスなど)に表示できるように、メモリ内またはメモリ上に記憶された命令を含む電子デバイスで実行された命令を処理でき、他の実施例では、必要とすれば、複数のプロセッサおよび/または複数のバスを、複数のメモリ及び複数のメモリと共に使用することができる。同様に、複数の電子デバイスを接続でき、各デバイスはいくつかの必要なオペレーティングを提供する(例えば、サーバーアレイ、ブレードサーバーグループ、またはマルチプロセッサシステムとする)。図7では、1つのプロセッサ701を例にする。
メモリ702は、すなわち、本願による非一時的なコンピュータ可読記憶媒体である。ただし、前記メモリは、少なくとも1つのプロセッサによって実行可能な命令を記憶するので、前記少なくとも1つのプロセッサに本願によるオンライン予測モデルのトレーニング方法を実行させる。本願の非一時的なコンピュータ可読記憶媒体は、コンピュータに本願によるオンライン予測モデルのトレーニング方法を実行させるためのコンピュータ命令を記憶する。
メモリ702は非一時的なコンピュータ可読記憶媒体として、非一時的なソフトウェアプログラム、非一時的なコンピュータによって実行可能なプログラム、及びモジュールを記憶することに用いられ、例えば、本願の実施例のオンライン予測モデルのトレーニング方法に対応するプログラム命令/モジュール(例えば、図6に示される取得ユニット601、オフライントレーニングユニット602、オンライントレーニングユニット603とモデル生成ユニット604)プロセッサ701は、メモリ702に記憶された非一時的なソフトウェアプログラム、命令及びモジュールを実行することによって、サーバーの様々な機能アプリケーション及びデータ処理を実行し、すなわち、上記の方法実施例のオンライン予測モデルのトレーニング方法を実現する。
メモリ702は、記憶プログラム領域と記憶データ領域を含んでもよく、ただし、記憶プログラム領域は、オペレーティングシステム、少なくとも1つの機能に必要なアプリケーションプログラムを記憶してもよく、記憶データ領域は、オンライン予測モデルのトレーニング方法の電子デバイスの使用のため、作成されたデータなどを記憶することができ、また、メモリ702は、高速ランダムアクセスメモリを含んでもよく、さらに非一時的なメモリを含んでもよく、例えば、少なくとも1つの磁気ディスク記憶デバイス、フラッシュメモリデバイス、または他の非一時的なソリッドステートストレージデバイスなどの非一時的なメモリを含んでもよく、いくつかの実施例では、メモリ702は、プロセッサ701に対してリモートで設定されたメモリを選択してもよく、これらのリモートメモリは、ネットワークを介してオンライン予測モデルのトレーニング方法の電子デバイスに接続されてもよい。上記のネットワークの例としては、インターネット、ブロックチェーンネットワーク、企業イントラネット、ローカルエリアネットワーク、モバイル通信ネットワーク、及びそれらの組み合わせなどを含むが、これらに限定されない。
オンライン予測モデルのトレーニング方法の電子デバイスは、入力装置703及び出力装置704をさらに備えてよい。プロセッサ701、メモリ702、入力装置703、出力装置704は、バスなどで接続されてもよいが、図7にバスによる接続を例にする。
入力装置703は、入力デジタルまたは文字情報を受信し、オンライン予測モデルのトレーニング方法の電子デバイスのユーザ設定及び機能制御に関連するキー信号入力を生成することができる。例えば、タッチスクリーン、キーパッド、マウス、トラックパッド、タッチパッド、ポインティングスティック、1つ以上のマウスボタン、トラックボール、ジョイスティック、その他の入力装置。出力装置704は、ディスプレイデバイス、補助照明装置(例えば、LED)、触覚フィードバック装置(例えば、振動モーター)などを備えてもよい。該ディスプレイデバイスは、液晶ディスプレイ(LCD)、発光ダイオード(LED)ディスプレイ、及びプラズマディスプレイを備えてもよい。いくつかの実施例では、ディスプレイデバイスはタッチスクリーンであってもよい。
ここでは説明されるシステム及び技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、特定用途向けASIC(特定用途向け集積回路)、コンピュータハードウェア、ファームウェア、ソフトウェア、および/またはそれらの組み合わせにおいて実現できる。これらの様々な実施形態は、以下を含んでもよく、1つまたは複数のコンピュータプログラムに実施され、該1つまたは複数のコンピュータプログラムは、少なくとも1つのプログラマブルプロセッサを含むプログラマブルシステム上で実行および/または解釈されてもよく、該プログラマブルプロセッサは、ストレージシステム、少なくとも1つの入力装置、及び少なくとも1つの出力装置からデータと命令を受信し、そのデータと命令をストレージシステム、少なくとも1つの入力装置、及び少なくとも1つの出力装置に送信できる専用または汎用のプログラマブルプロセッサであってもよい。
これらのコンピュータプログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、またはコードとも呼ばれる)は、プログラマブルプロセッサの機械命令を含み、高レベルのプロセス及び/またはオブジェクト指向プログラミング言語、及び/またはアセンブリ/機械言語を利用してこれらのコンピュータプログラムを実施することができる。本文で使用されるように、「機械読み取り可能な媒体」及び「コンピュータ読み取り可能な媒体」という用語は、プログラマブルプロセッサに機械命令および/またはデータを提供するために用いられる任意のコンピュータプログラム製品、デバイス、および/または装置(例えば、磁気ディスク、光ディスク、メモリ、プログラマブルロジック装置(PLD)を指す。機械読み取り可能な信号である機械命令を受信する機械読み取り可能な媒体を含む。「機械読み取り可能な信号」という用語は、プログラマブルプロセッサに機械命令および/またはデータを提供するために用いられる任意の信号を指す。
ユーザとのインタラクティブを提供するために、コンピュータにここでは説明されるシステム及び技術を実施してもよく、該コンピュータは、ユーザに情報を表示するためのディスプレイ装置(例えば、CRT(陰極線管)またはLCD(液晶ディスプレイ)モニター)、及びキーボードとポインティング装置(マウスやトラックボールなど)を備え、ユーザが該キーボードとポインティング装置を介してコンピュータに入力を提供することができる。他のタイプの装置もユーザとのインタラクティブを提供するために用いられ、例えば、ユーザに提供されるフィードバックは、任意の形式の感覚フィードバック(例えば、視覚フィードバック、聴覚フィードバック、または触覚フィードバック)であってもよく、任意の形式(音入力、音声入力、または触覚入力を含み)でユーザからの入力を受信することができる。
ここでは説明されるシステムと技術は、バックエンドコンポーネント(例えば、データサーバー)を含むコンピュータシステム、ミドルウェアコンポーネント(例えば、アプリケーションサーバー)を含むコンピュータシステム、またはフロントエンドコンポーネントを含むコンピュータシステム(例えば、グラフィカルユーザインターフェイスまたはWebブラウザーを備え、ユーザが該ラフィカルユーザインターフェイスまたはWebブラウザーでシステムと技術の実施例とインタラクティブできるユーザのコンピュータ)、またはそのようなバックエンドコンポーネント、ミドルウェアコンポーネント、またはフロントエンドコンポーネントを含む任意の組み合わせに実施してもよく、システムのコンポーネントは、任意の形式または媒体のデジタルデータ通信(通信ネットワークなど)を介して相互に接続してもよい。通信ネットワークの例としては、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)、インターネット、ブロックチェーンネットワークが挙げられる。
コンピュータシステムは、クライアント端末及びサーバーを含んでもよい。クライアント端末とサーバーは、一般的に互いに離れており、通常は通信ネットワークを介してインタラクティブする。対応するコンピュータ上で、互いにクライアント端末/サーバー関係を持つコンピュータプログラムを実行することによりクライアント端末とサーバーの関係を生成する。
なお、上記に示される様々な形態のプロセスを使用して再度ソートし、ステップを追加し、削除できる。例えば、本願に記載される各ステップは、本願に開示される技術的解決手段の所望の結果を達成できる限り、並列、順次、または異なる順序で実行されてもよく、ここでは本文に限定されない。
上記の具体的な実施形態は、本願の特許範囲を限定するものではない。当業者は、設計要件及び他の要因に応じて、様々な修正、組み合わせ、サブ組み合わせ、及び置換を行うことができると理解すべきである。本願の精神及び原則を逸脱せずに行われる変形、均等など置換、改良などはすべて本願の特許範囲に含まれるべきである。

Claims (21)

  1. オンライン予測モデルのトレーニング装置により実行される方法であって、
    取得ユニットが、ユーザのユーザ肖像画特徴を含むオフラインサンプル特徴と、オンラインサンプル特徴とを取得するステップと、
    オフライントレーニングユニットが、ユーザのオフラインサンプル特徴とオンラインサンプル特徴に基づいて、オフライントレーニングしてオフラインリコメンドモデルを取得するステップと、
    モデル同期ユニットが、前記オフラインリコメンドモデルを、オンラインリコメンドモデルとして、オンラインに同期するステップと、
    オンライントレーニングユニットが、ユーザの最新オンライン特徴を取得し、且つユーザの前記最新オンライン特徴を前記オンラインリコメンドモデルに入力し、オンライントレーニングしてオンライン学習モデルを取得するステップと、
    モデル生成ユニットが、前記オンライン学習モデルを、オンライン予測モデルとするステップと、を含み、
    前記オンライン学習モデルは、前記最新オンライン特徴がオンラインサンプル特徴として入力されることに適応させるように、前記オンラインリコメンドモデルのパラメーターを調整したモデルである、方法。
  2. 前記オフラインリコメンドモデルは、XGBboostモデルまたはWide&Deepモデルを備える請求項1に記載の方法。
  3. 前記方法は、データ同期ユニットがユーザの前記最新オンライン特徴をユーザの前記オフラインサンプル特徴を記憶するオフライン特徴ライブラリに同期するステップをさらに含む請求項1に記載の方法。
  4. 前記方法は、オンラインサンプル特徴生成ユニットがユーザオンラインオペレーション行動を含むユーザオンラインリアルタイム行動に従ってユーザのオンラインサンプル特徴を決定するステップをさらに含む請求項1または3に記載の方法。
  5. 前記方法は、結果出力ユニットが前記オンライン予測モデルの出力に従ってリコメンドシステムのリコメンドソートまたはクリック率推定を決定するステップをさらに含む請求項1または4に記載の方法。
  6. 前記オフラインリコメンドモデルはXGBboostモデルであり、前記オフライントレーニングユニットがユーザのオフラインサンプル特徴とオンラインサンプル特徴に基づいてオフライントレーニングしてオフラインリコメンドモデルを取得するステップは、
    前記オフラインサンプル特徴をXGBboostに入力し、前記オフラインサンプル特徴の特徴コードを生成することと、
    前記オンラインサンプル特徴を特徴コードし、且つ前記オンラインサンプル特徴の特徴コードとオフラインサンプル特徴の組み合わせコードをスティッチングすることと、
    スティッチング結果をロジスティック回帰器に入力して予測トレーニングし、トレーニング済みのオフラインリコメンドモデルを取得することと、を含む請求項4に記載の方法。
  7. 前記ユーザの前記最新オンライン特徴を前記オンラインリコメンドモデルに入力し、オンライントレーニングしてオンライン学習モデルを取得するステップは、
    オンライン機械学習アルゴリズム(FTRL)で前記オンラインリコメンドモデルの最新オンライン特徴に関するパラメーターを調整することにより、前記最新オンライン特徴をオンラインサンプル特徴として特徴コードすることに適応させることを含む請求項6に記載の方法。
  8. 前記オフラインリコメンドモデルはWide&Deepモデルであり、前記オフライントレーニングユニットがユーザのオフラインサンプル特徴とオンラインサンプル特徴に基づいてオフライントレーニングしてオフラインリコメンドモデルを取得するステップは、
    ユーザの前記オフラインサンプル特徴をDeepレイヤーに入力することと、
    特徴プロセスを経た前記オンラインサンプル特徴をWideレイヤーに入力することと、
    Deepレイヤー特徴とスティッチングされたWideレイヤー特徴をロジスティック回帰器に入力して予測トレーニングし、トレーニング済みのオフラインリコメンドモデルを取得することと、を含む請求項4に記載の方法。
  9. 前記ユーザの前記最新オンライン特徴を前記オンラインリコメンドモデルに入力し、オンライントレーニングしてオンライン学習モデルを取得するステップは、
    前記オンラインリコメンドモデルのWideレイヤーパラメーターを調整することにより、前記最新オンライン特徴をオンラインサンプル特徴としてWideレイヤーに入力されることに適応させることを含む請求項8に記載の方法。
  10. オンライン予測モデルのトレーニング装置であって、
    ユーザのユーザ肖像画特徴を含むオフラインサンプル特徴と、オンラインサンプル特徴とを取得するように構成される取得ユニットと、
    ユーザのオフラインサンプル特徴とオンラインサンプル特徴に基づいて、オフライントレーニングしてオフラインリコメンドモデルを取得するように構成されるオフライントレーニングユニットと、
    前記オフラインリコメンドモデルを、オンラインリコメンドモデルとして、オンラインに同期するように構成されるモデル同期ユニットと、
    ユーザの最新オンライン特徴を取得し、且つユーザの前記最新オンライン特徴を前記オンラインリコメンドモデルに入力し、オンライントレーニングしてオンライン学習モデルを取得するように構成されるオンライントレーニングユニットと、
    記オンライン学習モデルを、オンライン予測モデルとするように構成されるモデル生成ユニットと、を備え、
    前記オンライン学習モデルは、前記最新オンライン特徴がオンラインサンプル特徴として入力されることに適応させるように、前記オンラインリコメンドモデルのパラメーターを調整したモデルである、装置。
  11. 前記オフラインリコメンドモデルは、XGBboostモデルまたはWide&Deepモデルを備える請求項10に記載の装置。
  12. 前記装置は、さらに、ユーザの前記最新オンライン特徴またはオンラインサンプル特徴を、ユーザの前記オフラインサンプル特徴を記憶するオフライン特徴ライブラリに同期するように構成されるデータ同期ユニットと、を備える請求項10に記載の装置。
  13. 前記装置は、さらに、ユーザオンラインオペレーション行動を含むユーザオンラインリアルタイム行動に従って、ユーザのオンラインサンプル特徴を決定するように構成されるオンラインサンプル特徴生成ユニットを備える請求項10または12に記載の装置。
  14. 前記装置は、さらに、前記オンライン予測モデルの出力に従ってリコメンドシステムのリコメンドソートまたはクリック率推定を決定するように構成される結果出力ユニットを備える請求項10または13に記載の装置。
  15. 前記オフラインリコメンドモデルはXGBboostモデルであり、前記オフライントレーニングユニットは、さらに、
    前記オフラインサンプル特徴をXGBboostに入力し、前記オフラインサンプル特徴の特徴コードを生成し、
    前記オンラインサンプル特徴を特徴コードし、且つ前記オンラインサンプル特徴の特徴コードとオフラインサンプル特徴の組み合わせコードをスティッチングし、
    スティッチング結果をロジスティック回帰器に入力して予測トレーニングし、トレーニング済みのオフラインリコメンドモデルを取得するように構成される請求項13に記載の装置。
  16. 前記オンライントレーニングユニットは、さらに、
    オンライン機械学習アルゴリズム(FTRL)で前記オンラインリコメンドモデルの最新オンライン特徴に関するパラメーターを調整することにより、前記最新オンライン特徴をオンラインサンプル特徴として特徴コードすることに適応させるように構成される請求項15に記載の装置。
  17. 前記オフラインリコメンドモデルはWide&Deepモデルであり、前記オフライントレーニングユニットは、さらに、
    ユーザの前記オフラインサンプル特徴をDeepレイヤーに入力し、
    特徴プロセスを経た前記オンラインサンプル特徴をWideレイヤーに入力し、
    Deepレイヤー特徴とスティッチングされたWideレイヤー特徴をロジスティック回帰器に入力して予測トレーニングし、トレーニング済みのオフラインリコメンドモデルを取得するように構成される請求項13に記載の装置。
  18. 前記オンライントレーニングユニットは、さらに、
    前記オンラインリコメンドモデルのWideレイヤーパラメーターを調整することにより、前記最新オンライン特徴をオンラインサンプル特徴としてWideレイヤーに入力されることに適応させるように構成される請求項17に記載の装置。
  19. 電子デバイスであって、
    1つまたは複数のプロセッサと、
    1つまたは複数のプログラムを記憶するための記憶装置と、を備え、
    前記1つまたは複数のプログラムが前記1つまたは複数のプロセッサに実行されると、前記1つまたは複数のプロセッサが請求項1~9いずれか1項に記載の方法を実現する電子デバイス。
  20. コンピュータプログラムを記憶したコンピュータ可読記憶媒体であって、該コンピュータプログラムは、プロセッサに実行されると、請求項1~9いずれか1項に記載の方法を実現する記憶媒体。
  21. コンピュータプログラムであって、該コンピュータプログラムは、プロセッサにより実行されると、請求項1~9いずれか1項に記載の方法を実現するコンピュータプログラム。
JP2021056033A 2020-09-02 2021-03-29 オンライン予測モデルのトレーニング方法、装置、電子デバイス、コンピュータ可読記憶媒体及びコンピュータプログラム Active JP7312780B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202010911608.5 2020-09-02
CN202010911608.5A CN112070226B (zh) 2020-09-02 2020-09-02 在线预测模型的训练方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
JP2022023776A JP2022023776A (ja) 2022-02-08
JP7312780B2 true JP7312780B2 (ja) 2023-07-21

Family

ID=73665384

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021056033A Active JP7312780B2 (ja) 2020-09-02 2021-03-29 オンライン予測モデルのトレーニング方法、装置、電子デバイス、コンピュータ可読記憶媒体及びコンピュータプログラム

Country Status (5)

Country Link
US (1) US20210248513A1 (ja)
EP (1) EP3846109A3 (ja)
JP (1) JP7312780B2 (ja)
KR (1) KR20210052410A (ja)
CN (1) CN112070226B (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112541122A (zh) * 2020-12-23 2021-03-23 北京百度网讯科技有限公司 推荐模型的训练方法、装置、电子设备及存储介质
EP4302241A1 (en) * 2021-03-03 2024-01-10 Beijing Dajia Internet Information Technology Co., Ltd. Methods and apparatus for hybrid training of neural networks for video coding
CN113223705B (zh) * 2021-05-22 2023-08-29 杭州医康慧联科技股份有限公司 适用于隐私计算平台的离线预测方法
CN113378060A (zh) * 2021-07-01 2021-09-10 第四范式(北京)技术有限公司 资源推荐方法、装置、设备及介质
EP4377894A1 (en) * 2021-07-29 2024-06-05 Beijing Dajia Internet Information Technology Co., Ltd. Network based image filtering for video coding
CN113612777B (zh) * 2021-08-04 2023-07-11 百度在线网络技术(北京)有限公司 训练方法、流量分级方法、装置、电子设备以及存储介质
CN113762467B (zh) * 2021-08-12 2022-10-21 生态环境部卫星环境应用中心 基于紫外和可见高光谱获得近地面臭氧浓度的方法
CN113762621A (zh) * 2021-09-09 2021-12-07 南京领行科技股份有限公司 网约车司机离职预测方法及系统
CN113836411A (zh) * 2021-09-22 2021-12-24 上海哔哩哔哩科技有限公司 数据处理方法、装置及计算机设备
CN113569557B (zh) * 2021-09-26 2022-01-04 腾讯科技(深圳)有限公司 信息的质量识别方法、装置、设备、存储介质及程序产品
CN114238269B (zh) * 2021-12-03 2024-01-23 中兴通讯股份有限公司 数据库参数调整方法、装置、电子设备和存储介质
CN114925279A (zh) * 2022-06-07 2022-08-19 支付宝(杭州)信息技术有限公司 推荐模型训练方法、推荐方法以及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180247362A1 (en) 2017-02-24 2018-08-30 Sap Se Optimized recommendation engine
US20190336061A1 (en) 2018-05-01 2019-11-07 International Business Machines Corporation Epilepsy seizure detection and prediction using techniques such as deep learning methods

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180374138A1 (en) * 2017-06-23 2018-12-27 Vufind Inc. Leveraging delayed and partial reward in deep reinforcement learning artificial intelligence systems to provide purchase recommendations
CN108108821B (zh) * 2017-12-29 2022-04-22 Oppo广东移动通信有限公司 模型训练方法及装置
CN110046952B (zh) * 2019-01-30 2021-12-10 创新先进技术有限公司 一种推荐模型的训练方法及装置、一种推荐方法及装置
CN110880124A (zh) * 2019-09-29 2020-03-13 清华大学 转化率评估方法及装置
CN111080413A (zh) * 2019-12-20 2020-04-28 深圳市华宇讯科技有限公司 电商平台商品的推荐方法、装置、服务器和存储介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180247362A1 (en) 2017-02-24 2018-08-30 Sap Se Optimized recommendation engine
US20190336061A1 (en) 2018-05-01 2019-11-07 International Business Machines Corporation Epilepsy seizure detection and prediction using techniques such as deep learning methods

Also Published As

Publication number Publication date
JP2022023776A (ja) 2022-02-08
CN112070226B (zh) 2023-06-27
CN112070226A (zh) 2020-12-11
US20210248513A1 (en) 2021-08-12
EP3846109A3 (en) 2021-11-17
KR20210052410A (ko) 2021-05-10
EP3846109A2 (en) 2021-07-07

Similar Documents

Publication Publication Date Title
JP7312780B2 (ja) オンライン予測モデルのトレーニング方法、装置、電子デバイス、コンピュータ可読記憶媒体及びコンピュータプログラム
JP7166322B2 (ja) モデルを訓練するための方法、装置、電子機器、記憶媒体およびコンピュータプログラム
CN112507715B (zh) 确定实体之间关联关系的方法、装置、设备和存储介质
US20210216561A1 (en) Information search method and apparatus, device and storage medium
KR102484617B1 (ko) 이종 그래프 노드를 표현하는 모델 생성 방법, 장치, 전자 기기, 저장 매체 및 프로그램
JP7194163B2 (ja) マルチメディアリソースの推薦方法、マルチメディアリソースの推薦装置、電子機器、非一時的なコンピュータ読み取り可能な記憶媒体及びコンピュータプログラム
US20210209446A1 (en) Method for generating user interactive information processing model and method for processing user interactive information
JP7170082B2 (ja) 情報を生成するための方法及び装置、電子機器、記憶媒体並びにコンピュータプログラム
KR102476056B1 (ko) 아이템 추천방법, 시스템, 전자기기 및 기록매체
CN111539514A (zh) 用于生成神经网络的结构的方法和装置
CN110674260B (zh) 语义相似模型的训练方法、装置、电子设备和存储介质
CN110297890B (zh) 使用交互式自然语言对话的图像获取
KR20210040329A (ko) 비디오 태그의 생성 방법, 장치, 전자 기기 및 저장 매체
KR102475235B1 (ko) 리소스 정렬 방법, 정렬 모델을 트레이닝하는 방법 및 대응하는 장치
JP2022050379A (ja) 意味検索方法、装置、電子機器、記憶媒体およびコンピュータプログラム
JP7240505B2 (ja) 音声パケット推薦方法、装置、電子機器およびプログラム
CN111506803B (zh) 内容推荐方法、装置、电子设备及存储介质
JP7337172B2 (ja) 音声パケット推薦方法、装置、電子機器およびプログラム
CN111967599B (zh) 用于训练模型的方法、装置、电子设备及可读存储介质
WO2023022727A1 (en) Prompt tuning using one or more machine-learned models
CN112288483A (zh) 用于训练模型的方法和装置、用于生成信息的方法和装置
JP7220733B2 (ja) ユーザappインタレストの埋め込み方法及び装置、電子機器、記憶媒体並びにコンピュータプログラム
CN115238126A (zh) 搜索结果重排序方法、装置、设备及计算机存储介质
CN111737559B (zh) 资源排序方法、训练排序模型的方法及对应装置
CN113742523B (zh) 文本核心实体的标注方法及装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211117

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20221115

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221122

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230222

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230613

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230710

R150 Certificate of patent or registration of utility model

Ref document number: 7312780

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150