CN105260471B - 商品个性化排序模型训练方法及系统 - Google Patents

商品个性化排序模型训练方法及系统 Download PDF

Info

Publication number
CN105260471B
CN105260471B CN201510679812.8A CN201510679812A CN105260471B CN 105260471 B CN105260471 B CN 105260471B CN 201510679812 A CN201510679812 A CN 201510679812A CN 105260471 B CN105260471 B CN 105260471B
Authority
CN
China
Prior art keywords
commodity
term interest
interest feature
personalized ordering
long
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510679812.8A
Other languages
English (en)
Other versions
CN105260471A (zh
Inventor
王晓丹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Vipshop Guangzhou Software Co Ltd
Original Assignee
Guangzhou Pinwei Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Pinwei Software Co Ltd filed Critical Guangzhou Pinwei Software Co Ltd
Priority to CN201510679812.8A priority Critical patent/CN105260471B/zh
Publication of CN105260471A publication Critical patent/CN105260471A/zh
Application granted granted Critical
Publication of CN105260471B publication Critical patent/CN105260471B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Databases & Information Systems (AREA)
  • Finance (AREA)
  • Theoretical Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种商品个性化排序模型训练方法及系统,根据历史商品数据中长期兴趣特征对商品个性化排序模型进行离线训练,获得每个长期兴趣特征对应的参数,即获得一个精度较高的商品个性化排序模型,且排除了历史商品数据中短期兴趣特征,减少耗时。再间隔单位时间获取实时商品数据,对离线训练后的商品个性化排序模型进行扩展,根据实时商品数据中长期兴趣特征以及短期兴趣特征,对扩展后的商品个性化排序模型进行在线训练,获得更新的每个长期兴趣特征对应的参数以及每个短期兴趣特征对应的参数,从而实现每隔单位时间对扩展后的商品个性化排序模型进行更新一次,获得时效性更强的模型,实现模型的精度和时效性平衡,以获得更好的预测结果。

Description

商品个性化排序模型训练方法及系统
技术领域
本发明涉及数据处理技术领域,特别涉及一种商品个性化排序模型训练方法及系统。
背景技术
目前,给用户在线推荐商品是提高商品销售量的常用手段,主要通过对商品个性化排序模型进行训练,然后利用训练后的商品个性化排序模型进行输出预测,根据预测结果进行商品推荐。其中,商品个性化排序模型即是商品个性化推荐模型,商品个性化推荐模型包括模型输入、模型参数以及预测输出,根据模型输入以及模型参数进行模拟可获得预测输出,模型训练过程即是根据预测输出与实际输出的误差对模型参数进行不断调整的过程,使模型参数达到最优,从而使商品个性化推荐模型达到最优,再根据训练完成后的商品个性化推荐模型对待推荐商品进行模拟,获得待推荐商品的预测输出。
现有的商品个性化排序模型包括batch(批量)模式的LR(逻辑回归)模型和online(在线)模式下的LR模型,batch模式的LR模型是一种离线学习模型,原数据集是事先存储好的,是一种需要在原数据集上反复迭代以获得一个最优的模型参数,能确保模型推荐的精度,但是会导致batch模式下的LR模型无法在大数据集下多次迭代训练获得一个最新的模型,且采用的原数据集是历史数据,而当前售卖的商品和用户兴趣是随时变化的,从而利用该模型进行商品排序推荐时,会导致实时性较差。online模式下的LR模型是一种在线学习模型,实现了实时数据的增量训练,能追踪到用户的当前兴趣,即能确保模型的实时性,但是无法兼顾到较长周期的历史数据,且利用该模型进行训练时,对实时数据只迭代一次,从而利用该模型进行商品排序推荐时,会导致精度较低。
发明内容
基于此,有必要针对现有模型无法同时兼顾实时性和精度的问题,提供一种能同时提高时效性以及精度的商品个性化排序模型训练方法及系统。
一种商品个性化排序模型训练方法,包括如下步骤:
获取预设时间内的历史商品数据;
根据所述历史商品数据中的长期兴趣特征以及商品的预设输出目标,对所述商品个性化排序模型进行离线训练,获得每个所述长期兴趣特征对应的参数,其中,长期兴趣特征包括商品品牌以及商品类型;
间隔单位时间实时获取商品数据,并获取所述实时获取的商品数据中的所述商品的预设输出目标、所述长期兴趣特征以及短期兴趣特征,其中,所述短期兴趣特征包括商品ID以及档期ID;
根据所述短期兴趣特征,对离线训练后的所述商品个性化排序模型进行扩展,获得扩展后的商品个性化排序模型,其中,扩展后的所述商品个性化排序模型包括获得的每个所述长期兴趣特征对应的参数以及初始化的每个所述短期兴趣特征对应的参数;
根据所述实时获取的商品数据中的所述商品的预设输出目标、所述实时获取的商品数据中的所述长期兴趣特征以及所述短期兴趣特征,对扩展后的所述商品个性化排序模型进行在线训练,修正每个所述长期兴趣特征对应的参数以及每个所述短期兴趣特征对应的参数。
一种商品个性化排序模型训练系统,包括:
第一获取模块,用于获取预设时间内的历史商品数据;
第一训练模块,用于根据所述历史商品数据中的长期兴趣特征以及商品的预设输出目标,对所述商品个性化排序模型进行离线训练,获得每个所述长期兴趣特征对应的参数,其中,长期兴趣特征包括商品品牌以及商品类型;
第二获取模块,用于间隔单位时间实时获取商品数据,并获取所述实时获取的商品数据中的所述商品的预设输出目标、所述长期兴趣特征以及短期兴趣特征,其中,所述短期兴趣特征包括商品ID以及档期ID;
扩展模块,用于根据所述短期兴趣特征,对离线训练后的所述商品个性化排序模型进行扩展,获得扩展后的商品个性化排序模型,其中,扩展后的所述商品个性化排序模型包括获得的每个所述长期兴趣特征对应的参数以及初始化的每个所述短期兴趣特征对应的参数;
第二训练模块,用于根据所述实时获取的商品数据中的所述商品的预设输出目标、所述实时获取的商品数据中的所述长期兴趣特征以及所述短期兴趣特征,对扩展后的所述商品个性化排序模型进行在线训练,修正每个所述长期兴趣特征对应的参数以及每个所述短期兴趣特征对应的参数。
上述商品个性化排序模型训练方法及系统,首先,获取预设时间内的历史商品数据,根据历史商品数据中的长期兴趣特征,对商品个性化排序模型进行离线训练,获得每个长期兴趣特征对应的参数,即在预设时间的历史数据上对模型进行训练获得一个精度较高的商品个性化排序模型。然后,对离线训练后的商品个性化排序模型进行扩展,扩展后的商品个性化排序模型包括获得的每个长期兴趣特征对应的参数以及预设的每个短期兴趣特征对应的参数。间隔单位时间实时获取商品数据,根据实时获取的商品数据中的商品的预设输出目标、长期兴趣特征以及短期兴趣特征,对扩展后的商品个性化排序模型进行在线训练。训练完成后,获得更新的每个长期兴趣特征对应的参数以及每个短期兴趣特征对应的参数,从而实现每隔单位时间对扩展后的商品个性化排序模型进行更新一次,利用实时获取的商品数据对扩展后的商品个性化排序模型进行在线训练,获得一个时效性更强的模型,从而得到一个既可以反映用户长期偏好又能够追踪用户当前兴趣的模型,实现模型的精度和时效性平衡,以获得一个更好的预测结果。
附图说明
图1为一实施方式的商品个性化排序模型训练方法的流程图;
图2为另一实施方式的商品个性化排序模型训练方法的流程图;
图3为一实施方式的商品个性化排序模型训练系统的模块图;
图4为另一实施方式的商品个性化排序模型训练系统的模块图;
图5为另一实施方式的商品个性化排序模型训练系统的模块图。
具体实施方式
请参阅图1,提供一种实施方式的商品个性化排序模型训练方法,包括如下步骤:
S100:获取预设时间内的历史商品数据。
用户在页面对商品进行点击、购买或收藏时,会产生商品数据,将这些商品数据进行存储,形成历史商品数据,通过对预设时间内的历史商品数据进行获取,为后续对商品个性化排序模型进行离线训练提供训练样本。例如,每隔一天对前2个月内的历史商品数据进行获取,即每天凌晨对之前2个月内的历史商品数据进行获取,得到训练样本,然后根据训练样本对商品个性化排序模型进行离线训练。
S200:根据历史商品数据中的长期兴趣特征以及商品的预设输出目标,对商品个性化排序模型进行离线训练,获得每个长期兴趣特征对应的参数。
其中,长期兴趣特征包括商品品牌以及商品类型,商品个性化排序模型的输入为长期兴趣特征,输出为预设输出目标。商品个性化排序模型包括长期兴趣特征、每个长期兴趣特征对应的参数以及预设输出目标,对商品个性化排序模型的训练即是通过将长期兴趣特征输入至商品个性化排序模型,根据预测输出与实际输出的差距对每个长期兴趣特征对应的参数进行不断调整的过程,最终获得每个长期兴趣特征对应的参数。
S300:间隔单位时间实时获取商品数据,并获取实时获取的商品数据中的商品的预设输出目标、长期兴趣特征以及短期兴趣特征。
其中,短期兴趣特征包括商品ID以及档期ID。在对用户进行商品推荐时,不但需要考虑历史商品数据,而且需要考虑实时获取的商品数据,这样可实时了解用户实时的兴趣,确保商品推荐的时效性。每隔单位时间产生一份实时的训练数据,利用该实时的训练数据对扩展后的商品个性化排序模型进行在线训练。在本实施例中,每小时产生一份实时的训练数据,即每个一小时对扩展后的商品个性化排序模型进行训练,直到当天结束,当天结束后,将当天的数据当作历史数据,作为下一天对商品个性化排序模型进行离线训练的训练样本。
由于商品品牌以及商品类型一般是不会随时间的变化而变化,所以将其作为商品的长期兴趣特征。档期ID是指在一段时间内上线的专场ID,例如,在今天,在网页上需要上线一个专场,是专门对某一类商品进行促销,即上线一个档期,对应有档期ID,明天就下线,那么针对该档期ID是短期兴趣特征,对于该档期中的商品也具有商品ID,同样也是短期兴趣特征。用户在点击浏览某一档期中某种商品时,会纪录用户点击浏览的该档期ID以及该商品ID,将商品ID以及档期ID作为用户的短期兴趣特征,以表征用户当前兴趣。
S400:根据短期兴趣特征,对离线训练后的商品个性化排序模型进行扩展,获得扩展后的商品个性化排序模型。
其中,扩展后的商品个性化排序模型的输入为长期兴趣特征和短期兴趣特征,扩展后的商品个性化排序模型包括获得的每个长期兴趣特征对应的参数以及初始化的每个短期兴趣特征对应的参数。
在对商品个性化排序模型进行离线训练后,得到了每个长期兴趣特征对应的参数,对离线训练后的商品个性化排序模型进行加载并扩展,增加输入维数以及初始化每个短期兴趣特征对应的参数,其中,增加的输入维数即是短期兴趣特征的个数。
上述短期兴趣特征对应的参数以及长期兴趣特征对应的参数即为商品个性化排序模型的参数,对商品个性化排序模型进行训练过程即是对这些参数的不断修正过程,对离线训练后的商品个性化排序模型进行扩展即是增加短期兴趣特征对应的参数,并初始化短期兴趣特征对应的参数,长期兴趣特征对应的参数通过离线训练后获得,通过将短期兴趣特征以及长期兴趣特征输入商品个性化排序模型,通过这些参数的作用,可以获得相应的商品的预设输出目标的具体值,这些参数确定结果的好坏影响商品个性化排序模型的好坏,从而影响商品个性化排序模型预测结果的准确性。从而需要对扩展后的商品个性化排序模型进行训练,对短期兴趣特征对应的参数以及长期兴趣特征对应的参数进行不断调整,使这些参数的值达到较优,从而使扩展后的商品个性化排序模型的预测输出更加接近实际值,训练完成后,这些参数均确定。
S500:根据实时获取的商品数据中的商品的预设输出目标、实时获取的商品数据中的长期兴趣特征以及短期兴趣特征,对扩展后的商品个性化排序模型进行在线训练,修正每个长期兴趣特征对应的参数以及每个短期兴趣特征对应的参数。
将实时获取的商品数据中长期兴趣特征以及短期兴趣特征输入扩展后的商品个性化排序模型进行预测输出,根据预测输出与实际输出的差距对扩展后的商品个性化排序模型中每个长期兴趣特征对应的参数以及每个短期兴趣特征对应的参数进行不断的调整,即是根据商品个性化排序模型预测输出的商品的预设输出目标与实际的商品的预设输出目标之间的差距对参数进行不断调整。训练完成后,获得更新的每个长期兴趣特征对应的参数以及每个短期兴趣特征对应的参数。
上述商品个性化排序模型训练方法,首先,获取预设时间内的历史商品数据,根据历史商品数据中的商品的预设输出目标、长期兴趣特征,对商品个性化排序模型进行离线训练,获得每个长期兴趣特征对应的参数,即在预设时间的历史数据上对模型进行训练获得一个精度较高的商品个性化排序模型,且排除了历史商品数据中短期兴趣特征,减少耗时。然后,对离线训练后的商品个性化排序模型进行扩展,扩展后的商品个性化排序模型包括获得的每个长期兴趣特征对应的参数以及初始化的每个短期兴趣特征对应的参数。间隔单位时间实时获取商品数据,根据实时获取的商品数据中的商品的预设输出目标、长期兴趣特征以及短期兴趣特征,对扩展后的商品个性化排序模型进行在线训练。训练完成后,获得更新的每个长期兴趣特征对应的参数以及每个短期兴趣特征对应的参数,从而实现每隔单位时间对扩展后的商品个性化排序模型进行更新一次,利用实时获取的数据获对扩展后的商品个性化排序模型进行在线训练,获得一个时效性更强的模型,从而得到一个既可以反映用户长期偏好又能够追踪用户当前兴趣的模型,实现模型的精度和时效性平衡,以获得一个更好的预测结果。
请参阅图2,在其中一个实施例中,根据实时获取的商品数据中的商品的预设输出目标、实时获取的商品数据中的长期兴趣特征以及短期兴趣特征,对扩展后的商品个性化排序模型进行在线训练,修正每个长期兴趣特征对应的参数以及每个短期兴趣特征对应的参数的步骤S500之后还包括:
S600:获取待排序商品数据。
S700:根据待排序商品数据中的长期兴趣特征和短期兴趣特征以及在线训练后的商品个性化排序模型,对待排序商品的预设输出目标进行预测。
对扩展后的商品个性化排序模型在线训练完成后,每个长期兴趣特征对应的参数以及每个短期兴趣特征对应的参数也确定,后续将待排序商品数据中的长期兴趣特征以及短期兴趣特征输入至该商品个性化排序模型,即可获得待排序商品的预测输出。
S800:根据预测的待排序商品的预设输出目标的结果,对待排序商品进行排序。
在本实施例中,预测输出结果越大,待排序商品排序越靠前,表示越有可能推荐给用户。
S900:根据待排序商品的排序结果,向用户推荐待排序商品。
获得待排序商品的排序结果后,需要根据排序结果,给用户推荐商品,排序越靠前,越可能推荐给用户。例如,将排序结果中排名前100的商品推荐给用户。
在其中一个实施例中,商品的预设输出目标包括商品的点击率、商品的购买量及/或商品的收藏量。
在本实施例中,预设的个性化排序模型采用逻辑回归模型,对逻辑回归模型进行离线训练时采用基于L1正则的OWL-QN(Orthant-Wise Limited-memoryQuasi-Newton)算法进行优化,对离线训练后的个性化排序模型进行在线训练时采用FTRL(Follow-the-regularized-Leader)算法进行优化。
在对商品个性化排序模型进行训练时,是根据预测输出与实际输出之间的误差来对参数进行调整。对最小误差进行最优化求解,从而可求出最优的模型参数,即可求出每个长期兴趣特征对应的参数。对最小误差进行求解过程中,优化算法包括基于L1正则的OWL-QN算法。对离线训练后的个性化排序模型进行在线训练时,对最小误差进行最优化求解,从而可求出最优化模型的参数,即可求出每个短期兴趣特征对应的参数,最优化求解过程中,优化算法包括FTRL算法。
在机器学习模型中,主要是如何求解这个模型的最优解,即求出这个模型中的最优模型参数,可转化为如何求解损失函数的最小值,损失函数是用来衡量当训练出现误差时的损失。上述基于L1正则的OWL-QN算法是求解在原来可导的损失函数上加上一个L1正则项的最优解,L1正则项是对模型空间进行限制,L1正则项是指商品个性化排序模型中模型参数向量中各个元素绝对值之和,该模型参数向量中包括了每个长期兴趣特征对应的参数。最小化损失函数是为了让我们的模型更好地拟合训练数据,而规则化参数是防止我们的模型过分拟合训练数据。FTRL算法是一种可以实现L1正则和L2正则的LR优化方法,在损失函数的基础上加上L1正则项和L2正则项,然后在求解最优解,该模型参数向量包括了每个长期兴趣特征对应的参数以及每个短期兴趣特征对应的参数,该L1正则项是指扩展后的商品个性化排序模型中模型参数向量中各个元素绝对值之和,L2正则项是指扩展后的商品个性化排序模型中模型参数向量减去已经迭代过的模型参数解向量后各个元素平方和,以限制模型参数的变化不能离已迭代过的解太远,即L2正则项的引入对最优化求解过程中增加了一个约束,使求解的结果更加平滑。
在其中一个实施例中,根据历史商品数据中的长期兴趣特征以及商品个性化排序模型预设的输出目标,对商品个性化排序模型进行离线训练,获得每个长期兴趣特征对应的参数步骤S200之前还包括步骤:
初始化商品个性化排序模型。
对商品个性化排序模型进行初始化,为后续的训练提供依据,其输入为商品数据中长期兴趣特征,即商品个性化排序模型的输入维数即为商品数据中长期兴趣特征个数,在对商品个性化排序模型初始化时,需初始化每个长期兴趣特征对应的参数,训练过程即根据预测输出与实际输出的差距对这些参数不断调整的过程。
请参阅图3,提供一种实施方式的商品个性化排序模型训练系统,包括:
第一获取模块100,用于获取预设时间内的历史商品数据。
用户在页面对商品进行点击、购买或收藏时,会产生商品数据,将这些商品数据进行存储,形成历史商品数据,通过对预设时间内的历史商品数据进行获取,为后续对商品个性化排序模型进行离线训练提供训练样本。例如,每隔一天对前2个月内的历史商品数据进行获取,即每天凌晨对之前2个月内的历史商品数据进行获取,得到训练样本,然后根据训练样本对商品个性化排序模型进行离线训练。
第一训练模块200,用于根据历史商品数据中的长期兴趣特征以及商品的预设输出目标,对商品个性化排序模型进行离线训练,获得每个长期兴趣特征对应的参数。
其中,长期兴趣特征包括商品品牌以及商品类型,商品个性化排序模型的输入为长期兴趣特征,输出为预设输出目标。商品个性化排序模型包括长期兴趣特征、每个长期兴趣特征对应的参数以及预设输出目标,对商品个性化排序模型的训练即是通过将长期兴趣特征输入至商品个性化排序模型,根据预测输出与实际输出的差距对每个长期兴趣特征对应的参数进行不断调整的过程,最终获得每个长期兴趣特征对应的参数。
第二获取模块300,用于间隔单位时间实时获取商品数据,并获取实时获取的商品数据中的商品的预设输出目标、长期兴趣特征以及短期兴趣特征。
其中,短期兴趣特征包括商品ID以及档期ID。在对用户进行商品推荐时,不但需要考虑历史商品数据,而且需要考虑实时获取的商品数据,这样可实时了解用户实时的兴趣,确保商品推荐的时效性。每隔单位时间产生一份实时的训练数据,利用该实时的训练数据对扩展后的商品个性化排序模型进行在线训练。在本实施例中,每小时产生一份实时的训练数据,即每个一小时对扩展后的商品个性化排序模型进行训练,直到当天结束,当天结束后,将当天的数据当作历史数据,作为下一天对商品个性化排序模型进行离线训练的训练样本。
由于商品品牌以及商品类型一般是不会随时间的变化而变化,所以将其作为商品的长期兴趣特征。档期ID是指在一段时间内上线的专场ID,例如,在今天,在网页上需要上线一个专场,是专门对某一类商品进行促销,即上线一个档期,对应有档期ID,明天就下线,那么针对该档期ID是短期兴趣特征,对于该档期中的商品也具有商品ID,同样也是短期兴趣特征。用户在点击浏览某一档期中某种商品时,会纪录用户点击浏览的该档期ID以及该商品ID,将商品ID以及档期ID作为用户的短期兴趣特征,以表征用户当前兴趣。
扩展模块400,用于根据短期兴趣特征,对离线训练后的商品个性化排序模型进行扩展,获得扩展后的商品个性化排序模型。
其中,扩展后的商品个性化排序模型的输入为长期兴趣特征和短期兴趣特征,扩展后的商品个性化排序模型包括获得的每个长期兴趣特征对应的参数以及初始化的每个短期兴趣特征对应的参数。
在对商品个性化排序模型进行离线训练后,得到了每个长期兴趣特征对应的参数,对离线训练后的商品个性化排序模型进行加载并扩展,增加输入维数以及初始化每个短期兴趣特征对应的参数,其中,增加的输入维数即是短期兴趣特征的个数。
上述短期兴趣特征对应的参数以及长期兴趣特征对应的参数即为商品个性化排序模型的参数,对商品个性化排序模型进行训练过程即是对这些参数的不断修正过程,对离线训练后的商品个性化排序模型进行扩展即是增加短期兴趣特征对应的参数,并初始化短期兴趣特征对应的参数,长期兴趣特征对应的参数通过离线训练后获得,通过将短期兴趣特征以及长期兴趣特征输入商品个性化排序模型,通过这些参数的作用,可以获得相应的商品的预设输出目标的具体值,这些参数确定结果的好坏影响商品个性化排序模型的好坏,从而影响商品个性化排序模型预测结果的准确性。从而需要对扩展后的商品个性化排序模型进行训练,对短期兴趣特征对应的参数以及长期兴趣特征对应的参数进行不断调整,使这些参数的值达到较优,从而使扩展后的商品个性化排序模型的预测输出更加接近实际值,训练完成后,这些参数均确定。
第二训练模块500,用于根据实时获取的商品数据中的商品的预设输出目标、实时获取的商品数据中的长期兴趣特征以及短期兴趣特征,对扩展后的商品个性化排序模型进行在线训练,修正每个长期兴趣特征对应的参数以及每个短期兴趣特征对应的参数。
将实时获取的商品数据中长期兴趣特征以及短期兴趣特征输入扩展后的商品个性化排序模型进行预测输出,根据预测输出与实际输出的差距对扩展后的商品个性化排序模型中每个长期兴趣特征对应的参数以及每个短期兴趣特征对应的参数进行不断的调整,即是根据商品个性化排序模型预测输出的商品的预设输出目标与实际的商品的预设输出目标之间的差距对参数进行不断调整。训练完成后,获得更新的每个长期兴趣特征对应的参数以及每个短期兴趣特征对应的参数。
上述商品个性化排序模型训练系统,首先,获取预设时间内的历史商品数据,根据历史商品数据中的商品的预设输出目标、长期兴趣特征,对商品个性化排序模型进行离线训练,获得每个长期兴趣特征对应的参数,即在预设时间的历史数据上对模型进行训练获得一个精度较高的商品个性化排序模型,且排除了历史商品数据中短期兴趣特征,减少耗时。然后,对离线训练后的商品个性化排序模型进行扩展,扩展后的商品个性化排序模型包括获得的每个长期兴趣特征对应的参数以及初始化的每个短期兴趣特征对应的参数。间隔单位时间实时获取商品数据,根据实时获取的商品数据中的商品的预设输出目标、长期兴趣特征以及短期兴趣特征,对扩展后的商品个性化排序模型进行在线训练。训练完成后,获得更新的每个长期兴趣特征对应的参数以及每个短期兴趣特征对应的参数,从而实现每隔单位时间对扩展后的商品个性化排序模型进行更新一次,利用实时获取的数据获对扩展后的商品个性化排序模型进行在线训练,获得一个时效性更强的模型,从而得到一个既可以反映用户长期偏好又能够追踪用户当前兴趣的模型,实现模型的精度和时效性平衡,以获得一个更好的预测结果。
请参阅图4,在其中一个实施例中,上述商品个性化排序模型训练系统还包括:
第三获取模块600,用于获取待排序商品数据。
预测模块700,用于根据待排序商品数据中的长期兴趣特征和短期兴趣特征以及在线训练后的商品个性化排序模型,对待排序商品的预设输出目标进行预测。
对扩展后的商品个性化排序模型在线训练完成后,每个长期兴趣特征对应的参数以及每个短期兴趣特征对应的参数也确定,后续将待排序商品数据中的长期兴趣特征以及短期兴趣特征输入至该商品个性化排序模型,即可获得待排序商品的预测输出。
排序模块800,用于根据预测的待排序商品的预设输出目标的结果,对待排序商品进行排序。
在本实施例中,预测输出结果越大,待排序商品排序越靠前,表示越有可能推荐给用户。
推荐模块900,用于根据待排序商品的排序结果,向用户推荐待排序商品。
获得待排序商品的排序结果后,需要根据排序结果,给用户推荐商品,排序越靠前,越可能推荐给用户。例如,将排序结果中排名前100的商品推荐给用户。
在其中一个实施例中,商品的预设输出目标包括商品的点击率、商品的购买量及/或商品的收藏量。
在本实施例中,预设的个性化排序模型采用逻辑回归模型,对逻辑回归模型进行离线训练时采用基于L1正则的OWL-QN(Orthant-Wise Limited-memoryQuasi-Newton)算法进行优化,对离线训练后的个性化排序模型进行在线训练时采用FTRL(Follow-the-regularized-Leader)算法进行优化。
在对商品个性化排序模型进行训练时,是根据预测输出与实际输出之间的误差来对参数进行调整。对最小误差进行最优化求解,从而可求出最优的模型参数,即可求出每个长期兴趣特征对应的参数。对最小误差进行求解过程中,优化算法包括基于L1正则的OWL-QN算法。对离线训练后的个性化排序模型进行在线训练时,对最小误差进行最优化求解,从而可求出最优化模型的参数,即可求出每个短期兴趣特征对应的参数,最优化求解过程中,优化算法包括FTRL算法。
在机器学习模型中,主要是如何求解这个模型的最优解,即求出这个模型中的最优模型参数,可转化为如何求解损失函数的最小值,损失函数是用来衡量当训练出现误差时的损失。上述基于L1正则的OWL-QN算法是求解在原来可导的损失函数上加上一个L1正则项的最优解,L1正则项是对模型空间进行限制,L1正则项是指商品个性化排序模型中模型参数向量中各个元素绝对值之和,该模型参数向量中包括了每个长期兴趣特征对应的参数。最小化损失函数是为了让我们的模型更好地拟合训练数据,而规则化参数是防止我们的模型过分拟合训练数据。FTRL算法是一种可以实现L1正则和L2正则的LR优化方法,在损失函数的基础上加上L1正则项和L2正则项,然后在求解最优解,该模型参数向量包括了每个长期兴趣特征对应的参数以及每个短期兴趣特征对应的参数,该L1正则项是指扩展后的商品个性化排序模型中模型参数向量中各个元素绝对值之和,L2正则项是指扩展后的商品个性化排序模型中模型参数向量减去已经迭代过的模型参数解向量后各个元素平方和,以限制模型参数的变化不能离已迭代过的解太远,即L2正则项的引入对最优化求解过程中增加了一个约束,使求解的结果更加平滑。
请参阅图5,在其中一个实施例中,上述商品个性化排序模型训练系统还包括:
初始化模块210,用于初始化商品个性化排序模型。
对商品个性化排序模型进行初始化,为后续的训练提供依据,其输入为商品数据中长期兴趣特征,即商品个性化排序模型的输入维数即为商品数据中长期兴趣特征个数,在对商品个性化排序模型初始化时,还需初始化每个长期兴趣特征对应的参数,训练过程即根据预测输出与实际输出的差距对这些参数不断调整的过程。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种商品个性化排序模型训练方法,其特征在于,包括如下步骤:
获取预设时间内的历史商品数据;
根据所述历史商品数据中的长期兴趣特征以及商品的预设输出目标,对所述商品个性化排序模型进行离线训练,获得每个所述长期兴趣特征对应的参数,其中,长期兴趣特征包括商品品牌以及商品类型;
间隔单位时间实时获取商品数据,并获取所述实时获取的商品数据中的所述商品的预设输出目标、所述长期兴趣特征以及短期兴趣特征,其中,所述短期兴趣特征包括商品ID以及档期ID;
根据所述短期兴趣特征,对离线训练后的所述商品个性化排序模型进行扩展,获得扩展后的商品个性化排序模型,其中,扩展后的所述商品个性化排序模型包括获得的每个所述长期兴趣特征对应的参数以及初始化的每个所述短期兴趣特征对应的参数;
根据所述实时获取的商品数据中的所述商品的预设输出目标、所述实时获取的商品数据中的所述长期兴趣特征以及所述短期兴趣特征,对扩展后的所述商品个性化排序模型进行在线训练,修正每个所述长期兴趣特征对应的参数以及每个所述短期兴趣特征对应的参数。
2.根据权利要求1所述的商品个性化排序模型训练方法,其特征在于,所述根据所述实时获取的商品数据中的所述商品的预设输出目标、所述实时获取的商品数据中的所述长期兴趣特征以及所述短期兴趣特征,对扩展后的所述商品个性化排序模型进行在线训练,修正每个所述长期兴趣特征对应的参数以及每个所述短期兴趣特征对应的参数的步骤之后还包括:
获取待排序商品数据;
根据所述待排序商品数据中的所述长期兴趣特征和所述短期兴趣特征以及在线训练后的所述商品个性化排序模型,对待排序商品的预设输出目标进行预测;
根据预测的所述待排序商品的预设输出目标的结果,对所述待排序商品进行排序;
根据所述待排序商品的排序结果,向用户推荐所述待排序商品。
3.根据权利要求1所述的商品个性化排序模型训练方法,其特征在于,所述商品的预设输出目标包括商品的点击率、商品的购买量及/或商品的收藏量。
4.根据权利要求1-3中任意一项所述的商品个性化排序模型训练方法,其特征在于,所述商品个性化排序模型采用逻辑回归模型,对所述逻辑回归模型进行离线训练时采用基于L1正则的OWL-QN算法进行优化,对离线训练后的所述个性化排序模型进行在线训练时采用FTRL算法进行优化。
5.根据权利要求1所述的商品个性化排序模型训练方法,其特征在于,所述根据所述历史商品数据中的长期兴趣特征以及商品的预设输出目标,对所述商品个性化排序模型进行离线训练,获得每个所述长期兴趣特征对应的参数之前还包括步骤:
初始化所述商品个性化排序模型。
6.一种商品个性化排序模型训练系统,其特征在于,包括:
第一获取模块,用于获取预设时间内的历史商品数据;
第一训练模块,用于根据所述历史商品数据中的长期兴趣特征以及商品的预设输出目标,对所述商品个性化排序模型进行离线训练,获得每个所述长期兴趣特征对应的参数,其中,长期兴趣特征包括商品品牌以及商品类型;
第二获取模块,用于间隔单位时间实时获取商品数据,并获取所述实时获取的商品数据中的所述商品的预设输出目标、所述长期兴趣特征以及短期兴趣特征,其中,所述短期兴趣特征包括商品ID以及档期ID;
扩展模块,用于根据所述短期兴趣特征,对离线训练后的所述商品个性化排序模型进行扩展,获得扩展后的商品个性化排序模型,其中,扩展后的所述商品个性化排序模型包括获得的每个所述长期兴趣特征对应的参数以及初始化的每个所述短期兴趣特征对应的参数;
第二训练模块,用于根据所述实时获取的商品数据中的所述商品的预设输出目标、所述实时获取的商品数据中的所述长期兴趣特征以及所述短期兴趣特征,对扩展后的所述商品个性化排序模型进行在线训练,修正每个所述长期兴趣特征对应的参数以及每个所述短期兴趣特征对应的参数。
7.根据权利要求6所述的商品个性化排序模型训练系统,其特征在于,还包括:
第三获取模块,用于获取待排序商品数据;
预测模块,用于根据所述待排序商品数据中的所述长期兴趣特征和所述短期兴趣特征以及在线训练后的所述商品个性化排序模型,对待排序商品的预设输出目标进行预测;
排序模块,用于根据预测的所述待排序商品的预设输出目标的结果,对所述待排序商品进行排序;
推荐模块,用于根据所述待排序商品的排序结果,向用户推荐所述待排序商品。
8.根据权利要求6所述的商品个性化排序模型训练系统,其特征在于,所述商品的预设输出目标包括商品的点击率、商品的购买量及/或商品的收藏量。
9.根据权利要求6-8中任意一项所述的商品个性化排序模型训练系统,其特征在于,所述商品个性化排序模型采用逻辑回归模型,对所述逻辑回归模型进行离线训练时采用基于L1正则的OWL-QN算法进行优化,对离线训练后的所述个性化排序模型进行在线训练时采用FTRL算法进行优化。
10.根据权利要求6所述的商品个性化排序模型训练系统,其特征在于,还包括:
初始化模块,用于初始化所述商品个性化排序模型。
CN201510679812.8A 2015-10-19 2015-10-19 商品个性化排序模型训练方法及系统 Active CN105260471B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510679812.8A CN105260471B (zh) 2015-10-19 2015-10-19 商品个性化排序模型训练方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510679812.8A CN105260471B (zh) 2015-10-19 2015-10-19 商品个性化排序模型训练方法及系统

Publications (2)

Publication Number Publication Date
CN105260471A CN105260471A (zh) 2016-01-20
CN105260471B true CN105260471B (zh) 2019-03-26

Family

ID=55100161

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510679812.8A Active CN105260471B (zh) 2015-10-19 2015-10-19 商品个性化排序模型训练方法及系统

Country Status (1)

Country Link
CN (1) CN105260471B (zh)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107329887B (zh) * 2016-04-28 2020-08-14 腾讯科技(深圳)有限公司 一种基于推荐系统的数据处理方法以及装置
CN106127363B (zh) * 2016-06-12 2022-04-15 腾讯科技(深圳)有限公司 一种用户信用评估方法和装置
CN106599815A (zh) * 2016-12-06 2017-04-26 东南大学 基于标记分布的解决类别缺失问题的头部姿态估计方法
CN107067274A (zh) * 2016-12-27 2017-08-18 北京掌阔移动传媒科技有限公司 一个基于混合学习模型的dsp实时竞价广告系统
CN110537212B (zh) 2017-05-22 2022-06-07 北京嘀嘀无限科技发展有限公司 确定预估到达时间的系统与方法
CN107341687B (zh) * 2017-06-01 2021-06-08 华南理工大学 一种基于多维标签与分类排序的推荐算法
CN107301247B (zh) * 2017-07-14 2020-12-18 阿里巴巴(中国)有限公司 建立点击率预估模型的方法及装置、终端、存储介质
CN107451894B (zh) * 2017-08-03 2020-09-29 北京京东尚科信息技术有限公司 数据处理方法、装置和计算机可读存储介质
CN109816412B (zh) * 2017-11-21 2022-11-29 腾讯科技(深圳)有限公司 一种训练模型生成方法、装置、设备和计算机存储介质
CN109903111A (zh) * 2017-12-11 2019-06-18 北京京东尚科信息技术有限公司 用于个性化推荐的排序方法,排序模型训练方法和排序系统
CN110321422B (zh) * 2018-03-28 2023-04-14 腾讯科技(深圳)有限公司 在线训练模型的方法、推送方法、装置以及设备
CN110599280A (zh) * 2018-06-12 2019-12-20 阿里巴巴集团控股有限公司 商品信息偏好模型训练和预测方法、装置及电子设备
CN109146606B (zh) * 2018-07-09 2022-02-22 广州品唯软件有限公司 一种品牌推荐方法、电子设备、存储介质及系统
CN110069699B (zh) * 2018-07-27 2022-12-16 创新先进技术有限公司 排序模型训练方法和装置
CN109543132A (zh) * 2018-11-22 2019-03-29 深圳墨世科技有限公司 内容推荐方法、装置、电子设备及存储介质
CN109558544B (zh) * 2018-12-12 2021-04-27 拉扎斯网络科技(上海)有限公司 排序方法及装置、服务器和存储介质
CN109597941B (zh) * 2018-12-12 2021-04-27 拉扎斯网络科技(上海)有限公司 排序方法及装置、电子设备和存储介质
CN110288433A (zh) * 2019-06-12 2019-09-27 达疆网络科技(上海)有限公司 一种基于点击率模型预测o2o实时个性化排序方法
CN110674408B (zh) * 2019-09-30 2021-06-04 北京三快在线科技有限公司 业务平台、训练样本的实时生成方法及装置
CN113744015A (zh) * 2020-10-20 2021-12-03 北京沃东天骏信息技术有限公司 一种排序方法、装置、设备及计算机存储介质
CN113822776B (zh) * 2021-09-29 2023-11-03 中国平安财产保险股份有限公司 课程推荐方法、装置、设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102073720A (zh) * 2011-01-10 2011-05-25 北京航空航天大学 一种对个性化推荐结果进行优化的fr方法
WO2013131278A1 (en) * 2012-03-09 2013-09-12 Nokia Corporation Method and apparatus for performing an incremental update of a recommendation model
CN103824192A (zh) * 2012-08-31 2014-05-28 埃森哲环球服务有限公司 混合推荐系统
CN103955842A (zh) * 2014-04-14 2014-07-30 武汉烽火普天信息技术有限公司 一种面向大规模媒体数据的在线广告推荐系统及方法
CN104572734A (zh) * 2013-10-23 2015-04-29 腾讯科技(深圳)有限公司 问题推荐方法、装置及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102073720A (zh) * 2011-01-10 2011-05-25 北京航空航天大学 一种对个性化推荐结果进行优化的fr方法
WO2013131278A1 (en) * 2012-03-09 2013-09-12 Nokia Corporation Method and apparatus for performing an incremental update of a recommendation model
CN103824192A (zh) * 2012-08-31 2014-05-28 埃森哲环球服务有限公司 混合推荐系统
CN104572734A (zh) * 2013-10-23 2015-04-29 腾讯科技(深圳)有限公司 问题推荐方法、装置及系统
CN103955842A (zh) * 2014-04-14 2014-07-30 武汉烽火普天信息技术有限公司 一种面向大规模媒体数据的在线广告推荐系统及方法

Also Published As

Publication number Publication date
CN105260471A (zh) 2016-01-20

Similar Documents

Publication Publication Date Title
CN105260471B (zh) 商品个性化排序模型训练方法及系统
CN110490717B (zh) 基于用户会话及图卷积神经网络的商品推荐方法及系统
Shi et al. Virtual-taobao: Virtualizing real-world online retail environment for reinforcement learning
US10409821B2 (en) Search result ranking using machine learning
Gilliams et al. Comparing multiple criteria decision methods to extend a geographical information system on afforestation
Rahimi-Vahed et al. A multi-objective scatter search for a mixed-model assembly line sequencing problem
Atkinson et al. The zero lower bound and estimation accuracy
CN104992347B (zh) 一种视频匹配广告的方法及装置
CN108205766A (zh) 信息推送方法、装置及系统
Saysel et al. Model simplification and validation with indirect structure validity tests
CN107563841A (zh) 一种基于用户评分分解的推荐系统
Akgündüz et al. An adaptive genetic algorithm approach for the mixed-model assembly line sequencing problem
CN107451894A (zh) 数据处理方法、装置和计算机可读存储介质
CN105760443A (zh) 项目推荐系统、项目推荐装置以及项目推荐方法
CN109544233A (zh) 一种面向电商业务的时尚品需求预测方法
CN111476622B (zh) 一种物品推送方法及装置、计算机可读存储介质
Ruidas et al. Interval valued EOQ model with two types of defective items
CN105184400A (zh) 一种烟田土壤水分预测方法
CN105550901A (zh) 基于少量用户评价的物品流行度与喜好度联合预测系统
LeSage et al. Using interindustry input-output relations as a Bayesian prior in employment forecasting models
CN106600347A (zh) 一种基于多视角数据和循环网络构建序列预测模型的方法
Ioannou et al. Adalip: An adaptive learning rate method per layer for stochastic optimization
CN116054144A (zh) 分布式光伏接入的配电网重构方法、系统及存储介质
CN113254783B (zh) 一种对象推荐方法、装置及设备
Farahmand et al. An improved method for predicting and ranking suppliers efficiency using data envelopment analysis

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20160315

Address after: 510370 Guangdong, Guangzhou, Fangcun, No., No. 20 Huahai street, building 1-5

Applicant after: Guangzhou Pinwei Software Co., Ltd.

Address before: 510370 Guangdong, Guangzhou, Fangcun, No., No. 20 Huahai street, building 1-5

Applicant before: Guangzhou VIPSHOP Information and Technology Co., Ltd.

GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20220105

Address after: 510000 Room 601, 128 Dingxin Road, Haizhu District, Guangzhou City, Guangdong Province (office only)

Patentee after: Vipshop (Guangzhou) Software Co.,Ltd.

Address before: 510370 self compiled buildings 1-5, No. 20, Huahai street, Fangcun, Liwan District, Guangzhou, Guangdong

Patentee before: GUANGZHOU PINWEI SOFTWARE Co.,Ltd.