CN114757695A - 用户购买行为预测模型的构建方法、装置及计算机设备 - Google Patents

用户购买行为预测模型的构建方法、装置及计算机设备 Download PDF

Info

Publication number
CN114757695A
CN114757695A CN202210343871.8A CN202210343871A CN114757695A CN 114757695 A CN114757695 A CN 114757695A CN 202210343871 A CN202210343871 A CN 202210343871A CN 114757695 A CN114757695 A CN 114757695A
Authority
CN
China
Prior art keywords
sample set
user
training sample
information
prediction model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210343871.8A
Other languages
English (en)
Inventor
刘妍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dazhu Hangzhou Technology Co ltd
Original Assignee
Dazhu Hangzhou Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dazhu Hangzhou Technology Co ltd filed Critical Dazhu Hangzhou Technology Co ltd
Priority to CN202210343871.8A priority Critical patent/CN114757695A/zh
Publication of CN114757695A publication Critical patent/CN114757695A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Mathematical Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computing Systems (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种用户购买行为预测模型的构建方法、装置及计算机设备,主要在于能够提高新场景下用户购买行为的预测精度。其中方法包括:获取与用户购买行为相关联的训练样本集和测试样本集;确定所述训练样本集中各个用户的属性特征向量对应的初始权重,并基于所述初始权重和所述训练样本集,构建初始用户购买行为预测模型;计算所述初始用户购买行为预测模型在所述测试样本集上的错误率;若所述错误率不满足预设要求,则通过更新所述初始权重,不断对所述初始用户行为购买模型进行迭代训练,直至任一迭代层级对应的用户购买行为预测模型的错误率满足预设要求,将其作为所述目标场景下的用户购买行为预测模型输出。

Description

用户购买行为预测模型的构建方法、装置及计算机设备
技术领域
本发明涉及人工智能领域,尤其是涉及一种用户购买行为预测模型的构建方法、装置及计算机设备。
背景技术
用户购买行为的预测一直是各电商品台研究的重要课题,大型电商平台一般都沉淀了千万乃至数亿的用户,积累了海量的用户历史数据,并倾向于从用户历史数据中找出规律,去预测用户未来的购买行为。
目前,通常通过收集用户在旧场景中的大量历史数据,来构建旧场景下的预测模型,以便基于该预测模型对用户未来的购买行为进行预测。然而,由于在旧场景下已经积累了海量的真实数据,基于这些数据训练的模型可以对用户的购买行为进行有效预测,而对于一些新场景,其仅存在少量与用户购买行为相关的表现数据,利用少量数据构建的预测模型无法实现新场景下对用户购买行为的精准预测。
发明内容
本发明提供了一种用户购买行为预测模型的构建方法、装置及计算机设备,主要在于能够提高新场景下用户购买行为的预测精度。
根据本发明的第一个方面,提供一种用户购买行为预测模型的构建方法,包括:
获取与用户购买行为相关联的训练样本集和测试样本集,其中,所述训练样本集包括目标场景的目标域训练样本集和历史场景的源域训练样本集;
确定所述训练样本集中各个用户的属性特征向量对应的初始权重,并基于所述初始权重和所述训练样本集,构建初始用户购买行为预测模型;
计算所述初始用户购买行为预测模型在所述测试样本集上的错误率,其中,所述目标域训练样本集与所述测试样本集属于同一分布,所述源域训练样本集与所述测试样本集属于不同分布;
若所述错误率不满足预设要求,则通过更新所述初始权重,不断对所述初始用户行为购买模型进行迭代训练,直至任一迭代层级对应的用户购买行为预测模型的错误率满足预设要求,将其作为所述目标场景下的用户购买行为预测模型输出。
根据本发明的第二个方面,提供一种用户购买行为预测模型的构建装置,包括:
获取单元,用于获取与用户购买行为相关联的训练样本集和测试样本集,其中,所述训练样本集包括目标场景的目标域训练样本集和历史场景的源域训练样本集;
构建单元,用于确定所述训练样本集中各个用户的属性特征向量对应的初始权重,并基于所述初始权重和所述训练样本集,构建初始用户购买行为预测模型;
计算单元,用于计算所述初始用户购买行为预测模型在所述测试样本集上的错误率,其中,所述目标域训练样本集与所述测试样本集属于同一分布,所述源域训练样本集与所述测试样本集属于不同分布;
训练单元,用于若所述错误率不满足预设要求,则通过更新所述初始权重,不断对所述初始用户行为购买模型进行迭代训练,直至任一迭代层级对应的用户购买行为预测模型的错误率满足预设要求,将其作为所述目标场景下的用户购买行为预测模型输出。
根据本发明的第三个方面,提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现以下步骤:
获取与用户购买行为相关联的训练样本集和测试样本集,其中,所述训练样本集包括目标场景的目标域训练样本集和历史场景的源域训练样本集;
确定所述训练样本集中各个用户的属性特征向量对应的初始权重,并基于所述初始权重和所述训练样本集,构建初始用户购买行为预测模型;
计算所述初始用户购买行为预测模型在所述测试样本集上的错误率,其中,所述目标域训练样本集与所述测试样本集属于同一分布,所述源域训练样本集与所述测试样本集属于不同分布;
若所述错误率不满足预设要求,则通过更新所述初始权重,不断对所述初始用户行为购买模型进行迭代训练,直至任一迭代层级对应的用户购买行为预测模型的错误率满足预设要求,将其作为所述目标场景下的用户购买行为预测模型输出。
根据本发明的第四个方面,提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现以下步骤:
获取与用户购买行为相关联的训练样本集和测试样本集,其中,所述训练样本集包括目标场景的目标域训练样本集和历史场景的源域训练样本集;
确定所述训练样本集中各个用户的属性特征向量对应的初始权重,并基于所述初始权重和所述训练样本集,构建初始用户购买行为预测模型;
计算所述初始用户购买行为预测模型在所述测试样本集上的错误率,其中,所述目标域训练样本集与所述测试样本集属于同一分布,所述源域训练样本集与所述测试样本集属于不同分布;
若所述错误率不满足预设要求,则通过更新所述初始权重,不断对所述初始用户行为购买模型进行迭代训练,直至任一迭代层级对应的用户购买行为预测模型的错误率满足预设要求,将其作为所述目标场景下的用户购买行为预测模型输出。
本发明提供的一种用户购买行为预测模型的构建方法、装置及计算机设备,与目前直接利用少量样本数据构建新场景下的预测模型的方式相比,本发明能够获取与用户购买行为相关联的训练样本集和测试样本集,其中,所述训练样本集包括目标场景的目标域训练样本集和历史场景的源域训练样本集;同时确定所述训练样本集中各个用户的属性特征向量对应的初始权重,并基于所述初始权重和所述训练样本集,构建初始用户购买行为预测模型;此外,计算所述初始用户购买行为预测模型在所述测试样本集上的错误率,其中,所述目标域训练样本集与所述测试样本集属于同一分布,所述源域训练样本集与所述测试样本集属于不同分布;若所述错误率不满足预设要求,则通过更新所述初始权重,不断对所述初始用户行为购买模型进行迭代训练,直至任一迭代层级对应的用户购买行为预测模型的错误率满足预设要求,将其作为所述目标场景下的用户购买行为预测模型输出。在本发明中,通过计算初始用户购买行为预测模型的错误率,能够不断对训练样本集中各个属性特征向量对应的权重进行更新,从而能够从历史场景中筛选出目标场景可用的样本数据,并将其与目标场景下的少量样本数据结合,保证目标场景具有足够多的训练样本,进而能够提高目标场景下用户购买行为预测模型的预测精度。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1示出了本发明实施例提供的一种用户购买行为预测模型的构建方法流程图;
图2示出了本发明实施例提供的另一种用户购买行为预测模型的构建方法流程图;
图3示出了本发明实施例提供的一种用户购买行为预测模型的构建装置的结构示意图;
图4示出了本发明实施例提供的另一种用户购买行为预测模型的构建装置的结构示意图;
图5示出了本发明实施例提供的一种计算机设备的实体结构示意图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
目前,对于一些新场景,其仅存在少量与用户购买行为相关的表现数据,利用少量数据构建的预测模型无法实现新场景下对用户购买行为的精准预测。
为了解决上述问题,本发明实施例提供了一种用户购买行为预测模型的构建方法,如图1所示,所述方法包括:
101、获取与用户购买行为相关联的训练样本集和测试样本集。
其中,所述训练样本集包括目标场景的目标域训练样本集和历史场景的源域训练样本集。历史场景为当前已经发展成熟的任意一个业务场景,该历史场景积累了大量用户数据,目标场景为当前还未发展成熟的新兴业务场景,该目标场景仅具有少量用户数据,例如,历史场景为当前已经发展成熟的母婴业务场景,目标业务场景为新兴的舞蹈服饰业务场景。
本发明实施例主要适用于构建新兴业务场景下的用户购买行为预测模型的场景。本发明实施例的执行主体为能够构建新兴业务场景下的用户购买行为预测模型的装置或者设备,具体可以设置在服务器一侧。
对于本发明实施例,为了构建目标场景下的用户购买行为预测模型,需要预先收集历史场景下的用户数据和目标场景下的用户数据,历史场景和目标场景下的用户数据具体包括用户的基础信息、行为信息、关联信息、消费信息等,其中,基础信息具体包括用户的年龄、性别、工作和地域等个人信息,行为信息具体包括用户在一定时间段内浏览相应场景的次数、用户在一定时间段内浏览相应场景商品的价格分布等,关联信息具体可以为与用户具有关联的其他用户的信息,如与用户具有代付款关联的其他用户的基础信息、行为信息等,消费信息具体为用户在相应场景中的历史消费数据。
与此同时,还要收集历史场景下和目标场景下每组用户数据对应的用户实际购买行为,该实际购买行为包括用户在相应场景下购买商品,或者没有购买商品。进一步地,分别对目标场景下和历史场景下用户的基础信息、行为信息、关联信息、消费信息进行特征加工,得到目标场景和历史场景分别对应的各个属性特征向量,其中,该特征加工具体是指对基础信息、行为信息、关联信息、消费信息等进行标准化处理、归一化处理、离散化处理和时序处理等,收集的用户数据经过上述处理后,转换为属性特征向量,该属性特征向量任一维度的数值为0或者1,该属性特征向量对应的维数与收集的信息维度相关。
进一步地,根据目标场景下用户的实际购买行为,对目标场景下用户的属性特征向量进行标注,得到目标场景下标注后的属性特征向量,并将目标场景下标注后的属性特征向量作为目标域训练样本集,同理根据历史场景下用户的实际购买行为,对历史场景下用户的属性特征向量进行标注,得到历史场景下标注后的属性特征向量,并将历史场景下标注后的属性特征向量作为源域训练样本集,例如,当用户的实际购买行为为购买相应场景下的商品时,确定相应属性特征向量对应的标签为1;当用户的实际购买行为未购买相应场景下的商品时,确定相应属性特征向量对应的标签为0。需要说明的是目标域训练样本集中包含少量的样本特征,源域训练样本集中包含大量的样本特征。
进一步地,将目标域训练样本集和源域训练样本集进行合并,作为用于训练新场景下用户购买行为预测模型的训练样本集。与此同时,从目标场景下用户的属性特征向量中抽取部分未进行标注的属性特征向量,将其作为测试样本集。由此能够保证目标域训练样本集与测试样本集具有相同的分布,而源域训练样本集与测试样本集具有不同的分布。
102、确定所述训练样本集中各个用户的属性特征向量对应的初始权重,并基于所述初始权重和所述训练样本集,构建初始用户购买行为预测模型。
对于本发明实施例,由于目标场景下仅具有少量的样本数据(属性特征向量),为了保证目标场景下的预测模型能够具有良好的精度,需要从历史场景中筛选出目标场景可用的样本数据,并将其与目标场景的少量样本数据进行结合,以保证目标场景具有足够的训练样本。
为了实现上述目的,本发明实施例采用预设迁移算法,从历史场景下的样本数据中筛选目标场景可用的样本数据。具体地,首先设定训练样本集中每个属性特征向量对应的初始权重,每个属性特征向量对应的初始权重可以相同,如设定每个属性特征向量对应的初始权重均是1。进一步地,基于训练样本集中的各个属性特征向量及其对应的初始权重,构建初始用户购买行为预测模型,该初始用户购买行为预测模型具体可以为初始决策树分类模型或者初始多层感知器。
103、计算所述初始用户购买行为预测模型在所述测试样本集上的错误率。
其中,所述目标域训练样本集与所述测试样本集属于同一分布,所述源域训练样本集与所述测试样本集属于不同分布。
对于本发明实施例,将测试样本集中的每个属性特征向量依次输入至初始用户购买行为预测模型中进行购买行为预测,得到测试样本集中每个属性特征向量对应的预测购买行为。进一步地,基于测试样本集中每个属性特征向量对应的预测购买行为和实际购买行为,计算初始用户购买行为预测模型对应的错误率。
104、若所述错误率不满足预设要求,则通过更新所述初始权重,不断对所述初始用户行为购买模型进行迭代训练,直至任一迭代层级对应的用户购买行为预测模型的错误率满足预设要求,将其作为所述目标场景下的用户购买行为预测模型输出。
对于本发明实施例,如果初始用户购买行为预测模型对应的错误率大于预设错误率,则对训练样本集中每个属性特征向量对应的初始权重进行更新,具体对初始权重进行更新时,如果训练样本集中某个被分类错误的属性特征向量属于目标域训练样本集,说明该属性特征向量分类较为困难,需要提高该属性特征向量对应的权重;如果训练样本集中某个被分类错误的属性特征向量属于源域训练样本集,说明该属性特征向量与目标域训练样本集的关联度不大,需要降低该属性特征向量对应的权重,从而能够得到训练样本集中各个属性特征向量对应的更新后的权重。
进一步地,基于更新后的权重和训练样本集,对初始用户购买行为预测模型进行更新迭代,之后继续计算本轮迭代的用户购买行为预测模型对应的错误率,如果该错误率大于预设错误率,重复上述迭代过程,直至某一迭代层级的预测模型的错误率小于预设错误率,停止迭代,并将最终迭代的预测模型确定为目标场景下的用户购买行为预测模型。其中,该预设错误率可以根据实际业务需求进行设定,如设定预设错误率为0.5。
本发明实施例提供的一种用户购买行为预测模型的构建方法,通过计算初始用户购买行为预测模型的错误率,能够不断对训练样本集中各个属性特征向量对应的权重进行更新,从而能够从历史场景中筛选出目标场景可用的样本数据,并将其与目标场景下的少量样本数据结合,保证目标场景具有足够多的训练样本,进而能够提高目标场景下用户购买行为预测模型的预测精度。
进一步的,为了更好的说明上述构建新场景下用户购买行为预测模型的过程,作为对上述实施例的细化和扩展,本发明实施例提供了另一种用户购买行为预测模型的构建方法,如图2所示,所述方法包括:
201、获取与用户购买行为相关联的训练样本集和测试样本集。
其中,所述训练样本集包括目标场景的目标域训练样本集和历史场景的源域训练样本集。
对于本发明实施例,为了获取训练样本集,步骤201具体包括:分别收集所述历史场景下各个用户的基础信息、行为信息、关联信息和消费信息,以及所述目标场景下各个用户的基础信息、行为信息、关联信息和消费信息;根据所述历史场景下各个用户的基础信息、行为信息、关联信息和消费信息,以及所述目标场景下各个用户的基础信息、行为信息、关联信息和消费信息,确定所述历史场景和所述目标场景分别对应的各个属性特征向量;根据所述历史场景下各个用户的实际购买行为和所述目标场景下各个用户的实际购买行为,确定所述历史场景和所述目标场景分别对应的各个属性特征向量的标签;根据所述历史场景下的各个属性特征向量及其对应的标签,以及所述目标场景下的各个属性特征向量及其对应的标签,分别确定所述源域训练样本集和所述目标域训练样本集,其中,所述源域训练样本集中属性特征向量的数量大于所述目标域训练样本集中属性特征向量的数量。
具体地,通过对基础信息、行为信息、关联信息和消费信息进行标准化处理、归一化处理、离散化处理和时序处理,得到目标场景和历史场景分别对应的各个属性特征向量。进一步地,根据历史场景下的各个属性特征向量及其对应的标签,定义源域训练样本集
Figure BDA0003580328980000081
同时根据目标场景下的各个属性特征向量及其对应的标签,定义目标域训练样本集
Figure BDA0003580328980000082
Figure BDA0003580328980000083
由此能够得到训练样本集中的所有样本数据,如下:
Figure BDA0003580328980000084
其中,有n个数据来自源域训练样本集,有m个数据来自目标域训练样本集,n远大于m。
在具体应用场景中,除了获取目标场景和历史场景下用户的基础信息、行为信息、关联信息和消费信息,还可以根据上述信息,生成衍生信息,以便增加信息维度,基于此,所述方法包括:根据所述历史场景下各个用户的基础信息、行为信息、关联信息和消费信息,确定所述历史场景下各个用户的衍生信息;对所述历史场景下各个用户的基础信息、行为信息、关联信息、消费信息和衍生信息进行特征加工,得到所述历史场景对应的各个属性特征向量;根据所述目标场景下各个用户的基础信息、行为信息、关联信息和消费信息,确定所述目标场景下各个用户的衍生信息;对所述目标场景下各个用户的基础信息、行为信息、关联信息、消费信息和衍生信息进行特征加工,得到所述目标场景对应的各个属性特征向量。
例如,基础信息为用户的地域,消费信息为用户在一定时间段内购买的商品品类,根据上述两种信息,可以衍生出用户在该地域一定时间段内购买的商品品类。
在具体应用场景中,由于目标场景可能是针对特定人群,因此可以从收集的用户信息维度中筛选出符合特定人群的目标信息维度,从而能够减少模型训练过程中的计算量,基于此,所述方法包括:基于所述目标场景所针对的人群特征,分别对所述历史场景下各个用户的基础信息、行为信息、关联信息和消费信息,以及所述目标场景下各个用户的基础信息、行为信息、关联信息和消费信息进行信息维度筛选;基于所述历史场景下各个用户筛选后的信息,以及所述目标场景下各个用户筛选后的信息,确定所述历史场景和所述目标场景分别对应的各个属性特征向量。
例如,针对目标场景和历史场景收集的信息维度包括用户的基础信息、行为信息、关联信息和消费信息,由于关联信息与适用目标场景的特定人群关联不大,因此可以将关联信息剔除,仅根据基础信息、行为信息和消费信息,确定目标场景和历史场景下的各个属性特征向量。
进一步地,针对获取与用户购买行为相关联的测试样本集的具体过程,所述方法包括:从所述目标场景对应的各个属性特征向量中抽取未进行标注的预设数量的属性特征向量;根据所述未进行标注的预设数量的属性特征向量,确定所述测试样本集。其中,预设数量可以根据实际业务需求进行设定,例如,目标域训练样本集中共存在200个属性特征向量,抽取其中100个未进行标注的属性特征向量作为测试样本集
Figure BDA0003580328980000101
202、确定所述训练样本集中各个用户的属性特征向量对应的初始权重,并基于所述初始权重和所述训练样本集,构建初始用户购买行为预测模型。
例如,源域训练样本集为Told,目标域训练样本集为Tnew,将两者合并成训练样本集为T=Told∪Tnew,并设定迭代次数N,之后为目标域训练样本集中的每个属性特征向量和源域训练样本集中的每个属性特征向量设定一个初始权重,从而能够得到初始权重向量为:
Figure BDA0003580328980000102
Figure BDA0003580328980000103
其中,n为源域训练样本集中的样本数量,m为目标域训练样本集中的样本数量,n+m为训练样本集中的样本数量,wi 1为训练样本集中任意一个属性特征向量对应的初始权重。
进一步地,根据训练样本集中各个属性特征向量对应的初始权重,确定初始权重分布,该初始权重分布具体为:
Figure BDA0003580328980000104
进一步地,根据该初始权重分布和训练样本集进行迭代训练,构建初始分类器,即初始用户购买行为预测模型,该初始用户购买行为模型能够基于用户的属性特征向量与用户购买行为之间的映射关系对用户的购买行为进行预测。
203、计算所述初始用户购买行为预测模型在所述测试样本集上的错误率。
其中,所述目标域训练样本集与所述测试样本集属于同一分布,所述源域训练样本集与所述测试样本集属于不同分布。
对于本发明实施例,为了对初始用户购买行为预测模型不断进行更新迭代,需要计算预测模型在所述测试样本集上的错误率,针对计算该错误率的具体过程,所述方法包括:将所述测试样本集中各个属性特征向量依次输入至所述初始用户购买行为预测模型中进行购买行为预测,得到所述测试样本集中各个属性特征向量对应的预测购买行为;对所述测试样本集中各个属性特征向量对应的初始权重进行归一化处理,得到归一化处理后的初始权重;根据所述归一化处理后的初始权重,以及所述测试样本集中各个属性特征向量对应的预测购买行为和实际购买行为,计算所述初始用户购买行为预测模型的错误率。
204、若所述错误率不满足预设要求,则通过更新所述初始权重,不断对所述初始用户行为购买模型进行迭代训练,直至任一迭代层级对应的用户购买行为预测模型的错误率满足预设要求,将其作为所述目标场景下的用户购买行为预测模型输出。
对于本发明实施例,如果构建的初始用户购买行为预测模型的错误率大于或者等于预设错误率,则对训练样本集中各个属性特征向量对应的初始权重进行更新,通过对初始权重进行更新,能够从历史场景的源域训练样本集中筛选出目标场景可用的样本数据,从而能够保证目标场景具有足够的训练样本,针对更新初始权重的具体过程,所述方法包括:在训练所述初始用户购买行为预测模型的过程中,确定所述训练样本集中被分类错误的属性特征向量;计算所述目标域训练样本集中任意一个属性特征向量对应的第一权重调整速率,以及所述源域训练样本集中任意一个属性特征向量对应的第二权重调整速率;若被分类错误的属性特征向量属于所述源域训练样本集,则基于所述第二权重调整速率,降低所述被分类错误的属性特征向量对应的初始权重;若被分类错误的属性特征向量属于所述目标域训练样本集,则基于所述第一权重调整速率,提高所述被分类错误的属性特征向量对应的初始权重。
具体地,源域训练样本集中被分类错误的属性特征向量的初始权重被降低后,其在下一轮模型迭代训练中所占的比重会较小,而目标域训练样本集中被分类错误的属性特征向量的初始权重被提高后,其在下一轮模型迭代训练中所占的比重会较大,由此通过调整初始权重,能够从源域训练样本集中筛选出目标场景可用的样本数据,将其与目标场景的少量样本数据结合。
进一步地,在更新训练样本集中每个属性特征向量对应的初始权重之后,基于更新后的初始权重的分布和训练样本集,对初始用户购买行为预测模型进行迭代,得到本轮迭代后的用户购买行为预测模型。
在本发明实施例中,针对第t轮迭代的权重分布,具体可以表示为:
Figure BDA0003580328980000121
其中,pt为第t轮迭代的权重分布,wi t为第t轮迭代训练样本集中第i个属性特征向量对应的权重。
进一步地,根据第t轮迭代的权重分布和训练样本集,对预测模型进行第t轮迭代训练,得到第t轮迭代对应的用户购买行为预测模型,之后计算第t轮迭代的用户购买行为预测模型在测试样本集上的错误率,该错误率的具体计算公式如下:
Figure BDA0003580328980000122
其中,xi属于测试样本集中的任意一个属性特征向量,ft(x)为第t轮迭代的预测模型,c(xi)为属性特征向量对应的实际购买行为。由此通过上述公式能够计算出第t轮迭代的预测模型对应的错误率。
进一步地,如果第t轮迭代的预测模型对应的错误率大于或者等于预设错误率,则对其权重进行更新,具体公式如下:
Figure BDA0003580328980000131
其中,β为源域训练样本集中任意一个属性特征向量对应的第二权重调整速率,βt为目标域训练样本集中任意一个属性特征向量对应的第一权重调整速率,wt+1为第t+1轮迭代过程中属性特征向量对应的权重。
进一步地,重复更新权重和对预测模型迭代训练的过程,直至某一迭代层级对应的预测模型的错误率小于预设错误率,或者已经达到预设迭代次数N,停止迭代,最终输出目标场景下的用户购买行为预测模型,该模型具体为:
Figure BDA0003580328980000132
205、获取待预测用户在目标场景下的基础信息、行为信息、关联信息和消费信息,并基于所述待预测用户对应的基础信息、行为信息、关联信息和消费信息,确定所述待预测用户对应的目标属性特征。
对于本发明实施例,在构建完成目标场景下的用户购买行为预测模型之后,如果想要对某个用户在目标场景下的购买行为进行预测,需要先收集该用户在目标场景下的基础信息、行为信息、关联信息和消费信息等,之后对上述信息进行标准化处理、归一化处理和离散化处理等,得到该用户对应的目标属性特征向量。
206、将所述目标属性特征输入至所述目标场景下的用户购买行为预测模型中进行购买行为预测,得到所述待预测用户对应的预测购买行为。
对于本发明实施例,将用户的目标属性特征向量输入至目标场景下的用户购买行为预测模型进行行为预测,如果输出结果为1,则表示该用户未来会在目标场景下进行购买;如果输出结果为0,则表示该用户未来可能不会在该目标场景下进行购买。根据该预测结果,能够提高营销推荐的准确率。
本发明实施例提供的另一种用户购买行为预测模型的构建方法,通过计算初始用户购买行为预测模型的错误率,能够不断对训练样本集中各个属性特征向量对应的权重进行更新,从而能够从历史场景中筛选出目标场景可用的样本数据,并将其与目标场景下的少量样本数据结合,保证目标场景具有足够多的训练样本,进而能够提高目标场景下用户购买行为预测模型的预测精度。
进一步地,作为图1的具体实现,本发明实施例提供了一种用户购买行为预测模型的构建装置,如图3所示,所述装置包括:获取单元31、构建单元32、计算单元33和训练单元34。
所述获取单元31,可以用于获取与用户购买行为相关联的训练样本集和测试样本集,其中,所述训练样本集包括目标场景的目标域训练样本集和历史场景的源域训练样本集。
所述构建单元32,可以用于确定所述训练样本集中各个用户的属性特征向量对应的初始权重,并基于所述初始权重和所述训练样本集,构建初始用户购买行为预测模型。
所述计算单元33,可以用于计算所述初始用户购买行为预测模型在所述测试样本集上的错误率,其中,所述目标域训练样本集与所述测试样本集属于同一分布,所述源域训练样本集与所述测试样本集属于不同分布。
所述训练单元34,可以用于若所述错误率不满足预设要求,则通过更新所述初始权重,不断对所述初始用户行为购买模型进行迭代训练,直至任一迭代层级对应的用户购买行为预测模型的错误率满足预设要求,将其作为所述目标场景下的用户购买行为预测模型输出。
在具体应用场景中,所述获取单元31,如图4所示,包括:收集模块311和第一确定模块312。
所述收集模块311,可以用于分别收集所述历史场景下各个用户的基础信息、行为信息、关联信息和消费信息,以及所述目标场景下各个用户的基础信息、行为信息、关联信息和消费信息。
所述第一确定模块312,可以用于根据所述历史场景下各个用户的基础信息、行为信息、关联信息和消费信息,以及所述目标场景下各个用户的基础信息、行为信息、关联信息和消费信息,确定所述历史场景和所述目标场景分别对应的各个属性特征向量。
所述第一确定模块312,还可以用于根据所述历史场景下各个用户的实际购买行为和所述目标场景下各个用户的实际购买行为,确定所述历史场景和所述目标场景分别对应的各个属性特征向量的标签。
所述第一确定模块312,还可以用于根据所述历史场景下的各个属性特征向量及其对应的标签,以及所述目标场景下的各个属性特征向量及其对应的标签,分别确定所述源域训练样本集和所述目标域训练样本集,其中,所述源域训练样本集中属性特征向量的数量大于所述目标域训练样本集中属性特征向量的数量。
在具体应用场景中,所述第一确定模块312,具体可以用于基于所述目标场景所针对的人群特征,分别对所述历史场景下各个用户的基础信息、行为信息、关联信息和消费信息,以及所述目标场景下各个用户的基础信息、行为信息、关联信息和消费信息进行信息维度筛选;基于所述历史场景下各个用户筛选后的信息,以及所述目标场景下各个用户筛选后的信息,确定所述历史场景和所述目标场景分别对应的各个属性特征向量。
在具体应用场景中,所述获取单元31,还包括:抽取模块313。
所述抽取模块313,可以用于从所述目标场景对应的各个属性特征向量中抽取未进行标注的预设数量的属性特征向量。
所述第一确定模块312,还可以用于根据所述未进行标注的预设数量的属性特征向量,确定所述测试样本集。
在具体应用场景中,所述计算单元33,包括:预测模块331、处理模块332和第一计算模块333。
所述预测模块331,可以用于将所述测试样本集中各个属性特征向量依次输入至所述初始用户购买行为预测模型中进行购买行为预测,得到所述测试样本集中各个属性特征向量对应的预测购买行为。
所述处理模块332,可以用于对所述测试样本集中各个属性特征向量对应的初始权重进行归一化处理,得到归一化处理后的初始权重。
所述第一计算模块333,可以用于根据所述归一化处理后的初始权重,以及所述测试样本集中各个属性特征向量对应的预测购买行为和实际购买行为,计算所述初始用户购买行为预测模型的错误率。
在具体应用场景中,所述训练单元34,包括:第二确定模块341、第二计算模块342、降低模块343和提高模块344。
所述第二确定模块341,可以用于在训练所述初始用户购买行为预测模型的过程中,确定所述训练样本集中被分类错误的属性特征向量。
所述第二计算模块342,可以用于计算所述目标域训练样本集中任意一个属性特征向量对应的第一权重调整速率,以及所述源域训练样本集中任意一个属性特征向量对应的第二权重调整速率。
所述降低模块343,可以用于若被分类错误的属性特征向量属于所述源域训练样本集,则基于所述第二权重调整速率,降低所述被分类错误的属性特征向量对应的初始权重。
所述提高模块344,可以用于若被分类错误的属性特征向量属于所述目标域训练样本集,则基于所述第一权重调整速率,提高所述被分类错误的属性特征向量对应的初始权重。
在具体应用场景中,所述装置还包括:确定单元35和预测单元36。
所述获取单元31,还可以用于获取待预测用户在目标场景下的基础信息、行为信息、关联信息和消费信息。
所述确定单元35,可以用于基于所述待预测用户对应的基础信息、行为信息、关联信息和消费信息,确定所述待预测用户对应的目标属性特征。
所述预测单元36,可以用于将所述目标属性特征输入至所述目标场景下的用户购买行为预测模型中进行购买行为预测,得到所述待预测用户对应的预测购买行为。
需要说明的是,本发明实施例提供的一种用户购买行为预测模型的构建装置所涉及各功能模块的其他相应描述,可以参考图1所示方法的对应描述,在此不再赘述。
基于上述如图1所示方法,相应的,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现以下步骤:获取与用户购买行为相关联的训练样本集和测试样本集,其中,所述训练样本集包括目标场景的目标域训练样本集和历史场景的源域训练样本集;确定所述训练样本集中各个用户的属性特征向量对应的初始权重,并基于所述初始权重和所述训练样本集,构建初始用户购买行为预测模型;计算所述初始用户购买行为预测模型在所述测试样本集上的错误率,其中,所述目标域训练样本集与所述测试样本集属于同一分布,所述源域训练样本集与所述测试样本集属于不同分布;若所述错误率不满足预设要求,则通过更新所述初始权重,不断对所述初始用户行为购买模型进行迭代训练,直至任一迭代层级对应的用户购买行为预测模型的错误率满足预设要求,将其作为所述目标场景下的用户购买行为预测模型输出。
基于上述如图1所示方法和如图3所示装置的实施例,本发明实施例还提供了一种计算机设备的实体结构图,如图5所示,该计算机设备包括:处理器41、存储器42、及存储在存储器42上并可在处理器上运行的计算机程序,其中存储器42和处理器41均设置在总线43上所述处理器41执行所述程序时实现以下步骤:获取与用户购买行为相关联的训练样本集和测试样本集,其中,所述训练样本集包括目标场景的目标域训练样本集和历史场景的源域训练样本集;确定所述训练样本集中各个用户的属性特征向量对应的初始权重,并基于所述初始权重和所述训练样本集,构建初始用户购买行为预测模型;计算所述初始用户购买行为预测模型在所述测试样本集上的错误率,其中,所述目标域训练样本集与所述测试样本集属于同一分布,所述源域训练样本集与所述测试样本集属于不同分布;若所述错误率不满足预设要求,则通过更新所述初始权重,不断对所述初始用户行为购买模型进行迭代训练,直至任一迭代层级对应的用户购买行为预测模型的错误率满足预设要求,将其作为所述目标场景下的用户购买行为预测模型输出。
本发明通过计算初始用户购买行为预测模型的错误率,能够不断对训练样本集中各个属性特征向量对应的权重进行更新,从而能够从历史场景中筛选出目标场景可用的样本数据,并将其与目标场景下的少量样本数据结合,保证目标场景具有足够多的训练样本,进而能够提高目标场景下用户购买行为预测模型的预测精度。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。

Claims (10)

1.一种用户购买行为预测模型的构建方法,其特征在于,包括:
获取与用户购买行为相关联的训练样本集和测试样本集,其中,所述训练样本集包括目标场景的目标域训练样本集和历史场景的源域训练样本集;
确定所述训练样本集中各个用户的属性特征向量对应的初始权重,并基于所述初始权重和所述训练样本集,构建初始用户购买行为预测模型;
计算所述初始用户购买行为预测模型在所述测试样本集上的错误率,其中,所述目标域训练样本集与所述测试样本集属于同一分布,所述源域训练样本集与所述测试样本集属于不同分布;
若所述错误率不满足预设要求,则通过更新所述初始权重,不断对所述初始用户行为购买模型进行迭代训练,直至任一迭代层级对应的用户购买行为预测模型的错误率满足预设要求,将其作为所述目标场景下的用户购买行为预测模型输出。
2.根据权利要求1所述的方法,其特征在于,获取与用户购买行为相关联的训练样本集,包括:
分别收集所述历史场景下各个用户的基础信息、行为信息、关联信息和消费信息,以及所述目标场景下各个用户的基础信息、行为信息、关联信息和消费信息;
根据所述历史场景下各个用户的基础信息、行为信息、关联信息和消费信息,以及所述目标场景下各个用户的基础信息、行为信息、关联信息和消费信息,确定所述历史场景和所述目标场景分别对应的各个属性特征向量;
根据所述历史场景下各个用户的实际购买行为和所述目标场景下各个用户的实际购买行为,确定所述历史场景和所述目标场景分别对应的各个属性特征向量的标签;
根据所述历史场景下的各个属性特征向量及其对应的标签,以及所述目标场景下的各个属性特征向量及其对应的标签,分别确定所述源域训练样本集和所述目标域训练样本集,其中,所述源域训练样本集中属性特征向量的数量大于所述目标域训练样本集中属性特征向量的数量。
3.根据权利要求2所述的方法,其特征在于,所述根据所述历史场景下各个用户的基础信息、行为信息、关联信息和消费信息,以及所述目标场景下各个用户的基础信息、行为信息、关联信息和消费信息,确定所述历史场景和所述目标场景分别对应的各个属性特征向量,包括:
基于所述目标场景所针对的人群特征,分别对所述历史场景下各个用户的基础信息、行为信息、关联信息和消费信息,以及所述目标场景下各个用户的基础信息、行为信息、关联信息和消费信息进行信息维度筛选;
基于所述历史场景下各个用户筛选后的信息,以及所述目标场景下各个用户筛选后的信息,确定所述历史场景和所述目标场景分别对应的各个属性特征向量。
4.根据权利要求2所述的方法,其特征在于,获取与用户购买行为相关联的测试样本集,包括:
从所述目标场景对应的各个属性特征向量中抽取未进行标注的预设数量的属性特征向量;
根据所述未进行标注的预设数量的属性特征向量,确定所述测试样本集。
5.根据权利要求1所述的方法,其特征在于,所述计算所述初始用户购买行为预测模型在所述测试样本集上的错误率,包括:
将所述测试样本集中各个属性特征向量依次输入至所述初始用户购买行为预测模型中进行购买行为预测,得到所述测试样本集中各个属性特征向量对应的预测购买行为;
对所述测试样本集中各个属性特征向量对应的初始权重进行归一化处理,得到归一化处理后的初始权重;
根据所述归一化处理后的初始权重,以及所述测试样本集中各个属性特征向量对应的预测购买行为和实际购买行为,计算所述初始用户购买行为预测模型的错误率。
6.根据权利要求5所述的方法,其特征在于,更新所述初始权重,包括:
在训练所述初始用户购买行为预测模型的过程中,确定所述训练样本集中被分类错误的属性特征向量;
计算所述目标域训练样本集中任意一个属性特征向量对应的第一权重调整速率,以及所述源域训练样本集中任意一个属性特征向量对应的第二权重调整速率;
若被分类错误的属性特征向量属于所述源域训练样本集,则基于所述第二权重调整速率,降低所述被分类错误的属性特征向量对应的初始权重;
若被分类错误的属性特征向量属于所述目标域训练样本集,则基于所述第一权重调整速率,提高所述被分类错误的属性特征向量对应的初始权重。
7.根据权利要求1-6任一项所述的方法,其特征在于,所述方法还包括:
获取待预测用户在目标场景下的基础信息、行为信息、关联信息和消费信息;
基于所述待预测用户对应的基础信息、行为信息、关联信息和消费信息,确定所述待预测用户对应的目标属性特征;
将所述目标属性特征输入至所述目标场景下的用户购买行为预测模型中进行购买行为预测,得到所述待预测用户对应的预测购买行为。
8.一种用户购买行为预测模型的构建装置,其特征在于,包括:
获取单元,用于获取与用户购买行为相关联的训练样本集和测试样本集,其中,所述训练样本集包括目标场景的目标域训练样本集和历史场景的源域训练样本集;
构建单元,用于确定所述训练样本集中各个用户的属性特征向量对应的初始权重,并基于所述初始权重和所述训练样本集,构建初始用户购买行为预测模型;
计算单元,用于计算所述初始用户购买行为预测模型在所述测试样本集上的错误率,其中,所述目标域训练样本集与所述测试样本集属于同一分布,所述源域训练样本集与所述测试样本集属于不同分布;
训练单元,用于若所述错误率不满足预设要求,则通过更新所述初始权重,不断对所述初始用户行为购买模型进行迭代训练,直至任一迭代层级对应的用户购买行为预测模型的错误率满足预设要求,将其作为所述目标场景下的用户购买行为预测模型输出。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
CN202210343871.8A 2022-04-02 2022-04-02 用户购买行为预测模型的构建方法、装置及计算机设备 Pending CN114757695A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210343871.8A CN114757695A (zh) 2022-04-02 2022-04-02 用户购买行为预测模型的构建方法、装置及计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210343871.8A CN114757695A (zh) 2022-04-02 2022-04-02 用户购买行为预测模型的构建方法、装置及计算机设备

Publications (1)

Publication Number Publication Date
CN114757695A true CN114757695A (zh) 2022-07-15

Family

ID=82329150

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210343871.8A Pending CN114757695A (zh) 2022-04-02 2022-04-02 用户购买行为预测模型的构建方法、装置及计算机设备

Country Status (1)

Country Link
CN (1) CN114757695A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117974276A (zh) * 2024-04-02 2024-05-03 深圳市灵智数字科技有限公司 商品推荐模型训练方法、商品推荐方法及电子设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117974276A (zh) * 2024-04-02 2024-05-03 深圳市灵智数字科技有限公司 商品推荐模型训练方法、商品推荐方法及电子设备
CN117974276B (zh) * 2024-04-02 2024-08-02 深圳市灵智数字科技有限公司 商品推荐模型训练方法、商品推荐方法及电子设备

Similar Documents

Publication Publication Date Title
CN110503531B (zh) 时序感知的动态社交场景推荐方法
CN111507768B (zh) 一种潜在用户的确定方法及相关装置
WO2021081962A1 (zh) 推荐模型的训练方法、推荐方法、装置及计算机可读介质
CN110148023A (zh) 基于逻辑回归的电力积分商品推荐方法及系统
CN110427560A (zh) 一种应用于推荐系统的模型训练方法以及相关装置
CN108665148B (zh) 一种电子资源质量评价方法、装置和存储介质
CN109685537B (zh) 用户行为的分析方法、装置、介质和电子设备
CN109189921A (zh) 评论评估模型的训练方法和装置
CN113592605B (zh) 基于相似产品的产品推荐方法、装置、设备及存储介质
CN111612499A (zh) 信息的推送方法及装置、存储介质、终端
CN111695024A (zh) 对象评估值的预测方法及系统、推荐方法及系统
CN112686312A (zh) 一种数据分类方法、装置及系统
CN114219562A (zh) 模型的训练方法、企业信用评估方法和装置、设备、介质
CN111488517A (zh) 用于训练点击率预估模型的方法和装置
CN117061322A (zh) 物联网流量池管理方法及系统
CN112328869A (zh) 一种用户贷款意愿的预测方法、装置及计算机系统
CN111538909A (zh) 一种信息推荐方法及装置
CN114757695A (zh) 用户购买行为预测模型的构建方法、装置及计算机设备
CN114266601A (zh) 营销策略确定方法、装置、终端设备及存储介质
Wang et al. App Download Forecasting: An Evolutionary Hierarchical Competition Approach.
CN107943943B (zh) 用户相似度的确定方法、装置、电子设备及存储介质
CN110457387A (zh) 一种应用于网络中用户标签确定的方法及相关装置
CN113837843B (zh) 产品推荐方法、装置、介质及电子设备
CN112328899B (zh) 信息处理方法、信息处理装置、存储介质与电子设备
CN112632275B (zh) 基于个人文本信息的人群聚类数据处理方法、装置及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination