CN114579854A - 商品推荐方法、模型训练方法、装置及电子设备 - Google Patents

商品推荐方法、模型训练方法、装置及电子设备 Download PDF

Info

Publication number
CN114579854A
CN114579854A CN202210203626.7A CN202210203626A CN114579854A CN 114579854 A CN114579854 A CN 114579854A CN 202210203626 A CN202210203626 A CN 202210203626A CN 114579854 A CN114579854 A CN 114579854A
Authority
CN
China
Prior art keywords
data
commodity
purchase probability
consumption behavior
personal basic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210203626.7A
Other languages
English (en)
Inventor
储开龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hubei Tiantian Digital Chain Technology Co ltd
Original Assignee
Hubei Tiantian Digital Chain Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hubei Tiantian Digital Chain Technology Co ltd filed Critical Hubei Tiantian Digital Chain Technology Co ltd
Priority to CN202210203626.7A priority Critical patent/CN114579854A/zh
Publication of CN114579854A publication Critical patent/CN114579854A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate

Abstract

本申请提供一种商品推荐方法、模型训练方法、装置及电子设备,属于计算机技术领域。该商品推荐方法,包括:获取消费者的个人基本数据、消费行为数据以及指定商品的商品数据;基于所述个人基本数据、所述消费行为数据、所述商品数据和预先训练好的购买概率模型,得到预测购买概率;根据所述预测购买概率向所述消费者推荐该预测购买概率对应的商品。本方案充分考虑到了用户自身的个人基本数据以及消费行为数据和商品本身的商品数据对用户的影响,使得本方案最终得到的推荐结果能准确地贴合用户需求,继而可以提高商品销量。

Description

商品推荐方法、模型训练方法、装置及电子设备
技术领域
本申请涉及计算机的技术领域,具体而言,涉及一种商品推荐方法、模型训练方法、装置及电子设备。
背景技术
推荐系统的兴起与互联网的发展息息相关,随着大数据时代的来临,网络中的信息量呈现指数式增长,随之带来了信息过载问题。推荐系统是解决信息过载最有效的方式。推荐系统可以有效的对信息进行过滤和筛选,帮助用户以个性化的方式来检索符合其需求的信息资源,缓解信息过载的问题。但现有的推荐方法往往是通过用户的历史行为数据来进行推荐,但通过该方式得到的推荐结果并不能准确地贴合用户需求。
发明内容
本申请提供一种商品推荐方法、模型训练方法、装置及电子设备,以解决现有的推荐方法往往是通过用户的历史行为数据来进行推荐,但通过该方式得到的推荐结果并不能准确地贴合用户需求的问题。
第一方面,本申请提供一种商品推荐方法,包括:获取消费者的个人基本数据、消费行为数据以及指定商品的商品数据;基于所述个人基本数据、所述消费行为数据、所述商品数据和预先训练好的购买概率模型,得到预测购买概率;根据所述预测购买概率向所述消费者推荐该预测购买概率对应的商品。
本申请实施例中,通过获取消费者的个人基本数据、消费行为数据以及指定商品的商品数据,再通过个人基本数据、消费行为数据、商品数据和预先训练好的购买概率模型,即可得到预测购买概率,并可以根据预测购买概率向该消费者推荐该预测购买概率对应的商品,本方案充分考虑到了用户自身的个人基本数据、消费行为数据和商品本身的商品数据对用户的影响,使得本方案最终得到的推荐结果能准确地贴合用户需求,继而可以提高商品销量。
结合上述第一方面提供的技术方案,在一些可能的实施方式中,所述基于所述个人基本数据、所述消费行为数据、所述商品数据和预先训练好的购买概率模型,得到预测购买概率,包括:将所述商品数据、所述个人基本数据和所述消费行为数据进行拼接,得到第一拼接数据;基于预设的全连接层对所述第一拼接数据进行处理,得到全连接数据;将所述商品数据、所述个人基本数据做线性交叉,得到线性交叉数据;将所述全连接数据和所述线性交叉数据进行拼接,得到第二拼接数据;基于所述第二拼接数据和预先训练好的购买概率模型,得到预测购买概率。
本申请实施例中,通过将商品数据、个人基本数据和消费行为数据进行拼接,得到第一拼接数据,再基于预设的全连接层对第一拼接数据进行处理,得到全连接数据,同时将商品数据、个人基本数据做线性交叉,得到线性交叉数据,之后将全连接数据和线性交叉数据进行拼接,得到第二拼接数据,使得第二拼接数据能充分体现商品信息和用户的个人基本数据和消费行为数据,进而使得基于第二拼接数据和预先训练好的购买概率模型得到的预测购买概率更加贴合用户实际情况,从而使得最终得到的推荐结果更加准确。
结合上述第一方面提供的技术方案,在一些可能的实施方式中,所述获取消费者的个人基本数据、消费行为数据以及指定商品的商品数据,包括:获取所述消费者的初始个人基本数据和初始消费行为数据以及所述指定商品的基本商品数据;分别对所述基本商品数据、所述初始个人基本数据和所述初始消费行为数据做第一预设编码方式处理,得到所述个人基本数据、所述消费行为数据以及所述指定商品的商品数据。
本申请实施例中,通过对基本商品数据、初始个人基本数据和初始消费行为数据做第一预设编码方式处理,使得到的消费者的个人基本数据、消费行为数据以及指定商品的商品数据格式一致,便于后续进行步骤的进行。
结合上述第一方面提供的技术方案,在一些可能的实施方式中,获取所述基本商品数据,包括:获取所述指定商品的初始商品数据,所述初始商品数据具有不同维度的多个特征;对所述初始商品数据做第二预设编码方式处理;将所述第二预设编码处理后的所述初始商品数据包括的每个特征做维度重要性排名,选取重要性大于阈值的特征作为所需的特征,得到所述基本商品数据。
本申请实施例中,通过对指定商品的初始商品数据做第二预设编码方式处理,之后将第二预设编码处理后的初始商品数据包括的每个特征做维度重要性排名,选取重要性大于阈值的特征作为所需的特征,得到基本商品数据,从而可以降低基本商品数据中包含的特征的维度,减小后续的计算量,同时,由于基本商品数据中重要性大于阈值的特征都被保留下来,不会降低基于该基本商品数据得到的推荐结果的准确性。
结合上述第一方面提供的技术方案,在一些可能的实施方式中,所述方法还包括:获取训练样本集,所述训练样本集包括所述个人基本数据、所述消费行为数据、多个商品的历史商品数据,以及与所述多个商品一一对应的多个标签,每个标签表征对应商品是否被所述消费者购买;基于所述训练样本集对初始网络模型进行训练,得到训练好的所述购买概率模型。
本申请实施例中,通过包括多个历史商品数据、个人基本数据、消费行为数据以及与所述多个商品一一对应的多个标签的训练样本集对购买概率模型进行训练,使得得到训练好的购买概率模型能更加准确地预测消费者的购买概率,提高最终的推荐结果的准确性。
结合上述第一方面提供的技术方案,在一些可能的实施方式中,基于所述训练样本集对所述购买概率模型进行训练,得到训练好的购买概率模型,包括:针对每一个商品,将该商品对应的历史商品数据与所述个人基本数据和所述消费行为数据进行拼接,得到第一拼接数据;基于预设的全连接层对所述第一拼接数据进行处理,得到全连接数据;将该商品对应的历史商品数据与所述个人基本数据做线性交叉,得到线性交叉数据;将所述全连接数据和所述线性交叉数据进行拼接,得到第二拼接数据;利用多个商品对应的第二拼接数据以及对应的标签,对初始网络模型进行训练,得到训练好的所述购买概率模型。
结合上述第一方面提供的技术方案,在一些可能的实施方式中,所述商品数据包括商品价格、商品用途、商品种类、商品图片、商品描述、商品评价中的至少一种数据。
本申请实施例中,由于商品数据包括商品价格、商品用途、商品种类、商品图片、商品描述、商品评价,使得该商品数据能准确体现该商品的特点,进而使得基于该商品数据得到的预测购买概率更加准确。
结合上述第一方面提供的技术方案,在一些可能的实施方式中,所述个人基本数据包括消费者性别、年龄、学历、职业、城市、爱好中的至少一种数据。
本申请实施例中,由于个人基本数据包括消费者性别、年龄、学历、职业、城市、爱好,使得该个人基本数据能准确体现消费者的自身特点,进而使得基于该个人基本数据得到的预测购买概率更加符合消费者的实际情况,提高预测的准确性。
结合上述第一方面提供的技术方案,在一些可能的实施方式中,所述消费行为数据包括点击记录、购买记录、购物车、收藏、评论中的至少一种数据。
本申请实施例中,由于消费行为数据包括点击记录、购买记录、购物车、收藏、评论,使得该消费行为数据能准确体现消费者的消费特点,进而使得基于该消费行为数据得到的预测购买概率更加符合消费者的实际情况,提高预测的准确性。
第二方面,本申请提供一种模型训练方法,包括:获取训练样本集,所述训练样本集包括多个商品的第二拼接数据,以及与所述多个商品一一对应的多个标签,每个标签表征对应商品是否被所述消费者购买,每个第二拼接数据通过该第二拼接数据对应的商品的历史商品数据以及消费者的个人基本数据、消费行为数据得到;基于所述训练样本集对初始网络模型进行训练,得到训练好的所述购买概率模型。
第三方面,本申请提供一种商品推荐装置,包括获取模块、处理模块、推荐模块,获取模块用于获取消费者的个人基本数据、消费行为数据以及指定商品的商品数据;处理模块用于基于所述个人基本数据、所述消费行为数据、所述商品数据和预先训练好的购买概率模型,得到预测购买概率;推荐模块用于根据所述预测购买概率向所述消费者推荐该预测购买概率对应的商品。
第四方面,本申请实施例提供一种模型训练装置,包括获取模块、处理模块,获取模块用于获取训练样本集,所述训练样本集包括多个商品的第二拼接数据,以及与所述多个商品一一对应的多个标签,每个标签表征对应商品是否被所述消费者购买,每个第二拼接数据通过该第二拼接数据对应的商品的历史商品数据以及消费者的个人基本数据、消费行为数据得到;处理模块用于基于所述训练样本集对初始网络模型进行训练,得到训练好的所述购买概率模型。
第五方面,本申请实施例提供一种电子设备,包括:存储器和处理器,所述存储器和所述处理器连接;所述存储器,用于存储程序;所述处理器,用于调用存储于所述存储器中的程序,以执行如上述第一方面实施例和/或结合上述第一方面实施例的任一种可能的实施方式提供的方法。
第六方面,本申请实施例提供一种存储介质,其上存储有计算机程序,所述计算机程序被计算机运行时,执行如上述第一方面实施例和/或结合上述第一方面实施例的任一种可能的实施方式提供的方法。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例示出的一种商品推荐方法的流程示意图;
图2为本申请实施例示出的一种模型训练方法的流程示意图;
图3为本申请实施例示出的一种商品推荐装置的结构框图;
图4为本申请实施例示出的一种模型训练装置的结构框图;
图5为本申请实施例示出的一种电子设备的结构框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本申请的描述中诸如“第一”、“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
再者,本申请中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。
下面将结合附图对本申请的技术方案进行清楚、完整地描述。
请参阅图1,图1为本申请实施例提供的一种商品推荐方法,下面将结合图1对其包含的步骤进行说明。
S100:获取消费者的个人基本数据、消费行为数据以及指定商品的商品数据。
其中,消费者的个人基本数据、消费行为数据以及指定商品的商品数据可以是预先获取并保存在数据库或磁盘中的,在需要时直接调用即可,或者,可以是在需要时,实时获取得到的。
可选的,商品数据包括商品价格、商品用途、商品种类、商品图片、商品描述、商品评价中的至少一种数据。个人基本数据包括消费者性别、年龄、学历、职业、城市、爱好中的至少一种数据。消费行为数据包括点击记录、购买记录、购物车、收藏、评论中的至少一种数据。
一种实施方式下,获取消费者的个人基本数据、消费行为数据以及指定商品的商品数据的过程可以是,首先获取消费者的初始个人基本数据和初始消费行为数据以及指定商品的基本商品数据,然后分别对基本商品数据、初始个人基本数据和初始消费行为数据做第一预设编码方式处理,得到个人基本数据、消费行为数据以及指定商品的商品数据。也即,将基本商品数据、初始个人基本数据和初始消费行为数据利用新的编码方式进行表示。
可选的,上述的第一预设编码方式可以是embedding编码,其中,利用embedding编码方式进行编码已为本领域技术人员所熟知,为简要描述,此处不再赘述。
一种实施方式下,获取上述基本商品数据的过程可以是,首先获取指定商品的初始商品数据,该初始商品数据具有不同维度的多个特征;然后对该初始商品数据做第二预设编码方式处理,之后将第二预设编码方式处理后的初始商品数据包括的每个特征做维度重要性排名,选取重要性大于阈值的特征作为所需的特征,得到基本商品数据。
其中,上述的第二预设编码方式可以是onehot编码,其中,利用onehot编码方式进行编码已为本领域技术人员所熟知,为简要描述,此处不再赘述。
可选的,上述的阈值可以根据实际需求设置,此处不对阈值的具体取值作出限制,或者,在将第二预设编码方式处理后的初始商品数据包括的每个特征做维度重要性排名后,也可以是将重要性排名在预设范围内的特征作为所需的特征,例如,可以是将重要性排名在前60%内的特征作为所需的特征,或者,也可以是将重要性排名在前60名的特征作为所需的特征,也即预设范围可以是用百分比形式,即选择固定比例的特征;预设范围也可以是具体的数值,即选择固定数量的特征,上述的60%、60仅为便于理解作出的示例,不应作为对本申请的限制,预设范围的具体取值范围可以根据实际需求设置,此处不对预设范围的具体取值作出限制。
可选的,可以是利用训练好的随机森林模型来预测第二预设编码方式处理后的初始商品数据中的每个特征的分类概率,然后对每个特征对应的分类概率进做维度重要性排名,由于采用随机森林模型获取特征的分类概率,因此,可以通过调用feature_importance接口实现维度重要性排名,然后将维度重要性排名大于阈值的分类概率对应的特征作为所需特征,得到商品数据,其中,特征的分类概率越大,表征该特征的重要性越高,利用feature_importance接口实现维度重要性排名已为本领域技术人员所熟知,为简要描述,此处不再赘述。
其中,随机森林模型可以是利用分类训练样本集进行训练得到,分类训练样本集包括多个初始商品数据和表征每一个初始商品数据对应的商品是否被消费者购买的标签,随机森林模型的具体训练过程已为本领域技术人员所熟知,为简要描述,此处不再赘述。
一种实施方式下,获取上述初始个人基本数据的过程可以是首先获取消费者的原始个人基本数据,该原始个人基本数据具有不同维度的多个特征;然后对该原始个人基本数据做第二预设编码方式处理,之后将第二预设编码方式处理后的原始个人基本数据包括的每个特征做维度重要性排名,选取重要性大于阈值的特征作为所需的特征,得到初始个人基本数据。其中,获取上述初始个人基本数据的过程及原理与前述的获取指定商品的基本商品数据的过程及原理相同,为简要描述,此处不再赘述。
S200:基于个人基本数据、消费行为数据、商品数据和预先训练好的购买概率模型,得到预测购买概率。
第一种实施方式下,基于个人基本数据、消费行为数据、商品数据和预先训练好的购买概率模型,得到预测购买概率,可以是,将个人基本数据、消费行为数据、商品数据输入预先训练好的购买概率模型,然后该预先训练好的购买概率模型输出预测购买概率。
相应的,该预先训练好的购买概率模型的训练过程可以是,首先获取训练样本集,该训练样本集包括个人基本数据、消费行为数据、多个商品的历史商品数据,以及与多个商品一一对应的多个标签,每个标签表征对应商品是否被消费者购买,然后基于该训练样本集对初始网络模型进行训练,得到训练好的购买概率模型。其中,当训练样本集中包括N个商品的历史商品数据时,训练样本集中包括N个标签,每个标签唯一对应一个商品,用于表征该商品是否被消费者购买。
例如,若历史商品数据被消费者购买,则将其实际购买概率设置为1,若历史商品数据没有被消费者购买,则将其实际购买概率设置为0,针对每一个历史商品数据,将该历史商品数据和个人基本数据、消费行为数据输入购买概率模型中,得到预测购买概率,若该历史商品数据对应的商品被消费者购买,则计算该预测购买概率和1的误差,并基于该误差更新购买概率模型的参数,反之,若该历史商品数据对应的商品没有被消费者购买,则计算该预测购买概率和0的误差,并基于该误差更新购买概率模型的参数,直至预测购买概率和实际购买概率的误差满足预设条件,得到训练好的购买概率模型。其中,上述的预设条件可以是预测购买概率和实际购买概率的误差小于预设误差阈值,该预设误差阈值可以是1%、2%、3%、4%等数值,具体的预设误差阈值可以根据实际需求设置,此处不对预设误差阈值的具体取值范围作出限制。
第二种实施方式下,基于个人基本数据、消费行为数据、商品数据和预先训练好的购买概率模型,得到预测购买概率的过程可以是,首先将商品数据、个人基本数据和消费行为数据进行拼接,得到第一拼接数据,然后基于预设的全连接层对第一拼接数据进行处理,得到全连接数据,同时,将商品数据、个人基本数据做线性交叉,得到线性交叉数据,之后将全连接数据和线性交叉数据进行拼接,得到第二拼接数据,最后基于第二拼接数据和预先训练好的购买概率模型,得到预测购买概率。
其中,将将商品数据、个人基本数据和消费行为数据进行拼接以及将全连接数据和线性交叉数据进行拼接可以是通过concat操作进行拼接。
可选的,基于预设的全连接层对第一拼接数据进行处理,得到全连接数据,是为了改变第一拼接数据的维度,例如,第一拼接数据是一个N维向量,通过预设的全连接层对该N维向量进行处理,可以得到M维的向量。其中,N和M均为大于等于1的整数。
由于商品数据、个人基本数据均具有不同维度的多个特征,因此,将商品数据、个人基本数据做线性交叉,即将商品数据中包含的每个特征与个人基本数据中包括的每个特征进行组合,并将组合后的特征相加,实现商品数据、个人基本数据的特征交叉,同时最终得到的特征交叉数据是一个数值,降低了商品数据、个人基本数据的维度,降低了后续步骤的计算量。
可以理解的是,第二种实施方式中的预先训练好的购买概率模型的训练过程可以是,首先获取训练样本集,该训练样本集包括个人基本数据、消费行为数据、多个商品的历史商品数据,以及与多个商品一一对应的多个标签,每个标签表征对应商品是否被消费者购买,然后针对每一个商品,将该商品对应的历史商品数据与个人基本数据和消费行为数据进行拼接,得到第一拼接数据,再基于预设的全连接层对所述第一拼接数据进行处理,得到全连接数据,同时将该商品对应的历史商品数据与个人基本数据做线性交叉,得到线性交叉数据,之后将全连接数据和线性交叉数据进行拼接,得到第二拼接数据,最后利用多个商品对应的第二拼接数据以及对应的标签,对初始网络模型进行训练,得到训练好的所述购买概率模型。
例如,若第二拼接数据的标签为该第二拼接数据对应的商品被消费者购买,则将其实际购买概率设置为1,若第二拼接数据的标签为该第二拼接数据对应的商品没有被消费者购买,则将其实际购买概率设置为0,针对每一个第二拼接数据,将该第二拼接数据输入购买概率模型中,得到预测购买概率,若该第二拼接数据对应的商品被消费者购买,则计算该预测购买概率和1的误差,并基于该误差更新购买概率模型的参数,反之,若该第二拼接数据对应的商品没有被消费者购买,则计算该预测购买概率和0的误差,并基于该误差更新购买概率模型的参数,直至预测购买概率和实际购买概率的误差满足预设条件,得到训练好的购买概率模型。其中,上述的预设条件可以是预测购买概率和实际购买概率的误差小于预设误差阈值,该预设误差阈值可以是1%、2%、3%、4%等数值,具体的预设误差阈值可以根据实际需求设置,此处不对预设误差阈值的具体取值范围作出限制。
其中,通过商品信息以及消费者的个人基本数据、消费行为数据得到第二拼接数据的具体过程及实现原理在前文已叙述清楚,为简要描述,此处不再赘述。
S300:根据预测购买概率向消费者推荐该预测购买概率对应的商品。
其中,根据预测购买概率向消费者推荐该预测购买概率对应的商品,可以是在预测购买概率大于预设购买概率阈值时,向用户推荐该预测购买概率对应的商品,预设购买概率可以根据实际需求设置,可以是0-100%中的任意一个数值,此处不对预设购买概率的具体数值作出限制。或者,根据预测购买概率向消费者推荐该预测购买概率对应的商品,可以是在获得多个商品的预测购买概率后,对获得的预测购买概率进行排序,然后基于排序结果向消费者推荐商品,例如,可以是向消费者推荐购买概率最大的k%对应的商品,或者,可以是向用户推荐购买概率最大的j个商品,其中,0<k≤100,0<j,且j为整数。
上述的商品推荐方法可以应用于电商平台,通过为每个用户推荐其更感兴趣的商品,从而提高商品的销量,同时还能提高用户体验,或者,也可以用于进行广告投放,通过向用户投放其更感兴趣的商品的广告来提高商品的销量。
基于同样的发明构思,请参阅图2,图2为本申请实施例提供的一种模型训练方法,下面将结合图2对其包含的步骤进行说明。
S400:获取训练样本集。
其中,训练样本集包括多个第二拼接数据和每个第二拼接数据对应的商品是否被购买的标签,每个第二拼接数据通过该第二拼接数据对应的商品的商品信息以及消费者的个人基本数据、消费行为数据得到。
S500:基于训练样本集对购买概率模型进行训练,得到训练好的购买概率模型。
需要说明的是,图2所示的模型训练方法仅为本申请中的其中一种模型训练的示例,此外,还可以是首先获取训练样本集,训练样本集包括个人基本数据、消费行为数据、多个商品的历史商品数据,以及与多个商品一一对应的多个标签,每个标签表征对应商品是否被消费者购买,然后基于训练样本集对初始网络模型进行训练,得到训练好的购买概率模型。
本申请实施例所提供的模型训练方法,其实现原理及产生的技术效果在前述商品推荐方法实施例中已进行完整说明,为简要描述,模型训练方法实施例部分未提及之处,可参考前述商品推荐方法实施例中相应内容。
请参阅图3,图3为本申请实施例提供的一种商品推荐装置100,包括获取模块110、处理模块120和推荐模块130。
获取模块110,用于获取消费者的个人基本数据、消费行为数据以及指定商品的商品数据;
处理模块120,用于基于所述个人基本数据、所述消费行为数据、所述商品数据和预先训练好的购买概率模型,得到预测购买概率;
推荐模块130,用于根据所述预测购买概率向所述消费者推荐该预测购买概率对应的商品。
处理模块120,具体用于将所述商品数据、所述个人基本数据和所述消费行为数据进行拼接,得到第一拼接数据;基于预设的全连接层对所述第一拼接数据进行处理,得到全连接数据;将所述商品数据、所述个人基本数据做线性交叉,得到线性交叉数据;将所述全连接数据和所述线性交叉数据进行拼接,得到第二拼接数据;基于所述第二拼接数据和预先训练好的购买概率模型,得到预测购买概率。
获取模块110,具体用于获取所述消费者的初始个人基本数据和初始消费行为数据以及所述指定商品的基本商品数据;分别对所述基本商品数据、所述初始个人基本数据和所述初始消费行为数据做第一预设编码方式处理,得到所述个人基本数据、所述消费行为数据以及所述指定商品的商品数据。
获取模块110,还用于获取所述指定商品的初始商品数据,所述初始商品数据具有不同维度的多个特征;对所述初始商品数据做第二预设编码方式处理;将所述第二预设编码方式处理后的所述初始商品数据包括的每个特征做维度重要性排名,选取重要性大于阈值的特征作为所需的特征,得到所述基本商品数据。
处理模块120,还用于获取训练样本集,所述训练样本集包括所述个人基本数据、所述消费行为数据、多个商品的历史商品数据,以及与所述多个商品一一对应的多个标签,每个标签表征对应商品是否被所述消费者购买;基于所述训练样本集对初始网络模型进行训练,得到训练好的所述购买概率模型。
处理模块120,还用于针对每一个商品,将该商品对应的历史商品数据与所述个人基本数据和所述消费行为数据进行拼接,得到第一拼接数据;基于预设的全连接层对所述第一拼接数据进行处理,得到全连接数据;将该商品对应的历史商品数据与所述个人基本数据做线性交叉,得到线性交叉数据;将所述全连接数据和所述线性交叉数据进行拼接,得到第二拼接数据;利用多个商品对应的第二拼接数据以及对应的标签,对初始网络模型进行训练,得到训练好的所述购买概率模型。
本申请实施例所提供的商品推荐装置100,其实现原理及产生的技术效果和前述商品推荐方法实施例相同,为简要描述,商品推荐装置100实施例部分未提及之处,可参考前述商品推荐方法实施例中相应内容。
请参阅图4,图4为本申请实施例提供的一种模型训练装置200,包括获取模块210、处理模块220。
获取模块210,用于获取训练样本集,所述训练样本集包括多个商品的第二拼接数据,以及与所述多个商品一一对应的多个标签,每个标签表征对应商品是否被所述消费者购买,每个第二拼接数据通过该第二拼接数据对应的商品的历史商品数据以及消费者的个人基本数据、消费行为数据得到。
处理模块220,用于基于所述训练样本集对初始网络模型进行训练,得到训练好的所述购买概率模型。
本申请实施例所提供的模型训练装置200,其实现原理及产生的技术效果和前述模型训练方法实施例相同,为简要描述,模型训练装置200实施例部分未提及之处,可参考前述模型训练方法实施例中相应内容。
请参阅图5,其为本申请实施例提供的一种电子设备300。所述电子设备300包括:收发器310、存储器320、通讯总线330、处理器340。
所述收发器310、所述存储器320、处理器340各元件相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线330或信号线实现电性连接。其中,收发器310用于收发数据。存储器320用于存储计算机程序,如存储有图3或图4中所示的软件功能模块,即商品推荐装置100或模型训练装置200。其中,商品推荐装置100或模型训练装置200包括至少一个可以软件或固件(firmware)的形式存储于所述存储器320中或固化在所述电子设备300的操作系统(operating system,OS)中的软件功能模块。
所述处理器340,用于执行商品推荐装置100包括的软件功能模块或计算机程序时,此时,处理器340,用于获取消费者的个人基本数据、消费行为数据以及指定商品的商品数据;基于所述个人基本数据、所述消费行为数据、所述商品数据和预先训练好的购买概率模型,得到预测购买概率;根据所述预测购买概率向所述消费者推荐该预测购买概率对应的商品。
或者,所述处理器340,用于执行模型训练装置200包括的软件功能模块或计算机程序时,此时,处理器340,用于获取训练样本集,所述训练样本集包括多个商品的第二拼接数据,以及与所述多个商品一一对应的多个标签,每个标签表征对应商品是否被所述消费者购买,每个第二拼接数据通过该第二拼接数据对应的商品的历史商品数据以及消费者的个人基本数据、消费行为数据得到;基于所述训练样本集对初始网络模型进行训练,得到训练好的所述购买概率模型。
其中,存储器320可以是,但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。
处理器340可能是一种集成电路芯片,具有信号的处理能力。上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(NetworkProcessor,NP)等;还可以是数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(FieldProgrammable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器340也可以是任何常规的处理器等。
其中,上述的电子设备300,包括但不限于个人电脑、服务器等。
本申请实施例还提供了一种非易失性计算机可读取存储介质(以下简称存储介质),该存储介质上存储有计算机程序,该计算机程序被计算机如上述的电子设备300运行时,执行上述所示的商品推荐方法或模型训练方法。该计算机可读存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (11)

1.一种商品推荐方法,其特征在于,包括:
获取消费者的个人基本数据、消费行为数据以及指定商品的商品数据;
基于所述个人基本数据、所述消费行为数据、所述商品数据和预先训练好的购买概率模型,得到预测购买概率;
根据所述预测购买概率向所述消费者推荐该预测购买概率对应的商品。
2.根据权利要求1所述的方法,其特征在于,所述基于所述个人基本数据、所述消费行为数据、所述商品数据和预先训练好的购买概率模型,得到预测购买概率,包括:
将所述商品数据、所述个人基本数据和所述消费行为数据进行拼接,得到第一拼接数据;
基于预设的全连接层对所述第一拼接数据进行处理,得到全连接数据;
将所述商品数据、所述个人基本数据做线性交叉,得到线性交叉数据;
将所述全连接数据和所述线性交叉数据进行拼接,得到第二拼接数据;
基于所述第二拼接数据和预先训练好的购买概率模型,得到预测购买概率。
3.根据权利要求1所述的方法,其特征在于,所述获取消费者的个人基本数据、消费行为数据以及指定商品的商品数据,包括:
获取所述消费者的初始个人基本数据和初始消费行为数据以及所述指定商品的基本商品数据;
分别将所述基本商品数据、所述初始个人基本数据和所述初始消费行为数据做第一预设编码方式处理,得到所述个人基本数据、所述消费行为数据以及所述指定商品的商品数据。
4.根据权利要求3所述的方法,其特征在于,获取所述基本商品数据,包括:
获取所述指定商品的初始商品数据,所述初始商品数据具有不同维度的多个特征;
对所述初始商品数据做第二预设编码方式处理;
将所述第二预设编码处理后的所述初始商品数据包括的每个特征做维度重要性排名,选取重要性大于阈值的特征作为所需的特征,得到所述基本商品数据。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取训练样本集,所述训练样本集包括所述个人基本数据、所述消费行为数据、多个商品的历史商品数据,以及与所述多个商品一一对应的多个标签,每个标签表征对应商品是否被所述消费者购买;
基于所述训练样本集对初始网络模型进行训练,得到训练好的所述购买概率模型。
6.根据权利要求5所述的方法,其特征在于,基于所述训练样本集对所述购买概率模型进行训练,得到训练好的购买概率模型,包括:
针对每一个商品,将该商品对应的历史商品数据与所述个人基本数据和所述消费行为数据进行拼接,得到第一拼接数据;
基于预设的全连接层对所述第一拼接数据进行处理,得到全连接数据;
将该商品对应的历史商品数据与所述个人基本数据做线性交叉,得到线性交叉数据;
将所述全连接数据和所述线性交叉数据进行拼接,得到第二拼接数据;
利用多个商品对应的第二拼接数据以及对应的标签,对初始网络模型进行训练,得到训练好的所述购买概率模型。
7.一种模型训练方法,其特征在于,包括:
获取训练样本集,所述训练样本集包括多个商品的第二拼接数据,以及与所述多个商品一一对应的多个标签,每个标签表征对应商品是否被消费者购买,每个第二拼接数据通过该第二拼接数据对应的商品的历史商品数据以及消费者的个人基本数据、消费行为数据得到;
基于所述训练样本集对初始网络模型进行训练,得到训练好的购买概率模型。
8.一种商品推荐装置,其特征在于,包括:
获取模块,用于获取消费者的个人基本数据、消费行为数据以及指定商品的商品数据;
处理模块,用于基于所述个人基本数据、所述消费行为数据、所述商品数据和预先训练好的购买概率模型,得到预测购买概率;
推荐模块,用于根据所述预测购买概率向所述消费者推荐该预测购买概率对应的商品。
9.一种模型训练装置,其特征在于,包括:
获取模块,用于获取训练样本集,所述训练样本集包括多个商品的第二拼接数据,以及与所述多个商品一一对应的多个标签,每个标签表征对应商品是否被消费者购买,每个第二拼接数据通过该第二拼接数据对应的商品的历史商品数据以及消费者的个人基本数据、消费行为数据得到;
处理模块,用于基于所述训练样本集对初始网络模型进行训练,得到训练好的购买概率模型。
10.一种电子设备,其特征在于,包括:存储器和处理器,所述存储器和所述处理器连接;
所述存储器,用于存储程序;
所述处理器,用于调用存储于所述存储器中的程序,以执行如权利要求1-6中任一项所述的方法。
11.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序被计算机运行时,执行如权利要求1-6中任一项所述的方法。
CN202210203626.7A 2022-03-03 2022-03-03 商品推荐方法、模型训练方法、装置及电子设备 Pending CN114579854A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210203626.7A CN114579854A (zh) 2022-03-03 2022-03-03 商品推荐方法、模型训练方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210203626.7A CN114579854A (zh) 2022-03-03 2022-03-03 商品推荐方法、模型训练方法、装置及电子设备

Publications (1)

Publication Number Publication Date
CN114579854A true CN114579854A (zh) 2022-06-03

Family

ID=81772301

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210203626.7A Pending CN114579854A (zh) 2022-03-03 2022-03-03 商品推荐方法、模型训练方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN114579854A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115936803A (zh) * 2022-11-28 2023-04-07 重庆长安汽车股份有限公司 一种基于大数据的个性化推荐方法及系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115936803A (zh) * 2022-11-28 2023-04-07 重庆长安汽车股份有限公司 一种基于大数据的个性化推荐方法及系统

Similar Documents

Publication Publication Date Title
US11587116B2 (en) Predictive recommendation system
Sismeiro et al. Modeling purchase behavior at an e-commerce web site: A task-completion approach
US9031967B2 (en) Natural language processing system, method and computer program product useful for automotive data mapping
US9846885B1 (en) Method and system for comparing commercial entities based on purchase patterns
CN111666275B (zh) 一种数据处理方法、装置、电子设备及存储介质
CN112070577A (zh) 一种商品推荐方法、系统、设备及介质
KR102409717B1 (ko) 온라인 쇼핑몰의 판매자에게 판매 상품을 추천하는 방법 및 장치
CN111738780A (zh) 一种推荐对象的方法及系统
CN111415216A (zh) 一种商品推荐方法、装置、服务器及存储介质
KR102422408B1 (ko) 협업 필터링 신경망을 이용하여 상품을 추천하는 방법 및 장치
CN113781149A (zh) 信息推荐方法、装置、计算机可读存储介质及电子设备
US11544333B2 (en) Analytics system onboarding of web content
CN114579854A (zh) 商品推荐方法、模型训练方法、装置及电子设备
CN113780479A (zh) 周期预测模型的训练方法及装置、周期预测方法、设备
CN112102043B (zh) 物品推荐页面生成方法、装置、电子设备和可读介质
US20210090105A1 (en) Technology opportunity mapping
CN116739653A (zh) 销售数据采集分析系统及其方法
CN116977019A (zh) 一种商户推荐方法、装置、电子设备及存储介质
EP4092603A1 (en) Inventory item prediction and listing recommendation
US11861882B2 (en) Systems and methods for automated product classification
CN116562928A (zh) 一种目标预估方法、装置、设备及存储介质
JP6686208B1 (ja) 情報処理装置、情報処理方法、及びプログラム
US20180157714A1 (en) System, method and non-transitory computer readable storage medium for matching cross-area products
CN114116814A (zh) 基于智慧金融大数据的金融产品推荐方法
CN109191192B (zh) 数据估算方法、装置和计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination