CN113781160B

CN113781160B - 一种基于人工智能的商品推荐的方法

Info

Publication number: CN113781160B
Application number: CN202110977160.1A
Authority: CN
Inventors: 张阳
Original assignee: Fujian Jinshubao Technology Co ltd
Current assignee: Fujian Jinshubao Technology Co ltd
Priority date: 2021-08-24
Filing date: 2021-08-24
Publication date: 2023-02-03
Anticipated expiration: 2041-08-24
Also published as: CN113781160A

Abstract

本申请公开了一种基于人工智能的商品推荐的方法，包括：智能客服系统获取用户对话文本信息，并整理成长文本；基于GPT2模型将所述长文本进行摘要提取；基于所述提取出的摘要信息，对所述用户进行用户画像预测；基于所述用户画像及所述用户购买商品的历史行为，通过环形图注意力网络模型将所述用户与拟推荐商品进行匹配，获取所述拟推荐商品匹配得分PMS；若所述PMS超过预设阈值，则向所述用户推荐所述拟推荐商品。

Description

一种基于人工智能的商品推荐的方法

技术领域

本申请涉及电子商务技术领域，尤其涉及基于人工智能的商品推荐的方法。

背景技术

近年来，随着互联网的不断发展和快速完善，流量成本越来越贵，拉新成本越来越高，老顾客忠诚度也越来越低，在这种形势下，只有精细化运营每一个客户，才能使品牌保持持续性增长。电商领域的精细化运营，指的是通过用户分群，对不同需求的用户匹配不同的服务和内容，从而满足其个性化的需求。用户画像可以从多个维度来描绘用户特征，不同的产品类型，用户画像的维度也有不同，更快速更准确的画像信息，可以帮助电商精准的定位实际用户群体，并进行商品推荐。

为了能够准确地给用户推荐商品，通常需要对用户特征进行提取，并通过大量的用户购买行为和用户评论信息，对用户的兴趣点POI(points of interest)进行预测，然而，现有技术中并未考虑结合用户的其他行为(例如客服对话)也会对用户的商品推荐提供决策，导致现有商品推荐算法精准性不高。

发明内容

本申请实施例提供一种基于人工智能的商品推荐的方法，用于解决现有技术中商品推荐算法精确性不高的问题。

本发明实施例提供一种基于人工智能的商品推荐的方法，包括：

智能客服系统获取用户对话文本信息，并整理成长文本；

基于GPT2模型将所述长文本进行摘要提取；

基于所述提取出的摘要信息，对所述用户进行用户画像预测；

基于所述用户画像及所述用户购买商品的历史行为，通过环形图注意力网络模型将所述用户与拟推荐商品进行匹配，获取所述拟推荐商品匹配得分PMS；

若所述PMS超过预设阈值，则向所述用户推荐所述拟推荐商品。

可选地，所述基于GPT2模型将所述长文本进行摘要提取，包括：

设置GPT2模型，所述GPT2模型为多层单向传输的解码语言模型；

对所述长文本进行摘要抽取，抽取出第一摘要信息；

将所述第一摘要信息和所述长文本进行处理，形成词嵌入和单词token位置信息；

将所述词嵌入和单词token位置信息作为所述GPT2模型的输入层进行输入，获取输出单向transformer输出向量；

将所述单向transformer输出向量通过softmax分类器进行分类，输出词的概率分布；

基于所述词的概率分布，生成第二摘要信息。

可选地，所述将所述词嵌入和单词token位置信息作为所述GPT2模型的输入层进行输入，获取输出单向transformer输出向量，包括：

设置所述GPT2模型包括n层解码器tranformer，n为正整数；

所述第一层tranformer定义为h₀：

h₀＝UW_e+W_P

其中U＝{u_-k,...,u_-1}是上下文的文本词汇，k是文本上下文窗口的大小，W_e是词嵌入矩阵，W_P是位置嵌入矩阵；

第i层tranformer定义为h_i：

h_i＝transformer(h_i-1)，0<＝i<＝n；

则第n层transformer输出的向量为最终的所述输出单向transformer输出向量。

可选地，所述对所述长文本进行摘要抽取，抽取出第一摘要信息，包括：

加载BERT模型；

调用BERT编码接口，将所述长文本中的文本信息转换为词向量，形成词向量集合；

对所述词向量集合进行k-means聚类，从聚类结果中，选取最接近簇心的词向量作为所述第一摘要信息。

可选地，所述对所述词向量进行k-means聚类，包括：

随机选取k个聚类中心作为簇心；

计算所述词向量集合中所有点到所述k个簇心的欧式距离；

根据上述欧式距离，形成以所述k个簇心为中心的k个簇群；

在所述k个簇群中重新计算簇心，并根据重新计算出的簇心，更新所述簇群，直到完成迭代。

可选地，在所述通过环形图注意力网络模型将所述用户与拟推荐商品进行匹配之前，所述方法还包括：

训练矩阵分类模型，并将所述用户画像和用户购买商品的历史行为输入至所述矩阵分类模型中，以获取所述用户的兴趣点向量和支付能力向量，其中，所述训练矩阵分类模型，包括：

基于所述用户画像，形成用户兴趣点矩阵POI；

基于所述用户购买商品的历史行为，形成用户支付能力矩阵PA；

计算所述用户x对拟推荐商品y的预测值F_x,y：

F_x,y＝POI_x ^T*PA_y；

使用最小化目标函数来学习POI和PA，选择随机梯度下降作为优化器，达到收敛条件，获取训练好的矩阵分解模型。

可选地，所述通过环形图注意力网络模型将所述用户与拟推荐商品进行匹配，包括：

基于所述用户的兴趣点向量和支付能力向量，形成用户序列数据集；

将所述用户序列数据集中分为多个预设长度的短序列，并将每一个所述短序列构建成一个环形图；

将所述短序列中的每个行为设置有一个对应的子环形图；所述环形图包括整个所述短序列的信息，所述子环形图只包括与该行为相邻的行为所连成的图；

环形图注意力网络模型中，将环形图注意力机制分别应用在所述环形图和每个子环形图上，得到该用户的全局特征和局部特征；

将所述用户的局部特征和全局特征拼接结合后，输入多层感知机网络，获取用户特征；

获取拟推荐商品的商品特征，将所述用户特征与所述商品特征进行匹配，获取匹配得分。

可选地，对所述用户进行用户画像预测，包括：

基于所述摘要信息，获取所述用户的兴趣点及商品评价；

基于所述用户的兴趣点与商品评价，获取用户画像特征；

遍历用户画像特征库中的特征值，寻找与所述用户画像特征值差值最小的特征值，所述特征值在模板中对应的用户画像为所述预测得到的用户画像。

本发明实施例提供的方法，通过对智能客服系统中获取到用户输入的文本信息，并通过语义分析模型GPT2进行摘要提取，基于该摘要可进行用户画像预测，并基于用户画像及用户商品的历史购买行为，通过图神经网络进行商品匹配，最终能够精确地提供合适的商品推荐，提升了商品推荐的成功率。

附图说明

为了更清楚地说明本申请实施例技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍。

图1为一个实施例中基于人工智能的商品推荐的流程示意图；

图2为一个实施例中GPT2模型结构示意图；

图3为另一个实施例中基于人工智能的商品推荐的流程示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

应当理解，当在本说明书和所附权利要求书中使用时，术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在，但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

还应当理解，在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样，除非上下文清楚地指明其它情况，否则单数形式的“一”、“一个”及“该”意在包括复数形式。

还应当进一步理解，在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合，并且包括这些组合。

如在本说明书和所附权利要求书中所使用的那样，术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地，短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。

图1是本发明实施例的其中一个基于人工智能的商品推荐的的流程图，如图1所示，该方法包括：

S101.智能客服系统获取用户对话文本信息，并整理成长文本；

智能客服系统是电子商务网站的后台服务，其本质是通过人工智能的语义解析，采用人工智能客服与用户进行对话，并引导用户进行商品评价、购买等操作，智能客服系统具备良好的语义解析和扩展能力，能够收集用户在不同时间段针对不同商品的聊天记录，并整理成长文本。长文本在本发明中表示用户对同一个商品的所有聊天记录。

在整理成长文本后，智能客服系统还需要对该长文本进行预处理，即将部分噪声去除，例如发送的表情、无用的链接等。并在去除后，通过字符串等方法将聊天记录整理为以句子为单位的长文本。

S102.基于GPT2模型将所述长文本进行摘要提取；

GPT2是OpenAI在近几年推荐的大规模无监督自然语言处理NLP模型，该模型可以生成连贯的文本段落，并且能在未经预训练的情况下，完成阅读理解、问答、机器翻译等多项不同的语言建模任务。

与BERT模型不同的是，GPT2是使用transformer解码器(decoder)模块构建的，而BERT则是通过transformer编码器(encoder)模块构建的。GPT2类似于传统的语言模型，一次只输出一个单词(token)。

在本发明实施例中，基于GPT2模型将所述长文本进行摘要提取，具体可以为：

S1021、设置GPT2模型，所述GPT2模型为多层单向传输的解码语言模型；图2为GPT2模型的示意图，如图2所示，GPT2模型采用的是单向解码器(tramformer，Trm)架构，在训练过程中，会考虑到待生成文本在该词向量之前的所有词向量对该词向量的影响，从而能够更加准确的确定当前词向量，使得训练的目标摘要生成模型能够自动生成语义连贯、句法准确、可读性高、概括性强的语句，其中，C₁～C_N为对应文本样本的词向量，图中可以看出在训练C₂时，会考虑到C₁对它的影响，在经过多层解码器架构得到的T₁～T_N为预设摘要生成模型输出的词向量，T_N是生成的最后一个词向量，利用T₁～T_N从词汇表中确定出相应的单词，连起来就是生成的摘要。

S1022、对所述长文本进行摘要抽取，抽取出第一摘要信息；其中，本发明实施例抽取出第一摘要信息需要通过BERT模型生成词向量，并根据词向量进行k-means聚类。具体地，智能客服系统预先加载BERT模型，并调用BERT编码接口，以便将所述长文本中的文本信息转换为词向量，形成词向量集合；此后，对所述词向量集合进行k-means聚类，从聚类结果中，选取最接近簇心的词向量作为所述第一摘要信息。k-means聚类的具体方法可以为：随机选取k个聚类中心作为簇心；计算所述词向量集合中所有点到所述k个簇心的欧式距离；根据上述欧式距离，形成以所述k个簇心为中心的k个簇群；在所述k个簇群中重新计算簇心，并根据重新计算出的簇心，更新所述簇群，直到完成迭代。

S1023、将所述第一摘要信息和所述长文本进行处理，形成词嵌入和单词(token)位置信息；

GPT2采用多层Trasformer的decoder的语言模型，输入的是词嵌入以及单词token的位置信息。此外，由于GPT2采用的是单向Transformer，只能看到上文的词，对于无标签的文本U＝{U₁,...,U_n}，最大化语言模型的极大似然函数：

其中k是文本上下文窗口的大小，用参数为θ神经网络对条件概率P建模，优化器采用随机梯度下降法。

S1024、将所述词嵌入和单词token位置信息作为所述GPT2模型的输入层进行输入，获取输出单向transformer输出向量；

具体地，将所述词嵌入和单词token位置信息作为所述GPT2模型的输入层进行输入，获取输出单向transformer输出向量，具体包括：

设置所述GPT2模型包括n层解码器tranformer，n为正整数；

所述第一层tranformer定义为h₀：

h₀＝UW_e+W_P

第i层tranformer定义为h_i：

h_i＝transformer(h_i-1)，0<＝i<＝n；

S1025、将所述单向transformer输出向量通过softmax分类器进行分类，输出词的概率分布P(u)；

P(u)＝softmax(h_n*W_e ^T)

S1026、基于所述词的概率分布，生成第二摘要信息。

需要说明的是，第一摘要信息是初始摘要信息，而第二摘要信息才是最终的结果，即S102中提取出的摘要信息。

本发明实施例采用的其实是一种自监督学习方法，在基于深度学习的生成式方法中，由于用于训练的人工摘要获取困难，常用的监督训练方法所用标签是通过人工总结的标签，而本发明实施例训练采用的标签是通过以上步骤自动生成，并结合生成式方法，使生成的摘要更加合理。

S103.基于所述提取出的摘要信息，对所述用户进行用户画像预测；

在S102中，可提取用户的摘要信息，那么可根据用户的摘要进行部分用户画像的预测。在本发明实施例中，电商平台具备一个用户画像库，在该用户画像库中具备多个不同年龄段、不同性别、不同职业、不同地域的用户的用户画像模板，不同的模板对应的用户兴趣点不同，例如，有的用户喜欢音乐的产品，有的用户喜欢户外运动的产品等，针对不同的用户可设置用户偏好(兴趣点)特征，根据该特征值确定该用户属于哪一类型的用户画像模板。

具体地，在本发明实施例中，可基于所述摘要信息，获取所述用户的兴趣点及商品评价；基于所述用户的兴趣点与商品评价，获取用户画像特征，该用户画像特征既可以是用户对某商品的感兴趣程度，又可以是针对用户摘要信息中提及到该商品的次数等等；遍历用户画像特征库中的特征值，寻找与所述用户画像特征值差值最小的特征值，所述特征值在模板中对应的用户画像为所述预测得到的用户画像。例如，用户A在与智能客服聊天的过程中，提及到了商品B和C，而通过摘要信息中可得知，用户A对于商品B有兴趣且评价高，对于商品C评价低，则结合用户A的这一选择而言，其选择更接近于用户画像模板D(特征值差值最小)，则该用户A的用户画像模板为D。

S104.基于所述用户画像及所述用户购买商品的历史行为，通过环形图注意力网络模型将所述用户与拟推荐商品进行匹配，获取所述拟推荐商品匹配得分PMS；

需要说明的是，在通过环形图注意力网络模型进行用户与拟推荐商品匹配之前，本发明实施例还需要进行训练矩阵分类模型，并将所述用户画像和用户购买商品的历史行为输入至所述矩阵分类模型中，以获取所述用户的兴趣点向量和支付能力向量，其中，训练矩阵分类模型的步骤具体可以为：

基于所述用户画像，形成用户兴趣点矩阵POI(points of interest)；

基于所述用户购买商品的历史行为，形成用户支付能力矩阵PA(paymentability)；

计算所述用户x对拟推荐商品y的预测值F_x,y：

F_x,y＝POI_x ^T*PA_y；

在矩阵分类模型输出用户的兴趣点向量和支付能力向量后，S104中通过环形图注意力网络模型将所述用户与拟推荐商品进行匹配具体包括如下步骤：

S1041基于所述用户的兴趣点向量和支付能力向量，形成用户序列数据集；

S1042将所述用户序列数据集中分为多个预设长度的短序列，并将每一个所述短序列构建成一个环形图；

S1043将所述短序列中的每个行为设置有一个对应的子环形图；所述环形图包括整个所述短序列的信息，所述子环形图只包括与该行为相邻的行为所连成的图；

S1044环形图注意力网络模型中，将环形图注意力机制分别应用在所述环形图和每个子环形图上，得到该用户的全局特征和局部特征；

S1045将所述用户的局部特征和全局特征拼接结合后，输入多层感知机网络，获取用户特征；

S1046获取拟推荐商品的商品特征，将所述用户特征与所述商品特征进行匹配，获取拟推荐商品匹配得分PMS。

S105.若所述PMS超过预设阈值，则向所述用户推荐所述拟推荐商品。

与现有技术相比，通过图神经网络进行商品推荐，可极大提升用户建模的精准度以及商品推荐的成功性。

图3是本发明实施例中的另一示意图，如图3所示，本发明实施例中，将文本进行预处理后，通过bert模型提取词向量，并举行聚类，获取第一摘要信息，将第一摘要信息作为输入，通过GPT2模型进行摘要提取，最终获取第二摘要，根据该第二摘要获取用户画像，并将用户画像和用户商品购买的历史行为作为输入，通过环形图注意力网络进行拟推荐商品匹配，最终结合多个人工智能算法，更加精准地推荐商品，提升推荐精准度。

以上仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以权利要求的保护范围为准。

Claims

1.一种基于人工智能的商品推荐的方法，其特征在于，包括：

智能客服系统获取用户对话文本信息，并整理成长文本；

基于GPT2模型将所述长文本进行摘要提取；

若所述PMS超过预设阈值，则向所述用户推荐所述拟推荐商品；

其中，所述基于GPT2模型将所述长文本进行摘要提取，包括：

对所述长文本进行摘要抽取，抽取出第一摘要信息；

基于所述词的概率分布，生成第二摘要信息。

2.根据权利要求1所述的方法，其特征在于，所述将所述词嵌入和单词token位置信息作为所述GPT2模型的输入层进行输入，获取输出单向transformer输出向量，包括：

设置所述GPT2模型包括n层解码器tranformer，n为正整数;

第一层tranformer定义为h₀：

其中

是上下文的文本词汇，k是文本上下文窗口的大小，

是词嵌入矩阵，

是位置嵌入矩阵；

第i层tranformer定义为h_i：

h_i=transformer(h_i-1)，0<=i<=n;

3.根据权利要求1所述的方法，其特征在于，所述对所述长文本进行摘要抽取，抽取出第一摘要信息，包括：

加载BERT模型；

4.根据权利要求3所述的方法，其特征在于，所述对所述词向量进行k-means聚类，包括：

随机选取k个聚类中心作为簇心；

计算所述词向量集合中所有点到所述k个簇心的欧式距离；

根据上述欧式距离，形成以所述k个簇心为中心的k个簇群；

5.根据权利要求1所述的方法，其特征在于，在所述通过环形图注意力网络模型将所述用户与拟推荐商品进行匹配之前，所述方法还包括：

基于所述用户画像，形成用户兴趣点矩阵POI；

计算所述用户x对拟推荐商品y的预测值F_x,y：

F_x,y=POI_x ^T*PA_y；

6.根据权利要求5所述的方法，其特征在于，所述通过环形图注意力网络模型将所述用户与拟推荐商品进行匹配，包括：

7.根据权利要求1所述的方法，其特征在于，对所述用户进行用户画像预测，包括：

基于所述摘要信息，获取所述用户的兴趣点及商品评价；

基于所述用户的兴趣点与商品评价，获取用户画像特征；