CN113781160B - 一种基于人工智能的商品推荐的方法 - Google Patents

一种基于人工智能的商品推荐的方法 Download PDF

Info

Publication number
CN113781160B
CN113781160B CN202110977160.1A CN202110977160A CN113781160B CN 113781160 B CN113781160 B CN 113781160B CN 202110977160 A CN202110977160 A CN 202110977160A CN 113781160 B CN113781160 B CN 113781160B
Authority
CN
China
Prior art keywords
user
commodity
model
word
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110977160.1A
Other languages
English (en)
Other versions
CN113781160A (zh
Inventor
张阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujian Jinshubao Technology Co ltd
Original Assignee
Fujian Jinshubao Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujian Jinshubao Technology Co ltd filed Critical Fujian Jinshubao Technology Co ltd
Priority to CN202110977160.1A priority Critical patent/CN113781160B/zh
Publication of CN113781160A publication Critical patent/CN113781160A/zh
Application granted granted Critical
Publication of CN113781160B publication Critical patent/CN113781160B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3346Query execution using probabilistic model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • G06F16/345Summarisation for human users
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Business, Economics & Management (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种基于人工智能的商品推荐的方法,包括:智能客服系统获取用户对话文本信息,并整理成长文本;基于GPT2模型将所述长文本进行摘要提取;基于所述提取出的摘要信息,对所述用户进行用户画像预测;基于所述用户画像及所述用户购买商品的历史行为,通过环形图注意力网络模型将所述用户与拟推荐商品进行匹配,获取所述拟推荐商品匹配得分PMS;若所述PMS超过预设阈值,则向所述用户推荐所述拟推荐商品。

Description

一种基于人工智能的商品推荐的方法
技术领域
本申请涉及电子商务技术领域,尤其涉及基于人工智能的商品推荐的方法。
背景技术
近年来,随着互联网的不断发展和快速完善,流量成本越来越贵,拉新成本越来越高,老顾客忠诚度也越来越低,在这种形势下,只有精细化运营每一个客户,才能使品牌保持持续性增长。电商领域的精细化运营,指的是通过用户分群,对不同需求的用户匹配不同的服务和内容,从而满足其个性化的需求。用户画像可以从多个维度来描绘用户特征,不同的产品类型,用户画像的维度也有不同,更快速更准确的画像信息,可以帮助电商精准的定位实际用户群体,并进行商品推荐。
为了能够准确地给用户推荐商品,通常需要对用户特征进行提取,并通过大量的用户购买行为和用户评论信息,对用户的兴趣点POI(points of interest)进行预测,然而,现有技术中并未考虑结合用户的其他行为(例如客服对话)也会对用户的商品推荐提供决策,导致现有商品推荐算法精准性不高。
发明内容
本申请实施例提供一种基于人工智能的商品推荐的方法,用于解决现有技术中商品推荐算法精确性不高的问题。
本发明实施例提供一种基于人工智能的商品推荐的方法,包括:
智能客服系统获取用户对话文本信息,并整理成长文本;
基于GPT2模型将所述长文本进行摘要提取;
基于所述提取出的摘要信息,对所述用户进行用户画像预测;
基于所述用户画像及所述用户购买商品的历史行为,通过环形图注意力网络模型将所述用户与拟推荐商品进行匹配,获取所述拟推荐商品匹配得分PMS;
若所述PMS超过预设阈值,则向所述用户推荐所述拟推荐商品。
可选地,所述基于GPT2模型将所述长文本进行摘要提取,包括:
设置GPT2模型,所述GPT2模型为多层单向传输的解码语言模型;
对所述长文本进行摘要抽取,抽取出第一摘要信息;
将所述第一摘要信息和所述长文本进行处理,形成词嵌入和单词token位置信息;
将所述词嵌入和单词token位置信息作为所述GPT2模型的输入层进行输入,获取输出单向transformer输出向量;
将所述单向transformer输出向量通过softmax分类器进行分类,输出词的概率分布;
基于所述词的概率分布,生成第二摘要信息。
可选地,所述将所述词嵌入和单词token位置信息作为所述GPT2模型的输入层进行输入,获取输出单向transformer输出向量,包括:
设置所述GPT2模型包括n层解码器tranformer,n为正整数;
所述第一层tranformer定义为h0
h0=UWe+WP
其中U={u-k,...,u-1}是上下文的文本词汇,k是文本上下文窗口的大小,We是词嵌入矩阵,WP是位置嵌入矩阵;
第i层tranformer定义为hi
hi=transformer(hi-1),0<=i<=n;
则第n层transformer输出的向量为最终的所述输出单向transformer输出向量。
可选地,所述对所述长文本进行摘要抽取,抽取出第一摘要信息,包括:
加载BERT模型;
调用BERT编码接口,将所述长文本中的文本信息转换为词向量,形成词向量集合;
对所述词向量集合进行k-means聚类,从聚类结果中,选取最接近簇心的词向量作为所述第一摘要信息。
可选地,所述对所述词向量进行k-means聚类,包括:
随机选取k个聚类中心作为簇心;
计算所述词向量集合中所有点到所述k个簇心的欧式距离;
根据上述欧式距离,形成以所述k个簇心为中心的k个簇群;
在所述k个簇群中重新计算簇心,并根据重新计算出的簇心,更新所述簇群,直到完成迭代。
可选地,在所述通过环形图注意力网络模型将所述用户与拟推荐商品进行匹配之前,所述方法还包括:
训练矩阵分类模型,并将所述用户画像和用户购买商品的历史行为输入至所述矩阵分类模型中,以获取所述用户的兴趣点向量和支付能力向量,其中,所述训练矩阵分类模型,包括:
基于所述用户画像,形成用户兴趣点矩阵POI;
基于所述用户购买商品的历史行为,形成用户支付能力矩阵PA;
计算所述用户x对拟推荐商品y的预测值Fx,y
Fx,y=POIx T*PAy
使用最小化目标函数来学习POI和PA,选择随机梯度下降作为优化器,达到收敛条件,获取训练好的矩阵分解模型。
可选地,所述通过环形图注意力网络模型将所述用户与拟推荐商品进行匹配,包括:
基于所述用户的兴趣点向量和支付能力向量,形成用户序列数据集;
将所述用户序列数据集中分为多个预设长度的短序列,并将每一个所述短序列构建成一个环形图;
将所述短序列中的每个行为设置有一个对应的子环形图;所述环形图包括整个所述短序列的信息,所述子环形图只包括与该行为相邻的行为所连成的图;
环形图注意力网络模型中,将环形图注意力机制分别应用在所述环形图和每个子环形图上,得到该用户的全局特征和局部特征;
将所述用户的局部特征和全局特征拼接结合后,输入多层感知机网络,获取用户特征;
获取拟推荐商品的商品特征,将所述用户特征与所述商品特征进行匹配,获取匹配得分。
可选地,对所述用户进行用户画像预测,包括:
基于所述摘要信息,获取所述用户的兴趣点及商品评价;
基于所述用户的兴趣点与商品评价,获取用户画像特征;
遍历用户画像特征库中的特征值,寻找与所述用户画像特征值差值最小的特征值,所述特征值在模板中对应的用户画像为所述预测得到的用户画像。
本发明实施例提供的方法,通过对智能客服系统中获取到用户输入的文本信息,并通过语义分析模型GPT2进行摘要提取,基于该摘要可进行用户画像预测,并基于用户画像及用户商品的历史购买行为,通过图神经网络进行商品匹配,最终能够精确地提供合适的商品推荐,提升了商品推荐的成功率。
附图说明
为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍。
图1为一个实施例中基于人工智能的商品推荐的流程示意图;
图2为一个实施例中GPT2模型结构示意图;
图3为另一个实施例中基于人工智能的商品推荐的流程示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
图1是本发明实施例的其中一个基于人工智能的商品推荐的的流程图,如图1所示,该方法包括:
S101.智能客服系统获取用户对话文本信息,并整理成长文本;
智能客服系统是电子商务网站的后台服务,其本质是通过人工智能的语义解析,采用人工智能客服与用户进行对话,并引导用户进行商品评价、购买等操作,智能客服系统具备良好的语义解析和扩展能力,能够收集用户在不同时间段针对不同商品的聊天记录,并整理成长文本。长文本在本发明中表示用户对同一个商品的所有聊天记录。
在整理成长文本后,智能客服系统还需要对该长文本进行预处理,即将部分噪声去除,例如发送的表情、无用的链接等。并在去除后,通过字符串等方法将聊天记录整理为以句子为单位的长文本。
S102.基于GPT2模型将所述长文本进行摘要提取;
GPT2是OpenAI在近几年推荐的大规模无监督自然语言处理NLP模型,该模型可以生成连贯的文本段落,并且能在未经预训练的情况下,完成阅读理解、问答、机器翻译等多项不同的语言建模任务。
与BERT模型不同的是,GPT2是使用transformer解码器(decoder)模块构建的,而BERT则是通过transformer编码器(encoder)模块构建的。GPT2类似于传统的语言模型,一次只输出一个单词(token)。
在本发明实施例中,基于GPT2模型将所述长文本进行摘要提取,具体可以为:
S1021、设置GPT2模型,所述GPT2模型为多层单向传输的解码语言模型;图2为GPT2模型的示意图,如图2所示,GPT2模型采用的是单向解码器(tramformer,Trm)架构,在训练过程中,会考虑到待生成文本在该词向量之前的所有词向量对该词向量的影响,从而能够更加准确的确定当前词向量,使得训练的目标摘要生成模型能够自动生成语义连贯、句法准确、可读性高、概括性强的语句,其中,C1~CN为对应文本样本的词向量,图中可以看出在训练C2时,会考虑到C1对它的影响,在经过多层解码器架构得到的T1~TN为预设摘要生成模型输出的词向量,TN是生成的最后一个词向量,利用T1~TN从词汇表中确定出相应的单词,连起来就是生成的摘要。
S1022、对所述长文本进行摘要抽取,抽取出第一摘要信息;其中,本发明实施例抽取出第一摘要信息需要通过BERT模型生成词向量,并根据词向量进行k-means聚类。具体地,智能客服系统预先加载BERT模型,并调用BERT编码接口,以便将所述长文本中的文本信息转换为词向量,形成词向量集合;此后,对所述词向量集合进行k-means聚类,从聚类结果中,选取最接近簇心的词向量作为所述第一摘要信息。k-means聚类的具体方法可以为:随机选取k个聚类中心作为簇心;计算所述词向量集合中所有点到所述k个簇心的欧式距离;根据上述欧式距离,形成以所述k个簇心为中心的k个簇群;在所述k个簇群中重新计算簇心,并根据重新计算出的簇心,更新所述簇群,直到完成迭代。
S1023、将所述第一摘要信息和所述长文本进行处理,形成词嵌入和单词(token)位置信息;
GPT2采用多层Trasformer的decoder的语言模型,输入的是词嵌入以及单词token的位置信息。此外,由于GPT2采用的是单向Transformer,只能看到上文的词,对于无标签的文本U={U1,...,Un},最大化语言模型的极大似然函数:
Figure BDA0003227942760000081
其中k是文本上下文窗口的大小,用参数为θ神经网络对条件概率P建模,优化器采用随机梯度下降法。
S1024、将所述词嵌入和单词token位置信息作为所述GPT2模型的输入层进行输入,获取输出单向transformer输出向量;
具体地,将所述词嵌入和单词token位置信息作为所述GPT2模型的输入层进行输入,获取输出单向transformer输出向量,具体包括:
设置所述GPT2模型包括n层解码器tranformer,n为正整数;
所述第一层tranformer定义为h0
h0=UWe+WP
其中U={u-k,...,u-1}是上下文的文本词汇,k是文本上下文窗口的大小,We是词嵌入矩阵,WP是位置嵌入矩阵;
第i层tranformer定义为hi
hi=transformer(hi-1),0<=i<=n;
则第n层transformer输出的向量为最终的所述输出单向transformer输出向量。
S1025、将所述单向transformer输出向量通过softmax分类器进行分类,输出词的概率分布P(u);
P(u)=softmax(hn*We T)
S1026、基于所述词的概率分布,生成第二摘要信息。
需要说明的是,第一摘要信息是初始摘要信息,而第二摘要信息才是最终的结果,即S102中提取出的摘要信息。
本发明实施例采用的其实是一种自监督学习方法,在基于深度学习的生成式方法中,由于用于训练的人工摘要获取困难,常用的监督训练方法所用标签是通过人工总结的标签,而本发明实施例训练采用的标签是通过以上步骤自动生成,并结合生成式方法,使生成的摘要更加合理。
S103.基于所述提取出的摘要信息,对所述用户进行用户画像预测;
在S102中,可提取用户的摘要信息,那么可根据用户的摘要进行部分用户画像的预测。在本发明实施例中,电商平台具备一个用户画像库,在该用户画像库中具备多个不同年龄段、不同性别、不同职业、不同地域的用户的用户画像模板,不同的模板对应的用户兴趣点不同,例如,有的用户喜欢音乐的产品,有的用户喜欢户外运动的产品等,针对不同的用户可设置用户偏好(兴趣点)特征,根据该特征值确定该用户属于哪一类型的用户画像模板。
具体地,在本发明实施例中,可基于所述摘要信息,获取所述用户的兴趣点及商品评价;基于所述用户的兴趣点与商品评价,获取用户画像特征,该用户画像特征既可以是用户对某商品的感兴趣程度,又可以是针对用户摘要信息中提及到该商品的次数等等;遍历用户画像特征库中的特征值,寻找与所述用户画像特征值差值最小的特征值,所述特征值在模板中对应的用户画像为所述预测得到的用户画像。例如,用户A在与智能客服聊天的过程中,提及到了商品B和C,而通过摘要信息中可得知,用户A对于商品B有兴趣且评价高,对于商品C评价低,则结合用户A的这一选择而言,其选择更接近于用户画像模板D(特征值差值最小),则该用户A的用户画像模板为D。
S104.基于所述用户画像及所述用户购买商品的历史行为,通过环形图注意力网络模型将所述用户与拟推荐商品进行匹配,获取所述拟推荐商品匹配得分PMS;
需要说明的是,在通过环形图注意力网络模型进行用户与拟推荐商品匹配之前,本发明实施例还需要进行训练矩阵分类模型,并将所述用户画像和用户购买商品的历史行为输入至所述矩阵分类模型中,以获取所述用户的兴趣点向量和支付能力向量,其中,训练矩阵分类模型的步骤具体可以为:
基于所述用户画像,形成用户兴趣点矩阵POI(points of interest);
基于所述用户购买商品的历史行为,形成用户支付能力矩阵PA(paymentability);
计算所述用户x对拟推荐商品y的预测值Fx,y
Fx,y=POIx T*PAy
使用最小化目标函数来学习POI和PA,选择随机梯度下降作为优化器,达到收敛条件,获取训练好的矩阵分解模型。
在矩阵分类模型输出用户的兴趣点向量和支付能力向量后,S104中通过环形图注意力网络模型将所述用户与拟推荐商品进行匹配具体包括如下步骤:
S1041基于所述用户的兴趣点向量和支付能力向量,形成用户序列数据集;
S1042将所述用户序列数据集中分为多个预设长度的短序列,并将每一个所述短序列构建成一个环形图;
S1043将所述短序列中的每个行为设置有一个对应的子环形图;所述环形图包括整个所述短序列的信息,所述子环形图只包括与该行为相邻的行为所连成的图;
S1044环形图注意力网络模型中,将环形图注意力机制分别应用在所述环形图和每个子环形图上,得到该用户的全局特征和局部特征;
S1045将所述用户的局部特征和全局特征拼接结合后,输入多层感知机网络,获取用户特征;
S1046获取拟推荐商品的商品特征,将所述用户特征与所述商品特征进行匹配,获取拟推荐商品匹配得分PMS。
S105.若所述PMS超过预设阈值,则向所述用户推荐所述拟推荐商品。
与现有技术相比,通过图神经网络进行商品推荐,可极大提升用户建模的精准度以及商品推荐的成功性。
图3是本发明实施例中的另一示意图,如图3所示,本发明实施例中,将文本进行预处理后,通过bert模型提取词向量,并举行聚类,获取第一摘要信息,将第一摘要信息作为输入,通过GPT2模型进行摘要提取,最终获取第二摘要,根据该第二摘要获取用户画像,并将用户画像和用户商品购买的历史行为作为输入,通过环形图注意力网络进行拟推荐商品匹配,最终结合多个人工智能算法,更加精准地推荐商品,提升推荐精准度。
本发明实施例提供的方法,通过对智能客服系统中获取到用户输入的文本信息,并通过语义分析模型GPT2进行摘要提取,基于该摘要可进行用户画像预测,并基于用户画像及用户商品的历史购买行为,通过图神经网络进行商品匹配,最终能够精确地提供合适的商品推荐,提升了商品推荐的成功率。
以上仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (7)

1.一种基于人工智能的商品推荐的方法,其特征在于,包括:
智能客服系统获取用户对话文本信息,并整理成长文本;
基于GPT2模型将所述长文本进行摘要提取;
基于所述提取出的摘要信息,对所述用户进行用户画像预测;
基于所述用户画像及所述用户购买商品的历史行为,通过环形图注意力网络模型将所述用户与拟推荐商品进行匹配,获取所述拟推荐商品匹配得分PMS;
若所述PMS超过预设阈值,则向所述用户推荐所述拟推荐商品;
其中,所述基于GPT2模型将所述长文本进行摘要提取,包括:
设置GPT2模型,所述GPT2模型为多层单向传输的解码语言模型;
对所述长文本进行摘要抽取,抽取出第一摘要信息;
将所述第一摘要信息和所述长文本进行处理,形成词嵌入和单词token位置信息;
将所述词嵌入和单词token位置信息作为所述GPT2模型的输入层进行输入,获取输出单向transformer输出向量;
将所述单向transformer输出向量通过softmax分类器进行分类,输出词的概率分布;
基于所述词的概率分布,生成第二摘要信息。
2.根据权利要求1所述的方法,其特征在于,所述将所述词嵌入和单词token位置信息作为所述GPT2模型的输入层进行输入,获取输出单向transformer输出向量,包括:
设置所述GPT2模型包括n层解码器tranformer,n为正整数;
第一层tranformer定义为h0
Figure 275372DEST_PATH_IMAGE002
其中
Figure 894310DEST_PATH_IMAGE004
是上下文的文本词汇,k是文本上下文窗口的大小,
Figure 877309DEST_PATH_IMAGE006
是词嵌入矩阵,
Figure 272518DEST_PATH_IMAGE008
是位置嵌入矩阵;
第i层tranformer定义为hi
hi=transformer(hi-1),0<=i<=n;
则第n层transformer输出的向量为最终的所述输出单向transformer输出向量。
3.根据权利要求1所述的方法,其特征在于,所述对所述长文本进行摘要抽取,抽取出第一摘要信息,包括:
加载BERT模型;
调用BERT编码接口,将所述长文本中的文本信息转换为词向量,形成词向量集合;
对所述词向量集合进行k-means聚类,从聚类结果中,选取最接近簇心的词向量作为所述第一摘要信息。
4.根据权利要求3所述的方法,其特征在于,所述对所述词向量进行k-means聚类,包括:
随机选取k个聚类中心作为簇心;
计算所述词向量集合中所有点到所述k个簇心的欧式距离;
根据上述欧式距离,形成以所述k个簇心为中心的k个簇群;
在所述k个簇群中重新计算簇心,并根据重新计算出的簇心,更新所述簇群,直到完成迭代。
5.根据权利要求1所述的方法,其特征在于,在所述通过环形图注意力网络模型将所述用户与拟推荐商品进行匹配之前,所述方法还包括:
训练矩阵分类模型,并将所述用户画像和用户购买商品的历史行为输入至所述矩阵分类模型中,以获取所述用户的兴趣点向量和支付能力向量,其中,所述训练矩阵分类模型,包括:
基于所述用户画像,形成用户兴趣点矩阵POI;
基于所述用户购买商品的历史行为,形成用户支付能力矩阵PA;
计算所述用户x对拟推荐商品y的预测值Fx,y
Fx,y=POIx T*PAy
使用最小化目标函数来学习POI和PA,选择随机梯度下降作为优化器,达到收敛条件,获取训练好的矩阵分解模型。
6.根据权利要求5所述的方法,其特征在于,所述通过环形图注意力网络模型将所述用户与拟推荐商品进行匹配,包括:
基于所述用户的兴趣点向量和支付能力向量,形成用户序列数据集;
将所述用户序列数据集中分为多个预设长度的短序列,并将每一个所述短序列构建成一个环形图;
将所述短序列中的每个行为设置有一个对应的子环形图;所述环形图包括整个所述短序列的信息,所述子环形图只包括与该行为相邻的行为所连成的图;
环形图注意力网络模型中,将环形图注意力机制分别应用在所述环形图和每个子环形图上,得到该用户的全局特征和局部特征;
将所述用户的局部特征和全局特征拼接结合后,输入多层感知机网络,获取用户特征;
获取拟推荐商品的商品特征,将所述用户特征与所述商品特征进行匹配,获取匹配得分。
7.根据权利要求1所述的方法,其特征在于,对所述用户进行用户画像预测,包括:
基于所述摘要信息,获取所述用户的兴趣点及商品评价;
基于所述用户的兴趣点与商品评价,获取用户画像特征;
遍历用户画像特征库中的特征值,寻找与所述用户画像特征值差值最小的特征值,所述特征值在模板中对应的用户画像为所述预测得到的用户画像。
CN202110977160.1A 2021-08-24 2021-08-24 一种基于人工智能的商品推荐的方法 Active CN113781160B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110977160.1A CN113781160B (zh) 2021-08-24 2021-08-24 一种基于人工智能的商品推荐的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110977160.1A CN113781160B (zh) 2021-08-24 2021-08-24 一种基于人工智能的商品推荐的方法

Publications (2)

Publication Number Publication Date
CN113781160A CN113781160A (zh) 2021-12-10
CN113781160B true CN113781160B (zh) 2023-02-03

Family

ID=78839045

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110977160.1A Active CN113781160B (zh) 2021-08-24 2021-08-24 一种基于人工智能的商品推荐的方法

Country Status (1)

Country Link
CN (1) CN113781160B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114399343B (zh) * 2022-03-24 2022-07-15 北京优全智汇信息技术有限公司 一种智能机器人线上辅助销售方法及系统

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11416689B2 (en) * 2019-03-28 2022-08-16 Siemens Aktiengesellschaft System and method for natural language processing with a multinominal topic model
CN111310029B (zh) * 2020-01-20 2022-11-01 哈尔滨理工大学 一种基于用户商品画像和潜在因子特征提取的混合推荐方法
CN111797210A (zh) * 2020-03-03 2020-10-20 中国平安人寿保险股份有限公司 基于用户画像的信息推荐方法、装置、设备及存储介质
CN113256367B (zh) * 2021-04-25 2023-06-06 西安交通大学 用户行为历史数据的商品推荐方法、系统、设备及介质
CN113239268B (zh) * 2021-04-29 2023-04-07 佛山科学技术学院 一种商品推荐方法、装置及系统

Also Published As

Publication number Publication date
CN113781160A (zh) 2021-12-10

Similar Documents

Publication Publication Date Title
CN112084337B (zh) 文本分类模型的训练方法、文本分类方法及设备
CN109062893B (zh) 一种基于全文注意力机制的商品名称识别方法
CN111680159B (zh) 数据处理方法、装置及电子设备
CN110069709B (zh) 意图识别方法、装置、计算机可读介质及电子设备
Kumar et al. Towards the Explainability of Multimodal Speech Emotion Recognition.
CN109871485B (zh) 一种个性化推荐方法及装置
CN111428028A (zh) 基于深度学习的信息分类方法及相关设备
CN107169572A (zh) 一种基于Mahout的机器学习服务组装方法
CN112418320B (zh) 一种企业关联关系识别方法、装置及存储介质
CN116661805B (zh) 代码表示的生成方法和装置、存储介质及电子设备
CN113688951A (zh) 视频数据处理方法以及装置
CN115935975A (zh) 一种情感可控的新闻评论生成方法
CN114443899A (zh) 视频分类方法、装置、设备及介质
CN114648031A (zh) 基于双向lstm和多头注意力机制的文本方面级情感识别方法
CN113705238A (zh) 基于bert和方面特征定位模型的方面级情感分析方法及模型
CN113781160B (zh) 一种基于人工智能的商品推荐的方法
CN115392254A (zh) 一种基于目标任务可解释性认知预测与判别方法及其系统
CN116186562B (zh) 基于编码器的长文本匹配方法
CN113268592A (zh) 基于多层次交互注意力机制的短文本对象情感分类方法
CN113158667A (zh) 基于实体关系级别注意力机制的事件检测方法
CN116702753A (zh) 基于图注意力网络的文本情感分析方法
CN117033558A (zh) 一种融合bert-wwm与多特征的影评情感分析方法
kumar Mall et al. Self-Attentive CNN+ BERT: An Approach for Analysis of Sentiment on Movie Reviews Using Word Embedding
CN115994223A (zh) 序列化多标签分类方法、装置、设备和介质
CN115186085A (zh) 回复内容处理方法以及媒体内容互动内容的交互方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20220316

Address after: 561000 room 17011, unit 1, building C, Jianbo International Plaza, No. 188, Huangguoshu street, Huaxi street, Xixiu District, Anshun City, Guizhou Province

Applicant after: Guizhou Anhe Shengda Enterprise Management Co.,Ltd.

Address before: 518129 Bantian shangpinya garden, Longgang District, Shenzhen City, Guangdong Province

Applicant before: Zhang Yang

TA01 Transfer of patent application right

Effective date of registration: 20221020

Address after: 274009 room 07003, building 6, Shangri La Jiayuan, South and east of Qingnian Road, Mudan District, Heze City, Shandong Province

Applicant after: Heze zhuotong Internet Co.,Ltd.

Address before: 561000 room 17011, unit 1, building C, Jianbo International Plaza, No. 188, Huangguoshu street, Huaxi street, Xixiu District, Anshun City, Guizhou Province

Applicant before: Guizhou Anhe Shengda Enterprise Management Co.,Ltd.

TA01 Transfer of patent application right
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20221216

Address after: 561000 room 17011, unit 1, building C, Jianbo International Plaza, No. 188, Huangguoshu street, Huaxi street, Xixiu District, Anshun City, Guizhou Province

Applicant after: Guizhou Anhe Shengda Enterprise Management Co.,Ltd.

Address before: 274009 room 07003, building 6, Shangri La Jiayuan, South and east of Qingnian Road, Mudan District, Heze City, Shandong Province

Applicant before: Heze zhuotong Internet Co.,Ltd.

TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20230112

Address after: Room 4205, No. 99 Yilan Road, Siming District, Xiamen City, Fujian Province, 361000

Applicant after: Fujian jinshubao Technology Co.,Ltd.

Address before: 561000 room 17011, unit 1, building C, Jianbo International Plaza, No. 188, Huangguoshu street, Huaxi street, Xixiu District, Anshun City, Guizhou Province

Applicant before: Guizhou Anhe Shengda Enterprise Management Co.,Ltd.

GR01 Patent grant
GR01 Patent grant