CN113763084A - 产品推荐的处理方法、装置、设备及存储介质 - Google Patents

产品推荐的处理方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN113763084A
CN113763084A CN202010993838.0A CN202010993838A CN113763084A CN 113763084 A CN113763084 A CN 113763084A CN 202010993838 A CN202010993838 A CN 202010993838A CN 113763084 A CN113763084 A CN 113763084A
Authority
CN
China
Prior art keywords
scene
product
target
products
theme
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010993838.0A
Other languages
English (en)
Inventor
吴荣强
李志鹏
刘朋樟
杜永青
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Century Trading Co Ltd
Beijing Wodong Tianjun Information Technology Co Ltd
Original Assignee
Beijing Jingdong Century Trading Co Ltd
Beijing Wodong Tianjun Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Century Trading Co Ltd, Beijing Wodong Tianjun Information Technology Co Ltd filed Critical Beijing Jingdong Century Trading Co Ltd
Priority to CN202010993838.0A priority Critical patent/CN113763084A/zh
Publication of CN113763084A publication Critical patent/CN113763084A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0623Item investigation
    • G06Q30/0625Directed, with specific intent or strategy
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0633Lists, e.g. purchase orders, compilation or processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • General Engineering & Computer Science (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供一种产品推荐的处理方法、装置、设备及存储介质,该方法包括:接收第一用户的产品搜索请求;根据所述产品搜索请求,确定所述产品搜索请求所包括的第一场景词所属的目标主题场景;获取所述目标主题场景对应的产品池中的产品作为待推荐产品;将所述待推荐产品推荐给所述第一用户。由于其各主题场景对应的产品池是基于用户历史行为数据获得的,能够有效获得大量主题场景及其对应的场景词,从而更好更准确地为用户推荐产品,解决现有技术场景词较少,无法准确为用户推荐产品的问题。

Description

产品推荐的处理方法、装置、设备及存储介质
技术领域
本发明涉及计算机技术领域,尤其涉及一种产品推荐的处理方法、装置、设备及存储介质。
背景技术
随着自然语言处理技术的飞速发展,其在电商领域的应用越来越广泛。用户在电商平台购买产品时,通常会搜索具体的产品,电商平台根据用户搜索请求为用户推荐相应的产品供用户选择购买。
随着生活质量的不断提高,用户对购买产品的需求也趋于多样化,可能简单的搜索服务不能满足用户的需求,比如当用户处于某种场景并不确定应该买什么产品时,基于主题场景的产品推荐可以为用户提供更准确更优质的产品列表。
现有技术中,主题场景对应的场景词是人工总结的,效率低,且总结出的场景词较少,对于用户对各种场景的搜索需求,无法准确地为用户推荐相应的产品。
发明内容
本发明实施例提供一种产品推荐的处理方法、装置、设备及存储介质,以解决现有技术推荐准确性低等缺陷。
第一个方面,本发明实施例提供一种产品推荐的处理方法,包括:
接收第一用户的产品搜索请求;
根据所述产品搜索请求,确定所述产品搜索请求所包括的第一场景词所属的目标主题场景;
获取所述目标主题场景对应的产品池中的产品作为待推荐产品,各主题场景对应的产品池是基于用户历史行为数据获得的;
将所述待推荐产品推荐给所述第一用户。
可选地,基于用户历史行为数据获得各主题场景对应的产品池,包括:
基于用户评论内容数据,确定第一组场景词及各场景词关联的产品;
将所述第一组场景词作为目标场景词,对所述目标场景词进行语义相似合并,获得至少一个主题场景,每个主题场景对应至少一个目标场景词;
根据各主题场景对应的目标场景词及各目标场景词关联的产品,确定各主题场景对应的产品池。
可选地,基于用户历史行为数据获得各主题场景对应的产品池,还包括:
基于用户历史搜索数据,确定第二组场景词;
将所述第一组场景词和所述第二组场景词去重后作为所述目标场景词;
所述方法还包括:
基于用户历史点击行为数据及历史订单数据,确定涉及的目标产品,并构建目标产品之间的二元组关系;
根据所述目标产品之间的二元组关系,确定所述目标产品的邻接矩阵;
根据所述目标产品的用户评论内容及所述目标产品的属性,确定所述目标产品的产品特征;
基于所述目标产品的邻接矩阵及产品特征,采用训练好的场景分类模型,确定各所述目标产品关联的主题场景;
所述根据各主题场景对应的场景词及各场景词关联的产品,确定各主题场景对应的产品信息,包括:
根据各主题场景对应的场景词及各场景词关联的产品,以及各所述目标产品关联的主题场景,确定各主题场景对应的产品池。
可选地,所述根据所述目标产品的用户评论内容及所述目标产品的产品属性,确定所述目标产品的产品特征,包括:
对所述目标产品的用户评论内容进行分词处理,获得分词结果;
根据分词结果,采用TF-IDF算法,确定所述目标产品的关键词特征;
根据所述目标产品的产品属性,确定所述目标产品的属性特征;
将所述关键词特征和所述属性特征作为所述目标产品的产品特征。
可选地,所述方法还包括:
对所述目标产品的产品特征进行one-hot编码处理,获得所述目标产品对应的产品特征编码。
可选地,所述基于所述目标产品的邻接矩阵及产品特征,采用训练好的场景分类模型,确定各所述目标产品关联的主题场景,包括:
将所述邻接矩阵及产品特征编码输入到训练好的GCN分类模型,获得各所述目标产品的分类结果,所述分类结果包括各目标产品属于不同主题场景的概率;
基于各所述目标产品的分类结果,确定各所述目标产品关联的主题场景。
可选地,所述方法还包括:
获取产品属性信息;
基于所述产品属性信息,确定第三组场景词及各场景词关联的产品;
将所述第一组场景词、所述第二组场景词及所述第三组场景词去重后作为所述目标场景词。
可选地,所述对所述目标场景词进行语义相似合并,获得至少一个主题场景,包括:
采用训练好的word2vector模型构建各所述目标场景词对应的空间向量;
基于各所述目标场景词对应的空间向量,采用空间余弦相似度算法确定各所述目标场景词之间的语义相似度;
基于各所述目标场景词之间的语义相似度进行语义相似合并,获得至少一个主题场景。
可选地,所述方法还包括:
对各主题场景进行结构化处理,确定各主题场景所属的上位场景;
基于所述上位场景及各上位场景包括的主题场景为用户进行产品推荐。
可选地,在获得各主题场景对应的产品池之后,所述方法还包括:
针对每个主题场景对应的产品池,将所述产品池中的产品按预设规则进行排序,获得排序结果;
根据所述排序结果,将排名靠前的预设数量的产品作为待推荐产品。
可选地,所述将所述产品池中的产品按预设规则进行排序,获得排序结果,包括:
获取所述产品池中各产品的销量、独立访客量、访问量、好评率、单价中的至少一种因素;
根据各因素的预设权重,确定各产品的得分;
将各产品按得分进行排序,获得所述排序结果。
上述发明中的一个实施例具有如下优点或者有益效果:
通过结合用户评论内容数据和用户历史搜索数据挖掘更多的主题场景,并且基于用户历史点击行为数据和历史订单数据,可以有效扩充各主题场景对应产品池的产品,提高产品覆盖度。
上述发明中的另一个实施例具有如下优点或者有益效果:
还通过场景分类模型,对更多产品进行场景分类,进一步提高产品池中热销产品的覆盖度。
上述发明中的再一个实施例具有如下优点或者有益效果:
还可以对产品池中产品进行口碑排序,将排序靠前的一定数量的产品作为待推荐产品推荐给用户,进一步提高推荐准确性,从而提高用户体验。
第二个方面,本发明实施例提供一种产品推荐的处理装置,包括:
接收模块,用于接收第一用户的产品搜索请求;
确定模块,用于根据所述产品搜索请求,确定所述产品搜索请求所包括的第一场景词所属的目标主题场景;
获取模块,用于获取所述目标主题场景对应的产品池中的产品作为待推荐产品,各主题场景对应的产品池是基于用户历史行为数据获得的;
推荐模块,用于将所述待推荐产品推荐给所述第一用户。
可选地,该装置还包括,处理模块,用于:
基于用户评论内容数据,确定第一组场景词及各场景词关联的产品;
将所述第一组场景词作为目标场景词,对所述目标场景词进行语义相似合并,获得至少一个主题场景,每个主题场景对应至少一个目标场景词;
根据各主题场景对应的目标场景词及各目标场景词关联的产品,确定各主题场景对应的产品池。
可选地,所述处理模块,还用于:
基于用户历史搜索数据,确定第二组场景词;将所述第一组场景词和所述第二组场景词去重后作为所述目标场景词;
所述处理模块,还用于:
基于用户历史点击行为数据及历史订单数据,确定涉及的目标产品,并构建目标产品之间的二元组关系;
根据所述目标产品之间的二元组关系,确定所述目标产品的邻接矩阵;
根据所述目标产品的用户评论内容及所述目标产品的属性,确定所述目标产品的产品特征;
基于所述目标产品的邻接矩阵及产品特征,采用训练好的场景分类模型,确定各所述目标产品关联的主题场景;
所述处理模块,具体用于:
根据各主题场景对应的场景词及各场景词关联的产品,以及各所述目标产品关联的主题场景,确定各主题场景对应的产品池。
可选地,所述处理模块,具体用于:
对所述目标产品的用户评论内容进行分词处理,获得分词结果;
根据分词结果,采用TF-IDF算法,确定所述目标产品的关键词特征;
根据所述目标产品的产品属性,确定所述目标产品的属性特征;
将所述关键词特征和所述属性特征作为所述目标产品的产品特征。
可选地,所述处理模块,还用于:
对所述目标产品的产品特征进行one-hot编码处理,获得所述目标产品对应的产品特征编码。
可选地,所述处理模块,具体用于:
将所述邻接矩阵及产品特征编码输入到训练好的GCN分类模型,获得各所述目标产品的分类结果,所述分类结果包括各目标产品属于不同主题场景的概率;
基于各所述目标产品的分类结果,确定各所述目标产品关联的主题场景。
可选地,所述处理模块,具体用于:
获取产品属性信息;
基于所述产品属性信息,确定第三组场景词及各场景词关联的产品;
将所述第一组场景词、所述第二组场景词及所述第三组场景词去重后作为所述目标场景词。
可选地,所述处理模块,具体用于:
采用训练好的word2vector模型构建各所述目标场景词对应的空间向量;
基于各所述目标场景词对应的空间向量,采用空间余弦相似度算法确定各所述目标场景词之间的语义相似度;
基于各所述目标场景词之间的语义相似度进行语义相似合并,获得至少一个主题场景。
可选地,处理模块还用于:
对各主题场景进行结构化处理,确定各主题场景所属的上位场景;
基于所述上位场景及各上位场景包括的主题场景为用户进行产品推荐。
可选地,处理模块,还用于:
针对每个主题场景对应的产品池,将所述产品池中的产品按预设规则进行排序,获得排序结果;
根据所述排序结果,将排名靠前的预设数量的产品作为待推荐产品。
可选地,所述处理模块,具体用于:
获取所述产品池中各产品的销量、独立访客量、访问量、好评率、单价中的至少一种因素;
根据各因素的预设权重,确定各产品的得分;
将各产品按得分进行排序,获得所述排序结果。
第三个方面,本发明实施例提供一种电子设备,包括:至少一个处理器和存储器;
所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如上第一个方面以及第一个方面各种可能的设计所述的方法。
第四个方面,本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如上第一个方面以及第一个方面各种可能的设计所述的方法。
本发明实施例提供的产品推荐的处理方法、装置、设备及存储介质根据第一用户的产品搜索请求,确定产品搜索请求所包括的第一场景词所属的目标主题场景,获取所述目标主题场景对应的产品池中的产品作为待推荐产品,将所述待推荐产品推荐给所述用户,由于其各主题场景对应的产品池是基于用户历史行为数据获得的,能够有效获得大量主题场景及其对应的场景词,从而更好更准确地为用户推荐产品,解决现有技术场景词较少,无法准确为用户推荐产品的问题。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例基于的处理系统的架构示意图;
图2为本发明一实施例提供的产品推荐的处理方法的流程示意图;
图3为本发明另一实施例提供的一种产品推荐的处理方法的流程示意图;
图4为本发明另一实施例提供的另一种产品推荐的处理方法的流程示意图;
图5为本发明一实施例提供的一种二元组关系网络的示意图;
图6为本发明一实施例提供的one-hot编码的示意图;
图7为本发明一实施例提供的场景分类模型的网络结构示意图;
图8为本发明一实施例提供的word2vector模型应用过程示意图;
图9为本发明一实施例提供的产品推荐的处理装置的结构示意图;
图10为本发明另一实施例提供的产品推荐的处理装置的结构示意图;
图11为本发明一实施例提供的电子设备的结构示意图。
通过上述附图,已示出本发明明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本公开构思的范围,而是通过参考特定实施例为本领域技术人员说明本发明的概念。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
首先对本发明所涉及的名词进行解释:
word2vector:是一种把单词转换成向量的工具。它本质上是一种单词聚类的方法,是实现单词语义推测、句子情感分析等目的一种手段。
one-hot编码:是将类别变量转换为机器学习算法易于利用的一种形式的过程,通常是把特征变量转化为只包含0,1的向量;
jieba分词:也可称为结巴分词,指的是将一个汉字序列切分成一个一个单独的词。分词就是将连续的字序列按照一定的规范重新组合成词序列的过程;
TF-IDF:是一种用于信息检索与数据挖掘的加权技术。TF是词频(TermFrequency),IDF是逆文本频率指数(Inverse Document Frequency),公式为:TF*IDF。其主要思想是:如果某个词或短语在一篇文章中出现的频率TF高,并且在其他文章中很少出现,则认为此词或者短语具有很好的类别区分能力。
GCN:Graph Convolutional Network,图卷积网络,是一种特征提取器,它的对象是图网络。GCN精妙地设计了一种从图网络中提取特征的方法,从而可以使用这些特征去对图网络进行节点分类、图分类、边预测,还可以得到图的嵌入表示。GCN分为谱卷积和空间域卷积,效率上谱卷积计算量会随图大小急剧增加,因为模型需要同时计算特征向量或者同时处理大图,使得模型很难对大图进行并行处理或缩放。空间域卷积直接对图域的邻居节点进行聚合,所以有潜力处理大图,方法是对一个batch数据计算而不是在整个图上计算。如果邻居节点的数量增加,能够通过采样技术提高效率。通用性上谱卷积假设图是固定的,因此对新的或者不同的图泛化性能很差空间域卷积在每个节点上进行局部图卷积,权值可以很容易地在不同地位置和结构之间共享。灵活性上谱卷积只适用于无向图,谱方法用于有向图的唯一方法是将有向图转换为无向图,因为没有有向图的拉普拉斯矩阵明确的定义。空间域卷积可以将输入合并到聚合函数中,所以在处理多源输入像是边特征边方向上更灵活。
随着自然语言处理技术的飞速发展,其在电商领域的应用越来越广泛。用户在电商平台购买产品时,通常会搜索具体的产品,电商平台根据用户搜索请求为用户推荐相应的产品供用户选择购买。随着生活质量的不断提高,用户对购买产品的需求也趋于多样化,可能简单的搜索服务不能满足用户的需求,比如当用户处于某种场景并不确定应该买什么产品时,基于主题场景的产品推荐可以为用户提供更准确更优质的产品列表。现有技术中,主题场景对应的场景词是人工总结的,效率低,且总结出的场景词较少,对于用户对各种场景的搜索需求,无法准确地为用户推荐相应的产品。
针对现有技术存在的上述问题,发明人进行了创造性的研究,在研究中发现,现有技术由于是人工总结主题场景,一方面工作效率低,另一方面总结出的场景词较少,无法准确地为用户各种场景的搜索推荐产品,为了能够解决上述问题,发明人创造性地发现在用户历史行为数据中存在有大量相关的场景词,比如用户对已购买产品的评论内容中往往容易存在相应的场景词,为场景词的挖掘提供了很好的数据支撑。因此本发明实施例提供一种产品推荐的处理方法,基于用户历史行为数据来挖掘场景词,并确定不同主题场景对应的产品池,基于不同主题场景对应的产品池响应用户搜索请求,为用户推荐产品,有效提高了产品推荐的准确性,从而提高用户体验。
本发明实施例提供的产品推荐的处理方法,适用于需要基于用户需要的场景为用户推荐产品的应用场景。如图1所示,为本发明实施例基于的处理系统的架构示意图。该处理系统可以包括电子设备和至少一个终端。终端可以是手机、笔记本电脑、台式电脑等设备。其中电子设备可以为服务器。用户通过终端访问购买平台,在产品搜索界面进行产品搜索,终端则向服务器发送产品搜索请求,服务器接收到产品搜索请求,可以确定产品搜索请求所包括的第一场景词所属的目标主题场景,获取目标主题场景对应的产品池中的产品作为待推荐产品,将待推荐产品推荐给用户,其中,各主题场景对应的产品池是基于用户历史行为数据获得的,用户历史行为数据可以包括用户历史搜索数据、用户评论内容数据(或者优质评论内容数据)、用户历史点击行为数据、用户历史订单数据等,可以有效增加主题场景对应的场景词量,更好更准确地为用户推荐产品。可选地,该处理系统还可以包括其他服务器,比如电商平台的维护历史数据的服务器,该电子设备从其他服务器获取相关的数据,比如用户历史行为数据。用户历史行为数据也可以是预先存储在该电子设备的。
此外,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。在以下各实施例的描述中,“多个”的含义是两个以上,除非另有明确具体的限定。
下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本发明的实施例进行描述。
本发明一实施例提供一种产品推荐的处理方法,用于基于场景为用户推荐产品。本实施例的执行主体为产品推荐的处理装置,该装置可以设置在电子设备中,具体可以为设置在服务器中。
如图2所示,为本实施例提供的产品推荐的处理方法的流程示意图,该方法包括:
步骤101,接收第一用户的产品搜索请求。
具体的,第一用户可以是任意的用户,用户可以通过终端登录电商平台浏览或购买产品,当用户对于某些场景下不知道应该买什么产品或者想了解该场景下都有些什么产品时,则可以通过电商平台的产品搜索功能进行搜索,比如在搜索框输入相应的场景关键词(简称场景词),点击搜索,终端则可以获取用户输入的场景词,向服务器发送产品搜索请求,服务器则可以接收到第一用户的产品搜索请求。产品搜索请求包括第一用户输入的第一场景词,比如“差旅”、“游戏”、“居家”等场景词。
步骤102,根据产品搜索请求,确定产品搜索请求所包括的第一场景词所属的目标主题场景。
具体的,在接收到产品搜索请求后,可以获取产品搜索请求中的场景词,为了区分描述称为第一场景词。将第一场景词与预先获得的各主题场景对应的场景词进行匹配,来确定第一场景词所属的主题场景,为了区分描述称为目标主题场景。预先获得的各主题场景基于用户历史行为数据挖掘获得。用户历史行为数据可以包括用户历史搜索数据、用户评论内容数据及其他相关的行为数据。
示例性的,可以从用户评论内容数据中挖掘获得一些场景词,经语义相似合并获得一批主题场景。比如,用户评论内容中对某键盘产品的评论为,打游戏非常顺手,操作灵敏等,可以得到场景词“游戏”,并可以获得该键盘产品与游戏是关联的。对于挖掘到的场景词有可能有多个场景词表达的是相同的语义,因此可以对挖掘的场景词进行语义相似合并,将表示同一语义的多个场景词归类为一个主题场景。各主题场景可以用其代表的其中一个场景词表示,也可以重新为其设置场景标识,具体可以根据实际需求设置。比如“家居”、“居家”、“居家日常”等场景词需要进行语义相似合并,合并后对应一个主题场景,比如该主题场景以“居家”表示,也可以用标识性符号表示。可以存储各主题场景与其代表的场景词的对应关系,或者称为主题场景与其对应的场景词库。比如:主题场景1=[场景词1,场景词2,…,场景词N]。具体存储方式可以根据实际需求设置。
可选地,还可以是结合用户历史行为数据及产品属性共同挖掘场景词,以及合并获得主题场景。
步骤103,获取目标主题场景对应的产品池中的产品作为待推荐产品。
其中,各主题场景及对应的产品池是基于用户历史行为数据获得的。
具体的,在确定了第一场景词所属的目标主题场景后,则可以获取目标主题场景对应的产品池中的产品作为待推荐产品。具体来说,每个主题场景对应有相应的产品池,产品池包括属于该主题场景的产品信息或产品列表。每个主题场景对应的产品池也可以是基于用户历史行为数据获得。
示例性的,在根据用户评论内容数据挖掘场景词时,可以获得场景词与用户评论的产品的关联关系,从而可以将与这些场景词关联的产品加入到该场景词所属主题场景的产品池中;
示例性的,在基于用户历史搜索数据挖掘场景词时,可以基于各场景词所属的主题场景及预先标注的产品,训练获得场景分类模型,并基于场景分类模型,将更多的产品归类到相应的主题场景,加入相应主题场景对应的产品池。
可选地,还可以基于产品属性挖掘一些场景词,以扩充已有的场景词库。
可选地,还可以采用各种其他方式来挖掘场景词,不断补充新的主题场景及各主题场景对应的场景词库。
可选地,可以将目标主题场景对应的产品池中的全部产品作为待推荐产品,也可以是将部分产品作为待推荐产品,具体可以根据实际需求设置。
比如可以对产品池中的产品按一定需求(比如销量、好评率、价格、独立访客量、访问量等因素中的一种或多种)进行排序,将排序后的产品列表作为待推荐产品,也可以是将排序靠前的预设数量的产品作为待推荐产品。
步骤104,将待推荐产品推荐给第一用户。
具体的,在确定了待推荐产品后,则可以将待推荐产品推荐给第一用户。比如,可以将待推荐产品列表发送给第一用户的终端,以使终端将待推荐产品列表展示给第一用户。
本实施例提供的产品推荐的处理方法,根据第一用户的产品搜索请求,确定产品搜索请求所包括的第一场景词所属的目标主题场景,获取目标主题场景对应的产品池中的产品作为待推荐产品,将待推荐产品推荐给用户,由于其各主题场景对应的产品池是基于用户历史行为数据获得的,能够有效获得大量主题场景及其对应的场景词,从而更好更准确地为用户推荐产品,解决现有技术场景词较少,无法准确为用户推荐产品的问题。
本发明另一实施例对上述实施例提供的方法做进一步补充说明。
如图3所示,为本实施例提供的一种产品推荐的处理方法的流程示意图。
作为一种可实施的方式,在上述实施例的基础上,可选地,基于用户历史行为数据获得各主题场景对应的产品池,具体包括:
步骤2011,基于用户评论内容数据,确定第一组场景词及各场景词关联的产品。
具体的,可以从用户评论内容数据中挖掘获得一些场景词,为了区分描述称为第一组场景词。具体的挖掘方式可以是获取优质评论内容,通过分词、过滤筛选等,获得第一组场景词。由于用户评论内容数据是各用户对各产品的评论,因此可以获取每条评论内容对应的产品,也即表示该评论内容包含的场景词语该评论内容对应的产品关联。还可以根据获得的场景词与更多其他产品的评论内容进行匹配,挖掘更多的关联产品,还可以根据获得的场景词与更多其他产品的产品名称、产品属性等进行匹配,挖掘更多的关联产品。具体的关联产品的确定方式可以根据实际需求设置。
比如,用户评论内容中对某键盘产品的评论为,打游戏非常顺手,操作灵敏等,可以得到场景词“游戏”,并可以获得该键盘产品与游戏是关联的。可以将场景词“游戏”与更多其他产品匹配,有可能有些产品的产品属性会有“游戏”场景词,比如鼠标、手机、笔记本等等。因此可以挖掘出与“游戏”场景词关联的更多产品。
步骤2012,将第一组场景词作为目标场景词。
步骤2013,对目标场景词进行语义相似合并,获得至少一个主题场景,每个主题场景对应至少一个目标场景词。
具体的,由于对于挖掘到的场景词有可能有多个场景词表达的是相同的语义,因此在获得第一组场景词后,则可以将第一组场景词作为目标场景词,对目标场景词进行语义相似合并,将表示同一语义的多个场景词归类为一个主题场景。各主题场景可以用其代表的其中一个场景词表示,也可以重新为其设置场景标识,具体可以根据实际需求设置。比如“家居”、“居家”、“居家日常”等场景词需要进行语义相似合并,合并后对应一个主题场景,比如该主题场景以“居家”表示,也可以用标识性符号表示。可以存储各主题场景与其代表的场景词的对应关系,或者称为主题场景与其对应的场景词库。比如:主题场景1=[场景词1,场景词2,…,场景词N]。具体存储方式可以根据实际需求设置。
步骤2014,根据各主题场景对应的目标场景词及各目标场景词关联的产品,确定各主题场景对应的产品池。
具体的,在获得了各主题场景、各主题场景对应的目标场景词及各目标场景词关联的产品后,即可确定各主题场景对应的产品池。具体来说,对于一个主题场景,其可能对应一个或多个目标场景词,可以称为场景词库,每个目标场景词又可能关联有一个或多个产品,则将该主题场景对应的各场景词所关联的产品均加入到该主题场景对应的产品池。
如图4所示,为本实施例提供的另一种产品推荐的处理方法的流程示意图
可选地,基于用户历史行为数据获得各主题场景对应的产品池,还包括:
步骤2021,基于用户历史搜索数据,确定第二组场景词。
具体的,在用户进行产品搜索时,可以记录用户的搜索行为数据作为后续的用户历史搜索数据。比如用户搜索了哪些关键词。对用户历史搜索数据可以按照预设的筛选规则进行筛选过滤,获得第二组场景词。筛选规则比如可以是去掉明显无效的关键词。还可以预设一些明显不是场景词的关键词进行过滤。具体的筛选规则可以根据实际需求设置。
步骤2022,将第一组场景词和第二组场景词去重后作为目标场景词。
对于不同方式挖掘到的关键词可能有重复的,因此可以将第一组场景词和第二组场景词集合及去重后作为目标场景词,进行后续的语义相似性合并,并基于合并获得的主题场景用于训练获得场景分类模型。
相应的,该方法还包括:
步骤2031,基于用户历史点击行为数据及历史订单数据,确定涉及的目标产品,并构建目标产品之间的二元组关系。
具体的,为了扩充各主题场景的产品池,可以基于用户历史行为数据挖掘与各主题场景相关场景词关联的产品,具体可以是基于用户历史点击行为数据及历史订单数据来确定点击行为和订单所涉及的产品(为了区分描述称为目标产品),并构建目标产品之间的二元组关系。
示例性的,对于用户历史点击行为数据,在预设时间内的两次点击的产品可以构成一个二元组,比如用户在10:00点击了某笔记本产品A,在10:02又点击了某鼠标产品B,则该笔记本产品A和该鼠标产品B构成一个二元组<A,B>。
示例性的,对于历史订单数据,一个订单中包括的多个产品可以构成多个二元组。比如一个订单中包括产品A、B、C、D,则可以构成二元组<A,B>,<A,C>,<A,D>,<B,C>,<B,D>,<C,D>。各目标产品之间的二元组关系可以形成网络,网络以产品为顶点,比如以产品的标识(比如产品ID)为顶点,两个产品同时出现在同一二元组中的关系作为边。
示例性的,如图5所示,为本实施例提供的一种二元组关系网络的示意图。
步骤2032,根据目标产品之间的二元组关系,确定目标产品的邻接矩阵。
具体的,根据目标产品之间的二元组关系可以确定目标产品的邻近矩阵,作为场景分类模型的一个输入。
示例性的,图5所示的二元组关系网络对应的邻接矩阵如下:
Figure BDA0002691769940000121
步骤2033,根据目标产品的用户评论内容及目标产品的属性,确定目标产品的产品特征。
步骤2032和2033不分先后顺序。
具体的,可以对评论内容进行分词,并计算目标产品特征相关的关键词,提取关键词特征,基于目标产品属性提取产品属性特征,将关键词特征和产品属性特征构建产品特征。还可以对产品特征进行one-hot编码,作为场景分类模型的另一个输入。
步骤2034,基于目标产品的邻接矩阵及产品特征,采用训练好的场景分类模型,确定各目标产品关联的主题场景。
具体的,在确定了场景分类模型的输入后,可以将上述获得的邻接矩阵和产品特征编码输入到场景分类模型,获得分类结果,根据分类结果确定各目标产品属于哪种主题场景。
相应的,根据各主题场景对应的场景词及各场景词关联的产品,确定各主题场景对应的产品信息,具体包括:
步骤2035,根据各主题场景对应的场景词及各场景词关联的产品,以及各目标产品关联的主题场景,确定各主题场景对应的产品池。
具体的,在根据各主题场景对应的场景词及各场景词关联的产品,将这些产品加入各主题场景对应的产品池,并将各目标产品加入其关联的主题场景对应的产品池。
结合用户评论内容数据和用户历史搜索数据挖掘更多的主题场景,并且基于用户历史点击行为数据和历史订单数据,可以有效扩充各主题场景对应产品池的产品,提高产品覆盖度。
可选地,根据目标产品的用户评论内容及目标产品的产品属性,确定目标产品的产品特征,具体包括:
步骤2041,对目标产品的用户评论内容进行分词处理,获得分词结果。
步骤2042,根据分词结果,采用TF-IDF算法,确定目标产品的关键词特征。
步骤2043,根据目标产品的产品属性,确定目标产品的属性特征。
步骤2044,将关键词特征和属性特征作为目标产品的产品特征。
具体的,可以采用jieba分词对目标产品的用户评论内容进行分词处理,获得分词结果,具体的分词操作为现有技术,可以根据实际需求设置。分词后,可以采用TF-IDF算法计算获得与产品特征相关的关键词特征。并根据目标产品的产品属性,确定目标产品的属性特征。关键词特征结合产品属性特征构建产品特征(即产品特征集合)。比如某产品的产品特征为[超高清,多功能,大尺寸]。
可选地,该方法还可以包括:
步骤2051,对目标产品的产品特征进行one-hot编码处理,获得目标产品对应的产品特征编码。
具体的,采用one-hot编码对目标产品的产品特征进行0、1编码处理。将产品特征中各特征元素分别进行编码,
示例性的,如图6所示,为本实施例提供的one-hot编码的示意图。这里以特征元素“超高清”为例。
相应的,基于目标产品的邻接矩阵及产品特征,采用训练好的场景分类模型,确定各目标产品关联的主题场景,具体包括:
步骤2052,将邻接矩阵及产品特征编码输入到训练好的GCN分类模型,获得各目标产品的分类结果,分类结果包括各目标产品属于不同主题场景的概率。
具体的,GCN分类模型是预先训练获得的,可以抽取部分用户历史点击行为数据及历史订单数据按照上述过程确定训练产品的邻接矩阵,抽取训练产品的用户评论内容数据,及训练产品的属性按照上述步骤构建训练产品特征。利用GCN网络进行场景分类模型训练,分类标签即为上述确定的各主题场景,因此需要对主题场景进行one-hot编码处理。
训练获得场景分类模型后,将目标产品的邻接矩阵和产品特征编码输入到场景分类模型,获得目标产品的分类结果。分类结果包括各目标产品属于不同主题场景的概率。
示例性的,如图7所示,为本实施例提供的场景分类模型的网络结构示意图。该场景分类模型的网络结构包括第一卷积层、RELU激活函数、第二卷积层、softmax函数,输出为目标产品属于各主题场景的概率。其中,对于第一卷积层和第二卷积层可以根据实际需求设置相应的网络参数及层数。
步骤2053,基于各目标产品的分类结果,确定各目标产品关联的主题场景。
在获得各目标产品的分类结果后,则可以根据分类结果确定各目标产品关联的主题场景,即各目标产品属于哪种主题场景。具体来说,对于一个目标产品,可以选择概率最大的主题场景作为与该目标产品关联的主题场景。
示例性的,目标产品1属于主题场景1、主题场景2和主题场景3的概率分别为0.1、0.2、0.7,则确定目标产品1与主题场景3关联,需要将该目标产品加入主题场景3对应的产品池。
可选地,该方法还可以包括:
步骤2061,获取产品属性信息。
步骤2062,基于产品属性信息,确定第三组场景词及各场景词关联的产品。
步骤2063,将第一组场景词、第二组场景词及第三组场景词去重后作为目标场景词。
具体的,对于有些产品,可能在其属性信息中包括一些场景词,可以从其属性信息中提取出相应的场景词,可以称为第三组场景词,并可以基于这些场景词与更多其他产品属性信息匹配,挖掘出更多的关联产品,扩充相应主题场景及对应的产品池。在实际处理过程中,可以将第一组场景词、第二组场景词及第三组场景词去重后作为目标场景词,进行后续的语义相似合并获得各主题场景。后续的其他处理与上一致,在此不再赘述。
可选地,对目标场景词进行语义相似合并,获得至少一个主题场景,具体包括:
步骤2071,采用训练好的word2vector模型构建各目标场景词对应的空间向量。
步骤2072,基于各目标场景词对应的空间向量,采用空间余弦相似度算法确定各目标场景词之间的语义相似度。
步骤2073,基于各目标场景词之间的语义相似度进行语义相似合并,获得至少一个主题场景。
具体的,需要预先训练获得word2vector模型,用于空间向量的构建。word2vector模型的训练过程与现有技术一致,在此不再赘述。在构建了目标场景词对应的空间向量后,则可以采用空间余弦相似度算法来确定各目标场景词之间的语义相似度,语义相似度大于预设阈值的目标场景词可以进行合并。
作为另一种可实施的方式,在上述实施例的基础上,可选地,该方法还可以包括:
步骤2081,对各主题场景进行结构化处理,确定各主题场景所属的上位场景。
步骤2082,基于上位场景及各上位场景包括的主题场景为用户进行产品推荐。
具体的,则获得了个主题场景后,还可以对各主题场景进行结构化处理,为主题场景抽象出更上位的场景。
示例性的,如“美腿”、“美背”、“收腰”等场景词可以抽象出“塑形”的上位场景,即输出结果为“塑形_美腿”、“塑形_美背”、“塑形_收腰”。
可以是预先设定结构化处理规则,将各主题场景根据结构化处理规则进行处理。
作为另一种可实施的方式,在上述实施例的基础上,可选地,在获得各主题场景对应的产品池之后,该方法还包括:
步骤2091,针对每个主题场景对应的产品池,将产品池中的产品按预设规则进行排序,获得排序结果。
步骤2092,根据排序结果,将排名靠前的预设数量的产品作为待推荐产品。
相应的,获取目标主题场景对应的产品池中的产品作为待推荐产品,包括:
步骤1031,获取目标主题场景对应的产品池中的待推荐产品。
具体的,根据上述过程获得的产品池可能包括太多产品,不便都推荐给用户,因此可以按照一定规则进行排序,比如按照销量、好评率、价格等因素中的一种或多种进行排序,获得口碑排序列表,将排名靠前(即口碑较好)的预设数量的产品作为待推荐产品推荐给用户。
可选地,将产品池中的产品按预设规则进行排序,获得排序结果,具体可以包括:
步骤20911,获取产品池中各产品的销量、独立访客量、访问量、好评率、单价中的至少一种因素。
步骤20912,根据各因素的预设权重,确定各产品的得分。
步骤20913,将各产品按得分进行排序,获得排序结果。
具体的,对于各因素可以按照线性加权的方式计算每个产品的得分,按照得分对产品进行排序。得分高可以认为该产品口碑好。
示例性的,以上述5个因素综合考虑为例,产品得分score的计算公式如下:
score=w1(销量)+w2(UV)+w3(PV)+w4(好评率)+w5(单价)
其中,w1-w5分别表示各因素的权重。UV是指独立访客量。PV是指访问量。可以理解地,对于其他数量的因素的情况与此类似,在此不再一一赘述。
需要说明的是,对于各因素,需要对其进行归一化处理,根据归一化值计算得分,以一种产品为例,具体的归一化处理方式如下:
销量1=log10(Sale+1)/log10(maxSale+1.0001)
UV1=log10(UV+1)/log10(maxUV+1.00001)
PV1=log10(PV+1)/log10(maxPV+1.00001)
好评率1=log10(GoodCmtNum+1)/log10(MaxGoodCmtNum+1.00001)
单价1=log10(Price+1)/log10(MaxPrice+1.00001)
其中,销量1表示该产品归一化后的销量值,Sale是该产品的原销量值,maxSale是该产品所在产品池中所有产品的最大销量值。其他因素与此类似,在此不再一一赘述。GoodCmtNum表示该产品的原好评率,Price表示该产品的原单价。
则该产品的得分score为:
score=w1(销量1)+w2(UV1)+w3(PV1)+w4(好评率1)+w5(单价1)
作为另一种可实施的方式,在上述实施例的基础上,可选地,该方法还可以包括:
对目标场景词按照预设的第一规则进行过滤,获得热门场景词作为上述的目标场景词。
具体的,可以是基于各目标场景词关联到的热销产品数量(Xi1)、用户搜索各目标场景词的热度(Xi2)以及用户优质评论内容中各目标场景词的热度(Xi3)进行统计分析,根据这三个统计指标进行加权求和,获得每个目标场景词的得分,根据得分进行排序,从而过滤非热门场景词,保留热门场景词,构建热门场景词表,作为最终的目标场景词。对于热销产品具有相应的热销产品列表,根据各目标场景词关联的产品与热销产品列表进行匹配来确定目标场景词关联到的热销产品数量。用户搜索各目标场景词的热度则可以将各目标场景词与用户历史搜索数据进行匹配来确定。用户优质评论内容中各目标场景词的热度则是将目标场景词与用户优质评论内容进行匹配来确定。
示例性的,以用户搜索各目标场景词的热度为例,假如目标场景词有100个,用户搜索这些目标场景词的总次数为10000次,其中,各目标场景词分别被搜索到次数为Yi,i=1,2,…,100,i表示第i个目标场景词。则用户搜索第i个目标场景词的热度Xi2=Yi/10000*100%。
对于第i个目标场景词,其得分Si=a1*Xi1+a2*Xi2+a3*Xi3
作为一种示例性的实施方式,该方法具体包括以下步骤:
1、从线上抽取产品属性信息,获取产品属性信息中相关的场景词,由于获得的场景词比较杂乱,可以设置一些清洗规则进行清洗和过滤,获得相对干净的场景词表。清洗规则比如剔除一些无效的关键词。
2、基于场景词表中各场景词关联到的热销产品数量、用户搜索各场景词的热度以及用户优质评论内容中各场景词的热度进行统计分析,根据这三个统计指标进行加权求和计算每个场景词的得分,按得分对各场景词进行排序从而过滤非热门场景词,保留热门场景词,构建热门场景词表。
3、由于热门场景词表中不同的场景词可能表达的含义相同,例如:“家居”、“居家”、“居家日常”等场景词,需要进行语义相似合并,因此可以预先训练word2vector模型构建场景词的空间向量,采用空间余弦相似度计算方法进行语义相似的场景词合并,获得一批主题场景及各主题场景对应的场景词库。
示例性的,如图8所示,为本实施例提供的word2vector模型应用过程示意图。
4、将获得的主题场景进行结构化处理,例如:主题场景“美腿”、“美背”、“收腰”等可以抽象出“塑形”的大的场景,即结果输出格式为“塑形_美腿”、“塑形_美背”、“塑形_收腰”等。
5、将各主题场景下的场景词与产品名称、产品属性、产品评论内容进行匹配,构建场景词关联的产品,进而构建各主题场景对应的产品池。但是由于此时的产品池是基于匹配构建的,而基于匹配方式很难挖掘产品的隐含信息,导致产品池中的产品对热销产品的整体覆盖度不够,比如,某个产品的名称和属性中都未包含场景词,但是它的特性可以被划分到某一场景词下进而被划分到某一主题场景下。为了进一步提高热销产品的覆盖度,可以采用GCN图网络算法进行隐藏信息挖掘,将更多的产品划分到正确的主题场景下,加入到相应主题场景对应的产品池中。
6、GCN图网络能够同时对图上的节点特征信息与结构信息进行端到端学习,将特征一层一层抽取,并且GCN适用性极广。基于GCN图网络构建场景分类网络,并进行训练获得场景分类模型。具体训练过程如下:
1)可以抽取一定周期的用户历史点击行为数据和历史订单数据,基于用户点击行为和一个订单包括多个产品的购买行为,构建产品之间的二元组关系,即:<产品1,产品2>,从而生成网络,网络以产品ID为顶点,两个产品同时出现在同一二元组中的关系作为边,最终生成GCN场景分类网络(也称GCN分类网络)的一个输入:邻接矩阵,为了与上述描述区分,可以称为训练邻接矩阵。
2)抽取步骤1)中得到的产品,抽取各产品的用户评论内容,对用户评论内容进行jieba分词处理,并采用TF-IDF计算产品特征相关的关键词,并提取关键词特征,结合各产品的产品属性特征,构建产品的特征集合,并采用one-hot编码对产品特征集合进行0,1编码处理,获得产品特征编码,为了与前述应用过程区分,可以称为训练产品特征编码。
3)基于上述得到的训练邻接矩阵和训练产品特征编码作为训练集,对GCN场景分类网络进行训练,分类标签可以为主题场景,可以理解地,分类标签也可以是各主题场景下的场景标签,具体可以根据实际需求设置,只要保证训练时与后续应用时用的类型一致即可。以分类标签为主题场景为例,需要对主题场景进行one-hot编码处理。
4)场景分类网络输出的是产品属于不同主题场景的概率,最终分类结果取概率最大的标签作为该产品所属的主题场景。将分类结果与实际标签进行对比,采用预设的损失函数来监控训练过程的结束,训练结束后获得GCN场景分类模型(即GCN分类模型)。
7、基于获得的GCN分类模型对更多产品进行分类,将更多产品加入到相应主题场景对应的产品池。
8、对不同主题场景下的产品池中的产品进行口碑榜排序,采用前述的线性加权方式计算每个产品的得分,以此来确定产品口碑排序列表。
9、基于获得的各产品池的产品口碑排序列表为用户提供基于场景的产品搜索服务。
需要说明的是,本实施例中各可实施的方式可以单独实施,也可以在不冲突的情况下以任意组合方式结合实施本发明不做限定。
本实施例提供的产品推荐的处理方法,通过结合用户评论内容数据和用户历史搜索数据挖掘更多的主题场景,并且基于用户历史点击行为数据和历史订单数据,可以有效扩充各主题场景对应产品池的产品,提高产品覆盖度。还通过场景分类模型,对更多产品进行场景分类,进一步提高产品池中热销产品的覆盖度。还可以对产品池中产品进行口碑排序,将排序靠前的一定数量的产品作为待推荐产品推荐给用户,进一步提高推荐准确性,从而提高用户体验。
本发明再一实施例提供一种产品推荐的处理装置,用于执行上述实施例的方法。
如图9所示,为本实施例提供的产品推荐的处理装置的结构示意图。该产品推荐的处理装置30包括接收模块31、确定模块32、获取模块33和推荐模块34。
其中,接收模块,用于接收第一用户的产品搜索请求;确定模块,用于根据产品搜索请求,确定产品搜索请求所包括的第一场景词所属的目标主题场景;获取模块,用于获取目标主题场景对应的产品池中的产品作为待推荐产品,各主题场景对应的产品池是基于用户历史行为数据获得的;推荐模块,用于将待推荐产品推荐给第一用户。
关于本实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
根据本实施例提供的产品推荐的处理装置,根据第一用户的产品搜索请求,确定产品搜索请求所包括的第一场景词所属的目标主题场景,获取目标主题场景对应的产品池中的产品作为待推荐产品,将待推荐产品推荐给用户,由于其各主题场景对应的产品池是基于用户历史行为数据获得的,能够有效获得大量主题场景及其对应的场景词,从而更好更准确地为用户推荐产品,解决现有技术场景词较少,无法准确为用户推荐产品的问题。
本发明又一实施例对上述实施例提供的装置做进一步补充说明。
如图10所示,为本实施例提供的产品推荐的处理装置的结构示意图。
作为一种可实施的方式,在上述实施例的基础上,可选地,该装置还包括,处理模块35。处理模块,用于:
基于用户评论内容数据,确定第一组场景词及各场景词关联的产品;
将第一组场景词作为目标场景词,对目标场景词进行语义相似合并,获得至少一个主题场景,每个主题场景对应至少一个目标场景词;
根据各主题场景对应的目标场景词及各目标场景词关联的产品,确定各主题场景对应的产品池。
可选地,处理模块,还用于:
基于用户历史搜索数据,确定第二组场景词;将第一组场景词和第二组场景词去重后作为目标场景词;
处理模块,还用于:
基于用户历史点击行为数据及历史订单数据,确定涉及的目标产品,并构建目标产品之间的二元组关系;
根据目标产品之间的二元组关系,确定目标产品的邻接矩阵;
根据目标产品的用户评论内容及目标产品的属性,确定目标产品的产品特征;
基于目标产品的邻接矩阵及产品特征,采用训练好的场景分类模型,确定各目标产品关联的主题场景;
处理模块,具体用于:
根据各主题场景对应的场景词及各场景词关联的产品,以及各目标产品关联的主题场景,确定各主题场景对应的产品池。
可选地,处理模块,具体用于:
对目标产品的用户评论内容进行分词处理,获得分词结果;
根据分词结果,采用TF-IDF算法,确定目标产品的关键词特征;
根据目标产品的产品属性,确定目标产品的属性特征;
将关键词特征和属性特征作为目标产品的产品特征。
可选地,处理模块,还用于:
对目标产品的产品特征进行one-hot编码处理,获得目标产品对应的产品特征编码。
可选地,处理模块,具体用于:
将邻接矩阵及产品特征编码输入到训练好的GCN分类模型,获得各目标产品的分类结果,分类结果包括各目标产品属于不同主题场景的概率;
基于各目标产品的分类结果,确定各目标产品关联的主题场景。
可选地,处理模块,具体用于:
获取产品属性信息;
基于产品属性信息,确定第三组场景词及各场景词关联的产品;
将第一组场景词、第二组场景词及第三组场景词去重后作为目标场景词。
可选地,处理模块,具体用于:
采用训练好的word2vector模型构建各目标场景词对应的空间向量;
基于各目标场景词对应的空间向量,采用空间余弦相似度算法确定各目标场景词之间的语义相似度;
基于各目标场景词之间的语义相似度进行语义相似合并,获得至少一个主题场景。
作为另一种可实施的方式,在上述实施例的基础上,可选地,处理模块还用于:
对各主题场景进行结构化处理,确定各主题场景所属的上位场景;
基于上位场景及各上位场景包括的主题场景为用户进行产品推荐。
作为另一种可实施的方式,在上述实施例的基础上,可选地,处理模块,还用于:
针对每个主题场景对应的产品池,将产品池中的产品按预设规则进行排序,获得排序结果;
根据排序结果,将排名靠前的预设数量的产品作为待推荐产品。
可选地,处理模块,具体用于:
获取产品池中各产品的销量、独立访客量、访问量、好评率、单价中的至少一种因素;
根据各因素的预设权重,确定各产品的得分;
将各产品按得分进行排序,获得排序结果。
关于本实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
需要说明的是,本实施例中各可实施的方式可以单独实施,也可以在不冲突的情况下以任意组合方式结合实施本发明不做限定。
根据本实施例的产品推荐的处理装置,通过结合用户评论内容数据和用户历史搜索数据挖掘更多的主题场景,并且基于用户历史点击行为数据和历史订单数据,可以有效扩充各主题场景对应产品池的产品,提高产品覆盖度。还通过场景分类模型,对更多产品进行场景分类,进一步提高产品池中热销产品的覆盖度。还可以对产品池中产品进行口碑排序,将排序靠前的一定数量的产品作为待推荐产品推荐给用户,进一步提高推荐准确性,从而提高用户体验。
本发明再一实施例提供一种电子设备,用于执行上述实施例提供的方法。
如图11所示,为本实施例提供的电子设备的结构示意图。该电子设备50包括:至少一个处理器51和存储器52;
存储器存储计算机执行指令;至少一个处理器执行存储器存储的计算机执行指令,使得至少一个处理器执行如上任一实施例提供的方法。
根据本实施例的电子设备,根据第一用户的产品搜索请求,确定产品搜索请求所包括的第一场景词所属的目标主题场景,获取目标主题场景对应的产品池中的产品作为待推荐产品,将待推荐产品推荐给用户,由于其各主题场景对应的产品池是基于用户历史行为数据获得的,能够有效获得大量主题场景及其对应的场景词,从而更好更准确地为用户推荐产品,解决现有技术场景词较少,无法准确为用户推荐产品的问题。
本发明又一实施例提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机执行指令,当处理器执行计算机执行指令时,实现如上任一实施例提供的方法。
根据本实施例的计算机可读存储介质,根据第一用户的产品搜索请求,确定产品搜索请求所包括的第一场景词所属的目标主题场景,获取目标主题场景对应的产品池中的产品作为待推荐产品,将待推荐产品推荐给用户,由于其各主题场景对应的产品池是基于用户历史行为数据获得的,能够有效获得大量主题场景及其对应的场景词,从而更好更准确地为用户推荐产品,解决现有技术场景词较少,无法准确为用户推荐产品的问题。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本发明旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求书指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求书来限制。

Claims (14)

1.一种产品推荐的处理方法,其特征在于,包括:
接收第一用户的产品搜索请求;
根据所述产品搜索请求,确定所述产品搜索请求所包括的第一场景词所属的目标主题场景;
获取所述目标主题场景对应的产品池中的产品作为待推荐产品,各主题场景对应的产品池是基于用户历史行为数据获得的;
将所述待推荐产品推荐给所述第一用户。
2.根据权利要求1所述的方法,其特征在于,基于用户历史行为数据获得各主题场景对应的产品池,包括:
基于用户评论内容数据,确定第一组场景词及各场景词关联的产品;
将所述第一组场景词作为目标场景词,对所述目标场景词进行语义相似合并,获得至少一个主题场景,每个主题场景对应至少一个目标场景词;
根据各主题场景对应的目标场景词及各目标场景词关联的产品,确定各主题场景对应的产品池。
3.根据权利要求2所述的方法,其特征在于,基于用户历史行为数据获得各主题场景对应的产品池,还包括:
基于用户历史搜索数据,确定第二组场景词;
将所述第一组场景词和所述第二组场景词去重后作为所述目标场景词;
所述方法还包括:
基于用户历史点击行为数据及历史订单数据,确定涉及的目标产品,并构建目标产品之间的二元组关系;
根据所述目标产品之间的二元组关系,确定所述目标产品的邻接矩阵;
根据所述目标产品的用户评论内容及所述目标产品的属性,确定所述目标产品的产品特征;
基于所述目标产品的邻接矩阵及产品特征,采用训练好的场景分类模型,确定各所述目标产品关联的主题场景;
所述根据各主题场景对应的场景词及各场景词关联的产品,确定各主题场景对应的产品信息,包括:
根据各主题场景对应的场景词及各场景词关联的产品,以及各所述目标产品关联的主题场景,确定各主题场景对应的产品池。
4.根据权利要求3所述的方法,其特征在于,所述根据所述目标产品的用户评论内容及所述目标产品的产品属性,确定所述目标产品的产品特征,包括:
对所述目标产品的用户评论内容进行分词处理,获得分词结果;
根据分词结果,采用TF-IDF算法,确定所述目标产品的关键词特征;
根据所述目标产品的产品属性,确定所述目标产品的属性特征;
将所述关键词特征和所述属性特征作为所述目标产品的产品特征。
5.根据权利要求3所述的方法,其特征在于,所述方法还包括:
对所述目标产品的产品特征进行one-hot编码处理,获得所述目标产品对应的产品特征编码。
6.根据权利要求5所述的方法,其特征在于,所述基于所述目标产品的邻接矩阵及产品特征,采用训练好的场景分类模型,确定各所述目标产品关联的主题场景,包括:
将所述邻接矩阵及产品特征编码输入到训练好的GCN分类模型,获得各所述目标产品的分类结果,所述分类结果包括各目标产品属于不同主题场景的概率;
基于各所述目标产品的分类结果,确定各所述目标产品关联的主题场景。
7.根据权利要求3所述的方法,其特征在于,所述方法还包括:
获取产品属性信息;
基于所述产品属性信息,确定第三组场景词及各场景词关联的产品;
将所述第一组场景词、所述第二组场景词及所述第三组场景词去重后作为所述目标场景词。
8.根据权利要求2所述的方法,其特征在于,所述对所述目标场景词进行语义相似合并,获得至少一个主题场景,包括:
采用训练好的word2vector模型构建各所述目标场景词对应的空间向量;
基于各所述目标场景词对应的空间向量,采用空间余弦相似度算法确定各所述目标场景词之间的语义相似度;
基于各所述目标场景词之间的语义相似度进行语义相似合并,获得至少一个主题场景。
9.根据权利要求1所述的方法,其特征在于,所述方法还包括:
对各主题场景进行结构化处理,确定各主题场景所属的上位场景;
基于所述上位场景及各上位场景包括的主题场景为用户进行产品推荐。
10.根据权利要求1-9任一项所述的方法,其特征在于,在获得各主题场景对应的产品池之后,所述方法还包括:
针对每个主题场景对应的产品池,将所述产品池中的产品按预设规则进行排序,获得排序结果;
根据所述排序结果,将排名靠前的预设数量的产品作为待推荐产品。
11.根据权利要求10所述的方法,其特征在于,所述将所述产品池中的产品按预设规则进行排序,获得排序结果,包括:
获取所述产品池中各产品的销量、独立访客量、访问量、好评率、单价中的至少一种因素;
根据各因素的预设权重,确定各产品的得分;
将各产品按得分进行排序,获得所述排序结果。
12.一种产品推荐的处理装置,其特征在于,包括:
接收模块,用于接收第一用户的产品搜索请求;
确定模块,用于根据所述产品搜索请求,确定所述产品搜索请求所包括的第一场景词所属的目标主题场景;
获取模块,用于获取所述目标主题场景对应的产品池中的产品作为待推荐产品,各主题场景对应的产品池是基于用户历史行为数据获得的;
推荐模块,用于将所述待推荐产品推荐给所述第一用户。
13.一种电子设备,其特征在于,包括:至少一个处理器和存储器;
所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如权利要求1-11任一项所述的方法。
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如权利要求1-11任一项所述的方法。
CN202010993838.0A 2020-09-21 2020-09-21 产品推荐的处理方法、装置、设备及存储介质 Pending CN113763084A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010993838.0A CN113763084A (zh) 2020-09-21 2020-09-21 产品推荐的处理方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010993838.0A CN113763084A (zh) 2020-09-21 2020-09-21 产品推荐的处理方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN113763084A true CN113763084A (zh) 2021-12-07

Family

ID=78785844

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010993838.0A Pending CN113763084A (zh) 2020-09-21 2020-09-21 产品推荐的处理方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN113763084A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114969135A (zh) * 2022-05-24 2022-08-30 浪潮卓数大数据产业发展有限公司 一种个性化旅游路线推荐方法、设备及介质

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150101538A (ko) * 2014-02-26 2015-09-04 에스케이플래닛 주식회사 사용자의 실행 패턴을 이용한 상품 추천 시스템, 사용자의 실행 패턴을 이용한 상품 추천 방법 및 이를 위한 장치
CN106021562A (zh) * 2016-05-31 2016-10-12 北京京拍档科技有限公司 用于电商平台的基于主题相关的推荐方法
US20170091846A1 (en) * 2015-09-25 2017-03-30 Universal Entertainment Corporation Information provision system, information provision method, and storage medium
CN106897914A (zh) * 2017-01-25 2017-06-27 浙江大学 一种基于主题模型的商品推荐方法及系统
CN107194769A (zh) * 2017-05-17 2017-09-22 东莞市华睿电子科技有限公司 一种基于用户搜索内容的商品推荐方法
CN107424043A (zh) * 2017-06-15 2017-12-01 北京三快在线科技有限公司 一种产品推荐方法及装置,电子设备
CN107730346A (zh) * 2017-09-25 2018-02-23 北京京东尚科信息技术有限公司 物品聚类的方法和装置
CN107818487A (zh) * 2016-09-12 2018-03-20 阿里巴巴集团控股有限公司 一种产品信息处理方法、装置、设备及客户端
CN108346073A (zh) * 2017-01-23 2018-07-31 北京京东尚科信息技术有限公司 一种语音购物方法和装置
CN108763258A (zh) * 2018-04-03 2018-11-06 平安科技(深圳)有限公司 文档主题参数提取方法、产品推荐方法、设备及存储介质
CN110704640A (zh) * 2019-09-30 2020-01-17 北京邮电大学 一种知识图谱的表示学习方法及装置
CN110766488A (zh) * 2018-07-25 2020-02-07 北京京东尚科信息技术有限公司 一种自动确定主题场景的方法和装置
CN111080400A (zh) * 2019-11-25 2020-04-28 中山大学 一种基于门控图卷积网络的商品推荐方法及系统、存储介质
CN111523010A (zh) * 2019-02-03 2020-08-11 阿里巴巴集团控股有限公司 推荐方法、装置、终端设备及计算机存储介质

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150101538A (ko) * 2014-02-26 2015-09-04 에스케이플래닛 주식회사 사용자의 실행 패턴을 이용한 상품 추천 시스템, 사용자의 실행 패턴을 이용한 상품 추천 방법 및 이를 위한 장치
US20170091846A1 (en) * 2015-09-25 2017-03-30 Universal Entertainment Corporation Information provision system, information provision method, and storage medium
CN106021562A (zh) * 2016-05-31 2016-10-12 北京京拍档科技有限公司 用于电商平台的基于主题相关的推荐方法
CN107818487A (zh) * 2016-09-12 2018-03-20 阿里巴巴集团控股有限公司 一种产品信息处理方法、装置、设备及客户端
CN108346073A (zh) * 2017-01-23 2018-07-31 北京京东尚科信息技术有限公司 一种语音购物方法和装置
CN106897914A (zh) * 2017-01-25 2017-06-27 浙江大学 一种基于主题模型的商品推荐方法及系统
CN107194769A (zh) * 2017-05-17 2017-09-22 东莞市华睿电子科技有限公司 一种基于用户搜索内容的商品推荐方法
CN107424043A (zh) * 2017-06-15 2017-12-01 北京三快在线科技有限公司 一种产品推荐方法及装置,电子设备
CN107730346A (zh) * 2017-09-25 2018-02-23 北京京东尚科信息技术有限公司 物品聚类的方法和装置
CN108763258A (zh) * 2018-04-03 2018-11-06 平安科技(深圳)有限公司 文档主题参数提取方法、产品推荐方法、设备及存储介质
CN110766488A (zh) * 2018-07-25 2020-02-07 北京京东尚科信息技术有限公司 一种自动确定主题场景的方法和装置
CN111523010A (zh) * 2019-02-03 2020-08-11 阿里巴巴集团控股有限公司 推荐方法、装置、终端设备及计算机存储介质
CN110704640A (zh) * 2019-09-30 2020-01-17 北京邮电大学 一种知识图谱的表示学习方法及装置
CN111080400A (zh) * 2019-11-25 2020-04-28 中山大学 一种基于门控图卷积网络的商品推荐方法及系统、存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
XIAOHAN ZHANG, YONG JIANG: "Application of Improved Clustering Algorithm in Commodity Diversity Recommendation", 《2019 IEEE 8TH JOINT INTERNATIONAL INFORMATION TECHNOLOGY AND ARTIFICIAL INTELLIGENCE CONFERENCE (ITAIC 2019)》, 5 August 2019 (2019-08-05), pages 1017 - 1021 *
杨博;赵鹏飞;: "推荐算法综述", 山西大学学报(自然科学版), no. 03, 15 August 2011 (2011-08-15) *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114969135A (zh) * 2022-05-24 2022-08-30 浪潮卓数大数据产业发展有限公司 一种个性化旅游路线推荐方法、设备及介质
CN114969135B (zh) * 2022-05-24 2024-05-28 浪潮卓数大数据产业发展有限公司 一种个性化旅游路线推荐方法、设备及介质

Similar Documents

Publication Publication Date Title
CN108536852B (zh) 问答交互方法和装置、计算机设备及计算机可读存储介质
CN107861972B (zh) 一种用户录入商品信息后显示商品全结果的方法及设备
CN112991017A (zh) 基于用户评论解析的标签体系精准推荐方法
CN111444304A (zh) 搜索排序的方法和装置
CN112559684A (zh) 一种关键词提取及信息检索方法
CN113254711B (zh) 一种互动图像的显示方法、装置、计算机设备和存储介质
CN109325146A (zh) 一种视频推荐方法、装置、存储介质和服务器
CN114238573B (zh) 基于文本对抗样例的信息推送方法及装置
CN111310011A (zh) 一种信息推送方法、装置、电子设备及存储介质
CN112100396A (zh) 一种数据处理方法和装置
CN112182145A (zh) 文本相似度确定方法、装置、设备和存储介质
CN111666757A (zh) 商品评论情感倾向分析方法、装置、设备和可读存储介质
Liu et al. Open intent discovery through unsupervised semantic clustering and dependency parsing
Rani et al. Study and comparision of vectorization techniques used in text classification
Meng et al. Concept-concept association information integration and multi-model collaboration for multimedia semantic concept detection
Wei et al. Online education recommendation model based on user behavior data analysis
CN113821588A (zh) 文本处理方法、装置、电子设备及存储介质
CN113763084A (zh) 产品推荐的处理方法、装置、设备及存储介质
CN114282119B (zh) 一种基于异构信息网络的科技信息资源检索方法及系统
CN115618126A (zh) 搜索处理方法、系统、计算机可读存储介质及计算机设备
CN114255067A (zh) 数据定价方法和装置、电子设备、存储介质
CN111061939B (zh) 基于深度学习的科研学术新闻关键字匹配推荐方法
CN114022233A (zh) 一种新型的商品推荐方法
Hanafi et al. Word Sequential Using Deep LSTM and Matrix Factorization to Handle Rating Sparse Data for E‐Commerce Recommender System
CN113821718A (zh) 一种物品信息推送方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination