CN115618079A - 会话推荐方法、装置、电子设备及存储介质 - Google Patents
会话推荐方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN115618079A CN115618079A CN202211153870.3A CN202211153870A CN115618079A CN 115618079 A CN115618079 A CN 115618079A CN 202211153870 A CN202211153870 A CN 202211153870A CN 115618079 A CN115618079 A CN 115618079A
- Authority
- CN
- China
- Prior art keywords
- conversation
- session
- sequence
- historical
- recommendation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9035—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9038—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Finance (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Accounting & Taxation (AREA)
- General Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Development Economics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及城市计算领域,提供一种会话推荐方法、装置、电子设备及存储介质,方法包括:获取用户的历史会话序列;将历史会话序列输入预先构建的会话推荐模型,得到会话推荐结果;会话推荐模型用于对历史会话序列进行意图解纠缠处理和会话预测,输出会话推荐结果。由于会话推荐过程涉及对历史会话序列的意图解纠缠处理,可以在会话推荐过程中更多的关注用户行为背后的会话意图,从而使会话推荐结果更满足用户的真正兴趣,推荐结果更加准确和可靠,解决了现有的会话推荐方法未考虑用户行为背后的会话意图,使得推荐给用户的结果准确性较低的问题。
Description
技术领域
本发明涉及城市计算技术领域,尤其涉及一种会话推荐方法、装置、电子设备及存储介质。
背景技术
城市计算是一个通过不断获取、整合和分析城市中多种异构大数据来解决城市所面临的挑战(如环境恶化、交通拥堵、能耗增加、规划落后等)的过程,可以帮助人们理解各种城市现象的本质,甚至预测城市的未来。城市计算在社交和娱乐领域应用的过程中,常涉及基于用户的历史会话信息捕获用户的兴趣以为用户提供个性化的推荐服务。
现有的会话推荐方法通常依据用户的会话序列进行建模预测,由于建模过程中更多的关注会话序列的先后顺序,未考虑用户会话行为背后的会话意图,导致推荐过程难以有效的从会话序列中捕获用户的真正兴趣,使得推荐给用户的结果准确性较低。
发明内容
本发明提供一种会话推荐方法、装置、电子设备及存储介质,用以解决现有技术中会话推荐方法未考虑用户会话行为背后的会话意图,导致推荐过程难以有效的从会话序列中捕获用户的真正兴趣,使得推荐给用户的结果准确性较低的缺陷,实现准确、可靠的会话推荐。
第一方面,本发明提供一种会话推荐方法,该方法包括:
获取用户的历史会话序列;
将所述历史会话序列输入预先构建的会话推荐模型,得到会话推荐结果;
其中,所述会话推荐模型用于对所述历史会话序列进行意图解纠缠处理和会话预测,输出会话推荐结果。
根据本发明提供的会话推荐方法,所述将所述历史会话序列输入预先构建的会话推荐模型,得到会话推荐结果,包括:
基于所述历史会话序列,构建第一会话超图;
基于所述第一会话超图,对所述历史会话序列进行意图解纠缠处理,确定所述历史会话序列中每个会话项目在不同会话意图下的表征信息;
基于每个所述会话项目在不同会话意图下的表征信息,分别确定各个候选项目的预测分数;
基于各个所述候选项目的预测分数,确定所述会话推荐结果。
根据本发明提供的会话推荐方法,所述基于所述历史会话序列,构建第一会话超图,包括:
基于所述历史会话序列中各个会话项目,确定超图的节点;
基于所述历史会话序列中所述会话项目的点击时序关系,确定第一超边;
基于所述历史会话序列中相邻的所述会话项目之间的上下文关系,确定第二超边;
基于所述历史会话序列中所述会话项目在不同会话意图下的相似性,确定第三超边;
基于所述节点以及所述第一超边、所述第二超边和所述第三超边,构建得到所述第一会话超图。
根据本发明提供的会话推荐方法,所述基于所述第一会话超图,对所述历史会话序列进行意图解纠缠处理,确定所述历史会话序列中每个会话项目在不同会话意图下的表征信息,包括:
分别将所述历史会话序列中每个会话项目按照不同的会话意图拆分为多个项目块,并确定各个所述项目块的初始表征信息;
基于所述第一会话超图,分别构建每个所述项目块对应的第二会话超图;
基于所述第二会话超图,分别对每个所述项目块的初始表征信息进行更新,得到每个所述会话项目在不同会话意图下的表征信息。
根据本发明提供的会话推荐方法,所述基于所述第一会话超图,分别构建每个所述项目块对应的第二会话超图,包括:
分别确定每个所述项目块在所述第一会话超图中的目标第三超边;其中,所述目标第三超边为所述项目块对应的会话意图下的第三超边;
基于每个所述项目块对应的节点、所述目标第三超边以及所述第一会话超图中所有的所述第一超边和所述第二超边,构建得到每个所述项目块对应的第二会话超图。
根据本发明提供的会话推荐方法,所述基于所述第一会话超图,对所述历史会话序列进行意图解纠缠处理,确定所述历史会话序列中每个会话项目在不同会话意图下的表征信息之后,还包括:
基于所述会话项目在不同会话意图下的表征信息,确定所述会话意图对应的意图类别。
根据本发明提供的会话推荐方法,所述基于每个所述会话项目在不同会话意图下的表征信息,分别确定各个候选项目的预测分数,包括:
基于每个所述会话项目在不同会话意图下的表征信息,分别确定每个所述会话意图对应的会话表示;
基于每个所述会话意图对应的会话表示,分别确定每个所述候选项目在所述会话意图下的预测分数;
分别将每个所述候选项目在各个所述会话意图下的预测分数求和,得到各个所述候选项目的预测分数。
第二方面,本发明还提供一种会话推荐装置,该装置包括:
获取模块,用于获取用户的历史会话序列;
推荐模块,用于将所述历史会话序列输入预先构建的会话推荐模型,得到会话推荐结果;
其中,所述会话推荐模型用于对所述历史会话序列进行意图解纠缠处理和会话预测,输出会话推荐结果。
第三方面,本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述会话推荐方法。
第四方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述会话推荐方法。
本发明提供的会话推荐方法、装置、电子设备及存储介质,通过利用会话推荐模型对用户的历史会话序列进行意图解纠缠处理和会话预测,得到最终的会话推荐结果,由于会话推荐过程涉及对历史会话序列的意图解纠缠处理,可以在会话推荐过程中更多的关注用户会话行为背后的会话意图,从而可以使会话推荐结果更满足用户的真正兴趣,推荐结果更加准确和可靠。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的会话推荐方法的流程示意图;
图2是本发明实施例中会话推荐模型的结构架构示意图;
图3是本发明实施例中第一会话超图的构建原理示意图;
图4是本发明实施例中会话推荐方法的执行原理示意图;
图5是本发明提供的会话推荐装置的结构示意图;
图6是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合图1至图6描述本发明实施例提供的会话推荐方法、装置、电子设备及存储介质。
图1示出了本发明实施例提供的会话推荐方法,该方法包括:
步骤101:获取用户的历史会话序列;
步骤102:将历史会话序列输入预先构建的会话推荐模型,得到会话推荐结果;
其中,会话推荐模型用于对历史会话序列进行意图解纠缠处理和会话预测,输出会话推荐结果。
本实施例中用户的历史会话序列主要指的是用户历史交互过的会话项目的序列,以用户在电商平台购买商品的会话行为为例,历史会话序列可以是用户在电商平台点击过的商品序列s=[vs,1,vs,2,...,vs,n],其中,vs,n表示商品序列s中的第n个商品。
本实施例中会话推荐模型是基于用户会话行为相关的原始数据对超图神经网络进行意图解纠缠训练和会话推荐训练得到的,超图神经网络主要是利用原始数据中各个会话序列内会话项目之间的点击时序关系、上下文关系以及不同会话意图下的相似性,基于超图结构搭建的神经网络。
本实施例中会话项目主要指的是历史会话序列中用户直接交互的对象,比如在商品序列中,会话项目指的是各个商品,在视频序列中,会话项目指的是各个视频。
参见附图2,整个会话推荐模型可以分为关系抽取单元201、超图构建单元202、意图解纠缠单元203和预测推荐单元204,原始数据输入关系抽取单元201后,通过关系抽取单元201获取原始数据中各个会话项目之间的点击时序关系、上下文关系以及不同点击下的意图关系(即不同会话意图下的相似性)。
基于关系抽取单元201抽取的上述关系,超图构建单元202可以获得转移超边(即第一超边)、上下文超边(即第二超边)以及意图超边(即第三超边),进而构建得到第一会话超图。
之后意图解纠缠单元203可以基于第一会话超图构建不同会话意图下的第二会话超图,即图2中示出的多个意图子超图,进而得到各个会话项目在不同会话意图下的表征信息,实现微观层面的意图解纠缠。
此外,本实施例中意图解纠缠单元203还可以通过给定会话序列中会话项目的表征信息预测对应的意图类别,通过意图分类的辅助方式确保不同会话意图下会话项目的表征信息彼此独立且在语义上可分,从而实现宏观层面的意图解纠缠。
最后预测推荐单元204根据不同会话意图下会话项目的表征信息,确定不同会话意图下的会话表示,即不同会话意图下的会话序列特征,基于不同会话意图下的会话表示,计算候选项目的预测分数,进而返回推荐列表,实现会话推荐结果的输出。
在上述实施例的基础上,将历史会话序列输入预先构建的会话推荐模型,得到会话推荐结果,具体可以包括:
基于历史会话序列,构建第一会话超图;
基于第一会话超图,对历史会话序列进行意图解纠缠处理,确定历史会话序列中每个会话项目在不同会话意图下的表征信息;
基于每个会话项目在不同会话意图下的表征信息,分别确定各个候选项目的预测分数;
基于各个候选项目的预测分数,确定会话推荐结果。
本实施例中会话项目在不同会话意图下的表征信息,可以理解为会话项目在不同会话意图下对应特征信息的向量化表示。
由于原始数据在超图神经网络内进行信息传播和聚合的过程中引入了意图接纠缠环节,可以学习到会话项目在不同会话意图下的表征信息,后续基于学习到的会话项目的表征信息生成不同会话意图下的会话表示,并可以预测出当前用户在不同会话意图下对不同候选项目的偏好,即各个候选项目的预测分数,进而输出会话推荐结果。
在示例性实施例中,基于历史会话序列,构建第一会话超图,具体可以包括:
基于历史会话序列中各个会话项目,确定超图的节点;
基于历史会话序列中会话项目的点击时序关系,确定第一超边;
基于历史会话序列中相邻的会话项目之间的上下文关系,确定第二超边;
基于历史会话序列中会话项目在不同会话意图下的相似性,确定第三超边;
基于节点以及第一超边、第二超边和第三超边,构建得到第一会话超图。
在会话推荐过程中,会话项目之间的转换关系是多对多的高阶关系,因为当前的会话项目点击通常受到先前会话项目点击的综合影响。此外,会话项目点击转移的上下文关系和会话项目在特定意图下的相似关系也是高阶的。为了对上述高阶关系进行精确建模,本实施例针对每个会话序列构建一张会话超图,即第一会话超图。如图3所示,本实施例可以从不同角度构建转移超边、上下文超边和意图超边这三种类别的超边,来建模会话序列中的复杂关系。
由于会话序列中用户点击会话项目的先后顺序是十分重要的信息,为了建模会话序列中的会话项目点击时序上的先后关系,本实施例将指向某一会话项目的所有会话项目用一条超边进行连接,从而在建模高阶关系的同时保持了会话项目转移的先后顺序信息。通过上述方式可以构建得到多条转移超边,即第一超边。图3中带圆圈的1、2、3、4表示四个会话项目,图3中示出了基于当前会话序列中多个会话项目之间的点击时序关系,构建得到的第一超边的集合
在会话序列中相邻的几个会话项目往往属于类似的用户兴趣,参见附图3,本实施例通过滑动不同长度的滑窗,将窗口里的会话项目用一条超边进行连接,从而构建得到上下文超边,即第二超边。图3中示例性的示出了滑窗尺寸ω=2以及滑窗尺寸ω=3时,构建得到的第二超边的集合
会话项目在不同的意图表征下会有不同的相似性,为了对不同会话意图下的会话项目的相似性进行建模,本实施例在不同的意图表征下计算会话项目的相似性,并将不同会话意图下相似的会话项目用同一超边进行连接,从而得到意图超边,即第三超边。图3中示出了基于当前会话序列中会话项目在不同会话意图下的相似性,构建得到的第三超边的集合
最后,结合上述三种类型的超边,对每个会话序列完成会话超图(即第一会话超图)的构建,图3示例性的示出了涉及四个节点的第一会话超图,其中节点1和节点2与节点3之间的连线301表示第一超边,节点2和节点4与节点3之间的连线302表示第二超边,节点1与节点3之间的连线303、节点3与节点4之间的连线304以及节点2与节点4之间的连线305分别表示不同会话意图对应的第三超边。
在示例性实施例中,基于第一会话超图,对历史会话序列进行意图解纠缠处理,确定历史会话序列中每个会话项目在不同会话意图下的表征信息,具体可以包括:
分别将历史会话序列中每个会话项目按照不同的会话意图拆分为多个项目块,得到各个项目块的初始表征信息;
基于第一会话超图,分别构建每个项目块对应的第二会话超图;
基于第二会话超图,分别对每个项目块的初始表征信息进行更新,得到每个会话项目在不同会话意图下的表征信息。
在进行意图解纠缠处理之前,需要先对会话项目进行意图感知的嵌入初始化处理,为了充分捕捉不同会话意图下会话项目的初始表征信息,本实施例在不同会话意图下初始化会话项目不同的初始表征信息。具体地,将每个会话项目划分为K个不同的项目块,具体将每个会话项目的初始表征信息划分为K块,每一项目块代表不同的会话意图,具体可以表示为其中,表示会话项目vi对应的第K个会话意图下的初始表征信息,各个初始表征信息的维度为d。显然,第k(k∈[1,K])个项目块表示的是用户的第k种类型的消费意图,因此会话序列中同一会话意图的项目块会处于同一特征空间下。
为了对特定的会话意图进行标准化表示,本实施例提出用该意图空间下所有会话项目的初始表征信息的均值来作为该会话意图的标准化表征,例如对于第k种会话意图,其标准化表征的计算方式如下:
会话序列中一般同时包含噪声信号和用户兴趣,直接从用户的会话序列中获取用户兴趣十分困难,因为用户兴趣是动态多变的。然而在一个会话序列中的用户的会话意图却相对稳定且更容易捕捉到的,因此本实施例通过意图解纠缠处理确定用户的会话意图,从而实现更准确的会话推荐。
本实施例中意图解纠缠处理环节可以仅包括微观层面的意图解纠缠,也可以同时包括微观层面的意图解纠缠和宏观层面的意图解纠缠。微观层面的意图解纠缠主要可以通过不同的意图感知编码器分别捕捉不同的会话意图实现。
在示例性实施例中,基于第一会话超图,分别构建每个项目块对应的第二会话超图,具体可以包括:
分别确定每个项目块在第一会话超图中的目标第三超边;其中,目标第三超边为项目块对应的会话意图下的第三超边;
基于每个项目块对应的节点、目标第三超边以及第一会话超图中所有的第一超边和第二超边,构建得到每个项目块对应的第二会话超图。
为了确保意图感知编码器仅捕获会话意图的一个方面,本实施例提出在具有相应会话意图的项目块对应的意图子超图(即第二会话超图)上执行传播。对于每个会话序列s,其在第k种会话意图下的意图子超图包含所有转换超边和上下文超边,但仅涉及第k种会话意图下的意图超边,即目标第三超边。至于节点特征,只将每个会话项目的第k个项目块的初始表征信息作为意图感知编码器的输入。参见附图4,意图感知编码器内存在三个意图子超图,即意图子超图意图子超图以及意图子超图
如图4所示,本实施例通过高效的超图卷积运算实现针对不同的意图子超图学习不同的会话意图,上述超图卷积运算主要包括两个阶段的信息聚合,分别是节点到超边的信息聚合和超边到节点的信息聚合。
其中,节点到超边的信息聚合过程中,超边连接的部分节点揭示了会话意图,但其他节点可能是噪声。因此,本实施例用注意力机制聚合节点信息,得到特定的会话意图下对应的超边特征,计算过程如下:
超边到节点的信息聚合过程中给定超边特征,可以在第k种会话意图下进一步更新节点的初始表征信息,即:
基于K个意图感知编码器,可以获得会话项目在特定的会话意图下更新后的表征信息,实现微观层面的意图解纠缠。
图4示出了在三种特定的会话意图下通过超图卷积运算对四个会话项目进行分块和微观意图解纠缠的原理,图4中v11、v12以及v13分别为会话项目v1在三种不同会话意图下拆分得到的项目块对应的初始表征信息;v21、v22以及v23分别为会话项目v2在三种不同会话意图下拆分得到的项目块对应的初始表征信息;v31、v32以及v33分别为会话项目v3在三种不同会话意图下拆分得到的项目块对应的初始表征信息;v41、v42以及v43分别为会话项目v4在三种不同会话意图下拆分得到的项目块对应的初始表征信息。
通过超图卷积运算进行信息聚合后可以得到会话项目v1、会话项目v2以及会话项目v3在三种会话意图下更新后的表征信息,即解纠缠后会话项目的表征信息,经过注意力机制聚合后可以得到解纠缠后不同会话意图对应的会话序列的表征信息,即会话表示。
将解纠缠后会话序列的表征信息输入预测推荐单元,并将候选项目的表征信息输入预测推荐单元,可以从预测推荐单元输出各个候选项目的预测分数,图4中涉及m个候选项目,得到的第一个候选项目的预测分数为0.01,第二个候选项目的预测分数为0.03,第三个候选项目的预测分数为0.45,第m个候选项目的预测分数为0.11,从而根据各个候选项目的预测分数,后续可以对候选项目进行排序并生成推荐列表,进而将预测分数较高的候选项目推荐给用户。
在示例性实施例中,基于第一会话超图,对历史会话序列进行意图解纠缠处理,确定历史会话序列中每个会话项目在不同会话意图下的表征信息之后,还可以包括:
基于会话项目在不同会话意图下的表征信息,确定会话意图对应的意图类别。
上述确定意图类别的方案,即意图预测的方案可以理解为宏观层面的意图解纠缠,如图4所示,本实施例在宏观层面通过引入意图分类的辅助任务来确保不同会话意图下的会话项目的表征信息彼此独立且在语义上可分。
具体地,本实施例使用给定的会话序列中会话项目在特定的会话意图下的表征信息(即微观层面的意图解纠缠后更新的会话项目的表征信息)来预测意图类别,具体计算过程如下:
图4中示出了宏观层面的意图解纠缠的环节,即意图预测环节,其中P表示各类会话意图的预测概率,P1表示第一种会话意图的预测概率,P2表示第二种会话意图的预测概率,P3表示第三种会话意图的预测概率。
本实施例中意图分类任务的损失函数可以表述为:
在示例性实施例中,基于每个会话项目在不同会话意图下的表征信息,分别确定各个候选项目的预测分数,具体可以包括:
基于每个会话项目在不同会话意图下的表征信息,分别确定每个会话意图对应的会话表示;
基于每个会话意图对应的会话表示,分别确定每个候选项目在当前会话意图下的预测分数;
分别将每个候选项目在各个会话意图下的预测分数求和,得到各个候选项目的预测分数。
本实施例首先使用软注意机制计算每个会话意图下的项目权重,计算过程如下:
其中,pn-i+1表示会话项目vs,i的反向位置嵌入,表示更新后第k种会话意图下会话项目vs,i的表征信息,表示加入反向位置嵌入后会话项目vs,i的表征信息,表示将会话项目vs,i以及会话项目vs,n结合起来做线性变换后的表征信息,表示第k种会话意图下的会话项目vs,i的项目权重,以及均为线性变换过程中的矩阵,bk和qk表示线性变换过程的已知参量,σ表示集合函数,⊙表示两个向量对应维度的乘积,本实施例中提到的表征信息和初始表征信息均可以通过向量的形式呈现。
最后,计算会话序列s对候选项目vi在每种会话意图下的预测分数,并将所有会话意图对应的预测分数结合起来,得到最终的预测分数,即:
基于各个候选项目的预测分数,本实施例可以根据预测分数较高的部分候选项目生成候选项目列表,即会话推荐结果,将候选项目列表推荐给用户。
需要说明的是,在具有微观层面的意图解纠缠处理能力和宏观层面的意图解纠缠处理能力的会话推荐模型中,宏观层面的意图解纠缠环节,即意图预测环节为辅助任务,会话预测任务为主任务。为了优化会话推荐模型,本实施例通过正负样本利用成对学习的方式进行会话推荐模型的训练,会话推荐模型中会话推荐任务的损失函数采用交叉熵函数,具体定义如下:
最后,本实施例将会话推荐任务与意图分类辅助任务统一起来,将总损失函数定义为:
在会话推荐模型的训练过程中,还需要设置模型超参数,本实施例中模型超参数具体可以包括负采样数sample_number、批次大小mini_batch_size、嵌入大小embedding_size、学习率learning_rate、L2正则项L2_normalization、滑窗数W以及会话意图数K等参数。在对会话推荐模型进行训练的过程中,超图神经网络中各层的权重及偏置值都可以在反向传播的过程中通过随机梯度下降法(Stochastic Gradient Descent,SGD)进行更新。
训练好的会话推荐模型可以应用于信息检索与数据挖掘领域内多种存在会话推荐需求的场景中,比如可以是外卖推荐场景、电商推荐场景或者视频推荐场景,当然,其他涉及会话推荐的平台也同样适用。
下面通过多个实施例详细说明本发明提供的会话推荐方法在不同应用场景中的具体实现流程。
实施例1
本实施例针对的应用场景为外卖推荐场景,在外卖平台上,用户的会话行为呈现高度周期性,为本发明提供的会话推荐方法的实施提供了便利条件,针对外卖推荐场景的会话推荐方法,实现流程如下:
首先,外卖平台可以通过固定终端网页或者移动终端APP收集用户的历史外卖订单信息,基于历史外卖订单信息构建历史会话序列;
之后,将上述历史会话序列输入预先构建和训练好的会话推荐模型,通过会话推荐模型对历史会话序列进行意图解纠缠处理和会话预测,输出会话推荐结果。
具体地,本实施例中通过会话推荐模型对输入的历史会话序列进行处理,并输出会话推荐结果的过程,具体如下:
第一步:基于历史会话序列中各个外卖订单、各外卖订单之间的点击时序关系、上下文关系以及外卖订单在不同外卖消费意图下的相似性,构建得到第一会话超图;
第二步:分别将历史会话序列中每个外卖订单按照不同的外卖消费意图拆分为多个外卖订单块,并确定各个外卖订单块的初始表征信息;
第三步:基于第一会话超图,分别构建每个外卖订单块对应的第二会话超图;
第四步:基于第二会话超图,分别对每个外卖订单块的初始表征信息进行更新,得到每个外卖订单在不同外卖消费意图下的表征信息;
第五步:基于每个外卖订单在不同外卖消费意图下的表征信息,分别确定每个外卖消费意图对应的会话表示;
第六步:基于每个外卖消费意图对应的会话表示,分别确定每个候选外卖菜品在当前外卖消费意图下的预测分数;
第七步:分别将每个候选外卖菜品在各个外卖消费意图下的预测分数求和,得到各个候选外卖菜品的预测分数。
在得到所有候选外卖菜品的预测分数后,可以对候选外卖菜品按照预测分数进行排序,比如可以按照预测分数由高至低进行排序,将排序靠前的几个候选外卖菜品作为用户可能感兴趣的菜品。
之后,外卖平台可以根据不同菜品所在的线下门店位置和用户当前的位置确定用户可能感兴趣的菜品对应的最优门店,从而得到外卖消费会话的推荐结果,将上述推荐结果推送给用户,从而完成外卖菜品的推荐功能。
在实际应用过程中,外卖平台还可以统筹所有用户在当前时刻的偏好菜品,对骑士的配送调度进行优化,比如可以根据偏好菜品对应的门店位置以及用户当前位置,规划合理的配送路线,从而实现高效的配送。
实施例2
本实施例针对的应用场景为商品推荐场景,由于电商平台上的用户的消费行为也呈现一定周期性,为本发明提供的会话推荐方法的实施提供了便利条件,针对商品推荐场景的会话推荐方法,实现流程如下:
首先,电商平台可以通过固定终端网页或者移动终端APP收集用户的历史点击过的商品信息,基于历史点击过的商品信息构建历史会话序列;
之后,将上述历史会话序列输入预先构建和训练好的会话推荐模型,通过会话推荐模型对历史会话序列进行意图解纠缠处理和会话预测,输出会话推荐结果。
具体地,本实施例中通过会话推荐模型对输入的历史会话序列进行处理,并输出会话推荐结果的过程,具体如下:
第一步:基于历史会话序列中各个商品、各商品之间的点击时序关系、上下文关系以及商品在不同商品消费意图下的相似性,构建得到第一会话超图;
第二步:分别将历史会话序列中每个商品按照不同的商品消费意图拆分为多个商品块,并确定各个商品块的初始表征信息;
第三步:基于第一会话超图,分别构建每个商品块对应的第二会话超图;
第四步:基于第二会话超图,分别对每个商品块的初始表征信息进行更新,得到每个商品在不同商品消费意图下的表征信息;
第五步:基于每个商品在不同商品消费意图下的表征信息,分别确定每个商品消费意图对应的会话表示;
第六步:基于每个商品消费意图对应的会话表示,分别确定每个候选商品在当前商品消费意图下的预测分数;
第七步:分别将每个候选商品在各个商品消费意图下的预测分数求和,得到各个候选商品的预测分数。
在本实施例中,给定用户的历史会话序列,需要预测的是用户在电商平台可能会感兴趣的商品,从而为用户提供个性化的商品推荐服务,同时还可以提高电商平台中商家的收益。
在得到电商平台上用户对所有曝光的候选商品的预测分数后,可以按照预测分数对候选商品进行排序,提取预测分数较高的候选商品,并根据提取出的候选商品生成用户可能感兴趣的商品列表。电商平台可以个性化地将上述商品列表展示在最明显的位置上,吸引用户点击和购买候选商品,实现用户留存和增加商家及平台收益的目的。
实施例3
本实施例针对的应用场景为短视频推荐场景,针对短视频推荐场景的会话推荐方法,实现流程如下:
首先,短视频平台可以通过固定终端网页或者移动终端APP收集用户的历史观看过的短视频信息,基于历史观看过的短视频信息构建历史会话序列;
之后,将上述历史会话序列输入预先构建和训练好的会话推荐模型,通过会话推荐模型对历史会话序列进行意图解纠缠处理和会话预测,输出会话推荐结果。
具体地,本实施例中通过会话推荐模型对输入的历史会话序列进行处理,并输出会话推荐结果的过程,具体如下:
第一步:基于历史会话序列中各个短视频、各短视频之间的点击时序关系、上下文关系以及短视频在不同视频观看意图下的相似性,构建得到第一会话超图;
第二步:分别将历史会话序列中每个短视频按照不同的视频观看意图拆分为多个视频块,并确定各个视频块的初始表征信息;
第三步:基于第一会话超图,分别构建每个视频块对应的第二会话超图;
第四步:基于第二会话超图,分别对每个视频块的初始表征信息进行更新,得到每个短视频在不同视频观看意图下的表征信息;
第五步:基于每个短视频在不同视频观看意图下的表征信息,分别确定每个视频观看意图对应的会话表示;
第六步:基于每个视频观看意图对应的会话表示,分别确定每个候选短视频在当前视频观看意图下的预测分数;
第七步:分别将每个候选短视频在各个视频观看意图下的预测分数求和,得到各个候选短视频的预测分数。
在本实施例中,给定用户历史观看过的短视频信息,即历史会话序列,需要预测的是用户下一时刻可能会感兴趣的短视频,从而实现帮助用户发现潜在兴趣,提升用户视频观看体验的效果,进而增加短视频平台上用户留存和转化率。
在实际应用过程中,短视频平台在得到用户对所有曝光的候选短视频的预测分数后,可以按照预测分数进行排序,比如按照预测分数由高到低排序,依据排序比较靠前的几个短视频生成用户可能感兴趣的短视频清单。之后,短视频平台可以将该短视频清单投放到用户浏览的主页上显著位置或者加入到用户浏览过程中的单列或双列推荐视频栏中。
短视频平台通过对用户感兴趣的短视频进行预测和推荐,可以帮助用户发现自己的兴趣,提高短视频平台的视频观看量。
下面对本发明提供的会话推荐装置进行描述,下文描述的会话推荐装置与上文描述的会话推荐方法可相互对应参照。
图5示出了本发明实施例提供的会话推荐装置,该装置包括:
获取模块501,用于获取用户的历史会话序列;
推荐模块502,用于将历史会话序列输入预先构建的会话推荐模型,得到会话推荐结果;
其中,会话推荐模型用于对历史会话序列进行意图解纠缠处理和会话预测,输出会话推荐结果。
在示例性实施例中,上述推荐模块502具体可以用于:
基于历史会话序列,构建第一会话超图;
基于第一会话超图,对历史会话序列进行意图解纠缠处理,确定历史会话序列中每个会话项目在不同会话意图下的表征信息;
基于每个会话项目在不同会话意图下的表征信息,分别确定各个候选项目的预测分数;
基于各个候选项目的预测分数,确定会话推荐结果。
在示例性实施例中,上述推荐模块502具体可以通过如下方式实现基于历史会话序列,构建第一会话超图:
基于历史会话序列中各个会话项目,确定超图的节点;
基于历史会话序列中会话项目的点击时序关系,确定第一超边;
基于历史会话序列中相邻的会话项目之间的上下文关系,确定第二超边;
基于历史会话序列中会话项目在不同会话意图下的相似性,确定第三超边;
基于节点以及第一超边、第二超边和第三超边,构建得到第一会话超图。
在示例性实施例中,上述推荐模块502具体可以通过如下方式实现基于第一会话超图,对历史会话序列进行意图解纠缠处理,确定历史会话序列中每个会话项目在不同会话意图下的表征信息:
分别将历史会话序列中每个会话项目按照不同的会话意图拆分为多个项目块,并确定各个项目块的初始表征信息;
基于第一会话超图,分别构建每个项目块对应的第二会话超图;
基于第二会话超图,分别对每个项目块的初始表征信息进行更新,得到每个会话项目在不同会话意图下的表征信息。
在示例性实施例中,上述推荐模块502具体可以通过如下方式实现基于第一会话超图,分别构建每个项目块对应的第二会话超图,包括:
分别确定每个项目块在第一会话超图中的目标第三超边;其中,目标第三超边为项目块对应的会话意图下的第三超边;
基于每个项目块对应的节点、目标第三超边以及第一会话超图中所有的第一超边和第二超边,构建得到每个项目块对应的第二会话超图。
在示例性实施例中,上述推荐模块502还可以用于:
基于会话项目在不同会话意图下的表征信息,确定会话意图对应的意图类别。
在示例性实施例中,上述推荐模块502具体可以通过如下方式实现基于每个会话项目在不同会话意图下的表征信息,分别确定各个候选项目的预测分数:
基于每个会话项目在不同会话意图下的表征信息,分别确定每个会话意图对应的会话表示;
基于每个会话意图对应的会话表示,分别确定每个候选项目在会话意图下的预测分数;
分别将每个候选项目在各个会话意图下的预测分数求和,得到各个候选项目的预测分数。
本发明实施例提供的会话推荐装置,可以通过推荐模块利用会话推荐模型对用户的历史会话序列进行意图解纠缠处理和会话预测,得到最终的会话推荐结果,由于会话推荐过程涉及对历史会话序列的意图解纠缠处理,可以在会话推荐过程中更多的关注用户会话行为背后的会话意图,从而可以使会话推荐结果更满足用户的真正兴趣,推荐结果更加准确和可靠。
图6示例了一种电子设备的实体结构示意图,如图6所示,该电子设备可以包括:处理器(processor)601、通信接口(Communications Interface)602、存储器(memory)603和通信总线604,其中,处理器601,通信接口602,存储器603通过通信总线604完成相互间的通信。处理器601可以调用存储器603中的逻辑指令,以执行会话推荐方法,该方法包括:获取用户的历史会话序列;将历史会话序列输入预先构建的会话推荐模型,得到会话推荐结果;其中,会话推荐模型用于对历史会话序列进行意图解纠缠处理和会话预测,输出会话推荐结果。
此外,上述的存储器603中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各实施例所提供的会话推荐方法,该方法包括:获取用户的历史会话序列;将历史会话序列输入预先构建的会话推荐模型,得到会话推荐结果;其中,会话推荐模型用于对历史会话序列进行意图解纠缠处理和会话预测,输出会话推荐结果。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时以实现上述各实施例提供的会话推荐方法,该方法包括:获取用户的历史会话序列;将历史会话序列输入预先构建的会话推荐模型,得到会话推荐结果;其中,会话推荐模型用于对历史会话序列进行意图解纠缠处理和会话预测,输出会话推荐结果。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种会话推荐方法,其特征在于,包括:
获取用户的历史会话序列;
将所述历史会话序列输入预先构建的会话推荐模型,得到会话推荐结果;
其中,所述会话推荐模型用于对所述历史会话序列进行意图解纠缠处理和会话预测,输出会话推荐结果。
2.根据权利要求1所述的会话推荐方法,其特征在于,所述将所述历史会话序列输入预先构建的会话推荐模型,得到会话推荐结果,包括:
基于所述历史会话序列,构建第一会话超图;
基于所述第一会话超图,对所述历史会话序列进行意图解纠缠处理,确定所述历史会话序列中每个会话项目在不同会话意图下的表征信息;
基于每个所述会话项目在不同会话意图下的表征信息,分别确定各个候选项目的预测分数;
基于各个所述候选项目的预测分数,确定所述会话推荐结果。
3.根据权利要求2所述的会话推荐方法,其特征在于,所述基于所述历史会话序列,构建第一会话超图,包括:
基于所述历史会话序列中各个会话项目,确定超图的节点;
基于所述历史会话序列中所述会话项目的点击时序关系,确定第一超边;
基于所述历史会话序列中相邻的所述会话项目之间的上下文关系,确定第二超边;
基于所述历史会话序列中所述会话项目在不同会话意图下的相似性,确定第三超边;
基于所述节点以及所述第一超边、所述第二超边和所述第三超边,构建得到所述第一会话超图。
4.根据权利要求3所述的会话推荐方法,其特征在于,所述基于所述第一会话超图,对所述历史会话序列进行意图解纠缠处理,确定所述历史会话序列中每个会话项目在不同会话意图下的表征信息,包括:
分别将所述历史会话序列中每个会话项目按照不同的会话意图拆分为多个项目块,并确定各个所述项目块的初始表征信息;
基于所述第一会话超图,分别构建每个所述项目块对应的第二会话超图;
基于所述第二会话超图,分别对每个所述项目块的初始表征信息进行更新,得到每个所述会话项目在不同会话意图下的表征信息。
5.根据权利要求4所述的会话推荐方法,其特征在于,所述基于所述第一会话超图,分别构建每个所述项目块对应的第二会话超图,包括:
分别确定每个所述项目块在所述第一会话超图中的目标第三超边;其中,所述目标第三超边为所述项目块对应的会话意图下的第三超边;
基于每个所述项目块对应的节点、所述目标第三超边以及所述第一会话超图中所有的所述第一超边和所述第二超边,构建得到每个所述项目块对应的第二会话超图。
6.根据权利要求2至5任一项所述的会话推荐方法,其特征在于,所述基于所述第一会话超图,对所述历史会话序列进行意图解纠缠处理,确定所述历史会话序列中每个会话项目在不同会话意图下的表征信息之后,还包括:
基于所述会话项目在不同会话意图下的表征信息,确定所述会话意图对应的意图类别。
7.根据权利要求2所述的会话推荐方法,其特征在于,所述基于每个所述会话项目在不同会话意图下的表征信息,分别确定各个候选项目的预测分数,包括:
基于每个所述会话项目在不同会话意图下的表征信息,分别确定每个所述会话意图对应的会话表示;
基于每个所述会话意图对应的会话表示,分别确定每个所述候选项目在所述会话意图下的预测分数;
分别将每个所述候选项目在各个所述会话意图下的预测分数求和,得到各个所述候选项目的预测分数。
8.一种会话推荐装置,其特征在于,包括:
获取模块,用于获取用户的历史会话序列;
推荐模块,用于将所述历史会话序列输入预先构建的会话推荐模型,得到会话推荐结果;
其中,所述会话推荐模型用于对所述历史会话序列进行意图解纠缠处理和会话预测,输出会话推荐结果。
9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述会话推荐方法。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述会话推荐方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211153870.3A CN115618079A (zh) | 2022-09-21 | 2022-09-21 | 会话推荐方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211153870.3A CN115618079A (zh) | 2022-09-21 | 2022-09-21 | 会话推荐方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115618079A true CN115618079A (zh) | 2023-01-17 |
Family
ID=84859051
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211153870.3A Pending CN115618079A (zh) | 2022-09-21 | 2022-09-21 | 会话推荐方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115618079A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116805152A (zh) * | 2023-08-09 | 2023-09-26 | 数据空间研究院 | 基于图解纠缠的上下文感知事件预测方法、装置及介质 |
-
2022
- 2022-09-21 CN CN202211153870.3A patent/CN115618079A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116805152A (zh) * | 2023-08-09 | 2023-09-26 | 数据空间研究院 | 基于图解纠缠的上下文感知事件预测方法、装置及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Pan et al. | Study on convolutional neural network and its application in data mining and sales forecasting for E-commerce | |
US11521221B2 (en) | Predictive modeling with entity representations computed from neural network models simultaneously trained on multiple tasks | |
CN110717098B (zh) | 基于元路径的上下文感知用户建模方法、序列推荐方法 | |
CN111797321B (zh) | 一种面向不同场景的个性化知识推荐方法及系统 | |
WO2021139415A1 (zh) | 数据处理方法、装置、计算机可读存储介质及电子设备 | |
EP4242955A1 (en) | User profile-based object recommendation method and device | |
CN114036398B (zh) | 内容推荐和排序模型训练方法、装置、设备以及存储介质 | |
CN112288554B (zh) | 商品推荐方法和装置、存储介质及电子装置 | |
CN107368499B (zh) | 一种客户标签建模及推荐方法及装置 | |
CN111159242B (zh) | 一种基于边缘计算的客户端重排序方法及系统 | |
Hassan et al. | Performance analysis of neural networks-based multi-criteria recommender systems | |
CN115618079A (zh) | 会话推荐方法、装置、电子设备及存储介质 | |
CN113592593A (zh) | 序列推荐模型的训练及应用方法、装置、设备及存储介质 | |
CN116340643B (zh) | 对象推荐的调整方法及装置、存储介质、电子设备 | |
CN114817692A (zh) | 确定推荐对象的方法、装置和设备及计算机存储介质 | |
CN114169418B (zh) | 标签推荐模型训练方法及装置、标签获取方法及装置 | |
CN113256024B (zh) | 一种融合群体行为的用户行为预测方法 | |
CN115481325A (zh) | 基于用户全局兴趣迁移感知的个性化新闻推荐方法及系统 | |
CN115456708A (zh) | 推荐模型的训练方法、装置、电子设备和存储介质 | |
CN113469752A (zh) | 内容推荐方法、装置、存储介质及电子设备 | |
You et al. | A hotel ranking model through online reviews with aspect-based sentiment analysis | |
CN113792163B (zh) | 多媒体推荐方法、装置、电子设备及存储介质 | |
CN115640461A (zh) | 一种产品的推荐方法、装置、电子设备及其存储介质 | |
CN114117229A (zh) | 一种基于有向和无向结构信息的图神经网络的项目推荐方法 | |
CN113971587A (zh) | 一种物品选取方法、装置、终端设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |