CN117556139A - 平台内容推荐方法、装置、电子设备及存储介质 - Google Patents

平台内容推荐方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN117556139A
CN117556139A CN202311509621.8A CN202311509621A CN117556139A CN 117556139 A CN117556139 A CN 117556139A CN 202311509621 A CN202311509621 A CN 202311509621A CN 117556139 A CN117556139 A CN 117556139A
Authority
CN
China
Prior art keywords
content
session
vector
platform
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311509621.8A
Other languages
English (en)
Inventor
汪自力
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiaohongshu Technology Co ltd
Original Assignee
Xiaohongshu Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiaohongshu Technology Co ltd filed Critical Xiaohongshu Technology Co ltd
Priority to CN202311509621.8A priority Critical patent/CN117556139A/zh
Publication of CN117556139A publication Critical patent/CN117556139A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/258Heading extraction; Automatic titling; Numbering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供一种平台内容推荐方法、装置、电子设备及存储介质,通过获取处于新增状态的多个候选平台内容的内容特征向量;获取目标用户在目标群聊会话中的第一历史会话信息;基于第一历史会话信息,获取目标用户的用户兴趣特征向量;基于目标群聊会话中的第二历史会话信息,提取目标群聊会话的至少一个会话主题向量;对目标群聊会话中的第二历史会话信息进行会话信息编码,得到会话内容向量;计算每一个候选平台内容的内容特征向量与会话内容向量、会话主题向量和用户兴趣特征向量的相似度得分;基于相似度得分确定为目标用户确定推荐的目标平台内容。结合聊天信息进行针对性推荐,保证平台内容推荐合理性,增强激发用户的发布新笔记的兴趣。

Description

平台内容推荐方法、装置、电子设备及存储介质
技术领域
本申请涉及互联网技术领域,具体涉及一种平台内容推荐方法、装置、电子设备及存储介质。
背景技术
随着网络信息技术的发展,越来越多的用户通过发表内容,浏览内容、网络群聊等方式实现网络资源的共享,内容包括文本、视频、音频或者文本、视频和/或音频的结合内容。随着用户的增多,很多内容被发表在平台,相关技术中,在用户发表平台内容后,一般将平台内容加入到平台内容数据库中,并基于用户终端浏览笔记过程中的点击浏览信息进行,进一步从平台内容数据库中推荐内容至用户终端实现内容推荐,推荐内容不准确。
发明内容
本申请提供一种平台内容推荐方法、装置、电子设备及存储介质,旨在解决现有技术中推荐内容不准确的问题,提升用户新发的平台内容曝光率,提升推荐内容的准确性。
第一方面,本申请提供一种平台内容推荐方法,包括:
获取处于新增状态的多个候选平台内容的内容特征向量,所述内容特征向量的维度包括:内容主题、内容关键信息、内容类目类别中的至少一种;
获取目标用户在目标群聊会话中的第一历史会话信息;
基于所述第一历史会话信息,获取所述目标用户的用户兴趣特征向量;
基于所述目标群聊会话中的第二历史会话信息,提取所述目标群聊会话的至少一个会话主题向量;
对所述目标群聊会话中的第二历史会话信息进行会话信息编码,得到会话内容向量;
计算每一个候选平台内容的内容特征向量与所述会话内容向量、会话主题向量和所述用户兴趣特征向量的相似度得分;
基于所述相似度得分确定为所述目标用户确定推荐的目标平台内容。
在本申请一种可能的实现方式中,所述基于所述目标群聊会话中的第二历史会话信息,提取所述目标群聊会话的至少一个会话主题向量,包括:
根据所述目标群聊会话中的各第二历史会话信息的时间间隔和预设会话间隔时长,将所述第二历史会话信息划分为多个会话集;
根据所述会话集中各所述第二历史会话信息的语义信息,确定各所述会话集的会话主题;
对各会话主题进行编码,得到对应的会话主题向量。
在本申请一种可能的实现方式中,所述计算每一个候选平台内容的内容特征向量与所述会话内容向量、会话主题向量和所述用户兴趣特征向量的相似度得分,包括:
将所述候选平台内容的内容特征向量、所述会话内容向量、会话主题向量和所述用户兴趣特征向量输入高斯核网络,其中,所述会话主题向量的数量为至少一个,所述用户兴趣特征向量的数量为至少一个;
通过高斯核网络对候选平台内容的内容特征向量与所述会话内容向量、以及会话主题向量和所述用户兴趣特征向量的所有组合进行相似度得分计算,得到每个所述组合的相似度得分。
在本申请一种可能的实现方式中,基于所述相似度得分确定为所述目标用户确定推荐的目标平台内容后,还包括:
确定所述目标平台内容对应的组合中的内容特征向量、用户兴趣特征向量、会话内容向量和会话主题向量;
基于所述用户兴趣特征向量、会话主题向量、会话内容向量和所述内容特征向量,生成针对所述目标用户的对所述目标平台内容的推荐信息;
基于推荐信息和所述目标平台内容在所述目标用户对应的显示界面进行推荐。
在本申请一种可能的实现方式中,基于推荐信息和所述目标平台内容在所述目标用户对应的显示界面进行推荐,包括:
根据所述推荐信息和所述目标平台内容,生成推荐消息;
通过虚拟角色在目标群聊会话中针对所述目标用户发送所述推荐消息,或者,在所述目标用户的平台内容推荐页面中的内容更新区域显示所述推荐消息。
在本申请一种可能的实现方式中,所述内容特征向量包括候选平台内容在内容主题维度和内容关键信息维度下的内容特征向量;
所述获取处于新增状态的多个候选平台内容的内容特征向量,包括:
确定处于新增状态的多个候选平台内容,针对各所述候选平台内容进行编码,得到编码向量;
对所述编码向量进行聚类处理,得到向量类别,以及各所述向量类别对应的候选平台内容;
对每一个所述向量类别下的候选平台内容进行关键字提取;
对候选平台内容的关键字进行特征提取,得到候选平台内容在关键字维度下的内容特征向量;
统计每一向量类别下各关键字的数量,根据所述关键字的数量确定每一所述向量类别对应的主题关键字;
基于所述主题关键字提取各向量类别下的主题关键字向量,作为候选平台内容在主题维度下的内容特征向量。
在本申请一种可能的实现方式中,内容特征向量还包括内容类目类别维度下的内容特征向量,所述确定处于新增状态的多个候选平台内容后,还包括:
将候选平台内容输入预设的大语言模型,所述大语言模型基于带类目类别标签的内容样本训练得到;
通过所述大语言模型对所述候选平台内容进行分类处理,得到所述候选平台内容的内容类目类别;
对所述内容类目类别进行编码处理,得到内容类目类别维度下的内容特征向量。
第二方面,本申请提供一种平台内容推荐装置,所述平台内容推荐装置包括:
第一获取模块,用于获取处于新增状态的多个候选平台内容的内容特征向量,所述内容特征向量的维度包括:内容主题、内容关键信息、内容类目类别中的至少一种;
第二获取模块,用于获取目标用户在目标群聊会话中的第一历史会话信息;
第一会话处理模块,用于基于所述第一历史会话信息,获取所述目标用户的用户兴趣特征向量;
第二会话处理模块,用于基于所述目标群聊会话中的第二历史会话信息,提取所述目标群聊会话的至少一个会话主题向量;
第三会话处理模块,用于对所述目标群聊会话中的第二历史会话信息进行会话信息编码,得到会话内容向量;
相似度处理模块,用于计算每一个候选平台内容的内容特征向量与所述会话内容向量、会话主题向量和所述用户兴趣特征向量的相似度得分;
推荐模块,用于基于所述相似度得分确定为所述目标用户确定推荐的目标平台内容。
第三方面,本申请提供一种电子设备,所述电子包括:
一个或多个处理器;
存储器;以及
一个或多个应用程序,其中所述一个或多个应用程序被存储于所述存储器中,并配置为由所述处理器执行以实现任一项所述的平台内容推荐方法中的步骤。
第四方面,本申请提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器进行加载,以执行任一项所述的中的步骤。
本申请提供平台内容推荐方法、装置、电子设备及存储介质,通过获取处于新增状态的多个候选平台内容的内容特征向量,所述内容特征向量的维度包括:内容主题、内容关键信息、内容类目类别中的至少一种;获取目标用户在目标群聊会话中的第一历史会话信息;基于所述第一历史会话信息,获取所述目标用户的用户兴趣特征向量;基于所述目标群聊会话中的第二历史会话信息,提取所述目标群聊会话的至少一个会话主题向量;对所述目标群聊会话中的第二历史会话信息进行会话信息编码,得到会话内容向量;计算每一个候选平台内容的内容特征向量与所述会话内容向量、会话主题向量和所述用户兴趣特征向量的相似度得分;基于所述相似度得分确定为所述目标用户确定推荐的目标平台内容。本方案中根据目标用户在目标群聊会话中的第一历史会话信息分析目标用户的用户兴趣特征向量,以及根据目标群聊会话中对应的会话主体向量,以及对应目标用户的会话内容向量,结合属于新增状态的内容特征向量,进行多维度分析,进而确定每一个候选平台内容的内容特征向量与所述会话内容向量、会话主题向量和所述用户兴趣特征向量的相似度得分,根据相似度得分确定与所述会话内容向量、会话主题向量和所述用户兴趣特征向量最相似的目标平台内容,并将所述目标平台内容对应所述目标用户进行推荐,增加新笔记的曝光度,同时结合用户聊天信息对目标用户进行针对性推荐,保证平台内容推荐合理性,增强激发用户的发布新笔记的兴趣。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的平台内容推荐方法的场景示意图;
图2是本申请实施例中提供的平台内容推荐方法的一个实施例流程示意图;
图3为本申请实施例提供的平台内容推荐方法中会话主题向量提取的其中一种实施方案流程示意图;
图4为本申请实施例提供的平台内容推荐方法中相似度得分计算的其中一种实施方案流程示意图;
图5为本申请实施例提供的平台内容推荐方法的另一种实施方案流程示意图;
图6为本申请实施例提供的平台内容推荐方法中内容特征向量获取的其中一种实施方案流程示意图;
图7是本申请实施例中提供的平台内容推荐装置的一个实施例结构示意图;
图8是本申请实施例中提供的电子设备的一个实施例结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个所述特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
本申请实施例中,“和/或”描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,字符“/”,如无特殊说明,一般表示前后关联对象是一种“或”的关系。
在本申请中,“示例性”一词用来表示“用作例子、例证或说明”。本申请中被描述为“示例性”的任何实施例不一定被解释为比其它实施例更优选或更具优势。为了使本领域任何技术人员能够实现和使用本发明,给出了以下描述。在以下描述中,为了解释的目的而列出了细节。应当明白的是,本领域普通技术人员可以认识到,在不使用这些特定细节的情况下也可以实现本发明。在其它实例中,不会对公知的结构和过程进行详细阐述,以避免不必要的细节使本发明的描述变得晦涩。因此,本发明并非旨在限于所示的实施例,而是与符合本申请所公开的原理和特征的最广范围相一致。
本申请实施例提供一种平台内容推荐方法、装置、设备及计算机可读存储介质,以下分别进行详细说明。
本发明实施例中的平台内容推荐方法应用于平台内容推荐装置,平台内容推荐装置设置于电子设备,电子设备中设置有一个或多个处理器、存储器,以及一个或多个应用程序,其中一个或多个应用程序被存储于存储器中,并配置为由处理器执行以实现平台内容推荐方法;电子设备可以是终端,例如,手机或平板电脑,电子设备还可以是一台服务器,或者多台服务器组成的服务集群。
如图1所示,图1为本申请实施例平台内容推荐方法的场景示意图,本发明实施例中平台内容推荐场景中包括电子设备100(电子设备100中集成有平台内容推荐装置),电子设备100中运行平台内容推荐对应的计算机可读存储介质,以执行平台内容推荐的步骤。
可以理解的是,图1所示平台内容推荐方法的场景中的电子设备,或者电子设备中包含的装置并不构成对本发明实施例的限制,即,平台内容推荐方法的场景中包含的设备数量、设备种类,或者各个设备中包含的装置数量、装置种类不影响本发明实施例中技术方案整体实现,均可以算作本发明实施例要求保护技术方案的等效替换或衍生。
本发明实施例中电子设备100主要用于:获取处于新增状态的多个候选平台内容的内容特征向量,所述内容特征向量的维度包括:内容主题、内容关键信息、内容类目类别中的至少一种;获取目标用户在目标群聊会话中的第一历史会话信息;基于所述第一历史会话信息,获取所述目标用户的用户兴趣特征向量;基于所述目标群聊会话中的第二历史会话信息,提取所述目标群聊会话的至少一个会话主题向量;对所述目标群聊会话中的第二历史会话信息进行会话信息编码,得到会话内容向量;计算每一个候选平台内容的内容特征向量与所述会话内容向量、会话主题向量和所述用户兴趣特征向量的相似度得分;基于所述相似度得分确定为所述目标用户确定推荐的目标平台内容。
本发明实施例中该电子设备100可以是独立的电子设备,也可以是电子设备组成的电子设备网络或电子设备集群,例如,本发明实施例中所描述的电子设备100,其包括但不限于计算机、网络主机、单个网络电子设备、多个网络电子设备集或多个电子设备构成的云电子设备。其中,云电子设备由基于云计算(Cloud Computing)的大量计算机或网络电子设备构成。
本领域技术人员可以理解,图1中示出的应用环境,仅仅是与本申请方案一种应用场景,并不构成对本申请方案应用场景的限定,其他的应用环境还可以包括比图1中所示更多或更少的电子设备,或者电子设备网络连接关系,例如图1中仅示出1个电子设备,可以理解的,该平台内容推荐方法的场景还可以包括一个或多个其他电子设备,具体此处不作限定;该电子设备100中还可以包括存储器,用于存储数据,例如,存储拍摄获得的图像信息等。
此外,本申请平台内容推荐方法的场景中电子设备100可以设置显示装置,或者电子设备100中不设置显示装置与外接的显示装置200通讯连接,显示装置200用于输出电子设备中平台内容推荐方法执行的结果。电子设备100可以访问后台数据库300(后台数据库可以是电子设备的本地存储器中,后台数据库还可以设置在云端),后台数据库300中保存有平台内容推荐相关的信息,例如,后台数据库300中初始图像,或者预先设置的滤波参数。
需要说明的是,图1所示的平台内容推荐方法的场景示意图仅仅是一个示例,本发明实施例描述的平台内容推荐方法的场景是为了更加清楚的说明本发明实施例的技术方案,并不构成对于本发明实施例提供的技术方案的限定。
基于上述平台内容推荐方法的场景,提出了平台内容推荐方法的实施例。
如图2所示,为本申请实施例中平台内容推荐方法的一个实施例流程示意图,该平台内容推荐方法包括步骤S201-S207:
S201、获取处于新增状态的多个候选平台内容的内容特征向量。
其中,新增状态,即,用于标识预设时长内新增的平台内容的状态标识,示例性的,可以将三天内发布的平台内容设置为新增状态的平台内容,也可以将一天内发布的平台内容设置为新增状态的平台内容;可以理解的是,当检测到平台内容发布超过预设时长,则删除所述平台内容的新增状态,即,其不属于处于新增状态的多个候选平台内容。
其中,候选平台内容,即,待推荐的平台内容,可以包括,预设时长内县发布的笔记、视频、音频或者文本、视频和/或音频的结合内容。
其中,所述内容特征向量的维度包括:内容主题、内容关键信息、内容类目类别中的至少一种。
可以理解的是,所述内容主体,即,平台内容对应的主要表达的信息,示例性的,所述内容主题可以为内容标题、内容简介、内容概括等;所述内容关键信息,即,与内容主体相关的关键信息,示例性的,所述内容关键信息可以为内容关键词、内容关键帧、内容关键字段等;其中,所述内容类目类别,即,平台内容所述的分类信息,示例性的,所述内容类目类别可以包括体育类、娱乐类、科普类、音乐类等。
具体的,在本申请实施方案中,所述平台内容推荐方法运用于平台内容推荐装置,所述平台内容推荐装置设置与电子设备中,所述电子设备可以通过在预设时间点、或者在检测到新增状态的候选平台内容时,根据所述候选平台内容的内容信息,生成各所述候选平台内容对应的内容特征向量。
进一步的,在检测到目标用户位于候选平台内容对应的目标平台时,获取处于新增状态的多个候选平台内容的内容特征向量,或者,根据预设的推荐间隔频率处于新增状态的多个候选平台内容的内容特征向量,本申请不做具体的限定。
S202、获取目标用户在目标群聊会话中的第一历史会话信息。
其中,所述第一历史会话信息为所述目标用户在所述目标群聊会话中发送的会话,可以理解的是,所述第一历史会话信息可以包括预设时长内的目标用户在所述目标群聊会话中发送的会话,预设时长可以为一天、两个小时、一个星期等。
可以理解的是,电子设备获取处于新增状态的多个候选平台内容的内容特征向量后,可以通过获取各目标群聊对应的群聊日志,获取所述目标用户在目标群聊会话中的第一历史会话信息。
S203、基于所述第一历史会话信息,获取所述目标用户的用户兴趣特征向量。
其中,所述用户兴趣特征向量,即,用于表征用户兴趣/喜好的信息。
可以理解的是,基于所述第一历史会话信息,获取所述目标用户的用户兴趣特征向量的具体实现方式本申请不做具体的限定,示例性的:
在本申请的其中一种实施方案中,将所述第一历史会话信息输入预设的喜好分析模型,输出得到所述目标用户的用户兴趣特征向量,可以理解的是,所述喜好分析模型可以通过携带喜好标签的会话信息训练得到。
在本申请的其中一种实施方案中,提取所述第一历史会话信息中的关键字,根据所述关键字的出现频率,确定目标用户的用户兴趣特征向量。
S204、基于所述目标群聊会话中的第二历史会话信息,提取所述目标群聊会话的至少一个会话主题向量。
其中,所述第二历史会话信息为所述目标用户所在的目标群聊中的包括所述目标用户发言的会话信息,可以理解的是,所述第二历史会话信息可以包括预设时长内的会话信息,示例性的,所述第二历史会话信息为前三个小时的会话信息、或前一天的会话信息。
可以理解的是,所述第一历史会话信息可以包括部分第一会话信息或者全部第一会话信息,示例性的:
可以理解的是,由于目标群聊会话中的会话时间或语义可能不连贯,可以将所述目标群聊会话中的第二历史会话信息划分为至少一个会话集,进而根据至少一个会话集中的会话内容确定对应的至少一个会话主题向量。
进一步可以理解的是,基于所述目标群聊会话中的第二历史会话信息,提取所述目标群聊会话的至少一个会话主题向量的实现方式,本申请不做具体的限定,示例性:
在本申请的其中一个实施方案中,通过将所述第二历史会话信息按照时间顺序输入预设的主题分类模型,通过所述主题分类模型对所述二历史会话信息进行主题划分,输出得到至少一个会话主题向量。
在本申请的另一个实施方案中,根据所述第二历史会话信息中各会话的时间间隔,将所述第二历史会话信息划分为不同的会话集,进而根据会话集的会话内容确定所述目标群聊会话的至少一个会话主题向量。
S205、对所述目标群聊会话中的第二历史会话信息进行会话信息编码,得到会话内容向量。
具体的,在本申请的其中一种实施方案中,针对每一个会话主题向量,通过提取所述第二历史会话信息中会话主题向量对应的会话信息,将所述会话信息编码形成会话内容向量。
具体的,在本申请的其中一种实施方案中,将第二历史会话信息中的所有的会话进行编码,得到所述得到会话内容向量。
可以理解的是,将所述编码具体可以通过bert模型实现。
S206、计算每一个候选平台内容的内容特征向量与所述会话内容向量、会话主题向量和所述用户兴趣特征向量的相似度得分。
其中,所述相似度得分用于表征每一个候选平台内容的内容特征向量与每一个会话内容向量、每一个会话主题向量和每一个所述用户兴趣特征向量之间的相似度程度。
可以理解的是,所述相似度得分可以通过预设的预测模型计算得到,所述预测模型可以为高斯核网络、深度学习网络模型等,可以理解的是,所述预测模型可以通过写到相似度评分的内容特征向量与每一个会话内容向量、每一个会话主题向量和每一个所述用户兴趣特征向量形成的组合训练得到。
S207、基于所述相似度得分确定为所述目标用户确定推荐的目标平台内容。
其中,目标平台内容,即,从所述候选平台内容中筛选出来的相似评分最高的候选平台内容。
可以理解的是,可以将所述相似度得分进行排序,根据目标推荐数量,确定一个或几个(与目标推荐数量相关)最高的相似度得分,进而根据并根据一个或几个(与目标推荐数量相关)最高的相似度得分对应的组合中的内容特征向量,确定所述内容特征向量对应的目标平台内容。
可以理解的是,目标推荐数量即,每次推荐的候选平台内容数量,示例性的,可以为一个两个或N个。
进一步的,在上述实施方案的基础上,参见图3,图3为本申请实施例提供的平台内容推荐方法中会话主题向量提取的其中一种实施方案流程示意图,具体包括步骤S301-S303:
S301、根据所述目标群聊会话中的各第二历史会话信息的时间间隔和预设会话间隔时长,将所述第二历史会话信息划分为多个会话集。
其中,各第二历史会话信息的时间间隔,即,第二历史会话信息中包括的在时间轴上相邻的两会话之间的时间间隔。
具体的,若所述时间间隔大于预设会话间隔时长,说明用户聊天间隔较大,可以将时间间隔相隔较大的两个会话分别划分到两个会话集,其中,所述会话集中包括至少一个会话。
可以理解的是,在本申请的其中一些实施方案中,与可以对所述会话集进行筛选,即,将只包括一个会话的会话集删除,减少数据分析量。
S302、根据所述会话集中各所述第二历史会话信息的语义信息,确定各所述会话集的会话主题。
具体的,在将所述第二历史会话信息划分为多个会话集后,针对每一个会话集进行主题分析(可以通过模型分析、语义识别分析等),得到每一个会话集的会话主题。
S303、对各会话主题进行编码,得到对应的会话主题向量。
进一步的,在确定各所述会话集的会话主题后,针对每一个会话主题进行编码,得到对应的会话主题向量。
可以理解的是,在本申请的其中一种实施方案中,由于一个群聊内有大量的对话历史内容,不可能所有的对话内容的主题都是一样的,因此会存在多个主题的内容。因此,提出了动态的bert编码的方式,我们会定一个k,k代表的是编码的对话轮数(根据所述目标群聊会话中的各第二历史会话信息的时间间隔和预设会话间隔时长,将所述第二历史会话信息划分为多个会话集),然后我们将对话历史输入到bert模型中,然后一开始的k是1,然后通过不断的编码,我们可以得到不同轮的主题,然后依次动态变化,可以得到多个主题(根据所述会话集中各所述第二历史会话信息的语义信息,确定各所述会话集的会话主题),我们可以针对这多个主题进行编码(对各会话主题进行编码,得到对应的会话主题向量)。
进一步的,在上述实施方案的基础上,参见图4,图4为本申请实施例提供的平台内容推荐方法中相似度得分计算的其中一种实施方案流程示意图,具体包括步骤S401-S402:
S401、将所述候选平台内容的内容特征向量、所述会话内容向量、会话主题向量和所述用户兴趣特征向量输入高斯核网络。
其中,所述会话主题向量的数量为至少一个,所述用户兴趣特征向量的数量为至少一个。
具体的,在本申请的其中一种实施方案中,针对每一个时刻的群聊的内容进行编码(每一个会话主题向量对应的时刻,即针对每一个会话集进行编码),然后将编码的会话内容向量和用户兴趣特征向量、群聊的会话主题向量、候选平台内容的内容特征向量输入高斯核网络。在这里,我们首次提出基于高斯核网络的多维向量的结合,传统的向量都是直接采用两两之间的余弦相似度进行判断,我们这里采用这种多维的方式可以更好的提升整体的match程度。
S402、通过高斯核网络对候选平台内容的内容特征向量与所述会话内容向量、以及会话主题向量和所述用户兴趣特征向量的所有组合进行相似度得分计算,得到每个所述组合的相似度得分。
进一步的,通过高斯核网络分析内容特征向量与所述会话内容向量、以及会话主题向量和所述用户兴趣特征向量各维度对应的所有组合的相似度,得到每个所述组合的相似度得分,每一个组合中包括一个内容特征向量与一个所述会话内容向量、以及一个会话主题向量和一个用户兴趣特征向量,所述相似度得分用于表征组合中包括一个内容特征向量与一个所述会话内容向量、以及一个会话主题向量和一个用户兴趣特征向量之间的相似程度。
进一步的,在上述实施方案的基础上,参见图5,图5为本申请实施例提供的平台内容推荐方法的另一种实施方案流程示意图,具体包括步骤S501-S510:
S501、获取处于新增状态的多个候选平台内容的内容特征向量,所述内容特征向量的维度包括:内容主题、内容关键信息、内容类目类别中的至少一种;
S502、获取目标用户在目标群聊会话中的第一历史会话信息;
S503、基于所述第一历史会话信息,获取所述目标用户的用户兴趣特征向量;
S504、基于所述目标群聊会话中的第二历史会话信息,提取所述目标群聊会话的至少一个会话主题向量;
S505、对所述目标群聊会话中的第二历史会话信息进行会话信息编码,得到会话内容向量;
S506、计算每一个候选平台内容的内容特征向量与所述会话内容向量、会话主题向量和所述用户兴趣特征向量的相似度得分;
S507、基于所述相似度得分确定为所述目标用户确定推荐的目标平台内容。
其中,步骤S501-S507的具体实现方式参见上述任一项实施方案所示。
S508、确定所述目标平台内容对应的组合中的内容特征向量、用户兴趣特征向量、会话内容向量和会话主题向量。
可以理解的是,所述目标平台内容对应的组合,即,包括所述目标平台内容的内容特征向量与所述会话内容向量、会话主题向量和所述用户兴趣特征向量的组合,可以理解的是,所述目标平台内容为相似度得分最高的组合确定,进而可以根据所述目标平台内容确定对应的组合。
S509、基于所述用户兴趣特征向量、会话主题向量、会话内容向量和所述内容特征向量,生成针对所述目标用户的对所述目标平台内容的推荐信息。
其中,所述推荐信息可以推荐理由、推荐图文、推荐文本等。
示例性的,在本申请的其中一种实施方案中,可以将所述用户兴趣特征向量、会话主题向量、会话内容向量和所述内容特征向量的信息融入到gpt的encoding中,然后生成一段针对目标用户的不同的推荐理由出来。可以理解的是,由于所述推荐理由涵盖用户兴趣特征向量、会话主题向量、会话内容向量和所述内容特征向量,能够使得所述推荐理由与目标用户的兴趣更加贴合。
S510、基于推荐信息和所述目标平台内容在所述目标用户对应的显示界面进行推荐。
进一步的,根据所述推荐信息和基于推荐信息和所述目标平台内容在所述目标用户对应的显示界面进行推荐的具体实现方式本申请不做具体限定,示例性:根据所述推荐信息和所述目标平台内容,生成推荐消息,所述推荐消息可以是推荐弹窗、推荐页面或者推荐文本等;进一步将所述推进消息显示在所述目标用户对应的目标群聊界面,示例性的可以弹窗显示,或者由机器人在目标群聊界面针对目标用户发送。
可以理解的是,在本申请的其中一些实施方案中,所述目标平台内容可仅仅针对所述目标用户可见,也可以针对目标群聊中的所有用户可见。
具体的,在本申请的其中一种实施方案中,电子设备在基于所述用户兴趣特征向量、会话主题向量、会话内容向量和所述内容特征向量,生成针对所述目标用户的对所述目标平台内容的推荐信息后,将根据所述推荐信息和所述目标平台内容,生成推荐消息;进一步的通过虚拟角色在目标群聊会话中针对所述目标用户发送所述推荐消息,控制所述推荐信息在所述显示界面显示。
具体的,在本申请的另一种实施方案中,电子设备在基于所述用户兴趣特征向量、会话主题向量、会话内容向量和所述内容特征向量,生成针对所述目标用户的对所述目标平台内容的推荐信息后,将根据所述推荐信息和所述目标平台内容,生成推荐消息;进一步的,在所述目标用户的平台内容推荐页面中的内容更新区域显示所述推荐消息。
可以理解的会,具体的推荐显示方式本申请不做具体限定。
进一步的,在上述实施方案的基础上,本申请提供一种内容特征向量获取的实施方案,在本申请实施方案中,所述内容特征向量包括候选平台内容在内容主题维度和内容关键信息维度下的内容特征向量;具体的,参见图6,图6为本申请实施例提供的平台内容推荐方法中内容特征向量获取的其中一种实施方案流程示意图,具体包括步骤S601-S606:
S601、确定处于新增状态的多个候选平台内容,针对各所述候选平台内容进行编码,得到编码向量。
具体的,在查找平台内容数据库,获取处于新增状态的多个候选平台内容,可以理解的是,所述处于新增状态的多个候选平台内容可以单独存储在具有新增状态标识的数据库中,也可以存储在总数据库中,并对应每一个候选平台内容具有新增状态标识,以便于处于新增状态的多个候选平台内容的确定。
具体的,在确定处于新增状态的多个候选平台内容后,将针对笔记的topic模块,我们首先会采用bert处理得到很多笔记的embedding的表示,实现对所述候选平台内容进行编码,得到编码向量。
S602、对所述编码向量进行聚类处理,得到向量类别,以及各所述向量类别对应的候选平台内容。
其中,所述向量类别,即,用于表征内容主题分类的向量参数。
具体的,在本申请的其中一种实施方案中,采用聚类算法对所述编码向量进行聚类处理,得到向量类别,以及每一个向量类别对应的至少一个候选平台内容;示例性的,可以采用K-means聚类算法,对所述编码向量进行聚类处理,即,首先对新笔记的topic进行粗分类,得到向量类别。
S603、对每一个所述向量类别下的候选平台内容进行关键字提取。
进一步的,在得到向量类别后,针对每一个向量类别,对所述向量类别下的候选平台内容进行关键字提取,得到向量类别下的关键字信息。
具体的,对所述向量类别中包含的候选平台内容进行rake计算处理,得到向量类别对应的关键字向量。
S604、对候选平台内容的关键字进行特征提取,得到候选平台内容在关键字维度下的内容特征向量。
进一步的,对所述关键字向量进行向量特征提取处理,比如卷积运算,进而得到候选平台内容在关键字维度下的内容特征向量。
S605、统计每一向量类别下各关键字的数量,根据所述关键字的数量确定每一所述向量类别对应的主题关键字。
进一步的,根据所述关键字向量的重复数量由大到小,对所述初始关键词进行排序;将位于排序前N位对应的初始关键词向量设置为所述语言表征类别对应的关键字向量。
S606、基于所述主题关键字提取各向量类别下的主题关键字向量,作为候选平台内容在主题维度下的内容特征向量。
示例性的,在本申请的其中一种实施方案中,我们针对每个粗类别(粗类别即向量类别)再采用rake算法,抽取得出来粗类别下每一个候选平台内容的多个keyword,然后我们再每一个粗类别下(统计每一个topic粗类别下的所有笔记中的每个keyword的数量,在每一个topic粗类别下根据keyword数量排序),每个笔记的keyword进行排序,比如“巴黎贝甜”这个keyword在这个topic下出现了5次,排名第一名,那么就是一个topic的代表词,然后我们选取了每个粗类别下(排列在前)的3个keyword作为topic。这样得到的topic更具有特征性,也和传统的获得topic的方法不一样。
进一步的,在上述实施方案的基础上,本申请提供一种内容特征向量获取的实施方案,在本申请实施方案中,内容特征向量还包括内容类目类别维度下的内容特征向量,具体的包括步骤:
(1)确定处于新增状态的多个候选平台内容;
(2)将候选平台内容输入预设的大语言模型,所述大语言模型基于带类目类别标签的内容样本训练得到;
(3)通过所述大语言模型对所述候选平台内容进行分类处理,得到所述候选平台内容的内容类目类别;
(4)对所述内容类目类别进行编码处理,得到内容类目类别维度下的内容特征向量。
具体的,在本申请实施方案中,我们采用的方式是我们先采用gpt-4针对候选平台内容的内容类目类别标注大概4000条数据,然后我们用这4000条数据针对gpt模型进行微调,然后我们可以得到一个微调后的gpt的模型用于得到内容类目类别,本申请采用gpt模型针对候选平台内容的内容类目类别识别采用gpt模型进行训练。综上,我们可以得到一篇候选平台内容的topic、keyword、特色属性(内容类目类别),然后我们采用bert模型针对这些属性值进行编码。
本申请实施方案提供平台内容推荐方法,通过获取处于新增状态的多个候选平台内容的内容特征向量,所述内容特征向量的维度包括:内容主题、内容关键信息、内容类目类别中的至少一种;获取目标用户在目标群聊会话中的第一历史会话信息;基于所述第一历史会话信息,获取所述目标用户的用户兴趣特征向量;基于所述目标群聊会话中的第二历史会话信息,提取所述目标群聊会话的至少一个会话主题向量;对所述目标群聊会话中的第二历史会话信息进行会话信息编码,得到会话内容向量;计算每一个候选平台内容的内容特征向量与所述会话内容向量、会话主题向量和所述用户兴趣特征向量的相似度得分;基于所述相似度得分确定为所述目标用户确定推荐的目标平台内容。本方案中根据目标用户在目标群聊会话中的第一历史会话信息分析目标用户的用户兴趣特征向量,以及根据目标群聊会话中对应的会话主体向量,以及对应目标用户的会话内容向量,结合属于新增状态的内容特征向量,进行多维度分析,进而确定每一个候选平台内容的内容特征向量与所述会话内容向量、会话主题向量和所述用户兴趣特征向量的相似度得分,根据相似度得分确定与所述会话内容向量、会话主题向量和所述用户兴趣特征向量最相似的目标平台内容,并将所述目标平台内容对应所述目标用户进行推荐,增加新笔记的曝光度,同时结合用户聊天信息对目标用户进行针对性推荐,保证平台内容推荐合理性,增强激发用户的发布新笔记的兴趣。
为了更好实施本申请实施例中平台内容推荐装置,在平台内容推荐装置基础之上,本申请实施例中还提供一种平台内容推荐装置,如图7所示,所述平台内容推荐装置包括模块701-707:
第一获取模块701,用于获取处于新增状态的多个候选平台内容的内容特征向量,所述内容特征向量的维度包括:内容主题、内容关键信息、内容类目类别中的至少一种;
第二获取模块702,用于获取目标用户在目标群聊会话中的第一历史会话信息;
第一会话处理模块703,用于基于所述第一历史会话信息,获取所述目标用户的用户兴趣特征向量;
第二会话处理模块704,用于基于所述目标群聊会话中的第二历史会话信息,提取所述目标群聊会话的至少一个会话主题向量;
第三会话处理模块705,用于对所述目标群聊会话中的第二历史会话信息进行会话信息编码,得到会话内容向量;
相似度处理模块706,用于计算每一个候选平台内容的内容特征向量与所述会话内容向量、会话主题向量和所述用户兴趣特征向量的相似度得分;
推荐模块707,用于基于所述相似度得分确定为所述目标用户确定推荐的目标平台内容。
在本申请其中一个实施方案中,所述第二会话处理模块704,用于基于所述目标群聊会话中的第二历史会话信息,提取所述目标群聊会话的至少一个会话主题向量,具体包括用于:
根据所述目标群聊会话中的各第二历史会话信息的时间间隔和预设会话间隔时长,将所述第二历史会话信息划分为多个会话集;
根据所述会话集中各所述第二历史会话信息的语义信息,确定各所述会话集的会话主题;
对各会话主题进行编码,得到对应的会话主题向量。
在本申请其中一个实施方案中,相似度处理模块706,用于计算每一个候选平台内容的内容特征向量与所述会话内容向量、会话主题向量和所述用户兴趣特征向量的相似度得分,具体包括用于:
将所述候选平台内容的内容特征向量、所述会话内容向量、会话主题向量和所述用户兴趣特征向量输入高斯核网络,其中,所述会话主题向量的数量为至少一个,所述用户兴趣特征向量的数量为至少一个;
通过高斯核网络对候选平台内容的内容特征向量与所述会话内容向量、以及会话主题向量和所述用户兴趣特征向量的所有组合进行相似度得分计算,得到每个所述组合的相似度得分。
在本申请其中一个实施方案中,推荐模块707,用于基于所述相似度得分确定为所述目标用户确定推荐的目标平台内容之后,具体包括用于:
确定所述目标平台内容对应的组合中的内容特征向量、用户兴趣特征向量、会话内容向量和会话主题向量;
基于所述用户兴趣特征向量、会话主题向量、会话内容向量和所述内容特征向量,生成针对所述目标用户的对所述目标平台内容的推荐信息;
基于推荐信息和所述目标平台内容在所述目标用户对应的显示界面进行推荐。
在本申请其中一个实施方案中,推荐模块707,用于基于推荐信息和所述目标平台内容在所述目标用户对应的显示界面进行推荐,具体包括用于:
根据所述推荐信息和所述目标平台内容,生成推荐消息;
通过虚拟角色在目标群聊会话中针对所述目标用户发送所述推荐消息。
在本申请其中一个实施方案中,所述内容特征向量包括候选平台内容在内容主题维度和内容关键信息维度下的内容特征向量;第一获取模块701,用于获取处于新增状态的多个候选平台内容的内容特征向量,具体包括用于:
确定处于新增状态的多个候选平台内容,针对各所述候选平台内容进行编码,得到编码向量;
对所述编码向量进行聚类处理,得到向量类别,以及各所述向量类别对应的候选平台内容;
对每一个所述向量类别下的候选平台内容进行关键字提取;
对候选平台内容的关键字进行特征提取,得到候选平台内容在关键字维度下的内容特征向量;
统计每一向量类别下各关键字的数量,根据所述关键字的数量确定每一所述向量类别对应的主题关键字;
基于所述主题关键字提取各向量类别下的主题关键字向量,作为候选平台内容在主题维度下的内容特征向量。
在本申请其中一个实施方案中,内容特征向量还包括内容类目类别维度下的内容特征向量;第一获取模块701,用于获取处于新增状态的多个候选平台内容的内容特征向量,具体包括用于:
将候选平台内容输入预设的大语言模型,所述大语言模型基于带类目类别标签的内容样本训练得到;
通过所述大语言模型对所述候选平台内容进行分类处理,得到所述候选平台内容的内容类目类别;
对所述内容类目类别进行编码处理,得到内容类目类别维度下的内容特征向量。
在上述实施方案的基础上,本发明实施例还提供一种电子设备,如图8所示,图8是本申请实施例中提供的电子设备的一个实施例结构示意图。
电子设备包括:
一个或多个处理器;
存储器;以及
一个或多个应用程序,其中一个或多个应用程序被存储于存储器中,并配置为由处理器执行上述平台内容推荐方法实施例中任一实施例中的平台内容推荐方法中的步骤。
具体来讲:电子设备可以包括一个或者一个以上处理核心的处理器1001、一个或一个以上计算机可读存储介质的存储器1002、电源1003和输入单元1004等部件。本领域技术人员可以理解,图8中示出的电子设备结构并不构成对电子设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
处理器1001是该平台内容推荐中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或执行存储在存储器1002内的软件程序和/或模块,以及调用存储在存储器1002内的数据,执行电子设备的各种功能和处理数据,从而对电子设备进行整体监控。可以理解的是,处理器1001通过与控制器信号传输,可选的,处理器1001可包括一个或多个处理核心;优选的,处理器1001可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器1001中。
存储器1002可用于存储软件程序以及模块,处理器1001通过运行存储在存储器1002的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器1002可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据电子设备的使用所创建的数据等。此外,存储器1002可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器1002还可以包括存储器控制器,以提供处理器1001对存储器1002的访问。
在本申请一些实施例中,平台内容推荐装置可以实现为一种计算机程序的形式,计算机程序可在如图8所示的电子设备上运行。电子设备的存储器中可存储组成该平台内容推荐方法装置的各个程序模块,比如,图7所示的第一获取模块701、第二获取模块702、第一会话处理模块703、第二会话处理模块704、第三会话处理模块705、相似度处理模块706、推荐模块707。各个程序模块构成的计算机程序使得处理器执行本说明书中描述的本申请各个实施例的平台内容推荐方法中的步骤。
例如,图8所示的电子设备可以通过如图7所示的平台内容推荐方法装置中的第一获取模块701执行步骤S201。电子设备可通过第二获取模块702执行步骤S202。电子设备可通过第一会话处理模块703执行步骤S203。电子设备可通过第二会话处理模块704执行步骤S204。电子设备可通过第三会话处理模块705执行步骤S205。电子设备可通过相似度处理模块706执行步骤S206。电子设备可通过推荐模块707执行步骤S207。该电子设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该电子设备的处理器用于提供计算和控制能力。该电子设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该电子设备的网络接口用于与外部的电子设备通过网络连接通信。该计算机程序被处理器执行时以实现一种平台内容推荐方法。
电子设备还包括给各个部件供电的电源1003,优选的,电源1003可以通过电源管理系统与处理器1001逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源1003还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
该电子设备还可包括输入单元1004,该输入单元1004可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。
尽管未示出,电子设备还可以包括显示单元等,在此不再赘述。具体在本实施例中,电子设备中的处理器1001会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器1002中,并由处理器1001来运行存储在存储器1002中的应用程序,从而实现各种功能,如下:
获取处于新增状态的多个候选平台内容的内容特征向量,所述内容特征向量的维度包括:内容主题、内容关键信息、内容类目类别中的至少一种;
获取目标用户在目标群聊会话中的第一历史会话信息;
基于所述第一历史会话信息,获取所述目标用户的用户兴趣特征向量;
基于所述目标群聊会话中的第二历史会话信息,提取所述目标群聊会话的至少一个会话主题向量;
对所述目标群聊会话中的第二历史会话信息进行会话信息编码,得到会话内容向量;
计算每一个候选平台内容的内容特征向量与所述会话内容向量、会话主题向量和所述用户兴趣特征向量的相似度得分;
基于所述相似度得分确定为所述目标用户确定推荐的目标平台内容。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
为此,本发明实施例提供一种计算机可读存储介质(可简称存储介质),该计算机可读存储介质可以包括:只读存储器(ROM,ReadOnlyMemory)、随机存取记忆体(RAM,RandomAccessMemory)、磁盘或光盘等。其上存储有计算机程序,计算机程序被处理器进行加载,以执行本发明实施例所提供的任一种平台内容推荐方法中的步骤。例如,计算机程序被处理器进行加载可以执行如下步骤:
获取处于新增状态的多个候选平台内容的内容特征向量,所述内容特征向量的维度包括:内容主题、内容关键信息、内容类目类别中的至少一种;
获取目标用户在目标群聊会话中的第一历史会话信息;
基于所述第一历史会话信息,获取所述目标用户的用户兴趣特征向量;
基于所述目标群聊会话中的第二历史会话信息,提取所述目标群聊会话的至少一个会话主题向量;
对所述目标群聊会话中的第二历史会话信息进行会话信息编码,得到会话内容向量;
计算每一个候选平台内容的内容特征向量与所述会话内容向量、会话主题向量和所述用户兴趣特征向量的相似度得分;
基于所述相似度得分确定为所述目标用户确定推荐的目标平台内容。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见上文针对其他实施例的详细描述,此处不再赘述。
具体实施时,以上各个单元或结构可以作为独立的实体来实现,也可以进行任意组合,作为同一或若干个实体来实现,以上各个单元或结构的具体实施可参见前面的方法实施例,在此不再赘述。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
以上对本申请实施例所提供的一种平台内容推荐方法、装置、电子设备及存储介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种平台内容推荐方法,其特征在于,包括:
获取处于新增状态的多个候选平台内容的内容特征向量,所述内容特征向量的维度包括:内容主题、内容关键信息、内容类目类别中的至少一种;
获取目标用户在目标群聊会话中的第一历史会话信息;
基于所述第一历史会话信息,获取所述目标用户的用户兴趣特征向量;
基于所述目标群聊会话中的第二历史会话信息,提取所述目标群聊会话的至少一个会话主题向量;
对所述目标群聊会话中的第二历史会话信息进行会话信息编码,得到会话内容向量;
计算每一个候选平台内容的内容特征向量与所述会话内容向量、会话主题向量和所述用户兴趣特征向量的相似度得分;
基于所述相似度得分确定为所述目标用户确定推荐的目标平台内容。
2.根据权利要求1所述的平台内容推荐方法,其特征在于,所述基于所述目标群聊会话中的第二历史会话信息,提取所述目标群聊会话的至少一个会话主题向量,包括:
根据所述目标群聊会话中的各第二历史会话信息的时间间隔和预设会话间隔时长,将所述第二历史会话信息划分为多个会话集;
根据所述会话集中各所述第二历史会话信息的语义信息,确定各所述会话集的会话主题;
对各会话主题进行编码,得到对应的会话主题向量。
3.根据权利要求1所述的平台内容推荐方法,其特征在于,所述计算每一个候选平台内容的内容特征向量与所述会话内容向量、会话主题向量和所述用户兴趣特征向量的相似度得分,包括:
将所述候选平台内容的内容特征向量、所述会话内容向量、会话主题向量和所述用户兴趣特征向量输入高斯核网络,其中,所述会话主题向量的数量为至少一个,所述用户兴趣特征向量的数量为至少一个;
通过高斯核网络对候选平台内容的内容特征向量与所述会话内容向量、以及会话主题向量和所述用户兴趣特征向量的所有组合进行相似度得分计算,得到每个所述组合的相似度得分。
4.根据权利要求1所述的平台内容推荐方法,其特征在于,所述基于所述相似度得分确定为所述目标用户确定推荐的目标平台内容后,还包括:
确定所述目标平台内容对应的组合中的内容特征向量、用户兴趣特征向量、会话内容向量和会话主题向量;
基于所述用户兴趣特征向量、会话主题向量、会话内容向量和所述内容特征向量,生成针对所述目标用户的对所述目标平台内容的推荐信息;
基于推荐信息和所述目标平台内容在所述目标用户对应的显示界面进行推荐。
5.根据权利要求4所述的平台内容推荐方法,其特征在于,基于推荐信息和所述目标平台内容在所述目标用户对应的显示界面进行推荐,包括:
根据所述推荐信息和所述目标平台内容,生成推荐消息;
通过虚拟角色在目标群聊会话中针对所述目标用户发送所述推荐消息,或者,在所述目标用户的平台内容推荐页面中的内容更新区域显示所述推荐消息。
6.根据权利要求1-5任一项所述的平台内容推荐方法,其特征在于,所述内容特征向量包括候选平台内容在内容主题维度和内容关键信息维度下的内容特征向量;
所述获取处于新增状态的多个候选平台内容的内容特征向量,包括:
确定处于新增状态的多个候选平台内容,针对各所述候选平台内容进行编码,得到编码向量;
对所述编码向量进行聚类处理,得到向量类别,以及各所述向量类别对应的候选平台内容;
对每一个所述向量类别下的候选平台内容进行关键字提取;
对候选平台内容的关键字进行特征提取,得到候选平台内容在关键字维度下的内容特征向量;
统计每一向量类别下各关键字的数量,根据所述关键字的数量确定每一所述向量类别对应的主题关键字;
基于所述主题关键字提取各向量类别下的主题关键字向量,作为候选平台内容在主题维度下的内容特征向量。
7.根据权利要求6所述的平台内容推荐方法,其特征在于,内容特征向量还包括内容类目类别维度下的内容特征向量,所述确定处于新增状态的多个候选平台内容后,还包括:
将候选平台内容输入预设的大语言模型,所述大语言模型基于带类目类别标签的内容样本训练得到;
通过所述大语言模型对所述候选平台内容进行分类处理,得到所述候选平台内容的内容类目类别;
对所述内容类目类别进行编码处理,得到内容类目类别维度下的内容特征向量。
8.一种平台内容推荐装置,其特征在于,所述平台内容推荐装置包括:
第一获取模块,用于获取处于新增状态的多个候选平台内容的内容特征向量,所述内容特征向量的维度包括:内容主题、内容关键信息、内容类目类别中的至少一种;
第二获取模块,用于获取目标用户在目标群聊会话中的第一历史会话信息;
第一会话处理模块,用于基于所述第一历史会话信息,获取所述目标用户的用户兴趣特征向量;
第二会话处理模块,用于基于所述目标群聊会话中的第二历史会话信息,提取所述目标群聊会话的至少一个会话主题向量;
第三会话处理模块,用于对所述目标群聊会话中的第二历史会话信息进行会话信息编码,得到会话内容向量;
相似度处理模块,用于计算每一个候选平台内容的内容特征向量与所述会话内容向量、会话主题向量和所述用户兴趣特征向量的相似度得分;
推荐模块,用于基于所述相似度得分确定为所述目标用户确定推荐的目标平台内容。
9.一种电子设备,其特征在于,所述电子包括:
一个或多个处理器;
存储器;以及
一个或多个应用程序,其中所述一个或多个应用程序被存储于所述存储器中,并配置为由所述处理器执行以实现权利要求1至7中任一项所述的平台内容推荐方法中的步骤。
10.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序被处理器进行加载,以执行权利要求1至7任一项所述的中的步骤。
CN202311509621.8A 2023-11-13 2023-11-13 平台内容推荐方法、装置、电子设备及存储介质 Pending CN117556139A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311509621.8A CN117556139A (zh) 2023-11-13 2023-11-13 平台内容推荐方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311509621.8A CN117556139A (zh) 2023-11-13 2023-11-13 平台内容推荐方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN117556139A true CN117556139A (zh) 2024-02-13

Family

ID=89812183

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311509621.8A Pending CN117556139A (zh) 2023-11-13 2023-11-13 平台内容推荐方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN117556139A (zh)

Similar Documents

Publication Publication Date Title
US10552488B2 (en) Social media user recommendation system and method
KR102462365B1 (ko) 사용자 데모그래픽 정보 및 콘텍스트 정보에 기초한 텍스트 입력 예측 방법 및 장치
US20180285700A1 (en) Training Image-Recognition Systems Using a Joint Embedding Model on Online Social Networks
US10891322B2 (en) Automatic conversation creator for news
CN110569496B (zh) 实体链接方法、装置及存储介质
WO2017084362A1 (zh) 模型生成方法、推荐方法及对应装置、设备和存储介质
US10535106B2 (en) Selecting user posts related to trending topics on online social networks
US20150213042A1 (en) Search term obtaining method and server, and search term recommendation system
JP6404106B2 (ja) コンテント及び関係距離に基づいて人々をつなげるコンピューティング装置及び方法
CN106940726B (zh) 一种基于知识网络的创意自动生成方法与终端
CN114036398B (zh) 内容推荐和排序模型训练方法、装置、设备以及存储介质
WO2019137391A1 (zh) 对视频进行分类匹配的方法、装置和挑选引擎
CN110209810A (zh) 相似文本识别方法以及装置
CN111291184B (zh) 表情的推荐方法、装置、设备及存储介质
CN111967599A (zh) 用于训练模型的方法、装置、电子设备及可读存储介质
CN114169418B (zh) 标签推荐模型训练方法及装置、标签获取方法及装置
CN117556139A (zh) 平台内容推荐方法、装置、电子设备及存储介质
CN116415624A (zh) 模型训练方法及装置、内容推荐方法及装置
CN113821669A (zh) 搜索方法、装置、电子设备和存储介质
CN111125362A (zh) 一种异常文本确定方法、装置、电子设备和介质
CN115795023B (zh) 文档推荐方法、装置、设备以及存储介质
CN114398502A (zh) 内容检索方法、装置、计算机设备和存储介质
US20230222148A1 (en) Systems and methods for attribution of facts to multiple individuals identified in textual content
CN110704648B (zh) 用户行为属性的确定方法、装置、服务器及存储介质
CN116932913A (zh) 一种信息推送方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination