CN113076414A - 会话推荐方法、装置、计算机设备和存储介质 - Google Patents

会话推荐方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN113076414A
CN113076414A CN202110628877.5A CN202110628877A CN113076414A CN 113076414 A CN113076414 A CN 113076414A CN 202110628877 A CN202110628877 A CN 202110628877A CN 113076414 A CN113076414 A CN 113076414A
Authority
CN
China
Prior art keywords
unit
session
conversation
sample
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110628877.5A
Other languages
English (en)
Inventor
陈嘉真
徐凯波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Mininglamp Software System Co ltd
Original Assignee
Beijing Mininglamp Software System Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Mininglamp Software System Co ltd filed Critical Beijing Mininglamp Software System Co ltd
Priority to CN202110628877.5A priority Critical patent/CN113076414A/zh
Publication of CN113076414A publication Critical patent/CN113076414A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及一种会话推荐方法、装置、计算机设备和存储介质。所述方法包括:获取用户的历史会话信息,用户的历史会话信息是指用户与其他用户之间的会话信息,将历史会话信息按照时间段划分为不同的会话单元,依照用户在每个会话单元中参与交互的情况,对每个会话单元进行打标,将打标后的会话单元作为特征参数提供给推荐系统,基于推荐系统中的预设推荐方案,根据会话单元打标后的交互标记,确定待推荐的目标单元,将目标单元中的会话内容推荐给用户终端进行展示,从而避免用户自行在众多历史交互信息中一一查找感兴趣的会话内容,根据用户的历史会话信息自动为用户推荐感兴趣的会话内容,提高了会话内容的查找效率。

Description

会话推荐方法、装置、计算机设备和存储介质
技术领域
本申请涉及推荐技术领域,尤其涉及一种会话推荐方法、装置、计算机设备和存储介质。
背景技术
随着网络的日常化发展,在生活和工作中均可通过社交软件实现沟通,因此,容易存在众多的线上交互信息,但由于交互信息的体量较大,容易导致用户查看后遗忘交互具体内容,需要查找历史交互信息,尤其是在工作中,由于工作内容较多,容易遗漏查看过的历史交互信息,因此,用户需要自行查找所需要的历史交互信息,但用户自行在众多历史交互信息中一一筛查,查找效率较低,且耗时较久。
发明内容
为了解决上述技术问题,本申请提供了一种会话推荐方法、装置、计算机设备和存储介质。
第一方面,本申请提供了一种会话推荐方法,包括:
获取目标账号的历史会话信息,其中,所述历史会话信息包括多个会话单元,各个所述会话单元对应不同的交互时间段,所述会话单元包括多个用户标签和各个用户标签对应的会话内容;
根据所述目标账号在各个所述会话单元中的参与状态,对各个所述会话单元进行打标,得到各个所述会话单元相对于所述目标账号的交互标记;
按照预设推荐方案,根据各个所述会话单元的交互标记,在各个所述会话单元中为所述目标账号确定目标单元;
推荐所述目标单元中的会话内容至所述目标账号对应的终端。
可选地,所述根据所述目标账号在各个所述会话单元中的参与状态,对各个所述会话单元进行打标,得到各个所述会话单元相对于所述目标账号的交互标记,包括:
根据所述会话单元中的用户标签与所述目标账号对应的用户标签的比对结果,确定所述目标账号在所述会话单元中的参与状态;
在所述参与状态为参与会话的情况下,将所述会话单元的交互标记设为第一标记;
在所述参与状态为未参与会话的情况下,将所述会话单元的交互标记设为第二标记,其中,所述第二标记对应的内容与所述第一标记对应的内容不同。
可选地,所述根据所述会话单元中的用户标签与所述目标账号对应的用户标签的比对结果,确定所述目标账号在所述会话单元中的参与状态,包括:
在所述会话单元中检测到所述目标账号对应的用户标签的情况下,确定所述目标账号在所述会话单元中的参与状态为参与会话;
在所述会话单元中未检测到所述目标账号对应的用户标签的情况下,确定所述目标账号在所述会话单元中的参与状态为未参与会话。
可选地,所述按照预设推荐方案,根据各个所述会话单元的交互标记,在各个所述会话单元中为所述目标账号确定目标单元,包括:
根据所述目标账号在第一单元中的参与率,确定所述目标账号与所述第一单元之间的第一匹配度,其中,所述第一单元为交互标记为第一标记的会话单元;
确定所述第一单元与第二单元之间的相似度,其中,所述第二单元为交互标记为第二标记的会话单元;
根据所述第一单元与所述第二单元之间的相似度,确定所述目标账号与所述第二单元之间的第一匹配度;
将所述第一匹配度大于或等于阈值的第一单元和/或第二单元作为目标单元。
可选地,所述推荐所述目标单元中的会话内容至所述目标账号对应的终端,包括:
依照多个所述第一匹配度的降序顺序,推荐所述目标单元中的会话内容至所述目标账号对应的终端,其中,所述目标单元为所述第一匹配度大于或等于阈值的第二单元。
可选地,获取目标账号的历史会话信息之前,所述方法还包括:
获取训练数据集,其中,所述训练数据集包括多个样本账号以及各个样本账号对应的样本会话信息,每个所述样本会话信息包括多个样本单元,每个所述样本单元包括多个用户标签和各个用户标签对应的会话内容,每个所述样本单元携带对应的会话标签;
根据所述样本账号在所述样本单元中的参与状态,对所述样本单元进行打标,得到所述样本单元相对于所述样本账号的交互标记,其中,一个所述样本单元相对于一个所述样本账号有一个交互标记;
将所述训练数据集中的数据分为多个分组;
依照分组顺序,根据各个所述样本账号对应的交互标记,确定每个分组内所述样本单元与所述样本账号之间的第二匹配度;
根据每个所述分组内的所述第二匹配度和所述样本单元的会话标签,确定所述分组对应的目标损失值;
在所述目标损失值满足预设条件的情况下,得到所述预设推荐方案,其中,所述预设条件用于指示所述目标损失值为最小值的情况。
可选地,所述将所述训练数据集中的数据分为多个分组,包括:
在所述训练数据集中,将所述样本账号的用户标签与所述样本单元的会话标签组合成数据对,其中,所述数据对携带所述样本单元相对于所述样本账号的交互标记,交互标记为第一标记或第二标记,所述第一标记用于表示所述样本账号在所述样本单元中参与会话,所述第二标记用于表示所述样本账号在所述样本单元中未参与会话;
随机选取多个交互标记为第一标记的数据对,得到多个第一数据对;
根据所述第一数据对中的用户标签,随机选取多个交互标记为第二标记的数据对,得到多个第二数据对,其中,每个所述第二数据对中的用户标签与所述第一数据对中的用户标签相匹配;
根据多个所述第一数据对和多个所述第二数据对,形成一个分组。
第二方面,本申请提供了一种会话推荐装置,包括:
信息获取模块,用于获取目标账号的历史会话信息,其中,所述历史会话信息包括多个会话单元,各个所述会话单元对应不同的交互时间段,所述会话单元包括多个用户标签和各个用户标签对应的会话内容;
打标模块,用于根据所述目标账号在各个所述会话单元中的参与状态,对各个所述会话单元进行打标,得到各个所述会话单元相对于所述目标账号的交互标记;
目标确定模块,用于按照预设推荐方案,根据各个所述会话单元的交互标记,在各个所述会话单元中为所述目标账号确定目标单元;
推荐模块,用于推荐所述目标单元中的会话内容至所述目标账号对应的终端。
一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取目标账号的历史会话信息,其中,所述历史会话信息包括多个会话单元,各个所述会话单元对应不同的交互时间段,所述会话单元包括多个用户标签和各个用户标签对应的会话内容;
根据所述目标账号在各个所述会话单元中的参与状态,对各个所述会话单元进行打标,得到各个所述会话单元相对于所述目标账号的交互标记;
按照预设推荐方案,根据各个所述会话单元的交互标记,在各个所述会话单元中为所述目标账号确定目标单元;
推荐所述目标单元中的会话内容至所述目标账号对应的终端。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取目标账号的历史会话信息,其中,所述历史会话信息包括多个会话单元,各个所述会话单元对应不同的交互时间段,所述会话单元包括多个用户标签和各个用户标签对应的会话内容;
根据所述目标账号在各个所述会话单元中的参与状态,对各个所述会话单元进行打标,得到各个所述会话单元相对于所述目标账号的交互标记;
按照预设推荐方案,根据各个所述会话单元的交互标记,在各个所述会话单元中为所述目标账号确定目标单元;
推荐所述目标单元中的会话内容至所述目标账号对应的终端。
上述会话推荐方法应用于推荐技术领域用于优化推荐算法,通常采用推荐系统为用户推荐可能感兴趣的内容,且推荐系统常根据大量的用户的历史行为数据为用户精准推荐其感兴趣的内容,用户的历史行为数据包括用户的点击操作、评价操作等,但在推荐系统初期用户的历史行为数据稀缺的情况下,无法为用户做个性化推荐,从而无法解决推荐系统的冷启动问题。
基于上述会话推荐方法只需获取用户的历史会话信息,用户的历史会话信息是指用户与其他用户之间的会话信息,将历史会话信息按照时间段划分为不同的会话单元,依照用户在每个会话单元中参与交互的情况,对每个会话单元进行打标,将打标后的会话单元作为特征参数提供给推荐系统,基于推荐系统中的预设推荐方案,根据会话单元打标后的交互标记,确定待推荐的目标单元,将目标单元中的会话内容推荐给用户终端进行展示,从而避免用户自行在众多历史交互信息中一一查找感兴趣的会话内容,根据用户的历史会话信息自动为用户推荐感兴趣的会话内容,提高了会话内容的查找效率,且由于本发明中无需获取用户的历史行为数据,在推荐系统初期用户的历史行为数据稀缺的情况下,根据用户的历史会话信息即可为用户做个性化的会话推荐,从而解决了推荐系统的冷启动问题。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为一个实施例中会话推荐方法的应用环境图;
图2为一个实施例中会话推荐方法的流程示意图;
图3为一个实施例中会话推荐装置的结构框图;
图4为一个实施例中计算机设备的内部结构图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
图1为一个实施例中会话推荐方法的应用环境图。参照图1,该会话推荐方法应用于会话推荐系统。该会话推荐系统包括终端110和服务器120。终端110和服务器120通过网络连接。终端110具体可以是台式终端或移动终端,移动终端具体可以为手机、平板电脑、笔记本电脑等中的至少一种。服务器120可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,图2为一个实施例中一种会话推荐方法的流程示意图,参照图2,提供了一种会话推荐方法。本实施例主要以该方法应用于上述图1中的服务器120来举例说明,该会话推荐方法具体包括如下步骤:
步骤S210,获取目标账号的历史会话信息,其中,所述历史会话信息包括多个会话单元,各个所述会话单元对应不同的交互时间段,所述会话单元包括多个用户标签和各个用户标签对应的会话内容。
在本实施例中,目标账号是指目标用户的社交账号,每个社交账号对应一个用户标签,用户标签用于在会话信息中指代用户身份,目标账号对应的历史会话信息包含该社交账号内所有的会话记录,按照不同的划分方式将历史会话信息划分为多个会话单元,每个会话单元中包括多个交互对象的用户标签以及各个交互对象所发的会话内容,每个用户标签用于指示一个交互对象,其中,划分方式包括按照时间段划分和按照信息条数划分,按照时间段划分就是将属于同一个时间段内的会话内容划分为一个会话单元,例如,时间段对应的起始时刻为0点,结束时刻为0点,起始时刻至结束时刻之间的时长为24小时,则将历史会话信息中的属于同一天的会话内容划分至一个会话单元内。按照信息条数划分就是将连续多个的会话内容划分为一个会话单元,例如,信息条数为10,则将10条连续的会话内容划分为一个会话单元。每个会话单元携带对应的会话标签。
步骤S220,根据所述目标账号在各个所述会话单元中的参与状态,对各个所述会话单元进行打标,得到各个所述会话单元相对于所述目标账号的交互标记。
在本实施例中,通常目标账号中包括多个群组,在不同的群组中,目标用户可能参与了群组的会话,目标用户也可能未参与群组的会话,目标账号在各个会话单元中的参与状态包括未参与会话和参与会话,根据目标账号在会话单元中的参与状态对会话单元进行打标,相当于是对会话单元进行分类,每个会话单元相对于目标账号的交互标记,相当于会话单元的分类标记。
步骤S230,按照预设推荐方案,根据各个所述会话单元的交互标记,在各个所述会话单元中为所述目标账号确定目标单元。
在本实施例中,预设推荐方案为任意能够实现推荐功能的推荐模型,推荐模型具体可以为但不仅限于协同过滤模型、LR模型、MF模型、DeepFM模型等,将会话单元的会话标签、交互标记、交互时间段和目标账号的用户标签作为推荐模型的输入参数,从而使推荐模型输出目标账号感兴趣的会话单元,目标账号感兴趣的会话单元为上述目标单元。
步骤S240,推荐所述目标单元中的会话内容至所述目标账号对应的终端。
在本实施例中,将目标单元中的会话内容推荐至目标账号对应的终端,以使目标账号对应的用户可以快速查阅感兴趣的会话信息。其中,目标账号对应的终端为登录目标账号的终端。
会话推荐方法常应用于职场交互场景,通常在工作过程中会收到不同同事发送的消息通知,但由于消息过多,工作人员容易遗忘已经查阅过的会话内容,现有技术中若用户后续想了解之前交互过的会话内容,只能从历史会话信息中一一查找感兴趣的会话内容,而基于本发明的会话推荐方法,可根据历史会话信息为用户推荐感兴趣的会话内容,便于用户快速查阅感兴趣的历史会话信息,为用户办公提供了便利,为用户节约了翻阅聊天记录查找的时间,从而提高了用户的办公效率。
目标单元的会话内容通过终端内交互软件中的插件进行展示,用户点击交互软件内的插件从而获取推荐系统推荐的会话内容,在用户未点击插件的情况下,折叠隐藏所有待推荐的会话内容,避免遮挡交互软件中的正常交互界面,保证用户正常的交互过程。
在一个实施例中,所述根据所述目标账号在各个所述会话单元中的参与状态,对各个所述会话单元进行打标,得到各个所述会话单元相对于所述目标账号的交互标记,包括:根据所述会话单元中的用户标签与所述目标账号对应的用户标签的比对结果,确定所述目标账号在所述会话单元中的参与状态;在所述参与状态为参与会话的情况下,将所述会话单元的交互标记设为第一标记;在所述参与状态为未参与会话的情况下,将所述会话单元的交互标记设为第二标记,其中,所述第二标记对应的内容与所述第一标记对应的内容不同。
在本实施例中,将会话单元中的用户标签与所述目标账号的用户标签进行比对,从而确定用户在会话单元中的参与状态和参与率,参与状态用于确定用户是否参与交互,参与率用于确定用户对于会话单元中会话内容的偏好程度,将参与状态为参与会话的会话单元标上第一标记,将参与状态为未参与会话的会话单元标上第二标记,第一标记与第二标记对应不同的标记内容,标记内容具体可以为数字标记、符合标记、文字标记或图像标记等,例如,设定标记内容为数据标记,第一标记为1,第二标记为0。
在一个实施例中,所述根据所述会话单元中的用户标签与所述目标账号对应的用户标签的比对结果,确定所述目标账号在所述会话单元中的参与状态,包括:在所述会话单元中检测到所述目标账号对应的用户标签的情况下,确定所述目标账号在所述会话单元中的参与状态为参与会话;在所述会话单元中未检测到所述目标账号对应的用户标签的情况下,确定所述目标账号在所述会话单元中的参与状态为未参与会话。
在本实施例中,在所述会话单元中检测到所述目标账号对应的用户标签的情况下,相当于会话单元内的多个用户标签中存在与目标账号相匹配的用户标签,表示用户在会话单元中参与了会话交互,从而确定参与状态为参与会话;在所述会话单元中未检测到所述目标账号对应的用户标签的情况下,表示用户在会话单元中没有参与会话交互,因此在会话单元内的多个用户标签中无法检测到与目标账号相匹配的用户标签,从而确定参与状态为未参与会话。
在一个实施例中,所述按照预设推荐方案,根据各个所述会话单元的交互标记,在各个所述会话单元中为所述目标账号确定目标单元,包括:根据所述目标账号在第一单元中的参与率,确定所述目标账号与所述第一单元之间的第一匹配度,其中,所述第一单元为交互标记为第一标记的会话单元;确定所述第一单元与第二单元之间的相似度,其中,所述第二单元为交互标记为第二标记的会话单元;根据所述第一单元与所述第二单元之间的相似度,确定所述目标账号与所述第二单元之间的第一匹配度;将所述第一匹配度大于或等于阈值的第一单元和/或第二单元作为目标单元。
在本实施例中,根据所述会话单元中的用户标签与所述目标账号对应的用户标签的比对结果,确定目标账号在所述会话单元中的参与率,即根据会话单元中与目标账号相匹配的用户标签的第一数量,与会话单元中全部的用户标签的第二数量之间的比值,以此确定目标账号在会话单元中的参与率,参与率越高表示用户对于会话单元中的会话内容的偏好程度越高,参与率越低表示用户对于会话单元中的会话内容的偏好程度越低。
目标账号在第一单元中的参与率越高,目标账号与第一单元之间的第一匹配度越高;目标账号在第一单元中的参与率越低,目标账号与第一单元之间的第一匹配度越低。将第一单元中的会话内容与第二单元中的会话内容进行匹配,确定第一单元与第二单元之间的相似度,根据第一单元与第二单元之间的相似度,预估目标账号与第二单元之间的第一匹配度,根据各个第一匹配度与阈值之间的比对结果,筛选出满足阈值要求的第一单元和/或第二单元作为目标单元,其中,阈值可根据实际场景需求自定义,阈值越高,待推荐的会话内容越少,用户不感兴趣的内容越少;阈值越低,待推荐的会话内容越多,用户不感兴趣的内容越多。
在一个实施例中,所述推荐所述目标单元中的会话内容至所述目标账号对应的终端,包括:依照多个所述第一匹配度的降序顺序,推荐所述目标单元中的会话内容至所述目标账号对应的终端,其中,所述目标单元为所述第一匹配度大于或等于阈值的第二单元。
在本实施例中,依照第一匹配度的降序顺序,依次推荐第二单元中的会话内容至终端,即为用户推荐其感兴趣但并未参与会话交互的会话内容,由于用户对于参与会话交互的会话内容通常留有印象,往往用户可根据记忆查找到历史会话内容,但对于未参与会话交互的会话内容印象较浅,因此,为用户推荐其并未参与交互但感兴趣的会话内容,帮助用户快速查阅历史会话内容。
在一个实施例中,获取目标账号的历史会话信息之前,所述方法还包括:获取训练数据集,其中,所述训练数据集包括多个样本账号以及各个样本账号对应的样本会话信息,每个所述样本会话信息包括多个样本单元,每个所述样本单元包括多个用户标签和各个用户标签对应的会话内容,每个所述样本单元携带对应的会话标签;根据所述样本账号在所述样本单元中的参与状态,对所述样本单元进行打标,得到所述样本单元相对于所述样本账号的交互标记,其中,一个所述样本单元相对于一个所述样本账号有一个交互标记;将所述训练数据集中的数据分为多个分组;依照分组顺序,根据各个所述样本账号对应的交互标记,确定每个分组内所述样本单元与所述样本账号之间的第二匹配度;根据每个所述分组内的所述第二匹配度和所述样本单元的会话标签,确定所述分组对应的目标损失值;在所述目标损失值满足预设条件的情况下,得到所述预设推荐方案,其中,所述预设条件用于指示所述目标损失值为最小值的情况。
在本实施例中,通过训练数据集训练推荐模型,在训练数据集中的数据输入至初始模型之前,需要对训练数据集中的样本单元进行打标,即根据不同样本账号在各个样本单元中的参与情况,对每个样本单元针对不同的样本账号进行打标,也就是每个样本单元携带多个交互标记,每个交互标记对应一个样本账号,由于不同的样本账号可能属于一个社交群组,由于各个样本账号对应的样本会话信息中可能存在相同的样本单元,在同一样本单元中,有的样本账号参与会话交互,有的样本账号未参与会话交互,所以,对于同一样本单元针对不同的样本账号会有不同的交互标记。
分批次将训练数据集中的数据输入至初始模型中,输入至初始模型的数据包括样本单元的交互标记、会话标签、样本单元中的用户标签以及样本账号,根据初始模型得到各个样本单元与各个样本账号之间的第二匹配度,第二匹配度用于表示样本单元对于样本账号的偏好概率。
根据每个分组得到的第二匹配度确定初始函数的目标损失值,计算公式如下:
Figure 370015DEST_PATH_IMAGE001
其中,
Figure 234066DEST_PATH_IMAGE002
为sigmoid函数,O表示一个包含多种数据组合方式的数据集合,
Figure 782859DEST_PATH_IMAGE003
Figure 339743DEST_PATH_IMAGE004
代表 u与i之间的数据组合,
Figure 324885DEST_PATH_IMAGE005
代表 u与j之间的数据组合,u用于指示样本账号,即对应用户,i用于指示相对于样本账号交互标记为1的会话单元,j用于指示相对于样本账号交互标记为0的会话单元,即会话单元的交互标记为0或1,
Figure 258206DEST_PATH_IMAGE006
为模型预估的第二匹配度,即样本账号u对于i会话单元的偏好分数;同理,
Figure 395926DEST_PATH_IMAGE007
表示样本账号u对于j会话单元的偏好分数。
再通过优化算法对模型进行优化训练,即逐渐降低目标损失值,从而对模型中的权重进行更新,在目标损失值满足预设条件的情况下,得到推荐模型,即上述预设推荐方案。预设条件用于指示目标损失值达到最小值的情况。其中,优化算法包括但不仅限于随机梯度下降算法、批量梯度下降法和共轭梯度法。
在一个实施例中,所述将所述训练数据集中的数据分为多个分组,包括:在所述训练数据集中,将所述样本账号的用户标签与所述样本单元的会话标签组合成数据对,其中,所述数据对携带所述样本单元相对于所述样本账号的交互标记,交互标记为第一标记或第二标记,所述第一标记用于表示所述样本账号在所述样本单元中参与会话,所述第二标记用于表示所述样本账号在所述样本单元中未参与会话;随机选取多个交互标记为第一标记的数据对,得到多个第一数据对;根据所述第一数据对中的用户标签,随机选取多个交互标记为第二标记的数据对,得到多个第二数据对,其中,每个所述第二数据对中的用户标签与所述第一数据对中的用户标签相匹配;根据多个所述第一数据对和多个所述第二数据对,形成一个分组。
在本实施例中,分批次将待训练的样本数据输入至初始模型中,按批来更新初始模型中的参数,这样,一个批中的一组数据共同决定了本次梯度的方向,训练起来不容易跑偏,减少了随机性。另一方面因为批的样本数与整个数据集相比小了很多,减少了模型每次训练的计算量。
数据对记为(用户标签,会话标签),在训练数据集中随机选取N个交互标记为1的第一数据对,依照第一数据对中的用户标签,随机选取N个交互标记为0的第二数据对,即参照第一数据对中的样本账号,选取针对该样本账号的交互标记为0的会话单元,也就是N个第一数据对和N个第二数据对形成一个分组,一个分组的数据输入至初始模型中,输出2N个第二匹配度,即输入的每个数据对都会对应一个第二匹配度。
图2为一个实施例中会话推荐方法的流程示意图。应该理解的是,虽然图2的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图3所示,提供了一种会话推荐装置,包括:
信息获取模块310,用于获取目标账号的历史会话信息,其中,所述历史会话信息包括多个会话单元,各个所述会话单元对应不同的交互时间段,所述会话单元包括多个用户标签和各个用户标签对应的会话内容;
打标模块320,用于根据所述目标账号在各个所述会话单元中的参与状态,对各个所述会话单元进行打标,得到各个所述会话单元相对于所述目标账号的交互标记;
目标确定模块330,用于按照预设推荐方案,根据各个所述会话单元的交互标记,在各个所述会话单元中为所述目标账号确定目标单元;
推荐模块340,用于推荐所述目标单元中的会话内容至所述目标账号对应的终端。
在一个实施例中,所述打标模块320还用于:
根据所述会话单元中的用户标签与所述目标账号对应的用户标签的比对结果,确定所述目标账号在所述会话单元中的参与状态;
在所述参与状态为参与会话的情况下,将所述会话单元的交互标记设为第一标记;
在所述参与状态为未参与会话的情况下,将所述会话单元的交互标记设为第二标记,其中,所述第二标记对应的内容与所述第一标记对应的内容不同。
在一个实施例中,所述打标模块320还用于:
在所述会话单元中检测到所述目标账号对应的用户标签的情况下,确定所述目标账号在所述会话单元中的参与状态为参与会话;
在所述会话单元中未检测到所述目标账号对应的用户标签的情况下,确定所述目标账号在所述会话单元中的参与状态为未参与会话。
在一个实施例中,所述目标确定模块330还用于:
根据所述目标账号在第一单元中的参与率,确定所述目标账号与所述第一单元之间的第一匹配度,其中,所述第一单元为交互标记为第一标记的会话单元;
确定所述第一单元与第二单元之间的相似度,其中,所述第二单元为交互标记为第二标记的会话单元;
根据所述第一单元与所述第二单元之间的相似度,确定所述目标账号与所述第二单元之间的第一匹配度;
将所述第一匹配度大于或等于阈值的第一单元和/或第二单元作为目标单元。
在一个实施例中,所述推荐模块340还用于:
依照多个所述第一匹配度的降序顺序,推荐所述目标单元中的会话内容至所述目标账号对应的终端,其中,所述目标单元为所述第一匹配度大于或等于阈值的第二单元。
在一个实施例中,所述装置还包括训练模块,所述训练模块用于:
获取训练数据集,其中,所述训练数据集包括多个样本账号以及各个样本账号对应的样本会话信息,每个所述样本会话信息包括多个样本单元,每个所述样本单元包括多个用户标签和各个用户标签对应的会话内容,每个所述样本单元携带对应的会话标签;
根据所述样本账号在所述样本单元中的参与状态,对所述样本单元进行打标,得到所述样本单元相对于所述样本账号的交互标记,其中,一个所述样本单元相对于一个所述样本账号有一个交互标记;
将所述训练数据集中的数据分为多个分组;
依照分组顺序,根据各个所述样本账号对应的交互标记,确定每个分组内所述样本单元与所述样本账号之间的第二匹配度;
根据每个所述分组内的所述第二匹配度和所述样本单元的会话标签,确定所述分组对应的目标损失值;
在所述目标损失值满足预设条件的情况下,得到所述预设推荐方案,其中,所述预设条件用于指示所述目标损失值为最小值的情况。
在一个实施例中,所述训练模块还用于:
在所述训练数据集中,将所述样本账号的用户标签与所述样本单元的会话标签组合成数据对,其中,所述数据对携带所述样本单元相对于所述样本账号的交互标记,交互标记为第一标记或第二标记,所述第一标记用于表示所述样本账号在所述样本单元中参与会话,所述第二标记用于表示所述样本账号在所述样本单元中未参与会话;
随机选取多个交互标记为第一标记的数据对,得到多个第一数据对;
根据所述第一数据对中的用户标签,随机选取多个交互标记为第二标记的数据对,得到多个第二数据对,其中,每个所述第二数据对中的用户标签与所述第一数据对中的用户标签相匹配;
根据多个所述第一数据对和多个所述第二数据对,形成一个分组。
图4示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是图1中的服务器120。如图4所示,该计算机设备包括该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、输入装置和显示屏。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现会话推荐方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行会话推荐方法。计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图4中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,本申请提供的会话推荐装置可以实现为一种计算机程序的形式,计算机程序可在如图4所示的计算机设备上运行。计算机设备的存储器中可存储组成该会话推荐装置的各个程序模块,比如,图3所示的信息获取模块310、打标模块320、目标确定模块330和推荐模块340。各个程序模块构成的计算机程序使得处理器执行本说明书中描述的本申请各个实施例的会话推荐方法中的步骤。
图4所示的计算机设备可以通过如图3所示的会话推荐装置中的信息获取模块310执行获取目标账号的历史会话信息,其中,所述历史会话信息包括多个会话单元,各个所述会话单元对应不同的交互时间段,所述会话单元包括多个用户标签和各个用户标签对应的会话内容。计算机设备可通过打标模块320执行根据所述目标账号在各个所述会话单元中的参与状态,对各个所述会话单元进行打标,得到各个所述会话单元相对于所述目标账号的交互标记。计算机设备可通过目标确定模块330执行按照预设推荐方案,根据各个所述会话单元的交互标记,在各个所述会话单元中为所述目标账号确定目标单元。计算机设备可通过推荐模块340执行推荐所述目标单元中的会话内容至所述目标账号对应的终端。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述任一项实施例所述的方法。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述任一项实施例所述的方法。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指示相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双倍速率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink) DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本发明的具体实施方式,使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种会话推荐方法,其特征在于,所述方法包括:
获取目标账号的历史会话信息,其中,所述历史会话信息包括多个会话单元,各个所述会话单元对应不同的交互时间段,所述会话单元包括多个用户标签和各个用户标签对应的会话内容;
根据所述目标账号在各个所述会话单元中的参与状态,对各个所述会话单元进行打标,得到各个所述会话单元相对于所述目标账号的交互标记;
按照预设推荐方案,根据各个所述会话单元的交互标记,在各个所述会话单元中为所述目标账号确定目标单元;
推荐所述目标单元中的会话内容至所述目标账号对应的终端。
2.根据权利要求1所述的方法,其特征在于,所述根据所述目标账号在各个所述会话单元中的参与状态,对各个所述会话单元进行打标,得到各个所述会话单元相对于所述目标账号的交互标记,包括:
根据所述会话单元中的用户标签与所述目标账号对应的用户标签的比对结果,确定所述目标账号在所述会话单元中的参与状态;
在所述参与状态为参与会话的情况下,将所述会话单元的交互标记设为第一标记;
在所述参与状态为未参与会话的情况下,将所述会话单元的交互标记设为第二标记,其中,所述第二标记对应的内容与所述第一标记对应的内容不同。
3.根据权利要求2所述的方法,其特征在于,所述根据所述会话单元中的用户标签与所述目标账号对应的用户标签的比对结果,确定所述目标账号在所述会话单元中的参与状态,包括:
在所述会话单元中检测到所述目标账号对应的用户标签的情况下,确定所述目标账号在所述会话单元中的参与状态为参与会话;
在所述会话单元中未检测到所述目标账号对应的用户标签的情况下,确定所述目标账号在所述会话单元中的参与状态为未参与会话。
4.根据权利要求2所述的方法,其特征在于,所述按照预设推荐方案,根据各个所述会话单元的交互标记,在各个所述会话单元中为所述目标账号确定目标单元,包括:
根据所述目标账号在第一单元中的参与率,确定所述目标账号与所述第一单元之间的第一匹配度,其中,所述第一单元为交互标记为第一标记的会话单元;
确定所述第一单元与第二单元之间的相似度,其中,所述第二单元为交互标记为第二标记的会话单元;
根据所述第一单元与所述第二单元之间的相似度,确定所述目标账号与所述第二单元之间的第一匹配度;
将所述第一匹配度大于或等于阈值的第一单元和/或第二单元作为目标单元。
5.根据权利要求4所述的方法,其特征在于,所述推荐所述目标单元中的会话内容至所述目标账号对应的终端,包括:
依照多个所述第一匹配度的降序顺序,推荐所述目标单元中的会话内容至所述目标账号对应的终端,其中,所述目标单元为所述第一匹配度大于或等于阈值的第二单元。
6.根据权利要求1所述的方法,其特征在于,获取目标账号的历史会话信息之前,所述方法还包括:
获取训练数据集,其中,所述训练数据集包括多个样本账号以及各个样本账号对应的样本会话信息,每个所述样本会话信息包括多个样本单元,每个所述样本单元包括多个用户标签和各个用户标签对应的会话内容,每个所述样本单元携带对应的会话标签;
根据所述样本账号在所述样本单元中的参与状态,对所述样本单元进行打标,得到所述样本单元相对于所述样本账号的交互标记,其中,一个所述样本单元相对于一个所述样本账号有一个交互标记;
将所述训练数据集中的数据分为多个分组;
依照分组顺序,根据各个所述样本账号对应的交互标记,确定每个分组内所述样本单元与所述样本账号之间的第二匹配度;
根据每个所述分组内的所述第二匹配度和所述样本单元的会话标签,确定所述分组对应的目标损失值;
在所述目标损失值满足预设条件的情况下,得到所述预设推荐方案,其中,所述预设条件用于指示所述目标损失值为最小值的情况。
7.根据权利要求6所述的方法,其特征在于,所述将所述训练数据集中的数据分为多个分组,包括:
在所述训练数据集中,将所述样本账号的用户标签与所述样本单元的会话标签组合成数据对,其中,所述数据对携带所述样本单元相对于所述样本账号的交互标记,交互标记为第一标记或第二标记,所述第一标记用于表示所述样本账号在所述样本单元中参与会话,所述第二标记用于表示所述样本账号在所述样本单元中未参与会话;
随机选取多个交互标记为第一标记的数据对,得到多个第一数据对;
根据所述第一数据对中的用户标签,随机选取多个交互标记为第二标记的数据对,得到多个第二数据对,其中,每个所述第二数据对中的用户标签与所述第一数据对中的用户标签相匹配;
根据多个所述第一数据对和多个所述第二数据对,形成一个分组。
8.一种会话推荐装置,其特征在于,所述装置包括:
信息获取模块,用于获取目标账号的历史会话信息,其中,所述历史会话信息包括多个会话单元,各个所述会话单元对应不同的交互时间段,所述会话单元包括多个用户标签和各个用户标签对应的会话内容;
打标模块,用于根据所述目标账号在各个所述会话单元中的参与状态,对各个所述会话单元进行打标,得到各个所述会话单元相对于所述目标账号的交互标记;
目标确定模块,用于按照预设推荐方案,根据各个所述会话单元的交互标记,在各个所述会话单元中为所述目标账号确定目标单元;
推荐模块,用于推荐所述目标单元中的会话内容至所述目标账号对应的终端。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述方法的步骤。
CN202110628877.5A 2021-06-07 2021-06-07 会话推荐方法、装置、计算机设备和存储介质 Pending CN113076414A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110628877.5A CN113076414A (zh) 2021-06-07 2021-06-07 会话推荐方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110628877.5A CN113076414A (zh) 2021-06-07 2021-06-07 会话推荐方法、装置、计算机设备和存储介质

Publications (1)

Publication Number Publication Date
CN113076414A true CN113076414A (zh) 2021-07-06

Family

ID=76617093

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110628877.5A Pending CN113076414A (zh) 2021-06-07 2021-06-07 会话推荐方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN113076414A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115022262A (zh) * 2022-05-30 2022-09-06 北京字跳网络技术有限公司 一种会话处理方法、装置、设备及介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160063993A1 (en) * 2014-09-02 2016-03-03 Microsoft Corporation Facet recommendations from sentiment-bearing content
CN110399553A (zh) * 2019-06-28 2019-11-01 南京工业大学 一种基于对抗学习的会话推荐列表生成方法
CN110647621A (zh) * 2019-09-27 2020-01-03 支付宝(杭州)信息技术有限公司 机器人客服引导对话中选择话术的方法和装置
CN111259243A (zh) * 2020-01-14 2020-06-09 中山大学 基于会话的并行推荐方法及系统
CN111538912A (zh) * 2020-07-07 2020-08-14 腾讯科技(深圳)有限公司 内容推荐方法、装置、设备及可读存储介质
CN112769673A (zh) * 2019-11-05 2021-05-07 钉钉控股(开曼)有限公司 沟通记录的生成、推荐和展示方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160063993A1 (en) * 2014-09-02 2016-03-03 Microsoft Corporation Facet recommendations from sentiment-bearing content
CN110399553A (zh) * 2019-06-28 2019-11-01 南京工业大学 一种基于对抗学习的会话推荐列表生成方法
CN110647621A (zh) * 2019-09-27 2020-01-03 支付宝(杭州)信息技术有限公司 机器人客服引导对话中选择话术的方法和装置
CN112769673A (zh) * 2019-11-05 2021-05-07 钉钉控股(开曼)有限公司 沟通记录的生成、推荐和展示方法及装置
CN111259243A (zh) * 2020-01-14 2020-06-09 中山大学 基于会话的并行推荐方法及系统
CN111538912A (zh) * 2020-07-07 2020-08-14 腾讯科技(深圳)有限公司 内容推荐方法、装置、设备及可读存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115022262A (zh) * 2022-05-30 2022-09-06 北京字跳网络技术有限公司 一种会话处理方法、装置、设备及介质
CN115022262B (zh) * 2022-05-30 2024-06-11 北京字跳网络技术有限公司 一种会话处理方法、装置、设备及介质

Similar Documents

Publication Publication Date Title
CN108763502B (zh) 信息推荐方法和系统
CN108763314B (zh) 一种兴趣推荐方法、装置、服务器及存储介质
CN110162717B (zh) 一种推荐好友的方法和设备
US20090327054A1 (en) Personal reputation system based on social networking
US20150101008A1 (en) Reputation System in a Default Network
CN110110201B (zh) 一种内容推荐方法和系统
CN106980703A (zh) 用于群组搜索的方法及装置、电子设备、计算机可读介质
CN109688479B (zh) 一种弹幕显示方法、弹幕显示装置和弹幕显示服务器
WO2014134155A1 (en) Candidate and job trending in employment system
WO2018145577A1 (zh) 表情推荐方法和装置
CN110413867B (zh) 用于内容推荐的方法及系统
US20220027333A1 (en) A System, Method and Data Structure for Allowing Users to Electronically Post Comments
US11323404B2 (en) System and method for displaying message or user lists
US9331973B1 (en) Aggregating content associated with topics in a social network
CN113869931A (zh) 广告投放策略确定方法、装置、计算机设备和存储介质
JP5228584B2 (ja) 興味情報特定システム、興味情報特定方法、および興味情報特定用プログラム
CN113778286A (zh) 应用控件显示方法、装置、存储介质及电子设备
CN110347314A (zh) 一种内容展示方法、装置、存储介质和计算机设备
JP7206761B2 (ja) 情報処理装置
CN108810577B (zh) 一种用户画像的构建方法、装置及电子设备
CN111242690A (zh) 广告图片的测评方法、装置、存储介质及计算机设备
CN113076414A (zh) 会话推荐方法、装置、计算机设备和存储介质
CN113111198A (zh) 基于协同过滤算法的演示文稿推荐方法及相关设备
CN111159575A (zh) 一种基于手机银行的交友方法及装置
CN114491093B (zh) 多媒体资源推荐、对象表征网络的生成方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210706

RJ01 Rejection of invention patent application after publication