CN113486260A

CN113486260A - 互动信息的生成方法、装置、计算机设备及存储介质

Info

Publication number: CN113486260A
Application number: CN202110801366.9A
Authority: CN
Inventors: 徐宁文; 李忆纯; 徐涵煜; 梁思; 程兵
Original assignee: Beijing Sankuai Online Technology Co Ltd
Current assignee: Beijing Sankuai Online Technology Co Ltd
Priority date: 2021-07-15
Filing date: 2021-07-15
Publication date: 2021-10-08
Anticipated expiration: 2041-07-15
Also published as: CN113486260B

Abstract

本申请公开了一种互动信息的生成方法、装置、计算机设备及存储介质，涉及人机交互技术领域。该方法包括：获取用户帐号的用户发布信息；根据用户发布信息，通过n个不同的互动信息生成模型生成m条候选互动信息，互动信息生成模型为用于生成候选互动信息的神经网络模型，候选互动信息为对于用户发布信息的候选回复信息，n为大于1的整数；在m条候选互动信息中选择出一条候选互动信息，确定为正式互动信息；在用户发布信息的信息流中推送正式互动信息。本申请提供了一种通过多个不同的互动信息生成模型生成候选互动信息，将其中质量最佳的候选互动信息确定为正式互动信息并进行推送的互动信息的生成方法，提升了互动信息的准确性与多样性。

Description

互动信息的生成方法、装置、计算机设备及存储介质

技术领域

本申请涉及人机交互技术领域，特别涉及一种互动信息的生成方法、装置、计算机设备及存储介质。

背景技术

随着互联网的发展，越来越多的用户选择在内容社区中分享自己的生活与喜好。为了使得内容社区的互动量增加，且互动氛围更加积极，自动生成互动信息是一种高效的、具有较强可持续性的方案。

相关技术中采用递归神经网络(RNN，Recursive Neural Network)自动生成文本。然而使用递归神经网络生成文本的方法只能对文本的单个特征进行控制，例如文本的情感，导致文本的准确度不高，且较为单调。

如何在互动平台的应用场景中使得自动生成的互动信息具有较高的准确性和多样性，是需要解决的问题。

发明内容

本申请实施例提供了一种互动信息的生成方法、装置、计算机设备及存储介质，能够提高生成的互动信息的准确性和多样性。所述技术方案如下：

一方面，提供了一种互动信息的生成方法，所述方法包括：

获取用户帐号的用户发布信息；

根据所述用户发布信息，通过n个不同的互动信息生成模型生成m条候选互动信息，所述互动信息生成模型为用于生成所述候选互动信息的神经网络模型，所述候选互动信息为对于所述用户发布信息的候选回复信息，n为大于1的整数，m为大于或者等于n的整数；

在所述m条候选互动信息中选择出一条候选互动信息，确定为正式互动信息；

在所述用户发布信息的信息流中推送所述正式互动信息。

另一方面，提供了一种互动信息的生成装置，所述装置包括：

获取模块，用于获取用户帐号的用户发布信息；

生成模块，用于根据所述用户发布信息，通过n个不同的互动信息生成模型生成m条候选互动信息，所述互动信息生成模型为用于生成所述候选互动信息的神经网络模型，所述候选互动信息为对于所述用户发布信息的候选回复信息，n为大于1的整数，m为大于或者等于n的整数；

确定模块，用于在所述m条候选互动信息中选择出一条候选互动信息，确定为正式互动信息；

推送模块，用于在所述用户发布信息的信息流中推送所述正式互动信息。

另一方面，提供了一种计算机设备，所述计算机设备包括处理器和存储器，所述存储器中存储有至少一段程序，所述至少一段程序由所述处理器加载并执行以实现如上述本申请实施例中任一所述的互动信息的生成方法。

另一方面，提供了一种计算机可读存储介质，所述存储介质中存储有计算机指令，所述计算机指令由处理器加载并执行以实现如本申请各个方面提供的互动信息的生成方法。

另一方面，提供了一种计算机程序产品，该计算机程序产品包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述互动信息的生成方法。

本申请实施例提供的技术方案带来的有益效果至少包括：

通过调用多个不同的互动信息生成模型，生成多条候选互动信息；再根据质量控制规则在多条候选互动信息中选取一条候选互动信息，确定为正式互动信息并将其推送至用户发布信息的信息流中，解决了单一模型生成的互动信息准确度差、多样性差的问题。通过多个互动信息生成模型分别生成的互动信息再加以质量控制手段，提升了互动信息的准确度，也丰富了互动信息的表达，提供了一种准确性高且持续性强的互动信息生成方法。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请一个示例性实施例提供的一种计算机系统的结构框图；

图2是本申请一个示例性实施例提供的互动信息的生成方法的流程示意图；

图3是本申请一个示例性实施例提供的互动信息的生成方法的整体架构示意图；

图4是本申请一个示例性实施例提供的互动信息的生成方法的流程示意图；

图5是本申请一个示例性实施例提供的匹配式模型的结构示意图；

图6是本申请一个示例性实施例提供的模板式模型的结构示意图；

图7是本申请一个示例性实施例提供的生成式模型的结构示意图；

图8是本申请一个示例性实施例提供的推送正式互动信息的流程示意图；

图9是本申请一个示例性实施例提供的确定回复等待时间的流程示意图；

图10是本申请一个示例性实施例提供的确定点赞等待时间的流程示意图；

图11是本申请一个示例性实施例提供的互动信息的生成装置的结构框图；

图12是本申请一个示例性实施例提供的终端的结构框图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请实施方式作进一步地详细描述。

图1示出了本申请一个示例性实施例提供的计算机系统的结构框图。该计算机系统100包括：终端120和服务器140。

终端120能够是智能手机、游戏主机、台式计算机、平板电脑、电子书阅读器、MP3(Moving Picture Experts Group Audio Layer III，动态影像专家压缩标准音频层面3)播放器或MP4(Moving Picture Experts Group Audio Layer IV，动态影像专家压缩标准音频层面4)播放器，膝上型便携计算机，智能机器人，自助支付设备中的至少一种。终端120安装和运行有支持用户发布信息的获取和互动信息的推送的应用程序，例如，该应用程序能够是系统应用、搜索引擎、新闻推送应用、购物应用、社交应用，等等。

终端120通过无线网络或有线网络与服务器140相连。

服务器140包括一台服务器、多台服务器、云计算平台和虚拟化中心中的至少一种。服务器140用于为客户端提供后台服务。可选地，服务器140承担主要计算工作，终端承担次要计算工作；或者，服务器140承担次要计算工作，终端承担主要计算工作；或者，服务器140和终端之间采用分布式计算架构进行协同计算。

本领域技术人员能够知晓，上述终端120、服务器140的数量能够更多或更少。比如上述终端120、服务器140能够仅为一个，或者上述终端120、服务器140为几十个或几百个，或者更多数量，本申请实施例对终端或服务器的数量和设备类型不加以限定。

相关技术中，采用递归神经网络自动生成互动信息。然而该方法仅能对生成的互动信息的单个特征进行控制，导致生成的互动信息的准确度不高，用户感知度差；此外，该方法生成的互动信息较为单调，在个性化和多样性方面表现不佳，这会导致自动生成互动信息的可持续性较低。本申请中通过多个不同的模型生成对于用户发布信息的候选互动信息，基于质量控制手段在多条候选互动信息中择优推送，既能提升语义理解的准确度，也能改善互动信息在多样性方面的表现。

图2示出了本申请一个示例性实施例提供的互动信息的生成方法的流程图。如图2所示，该方法包括：

步骤220：获取用户帐号的用户发布信息；

用户发布信息为用户帐号发表的信息，即待互动的内容信息。用户发布信息可以为文字、图片、视频，等等。

示例性的，在社交平台上，用户发布信息可以是用户帐号分享的日常生活动态；在点评网站中，用户发布信息可以是用户帐号对商家或商品的评价；在问答场景中，用户发布信息可以是用户帐号提出的待回答的问题，等等。

在获取用户帐号的用户发布信息时，可以根据预设规则对用户发布信息进行筛选，例如，对用户发布信息中文本的字数、用户发布信息中图片的数量、用户帐号的等级设置阈值，等等。

示例性的，设置选择目标用户发布信息的规则为文本的字数达到15字以上；或者，设置选择目标用户发布信息的规则为用户帐号等级达到3级；或者，设置选择目标用户发布信息的规则为用户帐号累计发布的历史信息达到十条，等等。

本申请对用户发布信息的内容和形式不加以限制，对用户发布信息的选择方式也不加以限制。

步骤240：根据用户发布信息，通过n个不同的互动信息生成模型分别生成m条候选互动信息，n为大于1的整数，m为大于或者等于n的整数；

候选互动信息为对于用户发布信息的候选的回复信息。

互动信息生成模型为用于生成候选互动信息的神经网络模型。

示例性的，互动信息生成模型为匹配式模型，匹配式模型为基于历史互动信息候选集生成所述候选互动信息的神经网络模型。

示例性的，互动信息生成模型为模板式模型，模板式模型为基于模板生成所述候选互动信息的模型。

示例性的，互动信息生成模型为生成式模型，生成式模型为基于Seq2Seq神经网络的模型。

可选地，基于一个互动信息生成模型生成1条或者多条候选互动信息。

示例性的，通过前述任意2个不同的互动信息生成模型生成至少2条候选互动信息；或者，通过前述3个不同的互动信息生成模型生成至少3条候选互动信息。

本申请对n、m的数值大小以及互动信息生成模型的种类不加以限制。

步骤260：在m条候选互动信息中选择出一条候选互动信息，确定为正式互动信息；

在通过n个不同的互动信息模型生成了m条候选互动信息后，从中选择出一条候选互动信息，确定为正式互动信息。

示例性的，对候选互动信息按照质量控制规则进行打分；对候选互动信息的打分进行排序，将具有最高打分的候选互动信息确定为正式互动信息，质量控制规则为基于候选互动信息的质量对候选互动信息进行筛选的规则，候选互动信息的质量可能包括单个或多个维度的质量。

示例性的，质量控制规则的设置基于如下维度中的至少之一：情感分析维度、符合程度分析维度、参数分析维度。情感分析维度的质量控制规则用于筛选符合正面情感的候选互动信息；符合程度分析维度的质量控制规则用于筛选与用户发布内容的符合程度高的候选互动信息；参数分析维度的质量控制规则用于基于候选互动信息的基本参数筛选质量好的候选互动信息，基本参数包括有例如准确度、多样性、互动率等方面。

本申请对在m条候选互动信息中选择出一条候选互动信息作为正式互动信息的质量控制方式不加以限制。

步骤280：在用户发布信息的信息流中推送正式互动信息。

从候选互动信息中确定正式互动信息后，将正式互动信息的内容、推送该正式互动信息的互动帐号、推送该正式互动信息的时间整合起来，构建完整的正式互动信息，而后在用户发布信息的信息流中推送该正式互动信息。

示例性的，在社交平台上，将正式互动信息推送为用户帐号发布的日常生活动态的评论；在点评网站上，将正式互动信息推送为用户帐号发布的对商家或商品的评价的回复；在问答场景中，将正式互动信息推送为用户帐号提出的待回答问题的答案。

可选地，正式互动信息除了通过互动信息生成模型生成的互动信息外，还可能为对于用户发布信息的点赞等形式的互动信息。本申请对互动信息的形式不加以限制。

可选地，在满足推送频率条件的情况下，在用户发布信息的信息流中推送正式互动信息，推送频率条件用于限制正式互动信息发送的次数或时间。

可选地，预先设置最短互动时间，最短互动时间为两次互动间需要间隔的最小时间。将预先设置的最短互动时间与发送正式互动信息的互动帐号上次发生互动时距离当前时间已间隔时间的时间差确定为第一时间差；将预先设置的最短互动时间与用户发表信息上次发生互动时距离当前时间已间隔时间的时间差确定为第二时间差。将第一时间差和第二时间差中较大的一个，确定为正式互动信息的发送等待时间；在经过发送等待时间之后，在用户发布信息的信息流中推送正式互动信息。

综上所述，本申请实施例中提出的互动信息的生成方法，通过多个不同的互动信息生成模型，基于用户发布信息生成多条候选互动信息，再通过质量控制的方式，从多条候选互动信息中挑选出质量最优的一条，确定为正式互动信息并将其在线推送，提供了一种在互动信息的准确度、多样性、个性化方面都能够得到优化的互动信息的生成方法，提升了内容社区的互动量和互动氛围。

由上述实施例的说明可以得知互动信息的生成的大致流程，进一步的，图3示出了互动信息生成方法的整体框架。

由图3可见，整个互动信息的生成系统由6个环节组成，分别是内容选择、候选生成、质量控制、要素构建、在线推送和频率控制。其中，内容选择环节是对于进行互动的目标内容进行筛选，例如，根据发布用户发布信息的用户帐号设置阈值进行筛选，对用户发布信息的长度设置阈值进行筛选，等等；候选生成环节是通过不同的互动信息生成模型来生成候选互动信息，例如，通过匹配式模型、模板式模型、生成式模型分别生成候选互动信息；质量控制环节用于在候选互动信息中筛选出质量最佳的互动信息，质量控制可能包括多维度的质量打分，例如，情感分析维度、符合程度分析维度、参数分析维度，等等；要素构建环节为将筛选后确定的正式互动信息、推送该正式互动信息的互动帐号、推送该正式互动信息的互动时间进行整合；在线推送环节和频率控制环节共同决定了推送正式互动信息的逻辑，频率控制环节通过对内容频率、模板频率、帐号频率等进行校验控制，避免在线推送太过集中。

可选地，互动信息除了为评论信息外，也可能是点赞、投币、关注、分享等等互动信息。由图3可见，以互动信息为点赞为例，通过内容选择环节对待互动的目标内容进行筛选后，直接跳转至要素构建，整合执行点赞的互动帐号、执行点赞的时间，而后通过在线推送环节和频率控制环节完成点赞的推送。类似的，互动信息如投币、关注、分享等，执行互动信息生成的逻辑都与点赞相同。

图4出了本申请一个示例性实施例提供的互动信息的生成方法的流程图。

如图4所示，该方法包括：

步骤320：获取用户帐号的用户发布信息；

示例性的，用户发布信息可能为内容社区中用户发布的日志、点评、提问；或者，用户发布信息可能为音乐类应用程序中用户发布的歌曲评论；或者，用户发布信息可能为旅游类应用程序中用户发布的游记，等等。本申请对用户发布信息的内容和形式不加以限制。

可选地，在获取用户帐号的用户发布信息时，对用户发布信息进行筛选。根据预设规则对用户发布信息进行筛选，例如，对用户发布信息中文本的字数、用户发布信息中图片的数量、用户帐号的等级、用户帐号的活跃度设置阈值，等等。本申请对用户发布信息的选择方式不加以限制。

步骤342：根据用户发布信息，通过匹配式模型生成候选互动信息；

匹配式模型为基于历史互动信息候选集生成候选互动信息的神经网络模型，即通过匹配式模型在历史互动信息候选集中选取与用户发布信息最为相似的历史互动信息，将其作为候选互动信息。

示例性的，根据用户发布信息构造第一特征，以及，根据历史互动信息候选集构造第二特征；基于第一特征得到用于表示用户发布信息的第一向量，以及，基于第二特征得到用于表示历史互动信息候选集中的候选历史互动信息的第二向量；基于第一向量和第二向量，将与第一向量的向量距离最小的第二向量对应的历史互动信息候选集中的候选历史互动信息确定为候选互动信息。

图5示出了匹配式模型的一种可能的结构。图5的左侧为用户发布信息部分，右侧为历史互动信息候选集部分。

示例性的，根据用户发布信息构造第一特征，第一特征包括内容维度特征、上下文维度特征，以及作者维度特征。其中，内容维度特征包括用户发布信息中的实体内容、情感信息等特征；上下文维度特征为根据用户发布信息的语境确定的特征，例如，在点评场景中的上下文维度特征可以为商户特征；作者维度特征包括发布该用户发布信息的用户帐号的特征，例如，等级、活跃度、作者画像，等等。

示例性的，根据历史互动信息候选集构造第二特征，第二特征包括回复维度特征，即用于对用户发布信息进行回复的信息特征。

示例性的，如图5的左侧部分所示，将第一特征进行独热(one-hot)编码并拼接，得到第一特征对应的独热向量；通过嵌入(embedding)层将第一特征对应的独热向量映射为低维稠密向量；将第一特征对应的低维稠密向量再通过多个多层感知层(Multi-LayerPerception，MLP)进行多次非线性化处理，使得第一特征对应的低维稠密向量能够学习到特征之间的交互表达；MLP层输出的即为基于第一特征得到的用于表示用户发布信息的第一向量。

类似的，如图5的右侧部分所示，基于第二特征得到用于表示历史互动信息候选集中的候选历史信息的第二向量，该过程与基于第一特征得到第一向量的过程类似，此处不再赘述。

示例性的，在得到用于表示用户发布信息的第一向量和用于表示历史互动信息候选集中的候选历史信息的第二向量后，基于第一向量和第二向量，将与第一向量的向量距离最小的第二向量对应的历史互动信息候选集中的候选历史互动信息确定为候选互动信息。

可选地，根据用户发布信息，通过匹配式模型生成1条或者多条候选互动信息，即，选取与第一向量的向量距离最小的一个或多个第二向量对应的历史互动信息候选集中的候选历史互动信息确定为候选互动信息。

可选地，在通过匹配式模型生成候选互动信息之前，对匹配式模型进行训练。基于筛选规则筛选出历史互动信息中的有效历史互动信息作为正样本。筛选的规则包括对历史互动信息的字数设置的限制、对发布该历史互动信息的帐号的属性，等等。例如，设置筛选规则为字数超过20字、发布该历史互动信息的帐号为三星级以上帐号。

示例性的，按照上述筛选规则筛选出有效历史互动信息作为正样本，再对负样本进行随机采样，负样本中包括了与正样本相对的限制，例如，关键词限制、类目限制、商家限制，等等。基于前述正样本和负样本对匹配式模型进行训练，使得基于训练后的匹配式模型获得的第一向量和第二向量更为准确，更能准确表示出用户发布信息和历史互动信息的特征。

可选地，采用结对(Pairwise)算法对匹配式模型进行训练。

可选地，在采用结对算法对匹配式模型进行训练时，根据历史互动信息的正向反馈对历史互动信息进行加权，得到更加精准的匹配式模型。其中，正向反馈为对历史互动信息的回复、点赞等。

步骤344：根据用户发布信息，通过模板式模型生成候选互动信息；

模板式模型为基于模板生成候选互动信息的模型。

示例性的，模板式模型中包括槽位填充模板和基础回复模板。基于用户发布信息，在槽位填充模板和基础回复模板中选择符合生成条件的模板，生成条件为使得互动信息和用户发布信息在语义和情感上相配的条件；基于符合生成条件的模板生成候选互动信息。

示例性的，槽位填充模板是为实体词汇预留出槽位进行填充的模板，即在使用槽位填充模板时需要根据用户发布内容提取实体词汇，填充进预留的槽位中，根据槽位填充模板生成候选互动信息。

示意性的，槽位填充模板为“***真好吃！”，其中，星号***部分指代预留的槽位，需要从用户发布内容中提取实体名词填入该槽位，生成完整的语句。例如，用户发布内容为对于菜品牛排的描述，即提取实体名词“牛排”，填充入槽位，生成候选互动信息“牛排真好吃！”。

示例性的，基础回复模板为预先设置好的完整的语句，并不需要再对其进行语句的加工，而是需要根据用户发布信息的语义进行判断是否可以使用基础回复模板。

示意性的，构造基础回复模板包括“你写的真好！”、“这家店确实很不错！”、“这篇点评对我很有帮助”，等等。根据用户发布信息的情感、语义等信息，进行基础回复模板的使用判断，即对使用基础回复模板是否合适作出判断。

由上述说明可知，由于模板式模型中使用的模板为预先构造的，因此需要在使用模板式模型的过程中，基于用户发布信息，根据生成条件对模板进行筛选。生成条件用于根据用户发布信息对模板进行情感、语义、实体等多方面的筛选，使得最终生成的候选互动信息符合用户发布信息的语境。

图6示出了模板式模型的一种可能的架构，由上往下为根据模板生成候选集的过程。首先，预先进行槽位填充模板和基础回复模板的构造；接着，基于用户发布信息，提取用户发布信息的字数、用户发布信息中包含的图片或视频的数量、用户发布信息的内容文本、用户发布信息中涉及的类目以及用户发布信息所包括的实体标签；而后，根据预先构造的模板和提取到的用户发布信息中的特征进行预处理，即基于用户发布信息，在槽位填充模板和基础回复模板中选择符合生成条件的模板；最后，基于预处理后筛选出符合生成条件的模板生成候选互动信息。

其中，上述预处理过程包括实体匹配、原文分割、情感过滤、规则过滤等过滤步骤。实体匹配步骤中将提取到的实体标签与用户发布信息进行匹配，用于确保实体标签与用户发布信息具有强关联性；原文分割步骤用于按照用户发布信息中的实体词汇对用户发布信息中的语句进行分割；情感过滤用于过滤情感负向的实体词汇，以及过滤情感与用户发布信息不匹配的模板；规则过滤用于基于语义特征对模板进行过滤，例如用户发布信息中涉及“花椒鱼”，则基于语义规则将模板“花椒多少钱？”过滤掉。

步骤346：根据用户发布信息，通过生成式模型生成候选互动信息；

生成式模型为基于序列到序列Seq2Seq神经网络的模型。

示例性的，生成式模型包括编码器和基于注意力机制的解码器。对用户发布信息进行编码，得到用户发布信息对应的上下文向量；基于注意力机制对上下文向量进行解码，生成候选互动信息。

可选地，生成式模型包括控制条件。根据控制条件对生成式模型生成的候选互动信息进行控制，控制包括关键词控制、类目控制、长度控制中的至少之一。

可选地，生成式模型包括条件变分自编码器(Conditional Variational Auto-Encoder，C-VAE)。通过条件变分自编码器使得上下文向量服从目标分布，目标分布为根据用户发布信息的上下文特征确定的。

图7示出了生成式模型的一种可能的架构。图7左下角中的内容模块10为基于用户发布信息获得的词嵌入向量和以及与词汇对应的实体识别嵌入向量，实体识别嵌入向量用于标识词汇的词性，例如n表示名词、v表示动词，等等。

将内容模块10中的词嵌入向量和实体识别嵌入向量输入编码器20，编码器20的目的是为了更好的得到词汇之间的联系以及词汇的位置特征，使得输入的词嵌入向量转化为上下文向量(Context Vector)30。示意性的，选择基于转换神经网络(Transformer)和门控卷积神经网络(Gated CNN)的编码器。

编码器20输出的上下文向量30经过基于注意力机制的解码器40生成候选互动信息。注意力(Attention)机制的目的是基于用户发布信息中的词汇的概率分布，对用户发布信息中的词汇进行加权，即用于向生成式模型指示用户发布信息中的哪些词汇在当前的预测步骤中更为重要。

图7的右上角所示即为基于注意力机制的解码器40。由图可见，基于注意力机制的解码器40中采用的解码方式包括生成模式(Generate Mode)和复制模式(Copy Mode)，即，基于注意力机制的解码器40中在生成模式中生成候选互动信息的基础为通过复制模式获得的用户发布信息的词汇分布；也即，生成模式中采用的关键词来自用户发布信息。

可选地，为了更好地控制生成式模型生成的候选互动信息，加入控制条件50对生成的候选互动信息进行控制，控制包括关键词控制、类目控制、长度控制中的至少之一。例如，设置长度控制条件为生成的候选互动信息在六个字以内，类别控制为生成的候选互动信息属于“酒吧”的分类，关键词控制为生成的候选互动信息包括关键词“情侣约会”，等等。示意性的，将控制条件50引入注意力ATT模块70，作为生成上下文向量30时的权重。

可选地，在生成式模型中加入C-VAE60，使得编码器20输出的上下文向量30能够服从目标分布，目标分布为根据用户发布信息的上下文(Context)特征确定的，上下文特征为根据用户发布信息的语境确定的。即，如图7的左上角所示的C-VAE60，通过上下文标号(Context ID)确定该上下文特征对应的目标分布，并且引入随机噪声来增加生成的候选互动信息的多样性，随机噪声由KL散度(Kullback–Leibler divergence)损失函数来表示。其中，C-VAE60中的参数μ、logσ²为根据目标分布确定的参数，参数ε为根据引入的随机噪声确定的参数。

需要注意的是，步骤342至步骤346不需要按顺序执行，可以在其中任选两个步骤执行，也可以将三个步骤全部执行；本申请也不限定执行的先后顺序，可以先后执行，也可以同时执行。

步骤362：基于情感模型对候选互动信息进行情感分析维度的打分；

情感模型为用于筛选符合正面情感的候选互动信息的神经网络模型。

示例性的，情感模型包括基于词典的情感模型和基于来自转换器的双向编码表征(Bidirectional Encoder Representations from Transformers，BERT)的情感模型中的至少之一。

示例性的，采集低星级的用户原创内容(User Generated Content，UGC)，从中挖掘表示情感的词汇和敏感词汇，来完善情感词库和敏感词库。采用完善后的基于词典的情感模型对候选互动信息进行情感分析维度的打分。

示例性的，采集UGC和该UGC对应的星级数据作为训练集，对基于BERT的模型进行训练。采用训练得到的BERT预训练模型对候选互动信息进行情感分析维度的打分。

步骤364：基于预设规则对候选互动信息与用户发布内容的符合程度进行符合程度分析维度的打分；

预设规则为根据互动的内容、对象可根据实际情况进行预先设置的规则，预设规则用于对候选互动信息与用户发布内容的符合程度进行评估的规则。

示例性的，如下表所示，预设规则包括如下三个规则中的至少之一：画像规则、基础规则和细节规则。其中，画像规则用于指示发布候选互动信息的互动帐号画像与用户发布信息对应的用户帐号画像的符合程度，画像可以根据帐号发布的历史信息确定；基础规则用于指示候选互动信息的属性信息和用户发布信息的符合程度，属性信息为信息所属的类别信息，例如，颜色、价钱，等等；细节规则用于指示候选互动信息的语义细节和用户发布信息的符合程度，语义细节为语句中重要词语的含义，例如，用户发布信息中涉及“金毛”，而候选互动信息中涉及“泰迪”，则不符合细节规则。

步骤366：基于候选互动信息的参数，对候选互动信息进行参数分析维度的打分；

示例性的，参数包括准确度、多样性、互动率中的至少一种。准确度为生成候选互动信息的互动信息生成模型的准确度，准确度可以根据互动信息生成模型的内部结构进行打分，也可以根据互动信息生成模型历史生成的历史互动信息的准确度进行打分；多样性为根据候选互动信息的词语重复度和语义相似度确定的，例如，可以选取城市维度、类目维度、用户帐号维度等进行多样性的打分；互动率为基于互动信息生成模型生成的历史互动信息的互动率确定的，互动率可以为二级回复率(对历史互动信息的回复数量除以对历史互动信息的查看数量)、二级点赞率(对历史互动信息的点赞数量除以对历史互动信息的查看数量)、内容点击通过率(Click-Through-Rate，CTR)、内容曝光数等维度进行打分。

参数可以根据互动的内容、对象的实际情况进行调整，本申请对参数的选择不加以限制。

需要注意的是，步骤362至步骤366可以任选一步骤执行，或者，任选其二执行，再或者，执行全部三个步骤；本申请对步骤362至步骤366执行的顺序也不加以限制，可以先后执行，也可以同时执行。

步骤368：对候选互动信息的打分进行排序，将具有最高打分的候选互动信息确定为正式互动信息；

示例性的，对候选互动信息按照上述质量控制规则进行打分，再对候选互动信息的打分进行排序，将具有最高打分的候选互动信息确定为正式互动信息。

步骤382：在满足推送频率条件的情况下，在用户发布信息的信息流中推送正式互动信息。

推送频率条件用于限制正式互动信息发送的次数或时间。

示例性的，在满足推送频率条件的情况下，将第一时间差和第二时间差中较大的一个，确定为正式互动信息的发送等待时间，第一时间差为预先设置的最短互动时间与发送正式互动信息的互动帐号上次发生互动距离当前时间已间隔时间的时间差，第二时间差为预先设置的最短互动时间与用户发表信息上次发生互动距离当前时间已间隔时间的时间差；在经过发送等待时间之后，在用户发布信息的信息流中推送正式互动信息。

图8示出了在满足推送频率条件的情况下，在用户发布信息的信息流中推送正式互动信息的流程图。

示例性的，HIVE为数据仓库分析系统，可以将结构化的数据文件映射为一张数据库表，通过HIVE表对互动帐号发布正式互动信息的时间进行调度；在时间符合HIVE表的调度的情况下，时间触发MAFKA(基于Kafka开发的分布式消息中间件综合解决方案)消息，MAFKA消息用于指示进行后续的物料审核和防疲劳机制；物料审核用于对正式互动信息的漏发和重发进行审核；防疲劳用于保证正式互动信息的真实性和有效性，防疲劳包括时间延迟和特殊时段延迟；最后，在推送正式互动信息的环节，调用UGC接口，实现正式互动信息在用户发布信息的信息流中的推送。

示例性的，防疲劳机制中的特殊时段延迟用于防止链路延迟导致非常规时间存在大量正式互动信息的推送，采用特殊时段延迟措施对正式互动信息发送的数量和内容进行限制。

示例性的，防疲劳机制中的时间延迟用于避免发送正式互动信息的互动帐号发生互动的频率过于频繁，以及，避免用户发布信息的互动发生的过于频繁。

以正式互动信息为对于用户发布信息的回复为例，图9示出了确定回复等待时间的流程图。

步骤910：将回复等待时间reply_wait_time进行初始化，设置其数值为0；

步骤920：判断发送正式互动信息的互动帐号是否与发布用户发布信息的用户帐号发生过互动；

若发送正式互动信息的互动帐号与发布用户发布信息的用户帐号发生过互动，则执行步骤922，不再进行回复，设置回复等待时间reply_wait_time＝-1.0；若未发生过互动则执行步骤930，进行后续判断。

步骤930：判断发送正式互动信息的互动帐号是否对该用户发布信息发送过互动信息；

若发送过互动信息，则执行步骤922，不再进行回复，设置回复等待时间reply_wait_time＝-1.0；若未发送过互动信息，则执行步骤940，进行后续判断。

步骤940：判断互动信息是否为空；

若互动信息为空，说明没有要发送的信息，即不用回复，则执行步骤942，设置回复等待时间reply_wait_time＝0.0；若互动信息不为空，则执行步骤950，计算回复等待时间；

步骤950：计算用户帐号上次发生互动距离当前的时间t1，计算用户发表信息上次发生互动信息距离当前的时间t2；

步骤960：根据t1、t2以及预设的最短时间间隔T，分配回复等待时间time_wait1和time_wait2；

分配回复等待时间time_wait1＝T-t1,time_wait2＝T-t2。

步骤970：确定回复等待时间reply_time_wait＝max(time_wait1，time_wait2)。

回复等待时间reply_time_wait＝max(time_wait1，time_wait2)＝max(T-t1，T-t2)，其中，max函数表示取最大值。

可选地，最短时间间隔T为根据实际情况设置的时长；或者，最短时间间隔T为在预设的时间范围内随机生成的时间。

可选地，正式互动信息可以包括点赞、分享、投币、关注等多种互动信息。以正式互动信息为点赞信息为例，与图9示出的确定回复等待时间类似的，图10示出了确定点赞等待时间的流程图。

步骤1010：将点赞等待时间like_wait_time进行初始化，设置其数值为0；

步骤1020：判断发送点赞信息的互动帐号是否与发布用户发布信息的用户帐号发生过互动；

若发生过互动则执行步骤1022，不进行点赞，设置点赞等待时间like_wait_time＝-1.0；若未发生过互动则执行步骤1030，进行后续判断。

步骤1030：判断点赞内容item_like是否为0；

若为点赞内容item_like为0，则执行步骤1032，不进行点赞，设置点赞等待时间like_wait_time＝0.0；若不为0，则执行步骤1040，计算点赞等待时间。

步骤1040：计算用户帐号上次发生互动距离当前的时间t1，计算用户发表信息上次发生互动信息距离当前的时间t2；

步骤1050：根据t1、t2以及预设的最短时间间隔T，分配点赞等待时间time_wait1和time_wait2；

分配点赞等待时间time_wait1＝T-t1,time_wait2＝T-t2。

步骤1060：确定回复等待时间like_time_wait＝max(time_wait1，time_wait2)。

回复等待时间like_time_wait＝max(time_wait1，time_wait2)＝max(T-t1，T-t2)，其中，max函数表示取最大值。

可选地，在推送正式互动信息的步骤中还包括频率控制，频率控制用于对推送正式互动信息的互动帐号的安全性和多样性进行控制。频率控制采取的维度包括内容维度、用户发布信息的作者维度、上下文特征维度、城市维度以及大盘维度，频率控制涉及的方面包括内容频率控制、句式或主体频率控制、模板频率控制、推送正式互动信息的帐号频率控制以及发送频率控制。具体的控制维度与控制内容的对应关系见下表：

	内容维度	作者维度	上下文特征维度	城市维度	大盘维度
						内容频率控制	√	√	√	√
句式或主体控制	√	√
						模板频率控制	√	√	√	√
帐号频率控制	√	√			√
						发送频率控制	√	√

综上所述，本申请实施例提供的方法，通过在匹配式模型、模板式模型、生成式模型中选取不同的互动信息生成模型生成候选互动信息，而后通过质量控制手段从不同维度对候选互动信息进行打分，选取打分最高的候选互动信息，作为正式互动信息推送至用户发布信息的信息流中，提供了一种基于多种模型生成候选互动信息并从中择优推送的方法，使得最终确定的正式互动信息准确度较高，且在多样性方面具有更好的表现。

此外，本申请实施例通过在推送正式互动信息的环节中加入防疲劳控制等手段，保证了推送正式互动信息的帐号不会过于频繁的进行互动，使得推送的互动信息具有更高的真实性，提升了用户的体验感。

图11是本申请一个示例性实施例提供的互动信息的生成装置的结构框图，如图11所示，该装置包括：

获取模块1120，用于获取用户帐号的用户发布信息；

生成模块1140，用于根据所述用户发布信息，通过n个不同的互动信息生成模型生成m条候选互动信息，所述互动信息生成模型为用于生成所述候选互动信息的神经网络模型，所述候选互动信息为对于所述用户发布信息的候选回复信息，n为大于1的整数，m为大于或者等于n的整数；

确定模块1160，用于在所述m条候选互动信息中选择出一条候选互动信息，确定为正式互动信息；

推送模块1180，用于在所述用户发布信息的信息流中推送所述正式互动信息。

在一个可能的实施例中，所述确定模块1160包括打分子模块1162和排序子模块1164；所述打分子模块1162，用于对所述候选互动信息按照质量控制规则进行打分；所述排序子模块1164，用于对所述候选互动信息的打分进行排序，将具有最高打分的候选互动信息确定为所述正式互动信息。

在一个可能的实施例中，所述打分子模块1162，用于基于情感模型对所述候选互动信息进行情感分析维度的打分，所述情感模型为用于筛选符合正面情感的候选互动信息的神经网络模型。

在一个可能的实施例中，所述打分子模块1162，用于基于预设规则对所述候选互动信息与所述用户发布内容的符合程度进行符合程度分析维度的打分，所述预设规则包括如下三个规则中的至少之一：画像规则、基础规则和细节规则，所述画像规则用于指示发布所述候选互动信息的互动帐号画像与所述用户发布信息对应的用户帐号画像的符合程度，所述基础规则用于指示所述候选互动信息的属性信息和所述用户发布信息的符合程度，所述细节规则用于指示所述候选互动信息的语义细节和所述用户发布信息的符合程度。

在一个可能的实施例中，所述打分子模块1162，用于基于所述候选互动信息的参数，对所述候选互动信息进行参数分析维度的打分，所述参数包括准确度、多样性、互动率中的至少一种，所述准确度为生成所述候选互动信息的互动信息生成模型的准确度，所述多样性为根据所述候选互动信息的词语重复度和语义相似度确定的，所述互动率为基于所述互动信息生成模型生成的历史互动信息的互动率确定的。

在一个可能的实施例中，所述n个互动信息生成模型中包括匹配式模型；所述生成模块1140，用于根据所述用户发布信息，通过所述匹配式模型生成所述候选互动信息，所述匹配式模型为基于历史互动信息候选集生成所述候选互动信息的神经网络模型。

在一个可能的实施例中，所述生成模块1140，用于根据所述用户发布信息构造第一特征，以及，根据所述历史互动信息候选集构造第二特征；基于所述第一特征得到用于表示所述用户发布信息的第一向量，以及，基于所述第二特征得到用于表示所述历史互动信息候选集中的候选历史互动信息的第二向量；基于所述第一向量和所述第二向量，将与所述第一向量的向量距离最小的第二向量对应的所述历史互动信息候选集中的候选历史互动信息确定为所述候选互动信息。

在一个可能的实施例中，所述n个互动信息生成模型中包括模板式模型；所述生成模块1140，用于根据所述用户发布信息，通过所述模板式模型生成所述候选互动信息，所述模板式模型为基于模板生成所述候选互动信息的模型。

在一个可能的实施例中，所述模板式模型中包括槽位填充模板和基础回复模板；所述生成模块1140，用于基于所述用户发布信息，在所述槽位填充模板和所述基础回复模板中选择符合生成条件的模板，所述生成条件为使得所述互动信息和所述用户发布信息在语义和情感上相配的条件；基于所述符合生成条件的模板构造生成所述候选互动信息。

在一个可能的实施例中，所述n个互动信息生成模型中包括生成式模型；所述生成模块1140，用于根据所述用户发布信息，通过所述生成式模型生成所述候选互动信息，所述生成式模型为基于序列到序列Seq2Seq神经网络的模型。

在一个可能的实施例中，所述生成式模型包括编码器和基于注意力机制的解码器；所述生成模块1140，用于对所述用户发布信息进行编码，得到所述用户发布信息对应的上下文向量；基于注意力机制对所述上下文向量进行解码，生成所述候选互动信息。

在一个可能的实施例中，所述生成式模型包括控制条件；所述生成模块1140，还用于根据所述控制条件对所述生成式模型生成的所述候选互动信息进行控制，所述控制包括关键词控制、类目控制、长度控制中的至少之一。

在一个可能的实施例中，所述生成式模型包括条件变分自编码器，所述生成模块1140，还用于通过所述条件变分自编码器使得所述上下文向量服从目标分布，所述目标分布为根据所述用户发布信息的兴趣点确定的。

在一个可能的实施例中，所述推送模块1180，用于在满足推送频率条件的情况下，在所述用户发布信息的信息流中推送所述正式互动信息，所述推送频率条件用于限制所述正式互动信息发送的次数或时间。

在一个可能的实施例中，所述推送模块1180，用于在满足所述推送频率条件的情况下，将第一时间差和第二时间差中较大的一个，确定为所述正式互动信息的发送等待时间，所述第一时间差为预先设置的最短互动时间与发送所述正式互动信息的互动帐号上次发生互动距离当前时间已间隔时间的时间差，所述第二时间差为所述预先设置的最短互动时间与所述用户发表信息上次发生互动距离当前时间已间隔时间的时间差；在经过所述发送等待时间之后，在所述用户发布信息的信息流中推送所述正式互动信息。

图12示出了本申请一个示例性实施例提供的电子设备2000的结构框图。该电子设备2000可以是便携式移动终端，比如：智能手机、平板电脑、MP3播放器(Moving PictureExperts Group Audio Layer III，动态影像专家压缩标准音频层面3)、MP4播放器(MovingPicture Experts Group Audio Layer IV，动态影像专家压缩标准音频层面4)、笔记本电脑或台式电脑。电子设备2000还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。

通常，电子设备2000包括有：处理器2001和存储器2002。

处理器2001可以包括一个或多个处理核心，比如4核心处理器、8核心处理器等。处理器2001可以采用DSP(Digital Signal Processing，数字信号处理)、FPGA(Field－Programmable Gate Array，现场可编程门阵列)、PLA(Programmable Logic Array，可编程逻辑阵列)中的至少一种硬件形式来实现。处理器2001也可以包括主处理器和协处理器，主处理器是用于对在唤醒状态下的数据进行处理的处理器，也称CPU(Central ProcessingUnit，中央处理器)；协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中，处理器2001可以集成有GPU(Graphics Processing Unit，图像处理器)，GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中，处理器2001还可以包括AI(Artificial Intelligence，人工智能)处理器，该AI处理器用于处理有关机器学习的计算操作。

存储器2002可以包括一个或多个计算机可读存储介质，该计算机可读存储介质可以是非暂态的。存储器2002还可包括高速随机存取存储器，以及非易失性存储器，比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中，存储器2002中的非暂态的计算机可读存储介质用于存储至少一个指令，该至少一个指令用于被处理器2001所执行以实现本申请中方法实施例提供的互动信息的生成方法。

在一些实施例中，电子设备2000还可选包括有：外围设备接口2003和至少一个外围设备。处理器2001、存储器2002和外围设备接口2003之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口2003相连。具体地，外围设备包括：射频电路2004、显示屏2005、摄像头组件2006、音频电路2007、定位组件2008和电源2009中的至少一种。

外围设备接口2003可被用于将I/O(Input/Output，输入/输出)相关的至少一个外围设备连接到处理器2001和存储器2002。在一些实施例中，处理器2001、存储器2002和外围设备接口2003被集成在同一芯片或电路板上；在一些其他实施例中，处理器2001、存储器2002和外围设备接口2003中的任意一个或两个可以在单独的芯片或电路板上实现，本实施例对此不加以限定。

射频电路2004用于接收和发射RF(Radio Frequency，射频)信号，也称电磁信号。射频电路2004通过电磁信号与通信网络以及其他通信设备进行通信。射频电路2004将电信号转换为电磁信号进行发送，或者，将接收到的电磁信号转换为电信号。可选地，射频电路2004包括：天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路2004可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于：万维网、城域网、内联网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity，无线保真)网络。在一些实施例中，射频电路2004还可以包括NFC(Near Field Communication，近距离无线通信)有关的电路，本申请对此不加以限定。

显示屏2005用于显示UI(User Interface，用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏2005是触摸显示屏时，显示屏2005还具有采集在显示屏2005的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器2001进行处理。此时，显示屏2005还可以用于提供虚拟按钮和/或虚拟键盘，也称软按钮和/或软键盘。在一些实施例中，显示屏2005可以为一个，设置在电子设备2000的前面板；在另一些实施例中，显示屏2005可以为至少两个，分别设置在电子设备2000的不同表面或呈折叠设计；在另一些实施例中，显示屏2005可以是柔性显示屏，设置在电子设备2000的弯曲表面上或折叠面上。甚至，显示屏2005还可以设置成非矩形的不规则图形，也即异形屏。显示屏2005可以采用LCD(Liquid Crystal Display，液晶显示屏)、OLED(Organic Light-Emitting Diode，有机发光二极管)等材质制备。

摄像头组件2006用于采集图像或视频。可选地，摄像头组件2006包括前置摄像头和后置摄像头。通常，前置摄像头设置在终端的前面板，后置摄像头设置在终端的背面。在一些实施例中，后置摄像头为至少两个，分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种，以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality，虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中，摄像头组件2006还可以包括闪光灯。闪光灯可以是单色温闪光灯，也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合，可以用于不同色温下的光线补偿。

音频电路2007可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波，并将声波转换为电信号输入至处理器2001进行处理，或者输入至射频电路2004以实现语音通信。出于立体声采集或降噪的目的，麦克风可以为多个，分别设置在电子设备2000的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器2001或射频电路2004的电信号转换为声波。扬声器可以是传统的薄膜扬声器，也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时，不仅可以将电信号转换为人类可听见的声波，也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中，音频电路2007还可以包括耳机插孔。

定位组件2008用于定位电子设备2000的当前地理位置，以实现导航或LBS(Location Based Service，基于位置的服务)。定位组件2008可以是基于美国的GPS(Global Positioning System，全球定位系统)、中国的北斗系统或俄罗斯的伽利略系统的定位组件。

电源2009用于为电子设备2000中的各个组件进行供电。电源2009可以是交流电、直流电、一次性电池或可充电电池。当电源2009包括可充电电池时，该可充电电池可以是有线充电电池或无线充电电池。有线充电电池是通过有线线路充电的电池，无线充电电池是通过无线线圈充电的电池。该可充电电池还可以用于支持快充技术。

在一些实施例中，电子设备2000还包括有一个或多个传感器2010。该一个或多个传感器2010包括但不限于：加速度传感器2011、陀螺仪传感器2012、压力传感器2013、指纹传感器2014、光学传感器2015以及接近传感器2016。

加速度传感器2011可以检测以电子设备2000建立的坐标系的三个坐标轴上的加速度大小。比如，加速度传感器2011可以用于检测重力加速度在三个坐标轴上的分量。处理器2001可以根据加速度传感器2011采集的重力加速度信号，控制显示屏2005以横向视图或纵向视图进行用户界面的显示。加速度传感器2011还可以用于游戏或者用户的运动数据的采集。

陀螺仪传感器2012可以检测电子设备2000的机体方向及转动角度，陀螺仪传感器2012可以与加速度传感器2011协同采集用户对电子设备2000的3D动作。处理器2001根据陀螺仪传感器2012采集的数据，可以实现如下功能：动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。

压力传感器2013可以设置在电子设备2000的侧边框和/或显示屏2005的下层。当压力传感器2013设置在电子设备2000的侧边框时，可以检测用户对电子设备2000的握持信号，由处理器2001根据压力传感器2013采集的握持信号进行左右手识别或快捷操作。当压力传感器2013设置在显示屏2005的下层时，由处理器2001根据用户对显示屏2005的压力操作，实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。

指纹传感器2014用于采集用户的指纹，由处理器2001根据指纹传感器2014采集到的指纹识别用户的身份，或者，由指纹传感器2014根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时，由处理器2001授权该用户执行相关的敏感操作，该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器2014可以被设置在电子设备2000的正面、背面或侧面。当电子设备2000上设置有物理按键或厂商Logo时，指纹传感器2014可以与物理按键或厂商Logo集成在一起。

光学传感器2015用于采集环境光强度。在一个实施例中，处理器2001可以根据光学传感器2015采集的环境光强度，控制显示屏2005的显示亮度。具体地，当环境光强度较高时，调高显示屏2005的显示亮度；当环境光强度较低时，调低显示屏2005的显示亮度。在另一个实施例中，处理器2001还可以根据光学传感器2015采集的环境光强度，动态调整摄像头组件2006的拍摄参数。

接近传感器2016，也称距离传感器，通常设置在电子设备2000的前面板。接近传感器2016用于采集用户与电子设备2000的正面之间的距离。在一个实施例中，当接近传感器2016检测到用户与电子设备2000的正面之间的距离逐渐变小时，由处理器2001控制显示屏2005从亮屏状态切换为息屏状态；当接近传感器2016检测到用户与电子设备2000的正面之间的距离逐渐变大时，由处理器2001控制显示屏2005从息屏状态切换为亮屏状态。

本领域技术人员可以理解，图9中示出的结构并不构成对电子设备2000的限定，可以包括比图示更多或更少的组件，或者组合某些组件，或者采用不同的组件布置。

本申请的实施例还提供了一种计算机可读存储介质，该计算机可读存储介质上存储有至少一条指令、至少一段程序、代码集或指令集，至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行，以实现上述各方法实施例提供的互动信息的生成方法。

本申请的实施例还提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述实施例中任一所述的互动信息的生成方法。

可选地，该计算机可读存储介质可以包括：只读存储器(ROM，Read Only Memory)、随机存取记忆体(RAM，Random Access Memory)、固态硬盘(SSD，Solid State Drives)或光盘等。其中，随机存取记忆体可以包括电阻式随机存取记忆体(ReRAM,Resistance RandomAccess Memory)和动态随机存取存储器(DRAM，Dynamic Random Access Memory)。上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。以上所述仅为本申请的可选实施例，并不用以限制本申请，凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

1.一种互动信息的生成方法，其特征在于，所述方法包括：

获取用户帐号的用户发布信息；

在所述用户发布信息的信息流中推送所述正式互动信息。

2.根据权利要求1所述的方法，其特征在于，所述在所述m条候选互动信息中选择出一条候选互动信息，确定为正式互动信息，包括：

对所述候选互动信息按照质量控制规则进行打分；

对所述候选互动信息的打分进行排序，将具有最高打分的候选互动信息确定为所述正式互动信息。

3.根据权利要求2所述的方法，其特征在于，所述质量控制规则包括情感分析；

所述对所述候选互动信息按照质量控制规则进行打分，包括：

基于情感模型对所述候选互动信息进行情感分析维度的打分，所述情感模型为用于筛选符合正面情感的候选互动信息的神经网络模型。

4.根据权利要求2所述的方法，其特征在于，所述质量控制规则包括符合程度分析；

基于预设规则对所述候选互动信息与所述用户发布内容的符合程度进行符合程度分析维度的打分，所述预设规则包括如下三个规则中的至少之一：画像规则、基础规则和细节规则，所述画像规则用于指示发布所述候选互动信息的互动帐号画像与所述用户发布信息对应的用户帐号画像的符合程度，所述基础规则用于指示所述候选互动信息的属性信息和所述用户发布信息的符合程度，所述细节规则用于指示所述候选互动信息的语义细节和所述用户发布信息的符合程度。

5.根据权利要求2所述的方法，其特征在于，所述质量控制规则包括参数分析；

基于所述候选互动信息的参数，对所述候选互动信息进行参数分析维度的打分，所述参数包括准确度、多样性、互动率中的至少一种，所述准确度为生成所述候选互动信息的互动信息生成模型的准确度，所述多样性为根据所述候选互动信息的词语重复度和语义相似度确定的，所述互动率为基于所述互动信息生成模型生成的历史互动信息的互动率确定的。

6.根据权利要求1至3任一所述的方法，其特征在于，所述n个互动信息生成模型中包括匹配式模型；

所述根据所述用户发布信息，通过n个不同的互动信息生成模型生成m条候选互动信息，包括：

根据所述用户发布信息，通过所述匹配式模型生成所述候选互动信息，所述匹配式模型为基于历史互动信息候选集生成所述候选互动信息的神经网络模型。

7.根据权利要求6所述的方法，其特征在于，所述根据所述用户发布信息，通过所述匹配式模型生成所述候选互动信息，包括：

根据所述用户发布信息构造第一特征，以及，根据所述历史互动信息候选集构造第二特征；

基于所述第一特征得到用于表示所述用户发布信息的第一向量，以及，基于所述第二特征得到用于表示所述历史互动信息候选集中的候选历史互动信息的第二向量；

基于所述第一向量和所述第二向量，将与所述第一向量的向量距离最小的第二向量对应的所述历史互动信息候选集中的候选历史互动信息确定为所述候选互动信息。

8.根据权利要求1至3任一所述的方法，其特征在于，所述n个互动信息生成模型中包括模板式模型；

根据所述用户发布信息，通过所述模板式模型生成所述候选互动信息，所述模板式模型为基于模板生成所述候选互动信息的模型。

9.根据权利要求8所述的方法，其特征在于，所述模板式模型中包括槽位填充模板和基础回复模板；

所述根据所述用户发布信息，通过模板式模型生成所述候选互动信息，包括：

基于所述用户发布信息，在所述槽位填充模板和所述基础回复模板中选择符合生成条件的模板，所述生成条件为使得所述互动信息和所述用户发布信息在语义和情感上相配的条件；

基于所述符合生成条件的模板生成所述候选互动信息。

10.根据权利要求1至3任一所述的方法，其特征在于，所述n个互动信息生成模型中包括生成式模型；

根据所述用户发布信息，通过所述生成式模型生成所述候选互动信息，所述生成式模型为基于序列到序列Seq2Seq神经网络的模型。

11.根据权利要求10所述的方法，其特征在于，所述生成式模型包括编码器和基于注意力机制的解码器；

所述根据所述用户发布信息，通过所述生成式模型生成所述候选互动信息，包括：

对所述用户发布信息进行编码，得到所述用户发布信息对应的上下文向量；

基于注意力机制对所述上下文向量进行解码，生成所述候选互动信息。

12.根据权利要求11所述的方法，其特征在于，所述生成式模型包括控制条件；

所述方法还包括：

根据所述控制条件对所述生成式模型生成的所述候选互动信息进行控制，所述控制包括关键词控制、类目控制、长度控制中的至少之一。

13.根据权利要求11所述的方法，其特征在于，所述生成式模型包括条件变分自编码器，所述方法还包括：

通过所述条件变分自编码器使得所述上下文向量服从目标分布，所述目标分布为根据所述用户发布信息的上下文特征确定的。

14.根据权利要求1至13中任一所述的方法，其特征在于，所述在所述用户发布信息的信息流中推送所述正式互动信息，包括：

在满足推送频率条件的情况下，在所述用户发布信息的信息流中推送所述正式互动信息，所述推送频率条件用于限制所述正式互动信息发送的次数或时间。

15.根据权利要求14所述的方法，其特征在于，所述在满足推送频率条件的情况下，在所述用户发布信息的信息流中推送所述正式互动信息，包括：

在满足所述推送频率条件的情况下，将第一时间差和第二时间差中较大的一个，确定为所述正式互动信息的发送等待时间，所述第一时间差为预先设置的最短互动时间与发送所述正式互动信息的互动帐号上次发生互动距离当前时间已间隔时间的时间差，所述第二时间差为所述预先设置的最短互动时间与所述用户发表信息上次发生互动距离当前时间已间隔时间的时间差；

在经过所述发送等待时间之后，在所述用户发布信息的信息流中推送所述正式互动信息。

16.一种互动信息的生成装置，其特征在于，所述装置包括：

获取模块，用于获取用户帐号的用户发布信息；

17.一种计算机设备，其特征在于，所述计算机设备包括处理器，与所述处理器相连的存储器，以及存储在所述存储器上的程序指令，所述处理器执行的所述程序指令时实现如权利要求1至15任一所述的互动信息的生成方法。

18.一种计算机可读存储介质，所述存储介质中存储有程序指令，其特征在于，所述程序指令被处理器执行时实现如权利要求1至15任一所述的互动信息的生成方法。