CN112131346B

CN112131346B - 评论聚合方法、装置、存储介质和电子设备

Info

Publication number: CN112131346B
Application number: CN202011023575.7A
Authority: CN
Inventors: 马宏智
Original assignee: Beijing Dajia Internet Information Technology Co Ltd
Current assignee: Beijing Dajia Internet Information Technology Co Ltd
Priority date: 2020-09-25
Filing date: 2020-09-25
Publication date: 2024-04-30
Anticipated expiration: 2040-09-25
Also published as: CN112131346A

Abstract

本公开关于一种评论聚合方法、装置、存储介质和电子设备，方法包括，在当前拉取周期拉取到的评论中识别出每一组重复评论；一组重复评论包括内容相匹配的至少一条评论；检测每一组重复评论是否符合评论聚合条件；评论聚合条件为：重复评论的内容为首次出现，且包含的评论的数量大于初始聚合阈值，或，重复评论的内容不为首次出现、且包含的评论的数量大于累积聚合阈值；初始聚合阈值大于累积聚合阈值；对符合评论聚合条件的一组重复评论进行聚合，得到对应的一条聚合评论；将聚合评论和未被聚合的评论发送至客户端。通过对单次大量重复和多次少量重复两种情况设置对应的阈值，本方案能够对连续多次少量出现的重复评论进行聚合，改善评论聚合效果。

Description

评论聚合方法、装置、存储介质和电子设备

技术领域

本公开涉及互联网技术领域，尤其涉及一种评论聚合方法、装置、存储介质和电子设备。

背景技术

随着互联网技术的发展，各种各样基于互联网的视频平台层出不穷。视频生产者(指拍摄或制作视频的用户，例如，直播平台中的主播就是视频生产者)可以在视频平台上传视频，而观众可以通过联网的客户端访问视频平台，从而观看平台上的视频并发表对视频的评论。

目前在播放视频时同步显示该视频的评论的方法是，一方面观众在客户端输入的评论会实时存储在与服务器连接的数据库中，另一方面，服务器会以预设的周期定时从数据库拉取一批评论，然后将拉取的评论发送至观众的客户端。

在实际播放时，为了避免客户端显示大量重复评论，往往需要对重复评论进行聚合，也就是将多条重复评论聚合为一条聚合评论。

发明内容

本公开提供一种评论聚合的方法、装置、存储介质和电子设备，以至少解决相关技术中对重复评论的聚合效果较差的问题。本公开的技术方案如下：

根据本公开实施例的第一方面，提供一种评论聚合的方法，包括：

在当前拉取周期拉取到的评论中，识别出每一组重复评论；其中，所述一组重复评论包括内容相匹配的至少一条评论；

当任意一组重复评论符合评论聚合条件时，对所述一组重复评论进行聚合，得到所述一组重复评论对应的一条聚合评论；其中，所述评论聚合条件为：所述重复评论的内容为首次出现，且包含的评论的数量大于初始聚合阈值，或者，所述重复评论的内容不为首次出现、且包含的评论的数量大于累积聚合阈值；所述初始聚合阈值大于所述累积聚合阈值；所述聚合评论的内容和所述重复评论的内容相互匹配；

将所述聚合评论和所述当前拉取周期拉取到的评论中未被聚合的评论，发送至客户端。

可选的，所述当任意一组重复评论符合评论聚合条件时，对所述一组重复评论进行聚合，得到所述一组重复评论对应的一条聚合评论之前，还包括：

获取当前账户数量；其中，所述当前账户数量指代当前接入网络直播间的账户的总数；

在预先划分的多个账户数量区间中，确定所述当前账户数量所属的账户数量区间；其中，每一个所述账户数量区间均对应有一个初始阈值和一个累积阈值；

将所述当前账户数量所属的账户数量区间对应的初始阈值，确定为所述初始聚合阈值，并将所述当前账户数量所属的账户数量区间对应的累积阈值，确定为所述累积聚合阈值。

可选的，所述在当前拉取周期拉取到的评论中，识别出每一组重复评论，包括：

在所述当前拉取周期拉取到的评论中，检测得到每两条内容相匹配的评论；

将所述当前拉取周期拉取到的评论中，内容相匹配的所有评论确定为一组重复评论。

可选的，所述在所述当前拉取周期拉取到的评论中，检测得到每两条内容相匹配的评论，包括：

计算所述当前拉取周期拉取到的评论中，每两条评论的内容的相似度；

将所述当前拉取周期拉取到的评论中，每两条内容的相似度大于或等于预设阈值的评论，确定为两条内容相匹配的评论。

可选的，所述对所述一组重复评论进行聚合，得到所述一组重复评论对应的一条聚合评论，包括：

从所述一组重复评论中选择任意一条评论，并将被选择的所述评论的内容确定为聚合内容；

当所述一组重复评论符合所述重复评论的内容不为首次出现、且包含的评论的数量大于累积聚合阈值条件时，将所述一组重复评论包含的评论的数量，和目标组重复评论包括的评论的数量相加，得到聚合数值；其中，所述目标组重复评论指代：与所述聚合内容相匹配的前一条聚合评论对应的一组重复评论；

组合所述聚合内容和所述聚合数值，得到所述一组重复评论所对应的一条聚合评论。

当所述一组重复评论符合所述重复评论的内容为首次出现，且包含的评论的数量大于初始聚合阈值条件时，将所述一组重复评论包含的评论的数量确定为聚合数值；

可选的，所述组合所述聚合内容和所述聚合数值，得到所述一组重复评论所对应的一条聚合评论之前，还包括：

根据所述一组重复评论包含的每一条所述评论的用户名，生成聚合用户列表；

其中，所述组合所述聚合内容和所述聚合数值，得到所述一组重复评论所对应的一条聚合评论，包括：

组合所述聚合用户列表、所述聚合内容和所述聚合数值，得到所述一组重复评论所对应的一条聚合评论。

根据本公开实施例的第二方面，提供一种评论聚合的装置，包括：

识别单元，被配置为执行在当前拉取周期拉取到的评论中，识别出每一组重复评论；其中，所述一组重复评论包括内容相匹配的至少一条评论；

聚合单元，被配置为执行，当任意一组重复评论符合评论聚合条件时，对所述一组重复评论进行聚合，得到所述一组重复评论对应的一条聚合评论；其中，所述评论聚合条件为：所述重复评论的内容为首次出现，且包含的评论的数量大于初始聚合阈值，或者，所述重复评论的内容不为首次出现、且包含的评论的数量大于累积聚合阈值；所述初始聚合阈值大于所述累积聚合阈值；所述聚合评论的内容和所述重复评论的内容相互匹配；

发送单元，被配置为执行将所述聚合评论和所述当前拉取到的评论中未被聚合的评论，发送至客户端。

可选的，还包括：

获取单元，被配置为执行获取当前账户数量；其中，所述当前账户数量指代当前接入网络直播间的账户的总数；

设定单元，被配置为执行：

将所述当前账户数量所属的账户数量区间对应的初始阈值，作为所述初始聚合阈值，并将所述当前账户数量所属的账户数量区间对应的累积阈值，作为所述累积聚合阈值。

可选的，所述识别单元在当前拉取周期拉取到的评论中，识别出每一组重复评论时，具体执行：

可选的，所述识别单元在所述当前拉取周期拉取到的评论中，检测得到每两条内容相匹配的评论时，具体执行：

可选的，所述聚合单元对符合所述评论聚合条件的所述一组重复评论进行聚合，得到所述一组重复评论对应的一条聚合评论时，具体执行：

可选的，其特征在于，所述聚合单元还被配置为执行：

其中，所述聚合单元组合所述聚合内容和所述聚合数值，得到所述一组重复评论所对应的一条聚合评论时，具体执行：

根据本公开实施例的第三方面，提供一种电子设备，包括：

处理器；

用于存储所述处理器可执行指令的存储器；

其中，所述处理器被配置为执行所述指令，以实现如本公开实施例第一方面的任意一项提供的评论聚合的方法。

根据本公开实施例的第四方面，提供一种存储介质，当所述存储介质中的指令由电子设备的处理器执行时，使得所述电子设备能够执行本公开实施例第一方面的任意一项提供的评论聚合的方法。

根据本公开实施例的第五方面，提供一种计算机程序产品，所述计算机程序产品被执行时，用于实现本公开实施例的第一方面所提供的任意一项的评论聚合方法。

本公开的实施例提供的技术方案至少带来以下有益效果：

在对重复评论进行聚合时，针对重复评论的不同情况对应的设定两种不同的阈值，并基于不同的阈值进行重复评论的识别和聚合，获得更好的评论聚合效果。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理，并不构成对本公开的不当限定。

图1是根据一示例性实施例示出的一种视频平台的评论处理系统的结构示意图；

图2是根据一示例性实施例示出的一种评论聚合方法的流程图；

图3是根据一示例性实施例示出的一种识别重复评论的方法的流程图；

图4是根据一示例性实施例示出的另一种评论聚合方法的流程图；

图5是根据一示例性实施例示出的一种显示评论的界面示意图；

图6是根据一示例性实施例示出的又一种显示评论的界面示意图；

图7是根据一示例性实施例示出的一种评论聚合装置的结构框图；

图8是根据一示例性实施例示出的一种评论聚合装置的工作原理的示意图；

图9是根据一示例性实施例示出的一种电子设备的结构示意图。

具体实施方式

为了使本领域普通人员更好地理解本公开的技术方案，下面将结合附图，对本公开实施例中的技术方案进行清楚、完整地描述。

需要说明的是，本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

随着互联网技术的发展，市场上出现了各种基于互联网的视频平台。在视频平台的支持下，每一个观众(指视频平台中观看视频的用户)均可以利用客户端接入视频平台，然后通过观看视频平台的视频生产者(指视频平台中上传视频的用户)上传的视频。

目前在视频平台上观看视频的方式主要有直播和点播两种，视频平台可以同时支持两种方式，或者仅支持其中的任意一种。

在直播这种方式中，视频平台会提供多个网络直播间，每一个网络直播间对应于一个视频生产者(在直播领域一般称为主播)，观众可以在通过客户端访问视频平台后，选择视频平台提供的任意一个网络直播间接入，另一方面，主播可以在任意时刻开始拍摄并实上传视频至直播服务器，从而开启一次直播，直播服务器则在收到主播实时上传的视频后，同步地将视频发送至每一个接入该主播的网络直播间的客户端，使得对应的观众可以实时观看该主播当前拍摄的视频，在主播停止拍摄和上传视频后，本次直播结束。通过这种方式，主播可以在视频中实时地和接入网络直播间的观众互动。

在点播的方式中，视频生产者可以将自己的视频(可以是拍摄，剪辑，或者从其他渠道下载的视频)上传至视频平台管理的点播服务器，然后点播服务器存储视频生产者上传的这段视频，并为该视频配置对应的视频标签(包括但不限于封面图像，视频标题，视频主题词等)，观众通过客户端接入视频平台后，可以浏览视频平台的多个视频的视频标签，并选择其中感兴趣的视频，在观众选定要播放的视频后，点播服务器就将存储的视频发送至该观众的客户端，由客户端向观众播放。

不论采用上述哪种方式，为了增强观众之间的互动，吸引更多的用户使用视频平台，目前的视频平台一般均设置有评论处理系统，以支持在观众观看视频的时候，实时的显示其他观众对该视频发表的评论。

请参考图1，评论处理系统由数据库和与数据库连接的评论服务器组成。任意一个观众均可以在观看视频时输入自己对视频的评论，输入评论后，客户端的通信单元会通过数据库提供的应用程序接口(ApplicationProgrammingInterface，API)将评论上传至数据库，由数据库存储该评论。数据库可以采用现有的Redis架构，或者采用其他数据库架构。

其中，客户端可以运行于任意一个接入互联网并且可以运行程序的终端设备上，具体包括但不限于个人电脑，智能手机，平板电脑等。

在有多个观众同时观看同一视频时，评论服务器可以每经过一定的拉取周期，就从数据库拉取观众对该视频的一批评论(一般是最近这个拉取周期内收到的评论)，假设拉取周期固定为1s(秒)，则评论服务器每经过1s就从数据库拉取一次最近1s内收到的评论，然后将本次拉取到的这些评论发送给每一个正在播放该视频的客户端，客户端的通信单元接收这些评论后传递至显示单元，由显示单元在视频画面上显示收到的评论，由此，对应的观众可以浏览到其他正在观看该视频的观众的评论，这样，同时观看一个视频的多个观众之间就可以通过相互发表评论的方式进行互动。

可选的，上述拉取周期除了设定为一个固定时长外，还可以设定为一个根据接收的评论的数量动态调整的时长，例如，拉取周期可以设定为，每当检测到数据库中新增了M条评论时，当前时刻到前一次拉取评论的时刻之间就是一个拉取周期，换言之每当检测到数据库中新增了M条评论，就认为经过了一个拉取周期，然后从数据库拉取新增的这M条评论，之后，当数据库又新增了M条评论后，评论服务器继续拉取第二次新增的这M条评论，以此类推。

观看同一视频的多个观众有可能会发表多条重复评论，例如，当视频画面中出现一件衣服时，可能会有多个观众同时发表内容为“这件衣服好漂亮”的评论，如果将短时间内收到的所有重复评论逐一发送给客户端并由客户端在视频画面上显示，观众就会浏览到大量重复的评论，而无法注意到其他非重复的评论。在上述例子中，若某一次拉取了11条评论，其中10条评论的内容均为“这件衣服好漂亮”，另一条评论的内容为“这件衣服在哪买的”，若评论服务器直接将这11条评论全部发给客户端，则观众就很难注意到“这件衣服在哪买的”。

需要说明的是，在一个视频平台中，一条评论可以认为是上述数据库中的一条记录，该记录可以包括评论的内容，用户名，评论时间等信息，其中用户名是发布这条评论的账户(或者说观众)自定义的名称，评论时间为该账户发布这条评论的时间戳。例如，张三在T1时刻评论“真漂亮”，相应的，数据库中就会添加一条，用户名为张三，评论时间为T1，内容为“真漂亮”的记录，这条记录就相当于是T1时刻张三发布的一条评论，而其中“真漂亮”为这条评论的内容。

显然，多个账户可以在同一时刻发布多条评论，同一账户也可以在多个时刻分别发布多条评论，每一条评论都会作为一条记录存储在数据库中，并且，任意两条评论，其评论的内容有可能完全相同，也可能相似。

因此，如图1所示，评论处理系统一般均会支持对重复评论的聚合，也就是说，评论服务器每拉取一次评论，就会检测本次拉取的这一批评论中是否有多条内容相同的重复评论，并将重复的数量和预设的聚合阈值进行比对，拉取的这一批评论中，某一内容对应的重复评论的数量大于或等于聚合阈值，则对这些重复评论进行聚合，将多条内容相同的重复评论合并为一条对应内容的聚合评论，后续发送时将聚合评论和其他未被聚合的评论(包括不重复的评论，以及数量小于聚合阈值的重复评论)发送至客户端。

结合前述例子，通过评论聚合，评论服务器会将本次拉取的这一批11条评论中，内容相同(均为“这件衣服好漂亮”)的10条评论合并为一条聚合评论，例如，合并的聚合评论可以是“这件衣服好漂亮×10”，然后将聚合评论“这件衣服好漂亮×10”和未被聚合的评论“这件衣服在哪买的”发送至客户端，这样既能够在显示时突出重复评论的内容，也不会影响观众浏览其他非重复的，或者重复的数量较少的评论。

为了减少评论服务器所消耗的资源，现有的这种评论聚合的方法一般会设置一个较大的聚合阈值，例如，将聚合阈值确定为10，此时，只有在本次拉取到的一批评论中，同一内容对应的重复评论的数量足够多(即大于或等于设定的聚合阈值)时，评论服务器才会对该内容对应的这些重复评论进行聚合，若对应的本次拉取的这批评论中，同一内容对应的重复评论的数量较少(即小于聚合阈值)，则评论服务器不会对该内容对应的这些重复评论进行聚合。

结合前述例子，若拉取的一批评论中，内容为“这件衣服好漂亮”的重复评论的数量为10，则评论服务器这10条重复评论聚合为“这件衣服好漂亮×10”，若内容为“这件衣服好漂亮”的重复评论的数量小于10，例如，重复评论数量为8，则评论服务器不会对这8条重复评论进行聚合，而是将这8条重复评论均发送至客户端。

评论服务器拉取评论的周期一般较短，例如每隔1s就拉取一次，而客户端有可能会同时显示评论服务器多次发送的评论，比如可能会同时显示T0时刻，T1时刻(T1＝T0+1s)和T2时刻(T2＝T1+1s)评论服务器分别拉取的评论，若其中每一次拉取到的评论中均出现同一内容对应的多条重复评论，但是每一次拉取的评论中重复评论的数量均小于聚合阈值，也就是说，在评论服务器多次拉取的评论中均出现重复评论，但是每一次拉取的评论中重复评论的数量均较少(小于聚合阈值)，即重复评论以少量多次的方式出现时，现有的这种评论聚合方法就不会对这些重复评论进行聚合，导致客户端同时显示多次拉取的重复评论。

例如，T0时刻拉取的评论中有7条内容均为“树上的苹果好大”的重复评论，T1时刻拉取的评论中有8条内容均为“树上的苹果好大”的重复评论，T2时刻拉取的评论中有6条内容均为“树上的苹果好大”的重复评论。由于每一次拉取的评论中重复评论的数量均小于聚合阈值，评论服务器不会对任意一次拉取的评论中内容为“树上的苹果好大”的重复评论进行聚合，客户端则会同时显示上述三次拉取的评论中，共计21条内容为“树上的苹果好大”的重复评论，这样既影响观众浏览其他内容的评论，同时也不利于突出“树上的苹果好大”这一信息。

针对上述现有技术存在的问题，本申请实施例提供了一种评论聚合的方法，请参考图2，该方法可以包括以下步骤：

本申请任一实施例所提供的方法均可以应用于直播和点播两种视频观看方式。下述实施例以当前视频(指代视频平台的任意一个视频)为例进行说明，但是，本申请任一实施例所提供的方法可以应用于视频平台中的任意一个视频，或者说任意一个网络直播间。

也就是说，对于视频平台中的每一个当前有多个账户在观看的视频，评论服务器均可以通过执行本申请所提供的评论聚合方法聚合各个账户在观看过程中发表的评论，同样的，对于每一个网络直播间，主播开始直播之后，评论服务器均可以通过执行本申请所提供的评论聚合方法聚合接入该网络直播间中的每一个账户在观看直播时发表的评论。

本申请任一实施例所提供的评论聚合的方法的执行主体可以认为是上述评论服务器。

在步骤S21中，在当前拉取周期拉取到的评论中，识别出每一组重复评论。

其中，识别得到的每一组重复评论均包括内容相匹配的至少一条评论。

当前拉取周期拉取到的一批评论，可以包括从前一次拉取评论的时刻T0到当前时刻T1的这段时间内，数据库接收到的在浏览当前视频的账户(相当于在观看当前视频的观众)通过客户端发送的评论。客户端发送的评论可以携带客户端发送该评论的时间戳，这样，评论服务器每次要拉取一批评论时，就可以从数据库中查找并读取出每一条对应的时间戳位于T0至T1这段时间内的评论，将读取得到的所有评论，确定为本次拉取得到的一批评论。

步骤S21中的一组重复评论，可以理解为，当前拉取得到的一批评论中，对应的内容相互匹配的评论的集合。

评论的内容，可以理解为某观众发表的一条评论所包含的文本(其中可以包括文字、数字和符号)，例如，观众甲发表评论“XX游戏我玩过，可好玩了”，该评论的内容就是“XX游戏我玩过，可好玩了”。

两条评论的内容相互匹配，可以包括，这两条评论的内容完全相同。例如，观众A发表“XX地方的海水很清澈”的评论，观众B也发表“XX地方的海水很清澈”的评论，观众A和观众B发表的两条评论的内容完全相同，此时可以认为观众A发表的评论的内容和观众B发表的评论的内容相互匹配，

另外，若两条评论的内容具有较高的相似度，或者说，两条评论的内容的相似度大于或等于预设的阈值，那么，也可以认为这两条评论的内容相互匹配。可选的，可以用两条评论的内容中相同的字符的数量，除以任意一条评论内容的字符的数量，将得到的比值作为这两条评论的内容的相似度。例如，观众A发表“YY地方的小吃很好吃”的评论，观众B发表“YY地方的小吃真好吃”的评论，两条评论的内容中相同的字符的数量为9，任意一条评论内容的字符的数量为10，计算得到两条评论的内容的相似度为90％，若设定的阈值为85％，则这两条评论的内容的相似度大于阈值，可以认为这两条评论的内容相互匹配。

可以理解的，前述评论的内容完全相同，也可以认为是评论的内容的相似度为100％的一种特例。

本申请提供的评论聚合方法还可以用其他的方法判断任意两条评论的内容是否相互匹配，此处不一一列举。

在拉取得到的一批评论中，可以有两组及以上的重复评论。例如，当前拉取到的一批评论中，内容为“主播真好看”的评论有6条，这6条评论可以构成一组重复评论。

另外有4条内容为“主播的游戏技术真高”的评论，和3条内容为“主播的游戏技术很高”的评论，其中内容“主播的游戏技术真高”和内容“主播的游戏技术很高”可以认为是两种相互匹配的内容，因此，上述7条评论可以组成当前拉取的这一批评论的另一组重复评论。

在步骤S22中，当任意一组重复评论符合评论聚合条件时，对这一组重复评论进行聚合，得到这一组重复评论对应的一条聚合评论。

也就是说，步骤S22可以包括两个步骤，其一是逐一检测步骤S21中确定的每一组重复评论是否符合评论聚合条件，其二是对检测出符合评论聚合条件的每一组重复评论进行聚合，将符合评论聚合条件的每一组重复评论均聚合为对应的聚合评论，相对于的，若一组重复评论不符合评论聚合条件，则不需要对这一组重复评论进行聚合。

其中，对于每一组符合评论聚合条件的重复评论，将其聚合后得到的聚合评论可以包括聚合内容和聚合数值两部分，其中的聚合内容和对应的这一组重复评论的内容相互匹配。

本申请所提供的评论聚合方法中，评论聚合条件可以包括下述两方面：

第一方面，一组重复评论中评论的内容为首次出现，并且这一组重复评论包含的评论的数量大于初始聚合阈值。

第二方面，一组重复评论中评论的内容不是首次出现，并且这一组重复评论包含的评论的数量大于累积聚合阈值。

其中，初始聚合阈值大于累积聚合阈值。比如，若初始聚合阈值设定为10，那么累积聚合阈值就设定为一个小于10的正整数，例如可以设定为6。

对于一组重复评论，只要这组重复评论符合上述至少一方面的条件，就可以认为这组重复评论符合评论聚合条件。

上述评论聚合条件中，一组重复评论中评论的内容首次出现，可以理解为，评论服务器在最近的N个拉取周期内拉取的N批评论中，只有当前这一次拉取得到的这批评论中出现了这组重复评论，而在之前的N-1次拉取中，每次拉取得到的一批评论中均未出现对应的内容和这组重复评论包含的评论的内容相互匹配的其他评论。N是一个预设的正整数。

假设N设定为6，拉取评论的周期为1s，即评论服务器每隔1s拉取一批评论，假设评论服务器连续执行了6次拉取评论的动作，分别拉取得到6批评论，其中，当前拉取到的这一批，即第6次拉取得到的第6批评论中有4条内容均为“厉害”的评论，构成一组重复评论，而前5批评论中均未出现对应的内容和“厉害”相匹配的评论，比如，前5批评论未出现内容同样为“厉害”，也未出现对应的内容和“厉害”的相似度高于阈值的评论，如内容为“好厉害”的评论，则当前拉取的这一批评论中内容均为“厉害”的这一组重复评论，其内容为首次出现。

结合上述例子，若当前拉取到的这一批评论中，有3条内容为“主播的游戏技术真高”的评论，和3条内容为“主播的游戏技术很高”的评论，这6条评论构成一组重复评论，而前5批评论中，第4次拉取得到的第4批评论中，有2条内容均为“主播的游戏技术真高”的评论，和2条内容为“主播的游戏技术很高”的评论，那么，当前拉取到的这一批评论中，由3条内容为“主播的游戏技术真高”的评论，和3条内容为“主播的游戏技术很高”的评论构成的一组重复评论，其内容就不是首次出现的。

将本申请提供的评论聚合方法应用于直播领域时，重复评论的内容首次出现，也可以理解为，本次直播开始以来，首次出现这一组重复评论中评论的内容。也就是说，若本次直播开始以来，在当前拉取的这一批评论之前的每一批评论中，均未出现对应的内容和重复评论中评论的内容相互匹配的评论，则这一组重复评论中评论的内容为首次出现，反之，若不符合前述条件，则这组重复评论中评论的内容不为首次出现。

如前文所述，评论聚合条件包括两个方面，对于符合不同方面的评论聚合条件的一组重复评论，对应的聚合方式也存在一定区别。

对于符合第一方面的评论聚合条件的一组重复评论，其聚合方式可以包括：

从一组重复评论中选择任意一条评论，并将被选择的评论的内容确定为聚合内容；

当这一组重复评论符合重复评论的内容为首次出现，且包含的评论的数量大于初始聚合阈值条件时，将这一组重复评论包含的评论的数量确定为聚合数值；

组合聚合内容和聚合数值，得到这一组重复评论所对应的一条聚合评论。

也就是说，对符合第一方面的评论聚合条件的一组重复评论进行聚合时，首先从这一组重复评论中选择任意一条评论，以被选择的评论的内容作为聚合内容。

可选的，在这一组重复评论中每条评论的内容不完全相同时，可以从对应的内容完全相同、且在这一组重复评论中数量最多的那些评论中选择一条评论，以其内容作为聚合内容。例如，若一组重复评论中有5条内容均为“主播的游戏技术真高”的评论，和3条内容为“主播的游戏技术很高”的评论，那么可以选择内容为“主播的游戏技术真高”的评论，以其内容，即“主播的游戏技术真高”作为聚合内容。

确定聚合内容后，统计这一组重复评论所包含的评论的数量，以统计结果作为聚合数值。例如，若一组符合前述第一方面的评论聚合条件的重复评论一共包含20条评论，那么对这组重复评论进行聚合时，确定的聚合数值就是20。

最后，将聚合内容和聚合数值组合，得到这一组重复评论对应的一条聚合评论。例如，一组符合前述第一方面的评论聚合条件的重复评论一共包含20条内容均为“主播真漂亮”的评论，其聚合内容为“主播真漂亮”，聚合数值为20，组合后得到的聚合评论可以是：“主播真漂亮×20”。

通过将内容首次出现的一组重复评论按上述方法进行聚合，并展示相应的聚合评论，一方面，用户能够看到重复评论的内容，并通过聚合数值直观的了解到该内容在最近的一批评论中出现的频率。另一方面，将多条重复评论合并为一条聚合评论，也可以避免屏幕上显示过多的重复评论而影响用户正常观看视频和其他的评论，同时也能够减少用户的终端设备显示评论所消耗的计算资源。

对于符合第二方面的评论聚合条件的一组重复评论，其聚合方式可以包括：

当这一组重复评论符合重复评论的内容不为首次出现、且包含的评论的数量大于累积聚合阈值条件时，将这一组重复评论包含的评论的数量，和目标组重复评论包括的评论的数量相加，得到聚合数值。

其中，目标组重复评论指代：与当前的聚合内容相匹配的前一条聚合评论对应的一组重复评论。

也就是说，对于符合第二方面的评论聚合条件的一组重复评论进行聚合时，首先确定聚合内容，该过程与前文对符合第一方面的评论聚合条件的重复评论的聚合过程中对应的步骤一致，不再赘述。

将当前这组重复评论(指代当前拉取的这批评论中的一组重复评论)包含的评论的数量，和前N-1次拉取得到的N-1批评论中，对应的聚合内容与当前的聚合内容(指代根据当前这组重复评论确定得到的聚合内容)相互匹配的聚合评论的聚合数值相加，得到当前的这组重复评论的聚合数值。

将当前这一组重复评论包含的评论的数量，和目标组重复评论包括的评论的数量相加，得到当前这组重复评论的聚合数值。

其中，目标组重复评论指代：与聚合内容相匹配的前一条聚合评论对应的一组重复评论。这里的聚合内容，是指根据当前的这一组重复评论确定出来的聚合内容。

可选的，如果与聚合内容相匹配的前一条聚合评论的聚合数值，大于对应的目标组重复评论包含的评论的数量，那么在计算当前这组重复评论的聚合数值时，也可以将当前这一组重复评论包含的评论的数量，和与聚合内容相匹配的前一条聚合评论的聚合数值相加，得到当前这组重复评论的聚合数值。

结合前述例子，设N等于6，初始聚合阈值为9，累积聚合阈值设定为5，评论服务器以1s的间隔连续执行了5次拉取并发送评论之后，第6次拉取得到的第6批评论(即当前拉取得到的一批评论)中，出现7条内容均为“好大的苹果”的评论，显然这7条评论构成一组重复评论。

在之前第4次拉取得到的第4批评论中，有10条内容均为“好大的苹果”的评论，并且对于第4批评论，内容“好大的苹果”为首次出现，即在第4批评论之前的5批评论中均未出现内容为“好大的苹果”的评论。在处理第4批评论时，其中的10条内容均为“好大的苹果”的评论构成一组重复评论，且这一组重复评论符合前述第一方面的评论聚合条件，因此将其聚合得到聚合评论：“好大的苹果×10”。

在处理当前这组重复评论，即第6批评论中的7条内容均为“好大的苹果”的评论时，由于其内容不为首次出现，且评论的数量大于累积聚合阈值，因此对这一组重复评论进行聚合，聚合内容为“好大的苹果”，确定聚合数值时，将当前这组重复评论包含的评论数量7，和之前的5批评论中，对应的内容相互匹配的聚合评论(即：“好大的苹果”×10)的聚合数值10相加，得到当前这组重复评论对应的聚合数值17。

最后，将聚合内容和聚合数值组合，得到这一组重复评论对应的一条聚合评论。结合上述例子，对于第6批评论中的7条内容均为“好大的苹果”的评论，其对应的聚合评论为：“好大的苹果×17”。

可选的，若前N-1批评论中未出现对应的聚合内容和当前这组重复评论的聚合内容相互匹配的聚合评论，那么，上述聚合数值也可以设定为，当前这组重复评论包含的评论的数量，和前N-1批评论中对应的内容和当前这组重复评论的内容相互匹配的评论的数量。

例如，上述例子中，第4批评论中，有6条内容均为“好大的苹果”的评论，评论的数量小于初始聚合阈值，并且对于第4批评论，内容“好大的苹果”为首次出现，在第4批评论中这组重复评论不符合任意一方面的评论聚合条件，因此未进行聚合。这种情况下，计算当前这组由7条内容均为“好大的苹果”的评论组成的重复评论对应的聚合数值时，仍然可以将当前这组重复评论包含的评论的数量，和第4批评论内容为“好大的苹果”的评论的数量6相加，将得到的结果13作为当前这组重复评论的聚合数值。

采用这种计算聚合数值的方式的效果在于，聚合评论中的聚合数值，可以突出对应的聚合内容的重要程度，聚合数值越大表示该聚合内容越重要，或者说该聚合内容越受观众关注。若前几批评论中出现了对应的聚合内容与当前这批的聚合评论的聚合内容相匹配的聚合评论，表明这一聚合内容的重要程度较高，此时仅以当前这批评论中重复评论的数量作为聚合数值，显然不能准确反映对应的聚合内容受观众关注的程度，而通过本实施例提供的计算聚合数值的方法，可以将前几批评论中对应的聚合内容相互匹配的聚合评论的聚合数值累加至当前这条聚合评论的聚合数值中，更准确的反映对应的聚合内容受观众关注的程度，使观众能够了解到观看当前视频的其他观众真实的意见，并避免对应于相同内容的重复评论的累加出现断裂。

进一步的，为了增强观众之间的互动，显示评论时一般会将评论的内容和发表评论的观众的用户名一并显示，例如，小明发表了内容为“这辆车很好看”的评论，则客户端可以显示“小明说：这辆车很好看”。

针对这种情况，在将一组重复评论聚合为对应的聚合评论时，可以在组合聚合内容和聚合数值，得到这一组重复评论所对应的一条聚合评论之前，执行如下步骤：

根据这一组重复评论所包含的每一条评论的观众的用户名，生成聚合用户列表。

相应的，后续的组合聚合内容和聚合数值，得到这一组重复评论所对应的一条聚合评论的步骤，可以替换为：

组合聚合用户列表、聚合内容和聚合数值，得到这一组重复评论所对应的一条聚合评论。

通过这种方式，客户端显示聚合评论时，观众可以知道是哪些观众发表了对应内容的评论。

例如，一组重复评论包含10条内容均为“好大的苹果”的评论，分别由3个观众发送，对应的用户名分别以用户1，用户2和用户3表示，用户1发表了3条，用户2发表了4条，用户3发表了3条，那么，聚合用户列表为“用户1，用户2，用户3”，聚合后得到这一组重复评论的聚合评论可以是，“用户1，用户2和用户3说：好大的苹果×10”。

进一步的，当一组重复评论中，发表评论的观众数量过多时，在聚合评论中可以只显示前几位发表评论的观众的用户名，而省略其他观众的用户名。结合前述例子，若10条内容均为“好大的苹果”的评论分别由10个观众发表，对应的用户名依次是用户1至用户10，则可以只显示前三位观众的用户名，而省略其他用户名，最终生成的聚合评论可以是“用户1，用户2和用户3……说：好大的苹果×10”。

在步骤S23中，将聚合评论和当前拉取到的评论中未被聚合的评论，发送至客户端。

步骤S23中的发送至客户端，是指，发送至每一个正在播放当前视频的客户端，或者，在直播领域中，也可以理解为，发送至每一个接入当前网络直播间的客户端。

可选的，客户端可以根据收到的评论对应的时间戳(表示客户端向数据库发送该评论的时间)的先后对收到的一批评论进行排序，然后顺序显示每一条评论。对应的，评论服务器在将一组重复评论聚合得到一条对应的聚合评论时，可以将这一组重复评论中，最早发送至数据库的那一条评论的时间戳，作为对应的聚合评论的时间戳，以便客户端可以根据时间戳确定聚合评论和其他未被聚合的评论的显示顺序。

可选的，客户端可以配置为，在显示评论时，对于聚合评论和未被聚合的其他评论采用不同的颜色、字体或其他特效进行显示，以便突出聚合评论。

例如，可以对未被聚合的其他评论采用较小的字体进行显示，而采用较大的字体显示聚合评论。或者，对未被聚合的其他评论直接显示文字，显示聚合评论时则采用包括但不限于发光，闪烁在内的多种特效，从而达到突出显示聚合评论的效果。

请参考图3，在步骤S21中，从拉取得到的一批评论中识别出每一组重复评论的过程可以包括如下步骤：

S31、在当前拉取周期拉取到的评论中，检测得到每两条内容相匹配的评论。

判断两条评论的内容是否相互匹配的方法可以是：

计算当前拉取周期拉取到的评论中，每两条评论的内容的相似度；

将当前拉取周期拉取到的评论中，每两条内容的相似度大于或等于预设阈值的评论，确定为两条内容相匹配的评论。

也就是说，对于当前拉取周期拉取到的评论中的每两条评论，可以计算这两条评论的内容的相似度，若相似度大于设定的阈值，则确定这两条评论的内容相互匹配。

其中，相似度大于设定的阈值，具体可以对应于两种情况，其一是两条评论的内容完全相同，即相似度为100％，其二是两条评论的内容不完全相同，但是文本的相似度较高，即两条评论的内容中有大量相同的文字，而仅有少数几个文字不同，这种情况也可以认为这两条评论的内容相互匹配。

考虑到两条评论的内容有可能出现大部分文字相同，但是表示的语义完全不同的情况，例如，“XX地方生产的苹果很大”和“XX地方生产的苹果很甜”，仅以前文步骤S21中计算相似度的方法，两种内容的文本的相似度很高，但显然两者的语义不相同，这两种内容并不相互匹配。

为了能够识别上述情况，可以进一步将上述第二种判断方法和语义识别技术相结合。首先可以预先利用大量的样本语句对一个神经网络模型进行训练，得到一个语义识别模型，将两个语句输入该语义识别模型，就可以语义识别模型就可以输出这两个语句的语义是否相同。

基于此，在执行步骤S31时，可以首先用步骤S21中计算相似度的方法计算两条评论的内容的文本的相似度，若两条评论的内容不完全相同，但是相似度大于预设的阈值，则将这两条评论的内容输入前述语义识别模型，若识别的结果是这两条评论的内容具有相同的语义，则判断出这两条评论的内容相互匹配，这两条评论属于一组重复评论，反之，若识别的结果是这两条评论的内容具有不相同的语义，则判断出这两条评论的内容不相互匹配。

上述判断内容是否匹配的方法，可以将对应内容的语义和表述方式基本一致的若干条评论识别为一组重复评论，并且避免将文本的相似度极高，但是语义完全不同的多条评论识别为重复评论，既能够避免将不同语义的评论聚合为聚合评论而导致的信息丢失，又能够准确的识别出相互匹配的内容。

S32、将当前拉取周期拉取到的评论中，内容相匹配的所有评论确定为一组重复评论。

在执行步骤S32时，首先可以在当前拉取周期拉取到的评论中，选择任意一条未被标记的评论(记为目标评论)，然后查看步骤S31中的检测结果，看是否有内容和目标评论的内容相匹配的其他评论(除目标评论以外的未被标记的评论)，如果有内容和目标评论的内容相匹配的其他评论，就把目标评论，以及每一条和目标评论的内容相匹配的其他评论，标记为一组重复评论，比如，可以将这些评论均标记为：重复评论1，由此即识别得到一组重复评论。

如果判断出没有内容和目标评论的内容相匹配的其他评论，就可以将目标评论标记为非重复评论。

在识别出一组重复评论，或者标记了一条非重复评论之后，若当前拉取周期拉取到的评论中还有未被标记的评论，则继续从其他未被标记的评论中选择一条目标评论，然后重复上述过程，直至当前拉取周期拉取到的每一条评论均被标记为止。通过这种方式，就可以将当前拉取周期中所有内容相互匹配的评论均确定为对应的一组重复评论。

下面结合一个具体的例子说明识别重复评论的过程。

假设当前拉取到的一批评论中包括30条评论，依次记为评论1至评论30。开始识别重复评论后，首先对这30条评论中的每两条评论执行步骤S31，以检测每两条评论的内容是否相互匹配，得到相应的检测结果。

然后，以评论1作为目标评论，若检测结果指示当前拉取的这30条评论中不存在内容和评论1的内容相匹配的评论，则标记评论1为未重复评论，若检测结果指示当前拉取的这30条评论中有若干条对应的内容和评论1的内容相匹配的评论，将这些内容和评论1的内容相匹配的评论和评论1标记为一组重复评论(如标记为重复评论1)。

完成上述对评论1的标记之后，若评论2未被标记为重复评论，则以评论2作为目标评论，重复上述过程，若评论2被标记为重复评论，则跳过评论2，判断评论3是否被标记为重复评论，若评论3未被标记为重复评论，则以评论3作为目标评论，重复上述过程，若评论3被标记为重复评论，则跳过评论3，以此类推，直至当前拉取到的这一批评论中每一条评论均被标记为未重复评论或重复评论为止。

其中，若当前拉取到的一批评论中存在两组及以上的重复评论，那么，对每一组重复评论采用不同的重复评论标记。例如，对于6条内容均为“主播真漂亮”的评论构成的一组重复评论，将这6条评论均标记为重复评论1，对于由7条内容均为“主播玩游戏好厉害”的评论组成的另一组重复评论，将这7条评论均标记为重复评论2，由此，就可以通过重复评论标记区分不同组的重复评论，从而分别对当前拉取到的一批评论中不同组的重复评论分别进行聚合，得到不同的聚合评论。

上述检测方案，可以将内容完全相同的多条评论，以及内容相似并且具有相同语义的评论均识别为重复评论，以便在后续的步骤中进行聚合。这种检测方案可以加强评论聚合的力度，让用户更能注意都多种体现了不同信息的评论，而避免大量的语义相同且内容相近的评论影响用户浏览其他评论。

在步骤S22的评论聚合条件中，初始聚合阈值和累积聚合阈值的具体取值可以根据观看当前视频的观众的数量进行调整，具体的，评论服务器可以每经过一个预设的调整周期，例如，每经过20秒，就检测一次观看当前视频的观众的数量，然后根据观众的数量对初始聚合阈值和累积聚合阈值进行调整。

在本公开提供的方法应用于网络直播领域时，一种可选的调整方式是，

获取当前账户数量。

其中，所述当前账户数量指代当前接入网络直播间的账户的总数。

在预先划分的多个账户数量区间中，确定当前账户数量所属的账户数量区间。

其中，每一个账户数量区间均对应有一个初始阈值和一个累积阈值。

将当前账户数量所属的账户数量区间对应的初始阈值，确定为初始聚合阈值，并将当前账户数量所属的账户数量区间对应的累积阈值，确定为累积聚合阈值。

在网络中，每一个观众均对应于网站的一个账户，因此上述检测观看当前视频的观众的数量，相当于检测目前在浏览当前视频的账户的总数，即检测该视频的当前账户数量。进一步的，当本申请提供的方案应用于网络直播领域时，当前视频就是一个网络直播间内播放的视频，检测观看当前视频的观众的数量，就相当于是，检测该网络直播间的当前账户数量，当前账户数量用于指代当前接入网络直播间的账户的总数。

在实际实施上述调整方式时，可以预先设置两个或以上连续且互相不重叠的观众数量区间，例如，以大于0，小于或等于500作为第一个观众数量区间，大于500，小于或等于3000作为第二个观众数量区间，以大于3000作为第三个观众数量区间。当然，观众数量区间的个数和具体的范围可以根据实际情况设定，前述3个区间仅仅是一种可选的例子。

由于每一个观众，或者说用户，均在视频平台对应有至少一个账户，因此，本实施例中的观众数量区间，也可以认为是账户数量区间。

在此基础上，为每一个观众数量区间设置一个对应的初始阈值和一个累积阈值，其中，对于任意的两个观众数量区间，若一个观众数量区间位于另一个观众数量区间的右侧(例如，大于500，小于或等于3000的区间位于大于0，小于或等于500的区间的右侧)，即一个观众数量区间的下限大于或等于另一个观众数量区间的上限，则位于右侧的一个观众数量区间的初始阈值，大于另一个位于左侧的观众数量区间的初始阈值，并且，位于左侧的一个观众数量区间的累积阈值，大于另一个位于左侧的观众数量区间的累积阈值。

例如，对于前述三个观众数量区间，第一个观众数量区间对应的初始阈值可以是10，累积阈值为6，第二个观众数量区间对应的初始阈值可以是20，累积阈值为15，第三个观众数量区间对应的初始阈值可以是30，累积阈值可以为26。

然后，在获取到观看当前视频的观众的数量后，检测观众的数量位于设定的哪一个观众数量区间内，选择观众的数量所属的那个观众数量区间对应的初始阈值，作为初始聚合阈值，并选择观众的数量所属的那个观众数量区间对应的累积阈值，作为累积聚合阈值。

通过上述方法对初始聚合阈值和累积聚合阈值进行调整，可以实现以视频当前的观众的数量，或者说以当前接入网络直播间的观众的数量为依据动态地调整聚合阈值。

由此，一方面可以使当前观众的数量较多的视频(应用于直播领域时，也可以认为是当前观众的数量较多的网络直播间)具有较大的聚合阈值(不论是初始聚合阈值还是累积聚合阈值)，从而增加重复评论被聚合的难度，只有那些包含的评论的数量更多的重复评论才会被聚合。对重复评论进行聚合的一个作用在于，通过聚合评论突出重要内容(一般认为多数观众发表的内容可能是重要内容)，而聚合评论的数量过多时，显然这种突出重要内容的作用就会减弱。

所以，在观众的数量较多时，可能会出现很多组对应于不同内容的重复评论，此时设定一个较大的聚合阈值，可以避免聚合出过多的聚合评论，控制聚合评论的数量，确保只对在当前的所有观众中占到一定比例的观众发表的重复评论才会被聚合为聚合评论，使得聚合评论能够充分发挥其突出重要内容的作用。

另一方面，对于当前观众的数量较少的视频，即使出现重复评论，由于整体的观众数量较少，每一组重复评论包含的评论的数量也必然少于当前观众的数量较多的视频中重复评论的数量，此时若设定较大的阈值可能导致大多数的重复评论均不会被聚合，同样无法起到通过评论聚合突出对应的聚合内容和其他未重复评论的效果，因此，需要针对当前观众的数量较少的视频配置较小的初始聚合阈值和累积聚合阈值，以确保评论聚合方法能够对少量的重复评论进行聚合。

对于一组重复评论，有可能这组重复评论的内容不是首次出现，但是在前N-1批评论中，对应的内容和这组重复评论的内容相互匹配的评论的数量较少，这种情况下即使客户端同时显示评论服务器发送的多批评论，其中重复评论的数量也较少，既不会影响观众浏览其他评论，也不需要对这些重复评论进行聚合以突出其内容，换言之，这种情况下不适宜直接基于累积聚合阈值判断当前这组重复评论是否符合评论聚合条件。

因此，上述第二方面的评论聚合条件可以进一步限定为：

在之前的N-1批评论中，出现过对应的聚合内容和这一组重复评论中评论的内容相互匹配的聚合评论，且这一组重复评论包含的评论的数量大于或等于累积聚合阈值。

例如，评论服务器第P次(P为任意的正整数)拉取的一批评论中，有3条内容均为“跑车的速度真快”的评论，在这一批评论中构成重复评论，但是该内容为首次出现，且数量小于初始聚合阈值(假设初始聚合阈值为9)，所以未进行聚合。

随后在第P+2次拉取到的一批评论中，又出现6条内容均为“跑车的速度真快”的评论，尽管该内容不为首次出现，且数量大于累积聚合阈值(假设累积聚合阈值为5)，但是在之前的N-1批评论中，未出现聚合内容为“跑车的速度真快”的聚合评论，因此，不对这一批评论中6条内容均为“跑车的速度真快”的评论进行聚合。

相对的，若前述第P次拉取的一批评论中，内容为“跑车的速度真快”的评论有10条，就需要对这组重复评论进行聚合，得到聚合评论“跑车的速度真快×10”，进而在第P+2次拉取的这一批评论中，由于之前出现过对应的聚合内容相匹配的聚合评论，且重复评论的数量大于累积聚合阈值，因此需要对第P+2次拉取的这批评论中6条内容均为“跑车的速度真快”的评论进行聚合，得到对应的聚合评论“跑车的速度真快×16”。

通过这种方式，可以避免在累积的重复评论的数量过少的时候进行聚合，既能够控制聚合评论的数量，使得聚合评论能够突出重要内容，也能够避免对少量的重复评论进行聚合，导致客户端显示的评论的数量过少。

最后，为了方便理解本申请实施例提供的评论聚合的方法，下面结合一个具体的例子，并参考图4，说明本申请实施例提供的评论聚合方法。

设定累积聚合阈值为6，初始聚合阈值为10，拉取评论的间隔为1s。

假设主播开始在网络直播间直播后的任意时刻T0，评论服务器从数据库拉取了一批，共20条评论，基于前述图2对应的方法对这一批评论进行处理，其中有11条内容均为“主播真漂亮”的评论，构成一组重复评论，经检测这一组重复评论的内容为首次出现，且重复评论的数量大于初始聚合阈值，于是以“主播真漂亮”为聚合内容，聚合数值为11，生成聚合评论“主播真漂亮×11”，然后将聚合评论和其他未被聚合的9条评论发送至客户端。

经过1s以后，评论服务器在T1时刻(T1＝T0+1s)再次拉取一批，共计16条评论，经检测这16条评论中没有重复评论，也就是这16条评论均为不重复的评论，于是直接将这16条评论发送至客户端。

T1时刻之后，又经过1s，评论服务器在T2时刻(T2＝T1+1s)再一次拉取一批，共计24条评论，如图4所示，经过检测发现其中有内容为“厉害”的评论共计13条，内容为“主播真漂亮”的评论共计7条，其他未重复的评论4条。

其中，内容“主播真厉害”为首次出现，对应的一组重复评论包含13条评论，数量大于初始聚合阈值，于是将这一组内容均为“主播真厉害”的重复评论聚合为一条聚合评论“主播真厉害×13”。

可以发现，内容“主播真漂亮”不为首次出现，在前两批评论中，具体是在T0时刻拉取的那一批评论中出现过，并且在那一批评论中，对内容为“主播真漂亮”的重复评论进行了聚合，因此，在当前这批评论(指T2时刻拉取的这一批评论)中，内容为“主播真漂亮”符合前述第二方面的评论聚合条件，也就是内容不为首次出现，且重复评论的数量7大于累积聚合阈值6，需要对这一组重复评论进行聚合，根据前述步骤S23中的聚合方法，对内容为“主播真漂亮”的这组重复评论聚合后得到的聚合评论可以是“主播真漂亮×18”，其中，聚合数值为当前这组重复评论包含的评论的数量7，和前一条对应的内容相互匹配的聚合评论的聚合数值11之和。

以上拉取的三批评论中，未重复的评论的具体内容均在图4中省略。

本申请提供的评论聚合方法，针对对应的内容首次出现的重复评论设置较大的初始聚合阈值，针对对应的内容不为首次出现的重复评论设置较小的累积聚合阈值，通过这种方式，本申请提供的评论聚合方法可以分别对单次大量出现的重复评论，和多次少量出现的重复评论均进行聚合，既能够有效的突出符合评论聚合条件的每一组重复评论对应的内容，也能够避免客户端显示大量的重复评论而干扰观众浏览其他少量的，或者非重复的评论。

需要说明的是，本申请实施例所提供的评论聚合方法中，由评论服务器发送至客户端的聚合评论，和未被聚合的评论，可以采用多种可选的方式进行显示。

一种可选的显示方式可以参考图5，图5上方为不进行评论聚合的情况下，客户端显示评论服务器下发的一批评论的界面示意图，图5下方为进行评论聚合后，客户端显示评论服务器下发的聚合评论和其他未被聚合的评论的界面示意图。其中，每一条评论均在视频画面的左下角以竖排的形式逐条显示。

另一种可选的显示方式可以参考图6，与图5相同，图6上方为不进行评论聚合的情况下，客户端显示评论服务器下发的一批评论的界面示意图，图6下方为进行评论聚合后，客户端显示评论服务器下发的聚合评论和其他未被聚合的评论的界面示意图。在这种显示方式中，每一条评论从视频画面的右侧以一定的速度向左侧横向移动。

图5和图6中，冒号前面的用户1，用户2等用于表示发表该评论的观众在视频平台中的用户名，冒号后面的文本就是该观众发表的评论的内容。

通过上述两种界面示意图可以发现，通过对重复评论进行聚合，一方面可以突出重复评论的内容，另一方面，也可以避免大量的重复评论影响观众浏览其他非重复的评论，有效的改善用户体验。

进一步的，通过评论聚合，评论服务器需要发送的数据由原本的多条重复评论，变更为一条聚合评论，有效的减少评论服务器向客户端发送评论时占用的网络带宽。

结合本申请任一实施例提供的评论聚合的方法，请参考图7，本申请实施例还提供一种评论聚合装置，该装置可以包括如下单元：

识别单元701，被配置为执行在当前拉取周期拉取到的评论中，识别出每一组重复评论。

其中，一组重复评论包括内容相匹配的至少一条评论。

拉取到的这些评论可以由识别单元701从数据库拉取。

检测单元702，被配置为执行检测每一组重复评论是否符合评论聚合条件。

其中，评论聚合条件为：重复评论的内容为首次出现，且包含的评论的数量大于初始聚合阈值，或者，重复评论的内容不为首次出现、且包含的评论的数量大于累积聚合阈值；初始聚合阈值大于累积聚合阈值。

聚合单元703，被配置为执行对符合评论聚合条件的一组重复评论进行聚合，得到一组重复评论对应的一条聚合评论。

其中，聚合评论的内容和重复评论的内容相互匹配。

发送单元704，被配置为执行将聚合评论和当前拉取到的评论中未被聚合的评论，发送至客户端。

可选的，本实施例提供的评论聚合装置还可以包括：

获取单元705，被配置为执行获取网络直播间当前账户数量。

设定单元706，被配置为执行从多个预设的初始阈值中选取与当前账户数量相匹配的初始阈值作为初始聚合阈值，并从多个预设的累积阈值中选取与当前账户数量相匹配的累积阈值作为累积聚合阈值。

当前账户数量，指代，当前接入网络直播间的账户的总数。

可选的，识别单元701在当前拉取到的评论中，识别出每一组重复评论时，具体执行：

在当前拉取周期拉取到的评论中，检测得到每两条内容相匹配的评论；

将当前拉取周期拉取到的评论中，内容相匹配的所有评论确定为一组重复评论。

可选的，识别单元701在当前拉取到的评论中，在当前拉取周期拉取到的评论中，检测得到每两条内容相匹配的评论时，具体执行：

可选的，聚合单元703对符合评论聚合条件的一组重复评论进行聚合，得到一组重复评论对应的一条聚合评论时，具体执行：

当一组重复评论符合重复评论的内容不为首次出现、且包含的评论的数量大于累积聚合阈值条件时，将一组重复评论包含的评论的数量，和目标组重复评论包括的评论的数量相加，得到聚合数值；其中，目标组重复评论指代：与聚合内容相匹配的前一条聚合评论对应的一组重复评论；

组合聚合内容和聚合数值，得到一组重复评论所对应的一条聚合评论。

当一组重复评论符合重复评论的内容为首次出现，且包含的评论的数量大于初始聚合阈值条件时，将一组重复评论包含的评论的数量确定为聚合数值；

可选的，聚合单元703还被配置为执行：

根据一组重复评论包含的每一条评论的观众的用户名，生成聚合用户列表；

其中，聚合单元703组合聚合内容和聚合数值，得到一组重复评论所对应的一条聚合评论时，具体执行：

组合聚合用户列表、聚合内容和聚合数值，得到一组重复评论所对应的一条聚合评论。

请参考图8，本申请实施例提供的评论聚合装置的工作原理简述如下：

识别单元从数据库拉取一批评论后，识别出这一批评论中的每一组重复评论，以及每一条未重复的评论。

随后，识别出的未重复的评论由识别单元传递至发送单元，识别出的每一组重复评论由则传递至检测单元。

检测单元检测每一组重复评论是否符合评论聚合条件，将检测出不符合评论聚合条件的一组重复评论传递至发送单元，并将检测出符合评论聚合条件的一组重复评论传递至聚合单元。

聚合单元对获得的每一组重复评论进行聚合，得到一组重复评论对应的一条聚合评论。可以理解的，当存在M组符合评论聚合条件的重复评论时，聚合单元对应的会聚合得到其中每一组重复评论的聚合评论，即最终输出与这M组重复评论对应的M条聚合评论。M是非负的整数。

聚合单元输出的聚合评论传递至发送单元后，发送单元将收到的聚合评论，检测单元传递的不符合评论聚合条件的重复评论，以及识别单元传递的未重复的评论，一并发送至在播放当前视频的每一个客户端。至此，本申请提供的评论聚合装置就完成了一次评论的拉取，聚合和发送。

进一步的，获取单元可以每经过一个调整周期，就获取一次正在观看当前视频的观众的观众数量，然后将获取的观众数量传递至设定单元，使得设定单元根据观众数量调整评论聚合条件中的初始聚合阈值和累积聚合阈值。

本申请实施例提供的评论聚合装置中，各个单元的具体工作原理可以参考本申请实施例提供的评论聚合方法中的相关步骤，此处不再详述。

本申请提供的评论聚合装置，针对对应的内容首次出现的重复评论设置较大的初始聚合阈值，针对对应的内容不为首次出现的重复评论设置较小的累积聚合阈值，通过这种方式，检测单元702可以分别将单次大量出现的重复评论，和多次少量出现的重复评论确定为符合评论聚合条件的重复评论，使得聚合单元703对其进行聚合得到对应的聚合评论。由此，本方案既能够有效的突出符合评论聚合条件的每一组重复评论对应的内容，也能够避免客户端显示大量的重复评论而干扰观众浏览其他少量的，或者非重复的评论。

图9是根据一示例性实施例示出的一种用于执行前述处理图像的方法的电子设备的框图，该电子设备包括处理器901，和用于存储所述处理器可执行指令的存储器902。

其中，处理器901被配置为执行所述指令，以实现如本公开任一实施例提供的评论聚合方法。

在示例性实施例中，还提供了一种包括指令的存储介质，例如包括指令的存储器，上述指令可由图9所示的电子设备的处理器901执行以完成上述方法。可选地，存储介质可以是非临时性计算机可读存储介质，例如，所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

本申请实施例提供一种计算机程序产品，该计算机程序产品被执行时，用于实现本公开任一实施例提供的评论聚合的方法。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims

1.一种评论聚合方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述当任意一组重复评论符合评论聚合条件时，对所述一组重复评论进行聚合，得到所述一组重复评论对应的一条聚合评论之前，还包括：

3.根据权利要求1所述的方法，其特征在于，所述在当前拉取周期拉取到的评论中，识别出每一组重复评论，包括：

4.根据权利要求3所述的方法，其特征在于，所述在所述当前拉取周期拉取到的评论中，检测得到每两条内容相匹配的评论，包括：

5.根据权利要求1所述的方法，其特征在于，所述对所述一组重复评论进行聚合，得到所述一组重复评论对应的一条聚合评论，包括：

6.根据权利要求1所述的方法，其特征在于，所述对所述一组重复评论进行聚合，得到所述一组重复评论对应的一条聚合评论，包括：

7.根据权利要求5或6所述的方法，其特征在于，所述组合所述聚合内容和所述聚合数值，得到所述一组重复评论所对应的一条聚合评论之前，还包括：

8.一种评论聚合装置，其特征在于，包括：

9.根据权利要求8所述的装置，其特征在于，还包括：

设定单元，被配置为执行：

10.根据权利要求8所述的装置，其特征在于，所述识别单元在当前拉取周期拉取到的评论中，识别出每一组重复评论时，具体执行：

11.根据权利要求10所述的装置，其特征在于，所述识别单元在所述当前拉取周期拉取到的评论中，检测得到每两条内容相匹配的评论时，具体执行：

12.根据权利要求8所述的装置，其特征在于，所述聚合单元对符合所述评论聚合条件的所述一组重复评论进行聚合，得到所述一组重复评论对应的一条聚合评论时，具体执行：

13.根据权利要求8所述的装置，其特征在于，所述聚合单元对符合所述评论聚合条件的所述一组重复评论进行聚合，得到所述一组重复评论对应的一条聚合评论时，具体执行：

14.根据权利要求12或13所述的装置，其特征在于，所述聚合单元还被配置为执行：

15.一种电子设备，其特征在于，包括：

处理器；

用于存储所述处理器可执行指令的存储器；

其中，所述处理器被配置为执行所述指令，以实现如权利要求1至7中任一项所述的评论聚合方法。

16.一种存储介质，其特征在于，当所述存储介质中的指令由电子设备的处理器执行时，使得所述电子设备能够执行如权利要求1至7中任一项所述的评论聚合方法。