CN110505491A

CN110505491A - 一种直播的处理方法、装置、电子设备及存储介质

Info

Publication number: CN110505491A
Application number: CN201910642248.0A
Authority: CN
Inventors: 谢纨楠; 范威
Original assignee: Beijing Dajia Internet Information Technology Co Ltd
Current assignee: Beijing Dajia Internet Information Technology Co Ltd
Priority date: 2019-07-16
Filing date: 2019-07-16
Publication date: 2019-11-26
Anticipated expiration: 2039-07-16
Also published as: CN110505491B

Abstract

本公开关于一种直播的处理方法、装置、电子设备及存储介质，所述方法包括：响应于至少两个客户端的连麦请求，控制所述客户端展示题目信息；根据所述客户端发送的答题请求从所述客户端中选取目标客户端；接收所述目标客户端针对所述题目信息发送的语音格式的答案信息，并确认所述答案信息与预设答案的相似度；根据所述相似度确认所述目标客户端的答案信息的正确度。通过在主播连麦直播的过程中加入语音答题游戏，以增加主播之间的互动，避免在连麦直播时出现僵局，提高了连麦直播的效果和观众的观看体验。

Description

一种直播的处理方法、装置、电子设备及存储介质

技术领域

本公开属于网络技术领域，特别是涉及一种直播的处理方法、装置、电子设备及存储介质。

背景技术

网络直播作为新兴的网络娱乐服务已被越来越多的互联网用户所喜爱，主播可以通过网络直播的方式向观众展示各种类型的直播内容，并且可以和观众实现实时互动，趣味性十足。

现如今，国内外很多直播类平台为了提高虚拟空间的互动玩法，加入了多个主播连接麦克风等用户互动功能，连接麦克风的方式可以包括语音连接和/或视频连接，并向观众同时展示多个主播连麦直播画面。主播之间可以进行连麦互动，以吸引观众向自己喜爱的主播送礼物，而这些礼物将会给对应的主播增加积分，根据最后主播获得的积分多少来判别连麦对战的胜负。

但是由于连麦直播的用户之间不一定有相同的话题，并且部分用户在沟通交流能力不足，导致在连麦直播时容易出现陷入僵局的情况，使得连麦直播的趣味性下降，降低了观众的观看体验。

公开内容

本公开提供一种直播的处理方法、装置、电子设备及存储介质，以至少解决相关技术中连麦直播容易陷入僵局，降低直播的效果和观众的观看体验的问题。

本公开的技术方案如下：

根据本公开实施例的第一方面，提供一种直播的处理方法，包括：

响应于至少两个客户端的连麦请求，控制所述客户端展示题目信息；

根据所述客户端发送的答题请求从所述客户端中选取目标客户端；

接收所述目标客户端针对所述题目信息发送的语音格式的答案信息，并确认所述答案信息与预设答案的相似度；

根据所述相似度确认所述目标客户端的答案信息的正确度。

可选的，所述响应于至少两个客户端的连麦请求，控制所述客户端展示题目信息的步骤，包括：

响应于至少两个客户端的连麦请求，建立所述客户端组成的主播集合；

初始化所述主播集合中每个客户端处于连麦状态；

向所述客户端发送题目展示指令以控制所述主播集合中的每个客户端展示题目信息。

可选的，所述根据所述客户端发送的答题请求从所述客户端中选取目标客户端的步骤之后，还包括：

将所述主播集合中除所述目标客户端之外的剩余客户端切换为闭麦状态。

可选的，所述答题请求至少包括：请求时间戳；所述根据所述客户端发送的答题请求从所述客户端中选取目标客户端的步骤，包括：

将所述请求时间戳最早的答题请求所对应的客户端确认为目标客户端。

可选的，所述答案信息至少包括：基音信息、语音时间戳；所述答案信息与预设答案的时长相同；所述确认所述答案信息与预设答案的相似度的步骤，包括：

当所述答案信息是音频格式时，分别从所述基音信息与所述预设答案中提取所述语音时间戳所对应的第一特征与第二特征；

通过将所述第一特征与所述第二特征进行比对，得到所述答案信息与预设答案之间的相似度。

可选的，所述确认所述答案信息与预设答案的相似度的步骤，包括：

当所述答案信息是音频格式时，利用语音识别模型识别所述答案信息，得到预设格式的第一目标答案；

利用自然语言处理模型对所述答案信息进行分析得到第二目标答案；

将所述第二目标答案与预设答案进行比对，得到所述答案信息与预设答案之间的相似度。

当所述答案信息是图像格式时，利用神经网络识别模型分别对所述答案信息和预设答案进行识别，得到与所述答案信息相对应的第三特征和与所述预设答案向对应的第四特征；

通过将所述第三特征与所述第四特征进行比对，得到所述答案信息与预设答案之间的相似度。

可选的，所述根据所述相似度确认所述目标客户端的答案信息的正确度的步骤，包括：

当所述相似度大于预设相似度阈值时，根据所述相似度确认所述答案信息的正确度，并根据所述正确度给所述目标客户端的积分增加第一预设分值；

当所述相似度小于或等于预设相似度阈值时，根据所述相似度确认所述答案信息的正确度，并根据所述正确度向用户返回提示信息。

可选的，所述方法，还包括：

当检测到观众客户端发送的礼物信息时，给所述礼物信息所对应的客户端的积分增加第二预设分值。

可选的，所述根据所述相似度确认所述目标客户端的答案信息的正确度的步骤之后，还包括：

根据所述客户端端的积分生成积分列表，并输出。

根据本公开实施例的第二方面，提供一种直播的处理装置，包括：

展示模块，被配置为响应于至少两个客户端的连麦请求，控制所述客户端展示题目信息；

选取模块，被配置为根据所述客户端发送的答题请求从所述客户端中选取目标客户端；

接收模块，被配置为接收所述目标客户端针对所述题目信息发送的语音格式的答案信息，并确认所述答案信息与预设答案的相似度；

确认模块，被配置为根据所述相似度确认所述目标客户端的答案信息的正确度。

可选的，所述展示模块，包括：

集合建立子模块，被配置为响应于至少两个客户端的连麦请求，建立所述客户端组成的主播集合；

初始化子模块，被配置为初始化所述主播集合中每个客户端处于连麦状态；

展示子模块，被配置为向所述客户端发送题目展示指令以控制所述主播集合中的每个客户端展示题目信息。

可选的，所述装置，还包括：

切换模块，被配置为将所述主播集合中除所述目标客户端之外的剩余客户端切换为闭麦状态。

可选的，所述答题请求至少包括：请求时间戳；所述选取模块，包括：

选取子模块，被配置为将所述请求时间戳最早的答题请求所对应的客户端确认为目标客户端。

可选的，所述答案信息至少包括：基音信息、语音时间戳；所述答案信息与预设答案的时长相同；所述接收模块，包括：

第一提取子模块，被配置为当所述答案信息是音频格式时，分别从所述基音信息与所述预设答案中提取所述语音时间戳所对应的第一特征与第二特征；

第一比对子模块，被配置为通过将所述第一特征与所述第二特征进行比对，得到所述答案信息与预设答案之间的相似度。

可选的，所述接收模块，还包括：

识别子模块，被配置为当所述答案信息是音频格式时，利用语音识别模型识别所述答案信息，得到预设格式的第一目标答案；

第二提取子模块，被配置为利用自然语言处理模型对所述答案信息进行分析得到第二目标答案；

第二比对子模块，被配置为将所述第二目标答案与预设答案进行比对，得到所述答案信息与预设答案之间的相似度。

可选的，所述接收模块，还包括：

第三提取子模块，被配置为当所述答案信息是图像格式时，利用神经网络识别模型分别对所述答案信息和预设答案进行识别，得到与所述答案信息相对应的第三特征和与所述预设答案向对应的第四特征；

第三比对子模块，被配置为通过将所述第三特征与所述第四特征进行比对，得到所述答案信息与预设答案之间的相似度。

可选的，所述确认模块，包括：

第一确认子模块，被配置为当所述相似度大于预设相似度阈值时，根据所述相似度确认所述答案信息的正确度，并根据所述正确度给所述目标客户端的积分增加第一预设分值；

第二确认子模块，被配置为当所述相似度小于或等于预设相似度阈值时，根据所述相似度确认所述答案信息的正确度，并根据所述正确度向用户返回提示信息。

可选的，所述装置，还包括：

礼物积分模块，被配置为当检测到观众客户端发送的礼物信息时，给所述礼物信息所对应的客户端的积分增加第二预设分值。

可选的，所述装置，还包括：

输出模块，被配置为根据所述客户端端的积分生成积分列表，并输出。

根据本公开实施例的第三方面，提供一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述第一方面任一所述的直播的处理方法。

根据本公开实施例的第四方面，提供一种计算机可读存储介质，所述计算机可读存储介质上存储计算机程序，所述计算机程序被处理器执行时实现上述第一方面任一所述的直播的处理方法。

根据本公开实施例的第五方面，提供一种计算机程序产品，包括一条或多条指令，该一条或多条指令可以由电子设备的处理器执行时，使得电子设备能够执行所述的直播的处理方法。

本公开的实施例提供的技术方案至少带来以下有益效果：

本公开实施例中，响应于至少两个客户端的连麦请求，控制所述客户端展示题目信息；根据所述客户端发送的答题请求从所述客户端中选取目标客户端；接收所述目标客户端针对所述题目信息发送的语音格式的答案信息，并确认所述答案信息与预设答案的相似度；根据所述相似度确认所述目标客户端的答案信息的正确度。通过在主播连麦直播的过程中加入语音答题游戏，以增加主播之间的互动，避免在连麦直播时出现僵局，提高了连麦直播的效果和观众的观看体验。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起被配置为解释本公开的原理，并不构成对本公开的不当限定。

图1是根据一示例性实施例示出的一种直播的处理方法的流程图；

图2是根据一示例性实施例示出的另一种直播的处理方法的流程图；

图3是根据一示例性实施例示出的一种直播的处理装置的框图；

图4是根据一示例性实施例示出的另一种直播的处理装置的框图；

图5是根据一示例性实施例示出的一种电子设备的结构框图。

具体实施方式

为了使本领域普通人员更好地理解本公开的技术方案，下面将结合附图，对本公开实施例中的技术方案进行清楚、完整地描述。

需要说明的是，本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是被配置为区别类似的对象，而不必被配置为描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

图1是本公开实施例提供的一种直播的处理方法的步骤流程图，如图1所示，该方法可以包括：

步骤S101，响应于至少两个客户端的连麦请求，控制所述客户端展示题目信息。

在本公开实施例中，在连麦直播中，直播平台的后台服务器同时连接有主播客户端和观众客户端，后台服务器可以将客户端发送的直播内容进过处理后发送给观众客户端和/或客户端。所述客户端是直播之前在主播用户和/或观众用户对应的终端设备上预先安装的直播平台，与其相对应的是观看之前在观众用户对应的终端设备上预先安装的直播平台，主播用户和观众用户通过不同的身份登录预先安装的直播平台，客户端和观众客户端通过直播平台对应的后台服务器通信连接，实现客户端和观众客户端之间的连接。本发明实施例从直播平台对应的后台服务器侧进行详细说明。

可以理解，主播用户可以通过安装在其终端设备内的客户端向观众客户端发送直播内容，并在观众客户端上展示其直播内容，所述直播内容包括视频直播内容、语音直播内容等。主播用户和/或观众用户也可以通过客户端实现至少两个客户端之间的连麦直播，所述连麦直播是指向处于正在观看状态的观众客户端同时展示至少两个客户端的直播内容。连麦直播可以是主播客户端与主播客户端之间实现的，或主播客户端与观众客户端之间实现的，或观众客户端观众客户端与观众客户端之间实现的。

所述题目信息可以是从题目信息库中提取的特定类型的至少一个题目信息，例如：抢唱题目、成语接龙题目，所述题目信息库中还存储有所述题目信息对应的答案信息。

当主播用户想要进行连麦直播(例如，直播游戏、直播对战)时，通过在客户端的功能选取界面选取相应的连麦直播功能选项，以使得客户端向后台服务器发送连麦请求，所述连麦请求可以包括但不限于：连麦直播服务标识和/或客户端识别标识。所述连麦直播功能选项可以包括：连麦直播对象配置。主播用户可以通过设置连麦直播对象配置，对匹配的对象客户端进行筛选，例如：地域、性别、年龄、直播类型等。主播用户也可以直接通过设置指定客户端作为连麦直播的对象，以向该指定客户端发送连麦直播请求，主播用户可以通过该方式邀请好友进行连麦直播。

后台服务器根据客户端的客户端识别标识，在连麦直播列表中进行匹配，当匹配到至少一个客户端时，向所述客户端展示题目信息，当匹配失败时，将所述客户端加入连麦直播列表中，供其他客户端匹配使用。可以理解，可以设置所述客户端识别标识在连麦直播列表中的匹配时间阈值，当所述客户端在匹配时间阈值内未匹配到至少一个客户端时，将所述客户端识别标识从连麦直播列表中移除，并向所对应的客户端返回匹配失败提示。

后台服务器将匹配到至少连个客户端加入连麦直播列表中，并向所述客户端发送题目信息，以使得客户端向主播用户展示题目信息。所述题目信息可以包括一个或多个，后台服务器可以控制所述客户端随机向主播用户展示题目信息，也可以根据预设规则向主播用户顺序展示题目信息。

步骤S102，根据所述客户端发送的答题请求从所述客户端中选取目标客户端。

在本公开实施例中，所述答题请求包括：客户端识别标识。主播用户在观看客户端展示的题目信息时，可以通过点击客户端界面中的抢答按键，以向后台服务器发送答题请求。后台服务器可以在接收到所述客户端发送的题目展示完成通知后，按照预设规则选取某一答题请求对应的客户端作为目标客户端。所述预设规则可以是对客户端识别标识的随机选取，也可以是按照接收到所述答题请求的时间节点的先后顺序确认的，例如，将最先接收到的答题请求对应的客户端作为目标客户端。

步骤S103，接收所述目标客户端针对所述题目信息发送的语音格式的答案信息，并确认所述答案信息与预设答案的相似度。

在本公开实施例中，所述后台服务器向所确认的目标客户端发送开始答题指令，以使得所述目标客户端通过显示界面向主播用户展示开始答题提示信息，并显示答题倒计时，在所述答题倒计时计数为零时，所述目标客户端开始录制其连接的音频输入设备，如麦克风，所获取的语音信息。

其中，录制过程持续预置录制时长，并在录制过程中通过目标客户端显示界面向主播用户展示录制倒计时。当录制时长等于预置录制时长时，结束录音进程，并向主播用户推送答题完成提示信息。当所述录制时长小于预置录制时长时，保持录音状态。

在结束所述录音进程后，所述目标客户端可以将采集到的语音格式的答案信息直接发送至后台服务器，以使得后台服务器计算其与预设答案之间的相似度。当预设答案为语音格式，则不需要对语音格式的答案信息进行转换；当预设答案为文字格式，则通过语音识别模块将所述语音格式的答案信息转换为文字格式的答案信息，也可以通过目标客户端本地设置的语音识别模块将所述语音格式的答案信息转换为文字格式的答案信息后，再向后台服务器返回所述答案信息。后台服务器根据所述答案信息与所对应的预设答案进行比对，获取所述答案信息与预设答案之间的相似度。

本领域技术人员可以理解，所述相似度的确认过程也可以在目标客户端进行，以减少后台服务器的数据处理压力。所述相似度可以是根据答案信息中基音的语调特征确认的，也可以是根据答案信息中的语义特征确认的。

在实际应用中，根据不同的连麦直播类型，所述相似度的确认方式也可以随之改变，例如成语接龙游戏，由于体现答案是否准确的关键是语音信息所表达的语义，所述需要将语义特征作为相似度确认的主要参数；而在歌曲抢唱游戏中，由于判别某人唱歌水平的关键是曲调是否把握准确，因此需要将语调特征作为相似度确认的主要参数。

步骤S104，根据所述相似度确认所述目标客户端的答案信息的正确度。

具体地，当相似度大于一定相似度阈值时，可以确定答案信息正确；否则，确定答案信息错误。

在实际应用中，相似度阈值是可以根据连麦直播的类型确认的，例如：成语接龙游戏中，由于成语的表述必须准确，在语种类型统一的前提下，所述相似度必须高度吻合，才保证确认答案信息是否正确的判断准确性。或者在歌曲抢答游戏中，所述相似度可以是根据歌曲的难易程度调节的。根据所述相似度确定该目标客户端答案信息的正确度，所述正确度可以是根据相似度与正确度之间的对应关系确定的，例如答案信息的相似度在1％～50％的范围内，则对应的正确度为1，相似度在50％～80％,则对应的正确度为2，相似度在80％～100％，则对应的相似度为3，该对应关系可以是根据实际需求设定的，本申请对此不做限定。

本公开的实施例提供的技术方案至少带来以下有益效果：

图2是本公开实施例提供的另一种直播的处理方法的步骤流程图，如图2所示，该方法可以包括：

步骤S201，响应于至少两个客户端的连麦请求，建立所述客户端组成的主播集合。

在本公开实施例中，所述连麦请求可以包括客户端识别标识。后台服务器在接收到至少两个主播用户或观众用户通过所使用的客户端发送的连麦请求时，根据至少两个所述客户端识别标识生成主播集合。

具体地，可以将满足预设条件的客户端组成主播集合，其中，预设条件包括但不限于：同一直播类型、同一性别、同一年龄段、同一喜好等。例如，将同一直播类型的主播用户对应的客户端组成主播集合。

本公开可以将具有相同类型、性别、年龄段、喜好的客户端组成主播集合，使其进行连麦直播，有助于连麦直播的趣味性。例如，若男性主播和女性主播的喜好通常差距较大，若让男性主播和女性主播之间进行连麦直播，会降低主播对连麦直播的兴趣，影响趣味性和直播体验。

步骤S202，初始化所述主播集合中每个客户端处于连麦状态。

在本公开实施例中，所述连麦状态是建立所述主播集合中客户端之间的视频通话连接或语音通话连接，并将所述主播集合中的客户端的音频直播画面或语音直播画面进行拼接后，并发送至观众客户端。所述语音直播画面可以包括主播用户的用户识别标识，可以包括主播用户的头像、用户名。

步骤S203，向所述客户端发送题目展示指令以控制所述主播集合中的每个客户端展示题目信息。

在本公开实施例，针对所述主播集合包含的客户端识别标识所述对应的客户端，后台服务器向其发送至少包含有题目信息的题目展示指令。所述客户端根据所述题目展示指令，通过客户端所设置的终端设备上展示所述题目信息。

在实际应用中，后台服务器可以从题目信息库中筛选预设数量的题目信息，并将所述题目信息排序组合生成题目信息列表。所述客户端根据所述题目信息列表中题目信息的排列次序依次在完成一题目信息的答题过程后展示下一道题目信息。

通过响应于至少两个客户端的连麦请求，建立多人参与的连麦直播直播，丰富了连麦直播的内容，提高了连麦直播的趣味性。

步骤S204，将所述请求时间戳最早的答题请求所对应的客户端确认为目标客户端。

其中，答题请求可以包括：请求时间戳，从而将请求时间戳携带在答题请求中，可以从答题请求中提取请求时间戳，然后根据请求时间戳确定目标客户端。

在本公开实施例中，由于客户端之间存在网络延迟差异，因此通过接收到答题请求的时间点作为判别主播用户答题的先后次序无法保证确认过程的公平性。因此可以将客户端上的时间作为请求时间戳。所述请求时间戳是客户端发送答题请求时根据当前时间加入的。后台服务器可以将所述答题请求中的时间戳进行比对，以确认目标客户端。后台服务器可以将最靠前的请求时间戳所对应的客户端确认为目标客户端，以实现连麦直播对抢答的效果，并且由于利用答题请求中的请求时间戳确认目标客户端，避免了因网络延迟导致的确认误差，保障了连麦直播中抢答环节的公平性。

步骤S205，将所述主播集合中除所述目标客户端之外的剩余客户端切换为闭麦状态。

在本公开实施例中，后台服务器在确认目标客户端，并向目标客户端发送答题开始指令的同时，向主播集合中除目标主播客户之外的剩余客户端发送闭麦指令，以使得所述剩余客户端将所处的连麦状态切换为闭麦状态，从而剩余客户端断开与音频输入设备的连接，以使得连麦直播间仅存在目标客户端的音频信息而不存在其余客户端的音频信息。

通过在目标客户端答题的过程中，将主播集合中的剩余客户端切换为闭麦状态，避免了剩余客户端的音频信息对目标客户端的音频信息产生不必要的干扰，提高了连麦直播的规范性。

步骤S206，接收所述目标客户端针对所述题目信息发送的语音格式的答案信息，所述答案信息至少包括：基音信息、语音时间戳；所述答案信息与预设答案的时长相同。

所述步骤S206可以参照步骤S103的详细描述，此处不再赘述。

步骤S207，当所述答案信息是音频格式时，分别从所述基音信息与所述预设答案中提取所述语音时间戳所对应的第一特征与第二特征。

在本公开实施例中，目标客户端在接收到主播用户通过音频输入设备发送的语音格式的答案信息时，开始向主播用户展示答题计时提示，以记录主播用户录入的答案信息的时长，所述答案信息的时长与预设答案的时长相同，以保证所接收到的语音信息与预设答案时长相同。

并且，所述目标客户端可以通过语音识别模块对所述语音信息进行处理，排除语音信息中的环境噪音、歌曲伴奏等不必要的音频信息，仅保留主播用户的基音信息，以提高后续答案信息判别过程的准确性。提取基音信息的方法目前有时域估计法、交换法、混合法等，本公开不做限定。当所述题目信息是歌曲抢唱类型时，后台服务器可以根据语音时间戳提取所述基音语音与预设答案中的语调特征，分别生成第一特征与第二特征。

步骤S208，通过将所述第一特征与所述第二特征进行比对，得到所述答案信息与预设答案之间的相似度。

在本公开实施例中，后台服务器将所述第一特征与第二特征根据语音时间戳进行比对，将第一特征与第二特征在各时间点的部分进行比对，得到第一特征和第二特征在每个时间点的相似度，然后，将所有时间点的相似度汇总生成答案信息与预设答案之间的相似度，例如计算所有时间点的相似度的平均值得到答案信息与预设答案之间的相似度。

通过将根据不同的连麦直播类型，将答案信息与预设答案中的不同语音特征进行比对以生成相对应的相似度，提高了连麦直播的公平性和可拓展性。

步骤S209，当所述答案信息是音频格式时，利用语音识别模型识别所述答案信息，得到预设格式的第一目标答案。

步骤S210，利用自然语言处理模型对所述答案信息进行分析得到第二目标答案。

步骤211，将所述第二目标答案与预设答案进行比对，得到所述答案信息与预设答案之间的相似度。

在本发明实施例中，当所述题目信息是成语接龙类型时，后台服务器可以将所述答案信息通过系统内置的语音识别接口或第三方服务器提供的语音识别服务，将所述答案信息转换成文本格式的第一目标答案，并利用自然语言处理模型识别第一目标答案，以获取更接近所述答案信息语义的第二目标答案，再所述第二目标答案与预设答案进行比对，根据比对结果生成相似度。

步骤S212，当所述答案信息是图像格式时，利用神经网络识别模型分别对所述答案信息和预设答案进行识别，得到与所述答案信息相对应的第三特征和与所述预设答案向对应的第四特征。

步骤S213通过将所述第三特征与所述第四特征进行比对，得到所述答案信息与预设答案之间的相似度。

在本发明实施例中，当所述题目信息是舞蹈或手势等肢体表达类型时，后台服务器可利用预先训练的神经网络识别模型分别对所述答案信息和预设答案进行识别，从中提取向对应的动作特征，即第三特征及第四特征，并将所述第三特征和第四特征进行比对，得到相对应的相似度，为了提高相似度，此处可以利用同一神经网络识别模型进行识别，具体识别方式本公开不做限定。通过增加肢体表达类型的题目信息和确认方式，丰富了连麦直播的内容，提高了连麦直播的趣味性。

步骤S214，当所述相似度大于预设相似度阈值时，根据所述相似度确认所述答案信息的正确度，并根据所述正确度给所述目标客户端的积分增加第一预设分值。

在本公开实施例中，所述第一预设分值可以是根据所述相似度调整，例如相似度在大于0.6时确认该客户端答案信息正确后，当相似度在0.6～0.8范围内，正确度为1，积10分，当相似度在0.8～0.9范围内，正确度为2，积20分，当相似度大于0.9时，正确度为3，积30分。

步骤S215，当所述相似度小于或等于预设相似度阈值时，根据所述相似度确认所述答案信息的正确度，并根据所述正确度向用户返回提示信息。

在本公开实施例中，所述相似度阈值可以是根据题目信息的难度系数和题目类型设置的。当题目信息类型是歌曲抢答类型是，所述相似度阈值可以是与所述难度系数成反比的关系，随着题目信息的难度系数提高，降低相似度阈值，反之则提高相似度阈值。所述相似度阈值也可以根据题目信息类型设置，当题目信息类型属于纯语言类型时，如成语接龙，所述相似度阈值可以设置为较高的固定值。可以在答案信息的相似度小于或等于预设相似度阈值时，根据对应的正确度向用户返回提示信息，例如用户的正确度只有1，则向用户返回再接再厉的鼓励语，也可以直接向用户返回包含有正确度的提示信息，提示信息的具体形式本申请不做限定。

将相似度阈值与所述相似度进行比对，以确认目标客户端是否回答正确并相应的给客户端积分，打破了连麦直播的僵局，实现了破冰的效果，提高了连麦直播的趣味性。

步骤S216，当检测到观众客户端发送的礼物信息时，给所述礼物信息所对应的客户端的积分增加第二预设分值。

在本公开实施例中，在连麦直播的过程中，观众用户可以通过观众客户端为自己支持的主播用户送出虚拟礼物，以使得观众客户端向后台服务器发送礼物信息，所述礼物信息至少包括客户端识别标识。后台服务器根据所述礼物信息中的客户端识别标识给相对应的客户端增加第二预设分值。

其中，所述第二预设分值可以是根据礼物类型确认，根据用户送出的礼物类型不同，确认相应的第二预设分值。

通过观众客户端发送礼物信息以给客户端增加积分的方式，使得观众用户可以参与到连麦直播中，提高了连麦直播的观众体验和趣味性。

步骤S217，根据所述客户端的积分生成积分列表，并输出。

在本公开实施例中，当客户端已完成题目信息列表中各题目信息的答题过程后，后台服务器统计主播集合中客户端的积分，并将各客户端的积分排序组合生成积分列表，向所述客户端和观众客户端输出所述积分列表，主播用户和观众用户可以根据所述积分列表确认最后的胜出方，并可以依据该积分列表进行后续的惩罚和/或奖励活动。

通过利用积分的形式统计客户端的答题结果，使得连麦直播的结果更为直观，保障了连麦直播的公平性。

本公开实施例中，响应于至少两个客户端的连麦请求，建立所述客户端组成的主播集合；初始化所述主播集合中每个客户端处于连麦状态；向所述客户端发送题目展示指令以控制所述主播集合中的每个客户端展示题目信息；所述答题请求至少包括：请求时间戳；将所述请求时间戳最早的答题请求所对应的客户端确认为目标客户端；将所述主播集合中除所述目标客户端之外的剩余客户端切换为闭麦状态；所述答案信息至少包括：基音信息、语音时间戳；所述答案信息与预设答案的时长相同；分别从所述基音信息与所述预设答案中提取所述语音时间戳所对应的第一特征与第二特征；通过将所述第一特征与所述第二特征进行比对，得到所述答案信息与预设答案之间的相似度；当所述相似度大于预设相似度阈值时，根据所述相似度确认所述答案信息的正确度，并根据所述正确度给所述目标客户端的积分增加第一预设分值；当所述相似度小于或等于预设相似度阈值时，根据所述相似度确认所述答案信息的正确度，并根据所述正确度向用户返回提示信息；当检测到观众客户端发送的礼物信息时，给所述礼物信息所对应的客户端的积分增加第二预设分值；根据所述客户端的积分生成积分列表，并输出。通过在连麦直播中加入抢答游戏环节，提高了连麦直播的趣味性，并且可以打破连麦直播的僵局，实现了破冰的效果。而且在通过时间戳同步的方式，避免了因网络延迟导致的判别误差，保障了连麦直播的公平性。观众用户也可以通过客户端发送礼物信息的方式参与到连麦直播中，提高了观众用户的用户体验。

图3是根据一示例性实施例示出的一种直播的处理装置30的结构框图，参照图3，所述装置可以包括：

展示模块301，被配置为响应于至少两个客户端的连麦请求，控制所述客户端展示题目信息。

选取模块302，被配置为根据所述客户端发送的答题请求从所述客户端中选取目标客户端。

接收模块303，被配置为接收所述目标客户端针对所述题目信息发送的语音格式的答案信息，并确认所述答案信息与预设答案的相似度。

确认模块304，被配置为根据所述相似度确认所述目标客户端的答案信息的正确度。

本公开实施例中，展示模块，被配置为响应于至少两个客户端的连麦请求，控制所述客户端展示题目信息；选取模块，被配置为根据所述客户端发送的答题请求从所述客户端中选取目标客户端；接收模块，被配置为接收所述目标客户端针对所述题目信息发送的语音格式的答案信息，并确认所述答案信息与预设答案的相似度；确认模块，被配置为根据所述相似度确认所述目标客户端的答案信息的正确度。通过在主播连麦直播的过程中加入语音答题游戏，以增加主播之间的互动，避免在连麦直播时出现僵局，提高了连麦直播的效果和观众的观看体验。

图4是根据一示例性实施例示出的另一种直播的处理装置40的结构框图，参照图4，所述装置可以包括：

展示模块401，被配置为响应于至少两个客户端的连麦请求，控制所述客户端展示题目信息。

可选的，在本公开的实施例中，所述展示模块401，可以包括：

集合建立子模块4011，被配置为响应于至少两个客户端的连麦请求，建立所述客户端组成的主播集合。

初始化子模块4012，被配置为初始化所述主播集合中每个客户端处于连麦状态。

展示子模块4013，被配置为向所述客户端发送题目展示指令以控制所述主播集合中的每个客户端展示题目信息。

选取模块402，被配置为根据所述客户端发送的答题请求从所述客户端中选取目标客户端。

可选的，所述答题请求至少包括：请求时间戳；所述选取模块402，包括：

选取子模块4021，被配置为：将所述请求时间戳最早的答题请求所对应的客户端确认为目标客户端。

切换模块403，被配置为将所述主播集合中除所述目标客户端之外的剩余客户端切换为闭麦状态。

接收模块404，被配置为接收所述目标客户端针对所述题目信息发送的语音格式的答案信息，并确认所述答案信息与预设答案的相似度。

可选的，在本公开的实施例中，所述答案信息至少包括：基音信息、语音时间戳；所述答案信息与预设答案的时长相同；所述接收模块440，可以包括：

第一提取子模块4041，被配置为当所述答案信息是音频格式时，分别从所述基音信息与所述预设答案中提取所述语音时间戳所对应的第一特征与第二特征。

第一比对子模块4042，被配置为通过将所述第一特征与所述第二特征进行比对，得到所述答案信息与预设答案之间的相似度。

可选的，所述接收模块404，还包括：

识别子模块4043，被配置为当所述答案信息是音频格式时，利用语音识别模型识别所述答案信息，得到预设格式的第一目标答案。

第二提取子模块4044，被配置为利用自然语言处理模型对所述答案信息进行分析得到第二目标答案。

第二比对子模块4045，被配置为将所述第二目标答案与预设答案进行比对，得到所述答案信息与预设答案之间的相似度。

可选的，所述接收模块404，还包括：

第三提取子模块4046，被配置为当所述答案信息是图像格式时，利用神经网络识别模型分别对所述答案信息和预设答案进行识别，得到与所述答案信息相对应的第三特征和与所述预设答案向对应的第四特征。

第三比对子模块4047，被配置为通过将所述第三特征与所述第四特征进行比对，得到所述答案信息与预设答案之间的相似度。

确认模块405，被配置为根据所述相似度确认所述目标客户端的答案信息的正确度。

可选的，所述确认模块405，可以包括：

第一确认子模块4051，被配置为当所述相似度大于预设相似度阈值时，根据所述相似度确认所述答案信息的正确度，并根据所述正确度给所述目标客户端的积分增加第一预设分值。

第二确认子模块4052，被配置为当所述相似度小于或等于预设相似度阈值时，根据所述相似度确认所述答案信息的正确度，并根据所述正确度向用户返回提示信息。

礼物积分模块406，被配置为当检测到观众客户端发送的礼物信息时，给所述礼物信息所对应的客户端的积分增加第二预设分值。

输出模块407，被配置为根据所述客户端端的积分生成积分列表，并输出。

本公开实施例中，展示模块被配置为响应于至少两个客户端的连麦请求，控制所述客户端展示题目信息；所述展示模块410，可以包括：集合建立子模块，被配置为响应于至少两个客户端的连麦请求，建立所述客户端组成的主播集合；初始化子模块，被配置为初始化所述主播集合中每个客户端处于连麦状态；展示子模块，被配置为向所述客户端发送题目展示指令以控制所述主播集合中的每个客户端展示题目信息；选取模块，被配置为根据所述客户端发送的答题请求从所述客户端中选取目标客户端；所述答题请求至少包括：请求时间戳；所述选取模块，可以被配置为：将所述请求时间戳最早的答题请求所对应的客户端确认为目标客户端；切换模块，被配置为将所述主播集合中除所述目标客户端之外的剩余客户端切换为闭麦状态；接收模块，被配置为接收所述目标客户端针对所述题目信息发送的语音格式的答案信息，并确认所述答案信息与预设答案的相似度；所述答案信息至少包括：基音信息、语音时间戳；所述答案信息与预设答案的时长相同；所述接收模块，包括：提取子模块，被配置为分别从所述基音信息与所述预设答案中提取所述语音时间戳所对应的第一特征与第二特征；比对子模块，被配置为通过将所述第一特征与所述第二特征进行比对，得到所述答案信息与预设答案之间的相似度；确认模块，被配置为根据所述相似度确认所述目标客户端的答案信息的正确度；所述确认模块，可以包括：第一确认子模块，被配置为当所述相似度大于预设相似度阈值时，根据所述相似度确认所述答案信息的正确度，并根据所述正确度给所述目标客户端的积分增加第一预设分值；第二确认子模块，被配置为当所述相似度小于或等于预设相似度阈值时，根据所述相似度确认所述答案信息的正确度，并根据所述正确度向用户返回提示信息；礼物积分模块，被配置为当检测到观众客户端发送的礼物信息时，给所述礼物信息所对应的客户端的积分增加第二预设分值；输出模块，被配置为根据所述客户端端的积分生成积分列表，并输出。通过在连麦直播中加入抢答游戏环节，提高了连麦直播的趣味性，并且可以打破连麦直播的僵局，实现了破冰的效果。而且在通过时间戳同步的方式，避免了因网络延迟导致的判别误差，保障了连麦直播的公平性。观众用户也可以通过客户端发送礼物信息的方式参与到连麦直播中，提高了观众用户的用户体验。

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

本公开实施例还提供一种计算机可读存储介质，计算机可读存储介质上存储有计算机程序，该计算机程序被处理器执行时实现上述直播的处理方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。其中，所述的计算机可读存储介质，可以为只读存储器(Read-Only Memory，简称ROM)、随机存取存储器(Random Access Memory，简称RAM)、磁碟或者光盘等。

图5是根据一示例性实施例示出的一种电子设备500的框图。电子设备可以为移动终端也可以为服务器，本公开实施例中以电子设备为移动终端为例进行说明。例如，电子设备500可以是移动电话，计算机，数字广播终端，消息收发设备，游戏控制台，平板设备，医疗设备，健身设备，个人数字助理等。

参照图5，电子设备500可以包括以下一个或多个组件：处理组件502，存储器504，电力组件506，多媒体组件508，音频组件510，输入/输出(I/O)的接口512，传感器组件514，以及通信组件516。

处理组件502通常控制电子设备500的整体操作，诸如与显示，电话呼叫，数据通信，相机操作和记录操作相关联的操作。处理组件502可以包括一个或多个处理器520来执行指令，以完成上述的方法的全部或部分步骤。此外，处理组件502可以包括一个或多个模块，便于处理组件502和其他组件之间的交互。例如，处理组件502可以包括多媒体模块，以方便多媒体组件508和处理组件502之间的交互。

存储器504被配置为存储各种类型的数据以支持在电子设备500的操作。这些数据的示例包括用于在电子设备500上操作的任何应用程序或方法的指令，联系人数据，电话簿数据，消息，图片，视频等。存储器504可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(SRAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。

电源组件506为电子设备500的各种组件提供电力。电源组件506可以包括电源管理系统，一个或多个电源，及其他与为电子设备500生成、管理和分配电力相关联的组件。

多媒体组件508包括在所述电子设备500和用户之间的提供一个输出接口的屏幕。在一些实施例中，屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板，屏幕可以被实现为触摸屏，以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界，而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中，多媒体组件508包括一个前置摄像头和/或后置摄像头。当电子设备500处于操作模式，如拍摄模式或视频模式时，前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

音频组件510被配置为输出和/或输入音频信号。例如，音频组件510包括一个麦克风(MIC)，当电子设备500处于操作模式，如呼叫模式、记录模式和语音识别模式时，麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器504或经由通信组件516发送。在一些实施例中，音频组件510还包括一个扬声器，用于输出音频信号。

I/O接口512为处理组件502和外围接口模块之间提供接口，上述外围接口模块可以是键盘，点击轮，按钮等。这些按钮可包括但不限于：主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件514包括一个或多个传感器，用于为电子设备500提供各个方面的状态评估。例如，传感器组件514可以检测到电子设备500的打开/关闭状态，组件的相对定位，例如所述组件为电子设备500的显示器和小键盘，传感器组件514还可以检测电子设备500或电子设备500一个组件的位置改变，用户与电子设备500接触的存在或不存在，电子设备500方位或加速/减速和电子设备500的温度变化。传感器组件514可以包括接近传感器，被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件514还可以包括光传感器，如CMOS或CCD图谱传感器，用于在成像应用中使用。在一些实施例中，该传感器组件514还可以包括加速度传感器，陀螺仪传感器，磁传感器，压力传感器或温度传感器。

通信组件516被配置为便于电子设备500和其他设备之间有线或无线方式的通信。电子设备500可以接入基于通信标准的无线网络，如WiFi，运营商网络(如2G、5G、4G或5G)，或它们的组合。在一个示例性实施例中，通信组件516经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中，所述通信组件516还包括近场通信(NFC)模块，以促进短程通信。例如，在NFC模块可基于射频识别(RFID)技术，红外数据协会(IrDA)技术，超宽带(UWB)技术，蓝牙(BT)技术和其他技术来实现。

在示例性实施例中，电子设备500可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述图1至图2中所示的直播的处理方法。

在示例性实施例中，还提供了一种包括指令的非临时性计算机可读存储介质，例如包括指令的存储器504，上述指令可由电子设备500的处理器520执行以完成上述图2至图4中所示的音乐合成方法。例如，所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

在示例性实施例中，还提供了一种计算机程序产品，当计算机程序产品中的指令由电子设备500的处理器520执行时，使得电子设备500执行上述图2至图4中所示的音乐合成方法。

本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。

本领域技术人员易于想到的是：上述各个实施例的任意组合应用都是可行的，故上述各个实施例之间的任意组合都是本公开的实施方案，但是由于篇幅限制，本说明书在此就不一一详述了。

在此提供的直播的处理方法不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述，构造具有本公开方案的系统所要求的结构是显而易见的。此外，本公开也不针对任何特定编程语言。应当明白，可以利用各种编程语言实现在此描述的本公开的内容，并且上面对特定语言所做的描述是为了披露本公开的最佳实施方式。

在此处所提供的说明书中，说明了大量具体细节。然而，能够理解，本公开的实施例可以在没有这些具体细节的情况下实践。在一些实例中，并未详细示出公知的方法、结构和技术，以便不模糊对本说明书的理解。

类似地，应当理解，为了精简本公开并帮助理解各个公开方面中的一个或多个，在上面对本公开的示例性实施例的描述中，本公开的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而，并不应将该公开的方法解释成反映如下意图：即所要求保护的本公开要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说，如权利要求书所反映的那样，公开方面在于少于前面公开的单个实施例的所有特征。因此，遵循具体实施方式的权利要求书由此明确地并入该具体实施方式，其中每个权利要求本身都作为本公开的单独实施例。

本领域那些技术人员可以理解，可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件，以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外，可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述，本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外，本领域的技术人员能够理解，尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征，但是不同实施例的特征的组合意味着处于本公开的范围之内并且形成不同的实施例。例如，在权利要求书中，所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

本公开的各个部件实施例可以以硬件实现，或者以在一个或者多个处理器上运行的软件模块实现，或者以它们的组合实现。本领域的技术人员应当理解，可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本公开实施例的直播的处理方法中的一些或者全部部件的一些或者全部功能。本公开还可以实现为被配置为执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如，计算机程序和计算机程序产品)。这样的实现本公开的程序可以存储在计算机可读介质上，或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到，或者在载体信号上提供，或者以任何其他形式提供。

应该注意的是上述实施例对本公开进行说明而不是对本公开进行限制，并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中，不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本公开可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中，这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

Claims

1.一种直播的处理方法，其特征在于，所述方法包括：

接收所述目标客户端针对所述题目信息发送的答案信息，并确认所述答案信息与预设答案的相似度；

根据所述相似度确认所述目标客户端的答案信息的正确度。

2.根据权利要求1所述的方法，其特征在于，所述响应于至少两个客户端的连麦请求，控制所述客户端展示题目信息的步骤，包括：

初始化所述主播集合中每个客户端处于连麦状态；

3.根据权利要求2所述的方法，其特征在于，所述根据所述客户端发送的答题请求从所述客户端中选取目标客户端的步骤之后，还包括：

4.根据权利要去3所述的方法，其特征在于，所述答题请求至少包括：请求时间戳；所述根据所述客户端发送的答题请求从所述客户端中选取目标客户端的步骤，包括：

5.根据权利要求4所述的方法，其特征在于，所述答案信息至少包括：基音信息、语音时间戳；所述答案信息与预设答案的时长相同；所述确认所述答案信息与预设答案的相似度的步骤，包括：

6.根据权利要求4所述的方法，其特征在于，所述确认所述答案信息与预设答案的相似度的步骤，包括：

7.根据权利要求4所述的方法，其特征在于，所述确认所述答案信息与预设答案的相似度的步骤，包括：

8.一种直播的处理装置，其特征在于，所述装置包括：

9.一种电子设备，其特征在于，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现权利要求1至7中任一所述的直播的处理方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储计算机程序，所述计算机程序被处理器执行时实现权利要求1至7中任一所述的直播的处理方法。