WO2023236045A1

WO2023236045A1 - 实现虚拟人物和真人视频混合连麦的系统和方法

Info

Publication number: WO2023236045A1
Application number: PCT/CN2022/097401
Authority: WO
Inventors: 段新盟; 陈帅雷; 刘宁
Original assignee: 云智联网络科技(北京)有限公司
Priority date: 2022-06-07
Filing date: 2022-06-07
Publication date: 2023-12-14

Abstract

本申请提供一种实现虚拟人物和真人视频混合连麦的系统和方法，该方法包括：获取来自虚拟人物主播终端和真人视频主播终端中任一者的连麦请求；将所述连麦请求发送至对方主播终端；响应于所述对方主播终端对所述连麦请求的确认，将所述虚拟人物主播终端的虚拟人物形象指令发送至所述真人视频主播终端和真人视频主播直播间的观众终端，以及将所述真人视频主播终端的视频流发送至所述虚拟人物主播终端和虚拟人物主播直播间的观众终端，其中，所述虚拟人物形象指令用于调用所述虚拟人物主播终端、所述真人视频主播终端和观众终端中预置的虚拟元素集中的元素。根据本申请的方案，丰富了直播互动的呈现形式，为观众带来更佳的观看体验。

Description

实现虚拟人物和真人视频混合连麦的系统和方法

技术领域

本申请涉及直播领域，尤其涉及一种实现虚拟人物和真人视频混合连麦的系统和方法。

背景技术

现有技术中，直播的主播之间的互动过程，需要主播打开各自的摄像头，摄像头摄制主播的直播视频，并将直播视频发送到直播间的各个观众的终端。观众在观看主播直播或互动的过程中，可以给主播留言、打赏或发送气氛或效果内容，在主播的直播过程中进行呈现。

然而，这种真人直播形式的互动过程比较单一，直播场景比较单调，观众的观看体验有待进一步丰富。

发明内容

基于此，本申请提供了一种实现虚拟人物和真人视频混合连麦的方案，在主播的连麦互动过程中，不再局限于真人之间互动形式，而是真人视频主播与虚拟人物主播之间的互动，丰富了直播互动的呈现形式，为观众带来更佳的观看体验。

根据本申请的第一个方面，提供一种实现虚拟人物和真人视频混合连麦的方法，应用于服务器端，包括：

获取来自虚拟人物主播终端和真人视频主播终端中任一者的连麦请求；

将所述连麦请求发送至所述虚拟人物主播终端和真人视频主播终端中的对方主播终端；

响应于所述对方主播终端对所述连麦请求的确认，将所述虚拟人物主播终端的虚拟人物形象指令发送至所述真人视频主播终端和真人视频主播直播间的观众终端，以及将所述真人视频主播终端的视频流发送至所述虚拟人物主播终端和虚拟人物主播直播间的观众终端，其中，所述虚拟人物形象指令用于调用所述虚拟人物主播终端、所述真人视频主播终端和观众终端中预置的虚拟元素集中的元素。

根据本申请的第二个方面，提供一种实现虚拟人物和真人视频混合连麦的方法，应用于虚拟人物主播终端，包括：

生成虚拟人物形象指令，并将所述虚拟人物形象指令发送至服务器端；

接收来自真人视频主播终端的视频流；以及

根据所述视频流，显示真人视频主播的连麦形象。

根据本申请的第三个方面，提供一种实现虚拟人物和真人视频混合连麦的方法，应用于真人视频主播终端，包括：

生成直播视频流，并将所述直播视频流发送至服务器端；

接收来自虚拟人物主播终端的虚拟人物形象指令；以及

根据所述虚拟人物形象指令调用预置的虚拟元素集中的虚拟元素显示对应主播的虚拟人物形象。

根据本申请的第四个方面，提供一种实现虚拟人物和真人视频混合连麦的方法，应用于观众终端，包括：

接收来自虚拟人物主播终端的虚拟人物形象指令；

接收来自真人视频主播终端的直播视频流；以及

根据所述虚拟人物形象指令调用预置的虚拟元素集中的虚拟元素显示所述虚拟人物主播的虚拟人物形象，并根据所述直播视频流显示真人视频主播的连麦形象。

根据本申请的第五个方面，提供一种实现虚拟人物和真人视频混合连麦的系统，其包括服务器端、虚拟人物主播终端、真人视频主播终端和观众终端，其中，所述服务器端执行如第一个方面所述的方法，所述虚拟人物主播终端执行如第二个方面所述的方法，所述真人视频主播终端执行如第三个方面所述的方法，所述观众终端执行如第四个方面所述的方法。

根据本申请提出的实现虚拟人物和真人视频混合连麦的系统和方法，在主播和观众的终端均分别预置与主播虚拟形象相关的虚拟形象元素，虚拟形象元素有对应的虚拟形象元素指令，主播终端或观众终端通过服务器端向其他终端发送虚拟元素指令，主播终端和观众终端根据虚拟形象元素指令，调用预置的虚拟形象元素，呈现虚拟效果。这样，首先，不限制连麦双方主播必须是相同的主播人物呈现形式，即可以存在真人视频主播与虚拟人物主播的混合形式，这样使得连麦的形式更加灵活，为观众呈现新颖的直播观看体验；其次，对于虚拟人物主播的直播互动，由于只需传输虚拟元素指令，无需传输真实人物直播过程中的真实画面，降低了对网络带宽的需求；再者，主播终端和用户终端发送的虚拟效果(例如气氛效果、打赏效果)更匹配主播的虚拟人物形象，从视觉、互动、可玩性等各个维度比真人直播更加丰富。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，还可以根据这些附图获得其他的附图，而并不超出本申请要求保护的范围。

图1是根据本申请实施例的实现虚拟人物和真人视频混合连麦的系统的示意图。

图2是根据本申请实施例的由服务器端执行的实现虚拟人物和真人视频混合连麦的方法的流程图。

图3(a)是根据本申请一个实施例的由虚拟人物主播终端执行的实现虚拟人物和真人视频混合连麦的方法的流程图。

图3(b)是根据另一个本申请实施例的由虚拟人物主播终端执行的实现虚拟人物和真人视频混合连麦的方法的流程图。

图4(a)是根据本申请一个实施例的由真人视频主播终端执行的实现虚拟人物和真人视频混合连麦的方法的流程图。

图4(b)是根据另一个本申请实施例的由真人视频主播终端执行的实现虚拟人物和真人视频混合连麦的方法的流程图。

图5是根据本申请实施例的由观众终端执行的实现虚拟人物和真人视频混合连麦的方法的流程图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

图1是根据本申请实施例的实现虚拟人物和真人视频混合连麦的系统的示意图。如图1所示，实现虚拟人物和真人视频混合连麦的系统包括服务器端、真人视频主播终端、虚拟人物主播终端和观众终端，其中，真人视频主播终端、虚拟人物主播终端和观众终端分别与服务器端连接。

在本申请中，“虚拟人物和真人视频混合连麦”指的是主播在直播过程中存在真人形象和虚拟人物形象。在本申请的实现虚拟人物和真人视频混合连麦的系统中(例如在服务器端)存储了与虚拟人物直播和互动相关的虚拟元素集，这个虚拟元素集包括了与虚拟人物直播和互动相关的各个虚拟元素，例如，与虚拟人物相关的人物形象设定(卡通人物、动物等)、人物的身体部位(五官、头发、四肢等)、人物的穿戴(帽子、衣服、手套等)、虚拟人物所处的背景、主播或观众发送的气氛或打赏等。服务器端、主播终端和观众终端都可以发出相应的指令来调用虚拟元素集中的虚拟元素，从而呈现对应的虚拟效果。

为了实现虚拟人物直播，虚拟人物主播在开播前，需要预置虚拟元素集(例如，从服务器端下载)，并需要设置自己的虚拟形象。例如，虚拟人物主播可以设置自己的眼睛、耳朵，还可以设置自己的穿戴等。虚拟人物主播在个性化设置自己的虚拟形象后，在开播时，就形成与该虚拟形象的设置对应的虚拟人物形象指令，并将该虚拟人物形象指令发送至服务器端，服务器端将该虚拟人物形象指令发送至主播直播间内的观众终端。

观众终端为了呈现虚拟人物直播，在进入直播间的同时或之前，需要预置虚拟元素集(例如，从服务器端下载)。在进入直播间后，观众终端可以从服务器端接收到主播终端发送的虚拟人物形象指令，根据该虚拟人物形象指令调用预置的虚拟元素集，呈现虚拟人物直播的效果。

虚拟人物形象指令包括静态元素指令和动态元素指令，其中，静态元素指令包括直播所呈现的虚拟形象，例如，主播所呈现的静态状态(身体部位是什么样的，穿戴的衣服帽子是什么样的)，虚拟人物所处的背景以及主播发送的气氛或打赏是什么样的等；而虚拟人物主播在直播的过程中会存在各种表情和动作，比如眨眼、跳舞、微笑等，虚拟人物主播的终端(例如通过摄像头)会捕捉这些动作，所形成的指令为动态元素指令，动态元素指令用于指示主播的虚拟形象进行各种动作。例如，主播眨眼，主播的终端捕捉到眨眼动作，形成指示主播的虚拟人物形象的眨眼的指令，并将该指令发送到服务器端，服务器端再将该指令发送到观众终端，观众终端根据该指令呈现主播的虚拟人物形象眨眼的效果。

在主播直播的过程中，如果需要与另一个主播互动，则需要向服务器端发送互动请求。例如，第一主播(可以是真人视频主播也可以是虚拟人物主播)通过其终端向服务器端发送互动请求。该互动请求可以指定进行互动的对象，例如指定第二主播；该互动请求还可以不指定进行互动的对象，而指示服务器端指定一个互动对象或随机匹配一个互动对象，例如随机匹配了第二主播。第一主播获取互动主播对象的方式本申请不做限定。

在真人视频主播和虚拟人物主播建立连麦的过程中，发起连麦请求的主播(可以是真人视频主播也可以是虚拟人物主播)可以开播也可以不开播。在开播的情况下，发起连麦请求的主播向服务器端发送连麦请求；在不开播的情况下，发起连麦请求的主播首先以观众的身份进入连麦对象主播的直播间，然后通过服务器端向对象主播终端发送连麦请求。

在确定第一主播的互动对象(第二主播)后，服务器端将互动请求发送至第二主播终端。第二主播终端在收到该请求后，向第二主播呈现该互动请求信息，若第二主播不同意进行互动，则第二主播终端向服务器端发送拒绝请求消息，在第一主播指定互动对象的模式下，服务器端向第一主播终端反馈互动请求被拒绝的消息；在随机匹配互动对象的模式下，服务器端继续匹配下一个互动对象，直至匹配到接受互动请求的对象或收到所有待匹配对象的拒绝消息。若第二主播同意进行互动，则第二主播终端向服务器端发送互动确认消息。

服务器端在收到第二主播的互动确认后，将虚拟人物主播终端的虚拟人物形象指令发送至真人视频主播终端和真人视频主播直播间的观众终端，并将真人视频主播终端的视频流发送至虚拟人物主播终端和虚拟人物主播直播间的观众终端，其中，虚拟人物形象指令用于调用虚拟人物主播终端、真人视频主播终端和观众终端中预置的虚拟元素集中的元素。

真人视频主播终端在收到虚拟人物主播终端发送的虚拟人物形象指令后，调用预置的虚拟元素集中的虚拟元素，显示虚拟人物主播的虚拟人物形象。虚拟人物主播在收到真人视频主播终端发送的视频流后，根据视频流，显示真人视频主播的连麦形象。观众终端在收到虚拟人物主播终端发送的虚拟人物形象指令后，调用预置的虚拟元素集中的虚拟元素，显示虚拟人物主播的虚拟人物形象以及主播之间的互动过程，例如显示主播之间虚拟摸头、虚拟敲打等动画。观众终端在收到真人视频主播终端发送的视频流后，根据视频流，显示真人视频主播的连麦形象。

这样，真人视频主播可以看到虚拟人物主播的虚拟人物形象，虚拟人物主播可以看到真人视频主播的真人连麦形象，而观众可以看到虚拟人物主播的虚拟人物形象以及真人视频主播的真人连麦形象。在直播互动的过程中，主播终端和观众终端可以采用各种形式显示主播画面，例如，观众将看到两个窗体，一个是虚拟形象主播的窗体，一个是真人视频主播的窗体，两个窗体一个全屏，一个小屏，可以通过点击小屏的方式，实现两种形象展示的切换，即大屏(虚拟形象)，小屏(真人视频)，或者大屏(真人视频)，小屏(虚拟形象)，本申请对此不做限制。

观众在观看主播互动的过程中可以参与进来，例如通过渲染气氛、打赏等形式。例如，观众向喜欢的主播打赏，选择打赏效果。观众与真人视频主播和虚拟人物主播之间的互动可供选择的互动效果可以是不同的。例如，对于赠送礼物来说，对虚拟人物主播可以赠送特有的虚拟礼物及虚拟特效，而对于真人视频主播可以赠送普通连发礼物及特效礼物。这样，当观众希望与主播进行互动时，互动对象的不同，供观众选择的互动形式也不同。例如，当观众选择与主播进行互动时，互动对象为真人视频主播和虚拟人物主播，观众终端为观众呈现的互动效果选择列表的内容可以是不同的。

这样，对于观众与真人视频主播的互动，观众终端将代表所选互动效果(例如打赏效果)的普通效果指令发送至服务器端，服务器端将该指令发送至主播终端和其他观众终端，主播终端和其他观众终端在收到该指令后，根据该指令显示互动效果。对于观众与虚拟人物主播的互动，观众终端将代表所选互动效果(例如打赏效果)的虚拟特效指令发送至服务器端，服务器端将该指令发送至主播终端和其他观众终端，主播终端和其他观众终端在收到该指令后，根据该指令调用预置的虚拟元素集中的虚拟元素，显示互动效果。

或者，观众与真人视频主播和虚拟人物主播之间的互动可供选择的互动效果不受主播是真人视频主播还是虚拟人物主播的限制，即，对虚拟人物主播可以发送普通效果指令，虚拟人物主播终端呈现普通效果；对真人视频主播可以发送虚拟特效，例如基于人脸识别的特效，真人视频主播终端呈现虚拟效果。

在混合连麦过程中，真人视频主播和虚拟人物主播之间可以进行互动。例如，真人视频主播对虚拟人物主播拍一拍动作等。其中，真人视频主播向虚拟人物主播的互动，真人视频主播选择互动的内容和效果，生成虚拟互动指令并向服务器端发送的虚拟互动指令，服务器端将虚拟互动指令发送至虚拟人物主播终端和观众终端。虚拟人物主播终端和观众终端根据虚拟互动指令调用预置的虚拟元素集中的虚拟元素，显示真人视频主播与虚拟人物主播之间的互动过效果。

上述实现混合连麦的方案中，为了便于说明，采用两个主播的混合连麦进行描述。然而，本领域技术人员可以理解的是，本申请混合连麦的方案的主播的数量可以是任意的，而且，只要存在真人视频主播和虚拟人物主播就可以，真人视频主播和虚拟人物主播的数量不做限制。

采用本申请的混合连麦互动方式，不限制连麦双方主播必须是相同的主播人物呈现形式，即可以存在真人视频主播与虚拟人物主播的混合形式，这样使得连麦的形式更加灵活，为观众呈现新颖的直播观看体验。另外，在混合连麦的过程中，主播终端、观众终端和服务器端发送的调用虚拟元素集的指令所呈现的效果，相对于真人直播，与虚拟人物更匹配，例如，观众为主播打赏了一个帽子的虚拟效果，这个帽子能够刚好戴在主播的虚拟人物的头上，而如果主播是真人形象，匹配效果不是很好。这样，采用本申请的混合连麦互动方式，从视觉、互动、可玩性等各个维度比真人直播更加丰富。

根据图1所示的实现虚拟人物和真人视频混合连麦的系统以及组成该系统的服务器端和终端的运行过程，本申请还提供一种实现虚拟人物和真人视频混合连麦的方法，分别如图2、图3(a)、图3(b)、图4(a)、图4(b)和图5所示。

图2是根据本申请实施例的由服务器端执行的实现虚拟人物和真人视频混合连麦的方法的流程图。如图2所示，该方法包括如下步骤。

步骤S201，获取来自虚拟人物主播终端和真人视频主播终端中任一者的连麦请求。

步骤S202，将所述连麦请求发送至所述虚拟人物主播终端和真人视频主播终端中的对方主播终端。

步骤S203，响应于所述对方主播终端对所述连麦请求的确认，将所述虚拟人物主播终端的虚拟人物形象指令发送至所述真人视频主播终端和真人视频主播直播间的观众终端，以及将所述真人视频主播终端的视频流发送至所述虚拟人物主播终端和虚拟人物主播直播间的观众终端，其中，所述虚拟人物形象指令用于调用所述虚拟人物主播终端、所述真人视频主播终端和观众终端中预置的虚拟元素集中的元素。

在混合连麦过程中，服务器端除了收到来自主播终端的虚拟人物形象指令和视频流，还会收到来自观众终端的指令。这样，由服务器端执行的实现虚拟人物和真人视频混合连麦的方法还包括：

步骤S204，获取来自所述观众终端中的第一观众终端的虚拟特效指令。

步骤S205，将所述虚拟特效指令发送至所述虚拟人物主播终端、所述真人视频主播终端和除所述第一观众终端的其他观众终端。

或者，观众与真人视频主播和虚拟人物主播之间的互动可供选择的互动效果不受主播是真人视频主播还是虚拟人物主播的限制，即，对虚拟人物主播可以发送普通效果指令，虚拟人物主播终端呈现普通效果；对真人视频主播可以发送虚拟特效指令，真人视频主播终端呈现虚拟效果。

在混合连麦过程中，真人视频主播和虚拟人物主播之间可以进行互动。这样，由服务器端执行的实现虚拟人物和真人视频混合连麦的方法还包括：

步骤S206，获取来自所述真人视频主播终端的虚拟互动指令。

步骤S207，将所述虚拟互动指令发送至所述虚拟人物主播终端和观众终端。

真人视频主播向虚拟人物主播的互动，真人视频主播选择互动的内容和效果，生成虚拟互动指令并向服务器端发送的虚拟互动指令，服务器端将虚拟互动指令发送至虚拟人物主播终端和观众终端。虚拟人物主播终端和观众终端根据虚拟互动指令调用预置的虚拟元素集中的虚拟元素，显示真人视频主播与虚拟人物主播之间的互动过效果。

在混合连麦结束时，服务器端会停止两个主播直播间之间的互动。这样，由服务器端执行的实现虚拟人物和真人视频混合连麦的方法还包括：

步骤S208，响应于连麦的结束，停止将所述虚拟人物主播终端的虚拟人物形象指令发送至所述真人视频主播终端和真人视频主播直播间的观众终端，停止将所述真人视频主播终端的视频流发送至所述虚拟人物主播终端和虚拟人物主播直播间的观众终端。

这样，观众终端恢复混合连麦之前的主播的画面，即虚拟人物主播直播间的观众恢复虚拟人物形象画面，真人视频主播直播间的观众恢复真人视频画面。

图3(a)是根据本申请一个实施例的由虚拟人物主播终端执行的实现虚拟人物和真人视频混合连麦的方法的流程图。如图3(a)所示，该方法包括如下步骤。

步骤S301，生成虚拟人物形象指令，并将所述虚拟人物形象指令发送至服务器端。

步骤S302，接收来自真人视频主播终端的视频流。

步骤S303，根据所述视频流，显示真人视频主播的连麦形象。

真人视频主播和虚拟人物主播确认连麦时，服务器端将虚拟人物主播终端的虚拟人物形象指令发送至真人视频主播终端和真人视频主播直播间的观众终端，并将真人视频主播终端的视频流发送至虚拟人物主播终端和虚拟人物主播直播间的观众终端。虚拟人物主播在收到真人视频主播终端发送的视频流后，根据视频流，显示真人视频主播的连麦形象。

在混合连麦过程中，虚拟人物主播终端除了收到来自真人视频主播终端的视频流，还会收到来自观众终端的指令。这样，由虚拟人物主播终端执行的实现虚拟人物和真人视频混合连麦的方法还包括：

步骤S304，接收来自观众终端的虚拟特效指令。

步骤S305，根据所述虚拟特效指令调用预置的虚拟元素集中的虚拟元素显示虚拟特效。

在混合连麦过程中，真人视频主播和虚拟人物主播之间可以进行互动。这样，由虚拟人物主播终端执行的实现虚拟人物和真人视频混合连麦的方法还包括：

步骤S306，接收来自所述真人视频主播终端的虚拟互动指令。

步骤S307，根据所述虚拟互动指令调用预置的虚拟元素集中的虚拟元素显示互动特效。

在一个实施例中，在真人视频主播和虚拟人物主播建立连麦的过程中，虚拟人物主播可以开播也可以不开播。在开播的情况下，虚拟人物主播向服务器端发送连麦请求；在不开播的情况下，虚拟人物主播首先以观众的身份进入真人视频主播的直播间，然后通过服务器端向真人视频主播终端发送连麦请求。

从而，如图3(b)所示，除了图3(a)所示的步骤S301至步骤S307，由虚拟人物主播终端执行的实现虚拟人物和真人视频混合连麦的方法还可以包括步骤S308和步骤S309。

步骤S308，进入所述真人视频主播的直播间；

步骤S309，通过所述服务器端向所述真人视频主播终端发送连麦请求。

图4(a)是根据本申请一个实施例的由真人视频主播终端执行的实现虚拟人物和真人视频混合连麦的方法的流程图。如图4(a)所示，该方法包括如下步骤。

步骤S401，生成直播视频流，并将所述直播视频流发送至服务器端。

步骤S402，接收来自虚拟人物主播终端的虚拟人物形象指令。

步骤S403，根据所述虚拟人物形象指令调用预置的虚拟元素集中的虚拟元素显示对应主播的虚拟人物形象。

真人视频主播和虚拟人物主播确认连麦时，服务器端将虚拟人物主播终端的虚拟人物形象指令发送至真人视频主播终端和真人视频主播直播间的观众终端，并将真人视频主播终端的视频流发送至虚拟人物主播终端和虚拟人物主播直播间的观众终端，其中，虚拟人物形象指令用于调用虚拟人物主播终端、真人视频主播终端和观众终端中预置的虚拟元素集中的元素。

在混合连麦过程中，真人视频主播终端除了收到来自虚拟人物主播终端的虚拟人物形象指令，还会收到来自观众终端的指令。这样，由真人视频主播终端执行的实现虚拟人物和真人视频混合连麦的方法还包括：

步骤S404，接收来自观众终端的虚拟特效指令。

步骤S405，根据所述虚拟特效指令调用预置的虚拟元素集中的虚拟元素显示虚拟特效。

在混合连麦过程中，真人视频主播和虚拟人物主播之间可以进行互动。这样，由真人视频主播终端执行的实现虚拟人物和真人视频混合连麦的方法还包括：

步骤S406，向所述服务器端发送虚拟互动指令。

在一个实施例中，在真人视频主播和虚拟人物主播建立连麦的过程中，真人视频主播可以开播也可以不开播。在开播的情况下，真人视频主播向服务器端发送连麦请求；在不开播的情况下，真人视频主播首先以观众的身份进入虚拟人物主播的直播间，然后通过服务器端向虚拟人物主播终端发送连麦请求。

从而，如图4(b)所示，除了图4(a)所示的步骤S401至步骤S406，由虚拟人物主播终端执行的实现虚拟人物和真人视频混合连麦的方法还可以包括步骤S407和步骤S408。

步骤S407，进入所述虚拟人物主播的直播间；

步骤S408，通过所述服务器端向所述虚拟人物主播终端发送连麦请求。

图5是根据本申请实施例的由观众终端执行的实现虚拟人物和真人视频混合连麦的方法的流程图。如图5所示，该方法包括如下步骤。

步骤S501，接收来自虚拟人物主播终端的虚拟人物形象指令。

步骤S502，接收来自真人视频主播终端的直播视频流。

步骤S503，根据所述虚拟人物形象指令调用预置的虚拟元素集中的虚拟元素显示所述虚拟人物主播的虚拟人物形象，并根据所述直播视频流显示真人视频主播的连麦形象。

在混合连麦过程中，观众终端也可以参与互动，例如，对主播进行打赏。这样，由观众终端执行的实现虚拟人物和真人视频混合连麦的方法还包括：

步骤S504，生成第一虚拟特效指令，并将所述第一虚拟特效指令发送至服务器端。

步骤S505，接收来自所述服务器端的第二虚拟特效指令。

步骤S506，根据所述第二虚拟特效指令调用预置的虚拟元素集中的虚拟元素显示虚拟特效。

在混合连麦过程中，真人视频主播和虚拟人物主播之间可以进行互动。这样，由观众终端执行的实现虚拟人物和真人视频混合连麦的方法还包括：

步骤S507，接收来自所述真人视频主播终端的虚拟互动指令。

步骤S508，根据所述虚拟互动指令调用预置的虚拟元素集中的虚拟元素显示互动特效。

需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本申请并不受所描述的动作顺序的限制，因为依据本申请，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于可选实施例，所涉及的动作和模块并不一定是本申请所必须的。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

以上对本申请实施例进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明仅用于帮助理解本申请的方法及其核心思想。同时，本领域技术人员依据本申请的思想，基于本申请的具体实施方式及应用范围上做出的改变或变形之处，都属于本申请保护的范围。综上所述，本说明书内容不应理解为对本申请的限制。

Claims

一种实现虚拟人物和真人视频混合连麦的方法，应用于服务器端，包括：

获取来自虚拟人物主播终端和真人视频主播终端中任一者的连麦请求；

将所述连麦请求发送至所述虚拟人物主播终端和真人视频主播终端中的对方主播终端；

响应于所述对方主播终端对所述连麦请求的确认，将所述虚拟人物主播终端的虚拟人物形象指令发送至所述真人视频主播终端和真人视频主播直播间的观众终端，以及将所述真人视频主播终端的视频流发送至所述虚拟人物主播终端和虚拟人物主播直播间的观众终端，其中，所述虚拟人物形象指令用于调用所述虚拟人物主播终端、所述真人视频主播终端和观众终端中预置的虚拟元素集中的元素。
如权利要求1所述的方法，还包括：

获取来自所述观众终端中的第一观众终端的虚拟特效指令；以及

将所述虚拟特效指令发送至所述虚拟人物主播终端、所述真人视频主播终端和除所述第一观众终端的其他观众终端。
如权利要求1所述的方法，还包括：

获取来自所述真人视频主播终端的虚拟互动指令；以及

将所述虚拟互动指令发送至所述虚拟人物主播终端和观众终端。
如权利要求1至3任一者所述的方法，还包括：

响应于连麦的结束，停止将所述虚拟人物主播终端的虚拟人物形象指令发送至所述真人视频主播终端和真人视频主播直播间的观众终端，停止将所述真人视频主播终端的视频流发送至所述虚拟人物主播终端和虚拟人物主播直播间的观众终端。
如权利要求1至3任一者所述的方法，其中，所述虚拟人物形象指令包括静态元素指令和动态元素指令。
一种实现虚拟人物和真人视频混合连麦的方法，应用于虚拟人物主播终端，包括：

生成虚拟人物形象指令，并将所述虚拟人物形象指令发送至服务器端；

接收来自真人视频主播终端的视频流；以及

根据所述视频流，显示真人视频主播的连麦形象。
如权利要求6所述的方法，还包括：

接收来自观众终端的虚拟特效指令；

根据所述虚拟特效指令调用预置的虚拟元素集中的虚拟元素显示虚拟特效。
如权利要求6或7所述的方法，还包括：

接收来自所述真人视频主播终端的虚拟互动指令；

根据所述虚拟互动指令调用预置的虚拟元素集中的虚拟元素显示互动特效。
如权利要求6或7所述的方法，还包括：

进入所述真人视频主播的直播间；

通过所述服务器端向所述真人视频主播终端发送连麦请求。
一种实现虚拟人物和真人视频混合连麦的方法，应用于真人视频主播终端，包括：

生成直播视频流，并将所述直播视频流发送至服务器端；

接收来自虚拟人物主播终端的虚拟人物形象指令；以及

根据所述虚拟人物形象指令调用预置的虚拟元素集中的虚拟元素显示对应主播的虚拟人物形象。
如权利要求10所述的方法，还包括：

接收来自观众终端的虚拟特效指令；

根据所述虚拟特效指令调用预置的虚拟元素集中的虚拟元素显示虚拟特效。
如权利要求10或11所述的方法，还包括：

向所述服务器端发送虚拟互动指令。
如权利要求10或11所述的方法，还包括：

进入所述虚拟人物主播的直播间；

通过所述服务器端向所述虚拟人物主播终端发送连麦请求。
一种实现虚拟人物和真人视频混合连麦的方法，应用于观众终端，包括：

接收来自虚拟人物主播终端的虚拟人物形象指令；

接收来自真人视频主播终端的直播视频流；以及

根据所述虚拟人物形象指令调用预置的虚拟元素集中的虚拟元素显示所述虚拟人物主播的虚拟人物形象，并根据所述直播视频流显示真人视频主播的连麦形象。
如权利要求14所述的方法，还包括：

生成第一虚拟特效指令，并将所述第一虚拟特效指令发送至服务器端；

接收来自所述服务器端的第二虚拟特效指令；

根据所述第二虚拟特效指令调用预置的虚拟元素集中的虚拟元素显示虚拟特效。
如权利要求14或15所述的方法，还包括：

接收来自所述真人视频主播终端的虚拟互动指令；

根据所述虚拟互动指令调用预置的虚拟元素集中的虚拟元素显示互动特效。
一种实现虚拟人物和真人视频混合连麦的系统，其包括服务器端、虚拟人物主播终端、真人视频主播终端和观众终端，其中，所述服务器端执行如权利要求1至5任一者所述的方法，所述虚拟人物主播终端执行如权利要求6至9任一者所述的方法，所述真人视频主播终端执行如权利要求10至13任一者所述的方法，所述观众终端执行如权利要求14至16任一者所述的方法。