CN118233696A

CN118233696A - 直播背景切换方法、系统、电子设备及存储介质

Info

Publication number: CN118233696A
Application number: CN202410302448.2A
Authority: CN
Inventors: 康凯; 朱基锋; 周辉
Original assignee: Guangzhou Qianjun Network Technology Co ltd
Current assignee: Guangzhou Qianjun Network Technology Co ltd
Priority date: 2024-03-15
Filing date: 2024-03-15
Publication date: 2024-06-21

Abstract

本公开提供一种直播背景切换方法、系统、电子设备及存储介质，涉及直播技术领域。本公开的直播背景切换方法包括：获取主播端生成的第一音视频流，所述第一音视频流具有原始背景；通过所述主播端将所述原始背景替换为过渡背景，得到第二音视频流；传输所述第二音视频流至观众端；通过所述观众端将所述过渡背景替换为目标背景，得到第三音视频流。本公开的直播背景切换方法将直播音视频流中的人像与背景的分割交由主播端处理，将目标背景的替换交由观众端处理，可以减少对服务器资源的占用，进而能够支持更多的观众同时切换不同的目标背景，增强了直播过程中主播和观众间的互动性。

Description

直播背景切换方法、系统、电子设备及存储介质

技术领域

本公开涉及直播技术领域，尤其涉及一种直播背景切换方法、系统、电子设备及存储介质。

背景技术

现有技术中，为了增加直播的趣味性等，可以采用人像分割技术将直播画面中的主播人像和直播背景进行分离，再为直播画面切换观众想要的目标背景。直播视频流由主播端（即推送直播音视频流的设备）通过CDN（Content Delivery Network，内容分发网络）传输至服务器，服务器接收用户的指令对直播视频流的背景进行替换，得到用户想要的具有目标背景的直播视频流，再将新的直播音视频流，通过CDN传输至观众端（即播放音视频流的设备）供观众端播放。

但上述方案中，利用服务器进行直播背景的切换，需要占用较多的服务器资源，相对来说，仅适用于一场直播同时刻只有少量背景切换需求的直播互动场景。如果存在大量用户在相同时刻都有切换某个主播的直播背景的需求，且目标背景并不相同时，进行背景切换的服务器将产生大量的背景切换任务，消耗大量的服务器资源。

发明内容

本公开提供一种直播背景切换方法、系统、电子设备及存储介质，以解决现有技术中，通过服务器进行直播背景切换导致的消耗大量服务器资源、难以支持大量观众同时切换直播背景的需求的技术问题。

本公开提供该发明内容部分以便以简要的形式介绍构思，这些构思将在后面的具体实施方式部分进行详细描述。该发明内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征，也不旨在用于限制所要求的保护的技术方案的范围。

为了解决上述技术问题，本公开实施例提供一种直播背景切换方法，采用了如下的技术方案，包括：

获取主播端生成的第一音视频流，所述第一音视频流具有原始背景；

通过所述主播端将所述原始背景替换为过渡背景，得到第二音视频流；

传输所述第二音视频流至观众端；

通过所述观众端将所述过渡背景替换为目标背景，得到第三音视频流。

为了解决上述技术问题，本公开实施例还提供一种直播背景切换系统，采用了如下所述的技术方案，包括：

主播端，用于获取第一音视频流，并将所述第一音视频流中的原始背景替换为过渡背景，以得到第二音视频流；

观众端，用于接收所述第二音视频流，并将所述第二音视频流中的所述过渡背景替换为目标背景，以得到第三音视频流；

服务器，配置有背景资源库，所述背景资源库包含所述目标背景，所述观众端能够调用所述目标背景。

为了解决上述技术问题，本公开实施例还提供一种电子设备，采用了如下所述的技术方案，包括：存储器和处理器，所述存储器中存储有计算机程序，所述处理器执行所述计算机程序时实现如前所述的方法。

为了解决上述技术问题，本公开实施例还提供一种计算机可读存储介质，采用了如下所述的技术方案，包括：所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如前所述的方法。

本公开的积极进步效果：

根据本公开的技术方案，将直播音视频流中的人像与背景的分割交由主播端处理，将目标背景的替换交由观众端处理，可以减少对服务器资源的占用，进而能够支持更多的观众同时切换不同的目标背景，增强了直播过程中主播和观众间的互动性。

附图说明

图1为现有技术中直播背景切换系统的示意图；

图2为本公开一实施例提供的一种直播背景切换方法的流程图；

图3为本公开一实施例提供的一种直播背景切换方法的步骤S202的流程图；

图4为本公开一实施例提供的一种直播背景切换方法的步骤S204的流程图；

图5为本公开一实施例提供的一种直播背景切换方法的步骤S403的流程图；

图6为本公开一实施例提供的一种直播背景切换系统的示意图；

图7为本公开一实施例提供的一种电子设备的示意图。

结合附图并参考以下具体实施方式，本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中，相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的，元件和元素不一定按照比例绘制。

具体实施方式

除非另有定义，本文所使用的所有的技术和科学术语与属于本公开的技术领域的技术人员通常理解的含义相同；本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的，不是旨在于限制本公开；本公开的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形，意图在于覆盖不排他的包含。本公开的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象，而不是用于描述特定顺序。

在本文中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本公开的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本文所描述的实施例可以与其它实施例相结合。

为了更好地指出现有技术的不足之处，以及说明本公开相比于现有技术的改进，下面先对现有技术中直播背景切换系统进行介绍。

图1为现有技术中直播背景切换系统的示意图。如图1所示，现有技术中的直播背景切换系统包括主播端101、第一CDN102、服务器103、第二CDN104和观众端，需要说明的是，在不同的直播场次中，观众端的数量并不是唯一的，因此，图中示例性地给出了第一观众端105、第二观众端106和第三观众端107。其中，服务器103包括拉流单元1031、分割单元1032、混流单元1033、背景资源库1034和推流单元1035。直播过程中，背景切换系统的工作流程如下：

主播端101采集直播生成的初始音视频流，并将初始音视频流推流至第一CDN102；

服务器103的拉流单元1031从第一CDN102中获取初始音视频流并传输至分割单元1032；

服务器103的分割单元1032将初始音视频流分割为人像流和原始背景，并将人像流传输至混流单元1033；

服务器103的混流单元1033从背景资源库1034中调取目标背景，将目标背景与人像流混合为目标音视频流，并将目标音视频流传输至推流单元1035；

服务器103的推流单元1035将目标音视频流推流至第二CDN104；

观众端从第二CDN104中获取目标音视频流进行播放。

在此过程中，直播背景的切换主要是在服务器103中进行的，如果同一场直播中，大量用户在相同时刻都具有切换不同直播背景的需求，负责进行直播背景切换的服务器103将产生大量的背景切换任务，需要消耗大量的服务器资源。

针对上述的现有技术中直播背景切换系统存在的技术问题，提出本公开，即本公开旨在解决通过服务器进行直播背景切换导致的服务器资源消耗大、难以支持大量观众同时切换直播背景的需求的技术问题。

为了使本技术领域的人员更好地理解本公开的技术方案，下面将结合附图，对本公开实施例中的技术方案进行清楚、完整地描述。

下面介绍本公开实施例的第一方面：直播背景切换方法。

图2为本公开实施例提供的一种直播背景切换方法的流程图。如图2所示，直播背景切换方法包括步骤S201-S204。

S201，获取主播端生成的第一音视频流，第一音视频流具有原始背景。

本公开的实施例在该处需要说明的是，主播端，即推送直播音视频流的设备，例如，可以是手机、电脑等设备，主播使用主播端进行直播的观看以及接收后续直播音视频流的推送；第一音视频流，即主播利用直播端生成的初始音视频流，该初始音视频流中的背景即为主播在直播过程中的原始背景。

S202，通过主播端将原始背景替换为过渡背景，得到第二音视频流。

本公开的实施例在该处需要说明的是，过渡背景，可以为纯色背景，例如，选用绿色，以得到具有绿色背景的第二音视频流，由于绿色与人的肤色差别大，可以方便后续步骤中对第二音视频流进行人像流与过渡背景的分割处理，进而进行目标背景的替换。

S203，传输第二音视频流至观众端。

本公开的实施例在该处需要说明的是，观众端，即播放音视频流的设备，例如，可以是手机、电脑等设备，观众使用观众端进行直播的播放，但此处的第二音视频流是指观众端接收到的直播音视频流，可以是观众在最开始进入直播间时看到的直播音视频，但观众进行后续直播背景切换的处理后，观众端最终播放的直播音视频并非是第二音视频流，而是背景切换后的直播音视频。

S204，通过观众端将过渡背景替换为目标背景，得到第三音视频流。

本公开的实施例在该处需要说明的是，多个观众端接收到的都是具有过渡背景的第二音视频流，当有较多的观众具有不同的替换目标背景的需求时，由于目标背景的替换是在观众端进行的，各观众仅需在自己的观众端进行操作即可，而无需在服务器中进行目标背景的替换，极大地节省了服务器资源。

进一步的，在本公开的一些实施例中，在执行步骤S202即通过主播端将原始背景替换为过渡背景，得到第二音视频流时，可以通过但不局限于以下的方法实现，如图3所示，包括步骤S301- S304：

S301，将第一音视频流分离为第一视频流和音频流。

本公开的实施例在该处需要说明的是，第一视频流，即主播在直播过程中生成的初始视频流，包含了主播在直播过程中生成的人像流和初始的直播背景；音频流，即主播在直播过程中生成的音频流，包含了主播的在直播过程中的讲话等，还可以包含主播在直播过程中播放的音频等。

其中，关于第一音视频流分离的方法，例如采用直播数据流解封装技术，主要包括：解协议，将协议封装时给音视频数据携带的一些头部描述信息或者信令数据去除掉，提取出具体的音视频封装格式数据；解封装，对提取出的例如FLV、MP4等格式的封装数据进行解封处理，由此得到音频压缩流数据和视频压缩流数据；解码音视频，对提取到的音频和视频的压缩流数据进行解码处理，最终得到音频数据流和视频数据流。

S302，将第一视频流分割为人像流和原始背景。

本公开的实施例在该处需要说明的是，人像流记录了主播在直播间进行直播时的动作、表情变化、姿态等以便于提供更多的信息和特征，帮助系统更好地识别和分割原始背景。同时，这些信息和特征也可以让替换后的背景更加自然和真实，提高背景替换的效果和质量；将原始背景由第一视频流中分割出来，方便后续步骤中对直播背景的替换。

在一个或多个实施例中，分割为人像流和原始背景的步骤例如包括：对视频进行裁剪、缩放、旋转等预处理操作，以使其适合后续的处理。使用深度学习模型，如卷积神经网络（CNN），对主播的动作、表情、姿态等信息等视频数据进行特征提取。使用基于深度学习的图像分割算法，例如U-Net等对主播的视频数据进行背景分割，特别是可以根据提取的主播的特征信息，将主播从背景中分割出来。在一个或多个实施例中，例如基于深度学习、卷积神经网络、循环神经网络、语义分割、抠图等模型和算法，从视频流中提取人物的轮廓、边缘、透明度等信息，然后自动将图像中的人像流和背景分离，并根据需要替换背景，例如通过GrabCut算法和 Background Matting算法等，通过调整阈值来控制前景和背景的分离程度，通过调整平滑度来控制抠图的边缘质量。

S303，将人像流与过渡背景合成为第二视频流。

本公开的实施例在该处需要说明的是，第二视频流中的背景为过渡背景，过渡背景一般会选取与人的肤色相差较大的颜色，可以方便后续对第二视频流的过渡背景进行替换；此外，由于过渡背景的替换是在主播端进行的，只需要进行一次，众多的观众端接收到的便都是具有过渡背景的第二音视频流，而无需每位观众都再进行将初始背景替换为过渡背景的操作。

S304，将第二视频流与音频流合成为第二音视频流。

本公开的实施例在该处需要说明的是，第二视频流展示的主要是主播在过渡背景下的人像流，此时只有画面，还没有声音，因此需要将音频流与第二视频流进行合成，以得到具有音频的第二音视频流。

进一步的，在本公开的一些实施例中，在执行步骤S203传输第二音视频流至观众端时，可以通过但不局限于以下的方法实现，包括：

通过内容分发网络将第二音视频流传输至观众端。

本公开的实施例在该处需要说明的是，内容分发网络，即CDN，全称为ContentDelivery Network，其基本思路是尽可能避开互联网上有可能影响数据传输速度和稳定性的瓶颈和环节，使内容传输地更快、更稳定。因此，通过内容分发网络进行第二音视频流的传输可以保证传输的稳定性。

进一步的，在本公开的一些实施例中，在执行步骤S204通过观众端将过渡背景替换为目标背景，得到第三音视频流时，可以通过但不局限于以下的方法实现，如图4所示，包括步骤S401-S404：

S401，将第二音视频流分离为第二视频流和音频流。

本公开的实施例在该处需要说明的是，观众端接收到的是第二音视频流，第二音视频流包含的是过渡背景，观众需要先将第二音视频流分离为第二视频流和音频流，以便对第二视频流中的过渡背景进行后续的替换。其中，分离的方法可以采用例如解封装技术，该方法在前文中已经详细阐述，此处不再赘述。

S402，将第二视频流分割为人像流和过渡背景。

本公开的实施例在该处需要说明的是，将过渡背景从第二视频流中分割出来，得到人像流，方便后续对人像流的处理。

S403，将人像流与目标背景合成为第三视频流。

本公开的实施例在该处需要说明的是，目标背景是观众根据自身的喜好和需求选取的，目标背景可以来源于观众提供的素材，还可以是来源于网络数据库中的素材等。

S404，将第三视频流与音频流合成为第三音视频流。

本公开的实施例在该处需要说明的是，第三视频流是包含了目标背景的视频流，但只有画面没有声音，将第三视频流与音频流进行合成，得到具有目标背景的第三音视频流，第三音视频流是观众最终根据自身需求进行个性化设置后观看的直播音视频。

进一步的，在本公开的一些实施例中，在执行步骤S403将人像流与目标背景合成为第三视频流时，可以通过但不局限于以下的方法实现，如图5所示，包括步骤S501-S502：

S501，在服务器中构建背景资源库。

本公开的实施例在该处需要说明的是，背景资源库可以包含各种类型的背景图片，例如风景类、建筑类、动物类等等，多种多样类型的图片可以方便后续步骤中更多的观众进行选择，满足不同的观众需求。可选择地，背景资源库可以由观众进行补充和完善，能够较快地丰富背景资源库的内容。

S502，从背景资源库中获取目标背景。

本公开的实施例该处需要说明的是，观众端能够调用服务器中的背景资源库，并从中选定目标背景，背景资源库的建立，方便为更多观众提供选择，节省资源。

下面介绍本公开实施例的第二方面：直播背景切换系统。

图6为本公开实施例提供的一种直播背景切换系统的示意图。如图6所示，该直播背景切换系统包括：

主播端601，被配置为：获取第一音视频流，并将所述第一音视频流中的原始背景替换为过渡背景，以得到第二音视频流；

观众端603，被配置为：接收所述第二音视频流，并将所述第二音视频流中的所述过渡背景替换为目标背景，以得到第三音视频流；

服务器604，被配置为：构建有背景资源库6041，所述背景资源库6041包含所述目标背景，所述观众端603能够调用所述目标背景。

在本公开的一些实施例中，主播端601包括：

采集单元6011，被配置为：获取所述第一音视频流；

分割单元6012，被配置为：将所述第一音视频流分离为第一视频流和音频流，将所述第一视频流分割为人像流和所述原始背景，将所述人像流与所述过渡背景合成为第二视频流，将所述第二视频流与所述音频流合成为所述第二音视频流；

推流单元6013，被配置为：将所述第二音视频流传输至所述观众端603。

在本公开的一些实施例中，观众端603包括：

拉流单元6031，被配置为：获取所述主播端601传输的所述第二音视频流；

混流单元6032，被配置为：将所述第二音视频流分离为第二视频流和所述音频流，将所述第二视频流分割为所述人像流和所述过渡背景，从所述服务器604中获取所述目标背景，并将所述人像流与所述目标背景合成为第三视频流，将所述第三视频流与所述音频流合成为所述第三音视频流；

播放单元6033，被配置为：播放所述第三音视频流。

具体的，在本实施例中，推流单元6013通过CDN602将第二音视频流推送至拉流单元6031。

上述本公开提供的实施例中，对本公开实施例提供的方法、系统进行了介绍。为了实现上述本公开实施例提供的方法中的各功能，采用的电子设备可以包括硬件结构、软件模块，以硬件结构、软件模块、或硬件结构加软件模块的形式来实现上述各功能。上述各功能中的某个功能可以以硬件结构、软件模块、或者硬件结构加软件模块的方式来执行。

下面介绍本公开实施例的第三方面和第四方面：电子设备和计算机可读存储介质。

如图7所示，其示出了适于用来实现本公开实施例的电子设备的示意图。本公开实施例中的电子设备仅仅是一个示例，不应对本公开实施例的功能和使用范围带来任何限制。

如图7所示，电子设备包括处理装置701、存储装置702、传感器装置703、总线704、输入/输出（I/O）接口705、多媒体装置706、电源装置707以及通信装置708等。

处理装置701（例如中央处理器、图形处理器等），用于控制电子设备的整体操作。处理装置701可以包括一个或多个处理器来执行指令，以完成上述的方法的全部或部分步骤。此外，处理装置701还可以包括一个或多个模块，用于处理和其他装置之间的交互。

存储装置702，用于存储各种类型的数据，存储装置702可以是包括各种类型的计算机可读存储介质或者它们的组合，例如可以是电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。

其中，计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器（RAM）、只读存储器（ROM）、可擦式可编程只读存储器（EPROM或闪存）、光纤、便携式紧凑磁盘只读存储器（CD-ROM）、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

传感器装置703，用于感受规定的被测量的信息并按照一定的规律转换成可用输出信号，可以包括一个或多个传感器。例如，其可以包括加速度传感器，陀螺仪传感器，磁传感器，压力传感器或温度传感器等，用于检测电子设备的打开/关闭状态、相对定位、加速/减速、温度、湿度和光线等的变化。

处理装置701、存储装置702以及传感器装置703通过总线704彼此相连。输入/输出（I/O）接口705也连接至总线704。

多媒体装置706，可以包括触摸屏、触摸板、键盘、鼠标、摄像头、麦克风等的输入装置用以接收来自用户的输入信号，在各种输入装置可以与上述传感器装置的各种传感器配合完成例如手势操作输入、图像识别输入、距离检测输入等；多媒体装置还可以包括例如液晶显示器（LCD）、扬声器、振动器等的输出装置。

电源装置707，用于为电子设备中的各种装置提供电力，可以包括电源管理系统、一个或多个电源及为其他装置分配电力的组件。

通信装置708，可以允许电子设备与其他设备进行无线或有线通信以交换数据。

上述各项装置也均可以连接至I/O接口705以实现电子设备的应用。

虽然图中示出了具有各种装置的电子设备，但是应理解的是，并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。

特别地，根据本公开的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括承载在非暂态计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信装置从网络上被下载和安装，或者从存储装置被安装。在该计算机程序被处理装置执行时，执行本公开实施例的方法中限定的上述功能。

在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。

要说明的是，本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。而在本公开中，计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：电线、光缆、RF（射频）等等，或者上述的任意合适的组合。

上述计算机可读介质可以是上述电子设备中所包含的；也可以是单独存在，而未装配入该电子设备中。

进一步地，可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码，上述程序设计语言包括但不限于面向对象的程序设计语言—诸如Java、Python、C++，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络连接到用户计算机，或者，可以连接到外部计算机（例如利用因特网服务提供商来通过因特网连接）。

附图中的流程图和框图，图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本公开实施例中所涉及到的单元可以通过软件的方式实现，也可以通过硬件的方式来实现。其中，单元的名称在某种情况下并不构成对该单元本身的限定。

本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如，非限制性地，可以使用的示范类型的硬件逻辑部件包括：现场可编程门阵列（FPGA）、专用集成电路（ASIC）、专用标准产品（ASSP）、片上系统（SOC）、复杂可编程逻辑设备（CPLD）等等。

下面，简要总结和列出上述根据本公开的实施例的特征。

根据本公开的一个或多个实施例，提供了一种直播背景切换方法，采用了如下所述的技术方案，包括：

传输所述第二音视频流至观众端；

根据本公开的一个或多个实施例，提供了一种直播背景切换方法，采用了如下所述的技术方案，所述通过所述主播端将所述原始背景替换为过渡背景，得到第二音视频流，包括：

将所述第一音视频流分离为第一视频流和音频流；

将所述第一视频流分割为人像流和所述原始背景；

将所述人像流与所述过渡背景合成为第二视频流；

将所述第二视频流与所述音频流合成为所述第二音视频流。

根据本公开的一个或多个实施例，提供了一种直播背景切换方法，采用了如下所述的技术方案，所述传输所述第二音视频流至观众端，包括：

通过内容分发网络将所述第二音视频流传输至所述观众端。

根据本公开的一个或多个实施例，提供了一种直播背景切换方法，采用了如下所述的技术方案，所述通过所述观众端将所述过渡背景替换为目标背景，得到第三音视频流，包括：

将所述第二音视频流分离为第二视频流和所述音频流；

将所述第二视频流分割为所述人像流和所述过渡背景；

将所述人像流与所述目标背景合成为第三视频流；

将所述第三视频流与所述音频流合成为所述第三音视频流。

根据本公开的一个或多个实施例，提供了一种直播背景切换方法，采用了如下所述的技术方案，所述将所述人像流与所述目标背景合成为第三视频流，包括：

在服务器中构建背景资源库；

从所述背景资源库中获取所述目标背景。

根据本公开的一个或多个实施例，提供了一种直播背景切换系统，采用了如下所述的技术方案，包括：

根据本公开的一个或多个实施例，提供了一种直播背景切换系统，采用了如下所述的技术方案，所述主播端包括：

采集单元，用于获取所述第一音视频流；

分割单元，用于将所述第一音视频流分离为第一视频流和音频流，将所述第一视频流分割为人像流和所述原始背景，将所述人像流与所述过渡背景合成为第二视频流，将所述第二视频流与所述音频流合成为所述第二音视频流；

推流单元，用于将所述第二音视频流传输至所述观众端。

根据本公开的一个或多个实施例，提供了一种直播背景切换系统，采用了如下所述的技术方案，所述观众端包括：

拉流单元，用于获取所述主播端传输的所述第二音视频流；

混流单元，用于将所述第二音视频流分离为第二视频流和所述音频流，将所述第二视频流分割为所述人像流和所述过渡背景，从所述服务器中获取所述目标背景，并将所述人像流与所述目标背景合成为第三视频流，将所述第三视频流与所述音频流合成为所述第三音视频流；

播放单元，用于播放所述第三音视频流。

根据本公开的一个或多个实施例，提供了一种电子设备，包括存储器和处理器，所述存储器中存储有计算机程序，所述处理器执行所述计算机程序时实现如前任一项所述的方法。

根据本公开的一个或多个实施例，提供了一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如前任一项所述的方法。

以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解，本公开中所涉及的公开范围，并不限于上述技术特征的特定组合而成的技术方案，同时也应涵盖在不脱离上述公开构思的情况下，由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的（但不限于）具有类似功能的技术特征进行互相替换而形成的技术方案。

此外，虽然采用特定次序描绘了各操作，但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下，多任务和并行处理可能是有利的。同样地，虽然在上面论述中包含了若干具体实现细节，但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地，在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。

尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题，但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反，上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。

Claims

1.一种直播背景切换方法，其特征在于，包括：

传输所述第二音视频流至观众端；

2.根据权利要求1所述的方法，其特征在于，所述通过所述主播端将所述原始背景替换为过渡背景，得到第二音视频流，包括：

将所述第一音视频流分离为第一视频流和音频流；

将所述第一视频流分割为人像流和所述原始背景；

将所述人像流与所述过渡背景合成为第二视频流；

将所述第二视频流与所述音频流合成为所述第二音视频流。

3.根据权利要求1所述的方法，其特征在于，所述传输所述第二音视频流至观众端，包括：

通过内容分发网络将所述第二音视频流传输至所述观众端。

4.根据权利要求1所述的方法，其特征在于，所述通过所述观众端将所述过渡背景替换为目标背景，得到第三音视频流，包括：

将所述第二音视频流分离为第二视频流和所述音频流；

将所述第二视频流分割为所述人像流和所述过渡背景；

将所述人像流与所述目标背景合成为第三视频流；

将所述第三视频流与所述音频流合成为所述第三音视频流。

5.根据权利要求4所述的方法，其特征在于，所述将所述人像流与所述目标背景合成为第三视频流，包括：

在服务器中构建背景资源库；

从所述背景资源库中获取所述目标背景。

6.一种直播背景切换系统，其特征在于，包括：

7.根据权利要求6所述的系统，其特征在于，所述主播端包括：

采集单元，用于获取所述第一音视频流；

推流单元，用于将所述第二音视频流传输至所述观众端。

8.根据权利要求6所述的系统，其特征在于，所述观众端包括：

拉流单元，用于获取所述主播端传输的所述第二音视频流；

播放单元，用于播放所述第三音视频流。

9.一种电子设备，其特征在于，包括存储器和处理器，所述存储器中存储有计算机程序，所述处理器执行所述计算机程序时实现如权利要求1-5中任一项所述的方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1-5中任一项所述的方法。