CN117395449A

CN117395449A - 针对ai数字人直播内容差异化处理方法及处理装置

Info

Publication number: CN117395449A
Application number: CN202311678999.0A
Authority: CN
Inventors: 李火亮; 黄杰
Original assignee: Tuoshe Technology Group Co ltd; Jiangxi Tuoshi Intelligent Technology Co ltd
Current assignee: Tuoshe Technology Group Co ltd; Jiangxi Tuoshi Intelligent Technology Co ltd
Priority date: 2023-12-08
Filing date: 2023-12-08
Publication date: 2024-01-12
Anticipated expiration: 2043-12-08
Also published as: CN117395449B

Abstract

本申请提供了一种针对AI数字人直播内容差异化处理方法及处理装置，所述方法包括：确定n个数字人直播间；确定n个数字人直播间中播放时段重叠的最大直播间数量k；获取参考直播剧本及对应音频时长；根据直播间的播放时长及该音频时长确定播放直播视频的n个循环次数，并与该数量k确定直播剧本数量p；根据参考直播剧本生成p个直播剧本，再生成p个第一数字人直播视频；获取p个背景视频，并与p个第一数字人直播视频合成p个第二数字人直播视频；确定n个数字人直播间的q个重复时段，每一重复时段的不同直播间分配不同的第二数字人直播视频，控制n个数字人直播间在相应时段播放第二数字人直播视频。

Description

针对AI数字人直播内容差异化处理方法及处理装置

技术领域

本发明涉及图像通信中的视频直播应用领域，尤其涉及一种针对AI数字人直播内容差异化处理方法及处理装置。

背景技术

基于数字人进行直播时，用户先选好要直播的数字人形象，以及基于直播剧本录制对应的直播音频，然后在进行直播前，先基于直播音频对数字人进行数字人训练，以得到直播视频，然后在直播时，用户基于一般的直播规则，先确定要上架的产品，然后打开直播间，播放该直播视频。

在使用数字人进行直播时，用户为了提高直播热度，往往会在多个直播间同时进行直播，但由于数字人直播所播放的是直播视频，则会导致多个直播间的直播视频的音频和背景均相同，使得直播视频重复率过高，同时，用户为了提高直播时长，还会将直播视频循环播放，导致同一直播间的相同话术和相同视频素材多次循环，使得直播视频重复率过高。

如何提高直播视频的差异性，降低视频内容的重复率，便是亟待解决的问题。

发明内容

本发明实施例提供一种针对AI数字人直播内容差异化处理方法及处理装置，提高了直播视频的差异性，降低了视频内容的重复率。

第一方面，本发明实施例提供了一种针对AI数字人直播内容差异化处理方法，应用于数字人直播系统的服务器，所述数字人直播系统包括所述服务器和客户端设备，所述方法包括：

确定n个数字人直播间，所述n个数字人直播间中每个数字人直播间对应一个播放时段，n为正整数；

根据所述每个数字人直播间的播放时段，确定所述n个数字人直播间中每一数字人直播间的播放时长；

根据所述n个数字人直播间中每个数字人直播间的播放时段确定所述n个直播间中播放时段重叠的最大直播间数量k，k为小于或等于n的正整数；

获取所述客户端设备发送的参考直播剧本，并获取所述参考直播剧本的音频时长；

根据所述n个数字人直播间中每一数字人直播间的播放时长以及所述音频时长确定所述n个数字人直播间中每一数字人直播间播放直播视频的循环次数，得到n个循环次数；

根据所述最大直播间数量k和所述n个循环次数确定直播剧本数量p，p为正整数；

根据所述参考直播剧本和所述直播剧本数量p生成p个直播剧本，所述p个直播剧本表达内容相同但直播通用话术的表达方式不同；

根据所述p个直播剧本生成p个第一数字人直播视频，每一所述第一数字人直播视频的播放时长与所述音频时长相等；

获取与所述p个直播剧本等数量的p个背景视频；

将所述p个背景视频和所述p个第一数字人直播视频进行视频融合，得到p个第二数字人直播视频；

根据所述每个数字人直播间的播放时段确定所述n个数字人直播间的重复时段，得到q个重复时段，q为正整数，所述重复时段表示所述n个数字人直播间中至少两个数字人直播间同时在线直播；

根据所述q个重复时段将所述p个第二数字人直播视频分配给所述n个数字人直播间，以使得所述q个重复时段中每一重复时段不同的数字人直播间分配不同的所述第二数字人直播视频，并控制所述n个数字人直播间在相应的播放时段播放分配的第二数字人直播视频。

第二方面，本发明实施例提供了一种针对AI数字人直播内容差异化处理装置，应用于数字人直播系统的服务器，所述数字人直播系统包括所述服务器和客户端设备，所述装置包括第一确定模块、第一获取模块、第二确定模块、生成模块、第二获取模块、融合模块、第三确定模块以及分配控制模块，其中：

所述第一确定模块，用于确定n个数字人直播间，所述n个数字人直播间中每个数字人直播间对应一个播放时段，n为正整数；根据所述每个数字人直播间的播放时段，确定所述n个数字人直播间中每一数字人直播间的播放时长；根据所述n个数字人直播间中每个数字人直播间的播放时段确定所述n个直播间中播放时段重叠的最大直播间数量k，k为小于或等于n的正整数；

所述第一获取模块，用于获取所述客户端设备发送的参考直播剧本，并获取所述参考直播剧本的音频时长；

所述第二确定模块，用于根据所述n个数字人直播间中每一数字人直播间的播放时长以及所述音频时长确定所述n个数字人直播间中每一数字人直播间播放直播视频的循环次数，得到n个循环次数；根据所述最大直播间数量k和所述n个循环次数确定直播剧本数量p，p为正整数；

所述生成模块，用于根据所述参考直播剧本和所述直播剧本数量p生成p个直播剧本，所述p个直播剧本表达内容相同但直播通用话术的表达方式不同；根据所述p个直播剧本生成p个第一数字人直播视频，每一所述第一数字人直播视频的播放时长与所述音频时长相等；

所述第二获取模块，用于获取与所述p个直播剧本等数量的p个背景视频；

所述融合模块，用于将所述p个背景视频和所述p个第一数字人直播视频进行视频融合，得到p个第二数字人直播视频；

所述第三确定模块，用于根据所述每个数字人直播间的播放时段确定所述n个数字人直播间的重复时段，得到q个重复时段，q为正整数，所述重复时段表示所述n个数字人直播间中至少两个数字人直播间同时在线直播；

所述分配控制模块，用于根据所述q个重复时段将所述p个第二数字人直播视频分配给所述n个数字人直播间，以使得所述q个重复时段中每一重复时段不同的数字人直播间分配不同的所述第二数字人直播视频，并控制所述n个数字人直播间在相应的播放时段播放分配的第二数字人直播视频。

第三方面，本申请实施例提供一种服务器，包括处理器、存储器、通信接口以及一个或多个程序，其中，上述一个或多个程序被存储在上述存储器中，并且被配置由上述处理器执行，上述程序包括用于执行本申请实施例第一方面任一方法中的步骤的指令。

第四方面，本申请实施例提供了一种计算机可读存储介质，其中，上述计算机可读存储介质存储用于电子数据交换的计算机程序，其中，上述计算机程序使得计算机执行如本申请实施例第一方面任一方法中所描述的部分或全部步骤。

第五方面，本申请实施例提供了一种计算机程序产品，其中，上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质，上述计算机程序可操作来使计算机执行如本申请实施例第一方面任一方法中所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。

附图说明

为了更清楚地说明本发明实施例技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的一种数字人直播系统的系统架构图；

图2是本申请实施例提供的一种服务器的结构示意图；

图3是本申请实施例提供的一种针对AI数字人直播内容差异化处理方法的流程示意图；

图4是本申请实施例提供的一种针对AI数字人直播内容差异化处理装置的功能模块组成框图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象，而不是用于描述特定顺序。此外，术语“包括”和“具有”以及它们任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元，而是可选地还包括没有列出的步骤或单元，或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。

应理解，本文中术语“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中字符“/”，表示前后关联对象是一种“或”的关系。本申请实施例中出现的“多个”是指两个或两个以上。

本申请实施例中的“至少一项(个)”或其类似表达，是指这些项中的任意组合，包括单项(个)或复数项(个)的任意组合，是指一个或多个，多个指的是两个或两个以上。例如，a、b或c中的至少一项(个)，可以表示如下七种情况：a，b，c，a和b，a和c，b和c，a、b和c。其中，a、b、c中的每一个可以是元素，也可以是包含一个或多个元素的集合。

本申请实施例中出现的“连接”是指直接连接或者间接连接等各种连接方式，以实现设备间的通信，本申请实施例对此不做任何限定。

在本文中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本文所描述的实施例可以与其它实施例相结合。

目前，在使用数字人进行直播时，用户为了提高直播热度，往往会在多个直播间同时进行直播，但由于数字人直播所播放的是直播视频，则会导致多个直播间的直播视频的音频和背景均相同，使得直播视频重复率过高，同时，用户为了提高直播时长，还会将直播视频循环播放，导致同一场直播间相同话术和相同视频素材多次循环，也会使得直播视频重复率过高。

为解决上述问题，本申请实施例提供了一种针对AI数字人直播内容差异化处理方法及处理装置，首先，确定n个数字人直播间，n个数字人直播间中每个数字人直播间对应一个播放时段，n为正整数；根据每个数字人直播间的播放时段，确定n个数字人直播间中每一数字人直播间的播放时长；根据n个数字人直播间中每个数字人直播间的播放时段确定n个直播间中播放时段重叠的最大直播间数量k，k为小于或等于n的正整数；然后，获取客户端设备发送的参考直播剧本，并获取参考直播剧本的音频时长；根据n个数字人直播间中每一数字人直播间的播放时长以及音频时长确定n个数字人直播间中每一数字人直播间播放直播视频的循环次数，得到n个循环次数；根据最大直播间数量k和n个循环次数确定直播剧本数量p，p为正整数；根据参考直播剧本和直播剧本数量p生成p个直播剧本，p个直播剧本表达内容相同但直播通用话术的表达方式不同；根据p个直播剧本生成p个第一数字人直播视频，每一第一数字人直播视频的播放时长与音频时长相等；再获取与p个直播剧本等数量的p个背景视频；将p个背景视频和p个第一数字人直播视频进行视频融合，得到p个第二数字人直播视频；根据每个数字人直播间的播放时段确定n个数字人直播间的重复时段，得到q个重复时段，q为正整数，重复时段表示n个数字人直播间中至少两个数字人直播间同时在线直播；最后，根据q个重复时段将p个第二数字人直播视频分配给n个数字人直播间，以使得q个重复时段中每一重复时段不同的数字人直播间分配不同的第二数字人直播视频，并控制n个数字人直播间在相应的播放时段播放分配的第二数字人直播视频。可见，通过快速生成不同的数字人直播视频，并将不同的数字人直播视频分配给各直播间，提高了直播视频的差异性，降低了视频内容的重复率。

下面结合图1对本申请实施例中的一种用于执行针对AI数字人直播内容差异化处理方法的系统架构进行说明，图1是本申请实施例提供的一种数字人直播系统的系统架构图，该数字人直播系统110包括服务器111和客户端设备112，该服务器111和客户端设备112通信连接。

当用户需要多个直播间进行数字人直播时，客户端设备112会向服务器111发送直播需求，服务器111根据直播需求确定n个数字人直播间及播放时段重叠的最大直播间数量k，然后服务器111接收来自客户端设备112发送的参考直播剧本，根据参考直播剧本的音频时长和每个数字人直播间的播放时长确定每个数字人直播间的直播视频循环次数，服务器111可以根据最大直播间数量k和每个数字人直播间的直播视频循环次数确定直播剧本数量p，再根据直播剧本数量p生成p个第一数字人直播视频，服务器111获取对应p个背景视频，可以将p个背景视频与第一数字人直播视频进行融合，得到p个第二数字人直播视频，服务器111将p个第二数字人直播视频分配给n个数字人直播间，并保证同时直播的数字人直播间的第二数字人直播视频不同，提高了直播视频的差异性，降低了视频内容的重复率，减少了直播成本。

下面结合图2对本申请实施例中的服务器进行说明，图2为本申请实施例提供的一种服务器的结构示意图，如图2所示，该服务器111包括一个或多个应用处理器220、存储器230、通信模块240以及一个或多个程序231，该应用处理器220通过内部通信总线与该存储器230、该通信模块240通信连接。

其中，应用处理器220主要用于：

确定n个数字人直播间，n个数字人直播间中每个数字人直播间对应一个播放时段，n为正整数；

根据每个数字人直播间的播放时段，确定n个数字人直播间中每一数字人直播间的播放时长；

根据n个数字人直播间中每个数字人直播间的播放时段确定n个直播间中播放时段重叠的最大直播间数量k，k为小于或等于n的正整数；

获取客户端设备发送的参考直播剧本，并获取参考直播剧本的音频时长；

根据n个数字人直播间中每一数字人直播间的播放时长以及音频时长确定n个数字人直播间中每一数字人直播间播放直播视频的循环次数，得到n个循环次数；

根据最大直播间数量k和n个循环次数确定直播剧本数量p，p为正整数；

根据参考直播剧本和直播剧本数量p生成p个直播剧本，p个直播剧本表达内容相同但直播通用话术的表达方式不同；

根据p个直播剧本生成p个第一数字人直播视频，每一第一数字人直播视频的播放时长与音频时长相等；

获取与p个直播剧本等数量的p个背景视频；

将p个背景视频和p个第一数字人直播视频进行视频融合，得到p个第二数字人直播视频；

根据每个数字人直播间的播放时段确定n个数字人直播间的重复时段，得到q个重复时段，q为正整数，重复时段表示n个数字人直播间中至少两个数字人直播间同时在线直播；

根据q个重复时段将p个第二数字人直播视频分配给n个数字人直播间，以使得q个重复时段中每一重复时段不同的数字人直播间分配不同的第二数字人直播视频，并控制n个数字人直播间在相应的播放时段播放分配的第二数字人直播视频。

其中，该一个或多个程序231被存储在上述存储器230中，且被配置由上述应用处理器220执行，该一个或多个程序231包括用于执行上述方法实施例中任一步骤的指令。

其中，应用处理器220例如可以是中央处理器（Central Processing Unit，CPU），通用处理器，数字信号处理器（Digital Signal Processor，DSP），专用集成电路（Application-Specific Integrated Circuit，ASIC），现场可编程门阵列（FieldProgrammable Gate Array，FPGA）或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框，单元和电路。应用处理器220也可以是实现计算功能的组合，例如包含一个或多个微处理器组合，DSP和微处理器的组合等等。通信单元可以是通信模块240、收发器、收发电路等，存储单元可以是存储器230。

存储器230可以是易失性存储器或非易失性存储器，或可包括易失性和非易失性存储器两者。其中，非易失性存储器可以是只读存储器（read-only memory，ROM）、可编程只读存储器（programmable ROM，PROM）、可擦除可编程只读存储器（erasable PROM，EPROM）、电可擦除可编程只读存储器（electrically EPROM，EEPROM）或闪存。易失性存储器可以是随机存取存储器（random access memory，RAM），其用作外部高速缓存。通过示例性但不是限制性说明，许多形式的随机存取存储器（random access memory，RAM）可用，例如静态随机存取存储器（static RAM，SRAM）、动态随机存取存储器（DRAM）、同步动态随机存取存储器（synchronous DRAM，SDRAM）、双倍数据速率同步动态随机存取存储器（double data rateSDRAM，DDR SDRAM）、增强型同步动态随机存取存储器（enhanced SDRAM，ESDRAM）、同步连接动态随机存取存储器（synchlink DRAM，SLDRAM）和直接内存总线随机存取存储器（directrambus RAM，DR RAM）。

可以理解的是，服务器111可包括比上述结构框图中更多或更少的结构元件，例如，包括电源模块、物理按键、Wi-Fi模块、扬声器、蓝牙模块、传感器、显示模块等，在此不进行限定。可以理解，该服务器111可以搭载如图1所述的系统架构。

需要说明的是，本申请实施例所涉及到的客户端设备可以是具备通信能力的电子设备，该电子设备可以包括各种具有无线通信功能的手持设备、车载设备、可穿戴设备、计算设备或连接到无线调制解调器的其他处理设备，以及各种形式的用户设备（UserEquipment，UE），移动台（Mobile Station，MS），终端设备（terminal device）等等。

在了解本申请的软硬件架构后，下面结合图3对本申请实施例中的一种针对AI数字人直播内容差异化处理方法进行说明，所述针对AI数字人直播内容差异化处理方法应用于数字人直播系统的服务器，所述数字人直播系统包括所述服务器和客户端设备，图3为本申请实施例提供的一种针对AI数字人直播内容差异化处理方法的流程示意图，具体包括以下步骤：

步骤S301，确定n个数字人直播间。

其中，所述n个数字人直播间中每个数字人直播间对应一个播放时段，n为正整数。所述n个数字人直播间来自于用户的直播需求，该直播需求可以包括直播账号的信息，所述n个数字人直播间的每个数字人直播间均对应一个直播账号，服务器可以根据每个直播账号的信息，确定每一个数字人直播间及对应的直播信息。

步骤S302，根据所述每个数字人直播间的播放时段，确定所述n个数字人直播间中每一数字人直播间的播放时长。

其中，每个数字人直播间都对应着一个直播信息，该直播信息包括数字人直播间的播放时段，可以根据每个数字人直播间的播放时段确定每个数字人直播间的播放时长。

步骤S303，根据所述n个数字人直播间中每个数字人直播间的播放时段确定所述n个直播间中播放时段重叠的最大直播间数量k。

其中，k为小于或等于n的正整数，所述n个数字人直播间中存在播放时段相同的数字人直播间，为获取播放时段重叠的最大直播间数量k，先确定每个播放时段对应的数字人直播间数量，然后对于每个播放时段根据对应的数字人直播间数量进行从大到小的排序，获取该数量最大的播放时段，确定该播放时段对应的数字人直播间数量k。

步骤S304，获取所述客户端设备发送的参考直播剧本，并获取所述参考直播剧本的音频时长。

其中，所述客户端设备发送的参考直播剧本包括文本内容和音频内容，该文本内容与音频内容相对应，根据音频内容获取参考直播剧本的音频时长。

步骤S305，根据所述n个数字人直播间中每一数字人直播间的播放时长以及所述音频时长确定所述n个数字人直播间中每一数字人直播间播放直播视频的循环次数，得到n个循环次数。

其中，多个音频时长的总时长大于或者等于所述n个数字人直播间中每一数字人直播间的播放时长，该多个音频时长的个数即为对应数字人直播间播放直播视频的循环次数，以此类推，得到n个数字人直播间对应的n个循环次数。

步骤S306，根据所述最大直播间数量k和所述n个循环次数确定直播剧本数量p。

其中，p为正整数，获取所述最大直播间数量k对应的k个数字人直播间；从所述n个循环次数中获取与所述k个数字人直播间对应的k个循环次数；将所述k个循环次数进行求和，得到所述直播剧本数量p。

具体的，先获取最大直播间数量k对应的k个数字人直播间，该k个数字人直播间需在同一播放时段进行数字人直播，再获取该k个数字人直播间对应的k个循环次数，该k个循环次数表明该k个数字人直播间中每个数字人直播间对应的直播剧本的数量，将k个循环次数进行求和，可以得到直播剧本的总数量p。

步骤S307，根据所述参考直播剧本和所述直播剧本数量p生成p个直播剧本。

其中，所述p个直播剧本表达内容相同但直播通用话术的表达方式不同，服务器在获取参考直播剧本后，可以根据该直播剧本生成对应p个直播剧本，该p个直播剧本由AI自动生成，且该p个直播剧本的类型相同，即表达的内容一致，但所使用的直播通用话术不同，使得该p个直播剧本具有一定的差异性，便于后续生成不同的直播视频。

步骤S308，根据所述p个直播剧本生成p个第一数字人直播视频。

其中，每一所述第一数字人直播视频的播放时长与所述音频时长相等，服务器在获取该p个直播剧本后，可以根据该p个直播剧本的文本内容生成对应的p个音频文件，该p个音频文件的音色可以由AI根据参考剧本中对应音频内容的音色生成，再将该p个音频文件与数字人形象进行渲染，得到p个第一数字人直播视频。

步骤S309，获取与所述p个直播剧本等数量的p个背景视频。

其中，该p个背景视频的时长均大于或者小于该p个第一数字人直播视频。

步骤S310，将所述p个背景视频和所述p个第一数字人直播视频进行视频融合，得到p个第二数字人直播视频。

其中，该p个背景视频具有一定的差异性，且该p个背景视频中不同的背景视频的个数可以是一个或者多个，在此不做具体限定，服务器在获取该p个背景视频后，将第一数字人直播视频中的背景替换为对应的背景视频，得到p个第二数字人直播视频。

步骤S311，根据所述每个数字人直播间的播放时段确定所述n个数字人直播间的重复时段，得到q个重复时段。

其中，q为正整数，所述重复时段表示所述n个数字人直播间中至少两个数字人直播间同时在线直播。

步骤S312，根据所述q个重复时段将所述p个第二数字人直播视频分配给所述n个数字人直播间，以使得所述q个重复时段中每一重复时段不同的数字人直播间分配不同的所述第二数字人直播视频，并控制所述n个数字人直播间在相应的播放时段播放分配的第二数字人直播视频。

其中，首先确定所述q个重复时段中每一重复时段的时间长度，得到q个第一时间长度；再确定所述q个第一时间长度与所述音频时长之间的比值，得到q个比值，并对所述q个比值进行向上取整，得到q个数值，并对所述q个数值进行求和，得到a，a为正整数；从所述p个第二数字人直播视频中获取a个第二数字人直播视频，剩余p-a个第二数字人直播视频；根据所述q个数值将所述a个第二数字人直播视频分配给所述q个重复时段；最后，根据所述q个第一时间长度和所述n个数字人直播间中每一数字人直播间的播放时长将所述p-a个第二数字人直播视频分配给所述n个数字人直播间。

其中，所述根据所述q个第一时间长度和所述n个数字人直播间中每一数字人直播间的播放时长将所述p-a个第二数字人直播视频分配给所述n个数字人直播间，包括：根据所述n个数字人直播间中每一数字人直播间的播放时长和所述q个第一时间长度确定所述n个数字人直播间中每一数字人直播间的非重复时段的时间长度，得到q个第二时间长度；确定所述q个第二时间长度的总时长；确定所述q个第二时间长度中每一第二时间长度与所述总时长之间的占比，得到q个占比；根据所述q个占比和所述p-a个第二数字人直播视频确定分配份额，得到q个分配份额；根据所述q个分配份额将所述p-a个第二数字人直播视频分配给所述n个数字人直播间。

在一个可能的实例中，在所述控制所述n个数字人直播间在相应的播放时段播放分配的第二数字人直播视频之后，获取所述n个数字人直播间同一播放时段对应的任意两个直播视频；将所述任意两个直播视频进行相似性分析，得到相似比例值；若所述相似比例值比例高于预设比例阈值，则发送第一提示信息给所述客户端设备，所述第一提示信息包括推荐直播视频，所述推荐直播视频为所述p个第二数字人直播视频中除所述任意两个直播视频之外的任一直播视频，或者，所述推荐直播视频为所述任意两个直播视频中任一直播视频的背景或者音频修改后的视频；接收所述客户端设备发送针对所述第一提示信息的确认指令，若用户同意所述第一提示信息，则响应于用户第一同意指令，将所述推荐直播视频替换所述任意两个直播视频中的一个直播视频。

在一个可能的实例中，在所述控制所述n个数字人直播间在相应的播放时段播放分配的第二数字人直播视频之前，为所述n个数字人直播间中每一数字人直播间分配一个底层视频，得到n个底层视频，每一底层视频的视频时长大于或者等于相应的数字人直播间的播放时长；将所述n个底层视频与所述n个数字人直播间中已分配的所述第二数字人直播视频进行融合。

其中，所述为所述n个数字人直播间中每一数字人直播间分配一个底层视频，包括：获取数字人直播间i对应的目标视频地址，所述数字人直播间i为所述n个数字人直播间中的任一数字人直播间；将所述目标视频地址对应的视频内容作为所述数字人直播间i的目标底层视频。

其中，所述将所述n个底层视频与所述n个数字人直播间中已分配的所述第二数字人直播视频进行融合，包括：将所述目标底层视频显示在所述数字人直播间i中的已分配的所述第二数字人直播视频的最底层；调整所述视频内容的图层的透明度至预设透明度值；调整所述视频内容的音量至预设音量值。

可见，通过上述方法，可以根据参考直播剧本快速生成多个数字人直播视频，通过使用不同的数字人直播视频，保证了同时直播的直播视频的音频或者背景至少有一个不相同，提高了直播视频的差异性，降低了视频内容的重复率，减少了直播的成本，对每个数字人直播间均设有一段底层视频，提高了数字人直播的稳定性。

上述主要从方法侧执行过程的角度对本申请实施例的方案进行了介绍。可以理解的是，电子设备为了实现上述功能，其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到，结合本文中所提供的实施例描述的各示例的单元及算法步骤，本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

本申请实施例可以根据上述方法示例对服务器进行功能模块的划分，例如，可以对应各个功能划分各个功能模块，也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。需要说明的是，本申请实施例中对模块的划分是示意性的，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。

在采用对应各个功能划分各个功能模块的情况下，图4为本申请实施例提供的一种针对AI数字人直播内容差异化处理装置的功能模块组成框图，所述针对AI数字人直播内容差异化处理装置400，应用于数字人直播系统的服务器，所述数字人直播系统包括所述服务器和客户端设备，所述装置包括第一确定模块410、第一获取模块420、第二确定模块430、生成模块440、第二获取模块450、融合模块460、第三确定模块470以及分配控制模块480，其中：

第一确定模块410，用于确定n个数字人直播间，所述n个数字人直播间中每个数字人直播间对应一个播放时段，n为正整数；根据所述每个数字人直播间的播放时段，确定所述n个数字人直播间中每一数字人直播间的播放时长；根据所述n个数字人直播间中每个数字人直播间的播放时段确定所述n个直播间中播放时段重叠的最大直播间数量k，k为小于或等于n的正整数；

第一获取模块420，用于获取所述客户端设备发送的参考直播剧本，并获取所述参考直播剧本的音频时长；

第二确定模块430，用于根据所述n个数字人直播间中每一数字人直播间的播放时长以及所述音频时长确定所述n个数字人直播间中每一数字人直播间播放直播视频的循环次数，得到n个循环次数；根据所述最大直播间数量k和所述n个循环次数确定直播剧本数量p，p为正整数；

生成模块440，用于根据所述参考直播剧本和所述直播剧本数量p生成p个直播剧本，所述p个直播剧本表达内容相同但直播通用话术的表达方式不同；根据所述p个直播剧本生成p个第一数字人直播视频，每一所述第一数字人直播视频的播放时长与所述音频时长相等；

第二获取模块450，用于获取与所述p个直播剧本等数量的p个背景视频；

融合模块460，用于将所述p个背景视频和所述p个第一数字人直播视频进行视频融合，得到p个第二数字人直播视频；

第三确定模块470，用于根据所述每个数字人直播间的播放时段确定所述n个数字人直播间的重复时段，得到q个重复时段，q为正整数，所述重复时段表示所述n个数字人直播间中至少两个数字人直播间同时在线直播；

分配控制模块480，用于根据所述q个重复时段将所述p个第二数字人直播视频分配给所述n个数字人直播间，以使得所述q个重复时段中每一重复时段不同的数字人直播间分配不同的所述第二数字人直播视频，并控制所述n个数字人直播间在相应的播放时段播放分配的第二数字人直播视频。

可见，根据参考直播剧本快速生成多个数字人直播视频，通过使用不同的数字人直播视频，保证了同时直播的直播视频的音频或者背景至少有一个不相同，提高了直播视频的差异性，降低了视频内容的重复率，减少了直播的成本。

需要说明的是，各个操作的具体实现可以采用上述所示的方法实施例的相应描述，一种针对AI数字人直播内容差异化处理装置可以用于执行本申请上述方法实施例，对此不再赘述。

本申请实施例还提供了一种计算机存储介质，其中，该计算机存储介质存储用于电子数据交换的计算机程序，该计算机程序使得计算机执行如上述方法实施例中记载的任一方法的部分或全部步骤，上述计算机包括电子设备。

本申请实施例还提供了一种计算机程序产品，上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质，上述计算机程序可操作来使计算机执行如上述方法实施例中记载的任一方法的部分或全部步骤。该计算机程序产品可以为一个软件安装包，上述计算机包括电子设备。

需要说明的是，对于上述的各个实施例，为了简单描述，将其都表述为一系列的动作组合。本领域技术人员应该知悉，本申请不受所描述的动作顺序的限制，因为本申请实施例中的某些步骤可以采用其他顺序或者同时进行。另外，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作、步骤、模块或单元等并不一定是本申请实施例所必须的。

在上述实施例中，本申请实施例对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

综上所述，通过实施本发明实施例，可以根据参考直播剧本快速生成多个数字人直播视频，通过使用不同的数字人直播视频，保证了同时直播的直播视频的音频或者背景至少有一个不相同，提高了直播视频的差异性，降低了视频内容的重复率，减少了直播的成本，对每个数字人直播间均设有一段底层视频，提高了数字人直播的稳定性。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，该流程可以由计算机程序来指令相关的硬件完成，该程序可存储于计算机可读取存储介质中，该程序在执行时，可包括如上述各方法实施例的流程。而前述的存储介质包括：ROM或随机存储记忆体RAM、磁碟或者光盘等各种可存储程序代码的介质。

本申请实施例所描述的方法或者算法的步骤可以以硬件的方式来实现，也可以是由处理器执行软件指令的方式来实现。软件指令可以由相应的软件模块组成，软件模块可以被存放于RAM、闪存、ROM、EPROM、电可擦可编程只读存储器（electrically EPROM，EEPROM）、寄存器、硬盘、移动硬盘、只读光盘（CD-ROM）或者本领域熟知的任何其它形式的存储介质中。一种示例性的存储介质耦合至处理器，从而使处理器能够从该存储介质读取信息，且可向该存储介质写入信息。当然，存储介质也可以是处理器的组成部分。处理器和存储介质可以位于ASIC中。另外，该ASIC可以位于终端设备或管理设备中。当然，处理器和存储介质也可以作为分立组件存在于终端设备或管理设备中。

本领域技术人员应该可以意识到，在上述一个或多个示例中，本申请实施例所描述的功能可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行该计算机程序指令时，全部或部分地产生按照本申请实施例所述的流程或功能。该计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。该计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输。例如，该计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线（例如同轴电缆、光纤、数字用户线（digital subscriberline，DSL））或无线（例如红外、无线、微波等）方式向另一个网站站点、计算机、服务器或数据中心进行传输。该计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。该可用介质可以是磁性介质（例如，软盘、硬盘、磁带）、光介质（例如，数字视频光盘（digital video disc，DVD））、或者半导体介质（例如，固态硬盘（solid state disk，SSD））等。

上述实施例中描述的各个装置、产品包含的各个模块/单元，其可以是软件模块/单元，也可以是硬件模块/单元，或者也可以部分是软件模块/单元，部分是硬件模块/单元。例如，对于应用于或集成于芯片的各个装置、产品，其包含的各个模块/单元可以都采用电路等硬件的方式实现，或者，至少部分模块/单元可以采用软件程序的方式实现，该软件程序运行于芯片内部集成的处理器，剩余的（如果有）部分模块/单元可以采用电路等硬件方式实现；对于应用于或集成于芯片模组的各个装置、产品，其包含的各个模块/单元可以都采用电路等硬件的方式实现，不同的模块/单元可以位于芯片模组的同一组件（例如芯片、电路模块等）或者不同组件中，或者，至少部分模块/单元可以采用软件程序的方式实现，该软件程序运行于芯片模组内部集成的处理器，剩余的（如果有）部分模块/单元可以采用电路等硬件方式实现；对于应用于或集成于终端设备的各个装置、产品，其包含的各个模块/单元可以都采用电路等硬件的方式实现，不同的模块/单元可以位于终端设备内同一组件（例如，芯片、电路模块等）或者不同组件中，或者，至少部分模块/单元可以采用软件程序的方式实现，该软件程序运行于终端设备内部集成的处理器，剩余的（如果有）部分模块/单元可以采用电路等硬件方式实现。

以上所述的具体实施方式，对本申请实施例的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本申请实施例的具体实施方式而已，并不用于限定本申请实施例的保护范围，凡在本申请实施例的技术方案的基础之上，所做的任何修改、等同替换、改进等，均应包括在本申请实施例的保护范围之内。

Claims

1.一种针对AI数字人直播内容差异化处理方法，其特征在于，应用于数字人直播系统的服务器，所述数字人直播系统包括所述服务器和客户端设备，包括：

获取与所述p个直播剧本等数量的p个背景视频；

2.如权利要求1所述的方法，其特征在于，所述根据所述最大直播间数量k和所述n个循环次数确定直播剧本数量p，包括：

获取所述最大直播间数量k对应的k个数字人直播间；

从所述n个循环次数中获取与所述k个数字人直播间对应的k个循环次数；

将所述k个循环次数进行求和，得到所述直播剧本数量p。

3.如权利要求1或2所述的方法，其特征在于，所述根据所述q个重复时段将所述p个第二数字人直播视频分配给所述n个数字人直播间，以使得所述q个重复时段中每一重复时段不同的数字人直播间分配不同的所述第二数字人直播视频，包括：

确定所述q个重复时段中每一重复时段的时间长度，得到q个第一时间长度；

确定所述q个第一时间长度与所述音频时长之间的比值，得到q个比值，并对所述q个比值进行向上取整，得到q个数值，并对所述q个数值进行求和，得到a，a为正整数；

从所述p个第二数字人直播视频中获取a个第二数字人直播视频，剩余p-a个第二数字人直播视频；

根据所述q个数值将所述a个第二数字人直播视频分配给所述q个重复时段；

根据所述q个第一时间长度和所述n个数字人直播间中每一数字人直播间的播放时长将所述p-a个第二数字人直播视频分配给所述n个数字人直播间。

4.如权利要求3所述的方法，其特征在于，所述根据所述q个第一时间长度和所述n个数字人直播间中每一数字人直播间的播放时长将所述p-a个第二数字人直播视频分配给所述n个数字人直播间，包括：

根据所述n个数字人直播间中每一数字人直播间的播放时长和所述q个第一时间长度确定所述n个数字人直播间中每一数字人直播间的非重复时段的时间长度，得到q个第二时间长度；

确定所述q个第二时间长度的总时长；

确定所述q个第二时间长度中每一第二时间长度与所述总时长之间的占比，得到q个占比；

根据所述q个占比和所述p-a个第二数字人直播视频确定分配份额，得到q个分配份额；

根据所述q个分配份额将所述p-a个第二数字人直播视频分配给所述n个数字人直播间。

5.如权利要求1所述的方法，其特征在于，在所述控制所述n个数字人直播间在相应的播放时段播放分配的第二数字人直播视频之后，所述方法还包括：

获取所述n个数字人直播间同一播放时段对应的任意两个直播视频；

将所述任意两个直播视频进行相似性分析，得到相似比例值；

若所述相似比例值比例高于预设比例阈值，则发送第一提示信息给所述客户端设备，所述第一提示信息包括推荐直播视频，所述推荐直播视频为所述p个第二数字人直播视频中除所述任意两个直播视频之外的任一直播视频，或者，所述推荐直播视频为所述任意两个直播视频中任一直播视频的背景或者音频修改后的视频；

接收所述客户端设备发送针对所述第一提示信息的确认指令，

若用户同意所述第一提示信息，则响应于用户第一同意指令，将所述推荐直播视频替换所述任意两个直播视频中的一个直播视频。

6.如权利要求1或2所述的方法，其特征在于，在所述控制所述n个数字人直播间在相应的播放时段播放分配的第二数字人直播视频之前，所述方法还包括：

为所述n个数字人直播间中每一数字人直播间分配一个底层视频，得到n个底层视频，每一底层视频的视频时长大于或者等于相应的数字人直播间的播放时长；

将所述n个底层视频与所述n个数字人直播间中已分配的所述第二数字人直播视频进行融合。

7.如权利要求6所述的方法，其特征在于，所述为所述n个数字人直播间中每一数字人直播间分配一个底层视频，包括：

获取数字人直播间i对应的目标视频地址，所述数字人直播间i为所述n个数字人直播间中的任一数字人直播间；

将所述目标视频地址对应的视频内容作为所述数字人直播间i的目标底层视频；

所述将所述n个底层视频与所述n个数字人直播间中已分配的所述第二数字人直播视频进行融合，包括：

将所述目标底层视频显示在所述数字人直播间i中的已分配的所述第二数字人直播视频的最底层；

调整所述视频内容的图层的透明度至预设透明度值；

调整所述视频内容的音量至预设音量值。

8.一种针对AI数字人直播内容差异化处理装置，其特征在于，应用于数字人直播系统的服务器，所述数字人直播系统包括所述服务器和客户端设备，所述装置包括第一确定模块、第一获取模块、第二确定模块、生成模块、第二获取模块、融合模块、第三确定模块以及分配控制模块，其中：

9.一种服务器，其特征在于，包括：处理器，存储器，以及一个或多个程序；所述一个或多个程序被存储在所述存储器中，并且被配置成由所述处理器执行，所述程序包括用于执行如权利要求1-7任一项所述的方法中的步骤的指令。

10.一种计算机存储介质，其特征在于，所述计算机存储介质存储有计算机程序，所述计算机程序包括程序指令，所述程序指令当被处理器执行时使所述处理器执行如权利要求1-7任一项所述的方法。