CN117079194B

CN117079194B - 云视频ai理解生成方法、装置及计算机设备

Info

Publication number: CN117079194B
Application number: CN202311316558.6A
Authority: CN
Inventors: 贺国超; 王曜; 刘琦; 许亦; 请求不公布姓名
Original assignee: Shenzhen Yuntian Changxiang Information Technology Co ltd
Current assignee: Shenzhen Yuntian Changxiang Information Technology Co ltd
Priority date: 2023-10-12
Filing date: 2023-10-12
Publication date: 2024-01-05
Anticipated expiration: 2043-10-12
Also published as: CN117079194A

Abstract

本发明公开了一种云视频AI理解生成方法、装置及计算机设备，包括以下步骤：获取期望图像；根据期望图像，进行像素块抽取，得到多个第一像素块；根据第一像素块，通过AI理解网络，得到多个云视频帧；将多个云视频帧，通过序列映射关系，得到云视频帧序列顺序；根据云视频帧序列顺序，对各个云视频帧进行序列化，得到云视频。本发明通过AI理解网络，自动快速生成符合期望的视频，提高云视频帧生成效率，而且通过序列映射关系控制云视频帧的序列顺序，能够保证生成的云视频动态性更佳，更具真实感。

Description

云视频AI理解生成方法、装置及计算机设备

技术领域

本发明涉及视频处理技术领域，具体涉及一种云视频AI理解生成方法、装置及计算机设备。

背景技术

云游戏是以云计算为基础的游戏方式，在云游戏的运行模式下，所有游戏都在服务器端运行，并将渲染完毕后的游戏画面压缩后通过网络传送给用户。在客户端，用户的游戏设备不需要任何高端处理器和显卡，只需要基本的视频解压能力就可以了。云计算（cloud computing），是一种基于互联网的计算方式，通过这种方式，共享的软硬件资源和信息可以按需提供给计算机和其他设备。

在现有技术进行云游戏的云视频生成时，通常使用人工制作渲染的方式，容易造成云视频制作效率低下，难以满足在云游戏中云视频加载服务的时效性，影响云游戏体验。

发明内容

本发明的目的在于提供一种云视频AI理解生成方法、装置及计算机设备，以解决现有技术中云视频制作效率低下，难以满足在云游戏中云视频加载服务的时效性，影响云游戏体验的技术问题。

为解决上述技术问题，本发明具体提供下述技术方案：

在本发明的第一个方面，本发明提供了一种云视频AI理解生成方法，包括以下步骤：

获取期望图像，所述期望图像对应于云视频生成的期望特征；

根据期望图像，进行像素块抽取，得到多个第一像素块；

根据第一像素块，通过AI理解网络，得到多个云视频帧，所述AI理解网络为神经网络；

将多个云视频帧，通过序列映射关系，得到云视频帧序列顺序，所述序列映射关系为聚类模型；

根据云视频帧序列顺序，对各个云视频帧进行序列化，得到云视频。

作为本发明的一种优选方案，所述第一像素块确定，包括：

对期望图像进行laplace变换，得到期望图像的各个低频分量，以及期望图像的各个高频分量；

在期望图像中，逐一将各个高频分量对应的像素块截取出，作为高频像素块；

在期望图像中，逐一将各个低频分量对应的像素块截取出，作为第一低频像素块；

高频像素块和第一低频像素块共同构成第一像素块。

作为本发明的一种优选方案，所述根据第一像素块，通过AI理解网络，得到多个云视频帧，包括：

第一步：在所有高频像素块中，随机抽取至少一个高频像素块，标记为第二像素块；

第二步：将所述第二像素块与所有第一低频像素块以在期望图像中的位置进行拼接，得到第三像素块；

第三步：在对抗网络GAN中输入第三像素块，由对抗网络GAN生成云视频帧；

循环执行第一步至第三步，得到多个云视频帧。

作为本发明的一种优选方案，所述云视频帧序列顺序的确定，包括：

将多个云视频帧，利用KMeans算法对多个云视频帧进行聚类划分，得到多个视频帧簇；

在每个视频帧簇中，设定云视频帧序列顺序中相邻位置的云视频帧的动量连续性最大化函数，作为帧排序期望目标函数；

所述帧排序期望目标函数的函数表达式为：；；式中，f_ij为第i个云视频帧和第j个云视频帧间的动量连续性，G_i为第i个云视频帧，G_j为第j个云视频帧，similar(G_i,G_j)为G_i和G_j间的相似度运算函数，F为视频帧簇中以云视频帧的序列顺序的所有云视频帧间的动量连续性总和，G_i和G_j为相邻位置的云视频帧，n为视频帧簇中云视频帧的总数量，max为最大化运算符，i，j为计数变量；将视频帧簇作为求解空间，对帧排序期望目标进行排序求解，得到每个视频帧簇中云视频帧的序列顺序；

依据各个视频帧簇之间的聚类距离，由小到大排列，确定各个视频帧簇之间的序列顺序；

根据各个视频帧簇之间的序列顺序，对各个视频帧簇中云视频帧的序列顺序进行拼接，得到所述云视频帧序列顺序。

作为本发明的一种优选方案，多个云视频帧在对抗网络GAN生成后，进行标准化处理。

作为本发明的一种优选方案，所述第三像素块与期望图像具有相同的图像矩阵空间。

作为本发明的一种优选方案，将序列化后的各个云视频帧，进行超分辨处理，得到云视频。

作为本发明的一种优选方案，所述各个视频帧簇之间的聚类距离对应于各个视频帧簇中聚类中心之间距离。

在本发明的第二个方面，本发明提供了一种云视频AI理解生成装置，包括：

数据获取模块，用于获取期望图像，所述期望图像对应于云视频生成的期望特征；

数据处理模块，用于根据期望图像，进行像素块抽取，得到多个第一像素块；

根据云视频帧序列顺序，对各个云视频帧进行序列化，得到云视频；

数据存储模块，用于存储AI理解网络、序列映射关系。

在本发明的第三个方面，本发明提供了一种计算机设备，

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；

其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使计算机设备执行云视频AI理解生成方法。

在本发明的第四个方面，本发明提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机执行指令，当处理器执行所述计算机执行指令时，实现云视频AI理解生成方法。

本发明与现有技术相比较具有如下有益效果：

本发明通过AI理解网络，自动快速生成符合期望的视频，提高云视频帧生成效率，而且通过序列映射关系控制云视频帧的序列顺序，能够保证生成的云视频动态性更佳，更具真实感。

附图说明

为了更清楚地说明本发明的实施方式或现有技术中的技术方案，下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍。显而易见地，下面描述中的附图仅仅是示例性的，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图引伸获得其它的实施附图。

图1为本发明实施例提供的云视频AI理解生成方法流程图；

图2为本发明实施例提供的云视频AI理解生成方法装置框图；

图3为本发明实施例提供的计算机装置的内部结构图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

如图1所示，在本发明的第一个方面，本发明提供了一种云视频AI理解生成方法，包括以下步骤：

获取期望图像，期望图像对应于云视频生成的期望特征；

根据期望图像，进行像素块抽取，得到多个第一像素块；

根据第一像素块，通过AI理解网络，得到多个云视频帧，AI理解网络为神经网络；

将多个云视频帧，通过序列映射关系，得到云视频帧序列顺序，序列映射关系为聚类模型；

本发明为了能够快速生成云游戏中的云视频，加速云游戏的视觉画面生成，提高云游戏上市速度，依据表征用户意愿的游戏画面期望特征，通过神经网络——GAN对抗网络，批量生产包含用户意愿的游戏画面期望特征的云视频帧，相较于人工制作包含用户意愿的游戏画面期望特征的云视频帧而言，效率得到了极大的提升。

本发明为了使得生成的云视频帧具有更丰富的动态性，增强后续序列化后形成的云视频的真实感，将表征用户意愿的游戏画面期望特征进行离散化，即将期望图像进行像素块离散化，形成多个像素块，再基于各个像素块（离散化的游戏画面期望特征），进行云视频帧生成，保证了各个云视频帧之间的主体相似性，同时也丰富了云视频帧之间动态细节，最终使得序列化形成的云视频画面主题连续，画面动态真实。

本发明为了实现各个云视频帧之间的主体相似性增强，同时丰富了云视频帧之间动态细节，将游戏画面期望特征离散为画面主体特征和画面细节特征，对应到第一画像中，是将第一画像离散为表征高频分量的像素块和表征低频分量的像素块，并将所有表征低频分量的像素块与随机选取的多个表征高频分量的像素块构建出生成云视频帧的基础数据，其中，运用所有表征低频分量的像素块能够保证所有生成的云视频帧主体相似，保证了云视频画面主体的相似性或同属性，即保证了云视频画面主题的连续性，逻辑性，而局部运用表征高频分量的像素块，保证了云视频画面纹理细节差异性，使得画面纹理细节变化性丰富，丰富了云视频帧之间动态细节。

本发明为了进一步保证云视频的真实性和逻辑性，构建序列映射关系，对生成的一系列视频帧进行序列化，即保持序列中相邻的视频帧之间具有最大的画面相似性，反映到用户视觉中，连续性更强，逻辑性也更强，因此，本发明利用相邻位置的云视频帧的动量连续性最大化，作为帧排序期望目标，根据帧排序期望目标求解得到的云视频序列化结果，能够保持相邻位置视频帧之间，画面相似度最高，动量连续性最强。

本发明为了使得生成的视频帧具有更丰富的动态性，增强后续序列化后形成的云视频的真实感，将表征用户意愿的游戏画面期望特征进行离散化，即将期望图像进行像素块离散化，形成多个像素块，具体如下：

第一像素块确定，包括：

高频像素块和第一低频像素块共同构成第一像素块。

本发明为了能够快速生成云游戏中的云视频，加速云游戏的视觉画面生成，提高云游戏上市速度，依据表征用户意愿的游戏画面期望特征，通过神经网络——GAN对抗网络，批量生产包含用户意愿的游戏画面期望特征的视频帧，具体如下：

根据第一像素块，通过AI理解网络，得到多个云视频帧，包括：

第二步：将第二像素块与所有第一低频像素块以在期望图像中的位置进行拼接，得到第三像素块；

循环执行第一步至第三步，得到多个云视频帧。

本发明为了进一步保证云视频的真实性和逻辑性，构建序列映射关系，对生成的一系列视频帧进行序列化，具体如下：

云视频帧序列顺序的确定，包括：

帧排序期望目标函数的函数表达式为：；；式中，f_ij为第i个云视频帧和第j个云视频帧间的动量连续性，G_i为第i个云视频帧，G_j为第j个云视频帧，similar(G_i,G_j)为G_i和G_j间的相似度运算函数，F为视频帧簇中以云视频帧的序列顺序的所有云视频帧间的动量连续性总和，G_i和G_j为相邻位置的云视频帧，n为视频帧簇中云视频帧的总数量，max为最大化运算符，i，j为计数变量；将视频帧簇作为求解空间，对帧排序期望目标进行排序求解，得到每个视频帧簇中云视频帧的序列顺序；

根据各个视频帧簇之间的序列顺序，对各个视频帧簇中云视频帧的序列顺序进行拼接，得到云视频帧序列顺序。

因此，本发明在构建云视频帧序列顺序中相邻位置的云视频帧的动量连续性最大化函数，利用相邻位置的云视频帧的画面相似性进行最大化量化，实现画面相似度越高，动量连续性越高，反映到用户视觉中，视觉连续性更强，视觉逻辑性也更强。

多个云视频帧在对抗网络GAN生成后，进行标准化处理。

第三像素块与期望图像具有相同的图像矩阵空间。

将序列化后的各个云视频帧，进行超分辨处理，得到云视频。

各个视频帧簇之间的聚类距离对应于各个视频帧簇中聚类中心之间距离。

如图2所示，在本发明的第二个方面，本发明提供了一种云视频AI理解生成装置，包括：

数据获取模块，用于获取期望图像，期望图像对应于云视频生成的期望特征；

数据存储模块，用于存储AI理解网络、序列映射关系。

数据处理模块通过AI理解网络，根据第一像素块，得到多个云视频帧，具体如下：

第一步：数据处理模块在所有高频像素块中，随机抽取至少一个高频像素块，标记为第二像素块；

第二步：数据处理模块将第二像素块与所有第一低频像素块以在期望图像中的位置进行拼接，得到第三像素块；

第三步：数据处理模块在对抗网络GAN中输入第三像素块，由对抗网络GAN生成云视频帧；

数据处理模块循环执行第一步至第三步，得到多个云视频帧。

数据处理模块根据序列映射关系确定云视频帧序列顺序，具体如下：

数据处理模块将多个云视频帧，利用KMeans算法对多个云视频帧进行聚类划分，得到多个视频帧簇；

数据处理模块在每个视频帧簇中，设定云视频帧序列顺序中相邻位置的云视频帧的动量连续性最大化函数，作为帧排序期望目标函数；

帧排序期望目标函数的函数表达式为：；；式中，f_ij为第i个云视频帧和第j个云视频帧间的动量连续性，G_i为第i个云视频帧，G_j为第j个云视频帧，similar(G_i,G_j)为G_i和G_j间的相似度运算函数，F为视频帧簇中以云视频帧的序列顺序的所有云视频帧间的动量连续性总和，G_i和G_j为相邻位置的云视频帧，n为视频帧簇中云视频帧的总数量，max为最大化运算符，i，j为计数变量；

数据处理模块将视频帧簇作为求解空间，对帧排序期望目标进行排序求解，得到每个视频帧簇中云视频帧的序列顺序；

数据处理模块依据各个视频帧簇之间的聚类距离，由小到大排列，确定各个视频帧簇之间的序列顺序；

数据处理模块根据各个视频帧簇之间的序列顺序，对各个视频帧簇中云视频帧的序列顺序进行拼接，得到云视频帧序列顺序。

如图3所示，在本发明的第三个方面，本发明提供了一种计算机设备，

至少一个处理器；以及

与至少一个处理器通信连接的存储器；

其中，存储器存储有可被至少一个处理器执行的指令，指令被至少一个处理器执行，以使计算机设备执行云视频AI理解生成方法。

在本发明的第四个方面，本发明提供了一种计算机可读存储介质，计算机可读存储介质中存储有计算机执行指令，当处理器执行计算机执行指令时，实现云视频AI理解生成方法。

以上实施例仅为本申请的示例性实施例，不用于限制本申请，本申请的保护范围由权利要求书限定。本领域技术人员可以在本申请的实质和保护范围内，对本申请做出各种修改或等同替换，这种修改或等同替换也应视为落在本申请的保护范围内。

Claims

1.一种云视频AI理解生成方法，其特征在于，包括以下步骤：

根据期望图像，进行像素块抽取，得到多个第一像素块；

所述第一像素块确定，包括：

高频像素块和第一低频像素块共同构成第一像素块；

所述根据第一像素块，通过AI理解网络，得到多个云视频帧，包括：

循环执行第一步至第三步，得到多个云视频帧。

2.根据权利要求1所述的一种云视频AI理解生成方法，其特征在于：所述云视频帧序列顺序的确定，包括：

所述帧排序期望目标函数的函数表达式为：f_ij=max[similar(G_i,G_j)]；；式中，f_ij为第i个云视频帧和第j个云视频帧间的动量连续性，G_i为第i个云视频帧，G_j为第j个云视频帧，similar(G_i,G_j)为G_i和G_j间的相似度运算函数，F为视频帧簇中以云视频帧的序列顺序的所有云视频帧间的动量连续性总和，G_i和G_j为相邻位置的云视频帧，n为视频帧簇中云视频帧的总数量，max为最大化运算符，i，j为计数变量；将视频帧簇作为求解空间，对帧排序期望目标进行排序求解，得到每个视频帧簇中云视频帧的序列顺序；

3.根据权利要求2所述的一种云视频AI理解生成方法，其特征在于：

多个云视频帧在对抗网络GAN生成后，进行标准化处理。

4.根据权利要求3所述的一种云视频AI理解生成方法，其特征在于：所述第三像素块与期望图像具有相同的图像矩阵空间。

5.根据权利要求4所述的一种云视频AI理解生成方法，其特征在于：将序列化后的各个云视频帧，进行超分辨处理，得到云视频。

6.根据权利要求5所述的一种云视频AI理解生成方法，其特征在于：所述各个视频帧簇之间的聚类距离对应于各个视频帧簇中聚类中心之间距离。

7.一种云视频AI理解生成装置，其特征在于，包括：

数据存储模块，用于存储AI理解网络、序列映射关系；

第一像素块确定，包括：

高频像素块和第一低频像素块共同构成第一像素块；

循环执行第一步至第三步，得到多个云视频帧。

8.一种计算机设备，其特征在于，

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；

其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使计算机设备执行权利要求1-6任一项所述的方法。