CN115829828A - 游戏图像重构网络的训练及重构方法、设备与存储介质 - Google Patents
游戏图像重构网络的训练及重构方法、设备与存储介质 Download PDFInfo
- Publication number
- CN115829828A CN115829828A CN202210937965.8A CN202210937965A CN115829828A CN 115829828 A CN115829828 A CN 115829828A CN 202210937965 A CN202210937965 A CN 202210937965A CN 115829828 A CN115829828 A CN 115829828A
- Authority
- CN
- China
- Prior art keywords
- game
- sample
- image data
- data
- video data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Image Analysis (AREA)
Abstract
本发明公开了一种游戏图像重构网络的训练及重构方法、设备与存储介质,该方法包括:采集记录真实世界的第一样本图像数据;确定样本游戏;采集在用户操控样本游戏时记录的、内容为样本游戏的样本视频数据;从样本视频数据中提取第二样本图像数据;以第一样本图像数据为内容的来源、第二样本图像数据为游戏风格的来源将生成对抗网络训练为游戏图像重构网络。以非成对数据的方式训练生成对抗网络,使得游戏图像重构网络可将图像数据重构至游戏风格,重构游戏风格属于后期处理,可以维持制作视频数据的门槛,维持制作视频数据的耗时,大大提高了制作游戏风格的视频数据的效率。
Description
技术领域
本发明涉及计算机视觉技术领域,尤其涉及一种游戏图像重构网络的训练及重构方法、设备与存储介质。
背景技术
在短视频、广告等场景中,用户会制作各种不同类型的视频数据,在录制原始的视频数据之后,通常会对视频数据进行后期处理,从而提升视频数据的质量。
因某些业务需求,部分后期处理是将视频数据的风格转换至某款游戏的风格,而目前常用的后期处理是对视频数据添加滤镜,将视频数据整体转换至其他风格,例如,复古、胶片、落日,等等。
但是,滤镜通常是在像素点的颜色值进行调整,并添加其他装饰使用的元素,效果较为单一,使用多个滤镜叠加也难以实现该款游戏的风格,而如果在制作视频数据时按照游戏的风格进行设计,这会大大提高制作视频数据的门槛,导致制作视频数据的耗时大大延长,制作视频数据的效率低。
发明内容
本发明提供了一种游戏图像重构网络的训练及重构方法、设备与存储介质,以解决如何高效将画面实现游戏的风格。
根据本发明的一方面,提供了一种游戏图像重构网络的训练方法,包括:
采集记录真实世界的第一样本图像数据;
确定样本游戏;
采集在用户操控所述样本游戏时记录的、内容为所述样本游戏的样本视频数据;
从所述样本视频数据中提取第二样本图像数据;
以所述第一样本图像数据为内容的来源、所述第二样本图像数据为游戏风格的来源将生成对抗网络训练为游戏图像重构网络。
根据本发明的另一方面,提供了一种图像重构方法,包括:
加载根据本发明任一实施例所述的方法训练的游戏图像重构网络;
获取待重构的原始图像数据;
将所述原始图像数据输入至所述游戏图像重构网络中重构为包含游戏风格的候选图像数据;
在所述候选图像数据中添加描边信息,得到目标图像数据。
根据本发明的另一方面,提供了一种视频重构方法,包括:
加载根据本发明任一实施例所述的方法训练的游戏图像重构网络;
获取内容为介绍目标游戏的原始视频数据,所述原始视频数据中具有多帧原始图像数据;
将所述原始图像数据输入至所述游戏图像重构网络中重构为包含游戏风格的候选图像数据;
在所述候选图像数据中添加描边信息,得到目标图像数据;
在所述原始视频数据中将所述目标图像数据替换所述原始图像数据,获得目标视频数据。
根据本发明的另一方面,提供了一种电子设备,所述电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例所述的游戏图像重构网络的训练方法或者图像重构方法或者视频重构方法。
根据本发明的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序用于使处理器执行时实现本发明任一实施例所述的游戏图像重构网络的训练方法或者图像重构方法或者视频重构方法。
在本实施例中,采集记录真实世界的第一样本图像数据;确定样本游戏;采集在用户操控样本游戏时记录的、内容为样本游戏的样本视频数据;从样本视频数据中提取第二样本图像数据;以第一样本图像数据为内容的来源、第二样本图像数据为游戏风格的来源将生成对抗网络训练为游戏图像重构网络。使用在用户操控样本游戏时记录的样本视频数据采集样本游戏的画面,提高制作样本的效率,以非成对数据的方式训练生成对抗网络,使得游戏图像重构网络可将图像数据重构至游戏风格,重构游戏风格属于后期处理,可以维持制作视频数据的门槛,维持制作视频数据的耗时,大大提高了制作游戏风格的视频数据的效率。
应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例一提供的一种游戏图像重构网络的训练方法的流程图;
图2是根据本发明实施例二提供的一种图像重构方法的流程图;
图3A至图3E是根据本发明实施例一提供的一种图像重构的示例图;
图4是根据本发明实施例三提供的一种视频重构方法的流程图;
图5是根据本发明实施例四提供的一种游戏图像重构网络的训练装置的结构示意图;
图6是根据本发明实施例五提供的一种图像重构装置的结构示意图;
图7是根据本发明实施例六提供的一种视频重构装置的结构示意图;
图8是实现本发明实施例七提供的一种电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例一
图1为本发明实施例一提供的一种游戏图像重构网络的训练方法的流程图,本实施例可适用于训练实现游戏风格的游戏图像重构网络的情况,该方法可以由游戏图像重构网络的训练装置来执行,该游戏图像重构网络的训练装置可以采用硬件和/或软件的形式实现,该游戏图像重构网络的训练装置可配置于电子设备中。如图1所示,该方法包括:
步骤101、采集记录真实世界的第一样本图像数据。
在本实施例中,可以通过授权使用、公开的数据集、自行录制等方式采集多帧图像数据,这些图像数据的内容记录真实世界,可作为训练游戏图像重构网络的样本,可记为第一样本图像数据。
其中,真实世界既可以包括真实的自然环境,也可以包括真实的建筑,还可以包括真实的人、动物,等等,本实施例对此不加以限制。
步骤102、确定样本游戏。
在本实施例中,可以根据业务的需求选定一款游戏作为训练游戏图像重构网络时风格的来源,可记为样本游戏。
其中,游戏的类型可以包括MOBA(Multiplayer Online Battle Arena,多人在线战术竞技游戏)、RPG(Role-playing game,角色扮演游戏)、SLG(Simulation Game,策略类游戏),等等,本实施例对此不加以限制。
示例性地,可选择在指定专门运行于游戏机、个人电脑等平台的RPG游戏作为样本游戏,玩家在该游戏中将扮演失去了一位少年在异世界的另外一个国度中展开冒险,并体验该少年在其中成长的过程。
一般情况下,同一款样本游戏由同一个团队开发,在美术设计上具有较为统一且典型的风格。
步骤103、采集在用户操控样本游戏时记录的、内容为样本游戏的样本视频数据。
诸如RPG等类型的样本游戏,其画面是随着剧情的推进变化的,而剧情的推进会耗费比较多的时间、精力,而为训练游戏图像重构网络需求大量、且多样化的样本,如果直接启动样本游戏并在样本游戏中采集画面作为样本,效率可能较低。
因此,本实施例中可以从通过邀约用户操控样本游戏、向版权方申请、从开放的视频平台下载等方式采集在用户操控样本游戏时记录的样本视频数据,其中,样本视频数据内容包含样本游戏,即,样本视频数据的画面为样本游戏的画面。
样本视频数据的画面相对于样本游戏的画面而言,清晰度可能存在一定程度的下降,但一般情况下,样本视频数据的画面的清晰度已满足训练游戏图像重构网络,样本视频数据的获取方式多样化,便捷获取大量的样本视频数据,而不同用户有用足够的时间去推进样本游戏的剧情,使得样本视频数据的画面也是同样化,可满足训练游戏图像重构网络的需求,并大大提高了采集样本的效率。
在实际应用中,样本视频数据的筛选并输入可由美术人员和/或技术人员负责,在美术人员和/或技术人员熟悉样本游戏的情况下,筛选的效率较高。
但考虑到样本游戏的画面较多,美术人员和/或技术人员并不一定熟悉各个样本游戏的画面,并且,作为候选的视频数据的时长较长,美术人员和/或技术人员浏览、熟悉样本游戏,筛选作为候选的视频数据的过程会消耗较长的时间,因而,可以分析样本游戏的特性,自动化采集样本视频数据,并进一步提供给美术人员和/或技术人员校验,这样子可以大大提高采集样本视频数据的效率。
在本发明的一个实施例中,步骤103可以包括如下步骤:
步骤1031、采集用户操控样本游戏时记录的候选视频数据。
在本实施例中,可以从通过邀约用户操控样本游戏、向版权方申请、从开放的视频平台下载等方式采集在用户操控样本游戏时记录的视频数据,记为候选视频数据。
在实际应用中,用户操控样本游戏的情况有所不同,使得候选视频数据中除了包含样本游戏的画面之外,还可能包含其他画面。
例如,在游戏直播、介绍游戏等场景中,候选视频数据中除了包含样本游戏的画面之外,还可能一直存在一路面向用户采集的视频数据,该路面向用户采集的视频数据可能占据画面的一个区域,也可能占据整个画面。
又例如,在介绍游戏的场景中,候选视频数据中除了包含样本游戏的画面之外,还会包含其他游戏的画面,即,候选视频数据为多款游戏的合集。
在一种采集候选视频数据的方式中,可以确定样本游戏的名称,使用该名称、表征操控的关键词(如“玩”、“了解”等)在预设的视频库中检索用户操控样本游戏时记录的视频数据,作为候选视频数据。
此外,可以查询候选视频数据的标题,对该标题进行语义分析。
若标题中具有表示合集的关键词,则可以使用命令行工具、库文件等方式将以独立的场景作为切分的节点,将候选视频数据按照场景切分为多个片段,记为视频片段,其中,每个视频片段中具有一个或多个独立的景。
进一步而言,检测场景的方式包括如下两种:
1、阈值模式
针对存在明显场景边界的候选视频数据适用阈值模式,将每帧图像数据与设置的黑电平进行比较,基于检测的结果判断是否为淡入、淡出、切成黑色等场景的边界,从而在候选视频数据中划分出各个场景。
2、内容模式
针对场景之间快速切换的候选视频数据适用内容模式,比较每帧图像数据,依次查找内容存在较大变化的图像数据作为切分的节点,从而在候选视频数据中划分出各个场景。
一般情况下,可以将包含一个独立场景的候选视频数据切分为一个视频片段,而考虑到某些包含一个独立场景的候选视频数据的时长较短,则可以将该场景与相邻的其他场景合并,从而将包含两个或两个以上相连场景的候选视频数据切分为一个视频片段,本实施例对此不加以限制。
在每个视频片段的头部或尾部检测场景切换的间隔时长,其中,场景切换表征为白色画面、黑色画面、静止画面等形态,可以通过颜色、像素差异等方式检测。
在一些游戏的介绍合集中,不同款游戏之间切换的时间通常比同一款游戏内场景变换的时间长,因而可以将各个间隔时长与预设的阈值进行比较,如果间隔时长超过(大于或等于)预设的阈值,则可以认为出现不同款游戏之间的切分点,即切分点对应的间隔时长超过预设的第一阈值。
起始和结尾均可以作为一个切分点,那么,可将位于切分点之间的视频片段合并为游戏片段,一个游戏片段中通常是介绍同一款游戏的内容。
一般情况下,在每个游戏片段的头部会显示游戏的简介信息,比如,游戏的Logo(图标)、名称,等等,那么,本实施例中可在每个游戏片段的头部执行光学字符识别(Optical Character Recognition,OCR),得到文本信息。
若文本信息中包含样本游戏的名称,表示该游戏片段用于介绍样本游戏,则在候选视频数据中保留该游戏片段。
若文本信息中未包含样本游戏的名称,表示该游戏片段并非用于介绍样本游戏,则在候选视频数据中滤除游戏片段。
在本实施例中,针对介绍游戏的合集的情况,通过切换时间的长短、头部的信息筛选出介绍样本游戏的候选视频数据,滤除其他游戏的干扰,可以减少候选视频数据的数量,降低后续筛选样本视频数据的计算量。
步骤1032、在候选视频数据中识别样本游戏中的角色所处的第一时间点、用户出现时所处的第二时间点。
在本实施例中,对候选视频数据进行抽样检测,检测在候选视频数据出现的样本游戏中的角色、用户,其中,用户一般为真实的人即可,并不要求特定身份的人。
在候选视频数据的时间轴上,分别标记样本游戏中的角色所处的第一时间点、用户所处的第二时间点。
在具体实现中,在样本游戏的资料库中查询用户在样本游戏中可操控的角色,用户在样本游戏中可操控的角色一般为样本游戏中的主角、主要配角,这些角色出现的频率较高,可以保证识别样本游戏的画面的准确率。
在资料库中记录角色的信息,例如,名称、人像数据(包含头像数据)、经历,等等。
在候选视频数据均匀抽帧,在每帧中执行人脸检测,得到人脸数据,以及将人脸数据与人像数据进行匹配。
其中,人脸检测也称为人脸关键点检测、定位或者人脸对齐,是指给定人脸数据,定位出人脸面部的关键区域位置,包括眉毛、眼睛、鼻子、嘴巴、脸部轮廓等等。
在本实施例中,人脸检测可使用如下方法:
1、利用人工提取特征,如haar特征,使用特征训练分类器,使用分类器进行人脸检测。
2、从通用的目标检测算法中继承人脸检测,例如,利用Faster R-CNN来检测人脸。
3、使用级联结构的卷积神经网络,例如,Cascade CNN(级联卷积神经网络),MTCNN(Multi-task Cascaded Convolutional Networks,多任务卷积神经网络)。
考虑到简单标记人脸数据即可满足区分角色与用户,因而人脸检测的算法的要求较低,允许存在噪音,可使用MTCNN等通用的卷积神经网络进行人脸检测。
若人脸数据与人像数据匹配成功,则标记人脸数据所处的时间点(即检测到人脸数据的帧所处的时间点)为第一时间点。
若人脸数据与人像数据匹配失败,则调用预设的人脸鉴别器识别人脸数据是否为真实人体的脸部,其中,人脸鉴别器为二分类的分类器,使用真实人体的脸部与游戏中角色的脸部进行训练,可区分人脸数据是否为真实人体的脸部。
若人脸数据为真实人体的脸部,则标记人脸数据所处的时间点(即检测到人脸数据的帧所处的时间点)为第二时间点。
步骤1033、在候选视频数据中,分别将至少部分第一时间点连接为连续的第一时间范围、将至少部分第二时间点连接为连续的第二时间范围。
一方面,可遍历候选视频数据中的各个第一时间点,针对位置相邻的两个第一时间点,可以计算该两个第一时间点之间的第一时间间隔。
如果第一时间间隔小于或等于第一间隔阈值,表示第一时间间隔较短,属于连贯的场景的概率较高,可以将该两个第一时间点相连,得到第一候选范围。
如果第一时间间隔大于第一间隔阈值,表示第一时间间隔较长,属于连贯的场景的概率较低,可以忽略该两个第一时间点。
在遍历完所有第一时间点时,为保证第一时间范围的有效性、减缓检测并识别人脸数据时的噪音的影响,可筛选出长度超过第一时长阈值的第一候选范围,作为第一时间范围。
另一方面,可遍历候选视频数据中的各个第二时间点,针对位置相邻的两个第二时间点,可以计算该两个第二时间点之间的第二时间间隔。
如果第二时间间隔小于或等于第二间隔阈值,表示第二时间间隔较短,属于连贯的场景的概率较高,可以将该两个第二时间点相连,得到第二候选范围。
如果第二时间间隔大于第二间隔阈值,表示第二时间间隔较长,属于连贯的场景的概率较低,可以忽略该两个第二时间点。
在遍历完所有第二时间点时,为保证第二时间范围的有效性、减缓检测并识别人脸数据时的噪音的影响,可筛选出长度超过第二时长阈值的第二候选范围,作为第二时间范围。
步骤1034、在第一时间范围内删除与第二时间范围相交的部分区域,获得第三时间范围。
将第一时间范围与第二时间范围进行比较,筛选出第一时间范围与第二时间范围相交(即重叠)的部分区域,在第一时间范围内删除这部分区域,剩余的部分区域记为第三时间范围。
步骤1035、提取位于第三时间范围内的候选视频数据,作为内容为样本游戏的样本视频数据。
在候选视频数据中,分别提取位于第三时间范围内的帧,得到内容为样本游戏的样本视频数据,使得样本视频数据中减少或避免采集到包含用户的画面。
包含用户的画面并不具备样本游戏的风格,使用包含用户的画面的样本训练游戏图像重构网络可能对游戏图像重构网络的性能造成一定影响,本实施例可以减少或避免采集包含用户的画面,可以提高样本的风格的统一性,从而提高游戏图像重构网络的性能。
进一步地,为保证第一时间范围的有效性、减缓检测并识别人脸数据时的噪音的影响,可分别统计第三时间范围的数量,统计所有第三时间范围的总长度。
将数量与总长度线性融合为第三时间范围的置信度,其中,置信度与总长度正相关,即,总长度越大,置信度越高,反之,总长度越小,置信度越低,置信度与数量负相关,即,数量越少,置信度越高,反之,数量越多,置信度越低。
若置信度大于或等于预设的第二阈值,表示置信度教高,则可以提取位于第三时间范围内的候选视频数据,作为内容为样本游戏的样本视频数据。
某些用户在游戏直播、介绍游戏时,大部分时间是提供游戏的画面,而少部分时间是提供自身的画面,这样子可以保证浏览游戏内容的体验,这种情况下,第三时间范围的数量较少、总长度较大,剔除用户自身的画面之后,可以得到较为纯净的游戏的画面。
某些用户在游戏直播、介绍游戏时,将自身的画面持续展示在游戏的画面上,这种情况下,第三时间范围的数量较多、总长度较小,剔除用户自身的画面较为麻烦。
步骤104、从样本视频数据中提取第二样本图像数据。
在本实施例中,可以通过随机抽帧、均匀抽帧等方式从样本视频数据中提取部分或全部图像数据,记为第二样本图像数据。
在本发明的一个实施例中,步骤104可以包括如下步骤:
步骤1041、在样本视频数据中每间隔预设的时间抽取一帧第二样本图像数据。
在本实施例中,可以预先设置间隔的时间,如10ms等,在遍历样本视频数据的过程中,每间隔该时间则可以抽取一帧图像数据,记为第二样本图像数据。
步骤1042、在第二样本图像数据中检测目标对象。
在本实施例中,可以根据业务的需求从样本游戏中挑选一个或多个元素作为目标对象。
进一步而言,目标对象可以为特定的元素,如某个角色、某款机甲等,目标对象也可以为宽泛的元素,如任一角色、任一建筑物等,本实施例对此不加以限制。
在实际应用中,目标对象的筛选并输入可由美术人员和/或技术人员负责,在美术人员和/或技术人员熟悉目标对象的情况下,筛选的效率较高。
但考虑到样本游戏的画面较多,美术人员和/或技术人员并不一定熟悉各个目标对象,并且,作为候选的视频数据的时长较长,美术人员和/或技术人员浏览、熟悉样本游戏,筛选目标对象的过程会消耗较长的时间,因而,可以使用少量的目标对象作为样本预先训练目标检测网络,如R-CNN、YOLO等,由于目标对象的检测允许存在一定的噪音,因此,少量的样本也满足使用目标检测网络检测目标对象的需求。
示例性地,目标对象包括动漫头像,此时,可加载目标检测网络,将第二样本图像数据输入目标检测网络中、检测第二样本图像数据中是否存在动漫头像。
本示例自动化检测目标对象,并进一步提供给美术人员和/或技术人员校验,这样子可以大大提高检测目标对象的效率。
步骤1043、针对检测到目标对象的第二样本图像数据,保留第二样本图像数据。
对于检测到目标对象的第二样本图像数据,有利于训练游戏图像重构网络,可以保留该第二样本图像数据,即检测到目标对象的第二样本图像数据可全部参与游戏图像重构网络的训练。
步骤1044、针对未检测到目标对象的第二样本图像数据,滤除部分第二样本图像数据。
一般情况下,未检测到目标对象的第二样本图像数据的数量较多,为平衡检测到目标对象的第二样本图像数据与未检测到目标对象的第二样本图像数据之间的比例,可以滤除部分第二样本图像数据,被滤除的部分第二样本图像数据并不参与游戏图像重构网络的训练,剩余的部分第二样本图像数据参与游戏图像重构网络的训练。
在一种滤除的示例中,若在某帧第二样本图像数据中未检测到目标对象,则将第二样本图像数据划分至预设的集合。
确定采样率,如1/2、1/3等,在集合中按照采样率随机抽取第二样本图像数据,滤除集合中未被抽取的第二样本图像数据。
步骤105、以第一样本图像数据为内容的来源、第二样本图像数据为游戏风格的来源将生成对抗网络训练为游戏图像重构网络。
在本实施例中,可以预先构建生成对抗网络(Generative Adversarial Network,GAN)。
一般情况下,生成对抗网络包括生成器和判别器。其中,生成器负责依据随机向量产生内容,在本实施例中,该内容为图像数据,尤其为具有游戏风格的图像数据;判别器负责判别接收的内容是否是真实的,判别器通常会给出一个概率,代表内容的真实度。
生成器和判别器可以使用不同的结构,对于处理图像数据的功能,这些结构不局限于人工设计的神经网络,如卷积层、全连接层等,也可以通过模型量化方法优化的神经网络,通过NAS(Neural Architecture Search,神经网络结构搜索)方法针对游戏风格的特性搜索的神经网络,等等,本实施例对此不加以限制。
针对不同结构的生成器和判别器,可以将生成对抗网络划分为如下类型:
DCGAN(深度卷积生成对抗网络)、CGAN(条件生成对抗网络)、CycleGAN(周期生成对抗网络)、CoGAN(耦合生成对抗网络)、ProGAN(生成对抗网络的渐进式增长)、WGAN(Wasserstein生成对抗网络)、SAGAN(自注意力生成对抗网络)、BigGAN(大生成对抗性网络)、StyleGAN(基于风格的生成对抗网络)。
生成器和判别器存在对抗,所谓对抗,可以指在生成对抗网络交替训练的过程,以生成具有游戏风格的图像数据为例,让生成器生成一些假的图像数据和真的图像数据,一起交给判别器判别,让它学习区分两者,给真的图像数据(即具有游戏风格的图像数据)评高分,给假的图像数据(即不具有游戏风格的图像数据)评低分,当判别器能够熟练判断现有的图像数据后,让生成器以从判别器处获得高分为目标,不断生成更好的假的图像数据,直到能骗过判别器,重复这一过程,直到判别器对任何图像数据的预测概率都接近0.5,也就是无法判别图像数据的真假,即可停止训练了。
在本实施例中,用于记录真实世界的第一样本图像数据、具备游戏风格的第二样本图像脸数据为训练生成对抗网络的样本,第一样本图像数据为内容的来源、第二样本图像数据为游戏风格的来源,以此训练生成对抗网络,将完成训练的生成对抗网络记为游戏图像重构网络,使得游戏图像重构网络可用于重构包含游戏风格的图像数据。
进一步而言,训练生成对抗网络的样本可选为成对数据(paired data),这样子可提升生成对抗网络的性能,但这要求收集第二样本图像数据对应的真实世界的图像数据,但实际上大部分第二样本图像数据并不存在对应的真实世界的图像数据,因此,本实施例中的生成对抗网络支持利用非成对数据(unpaired data)训练,例如,CycleGAN、StyleGAN,等等。
以Learning to Cartoonize Using White-box Cartoon Representations(学习使用白盒卡通表示法进行卡通化网络)为例,该网络包含三个模块,可将原图和风格图分为三个表征:
1、surface(表面)表征
提取表面表征来表示图像数据的光滑表面。给定图像数据,可提取加权低频分量,其中颜色成分和表面纹理被保留,边缘、纹理和细节被忽略,可用于实现平滑表面的灵活和可学习的特征表示。
2、structure(结构)表征
结构表征可有效抓住赛璐珞卡通风格中的全局结构信息和稀疏色块从输入的图像数据中提取分割区域,对每个分割区域应用自适应着色算法以生成结构表征。结构表征可模仿赛璐珞卡通风格,其特点是边界清晰,色块稀疏。
3、texture(纹理)表征
纹理表征包含绘制的细节和边缘。输入的图像数据被转换为单通道强度图,其中去除了颜色和亮度,并保留了相对像素强度。纹理表征可引导网络独立学习高频纹理细节,排除颜色和亮度模式。
通过平衡表面表征、结构表征、纹理表征的权重来控制图像数据输出的风格。
在本实施例中,采集记录真实世界的第一样本图像数据;确定样本游戏;采集在用户操控样本游戏时记录的、内容为样本游戏的样本视频数据;从样本视频数据中提取第二样本图像数据;以第一样本图像数据为内容的来源、第二样本图像数据为游戏风格的来源将生成对抗网络训练为游戏图像重构网络。使用在用户操控样本游戏时记录的样本视频数据采集样本游戏的画面,提高制作样本的效率,以非成对数据的方式训练生成对抗网络,使得游戏图像重构网络可将图像数据重构至游戏风格,重构游戏风格属于后期处理,可以维持制作视频数据的门槛,维持制作视频数据的耗时,大大提高了制作游戏风格的视频数据的效率。
实施例二
图2为本发明实施例二提供的一种图像重构方法的流程图,本实施例可适用于基于游戏图像重构网络将图像数据重构至游戏风格的情况,该方法可以由图像重构装置来执行,该图像重构装置可以采用硬件和/或软件的形式实现,该图像重构装置可配置于电子设备中。如图2所示,该方法包括:
步骤201、加载游戏图像重构网络。
在具体实现中,可以预先根据本发明实施例一所述的方法训练游戏图像重构网络,其中,游戏图像重构网络可用于重构包含游戏风格的图像数据。
在应用游戏图像重构网络时,将游戏图像重构网络及其参数加载至内存进行运行。
步骤202、获取待重构的原始图像数据。
一般情况下,游戏图像重构网络的结构较为庞大,占用的资源较多,通常部署在服务端,服务端可将游戏图像重构网络封装成接口、插件等方式,面向局域网或公网的用户提供重构游戏风格的服务,用户可以通过客户端或浏览器以调用该接口、插件等方式将待重构游戏风格的图像数据传输至服务端,为便于区分,待重构游戏风格的图像数据记为原始图像数据。
当然,如果诸如个人电脑、笔记本电脑等电子设备本地的资源较多,可满足游戏图像重构网络的运行,则可以在电子设备本地加载并运行游戏图像重构网络,此时,可以通过命令行等方式输入待重构游戏风格的原始图像数据,本实施例对此不加以限制。
其中,游戏风格可以指样本游戏在整体上体现的风格。
步骤203、将原始图像数据输入至游戏图像重构网络中重构为包含游戏风格的候选图像数据。
在本实施例中,将原始图像数据输入至游戏图像重构网络中,游戏图像重构网络按照其结构对原始图像数据进行处理,在保持原始图像数据的内容的情况下,将原始图像数据重构为包含游戏风格的新图像数据,记为候选图像数据。
步骤204、在候选图像数据中添加描边信息,得到目标图像数据。
在本实施例中,可以对候选图像数据进行图像处理,在候选图像数据的基础上添加描边信息,得到目标图像数据,描边信息是指各元素的边缘上添加线条,对具备游戏风格的各元素起到强化边缘的作用。
在具体实现中,可以使用RVM(相关向量机)在原始图像数据中对人像抠图,从而提取包含人像信息的人像图像数据,作为掩膜mask。
使用Anime2sketch等算法将原始图像数据转换为素描风格的素描图像数据。
将人像图像数据(矩阵)与素描图像数据(矩阵)相乘,得到人像素描草图,人像素描草图属于描边信息,此时,可将人像素描草图叠加至候选图像数据,得到目标图像数据。
在一个示例中,将如图3A所示的原始图像数据输入至游戏图像重构网络中,重构得到如图3B所示的候选图像数据,如图3B所示的候选图像数据相比于如图3A所示的原始图像数据,人物形象、地砖等风格显著改变,更加倾向样本游戏,凸显出素描(尤其为描边)的风格,在如图3A所示的原始图像数据中提取如图3C所示的人像图像数据,并与由如图3A所示的原始图像数据转换的素描图像数据相乘,得到如图3D所示的人像素描草图,在如图3B所示的候选图像数据的基础上叠加如图3D所示的人像素描草图,得到如图3E所示的目标图像数据。
在本实施例中,加载游戏图像重构网络;获取待重构的原始图像数据;将原始图像数据输入至游戏图像重构网络中重构为包含游戏风格的候选图像数据;在候选图像数据中添加描边信息,得到目标图像数据。在训练游戏图像重构网络时,使用在用户操控样本游戏时记录的样本视频数据采集样本游戏的画面,提高制作样本的效率,以非成对数据的方式训练生成对抗网络,使得游戏图像重构网络可将图像数据重构至游戏风格,重构游戏风格属于后期处理,可以维持制作视频数据的门槛,维持制作视频数据的耗时,大大提高了制作游戏风格的视频数据的效率。
实施例三
图4为本发明实施例三提供的一种视频重构方法的流程图,本实施例可适用于基于游戏图像重构网络将视频数据重构至游戏风格的情况,该方法可以由视频重构装置来执行,该视频重构装置可以采用硬件和/或软件的形式实现,该视频重构装置可配置于电子设备中。如图4所示,该方法包括:
步骤401、加载游戏图像重构网络。
在具体实现中,可以预先根据本发明实施例一所述的方法训练游戏图像重构网络,其中,游戏图像重构网络可用于重构包含游戏风格的图像数据。
在应用游戏图像重构网络时,将游戏图像重构网络及其参数加载至内存进行运行。
步骤402、获取内容为介绍目标游戏的原始视频数据。
在本实施例中,美术人员可以针对待推广目标的游戏制作视频数据,即该视频数据的内容用于介绍该游戏,为便于区分,该游戏记为目标游戏,该视频数据记为原始视频数据。
其中,目标游戏的类型可以包括MOBA、RPG、SLG,等等,本实施例对此不加以限制。
在具体实现中,原始视频数据的内容可以划分为游戏的内容、真实的剧情两种主要的形式,其中剧情可以进一步划分为如下类别:
1、伪美食分享
原始视频数据包含一些美食类的素材,可以吸引起用户的注意,其次植入赚钱吃美食的玩法,与此同时还给用户们提供了一个明确的玩游戏的目标。
2、贴近用户生活题材
原始视频数据贴近用户现在的生活状态,将游戏的卖点植入到生活的方方面面,购买目标游戏的道具、吃饭、买零食等方式使用游戏赚钱付款。这类素材的制作也较为简单,场景单一且拍摄难度低,素材前半段主要以2人对话为主,后半段为游戏的植入片段。
3、情景剧
原始视频数据包含情景剧的素材,部分情况为明星穿着游戏中的服饰代言,某些剧情较为夸张,用以吸引起用户的注意。
一般情况下,游戏图像重构网络的结构较为庞大,占用的资源较多,通常部署在服务端,服务端可将游戏图像重构网络封装成接口、插件等方式,面向局域网或公网的用户提供重构游戏风格的服务,用户可以通过客户端或浏览器以调用该接口、插件等方式将待重构游戏风格的原始视频数据传输至服务端。
当然,如果诸如个人电脑、笔记本电脑等电子设备本地的资源较多,可满足游戏图像重构网络的运行,则可以在电子设备本地加载并运行游戏图像重构网络,此时,可以通过命令行等方式输入待重构游戏风格的原始视频数据,本实施例对此不加以限制。
其中,游戏风格可以指样本游戏在整体上体现的风格。
步骤403、将原始图像数据输入至游戏图像重构网络中重构为包含游戏风格的候选图像数据。
在具体实现中,原始视频数据中具有多帧图像数据,记为原始图像数据,对于原始视频数据,可将每帧原始图像数据输入至游戏图像重构网络中,游戏图像重构网络按照其结构对原始图像数据进行处理,在保持原始图像数据的内容的情况下,将原始图像数据重构为包含游戏风格的新图像数据,记为候选图像数据。
步骤404、在候选图像数据中添加描边信息,得到目标图像数据。
在本实施例中,可以对候选图像数据进行图像处理,在候选图像数据的基础上添加描边信息,得到目标图像数据,描边信息是指各元素的边缘上添加线条,对具备游戏风格的各元素起到强化边缘的作用。
在具体实现中,可以使用RVM(相关向量机)在原始图像数据中对人像抠图,从而提取包含人像信息的人像图像数据,作为掩膜mask。
使用Anime2sketch等算法将原始图像数据转换为素描风格的素描图像数据。
将人像图像数据(矩阵)与素描图像数据(矩阵)相乘,得到人像素描草图,人像素描草图属于描边信息,此时,可将人像素描草图叠加至候选图像数据,得到目标图像数据。
步骤405、在原始视频数据中将目标图像数据替换原始图像数据,获得目标视频数据。
在原始视频数据中,可以将目标图像数据替换相应的原始图像数据,获得目标视频数据。
此后,可以在目标视频数据中添加与目标游戏相关的广告元素数据,获得广告视频数据,其中,广告元素数据包括用于分发目标游戏的平台的LOGO(图标)、Banner(横幅广告)、EC(结束片段,一般包含目标游戏的信息(如名称、分发目标游戏的平台等)),等等。
在指定的渠道(如新闻资讯、短视频、小说阅读、运动健康等)发布广告视频数据,以在客户端访问渠道时,将广告视频数据推送至客户端进行播放,用户在对目标游戏感兴趣时,从分发游戏的平台中下载目标游戏。
在本实施例中,加载游戏图像重构网络;获取内容为介绍目标游戏的原始视频数据,原始视频数据中具有多帧原始图像数据;将原始图像数据输入至游戏图像重构网络中重构为包含游戏风格的候选图像数据;在候选图像数据中添加描边信息,得到目标图像数据;在原始视频数据中将目标图像数据替换原始图像数据,获得目标视频数据。在训练游戏图像重构网络时,使用在用户操控样本游戏时记录的样本视频数据采集样本游戏的画面,提高制作样本的效率,以非成对数据的方式训练生成对抗网络,使得游戏图像重构网络可将图像数据重构至游戏风格,重构游戏风格属于后期处理,可以维持制作视频数据的门槛,维持制作视频数据的耗时,大大提高了制作游戏风格的视频数据的效率。
实施例四
图5为本发明实施例四提供的一种游戏图像重构网络的训练装置的结构示意图。如图5所示,该装置包括:
内容样本采集模块501,用于采集记录真实世界的第一样本图像数据;
样本游戏确定模块502,用于确定样本游戏;
视频数据采集模块503,用于采集在用户操控所述样本游戏时记录的、内容为所述样本游戏的样本视频数据;
风格样本提取模块504,用于从所述样本视频数据中提取第二样本图像数据;
生成对抗网络训练模块505,用于以所述第一样本图像数据为内容的来源、所述第二样本图像数据为游戏风格的来源将生成对抗网络训练为游戏图像重构网络。
在本发明的一个实施例中,所述视频数据采集模块503还用于:
采集用户操控所述样本游戏时记录的候选视频数据;
在所述候选视频数据中识别所述样本游戏中的角色所处的第一时间点、所述用户出现时所处的第二时间点;
在所述候选视频数据中,分别将至少部分所述第一时间点连接为连续的第一时间范围、将至少部分所述第二时间点连接为连续的第二时间范围;
在所述第一时间范围内删除与所述第二时间范围相交的部分区域,获得第三时间范围;
提取位于所述第三时间范围内的所述候选视频数据,作为内容为所述样本游戏的样本视频数据。
在本发明的一个实施例中,所述视频数据采集模块503还用于:
确定所述样本游戏的名称;
使用所述名称、表征操控的关键词在预设的视频库中检索用户操控所述样本游戏时记录的候选视频数据。
在本发明的一个实施例中,所述视频数据采集模块503还用于:
查询所述候选视频数据的标题;
若所述标题中具有表示合集的关键词,则将所述候选视频数据按照场景切分为多个视频片段;
在每个所述视频片段的头部或尾部检测场景切换的间隔时长;
将位于切分点之间的所述视频片段合并为游戏片段,所述切分点对应的所述间隔时长超过预设的第一阈值;
在每个所述游戏片段的头部执行光学字符识别,得到文本信息;
若所述文本信息中包含所述样本游戏的名称,则在所述候选视频数据中保留所述游戏片段;
若所述文本信息中未包含所述样本游戏的名称,则在所述候选视频数据中滤除所述游戏片段。
在本发明的一个实施例中,所述视频数据采集模块503还用于:
在所述样本游戏的资料库中查询所述用户在所述样本游戏中可操控的角色,所述角色具有人像数据;
在所述候选视频数据中执行人脸检测,得到人脸数据;
若所述人脸数据与所述人像数据匹配成功,则标记所述人脸数据所处的时间点为第一时间点;
若所述人脸数据与所述人像数据匹配失败,则调用预设的人脸鉴别器识别所述人脸数据是否为真实人体的脸部;
若所述人脸数据为真实人体的脸部,则标记所述人脸数据所处的时间点为第二时间点。
在本发明的一个实施例中,所述视频数据采集模块503还用于:
统计所述第三时间范围的数量;
统计所有所述第三时间范围的总长度;
将所述数量与所述总长度线性融合为所述第三时间范围的置信度,其中,所述置信度与所述总长度正相关,所述置信度与所述数量负相关;
若所述置信度大于或等于预设的第二阈值,则提取位于所述第三时间范围内的所述候选视频数据,作为内容为所述样本游戏的样本视频数据。
在本发明的一个实施例中,所述风格样本提取模块504还用于:
在所述样本视频数据中每间隔预设的时间抽取一帧第二样本图像数据;
在所述第二样本图像数据中检测目标对象;
针对检测到所述目标对象的所述第二样本图像数据,保留所述第二样本图像数据;
针对未检测到所述目标对象的所述第二样本图像数据,滤除部分所述第二样本图像数据。
在本发明的一个实施例中,所述目标对象包括动漫头像;所述风格样本提取模块504还用于:
加载目标检测网络;
将所述第二样本图像数据输入所述目标检测网络中、检测所述第二样本图像数据中是否存在动漫头像。
在本发明的一个实施例中,所述风格样本提取模块504还用于:
若在某帧所述第二样本图像数据中未检测到所述目标对象,则将所述第二样本图像数据划分至预设的集合;
确定采样率;
在所述集合中按照所述采样率随机抽取所述第二样本图像数据;
滤除所述集合中未被抽取的所述第二样本图像数据。
本发明实施例所提供的游戏图像重构网络的训练装置可执行本发明任意实施例所提供的游戏图像重构网络的训练方法,具备执行游戏图像重构网络的训练方法相应的功能模块和有益效果。
实施例五
图6为本发明实施例五提供的一种图像重构装置的结构示意图。如图6所示,该装置包括:
重构网络加载模块601,用于加载根据本发明任一实施例所述的方法训练的游戏图像重构网络;
原始图像数据获取模块602,用于获取待重构的原始图像数据;
候选图像数据生成模块603,用于将所述原始图像数据输入至所述游戏图像重构网络中重构为包含游戏风格的候选图像数据;
目标图像数据生成模块604,用于在所述候选图像数据中添加描边信息,得到目标图像数据。
在本发明的一个实施例中,所述目标图像数据生成模块604还用于:
在所述原始图像数据中提取包含人像信息的人像图像数据;
将所述原始图像数据转换为素描风格的素描图像数据;
将所述人像图像数据与所述素描图像数据相乘,得到人像素描草图;
将所述人像素描草图叠加至所述候选图像数据,得到目标图像数据。
本发明实施例所提供的图像重构装置可执行本发明任意实施例所提供的图像重构方法,具备执行图像重构方法相应的功能模块和有益效果。
实施例六
图7为本发明实施例六提供的一种视频重构装置的结构示意图。如图7所示,该装置包括:
重构网络加载模块701,用于加载根据本发明任一实施例所述的方法训练的游戏图像重构网络;
视频数据获取模块702,用于获取内容为介绍目标游戏的原始视频数据,所述原始视频数据中具有多帧原始图像数据;
候选图像数据生成模块703,用于将所述原始图像数据输入至所述游戏图像重构网络中重构为包含游戏风格的候选图像数据;
目标图像数据生成模块704,用于在所述候选图像数据中添加描边信息,得到目标图像数据;
目标视频数据生成模块705,用于在所述原始视频数据中将所述目标图像数据替换所述原始图像数据,获得目标视频数据。
在本发明的一个实施例中,还包括:
广告视频数据生成模块,用于在所述目标视频数据中添加与所述目标游戏相关的广告元素数据,作为广告视频数据;
广告视频数据发布模块,用于在指定的渠道发布所述广告视频数据,以在客户端访问所述渠道时,将所述广告视频数据推送至所述客户端进行播放。
本发明实施例所提供的视频重构装置可执行本发明任意实施例所提供的视频重构方法,具备执行视频重构方法相应的功能模块和有益效果。
实施例七
图8示出了可以用来实施本发明的实施例的电子设备10的结构示意图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本发明的实现。
如图8所示,电子设备10包括至少一个处理器11,以及与至少一个处理器11通信连接的存储器,如只读存储器(ROM)12、随机访问存储器(RAM)13等,其中,存储器存储有可被至少一个处理器执行的计算机程序,处理器11可以根据存储在只读存储器(ROM)12中的计算机程序或者从存储单元18加载到随机访问存储器(RAM)13中的计算机程序,来执行各种适当的动作和处理。在RAM 13中,还可存储电子设备10操作所需的各种程序和数据。处理器11、ROM 12以及RAM 13通过总线14彼此相连。输入/输出(I/O)接口15也连接至总线14。
电子设备10中的多个部件连接至I/O接口15,包括:输入单元16,例如键盘、鼠标等;输出单元17,例如各种类型的显示器、扬声器等;存储单元18,例如磁盘、光盘等;以及通信单元19,例如网卡、调制解调器、无线通信收发机等。通信单元19允许电子设备10通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
处理器11可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器11的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。处理器11执行上文所描述的各个方法和处理,例如游戏图像重构网络的训练方法或者图像重构方法或者视频重构方法。
在一些实施例中,游戏图像重构网络的训练方法或者图像重构方法或者视频重构方法可被实现为计算机程序,其被有形地包含于计算机可读存储介质,例如存储单元18。在一些实施例中,计算机程序的部分或者全部可以经由ROM 12和/或通信单元19而被载入和/或安装到电子设备10上。当计算机程序加载到RAM 13并由处理器11执行时,可以执行上文描述的游戏图像重构网络的训练方法或者图像重构方法或者视频重构方法的一个或多个步骤。备选地,在其他实施例中,处理器11可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行游戏图像重构网络的训练方法或者图像重构方法或者视频重构方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本发明的方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本发明的上下文中,计算机可读存储介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。备选地,计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在电子设备上实施此处描述的系统和技术,该电子设备具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、区块链网络和互联网。
计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务中,存在的管理难度大,业务扩展性弱的缺陷。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发明中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本发明的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。
Claims (15)
1.一种游戏图像重构网络的训练方法,其特征在于,包括:
采集记录真实世界的第一样本图像数据;
确定样本游戏;
采集在用户操控所述样本游戏时记录的、内容为所述样本游戏的样本视频数据;
从所述样本视频数据中提取第二样本图像数据;
以所述第一样本图像数据为内容的来源、所述第二样本图像数据为游戏风格的来源将生成对抗网络训练为游戏图像重构网络。
2.根据权利要求1所述的方法,其特征在于,所述采集在用户操控所述样本游戏时记录的、内容为所述样本游戏的样本视频数据,包括:
采集用户操控所述样本游戏时记录的候选视频数据;
在所述候选视频数据中识别所述样本游戏中的角色所处的第一时间点、所述用户出现时所处的第二时间点;
在所述候选视频数据中,分别将至少部分所述第一时间点连接为连续的第一时间范围、将至少部分所述第二时间点连接为连续的第二时间范围;
在所述第一时间范围内删除与所述第二时间范围相交的部分区域,获得第三时间范围;
提取位于所述第三时间范围内的所述候选视频数据,作为内容为所述样本游戏的样本视频数据。
3.根据权利要求2所述的方法,其特征在于,所述采集用户操控所述样本游戏时记录的候选视频数据,包括:
确定所述样本游戏的名称;
使用所述名称、表征操控的关键词在预设的视频库中检索用户操控所述样本游戏时记录的候选视频数据。
4.根据权利要求3所述的方法,其特征在于,所述采集用户操控所述样本游戏时记录的候选视频数据,还包括:
查询所述候选视频数据的标题;
若所述标题中具有表示合集的关键词,则将所述候选视频数据按照场景切分为多个视频片段;
在每个所述视频片段的头部或尾部检测场景切换的间隔时长;
将位于切分点之间的所述视频片段合并为游戏片段,所述切分点对应的所述间隔时长超过预设的第一阈值;
在每个所述游戏片段的头部执行光学字符识别,得到文本信息;
若所述文本信息中包含所述样本游戏的名称,则在所述候选视频数据中保留所述游戏片段;
若所述文本信息中未包含所述样本游戏的名称,则在所述候选视频数据中滤除所述游戏片段。
5.根据权利要求2所述的方法,其特征在于,所述在所述候选视频数据中识别所述样本游戏中的角色所处的第一时间点、所述用户出现时所处的第二时间点,包括:
在所述样本游戏的资料库中查询所述用户在所述样本游戏中可操控的角色,所述角色具有人像数据;
在所述候选视频数据中执行人脸检测,得到人脸数据;
若所述人脸数据与所述人像数据匹配成功,则标记所述人脸数据所处的时间点为第一时间点;
若所述人脸数据与所述人像数据匹配失败,则调用预设的人脸鉴别器识别所述人脸数据是否为真实人体的脸部;
若所述人脸数据为真实人体的脸部,则标记所述人脸数据所处的时间点为第二时间点。
6.根据权利要求2所述的方法,其特征在于,所述提取位于所述第三时间范围内的所述候选视频数据,作为内容为所述样本游戏的样本视频数据,包括:
统计所述第三时间范围的数量;
统计所有所述第三时间范围的总长度;
将所述数量与所述总长度线性融合为所述第三时间范围的置信度,其中,所述置信度与所述总长度正相关,所述置信度与所述数量负相关;
若所述置信度大于或等于预设的第二阈值,则提取位于所述第三时间范围内的所述候选视频数据,作为内容为所述样本游戏的样本视频数据。
7.根据权利要求1-6中任一项所述的方法,其特征在于,所述从所述样本视频数据中提取第二样本图像数据,包括:
在所述样本视频数据中每间隔预设的时间抽取一帧第二样本图像数据;
在所述第二样本图像数据中检测目标对象;
针对检测到所述目标对象的所述第二样本图像数据,保留所述第二样本图像数据;
针对未检测到所述目标对象的所述第二样本图像数据,滤除部分所述第二样本图像数据。
8.根据权利要求7所述的方法,其特征在于,所述目标对象包括动漫头像;所述在所述第二样本图像数据中检测目标对象,包括:
加载目标检测网络;
将所述第二样本图像数据输入所述目标检测网络中、检测所述第二样本图像数据中是否存在动漫头像。
9.根据权利要求7所述的方法,其特征在于,所述针对未检测到所述目标对象的所述第二样本图像数据,滤除部分所述第二样本图像数据,包括:
若在某帧所述第二样本图像数据中未检测到所述目标对象,则将所述第二样本图像数据划分至预设的集合;
确定采样率;
在所述集合中按照所述采样率随机抽取所述第二样本图像数据;
滤除所述集合中未被抽取的所述第二样本图像数据。
10.一种图像重构方法,其特征在于,包括:
加载根据权利要求1-9任一项所述的方法训练的游戏图像重构网络;
获取待重构的原始图像数据;
将所述原始图像数据输入至所述游戏图像重构网络中重构为包含游戏风格的候选图像数据;
在所述候选图像数据中添加描边信息,得到目标图像数据。
11.根据权利要求10所述的方法,其特征在于,所述在所述候选图像数据中添加描边信息,得到目标图像数据,包括:
在所述原始图像数据中提取包含人像信息的人像图像数据;
将所述原始图像数据转换为素描风格的素描图像数据;
将所述人像图像数据与所述素描图像数据相乘,得到人像素描草图;
将所述人像素描草图叠加至所述候选图像数据,得到目标图像数据。
12.一种视频重构方法,其特征在于,包括:
加载根据权利要求1-9任一项所述的方法训练的游戏图像重构网络;
获取内容为介绍目标游戏的原始视频数据,所述原始视频数据中具有多帧原始图像数据;
将所述原始图像数据输入至所述游戏图像重构网络中重构为包含游戏风格的候选图像数据;
在所述候选图像数据中添加描边信息,得到目标图像数据;
在所述原始视频数据中将所述目标图像数据替换所述原始图像数据,获得目标视频数据。
13.根据权利要求12所述的方法,其特征在于,还包括:
在所述目标视频数据中添加与所述目标游戏相关的广告元素数据,作为广告视频数据;
在指定的渠道发布所述广告视频数据,以在客户端访问所述渠道时,将所述广告视频数据推送至所述客户端进行播放。
14.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-9中任一项所述的游戏图像重构网络的训练方法或者权利要求10-11中任一项所述的图像重构方法或者权利要求12-13中任一项所述的视频重构方法。
15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序用于使处理器执行时实现权利要求1-9中任一项所述的游戏图像重构网络的训练方法或者权利要求10-11中任一项所述的图像重构方法或者权利要求12-13中任一项所述的视频重构方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210937965.8A CN115829828A (zh) | 2022-08-05 | 2022-08-05 | 游戏图像重构网络的训练及重构方法、设备与存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210937965.8A CN115829828A (zh) | 2022-08-05 | 2022-08-05 | 游戏图像重构网络的训练及重构方法、设备与存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115829828A true CN115829828A (zh) | 2023-03-21 |
Family
ID=85523038
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210937965.8A Pending CN115829828A (zh) | 2022-08-05 | 2022-08-05 | 游戏图像重构网络的训练及重构方法、设备与存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115829828A (zh) |
-
2022
- 2022-08-05 CN CN202210937965.8A patent/CN115829828A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110784759B (zh) | 弹幕信息处理方法、装置、电子设备及存储介质 | |
US11887253B2 (en) | Terrain generation and population system | |
CN110347872B (zh) | 视频封面图像提取方法及装置、存储介质及电子设备 | |
CN109145784A (zh) | 用于处理视频的方法和装置 | |
CN111491173A (zh) | 一种直播封面确定方法、装置、计算机设备及存储介质 | |
CN111738243A (zh) | 人脸图像的选择方法、装置、设备及存储介质 | |
CN106663196A (zh) | 视频中的计算机显著人物识别 | |
Hao et al. | ViCo: Plug-and-play Visual Condition for Personalized Text-to-image Generation | |
CN111429341B (zh) | 一种视频处理方法、设备及计算机可读存储介质 | |
CN115100334B (zh) | 一种图像描边、图像动漫化方法、设备及存储介质 | |
CN115222858A (zh) | 动画重构网络的训练及其图像重构、视频重构方法与设备 | |
CN109408672A (zh) | 一种文章生成方法、装置、服务器及存储介质 | |
CN107801061A (zh) | 广告数据匹配方法、装置及系统 | |
CN111586466A (zh) | 一种视频数据处理方法、装置及存储介质 | |
CN110198482A (zh) | 一种视频重点桥段标注方法、终端及存储介质 | |
Saini et al. | Chop & learn: Recognizing and generating object-state compositions | |
CN114187558A (zh) | 一种视频场景识别方法、装置、计算机设备及存储介质 | |
Jacob et al. | A non-intrusive approach for 2d platform game design analysis based on provenance data extracted from game streaming | |
CN115272057A (zh) | 卡通素描图像重构网络的训练及其重构方法与设备 | |
CN115294162B (zh) | 目标识别方法、装置、设备及存储介质 | |
CN115170390B (zh) | 一种文件风格化方法、装置、设备及存储介质 | |
CN115460455B (zh) | 一种视频剪辑方法、装置、设备及存储介质 | |
CN115829828A (zh) | 游戏图像重构网络的训练及重构方法、设备与存储介质 | |
Bhattacharyya et al. | Diffusion deepfake | |
Gao et al. | Research and implementation of image recognition of tea based on deep learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |