CN114359056A - 对象处理方法、装置及电子设备 - Google Patents
对象处理方法、装置及电子设备 Download PDFInfo
- Publication number
- CN114359056A CN114359056A CN202011042783.1A CN202011042783A CN114359056A CN 114359056 A CN114359056 A CN 114359056A CN 202011042783 A CN202011042783 A CN 202011042783A CN 114359056 A CN114359056 A CN 114359056A
- Authority
- CN
- China
- Prior art keywords
- information
- object block
- processing
- original
- block
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
本申请公开了一种对象处理方法,该方法包括:获取待处理的原始对象的特征信息;根据所述特征信息和所述原始对象,获得对象块处理信息集合,其中,所述对象块处理信息集合包括至少一个数据对,任一数据对包括至少一个对象块以及对所述至少一个对象块进行增强处理时的配置信息;根据所述对象块处理信息集合,获得目标对象,其中,所述目标对象是对原始对象进行增强处理后获得的对象。该方法可以灵活、高效的对原始对象进行增强处理。
Description
技术领域
本公开涉及计算机技术领域,更具体地,涉及一种对象处理方法、装置及电子设备。
背景技术
随着计算机技术,尤其是人工智能技术的不断发展,通过人工智能技术对网络视听内容,例如,图像、视频等原始对象进行图像增强、修复、智能剪辑等处理,可以使得网络视听内容制作的效率明显提升。
目前,在对图像、视频等原始对象进行增强处理,例如,超分辨率重建处理时,常用的方法一般是由用户配置统一的增强倍数,并将原始对象输入到同一个增强模型中,以获得增强后的图像。
现有方法通常将待进行增强处理的原始对象视为一个整体,采用单一的增强倍数以及单一的增强模型对原始对象进行增强处理,存在灵活性低、以及处理效率较低的问题。
发明内容
本公开实施例的一个目的是提供一种用于对象处理的新技术方案。
本公开的第一方面,提供了一种对象处理方法,该方法包括:
获取待处理的原始对象的特征信息;
根据所述特征信息和所述原始对象,获得对象块处理信息集合,其中,所述对象块处理信息集合包括至少一个数据对,任一数据对包括至少一个对象块以及对所述至少一个对象块进行增强处理时的配置信息;
根据所述对象块处理信息集合,获得目标对象,其中,所述目标对象是对原始对象进行增强处理后获得的对象。
可选地,所述根据所述特征信息和所述待处理对象,获得对象块处理信息集合,包括:
拆分所述原始对象,获得与所述原始对象对应的对象块集合;
根据所述特征信息,确定所述对象块集合中对象块对应的配置信息,以获得所述对象块处理信息集合。
可选地,所述根据所述特征信息,确定所述对象块集合中对象块对应的配置信息,以获得所述对象块处理信息集合,包括:
获取第一对象块,其中,所述第一对象块为所述对象块集合中的任一对象块;
获取与所述第一对象块对应的第一特征信息;
根据所述第一特征信息,获得与所述第一对象块对应的第一配置信息;
根据所述第一对象块和所述第一配置信息,获得所述对象块处理信息集合。
可选地,所述根据所述第一特征信息,获得与所述第一对象块对应的第一配置信息,包括:
根据所述第一特征信息,获得第一决策信息;
根据所述第一决策信息,获得第一模型标识信息和第一增强倍数信息,其中,所述第一模型标识信息用于标识第一增强模型,所述第一增强模型用于对所述第一对象块进行增强处理;
根据所述第一模型标识信息和所述第一增强倍数信息,获得所述第一配置信息。
可选地,所述第一决策信息包括以下至少一种:
所述第一对象块对应的第一注意力权重,其中,所述第一注意力权重用于表征用户对所述第一对象块中内容的关注程度;
所述第一对象块的第一纹理特征信息;
表征所述第一对象块中内容的第一内容信息,其中,所述内容信息通过对所述第一对象块进行内容识别处理后获得;
所述第一对象块对应的前景类别信息。
可选地,根据所述对象块处理信息集合,获得目标对象,包括:
根据所述对象块处理信息中对象块对应的配置信息,将所述对象块输入到对应的增强模型中,以对所述对象块进行对应的增强处理,获得与所述原始对象对应的增强对象块集合;
通过对所述增强对象块集合中的对象块进行融合处理,获得所述目标对象。
可选地,所述通过对所述增强对象块集合中的对象块进行融合处理,获得所述目标对象,包括:
将所述增强对象块集合中的对象块输入到目标融合模型中,获得所述目标对象。
可选地,所述拆分所述原始对象,获得与所述原始对象对应的对象块集合,包括:
在所述原始对象满足预设的第一拆分条件的情况下,根据第一拆分策略拆分所述原始对象,获得所述对象块集合。
可选地,所述拆分所述原始对象,获得与所述原始对象对应的对象块集合,还包括:
在所述原始对象满足预设的第二拆分条件的情况下,根据第二拆分策略拆分所述原始对象,获得所述对象块集合。
可选地,所述方法通过以下步骤确定所述原始对象是否满足所述预设的第一拆分条件:
获取所述电子设备对应的计算资源数据,其中,所述计算资源数据表征所述电子设备剩余的计算资源;
获取与所述原始对象对应的实时处理级别,其中,所述实时处理级别表征对所述目标对象进行增强处理的实时性要求级别;
在所述计算资源数据小于预设的资源阈值,或者,所述实时处理级别大于或等于预设的实时阈值的情况下,确定所述原始对象满足所述预设的第一拆分条件。
可选地,所述方法通过以下步骤确定所述原始对象是否满足所述预设的第二拆分条件:
获取所述电子设备对应的计算资源数据,其中,所述计算资源数据表征所述电子设备剩余的计算资源;
获取与所述原始对象对应的前景处理策略,其中,所述前景处理策略表征是否针对所述原始对象的前景以及背景进行区分增强处理;
在所述计算资源数据小于预设的资源阈值,并且,所述前景处理策略表征对所述原始对象的前景以及背景进行区分增强处理的情况下,确定所述原始对象满足所述预设的第二拆分条件。
可选地,所述获取待处理的原始对象的特征信息,包括:
获取特征提取模型;
将所述原始对象输入到所述特征提取模型中,获得所述特征信息。
可选地,所述原始对象包括以下至少一种:图像、视频。
本公开的第二方面,还提供了一种对象处理装置,包括:
特征信息获取模块,用于获取待处理的原始对象的特征信息;
策略配置模块,用于根据所述特征信息和所述原始对象,获得对象块处理信息集合,其中,所述对象块处理信息集合包括至少一个数据对,任一数据对包括至少一个对象块以及对所述至少一个对象块进行增强处理时的配置信息;
目标对象获得模块,用于根据所述对象块处理信息集合,获得目标对象,其中,所述目标对象是对原始对象进行增强处理后获得的对象。
本公开的第三方面,还提供了一种电子设备,其包括本公开的第二方面所述的装置;或者,所述电子设备包括:存储器,用于存储可执行的指令;处理器,用于根据所述指令的控制运行所述电子设备执行根据本公开的第一方面所述的方法。
本公开的一个有益效果在于,根据本公开的实施例,针对待进行增强处理的原始对象,通过获取该原始对象的特征信息,并根据该特征信息和该原始对象,获得与该原始对象对应的、包括至少一个数据对的对象块信息集合,并根据该对象块信息集合,获得对原始对象进行增强处理后的目标对象。该方法在对原始对象进行增强处理时,可以不用单一的、针对原始对象整体进行增强处理,而是将原始对象拆分为至少一个对象块,并为每一数据块配置进行增强处理时的配置信息,从而在对原始对象进行增强处理时,可以根据为每一对象块配置的配置信息,并行的对该至少一个对象块进行增强处理,从而在提升对象增强处理的灵活性的同时,提升处理效率。
通过以下参照附图对本公开的示例性实施例的详细描述,本公开的其他特征及其优点将会变得清楚。
附图说明
被结合在说明书中并构成说明书的一部分的附图示出了本公开的实施例,并且连同其说明一起用于解释本公开的原理。
图1是本公开实施例提供的可用于实现对象处理方法的对象处理系统的硬件配置的原理框图。
图2是本公开实施例提供的对象处理方法的流程示意图。
图3是本公开实施例提供的统一模型训练处理示意图。
图4是本公开实施例提供的一种对象处理装置的原理框图。
图5是本公开实施例提供的一种电子设备的结构示意图。
具体实施方式
现在将参照附图来详细描述本公开的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本公开及其应用或使用的任何限制。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
在这里示出和讨论的所有例子中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其他例子可以具有不同的值。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
<硬件配置>
图1是本公开实施例提供的可用于实现对象处理方法的对象处理系统的硬件配置的原理框图。
如图1所示,对象处理系统1000包括服务器1100、终端设备1200以及网络1300。
服务器1100例如可以是刀片服务器、机架式服务器等,服务器1100也可以是部署在云端的服务器集群,在此不做限定。
如图1所示,服务器1100可以包括处理器1110、存储器1120、接口装置1130、通信装置1140、显示装置1150和输入装置1160。处理器1110例如可以是中央处理器CPU等。存储器1120例如包括ROM(只读存储器)、RAM(随机存取存储器)、诸如硬盘的非易失性存储器等。接口装置1130例如包括USB接口、串行接口等。通信装置1140例如能够进行有线或无线通信。显示装置1150例如是液晶显示屏。输入装置1160例如可以包括触摸屏、键盘等。
本实施例中,服务器1100可用于参与实现根据本公开任意实施例的方法。
应用于本公开实施例中,服务器1100的存储器1120用于存储指令,所述指令用于控制所述处理器1110进行操作以支持实现根据本发明任意实施例的方法。技术人员可以根据本发明所公开方案设计指令。指令如何控制处理器进行操作,这是本领域公知,故在此不再详细描述。
本领域技术人员应当理解,尽管在图1中示出了服务器1100的多个装置,但是,本公开实施例的服务器1100可以仅涉及其中的部分装置,例如,只涉及处理器1110和存储器1120。
如图1所示,终端设备1200可以包括处理器1210、存储器1220、接口装置1230、通信装置1240、显示装置1250、输入装置1260、音频输出装置1270、音频输入装置1280,等等。其中,处理器1210可以是中央处理器CPU、微处理器MCU等。存储器1220例如包括ROM(只读存储器)、RAM(随机存取存储器)、诸如硬盘的非易失性存储器等。接口装置1230例如包括USB接口、耳机接口等。通信装置1240例如能够进行有线或无线通信。显示装置1250例如是液晶显示屏、触摸显示屏等。输入装置1260例如可以包括触摸屏、键盘等。终端设备1200可以通过音频输出装置1270输出音频信息,该音频输出装置1270例如包括扬声器。终端设备1200可以通过音频拾取装置1280拾取用户输入的语音信息,该音频拾取装置1280例如包括麦克风。
终端设备1200可以是智能手机、便携式电脑、台式计算机、平板电脑等,此处不做特殊限定。
本领域技术人员应当理解,尽管在图1中示出了终端设备1200的多个装置,但是,本公开实施例的终端设备1200可以仅涉及其中的部分装置,例如,只涉及处理器1210、存储器1220等。
通信网络1300可以是无线网络也可以是有线网络,可以是局域网也可以是广域网。终端设备1200可以通过通信网络1300与服务器1100进行通信。
需要说明的是,图1所示的对象处理系统1000仅是解释性的,并且决不是为了要限制本公开、其应用或用途。例如,尽管图1仅示出一个服务器1100和一个终端设备1200,但不意味着限制各自的数量,该系统1000中可以包含多个服务器1100和/或多个终端设备1200。
<方法实施例>
图2是根据本公开实施例的对象处理方法的流程示意图,该方法可以由电子设备实施,该电子设备可以是服务器,例如,可以是图1所示的服务器1100;或者,该电子设备也可以是终端设备,此处不做特殊限定。
根据图2所示,本实施例的方法可以包括如下步骤S2100-S2300,以下予以详细说明。
步骤S2100,获取待处理的原始对象的特征信息。
在实际中,现有方法在对原始对象进行增强处理时,通常是针对原始对象整体进行处理,即,使用统一增强倍数以及统一增强模型对原始对象整体进行重建,该方法处理方式较为单一,并且由于是针对原始对象整体进行处理,所以不能有效利用计算资源,存在不够灵活以及处理效率低的问题;另外,当原始对象为视频时,由于现有方法并没有考虑相邻帧间的时序关系,所以增强处理后的视频还可能存在帧间闪烁等失真问题,影响用户体验。
针对现有技术中的上述问题,本实施例提供的方法采取模块化的方法对原始对象进行增强处理,具体是先使用特征信息提取模块提取原始对象的特征信息,之后,由策略配置模块根据该特征信息,决定是否拆分原始对象,以及针对原始对象或拆分原始对象得到的至少一个对象块,为其配置进行增强处理时的配置信息;再之后,通过上述策略配置模块得到的对象块处理信息集合,通过多粒度增强模块,对每一对象块进行对应的增强处理,以获得增强处理后的目标对象。
在本实施例中,原始对象,是待进行增强处理的对象,该对象可以为图像、视频等对象。该原始对象,例如可以是图像修复、旧视听内容修复以及智能剪辑等场景中的对象。
具体来讲,所述对原始对象进行增强处理,是指用于提升原始对象的视觉效果的处理。在本实施例中,如无特殊说明,该增强处理可以是对原始对象,例如图像或者视频进行超分辨率重建(SR,Super Resolution)处理。需要说明的是,在本实施例中,如无特殊说明,以原始对象为图像进行说明。
在本实施例中,所述获取待处理的原始对象的特征信息,包括:获取特征提取模型;将所述原始对象输入到所述特征提取模型中,获得所述特征信息。
即,在对原始对象进行增强处理时,可以先通过特征提取模块提取原始对象的特征信息,即,将原始对象输入到特征提取模型中,获得其对应的特征信息,在本实施例中,该特征提取模型可以是用于提取图像或视频特征信息的卷积神经网络模型(CNN,Convolutional Neural Networks),或者也可以是其他网络结构的模型,此处不做特殊限定。
在原始对象为图像时,其的特征信息可以包括颜色特征信息、纹理特征信息、形状特征信息以及空间关系特征信息等特征信息中的一种或多种;而在原始对象为视频时,其的特征信息还可以包括不同视频帧之间的时序关系,以及内容对应关系,例如,是否为连续运动帧等,此处不做特殊限定。
在步骤S2100之后,执行步骤S2200,根据所述特征信息和所述原始对象,获得对象块处理信息集合,其中,所述对象块处理信息集合包括至少一个数据对,任一数据对包括至少一个对象块以及对所述至少一个对象块进行增强处理时的配置信息。
在经过步骤S2100获得原始对象的特征信息之后,为了灵活、高效的对原始对象进行增强处理,本实施例在针对原始对象进行增强处理时,可以先根据原始对象和其特征信息,决定是否将原始对象拆分为至少一个对象块,以及为原始对象或拆分原始对象获得的至少一个对象块配置其在进行增强处理时的配置信息,以得到由至少一个数据对组成的对象块处理信息集合。
在具体实施时,对象块对应的配置信息可以包括对该对象块进行增强处理时的增强倍数,即,扩大倍数,以及,对其进行增强处理的增强模型的标识信息。即,在本实施例中,所述多粒度增强模块可以包括至少一个增强模型,以根据不同对象块的特征信息,自适应的选择合适的增强模型对其进行增强处理,以提升增强处理后获得的目标对象的视觉效果。
在具体实施时,所述根据所述特征信息和所述待处理对象,获得对象块处理信息集合,包括:拆分所述原始对象,获得与所述原始对象对应的对象块集合;根据所述特征信息,确定所述对象块集合中对象块对应的配置信息,以获得所述对象块处理信息集合。以下,首先对如何拆分原始对象进行详细说明。
在本实施例中,所述拆分所述原始对象,获得与所述原始对象对应的对象块集合,包括:在所述原始对象满足预设的第一拆分条件的情况下,根据第一拆分策略拆分所述原始对象,获得所述对象块集合。
具体来讲,本实施例提供的方法可以通过以下步骤确定所述原始对象是否满足所述预设的第一拆分条件:获取所述电子设备对应的计算资源数据,其中,所述计算资源数据表征所述电子设备剩余的计算资源;获取与所述原始对象对应的实时处理级别,其中,所述实时处理级别表征对所述目标对象进行增强处理的实时性要求级别;在所述计算资源数据小于预设的资源阈值,或者,所述实时处理级别大于或等于预设的实时阈值的情况下,确定所述原始对象满足所述预设的第一拆分条件。
计算资源数据,是表征电子设备剩余的计算资源的数据,该数据可以是对电子设备中,中央处理器(CPU,Central Processing Unit)、内存(Memory)等剩余资源按照一定权重进行计算后得到的数据,其具体处理方法由于现有技术中有详细说明,此处不再赘述。
实时处理级别,可以由用户在对原始对象进行增强处理时预先配置,例如,可以设置实时处理级别为高优先级、中优先级以及低优先级,此处不做特殊限定。
所述预设的第一拆分条件,可以是进行增强处理的电子设备对应的计算资源数据小于预设的资源阈值,或者,待进行增强处理的原始对象的实时处理级别大于或等于预设的实时阈值的情况下,确定所述原始对象满足所述预设的第一拆分条件,即,用于进行增强处理的电子设备的计算资源较少,或者,该原始对象的实时性要求较高。
所述第一拆分策略,可以是均匀拆分策略。例如,在原始对象为图像块时,可以将该图像拆分为多个尺寸大小相同的图像块。
另外,在具体实施时,所述拆分所述原始对象,获得与所述原始对象对应的对象块集合,还可以为:在所述原始对象满足预设的第二拆分条件的情况下,根据第二拆分策略拆分所述原始对象,获得所述对象块集合。
具体来讲,本实施例提供的方法还可以通过以下步骤确定所述原始对象是否满足所述预设的第二拆分条件:获取所述电子设备对应的计算资源数据,其中,所述计算资源数据表征所述电子设备剩余的计算资源;获取与所述原始对象对应的前景处理策略,其中,所述前景处理策略表征是否针对所述原始对象的前景以及背景进行区分增强处理;在所述计算资源数据小于预设的资源阈值,并且,所述前景处理策略表征对所述原始对象的前景以及背景进行区分增强处理的情况下,确定所述原始对象满足所述预设的第二拆分条件。
即,在实际中,在计算资源有限,并且主要考虑对原始对象的前景(front view)进行增强的应用场景,例如,在虚拟现实(VR,Virtual Reality)领域中的原始对象,通常可以对其前景进行较大倍数的增强处理,而对背景可以选择不增强,或者,采取较小倍数的增强处理。针对该类应用场景中的待处理对象,在对其进行增强处理时,可以预为其配置对应的前景处理策略,例如,可以设置“1”表征主要对原始对象进行前景增强处理,以及设置“0”表征不需要特意对原始对象进行前景增强处理;当然,在具体实施时,该前景处理策略也可以通过其他方式获得,此处不再赘述。
需要说明的是,在具体实施时,可以使用以上任意预设的拆分条件对原始对象进行拆分处理,或者,也可以将上述任意条件进行组合,或者与其他条件进行组合,此处不做特殊限制。在经过上述处理拆分原始对象,获得与原始对象对应的、由至少一个对象块构成的对象块集合之后,为了灵活、方便的对原始对象进行增强处理,例如,超分辨率重建处理,可以为每一对象块配置其对应的、进行增强处理时的配置信息,以下进行详细说明。
在本实施例中,提供一种根据原始对象的特征信息,确定对对象块进行增强处理时的配置信息的方法,该方法包括:获取第一对象块,其中,所述第一对象块为所述对象块集合中的任一对象块;获取与所述第一对象块对应的第一特征信息;根据所述第一特征信息,获得与所述第一对象块对应的第一配置信息;根据所述第一对象块和所述第一配置信息,获得所述对象块处理信息集合。
该第一特征信息,是从原始对象的特征信息中拆分出的与对象块对应的特征信息,例如,在原始对象为图像时,可以拆分得到多个图像块,并且,可以对应的从该图像的特征信息中,拆分得到每一图像块对应的特征信息。
需要说明的是,在本实施例中,如无特殊说明,第一特征信息、第一对象块等描述中的“第一”是用于对其进行对应说明,而非特指某一特征信息或某一对象块。
在具体实施时,所述根据所述第一特征信息,获得与所述第一对象块对应的第一配置信息,包括:根据所述第一特征信息,获得第一决策信息;根据所述第一决策信息,获得第一模型标识信息和第一增强倍数信息,其中,所述第一模型标识信息用于标识第一增强模型,所述第一增强模型用于对所述第一对象块进行增强处理;根据所述第一模型标识信息和所述第一增强倍数信息,获得所述第一配置信息。
在本实施例中,所述第一决策信息包括以下至少一种:所述第一对象块对应的第一注意力权重,其中,所述第一注意力权重用于表征用户对所述第一对象块中内容的关注程度;所述第一对象块的第一纹理特征信息;表征所述第一对象块中内容的第一内容信息,其中,所述内容信息通过对所述第一对象块进行内容识别处理后获得;所述第一对象块对应的前景类别信息。
第一决策信息,是与第一对象块对应的,用于决策对第一对象块进行增强处理时的对应配置的信息。
具体来讲,在计算资源较少或实时性要求较高时,即,在满足上述第一拆分条件的情况下,可以对原始对象进行均匀拆分处理,已获得多个尺寸大小相同的对象块,之后,可以为每一对象块分配相同的增强倍数,以及相同的增强模型;或者,也可以由电子设备自适应的根据每一对象块的特征信息,为其分配对应的增强倍数,以及对应的增强模型,以提升待获得的目标对象的视觉效果。
在一个实施例中,该第一决策信息可以是与第一对象块对应的第一注意力权重。即,可以根据对象块中的内容是否为用户关注,即感兴趣的内容,决定其增强倍数。
在本实施例中,可以采用注意力权重来量化用户对对象块关注的程度,例如,可以根据对象块是否为对象块的视觉中心,即,图像或视频的中心区域、对象块中是否包含人物或移动物体等来为每一对象块分配注意力权重;同时,在针对原始对象进行增强处理时,根据该注意力权重决定每一对象块的增强倍数,即,通过预设与不同增强倍数对应的权重阈值,以自适应的为每一对象块分配对应的增强倍数。
在一个实施例中,该第一决策信息还可以是第一对象块的第一纹理特征信息,例如,可以通过使用纹理复杂度、纹理梯度等纹理特征信息来确定图像或视频的模糊程度,以对应的为其分配增强倍数。
在一个实施例中,该第一决策信息还可以是通过对原始对象进行内容识别后获得的与该第一对象块对应的第一内容信息。所述第一内容信息,可以是使用对象检测(objectdetection)算法检测得到的、用于在图像或视频中描述不同内容对象的位置区域的矩形框,以及还可以包括该内容对象的类别等信息。
在一个实施例中,在原始对象满足上述第二拆分条件的情况下,可以对该原始对象进行非均匀切分处理,即,将原始对象拆分为分别由前景像素和背景像素构成的多个非均匀对象块。在该种情况下,可以设置前景类别信息,以表征每一对象块是否为前景对象块,并在对象块为前景对象块的情况下,提高其增强倍数,该增强倍数可以预先设置,例如,在对象块为前景对象块的情况下,设置其增强倍数为8,而在其为背景对象块的情况下,设置其增强倍数为2或4。
需要说明的是,在根据第一决策信息确定对象块的增强倍数之后,还可以根据对象块的增强倍数,以及原始对象的类型,例如,图像类型、视频类型,自适应的为其分别增强模型。
具体来讲,在原始对象为图像,并且,对象块的增强倍数较小,例如,小于4倍的情况下,可以使用双三次插值(Bicubic,Bicubic interpolation),FRSR等模型结构相对简单的模型对该对象块进行增强处理;而在对象块的增强倍数较大,例如,大于或等于4倍的情况下,可以使用残差密集网络模型(RDN,Residual Dense Network)、NatSR等性能较好的模型对该对象块进行增强处理。
在原始对象为视频,并且,对象块的增强倍数较小,例如,小于4倍的情况下,则可以使用VESPCN模型;而在对象块的增强倍数较大,例如,大于或等于4倍的情况下,或者,视频序列运动剧烈的对象块,则可以使用EDVR等性能较好的模型对该对象块进行增强处理。
当然,在具体实施时,还可以根据原始对象的模糊程度以及其模糊核(blurkernel)是否已知,确定其对应的增强模型,此处不再赘述。
在经过策略配置模块得到与原始对象对应的对象块处理信息集合之后,即可根据该对象块处理信息集合,将拆分原始对象得到的对象块集合输入到对应的增强模型中,以对每一对象块进行对应倍数的增强处理。
在步骤S2200之后,执行步骤S2300,根据所述对象块处理信息集合,获得目标对象,其中,所述目标对象是对原始对象进行增强处理后获得的对象。
在具体实施时,根据所述对象块处理信息集合,获得目标对象,包括:根据所述对象块处理信息中对象块对应的配置信息,将所述对象块输入到对应的增强模型中,以对所述对象块进行对应的增强处理,获得与所述原始对象对应的增强对象块集合;通过对所述增强对象块集合中的对象块进行融合处理,获得所述目标对象。
所述通过对所述增强对象块集合中的对象块进行融合处理,获得所述目标对象,包括:将所述增强对象块集合中的对象块输入到目标融合模型中,获得所述目标对象。
在本实施例中,目标融合模型可以是预先训练得到的、用于消除不同对象块融合或者相邻视频帧间可能存在的切分边界、帧间闪烁等失真问题的模型,该模型例如可以为EDVR(Video Restoration with Enhanced Deformable Convolutional Networks)框架中的时空注意融合(Temporal and Spatial Attention)模型。
请参看图3,其是本公开实施例提供的统一模型训练处理示意图。如图3所示,在本实施例中,为了提升目标图像的视觉效果,在具体实施时,可以对策略配置模块301、多粒度增强模块中的各增强模型302-1,302-2,…302-n以及目标融合模型303进行统一训练,在训练的过程中,通过计算样本对象,以及重建得到的样本目标图像之间的失真率作为损失函数(loss function),并通过不断调整上述多个模型中的参数,以使各模块中的对应模型达到预设的收敛条件,并使用训练得到的各模型对实际待处理的样本图像进行增强处理,其中,在计算样本目标图像和样本图像之间的失真率时可以使用峰值信噪比(PSNR,PeakSignal to Noise Ratio)、结构相似性(SSIM,Structural Similarity)、多层级结构相似性(MS-SSIM,Multi-level Structural Similarity)中的至少之一和视频质量多方法评价融合(VMAF,Visual Multimethod Assessment Fusion)、VIFP中的至少之一的加权计算获得;当然,在具体实施时,也可以直接使用RankIQA等无参考质量评价模型计算样本目标图像的失真率,此处不做特殊限制。
综上可知,本实施例提供的方法,针对待进行增强处理的原始对象,通过获取该原始对象的特征信息,并根据该特征信息和该原始对象,获得与该原始对象对应的、包括至少一个数据对的对象块信息集合,并根据该对象块信息集合,获得对原始对象进行增强处理后的目标对象。该方法在对原始对象进行增强处理后,可以不单一的、针对原始对象整体进行增强处理,而是将原始对象拆分为至少一个对象块,并为每一数据块配置进行增强处理时的配置信息,从而在对原始对象进行增强处理时,可以根据为每一对象块配置的配置信息,并行的对该至少一个对象块进行增强处理,从而在提升对象增强处理的灵活性的同时,提升处理效率;另外,由于采用了模块化的结构对原始对象进行增强处理,且各模块间具有弱耦合性,因此,在具体实施时,还可以根据需要对局部模块进行更新、替换处理,以提升处理效率。
<装置实施例>
与上述方法实施例相对应,在本实施例中,还提供一种对象处理装置,应用于电子设备,如图4所示,该装置4000可以包括特征信息获取模块4100、策略配置模块4200和目标对象获得模块4300。
该特征信息获取模块4100,用于获取待处理的原始对象的特征信息。
在一个实施例中,该特征信息获取模块4100在获取待处理的原始对象的特征信息时,可以用于:获取特征提取模型;将所述原始对象输入到所述特征提取模型中,获得所述特征信息。
该策略配置模块4200,用于根据所述特征信息和所述原始对象,获得对象块处理信息集合,其中,所述对象块处理信息集合包括至少一个数据对,任一数据对包括至少一个对象块以及对所述至少一个对象块进行增强处理时的配置信息。
在一个实施例中,该策略配置模块4200在根据所述特征信息和所述原始对象,获得对象块处理信息集合时,可以用于:拆分所述原始对象,获得与所述原始对象对应的对象块集合;根据所述特征信息,确定所述对象块集合中对象块对应的配置信息,以获得所述对象块处理信息集合。
在一个实施例中,该策略配置模块4200在拆分所述原始对象,获得与所述原始对象对应的对象块集合时,可以用于:在所述原始对象满足预设的第一拆分条件的情况下,根据第一拆分策略拆分所述原始对象,获得所述对象块集合。
在该实施例中,该策略配置模块4200用于通过以下步骤确定所述原始对象是否满足所述预设的第一拆分条件:获取所述电子设备对应的计算资源数据,其中,所述计算资源数据表征所述电子设备剩余的计算资源;获取与所述原始对象对应的实时处理级别,其中,所述实时处理级别表征对所述目标对象进行增强处理的实时性要求级别;在所述计算资源数据小于预设的资源阈值,并且,所述实时处理级别大于或等于预设的实时阈值的情况下,确定所述原始对象满足所述预设的第一拆分条件。
在一个实施例中,该策略配置模块4200在拆分所述原始对象,获得与所述原始对象对应的对象块集合时,可以用于:在所述原始对象满足预设的第二拆分条件的情况下,根据第二拆分策略拆分所述原始对象,获得所述对象块集合。
在该实施例中,该策略配置模块4200用于通过以下步骤确定所述原始对象是否满足所述预设的第二拆分条件:获取所述电子设备对应的计算资源数据,其中,所述计算资源数据表征所述电子设备剩余的计算资源;获取与所述原始对象对应的前景处理策略,其中,所述前景处理策略表征是否针对所述原始对象的前景以及背景进行区分增强处理;在所述计算资源数据小于预设的资源阈值,并且,所述前景处理策略表征对所述原始对象的前景以及背景进行区分增强处理的情况下,确定所述原始对象满足所述预设的第二拆分条件。
在一个实施例中,该策略配置模块4200在根据所述特征信息,确定所述对象块集合中对象块对应的配置信息,以获得所述对象块处理信息集合时,可以用于:获取第一对象块,其中,所述第一对象块为所述对象块集合中的任一对象块;获取与所述第一对象块对应的第一特征信息;根据所述第一特征信息,获得与所述第一对象块对应的第一配置信息;根据所述第一对象块和所述第一配置信息,获得所述对象块处理信息集合。
在一个实施例中,该策略配置模块4200在根据所述第一特征信息,获得与所述第一对象块对应的第一配置信息时,可以用于:根据所述第一特征信息,获得第一决策信息;根据所述第一决策信息,获得第一模型标识信息和第一增强倍数信息,其中,所述第一模型标识信息用于标识第一增强模型,所述第一增强模型用于对所述第一对象块进行增强处理;根据所述第一模型标识信息和所述第一增强倍数信息,获得所述第一配置信息。
该目标对象获得模块4300,用于根据所述对象块处理信息集合,获得目标对象,其中,所述目标对象是对原始对象进行增强处理后获得的对象。
在一个实施例中,该目标对象获得模块4300在根据所述对象块处理信息集合,获得目标对象时,可以用于:根据所述对象块处理信息中对象块对应的配置信息,将所述对象块输入到对应的增强模型中,以对所述对象块进行对应的增强处理,获得与所述原始对象对应的增强对象块集合;通过对所述增强对象块集合中的对象块进行融合处理,获得所述目标对象。
在该实施例中,该目标对象获得模块4300在对所述增强对象块集合中的对象块进行融合处理,获得所述目标对象时,可以用于:将所述增强对象块集合中的对象块输入到目标融合模型中,获得所述目标对象。
<设备实施例>
与上述方法实施例相对应,在本实施例中,还提供一种电子设备,其可以包括根据本公开任意实施例的对象处理装置4000,用于实施本公开任意实施例的方法。
如图5所示,该电子设备5000还可以包括处理器5200和存储器5000,该存储器5100用于存储可执行的指令;该处理器5200用于根据指令的控制运行电子设备以执行根据本公开任意实施例的方法。
以上装置4000的各个模块可以由处理器5200运行该指令以执行根据本公开任意实施例的方法来实现。
本公开可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本公开的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本公开的各个方面。
这里参照根据本公开实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其他可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其他可编程数据处理装置、或其他设备上,使得在计算机、其他可编程数据处理装置或其他设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其他可编程数据处理装置、或其他设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本公开的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。对于本领域技术人员来说公知的是,通过硬件方式实现、通过软件方式实现以及通过软件和硬件结合的方式实现都是等价的。
以上已经描述了本公开的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术改进,或者使本技术领域的其他普通技术人员能理解本文披露的各实施例。本公开的范围由所附权利要求来限定。
Claims (15)
1.一种对象处理方法,其特征在于,应用于电子设备,包括:
获取待处理的原始对象的特征信息;
根据所述特征信息和所述原始对象,获得对象块处理信息集合,其中,所述对象块处理信息集合包括至少一个数据对,任一数据对包括至少一个对象块以及对所述至少一个对象块进行增强处理时的配置信息;
根据所述对象块处理信息集合,获得目标对象,其中,所述目标对象是对原始对象进行增强处理后获得的对象。
2.根据权利要求1所述的方法,其特征在于,所述根据所述特征信息和所述待处理对象,获得对象块处理信息集合,包括:
拆分所述原始对象,获得与所述原始对象对应的对象块集合;
根据所述特征信息,确定所述对象块集合中对象块对应的配置信息,以获得所述对象块处理信息集合。
3.根据权利要求2所述的方法,其特征在于,所述根据所述特征信息,确定所述对象块集合中对象块对应的配置信息,以获得所述对象块处理信息集合,包括:
获取第一对象块,其中,所述第一对象块为所述对象块集合中的任一对象块;
获取与所述第一对象块对应的第一特征信息;
根据所述第一特征信息,获得与所述第一对象块对应的第一配置信息;
根据所述第一对象块和所述第一配置信息,获得所述对象块处理信息集合。
4.根据权利要求3所述的方法,其特征在于,所述根据所述第一特征信息,获得与所述第一对象块对应的第一配置信息,包括:
根据所述第一特征信息,获得第一决策信息;
根据所述第一决策信息,获得第一模型标识信息和第一增强倍数信息,其中,所述第一模型标识信息用于标识第一增强模型,所述第一增强模型用于对所述第一对象块进行增强处理;
根据所述第一模型标识信息和所述第一增强倍数信息,获得所述第一配置信息。
5.根据权利要求4所述的方法,其特征在于,所述第一决策信息包括以下至少一种:
所述第一对象块对应的第一注意力权重,其中,所述第一注意力权重用于表征用户对所述第一对象块中内容的关注程度;
所述第一对象块的第一纹理特征信息;
表征所述第一对象块中内容的第一内容信息,其中,所述内容信息通过对所述第一对象块进行内容识别处理后获得;
所述第一对象块对应的前景类别信息。
6.根据权利要求1所述的方法,其特征在于,所述根据所述对象块处理信息集合,获得目标对象,包括:
根据所述对象块处理信息中对象块对应的配置信息,将所述对象块输入到对应的增强模型中,以对所述对象块进行对应的增强处理,获得与所述原始对象对应的增强对象块集合;
通过对所述增强对象块集合中的对象块进行融合处理,获得所述目标对象。
7.根据权利要求6所述的方法,其特征在于,所述通过对所述增强对象块集合中的对象块进行融合处理,获得所述目标对象,包括:
将所述增强对象块集合中的对象块输入到目标融合模型中,获得所述目标对象。
8.根据权利要求2所述的方法,其特征在于,所述拆分所述原始对象,获得与所述原始对象对应的对象块集合,包括:
在所述原始对象满足预设的第一拆分条件的情况下,根据第一拆分策略拆分所述原始对象,获得所述对象块集合。
9.根据权利要求2所述的方法,其特征在于,所述拆分所述原始对象,获得与所述原始对象对应的对象块集合,包括:
在所述原始对象满足预设的第二拆分条件的情况下,根据第二拆分策略拆分所述原始对象,获得所述对象块集合。
10.根据权利要求8所述的方法,其特征在于,所述方法通过以下步骤确定所述原始对象是否满足所述预设的第一拆分条件:
获取所述电子设备对应的计算资源数据,其中,所述计算资源数据表征所述电子设备剩余的计算资源;
获取与所述原始对象对应的实时处理级别,其中,所述实时处理级别表征对所述目标对象进行增强处理的实时性要求级别;
在所述计算资源数据小于预设的资源阈值,或者,所述实时处理级别大于或等于预设的实时阈值的情况下,确定所述原始对象满足所述预设的第一拆分条件。
11.根据权利要求9所述的方法,其特征在于,所述方法通过以下步骤确定所述原始对象是否满足所述预设的第二拆分条件:
获取所述电子设备对应的计算资源数据,其中,所述计算资源数据表征所述电子设备剩余的计算资源;
获取与所述原始对象对应的前景处理策略,其中,所述前景处理策略表征是否针对所述原始对象的前景以及背景进行区分增强处理;
在所述计算资源数据小于预设的资源阈值,并且,所述前景处理策略表征对所述原始对象的前景以及背景进行区分增强处理的情况下,确定所述原始对象满足所述预设的第二拆分条件。
12.根据权利要求1所述的方法,其特征在于,所述获取待处理的原始对象的特征信息,包括:
获取特征提取模型;
将所述原始对象输入到所述特征提取模型中,获得所述特征信息。
13.根据权利要求1所述的方法,其特征在于,所述原始对象包括以下至少一种:图像、视频。
14.一种对象处理装置,其特征在于,包括:
特征信息获取模块,用于获取待处理的原始对象的特征信息;
策略配置模块,用于根据所述特征信息和所述原始对象,获得对象块处理信息集合,其中,所述对象块处理信息集合包括至少一个数据对,任一数据对包括至少一个对象块以及对所述至少一个对象块进行增强处理时的配置信息;
目标对象获得模块,用于根据所述对象块处理信息集合,获得目标对象,其中,所述目标对象是对原始对象进行增强处理后获得的对象。
15.一种电子设备,其特征在于,包括权利要求14所述的装置;或者,
所述电子设备包括:
存储器,用于存储可执行的指令;
处理器,用于根据所述指令的控制运行所述电子设备执行如权利要求1-13任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011042783.1A CN114359056A (zh) | 2020-09-28 | 2020-09-28 | 对象处理方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011042783.1A CN114359056A (zh) | 2020-09-28 | 2020-09-28 | 对象处理方法、装置及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114359056A true CN114359056A (zh) | 2022-04-15 |
Family
ID=81090113
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011042783.1A Pending CN114359056A (zh) | 2020-09-28 | 2020-09-28 | 对象处理方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114359056A (zh) |
-
2020
- 2020-09-28 CN CN202011042783.1A patent/CN114359056A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109377508B (zh) | 图像处理方法和装置 | |
CN110166684B (zh) | 图像处理方法、装置、计算机可读介质及电子设备 | |
CN111985281A (zh) | 图像生成模型的生成方法、装置及图像生成方法、装置 | |
CN111105375A (zh) | 图像生成方法及其模型训练方法、装置及电子设备 | |
JP2023531350A (ja) | サンプル画像を増分する方法、画像検出モデルの訓練方法及び画像検出方法 | |
CN111445424A (zh) | 图像处理和移动终端视频处理方法、装置、设备和介质 | |
CN111757100B (zh) | 相机运动变化量的确定方法、装置、电子设备和介质 | |
CN110622214A (zh) | 基于超体素的时空视频分割的快速渐进式方法 | |
CN113033677A (zh) | 视频分类方法、装置、电子设备和存储介质 | |
Diaz-Ramirez et al. | Real-time haze removal in monocular images using locally adaptive processing | |
CN110689498A (zh) | 一种基于对非关注点部分分级模糊的高清视频优化方法 | |
CN111179276A (zh) | 一种图像处理方法和装置 | |
CN116757962A (zh) | 一种图像去噪方法、装置 | |
CN108898557B (zh) | 图像恢复方法及装置、电子设备、计算机程序及存储介质 | |
CN110852250A (zh) | 一种基于最大面积法的车辆排重方法、装置及存储介质 | |
CN114359056A (zh) | 对象处理方法、装置及电子设备 | |
US11928855B2 (en) | Method, device, and computer program product for video processing | |
CN113014745B (zh) | 视频图像降噪方法及装置、存储介质及电子设备 | |
WO2022216671A1 (en) | Temporal augmentation for training video reasoning system | |
CN115019057A (zh) | 图像特征提取模型确定方法及装置、图像识别方法及装置 | |
CN110809158B (zh) | 图像环路滤波处理方法、装置 | |
CN113610720A (zh) | 视频去噪方法及装置、计算机可读介质和电子设备 | |
CN113095176A (zh) | 一种对视频数据进行背景还原的方法和装置 | |
CN113409199A (zh) | 图像处理方法、装置、电子设备及计算机可读介质 | |
CN117278765B (zh) | 一种视频压缩方法、装置、设备以及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |