CN116934878A - 压缩标注图像的获取方法、装置、设备及存储介质 - Google Patents
压缩标注图像的获取方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN116934878A CN116934878A CN202210368901.0A CN202210368901A CN116934878A CN 116934878 A CN116934878 A CN 116934878A CN 202210368901 A CN202210368901 A CN 202210368901A CN 116934878 A CN116934878 A CN 116934878A
- Authority
- CN
- China
- Prior art keywords
- image
- compressed
- target
- probability information
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000007906 compression Methods 0.000 title claims abstract description 62
- 230000006835 compression Effects 0.000 title claims abstract description 62
- 238000000034 method Methods 0.000 title claims abstract description 58
- 238000002372 labelling Methods 0.000 title claims abstract description 29
- 238000012545 processing Methods 0.000 claims abstract description 25
- 238000012549 training Methods 0.000 claims abstract description 14
- 238000013528 artificial neural network Methods 0.000 claims description 31
- 238000005457 optimization Methods 0.000 claims description 13
- 238000000605 extraction Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 9
- 230000007423 decrease Effects 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 8
- 238000007781 pre-processing Methods 0.000 abstract description 4
- 230000006870 function Effects 0.000 description 18
- 238000010586 diagram Methods 0.000 description 12
- 238000004891 communication Methods 0.000 description 6
- 230000003247 decreasing effect Effects 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 239000004973 liquid crystal related substance Substances 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
- G06T9/002—Image coding using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本公开实施例公开了一种压缩标注图像的获取方法、装置、设备及存储介质。对原始图像进行压缩,获得第一压缩图像;获取当前图像的目标调整概率信息;基于目标调整概率信息对当前图像进行调整,并对调整后的图像进行压缩,获取第二压缩图像;确定第一压缩图像和第二压缩图像的目标价值增量;若目标价值增量满足设定条件,则将调整后的图像确定为压缩标注图像,以基于压缩标注图像对设定图像处理模型进行训练;若目标价值增量不满足设定条件,则将调整后的图像作为新的当前图像,并返回执行获取当前图像的目标调整概率信息的操作,直到目标价值增量满足设定条件。不仅可以提高模型的泛化性和预处理效果,也可以提高设定压缩方法的图像压缩效果。
Description
技术领域
本公开实施例涉及图像处理技术领域,尤其涉及一种压缩标注图像的获取方法、装置、设备及存储介质。
背景技术
图像压缩是数据压缩技术在数字图像上的应用,目的是减少图像数据中的冗余信息,从而用更加高效的格式存储和传输数据。
近年来,随着深度学习技术的飞速发展,如何利用深度神经网络提升压缩效率已然成为图像压缩领域的热点研究问题。也有了许多研究成果,归结起来主要有两方面:第一,采用深度神经网络直接进行端到端的压缩,这类方法的解码比较耗时、模型体积较大、兼容性较差,当前很难在工业界直接推广使用;第二,将深度学习应用到图像预处理阶段,如图像去噪、图像去压缩失真、图像超分等。这类方法均是采用特定的先验方法进行数据标注,例如:在图像去噪中,将原始图片经过随机添加各种噪声,得到带有噪声的图像;在图像超分中,将高分辨率图像通过各种退化操作,得到低分辨率图像。采用特定先验方法标注训练数据得到的模型,只对相对应的图像有效果,泛化性较差。
发明内容
本公开实施例提供一种压缩标注图像的获取方法、装置、设备及存储介质,不仅可以提高神经网络度压缩图像时的泛化性,也可以提高图像的压缩效率。
第一方面,本公开实施例提供了一种压缩标注图像的获取方法,包括:
对原始图像进行压缩,获得第一压缩图像;
获取当前图像的目标调整概率信息;其中,所述当前图像为所述原始图像或者对所述原始图像经过至少一次调整后的图像;
基于所述调整概率信息对所述当前图像进行调整,并对调整后的图像进行压缩,获取第二压缩图像;
确定所述第一压缩图像和所述第二压缩图像的目标价值增量;
若所述目标价值增量满足设定条件,则将所述调整后的图像确定为压缩标注图像,以基于所述压缩标注图像对设定图像处理模型进行训练;
若所述目标价值增量不满足所述设定条件,则将所述调整后的图像作为新的当前图像,并返回执行获取当前图像的目标调整概率信息的操作,直到所述目标价值增量满足所述设定条件。。
第二方面,本公开实施例还提供了一种压缩标注图像的获取装置,包括:
第一压缩图像获取模块,用于对原始图像进行压缩,获得第一压缩图像;
目标调整概率信息获取模块,用于获取当前图像的目标调整概率信息;其中,所述当前图像为所述原始图像或者对所述原始图像经过至少一次调整后的图像;
图像调整模块,用于基于所述调整概率信息对所述当前图像进行调整,并对调整后的图像进行压缩,获取第二压缩图像;
目标价值增量确定模块,用于确定所述第一压缩图像和所述第二压缩图像的目标价值增量;
压缩标注图像确定模块,用于若所述目标价值增量满足设定条件,则将所述调整后的图像确定为压缩标注图像,以基于所述压缩标注图像对设定图像处理模型进行训练;
返回执行模块,用于若所述目标价值增量不满足所述设定条件,则将所述调整后的图像作为新的当前图像,并返回执行获取当前图像的目标调整概率信息的操作,直到所述目标价值增量满足所述设定条件。
第三方面,本公开实施例还提供了一种电子设备,所述电子设备包括:
一个或多个处理装置;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理装置执行,使得所述一个或多个处理装置实现如本公开实施例所述的压缩标注图像的获取方法。
第四方面,本公开实施例还提供了一种计算机可读介质,其上存储有计算机程序,其特征在于,该程序被处理装置执行时实现如本公开实施例所述的压缩标注图像的获取方法。
本公开实施例公开了一种压缩标注图像的获取方法、装置、设备及存储介质。对原始图像进行压缩,获得第一压缩图像;获取当前图像的目标调整概率信息;其中,当前图像为原始图像或者对原始图像经过至少一次调整后的图像;基于调整概率信息对当前图像进行调整,并对调整后的图像进行压缩,获取第二压缩图像;确定第一压缩图像和第二压缩图像的目标价值增量;若目标价值增量满足设定条件,则将调整后的图像确定为压缩标注图像,以基于压缩标注图像对设定图像处理模型进行训练;若目标价值增量不满足设定条件,则将调整后的图像作为新的当前图像,并返回执行获取当前图像的目标调整概率信息的操作,直到目标价值增量满足设定条件。基于上述方法获得的自动标注数据集进行设定神经网络模型训练,不仅可以提高模型的泛化性和预处理效果,同时也可以提高设定压缩方法的图像压缩效果。
附图说明
图1是本公开实施例中的一种压缩标注图像的获取方法的流程图;
图2是本公开实施例中的多任务神经网络的结构示意图;
图3是本公开实施例中的获取压缩标注图像的原理图;
图4是本公开实施例中的一种压缩标注图像的获取装置的结构示意图;
图5是本公开实施例中的一种电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。
需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
图1为本公开实施例提供的一种压缩标注图像的获取方法的流程图,本实施例可适用于获取压缩标注数据的情况,该方法可以由压缩标注图像的获取装置来执行,该装置可由硬件和/或软件组成,并一般可集成在具有压缩标注图像的获取功能的设备中,该设备可以是服务器、移动终端或服务器集群等电子设备。如图1所示,该方法具体包括如下步骤:
S110,对原始图像进行压缩,获得第一压缩图像。
本实施例中,可以采用传统的任意压缩方法对原始图像进行压缩,此处不做限定。例如:JPEG(Joint Photographic Experts Group)、JPEG-2000、MPEG(Moving PictureExperts Group)、VP8、HEVC(High Efficiency Video Coding)等。
S120,获取当前图像的目标调整概率信息。
其中,当前图像可以是原始图像或者对原始图像经过至少一次调整后的图像。目标调整概率信息包含当前图像各像素点按照设定方式调整的概率,由与当前图像的尺寸相同的矩阵表示。其中,设定方式可以是像素点像素值增加设定值或者减少所述设定值。设定值可以设置为1,即设定方式为像素值加1或者减1。
本实施例中,获取当前图像的目标调整概率信息的方式可以是采用设定优化策略确定目标调整概率信息,或者多任务神经网络与设定优化策略相结合的方式确定目标调整概率信息。其中,设定优化策略为如下任意一种:时间差分策略、动态规划策略及蒙特卡洛树搜索。
具体的,获取当前图像的目标调整概率信息的方式可以是:将当前图像输入多任务神经网络中,输出初始价值增量和初始调整概率信息;基于设定优化策略对初始调整概率信息进行优化,获得目标调整概率信息。
其中,多任务神经网络包括特征提取子网络、价值子网络及策略子网络,特征提取子网络分别与价值子网络及策略子网络相连。图2是本实施例中多任务神经网络的结构示意图,如图2所示,将当前图像输入多任务神经网络中,输出初始价值增量和初始调整概率信息的过程可以是:将当前图像输入特征提取子网络,输出特征图;将特征图分别输入价值子网络和策略子网络,输出初始价值增量和初始调整概率信息。
其中,价值子网络用于确定价值增量,策略子网络用于确定调整概率。
本实施例中,以蒙特卡洛树搜索法(Monte Carlo Tree Search,MCTS)为例,基于设定优化策略对所述初始调整概率信息进行优化的过程如下:
在MCTS中,每个节点代表一个图像状态,每条边表示由一个图像状态到另一个图像状态执行的调整动作,每条边存储了四个信息:平均奖励Q、访问次数N、总奖励W及调整概率p。一条边两端的节点,其中一个为父节点另一个为子节点,父节点对应的图像状态调整其中一个像素点的像素值获得子节点对应的图像状态,即调整动作为调整某个像素点的像素值。本实施例中,当前图像对应的边的数量与图像的大小以及调整方式数量(如:像素值加1或者减1)有关,若图像大小为m*n,调整方式数量为2,则边的数量为m*n*2。
假设初始价值增量表示为V。以其中一条边为例,执行一次该边对应的调整动作的奖励为:q=p*V+Re,其中,Re表示该条边两端的图像经压缩后之间的价值增量。
每次搜索时,都从根节点开始访问调整动作对应的边,一直执行到叶子节点。其中,根节点为当前图像对应的节点。调整动作at的选择依据如下公式:
at=max(q+u);其中,其中,N当前边的访问次数,/>表示从当前图像对应的根节点往下搜索的所有边的访问次数的和,p为执行当前边对应的调整动作的概率,可以从初始调整概率信息中获得。即计算每条边对应的q+u,然后访问q+u最大的边。
搜索完成一次后,更新各条边的四个信息:平均奖励Q、访问次数N、总奖励W及调整概率p。其中,调整概率p的更新按照如下公式:其中,π表示更新后的调整概率,τ为超参数,该公式表示π与/>成正比的关系。按照上述方式迭代搜索,直到满足结束条件,获得优化后的目标调整概率信息Π,Π为所有π构成的矩阵。其中,结束条件可以是任意一条边的访问次数达到设定阈值。
可选的,在确定所述第一压缩图像和所述第二压缩图像的目标价值增量之后,还包括如下步骤:确定初始价值增量和目标价值增量间的第一差异信息;确定初始调整概率信息与目标调整概率信息间的第二差异信息;基于第一差异信息和第二差异信息确定损失函数;基于损失函数训练多任务神经网络。
其中,第一差异信息可以是初始价值增量和目标价值增量差值的平方,表示为(Z-V)2。第二差异信息可以是目标调整概率信息点乘初始调整概率信息的对数,表示为:Π·logP。
其中,基于第一差异信息和第二差异信息确定损失函数的方式可以是:将第一差异信息减去第二差异信息,获得损失函数。可以表示:l=(Z-V)2-Π·lo。最后基于损失函数对多任务神经网络进行反向调参。
相应的,将调整后的图像输入调参后的设定多任务神经网络,输出初始价值增量和初始调整概率信息,再基于设定优化策略对所述初始调整概率信息进行优化,获得目标调整概率信息。直到目标价值增量满足设定条件。
S130,基于目标调整概率信息对当前图像进行调整,并对调整后的图像进行压缩,获取第二压缩图像。
具体的,在获得目标调整概率信息后,根据目标调整概率信息确定需要调整的像素点,根据该像素点的调整概率调整该像素点的像素值。
本实施例中,基于调整概率信息对当前图像进行调整的方式可以是:获取调整概率信息中概率最大值对应的像素点,作为目标像素点;将目标像素点的像素值按照设定方式进行调整。
其中,设定方式包括像素值增加设定值或者减少所述设定值。具体的,从目标调整概率信息对应的概率矩阵中获取最大概率,将最大概率的像素点的像素值加1或者减1,从而获得调整后的图像。
本实施例中,可以采用传统的任意压缩方法对调整后的图像进行压缩,此处不做限定。例如:JPEG(Joint Photographic Experts Group)、JPEG-2000、MPEG(MovingPicture Experts Group)、VP8、HEVC(High Efficiency Video Coding)等。本实施例中,对原始图像和调整后的图像压缩采用的算法相同。
S140,确定第一压缩图像和第二压缩图像的目标价值增量。
其中,目标价值增量可以由第一压缩图像和第二压缩图像间的峰值信噪比信息和压缩比信息两部分内容确定。
具体的,确定第一压缩图像和第二压缩图像的目标价值增量的方式可以是:确定第一压缩图像和第二压缩图像间的峰值信噪比PSNR差异信息;确定第一压缩图像和第二压缩图像间的压缩比差异信息;对PSNR差异信息和压缩比差异信息进行加权求和,获得目标价值增量。
其中,确定第一压缩图像和第二压缩图像间的峰值信噪比(Peak Signalto NoiseRatio,PSNR)差异信息的过程可以是:计算第一压缩图像和原始图像间的PSNR信息,计算第二压缩图像和调整后的图像间的PSNR信息,最后再计算两个PSNR的差值,获得PSNR差异信息。确定第一压缩图像和第二压缩图像间的压缩比差异信息的过程可以是:计算第一压缩图像与原始图像间的压缩比,计算第二压缩图像和调整后的图像间的压缩比,将两个压缩比作差,获得压缩比差异信息。
具体的,对PSNR信息和压缩比信息进行加权求和,获得目标价值增量的过程可以是:确定PSNR信息和压缩比信息分别对应的权重,基于该权重进行加权求和。目标价值增量的计算公式可以表示为:V=a(F2-F1)+b(H2-H1),其中,a和b为权重,F1为第一压缩图像和原始图像间的PSNR信息,F2为第二压缩图像和调整后的图像间的PSNR信息,H1为第一压缩图像与原始图像间的压缩比,H2为第二压缩图像和调整后的图像间的压缩比。
S150,判断目标价值增量是否满足设定条件,若满足,则执行步骤160,若否,则执行步骤170。
其中,设定条件可以是目标价值增量超过设定阈值。即若目标价值增量超过设定阈值,则执行S160,若目标价值增量未超过设定阈值,则执行S170。
S160,将调整后的图像确定为压缩标注图像,以基于压缩标注图像对设定图像处理模型进行训练。
本实施例中,若目标价值增量超过设定阈值,则表明调整后的图像可以作为压缩标注图像。具体的,将大量的原始图像执行S120-S150,从而获得大量的压缩标注图像,这些压缩标注图像可以作为样本对设定图像处理模型进行训练,训练后的模型具备泛化性的图像预处理能力。利用训练后的模型对图像进行预处理,再继续对预处理后的图像进行压缩,获得压缩后的图像。模型输出的图像可以比原始图像更好的适应传统编解码器的压缩,且对具备各种特性的图像均有效,进而在各种场景中提升现有编解码器的压缩效果。
S170,将调整后的图像作为新的当前图像,并返回执行S120,直到目标价值增量满足设定条件。
示例性的,图3是本实施例中获取压缩标注图像的原理图。如图3所示,对原始图像进行压缩,获得第一压缩图像;将原始图像作为当前图像输入多任神经网络中,获得初始价值增量V和初始调整概率信息P;然后基于设定优化策略对所述初始调整概率信息进行优化,获得目标调整概率信息Π;再然后基于Π对当前图像进行调整,获得调整后的图像;对调整后的图像进行压缩,获得第二压缩图像;计算第一压缩图像和第二压缩图像间的目标价值增量Z;确定V和Z间的第一差异信息,确定P与Π间的第二差异信息,基于第一差异信息和第二差异信息确定损失函数,基于损失函数训练多任务神经网络;将调整后的图像作为新的当前图像输入训练的多任务神经网络,循环执行上述步骤,直到目标价值增量满足设定条件,则将调整后的图像确定为压缩标注图像。
本公开实施例的技术方案,对原始图像进行压缩,获得第一压缩图像;获取当前图像的目标调整概率信息;其中,当前图像为原始图像或者对原始图像经过至少一次调整后的图像;基于调整概率信息对当前图像进行调整,并对调整后的图像进行压缩,获取第二压缩图像;确定第一压缩图像和第二压缩图像的目标价值增量;若目标价值增量满足设定条件,则将调整后的图像确定为压缩标注图像,以基于压缩标注图像对设定图像处理模型进行训练;若目标价值增量不满足设定条件,则将调整后的图像作为新的当前图像,并返回执行获取当前图像的目标调整概率信息的操作,直到目标价值增量满足设定条件。基于上述方法获得的自动标注数据集进行设定神经网络模型训练,不仅可以提高模型的泛化性和预处理效果,同时也可以提高设定压缩方法的图像压缩效果。
图4是本公开实施例提供的一种压缩标注图像的获取装置的结构示意图,如图4所示,该装置包括:
第一压缩图像获取模块210,用于对原始图像进行压缩,获得第一压缩图像;
目标调整概率信息获取模块220,用于获取当前图像的目标调整概率信息;其中,当前图像为原始图像或者对原始图像经过至少一次调整后的图像;
图像调整模块230,用于基于目标调整概率信息对当前图像进行调整,并对调整后的图像进行压缩,获取第二压缩图像;
目标价值增量确定模块240,用于确定第一压缩图像和第二压缩图像的目标价值增量;
压缩标注图像确定模块250,用于若目标价值增量满足设定条件,则将调整后的图像确定为压缩标注图像,以基于压缩标注图像对设定图像处理模型进行训练;
返回执行模块260,用于若目标价值增量不满足设定条件,则将调整后的图像作为新的当前图像,并返回执行获取当前图像的目标调整概率信息的操作,直到目标价值增量满足设定条件。
可选的,目标调整概率信息获取模块220,还用于:
将当前图像输入多任务神经网络中,输出初始价值增量和初始调整概率信息;
基于设定优化策略对初始调整概率信息进行优化,获得目标调整概率信息。
可选的,还包括:多任务神经网络训练模块,用于:
确定初始价值增量和目标价值增量间的第一差异信息;
确定初始调整概率信息与目标调整概率信息间的第二差异信息;
基于第一差异信息和第二差异信息确定损失函数;
基于损失函数训练多任务神经网络。
可选的,返回执行模块260,还用于:
返回执行将当前图像输入训练后的设定多任务神经网络中。
可选的,多任务神经网络包括特征提取子网络、价值子网络及策略子网络;特征提取子网络分别与价值子网络及策略子网络相连;将当前图像输入多任务神经网络中,输出初始价值增量和初始调整概率信息,包括:
将当前图像输入特征提取子网络,输出特征图;
将特征图分别输入价值子网络和策略子网络,输出初始价值增量和初始调整概率信息。
可选的,设定优化策略为如下任意一种:时间差分策略、动态规划策略及蒙特卡洛树搜索。
可选的,目标调整概率信息包含当前图像中各像素点按照设定方式调整的概率;图像调整模块230,还用于:
获取目标调整概率信息中概率最大值对应的像素点,作为目标像素点;
将目标像素点的像素值按照设定方式进行调整;其中,设定方式包括像素值增加设定值或者减少设定值。
可选的,目标价值增量确定模块240,还用于:
确定第一压缩图像和第二压缩图像间的峰值信噪比PSNR差异信息;
确定第一压缩图像和第二压缩图像间的压缩比差异信息;
对PSNR差异信息和压缩比差异信息进行加权求和,获得目标价值增量。
上述装置可执行本公开前述所有实施例所提供的方法,具备执行上述方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本公开前述所有实施例所提供的方法。
下面参考图5,其示出了适于用来实现本公开实施例的电子设备300的结构示意图。本公开实施例中的电子设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端,或者各种形式的服务器,如独立服务器或者服务器集群。图5示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图5所示,电子设备300可以包括处理装置(例如中央处理器、图形处理器等)301,其可以根据存储在只读存储装置(ROM)302中的程序或者从存储装置305加载到随机访问存储装置(RAM)303中的程序而执行各种适当的动作和处理。在RAM 303中,还存储有电子设备300操作所需的各种程序和数据。处理装置301、ROM 302以及RAM 303通过总线304彼此相连。输入/输出(I/O)接口305也连接至总线304。
通常,以下装置可以连接至I/O接口305:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置306;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置307;包括例如磁带、硬盘等的存储装置308;以及通信装置309。通信装置309可以允许电子设备300与其他设备进行无线或有线通信以交换数据。虽然图5示出了具有各种装置的电子设备300,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行词语的推荐方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置309从网络上被下载和安装,或者从存储装置305被安装,或者从ROM 302被安装。在该计算机程序被处理装置301执行时,执行本公开实施例的方法中限定的上述功能。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
在一些实施方式中,客户端、服务器可以利用诸如HTTP(HyperText TransferProtocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“LAN”),广域网(“WAN”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何当前已知或未来研发的网络。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:对原始图像进行压缩,获得第一压缩图像;获取当前图像的目标调整概率信息;其中,所述当前图像为所述原始图像或者对所述原始图像经过至少一次调整后的图像;基于所述目标调整概率信息对所述当前图像进行调整,并对调整后的图像进行压缩,获取第二压缩图像;确定所述第一压缩图像和所述第二压缩图像的目标价值增量;若所述目标价值增量满足设定条件,则将所述调整后的图像确定为压缩标注图像,以基于所述压缩标注图像对设定图像处理模型进行训练;若所述目标价值增量不满足所述设定条件,则将所述调整后的图像作为新的当前图像,并返回执行获取当前图像的目标调整概率信息的操作,直到所述目标价值增量满足所述设定条件。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括但不限于面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)等等。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
根据本公开实施例的一个或多个实施例,本公开实施例公开了一种压缩标注图像的获取方法,包括:
对原始图像进行压缩,获得第一压缩图像;
获取当前图像的目标调整概率信息;其中,所述当前图像为所述原始图像或者对所述原始图像经过至少一次调整后的图像;
基于所述目标调整概率信息对所述当前图像进行调整,并对调整后的图像进行压缩,获取第二压缩图像;
确定所述第一压缩图像和所述第二压缩图像的目标价值增量;
若所述目标价值增量满足设定条件,则将所述调整后的图像确定为压缩标注图像,以基于所述压缩标注图像对设定图像处理模型进行训练;
若所述目标价值增量不满足所述设定条件,则将所述调整后的图像作为新的当前图像,并返回执行获取当前图像的目标调整概率信息的操作,直到所述目标价值增量满足所述设定条件。
进一步地,获取当前图像的目标调整概率信息,包括:
将所述当前图像输入多任务神经网络中,输出初始价值增量和初始调整概率信息;
基于设定优化策略对所述初始调整概率信息进行优化,获得目标调整概率信息。
进一步地,在确定所述第一压缩图像和所述第二压缩图像的目标价值增量之后,还包括:
确定所述初始价值增量和所述目标价值增量间的第一差异信息;
确定所述初始调整概率信息与所述目标调整概率信息间的第二差异信息;
基于所述第一差异信息和所述第二差异信息确定损失函数;
基于所述损失函数训练所述多任务神经网络。
进一步地,返回执行获取当前图像的目标调整概率信息的操作,包括:
返回执行将所述当前图像输入训练后的设定多任务神经网络中。
进一步地,所述多任务神经网络包括特征提取子网络、价值子网络及策略子网络;所述特征提取子网络分别与所述价值子网络及策略子网络相连;将所述当前图像输入多任务神经网络中,输出初始价值增量和初始调整概率信息,包括:
将所述当前图像输入所述特征提取子网络,输出特征图;
将所述特征图分别输入所述价值子网络和所述策略子网络,输出初始价值增量和初始调整概率信息。
进一步地,所述设定优化策略为如下任意一种:时间差分策略、动态规划策略及蒙特卡洛树搜索。
进一步地,所述目标调整概率信息包含所述当前图像中各像素点按照设定方式调整的概率;基于所述目标调整概率信息对所述当前图像进行调整,包括:
获取目标调整概率信息中概率最大值对应的像素点,作为目标像素点;
将所述目标像素点的像素值按照所述设定方式进行调整;其中,所述设定方式包括像素值增加设定值或者减少所述设定值。
进一步地,确定所述第一压缩图像和所述第二压缩图像的目标价值增量,包括:
确定所述第一压缩图像和所述第二压缩图像间的峰值信噪比PSNR差异信息;
确定所述第一压缩图像和所述第二压缩图像间的压缩比差异信息;
对所述PSNR差异信息和所述压缩比差异信息进行加权求和,获得目标价值增量。
注意,上述仅为本公开的较佳实施例及所运用技术原理。本领域技术人员会理解,本公开不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本公开的保护范围。因此,虽然通过以上实施例对本公开进行了较为详细的说明,但是本公开不仅仅限于以上实施例,在不脱离本公开构思的情况下,还可以包括更多其他等效实施例,而本公开的范围由所附的权利要求范围决定。
Claims (11)
1.一种压缩标注图像的获取方法,其特征在于,包括:
对原始图像进行压缩,获得第一压缩图像;
获取当前图像的目标调整概率信息;其中,所述当前图像为所述原始图像或者对所述原始图像经过至少一次调整后的图像;
基于所述目标调整概率信息对所述当前图像进行调整,并对调整后的图像进行压缩,获取第二压缩图像;
确定所述第一压缩图像和所述第二压缩图像的目标价值增量;
若所述目标价值增量满足设定条件,则将所述调整后的图像确定为压缩标注图像,以基于所述压缩标注图像对设定图像处理模型进行训练;
若所述目标价值增量不满足所述设定条件,则将所述调整后的图像作为新的当前图像,并返回执行获取当前图像的目标调整概率信息的操作,直到所述目标价值增量满足所述设定条件。
2.根据权利要求1所述的方法,其特征在于,获取当前图像的目标调整概率信息,包括:
将所述当前图像输入多任务神经网络中,输出初始价值增量和初始调整概率信息;
基于设定优化策略对所述初始调整概率信息进行优化,获得目标调整概率信息。
3.根据权利要求2所述的方法,其特征在于,在确定所述第一压缩图像和所述第二压缩图像的目标价值增量之后,还包括:
确定所述初始价值增量和所述目标价值增量间的第一差异信息;
确定所述初始调整概率信息与所述目标调整概率信息间的第二差异信息;
基于所述第一差异信息和所述第二差异信息确定损失函数;
基于所述损失函数训练所述多任务神经网络。
4.根据权利要求3所述的方法,其特征在于,返回执行获取当前图像的目标调整概率信息的操作,包括:
返回执行将所述当前图像输入训练后的设定多任务神经网络中。
5.根据权利要求2所述的方法,其特征在于,所述多任务神经网络包括特征提取子网络、价值子网络及策略子网络;所述特征提取子网络分别与所述价值子网络及策略子网络相连;将所述当前图像输入多任务神经网络中,输出初始价值增量和初始调整概率信息,包括:
将所述当前图像输入所述特征提取子网络,输出特征图;
将所述特征图分别输入所述价值子网络和所述策略子网络,输出初始价值增量和初始调整概率信息。
6.根据权利要求2所述的方法,其特征在于,所述设定优化策略为如下任意一种:时间差分策略、动态规划策略及蒙特卡洛树搜索。
7.根据权利要求1所述的方法,其特征在于,所述目标调整概率信息包含所述当前图像中各像素点按照设定方式调整的概率;基于所述目标调整概率信息对所述当前图像进行调整,包括:
获取目标调整概率信息中概率最大值对应的像素点,作为目标像素点;
将所述目标像素点的像素值按照所述设定方式进行调整;其中,所述设定方式包括像素值增加设定值或者减少所述设定值。
8.根据权利要求1所述的方法,其特征在于,确定所述第一压缩图像和所述第二压缩图像的目标价值增量,包括:
确定所述第一压缩图像和所述第二压缩图像间的峰值信噪比PSNR差异信息;
确定所述第一压缩图像和所述第二压缩图像间的压缩比差异信息;
对所述PSNR差异信息和所述压缩比差异信息进行加权求和,获得目标价值增量。
9.一种压缩标注图像的获取装置,其特征在于,包括:
第一压缩图像获取模块,用于对原始图像进行压缩,获得第一压缩图像;
目标调整概率信息获取模块,用于获取当前图像的目标调整概率信息;其中,所述当前图像为所述原始图像或者对所述原始图像经过至少一次调整后的图像;
图像调整模块,用于基于所述目标调整概率信息对所述当前图像进行调整,并对调整后的图像进行压缩,获取第二压缩图像;
目标价值增量确定模块,用于确定所述第一压缩图像和所述第二压缩图像的目标价值增量;
压缩标注图像确定模块,用于若所述目标价值增量满足设定条件,则将所述调整后的图像确定为压缩标注图像,以基于所述压缩标注图像对设定图像处理模型进行训练;
返回执行模块,用于若所述目标价值增量不满足所述设定条件,则将所述调整后的图像作为新的当前图像,并返回执行获取当前图像的目标调整概率信息的操作,直到所述目标价值增量满足所述设定条件。
10.一种电子设备,其特征在于,所述电子设备包括:
一个或多个处理装置;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理装置执行,使得所述一个或多个处理装置实现如权利要求1-8中任一所述的压缩标注图像的获取方法。
11.一种计算机可读介质,其上存储有计算机程序,其特征在于,该程序被处理装置执行时实现如权利要求1-8中任一所述的压缩标注图像的获取方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210368901.0A CN116934878A (zh) | 2022-04-08 | 2022-04-08 | 压缩标注图像的获取方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210368901.0A CN116934878A (zh) | 2022-04-08 | 2022-04-08 | 压缩标注图像的获取方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116934878A true CN116934878A (zh) | 2023-10-24 |
Family
ID=88379365
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210368901.0A Pending CN116934878A (zh) | 2022-04-08 | 2022-04-08 | 压缩标注图像的获取方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116934878A (zh) |
-
2022
- 2022-04-08 CN CN202210368901.0A patent/CN116934878A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110413812B (zh) | 神经网络模型的训练方法、装置、电子设备及存储介质 | |
CN110189246B (zh) | 图像风格化生成方法、装置及电子设备 | |
CN110826567B (zh) | 光学字符识别方法、装置、设备及存储介质 | |
CN111399956A (zh) | 应用于显示设备的内容展示方法、装置和电子设备 | |
CN113177888A (zh) | 超分修复网络模型生成方法、图像超分修复方法及装置 | |
CN110765354A (zh) | 信息的推送方法、装置、电子设备及存储介质 | |
CN113327599B (zh) | 语音识别方法、装置、介质及电子设备 | |
CN113449070A (zh) | 多模态数据检索方法、装置、介质及电子设备 | |
CN113038176B (zh) | 视频抽帧方法、装置和电子设备 | |
CN114692085A (zh) | 特征提取方法、装置、存储介质及电子设备 | |
CN111915689B (zh) | 用于生成目标函数的方法、装置、电子设备和计算机可读介质 | |
CN111783731B (zh) | 用于提取视频特征的方法和装置 | |
CN111858381B (zh) | 应用程序容错能力测试方法、电子设备及介质 | |
CN111402159B (zh) | 图像处理方法、装置、电子设备及计算机可读介质 | |
CN111680754B (zh) | 图像分类方法、装置、电子设备及计算机可读存储介质 | |
CN116934878A (zh) | 压缩标注图像的获取方法、装置、设备及存储介质 | |
CN111737575B (zh) | 内容分发方法、装置、可读介质及电子设备 | |
CN114495081A (zh) | 文本识别的方法、装置、可读介质和电子设备 | |
CN113905177A (zh) | 视频生成方法、装置、设备及存储介质 | |
CN110209851B (zh) | 模型训练方法、装置、电子设备及存储介质 | |
CN112488947A (zh) | 模型训练和图像处理方法、装置、设备和计算机可读介质 | |
CN112418233A (zh) | 图像处理方法、装置、可读介质及电子设备 | |
CN116958282A (zh) | 图像压缩方法、装置、设备及存储介质 | |
CN111402133A (zh) | 图像处理方法、装置、电子设备及计算机可读介质 | |
CN116828180B (zh) | 视频编码方法、装置、电子设备和计算机可读介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |