CN101842811A - 用于预测经过通过缩放以及质量控制参数的改变而转换的图像的文件大小的系统和方法 - Google Patents
用于预测经过通过缩放以及质量控制参数的改变而转换的图像的文件大小的系统和方法 Download PDFInfo
- Publication number
- CN101842811A CN101842811A CN200780101390A CN200780101390A CN101842811A CN 101842811 A CN101842811 A CN 101842811A CN 200780101390 A CN200780101390 A CN 200780101390A CN 200780101390 A CN200780101390 A CN 200780101390A CN 101842811 A CN101842811 A CN 101842811A
- Authority
- CN
- China
- Prior art keywords
- image
- file size
- prediction
- described image
- quality
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 230000008859 change Effects 0.000 title claims abstract description 23
- 230000007704 transition Effects 0.000 claims abstract description 76
- 238000004364 calculation method Methods 0.000 claims abstract description 28
- 230000006835 compression Effects 0.000 claims description 7
- 238000007906 compression Methods 0.000 claims description 7
- 238000005070 sampling Methods 0.000 claims description 6
- 238000006243 chemical reaction Methods 0.000 abstract description 25
- 230000006870 function Effects 0.000 description 22
- 238000012549 training Methods 0.000 description 18
- 238000011002 quantification Methods 0.000 description 17
- 238000013139 quantization Methods 0.000 description 12
- 238000012360 testing method Methods 0.000 description 8
- 230000003044 adaptive effect Effects 0.000 description 6
- 238000011160 research Methods 0.000 description 6
- 230000009467 reduction Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000009826 distribution Methods 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 230000006978 adaptation Effects 0.000 description 3
- 230000007547 defect Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 239000003638 chemical reducing agent Substances 0.000 description 2
- 239000003086 colorant Substances 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000010790 dilution Methods 0.000 description 2
- 239000012895 dilution Substances 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000003252 repetitive effect Effects 0.000 description 2
- 238000005549 size reduction Methods 0.000 description 2
- 101001126234 Homo sapiens Phospholipid phosphatase 3 Proteins 0.000 description 1
- 102100030450 Phospholipid phosphatase 3 Human genes 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 238000005315 distribution function Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4092—Image resolution transcoding, e.g. by using client-server architectures
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/149—Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/40—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/48—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using compressed domain processing techniques other than decoding, e.g. modification of transform coefficients, variable length coding [VLC] data or run-length data
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/59—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Analysis (AREA)
- Algebra (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Editing Of Facsimile Originals (AREA)
- Image Processing (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
Abstract
一种系统和方法,用于预测经过通过缩放以及至少一个质量控制参数的改变而转换的图像的文件大小,其中输入端接收(a)在转换之前的图像的文件大小,(b)在转换之前的关于所述图像的至少一个质量控制参数的信息,(c)在转换期间的关于应用于图像的至少一个质量控制参数的信息,和(d)在转换期间应用于图像的缩放因子。基于关于质量控制参数和缩放因子的接收信息计算相对文件大小预测。最后,根据所述转换之前的图像的文件大小和计算的相对文件大小预测来计算所述转换之后的图像的文件大小。
Description
技术领域
概括地说,本发明涉及图像转码。更具体地,本发明关于一种系统和方法,用于预测经过通过缩放以及质量控制参数的改变而转换的图像的文件大小。
背景技术
如今,移动终端、电子设备、通信和多媒体应用的异构特征使得多媒体转码不可避免。例如,在新兴的多媒体消息服务(MMS)中,服务器端适配是必要的,以在目的移动终端不能够处理在其当前格式下的接收媒体时确保互通性。图像相关的互通性问题主要源自过高的分辨率或文件大小。由此,图像转码操作通常涉及图像缩放和文件大小的缩减。
尽管缩减图像的分辨率是已知的和确定性的问题,但是为了满足给定目标而有效缩减图像的压缩文件大小仍旧是一个挑战。例如,在有损耗的JPEG(联合图像专家组)格式中,用户典型地控制质量因子(QF),其影响量化处理并因此影响压缩文件大小。当然,更高的QF导致更好的图像质量和更大的文件尺寸。然而,由于在建立QF和压缩文件大小之间的关系时必须还要考虑其他图像属性,所以在QF和压缩文件大小之间仍旧缺乏精确的关系。
用于图像的文件大小缩减的一个简单的转码方法可包括在可接受的容限内解码图像,并随后用不同QF反复地重新编码图像,直到满足给定目标大小。但是在功能上,这个方法在计算方面效率非常低,因此对于大量图像转发服务器来说是不可接受的。
多个研究已经致力于量化和文件大小之间的关系、或比特率。但是这些研究提供了有趣的结果,他们难以在如下提出的环境中实现:预测通过经过缩放以及QF值的改变而转换的JPEG图像文件大小,因为许多假设不满足。例如,大部分研究开始于原始、非人造的图像。同样,这些研究中的某些是在MPEG视频编码的环境中进行的,其使用比JPEG更简单的量化方案。更重要地,作为真实适配策略,这些研究忽略了图像的缩放。以下将讨论与提出的环境的这些区别的影响。
此外,提出有趣的方法来解决JPEG大小适配的特定问题(见例如于2001年5月15日授权给Ratnakar等的美国专利6,233,359B1,和J.Ridge的文章“Efficient transform-domain size and resolution reduction ofimages”,信号处理:图像通信,18(8):621-639,2003年9月)。如J.Ridge的文件所述,美国专利6,233,359 B1的方法解决了比用户体验更高的复杂度,同样这个方法倾向于降低文件大小,从而呈现出两个主要缺点。尽管J.Ridge的方法提供了比美国专利6,233,359 B1更好的结果,但是这两个方法仍旧具有主要缺陷或限制,特别地,他们并没有将缩放看作文件大小缩减策略,从而需要进一步致力于和改进现有方法。
例如,现有算法首先需要收集某些图像统计。由此,不仅处理的复杂度增加,而且需要图像压缩工具的某种程度的重新工程化,而JPEG编码器/解码器软件必须成为专用的转码器。
其次,那些算法将图像的分辨率看作固定的,或在先前阶段独立改变,并且唯一地关注于文件大小缩减。然而,质量控制参数和缩放的改变的影响的研究看起来是必要的。当然,这将是有用的,以选择将满足终端限制的缩放和QF值的最佳组合。具体地,通常更佳的是与低质量的高分量图像相比具有更低分辨率的、高质量图像。
发明内容
更具体地,根据本发明,提供一种方法,用于预测经过通过缩放以及至少一个质量控制参数的改变而转换的图像的文件大小,包括:接收(a)在所述图像转换之前的图像的文件大小,(b)在所述图像转换之前的关于所述图像的至少一个质量控制参数的信息,(c)在所述图像转换期间的关于应用于图像的至少一个质量控制参数的信息,和(d)在所述图像转换期间应用于图像的缩放因子;基于关于质量控制参数和缩放因子的接收信息计算相对文件大小预测;以及计算在所述图像转换之后的图像的文件大小预测,其中根据所述图像转换之前的图像的文件大小和计算的相对文件大小预测来计算所述图像转换之后的图像的文件大小预测。
本发明还涉及一种系统,用于预测经过通过缩放以及至少一个质量控制参数的改变而转换的图像的文件大小,包括:输入端,用于接收(a)在所述图像转换之前的图像的文件大小,(b)在所述图像转换之前的关于所述图像的至少一个质量控制参数的信息,(c)在所述图像转换期间的关于应用于图像的至少一个质量控制参数的信息,和(d)在所述图像转换期间应用于图像的缩放因子;基于关于质量控制参数和缩放因子的接收信息计算相对文件大小预测;以及在计算所述图像转换之后的图像的文件大小预测,其中根据所述图像转换之前的图像的文件大小和计算的相对文件大小预测来计算所述图像转换之后的图像的文件大小预测。
在阅读仅参照附图通过实例给出的一下本发明的示例性实施例的非限制性描述,本发明的以上和其他目的、优点和特定将变得更加清楚。
附图说明
在附图中:
图1是根据本发明的第一非限制性示例性实施例的第一系统的示意性框图,其用于预测经过缩放以及质量控制参数的改变而转换的图像的文件大小;
图2是示出根据本发明的第一非限制性示例性实施例的第一方法(相应于图1的第一系统)的训练阶段的流程图,其用于预测经过缩放以及质量控制参数的改变而转换的图像的文件大小;
图3是根据本发明的第二非限制性示例性实施例的第二系统的示意性框图,其用于预测经过缩放以及质量控制参数的改变而转换的图像的文件大小;
图4是示出根据本发明的第二非限制性示例性实施例的第二方法(相应于图3的第二系统)的训练阶段的流程图,其用于预测经过缩放以及质量控制参数的改变而转换的图像的文件大小;
图6是成簇的实例的视图;以及
图7a和7b是示出根据文件大小(字节)的0的百分比的视图。
具体实施方式
概括地说,根据本发明的非限制性示例性实施例的系统和方法将预测图像的文件大小,所述图像已经被压缩并经过缩放以及质量控制参数的改变而转换。
同样,尽管根据非限制性示例性实施例的系统和方法将预测经过缩放以及至少一个质量控制参数(在这种情况下为QF(质量因子))的改变而转换的JPEG图像的文件大小,但是应理解,相同的构思可应用于例如GIF(图形交换格式)的其他类型格式以及具有例如颜色数量、颜色深度、颜色分量采样结构(4:4:4,4:2:2,4:2:0等)、水平和垂直分辨率、子采样因子等的其他质量控制参数的其他图像格式。为了清楚和有助于保持说明简单,主要通过一个质量控制参数来说明本发明,但是可扩展到许多质量控制参数;以下将更详细地说明。
根据非限制性示例性实施例的系统和方法还将选择满足一定大小限制的缩放和QF的适当组合。此外,为了最小化处理复杂度,用于文件大小的预测的系统(以下称为文件大小的预测器)使用可从图像容易利用和易于访问的值。
然而,在进一步定义文件大小的预测器之前,将描述训练和测试图像库(corpus)的概念。
为了测试文件大小的预测器和/或文件大小预测方法,使用图像的库。可用的库由范本-在我们的实例中为图像-的集合构成,这代表要研究的集群。目前,典型的JPEG数据库没有普遍可用;因此,用户必须建立他/她自己的数据库或图像库。例如,可从因特网收集图像以形成图像库。当然,抓取器(crawler)可容易地跟踪从确保最新的流行网页开始的链接,并随后可抓取碰到的任何图像媒体。此外,可通过使用唯一标识符(例如由应用于整个文件的例如MD5(消息摘要5)的强哈希函数重命名文件来确保图像库中的图像的匿名化和唯一性。此外,可安全地忽略冲突。例如MD5的强哈希函数从文档计算数字签名,其可随后被可靠地用于识别已经被计算的文档。像MD5的超强哈希函数极度不可能对于两个不同文档生成相同的数字签名,由此能够实现检测同一文件的非常可靠的方法。
此外,将图像库分成两个随机的分离集:图像的训练集和图像的测试集。训练集包含用于优化预测模型和方法的图像,而测试集用于实际测试所优化的预测模型和方法。由于所述库呈现非常有限数目个范本,所以通过对于质量控制参数和缩放应用大量可能的转换来生成新范本,从而可构成具有大量和可用范本集群的模型。
现在将描述目前使用的图像文件大小预测系统和方法,例如i)多项式预测和ii)ρ域预测系统和方法。
i)多项式预测
多项式预测使用低阶多项式对预测进行公式化。如果对一维数据计算多项式拟合是一个简单的任务,那么对拟合增加多个变量将指数地增加需要计算的点数。当然,如果将Lin等的技术(文章“Rate control usingspline-interpolated R-D characteristics”,子标题,VCIP’96,第111-122页,1996年)概括为使用n个变量中的d阶多项式,则需要解(d+1)n个未知的(d+1)n个等式。对于这些(d+1)n个等式中的每个,需要估计曲线上的点。通过Lin等提出的方法,这意味着需要执行每个点的部分转码,从而导致无法接受的计算量。
此外,不清楚多项式的最佳阶d是什么(或甚至根本就是多项式)以及在预测中应该包括什么样的n个变量。至少应使用缩放和预期的输出质量因子QFout来对预测公式化;在图像本身中输入质量因子QFin是隐含的,因此当计算了(d+1)n个点时参与计算。因为这个过程在计算上是禁止的,所以决定不再深度研究这个行为。
应注意,QP(量化参数)和QF(质量因子)是反向相关的。高QP意味着更积极的量化,而高QF意味着更高的质量,因此意味着更不积极的量化。在例如用于标准H.263的方案中,QP与量化直接相关。然而,在JPEG中,QF通过两个连续步骤与量化相关:在第一步骤,使用分段转移函数;以及在第二步骤,使用量化矩阵。量化矩阵缩放DCT(离散余弦变换)系数,然后编码。应指出,在本说明书中,QF指的是JPEG质量因子,是独立JPEG组(IJG)可理解的。
ii)ρ域预测
在ρ域预测中,基于从量化得到的0的数目的估计来计算比特率的精确预测。
在ρ域预测中,假设i)图像没有被调整大小,ii)目标比特率很低,和iii)原始图像对于压缩器可用。在标准H.263的环境下,前2个假设i)和ii)可以有效。然而,假设在图像适配和转换的环境下原始图像对于压缩器可用(假设iii)不有效;如上所述,原始和初始图像通常对于转换引擎不可用。
ρ域预测使用标准H.263的更粗量化。JPEG使用可定制的量化矩阵,而标准H.263使用更简单的统一量化。量化矩阵所带来的额外复杂度使得ρ域预测的模型更加不易于JPEG适配。
图7a和7b示出根据ρ域预测的预测器在很低QF的区域内是线性。更具体地,0的数目随着比特率线性改变,但是仅在很低比特率处。然而,如果考虑大范围的比特率,则失去线性,如图7b所示。此外,对于使用JPEG的静态图像编码,很低的QF是不可接受的,因为这样将导致伪影和较差的感知图像质量。当最大化用户体验时,应该在满足文件大小限制的同时考虑最高可能的QF。
此外,ρ域预测在计算方面开销很大,并且假定不同范围的量化参数值。
不仅多项式预测和ρ域预测相当复杂,而且他们还呈现缺陷。第一,多项式预测和ρ域预测做出通常不抑制转码的假设,例如使用原始图像。第二,多项式预测和ρ域预测省略了用于缩减文件大小的缩放操作。因此,他们的估计不导致缩放和QF缩减的联合估计。ρ域预测假设,当发生缩减时,其发生在转码的文件大小预测之前,这不允许用户基于缩放和质量因子对于文件大小的适配策略进行公式化。理论上,多项式预测也可包括缩放,但是由于需要转码的数目随着使用的变量的数目指数增长,所以这个操作的计算成本较高。省略作为适配策略的缩放是主要缺陷,因为这样的目的是为了很好地最大化用户体验,将图像缩小并且通过更高的QF编码,而并非仅通过更低QF来重新压缩。因此,文件大小的预测器应该同样能够考虑缩放,以及QF改变。
此外,除了图像的宽度、高度、缩放和QF之外,还关注于获得不使用图像数据的文件大小的预测。此外,文件大小的预测器应该能够使用关于其他图像的信息,以对于与当前图像相关的预测公式化。因此,将有利地使用非参数的方法。
非参数的模型在内部参数的数目方面与参数的模型不同,前者通常具有更大的内部参数的数目,并且这些参数被松散地组织以实现结构的发现。相反,参数化模型使用固定的和少量参数,通过先前假设为每个分配非常特定的角色。
1.第一转换的图像文件大小的预测器
概括地说,根据本发明的第一非限制性示例性实施例的文件大小的预测器通过考虑图像的压缩文件大小来预测在与某个预测因子相乘的图像的转换之前经过缩放以及质量因子的改变而转换的图像的文件大小,以下称为相对文件大小的预测。
现在转到图1,将描述根据本发明的第一非限制性示例性实施例的文件大小的预测器10。文件大小的预测器10通常用在转码引擎(未示出)中。然而,将文件大小的预测器10用在除了转换引擎之外的设备中(例如编码器和解码器等中)也在本发明的范围内。
在转码中,典型地使用例如媒体类型、分辨率等媒体特征来确定是否需要适配。通常可在不解压缩经过压缩后的媒体的情况下获得那些参数。例如,扫描经过压缩后的媒体的文件头通常足够。在文件大小的预测器中,基于需要经过压缩的图像的解压缩的度量或任意像素级的计算使用参数在计算方面开销很大,并且需要几乎与实际转码相同的处理时间和功率。因此,避免这种类型的参数。
将特征数据用作文件大小的预测器10的输入。例如,在JPEG图像的情况下,特征数据可以是分辨率,例如图像的宽度和高度、质量因子QF、子采样方法、或从图像容易可用的任意其他信息。
在图1中所示的本发明的第一非限制性示例性实施例中,作为输入11像文件大小的预测器10提供i)在该图像的转换之前的图像的文件大小S(I),ii)在转换之前的图像的原始质量因子QFin,iii)在转换期间应用于图像的预期输出质量因子QFout,和iv)在转换期间应用于图像的缩放因子(变焦因子)z,其中0<z≤1。
参照图1,文件大小的预测器10包括量化器14,用于量化原始质量因子QFin,输出质量因子QFout,和缩放因子z,以获得量化的质量因子和量化的缩放因子对于本领域普通技术人员来说,量化器是已知的,因此在本说明书中将不再进一步描述。
文件大小的预测器10还包括基于阵列的、相对文件大小预测计算器16,用于基于预测阵列(以下将描述)预计算相对文件大小预测。这生成预测函数其给出图像的相对压缩文件大小预测/对其应用预期的输出质量因子QFout和缩放因子(变焦因子)z。
最后,文件大小的预测器10包括转换的图像文件大小预测计算器18,向其提供在图像和预测函数的转换之前的图像的压缩文件大小S(I),以计算在转换(图像J)之后的图像的文件大小预测19如下:
函数s(J,QFout,z)代表转换图像J的文件大小的精确函数,具有预期的QFout和缩放z。该函数由以下给出:
其中S(J)是转换图像J的压缩文件大小,T(J,QFout,z)是应用缩放z和质量因子的改变QFout之后返回压缩的、转换图像J的函数。表达式S(T())是涉及使用预期的输出质量因子QFout和缩放因子z的转换图像J的压缩文件大小函数。
然而,由于函数在计算方面开销大,可使用该函数预计算相对文件大小预测的阵列,以缓解计算复杂度。因此,相对文件大小预测计算器16可通过预计算的文件大小预测的阵列M来使用,其索引是在图像转换之前的图像的量化的质量因子在图像转换期间应用的预期质量因子和在图像转换期间应用的缩放因子通过波浪符(~)来指示量化的值。
适当的量化将防止上下文稀释,同时允许有效地检索阵列M。可通过传统量化器(未示出)来量化所述值。由于量化器对于本领域普通基数人员是已知的,所以在本说明书中将不再进一步描述。
如上所示,基于阵列的相对大小预测计算器16的输入包括在图像的转换之前的量化的质量因子在图像转换期间的预期量化的输出质量因子和在图像转换期间量化的缩放因子以及基于阵列的相对大小预测计算器16包括相对文件大小预测阵列计算器(未示出),向其提供这些输入以预计算相对文件大小预测的阵列。通过以下等式给出阵列M的项:
其中QFout(J)、z(J)是分别返回在转换期间使用的QF、或QFout和缩放因子z的函数。函数s(J,QFout(J),z(J))(等式(5))返回当对于转换的图像J应用给定转换时所观察的相对文件大小改变。集代表所有图像的基数的集,所述所有图像具有落入相应量化单元中的质量因子和缩放因子。量化单元是量化到相同给定值的所有值的集。通过单元表示分别量化到的QFin、QFout和z所有值的集。这里,是具有以下内容的图像集:对于QFin的值包含具有量化到的相同原始量化因子的图像集合的所有图像,量化到的输出量化因子QFout的值,以及量化到的缩放因子z的值(这是三个集的交集)。如果使用更多的质量控制参数(超过QF),则可以按参数特定的适当方式也对他们进行量化,并将其用作预测阵列的更多维数。函数s()是在转换图像J时所观察的精确相对文件大小预测。
表1:相对文件大小预测
文件大小的预测器10的基于阵列的相对大小预测计算器18响应于相对文件大小预测和在图像转换之前的图像的文件大小S(I),计算在转换(图像J)之后的图像的预测文件大小19,使用转换的图像文件大小预测计算器18如下:
应指出,函数S(I)嵌入与在计算方面其他系统和方法明显以更大成本提取的图像I相关的某些信息。S(I)可看作保持与图像的特征相关的信息并且将其注入转换的图像文件大小预测计算器18的图像I的哈希函数。
根据第一非限制性示例性实施例的文件大小的预测器10是非参数预测器。
2.第一阵列计算器和训练方法
现在转到图2,描述根据第一方法的基于阵列的相对文件大小预测计算器20的训练阶段。可对于相对文件大小的预测器10实现这个方法。
在操作21,获取图像库。对于这个获取的方式超出本发明的范围,但是非限制性示例性实施例是web抓取器或进行现有图像的可靠检查的任意其他方式。在运行中由转码器获得的图像也可用于训练。
在操作22,使用库中的每个图像生成任意预期数目的范本。在子操作23,根据从库生成的图像生成大量图像,对其应用质量控制参数改变和缩放,其方式典型地兼容于在文件大小的预测器10中使用的量化方案。通过每个范本存储其质量因子QFin、质量因子QFout和缩放因子z。
在子操作24,将每个生成的范本增加到还包括来自库的原始图像的范本列表。重复操作22,只要在库中存在保留未处理的图像。
在操作26,计算阵列M。现在,处理在操作22中生成的每个范本以计算阵列M。
在操作26之后,阵列M包含对于所有图像的相对文件大小预测。根据等式(5):
图2的基于阵列的相对文件大小预测计算器20是时间自适应的。例如,为了更新预测,可以在等式(2)中增加新范本,即仅通过子操作27和28。还可通过从预测集去除最旧范本来保持趋势自适应。幸好,在这样操作时,不需要图像的存储;仅需要存储转换值(质量因子和缩放因子)、时间戳、和在图像转换之后的相对文件大小。
应注意,在图2的基于阵列的相对文件大小预测计算器20中的更新时间是基数O(1)。通过O(1),表示更新基于阵列的相对文件大小预测计算器20所需的操作数目是恒定的,即,不依赖于在训练集中图像的数目。
3.数值实例的第一集
在仿真中使用的库包含70300个JPEG文件。库不受破坏文件约束,并且去除例如EXIF标签的所有元数据。EXIF是对于许多图像格式的共同扩展,包括JPEG,特别在从数码相机生成时其保存与图片或图像相关的附加信息。EXIF扩展用于存储数据,例如曝光细节、颜色平衡、相机品牌名称、和其他数字摄影信息。对于库中的每个原始范本(图像),使用不同的质量因子QFout和缩放因子z生成100(一百)个范本。在训练集和测试集之间的划分为约80/20。
表2:预期相对文件大小预测误差
表3
应注意,误差的分布如预期地进一步远离100%的缩放扩散。
绘图示出通过例如53的虚线指示四分位(例如52的矩形)和5%/95%限制。从图5可以看出,分布不是很广泛的分布,从而例如在预测误差上允许分摊界限。
在图5中可绘制远离四分位上方或下方的某些点。这些点是离群值(outlier)。某些离群值是其文件主要包括开销的图像。当图像具有很低分辨率时,QF和缩放改变对于总文件大小映像很小,因为相比于文件格式开销,例如标头、标记等,压缩的数据已经很小。然而,当忽略图像的原始比例时,则由于由等式(1)给出的最小均方估计量对于离群值敏感,所以文件大小的预测器可出现故障。因此,应作为预测参数包括原始分辨率。
4.第二转换的图像文件大小的预测器
现在将描述根据本发明的第二非限制性示例性实施例的文件大小的预测器30。文件大小的预测器30考虑图像的原始分辨率,因此存在离群值。
现在转到图3,根据本发明的第二非限制性示例性实施例的文件大小的预测器30包括参数量化器、和基于簇的相对文件大小预测计算器34,以生成相对文件大小预测35。
向文件大小的预测器30提供输入31,包括原始文件大小S(I)、原始质量因子QF(I)(指示为QFin)、在图像转换之前的图像I的宽度W(I)和高度H(I)、以及在图像转换之后的预期质量因子QFout和预期缩放因子(变焦因子)z。预测器30的输出37生成在应用了缩放因子z和质量因子QFout的图像变换之后的图像的文件大小预测
在量化器32中还发生质心确定,其根据图像I的宽度W(I)、高度H(I)和原始质量因子QFin生成用于图像I的阵列以用作向基于簇的相对文件大小预测计算器34的输入。如果使用更多的质量控制参数,则他们可附加在的向量xI(以下将定义)中。
其中函数是相对大小预测35。
如上所述,在例如存在离群值的情况下,图像的小分辨率破坏了上述文件大小的预测器10。为了克服这个问题,执行将图像空间分成区域的操作,其中将类似分辨率的区域分在一起。为此,使用簇将从图像库生成的范本分成类。此外,成簇的使用能够对于每个类优化最小均方估计量,由此进一步最小化预测误差。
应注意,成簇是非监督的学习技术,其划分在给定数目个分离子集(称为类)中的数据,从而在每个子集中的数据在所选度量下最大地类似。对于每个子集,计算代表值或原形(prototype)。一般地,原形是子集的质心。因此,成簇与概率分布函数优化的向量量化同义,其中量化级别是类的质心。
现在转到图4,簇计算器44将例如xI=(W(I),H(I),αQF(I))的向量关联至训练集T中的每个图像,其中α是使得质量因子维数达到与宽度和高度相同的量级的缩放常数。W(I)、H(I)、和QF(I)分别是图像I的宽度、高度和QF。如果我们使用更多质量控制参数,则可将他们附加在向量xI中,并且可通过第二算法来考虑。
在成簇之前选择类的数目k。本领域普通技术人员知道如何选择这个类的数目k。例如,参数k足够大,以减少误差,并且足够小,以避免上下文稀释。
仍参照图4,库41的获取通过与图2中的操作21相同的方式进行。
新范本42的生成通过与图2中的操作22相同的方式进行,除了通过附加信息QFout和z代替包括创建向量xI=(W(I),H(I),αQF(I))的子操作43。
因此,操作42创建簇计算器44所需的范本向量,以计算图像的训练集T到类的数目k的划分C。
此外,以最佳划分C*将最小化任意向量xI(其中I∈T)及其分配的质心之间的预期平方距离。最佳划分C*有以下给出:
图6中示出成簇的实例。在图6中,所有图像具有QF=80,从而可二维地视觉化计算的文件大小预测。然而,真实的划分跨越宽度、高度和量化的QF三个(3)维度。
其代表类Ci中所有向量的原形。
计算最佳划分C*的复杂度使其在计算上不可行。然而,可使用k平均算法以高精度对其进行近似计算,如Leon Bottou和Yoshua Bengio的题为“Convergence properties of the K-means algorithms”的文章,在G.Tesauro、D.Touretzky和T.Leen编辑的Advances in Neural InformationProcessing Systems,第7卷,第585-592页,MIT出版社,1995年。类似于Newton算法,k平均算法具有超线性收敛性,在实践中这意味着为了良好近似需要相对少量的反复。K平均的细节和属性相信对于本领域普通技术人员是已知的,为此在本说明书中将不再进一步描述。
最后,文件大小的预测器30的基于簇的相对文件大小预测计算器(图3)生成相对文件大小预测35,并且根据以下等式在计算器38中计算文件大小预测37:
应注意,在计算方面,预测器30的成本受限于计算最近质心的成本,后者可使用充分数据结构有效计算(细节见Jean-Daniel Boissonnat和Mariette Yvinec的“Algorithmic Geometry”,剑桥大学出版社,1998年)。一旦被定位,则可在恒定实践搜索阵列以生成的值。
5.第二阵列计算器和训练方法
再参照图4,现在将描述根据第二非限制性示例性实施例的训练相对大小预测阵列计算器40的第二方法。
可对于大小的预测器30来实现第二训练方法。
在操作42,使用库中的每个图像来生成任意预期数目个范本。在操作42,根据从库绘画的图像生成大量图像,对其应用质量控制参数改变和缩放,其方式典型地兼容于在基于簇的相对文件大小预测计算器34中使用的量化方案。通过每个范本J存储其向量xJ=(W(J),H(J),αQF(J)),以及QFout和z。
在子操作43,将每个生成的范本增加到还包括来自库的原始图像的范本列表。重复操作22,只要在库中存在保留未处理的图像。
在库计算器44,指定类或簇的数目k。
在操作46,填入与质心相关的阵列。
在操作47,对于每个范本J,使用在图像转换之前的质量因子QFin(J)、宽度H(J)和高度H(J),以找到相应质心及其相关的预测阵列。使用等式(11)计算最接近图像I的质心。
6.数值实例的第二集
在试验中,选择k使得k=200。经验地发现α≈1000。
表4:预期相对文件大小预测误差
通过文件大小的预测器10,在周围聚集文件大小的预测器30的最小误差,其中并且通过表4的一部分给出最大预测误差,其中和缩放因子在表4的左上方最不相同。类似于表2,表4的灰色部分相应于10%或更小的预期绝对误差的区域。然而,当比较表2和4的两个(2)灰色部分时,表4的预期绝对误差明显小于表2,这是因为簇的使用。例如,在最困难的转码设置(即,其中和)中,从表2到表4,误差从112.93%下降到24.82%。
同样,尽管根据非限制性示例性实施例的系统和方法预测经过缩放以及质量控制参数(在这种情况下为QF(质量因子))的改变而转换的JPEG图像的文件大小,但是应理解,相同的构思可应用于例如GIF(图形交换格式)的其他类型格式以及例如颜色数量、颜色深度、颜色分量采样结构等的其他质量控制参数、以及例如颜色增强和裁剪的转换。
尽管通过非限制性示例性实施例在以上说明书中描述了本发明,但是在不脱离本发明的精神和特征的情况下,可在所附权利要求的范围内修改这些示例性实施例。
Claims (22)
1.一种系统,用于预测经过通过缩放以及至少一个质量控制参数的改变而转换的图像的文件大小,包括:
输入端,用于接收(a)在所述图像转换之前的图像的文件大小,(b)在所述图像转换之前的关于所述图像的至少一个质量控制参数的信息,(c)在所述图像转换期间的关于应用于图像的至少一个质量控制参数的信息,和(d)在所述图像转换期间应用于图像的缩放因子;
基于接收到的关于质量控制参数和缩放因子的信息进行相对的文件大小预测的计算器;以及
在所述图像转换之后进行所述图像的文件大小预测的计算器,其中根据所述图像转换之前的图像的文件大小和计算的相对文件大小预测来计算所述图像转换之后的图像的文件大小预测。
2.如权利要求1所述的系统,其中所述质量控制参数信息包括关于表示所述图像的质量的至少一个参数的信息,并选自以下内容的组,包括:质量因子、颜色数目、颜色深度、颜色分量采样结构、和水平和垂直分辨率。
3.如权利要求1所述的系统,其中在所述图像转换之前的图像的文件大小和所述文件大小预测是压缩的文件大小。
4.如权利要求1所述的系统,其中所述文件大小预测的计算器将所述图像转换之前的图像的文件大小与计算的相对文件大小预测相乘。
6.如权利要求1所述的系统,其中所述相对文件大小预测的计算器包括通过相对文件大小预测阵列计算器预计算的相对文件大小预测阵列,其中由所述相对文件大小预测的计算器使用预计算的相对文件大小预测阵列来计算所述图像转换之后的图像的相对文件大小预测。
7.如权利要求6所述的系统,其中在所述图像转换之前的关于所述图像的至少一个质量控制参数的信息包括在所述图像转换之前的图像的质量因子QFin,在所述图像转换期间的关于应用于图像的至少一个质量控制参数的信息包括在所述图像转换之后的图像的预期质量因子QFout,以及其中预计算的相对文件大小预测的阵列的计算器包括:
使用以下关系预计算的相对文件大小预测阵列的计算器:
9.如权利要求6所述的系统,其中所述相对文件大小预测阵列计算器包括:
簇计算器,用于(a)将表示所述图像的特征的向量关联至图像集的每个图像,和(b)将所述图像集划分成关联至类似向量的图像类;
原形计算器,用于针对每个图像类计算质心,其代表关联至所述类的图像的向量原形;以及
阵列计算器,用于针对每个质心计算相对文件大小预测的阵列,所述阵列具有包括关于至少一个质量控制参数的改变和所述缩放因子的至少二维。
10.如权利要求9所述的系统,其中通过以下关系给出关联至每个图像I的向量:
xI=(W(I),H(I),αQF(I))
其中α是缩放常量,W(I)、H(I)和QF(I)分别是图像I的宽度、高度和质量因子。
11.如权利要求6所述的系统,其中在所述图像转换之后的图像的文件大小预测的计算器使用在所述图像转换之前的图像的文件大小和所述阵列计算器预计算的相对文件大小预测的阵列的项来计算在所述图像转换之后的图像的文件大小预测。
12.一种方法,用于预测经过通过缩放以及至少一个质量控制参数的改变而转换的图像的文件大小,包括:
接收(a)在所述图像转换之前的图像的文件大小,(b)在所述图像转换之前的关于所述图像的至少一个质量控制参数的信息,(c)在所述图像转换期间的关于应用于图像的至少一个质量控制参数的信息,和(d)在所述图像转换期间应用于图像的缩放因子;
基于接收到的关于质量控制参数和缩放因子的信息计算相对文件大小预测;以及
计算在所述图像转换之后的图像的文件大小预测,其中根据所述图像转换之前的图像的文件大小和计算的相对文件大小预测来计算所述图像转换之后的图像的文件大小预测。
13.如权利要求12所述的方法,包括:接收关于表示所述图像的质量的至少一个参数的信息作为质量控制参数信息,并且其选自包括以下内容的组:质量因子、颜色数目、颜色深度、颜色分量采样结构、和水平和垂直分辨率。
14.如权利要求12所述的方法,包括:接收压缩的文件大小作为在所述图像转换之前的图像的文件大小,并计算压缩的文件大小作为在所述图像转换之后的图像的文件大小。
15.如权利要求12所述的方法,其中计算在所述图像转换之后的图像的预测包括:将所述图像转换之前的图像的文件大小与计算的相对文件大小预测相乘。
17.如权利要求12所述的方法,其中计算相对文件大小预测包括:(a)预计算相对文件大小预测阵列,和(b)使用预计算的相对文件大小预测阵列来计算相对文件大小预测。
18.如权利要求17所述的方法,其中在所述图像转换之前的关于所述图像的至少一个质量控制参数的信息包括在所述图像转换之前的图像的质量因子QFin,在所述图像转换期间的关于应用于图像的至少一个质量控制参数的信息包括在所述图像转换之后的图像的预期质量因子QFout,以及其中预计算相对文件大小预测的阵列包括:
使用以下关系计算预计算相对文件大小预测阵列:
20.如权利要求17所述的方法,其中计算所述相对文件大小预测包括:
(a)将表示所述图像的特征的向量关联至图像集的每个图像,和(b)将所述图像集划分成关联至类似向量的图像类;
针对每个图像类计算质心,其代表关联至所述类的图像的向量原形;以及
针对每个质心计算相对文件大小预测的阵列,所述阵列具有包括关于至少一个质量控制参数的改变和所述缩放因子的至少二维。
21.如权利要求20所述的方法,包括:通过使用以下关系计算关联至每个图像的向量:
xI=(W(I),H(I),αQF(I))
其中α是缩放常量,W(I)、H(I)和QF(I)分别是图像I的宽度、高度和质量因子。
22.如权利要求20所述的方法,其中计算在所述图像转换之后的图像的文件大小预测包括:使用在所述图像转换之前的图像的文件大小和预计算的相对文件大小预测的阵列的项。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CA2007/001974 WO2009055896A1 (en) | 2007-11-02 | 2007-11-02 | System and method for predicting the file size of images subject to transformation by scaling and a change of quality-controlling parameters |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101842811A true CN101842811A (zh) | 2010-09-22 |
CN101842811B CN101842811B (zh) | 2012-05-23 |
Family
ID=40590475
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200780101390XA Expired - Fee Related CN101842811B (zh) | 2007-11-02 | 2007-11-02 | 用于预测经过通过缩放以及质量控制参数的改变而转换的图像的文件大小的系统和方法 |
Country Status (8)
Country | Link |
---|---|
US (2) | US8224104B2 (zh) |
EP (1) | EP2210236B1 (zh) |
JP (1) | JP5176175B2 (zh) |
KR (1) | KR101428671B1 (zh) |
CN (1) | CN101842811B (zh) |
CA (1) | CA2706251C (zh) |
IL (1) | IL204727A (zh) |
WO (1) | WO2009055896A1 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102867314A (zh) * | 2011-07-06 | 2013-01-09 | 华晶科技股份有限公司 | 预估影像压缩尺寸的方法 |
CN105474650A (zh) * | 2013-06-19 | 2016-04-06 | 米夏埃尔·凯尔光学通讯有限公司 | 用于确定具有变化的质量对比特率的媒体数据流的质量的概念 |
TWI680437B (zh) * | 2017-04-27 | 2019-12-21 | 大陸商騰訊科技(深圳)有限公司 | 圖片轉碼方法和裝置 |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8300961B2 (en) * | 2008-12-12 | 2012-10-30 | Ecole De Technologie Superieure | Method and system for low complexity transcoding of images with near optimal quality |
JP5875084B2 (ja) * | 2010-04-29 | 2016-03-02 | ビーマル イメージング リミテッドBeamr Imaging Ltd. | 圧縮の程度と圧縮済み画像の品質との間に単調な関係を有する、再圧縮のための装置および方法 |
US8913829B2 (en) * | 2012-06-05 | 2014-12-16 | Tandent Vision Science, Inc. | Automatic processing scale estimation for use in an image process |
US10757425B2 (en) * | 2017-07-24 | 2020-08-25 | United States Postal Service | Image encryption through dynamic compression code words |
US11061626B2 (en) | 2019-05-24 | 2021-07-13 | Kyocera Document Solutions Inc. | Machine learning printer control system including pre-press action predictor |
Family Cites Families (35)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2633118B2 (ja) * | 1991-09-30 | 1997-07-23 | 富士写真フイルム株式会社 | 画像データ圧縮装置およびその方法 |
US6215910B1 (en) * | 1996-03-28 | 2001-04-10 | Microsoft Corporation | Table-based compression with embedded coding |
US6563517B1 (en) * | 1998-10-02 | 2003-05-13 | International Business Machines Corp. | Automatic data quality adjustment to reduce response time in browsing |
US6233359B1 (en) * | 1998-10-29 | 2001-05-15 | Seiko Epson Corporation | File size bounded JPEG transcoder (FSBJT) |
US6421467B1 (en) * | 1999-05-28 | 2002-07-16 | Texas Tech University | Adaptive vector quantization/quantizer |
US6490320B1 (en) * | 2000-02-02 | 2002-12-03 | Mitsubishi Electric Research Laboratories Inc. | Adaptable bitstream video delivery system |
CA2374067C (en) | 2000-03-13 | 2012-09-25 | Sony Corporation | Method and apparatus for generating compact transcoding hints metadata |
US6990146B2 (en) * | 2001-11-16 | 2006-01-24 | Koninklijke Philips Electronics N.V. | Method and system for detecting intra-coded pictures and for extracting intra DCT precision and macroblock-level coding parameters from uncompressed digital video |
US6608924B2 (en) * | 2001-12-05 | 2003-08-19 | New Mexico Technical Research Foundation | Neural network model for compressing/decompressing image/acoustic data files |
US7177356B2 (en) * | 2002-01-11 | 2007-02-13 | Webtv Networks, Inc. | Spatially transcoding a video stream |
US6937759B2 (en) * | 2002-02-28 | 2005-08-30 | Nokia Corporation | Method and device for reducing image by palette modification |
JP3982615B2 (ja) * | 2002-03-11 | 2007-09-26 | 株式会社Kddi研究所 | 符号化動画像データの方式変換装置 |
FR2840495B1 (fr) | 2002-05-29 | 2004-07-30 | Canon Kk | Procede et dispositif de selection d'une methode de transcodage parmi un ensemble de methodes de transcodage |
GB2398976B (en) * | 2003-02-28 | 2006-03-08 | Samsung Electronics Co Ltd | Neural network decoder |
US7142601B2 (en) * | 2003-04-14 | 2006-11-28 | Mitsubishi Electric Research Laboratories, Inc. | Transcoding compressed videos to reducing resolution videos |
US7551785B2 (en) * | 2003-07-03 | 2009-06-23 | Canadian Space Agency | Method and system for compressing a continuous data flow in real-time using cluster successive approximation multi-stage vector quantization (SAMVQ) |
JP4301366B2 (ja) * | 2003-11-27 | 2009-07-22 | 株式会社リコー | 画像形成システム |
US6992686B2 (en) * | 2004-06-14 | 2006-01-31 | Xerox Corporation | System and method for dynamic control of file size |
EP1615447B1 (en) | 2004-07-09 | 2016-03-09 | STMicroelectronics Srl | Method and system for delivery of coded information streams, related network and computer program product therefor |
US7440626B2 (en) * | 2004-12-02 | 2008-10-21 | Mitsubishi Electric Research Laboratories, Inc. | Image transcoding |
FR2880743A1 (fr) * | 2005-01-12 | 2006-07-14 | France Telecom | Dispositif et procedes de codage et de decodage echelonnables de flux de donnees d'images, signal, programme d'ordinateur et module d'adaptation de qualite d'image correspondants |
WO2006085301A2 (en) * | 2005-02-09 | 2006-08-17 | Mobixell Networks | Image adaptation with target size, quality and resolution constraints |
US7724972B2 (en) | 2005-03-01 | 2010-05-25 | Qualcomm Incorporated | Quality metric-biased region-of-interest coding for video telephony |
US7583844B2 (en) * | 2005-03-11 | 2009-09-01 | Nokia Corporation | Method, device, and system for processing of still images in the compressed domain |
WO2006097144A1 (en) | 2005-03-15 | 2006-09-21 | Nero Ag | Apparatus and method for producing a picture data stream and for processing a picture data stream |
EP1862017A4 (en) * | 2005-03-25 | 2011-03-23 | Algolith Inc | DEVICE AND METHOD FOR OBJECTIVELY EVALUATING THE DCT-CODED VIDEO QUALITY WITH OR WITHOUT AN ORIGINAL VIDEOS SEQUENCE |
WO2006110975A1 (en) | 2005-04-22 | 2006-10-26 | Logovision Wireless Inc. | Multimedia system for mobile client platforms |
US8315308B2 (en) * | 2006-01-11 | 2012-11-20 | Qualcomm Incorporated | Video coding with fine granularity spatial scalability |
US7480641B2 (en) * | 2006-04-07 | 2009-01-20 | Nokia Corporation | Method, apparatus, mobile terminal and computer program product for providing efficient evaluation of feature transformation |
US7805292B2 (en) * | 2006-04-21 | 2010-09-28 | Dilithium Holdings, Inc. | Method and apparatus for audio transcoding |
US8761248B2 (en) * | 2006-11-28 | 2014-06-24 | Motorola Mobility Llc | Method and system for intelligent video adaptation |
JP2008283560A (ja) * | 2007-05-11 | 2008-11-20 | Canon Inc | 画像処理装置およびその方法 |
WO2009055898A1 (en) | 2007-11-02 | 2009-05-07 | Ecole De Technologie Superieure | Method and system for generating a quality prediction table for quality-aware transcoding of digital images |
US8295624B2 (en) * | 2007-12-03 | 2012-10-23 | Ecole De Technologie Superieure | Method and system for generating a quality prediction table for quality-aware transcoding of digital images |
US8300961B2 (en) * | 2008-12-12 | 2012-10-30 | Ecole De Technologie Superieure | Method and system for low complexity transcoding of images with near optimal quality |
-
2007
- 2007-11-02 WO PCT/CA2007/001974 patent/WO2009055896A1/en active Application Filing
- 2007-11-02 US US12/741,032 patent/US8224104B2/en active Active
- 2007-11-02 EP EP07816124.7A patent/EP2210236B1/en not_active Not-in-force
- 2007-11-02 KR KR20107012055A patent/KR101428671B1/ko active IP Right Grant
- 2007-11-02 JP JP2010531382A patent/JP5176175B2/ja not_active Expired - Fee Related
- 2007-11-02 CA CA2706251A patent/CA2706251C/en not_active Expired - Fee Related
- 2007-11-02 CN CN200780101390XA patent/CN101842811B/zh not_active Expired - Fee Related
-
2010
- 2010-03-25 IL IL204727A patent/IL204727A/en active IP Right Grant
-
2012
- 2012-05-03 US US13/463,694 patent/US8374443B2/en active Active
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102867314A (zh) * | 2011-07-06 | 2013-01-09 | 华晶科技股份有限公司 | 预估影像压缩尺寸的方法 |
CN105474650A (zh) * | 2013-06-19 | 2016-04-06 | 米夏埃尔·凯尔光学通讯有限公司 | 用于确定具有变化的质量对比特率的媒体数据流的质量的概念 |
CN105474650B (zh) * | 2013-06-19 | 2019-07-12 | 米夏埃尔·凯尔光学通讯有限公司 | 用于确定具有变化的质量对比特率的媒体数据流的质量的概念 |
US10687122B2 (en) | 2013-06-19 | 2020-06-16 | Opticom Dipl.-Ing. Michael Keyhl Gmbh | Concept for determining the quality of a media data stream with varying quality-to-bitrate |
TWI680437B (zh) * | 2017-04-27 | 2019-12-21 | 大陸商騰訊科技(深圳)有限公司 | 圖片轉碼方法和裝置 |
US10904542B2 (en) | 2017-04-27 | 2021-01-26 | Tencent Technology (Shenzhen) Company Limited | Image transcoding method and apparatus |
Also Published As
Publication number | Publication date |
---|---|
JP5176175B2 (ja) | 2013-04-03 |
US8374443B2 (en) | 2013-02-12 |
IL204727A (en) | 2017-05-29 |
JP2011505083A (ja) | 2011-02-17 |
WO2009055896A1 (en) | 2009-05-07 |
CA2706251A1 (en) | 2009-05-07 |
IL204727A0 (en) | 2010-11-30 |
KR20100097126A (ko) | 2010-09-02 |
EP2210236B1 (en) | 2018-07-11 |
CA2706251C (en) | 2015-06-30 |
CN101842811B (zh) | 2012-05-23 |
US20100254629A1 (en) | 2010-10-07 |
US20120237139A1 (en) | 2012-09-20 |
EP2210236A1 (en) | 2010-07-28 |
KR101428671B1 (ko) | 2014-09-17 |
EP2210236A4 (en) | 2012-02-15 |
US8224104B2 (en) | 2012-07-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101842811B (zh) | 用于预测经过通过缩放以及质量控制参数的改变而转换的图像的文件大小的系统和方法 | |
CN101842812B (zh) | 用于数字图像转码中的参数质量感知选择的系统和方法 | |
CN101394522B (zh) | 一种视频拷贝的检测方法和系统 | |
CN111079532A (zh) | 一种基于文本自编码器的视频内容描述方法 | |
US11610124B2 (en) | Learning compressible features | |
Barannik et al. | Video data compression methods in the decision support systems | |
CN111310041B (zh) | 图文发布的方法、模型的训练方法、装置及存储介质 | |
US8005306B2 (en) | Decoding apparatus, inverse quantization method, and computer readable medium | |
Gore et al. | Full reference image quality metrics for JPEG compressed images | |
CN102113328A (zh) | 确定用于比较运动补偿视频编码中的图像块的度量的方法和系统 | |
US11650989B2 (en) | Efficient aggregation of time series data | |
Mallick et al. | Video retrieval framework based on color co-occurrence feature of adaptive low rank extracted keyframes and graph pattern matching | |
CN117056863A (zh) | 一种基于多模态数据融合的大数据处理方法 | |
CN117197722A (zh) | 基于移动互联网视频的用户感知与分析系统 | |
Lee | Deep learning ensemble with data augmentation using a transcoder in visual description | |
Wang et al. | Multispectral image compression algorithm based on silced convolutional LSTM | |
Paul et al. | Image compression scheme based on histogram equalization and convolution neural network | |
KR102588531B1 (ko) | 학습데이터 처리 장치 및 그 방법 | |
Wang et al. | Research on Video Compression Algorithm Based on Deep Learning | |
JP5391466B2 (ja) | 品質制御パラメータの変更及びスケーリングによって変換される画像のファイルサイズを予想するシステム、方法及びプログラム | |
Ciolino | Image Compression and Actionable Intelligence With Deep Neural Networks | |
Wu et al. | Image indexing in DCT domain | |
Sundeqvist | An Implementation Of A Rate Controller Using A Neural Network | |
CN118018753A (zh) | 一种基于背景建模的全景视频编码方法及其系统 | |
CN117390205A (zh) | 电力设备检测图像管理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20120523 Termination date: 20191102 |
|
CF01 | Termination of patent right due to non-payment of annual fee |