CN108182712B - 图像处理方法、装置及系统 - Google Patents

图像处理方法、装置及系统 Download PDF

Info

Publication number
CN108182712B
CN108182712B CN201711284958.8A CN201711284958A CN108182712B CN 108182712 B CN108182712 B CN 108182712B CN 201711284958 A CN201711284958 A CN 201711284958A CN 108182712 B CN108182712 B CN 108182712B
Authority
CN
China
Prior art keywords
image block
gray
image
reconstruction
training sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711284958.8A
Other languages
English (en)
Other versions
CN108182712A (zh
Inventor
炎喆
苏睿
熊磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian Wanxiang Electronics Technology Co Ltd
Original Assignee
Xian Wanxiang Electronics Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian Wanxiang Electronics Technology Co Ltd filed Critical Xian Wanxiang Electronics Technology Co Ltd
Priority to CN201711284958.8A priority Critical patent/CN108182712B/zh
Publication of CN108182712A publication Critical patent/CN108182712A/zh
Application granted granted Critical
Publication of CN108182712B publication Critical patent/CN108182712B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/007Transform coding, e.g. discrete cosine transform
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/48Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using compressed domain processing techniques other than decoding, e.g. modification of transform coefficients, variable length coding [VLC] data or run-length data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/513Sparse representations

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Discrete Mathematics (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本公开提供一种图像处理方法、装置及系统,涉及图像处理技术领域,能够建立紧凑高效的训练基字典,有效提高压缩率和重构质量。具体技术方案为:获取训练样本图像;对训练样本图像进行分块,得到至少一个训练样本图像块;对每个训练样本图像块进行灰度量化,得到每个训练样本图像块的第一灰度图像块;对所有第一灰度图像块进行字典学习,得到训练基字典。本发明用于图像的压缩和解压。

Description

图像处理方法、装置及系统
技术领域
本公开涉及图像处理技术领域,尤其涉及一种图像处理方法、装置及系统。
背景技术
随着信息化手段的不断完善,各种办公类数字图像和视频传输的需求越来越多,稀疏编码作为一种信号编码方法,已显示出在图像压缩领域的巨大潜力。稀疏编码往往针对原始图像块,通过建立重构字典,实现对图像的压缩。但是在压缩字符、线条等图像时,由于笔画细节丰富,各种颜色、阴影、字体、大小、位置等因素的影响,使得采集的原始图像块差异巨大,使得建立的重构字典数量庞大且重构效果不理想,导致压缩效率低的问题。
发明内容
本公开实施例提供一种图像处理方法、装置及系统,能够建立紧凑高效的训练基字典,有效地提高压缩率和重构质量。所述技术方案如下:
根据本公开实施例的第一方面,提供一种图像处理方法,该方法包括:
获取训练样本图像;
对训练样本图像进行分块,得到至少一个训练样本图像块;
对每个训练样本图像块进行灰度量化,得到每个训练样本图像块的第一灰度图像块;
对所有第一灰度图像块进行字典学习,得到训练基字典。
通过对训练样本图像的灰度量化,降低了训练样本图像的差异性,通过自适应字典学习能够建立紧凑高效的训练基字典,从而有效提高压缩率和重构质量。
在一个实施例中,对训练样本图像进行分块,得到至少一个训练样本图像块包括:对训练样本图像按照预设间隔进行重叠采集,得到至少一个X*Y大小的训练样本图像块。
采用重叠采集的方式能够保证采集训练样本图像块的数量。
在一个实施例中,对每个训练样本图像块进行灰度量化,得到每个训练样本图像块的第一灰度图像块包括:
计算每个训练样本图像块的灰度直方图;
从灰度直方图中选取出现次数最多的N个灰度值作为基本灰度;
将每个训练样本图像块中基本灰度与预设步长范围内的灰度值量化为对应的基本灰度;
将每个训练样本图像块中除基本灰度外的剩余灰度值量化为残余灰度,得到每个训练样本图像块的第一灰度图像块。
将训练样本图像量化为基本灰度和残余灰度,实现对训练样本图像的自适应灰度量化,降低了训练样本图像的差异性。
在一个实施例中,对所有第一灰度图像块进行字典学习,得到训练基字典包括:利用第一公式对所有第一灰度图像块进行字典学习,得到训练基字典;第一公式包括:
Figure BDA0001498248210000021
其中,{Mk}表示第k个第一灰度图像块,D表示训练基字典,bk表示第k个第一灰度图像块对应的稀疏编码系数,L表示约束值。
对经过量化的基本灰度图像块进行自适应稀疏编码,能够建立一个紧凑高效的训练基字典,从而有效提高压缩率和重构质量。
根据本公开实施例的第二方面,提供一种图像处理方法,包括:
获取待压缩图像;
对待压缩图像进行分块,得到至少一个待压缩图像块;
对每个待压缩图像块进行灰度量化,得到每个待压缩图像块的灰度量化信息和第二灰度图像块;
根据第一方面及第一方面中任一实施例得到的训练基字典对每个第二灰度图像块进行重构,得到每个第二灰度图像块的重构参数;
获取每个第二灰度图像块和对应的第一重构灰度图像块的灰度残差信息,第一重构灰度图像块根据训练基字典和重构参数得到;
将每个待压缩图像块的灰度量化信息、重构参数以及灰度残差信息进行压缩编码
由于对训练样本图像进行灰度量化,降低了训练样本图像的差异性,通过稀疏编码能够建立紧凑高效的训练基字典,基于该训练基字典实现对图像的压缩,能够有效提高压缩率和重构质量。
在一个实施例中,根据训练基字典对每个第二灰度图像块进行重构,得到每个第二灰度图像块的重构参数包括:
根据训练基字典和第二公式对每个第二灰度图像块进行重构,得到每个第二灰度图像块的重构参数;第二公式包括:
Figure BDA0001498248210000031
其中,Ik表示第k个第二灰度图像块,D表示训练基字典,λ表示平衡系数,δ表示重构参数。
在一个实施例中,第一重构灰度图像块根据训练基字典和对应的每个第二灰度量化图像块的重构参数得到包括:
根据训练基字典和对应的每个第二灰度量化图像块的重构参数、以及第三公式得到;第三公式包括:
Figure BDA0001498248210000032
其中,
Figure BDA0001498248210000033
表示第k个第一重构灰度图像块,R表示重构,D表示训练基字典,δ表示重构参数。
根据本公开实施例的第三方面,提供一种图像处理方法,包括:
接收待解码图像的压缩码流;
对压缩码流进行解码,得到待解码图像中每个待解码图像块的灰度量化信息、重构参数以及灰度残差信息;
根据每个待解码图像块的重构参数和第一方面及第一方面中任一实施例得到的训练基字典,得到每个待解码图像块对应的第二重构灰度图像块;
将每个待解码图像块的灰度量化信息赋值给对应的第二重构灰度图像块,得到每个待解码图像块的第三重构灰度图像块;
将第三重构灰度图像块和对应的灰度残差信息叠加,得到待解码图像。
由于对训练样本图像块进行灰度量化,降低了训练样本图像块的差异性,通过稀疏编码能够建立紧凑高效的训练基字典,基于该训练基字典实现对图像的解码,能够有效提高重构质量。
根据本公开实施例的第四方面,提供一种图像处理装置,包括:
第一获取模块,用于获取训练样本图像;
第一分块模块,用于对训练样本图像进行分块,得到至少一个训练样本图像块;
第一量化模块,用于对每个训练样本图像块进行灰度量化,得到每个训练样本图像块的第一灰度图像块;
字典学习模块,用于对所有第一灰度图像块进行字典学习,得到训练基字典。
在一个实施例中,量化模块包括:
计算子模块,用于计算每个训练样本图像块的灰度直方图;
选取子模块,用于从所有灰度直方图中选取出现次数最多的N个灰度值作为基本灰度;
量化子模块,用于将每个训练样本图像块中基本灰度与预设步长范围内的灰度值量化为对应的基本灰度;
量化子模块,用于将每个训练样本图像块中除基本灰度外的剩余灰度值量化为残余灰度,得到每个训练样本图像块的第一灰度图像块。
根据本公开实施例的第五方面,提供一种图像处理装置,包括:
第二获取模块,用于获取待压缩图像;
第二分块模块,用于对待压缩图像进行分块,得到至少一个待压缩图像块;
第二量化模块,用于对每个待压缩图像块进行灰度量化,得到每个待压缩图像块的灰度量化信息和第二灰度图像块;
第一重构模块,用于根据第一方面及第一方面任一实施例得到的训练基字典对每个第二灰度图像块进行重构,得到每个第二灰度图像块的重构参数;
第三获取模块,用于获取每个第二灰度图像块和对应的第一重构灰度图像块之间的灰度残差信息,第一重构灰度图像块根据训练基字典和重构参数得到;
压缩模块,用于将每个待压缩图像块的灰度量化信息、重构参数以及灰度残差信息进行压缩编码。
根据本公开实施例的第六方面,提供一种图像处理装置,包括:
接收模块,用于接收待解码图像的压缩码流;
解码模块,用于对压缩码流进行解码,得到待解码图像中每个待解码图像块的灰度量化信息、重构参数以及灰度残差信息;
第二重构模块,用于根据每个待解码图像块的重构参数和第一方面及第一方面任一实施例得到的训练基字典,得到每个待解码图像块对应的第二重构灰度图像块;
赋值模块,用于将每个待解码图像块的灰度量化信息赋值给对应的第二重构灰度图像块,得到每个待解码图像块的第三重构灰度图像块;
叠加模块,还用于将第三重构灰度图像块和对应的灰度残差信息叠加,得到待解码图像。
根据本公开实施例的第七方面,提供一种图像处理系统,包括:第五方面所描述的图像处理装置和第六方面所描述的图像处理装置。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1是本公开实施例提供的一种图像处理方法的流程图;
图2是本公开实施例提供的一种图像处理方法的交互图;
图3是本公开实施例提供的一种字符基字典的提取流程图;
图4是本公开实施例提供的编码端对图像压缩的流程图;
图5是本公开实施例提供的解码端对图像解压的流程图;
图6是本公开实施例提供的一种图像处理装置的结构图;
图7是本公开实施例提供的一种图像处理装置的结构图;
图8是本公开实施例提供的一种图像处理装置的结构图;
图9是本公开实施例提供的一种图像处理装置的结构图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
本公开实施例提供一种图像处理方法,如图1所示,该图像处理方法方法包括以下步骤:
101、获取训练样本图像。
在本公开实施例中,训练样本图像为预先设定的图像集,这些训练样本图像中包含不同颜色、字符、线条等内容。
102、对训练样本图像进行分块,得到至少一个训练样本图像块。
在本发明的一个实施例中,对训练样本图像按照预设间隔进行重叠采集,得到至少一个X*Y大小的训练样本图像块。所谓重叠采集是指依次采集得到的两个训练样本图像块在采集方向上相差预设间隔个像素,采用重叠采集的方式是为了保证采集训练样本图像块的数量。对于预设间隔可以根据实际需要进行自适应设置,例如预设间隔为大于等于1的整数。另外,X和Y的大小根据训练样本图像的大小进行设定,X与Y的大小可以相同也可以不相同。
103、对每个训练样本图像块进行灰度量化,得到每个训练样本图像块的第一灰度图像块。
在本公开的一个实施例中,对每个训练样本图像块进行灰度量化,得到每个训练样本图像块的第一灰度图像块包括:
计算每个训练样本图像块的灰度直方图;
从所有灰度直方图中选取出现次数最多的N个灰度值作为基本灰度;
将每个训练样本图像块中的基本灰度与预设步长范围内的灰度值量化为对应的基本灰度;
将每个训练样本图像块中除基本灰度外的剩余灰度值量化为残余灰度,得到每个训练样本图像块的第一灰度图像块。
其中,灰度直方图用于表征图像的一维信息,是将图像中的所有像素,按照灰度值的大小统计其出现的次数(或频率),用于表示图像中具有某种灰度级的像素的个数,反映了图像中某种灰度出现的频率。一副图像可以唯一确定与之对应的灰度统计直方图,但不同的图像可能有相同的灰度统计直方图。那么,对每个训练样本图像块中的灰度值进行统计,得到每个训练样本图像的灰度统计直方图。
然后,从灰度直方图中选取出现次数最多的N个灰度值作为基本灰度,如果两个基本灰度距离在预设阈值以内,则合并这两个基本灰度,直到选取出N个基本灰度。此处以对一个训练样本图像块进行灰度量化为例,根据选取出的N个基本灰度,将该训练样本图像块中基本灰度与预设步长范围内的灰度值都量化为基本灰度,将其他不是基本灰度的像素点的灰度值量化为残余灰度。这样,就实现对训练样本图像块的灰度量化,得到每个训练样本图像块的第一灰度图像块。
104、对所有第一灰度图像块进行字典学习,得到训练基字典。
在稀疏编码中,字典学习(Dictionary Learning)是为了获取相互独立的训练基字典,在本公开的一个实施例中,利用第一公式对所有第一灰度图像块进行字典学习,得到训练基字典;该第一公式包括:
Figure BDA0001498248210000081
其中,{Mk}表示第k个第一灰度图像块,k表示第一灰度图像块的序号,D表示训练基字典,bk表示第k个第一灰度图像块对应的稀疏编码系数,L表示约束值。该约束值为一常数,如256。
本公开实施例提供的图像处理方法,输入训练样本图像,对训练样本图像进行分块,得到至少一个训练样本图像块,对每个训练样本图像块进行灰度量化,得到每个训练样本图像块的第一灰度图像块,对所有第一灰度图像块进行字典学习,得到训练基字典。通过对训练样本图像的灰度量化,降低了训练样本图像的差异性,通过字典学习能够建立紧凑高效的训练基字典,从而有效提高压缩率和重构质量。
基于上述图1对应的实施例提供的图像处理方法,本公开实施例提供了一种图像处理方法,参照图2所示,本实施例提供的图像处理方法包括:
201、获取待压缩图像。
202、对待压缩图像进行分块,得到至少一个待压缩图像块。
在本公开实施例中,将待压缩图像分割成与训练基字典相同大小、互不重叠的待压缩图像块。图2对应的实施例中提及的训练基字典与图1对应的实施例中的训练基字典相同。
203、对每个待压缩图像块进行灰度量化,得到每个待压缩图像块的灰度量化信息和第二灰度图像块。
在本公开实施例中,采用与步骤103中相同的方法,对每个待压缩图像块进行灰度量化,得到每一个待压缩图像块的第二灰度图像块,每个第二灰度图像块量化为对应的基本灰度和残余灰度,每个待压缩图像块的灰度量化信息中包含各自的基本灰度和残余灰度。
204、根据训练基字典对每个第二灰度图像块进行重构,得到每个第二灰度图像块的重构参数。
在本公开实施例中,根据训练基字典和第二公式对每个第二灰度图像块进行重构,得到每个第二灰度图像块的重构参数;第二公式包括:
Figure BDA0001498248210000082
其中,Ik表示第k个第二灰度图像块,D表示训练基字典,λ表示平衡系数,δ表示重构参数。
205、获取每个第二灰度图像块和对应的第一重构灰度图像块的灰度残差信息,第一重构灰度图像块根据重构参数和训练基字典得到。
在本公开实施例中,根据重构参数和训练基字典,利用第三公式得到第一重构灰度图像,第三公式包括:
Figure BDA0001498248210000091
其中,
Figure BDA0001498248210000092
表示第k个第一重构灰度图像块,R表示重构,D表示训练基字典,δ表示重构参数。也就是说,第一重构灰度图像是通过训练基字典重构得到的。正是由于重构灰度图像是根据训练基字典重构得到的,无法保证与第二灰度图像完全一致,因此,与对应的第二灰度图像之间存在误差。所以,需要获取每个第二灰度图像块和对应的第一重构灰度图像块之间的灰度残差信息。
206、将每个待压缩图像块的灰度量化信息、重构参数以及灰度残差信息进行压缩编码。
步骤201~206是利用图1对应的实施例中获取的训练基字典,实现对待压缩图像的压缩编码,步骤201~206所描述的方法可应用于编码设备。在实现压缩编码后,将压缩码流发送给解码端,步骤207~211是利用图1对应的实施例中获取的训练基字典,对压缩码流的解码,得到解码图像,步骤207~211所描述的方法可应用于解码设备。需要说明的是,由于训练基字典在编码设备和解码设备中都会应用,因此,图1对应的实施例中获取的训练基字典的方法,其执行主体可以是编码设备,也可以是解码设备,编码设备和解码设备可以将获取到的训练基字典通过发送得到。
207、接收待解码图像的压缩码流。
需要说明的是,步骤207~211中所描述的待解码图像即经过步骤201~206中压缩之后的图像。
208、对压缩码流进行解码,得到解码信息。
其中,解码信息中包含待解码图像中每个待解码图像块的灰度量化信息、重构参数以及灰度残差信息。
209、根据每个待解码图像块的重构参数和训练基字典,得到每个待解码图像块的第二重构灰度图像块。
在本公开实施例中,利用步骤205中所描述的第三公式,得到每个待解码图像块的第二重构灰度图像块。
210、将每个待解码图像块的灰度量化信息赋值给对应的第二重构灰度图像块,得到每个待解码图像块的第三重构灰度图像块。
211、将每个第三重构灰度图像块和对应的灰度残差信息叠加,得到待解码图像。
本公开实施例提供的图像处理方法,由于对训练样本图像进行灰度量化,降低了训练样本图像的差异性,通过稀疏编码能够建立紧凑高效的训练基字典,基于该训练基字典实现对图像的压缩和解码,能够有效提高压缩率和重构质量。
基于上述图1和2对应的实施例提供的图像处理方法,本公开另一实施例提供一种图像处理方法,本实施例提供的图像处理方法主要包括两个部分:字符基字典提取过程和图像压缩解压过程。其中,图3所示为字符基字典的提取流程图,图4为编码端对图像压缩的流程图,图5为解码端对图像解压的流程图。具体的:
第一部分:字符基字典提取过程
(1)训练样本采集:采集一些常用的含有字符的图像(即图3中的训练样本原始图像),包括不同的尺寸、颜色、字体等,并将这些图像分割为8*8或16*16的图像块,作为训练样本。其特征是采用重叠采集的方式进行,每个图像块x和y方向只相差1个像素,保证采集样本的数量。
(2)对每个样本图像块,计算其灰度统计直方图,选取数值出现次数最多的n个灰度值作为基本灰度,如果两个基本灰度距离在4以内,则合并这两个基本灰度,直到选出n个基本灰度。将每个基本灰度值±4范围内的值都量化为基本灰度,并将其灰度用0,1,2,…,n-1表示,其余不是基本灰度的像素点作为残余灰度,统一用n表示。这个由0-n组成的图像称为基本灰度图像块。其特征是对出现次数最多的n个灰度进行量化,对其余的灰度值统一量化为一个值。
(3)将所有基本灰度图像块,利用稀疏编码的方法,训练出一个字符基字典D,其训练过程可以用公式表示如下:
Figure BDA0001498248210000111
其中,{Mk}为基本灰度图像块,k表示基本灰度图像块序号,D为训练得到的字符基字典,bk为基本灰度图像块对应的稀疏编码系数,是一个向量,L表示约束值。
第二部分:图像压缩解压过程
(1)图像分块和量化:输入待压缩原始图像,将其分割为与字符基字典相同大小的、互不重叠的图像块。对每个图像块采用第一部分步骤(2)的自适应灰度量化方法,获得每个待压缩图像块的基本灰度图像块和基本灰度值表(即图4中的基本灰度量化表);对基本灰度值表,采用熵编码进行压缩。
(2)对于基本灰度图像块,在压缩端用字符基字典进行重构,求出其重构系数δ,其计算过程可以用公式表示如下:
Figure BDA0001498248210000112
其中Ik为输入待压缩图像的基本灰度图像块,D为字符基字典,λ为平衡系数。重构系数为稀疏向量,压缩率很高,对重构系数采用熵编码进行压缩。
(3)将原始图像值与重构后的基本灰度图像之间的差值,按照扫描顺序将其拉成一个向量,称为残差灰度值表(即图4中的残差灰度量化表)。对残差灰度值表进行DCT(离散余弦变换,Discrete Cosine Transform)变换,并在量化后进行熵编码,如果量化系数设为1,则可实现无损压缩;随着量化系数的增大,编码码率下降,图像质量也下降。最终压缩码流包括:重构系数、基本灰度值表、残差灰度值表三部分。
(4)解码过程:重构系数熵解码后,利用重构系数δ和字符基字典D,获得重构基本灰度图像块,重构过程计算公式如下:
Figure BDA0001498248210000113
其中
Figure BDA0001498248210000114
为重构基本灰度图像块。
(5)经过熵解码,获得基本灰度值表(即图5中的基本灰度量化表),并将基本灰度值赋值到
Figure BDA0001498248210000115
中,获得重构灰度图像块。
(6)经过熵解码获得解码残差灰度值表(即图5中的残差灰度量化表),将解码残差灰度值表与重构灰度图像块相加,获得最终解码结果。
本公开实施例提供的图像处理方法,通过对训练样本图像进行灰度量化,降低了训练样本图像的差异性,通过稀疏编码能够建立紧凑高效的训练基字典,基于该训练基字典实现对图像的压缩和解码,能够有效提高压缩率和重构质量。
基于上述图1和图2对应的实施例中所描述的图像处理方法,下述为本公开装置实施例,可以用于执行本公开方法实施例。
本公开实施例提供一种图像处理装置,如图6所示,该图像处理装置60包括:第一获取模块601、第一分块模块602、第一量化模块603和字典学习模块604;
第一获取模块601,用于获取训练样本图像;
第一分块模块602,用于对训练样本图像进行分块,得到至少一个训练样本图像块;
第一量化模块603,用于对每个训练样本图像块进行灰度量化,得到每个训练样本图像块的第一灰度图像块;
字典学习模块604,用于对所有第一灰度图像块进行字典学习,得到训练基字典。
在一个实施例中,第一分块模块602用于对训练样本图像按照预设间隔进行重叠采集,得到至少一个X*Y大小的训练样本图像块。
在一个实施例中,如图7所示,第一量化模块603包括:计算子模块6031、选取子模块6032、量化子模块6033;
计算子模块6031,用于计算每个训练样本图像块的灰度直方图;
选取子模块6032,用于从所有灰度直方图中选取出现次数最多的N个灰度值作为基本灰度;
量化子模块6033,用于将每个训练样本图像块中基本灰度与预设步长范围内的灰度值量化为对应的基本灰度;
量化子模块6033,还用于将每个训练样本图像块中除基本灰度外的剩余灰度值量化为残余灰度,得到每个训练样本图像块的第一灰度图像块。
在一个实施例中,字典学习模块604用于利用第一公式对所有第一灰度图像块进行字典学习,得到训练基字典;第一公式包括:
Figure BDA0001498248210000121
其中,{Mk}表示第k个第一灰度图像块,D表示训练基字典,bk表示第k个第一灰度图像块对应的稀疏编码系数,L表示约束值。
本公开实施例提供的图像处理装置,输入训练样本图像,对训练样本图像进行分块,得到至少一个训练样本图像块,对每个训练样本图像块进行灰度量化,得到每个训练样本图像块的第一灰度图像块,对所有第一灰度图像块进行字典学习,得到训练基字典。通过对训练样本图像的灰度量化,降低了训练样本图像的差异性,通过字典学习能够建立紧凑高效的训练基字典,从而有效提高压缩率和重构质量。
本公开实施例提供一种图像处理装置,如图8所示,该图像处理装置80包括:第二获取模块801、第二分块模块802、第二量化模块803、第一重构模块804、第三获取模块805、压缩模块806;
第二获取模块801,用于获取待压缩图像;
第二分块模块802,用于对待压缩图像进行分块,得到至少一个待压缩图像块;
第二量化模块803,用于对每个待压缩图像块进行灰度量化,得到每个待压缩图像块的灰度量化信息和第二灰度图像块;
第一重构模块804,用于根据图1实施例对应的方法得到的训练基字典对每个第二灰度图像块进行重构,得到每个第二灰度图像块的重构参数;
第三获取模块805,还用于获取每个第二灰度图像块和对应的第一重构灰度图像块之间的灰度残差信息,第一重构灰度图像块根据训练基字典和重构参数得到;
压缩模块806,用于将每个待压缩图像块的灰度量化信息、重构参数以及灰度残差信息进行压缩编码。
在一个实施例中,第二重构模块804用于根据根据图1实施例对应的方法得到的训练基字典和第二公式对每个第二灰度图像块进行重构,得到每个第二灰度图像块的重构参数;第二公式包括:
Figure BDA0001498248210000131
其中,Ik表示第k个第二灰度图像块,D表示训练基字典,λ表示平衡系数,δ表示重构参数。
在一个实施例中,第二重构模块804用于根据训练基字典和对应的每个第二灰度量化图像块的重构参数、以及第三公式得到第一重构灰度图像块;第三公式包括:
Figure BDA0001498248210000141
其中,
Figure BDA0001498248210000142
表示第k个第一重构灰度图像块,R表示重构,D表示训练基字典,δ表示重构参数。
本公开实施例提供的图像处理装置,由于对训练样本图像进行灰度量化,降低了训练样本图像的差异性,通过稀疏编码能够建立紧凑高效的训练基字典,基于该训练基字典实现对图像的压缩,能够有效提高压缩率和重构质量。
本公开实施例提供一种图像处理装置,如图9所示,该图像处理装置90包括:接收模块901、解码模块902、第二重构模块903、赋值模块904和叠加模块905;
接收模块901,用于接收待解码图像的压缩码流;
解码模块902,用于对压缩码流进行解码,得到待解码图像中每个待解码图像块的灰度量化信息、重构参数以及灰度残差信息;
第二重构模块903,用于根据每个待解码图像块的重构参数和图1实施例对应方法得到的训练基字典,得到每个待解码图像块对应的第二重构灰度图像块;
赋值模块904,用于根据每个待解码图像块的灰度量化信息和对应的第二重构灰度图像块,得到每个待解码图像块的第三重构灰度图像块;
叠加模块905,还用于将第三重构灰度图像块和对应的灰度残差信息叠加,得到待解码图像。
本公开实施例提供的图像处理装置,通过对训练样本图像进行灰度量化,降低了训练样本图像的差异性,通过稀疏编码能够建立紧凑高效的训练基字典,基于该训练基字典实现对图像的压缩和解码,能够有效提高压缩率和重构质量。
本公开实施例提供一种图像处理系统,包括:图8对应实施例所描述的图像处理装置和图9对应实施例所描述的图像处理装置。
基于上述图1~图6对应的实施例中所描述的图像处理方法,本公开实施例还提供一种计算机可读存储介质,例如,非临时性计算机可读存储介质可以是只读存储器(英文:Read Only Memory,ROM)、随机存取存储器(英文:Random Access Memory,RAM)、CD-ROM、磁带、软盘和光数据存储装置等。该存储介质上存储有计算机指令,用于执行上述图1和图3对应的实施例中所描述的数据传输方法,此处不再赘述。
本领域技术人员在考虑说明书及实践这里公开的公开后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (11)

1.一种图像处理方法,其特征在于,所述方法包括:
获取训练样本图像;
对所述训练样本图像进行分块,得到至少一个训练样本图像块;
对所述每个训练样本图像块进行灰度量化,得到所述每个训练样本图像块的第一灰度图像块;
对所有所述第一灰度图像块进行字典学习,得到训练基字典;
其中,所述对所述每个训练样本图像块进行灰度量化,得到所述每个训练样本图像块的第一灰度图像块包括:
计算所述每个训练样本图像块的灰度直方图;
从所述灰度直方图中选取出现次数最多的N个灰度值作为基本灰度;
将所述每个训练样本图像块中所述基本灰度与预设步长范围内的灰度值量化为对应的基本灰度;
将所述每个训练样本图像块中除所述基本灰度外的剩余灰度值量化为残余灰度,得到所述每个训练样本图像块的第一灰度图像块。
2.根据权利要求1所述的方法,其特征在于,所述对所述训练样本图像进行分块,得到至少一个训练样本图像块包括:
对所述训练样本图像按照预设间隔进行重叠采集,得到至少一个X*Y大小的所述训练样本图像块。
3.根据权利要求1所述的方法,其特征在于,所述对所有所述第一灰度图像块进行字典学习,得到训练基字典包括:
利用第一公式对所有所述第一灰度图像块进行字典学习,得到所述训练基字典;所述第一公式包括:
Figure FDA0002824077800000011
其中,{Mk}表示第k个第一灰度图像块,D表示所述训练基字典,bk表示第k个所述第一灰度图像块对应的稀疏编码系数,L表示约束值。
4.一种图像处理方法,其特征在于,所述方法包括:
获取待压缩图像;
对所述待压缩图像进行分块,得到至少一个待压缩图像块;
对每个所述待压缩图像块进行灰度量化,得到所述每个待压缩图像块的灰度量化信息和第二灰度图像块;
根据权利要求1~3任一所述的训练基字典对所述每个第二灰度图像块进行重构,得到所述每个第二灰度图像块的重构参数;
获取所述每个第二灰度图像块和对应的第一重构灰度图像块的灰度残差信息,所述第一重构灰度图像块根据所述训练基字典和所述重构参数得到;
将所述每个待压缩图像块的灰度量化信息、重构参数以及灰度残差信息进行压缩编码。
5.根据权利要求4所述的方法,其特征在于,所述根据权利要求1~3任一所述的训练基字典对所述每个第二灰度图像块进行重构,得到所述每个第二灰度图像块的重构参数包括:
根据所述训练基字典和第二公式对所述每个第二灰度图像块进行重构,得到所述每个第二灰度图像块的重构参数;所述第二公式包括:
Figure FDA0002824077800000021
其中,Ik表示第k个所述第二灰度图像块,D表示所述训练基字典,λ表示平衡系数,δ表示所述重构参数。
6.根据权利要求5所述的方法,其特征在于,所述第一重构灰度图像块根据所述训练基字典和对应的所述每个第二灰度量化图像块的重构参数得到包括:
根据所述训练基字典和对应的所述每个第二灰度量化图像块的重构参数、以及第三公式得到;所述第三公式包括:
Figure FDA0002824077800000022
其中,
Figure FDA0002824077800000023
表示第k个所述第一重构灰度图像块,R表示重构,D表示所述训练基字典,δ表示重构参数。
7.一种数据处理方法,其特征在于,所述方法包括:
接收待解码图像的压缩码流;
对所述压缩码流进行解码,得到所述待解码图像中每个待解码图像块的灰度量化信息、重构参数以及灰度残差信息;
根据所述每个待解码图像块的重构参数和权利要求1~3任一所述训练基字典,得到所述每个待解码图像块对应的第二重构灰度图像块;
将所述每个待解码图像块的灰度量化信息赋值给对应的所述第二重构灰度图像块,得到每个待解码图像块的第三重构灰度图像块;
将所述第三重构灰度图像块和对应的所述灰度残差信息叠加,得到所述待解码图像。
8.一种图像处理装置,其特征在于,包括:
第一获取模块,用于获取训练样本图像;
第一分块模块,用于对所述训练样本图像进行分块,得到至少一个训练样本图像块;
第一量化模块,用于对所述每个训练样本图像块进行灰度量化,得到所述每个训练样本图像块的第一灰度图像块;
字典学习模块,用于对所有所述第一灰度图像块进行字典学习,得到训练基字典;
所述量化模块包括:
计算子模块,用于计算所述每个训练样本图像块的灰度直方图;
选取子模块,用于从所有所述灰度直方图中选取出现次数最多的N个灰度值作为基本灰度;
量化子模块,用于将所述每个训练样本图像块中所述基本灰度与预设步长范围内的灰度值量化为对应的基本灰度;
所述量化子模块,用于将所述每个训练样本图像块中除所述基本灰度外的剩余灰度值量化为残余灰度,得到所述每个训练样本图像块的第一灰度图像块。
9.一种图像处理装置,其特征在于,包括:
第二获取模块,用于获取待压缩图像;
第二分块模块,用于对所述待压缩图像进行分块,得到至少一个待压缩图像块;
第二量化模块,用于对每个所述待压缩图像块进行灰度量化,得到所述每个待压缩图像块的灰度量化信息和第二灰度图像块;
第一重构模块,用于根据权利要求1~3任一所述的训练基字典对所述每个第二灰度图像块进行重构,得到所述每个第二灰度图像块的重构参数;
第三获取模块,用于获取所述每个第二灰度图像块和对应的第一重构灰度图像块之间的灰度残差信息,所述第一重构灰度图像块根据所述训练基字典和所述重构参数得到;
压缩模块,用于将所述每个待压缩图像块的灰度量化信息、重构参数以及灰度残差信息进行压缩编码。
10.一种数据处理装置,其特征在于,包括:
接收模块,用于接收待解码图像的压缩码流;
解码模块,用于对所述压缩码流进行解码,得到所述待解码图像中每个待解码图像块的灰度量化信息、重构参数以及灰度残差信息;
第二重构模块,用于根据所述每个待解码图像块的重构参数和权利要求1~3任一所述训练基字典,得到所述每个待解码图像块对应的第二重构灰度图像块;
赋值模块,用于将所述每个待解码图像块的灰度量化信息赋值给对应的所述第二重构灰度图像块,得到每个待解码图像块的第三重构灰度图像块;
叠加模块,还用于将所述第三重构灰度图像块和对应的所述灰度残差信息叠加,得到所述待解码图像。
11.一种图像处理系统,其特征在于,包括:权利要求9所述的图像处理装置和权利要求10所述的图像处理装置。
CN201711284958.8A 2017-12-07 2017-12-07 图像处理方法、装置及系统 Active CN108182712B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711284958.8A CN108182712B (zh) 2017-12-07 2017-12-07 图像处理方法、装置及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711284958.8A CN108182712B (zh) 2017-12-07 2017-12-07 图像处理方法、装置及系统

Publications (2)

Publication Number Publication Date
CN108182712A CN108182712A (zh) 2018-06-19
CN108182712B true CN108182712B (zh) 2021-06-04

Family

ID=62545881

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711284958.8A Active CN108182712B (zh) 2017-12-07 2017-12-07 图像处理方法、装置及系统

Country Status (1)

Country Link
CN (1) CN108182712B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11275968B2 (en) 2019-02-13 2022-03-15 Western Digital Technologies, Inc. Super-sparse image compression using cross-bar non-volatile memory device
CN110210582A (zh) * 2019-06-17 2019-09-06 上海海事大学 一种基于局部协作表示分类的手写汉字识别方法
CN115396670B (zh) * 2022-07-28 2024-05-03 西安空间无线电技术研究所 一种局域处理的图像数据压缩方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0272505A2 (en) * 1986-12-22 1988-06-29 International Business Machines Corporation Adaptive graylevel image compression system
CN104361574A (zh) * 2014-10-14 2015-02-18 南京信息工程大学 一种基于稀疏表示的无参考彩色图像质量评价方法
CN106682087A (zh) * 2016-11-28 2017-05-17 东南大学 一种基于车载装饰品特征稀疏编码的车辆检索方法
CN107103632A (zh) * 2017-05-03 2017-08-29 西安万像电子科技有限公司 图像压缩方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0272505A2 (en) * 1986-12-22 1988-06-29 International Business Machines Corporation Adaptive graylevel image compression system
CN104361574A (zh) * 2014-10-14 2015-02-18 南京信息工程大学 一种基于稀疏表示的无参考彩色图像质量评价方法
CN106682087A (zh) * 2016-11-28 2017-05-17 东南大学 一种基于车载装饰品特征稀疏编码的车辆检索方法
CN107103632A (zh) * 2017-05-03 2017-08-29 西安万像电子科技有限公司 图像压缩方法及装置

Also Published As

Publication number Publication date
CN108182712A (zh) 2018-06-19

Similar Documents

Publication Publication Date Title
US10659784B2 (en) Region-based image compression
RU2433479C2 (ru) Адаптивное кодирование и декодирование коэффициентов с широким диапазоном
RU2567988C2 (ru) Кодер, способ кодирования данных, декодер, способ декодирования данных, система передачи данных, способ передачи данных и программный продукт
JP2016226001A (ja) デコーダおよび復号方法
JP2011511592A (ja) 参照フレームの圧縮を伴うビデオ符号化システム
CN108182712B (zh) 图像处理方法、装置及系统
CN108881913B (zh) 图像编码的方法和装置
US10785493B2 (en) Method of compressing and decompressing image data
CN101653004A (zh) 从编码比特流选择性地解码预定数据单元的解码器
KR20200024154A (ko) 디지털 데이터 압축을 위한 방법 및 디바이스
Zepeda et al. Image compression using the iteration-tuned and aligned dictionary
JP2003188733A (ja) 符号化方法及び装置
CN110738666A (zh) 一种基于离散余弦变换的图像语义分割方法及装置
Kabir et al. Edge-based transformation and entropy coding for lossless image compression
KR102113904B1 (ko) 보간을 이용한 연산 방법, 인코더, 및 디코더
US10536697B2 (en) Method for re-encoding image and apparatus therefor
Kekre et al. Image Reconstruction using Fast Inverse Half tone and Huffman Coding Technique
CN111641827A (zh) 多套方案切换进行预测残差熵编码的数据压缩方法和装置
Padmavati et al. DCT combined with fractal quadtree decomposition and Huffman coding for image compression
JP2885433B2 (ja) 画像処理方法及びその装置
Hussin et al. A comparative study on improvement of image compression method using hybrid DCT-DWT techniques with huffman encoding for wireless sensor network application
Hashim et al. Correlated Block Quad-Tree Segmented and DCT based Scheme for Color Image Compression
KR102615404B1 (ko) 피쳐 정보에 대한 방법, 장치, 시스템 및 컴퓨터 판독 가능한 기록 매체
CN113473154B (zh) 视频编码、视频解码方法、装置及存储介质
RU2765654C9 (ru) Способ и устройство для сжатия цифровых данных

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20221212

Address after: Room 740, No. 1256 and 1258, Wanrong Road, Jing'an District, Shanghai, 200072

Patentee after: Shanghai Jingda Xinlian Information Technology Co.,Ltd.

Address before: Room 302, 3rd floor, No.4 factory building, 3G intelligent terminal Industrial Park, No.8, Tangyan South Road, high tech Zone, Xi'an City, Shaanxi Province, 710075

Patentee before: XI'AN VANXVM ELECTRONICS TECHNOLOGY Co.,Ltd.

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20230728

Address after: 710075, 2nd Floor, Building 5, Taiwei Zhilian Center, No. 8 Tangyan South Road, High tech Zone, Xi'an City, Shaanxi Province

Patentee after: XI'AN VANXVM ELECTRONICS TECHNOLOGY Co.,Ltd.

Address before: Room 740, No. 1256 and 1258, Wanrong Road, Jing'an District, Shanghai, 200072

Patentee before: Shanghai Jingda Xinlian Information Technology Co.,Ltd.