CN1178460C - 图象编码方法和图象编码装置 - Google Patents

图象编码方法和图象编码装置 Download PDF

Info

Publication number
CN1178460C
CN1178460C CNB971983143A CN97198314A CN1178460C CN 1178460 C CN1178460 C CN 1178460C CN B971983143 A CNB971983143 A CN B971983143A CN 97198314 A CN97198314 A CN 97198314A CN 1178460 C CN1178460 C CN 1178460C
Authority
CN
China
Prior art keywords
pixel
image
block
statistical model
reference block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB971983143A
Other languages
English (en)
Other versions
CN1231797A (zh
Inventor
���xһ��
畑幸一
־
栄藤稔
安庆武志
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Publication of CN1231797A publication Critical patent/CN1231797A/zh
Application granted granted Critical
Publication of CN1178460C publication Critical patent/CN1178460C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/41Bandwidth or redundancy reduction
    • H04N1/411Bandwidth or redundancy reduction for the transmission or storage or reproduction of two-tone pictures, e.g. black and white pictures
    • H04N1/413Systems or arrangements allowing the picture to be reproduced without loss or modification of picture-information
    • H04N1/417Systems or arrangements allowing the picture to be reproduced without loss or modification of picture-information using predictive or differential encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/41Bandwidth or redundancy reduction
    • H04N1/411Bandwidth or redundancy reduction for the transmission or storage or reproduction of two-tone pictures, e.g. black and white pictures
    • H04N1/413Systems or arrangements allowing the picture to be reproduced without loss or modification of picture-information
    • H04N1/415Systems or arrangements allowing the picture to be reproduced without loss or modification of picture-information in which the picture-elements are subdivided or grouped into fixed one-dimensional or two-dimensional blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/41Bandwidth or redundancy reduction
    • H04N1/411Bandwidth or redundancy reduction for the transmission or storage or reproduction of two-tone pictures, e.g. black and white pictures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Image Processing (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

一种图象编码装置,包括:获得待编码目标多值图象动态范围的动态范围估计装置10101;对动态范围进行编码并将其输出为动态范围编码数据的动态范围编码装置10105;估计目标多值图象的平滑函数的平滑函数估计装置10102;基于确定为平滑函数匹配的多值至二值转换准则将多值图象转换为二值图象的多值至二值转换装置10103;对二值图象进行编码并将其输出为二值图象编码数据的二值图象编码装置10104;对平滑函数进行编码并将其输出为平滑函数编码数据的平滑函数编码装置10106。这种结构可实现多值图象的有效编码。

Description

图象编码方法和图象编码装置
技术领域
本发明涉及图象编码装置、图象解码装置、图象编码方法、图象解码方法以及可以被用于传送和存储图象的媒体。
背景技术
当对图象进行合成时,存在这种情况,除了目标的亮度外还附加称为α值的信息,表示目标的重叠区和透明度。确定每个象素的α值,α值为1表示完全不透明或遮断,α值为0表示完全透明或不遮断。当目标图象重叠在背景图象上时α值变为必不可少。以下将仅由这种α值表示的图象称为α平面。
在云、毛玻璃等情况中,可以采用介于[0,1]之间的α值来表示图象,但是,存在用两个值{0,1}就足够的情况。
对应传统的二值α平面的编码,可以采用传真等系统常用的CCITT国际标准中所定义的二值图象编码技术,如MR和MMR,或者用JPEG进行标准化的编码技术。这种编码方案通常称为二值静止图象编码。在二值静止图象编码中,通过在扫描方向上从高阶象素预测低阶象素以及对它们之间的差值进行熵编码能够实现有效的编码。
在二值活动图象中,如活动图象的两个顺次α平面,可以利用顺次帧之间的相关性。即,通过从以前获得的具有高度相关性的二值图象中预测待编码的象素和对它们之间的差值进行编码,而不是在扫描方向上从高阶象素预测低阶象素和对它们之间的差值进行编码,能够实现有效的编码。
然而,即使在编码器或者解码器上获得与待编码或解码二值图象具有高度相关性的二值图象时,以现有技术进行的二值静止图象编码仅利用了扫描方向上高阶与低阶象素之间的相关性,因此,现有技术一直存在需要大量代码位数的问题。
对于传统α平面的编码,采用波形编码,象以JPEG编码方案进行的那样。
然而,许多α平面具有绝大部分是均匀的而中间值沿边界分布的特性。
由于这种α平面包含沿边界的高频成分,采用现有技术进行的波形编码一直存在难以实现有效编码的问题。
发明内容
考虑到现有技术的上述问题,本发明的一个目的是提供图象编码装置、图象解码装置、图象编码方法、图象解码方法以及其上记录了使计算机执行这些处理操作的程序的媒体,这里,从以前获得的具有高度相关性的二值图象中对待编码的象素进行预测并对其差值进行编码,由此能够实现比利用现有技术中所采用的二值图象编码和解码技术更有效的编码和解码。
考虑到上述问题,本发明的再一个目的是提供图象编码装置及其相应的解码装置、图象编码方法及其相应的图象解码方法以及存储它们执行程序的媒体,这里,对例如中间值的分布进行分析,对近似该分布的平滑函数和仅有两个值(最大值和最小值)的二值基本图象分别进行编码,由此实现比现有技术所能实现的更有效的编码。
本发明提供一种通过参照一参考二值图象对目标二值图象进行编码的图象编码方法,它包括步骤:第一分块步骤,通过从所述目标二值图象获得包含多个象素的目标块;第二分块步骤,通过从所述参考二值图象获得包含多个象素的参考块;统计模型选择步骤,基于所述参考块中一个参考象素周围的象素的状态,从多个统计模型中选择一个统计模型,所述参考象素对应于所述目标块中的一个目标象素;算术编码步骤,根据所述的所选统计模型通过对所述目标象素进行算术编码而获得所述目标块的编码数据。
本发明提供一种通过参照一参考二值图象对目标二值图象进行编码的图象编码装置,它包括:第一分块装置,通过从所述目标二值图象获得包含多个象素的目标块;第二分块装置,通过从所述参考二值图象获得包含多个象素的参考块;统计模型选择装置,基于所述参考块中一个参考象素周围的象素的状态,从多个统计模型中选择一个统计模型,所述参考象素对应于所述目标块中的一个目标象素;算术编码装置,根据所述的所选统计模型通过对所述目标象素进行算术编码而获得所述目标块的编码数据。
本发明提供一种通过参照一参考二值图象对目标二值图象进行编码的图象编码方法,它包括步骤:运动估计步骤,通过从所述参考二值图象搜索一运动补偿块,以输出目标块的运动信息;运动补偿分块步骤,获得所述运动补偿块,作为一个参考块;统计模型选择步骤,基于所述参考块中一个参考象素周围的象素的状态,从多个统计模型中选择一个统计模型,所述参考象素对应于所述目标块中的一个目标象素;和算术编码步骤,基于所述的所选统计模型通过对所述目标象素进行算术编码而获得所述目标块的编码数据。
本发明提供一种通过参照一参考二值图象对目标二值图象进行编码的图象编码装置,它包括:运动估计装置,通过从所述参考二值图象搜索一运动补偿块,以输出目标块的运动信息;运动补偿分块装置,获得所述运动补偿块,作为一个参考块;统计模型选择装置,基于所述参考块中一个参考象素周围的象素的状态,从多个统计模型中选择一个统计模型,所述参考象素对应于所述目标块中的一个目标象素;和算术编码装置,基于所述的所选统计模型通过对所述目标象素进行算术编码而获得所述目标块的编码数据。
本发明提供一种通过参照一参考二值图象对目标二值图象进行编码,以获得编码数据的图象编码方法,它包括步骤:第一分块步骤,通过从所述目标二值图象获得包含多个象素的目标块;第二分块步骤,通过从所述参考二值图象获得包含多个象素的参考块;参考块采用确定步骤,确定所述参考块是否被采用;统计模型选择步骤,基于所述参考块中一个参考象素周围的象素的状态,从多个统计模型中选择一个统计模型,所述参考象素对应于所述目标块中的一个目标象素;算术编码步骤,根据所述的所选统计模型通过对所述目标象素进行算术编码而获得所述目标块的编码数据;目标象素编码步骤,通过对所述目标块的算术编码而对所述目标块的编码,获得所述目标块的所述编码数据;其中当所述参考块采用确定步骤指示所述参考块被采用时,执行所述第一分块步骤和所述统计模型选择步骤,从而从所述算术编码步骤输出所述编码数据;当所述参考块采用确定步骤指示所述参考块不被采用时,执行所述目标象素编码步骤,从而从所述目标象素编码步骤输出所述编码数据;以及输出一参考块采用确定信号,作为所述参考块确定步骤中的确定结果。
本发明提供一种通过参照一参考二值图象对目标二值图象进行编码,以获得编码数据的图象编码装置,它包括:第一分块装置,通过从所述目标二值图象获得包含多个象素的目标块;第二分块装置,通过从所述参考二值图象获得包含多个象素的参考块;参考块采用确定装置,确定所述参考块是否被采用;统计模型选择装置,基于所述参考块中一个参考象素周围的象素的状态,从多个统计模型中选择一个统计模型,所述参考象素对应于所述目标块中的一个目标象素;算术编码装置,根据所述的所选统计模型通过对所述目标象素进行算术编码而获得所述目标块的编码数据;目标象素编码装置,通过对所述目标块的算术编码,通过对所述目标块的编码,获得所述目标块的所述编码数据;其中当所述参考块采用确定装置指示所述参考块被采用时,所述第一分块装置和所述统计模型选择装置工作,从而从所述算术编码装置输出所述编码数据;当所述参考块采用确定装置指示所述参考块不被采用时,所述目标象素编码装置工作,从而从所述目标象素编码装置输出所述编码数据;以及输出一参考块采用确定信号,作为所述参考块确定装置的确定输出。
本发明提供一种通过参照一参考二值图象对目标二值图象进行编码的图象编码方法,它包括步骤:第一分块步骤,通过从所述目标二值图象获得包含多个象素的目标块;第二分块步骤,通过从所述参考二值图象获得包含多个象素的参考块;统计模型产生步骤,从所述参考块产生所述目标块的统计模型;算术编码步骤,根据所述的所产生的统计模型通过对所述目标象素进行算术编码而获得所述目标块的编码数据。
本发明提供一种通过参照一参考二值图象对目标二值图象进行编码的图象编码方法,它包括步骤:运动估计步骤,通过从所述参考二值图象搜索一运动补偿块,以输出目标块的运动信息;运动补偿分块步骤,获得所述运动补偿块,作为一个参考块;统计模型产生步骤,从所述参考块产生所述目标块的统计模型;和算术编码步骤,基于所述的所产生的统计模型通过对所述目标象素进行算术编码而获得所述目标块的编码数据。
本发明提供一种通过参照一参考二值图象对目标二值图象进行编码,以获得编码数据的图象编码方法,它包括步骤:第一分块步骤,通过从所述目标二值图象获得包含多个象素的目标块;第二分块步骤,通过从所述参考二值图象获得包含多个象素的参考块;参考块采用确定步骤,确定所述参考块是否被采用;统计模型产生步骤,从所述参考块产生所述目标块的统计模型;算术编码步骤,根据所述的所产生的统计模型通过对所述目标象素进行算术编码而获得所述目标块的编码数据;目标象素编码步骤,通过对所述目标块的算术编码而对所述目标块的编码,获得所述目标块的所述编码数据;其中当所述参考块采用确定步骤指示所述参考块被采用时,执行所述第一分块步骤和所述统计模型选择步骤,从而从所述算术编码步骤输出所述编码数据;当所述参考块采用确定步骤指示所述参考块不被采用时,执行所述目标象素编码步骤,从而从所述目标象素编码步骤输出所述编码数据;以及输出一参考块采用确定信号,作为所述参考块确定步骤中的确定结果。
本发明权利要求1是一种图象编码装置,包括:分块装置1,取待编码的目标二值图象作为输入,通过将所述目标二值图象划分为各含有多个象素的块而获得目标块;分块装置2,通过将以前获得的参考二值图象划分为各含有多个象素的块而获得参考块;异或块构成装置,通过依次地对所述目标块和所述参考块进行扫描和通过对所述两个块之间象素值进行异或而构成异或块;以及异或编码装置,产生代表所述异或结果的代码序列并将其输出为编码数据。
本发明权利要求2是一种图象解码装置,包括:分块装置2,通过将以前获得的参考二值图象划分为各含有多个象素的块而获得参考块;异或解码装置,通过对经权利要求1图象编码装置编码的编码数据进行解码而恢复所述异或块;以及目标块构成装置,通过将所述异或块与所述参考块进行组合而构成目标块。
本发明权利要求9是一种图象编码装置,包括:分块装置1,取待编码的目标二值图象作为输入,通过将所述目标二值图象划分为各含有多个象素的块而获得目标块;分块装置2,通过将以前获得的参考二值图象划分为各含有多个象素的块而获得参考块;统计模型选择装置,基于所述参考块中参考象素周围的象素的状态从多个统计模型中选择一个统计模型,所述参考象素对应于所述目标块中的目标块;以及熵编码装置,基于所述的所选统计模型对所述目标象素进行熵编码并将其输出为编码数据。
本发明权利要求12是一种图象解码装置,包括:分块装置2,通过将以前获得的参考二值图象划分为各含有多个象素的块而获得参考块;统计模型选择装置,基于所述参考块中参考象素周围的象素的状态从多个统计模型中选择一个统计模型,所述参考象素对应于所述目标块中的目象素;以及熵解码装置,根据所述所选统计模型通过对权利要求9图象编码装置输出的编码数据进行熵解码而恢复所述目标块。
本发明权利要求14是一种依照权利要求9的图象编码装置,进一步包括:运动估计装置,通过所述参考二值图象搜索与所述目标块最相似的块,从所述搜索结果获得运动信息,这里,所述分块装置2是运动补偿分块装置2,它利用所述运动信息将运动补偿施加到所述参考二值图象上而获得参考块,所述运动信息也是从所述图象编码装置输出的。
本发明权利要求15是一种依照权利要求12的图象解码装置,这里,所述分块装置2是运动补偿分块装置2,它利用从权利要求14图象编码装置输出的运动信息将运动补偿施加到所述以前获得的参考二值图象上而获得参考块。
本发明权利要求16是一种依照权利要求9的图象编码装置,进一步包括:参考块采用确定装置,将所述目标块与所述参考块进行比较,根据所述比较的结果确定所述参考块是否被采用,由此切换各个装置之间其余的处理;以及目标象素编码装置,产生代表所述目标块中象素值的代码序列并将其输出为编码数据,这里,当所述参考块采用确定装置确定所述参考块被采用时,所述熵编码装置和所述统计模型选择装置这样操作,即输出所述熵编码装置的所述编码数据,而另一方面,当确定所述参考块不被采用时,所述目标象素编码装置这样操作,即输出所述目标象素编码装置的所述编码数据,确定所述参考块是否被采用的结果作为参考块采用确定信号而输出。
本发明权利要求18是一种依照权利要求12的图象解码装置,进一步包括:参考块采用控制装置,根据从权利要求16或17图象编码装置输出的参考块采用确定信号确定所述参考块是否被采用,由此切换各个装置之间其余的处理;以及目标象素解码装置,通过对所述图象编码装置输出的所述编码数据进行解码而恢复所述目标块,这里,当所述参考块采用控制装置确定所述参考块被采用时,所述熵解码装置和所述统计模型选择装置这样操作,即从所述熵解码装置输出所述目标块,而另一方面,当确定所述参考块不被采用时,所述目标象素解码装置这样操作,即从所述目标象素解码装置输出所述目标块。
本发明权利要求20是一种图象编码装置,包括:分块装置1,取待编码的目标二值图象作为输入,通过将所述目标二值图象划分为各含有多个象素的块而获得目标块;分块装置2,通过将以前获得的参考二值图象划分为各含有多个象素的块而获得参考块;统计模型产生装置,从所述参考块产生目标象素的统计模型;以及熵编码装置,基于所述产生的统计模型对所述目标象素进行熵编码并将其输出为编码数据。
本发明权利要求21是一种图象解码装置,包括:分块装置2,通过将以前获得的参考二值图象划分为各含有多个象素的块而获得参考块;统计模型产生装置,从所述参考块产生目标象素的统计模型;以及熵解码装置,根据所述产生的统计模型通过对权利要求20图象编码装置输出的编码数据进行熵解码而恢复所述目标块。
本发明权利要求26是一种图象编码方法,包括步骤:取待编码的目标二值图象作为输入,通过将所述目标二值图象划分为各含有多个象素的块而获得目标块;通过将以前获得的参考二值图象划分为各含有多个象素的块而获得参考块;通过依次地对所述目标块和所述参考块进行扫描和通过对所述两个块之间象素值进行异或而构成异或块;以及产生代表所述异或结果的代码序列并将其输出为编码数据。
本发明权利要求27是一种图象解码方法,包括步骤:通过将以前获得的参考二值图象划分为各含有多个象素的块而获得参考块;取由权利要求26图象编码方法编码的编码数据为输入,通过对所述编码数据进行解码而恢复所述异或块;以及通过将所述异或块与所述参考块进行组合而构成目标块。
本发明权利要求28是一种图象编码方法,包括:分块步骤1,取待编码的目标二值图象作为输入,通过将所述目标二值图象划分为各含有多个象素的块而获得目标块;分块步骤2,通过将以前获得的参考二值图象划分为各含有多个象素的块而获得参考块;统计模型选择步骤,基于所述参考块中参考象素周围的象素的状态从多个统计模型中选择一个统计模型,所述参考象素对应于所述目标块中的目标块;以及熵编码步骤,基于所述的所选统计模型对所述目标象素进行熵编码并将其输出为编码数据。
本发明权利要求29是一种图象解码方法,包括:分块步骤2,通过将以前获得的参考二值图象划分为各含有多个象素的块而获得参考块;统计模型选择步骤,基于所述参考块中参考象素周围的象素的状态从多个统计模型中选择一个统计模型,所述参考象素对应于所述目标块中的目标块;以及熵解码步骤,根据所述所选统计模型通过对按照权利要求28图象编码方法输出的编码数据进行熵解码而恢复所述目标块。
本发明权利要求30是一种依照权利要求28的图象编码方法,进一步包括:运动估计步骤,通过所述参考二值图象搜索与所述目标块最相似的块,以及从所述搜索的结果获得运动信息,这里,所述分块步骤2是指运动补偿分块步骤2,它利用所述运动信息将运动补偿施加到所述参考二值图象上而获得参考块,所述运动信息也是由所述图象编码方法输出的。
本发明权利要求31是一种依照权利要求29的图象解码方法,这里,所述分块步骤2是指运动补偿分块步骤2,它利用按照权利要求30图象编码方法输出的运动信息将运动补偿施加到所述以前获得的参考二值图象上而获得参考块。
本发明权利要求32是一种依照权利要求28的图象编码方法,进一步包括:参考块采用确定步骤,将所述目标块与所述参考块进行比较,根据所述比较的结果确定所述参考块是否被采用,由此切换接下来步骤的执行;以及目标象素编码步骤,产生代表所述目标块中象素值的代码序列并将其输出为编码数据,这里,当在所述参考块采用确定步骤中确定所述参考块被采用时,执行所述熵编码步骤和所述统计模型选择步骤,从而由所述熵编码步骤输出所述编码数据,而另一方面,当确定所述参考块不被采用时,执行所述目标象素编码步骤,从而由所述目标象素编码步骤输出所述编码数据,所述参考块是否被采用的确定结果作为参考块采用确定信号而输出。
本发明权利要求34是一种依照权利要求29的图象解码方法,进一步包括:参考块采用控制步骤,根据按照权利要求32或33图象编码方法输出的参考块采用确定信号确定所述参考块是否被采用,由此切换接下来步骤的执行;以及目标象素解码步骤,通过对按照所述图象编码方法输出的所述编码数据进行解码而恢复所述目标块,这里,当在所述参考块采用控制步骤中确定所述参考块被采用时,执行所述熵解码步骤和所述统计模型选择步骤,从而从所述熵解码步骤输出所述目标块,而另一方面,当确定所述参考块不被采用时,执行所述目标象素解码步骤,从而从所述目标象素解码步骤输出所述目标块。
本发明权利要求36是一种图象编码方法,包括步骤:取待编码的目标二值图象作为输入,通过将所述目标二值图象划分为各含有多个象素的块而获得目标块;通过将以前获得的参考二值图象划分为各含有多个象素的块而获得参考块;从所述参考块产生目标象素的统计模型;以及基于所述产生的统计模型对所述目标象素进行熵编码并将其输出为编码数据。
本发明权利要求37是一种图象解码方法,包括步骤:通过将以前获得的参考二值图象划分为各含有多个象素的块而获得参考块;从所述参考块产生目标象素的统计模型;以及根据所述产生的统计模型通过对按照权利要求36图象编码方法输出的编码数据进行熵解码而恢复所述目标块。
本发明权利要求40是一种图象编码装置,包括:多值至二值转换装置,取待编码的目标多值图象和平滑函数作为输入,基于所述平滑函数由所述多值图象产生二值图象;二值图象编码装置,对所述二值图象进行编码并将其输出为二值图象编码数据;以及平滑函数编码装置,对所述平滑函数进行编码并将其输出为平滑函数编码数据,这里,所述平滑函数是指一种这样调节功能,即如果将所述平滑函数运用到所述二值图象上能够有效地再现原始的多值图象。
本发明权利要求42是一种图象编码装置,包括:平滑函数估计装置,由待编码的目标多值图象估计平滑函数;多值至二值转换装置,基于确定与所述所估计平滑函数相匹配的多值至二值转换准则将所述多值图象转换为二值图象并将其输出为二值图象编码数据;二值图象编码装置,对所述二值图象进行编码并将其输出为二值图象编码数据;以及平滑函数编码装置,对所述平滑函数进行编码并将其输出为平滑函数编码数据。
本发明权利要求43是一种图象编码装置,包括:多值至二值转换装置,由待编码的目标多值图象产生二值图象;二值图象编码装置,对所述二值图象进行编码并将其输出为二值图象编码数据;平滑函数产生装置,由所述二值图象和所述目标多值图象产生平滑函数;以及平滑函数编码装置,对所述平滑函数进行编码并将其输出为平滑函数编码数据。
本发明权利要求44是一种依照权利要求43的图象编码装置,这里,所述平滑函数是利用由相邻象素的二值化图案和对应于所述图案的替换值构成的一个或多个表来表示的。
本发明权利要求45是一种依照权利要求43的图象编码装置,进一步包括:
二值至多值转换装置,利用所述平滑函数通过对所述二值图象进行平滑而产生多值图象;以及剩余成分编码装置,对由所述二值至多值转换装置产生的多值图象与由所述多值至二值转换装置输入进行转换的所述目标多值图象之间存在的剩余成分进行编码。
本发明权利要求46是一种图象编码装置,包括:多值至二值转换装置,基于确定与所述多值相匹配的多值至二值转换准则将多值图象,即待编码的目标图象转换为二值图象;平滑函数估计装置,这样估计平滑函数,即如果将所述平滑函数运用到所述二值图象上能够有效地再现原始的多值图象;二值图象编码装置,对所述二值图象进行编码并将其输出为二值图象编码数据;以及平滑函数编码装置,对所述所估计平滑函数进行编码并将其输出为平滑函数编码数据。
本发明权利要求48是一种图象解码装置,包括:接收由权利要求40、42、43或46图象编码装置所编码的各种编码数据作为其输入的装置;二值图象解码装置,通过对所述编码数据当中的所述二值图象编码数据进行解码而恢复所述二值图象;平滑函数解码装置,通过对所述编码数据当中的所述平滑函数编码数据进行解码而恢复所述平滑函数;以及二值至多值转换装置,通过用所述已解码的平滑函数对所述已解码二值图象进行平滑而恢复所述多值图象。
本发明权利要求49是一种图象解码装置,包括:接收由权利要求47图象编码装置所编码的各种编码数据作为输入的装置;二值图象解码装置,通过对所述编码数据当中的所述二值图象编码数据进行解码而恢复所述二值图象;平滑函数解码装置,通过对所述编码数据当中的所述平滑函数编码数据进行解码而恢复所述平滑函数;动态范围解码装置,通过对所述编码数据当中的所述动态范围编码数据进行解码而恢复所述动态范围;以及二值至多值转换装置,通过用所述已解码的平滑函数对所述已解码二值图象进行平滑和用所述已解码的动态范围对所述象素值进行转换而恢复所述多值图象。
本发明权利要求50是一种图象解码装置,包括:接收由权利要求44图象编码装置所编码的各种编码数据作为输入的装置;二值图象解码装置,通过对所述编码数据当中的所述二值图象编码数据进行解码而恢复所述二值图象;平滑函数解码装置,通过对所述编码数据当中的所述平滑函数编码数据进行解码而恢复所述平滑函数;以及二值至多值转换装置,通过用所述已解码的平滑函数对所述已解码二值图象进行平滑而恢复所述多值图象,这里,所述已解码的平滑函数是利用由相邻象素的二值化图案和对应于所述图案的替换值构成的一个或多个表来表示的。
本发明权利要求52是一种图象解码装置,包括:接收由权利要求45图象编码装置所编码的各种编码数据作为输入的装置;二值图象解码装置,通过对所述编码数据当中的所述二值图象编码数据进行解码而恢复所述二值图象;平滑函数解码装置,通过对所述编码数据当中的所述平滑函数编码数据进行解码而恢复所述平滑函数;二值至多值转换装置,通过用所述已解码的平滑函数对所述已解码二值图象进行平滑而恢复所述多值图象;以及剩余成分解码装置,对所述剩余成分进行解码,这里,输出图象是通过将所述已解码的剩余成分加在所述二值至多值转换装置的输出上而获得的。
附图简述
图1是本发明第A1实施例的图象编码装置的方框图。
图2是本发明第A2实施例的图象解码装置的方框图。
图3是本发明第A3实施例的图象编码装置的方框图。
图4是本发明第A4实施例的图象解码装置的方框图。
图5是本发明第A5实施例的图象编码装置的方框图。
图6是本发明第A6实施例的图象解码装置的方框图。
图7是本发明第A7实施例的图象编码装置的方框图。
图8是本发明第A8实施例的图象解码装置的方框图。
图9是本发明第A9实施例的图象编码装置的方框图。
图10是本发明第A10实施例的图象解码装置的方框图。
图11是本发明第A11实施例的图象编码装置的方框图。
图12是本发明第A12实施例的图象解码装置的方框图。
图13是本发明第A13实施例的图象编码装置的方框图。
图14是本发明第A14实施例的图象解码装置的方框图。
图15是本发明第A15实施例的图象编码装置的方框图。
图16是本发明第A16实施例的图象解码装置的方框图。
图17是本发明第A17实施例的图象编码装置的方框图。
图18是本发明第A18实施例的图象解码装置的方框图。
图19是表明掩膜运动图象中参考图象和目标图象的图。
图20是说明如何构成异或块的图。
图21是说明算术编码原理的图。
图22是算术编码的方框图。
图23是表明一部分统计模型表的图。
图24是表明一部分统计模型表的图。
图25是表明一部分统计模型表的图。
图26是表明一部分统计模型表的图。
图27是说明外推参考块的图。
图28是说明统计模型表中指数的图。
图29是频度-产生几率转换图的说明图。
图30是本发明另一实施例的图象编码装置的方框图。
图31是根据同一实施例的图象解码装置的方框图。
图32是本发明又一实施例的图象编码装置的方框图。
图33是根据同一实施例的图象解码装置的方框图。
图34是本发明再一实施例的图象编码装置的方框图。
图35是根据同一实施例的图象解码装置的方框图。
图36是本发明第B1实施例的图象编码装置的方框图。
图37是表明同一实施例中所使用的多值图象的图。
图38是沿图37中A-B线的象素值的分布图。
图39是根据第B1实施例的平滑函数估计装置的方框图。
图40是本实施例中所使用的非最大值抑制的说明图。
图41表明归一化平均梯度与第B1实施例平滑滤波之间的对应关系。
图42是根据第B1实施例的平滑滤波器的说明图。
图43是说明根据第B1实施例的平滑滤波步骤响应的图。
图44是说明本实施例中所使用的阈值化的图。
图45是本发明第B2实施例的图象解码装置的方框图。
图46是本实施例中所使用的象素值转换的图。
图47是本发明第B3实施例的图象编码装置的方框图。
图48是根据第B3实施例的平滑函数估计装置的方框图。
图49表明归一化平均梯度与根据第B3实施例平滑滤波之间的对应关系。
图50是说明第B3实施例的平滑滤波器的图。
图51是说明根据第B3实施例的平滑滤波步骤响应的图。
图52是说明本实施例中形态滤波器的图。
图53是本发明第B4实施例的图象解码装置的方框图。
图54是本发明第B5实施例的图象编码装置的方框图。
图55是根据第B5实施例的平滑函数估计装置的方框图。
图56是说明第B5实施例的平滑滤波器的图。
图57是本发明第B6实施例的图象解码装置的方框图。
图58是本发明第B7实施例的图象编码装置的方框图。
图59是本发明第B8实施例的图象解码装置的方框图。
图60是说明第B7、B8、B9和B10实施例中平滑图案的图。
图61是说明第B7、B8、B9和B10实施例中多级平滑的图。
图62是本发明第B9实施例的图象编码装置的方框图。
图63是本发明第B10实施例的图象解码装置的方框图。
图64是本发明第B11实施例的图象编码装置的方框图。
图65是第B1实施例的改进例中图象编码装置的方框图。
图66是本发明另一实施例的图象编码装置的方框图。
图67是图66所示实施例的改进例中图象编码装置的方框图。
图68是第B11实施例的改进例中图象编码装置的方框图。
图69是本发明另一实施例的图象编码装置的方框图。
(参考标号的说明)
101分块装置1
102分块装置2
103异或块构成装置
104异或编码装置
201异或解码装置
202分块装置2
203目标块构成装置
301分块装置1
302运动补偿分块装置2
303异或块构成装置
304异或编码装置
305运动估计装置
401异或解码装置
402运动补偿分块装置2
403目标块构成装置
501分块装置1
502分块装置2
503异或块构成装置
504异或编码装置
505参考块采用确定装置
506目标象素编码装置
601异或解码装置
602分块装置2
603目标块构成装置
604参考块采用控制装置
605目标象素解码装置
701分块装置1
702分块装置2
703统计模型估计装置
704统计模型
705熵编码装置
801熵解码装置
802分块装置2
803统计模型估计装置
804统计模型
901分块装置1
902运动补偿分块装置
903统计模型估计装置
904统计模型
905熵编码装置
906运动估计装置
1001熵解码装置
1002运动补偿分块装置2
1003统计模型选择装置
1004统计模型表
1101分块装置1
1102分块装置2
1103统计模型选择装置
1104统计模型表
1105熵编码装置
1106参考块采用确定装置
1107目标象素编码装置
1201熵解码装置
1202分块装置2
1203统计模型选择装置
1204统计模型表
1205参考块采用控制装置
1206目标象素解码装置
1301分块装置1
1302分块装置2
1303统计模型估计装置
1304统计模型
1305熵编码装置
1401熵解码装置
1402分块装置2
1403统计模型估计装置
1404统计模型
1501分块装置1
1502运动补偿分块装置2
1503熵编码装置
1504统计模型估计装置
1505统计模型
1506运动估计装置
1601熵解码装置
1602运动补偿分块装置2
1603统计模型估计装置
1604统计模型
1701分块装置1
1702分块装置2
1703统计模型估计装置
1704统计模型
1705熵编码装置
1706参考块采用确定装置
1707目标象素编码装置
1801熵解码装置
1802分块装置2
1803统计模型估计装置
1804统计模型
1805参考块采用控制装置
1806目标象素解码装置
1901掩膜运动图象
1902参考图象
1903目标图象
1904参考块图象
1905目标块图象
2001参考块
2002目标块
2003异或块
2101数值线
2102范围
2103二进制小数
2104产生几率模型
2105符号串
2201开始
2202对范围进行初始化
2203输入符号
2204限制范围
2205是结束符号吗?
2206输出二进制小数
2207结束
2301统计模型表
2401参考块
2402外推参考块
2403外推参考块
2501参考块
2502目标块
2503参考掩膜
2504目标掩膜
2601转换图
10101动态范围估计装置
10102平滑函数估计装置
10103多值-二值转换装置
10104二值图象编码装置
10105动态范围编码装置
10106平滑函数编码装置
10201多值图象
10301 X-方向滤波
10302 Y-方向滤波
10303梯度检测
10304梯度方向检测
10305非最大值抑制
10306平均梯度检测
10307平滑函数选择
10601滤波器1
10602滤波器2
10603滤波器3
10604滤波器4
10901二值图象解码装置
10902平滑函数解码装置
10903动态范围解码装置
10904二值-多值转换装置
10905二值掩膜应用装置
11101动态范围估计装置
11102平滑函数估计装置
11103多值-二值转换装置
11104二值图象编码装置
11105动态范围编码装置
11106平滑函数编码装置
11201 X-方向滤波
11202 Y-方向滤波
11203梯度检测
11204梯度方向检测
11205非最大值抑制
11206平均梯度检测
11207平滑函数构成
11401平滑滤波步骤2
11402平滑滤波步骤3
11403平滑滤波步骤4
11404平滑滤波系数表
11601形态滤波1
11602形态滤波2
11603形态滤波3
11701二值图象解码装置
11702平滑函数解码装置
11703动态范围解码装置
11704二值-多值转换装置
11801动态范围估计装置
11802平滑函数估计装置
11803多值-二值转换装置
11804二值图象编码装置
11805动态范围编码装置
11806平滑函数系数编码装置
11901 X-方向滤波
11902 Y-方向滤波
11903梯度检测
11904梯度方向检测
11905非最大值抑制
11906平均梯度检测
11907平滑函数产生
12101二值图象解码装置
12102平滑函数系数解码装置
12103动态范围解码装置
12104二值-多值转换装置
12201多值-二值转换装置
12202二值图象编码装置
12203平滑函数估计装置
12204平滑函数编码装置
12301二值图象解码装置
12302平滑函数解码装置
12303二值-多值转换装置
12601多值-二值转换装置
12602二值图象编码装置
12603平滑函数估计装置
12604平滑函数编码装置
12605二值-多值转换装置
12606差分计算器
12607剩余编码装置
12701二值图象解码装置
12702平滑函数解码装置
12703二值-多值转换装置
12704剩余解码装置
12705加法器
实现本发明的最佳方式
以下将参考附图描述本发明的实施例。
(实施例A1)
图1是表明本发明一个实施例的图象编码装置结构的方框图。
在图1中,分块装置1(以下称为第一分块装置)101是将待编码的目标图象作为输入并将输入图象划分成多个各由多个象素组成的块的装置。分块装置2(以下称为第二分块装置)102是将以前获得的参考图象划分成多个各由多个象素组成的块的装置。异或块构成装置103是通过对由第一分块装置101划分的图象所获取的目标块和由第二分块装置102划分的图象所获取的参考块进行扫描以及对它们之间的象素值进行异或而构成一个异或块的装置。异或编码装置104是对异或块进行编码并输出编码数据的装置。
以下将描述由此构成的本实施例的图象编码装置的操作以及按照本发明一个实施例的图象编码方法的操作。
这里,将如图19所示的人的运动掩膜图象1901的第(t+1)帧作为目标二值图象,将第t帧1902作为参考二值图象。在以下所述的附图中,值1代表黑,值0代表白。目标二值图象1903被第一分块装置101划分为8×8象素的目标块,如目标块图象1905所示。然而,第一分块装置101中的图象分块不限于8×8象素或16×16象素的块。同样,参考二值图象1902被划分为参考块,如参考块图象1904所示。
参考二值图象1902被第二分块装置102划分为8×8象素的参考块,如参考块图象1904中所示。然而,第二分块装置102中的图象分块不限于8×8象素或16×16象素的块。
图20中所示的目标块2002是从目标块图象1905中获得的一个块。参考块2001是从参考块图象1904中获得的与目标块2002相匹配的一个块。异或块构成装置103从左上到右下对目标块2002和参考块2001进行扫描,对它们之间的象素值进行异或,由此而构成异或块2003。异或编码装置104采用通常称为算术编码的技术对由0和1组成的异或块2003进行编码。下面将简要地描述一下算术编码(参考Hiroshi Yasuda,“多媒体编码的国际标准”,第3章算术编码,Maruzen出版)。
图21是说明算术编码原理的图。在算术编码中,利用符号串2105和符号产生几率模型2104,从0到1的数值线2101逐次限制来自符号串2105的每个符号输入,不管下一个将是什么,将不超出所获范围2102的最短二进制小数2103输出为编码数据。
图22示出了算术编码的流程图。在2201中,开始进行算术编码。在2202中,将范围初始化为由0和1限制的间隔。在2203中,输入符号。在2204中,将产生几率模型指定为当前范围并将输入符号的几率范围设定为新范围。在2205中,如果符号是结束符号,那么,在2206中由被输出的二进制小数表示范围,在2207中终止算术编码。如果在2205中符号不是结束符号,那么,在2203中输入下一个符号。如果符号的数目是预定的,那么可以省略结束符号。
通过确定来自二进制小数的符号串而进行解码。众所周知,算术编码具有符号与符号的产生几率模型匹配得越好,符号产生几率偏移越大,对符号串进行编码的代码位越少的特点。人们还知道,即使在编码期间改变了产生几率模型,如果改变模型的方法是已知的,也能够进行解码。
利用上述算术编码和将(0,0.9)作为符号0和(0.9,1.0)作为符号1的产生几率模型,异或块编码装置104产生由0和1符号串组成的异或块的编码序列并将其输出为编码数据。
如上所述,在本实施例中,利用在掩膜运动图象等的情况中由目标块和参考块的异或以约9∶1比率得到符号0和符号1的产生几率的特点,以及通过将异或与算术编码相结合,能够实现具有较少代码位数的有效编码。
(实施例A2)
图2是表明本发明一个实施例的图象解码装置结构的方框图。以下将参考该图描述本实施例的结构。
在本图中,异或解码装置201是将编码数据作为输入并对其进行解码以恢复异或块的装置。第二分块装置202是将以前获得的参考图象划分成多个各由多个象素组成的参考块的装置。目标块构成装置203是从异或解码装置201提供的异或块和第二分块装置202提供的参考块中恢复目标块的装置。
以下将描述由此构成的本实施例的图象解码装置的操作以及按照本发明一个实施例的图象解码方法的操作。
异或解码装置201是算术编码的解码器,其产生几率模型象异或编码装置104一样的将(0,0.9)作为符号0和(0.9,1.0)作为符号1。异或块是象编码数据和产生几率模型一样通过从二进制小数产生的符号串并按扫描方向排列这些符号而构成的。
在操作中,第二分块装置202等效于第二分块装置102。目标块构成装置203通过对异或块和参考块进行扫描以及将参考块中其值在异或块中为1的象素的象素值反转构成目标块。
如上所述,在本实施例中,利用在掩膜运动图象等的情况中由目标块和参考块的异或以约9∶1比率得到符号0和符号1的产生几率的特点,以及通过将异或与算术编码相结合,能够实现具有较少代码位数的有效解码。
(实施例A3)
图3是表明本发明一个实施例的图象编码装置结构的方框图。以下将参考该图描述本实施例的结构。
在本图中,分块装置301是将待编码的目标图象作为输入并将输入图象划分成多个各由多个象素组成的块的装置。运动估计装置305是通过参考图象搜索同目标块相似的块并产生该块的运动矢量的装置。运动补偿分块装置302是将参考图象和运动信息作为输入并根据运动信息将输入参考图象划分成多个各由多个象素组成的块的装置。异或块构成装置303是通过对由分块装置301划分的图象所获取的目标块和由运动补偿分块装置302划分的图象所获取的参考块进行扫描以及对它们之间的象素值进行异或而构成一个异或块的装置。异或编码装置304是对异或块进行编码并输出编码数据的装置。
以下将描述由此构成的本实施例的图象编码装置的操作以及按照本发明一个实施例的图象编码方法的操作。
在操作中,分块装置301等效于第一分块装置101。当待估计的运动矢量由v表示、目标块中的象素数目由m表示、图象中每个象素的位置由u_i(i=1至m)表示、目标图象中位置x上的象素值由A(x)表示、参考图象中位置x上的象素值由B(x)表示时,运动估计装置305在预定范围内检测使相似性S(v)(方程式A1)到达最小的v并将v输出为运动矢量。
(方程式A1)
S ( v ) = Σ i = 1 m | A ( u _ i + v ) - B ( u _ i ) | - - - ( 1 )
运动补偿分块装置302通过运动矢量使从参考图象获取的块移动并产生输出的参考块。在操作中,异或块构成装置303等效于异或块构成装置103。异或编码装置304等效于异或编码装置104。
如上所述,根据本实施例,利用运动估计装置和运动补偿分块装置,以使得产生几率的比率更接近9∶1的这种方式将运动补偿运用于在异或块中符号0和符号1的产生几率远不同于9∶1比率的块上,能够实现具有较少代码位数的有效编码。
(实施例A4)
图4是表明本发明一个实施例的图象解码装置结构的方框图。以下将参考该图描述本实施例的结构。
在本图中,异或解码装置401是将编码数据作为输入并对其进行解码以恢复异或块的装置。运动补偿分块装置402是将参考图象和运动信息作为输入并根据该运动信息将输入参考图象划分成多个各由多个象素组成的块的装置。目标块构成装置403是从异或解码装置401提供的异或块和运动补偿分块装置402提供的参考块恢复目标块的装置。
以下将描述由此构成的本实施例的图象解码装置的操作以及按照本发明一个实施例的图象解码方法的操作。
在操作中,异或块解码装置401等效于异或块解码装置201。运动补偿分块装置402等效于运动补偿分块装置302。目标块构成装置403等效于目标块构成装置203。
如上所述,根据本实施例,利用运动估计装置和运动补偿分块装置,以使得产生几率的比率更接近9∶1的这种方式将运动补偿运用于在异或块中符号0和符号1的产生几率远不同于9∶1比率的块上,能够实现具有较少代码位数的有效解码。
(实施例A5)
图5是表明本发明一个实施例的图象编码装置结构的方框图。以下将参考该图描述本实施例的结构。
在本图中,分块装置1(501)是将待编码的目标图象作为输入并将输入图象划分成多个各由多个象素组成的块的装置。分块装置2(502)是将参考图象划分成多个各由多个象素组成的块的装置。异或块构成装置(503)是通过对由分块装置1(501)划分的图象所获取的目标块和由分块装置2(502)划分的图象所获取的参考块进行扫描以及通过对它们之间的象素值进行异或而构成一个异或块的装置。异或编码装置(504)是对异或块进行编码并输出编码数据的装置。参考块采用确定装置(505)是将目标块与参考块进行比较以及输出参考块采用确定信号以切换下一步处理的装置。目标象素编码装置(506)是对目标块进行编码并输出编码数据的装置。
以下将描述由此构成的本实施例的图象编码装置的操作以及按照本发明一个实施例的图象编码方法的操作。
在操作中,分块装置1(501)等效于第一分块装置101,分块装置2(502)等效于第二分块装置102。如果绝对差之和大于或等于阈值则利用目标象素编码装置(506)进行编码,如果绝对差之和小于阈值则利用异或块构成装置(503)和异或编码装置(504)进行编码,参考块采用确定装置(505)以这种方式,根据目标块与参考块之间的绝对差之和(SAD)输出参考块采用确定信号,进行处理的切换。这里,5用作阈值。在操作中,异或块构成装置(503)等效于异或块构成装置103,异或编码装置(504)等效于异或编码装置104。目标象素编码装置(506)大体上等效于异或编码装置(504),是一个将目标块作为输入的算术编码器,其产生几率模型取[0,0.5)为符号0,取[0.5,1.0)为符号1。
如上所述,根据本实施例,把符号0和符号1的产生几率远不同于9∶1比率的块当作产生较大绝对差之和的块,参考块采用确定装置改变编码方案以降低编码中无效块的数目,由此能够实现具有较少代码位数的有效编码。
(实施例A6)
图6是表明本发明一个实施例的图象解码装置结构的方框图。以下将参考该图描述本实施例的结构。
在本图中,异或解码装置(601)是将编码数据作为输入并对其进行解码以恢复异或块的装置。分块装置2(602)是将参考图象作为输入并将输入参考图象划分成多个各由多个象素组成的参考块的装置。目标块构成装置(603)是把异或解码装置(601)恢复的异或块和分块装置(602)提供的参考块作为输入,由此恢复目标块的装置。参考块采用控制装置(604)是根据参考块采用确定信号切换下一步处理的装置。目标象素解码装置(605)是对编码数据进行解码并恢复目标块的装置。
以下将描述由此构成的本实施例的图象解码装置的操作以及按照本发明一个实施例的图象解码方法的操作。
在操作中,异或块解码装置(601)等效于异或块解码装置(201)。分块装置2(602)等效于第二分块装置102。
目标块构成装置(603)等效于目标块构成装置(203)。参考块采用控制装置(604)根据参考块采用确定信号,切换目标块构成装置(603)与分块装置(602)(利用参考块时)以及与目标象素解码装置(605)(不利用参考块时)之间的下一步处理。
目标象素解码装置(605)是一个算术编码的解码器,其产生几率模型取[0,0.5)为符号0,取[0.5,1.0)为符号1,与目标象素编码装置(506)一样。目标块是按照编码数据和产生几率模型从二进制小数产生符号串以及按扫描方向排列符号串而构成的。
如上所述,根据本实施例,把符号0和符号1的产生几率远不同于9∶1比率的块当作产生较大绝对差之和的块,参考块采用控制装置改变编码方案以降低编码中无效块的数目,由此能够实现具有较少代码位数的有效解码。
(实施例A7)
图7是表明本发明一个实施例的图象编码装置结构的方框图。以下将参考该图描述本实施例的结构。
在本图中,分块装置1(701)是将待编码的目标图象作为输入并将输入图象划分成多个各由多个象素组成的块的装置。
分块装置2(702)是将参考图象作为输入以及将输入参考图象划分成多个各由多个象素组成的块的装置。统计模型选择装置(703)是将待编码的目标象素的位置、参考块和下文中描述的统计模型表作为输入,根据目标象素在参考块中相应位置周围的象素的状态从统计模型表(704)中选择一个统计模型,以及将所选模型提供给熵编码装置(705)的装置。即,统计模型选择装置(703)是根据对应于目标块中目标象素的参考块中参考象素周围的象素的状态从多个统计模型中选择一个统计模型的装置。熵编码装置(705)是将待编码的目标象素的位置提供给统计模型选择装置(703),根据从统计模型选择装置(703)提供的统计模型对目标块进行熵编码,以及将其输出为编码数据的装置。
以下将描述由此构成的本实施例的图象编码装置的操作以及按照本发明一个实施例的图象编码方法的操作。
在操作中,分块装置1(701)等效于第一分块装置101,分块装置2(702)等效于第二分块装置102。
统计模型选择装置(703)从多个统计模型中选择一个统计模型并将所选模型提供给熵编码装置(705)。如图23至26所示,统计模型表(2301)是将指数分配给每个周围象素状态以及将统计模型分配给每个指数的装置。以下将参考图27和28描述状态与指数之间的对应关系。
由于考虑到对应象素周围的象素的状态,首先对参考块(2401)进行外推,产生外推参考块。
采用一种产生方法,如果周围象素的值是从参考图象获得的,那么,增加这些象素,产生外推参考块(2402)。在本实施例中,将这种方法称为外推方法1。
如果周围象素的值不是从参考图象获得的,那么,将参考块外围中的象素简单地延伸到外侧,产生外推参考块(2403)。将这种方法称为外推方法2。以同样的方式,从目标块产生外推目标块。
通过把参考掩膜(2503)运用于参考块(2501)以及把目标掩膜(2504)运用于目标块(2502),可获得目标象素在参考块中相应位置周围的象素的状态。如图28所示,当参考掩膜(2503)和目标掩膜(2504)中各个位置上的象素值由A、B、C、D、E、F、G、H、I、J、K、L和M表示时,指数i由以下的方程式A2表达。在图28中,下一个待编码的目标象素由参考标号2502a表示,对应于目标象素(2502a)的参考象素由参考标号2501a表示。为了再考虑与目标象素(2502a)相邻的已编码象素在目标块中的状态,利用外推目标块,以与上述方式相同的方式,本发明的统计模型选择装置(703)可获得与目标象素(2502a)相邻的这些象素的状态。当利用周围象素仅在参考块中的状态时可获得统计模型的更适当的选择。当然,在仅在参考块中采用周围象素状态的地方,也能够采用这种构造。
(方程式A2)
i=B+2D+4E+8F+16H+32K+64M             (2)
这时,可选择对应于统计模型表(2301)中指数I的统计模型。
以这种方法,统计模型选择装置(703)从统计模型表中选择一个统计模型并将该所选模型提供给熵编码装置(705)。
熵编码装置(705)象异或编码装置104一样采用一个算术编码器,所不同的是,这里,算术编码器采用统计模型选择装置(703)所选的统计模型(704)作为产生几率模型并利用所选统计模型对目标象素进行编码。
如上所述,根据本实施例,统计模型选择装置依据目标象素在参考块中相应位置周围的象素的状态改变统计模型,这提高了熵编码的的效率和实现较少代码位数的有效编码。
(实施例A8)
图8是表明本发明一个实施例的图象解码装置结构的方框图。以下将参考该图描述本实施例的结构。
在本图中,分块装置2(802)是将参考图象作为输入以及将输入参考图象划分成多个各由多个象素组成的块的装置。统计模型选择装置(803)是将待编码的目标象素的位置、参考块和统计模型表作为输入,根据目标象素在参考块中相应位置周围的象素的状态从统计模型表(804)中选择一个统计模型,以及将所选模型提供给熵解码装置(801)的装置。熵解码装置(801)是将编码数据作为输入并根据统计模型(804)对编码数据进行解码和恢复目标块的装置。
以下将描述由此构成的本实施例的图象解码装置的操作以及按照本发明一个实施例的图象解码方法的操作。
在操作中,分块装置2(802)等效于第二分块装置102。统计模型选择装置(803)等效于统计模型选择装置(703)。
熵解码装置(801)象在异或解码装置(201)中那样采用一个算术解码器,所不同的是,这里,算术解码器采用统计模型选择装置(803)所选的统计模型(804)。统计模型表(804)等效于统计模型表(704)。
如上所述,根据本实施例,统计模型选择装置依据目标象素在参考块中相应位置周围的象素的状态改变统计模型,这提高了熵编码的的效率和实现较少代码位数的有效解码。
(实施例A9)
图9是表明本发明一个实施例的图象编码装置结构的方框图。以下将参考该图描述本实施例的结构。
在本图中,分块装置1(901)是将待编码的目标图象作为输入并将输入图象划分成多个各由多个象素组成的块的装置。
运动估计装置(906)是通过参考图象搜索类似目标块的块并产生该块的运动矢量的装置。运动补偿分块装置2(902)是将参考图象和运动信息作为输入并根据运动信息将输入参考图象划分成多个各由多个象素组成的块的装置。统计模型选择装置(903)是将待编码的目标象素的位置、参考块和下文中描述的统计模型表作为输入,根据目标象素在参考块中相应位置周围的象素的状态从统计模型表(904)中选择一个统计模型,以及将所选模型提供给熵编码装置(905)的装置。熵编码装置(905)是根据从统计模型选择装置(903)提供的统计模型对目标块进行熵编码,以及将其输出为编码数据的装置。
以下将描述由此构成的本实施例的图象编码装置的操作以及按照本发明一个实施例的图象编码方法的操作。
在操作中,分块装置1(901)等效于第一分块装置101。
运动估计装置(906)等效于运动估计装置(305)。运动补偿分块装置2(902)等效于运动补偿分块装置302。
统计模型选择装置(903)等效于统计模型选择装置(703)。统计模型表(904)等效于统计模型表(704)。熵编码装置(905)等效于熵编码装置(705)。
如上所述,根据本实施例,利用运动估计装置和运动补偿分块装置,提高了统计模型的准确度,实现了较少代码位数的有效编码。
(实施例A10)
图10是表明本发明一个实施例的图象解码装置结构的方框图。以下将参考该图描述本实施例的结构。
在本图中,运动补偿分块装置2(1002)是将参考图象和运动信息作为输入并根据运动信息将输入参考图象划分成多个各由多个象素组成的块的装置。统计模型选择装置(1003)是将待解码的目标象素的位置、参考块和下文中描述的统计模型表作为输入,根据目标象素在参考块中相应位置周围的象素的状态从统计模型表(1004)中选择一个统计模型,以及将所选模型提供给熵解码装置(1001)的装置。熵解码装置(1001)是将编码数据作为输入和根据统计模型对编码数据进行解码和恢复目标块的装置。
以下将描述由此构成的本实施例的图象解码装置的操作以及按照本发明一个实施例的图象解码方法的操作。
在操作中,运动补偿分块装置2(1002)等效于运动补偿分块装置2(402)。统计模型选择装置(1003)等效于统计模型选择装置(803)。熵解码装置(1001)等效于熵解码装置(801)。统计模型表(1004)等效于统计模型表(704)。
如上所述,根据本实施例,利用运动补偿分块装置2,提高了统计模型的准确度,实现了较少代码位数的有效解码。
(实施例A11)
图11是表明本发明一个实施例的图象编码装置结构的方框图。以下将参考该图描述本实施例的结构。
在本图中,分块装置1(1101)是将待编码的目标图象作为输入并将输入图象划分成多个各由多个象素组成的块的装置。
分块装置2(1102)是将参考图象作为输入并将输入参考图象划分成多个各由多个象素组成的块的装置。统计模型选择装置(1103)是将待编码的目标象素的位置、参考块和统计模型表作为输入,根据目标象素在参考块中相应位置周围的象素的状态从统计模型表(1104)中选择一个统计模型,以及将所选模型提供给熵编码装置(1105)的装置。参考块采用确定装置(1106)是将目标块与参考块进行比较以及输出参考块采用确定信号以切换下一步处理的装置。熵编码装置(1105)是根据统计模型对目标块进行熵编码以及将其输出为编码数据的装置。目标象素编码装置(1107)是对目标块进行编码并输出编码数据的装置。
以下将描述由此构成的本实施例的图象编码装置的操作以及按照本发明一个实施例的图象编码方法的操作。
在操作中,分块装置1(1101)等效于第一分块装置101。分块装置2(1102)等效于第二分块装置102。统计模型选择装置(1103)等效于统计模型选择装置(703)。统计模型表(1104)等效于统计模型表(704)。熵编码装置(1105)等效于熵编码装置(705)。参考块采用确定装置(1106)等效于参考块采用确定装置(505)。目标象素编码装置(1107)等效于目标象素编码装置(506)。
如上所述,根据本实施例,参考块采用确定装置改变与统计模型不匹配块的编码方案,由此降低编码过程中无效块的数目,因此实现了较少代码位数的有效编码。
(实施例A12)
图12是表明本发明一个实施例的图象解码装置结构的方框图。以下将参考该图描述本实施例的结构。
分块装置2(1202)是将参考图象作为输入并将输入参考图象划分成多个各由多个象素组成的块的装置。统计模型选择装置(1203)是将待解编码的目标象素的位置、参考块和统计模型表作为输入,根据目标象素在参考块中相应位置周围的象素的状态从统计模型表(1204)中选择一个统计模型,以及将所选模型提供给熵解码装置(1205)的装置。熵解码装置(1201)是将编码数据作为输入并根据统计模型对编码数据进行解码和恢复目标块的装置。参考块采用控制装置(1205)是将目标块与参考块进行比较以及输出参考块采用确定信号以切换下一步处理的装置。目标象素解码装置(605)是对编码数据进行解码和恢复目标块的装置。
以下将描述由此构成的本实施例的图象解码装置的操作以及按照本发明一个实施例的图象解码方法的操作。
在操作中,熵解码装置(1201)等效于熵解码装置(801)。分块装置2(1202)等效于第二分块装置102。统计模型选择装置(1203)等效于统计模型选择装置(703)。统计模型表(1204)等效于统计模型表(704)。参考块采用控制装置(1205)等效于参考块采用控制装置(604)。目标象素解码装置(1206)等效于目标象素解码装置(605)。
如上所述,根据本实施例,参考块采用控制装置改变与统计模型不匹配块的编码方案,由此降低编码过程中无效块的数目,因此实现了较少代码位数的有效解码。
(实施例A13)
图13是表明本发明一个实施例的图象编码装置结构的方框图。以下将参考该图描述本实施例的结构。
在本图中,分块装置1(1301)是将待编码的目标图象作为输入并将输入图象划分成多个各由多个象素组成的块的装置。分块装置2(1302)是将参考图象作为输入并将输入参考图象划分成多个各由多个象素组成的块的装置。统计模型估计装置(1303)是从参考块估计目标块的统计模型并将估计的模型存储在统计模型(1304)中的装置。熵编码装置(1305)是根据统计模型(1304)对目标块中的象素进行编码以及输出编码数据的装置。
以下将描述由此构成的本实施例的图象编码装置的操作以及按照本发明一个实施例的图象编码方法的操作。
在操作中,分块装置1(1301)等效于第一分块装置101。分块装置2(1302)等效于第二分块装置102。统计模型估计装置(1303)从参考块估计统计模型。图29是说明统计模型估计装置(1303)如何对统计模型进行估计的图。
统计模型估计是通过获得符号0的频率Z开始的。频率Z是通过对参考块中符号0出现的数目进行计数以及将该数目除以象素总数64而获得的。利用转换图(2601)将频率Z转换为符号0的产生几率。在转换图中,r=0.1。
利用从转换图获得的产生几率z,对统计模型进行估计,其中把[0,z)中的任何数目取作符号0,把[z,1.0)中的任何数目取作符号1。将估计出的统计模型存储在统计模型(1304)中。
熵编码装置(1305)象熵编码装置(102)一样,利用算术编码器和估计出的统计模型(1304)对目标块进行编码。
如上所述,根据本实施例,统计模型估计装置从参考块估计目标块中符号的统计模型,由此提高熵编码的效率就实现以较少代码位数的有效编码。
在本实施例中,为每个目标块产生一个统计模型,但是构造并不限于所示出的排列,例如,可以为每个目标象素产生一个统计模型。
(实施例A14)
图14是表明本发明一个实施例的图象解码装置结构的方框图。以下将参考该图描述本实施例的结构。
在本图中,分块装置2(1402)是将参考图象作为输入并将输入参考图象划分成多个各由多个象素组成的块的装置。统计模型估计装置(1403)是从参考块估计目标块的统计模型并将估计出的模型存储在统计模型(1404)中的装置。熵解码装置(1401)是将编码数据作为输入并根据统计模型(1404)对编码数据进行解码和恢复目标块的装置。
以下将描述由此构成的本实施例的图象解码装置的操作以及按照本发明一个实施例的图象解码方法的操作。
在操作中,分块装置2(1401)等效于第二分块装置102。统计模型估计装置(1403)等效于统计模型估计装置(1303)。熵解码装置(1401)象异或解码装置(201)一样,利用算术解码器和统计模型估计装置(1403)估计出的统计模型对编码数据进行解码和恢复目标块。
如上所述,根据本实施例,统计模型估计装置从参考块估计目标块中符号的统计模型,由此提高熵编码的效率并实现以较少代码位数的有效解码。
(实施例A15)
图15是表明本发明一个实施例的图象编码装置结构的方框图。以下将参考该图描述本实施例的结构。
在本图中,分块装置1(1501)是将待编码的目标图象作为输入并将输入图象划分成多个各由多个象素组成的块的装置。运动估计装置(1506)是通过参考图象搜索同目标块相似的块并产生该块的运动矢量的装置。
运动补偿分块装置2(1502)是将参考图象和运动信息作为输入并根据运动信息将输入参考图象划分成多个各由多个象素组成的块的装置。
统计模型估计装置(1503)是从参考块估计目标块的统计模型并将估计出的模型存储在统计模型(1504)中的装置。
熵编码装置(1505)是根据统计模型(1504)对目标块中的象素进行编码以及输出编码数据的装置。
以下将描述由此构成的本实施例的图象编码装置的操作以及按照本发明一个实施例的图象编码方法的操作。
在操作中,分块装置1(1501)等效于第一分块装置101。运动补偿分块装置2(1502)等效于运动补偿分块装置302。统计模型估计装置(1504)等效于统计模型估计装置(1303)。熵编码装置(1503)等效于熵编码装置(1305)。运动估计装置(1506)等效于运动估计装置(305)。
如上所示,根据本实施例,利用运动估计装置和运动补偿分块装置,可提高统计模型估计的准确度,由此实现以较少代码位数的有效编码。
(实施例A16)
图16是表明本发明一个实施例的图象解码装置结构的方框图。以下将参考该图描述本实施例的结构。
在本图中,运动补偿分块装置2(1602)是将参考图象和运动信息作为输入并根据运动信息将输入参考图象划分成多个各由多个象素组成的块的装置。统计模型估计装置(1603)是从参考块估计目标块的统计模型并将估计出的模型存储在统计模型(1604)中的装置。熵解码装置(1601)是将编码数据作为输入并根据统计模型(1604)对编码数据进行解码和恢复目标块的装置。
以下将描述由此构成的本实施例的图象解码装置的操作以及按照本发明一个实施例的图象解码方法的操作。
在操作中,运动补偿分块装置2(1602)等效于运动补偿分块装置2(402)。统计模型估计装置(1603)等效于统计模型估计装置(1303)。熵解码装置(1601)等效于熵解码装置(1401)。
如上所示,根据本实施例,利用运动补偿分块装置2,可提高统计模型估计的准确度,由此实现以较少代码位数的有效编码。
(实施例A17)
图17是表明本发明一个实施例的图象编码装置结构的方框图。以下将参考该图描述本实施例的结构。
在本图中,分块装置1(1701)是将待编码的目标图象作为输入并将输入图象划分成多个各由多个象素组成的块的装置。分块装置2(1702)是将参考图象作为输入并将输入参考图象划分成多个各由多个象素组成的块的装置。统计模型估计装置(1703)是从参考块估计目标块的统计模型并将估计的模型存储在统计模型(1704)中的装置。熵编码装置(1705)是取分块装置(1701)的输出数据作为输入以及根据统计模型(1704)对输入数据进行编码并恢复编码数据的装置。参考块采用确定装置(1706)是将目标块与参考块进行比较以及输出参考块采用确定信号以切换下一步处理的装置。
以下将描述由此构成的本实施例的图象编码装置的操作以及按照本发明一个实施例的图象编码方法的操作。
在操作中,分块装置1(1701)等效于第一分块装置101。分块装置2(1702)等效于第二分块装置102。统计模型估计装置(1703)等效于统计模型估计装置(1303)。熵编码装置(1705)等效于熵编码装置(1305)。参考块采用确定装置(1706)等效于参考块采用确定装置(505)。目标象素编码装置(1707)等效于目标象素编码装置(506)。
如上所述,根据本实施例,参考块采用确定装置改变与统计模型不匹配的块的编码方案,由此减少编码中无效的块数目,因此实现以较少代码位数的有效编码。
(实施例A18)
图18是表明本发明一个实施例的图象解码装置结构的方框图。以下将参考该图描述本实施例的结构。
在本图中,分块装置2(1802)是将参考图象作为输入并将输入参考图象划分成多个各由多个象素组成的块的装置。统计模型估计装置(1803)是从参考块估计目标块的统计模型并将估计出的模型存储在统计模型(1804)中的装置。熵解码装置(1801)是将编码数据作为输入并根据统计模型(1804)对编码数据进行解码和恢复目标块的装置。参考块采用控制装置(1805)是根据参考块采用确定信号切换下一步处理的装置。目标象素解码装置(1806)是对编码数据进行解码并输出目标象素的解码数据的装置。
以下将描述由此构成的本实施例的图象解码装置的操作以及按照本发明一个实施例的图象解码方法的操作。
在操作中,分块装置2(1802)等效于第二分块装置102。统计模型估计装置(1803)等效于统计模型估计装置(1303)。熵解码装置(1801)等效于熵解码装置(1401)。参考块采用控制装置(1805)等效于参考块采用控制装置(604)。目标象素解码装置(1806)等效于目标象素解码装置(605)。
如上所述,根据本实施例,参考块采用确定装置改变与统计模型不匹配的块的编码方案,由此减少编码中无效的块数目,因此实现以较少代码位数的有效解码。
在上述实施例的任何一个例子中,可以产生磁性记录媒体或光学记录媒体,它们储存了由计算机执行全部或部分所述装置的功能的程序,从而使程序能够在计算机上运行,进行上述操作。此外,在这种情况下,能够获得与各个实施例相关的所述的相同效果。
如上所述,利用本发明的图象编码装置、图象解码装置、图象编码方法和图象解码方法,当采用目前已知的二值图象编码和解码技术时,由于下述原因,能够实现更有效的编码和解码:
(1)在二进制运动图象序列中,目标图象可从参考图象中预测,残留图象可通过异或来表示。
(2)按照周围象素在具有相关性的另一帧中的状态,通过改变统计模型,总是可以使用合适的统计模型。
(3)通过从参考图象产生统计模型,可以使用合适的统计模型。
(4)通过利用运动补偿或者通过利用阈值和绝对差值之和来改变编码方案,可减少与统计模型不匹配的块的数目。
本发明的参考块采用确定装置已经在第五实施例中作了描述,被应用于图5所示的结构,但是,可应用的结构不限于前面所述的这种结构,例如,图30所示的结构也可以应用。即,在图30所示的图象编码装置的情况中,参考块采用确定装置3505通过将目标块的代码位的数目与参考块的代码位的数目进行比较,输出参考块采用确定信号,对下一步处理进行切换。这一点构成了与图5结构的主要区别。更具体地说,参考块采用确定装置3505将目标象素编码装置506中所采用的代码位的数目与异或编码装置504中所采用的代码位的数目进行比较,以这样的方式进行切换,即如果来自目标象素编码装置506的代码位的数目较小,那么输出来自该装置的编码数据,如果来自异或编码装置504的代码位的数目较小,那么输出来自该装置的编码数据。另外,当来自目标象素编码装置506的代码位的数目较小时,输出参考块采用确定信号。根据本实施例,以这种方式,参考块采用确定装置3505通过参考代码位的数目对编码数据的输出进行切换,由此减少编码中无效的块的数目,因此以较少代码位的数目实现有效编码。在图30中,采用相同的参考标号表示与图5中基本相同的元件。
本发明的参考块采用控制装置已经在第六实施例中作了描述,被应用于图6所示的结构,但是,可应用的结构不限于前面所述的这种结构,例如,图31所示的结构也可以应用。即,图31所示的图象解码装置的结构包括:目标象素解码装置605,它通过对图5或30中所示的图象编码装置输出的编码数据进行解码恢复目标块;参考块采用控制装置3604,它根据图象编码装置输出的参考块采用确定信号选择目标块构成装置603的输出或是目标象素解码装置605的输出,作为目标块而输出。这种结构实现了比现有技术更有效的解码。在图31中,采用相同的参考标号表示与图6中基本相同的元件。
本发明的统计模型选择装置已经在第七实施例中作了描述,被应用于统计模型选择的结果不发送到解码装置的结构中,但是,可应用的结构不限于前面所述的这种结构,例如,如图32所示,可以将统计模型选择装置3703构造成将统计模型选择的结果作为选择结果信号输出到解码装置。在图32中,采用相同的参考标号表示与图7中基本相同的元件。
本发明的图象解码装置已经在第八实施例中作了描述,其结构对应于不把统计模型选择结果发送到解码装置的这种类型的图象编码装置,但是,可应用的结构不限于前面所述的这种结构,例如,图33中所示的结构也可以应用。即,图33中所示的图象解码装置包括:统计模型选择装置3803,它接收图32所示图象编码装置输出的选择结果并从多个统计模型中选择一个对应于选择结果信号的统计模型;熵解码装置801,它通过利用所选的统计模型对图象编码装置输出的编码数据进行熵解码而恢复目标块。这种结构可实现比现有技术更有效的解码。在本实施例中,可以省略如图8所示的分块装置2(802)。在图33中,采用相同的参考标号表示与图8中基本相同的元件。
本发明的参考块采用确定装置已经在第11实施例中作了描述,被应用于图11所示的结构,但是,可应用的结构不限于前面所述的这种结构,例如,图34所示的结构也可以应用。即,在图34所示的图象编码装置的情况中,参考块采用确定装置3106通过将目标块的代码位的数目与参考块的代码位的数目进行比较,输出参考块采用确定信号,对下一步处理进行切换。这一点构成了与图11结构的主要区别。更具体地说,参看块采用确定装置3106将目标象素编码装置1107中所采用的代码位的数目与熵编码装置1105中所采用的代码位的数目进行比较,以这样的方式进行切换,即如果来自目标象素编码装置1107的代码位的数目较小,那么输出来自该装置的编码数据;如果来自熵编码装置1105的代码位的数目较小,那么输出来自该装置的编码数据。另外,当来自目标象素编码装置1107的代码位的数目较小时,输出参考块采用确定信号。根据本实施例,以这种方式,参考块采用确定装置3106通过参考代码位的数目对编码数据的输出进行切换,由此减少编码中无效的块的数目,因此实现以较少代码位的数目的有效编码。在图34中,采用相同的参考标号表示与图11中基本相同的元件。
本发明的参考块采用控制装置已经在第12实施例中作了描述,被应用于图12所示的结构,但是,可应用的结构不限于前面所述的这种结构,例如,图31所示的结构也可以应用。即,图35所示的图象解码装置的结构包括:目标象素解码装置1206,它通过对图11或34中所示的图象编码装置输出的编码数据进行解码恢复目标块;参考块采用控制装置3205,它根据图象编码装置输出的参考块采用确定信号选择熵解码装置1201的输出或是目标象素解码装置1206的输出作为目标块而输出。这种结构实现了比现有技术更有效的解码。在图35中,采用相同的参考标号表示与图12中基本相同的元件。
已经描述的上述实施例中的每一个是针对把运动图象序列的第(t+1)帧用作目标二值图象和把第t帧用作参考二值图象的情况,但是,实施例不限于所说明情况,例如,可以采用一对立体摄像机对同一物体进行拍摄,在相同的时间上用一个摄像机获取的图象和用另一个摄像机获取的图象可以分别被用作目标二值图象和参考二值图象。此外,在这种情况下,能够获得结合各个实施例所述的相同效果。
从以上的描述中显而易见,本发明提供的优点在于能够实现比采用现有的二值图象编码技术更有效的编码和解码。
以下将参考附图描述本发明的进一步的实施例。
(实施例B1)
图36是表明本发明第B1实施例的图象编码装置结构的方框图。以下将参考该图描述本实施例的结构。
在该图中,动态范围估计装置(10101)是取目标多值图象作为输入、提取多值图象中最大面积的象素值和次最大面积的象素值以及将这些象素值作为动态范围而输出的装置。
平滑函数估计装置(10102)是取多值图象和动态范围作为输入以及通过对多值图象中亮度梯度的分析而估计平滑函数的装置。
多值至二值转换装置(10103)是利用动态范围进行亮度转换以及利用阈值作为多值至二值转换准则从多值图象中产生二值图象的装置,多值至二值转换准则是如此预先确定的,即如果在相应的解码器一侧利用上述的相同的平滑函数进行平滑能够很好地接近原始的多值图象。在以下给出的操作描述中,将对利用这一阈值进行阈值化作出描述。基于多值图象由平滑函数估计装置(10102)估出的平滑函数是这样进行调节的功能,即如果把平滑函数运用于相应解码器一侧的相应二值图象上能够有效地或者以逼近方式再现原始多值图象。
动态范围编码装置(10105)是对动态范围进行编码和输出编码数据的装置。
二值图象编码装置(10104)是对二值图象进行编码和输出编码数据的装置。
以下将参考图36至44描述由此构成的本发明的图象编码装置的操作以及按照本发明一个实施例的图象编码方法的操作。
图37是目标多值图象图。图38是沿图37中A-B线的象素的分布图。如图37所示,黑的象素值为255,白的象素值为0。
动态范围估计装置(10101)提取多值图象中最大面积的象素值和次最大面积的象素值;在许多多值图象中,这些象素值分别与最大象素值和最小象素值相一致,从而在本实施例中,通过对目标的多值图象的扫描可提取最大象素值Dmax和最小象素值Dmin。
平滑函数估计装置(10102)如图39所示。
如该图所示,在x-方向滤波(10301)中,应用x-方向滤波器(10401)在图象上扫描,沿图象中的x-方向对梯度进行检测。
在y-方向滤波(10302)中,应用y-方向滤波器(10402)在图象上扫描,沿图象中的y-方向对梯度进行检测。
在梯度检测(10303)中,利用x-方向滤波(10301)获得的x-方向梯度dx(i,j)和y-方向滤波(10302)获得的y-方向梯度dy(i,j),通过对下列方程式B1的计算,对梯度d(i,j)进行检测,这里(i,j)是图象上的坐标。
(方程式B1)
d ( i , j ) = dx ( i , j ) 2 + dy ( i , j ) 2 - - - ( 1 )
在梯度方向检测(10304)中,利用x-方向滤波(10301)获得的x-方向梯度dx(i,j)和y-方向滤波(10302)获得的y-方向梯度dy(i,j),通过对下列方程式B2的计算,对梯度方向θ(i,j)进行检测,这里(i,j)是图象上的坐标。
(方程式B2)
θ = tan - 1 dy dx - - - ( 2 )
在非最大值抑制(10305)中,如图40所示,利用随θ变化的窗口,以这样的方式产生图象,即如果在窗口中参考点上的梯度值是最大值,那么给该参考点的坐标上的图象部分分配1值;否则,给参考点的坐标上的图象部分分配0值。
在平均梯度检测(10306)中,对于由非最大值抑制(10305)所获得的二值图象中的取1值的象素,通过计算梯度检测(10303)中所检测到梯度的平均值可获得平均梯度d’ave此外,利用动态范围估计装置(10101)所检测的最大象素值Dmax和最小象素值Dmin,由以下的方程式B3重新计算归一化的平均梯度,得到dave
(方程式B3)
d ave = 255 D max - D min d ave ′ - - - ( 3 )
如图41所示,平滑函数选择装置(10307)根据平均梯度dave选择一个平滑滤波器。图42示出图41中平滑滤波器1的详细情况。在图42中,划圆圈的位置表示接受平滑的象素的位置。在对图象扫描时,分别计算与滤波器1的卷积结果(10601)、与滤波器2的卷积结果(10602)、与滤波器3的卷积结果(10603)和与滤波器4的卷积结果(10604),取四个滤波器的最小值为平滑滤波器1的结果。在图42中,a、b、c、d、e、f、g和h各为0.5。平滑滤波器2是在应用平滑滤波器1之后应用平滑滤波器1的滤波器。
平滑滤波器3是在应用平滑滤波器2之后应用平滑滤波器1的滤波器。当dave大于191时,由于图象的梯度被认为是代表阶跃边缘,所以不应用平滑滤波器进行平滑。另一方面,当dave小于10时,由于被认为不存在图象梯度,所以不应用平滑滤波器进行平滑。
考虑到平滑函数估计装置(10102)所估计的平滑函数的特征,多值至二值转换转换装置(10103)将多值图象转换为仅具有两个象素值255和0的二值图象。图43示出平滑滤波器1、平滑滤波器2和平滑滤波器3对一维阶跃的响应,于是,对应于平滑滤波器1、平滑滤波器2和平滑滤波器3的多值至二值的转换是诸如图44所示的阈值化。因此,多值至二值转换装置(10103)将图44所示的阈值化运用到多值图象上。
二值图象编码装置(10104)利用二值图象编码方案MMR(在传真系统常用的CCITT国际标准中所定义的)对二值图象进行编码并输出编码数据。
平滑函数编码装置(10106)对平滑函数估计装置(10102)所估计的平滑函数进行编码并输出编码数据。在本实施例中,由于平滑函数是从三个平滑函数中选出的,所以对所选平滑函数的识别号进行编码,将其输出为编码数据。
动态范围编码装置(10105)分别对动态范围估计装置(10101)所获得的Dmax和Dmin进行编码并将其输出为编码数据。
如上所述,在本实施例中,通过利用图象中几乎所有的象素都具有一致的最小值或最大值以及沿边界分布的中间值的多值图象的特性,对中间值的分布状态进行分析,对中间值分布提供良好近似的平滑函数进行估计,以及对与所估计平滑函数相对应的二值基本图象进行估计。通过对所估计的最大象素值和最小象素值、估计的平滑函数和估计的二值基本图象分别进行编码以及将结果输出为编码数据,能够实现有效的编码。
(实施例B2)
图45是表明本发明第B2实施例的图象解码装置结构的方框图。以下将参考该图描述本实施例的结构。
在该图中,二值图象解码装置(10901)是通过对二值图象编码数据进行解码而恢复二值图象的装置。
平滑函数解码装置(10902)是通过对平滑函数编码数据进行解码而恢复平滑函数的装置。
动态范围解码装置(10903)是通过对动态范围编码数据进行解码而恢复动态范围的装置。
二值至多值转换装置(10904)是通过利用平滑函数解码装置(10902)所恢复的平滑函数对二值图象进行平滑以及通过利用动态范围解码装置(10903)所恢复的动态范围进行亮度转换而恢复多值图象的装置。
二值掩膜应用装置(10905)是通过用二值图象解码装置(10901)所恢复的二值图象把掩膜化应用到多值图象上而获得新的多值图象的装置。
以下将描述由此构成的本实施例的图象解码装置的操作。
二值图象解码装置(10901)通过对利用传真等系统常用的CCITT国际标准中所定义的二值图象编码方案MMR进行编码的二值图象编码数据进行解码,恢复仅具有两个象素值0和255的二值图象。
平滑函数解码装置(10902)是通过对平滑函数编码数据进行解码而恢复平滑函数。
动态范围解码装置(10903)是通过对动态范围编码数据进行解码而恢复最大象素值Dmax和最小象素值Dmin
二值至多值转换装置(10904)实际上应用平滑函数解码装置(10902)所恢复的平滑滤波器。(对于应用平滑滤波器的方法,参考平滑函数选择装置(10307)和图42的描述)。此外,利用动态范围解码装置(10903)所恢复的最大象素值Dmax和最小象素值Dmin,进行如图46所示的线性转换,恢复多值图象。在二值掩膜应用装置(10905)中,利用二值图象解码装置(10901)所恢复的二值图象,与二值图象中0值象素相对应的多值图象中象素的值被强迫改变为Dmin,从而使编码的多值图象中具有最小象素值的象素不会取最小象素值以外的其它任何值。当需要限制Dmin的位置以维持与纹理数据的匹配时,二值掩膜应用装置(10905)是特别有效的,但是,如果没有这样的需要,则可以省略该装置。
如上所述,在本实施例中,通过利用图象中几乎所有的象素都具有均匀的最小值或最大值以及沿边界分布的中间值的多值图象的特性,对中间值的分布状态进行分析,对中间值分布提供良好近似的平滑函数进行估计,以及对与所估计平滑函数相对应的二值基本图象进行估计。通过对所估计的最大象素值和最小象素值、估计的平滑函数和估计的二值基本图象分别进行编码以及对编码数据进行解码并输出,能够实现具有较少代码位的有效解码。
(实施例B3)
图47是表明本发明第B3实施例的图象编码装置结构的方框图。以下将参考该图描述本实施例的结构。
在该图中,动态范围估计装置(11101)是取目标多值图象作为输入、提取多值图象中最大面积的象素值和次最大面积的象素值的装置。
平滑函数估计装置(11102)是取多值图象和动态范围作为输入以及通过对多值图象中亮度梯度的分析而估计平滑函数的装置。
多值至二值转换装置(11103)是利用动态范围、平滑函数和多值图象产生二值图象,从而在利用动态范围进行亮度转换和利用平滑函数进行平滑时能够很好地接近多值图象的装置。
动态范围编码装置(11105)是对动态范围进行编码和输出编码数据的装置。
平滑函数编码装置(11106)是对平滑函数进行编码和输出编码数据的装置。
二值图象编码装置(11104)是对二值图象进行编码和输出编码数据的装置。
以下将描述由此构成的本实施例的图象编码装置的操作。
动态范围估计装置(11101)提取多值图象中最大面积的象素值和次最大面积的象素值;在许多个多值图象中,这些象素值分别与最大象素值和最小象素值相一致,从而在本实施例中,最大象素值Dmax和最小象素值Dmin是通过对目标多值图象的扫描提取的。
图48示出平滑函数估计装置(11102)。
在x-方向滤波(11201)中,应用x-方向滤波器(10401)在图象上扫描,沿x-方向对图象中的梯度进行检测。在y-方向滤波(11202)中,应用y-方向滤波器(10402)在图象上扫描,沿y-方向对图象中的梯度进行检测。
在梯度检测(11203)中,利用x-方向滤波(11201)获得的x-方向梯度dx(i,j)和y-方向滤波(11202)获得的y-方向梯度dy(i,j),通过方程式B1的计算,对梯度d(i,j)进行检测,这里(i,j)是图象上的坐标。
在梯度方向检测(11204)中,利用x-方向滤波(11201)获得的x-方向梯度dx(i,j)和y-方向滤波(11202)获得的y-方向梯度dy(i,j),通过方程式B2的计算,对梯度方向θ(i,j)进行检测,这里(i,j)是图象上的坐标。
在非最大值抑制(11205)中,如图40所示,利用随θ变化的窗口,以这样的方式产生图象,即如果在窗口中参考点上的梯度值是最大值,那么给该参考点的坐标上的图象部分分配1值;否则,给参考点的坐标上的图象部分分配0值。
在平均梯度检测(11206)中,对于由非最大值抑制(11205)所获得的二值图象中的取1值的象素,通过计算梯度检测(11203)中所检测到梯度的平均值,可获得平均梯度d’ave。此外,利用动态范围估计装置(11101)所检测的最大象素值Dmax和最小象素值Dmin,由方程式B3重新计算归一化的平均梯度,得到dmax
在平滑函数构成(11207)中,根据归一化的平均梯度dave构成平滑滤波器,如图49所示。构成平滑滤波器的步骤的次数是根据梯度而变化的,如图49所示。图50示出图49中平滑滤波器的详细情况。在该图中,分别用11401、11402和11403表示平滑滤波器2、平滑滤波器3和平滑滤波器4。该图还示出平滑滤波器系数表11404。当dave大于191时,由于图象的梯度被认为是代表阶跃边缘,所以不应用平滑滤波器进行平滑。另一方面,当dave小于10时,由于认为不存在图象梯度,所以不应用平滑滤波器进行滤波。
考虑到平滑函数估计装置(11102)所估计的平滑函数的特征,多值至二值转换转换装置(11103)将多值图象转换为仅具有两个象素值255和0的二值图象。图51示出平滑滤波步骤2、平滑滤波步骤3和平滑滤波器步骤4对一维阶跃的响应,于是,对应于平滑滤波步骤2(11401)、平滑滤波步骤3(11402)和平滑滤波步骤4(11403)的多值至二值转换涉及到如图44所示的阈值化,接着用诸如图52所示的形态滤波器进行形态滤波。即,这样进行处理,当构成平滑滤波步骤2时,利用形态滤波器1(11601)以滤波器窗口中的最小值取代参考点;当构成平滑滤波步骤3(11603)时,利用形态滤波器2(11602)以滤波器窗口中的最小值取代参考点;当构成平滑滤波步骤4时,利用形态滤波器3以滤波器窗口中的最小值取代参考点。
因此,多值至二值转换装置(11103)在进行图44所示的阈值化后,利用按照图52所示构造的平滑滤波器将形态处理运用到多值图象上。
二值图象编码装置(11104)利用二值图象编码方案MMR(在传真系统常用的CCITT国际标准中所定义的)对二值图象进行编码并输出编码数据。
平滑函数编码装置(11106)对平滑函数估计装置(11102)所估计的平滑函数进行编码并输出编码数据。
动态范围编码装置(11105)对动态范围估计装置(11101)所获得的Dmax和Dmin进行编码并输出为编码数据。
如上所述,在本实施例中,通过利用图象中几乎所有的象素都具有均匀的最小值或最大值以及沿边界分布的中间值的多值图象的特性,对中间值的分布状态进行分析,对中间值分布提供良好近似的平滑函数进行估计,以及对与所估计平滑函数相对应的二值基本图象进行估计。通过对所估计的最大象素值和最小象素值、估计的平滑函数和估计的二值基本图象分别进行编码以及将结果输出为编码数据,能够实现有效的编码。
(实施例B4)
图53是表明本发明第B4实施例的图象解码装置结构的方框图。以下将参考该图描述本实施例的结构。
在该图中,二值图象解码装置(11701)是通过对二值图象编码数据进行解码而恢复二值图象的装置。
平滑函数解码装置(11702)是通过对平滑函数编码数据进行解码而恢复平滑函数的装置。
动态范围解码装置(11703)是通过对动态范围编码数据进行解码而恢复动态范围的装置。
二值至多值转换装置(11704)是通过利用平滑函数解码装置(11702)所恢复的平滑函数对二值图象进行平滑以及通过利用动态范围解码装置(11703)所恢复的动态范围进行亮度转换而恢复多值图象的装置。
以下将描述由此构成的本实施例的图象解码装置的操作。
二值图象解码装置(11701)通过对利用传真等系统常用的CCITT国际标准中所定义的二值图象编码方案MMR进行编码的二值图象编码数据进行解码,恢复仅具有两个象素值0和255的二值图象。
平滑函数解码装置(11702)是通过对平滑函数编码数据进行解码而恢复平滑函数。
动态范围解码装置(11703)是通过对动态范围编码数据进行解码而恢复最大象素值Dmax和最小象素值Dmin。二值至多值转换装置(11704)实际上应用平滑函数解码装置(11702)所恢复的平滑滤波器。(对于应用平滑滤波器的方法,参考平滑函数构成装置(11207)和图50的描述)。此外,利用动态范围解码装置(10903)所恢复的最大象素值Dmax和最小象素值Dmin,如图46所示,进行线性转换,恢复多值图象。
如上所述,在本实施例中,通过利用图象中几乎所有的象素都具有均匀的最小值或最大值以及沿边界分布的中间值的多值图象的特性,对中间值的分布状态进行分析,对中间值分布提供良好近似的平滑函数进行估计,以及对与所估计平滑函数相对应的二值基本图象进行估计。通过对所估计的最大象素值和最小象素值、估计的平滑函数和估计的二值基本图象分别进行编码以及对编码数据进行解码并输出,能够实现具有较少代码位的有效解码。
(实施例B5)
图54是表明本发明第B5实施例的图象编码装置结构的方框图。以下将参考该图描述本实施例的结构。
在该图中,动态范围估计装置(11801)是取目标多值图象作为输入、以及提取多值图象中最大面积的象素值和次最大面积的象素值的装置。
平滑函数估计装置(11802)是取多值图象和动态范围作为输入以及通过对多值图象中亮度梯度的分析而估计平滑函数的装置。多值至二值转换装置(11803)是利用动态范围、平滑函数和多值图象产生二值图象,从而在利用动态范围进行亮度转换和利用平滑函数进行平滑时能够很好地接近多值图象的装置。
动态范围编码装置(11805)是对动态范围进行编码和输出编码数据的装置。
平滑函数系数编码装置(11806)是对平滑函数进行编码和输出编码数据的装置。二值图象编码装置(11804)是对二值图象进行编码和输出编码数据的装置。
以下将描述由此构成的本实施例的图象编码装置的操作。
动态范围估计装置(11801)提取多值图象中最大面积的象素值和次最大面积的象素值;在许多个多值图象中,这些象素值分别与最大象素值和最小象素值相一致,从而在本实施例中,最大象素值Dmax和最小象素值Dmin是通过对目标多值图象的扫描提取的。
图55示出平滑函数估计装置(11802)。在x-方向滤波(11901)中,应用x-方向滤波器(10401)在图象上扫描,沿x-方向对图象中的梯度进行检测。
在y-方向滤波(11902)中,应用y-方向滤波器(10402)在图象上扫描,沿y-方向对图象中的梯度进行检测。在梯度检测(11903)中,利用x-方向滤波(11901)获得的x-方向梯度dx(i,j)和y-方向滤波(11902)获得的y-方向梯度dy(i,j),通过方程式B1的计算,对梯度d(i,j)进行检测,这里(i,j)是图象上的坐标。
在梯度方向检测(11904)中,利用x-方向滤波(11901)获得的x-方向梯度dx(i,j)和y-方向滤波(11902)获得的y-方向梯度dy(i,j),通过方程式B2的计算,对梯度方向θ(i,j)进行检测,这里(i,j)是图象上的坐标。在非最大值抑制(11905)中,如图40所示,利用随θ变化的窗口,以这样的方式产生图象,即如果在窗口中参考点上的梯度值是最大值,那么给该参考点的坐标上的图象部分分配1值;否则,给参考点的坐标上的图象部分分配0值。
在逐个方向平均梯度检测(11906)中,对于通过非最大值抑制(11905)所获得的二值图象中取1值的象素,通过计算梯度检测(11903)中所检测到梯度的平均值,根据梯度方向(11904)中检测到梯度方向,可获得两个方向中每个方向,即水平方向和垂直方向的平均梯度。此外,利用动态范围估计装置(11801)所检测的最大象素值Dmax和最小象素值Dmin由方程式B3重新计算归一化的平均梯度,得到垂直方向的平均梯度dave_1和水平方向的平均梯度dave_2 。
在平滑函数构成(11907)中,根据平均梯度dave_1和dave_2,通过估计平滑滤波器系数产生平滑滤波器。在本实施例中,估计图56所示的步骤次数3的平滑滤波器的系数。这里,通过方程式B4进行限制,但是,根据图象可以对每个系数进行加权。
(方程式B4)
        a=1                    (4)
        b=f,c=h              (5)
g = i = e = d = h + f 2 - - - ( 6 )
        j=a+b+c+d+e+f+g+h+i    (7)
利用dave_1,通过方程式B5估计c。然而,当dave_1大于200时,图象的梯度被认为是代表阶跃边缘,所以将c设定为0。另一方面,当dave_1小于50时,认为不存在图象梯度,所以将c设定为0。
(方程式B5)
b = 255 - d ave 1 2 d ave 1 - - - ( 8 )
利用dave_2,通过方程式B6估计b。然而,当dave_2大于200时,图象的梯度被认为是代表阶跃边缘,所以将b设定为0。另一方面,当dave_2小于50时,认为不存在图象梯度,所以将b设定为0。
(方程式B6)
b = 255 - d ave 2 2 d ave 2 - - - ( 9 )
如上所述,利用方程式B4、B5和B6估计滤波器系数和标度。考虑到平滑函数估计装置(11902)所估计的平滑函数的特征,多值至二值转换转换装置(11903)将多值图象转换为仅具有两个象素值255和0的二值图象。在本实施例中,阈值是根据滤波器系数估计的,二值图象是通过利用估计的阈值对多值图象进行阈值化而获得的。阈值γ是通过方程式B7估计的。
(方程式B7)
γ = 255 ( a + 2 b 4 j + a + 2 h 4 j ) - - - ( 10 )
二值图象编码装置(11804)利用传真等系统常用的CCITT国际标准中所定义的二值图象编码方案MMR对二值图象进行编码并输出编码数据。
平滑函数系数编码装置(11806)对平滑函数估计装置(11802)所估计的平滑函数的每个系数和标度进行编码并输出编码数据。动态范围编码装置(11805)分别对动态范围估计装置(11801)所获得的Dmax和Dmin进行编码并输出编码数据。
如上所述,在本实施例中,通过利用图象中几乎所有的象素都具有均匀的最小值或最大值以及沿边界分布的中间值的多值图象的特性,对中间值的分布状态进行分析,对中间值分布提供良好近似的平滑函数进行估计,以及对与所估计平滑函数相对应的二值基本图象进行估计。通过对所估计的最大象素值和最小象素值、估计的平滑函数和估计的二值基本图象分别进行编码以及将结果输出为编码数据,能够实现有效的编码。
(实施例B6)
图57是表明本发明第B6实施例的图象解码装置结构的方框图。以下将参考该图描述本实施例的结构。
在该图中,二值图象解码装置(12101)是通过对二值图象编码数据进行解码而恢复二值图象的装置。
平滑函数系数解码装置(12102)是通过对平滑函数编码数据进行解码而恢复平滑函数的装置。
动态范围解码装置(12103)是通过对动态范围编码数据进行解码而恢复动态范围的装置。
二值至多值转换装置(12104)是通过利用平滑函数解码装置(12102)所恢复的平滑函数对二值图象进行平滑以及通过利用动态范围解码装置(12103)所恢复的动态范围进行亮度转换而恢复多值图象的装置。
以下将描述由此构成的本实施例的图象解码装置的操作。
二值图象解码装置(12101)通过对利用传真等系统常用的CCITT国际标准中所定义的二值图象编码方案MMR编码的二值图象编码数据进行解码,恢复仅具有两个象素值0和255的二值图象。
平滑函数系数解码装置(12102)是通过对平滑函数编码数据进行解码而恢复平滑滤波器系数和标度,以及因此恢复平滑函数。动态范围解码装置(12103)是通过对动态范围编码数据进行解码而恢复最大象素值Dmax和最小象素值Dmin
二值至多值转换装置(12104)采用与平滑函数系数解码装置(12102)所恢复的平滑滤波器的卷积。此外,利用动态范围解码装置(12103)所恢复的最大象素值Dmax和最小象素值Dmin,进行如图46所示的线性转换,恢复多值图象。
如上所述,在本实施例中,通过利用图象中几乎所有的象素都具有均匀的最小值或最大值以及沿边界分布的中间值的多值图象的特性,对中间值的分布状态进行分析,对中间值分布提供良好近似的平滑函数进行估计,以及对与所估计平滑函数相对应的二值基本图象进行估计。通过对所估计的最大象素值和最小象素值、估计的平滑函数和估计的二值基本图象分别进行编码以及对编码数据进行解码并输出,能够实现具有较少代码位的有效解码。
(实施例B7)
图58是表明本发明第B7实施例的图象编码装置结构的方框图。以下将参考该图描述本实施例的结构。
在该图中,多值至二值转换装置(12201)是取目标图象(取值范围在0至255之间,每个取值为整数)作为输入,通过给0值的象素分配0值而给其它值的象素分配255值而对输入目标图象进行二值化的装置。
二值图象编码装置(12202)是对取值为{0,255}的二值图象进行编码和输出编码数据的装置。平滑函数估计装置(12203)是确定平滑函数的装置。平滑函数编码装置(12204)是对如此确定的功能进行编码的装置。这里,平滑函数估计装置(12203)对应于本发明的平滑函数发生装置。
以下将描述由此构成的本实施例的图象编码装置的操作。
通过二值图象编码装置(12202)对由多值至二值图象转换装置(12201)作过二值化的二值图象进行编码。对于这种编码,采用了传真等系统常用的CCITT国际标准中所定义的二值图象编码方案MMR,0值为白,255值为黑。
另一方面,利用平滑函数估计装置(12203)将二值化的图象与输入多值图象进行比较,确定平滑函数。以下将参考图60和61说明这一点。
正如在背景技术中所描述的,许多α平面具有绝大部分是均匀的和中间值沿边界分布的特性。为了再现沿边界分布的中间值,考虑平滑操作,这里,根据垂直(b3,b0)和水平(b2,b1)相邻象素的值是否为255,对于中心象素值x作出替换。
由于通过给0值的象素分配0和给其它值的象素分配255对目标多值图象进行二值化,只有在目标象素的值为255时才进行替换。因此,取值为255的象素的四个相邻象素的二值化图案是由四个位(16个图案)表示的。
平滑函数估计装置(12203)对图象进行扫描,通过寻找取值为255的象素的四个相邻象素的16图案中每个图案的平均值获得替换值。表1示出一个例子。
(表1)
b3 b2 b1 b0 X
≠255 ≠255 ≠255 ≠255 32
≠255 ≠255 ≠255 =255 64
≠255 ≠255 =255 ≠255 64
≠255 ≠255 =255 =255 128
≠255 =255 ≠255 ≠255 64
≠255 =255 ≠255 =255 128
≠255 =255 =255 ≠255 128
≠255 =255 =255 =255 192
=255 ≠255 ≠255 ≠255 64
=255 ≠255 ≠255 =255 128
=255 ≠255 =255 ≠255 128
=255 ≠255 =255 =255 192
=255 =255 ≠255 ≠255 128
=255 =255 ≠255 =255 192
=255 =255 =255 ≠255 192
=255 =255 =255 =255 255
于是,在边界处的象素值从0变为255的情况下,例如,如图61中第一平滑级所示,将象素值替换为128。如果在轮廓上或者附近存在两个具有中间值的象素,那么,对于取值为255的象素,以递归方式重复进行寻找取值为255的象素的四个相邻象素的16个图案中每个图案的平均值的操作。表2示出第二操作的结果。以这种方式,能够表示对应于图61中第二平滑级的具有中间值的边界。
(表2)
b3 b2 b1 b0 X
≠255 ≠255 ≠255 ≠255 128
≠255 ≠255 ≠255 =255 128
≠255 ≠255 =255 ≠255 128
≠255 ≠255 =255 =255 192
≠255 =255 ≠255 ≠255 128
≠255 =255 ≠255 =255 192
≠255 =255 =255 ≠255 192
≠255 =255 =255 =255 192
=255 ≠255 ≠255 ≠255 128
=255 ≠255 ≠255 =255 192
=255 ≠255 =255 ≠255 192
=255 ≠255 =255 =255 192
=255 =255 ≠255 ≠255 192
=255 =255 ≠255 =255 192
=255 =255 =255 ≠255 192
=255 =255 =255 =255 255
获得平滑函数估计装置(12203)的输出,作为平滑级的数目(在所示的例子中,是2级,最大可能数目是8级)和对应于级数目的(b3、b2、b1、b0)图案的象素值表。这里,级的数目是指以递归方式重复进行平滑操作的重复次数。平滑函数编码装置(12204)将平滑级的数目编码为三个位数和将(b3、b2、b1、b0)图案的象素值表编码为8位×15(包括所有象素值为255图案在内的图案的数目)×级的数目。
(实施例B8)
图59是表明本发明第B8实施例的图象解码装置结构的方框图。以下将参考该图描述本实施例的结构。将第七实施例图象编码装置的输出提供作为本实施例图象解码装置的输入。二值图象解码装置(12301)是取二值图象编码装置(12202)的输出作为输入并从二值图象编码数据中恢复{0,255}二值图象的装置。平滑函数解码装置(12302)是对平滑函数编码装置(12204)的输出进行解码的解码装置。二值至多值转换装置(12303)是取平滑函数和二值图象为输入和重构多值图象的装置。
以下将描述由此构成的本实施例的图象解码装置的操作。
二值图象解码装置(12301)采用MMR解码方案。对于与级数目相对应的图案,平滑函数解码装置对平滑级的数目和替换象素值表进行解码。假设在图象解码装置例子中所采用的解码表是两个表,即表1和表2。二值至多值转换装置(12303)在取值为255的每个象素上进行转换,通过参考其四个相邻象素利用表1和2以两级对其值进行转换,如图61所示。
如上所述,在第七和第八实施例中,通过利用图象中几乎所有的象素都具有均匀的二值以及中间值沿边界分布的多值图象的特性,对中间值的分布状态进行分析,对中间值分布提供良好近似的平滑函数进行估计。由于平滑函数是由多级表示的,即使中间值的宽度大于或等于两个象素,对应最高为8个象素,能够表示任何平滑图案。这里,任何平滑图案是指边界上的升/降特性。
(实施例B9)
图62是表明本发明第B9实施例的图象编码装置结构的方框图。以下将参考该图描述本实施例的结构。在该图中,多值至二值转换装置(12601)是取目标图象(取值范围为0至255,每个取值为整数)作为输入,通过给0值的象素分配0值和给其它值的象素分配255值对输入目标图象进行二值化的装置。二值图象编码装置(12602)是对取值为{0,255}的二值图象进行编码和输出编码数据的装置。平滑函数估计装置(12603)是确定平滑函数的装置。
平滑函数编码装置(12604)是对如此确定的功能进行编码的装置。二值至多值转换装置(12605)是取平滑函数和二值图象作为输入并重构多值图象的装置。差分计算器(12606)是获得二值至多值转换装置(12605)输出与目标多值图象之间差值的装置。剩余编码装置(12607)是对差值进行编码的装置。
以下将描述由此构成的本实施例的图象编码装置的操作。
标号2601至2605表示的方块与以前参考图58和59所述的相同名称的方块的构造和操作是相同的。在本实施例中,采用第七实施例中所示的图象编码装置作为预测器,即取二值至多值转换装置(12605)的输出作为预测图象,通过差分计算器(12606)获得预测图象的差值,然后,由剩余编码装置(12607)对差值进行编码。
对于差值的编码,采用活动图象编码H.261的CCITT国际标准所定义的帧间编码模式(离散余弦变换编码)。
(实施例B10)
图63是表明本发明第B10实施例的图象解码装置结构的方框图。以下将参考该图描述本实施例的结构。将第九实施例图象编码装置的输出提供作为本实施例图象解码装置的输入。
在该图中,二值图象解码装置(12701)是取二值图象编码装置(12602)的输出作为输入并从二值图象编码数据中恢复{0,255}二值图象的装置。平滑函数解码装置(12702)是对平滑函数编码装置(12604)的输出进行解码的解码装置。二值至多值转换装置(12703)是取平滑函数和二值图象为输入和重构多值图象的装置。剩余解码装置(12704)是取剩余编码装置(12607)的输出作为输入和获得剩余的装置。加法器(12705)将二值至多值转换装置(12703)的输出与剩余解码装置(12704)相加。
以下将描述由此构成的本实施例的图象解码装置的操作。
标号2701至2705表示的方块与以前参考图58和59所述的相同名称的方块的构造和操作是相同的。剩余解码装置(12704)采用活动图象编码H.261中所定义的帧间解码模式,与剩余编码装置(12607)的输出相对应。因此重构差值信号,代表图41中目标多值图象与通过对二值图象进行平滑而获得的图象之间的差值,在加法器(12705)中加上差值信号,重构多值图象。
在第九和第十实施例中,采用第七和第八实施例中所示的图象编码方法进行预测,对预测的剩余成分分别进行编码、发送和存储,由此实现目标多值图象的更准确的再现。具体地说,通过预测边界上象素值的突然变换,能够从剩余信号中去除高频成分,因此而能够提高离散余弦变换编码的效率。
(实施例B11)
图64是表明本发明第B11实施例的图象编码装置结构的方框图。以下将参考该图描述本实施例的结构。
在该图中,动态范围估计装置(20101)是取目标多值图象作为输入、提取多值图象中最大面积的象素值和次最大面积的象素值以及将它们作为动态范围而输出的装置。
多值至二值转换装置(20103)是利用动态范围进行亮度转换以及利用预定的阈值进行阈值化,产生二值图象的装置。
平滑函数估计装置(20102)是通过考虑多值至二值转换装置(20103)中进行的阈值化对多值图象中亮度梯度进行分析并估计平滑函数的装置。
动态范围编码装置(20105)是对动态范围进行编码和输出编码数据的装置。
平滑函数编码装置(20106)是对平滑函数进行编码和输出编码数据的装置。
二值图象编码装置(20104)是对二值图象进行编码和输出编码数据的装置。
以下将参考图40、49等描述由此构成的本发明的图象编码装置的操作以及按照本发明一个实施例的图象编码方法的操作。
动态范围估计装置(20101)提取多值图象中最大面积的象素值和次最大面积的象素值;在许多多值图象中,这些象素值分别与最大象素值和最小象素值相一致,从而在本实施例中,通过对目标的多值图象的扫描可提取最大象素值Dmax和最小象素值Dmin
多值至二值转换装置(20103)进行线性转换,如图40所示,并利用阈值128对每个象素值进行阈值化,将最大值Dmax设定为255和将最小值Dmin设定为0。
平滑函数估计装置(20102)通过多值至二置转换装置(20103)所进行的阈值化和图象中象素值的平均梯度,对平滑函数进行估计。在本实施例中,由于阈值化是利用多值至二值转换装置(20103)中阈值128进行的,采用了参考点在其中心处的平均滤波器。
平均滤波器的大小是由图象中象素值的平均梯度确定的。
图象中象素值的平均梯度dave是以以下方式计算的。
在x-方向滤波(10301)中,应用x-方向滤波器(10401)在图象上扫描,沿图象中的x-方向对梯度进行检测。
在y-方向滤波(10302)中,应用y-方向滤波器(10402)在图象上扫描,沿图象中的y-方向对梯度进行检测。
在梯度检测(10303)中,利用x-方向滤波(10301)获得的x-方向梯度dx(i,j)和y-方向滤波(10302)获得的y-方向梯度dy(i,j),通过在第1实施例中给出的方程式B1的计算,对梯度d(i,j)进行检测,这里(i,j)是图象上的坐标。
在梯度方向检测(10304)中,利用x-方向滤波(10301)获得的x-方向梯度dx(i,j)和y-方向滤波(10302)获得的y-方向梯度dy(i,j),通过在第1实施例中给出的方程式B2的计算,对梯度方向θ(i,j)进行检测,这里(i,j)是图象上的坐标。
在非最大值抑制(10305)中,如图40所示,利用随θ变化的窗口,以这样的方式产生图象,即如果在窗口中参考点上的梯度值是最大值,那么给该参考点的坐标上的图象部分分配1值;否则,给参考点的坐标上的图象部分分配0值。
在平均梯度检测(10306)中,对于由非最大值抑制(10305)所获得的二值图象中取1值的象素,通过计算梯度检测(10303)中所检测到梯度的平均值可获得平均梯度d’ave。此外,利用动态范围估计装置(20101)所检测的最大象素值Dmax和最小象素值Dmin,由第1实施例中给出的方程式B3重新计算归一化的平均梯度,得到dave
平均滤波器的大小是根据归一化的平均梯度dave并参考图49而确定的。
二值图象编码装置(20104)利用二值图象编码方案MMR(在传真系统常用的CCITT国际标准中所定义的)对二值图象进行编码并输出编码数据。
平滑函数编码装置(20106)对平滑函数估计装置(20102)所估计的平滑函数进行编码并输出编码数据。在本实施例情况中,对平均滤波器的大小进行编码,将其输出为编码数据。
动态范围编码装置(20105)分别对动态范围估计装置(20101)所获得的Dmax和Dmin进行编码并输出编码数据。
如上所述,在本实施例中,通过利用图象中几乎所有的象素都具有均匀的最小值或最大值以及沿边界分布的中间值的多值图象的特性,对中间值的分布状态进行分析,以及对中间值分布提供良好近似的平滑函数进行估计。通过对所估计的最大象素值和最小象素值、估计的平滑函数和估计的二值图象分别进行编码以及将结果输出为编码数据,能够实现有效的编码。
在任一上述实施例中,可以产生拥有由计算机执行以上所述全部或部分装置功能的程序的磁性记录媒体或光学记录媒体,这些程序能够在计算机上运行,以执行上述的操作。
在以上的实施例中已经对本发明的图象编码装置作了描述,它包括动态范围估计装置及其编码装置,但是,这并不是必要条件,例如,在许多情况中由于Dmax为255和Dmin为0,上述这两个装置可以被省略。在这种情况下,如图65所示,图象编码装置包括平滑函数估计装置(10102),从目标多值图象(这是待编码的图象)估计平滑函数;多值至二值转换装置(10103),按照确定与估计平滑函数匹配的多值至二值转换准则将多值图象转换为二值图象;二值图象编码装置(10104),对二值图象进行编码并将其输出为二值图象编码数据;平滑函数编码装置(10106),对估计的平滑函数进行编码并将其输出为平滑函数编码数据。根据这种结构,从待编码的目标多值图象估计平滑函数;按照确定与估计平滑函数匹配的多值至二值转换准则将多值图象转换为二值图象;对二值图象进行编码并输出为二值图象编码数据;对估计的平滑函数进行编码并输出为平滑函数编码数据。此外,在这种情况下,能够获得同第一种所述结构中所实现的相同效果。
此外,在以上的实施例中已经对本发明的图象编码装置作了描述,它包括平滑函数估计装置,但是,这并不是必要条件,例如,不包括平滑函数估计装置的结构也是可以的。在这种情况下,如图66所示,图象编码装置包括多值至二值转换装置,取待编码的目标多值图象和平滑函数作为输入和基于平滑函数从多值图象产生二值图象;二值图象编码装置,对二值图象进行编码并将其输出为二值图象编码数据;平滑函数编码装置,对平滑函数进行编码并将其输出为平滑函数编码数据。平滑函数是这么进行调节的预定功能,即如果将平滑函数运用到二值图象上,能够有效地或者以逼近方式再现原始多值图象。根据这种结构,输入待编码的目标多值图象和平滑函数;基于平滑函数从多值图象产生二值图象;对二值图象进行编码并输出为二值图象编码数据;对平滑函数进行编码并输出为平滑函数编码数据。此外,在这种情况下,能够获得同第一种所述结构中所实现的大致相同效果。
在图66所示的实施例中已经对本发明的图象编码装置作了描述,它不包括动态范围估计装置等,但是,这并不是必要条件,例如,包括动态范围估计装置的结构也是可以的。在这种情况下,图象编码装置除了图66中所示的元件外还包括从目标多值图象中获得动态范围的动态范围估计装置和对动态范围进行编码并将其输出为动态范围编码数据的动态范围编码装置,如图67所示。在这种结构中,多值至二值转换装置还通过考虑动态范围产生二值图象。在操作中,这种结构除了涉及到联系图66结构所描述的操作外还涉及到从目标多值图象获得动态范围、对动态范围进行编码并将其输出为动态范围编码数据。
此外,在图64所示的实施例中已经对本发明的图象编码装置作了描述,它包括动态范围估计装置等,但是,这并不是必要条件,例如,不包括动态范围估计装置的结构也是可以的。在这种情况下,如图68所示,图象编码装置包括多值至二值转换装置(20103),按照确定与多值图象匹配的多值至二值转换准则将多值图象(待编码的图象)转换为二值图象;平滑函数估计装置(20102),这样估计平滑函数,即如果将相同的平滑函数运用到二值图象上,能够有效地或者以逼近方式再现原始多值图象;二值图象编码装置(20104),对二值图象进行编码并将其输出为二值图象编码数据;以及平滑函数编码装置(20106),对估计的平滑函数进行编码并将其输出为平滑函数编码数据。根据这种结构,按照确定与估计待编码目标多值图象匹配的多值至二值转换准则将多值图象转换为二值图象;对平滑函数进行估计,如果被运用到二值图象上,它能够有效地或者以逼近方式再现原始多值图象;对二值图象进行编码并输出为二值图象编码数据;以及对估计的平滑函数进行编码并输出为平滑函数编码数据。此外,在这种情况下,能够获得同第一种所述结构中所实现的相同效果。
在以上的实施例中已经对本发明的图象解码装置作了描述,它包括动态范围解码装置等,但是,这并不是必要条件,例如,不包括动态范围解码装置的结构也是可以的。在这种情况下,图象解码装置具有接受图58、65、66或68中所示图象编码装置输出的多种的编码数据的结构,如图69所示,它包括:二值图象解码装置,通过对编码数据之中的二值图象编码数据进行解码而恢复二值图象;平滑函数解码装置,通过对编码数据之中的平滑函数编码数据进行解码而恢复平滑函数;以及二值至多值转换装置,利用已解码的平滑函数通过对已解码的二值图象进行平滑而恢复多值图象。根据这种结构,输入从任何一个图象编码装置输出的多种编码数据;在编码数据之中,对二值图象编码数据进行解码,恢复二值图象;在编码数据之中,对平滑函数编码数据进行解码,恢复平滑函数;利用已解码的平滑函数通过对已解码的二值图象进行平滑而恢复多值图象。此外,在这种情况中,能够获得同所述第一结构中实现的效果大致相同的效果。
如上所述,由于下面给出的原因,利用本发明的图象编码装置、图象解码装置、图象编码方法和图象解码方法能够实现比利用现有多值图象编码技术更有效的编码和解码。
1.在多值图象中,对中间值沿占据图象中主要部分的最大值区域与也占据图象中主要部分的最小值区域之间边界的分布进行分析,确定提供该分布良好近似的平滑函数。
2.基于在1中所确定的平滑函数,产生仅有两个值(最大值和最小值)的二值图象。
3.采用1中所确定的平滑函数以及在2中产生的二值图象表示多值图象进行相应的编码。
4.在解码器上,对已编码的平滑函数和二值图象进行解码,重构多值图象。
从以上的描述中显而易见,本发明的优点在于能够实现比现有技术所能实现的更有效的编码和解码。
工业应用性
如上所述,根据本发明,通过从以前获得的具有高度相关性的二值图象中对待编码的象素进行预测以及通过对其差值进行编码,能够实现比利用现有二值图象编码和解码技术更有效的编码和解码。此外,根据本发明,对例如中间值的分布进行分析,分别对近似该分布的平滑函数和仅有两个值(最大值和最小值)的二值基本图象进行编码,然后进行解码,由此实现比现有技术所能实现的更有效的编码和解码。

Claims (29)

1.一种通过参照一参考二值图象对目标二值图象进行编码的图象编码方法,其特征在于,所述方法包括以下步骤:
第一分块步骤,通过从所述目标二值图象获得包含多个象素的目标块;
第二分块步骤,通过从所述参考二值图象获得包含多个象素的参考块;
统计模型选择步骤,基于所述参考块中一个参考象素周围的象素的状态,从多个统计模型中选择一个统计模型,所述参考象素对应于所述目标块中的一个目标象素;
算术编码步骤,根据所述的所选统计模型通过对所述目标象素进行算术编码而获得所述目标块的编码数据。
2.如权利要求1所述的图象编码方法,其特征在于:所述参考块中所述参考象素周围的所述象素是定位在与所述参考象素相距一个象素距离中的象素。
3.如权利要求1所述的图象编码方法,其特征在于:所述参考块中所述参考象素周围的所述象素是直接位于所述参考象素之上、之下、之左和之右的四个象素。
4.如权利要求1、2或3所述的图象编码方法,其特征在于:所述的所选统计模型基于所述目标象素周围的象素的状态。
5.如权利要求4所述的图象编码方法,其特征在于:所述目标象素周围的象素直接定位在所述目标象素之上、之下、之左和之右。
6.一种通过参照一参考二值图象对目标二值图象进行编码的图象编码装置,其特征在于,所述图象编码装置包括:
第一分块装置,通过从所述目标二值图象获得包含多个象素的目标块;
第二分块装置,通过从所述参考二值图象获得包含多个象素的参考块;
统计模型选择装置,基于所述参考块中一个参考象素周围的象素的状态,从多个统计模型中选择一个统计模型,所述参考象素对应于所述目标块中的一个目标象素;
算术编码装置,根据所述的所选统计模型通过对所述目标象素进行算术编码而获得所述目标块的编码数据。
7.如权利要求6所述的图象编码装置,其特征在于:所述参考块中所述参考象素周围的所述象素是定位在与所述参考象素相距一个象素距离中的象素。
8.如权利要求6所述的图象编码装置,其特征在于:所述参考块中所述参考象素周围的所述象素是直接位于所述参考象素之上、之下、之左和之右的四个象素。
9.如权利要求6、7或8所述的图象编码装置,其特征在于:所述的所选统计模型基于所述目标象素周围的象素的状态。
10.如权利要求9所述的图象编码装置,其特征在于:所述目标象素周围的象素直接定位在所述目标象素之上、之下、之左和之右。
11.一种通过参照一参考二值图象对目标二值图象进行编码的图象编码方法,其特征在于,所述方法包括以下步骤:
运动估计步骤,通过从所述参考二值图象搜索一运动补偿块,以输出目标块的运动信息;
运动补偿分块步骤,获得所述运动补偿块,作为一个参考块;
统计模型选择步骤,基于所述参考块中一个参考象素周围的象素的状态,从多个统计模型中选择一个统计模型,所述参考象素对应于所述目标块中的一个目标象素;和
算术编码步骤,基于所述的所选统计模型通过对所述目标象素进行算术编码而获得所述目标块的编码数据。
12.如权利要求11所述的图象编码方法,其特征在于:所述参考块中所述参考象素周围的所述象素是定位在与所述参考象素相距一个象素距离中的象素。
13.如权利要求11所述的图象编码方法,其特征在于:所述参考块中所述参考象素周围的所述象素是直接位于所述参考象素之上、之下、之左和之右的四个象素。
14.如权利要求11、12或13所述的图象编码方法,其特征在于:所述的所选统计模型基于所述目标象素周围的象素的状态。
15.如权利要求14所述的图象编码方法,其特征在于:所述目标象素周围的象素直接定位在所述目标象素之上、之下、之左和之右。
16.一种通过参照一参考二值图象对目标二值图象进行编码的图象编码装置,其特征在于,所述图象编码装置包括:
运动估计装置,通过从所述参考二值图象搜索一运动补偿块,以输出目标块的运动信息;
运动补偿分块装置,获得所述运动补偿块,作为一个参考块;
统计模型选择装置,基于所述参考块中一个参考象素周围的象素的状态,从多个统计模型中选择一个统计模型,所述参考象素对应于所述目标块中的一个目标象素;和
算术编码装置,基于所述的所选统计模型通过对所述目标象素进行算术编码而获得所述目标块的编码数据。
17.如权利要求16所述的图象编码装置,其特征在于:所述参考块中所述参考象素周围的所述象素是定位在与所述参考象素相距一个象素距离中的象素。
18.如权利要求16所述的图象编码装置,其特征在于:所述参考块中所述参考象素周围的所述象素是直接位于所述参考象素之上、之下、之左和之右的四个象素。
19.如权利要求16、17或18所述的图象编码装置,其特征在于:所述的所选统计模型基于所述目标象素周围的象素的状态。
20.如权利要求19所述的图象编码装置,其特征在于:所述目标象素周围的象素直接定位在所述目标象素之上、之下、之左和之右。
21.一种通过参照一参考二值图象对目标二值图象进行编码以获得编码数据的图象编码方法,其特征在于,所述方法包括以下步骤:
第一分块步骤,通过从所述目标二值图象获得包含多个象素的目标块;
第二分块步骤,通过从所述参考二值图象获得包含多个象素的参考块;
参考块采用确定步骤,确定所述参考块是否被采用;
统计模型选择步骤,基于所述参考块中一个参考象素周围的象素的状态,从多个统计模型中选择一个统计模型,所述参考象素对应于所述目标块中的一个目标象素;
算术编码步骤,根据所述的所选统计模型通过对所述目标象素进行算术编码而获得所述目标块的编码数据;以及
目标象素编码步骤,通过对所述目标块的算术编码而获得所述目标块的所述编码数据;其中
当所述参考块采用确定步骤指示所述参考块被采用时,执行所述第一分块步骤和所述统计模型选择步骤,从而从所述算术编码步骤输出所述编码数据;
当所述参考块采用确定步骤指示所述参考块不被采用时,执行所述目标象素编码步骤,从而从所述目标象素编码步骤输出所述编码数据;以及
输出一参考块采用确定信号,作为所述参考块确定步骤中的确定结果。
22.如权利要求21所述的图象编码方法,其特征在于:所述的确定所述参考块是否被采用是基于比较所述目标块与所述参考块的结果。
23.如权利要求21所述的图象编码方法,其特征在于:所述的确定所述参考块是否被采用是基于比较所述算术编码步骤中输出位数目与所述目标象素编码步骤中输出位数目的结果。
24.一种通过参照一参考二值图象对目标二值图象进行编码以获得编码数据的图象编码装置,其特征在于,所述图象编码装置包括:
第一分块装置,通过从所述目标二值图象获得包含多个象素的目标块;
第二分块装置,通过从所述参考二值图象获得包含多个象素的参考块;
参考块采用确定装置,确定所述参考块是否被采用;
统计模型选择装置,基于所述参考块中一个参考象素周围的象素的状态,从多个统计模型中选择一个统计模型,所述参考象素对应于所述目标块中的一个目标象素;
算术编码装置,根据所述的所选统计模型通过对所述目标象素进行算术编码而获得所述目标块的编码数据;以及
目标象素编码装置,通过对所述目标块的算术编码,获得所述目标块的所述编码数据;其中
当所述参考块采用确定装置指示所述参考块被采用时,所述第一分块装置和所述统计模型选择装置工作,从而从所述算术编码装置输出所述编码数据;
当所述参考块采用确定装置指示所述参考块不被采用时,所述目标象素编码装置工作,从而从所述目标象素编码装置输出所述编码数据;以及
输出一参考块采用确定信号,作为所述参考块确定装置的确定输出。
25.如权利要求24所述的图象编码装置,其特征在于:所述的确定所述参考块是否被采用是基于比较所述目标块与所述参考块的结果。
26.如权利要求24所述的图象编码装置,其特征在于:所述的确定所述参考块是否被采用是基于比较所述算术编码步骤中输出位数目与所述目标象素编码步骤中输出位数目的结果。
27.一种通过参照一参考二值图象对目标二值图象进行编码的图象编码方法,其特征在于,所述方法包括以下步骤:
第一分块步骤,通过从所述目标二值图象获得包含多个象素的目标块;
第二分块步骤,通过从所述参考二值图象获得包含多个象素的参考块;
统计模型产生步骤,从所述参考块产生所述目标块的统计模型;和
算术编码步骤,根据所述的所产生的统计模型通过对所述目标象素进行算术编码而获得所述目标块的编码数据。
28.一种通过参照一参考二值图象对目标二值图象进行编码的图象编码方法,其特征在于,所述方法包括以下步骤:
运动估计步骤,通过从所述参考二值图象搜索一运动补偿块,以输出目标块的运动信息;
运动补偿分块步骤,获得所述运动补偿块,作为一个参考块;
统计模型产生步骤,从所述参考块产生所述目标块的统计模型;和
算术编码步骤,基于所述的所产生的统计模型通过对目标象素进行算术编码而获得所述目标块的编码数据。
29.一种通过参照一参考二值图象对目标二值图象进行编码以获得编码数据的图象编码方法,其特征在于,所述方法包括以下步骤:
第一分块步骤,通过从所述目标二值图象获得包含多个象素的目标块;
第二分块步骤,通过从所述参考二值图象获得包含多个象素的参考块;
参考块采用确定步骤,确定所述参考块是否被采用;
统计模型产生步骤,从所述参考块产生所述目标块的统计模型;
算术编码步骤,根据所述的所产生的统计模型通过对所述目标象素进行算术编码而获得所述目标块的编码数据;
目标象素编码步骤,通过对所述目标块的算术编码,获得所述目标块的所述编码数据;其中
当所述参考块采用确定步骤指示所述参考块被采用时,执行所述第一分块步骤和所述统计模型选择步骤,从而从所述算术编码步骤输出所述编码数据;
当所述参考块采用确定步骤指示所述参考块不被采用时,执行所述目标象素编码步骤,从而从所述目标象素编码步骤输出所述编码数据;以及
输出一参考块采用确定信号,作为所述参考块确定步骤中的确定结果。
CNB971983143A 1996-07-31 1997-07-25 图象编码方法和图象编码装置 Expired - Fee Related CN1178460C (zh)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
JP202346/1996 1996-07-31
JP202346/96 1996-07-31
JP20234696 1996-07-31
JP258077/1996 1996-09-30
JP25807796 1996-09-30
JP258077/96 1996-09-30
JP279170/1996 1996-10-22
JP279170/96 1996-10-22
JP27917096 1996-10-22

Related Child Applications (3)

Application Number Title Priority Date Filing Date
CNB01121158XA Division CN1178458C (zh) 1996-07-31 1997-07-25 图象解码装置和图象解码方法
CNB011210117A Division CN1196342C (zh) 1996-07-31 1997-07-25 图象解码装置和图象解码方法
CNB011211598A Division CN1196319C (zh) 1996-07-31 1997-07-25 图象解码装置和图象解码方法

Publications (2)

Publication Number Publication Date
CN1231797A CN1231797A (zh) 1999-10-13
CN1178460C true CN1178460C (zh) 2004-12-01

Family

ID=27328081

Family Applications (4)

Application Number Title Priority Date Filing Date
CNB011211598A Expired - Fee Related CN1196319C (zh) 1996-07-31 1997-07-25 图象解码装置和图象解码方法
CNB01121158XA Expired - Fee Related CN1178458C (zh) 1996-07-31 1997-07-25 图象解码装置和图象解码方法
CNB011210117A Expired - Fee Related CN1196342C (zh) 1996-07-31 1997-07-25 图象解码装置和图象解码方法
CNB971983143A Expired - Fee Related CN1178460C (zh) 1996-07-31 1997-07-25 图象编码方法和图象编码装置

Family Applications Before (3)

Application Number Title Priority Date Filing Date
CNB011211598A Expired - Fee Related CN1196319C (zh) 1996-07-31 1997-07-25 图象解码装置和图象解码方法
CNB01121158XA Expired - Fee Related CN1178458C (zh) 1996-07-31 1997-07-25 图象解码装置和图象解码方法
CNB011210117A Expired - Fee Related CN1196342C (zh) 1996-07-31 1997-07-25 图象解码装置和图象解码方法

Country Status (9)

Country Link
US (4) US6404932B1 (zh)
EP (3) EP1158805B1 (zh)
KR (4) KR100422935B1 (zh)
CN (4) CN1196319C (zh)
AT (3) ATE252805T1 (zh)
DE (3) DE69720560T2 (zh)
ES (2) ES2184117T3 (zh)
TW (1) TW366668B (zh)
WO (1) WO1998005159A1 (zh)

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999065226A1 (fr) * 1998-06-09 1999-12-16 Matsushita Electric Industrial Co., Ltd. Codeur et decodeur d'images, verificateur de caracteres et support de donnees
US6721457B1 (en) * 1999-08-27 2004-04-13 Hewlett-Packard Development Company, L.P. Method for enhancing digital images
JP2002064821A (ja) * 2000-06-06 2002-02-28 Office Noa:Kk 動画像情報の圧縮方法およびそのシステム
US7221483B2 (en) * 2000-09-05 2007-05-22 Ricoh Company, Ltd. Image encoding method and apparatus, image decoding method and apparatus, image processing apparatus, image formation apparatus, and computer-executable programs
US6888968B1 (en) * 2000-09-21 2005-05-03 Kabushiki Kaisha Toshiba Image processing apparatus and image processing method
US7171444B2 (en) * 2001-11-14 2007-01-30 Sharp Laboratories Of America, Inc. Remote desktop protocol compression system
EP2933756B1 (en) * 2002-04-23 2020-04-29 Ntt Docomo, Inc. System and method for arithmetic encoding and decoding
US9577667B2 (en) 2002-04-23 2017-02-21 Ntt Docomo, Inc. System and method for arithmetic encoding and decoding
US7321623B2 (en) 2002-10-01 2008-01-22 Avocent Corporation Video compression system
US7738552B2 (en) * 2002-12-06 2010-06-15 Broadcom Company Processing data streams
US9560371B2 (en) * 2003-07-30 2017-01-31 Avocent Corporation Video compression system
CN1655620B (zh) * 2004-02-09 2010-09-22 三洋电机株式会社 图像显示装置
US7457461B2 (en) * 2004-06-25 2008-11-25 Avocent Corporation Video compression noise immunity
US7720295B2 (en) * 2004-06-29 2010-05-18 Sanyo Electric Co., Ltd. Method and apparatus for coding images with different image qualities for each region thereof, and method and apparatus capable of decoding the images by adjusting the image quality
JP4656912B2 (ja) * 2004-10-29 2011-03-23 三洋電機株式会社 画像符号化装置
JP2006129248A (ja) * 2004-10-29 2006-05-18 Sanyo Electric Co Ltd 画像符号化方法および装置、ならびに画像復号方法および装置
CA2650663A1 (en) * 2006-04-28 2007-11-08 Avocent Corporation Dvc delta commands
JP4993676B2 (ja) * 2006-09-01 2012-08-08 キヤノン株式会社 画像符号化装置及び画像符号化方法
JP5054981B2 (ja) * 2007-01-12 2012-10-24 キヤノン株式会社 撮像装置及び撮像処理方法
KR101012275B1 (ko) * 2008-04-29 2011-02-07 주식회사 영진공영 배관 파이프 지지장치
KR101710619B1 (ko) * 2009-02-04 2017-02-28 삼성전자주식회사 단계적인 영상 부호화, 복호화 방법 및 장치
JP5210198B2 (ja) * 2009-02-13 2013-06-12 オリンパス株式会社 画像処理装置、画像処理方法、画像処理プログラム
AU2009251048B2 (en) * 2009-12-18 2013-12-19 Canon Kabushiki Kaisha Background image and mask estimation for accurate shift-estimation for video object detection in presence of misalignment
US8968080B1 (en) 2010-11-05 2015-03-03 Wms Gaming, Inc. Display of third party content on a wagering game machine
JP5744614B2 (ja) * 2011-04-28 2015-07-08 オリンパス株式会社 画像処理装置、画像処理方法、および、画像処理プログラム
EP3576412B1 (en) * 2011-11-08 2021-09-01 Nokia Technologies Oy Reference picture handling
US9286323B2 (en) 2013-02-25 2016-03-15 International Business Machines Corporation Context-aware tagging for augmented reality environments
US9984305B2 (en) * 2016-04-19 2018-05-29 Texas Instruments Incorporated Efficient SIMD implementation of 3x3 non maxima suppression of sparse 2D image feature points
US10430987B1 (en) * 2017-06-09 2019-10-01 Snap Inc. Annotating an image with a texture fill
CN111247806B (zh) 2017-10-27 2023-11-14 松下电器(美国)知识产权公司 解码装置和解码方法
EP3935581A4 (en) 2019-03-04 2022-11-30 Iocurrents, Inc. DATA COMPRESSION AND COMMUNICATION USING MACHINE LEARNING
CN114061524B (zh) * 2021-10-15 2024-07-12 首钢集团有限公司 一种钢卷轮廓测量方法及装置

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6229372A (ja) 1985-07-31 1987-02-07 インタ−ナショナル ビジネス マシ−ンズ コ−ポレ−ション 2値デ−タの圧縮方法
JP2584840B2 (ja) * 1988-08-30 1997-02-26 キヤノン株式会社 画像の階層的符号化装置
JPH02274080A (ja) * 1989-04-14 1990-11-08 Sharp Corp 画像符号化伝送方式
JP2675903B2 (ja) * 1990-05-30 1997-11-12 キヤノン株式会社 画像符号化方式
JPH04306970A (ja) * 1991-04-04 1992-10-29 Canon Inc 画像処理方法及び装置
EP0523939B1 (en) * 1991-07-15 1998-10-07 Canon Kabushiki Kaisha Image encoding
US5442458A (en) * 1991-12-18 1995-08-15 Eastman Kodak Company Method and associated apparatus for encoding bitplanes for improved coding efficiency
JP3068304B2 (ja) * 1992-01-21 2000-07-24 日本電気株式会社 動画像符号化方式および復号化方式
DE69320147T2 (de) * 1992-11-13 1999-01-14 Canon K.K., Tokio/Tokyo Vorrichtung zur Bildkodierung
JP3470763B2 (ja) 1993-01-21 2003-11-25 沖電気工業株式会社 画像符号化及び復号化装置
US5471207A (en) * 1994-02-23 1995-11-28 Ricoh Company Ltd. Compression of palettized images and binarization for bitwise coding of M-ary alphabets therefor
JPH07254990A (ja) * 1994-03-14 1995-10-03 Ricoh Co Ltd 画像通信装置
US5486863A (en) 1994-04-29 1996-01-23 Motorola, Inc. Method for determining whether to intra code a video block
US5608458A (en) * 1994-10-13 1997-03-04 Lucent Technologies Inc. Method and apparatus for a region-based approach to coding a sequence of video images
KR100365555B1 (ko) 1994-10-19 2003-08-27 마츠시타 덴끼 산교 가부시키가이샤 화상부호화/복호화장치
JPH08140085A (ja) * 1994-11-04 1996-05-31 Matsushita Electric Ind Co Ltd 多値信号符号化方法および多値信号復号化方法
EP1098527A1 (en) 1994-11-04 2001-05-09 Matsushita Electric Industrial Co., Ltd. Picture coding apparatus and decoding apparatus
US5689589A (en) * 1994-12-01 1997-11-18 Ricoh Company Ltd. Data compression for palettized video images
DE69521191T2 (de) * 1994-12-16 2001-10-31 Canon K.K., Tokio/Tokyo Kodier- und Dekodiervorrichtung und -verfahren
US5659631A (en) * 1995-02-21 1997-08-19 Ricoh Company, Ltd. Data compression for indexed color image data
JP3086396B2 (ja) * 1995-03-10 2000-09-11 シャープ株式会社 画像符号化装置及び画像復号装置
MY121607A (en) * 1995-07-10 2006-02-28 Hyundai Curitel Inc Grid moving method of object image and apparatus using the same and compaction/motion estimation method using the same and apparatus thereof
US5883678A (en) * 1995-09-29 1999-03-16 Kabushiki Kaisha Toshiba Video coding and video decoding apparatus for reducing an alpha-map signal at a controlled reduction ratio

Also Published As

Publication number Publication date
KR20000029714A (ko) 2000-05-25
KR100422939B1 (ko) 2004-03-12
DE69715426T2 (de) 2003-01-09
EP1158805A1 (en) 2001-11-28
US6760480B2 (en) 2004-07-06
EP1120973A2 (en) 2001-08-01
EP1120973A3 (en) 2001-11-07
DE69725765T2 (de) 2004-04-29
US20010024525A1 (en) 2001-09-27
CN1339915A (zh) 2002-03-13
ES2184117T3 (es) 2003-04-01
DE69725765D1 (de) 2003-11-27
TW366668B (en) 1999-08-11
EP1158805B1 (en) 2003-10-22
US20020090139A1 (en) 2002-07-11
ES2195968T3 (es) 2003-12-16
EP0917351A4 (en) 2000-11-22
CN1178458C (zh) 2004-12-01
US6404932B1 (en) 2002-06-11
KR100437187B1 (ko) 2004-06-23
ATE236490T1 (de) 2003-04-15
DE69720560T2 (de) 2003-11-27
WO1998005159A1 (en) 1998-02-05
DE69715426D1 (de) 2002-10-17
US20010031089A1 (en) 2001-10-18
CN1322085A (zh) 2001-11-14
CN1231797A (zh) 1999-10-13
ATE252805T1 (de) 2003-11-15
KR20030096439A (ko) 2003-12-31
CN1196342C (zh) 2005-04-06
KR100422935B1 (ko) 2004-03-12
KR20030096440A (ko) 2003-12-31
CN1339914A (zh) 2002-03-13
CN1196319C (zh) 2005-04-06
EP1120973B1 (en) 2003-04-02
US6510250B2 (en) 2003-01-21
EP0917351A1 (en) 1999-05-19
DE69720560D1 (de) 2003-05-08
ATE224121T1 (de) 2002-09-15
US6490373B2 (en) 2002-12-03
KR100422943B1 (ko) 2004-03-12
EP0917351B1 (en) 2002-09-11
KR20030096438A (ko) 2003-12-31
US20030086621A1 (en) 2003-05-08

Similar Documents

Publication Publication Date Title
CN1178460C (zh) 图象编码方法和图象编码装置
CN1217546C (zh) 图像编码装置
CN1139256C (zh) 图像编码装置及图像解码装置
CN1172532C (zh) 图像预测编码/解码装置和方法以及记录媒体
CN1175670C (zh) 图像信号转换方法和设备以及图像提供系统
CN1545813A (zh) 图象编码装置、图象译码装置、图象编码方法、图象译码方法、图象编码程序和图象译码程序
CN1169303C (zh) 数据处理装置和方法以及记录介质
CN1178461C (zh) 图像编码装置、图像译码装置、传真装置
CN1640142A (zh) 对小波变换系数进行编码的方法和设备
CN1268135C (zh) 编码方法、编码装置和记录媒体、以及解码方法、解码装置和记录媒体
CN1286575A (zh) 噪声检测方法、噪声检测装置及图象编码装置
CN1922890A (zh) 分段可逆视频编码方法、分段可逆视频译码方法、分段可逆视频编码装置、分段可逆视频译码装置和它们的程序及程序记录媒体
CN1922887A (zh) 图象编码方法和图象解码方法
CN1200571C (zh) 正交变换、逆正交变换方法及装置、编码、解码方法及装置
CN1204753C (zh) 基于相邻像素预测的帧内预测方法
CN1926881A (zh) 运动矢量检测装置、运动矢量检测方法和计算机程序
CN1977540A (zh) 用于图像编码/解码和扩展图像压缩解压缩的方法和设备
CN100350433C (zh) 计算路径误差的方法和提取路径断点的方法
CN1265647C (zh) 块组编码结构及基于块组结构的自适应分阶段预测编码方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20041201

Termination date: 20120725