CN1150283A - 制作标准化图象模板的方法和设备 - Google Patents
制作标准化图象模板的方法和设备 Download PDFInfo
- Publication number
- CN1150283A CN1150283A CN95121123A CN95121123A CN1150283A CN 1150283 A CN1150283 A CN 1150283A CN 95121123 A CN95121123 A CN 95121123A CN 95121123 A CN95121123 A CN 95121123A CN 1150283 A CN1150283 A CN 1150283A
- Authority
- CN
- China
- Prior art keywords
- template
- image
- feature
- elements
- features
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 230000015572 biosynthetic process Effects 0.000 title abstract 2
- 238000012545 processing Methods 0.000 claims description 11
- 238000003860 storage Methods 0.000 claims description 6
- 238000012512 characterization method Methods 0.000 claims 2
- 230000006835 compression Effects 0.000 abstract description 15
- 238000007906 compression Methods 0.000 abstract description 15
- 230000006837 decompression Effects 0.000 abstract 2
- 230000002596 correlated effect Effects 0.000 abstract 1
- 239000013598 vector Substances 0.000 description 13
- 230000001815 facial effect Effects 0.000 description 11
- 238000010606 normalization Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 230000008859 change Effects 0.000 description 5
- 238000012549 training Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 230000004807 localization Effects 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 210000003128 head Anatomy 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000009499 grossing Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 101000822695 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C1 Proteins 0.000 description 1
- 101000655262 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C2 Proteins 0.000 description 1
- 241000081385 Marchesinia Species 0.000 description 1
- 101000655256 Paraclostridium bifermentans Small, acid-soluble spore protein alpha Proteins 0.000 description 1
- 101000655264 Paraclostridium bifermentans Small, acid-soluble spore protein beta Proteins 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 210000000887 face Anatomy 0.000 description 1
- 230000004313 glare Effects 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000004513 sizing Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G07—CHECKING-DEVICES
- G07C—TIME OR ATTENDANCE REGISTERS; REGISTERING OR INDICATING THE WORKING OF MACHINES; GENERATING RANDOM NUMBERS; VOTING OR LOTTERY APPARATUS; ARRANGEMENTS, SYSTEMS OR APPARATUS FOR CHECKING NOT PROVIDED FOR ELSEWHERE
- G07C9/00—Individual registration on entry or exit
- G07C9/30—Individual registration on entry or exit not involving the use of a pass
- G07C9/32—Individual registration on entry or exit not involving the use of a pass in combination with an identity check
- G07C9/37—Individual registration on entry or exit not involving the use of a pass in combination with an identity check using biometric data, e.g. fingerprints, iris scans or voice recognition
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Image Processing (AREA)
- Image Analysis (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本技术便利图象特征模板的构成,该特征模板在相同特征图象的压缩和还原中特别有用。详细地说,该特征模板能够对具有一致的相同图象特征集合的大量图象进行压缩和还原,这些特征能够被调整并定标到相互关联的区域。该特征模板包括若干模板元,每个模板元代表图象的一个特别特征,还包括代表每个模板元属性的数据。
Description
请参考缩微胶片附录。该附录构成本说明书的一部份,它包括一张带有82帧的缩微胶片。
本申请相关以下以容:
美国申请序列号08/145,051,申请日为1993年10月29日,申请人是Ray、Ellson和Gandhi,发明名称为“在事项磁卡上进行图象压缩、存贮和检索的方法和装置”,其柯达案卷目录为68,290。
美国申请序列号08/145,284,申请日为1993年10月29日,申请人是Ray和Ellson,发明名称为“标准化图象库的压缩方法”,其柯达案卷目录为68,291。
美国申请序列号08/144,753,申请日为1993年10月29日,申请人是Ray和Ellson,发明名称为“用保留值数据编码的方法和装置”,其柯达案卷目录为68,362。
柯达案卷目录71,250,与本申请同一日期提交,申请人是Ray、Ellson和Elbaz,发明名称为“对标准化肖像图像进行压缩和还原的方法”。
上述参考申请的教导被允许以参考编入进去,仿佛在此陈列全文。
本发明关系到数字图像处理领域,更详细地说,关系到一种方法及其相关装置,用于制作数字式标准化图像特征模板,以减少适当地表示一个图象所需要的位数。
本发明的背景
这一专利文献的缩微胶片附录中所公开的内容包含对材料作出版权保护的要求,版权所有人不反对对任一专利文献或专利公开内容的影印复制,因为其出现在美国专利商标局的专利文稿或记录上,但保留所有其它权利。
考虑一个具有类似图象内容的图象库,如一丢失小孩的肖像的集合。在这些图象的集合中,由于脸部具有共同的特征,因此,基于象素位置,存在很大程度上的图象与图象之间的相关性。这个在不同图象上的相关性,恰像在一给定的图象中的空间相关性,能够被开发利用以改进压缩。
基于在图象中所处位置,对某些图象库的研究会得出图象保真度的有关重要性的知识。如果这些图像是用来识别丢失的儿童的,那么脸部区域的图象保真度就比头发或肩膀的保真度重要得多,而相比于背部而言,则头发或肩膀的保真度又要重要一些。在对于应用而言视觉图象保真度不太重要的地方,图象可以压缩得更过分一些。
在许多应用中,保持原始图象的取向和量化远不如保持图象中所包含的视觉信息重要。特别是对于丢失儿童案中的图象而言,如果从原始图象或从经过处理以便于压缩的图象可以同样便利地确认肖像中的儿童的特征,那么将处理过的图象放入库中不会带来损失。采用这一原理,通过将原始图象制成标准化的格式,可建立已处理图象库。对丢失的儿童的肖像而言,这可能包括对每个小孩的头部定位,使其眼睛保持水平,以及相对于图象边界使头部居中。一旦这样标准化的图象被建立起来,就可以很好地进行压缩,因为我们知道,该标准化带来了图象与图象之间的关联性。
一种压缩方法中称为向量量化(Vector Quantization-VQ)的技术在找出一个图象的各部份之间的关联时很有用。采用向量量化VQ压缩很适合于固定速率、有损耗、高比例压缩应用(见IEEE ASSP杂志,1984年4月第1卷,第4-29页,R.M.Gray的“向量量化”)。这一方法将图象分为一小片一小片的“图象块”。这些块随后与在通常称之为代码簿(codebook)的预定的图象块集合中的其它图象块匹配。该匹配算法通常是最小平方误差(minimum-squared-error-MSE)。由于图象块集合是预定的,集合的表项之一可以用一个简单的索引引用,由此,一个多象素块可以通过一个单一号码来引用。采用这样一种方法,可以对一个图象的位数作合理预算。当给每个图象块分配大量的位时,代码簿的尺寸会增大。与此类似,如果对图象分配大量的位时,图象块的数目可以增大(从而每块的尺寸减小)。
通过首先构成称之为训练图象集的代表图象集来确定代码簿。接着,将图象分为图象块,并将这些图象块作为高维向量空间中的向量来考虑,即,对于一个8×8的图象块,空间有64维。图象块是从位于训练图象集的每个图象中的预定区域中选出的。一旦从训练集中确定了所有的向量,那么找到群集,并将代表元分配给每个群集。对群集的选择要使得一个训练集的元素与该元素被分配给该群集的代表之间的总体组合距离最小化。选择技术是Linde-Buzo-Gray(LBG)算法(参看IEEE Transactions OnCommunications,1980年1月,第COM-28卷,第1册,第84-95页,Y.Linde等人的“向量量化器设计算法”)。群集数是由为描述图象块作预算的位数来确定的。假定n位,代码簿可以包含多至2n群集代表或代码向量。
上述参考专利申请,即由Ray、Ellson和Gandhi提交的美国申请序列号08/145,051和由Ray和Ellson提交的美国申请序列号08/145,284,都描述了一个系统,该系统利用图象库中标准化特征的优点,能够达到高压缩比率,而图象质量损失很小。这一压缩方法利用标准化所产生的固有的图象与图象之间的关联性的优点来改进可预测性,从而,通过对标准化图象所作的训练以及构成包括8×8象素代码向量的复式代码簿,来改进可压缩性。
这些应用描述了在图象库中提取图象的共同特征并以此作为图象标准化的基础的一个过程。一旦图象被制成标准化库图象,就可以对其进行压缩,并在其后还原成原始库图象的有损代表。
作为被上述参考专利申请所描述的现有技术综述起来包括:
标准化:
选择最重要的图象特征。
对库中的一个代表图象集合进行处理,以增强选定的特征。
将选定的特征放在代表图象中。
确定图象特征定位的约束条件。
对图象进行处理,以满足图象特征定位约束条件。
根据所存在的特征或者所需要的图象质量的水平,分配图象的区域。
对每个子区域,确定图象与图象之间的关联性。
将基于分区子区域的每一子分区的图象信息的存储容量分配给图象块和代码簿大小。
制作代码簿,以利用关联性的优点。
对图象进行处理,以增强特征。
将选定的特征放在图象中。
通过对图象的处理将图象进行标准化处理以满足图象特征定位约束条件。
根据子区域及其图象块来划分图象。
对每个区域,确定最近似图象内容的代码簿的表目。
对每个图象块存贮代码簿值序列,因为这就是压缩的图象。
还原:
从代码簿值序列中选取代码簿值。
根据代码簿值序列中相应的子区域位置来确定代码簿。
从上面确定的代码簿中根据代码簿值抽取一个图象块。
将图象块复制到子区域中适当的图象块位置。
持续插入图象块,直到在整个图象中所有图象块位置都被填上。
为了对一单磁道事务磁卡(magnetic transactioncard)用符合国际标准的方式来存贮一个压缩的面部图象,可用的数据容量低于500比特(见ISO7811/2)。
当目标位数非常小时,如脸部图象存贮在500位之下的情况下,上面描述的压缩/还原过程不能提供用于某些验证和辩认应用中的质量保持一致的脸部图象。对于要求更高的验证系统而言,还需要额外的技术来进一步改进压缩图象的质量。这种改进的机会在图象标准化、特定的代码簿制作和图象块对称性中都存在。
即使对图象中脸的定位和定向的标准化,肖像的明暗情况也可能是高度不对称的,这就导致了一个人的面部肖像的左右侧亮度不平衡。这时所需要的是一种为平衡一个人的脸部肖像的亮度的方法,以便取得较高的面部图象肖像标准化,并且提高人的面部图象的自然对称性。
随着图象特征的亮度和定位两者的标准化,所以研制代码簿来更好地在图象中特定的位置表示期望的图象内容。Sexton的美国专利5,086,480专门介绍代码簿方法,其发明名称为“视频图象处理”,该专利介绍了两个代码簿的应用。这一压缩方法通过对两个代码簿的穷尽搜索,从两个代码簿中找到最佳的代码向量,然后对从中找到最佳匹配的代码簿设置标志。最终结果是一个包含具有可能不同代码向量数的两个代码簿的“超级代码簿”,其中标志指示被选定的代码簿。代码簿选择不是出自对图象的一个区域的内容的事先了解,Sexton计算了对每个图象中的每个代码向量采用哪个代码簿。要进行较大的压缩,机会之一是消除存贮代码簿标志的需求。
应该注意到,Sexton的方法要求两个代码簿中的所有代码向量具有相同的维数。另外,上面引用的Ray的现有技术将图象划分为相等大小的图象块。
改进压缩肖像的质量的另一个途径是采用面部图象的相关性,在面部图象中脸的左右侧近似镜象对称。通常,在近前方透视肖像中,在靠近中线的面部部位之间存在很大程度的相关性。特别是用于反映眼睛上下的面部部份的图象块显示很高程度的对称相关性。然而,当从稍微不同的角度观察时,沿着面部的中线,由于鼻子外观的变化,对称的程度下降。所需要的是一种方法,该方法通过利用面部中线周围区域中人脸的自然对称,在不对鼻子强加有害的对称限制的情况下,进一步减少存贮一个压缩肖像图象所需要的位数。
图象的某些部位对个人识别时没有任何显著的价值。例如,在识别过程中,肩部区域的作用极小,此外,这一区域常常穿着衣服,这对同一个人来说变化也是极大的。由于这样的区域几乎没什么价值,因此编码图象时对其分配的位数也应该减少。在本发明中,某些这种区域即使分配一些位,也是很少的,其图象数据是从邻近块的图象数据中合成出来的。这样就使得更多的位被分配去编码更重要的区域。
本发明技术便利对图象特征模板的制作,该模板在相同特征图象的压缩和还原中特别有用。更详细地说,该特征模板能够压缩和还原具有一致的相同图象特征集合的大量图象,这些特征能够被对准和定标,从而把这些特性定位在非常相关的区域中。
本发明的特征模板包括:
若干模板元,每个元代表物体的一个特征;以及代表每个模板元的属性的数据。
构成特征模板的最佳方法包括以下步骤:
建立特征模板的维数,以适应标准化的图象;
将所述特征模板划分为若干特征类型,以适应标准化图象中的相同特征;
对每个特征类型分配至少一个模板元;
记录所有被分配的模板元在所述特征模板的维数中的位置,以便利对这样制作的特征模板的重新构造。
从上面所作的描述可以看出,本发明的一个主要目的是提供一个特征模板,该模板可用于一个系统中以降低相关的图象集合的数据存贮需要。
根据下面结合附图所作的进一步描述,可更清楚地了解本发明的上述目的及其它目的。在附图中,相同的字符代表相同的部分,这些附图构成本发明的一部分。
图1A、1B和1C示出了正面头像,该头像被分别斜置、旋转并平移到一个标准位置,以及调整为标准尺寸;
图2以流程图形式示出了对图象进行标准化的方法;
图3A示出了构成一个模板的模板元的位置和大小。
图3B用阴影区域示出了具有左右翻转特性的模板的模板元的位置和大小;
图3C用阴影区域示出了具有上下翻转特征的模板的模板元的位置和大小;
图3D用阴影区域示出了被连接起来模板的模板元的位置和大小;
图4以表的形式示出了肖像特征、它们的相关的标签及其特性;
图5A和5B示出了为图3A-3D所示的模板中的元素所记录的模板元数据;
图6示出了与用于本发明的特定实施例中的每个特征类型A-M相关的贴片(tiles)的一个集合;
图7示出了一个压缩图象的用数字标记和用标签标记的贴片;
图8示出了从特征类型贴片集合中抽取的贴片,阴影较淡处的贴片至少有一个翻转特性;
图9示出了执行所有翻转特性后的贴片;
图10示出了最终的图象;
图11示出了执行本发明方法的最佳的装置结构。
图1A代表正面脸部肖像的一个图象。在这个例子中,该脸对于图象的中心被倾斜和平移。根据图象的来源,也可以会遇到在图象的边界之内进行脸部定位和定尺寸的其它变化。为了取得本发明的最大效果,脸的大小、位置和方向都被标准化。为了对图象进行操作,图象被安排成数字格式,通常作为一个象素值的矩阵。图象的数字格式(象素值)是通过扫描原始图象,将原始图象转换为数字化的电信号值而导出的。该数字图象格式随后被用来在显示器上重现显示图象,以便将标准化过程应用到显示图象以及构成显示图象的象素值上,从而构成一个标准化的几何图象。图象被标准化,以提供能与模板相关的模板元相匹配的质量(本说明书后面将作详细描述)。该过程始于图1A,首先于图象中确定脸部左右眼的中心。在图1B中,采用众所周知的图象处理操作,根据需要,将图1A的脸部图象进行旋转和平移,以便将左右眼的中心沿预定的水平轴定位,并且该图象绕一个中心纵轴均匀分布,从而形成代表一个部份标准化几何图象的脸部图象的新的数字化图象。图1C示出了通过将图象定标为标准尺寸从而构成一个标准化几何脸部图象的按一定尺寸制作的图1B的脸部图象。
现在参看图2,构成标准化几何图象的方法在从标明“选择一个图象”的方框开始的流程图框中作了说明。该选择过程以用本发明模板被处理过的人的正面头象的可用性为基础。在选择过程中所包含的是产生可用图象的数字矩阵表示。该数字矩阵接着被装入一个系统中(示于图11),用来给操作人员显示。如前所述,操作人员确定左右眼,并且对图象进行所需要的旋转、平移和重定比例,以构成标准化的几何图象。
更详细地说,就图1C的标准图象和图2的流程图而言,在本发明的这个实施例中,图象标准如下设置:图象大小,宽度为56个象素,高度为64个象素,眼睛中心位于离图象上边界28个象素处以及纵向中心线两侧8个象素处。确定左眼和右眼的中心是将初始图象显示给操作人员,由他采用诸如鼠标、图形输入板、光笔或者触摸感测屏之类的定位设备来指定中心位置。另一种方法是采用特征搜索程序来自动进行处理。操作人员确定眼睛的位置,处理器通过在操作人员确定的位置周围较小的区域采用眼睛寻找搜索方法,来微调该位置。标准化的下一步是改变图象,使眼睛的位置被标准地确定在预定的位置。一般来说,这包括图象平移、定比例和旋转的标准图象处理操作。
当图象的大小和眼睛的位置被调节后,将标准化几何图象存贮起来,并进行亮度标准化程序,该程序通过以偶数40-52标明的流程框所表示。采用三维标度对数字化图象亮度的变化进行标准化处理;大代表光的水平/方向,中代表从侧光对不对称阴影进行校正,小代表减少来自眼镜、珠宝和皮肤的特殊强光。这些程序改变了数字化图象中的平均亮度水平。某些在判别一个个体时很有用的特征在灰度范围肖像中趋向于减弱。因此,为了增强这些特性,被称作对比度的亮度水平的变化也被作了调整。
由方框50所表示的功能运行将脸部平均亮度,即鼻子周围部份的平均亮度,改变为一个预定值。在这个最佳实施例中,浅肤色的人的预定值为165,中等肤色为155,深肤色为135。由方框50所构成的标准化数字图象现在由相应于功能方框52存贮的一个可存贮象素值矩阵所表示。
图3A示出了将同图2的标准化图象一起使用的模板30的设计。该模板30被分为标上A至M的64个模板元。这些元素根据人脸的13个相应特征排列,例如,模板元A相应于头顶的头发特征,模板元G对应于眼睛。带有相同标号的模板元共同代表一个特征。图4、5A和5B的表对其余的模板元作了进一步的描述。虽然本发明的最佳实施例有64个模板元和13个特征实现,但应该理解,这些数字可以根据情况加以改变,而不对本发明的方法加以约束。还应该注意的是,模板的某些区域没有被分配任何元素。基于从代码簿对信息的检索,这些没被分配的区域将不会有图象内容。对这些区域分配图象内容的方法将以后面要描述的邻接区域的分配为基础。该模板的大小与宽为56个象素、高为64个象素的标准化图象的尺寸相匹配。该模板元的大小以其要表示的脸部特征的大小为基础。例如,G是一个标准化图象中一只眼睛的相对尺寸,分配给G的两个元素都放置在一个标准图象中眼睛所处的位置。
在图3B中,阴影模板元代表具有左右翻转特性的元素,后面对此将作详细描述。
在图3C中,阴影模板元代表具有上下翻转特性的元素,后面对此将作详细描述。
模板元的另一特性是连接。图3D用阴影区域代表了作为连接部份的模板元的位置。在这个特殊的实施例中存在7个元素连接对。在每对阴影模板元之间的连接是水平的,例如,位于中心左边的G连接到位于中心右边的G。虽然作为最佳实施例示出了7个连接对,但在大于2个元素的组中以及在任何具有相同标号的元素集合之间也可以出现连接。
模板30事实上是一数据记录序列,在最佳实施例中,每个记录描述了每个模板元的位置、大小、标号、左右特性、上下特性以及连接。在需要时,可以产生带有其它和/或额外因素的数据记录。
模板30记录模板元的分布和大小。对每个模板元指定了一个代码簿和在图象中的空间位置。(注意:模板的某些部位没有模板元,这些区域将在后面详细描述。)图3A所示的模板包括构成矩形象素区域的64个模板元。这些模板元被分配给13个不同代码簿(标号为A-M)的其中一个。这些代码簿是4×16或8×8或8×5或4×10或4×6或8×4象素的均匀尺寸做成的代码向量集合。构成代码簿的代码向量是从图象特征库中导出的。
参看图4,标号A至M代表人脸的特征类型。与标号行中的每个标号A-M相关的人的特征表示在标号行下面一行。图4的其余部份提供关于每个相关标号的模板元的宽度与高度信息以及每个特征出现的次数和单一出现次数。单一出现次数代表被连接起来的独立模板元的数目(连接元素仅仅被看作是一次单一出现)。
图5A和5B示出了模板元数据记录。这些数据记录表示每个模板元的属性,即对于左上方坐标系统象素坐标包括数据记录信息域、宽度、高度、左右翻转特性,上下翻转特性、连接组的记录以及特征类型。如果连接组的记录是-1,那么就没有出现连接。连接组的其它值标识该组的模板元。例如,图3D的上方两个模板元D被连在一起,因此在图5A和5B的表的连接组列中被给定相同的连接组号O。
下面的讨论将参考图4、5A、5B和图6进行。图4中所述的特征类型在图6中作为贴片的集合示出。例如,在特征类型G-眼睛特征-的集合中的贴片1是表示为一个象素阵列的眼睛的图形。对特征G而言,此集合中的其它贴片2至2n是眼睛的其它图形。在最佳实施例中,对每个特征类型,每个集合中的贴片数目是2n,n为正整数。应该注意的是,集合中的贴片在表示图象特征时直观上看具有相似的特性。不同特征类型的贴片在相比较时,看起来常常是不相似的。
图7示出了将模板元分配给贴片的一个图象。图7的每个模板元有一个相关的号码,这个号码相应于代表模板元的特征类型的贴片。例如,模板元60代表特征类型A,并且在图6中头发特征类型贴片A的集合中有号码为46的相关贴片。与此类似,对于眼睛特征类型的模板元62被编号为123,它对应于图6中标号为G的眼睛特征类型集合中号码为123的贴片。注意,在相同连接组中的模板元(例如眼睛特征类型模板元62和64)具有相同的贴片号码。为了便于识别连接元件,它们在图7中打印为黑体号码。
图7中分配给每个模板元的贴片号被用于从标号相同的贴片特征类型集合中检索相同号码的贴片。检索的贴片与包含该贴含片号码的模板元的位置相同。贴片的配置结果产生了图8的镶嵌图案。
接下来,将选定的贴片翻转(flip)。图3B和3C分别指出了具有左右和上下翻转特性的模板元。具有这些翻转特性的模板元在图5A和5B中的表中也由真/假标志所指示。图8中要被翻转的这些贴片用通过代表象素的方盒的斜线所识别。图9表示翻转特性对图8中贴片的应用,其中图8中相应于图3B中阴影模板元的所有贴片被左右翻转,而图8中相应于图3C中阴影模板元的所有贴片被上下翻转。值得注意的是,在贴片从图8转换为图9的贴片方位时,某些模板元同时进行两种翻转,并且翻转在相关的元素内发生。
接下来的步骤是基于图9的定向贴片镶嵌图案,采用图象处理操作,制作最终图象。图9的镶嵌图案,由于由贴片构造的结果,可能具有某些看起来不好的现象,通过某些图象处理算法的结合,可以消除这些现象。在本最佳实施例中,采用众所周知的图象处理操作的结合,其中包括平滑地经过贴片边界、增强对比度、采用线性插值充填丢失的图象区域以及增加具有三维依赖关系的随机干扰。为了描述平滑操作,假设具有三个连续象素P1、P2和P3的情况,其中P1和P2在一个贴片中,P3在一个相邻贴片中。象素P2被(P1+2*P2+P3)/4的结果所替换。对比度增强是通过确定镶嵌图案的最小象素值min和最大象素值max来获得的。根据式子:
Pnew=255×(Pcur-min)/(max-min)镶嵌图案的每个象素值Pcur被Pnew所替换。
不与任何模板元对应的特征模板的区域采用线性插值充填。对每个区域来说,采用已知的边界象素值来计算出一个平均象素值。将与已知边界相对的未知角落设置为这个平均值。其余未被分配的内部象素采用线性插值来计算。在本发明的最佳实施例中,共有4个这种未被分配的区域,每个位于特征模板的角落。
将要增加的三维随机干扰由下式确定:
n(i,j)=v*sqrt((i-28)**2+(j-32)**2)*rand
其中,
v是干扰大小
i是受影响的象素的列
j是受影响的象素的行
rand是一个在范围(-1至1)之间的伪随机浮点数。值n(i,j)在位置(i,j)被加到象素中。如果所得到的象素值大于255,那么设定为255,如果小于零,则设定为0。图10示出经过这些操作处理后的一个图象。应该理解的是,在其它情况下可以采用其它图象处理操作,本最佳实施例不应该视为限制。
图11示出了可以实施本发明方法的设备100。设备100包括用于将非数字图象,如照片80,或负片图象82,转换为图象的数字表示的装置102。通常转换是在扫描器104中进行的,该扫描器输出以模拟形式表示象素值的信号,然后采用模-数转换器106将模拟象素值转换为代表扫描图象的数字值。其它数字图象源可以直接输入到工作站200。在本发明的最佳设备实施例中,工作站200是一台SUNSPARC 10,运行UNIX操作系统,并且采用标准C程序设计语言编程。本发明的程序部分在附件A和B中完整地给出。数字图象的显示是在软件、键盘204和鼠标206控制下,通过显示器202操作的。数字图象也可以通过CD输入机208或其它类似装置输入系统。由本发明方法和设备产生的模板可以卸载到一台CD记录器210上以便存贮在CD上,由打印机212作硬拷贝打印以记录在存贮卡(诸如事务卡),或者由调制解调器214和传输线传输以作进一步处理或在远程单元存贮。
本发明的其它用处包括肖像之外的图象的压缩。还可以表示其它特征类型,例如,与银行支票相关的特征,如银行和帐号,以及签名、美元数额、地址等等。与人脸一样,对每张支票而言,这些特征通常处于同一位置。
虽然本发明主要考虑的是最佳实施例的情况,但很显然,在不脱离本发明基本精神的前提下,可作许多改进。因此在权利要求书中将包括在本发明范围之内的所有改进。
部件目录:30 模板40-52 流程方框(双号)60 特征类型A的模板元62 眼睛特征类型的第一模板元64 眼睛特征类型的第二模板元80 照片82 负片图象100 设备102 图象数字化装置104 扫描器106 模-数信号转换装置200 工作站202 显示器204 键盘206 鼠标208 CD输入器210 CD录器212 打印机214 调制解调器A-M 代码簿
Claims (10)
1.一种特征模板,包括:
若干模板元,每个模板元代表物体的一个特征;
代表每个模板元属性的数据。
2.根据权利要求1所述的特征模板,其特征在于多个模板元共享代表物体的一个特征。
3.根据权利要求1所述的特征模板,其特征在于代表每个模板元属性的数据包括指示一个模板元与另一模板元连接关系的数据。
4.一种特征模板,包括:
以代码形式表示物体特征的区域;
代表每个模板元相对于具有相同特征类型的其它模板元的取向的代码位。
5.构成特征模板的一种方法,包括以下步骤:
建立特征模板的维数,以适应标准化图象;
将所述特征模板划分为若干特征类型,以适应标准化图象中的相同特征;
对每个特征类型至少分配一个模板元;
记录所有被分配的模板元在所述特征模板维数中的位置,以便利重建如此构成的特征模板。
6.根据权利要求5所述的构成图象的特征模板的方法,其特征在于标准化的图象是由以下步骤形成的:
获取数字形式的图象;
将获取的图象中的特征调整并定标到预先确定的参数。
7.根据权利要求5所述的方法,进一步包括以下步骤: 使纵向对称特性至少相关于一个模板元。
8.根据权利要求5所述的方法,进一步包括以下步骤:使水平对称特性至少相关于一个模板元。
9.根据权利要求5所述的方法,其特征在于每个模板元代表标准化图象中一个物体的一个特征,从而从该特征模板可以构成标准化图象的一个表示。
10.用于数字信号处理系统中的存贮媒体,在其上记录了由权利要求1的方法所构成的特征模板,以便利制成用于显示的图象。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US36135294A | 1994-12-21 | 1994-12-21 | |
US361352 | 1994-12-21 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1150283A true CN1150283A (zh) | 1997-05-21 |
Family
ID=23421698
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN95121123A Pending CN1150283A (zh) | 1994-12-21 | 1995-12-21 | 制作标准化图象模板的方法和设备 |
Country Status (6)
Country | Link |
---|---|
EP (1) | EP0718788A2 (zh) |
JP (1) | JPH08249469A (zh) |
CN (1) | CN1150283A (zh) |
AR (1) | AR000239A1 (zh) |
BR (1) | BR9505966A (zh) |
ZA (1) | ZA959492B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102982501A (zh) * | 2012-11-19 | 2013-03-20 | 山东神思电子技术股份有限公司 | 一种图像样本标定方法 |
CN104021138A (zh) * | 2014-04-23 | 2014-09-03 | 北京智谷睿拓技术服务有限公司 | 图像检索方法及图像检索装置 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10038902B2 (en) | 2009-11-06 | 2018-07-31 | Adobe Systems Incorporated | Compression of a collection of images using pattern separation and re-organization |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB8710737D0 (en) * | 1987-05-06 | 1987-06-10 | British Telecomm | Video image encoding |
GB8910749D0 (en) * | 1989-05-10 | 1989-06-28 | Sherman Robin L | Methods and apparatus for obtaining information for characterising a person or animal |
US5151951A (en) * | 1990-03-15 | 1992-09-29 | Sharp Kabushiki Kaisha | Character recognition device which divides a single character region into subregions to obtain a character code |
JP3040466B2 (ja) * | 1990-07-17 | 2000-05-15 | ブリテイッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー | 画像処理方法 |
US5237627A (en) * | 1991-06-27 | 1993-08-17 | Hewlett-Packard Company | Noise tolerant optical character recognition system |
US5246253A (en) * | 1991-10-17 | 1993-09-21 | Mykrantz John R | Garden planning kit |
US5331544A (en) * | 1992-04-23 | 1994-07-19 | A. C. Nielsen Company | Market research method and system for collecting retail store and shopper market research data |
JP3364957B2 (ja) * | 1992-08-24 | 2003-01-08 | カシオ計算機株式会社 | モンタージュ作成装置及び顔画像作成方法 |
US5365596A (en) * | 1992-12-17 | 1994-11-15 | Philip Morris Incorporated | Methods and apparatus for automatic image inspection of continuously moving objects |
US5574573A (en) * | 1993-10-29 | 1996-11-12 | Eastman Kodak Company | Compression method for a standardized image library |
JPH08141212A (ja) * | 1994-11-24 | 1996-06-04 | Taito Corp | モンタージュ機能を有するゲーム機 |
-
1995
- 1995-11-08 ZA ZA959492A patent/ZA959492B/xx unknown
- 1995-11-30 AR AR33446895A patent/AR000239A1/es unknown
- 1995-12-05 EP EP95420342A patent/EP0718788A2/en not_active Withdrawn
- 1995-12-20 JP JP7332356A patent/JPH08249469A/ja active Pending
- 1995-12-20 BR BR9505966A patent/BR9505966A/pt not_active Application Discontinuation
- 1995-12-21 CN CN95121123A patent/CN1150283A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102982501A (zh) * | 2012-11-19 | 2013-03-20 | 山东神思电子技术股份有限公司 | 一种图像样本标定方法 |
CN102982501B (zh) * | 2012-11-19 | 2015-07-01 | 山东神思电子技术股份有限公司 | 一种图像样本标定方法 |
CN104021138A (zh) * | 2014-04-23 | 2014-09-03 | 北京智谷睿拓技术服务有限公司 | 图像检索方法及图像检索装置 |
CN104021138B (zh) * | 2014-04-23 | 2017-09-01 | 北京智谷睿拓技术服务有限公司 | 图像检索方法及图像检索装置 |
Also Published As
Publication number | Publication date |
---|---|
JPH08249469A (ja) | 1996-09-27 |
ZA959492B (en) | 1996-07-10 |
AR000239A1 (es) | 1997-05-28 |
BR9505966A (pt) | 1997-12-23 |
EP0718788A2 (en) | 1996-06-26 |
EP0718788A3 (zh) | 1996-07-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11010955B2 (en) | Point cloud mapping | |
US10410087B2 (en) | Automated methods and systems for locating document subimages in images to facilitate extraction of information from the located document subimages | |
KR102709925B1 (ko) | 투영 기반 메시 압축 | |
US5963670A (en) | Method and apparatus for classifying and identifying images | |
US7583846B2 (en) | Texture image compressing device and method, texture image decompressing device and method, data structures and storage medium | |
US8417029B2 (en) | Image processing apparatus and method, including fill-up processing | |
CN100342399C (zh) | 提取用作面貌识别和重现的特征向量的方法和装置 | |
US7088870B2 (en) | Image region filling by example-based tiling | |
Wang et al. | Factoring repeated content within and among images | |
US20050147280A1 (en) | System and method for face recognition using synthesized images | |
US7817161B2 (en) | Texture synthesis using dimensionality-reduced appearance space | |
US20040175041A1 (en) | Viewpoint-invariant detection and identification of a three-dimensional object from two-dimensional imagery | |
WO1991000666A2 (en) | Method and apparatus for processing digital data | |
CN1447955A (zh) | 根据面部图像的形态信息生成合成面部图像的装置和方法 | |
US20110019910A1 (en) | Image processing system | |
CN113658032B (zh) | 基于深度学习和图像处理的图像水印加解密方法及系统 | |
JP2008059546A (ja) | 画像処理装置、画像読取装置、画像形成装置、画像処理方法、コンピュータプログラム、及び記録媒体 | |
US7129954B2 (en) | Apparatus and method for synthesizing multi-dimensional texture | |
JP2009169925A (ja) | 画像検索装置および画像検索方法 | |
JP2001186516A (ja) | 画像データの符号化復号化方法及び装置 | |
JP2003244447A (ja) | 画像処理装置及び画像処理方法 | |
US7961941B2 (en) | Color form dropout using dynamic geometric solid thresholding | |
CN1150283A (zh) | 制作标准化图象模板的方法和设备 | |
CN1290064C (zh) | 用于合成高维纹理的设备和方法 | |
EP0718807B1 (en) | Method for compressing and decompressing standardized portrait images |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C01 | Deemed withdrawal of patent application (patent law 1993) | ||
WD01 | Invention patent application deemed withdrawn after publication |