CN102547315B

CN102547315B - 立体图像数据压缩方法及系统

Info

Publication number: CN102547315B
Application number: CN201010605295.7A
Authority: CN
Inventors: 罗远志; 李炜; 沈新民; 李贞�
Original assignee: Inlife Handnet Co Ltd
Current assignee: Inlife Handnet Co Ltd
Priority date: 2010-12-24
Filing date: 2010-12-24
Publication date: 2014-05-28
Anticipated expiration: 2030-12-24
Also published as: CN102547315A

Abstract

本发明涉及一种立体图像数据压缩方法及系统，所述方法包括以下步骤：景深分类步骤，依据景深值采用聚类法将每帧图像的景深数据分解成若干景深块数据；数据压缩步骤，对每帧图像的各个景深块数据分别进行哈夫曼编码压缩；数据存储步骤，将经过哈夫曼编码压缩的数据存储成预设格式的文件。本发明通过先采用聚类法将每帧图像的景深数据分解成若干景深块数据，再对每帧图像的景深块数据进行哈夫曼编码压缩，从而本发明在保证图象质量无损的前提下，对景深信息进行更有效的压缩，以解决立体图像数据占用物理空间大的问题。

Description

立体图像数据压缩方法及系统

技术领域

本发明涉及立体图像数据处理技术，更具体地说，涉及一种立体图像数据压缩方法及系统。

背景技术

近年来出现了采用二维视频图像数据结合景深信息来存储立体视频文件的方法。在利用此方法存储的文件中，一部分信息记录了单路二维视频图像数据，另一部分信息记录了每帧图像的景深数据，在显示的时候根据二维视频图像数据和景深数据共同显示出3D数据。

然而，目前的立体图像数据处理过程中，对于上述景深数据，为了保证图像质量，通常对上述文件中的采用不压缩，或者直接采用简单哈夫曼编码的方法进行压缩，造成存储信息占用物理空间很大的情况，严重影响了高清立体视频存储和传输的发展。

发明内容

本发明要解决的技术问题在于，针对现有技术的上述立体图像数据文件不压缩或直接压缩占用存储空间大的缺陷，提供一种立体图像数据压缩方法及系统。

本发明解决其技术问题所采用的技术方案是：构造一种立体图像数据压缩方法及系统，先采用聚类法将每帧图像的景深数据分解成若干景深块数据，再对每帧图像的景深块数据进行哈夫曼编码压缩并存储，从而有效地减小存储空间。

根据本发明第一方面，提供了一种立体图像数据压缩方法，包括以下步骤：景深分类步骤，依据景深值采用聚类法将每帧图像的景深数据分解成若干景深块数据；数据压缩步骤，对每帧图像的各个景深块数据分别进行哈夫曼编码压缩；数据存储步骤，将经过哈夫曼编码压缩的数据存储成预设格式的文件。

在本发明所述的立体图像数据压缩方法中，所述景深分类步骤中采用的聚类法包括划分法、层次法、基于密度的方法、基于网格的方法或基于模型的方法。

在本发明所述的立体图像数据压缩方法中，所述数据存储步骤中，所述预设格式的文件根据数据还原显示原则设立。

在本发明所述的立体图像数据压缩方法中，所述数据存储步骤中，预设格式的文件中存储有景深块数据坐标位置、压缩长度及经压缩的景深块数据。

根据本发明第二方面，提供了一种立体图像数据压缩系统，包括：景深分类模块，用于依据景深值采用聚类法将每帧图像的景深数据分解成若干景深块数据；数据压缩模块，对每帧图像的各个景深块数据分别进行哈夫曼编码压缩；以及数据存储模块，将经过哈夫曼编码压缩的数据存储成预设格式的文件。

在本发明所述的立体图像数据压缩系统中，所述景深分类模块采用的聚类法包括划分法、层次法、基于密度的方法、基于网格的方法或基于模型的方法。

在本发明所述的立体图像数据压缩系统中，所述数据存储模块采用的所述预设格式的文件根据数据还原显示原则设立。

在本发明所述的立体图像数据压缩系统中，所述数据存储模块存储的预设格式的文件中包括景深块数据坐标位置、压缩长度及经压缩的景深块数据。

实施本发明的立体图像数据压缩方法及系统，具有以下有益效果：本发明通过先采用聚类法将每帧图像的景深数据分解成若干景深块数据，再对每帧图像的各个景深块数据分别进行哈夫曼编码压缩，从而本发明在保证图象质量无损的前提下，对景深信息进行更有效的压缩，以解决立体图像数据占用物理空间大的问题。

附图说明

下面将结合附图及实施例对本发明作进一步说明，附图中：

图1为根据本发明优选实施例中立体图像数据压缩方法的流程图；

图2为根据本发明优选实施例中立体图像数据压缩系统的模块示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。

本发明主要是利用景深文件的特性，对立体视频文件或者立体图片的景深数据进行压缩，从而最大程度地减少压缩后数据文件的物理存储空间。

请参阅图1，为根据本发明优选实施例中立体图像数据压缩方法的流程图。如图1所示，本实施例提供的立体图像数据压缩方法开始于步骤S102：

随后，在下一步骤S104中，执行景深分类步骤，依据景深值采用聚类法将每帧图像的景深数据分解成若干景深块数据。

在此，本发明充分利用景深数据的特点。景深是指在摄影机镜头或其他成像器前沿着能够取得清晰图像的成像景深相机器轴线所测定的物体距离范围。已知目前在采用的二维视频图像数据结合景深信息的方式存储的立体视频文件中，一部分信息记录了单路二维视频图像数据，即主要包括每帧图像各个像素的颜色信息，而另一部分信息记录了每帧图像的各个像素的景深值。在立体图像数据显示时，只需要结合每帧图像的各个像素的颜色信息及景深值就能显示出整帧图像，并能产生立体显示效果。而每帧图像的各个像素的景深值具有一定的规律，即相邻像素的景深值相近。例如正对某一平面物体拍照，其该物体所在的像素的景深值基本相同。这样，如果对每个像素的景深值进行存储就势必占用过大的空间，而如果利用上述特性，将这些具有相同或类似景深值的像素作为一个整体，仅记录其在每帧图像中的像素坐标，以及统一的景深值，则其数据量将显著减少。因此本发明首先将每帧图像的景深数据分解成若干景深块数据，也就是说将每帧图像分成具有相同或相似景深值的像素块。并且这些具有相同或相似景深值的像素在空间位置上相互连接，以便于记录这些景深块数据代表的像素所在的坐标区域。

在该步骤中，主要采用聚类法来依据景深值进行划分。聚类分析又称群分析，它是研究(样品或指标)分类问题的一种多元统计方法，所谓类，通俗地说，就是指相似元素的集合。本领域技术人员熟知多种聚类方法，其中任何一种均可以应用在本发明中对景深块进行划分，例如划分法、层次法、基于密度的方法、基于网格的方法或基于模型的方法。

随后，在下一步骤S106中，执行数据压缩步骤，对每帧图像的各个景深块数据分别进行哈夫曼编码压缩。在计算机信息处理中，“哈夫曼编码”是一种一致性编码法，用于数据的无损耗压缩。这一术语是指使用一张特殊的编码表将源字符(例如某文件中的一个符号)进行编码。这张编码表的特殊之处在于，它是根据每一个源字符出现的估算概率而建立起来的(出现概率高的字符使用较短的编码，反之出现概率低的则使用较长的编码，这便使编码之后的字符串的平均期望长度降低，从而达到无损压缩数据的目的)。例如，在英文中，e的出现概率很高，而z的出现概率则最低。当利用哈夫曼编码对一篇英文进行压缩时，e极有可能用一个位(bit)来表示，而z则可能花去25个位。用普通的表示方法时，每个英文字母均占用一个字节(byte)，即8个位。二者相比，e使用了一般编码的1/8的长度，z则使用了3倍多。倘若我们能实现对于英文中各个字母出现概率的较准确的估算，就可以大幅度提高无损压缩的比例。

下面以一个简单的示例对本发明的压缩效果进行分析。例如，如果一帧图像包括100个像素相连的景深值为-1的像素点，20个像素相连的景深值为-2的点，30个像素相连的景深值为-3的点，以及50个像素相连的景深值为-4的点。如果不压缩的话，每个像素点占用2比特，则200个像素点需要采用400个比特来进行存储。如果对整帧图像使用哈夫曼压缩的话，出现概率最高的景深值为-1的像素占用1比特，随着概率依次递减，景深值为-4的像素占用2比特，景深值为-3的像素占用3比特，景深值为-2的像素占用4比特，经过压缩后，总空间大小为1*100+2*50+3*30+4*20＝370；由此可见对整帧图像使用哈夫曼压缩的效率比较低。而如果使用本发明的方法，可以先采用聚类法对该帧图像进行划分。例如，划分为4个景深块，第一块为100个像素相连的景深值为-1的像素点，第二块为20个像素相连的景深值为-2的点，第三块为30个像素相连的景深值为-3的点，第四块为50个像素相连的景深值为-4的点。然后在数据压缩步骤中，对第一块进行压缩，那么第一块所占用的数据总空间包括该景深块的坐标位置数据，以及景深值-1，因此采用几个字节甚至更小的空间就可以。同样对第二块、第三块和第四块进行压缩，由于这些块内像素点具有相同的景深值，因此采用非常小的空间就能记录下这些数据。从而最大程度地减少了存储空间。

上述数据是为了在理论上说明本发明的效果而举例的，虽然相对理想化，但是本发明亦可用于对复杂图片的分析，经过实践证明，本发明的压缩率可达10％以下，对于1M的立体图片可以压缩为0.1M。

随后，在下一步骤S108中，执行数据存储步骤，将经过哈夫曼编码压缩的数据存储成预设格式的文件。在该步骤中，预设格式的文件是根据数据还原显示原则设立的。也就是说，该文件的格式需要记录下该景深块的足够特征数据，使得在立体图像恢复过程中，即解压缩并显示立体图像过程中能够完整不失真地将数据显示出来。例如，预设格式的文件中可以存储有景深块数据坐标位置、压缩长度及经压缩的景深块数据本身。

请参阅图2，为根据本发明优选实施例中立体图像数据压缩系统的模块示意图。如图2所示，本实施例提供的立体图像数据压缩系统200至少包括：景深分类模块202、数据压缩模块204和数据存储模块206。

其中，景深分类模块202用于依据景深值采用聚类法将每帧图像的景深数据分解成若干景深块数据。如方法中所述，景深分类模块202将每帧图像的景深数据分解成若干景深块数据，也就是说将每帧图像分成具有相同或相似景深值的像素块。并且这些具有相同或相似景深值的像素在空间位置上相互连接，以便于记录这些景深块数据代表的像素所在的坐标区域。

景深分类模块202采用的聚类法包括划分法、层次法、基于密度的方法、基于网格的方法或基于模型的方法。

数据压缩模块204用于对每帧图像的各个景深块数据分别进行哈夫曼编码压缩。如方法中所述，数据压缩模块204对每个景深块进行压缩，由于这些块内像素点具有相同的景深值，因此采用非常小的空间就能记录下这些数据。从而最大程度地减少了存储空间。

数据存储模块206用于将经过哈夫曼编码压缩的数据存储成预设格式的文件。数据存储模块206采用的所述预设格式的文件根据数据还原显示原则设立。也就是说，该文件的格式需要记录下该景深块的足够特征数据，使得在立体图像恢复过程中，即解压缩并显示立体图像过程中能够完整不失真地将数据显示出来。例如，包括景深块数据坐标位置、压缩长度及经压缩的景深块数据本身。

综上所述，本发明通过先采用聚类法将每帧图像的景深数据分解成若干景深块数据，再对每帧图像的各个景深块数据分别进行哈夫曼编码压缩，从而本发明在保证图象质量无损的前提下，对景深信息进行更有效的压缩，以解决立体图像数据占用物理空间大的问题。

本发明是根据特定实施例进行描述的，但本领域的技术人员应明白在不脱离本发明范围时，可进行各种变化和等同替换。此外，为适应本发明技术的特定场合或材料，可对本发明进行诸多修改而不脱离其保护范围。因此，本发明并不限于在此公开的特定实施例，而包括所有落入到权利要求保护范围的实施例。

Claims

1.一种立体图像数据压缩方法，其特征在于，包括以下步骤：

景深分类步骤，依据景深值采用聚类法将每帧图像的景深数据分解成若干景深块数据；所述每帧图像的相邻像素景深值相同或相近；所述具有相同或相近景深值的像素在空间上相互连接；所述景深分类步骤中采用的聚类法包括划分法、层次法、基于密度的方法、基于网格的方法或基于模型的方法；

数据压缩步骤，对每帧图像的各个景深块数据分别进行哈夫曼编码压缩；

数据存储步骤，将经过哈夫曼编码压缩的数据存储成预设格式的文件；所述数据存储步骤中，预设格式的文件中存储有景深块数据坐标位置、压缩长度及经压缩的景深块数据；所述数据存储步骤中，所述预设格式的文件根据数据还原显示原则设立。

2.一种立体图像数据压缩系统，其特征在于，包括：

景深分类模块，用于依据景深值采用聚类法将每帧图像的景深数据分解成若干景深块数据；所述每帧图像的相邻像素景深值相同或相近；所述具有相同或相近景深值的像素在空间上相互连接；所述景深分类模块采用的聚类法包括划分法、层次法、基于密度的方法、基于网格的方法或基于模型的方法；

数据压缩模块，对每帧图像的各个景深块数据分别进行哈夫曼编码压缩；以及

数据存储模块，将经过哈夫曼编码压缩的数据存储成预设格式的文件；所述数据存储模块采用的所述预设格式的文件根据数据还原显示原则设立；所述数据存储模块存储的预设格式的文件中包括景深块数据坐标位置、压缩长度及经压缩的景深块数据。