CN114827568A - 基于神经网络算法的三维显示图像压缩编码方法及设备 - Google Patents
基于神经网络算法的三维显示图像压缩编码方法及设备 Download PDFInfo
- Publication number
- CN114827568A CN114827568A CN202210395022.7A CN202210395022A CN114827568A CN 114827568 A CN114827568 A CN 114827568A CN 202210395022 A CN202210395022 A CN 202210395022A CN 114827568 A CN114827568 A CN 114827568A
- Authority
- CN
- China
- Prior art keywords
- image
- neural network
- dimensional display
- parallax
- sub
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/10—Processing, recording or transmission of stereoscopic or multi-view image signals
- H04N13/106—Processing image signals
- H04N13/161—Encoding, multiplexing or demultiplexing different image signal components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
- G06T9/002—Image coding using neural networks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/597—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
Abstract
本发明提出一种基于神经网络算法的三维显示图像压缩编码方法及设备,该方法通过视差矩阵构建算法,生成视差矩阵和对应的权重矩阵;利用视差矩阵和权重矩阵,对三维显示的采集视差图像进行处理,生成合成图像;利用图像筛选神经网络模型,筛除合成图像中的无用信息量并输出,接收端通过压缩复原处理将接收到的压缩合成图像进行解压缩。通过本发明,能够在相对较小的图片质量损失下,将三维显示图像数据量压缩到之前的几十分之一,使得传输效率有几十倍的提升,为三维显示图像大规模应用提供了可能性。
Description
技术领域
本发明涉及图像处理技术领域,尤其涉及一种基于神经网络算法的三维显示图像压缩编码方法、装置、设备、存储介质。
背景技术
随着国民经济的发展与显示技术的进步,三维显示设备逐渐在生活娱乐、工业生产、科学研究等各个领域有了越来越广泛的应用,对三维显示设备实时高清地播放图片视频的需求也越来越急迫。由于三维图像基于二维平面支撑三维显示信息,其视点数量越多,对应清晰度需求越高。目前,三维图像分辨率仍在快速地逐年提升,后续数据量将大幅度提升,远超现有的无线通信的通信容量,如果没有一种普适的压缩编码方法,三维显示技术难以实现未来的大规模商用。
由于三维显示图像通过二维平面存储三维信息,具有文件数据量大以及图片精度高等特点,且由于三维显示设备普遍由周期性的体像素构成,造成三维显示图像临近子像素并不汇聚到同一视点的现象,导致了三维显示图像的高频信息占比远高于普通图片,因此现存的几乎所有压缩方案都会极大损失图片高频信息,导致三维显示图像出现严重的失真,使得压缩传输复原后的图片质量难以接受。
每秒传输几十张数十MB甚至数百MB的图像信息,需要高速传输的三维显示图像信息只能通过光纤进行传输,限制了高清晰度三维显示图像在移动网络等较低传输速率通信系统的高速传输,限制了三维显示图像的应用范围,设备普及和显示质量的发展,成为了限制产业发展的巨大瓶颈。
根据社会学和实际应用场景进行分析,可以发现单一应用场景下的三维显示设备的成像图片总是具有共性特征(如黑色背景、边框、矩形元素等),其相关特征一定程度上是可以通过神经网络缩减信息量,完成图片信息整体性的降频,提升后续压缩算法的压缩质量。
从目前公开的专利来看,并没有专门针对三维显示图像高速传输的压缩编码的技术方案,可是,如果通过无损图像压缩算法完成压缩,又无法将图像数据量压缩到足够进行高速信息传输的程度。因此建立一套能将高清晰度三维显示图像信息压缩到能够支持实时播放与高速传输的图像编码方法是必要的。
发明内容
本发明提供一种基于神经网络算法的三维显示图像压缩编码方法、装置、设备、存储介质,旨在在相对较小的图片质量损失下,将三维显示图像数据量压缩到之前的几十分之一,使得传输效率有几十倍的提升,为三维显示图像大规模应用提供了可能性。
为此,本发明的第一个目的在于提出一种基于神经网络算法的三维显示图像压缩编码方法,包括:
根据发送端的三维显示设备的成像参数,确定发送端三维显示设备的成像特征,通过视差矩阵构建算法,生成与发送端三维显示设备器子像素阵列成映射关系的视差矩阵,根据子像素加权算法生成对应于视差矩阵的权重矩阵;
将采集到的发送端三维显示设备显示的三维物体采集视差图像按照视差矩阵和权重矩阵进行信息汇总,根据不同采集视差图像进行子像素加权排列和视点划分,生成合成图像;
构建图像筛选神经网络模型,将所述合成图像输入所述图像筛选神经网络模型,以筛除合成图像中的无用信息量,将模型输出的合成图像经过压缩处理后,通过发送端输出;
通过接收端接收模型输出的合成图像,进行编码复原处理,得到编码复原的合成图像,并通过接收端三维显示设备进行显示。
其中,视差矩阵反映对应子像素在三维显示设备成像后发出光线所在的成像视差图像的视差图像编号阵列,矩阵内容为一一对应的成像视差图像编号以及一个子像素对应的多个视差图像编号的子像素视差信息。
其中,权重矩阵针对一个三维显示设备子像素对应多个成像视差图像的情况,获取每张采集视差图像的每个子像素对应到成像视差图像的灰度映射关系,将子像素对应到合成图像中的权重占比进行矩阵化操作。
其中,视差矩阵包含每个子像素最终汇聚到的视点信息,所述权重矩阵包含每个子像素汇聚到对应视差矩阵的权重信息,通过加权排列子像素亮度,在三维显示成像系统形成不同视点,使得人眼在进行跨视点观察时完成立体感建构,得到合成图像。
其中,图像筛选神经网络模型包括前置选择神经网络和后置优化神经网络;其中,前置选择神经网络用于对输入的合成图像的图片特征进行筛选判别,并选择对应的后置优化神经网络,将图片周期性排布的子像素识别并抽离编码,整体降低合成图像的频率。
其中,对合成图像进行压缩处理的步骤包括预压缩处理和压缩处理;其中,预压缩处理采用的预压缩算法通过调整子像素位置及其相应权重,将视点高频数据信息转换成低频信息存储;
压缩处理采用的压缩算法通过削减通过预压缩处理的合成图像中的高频信息,以减小合成图像数据量;
其中,预压缩处理是在图像筛选神经网络模型对合成图像处理之前进行处理,压缩处理是在图像筛选神经网络模型对合成图像处理之后进行处理。
其中,接收端用于编码复原处理采用的编码复原算法是针对所述预压缩算法和神经网络模型抽离编码的逆变换。
本发明的第二个目的在于提出一种基于神经网络算法的三维显示图像压缩编码装置,包括:
视差矩阵构建模块,用于根据发送端的三维显示设备的成像参数,确定发送端三维显示设备的成像特征,通过视差矩阵构建算法,生成与发送端三维显示设备器子像素阵列成映射关系的视差矩阵,根据子像素加权算法生成对应于视差矩阵的权重矩阵;
图像合成模块,用于将采集到的发送端三维显示设备显示的三维物体采集视差图像按照视差矩阵和权重矩阵进行信息汇总,根据不同采集视差图像进行子像素加权排列和视点划分,生成合成图像;
神经网络模型处理模块,用于构建图像筛选神经网络模型,将所述合成图像输入所述图像筛选神经网络模型,以筛除合成图像中的无用信息量,将模型输出的合成图像经过压缩处理后,通过发送端输出;
图像解压缩模块,通过接收端接收模型输出的合成图像,进行编码复原处理,得到编码复原的合成图像,并通过接收端三维显示设备进行显示。
本发明的第三个目的在于提出一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行前述技术方案的方法中的各步骤。
本发明的第四个目的在于提出一种存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行根据前述技术方案的方法中的各步骤。
区别于现有技术,本发明提供的基于神经网络算法的三维显示图像压缩编码方法,通过视差矩阵构建算法,生成视差矩阵和对应的权重矩阵;利用视差矩阵和权重矩阵,对三维显示的采集视差图像进行处理,生成合成图像;利用图像筛选神经网络模型,筛除合成图像中的无用信息量并输出,接收端通过压缩复原处理将接收到的压缩合成图像进行解压缩。通过本发明,能够在相对较小的图片质量损失下,将三维显示图像数据量压缩到之前的几十分之一,使得传输效率有几十倍的提升,为三维显示图像大规模应用提供了可能性。
附图说明
本发明的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1是本发明提供的一种基于神经网络算法的三维显示图像压缩编码方法的流程示意图。
图2是本发明提供的一种基于神经网络算法的三维显示图像压缩编码方法中三维显示设备成像效果示意图。
图3是本发明提供的一种基于神经网络算法的三维显示图像压缩编码方法中视差矩阵构建算法的示意图。
图4是本发明提供的一种基于神经网络算法的三维显示图像压缩编码方法中获取权重矩阵的算法示意图。
图5是本发明提供的一种基于神经网络算法的三维显示图像压缩编码方法中得到合成图像的算法示意图。
图6是本发明提供的一种基于神经网络算法的三维显示图像压缩编码方法中图像筛选神经网络模型的算法示意图。
图7是本发明提供的一种基于神经网络算法的三维显示图像压缩编码方法中图像筛选神经网络模型的算法效果示意图。
图8是本发明提供的一种基于神经网络算法的三维显示图像压缩编码装置的结构示意图。
图9是本发明提供的一种非临时性计算机可读存储介质的结构示意图。
具体实施方式
下面详细描述本发明的实施例,实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
图1为本发明实施例所提供的一种基于神经网络算法的三维显示图像压缩编码方法。
包括:
S101:根据发送端的三维显示设备的成像参数,确定发送端三维显示设备的成像特征,通过视差矩阵构建算法,生成与发送端三维显示设备器子像素阵列成映射关系的视差矩阵,根据子像素加权算法生成对应于视差矩阵的权重矩阵。
分析三维显示设备,得到三维显示设备体像素和观看视角。按照三维显示设备体像素成像特征(FOV,最佳观看距离等)与各种显示设备参数(视点间距、线数、倾角等),根据视差矩阵构建算法划分显示器子像素所属视差图像,构建出子像素视差矩阵。对于单一体像素包含的子像素个数与视点个数不同的情况,单个子像素可能被划分到多个成像视差图像中,需要得到子像素划分到不同视差图时对应的权重矩阵。
如图2所示,三维显示设备成像包含三个过程:子像素发光过程、体像素形成过程与人眼双目视差信息接收过程。其中,不同显示设备子像素排列与形式各不相同,但是子像素发光原理均是利用人眼低分辨率特点将子像素发出不同色光进行组合进行成像。子像素的通用定义是可以发出不同的色光并按照一定规律周期性排列的发光单元。体像素是在三维显示设备中至关重要的周期性子系统,每个体像素都可以将多个子像素发出的光线汇聚到不同的视点,使得不同位置观察到的成像视差图不同,当人眼观看时,构成双目视差,形成立体感知。
因此,期望形成的成像视差图像效果与不同子像素的光线汇聚到对应位置的映射关系决定着子像素的亮度。
其中,视差矩阵反映对应子像素在三维显示设备成像后发出光线所在的成像视差图像的视差图像编号阵列,矩阵内容为一一对应的成像视差图像编号以及一个子像素对应的多个视差图像编号的子像素视差信息。
其中,权重矩阵针对一个三维显示设备子像素对应多个成像视差图像的情况,获取每张采集视差图像的每个子像素对应到成像视差图像的灰度映射关系,将子像素对应到合成图像中的权重占比进行矩阵化操作。构建权重矩阵的子像素加权算法的类型至少包括狭缝光栅子像素直线加权法、柱透镜光栅子像素直线加权法、透镜阵列面积加权法、狭缝光栅子像素面积加权法与柱透镜光栅子像素面积加权法以及集成成像子像素加权法等由同一子像素对应不同视点形成的不同视差下的权重矩阵生成算法。
本发明以光栅柱透镜单元覆盖4个子像素且光栅倾斜角为的柱透镜光栅为例进行视差矩阵构建算法的演示:
如图3所示,第一行的子像素与其对应透镜左边缘的距离有4种情况,假设子像素宽度为1,则这4种距离分别为0、1、2、3,如图2中虚线框所标注的区域1所示。第二行的子像素与所在透镜左边缘的距离有1/2,3/2,5/2,7/2这4种,如图2中虚线框所标注的区域2所示。当时,显示面板上奇数行子像素与其所在透镜的相对位置关系与第一行子像素相同,偶数行子像素与其所在透镜的相对位置关系与第二行子像素相同,所以采用此光栅参数的立体显示器,其子像素与所在透镜的相对位置关系总共有上述8种,可以构建8个视点,区域1内4个子像素和区域2内4个子像素与其对应柱透镜共同构建一个显示单元。这样,在不改变光栅节距的基础上,可通过改变光栅倾角来增加可构建的视点数目。
如图4所示,虚线由视点观看位置接收的光线透过柱透镜向显示屏反向追踪得到,当观看者在视点的位置观看时,透过柱透镜单元看到的子像素全部为视点的子像素。区域1中虚线框标记子像素的即在视点位置能够观察到的子像素,在合成图中仅提取相应子像素的信息,其他子像素权重为0。可以看到虚线斜穿过显示屏,每行不只穿过一个子像素,在此位置观看时会出现串扰现象,即透过一个柱透镜单元不止看到一个视点的子像素信息,还将看到来自相邻视点子像素发出的光。区域2虚线穿过这个像素中的多个子像素,观看者通过第一个柱透镜单元可以同时看到这两个子像素的信息,分割这两个子像素的线段比例为,即人眼在观察时获取的视点信息是经过多个子像素的灰度进行加权后形成的,因此将不同视差下的子像素的权重就可以根据线段比例得到确定。在柱透镜光栅成像系统等拥有透镜相差的成像系统中,视点观看位置接收的光线透过柱透镜向显示屏反向追踪得到的并不是一条直线,而是一个平行四边形的区域,则根据面积比例确定各子像素的权重。
S102:将采集到的发送端三维显示设备显示的三维物体采集视差图像按照视差矩阵和权重矩阵进行信息汇总,根据不同采集视差图像进行子像素加权排列和视点划分,生成合成图像。
视差矩阵构建算法生成的视差矩阵包含每个子像素最终汇聚到的视点信息;子像素加权算法生成的权重矩阵包含着每个子像素汇聚到对应视差矩阵的权重信息。通过上述算法得到的合成图像就是通过加权排列子像素亮度,在三维显示成像系统形成不同视点,使得人眼在进行跨视点观察时完成立体感建构。图5即为视差图像信息抽样合成算法示意图。(图5绘制的算法流程只是本发明所有显示情况中的一种,无法覆盖所有本发明涉及的显示原理,子像素构建情况,加权合成情况以及多种视差图像信息抽样合成情况),将对应视点的采集视差图(C4)形成的对应位置的子像素根据差矩阵构建算法、子像素加权算法生成的视差矩阵(C1-1)、(C1-2)与对应的权重矩阵(C3-1)、(C3-2)进行提取加权并生成合成图(C5)。
S103:构建图像筛选神经网络模型,将所述合成图像输入所述图像筛选神经网络模型,以筛除合成图像中的无用信息量,将模型输出的合成图像通过发送端输出。
由于合成图像以二维图片存储三维信息,使得其数据量极大,难以对未经压缩的图片及图片流进行高速传输。故要在发送端对合成图像通过预压缩算法、图像筛选神经网络模型与压缩算法进行高速、低信息损失、低资源占用的压缩传输。
预压缩算法是为了防止在后续的通过损失图像高频信息完成图像压缩的各种压缩算法导致高频信息占比极大的三维显示图像出现严重失真而进行的将高频信息转变为低频信息的编码算法,本专利中展示的是通过提取同一成像视差图像对应的子像素重新加权组合排列,使相邻子像素为同一成像视差图像对应像素,完成从高频信息向低频信息的转换。此具体算法不能涵盖本专利的所有具体情况,仅为实例之一。
预压缩算法是通过调整子像素位置及其相应权重,将视点高频数据信息转换成低频信息存储的编码算法,包括但不限于将相同视点的子像素加权排列在相邻位置的具体算法,在极少损失或不损失图片信息的情况下完成图像预编码,防止后续压缩算法造成图片高频信息大量损失。
图像筛选神经网络模型的系统框图如图6所示。通过减少预压缩后合成图像的无用信息量,整体降低图片信息的频率,从而达到减少压缩算法中图片失真。
图像筛选神经网络模型采用多种具有明显且常见的特征的合成图像作为训练集,训练出多种神经网络模型,并根据实际合成图像的图片特征选择对应的后置神经网络。
图像筛选神经网络模型包括前置选择神经网络和后置优化神经网络;其中,前置选择神经网络用于对输入的合成图像的图片特征进行筛选判别,并选择对应的后置优化神经网络,将图片周期性排布的子像素识别并抽离编码,整体降低合成图像的频率。前置选择神经网络筛选判别的图片特征包括但不限于各种颜色的边框,各种单色背景,具有矩形元素,具有圆形元素等便于进行神经网络特征提取与冗余信息削减的特征。
使用的具体子算法包括但不限于前馈神经网络(FF)、深度前馈(DFF)、自动编码器(AE)、去噪自动编码器(DAE)、霍菲特网络(HN)、玻尔兹曼机(BM)、受限玻尔兹曼机(RBM)、卷积神经网络(CNN)、深度卷积网络(DCN)、反卷积神经网络(DN)、生成对抗网络(GAN)、深度残差网络(DRN)等具体的常见应用于图像识别及图像优化的神经网络结构。
其中前置神经网络按照多种合成图像图片特征进行筛选分类,由多种已完成相关训练的轮廓边缘检测神经网络算法,背景检测神经网络算法等神经网络分类方法集成。筛选分类后,将合成图像加载到对应的后置优化神经网络中处理,包括但不限于将图片周期性排布的子像素识别并抽离编码再整体性降低原图像频率的神经网络优化算法(如图7所示)、通过将图片带入相应网络结构后压缩复原与原图片比较(SSIM算法等图像比较算法)得到的相似性参数作为训练指标训练出的神经网络算法。
压缩算法是通过削减图片中的高频信息以达到减小图片数据量的目的的通用压缩编码以及无损的图片压缩编码,包括但不限于JPEG2000、JPEG、GIF、PNG、YUV442、YUV422、YUV420等常见的的图片与视频压缩编码算法。
S104:通过接收端接收模型输出的合成图像,进行编码复原处理,得到编码复原的合成图像,并通过接收端三维显示设备进行显示。
接收端用于编码复原处理采用的编码复原算法是针对所述预压缩算法和神经网络模型抽离编码的逆变换。在接收端通过编码复原算法得到复原后的低损或无损合成图像,在每个成像视差图像均匀丢失极少量高频信息或不损失高频信息的情况下完成三维成像显示。最终实现可以高速、低延时传输三维显示图像信息的三维显示图像压缩编码方法。
解码复原算法为对应于预压缩算法及压缩算法的逆变换,具体情况根据不同的显示设备与前置算法有诸多差别。
此外,如图8所示,本发明提供了一种基于神经网络算法的三维显示图像压缩编码装置,包括:
视差矩阵构建模块310,用于根据发送端的三维显示设备的成像参数,确定发送端三维显示设备的成像特征,通过视差矩阵构建算法,生成与发送端三维显示设备器子像素阵列成映射关系的视差矩阵,根据子像素加权算法生成对应于视差矩阵的权重矩阵;
图像合成模块320,用于将采集到的发送端三维显示设备显示的三维物体采集视差图像按照视差矩阵和权重矩阵进行信息汇总,根据不同采集视差图像进行子像素加权排列和视点划分,生成合成图像;
神经网络模型处理模块330,用于构建图像筛选神经网络模型,将所述合成图像输入所述图像筛选神经网络模型,以筛除合成图像中的无用信息量,将模型输出的合成图像经过压缩处理后,通过发送端输出;
图像解压缩模块340,通过接收端接收模型输出的合成图像,进行编码复原处理,得到编码复原的合成图像,并通过接收端三维显示设备进行显示。
为了实现实施例,本发明还提出一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行前述技术方案的三维显示图像压缩编码方法中的各步骤。
如图9所示,非临时性计算机可读存储介质包括指令的存储器810,接口830,指令可由根据处理器820执行以完成方法。可选地,存储介质可以是非临时性计算机可读存储介质,例如,非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
为了实现所述实施例,本发明还提出一种非临时性计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现如本发明实施例的三维显示图像压缩编码。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对所述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在所述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现所述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。所述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
所述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例,可以理解的是,所述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对所述实施例进行变化、修改、替换和变型。
Claims (10)
1.一种基于神经网络算法的三维显示图像压缩编码方法,其特征在于,包括:
根据发送端的三维显示设备的成像参数,确定发送端三维显示设备的成像特征,通过视差矩阵构建算法,生成与发送端三维显示设备器子像素阵列成映射关系的视差矩阵,根据子像素加权算法生成对应于视差矩阵的权重矩阵;
将采集到的发送端三维显示设备显示的三维物体采集视差图像按照视差矩阵和权重矩阵进行信息汇总,根据不同采集视差图像进行子像素加权排列和视点划分,生成合成图像;
构建图像筛选神经网络模型,将所述合成图像输入所述图像筛选神经网络模型,以筛除合成图像中的无用信息量,将模型输出的合成图像经过压缩处理后,通过发送端输出;
通过接收端接收模型输出的合成图像,进行编码复原处理,得到编码复原的合成图像,并通过接收端三维显示设备进行显示。
2.根据权利要求1所述的基于神经网络算法的三维显示图像压缩编码方法,其特征在于,所述视差矩阵反映对应子像素在三维显示设备成像后发出光线所在的成像视差图像的视差图像编号阵列,矩阵内容为一一对应的成像视差图像编号以及一个子像素对应的多个视差图像编号的子像素视差信息。
3.根据权利要求2所述的基于神经网络算法的三维显示图像压缩编码方法,其特征在于,所述权重矩阵针对一个三维显示设备子像素对应多个成像视差图像的情况,获取每张采集视差图像的每个子像素对应到成像视差图像的灰度映射关系,将子像素对应到合成图像中的权重占比进行矩阵化操作。
4.根据权利要求1所述的基于神经网络算法的三维显示图像压缩编码方法,其特征在于,所述视差矩阵包含每个子像素最终汇聚到的视点信息,所述权重矩阵包含每个子像素汇聚到对应视差矩阵的权重信息,通过加权排列子像素亮度,在三维显示成像系统形成不同视点,使得人眼在进行跨视点观察时完成立体感建构,得到合成图像。
5.根据权利要求1所述的基于神经网络算法的三维显示图像压缩编码方法,其特征在于,所述图像筛选神经网络模型包括前置选择神经网络和后置优化神经网络;其中,前置选择神经网络用于对输入的合成图像的图片特征进行筛选判别,并选择对应的后置优化神经网络,将图片周期性排布的子像素识别并抽离编码,整体降低合成图像的频率。
6.根据权利要求5所述的基于神经网络算法的三维显示图像压缩编码方法,其特征在于,对合成图像进行压缩处理的步骤包括预压缩处理和压缩处理;其中,预压缩处理采用的预压缩算法通过调整子像素位置及其相应权重,将视点高频数据信息转换成低频信息存储;
压缩处理采用的压缩算法通过削减通过预压缩处理的合成图像中的高频信息,以减小合成图像数据量;
其中,预压缩处理是在图像筛选神经网络模型对合成图像处理之前进行处理,压缩处理是在图像筛选神经网络模型对合成图像处理之后进行处理。
7.根据权利要求6所述的基于神经网络算法的三维显示图像压缩编码方法,其特征在于,所述接收端用于编码复原处理采用的编码复原算法是针对所述预压缩算法和神经网络模型抽离编码的逆变换。
8.一种基于神经网络算法的三维显示图像压缩编码装置,其特征在于,包括:
视差矩阵构建模块,用于根据发送端的三维显示设备的成像参数,确定发送端三维显示设备的成像特征,通过视差矩阵构建算法,生成与发送端三维显示设备器子像素阵列成映射关系的视差矩阵,根据子像素加权算法生成对应于视差矩阵的权重矩阵;
图像合成模块,用于将采集到的发送端三维显示设备显示的三维物体采集视差图像按照视差矩阵和权重矩阵进行信息汇总,根据不同采集视差图像进行子像素加权排列和视点划分,生成合成图像;
图像筛选神经网络模型处理模块,用于构建图像筛选神经网络模型,将所述合成图像输入所述图像筛选神经网络模型,以筛除合成图像中的无用信息量,将模型输出的合成图像经过压缩处理后,通过发送端输出;
图像解压缩模块,通过接收端接收模型输出的合成图像,进行编码复原处理,得到编码复原的合成图像,并通过接收端三维显示设备进行显示。
9.一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7中任一项所述的方法中的各步骤。
10.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-7中任一项所述的方法中的各步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210395022.7A CN114827568B (zh) | 2022-04-15 | 2022-04-15 | 基于神经网络算法的三维显示图像压缩编码方法及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210395022.7A CN114827568B (zh) | 2022-04-15 | 2022-04-15 | 基于神经网络算法的三维显示图像压缩编码方法及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114827568A true CN114827568A (zh) | 2022-07-29 |
CN114827568B CN114827568B (zh) | 2023-08-15 |
Family
ID=82536222
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210395022.7A Active CN114827568B (zh) | 2022-04-15 | 2022-04-15 | 基于神经网络算法的三维显示图像压缩编码方法及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114827568B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003070022A (ja) * | 2001-08-29 | 2003-03-07 | Sanyo Electric Co Ltd | 立体画像圧縮方法、装置、およびシステム |
CN102905150A (zh) * | 2012-10-22 | 2013-01-30 | 北京航空航天大学 | 一种新的多视点视频分形编码压缩与解压缩方法 |
CN104853184A (zh) * | 2015-05-27 | 2015-08-19 | 天津大学 | 一种影响立体图像舒适度的视差范围的检测方法 |
US20200359052A1 (en) * | 2017-11-08 | 2020-11-12 | Displaylink (Uk) Limited | Stereoscopic image data compression |
CN114266702A (zh) * | 2022-03-01 | 2022-04-01 | 清华大学 | 基于压缩感知和深度光学的高速超分辨成像方法及装置 |
-
2022
- 2022-04-15 CN CN202210395022.7A patent/CN114827568B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003070022A (ja) * | 2001-08-29 | 2003-03-07 | Sanyo Electric Co Ltd | 立体画像圧縮方法、装置、およびシステム |
CN102905150A (zh) * | 2012-10-22 | 2013-01-30 | 北京航空航天大学 | 一种新的多视点视频分形编码压缩与解压缩方法 |
CN104853184A (zh) * | 2015-05-27 | 2015-08-19 | 天津大学 | 一种影响立体图像舒适度的视差范围的检测方法 |
US20200359052A1 (en) * | 2017-11-08 | 2020-11-12 | Displaylink (Uk) Limited | Stereoscopic image data compression |
CN114266702A (zh) * | 2022-03-01 | 2022-04-01 | 清华大学 | 基于压缩感知和深度光学的高速超分辨成像方法及装置 |
Non-Patent Citations (1)
Title |
---|
吴勇军;殷勤业;曾雁星;方强;吴研: "基于幅相分离立体匹配的小波立体图像压缩", 西安交通大学学报, no. 012, pages 1245 - 1248 * |
Also Published As
Publication number | Publication date |
---|---|
CN114827568B (zh) | 2023-08-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102467376B1 (ko) | 디스플레이 처리 회로 | |
TWI691197B (zh) | 用於全視差光場壓縮之預處理器 | |
CN111837392A (zh) | 处理点云 | |
CN107071423A (zh) | 视觉多通道模型在立体视频质量客观评价中的应用方法 | |
US20240040098A1 (en) | 3d system | |
KR20210020815A (ko) | 포인트 클라우드 데이터 송신 장치, 포인트 클라우드 데이터 송신 방법, 포인트 클라우드 데이터 수신 장치 및 포인트 클라우드 데이터 수신 방법 | |
US10122987B2 (en) | 3D system including additional 2D to 3D conversion | |
CN114827568B (zh) | 基于神经网络算法的三维显示图像压缩编码方法及设备 | |
WO2023137869A1 (en) | Multiview 3d image encoding method, apparatus, system and storage medium | |
JP2014072809A (ja) | 画像生成装置、画像生成方法、画像生成装置用プログラム | |
CN114785997B (zh) | 用于高速传输的三维显示图像压缩编码方法及设备 | |
US10121280B2 (en) | 3D system including rendering with three dimensional transformation | |
US20170140571A1 (en) | 3d system including rendering with curved display | |
US20170142400A1 (en) | 3d system including rendering with shifted compensation | |
CN108495111B (zh) | 一种基于成像几何特征的立体元图像阵列编码方法 | |
CN102404583A (zh) | 三维影像的深度加强系统及方法 | |
US10225542B2 (en) | 3D system including rendering with angular compensation | |
WO2022246791A1 (zh) | 多视点图像处理系统及其方法 | |
CN116939186B (zh) | 一种自动联想性遮盖视差裸眼空间计算的处理方法及装置 | |
RU2767775C1 (ru) | Обработка облака точек | |
JP4332061B2 (ja) | 画像作成方法,画像符号化方法,画像復号方法,画像作成装置,画像符号化装置,画像復号装置,画像作成プログラム,画像符号化プログラム,画像復号プログラムおよびそれらのプログラム記録媒体 | |
CN109561262B (zh) | 一种脉冲序列格式转换方法及系统 | |
US10284837B2 (en) | 3D system including lens modeling | |
CN107105225B (zh) | 基于自适应权重调节的立体视频质量评价方法 | |
CN115550653A (zh) | 基于轻量级神经网络的动态3d点云编码模式快速确定方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |