CN116437089A - 一种基于关键目标的深度视频压缩算法 - Google Patents

一种基于关键目标的深度视频压缩算法 Download PDF

Info

Publication number
CN116437089A
CN116437089A CN202310675512.7A CN202310675512A CN116437089A CN 116437089 A CN116437089 A CN 116437089A CN 202310675512 A CN202310675512 A CN 202310675512A CN 116437089 A CN116437089 A CN 116437089A
Authority
CN
China
Prior art keywords
frame
network
motion information
preliminary
video compression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310675512.7A
Other languages
English (en)
Other versions
CN116437089B (zh
Inventor
白慧慧
邹同元
钟烨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jiaotong University
Space Star Technology Co Ltd
Original Assignee
Beijing Jiaotong University
Space Star Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jiaotong University, Space Star Technology Co Ltd filed Critical Beijing Jiaotong University
Priority to CN202310675512.7A priority Critical patent/CN116437089B/zh
Publication of CN116437089A publication Critical patent/CN116437089A/zh
Application granted granted Critical
Publication of CN116437089B publication Critical patent/CN116437089B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/128Adjusting depth or disparity
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/57Motion estimation characterised by a search window with variable size or shape
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/87Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving scene cut or scene change detection in combination with video compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/88Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving rearrangement of data among different coding units, e.g. shuffling, interleaving, scrambling or permutation of pixel data or permutation of transform coefficient data among different blocks
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明提出一种基于关键目标的深度视频压缩算法,模型主要包括两部分。第一部分是基于长短期注意力机制的语义分割网络,该模块利用长期注意力机制和短期注意力机制以聚合目标的信息并学习时间平滑性,生成高质量的特征图,最后,通过解码器输出带有语义信息的帧序列。第二部分是基于残差编码的深度视频压缩网络DVC,通过对输入帧序列做运动估计提取运动信息,并将运动编解码后的运行信息做残差,然后对残差进行压缩,最后将重建的残差与运动信息相加重建帧序列。

Description

一种基于关键目标的深度视频压缩算法
技术领域
本发明属于视频压缩技术领域,具体一种基于关键目标的深度视频压缩算法。
背景技术
在过去的几十年里,已经提出了一些传统的视频压缩算法,如H.264和H.265。这些算法大多遵循预测编码体系结构。尽管它们提供了高效的压缩性能,但它们是手工设计的,如基于块的运动估计和离散余弦变换(DCT),不能以端到端方式共同优化。随着近些年来神经网络的发展,端到端的视频编码技术也有了迅猛的发展。现有的大多数神经视频编解码器的工作大致可以分为三类:基于残差编码的、基于条件编码的和基于3D自动编码器的解决方案。其中,许多方法属于基于残差编码的解。残差编码来自于传统的混合视频编解码器。具体来说,首先生成运动补偿预测,然后对其与当前帧的残差进行编码。对于基于条件编码的解决方案,时间帧或特征作为当前帧编码的条件。与残差编码相比,条件编码具有较低或相等的熵界。而基于3D自编码器的解决方案,是通过扩展输入维数,对神经图像编解码器的自然延伸,但是它带来了较大的编码延迟,大大增加了内存开销。综上所述,这些已有的工作大多集中在如何通过探索不同的数据流或网络结构来生成优化的潜在表示。
发明内容
本发明提出一种基于关键目标的深度视频压缩算法,模型主要包括两部分。第一部分是基于长短期注意力机制的语义分割网络,该模块利用长期注意力机制和短期注意力机制以聚合目标的信息并学习时间平滑性,生成高质量的特征图,最后,通过解码器输出带有语义信息的帧序列。第二部分是基于残差编码的深度视频压缩网络,通过对输入帧序列做运动估计提取运动信息,并将运动编解码后的运行信息做残差,然后对残差进行压缩,最后将重建的残差与运动信息相加重建帧序列。具体如下:
一种基于关键目标的深度视频压缩算法,包括下述步骤:
输入被压缩对象到语义分割网络;
语义分割网络进行前景分割;
语义分割网络输出与输入对应的前景分割图;
将所述前景分割图和参考帧输入到编码网络;
提取当前帧和参考帧的运动信息;
对所述运动信息压缩编码;
将重构的运动信息和参考帧输入到运动补偿模块;
运动补偿模块输出初步预测帧;
计算所述初步预测帧与输入帧之间的残差;
将所述残差输入到压缩网络中;
所述压缩网络对残差进行压缩与编码;
将重构的残差与所述初步预测帧相加,得到最后的重建帧。
在上述方案的基础上,所述语义分割网络为一个基于长短期注意力的语义分割网络;其具体工作步骤为:
通过编码器提取视频帧序列中的特征;
利用长短期transformer学习当前帧对应的特征并传递给下一帧对应的长短期transformer;
通过解码器输出语义分割帧序列。
在上述方案的基础上,所述编码网络为基于重要性图的运动编码网络;其具体工作步骤为:
编码器对输入的运动信息压缩、量化,得到一个初步的量化码流;
重要性映射子网络从运动信息中学习一个重要性图,生成重要性mask,利用重要性mask对初步量化码流修剪生成最终的量化码流;
解码器对量化码流解码,重建运动信息。
在上述方案的基础上,所述运动补偿网络利用重构的运动信息将参考帧扭曲为一个扭曲帧,利用卷积神经网络消除扭曲帧中的空间不连续现象,得到初步的预测帧。
本发明还提出一种基于关键目标的深度视频压缩设备,包括:语义分割模块、编码网络、运动补偿模块、第一运算模块、压缩网络、第二运算模块;
所述语义分割模块用于进行前景分割,输出与输入对应的前景分割图;
所述编码网络用于提取当前帧和参考帧的运动信息,对所述运动信息压缩编码;
所述运动补偿模块用于输出初步预测帧;
所述第一运算模块用于计算所述初步预测帧与输入帧之间的残差;
所述压缩网络用于对残差进行压缩与编码;
所述第二运算模块用于重构的残差与所述初步预测帧相加,得到最后的重建帧。
在上述方案的基础上,所述语义分割模块包括编码器、解码器;
所述编码器用于提取视频帧序列中的特征,
所述解码器用于输出语义分割帧序列。
在上述方案的基础上,所述编码网络包括编码器、解码器和重要性映射子网络;
所述编码器用于对输入的运动信息压缩、量化;
所述重要性映射子网络用于生成重要性mask,利用重要性mask对初步量化码流修剪生成最终的量化码流;
所述解码器对量化码流解码,重建运动信息。
在上述方案的基础上,所述运动补偿模块利用重构的运动信息将参考帧扭曲为一个扭曲帧,利用卷积神经网络消除扭曲帧中的空间不连续现象,得到初步的预测帧。
本发明的有益效果:
本发明的针对视频聊天和视频会议的深度视频编码算法,能够有效保证关键目标视觉效果的同时,降低整体码率。
附图说明
本发明有如下附图:
图1为本发明实施例所述的一种基于关键目标的深度视频压缩方法流程框架示意图;
图2为本发明实施例所述的运动编码网络框架;
图3为本发明实施例所述的运动补偿网络框架;
图4为本发明实施例所述的算法在关键目标的测试结果;
图5为本发明实施例所述的算法在整体的测试结果。
具体实施方式
为使本发明的目的、优点和特征更加显而易见,下面结合附图1-5和具体实施方式对本发明进行进一步的详细说明。
参考图1,一种基于关键目标的深度视频压缩方法具体实施例:
包括如下步骤:
步骤(1):首先输入一组视频帧序列到语义分割网络提取关键目标帧序列。
步骤(2):将关键目标帧和参考帧输入到运动估计模块,提取运动信息输入到运动编码网络中压缩编码。
步骤(3):将重构的运动信息和参考帧输入到运动补偿网络,扭曲、细化后得到初步预测帧。
步骤(4):将输入帧和初步预测帧之间的残差输入到残差编码网络进行压缩编码,并将重构的残差与初步预测帧求和得到最后的重建帧。
在视频编码的具体过程中,首先,将带有语义信息的帧序列输入到视频压缩网络中,针对前景和背景采用不同的压缩率进行编码,基于重要性映射的端到端视频编码网络包括光流估计、运动编码、运动补偿、残差编码、比特估计等模块,首先将当前帧和重建的参考帧输入到光流估计子网络中提取运动信息,随后将运动信息 输入到运动编码子网络中提取高维特征并进行量化编码,随后将重构的 输入到运动解码子网络重构为运动信息,与重建的参考帧共同输入到运动补偿子网络中生成初步预测帧 ,当前帧和预测帧的残差将进入残差编解码器中压缩并重构为残差,重构的残差和初步预测帧相加得到最后的重构帧。
参考图2,在步骤(1)中,提出了一个基于长短期注意力的语义分割网络,首先通过编码器提取视频帧序列中的特征,然后利用长短期transformer学习和传递特征给下一个单元,最后通过解码器输出语义分割帧序列。
参考图3,在步骤(2)中,提出了基于重要性图的运动编码网络,该网络包括编码器、解码器和重要性映射子网络。编码器首先对输入的运动信息压缩、量化,得到一个初步的量化码流。重要性映射子网络从运动信息中学习一个重要性图,生成重要性mask,利用重要性mask对初步量化码流修剪生成最终的量化码流,随后解码器对量化码流解码,重建运动信息。
在步骤(3)中,提出了运动补偿网络,利用重构的运动信息将参考帧扭曲为一个扭曲帧,接下来利用卷积神经网络消除扭曲帧中的空间不连续现象,得到初步的预测帧。
下面用对比试验的结果对本发明进行说明:
训练与测试过程:
实验采用了一块NVIDIA RTX 3090 GPU在Pytorch框架的支持下来执行模型的训练和测试工作。本方法学习率初始为0.0001,后续稳定后除以10,本方法采用率失真损失函数作为网络框架的损失函数。在maadaa.ai数据集上训练到30万次,获得最佳的检测精度。
参考图4,展示了在maadaa.ai数据集上多个算法的在关键目标上的性能结果,为了更好的评估本发明提出的基于关键目标的深度视频压缩方法,设置了两组不同评价指标的实验,分别是PSNR-bpp性能曲线和PSNR-MS-SSIM性能曲线。在第一组PSNR-bpp性能实验中,本发明提出的方法在bpp大于0.10时比表现最好的算法PSNR高0.3dB,小于0.10时也有一定优势。在第二组PSNR-MS-SSIM的实验中,本发明提出的方案相比于其他方法中表现最好的取得了0.002的平均优势。
参考图5,展示了在maadaa.ai数据集上多个算法的在整体上的性能结果,可以看出,在整体(前景+背景)的测试结果上,本章采用的算法在低比特率的情况下PSNR和MS-SSIM两个指标的优势都非常明显,因为前景与背景采用了不同压缩率,在降低整体比特率的基础上还保证了关键目标的高压缩质量。随着比特率的增大,PSNR和MS-SSIM两个指标的优势变小,因为只有关键目标在提高压缩质量,背景依旧采用比较低的压缩质量,虽然这样能够节省码率,但低质量背景依旧影响了整体的PSNR和MS-SSIM指标。
以上实施方式仅用于说明本发明专利,而并非对本发明专利的限制,有关技术领域的普通技术人员,在不脱离本发明专利的实质和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明专利的范畴,本发明专利的专利保护范围应由权利要求限定。
本说明书中未作详细描述的内容属于本领域专业技术人员公知的现有技术。

Claims (8)

1.一种基于关键目标的深度视频压缩算法,其特征在于,包括下述步骤:
输入被压缩对象到语义分割网络;
语义分割网络进行前景分割;
语义分割网络输出与输入对应的前景分割图;
将所述前景分割图和参考帧输入到编码网络;
提取当前帧和参考帧的运动信息;
对所述运动信息压缩编码;
将重构的运动信息和参考帧输入到运动补偿模块;
运动补偿模块输出初步预测帧;
计算所述初步预测帧与输入帧之间的残差;
将所述残差输入到压缩网络中;
所述压缩网络对残差进行压缩与编码;
将重构的残差与所述初步预测帧相加,得到最后的重建帧。
2.根据权利要求1所述的一种基于关键目标的深度视频压缩算法,其特征在于,所述语义分割网络为一个基于长短期注意力的语义分割网络;
其具体工作步骤为:
通过编码器提取视频帧序列中的特征;
利用长短期transformer学习当前帧对应的特征并传递给下一帧对应的长短期transformer;
通过解码器输出语义分割帧序列。
3.根据权利要求1所述的一种基于关键目标的深度视频压缩算法,其特征在于,所述编码网络为基于重要性图的运动编码网络;
其具体工作步骤为:
编码器对输入的运动信息压缩、量化,得到一个初步的量化码流;
重要性映射子网络从运动信息中学习一个重要性图,生成重要性mask,利用重要性mask对初步量化码流修剪生成最终的量化码流;
解码器对量化码流解码,重建运动信息。
4.根据权利要求1所述的一种基于关键目标的深度视频压缩算法,其特征在于,所述运动补偿网络利用重构的运动信息将参考帧扭曲为一个扭曲帧,利用卷积神经网络消除扭曲帧中的空间不连续现象,得到初步的预测帧。
5.一种基于关键目标的深度视频压缩设备,其特征在于,包括:语义分割模块、编码网络、运动补偿模块、第一运算模块、压缩网络、第二运算模块;
所述语义分割模块用于进行前景分割,输出与输入对应的前景分割图;
所述编码网络用于提取当前帧和参考帧的运动信息,对所述运动信息压缩编码;
所述运动补偿模块用于输出初步预测帧;
所述第一运算模块用于计算所述初步预测帧与输入帧之间的残差;
所述压缩网络用于对残差进行压缩与编码;
所述第二运算模块用于重构的残差与所述初步预测帧相加,得到最后的重建帧。
6.根据权利要求5所述的一种基于关键目标的深度视频压缩设备,其特征在于,所述语义分割模块包括编码器、解码器;
所述编码器用于提取视频帧序列中的特征,
所述解码器用于输出语义分割帧序列。
7.根据权利要求5所述的一种基于关键目标的深度视频压缩设备,其特征在于,
所述编码网络包括编码器、解码器和重要性映射子网络;
所述编码器用于对输入的运动信息压缩、量化;
所述重要性映射子网络用于生成重要性mask,利用重要性mask对初步量化码流修剪生成最终的量化码流;
所述解码器对量化码流解码,重建运动信息。
8.根据权利要求5所述的一种基于关键目标的深度视频压缩设备,其特征在于,
所述运动补偿模块利用重构的运动信息将参考帧扭曲为一个扭曲帧,利用卷积神经网络消除扭曲帧中的空间不连续现象,得到初步的预测帧。
CN202310675512.7A 2023-06-08 2023-06-08 一种基于关键目标的深度视频压缩方法 Active CN116437089B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310675512.7A CN116437089B (zh) 2023-06-08 2023-06-08 一种基于关键目标的深度视频压缩方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310675512.7A CN116437089B (zh) 2023-06-08 2023-06-08 一种基于关键目标的深度视频压缩方法

Publications (2)

Publication Number Publication Date
CN116437089A true CN116437089A (zh) 2023-07-14
CN116437089B CN116437089B (zh) 2023-09-05

Family

ID=87080010

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310675512.7A Active CN116437089B (zh) 2023-06-08 2023-06-08 一种基于关键目标的深度视频压缩方法

Country Status (1)

Country Link
CN (1) CN116437089B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118474377A (zh) * 2024-07-11 2024-08-09 中国矿业大学 一种支持多种计算复杂度的深度视频编解码方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018128741A1 (en) * 2017-01-06 2018-07-12 Board Of Regents, The University Of Texas System Segmenting generic foreground objects in images and videos
CN111294604A (zh) * 2020-02-13 2020-06-16 济南浪潮高新科技投资发展有限公司 一种基于深度学习的视频压缩方法
CN112004085A (zh) * 2020-08-14 2020-11-27 北京航空航天大学 一种场景语义分割结果指导下的视频编码方法
CN114503576A (zh) * 2020-07-15 2022-05-13 腾讯美国有限责任公司 通过可变形卷积生成用于视频编解码的预测帧
CN114913250A (zh) * 2021-12-24 2022-08-16 天翼数字生活科技有限公司 基于语义分割和匈牙利算法的视频编解码系统和方法
CN115150628A (zh) * 2022-05-31 2022-10-04 北京航空航天大学 具有超先验引导模式预测的由粗到细深度视频编码方法
US20220394240A1 (en) * 2021-06-03 2022-12-08 Lemon Inc. Neural Network-Based Video Compression with Spatial-Temporal Adaptation

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018128741A1 (en) * 2017-01-06 2018-07-12 Board Of Regents, The University Of Texas System Segmenting generic foreground objects in images and videos
CN111294604A (zh) * 2020-02-13 2020-06-16 济南浪潮高新科技投资发展有限公司 一种基于深度学习的视频压缩方法
CN114503576A (zh) * 2020-07-15 2022-05-13 腾讯美国有限责任公司 通过可变形卷积生成用于视频编解码的预测帧
CN112004085A (zh) * 2020-08-14 2020-11-27 北京航空航天大学 一种场景语义分割结果指导下的视频编码方法
US20220394240A1 (en) * 2021-06-03 2022-12-08 Lemon Inc. Neural Network-Based Video Compression with Spatial-Temporal Adaptation
CN114913250A (zh) * 2021-12-24 2022-08-16 天翼数字生活科技有限公司 基于语义分割和匈牙利算法的视频编解码系统和方法
CN115150628A (zh) * 2022-05-31 2022-10-04 北京航空航天大学 具有超先验引导模式预测的由粗到细深度视频编码方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118474377A (zh) * 2024-07-11 2024-08-09 中国矿业大学 一种支持多种计算复杂度的深度视频编解码方法

Also Published As

Publication number Publication date
CN116437089B (zh) 2023-09-05

Similar Documents

Publication Publication Date Title
CN107105278B (zh) 运动矢量自动生成的视频编解码系统
US20230291909A1 (en) Coding video frame key points to enable reconstruction of video frame
CN110248190B (zh) 一种基于压缩感知的多层残差系数图像编码方法
CN116437089B (zh) 一种基于关键目标的深度视频压缩方法
CN110290386B (zh) 一种基于生成对抗网络的低码率人体运动视频编码系统及方法
CN109982092B (zh) 基于多分支循环卷积神经网络的hevc帧间快速方法
CN114501013A (zh) 一种可变码率视频压缩方法、系统、装置及存储介质
CN113822147A (zh) 一种协同机器语义任务的深度压缩方法
CN113132735A (zh) 一种基于视频帧生成的视频编码方法
CN111669588B (zh) 一种超低时延的超高清视频压缩编解码方法
He et al. Beyond coding: Detection-driven image compression with semantically structured bit-stream
Akbari et al. Learned multi-resolution variable-rate image compression with octave-based residual blocks
US20240187618A1 (en) Multivariate rate control for transcoding video content
CN112631434B (zh) 一种基于深度学习的振动触觉编解码方法
CN115529457B (zh) 基于深度学习的视频压缩方法和装置
Zhao et al. Efficient screen content coding based on convolutional neural network guided by a large-scale database
CN106791864A (zh) 一种基于hevc标准下提高视频转码速率的实现方法
Lu et al. Image Compression Based on Mean Value Predictive Vector Quantization.
Gulia et al. Comprehensive Analysis of Flow Incorporated Neural Network based Lightweight Video Compression Architecture
CN1338235A (zh) 基于分段的视频压缩编码的方法和装置
CN117061751B (zh) 一种面向机器视觉和人眼视觉的图像压缩系统
EP4224852A1 (en) Video encoding and decoding methods, encoder, decoder, and storage medium
EP3322188A1 (en) Method and device for generating a signal comprising video transcoding hints
US11683515B2 (en) Video compression with adaptive iterative intra-prediction
CN117915107B (zh) 图像压缩系统、图像压缩方法、存储介质与芯片

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant