CN110401834A - 一种基于深度学习的自适应视频编码方法 - Google Patents

一种基于深度学习的自适应视频编码方法 Download PDF

Info

Publication number
CN110401834A
CN110401834A CN201910714608.3A CN201910714608A CN110401834A CN 110401834 A CN110401834 A CN 110401834A CN 201910714608 A CN201910714608 A CN 201910714608A CN 110401834 A CN110401834 A CN 110401834A
Authority
CN
China
Prior art keywords
video
crf
neural network
network model
deep learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910714608.3A
Other languages
English (en)
Other versions
CN110401834B (zh
Inventor
庄育珊
许祝登
刘佳扬
刘宇新
朱政
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Microframe Information Technology Co Ltd
Original Assignee
Hangzhou Microframe Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Microframe Information Technology Co Ltd filed Critical Hangzhou Microframe Information Technology Co Ltd
Priority to CN201910714608.3A priority Critical patent/CN110401834B/zh
Publication of CN110401834A publication Critical patent/CN110401834A/zh
Application granted granted Critical
Publication of CN110401834B publication Critical patent/CN110401834B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/149Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明公开了一种基于深度学习的自适应视频编码方法。所述方法包括以下步骤:利用多样化的视频资料库生成训练数据和测试数据;构建深度学习的神经网络模型;所述神经网络模型包括卷积神经网络CNN特征提取器、长短期记忆网络LSTM特征提取器、全连接层以及输出层;使用训练数据对深度学习的神经网络模型进行训练;使用测试数据对训练好的模型进行验证;应用所述神经网络模型得到预测的CRFoptimal(v)的取值;根据得到的CRFoptimal(v)进行视频压缩。该方法对每个视频较准确地预测满足视频质量评价分数的编码参数,从而实现满足用户体验前提下视频编码的码率自适应。

Description

一种基于深度学习的自适应视频编码方法
技术领域
本发明涉及视频编解码技术领域,尤其涉及一种基于深度学习的自适应视频编码方法。
背景技术
视频压缩,也称视频编码,其目的是消除视频信号间存在的冗余信息。随着多媒体数字视频应用的不断发展和人们对视频云计算需求的不断提高,原始视频信源的数据量已使现有传输网络带宽和存储资源无法承受,因而经编码压缩后的视频才是宜在网络中传输中的信息,视频编码技术已成为目前国内外学术研究和工业应用的热点之一。
同一个视频,视频编码的压缩率越高,压缩失真越高,用户体验的视频质量越差;压缩率越低,视频的存储和传输的成本越高。如何在两者之间找到一个平衡是视频编码技术中的一个难点。
自适应的视频编码就是要为每一个视频或视频片段,找出满足用户体验要求的编码的参数,以达到满足视频质量又节省带宽的目的。
发明内容
本发明提供了一种基于深度学习的自适应视频编码方法,深度学习的方法可以对每个视频较准确地预测满足视频质量评价分数的编码参数,从而实现满足用户体验前提下视频编码的码率自适应。
本发明提供的一种基于深度学习的自适应视频编码方法,包括以下步骤:
(1)利用多样化的视频资料库生成训练数据和测试数据;
(1.1)对样本视频数据使用不同的固定码率系数CRF进行压缩编码;
(1.2)对每个已编码的视频按照一视频质量评价体系进行评分;
(1.3)针对每个样本视频v,选取使得编码的视频能够达到一个满意的质量分数SCORE_TARGET的最大的CRF,记为CRFoptimal(v),当CRF设置为CRFoptimal(v)时,压缩的视频在达到一个满意的视觉效果的同时能够节省最多的码率;
(1.4)把样本数据按照一定的比例随机分为训练数据和测试数据;
(2)构建深度学习的神经网络模型;所述神经网络模型包括卷积神经网络CNN特征提取器、长短期记忆网络LSTM特征提取器、全连接层以及输出层,所述全连接层分别与所述CNN特征提取器、LSTM特征提取器、输出层相连;
(2.1)所述CNN特征提取器通过CNN模型提取视频空间域的特征;
(2.2)所述LSTM特征提取器通过LSTM模型来提取视频时间域的特征;
(2.3)所述全连接层融合上述提取的视频空间域的特征和时间域的特征,进行CRFoptimal(v)的预测;
(2.4)输出层的输出值为预测的CRFoptimal(v)的值;
(2.5)计算所述神经网络模型的损失函数L2
其中m表示样本的个数,表示CRF的预测值,CRF(i)表示样本数据i的CRF实际值,表示对样本数据i的预测值;利用所述损失函数L2对所述神经网络模块的各层的参数进行调整;
(3)使用训练数据对深度学习的神经网络模型进行训练;
(4)使用测试数据对训练好的模型进行验证;
(5)应用所述构建的神经网络模型;
(5.1)把输入视频作为输入送到训练好的深度学习的神经网络模型中;
(5.2)在模型的输出端得到预测的CRFoptimal(v)的取值;
(6)视频压缩:编码器对输入的视频v进行压缩编码,CRF设置为CRFoptimal(v),输出编码视频码流。
优选地,所述步骤(1.1)中,在x264、x265编码器中,CRF的等级范围为[0,51];对于AV1编码标准,CRF的取值对应于视频编码器的帧量化参数。
优选地,所述步骤(1.2)中,所述视频质量评价体系为视频质量多方法评价融合VMAF。
本发明基于深度学习的方法,建立神经网络模型,通过训练和测试,可以对每个视频较准确地预测满足视频质量评价分数的编码参数,从而实现满足用户体验前提下视频编码的码率自适应,实现了视频压缩与用户体验质量之间的平衡。本发明对CRFoptimal(v)预测的平均误差为1.4,可以较好地实现满足用户体验前提下视频编码的码率自适应。
附图说明
图1为本发明基于深度学习的自适应视频编码方法的流程图。
图2为本发明神经网络模型的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书一个或多个实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。
下面结合附图对本发明作更进一步的说明。
如图1所示,本发明的基于深度学习的自适应视频编码方法具体包括以下步骤:
(1)利用多样化的视频资料库生成训练数据和测试数据。
(1.1)对样本视频数据使用不同的固定码率系数CRF(Constant Rate Factor)进行压缩编码。CRF为编码器的码率控制的参数,对于同一个视频,CRF值越大压缩度越高,压缩的视频质量越低。在x264、x265编码器中CRF的等级范围为[0,51];对于其他编码标准,比如AV1,CRF的取值对应于视频编码器的帧量化参数。
(1.2)对每个已编码的视频按照一个视频质量评价体系比如视频质量多方法评价融合VMAF(Visual Multimethod Assessment Fusion)进行评分。
(1.3)针对每个样本视频v,选取使得编码的视频能够达到一个满意的质量分数SCORE_TARGET的最大的CRF,记为CRFoptimal(v)。对于每个视频v,压缩的难易程度不一样,CRFoptimal(v)的取值是不一样的。针对一个视频v,当CRF设置为CRFoptimal(v)时,压缩的视频在达到一个满意的视觉效果的同时能够节省最多的码率。
(1.4)把样本数据按照一定的比例随机分为训练数据和测试数据。
(2)构建深度学习的神经网络模型,如图2所示。所述神经网络模块包括CNN特征提取器、LSTM特征提取器、全连接层以及输出层,所述全连接层分别与所述CNN特征提取器、LSTM特征提取器、输出层相连。
(2.1)所述CNN特征提取器通过卷积神经网络CNN(Convolutional NeuralNetwork)模型提取视频空间域的特征。卷积神经网络CNN,利用卷积的方式将取样帧的纹理、光源、大小等等作为特征,最大特色在于局部感知与权重共享,藉由卷积核抽取影像的局部特征,并且让影像各区域共享这个卷积核,常运用于图像辨识领域。
(2.2)所述LSTM特征提取器通过长短期记忆网络LSTM(Long short-term memory)模型来提取视频时间域的特征。视频的压缩其中一环即是利用帧与帧的时序上的相关性,减少时间冗余,因此将视频的时域特征纳入参考是关键。而LSTM是一种特定形式的循环神经网络RNN(Recurrent neural network),擅长处理多变量的问题,该特性使其有助于处理时间序列问题。
(2.3)所述全连接层融合上述提取的视频空间域的特征和时间域的特征,进行CRFoptimal(v)的预测。
(2.4)输出层输出的为预测的CRFoptimal(v)的值。
(2.5)计算所述神经网络模型的损失函数L2
其中m表示样本的个数,表示CRF的预测值,CRF(i)表示样本数据i的CRF实际值,表示对样本数据i的预测值。如上述公式,L2使用梯度下降的方法来调整调经网络各层之间的参数,对损失函数L2求导可以得到与输出层的连接的参数的调整,这个调整会反向传递给前面的层,用于调整前面各层的参数。这是深度学习通用的一个训练过程,此处不再赘述。
(3)使用训练数据对深度学习的神经网络模型进行训练。
(4)使用测试数据对训练好的模型进行验证。
(5)模型应用。
(5.1)把输入视频作为输入送到训练好的深度学习的神经网络模型中。
(5.2)在模型的输出端得到预测的CRFoptimal(v)的取值。
(6)视频压缩:编码器对输入的视频v进行压缩编码,CRF设置为CRFoptimal(v)。输出编码视频码流。
通过上述基于深度学习的自适应视频编码方法,针对每个待编码视频预测满足一定质量评价分数要求的编码系数CRF的最大值,从而实现满足用户体验要求下最高的压缩率。本发明对CRFoptimal(v)预测的平均误差为1.4,可以较好地实现满足用户体验前提下视频编码的码率自适应。
本申请可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

Claims (3)

1.一种基于深度学习的自适应视频编码方法,其特征在于,包括以下步骤:
(1)利用多样化的视频资料库生成训练数据和测试数据;
(1.1)对样本视频数据使用不同的固定码率系数CRF进行压缩编码;
(1.2)对每个已编码的视频按照一视频质量评价体系进行评分;
(1.3)针对每个样本视频v,选取使得编码的视频能够达到一个满意的质量分数SCORE_TARGET的最大的CRF,记为CRFoptimal(v),当CRF设置为CRFoptimal(v)时,压缩的视频在达到一个满意的视觉效果的同时能够节省最多的码率;
(1.4)把样本数据按照一定的比例随机分为训练数据和测试数据;
(2)构建深度学习的神经网络模型;所述神经网络模型包括卷积神经网络CNN特征提取器、长短期记忆网络LSTM特征提取器、全连接层以及输出层,所述全连接层分别与所述CNN特征提取器、所述LSTM特征提取器、所述输出层相连;
(2.1)所述CNN特征提取器通过CNN模型提取视频空间域的特征;
(2.2)所述LSTM特征提取器通过LSTM模型来提取视频时间域的特征;
(2.3)所述全连接层融合上述提取的视频空间域的特征和时间域的特征,进行CRFoptimal(v)的预测;
(2.4)输出层的输出值为预测的CRFoptimal(v)的值;
(2.5)计算所述神经网络模型的损失函数L2
其中m表示样本的个数,表示CRF的预测值,CRF(i)表示样本数据i的CRF实际值,表示对样本数据i的预测值;利用所述损失函数L2对所述神经网络模型中各层的参数进行调整;
(3)使用训练数据对深度学习的神经网络模型进行训练;
(4)使用测试数据对训练好的模型进行验证;
(5)应用所述构建的神经网络模型;
(5.1)把输入视频作为输入送到训练好的深度学习的神经网络模型中;
(5.2)在模型的输出端得到预测的CRFoptimal(v)的取值;
(6)视频压缩:编码器对输入的视频v进行压缩编码,CRF设置为CRFoptimal(v),输出编码视频码流。
2.根据权利要求1所述的自适应视频编码方法,其特征在于,所述步骤(1.1)中,在x264、x265编码器中,CRF的等级范围为[0,51];对于AV1编码标准,CRF的取值对应于视频编码器的帧量化参数。
3.根据权利要求2所述的自适应视频编码方法,其特征在于,所述步骤(1.2)中,所述视频质量评价体系为视频质量多方法评价融合VMAF。
CN201910714608.3A 2019-08-06 2019-08-06 一种基于深度学习的自适应视频编码方法 Active CN110401834B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910714608.3A CN110401834B (zh) 2019-08-06 2019-08-06 一种基于深度学习的自适应视频编码方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910714608.3A CN110401834B (zh) 2019-08-06 2019-08-06 一种基于深度学习的自适应视频编码方法

Publications (2)

Publication Number Publication Date
CN110401834A true CN110401834A (zh) 2019-11-01
CN110401834B CN110401834B (zh) 2021-07-27

Family

ID=68327303

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910714608.3A Active CN110401834B (zh) 2019-08-06 2019-08-06 一种基于深度学习的自适应视频编码方法

Country Status (1)

Country Link
CN (1) CN110401834B (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111083473A (zh) * 2019-12-28 2020-04-28 杭州当虹科技股份有限公司 一种基于机器学习的内容自适应视频编码方法
CN111246209A (zh) * 2020-01-20 2020-06-05 北京字节跳动网络技术有限公司 自适应编码方法、装置、电子设备及计算机存储介质
CN111818329A (zh) * 2020-06-24 2020-10-23 天津大学 基于堆栈式自适应编码器的视频质量评价方法
CN112188310A (zh) * 2020-09-28 2021-01-05 北京金山云网络技术有限公司 测试序列构建方法、装置、电子设备及存储介质
CN112422967A (zh) * 2020-09-24 2021-02-26 北京金山云网络技术有限公司 视频的编码方法及装置、存储介质、电子设备
CN112492314A (zh) * 2020-11-25 2021-03-12 杭州微帧信息科技有限公司 一种基于机器学习的动态运动估计算法选择的方法
CN113259657A (zh) * 2021-05-18 2021-08-13 上海大学 基于视频质量分数的dppo码率自适应控制系统和方法
CN113395518A (zh) * 2021-08-13 2021-09-14 杭州微帧信息科技有限公司 一种视频编码自适应量化死区的方法
CN114025190A (zh) * 2021-11-03 2022-02-08 北京达佳互联信息技术有限公司 多码率调度方法和多码率调度装置
CN114071164A (zh) * 2020-08-06 2022-02-18 阿里巴巴集团控股有限公司 图像压缩模型的训练方法及装置、图像压缩方法及装置
CN114245140A (zh) * 2021-11-30 2022-03-25 慧之安信息技术股份有限公司 一种基于深度学习的码流预测方法和装置
CN114640658A (zh) * 2020-11-30 2022-06-17 阿里巴巴集团控股有限公司 媒体数据及内容数据传输方法、装置和系统
CN114868390A (zh) * 2020-12-04 2022-08-05 深圳市大疆创新科技有限公司 视频编码方法、解码方法、编码器、解码器以及ai加速器

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103780901A (zh) * 2014-01-22 2014-05-07 上海交通大学 基于视频空间和时间信息的视频质量及压缩码率估计方法
CN106162167A (zh) * 2015-03-26 2016-11-23 中国科学院深圳先进技术研究院 基于学习的高效视频编码方法
CN108174290A (zh) * 2018-01-25 2018-06-15 北京百度网讯科技有限公司 用于处理视频的方法和装置
WO2019001108A1 (zh) * 2017-06-30 2019-01-03 华为技术有限公司 视频处理的方法和装置
CN109257600A (zh) * 2018-11-28 2019-01-22 福建帝视信息科技有限公司 一种基于深度学习的视频压缩伪影自适应去除方法
CN109286825A (zh) * 2018-12-14 2019-01-29 北京百度网讯科技有限公司 用于处理视频的方法和装置
CN109361919A (zh) * 2018-10-09 2019-02-19 四川大学 一种联合超分辨率和去压缩效应的图像编码性能提升方法
US10313675B1 (en) * 2015-01-30 2019-06-04 Google Llc Adaptive multi-pass video encoder control
CN109996071A (zh) * 2019-03-27 2019-07-09 上海交通大学 基于深度学习的可变码率图像编码、解码系统及方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103780901A (zh) * 2014-01-22 2014-05-07 上海交通大学 基于视频空间和时间信息的视频质量及压缩码率估计方法
US10313675B1 (en) * 2015-01-30 2019-06-04 Google Llc Adaptive multi-pass video encoder control
CN106162167A (zh) * 2015-03-26 2016-11-23 中国科学院深圳先进技术研究院 基于学习的高效视频编码方法
WO2019001108A1 (zh) * 2017-06-30 2019-01-03 华为技术有限公司 视频处理的方法和装置
CN108174290A (zh) * 2018-01-25 2018-06-15 北京百度网讯科技有限公司 用于处理视频的方法和装置
CN109361919A (zh) * 2018-10-09 2019-02-19 四川大学 一种联合超分辨率和去压缩效应的图像编码性能提升方法
CN109257600A (zh) * 2018-11-28 2019-01-22 福建帝视信息科技有限公司 一种基于深度学习的视频压缩伪影自适应去除方法
CN109286825A (zh) * 2018-12-14 2019-01-29 北京百度网讯科技有限公司 用于处理视频的方法和装置
CN109996071A (zh) * 2019-03-27 2019-07-09 上海交通大学 基于深度学习的可变码率图像编码、解码系统及方法

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111083473B (zh) * 2019-12-28 2022-03-08 杭州当虹科技股份有限公司 一种基于机器学习的内容自适应视频编码方法
CN111083473A (zh) * 2019-12-28 2020-04-28 杭州当虹科技股份有限公司 一种基于机器学习的内容自适应视频编码方法
CN111246209A (zh) * 2020-01-20 2020-06-05 北京字节跳动网络技术有限公司 自适应编码方法、装置、电子设备及计算机存储介质
CN111246209B (zh) * 2020-01-20 2022-08-02 北京字节跳动网络技术有限公司 自适应编码方法、装置、电子设备及计算机存储介质
CN111818329A (zh) * 2020-06-24 2020-10-23 天津大学 基于堆栈式自适应编码器的视频质量评价方法
CN114071164A (zh) * 2020-08-06 2022-02-18 阿里巴巴集团控股有限公司 图像压缩模型的训练方法及装置、图像压缩方法及装置
CN112422967A (zh) * 2020-09-24 2021-02-26 北京金山云网络技术有限公司 视频的编码方法及装置、存储介质、电子设备
CN112422967B (zh) * 2020-09-24 2024-01-19 北京金山云网络技术有限公司 视频的编码方法及装置、存储介质、电子设备
CN112188310A (zh) * 2020-09-28 2021-01-05 北京金山云网络技术有限公司 测试序列构建方法、装置、电子设备及存储介质
CN112188310B (zh) * 2020-09-28 2022-08-16 北京金山云网络技术有限公司 测试序列构建方法、装置、电子设备及存储介质
CN112492314A (zh) * 2020-11-25 2021-03-12 杭州微帧信息科技有限公司 一种基于机器学习的动态运动估计算法选择的方法
CN112492314B (zh) * 2020-11-25 2024-05-14 杭州微帧信息科技有限公司 一种基于机器学习的动态运动估计算法选择的方法
CN114640658A (zh) * 2020-11-30 2022-06-17 阿里巴巴集团控股有限公司 媒体数据及内容数据传输方法、装置和系统
CN114868390A (zh) * 2020-12-04 2022-08-05 深圳市大疆创新科技有限公司 视频编码方法、解码方法、编码器、解码器以及ai加速器
CN113259657A (zh) * 2021-05-18 2021-08-13 上海大学 基于视频质量分数的dppo码率自适应控制系统和方法
CN113395518B (zh) * 2021-08-13 2022-03-15 杭州微帧信息科技有限公司 一种视频编码自适应量化死区的方法
CN113395518A (zh) * 2021-08-13 2021-09-14 杭州微帧信息科技有限公司 一种视频编码自适应量化死区的方法
CN114025190A (zh) * 2021-11-03 2022-02-08 北京达佳互联信息技术有限公司 多码率调度方法和多码率调度装置
CN114025190B (zh) * 2021-11-03 2023-06-20 北京达佳互联信息技术有限公司 多码率调度方法和多码率调度装置
CN114245140A (zh) * 2021-11-30 2022-03-25 慧之安信息技术股份有限公司 一种基于深度学习的码流预测方法和装置

Also Published As

Publication number Publication date
CN110401834B (zh) 2021-07-27

Similar Documents

Publication Publication Date Title
CN110401834A (zh) 一种基于深度学习的自适应视频编码方法
US11756561B2 (en) Speech coding using content latent embedding vectors and speaker latent embedding vectors
CN110262819B (zh) 一种联邦学习的模型参数更新方法及装置
CN114554211A (zh) 内容自适应视频编码方法、装置、设备和存储介质
CN111371534B (zh) 一种数据重传方法、装置、电子设备和存储介质
CN110166781A (zh) 一种视频编码方法、装置和可读介质
CN112104867B (zh) 一种视频处理方法、视频处理装置、智能设备及存储介质
WO2022000298A1 (en) Reinforcement learning based rate control
CN111222532A (zh) 具有分类精度保持和带宽保护的边云协同深度学习模型训练方法
CN103607395A (zh) 一种传输触觉数据的方法及装置
US20240080495A1 (en) Iteratively updating a filtering model
CN116614637B (zh) 一种数据处理方法、装置、设备以及可读存储介质
CN115834890B (zh) 一种图像压缩方法、装置、设备及存储介质
CN112104863A (zh) 视频质量评测模型训练、视频质量评测的方法和相关装置
CN116760988A (zh) 基于人类视觉系统的视频编码方法和装置
Dong et al. Innovative semantic communication system
CN115767146A (zh) 数据流控制方法、系统、装置、电子设备及存储介质
CN108259914A (zh) 基于物体库的云图像编码方法
US11394981B2 (en) Electronic apparatus and control method thereof
CN110276728B (zh) 一种基于残差生成对抗网络的人脸视频增强方法
CN109218724A (zh) 一种数据编码方法、装置及存储设备和终端设备
CN108718340A (zh) 一种外语数字化学习系统及其学习方法
CN114827289B (zh) 一种通信压缩方法、系统、电子装置和存储介质
CN114501026B (zh) 视频编码方法、装置、设备及存储介质
US11412283B1 (en) System and method for adaptively streaming video

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant