CN110312131B

CN110312131B - 一种基于深度学习的内容自适应在线视频编码方法

Info

Publication number: CN110312131B
Application number: CN201910586777.3A
Authority: CN
Inventors: 万俊青; 王建伟; 谢亚光
Original assignee: Hangzhou Arcvideo Technology Co ltd
Current assignee: Hangzhou Arcvideo Technology Co ltd
Priority date: 2019-07-01
Filing date: 2019-07-01
Publication date: 2021-03-23
Anticipated expiration: 2039-07-01
Also published as: CN110312131A

Abstract

本发明公开了一种基于深度学习的内容自适应在线视频编码方法。它包括分析器、参数获得器和HEVC编码器，其中分析器提取每帧的特征值、决定编码帧型、检测场景切换点；参数获得器将视频流切分成若干个一小段，根据每段的特征选取编码参数；HEVC编码器根据各自的编码参数编码视频流段；利用深度学习算法，根据视频内容来自适应调节编码参数。本发明的有益效果是：保证在线编码视频质量并且节省带宽，根据视频内容来自适应调节编码参数，适应在线编码的实时性，视频质量相对以前方案稳定很多，减少了突然花屏、图像块多的现象，并且平均节省码率10％～20％左右。

Description

一种基于深度学习的内容自适应在线视频编码方法

技术领域

本发明涉及视频处理相关技术领域，尤其是指一种基于深度学习的内容自适应在线视频编码方法。

背景技术

目前在线编码一般都是根据经验设置合理的码率，采用CBR或VBR模式来编码。但在一段视频中，图像内容的复杂度是不断变化的，对于内容简单的视频段，这个码率过大，浪费带宽；对于内容复杂的视频段，这个码率过小，导致视频质量不满足客户需求。此外，在线视频内容因无法预先观看，这个码率有可能不适合这段视频流。

发明内容

本发明是为了克服现有技术中存在上述的不足，提供了一种保证在线编码视频质量并且节省带宽的基于深度学习的内容自适应在线视频编码方法。

为了实现上述目的，本发明采用以下技术方案：

一种基于深度学习的内容自适应在线视频编码方法，包括分析器、参数获得器和HEVC编码器，其中分析器提取每帧的特征值、决定编码帧型、检测场景切换点；参数获得器将视频流切分成若干个一小段，根据每段的特征选取编码参数；HEVC编码器根据各自的编码参数编码视频流段；具体操作步骤如下：

(1)用户设置视频质量级别、最大码率、GOP大小这些编码参数；

(2)分析器计算每帧的视频特征：帧内复杂度和帧间复杂度，分析器根据上一帧、本帧及后面几帧的帧内复杂度、帧间复杂度的关系判断当前是否是场景切换点；

(3)如果是场景切换点，则本帧将作为IDR帧并开始新的一个GOP分析，并进入到步骤(4)；如果不是场景切换点，则决定当前帧的帧型，判断是否是一个新的GOP开始，如果是，则进入到步骤(4)，如果不是，则返回到步骤(2)；

(4)参数获得器将这个GOP每帧的视频特征进行整合，计算各种帧型的总特征值，再将总特征值送给SVM，SVM利用离线数据训练好了的model进行分类，得到参数分类索引号，从参数表中得到这个GOP的编码参数，判断这个GOP第一帧是否是场景切换点，如果这个GOP第一帧是场景切换点，则进入到步骤(6)；如果这个GOP第一帧不是场景切换点，则进入到步骤(5)中；

(5)将这个编码参数和前一个GOP编码参数比较，如果满足：参数改变比较大并且前一参数编码的帧数大于阈值T，则进入到步骤(6)，如果不满足上述条件，则进入到步骤(7)；

(6)通知HEVC编码器以新的编码参数编码这个GOP；

(7)HEVC编码器得到用新的编码参数通知，则用编码参数编码这个GOP；如果没有通知HEVC编码器换参数，编码器用最近的参数编码这个GOP。

为了保证在线编码视频质量并且节省带宽，我们利用深度学习算法，根据视频内容来自适应调节编码参数，为了适应在线编码的实时性，计算复杂度只增加了10～20％左右。使用本发明的方法，视频质量相对以前方案稳定很多，减少了突然花屏、图像块多的现象，并且平均节省码率10％～20％左右，特别是对于综艺台。本发明不仅适用HEVC编码器，还适用H264、MPEG2、AVS、AVS2等视频编码器。另外本发明中应用的SVM，也可用其他深度学习网络来实现，比如CNN等。

作为优选，在步骤(1)中，视频质量级别分为可看、比较好、好三个级别。

作为优选，在步骤(2)中，首先对视频帧做一次1/2下采样，将下采样后图像分成8x8小块，提取每个块的帧内satd值和帧间satd值、mv值，帧内复杂度通过小块的帧内satd值计算得到，帧间复杂度通过帧间satd值、mv值计算得到。

作为优选，在步骤(3)中，当前帧的帧型包括IDR帧型、P帧型、B帧型、参考B帧；一个GOP分析结束后，将每帧的视频特征送给参数获得器，并告诉参数获得器场景切换点情况。

作为优选，在步骤(4)中，参数获得器将这个GOP每帧的视频特征进行整合，根据帧型，计算所有IDR帧各块的帧内satd值总和得到IDR的总特征值T_idr，P帧、B帧以及参考B帧各种帧型按IDR帧方法依次得到的总特征值T_p、T_b、T_refb，再将这四个值送给SVM，SVM支持向量机。

作为优选，在步骤(4)中，离线数据训练好了的model获得方法如下：离线对各种场景用VBR模式以各种码率编码，得到各种帧型的总特征值T_idr、T_p、T_b、T_refb以及VMAF分数，根据VMAF分数、编码参数标注参数索引号，其中T_idr、T_p、T_b、T_refb作为SVM的X、参数索引号作为Y，送给SVM训练得到model。

本发明的有益效果是：保证在线编码视频质量并且节省带宽，根据视频内容来自适应调节编码参数，适应在线编码的实时性，视频质量相对以前方案稳定很多，减少了突然花屏、图像块多的现象，并且平均节省码率10％～20％左右。

附图说明

图1是本发明的结构框架图；

图2是本发明的方法流程图。

具体实施方式

下面结合附图和具体实施方式对本发明做进一步的描述。

如图1所述的实施例中，一种基于深度学习的内容自适应在线视频编码方法，包括分析器、参数获得器和HEVC编码器，其中分析器提取每帧的特征值、决定编码帧型、检测场景切换点；参数获得器将视频流切分成若干个一小段，根据每段的特征选取编码参数；HEVC编码器根据各自的编码参数编码视频流段；如图2所示，具体操作步骤如下：

(1)用户设置视频质量级别、最大码率、GOP大小这些编码参数；视频质量级别分为可看、比较好、好三个级别；

帧内复杂度和帧间复杂度的计算如下：首先对视频帧做一次1/2下采样，将下采样后图像分成8x8小块，提取每个块的帧内satd值(satd的计算说明参考https://baike.baidu.com/item/satd/7986824)和帧间satd值、mv值，帧内复杂度通过小块的帧内satd值计算得到，帧间复杂度通过帧间satd值、mv值计算得到；

当前帧的帧型包括IDR帧型、P帧型、B帧型、参考B帧；一个GOP分析结束后，将每帧的视频特征送给参数获得器，并告诉参数获得器场景切换点情况；

参数获得器将这个GOP每帧的视频特征进行整合，根据帧型，计算所有IDR帧各块的帧内satd值总和得到IDR的总特征值T_idr，P帧、B帧以及参考B帧各种帧型按IDR帧方法依次得到的总特征值T_p、T_b、T_refb，再将这四个值送给SVM，SVM支持向量机；

离线数据训练的model获得如下：离线对各种场景用VBR模式以各种码率编码，得到各种帧型的总特征值T_idr、T_p、T_b、T_refb以及VMAF分数(VMAF分数计算参考https://blog.csdn.net/yue_huang/article/details/79503884)，根据VMAF分数、编码参数标注参数索引号，其中T_idr、T_p、T_b、T_refb作为SVM的X、参数索引号作为Y，送给SVM训练得到model；

(5)将这个编码参数和前一个GOP编码参数比较，如果满足：参数改变比较大并且前一参数编码的帧数大于阈值T，则进入到步骤(6)，如果不满足上述条件，则进入到步骤(7)；其中两个编码参数的参数改变大于30％则认为参数改变比较大，而阈值T是根据实际需求进行适应性的人工设置；

(6)通知HEVC编码器以新的编码参数编码这个GOP；

Claims

1.一种基于深度学习的内容自适应在线视频编码方法，其特征是，包括分析器、参数获得器和HEVC编码器，其中分析器提取每帧的特征值、决定编码帧型、检测场景切换点；参数获得器将视频流切分成若干个一小段，根据每段的特征选取编码参数；HEVC编码器根据各自的编码参数编码视频流段；具体操作步骤如下：

（1）用户设置视频质量级别、最大码率、GOP大小这些编码参数；

（2）分析器计算每帧的视频特征：帧内复杂度和帧间复杂度，分析器根据上一帧、本帧及后面几帧的帧内复杂度、帧间复杂度的关系判断当前是否是场景切换点；

（3）如果是场景切换点，则本帧将作为IDR帧并开始新的一个GOP分析，并进入到步骤（4）；如果不是场景切换点，则决定当前帧的帧型，判断是否是一个新的GOP开始，如果是，则进入到步骤（4），如果不是，则返回到步骤（2）；

（4）参数获得器将这个GOP每帧的视频特征进行整合，计算各种帧型的总特征值，再将总特征值送给SVM，SVM利用离线数据训练好了的model进行分类，得到参数分类索引号，从参数表中得到这个GOP的编码参数，判断这个GOP第一帧是否是场景切换点，如果这个GOP第一帧是场景切换点，则进入到步骤（6）；如果这个GOP第一帧不是场景切换点，则进入到步骤（5）中；

（5）将这个编码参数和前一个GOP编码参数比较，如果满足：参数改变比较大并且前一参数编码的帧数大于阈值T，则进入到步骤（6），如果不满足参数改变比较大并且前一参数编码的帧数大于阈值T，则进入到步骤（7）；

（6）通知HEVC编码器以新的编码参数编码这个GOP；

（7）HEVC编码器得到用新的编码参数通知，则用编码参数编码这个GOP；如果没有通知HEVC编码器换参数，编码器用最近的参数编码这个GOP。

2.根据权利要求1所述的一种基于深度学习的内容自适应在线视频编码方法，其特征是，在步骤（1）中，视频质量级别分为可看、比较好、好三个级别。

3.根据权利要求1所述的一种基于深度学习的内容自适应在线视频编码方法，其特征是，在步骤（2）中，首先对视频帧做一次1/2下采样，将下采样后图像分成8x8小块，提取每个块的帧内satd值和帧间satd值、mv值，帧内复杂度通过小块的帧内satd值计算得到，帧间复杂度通过帧间satd值、mv值计算得到。

4.根据权利要求1所述的一种基于深度学习的内容自适应在线视频编码方法，其特征是，在步骤（3）中，当前帧的帧型包括IDR帧型、P帧型、B帧型、参考B帧；一个GOP分析结束后，将每帧的视频特征送给参数获得器，并告诉参数获得器场景切换点情况。

5.根据权利要求4所述的一种基于深度学习的内容自适应在线视频编码方法，其特征是，在步骤（4）中，参数获得器将这个GOP每帧的视频特征进行整合，根据帧型，计算所有IDR帧各块的帧内satd值总和得到IDR的总特征值T_idr，P帧、B帧以及参考B帧各种帧型按IDR帧方法依次得到的总特征值T_p、T_b、T_refb，再将这四个值送给SVM，SVM支持向量机。

6.根据权利要求5所述的一种基于深度学习的内容自适应在线视频编码方法，其特征是，在步骤（4）中，离线数据训练好了的model获得方法如下：离线对各种场景用VBR模式以各种码率编码，得到各种帧型的总特征值T_idr、T_p、T_b、T_refb以及VMAF分数，根据VMAF分数、编码参数标注参数索引号，其中T_idr、T_p、T_b、T_refb 作为SVM的X、参数索引号作为Y，送给SVM训练得到model。