CN108769736B - 面向显示的视频转码码率决策模型的建立及参数确定方法 - Google Patents

面向显示的视频转码码率决策模型的建立及参数确定方法 Download PDF

Info

Publication number
CN108769736B
CN108769736B CN201810513088.5A CN201810513088A CN108769736B CN 108769736 B CN108769736 B CN 108769736B CN 201810513088 A CN201810513088 A CN 201810513088A CN 108769736 B CN108769736 B CN 108769736B
Authority
CN
China
Prior art keywords
clip
video
display
act
transcoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810513088.5A
Other languages
English (en)
Other versions
CN108769736A (zh
Inventor
孙斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing Rui Jing Mdt Infotech Ltd
Original Assignee
Chongqing Rui Jing Mdt Infotech Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing Rui Jing Mdt Infotech Ltd filed Critical Chongqing Rui Jing Mdt Infotech Ltd
Priority to CN201810513088.5A priority Critical patent/CN108769736B/zh
Publication of CN108769736A publication Critical patent/CN108769736A/zh
Application granted granted Critical
Publication of CN108769736B publication Critical patent/CN108769736B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N17/00Diagnosis, testing or measuring for television systems or their details
    • H04N17/004Diagnosis, testing or measuring for television systems or their details for digital television systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8456Structuring of content, e.g. decomposing content into time segments by decomposing the content in the time domain, e.g. in time segments

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明提供一种面向显示的视频转码码率决策模型的建立方法,包括方法包括以下步骤:步骤S1.计算视频的空间复杂度;步骤S2.计算视频的时域复杂度;步骤S3.提取显示器的描述特征以得到人眼在显示器高度方向的角频率,所述描述特征主要包括观测距离、显示器高度和显示器在高度方向上的像素数;步骤S4.在小波域对图像的质量进行评价,得到视频降质;步骤S5.以视频的空间复杂度、视频的时域复杂度、显示器的描述特征以及视频降质作为输入,以目标码率或量化阶作为输出,利用支持向量机进行训练,得到码率控制决策模型。本发明考虑了显示设备性能差异对视觉的影响,转码过程中尽可能的降低转码后视频信息中的视觉冗余,提高了转码器的转码效率。

Description

面向显示的视频转码码率决策模型的建立及参数确定方法
技术领域
本发明涉及一种视频的转码方法,特别涉及一种面向显示的视频转码码率决策模型的建立及参数确定方法。
背景技术
近年来,通信技术和多媒体技术长足发展使得移动设备端的多媒体应用越来越普及。用户对图像分辨率的要求越来越高,传输高分辨率的视频信号需要更高的带宽。虽然当前大部分无线通信已由最初的2G网络转换到4G网络,相较于视频传输而言4G带宽在传输高清、超高清视频时仍显得力不从心,所以需要通过转码降低视频传输所需码率。在过去的20年中,相关科研人员对转码技术进行了大量研究,实现了对视频码率转换、视频编码格式转换、视频空域/时域分辨率转换等功能。这些技术在一定程度上解决了视频传输中可能遇到的带宽不足的问题。
与固定显示设备不同,移动设备的显示屏尺寸和分辨率常存在较大差异。即使是相同分辨率的视频影像在不同属性的显示器上所呈现视频的主观质量也不尽相同。结合人的视觉特点,在小物理尺寸屏幕上显示高分辨率视频时,用户可以容忍较大的压缩失真而不显著的影响视频质量,所以在信道带宽限制以外考虑显示设备的属性可以进一步降低视频转码的码率,降低对信道带宽的要求。
传统的码率变换转码通过改变量化阶或者重量化来降低视频码率,其中部分转码方案引入图像质量变换构建约束函数优化转码性能。这些方法都基于视频信号本身,而未考虑视频显示终端性能差异对人视觉的影响,所以其控制策略存在冗余,未能充分做到率失真优化。
发明内容
鉴于以上所述现有技术的缺点,本发明的目的在于提供面向显示的视频转码码率决策模型的建立及参数确定方法,该方法通过调整视频编码的控制参数实现对视频码率的变化,最终降低视频传输对带宽要求。
为实现上述目的及其他相关目的,本发明提供一种面向显示的视频转码码率决策模型的建立方法,包括方法包括以下步骤:
步骤S1.计算视频的空间复杂度;
步骤S2.计算视频的时域复杂度;
步骤S3.提取显示器的描述特征以得到人眼在显示器高度方向的角频率fm(o),所述描述特征主要包括观测距离d、显示器高度h和显示器在高度方向上的像素数l;
步骤S4.在小波域对图像的质量进行评价,得到视频降质;
步骤S5.以视频的空间复杂度、视频的时域复杂度、显示器的描述特征以及视频降质作为输入,以量化阶作为输出,利用支持向量机进行训练,得到码率控制决策模型。
优选地,所述计算视频的空间复杂度,具体包括下子步骤:
步骤S11.对码流Clipi进行解码,产生图像序列Clipi(j),i为码流的数量,j为解码后图像帧编号;
步骤S12.对图像序列Clipi(j)做二维傅里叶变换并作移相操作,得到图像序列Clipi(j)的幅度谱信号A(Clipi(j));
步骤S13.将所述幅度谱信号A(Clipi(j))在频域与高斯高通滤波器相点积分离出图像帧的高频分量H_pass(Clipi(j)),其中u,v分别为水平、垂直方向的频率分量索引,D和D0为控制参数用于调整高斯滤波器的形状;
图像帧的空间复杂度high_pass(Clipi(j))=||A(Clipi(j))(u,v).*H(u,v)||2,其中||||2为L2范数算子;
视频的空间复杂度为所述视频中所有图像帧的空间复杂度的平均数,即act_spatial(Clipi)=mean(high_pass(Clipi(j))),j∈[1,N],N为解码总帧数,mean为均值运算符。
优选地,在所述步骤S2中,利用视频的平均码率表征视频的时域复杂度,即act_temporal(Clipi)=bitrate(Clipi),bitrate(Clipi)为视频的平均码率。
优选地,在所述步骤S3中,所述的人眼在显示器高度方向的角频率fm(o)具体为:fm(o)=(π*d*l)/(180*h*2*2o),其中,o是小波域子带分解时的子带索引。
优选地,所述在小波域对图像的质量进行评价得到视频降质具体为:
步骤S41.对图像序列Clipi(j)作小波变换;
步骤S42.分别计算图像序列Clipi(j)和tran(Clipi(k))(j)与自然图像的先验知识之间的互信息I(Clipi(j)(o,a))和I(tran(Clipi(k))(j)(o,a));
其中,tran(Clipi(k))(j)表示量化阶+k后进行转码产生的输出码流,B为在子带(o,a)中块的个数,go,a为对转码过程中引入的乘性误差的描述,So,a,b为一个随机数,Cu为协方差,为人的视觉模型参数,用于描述视觉噪声的方差,I为视觉接受场函数的空间索引的标识集;
步骤S43.计算量化阶增加k时转码tran(Clipi(k))的降质程度,该降质程度等于视频内所有图像帧降质的平均值,图像帧降质
优选地,根据量化阶,所述码流Clipi包括浅压缩码流ClipL-i、中度压缩码流ClipM-i和重度压缩码流ClipH-i,将视频的空间复杂度act_spatial(ClipL-i)、act_spatial(ClipM-i)、act_spatial(ClipH-i),视频的时域复杂度act_temporal(ClipL-i)、act_temporal(ClipM-i)、act_temporal(ClipH-i),显示器的描述特征fm(o)以及视频降质ΔDL-i(k)(j)、ΔDM-i(k)(j)、ΔDH-i(k)(j)作为输入,以量化阶k作为输出,利用支持向量机进行训练,得到码率控制决策模型。
为实现上述目的及其他相关目的,本发明还提供一种面向显示的视频转码参数确定方法,该方法包括以下步骤:
步骤一、获取显示器种类及型号,解析出当前应用下的人眼在显示器高度方向的角频率fm(o);
步骤二、获取待转码视频的空间复杂度act_spatial(Clip)和视频的时域复杂度act_temporal(Clip);
步骤三、将(act_spatial(Clip),act_temporal(Clip),ΔD,fm(o))馈入权利要求1~5任意一项所述的转码码率决策模型,获得转码量化阶增量k或者转码的目标码率增量。
优选地,该方法还包括步骤四、提取原量化阶QP,用QP+k作为新的量化阶或基于模型产生的码率增量获得新的码率增量进行转码。
由于采用了以上技术方案,本发明具有以下有益效果:
本发明方法以质量为考量,能够更好地保证视频接收端用户的视觉感受。由于考虑了显示设备性能差异对视觉的影响,转码过程中尽可能的降低转码后视频信息中的视觉冗余,进一步降低了转码目标视频的码率,提高了转码器的转码效率。
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
计算机硬件环境为CPU i5处理器,内存为8GB;软件部分的操作系统为Win10,应用程序的编译环境为visual studio 2010。所使用的视频编码及转码程序是由HM16.0参考模型改编而成,机器学习部分采用opencv3.0中ml模块下的CvSVM类实现。
本发明分为转码码率决策模型的建立与应用该模型决定视频码率两个部分。
建立转码码率决策模型包括以下步骤:
产生转码码率分配模型时需要准备以下素材:本案例实施时基于350个视频片段Clipi,i∈[1,350],视频素材包括体育类节目、新闻类节目及一般电视剧类节目,每个片段长度约5分钟。每个视频具有480p,720p,1080p,1440p等4种分辨率。上述视频用H.265的压缩,基准码率分别由QP=22,25,28压缩产生,GOP结构为8帧。QP=22时,生成浅压缩码流;QP=25时,生成中度压缩码流;QP=28压缩时,生成重度压缩码流。这三类基准码流分别定义为ClipL-i,ClipM-i,ClipH-i
ClipL-i,ClipM-i,ClipH-i解码后,产生不同码率下的源图像,即待转码的图像。通过小幅度增加QP值k,如QP+k,后再转码,产生略有降质的转码输出码流tran(ClipL-i(k)),tran(ClipM-i(k)),tran(ClipH-i(k))。在转码过程中,尽可能的重用原始码流中的块的编码树信息,即CTU(coding tree unit)信息。鉴于更深度的压缩可能对编码单元CU(CodingUnit)的大小产生的影响,在转码过程中尝试保持CU描述或退化至上一层的CU单元,并将TU(Transform Unit)与PU(Prediction Unit)做相应的修改。
训练转码码率决策模型需要提取浅压缩码流ClipL-i,中度压缩码流ClipM-i,重度压缩码流ClipH-i的特征,L-i代表浅压缩,M-i代表中度压缩,H-i代表重度压缩。下面以浅压缩为例进行说明,具体步骤包括:
1、计算视频的空间复杂度。空间复杂度由图像帧的纹理信息的多少表述。本实施例将ClipL-i、ClipM-i、ClipH-i解码,产生图像序列ClipL-i(j)、ClipM-i(j)、ClipH-i(j),j为解码后图像帧编号。对图像序列ClipL-i(j)、ClipM-i(j)、ClipH-i(j)分别做二维傅里叶变换并作移相操作,产生图像序列ClipL-i(j)、ClipM-i(j)、ClipH-i(j)的幅度谱信号A(ClipL-i(j))、A(ClipM-i(j))、A(ClipH-i(j))。将这些幅度谱信号A(ClipL-i(j))、A(ClipM-i(j))、A(ClipH-i(j))在频域与高斯高通滤波器相点积A(Clipi(j))(u,v).*H(u,v)分离出图像帧的高频分量H_pass(ClipL-i(j))、H_pass(ClipM-i(j))、H_pass(ClipH-i(j)),其中,u,v分别为水平、垂直方向的频率分量索引,D和D0分别为水平、垂直方向的频率分量索引为控制参数用于调整高斯滤波器的形状。
图像帧的空间复杂度由图像高频能量标识,即
high_pass(ClipL-i(j))=||A(ClipL-i(j))(u,v).*H(u,v)||2
high_pass(ClipM-i(j))=||A(ClipM-i(j))(u,v).*H(u,v)||2
high_pass(ClipH-i(j))=||A(ClipH-i(j))(u,v).*H(u,v)||2
其中,||||2为L2范数算子。视频的空间复杂度为该视频中所有图像帧复杂度的平均数,即
act_spatial(ClipL-i)=mean(high_pass(ClipL-i(j)))
act_spatial(ClipM-i)=mean(high_pass(ClipM-i(j)))
act_spatial(ClipH-i)=mean(high_pass(ClipH-i(j)))
j∈[1,N],N为解码总帧数,mean为均值运算符。
2、计算视频的时域复杂度
视频的时域复杂度用视频的平均码率表征,即
act_temporal(ClipL-i)=bitrate(ClipL-i)
act_temporal(ClipM-i)=bitrate(ClipM-i)
act_temporal(ClipH-i)=bitrate(ClipH-i)
3、训练转码码率决策模型需要提取描述显示器的特征。
本实施例中,与显示器的特征主要包括观测距离d,显示器高度h和显示器在高度方向上的像素数l。实际使用中,用户与移动终端显示器之间的距离通常为30-40cm,所以在本实施例中d=40cm。本发明实施时,广泛收集当前市场中主流移动终端显示器的显示器高度h和显示器在高度方向上的像素数l,分别表示为h(m)和l(m),其中,m为不同性质类别显示器的种类索引。
第m类显示器对视觉的影响以人眼在显示器高度方向的角频率fm(o)形式描述,其换算公式如下:fm(o)=(π*d*l)/(180*h*2*2o)。
其中,o是小波域子带分解时的子带索引,f(o)将与图像帧信号的小波变换相互作用。在做图像质量评价时,如果图像信号不做子带分解时,o=1;仅做一次分解时,o=2,以此类推。
训练转码控制参数模型时需要视频质量退化特征的描述。视频质量退化量为视频中所包含图像帧质量退化量的均值。以第j个图像帧的质量退化计算为例。
4、在小波域对图像的质量进行评价。
本实施方式的图像质量评价在小波域进行,所以首先要对图像作小波变换。自然图像在小波域的某个子带中得块可以描述成为一系列高斯分布的和Ro,a,b=So,a,b·Uo,a,b
高斯核函数
上式中,o为子带索引,a为子带方向,b为在(o,a)子带中块的索引,Uo,a,b为均值为0协方差为Cu高斯基函数,So,a,b为一个随机数,其数值为图像在基Uo,a,b上的投影,z为权重系数,Λ为高斯核方差。
计算图像Clipi(j)和tran(Clipi(k))(j)各自的视觉响应,即分别求取ClipL-i(j)与自然图像先验知识之间的互信息、ClipM-i(j)与自然图像先验知识之间的互信息、ClipH-i(j)与自然图像先验知识之间的互信息以及tran(ClipL-i(k))(j)与自然图像先验知识之间的互信息、tran(ClipM-i(k))(j)与自然图像先验知识之间的互信息、tran(ClipH-i(k))(j)与自然图像先验知识之间的互信息。
实施时以子带为单位计算上述互信息
上式中,B为在子带(o,a)中块的个数,go,a为对转码过程中引入的乘性误差的描述。
转码过程引入的图像降质可由下式计算
基于ΔDi(k)(j)(包括ΔDL-i(k)(j)、ΔDM-i(k)(j)、ΔDH-i(k)(j)),可以测算出量化阶增加k时转码tranClipi(k)的降质程度。该降质程度等于该视频内所有图像帧降质的均值。
本实施过程中,通过机器学习的方法分析量化阶的增量与显示端图像质量变化之间的关系,即在码流时/空域复杂度约束下,k与ΔDi(k)之间的关系。
上述步骤仅以浅压缩视频描述为例,而本发明还应包括有对中度压缩视频、重度压缩视频的相关内容。于本实施中,中度压缩视频,重度压缩视频的相关参数计算方式与浅压缩视频的相关参数计算方式相同,此处不再作赘述。
基于350个视频产生1050个基准视频。实施时k的取值范围为1-3,1050个样本产生3150个降质样本。由这些样本,可以得到3150个(k,ΔD(k))对。
采用支持向量机作为学习工具,SVM输入端为视频的空间复杂度act_spatial(Clipi)(包括act_spatial(ClipL-i)、act_spatial(ClipM-i)、act_spatial(ClipH-i)),视频的时域复杂度act_temporal(Clipi)(包括act_temporal(ClipL-i)、act_temporal(ClipM-i)、act_temporal(ClipL-i)),显示器的描述特征fm(o)以及视频降质ΔDi(k)(j)(包括ΔDL-i(k)(j)、ΔDM-i(k)(j)、ΔDH-i(k)(j))作为输入,SVM的输出为k。通过对3150个样本的学习,产生k的生成模型。
本实施案例生成的是基于量化阶调整的转码策略,其模型生成方法同样适用于基于码率增量的学习模型。在获取码率与视频质量之间的关系时,将k值替换成转码的目标码率。
应用该模型决定视频码率包括以下步骤:
1、首先,通过反馈信道读取显示器种类及型号,通过比对监视器种类及型号,解析出当前应用下的fm(o)。
转码过程一定会引入转码误差,本专利的核心思想是根据该误差的可视性程度控制转码过程,即根据用户所需的视频质量控制转码参数。用2种方式控制转码参数:1)以ΔD=10%作为默认的允许的视频质量降质;2)通过交互式界面,由用户输入允许的视频降质ΔD。
2、统计待转码视频的特征信息,获取其视频的空间复杂度act_spatial(Clip)和视频的时域复杂度act_temporal(Clip)。
3、将(act_spatial(Clip),act_temporal(Clip),ΔD,fm(o))馈入转码码率决策模型,获得转码量化阶增量k或者转码的目标码率增量。
4、提取原量化阶QP,用QP+k作为新的量化阶或基于模型产生的码率增量获得新的码率增量进行转码。与训练过程中的转码控制机制相似,在尽可能的重用CTU信息的基础上,实现转码。
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。

Claims (8)

1.一种面向显示的视频转码码率决策模型的建立方法,其特征在于,包括方法包括以下步骤:
步骤S1.计算视频的空间复杂度;
步骤S2.计算视频的时域复杂度;
步骤S3.提取显示器的描述特征以得到人眼在显示器高度方向的角频率fm(o),所述描述特征包括观测距离d、显示器高度h和显示器在高度方向上的像素数l;
步骤S4.在小波域对图像的质量进行评价,得到视频降质;
步骤S5.以视频的空间复杂度、视频的时域复杂度、显示器的描述特征以及视频降质作为输入,以量化阶作为输出,利用支持向量机进行训练,得到码率控制决策模型。
2.根据权利要求1所述的一种面向显示的视频转码码率决策模型的建立方法,其特征在于,所述计算视频的空间复杂度,具体包括下子步骤:
步骤S11.对压缩码流Clipi进行解码,产生图像序列Clipi(j),i为码流的数量,j为解码后图像帧编号;
步骤S12.对图像序列Clipi(j)做二维傅里叶变换并作移相操作,得到图像序列Clipi(j)的幅度谱信号A(Clipi(j));
步骤S13.将所述幅度谱信号A(Clipi(j))在频域与高斯高通滤波器相点积分离出图像帧的高频分量H_pass(Clipi(j)),其中u,v分别为水平、垂直方向的频率分量索引,D和D0为控制参数用于调整高斯滤波器的形状;
图像帧的空间复杂度high_pass(Clipi(j))=||A(Clipi(j))(u,v).*H(u,v)||2,其中|| ||2为L2范数算子;视频的空间复杂度为所述视频中所有图像帧的空间复杂度的平均数,即act_spatial(Clipi)=mean(high_pass(Clipi(j))),j∈[1,N],N为解码总帧数,mean为均值运算符。
3.根据权利要求2所述的一种面向显示的视频转码码率决策模型的建立方法,其特征在于,在所述步骤S2中,利用视频的平均码率表征视频的时域复杂度,即act_temporal(Clipi)=bitrate(Clipi),bitrate(Clipi)为视频的平均码率。
4.根据权利要求3所述的一种面向显示的视频转码码率决策模型的建立方法,其特征在于,在所述步骤S3中,所述的人眼在显示器高度方向的角频率fm(o)具体为:fm(o)=(π*d*l)/(180*h*2*2o),其中,o是小波域子带分解时的子带索引。
5.根据权利要求4所述的一种面向显示的视频转码码率决策模型的建立方法,其特征在于,所述在小波域对图像的质量进行评价得到视频降质具体为:
步骤S41.对图像序列Clipi(j)作小波变换;
步骤S42.分别计算图像序列Clipi(j)和tran(Clipi(k))(j)与自然图像的先验知识之间的互信息I(Clipi(j)(o,a))和I(tran(Clipi(k))(j)(o,a));
其中,tran(Clipi(k))(j)表示量化阶+k后进行转码产生的输出码流,B为在子带(o,a)中块的个数,go,a为对转码过程中引入的乘性误差的描述,So,a,b为一个随机数,Cu为协方差,为人的视觉模型参数,用于描述视觉噪声的方差,I为视觉接受场函数的空间索引的标识集;
步骤S43.计算量化阶增加k时转码tran(Clipi(k))的降质程度,该降质程度等于视频内所有图像帧降质的平均值,图像帧降质
6.根据权利要求5所述的一种面向显示的视频转码码率决策模型的建立方法,其特征在于,根据量化阶,所述码流Clipi包括浅压缩码流ClipL-i、中度压缩码流ClipM-i和重度压缩码流ClipH-i,将视频的空间复杂度act_spatial(ClipL-i)、act_spatial(ClipM-i)、act_spatial(ClipH-i),视频的时域复杂度act_temporal(ClipL-i)、act_temporal(ClipM-i)、act_temporal(ClipH-i),显示器的描述特征fm(o)以及视频降质ΔDL-i(k)(j)、ΔDM-i(k)(j)、ΔDH-i(k)(j)作为输入,以量化阶k作为输出,利用支持向量机进行训练,得到码率控制决策模型。
7.一种面向显示的视频转码参数确定方法,其特征在于,该方法包括以下步骤:
步骤一、获取显示器种类及型号,解析出当前应用下的人眼在显示器高度方向的角频率fm(o);
步骤二、获取待转码视频的空间复杂度act_spatial(Clip)和视频的时域复杂度act_temporal(Clip);
步骤三、将(act_spatial(Clip),act_temporal(Clip),ΔD,fm(o))馈入权利要求1~5任意一项所述的转码码率决策模型,获得转码量化阶增量k或者转码的目标码率增量。
8.根据权利要求7所述的一种面向显示的视频转码参数确定方法,其特征在于,该方法还包括步骤四、提取原量化阶QP,用QP+k作为新的量化阶或基于模型产生的码率增量获得新的码率增量进行转码。
CN201810513088.5A 2018-05-24 2018-05-24 面向显示的视频转码码率决策模型的建立及参数确定方法 Active CN108769736B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810513088.5A CN108769736B (zh) 2018-05-24 2018-05-24 面向显示的视频转码码率决策模型的建立及参数确定方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810513088.5A CN108769736B (zh) 2018-05-24 2018-05-24 面向显示的视频转码码率决策模型的建立及参数确定方法

Publications (2)

Publication Number Publication Date
CN108769736A CN108769736A (zh) 2018-11-06
CN108769736B true CN108769736B (zh) 2019-09-17

Family

ID=64005621

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810513088.5A Active CN108769736B (zh) 2018-05-24 2018-05-24 面向显示的视频转码码率决策模型的建立及参数确定方法

Country Status (1)

Country Link
CN (1) CN108769736B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111988630A (zh) * 2020-09-11 2020-11-24 北京锐马视讯科技有限公司 视频传输方法和装置、设备及存储介质
CN112672157B (zh) * 2020-12-22 2022-08-05 广州博冠信息科技有限公司 视频编码方法、装置、设备及存储介质
CN113949872A (zh) * 2021-11-09 2022-01-18 华侨大学 一种基于3D-Gradient引导的屏幕内容视频编码码率控制方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101021857A (zh) * 2006-10-20 2007-08-22 鲍东山 基于内容分析的视频搜索系统
CN102025999A (zh) * 2010-12-31 2011-04-20 北京工业大学 基于支持向量机的视频转码快速帧内预测方法
CN104363463A (zh) * 2014-11-10 2015-02-18 能力天空科技(北京)有限公司 一种视频处理方法、装置及系统
CN104837019A (zh) * 2015-04-30 2015-08-12 上海交通大学 基于支持向量机的avs到hevc优化视频转码方法
CN105933727A (zh) * 2016-05-20 2016-09-07 中山大学 一种应用于游戏直播平台的视频流转码和分发方法
CN107211145A (zh) * 2015-02-09 2017-09-26 高通股份有限公司 几乎视觉无损的视频再压缩

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100553335C (zh) * 2007-07-23 2009-10-21 武汉大学 一种视频转码中宏块级码率控制方法
JP2009182889A (ja) * 2008-01-31 2009-08-13 Toshiba Corp 再符号化装置および再符号化方法
CN107018412B (zh) * 2017-04-20 2019-09-10 四川大学 一种基于关键帧编码单元划分模式的dvc-hevc视频转码方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101021857A (zh) * 2006-10-20 2007-08-22 鲍东山 基于内容分析的视频搜索系统
CN102025999A (zh) * 2010-12-31 2011-04-20 北京工业大学 基于支持向量机的视频转码快速帧内预测方法
CN104363463A (zh) * 2014-11-10 2015-02-18 能力天空科技(北京)有限公司 一种视频处理方法、装置及系统
CN107211145A (zh) * 2015-02-09 2017-09-26 高通股份有限公司 几乎视觉无损的视频再压缩
CN104837019A (zh) * 2015-04-30 2015-08-12 上海交通大学 基于支持向量机的avs到hevc优化视频转码方法
CN105933727A (zh) * 2016-05-20 2016-09-07 中山大学 一种应用于游戏直播平台的视频流转码和分发方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
低复杂度的快速降尺寸视频转码算法;吕卓逸;《通信学报》;20120131;第33卷(第1期);第160-166页

Also Published As

Publication number Publication date
CN108769736A (zh) 2018-11-06

Similar Documents

Publication Publication Date Title
CN108769736B (zh) 面向显示的视频转码码率决策模型的建立及参数确定方法
EP3278559B1 (en) Training end-to-end video processes
CN104096362B (zh) 基于游戏者关注区域改进视频流的码率控制比特分配
CN101534436B (zh) 一种视频图像宏块级自适应码率分配方法
US8363953B2 (en) Image processing apparatus, image processing method and computer readable medium
CN113994691A (zh) 用于对图像执行人工智能编码和人工智能解码的设备和方法
CN106534862B (zh) 一种视频编码方法
US20110299604A1 (en) Method and apparatus for adaptive video sharpening
JPH07203435A (ja) 歪んだ図形情報の強調方法及び装置
CN107241607B (zh) 一种基于多域jnd模型的视觉感知编码方法
CN104378636B (zh) 一种视频图像编码方法及装置
US11200639B1 (en) Apparatus and method for performing artificial intelligence encoding and decoding on image by using low-complexity neural network
Amirpour et al. PSTR: Per-Title Encoding Using Spatio-Temporal Resolutions
JP2013258685A (ja) 画像処理装置、動画像処理装置、映像処理装置、画像処理方法、映像処理方法、テレビジョン受像機、プログラム、及び記録媒体
US20130156113A1 (en) Video signal processing
CN112887739A (zh) 电子设备、系统及其控制方法
US20170230546A1 (en) Method and apparatus for locally sharpening a video image using a spatial indication of blurring
JP2005039837A (ja) 映像雑音除去方法及び装置
CN104320671A (zh) 一种基于h.264标准的在线视频转码方法
CN100442848C (zh) 一种h263编码中码率的控制方法
US20230276070A1 (en) Artificial intelligence (ai) encoding apparatus and method and ai decoding apparatus and method for region of object of interest in image
EP2429192A1 (en) Video signal processing
US20190007685A1 (en) Devices and method for video encoding and reconstruction
CN104135662B (zh) 用于在有限带宽和发射速率条件下对视频文件的改进型h.264压缩编码方法
CN102427529B (zh) 视频编码压缩方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant