CN111327946A - 视频质量评价和特征字典的训练方法、装置和介质 - Google Patents

视频质量评价和特征字典的训练方法、装置和介质 Download PDF

Info

Publication number
CN111327946A
CN111327946A CN201811541314.7A CN201811541314A CN111327946A CN 111327946 A CN111327946 A CN 111327946A CN 201811541314 A CN201811541314 A CN 201811541314A CN 111327946 A CN111327946 A CN 111327946A
Authority
CN
China
Prior art keywords
training
video
evaluated
vector
feature dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811541314.7A
Other languages
English (en)
Inventor
袁其政
方华
周骏华
宋钦梅
郭明松
李金龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Hangzhou Information Technology Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Hangzhou Information Technology Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN201811541314.7A priority Critical patent/CN111327946A/zh
Publication of CN111327946A publication Critical patent/CN111327946A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N17/00Diagnosis, testing or measuring for television systems or their details

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Image Analysis (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)

Abstract

本申请实施例提供了一种视频质量评价和特征字典的训练方法、装置和介质,涉及视频信号处理和多媒体通信领域,用以在无原始视频的条件下,对视频质量进行预测。该方法中,获取待评价视频的特征信息;根据预先存储的特征字典,对所述待评价视频的特征信息进行稀疏表示,得到稀疏系数;获取所述特征字典中表示评价值的向量,与所述稀疏系数构成的向量进行相乘,得到所述待评价视频的评价值。这样,可以在没有待评价视频的原始视频的条件下准确的对待评价视频进行预测,提高视频评价的效率,节省人力。

Description

视频质量评价和特征字典的训练方法、装置和介质
技术领域
本申请涉及视频信号处理和多媒体通信领域,尤其涉及一种视频质量评价和特征字典的训练方法、装置和介质。
背景技术
在视频通信、多媒体通信领域中,高清分辨率视频越来越普遍,高清视频的质量问题受到关注。由于高清视频在采集、编码压缩、传输和解码显示的过程中会不可避免的产生噪声,会导致高清视频质量下降,严重影响高清视频的视觉主观感知。所以,需要提高高清视频质量来提高高清视频的视觉感知。
在提高高清视频的感知质量时首先要了解现有视频的质量好坏程度,有效的视频质量评价方法能够准确的评价高清视频质量,从而促进高清视频系统的发展和编码压缩效率的提高。
发明内容
本申请实施例中提供一种视频质量评价和特征字典的训练方法、装置和介质,解决现有技术中预测视频质量效率低、浪费人力的问题。
第一方面,本申请实施例提供一种视频评价方法,该方法包括:
获取待评价视频的特征信息;
根据预先存储的特征字典,对所述待评价视频的特征信息进行稀疏表示,得到稀疏系数;
获取所述特征字典中表示评价值的向量,与所述稀疏系数构成的向量进行相乘,得到所述待评价视频的评价值;
其中,所述特征字典通过以下方法训练得到:
获取N个不同失真程度的视频作为N个训练样本;其中,N为正整数;
获取各训练样本的特征信息;
针对每个训练样本,将该训练样本的特征信息与评价值对应组合,得到列向量;由N个训练样本的列向量构成训练矩阵;
根据所述训练矩阵,训练得到特征字典。
另一方面,本申请实施例中还提供一种特征字典的训练方法,该方法包括:获取N个不同失真程度的视频作为N个训练样本;其中,N为正整数;
提取各训练样本的特征信息;
针对每个训练样本,将该训练样本的特征信息与评价值对应组合,得到列向量;由N个训练样本的列向量构成训练矩阵;
根据所述训练矩阵,训练得到特征字典。
基于相同的发明构思,本申请实施例中提供一种视频质量评价装置,该装置包括:
获取模块,用于获取待评价视频的特征信息;
处理模块,用于根据预先存储的特征字典,对所述待评价视频的特征信息进行稀疏表示,得到稀疏系数;
计算模块,用于获取所述特征字典中表示评价值的向量,与所述稀疏系数构成的向量进行相乘,得到所述待评价视频的评价值;
其中,所述特征字典通过下方法训练得到:获取N个不同失真程度的视频作为N个训练样本;其中,N为正整数;
获取各训练样本的特征信息;
针对每个训练样本,将该训练样本的特征信息与评价值对应组合,得到列向量;由N个训练样本的列向量构成训练矩阵;
根据所述训练矩阵,训练得到特征字典。
另一方面,本申请实施例提供一种特征字典的训练装置,该装置包括:
第二获取模块,用于获取N个不同失真程度的视频作为N个训练样本;其中,N为正整数;
提取模块,用于提取各训练样本的特征信息;
组合模块,用于针对每个训练样本,将该训练样本的特征信息与评价值对应组合,得到列向量;由N个训练样本的列向量构成训练矩阵;
训练模块,用于根据所述训练矩阵,训练得到特征字典。
本申请另一实施例还提供了一种计算装置,包括至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本申请实施例提供的任一视频质量评价和特征字典的训练方法。
本申请另一实施例还提供了一种计算机存储介质,其中,所述计算机存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行本申请实施例中的任一视频质量评价和特征字典的训练方法。
本申请实施例提供的视频质量评价和特征字典的训练方法、装置和介质,由于通过特征字典对待评价视频的特征信息进行稀疏表示,得到稀疏系数,进而通过计算得到评价值,可以在没有原始视频信息的条件下,对视频的质量进行准确的预测,提高了视频质量评价的效率,节省了人力。
本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单地介绍,显而易见地,下面所介绍的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例中一种视频质量评价方法的流程图;
图2为本申请实施例中特征字典对特征信息进行稀疏表示前后的示意图;
图3为本申请实施例中特征字典的训练方法流程图;
图4为本申请实施例中利用特征字典预测待评价视频质量的流程示意图;
图5为本申请实施例中视频质量评价装置示意图;
图6为本申请实施例中特征字典的训练装置示意图;
图7为根据本申请实施方式的计算装置的结构示意图。
具体实施方式
为了在无原始参考视频信息的条件下准确预测视屏质量,本申请实施例中提供了一种视频质量评价方法和特征字典训练方法、装置和介质。为了更好的了解本申请实施例提供的方案,这里对该方案的基本原理做一下说明:
高清视频在采集和传输的过程中会不可避免的产生噪声,势必造成高清视频的质量下降。为了提高高清视频的质量,首先需要了解视频质量的好坏程度。有鉴于此,本申请实施例提供了一种视频质量评价方法,该方法包括:获取待评价视频的特征信息;根据预先存储的特征字典,对所述待评价视频的特征信息进行稀疏表示,得到稀疏系数;获取所述特征字典中表示评价值的向量,与所述稀疏系数构成的向量进行相乘,得到所述待评价视频的评价值;其中,所述特征字典通过以下方法训练得到:获取N个不同失真程度的视频作为N个训练样本;其中,N为正整数;获取各训练样本的特征信息;针对每个训练样本,将该训练样本的特征信息与评价值对应组合,得到列向量;由N个训练样本的列向量构成训练矩阵;根据所述训练矩阵,训练得到特征字典。
本申请实施例提供的方法中,利用特征字典对特征信息进行稀疏表示,在没有原始视频情况下,对视频进行有效的质量评价。这样,节省人力,减少评价视频质量时的处理资源,提高视频质量评价的效率。
如图1所示,其为本申请实施例中一种视频质量评价方法的流程图。该方法包括以下步骤:
步骤101:获取待评价视频的特征信息。
步骤102:根据预先存储的特征字典,对所述待评价视频的特征信息进行稀疏表示,得到稀疏系数。
步骤103:获取所述特征字典中表示评价值的向量,与所述稀疏系数构成的向量进行相乘,得到所述待评价视频的评价值。
其中,所述特征字典通过以下方法训练得到:获取N个不同失真程度的视频作为N个训练样本;其中,N为正整数;获取各训练样本的特征信息;针对每个训练样本,将该训练样本的特征信息与评价值对应组合,得到列向量;由N个训练样本的列向量构成训练矩阵;根据所述训练矩阵,训练得到特征字典。
具体实施时,可以利用KSVD训练方法中基于稀疏度控制时,训练得到特征字典。所述特征字典的最后一行的行向量为表示评价值的向量。通过特征字典对获取的特征信息进行稀疏表示,得到的稀疏系数为列向量。将列向量稀疏系与特征字典中表示评价值的行向量相乘,则可以得到待评价视频的评价值。
如图2所示,其为特征字典对特征信息进行稀疏表示前后的示意图。x表示特征信息,D表示特征字典,α为得到的稀疏系数。
这样,通过上述方法可以在没有待评价视频的原始视频的情况下,对待评价视频的质量进行评价,减少人力和处理资源的浪费,提高质量评价的效率。
为了使特征信息更贴近待评价视频,本申请实施例中获取待评价视频的特征信息,具体包括:提取所述待评价视频的空间域和时间域的纹理特征,并提取所述待评价视频的颜色特征,得到所述待评价视频的特征信息。
通过上述方法,特征信息中包含纹理特征和颜色特征,则能更好的代表待评价视频,使得到的评价值更贴近待评价视频,得到正确的评价值。
一种可能的实施方式中,为了减少处理的信息,得到所述待评价视频的特征信息之后,还包括:对所述特征信息采用主成分分析方法进行降维。利用主成分分析方法降维的目的是希望用较少的信息去解释原特征信息中的内容,将特征信息中相关性很高的信息转化成彼此相互独立或不相关信息。
这样,降维后的特征信息中内容少却可以更好的表征待评价视频的特征,减少处理资源的浪费,可以提高质量评价的效率。
本申请实施例中需要提取待评价视频的空间域和时间域的纹理特征,提取所述待评价视频的空间域的纹理特征,具体包括:随机选取待评价视频中的连续几帧图像;获取所述连续几帧图像中每帧图像的所有像素点的像素值;根据所述像素值,计算每帧图像的梯度向量;根据所述梯度向量,得到每帧图像的第一梯度幅值图;针对每个第一梯度幅值图、计算J个非对称广义高斯分布参数;其中,J为正整数;针对每帧图像,根据所述非对称广义高斯分布参数,计算J维的局部二值模式特征,得到该帧图像的空间域纹理特征;将所述连续几帧图像的空间域纹理特征的集合作为所述待评价视频的空间域纹理特征。
具体实施时,可以随机选取待评价视频的连续几帧的图像,例如前几帧、最后几帧或者中间连续几帧的图像。获取图像中像素点的像素值,计算每帧图像的梯度向量。
图像是一个二维离散函数f(x,y),图像的梯度向量就是这个二维离散函数的导数:
梯度向量G(x,y)=dx(i,j)+dy(i,j); (1)
dx(i,j)=I(i+1,j)-I(i,j); (2)
dy(i,y)=I(i,j+1)-I(i,j); (3)
其中,I是图像中某一像素点的像素值,(i,j)为该像素点的坐标。
从上面的表达式可以看出,图像的梯度向量是相邻像素之间的差值。所以,在计算梯度向量时,可在图像中随机选取一个像素点,计算该图像的梯度向量。现有技术中,计算图像的梯度向量的方法还有很多,不再赘述。需要说明的是,计算的局部二值模式特征越多越好,在此不限制其具体数量。较佳的,可以计算16维的局部二值模式特征。
通过上述方法,可以得到待评价视频的空间域纹理特征,该空间域纹理特征可以准确的表征待评价视频的空间域纹理特征。
本申请实施例中还需要获取时间域纹理特征。一种可能的实施方式中,随机选取待评价视频中的连续几帧图像。具体的,获取的连续几帧图像可以与提取空间域纹理图像时的几帧图像不同。获取该连续几帧图像中每帧图像的所有像素点的像素值。并计算相邻两帧图像中对应像素点的像素值的差,根据该像素值的差,可以得到一幅差值图像。针对所述每幅差值图像,根据各像素点的值,计算差值图像的梯度向量;根据所述梯度向量,得到所述差值图像的第二梯度幅值图;针对每个第二梯度幅值图、计算K个非对称广义高斯分布参数;其中,K为正整数;针对每幅差值图像,根据所述非对称广义高斯分布参数,计算K维的局部二值模式特征,得到该差值图像的时间域纹理特征;将所述每幅差值图像的时间域纹理特征的集合作为所述待评价视频的时间域纹理特征。同样的,具体实施时,K可以取16,则计算16维的局部二值模式特征。
通过上述方法,获取的时间域纹理特征可以准确的表征待评价视频的时间域纹理特征。
较佳的,为了进一步减少处理的信息,提取所述待评价视频的时间域的纹理特征,包括:针对所述连续几帧图像,计算相邻两帧图像中对应像素点的像素值的差;将所述相邻两帧图像中对应像素点的像素值的差,作为一幅差值图像;针对所述每幅差值图像,根据各像素点的值,计算差值图像的梯度向量;根据所述梯度向量,得到所述差值图像的第二梯度幅值图;针对每个第二梯度幅值图、计算J个非对称广义高斯分布参数;其中,J为正整数;针对每幅差值图像,根据所述非对称广义高斯分布参数,计算J维的局部二值模式特征,得到该差值图像的时间域纹理特征;将所述每幅差值图像的时间域纹理特征的集合作为所述待评价视频的时间域纹理特征。较佳的,J的取值为16。
通过上述方法,使提取时间域的纹理特征时使用的图像与获取空间域纹理特征时的图像相同,减少了处理的信息,而且将该时间域纹理特征和空间域纹理特征,作为待评价视频的特征信息,可以更加准确的表征待评价视频的纹理特征。
具体实施时,将空间域纹理特征、时间域纹理特征、颜色特征依次拼接成一个列向量,并对该列向量采用主成分分析方法进行降维,作为待评价视频的特征信息。
本申请实施例中还提供了一种特征字典的训练方法,如图3所示,其为本申请实施例中特征字典的训练方法流程图。该方法包括以下步骤:
步骤301:获取N个不同失真程度的视频作为N个训练样本;其中,N为正整数。
步骤302:提取各训练样本的特征信息。
步骤303:针对每个训练样本,将该训练样本的特征信息与评价值对应组合,得到列向量;由N个训练样本的列向量构成训练矩阵。
步骤304:根据所述训练矩阵,训练得到特征字典。
具体实施时,N越大即训练样本越多,训练的得到的特征字典越准确。这样,训练得到的特征字典,则可以准确的预测待评价视频的质量。
一种可能的实施方式中,获取训练样本的特征信息,具体包括:提取所述训练样本的空间域和时间域纹理特征,并提取所述训练样本的颜色特征,得到所述训练样本的特征信息。
这样,纹理特征和颜色特征结合得到的特征信息才能够更准确的表征训练样本的特征。
为了去除特征信息中的冗余信息,得到所述训练样本的特征信息之后,还包括:对所述特征信息采用主成分分析方法进行降维。这样,降维之后的特征信息中,各个信息相互独立或不相关,可以用较少的信息表示特征信息。
训练样本的空间域纹理特征和时间域纹理特征的获取方法与前述视频质量评价方法中,获取待评价视频的空间域纹理特征和时间域纹理特征的方法相同。该方法中,提取所述训练样本的空间域纹理特征,具体包括:随机选取训练样本中连续几帧图像;获取所述连续几帧图像中每帧图像的所有像素点的像素值;根据所述像素值,计算每帧图像的梯度向量;根据所述梯度向量,得到每帧图像的第三梯度幅值图;针对每个第三梯度幅值图、计算A个非对称广义高斯分布参数;其中,A为正整数;针对每帧图像,根据所述非对称广义高斯分布参数,计算A维的局部二值模式特征,得到该帧图像的空间域纹理特征;将所述连续几帧图像的空间域纹理特征的集合作为所述一个训练样本的空间域纹理特征。同样的,A的取值越大越好,即获得的局部二值模式特征越多越好,较佳的,可以将A取为16。
一种可能的实施方式中,提取所述训练样本的时间域纹理特征,具体包括:针对所述连续几帧图像,计算相邻两帧图像中对应像素点的像素值的差;将所述相邻两帧图像中对应像素点的像素值的差,作为一幅差值图像;针对所述每幅差值图像,根据像素差,计算差值图像的梯度向量;根据所述梯度向量,得到所述差值图像的第四梯度幅值图;针对每个第四梯度幅值图、计算B个非对称广义高斯分布参数;其中,B为正整数;针对每幅差值图像,根据所述非对称广义高斯分布参数,计算B维的局部二值模式特征,得到该差值图像的时间域纹理特征;将所述每幅差值图像的时间域纹理特征的集合作为所述一个训练样本的时间域纹理特征。具体实施时,可以将B取为16。
通过上述方法,获得了一个训练样本的空间域纹理特征和时间域纹理特征,并获取训练样本的颜色特征,将这三个特征依次拼接成一个列向量,即为一个训练样本的特征信息。本申请实施例中,由N个训练样本的列向量构成训练矩阵具体包括:将每个训练样本的特征信息排成列向量,得到N个训练样本的特征信息矩阵;将评价值作为行向量,对应的拼接在所述特征信息矩阵中,得到训练矩阵;根据所述训练矩阵,训练得到特征字典具体包括:根据所述训练矩阵,通过KSVD训练方法中基于稀疏度控制时,训练得到特征字典。
具体实施时,若将评价值作为行向量,拼接在特征信息矩阵的最后一行,则训练得到的特征字典中,最后一行为表示评价值的向量。如果将评价值,对应的拼接在矩阵的其他位置,则需要通过计算,获取特征字典中表示评价值的向量。
通过上述方法得到的特征字典,可以准确的预测待评价视频的质量。
如图4所示,其为本申请实施例中利用特征字典预测待评价视频质量的流程示意图,包括以下步骤:
A1:获取N个不同失真程度的视频作为N个训练样本。
A2:提取所述训练样本的空间域和时间域纹理特征,并提取所述训练样本的颜色特征,得到所述训练样本的特征信息。
A3:对所述特征信息采用主成分分析方法进行降维。
A4:针对每个训练样本,将该训练样本的特征信息与评价值对应组合,得到列向量;由N个训练样本的列向量构成训练矩阵。
A5:根据所述训练矩阵,通过KSVD训练方法中基于稀疏度控制时,训练得到特征字典。
B1:提取所述待评价视频的空间域和时间域的纹理特征,并提取所述待评价视频的颜色特征,得到所述待评价视频的特征信息。
B2:根据预先存储的特征字典,对所述待评价视频的特征信息进行稀疏表示,得到稀疏系数。
B3:获取所述特征字典中表示评价值的向量。
B4:与所述稀疏系数构成的向量进行相乘,得到所述待评价视频的评价值。
具体实施时,获取待评价信息的特征信息的方法,应该与训练特征字典时获取训练样本的特征信息的方法一致。
通过上述方法,训练得到特征字典,利用特征字典对待评价视频的特征信息进行稀疏表示,得到待评价视频的评价值,可以在无待评价视频的原始视频的情况下,对待评价视频进行质量预测。预测得知待评价视频的质量后,便可提高该视频的质量。节省了大量的人力和处理资源,提高了视屏评价的效率。
基于相同的发明构思,本申请实施例还提供一种视频质量评价装置,如图5所示,其为本申请实施例中视频质量评价装置示意图。该装置包括:
获取模块501,用于获取待评价视频的特征信息;
处理模块502,用于根据预先存储的特征字典,对所述待评价视频的特征信息进行稀疏表示,得到稀疏系数;
计算模块503,用于获取所述特征字典中表示评价值的向量,与所述稀疏系数构成的向量进行相乘,得到所述待评价视频的评价值;
其中,所述特征字典通过下方法训练得到:获取N个不同失真程度的视频作为N个训练样本;其中,N为正整数;获取各训练样本的特征信息;针对每个训练样本,将该训练样本的特征信息与评价值对应组合,得到列向量;由N个训练样本的列向量构成训练矩阵;根据所述训练矩阵,训练得到特征字典。
该装置中,所述特征字典是根据KSVD训练方法中基于稀疏度控制时训练得到的特征字典;所述特征字典的最后一行的行向量为所述表示评价值的向量。
进一步的,获取模块501具体包括:获取单元,用于提取所述待评价视频的空间域和时间域的纹理特征,并提取所述待评价视频的颜色特征,得到所述待评价视频的特征信息。
为了去除特征信息中的冗余信息,降维单元,用于在获取单元得到所述待评价视频的特征信息之后,对所述特征信息采用主成分分析方法进行降维。
进一步的,获取单元具体用于:随机选取待评价视频中的连续几帧图像;
获取所述连续几帧图像中每帧图像的所有像素点的像素值;
根据所述像素值,计算每帧图像的梯度向量;
根据所述梯度向量,得到每帧图像的第一梯度幅值图;
针对每个第一梯度幅值图、计算J个非对称广义高斯分布参数;其中,J为正整数;
针对每帧图像,根据所述非对称广义高斯分布参数,计算J维的局部二值模式特征,得到该帧图像的空间域纹理特征;
将所述连续几帧图像的空间域纹理特征的集合作为所述待评价视频的空间域纹理特征。
为了提取待评价视频的时间域纹理特征,获取单元具体用于针对所述连续几帧图像,计算相邻两帧图像中对应像素点的像素值的差;
将所述相邻两帧图像中对应像素点的像素值的差,作为一幅差值图像;
针对所述每幅差值图像,根据各像素点的值,计算差值图像的梯度向量;
根据所述梯度向量,得到所述差值图像的第二梯度幅值图;
针对每个第二梯度幅值图、计算J个非对称广义高斯分布参数;其中,J为正整数;
针对每幅差值图像,根据所述非对称广义高斯分布参数,计算J维的局部二值模式特征,得到该差值图像的时间域纹理特征;
将所述每幅差值图像的时间域纹理特征的集合作为所述待评价视频的时间域纹理特征。
基于相同的发明构思,本申请实施例还提供一种特征字典的训练装置,如图6所示,其为本申请实施例中特征字典的训练装置示意图。
第二获取模块601,用于获取N个不同失真程度的视频作为N个训练样本;其中,N为正整数;
提取模块602,用于提取各训练样本的特征信息;
组合模块603,用于针对每个训练样本,将该训练样本的特征信息与评价值对应组合,得到列向量;由N个训练样本的列向量构成训练矩阵;
训练模块604,用于根据所述训练矩阵,训练得到特征字典。
进一步的,第二获取模块601具体包括:第二获取单元,用于提取所述训练样本的空间域和时间域纹理特征,并提取所述训练样本的颜色特征,得到所述训练样本的特征信息。
为了去除训练样本特征信息中的冗余信息,第二降维单元,用于在第二获取单元得到所述训练样本的特征信息之后,对所述特征信息采用主成分分析方法进行降维。
进一步的,第二获取单元具体用于随机选取训练样本中连续几帧图像;
获取所述连续几帧图像中每帧图像的所有像素点的像素值;
根据所述像素值,计算每帧图像的梯度向量;
根据所述梯度向量,得到每帧图像的第三梯度幅值图;
针对每个第三梯度幅值图、计算A个非对称广义高斯分布参数;其中,A为正整数;
针对每帧图像,根据所述非对称广义高斯分布参数,计算A维的局部二值模式特征,得到该帧图像的空间域纹理特征;
将所述连续几帧图像的空间域纹理特征的集合作为所述一个训练样本的空间域纹理特征。
为了提取训练样本的时间域纹理特征,第二获取单元具体用于针对所述连续几帧图像,计算相邻两帧图像中对应像素点的像素值的差;
将所述相邻两帧图像中对应像素点的像素值的差,作为一幅差值图像;
针对所述每幅差值图像,根据像素差,计算差值图像的梯度向量;
根据所述梯度向量,得到所述差值图像的第四梯度幅值图;
针对每个第四梯度幅值图、计算B个非对称广义高斯分布参数;其中,B为正整数;
针对每幅差值图像,根据所述非对称广义高斯分布参数,计算B维的局部二值模式特征,得到该差值图像的时间域纹理特征;
将所述每幅差值图像的时间域纹理特征的集合作为所述一个训练样本的时间域纹理特征。
进一步的,组合模块603具体包括:组合单元,用于将每个训练样本的特征信息排成列向量,得到N个训练样本的特征信息矩阵;
第二组合单元,用于将评价值作为行向量,对应的拼接在所述特征信息矩阵中,得到训练矩阵;
训练模块604具体包括:训练单元,用于根据所述训练矩阵,通过KSVD训练方法中基于稀疏度控制时,训练得到特征字典。
在介绍了本申请示例性实施方式的视频质量评价和特征字典的训练方法和装置之后,接下来,介绍根据本申请的另一示例性实施方式的计算装置。
所属技术领域的技术人员能够理解,本申请的各个方面可以实现为系统、方法或程序产品。因此,本申请的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
在一些可能的实施方式中,根据本申请的计算装置可以至少包括至少一个处理器、以及至少一个存储器。其中,存储器存储有程序代码,当程序代码被处理器执行时,使得处理器执行本说明书上述描述的根据本申请各种示例性实施方式的视频质量评价和特征字典的训练方法中的步骤。例如,处理器可以执行如图1中所示的步骤101-103或如图3所示的步骤301-304或如图4所示的步骤A1-B4。
下面参照图7来描述根据本申请的这种实施方式的计算装置130。图7显示的计算装置130仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图7所示,计算装置130以通用计算装置的形式表现。计算装置130的组件可以包括但不限于:上述至少一个处理器131、上述至少一个存储器132、连接不同系统组件(包括存储器132和处理器131)的总线133。
总线133表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器、外围总线、处理器或者使用多种总线结构中的任意总线结构的局域总线。
存储器132可以包括易失性存储器形式的可读介质,例如随机存取存储器(RAM)1321和/或高速缓存存储器1322,还可以进一步包括只读存储器(ROM)1323。
存储器132还可以包括具有一组(至少一个)程序模块1324的程序/实用工具1325,这样的程序模块1324包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
计算装置130也可以与一个或多个外部设备134(例如键盘、指向设备等)通信,还可与一个或者多个使得用户能与计算装置130交互的设备通信,和/或与使得该计算装置130能与一个或多个其它计算装置进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口135进行。并且,计算装置130还可以通过网络适配器136与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器136通过总线133与用于计算装置130的其它模块通信。应当理解,尽管图中未示出,可以结合计算装置130使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
在一些可能的实施方式中,本申请提供的视频质量评价和特征字典的训练方法的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在计算机设备上运行时,程序代码用于使计算机设备执行本说明书上述描述的根据本申请各种示例性实施方式的视频质量评价和特征字典的训练方法中的步骤,例如,计算机设备可以执行如图1中所示的步骤101-103或如图3所示的步骤301-304或如图4所示的步骤A1-B4。
程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
本申请的实施方式的视频质量评价和特征字典的训练的程序产品可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在计算装置上运行。然而,本申请的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本申请操作的程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算装置上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算装置上部分在远程计算装置上执行、或者完全在远程计算装置或服务器上执行。在涉及远程计算装置的情形中,远程计算装置可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算装置,或者,可以连接到外部计算装置(例如利用因特网服务提供商来通过因特网连接)。
应当注意,尽管在上文详细描述中提及了装置的若干单元或子单元,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本申请的实施方式,上文描述的两个或更多单元的特征和功能可以在一个单元中具体化。反之,上文描述的一个单元的特征和功能可以进一步划分为由多个单元来具体化。
此外,尽管在附图中以特定顺序描述了本申请方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (16)

1.一种视频质量评价方法,其特征在于,所述方法包括:
获取待评价视频的特征信息;
根据预先存储的特征字典,对所述待评价视频的特征信息进行稀疏表示,得到稀疏系数;
获取所述特征字典中表示评价值的向量,与所述稀疏系数构成的向量进行相乘,得到所述待评价视频的评价值;
其中,所述特征字典通过以下方法训练得到:
获取N个不同失真程度的视频作为N个训练样本;其中,N为正整数;
获取各训练样本的特征信息;
针对每个训练样本,将该训练样本的特征信息与评价值对应组合,得到列向量;由N个训练样本的列向量构成训练矩阵;
根据所述训练矩阵,训练得到特征字典。
2.根据权利要求1所述的方法,其特征在于,所述特征字典是根据KSVD训练方法中基于稀疏度控制时训练得到的特征字典;所述特征字典的最后一行的行向量为所述表示评价值的向量。
3.根据权利要求1所述的方法,其特征在于,获取待评价视频的特征信息,具体包括:
提取所述待评价视频的空间域和时间域的纹理特征,并提取所述待评价视频的颜色特征,得到所述待评价视频的特征信息。
4.根据权利要求3所述的方法,其特征在于,得到所述待评价视频的特征信息之后,还包括:
对所述特征信息采用主成分分析方法进行降维。
5.根据权利要求3所述的方法,其特征在于,提取所述待评价视频的空间域的纹理特征,具体包括:
随机选取待评价视频中的连续几帧图像;
获取所述连续几帧图像中每帧图像的所有像素点的像素值;
根据所述像素值,计算每帧图像的梯度向量;
根据所述梯度向量,得到每帧图像的第一梯度幅值图;
针对每个第一梯度幅值图、计算J个非对称广义高斯分布参数;其中,J为正整数;
针对每帧图像,根据所述非对称广义高斯分布参数,计算J维的局部二值模式特征,得到该帧图像的空间域纹理特征;
将所述连续几帧图像的空间域纹理特征的集合作为所述待评价视频的空间域纹理特征。
6.根据权利要求5所述的方法,其特征在于,提取所述待评价视频的时间域的纹理特征,包括:
针对所述连续几帧图像,计算相邻两帧图像中对应像素点的像素值的差;
将所述相邻两帧图像中对应像素点的像素值的差,作为一幅差值图像;
针对所述每幅差值图像,根据各像素点的值,计算差值图像的梯度向量;
根据所述梯度向量,得到所述差值图像的第二梯度幅值图;
针对每个第二梯度幅值图、计算J个非对称广义高斯分布参数;其中,J为正整数;
针对每幅差值图像,根据所述非对称广义高斯分布参数,计算J维的局部二值模式特征,得到该差值图像的时间域纹理特征;
将所述每幅差值图像的时间域纹理特征的集合作为所述待评价视频的时间域纹理特征。
7.一种特征字典的训练方法,其特征在于,所述方法包括:
获取N个不同失真程度的视频作为N个训练样本;其中,N为正整数;
提取各训练样本的特征信息;
针对每个训练样本,将该训练样本的特征信息与评价值对应组合,得到列向量;由N个训练样本的列向量构成训练矩阵;
根据所述训练矩阵,训练得到特征字典。
8.根据权利要求7所述的方法,其特征在于,获取训练样本的特征信息,具体包括:
提取所述训练样本的空间域和时间域纹理特征,并提取所述训练样本的颜色特征,得到所述训练样本的特征信息。
9.根据权利要求8所述的方法,其特征在于,得到所述训练样本的特征信息之后,还包括:
对所述特征信息采用主成分分析方法进行降维。
10.根据权利要求7所述的方法,其特征在于,提取所述训练样本的空间域纹理特征,具体包括:
随机选取训练样本中连续几帧图像;
获取所述连续几帧图像中每帧图像的所有像素点的像素值;
根据所述像素值,计算每帧图像的梯度向量;
根据所述梯度向量,得到每帧图像的第三梯度幅值图;
针对每个第三梯度幅值图、计算A个非对称广义高斯分布参数;其中,A为正整数;
针对每帧图像,根据所述非对称广义高斯分布参数,计算A维的局部二值模式特征,得到该帧图像的空间域纹理特征;
将所述连续几帧图像的空间域纹理特征的集合作为所述一个训练样本的空间域纹理特征。
11.根据权利要求10所述的方法,其特征在于,提取所述训练样本的时间域纹理特征,具体包括:
针对所述连续几帧图像,计算相邻两帧图像中对应像素点的像素值的差;
将所述相邻两帧图像中对应像素点的像素值的差,作为一幅差值图像;
针对所述每幅差值图像,根据像素差,计算差值图像的梯度向量;
根据所述梯度向量,得到所述差值图像的第四梯度幅值图;
针对每个第四梯度幅值图、计算B个非对称广义高斯分布参数;其中,B为正整数;
针对每幅差值图像,根据所述非对称广义高斯分布参数,计算B维的局部二值模式特征,得到该差值图像的时间域纹理特征;
将所述每幅差值图像的时间域纹理特征的集合作为所述一个训练样本的时间域纹理特征。
12.根据权利要求7所述的方法,其特征在于,由N个训练样本的列向量构成训练矩阵具体包括:
将每个训练样本的特征信息排成列向量,得到N个训练样本的特征信息矩阵;
将评价值作为行向量,对应的拼接在所述特征信息矩阵中,得到训练矩阵;
根据所述训练矩阵,训练得到特征字典具体包括:
根据所述训练矩阵,通过KSVD训练方法中基于稀疏度控制时,训练得到特征字典。
13.一种视频质量评价装置,其特征在于,所述装置包括:
获取模块,用于获取待评价视频的特征信息;
处理模块,用于根据预先存储的特征字典,对所述待评价视频的特征信息进行稀疏表示,得到稀疏系数;
计算模块,用于获取所述特征字典中表示评价值的向量,与所述稀疏系数构成的向量进行相乘,得到所述待评价视频的评价值;
其中,所述特征字典通过下方法训练得到:获取N个不同失真程度的视频作为N个训练样本;其中,N为正整数;
获取各训练样本的特征信息;
针对每个训练样本,将该训练样本的特征信息与评价值对应组合,得到列向量;由N个训练样本的列向量构成训练矩阵;
根据所述训练矩阵,训练得到特征字典。
14.一种特征字典的训练装置,其特征在于,所述装置包括:
第二获取模块,用于获取N个不同失真程度的视频作为N个训练样本;其中,N为正整数;
提取模块,用于提取各训练样本的特征信息;
组合模块,用于针对每个训练样本,将该训练样本的特征信息与评价值对应组合,得到列向量;由N个训练样本的列向量构成训练矩阵;
训练模块,用于根据所述训练矩阵,训练得到特征字典。
15.一种计算机可读介质,存储有计算机可执行指令,其特征在于,所述计算机可执行指令用于执行如权利要求1-12中任一权利要求所述的方法。
16.一种计算装置,其特征在于,包括:
至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1-12中任一权利要求所述的方法。
CN201811541314.7A 2018-12-17 2018-12-17 视频质量评价和特征字典的训练方法、装置和介质 Pending CN111327946A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811541314.7A CN111327946A (zh) 2018-12-17 2018-12-17 视频质量评价和特征字典的训练方法、装置和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811541314.7A CN111327946A (zh) 2018-12-17 2018-12-17 视频质量评价和特征字典的训练方法、装置和介质

Publications (1)

Publication Number Publication Date
CN111327946A true CN111327946A (zh) 2020-06-23

Family

ID=71169060

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811541314.7A Pending CN111327946A (zh) 2018-12-17 2018-12-17 视频质量评价和特征字典的训练方法、装置和介质

Country Status (1)

Country Link
CN (1) CN111327946A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111681091A (zh) * 2020-08-12 2020-09-18 腾讯科技(深圳)有限公司 基于时间域信息的金融风险预测方法、装置及存储介质
US20220076077A1 (en) * 2020-09-04 2022-03-10 Microsoft Technology Licensing, Llc Quality estimation model trained on training signals exhibiting diverse impairments
CN115379259A (zh) * 2022-08-18 2022-11-22 百度在线网络技术(北京)有限公司 视频处理方法、装置、电子设备和存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105243385A (zh) * 2015-09-23 2016-01-13 宁波大学 一种基于非监督学习的图像质量评价方法
CN106447654A (zh) * 2016-09-12 2017-02-22 中国科学技术大学 基于统计相似性和双向显著性保真度的图像重定向质量评价方法
US20170116481A1 (en) * 2015-10-23 2017-04-27 Beihang University Method for video matting via sparse and low-rank representation

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105243385A (zh) * 2015-09-23 2016-01-13 宁波大学 一种基于非监督学习的图像质量评价方法
US20170116481A1 (en) * 2015-10-23 2017-04-27 Beihang University Method for video matting via sparse and low-rank representation
CN106447654A (zh) * 2016-09-12 2017-02-22 中国科学技术大学 基于统计相似性和双向显著性保真度的图像重定向质量评价方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
范赐恩等: ""颜色空间统计联合纹理特征的无参考图像质量评价"", 《光学精密工程》 *
袁其政: ""面向彩色与深度的3D视频感知质量评价与增强方法研究"", 《中国优秀硕士论文全文数据库》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111681091A (zh) * 2020-08-12 2020-09-18 腾讯科技(深圳)有限公司 基于时间域信息的金融风险预测方法、装置及存储介质
CN111681091B (zh) * 2020-08-12 2020-11-27 腾讯科技(深圳)有限公司 基于时间域信息的金融风险预测方法、装置及存储介质
US20220076077A1 (en) * 2020-09-04 2022-03-10 Microsoft Technology Licensing, Llc Quality estimation model trained on training signals exhibiting diverse impairments
CN115379259A (zh) * 2022-08-18 2022-11-22 百度在线网络技术(北京)有限公司 视频处理方法、装置、电子设备和存储介质
CN115379259B (zh) * 2022-08-18 2024-04-26 百度在线网络技术(北京)有限公司 视频处理方法、装置、电子设备和存储介质

Similar Documents

Publication Publication Date Title
US10897620B2 (en) Method and apparatus for processing a video
CN110188765B (zh) 图像语义分割模型生成方法、装置、设备及存储介质
CN108664981B (zh) 显著图像提取方法及装置
CN109165573B (zh) 用于提取视频特征向量的方法和装置
CN111327946A (zh) 视频质量评价和特征字典的训练方法、装置和介质
CN110046279B (zh) 视频文件特征的预测方法、介质、装置和计算设备
CN113763270B (zh) 蚊式噪声去除方法及电子设备
CN116506622B (zh) 模型训练方法及视频编码参数优化方法和装置
CN111144477A (zh) 一种钢材表面缺陷的训练样本生成方法、系统及电子设备
CN105979283A (zh) 视频转码方法和装置
Zhang et al. A GPU-accelerated real-time single image de-hazing method using pixel-level optimal de-hazing criterion
CN114495101A (zh) 文本检测方法、文本检测网络的训练方法及装置
EP3156943A1 (en) Method and device for clustering patches of a degraded version of an image
CN112712181A (zh) 模型构建优化方法、装置、设备和可读存储介质
CN112084954A (zh) 视频目标的检测方法、装置、电子设备及存储介质
US20230186608A1 (en) Method, device, and computer program product for video processing
CN113450276B (zh) 视频图像增强方法及其模型训练方法、相关设备
US20220377342A1 (en) Video encoding and video decoding
CN111339367B (zh) 视频处理方法、装置、电子设备及计算机可读存储介质
CN113327265A (zh) 一种基于指导学习策略的光流估计方法和系统
CN104320659A (zh) 背景建模方法、装置及设备
CN111311604A (zh) 用于分割图像的方法和装置
WO2023036274A1 (zh) 视频处理方法、装置、电子设备、介质及程序产品
CN115633210A (zh) 视频字幕去除方法及装置
CN116011416A (zh) 端到端基于矩阵关系解析的文本视语特征处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200623