CN104811693B

CN104811693B - 一种立体图像视觉舒适度客观评价方法

Info

Publication number: CN104811693B
Application number: CN201510173232.1A
Authority: CN
Inventors: 邵枫; 姜求平; 李福翠
Original assignee: Ningbo University
Current assignee: Langxi pinxu Technology Development Co., Ltd
Priority date: 2015-04-14
Filing date: 2015-04-14
Publication date: 2016-06-29
Anticipated expiration: 2035-04-14
Also published as: CN104811693A

Abstract

本发明公开了一种立体图像视觉舒适度客观评价方法，其首先提取出立体图像的右视差图像的用于反映视觉舒适度的初级视觉特征矢量和高级视觉特征矢量，并融合得到立体图像的特征矢量，再利用支持向量回归对立体图像集合中的所有立体图像的特征矢量进行训练，最后利用训练得到的支持向量回归训练模型对立体图像集合中的每幅立体图像的特征矢量进行测试，得到每幅立体图像的客观视觉舒适度评价预测值；优点是根据立体图像的右视差图像的初级视觉特征矢量和高级视觉特征矢量获得的立体图像的特征矢量具有较强的稳定性，且能够较好地反映立体图像的视觉舒适度变化情况，从而有效地提高了客观评价结果与主观感知之间的相关性。

Description

一种立体图像视觉舒适度客观评价方法

技术领域

本发明涉及一种图像质量评价方法，尤其是涉及一种立体图像视觉舒适度客观评价方法。

背景技术

随着立体视频显示技术和高质量立体视频内容获取技术的快速发展，立体视频的视觉体验质量(QoE，QualityofExperience)是立体视频系统设计中的一个重要问题，而视觉舒适度(VC，VisualComfort)是影响立体视频的视觉体验质量的重要因素。目前，对立体视频/立体图像的质量评价研究主要考虑了内容失真对于图像质量的影响，而很少考虑视觉舒适度等因素的影响。因此，为了提高观看者的视觉体验质量，研究立体视频/立体图像的视觉舒适度客观评价模型对指导3D内容的制作和后期处理具有十分重要的作用。

传统的立体图像视觉舒适度客观评价方法主要采用全局的视差统计特性来预测视觉舒适度。然而，过大的双目视差、人眼焦点调节与辐辏机制冲突通常被认为是引起视觉不舒适的主要原因。人眼的双眼融合机制为具有水平视差的左、右眼物像融合成具有立体感的单一清晰物像提供了生理保证，然而如果水平视差过大，则会导致物像落在Panum融合区域外，人眼将无法正常形成双眼单视性，长时间观看容易造成严重的视觉疲劳；此外，不同于自然观看条件下人眼焦点调节与辐辏机制的一致性(调节距离和辐辏距离都在观看屏幕上)，在观看立体图像时，人眼焦点调节与辐辏机制会产生不同程度的冲突，同样会影响观看者的视觉体验质量。因此，如何在评价过程中有效地表征上述人眼视觉处理机制，使得客观评价结果更加感觉符合人类视觉系统，是在对立体图像进行视觉舒适度客观评价过程中需要研究解决的问题。

发明内容

本发明所要解决的技术问题是提供一种立体图像视觉舒适度客观评价方法，其能够有效地提高客观评价结果与主观感知之间的相关性。

本发明解决上述技术问题所采用的技术方案为：一种立体图像视觉舒适度客观评价方法，其特征在于包括以下步骤：

①将待评价的立体图像的左视点图像记为{I_L(x,y)}，将待评价的立体图像的右视点图像记为{I_R(x,y)}，将待评价的立体图像的右视差图像记为{d_R(x,y)}，其中，此处(x,y)表示待评价的立体图像中的像素点的坐标位置，1≤x≤W，1≤y≤H，W表示待评价的立体图像的宽度，H表示待评价的立体图像的高度，I_L(x,y)表示{I_L(x,y)}中坐标位置为(x,y)的像素点的像素值，I_R(x,y)表示{I_R(x,y)}中坐标位置为(x,y)的像素点的像素值，d_R(x,y)表示{d_R(x,y)}中坐标位置为(x,y)的像素点的像素值；

②利用基于图论的视觉显著模型提取出{I_R(x,y)}的显著图，记为{SM_R(x,y)}；然后根据{SM_R(x,y)}和{d_R(x,y)}，获取{I_R(x,y)}的视觉显著图，记为{S_stereo(x,y)}，将{S_stereo(x,y)}中坐标位置为(x,y)的像素点的像素值记为S_stereo(x,y)，其中，SM_R(x,y)表示{SM_R(x,y)}中坐标位置为(x,y)的像素点的像素值，表示SM_R(x,y)的权重，表示d_R(x,y)的权重，

③根据{S_stereo(x,y)}和{d_R(x,y)}，获取{d_R(x,y)}中的所有像素点的显著加权视差幅值f₁、显著加权视差对比度f₂、显著加权视差散度f₃、显著加权视差偏度f₄、平均最大视差f₅和平均最小视差f₆，然后将f₁、f₂、f₃、f₄、f₅和f₆按顺序进行排列得到{d_R(x,y)}的初级视觉特征矢量，记为F_p，F_p＝[f₁,f₂,f₃,f₄,f₅,f₆]，其中，F_p的维数为6，符号“[]”为矢量表示符号；

④利用视差转换算法计算{d_R(x,y)}的角视差图像；然后利用不同神经元的视差调制函数对{d_R(x,y)}的角视差图像进行调制操作，得到{d_R(x,y)}的角视差图像中的不同神经元在不同视差区间的响应；再根据{d_R(x,y)}的角视差图像中的不同神经元在不同视差区间的响应，获取{d_R(x,y)}的高级视觉特征矢量，记为F_a，F_a＝[r₁,r₂,…,r₁₃]，其中，F_a的维数为13，符号“[]”为矢量表示符号，1≤i≤13，符号“||”为取绝对值符号，表示{d_R(x,y)}的角视差图像中的第i个神经元在所有视差区间的响应构成的向量经最大池化后得到的特征矢量；

⑤将F_p和F_a组合成一个新的特征矢量，记为X，X＝[F_p,F_a]，然后将X作为待评价的立体图像的特征矢量，其中，符号“[]”为矢量表示符号，X＝[F_p,F_a]表示将F_p和F_a连接起来形成一个新的特征矢量；

⑥将M副各不相同的立体图像构成一个立体图像集合；然后利用主观质量评价方法获取立体图像集合中的每副立体图像的视觉舒适度的平均主观评分均值，将立体图像集合中的第m副立体图像的视觉舒适度的平均主观评分均值记为MOS_m；再按照步骤①至步骤⑤获取待评价的立体图像的特征矢量X的操作，以相同的方式获取立体图像集合中的每幅立体图像的特征矢量，将立体图像集合中的第m副立体图像的特征矢量记为X_m；其中，M表示立体图像集合中包含的立体图像的幅数，M≥1，1≤m≤M，MOS_m∈[1,5]；

⑦将立体图像集合中的所有立体图像分成训练集和测试集，将训练集中的所有立体图像的特征矢量和视觉舒适度的平均主观评分均值构成训练样本数据集合，将测试集中的所有立体图像的特征矢量和视觉舒适度的平均主观评分均值构成测试样本数据集合；然后采用支持向量回归作为机器学习的方法，对训练样本数据集合中的所有特征矢量进行训练，使得经过训练得到的回归函数值与平均主观评分均值之间的误差最小，拟合得到最优的权重矢量w^opt和最优的偏置项b^opt；接着利用w^opt和b^opt构造得到支持向量回归训练模型；再根据支持向量回归训练模型，对测试样本数据集合中的每个特征矢量进行测试，预测得到测试样本数据集合中的每个特征矢量对应的立体图像的客观视觉舒适度评价预测值，将测试样本数据集合中的第q个特征矢量对应的立体图像的客观视觉舒适度评价预测值记为Q_q，Q_q＝f(X_q)，其中，1≤q≤M-S，S表示训练集中包含的立体图像的幅数，f()为函数表示形式，X_q表示测试样本数据集合中的第q个特征矢量，(w^opt)^T为w^opt的转置矩阵，表示测试样本数据集合中的第q个特征矢量的线性函数；之后通过重新分配训练集和测试集，重新预测得到测试样本数据集合中的每个特征矢量对应的立体图像的客观视觉舒适度评价预测值，经过N次迭代后计算立体图像集合中的每幅立体图像的多个客观视觉舒适度评价预测值的平均值，并将计算得到的平均值作为对应那幅立体图像的最终的客观视觉舒适度评价预测值，其中，N>100。

所述的步骤③的具体过程为：

③-1、根据{S_stereo(x,y)}和{d_R(x,y)}，计算{d_R(x,y)}中的所有像素点的显著加权视差幅值，记为f₁，其中，符号“||”为取绝对值符号，d_max为{d_R(x,y)}的最大视差幅值；

③-2、利用高斯差分滤波器对{d_R(x,y)}实施滤波操作，得到{d_R(x,y)}的视差对比度图，记为{d_C(x,y)}，将{d_C(x,y)}中坐标位置为(x,y)的像素点的像素值记为d_C(x,y)，其中，

h_{σ} (x, y) = \frac{1}{2 π σ^{2}} \exp (- \frac{x^{2} + y^{2}}{2 σ^{2}}) - \frac{1}{2 π k^{' 2} σ^{2}} \exp (- \frac{x^{2} + y^{2}}{2 k^{' 2} σ^{2}}),

σ表示高斯差分滤波器的尺度，k'表示高斯差分滤波器的滤波中心与环绕区域的比例，exp()表示以自然基数e为底的指数函数，符号“”为卷积操作符号；

③-3、根据{S_stereo(x,y)}和{d_C(x,y)}，计算{d_R(x,y)}中的所有像素点的显著加权视差对比度，记为f₂，其中，符号“||”为取绝对值符号；

③-4、根据{S_stereo(x,y)}和{d_R(x,y)}，计算{d_R(x,y)}中的所有像素点的显著加权视差散度，记为f₃，

f_{3} = \frac{1}{d_{\max}} \times \sqrt{\frac{Σ_{x = 1}^{W} Σ_{y = 1}^{H} S_{stereo} (x, y) \times {(d_{R} (x, y))}^{2}}{Σ_{x = 1}^{W} Σ_{y = 1}^{H} S_{stereo} (x, y)}};

③-5、根据{S_stereo(x,y)}和{d_R(x,y)}，计算{d_R(x,y)}中的所有像素点的显著加权视差偏度，记为f₄，其中，符号“||”为取绝对值符号；

③-6、计算{d_R(x,y)}中的所有像素点的平均最大视差，记为f₅，其中，表示将{d_R(x,y)}中的所有像素点各自的像素值按从大到小的顺序排列后、前10％的像素值对应的所有像素点的坐标位置构成的集合，

N_{Ω_{p}^{+}} = 0.1 \times (W \times H);

③-7、计算{d_R(x,y)}中的所有像素点的平均最小视差，记为f₆，其中，表示将{d_R(x,y)}中的所有像素点各自的像素值按从小到大的顺序排列后、前10％的像素值对应的所有像素点的坐标位置构成的集合，

N_{Ω_{p}^{-}} = 0.1 \times (W \times H);

③-8、将f₁、f₂、f₃、f₄、f₅和f₆按顺序进行排列得到{d_R(x,y)}的初级视觉特征矢量，记为F_p，F_p＝[f₁,f₂,f₃,f₄,f₅,f₆]，其中，F_p的维数为6，符号“[]”为矢量表示符号。

所述的步骤④的具体过程为：

④-1、利用视差转换算法计算{d_R(x,y)}的角视差图像，记为{φ_R(x,y)}；然后计算{φ_R(x,y)}的视差直方图，记为其中，φ_R(x,y)表示{φ_R(x,y)}中坐标位置为(x,y)的像素点的像素值，表示{φ_R(x,y)}中像素值属于第k个视差区间的所有像素点的个数，L表示中的视差区间的总数；

④-2、利用13个不同神经元的视差调制函数对{φ_R(x,y)}进行调制操作，得到{φ_R(x,y)}中的不同神经元在不同视差区间的响应，将{φ_R(x,y)}中的第i个神经元在第k个视差区间的响应记为R_i,k，其中，1≤i≤13,1≤k≤L，p(k|φ_R(x,y))表示φ_R(x,y)属于第k个视差区间的概率，如果φ_R(x,y)属于第k个视差区间，则p(k|φ_R(x,y))＝1，如果φ_R(x,y)不属于第k个视差区间，则p(k|φ_R(x,y))＝0，g_i(φ_R(x,y))表示第i个神经元的视差调制函数，

g_{i} (φ_{R} (x, y)) = A_{i} \times e^{- 0.5 ({(φ_{R} (x, y) - d_{0}^{i})}^{2} / δ_{i}^{2})} \times \cos (2 π f_{i} \times (φ_{R} (x, y) - d_{0}^{i}) + Φ_{i}),

A_i表示第i个神经元的视差调制函数的振幅，A_i∈{44,67,73,42,110,124,51,77,46,121,49,31,92}，表示第i个神经元的视差调制函数的中心，

d_{0}^{i} &Element; {- 0.23, - 0.46,0.15, - 0.11, - 0.04, - 0.16, - 0.02,0.04, - 0.01,0.24,0.81,1.6, - 0.23},

δ_i表示第i个神经元的视差调制函数的高斯核宽度，δ_i∈{1.86,1.16,1.07,0.62,0.53,0.31,0.62,0.67,0.57,0.52,1.01,2.10,0.56}，f_i表示第i个神经元的视差调制函数的频率，f_i∈{0.19,0.25,0.28,0.43,0.51,0.37,0.42,0.50,0.49,0.30,0.21,0.19,0.33}，Φ_i表示第i个神经元的视差调制函数的相位，Φ_i∈{74,86,123,73,40,-51,-38,-55,-92,-61,-19,38,-162}，cos()表示求余弦函数；

④-3、将{φ_R(x,y)}中的每个神经元在所有视差区间的响应构成一个向量，将{φ_R(x,y)}中的第i个神经元在所有视差区间的响应构成的向量记为x_i，x_i＝[R_i,1,R_i,2,…,R_i,L]；然后获取{φ_R(x,y)}中的每个神经元在所有视差区间的响应构成的向量经最大池化后得到的特征矢量，将x_i经最大池化后得到的特征矢量记为x_i，其中，R_i,1、R_i,2和R_i,L对应表示{φ_R(x,y)}中的第i个神经元在第1个视差区间的响应、在第2个视差区间的响应、在第L个视差区间的响应，和对应表示中的第1个元素的值、第2个元素的值和第L个元素的值，符号“[]”为矢量表示符号；

④-4、计算{d_R(x,y)}的高级视觉特征矢量，记为F_a，F_a＝[r₁,r₂,…,r₁₃]，其中，F_a的维数为13，符号“[]”为矢量表示符号，1≤i≤13，符号“||”为取绝对值符号，表示中的第k个元素的值。

所述的步骤④-3中的获取过程为：利用最大池化方法重新计算x_i中的每个元素的值，将R_i,k经最大池化方法重新计算后得到的值记为然后将x_i中的所有元素各自的值经最大池化方法重新计算后得到的值按顺序排列构成一个特征矢量，记为其中，max()为取最大值函数，和对应表示中的第1个元素的值、第2个元素的值和第L个元素的值。

所述的步骤⑦的具体过程为：

⑦-1、随机选择立体图像集合中的幅立体图像构成训练集，将立体图像集合中剩余的M-S幅立体图像构成测试集，其中，符号“”为向下取整符号；

⑦-2、将训练集中的所有立体图像的特征矢量和视觉舒适度的平均主观评分均值构成训练样本数据集合，记为Ω_S，{X_t,MOS_t}∈Ω_S，其中，X_t表示训练样本数据集合Ω_S中的第t个特征矢量，MOS_t表示训练样本数据集合Ω_S中的第t个视觉舒适度的平均主观评分均值，1≤t≤S；

⑦-3、构造训练样本数据集合Ω_S中的每个特征矢量的回归函数，将X_t的回归函数记为f(X_t)，其中，f()为函数表示形式，w为权重矢量，w^T为w的转置矩阵，b为偏置项，表示X_t的线性函数，为支持向量回归中的核函数，X_l为训练样本数据集合Ω_S中的第l个特征矢量，1≤l≤S，γ为核参数，exp()表示以自然基数e为底的指数函数，符号“||||”为求欧式距离符号；

⑦-4、采用支持向量回归作为机器学习的方法，对训练样本数据集合Ω_S中的所有特征矢量进行训练，使得经过训练得到的回归函数值与平均主观评分均值之间的误差最小，拟合得到最优的权重矢量w^opt和最优的偏置项b^opt，将最优的权重矢量w^opt和最优的偏置项b^opt的组合记为(w^opt,b^opt)，然后利用得到的最优的权重矢量w^opt和最优的偏置项b^opt构造支持向量回归训练模型，记为其中，Ψ表示对训练样本数据集合Ω_S中的所有特征矢量进行训练的所有的权重矢量和偏置项的组合的集合，表示取使得最小的w和b的值，X_inp表示支持向量回归训练模型的输入矢量，(w^opt)^T为w^opt的转置矩阵，表示支持向量回归训练模型的输入矢量X_inp的线性函数；

⑦-5、将测试集中的所有立体图像的特征矢量和视觉舒适度的平均主观评分均值构成测试样本数据集合，然后根据支持向量回归训练模型，对测试样本数据集合中的每个特征矢量进行测试，预测得到测试样本数据集合中的每个特征矢量对应的立体图像的客观视觉舒适度评价预测值，将测试样本数据集合中的第q个特征矢量对应的立体图像的客观视觉舒适度评价预测值记为Q_q，Q_q＝f(X_q)，其中，1≤q≤M-S，f()为函数表示形式，X_q表示测试样本数据集合中的第q个特征矢量，表示测试样本数据集合中的第q个特征矢量的线性函数；

⑦-6、再重新随机选择立体图像集合中的幅立体图像构成训练集，将立体图像集合中剩余的M-S幅立体图像构成测试集，然后返回步骤⑦-2继续执行，在经过N次迭代后，计算立体图像集合中的每幅立体图像的多个客观视觉舒适度评价预测值的平均值，并将计算得到的平均值作为对应那幅立体图像的最终的客观视觉舒适度评价预测值，其中，N>100。

与现有技术相比，本发明的优点在于：本发明方法考虑了人眼立体视觉注意机制(StereoVisualAttention)与人脑视皮层中颞区神经处理机制(MiddleTemporalNeuralActivity)对立体视觉舒适度的关系，分别提取出立体图像的右视差图像的初级视觉特征矢量和高级视觉特征矢量，用于反映立体视觉舒适性特性，由于根据立体图像的右视差图像的初级视觉特征矢量和高级视觉特征矢量获得的立体图像的特征矢量具有较强的稳定性，且能够较好地反映立体图像的视觉舒适度变化情况，因此有效地提高了客观评价结果与主观感知之间的相关性。

附图说明

图1为本发明方法的总体实现框图。

具体实施方式

以下结合附图实施例对本发明作进一步详细描述。

本发明提出的一种立体图像视觉舒适度客观评价方法，其总体实现框图如图1所示，其包括以下步骤：

①将待评价的立体图像的左视点图像记为{I_L(x,y)}，将待评价的立体图像的右视点图像记为{I_R(x,y)}，将待评价的立体图像的右视差图像记为{d_R(x,y)}，其中，此处(x,y)表示待评价的立体图像中的像素点的坐标位置，1≤x≤W，1≤y≤H，W表示待评价的立体图像的宽度，H表示待评价的立体图像的高度，I_L(x,y)表示{I_L(x,y)}中坐标位置为(x,y)的像素点的像素值，I_R(x,y)表示{I_R(x,y)}中坐标位置为(x,y)的像素点的像素值，d_R(x,y)表示{d_R(x,y)}中坐标位置为(x,y)的像素点的像素值。

②利用现有的基于图论的视觉显著(Graph-BasedVisualSaliency，GBVS)模型提取出{I_R(x,y)}的显著图，记为{SM_R(x,y)}；然后根据{SM_R(x,y)}和{d_R(x,y)}，获取{I_R(x,y)}的视觉显著图，记为{S_stereo(x,y)}，将{S_stereo(x,y)}中坐标位置为(x,y)的像素点的像素值记为S_stereo(x,y)，其中，SM_R(x,y)表示{SM_R(x,y)}中坐标位置为(x,y)的像素点的像素值，表示SM_R(x,y)的权重，表示d_R(x,y)的权重，在本实施例中取

③根据{S_stereo(x,y)}和{d_R(x,y)}，获取{d_R(x,y)}中的所有像素点的显著加权视差幅值f₁、显著加权视差对比度f₂、显著加权视差散度f₃、显著加权视差偏度f₄、平均最大视差f₅和平均最小视差f₆，然后将f₁、f₂、f₃、f₄、f₅和f₆按顺序进行排列得到{d_R(x,y)}的初级视觉特征矢量，记为F_p，F_p＝[f₁,f₂,f₃,f₄,f₅,f₆]，其中，F_p的维数为6，符号“[]”为矢量表示符号。

在此具体实施例中，步骤③的具体过程为：

③-1、根据{S_stereo(x,y)}和{d_R(x,y)}，计算{d_R(x,y)}中的所有像素点的显著加权视差幅值，记为f₁，其中，符号“||”为取绝对值符号，d_max为{d_R(x,y)}的最大视差幅值，即d_max为{d_R(x,y)}中的所有像素点的视差幅值的最大值，对于{d_R(x,y)}中坐标位置为(x,y)的像素点的视差幅值为|d_R(x,y)|。

h_{σ} (x, y) = \frac{1}{2 π σ^{2}} \exp (- \frac{x^{2} + y^{2}}{2 σ^{2}}) - \frac{1}{2 π k^{' 2} σ^{2}} \exp (- \frac{x^{2} + y^{2}}{2 k^{' 2} σ^{2}}),

σ表示高斯差分滤波器的尺度，k'表示高斯差分滤波器的滤波中心与环绕区域的比例，在本实施例中取σ＝32、k'＝1.6，exp()表示以自然基数e为底的指数函数，符号“”为卷积操作符号。

③-3、根据{S_stereo(x,y)}和{d_C(x,y)}，计算{d_R(x,y)}中的所有像素点的显著加权视差对比度，记为f₂，其中，符号“||”为取绝对值符号。

f_{3} = \frac{1}{d_{\max}} \times \sqrt{\frac{Σ_{x = 1}^{W} Σ_{y = 1}^{H} S_{stereo} (x, y) \times {(d_{R} (x, y))}^{2}}{Σ_{x = 1}^{W} Σ_{y = 1}^{H} S_{stereo} (x, y)}};

③-5、根据{S_stereo(x,y)}和{d_R(x,y)}，计算{d_R(x,y)}中的所有像素点的显著加权视差偏度，记为f₄，其中，符号“||”为取绝对值符号。

③-6、计算{d_R(x,y)}中的所有像素点的平均最大视差，记为f₅，其中，表示将{d_R(x,y)}中的所有像素点各自的像素值按从大到小的顺序排列后、前10％的像素值对应的所有像素点的坐标位置构成的集合，即表示将{d_R(x,y)}中的所有像素点各自的像素值按从大到小的顺序排列后、前10％的像素值的总个数。

③-7、计算{d_R(x,y)}中的所有像素点的平均最小视差，记为f₆，其中，表示将{d_R(x,y)}中的所有像素点各自的像素值按从小到大的顺序排列后、前10％的像素值对应的所有像素点的坐标位置构成的集合，即表示将{d_R(x,y)}中的所有像素点各自的像素值按从小到大的顺序排列后、前10％的像素值的总个数。

④利用现有的视差转换算法计算{d_R(x,y)}的角视差图像；然后利用不同神经元的视差调制函数对{d_R(x,y)}的角视差图像进行调制操作，得到{d_R(x,y)}的角视差图像中的不同神经元在不同视差区间的响应；再根据{d_R(x,y)}的角视差图像中的不同神经元在不同视差区间的响应，获取{d_R(x,y)}的高级视觉特征矢量，记为F_a，F_a＝[r₁,r₂,…,r₁₃]，其中，F_a的维数为13，符号“[]”为矢量表示符号，1≤i≤13，符号“||”为取绝对值符号，表示{d_R(x,y)}的角视差图像中的第i个神经元在所有视差区间的响应构成的向量经最大池化后得到的特征矢量。

在此具体实施例中，步骤④的具体过程为：

④-1、利用现有的视差转换算法计算{d_R(x,y)}的角视差图像，记为{φ_R(x,y)}；然后计算{φ_R(x,y)}的视差直方图，记为其中，φ_R(x,y)表示{φ_R(x,y)}中坐标位置为(x,y)的像素点的像素值，表示{φ_R(x,y)}中像素值属于第k个视差区间的所有像素点的个数，L表示中的视差区间的总数，在本实施例中取L＝64。

g_{i} (φ_{R} (x, y)) = A_{i} \times e^{- 0.5 ({(φ_{R} (x, y) - d_{0}^{i})}^{2} / δ_{i}^{2})} \times \cos (2 π f_{i} \times (φ_{R} (x, y) - d_{0}^{i}) + Φ_{i}),

d_{0}^{i} &Element; {- 0.23, - 0.46,0.15, - 0.11, - 0.04, - 0.16, - 0.02,0.04, - 0.01,0.24,0.81,1.6, - 0.23},

δ_i表示第i个神经元的视差调制函数的高斯核宽度，δ_i∈{1.86,1.16,1.07,0.62,0.53,0.31,0.62,0.67,0.57,0.52,1.01,2.10,0.56}，f_i表示第i个神经元的视差调制函数的频率，f_i∈{0.19,0.25,0.28,0.43,0.51,0.37,0.42,0.50,0.49,0.30,0.21,0.19,0.33}，Φ_i表示第i个神经元的视差调制函数的相位，Φ_i∈{74,86,123,73,40,-51,-38,-55,-92,-61,-19,38,-162}，cos()表示求余弦函数。

④-3、将{φ_R(x,y)}中的每个神经元在所有视差区间的响应构成一个向量，将{φ_R(x,y)}中的第i个神经元在所有视差区间的响应构成的向量记为x_i，x_i＝[R_i,1,R_i,2,…,R_i,L]；然后获取{φ_R(x,y)}中的每个神经元在所有视差区间的响应构成的向量经最大池化后得到的特征矢量，将x_i经最大池化后得到的特征矢量记为其中，R_i,1、R_i,2和R_i,L对应表示{φ_R(x,y)}中的第i个神经元在第1个视差区间的响应、在第2个视差区间的响应、在第L个视差区间的响应，和对应表示中的第1个元素的值、第2个元素的值和第L个元素的值，符号“[]”为矢量表示符号。

在此，的获取过程为：利用现有的最大池化方法重新计算x_i中的每个元素的值，将R_i,k经最大池化方法重新计算后得到的值记为然后将x_i中的所有元素各自的值经最大池化方法重新计算后得到的值按顺序排列构成一个特征矢量，记为其中，max()为取最大值函数，和对应表示中的第1个元素的值、第2个元素的值和第L个元素的值，亦表示R_i,1经最大池化方法重新计算后得到的值，亦表示R_i,2经最大池化方法重新计算后得到的值，亦表示R_i,L经最大池化方法重新计算后得到的值。

⑤将F_p和F_a组合成一个新的特征矢量，记为X，X＝[F_p,F_a]，然后将X作为待评价的立体图像的特征矢量，其中，符号“[]”为矢量表示符号，X＝[F_p,F_a]表示将F_p和F_a连接起来形成一个新的特征矢量。

⑥将M副各不相同的立体图像构成一个立体图像集合；然后利用主观质量评价方法获取立体图像集合中的每副立体图像的视觉舒适度的平均主观评分均值，将立体图像集合中的第m副立体图像的视觉舒适度的平均主观评分均值记为MOS_m；再按照步骤①至步骤⑤获取待评价的立体图像的特征矢量X的操作，以相同的方式获取立体图像集合中的每幅立体图像的特征矢量，将立体图像集合中的第m副立体图像的特征矢量记为X_m；其中，M表示立体图像集合中包含的立体图像的幅数，M≥1，1≤m≤M，MOS_m∈[1,5]。

⑦将立体图像集合中的所有立体图像分成训练集和测试集，将训练集中的所有立体图像的特征矢量和视觉舒适度的平均主观评分均值构成训练样本数据集合，将测试集中的所有立体图像的特征矢量和视觉舒适度的平均主观评分均值构成测试样本数据集合；然后采用支持向量回归作为机器学习的方法，对训练样本数据集合中的所有特征矢量进行训练，使得经过训练得到的回归函数值与平均主观评分均值之间的误差最小，拟合得到最优的权重矢量w^opt和最优的偏置项b^opt；接着利用w^opt和b^opt构造得到支持向量回归训练模型；再根据支持向量回归训练模型，对测试样本数据集合中的每个特征矢量进行测试，预测得到测试样本数据集合中的每个特征矢量对应的立体图像的客观视觉舒适度评价预测值，将测试样本数据集合中的第q个特征矢量对应的立体图像的客观视觉舒适度评价预测值记为Q_q，Q_q＝f(X_q)，其中，1≤q≤M-S，S表示训练集中包含的立体图像的幅数，f()为函数表示形式，X_q表示测试样本数据集合中的第q个特征矢量，X_q亦表示测试集中的第q幅立体图像的特征矢量，(w^opt)^T为w^opt的转置矩阵，表示测试样本数据集合中的第q个特征矢量的线性函数；之后通过重新分配训练集和测试集，重新预测得到测试样本数据集合中的每个特征矢量对应的立体图像的客观视觉舒适度评价预测值，经过N次迭代后计算立体图像集合中的每幅立体图像的多个客观视觉舒适度评价预测值的平均值，并将计算得到的平均值作为对应那幅立体图像的最终的客观视觉舒适度评价预测值，其中，N>100。

在此具体实施例中，步骤⑦的具体过程为：

⑦-1、随机选择立体图像集合中的幅立体图像构成训练集，将立体图像集合中剩余的M-S幅立体图像构成测试集，其中，符号“”为向下取整符号。

⑦-2、将训练集中的所有立体图像的特征矢量和视觉舒适度的平均主观评分均值构成训练样本数据集合，记为Ω_S，{X_t,MOS_t}∈Ω_S，其中，X_t表示训练样本数据集合Ω_S中的第t个特征矢量，X_t亦表示训练集中的第t幅立体图像的特征矢量，MOS_t表示训练样本数据集合Ω_S中的第t个视觉舒适度的平均主观评分均值，MOS_t亦表示训练集中的第t幅立体图像的视觉舒适度的平均主观评分均值，1≤t≤S。

⑦-3、构造训练样本数据集合Ω_S中的每个特征矢量的回归函数，将X_t的回归函数记为f(X_t)，其中，f()为函数表示形式，w为权重矢量，w^T为w的转置矩阵，b为偏置项，表示X_t的线性函数，为支持向量回归中的核函数，X_l为训练样本数据集合Ω_S中的第l个特征矢量，1≤l≤S，γ为核参数，在本实施例中取γ＝54，exp()表示以自然基数e为底的指数函数，e＝2.71828183，符号“||||”为求欧式距离符号。

⑦-4、采用支持向量回归作为机器学习的方法，对训练样本数据集合Ω_S中的所有特征矢量进行训练，使得经过训练得到的回归函数值与平均主观评分均值之间的误差最小，拟合得到最优的权重矢量w^opt和最优的偏置项b^opt，将最优的权重矢量w^opt和最优的偏置项b^opt的组合记为(w^opt,b^opt)，然后利用得到的最优的权重矢量w^opt和最优的偏置项b^opt构造支持向量回归训练模型，记为其中，Ψ表示对训练样本数据集合Ω_S中的所有特征矢量进行训练的所有的权重矢量和偏置项的组合的集合，表示取使得最小的w和b的值，X_inp表示支持向量回归训练模型的输入矢量，(w^opt)^T为w^opt的转置矩阵，表示支持向量回归训练模型的输入矢量X_inp的线性函数。

⑦-5、将测试集中的所有立体图像的特征矢量和视觉舒适度的平均主观评分均值构成测试样本数据集合，然后根据支持向量回归训练模型，对测试样本数据集合中的每个特征矢量进行测试，预测得到测试样本数据集合中的每个特征矢量对应的立体图像的客观视觉舒适度评价预测值，将测试样本数据集合中的第q个特征矢量对应的立体图像的客观视觉舒适度评价预测值记为Q_q，Q_q＝f(X_q)，其中，1≤q≤M-S，f()为函数表示形式，X_q表示测试样本数据集合中的第q个特征矢量，X_q亦表示测试集中的第q幅立体图像的特征矢量，表示测试样本数据集合中的第q个特征矢量的线性函数。

在本实施例中，采用宁波大学建立的立体图像数据库作为立体图像集合，该立体图像数据库包含200副立体图像以及对应的右视差图像，该立体图像数据库包含了各种场景深度的室内和室外图像，并给出了每副立体图像的视觉舒适度的平均主观评分均值。

在本实施例中，利用评估图像质量评价方法的4个常用客观参量作为评价指标，即非线性回归条件下的Pearson相关系数(Pearsonlinearcorrelationcoefficient，PLCC)、Spearman相关系数(Spearmanrankordercorrelationcoefficient，SROCC)、Kendall相关系数(Kendallrank-ordercorrelationcoefficient，KROCC)、均方误差(rootmeansquarederror，RMSE)，PLCC和RMSE反映客观评价预测值的准确性，SROCC和KROCC反映其单调性。利用本发明方法计算上述200副立体图像各自的最终的客观视觉舒适度评价预测值，将计算得到的200副立体图像各自的最终的客观视觉舒适度评价预测值做五参数Logistic函数非线性拟合，PLCC、SROCC和KROCC值越高、RMSE值越小说明利用本发明方法得到的客观评价结果与平均主观评分均值的相关性越好。表1给出了采用不同特征矢量得到的客观视觉舒适度评价预测值与平均主观评分均值之间的相关性，从表1中可以看出，只采用部分特征得到的客观视觉舒适度评价预测值与平均主观评分均值之间的相关性均不是最优的，这说明了本发明方法提取的立体图像的特征矢量是有效的，使得得到的客观视觉舒适度评价预测值与平均主观评分均值之间的相关性更强，这足以说明本发明方法是有效的。

表1采用不同特征矢量得到的客观视觉舒适度评价预测与平均主观评分均值之间的相关性

Claims

1.一种立体图像视觉舒适度客观评价方法，其特征在于包括以下步骤：

所述的步骤③的具体过程为：

③-2、利用高斯差分滤波器对{d_R(x,y)}实施滤波操作，得到{d_R(x,y)}的视差对比度图，记为{d_C(x,y)}，将{d_C(x,y)}中坐标位置为(x,y)的像素点的像素值记为d_C(x,y)，

d_{C} (x, y) = h_{σ} (x, y) &CircleTimes; d_{R} (x, y),

其中，

h_{σ} (x, y) = \frac{1}{2 {πσ}^{2}} \exp (- \frac{x^{2} + y^{2}}{2 σ^{2}}) - \frac{1}{2 {πk}^{' 2} σ^{2}} \exp (- \frac{x^{2} + y^{2}}{2 k^{' 2} σ^{2}}),

σ表示高斯差分滤波器的尺度，k'表示高斯差分滤波器的滤波中心与环绕区域的比例，exp()表示以自然基数e为底的指数函数，符号为卷积操作符号；

f_{3} = \frac{1}{d_{m a x}} \times \sqrt{\frac{Σ_{x = 1}^{W} Σ_{y = 1}^{H} S_{s t e r e o} (x, y) \times {(d_{R} (x, y))}^{2}}{Σ_{x = 1}^{W} Σ_{y = 1}^{H} S_{s t e r e o} (x, y)}};

N_{Ω_{p}^{+}} = 0.1 \times (W \times H);

N_{Ω_{p}^{-}} = 0.1 \times (W \times H);

③-8、将f₁、f₂、f₃、f₄、f₅和f₆按顺序进行排列得到{d_R(x,y)}的初级视觉特征矢量，记为F_p，F_p＝[f₁,f₂,f₃,f₄,f₅,f₆]，其中，F_p的维数为6，符号“[]”为矢量表示符号；

所述的步骤④的具体过程为：

④-2、利用13个不同神经元的视差调制函数对{φ_R(x,y)}进行调制操作，得到{φ_R(x,y)}中的不同神经元在不同视差区间的响应，将{φ_R(x,y)}中的第i个神经元在第k个视差区间的响应记为R_i,k，

R_{i, k} = Σ_{x = 1}^{W} Σ_{y = 1}^{H} p (k | φ_{R} (x, y)) \times g_{i} (φ_{R} (x, y)),

其中，1≤i≤13,1≤k≤L，p(k|φ_R(x,y))表示φ_R(x,y)属于第k个视差区间的概率，如果φ_R(x,y)属于第k个视差区间，则p(k|φ_R(x,y))＝1，如果φ_R(x,y)不属于第k个视差区间，则p(k|φ_R(x,y))＝0，g_i(φ_R(x,y))表示第i个神经元的视差调制函数，

g_{i} (φ_{R} (x, y)) = A_{i} \times e^{- 0.5 ({(φ_{R} (x, y) - d_{0}^{i})}^{2} / δ_{i}^{2})} \times c o s (2 {πf}_{i} \times (φ_{R} (x, y) - d_{0}^{i}) + Φ_{i}),

d_{0}^{i} &Element; {- 0.23, - 0.46, 0.15, - 0.11, - 0.04, - 0.16, - 0.02, 0.04, - 0.01, 0.24, 0.81, 1.6, - 0.23},

④-3、将{φ_R(x,y)}中的每个神经元在所有视差区间的响应构成一个向量，将{φ_R(x,y)}中的第i个神经元在所有视差区间的响应构成的向量记为x_i，x_i＝[R_i,1,R_i,2,…,R_i,L]；然后获取{φ_R(x,y)}中的每个神经元在所有视差区间的响应构成的向量经最大池化后得到的特征矢量，将x_i经最大池化后得到的特征矢量记为其中，R_i,1、R_i,2和R_i,L对应表示{φ_R(x,y)}中的第i个神经元在第1个视差区间的响应、在第2个视差区间的响应、在第L个视差区间的响应，和对应表示中的第1个元素的值、第2个元素的值和第L个元素的值，符号“[]”为矢量表示符号；

④-4、计算{d_R(x,y)}的高级视觉特征矢量，记为F_a，F_a＝[r₁,r₂,…,r₁₃]，其中，F_a的维数为13，符号“[]”为矢量表示符号，1≤i≤13，符号“||”为取绝对值符号，表示中的第k个元素的值；

2.根据权利要求1所述的一种立体图像视觉舒适度客观评价方法，其特征在于所述的步骤④-3中的获取过程为：利用最大池化方法重新计算x_i中的每个元素的值，将R_i,k经最大池化方法重新计算后得到的值记为然后将x_i中的所有元素各自的值经最大池化方法重新计算后得到的值按顺序排列构成一个特征矢量，记为其中，max()为取最大值函数，和对应表示中的第1个元素的值、第2个元素的值和第L个元素的值。

3.根据权利要求2所述的一种立体图像视觉舒适度客观评价方法，其特征在于所述的步骤⑦的具体过程为：

⑦-1、随机选择立体图像集合中的幅立体图像构成训练集，将立体图像集合中剩余的M-S幅立体图像构成测试集，其中，符号为向下取整符号；

⑦-3、构造训练样本数据集合Ω_S中的每个特征矢量的回归函数，将X_t的回归函数记为f(X_t)，其中，f()为函数表示形式，w为权重矢量，w^T为w的转置矩阵，b为偏置项，表示X_t的线性函数，D(X_t,X_l)为支持向量回归中的核函数，X_l为训练样本数据集合Ω_S中的第l个特征矢量，1≤l≤S，γ为核参数，exp()表示以自然基数e为底的指数函数，符号“||||”为求欧式距离符号；