CN109446887B

CN109446887B - 一种针对图像质量主观评测的图像场景描述生成方法

Info

Publication number: CN109446887B
Application number: CN201811048210.2A
Authority: CN
Inventors: 廖志梁; 陶亮; 王道宁; 张亚东; 马壮
Original assignee: Yicheng Gaoke Dalian Technology Co ltd
Current assignee: Yicheng Gaoke Dalian Technology Co ltd
Priority date: 2018-09-10
Filing date: 2018-09-10
Publication date: 2022-03-25
Anticipated expiration: 2038-09-10
Also published as: CN109446887A

Abstract

本发明公开了一种针对图像质量主观评测的图像场景描述生成方法，包括：将不同机型拍摄的图片按照场景内容进行分组；为分组后的每组图像生成一段适用于图像场景主观评测需求的场景描述。生成所述场景描述所采用的方法是基于多模型的主观图像场景描述方法。基于多模型的主观图像场景描述方法为每组图像生成一段适用于图像场景主观评测需求的场景描述，具体包括：基于场景环境的场景描述，即描述场景的时间信息和空间信息；基于光源属性的场景描述，即描述场景的光源特性和位置角度；基于目标主体的场景描述，即描述场景中主体类别和主体特性。本发明方法设计先分组再描述的流程，能够降低同组图像多次描述的误差，并提升效率。

Description

一种针对图像质量主观评测的图像场景描述生成方法

技术领域

本发明属于图像质量主观评价领域，可以将拍摄场景相同的图像归于同一组并为每组赋予相同的场景描述。

背景技术

本领域现阶段的图像场景描述流程包括：

1)像质专家预先规定容易出现像质问题的拍摄场景，对场景进行描述；

2)测试人员按照规定的场景使用多种拍摄设备进行数据采集；

3)测试人员手动按场景对图像进行分组；

4)像质专家在对分组图像进行评价之后，结合预定的场景描述结果整理报告。

上述方式能够实现对图像的场景描述，并且已经应用于实际项目中数年，但缺点是：

1)受制于先规定场景再拍摄的流程，场景选择会受专家的主观影响；

2)对测试人员的要求较高，需要充分理解专家制定的拍摄需求；

3)如果专家在评测阶段对图像进行重新描述，需要和测试人员进行场景确认，过程繁琐。

目前的图像质量主观评价流程中的图像分组描述环节主要依靠测试人员和像质专家协同完成。如果先规定场景再进行数据采集，场景选择就会受专家的主观影响。如果先数据采集再描述场景，需要像质专家与测试人员反复确认才能确定描述结果。

发明内容

本发明所要解决的技术问题是针对上述现有技术存在的不足，而提供一种简化流程替代人工的针对图像质量主观评测的图像场景描述生成方法，能实现自动化地图像分组和场景描述。

为解决上述技术问题，本发明采用的技术方案是：

一种针对图像质量主观评测的图像场景描述生成方法，包括以下几步：

将不同机型拍摄的图片按照场景内容进行分组；

为分组后的每组图像生成一段适用于图像场景主观评测需求的场景描述。

生成所述场景描述所采用的方法是基于多模型的主观图像场景描述方法。

将不同机型拍摄的图片按照场景内容进行分组采用的方法是基于内容的图像自动分组方法。

基于内容的图像自动分组方法对不同机型拍摄的图片按照场景内容进行分组的具体步骤是：

a)设定参考机型和对比机型；

b)依次为参考机型的图像赋予不同的场景编号；

c)提取参考机型所有图像的特征构建检索集；

d)使用距离度量的方式找到与对比机型图像场景内容相同的参考机型图像。

其中，距离度量的方式可采用欧氏距离、曼哈顿距离以及夹角余弦等距离度量方式。欧氏距离原理简单，易于说明。

所述步骤c)的详细步骤是：

1)将采集到的图像进行预处理；

2)提取卷积神经网络中某一中间层的参数，作为该图像的特征；

3)将全部图像提取的特征整合成一个矩阵，作为检索集。

所述步骤d)的详细步骤是：

1)提取用于查询的对比机型图片的特征；

2)依次计算检索集中每一行特征与查询图像特征的欧氏距离：

其中，x为查询图像特征，y为检索图像特征；

3)将欧氏距离向量升序排列，找到与查询图像最相似的检索集图像；

4)使查询图像具有和检索结果图像相同的场景ID。

基于多模型的主观图像场景描述方法能够为每组图像生成一段适用于图像场景主观评测需求的场景描述，具体包括：

a)基于场景环境的场景描述，即描述场景的时间信息(例如清晨，正午，傍晚，黑夜)和空间信息(例如室内，室外)，

b)基于光源属性的场景描述，即描述场景的光源特性(例如自然光源，暖光灯，荧光灯)和位置角度(例如顺光，逆光)，

c)基于目标主体的场景描述，即描述场景中主体类别(例如人像，建筑，绿地)和主体特性(例如微距图像)

d)以上若干子问题都可以使用单独的卷积神经网络进行解决(以Alexnet网络为例)，详细步骤是：

1)数据准备，按照不同子问题的需求将测试人员曾经采集的大量图像数据进行手工标注，作为训练集；

2)为每个子问题训练单独的Alexnet模型；

3)使用多模型对测试图像进行预测，得到多个角度下的场景描述结果；

4)通过子问题之间的关联性修正场景描述结果(例如微距图像中主体不可能是人)；

5)最终输出适用于图像场景主观评测需求的场景描述。

本方法能够将多机型的图像按场景自动分组，并且对每组图像进行符合图像场景主观评测需求的场景描述，而且具有更高的效率。

有益效果：

(1)鉴于图像质量主观评测实际项目的数据特殊性(相同场景使用多款机型进行数据采集)，本发明方法设计先分组再描述的流程，能够降低同组图像多次描述的误差，并提升效率。

(2)在图像拍摄过程中，场景环境，光源属性，和图像主体是影响成像质量的三个重要因素。例如不同强度的光照下能暴露不同层次的曝光问题，不同属性的图像主体对焦效果会不同。本发明在最终生成评测报告时，使用三个卷积神经网络模型分别从场景环境、光源属性以及图像主体三个维度进行描述，通过这三个维度生成适用于图像质量主观评价的场景描述，能使后续的主观评测结果更具说服力。

附图说明

图1是本发明方法流程图；

图2室外高亮度场景的人物图像；其中图2a为参考机型(iPhoneX)照片，图2b和图2c为对比机型照片(图2b对应机型为HUAWEI P20，图2c对应机型为MI8)；

图3为室内中高亮度暖色光场景的微距图像，其中图3a为参考机型(iPhoneX)照片，图3b和图3c为对比机型照片(图2b对应机型为HUAWEI P20，图2c对应机型为MI8)；

图4为室外中亮度黑夜场景的景物图像；其中图4a为参考机型(iPhoneX)照片，图4b和图4c为对比机型照片(图2b对应机型为HUAWEI P20，图2c对应机型为MI8)。

具体实施方式

下面结合附图，对本发明作详细说明：

假定参考机型为iPhoneX，对比机型为HUAWEI P20，MI8，数据采集100组，不同机型的数据存放在不同的文件夹内。

如图1所示，本发明一种针对图像质量主观评测的图像场景描述生成方法，包括两大步骤：

步骤一、将不同机型拍摄的图片按照场景内容进行分组；

步骤二、为分组后的每组图像生成一段适用于图像场景主观评测需求的场景描述。

步骤一将不同机型拍摄的图片按照场景内容进行分组具体方法如下：

1.对iPhoneX机型对应文件夹内的所有图像提取特征，得到100*512的矩阵，作为检索集，特征维数为512。提取图像特征的方法可采用卷积神经网络模型或传统特征提取方法，传统特征提取方法如HOG特征，SIFT特征。

2.选择对比机型的一张图片作为查询图像，提取特征(方法同步骤1)；

3.计算查询图像与检索集每行特征的距离；

4.将查询图像分配给距离最小的图像所在的组中，同组图像共享描述；

5.重复步骤2-4直至所有对比机型图像完成分组。

步骤二的具体方法包括：

6.选择一组图片(以图2所示图片为例)中iPhoneX所拍摄的图像作为输入；

7.将预处理后的图像导入多个图像场景描述模型中，得到针对场景环境，光源属性，目标主体三个子问题的描述：室外&白天；非夕阳&高亮度；人&建筑&草地&天空&道路；

8.通过子问题之间的关联性修正场景描述结果：室外；高亮度；人&建筑&草地&天空&道路；其中，子问题之间的关联性包括微距图像中主体不可能是人、夜景图像不考虑微距情况、夜景图像不考虑光源属性、室内图像不考虑测光和阴影情况(光源位置角度)等。非夕阳/白天无需特殊说明。

9.生成场景描述：图片为：室外高亮度场景的人物图像，具体场景描述包括建筑，草地，天空和道路。

10.重复6-9步骤直至所有组都获得了场景描述。

对图3和图4所示的图片分别按照上述6-9步骤进行处理，得到图3图片为：室内中高亮度暖色光场景的微距图像，具体场景描述包括大面积红色；得到图4图片为室外中亮度黑夜场景的景物图像，具体场景描述包括建筑和天空。

Claims

1.一种针对图像质量主观评测的图像场景描述生成方法，其特征在于，包括：

将不同机型拍摄的图片按照场景内容进行分组；

为分组后的每组图像生成一段适用于图像场景主观评测需求的场景描述；

生成所述场景描述所采用的方法是基于多模型的主观图像场景描述方法；

基于多模型的主观图像场景描述方法为每组图像生成一段适用于图像场景主观评测需求的场景描述，具体包括：

a)基于场景环境的场景描述，即描述场景的时间信息和空间信息；

b)基于光源属性的场景描述，即描述场景的光源特性和位置角度；

基于目标主体的场景描述，即描述场景中主体类别和主体特性；

所述基于多模型的主观图像场景描述方法，详细步骤是：

1)数据准备：按照不同场景描述的需求，将测试人员曾经采集的大量图像数据进行手工标注，作为训练集；

2)为每个需求训练单独的卷积神经网络模型；

3)使用不同需求下的卷积神经网络模型对测试图像进行预测，得到多个不同需求下的场景描述结果；

4)通过不同需求之间的关联性修正场景描述结果；

5)最终输出适用于图像场景主观评测需求的场景描述。

2.根据权利要求1所述的图像场景描述生成方法，其特征在于：描述场景的时间信息包括清晨、正午、傍晚或黑夜；描述场景的空间信息包括室内或室外；描述场景的光源特性包括自然光源、暖光灯或荧光灯；描述场景的位置角度包括顺光或逆光；所述主体类别包括人像、建筑或绿地；所述主体特性包括微距图像。

3.根据权利要求1所述的图像场景描述生成方法，其特征在于：将不同机型拍摄的图片按照场景内容进行分组采用的方法是基于内容的图像自动分组方法。

4.根据权利要求3所述的图像场景描述生成方法，其特征在于：基于内容的图像自动分组方法对不同机型拍摄的图片按照场景内容进行分组的具体步骤是：

a)设定参考机型和对比机型；

b)依次为参考机型的图像赋予不同的场景编号；

c)提取参考机型所有图像的特征构建检索集；

5.根据权利要求4所述的图像场景描述生成方法，其特征在于：所述步骤c)的详细步骤是：

1)将采集到的图像进行预处理；

3)将全部图像提取的特征整合成一个矩阵，作为检索集。

6.根据权利要求4所述的图像场景描述生成方法，其特征在于：所述步骤d)的详细步骤是：

1)提取用于查询的对比机型图片的特征；

其中，x为查询图像特征，y为检索图像特征，N为特征维数，下标i表示当前提取第i维特征用于计算，d表示查询图像和检索图像的距离；

4)使查询图像具有和检索结果图像相同的场景ID。

7.根据权利要求4所述的图像场景描述生成方法，其特征在于：所述步骤1)中的预处理为尺度变换或归一化。