学术图片信息量评价的量化方法
技术领域
本发明涉及数字图像处理技术领域,尤其涉及一种基于视觉信息的针对学术图片的信息量评价的量化方法。
背景技术
在海量的图片中,不同的图片承载不同的知识与信息,且所承载的知识与信息的量也不同,需要一种评价方法,可以对图像所承载的知识与信息的量进行度量,根据度量结果对海量图片进行筛选,获得有意义的图片,提过人获取信息与知识的效率,最有效的图片信息量的评价与量化,是人的主观评价与量化,但人的主观评价过程繁琐,稳定性差,效率低,不适合对于海量数据的处理,在实际中难以大规模应用,因此,需要一种客观的图片信息量评价算法可以近似人的主观评价结果。
传统的信息量计算方法,主要采用采用微分的零交叉点定义了信息度量,这是根据Marr计算理论,图像中的信息就是图像中可以提供给人们关于图像中存在“物体”和这些物体的关系以及与人的关系等要素,且这些要素是通过空间上颜色的变化呈现出来的。所采用的计算公式如下(用Pm,n表示图像P的第(m,n)个像素的像素值):
Φ1(P)={(m,n):1<m<M,1<n<N;
(Pm,n-Pm-1,n)(Pm,n-Pm+1,n)>0;
(Pm,n-Pm,n-1)(Pm,n-Pm,n+1)>0;
(Pm,n-Pm-1,n-1)(Pm,n-Pm+1,n+1)>0;
(Pm,n-Pm+1,n-1)(Pm,n-Pm-1,n+1)>0;}
Φ2(P)={(m,n):2<m<M-1,2<n<N-1;
((Pm+1,n-Pm-1,n)-(Pm+2,n-Pm,n))×((Pm+1,n-Pm-1,n)-(Pm,n-Pm-2,n))>0;
((Pm,n+1-Pm,n-1)-(Pm,n+2-Pm,n))×((Pm,n+1-Pm,n-1)-(Pm,n-Pm,n-2))>0;
((Pm+1,n+1-Pm-1,n-1)-(Pm+2,n+2-Pm,n))×((Pm+1,n+1-Pm-1,n-1)-(Pm,n-Pm-2,n-2))>0;
((Pm+1,n-1-Pm-1,n+1)-(Pm+2,n-2-Pm,n))×((Pm+1,n-1-Pm-1,n+1)-(Pm,n-Pm-2,n+2))>0;}
图像P的信息量IP=|Φ1(P)|+|Φ2(P)|。
显然,此种方法适用于通过颜色、灰度、亮度变化表现图像中物体与物体间的关系的图像,如照片等通过成像设备生成的图像,并不适用于通过简单线条勾勒出图形表示物体,由图形间相对位置以及图形间的特殊符号表示物体间的关系的图像,如曲线图、示意图等人工绘制出的图像,因为在这种图像中,相对于图像像素点的总数,灰度值变化明显的点的个数较少,大部分区域为背景区域,背景区域灰度值等于常数,而采用采用微分的零交叉点定义的信息度量,对灰度值等于常数的图像,计算信息量为零,所以这种信息度量对于类似于人工绘制出的图像计算所得的信息量值往往较低,并不能如实反映图片所带的信息量。
在学术图片中,存在大量的由简单线条勾勒的图像,因此需要设计出一种专门针对这种图片的信息量度量算法,同时,有较高的处理效率,适用于海量数据的处理。
将大段文字以图片的形式传播时,图片中文字量与图片所承载的信息量成正比,因此可以使用带有不同数量的文字的图片对信息量算法的结果进行验证,对文字较多的图片,信息量算法的计算结果也应较大。
发明内容
为解决上述中存在的问题与缺陷,本发明提供了一种学术图片信息量评价的量化方法。所述技术方案如下:
学术图片信息量评价的量化方法,所述方法包括:
A检测图片边缘,得到图片二值化图像;
B在边缘二值化图像中查找轮廓;
C计算所有轮廓外接矩形的面积的和及轮廓个数;
D根据轮廓个数,确定面积和乘以奖励因子或乘以惩罚因子;
E将所得轮廓面积和,进行归一化;
F对满足惩罚条件的轮廓面积和归一化结果乘以一个小于1的惩罚因子,所得结果为图片信息量。
本发明提供的技术方案的有益效果是:
本发明综合考虑了图片内容的丰富程度,图片的视觉复杂性,图片内对象的大小、个数,图片大小等多个因素,使得针对于学术图片计算得的信息量量化结果更好的反映了此类图片所承载的信息量。具有如下特点:
原理简单、明确,易于实现;
依据图像内对象的形状、大小、个数进行统计的策略,较好的克服了传统图像信息量度量方法的不足,即对不主要依靠灰度变化反映信息的图像有较好的评估度量能力;
实现方法的时间复杂度较小,适用于海量数据的处理。
附图说明
图1是学术图片信息量评价的量化方法流程图;
图2是学术图片信息量评价的量化方法具体流程图;
图3、图4、图5、图6、图7和图8为示例图像图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述:
参见图1,为学术图片信息量评价的量化方法流程,所述方法包括以下步骤:
步骤10检测图片边缘,得到图片二值化图像;
步骤20在边缘二值化图像中查找轮廓;
步骤30计算所有轮廓外接矩形的面积的和及轮廓个数;
步骤40根据轮廓个数,确定面积和乘以奖励因子或乘以惩罚因子;
步骤50将所得轮廓面积和,进行归一化;
步骤60对满足惩罚条件的轮廓面积和归一化结果乘以一个小于1的惩罚因子,所得结果为图片信息量。
所述轮廓包括外轮廓和内轮廓。
如图2所示,上述学术图片信息量评价的量化方法具体包括:
装载图片,并对图片边缘检测,得到边缘二值化图像;
在边缘二值化图像中查找轮廓;
提取所有轮廓,包括连同域的外围边界,洞的内层边界,即外轮廓和内轮廓。
得到轮廓,并计算所有轮廓外接矩形面积超过一定阈值的轮廓轮廓包围面积的和,以过滤掉质量不好的图片中的噪声;然后计算所有轮廓外接矩形的面积超过一定阈值的轮廓个数。
判断轮廓面积是否大于面积阈值;如果轮廓面积大于面积阈值,则对轮廓面积累加,累加个数+1;否则,判断是否处理完所有轮廓,如果没有处理完毕,则继续得到轮廓;如果处理完毕,则判断轮廓个数是否小于惩罚阈值如果是,轮廓面积和乘以一个小于1的惩罚因子,否则,判断轮廓个数是否大于奖励阈值,如果是,轮廓面积和乘以一个大于1的奖励因子;否则将所得轮廓面积和除以图片面积,进行归一化。
判断图片面积是否小于惩罚阈值,如果是,则对归一化轮廓面积和乘以一个小于1的惩罚因子,得到信息量;否则,判断图片面积是否大于奖励阈值,如果是,则对归一化轮廓面积和乘以一个大于1的奖励因子,得到信息量;否则直接得到信息量。
上述轮廓个数小于一定阈值时,表明图形的复杂度较低,因此,轮廓面积和乘以一个小于1的惩罚因子;轮廓个数大于一定阈值时,表明图像的复杂度较高,因此,轮廓面积和乘以一个大于1的奖励因子。
上述图片面积小于一定阈值时,表明图像过小,足以对图片质量造成影响,因此,对进行归一化轮廓面积和乘以一个小于1的惩罚因子。
如图3、图4、图5和图6所示,为学术图片通过现有方法和本实施例提供方法的实验对比结果;如表1所示:
表1
测试图片 |
现有方法所得信息量 |
本实施例方法所得信息量 |
图3 |
0.089352 |
1.103438 |
图4 |
0.533723 |
2.627805 |
图5 |
0.150576 |
0.858899 |
图6 |
0.346134 |
1.160016 |
从上述结果可以看出,现有的非平凡点计算信息量的方法对由简单线条组成的图片所得结果值普遍偏低,并不能代表图片中的信息量,而本实施例所采用方法,对线条形状敏感,更适用于由简单线条组成的图片,所得结果更能反映图片中的信息量。
实用带有不同数量的文字段落的图片对本实施例提供的算法的结果进行了验证,图7和图8图片大小相同,图7中文字较图8中文字少,图7计算所得的信息量为0.399136,图8中计算所得的信息量为0.674119,计算结果与实际信息量大小相一致。
通过上述实施例可以看出,本实施例提供的的方法更适用于学术图片这类图像,更能反映图片所承载信息的多少。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。