CN102663682A - 基于感兴趣区域的自适应图像增强方法 - Google Patents

基于感兴趣区域的自适应图像增强方法 Download PDF

Info

Publication number
CN102663682A
CN102663682A CN2012100651041A CN201210065104A CN102663682A CN 102663682 A CN102663682 A CN 102663682A CN 2012100651041 A CN2012100651041 A CN 2012100651041A CN 201210065104 A CN201210065104 A CN 201210065104A CN 102663682 A CN102663682 A CN 102663682A
Authority
CN
China
Prior art keywords
asad
area
interest
value
pixel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012100651041A
Other languages
English (en)
Other versions
CN102663682B (zh
Inventor
喻莉
夏珍
邓慧萍
钟刚
冯慧
王亮红
陈玲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huazhong University of Science and Technology
Original Assignee
Huazhong University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huazhong University of Science and Technology filed Critical Huazhong University of Science and Technology
Priority to CN201210065104.1A priority Critical patent/CN102663682B/zh
Publication of CN102663682A publication Critical patent/CN102663682A/zh
Application granted granted Critical
Publication of CN102663682B publication Critical patent/CN102663682B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明提出了一种基于感兴趣区域的自适应图像增强方法,包括:读取当前帧图像,并判断帧图像的宏块是否是感兴趣区域,若宏块是感兴趣区域,则利用ASAD算法对感兴趣区域每一个像素点进行计算,以得到感兴趣区域内所有像素点的ASAD值,并通过ASAD值得到ASAD灰度图,对ASAD灰度图进行增强处理,以得到自适应阈值,将自适应阈值和ASAD值进行比较,以得到ASAD掩模图,根据ASAD掩模图对感兴趣区域中的对应标记点进行高斯高通滤波,以得到自适应增强的感兴趣区域,对感兴趣区域和非感兴趣区域的边界进行降质处理。本发明使高频细节在不同帧图像中都得到适当的增强,从而可获得最佳的增强效果。

Description

基于感兴趣区域的自适应图像增强方法
技术领域
本发明涉及多媒体信号处理领域,具体涉及一种基于感兴趣区域的自适应图像增强方法。
背景技术
现有的视频编码技术(如H.264/AVC)虽然可以达到较高的压缩比,获得相对较好的压缩效率,但是当其运用于手机视频通信、桌面即时视频等低码率要求的应用场景中时,往往会由于码率要求过低造成图像/视频主观质量下降,特别是在人眼比较敏感的脸部区域会出现模糊,方块等效应,严重影响视频质量。
为了改善和提升低码率或带宽受限应用中图像/视频主观质量,视频质量增强预处理是一种通用且有效的技术手段。这种方法常常是将图像增强和人眼视觉特性结合起来,首先通过检测视频中的感兴趣区域(Region of Interest,简称ROI,在视频中通常将人脸定为感兴趣区域),将视频中感兴趣区域设为感兴趣区域,非感兴趣区域设为非感兴趣区域,对感兴趣区域和非感兴趣区域分别采用不同的增强方案,对感兴趣区域采用突出高频和细节的图像增强方法,对非感兴趣区域则采用轻微的模糊处理,采用高斯低通滤波方法来平滑改区域的高频信息,从而达到提升视频主观质量的目的。
虽然上述方法对单幅图像处理效果较好,但当其应用于视频主观质量增强中,会存在如下问题:视频是由连续变化的不同帧图像组成的,每帧图像中感兴趣区域需要增强的强度都不同,当上述方法连续处理不同帧图像时,会出现某些帧边缘增强过度和某些帧边缘增强过弱,从而不能自适应的调整对不同图像的增强强度。
发明内容
本发明的目的在于提供一种基于感兴趣区域的自适应图像增强方法,其使高频细节在不同帧图像中都得到适当的增强,并可以针对不同应用场景、不同的视频内容,依据图像内容自适应调整增强阈值,从而获得最佳的增强效果。
本发明是通过以下技术方案实现的:
一种基于感兴趣区域的自适应图像增强方法,包括以下步骤:
(1)读取当前帧图像,并判断帧图像的宏块是否是感兴趣区域,若宏块是感兴趣区域,则转入步骤(2),若宏块是非感兴趣区域,则转入步骤(6);
(2)利用ASAD算法对感兴趣区域每一个像素点进行计算,以得到感兴趣区域内所有像素点的ASAD值,并通过ASAD值得到ASAD灰度图;
(3)对ASAD掩膜图进行自适应增强处理,以得到自适应阈值Th;
(4)将自适应阈值Th和ASAD值进行比较,以得到ASAD掩模图,具体包括:
(4-1)判断ASAD图中第一个像素点的ASAD值是否大于或等于像素点的自适应阈值Th,如果ASAD值大于或等于自适应阈值Th,则转入步骤(4-2),否则转入步骤(4-3);
(4-2)将ASAD图中像素点的ASAD值赋值为1,帧图像的感兴趣区域中对应的像素点是边界点,且边界点作为标记点,然后转入步骤(4-4);
(4-3)将ASAD图中像素点的ASAD值赋值为0;
(4-4)对于ASAD图中的所有像素点,重复上述步骤(4-1)至(4-3),直到所有像素点都处理完毕为止;
(4-5)通过标记点得到ROI区域的ASAD掩模图;
(5)根据掩模图对感兴趣区域中的对应标记点进行高斯高通滤波,以得到自适应增强的感兴趣区域,然后转入步骤(7);
(6)对非感兴趣区域进行高斯低通滤波;
(7)对感兴趣区域和非感兴趣区域的边界进行降质处理;
(8)进入到下一帧图像,并重复执行上述步骤(1)至(7),直到所有帧图像都处理完毕为止。
与传统的图像增强或结合人眼视觉特性增强的方法相比,本发明具有以下的优点和技术效果:
1、本发明充分考虑了视频自身连续特性以及自适应的调整增强策略;
2、本发明利用人眼视觉的特性,对每一帧图像的感兴趣区域进行有针对性的增强,并适应视频通信中人眼的观察,有效消除了传统图像增强使部分区域失真的现象,因此本发明利用每一帧图像感兴趣区域中高频点的数目大小严格控制滤波点的多少。
附图说明
图1是本发明基于感兴趣区域的自适应图像增强方法的流程图。
图2(a)和(d)是采用传统的H.264编码方法得到的图像。
图2(b)和(e)是采用传统的图像增强方法结合H.264编码方法得到的图像。
图2(c)和(f)是采用本发明的方法结合H.264编码方法得到的图像。
具体实施方式
以下首先对本发明的技术术语进行解释和说明:
宏块:英文为Macroblock,是视频编码技术中的一个基本概念。在视频编码中,一个编码图像通常划分成若干宏块组成,亮度宏块为16x16大小的像素块。
掩膜图:英文为Masked Picture,对一帧图像做处理时,以此掩模图的标记为准,对帧图像中对应点做处理。
下面结合附图对本发明的技术方案作进一步的描述。
如图1所示,本发明基于感兴趣区域的自适应图像增强方法包括以下步骤:
(1)读取当前帧图像,并判断帧图像的宏块是否是感兴趣区域(Region Of Interest,简称ROI),若宏块是感兴趣区域,则转入步骤(2),若宏块是非感兴趣区域,则转入步骤(6);由于本发明主要针对桌面视频、视频通话等应用场景,实时性要求很高,故感兴趣区域检测采用肤色特性对宏块进行初步的判断和标记,然后利用数字形态学和滤波的方法对标记宏块进一步处理,以提高检测的精确度,实验表明,该方法不仅复杂度很低而且检测到的感兴趣区域的准确度很高;
(2)利用绝对差的平均和(Average Sum of Absolute Difference,简称ASAD)算法对感兴趣区域每一个像素点进行计算,以得到该感兴趣区域内所有像素点的ASAD值,并通过ASAD值得到ASAD灰度图;具体而言,ASAD算法如下:
ASAD = Σ m = 0 , n = 0 m = M , n = N [ I ( x , y ) - I ( x + m , y + n ) ] MN - 1
其中I(x,y)是感兴趣区域中坐标为(x,y)的像素点的亮度值,m、n是计数变量,M、N是大小为M*N的模板。
由计算得到的感兴趣区域的ASAD值可得到ASAD的灰度图。整个区域的灰度特点是平坦区域的ASAD值较小,高频边界区域的ASAD值都较大,而介于边界和平坦区域的纹理区则介于两者之间,因此利用这一特性,可以实现高频信息的主动选择,以及自适应的图像增强;
(3)对ASAD灰度图进行自适应增强处理,以得到自适应阈值Th;由于视频是由连续变化的不同场景的图像组成的,因此单一的图像增强算法无法满足视频编码中的要求。本步骤具体为:首先累积出ASAD灰度图中ASAD值大于3的像素点的数量,即计算出纹理区和边界区的像素点总数,用该数量乘以0.5的系数后所得到的数值作为自适应阈值Th的评价标准,根据累积分布函数,统计ASAD值的累积分布区间,当ASAD灰度图中像素值大于某一数值的ASAD值的累积分布和评价标准相比较,前者大于后者时,则该数值即为所求的自适应阈值Th。
根据纹理区和边界区的总数多少是由感兴趣区域的复杂程度决定的,因此该阈值可以根据不同帧图像的复杂程度来决定图像增强的强度,而乘以0.5的系数是经过尝试不同系数试验后得到的、人眼对感兴趣区域增强的最舒适强度;
(4)将自适应阈值Th和ASAD值进行比较,得到ASAD掩模图;
(4-1)判断ASAD图中第一个像素点的ASAD值是否大于或等于该像素点的自适应阈值Th,如果ASAD值大于或等于自适应阈值Th,则转入步骤(4-2),否则转入步骤(4-3);
(4-2)将ASAD图中该像素点的ASAD值赋值为1,并转入步骤(4-4);当ASAD值为1时,表明帧图像感兴趣区域中对应的该像素点是边界点,该边界点作为标记点;
(4-3)将ASAD图中该像素点的ASAD值赋值为0,表明帧图像感兴趣区域中对应的该像素点是非边界点;
(4-4)对于ASAD图中的所有像素点,重复上述步骤(4-1)至(4-3),直到所有像素点都处理完毕为止;
(4-5)通过标记点得到ROI区域的ASAD掩模图;
(5)根据得到的标记图,对感兴趣区域中对应标记点进行高斯高通滤波,得到自适应增强的感兴趣区域,然后转入步骤(8);具体而言,主要是对感兴趣区域中的边界进行增强,提升其主观质量,高斯高通模板只作用于被标记的帧图像中的像素点。高斯高通滤波模板为:
M = 0 - 1 0 - 1 5 - 1 0 - 1 0
(6)对非感兴趣区域进行高斯低通滤波;具体而言,非感兴趣区域是人眼不感兴趣区域,对该区域进行一定的平滑处理,利用高斯低通滤波减弱高频信息,有利于视频传输,而且不会使主观质量发生明显失真。高斯低通滤波模板为:
M = 1 2 1 2 4 2 1 2 1
(7)对感兴趣区域和非感兴趣区域的边界进行降质处理;具体而言,在感兴趣区域和非感兴趣区域都处理完后,感兴趣区域和非感兴趣区域不同的滤波方案,使感兴趣区域和非感兴趣区域边界存在明显差异。利用处理前的图像分别与感兴趣区域和非感兴趣区域的相关性,取各部分在离边界的距离作为权重进行降质处理,从而使边界区域得到很好的过度。
边界降质算法如下所示:
Z k = W nR I nR ( x , y ) + W in I ( x , y ) + W R I R ( x , y ) W nR + W in + W R
其中Zk是坐标为(x,y)的像素点降质后的像素值,WnR+Win+WR=1,0≤(WnR,Win,WR)≤1,WnR是非感兴趣区域权值,InR(x,y)是非感兴趣区域中坐标为(x,y)的像素点的像素值,Win是输入图像的权值,I(x,y)是原始图像中坐标为(x,y)的像素点的像素值,WR是感兴趣区域的权值,IR(x,y)是感兴趣区域中坐标为(x,y)的像素点的像素值。这样,是边界区域得到了很好的过度。
(8)进入到下一帧图像,并重复执行上述步骤(1)至(7),直到所有帧图像都处理完毕为止。
如图2所示,将本发明的方法和传统的图像增强方法进行比较,做了一系列的对比试验,具体测试条件如下:试验选取摄像头采集的序列boy_little和meilijian_large序列,均为300帧,固定码率为150kbps,帧率为25f/s。
在图2的实验结果中,(a)、(b)、(c)分别为boy_little序列基于H.264的不采用图像增强编码的结果、在H.264编码框架上传统的图像增强的结果和在H.264编码框架上基于感兴趣区域的自适应视频增强的结果。图2中的(d)、(e)、(f)分别为meilijian_large序列采用上述三种编码方案的结果。从以上两组结果可以得出如下结论:传统的图像增强方法的主观质量在H.264的基础上都有较大的提升,特别是人脸感兴趣区域较为清晰。本发明在上述方案的基础上增加了自适应增强方案,从而有效的避免了图(b)和图(e)中轮廓出现过增强的现象。相对于其他图像增强方法,本发明着重提升感兴趣区域的主观质量,并采用自适应方法使该方案适应了视频场景不断变化的要求,且适用于低码率的情况。

Claims (1)

1.一种基于感兴趣区域的自适应图像增强方法,其特征在于,包括以下步骤:
(1)读取当前帧图像,并判断所述帧图像的宏块是否是感兴趣区域,若所述宏块是感兴趣区域,则转入步骤(2),若所述宏块是非感兴趣区域,则转入步骤(6);
(2)利用ASAD算法对所述感兴趣区域每一个像素点进行计算,以得到所述感兴趣区域内所有像素点的ASAD值,并通过所述ASAD值得到ASAD灰度图;
(3)对所述ASAD掩膜图进行自适应增强处理,以得到自适应阈值Th;
(4)将所述自适应阈值Th和所述ASAD值进行比较,以得到ASAD掩模图,具体包括:
(4-1)判断所述ASAD图中第一个像素点的ASAD值是否大于或等于所述像素点的自适应阈值Th,如果所述ASAD值大于或等于所述自适应阈值Th,则转入步骤(4-2),否则转入步骤(4-3);
(4-2)将所述ASAD图中所述像素点的ASAD值赋值为1,
所述帧图像的感兴趣区域中对应的所述像素点是边界点,且所述边界点作为标记点,然后转入步骤(4-4);
(4-3)将所述ASAD图中所述像素点的ASAD值赋值为0;
(4-4)对于所述ASAD图中的所有像素点,重复上述步骤
(4-1)至(4-3),直到所有像素点都处理完毕为止;
(4-5)通过所述标记点得到ROI区域的ASAD掩模图;
(5)根据所述掩模图对所述感兴趣区域中的对应标记点进行高斯高通滤波,以得到自适应增强的感兴趣区域,然后转入步骤(7);
(6)对所述非感兴趣区域进行高斯低通滤波;
(7)对所述感兴趣区域和所述非感兴趣区域的边界进行降质处理;
(8)进入到下一帧图像,并重复执行上述步骤(1)至(7),直到所有帧图像都处理完毕为止。
CN201210065104.1A 2012-03-13 2012-03-13 基于感兴趣区域的自适应图像增强方法 Active CN102663682B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210065104.1A CN102663682B (zh) 2012-03-13 2012-03-13 基于感兴趣区域的自适应图像增强方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210065104.1A CN102663682B (zh) 2012-03-13 2012-03-13 基于感兴趣区域的自适应图像增强方法

Publications (2)

Publication Number Publication Date
CN102663682A true CN102663682A (zh) 2012-09-12
CN102663682B CN102663682B (zh) 2015-06-03

Family

ID=46773161

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210065104.1A Active CN102663682B (zh) 2012-03-13 2012-03-13 基于感兴趣区域的自适应图像增强方法

Country Status (1)

Country Link
CN (1) CN102663682B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104599230A (zh) * 2015-01-16 2015-05-06 腾讯科技(深圳)有限公司 视觉焦点显示方法及装置
CN105163125A (zh) * 2015-06-19 2015-12-16 美国掌赢信息科技有限公司 一种即时视频的编码方法和电子设备
CN106295587A (zh) * 2016-08-16 2017-01-04 块互动(北京)科技有限公司 一种视频感兴趣区域快速标定方法与装置
CN106264467A (zh) * 2016-08-10 2017-01-04 河南埃尔森智能科技有限公司 一种多功能双红外血管显像仪及其显像方法
CN106778751A (zh) * 2017-02-20 2017-05-31 迈吉客科技(北京)有限公司 一种非面部roi识别方法及装置
US11640655B2 (en) 2021-04-14 2023-05-02 Raytheon Company Systems and methods for image turbulence correction of moving targets

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW200952492A (en) * 2008-06-05 2009-12-16 Univ Nat Cheng Kung Method for determining size of adaptive window applied in motion estimation and application thereof
CN101742324A (zh) * 2008-11-14 2010-06-16 北京中星微电子有限公司 视频编解码方法、视频编解码系统及编解码器
WO2010107411A1 (en) * 2009-03-17 2010-09-23 Utc Fire & Security Corporation Region-of-interest video quality enhancement for object recognition
US8009203B2 (en) * 2008-09-24 2011-08-30 Samsung Techwin Co., Ltd. Digital photographing apparatus, tracking method, and recording medium having recorded thereon a program for executing the tracking method

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW200952492A (en) * 2008-06-05 2009-12-16 Univ Nat Cheng Kung Method for determining size of adaptive window applied in motion estimation and application thereof
US8009203B2 (en) * 2008-09-24 2011-08-30 Samsung Techwin Co., Ltd. Digital photographing apparatus, tracking method, and recording medium having recorded thereon a program for executing the tracking method
CN101742324A (zh) * 2008-11-14 2010-06-16 北京中星微电子有限公司 视频编解码方法、视频编解码系统及编解码器
WO2010107411A1 (en) * 2009-03-17 2010-09-23 Utc Fire & Security Corporation Region-of-interest video quality enhancement for object recognition

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
《2011 Fourth International Conference on Intelligent Computation Technology and Automation》 20111231 Liu Zhulong et al. "Passive Detection of Copy-paste Tampering for Digital Image Forensics" 649-652 1 , *
《IEEE Transactions on Consumer Electronics》 20101130 Homin Kwon et al. "New Video Enhancement Preprocessor Using the Region-Of-Interest for the Videoconferencing" 2644-2648 1 第56卷, 第4期 *
HOMIN KWON ET AL.: ""New Video Enhancement Preprocessor Using the Region-Of-Interest for the Videoconferencing"", 《IEEE TRANSACTIONS ON CONSUMER ELECTRONICS》, vol. 56, no. 4, 30 November 2010 (2010-11-30), pages 2644 - 2648 *
LIU ZHULONG ET AL.: ""Passive Detection of Copy-paste Tampering for Digital Image Forensics"", 《2011 FOURTH INTERNATIONAL CONFERENCE ON INTELLIGENT COMPUTATION TECHNOLOGY AND AUTOMATION》, 31 December 2011 (2011-12-31), pages 649 - 652 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104599230A (zh) * 2015-01-16 2015-05-06 腾讯科技(深圳)有限公司 视觉焦点显示方法及装置
CN105163125A (zh) * 2015-06-19 2015-12-16 美国掌赢信息科技有限公司 一种即时视频的编码方法和电子设备
CN106264467A (zh) * 2016-08-10 2017-01-04 河南埃尔森智能科技有限公司 一种多功能双红外血管显像仪及其显像方法
CN106264467B (zh) * 2016-08-10 2023-05-23 河南埃尔森智能科技有限公司 一种多功能双红外血管显像仪及其显像方法
CN106295587A (zh) * 2016-08-16 2017-01-04 块互动(北京)科技有限公司 一种视频感兴趣区域快速标定方法与装置
CN106778751A (zh) * 2017-02-20 2017-05-31 迈吉客科技(北京)有限公司 一种非面部roi识别方法及装置
WO2018149350A1 (zh) * 2017-02-20 2018-08-23 迈吉客科技(北京)有限公司 一种非面部roi识别方法及装置
CN106778751B (zh) * 2017-02-20 2020-08-21 迈吉客科技(北京)有限公司 一种非面部roi识别方法及装置
US11640655B2 (en) 2021-04-14 2023-05-02 Raytheon Company Systems and methods for image turbulence correction of moving targets

Also Published As

Publication number Publication date
CN102663682B (zh) 2015-06-03

Similar Documents

Publication Publication Date Title
CN102663682B (zh) 基于感兴趣区域的自适应图像增强方法
CN102271254B (zh) 一种深度图像的预处理方法
KR101437195B1 (ko) 코딩된 화상 및 영상에서 블록 아티팩트 검출
CN105046677B (zh) 一种用于交通视频图像的增强处理方法和装置
US9183617B2 (en) Methods, devices, and computer readable mediums for processing a digital picture
CN101184221A (zh) 基于视觉关注度的视频编码方法
CN102119401B (zh) 用于带状伪像检测的方法和设备
CN109584185B (zh) 图像处理方法
CN102521813B (zh) 基于双平台直方图的红外图像自适应增强方法
CN110062234B (zh) 一种基于区域恰可察觉失真的感知视频编码方法
CN101123682B (zh) 可减少图像振铃噪声的方法、装置及集成电路
CN102722871A (zh) 一种快速有效的图像增强方法
CN101325711A (zh) 基于时空掩盖效应的自适应码率控制方法
CN103295191A (zh) 多尺度视觉自适应图像增强方法及评价方法
CN103714520A (zh) 基于fpga实现数字视频图像增强系统及其方法
CN104221361A (zh) 视频处理装置、视频处理方法、电视接收机、程序及记录介质
CN104469386A (zh) 一种基于dof的恰可察觉误差模型的感知立体视频编码方法
CN103700121A (zh) 一种复合图像的压缩方法及装置
WO2017004889A1 (zh) 基于jnd因子的超像素高斯滤波预处理方法
CN101431606A (zh) 一种基于边缘检测的自适应降噪处理方法
CN106604029A (zh) 一种基于hevc的运动区域检测的码率控制方法
CN109859138A (zh) 一种基于人眼视觉特性的红外图像增强方法
CN102685491B (zh) 一种实现视频编码的方法和系统
CN104270634B (zh) 一种质量自适应的无线视频编码方法
CN104079934B (zh) 一种实时视频通信中的感兴趣区域提取方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant