CN113869363B - 一种基于图像评价网络和图像评价函数的爬山调焦搜索方法 - Google Patents

一种基于图像评价网络和图像评价函数的爬山调焦搜索方法 Download PDF

Info

Publication number
CN113869363B
CN113869363B CN202110975863.0A CN202110975863A CN113869363B CN 113869363 B CN113869363 B CN 113869363B CN 202110975863 A CN202110975863 A CN 202110975863A CN 113869363 B CN113869363 B CN 113869363B
Authority
CN
China
Prior art keywords
image
image evaluation
focusing
network
searching
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110975863.0A
Other languages
English (en)
Other versions
CN113869363A (zh
Inventor
柳万胜
尹文明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Optics and Electronics of CAS
Original Assignee
Institute of Optics and Electronics of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Optics and Electronics of CAS filed Critical Institute of Optics and Electronics of CAS
Priority to CN202110975863.0A priority Critical patent/CN113869363B/zh
Publication of CN113869363A publication Critical patent/CN113869363A/zh
Application granted granted Critical
Publication of CN113869363B publication Critical patent/CN113869363B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/53Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)
  • Studio Devices (AREA)

Abstract

本发明公开了一种基于图像评价网络和图像评价函数的爬山调焦搜索方法。该方法首先需要训练图像评价网络模型,然后将采集的图像信息输入至图像评价网络中,该网络可以准确辨别采集图像的模糊程度,不同的模糊程度对应着不同的搜索步长,图像评价函数的作用是控制搜索方向,并且在图像较为清晰时采用曲线拟合的调焦搜索方法。该方法充分利用各个算法的优点,在保证调焦精度的同时,大大地提高了调焦搜索效率,并且可以有效避免局部极值点。能更好地用于实际调焦工程,提高光学系统的最终成像质量。

Description

一种基于图像评价网络和图像评价函数的爬山调焦搜索方法
技术领域
本发明属于基于图像处理的自动调焦领域,具体涉及一种基于图像评价网络和图像评价函数的爬山调焦搜索方法,所述图像评价网络为基于卷积神经网络的图像评价网络,所述图像评价函数为图像清晰度评价函数,将图像信息输入图像评价网络中,可以识别图像的模糊程度,然后根据图像的模糊程度精确控制下一步调焦搜索步长,图像评价值的作用是控制调焦搜索方向,二者结合提高搜索效率。
背景技术
在靶场实验中,光学测量系统在测量以及目标观测等领域有着重要的应用,通过高精度调焦和对光学系统精确标定,可以提高系统的探测能力,并对成像细节进行高清晰显示,同时还可以实现对目标的高精度航迹、姿态或者辐射测量。但受到大气、温度或者目标快速运动,导致系统离焦,不能清晰成像。因此,如何快速调焦一直是调焦领域亟待解决的问题。
基于爬山搜索的对焦深度法因为其原理简单,工程上易于实现,所以广泛应用各个领域。但是该方法是一个逐步搜索的过程,而且单帧图像的评价值无法辨别图像是否清晰,以至于在系统清晰时,由于搜索步长未达到调焦结束条件时,调焦步骤持续进行,势必会增加调焦次数,影响调焦速度。近些年,在无参考图像评价领域中卷积神经网络成果突出,图像评价网络的功能和图像评价函数大致相当,但是图像评价网络的评价效果更为具体,所以本方法是将此两者算法结合,提高调焦搜索效率。
发明内容
本发明的目的在于提供一种基于图像评价网络和图像评价函数的爬山调焦搜索方法,该方法能够避免在搜索过程中调焦机构陷入局部极值,造成误调焦,还能够提高调焦搜索效率。
本发明的原理是:
1.利用图像神经网络实现模糊图像分类任务,将模糊程度一样的图像归为一类;图像分类的主要过程包括图像预处理、特征提取和分类器设计。图像预处理包括图像滤波,如中值滤波、均值滤波、高斯滤波以及图像归一化等操作,其主要作用是过滤图像中的一些无关信息,在简化数据的前提下最大限度地保留有用信息,增强特征提取的可靠性。特征提取是图像分类任务中最为关键的一部分,其将输入图像按照一定的规则变换生成另一种具有某些特性的特征表示,新的特征往往具有低维度、低冗余、低噪声、结构化等优点,从而降低了对分类器复杂度的要求,提高了模型性能。最后通过训练分类器对提取的特征进行分类,从而实现图像的分类。
2.图像评价函数:空间域的图像清晰度评价函数主要基于清晰图像比模糊图像的边缘更为清晰、对比度更高、灰度变化程度较为剧烈等特征来评判准焦和离焦图像。如SMD函数的公式式子的物理意义为:将目标像素的灰度值分别与其水平方向和垂直方向的两个相邻的像素的灰度值做灰度差绝对值计算,然后遍历整张图像,把累加的结果作为图像评价值,其中图像评价值越高,表示图像越清晰,相反,如果图像评价值越低,表示图像越模糊。理想的图像评价函数曲线是一个开口向下的二次函数曲线,峰值只有一个。
3.调焦搜索过程:首先用图像评价网络识别图像的模糊程度,然后根据图像的模糊程度设置下一步的搜索步长,而图像的图像评价值用来控制搜索方向,二者结合提高搜索效率。
为解决上述技术问题,基于上述原理,本发明提出以下技术方案:
一种基于图像评价网络和图像评价函数的爬山调焦搜索方法,该方法包括以下步骤:
步骤一,构建图像数据集:
所述图像数据集按模糊程度分为多类图像数据集,所述多类图像数据集的分类包括:清晰图像、浅度模糊图像、中度模糊图像、重度模糊图像;其中手机的高清屏保图像作为清晰图像一类;
步骤二,训练多个图像评价网络模型:
采用构建的所述图像数据集输入图像分类网络进行模型训练,所述图像分类网络包括AlexNet、VGG、Inception-V3;所述图像评价网络用于识别图像的模糊程度;
步骤三,选取多个图像评价函数:
所述图像评价函数模型类似于一个开口向下的二次函数曲线,根据以下五个基本特征选取多个图像评价函数:(1)无偏性;(2)单峰性;(3)灵敏度高;(4)鲁棒性强;(5)计算量小。
步骤四,确定评价网络模型和图像评价函数:
通过仿真实验对比,挑选SMD曲线作为图像清晰度评价函数,以及挑选图像评价网络识别精度最高的模型;
步骤五,识别图像模糊程度和图像评价值:
将采集的图像输入训练好的步骤四所确定的图像评价网络中,先识别出图像的模糊程度,然后基于步骤四确定的图像评价函数得到图像评价值,并将结果做好记录。
步骤六,调焦搜索:
在第一次调焦时,移动固定距离L采集图像,然后,回到步骤五,记录移动后采集的图像评价值,通过比对两次图像评价值确定搜索方向;然后根据步骤五识别的图像的模糊程度设置搜索步长,并基于该搜索步长采集图像,反复执行步骤五和步骤六,直至采集图像清晰。
在非第一次调焦时,根据步骤五识别的图像的模糊程度设置搜索步长,然后移动所述搜索步长采集图像,反复执行步骤五和步骤六,直至采集图像清晰。
其中,步骤六中,识别的图像为重度模糊图像时对应的搜索步长为bL,识别为中度模糊图像时对应的搜索步长为aL,识别为浅度模糊图像时使用曲线拟合搜索算法确定聚焦点,为清晰图像时对应于结束调焦,aL和bL分别为步长L的a倍和b倍,其中a,b为大于1的整数且b>a,这样使得不同成像状态下的搜索步长不同,成像系统越模糊对应的搜索步长越大,以此提升搜索效率。
其中,步骤一中,按照7:2:1,将所述图像数据集分为训练集、验证集和测试集。
其中,步骤一中,用高斯模糊公式,以清晰图像为模板,按方差不同对图像模糊程度进行归类。
本发明所述的技术方案中,图像评价网络可以识别图像的模糊程度,具有和评价函数一样的功能,但是图像评价网络的评价结果更为具体。
步骤五中识别的不同的模糊程度对应于不同的搜索步长,这个特点和人为操作调焦一样,当人眼感觉系统离焦程度大时,知道通过大幅度修正系统参数,当人眼感觉系统离焦程度小时,调焦的搜索步长较小。使用图像评价网络可以做到对搜索步长的精细化控制,减少没必要的搜索过程。
所述的图像评价网络的作用是可以识别图像的模糊程度,实际应用中的的评价函数存在局部极值,传统的爬山搜索方法容易陷入局部极值,导致调焦失败。使用图像评价网络可以对该点的模糊程度做出识别,如果该点图像清晰,则终止调焦;如果还是模糊,则继续搜索寻找最佳调焦点。有效避免调焦过程陷入局部极值。
所述的图像评价网络的作用是控制调焦搜索步长,图像评价函数的作用是控制调焦搜索方向,如果识别的图像模糊程度较低,则选择使用曲线拟合搜索方式,这样可以充分利用各个算法的优点,从而提升调焦搜索效率,保证调焦精度。
本发明与现有技术相比的优点在于:
(1)本发明中图像评价网络可以对图像给出更为直观的评价结果;
(2)本发明中该算法调焦效率比传统爬山搜索方法高;
(3)本发明中该方法调焦具备普适性价值。
附图说明
图1为本发明的工作流程图;
图2为模拟生成的模糊图像和实际采集的模糊图像;
图3为部分清晰图像数据集;
图4为改进SMD评价函数曲线图;
图5为改进爬山搜索方法的搜索流程图;
图6为自动调焦实验图像序列记录-1;
图7为自动调焦实验图像序列记录-2。
具体实施方式
以下结合附图,具体说明本发明的实施方式。
本发明方法流程如图1所示,下面展开详细描述:
一种基于图像评价网络和图像评价函数的爬山调焦搜索方法的具体实施方式,包括以下步骤:
步骤一构建高清图像数据集:
手机的高清屏保图像作为清晰图像一类,数量为2000张。然后用高斯模糊公式,以清晰图像为模板,将方差不同模糊图像归为一类,以4类图像数据集为例分为:清晰图像、浅度模糊图像、中度模糊图像和重度模糊图像,如图2所示,其中(a,b,c,d)是模拟生成的模糊图像,(e,f,g,h)是实际采集的模糊图像。然后按照7:2:1,分为训练集、验证集和测试集,部分清晰图像数据集如图3所示。
步骤二训练图像评价网络模型
典型的图像分类网络模型包括AlexNet、VGG、Inception-V3,采用微调的方式进行迁移学习;
训练参数和计算机配置如下:Ubuntu 18.04操作系统进行,处理器Intel Corei74770K CPU@3.50GHz×8;显卡GeForce GTX980Ti和GTX1080Ti混合使用,运行内存18G。训练环境:编程语言Python;采用Tensorflow深度学习框架;用批次训练的方法将训练集和测试集分为多个批次,每个批次大小为32,初始学习率0.0001、学习率衰减0.99、优化算法为Adam算法、采用MSE作为图像评价网络的损失函数。
步骤三图像评价函数选取
理想的图像评价函数模型类似于一个开口向下的二次函数曲线,有五个基本特征:(1)无偏性:表示函数最大值的横坐标就是最佳调焦点。(2)单峰性:指的是调焦过程中,评价曲线只有一个最大值,当函数偏离对焦位置时,函数评价值依次单调递减;(3)灵敏度高:表示函数可以处理两张细微离焦的图像;(4)鲁棒性强:表示图像评价算法抗干扰性强;(5)计算量小:图像处理速度快;其中以空域评价函数为例,在工程应用具体采用SMD函数曲线,如附图4所示:
步骤四图像评价函数和图像评价网络选择
通过仿真实验对比,SMD图像清晰度评价函数的灵敏度和抗噪性达到预期;Inception-V3的对图像的识别精度较高,图像处理速度快,如表1所示,表1为不同分类网络的实验结果对比。
表1
步骤五识别图像模糊程度和图像评价值
以4类不同模糊程度数据集训练的模型为例,4类图像模糊程度分别是:清晰图像、浅度模糊图像、中度模糊图像、重度模糊图像。将采集的图像输入训练好的图像评价网络中,先识别出图像的模糊程度,然后得到图像评价值,将结果做好记录。
步骤六调焦搜索过程
在第一次调焦中,由于不知道调焦方向是否正确,所以需要移动固定距离L,然后,回到步骤五,记录移动后的图像评价值,通过比对两次图像的评价值确定搜索方向。然后根据图像的模糊程度设置搜索步长,例如重度模糊图像对应的搜索步长为bL,中度模糊图像对应的搜索步长为aL,浅度模糊图像使用曲线拟合搜索算法,清晰图像结束调焦步骤,反复执行步骤五和步骤六,直至图像清晰,图5表示该方法的搜索示意图,图6和图7是按照不同模糊程度对应不同搜索步长的调焦实验过程,表2与表3是实验记录。表2所示的调焦实验记录表中,L=1刻度,a=3L,b=5L,表3所示的调焦实验记录表中,L=1刻度,a=5L,b=10L。
表2
表3
尽管上面对本发明说明性的具体实施方式进行了描述,以便于本技术领域的技术人员理解本发明,且应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。

Claims (3)

1.一种基于图像评价网络和图像评价函数的爬山调焦搜索方法,其特征在于,该方法包括以下步骤:
步骤一,构建图像数据集:
所述图像数据集按模糊程度分为多类图像数据集,所述多类图像数据集的分类包括:清晰图像、浅度模糊图像、中度模糊图像、重度模糊图像;其中手机的高清屏保图像作为清晰图像一类;
步骤二,训练多个图像评价网络模型:
采用构建的所述图像数据集输入图像分类网络进行模型训练,所述图像分类网络包括AlexNet、VGG、Inception-V3;所述图像评价网络用于识别图像的模糊程度;
步骤三,选取多个图像评价函数:
所述图像评价函数模型类似于一个开口向下的二次函数曲线,根据以下五个基本特征选取多个图像评价函数:(1)无偏性;(2)单峰性;(3)灵敏度高;(4)鲁棒性强;(5)计算量小;
步骤四,确定评价网络模型和图像评价函数:
通过仿真实验对比,挑选SMD曲线作为图像清晰度评价函数,以及挑选图像评价网络识别精度最高的模型;
步骤五,识别图像模糊程度和图像评价值:
将采集的图像输入训练好的步骤四所确定的图像评价网络中,先识别出图像的模糊程度,然后基于步骤四确定的图像评价函数得到图像评价值,并将结果做好记录;
步骤六,调焦搜索:
在第一次调焦时,移动固定距离L采集图像,然后,回到步骤五,记录移动后采集的图像评价值,通过比对两次图像评价值确定搜索方向;然后根据步骤五识别的图像的模糊程度设置搜索步长,并基于该搜索步长采集图像,反复执行步骤五和步骤六,直至采集图像清晰;
在非第一次调焦时,根据步骤五识别的图像的模糊程度设置搜索步长,然后移动所述搜索步长采集图像,反复执行步骤五和步骤六,直至采集图像清晰;
其中,步骤六中,识别的图像为重度模糊图像时对应的搜索步长为bL,为中度模糊图像时对应的搜索步长为aL,为浅度模糊图像时使用曲线拟合搜索算法确定聚焦点,为清晰图像时对应于结束调焦,aL和bL分别为步长L的a倍和b倍,其中a,b为大于1的整数,且b>a。
2.如权利要求1所述的一种基于图像评价网络和图像评价函数的爬山调焦搜索方法,其特征在于:
步骤一中,按照7:2:1,将所述图像数据集分为训练集、验证集和测试集。
3.如权利要求1所述的一种基于图像评价网络和图像评价函数的爬山调焦搜索方法,其特征在于:
步骤一中,用高斯模糊公式,以清晰图像为模板,按方差不同对图像模糊程度进行归类。
CN202110975863.0A 2021-08-24 2021-08-24 一种基于图像评价网络和图像评价函数的爬山调焦搜索方法 Active CN113869363B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110975863.0A CN113869363B (zh) 2021-08-24 2021-08-24 一种基于图像评价网络和图像评价函数的爬山调焦搜索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110975863.0A CN113869363B (zh) 2021-08-24 2021-08-24 一种基于图像评价网络和图像评价函数的爬山调焦搜索方法

Publications (2)

Publication Number Publication Date
CN113869363A CN113869363A (zh) 2021-12-31
CN113869363B true CN113869363B (zh) 2023-09-22

Family

ID=78988230

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110975863.0A Active CN113869363B (zh) 2021-08-24 2021-08-24 一种基于图像评价网络和图像评价函数的爬山调焦搜索方法

Country Status (1)

Country Link
CN (1) CN113869363B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104601886A (zh) * 2015-01-13 2015-05-06 烟台艾睿光电科技有限公司 一种用于红外图像电机调焦的控制方法及装置
CN106488122A (zh) * 2016-10-14 2017-03-08 北京信息科技大学 一种基于改进Sobel算子的动态自动调焦算法
CN108833770A (zh) * 2018-05-23 2018-11-16 释码融和(上海)信息科技有限公司 用于调焦的图像清晰度计算方法、计算设备及调焦系统
CN111462019A (zh) * 2020-04-20 2020-07-28 武汉大学 基于深度神经网络参数估计的图像去模糊方法及系统
CN111948784A (zh) * 2020-07-07 2020-11-17 江苏大学 基于爬山法的迭代优化自动调焦方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7195790B2 (ja) * 2018-07-02 2022-12-26 キヤノン株式会社 撮像装置及びその制御方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104601886A (zh) * 2015-01-13 2015-05-06 烟台艾睿光电科技有限公司 一种用于红外图像电机调焦的控制方法及装置
CN106488122A (zh) * 2016-10-14 2017-03-08 北京信息科技大学 一种基于改进Sobel算子的动态自动调焦算法
CN108833770A (zh) * 2018-05-23 2018-11-16 释码融和(上海)信息科技有限公司 用于调焦的图像清晰度计算方法、计算设备及调焦系统
CN111462019A (zh) * 2020-04-20 2020-07-28 武汉大学 基于深度神经网络参数估计的图像去模糊方法及系统
CN111948784A (zh) * 2020-07-07 2020-11-17 江苏大学 基于爬山法的迭代优化自动调焦方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
yin wenming 等.improved SMD image evaluation function based on pixel difference.destech transactions on computer science and engineering.2020,1-5. *
褚翔等.一种基于液体透镜的仿生视觉快速调焦方法 .激光与红外.2017,203-209. *
郝思嘉 ; 陆红刚 ; 王晓涵 ; .基于图像处理的自动调焦技术研究.电子元器件与信息技术.2020,第4卷(第04期),120-121. *

Also Published As

Publication number Publication date
CN113869363A (zh) 2021-12-31

Similar Documents

Publication Publication Date Title
CN111083365B (zh) 一种最佳焦平面位置快速检测方法及装置
CN111462076B (zh) 一种全切片数字病理图像模糊区域检测方法及系统
CN107403175A (zh) 一种运动背景下的视觉跟踪方法及视觉跟踪系统
CN110120065B (zh) 一种基于分层卷积特征和尺度自适应核相关滤波的目标跟踪方法及系统
Huang et al. Joint blur kernel estimation and CNN for blind image restoration
Kovacs et al. Focus area extraction by blind deconvolution for defining regions of interest
CN111462075B (zh) 一种全切片数字病理图像模糊区域的快速重聚焦方法及系统
CN104637046B (zh) 图像检测方法和装置
CN110555870B (zh) 基于神经网络的dcf跟踪置信度评价与分类器更新方法
JP6703314B2 (ja) フォーカス検出
CN111626933A (zh) 一种精准、快速的显微图像拼接方法及系统
CN113052873B (zh) 一种在线自监督学习场景适应的单目标跟踪方法
CN113592911A (zh) 表观增强深度目标跟踪方法
CN111932542B (zh) 一种基于多焦距的图像识别方法及装置、存储介质
CN112135048B (zh) 一种目标对象的自动对焦方法以及装置
CN110660080A (zh) 一种基于学习率调整融合多层卷积特征的多尺度目标跟踪方法
CN116030396B (zh) 一种用于视频结构化提取的精确分割方法
Nayef et al. Metric-based no-reference quality assessment of heterogeneous document images
CN110827327B (zh) 一种基于融合的长期目标跟踪方法
CN110660077A (zh) 一种融合多个特征的多尺度目标跟踪方法
CN113869363B (zh) 一种基于图像评价网络和图像评价函数的爬山调焦搜索方法
CN112017165A (zh) 一种基于深度学习的泪河高度检测方法
CN109507792B (zh) 一种基于机器学习的光学显微镜自动聚焦方法
JP2016062249A (ja) 識別辞書学習システム、認識辞書学習方法および認識辞書学習プログラム
CN109858342B (zh) 一种融合手工设计描述子和深度特征的人脸姿态估计方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant