CN113554606B - 一种深度学习的图像分析方法 - Google Patents

一种深度学习的图像分析方法 Download PDF

Info

Publication number
CN113554606B
CN113554606B CN202110795957.XA CN202110795957A CN113554606B CN 113554606 B CN113554606 B CN 113554606B CN 202110795957 A CN202110795957 A CN 202110795957A CN 113554606 B CN113554606 B CN 113554606B
Authority
CN
China
Prior art keywords
wedding
images
image
dress
wedding dress
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110795957.XA
Other languages
English (en)
Other versions
CN113554606A (zh
Inventor
徐竞柔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jiamu Network Technology Co ltd
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN202110795957.XA priority Critical patent/CN113554606B/zh
Publication of CN113554606A publication Critical patent/CN113554606A/zh
Application granted granted Critical
Publication of CN113554606B publication Critical patent/CN113554606B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30168Image quality inspection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Quality & Reliability (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种深度学习的图像分析方法,属于图像处理技术领域,该图像分析方法具体步骤如下:(1)婚纱图像获取;(2)模糊度客观检测;(3)模糊度主观评价;(4)特征集处理;(5)图像分析筛选模型构建;(6)模型测试判断;(7)模型应用;本发明采用客观检测和主观评价相结合的方式进行图像训练集和测试集的确定,即通过高斯模糊影响因子和主观评价来度量室外婚纱图像的清晰度,其相较于现有人工标注确定特征集的图像分析方法,有利于防止模型过拟合,并且有利于提高模型分析处理精度,同时可辅助摄影师完成优质婚纱图像的快速筛选工作,进而有利于提高后期处理效率,并且节约人工处理成本。

Description

一种深度学习的图像分析方法
技术领域
本发明涉及图像处理技术领域,尤其涉及一种深度学习的图像分析方法。
背景技术
经检索,中国专利号CN111242911A公开了一种基于深度学习算法确定图像清晰度的方法及系统,该发明方法虽然能确定舌部区域的脸部图像的图像清晰度,但采用人为标注形式确定训练集和测试集,由于人与人之间的个体差异性很大,因而仅采用人为标注方法易导致模型过拟合,进行容易降低模型分析处理精度;随着物质生活水平的不断提高,婚纱摄影己成为一种时尚,受到越来越多人士的青睐,使得越来越多的人会选择在结婚时拍摄婚纱照作为留念,并且随着互联网摄影打卡现象的带动,越来越多的人趋向于选择室外进行婚纱照拍摄,相较于室内环境拍摄,室外环境具有较多不可控因素(如雾天、雨天等),因此易导致拍摄图像会出现模糊不清等现象,对于此类情况,摄影师通常做法是对同组照片采用多量拍摄方法解决,后期再进行人工筛选,选出同组照片中的最好的几幅图像,之后再做后期处理,但由于婚纱照数量较多,如果选择人工进行逐一筛选,容易降低后期处理效率,增加人工处理成本;深度学习近年来快速发展,在图像识别、目标检测等领域表现出惊人的准确性,其需要大量的训练集进行训练,训练集的大小直接影响深度学习的性能,训练集太小将导致深度学习过拟合;如何将成为利用深度学习技术辅助摄影师进行图像分析已成为当下研究新方向;因此,发明出一种深度学习的图像分析方法变得尤为重要;
现有婚纱摄影图像分析方法大多是通过人工逐一筛选进行图像分析选择,其处理效率较低,且费时费力,容易增加人工处理成本,并且现有深度学习图像分析方法的训练集是基于人工标注进行确定的,但由于人与人之间的个体差异性很大,仅采用人工标注易导致模型过拟合,进行容易降低模型分析处理精度;为此,我们提出一种深度学习的图像分析方法。
发明内容
本发明的目的是为了解决现有技术中存在的缺陷,而提出的一种深度学习的图像分析方法。
为了实现上述目的,本发明采用了如下技术方案:
一种深度学习的图像分析方法,该图像分析方法具体步骤如下:
(1)婚纱图像获取:获取室外摄影的多组婚纱图像;
(2)模糊度客观检测:利用模糊度客观检测方法对步骤(1)所述多组婚纱图像进行清晰度划分和标注,得到客观检测结果集;
(3)模糊度主观评价:选取若干个测试人员对步骤(1)所述多组婚纱图像进行逐一清晰度评价,同时对已评价的婚纱图像进行标注,得到主观评价结果集;
(4)特征集处理:根据步骤(2)所述客观检测结果集和步骤(3)所述主观评价结果集进行权重分配和集成,得到婚纱图像特征集,并将婚纱图像特征集划分为70%的训练集和30%的验证集;
(5)图像分析筛选模型构建:搭建卷积神经网络架构,并将步骤(4)所述70%的训练集输入卷积神经网络,即得到图像分析筛选模型;
(6)模型测试判断:将步骤(4)所述30%的验证集输入所述图像分析筛选模型进行测试验证,判断其测试准确率是否达到阈值,若达到,则输出该模型,反之返回步骤(1)进行重采样;
(7)模型应用:对于满足阈值的图像分析筛选模型,将其应用于室外婚纱摄影图像筛选处理过程中,为摄影师过滤部分无后期处理价值的婚纱摄影图像。
进一步地,步骤(3)所述模糊度客观检测的具体过程如下:
S1:首先,获取多组婚纱图像,选取一组婚纱图像I将其转为成一组灰度图像,然后对该组灰度图像进行高斯模糊运算,得到一组模糊婚纱图像I';
S2:将一组婚纱图像I和对应的一组模糊婚纱图像I'分别做傅里叶变换,得到婚纱图像的频谱信息T和模糊婚纱图像的频谱信息T';
S3:根据婚纱图像的频谱信息T和模糊婚纱图像的频谱信息T'分别计算婚纱图像的能量谱和S以及模糊婚纱图像的能量谱和S';
S4:根据婚纱图像的能量谱和S与模糊婚纱图像的能量谱和S'计算图像的高斯模糊影响因子X,高斯模糊影响因子X越大,则图形越清晰,反之则图像越模糊;
S5:将同组婚纱图像中影响因子X最大的婚纱图像标记为清晰,且同组婚纱图像中的其它图像标记为模糊;
S6:采用上述方法对其它组婚纱图像进行相同检测,即得到客观检测结果集。
进一步地,所述高斯模糊运算的公式如下:
Figure BDA0003162760860000041
式中:x表示婚纱图像;μ是婚纱图像的均值;σ是婚纱图像的方差。
进一步地,步骤(3)所述模糊度主观评价的具体过程如下:
SS1:首先,获取多组婚纱图像,选取若干个测试人员对一组婚纱图像中的每一幅婚纱摄影图像进行其清晰度评分,得到多个评分结果;
SS2:对多个评分结果进行均值计算,即得到每幅婚纱摄影图像的最终主观评分,标记同组婚纱摄影图像中主观评分最高的图像为清晰,其它为模糊;
SS3:最后,根据上述方法对其它组婚纱图像进行测试评分,即得到主观评价结果集。
进一步地,步骤(5)所述阈值具体为90%。
相比于现有技术,本发明的有益效果在于:
本申请提出的一种深度学习的图像分析方法,其采用客观检测和主观评价相结合的方式进行图像训练集和测试集的确定,即通过高斯模糊影响因子和主观评价来度量室外婚纱图像的清晰度,其相较于现有人工标注确定特征集的图像分析方法,有利于防止模型过拟合,并且有利于提高模型分析处理精度,同时可辅助摄影师完成优质婚纱图像的快速筛选工作,进而有利于提高后期处理效率,并且节约人工处理成本。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。
图1为本发明提出的一种深度学习的图像分析方法的整体流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
在本发明的描述中,需要理解的是,术语“上”、“下”、“前”、“后”、“左”、“右”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
实施例1
参照图1,本实施例公开了一种深度学习的图像分析方法,该图像分析方法具体步骤如下:
第一步,获取室外摄影的多组婚纱图像;然后利用模糊度客观检测方法对多组婚纱图像进行清晰度划分和标注,得到客观检测结果集;接着选取若干个测试人员(具体的,该测试人员的数量可根据使用者自行确定,一般不得少于3人)对多组婚纱图像进行逐一清晰度评价,同时对已评价的婚纱图像进行标注(具体的,标注是将图像划分为清晰或模糊),得到主观评价结果集;之后根据客观检测结果集和主观评价结果集进行权重分配和集成,得到婚纱图像特征集,并将婚纱图像特征集划分为70%的训练集和30%的验证集;接着搭建卷积神经网络架构,并将70%的训练集输入卷积神经网络,即得到图像分析筛选模型;然后将30%的验证集输入图像分析筛选模型进行测试验证,判断其测试准确率是否达到阈值,具体的,该阈值具体为90%,若达到,则输出该模型,反之返回第一步进行重采样;最后对于满足阈值的图像分析筛选模型,将其应用于室外婚纱摄影图像筛选处理过程中,为摄影师过滤部分无后期处理价值的婚纱摄影图像。
实施例2
参照图1,本实施例公开了一种深度学习的图像分析方法,除与上述实施例相同的结构外,本实施例将具体介绍模糊度客观检测和模糊度主观评价的具体过程;
本实施例中,该模糊度客观检测的具体过程如下:
首先,获取多组婚纱图像,选取一组婚纱图像I将其转为成一组灰度图像,然后对该组灰度图像进行高斯模糊运算,得到一组模糊婚纱图像I',具体的该高斯模糊运算的公式为
Figure BDA0003162760860000071
Figure BDA0003162760860000072
式中x表示婚纱图像;μ是婚纱图像的均值;σ是婚纱图像的方差;然后,将一组婚纱图像I和对应的一组模糊婚纱图像I'分别做傅里叶变换,得到婚纱图像的频谱信息T和模糊婚纱图像的频谱信息T';接着根据婚纱图像的频谱信息T和模糊婚纱图像的频谱信息T'分别计算婚纱图像的能量谱和S以及模糊婚纱图像的能量谱和S';之后,根据婚纱图像的能量谱和S与模糊婚纱图像的能量谱和S'计算图像的高斯模糊影响因子X,高斯模糊影响因子X越大,则图形越清晰,反之则图像越模糊;然后,将同组婚纱图像中影响因子X最大的婚纱图像标记为清晰,且同组婚纱图像中的其它图像标记为模糊;最后采用上述方法对其它组婚纱图像进行相同检测,即得到客观检测结果集。
需要进一步说明的是,本实施例中模糊度主观评价的具体过程如下:
首先,获取多组婚纱图像,选取若干个测试人员对一组婚纱图像中的每一幅婚纱摄影图像进行其清晰度评分,得到多个评分结果;然后对多个评分结果进行均值计算,即得到每幅婚纱摄影图像的最终主观评分,具体的,均值计算公式为
Figure BDA0003162760860000073
Figure BDA0003162760860000074
式中
Figure BDA0003162760860000075
表示每幅婚纱摄影图像的最终主观评分,n表示测试人数;标记同组婚纱摄影图像中主观评分最高的图像为清晰,其它为模糊;最后,根据上述方法对其它组婚纱图像进行测试评分,即得到主观评价结果集。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

Claims (3)

1.一种深度学习的图像分析方法,其特征在于,该图像分析方法具体步骤如下:
(1)婚纱图像获取:获取室外摄影的多组婚纱图像;
(2)模糊度客观检测:利用模糊度客观检测方法对步骤(1)所述多组婚纱图像进行清晰度划分和标注,得到客观检测结果集;
(3)模糊度主观评价:选取若干个测试人员对步骤(1)所述多组婚纱图像进行逐一清晰度评价,同时对已评价的婚纱图像进行标注,得到主观评价结果集;
(4)特征集处理:根据步骤(2)所述客观检测结果集和步骤(3)所述主观评价结果集进行权重分配和集成,得到婚纱图像特征集,并将婚纱图像特征集划分为70%的训练集和30%的验证集;
(5)图像分析筛选模型构建:搭建卷积神经网络架构,并将步骤(4)所述70%的训练集输入卷积神经网络,即得到图像分析筛选模型;
(6)模型测试判断:将步骤(4)所述30%的验证集输入所述图像分析筛选模型进行测试验证,判断其测试准确率是否达到阈值,若达到,则输出该模型,反之返回步骤(1)进行重采样;
(7)模型应用:对于满足阈值的图像分析筛选模型,将其应用于室外婚纱摄影图像筛选处理过程中,为摄影师过滤部分无后期处理价值的婚纱摄影图像;
其中,步骤(3)所述模糊度客观检测的具体过程如下:
S1:首先,获取多组婚纱图像,选取一组婚纱图像I将其转为成一组灰度图像,然后对该组灰度图像进行高斯模糊运算,得到一组模糊婚纱图像I
S2:将一组婚纱图像I和对应的一组模糊婚纱图像I分别做傅里叶变换,得到婚纱图像的频谱信息T和模糊婚纱图像的频谱信息T
S3:根据婚纱图像的频谱信息T和模糊婚纱图像的频谱信息T分别计算婚纱图像的能量谱和S以及模糊婚纱图像的能量谱和S
S4:根据婚纱图像的能量谱和S与模糊婚纱图像的能量谱和S计算图像的高斯模糊影响因子X,高斯模糊影响因子X越大,则图形越清晰,反之则图像越模糊;
S5:将同组婚纱图像中影响因子X最大的婚纱图像标记为清晰,且同组婚纱图像中的其它图像标记为模糊;
S6:采用上述方法对其它组婚纱图像进行相同检测,即得到客观检测结果集;
所述高斯模糊运算的公式如下:
Figure FDA0004100057280000021
式中:x表示婚纱图像;μ是婚纱图像的均值;σ是婚纱图像的方差。
2.根据权利要求1所述的一种深度学习的图像分析方法,其特征在于,步骤(3)所述模糊度主观评价的具体过程如下:
SS1:首先,获取多组婚纱图像,选取若干个测试人员对一组婚纱图像中的每一幅婚纱摄影图像进行其清晰度评分,得到多个评分结果;
SS2:对多个评分结果进行均值计算,即得到每幅婚纱摄影图像的最终主观评分,标记同组婚纱摄影图像中主观评分最高的图像为清晰,其它为模糊;
SS3:最后,根据上述方法对其它组婚纱图像进行测试评分,即得到主观评价结果集。
3.根据权利要求1所述的一种深度学习的图像分析方法,其特征在于,步骤(6)所述阈值具体为90%。
CN202110795957.XA 2021-07-14 2021-07-14 一种深度学习的图像分析方法 Active CN113554606B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110795957.XA CN113554606B (zh) 2021-07-14 2021-07-14 一种深度学习的图像分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110795957.XA CN113554606B (zh) 2021-07-14 2021-07-14 一种深度学习的图像分析方法

Publications (2)

Publication Number Publication Date
CN113554606A CN113554606A (zh) 2021-10-26
CN113554606B true CN113554606B (zh) 2023-04-18

Family

ID=78103131

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110795957.XA Active CN113554606B (zh) 2021-07-14 2021-07-14 一种深度学习的图像分析方法

Country Status (1)

Country Link
CN (1) CN113554606B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105550694A (zh) * 2015-12-01 2016-05-04 厦门瑞为信息技术有限公司 一种度量人脸图像模糊程度的方法
CN105786684A (zh) * 2016-03-23 2016-07-20 中国人民公安大学 一种摄像机性能的综合评价方法及系统
CN109255390A (zh) * 2018-09-30 2019-01-22 京东方科技集团股份有限公司 训练图像的预处理方法及模块、鉴别器、可读存储介质
CN112966757A (zh) * 2021-03-11 2021-06-15 江苏禹空间科技有限公司 训练样本的扩展方法、装置、存储介质及设备

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB201900032D0 (en) * 2019-01-02 2019-02-13 Oxehealth Ltd Method and apparatus for monitoring of a human or animal subject

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105550694A (zh) * 2015-12-01 2016-05-04 厦门瑞为信息技术有限公司 一种度量人脸图像模糊程度的方法
CN105786684A (zh) * 2016-03-23 2016-07-20 中国人民公安大学 一种摄像机性能的综合评价方法及系统
CN109255390A (zh) * 2018-09-30 2019-01-22 京东方科技集团股份有限公司 训练图像的预处理方法及模块、鉴别器、可读存储介质
CN112966757A (zh) * 2021-03-11 2021-06-15 江苏禹空间科技有限公司 训练样本的扩展方法、装置、存储介质及设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Q. Memon 等.Privacy Preserving Smartphone Camera Tracking Using Support Vector Machines.Journal of Image Processing Theory and Applications .2021,1-12页. *
靳鑫.面向三维视频系统的立体图像感知质量研究.中国优秀硕士学位论文全文数据库 (信息科技辑).2016,I138-6267. *

Also Published As

Publication number Publication date
CN113554606A (zh) 2021-10-26

Similar Documents

Publication Publication Date Title
CN108038476B (zh) 一种基于边缘检测与sift的人脸表情识别特征提取方法
CN108830144B (zh) 一种基于改进Faster-R-CNN的哺乳母猪姿态识别方法
CN112464971A (zh) 害虫检测模型构建方法
CN109145921A (zh) 一种基于改进的直觉模糊c均值聚类的图像分割方法
CN110378232B (zh) 改进的ssd双网络的考场考生位置快速检测方法
CN110532900A (zh) 基于U-Net和LS-CNN的人脸表情识别方法
CN105160310A (zh) 基于3d卷积神经网络的人体行为识别方法
CN110148162A (zh) 一种基于复合算子的异源图像匹配方法
CN109101938B (zh) 一种基于卷积神经网络的多标签年龄估计方法
CN107133955A (zh) 一种多层次结合的协同显著性检测方法
CN106874929B (zh) 一种基于深度学习的珍珠分类方法
CN108256462A (zh) 一种商场监控视频中的人数统计方法
CN107392929A (zh) 一种基于人眼视觉模型的智能化目标检测及尺寸测量方法
CN110021019B (zh) 一种aga临床图像的ai辅助毛发的粗细分布分析方法
CN114049577A (zh) 一种鱼类规格的测量方法及系统
CN115346149A (zh) 基于时空图卷积网络的跳绳计数方法和系统
CN106529441A (zh) 基于模糊边界分片的深度动作图人体行为识别方法
CN113204990B (zh) 基于智能鱼竿的机器学习方法与装置
CN113554606B (zh) 一种深度学习的图像分析方法
CN117409407A (zh) 一种多层次感知注意力机制的细胞微核分类方法
CN115830514B (zh) 一种适用于带弯曲河道的全河段表面流速计算方法及系统
CN107832667A (zh) 一种基于深度学习的人脸识别方法
CN110251076B (zh) 融合视觉注意力基于对比度的显著性检测方法及装置
CN112132137A (zh) 一种基于FCN-SPP-Focal Net的抽象画图像正确方向的识别方法
CN116385717A (zh) 叶面病害识别方法、装置、电子设备、存储介质及产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20230628

Address after: 201210 3rd floor, building 1, No.400, Fangchun Road, China (Shanghai) pilot Free Trade Zone, Pudong New Area, Shanghai

Patentee after: Shanghai Jiamu Network Technology Co.,Ltd.

Address before: 611731, No. 2006, West Avenue, Chengdu hi tech Zone (West District, Sichuan)

Patentee before: University of Electronic Science and Technology of China

TR01 Transfer of patent right