CN109840559A - 图像筛选方法、装置以及电子设备 - Google Patents

图像筛选方法、装置以及电子设备 Download PDF

Info

Publication number
CN109840559A
CN109840559A CN201910071979.4A CN201910071979A CN109840559A CN 109840559 A CN109840559 A CN 109840559A CN 201910071979 A CN201910071979 A CN 201910071979A CN 109840559 A CN109840559 A CN 109840559A
Authority
CN
China
Prior art keywords
image data
image
network model
data
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910071979.4A
Other languages
English (en)
Inventor
冯文颖
姜楠
高雅妮
纪卓骁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Technology
Original Assignee
Beijing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Technology filed Critical Beijing University of Technology
Priority to CN201910071979.4A priority Critical patent/CN109840559A/zh
Publication of CN109840559A publication Critical patent/CN109840559A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本发明提供了一种图像筛选方法、装置以及电子设备,涉及图像处理技术领域,包括:获取待处理图像数据;利用第一网络模型滤除低于预设分数值的待处理图像数据,得到第一图像数据以及与第一图像数据对应的图像检测数据值;利用哈希算法对第一图像数据中的相似度大于预设值的图像进行分组,并根据图像检测数据对分组后的第一图像数据进行筛选,得到第二图像数据;将第二图像数据输入至第二网络模型中,在第二网络模型中提取与预设场景相对应的第三图像数据;根据用户输入对第三图像数据进行筛选,得到目标图像数据,该方式提高了图片筛选的效率,且可根据用户的输入筛选满足用户需求的图片,为用户带来良好的体验。

Description

图像筛选方法、装置以及电子设备
技术领域
本发明涉及图像处理技术领域,尤其是涉及一种图像筛选方法、装置以及电子设备。
背景技术
随着科技的发展,生活变得丰富多彩,人们经常会用手机或相机记录生活,随后选一些图片分享到网站、微博、微信等社交平台。但由于图像美感及拍摄场景的复杂性和图像数量的爆炸式增长,编辑和管理图像存在困难。
现有技术通常是根据图像特点、美学理论等构造图像特征提取的算法,手动提取图像特征,并利用机器学习方法,如支持向量机(support vector machine,简称SVM)、支持向量回归(support vector regression,简称SVR)等,对图像美感进行分类或对图像美感进行评分,该方法通过手动提取图像特征,耗时费力且效率低。因此,对于现有技术而言,图像的特征提取过程费时费力。
发明内容
有鉴于此,本发明的目的在于提供一种图像筛选方法、装置以及电子设备,以解决现有技术中存在的图像的特征提取费时费力的技术问题。
第一方面,本发明实施例提供了一种图像筛选方法,包括:获取待处理图像数据;利用第一网络模型滤除低于预设分数值的待处理图像数据,得到第一图像数据以及与第一图像数据对应的图像检测数据值;利用哈希算法对第一图像数据中的相似度大于预设值的图像进行分组,并根据图像检测数据对分组后的第一图像数据进行筛选,得到第二图像数据;将第二图像数据输入至第二网络模型中,在第二网络模型中提取与预设场景相对应的第三图像数据;根据用户输入对第三图像数据进行筛选,得到目标图像数据。
结合第一方面,本发明实施例提供了第一方面的第一种可能的实施方式,其中,获取待处理图像数据包括:通过摄像设备获取初始图像数据;在初始图像数据中提取符合预设图像属性的图像数据,得到待处理图像数据,其中,预设图像属性包括:图像的文件格式以及图像的像素信息。
结合第一方面,本发明实施例提供了第一方面的第二种可能的实施方式,其中,利用第一网络模型滤除低于预设分数值的待处理图像数据,得到第一图像数据以及与第一图像数据对应的图像检测数据值之前,包括:获取多个带有标签的第一样本数据,其中,标签包括:第一标签以及第二标签,第一标签表示的图像检测数据值大于第二标签表示的图像检测数据值;将第一样本数据输入至第一网络模型,并通过第一网络模型进行训练,得到多个训练结果;将每个训练结果与第一样本数据的标签进行比较,得到比较结果,并根据比较结果得到每个训练结果的训练准确率;当训练准确率小于第一预设阈值时,对第一网络模型的模型参数进行调整,以使训练准确率大于等于第一预设阈值。
结合第一方面,本发明实施例提供了第一方面的第三种可能的实施方式,其中,将第二图像数据输入至第二网络模型中,在第二网络模型中提取与预设场景相对应的第三图像数据之前,包括:获取多个带有预设场景标签的第二样本数据;将第二样本数据输入至第二网络模型,并通过第二网络模型进行训练,得到多个训练结果;将每个训练结果与第二样本数据的预设场景标签进行比较,得到比较结果,并根据比较结果得到每个训练结果的训练准确率;当训练准确率小于第二预设阈值时,对第二网络模型的模型参数进行调整,以使训练准确率大于等于第二预设阈值。
结合第一方面,本发明实施例提供了第一方面的第四种可能的实施方式,其中,预设场景标签中的预设场景包括:户外场景以及室内场景;其中,户外场景包括:海岸、森林、公路、城市、山脉、乡村原野、建筑物、街道以及工厂中的至少之一,室内场景包括:卧室、厨房、客厅、商店以及办公室中的至少之一。
结合第一方面,本发明实施例提供了第一方面的第五种可能的实施方式,其中,第一网络模型以及第二网络模型均为卷积神经网络模型。
结合第一方面,本发明实施例提供了第一方面的第六种可能的实施方式,其中,根据用户输入对第三图像数据进行筛选,得到目标图像数据,包括:根据用户输入的场景、图像数量以及图像的采集时间,对第三图像数据进行筛选,得到目标图像数据。
第二方面,本发明实施例提供一种图像筛选装置,包括:
获取模块,用于获取待处理图像数据;
滤除模块,用于利用第一网络模型滤除低于预设分数值的待处理图像数据,得到第一图像数据以及与第一图像数据对应的图像检测数据值;
分组模块,用于利用哈希算法对第一图像数据中的相似度大于预设值的图像进行分组,并根据图像检测数据对分组后的第一图像数据进行筛选,得到第二图像数据;
提取模块,用于将第二图像数据输入至第二网络模型中,在第二网络模型中提取与预设场景相对应的第三图像数据;
筛选模块,用于根据用户输入对第三图像数据进行筛选,得到目标图像数据。
第三方面,本发明实施例还提供一种电子设备,包括存储器、处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述如第一方面所述的方法的步骤。
第四方面,本发明实施例还提供一种具有处理器可执行的非易失的程序代码的计算机可读介质,所述程序代码使所述处理器执行如第一方面所述的方法。
本发明实施例提供的技术方案带来了以下有益效果:本发明实施例提供了一种图像筛选方法、装置以及电子设备,包括:首先获取待处理图像数据,然后利用第一网络模型滤除低于预设分数值的待处理图像数据,得到第一图像数据以及与第一图像数据对应的图像检测数据值,之后利用哈希算法对第一图像数据中的相似度大于预设值的图像进行分组,并根据图像检测数据对分组后的第一图像数据进行筛选,得到第二图像数据,再者将第二图像数据输入至第二网络模型中,在第二网络模型中提取与预设场景相对应的第三图像数据,最后根据用户输入对第三图像数据进行筛选,从而得到目标图像数据,因此,通过获取待处理图像数据,利用第一网络模型滤除待处理图像数据中低于预设分数值的图像数据得到第一图像数据以及第一图像数据对应的图像数据检测值,然后利用哈希算法对第一图像数据进行分组,得到第二图像数据,之后利用第二网络模型在第二图像数据中提取与预设场景对应的第三图像数据,最后根据用户输入对第三图像数据进行筛选,得到目标图像数据,使图片的筛选效率得到提高,且提高了用户的体验度,从而解决了现有技术中存在的图像的特征提取费时费力的技术问题。
本发明的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书以及附图中所特别指出的结构来实现和获得。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本发明实施例一所提供的一种图像筛选方法的流程图;
图2示出了本发明实施例二所提供的一种图像筛选方法的流程图;
图3示出了本发明实施例二所提供的第一网络模型的训练方法的流程图;
图4示出了本发明实施例二所提供的第二网络模型的训练方法的流程图;
图5示出了本发明实施例二所提供的VGG16网络模型的结构示意图;
图6示出了本发明实施例三所提供的一种图像筛选装置的结构示意图;
图7示出了本发明实施例四所提供的一种电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
目前,利用计算机模拟人类对图像美感进行评估,关键在于利用计算机提取图像的美感信息,即图像的特征信息,然后利用这些特征进行美感判断。由于人类的审美角度、审美经验、审美习惯都是共性和个性并存的,图像美学评估涉及的细节多且复杂,没有统一的衡量作品美感程度的规则标准。因此,通过计算机学习人类思维,自动分析判断图像的美感程度,存在一定的难度。早期研究人员主要通过人工设计美学特征,再利用机器学习方法训练模型,其中美学特征的设计至关重要。研究人员根据人类视觉系统的特点和审美规则,主要从颜色、构图等方面人工设计许多富含语义且与图像美学属性相关的特征。这个方法在图像美学质量评估方面取得一定效果,但是由于图像美学质量评估的复杂性和主观性,人工特征方法难以设计可以准确描述图像高层语义信息的特征。一方面,面对日益增长的海量图像,人工遍历和筛选十分耗费时间和精力,人类已经无法胜任如此繁杂的图像美学管理工作;另一方面,摄影和图像美学评判方面的专业人士毕竟是少数,而大多数人缺乏专业的图像美感评估知识,有时在图像美感判断中难免出现偏颇,不符合更广为认同的审美习惯。因此,现有技术存在图像特征提取费时费力的技术问题。
基于此,本发明实施例提供的一种图像筛选方法、装置以及电子设备,可以解决现有技术中存在的图像的特征提取费时费力的技术问题。
为便于对本实施例进行理解,首先对本发明实施例所公开的一种图像筛选方法、装置以及电子设备进行详细介绍。
实施例一:
本发明实施例提供一种图像筛选方法,如图1所示,该方法包括:
步骤S102,获取待处理图像数据。
具体而言,待处理图像为满足预设像素和图片格式的初始图像数据,如:预设图片格式为“.jpg”,预设图片像素为96*96,则需要从初始图像数据中提取图片格式为.jpg的图像,并对格式为.jpg的图像进行处理得到图片像素为96*96的图片格式为.jpg的图像,即待处理图像数据。
步骤S104,利用第一网络模型滤除低于预设分数值的待处理图像数据,得到第一图像数据以及与第一图像数据对应的图像检测数据值。
需要说明地是,第一网络模型为卷积神经网络(Convolutional Neural Network,简称CNN)模型,深度学习方法是从大数据中自动学习特征,对图像全局信息和潜在的语义信息描述能力强,且通过对CNN网络进行适应性扩展,使其更适合图像筛选的应用。
此外,待处理图像数据的分数需要综合图片的多种美学因素(如:平衡、颜色和谐型、趣味、景深、光照、主体、三分、颜色丰富性)后,才能得到图片分数值,如:图片分数值的取值范围为1分—10分,那么预设分数值是用户根据需求设置的,可以为3分、5分以及其他分数值。
步骤S106,利用哈希算法对第一图像数据中的相似度大于预设值的图像进行分组,并根据图像检测数据对分组后的第一图像数据进行筛选,得到第二图像数据。
具体地,哈希算法为感知哈希算法(Perceptual hash algorithm,简称PHA),采用PHA对第一图像数据进行相似度判断,主要包括以下步骤:缩小图片尺寸,如:32*32;将缩小后的图片转化为灰度图,如:256阶的灰度图,可以通过浮点算法令Gray=Rx0.3+Gx0.59+Bx0.11、整数方法令Gray=(Rx30+Gx59+Bx11)/100、移位方法令Gray=(Rx76+Gx151+Bx28)>>8、平均值法Gray=(R+G+B)/3、选取绿色令Gray=G将缩小后的图片转化成灰度图片;计算离散余弦变换(DCT for Discrete Cosine Transform,简称DCT),将图片分离成分率的集合;缩小DCT,保留图片左上角8*8的区域;计算缩小DCT后图片像素点的平均值;将大于平均值的图片记录为1,小于等于平均值的图片记录为0;得到信息指纹。通过对图片的信息指纹进行比对,得到汉明距离,这里设置的预设值即预设汉明距离值,如:预设值为10,那么当两张图片的汉明距离值小于10,则认为图像相似或重复图,分为一组。
步骤S108,将第二图像数据输入至第二网络模型中,在第二网络模型中提取与预设场景相对应的第三图像数据。
进一步地,第二网络模型也为CNN模型,此外,预设的场景包括:户外场景以及室内场景;其中,户外场景包括:海岸、森林、公路、城市、山脉、乡村原野、建筑物、街道以及工厂中的至少之一,室内场景包括:卧室、厨房、客厅、商店以及办公室中的至少之一。通过步骤S108,可以获取与场景相对应的图像数据,为用户进行图像数据的选择提供方便。
步骤S110,根据用户输入对第三图像数据进行筛选,得到目标图像数据。
具体地,用户通过键入需求的图片数量、场景信息、时间信息等信息对图片进行选择,得到用户需求的图片,方便快捷,且用户体验度大大提高。
本发明实施例通过获取待处理图像数据,利用第一网络模型滤除待处理图像数据中低于预设分数值的图像数据得到第一图像数据以及第一图像数据对应的图像数据检测值,然后利用哈希算法对第一图像数据进行分组,得到第二图像数据,之后利用第二网络模型在第二图像数据中提取与预设场景对应的第三图像数据,最后根据用户输入对第三图像数据进行筛选,得到目标图像数据,提高了图片的筛选效率,且提高了用户的体验度。
实施例二:
本发明实施例提供一种图像筛选方法,如图2所示,该方法包括:
步骤S202,通过摄像设备获取初始图像数据。
具体地,用户通过手机、平板电脑以及相机采集初始图像数据,并将初始图像数据进行存储,可将初始图像数据存储到本地的服务器,以便调用。
步骤S204,在初始图像数据中提取符合预设图像属性的图像数据,得到待处理图像数据,其中,预设图像属性包括:图像的文件格式以及图像的像素信息。
需要说明的是,图像的格式包括:“.jpg”、“.jepg”、“.png”、“.gif”、“.bmp”本发明选取的图像的格式为“.jpg”以及“.jepg”,选取的图像的像素信息为96*96。
步骤S206,利用第一网络模型滤除低于预设分数值的待处理图像数据,得到第一图像数据以及与第一图像数据对应的图像检测数据值。
其中,利用第一网络模型滤除低于预设分数值的待处理图像数据,得到第一图像数据以及与第一图像数据对应的图像检测数据值之前,第一网络模型的训练方法,如图3所示,包括:
步骤S302,获取多个带有标签的第一样本数据,其中,标签包括:第一标签以及第二标签,第一标签表示的图像检测数据值大于第二标签表示的图像检测数据值。
具体地,本发明从Photo.net中下载8000张照片并从图像美学数据集美学因素数据集(aesthetics and attributes database,AADB)中选择8000张照片,组成一个16000张的数据集,其中8000张(score>=6)为正图像,8000张(score<=4.3)为负图像,用此数据集来训练和测试算法。由于Photo.net为在线照片共享社区,有超过400000名活跃的摄影师,他们不断为彼此的作品进行同行评级,但由于从Photo.net中下载的图像风格主要是风景类的或者人文艺术图,而用户包括专业摄影师、业余摄影爱好者以及无摄影基础的普通群众,所以需要扩大数据集,找一些偏生活照的图像,因此选择从AADB中挑8000张图像。AADB包含了8种美学因素(平衡、颜色和谐型、趣味、景深、光照、主体、三分、颜色丰富性)的二值分类评价,并给出了每张图的美学质量分数。
由于数据集中图像大小不一致,因此,将图像裁剪为正方形(仅保留中心区域)并将其下采样为96x96像素图像,加载数据集中所有图像,根据分数给图像打标签,把高于5分的定义为优质图像,标签为1即第一标签,低于5分的定义为质量差的图像,标签为-1即第二标签。
具体地,将数据集分割成训练、验证和测试集。训练集包含14500张图片(带有第一标签7250张图片和带有第二标签7250张图片),验证集包含1000张图片(带有第一标签500张图片和带有第二标签500张图片),测试集包含500张图(带有第一标签250张图片和带有第二标签250张图片),上述的数据即为第一样本数据。
步骤S304,将第一样本数据输入至第一网络模型,并通过第一网络模型进行训练,得到多个训练结果。
本发明使用第一网络模型的展平图层的输出作为图像的提取特征,并进行了参数调整以满足原始图像大小和所需的特征输出。待处理的图片输入第一网络模型进行图像美学质量评分,使用函数svm.predict(x)判断图像标签是1还是-1,并使用函数svm.predict_proba(x)输出模型预测值,即图像的分数。
步骤S306,将每个训练结果与第一样本数据的标签进行比较,得到比较结果,并根据比较结果得到每个训练结果的训练准确率。
步骤S308,当训练准确率小于第一预设阈值时,对第一网络模型的模型参数进行调整,以使训练准确率大于等于第一预设阈值。
具体地,将预先训练的权重加载到第一网络模型后,原始图像(3x96x96)转换为来自展平层的特征向量(1x4608),应用主成分析(principal components analysis,简称PCA)算法提取具有较低维度的新特征值,并且训练SVM分类器具有新特征值。如:第一预设阈值设置为90%,则第一网络模型的训练准确率低于90%,则需要进行参数的调整。通过训练,得到第一网模型的最优的参数:SVM正则化参数C=1,RBF核半径gamma=1e-6,并使用PCA提取3072个主成分。
步骤S208,利用哈希算法对第一图像数据中的相似度大于预设值的图像进行分组,并根据图像检测数据对分组后的第一图像数据进行筛选,得到第二图像数据。
步骤S210,将第二图像数据输入至第二网络模型中,在第二网络模型中提取与预设场景相对应的第三图像数据。
其中,将第二图像数据输入至第二网络模型中,在第二网络模型中提取与预设场景相对应的第三图像数据之前,第二网络模型的训练流程,如图4所示,包括:
步骤S402,获取多个带有预设场景标签的第二样本数据。
具体地,第二样本数据包括2800张图像,每个图像都有对应的预设场景标签,其中,预设场景标签中的预设场景包括:户外场景以及室内场景;其中,户外场景包括:海岸、森林、公路、城市、山脉、乡村原野、建筑物、街道以及工厂中的至少之一,室内场景包括:卧室、厨房、客厅、商店以及办公室中的至少之一。
步骤S404,将第二样本数据输入至第二网络模型,并通过第二网络模型进行训练,得到多个训练结果。
需要说明的是,本发明中第一网络模型以及第二网络模型均采用VGG16网络模型为例对第一样本数据以及第二样本数据进行训练,该模型的结构如图5所示,但具体应用时也可根据实际需求选择其他CNN模型,如:AlexNet网络模型、GoogleNet网络模型以及ResNet网络模型中的一种。
步骤S406,将每个训练结果与第二样本数据的预设场景标签进行比较,得到比较结果,并根据比较结果得到每个训练结果的训练准确率。
步骤S408,当训练准确率小于第二预设阈值时,对第二网络模型的模型参数进行调整,以使训练准确率大于等于第二预设阈值。
具体来说,如:第二预设阈值设置为90%,则第二网络模型的训练准确率低于90%,则需要进行参数的调整。
步骤S212,根据用户输入的场景、图像数量以及图像的采集时间,对第三图像数据进行筛选,得到目标图像数据。
具体而言,如:用户输入的场景为客厅,图片数量9张,图片的采集时间为2018年12月1日至2018年12月31日后,经过筛选即可得到用户所需的图像。
因此,本实施例提供的图像筛选方法能够帮助人们完成图像美学管理工作,用专业评估水平快速智能地推荐最优图片,省时省力,适用范围广,可延伸性强,也可用于其他图像领域,此外该方法采用深度卷积神经网络模型来进行图像的筛选,能够精确提取图像特征且模型的预测准确率高,进一步地,用户可以选择感兴趣的图像场景和需要图像的数量,根据不同用户不同需求,智能推荐给用户一组图片,提高用户的体验度。
实施例三:
本发明实施例提供一种图像筛选装置,如图6所示,该装置包括:获取模块61、滤除模块62、分组模块63、提取模块64以及筛选模块65。
需要说明的是,获取模块61用于获取待处理图像数据。滤除模块62用于利用第一网络模型滤除低于预设分数值的待处理图像数据,得到第一图像数据以及与第一图像数据对应的图像检测数据值。分组模块63用于利用哈希算法对第一图像数据中的相似度大于预设值的图像进行分组,并根据图像检测数据对分组后的第一图像数据进行筛选,得到第二图像数据。提取模块64用于将第二图像数据输入至第二网络模型中,在第二网络模型中提取与预设场景相对应的第三图像数据。筛选模块65用于根据用户输入对第三图像数据进行筛选,得到目标图像数据。
本发明实施例通过获取待处理图像数据,利用第一网络模型滤除待处理图像数据中低于预设分数值的图像数据得到第一图像数据以及第一图像数据对应的图像数据检测值,然后利用哈希算法对第一图像数据进行分组,得到第二图像数据,之后利用第二网络模型在第二图像数据中提取与预设场景对应的第三图像数据,最后根据用户输入对第三图像数据进行筛选,得到目标图像数据,提高了图片的筛选效率,且提高了用户的体验度。
实施例四:
本发明实施例提供的一种电子设备,如图7所示,电子设备7包括存储器71、处理器72,所述存储器中存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述实施例一或实施例二提供的方法的步骤。
参见图7,电子设备还包括:总线73和通信接口74,处理器72、通信接口74和存储器71通过总线73连接;处理器72用于执行存储器71中存储的可执行模块,例如计算机程序。
其中,存储器71可能包含高速随机存取存储器(Random Access Memory,简称RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。通过至少一个通信接口74(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接,可以使用互联网,广域网,本地网,城域网等。
总线73可以是ISA总线、PCI总线或EISA总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图7中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
其中,存储器71用于存储程序,所述处理器72在接收到执行指令后,执行所述程序,前述本发明任一实施例揭示的流过程定义的装置所执行的方法可以应用于处理器72中,或者由处理器72实现。
处理器72可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器72中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器72可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital SignalProcessing,简称DSP)、专用集成电路(Application Specific Integrated Circuit,简称ASIC)、现成可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器71,处理器72读取存储器71中的信息,结合其硬件完成上述方法的步骤。
实施例五:
本发明实施例提供的一种具有处理器可执行的非易失的程序代码的计算机可读介质,所述程序代码使所述处理器执行上述实施例一或实施例二提供的方法。
本发明实施例提供的具有处理器可执行的非易失的程序代码的计算机可读介质,与上述实施例提供的图像筛选方法、装置以及电子设备具有相同的技术特征,所以也能解决相同的技术问题,达到相同的技术效果。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
本发明实施例所提供的进行图像筛选方法、装置以及电子设备的计算机程序产品,包括存储了处理器可执行的非易失的程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (10)

1.一种图像筛选方法,其特征在于,包括:
获取待处理图像数据;
利用第一网络模型滤除低于预设分数值的所述待处理图像数据,得到第一图像数据以及与所述第一图像数据对应的图像检测数据值;
利用哈希算法对所述第一图像数据中的相似度大于预设值的图像进行分组,并根据所述图像检测数据对分组后的所述第一图像数据进行筛选,得到第二图像数据;
将所述第二图像数据输入至第二网络模型中,在所述第二网络模型中提取与预设场景相对应的第三图像数据;
根据用户输入对所述第三图像数据进行筛选,得到目标图像数据。
2.根据权利要求1所述的图像筛选方法,其特征在于,所述获取待处理图像数据包括:
通过摄像设备获取初始图像数据;
在所述初始图像数据中提取符合预设图像属性的图像数据,得到待处理图像数据,其中,所述预设图像属性包括:图像的文件格式以及图像的像素信息。
3.根据权利要求1所述的图像筛选方法,其特征在于,所述利用第一网络模型滤除低于预设分数值的所述待处理图像数据,得到第一图像数据以及与所述第一图像数据对应的图像检测数据值之前,包括:
获取多个带有标签的第一样本数据,其中,所述标签包括:第一标签以及第二标签,所述第一标签表示的图像检测数据值大于所述第二标签表示的图像检测数据值;
将所述第一样本数据输入至所述第一网络模型,并通过所述第一网络模型进行训练,得到多个训练结果;
将每个所述训练结果与所述第一样本数据的标签进行比较,得到比较结果,并根据所述比较结果得到每个所述训练结果的训练准确率;
当所述训练准确率小于第一预设阈值时,对所述第一网络模型的模型参数进行调整,以使所述训练准确率大于等于所述第一预设阈值。
4.根据权利要求1所述的图像筛选方法,其特征在于,所述将所述第二图像数据输入至第二网络模型中,在所述第二网络模型中提取与预设场景相对应的第三图像数据之前,包括:
获取多个带有预设场景标签的第二样本数据;
将所述第二样本数据输入至所述第二网络模型,并通过所述第二网络模型进行训练,得到多个训练结果;
将每个所述训练结果与所述第二样本数据的预设场景标签进行比较,得到比较结果,并根据所述比较结果得到每个所述训练结果的训练准确率;
当所述训练准确率小于第二预设阈值时,对所述第二网络模型的模型参数进行调整,以使所述训练准确率大于等于所述第二预设阈值。
5.根据权利要求4所述的图像筛选方法,其特征在于,所述预设场景标签中的预设场景包括:户外场景以及室内场景;
其中,所述户外场景包括:海岸、森林、公路、城市、山脉、乡村原野、建筑物、街道以及工厂中的至少之一,所述室内场景包括:卧室、厨房、客厅、商店以及办公室中的至少之一。
6.根据权利要求3或4所述的图像筛选方法,其特征在于,所述第一网络模型以及所述第二网络模型均为卷积神经网络模型。
7.根据权利要求1所述的图像筛选方法,其特征在于,所述根据用户输入对所述第三图像数据进行筛选,得到目标图像数据,包括:
根据用户输入的场景、图像数量以及图像的采集时间,对所述第三图像数据进行筛选,得到目标图像数据。
8.一种图像筛选装置,其特征在于,包括:
获取模块,用于获取待处理图像数据;
滤除模块,用于利用第一网络模型滤除低于预设分数值的所述待处理图像数据,得到第一图像数据以及与所述第一图像数据对应的图像检测数据值;
分组模块,用于利用哈希算法对所述第一图像数据中的相似度大于预设值的图像进行分组,并根据所述图像检测数据对分组后的所述第一图像数据进行筛选,得到第二图像数据;
提取模块,用于将所述第二图像数据输入至第二网络模型中,在所述第二网络模型中提取与预设场景相对应的第三图像数据;
筛选模块,用于根据用户输入对所述第三图像数据进行筛选,得到目标图像数据。
9.一种电子设备,包括存储器、处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述权利要求1至7任一项所述的方法的步骤。
10.一种具有处理器可执行的非易失的程序代码的计算机可读介质,其特征在于,所述程序代码使所述处理器执行所述权利要求1至7任一所述方法。
CN201910071979.4A 2019-01-24 2019-01-24 图像筛选方法、装置以及电子设备 Pending CN109840559A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910071979.4A CN109840559A (zh) 2019-01-24 2019-01-24 图像筛选方法、装置以及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910071979.4A CN109840559A (zh) 2019-01-24 2019-01-24 图像筛选方法、装置以及电子设备

Publications (1)

Publication Number Publication Date
CN109840559A true CN109840559A (zh) 2019-06-04

Family

ID=66884161

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910071979.4A Pending CN109840559A (zh) 2019-01-24 2019-01-24 图像筛选方法、装置以及电子设备

Country Status (1)

Country Link
CN (1) CN109840559A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110348422A (zh) * 2019-07-18 2019-10-18 北京地平线机器人技术研发有限公司 图像处理方法、装置、计算机可读存储介质和电子设备
CN110929070A (zh) * 2019-12-09 2020-03-27 北京字节跳动网络技术有限公司 图像处理方法、装置、电子设备及存储介质
CN111046933A (zh) * 2019-12-03 2020-04-21 东软集团股份有限公司 图像分类方法、装置、存储介质及电子设备
CN111209922A (zh) * 2020-01-14 2020-05-29 深圳市彬讯科技有限公司 基于svm和opencv的图像色系风格标记方法、装置、设备及介质
CN111309948A (zh) * 2020-02-14 2020-06-19 北京旷视科技有限公司 图片筛选方法、图片筛选装置以及电子设备
CN113435485A (zh) * 2021-06-15 2021-09-24 北京百度网讯科技有限公司 图片检测方法、装置、电子设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104408077A (zh) * 2014-11-03 2015-03-11 宇龙计算机通信科技(深圳)有限公司 图片的展现方法、展现系统和终端
CN107871011A (zh) * 2017-11-21 2018-04-03 广东欧珀移动通信有限公司 图像处理方法、装置、移动终端及计算机可读存储介质
CN108229574A (zh) * 2018-01-18 2018-06-29 维沃移动通信有限公司 一种图片筛选的方法、装置和移动终端

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104408077A (zh) * 2014-11-03 2015-03-11 宇龙计算机通信科技(深圳)有限公司 图片的展现方法、展现系统和终端
CN107871011A (zh) * 2017-11-21 2018-04-03 广东欧珀移动通信有限公司 图像处理方法、装置、移动终端及计算机可读存储介质
CN108229574A (zh) * 2018-01-18 2018-06-29 维沃移动通信有限公司 一种图片筛选的方法、装置和移动终端

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
YUEYINGKAO ET AL.: "Hierarchical aesthetic quality assessment using deep convolutional neural networks", 《SIGNAL PROCESSING: IMAGE COMMUNICATION》 *
南通大学教务处: "《学海图南 南通大学优秀毕业设计(论文)集》", 31 March 2016 *
路婵: "如何选出最"美"图片展示给你?携程做了基于深度学习的图像美感评分系统", 《名为"携程技术"的微信公众号平台》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110348422A (zh) * 2019-07-18 2019-10-18 北京地平线机器人技术研发有限公司 图像处理方法、装置、计算机可读存储介质和电子设备
CN110348422B (zh) * 2019-07-18 2021-11-09 北京地平线机器人技术研发有限公司 图像处理方法、装置、计算机可读存储介质和电子设备
CN111046933A (zh) * 2019-12-03 2020-04-21 东软集团股份有限公司 图像分类方法、装置、存储介质及电子设备
CN111046933B (zh) * 2019-12-03 2024-03-05 东软集团股份有限公司 图像分类方法、装置、存储介质及电子设备
CN110929070A (zh) * 2019-12-09 2020-03-27 北京字节跳动网络技术有限公司 图像处理方法、装置、电子设备及存储介质
CN111209922A (zh) * 2020-01-14 2020-05-29 深圳市彬讯科技有限公司 基于svm和opencv的图像色系风格标记方法、装置、设备及介质
CN111209922B (zh) * 2020-01-14 2023-09-01 深圳市彬讯科技有限公司 基于svm和opencv的图像色系风格标记方法、装置、设备及介质
CN111309948A (zh) * 2020-02-14 2020-06-19 北京旷视科技有限公司 图片筛选方法、图片筛选装置以及电子设备
CN113435485A (zh) * 2021-06-15 2021-09-24 北京百度网讯科技有限公司 图片检测方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN109840559A (zh) 图像筛选方法、装置以及电子设备
CN108764372B (zh) 数据集的构建方法和装置、移动终端、可读存储介质
CN111104898B (zh) 基于目标语义和注意力机制的图像场景分类方法及装置
RU2608261C2 (ru) Автоматическое генерирование тега на основании содержания изображения
CN109522967A (zh) 一种商品定位识别方法、装置、设备以及存储介质
CN109919097A (zh) 基于多任务学习的人脸和关键点联合检测系统、方法
CN113065558A (zh) 一种结合注意力机制的轻量级小目标检测方法
CN103530638B (zh) 多摄像头下的行人匹配方法
CN109165645A (zh) 一种图像处理方法、装置以及相关设备
CN109492665A (zh) 水稻生育期的检测方法、装置及电子设备
CN110046617A (zh) 一种基于深度学习的数字电表读数自适应识别方法
CN108921057A (zh) 基于卷积神经网络的对虾形态测量方法、介质、终端设备及装置
CN112818849B (zh) 基于对抗学习的上下文注意力卷积神经网络的人群密度检测算法
CN114241325A (zh) 基于街景图片的空调挂机空间分布自动识别方法及系统
CN104361357A (zh) 基于图片内容分析的相片集分类系统及分类方法
CN112766361A (zh) 一种同色系背景下目标果实检测方法及检测系统
CN115713605A (zh) 一种基于图像学习的商业类建筑群自动建模方法
CN113487610B (zh) 疱疹图像识别方法、装置、计算机设备和存储介质
CN109657728A (zh) 样例生产方法及模型训练方法
CN112668675A (zh) 一种图像处理方法、装置、计算机设备及存储介质
CN111797795A (zh) 一种基于YOLOv3与SSR的行人检测算法
CN117058069A (zh) 一种全景影像中路面表观病害自动检测方法
Sun et al. Automatic building age prediction from street view images
CN110519509A (zh) 构图评价方法、摄影方法、装置、电子设备、存储介质
Lu et al. A deep learning method for building façade parsing utilizing improved SOLOv2 instance segmentation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190604