CN107066980A - 一种图像变形检测方法及装置 - Google Patents
一种图像变形检测方法及装置 Download PDFInfo
- Publication number
- CN107066980A CN107066980A CN201710255930.5A CN201710255930A CN107066980A CN 107066980 A CN107066980 A CN 107066980A CN 201710255930 A CN201710255930 A CN 201710255930A CN 107066980 A CN107066980 A CN 107066980A
- Authority
- CN
- China
- Prior art keywords
- images
- recognized
- image
- target
- recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
- G06V10/754—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries involving a deformation of the sample pattern or of the reference pattern; Elastic matching
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- Evolutionary Computation (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Image Analysis (AREA)
Abstract
本发明提供一种图像变形检测方法及装置,其中,所述图像变形检测方法包括:获取待识别图像中的图像目标,利用与所述图像目标对应的预设变形识别模型,对所述图像目标进行识别,得到表示所述待识别图像是否变形的识别结果,所述预设变形识别模型为:利用所述图像目标的至少两组对应于不同类型的训练样本集,对已设计的所述图像目标的基础变形识别模型进行训练得到。本发明的方案,通过对待识别图像中的图像目标的识别来判定待识别图像是否发生形变,可将较为抽象的图像变形检测过程具体化、对象化,从而有效提高检测效率和检测成功率。
Description
技术领域
本发明涉及图像处理技术领域,尤其涉及一种图像变形检测方法及装置。
背景技术
当前,在图像处理过程中,可能存在着图像左右压缩或者图像上下压缩的情况,且这两种压缩情况会造成图像变形。因图像变形,图像中的对象会被拉伸或者压缩,所以,变形图像中的对象常常看起来模糊,比例不协调,影响图像的显示效果。
为了保证图像的显示效果,避免显示变形图像,在图像被显示之前,需对图像进行变形检测,以剔除已变形的图像。而当前,常用的图像变形检测方法为:人工检测或者直接利用图像变形算法检测图像。人工检测是采用人眼观察图像的方式检测图像,这样会耗时长,检测效率低,且由于人眼误差以及人的主观因素,还会造成检测结果不一致。而直接利用图像变形算法检测图像时,因图像本身较为抽象,所以对图像检测的效率低,成功率也低。
发明内容
本发明实施例提供了一种图像变形检测方法及装置,以解决现有检测方法的检测效率低,检测成功率低的问题。
一方面,本发明实施例提供一种图像变形检测方法,包括:
获取待识别图像中的图像目标;
利用与所述图像目标对应的预设变形识别模型,对所述图像目标进行识别,得到表示所述待识别图像是否变形的识别结果;
其中,所述预设变形识别模型为:利用所述图像目标的至少两组对应于不同类型的训练样本集,对已设计的所述图像目标的基础变形识别模型进行训练得到。
另一方面,本发明实施例还提供一种图像变形检测装置,包括:
获取模块,用于获取待识别图像中的图像目标;
识别模块,用于利用与所述图像目标对应的预设变形识别模型,对所述图像目标进行识别,得到表示所述待识别图像是否变形的识别结果;
其中,所述预设变形识别模型为:利用所述图像目标的至少两组对应于不同类型的训练样本集,对已设计的所述图像目标的基础变形识别模型进行训练得到。
本发明实施例的图像变形检测方法,通过对待识别图像中的图像目标的识别来判定待识别图像是否发生形变,可将较为抽象的图像变形检测过程具体化、对象化,从而有效提高检测效率和检测成功率。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1表示本发明实施例的图像变形检测系统的结构示意图;
图2表示本发明实施例的图像变形检测方法的流程图;
图3表示本发明具体实例的预设变形识别模型的训练过程的流程图;
图4表示本发明具体实例的图像变形检测过程的流程图;
图5表示本发明实施例的一图像变形检测装置的结构示意图;
图6表示本发明实施例的另一图像变形检测装置的结构示意图;
图7表示本发明实施例的图像检测设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
首先指出的是,本发明实施例的图像变形检测方法,是通过对待识别图像中的图像目标的识别来判定图像本身是否发生形变,这样,可将较为抽象的图像变形检测过程具体化、对象化,从而有效提高检测效率和检测成功率。
其中,图像目标指的是图像中一个个具体的对象,例如人脸、人体、文字、动物、建筑物、汽车等,只要是图像中的具体对象基本都可视为该图像中的图像目标。
本发明实施例中,上述图像变形检测方法可以应用于如图1所示的由服务器101和终端102所构成的场景中。如图1所示,服务器101通过网络与终端102进行通信,上述网络包括但不限于:广域网、城域网或局域网,终端102并不限定于个人电脑(PC)、手机、平板电脑、图像检测设备等。本发明实施例的图像变形检测方法可以由服务器101来执行,也可以由终端102来执行,还可以是由服务器101和终端102共同执行。其中,终端102执行本发明实施例的图像变形检测方法也可以是由安装在其上的客户端来执行。
需要说明的是,图1所示的硬件环境还可以根据需求包含其他的硬件模块,本发明实施例的图像变形检测方法也可以由其他的硬件模块执行,本实施例不对其进行限定。
下面通过一些具体实施例对本发明的图像变形检测方法进行说明。
参见图2所示,本发明实施例提供一种图像变形检测方法,包括如下步骤201至步骤202,详述如下。
步骤201:获取待识别图像中的图像目标。
其中,待识别图像可以是实际业务场景中的支持多种格式的业务图像,例如图像专辑中的图像、视频封面中的图像等。图像目标可以是待识别图像中的人脸、人体、文字、动物、建筑物和/或汽车等对象。具体的,获取的图像目标可以是一个图像目标,也可以是多个图像目标,且图像目标的对象类型可以是一种,也可以是多种,本发明不对其进行限制。而获取图像目标的方式可以根据具体图像目标来定,也可以为现有方式,例如基于深度学习和大数据的更快神经网络faster R-CNN方法提取各图像目标。
步骤202:利用与所述图像目标对应的预设变形识别模型,对所述图像目标进行识别,得到表示所述待识别图像是否变形的识别结果。
其中,预设变形识别模型具体为:利用图像目标的至少两组对应于不同类型的训练样本集,对已设计的图像目标的基础变形识别模型进行训练得到。已设计的图像目标的基础变形识别模型可以是传统模式识别模型中的支持向量机(Support Vector Machine,简称SVM)模型、Adaboost等模型,也可以是深度学习中的卷积神经网络模型,只要通过图像目标的训练样本集的训练,能够识别相应的图像目标即可。
以图像目标A为例,参见图3所示,与图像目标A对应的预设变形识别模型的训练过程可为:首先,搜集图像目标A的三类训练样本集,即图像目标A正常类样本集、非图像目标A的其他样本集和图像目标A变形类样本集,设计图像目标A的基础变形识别模型(即初始模型);然后,利用图像目标A的三类训练样本集对已设计的基础变形识别模型进行训练;其中,训练过程例如为结合训练样本集和基础变形识别模型对该训练样本集中的样本的识别结果,调整基础变形识别模型中的参数,直至能够正确识别训练样本集的类型;最后,将训练后的模型确定为与图像目标A对应的预设变形识别模型。
需要指出的是,由于图像目标为待识别图像中的对象,所以,利用与图像目标对应的预设变形识别模型对图像目标进行识别的识别结果,即可表示相应待识别图像是否变形。例如,若对图像目标进行识别得到的识别结果为图像目标未变形,则该识别结果可表示该图像目标对应的待识别图像未变形;若对图像目标进行识别得到的识别结果为图像目标变形,则该识别结果可表示该图像目标对应的待识别图像变形。
这样,本发明实施例的图像变形检测方法,通过对待识别图像中的图像目标的识别来判定图像本身是否发生形变,能够将较为抽象的图像变形检测过程具体化、对象化,从而有效提高检测效率和检测的成功率。
本发明实施例中,图像目标的对象类型可包括如下对象类型中的一种或多种:人脸、人体、文字、动物、建筑物和车辆等。也就是说,本发明实施例的图像变形检测方法可通过对一种对象类型下的图像目标的识别来判定待识别图像是否发生形变,也可以通过对多种对象类型下的图像目标的识别来判定待识别图像是否发生形变。
而在选取对哪种对象类型下的图像目标进行识别时,可优先考虑用户对图像目标变形的容忍度,即若用户对一对象类型下的图像目标的变形的容忍度较低,则在图像变形检测时,可优先选取该对象类型下的图像目标。
例如,对于电影海报、视频封面等内容,由于用户对图像中人的变形的容忍度较低,因此,当待识别图像中有人脸时,可优先选取人脸作为图像目标。这样,利用用户容忍度较低的图像目标进行图像变形识别,可提高用户对识别结果的满意度。
又如对于玩具类商品的海报,用户可能更多的关注于其中的玩具本身,如电子汽车,而不会过多的关注模特是否变形,而玩具本身的变形会给用户带来的误导,因此,这种情况下,可以选择图像中的玩具对象进行变形图像识别。
在对多种对象类型下的图像目标进行识别时,可分别对每一种对象类型下的图像目标进行识别,并综合考虑得到的多种识别结果来判定待识别图像是否发生形变。这样,相比于通过对一种对象类型下的图像目标的识别来判定待识别图像是否发生形变,通过对多种对象类型下的图像目标的识别来判定待识别图像是否发生形变,可提高对待识别图像的检测精度。
本发明实施例中,当通过对多种对象类型下的图像目标的识别来判定待识别图像是否发生形变时,首先要获取多种对象类型下的图像目标。而在获取多种对象类型下的图像目标时,针对每一种对象类型可执行如下过程:
首先,利用基于深度学习的物体检测模型,检测待识别图像中是否存在图像目标;
然后,若检测到待识别图像中存在图像目标,则从待识别图像中存在的图像目标中依据检测评分选取至少一个图像目标。
其中,利用基于深度学习的物体检测模型进行检测的过程可为:首先,将待识别图像输入基于深度学习的物体检测模型;然后,该物体检测模型输出对应的待识别图像中的对象和检测评分;若某一对象的检测评分超过一预设分数(例如60分),则可确定该对象为图像目标,进而确定待识别图像中存在图像目标。这样,借助利用基于深度学习的物体检测模型进行的检测过程,可获知待识别图像中是否存在图像目标以及存在的图像目标的检测评分。
而当从待识别图像中存在的图像目标中依据检测评分选取至少一个图像目标时,可以从待识别图像中存在的图像目标中选取检测评分最高的图像目标,也可以从待识别图像中存在的图像目标中选取检测评分超过预设分数阈值的多个图像目标,主要依据相应检测装置的预先要求而定。举例来说,预先要求选取检测评分超过预设阈值的多个图像目标时,预设分数阈值可设为85分,若检测评分超过85分的图像目标有5个,则可直接选取该5个图像目标进行后续的识别检测。
实际应用中,当利用预设变形识别模型对待识别图像中的同一种对象类型下的多个图像目标进行识别时,因识别误差,不可避免地会出现相反的识别结果。例如,对于同一种对象类型下的图像目标A和B,当利用对应的预设变形识别模型对图像目标A和B进行识别时,可能会出现针对图像目标A的识别结果表示待识别图像变形,而针对图像目标B的识别结果表示待识别图像未变形。对于此种情况,为了避免误判去除正常图片,可在多个识别结果中至少有一个识别结果表示待识别图像未变形时,确定最终的识别结果表示待识别图像未变形。
在本发明一些具体实施例中,对于同一种对象类型下的多个图像目标,利用与图像目标对应的预设变形识别模型,对图像目标进行识别,得到表示待识别图像是否变形的识别结果的过程可具体为:
首先,利用与图像目标对应的预设变形识别模型,分别对多个图像目标进行识别,得到多个识别结果;
然后,若多个识别结果中至少有一个识别结果表示待识别图像未变形,则确定由该预设变形识别模型识别得到的识别结果表示待识别图像未变形。
这样,只要多个识别结果中有一个识别结果表示待识别图像未变形,就确定待识别图像未变形,能够避免误判去除正常图片。
此外,其他情况下,由于不同识别的精度不同,为了避免错误的判断,遗留变形图像,因此,当任意识别结果中至少有一个识别结果表示待识别图像变形时,可确定最终的识别结果表示待识别图像变形。
本发明实施例中,当存在多个识别结果时,也可以采用少数服从多数的方式确定最终的识别结果。即若多个识别结果中,表示待识别图像变形的识别结果比表示待识别图像未变形的识别结果多,则确定最终识别结果表示待识别图像变形,否则,确定最终识别结果表示待识别图像未变形;或者若多个识别结果中,表示待识别图像未变形的识别结果比表示待识别图像变形的识别结果多,则确定最终识别结果表示待识别图像未变形,否则,确定最终识别结果表示待识别图像变形。
需要指出的是,对于同一种对象类型下多个图像目标的多个识别结果,除了上述确定最终识别结果的方式外,本发明具体实施例中还可有其它的确定方式,例如,若多个识别结果中至少有两个识别结果表示待识别图像未变形,则确定最终识别结果表示待识别图像未变形;或者,若多个识别结果中至少有两个识别结果表示待识别图像变形,则确定最终识别结果表示待识别图像变形等,这些都应属于本发明的保护范围。
对于待识别图像中的多个图像目标,如对象类型不同,它们在图像变形识别时的重要性或参考价值通常是不同的。以人脸和文字为例,一般用户对图像中人的变形的容忍度较低,而对文字变形的容忍度相对较高,所以,在图像变形识别时,利用人脸进行识别得到的识别结果的参考价值会高于利用文字进行识别得到的识别结果的参考价值,即人脸相比于文字在图像变形识别时的重要性高。所以,为区分不同对象类型下的图像目标在图像变形识别时的重要性,可预先设置每种对象类型的权重值,并根据预设的每种对象类型的权重值,对多种对象类型下的多个图像目标进行图像变形识别得到的多种识别结果进行加权处理,并根据加权处理得到的结果,确定相应待识别图像是否变形。
在本发明一些具体实施例中,当选取到多种对象类型下的多个图像目标时,该利用与图像目标对应的预设变形识别模型,对图像目标进行识别,得到表示待识别图像是否变形的识别结果的过程可具体为:
首先,依次利用与每种对象类型下的图像目标对应的预设变形识别模型,对选取的每种对象类型下的图像目标进行识别,得到多种识别结果,该多种识别结果与多种对象类型一一对应;
然后,根据预设的每种对象类型的权重值,对该多种识别结果进行加权处理,得到加权处理结果;
最后,利用加权处理结果,确定最终表示待识别图像是否变形的识别结果。
其中,利用与每种对象类型下的图像目标对应的预设变形识别模型,对选取的每种对象类型下的图像目标进行识别的过程,可参见上述针对同一种对象类型下的图像目标进行识别的过程,在此不再赘述。
由于多种识别结果是对多种对象类型下的图像目标进行识别得到的,所以,可将预设的每种对象类型的权重值视为对应识别结果的权重值。对多种识别结果进行加权处理具体为综合考虑多种识别结果中的每种识别结果的权重值,将相同识别结果的权重值累加在一起,对多种识别结果进行分类,并得到每类识别结果的权重值。而在利用加权处理结果,确定最终表示待识别图像是否变形的识别结果时,是将权重值最高的那类识别结果确定为最终表示待识别图像是否变形的识别结果。
例如,选取三种对象类型下的图像目标,这三种对象类型分别为人脸、建筑物和车辆,人脸的权重值为80%,建筑物的权重值为10%,车辆的权重值为10%,若经过预设变形识别模型的识别,人脸对应的识别结果表示待识别图像变形,建筑物对应的识别结果表示待识别图像未变形,车辆对应的识别结果表示待识别图像未变形,则经过加权处理,表示待识别图像变形的那类识别结果的权重值为80%,表示待识别图像未变形的那类识别结果的权重值为20%,这样,最终识别结果表示待识别图像变形。
下面,结合图4对本发明具体实例的图像变形检测过程进行说明。
本发明具体实例中,以人脸作为图像目标。在对待识别图像进行变形检测之前,先预设与人脸对应的人脸变形识别模型。其中,人脸变形识别模型的预设过程可为:首先,搜集整理正常人脸图像、变形人脸图像和没有人脸的图像,分别对应于正常人脸样本集(标签值为0)、变形人脸样本集(标签值为1)和非人脸的样本集(标签值为2),并选取Googlenet网络作为训练模型,将Googlenet网络训练模型设计为三分类模型;然后,在caffe框架下利用整理好的三组样本集对已设计的三分类Googlenet网络训练模型进行训练,得到相应的人脸变形识别模型。训练过程中,为提高网络收敛速度,可建图形处理器gpu支持。
参见图4所示,该具体实例中的图像变形检测过程包括如下步骤:
步骤41:当有业务图像的识别请求时,获取待识别的业务图像;
步骤42:利用基于深度学习的物体检测模型,检测待识别业务图像中是否存在人脸;
步骤43:若检测到待识别业务图像中不存在人脸,则判定在以人脸为图像目标时,待识别业务图像未变形;
步骤44:若检测到待识别业务图像中存在人脸,则从待识别业务图像中存在的人脸中选取检测评分最高的人脸;
步骤45:利用已训练好的三分类人脸变形识别模型,对选取的人脸进行识别,得到识别结果top-1;其中,top-1是三分类模型中概率最大的标签值;
步骤46:若识别结果top-1为0、2,则待识别业务图像未变形;
步骤47:若识别结果top-1为1,则待识别业务图像变形。
上述实施例对本发明的图像变形检测方法进行了说明,下面将结合实施例和附图对本发明的与图像变形检测方法对应的图像变形检测装置进行说明。
参见图5所示,本发明实施例还提供一种图像变形检测装置,包括:
获取模块51,用于获取待识别图像中的图像目标;
识别模块52,用于利用与所述图像目标对应的预设变形识别模型,对所述图像目标进行识别,得到表示所述待识别图像是否变形的识别结果。
其中,所述预设变形识别模型为:利用所述图像目标的至少两组对应于不同类型的训练样本集,对已设计的所述图像目标的基础变形识别模型进行训练得到。
本发明实施例中,所述图像目标的对象类型为一种或多种,参见图6所示,所述获取模块51包括:
检测单元511,用于针对每一种对象类型,利用基于深度学习的物体检测模型,检测所述待识别图像中是否存在所述图像目标;
选取单元512,用于当检测到所述待识别图像中存在所述图像目标时,从所述待识别图像中存在的图像目标中依据检测评分选取至少一个图像目标。
其中,所述选取单元具体用于:
从所述待识别图像中存在的图像目标中选取检测评分最高的图像目标或检测评分超过预设分数阈值的多个图像目标。
本发明实施例中,参见图6所示,所述识别模块52可包括:
第一识别单元521,用于当获取的图像目标为同一种对象类型下的多个图像目标时,利用与所述图像目标对应的预设变形识别模型,分别对所述多个图像目标进行识别,得到多个识别结果;
第一确定单元522,用于当所述多个识别结果中,表示所述待识别图像变形的识别结果比表示所述待识别图像未变形的识别结果多时,确定最终识别结果表示所述待识别图像变形;或者,当所述多个识别结果中,表示所述待识别图像变形的识别结果不比表示所述待识别图像未变形的识别结果多时,确定最终识别结果表示所述待识别图像未变形。
本发明实施例中,参见图6所示,所述识别模块52可包括:
第二识别单元523,用于当获取的图像目标为多种对象类型下的多个图像目标时,依次利用与每种对象类型下的图像目标对应的预设变形识别模型,对选取的每种对象类型下的图像目标进行识别,得到多种识别结果,所述多种识别结果与所述多种对象类型一一对应;
加权处理单元524,用于根据预设的每种对象类型的权重值,对所述多种识别结果进行加权处理,得到加权处理结果;
第二确定单元525,用于利用所述加权处理结果,确定最终表示所述待识别图像是否变形的识别结果。
其中,所述图像目标的对象类型可包括如下对象类型中的一种或多种:人脸、人体、文字、动物、建筑物和车辆。
本发明实施例的图像变形检测装置,通过对待识别图像中的图像目标的识别来判定待识别图像是否发生形变,可将较为抽象的图像变形检测过程具体化、对象化,从而有效提高检测效率和检测成功率。
此外,本发明实施例还提供一种图像检测设备,包括存储器、处理器和存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时可实现上述图像变形检测方法中的步骤。
具体的,参见图7所示,本发明实施例的图像检测设备可包括总线71、处理器72、收发机73、总线接口74、存储器75和用户接口76。
其中,借助用户接口76,用户可输入待识别图像至图像检测设备。处理器72,用于读取存储器75中的计算机程序,执行下列过程:
控制收发机73获取待识别图像中的图像目标,利用与所述图像目标对应的预设变形识别模型,对所述图像目标进行识别,得到表示所述待识别图像是否变形的识别结果;所述预设变形识别模型为:利用所述图像目标的至少两组对应于不同类型的训练样本集,对已设计的所述图像目标的基础变形识别模型进行训练得到。
收发机73,用于在处理器72的控制下接收和发送数据。
具体的,所述图像目标的对象类型为一种或多种,处理器72还用于:利用基于深度学习的物体检测模型,检测所述待识别图像中是否存在所述图像目标,在检测到所述待识别图像中存在所述图像目标时,从所述待识别图像中存在的图像目标中依据检测评分选取至少一个图像目标。
具体的,处理器72还用于:从所述待识别图像中存在的图像目标中选取检测评分最高的图像目标或检测评分超过预设分数阈值的多个图像目标。
具体的,当获取的图像目标为同一种对象类型下的多个图像目标时,处理器72还用于:利用与所述图像目标对应的预设变形识别模型,分别对所述多个图像目标进行识别,得到多个识别结果,当所述多个识别结果中,表示所述待识别图像变形的识别结果比表示所述待识别图像未变形的识别结果多时,确定最终识别结果表示所述待识别图像变形;或者,当所述多个识别结果中,表示所述待识别图像变形的识别结果不比表示所述待识别图像未变形的识别结果多时,确定最终识别结果表示所述待识别图像未变形。
具体的,当获取的图像目标为多种对象类型下的多个图像目标时,处理器72还用于:依次利用与每种对象类型下的图像目标对应的预设变形识别模型,对选取的每种对象类型下的图像目标进行识别,得到多种识别结果,所述多种识别结果与所述多种对象类型一一对应,根据预设的每种对象类型的权重值,对所述多种识别结果进行加权处理,得到加权处理结果,利用所述加权处理结果,确定最终表示所述待识别图像是否变形的识别结果。
具体的,所述图像目标的对象类型可包括如下对象类型中的一种或多种:人脸、人体、文字、动物、建筑物和车辆。
在图7中,总线架构(用总线71来代表),总线71可以包括任意数量的互联的总线和桥,总线71将包括由通用处理器72代表的一个或多个处理器和存储器75代表的存储器的各种电路链接在一起。总线71还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口74在总线71和收发机73之间提供接口。收发机73可以是一个元件,也可以是多个元件,比如多个接收器和发送器,提供用于在传输介质上与各种其他装置通信的单元。例如:收发机73从其他设备接收外部数据。收发机73用于将处理器72处理后的数据发送给其他设备。取决于计算系统的性质,还可以提供用户接口76,例如小键盘、显示器、扬声器、麦克风、操纵杆。
处理器72负责管理总线71和通常的处理,如前述所述运行通用操作系统。而存储器75可以被用于存储处理器72在执行操作时所使用的数据,例如图像目标对应的预设变形识别模型、预设特征匹配库等。
可选的,处理器72可以是GPU、CPU、ASIC、FPGA或CPLD。
可以理解,本发明实施例中的存储器75可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(Read-Only Memory,ROM)、可编程只读存储器(Programmable ROM,PROM)、可擦除可编程只读存储器(Erasable PROM,EPROM)、电可擦除可编程只读存储器(Electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(Static RAM,SRAM)、动态随机存取存储器(Dynamic RAM,DRAM)、同步动态随机存取存储器(Synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data RateSDRAM,DDRSDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(Synchlink DRAM,SLDRAM)和直接内存总线随机存取存储器(DirectRambus RAM,DRRAM)。本文描述的系统和方法的存储器75旨在包括但不限于这些和任意其它适合类型的存储器。
在一些实施方式中,存储器75存储了如下的元素,可执行模块或者数据结构,或者他们的子集,或者他们的扩展集:操作系统751和应用程序752。存储器75中存储有预设变形识别模型。
其中,操作系统751,包含各种系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务。应用程序752,包含各种应用程序,例如媒体播放器(Media Player)、浏览器(Browser)等,用于实现各种应用业务。实现本发明实施例方法的程序可以包含在应用程序752中。
本发明实施例的图像检测设备,通过对待识别图像中的图像目标的识别来判定待识别图像是否发生形变,可将较为抽象的图像变形检测过程具体化、对象化,从而有效提高检测效率和检测成功率。
本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序(指令),该程序(指令)被处理器执行时实现以下步骤:
获取待识别图像中的图像目标;
利用与所述图像目标对应的预设变形识别模型,对所述图像目标进行识别,得到表示所述待识别图像是否变形的识别结果;所述预设变形识别模型为:利用所述图像目标的至少两组对应于不同类型的训练样本集,对已设计的所述图像目标的基础变形识别模型进行训练得到。
可选地,所述图像目标的对象类型为一种或多种,该程序(指令)被处理器执行时还可以实现以下步骤:利用基于深度学习的物体检测模型,检测所述待识别图像中是否存在所述图像目标,在检测到所述待识别图像中存在所述图像目标时,从所述待识别图像中存在的图像目标中依据检测评分选取至少一个图像目标。
可选地,该程序(指令)被处理器执行时还可以实现以下步骤:从所述待识别图像中存在的图像目标中选取检测评分最高的图像目标或检测评分超过预设分数阈值的多个图像目标。
可选地,当获取的图像目标为同一种对象类型下的多个图像目标时,该程序(指令)被处理器执行时还可以实现以下步骤:利用与所述图像目标对应的预设变形识别模型,分别对所述多个图像目标进行识别,得到多个识别结果,当所述多个识别结果中,表示所述待识别图像变形的识别结果比表示所述待识别图像未变形的识别结果多时,确定最终识别结果表示所述待识别图像变形;或者,当所述多个识别结果中,表示所述待识别图像变形的识别结果不比表示所述待识别图像未变形的识别结果多时,确定最终识别结果表示所述待识别图像未变形。
可选地,当获取的图像目标为多种对象类型下的多个图像目标时,该程序(指令)被处理器执行时还可以实现以下步骤:依次利用与每种对象类型下的图像目标对应的预设变形识别模型,对选取的每种对象类型下的图像目标进行识别,得到多种识别结果,所述多种识别结果与所述多种对象类型一一对应,根据预设的每种对象类型的权重值,对所述多种识别结果进行加权处理,得到加权处理结果,利用所述加权处理结果,确定最终表示所述待识别图像是否变形的识别结果。
可选地,所述图像目标的对象类型可包括如下对象类型中的一种或多种:人脸、人体、文字、动物、建筑物和车辆。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据,或预设变形识别模型。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (12)
1.一种图像变形检测方法,其特征在于,包括:
获取待识别图像中的图像目标;
利用与所述图像目标对应的预设变形识别模型,对所述图像目标进行识别,得到表示所述待识别图像是否变形的识别结果;
其中,所述预设变形识别模型为:利用所述图像目标的至少两组对应于不同类型的训练样本集,对已设计的所述图像目标的基础变形识别模型进行训练得到。
2.根据权利要求1所述的图像变形检测方法,其特征在于,所述图像目标的对象类型为一种或多种,所述获取待识别图像中的图像目标的步骤中,针对每一种对象类型执行如下步骤:
利用基于深度学习的物体检测模型,检测所述待识别图像中是否存在所述图像目标;
若检测到所述待识别图像中存在所述图像目标,则从所述待识别图像中存在的图像目标中依据检测评分选取至少一个图像目标。
3.根据权利要求2所述的图像变形检测方法,其特征在于,所述从所述待识别图像中存在的图像目标中依据检测评分选取至少一个图像目标的步骤,包括:
从所述待识别图像中存在的图像目标中选取检测评分最高的图像目标或检测评分超过预设分数阈值的多个图像目标。
4.根据权利要求1所述的图像变形检测方法,其特征在于,当获取的图像目标为同一种对象类型下的多个图像目标时,所述利用与所述图像目标对应的预设变形识别模型,对所述图像目标进行识别,得到表示所述待识别图像是否变形的识别结果的步骤,包括:
利用与所述图像目标对应的预设变形识别模型,分别对所述多个图像目标进行识别,得到多个识别结果;
若所述多个识别结果中,表示所述待识别图像变形的识别结果比表示所述待识别图像未变形的识别结果多,则确定最终识别结果表示所述待识别图像变形,否则,确定最终识别结果表示所述待识别图像未变形。
5.根据权利要求1所述的图像变形检测方法,其特征在于,当获取的图像目标为多种对象类型下的多个图像目标时,所述利用与所述图像目标对应的预设变形识别模型,对所述图像目标进行识别,得到表示所述待识别图像是否变形的识别结果的步骤,包括:
依次利用与每种对象类型下的图像目标对应的预设变形识别模型,对选取的每种对象类型下的图像目标进行识别,得到多种识别结果,所述多种识别结果与所述多种对象类型一一对应;
根据预设的每种对象类型的权重值,对所述多种识别结果进行加权处理,得到加权处理结果;
利用所述加权处理结果,确定最终表示所述待识别图像是否变形的识别结果。
6.根据权利要求1-5中任一项所述的图像变形检测方法,其特征在于,所述图像目标的对象类型包括如下对象类型中的一种或多种:人脸、人体、文字、动物、建筑物和车辆。
7.一种图像变形检测装置,其特征在于,包括:
获取模块,用于获取待识别图像中的图像目标;
识别模块,用于利用与所述图像目标对应的预设变形识别模型,对所述图像目标进行识别,得到表示所述待识别图像是否变形的识别结果;
其中,所述预设变形识别模型为:利用所述图像目标的至少两组对应于不同类型的训练样本集,对已设计的所述图像目标的基础变形识别模型进行训练得到。
8.根据权利要求7所述的图像变形检测装置,其特征在于,所述图像目标的对象类型为一种或多种,所述获取模块包括:
检测单元,用于针对每一种对象类型,利用基于深度学习的物体检测模型,检测所述待识别图像中是否存在所述图像目标;
选取单元,用于当检测到所述待识别图像中存在所述图像目标时,从所述待识别图像中存在的图像目标中依据检测评分选取至少一个图像目标。
9.根据权利要求8所述的图像变形检测装置,其特征在于,所述选取单元具体用于:
从所述待识别图像中存在的图像目标中选取检测评分最高的图像目标或检测评分超过预设阈值的多个图像目标。
10.根据权利要求7所述的图像变形检测装置,其特征在于,所述识别模块包括:
第一识别单元,用于当获取的图像目标为同一种对象类型下的多个图像目标时,利用与所述图像目标对应的预设变形识别模型,分别对所述多个图像目标进行识别,得到多个识别结果;
第一确定单元,用于当所述多个识别结果中,表示所述待识别图像变形的识别结果比表示所述待识别图像未变形的识别结果多时,确定最终识别结果表示所述待识别图像变形;或者,当所述多个识别结果中,表示所述待识别图像变形的识别结果不比表示所述待识别图像未变形的识别结果多时,确定最终识别结果表示所述待识别图像未变形。
11.根据权利要求7所述的图像变形检测装置,其特征在于,所述识别模块包括:
第二识别单元,用于当获取的图像目标为多种对象类型下的多个图像目标时,依次利用与每种对象类型下的图像目标对应的预设变形识别模型,对选取的每种对象类型下的图像目标进行识别,得到多种识别结果,所述多种识别结果与所述多种对象类型一一对应;
加权处理单元,用于根据预设的每种对象类型的权重值,对所述多种识别结果进行加权处理,得到加权处理结果;
第二确定单元,用于利用所述加权处理结果,确定最终表示所述待识别图像是否变形的识别结果。
12.根据权利要求7-11中任一项所述的图像变形检测装置,其特征在于,所述图像目标的对象类型包括如下对象类型中的一种或多种:人脸、人体、文字、动物、建筑物和车辆。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710255930.5A CN107066980B (zh) | 2017-04-18 | 2017-04-18 | 一种图像变形检测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710255930.5A CN107066980B (zh) | 2017-04-18 | 2017-04-18 | 一种图像变形检测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107066980A true CN107066980A (zh) | 2017-08-18 |
CN107066980B CN107066980B (zh) | 2020-04-24 |
Family
ID=59600811
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710255930.5A Active CN107066980B (zh) | 2017-04-18 | 2017-04-18 | 一种图像变形检测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107066980B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108229498A (zh) * | 2017-08-30 | 2018-06-29 | 黄建龙 | 一种拉链片识别方法、装置及设备 |
CN108921811A (zh) * | 2018-04-03 | 2018-11-30 | 阿里巴巴集团控股有限公司 | 检测物品损伤的方法和装置、物品损伤检测器 |
CN109740664A (zh) * | 2018-12-28 | 2019-05-10 | 东莞中国科学院云计算产业技术创新与育成中心 | 柔性物体分类方法、装置、计算机设备和存储介质 |
CN111541911A (zh) * | 2020-04-21 | 2020-08-14 | 腾讯科技(深圳)有限公司 | 视频检测方法和装置、存储介质及电子装置 |
CN112651931A (zh) * | 2020-12-15 | 2021-04-13 | 浙江大华技术股份有限公司 | 建筑物变形监测方法、装置和计算机设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130148881A1 (en) * | 2011-12-12 | 2013-06-13 | Alibaba Group Holding Limited | Image Classification |
CN103258216A (zh) * | 2013-05-15 | 2013-08-21 | 中国科学院自动化研究所 | 一种基于在线学习的局部可形变目标检测方法及其系统 |
CN103778435A (zh) * | 2014-01-16 | 2014-05-07 | 大连理工大学 | 一种基于视频的行人快速检测方法 |
CN104008359A (zh) * | 2014-04-18 | 2014-08-27 | 杭州晟元芯片技术有限公司 | 一种用于qr码识别的精确网格采样方法 |
CN104134071A (zh) * | 2014-06-20 | 2014-11-05 | 北京工业大学 | 一种基于颜色描述的可变形部件模型物体检测方法 |
-
2017
- 2017-04-18 CN CN201710255930.5A patent/CN107066980B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130148881A1 (en) * | 2011-12-12 | 2013-06-13 | Alibaba Group Holding Limited | Image Classification |
CN103258216A (zh) * | 2013-05-15 | 2013-08-21 | 中国科学院自动化研究所 | 一种基于在线学习的局部可形变目标检测方法及其系统 |
CN103778435A (zh) * | 2014-01-16 | 2014-05-07 | 大连理工大学 | 一种基于视频的行人快速检测方法 |
CN104008359A (zh) * | 2014-04-18 | 2014-08-27 | 杭州晟元芯片技术有限公司 | 一种用于qr码识别的精确网格采样方法 |
CN104134071A (zh) * | 2014-06-20 | 2014-11-05 | 北京工业大学 | 一种基于颜色描述的可变形部件模型物体检测方法 |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108229498A (zh) * | 2017-08-30 | 2018-06-29 | 黄建龙 | 一种拉链片识别方法、装置及设备 |
CN108229498B (zh) * | 2017-08-30 | 2022-02-22 | 黄建龙 | 一种拉链片识别方法、装置及设备 |
CN108921811A (zh) * | 2018-04-03 | 2018-11-30 | 阿里巴巴集团控股有限公司 | 检测物品损伤的方法和装置、物品损伤检测器 |
US10929717B2 (en) | 2018-04-03 | 2021-02-23 | Advanced New Technologies Co., Ltd. | Article damage detection |
CN109740664A (zh) * | 2018-12-28 | 2019-05-10 | 东莞中国科学院云计算产业技术创新与育成中心 | 柔性物体分类方法、装置、计算机设备和存储介质 |
CN109740664B (zh) * | 2018-12-28 | 2023-01-10 | 东莞中国科学院云计算产业技术创新与育成中心 | 柔性物体分类方法、装置、计算机设备和存储介质 |
CN111541911A (zh) * | 2020-04-21 | 2020-08-14 | 腾讯科技(深圳)有限公司 | 视频检测方法和装置、存储介质及电子装置 |
CN111541911B (zh) * | 2020-04-21 | 2024-05-14 | 深圳市雅阅科技有限公司 | 视频检测方法和装置、存储介质及电子装置 |
CN112651931A (zh) * | 2020-12-15 | 2021-04-13 | 浙江大华技术股份有限公司 | 建筑物变形监测方法、装置和计算机设备 |
CN112651931B (zh) * | 2020-12-15 | 2024-04-26 | 浙江大华技术股份有限公司 | 建筑物变形监测方法、装置和计算机设备 |
Also Published As
Publication number | Publication date |
---|---|
CN107066980B (zh) | 2020-04-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111126258B (zh) | 图像识别方法及相关装置 | |
CN111461089B (zh) | 一种人脸检测的方法、人脸检测模型的训练方法及装置 | |
CN107066980A (zh) | 一种图像变形检测方法及装置 | |
CN107742107A (zh) | 人脸图像分类方法、装置及服务器 | |
CN108304835A (zh) | 文字检测方法和装置 | |
CN105574550A (zh) | 一种车辆识别方法及装置 | |
CN110490238A (zh) | 一种图像处理方法、装置及存储介质 | |
CN111460968A (zh) | 基于视频的无人机识别与跟踪方法及装置 | |
CN112188306B (zh) | 一种标签生成方法、装置、设备及存储介质 | |
CN110147745A (zh) | 一种视频关键帧检测方法及装置 | |
US20230053911A1 (en) | Detecting an object in an image using multiband and multidirectional filtering | |
CN109670517A (zh) | 目标检测方法、装置、电子设备和目标检测模型 | |
CN113704623B (zh) | 一种数据推荐方法、装置、设备及存储介质 | |
CN114170531B (zh) | 基于困难样本迁移学习的红外图像目标检测方法和装置 | |
CN108323209A (zh) | 信息处理方法、系统、云处理设备以及计算机程序产品 | |
CN111881706B (zh) | 活体检测、图像分类和模型训练方法、装置、设备及介质 | |
CN113505640A (zh) | 一种基于多尺度特征融合的小尺度行人检测方法 | |
CN111738199A (zh) | 图像信息验证方法、装置、计算装置和介质 | |
CN113793620B (zh) | 基于场景分类的语音降噪方法、装置、设备及存储介质 | |
CN114581702A (zh) | 图像分类方法、装置、计算机设备及计算机可读存储介质 | |
CN116152938A (zh) | 身份识别模型训练和电子资源转移方法、装置及设备 | |
CN110287981A (zh) | 基于生物启发性表征学习的显著性检测方法及系统 | |
CN114360182A (zh) | 一种智能告警方法、装置、设备及存储介质 | |
CN115861595A (zh) | 一种基于深度学习的多尺度域自适应异源图像匹配方法 | |
CN115063795A (zh) | 一种尿沉渣分类检测方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |