CN111666957A - 图像真实性的识别方法及装置 - Google Patents
图像真实性的识别方法及装置 Download PDFInfo
- Publication number
- CN111666957A CN111666957A CN202010695746.4A CN202010695746A CN111666957A CN 111666957 A CN111666957 A CN 111666957A CN 202010695746 A CN202010695746 A CN 202010695746A CN 111666957 A CN111666957 A CN 111666957A
- Authority
- CN
- China
- Prior art keywords
- image
- recognized
- similar
- distance
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明提供了一种图像真实性的识别方法及装置,包括:对待识别图像特征提取,得到深度学习特征、ORB特征和hash特征;基于深度学习特征,确定当前分类模板库中是否存在与待识别图像相似的分类图像;若不存在与待识别图像相似的分类图像,则基于深度学习特征,在历史图像中确定与待识别图像相似的候选相似图像;基于ORB特征、hash特征,在候选相似图像中确定待识别图像的相似图像;根据待识别图像对应的用户和相似图像对应的用户确定待识别图像的真实性。本发明的方法融合了多种不同的特征提取方法,大大提高了图像识别的准确率,并且通过机器自动识别的方式更加智能,提高了图像识别的效率,减少了人工成本。
Description
技术领域
本发明涉及图像识别的技术领域,尤其是涉及一种图像真实性的识别方法及装置。
背景技术
近年来,随着互联网和移动互联网的普及,信贷业务高速发展,业务变得越来越多元和便捷。但是,信贷业务在为广大用户提供丰富的金融服务的同时,也带来了新的风险。最近几年,利用漏洞或者采取必要的技术手段进行非法交易的案件越来越多,严重损害了银行和客户的财产安全。随着不法分子作案流程的专业化与技术手段的升级,传统风控模型中基于规则+验证的方式已经很难满足当前的风控需求。
在信贷业务中,用户在多个场景下会提交不同类型的图像,人工查看图像的真实性时,无法全部查验,且对人的记忆要求高,不仅速度慢,而且准确率不高。
综上,现有的图像真实性的识别方法存在速度慢、准确率不高的技术问题。
发明内容
本发明的目的在于提供一种图像真实性的识别方法及装置,以缓解现有的图像真实性的识别方法速度慢、准确率不高的技术问题。
第一方面,本发明实施例提供了一种图像真实性的识别方法,包括:
对待识别图像进行特征提取,得到所述待识别图像的深度学习特征、ORB特征和hash特征;
基于所述待识别图像的深度学习特征,确定当前分类模板库中是否存在与所述待识别图像相似的分类图像,以根据与所述待识别图像相似的分类图像确定所述待识别图像的真实性;
若所述当前分类模板库中不存在与所述待识别图像相似的分类图像,则基于所述待识别图像的深度学习特征,在历史图像中确定与所述待识别图像相似的候选相似图像;
基于所述待识别图像的ORB特征、所述待识别图像的hash特征计算所述待识别图像与所述候选相似图像的距离,并基于所述距离,在所述候选相似图像中确定所述待识别图像的相似图像;
根据所述待识别图像对应的用户和所述相似图像对应的用户确定所述待识别图像的真实性。
进一步的,基于所述待识别图像的深度学习特征,确定当前分类模板库中是否存在与所述待识别图像相似的分类图像,以根据与所述待识别图像相似的分类图像确定所述待识别图像的真实性包括:
计算所述待识别图像的深度学习特征与所述当前分类模板库中各个分类图像的深度学习特征之间的第一余弦距离;
基于第一预设距离在所述第一余弦距离中确定第一目标余弦距离,其中,所述第一目标余弦距离大于所述第一预设距离;
将所述第一目标余弦距离对应的目标分类图像作为与所述待识别图像相似的分类图像;
根据所述目标分类图像所属的类别确定所述待识别图像的真实性。
进一步的,基于所述待识别图像的深度学习特征,在历史图像中确定与所述待识别图像相似的候选相似图像包括:
计算所述待识别图像的深度学习特征与各个历史图像的深度学习特征之间的第二余弦距离;
基于第二预设距离在所述第二余弦距离中确定第二目标余弦距离,其中,所述第二目标余弦距离大于所述第二预设距离;
将所述第二目标余弦距离对应的目标历史图像作为与所述待识别图像相似的候选相似图像。
进一步的,基于所述待识别图像的ORB特征、所述待识别图像的hash特征计算所述待识别图像与所述候选相似图像的距离包括:
计算所述待识别图像的ORB特征与所述候选相似图像的ORB特征之间的第一距离;
计算所述待识别图像的hash特征与所述候选相似图像的hash特征之间的第二距离;
基于权重对所述第一距离和所述第二距离进行加权计算,得到所述待识别图像与所述候选相似图像的距离。
进一步的,基于所述距离,在所述候选相似图像中确定所述待识别图像的相似图像包括:
基于第三预设距离在所述距离中确定目标距离,其中,所述目标距离大于所述第三预设距离;
将所述目标距离对应的目标候选相似图像作为所述待识别图像的相似图像。
进一步的,根据所述待识别图像对应的用户和所述相似图像对应的用户确定所述待识别图像的真实性包括:
若在所述相似图像中,存在目标相似图像对应的用户与所述待识别图像对应的用户不是同一用户,则确定所述待识别图像为虚假图像;
若在所述相似图像中,所有相似图像对应的用户与所述待识别图像对应的用户为同一用户,则确定所述待识别图像为真实图像。
进一步的,在根据所述待识别图像对应的用户和所述相似图像对应的用户确定所述待识别图像的真实性之后,所述方法还包括:
根据人工反馈结果自动更新所述第一预设距离、所述第二预设距离、所述第三预设距离和所述权重,其中,所述人工反馈结果为通过人工的方式对所述待识别图像和所述目标相似图像进行对比,得到的所述待识别图像和所述目标相似图像是否为不同用户的相似图像的结果。
进一步的,在对待识别图像进行特征提取之前,所述方法还包括:
获取所述当前分类模板库。
进一步的,获取所述当前分类模板库包括:
采用聚类方法对预设时间范围内采集的图像进行聚类,得到所述预设时间范围内高频出现的图像;
通过人工的方式对所述高频出现的图像进行真实性判定,并根据判定结果更新分类模板库,得到所述当前分类模板库。
第二方面,本发明实施例还提供了一种图像真实性的识别装置,包括:
特征提取单元,用于对待识别图像进行特征提取,得到所述待识别图像的深度学习特征、ORB特征和hash特征;
第一确定单元,用于基于所述待识别图像的深度学习特征,确定当前分类模板库中是否存在与所述待识别图像相似的分类图像,以根据与所述待识别图像相似的分类图像确定所述待识别图像的真实性;
第二确定单元,若所述当前分类模板库中不存在与所述待识别图像相似的分类图像,则基于所述待识别图像的深度学习特征,在历史图像中确定与所述待识别图像相似的候选相似图像;
计算单元,用于基于所述待识别图像的ORB特征、所述待识别图像的hash特征计算所述待识别图像与所述候选相似图像的距离,并基于所述距离,在所述候选相似图像中确定所述待识别图像的相似图像;
第三确定单元,用于根据所述待识别图像对应的用户和所述相似图像对应的用户确定所述待识别图像的真实性。
在本发明实施例中,提供了一种图像真实性的识别方法,该方法包括:先对待识别图像进行特征提取,得到待识别图像的深度学习特征、ORB特征和hash特征;然后,基于待识别图像的深度学习特征,确定当前分类模板库中是否存在与待识别图像相似的分类图像,以根据与待识别图像相似的分类图像确定待识别图像的真实性;若当前分类模板库中不存在与待识别图像相似的分类图像,则基于待识别图像的深度学习特征,在历史图像中确定与待识别图像相似的候选相似图像;进而基于待识别图像的ORB特征、待识别图像的hash特征计算待识别图像与候选相似图像的距离,并基于距离,在候选相似图像中确定待识别图像的相似图像;最后,根据待识别图像对应的用户和相似图像对应的用户确定待识别图像的真实性。通过上述描述可知,本发明的图像真实性的识别方法融合了多种不同的特征提取方法,大大提高了图像识别的准确率,并且通过机器自动识别的方式更加智能,提高了图像识别的效率,减少了人工成本,缓解了现有的图像真实性的识别方法速度慢、准确率不高的技术问题。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种图像真实性的识别方法的流程示意图;
图2为本发明实施例提供的确定当前分类模板库中是否存在与待识别图像相似的分类图像的方法流程图;
图3为本发明实施例提供的在历史图像中确定与待识别图像相似的候选相似图像的方法流程图;
图4为本发明实施例提供的在候选相似图像中确定待识别图像的相似图像的方法流程图;
图5为本发明实施例提供的一种图像真实性的识别装置的示意图。
具体实施方式
下面将结合实施例对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为便于对本实施例进行理解,首先对本发明实施例所公开的一种图像真实性的识别方法进行详细介绍。
实施例一:
为便于对本实施例进行理解,首先对本发明实施例所公开的一种图像真实性的识别方法进行详细介绍,参见图1所示的一种图像真实性的识别方法的流程示意图,主要包括以下步骤:
步骤S102,对待识别图像进行特征提取,得到待识别图像的深度学习特征、ORB特征和hash特征;
在本发明实施例中,该图像真实性的识别方法可以应用于服务器,是一种自动快速的图像识别方法。上述特征提取所采用的算法包括:ORB(Oriented Fast and RotatedBrief)算法、CNN卷积神经网络和hash算法。
其中,ORB(Oriented Fast and Rotated Brief),可以用来对图像中的关键点快速创建特征向量,这些特征向量可以用来识别图像中的对象。ORB首先会从图像中查找特殊区域,称为关键点。关键点即图像中突出的小区域,比如角点,它们具有像素值急剧的从浅色变为深色的特征。然后ORB会为每个关键点计算相应的特征向量。ORB算法创建的特征向量只包含1和0,称为二元特征向量。1和0的顺序会根据特定关键点和其周围的像素区域而变化。该向量表示关键点周围的强度模式,因此多个特征向量可以用来识别更大的区域,甚至图像中的特定对象。ORB的特点是速度超快,而且在一定程度上不受噪点和图像变换的影响,例如旋转和缩放变换等。
CNN(卷积神经网络,Convolutional Neural Network)的基本结构包括两种特殊的神经元层,其一为卷积层,每个神经元的输入与前一层的局部相连,并提取该局部的特征;其二是池化层,用来求局部敏感性与二次特征提取的计算层。这种两次特征提取结构减少了特征分辨率,减少了需要优化的参数数目。本发明中使用VGG16网络架构(Very DeepConvolutional Networks for Large-Scale Image Recognition),其主要通过小的卷积核尺寸,让网络走向更深层次。
需要说明的是,除了上述三种类型的特征之外,还可以包括hist特征等。
步骤S104,基于待识别图像的深度学习特征,确定当前分类模板库中是否存在与待识别图像相似的分类图像,以根据与待识别图像相似的分类图像确定待识别图像的真实性;
在本发明实施例中,上述当前分类模板库中包含有两种分类模板库,一种为真实图像的模板库,另一种为虚假图像的模板库。其中,真实图像的模板库中包含有真实图像模板和真实图像模板的深度学习特征,虚假图像的模板库中包含虚假图像模板和虚假图像模板的深度学习特征。上述当前分类模板库是基于聚类技术和人工的方式构建得到的,下文中再对该模板库的构建过程进行具体描述。
实现时,若当前分类模板库中,存在分类图像A与待识别图像相似,且该分类图像A所属的类别为真实图像模板,那么可以确定待识别图像为真实图像;若分类图像A所属的类别为虚假图像模板,那么可以确定待识别图像为虚假图像。
下文中再对确定当前分类模板库中是否存在与待识别图像相似的分类图像的过程进行具体介绍,在此不再赘述。
步骤S106,若当前分类模板库中不存在与待识别图像相似的分类图像,则基于待识别图像的深度学习特征,在历史图像中确定与待识别图像相似的候选相似图像;
在本发明实施例中,服务器中存储有历史图像数据库,历史图像数据库中包含有历史图像和历史图像的图像特征。具体的,历史图像的图像特征包括:历史图像的深度学习特征、历史图像的ORB特征和历史图像的hash特征,每种特征构成一个图像特征字典。如:历史图像的深度学习特征就构成了深度学习特征字典、历史图像的ORB特征就构成了ORB特征字典、历史图像的hash特征就构成了hash特征字典。
上述图像特征是对历史图像进行基于opencv中ORB特征、hash特征和深度学习特征向量的提取得到的。
步骤S108,基于待识别图像的ORB特征、待识别图像的hash特征计算待识别图像与候选相似图像的距离,并基于距离,在候选相似图像中确定待识别图像的相似图像;
发明人考虑到相似图像的识别会因为图像本身的复杂性,易受拍摄环境的影响,比如光照变化、尺度变化、视角变化等,不同类别的图像识别准确率不高。图像特征提取的方法种类繁多,没有一种四海皆准的特征,能够解决上述各种情况,基于此,发明人融合了上述多种不同的特征提取方法,能够兼顾多类图像,以提高相似图像识别的准确率。
步骤S110,根据待识别图像对应的用户和相似图像对应的用户确定待识别图像的真实性。
在本发明实施例中,提供了一种图像真实性的识别方法,该方法包括:先对待识别图像进行特征提取,得到待识别图像的深度学习特征、ORB特征和hash特征;然后,基于待识别图像的深度学习特征,确定当前分类模板库中是否存在与待识别图像相似的分类图像,以根据与待识别图像相似的分类图像确定待识别图像的真实性;若当前分类模板库中不存在与待识别图像相似的分类图像,则基于待识别图像的深度学习特征,在历史图像中确定与待识别图像相似的候选相似图像;进而基于待识别图像的ORB特征、待识别图像的hash特征计算待识别图像与候选相似图像的距离,并基于距离,在候选相似图像中确定待识别图像的相似图像;最后,根据待识别图像对应的用户和相似图像对应的用户确定待识别图像的真实性。通过上述描述可知,本发明的图像真实性的识别方法融合了多种不同的特征提取方法,大大提高了图像识别的准确率,并且通过机器自动识别的方式更加智能,提高了图像识别的效率,减少了人工成本,缓解了现有的图像真实性的识别方法速度慢、准确率不高的技术问题。
上述内容对本发明的图像真实性的识别方法进行了简要介绍,下面对其中涉及到的具体内容进行详细介绍。
发明人考虑到历史图像的数量上千万,每天的数量都有很多,而在这么多的图像提交记录里可能只有几张图像是由非法用户提交的虚假图像,全量图像数据的黑白样本比例悬殊。这样的情况下,安排较多的人直接进行分类模板库的构建,对人工的要求极高,无法准确快速全量的构建分类模板库。
基于此,本发明实施例给出了一种构建当前分类模板库的方法。在本发明的一个可选实施例中,获取当前分类模板库包括如下(1)-(2)的步骤:
(1)采用聚类方法对预设时间范围内采集的图像进行聚类,得到预设时间范围内高频出现的图像;
(2)通过人工的方式对高频出现的图像进行真实性判定,并根据判定结果更新分类模板库,得到当前分类模板库。
具体的,在预设时间范围内(如近30天内),对该时间范围内采集的图像,使用聚类方法进行聚类,得到聚类中心图像,即高频出现的图像,然后将高频出现的图像推送由人工进行真实性判定。实现时,人工根据历史发现的虚假图像模板(如某个银行转账记录PS过金额的图像)以及真实图像模板(如业务审批邮件及制度文件截图等)确定上述高频出现的图像的真实性。进而更新分类模板库,得到当前真实图像的模板库和当前虚假图像的模板库。分类模板库的最初构建过程也可参考上述过程实现。
上述真实图像的模板库用于批量真实图像的剔除,不进行预警和反馈;上述虚假图像的模板库用于批量虚假图像的识别。
本发明结合聚类技术可以发现近期高频出现的图像,自动建立分类模板库,能够辅助人工判断该类图像是团伙作案还是业务审批类的通用图像。
在本发明的一个可选实施例中,参考图2,步骤S104,基于待识别图像的深度学习特征,确定当前分类模板库中是否存在与待识别图像相似的分类图像,以根据与待识别图像相似的分类图像确定待识别图像的真实性的步骤包括:
步骤S201,计算待识别图像的深度学习特征与当前分类模板库中各个分类图像的深度学习特征之间的第一余弦距离;
具体的,计算待识别图像的深度学习特征向量和当前分类模板库中各个分类图像的深度学习特征向量之间的第一余弦距离。
步骤S202,基于第一预设距离在第一余弦距离中确定第一目标余弦距离,其中,第一目标余弦距离大于第一预设距离;
步骤S203,将第一目标余弦距离对应的目标分类图像作为与待识别图像相似的分类图像;
步骤S204,根据目标分类图像所属的类别确定待识别图像的真实性。
由上可知,本发明的分类模板库可以添加历史高频出现的虚假图像或者真实图像作为模板,使用了聚类技术能自动发现高频出现的图像以辅助分类模板库的建立,减少了人工工作量;另外,可以将待识别图像命中分类模板库中的分类图像的方式,确定待识别图像的真实性,减少了计算量,提高了图像识别的效率。
在本发明的一个可选实施例中,参考图3,步骤S106,基于待识别图像的深度学习特征,在历史图像中确定与待识别图像相似的候选相似图像的步骤包括:
步骤S301,计算待识别图像的深度学习特征与各个历史图像的深度学习特征之间的第二余弦距离;
步骤S302,基于第二预设距离在第二余弦距离中确定第二目标余弦距离,其中,第二目标余弦距离大于第二预设距离;
步骤S303,将第二目标余弦距离对应的目标历史图像作为与待识别图像相似的候选相似图像。
上述步骤S301至步骤S303的过程完成了第一轮的待识别图像与历史图像的比对,初筛得到了候选相似图像的集合。
在本发明的一个可选实施例中,参考图4,步骤S108,在候选相似图像中确定待识别图像的相似图像的步骤包括:
步骤S401,计算待识别图像的ORB特征与候选相似图像的ORB特征之间的第一距离;
步骤S402,计算待识别图像的hash特征与候选相似图像的hash特征之间的第二距离;
步骤S403,基于权重对第一距离和第二距离进行加权计算,得到待识别图像与候选相似图像的距离;
具体的,计算待识别图像的ORB特征与各个候选相似图像的ORB特征之间的第一距离(可以为余弦距离),并计算待识别图像的hash特征与各个候选相似图像的hash特征之间的第二距离(可以为海明距离),进而基于第一距离的权重、第二距离的权重、第一距离和第二距离进行加权计算,得到待识别图像与各个候选相似图像的距离。
步骤S404,基于第三预设距离在距离中确定目标距离,其中,目标距离大于第三预设距离;
步骤S405,将目标距离对应的目标候选相似图像作为待识别图像的相似图像。
上述步骤S401至步骤S405的过程完成了第二轮的待识别图像与候选相似图像的比对,第二轮细筛得到了待识别图像的相似图像的集合。
在本发明的一个可选实施例中,步骤S110,根据待识别图像对应的用户和相似图像对应的用户确定待识别图像的真实性的步骤包括如下1)和2)的过程:
1)若在相似图像中,存在目标相似图像对应的用户与待识别图像对应的用户不是同一用户,则确定待识别图像为虚假图像;
2)若在相似图像中,所有相似图像对应的用户与待识别图像对应的用户为同一用户,则确定待识别图像为真实图像。
具体的,在判断待识别图像对应的用户与其相似图像对应的用户是否为同一用户时,可以通过用户业务信息的方式进行判断。例如:待识别图像对应的合同的证件号与其相似图像对应的合同的证件号一样,则确定待识别图像对应的用户与相似图像对应的用户为同一用户,反之,不是同一用户。
在正常情况下,待识别图像与其相似图像对应的用户应为同一用户,若待识别图像与其相似图像对应的用户不是同一用户,则说明待识别图像对应的用户盗用了与待识别图像相似的相似图像。
在本发明的一个可选实施例中,在根据待识别图像对应的用户和相似图像对应的用户确定待识别图像的真实性之后,该方法还包括:
根据人工反馈结果自动更新第一预设距离、第二预设距离、第三预设距离和权重,其中,人工反馈结果为通过人工的方式对待识别图像和目标相似图像进行对比,得到的待识别图像和目标相似图像是否为不同用户的相似图像的结果。
在完成待识别图像真实性的识别后,将不是同一用户的相似图像(即目标相似图像)发由人工,由人工将待识别图像与目标相似图像进行对比,得到对比结果,并将该对比结果反馈至本发明的图像真实性的识别算法中,以使算法自动更新第一预设距离、第二预设距离、第三预设距离和权重,这样使得算法成为一个闭环,能够更好的适应变化。
本发明的图像真实性的识别方法通过不同算法提取图像特征,经过分类模板库、初筛和细筛三轮图像对比,可以更快且准确的确定待识别图像的相似图像,另外,通过图像聚类辅助人工判断该类图像是虚假图像还是真实图像(即业务审批类的通用图像)用于构建模板库,减少了人工成本。
本发明的图像真实性的识别方法具有以下优点:
1.针对不同特征提取算法的特点,对同一张图像进行多种图像特征提取,并且经过初筛和细筛(即融合了多种不同的图像特征提取方法和相似度计算方法),可以发挥不同类型特征提取算法的特点,准确性好;
2.对于分类模板库,可以添加历史高频出现的虚假图像或者真实图像作为模板,使用了聚类技术能自动发现高频出现的图像以辅助分类模板库的建立,减少了人工工作量;
3.可以将待识别图像命中分类模板库中的分类图像的方式,确定待识别图像的真实性,减少了计算量,提高了图像识别的效率;
4.能够根据人工反馈结果自动更新距离阈值、权重,使得算法成为一个闭环,可以更好的适应变化,提高算法的准确性。
实施例二:
本发明实施例还提供了一种图像真实性的识别装置,该图像真实性的识别装置主要用于执行本发明实施例上述内容所提供的图像真实性的识别方法,以下对本发明实施例提供的图像真实性的识别装置做具体介绍。
图5是本发明实施例的一种图像真实性的识别装置的示意图,如图5所示,该图像真实性的识别装置主要包括:特征提取单元10、第一确定单元20、第二确定单元30、计算单元40和第三确定单元50,其中:
特征提取单元,用于对待识别图像进行特征提取,得到待识别图像的深度学习特征、ORB特征和hash特征;
第一确定单元,用于基于待识别图像的深度学习特征,确定当前分类模板库中是否存在与待识别图像相似的分类图像,以根据与待识别图像相似的分类图像确定待识别图像的真实性;
第二确定单元,若当前分类模板库中不存在与待识别图像相似的分类图像,则基于待识别图像的深度学习特征,在历史图像中确定与待识别图像相似的候选相似图像;
计算单元,用于基于待识别图像的ORB特征、待识别图像的hash特征计算待识别图像与候选相似图像的距离,并基于距离,在候选相似图像中确定待识别图像的相似图像;
第三确定单元,用于根据待识别图像对应的用户和相似图像对应的用户确定待识别图像的真实性。
在本发明实施例中,提供了一种图像真实性的识别装置,包括:先对待识别图像进行特征提取,得到待识别图像的深度学习特征、ORB特征和hash特征;然后,基于待识别图像的深度学习特征,确定当前分类模板库中是否存在与待识别图像相似的分类图像,以根据与待识别图像相似的分类图像确定待识别图像的真实性;若当前分类模板库中不存在与待识别图像相似的分类图像,则基于待识别图像的深度学习特征,在历史图像中确定与待识别图像相似的候选相似图像;进而基于待识别图像的ORB特征、待识别图像的hash特征计算待识别图像与候选相似图像的距离,并基于距离,在候选相似图像中确定待识别图像的相似图像;最后,根据待识别图像对应的用户和相似图像对应的用户确定待识别图像的真实性。通过上述描述可知,本发明的图像真实性的识别装置融合了多种不同的特征提取方法,大大提高了图像识别的准确率,并且通过机器自动识别的方式更加智能,提高了图像识别的效率,减少了人工成本,缓解了现有的图像真实性的识别方法速度慢、准确率不高的技术问题。
可选地,第一确定单元还用于:计算待识别图像的深度学习特征与当前分类模板库中各个分类图像的深度学习特征之间的第一余弦距离;基于第一预设距离在第一余弦距离中确定第一目标余弦距离,其中,第一目标余弦距离大于第一预设距离;将第一目标余弦距离对应的目标分类图像作为与待识别图像相似的分类图像;根据目标分类图像所属的类别确定待识别图像的真实性。
可选地,第二确定单元还用于:计算待识别图像的深度学习特征与各个历史图像的深度学习特征之间的第二余弦距离;基于第二预设距离在第二余弦距离中确定第二目标余弦距离,其中,第二目标余弦距离大于第二预设距离;将第二目标余弦距离对应的目标历史图像作为与待识别图像相似的候选相似图像。
可选地,计算单元还用于:计算待识别图像的ORB特征与候选相似图像的ORB特征之间的第一距离;计算待识别图像的hash特征与候选相似图像的hash特征之间的第二距离;基于权重对第一距离和第二距离进行加权计算,得到待识别图像与候选相似图像的距离。
可选地,计算单元还用于:基于第三预设距离在距离中确定目标距离,其中,目标距离大于第三预设距离;将目标距离对应的目标候选相似图像作为待识别图像的相似图像。
可选地,第三确定单元还用于:若在相似图像中,存在目标相似图像对应的用户与待识别图像对应的用户不是同一用户,则确定待识别图像为虚假图像;若在相似图像中,所有相似图像对应的用户与待识别图像对应的用户为同一用户,则确定待识别图像为真实图像。
可选地,该装置还用于:根据人工反馈结果自动更新第一预设距离、第二预设距离、第三预设距离和权重,其中,人工反馈结果为通过人工的方式对待识别图像和目标相似图像进行对比,得到的待识别图像和目标相似图像是否为不同用户的相似图像的结果。
可选地,该装置还用于:获取当前分类模板库。
可选地,该装置还用于:采用聚类方法对预设时间范围内采集的图像进行聚类,得到预设时间范围内高频出现的图像;通过人工的方式对高频出现的图像进行真实性判定,并根据判定结果更新分类模板库,得到当前分类模板库。
本发明实施例所提供的装置,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,前述描述的系统、装置和单元的具体工作过程,均可以参考上述方法实施例中的对应过程,在此不再赘述。本申请实施例提供的图像真实性的识别装置与上述实施例提供的图像真实性的识别方法具有相同的技术特征,所以也能解决相同的技术问题,达到相同的技术效果。
另外,在本发明实施例的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (10)
1.一种图像真实性的识别方法,其特征在于,包括:
对待识别图像进行特征提取,得到所述待识别图像的深度学习特征、ORB特征和hash特征;
基于所述待识别图像的深度学习特征,确定当前分类模板库中是否存在与所述待识别图像相似的分类图像,以根据与所述待识别图像相似的分类图像确定所述待识别图像的真实性;
若所述当前分类模板库中不存在与所述待识别图像相似的分类图像,则基于所述待识别图像的深度学习特征,在历史图像中确定与所述待识别图像相似的候选相似图像;
基于所述待识别图像的ORB特征、所述待识别图像的hash特征计算所述待识别图像与所述候选相似图像的距离,并基于所述距离,在所述候选相似图像中确定所述待识别图像的相似图像;
根据所述待识别图像对应的用户和所述相似图像对应的用户确定所述待识别图像的真实性。
2.根据权利要求1所述的方法,其特征在于,基于所述待识别图像的深度学习特征,确定当前分类模板库中是否存在与所述待识别图像相似的分类图像,以根据与所述待识别图像相似的分类图像确定所述待识别图像的真实性包括:
计算所述待识别图像的深度学习特征与所述当前分类模板库中各个分类图像的深度学习特征之间的第一余弦距离;
基于第一预设距离在所述第一余弦距离中确定第一目标余弦距离,其中,所述第一目标余弦距离大于所述第一预设距离;
将所述第一目标余弦距离对应的目标分类图像作为与所述待识别图像相似的分类图像;
根据所述目标分类图像所属的类别确定所述待识别图像的真实性。
3.根据权利要求2所述的方法,其特征在于,基于所述待识别图像的深度学习特征,在历史图像中确定与所述待识别图像相似的候选相似图像包括:
计算所述待识别图像的深度学习特征与各个历史图像的深度学习特征之间的第二余弦距离;
基于第二预设距离在所述第二余弦距离中确定第二目标余弦距离,其中,所述第二目标余弦距离大于所述第二预设距离;
将所述第二目标余弦距离对应的目标历史图像作为与所述待识别图像相似的候选相似图像。
4.根据权利要求3所述的方法,其特征在于,基于所述待识别图像的ORB特征、所述待识别图像的hash特征计算所述待识别图像与所述候选相似图像的距离包括:
计算所述待识别图像的ORB特征与所述候选相似图像的ORB特征之间的第一距离;
计算所述待识别图像的hash特征与所述候选相似图像的hash特征之间的第二距离;
基于权重对所述第一距离和所述第二距离进行加权计算,得到所述待识别图像与所述候选相似图像的距离。
5.根据权利要求4所述的方法,其特征在于,基于所述距离,在所述候选相似图像中确定所述待识别图像的相似图像包括:
基于第三预设距离在所述距离中确定目标距离,其中,所述目标距离大于所述第三预设距离;
将所述目标距离对应的目标候选相似图像作为所述待识别图像的相似图像。
6.根据权利要求5所述的方法,其特征在于,根据所述待识别图像对应的用户和所述相似图像对应的用户确定所述待识别图像的真实性包括:
若在所述相似图像中,存在目标相似图像对应的用户与所述待识别图像对应的用户不是同一用户,则确定所述待识别图像为虚假图像;
若在所述相似图像中,所有相似图像对应的用户与所述待识别图像对应的用户为同一用户,则确定所述待识别图像为真实图像。
7.根据权利要求6所述的方法,其特征在于,在根据所述待识别图像对应的用户和所述相似图像对应的用户确定所述待识别图像的真实性之后,所述方法还包括:
根据人工反馈结果自动更新所述第一预设距离、所述第二预设距离、所述第三预设距离和所述权重,其中,所述人工反馈结果为通过人工的方式对所述待识别图像和所述目标相似图像进行对比,得到的所述待识别图像和所述目标相似图像是否为不同用户的相似图像的结果。
8.根据权利要求1所述的方法,其特征在于,在对待识别图像进行特征提取之前,所述方法还包括:
获取所述当前分类模板库。
9.根据权利要求8所述的方法,其特征在于,获取所述当前分类模板库包括:
采用聚类方法对预设时间范围内采集的图像进行聚类,得到所述预设时间范围内高频出现的图像;
通过人工的方式对所述高频出现的图像进行真实性判定,并根据判定结果更新分类模板库,得到所述当前分类模板库。
10.一种图像真实性的识别装置,其特征在于,包括:
特征提取单元,用于对待识别图像进行特征提取,得到所述待识别图像的深度学习特征、ORB特征和hash特征;
第一确定单元,用于基于所述待识别图像的深度学习特征,确定当前分类模板库中是否存在与所述待识别图像相似的分类图像,以根据与所述待识别图像相似的分类图像确定所述待识别图像的真实性;
第二确定单元,若所述当前分类模板库中不存在与所述待识别图像相似的分类图像,则基于所述待识别图像的深度学习特征,在历史图像中确定与所述待识别图像相似的候选相似图像;
计算单元,用于基于所述待识别图像的ORB特征、所述待识别图像的hash特征计算所述待识别图像与所述候选相似图像的距离,并基于所述距离,在所述候选相似图像中确定所述待识别图像的相似图像;
第三确定单元,用于根据所述待识别图像对应的用户和所述相似图像对应的用户确定所述待识别图像的真实性。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010695746.4A CN111666957B (zh) | 2020-07-17 | 2020-07-17 | 图像真实性的识别方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010695746.4A CN111666957B (zh) | 2020-07-17 | 2020-07-17 | 图像真实性的识别方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111666957A true CN111666957A (zh) | 2020-09-15 |
CN111666957B CN111666957B (zh) | 2023-04-25 |
Family
ID=72392644
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010695746.4A Active CN111666957B (zh) | 2020-07-17 | 2020-07-17 | 图像真实性的识别方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111666957B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114219753A (zh) * | 2021-10-27 | 2022-03-22 | 国网福建省电力有限公司检修分公司 | 一种基于深度学习的电力设备表面缺陷检测方法及终端 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007058722A (ja) * | 2005-08-26 | 2007-03-08 | Fujifilm Corp | 判別器の学習方法および対象判別装置ならびにプログラム |
JP2010092413A (ja) * | 2008-10-10 | 2010-04-22 | Ricoh Co Ltd | 画像分類学習装置、画像分類学習方法、および画像分類学習システム |
US20140072185A1 (en) * | 2012-09-07 | 2014-03-13 | David D. Dunlap | Biometric Identification Systems and Methods |
CN106886785A (zh) * | 2017-02-20 | 2017-06-23 | 南京信息工程大学 | 一种基于多特征哈希学习的航拍图像快速匹配算法 |
US20170304732A1 (en) * | 2014-11-10 | 2017-10-26 | Lego A/S | System and method for toy recognition |
US20180089537A1 (en) * | 2016-09-26 | 2018-03-29 | Canon Kabushiki Kaisha | Learning apparatus, image identification apparatus, learning method, image identification method, and storage medium |
CN108960412A (zh) * | 2018-06-29 | 2018-12-07 | 北京京东尚科信息技术有限公司 | 图像识别方法、装置及计算机可读存储介质 |
CN110084757A (zh) * | 2019-04-15 | 2019-08-02 | 南京信息工程大学 | 一种基于生成对抗网络的红外深度图像增强方法 |
US20190355113A1 (en) * | 2018-05-21 | 2019-11-21 | Corista, LLC | Multi-sample Whole Slide Image Processing in Digital Pathology via Multi-resolution Registration and Machine Learning |
CN110991533A (zh) * | 2019-12-03 | 2020-04-10 | Oppo广东移动通信有限公司 | 图像识别方法、识别装置、终端设备及可读存储介质 |
US10664722B1 (en) * | 2016-10-05 | 2020-05-26 | Digimarc Corporation | Image processing arrangements |
-
2020
- 2020-07-17 CN CN202010695746.4A patent/CN111666957B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007058722A (ja) * | 2005-08-26 | 2007-03-08 | Fujifilm Corp | 判別器の学習方法および対象判別装置ならびにプログラム |
JP2010092413A (ja) * | 2008-10-10 | 2010-04-22 | Ricoh Co Ltd | 画像分類学習装置、画像分類学習方法、および画像分類学習システム |
US20140072185A1 (en) * | 2012-09-07 | 2014-03-13 | David D. Dunlap | Biometric Identification Systems and Methods |
US20170304732A1 (en) * | 2014-11-10 | 2017-10-26 | Lego A/S | System and method for toy recognition |
US20180089537A1 (en) * | 2016-09-26 | 2018-03-29 | Canon Kabushiki Kaisha | Learning apparatus, image identification apparatus, learning method, image identification method, and storage medium |
US10664722B1 (en) * | 2016-10-05 | 2020-05-26 | Digimarc Corporation | Image processing arrangements |
CN106886785A (zh) * | 2017-02-20 | 2017-06-23 | 南京信息工程大学 | 一种基于多特征哈希学习的航拍图像快速匹配算法 |
US20190355113A1 (en) * | 2018-05-21 | 2019-11-21 | Corista, LLC | Multi-sample Whole Slide Image Processing in Digital Pathology via Multi-resolution Registration and Machine Learning |
CN108960412A (zh) * | 2018-06-29 | 2018-12-07 | 北京京东尚科信息技术有限公司 | 图像识别方法、装置及计算机可读存储介质 |
CN110084757A (zh) * | 2019-04-15 | 2019-08-02 | 南京信息工程大学 | 一种基于生成对抗网络的红外深度图像增强方法 |
CN110991533A (zh) * | 2019-12-03 | 2020-04-10 | Oppo广东移动通信有限公司 | 图像识别方法、识别装置、终端设备及可读存储介质 |
Non-Patent Citations (1)
Title |
---|
张盼盼,李其申,杨词慧: "基于轻量级分组注意力模块的图像分类算法", 计算机应用 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114219753A (zh) * | 2021-10-27 | 2022-03-22 | 国网福建省电力有限公司检修分公司 | 一种基于深度学习的电力设备表面缺陷检测方法及终端 |
Also Published As
Publication number | Publication date |
---|---|
CN111666957B (zh) | 2023-04-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10853642B2 (en) | Fusing multi-spectral images for identity authentication | |
CN109376604B (zh) | 一种基于人体姿态的年龄识别方法和装置 | |
CN112686812A (zh) | 银行卡倾斜矫正检测方法、装置、可读存储介质和终端 | |
CN110688901A (zh) | 一种人脸识别方法及装置 | |
CN105518709A (zh) | 用于识别人脸的方法、系统和计算机程序产品 | |
Türkyılmaz et al. | License plate recognition system using artificial neural networks | |
CN113221655B (zh) | 基于特征空间约束的人脸欺骗检测方法 | |
CN110287813A (zh) | 身份识别方法及系统 | |
CN103605972A (zh) | 一种基于分块深度神经网络的非限制环境人脸验证方法 | |
Waldamichael et al. | Coffee disease detection using a robust HSV color‐based segmentation and transfer learning for use on smartphones | |
CN109934180A (zh) | 指纹识别方法及相关装置 | |
CN111767879A (zh) | 一种活体检测方法 | |
CN112560710B (zh) | 一种用于构建指静脉识别系统的方法及指静脉识别系统 | |
CN112015935B (zh) | 图像搜索方法、装置、电子设备及存储介质 | |
CN108268641A (zh) | 发票信息识别方法及发票信息识别装置、设备和存储介质 | |
US20230147685A1 (en) | Generalized anomaly detection | |
CN113743365A (zh) | 人脸识别过程中的欺诈行为检测方法及装置 | |
CN114971294A (zh) | 数据采集方法、装置、设备及存储介质 | |
CN111666957A (zh) | 图像真实性的识别方法及装置 | |
CN113902942A (zh) | 一种基于多模态特征的同质用户群组发掘方法 | |
Liu et al. | Iris double recognition based on modified evolutionary neural network | |
US20230069960A1 (en) | Generalized anomaly detection | |
CN115116115A (zh) | 人脸识别及其模型训练方法和装置 | |
Szczepanik et al. | Security lock system for mobile devices based on fingerprint recognition algorithm | |
CN111832626B (zh) | 图像识别分类方法、装置及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |