CN113033518A - 图像检测方法、装置、电子设备及存储介质 - Google Patents

图像检测方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN113033518A
CN113033518A CN202110569146.8A CN202110569146A CN113033518A CN 113033518 A CN113033518 A CN 113033518A CN 202110569146 A CN202110569146 A CN 202110569146A CN 113033518 A CN113033518 A CN 113033518A
Authority
CN
China
Prior art keywords
target
image
feature vector
submodel
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110569146.8A
Other languages
English (en)
Other versions
CN113033518B (zh
Inventor
朱超
黄泰文
王磊
罗引
曹家
盘浩军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Zhongke Wenge Technology Co ltd
Beijing Zhongke Wenge Technology Co ltd
Original Assignee
Shenzhen Zhongke Wenge Technology Co ltd
Beijing Zhongke Wenge Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Zhongke Wenge Technology Co ltd, Beijing Zhongke Wenge Technology Co ltd filed Critical Shenzhen Zhongke Wenge Technology Co ltd
Priority to CN202110569146.8A priority Critical patent/CN113033518B/zh
Publication of CN113033518A publication Critical patent/CN113033518A/zh
Application granted granted Critical
Publication of CN113033518B publication Critical patent/CN113033518B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication
    • G06F21/36User authentication by graphic or iconic representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/12Accounting
    • G06Q40/123Tax preparation or submission
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Software Systems (AREA)
  • Human Computer Interaction (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Development Economics (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Computer Security & Cryptography (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Hardware Design (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Image Analysis (AREA)

Abstract

本发明实施例公开了一种图像检测方法、装置、电子设备及存储介质,所述方法包括:将待检测图像输入至特征图转换模型中,得到至少三幅特征图;其中,所述特征图转换模型包括约束卷积子模型、重压缩子模型以及噪声子模型;将所述至少三幅特征图分别输入至相应的目标特征向量提取模型中,得到目标特征向量;所述目标特征向量中包括三个特征子向量;将所述目标特征向量输入至特征处理模型中,得到目标全局特征向量;基于目标数据处理模型对所述目标全局特征向量进行处理,得到与所述待检测图像相对应的图像分类结果;基于所述图像分类结果,确定与所述待检测图像相对应的检测结果。本发明实施例的技术方案提高了图像检测的准确性。

Description

图像检测方法、装置、电子设备及存储介质
技术领域
本发明实施例涉及图像检测技术领域,尤其涉及一种图像检测方法、装置、电子设备及存储介质。
背景技术
随着人脸识别技术的发展,人脸识别已经成为身份认证的一种通用手段,在税务领域,企业注册领票员往往需要上传实名认证头像数据用于审核与记录。而如今业界尚未出现一种针对实名认证头像的高效准确的智能化检测手段。因此,急需一种图像检测方法以实现对实名认证头像进行可靠、准确的检测。
发明内容
本发明实施例提供一种图像检测方法、装置、电子设备及存储介质,以实现对篡改的图像进行检测,提高图像检测的准确性。
第一方面,本发明实施例提供了一种图像检测方法,所述方法包括:
将待检测图像输入至特征图转换模型中,得到至少三幅特征图;其中,所述特征图转换模型包括约束卷积子模型、重压缩子模型以及噪声子模型,所述至少三幅特征图是分别与所述约束卷积子模型对应的约束图,与所述重压缩子模型对应的误差图以及与所述噪声子模型对应的噪声图;
将所述至少三幅特征图分别输入至相应的目标特征向量提取模型中,得到目标特征向量;所述目标特征向量中包括三个特征子向量;
将所述目标特征向量输入至特征处理模型中,得到目标全局特征向量;
基于目标数据处理模型对所述目标全局特征向量进行处理,得到与所述待检测图像相对应的图像分类结果;
基于所述图像分类结果,确定与所述待检测图像相对应的检测结果。
第二方面,本发明实施例还提供了一种图像检测装置,所述装置包括:
特征图获取模块,用于将待检测图像输入至特征图转换模型中,得到至少三幅特征图;其中,所述特征图转换模型包括约束卷积子模型、重压缩子模型以及噪声子模型,所述至少三幅特征图是分别与所述约束卷积子模型对应的约束图,与所述重压缩子模型对应的误差图以及与所述噪声子模型对应的噪声图;
目标特征向量获取模块,用于将所述至少三幅特征图分别输入至相应的目标特征向量提取模型中,得到目标特征向量;所述目标特征向量中包括三个特征子向量;
目标全局特征向量获取模块,用于将所述目标特征向量输入至特征处理模型中,得到目标全局特征向量;
图像分类结果获取模块,用于基于目标数据处理模型对所述目标全局特征向量进行处理,得到与所述待检测图像相对应的图像分类结果;
检测结果确定模块,用于基于所述图像分类结果,确定与所述待检测图像相对应的检测结果。
第三方面,本发明实施例还提供了一种电子设备,所述电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明实施例任一所述的图像检测方法。
第四方面,本发明实施例还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如本发明实施例任一所述的图像检测方法。
本发明实施例的技术方案,通过将待检测图像输入至特征图转换模型中,得到至少三幅特征图,将这三幅特征图分别输入至相应的目标特征向量提取模型中,得到目标特征向量,将目标特征向量输入至特征处理模型中,得到目标全局特征向量。之后,基于目标数据处理模型对目标全局特征向量进行处理的,得到图像分类结果,基于图像分类结果,确定与待检测图像相对应的检测结果。通过本发明实施例的技术方案,实现了将图像转换为三种特征图,并基于三种特征图得到目标特征向量,基于目标特征向量进行计算以得到最终的检测结果,以对图像是否发生拼接篡改进行检测,提高了图像检测的准确性。
附图说明
为了更加清楚地说明本发明示例性实施例的技术方案,下面对描述实施例中所需要用到的附图做一简单介绍。显然,所介绍的附图只是本发明所要描述的一部分实施例的附图,而不是全部的附图,对于本领域普通技术人员,在不付出创造性劳动的前提下,还可以根据这些附图得到其他的附图。
图1为本发明实施例一中的一种图像检测方法的流程示意图;
图2为本发明实施例二中的一种图像检测方法的流程示意图;
图3为本发明实施例三中的一种图像检测系统的结构示意图;
图4为本发明实施例四中的一种图像检测装置的结构示意图;
图5为本发明实施例五中的一种电子设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例所提供的一种图像检测方法的流程示意图,本实施例可适用于在对篡改图像进行检测的情况,该方法可以由图像检测装置来执行,该装置可以通过软件和/或硬件的形式实现。
需要说明的是,在阐述本发明实施例的技术方案之前,先对本发明实施例的应用场景进行示例性说明:
本发明实施例的图像检测方法是指在对图像是否篡改进行检测。图像篡改包括图像的拼接篡改、图像内的文本篡改等。本发明实施例的图像检测方法主要针对图像的拼接篡改。图像的拼接篡改是指对通过复制一幅或者多幅图像的内区域上的内容,在目标图像上对应的区域进行内容粘贴,得到拼接后的目标图像。比如,在税务领域,领票员进行实名认证时需要上传的自然人实名认证的面部图像,在这一过程中存在不法分子通过篡改面部图像来绕过实名认证过程,通过本发明实施例的图像检测方法可以实现对面部图像的图像检测,以确定该面部图像是否为篡改图像。
如图1所述,本发明实施例的图像检测方法具体包括如下步骤:
S110、将待检测图像输入至特征图转换模型中,得到至少三幅特征图。
其中,待检测图像是指需要进行图像篡改检测的图像。待检测图像为RGB图像。特征图转换模型是指将待检测图像转换为特征图时使用的模型。所述特征图转换模型包括约束卷积子模型、重压缩子模型以及噪声子模型,所述至少三幅特征图是分别与所述约束卷积子模型对应的约束图,与所述重压缩子模型对应的误差图以及与所述噪声子模型对应的噪声图。
需要说明的是,约束卷积子模型具有三个卷积核,并且三个卷积核满足初始化时 的约束条件,利用这三个卷积核对待检测图像进行卷积操作,得到与待检测图像具有相同 高、宽的三通道的约束图。约束图具有高频信息。需要说明的是,约束条件指定卷积核中心 位置的值为-1,中心位置周围的值的和为1,公式表示如下,w 0,0 描述卷积核的中心位置,w i,j 描述第i行,第j列的卷积核的值:
Figure 441326DEST_PATH_IMAGE001
Figure 686363DEST_PATH_IMAGE002
。重压缩子模型通过将待 检测图像重新以指定质量存储得到比对图像,之后计算待检测图像与比对图像之间的像素 误差,得到最终的误差特征图。误差特征图可以直观的描述待检测图像的轮廓。这里所说的 指定质量按照实际情况进行设置,这里不做具体限定。噪声子模型包括SRM子模型,利用三 个设定固定值的卷积核将待检测图像进行卷积操作,获取与待检测图像具有相同高和宽的 噪声图。噪声图具有低频信息。
具体的,通过将待检测图像输入至特征图转换模型中,得到至少三幅特征图,为后续进行每个特征图的特征向量的获取做准备工作。
S120、将所述至少三幅特征图分别输入至相应的目标特征向量提取模型中,得到目标特征向量。
其中,目标特征向量提取模型包括卷积模型。可选的,目标特征向量提取模型包括三个相同结构的卷积模型,比如GhostNet网络卷积模型,在通过相同结构的卷积模型对三种特征图进行处理时,可以是设置三个卷积模型的第一层卷积层的通道数不同,有针对性对不同的特征图进行特征提取。所述目标特征向量中包括三个特征子向量;所述三个特征子向量是分别与约束图对应的约束特征子向量、与误差图对应的误差特征子向量以及与噪声图对应的噪声特征子向量。
具体的,通过具有相同结构的卷积模型分别对三种特征图进行卷积处理,以得到三种特征子向量。由于约束图具有高频信息,噪声特征图具有低频信息,误差特征图具有待检测图像的轮廓信息,因此,对这三种特征图进行特征提取,得到的目标特征向量具有高低信息以及轮廓信息。
S130、将所述目标特征向量输入至特征处理模型中,得到目标全局特征向量。
其中,特征处理模型用于对目标特征向量进行处理。通过特征处理模型将目标特征向量中的三种特征子向量进行融合,以得到一种目标全局特征向量。
在本发明实施例中,所述特征处理模型包括长短期记忆网络模型;所述将所述目标特征向量输入至特征处理模型中,得到目标全局特征向量,包括:将所述目标特征向量输入至所述长短期记忆网络模型中,得到目标全局特征向量。
具体的,通过长短期记忆网络(Long Short-Term Memory,LSTM)对目标特征向量进行处理,得到目标全局特征向量,为后续进行目标特征向量的融合做准备工作。
在本发明实施例中,当目标特征向量包括约束特征子向量、误差特征子向量以及噪声特征子向量时,所述将所述目标特征向量输入至特征处理模型中,得到目标全局特征向量,包括:将所述约束特征子向量、所述误差特征子向量以及所述噪声特征子向量依次输入至特征处理模型,得到目标全局特征向量。
具体的,将约束特征子向量、误差特征子向量以及噪声特征子向量按照预设的顺序依次输入至特征处理模型中,得到目标全局特征向量。需要说明的是,将上述的三种特征子向量依次输入至特征处理模型中,至于哪种特征子向量在先,哪种特征子向量在后,这里不做具体限定,可根据实际情况进行设置。
S140、基于目标数据处理模型对所述目标全局特征向量进行处理,得到与所述待检测图像相对应的图像分类结果。
其中,目标数据处理模型是指针对目标全局特征向量进行处理的模型。图像分类结果的表现方式取决于目标数据处理模型的训练结果,训练结果的表现方式可以是以文字形式表达:篡改图像、未篡改图像;或者对篡改图像以及未篡改图像进行标记,比如篡改图像标记为1,未篡改图像标记为2。当然,这里的标记也可以是英文字母、特殊字符等。
具体的,通过目标数据处理模型对目标全局特征向量进行处理,可以得到图像分类结果,通过图像分类结果可以确定待检测图像的检测结果。
S150、基于所述图像分类结果,确定与所述待检测图像相对应的检测结果。
具体的,检测结果是指图像是篡改图像或者未篡改图像。当根据待检测图像得到图像分类结果时,基于图像分类结果可以唯一确定一种检测结果。可选的,图像分类结果与检测结果之间存在一一对应关系。基于图像分类结果以及对应关系,可以唯一确定一种检测结果。
本发明实施例的技术方案,通过将待检测图像输入至特征图转换模型中,得到至少三幅特征图,将这三幅特征图分别输入至相应的目标特征向量提取模型中,得到目标特征向量,将目标特征向量输入至特征处理模型中,得到目标全局特征向量。之后,基于目标数据处理模型对目标全局特征向量进行处理的,得到图像分类结果,基于图像分类结果,确定与待检测图像相对应的检测结果。通过本发明实施例的技术方案,实现了将图像转换为三种特征图,并基于三种特征图得到目标特征向量,基于目标特征向量进行计算以得到最终的检测结果,以对图像是否发生拼接篡改进行检测,提高了图像检测的准确性。
实施例二
图2是本发明实施例提供的一种图像检测方法的流程示意图,本发明实施例在上述实施例的可选方案的基础上对步骤140和步骤150进行的细化,具体的细化过程在本发明实施例中进行详细的阐述。其中,与上述实施例相同或者相似的技术术语将不再赘述。
如图2所述,本发明实施例所提供的图像检测方法具体包括如下步骤:
S210、将待检测图像输入至特征图转换模型中,得到至少三幅特征图。
S220、将所述至少三幅特征图分别输入至相应的目标特征向量提取模型中,得到目标特征向量。
S230、将所述目标特征向量输入至特征处理模型中,得到目标全局特征向量。
S240、基于所述注意力子模型对所述目标全局特征向量进行处理,得到目标融合特征向量。
其中,所述目标数据处理模型包括注意力子模型以及决策子模型。注意力子模型包括全连接层。
具体的,将目标全局特征向量输入全连接层,通过全连接层对目标全局特征向量进行处理,以得到目标融合特征向量。
在本发明实施例中,所述基于所述注意力子模型对所述目标全局特征向量进行处理,得到目标融合特征向量,包括:基于所述注意力子模型对所述目标全局特征向量进行处理,得到所述目标全局特征向量的融合权重;基于所述目标全局特征向量以及所述融合权重,得到所述目标融合特征向量。
其中,注意力子模型包括一层全连接层,以对目标全局特征向量进行处理,得到目标全局特征向量的融合权重。
具体的,通过全连接层对目标全局特征向量进行处理,以得到融合权重,之后将目标全局特征向量与融合权重进行点乘处理,以得到加权后的目标全局特征向量,也即目标融合特征向量。通过对目标全局特征向量的加权处理,通过权重的设置可以过滤不重要的特征,提高图像检测的效果。
S250、基于所述决策子模型对所述目标融合特征向量进行处理,得到与所述待检测图像相对应的图像分类结果。
其中,决策子模型包括全连接层和分类层。可选的,全连接层为一层。
具体的,通过决策子模型中的全连接层映射目标融合特征向量,并将目标融合特征向量的维度与预设的图像分类结果的维度一致。然后通过分类层对目标融合特征向量进行处理,以得到图像分类结果。
S260、基于所述图像分类结果与预先设置的图像分类结果与类别标识的对应关系,确定图像类别标识;基于所述图像类别标识确定所述待检测图像相对应的检测结果。
其中,类别标识是指针对篡改图像与未篡改图像这两个类别设置的标识,以区分两个图像类别。比如,类别标识为文字描述:篡改图像以及未篡改图像。图像分类结果与类别标识一一对应,比如,图像分类结果为1,对应着类别标识为篡改图像,图像分类结果为2,对应着类别标识为未篡改图像。
具体的,通过图像分类结果与预先设置的图像分类结果与类别标识的对应关系,唯一确定一种图像类别标识,基于图像类别标识确定待检测图像相对应的检测结果。
本发明实施例的技术方案,通过将待检测图像输入至特征图转换模型中,得到至少三幅特征图,将这三幅特征图分别输入至相应的目标特征向量提取模型中,得到目标特征向量,将目标特征向量输入至特征处理模型中,得到目标全局特征向量。之后,基于注意力子模型对目标全局特征向量进行处理,得到目标融合特征向量,通过决策子模型对目标融合特征向量进行处理,得到图像分类结果。根据图像分类结果与预先设置的图像分类结果与类别标识的对应关系,确定图像类别标识,基于图像类别标识确定待检测图像相对应的检测结果。通过本发明实施例的技术方案,实现了将图像转换为三种特征图,并基于注意力子模型计算目标全局特征向量的权重,以使三种特征图得到目标特征向量,基于目标特征向量最终得到检测结果,以对图像是否发生拼接篡改进行检测,提高了图像检测的准确性。并且,通过注意力子模型、决策子模型等对特征向量进行处理,提高了图像检测的速度。
实施例三
图3为本发明实施例提供的一种图像检测系统的结构示意图,本发明实施例的图像检测系统可以执行上述实施例中的图像检测方法。
需要说明的是,本发明实施例的图像检测系统包括特征图转换模型(特征图转换模型包括约束卷积子模型、重压缩子模型以及噪声子模型),目标特征向量提取模型(网络结构相同的孪生网络),特征处理模型(长短期记忆网络模型)以及目标数据处理模型(注意力子模型以及决策子模型)。
特征图转换模型的输入为待检测图像,输出为三幅特征图,包括与约束卷积子模型对应的约束图,与重压缩子模型对应的误差图以及与噪声子模型对应的噪声图。特征图转换模型输出的约束图、误差图以及噪声图作为目标特征向量提取模型的输入,目标特征向量提取模型提取三种图对应的图像子向量。三个特征子向量是分别与约束图对应的约束特征子向量、与误差图对应的误差特征子向量以及与噪声图对应的噪声特征子向量。目标特征向量提取模型的输出的三种特征子向量作为特征处理模型的输入,特征处理模型对三种特征子向量进行融合处理,得到目标全局特征向量。特征处理模型输出的目标全局特征向量作为目标数据处理模型的输入。其中,首先将目标全局特征向量输入至注意力子模型中,得到目标融合特征向量,之后将目标融合特征向量输入至决策子模型中,得到分类结果,基于分类结果得到最终的待检测图像的检测结果。
对于图像检测系统,需要对搭建好的图像检测系统进行训练,保证图像检测系统的检测图像的准确度和效率。对于图像检测系统的训练过程,如下所述:
首先,构建图像检测系统的数据集data,需要说明的是,数据集中的每个图像都是 RGB图像。将篡改后的图像作为负样本,将未篡改图像作为正样本。根据预设比例(本发明实 施例使用0.2:0.8的比例)分割数据集为训练集和测试集,训练集用于学习正负样本中的特 征,测试集用于测试图像检测系统的准确性。数据集格式可以表示为:
Figure 731679DEST_PATH_IMAGE003
,其中:
Figure 658047DEST_PATH_IMAGE004
n 为训练 集中的图像,设置L c 为样本标签,如L 1为正样本,L 0为负样本,测试集的格式与训练集相同,
Figure 269157DEST_PATH_IMAGE005
。不同的数据集分割比例对 结果的影响较小。
然后,将训练数据集作为输入,分批送入到图像检测系统中,对图像检测系统进行训练,以得到训练好的图像检测系统。图像检测系统的训练过程阐述如下:
步骤1、将RGB图像分别输入至三种子模型中,以得到对应的特征图。
1)将RGB图像img rgb 输入到SRM子模型M srm 中,利用3个设置固定值的卷积核对RGB图像进行卷积操作,得到与RGB图像具有相同宽高的噪声图img srm ,其中,噪声图具有9通道。
Figure 622778DEST_PATH_IMAGE006
2)将RGB图像img rgb 输入到约束卷积子模型M constraint 中,利用3个卷积核对RGB图像进行卷积操作,获得与RGB图像具有相同宽高的3通道的约束图img constraint 。其中,约束卷积子模型中的三个卷积核满足初始化的约束条件。
Figure 624232DEST_PATH_IMAGE007
其中,约束条件指定卷积核中心位置的值始终为-1,中心位置周围的值的和为1,公式表示如下,w 0,0 描述卷积核的中心位置,w i,j 描述第i行,第j列的卷积核的值:
Figure 354290DEST_PATH_IMAGE008
Figure 819907DEST_PATH_IMAGE009
3)将RGB图像img rgb 输入至重压缩子模型M ela 中,得到误差图img ela 。重压缩子模型M ela 过将输入图像img rgb 重新以指定质量存储得到img resave ,然后计算图像img rgb 与重压缩存储后的图像img resave 之间的像素误差,得到最终的误差图img ela
Figure 547691DEST_PATH_IMAGE010
其中,Resave(img rgb )是指重压缩操作。
步骤2、将噪声图img srm 、误差图img ela 以及约束图img constraint 分别送入三个孪生网络模型M features 中,提取三种特征图的特征子向量。
孪生网络模型M features 为三个具有相同结构的卷积神经网络,三者仅第一层卷积层的通道数不同。该网络采用GhostNet网络结构,GhostNet相比较其他经典网络,如AlexNet,ResNet,VGGNet等更轻量,在获得同样的效果的情况下,GhostNet具有更少的参数量。M (features_constraint)采用img constraint 作为输入,M (features_srm)采用img srm 作为输入,M (features_ela)采用img ela 作为输入,最终获得三种模态数据下(三种特征图)的特征子向量Vector constraint Vector srm Vector ela ,本方案中三种特征子向量均为256维。
步骤3、利用LSTM层与复合的注意力子模型M attention 获得包含整体轮廓与局部细节的融合特征向量,然后利用注意力机制计算融合后的特征向量的权重,计算加权后的融合特征。
利用LSTM层对Vector constraint Vector srm Vector ela 按照预设的时间顺序依次输入至LSTM模型中,如图3中,T时刻、T+1时刻和T+2时刻,代表的三种特征子向量按照预设的时间顺序依次输入至LSTM模型中。对三种特征子向量进行融合,获得融合后的全局特征向量Vector global
Figure 833179DEST_PATH_IMAGE011
Vector global 作为输入,输入至全连接层中,获得最终的分类结果。M attention 由一层全连接层构成,利用全连接层获得融合后的特征的权重Vector atte ,然后对Vector global 与权重Vector atte 进行点乘操作,强调融合后对判别结果起重要作用的特征,获得加权后的特征向量Vector ehancement 。加权后的特征向量,通过加权处理,可以强调融合后对判别结果起重要作用的特征。
Figure 363999DEST_PATH_IMAGE012
其中,f linear 为全连接层操作。
步骤4、将Vector ehancement 作为输入,输入至决策子模型M classifier 中,获得最终的分类结果。M classifier 由一层全连接层和分类层构成,利用全连接层映射融合后的特征,使其维度与分类结果一致,然后对Vector ehancement 进行分类,表达融合后特征对判别结果的重要性。
具体的,将Vector ehancement 作为输入,利用线性函数f linear 计算经过线性变换后的特征向量Vector final
Figure 418543DEST_PATH_IMAGE013
其中,
Figure 582808DEST_PATH_IMAGE014
Figure 621171DEST_PATH_IMAGE015
在本发明实施例中,d 为256,c为2。
将结果Vector final 作为输入,输入至Softmax层中,获得对应类别的结果分数,选取分数最高的类作为预测的结果类P c ,其中Softmax公式可以表示为:
Figure 427453DEST_PATH_IMAGE016
其中,W c 为对应的类别权重,c为类别的标签,本发明实施例中C为2。
结果P c 和输入的RGB图像的标签L c 作为输入,送入损失计算函数f loss 中,获得二者之间的差值,损失函数计算公式表示为:
Figure 805345DEST_PATH_IMAGE017
其中,c为类别的标签,本发明实施例中C为2。利用反向传播算法计算函数对网络中的参数进行优化。
在获得训练好的系统M后,利用测试集测试模型的分类准确率。获得测试数据集,将测试数据集中的图像分批送入已训练好的系统M中,得到预测结果P c ,比较预测结果与标签的一致性,统计系统M识别正确的数量Count r ,计算识别正确的数量与测试集样本数量Count test 的比值,获得模型的准确率A cc
Figure 937249DEST_PATH_IMAGE018
重复上述步骤1-2,直到在指定的迭代轮数范围内,获得的准确率达到要求,此时的系统为训练好的系统。训练好的图像检测系统可以实现上述实施例中的图像检测方法。
本发明实施例的技术方案,采用RGB图像作为输入数据,对方法的条件限制少,无需对图像进行预处理与后处理。通过SRM子模型对图像进行处理,SRM子模型提取,在算法运行中生成,不占用额外的存储空间。SRM子模型利用一组高通滤波器抑制图像的内容,生成噪声图,提高了网络的泛化能力,加速网络的收敛。利用约束卷积子模型提取低层级的特征,抑制图像内容,自适应的学习图像篡改的痕迹,避免了针对不同类型的篡改设计、选择特征的过程。利用噪声图与约束图表达图像的篡改特征,实现了高低频信息的互补,能够获得更加丰富的篡改特征。通过重压缩子模型对图像进行处理,得到误差图,利用误差图作为其中一类输入,能够直观的描述出图像中目标的轮廓及区域。利用GhostNet作为特征提取网络,GhostNet由多个GhostModule组成,每一个GhostModule利用分组卷积,将卷积后的结果与原始结果进行了叠加,形成了新的特征图,能够在不增加参数量的同时实现通道间更丰富的特征提取。通过复用通道间的特征,参数量少,便于在边端设备上的部署,能够获得更快的推理速度。通过对三种特征子向量添加时间维度,然后利用LSTM网络融合三者,能够由粗到细、由远及近的融合特征向量,模拟人类的决策过程。利用注意力机制对融合后的特征求权,并对融合后的特征与权重进行加权过滤,强调重要的特征,抑制不重要的特征,对最终的效果有提升作用。
实施例四
图4为本发明实施例提供的一种图像检测装置的结构示意图,本发明实施例所提供的图像检测装置可执行本发明任意实施例所提供的图像检测方法,具备执行方法相应的功能模块和有益效果。该装置包括:特征图获取模块410、目标特征向量获取模块420、目标全局特征向量获取模块430、图像分类结果获取模块440和检测结果确定模块450;其中:
特征图获取模块410,用于将待检测图像输入至特征图转换模型中,得到至少三幅特征图;其中,所述特征图转换模型包括约束卷积子模型、重压缩子模型以及噪声子模型,所述至少三幅特征图是分别与所述约束卷积子模型对应的约束图,与所述重压缩子模型对应的误差图以及与所述噪声子模型对应的噪声图;目标特征向量获取模块420,用于将所述至少三幅特征图分别输入至相应的目标特征向量提取模型中,得到目标特征向量;所述目标特征向量中包括三个特征子向量;目标全局特征向量获取模块430,用于将所述目标特征向量输入至特征处理模型中,得到目标全局特征向量;图像分类结果获取模块440,用于基于目标数据处理模型对所述目标全局特征向量进行处理,得到与所述待检测图像相对应的图像分类结果;检测结果确定模块450,用于基于所述图像分类结果,确定与所述待检测图像相对应的检测结果。
进一步的,所述特征处理模型包括长短期记忆网络模型;
所述目标全局特征向量获取模块430包括:
第一特征向量获取子模块,用于将所述目标特征向量输入至所述长短期记忆网络模型中,得到目标全局特征向量。
进一步的,所述三个特征子向量是分别与约束图对应的约束特征子向量、与误差图对应的误差特征子向量以及与噪声图对应的噪声特征子向量。
进一步的,所述目标全局特征向量获取模块430包括:
第二特征向量获取子模块,用于将所述约束特征子向量、所述误差特征子向量以及所述噪声特征子向量依次输入至特征处理模型,得到目标全局特征向量。
进一步的,所述目标数据处理模型包括注意力子模型以及决策子模型;
所述图像分类结果获取模块440包括:
目标融合特征向量获取子模块,用于基于所述注意力子模型对所述目标全局特征向量进行处理,得到目标融合特征向量;图像分类结果获取子模块,用于基于所述决策子模型对所述目标融合特征向量进行处理,得到与所述待检测图像相对应的图像分类结果。
进一步的,所述目标融合特征向量获取子模块包括:
融合权重获取单元,用于基于所述注意力子模型对所述目标全局特征向量进行处理,得到所述目标全局特征向量的融合权重;目标融合特征向量确定单元,用于基于所述目标全局特征向量以及所述融合权重,得到所述目标融合特征向量。
进一步的,所述检测结果确定模块450包括:
图像类别标识确定子模块,用于基于所述图像分类结果与预先设置的图像分类结果与类别标识的对应关系,确定图像类别标识;检测结果确定子模块,用于基于所述图像类别标识确定所述待检测图像相对应的检测结果。
本发明实施例的技术方案,通过将待检测图像输入至特征图转换模型中,得到至少三幅特征图,将这三幅特征图分别输入至相应的目标特征向量提取模型中,得到目标特征向量,将目标特征向量输入至特征处理模型中,得到目标全局特征向量。之后,基于目标数据处理模型对目标全局特征向量进行处理的,得到图像分类结果,基于图像分类结果,确定与待检测图像相对应的检测结果。通过本发明实施例的技术方案,实现了将图像转换为三种特征图,并基于三种特征图得到目标特征向量,基于目标特征向量进行计算以得到最终的检测结果,以对图像是否发生拼接篡改进行检测,提高了图像检测的准确性。
值得注意的是,上述装置所包括的各个模块和子模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明实施例的保护范围。
实施例五
图5为本发明实施例提供的一种电子设备的结构示意图。图5示出了适于用来实现本发明实施例实施方式的示例性电子设备50的框图。图5显示的电子设备50仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图5所示,电子设备50以通用计算设备的形式表现。电子设备50的组件可以包括但不限于:一个或者多个处理器或者处理单元501,系统存储器502,连接不同系统组件(包括系统存储器502和处理单元501)的总线503。
总线503表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
电子设备50典型地包括多种计算机系统可读介质。这些介质可以是任何能够被电子设备50访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器502可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)504和/或高速缓存存储器505。电子设备50可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统506可以用于读写不可移动的、非易失性磁介质(图5未显示,通常称为“硬盘驱动器”)。尽管图5中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM, DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线503相连。存储器502可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块507的程序/实用工具508,可以存储在例如存储器502中,这样的程序模块507包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块507通常执行本发明所描述的实施例中的功能和/或方法。
电子设备50也可以与一个或多个外部设备509(例如键盘、指向设备、显示器510等)通信,还可与一个或者多个使得用户能与该电子设备50交互的设备通信,和/或与使得该电子设备50能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口511进行。并且,电子设备50还可以通过网络适配器512与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器512通过总线503与电子设备50的其它模块通信。应当明白,尽管图5中未示出,可以结合电子设备50使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元501通过运行存储在系统存储器502中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的图像检测方法。
实施例六
本发明实施例还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种图像检测方法,所述方法包括:
将待检测图像输入至特征图转换模型中,得到至少三幅特征图;其中,所述特征图转换模型包括约束卷积子模型、重压缩子模型以及噪声子模型,所述至少三幅特征图是分别与所述约束卷积子模型对应的约束图,与重压缩子模型对应的误差图以及与噪声子模型对应的噪声图;将所述至少三幅特征图分别输入至相应的目标特征向量提取模型中,得到目标特征向量;所述目标特征向量中包括三个特征子向量;将所述目标特征向量输入至特征处理模型中,得到目标全局特征向量;基于目标数据处理模型对所述目标全局特征向量进行处理,得到与所述待检测图像相对应的图像分类结果;基于所述图像分类结果,确定与所述待检测图像相对应的检测结果。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明实施例操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言——诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (10)

1.一种图像检测方法,其特征在于,包括:
将待检测图像输入至特征图转换模型中,得到至少三幅特征图;其中,所述特征图转换模型包括约束卷积子模型、重压缩子模型以及噪声子模型,所述至少三幅特征图是分别与所述约束卷积子模型对应的约束图,与所述重压缩子模型对应的误差图以及与所述噪声子模型对应的噪声图;
将所述至少三幅特征图分别输入至相应的目标特征向量提取模型中,得到目标特征向量;所述目标特征向量中包括三个特征子向量;
将所述目标特征向量输入至特征处理模型中,得到目标全局特征向量;
基于目标数据处理模型对所述目标全局特征向量进行处理,得到与所述待检测图像相对应的图像分类结果;
基于所述图像分类结果,确定与所述待检测图像相对应的检测结果。
2.根据权利要求1所述的方法,其特征在于,所述特征处理模型包括长短期记忆网络模型;
所述将所述目标特征向量输入至特征处理模型中,得到目标全局特征向量,包括:
将所述目标特征向量输入至所述长短期记忆网络模型中,得到目标全局特征向量。
3.根据权利要求1所述的方法,其特征在于,所述三个特征子向量是分别与约束图对应的约束特征子向量、与误差图对应的误差特征子向量以及与噪声图对应的噪声特征子向量。
4.根据权利要求3所述的方法,其特征在于,所述将所述目标特征向量输入至特征处理模型中,得到目标全局特征向量,包括:
将所述约束特征子向量、所述误差特征子向量以及所述噪声特征子向量依次输入至特征处理模型,得到目标全局特征向量。
5.根据权利要求1所述的方法,其特征在于,所述目标数据处理模型包括注意力子模型以及决策子模型;
所述基于目标数据处理模型对所述目标全局特征向量进行处理,得到与所述待检测图像相对应的图像分类结果,包括:
基于所述注意力子模型对所述目标全局特征向量进行处理,得到目标融合特征向量;
基于所述决策子模型对所述目标融合特征向量进行处理,得到与所述待检测图像相对应的图像分类结果。
6.根据权利要求5所述的方法,其特征在于,所述基于所述注意力子模型对所述目标全局特征向量进行处理,得到目标融合特征向量,包括:
基于所述注意力子模型对所述目标全局特征向量进行处理,得到所述目标全局特征向量的融合权重;
基于所述目标全局特征向量以及所述融合权重,得到所述目标融合特征向量。
7.根据权利要求1所述的方法,其特征在于,所述基于所述图像分类结果,确定与所述待检测图像相对应的检测结果,包括:
基于所述图像分类结果与预先设置的图像分类结果与类别标识的对应关系,确定图像类别标识;
基于所述图像类别标识确定所述待检测图像相对应的检测结果。
8.一种图像检测装置,其特征在于,包括:
特征图获取模块,用于将待检测图像输入至特征图转换模型中,得到至少三幅特征图;其中,所述特征图转换模型包括约束卷积子模型、重压缩子模型以及噪声子模型,所述至少三幅特征图是分别与所述约束卷积子模型对应的约束图,与所述重压缩子模型对应的误差图以及与所述噪声子模型对应的噪声图;
目标特征向量获取模块,用于将所述至少三幅特征图分别输入至相应的目标特征向量提取模型中,得到目标特征向量;所述目标特征向量中包括三个特征子向量;
目标全局特征向量获取模块,用于将所述目标特征向量输入至特征处理模型中,得到目标全局特征向量;
图像分类结果获取模块,用于基于目标数据处理模型对所述目标全局特征向量进行处理,得到与所述待检测图像相对应的图像分类结果;
检测结果确定模块,用于基于所述图像分类结果,确定与所述待检测图像相对应的检测结果。
9.一种电子设备,其特征在于,所述电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的图像检测方法。
10.一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-7中任一所述的图像检测方法。
CN202110569146.8A 2021-05-25 2021-05-25 图像检测方法、装置、电子设备及存储介质 Active CN113033518B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110569146.8A CN113033518B (zh) 2021-05-25 2021-05-25 图像检测方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110569146.8A CN113033518B (zh) 2021-05-25 2021-05-25 图像检测方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN113033518A true CN113033518A (zh) 2021-06-25
CN113033518B CN113033518B (zh) 2021-08-31

Family

ID=76455644

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110569146.8A Active CN113033518B (zh) 2021-05-25 2021-05-25 图像检测方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN113033518B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107253485A (zh) * 2017-05-16 2017-10-17 北京交通大学 异物侵入检测方法及异物侵入检测装置
US20180012107A1 (en) * 2015-12-11 2018-01-11 Tencent Technology (Shenzhen) Company Limited Image classification method, electronic device, and storage medium
CN111414856A (zh) * 2020-03-19 2020-07-14 支付宝(杭州)信息技术有限公司 实现用户隐私保护的人脸图像生成方法及装置
US20200372243A1 (en) * 2018-06-11 2020-11-26 Tencent Technology (Shenzhen) Company Limited Image processing method and apparatus, facial recognition method and apparatus, and computer device
CN112131978A (zh) * 2020-09-09 2020-12-25 腾讯科技(深圳)有限公司 一种视频分类方法、装置、电子设备和存储介质
CN112184547A (zh) * 2020-09-03 2021-01-05 红相股份有限公司 红外图像的超分辨率方法及计算机可读存储介质
CN112232258A (zh) * 2020-10-27 2021-01-15 腾讯科技(深圳)有限公司 一种信息处理方法、装置及计算机可读存储介质
CN112507997A (zh) * 2021-02-08 2021-03-16 之江实验室 一种基于多尺度卷积和感受野特征融合的人脸超分辨系统
CN112529168A (zh) * 2020-12-29 2021-03-19 中国人民解放军国防科技大学 一种基于gcn的属性多层网络表示学习方法
CN112669249A (zh) * 2021-01-15 2021-04-16 西安中科立德红外科技有限公司 结合改进nsct变换和深度学习的红外与可见光图像融合方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180012107A1 (en) * 2015-12-11 2018-01-11 Tencent Technology (Shenzhen) Company Limited Image classification method, electronic device, and storage medium
CN107253485A (zh) * 2017-05-16 2017-10-17 北京交通大学 异物侵入检测方法及异物侵入检测装置
US20200372243A1 (en) * 2018-06-11 2020-11-26 Tencent Technology (Shenzhen) Company Limited Image processing method and apparatus, facial recognition method and apparatus, and computer device
CN111414856A (zh) * 2020-03-19 2020-07-14 支付宝(杭州)信息技术有限公司 实现用户隐私保护的人脸图像生成方法及装置
CN112184547A (zh) * 2020-09-03 2021-01-05 红相股份有限公司 红外图像的超分辨率方法及计算机可读存储介质
CN112131978A (zh) * 2020-09-09 2020-12-25 腾讯科技(深圳)有限公司 一种视频分类方法、装置、电子设备和存储介质
CN112232258A (zh) * 2020-10-27 2021-01-15 腾讯科技(深圳)有限公司 一种信息处理方法、装置及计算机可读存储介质
CN112529168A (zh) * 2020-12-29 2021-03-19 中国人民解放军国防科技大学 一种基于gcn的属性多层网络表示学习方法
CN112669249A (zh) * 2021-01-15 2021-04-16 西安中科立德红外科技有限公司 结合改进nsct变换和深度学习的红外与可见光图像融合方法
CN112507997A (zh) * 2021-02-08 2021-03-16 之江实验室 一种基于多尺度卷积和感受野特征融合的人脸超分辨系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
孙继刚: "《序列图像红外小目标检测与跟踪算法研究》", 《中国博士学位论文全文数据库 信息科技辑》 *

Also Published As

Publication number Publication date
CN113033518B (zh) 2021-08-31

Similar Documents

Publication Publication Date Title
CN109949317B (zh) 基于逐步对抗学习的半监督图像实例分割方法
CN111476284B (zh) 图像识别模型训练及图像识别方法、装置、电子设备
US7447338B2 (en) Method and system for face detection using pattern classifier
CN108304835A (zh) 文字检测方法和装置
CN111931664A (zh) 混贴票据图像的处理方法、装置、计算机设备及存储介质
US11508173B2 (en) Machine learning prediction and document rendering improvement based on content order
CN105574550A (zh) 一种车辆识别方法及装置
CN110232340B (zh) 建立视频分类模型以及视频分类的方法、装置
CN111414906A (zh) 纸质票据图片的数据合成与文本识别方法
CN110598693A (zh) 一种基于Faster-RCNN的船牌识别方法
CN111428557A (zh) 基于神经网络模型的手写签名的自动校验的方法和装置
CN112200193B (zh) 基于多属性融合的分布式车牌识别方法、系统、装置
CN116226785A (zh) 目标对象识别方法、多模态识别模型的训练方法和装置
CN114863091A (zh) 一种基于伪标签的目标检测训练方法
CN115909280A (zh) 基于多头注意力机制的交通标志识别算法
CN115546553A (zh) 一种基于动态特征抽取和属性修正的零样本分类方法
CN113570512A (zh) 一种图像数据处理方法、计算机及可读存储介质
CN110351094B (zh) 字符验证方法、装置、计算机设备及存储介质
CN113033518B (zh) 图像检测方法、装置、电子设备及存储介质
CN111144466A (zh) 一种图像样本自适应的深度度量学习方法
WO2023280229A1 (zh) 图像处理方法、电子设备及存储介质
CN112801960B (zh) 图像处理方法及装置、存储介质、电子设备
CN113033305B (zh) 活体检测方法、装置、终端设备和存储介质
CN113989624A (zh) 红外低慢小目标检测方法、装置、计算设备及存储介质
CN114897901B (zh) 基于样本扩充的电池质量检测方法、装置和电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant