CN111241989A - 图像识别方法及装置、电子设备 - Google Patents

图像识别方法及装置、电子设备 Download PDF

Info

Publication number
CN111241989A
CN111241989A CN202010017583.4A CN202010017583A CN111241989A CN 111241989 A CN111241989 A CN 111241989A CN 202010017583 A CN202010017583 A CN 202010017583A CN 111241989 A CN111241989 A CN 111241989A
Authority
CN
China
Prior art keywords
target object
information
category
confidence
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010017583.4A
Other languages
English (en)
Other versions
CN111241989B (zh
Inventor
唐梦云
裴歌
刘水生
涂思嘉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202010017583.4A priority Critical patent/CN111241989B/zh
Publication of CN111241989A publication Critical patent/CN111241989A/zh
Priority to PCT/CN2020/123903 priority patent/WO2021139324A1/zh
Priority to US17/676,111 priority patent/US12087097B2/en
Application granted granted Critical
Publication of CN111241989B publication Critical patent/CN111241989B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/40Spoof detection, e.g. liveness detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/42Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation
    • G06V10/422Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation for representing the structure of the pattern or shape of an object therefor
    • G06V10/426Graphical representations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • G06V10/443Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/766Arrangements for image or video recognition or understanding using pattern recognition or machine learning using regression, e.g. by projecting features on hyperplanes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/40Spoof detection, e.g. liveness detection
    • G06V40/45Detection of the body part being alive
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本公开提供了一种图像识别方法及装置、电子设备,涉及人工智能领域。该方法包括:获取与待识别图像中的目标对象对应的特征信息,其中所述特征信息包括模糊度信息、局部特征信息、全局特征信息中的任意一个或多个;基于所述特征信息判断所述目标对象的类别,并确定与所述目标对象对应的置信度;根据所述目标对象的类别和所述置信度获取与所述待识别图像对应的目标信息。本公开能够提高图像识别的效率和精准度,并且能够判断图像或视频是否使用公众人物的肖像,保护了公众人物的肖像权,避免了不实信息的传播。

Description

图像识别方法及装置、电子设备
技术领域
本公开涉及人工智能技术领域,具体而言,涉及一种图像识别方法、图像识别装置、计算机可读存储介质及电子设备。
背景技术
随着计算机技术的变革和快速发展,人们的生活方式有了很大的改变。随着各种智能应用的产生,例如美图相机、换装软件、换脸软件等等,人们可以通过这些智能应用进行娱乐。
以换脸为例,由于不法分子会通过这些智能应用制作假视频,以此欺骗大众,更甚者会采用假视频进行敲诈勒索、传播黄暴恐、扰乱政治等,导致人们对换脸技术带来的安全风险和隐私危机非常担忧,因此需要对视频中的真假人脸进行精准甄别。但是目前对真假人脸的辨别方法简单,不能覆盖多种换脸算法生成的假脸图像或视频,因此针对当前通过深度伪造技术或其它图像技术生成的人脸,现有的辨别方法无法实现精准检测和甄别。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开的实施例提供了一种图像识别方法、图像识别装置、计算机可读存储介质和电子设备,进而至少在一定程度上可以提高图像识别效率和精准度。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
根据本公开实施例的一个方面,提供了一种图像识别方法,包括:获取与待识别图像中的目标对象对应的特征信息,其中所述特征信息包括模糊度信息、局部特征信息、全局特征信息中的任意一个或多个;基于所述特征信息判断所述目标对象的类别,并确定与所述目标对象对应的置信度;根据所述目标对象的类别和所述置信度获取与所述待识别图像对应的目标信息。
根据本公开实施例的一个方面,提供了一种图像识别装置,包括:特征信息获取模块,用于获取与待识别图像中的目标对象对应的特征信息,其中所述特征信息包括模糊度信息、局部特征信息、全局特征信息中的任意一个或多个;置信度获取模块,用于基于所述特征信息判断所述目标对象的类别,并确定与所述目标对象对应的置信度;目标信息获取模块,用于根据所述目标对象的类别和所述置信度获取与所述待识别图像对应的目标信息。
在本公开的一些实施例中,基于前述方案,所述置信度获取模块包括:第一类别确定单元,用于获取与所述目标对象对应的模糊度信息,根据所述模糊度信息和分类阈值确定所述目标对象的类别;第二类别确定单元,用于当根据所述模糊度信息和所述分类阈值确定所述目标对象的类别为真时,获取与所述目标对象对应的局部特征信息,并基于所述局部特征信息确定所述目标对象的类别;第三类别确定单元,用于当根据所述局部特征信息确定所述目标对象的类别为真时,获取与所述目标对象对应的全局特征信息,并基于所述全局特征信息确定所述目标对象的类别及与所述目标对象对应的置信度,以根据所述目标对象的类别和所述置信度获取与所述待识别图像对应的目标信息。
在本公开的一些实施例中,基于前述方案,所述第一类别确定单元包括:第一对象图获取单元,用于对所述待识别图像中的目标对象进行检测,以获取与所述目标对象对应的第一对象图;第二对象图获取单元,用于对所述第一对象图的坐标进行调整,以获取第二对象图;模糊度计算单元,用于分别对所述第一对象图和所述第二对象图进行模糊度计算,以获取与所述目标对象对应的模糊度信息。
在本公开的一些实施例中,所述模糊度信息包括与所述第一对象图对应的第一模糊度和与所述第二对象图对应的第二模糊度;基于前述方案,所述第一类别确定单元配置为:将所述第二模糊度与所述第一模糊度相除,以获取模糊度比值;将所述模糊度比值与所述分类阈值进行比较;当所述模糊度比值小于或等于所述分类阈值时,判定所述目标对象的类别为真;当所述模糊度比值大于所述分类阈值时,判定所述目标对象的类别为假。
在本公开的一些实施例中,基于前述方案,所述置信度获取模块配置为:在根据所述模糊度信息和所述分类阈值确定所述目标对象的类别为假时,根据所述模糊度比值和所述分类阈值确定与所述目标对象对应的第一置信度。
在本公开的一些实施例中,基于前述方案,所述第二类别确定单元包括:第一特征提取单元,用于将所述第一对象图输入至第一图像识别模型,通过所述第一图像识别模型对所述第一对象图进行特征提取,以获取所述局部特征信息;分类单元,用于根据所述局部特征信息进行分类判断,以获取所述目标对象的类别。
在本公开的一些实施例中,基于前述方案,所述分类单元配置为:基于所述局部特征信息获取与所述目标对象对应的第二置信度和第三置信度;当所述第二置信度大于所述第三置信度时,判定所述目标对象的类别为假;当所述第二置信度小于或等于所述第三置信度时,判定所述目标对象的类别为真。
在本公开的一些实施例中,基于前述方案,所述置信度获取模块包括:第二特征提取单元,用于将所述待识别图像输入至第二图像识别模型,通过所述第二图像识别模型对所述待识别图像进行特征提取,以获取所述全局特征信息;回归单元,用于根据所述全局特征信息对所述目标对象对应的区域进行回归计算,以获取所述目标对象的类别及与所述目标对象对应的置信度。
在本公开的一些实施例中,基于前述方案,所述回归单元配置为:根据所述全局特征信息对所述目标对象对应的区域进行回归计算,以获取与所述目标对象对应的第四置信度和第五置信度;当所述第四置信度大于所述第五置信度时,判定所述目标对象的类别为假;当所述第四置信度小于或等于所述第五置信度时,判定所述目标对象的类别为真。
在本公开的一些实施例中,基于前述方案,所述目标信息获取模块配置为:当根据所述模糊度信息和所述分类阈值确定的所述目标对象的类别为假时,根据基于所述模糊度信息确定的第一置信度确定与所述待识别图像对应的风险值,并基于所述目标对象的类别和所述风险值获取所述目标信息;或者,当根据所述局部特征信息确定的所述目标对象的类别为假时,根据基于所述局部特征信息确定的第二置信度确定与所述待识别图像对应的风险值,并基于所述目标对象的类别和所述风险值获取所述目标信息;或者,当根据所述全局特征信息确定的所述目标对象的类别为假时,根据基于所述全局特征信息确定的第四置信度确定与所述待识别图像对应的风险值,并基于所述目标对象的类别和所述风险值获取所述目标信息。
在本公开的一些实施例中,基于前述方案,所述目标信息获取模块还配置为:当根据所述模糊度信息和所述分类阈值确定的所述目标对象的类别为假时,将所述目标对象与素材库中的待匹配对象进行匹配,以根据所述目标对象的类别、目标置信度和匹配结果获取所述目标信息;或者,当根据所述局部特征信息确定的所述目标对象的类别为假时,将所述目标对象与所述素材库中的待匹配对象进行匹配,以根据所述目标对象的类别、目标置信度和匹配结果获取所述目标信息;或者,当根据所述全局特征信息确定的所述目标对象的类别为假时,将所述目标对象与所述素材库中的待匹配对象进行匹配,以根据所述目标对象的类别、目标置信度和匹配结果获取所述目标信息。
在本公开的一些实施例中,基于前述方案,所述将所述目标对象与素材库中的待匹配对象进行匹配具体为:计算所述目标对象对应的特征向量和所述待匹配对象对应的特征向量之间的距离;将所述距离与预设距离阈值进行比较;当所述距离小于所述预设距离阈值时,判定所述目标对象与所述待匹配对象匹配。
在本公开的一些实施例中,基于前述方案,所述根据所述目标对象的类别、目标置信度和匹配结果获取所述目标信息具体为:在所述目标对象与所述待匹配对象匹配时,根据所述距离确定第六置信度;在根据所述模糊度信息、所述局部特征信息或所述全局特征信息确定所述目标对象的类别为假时,获取与所述目标对象对应的置信度作为所述目标置信度;根据所述第六置信度和所述目标置信度确定与所述待识别图像对应的风险值,并基于所述目标对象的类型、所述匹配结果和所述风险值获取所述目标信息。
根据本公开实施例的一个方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如上述实施例所述的图像识别方法。
根据本公开实施例的一个方面,提供了一种电子设备,包括:一个或多个处理器;存储装置,所述存储装置用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行如上述实施例中所述的图像识别方法。
在本公开的一些实施例所提供的技术方案中,首先通过对待识别图像中的目标对象进行特征提取,获取特征信息,该特征信息包括模糊度信息、局部特征信息和全局特征信息中的一个或多个;然后基于特征信息判断目标对应的类别并确定与目标对象对应的置信度;最后根据目标对象对应的类别和置信度获取与待识别图像对应的目标信息。本公开的技术方案能够提高图像识别的效率和精准度,便于对图像或视频中的人脸、人体等对象进行真假甄别。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1示出了可以应用本公开实施例的技术方案的示例性系统架构的示意图;
图2示意性示出了根据本公开的一个实施例的图像识别方法的流程示意图;
图3示意性示出了根据本公开的一个实施例的获取模糊度信息的流程示意图;
图4示意性示出了根据本公开的一个实施例的根据目标对象进行匹配的流程示意图;
图5示意性示出了根据本公开的一个实施例的目标信息的界面示意图;
图6示意性示出了根据本公开的一个实施例的对人脸进行检测和识别的流程示意图;
图7示意性示出了根据本公开的一个实施例的对敏感视频中的人脸进行检测和识别的流程示意图;
图8示意性示出了根据本公开的一个实施例的图像识别装置的框图;
图9示出了适于用来实现本公开实施例的电子设备的计算机系统的结构示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本公开的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本公开的各方面。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
图1示出了可以应用本公开实施例的技术方案的示例性系统架构的示意图。
如图1所示,系统架构100可以包括终端设备101、网络102和服务器103。网络102用以在终端设备101和服务器103之间提供通信链路的介质。网络102可以包括各种连接类型,例如有线通信链路、无线通信链路等等。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实际需要,可以具有任意数目的终端设备、网络和服务器。比如服务器103可以是多个服务器组成的服务器集群等。终端设备101可以是诸如平板电脑、台式计算机、智能手机等设备。
在本公开的一个实施例中,终端设备101可以获取待识别视频,通过对待识别视频进行解析,以获取包含目标对象的图像,并将该包含目标对象的图像作为待识别图像,也可以直接获取包含目标对象的待识别图像后。然后终端设备101可以通过网络102向服务器103发送该待识别图像。当服务器103获取待识别图像后,可以对待识别图像中的目标对象进行特征提取,以获取与目标对象对应的特征信息,该特征信息包括模糊度信息、局部特征信息和全局特征信息中的任意一个或多个。接着基于该特征信息判断目标对象的类别,并确定与目标对象对应的置信度,根据目标对象的类别和置信度可以对待识别图像中的目标对象的真假进行甄别,也就是判断该目标对象是否为后期通过图像处理技术添加上去的,而不是待识别图像中原始包含的对象。最后根据获取的置信度可以对待识别图像的风险值进行计算,并基于该风险值获取目标信息,该目标信息具体可以包括目标对象是否为假、是否使用公众人物的肖像、风险值等信息,根据任务的不同,目标信息所包含的信息也不同。若确定待识别图像或待识别视频存在风险,则需要对其进行下架等操作。本公开实施例的技术方案能够对待识别图像或待识别视频进行多方位、多层次的分析,极大程度地提升了图像识别的效率和精准度。
需要说明的是,本公开实施例所提供的图像识别方法可由服务器执行,相应地,图像识别装置可设置于服务器中。但是,在本公开的其它实施例中,也可以由终端设备执行本公开实施例所提供的图像识别方法。
在本领域的相关技术中,以对图像中人脸的真假进行检测识别为例,首先可以对图像进行人脸检测,然后根据假脸模型对人脸图像进行检测,该假脸模型是一种基于特征向量的分类器。该方法主要针对早期人脸核验场景中的假脸,比如照片中的静态人像,与通过人工智能技术生成的人脸差异较大,通过人工智能技术生成的假脸视频变化多端,特征差别较大,质量很不稳定,因此,仅适用单一的方法对图像、视频进行真伪鉴别会带来误检率高、漏检率高的问题,很难实现对多种人工智能换脸技术生成的假脸进行准确检测。
鉴于相关技术中存在的问题,本公开实施例提供了一种图像识别方法,该图像识别方法是基于机器学习实现的,机器学习属于人工智能的一种,人工智能(ArtificialIntelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
计算机视觉技术(Computer Vision,CV)计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取信息的人工智能系统。计算机视觉技术通常包括图像处理、图像识别、图像语义理解、图像检索、OCR、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、3D技术、虚拟现实、增强现实、同步定位与地图构建等技术,还包括常见的人脸识别、指纹识别等生物特征识别技术。
机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
随着人工智能技术研究和进步,人工智能技术在多个领域展开研究和应用,例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。
本公开实施例提供的方案涉及人工智能的图像识别技术,具体通过如下实施例进行说明:
本公开实施例首先提出了一种图像识别方法,以下以对待识别图像中的人脸进行识别为例,对本公开实施例的技术方案的实现细节进行详细阐述:
图2示意性示出了根据本公开的一个实施例的图像识别方法的流程图,该图像识别方法可以由服务器来执行,该服务器可以是图1中所示的服务器103。参照图2所示,该图像识别方法至少包括步骤S210至步骤S230,详细介绍如下:
在步骤S210中,获取与待识别图像中的目标对象对应的特征信息,其中所述特征信息包括模糊度信息、局部特征信息、全局特征信息中的任意一个或多个。
在本公开的一个实施例中,待识别图像为需要对其中的人脸进行甄别的图像,其中的人脸即为目标对象,待识别图像可以是终端设备本地存储的包含人脸的图像,也可以是从网络上获取的包含人脸的图像,进一步地,待识别图像还可以是对待识别视频进行处理获取的,具体地,可以通过视频编解码技术对待识别视频进行解码,例如可以采用MPEG-2、MPEG-4、H.264等方法,将待识别视频解析为图像帧,并将其中包含人脸的图像帧作为待识别图像,也可以从所有包含人脸的图像帧中选择一帧作为待识别图像。
在本公开的一个实施例中,可以从待识别图像提取与其对应的低阶特征和高阶特征,其中低阶特征可以是图像的像素、纹理级别的信息,高阶特征可以是图像局部或全局的特征信息,在本公开的实施例中,与待识别图像对应的特征信息由低到高分别为模糊度信息、局部特征信息和全局特征信息。根据该三个特征信息中的任意一个可以确定待识别图像的类别,也可以根据三个特征信息中的多个确定待识别图像的类别,该待识别图像的类别即为待识别图像中人脸的真假。
由于目前大多数换脸技术首先是生成与图像或视频中目标任务的表情、动作相似的人脸区域,再利用图像融合、人脸融合技术将生成的假脸嵌入到目标人脸中。然而,这些方法的局限性在于,生成的人脸区域与原始视频的分辨率并不一致,使得合成视频中人脸区域在图像低阶特征层面与原始真实图像、视频存在较大差异,如:颜色、边缘轮廓、纹理、光照强度、清晰度等。合成的视频通常具有边缘模糊,不同区域的纹理缺少变化,分辨率较低等特点,因此在本公开的实施例中,可以首先对视频中人脸区域和人体区域的模糊度进行分析,包括二者在纹理、边缘轮廓和清晰度等方面的特征差异,并利用分类阈值,对图像、视频中的人脸进行真假判断,由于模糊度信息是图像的低阶特征,易获取,因此若通过模糊度信息便检测出人脸的真假,那么就不需要根据图像的高阶特征进行人脸识别,进而能够提高识别效率,节省时间和资源。
在本公开的一个实施例中,图3示出了获取模糊度信息的流程示意图,如图3所示,该流程至少包括步骤S301-S303,具体地:
在步骤S301中,对待识别图像中的目标对象进行检测,以获取与目标对象对应的第一对象图;
在本公开的一个实施例中,在获取待识别图像的模糊度信息之前,需要对待识别图像中的人脸区域进行检测,以获取与人脸区域对应的第一对象图。具体地,可以基于人脸检测算法对该待识别图像中的人脸进行检测,以获取人脸坐标框信息,根据该人脸坐标框信息可以进一步确定人脸区域,并获取仅包含人脸区域信息的第一对象图。在对待识别图像中的人脸进行检测时,可以采用基于特征金字塔网络架构的模型进行检测,通过该模型对待识别图像中的人脸进行检测,以获取人脸坐标框信息,该人脸坐标框信息具体包括人脸区域左上角起始点的坐标(x,y),同时还包括人脸区域边界框的宽度width和高度height,也就是说,人脸坐标框信息为(x,y,width,height),该第一对象图中仅包含人脸信息,不包含待识别图像中的背景信息。
在本公开的一个实施例中,还可以通过其它人脸检测算法对待识别图像中的人脸进行检测,以获取人脸坐标框信息,例如可以通过Cascade CNN、DenseBox、Faceness-Net、Face R-CNN、MTCNN等人脸检测算法,本公开实施例对此不作具体限定。
在步骤S302中,对第一对象图的坐标进行调整,以获取第二对象图。
在本公开的一个实施例中,由于需要对人脸区域和人体区域的模糊度进行分析,因此还需要获取与人体区域对应的第二对象图,但是考虑到待识别图像中的背景太多太杂,若直接将待识别图像作为第二对象图的话,会因存在太多噪音影响最终判断结果的精准度,因此在本公开的实施例中,可以对第一对象图的坐标进行扩大,以获取包含部分背景的第二对象图,具体地,可以将第一对象图的宽度width和高度height都扩大1/4倍,当然也可以扩大其它倍数,本公开实施例对此不作具体限定。
在步骤S303中,分别对第一对象图和第二对象图进行模糊度计算,以获取与目标对象对应的模糊度信息。
在本公开的一个实施例中,在获取第一对象图和第二对象图后,可以利用拉普拉斯算子计算分别与第一对象图对应的第一模糊度Sface和与第二对象图对应的第二模糊度Sbg,在计算模糊度时,首先可以对第一对象图、第二对象图进行高斯滤波,去除噪音;接着将滤波处理后的第一对象图和第二对象图转换为灰度图;然后采用拉普拉斯算子分别与第一对象图和第二对象图对应的灰度图进行卷积;最后根据卷积后得到的特征信息计算方差,即可得到第一模糊度Sface和第二模糊度Sbg,该第一模糊度Sface和该第二模糊度Sbg即为与目标对象人脸对应的模糊度信息。
在本公开的一个实施例中,还可以根据与目标对象对应的局部特征信息进行图像识别,首先可以获取与目标对象对应的局部特征信息,然后基于局部特征信息确定目标对象的类别。在提取与目标对象对应的局部特征信息时,可以将第一对象图输入至第一图像识别模型,通过第一图像识别模型对第一对象图进行特征提取,以获取局部特征信息,并根据该局部特征信息进行分类判断,以获取目标对像的类别。其中,该第一图像识别模型可以是用于图像特征提取的各种网络模型,例如可以是ResNet、Inception、SqueezeNet、DenseNet等卷积神经网络。以SqueezeNet网络为例,在将第一对象图输入至SqueezeNet网络之前,可以将第一对象图缩放至224×224像素,以与SqueezeNet网络的输入匹配;然后将缩放后的第一对象图输入至SqueezeNet网络,通过SqueezeNet网络对缩放后的第一对象图进行特征提取,获取局部特征信息,即人脸特征信息;最后根据人脸特征信息对人脸的真假进行甄别。
在本公开的一个实施例中,还可以根据与目标对象对应的全局特征信息进行图像识别,首先可以对待识别图像进行特征提取以获取与目标对象对应的全局特征信息,然后基于全局特征信息确定目标对象的类别及与目标对象对应的置信度。在提取全局特征信息时,可以将待识别图像输入至第二图像识别模型,通过第二图像识别模型对待识别图像进行特征提取,以获取全局特征信息,该第二图像识别模型也可以是用于图像特征提取的各种网络模型,如Faster R-CNN、Fast R-CNN、Mask R-CNN、YOLO、YOLOv2、YOLOv3等等。
在步骤S220中,基于所述特征信息判断所述目标对象的类别,并确定与所述目标对象对应的置信度。
在本公开的一个实施例中,获取第一模糊度Sface和第二模糊度Sbg后,可以将第二模糊度与第一模糊度相除,以获取模糊度比值p,p=Sbg/Sface;接着将该模糊度比值与分类阈值进行比较,当模糊度比值小于或等于分类阈值时,判定目标对象的类别为真,即待识别图像中的人脸为真脸;当模糊度比值大于分类阈值时,判定目标对象的类别为假,即待识别图像中的人脸为假脸。其中,分类阈值是根据多个视频中所有图像帧中的人脸识别结果得到的自适应的分类阈值。
在本公开的一个实施例中,当根据模糊度信息判定目标对象的类别为假时,可以根据模糊度比值和分类阈值确定其为假的第一置信度,计算公式如式(1)所示,具体为:
conf-level1-fake=(p-pboarder)/p×0.5+0.5 (1)
其中,conf-level1-fake为第一置信度,p为模糊度比值,pboarder为分类阈值。
在本公开的一个实施例中,可以根据与目标对象对应的局部特征信息确定目标对象的类别。在将第一对象图输入至第一图像识别模型,并通过第一图像识别模型对第一对象图进行特征提取后,可以获取待识别图像的局部特征信息,该局部特征信息即为人脸特征信息。基于人脸特征信息能够获取与人脸对应的第二置信度conf-level2-fake和第三置信度conf-level2-real,其中第二置信度conf-level2-fake是第一图像识别模型输出的人脸的类别为假的概率值,第三置信度conf-level2-real是第一图像识别模型输出的人脸的类别为真的概率值。当第二置信度conf-level2-fake大于第三置信度conf-level2-real时,判定待识别图像中的人脸为假脸;当第二置信度conf-level2-fake小于或等于第三置信度conf-level2-real时,判定待识别图像中的人脸为真脸。局部特征信息相较于模糊度信息更精确,属于图像信息中的高阶特征,根据局部特征信息进行图像识别,能够进一步提高图像识别的精准度,人脸甄别的准确度更高。
在本公开的一个实施例中,还可以根据与目标对象对应的全局特征信息进行图像识别,具体地可以基于全局特征信息确定目标对象的类别及与目标对象对应的置信度。在通过第二图像识别模型对待识别图像进行特征提取,获取全局特征信息后,可以对目标对象对应的区域进行回归计算,以获取目标对象的类别和与目标对象对应的置信度。通过根据全局特征信息对目标对象对应的区域进行回归计算,可以获取与目标对象对应的第四置信度conf-level3-fake和第五置信度conf-level3-real,其中第四置信度conf-level3-fake为第二图像识别模型输出的目标对象的类别为假的概率值,第五置信度conf-level3-real为第二图像识别模型输出的目标对象的类别为真的概率值。同样地,当第四置信度conf-level3-fake大于第五置信度conf-level3-real时,说明待识别图像中的人脸为假脸;当第四置信度conf-level3-fake小于或等于第五置信度conf-level3-real时,说明待识别图像中的人脸为真脸。通过对全局特征信息进行提取,能够充分考虑到人脸与背景之间的上下文关系,利用人脸区域与背景之间的差异,实现对真假人脸的甄别,提高了人脸甄别的精准度。
在本公开的一个实施例中,在提取待识别图像中的局部特征信息或全局特征信息,以获取与不同类别的目标对象对应的置信度时,可以仅采用一种图像识别模型,也可以采用多种图像识别模型的集合,当采用多种图像识别模型的集合时,可以通过集合中的各个图像识别模型对待识别图像进行特征提取,并基于获取的特征信息输出与不同类别的目标对象对应的置信度,该置信度包含目标对象为真时的置信度和目标对象为假时的置信度;在获取了各个图像识别模型输出的置信度后,将所有目标对象为真时的置信度相加即为最终的目标对象为真时的置信度,同样地,将所有目标对象为假时的置信度相加即为最终的目标对象为假时的置信度。
在本公开的一个实施例中,为了提高图像识别的效率和精准度,可以根据与待识别图像对应的由低阶到高阶的特征信息进行真假人脸的甄别,在进行真假人脸的甄别时,需要根据前一个特征信息对应的识别结果判断是否获取下一个特征信息,并根据下一个特征信息进行真假人脸的甄别,具体地,首先获取与目标对象对应的模糊度信息,根据模糊度信息和分类阈值确定目标对象的类别;当根据模糊度信息和分类阈值确定的目标对象的类别为真时,获取与目标对象对应的局部特征信息,并基于局部特征信息确定目标对象的类别;当基于局部特征信息确定目标对象的类别为真时,获取与目标对象对应的全局特征信息,并基于全局特征信息确定目标对象的类别及与目标对象对应的置信度,以根据置信度获取与待识别图像对应的目标信息。也就是说,根据某一阶的特征信息确定待识别图像中的目标对象的类别为假时,即停止判断,这样可以节省时间和资源。其中,根据模糊度信息和分类阈值确定目标对象的类别、基于局部特征信息确定目标对象的类别、基于全局特征信息确定目标对象的类别的具体流程与上述实施例中的流程相同,本公开实施例在此不再赘述。
在本公开的一个实施例中,在对待识别图像中目标对象依次按照模糊度信息、局部特征信息和全局特征信息进行甄别时,直至判定目标对象的类别为假或根据所有特征信息判定目标对象的类别为真时,则停止判断并输出判定信息。具体地,如果根据模糊度信息判定目标对象的类别为假时,停止判断;如果根据模糊度信息判定目标对象的类别为真,而根据局部特征信息判定目标对象的类别为假时,停止判断;如果根据局部特征信息判定目标对象的类别为真,而根据全局特征信息判定目标对象的类别为假时,停止判断。并且当根据从低阶到高阶的特征信息都确定待识别图像中的目标对象为真时,即可判定待识别图像中的目标对象为真,并输出目标信息“真脸,安全”。
在步骤S230中,根据所述目标对象的类别和所述置信度获取与所述待识别图像对应的目标信息。
在本公开的一个实施例中,在根据与待识别图像对应的由低阶到高阶的特征信息对目标对象的真假进行甄别时,当根据某一阶特征信息判定目标对象的类别为假时,获取对应的置信度,并根据该置信度对待识别图像的风险值进行计算,以获取目标信息,该目标信息为待识别图像中是否存在风险的提示信息,例如目标信息可以包括是否为假脸和风险值,当然根据任务的不同,目标信息还可以包含其它信息,比如是否使用公众人物人脸,等等。具体地,当根据模糊度信息和分类阈值确定的目标对象的类别为假时,根据第一置信度确定与待识别图像对应的风险值,并基于目标对象的类别和风险值获取目标信息;或者,当根据局部特征信息确定的目标对象的类别为假时,根据第二置信度确定与待识别图像对应的风险值,并基于目标对象的类别和风险值获取目标信息;或者,当根据全局特征信息确定的目标对象的类别为假时,根据第四置信度确定与待识别图像对应的风险值,并基于目标对象的类别和风险值获取目标信息。例如,根据模糊度信息和局部特征信息判定待识别图像中的人脸为真脸,且根据全局特征信息判定待识别图像中的人脸为假脸时,可以获取对应的置信度为0.7,根据该置信度可以确定待识别图像的风险值为0.7,那么最终的目标信息即为“假脸,风险值:0.7”。
在本公开的一个实施例中,除了对待识别图像中的目标对象的真假进行判断,还可以对待识别图像中的目标对象是否与公众人物相同进行判断,以保护公众人物的利益,并防止不法分子通过以公众人物的形象制作的假视频欺骗社会或做出其它危害社会的行为。在根据模糊度信息、局部特征信息或全局特征信息判定目标对象的类别为假时,可以将待识别图像中的目标对象与素材库中的待匹配对象进行匹配,以判断待识别图像中的人脸是否使用公众人物的人脸信息。
在本公开的一个实施例中,还可以根据目标对象的类别、目标置信度和与公众人物的人脸的匹配结果获取目标信息,具体地,当根据模糊度信息和分类阈值确定的目标对象的类别为假时,将目标对象与素材库中的待匹配对象进行匹配,以根据目标对象的类别、目标置信度和匹配结果获取目标信息;或者,当根据局部特征信息确定的目标对象的类别为假时,将目标对象与素材库中的待匹配对象进行匹配,以根据目标对象的类别、目标置信度和匹配结果获取目标信息;或者,当根据全局特征信息确定的目标对象的类别为假时,将目标对象与素材库中的待匹配对象进行匹配,以根据目标对象的类别、目标置信度和匹配结果获取目标信息。
在本公开的一个实施例中,素材库中包含多个公众人物的人脸特征向量,图4示出了根据目标对象进行匹配的流程示意图,如图4所示,在步骤S401中,计算目标对象对应的特征向量与待匹配对象对应的特征向量之间的距离;在步骤S402中,将该距离与预设距离阈值进行比较;在步骤S403中,当距离小于预设距离阈值时,判定目标对象与待匹配对象匹配;在步骤S404中,当距离大于或等于预设距离阈值时,判定目标对象与待匹配对象不匹配。
其中,在步骤S401中,目标对象对应的特征向量可以通过特征提取网络对根据目标对象坐标框信息确定的第一对象图进行特征提取获取,具体地,特征提取网络可以是FaceNet、DeepFace、DeepID、SphereFace、ARCFace等网络,本公开实施例对此不作具体限定;距离可以是欧氏距离、马氏距离、曼哈顿距离等等,本公开实施例同样对此不做具体限定。以欧式距离为例,在计算待识别图像中人脸对应的特征向量与素材库中公众人物的人脸对应的特征向量之间的距离时,可以根据公式(2)计算,具体如下:
Figure BDA0002359486950000161
其中,dist(X,Yi)为待识别图像中人脸对应的特征向量与素材库中公众人物的人脸对应的特征向量之间的距离,Xk为待识别图像中人脸对应的特征向量中的分量,Yik为公众人物的人脸对应的特征向量中的分量,k为特征向量中的第k个分量,N为特征向量中分量的总数。
在本公开的一个实施例中,待识别图像中人脸对应的特征向量与公众人物人脸对应的特征向量的维度相同,以FaceNet的输出为例,待识别图像中的人脸特征向量为512维的特征向量X=[x1,x2,x3,…x512],相应地,公众人物的人脸特征向量也是512维的特征向量Yi=[yi1,yi2,yi3,…yi512]。
在本公开的一个实施例中,在步骤S402中,预设距离阈值可以是根据实际情况设定的距离值,在工程中可以将预设距离阈值设定为0.3或0.35。当待识别图像中人脸对应的特征向量与素材库中一公众人物的人脸对应的特征向量的距离小于该预设距离阈值时,说明待识别图像中的人脸盗用了该公众人物的肖像。
在本公开的一个实施例中,在目标对象与待匹配对象匹配时,可以根据待识别图像中人脸对应的特征向量与素材库中公众人物的人脸对应的特征向量之间的距离确定第六置信度,第六置信度可以根据公式(3)获取,具体如下所示:
Figure BDA0002359486950000171
其中,conf-celebrity为第六置信度,dist(X,Yi)为待识别图像中人脸对应的特征向量与素材库中公众人物的人脸对应的特征向量之间的距离。
进一步地,可以根据第六置信度和目标置信度对待识别图像的风险值进行计算,以获取目标信息,其中目标置信度为根据模糊度信息、局部特征信息或全局特征信息确定目标对象的类别为假时,所获取的与目标对象对应的置信度,该置信度具体可以是上述实施例中的第一置信度、第二置信度或第四置信度。也就是说,风险值是由根据模糊度信息、局部特征信息或全局特征信息确定的假脸置信度conf-fake和根据公众人物的人脸比对确定的置信度conf-celebrity共同决定的,当根据模糊度信息确定待识别图像中的人脸为假脸时,conf-fake=conf-level1-fake;当根据局部特征信息确定待识别图像中的人脸为假脸时,conf-fake=conf-level2-fake;当根据全局特征信息确定待识别图像中的人脸为假脸时,conf-fake=conf-level3-fake。在计算风险值时,可以将目标置信度与第六置信度求和,具体为:conf-danger=conf-fake+conf-celebrity,conf-danger值越大,说明风险越大。最后,根据风险值可以确定目标信息,该目标信息可以包括是否为假脸、是否使用公众人物人脸、风险值三方面信息,图5示出了目标信息的界面示意图,如图5所示,在待识别图像的人脸标注框上方显示有目标信息“假脸;未使用公众人物人脸;风险值:0.65”,表明待识别图像中的人脸为假脸。
进一步地,根据风险值可以判断风险属于哪个等级,具体可以设置多个等级,每个等级对应不同的风险值区间,例如设置高风险、中等风险和低风险三个等级,当风险值在(0.7,1]时判定为高风险,当风险值在(0.3,0.7]时判定为中等风险,当风险值在(0,0.3]时判定为低风险,当然也可以是其它的数值区间。最后,根据风险等级可以确定目标信息并输出,该目标信息根据风险等级的不同而不同,例如,当风险等级为高风险时,目标信息为“假脸;使用了公众人物人脸;高风险”;当风险等级为低风险时,目标信息为“假脸;未使用公众人物人脸;低风险”;除此之外,还可以是其它形式,本公开实施例对此不做具体限定。
本公开实施例中的图像识别方法可以应用于活体检测、敏感视频检测等多种场景,活体检测主要应用于交通、金融、保险等领域,例如在乘坐火车、飞机等交通工具时,需要对乘客的人脸进行检测识别,确认乘客信息正确且不存在危险性,敏感视频检测主要应用于网络视频等,例如网络上出现一段视频,其内容为一公众人物发表不当言论,为了判断该视频是否为合成视频,并保障公众人物利益,就需要对其中的人脸进行检测识别。
以活体检测为例,终端设备对用户的头部或上半身进行拍摄,然后将拍摄得到的图像或视频上传至后台服务器,通过后台服务器对图像或视频中的人脸进行检测和识别,并将对人脸进行检测和识别得到的目标信息返回至终端设备,当目标信息提示人脸为假脸时,则进行警告,当目标信息提示人脸为真脸时,则继续后续的活体验证环节,进一步判断活体的合法性。图6示出了对人脸进行检测和识别的流程示意图,如图6所示,在步骤S601中,对图像中的人脸进行检测,获取人脸坐标框信息;在步骤S602中,对根据人脸坐标框信息确定的人脸图像进行模糊度分析,获取模糊度比值;在步骤S603中,根据模糊度比值和分类阈值的大小关系判断图像中的人脸是否为假脸;在步骤S604中,当判定为假脸时,获取假脸的置信度,并根据假脸的置信度计算风险值;在步骤S605中,当判定为真脸时,对根据人脸坐标框信息确定的人脸图像提取局部特征信息,并根据局部特征信息进行分类,以获取人脸分为真脸的置信度和人脸分为假脸的置信度;在步骤S606中,根据真脸的置信度和假脸的置信度判断人脸是否为假脸;在步骤S607中,当判定为假脸时,根据假脸的置信度计算风险值;在步骤S608中,当判定为真脸时,对待识别图像进行特征提取获取全局特征信息,并根据全局特征信息对人脸区域进行回归,同时计算人脸的真假及对应的置信度;在步骤S609中,根据真脸的置信度和假脸的置信度判断人脸是否为假脸;在步骤S610中,当判定为假脸时,根据假脸的置信度计算风险值;在步骤S611中,当判定为真脸时,确定目标信息;在步骤S612中,根据步骤S604、S607、S609中的风险值确定目标信息。其中各步骤的具体执行流程与本公开实施例中对应操作的具体执行流程相同,在此不再赘述。
以敏感视频检测为例,用户通过终端设备将敏感视频发送至后台服务器,通过后台服务器对视频中的人脸进行检测和识别,并判断视频中的人脸是否为公众人物的人脸,最后将根据对人脸进行检测和识别以及公众人物的判断结果确定的目标信息返回至终端设备,根据目标信息的不同可以对敏感视频进行不同的操作,具体地,当目标信息提示敏感视频的风险等级较高,且使用了公众人物的人脸,则可将该敏感视频下架并彻底删除相关路径信息;当目标信息提示敏感视频的风险等级为无风险或较低,并且未使用公众人物的人脸,则可不作处理,或对上传该敏感视频的用户进行监控、警告等。
图7示出了对敏感视频中的人脸进行检测和识别的流程示意图,如图7所示,在步骤S701中,解析敏感视频以获取视频帧,并将视频帧中包含人脸的一帧作为待识别图像;在步骤S702中,对待识别图像中的人脸进行检测,获取人脸坐标框信息;在步骤S703中,对根据人脸坐标框信息确定的人脸图像进行模糊度分析,获取模糊度比值;在步骤S704中,根据模糊度比值和分类阈值的大小关系判断图像中的人脸是否为假脸;在步骤S705中,当判定为假脸时,获取假脸的置信度,并根据假脸的置信度计算风险值;在步骤S706中,当判定为真脸时,对根据人脸坐标框信息确定的人脸图像提取局部特征信息,并根据局部特征信息进行分类,以获取人脸分为真脸的置信度和人脸分为假脸的置信度;在步骤S707中,根据真脸的置信度和假脸的置信度判断人脸是否为假脸;在步骤S708中,当判定为假脸时,根据假脸的置信度计算风险值;在步骤S709中,当判定为真脸时,对待识别图像进行特征提取获取全局特征信息,并根据全局特征信息对人脸区域进行回归,同时计算人脸的真假及对应的置信度;在步骤S710中,根据真脸的置信度和假脸的置信度判断人脸是否为假脸;在步骤S711中,当判定为假脸时,根据假脸的置信度计算风险值;在步骤S712中,当判定为真脸时,确定目标信息;在步骤S713中,将假脸对应的特征向量与公众人物的人脸对应的特征向量进行匹配;在步骤S714中,根据步骤S705、S708、S711中的风险值和步骤S713的匹配结果确定目标信息。其中各步骤的具体执行流程与本公开实施例中对应操作的具体执行流程相同,在此不再赘述。
在本公开的一个实施例中,除了对图像、视频中的人脸的真假进行甄别,还可以对图像、视频中的人体的真假进行甄别,对人体真假的甄别方法与对人脸真假的甄别方法类似,只是处理数据的类型有所不同,例如需要将人脸坐标框信息更改为人体坐标框信息,在获取局部特征信息、全局特征信息时需要获取与人体对应的局部特征信息和包含人体和背景的图像对应的全局特征信息,等等,至于具体地处理流程与对人脸真假的识别方法的流程相似,本公开实施例在此不再赘述。
本公开实施例中的图像识别方法能够对待识别图像、待识别视频中的目标对象进行检测识别,判断其真假,并根据判断结果输出相应地目标信息,以使服务使用者根据目标信息进行相应操作。本公开实施例的图像识别方法,一方面,在图像识别过程中采用机器学习模型对图像中的目标对象进行检测,并对局部特征和全局特征进行提取,提高了图像识别的效率和精准度;另一方面,在识别目标对象的真假时采用了包括像素、纹理级别的低阶特征,到包括全局语义信息的高阶特征,包含三个不同阶段的检测,进一步提高了图像识别的精准度;再一方面,能够对目标对象为假的图像是否使用公众任务的肖像进行判断,保护了公众人物的肖像权,避免了不实信息的传播。
以下介绍本公开的装置实施例,可以用于执行本公开上述实施例中的图像识别方法。对于本公开装置实施例中未披露的细节,请参照本公开上述的图像识别方法的实施例。
图8示意性示出了根据本公开的一个实施例的图像识别装置的框图。
参照图8所示,根据本公开的一个实施例的图像识别装置800,包括:特征信息获取模块801、置信度获取模块802和目标信息获取模块803。
其中,特征信息获取模块801,用于获取与待识别图像中的目标对象对应的特征信息,其中所述特征信息包括模糊度信息、局部特征信息、全局特征信息中的任意一个或多个;置信度获取模块802,用于基于所述特征信息判断所述目标对象的类别,并确定与所述目标对象对应的置信度;目标信息获取模块803,用于根据所述目标对象的类别和所述置信度获取与所述待识别图像对应的目标信息。
在本公开的一个实施例中,所述置信度获取模块802包括:第一类别确定单元,用于获取与所述目标对象对应的模糊度信息,根据所述模糊度信息和分类阈值确定所述目标对象的类别;第二类别确定单元,用于当根据所述模糊度信息和所述分类阈值确定所述目标对象的类别为真时,获取与所述目标对象对应的局部特征信息,并基于所述局部特征信息确定所述目标对象的类别;第三类别确定单元,用于当根据所述局部特征信息确定所述目标对象的类别为真时,获取与所述目标对象对应的全局特征信息,并基于所述全局特征信息确定所述目标对象的类别及与所述目标对象对应的置信度,以根据所述目标对象的类别和所述置信度获取与所述待识别图像对应的目标信息。
在本公开的一个实施例中,所述第一类别确定单元包括:第一对象图获取单元,用于对所述待识别图像中的目标对象进行检测,以获取与所述目标对象对应的第一对象图;第二对象图获取单元,用于对所述第一对象图的坐标进行调整,以获取第二对象图;模糊度计算单元,用于分别对所述第一对象图和所述第二对象图进行模糊度计算,以获取与所述目标对象对应的模糊度信息。
在本公开的一个实施例中,所述模糊度信息包括与所述第一对象图对应的第一模糊度和与所述第二对象图对应的第二模糊度;所述第一类别确定单元配置为:将所述第二模糊度与所述第一模糊度相除,以获取模糊度比值;将所述模糊度比值与所述分类阈值进行比较;当所述模糊度比值小于或等于所述分类阈值时,判定所述目标对象的类别为真;当所述模糊度比值大于所述分类阈值时,判定所述目标对象的类别为假。
在本公开的一些实施例中,基于前述方案,所述置信度获取模块802配置为:在根据所述模糊度信息和所述分类阈值确定所述目标对象的类别为假时,根据所述模糊度比值和所述分类阈值确定与所述目标对象对应的第一置信度。
在本公开的一个实施例中,所述第二类别确定单元包括:第一特征提取单元,用于将所述第一对象图输入至第一图像识别模型,通过所述第一图像识别模型对所述第一对象图进行特征提取,以获取所述局部特征信息;分类单元,用于根据所述局部特征信息进行分类判断,以获取所述目标对象的类别。
在本公开的一些实施例中,基于前述方案,所述分类单元配置为:基于所述局部特征信息获取与所述目标对象对应的第二置信度和第三置信度;当所述第二置信度大于所述第三置信度时,判定所述目标对象的类别为假;当所述第二置信度小于或等于所述第三置信度时,判定所述目标对象的类别为真。
在本公开的一个实施例中,所述置信度获取模块802包括:第二特征提取单元,用于将所述待识别图像输入至第二图像识别模型,通过所述第二图像识别模型对所述待识别图像进行特征提取,以获取所述全局特征信息;回归单元,用于根据所述全局特征信息对所述目标对象对应的区域进行回归计算,以获取所述目标对象的类别及与所述目标对象对应的置信度。
在本公开的一个实施例中,所述回归单元配置为:根据所述全局特征信息对所述目标对象对应的区域进行回归计算,以获取与所述目标对象对应的第四置信度和第五置信度;当所述第四置信度大于所述第五置信度时,判定所述目标对象的类别为假;当所述第四置信度小于或等于所述第五置信度时,判定所述目标对象的类别为真。
在本公开的一个实施例中,所述目标信息获取模块803配置为:当根据所述模糊度信息和所述分类阈值确定的所述目标对象的类别为假时,根据基于所述模糊度信息确定的第一置信度确定与所述待识别图像对应的风险值,并基于所述目标对象的类别和所述风险值获取所述目标信息;或者,当根据所述局部特征信息确定的所述目标对象的类别为假时,根据基于所述局部特征信息确定的第二置信度确定与所述待识别图像对应的风险值,并基于所述目标对象的类别和所述风险值获取所述目标信息;或者,当根据所述全局特征信息确定的所述目标对象的类别为假时,根据基于所述全局特征信息确定的第四置信度确定与所述待识别图像对应的风险值,并基于所述目标对象的类别和所述风险值获取所述目标信息。
在本公开的一个实施例中,所述目标信息获取模块803还配置为:当根据所述模糊度信息和所述分类阈值确定的所述目标对象的类别为假时,将所述目标对象与素材库中的待匹配对象进行匹配,以根据所述目标对象的类别、目标置信度和匹配结果获取所述目标信息;或者,当根据所述局部特征信息确定的所述目标对象的类别为假时,将所述目标对象与所述素材库中的待匹配对象进行匹配,以根据所述目标对象的类别、目标置信度和匹配结果获取所述目标信息;或者,当根据所述全局特征信息确定的所述目标对象的类别为假时,将所述目标对象与所述素材库中的待匹配对象进行匹配,以根据所述目标对象的类别、目标置信度和匹配结果获取所述目标信息。
在本公开的一个实施例中,所述将所述目标对象与素材库中的待匹配对象进行匹配具体为:计算所述目标对象对应的特征向量和所述待匹配对象对应的特征向量之间的距离;将所述距离与预设距离阈值进行比较;当所述距离小于所述预设距离阈值时,判定所述目标对象与所述待匹配对象匹配。
在本公开的一个实施例中,所述根据所述目标对象的类别、目标置信度和匹配结果获取所述目标信息具体为:在所述目标对象与所述待匹配对象匹配时,根据所述距离确定第六置信度;在根据所述模糊度信息、所述局部特征信息或所述全局特征信息确定所述目标对象的类别为假时,获取与所述目标对象对应的置信度作为所述目标置信度;根据所述第六置信度和所述目标置信度确定与所述待识别图像对应的风险值,并基于所述目标对象的类型、所述匹配结果和所述风险值获取所述目标信息。
图9示出了适于用来实现本公开实施例的电子设备的计算机系统的结构示意图。
需要说明的是,图9示出的电子设备的计算机系统900仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图9所示,计算机系统900包括中央处理单元(Central Processing Unit,CPU)901,其可以根据存储在只读存储器(Read-Only Memory,ROM)902中的程序或者从存储部分908加载到随机访问存储器(Random Access Memory,RAM)903中的程序而执行各种适当的动作和处理,实现上述实施例中所述的图像标注方法。在RAM 903中,还存储有系统操作所需的各种程序和数据。CPU 901、ROM 902以及RAM 903通过总线904彼此相连。输入/输出(Input/Output,I/O)接口905也连接至总线904。
以下部件连接至I/O接口905:包括键盘、鼠标等的输入部分906;包括诸如阴极射线管(Cathode Ray Tube,CRT)、液晶显示器(Liquid Crystal Display,LCD)等以及扬声器等的输出部分907;包括硬盘等的存储部分908;以及包括诸如LAN(Local Area Network,局域网)卡、调制解调器等的网络接口卡的通信部分909。通信部分909经由诸如因特网的网络执行通信处理。驱动器910也根据需要连接至I/O接口905。可拆卸介质911,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器910上,以便于从其上读出的计算机程序根据需要被安装入存储部分908。
特别地,根据本公开的实施例,下文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分909从网络上被下载和安装,和/或从可拆卸介质911被安装。在该计算机程序被中央处理单元(CPU)901执行时,执行本公开的系统中限定的各种功能。
需要说明的是,本公开实施例所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、闪存、光纤、便携式紧凑磁盘只读存储器(Compact Disc Read-Only Memory,CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
作为另一方面,本公开还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的图像处理装置中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该电子设备执行时,使得该电子设备实现上述实施例中所述的方法。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、触控终端、或者网络设备等)执行根据本公开实施方式的方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (15)

1.一种图像识别方法,其特征在于,包括:
获取与待识别图像中的目标对象对应的特征信息,其中所述特征信息包括模糊度信息、局部特征信息、全局特征信息中的任意一个或多个;
基于所述特征信息判断所述目标对象的类别,并确定与所述目标对象对应的置信度;
根据所述目标对象的类别和所述置信度获取与所述待识别图像对应的目标信息。
2.根据权利要求1所述的图像识别方法,其特征在于,所述基于所述特征信息判断所述目标对象的类别,并确定与所述目标对象对应的置信度,包括:
获取与所述目标对象对应的模糊度信息,根据所述模糊度信息和分类阈值确定所述目标对象的类别;
当根据所述模糊度信息和所述分类阈值确定所述目标对象的类别为真时,获取与所述目标对象对应的局部特征信息,并基于所述局部特征信息确定所述目标对象的类别;
当根据所述局部特征信息确定所述目标对象的类别为真时,获取与所述目标对象对应的全局特征信息,并基于所述全局特征信息确定所述目标对象的类别及与所述目标对象对应的置信度。
3.根据权利要求2所述的图像识别方法,其特征在于,所述获取与所述目标对象对应的模糊度信息,包括:
对所述待识别图像中的目标对象进行检测,以获取与所述目标对象对应的第一对象图;
对所述第一对象图的坐标进行调整,以获取第二对象图;
分别对所述第一对象图和所述第二对象图进行模糊度计算,以获取与所述目标对象对应的模糊度信息。
4.根据权利要求3所述的图像识别方法,其特征在于,所述模糊度信息包括与所述第一对象图对应的第一模糊度和与所述第二对象图对应的第二模糊度;
所述根据所述模糊度信息和分类阈值确定所述目标对象的类别,包括:
将所述第二模糊度与所述第一模糊度相除,以获取模糊度比值;
将所述模糊度比值与所述分类阈值进行比较;
当所述模糊度比值小于或等于所述分类阈值时,判定所述目标对象的类别为真;
当所述模糊度比值大于所述分类阈值时,判定所述目标对象的类别为假。
5.根据权利要求4所述的图像识别方法,所述基于所述特征信息判断所述目标对象的类别,并确定与所述目标对象对应的置信度,包括:
在根据所述模糊度信息和所述分类阈值确定所述目标对象的类别为假时,根据所述模糊度比值和所述分类阈值确定与所述目标对象对应的第一置信度。
6.根据权利要求3所述的图像识别方法,其特征在于,所述获取与所述目标对象对应的局部特征信息,并基于所述局部特征信息确定所述目标对象的类别,包括:
将所述第一对象图输入至第一图像识别模型,通过所述第一图像识别模型对所述第一对象图进行特征提取,以获取所述局部特征信息;
根据所述局部特征信息进行分类判断,以获取所述目标对象的类别。
7.根据权利要求6所述的信息识别方法,所述根据所述局部特征信息进行分类判断,以获取所述目标对象的类别,包括:
基于所述局部特征信息获取与所述目标对象对应的第二置信度和第三置信度;
当所述第二置信度大于所述第三置信度时,判定所述目标对象的类别为假;
当所述第二置信度小于或等于所述第三置信度时,判定所述目标对象的类别为真。
8.根据权利要求2所述的图像识别方法,其特征在于,所述获取与所述目标对象对应的全局特征信息,并基于所述全局特征信息确定所述目标对象的类别及与所述目标对象对应的置信度,包括:
将所述待识别图像输入至第二图像识别模型,通过所述第二图像识别模型对所述待识别图像进行特征提取,以获取所述全局特征信息;
根据所述全局特征信息对所述目标对象对应的区域进行回归计算,以获取所述目标对象的类别及与所述目标对象对应的置信度。
9.根据权利要求8所述的图像识别方法,所述根据所述全局特征信息对所述目标对象对应的区域进行回归计算,以获取所述目标对象的类别及与所述目标对象对应的置信度,包括:
根据所述全局特征信息对所述目标对象对应的区域进行回归计算,以获取与所述目标对象对应的第四置信度和第五置信度;
当所述第四置信度大于所述第五置信度时,判定所述目标对象的类别为假;
当所述第四置信度小于或等于所述第五置信度时,判定所述目标对象的类别为真。
10.根据权利要求2所述的图像识别方法,其特征在于,所述根据所述目标对象的类别和所述置信度获取与所述待识别图像对应的目标信息,包括:
当根据所述模糊度信息和所述分类阈值确定的所述目标对象的类别为假时,根据基于所述模糊度信息确定的第一置信度确定与所述待识别图像对应的风险值,并基于所述目标对象的类别和所述风险值获取所述目标信息;或者,
当根据所述局部特征信息确定的所述目标对象的类别为假时,根据基于所述局部特征信息确定的第二置信度确定与所述待识别图像对应的风险值,并基于所述目标对象的类别和所述风险值获取所述目标信息;或者,
当根据所述全局特征信息确定的所述目标对象的类别为假时,根据基于所述全局特征信息确定的第四置信度确定与所述待识别图像对应的风险值,并基于所述目标对象的类别和所述风险值获取所述目标信息。
11.根据权利要求2所述的图像识别方法,其特征在于,所述根据所述目标对象的类别和所述置信度获取与所述待识别图像对应的目标信息,包括:
当根据所述模糊度信息和所述分类阈值确定的所述目标对象的类别为假时,将所述目标对象与素材库中的待匹配对象进行匹配,以根据所述目标对象的类别、目标置信度和匹配结果获取所述目标信息;或者,
当根据所述局部特征信息确定的所述目标对象的类别为假时,将所述目标对象与所述素材库中的待匹配对象进行匹配,以根据所述目标对象的类别、目标置信度和匹配结果确定获取所述目标信息;或者,
当根据所述全局特征信息确定的所述目标对象的类别为假时,将所述目标对象与所述素材库中的待匹配对象进行匹配,以根据所述目标对象的类别、目标置信度和匹配结果获取所述目标信息。
12.根据权利要求11所述的图像识别方法,其特征在于,所述将所述目标对象与素材库中的待匹配对象进行匹配,包括:
计算所述目标对象对应的特征向量和所述待匹配对象对应的特征向量之间的距离;
将所述距离与预设距离阈值进行比较;
当所述距离小于所述预设距离阈值时,判定所述目标对象与所述待匹配对象匹配。
13.根据权利要求12所述的图像识别方法,其特征在于,所述根据所述目标对象的类别、目标置信度和匹配结果获取所述目标信息,包括:
在所述目标对象与所述待匹配对象匹配时,根据所述距离确定第六置信度;
在根据所述模糊度信息、所述局部特征信息或所述全局特征信息确定所述目标对象的类别为假时,获取与所述目标对象对应的置信度作为所述目标置信度;
根据所述第六置信度和所述目标置信度确定与所述待识别图像对应的风险值,并基于所述目标对象的类型、所述匹配结果和所述风险值获取所述目标信息。
14.一种图像识别装置,其特征在于,包括:
特征信息获取模块,用于获取与待识别图像中的目标对象对应的特征信息,其中所述特征信息包括模糊度信息、局部特征信息、全局特征信息中的任意一个或多个;
置信度获取模块,用于基于所述特征信息判断所述目标对象的类别,并确定与所述目标对象对应的置信度;
目标信息获取模块,用于根据所述目标对象的类别和所述置信度获取与所述待识别图像对应的目标信息。
15.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,所述存储装置用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行如权利要求1至13中任一项所述的图像识别方法。
CN202010017583.4A 2020-01-08 2020-01-08 图像识别方法及装置、电子设备 Active CN111241989B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202010017583.4A CN111241989B (zh) 2020-01-08 2020-01-08 图像识别方法及装置、电子设备
PCT/CN2020/123903 WO2021139324A1 (zh) 2020-01-08 2020-10-27 图像识别方法、装置、计算机可读存储介质及电子设备
US17/676,111 US12087097B2 (en) 2020-01-08 2022-02-18 Image recognition method and apparatus, computer-readable storage medium, and electronic device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010017583.4A CN111241989B (zh) 2020-01-08 2020-01-08 图像识别方法及装置、电子设备

Publications (2)

Publication Number Publication Date
CN111241989A true CN111241989A (zh) 2020-06-05
CN111241989B CN111241989B (zh) 2023-06-13

Family

ID=70876061

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010017583.4A Active CN111241989B (zh) 2020-01-08 2020-01-08 图像识别方法及装置、电子设备

Country Status (3)

Country Link
US (1) US12087097B2 (zh)
CN (1) CN111241989B (zh)
WO (1) WO2021139324A1 (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111738244A (zh) * 2020-08-26 2020-10-02 腾讯科技(深圳)有限公司 图像检测方法、装置、计算机设备和存储介质
CN111967576A (zh) * 2020-07-22 2020-11-20 长春工程学院 一种基于深度学习的地球化学数据处理方法和系统
CN112183501A (zh) * 2020-11-27 2021-01-05 北京智源人工智能研究院 深度伪造图像检测方法及装置
CN112183353A (zh) * 2020-09-28 2021-01-05 腾讯科技(深圳)有限公司 一种图像数据处理方法、装置和相关设备
CN112329719A (zh) * 2020-11-25 2021-02-05 江苏云从曦和人工智能有限公司 行为识别方法、装置以及计算机可读存储介质
WO2021139324A1 (zh) * 2020-01-08 2021-07-15 腾讯科技(深圳)有限公司 图像识别方法、装置、计算机可读存储介质及电子设备
CN114723966A (zh) * 2022-03-30 2022-07-08 北京百度网讯科技有限公司 多任务识别方法、训练方法、装置、电子设备及存储介质
CN114882551A (zh) * 2022-04-14 2022-08-09 支付宝(杭州)信息技术有限公司 一种基于机具维度的人脸识别处理方法、装置以及设备
CN117951673A (zh) * 2024-03-26 2024-04-30 上海帜讯信息技术股份有限公司 一种反ai诈骗的方法、电子设备

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111507262B (zh) * 2020-04-17 2023-12-08 北京百度网讯科技有限公司 用于检测活体的方法和装置
US20230259549A1 (en) * 2020-07-24 2023-08-17 Seung Mo Kim Extraction of feature point of object from image and image search system and method using same
CN112784760B (zh) * 2021-01-25 2024-04-12 北京百度网讯科技有限公司 人体行为识别方法、装置、设备以及存储介质
CN113822901B (zh) * 2021-07-21 2023-12-12 南京旭锐软件科技有限公司 图像分割方法、装置、存储介质及电子设备

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103116763A (zh) * 2013-01-30 2013-05-22 宁波大学 一种基于hsv 颜色空间统计特征的活体人脸检测方法
CN106548145A (zh) * 2016-10-31 2017-03-29 北京小米移动软件有限公司 图像识别方法及装置
CN106650669A (zh) * 2016-12-27 2017-05-10 重庆邮电大学 一种鉴别仿冒照片欺骗的人脸识别方法
CN107133948A (zh) * 2017-05-09 2017-09-05 电子科技大学 基于多任务卷积神经网络的图像模糊与噪声评测方法
CN107886070A (zh) * 2017-11-10 2018-04-06 北京小米移动软件有限公司 人脸图像的验证方法、装置及设备
CN107992845A (zh) * 2017-12-14 2018-05-04 广东工业大学 一种面部识别辨伪方法及装置、计算机设备
CN108446690A (zh) * 2018-05-31 2018-08-24 北京工业大学 一种基于多视角动态特征的人脸活体检测方法
CN108664843A (zh) * 2017-03-27 2018-10-16 北京三星通信技术研究有限公司 活体对象识别方法、设备和计算机可读存储介质
CN109086675A (zh) * 2018-07-06 2018-12-25 四川奇迹云科技有限公司 一种基于光场成像技术的人脸识别及攻击检测方法及其装置
CN109711254A (zh) * 2018-11-23 2019-05-03 北京交通大学 基于对抗生成网络的图像处理方法和装置

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101739555B (zh) 2009-12-01 2014-11-26 北京中星微电子有限公司 假脸检测方法及系统、假脸模型训练方法及系统
CN103678984A (zh) * 2013-12-20 2014-03-26 湖北微模式科技发展有限公司 一种利用摄像头实现用户身份验证的方法
JP2017010092A (ja) * 2015-06-17 2017-01-12 キヤノン株式会社 画像処理装置、撮像装置、画像処理方法、画像処理プログラム、および、記憶媒体
CN106557726B (zh) * 2015-09-25 2020-06-09 北京市商汤科技开发有限公司 一种带静默式活体检测的人脸身份认证系统及其方法
CN113095124B (zh) * 2017-06-07 2024-02-06 创新先进技术有限公司 一种人脸活体检测方法、装置以及电子设备
US11176490B2 (en) * 2018-03-09 2021-11-16 Qualcomm Incorporated Accumulate across stages in machine learning object detection
CN109345253A (zh) * 2018-09-04 2019-02-15 阿里巴巴集团控股有限公司 资源转移方法、装置及系统
CN109948439B (zh) * 2019-02-13 2023-10-31 平安科技(深圳)有限公司 一种活体检测方法、系统及终端设备
CN111241989B (zh) * 2020-01-08 2023-06-13 腾讯科技(深圳)有限公司 图像识别方法及装置、电子设备

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103116763A (zh) * 2013-01-30 2013-05-22 宁波大学 一种基于hsv 颜色空间统计特征的活体人脸检测方法
CN106548145A (zh) * 2016-10-31 2017-03-29 北京小米移动软件有限公司 图像识别方法及装置
CN106650669A (zh) * 2016-12-27 2017-05-10 重庆邮电大学 一种鉴别仿冒照片欺骗的人脸识别方法
CN108664843A (zh) * 2017-03-27 2018-10-16 北京三星通信技术研究有限公司 活体对象识别方法、设备和计算机可读存储介质
CN107133948A (zh) * 2017-05-09 2017-09-05 电子科技大学 基于多任务卷积神经网络的图像模糊与噪声评测方法
CN107886070A (zh) * 2017-11-10 2018-04-06 北京小米移动软件有限公司 人脸图像的验证方法、装置及设备
CN107992845A (zh) * 2017-12-14 2018-05-04 广东工业大学 一种面部识别辨伪方法及装置、计算机设备
CN108446690A (zh) * 2018-05-31 2018-08-24 北京工业大学 一种基于多视角动态特征的人脸活体检测方法
CN109086675A (zh) * 2018-07-06 2018-12-25 四川奇迹云科技有限公司 一种基于光场成像技术的人脸识别及攻击检测方法及其装置
CN109711254A (zh) * 2018-11-23 2019-05-03 北京交通大学 基于对抗生成网络的图像处理方法和装置

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US12087097B2 (en) 2020-01-08 2024-09-10 Tencent Technology (Shenzhen) Company Limited Image recognition method and apparatus, computer-readable storage medium, and electronic device
WO2021139324A1 (zh) * 2020-01-08 2021-07-15 腾讯科技(深圳)有限公司 图像识别方法、装置、计算机可读存储介质及电子设备
CN111967576B (zh) * 2020-07-22 2022-09-02 长春工程学院 一种基于深度学习的地球化学数据处理方法和系统
CN111967576A (zh) * 2020-07-22 2020-11-20 长春工程学院 一种基于深度学习的地球化学数据处理方法和系统
CN111738244B (zh) * 2020-08-26 2020-11-24 腾讯科技(深圳)有限公司 图像检测方法、装置、计算机设备和存储介质
CN111738244A (zh) * 2020-08-26 2020-10-02 腾讯科技(深圳)有限公司 图像检测方法、装置、计算机设备和存储介质
CN112183353A (zh) * 2020-09-28 2021-01-05 腾讯科技(深圳)有限公司 一种图像数据处理方法、装置和相关设备
CN112183353B (zh) * 2020-09-28 2022-09-20 腾讯科技(深圳)有限公司 一种图像数据处理方法、装置和相关设备
CN112329719A (zh) * 2020-11-25 2021-02-05 江苏云从曦和人工智能有限公司 行为识别方法、装置以及计算机可读存储介质
CN112329719B (zh) * 2020-11-25 2021-10-15 江苏云从曦和人工智能有限公司 行为识别方法、装置以及计算机可读存储介质
CN112183501B (zh) * 2020-11-27 2021-02-19 北京智源人工智能研究院 深度伪造图像检测方法及装置
CN112183501A (zh) * 2020-11-27 2021-01-05 北京智源人工智能研究院 深度伪造图像检测方法及装置
CN114723966A (zh) * 2022-03-30 2022-07-08 北京百度网讯科技有限公司 多任务识别方法、训练方法、装置、电子设备及存储介质
CN114882551A (zh) * 2022-04-14 2022-08-09 支付宝(杭州)信息技术有限公司 一种基于机具维度的人脸识别处理方法、装置以及设备
CN117951673A (zh) * 2024-03-26 2024-04-30 上海帜讯信息技术股份有限公司 一种反ai诈骗的方法、电子设备

Also Published As

Publication number Publication date
US20220172518A1 (en) 2022-06-02
US12087097B2 (en) 2024-09-10
CN111241989B (zh) 2023-06-13
WO2021139324A1 (zh) 2021-07-15

Similar Documents

Publication Publication Date Title
CN111241989B (zh) 图像识别方法及装置、电子设备
CN111709409B (zh) 人脸活体检测方法、装置、设备及介质
CN110728209B (zh) 一种姿态识别方法、装置、电子设备及存储介质
CN110909651B (zh) 视频主体人物的识别方法、装置、设备及可读存储介质
CN111754396B (zh) 脸部图像处理方法、装置、计算机设备和存储介质
CN111680678B (zh) 目标区域识别方法、装置、设备及可读存储介质
CN111325319B (zh) 一种神经网络模型的检测方法、装置、设备及存储介质
CN115050064A (zh) 人脸活体检测方法、装置、设备及介质
CN112257665A (zh) 图像内容的识别方法、图像识别模型的训练方法及介质
Liu et al. Attentive cross-modal fusion network for RGB-D saliency detection
CN115223022B (zh) 一种图像处理方法、装置、存储介质及设备
CN114972016A (zh) 图像处理方法、装置、计算机设备、存储介质及程序产品
CN114611672A (zh) 模型训练方法、人脸识别方法及装置
CN113569607A (zh) 动作识别方法、装置、设备以及存储介质
CN117011274A (zh) 自动化玻璃瓶检测系统及其方法
Gadasin et al. Application of Convolutional Neural Networks for Three-Dimensional Reconstruction of the Geometry of Objects in the Image
CN107784284A (zh) 人脸识别方法及系统
CN114463685B (zh) 行为识别方法、装置、电子设备及存储介质
CN115115699A (zh) 姿态估计方法、装置、相关设备和计算机产品
Chhabra et al. Comparison of different edge detection techniques to improve quality of medical images
Dong 3D face recognition neural network for digital human resource management
CN111680722B (zh) 内容识别方法、装置、设备及可读存储介质
CN117079336B (zh) 样本分类模型的训练方法、装置、设备及存储介质
CN114998990B (zh) 一种工地人员安全行为识别方法及装置
Narwal et al. Image Systems and Visualizations

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40024062

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant