CN110378203B - 图像处理方法、装置、终端及存储介质 - Google Patents

图像处理方法、装置、终端及存储介质 Download PDF

Info

Publication number
CN110378203B
CN110378203B CN201910487842.7A CN201910487842A CN110378203B CN 110378203 B CN110378203 B CN 110378203B CN 201910487842 A CN201910487842 A CN 201910487842A CN 110378203 B CN110378203 B CN 110378203B
Authority
CN
China
Prior art keywords
face images
face
preset number
image
preset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910487842.7A
Other languages
English (en)
Other versions
CN110378203A (zh
Inventor
戴磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201910487842.7A priority Critical patent/CN110378203B/zh
Publication of CN110378203A publication Critical patent/CN110378203A/zh
Priority to PCT/CN2019/118023 priority patent/WO2020244151A1/zh
Application granted granted Critical
Publication of CN110378203B publication Critical patent/CN110378203B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/94Hardware or software architectures specially adapted for image or video understanding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/94Hardware or software architectures specially adapted for image or video understanding
    • G06V10/955Hardware or software architectures specially adapted for image or video understanding using specific electronic processors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

一种图像处理方法,包括:获取人脸图像,人脸图像包括原始人脸图像与待识别的人脸图像;将人脸图像进行合并处理;将合并处理后的预设数量的人脸图像由中央处理器CPU对应的内存传递至图形处理器GPU对应的显存中;将合并处理后的预设数量的人脸图像输入至深度学习框架中计算,得到预设数量的人脸图像对应的特征向量;将预设数量的人脸图像对应的特征向量进行合并处理;将合并处理后的预设数量的人脸图像对应的特征向量由图形处理器GPU对应的显存回传至中央处理器CPU对应的内存中。本发明还提供一种图像处理装置、终端与计算机可读存储介质。本发明采用批量搬移人脸图像的方式,能够减少GPU的等待时间,提高GPU计算能力。

Description

图像处理方法、装置、终端及存储介质
技术领域
本发明涉及图像识别技术领域,具体涉及一种图像处理方法、图像处理装置、终端及计算机可读存储介质。
背景技术
深度学习(Deep Learning)是机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本。人脸识别技术是目前被广泛研究的热门课题。人脸识别技术就是利用计算机分析人脸图像,通过检测对比人脸数据库中的所有已知原型人脸图像来达到辨认身份的目的。随着科学技术的发展及各种技术手段的综合应用,人脸识别技术将在视频监控、访问控制等领域有着广阔的应用前景。
人脸识别算法使用深度学习模型来计算人脸的特征向量,因为计算中有大量的互不影响的加法和乘法计算,这样的计算可以利用GPU中的大量简单运算单元进行并行计算。但是由于在计算之前要先把人脸图像从内存CPU搬移到GPU可直接访问的显存中,这个搬移处理需要耗费额外的时间,当需要处理的人脸数量很大时,造成浪费的时间比较多,不能充分利用GPU的计算能力。
发明内容
鉴于以上内容,有必要提出一种图像处理方法、图像处理装置、终端与计算机可读存储介质,通过采用批量搬移人脸图像的方式,能够减少GPU的等待时间,提高GPU计算能力。
本发明实施例第一方面提供一种图像处理方法,所述图像处理方法包括:
获取人脸图像,所述人脸图像包括原始人脸图像与待识别的人脸图像;
将预设数量的人脸图像进行合并处理;
将合并处理后的预设数量的人脸图像由中央处理器CPU对应的内存传递至图形处理器GPU对应的显存中;
在所述图形处理器GPU中,将合并处理后的预设数量的人脸图像输入至深度学习框架中进行计算,得到预设数量的人脸图像对应的特征向量;
将预设数量的人脸图像对应的特征向量进行合并处理;
将合并处理后的预设数量的人脸图像对应的特征向量由图形处理器GPU对应的显存回传至中央处理器CPU对应的内存中。
进一步的,在本发明实施例提供的上述图像处理方法中,在所述将预设数量的人脸图像进行合并处理之前,所述方法还包括:
定位预设数量的人脸图像中的每一张原始人脸图像的特征点,并对人脸图像进行校正;
将校正后的所述人脸图像转换为预设标准尺寸的人脸图像。
进一步的,在本发明实施例提供的上述图像处理方法中,所述将预设数量的人脸图像进行合并处理包括:
获取每一张人脸图像中的像素值;
将每一张所述人脸图像的像素值转换为一个w*h形式的矩阵;
将所述预设数量的人脸图像对应的二维的w*h形式的矩阵转换为一个n*w*h形式的矩阵,其中,n表示所述进行合并处理的人脸图像的预设数量,w表示人脸图像的宽度,h表示人脸图像的高度。
进一步的,在本发明实施例提供的上述图像处理方法中,在所述将合并处理后的预设数量的原始人脸图像输入至深度学习框架中进行计算之前,所述方法还包括:
通过所述图形处理器GPU将不同的所述人脸图像的特征向量计算操作划分为互不相关且顺序任意的任务进行并行执行。
进一步的,在本发明实施例提供的上述图像处理方法中,所述将合并处理后的预设数量的人脸图像输入至深度学习框架中进行计算包括:
构建预设初始深度学习框架;
将合并处理后的预设数量的原始人脸图像作为训练样本输入至所述预设初始深度学习框架中进行训练,得到训练好的预设深度学习框架;
将所述待识别的人脸图像输入至训练好的预设深度学习框架中进行特征值计算,输出所述待识别的人脸图像对应的特征向量。
进一步的,在本发明实施例提供的上述图像处理方法中,所述将预设数量的人脸图像对应的特征向量进行合并处理包括:
获取每一张人脸图像对应的特征向量为1*m形式的特征向量;
确认进行特征向量合并处理的所述人脸图像的预设数量;
将所述预设数量的人脸图像对应的特征向量1*m形式的向量转换为n*m形式的特征向量,其中,n表示所述进行特征向量合并处理的所述人脸图像的预设数量,m表示每一张人脸图像对应的特征值的数量。
进一步的,在本发明实施例提供的上述图像处理方法中,在所述将合并处理后的预设数量的人脸图像对应的特征向量由图形处理器GPU对应的显存回传至中央处理器CPU对应的内存中之后,所述方法还包括:
获取所述待识别的人脸图像对应的特征向量;
获取合并处理后的预设数量的原始人脸图像对应的特征向量;
确认所述待识别的人脸图像对应的特征向量与所述合并处理后的预设数量的原始人脸图像对应的特征向量之间的特征相似度值;
判断所述特征相似度值是否大于预设相似度阈值;
若判断结果为所述特征相似度值大于所述预设相似度阈值,则输出人脸识别结果。
本发明实施例第二方面还提供一种图像处理装置,所述图像处理装置包括:
图像获取模块,用于获取人脸图像,所述人脸图像包括原始人脸图像与待识别的人脸图像;
图像合并模块,用于将预设数量的人脸图像进行合并处理;
图像传递模块,用于将合并处理后的预设数量的人脸图像由中央处理器CPU对应的内存传递至图形处理器GPU对应的显存中;
特征计算模块,用于在所述图形处理器GPU中,将合并处理后的预设数量的人脸图像输入至深度学习框架中进行计算,得到预设数量的人脸图像对应的特征向量;
特征合并模块,用于将预设数量的人脸图像对应的特征向量进行合并处理;
特征回传模块,用于将合并处理后的预设数量的人脸图像对应的特征向量由图形处理器GPU对应的显存回传至中央处理器CPU对应的内存中。
本发明实施例第三方面还提供一种终端,所述终端包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现上述任意一项所述图像处理方法。
本发明实施例第四方面还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一项所述图像处理方法。
本发明实施例提供一种图像处理方法、图像处理装置、终端及计算机可读存储介质,获取人脸图像,所述人脸图像包括原始人脸图像与待识别的人脸图像;将预设数量的人脸图像进行合并处理;将合并处理后的预设数量的人脸图像由中央处理器CPU对应的内存传递至图形处理器GPU对应的显存中;在所述图形处理器GPU中,将合并处理后的预设数量的人脸图像输入至深度学习框架中进行计算,得到预设数量的人脸图像对应的特征向量;将预设数量的人脸图像对应的特征向量进行合并处理;将合并处理后的预设数量的人脸图像对应的特征向量由图形处理器GPU对应的显存回传至中央处理器CPU对应的内存中。由于在内存和显存之间搬移一张人脸图像和多张人脸图像所需时间几乎没有区别(搬移多张人脸图像时的时间增长非常有限),利用本发明实施例,通过采用批量搬移人脸图像的方式,能够减少GPU的等待时间,提高GPU计算能力。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1是本发明实施例提供的图像处理方法的流程图。
图2是本发明一实施方式的终端的结构示意图。
图3是图2所示的终端的示例性的功能模块图。
主要元件符号说明
终端 1
存储器 10
显示屏 20
处理器 30
图像处理装置 100
图像获取模块 101
图像合并模块 103
图像传递模块 105
特征计算模块 107
特征合并模块 109
特征回传模块 111
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施例对本发明进行详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。
图1是本发明实施例提供的图像处理方法的流程图。所述图像处理方法可以应用于终端1,所述终端1可以是例如智能手机、笔记本电脑、台式/平板电脑、智能手表以及个人数字助理(Personal Digital Assistant,PDA)等智能设备。如图1所示,所述图像处理方法可以包括如下步骤:
S101:获取人脸图像,所述人脸图像包括原始人脸图像与待识别的人脸图像。
人脸图像识别包括图像处理、图像检测等重要技术,其中大部分处理都需要基于原始人脸图像进行,因此保存原始人脸图像是必要的。在本实施方式中,获取人脸图像,所述人脸图像包括原始人脸图像与待识别的人脸图像。其中,所述原始人脸图像可以保存在原始人脸图像样本库中,也可以直接保存在存储器中,包括暂存在内存中,长期保存在硬盘中,或者直接保存在SD卡、闪存卡等小型快速存储器中。所述待识别的人脸图像的获取可以通过如下方法:采用像素不低于1000万的摄像装置对不同目标用户的人脸进行拍摄。
S102:将预设数量的人脸图像进行合并处理。
在本实施方式中,在所述将预设数量的人脸图像进行合并处理之前,所述方法还包括:定位预设数量的人脸图像中的每一张人脸图像的特征点(可以采用定位算法进行定位,所述定位算法可以是现有的),并对人脸图像进行校正;将校正后的所述人脸图像转换为预设标准尺寸的人脸图像。其中,所述人脸图像的特征点包括人脸图像中预设人脸器官所在的像素点位置,所述预设人脸器官包括眼镜、鼻子、嘴巴等,也即所述特征点可以为虹膜重心像素点位置、鼻子重心像素点位置与口部重心像素点位置等,在此不做限制。根据所述人脸图像的特征点对所述人脸图像进行校正,并将校正后的人脸图像转换为预设标准尺寸的人脸图像,从而保证提取到较稳定的特征并取得较好的人脸识别效果。所述预设标准尺寸为终端用户预先设置的,适应于所述深度学习框架的人脸图像的尺寸。所述预设数量为终端用户预先设置的,需要进行合并的人脸图像的数量,所述预设数量的具体数值不做限定。
在所述将预设数量的人脸图像进行合并处理之前,所述方法还包括:将所述原始人脸图像与所述待识别的人脸图像进行分类处理;分别对所述原始人脸图像进行合并处理以及对所述待识别的人脸图像进行合并处理。
所述将预设数量的人脸图像进行合并处理包括:获取每一张人脸图像中的像素值;将每一张所述人脸图像的像素值转换为一个二维的w*h形式的矩阵;获取进行合并处理的所述人脸图像的预设数量;将所述预设数量的人脸图像对应的二维的w*h形式的矩阵转换为一个三维的n*w*h形式的矩阵,其中,n表示所述进行合并处理的人脸图像的预设数量,w表示人脸图像的宽度,h表示人脸图像的高度。
S103:将合并处理后的预设数量的人脸图像由中央处理器CPU对应的内存传递至图形处理器GPU对应的显存中。
在本实施方式中,中央处理器CPU对应的内存中用于存放所述人脸图像,将合并处理后的预设数量的人脸图像由中央处理器CPU对应的内存传递至图形处理器GPU对应的显存中,图形处理器GPU可通过访问显存获取合并处理后的预设数量的人脸图像。
S104:在所述图形处理器GPU中,将合并处理后的预设数量的人脸图像输入至深度学习框架中进行计算,得到预设数量的人脸图像对应的特征向量。
在本实施方式中,在所述将合并处理后的预设数量的人脸图像输入至深度学习框架中进行计算之前,所述方法还包括:通过所述图形处理器GPU将不同的所述人脸图像的特征向量计算操作划分为互不相关且顺序任意的任务进行并行执行。
所述将合并处理后的预设数量的人脸图像输入至深度学习框架中进行计算包括:构建预设初始深度学习框架;将合并处理后的预设数量的原始人脸图像作为训练样本输入至所述预设初始深度学习框架中进行训练,得到训练好的预设深度学习框架;将所述待识别的人脸图像输入至训练好的预设深度学习框架中进行特征值计算,输出所述待识别的人脸图像对应的特征向量。所述预设初始深度学习框架为终端用户预先设置的,用于计算人脸图像特征值的深度学习框架,所述预设初始深度学习框架可以包括TensorFlow框架、Theano框架、Keras框架以及Caffe框架。
S105:将预设数量的人脸图像对应的特征向量进行合并处理。
在本实施方式中,所述将预设数量的人脸图像对应的特征向量进行合并处理包括:获取每一张人脸图像对应的特征向量为1*m形式的特征向量;确认进行特征向量合并处理的所述人脸图像的预设数量;将所述预设数量的人脸图像对应的特征向量1*m形式的向量转换为n*m形式的特征向量,其中,n表示所述进行特征向量合并处理的所述人脸图像的预设数量,m表示每一张人脸图像对应的特征值的数量。
S106:将合并处理后的预设数量的人脸图像对应的特征向量由图形处理器GPU对应的显存回传至中央处理器CPU对应的内存中。
在本实施方式中,将合并处理后的预设数量的人脸图像对应的特征向量由图形处理器GPU对应的显存回传至中央处理器CPU对应内存中。在所述将合并处理后的预设数量的人脸图像对应的特征向量由图形处理器GPU对应的显存回传至中央处理器CPU对应的内存中之后,所述方法还包括:获取所述待识别的人脸图像对应的特征向量;获取合并处理后的预设数量的原始人脸图像对应的特征向量;确认所述待识别的人脸图像对应的特征向量与所述合并处理后的预设数量的原始人脸图像对应的特征向量之间的特征相似度值;判断所述特征相似度值是否大于预设相似度阈值;若判断结果为所述特征相似度值大于所述预设相似度阈值,则输出人脸识别结果。其中,所述预设相似度阈值为终端用户预先设置的值。输出的人脸识别结果包括人脸识别成功与人脸识别失败。当人脸识别结果为人脸识别成功时,输出与所述待检测的人脸图像最接近的原始人脸图像。可以理解的是,若所述特征相似度值均小于所述预设相似度阈值,则人脸识别结果为人脸识别失败。若存在不止一个所述特征相似度值小于所述预设相似度阈值,则按照所述特征相似度值与所述预设相似度阈值的差值从小到大的排序方式,获取差值的最小值对应的原始人脸图像作为与所述待识别的人脸图像最接近的原始人脸图像。
本发明实施例提供一种图像处理方法,获取人脸图像,所述人脸图像包括原始人脸图像与待识别的人脸图像;将预设数量的人脸图像进行合并处理;将合并处理后的预设数量的人脸图像由中央处理器CPU对应的内存传递至图形处理器GPU对应的显存中;在所述图形处理器GPU中,将合并处理后的预设数量的人脸图像输入至深度学习框架中进行计算,得到预设数量的人脸图像对应的特征向量;将预设数量的人脸图像对应的特征向量进行合并处理;将合并处理后的预设数量的人脸图像对应的特征向量由图形处理器GPU对应的显存回传至中央处理器CPU对应的内存中。由于在内存和显存之间搬移一张人脸图像和多张人脸图像所需时间几乎没有区别(搬移多张人脸图像时的时间增长非常有限),利用本发明实施例,通过采用批量搬移人脸图像的方式,能够减少GPU的等待时间,提高GPU计算能力。
以上是对本发明实施例所提供的方法进行的详细描述。根据不同的需求,所示流程图中方块的执行顺序可以改变,某些方块可以省略。下面对本发明实施例所提供的终端1进行描述。
本发明实施例还提供一种终端1,包括存储器10、处理器30及存储在存储器10上并可在处理器30上运行的计算机程序,所述处理器30执行所述程序时实现上述任一实施方式中所述的图像处理方法的步骤。
图2是本发明一实施方式的终端1的结构示意图,如图2所示,终端1包括存储器10,存储器10中存储有图像处理装置100。所述的终端1可以是手机、平板电脑、个人数字助理等具有应用显示功能的终端1。所述图像处理装置100可以获取人脸图像,所述人脸图像包括原始人脸图像与待识别的人脸图像;将预设数量的人脸图像进行合并处理;将合并处理后的预设数量的人脸图像由中央处理器CPU对应的内存传递至图形处理器GPU对应的显存中;在所述图形处理器GPU中,将合并处理后的预设数量的人脸图像输入至深度学习框架中进行计算,得到预设数量的人脸图像对应的特征向量;将预设数量的人脸图像对应的特征向量进行合并处理;将合并处理后的预设数量的人脸图像对应的特征向量由图形处理器GPU对应的显存回传至中央处理器CPU对应的内存中。由于在内存和显存之间搬移一张人脸图像和多张人脸图像所需时间几乎没有区别(搬移多张人脸图像时的时间增长非常有限),利用本发明实施例,通过采用批量搬移人脸图像的方式,能够减少GPU的等待时间,提高GPU计算能力。
本实施方式中,终端1还可以包括显示屏20及处理器30。存储器10、显示屏20可以分别与处理器30电连接。
所述的存储器10可以是不同类型存储设备,用于存储各类数据。例如,可以是终端1的存储器、内存,还可以是可外接于该终端装置1的存储卡,如闪存、SM卡(Smart MediaCard,智能媒体卡)、SD卡(Secure Digital Card,安全数字卡)等。此外,存储器10可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。存储器10用于存储各类数据,例如,所述终端1中安装的各类应用程序(Applications)、应用上述图像处理方法而设置、获取的数据等信息。
显示屏20安装于终端1,用于显示信息。
处理器30用于执行所述图像处理方法以及所述终端1内安装的各类软件,例如操作系统及应用显示软件等。处理器30包含但不限于处理器(Central Processing Unit,CPU)、微控制单元(Micro Controller Unit,MCU)等用于解释计算机以及处理计算机软件中的数据的装置。
所述的图像处理装置100可以包括一个或多个的模块,所述一个或多个模块被存储在终端1的存储器10中并被配置成由一个或多个处理器(本实施方式为一个处理器30)执行,以完成本发明实施例。例如,参阅图3所示,所述图像处理装置100可以包括图像获取模块101、图像合并模块103、图像传递模块105、特征计算模块107、特征合并模块109与特征回传模块111。本发明实施例所称的模块可以是完成一特定功能的程序段,比程序更适合于描述软件在处理器中的执行过程。
可以理解的是,对应上述图像处理方法中的各实施方式,终端1可以包括图3中所示的各功能模块中的一部分或全部,各模块的功能将在以下具体介绍。需要说明的是,以上图像处理方法的各实施方式中相同的名词相关名词及其具体的解释说明也可以适用于以下对各模块的功能介绍。为节省篇幅及避免重复起见,在此就不再赘述。
图像获取模块101可以用于获取人脸图像,所述人脸图像包括原始人脸图像与待识别的人脸图像。
图像合并模块103可以用于将预设数量的人脸图像进行合并处理。
图像传递模块105可以用于将合并处理后的预设数量的人脸图像由中央处理器CPU对应的内存传递至图形处理器GPU对应的显存中。
特征计算模块107可以用于在所述图形处理器GPU中,将合并处理后的预设数量的人脸图像输入至深度学习框架中进行计算,得到预设数量的人脸图像对应的特征向量。
特征合并模块109可以用于将预设数量的人脸图像对应的特征向量进行合并处理。
特征回传模块111可以用于将合并处理后的预设数量的人脸图像对应的特征向量由图形处理器GPU对应的显存回传至中央处理器CPU对应的内存中。
本发明实施例还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一实施方式中的图像处理方法的步骤。
所述图像处理装置100/终端1/计算机设备集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施方式方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读存储介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。
所称处理器30可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器30是所述图像处理装置100/终端1的控制中心,利用各种接口和线路连接整个图像处理装置100/终端1的各个部分。
所述存储器10用于存储所述计算机程序和/或模块,所述处理器30通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器10内的数据,实现所述图像处理装置100/终端1的各种功能。所述存储器10可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。
在本发明所提供的几个具体实施方式中,应该理解到,所揭露的终端和方法,可以通过其它的方式实现。例如,以上所描述的系统实施方式仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
对于本领域技术人员而言,显然本发明实施例不限于上述示范性实施例的细节,而且在不背离本发明实施例的精神或基本特征的情况下,能够以其他的具体形式实现本发明实施例。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明实施例的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明实施例内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。权利要求中陈述的多个单元、模块或装置也可以由同一个单元、模块或装置通过软件或者硬件来实现。
以上实施方式仅用以说明本发明实施例的技术方案而非限制,尽管参照以上较佳实施方式对本发明实施例进行了详细说明,本领域的普通技术人员应当理解,可以对本发明实施例的技术方案进行修改或等同替换都不应脱离本发明实施例的技术方案的精神和范围。

Claims (8)

1.一种图像处理方法,其特征在于,所述图像处理方法包括:
获取人脸图像,所述人脸图像包括原始人脸图像与待识别的人脸图像;
获取每一张所述人脸图像中的像素值,将所述像素值转换为矩阵,并将预设数量的人脸图像对应的矩阵进行合并处理;
将合并处理后的预设数量的人脸图像对应的矩阵由中央处理器CPU对应的内存传递至图形处理器GPU对应的显存中;
在所述图形处理器GPU中,将合并处理后的预设数量的人脸图像输入至深度学习框架中进行计算,得到预设数量的人脸图像对应的特征向量;
将预设数量的人脸图像对应的特征向量进行合并处理,包括:获取每一张人脸图像对应的特征向量为1*m形式的特征向量;确认进行特征向量合并处理的所述人脸图像的预设数量;将所述预设数量的人脸图像对应的特征向量1*m形式的向量转换为n*m形式的特征向量,其中,n表示所述进行特征向量合并处理的所述人脸图像的预设数量,m表示每一张人脸图像对应的特征值的数量;
将合并处理后的预设数量的人脸图像对应的特征向量由图形处理器GPU对应的显存回传至中央处理器CPU对应的内存中;
获取所述待识别的人脸图像对应的特征向量;
获取合并处理后的预设数量的原始人脸图像对应的特征向量;
确认所述待识别的人脸图像对应的特征向量与所述合并处理后的预设数量的原始人脸图像对应的特征向量之间的特征相似度值;
判断所述特征相似度值是否大于预设相似度阈值;
若判断结果为所述特征相似度值大于所述预设相似度阈值,则输出人脸识别结果。
2.根据权利要求1所述的图像处理方法,其特征在于,在所述将预设数量的人脸图像进行合并处理之前,所述方法还包括:
定位预设数量的人脸图像中的每一张原始人脸图像的特征点,并对人脸图像进行校正;
将校正后的所述人脸图像转换为预设标准尺寸的人脸图像。
3.根据权利要求1所述的图像处理方法,其特征在于,所述将所述像素值转换为矩阵,并将预设数量的人脸图像对应的矩阵进行合并处理包括:
将每一张所述人脸图像的像素值转换为一个w*h形式的矩阵;
将所述预设数量的人脸图像对应的二维的w*h形式的矩阵转换为一个n*w*h形式的矩阵,其中,n表示所述进行合并处理的人脸图像的预设数量,w表示人脸图像的宽度,h表示人脸图像的高度。
4.根据权利要求1所述的图像处理方法,其特征在于,在所述将合并处理后的预设数量的人脸图像输入至深度学习框架中进行计算之前,所述方法还包括:
通过所述图形处理器GPU将不同的所述人脸图像的特征向量计算操作划分为互不相关且顺序任意的任务进行并行执行。
5.根据权利要求1所述的图像处理方法,其特征在于,所述将合并处理后的预设数量的人脸图像输入至深度学习框架中进行计算包括:
构建预设初始深度学习框架;
将合并处理后的预设数量的原始人脸图像作为训练样本输入至所述预设初始深度学习框架中进行训练,得到训练好的预设深度学习框架;
将所述待识别的人脸图像输入至训练好的预设深度学习框架中进行特征值计算,输出所述待识别的人脸图像对应的特征向量。
6.一种图像处理装置,其特征在于,所述图像处理装置包括:
图像获取模块,用于获取人脸图像,所述人脸图像包括原始人脸图像与待识别的人脸图像;
图像合并模块,用于获取每一张所述人脸图像中的像素值,将所述像素值转换为矩阵,将预设数量的人脸图像对应的矩阵进行合并处理;
图像传递模块,用于将合并处理后的预设数量的人脸图像对应的矩阵由中央处理器CPU对应的内存传递至图形处理器GPU对应的显存中;
特征计算模块,用于在所述图形处理器GPU中,将合并处理后的预设数量的人脸图像输入至深度学习框架中进行计算,得到预设数量的人脸图像对应的特征向量;
特征合并模块,用于将预设数量的人脸图像对应的特征向量进行合并处理,包括:获取每一张人脸图像对应的特征向量为1*m形式的特征向量;确认进行特征向量合并处理的所述人脸图像的预设数量;将所述预设数量的人脸图像对应的特征向量1*m形式的向量转换为n*m形式的特征向量,其中,n表示所述进行特征向量合并处理的所述人脸图像的预设数量,m表示每一张人脸图像对应的特征值的数量;
特征回传模块,用于将合并处理后的预设数量的人脸图像对应的特征向量由图形处理器GPU对应的显存回传至中央处理器CPU对应的内存中;获取所述待识别的人脸图像对应的特征向量;获取合并处理后的预设数量的原始人脸图像对应的特征向量;确认所述待识别的人脸图像对应的特征向量与所述合并处理后的预设数量的原始人脸图像对应的特征向量之间的特征相似度值;判断所述特征相似度值是否大于预设相似度阈值;若判断结果为所述特征相似度值大于所述预设相似度阈值,则输出人脸识别结果。
7.一种终端,其特征在于,所述终端包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1至5中任意一项所述图像处理方法。
8.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5中任意一项所述图像处理方法。
CN201910487842.7A 2019-06-05 2019-06-05 图像处理方法、装置、终端及存储介质 Active CN110378203B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201910487842.7A CN110378203B (zh) 2019-06-05 2019-06-05 图像处理方法、装置、终端及存储介质
PCT/CN2019/118023 WO2020244151A1 (zh) 2019-06-05 2019-11-13 图像处理方法、装置、终端及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910487842.7A CN110378203B (zh) 2019-06-05 2019-06-05 图像处理方法、装置、终端及存储介质

Publications (2)

Publication Number Publication Date
CN110378203A CN110378203A (zh) 2019-10-25
CN110378203B true CN110378203B (zh) 2023-06-23

Family

ID=68249822

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910487842.7A Active CN110378203B (zh) 2019-06-05 2019-06-05 图像处理方法、装置、终端及存储介质

Country Status (2)

Country Link
CN (1) CN110378203B (zh)
WO (1) WO2020244151A1 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110378203B (zh) * 2019-06-05 2023-06-23 平安科技(深圳)有限公司 图像处理方法、装置、终端及存储介质
CN112965809A (zh) * 2019-12-12 2021-06-15 深圳市优必选科技股份有限公司 深度学习任务处理系统和方法
CN112036370B (zh) * 2020-09-22 2023-05-12 济南博观智能科技有限公司 一种人脸特征比对方法、系统、设备及计算机存储介质
CN112507903B (zh) * 2020-12-15 2024-05-10 平安科技(深圳)有限公司 假脸检测方法、装置、电子设备及计算机可读存储介质
CN113419806B (zh) * 2021-06-30 2023-08-08 腾讯科技(上海)有限公司 图像处理方法、装置、计算机设备和存储介质
CN118227384B (zh) * 2024-05-24 2024-08-09 北京蓝耘科技股份有限公司 一种局域gpu数据共享方法、系统及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108062532A (zh) * 2017-12-28 2018-05-22 北京智慧眼科技股份有限公司 深度学习人脸识别网络优化方法、装置及存储介质
CN109214273A (zh) * 2018-07-18 2019-01-15 平安科技(深圳)有限公司 人脸图像比对方法、装置、计算机设备及存储介质
CN109726626A (zh) * 2018-09-27 2019-05-07 合肥博焱智能科技有限公司 基于gpu的人脸识别系统

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2199971A1 (en) * 2008-12-15 2010-06-23 Medison Co., Ltd. Image processing system and method
CN103440612B (zh) * 2013-08-27 2016-12-28 华为技术有限公司 一种gpu虚拟化中图像处理方法和装置
CN107832807B (zh) * 2017-12-07 2020-08-07 上海联影医疗科技有限公司 一种图像处理方法和系统
CN110378203B (zh) * 2019-06-05 2023-06-23 平安科技(深圳)有限公司 图像处理方法、装置、终端及存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108062532A (zh) * 2017-12-28 2018-05-22 北京智慧眼科技股份有限公司 深度学习人脸识别网络优化方法、装置及存储介质
CN109214273A (zh) * 2018-07-18 2019-01-15 平安科技(深圳)有限公司 人脸图像比对方法、装置、计算机设备及存储介质
CN109726626A (zh) * 2018-09-27 2019-05-07 合肥博焱智能科技有限公司 基于gpu的人脸识别系统

Also Published As

Publication number Publication date
CN110378203A (zh) 2019-10-25
WO2020244151A1 (zh) 2020-12-10

Similar Documents

Publication Publication Date Title
CN110378203B (zh) 图像处理方法、装置、终端及存储介质
US10936919B2 (en) Method and apparatus for detecting human face
US11967151B2 (en) Video classification method and apparatus, model training method and apparatus, device, and storage medium
US20230081645A1 (en) Detecting forged facial images using frequency domain information and local correlation
US11609968B2 (en) Image recognition method, apparatus, electronic device and storage medium
US20200218948A1 (en) Thundernet: a turbo unified network for real-time semantic segmentation
CN112200062B (zh) 一种基于神经网络的目标检测方法、装置、机器可读介质及设备
JP2022058173A (ja) 画像分類方法及び機器
US11481625B2 (en) Artificial neural network
CN108509994B (zh) 人物图像聚类方法和装置
CN110555334B (zh) 人脸特征确定方法、装置、存储介质及电子设备
EP4220555A1 (en) Training method and apparatus for image segmentation model, image segmentation method and apparatus, and device
US20230067934A1 (en) Action Recognition Method, Apparatus and Device, Storage Medium and Computer Program Product
KR102621355B1 (ko) 미세 구조 마스크를 사용한 다중 스케일 인자 이미지 슈퍼 해상도
US11983903B2 (en) Processing images using self-attention based neural networks
CN111898735A (zh) 蒸馏学习方法、装置、计算机设备和存储介质
CN112529149B (zh) 一种数据处理方法及相关装置
US20230386243A1 (en) Information processing apparatus, control method, and non-transitory storage medium
CN114330565A (zh) 一种人脸识别方法及装置
WO2024045320A1 (zh) 人脸识别方法及装置
CN115909009A (zh) 图像识别方法、装置、存储介质及电子设备
CN114972775A (zh) 特征处理方法、装置、产品、介质及设备
CN111062995B (zh) 生成人脸图像的方法、装置、电子设备和计算机可读介质
CN110942033B (zh) 用于推送信息的方法、装置、电子设备和计算机介质
US11734574B1 (en) Neural Bregman divergences for distance learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant