CN109993137A - 一种基于卷积神经网络的快速人脸矫正方法 - Google Patents

一种基于卷积神经网络的快速人脸矫正方法 Download PDF

Info

Publication number
CN109993137A
CN109993137A CN201910279481.7A CN201910279481A CN109993137A CN 109993137 A CN109993137 A CN 109993137A CN 201910279481 A CN201910279481 A CN 201910279481A CN 109993137 A CN109993137 A CN 109993137A
Authority
CN
China
Prior art keywords
face
affine transformation
image
neural networks
convolutional neural
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910279481.7A
Other languages
English (en)
Inventor
王华彬
刘欣
闫祥
王祺
秦愿
王智君
宋金洁
施飞宇
陶亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui University
Original Assignee
Anhui University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui University filed Critical Anhui University
Priority to CN201910279481.7A priority Critical patent/CN109993137A/zh
Publication of CN109993137A publication Critical patent/CN109993137A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/02Affine transformations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Human Computer Interaction (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明公开一种基于卷积神经网络的快速人脸矫正算法,包括如下步骤:读取图像和图像中人脸位置信息;通过图像中人脸的位置信息裁剪出人脸区域,并对裁剪的图像进行预处理;将预处理好的人脸区域图像输入给卷积神经网络进行训练,得到最优的仿射变换参数预测模型;将待测试人脸图像输入仿射变换参数预测模型中,获得对应的预测仿射变换参数;利用预测的仿射变换参数对待测试人脸图像进行仿射变换,返回矫正后的人脸图像。本发明通过新的损失函数让卷积神经网络自动对仿射变换每一个系数的重要性进行建模。本发明公开的方法有效地提升了人脸矫正的速度,对遮挡等难题更加鲁棒。

Description

一种基于卷积神经网络的快速人脸矫正方法
技术领域
本发明属于计算机视觉技术,具体涉及一种基于卷积神经网络的快速人脸矫正方法。
背景技术
人脸矫正是人脸识别、表情识别、人脸分析等更高级别的任务关键的中至关重要的一步,其意义是更好的裁剪出人脸。在面对现实世界的复杂场景时,由于遮挡、模糊、角度、光照、表情的影响,使得人脸矫正仍是一个具有挑战性的研究领域。
卷积神经网络在人脸矫正的任务上取得了很好的性能,主要是因为其强大的非线性拟合能力和端对端学习。常见的人脸矫正方法先利用卷积神经网络预测人脸的关键点,然后通过普氏分析来获取人脸关键点与平均形状的仿射变换参数。基于此类的人脸矫正方法不仅速度慢,而且在处理遮挡、角度等因素时鲁棒性差。
发明内容
发明目的:本发明的目的在于解决现有技术中存在的不足,提供一种基于卷积神经网络的快速人脸矫正方法。
技术方案:本发明的一种基于卷积神经网络的快速人脸矫正方法,依次包括以下步骤:
步骤1:获取图像以及图像中人脸区域的位置信息;
步骤2:利用步骤1获得的人脸区域的位置信息,裁剪出图像中人脸区域,并对裁剪的图像进行预处理;
步骤3:将步骤2中处理后的图像输入给卷积神经网络进行训练,获取最优的人脸矫正网络模型;
步骤4:将待预测的人脸图像输入至步骤3获取到的最优人脸矫正网络模型中,获取相应的预测的仿射变换参数;
步骤5:通过步骤4获取的仿射变换参数对相应的人脸图片进行仿射变换,获得矫正的人脸图像。
进一步的,所述步骤2中对裁剪的图像进行预处理的具体内容为:
步骤2.1:读取包含人脸的图片和图片中人脸框的左上角和右下角两个坐标值;
步骤2.2:通过已知的两个坐标点裁剪出人脸区域图像;
步骤2.3:通过仿射变换将裁剪后的图片缩放到有利于训练的尺度。
进一步的,所述步骤2.3中有利于训练的尺度具体为长128像素,宽128像素,如果长宽大于128像素,则增加GPU的负担,速度变慢;如果长宽小于128像素,则会影响最终矫正精度。
进一步的,所述步骤3的详细内容为:
步骤3.1:搭建好卷积神经网络框架;该卷积神经网络的输入层至输出层之间依次为卷积层、第一残差块、第二残差块、第三残差块、第四残差块、卷积层、线性激活层、卷积层;所述残差块是由基础卷积神经网络结构构建得到,从输入层至输出层之间依次为第一卷积层;第一批量正则化层;第一线性激活层;第二卷积层;第二批量正则化层;第二线性激活层;数值单元融合层,残差块输入和第二线性激活层的输出相加;
步骤3.2:将步骤2处理后的图像数据输入给卷积神经网络,即:将图像数据转化为张量输入给上述卷积神经网络;
步骤3.3:通过改进的均方根误差最小化预测仿射变换参数和真值之间的误差,训练得到最优的人脸矫正网络模型,具体内容为:
其中,δ为预测的仿射变换系数,lp为输入图像中的人脸关键点的真值,lg为目标图像的人脸关键点的真值,⊙(δ,lp)的目的是利用预测的仿射变换系数将目标图像中的人脸关键点真值转到目标图像中的人脸关键点真值。该损失函数通过利用输入图像和目标图像的关键点真值作为辅助,让卷积神经网络自动对仿射变换每一个系数的重要性进行建模。
进一步的,所述步骤3.3中仿射变换参数的具体内容为:
其中,θ为旋转角度,α为缩放参数,tx和ty分别为平移。
进一步的,所述步骤5的具体内容为:根据步骤4所获得的仿射变换参数对图像进行仿射变换,所述仿射变换包括平移变换、旋转变换和缩放变换,按照如下公式进行转换:
其中x,y是变换前坐标,u,v是变换后坐标,δ是仿射变换参数。
有益效果:本发明利用这种直接通过卷积神经网络预测从输入图像到目标图像的仿射变换参数的方式具有两个优点,首先是因为不需要预测人脸的关键点,可以避免因遮挡、表情等因素导致人脸关键点预测不精确的问题,其次是直接预测仿射变换的参数,不会因人脸形状和平均人脸形状差异大导致矫正效果差。此外,考虑到每一个仿射变换参数对最终的结果具有不同的影响,本发明使用改进的均方根误差作为损失函数,对仿射变换参数中的每个参数的权重进行学习,从而训练出更鲁棒的人脸矫正模型。
附图说明
图1是本发明的总流程图;
图2是实施例中仿射变换参数预测网络结构图;
图3是实施例中残差块结构图;
图4是实施例中待矫正人脸的图;
图5是实施例中矫正人脸的效果图。
具体实施方式
下面对本发明技术方案进行详细说明,但是本发明的保护范围不局限于所述实施例。
如图1所示,本发明的一种基于卷积神经网络的快速人脸矫正方法,包括以下步骤:
步骤1:获取图像以及图像中人脸区域的位置信息;
步骤2:利用步骤1获得的人脸区域的位置信息,裁剪出图像中人脸区域,并对裁剪的图像进行预处理;
步骤2.1:读取包含人脸的图片和图片中人脸框的左上角和右下角两个坐标值;
步骤2.2:通过已知的两个坐标点裁剪出人脸区域图像;
步骤2.3:通过仿射变换,将图片缩放到有利于训练的尺度(例如长为128像素,宽为128像素);
步骤3:将步骤2中处理利好的图像输入给卷积神经网络进行训练,获取最优的人脸矫正网络模型;
步骤3.1:搭建好卷积神经网络框架;
步骤3.2:将步骤2处理后的图像数据输入给卷积神经网络;
步骤3.3:通过改进的均方根误差最小化预测仿射变换参数和真值之间的误差,训练得到最优的人脸矫正网络模型;
步骤4:将待预测的人脸图像输入至步骤3获取到的最优人脸矫正网络模型中,获取相应的预测的仿射变换参数;
步骤5:通过步骤4获取的仿射变换参数对相应的人脸图片进行仿射变换,获得矫正的人脸图像;所述仿射变换为平移变换、旋转变换、缩放变换,按照如下公式进行转换:
其中x,y是变换前坐标,u,v是变换后坐标,δ是仿射变换参数。
如图2所示,步骤3.1中所述卷积神经网络的输入层至输出层之间依次为卷积层,参数包括通道数为8,卷积核尺寸为3和3,步长为2,补零项尺寸为1和1;第一残差块;第二残差块;第三残差块;第四残差块;卷积层,参数包括通道数为32,卷积核尺寸为3和3;线性激活层;卷积层,参数包括通道数为6,卷积核尺寸为1和1;
如图3所示,第一残差块从输入层至输出层之间依次为第一卷积层,参数包括通道数为16,卷积核尺寸为3和3,步长为2,补零项尺寸为1和1;第一批量正则化层;第一线性激活层;第二卷积层,参数包括通道数为16,卷积核尺寸为3和3,步长为1,补零项尺寸为1和1;第二批量正则化层;第二线性激活层;数值单元融合层,通过以下方式:
out=ρ(inp)+out_bn
其中,ρ为卷积操作,inp为残差块的输入,该卷积层的参数包括通道数为16,卷积核尺寸为1和1,步长为2;out_bn为第二线性激活层的输出;+表示element-wise相加操作;out为残差块的输出。
如图3所示,第二残差块从输入层至输出层之间依次为第一卷积层,参数包括通道数为32,卷积核尺寸为3和3,步长为2,补零项尺寸为1和1;第一批量正则化层;第一线性激活层;第二卷积层,参数包括通道数为32,卷积核尺寸为3和3,步长为1,补零项尺寸为1和1;第二批量正则化层;第二线性激活层;数值单元融合层,通过以下方式:
out=ρ(inp)+out_bn
其中,ρ为卷积操作,inp为残差块的输入,该卷积层的参数包括通道数为32,卷积核尺寸为1和1,步长为2;out_bn为第二线性激活层的输出;+表示element-wise相加操作;out为残差块的输出。
如图3所示,第三残差块从输入层至输出层之间依次为第一卷积层,参数包括通道数为64,卷积核尺寸为3和3,步长为2,补零项尺寸为1和1;第一批量正则化层;第一线性激活层;第二卷积层,参数包括通道数为64,卷积核尺寸为3和3,步长为1,补零项尺寸为1和1;第二批量正则化层;第二线性激活层;数值单元融合层,通过以下方式:
out=ρ(inp)+out_bn
其中,ρ为卷积操作,inp为残差块的输入,该卷积层的参数包括通道数为64,卷积核尺寸为1和1,步长为2;out_bn为第二线性激活层的输出;+表示element-wise相加操作;out为残差块的输出。;
如图3所示,第四残差块从输入层至输出层之间依次为第一卷积层,参数包括通道数为128,卷积核尺寸为3和3,步长为2,补零项尺寸为1和1;第一批量正则化层;第一线性激活层;第二卷积层,参数包括通道数为128,卷积核尺寸为3和3,步长为1,补零项尺寸为1和1;第二批量正则化层;第二线性激活层;数值单元融合层,通过以下方式:
out=ρ(inp)+out_bn
其中,ρ为卷积操作,inp为残差块的输入,该卷积层的参数包括通道数为128,卷积核尺寸为1和1,步长为2;out_bn为第二线性激活层的输出;+表示element-wise相加操作;out为残差块的输出;
更进一步的,步骤3.2中将步骤2处理后的图像数据转化为张量输入给网络;
更进一步的,步骤3.3中改进的均方根误差的具体内容为:
其中,δ为预测的仿射变换系数,lp为输入图像中的人脸关键点的真值,lg为目标图像的人脸关键点的真值,⊙(δ,lp)的目的是利用预测的仿射变换系数将目标图像中的人脸关键点真值转到目标图像中的人脸关键点真值。该损失函数通过利用输入图像和目标图像的关键点真值作为辅助,让卷积神经网络自动对仿射变换每一个系数的重要性进行建模。
更进一步的,上述仿射变换参数的具体内容为:
其中,θ为旋转角度,α为缩放参数,tx,ty为平移。
实施例:
本实施的一种基于卷积神经网络的快速人脸矫正方法具体内容为:将图4输入给训练好的人脸矫正模型,输出仿射变换参数;通过获得的仿射变换参数对图4进行人脸矫正,最终即可获得的人脸矫正图像,如图5所示。
通过上述实施例的过程和结果可知,因不需要预测人脸的关键点,本发明可避免因遮挡、表情等因素导致人脸关键点预测不精确的问题。此外,考虑到每一个仿射变换参数对最终的结果具有不同的影响,本发明使用改进的均方根误差作为损失函数,通过卷积神经网络对仿射变换参数中的每个参数的权重进行学习。本发明相对于其他常用的人脸矫正方法,具有速度快、准确性高的特点。

Claims (6)

1.一种基于卷积神经网络的快速人脸矫正方法,其特征在于:依次包括以下步骤:
步骤1:获取图像以及图像中人脸区域的位置信息;
步骤2:利用步骤1获得的人脸区域的位置信息,裁剪出图像中人脸区域,并对裁剪的图像进行预处理;
步骤3:将步骤2中处理后的图像输入给卷积神经网络进行训练,获取最优的人脸矫正网络模型;
步骤4:将待预测的人脸图像输入至步骤3获取到的最优人脸矫正网络模型中,获取相应的预测的仿射变换参数;
步骤5:通过步骤4获取的仿射变换参数对相应的人脸图片进行仿射变换,获得矫正的人脸图像。
2.根据权利要求1所述的基于卷积神经网络的快速人脸矫正方法,其特征在于:所述步骤2中对裁剪的图像进行预处理的具体内容为:
步骤2.1:读取包含人脸的图片和图片中人脸框的左上角和右下角两个坐标值;
步骤2.2:通过已知的两个坐标点裁剪出人脸区域图像;
步骤2.3:通过仿射变换将裁剪后的图片缩放到有利于训练的尺度。
3.根据权利要求2所述的基于卷积神经网络的快速人脸矫正方法,其特征在于:所述步骤2.3中有利于训练的尺度为长128像素且宽128像素。
4.根据权利要求1所述的基于卷积神经网络的快速人脸矫正方法,其特征在于:所述步骤3的详细内容为:
步骤3.1:搭建好卷积神经网络框架;该卷积神经网络的输入层至输出层之间依次为卷积层、第一残差块、第二残差块、第三残差块、第四残差块、卷积层、线性激活层、卷积层;所述残差块是由基础卷积神经网络结构构建得到,从输入层至输出层之间依次为第一卷积层;第一批量正则化层;第一线性激活层;第二卷积层;第二批量正则化层;第二线性激活层;数值单元融合层,残差块输入和第二线性激活层的输出相加;
步骤3.2:将步骤2处理后的图像数据输入给卷积神经网络,即:将图像数据转化为张量输入给上述卷积神经网络;
步骤3.3:通过改进的均方根误差最小化预测仿射变换参数和真值之间的误差,训练得到最优的人脸矫正网络模型,具体内容为:
其中,δ为预测的仿射变换系数,lp为输入图像中的人脸关键点的真值,lg为目标图像的人脸关键点的真值,通过⊙(δ,lp)利用预测的仿射变换系数将目标图像中的人脸关键点真值转到目标图像中的人脸关键点真值。
5.根据权利要求4所述的基于卷积神经网络的快速人脸矫正方法,其特征在于:所述步骤3.3中仿射变换参数的具体内容为:
其中,θ为旋转角度,α为缩放参数,tx和ty分别为平移。
6.根据权利要求1所述的基于卷积神经网络的快速人脸矫正方法,其特征在于:所述步骤5的具体内容为:根据步骤4所获得的仿射变换参数对图像进行仿射变换,所述仿射变换包括平移变换、旋转变换和缩放变换,按照如下公式进行转换:
其中x,y是变换前坐标,u,v是变换后坐标,δ是仿射变换参数。
CN201910279481.7A 2019-04-09 2019-04-09 一种基于卷积神经网络的快速人脸矫正方法 Pending CN109993137A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910279481.7A CN109993137A (zh) 2019-04-09 2019-04-09 一种基于卷积神经网络的快速人脸矫正方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910279481.7A CN109993137A (zh) 2019-04-09 2019-04-09 一种基于卷积神经网络的快速人脸矫正方法

Publications (1)

Publication Number Publication Date
CN109993137A true CN109993137A (zh) 2019-07-09

Family

ID=67131319

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910279481.7A Pending CN109993137A (zh) 2019-04-09 2019-04-09 一种基于卷积神经网络的快速人脸矫正方法

Country Status (1)

Country Link
CN (1) CN109993137A (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110532928A (zh) * 2019-08-23 2019-12-03 安徽大学 基于面部区域规范化和可变形沙漏网络的面部关键点检测方法
CN110796029A (zh) * 2019-10-11 2020-02-14 北京达佳互联信息技术有限公司 人脸校正及模型训练方法、装置、电子设备及存储介质
CN111008929A (zh) * 2019-12-19 2020-04-14 维沃移动通信(杭州)有限公司 图像矫正方法及电子设备
CN111080667A (zh) * 2019-12-17 2020-04-28 杭州趣维科技有限公司 一种快速人像照片的自动构图裁剪方法及系统
CN111091083A (zh) * 2019-12-09 2020-05-01 Oppo广东移动通信有限公司 基于图像的人脸尺度计算方法、装置及电子设备
CN111223065A (zh) * 2020-01-13 2020-06-02 中国科学院重庆绿色智能技术研究院 图像矫正方法、不规则文本识别方法、装置、存储介质和设备
CN111476709A (zh) * 2020-04-09 2020-07-31 广州华多网络科技有限公司 人脸图像处理方法、装置及电子设备
CN111583099A (zh) * 2020-04-14 2020-08-25 上海联影智能医疗科技有限公司 图像摆正方法、计算机设备和存储介质
CN112149571A (zh) * 2020-09-24 2020-12-29 深圳龙岗智能视听研究院 一种基于神经网络仿射变换的人脸识别方法
CN112163479A (zh) * 2020-09-16 2021-01-01 广州华多网络科技有限公司 动作检测方法、装置、计算机设备和计算机可读存储介质
CN112183492A (zh) * 2020-11-05 2021-01-05 厦门市美亚柏科信息股份有限公司 一种人脸模型精度矫正方法、装置及存储介质
CN114519666A (zh) * 2022-02-18 2022-05-20 广州方硅信息技术有限公司 直播图像矫正方法、装置、设备及存储介质
WO2024045442A1 (zh) * 2022-08-30 2024-03-07 青岛云天励飞科技有限公司 图像矫正模型的训练方法、图像矫正方法、设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108470328A (zh) * 2018-03-28 2018-08-31 百度在线网络技术(北京)有限公司 用于处理图像的方法和装置
CN108509940A (zh) * 2018-04-20 2018-09-07 北京达佳互联信息技术有限公司 人脸图像跟踪方法、装置、计算机设备及存储介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108470328A (zh) * 2018-03-28 2018-08-31 百度在线网络技术(北京)有限公司 用于处理图像的方法和装置
CN108509940A (zh) * 2018-04-20 2018-09-07 北京达佳互联信息技术有限公司 人脸图像跟踪方法、装置、计算机设备及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
YUANYI ZHONG 等: "Towards End-to-End Face Recognition through Alignment Learning", 《ARXIV:1701.07174V1》 *
李少辉 等: "基于机器视觉和神经网络的低质量文本识别研究", 《机电工程》 *

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110532928A (zh) * 2019-08-23 2019-12-03 安徽大学 基于面部区域规范化和可变形沙漏网络的面部关键点检测方法
CN110532928B (zh) * 2019-08-23 2022-11-29 安徽大学 基于面部区域规范化和可变形沙漏网络的面部关键点检测方法
CN110796029B (zh) * 2019-10-11 2022-11-11 北京达佳互联信息技术有限公司 人脸校正及模型训练方法、装置、电子设备及存储介质
CN110796029A (zh) * 2019-10-11 2020-02-14 北京达佳互联信息技术有限公司 人脸校正及模型训练方法、装置、电子设备及存储介质
CN111091083A (zh) * 2019-12-09 2020-05-01 Oppo广东移动通信有限公司 基于图像的人脸尺度计算方法、装置及电子设备
CN111091083B (zh) * 2019-12-09 2023-08-08 Oppo广东移动通信有限公司 基于图像的人脸尺度计算方法、装置及电子设备
CN111080667A (zh) * 2019-12-17 2020-04-28 杭州趣维科技有限公司 一种快速人像照片的自动构图裁剪方法及系统
CN111080667B (zh) * 2019-12-17 2023-04-25 杭州小影创新科技股份有限公司 一种快速人像照片的自动构图裁剪方法及系统
CN111008929A (zh) * 2019-12-19 2020-04-14 维沃移动通信(杭州)有限公司 图像矫正方法及电子设备
CN111008929B (zh) * 2019-12-19 2023-09-26 维沃移动通信(杭州)有限公司 图像矫正方法及电子设备
CN111223065A (zh) * 2020-01-13 2020-06-02 中国科学院重庆绿色智能技术研究院 图像矫正方法、不规则文本识别方法、装置、存储介质和设备
CN111223065B (zh) * 2020-01-13 2023-08-01 中国科学院重庆绿色智能技术研究院 图像矫正方法、不规则文本识别方法、装置、存储介质和设备
CN111476709B (zh) * 2020-04-09 2023-04-07 广州方硅信息技术有限公司 人脸图像处理方法、装置及电子设备
CN111476709A (zh) * 2020-04-09 2020-07-31 广州华多网络科技有限公司 人脸图像处理方法、装置及电子设备
CN111583099A (zh) * 2020-04-14 2020-08-25 上海联影智能医疗科技有限公司 图像摆正方法、计算机设备和存储介质
CN112163479A (zh) * 2020-09-16 2021-01-01 广州华多网络科技有限公司 动作检测方法、装置、计算机设备和计算机可读存储介质
CN112149571A (zh) * 2020-09-24 2020-12-29 深圳龙岗智能视听研究院 一种基于神经网络仿射变换的人脸识别方法
CN112183492B (zh) * 2020-11-05 2022-07-15 厦门市美亚柏科信息股份有限公司 一种人脸模型精度矫正方法、装置及存储介质
CN112183492A (zh) * 2020-11-05 2021-01-05 厦门市美亚柏科信息股份有限公司 一种人脸模型精度矫正方法、装置及存储介质
CN114519666A (zh) * 2022-02-18 2022-05-20 广州方硅信息技术有限公司 直播图像矫正方法、装置、设备及存储介质
CN114519666B (zh) * 2022-02-18 2023-09-19 广州方硅信息技术有限公司 直播图像矫正方法、装置、设备及存储介质
WO2024045442A1 (zh) * 2022-08-30 2024-03-07 青岛云天励飞科技有限公司 图像矫正模型的训练方法、图像矫正方法、设备及存储介质

Similar Documents

Publication Publication Date Title
CN109993137A (zh) 一种基于卷积神经网络的快速人脸矫正方法
WO2022111236A1 (zh) 一种结合注意力机制的面部表情识别方法及系统
CN110348330B (zh) 基于vae-acgan的人脸姿态虚拟视图生成方法
CN111950453B (zh) 一种基于选择性注意力机制的任意形状文本识别方法
WO2020108362A1 (zh) 人体姿态检测方法、装置、设备及存储介质
CN113591968A (zh) 一种基于非对称注意力特征融合的红外弱小目标检测方法
CN102509303B (zh) 基于改进的结构相似度的二值化图像配准方法
CN110827312B (zh) 一种基于协同视觉注意力神经网络的学习方法
CN101114340A (zh) 直方图均衡化图像处理的vlsi实现系统及方法
CN111652233A (zh) 一种针对复杂背景的文本验证码自动识别方法
CN107341844A (zh) 一种基于多Kinect的实时三维人体绘制方法
CN105069745A (zh) 基于普通图像传感器及增强现实技术的带表情变脸系统及方法
CN116805360B (zh) 一种基于双流门控渐进优化网络的显著目标检测方法
CN116091551A (zh) 一种基于多模态融合的目标检索跟踪方法及系统
CN112989995A (zh) 文本检测方法、装置及电子设备
CN114863539A (zh) 一种基于特征融合的人像关键点检测方法及系统
CN114842389B (zh) 一种实时的鲁棒的两阶段姿态预估方法
CN109101985A (zh) 一种基于自适应邻域测试的图像误匹配点对剔除方法
CN112200163A (zh) 水下底栖生物检测方法及系统
CN116402769A (zh) 一种兼顾大小目标的高精度纺织品瑕疵智能检测方法
CN110598647A (zh) 一种基于图像识别的头部姿态识别方法
CN118172595A (zh) 基于轻量化网络模型的服装品牌logo检测分类方法和系统
CN110288026A (zh) 一种基于度量关系图学习的图像分割方法及装置
CN109658357A (zh) 一种面向遥感卫星图像的去噪方法
CN117623031A (zh) 一种电梯无感控制系统及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20190709