CN113657321B - 基于人工智能的狗脸关键点检测方法、装置、设备及介质 - Google Patents

基于人工智能的狗脸关键点检测方法、装置、设备及介质 Download PDF

Info

Publication number
CN113657321B
CN113657321B CN202110970713.0A CN202110970713A CN113657321B CN 113657321 B CN113657321 B CN 113657321B CN 202110970713 A CN202110970713 A CN 202110970713A CN 113657321 B CN113657321 B CN 113657321B
Authority
CN
China
Prior art keywords
dog
key point
feature map
eye
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110970713.0A
Other languages
English (en)
Other versions
CN113657321A (zh
Inventor
薛全华
戴磊
刘玉宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202110970713.0A priority Critical patent/CN113657321B/zh
Publication of CN113657321A publication Critical patent/CN113657321A/zh
Application granted granted Critical
Publication of CN113657321B publication Critical patent/CN113657321B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)

Abstract

本申请涉及人工智能中的生物识别领域,提供一种基于人工智能的狗脸关键点检测方法,该方法包括:获取待检测的宠物狗图像和目标关键点检测模型;将宠物狗图像输入特征提取网络进行特征提取,得到分辨率不同的第一目标特征图、第二目标特征图和第三目标特征图;将第一目标特征图、第二目标特征图和第三目标特征图分别输入狗眼关键点检测网络进行处理;将第一目标特征图、第二目标特征图和第三目标特征图分别输入狗鼻关键点检测网络进行处理;根据第一置信度确定目标狗眼关键点组;根据第二置信度确定目标狗鼻关键点组。该方法提高了狗脸关键点的检测准确性。本申请还涉及区块链技术,上述目标关键点检测模型可存储在区块链中。

Description

基于人工智能的狗脸关键点检测方法、装置、设备及介质
技术领域
本申请涉及生物识别领域,尤其涉及一种基于人工智能的狗脸关键点检测方法、装置、设备及介质。
背景技术
目前,用户可以给自家的宠物狗投保宠物险,当自家的宠物狗生病或出现意外时,可以向保险公司申请理赔,可以保障宠物狗的安全和减少自己的经济损失。宠物狗投保时,需要对宠物狗进行身份认证。现有的DNA认证、芯片认证等手段操作复杂,成本较高。为解决上述问题,可以对宠物狗进行关键点检测,然后通过狗脸关键点,基于宠物狗的面部识别技术对宠物狗的特征信息进行采集和存储,从而实现宠物狗的身份认证。然而,现有的狗脸关键点检测方法无法准确地检测宠物狗的狗脸关键点。因此,如何提高狗脸关键点的检测准确性是目前亟待解决的问题。
发明内容
本申请实施例提供一种基于人工智能的狗脸关键点检测方法、装置、设备及介质,旨在提高狗脸关键点的检测准确性。
第一方面,本申请实施例提供一种基于人工智能的狗脸关键点检测方法,包括:
获取待检测的宠物狗图像,并调用目标关键点检测模型,所述目标关键点检测模型包括特征提取网络、狗眼关键点检测网络和狗鼻关键点检测网络;
将所述宠物狗图像输入所述特征提取网络进行特征提取,得到分辨率不同的第一目标特征图、第二目标特征图和第三目标特征图;
将所述第一目标特征图、所述第二目标特征图和所述第三目标特征图分别输入所述狗眼关键点检测网络进行处理,得到多个狗眼关键点组和每个所述狗眼关键点组的第一置信度;
将所述第一目标特征图、所述第二目标特征图和所述第三目标特征图分别输入所述狗鼻关键点检测网络进行处理,得到多个狗鼻关键点组和每个所述狗鼻关键点组的第二置信度;
将多个所述狗眼关键点组中所述第一置信度最高所对应的所述狗眼关键点组确定为目标狗眼关键点组;
将多个所述狗鼻关键点组中所述第二置信度最高所对应的所述狗鼻关键点组确定为目标狗鼻关键点组。
第二方面,本申请实施例还提供一种狗脸关键点检测装置,所述狗脸关键点检测装置包括:
获取模块,用于获取待检测的宠物狗图像,并调用目标关键点检测模型,所述目标关键点检测模型包括特征提取网络、狗眼关键点检测网络和狗鼻关键点检测网络;
特征提取模块,用于将所述宠物狗图像输入所述特征提取网络进行特征提取,得到分辨率不同的第一目标特征图、第二目标特征图和第三目标特征图;
狗眼关键点检测模块,用于将所述第一目标特征图、所述第二目标特征图和所述第三目标特征图分别输入所述狗眼关键点检测网络进行处理,得到多个狗眼关键点组和每个所述狗眼关键点组的第一置信度;
狗鼻关键点组检测模块,用于将所述第一目标特征图、所述第二目标特征图和所述第三目标特征图分别输入所述狗鼻关键点检测网络进行处理,得到多个狗鼻关键点组和每个所述狗鼻关键点组的第二置信度;
确定模块,用于将多个所述狗眼关键点组中所述第一置信度最高所对应的所述狗眼关键点组确定为目标狗眼关键点组;
将多个所述狗鼻关键点组中所述第二置信度最高所对应的所述狗鼻关键点组确定为目标狗鼻关键点组。
第三方面,本申请实施例还提供一种计算机设备,所述计算机设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的计算机程序,其中所述计算机程序被所述处理器执行时,实现如上所述的狗脸关键点检测方法的步骤。
第四方面,本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其中所述计算机程序被处理器执行时,实现如上所述的狗脸关键点检测方法的步骤。
本申请实施例提供一种基于人工智能的狗脸关键点检测方法、装置、设备及介质,通过提取分辨率不同的第一目标特征图、第二目标特征图和第三目标特征图,然后通过狗眼关键点检测网络可以将分辨率不同的第一目标特征图、第二目标特征图和第三目标特征图进行融合,以准确地确定不同尺寸的宠物狗的多个狗眼关键点组和每个狗眼关键点组的第一置信度,同时通过狗鼻关键点检测网络可以将分辨率不同的第一目标特征图、第二目标特征图和第三目标特征图进行融合,以准确地确定不同尺寸的宠物狗的多个狗鼻关键点组和每个狗鼻关键点组的第二置信度,最后将第一置信度最高所对应的狗眼关键点组确定为目标狗眼关键点组,并将第二置信度最高所对应的狗鼻关键点组确定为目标狗鼻关键点组,从而可以将狗脸关键点检测拆分为狗眼关键点检测与狗鼻关键点组检测,能够更好地检测狗脸关键点,极大地提高了狗脸关键点的检测准确性。
附图说明
为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种基于人工智能的狗脸关键点检测方法的流程示意图;
图2是本申请实施例中的目标关键点检测模型的一网络层级示意图;
图3是本申请实施例中的目标关键点检测模型的另一网络层级示意图;
图4是本申请实施例中的特征提取子网络的一示意图;
图5是本申请实施例中的第四卷积层、第五卷积层和第六卷积层的一层级结构示意图;
图6是本申请实施例中的标记有狗脸关键点和狗脸框的宠物狗图像的示意图;
图7是本申请实施例提供的一种狗脸关键点检测装置的示意性框图;
图8是本申请实施例提供的一种计算机设备的结构示意性框图。
本申请目的的实现、功能特点及优点将结合实施例,参阅附图做进一步说明。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
附图中所示的流程图仅是示例说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解、组合或部分合并,因此实际执行的顺序有可能根据实际情况改变。
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
本申请实施例提供一种基于人工智能的狗脸关键点检测方法、装置、设备及介质。其中,该狗脸关键点检测方法可应用于终端设备或服务器,该终端设备可以手机、平板电脑、笔记本电脑、台式电脑、个人数字助理和穿戴式设备等,服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
下面结合附图,对本申请的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
请参阅图1,图1是本申请实施例提供的一种狗脸关键点检测方法的流程示意图。
如图1所示,基于人工智能的狗脸关键点检测方法可以包括步骤S101至步骤S106。
步骤S101、获取待检测的宠物狗图像,并调用目标关键点检测模型。
示例性的,终端设备获取拍摄装置采集到的宠物狗图像,由终端设备对宠物狗图像进行狗脸关键点检测。其中,终端设备上部署有预先训练好的目标关键点检测模型。或者,终端设备获取拍摄装置采集到的宠物狗图像,并将该宠物狗图像上传至服务器,由服务器对宠物狗图像进行狗脸关键点检测。其中,服务器上部署有预先训练好的目标关键点检测模型。为提高数据的安全性,可以将目标关键点检测模型存储在区块链中。
如图2所示,目标关键点检测模型包括特征提取网络100、狗眼关键点检测网络200和狗鼻关键点检测网络300,且特征提取网络100与狗眼关键点检测网络200连接,特征提取网络100也与狗鼻关键点检测网络300连接,特征提取网络100用于将宠物狗图像转换为不同分辨率的特征图,狗眼关键点检测网络200用于融合不同分辨率的特征图来检测宠物狗的狗眼关键点组和第一置信度,狗鼻关键点检测网络300用于融合不同分辨率的特征图来检测宠物狗的狗鼻关键点组和第二置信度。其中,狗眼关键点组包括至少两个狗眼关键点,且至少两个狗眼关键点包括宠物狗的左眼关键点和右眼关键点,狗鼻关键点组至少包括一个狗鼻关键点。
步骤S102、将宠物狗图像输入特征提取网络进行特征提取,得到分辨率不同的第一目标特征图、第二目标特征图和第三目标特征图。
示例性的,如图3所示,特征提取网络100包括特征提取子网络101、第一卷积层102、第一上采样层103、第一拼接层104、第二卷积层105、第二上采样层106、第二拼接层107、第三卷积层108、第四卷积层109、第五卷积层110和第六卷积层111,且特征提取子网络101分别与第一卷积层102、第一拼接层104和第二拼接层107连接,第一卷积层102分别与第一上采样层103和第四卷积层109连接,第一上采样层103与第一拼接层104,第一拼接层104与第二卷积层105连接,第二卷积层105分别与第二上采样层106和第五卷积层110连接,第二上采样层106与第二拼接层107连接,第二拼接层107与第三卷积层108连接,第三卷积层108与第六卷积层111,第四卷积层109、第五卷积层110和第六卷积层111均与狗眼关键点检测网络200和狗鼻关键点检测网络300连接。
示例性的,将宠物狗图像输入特征提取子网络,得到分辨率不同的第一特征图、第二特征图和第三特征图;将第一特征图输入第一卷积层进行卷积,得到第四特征图,将第四特征图输入第四卷积层进行卷积,得到第一目标特征图;将第四特征图输入第一上采样层进行上采样,得到第五特征图;将第二特征图和第五特征图输入第一拼接层进行拼接,得到第一拼接特征图;将第一拼接特征图输入第二卷积层进行卷积,得到第六特征图,将第六特征图输入第五卷积层进行卷积,得到第二目标特征图;将第六特征图输入第二上采样层进行上采样,得到第七特征图;将第三特征图与第七特征图输入第二拼接层进行拼接,得到第二拼接特征图;将第二拼接特征图输入第三卷积层进行卷积,得到第八特征图,将第八特征图输入第六卷积层进行卷积,得到第三目标特征图。
示例性的,将宠物狗图像的尺寸调整为预设尺寸,得到目标宠物狗图像,并将目标宠物狗图像输入特征提取子网络,得到第一特征图、第二特征图和第三特征图。其中,第一特征图的分辨率小于第二特征图,第二特征图的分辨率小于第三特征图的分辨率,预设尺寸可基于实际情况进行设置,本实施例对此不做具体限定。例如,预设尺寸为416×416。
其中,特征提取子网络可以为mobilenetv2,如图4所示,特征提取子网络包括7个bottleneck,第一瓶颈层bottleneck1的扩展因子t、通道数c、重复次数n和步长s分别为1、16、1和1,第二瓶颈层bottleneck2的扩展因子t、通道数c、重复次数n和步长s分别为6、24、2和2,第三瓶颈层bottleneck3的扩展因子t、通道数c、重复次数n和步长s分别为6、32、3和2,第四瓶颈层bottleneck4的扩展因子t、通道数c、重复次数n和步长s分别为6、64、4和2,第五瓶颈层bottleneck5的扩展因子t、通道数c、重复次数n和步长s分别为6、96、3和1,第六瓶颈层bottleneck6的扩展因子t、通道数c、重复次数n和步长s分别为6、160、3和1,第七瓶颈层bottleneck7的扩展因子t、通道数c、重复次数n和步长s分别为6、320、1和1。
示例性的,将宠物狗图像输入特征提取子网络,得到第一特征图、第二特征图和第三特征图的方式可以为:将宠物狗图像输入第一瓶颈层进行处理,得到第一候选特征图;将第一候选特征图输入第二瓶颈层进行处理,得到第二候选特征图;将第二候选特征图输入第三瓶颈层进行处理,得到第一特征图;将第一特征图输入第四瓶颈层进行处理,得到第三候选特征图;将第三候选特征图输入第五瓶颈层进行处理,得到第二特征图;将第二特征图输入第六瓶颈层进行处理,得到第四候选特征图;将第四候选特征图输入第七瓶颈层进行处理,得到第三特征图。其中,第七瓶颈层与第一卷积层连接,第五瓶颈层与第一拼接层连接,第三瓶颈层与第二拼接层连接。
其中,第一拼接层与第二拼接层均为concat layer,第一上采样层和第二上采样层的上采样率可基于实际情况进行设置,例如,第一上采样层和第二上采样层的上采样率均为2。第四卷积层、第五卷积层和第六卷积层包含的层级相同。例如,如图5所示,第四卷积层、第五卷积层和第六卷积层包含的层级可以包括第一卷积子层121、BatchNorm层122、LeakyRelu层123和第二卷积子层124,且第一卷积子层121与BatchNorm层122连接,BatchNorm层122与LeakyRelu层123连接,LeakyRelu层123与第二卷积子层124连接。
步骤S103、将第一目标特征图、第二目标特征图和第三目标特征图分别输入狗眼关键点检测网络进行处理,得到多个狗眼关键点组和每个狗眼关键点组的第一置信度。
示例性的,将第一目标特征图输入狗眼关键点检测网络进行处理,得到狗眼关键点检测网络的第一输出结果;将第二目标特征图输入狗眼关键点检测网络进行处理,得到狗眼关键点检测网络的第二输出结果;将第三目标特征图输入狗眼关键点检测网络进行处理,得到狗眼关键点检测网络的第三输出结果;对第一输出结果、第二输出结果和第三输出结果进行汇总,得到多个狗眼关键点组和每个狗眼关键点组的第一置信度。其中,狗眼关键点组包括至少两个狗眼关键点,且至少两个狗眼关键点包括宠物狗的左眼关键点和右眼关键点,狗眼关键点检测网络包括第七卷积层,第七卷积层的输出通道为4×64,卷积核大小为(3,3),步长为stride(1,1)。
步骤S104、将第一目标特征图、第二目标特征图和第三目标特征图分别输入狗鼻关键点检测网络进行处理,得到多个狗鼻关键点组和每个狗鼻关键点组的第二置信度。
示例性的,将第一目标特征图输入狗鼻关键点检测网络进行处理,得到狗鼻关键点检测网络的第四输出结果;将第二目标特征图输入狗鼻关键点检测网络进行处理,得到狗鼻关键点检测网络的第五输出结果;将第三目标特征图输入狗鼻关键点检测网络进行处理,得到狗鼻关键点检测网络的第六输出结果;对第四输出结果、第五输出结果和第六输出结果进行汇总,得到多个狗鼻关键点组和每个狗鼻关键点组的第二置信度。其中,狗鼻关键点组至少包括一个狗鼻关键点,狗鼻关键点检测网络包括第八卷积层,第八卷积层的输出通道数为2×64,卷积核大小为(3,3),步长为stride(1,1)。
步骤S105、将多个狗眼关键点组中第一置信度最高所对应的狗眼关键点组确定为目标狗眼关键点组。
示例性的,将多个狗眼关键点组中的第一置信度大于或等于第一置信度阈值所对应的狗眼关键点组确定为候选狗眼关键点组;根据各候选狗眼关键点组的第一置信度,计算第一平均置信度;确定第一平均置信度与各候选狗眼关键点组的第一置信度之间的第一置信度差值;将第一置信度差值最小所对应的候选狗眼关键点组确定为目标狗眼关键点组。其中,目标狗眼关键点组包括宠物狗的至少两个狗眼关键点。
示例性的,将多个狗眼关键点组中的第一置信度大于或等于第一置信度阈值所对应的狗眼关键点组确定为候选狗眼关键点组;根据各候选狗眼关键点组的坐标信息,确定第一平均坐标信息,并将第一平均坐标信息所对应的关键点组确定为目标狗眼关键点组。其中,第一置信度阈值可基于实际情况进行设置,本实施例对此不做具体限定。
例如,候选狗眼关键点组A的坐标信息可以为(x1,y1,x2,y2),即候选狗眼关键点组A中的左眼关键点的坐标为(x1,y1),且右眼关键点的坐标为(x2,y2),候选狗眼关键点组B的坐标信息为(x3,y3,x4,y4),则第一平均坐标信息为((x1+x3)/2,(y1+y3)/2,(x2+x4)/2,(y2+y4)/2),因此,将关键点((x1+x3)/2,(y1+y3)/2)和关键点((x2+x4)/2,(y2+y4)/2)确定为宠物狗的目标狗眼关键点组。
步骤S106、将多个狗鼻关键点组中第二置信度最高所对应的狗鼻关键点组确定为目标狗鼻关键点组。
示例性的,将多个狗鼻关键点组中的第二置信度大于或等于第二置信度阈值所对应的狗鼻关键点组确定为候选狗鼻关键点组;根据各候选狗鼻关键点组的第二置信度,计算第二平均置信度;确定第二平均置信度与各候选狗鼻关键点组的第二置信度之间的第二置信度差值;将第二置信度差值最小所对应的候选狗鼻关键点组确定为目标狗鼻关键点组。其中,目标狗鼻关键点组包括宠物狗的至少一个狗鼻关键点。
示例性的,将多个狗鼻关键点组中的第二置信度大于或等于第二置信度阈值所对应的狗鼻关键点组确定为候选狗鼻关键点组;根据各候选狗鼻关键点组的坐标信息,确定第二平均坐标信息,并将第二平均坐标信息所对应的关键点组确定为目标狗鼻关键点组。其中,第二置信度阈值可基于实际情况进行设置,本实施例对此不做具体限定。
例如,候选狗鼻关键点组A包括一个狗鼻关键点,且该狗鼻关键点的坐标信息为(x5,y5),候选狗鼻关键点B包括一个狗鼻关键点,且该狗鼻关键点的坐标信息为(x6,y6),则第二平均坐标信息为((x5+x6)/2,(y5+y6)/2),因此,将关键点((x5+x6)/2,(y5+y6)/2)确定为宠物狗的目标狗鼻关键点。
在一实施例中,目标关键点检测模型还包括狗脸识别网络。示例性的,将第一目标特征图、第二目标特征图和第三目标特征图分别输入狗脸识别网络,得到狗脸框的多个位置点组和每个位置点组的第三置信度;根据第三置信度和多个位置点组,确定狗脸框的目标位置点组,并从宠物狗图像中框选目标位置点组对应的狗脸区域。其中,狗脸框的位置点组包括至少两个位置点,且至少两个位置点互为对角位置点。例如,狗脸框的位置点组包括狗脸框的左上角位置点和右下角位置点,狗脸识别网络包括第九卷积层,第九卷积层的输出通道数可以为2×64,卷积核大小为(3,3),步长为stride(1,1)。
例如,根据目标狗眼关键点组和目标狗鼻关键点组可以在宠物狗图像中标记狗脸关键点。如图6所示,宠物狗图像中标记有三个狗脸关键点,分别是宠物狗的左眼关键点、右眼关键点和狗鼻关键点,且狗脸框10是由位置点11和位置点12框选确定的。
示例性的,将狗脸框的多个位置点组中第三置信度最高所对应的位置点组确定为狗脸框的目标位置点组。或者,将狗脸框的多个位置点组中的第三置信度大于或等于第三置信度阈值的位置点组确定为候选位置点组;根据每个候选位置点组的第三置信度,计算第三平均置信度,并确定第三平均置信度与每个候选位置点组的第三置信度之间的第三置信度差值;将第三置信度差值最小所对应的候选位置点组确定为宠物狗的目标位置点组。其中,第三置信度阈值可基于实际情况进行设置,本实施例对此不做具体限定。
示例性的,根据多个候选位置点组中的每个候选位置点组的坐标信息,确定第三平均坐标信息;根据第三平均坐标信息,确定狗脸框的目标位置点组。例如,候选位置点组A的坐标信息可以为(x7,y7,x8,y8),即狗脸框A的左上角位置点的坐标为(x7,y7),狗脸框A的右下角位置点的坐标为(x8,y8),候选位置点组B的坐标信息为(x9,y9,x10,y10),即狗脸框B的左上角位置点的坐标为(x9,y9),狗脸框B的右下角位置点的坐标为(x10,y10)则第三平均坐标信息为((x7+x9)/2,(y7+y9)/2,(x8+x10)/2,(y8+y10)/2),因此,将位置点((x7+x9)/2,(y7+y9)/2)和位置点((x8+x10)/2,(y8+y10)/2)确定为狗脸框的目标位置点组。
在一实施例中,从样本数据集中获取样本数据,其中,样本数据包括宠物狗的样本图像、第一狗眼关键点组和第一狗鼻关键点组;将样本图像输入待训练的狗脸关键点检测模型,得到预测狗脸框、第二狗眼关键点组和第二狗鼻关键点组;根据第一狗眼关键点组、第一狗鼻关键点组、预测狗脸框、第二狗眼关键点组和第二狗鼻关键点组,确定模型损失值;根据模型损失值确定狗脸关键点检测模型是否收敛,若狗脸关键点检测模型未收敛,则更新狗脸关键点检测模型的参数;返回执行从样本数据集中获取样本数据的步骤,直至狗脸关键点检测模型收敛,得到目标关键点检测模型。
示例性的,确定模型损失值是否大于预设的损失值阈值,若该模型损失值大于损失值阈值,则确定狗脸关键点检测模型收敛,若该模型损失值小于或等于损失值阈值,则确定狗脸关键点检测模型未收敛。其中,损失值阈值可基于实际情况进行设置,本实施例对此不做具体限定。
示例性的,判断样本图像中的预测狗脸框所对应的区域是否包含狗脸,并根据判断结果确定第一损失值;根据第一狗眼关键点组和第二狗眼关键点组,确定第二损失值;根据第一狗鼻关键点组和第二狗鼻关键点组,确定第三损失值;对第一损失值、第二损失值、第三损失值和预设损失值进行加权求和,得到模型损失值。其中,若预测狗脸框中包含狗脸,则第一损失值为1,若预测狗脸框中不包含狗脸,则第一损失值为0。
示例性的,对第一损失值、第二损失值、第三损失值和预设损失值进行加权求和,得到模型损失值的方式可以为:获取第一加权系数、第二加权系数、第三加权系数和第四加权系数;对第一加权系数与第一损失值进行乘法运算,得到第一加权损失值;对第二加权系数和第二损失值进行乘法运算,得到第二加权损失值;对第三加权系数和第三损失值进行乘法运算,得到第三加权损失值,对第四加权系数与预设位置损失值进行乘法运算,得到第四加权损失值;累计第一加权损失值、第二加权损失值、第三加权损失值和第四加权损失值,得到模型损失值。其中,第一加权系数、第二加权系数、第三加权系数和第四加权系数可基于实际情况进行设置,本实施例对此不做具体限定。例如,第一加权系数为320,第二加权系数为0.01,第三加权系数为0.03,第四加权系数为3.5。
示例性的,获取第一损失函数,并基于第一损失函数,根据第一狗眼关键点组和第二狗眼关键点组,确定第二损失值。其中,第一损失函数可以为:
其中,ω1=1,ε1=2,C1是常数项,N1为狗眼关键点组中的狗眼关键点的总个数,xi为第一狗眼关键点组中的第i个狗眼关键点,为第二狗眼关键点组中的第i个狗眼关键点。
示例性的,获取第二损失函数,并基于第二损失函数,根据第一狗鼻关键点组和第二狗鼻关键点组,确定第三损失值。其中,第二损失函数可以为:
其中,ω2=1,ε2=2,C2是常数项,N2为狗鼻关键点组中的狗鼻关键点的总个数,yj为第一狗鼻关键点组中的第j个狗鼻关键点,为第二狗鼻关键点组中的第j个狗鼻关键点。
上述实施例提供的狗脸关键点检测方法,通过提取分辨率不同的第一目标特征图、第二目标特征图和第三目标特征图,然后通过狗眼关键点检测网络可以将分辨率不同的第一目标特征图、第二目标特征图和第三目标特征图进行融合,以准确地确定不同尺寸的宠物狗的多个狗眼关键点组和每个狗眼关键点组的第一置信度,同时通过狗鼻关键点检测网络可以将分辨率不同的第一目标特征图、第二目标特征图和第三目标特征图进行融合,以准确地确定不同尺寸的宠物狗的多个狗鼻关键点组和每个狗鼻关键点组的第二置信度,最后将第一置信度最高所对应的狗眼关键点组确定为目标狗眼关键点组,并将第二置信度最高所对应的狗鼻关键点组确定为目标狗鼻关键点组,从而可以将狗脸关键点检测拆分为狗眼关键点检测与狗鼻关键点组检测,能够更好地检测狗脸关键点,极大地提高了狗脸关键点的检测准确性。
请参阅图7,图7是本申请实施例提供的一种狗脸关键点检测装置的示意性框图。
如图7所示,该狗脸关键点检测装置400,包括:
获取模块410,用于获取待检测的宠物狗图像,并调用目标关键点检测模型,所述目标关键点检测模型包括特征提取网络、狗眼关键点检测网络和狗鼻关键点检测网络;
特征提取模块420,用于将所述宠物狗图像输入所述特征提取网络进行特征提取,得到分辨率不同的第一目标特征图、第二目标特征图和第三目标特征图;
狗眼关键点检测模块430,用于将所述第一目标特征图、所述第二目标特征图和所述第三目标特征图分别输入所述狗眼关键点检测网络进行处理,得到多个狗眼关键点组和每个所述狗眼关键点组的第一置信度;
狗鼻关键点组检测模块440,用于将所述第一目标特征图、所述第二目标特征图和所述第三目标特征图分别输入所述狗鼻关键点检测网络进行处理,得到多个狗鼻关键点组和每个所述狗鼻关键点组的第二置信度;
确定模块450,用于将多个所述狗眼关键点组中所述第一置信度最高所对应的所述狗眼关键点组确定为目标狗眼关键点组;
所述确定模块450,还用于将多个所述狗鼻关键点组中所述第二置信度最高所对应的所述狗鼻关键点组确定为目标狗鼻关键点组。
在一实施例中,所述特征提取网络包括特征提取子网络、第一卷积层、第一上采样层、第一拼接层、第二卷积层、第二拼接层、第二上采样层、第三卷积层、第四卷积层、第五卷积层和第六卷积层,所述特征提取模块420还用于:
将所述宠物狗图像输入所述特征提取子网络,得到分辨率不同的第一特征图、第二特征图和第三特征图;
将所述第一特征图输入所述第一卷积层进行卷积,得到第四特征图,将所述第四特征图输入所述第四卷积层进行卷积,得到第一目标特征图;
将所述第四特征图输入所述第一上采样层进行上采样,得到第五特征图;
将所述第二特征图和所述第五特征图输入所述第一拼接层进行拼接,得到第一拼接特征图;
将所述第一拼接特征图输入所述第二卷积层进行卷积,得到第六特征图,将所述第六特征图输入所述第五卷积层进行卷积,得到第二目标特征图;
将所述第六特征图输入所述第二上采样层进行上采样,得到第七特征图;
将所述第三特征图与所述第七特征图输入所述第二拼接层进行拼接,得到第二拼接特征图;
将所述第二拼接特征图输入所述第三卷积层进行卷积,得到第八特征图,将所述第八特征图输入所述第六卷积层进行卷积,得到第三目标特征图。
在一实施例中,所述确定模块450还用于:
将多个所述狗眼关键点组中的所述第一置信度大于或等于第一置信度阈值所对应的所述狗眼关键点组确定为候选狗眼关键点组;
根据各所述候选狗眼关键点组的所述第一置信度,计算第一平均置信度;
确定所述第一平均置信度与各所述候选狗眼关键点组的所述第一置信度之间的第一置信度差值;
将所述第一置信度差值最小所对应的所述候选狗眼关键点组确定为目标狗眼关键点组。
在一实施例中,所述目标关键点检测模型还包括狗脸识别网络,所述狗脸关键点检测装置400还包括:
狗脸识别模块,用于将所述第一目标特征图、第二目标特征图和第三目标特征图分别输入所述狗脸识别网络,得到狗脸框的多个位置点组和每个位置点组的第三置信度;
所述确定模块450,还用于将多个所述位置点组中的所述第三置信度最高所对应的所述位置点组确定为狗脸框的目标位置点组,并从所述宠物狗图像中框选所述目标位置点组对应的狗脸区域。
在一实施例中,所述狗脸关键点检测装置400还包括模型训练模块,所述模型训练模块用于:
从样本数据集中获取样本数据,其中,所述样本数据包括宠物狗的样本图像、第一狗眼关键点组和第一狗鼻关键点组;
将所述样本图像输入待训练的狗脸关键点检测模型,得到预测狗脸框、第二狗眼关键点组和第二狗鼻关键点组;
根据所述第一狗眼关键点组、所述第一狗鼻关键点组、所述预测狗脸框、所述第二狗眼关键点组和所述第二狗鼻关键点组,确定模型损失值;
根据所述模型损失值确定所述狗脸关键点检测模型是否收敛,若所述狗脸关键点检测模型未收敛,则更新所述狗脸关键点检测模型的参数;
返回执行所述从样本数据集中获取样本数据的步骤,直至所述狗脸关键点检测模型收敛,得到所述目标关键点检测模型。
在一实施例中,所述模型训练模块还用于:
判断所述样本图像中的所述预测狗脸框所对应的区域是否包含狗脸,并根据判断结果确定第一损失值;
根据所述第一狗眼关键点组和所述第二狗眼关键点组,确定第二损失值;
根据所述第一狗鼻关键点组和所述第二狗鼻关键点组,确定第三损失值;
对所述第一损失值、所述第二损失值、所述第三损失值和预设损失值进行加权求和,得到模型损失值。
在一实施例中,所述模型训练模块还用于:
获取第一损失函数,其中,所述第一损失函数为:
ω1=1,ε1=2,C1是常数项,
N1为狗眼关键点组中的狗眼关键点的总个数,xi为所述第一狗眼关键点组中的第i个狗眼关键点,为所述第二狗眼关键点组中的第i个狗眼关键点;
基于所述第一损失函数,根据所述第一狗眼关键点组和所述第二狗眼关键点组,确定第二损失值。
需要说明的是,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的装置和各模块及单元的具体工作过程,可以参考前述狗脸关键点检测方法实施例中的对应过程,在此不再赘述。
上述实施例提供的装置可以实现为一种计算机程序的形式,该计算机程序可以在如图8所示的计算机设备上运行。
请参阅图8,图8是本申请实施例提供的一种计算机设备的结构示意性框图。该计算机设备可以为服务器或终端设备。
如图8所示,该计算机设备包括通过系统总线连接的处理器、存储器和网络接口,其中,存储器可以包括存储介质和内存储器。
存储介质可存储操作系统和计算机程序。该计算机程序包括程序指令,该程序指令被执行时,可使得处理器执行任意一种狗脸关键点检测方法。
处理器用于提供计算和控制能力,支撑整个计算机设备的运行。
该网络接口用于进行网络通信,如发送分配的任务等。本领域技术人员可以理解,图8中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
应当理解的是,处理器可以是中央处理单元(Central Processing Unit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
其中,在一实施例中,所述处理器用于运行存储在存储器中的计算机程序,以实现如下步骤:
获取待检测的宠物狗图像,并调用目标关键点检测模型,所述目标关键点检测模型包括特征提取网络、狗眼关键点检测网络和狗鼻关键点检测网络;
将所述宠物狗图像输入所述特征提取网络进行特征提取,得到分辨率不同的第一目标特征图、第二目标特征图和第三目标特征图;
将所述第一目标特征图、所述第二目标特征图和所述第三目标特征图分别输入所述狗眼关键点检测网络进行处理,得到多个狗眼关键点组和每个所述狗眼关键点组的第一置信度;
将所述第一目标特征图、所述第二目标特征图和所述第三目标特征图分别输入所述狗鼻关键点检测网络进行处理,得到多个狗鼻关键点组和每个所述狗鼻关键点组的第二置信度;
将多个所述狗眼关键点组中所述第一置信度最高所对应的所述狗眼关键点组确定为目标狗眼关键点组;
将多个所述狗鼻关键点组中所述第二置信度最高所对应的所述狗鼻关键点组确定为目标狗鼻关键点组。
在一实施例中,所述特征提取网络包括特征提取子网络、第一卷积层、第一上采样层、第一拼接层、第二卷积层、第二拼接层、第二上采样层、第三卷积层、第四卷积层、第五卷积层和第六卷积层,所述处理器在实现将所述宠物狗图像输入所述特征提取网络进行特征提取,得到第一目标特征图、第二目标特征图和第三目标特征图时,用于实现:
将所述宠物狗图像输入所述特征提取子网络,得到分辨率不同的第一特征图、第二特征图和第三特征图;
将所述第一特征图输入所述第一卷积层进行卷积,得到第四特征图,将所述第四特征图输入所述第四卷积层进行卷积,得到第一目标特征图;
将所述第四特征图输入所述第一上采样层进行上采样,得到第五特征图;
将所述第二特征图和所述第五特征图输入所述第一拼接层进行拼接,得到第一拼接特征图;
将所述第一拼接特征图输入所述第二卷积层进行卷积,得到第六特征图,将所述第六特征图输入所述第五卷积层进行卷积,得到第二目标特征图;
将所述第六特征图输入所述第二上采样层进行上采样,得到第七特征图;
将所述第三特征图与所述第七特征图输入所述第二拼接层进行拼接,得到第二拼接特征图;
将所述第二拼接特征图输入所述第三卷积层进行卷积,得到第八特征图,将所述第八特征图输入所述第六卷积层进行卷积,得到第三目标特征图。
在一实施例中,所述处理器还用于实现以下步骤:
将多个所述狗眼关键点组中的所述第一置信度大于或等于第一置信度阈值所对应的所述狗眼关键点组确定为候选狗眼关键点组;
根据各所述候选狗眼关键点组的所述第一置信度,计算第一平均置信度;
确定所述第一平均置信度与各所述候选狗眼关键点组的所述第一置信度之间的第一置信度差值;
将所述第一置信度差值最小所对应的所述候选狗眼关键点组确定为目标狗眼关键点组。
其中,在另一实施例中,所述处理器用于运行存储在存储器中的计算机程序,以实现如下步骤:
将所述第一目标特征图、第二目标特征图和第三目标特征图分别输入所述狗脸识别网络,得到狗脸框的多个位置点组和每个位置点组的第三置信度;
将多个所述位置点组中的所述第三置信度最高所对应的所述位置点组确定为狗脸框的目标位置点组;
从所述宠物狗图像中框选所述目标位置点组对应的狗脸区域。
在一实施例中,所述处理器在实现获取待检测的宠物狗图像,并调用目标关键点检测模型之前,还用于实现:
从样本数据集中获取样本数据,其中,所述样本数据包括宠物狗的样本图像、第一狗眼关键点组和第一狗鼻关键点组;
将所述样本图像输入待训练的狗脸关键点检测模型,得到预测狗脸框、第二狗眼关键点组和第二狗鼻关键点组;
根据所述第一狗眼关键点组、所述第一狗鼻关键点组、所述预测狗脸框、所述第二狗眼关键点组和所述第二狗鼻关键点组,确定模型损失值;
根据所述模型损失值确定所述狗脸关键点检测模型是否收敛,若所述狗脸关键点检测模型未收敛,则更新所述狗脸关键点检测模型的参数;
返回执行所述从样本数据集中获取样本数据的步骤,直至所述狗脸关键点检测模型收敛,得到所述目标关键点检测模型。
在一实施例中,所述处理器在实现根据所述第一狗眼关键点组、所述第一狗鼻关键点组、所述预测狗脸框、所述第二狗眼关键点组和所述第二狗鼻关键点组,确定模型损失值时,用于实现:
判断所述样本图像中的所述预测狗脸框所对应的区域是否包含狗脸,并根据判断结果确定第一损失值;
根据所述第一狗眼关键点组和所述第二狗眼关键点组,确定第二损失值;
根据所述第一狗鼻关键点组和所述第二狗鼻关键点组,确定第三损失值;
对所述第一损失值、所述第二损失值、所述第三损失值和预设损失值进行加权求和,得到模型损失值。
在一实施例中,所述处理器在实现根据所述第一狗眼关键点组和所述第二狗眼关键点组,确定第二损失值时,用于实现:
获取第一损失函数,其中,所述第一损失函数为:
ω1=1,ε1=2,C1是常数项,
N1为狗眼关键点组中的狗眼关键点的总个数,xi为所述第一狗眼关键点组中的第i个狗眼关键点,为所述第二狗眼关键点组中的第i个狗眼关键点;
基于所述第一损失函数,根据所述第一狗眼关键点组和所述第二狗眼关键点组,确定第二损失值。
需要说明的是,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的计算机设备的具体工作过程,可以参考前述狗脸关键点检测方法实施例中的对应过程,在此不再赘述。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。
本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序中包括程序指令,所述程序指令被执行时所实现的方法可参阅本申请狗脸关键点检测方法的各个实施例。
其中,所述计算机可读存储介质可以是易失性的,也可以是非易失性的。所述计算机可读存储介质可以是前述实施例所述的计算机设备的内部存储单元,例如所述计算机设备的硬盘或内存。所述计算机可读存储介质也可以是所述计算机设备的外部存储设备,例如所述计算机设备上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。
进一步地,所述计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
本申请所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (9)

1.一种基于人工智能的狗脸关键点检测方法,其特征在于,包括:
获取待检测的宠物狗图像,并调用目标关键点检测模型,所述目标关键点检测模型包括特征提取网络、狗眼关键点检测网络和狗鼻关键点检测网络;
将所述宠物狗图像输入所述特征提取网络进行特征提取,得到分辨率不同的第一目标特征图、第二目标特征图和第三目标特征图;
将所述第一目标特征图、所述第二目标特征图和所述第三目标特征图分别输入所述狗眼关键点检测网络进行处理,得到多个狗眼关键点组和每个所述狗眼关键点组的第一置信度,所述狗眼关键点组包括至少两个狗眼关键点,且所述至少两个狗眼关键点包括宠物狗的左眼关键点和右眼关键点;
将所述第一目标特征图、所述第二目标特征图和所述第三目标特征图分别输入所述狗鼻关键点检测网络进行处理,得到多个狗鼻关键点组和每个所述狗鼻关键点组的第二置信度,所述狗鼻关键点组至少包括一个狗鼻关键点;
将多个所述狗眼关键点组中所述第一置信度最高所对应的所述狗眼关键点组确定为目标狗眼关键点组;
将多个所述狗鼻关键点组中所述第二置信度最高所对应的所述狗鼻关键点组确定为目标狗鼻关键点组;
其中,所述特征提取网络包括特征提取子网络、第一卷积层、第一上采样层、第一拼接层、第二卷积层、第二拼接层、第二上采样层、第三卷积层、第四卷积层、第五卷积层和第六卷积层,所述将所述宠物狗图像输入所述特征提取网络进行特征提取,得到第一目标特征图、第二目标特征图和第三目标特征图,包括:
将所述宠物狗图像输入所述特征提取子网络,得到分辨率不同的第一特征图、第二特征图和第三特征图;
将所述第一特征图输入所述第一卷积层进行卷积,得到第四特征图,将所述第四特征图输入所述第四卷积层进行卷积,得到第一目标特征图;
将所述第四特征图输入所述第一上采样层进行上采样,得到第五特征图;
将所述第二特征图和所述第五特征图输入所述第一拼接层进行拼接,得到第一拼接特征图;
将所述第一拼接特征图输入所述第二卷积层进行卷积,得到第六特征图,将所述第六特征图输入所述第五卷积层进行卷积,得到第二目标特征图;
将所述第六特征图输入所述第二上采样层进行上采样,得到第七特征图;
将所述第三特征图与所述第七特征图输入所述第二拼接层进行拼接,得到第二拼接特征图;
将所述第二拼接特征图输入所述第三卷积层进行卷积,得到第八特征图,将所述第八特征图输入所述第六卷积层进行卷积,得到第三目标特征图。
2.根据权利要求1所述的狗脸关键点检测方法,其特征在于,所述方法还包括:
将多个所述狗眼关键点组中的所述第一置信度大于或等于第一置信度阈值所对应的所述狗眼关键点组确定为候选狗眼关键点组;
根据各所述候选狗眼关键点组的所述第一置信度,计算第一平均置信度;
确定所述第一平均置信度与各所述候选狗眼关键点组的所述第一置信度之间的第一置信度差值;
将所述第一置信度差值最小所对应的所述候选狗眼关键点组确定为目标狗眼关键点组。
3.根据权利要求1所述的狗脸关键点检测方法,其特征在于,所述目标关键点检测模型还包括狗脸识别网络,所述方法还包括:
将所述第一目标特征图、第二目标特征图和第三目标特征图分别输入所述狗脸识别网络,得到狗脸框的多个位置点组和每个位置点组的第三置信度;
将多个所述位置点组中的所述第三置信度最高所对应的所述位置点组确定为狗脸框的目标位置点组;
从所述宠物狗图像中框选所述目标位置点组对应的狗脸区域。
4.根据权利要求1-3中任一项所述的狗脸关键点检测方法,其特征在于,所述获取待检测的宠物狗图像,并调用目标关键点检测模型之前,还包括:
从样本数据集中获取样本数据,其中,所述样本数据包括宠物狗的样本图像、第一狗眼关键点组和第一狗鼻关键点组;
将所述样本图像输入待训练的狗脸关键点检测模型,得到预测狗脸框、第二狗眼关键点组和第二狗鼻关键点组;
根据所述第一狗眼关键点组、所述第一狗鼻关键点组、所述预测狗脸框、所述第二狗眼关键点组和所述第二狗鼻关键点组,确定模型损失值;
根据所述模型损失值确定所述狗脸关键点检测模型是否收敛,若所述狗脸关键点检测模型未收敛,则更新所述狗脸关键点检测模型的参数;
返回执行所述从样本数据集中获取样本数据的步骤,直至所述狗脸关键点检测模型收敛,得到所述目标关键点检测模型。
5.根据权利要求4所述的狗脸关键点检测方法,其特征在于,所述根据所述第一狗眼关键点组、所述第一狗鼻关键点组、所述预测狗脸框、所述第二狗眼关键点组和所述第二狗鼻关键点组,确定模型损失值,包括:
判断所述样本图像中的所述预测狗脸框所对应的区域是否包含狗脸,并根据判断结果确定第一损失值;
根据所述第一狗眼关键点组和所述第二狗眼关键点组,确定第二损失值;
根据所述第一狗鼻关键点组和所述第二狗鼻关键点组,确定第三损失值;
对所述第一损失值、所述第二损失值、所述第三损失值和预设损失值进行加权求和,得到模型损失值。
6.根据权利要求5所述的狗脸关键点检测方法,其特征在于,所述根据所述第一狗眼关键点组和所述第二狗眼关键点组,确定第二损失值,包括:
获取第一损失函数,其中,所述第一损失函数为:
,/>,/>,C1是常数项,N1为狗眼关键点组中的狗眼关键点的总个数,/>为所述第一狗眼关键点组中的第i个狗眼关键点,/>为所述第二狗眼关键点组中的第i个狗眼关键点;
基于所述第一损失函数,根据所述第一狗眼关键点组和所述第二狗眼关键点组,确定第二损失值。
7.一种狗脸关键点检测装置,其特征在于,所述狗脸关键点检测装置包括:
获取模块,用于获取待检测的宠物狗图像,并调用目标关键点检测模型,所述目标关键点检测模型包括特征提取网络、狗眼关键点检测网络和狗鼻关键点检测网络;
特征提取模块,用于将所述宠物狗图像输入所述特征提取网络进行特征提取,得到分辨率不同的第一目标特征图、第二目标特征图和第三目标特征图;
狗眼关键点检测模块,用于将所述第一目标特征图、所述第二目标特征图和所述第三目标特征图分别输入所述狗眼关键点检测网络进行处理,得到多个狗眼关键点组和每个所述狗眼关键点组的第一置信度,所述狗眼关键点组包括至少两个狗眼关键点,且所述至少两个狗眼关键点包括宠物狗的左眼关键点和右眼关键点;
狗鼻关键点组检测模块,用于将所述第一目标特征图、所述第二目标特征图和所述第三目标特征图分别输入所述狗鼻关键点检测网络进行处理,得到多个狗鼻关键点组和每个所述狗鼻关键点组的第二置信度,所述狗鼻关键点组至少包括一个狗鼻关键点;
确定模块,用于将多个所述狗眼关键点组中所述第一置信度最高所对应的所述狗眼关键点组确定为目标狗眼关键点组;
所述确定模块,还用于将多个所述狗鼻关键点组中所述第二置信度最高所对应的所述狗鼻关键点组确定为目标狗鼻关键点组;
其中,所述特征提取网络包括特征提取子网络、第一卷积层、第一上采样层、第一拼接层、第二卷积层、第二拼接层、第二上采样层、第三卷积层、第四卷积层、第五卷积层和第六卷积层,所述特征提取模块还用于:
将所述宠物狗图像输入所述特征提取子网络,得到分辨率不同的第一特征图、第二特征图和第三特征图;
将所述第一特征图输入所述第一卷积层进行卷积,得到第四特征图,将所述第四特征图输入所述第四卷积层进行卷积,得到第一目标特征图;
将所述第四特征图输入所述第一上采样层进行上采样,得到第五特征图;
将所述第二特征图和所述第五特征图输入所述第一拼接层进行拼接,得到第一拼接特征图;
将所述第一拼接特征图输入所述第二卷积层进行卷积,得到第六特征图,将所述第六特征图输入所述第五卷积层进行卷积,得到第二目标特征图;
将所述第六特征图输入所述第二上采样层进行上采样,得到第七特征图;
将所述第三特征图与所述第七特征图输入所述第二拼接层进行拼接,得到第二拼接特征图;
将所述第二拼接特征图输入所述第三卷积层进行卷积,得到第八特征图,将所述第八特征图输入所述第六卷积层进行卷积,得到第三目标特征图。
8.一种计算机设备,其特征在于,所述计算机设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的计算机程序,其中所述计算机程序被所述处理器执行时,实现如权利要求1至6中任一项所述的狗脸关键点检测方法的步骤。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,其中所述计算机程序被处理器执行时,实现如权利要求1至6中任一项所述的狗脸关键点检测方法的步骤。
CN202110970713.0A 2021-08-23 2021-08-23 基于人工智能的狗脸关键点检测方法、装置、设备及介质 Active CN113657321B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110970713.0A CN113657321B (zh) 2021-08-23 2021-08-23 基于人工智能的狗脸关键点检测方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110970713.0A CN113657321B (zh) 2021-08-23 2021-08-23 基于人工智能的狗脸关键点检测方法、装置、设备及介质

Publications (2)

Publication Number Publication Date
CN113657321A CN113657321A (zh) 2021-11-16
CN113657321B true CN113657321B (zh) 2024-04-26

Family

ID=78481613

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110970713.0A Active CN113657321B (zh) 2021-08-23 2021-08-23 基于人工智能的狗脸关键点检测方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN113657321B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115578753B (zh) * 2022-09-23 2023-05-05 中国科学院半导体研究所 人体关键点检测方法、装置、电子设备及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108121952A (zh) * 2017-12-12 2018-06-05 北京小米移动软件有限公司 人脸关键点定位方法、装置、设备及存储介质
CN111814744A (zh) * 2020-07-30 2020-10-23 河南威虎智能科技有限公司 一种人脸检测方法、装置、电子设备和计算机存储介质
CN112085088A (zh) * 2020-09-03 2020-12-15 腾讯科技(深圳)有限公司 图像处理方法、装置、设备及存储介质
CN112380981A (zh) * 2020-11-12 2021-02-19 平安科技(深圳)有限公司 人脸关键点的检测方法、装置、存储介质及电子设备
CN112464809A (zh) * 2020-11-26 2021-03-09 北京奇艺世纪科技有限公司 一种人脸关键点检测方法、装置、电子设备及存储介质
CN112560980A (zh) * 2020-12-24 2021-03-26 深圳市优必选科技股份有限公司 目标检测模型的训练方法、装置及终端设备
CN113128413A (zh) * 2021-04-22 2021-07-16 广州织点智能科技有限公司 一种人脸检测模型训练方法、人脸检测方法及其相关装置
CN113239847A (zh) * 2021-05-26 2021-08-10 电子科技大学中山学院 一种人脸检测网络的训练方法、装置、设备以及存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108121952A (zh) * 2017-12-12 2018-06-05 北京小米移动软件有限公司 人脸关键点定位方法、装置、设备及存储介质
CN111814744A (zh) * 2020-07-30 2020-10-23 河南威虎智能科技有限公司 一种人脸检测方法、装置、电子设备和计算机存储介质
CN112085088A (zh) * 2020-09-03 2020-12-15 腾讯科技(深圳)有限公司 图像处理方法、装置、设备及存储介质
CN112380981A (zh) * 2020-11-12 2021-02-19 平安科技(深圳)有限公司 人脸关键点的检测方法、装置、存储介质及电子设备
CN112464809A (zh) * 2020-11-26 2021-03-09 北京奇艺世纪科技有限公司 一种人脸关键点检测方法、装置、电子设备及存储介质
CN112560980A (zh) * 2020-12-24 2021-03-26 深圳市优必选科技股份有限公司 目标检测模型的训练方法、装置及终端设备
CN113128413A (zh) * 2021-04-22 2021-07-16 广州织点智能科技有限公司 一种人脸检测模型训练方法、人脸检测方法及其相关装置
CN113239847A (zh) * 2021-05-26 2021-08-10 电子科技大学中山学院 一种人脸检测网络的训练方法、装置、设备以及存储介质

Also Published As

Publication number Publication date
CN113657321A (zh) 2021-11-16

Similar Documents

Publication Publication Date Title
US10366313B2 (en) Activation layers for deep learning networks
KR102043938B1 (ko) 이미지 기반의 captcha 과제
CN113673439B (zh) 基于人工智能的宠物狗识别方法、装置、设备及存储介质
CN113657318B (zh) 基于人工智能的宠物分类方法、装置、设备及存储介质
CN111079570A (zh) 一种人体关键点识别方法、装置及电子设备
WO2022105125A1 (zh) 图像分割方法、装置、计算机设备及存储介质
KR101029160B1 (ko) 이미지 데이터베이스에 신규 이미지 및 이에 대한 정보를 추가하기 위한 방법, 시스템 및 컴퓨터 판독 가능한 기록 매체
CN113569754B (zh) 人脸关键点检测方法、装置、设备及计算机可读存储介质
CN111428805B (zh) 显著性物体的检测方法、模型、存储介质及电子设备
EP4320606A1 (en) Personalized biometric anti-spoofing protection using machine learning and enrollment data
CN112085088A (zh) 图像处理方法、装置、设备及存储介质
CN111310770A (zh) 目标检测方法和装置
JP2023527615A (ja) 目標対象検出モデルのトレーニング方法、目標対象検出方法、機器、電子機器、記憶媒体及びコンピュータプログラム
CN114387656B (zh) 基于人工智能的换脸方法、装置、设备及存储介质
CN112418345A (zh) 细粒度小目标快速识别的方法和装置
CN113657321B (zh) 基于人工智能的狗脸关键点检测方法、装置、设备及介质
CN113591603A (zh) 证件的验证方法、装置、电子设备及存储介质
CN116843901A (zh) 医学图像分割模型训练方法和医学图像分割方法
CN116796287A (zh) 图文理解模型的预训练方法、装置、设备及存储介质
CN113360300B (zh) 接口调用链路生成方法、装置、设备及可读存储介质
CN117058723B (zh) 掌纹识别方法、装置及存储介质
CN113822143A (zh) 文本图像的处理方法、装置、设备以及存储介质
CN111597336B (zh) 训练文本的处理方法、装置、电子设备及可读存储介质
CN113704276A (zh) 地图更新方法、装置、电子设备及计算机可读存储介质
CN112036316A (zh) 手指静脉识别方法、装置、电子设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant