CN110298291B - 基于Mask-RCNN的牛脸及牛脸关键点检测方法 - Google Patents

基于Mask-RCNN的牛脸及牛脸关键点检测方法 Download PDF

Info

Publication number
CN110298291B
CN110298291B CN201910551729.0A CN201910551729A CN110298291B CN 110298291 B CN110298291 B CN 110298291B CN 201910551729 A CN201910551729 A CN 201910551729A CN 110298291 B CN110298291 B CN 110298291B
Authority
CN
China
Prior art keywords
face
cattle
cow
network
key point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910551729.0A
Other languages
English (en)
Other versions
CN110298291A (zh
Inventor
于海业
武占东
张蕾
隋媛媛
孙志朋
任子圣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jilin University
Original Assignee
Jilin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jilin University filed Critical Jilin University
Priority to CN201910551729.0A priority Critical patent/CN110298291B/zh
Publication of CN110298291A publication Critical patent/CN110298291A/zh
Application granted granted Critical
Publication of CN110298291B publication Critical patent/CN110298291B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了基于Mask‑RCNN的牛脸及牛脸关键点检测方法,为填补牛脸及牛脸关键点同步检测的空白,基于Mask‑RCNN的牛脸及牛脸关键点检测方法的步骤:1)采集带有牛脸的图片,标记每张图片中牛脸及牛脸关键点数据:(1)从国内网络中收集牛的图片,从收集的图片中选取有牛脸的图片:a.从国内的农业节目中选取关于养牛的视频,每隔5帧截取一幅图片,从中选取有牛脸的图片;b.使用摄像机实地采集牛只的视频,每隔5帧截取一幅图片,从中选取有牛脸的图片;(2)标注图片中的每个牛脸的位置;2)设计牛脸及牛脸关键点检测网络结构;3)利用标记完成的数据训练牛脸及牛脸关键点检测网络,最终生成牛脸及牛脸关键点检测器。

Description

基于Mask-RCNN的牛脸及牛脸关键点检测方法
技术领域
本发明涉及属于数字图像处理技术领域的一种检测方法,更确切地说,本发明涉及一种基于Mask-RCNN的牛脸及牛脸关键点检测方法。
背景技术
动物身份识别可以方便生产管理、控制疾病爆发以及确立所属权,并且也满足当今消费者追踪溯源的需求以及进出口贸易的要求。
现代动物身份识别技术包括机械式的(如烙印、纹身等)、电子式的(如耳标、RFID瘤胃陶瓷标签、可植入式ID芯片等)、生物特征式的(如鼻纹印、DNA图谱、虹膜识别等)。机械式的、电子式的动物身份识别方法都具有操作难、动物福利低、造价高、丢失率高、重复利用率低等缺点。
牛脸识别技术是基于图像中牛脸部特征的差异进行区分的牛只身份识别方法。整个过程包括牛脸检测、牛脸特征点检测以及牛脸识别三个主要步骤。其中牛脸检测是目标检测的一种特例,是框出图像中的所有牛脸。牛脸特征点检测是定位出牛脸的关键区域位置点,利用这些关键点使用仿射变换将牛脸统一“摆正”,尽量去消除牛脸识别中姿势不同带来的误差。因此牛脸检测和牛脸关键点检测是牛脸识别的基础。
从2011年深度学习在语音识别中大放异彩,到2012年AlexNet(一种图片识别框架)在ImageNet(一个用于视觉对象识别软件研究的大型可视化数据库)中脱颖而出。2015年FaceNet(一种人脸识别框架)在LFW数据集上的识别率达到99.63%,已经超越人类识别人脸的水平。目前基于深度学习方法的动物身份识别研究较少,虽然有一些研究机构已经进行相关探索,但仍没有得到推广与应用。首先主要是基础工作没有做到位;任何生物特征识别的前提都是具有规定的数据库,而大部分的研究人员都是自己拥有自己的数据库,可以说相互独立。其次动物的品种很多,研究人员都是选出某一个品种来进行训练,导致每一个品种都要建数据库,操作繁琐。再次大部分研究人员应用的数据都是自己获取的,环境相同,噪声相似,导致模型的泛化性不强。
在牛脸检测方面,中国专利公告(布)号为CN108549860A,公告(布)日为2018年4月9日,发明名称为《一种基于深度神经网络的牛脸识别方法》的案子中只是提到使用通用的方法训练牛脸检测器;并且该方法稍微有些画蛇添足,是利用耳标和牛脸结合的方法识别牛脸。中国专利公告(布)号为CN107292298A,公告(布)日为2017年8月9日,发明名称为《基于卷积神经网络和分类器模型的牛脸识别方法》的案子中没有提及牛脸检测的问题,只是通过调整摄像头的视角,手动选取图像中只有一个牛脸的图片形成训练集和测试集,可想而知,该方法的通用性不强。并且以上两种方法都没有提及牛脸关键点检测问题,导致牛脸识别的准确率大幅度降低。
在牛脸关键点检测方面,中国专利公告(布)号为CN109002769A,公告(布)日为2018年6月22日,发明名称为《一种基于深度神经网络的牛脸对齐方法及系统》的案子并且没有给出关键点的数目;使用全局网络由整张图像定位所有关键点,利用欧氏距离损失函数进行回归,没有挖掘多尺度信息进行关键点的校正和调整,可以说是一个单级的牛脸关键点检测。
综上所述,现有的牛脸识别技术存在的主要问题有:
1.没有牛脸检测方法,只是利用目标检测的通用方法,这样导致牛脸检测的准确率不高,专业性不强。
2.牛脸关键点的数量没有分析,以及缺少较为准确的牛脸关键点的检测方法。
3.数据不统一,图像的噪声面不广,导致训练模型的泛化性不强。
4.多任务性不强,牛脸检测与牛脸关键点检测自立门户,都是分步进行,没有将两个任务统一完成。
发明内容
本发明所要解决的技术问题填补牛脸及牛脸关键点同步检测的空白,提供了一种基于Mask-RCNN(是一种在有效检测目标的同时输出高质量的实例分割掩码)的牛脸及牛脸关键点检测方法。
为解决上述技术问题,本发明是采用如下技术方案实现的:所述的基于Mask-RCNN的牛脸及牛脸关键点检测方法的步骤如下:
1)采集带有牛脸的图片,标记每张图片中牛脸及牛脸关键点数据;
2)设计牛脸及牛脸关键点检测网络结构;
3)利用标记完成的数据训练牛脸及牛脸关键点检测网络,最终生成牛脸及牛脸关键点检测器。
技术方案中所述的采集带有牛脸的图片,标记每张图片中牛脸及牛脸关键点数据是指:
1)从国内网络中收集牛的图片,从收集的图片中选取有牛脸的图片
(1)从国内的农业节目中选取关于养牛的视频,每隔5帧截取一幅图片,从中选取有牛脸的图片;
(2)使用摄像机实地采集牛只的视频,每隔5帧截取一幅图片,从中选取有牛脸的图片;
其中牛只的品种有中国黑白花牛、荷斯坦奶牛、娟珊牛、西门塔尔牛、西门塔尔杂交牛、红牛、黑牛、黄牛、和牛多个品种;
2)标注图片中的每个牛脸的位置
标记牛正脸时的牛脸的6个关键点,分别为左眼、右眼、左鼻孔上缘、左鼻孔下缘、右鼻孔上缘、右鼻孔下缘。
技术方案中所述的设计牛脸及牛脸关键点检测网络结构是指:
1)牛脸及牛脸关键点检测网络输入层接收用于训练检测网络的图片,即标记牛脸位置及牛脸6个关键点的彩色RGB图片,预处理将尺寸调整为1024*1024,经过改进的深度可分离卷积的VGGNet与FPN网络耦合的网络进行不同尺度的特征提取;
2)提取到的特征图对每个点设定预定的ROI即感兴趣区域,将获得的多个ROI输送到RPN网络进行候选区域筛选,将筛选出的候选区域映射回原图尺度;
3)利用RoIAlign层对每个候选出的ROI提取固定尺寸的特征图;
4)最后对固定尺寸的特征图进行牛脸边框回归、牛脸关键点回归、目标分类以及牛脸掩膜输出。
技术方案中所述的深度可分离卷积的VGGNet与FPN网络耦合的网络由两大部分组成:
(1)一部分为深度可分离卷积的VGGNet网络进行特征提取下采样,其结构采用原有的VGGNet16网络卷积基结构;
改进的VGGNet网络中使用深度可分离卷积提取特征,共计进行13次深度可分离卷积,卷积核的尺寸为3*3,通道数逐渐从64增加到512;池化都选用最大池化操做;进行5次下采样,下采样的频率2;
(2)另一部分为FPN网络进行特征提取上采样
FPN网络采用的最邻近上采样,采样频率为2。
技术方案中所述的利用标记完成的数据训练牛脸及牛脸关键点检测网络,最终生成牛脸及牛脸关键点检测器是指:
利用采集的数据训练牛脸及牛脸关键点检测网络,以牛脸及牛脸关键点检测网络的预测输出与真实输出的误差收敛为目标,即通过最小化RPN网络中的损失LR与牛脸及牛脸关键点检测网络的总损失L,训练该网络;
将数据分为两类,其中一类为只标记牛脸的数据集,另一类为即标记牛脸也标记牛脸关键点数据集;
1)先利用只标记牛脸的数据集训练网络;
2)然后再利用即标记牛脸也标记牛脸关键点数据集训练网络,如果只用正脸训练网络,会导致网络的泛化性不强;
所述的牛脸及牛脸关键点检测网络的预测输出与真实输出的误差分为四部分:
牛脸边框回归损失Lbox:Smooth L1损失;
目标分类损失Lclass:Softmax交叉熵损失;
牛脸关键点回归损失Lkpoint:均方误差损失;
牛脸掩膜输出损失Lmask:平均二值交叉熵损失;
总损失L=Lbox+Lclass+Lkpoint+Lmask
与现有技术相比本发明的有益效果是:
1.本发明所述的一种基于Mask-RCNN的牛脸及牛脸关键点检测方法采集的图片样本包括牛的种类较全,涵盖了常见牛的品种,这样训练出来的网络能更好的适应不同牛品种的牛脸及牛脸关键点检测,普适性较强;样本的来源较广,通过网络爬取、网络视频截取以及实地采样,丰富样本的属性,不同拍摄环境的图片可以使牛脸及牛脸关键点检测器的泛化性较强。
2.本发明所述的一种基于Mask-RCNN的牛脸及牛脸关键点检测方法首次提出针对牛脸的6个关键点进行提取,分别为左眼、右眼、左鼻孔上缘、左鼻孔下缘、右鼻孔上缘、右鼻孔下缘,这6个关键点最具有代表性,通过仿射变换,更容易进行牛脸对齐,解决不同拍摄角度的牛脸姿态多样性问题,从而提高牛脸识别的准确率。
3、本发明所述的一种基于Mask-RCNN的牛脸及牛脸关键点检测方法提出深度可分离卷积VGGNet模型(2014年由牛津大学计算机视觉组合和GoogleDeepMind公司研究员一起研发的深度卷积神经网络)与FPN(特征金字塔网络)的耦合特征提取网络,原有的Mask-RCNN中的特征提取网络为Resnet50(2015年由微软研究院提出的残差网络)或Resnet101与FPN结合,仅仅ResNet50当去掉最后的全连接层时训练的参数有2千万左右,而改进型深度可分离卷积VGGNet的训练参数大概只有2百万左右,二者相比减小了一个数量级,改进后的网络更加轻量、训练速度更快。
4、本发明所述的一种基于Mask-RCNN的牛脸及牛脸关键点检测方法利用一个端到端的网络完成牛脸检测与牛脸关键点检测两个任务,仅仅通过两个步骤就可以完成牛脸识别,减少牛脸识别的基础工作,并且使牛脸识别的准确率大大提高。
5、本发明所述的一种基于Mask-RCNN的牛脸及牛脸关键点检测方法在牛脸关键点检测时,同时进行多个任务的学习,这些任务包括:牛脸边框回归、牛脸掩膜输出、目标分类,使用这些辅助输出帮助更好的定位关键点。
6、本发明所述的一种基于Mask-RCNN的牛脸及牛脸关键点检测方法中牛脸关键点检测同样使用多尺度特征进行预测,低层特征语义信息较少,但目标位置准确,高层特征语义信息丰富,但目标位置比较粗略,因此采用低层特征高分辨率和高层特征的高语义信息,通过融合不同层的特征优化预测牛脸关键点的准确率。
附图说明
下面结合附图对本发明作进一步的说明:
图1为本发明所述的基于Mask-RCNN的牛脸及牛脸关键点检测方法的流程框图;
图2为本发明所述的基于Mask-RCNN的牛脸及牛脸关键点检测方法中的检测网络设计方法框图;
图3为本发明所述的基于Mask-RCNN的牛脸及牛脸关键点检测方法中深度可分离卷积VGGNet与FPN耦合的特征提取网络的结构框图;
图4为本发明所述的基于Mask-RCNN的牛脸及牛脸关键点检测方法中的网络输出层的结构框图;
图5为本发明所述的基于Mask-RCNN的牛脸及牛脸关键点检测方法中的牛脸及牛脸关键点的标记示意图。
具体实施方式
下面结合附图对本发明作详细的描述:
本发明所述的一种基于Mask-RCNN的牛脸及牛脸关键点检测方法包括步骤如下:
1.采集带有牛脸的图片,标记每张图片中牛脸及牛脸关键点数据
1)从国内网络中收集牛的图片,从收集的图片中选取有牛脸的图片
(1)从国内的农业节目中选取关于养牛的视频,每隔5帧截取一幅图片,从中选取有牛脸的图片;
(2)使用摄像机实地采集牛只的视频,每隔5帧截取一幅图片,从中选取有牛脸的图片;
其中牛只的品种有中国黑白花牛、荷斯坦奶牛、娟珊牛、西门塔尔牛、西门塔尔杂交牛、红牛、黑牛、黄牛、和牛等多个品种。
2)标注图片中的每个牛脸的位置
标记牛正脸时的牛脸的6个关键点,分别为左眼、右眼、左鼻孔上缘、左鼻孔下缘、右鼻孔上缘、右鼻孔下缘;
2.设计牛脸及牛脸关键点检测网络结构
1)牛脸及牛脸关键点检测网络输入层接收用于训练检测网络的图片,即标记牛脸位置及牛脸6个关键点的彩色RGB图片,预处理将尺寸调整为1024*1024,经过改进的深度可分离卷积的VGGNet与FPN网络耦合的网络进行不同尺度的特征提取;
所述的深度可分离卷积的VGGNet与FPN网络耦合的网络由两大部分组成:
(1)一部分为深度可分离卷积的VGGNet网络进行特征提取下采样,其结构采用原有的VGGNet16网络卷积基结构;
改进的VGGNet网络中使用深度可分离卷积提取特征,共计进行13次深度可分离卷积,卷积核的尺寸为3*3,通道数逐渐从64增加到512;池化都选用最大池化操做;进行5次下采样,下采样的频率2;
(2)另一部分为FPN网络进行特征提取上采样
FPN网络采用的最邻近上采样,采样频率为2;
2)提取到的特征图对每个点设定预定的ROI(感兴趣区域),将获得的多个ROI输送到RPN(区域生成)网络进行候选区域筛选,将筛选出的候选区域映射回原图尺度;
3)利用RoIAlign层对每个候选出的ROI提取固定尺寸的特征图;
4)最后对固定尺寸的特征图进行牛脸边框回归、牛脸关键点回归、目标分类以及牛脸掩膜输出;
3.利用标记完成的数据训练牛脸及牛脸关键点检测网络,最终生成牛脸及牛脸关键点检测器
利用采集的数据训练牛脸及牛脸关键点检测网络,以牛脸及牛脸关键点检测网络的预测输出与真实输出的误差收敛为目标,即通过最小化RPN网络中的损失LR与牛脸及牛脸关键点检测网络的总损失L,训练该网络;
将数据分为两类,其中一类为只标记牛脸的数据集,另一类为即标记牛脸也标记牛脸关键点数据集;
1)先利用只标记牛脸的数据集训练网络;
2)然后再利用即标记牛脸也标记牛脸关键点数据集训练网络,如果只用正脸训练网络,会导致网络的泛化性不强;
所述的牛脸及牛脸关键点检测网络的预测输出与真实输出的误差分为四部分:
牛脸边框回归损失Lbox:Smooth L1损失;
目标分类损失Lclass:Softmax交叉熵损失;
牛脸关键点回归损失Lkpoint:均方误差损失;
牛脸掩膜输出损失Lmask:平均二值交叉熵损失;
总损失L=Lbox+Lclass+Lkpoint+Lmask
实施例:
为使本发明所述的基于Mask-RCNN的牛脸及牛脸关键点检测方法的目的、技术方案和优点更加清楚,以下结合附图及实施例,对本发明进行进一步详细说明;应当理解,此处所描述的具体实例仅用以解释本发明,并不用于限定本发明。
参阅图1,本发明所述的基于Mask-RCNN的牛脸及牛脸关键点检测方法的步骤如下:
1.采集带有牛脸的图片,标记每张图片中牛脸及牛脸关键点数据
1)利用Python编写代码,从国内网络中爬取牛的图片,其中符合要求的大概有1000张;
(1)从国内的农业节目中选取关于养牛的视频,每隔5帧截取一幅图片,从中选取有牛脸的图片大概12000张;
(2)使用摄像机实地采集牛只的视频,每隔5帧截取一幅图片,从中选取有牛脸的图片大概40000张;
其中牛只的品种有中国黑白花牛、荷斯坦奶牛、娟珊牛、西门塔尔牛、西门塔尔杂交牛、红牛、黑牛、黄牛、和牛等多个品种;
参阅图5,图片的总量越多越好,并且每张图片的拍摄环境最好不同。利用VGGImage Annotator软件标注图片中的每个牛脸的位置;标记牛正脸时的面部6个关键点,分别为左眼、右眼、左鼻孔上缘、左鼻孔下缘、右鼻孔上缘、右鼻孔下缘,如图中所示。
2.设计牛脸及牛脸关键点检测网络
参阅图2,该网络依次连接输入层、深度可分离卷积VGGNet与FPN网络耦合的多尺度特征提取网络、RPN网络、RoIAlign层、输出层;其中输出层包括四个目标分别为牛脸边框回归、目标分类、牛脸关键点回归、牛脸掩膜输出;
1)输入层
接收训练样本,即标记牛脸位置及牛脸6个关键点的彩色图片,预处理将尺寸调整为1024*1024;
2)深度可分离卷积VGGNet与FPN网络耦合的多尺度特征提取网络
提取低层特征高分辨率和高层特征的高语义信息,具体结构如图3所示,深度可分离卷积的VGGNet与FPN网络耦合的网络由两大部分组成,一部分为深度可分离卷积的VGGNet的网络进行特征提取下采样,其结构采用原有的VGGNet16网络卷积基结构,共分为5个特征提取下采样模块,分别为特征提取模块1、特征提取模块2、特征提取模块3、特征提取模块4、特征提取模块5,每个特征提取下采样模块的结构如下:
特征提取模块1:2个深度可分离卷积,卷积核的尺寸为3*3*64,padding=1,下采样采用采样频率为2的最大池化操作,输出的特征图的尺寸为512*512*64;
特征提取模块2:2个深度可分离卷积,卷积核的尺寸为3*3*128,padding=1,下采样采用采样频率为2的最大池化操作,输出的特征图的尺寸为256*256*128;
特征提取模块3:3个深度可分离卷积,卷积核的尺寸为3*3*256,padding=1,下采样采用采样频率为2的最大池化操作,输出的特征图的尺寸为128*128*256;
特征提取模块4:3个深度可分离卷积,卷积核的尺寸为3*3*512,padding=1,下采样采用采样频率为2的最大池化操作,输出的特征图的尺寸为64*64*512;
特征提取模块5:3个深度可分离卷积,卷积核的尺寸为3*3*512,padding=1,下采样采用采样频率为2的最大池化操作,输出的特征图的尺寸为32*32*512。
利用FPN网络对输出的特征图进行上采样操作,具体网络结构如下:
特征提取模块5输出的特征图经过卷积核为1*1*256的卷积操作4,输出特征图4的尺寸为32*32*256;
特征提取模块4输出的特征图经过卷积核为1*1*256的卷积操作3,输出的特征图与特征图4进行频率为2的上采样操作3输出的特征图进行融合,产生特征图3,且尺寸为64*64*256;
特征提取模块3输出的特征图经过卷积核为1*1*256的卷积操作2,输出的特征图与特征图3进行频率为2的上采样操作2输出的特征图进行融合,产生特征图2,且尺寸为128*128*256;
特征提取模块2输出的特征图经过卷积核为1*1*256的卷积操作1,输出的特征图与特征图2进行频率为2的上采样操作1输出的特征图进行融合,输出特征图1,且尺寸为256*256*256。
将特征图1、特征图2、特征图3、特征图4分别进行卷积核为3*3*256的卷积操作5、卷积操作6、卷积操作7、卷积操作8,消除混叠现象,分别输出为特征图5、特征图6、特征图7、特征图8,再将特征图8进行采样频率为2的最大池化操作,输出特征图9,再将特征图5、特征图6、特征图7、特征图8、特征图输入到RPN网络。
3)RPN网络
原有Mask-RCNN网络中的RPN网络,提取到的特征图对每个点设定预定的ROI,将获得的多个ROI输送到RPN网络进行候选区域筛选,将筛选出的候选区域映射回原图尺度;
4)RoIAlign层
原有Mask-RCNN网络中的RoIAlign层。利用RoIAlign层对每个候选出的ROI提取固定尺寸的特征图;
5)输出层
对固定尺寸的特征图进行牛脸边框回归、牛脸关键点回归以及牛脸掩膜输出。输出层的特征图结构如图4所示。RoIAlign层将ROI分别固定为7*7*256和14*14*256,左侧的分支负责牛脸关键点回归与牛脸边框回归,右侧的分支负责生成对应的mask。左侧分支将7*7*256的特征图通过卷积操作将其升维到1*1*1024,在通过卷积操作输出1*1*1024,然后有两个分支,牛脸关键点回归输出为12(6个牛脸关键点的二维坐标),目标分类输出为2,牛脸边框回归输出为4;右侧分支将14*14*256特征图通过5次相同卷积操作,输出都为14*14*256特征图,然后进行转置卷积操作,输出28*28*256特征图,最后输出28*28*1的mask。
3.利用标记完成的数据训练牛脸及牛脸关键点检测网络,最终生成牛脸及牛脸关键点检测器
1)利用采集的数据训练牛脸及牛脸关键点检测网络,以牛脸及牛脸关键点检测网络的预测输出与真实输出的误差收敛为目标,即通过最小化RPN网络中的损失LR与牛脸及牛脸关键点检测网络的总损失L,训练该网络。将数据分为两类,其中一类为只标记牛脸的数据集,大概4万多张;另一类为即标记牛脸也标记牛脸关键点数据集,大概1万张;先利用只标记牛脸的数据集训练网络,然后再利用即标记牛脸也标记牛脸关键点数据集训练网络,因为牛脸正脸的图片较少,如果只用正脸训练网络,会导致网络的泛化性不强。
2)所述的步骤3中的牛脸及牛脸关键点检测网络的预测输出与真实输出的误差分为四部分,分别为:
牛脸边框回归损失Lbox:Smooth L1损失;
目标分类损失Lclass:softmax交叉熵损失;
牛脸关键点回归损失Lkpoint:均方误差损失;
牛脸掩膜输出损失Lmask:平均二值交叉熵损失;
总损失L=Lbox+Lclass+Lkpoint+Lmask
通过上述步骤后,得到最终的牛脸及牛脸关键点检测网络中的最佳参数。
以上所述,仅是本发明的较佳实施例,并非用以限制本发明的权利范围。任何以本申请专利范围所涵盖的权利范围实施的技术方案,或者任何熟悉本领域的技术人员,利用上述揭示的方法做出许多可能的变动和修饰方案,均属于本发明的保护范围。

Claims (3)

1.一种基于Mask-RCNN的牛脸及牛脸关键点检测方法,其特征在于,所述的基于Mask-RCNN的牛脸及牛脸关键点检测方法的步骤如下:
1)采集带有牛脸的图片,标记每张图片中牛脸及牛脸关键点数据:
(1)从国内网络中收集牛的图片,从收集的图片中选取有牛脸的图片
a.从国内的农业节目中选取关于养牛的视频,每隔5帧截取一幅图片,从中选取有牛脸的图片;
b.使用摄像机实地采集牛只的视频,每隔5帧截取一幅图片,从中选取有牛脸的图片;
其中牛只的品种有中国黑白花牛、荷斯坦奶牛、娟珊牛、西门塔尔牛、西门塔尔杂交牛、红牛、黑牛、黄牛与和牛多个品种;
(2)标注图片中的每个牛脸的位置
标记牛正脸时的牛脸的6个关键点,分别为左眼、右眼、左鼻孔上缘、左鼻孔下缘、右鼻孔上缘、右鼻孔下缘;
2)设计牛脸及牛脸关键点检测网络结构:
(1)牛脸及牛脸关键点检测网络输入层接收用于训练检测网络的图片,即标记牛脸位置及牛脸6个关键点的彩色RGB图片,预处理将尺寸调整为1024*1024,经过改进的深度可分离卷积的VGGNet与FPN网络耦合的网络进行不同尺度的特征提取;
(2)提取到的特征图对每个点设定预定的ROI即感兴趣区域,将获得的多个ROI输送到RPN网络进行候选区域筛选,将筛选出的候选区域映射回原图尺度;
(3)利用RoIAlign层对每个候选出的ROI提取固定尺寸的特征图;
(4)最后对固定尺寸的特征图进行牛脸边框回归、牛脸关键点回归、目标分类以及牛脸掩膜输出;
3)利用标记完成的数据训练牛脸及牛脸关键点检测网络,最终生成牛脸及牛脸关键点检测器。
2.按照权利要求1所述的基于Mask-RCNN的牛脸及牛脸关键点检测方法,其特征在于,所述的深度可分离卷积的VGGNet与FPN网络耦合的网络由两大部分组成:
(1)一部分为深度可分离卷积的VGGNet网络进行特征提取下采样,其结构采用原有的VGGNet16网络卷积基结构;
改进的VGGNet网络中使用深度可分离卷积提取特征,共计进行13次深度可分离卷积,卷积核的尺寸为3*3,通道数逐渐从64增加到512;池化都选用最大池化操做;进行5次下采样,下采样的频率2;
(2)另一部分为FPN网络进行特征提取上采样
FPN网络采用的最邻近上采样,采样频率为2。
3.按照权利要求1所述的基于Mask-RCNN的牛脸及牛脸关键点检测方法,其特征在于,所述的利用标记完成的数据训练牛脸及牛脸关键点检测网络,最终生成牛脸及牛脸关键点检测器是指:
利用采集的数据训练牛脸及牛脸关键点检测网络,以牛脸及牛脸关键点检测网络的预测输出与真实输出的误差收敛为目标,即通过最小化RPN网络中的损失LR与牛脸及牛脸关键点检测网络的总损失L,训练该网络;
将数据分为两类,其中一类为只标记牛脸的数据集,另一类为即标记牛脸也标记牛脸关键点数据集;
1)先利用只标记牛脸的数据集训练网络;
2)然后再利用即标记牛脸也标记牛脸关键点数据集训练网络,如果只用正脸训练网络,会导致网络的泛化性不强;
所述的牛脸及牛脸关键点检测网络的预测输出与真实输出的误差分为四部分:
牛脸边框回归损失Lbox:Smooth L1损失;
目标分类损失Lclass:Softmax交叉熵损失;
牛脸关键点回归损失Lkpoint:均方误差损失;
牛脸掩膜输出损失Lmask:平均二值交叉熵损失;
总损失L=Lbox+Lclass+Lkpoint+Lmask
CN201910551729.0A 2019-06-25 2019-06-25 基于Mask-RCNN的牛脸及牛脸关键点检测方法 Active CN110298291B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910551729.0A CN110298291B (zh) 2019-06-25 2019-06-25 基于Mask-RCNN的牛脸及牛脸关键点检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910551729.0A CN110298291B (zh) 2019-06-25 2019-06-25 基于Mask-RCNN的牛脸及牛脸关键点检测方法

Publications (2)

Publication Number Publication Date
CN110298291A CN110298291A (zh) 2019-10-01
CN110298291B true CN110298291B (zh) 2022-09-23

Family

ID=68028680

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910551729.0A Active CN110298291B (zh) 2019-06-25 2019-06-25 基于Mask-RCNN的牛脸及牛脸关键点检测方法

Country Status (1)

Country Link
CN (1) CN110298291B (zh)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113128277A (zh) * 2019-12-31 2021-07-16 Tcl集团股份有限公司 一种人脸关键点检测模型的生成方法及相关设备
CN111368685B (zh) * 2020-02-27 2023-09-29 北京字节跳动网络技术有限公司 关键点的识别方法、装置、可读介质和电子设备
CN111368766B (zh) * 2020-03-09 2023-08-18 云南安华防灾减灾科技有限责任公司 一种基于深度学习的牛脸检测与识别方法
CN111523511B (zh) * 2020-05-08 2023-03-24 中国科学院合肥物质科学研究院 一种用于枸杞采收夹持装置的视频图像枸杞枝条检测方法
CN111709461A (zh) * 2020-05-27 2020-09-25 北京百度网讯科技有限公司 动物识别模型的训练方法、装置、设备及存储介质
CN111881743B (zh) * 2020-06-23 2024-06-07 安徽清新互联信息科技有限公司 一种基于语义分割的人脸特征点定位方法
CN112069995B (zh) * 2020-09-04 2024-02-27 西安西图之光智能科技有限公司 一种深度域人脸稠密特征提取方法、系统和存储介质
CN112712552A (zh) * 2020-12-29 2021-04-27 哈尔滨市科佳通用机电股份有限公司 一种车辆踏面擦伤的故障检测方法
CN112884705B (zh) * 2021-01-06 2024-05-14 西北工业大学 一种二维材料样品位置可视化方法
CN113128413A (zh) * 2021-04-22 2021-07-16 广州织点智能科技有限公司 一种人脸检测模型训练方法、人脸检测方法及其相关装置
CN113192043B (zh) * 2021-05-13 2022-07-01 杭州健培科技有限公司 基于多尺度拓扑图的医学关键点检测方法、装置及应用
CN113962336B (zh) * 2021-08-06 2023-11-24 杨甦 可实时的牛只正脸id编码方法
CN114332956B (zh) * 2022-03-15 2023-04-07 华中农业大学 一种基于卷积神经网络的牛脸检测和牛脸关键点定位方法
CN115457338B (zh) * 2022-11-09 2023-03-28 中国平安财产保险股份有限公司 牛只唯一性识别方法、装置、计算机设备及存储介质
CN115457601A (zh) * 2022-11-14 2022-12-09 中国平安财产保险股份有限公司 牲畜面部检测方法、装置、计算机设备及存储介质
CN115546845B (zh) * 2022-11-24 2023-06-06 中国平安财产保险股份有限公司 一种多视角牛脸识别方法、装置、计算机设备及存储介质
CN116052222A (zh) * 2023-03-06 2023-05-02 吉林大学 自然采集牛脸图像的牛脸识别方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107292298A (zh) * 2017-08-09 2017-10-24 北方民族大学 基于卷积神经网络和分类器模型的牛脸识别方法
CN109344806A (zh) * 2018-10-31 2019-02-15 第四范式(北京)技术有限公司 利用多任务目标检测模型执行目标检测的方法和系统
CN109376603A (zh) * 2018-09-25 2019-02-22 北京周同科技有限公司 一种视频识别方法、装置、计算机设备及存储介质
CN109800648A (zh) * 2018-12-18 2019-05-24 北京英索科技发展有限公司 基于人脸关键点校正的人脸检测识别方法及装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105701464A (zh) * 2016-01-13 2016-06-22 杭州奇客科技有限公司 一种判断人脸检测误检及关键点定位准确度的方法
KR102602117B1 (ko) * 2017-10-26 2023-11-13 매직 립, 인코포레이티드 딥 멀티태스크 네트워크들에서 적응적 손실 밸런싱을 위한 그라디언트 정규화 시스템들 및 방법들
CN109558864B (zh) * 2019-01-16 2021-07-30 苏州科达科技股份有限公司 人脸关键点检测方法、装置及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107292298A (zh) * 2017-08-09 2017-10-24 北方民族大学 基于卷积神经网络和分类器模型的牛脸识别方法
CN109376603A (zh) * 2018-09-25 2019-02-22 北京周同科技有限公司 一种视频识别方法、装置、计算机设备及存储介质
CN109344806A (zh) * 2018-10-31 2019-02-15 第四范式(北京)技术有限公司 利用多任务目标检测模型执行目标检测的方法和系统
CN109800648A (zh) * 2018-12-18 2019-05-24 北京英索科技发展有限公司 基于人脸关键点校正的人脸检测识别方法及装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Joint Face Detection and Alignment Using Multitask Cascaded Convolutional Networks;Kaipeng Zhang 等;《IEEE SIGNAL PROCESSING LETTERS》;20160826;第23卷(第10期);1499-1503,正文第1节,图1 *
基于计算机视觉的牛脸轮廓提取算法及实现;蔡骋 等;《农业工程学报》;20170630;第33卷(第11期);171-177 *
复杂条件下人脸检测方法研究与实现;梅真卿;《中国优秀硕士学位论文全文数据库信息科技辑》;20180815(第(2018)08期);I138-820 *
牛脸特征点检测的研究与实现;宋肖肖;《中国优秀硕士学位论文全文数据库信息科技辑》;20180115(第(2018)01期);I138-1767,摘要,第1.3节,第2.3节,第3.1.2节 *

Also Published As

Publication number Publication date
CN110298291A (zh) 2019-10-01

Similar Documents

Publication Publication Date Title
CN110298291B (zh) 基于Mask-RCNN的牛脸及牛脸关键点检测方法
CN105069746B (zh) 基于局部仿射和颜色迁移技术的视频实时人脸替换方法及其系统
US10558844B2 (en) Lightweight 3D vision camera with intelligent segmentation engine for machine vision and auto identification
CN109858540B (zh) 一种基于多模态融合的医学图像识别系统及方法
CN110852182B (zh) 一种基于三维空间时序建模的深度视频人体行为识别方法
CN105740780B (zh) 人脸活体检测的方法和装置
CN109741317B (zh) 医学影像智能评价方法
CN110930374A (zh) 一种基于双深度相机的腧穴定位方法
CN109192302A (zh) 一种脸部多模态图像采集处理装置及方法
CN110738161A (zh) 一种基于改进生成式对抗网络的人脸图像矫正方法
CN106570491A (zh) 一种机器人智能互动的方法及智能机器人
CN109758756B (zh) 基于3d相机的体操视频分析方法及系统
CN107766864B (zh) 提取特征的方法和装置、物体识别的方法和装置
CN109903299A (zh) 一种条件式生成对抗网络的异源遥感图像配准方法及装置
CN110263768A (zh) 一种基于深度残差网络的人脸识别方法
CN112016497A (zh) 基于人工智能的单视角太极拳动作分析及考核系统
CN109325408A (zh) 一种手势判断方法及存储介质
CN116052222A (zh) 自然采集牛脸图像的牛脸识别方法
CN117671738B (zh) 基于人工智能的人体姿态识别系统
CN111582154A (zh) 基于多任务骨架姿态划分部件的行人重识别方法
Lopez-Antequera et al. Place and object recognition by CNN-based COSFIRE filters
CN113283466A (zh) 一种仪表读数识别方法及装置、可读存储介质
CN112365578A (zh) 基于双摄像机的三维人体模型重构系统及方法
CN116977960A (zh) 一种基于实例分割的水稻秧苗行检测方法
CN110348344A (zh) 一种基于二维和三维融合的特殊人脸表情识别的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant