CN108509860A - 基于卷积神经网络的可可西里藏羚羊检测方法 - Google Patents

基于卷积神经网络的可可西里藏羚羊检测方法 Download PDF

Info

Publication number
CN108509860A
CN108509860A CN201810193118.9A CN201810193118A CN108509860A CN 108509860 A CN108509860 A CN 108509860A CN 201810193118 A CN201810193118 A CN 201810193118A CN 108509860 A CN108509860 A CN 108509860A
Authority
CN
China
Prior art keywords
tibetan antelope
tibetan
prediction block
antelope
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810193118.9A
Other languages
English (en)
Inventor
卢朝阳
翟俊伟
裴竟德
李静
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xidian University
Original Assignee
Xidian University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xidian University filed Critical Xidian University
Priority to CN201810193118.9A priority Critical patent/CN108509860A/zh
Publication of CN108509860A publication Critical patent/CN108509860A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Biology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Human Computer Interaction (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于卷积神经网络的可可西里藏羚羊检测方法,主要解决现有技术对藏羚羊种群统计速度慢且不精确的问题。其实现方案是:1)构建训练数据集,对采集及数据增强得到的藏羚羊图像进行标注,得到训练数据集;2)利用k‑means算法对训练数据集进行目标框维度聚类,得到藏羚羊数据集的最有效的先验框信息,构建一个具有19个卷积层和5个最大池化层的卷积神经网络;3)用卷积神经网络对藏羚羊图像数据进行训练,得到藏羚羊检测与分类模型;4)利用训练好的模型,对藏羚羊图像进行检测,画出藏羚羊具体位置并标注所属类别。本发明能更快更准确的对藏羚羊进行检测与分类,可用于对自然保护区中藏羚羊的科学保护与管理。

Description

基于卷积神经网络的可可西里藏羚羊检测方法
技术领域
本发明属于计算机视觉技术领域,更进一步涉及基于卷积神经网络的可可西里藏羚羊检测方法。可用于对可可西里自然保护区中的藏羚羊目标的统计及对雌雄藏羚羊个体的分类,便于保护区管理机构掌握藏羚羊的变化动态和趋势,从而为科学管理藏羚羊种群提供依据。
背景技术
藏羚羊作为国家一级保护动物,被列入《濒危野生动植物种国际贸易公约》(CITES)公约附录Ⅰ,其主要分布在中国青海、西藏、新疆等地的高山荒漠草甸草原和高原草原等环境中。独特的生态环境,使得藏羚羊的保护工作变得尤为艰难。目前,国家对藏羚羊的保护主要是通过建立自然保护区、人工巡逻监测的方式来进行。一方面,由于藏羚羊的皮毛具有高昂的价值,使得一些盗猎分子铤而走险,大量猎杀藏羚羊,因此,有必要借助智能监控技术来了解藏羚羊种群的频繁活动区域,从而为有效地建立保护站提供科学依据;另一方面,由于藏羚羊生性极其敏感,使得人们无法近距离对藏羚羊种群数量进行统计,因此可以对藏羚羊种群进行远距离拍摄,再通过目标检测识别技术对其进行检测统计并分类。
目前关于藏羚羊种群数量统计与分布的研究还处于人工操作的阶段。如首都师范大学生命科学学院的路飞英等人发表的“阿尔金山自然保护区藏羚羊、藏野驴和野牦牛的数量与分布”(北京师范大学学报(自然科学版),2015(4):374-381.)中采用样线调查法调查了藏羚羊、藏野驴和野牦牛3种有蹄类动物的数量和分布状况,该方法的缺点是调查周期长,而且统计的种群数量是一个概数,不能较为准确的统计藏羚羊等的数量分布,并且对于场景较复杂的情况不能很好的区分藏羚羊的雌雄个体。
发明内容
本发明的目的在于针对上述现有技术的不足,提出一种基于卷积神经网络的藏羚羊检测方法,以通过高效的卷积神经网络提取特征,提高在复杂场景下对藏羚羊目标检测与雌雄个体分类的准确性和鲁棒性。
为了实现上述目的,本发明实现方案包括如下:
(1)构建训练数据集:
(1a)采集若干个不同场景中的可可西里藏羚羊图片数据;
(1b)对图片数据进行增强处理,以获得更多的训练样本量;
(1c)利用图像标注工具LabelImg对上述采集到的以及数据增强后的藏羚羊图像进行目标框标注,并将标注藏羚羊的坐标、宽高以及类别信息存入到xml格式的标签文件中,每一幅标注图像对应一个xml文件;
(1d)提取xml文件中的藏羚羊坐标、宽高以及类别信息并存到txt格式的标签文件中,构成训练数据集;
(2)以GoogLetNet为基础网络,使用1*1和3*3的卷积核,构建一个包含19个卷积层和5个最大值池化层的卷积神经网络;
(3)目标框维度聚类:
(3a)通过k-means聚类算法对(1d)中所生成的训练数据集进行聚类,获取藏羚羊数据集的最优先验框个数k与各个先验框的宽w和高h;
(3b)根据(2)中构建的卷积神经网络的降采样倍率,将(3a)得到的先验框的宽和高转换为相对于卷积神经网络最后网格的比例大小;
(4)利用卷积神经网络中的损失函数对藏羚羊图像数据进行训练,得到藏羚羊检测与分类模型;
(5)利用(2)中构建的卷积神经网络以及(4)中训练好的模型对待检测图像中的藏羚羊目标进行检测并分类:
(5a)对于每一幅待检测图像,通过卷积神经网络得到S*S*K个预测框,每个预测框预测C个类别,取值为2,最终得到一个C*(S*S*K)大小的二维分数矩阵,其中S代表划分的网格数,K表示(3a)聚类得到的先验框个数;
(5b)对分数矩阵的每一行,将得分小于阈值δ的分数设置为0,并将得分从高到低排序;
(5c)根据上述得到的分数矩阵,利用非极大值抑制方法去掉重叠率较大的预测框;
(5d)针对每个预测框的2个分数,取较大的一个,对其进行判断:如果该分数值大于0,则保留该预测框,并将该预测框的类别设置为该分数对应的藏羚羊类别;如果该值小于等于0,说明该预测框里面没有藏羚羊目标,则舍弃该预测框;
(5e)将所有保留的预测框映射到原图像中,并根据预测框类别,用不同颜色在原图中画出预测框并标出藏羚羊所属类别;
(5f)根据预测框个数及类别,统计出整幅图像中所有藏羚羊的数量以及每一类藏羚羊的数量。
本发明与现有的技术相比具有以下优点:
1.检测速度快、准确率高
相较于传统的样线调查法及其它人工方式对藏羚羊种群的统计及雌雄个体分类,本发明能够通过训练的检测识别模型自动对给定图像中的藏羚羊目标检测并进行雌雄个体分类,在GPU显卡加速下可以达到实时检测;对于活动范围较广、种群比较密集的情况,人工统计的方式容易出现较大的偏差,而本发明的卷积神经网络由于对藏羚羊目标提取了由底层到高层的特征,因此能够很好的区分遮挡个体与雌雄个体。
2.检测效果好
本发明采用的卷积神经网络能自动学习藏羚羊的多尺度特征,同时在训练过程中加入了多尺度的训练,因此对于不同大小、不同姿态的藏羚羊都有很好的检测效果。
3.鲁棒性好
本发明基于卷积神经网络对藏羚羊检测并进行雌雄个体分类,对各种天气情况都有很好的普适性,能克服不同角度、场景带来的影响,具有较强的鲁棒性。
附图说明
图1为本发明的实现流程图;
图2为本发明中的图片标注效果图;
图3为用本发明对藏羚羊图像的检测分类效果图。
具体实施方式
下面结合附图对本发明做进一步的详细描述。
参照图1,本发明具体实施步骤如下:
步骤1,构建训练数据集。
(1a)采集若干个不同场景、不同拍摄角度、不同光照变化和天气情况下的可可西里藏羚羊图片数据,图片大小为1920*1080;
(1b)对上述(1a)中图片数据进行数据增强,具体包括旋转、平移、缩放、噪声扰动和颜色变换,以增加训练样本数量;
(1c)利用图像标注工具LabelImg对上述采集到的图像以及数据增强得到的藏羚羊图像进行标注,标注效果如图2所示;同时将标注藏羚羊的坐标、宽高以及类别信息存入到xml格式的标签文件中,每一幅标注图像对应一个xml文件,生成的xml文件格式;
(1d)提取(1c)中的xml文件中的藏羚羊坐标、宽、高以及类别信息到txt格式的标签文件中,所有的txt文件即为训练数据集。
步骤2,以GoogLetNet为基础网络,使用1*1和3*3的卷积核,构建一个包含19个卷积层和5个最大值池化层的卷积神经网络。
步骤3,目标框维度聚类。
(3a)通过k-means聚类算法对(1d)中所生成的训练数据集进行聚类:
(3a1)使用k-means++算法初始化中心框initcentroid,减少随机初始化的中心框对最终结果的影响,其中聚类中心个数k取值为4;
(3a2)通过如下公式计算初始化中心框到每一个标注的真实框box之间的距离:
d(box,initcentroid)=1-IOU(box,initcentroid)
其中,initcentroid表示初始化的中心框,box表示除中心框外的其他真实框,d(box,initcentroid)表示box和initcentroid之间的距离,IOU(box,initcentroid)表示其他框与中心框的相似程度,通过二者的交集除以并集计算,具体如下:
其中,∩表示initcentroid和box两个框的交集区域的面积,∪表示initcentroid和box两个框的并集区域的面积;
(3a3)选取(3a2)中所有距离中最短的一个距离所对应的box,并将该box的宽和高分别记为boxW和boxH,计算先验框的宽w和高h:
w=initcentroidW+boxW
h=initcentroidH+boxH
其中,initcentroidW和initcentroidH分别表示初始化中心框的宽和高,由于本发明聚类算法的k取值为4,因此最终先验框的个数也为4,将得到的先验框的宽高信息以(w,h)的形式表示,则最后得到的4个先验框的宽高为(11.29,10.45),(19.30,18.34),(9.59,19.52),(15.83,20.75)。
(3b)根据步骤2中构建的卷积神经网络的降采样倍率,通过如下公式将(3a3)得到的先验框的宽w和高h转换为相对于卷积神经网络最后网格的比例大小:
w-=w*inputwidth/downsamples
h-=h*inputheight/downsamples
其中w-和h-是转换后的先验框的宽和高,intputwidth和inputheight是输入到网络的图片尺寸,downsamples是网络的降采样倍率。
步骤4,计算机利用卷积神经网络中的损失函数对藏羚羊数据集进行训练,得到藏羚羊检测与分类模型。
(4a)计算机加载(1d)中的训练数据集;
(4b)设置训练迭代次数iter为10000,计算机利用步骤2中构建的卷积神经网络中的损失函数对(4a)中的训练数据集进行迭代训练,损失函数表示如下:
式中:第一项为预测目标框的中心点坐标损失,λcoord为坐标损失系数,取值为5,S2表示图片划分网格的个数,B表示每个网格预测框的个数,表示有目标时的第i个网格中第j个预测框是否负责这个目标的预测,(xi,yi)表示目标真实框中心点坐标,表示预测框中心点坐标;
第二项为预测框宽高损失,(wi,hi)表示真实框的宽高,表示预测框的宽高;
第三项和第四项是预测框中包含目标的概率损失,λnoobj表示不包含目标时的损失系数,取值为0.5,示不含有目标时,第i个网格中的第j个预测框是否负责这个目标的预测,Ci表示包含目标的真实概率,表示预测包含目标的概率;
第五项表示真实目标类别,表示预测的目标类别,c表示类别数。
(4c)训练迭代次数达到10000后,结束训练,计算机输出得到藏羚羊检测与分类模型。
步骤5,利用步骤2中构建的卷积神经网络以及步骤4中训练好的模型对待检测图像中的藏羚羊目标进行检测并分类。
(5a)对于每一幅待检测图像,通过卷积神经网络得到S*S*K个预测框,每个预测框预测C个类别,最终得到一个C*(S*S*K)大小的二维分数矩阵,其中S代表划分的网格数,K表示(3a)聚类得到的先验框个数,本实例的C取值为2;
(5b)根据仿真实验,设定一个得分阈值δ,对分数矩阵的每一行得分进行判断,将得分小于δ的分数设置为0,然后将每一行得分从高到低排序,得到分数矩阵;
(5c)根据上述得到的分数矩阵,利用非极大值抑制方法去掉重叠率较大的预测框:
(5c1)对于某一个预测框A,计算A与其它所有预测框之间的重叠面积,如果某一个重叠面积超过预测框A面积的70%,则去掉该重叠面积对应的预测框,否则,保留该预测框;
(5c2)对所有预测框都执行上述(5c1)的操作;
(5d)针对每个预测框的2个分数,取较大的一个,对其进行判断:如果该分数值大于0,则保留该预测框,并将该预测框的类别设置为该分数对应的藏羚羊类别;如果该值小于等于0,说明该预测框里面没有藏羚羊目标,则舍弃该预测框;
(5e)将所有保留的预测框映射到原图像中,并根据预测框类别,用不同颜色在原图中画出预测框并标出藏羚羊所属类别,其中雄性藏羚羊用“mtibetan”表示,雌雄藏羚羊用“ftibetan”表示;
(5f)根据预测框个数及类别,统计出整幅图像中所有藏羚羊的数量以及每一类藏羚羊的数量。
本发明的效果可以通过以下仿真实验进一步说明。
1.仿真实验条件。
本发明仿真实验的计算机硬件配置为:处理器,Intel(R)Core(TM)i7-7700K CPU@4.20GHz;内存,24GB;GPU显卡,Nvidia GeForce GTX1080Ti 11GB;计算机软件配置为:Ubuntu16.04、OpenCV2.4.13。
2.仿真实验内容。
利用训练好的模型分别对不同背景下、不同角度的藏羚羊进行检测和分类,说明本发明的有效性,检测和分类结果如图3所示,其中:
图3(a)是在常规环境中对藏羚羊的检测与雌雄个体分类结果,从图3(a)可以看出本发明能够较好的完成对藏羚羊的检测与分类;
图3(b)是在对比度较低,且存在雾气和模糊的环境中对藏羚羊的检测与分类结果,从图3(b)可以看出本发明对恶劣天气状况下藏羚羊的检测有较强的鲁棒性;
图3(c)是在藏羚羊群体姿态不同,且相互之间存在遮挡情况下检测出的结果,从图3(c)可以看出本发明能对藏羚羊群体姿态多样,且相互遮挡的藏羚羊群体也能较好的完成检测与分类任务,表明卷积神经网络所提取的特征能够很好的区分雌雄藏羚羊个体之间的差异且能够处理部分遮挡问题。

Claims (6)

1.基于卷积神经网络的可可西里藏羚羊检测方法,包括:
(1)构建训练数据集:
(1a)采集若干个不同场景中的可可西里藏羚羊图片数据;
(1b)对图片数据进行增强处理,以获得更多的训练样本量;
(1c)利用图像标注工具LabelImg对上述采集到的以及数据增强后的藏羚羊图像进行目标框标注,并将标注藏羚羊的坐标、宽高以及类别信息存入到xml格式的标签文件中,每一幅标注图像对应一个xml文件;
(1d)提取xml文件中的藏羚羊坐标、宽高以及类别信息并存到txt格式的标签文件中,构成训练数据集;
(2)以GoogLetNet为基础网络,使用1*1和3*3的卷积核,构建一个包含19个卷积层和5个最大值池化层的卷积神经网络;
(3)目标框维度聚类:
(3a)通过k-means聚类算法对(1d)中所生成的训练数据集进行聚类,获取藏羚羊数据集的最优先验框个数k与各个先验框的宽w和高h;
(3b)根据(2)中构建的卷积神经网络的降采样倍率,将(3a)得到的先验框的宽和高转换为相对于卷积神经网络最后网格的比例大小;
(4)利用卷积神经网络中的损失函数对藏羚羊图像数据进行训练,得到藏羚羊检测与分类模型;
(5)利用(2)中构建的卷积神经网络以及(4)中训练好的模型对待检测图像中的藏羚羊目标进行检测并分类:
(5a)对于每一幅待检测图像,通过卷积神经网络得到S*S*K个预测框,每个预测框预测C个类别,取值为2,最终得到一个C*(S*S*K)大小的二维分数矩阵,其中S代表划分的网格数,K表示(3a)聚类得到的先验框个数;
(5b)对分数矩阵的每一行,将得分小于阈值δ的分数设置为0,并将得分从高到低排序;
(5c)根据上述得到的分数矩阵,利用非极大值抑制方法去掉重叠率较大的预测框;
(5d)针对每个预测框的2个分数,取较大的一个,对其进行判断:如果该分数值大于0,则保留该预测框,并将该预测框的类别设置为该分数对应的藏羚羊类别;如果该值小于等于0,说明该预测框里面没有藏羚羊目标,则舍弃该预测框;
(5e)将所有保留的预测框映射到原图像中,并根据预测框类别,用不同颜色在原图中画出预测框并标出藏羚羊所属类别;
(5f)根据预测框个数及类别,统计出整幅图像中所有藏羚羊的数量以及每一类藏羚羊的数量。
2.根据权利要求1所述的方法,其特征在于,步骤(1a)中采集若干个不同场景中的可可西里藏羚羊图片数据,是由野生动物摄影师在可可西里自然保护区的不同场景、不同天气状况下拍摄的藏羚羊图片若干张,其中包含不同姿态、不同种群密度下的藏羚羊雌雄个体。
3.根据权利要求1所述的方法,其特征在于,步骤(1b)中对图片数据进行增强处理,是对原始图片依次进行旋转、平移、缩放、噪声扰动和颜色变换。
4.根据权利要求1所述的方法,其特征在于,步骤(3a)中通过k-means聚类算法对(1d)中所生成的训练数据集进行聚类,通过如下公式进行:
d(box,centroid)=1-IOU(box,centroid)
其中,centroid表示随机选取的聚类中心框,box表示除中心框外的其他真实框,d(box,centroid)表示box和centroid之间的距离,IOU(box,centroid)表示其他框与中心框的相似程度,通过二者的交集除以并集计算,具体如下:
其中,∩表示centroid和box两个框的交集区域的面积,∪表示centroid和box两个框的并集区域的面积。
5.根据权利要求1所述的方法,其特征在于,步骤(3a)中将藏羚羊数据集的各个先验框的宽w和高h转换为相对于卷积神经网络最后网格的比例大小,通过如下公式进行:
w-=w*inputwidth/downsamples
h-=h*inputheight/downsamples
其中w-和h-是转换后的先验框的宽和高,inputwidth和inputheight是输入到网络的图片尺寸,downsamples是网络的降采样倍率。
6.根据权利要求1所述的方法,其特征在于,步骤(4)所述卷积神经网络中的损失函数,表示如下:
式中:第一项为预测目标框的中心点坐标损失,λcoord为坐标损失系数,取值为5,S2表示图片划分网格的个数,B表示每个网格预测框的个数,表示有目标时的第i个网格中第j个预测框是否负责这个目标的预测,(xi,yi)表示目标真实框中心点坐标,表示预测框中心点坐标;
第二项为预测框宽高损失,(wi,hi)表示真实框的宽高,表示预测框的宽高;
第三项和第四项是预测框中包含目标的概率损失,λnoobj表示不包含目标时的损失系数,取值为0.5,示不含有目标时,第i个网格中的第j个预测框是否负责这个目标的预测,Ci表示包含目标的真实概率,表示预测包含目标的概率;
第五项表示真实目标类别,表示预测的目标类别,c表示类别数。
CN201810193118.9A 2018-03-09 2018-03-09 基于卷积神经网络的可可西里藏羚羊检测方法 Pending CN108509860A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810193118.9A CN108509860A (zh) 2018-03-09 2018-03-09 基于卷积神经网络的可可西里藏羚羊检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810193118.9A CN108509860A (zh) 2018-03-09 2018-03-09 基于卷积神经网络的可可西里藏羚羊检测方法

Publications (1)

Publication Number Publication Date
CN108509860A true CN108509860A (zh) 2018-09-07

Family

ID=63376228

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810193118.9A Pending CN108509860A (zh) 2018-03-09 2018-03-09 基于卷积神经网络的可可西里藏羚羊检测方法

Country Status (1)

Country Link
CN (1) CN108509860A (zh)

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109242047A (zh) * 2018-10-17 2019-01-18 福州大学 基于K-means++聚类和残差网络分类的银行卡卡号检测与识别方法
CN109376765A (zh) * 2018-09-14 2019-02-22 汕头大学 一种基于深度学习的蝴蝶自动分类方法
CN109376605A (zh) * 2018-09-26 2019-02-22 福州大学 一种电力巡检图像防鸟刺故障检测方法
CN109658414A (zh) * 2018-12-13 2019-04-19 北京小龙潜行科技有限公司 一种猪只的智能盘点方法及装置
CN109684942A (zh) * 2018-12-08 2019-04-26 厦门大学嘉庚学院 一种基于视觉识别的全自动餐具分拣方法
CN109711437A (zh) * 2018-12-06 2019-05-03 武汉三江中电科技有限责任公司 一种基于yolo网络模型的变压器部件识别方法
CN109766872A (zh) * 2019-01-31 2019-05-17 广州视源电子科技股份有限公司 图像识别方法和装置
CN109829429A (zh) * 2019-01-31 2019-05-31 福州大学 基于YOLOv3的监控场景下的安防敏感物品检测方法
CN109858486A (zh) * 2019-01-27 2019-06-07 中国人民解放军国防科技大学 一种基于深度学习的数据中心云端目标识别方法
CN110097005A (zh) * 2019-04-30 2019-08-06 内蒙古科技大学 基于深度学习的牛体尺测量系统中站姿纠偏的方法
CN110119718A (zh) * 2019-05-15 2019-08-13 燕山大学 一种基于深度学习的落水检测及救援控制系统
CN110136192A (zh) * 2019-04-30 2019-08-16 内蒙古科技大学 一种基于深度学习和特征部位检测的牛体尺算法
CN110175989A (zh) * 2019-05-08 2019-08-27 常州市第二人民医院 影像数据处理方法及其装置
CN110263660A (zh) * 2019-05-27 2019-09-20 魏运 一种自适应场景变化的交通目标检测识别方法
CN110415240A (zh) * 2019-08-01 2019-11-05 国信优易数据有限公司 样本图像生成方法及装置、电路板缺陷检测方法及装置
CN111127457A (zh) * 2019-12-25 2020-05-08 上海找钢网信息科技股份有限公司 钢筋数目统计模型训练方法、统计方法、装置及设备
CN111161265A (zh) * 2019-11-13 2020-05-15 北京海益同展信息科技有限公司 一种动物计数、图像处理方法和装置
CN111259909A (zh) * 2018-11-30 2020-06-09 中国科学院大连化学物理研究所 一种lc-ms数据高灵敏度特征检测方法
CN112885411A (zh) * 2019-11-29 2021-06-01 中国科学院大连化学物理研究所 一种基于深度学习的多肽检测方法
CN113033376A (zh) * 2021-03-22 2021-06-25 陕西科技大学 一种基于深度学习的圈养山羊计数方法
CN113139481A (zh) * 2021-04-28 2021-07-20 广州大学 基于yolov3的教室人数统计方法
CN114512185A (zh) * 2022-01-13 2022-05-17 湖南大学 一种变异数据降维输入的驴种群自然选择分类系统
CN116310894A (zh) * 2023-02-22 2023-06-23 中交第二公路勘察设计研究院有限公司 一种基于无人机遥感的小样本小目标藏羚羊智能识别方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104408449A (zh) * 2014-10-27 2015-03-11 西安电子科技大学宁波信息技术研究院 智能移动终端场景文字处理方法
CN106682697A (zh) * 2016-12-29 2017-05-17 华中科技大学 一种基于卷积神经网络的端到端物体检测方法
CN107256262A (zh) * 2017-06-13 2017-10-17 西安电子科技大学 一种基于物体检测的图像检索方法
US20180005343A1 (en) * 2016-07-01 2018-01-04 Digimarc Corporation Image-based pose determination

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104408449A (zh) * 2014-10-27 2015-03-11 西安电子科技大学宁波信息技术研究院 智能移动终端场景文字处理方法
US20180005343A1 (en) * 2016-07-01 2018-01-04 Digimarc Corporation Image-based pose determination
CN106682697A (zh) * 2016-12-29 2017-05-17 华中科技大学 一种基于卷积神经网络的端到端物体检测方法
CN107256262A (zh) * 2017-06-13 2017-10-17 西安电子科技大学 一种基于物体检测的图像检索方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
JOSEPH REDMON 等: "YOLO9000: Better, Faster, Stronger", 《IEEE CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION》 *
JOSEPH REDMON 等: "You Only Look Once: Unified, Real-Time Object Detection", 《IEEE CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION》 *
高宗 等: "基于YOLO网络的行人检测方法", 《计算机工程》 *

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109376765A (zh) * 2018-09-14 2019-02-22 汕头大学 一种基于深度学习的蝴蝶自动分类方法
CN109376605A (zh) * 2018-09-26 2019-02-22 福州大学 一种电力巡检图像防鸟刺故障检测方法
CN109242047A (zh) * 2018-10-17 2019-01-18 福州大学 基于K-means++聚类和残差网络分类的银行卡卡号检测与识别方法
CN111259909A (zh) * 2018-11-30 2020-06-09 中国科学院大连化学物理研究所 一种lc-ms数据高灵敏度特征检测方法
CN109711437A (zh) * 2018-12-06 2019-05-03 武汉三江中电科技有限责任公司 一种基于yolo网络模型的变压器部件识别方法
CN109684942A (zh) * 2018-12-08 2019-04-26 厦门大学嘉庚学院 一种基于视觉识别的全自动餐具分拣方法
CN109658414A (zh) * 2018-12-13 2019-04-19 北京小龙潜行科技有限公司 一种猪只的智能盘点方法及装置
CN109858486A (zh) * 2019-01-27 2019-06-07 中国人民解放军国防科技大学 一种基于深度学习的数据中心云端目标识别方法
CN109766872A (zh) * 2019-01-31 2019-05-17 广州视源电子科技股份有限公司 图像识别方法和装置
CN109829429A (zh) * 2019-01-31 2019-05-31 福州大学 基于YOLOv3的监控场景下的安防敏感物品检测方法
CN110097005A (zh) * 2019-04-30 2019-08-06 内蒙古科技大学 基于深度学习的牛体尺测量系统中站姿纠偏的方法
CN110136192A (zh) * 2019-04-30 2019-08-16 内蒙古科技大学 一种基于深度学习和特征部位检测的牛体尺算法
CN110175989A (zh) * 2019-05-08 2019-08-27 常州市第二人民医院 影像数据处理方法及其装置
CN110119718A (zh) * 2019-05-15 2019-08-13 燕山大学 一种基于深度学习的落水检测及救援控制系统
CN110263660A (zh) * 2019-05-27 2019-09-20 魏运 一种自适应场景变化的交通目标检测识别方法
CN110415240A (zh) * 2019-08-01 2019-11-05 国信优易数据有限公司 样本图像生成方法及装置、电路板缺陷检测方法及装置
CN111161265A (zh) * 2019-11-13 2020-05-15 北京海益同展信息科技有限公司 一种动物计数、图像处理方法和装置
CN112885411A (zh) * 2019-11-29 2021-06-01 中国科学院大连化学物理研究所 一种基于深度学习的多肽检测方法
CN111127457A (zh) * 2019-12-25 2020-05-08 上海找钢网信息科技股份有限公司 钢筋数目统计模型训练方法、统计方法、装置及设备
CN113033376A (zh) * 2021-03-22 2021-06-25 陕西科技大学 一种基于深度学习的圈养山羊计数方法
CN113139481A (zh) * 2021-04-28 2021-07-20 广州大学 基于yolov3的教室人数统计方法
CN113139481B (zh) * 2021-04-28 2023-09-01 广州大学 基于yolov3的教室人数统计方法
CN114512185A (zh) * 2022-01-13 2022-05-17 湖南大学 一种变异数据降维输入的驴种群自然选择分类系统
CN114512185B (zh) * 2022-01-13 2024-04-05 湖南大学 一种变异数据降维输入的驴种群自然选择分类系统
CN116310894A (zh) * 2023-02-22 2023-06-23 中交第二公路勘察设计研究院有限公司 一种基于无人机遥感的小样本小目标藏羚羊智能识别方法
CN116310894B (zh) * 2023-02-22 2024-04-16 中交第二公路勘察设计研究院有限公司 一种基于无人机遥感的小样本小目标藏羚羊智能识别方法

Similar Documents

Publication Publication Date Title
CN108509860A (zh) 基于卷积神经网络的可可西里藏羚羊检测方法
CN106897390B (zh) 基于深度度量学习的目标精确检索方法
Li et al. SHREC'12 Track: Generic 3D Shape Retrieval.
Larlus et al. Combining appearance models and markov random fields for category level object segmentation
Rossatto et al. Fractal analysis of leaf-texture properties as a tool for taxonomic and identification purposes: a case study with species from Neotropical Melastomataceae (Miconieae tribe)
CN105095884B (zh) 一种基于随机森林支持向量机的行人识别系统及处理方法
CN104182765B (zh) 一种互联网图像驱动的三维模型最优视图自动选择方法
CN108197538A (zh) 一种基于局部特征和深度学习的卡口车辆检索系统及方法
CN105069481B (zh) 基于空间金字塔稀疏编码的自然场景多标记分类方法
CN107256262A (zh) 一种基于物体检测的图像检索方法
CN105528575B (zh) 基于上下文推理的天空检测方法
Liu et al. A model of visual attention for natural image retrieval
CN105160623B (zh) 基于组块低秩张量模型的无监督高光谱数据降维方法
CN109902736A (zh) 一种基于自动编码器构建特征表示的肺结节图像分类方法
CN107679509A (zh) 一种小环藻识别方法及装置
CN106528662A (zh) 一种基于特征几何约束的车辆图像快速检索方法与系统
Wang et al. Cattle face recognition method based on parameter transfer and deep learning
CN104050460B (zh) 多特征融合的行人检测方法
CN109426793A (zh) 一种图像行为识别方法、设备及计算机可读存储介质
CN105320963B (zh) 面向高分遥感图像的大尺度半监督特征选择方法
Hong et al. A flower image retrieval method based on ROI feature
CN106844785A (zh) 一种基于显著性分割的基于内容的图像检索方法
CN107067037A (zh) 一种使用llc准则定位图像前景的方法
CN111898418A (zh) 一种基于t-tiny-yolo网络的人体异常行为检测方法
Zhang et al. Land use and land cover classification base on image saliency map cooperated coding

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20180907

WD01 Invention patent application deemed withdrawn after publication