CN115690448A - 一种基于ai的鸟类物种识别方法及装置 - Google Patents
一种基于ai的鸟类物种识别方法及装置 Download PDFInfo
- Publication number
- CN115690448A CN115690448A CN202211398746.3A CN202211398746A CN115690448A CN 115690448 A CN115690448 A CN 115690448A CN 202211398746 A CN202211398746 A CN 202211398746A CN 115690448 A CN115690448 A CN 115690448A
- Authority
- CN
- China
- Prior art keywords
- bird
- block
- image
- features
- birds
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Image Analysis (AREA)
Abstract
本申请提供一种基于AI的鸟类物种识别方法及装置,涉及鸟类识别和人工智能技术领域,能够提高鸟类识别的准确率。该方法包括:采用第一鸟类特征提取模型提取待识别图像中的鸟的候选区块的区块特征,该候选区块包括鸟的喙、羽冠、脖、背以及腿,区块特征包括颜色特征、结构特征以及体色结构特征;并且根据鸟的候选区块的区块特征,确定待识别图像中的鸟的第一识别结果;采用第二鸟类特征提取模型提取待识别图像中鸟的关键特征,该关键特征包括鸟的一种或者多种具有排他特性的特征;并且根据鸟的关键特征,确定待识别图像中的鸟的第二识别结果;进而基于第一识别结果和第二识别结果,确定待识别图像中鸟的类别。
Description
技术领域
本申请实施例涉及鸟类识别和人工智能(artificial intelligence,AI)技术领域,尤其涉及一种基于AI的鸟类物种识别方法及装置。
背景技术
在野生动物保护和研究领域,对自然界中的鸟类进行长期的监控和记录,识别鸟的种类,以便于研究物种的生存和迁徙状况,进而采取相应的措施来保护濒危物种。
目前,一种识别鸟的种类的研究方案是:在各个自然生态区密集布设大量相机(例如红外相机)来采集海量的图像数据,并采用一些识别方法对图像数据进行处理从而识别出图像中的鸟的种类。具体的,以采集的海量的图像数据为训练样本,采用人工智能方法训练得到AI模型,然后对于待识别的图像,使用该AI模型提取图像的一些重要特征(例如鸟的姿态、轮廓、体型大小等等),并剔除一些冗余特征(例如图像对应的环境特征),再通过设计的分类器以及分类决策对图像的重要特征进行分析,以确定鸟的种类。上述在基于大量的样本训练AI模型的训练过程中自适应地将一些重复次数较多的特征作为重要特征。
然而,上述方法在采集图像的过程中,由于一些原因导致获取的图像样本(即训练样本)不足(例如对于现存的稀有鸟类,由于鸟类数量较少而无法获得更多的图像),或者获取的图像对应的环境较为单一(例如有些环境下的图像比较容易获取,有些环境下的图像不易获取),又或者获取到的图像质量较低(例如存在鸟被遮挡,鸟类成群、鸟类动态运动导致图像模糊),而AI模型是将大量训练样本中重复次数较多的特征作为重要特征的,在训练样本数量较少、样本环境不够丰富以及样本质量差的情况下,使得基于这些图像样本训练的AI模型的特征提取能力较差,对鸟的特征的辨识度较低,导致鸟类识别的准确率较低。
发明内容
本申请实施例提供一种基于AI的鸟类物种识别方法及装置,能够提高鸟类识别的准确率。
为达到上述目的,本申请实施例采用如下技术方案:
第一方面,本申请实施例提供一种基于AI的鸟类物种识别方法,包括:采用第一鸟类特征提取模型提取待识别图像中的鸟的候选区块的区块特征;所述候选区块包括所述鸟的喙、羽冠、脖、背以及腿,所述区块特征包括颜色特征、结构特征以及体色结构特征;并且根据所述鸟的候选区块的区块特征,确定所述待识别图像中的鸟的第一识别结果;采用第二鸟类特征提取模型提取所述待识别图像中鸟的关键特征,所述关键特征包括所述鸟的一种或者多种具有排他特性的特征;并且根据所述鸟的关键特征,确定所述待识别图像中的鸟的第二识别结果;进而基于所述第一识别结果和所述第二识别结果,确定所述待识别图像中鸟的类别。
本申请实施例提供的基于AI的鸟类物种识别方法将基于区块特征进行识别的物种概率与基于关键特征进行识别的物种概率进行加权处理,可以更加科学地平衡鸟类关键特征和区块特征的关系,避免因为某一种特征不清晰或者缺失使得识别结果不准确的问题,能够提高鸟类识别的正确率。
在第一方面的一种实现方式中,所述第一识别结果包括第一物种概率,所述第二识别结果包括第二物种概率;其中,物种概率包括所述鸟在所有类别上的物种概率。上述基于所述第一识别结果和所述第二识别结果,确定所述待识别图像中鸟的类别,包括:对所述第一物种概率和所述第二物种概率进行加权处理,得到第三物种概率;并将所述第三物种概率中概率值最高的物种概率对应的类别确定为所述鸟的类别。
在第一方面的一种实现方式中,根据所述鸟的候选区块的区块特征,确定所述待识别图像中的鸟的第一识别结果,包括:从所述候选区块中确定一个或多个区块作为目标区块;按照区块顺序,使用二分法对所述目标区块的区块特征进行分析,得到所述第一识别结果;所述区块顺序是预设的,或者,所述区块顺序是根据所述待识别图像确定的。
在第一方面的一种实现方式中,所述区块顺序为喙、羽冠、脖、背、腿。
在第一方面的一种实现方式中,本申请实施例提供的基于AI的鸟类物种识别方法还包括:根据所述待识别图像中鸟的目标区块的清晰度,确定所述区块顺序。
本申请实施例中,按照清晰度从高到低的顺序对目标区块进行排序,如此,使用二分法先对清晰度较高的区块的区块特征进行二分,能够进一步提升识别的准确率。
在第一方面的一种实现方式中,所述从所述候选区块中确定一个或多个区块作为目标区块,包括:将所述候选区块中的全部区块作为所述目标区块。
在第一方面的一种实现方式中,所述从所述候选区块中确定一个或多个区块作为目标区块,包括:根据所述候选区块的完整度,将所述候选区块中的一种或多个区块作为所述目标区块。
本申请实施例中,区块的完整度用于判断待识别图像中的鸟的区块是否完整,例如,在拍摄鸟类图像时,鸟的某一区块可能被遮挡使得获取的图像中鸟的区块不完整。对于不完整的区块,在使用该区块的区块特征进行鸟类识别时,由于区块不完整导致区块特征的辨识度较低,从而导致识别结果的准确性,因此,先对候选区块的完整度进行判断,从候选区块中选择完整度较高的一些区块作为目标区块,有助于提升识别的准确率。
在第一方面的一种实现方式中,所述鸟为鹈形目,则:
所述喙的特征包括所述喙的颜色特征;
所述羽冠的特征包括所述羽冠的结构特征,所述羽冠的结构特征包括具有羽冠或者不具有羽冠;
所述脖的特征包括所述脖的结构体色特征,所述脖的体色结构特征包括所述脖的颜色为纯色或者非纯色;
所述背的特征包括所述背的结构体色特征,所述背的结构体色特征包括所述背的颜色为纯色或者非纯色;
所述腿的特征包括所述腿的颜色特征。
第二方面,本申请实施例提供一种通信装置,包括第一特征提取模块、第一确定模块、第二特征提取模块、第二确定模块以及第三确定模块。
其中,第一特征提取模块,用于采用第一鸟类特征提取模型提取待识别图像中的鸟的候选区块的区块特征;所述候选区块包括所述鸟的喙、羽冠、脖、背以及腿,所述区块特征包括颜色特征、结构特征以及体色结构特征。
第一确定模块,用于根据所述鸟的候选区块的区块特征,确定所述待识别图像中的鸟的第一识别结果。
第二特征提取模块,用于采用第二鸟类特征提取模型提取所述待识别图像中鸟的关键特征,所述关键特征包括所述鸟的一种或者多种具有排他特性的特征。
第二确定模块,用于根据所述鸟的关键特征,确定所述待识别图像中的鸟的第二识别结果。
第三确定模块,用于基于所述第一识别结果和所述第二识别结果,确定所述待识别图像中鸟的类别。
在第二方面的一种实现方式中,所述第一识别结果包括第一物种概率,所述第二识别结果包括第二物种概率;其中,物种概率包括所述鸟在所有类别上的物种概率,上述第三确定模块具体用于对所述第一物种概率和所述第二物种概率进行加权处理,得到第三物种概率;并且将所述第三物种概率中概率值最高的物种概率对应的类别确定为所述鸟的类别。
在第二方面的一种实现方式中,第一确定模块具体用于从所述候选区块中确定一个或多个区块作为目标区块;并且按照区块顺序,使用二分法对所述目标区块的区块特征进行分析,得到所述第一识别结果。
在第二方面的一种实现方式中,第一确定模块还用于根据待识别图像中鸟的目标区块的清晰度,确定区块顺序。
在第二方面的一种实现方式中,上述通信装置还包括模型训练模块606,该模型训练模块用于基于第一鸟类图像训练集,通过人工智能AI算法训练得到所述第一鸟类特征提取模型,并且基于第二鸟类图像训练集,通过AI算法训练得到所述第二鸟类特征提取模型。
第三方面,本申请实施例提供一种电子设备,包括:处理器和与处理器耦合连接的存储器;存储器用于存储计算机指令,当电子设备运行时,处理器执行存储器存储的所述计算机指令,以使得所述电子设备执行上述第一方面或其任一种实现方式中所述的方法。
第四方面,本申请实施例提供一种计算机可读存储介质,该计算机可读存储介质包括计算机程序,当计算机程序在计算机上运行时,以执行上述第一方面或其任一种实现方式中所述的方法。
上述第二方面至第四方面及其可能的实施方式对应的技术效果可以参考上述对第一方面及其对可能的实施方式的技术效果的描述,此处不再赘述。
附图说明
图1为本申请实施例提供的鸟的区块的示意图;
图2为本申请实施例提供的基于AI的鸟类物种识别方法示意图之一;
图3为本申请实施例提供的基于AI的鸟类物种识别方法示意图之二;
图4为本申请实施例提供的基于AI的鸟类物种识别方法示意图之三;
图5为本申请实施例提供的基于AI的鸟类物种识别方法示意图之四;
图6为本申请实施例提供的通信装置的结构示意图。
具体实施方式
本申请的说明书和权利要求书中如有术语“第一”和“第二”等是用于区别不同的对象,而不是用于描述对象的特定顺序。
在本申请实施例中,“示例性的”或者“例如”等词用于表示作例子、例证或说明。本申请实施例中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言,使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。
在本申请的描述中,除非另有说明,“多个”的含义是指两个或两个以上。例如,多个图像是指两个或两个以上的图像。
应理解,本申请实施例中的鸟的区块指的是鸟的身体的部位,例如鸟的喙、羽冠、脖、背、腿、尾、翅、爪等,图1是对鸟的一些区块的示意性说明。
本申请实施例中,鸟的关键特征是鸟的独特的特征,即某一种鸟不同于其他鸟的特征,可以将鸟的具有排他性的特征作为鸟的关键特征。鸟的关键特征例如包括鸟的姿态、轮廓、生存环境等等,本申请实施例不做限定。
本申请实施例提供的基于AI的鸟类物种识别方法旨在基于对图像的分析处理来识别图像中的鸟的类别(即确定鸟的种类),在以下实施例中,以对鹈形目所包含的不同种类的鸟进行识别为例来说明该基于AI的鸟类物种识别方法。
可以理解的,在动物分类学上鹈形目是鸟纲中的一个目,鹈形目中包括多个鸟种。例如鹈形目中包括的鸟种包括但不限于朱鹮、黑脸琵鹭、海南鳽、栗鳽、黑冠鳽、夜鹭、绿鹭、棕夜鹭、印度池鹭、爪哇池鹭、苍鹭、斑鹭、岩鹭、白鹈鹕、斑嘴鹈鹕、卷羽鹈鹕、黄嘴白鹭、黑头白鹮、白肩黑鹮、彩鹮、白琵鹭、大麻鳽、小苇鳽、黄苇鳽、紫背苇鳽、栗尾鳽、黑鳽、池鹭、牛背鹭、大白鹭、中白鹭、白脸鹭以及白鹭。
为了解决现有技术中,由于训练样本的缺陷而导致对鸟的种类进行识别时准确率较低的问题,本申请实施例提供了一种基于AI的鸟类物种识别方法及装置,该技术方案可以采用第一鸟类特征提取模型提取待识别图像中的鸟的候选区块的区块特征,该候选区块包括所述鸟的喙、羽冠、脖、背以及腿,区块特征包括颜色特征、结构特征以及体色结构特征;并且根据鸟的候选区块的区块特征,确定待识别图像中的鸟的第一识别结果;采用第二鸟类特征提取模型提取待识别图像中鸟的关键特征,该关键特征包括鸟的一种或者多种具有排他特性的特征;并且根据鸟的关键特征,确定待识别图像中的鸟的第二识别结果;进而基于第一识别结果和第二识别结果,确定待识别图像中鸟的类别。通过本申请实施例提供的技术方案,能够提升鸟类识别的准确率。
本申请实施例提供的基于AI的鸟类物种识别方法可以应用于计算机、服务器等电子设备,该电子设备的硬件支持执行该基于AI的鸟类物种识别方法,本申请实施例对电子设备的具体类型和结构等不做限定。
下面以识别鹈形目中的鸟的种类为例,对本申请实施例提供的基于AI的鸟类物种识别方法进行详细描述。如图2所示,该方法包括S201-S205。
S201、采用第一鸟类特征提取模型提取待识别图像中的鸟的候选区块的区块特征。
本申请实施例中,待识别图像是相机获取的包含鸟的图像,鸟的候选区块包括鸟的喙、羽冠、脖、背以及腿。可选地,参考图1,鸟的候选区块也可以包括更多的区块,例如,还可以包括尾、翅、爪等,本申请实施例对此不做限定。
上述鸟的区块特征包括区块的颜色特征、结构特征以及体色结构特征。其中,区块的结构特征指鸟是否具有该区块,例如,区块为羽冠,则结构特征的内容是该鸟具有羽冠或者不具有羽冠;区块的体色结构特征指鸟的该区块是否为纯色,例如,区块为脖,则结构体色特征的内容是脖的颜色是纯色或者非纯色。
在一种实现方式中,当待识别的鸟为鹈形目,候选区块包括喙、羽冠、脖、背以及腿时,则喙的特征包括喙的颜色特征,例如喙的颜色是黄褐色;羽冠的特征包括羽冠的结构特征,羽冠的结构特征包括具有羽冠或者不具有羽冠;脖的特征包括脖的结构体色特征,脖的体色结构特征包括脖的颜色为纯色或者非纯色;背的特征包括背的结构体色特征,背的结构体色特征包括背的颜色为纯色或者非纯色;腿的特征包括腿的颜色特征,例如,腿的颜色是黑色。
可选地,第一鸟类特征提取模型可以为神经网络模型。
S202、根据鸟的候选区块的区块特征,确定待识别图像中的鸟的第一识别结果。
应理解,第一识别结果包括第一物种概率,该第一物种概率包括待识别图像中的鸟在所有类别上的物种概率,也就是说,第一物种概率包括多个概率值。
例如,鸟的种类总共包括5种,分别为物种1,物种2,物种3,物种4以及物种5,则第一物种概率中包括5个物种概率,第1个物种概率表示将该鸟识别为物种1的概率,第2个物种概率表示将该鸟识别为物种2的概率,第3个物种概率表示将该鸟识别为物种3的概率,第4个物种概率表示将该鸟识别为物种4的概率,第5个物种概率表示将该鸟识别为物种5的概率。
应理解,物种概率的确定方法可以为:所有特征通过全连接映射到最终的所有分类类别,每个分类类别得到所有特征在该分类的分数值和,从而得到每个类别的特征分数值,最后通过softmax将分数值转换为概率值,该概率值即为该类别对应的物种概率。
可选地,结合图2,如图3所示,上述S202可以包括:
S2021、从候选区块中确定一个或多个区块作为目标区块。
本申请实施例中,目标区块是用于对待识别图像中的鸟进行种类识别的。
作为一种实现方式,可以选择将待识别图像中的鸟的候选区块全部用于对该鸟进行种类识别,即将候选区块中的全部区块作为目标区块,例如,候选区块包括喙、羽冠、脖、背以及腿,则目标区块包括喙、羽冠、脖、背以及腿。
作为一种实现方式,可以选择候选区块中的部分区块用于对该鸟进行种类识别,即将候选区块中的部分区块作为目标区块,例如,候选区块包括喙、羽冠、脖、背以及腿,则目标区块包括羽冠、脖、背以及腿。
在一种实现方式中,上述从候选区块中确定一个或多个区块作为目标区块,包括:根据候选区块的完整度,将候选区块中的一种或多个区块作为目标区块。本申请实施例中,区块的完整度用于判断待识别图像中的鸟的区块是否完整,例如,在拍摄鸟类图像时,鸟的某一区块可能被遮挡使得获取的图像中鸟的区块不完整。对于不完整的区块,在使用该区块的区块特征进行鸟类识别时,由于区块不完整导致区块特征的辨识度较低,从而导致识别结果的准确性,因此,先对候选区块的完整度进行判断,从候选区块中选择完整度较高的一些区块作为目标区块,有助于提升识别的准确率。
可选地,可以根据提取的候选区块的区块特征确定区块的完整度,有的区块的特征的输出可能为空,这种情况下,将输出为空的候选区块确定为不完整的区块,将该区块从候选区块中剔除,将剩余的区块作为目标区块。当然,也可以采用其他方法判断区块的完整度,本申请实施例对此不做限定。
S2022、按照区块顺序,使用二分法对目标区块的区块特征进行分析,得到第一识别结果。
上述区块顺序是目标区块中的各个区块的顺序。
其中,区块顺序是预设的,或者,区块顺序是根据待识别图像确定的。
本申请实施例中,预设的区块顺序可以是预先定义(或设置)好的顺序。例如,目标区块包括喙、羽冠、脖、背、腿,该预设的区块顺序是喙、羽冠、脖、背、腿,或者预设的区块顺序是羽冠、喙、脖、腿、背,等等,本申请不再一一罗列。
可选地,上述根据待识别图像确定区块顺序的方法包括:根据待识别图像中鸟的目标区块的清晰度,确定区块顺序,按照清晰度从高到低的顺序对目标区块进行排序,如此在使用二分法分类时,也是按照区块的清晰度从高到低的顺序依次对各个区块的特征进行二分。
本申请实施例中,可以通过计算待识别图像中的各个区块对应的图像块的梯度,通过梯度判断区块的清晰度,具体的,区块的梯度越大说明区块越清晰。如此,使用二分法先对清晰度较高的区块的区块特征进行二分,能够进一步提升识别的准确率。
可以理解的,二分法是一种按照一定的逻辑顺序进行推演实现分类的一种方法,使用一种特征进行一次二分的结果包括两种,即:是或否。例如,使用喙的颜色特征进行二分时,通过喙的颜色是否为黄褐色可以得到是黄褐色或者非黄褐色两种二分结果。
示例性的,对鹈形目的种类进行识别时,假设目标区块包括喙、羽冠、脖、背、腿,区块顺序是喙、羽冠、脖、背、腿,上述按照区块顺序,使用二分法对目标区块的区块特征进行分析,以确定待识别图像中的鸟的种类具体包括:确定鸟的喙的颜色是否为黄褐色、确定鸟是否具有羽冠、确定脖的颜色是否为纯色、确定背的颜色是否为纯色、确定腿的颜色是否为黑色,进而根据各个区块的区块特征的二分结果确定鸟的种类。
S203、采用第二鸟类特征提取模型提取待识别图像中鸟的关键特征。
其中,关键特征包括鸟的一种或者多种具有排他特性的特征。
例如,在鹈形目中,琵鹭属中的鸟是高度相似的,通过形态、轮廓或者区块特征可能无法准确区分不同的琵鹭,琵鹭属中的鸟具有独特的形式琵琶的喙,不同的琵鹭,喙的一些细节特征不同,例如,白琵鹭的喙的端部的颜色为黄色,因此,可以将白琵鹭的喙的端部的颜色作为白琵鹭的关键特征;又例如,黑脸琵鹭的喙的端部的颜色为黑色,因此,可以将黑脸琵鹭的喙的端部的颜色作为黑脸琵鹭的关键特征。
又例如,鹈形目中,斑鹭成体雄鸟羽毛由大片的黑色与白色组成,其胸前白色的辐射状饰羽就显得极为独特,这在鹈形目当中是唯一的,因此可以将胸前饰羽的颜色及形状作为斑鹭的关键特征。
又例如,鹈形目中,苍鹭整体羽色由黑色,白色,灰色构成,在其颈部前方黑色与白色羽毛构成了独特的纵纹,这在其他鹈形目鸟类当中也是独特的特征,因此,可以将颈部的纹路特征作为苍鹭的关键特征。
S204、根据鸟的关键特征,确定待识别图像中的鸟的第二识别结果。
本申请实施例中,第二识别结果包括第二物种概率,与第一物种概率类似,该第二物种概率包括待识别图像中的鸟在所有类别上的物种概率,也就是说,第二物种概率包括多个概率值。
需要说明的是,本申请实施例不限制S201-S202与S203-S204的执行顺序,电子设备可以先S201-S202,后执行S203-S204,也可以先执行S203-S204,后执行S201-S202,也可以同时执行S201-S202和S203-S204。
S205、基于第一识别结果和第二识别结果,确定待识别图像中鸟的类别。
基于上述实施例,第一识别结果包括第一物种概率,第二识别结果包括第二物种概率,结合图2或图3,如图4所示,上述S205包括S2051-S2052。
S2051、对第一物种概率和第二物种概率进行加权处理,得到第三物种概率。
以第一物种概率中的一个概率值和第二物种概率中的一个概率值为例,根据下述公式对第一物种概率和第二物种概率进行加权处理:
P3=P1×W1+P2×W2
其中,P3为第三物种概率,P1为第一物种概率,W1为第一物种概率对应的权重,P2为第二物种概率,W2为第二物种概率对应的权重,W1与W2之和为1。
应理解,第一物种概率包括所有类别对应的概率,其中,所有类别对应的概率的权重相同,都采用W1;第二物种概率包括所有类别对应的概率,其中,所有类别对应的概率的权重相同,都采用W2。
本申请实施例中,可以根据图像中鸟的整体与局部的特征的重要性设置第一物种概率的权重和第二物种概率的权重。例如,对于鸟的整体特征较为相似,局部特征6不同,因此确定局部特征更为重要,此时,局部的特征可以作为关键特征,因此可以将关键特征对应的第二物种概率的权重设置的较大一些。
S2052、将第三物种概率中概率值最高的物种概率对应的类别确定为待识别图像中的鸟的类别。
本申请实施例中,将基于区块特征进行识别的物种概率与基于关键特征进行识别的物种概率进行加权处理,可以更加科学地平衡鸟类关键特征和区块特征的关系,避免因为某一种特征不清晰或者缺失使得识别结果不准确的问题,能够提高鸟类识别的正确率。
可选地,结合图2至图4,如图5所示,本申请实施例提供的基于AI的鸟类物种识别方法还包括S206-S207。
S206、基于第一鸟类图像训练集,通过人工智能AI算法训练得到第一鸟类特征提取模型。
该第一鸟类特征提取模型用于提取图像中鸟的候选区块的区块特征,该第一鸟类特征提取模型是基于AI算法训练得到,本申请不对该第一鸟类特征提取模型的结构进行限定,例如,该鸟类特征提取模型可以为神经网络等,其中,AI算法包括但不限于深度学习、机器学习等算法。
可以理解的,上述第一鸟类图像训练集包括多个图像以及对该多个图像中的鸟的区块特征的标注结果,区块特征的标注结果指示该区块特征的具体内容。例如,鸟的区块为喙,且区块特征是颜色特征,区块特征的标注结果是黄褐色;鸟的区块是羽冠,且区块特征是结构特征,区块特征的标注结果是无羽冠;鸟的区块是脖,且区块特征是结构体色特征,区块特征的标注结果是非纯色;鸟的区块是背,且区块特征是结构特色特征,区块特征的标注结果是纯色;鸟的区块是腿,且区块特征是颜色特征,区块特征的标注结果是黑色。
可选地,该图像中的鸟的区块特征的标注结果可以是人工标注结果,即人工对图像中的鸟的各个区块的特征进行判断并标注,该标注结果即区块特征的真实值。
本申请实施例中,训练第一鸟类特征提取模型的过程是采用第一鸟类图像训练集对初始化的特征提取模型进行不断更新的过程,具体的,是对第一鸟类特征提取模型的参数进行不断更新。在构建完毕鸟类图像数据库(包括上述的鸟类图像训练集、验证集以及测试集)和第一鸟类特征提取模型后模型,启动模型训练,该模型训练和评估过程包括:
第一步、模型训练。
将第一鸟类图像训练集中的训练样本输入第一鸟类特征提取模型,计算得到区块特征的预测值,并计算该区块特征的预测值与真实值之间的损失函数值,并执行梯度反向传播,并根据设置的优化算法更新模型的参数。
应理解,模型训练是经过多轮迭代的,每轮迭代遍历一次训练集,并且每次从中获取一小批样本,送入模型执行前向计算得到预测值,通过观察每轮迭代的损失值的减小趋势,以判断模型训练效果,例如损失值减小趋势不变时,说明模型趋于收敛。
第二步、模型评估。
将鸟类测试集输入至训练好的模型进行评估,得到预测值,计算预测值与真实值之间的损失函数值,并计算评价指标值,便于评估模型效果。
第三步,模型推理。
将待验证的鸟类数据输入至训练好的模型执行推理,观察并验证推理结果是否达到预期。
与现有的自适应地确定鸟的重要特征(例如轮廓、姿态等特征)的模型相比,由于本申请实施例是针对鸟类图像数据库中的鸟的候选区块,对候选区块的区块特征进行标注,并使用该数据库中的训练集训练得到能够提取区块特征的第一鸟类特征提取模型,该特征提取模块提取的鸟的特征更为具体,并且具有较高的辨识度。特别地,对于训练集中的样本数量不足的情况,本申请实施例中的第一鸟类特征提取模型提取的到辨识度较高的特征更有利于鸟类识别,有助于提高鸟类识别的准确率。
S207、基于第二鸟类图像训练集,通过AI算法训练得到第二鸟类特征提取模型。
第二鸟类图像训练集包括多个图像以及对所述多个图像中的鸟的关键特征的标注结果。
本申请实施例中,训练第二鸟类特征提取模型的过程与训练第一鸟类特征提取模型的过程类似,相关细节可以上述S206,此处不再赘述。
可选地,第二鸟类图像训练集与上述第一鸟类图像训练集可以为同一训练集,也可以为不同训练集,本申请实施例不做限定。
相应的,本申请实施例提供一种通信装置,如图6所示,该通信装置包括第一特征提取模块601、第一确定模块602、第二特征提取模块603、第二确定模块604以及第三确定模块605。
第一特征提取模块601,用于采用第一鸟类特征提取模型提取待识别图像中的鸟的候选区块的区块特征;所述候选区块包括所述鸟的喙、羽冠、脖、背以及腿,所述区块特征包括颜色特征、结构特征以及体色结构特征,例如执行上述方法实施例中的S201。
第一确定模块602,用于根据所述鸟的候选区块的区块特征,确定所述待识别图像中的鸟的第一识别结果,例如执行上述方法实施例中的S202。
第二特征提取模块603,用于采用第二鸟类特征提取模型提取所述待识别图像中鸟的关键特征,所述关键特征包括所述鸟的一种或者多种具有排他特性的特征,例如执行上述方法实施例中的S203。
第二确定模块604,用于根据所述鸟的关键特征,确定所述待识别图像中的鸟的第二识别结果,例如执行上述方法实施例中的S204;
第三确定模块605,用于基于所述第一识别结果和所述第二识别结果,确定所述待识别图像中鸟的类别,例如执行上述方法实施例中的S205。
可选地,所述第一识别结果包括第一物种概率,所述第二识别结果包括第二物种概率;其中,物种概率包括所述鸟在所有类别上的物种概率,上述第三确定模块605具体用于对所述第一物种概率和所述第二物种概率进行加权处理,得到第三物种概率;并且将所述第三物种概率中概率值最高的物种概率对应的类别确定为所述鸟的类别,例如执行上述方法实施例中的S2051-S2052。
可选地,上述第一确定模块602具体用于从所述候选区块中确定一个或多个区块作为目标区块;并且按照区块顺序,使用二分法对所述目标区块的区块特征进行分析,得到所述第一识别结果,例如执行上述实施例中的S2021-S2022。
可选地,上述第一确定模块602还用于根据待识别图像中鸟的目标区块的清晰度,确定区块顺序。
可选地,上述通信装置还包括模型训练模块606,该模型训练模块606用于基于第一鸟类图像训练集,通过人工智能AI算法训练得到所述第一鸟类特征提取模型,并且基于第二鸟类图像训练集,通过AI算法训练得到所述第二鸟类特征提取模型,例如执行上述方法实施例中的S206和S207。
上述通信装置的各个模块还可以用于执行上述方法实施例中的其他步骤,上述方法实施例涉及的各步骤的所有相关内容均可以援引到对应功能模块的功能描述,在此不再赘述。
本申请实施例还提供一种电子设备,包括:处理器和与处理器耦合连接的存储器;存储器用于存储计算机指令,当电子设备运行时,处理器执行存储器存储的计算机指令,以使得电子设备执行上述实施例中所述的方法。
本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质包括计算机程序,当计算机程序在计算机上运行时,以执行上述实施例中所述的方法。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围。
Claims (10)
1.一种基于AI的鸟类物种识别方法,其特征在于,包括:
采用第一鸟类特征提取模型提取待识别图像中的鸟的候选区块的区块特征;所述候选区块包括所述鸟的喙、羽冠、脖、背以及腿,所述区块特征包括颜色特征、结构特征以及体色结构特征;
根据所述鸟的候选区块的区块特征,确定所述待识别图像中的鸟的第一识别结果;
采用第二鸟类特征提取模型提取所述待识别图像中鸟的关键特征,所述关键特征包括所述鸟的一种或者多种具有排他特性的特征;
根据所述鸟的关键特征,确定所述待识别图像中的鸟的第二识别结果;
基于所述第一识别结果和所述第二识别结果,确定所述待识别图像中鸟的类别。
2.根据权利要求所述的方法,其特征在于,所述第一识别结果包括第一物种概率,所述第二识别结果包括第二物种概率;其中,物种概率包括所述鸟在所有类别上的物种概率;
所述基于所述第一识别结果和所述第二识别结果,确定所述待识别图像中鸟的类别,包括:
对所述第一物种概率和所述第二物种概率进行加权处理,得到第三物种概率;
将所述第三物种概率中概率值最高的物种概率对应的类别确定为所述鸟的类别。
3.根据权利要求1或2所述的方法,其特征在于,所述根据所述鸟的候选区块的区块特征,确定所述待识别图像中的鸟的第一识别结果,包括:
从所述候选区块中确定一个或多个区块作为目标区块;
按照区块顺序,使用二分法对所述目标区块的区块特征进行分析,得到所述第一识别结果;所述区块顺序是预设的,或者,所述区块顺序是根据所述待识别图像确定的。
4.根据权利要求3所述的方法,其特征在于,
所述区块顺序为喙、羽冠、脖、背、腿。
5.根据权利要求3或4所述的方法,其特征在于,所述方法还包括:
根据所述待识别图像中鸟的目标区块的清晰度,确定所述区块顺序。
6.根据权利要求3至5任一项所述的方法,其特征在于,所述从所述候选区块中确定一个或多个区块作为目标区块,包括:
将所述候选区块中的全部区块作为所述目标区块。
7.根据权利要求3至5任一项所述的方法,其特征在于,所述从所述候选区块中确定一个或多个区块作为目标区块,包括:
根据所述候选区块的完整度,将所述候选区块中的一种或多个区块作为所述目标区块。
8.根据权利要求1至7任一项所述的方法,其特征在于,所述鸟为鹈形目,则:
所述喙的特征包括所述喙的颜色特征;
所述羽冠的特征包括所述羽冠的结构特征,所述羽冠的结构特征包括具有羽冠或者不具有羽冠;
所述脖的特征包括所述脖的结构体色特征,所述脖的体色结构特征包括所述脖的颜色为纯色或者非纯色;
所述背的特征包括所述背的结构体色特征,所述背的结构体色特征包括所述背的颜色为纯色或者非纯色;
所述腿的特征包括所述腿的颜色特征。
9.根据权利要求1至8任一项所述的方法,其特征在于,所述方法还包括:
基于第一鸟类图像训练集,通过人工智能AI算法训练得到所述第一鸟类特征提取模型,所述第一鸟类图像训练集包括多个图像以及对所述多个图像中的鸟的区块特征的标注结果;
基于第二鸟类图像训练集,通过AI算法训练得到所述第二鸟类特征提取模型,所述第二鸟类图像训练集包括多个图像以及对所述多个图像中的鸟的关键特征的标注结果。
10.一种通信装置,其特征在于,包括:
第一特征提取模块,用于采用第一鸟类特征提取模型提取待识别图像中的鸟的候选区块的区块特征;所述候选区块包括所述鸟的喙、羽冠、脖、背以及腿,所述区块特征包括颜色特征、结构特征以及体色结构特征;
第一确定模块,用于根据所述鸟的候选区块的区块特征,确定所述待识别图像中的鸟的第一识别结果;
第二特征提取模块,用于采用第二鸟类特征提取模型提取所述待识别图像中鸟的关键特征,所述关键特征包括所述鸟的一种或者多种具有排他特性的特征;
第二确定模块,用于根据所述鸟的关键特征,确定所述待识别图像中的鸟的第二识别结果;
第三确定模块,用于基于所述第一识别结果和所述第二识别结果,确定所述待识别图像中鸟的类别。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211398746.3A CN115690448A (zh) | 2022-11-09 | 2022-11-09 | 一种基于ai的鸟类物种识别方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211398746.3A CN115690448A (zh) | 2022-11-09 | 2022-11-09 | 一种基于ai的鸟类物种识别方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115690448A true CN115690448A (zh) | 2023-02-03 |
Family
ID=85050531
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211398746.3A Pending CN115690448A (zh) | 2022-11-09 | 2022-11-09 | 一种基于ai的鸟类物种识别方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115690448A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115761329A (zh) * | 2022-11-14 | 2023-03-07 | 广东省科学院动物研究所 | 一种鸟类识别方法及装置 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160063310A1 (en) * | 2013-03-28 | 2016-03-03 | Nec Corporation | Bird detection device, bird detection system, bird detection method, and program |
CN110363146A (zh) * | 2019-07-16 | 2019-10-22 | 杭州睿琪软件有限公司 | 一种物体识别方法、装置、电子设备和存储介质 |
CN110472609A (zh) * | 2019-08-21 | 2019-11-19 | 广东工业大学 | 一种鸟类图像识别方法、装置、设备和存储介质 |
CN111709421A (zh) * | 2020-06-18 | 2020-09-25 | 深圳市赛为智能股份有限公司 | 鸟类识别方法、装置、计算机设备及存储介质 |
CN113314127A (zh) * | 2021-04-23 | 2021-08-27 | 广州大学 | 基于空间方位的鸟鸣识别方法、系统、计算机设备与介质 |
CN113591520A (zh) * | 2020-04-30 | 2021-11-02 | 华为技术有限公司 | 一种图像识别方法、入侵对象检测方法及装置 |
CN114419444A (zh) * | 2022-01-24 | 2022-04-29 | 中国民航大学 | 一种基于深度学习网络的轻量化的高分辨率鸟群识别方法 |
CN115035450A (zh) * | 2022-06-14 | 2022-09-09 | 西安天和防务技术股份有限公司 | 确定动物种类的方法及装置 |
CN115063601A (zh) * | 2022-06-28 | 2022-09-16 | 中国科学院半导体研究所 | 基于图像和音频双模态鸟类识别方法、装置、设备及介质 |
-
2022
- 2022-11-09 CN CN202211398746.3A patent/CN115690448A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160063310A1 (en) * | 2013-03-28 | 2016-03-03 | Nec Corporation | Bird detection device, bird detection system, bird detection method, and program |
CN110363146A (zh) * | 2019-07-16 | 2019-10-22 | 杭州睿琪软件有限公司 | 一种物体识别方法、装置、电子设备和存储介质 |
CN110472609A (zh) * | 2019-08-21 | 2019-11-19 | 广东工业大学 | 一种鸟类图像识别方法、装置、设备和存储介质 |
CN113591520A (zh) * | 2020-04-30 | 2021-11-02 | 华为技术有限公司 | 一种图像识别方法、入侵对象检测方法及装置 |
CN111709421A (zh) * | 2020-06-18 | 2020-09-25 | 深圳市赛为智能股份有限公司 | 鸟类识别方法、装置、计算机设备及存储介质 |
CN113314127A (zh) * | 2021-04-23 | 2021-08-27 | 广州大学 | 基于空间方位的鸟鸣识别方法、系统、计算机设备与介质 |
CN114419444A (zh) * | 2022-01-24 | 2022-04-29 | 中国民航大学 | 一种基于深度学习网络的轻量化的高分辨率鸟群识别方法 |
CN115035450A (zh) * | 2022-06-14 | 2022-09-09 | 西安天和防务技术股份有限公司 | 确定动物种类的方法及装置 |
CN115063601A (zh) * | 2022-06-28 | 2022-09-16 | 中国科学院半导体研究所 | 基于图像和音频双模态鸟类识别方法、装置、设备及介质 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115761329A (zh) * | 2022-11-14 | 2023-03-07 | 广东省科学院动物研究所 | 一种鸟类识别方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110334765B (zh) | 基于注意力机制多尺度深度学习的遥感影像分类方法 | |
Hall et al. | Evaluation of features for leaf classification in challenging conditions | |
Cai et al. | Cattle face recognition using local binary pattern descriptor | |
CN109410184B (zh) | 基于稠密对抗网络半监督学习的直播色情图像检测方法 | |
CN115690448A (zh) | 一种基于ai的鸟类物种识别方法及装置 | |
CN111401343B (zh) | 识别图像中人的属性的方法、识别模型的训练方法和装置 | |
CN114821204A (zh) | 一种基于元学习嵌入半监督学习图像分类方法与系统 | |
CN114463675A (zh) | 一种水下鱼类群组活动强度识别方法及装置 | |
CN115170548A (zh) | 基于无监督学习的皮革缺陷自动检测方法及装置 | |
CN111860117A (zh) | 一种基于深度学习的人体行为识别方法 | |
CN110837818A (zh) | 一种基于卷积神经网路的中华白海豚背鳍识别方法 | |
Thompson et al. | Semi‐automated image analysis for the identification of bivalve larvae from a Cape Cod estuary | |
CN112257730A (zh) | 植物害虫图像识别方法、装置、设备及存储介质 | |
CN111860601A (zh) | 预测大型真菌种类的方法及装置 | |
CN115761329A (zh) | 一种鸟类识别方法及装置 | |
Kaur et al. | Finger print Recognition Using Genetic Algorithm and Neural Network | |
CN114067155A (zh) | 基于元学习的图像分类方法、装置、产品及存储介质 | |
Chan et al. | A trainable n-tuple pattern classifier and its application for monitoring fish underwater | |
Mazurek et al. | Canine age classification using Deep Learning as a step toward preventive medicine in animals | |
CN114792436A (zh) | 人脸深度图像质量评价方法及系统、电子设备及存储介质 | |
CN112819527A (zh) | 一种用户分群处理方法及装置 | |
CN111553202A (zh) | 进行活体检测的神经网络的训练方法、检测方法及装置 | |
Lee et al. | Identifying Fagaceae species in Taiwan using leaf images | |
Penpong et al. | Development of oo-do-aware parasite egg detection | |
Mohanta et al. | A study on application of artificial neural network and genetic algorithm in pattern recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |