CN106056043B - 基于迁移学习的动物行为识别方法和装置 - Google Patents
基于迁移学习的动物行为识别方法和装置 Download PDFInfo
- Publication number
- CN106056043B CN106056043B CN201610339756.8A CN201610339756A CN106056043B CN 106056043 B CN106056043 B CN 106056043B CN 201610339756 A CN201610339756 A CN 201610339756A CN 106056043 B CN106056043 B CN 106056043B
- Authority
- CN
- China
- Prior art keywords
- sample
- behavior
- animal
- training
- target animal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 241001465754 Metazoa Species 0.000 title claims abstract description 148
- 230000006399 behavior Effects 0.000 title claims abstract description 113
- 238000000034 method Methods 0.000 title claims abstract description 73
- 238000013526 transfer learning Methods 0.000 title claims abstract description 46
- 238000012549 training Methods 0.000 claims abstract description 87
- 238000012360 testing method Methods 0.000 claims abstract description 68
- 230000000694 effects Effects 0.000 claims abstract description 55
- 230000003044 adaptive effect Effects 0.000 claims abstract description 7
- 239000000284 extract Substances 0.000 claims abstract description 7
- 238000004458 analytical method Methods 0.000 claims description 7
- 238000005457 optimization Methods 0.000 claims description 4
- 239000012141 concentrate Substances 0.000 claims 1
- 238000009826 distribution Methods 0.000 description 13
- 230000006870 function Effects 0.000 description 8
- 241000282326 Felis catus Species 0.000 description 5
- 239000011159 matrix material Substances 0.000 description 5
- 238000013508 migration Methods 0.000 description 4
- 230000005012 migration Effects 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 3
- 230000004927 fusion Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000000513 principal component analysis Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000013398 bayesian method Methods 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007500 overflow downdraw method Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/52—Surveillance or monitoring of activities, e.g. for recognising suspicious objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明提出了一种基于迁移学习的目标动物行为识别方法和装置,即训练数据集中的训练样本包括人的行为样本、非目标动物的行为样本和目标动物的行为样本中的一种或几种的组合,测试数据集为目标动物的行为样本。该发明步骤包括:步骤101,针对训练数据集中的每一个训练样本和测试数据集中的每一测试样本,提取原始特征;步骤102,采用迁移学习中的领域适应学习法将所述原始特征映射到共同空间中,得到新的特征;步骤103,利用所述新的特征训练SVM分类器,得到行为识别模型,同时对所述目标动物行为识别模型进行测试;步骤104,利用所述动物行为识别模型对目标动物的待识别行为进行识别。本发明提出的基于迁移学习的行为识别方法能有效的识别动物的行为。
Description
技术领域
本发明属于机器学习、计算机视觉的技术在动物行为的自动识别方面的应用,适用于动物行为的自动识别、动物异常行为分析等动物行为学的各项研究。
背景技术
随着监控视频和网络视频的数量日渐增多,视频中自动识别行为的技术变得越来越重要。如人的行为识别一样,动物的行为识别也很重要,它的应用包括野生动物行为分析、宠物的监控等。但是,获取动物行为视频的训练数据比较困难,特别是对某些稀有动物。
一些哲学家和行为研究者认为,不同种类之间的行为是相似的。考虑到人的行为的训练数据容易获取,于是我们提出一个新的问题,能否用人的行为的数据来帮助识别动物的行为?或者进一步,能否用人和某些动物的数据帮助识别另外一些动物的行为?
考虑到不同的种类的动物或者人,行为的表现方式不同,这些差别对应到所提取的特征上,就是特征的分布不一样。传统机器学习中的分类方法假设训练数据和测试数据的分布是一致的,所以不能直接采用人的行为的特征做训练来帮助做动物的行为识别。因为迁移学习(transfer learning,简称TL)针对训练数据和测试数据的分布不一致的情况,所以我们正好利用TL来解决这个问题。
发明内容
针对动物的行为识别中训练数据获取困难这个问题,本发明提出了一种基于迁移学习的动物的行为识别方法和装置。
根据本发明一方面,提供了一种基于迁移学习的目标动物行为识别方法,其包括:
步骤101,针对训练数据集中的每一个训练样本和测试数据集中的每一测试样本,提取原始特征;
步骤102,采用迁移学习中的领域适应学习法将所述原始特征映射到共同空间中,得到新的特征;
步骤103,利用所述新的特征训练SVM分类器,得到目标动物行为识别模型,同时对所述目标动物行为识别模型进行测试;
步骤104,利用所述动物行为识别模型对目标动物的待识别行为进行识别。
根据本发明另一方面,提供了一种基于迁移学习的目标动物行为识别装置,其包括:
特征提取模块,用于针对训练数据集中的每一个训练样本和测试数据集中的每一测试样本,提取原始特征;
特征优化模块,用于采用迁移学习中的领域适应学习法将所述原始特征映射到共同空间中,得到新的特征;
训练和测试模块,用于利用所述新的特征训练SVM分类器,得到目标动物行为识别模型,同时对所述目标动物行为识别模型进行测试;
分类和识别模块,用于利用所述动物行为识别模型对目标动物的待识别行为进行识别。
附图说明
图1为本发明的主要四个步骤,即特征提取、特征优化、训练和测试和分类和识别。
图2是本发明中所述训练数据集中的训练样本仅为人的行为样本时,目标动物行为识别的算法流程图。行为识别的算法如下:
步骤1:分别对训练数据和测试数据提取原始特征;
步骤2:采用迁移学习中领域适应学习(domain adaption learning,简称DAL)把训练数据的特征和测试数据的特征一起映射到一个共同的空间,得到新的特征,以减小来自人和动物的两类特征在概率分布上的差异;
步骤3:采用新特征训练、测试,识别目标动物的行为。
图3是本发明中所述训练数据集中的训练样本为人的行为样本和非目标动物的行为样本的组合时,目标动物行为识别的算法流程图。行为识别的算法如下:
步骤1:分别对训练数据和测试数据提取原始特征;
步骤2:对每一个来源(人或者某一类动物)的数据的特征和测试数据的特征,经过DAL,得到新的特征,采用这部分训练数据训练得到某个行为识别模型,最后得到多个从不同来源迁移的行为识别的模型;
步骤3:采用集成迁移学习(ensemble transfer learning,简称ETL) 的方法融合多个不同来源的迁移学习模型,以此识别目标动物的行为。
图4是本发明中所述训练数据集中的训练样本为人的行为样本、非目标动物的行为样本和目标动物的行为样本的组合时,目标动物行为识别的算法流程图。这里通过三种策略解决这个问题。第一种策略只采用目标动物的部分有标注的数据做训练。第二种策略用人和多类其它动物的行为的数据做训练。第三种策略是前两种的结合,本发明中通过对前两种策略所预测的行为的概率分布做后融合。
图5是A2D数据库中人和部分动物对应的行为示意图。
具体实施方式
下面结合实例,并参照附图,叙述本发明的具体细节,并给出实验结果和相关分析。
本发明提出了一种基于迁移学习的目标动物行为识别方法,其包括:
步骤101,针对训练数据集中的每一个训练样本和测试数据集中的每一测试样本,提取原始特征;
步骤102,采用迁移学习中的领域适应学习法将所述原始特征映射到共同空间中,得到新的特征;
步骤103,利用所述新的特征训练SVM分类器,得到目标动物行为识别模型,同时对所述目标动物行为识别模型进行测试;
步骤104,利用所述动物行为识别模型对目标动物的待识别行为进行识别。
上述方法中,所述训练数据集中的训练样本包括人的行为样本、非目标动物的行为样本和目标动物的行为样本中的一种或几种的组合。
上述方法中,所述训练数据集中的训练样本仅为人的行为样本时,步骤103包括:
对于人的行为样本,训练得到第一目标动物识别模型;
利用第一目标动物识别模型识别待识别行为,得到最终的识别结果。
上述方法中,所述训练数据集中的训练样本为人的行为样本和非目标动物的行为样本的组合时,步骤103包括:
对于不同种类的行为样本,分别训练得到不同的中间识别模型,利用集成迁移学习法将所述不同的中间识别模型融合成一个目标动物识别模型。
上述方法中,所述训练数据集中的训练样本为人的行为样本、非目标动物的行为样本和目标动物的行为样本的组合时,步骤103包括:
对于目标动物的行为样本,训练得到第一目标动物识别模型;
对于出目标动物的其他不同种类的行为样本,分别训练得到不同的中间识别模型;
对于利用集成迁移学习法将所述中间识别模型融合成第二目标动物识别模型;
利用第一目标动物识别模型和第二目标动物识别模型分别识别待识别行为,并结合两个识别结果得到最终的识别结果。
对输入视频,第一步要提取原始特征。我们采用在当前行为识别研究中比较流行的密集轨迹(dense trajectory)方法。首先,提取TRJ(trajectories)、 HOG(histogramsof oriented gradients)、HOF(histograms of optical flow)、 MBH(motion boundaryhistogram)四种局部特征,经过主成分分析 (principal component analysis,简称PCA)把特征维度降到原来的一半,然后采用词袋模型(bag of words)对每一种局部特征编码,视觉词典(visual words)的个数设置为2000,于是对每个视频得到TRJ、HOG、HOF、MBH 四种局部特征的直方图特征,最后把它们串接起来,作为视频的原始特征。本发明不限于上述四种原始特征,本方法对原始特征没有限定,适用任何有效的行为识别的特征。
由于来自人和动物的原始特征的概率分布不同,我们采用迁移学习的方法把原始特征转化为新的特征,最后采用线性支持向量机(support vector machine,SVM)作为最后特征的分类器,设置参数C=500。迁移学习的方法具体如下所述。
图2中,用人的行为的数据训练,把训练好的模型迁移到目标动物,以识别该动物的行为。在提取原始特征之后,我们采用TL中迁移稀疏编码(transfer sparse coding,简称TSC)的方法(Long等人提出),为了减小训练数据和测试数据在特征分布上的差异性,把训练和测试数据的原始特征一起映射到一个共同的空间,得到新的特征。该方法具体步骤如下。
记H=[h1,…,hN]∈RD×N为原始特征矩阵,其中D表示特征维度,N表示总的特征数目,N=Ns+Nt,H的前Ns列为训练数据的特征,后Nt列为测试数据的特征。U=[u1,…,uK]∈RD×K为稀疏编码的词典,基的个数为K。 V=[v1,…,vN]∈RK×N为原始特征经过稀疏编码后的新特征所组成的矩阵。迁移稀疏编码TSC的目标函数如下所示:
式中,λ,μ,γ为模型系数,实验中取固定的值,矩阵M,L为迁移学习相关参数,解释如下。
该目标函数由三项组成。第一项是稀疏编码的重构误差,第二项是对编码的L1正则,使得新特征产生稀疏的效果,前两项是传统的稀疏编码方法。第三项是针对迁移学习的,由两部分组成,即最大均值差异(maximum mean discrepancy,简称MMD)正则化和图拉普拉斯(graph Laplacian,简称GL)正规化。
MMD是对概率分布的一种非参数度量方法,它采用两个不同概率分布的均值之间的距离作为这两个概率分布之间的距离度量,计算如下:
式中,矩阵M具有如下形式:
MMD正则化能够减小来自不同分布的特征经过编码后的差异,当且仅当两类分布相同的时候,MMD渐进趋近于0,相当于没有加约束。
如果两个特征在原始空间距离近,那么在编码的特征在新的空间距离也应该近,GL正规化正是基于这个思路。它采用K近邻对特征在原始空间的邻近关系建模,构建邻接矩阵W如下:
定义GL矩阵L=W-D,其中,D=diag(d1,…,dN),并最小化以下函数:
对于公式(1)中的目标函数,可以采用两步走的优化方法求解。第一步,固定词典U,计算最优的编码V;第二步,固定编码V,计算最优的词典U。这两个步骤交替迭代,一直到目标函数值不再下降或者误差在可接受的范围之内。
对于新特征V,采用来自人的训练数据做训练,得到行为识别的模型,然后采用测试数据对所述目标动物进行测试,用于识别目标动物的行为,测试过程中分类器参数不变。作为对比方法,我们对原始特征做类似的处理。
图3中,用人和多类其它动物的行为的数据训练,把多个训练好的模型迁移到同一类目标动物。对每一个来源(人或者某一类动物)的训练数据,采用图1中所述的方法,得到从这个来源迁移的行为识别模型。集成迁移学习(ensemble transfer learning,简称ETL)是把多个TL模型的结果整合到一起的一类机器学习方法,正好针对我们的这个问题。这里,我们采用局部加权集成(locally weighted ensemble,简称LWE)的方法(Gao 等人提出)。具体过程如下所述。
假设已知l个从不同来源迁移的识别模型和测试数据集合DT,根据贝叶斯法则,测试样本的后验概率估计如下:
式中,P(y|h,Mk)表示模型Mk判断样本h∈DT是行为y的概率,P(Mk|h)表示样本h选择模型Mk来分类的概率,我们可以把P(Mk|h)看做对某一个样本h的权重系数,即并作为模型需要估计的参数。
测试样本h的真实标签是未知的,f(h)表示测试数据的概率密度函数。我们认为以下两条假设是合理的:假设1,对某个测试样本,如果某个模型的预测概率(P(y|h,Mk))的分布和该样本真实的概率(p(y|h))的分布接近,那么这个模型应该拥有对这个样本相对较大的权重系数;假设2,在概率密度f(h)值较大的区域,该密度函数的变化相对平缓,也就是说,分类的边界应该在概率密度值较小的区域。
但是,对于高维数据,概率密度函数f(h)很难准确估计,特别是样本数目缺乏的情况下。这里,我们采用一种替代的办法。首先,对测试样本聚类,并认为聚类中心的边界处对应概率密度低的区域。对于样本h,如果模型Mk预测的分类边界和聚类中心的边界一致,我们认为P(y|h,Mk)和标签真实的分布很像,也就是说,的值较大。
因此,我们采用一种聚类的方法来估计模型对于样本的权重系数。首先,把测试数据聚为c个类别,并构造图GT=(VT,ET),VT表示测试样本集合,ET表示测试样本之间的连接关系,当且仅当两个不同的样本属于同一个聚类中心时,它们之间才会有边相连接。接着,对于每一个模型Mk,我们构造类似的图不同之处在于边的集合这里,当且仅当两个不同的样本被模型Mk判为同一个类别时,它们之间才会有边相连接。基于以上的分析,我们可以认为,对于样本h,模型Mk的权重系数和该样本在图GT和图中共同相邻的节点的个数成正比,即:
式中VT,h,分别表示样本h节点在图GT,中的相邻节点的集合。
对每一个样本h,由此估计并按照公式(6)计算属于某行为的概率,从而判断该样本的行为。
图4中,用人和多类其它动物的行为的数据,以及目标动物的部分有标注的数据做训练,以识别该动物的行为。我们采用三种策略,并比较它们的结果。第一种策略是传统的行为识别方法,即只采用目标动物的有标注的数据做训练。第二种策略是图2中所述的方法,即用人和多类其它动物的数据做训练。第三中策略是前两种的结合,我们简单的对前两种策略所预测的行为的概率分布做后融合,即把这两个预测概率相加。
下面通过具体实施例详细说明本发明提出的上述方案,并借助实验结果来验证本发明的有效性。基于以上所发明的方法,实验设置分为以下三种情况:
情况1:用人的数据做训练,把训练好的模型迁移到目标动物,以识别该动物的行为;
情况2:用人和多类其它动物的数据做训练,把多个训练好的模型迁移到同一类目标动物,以识别该动物的行为;
情况3:用人和多类其它动物的数据,以及该目标动物的部分有标注的数据做训练,以识别该动物的行为。
针对目标动物有部分训练数据的情况,本发明采用三种策略解决这个问题,即简易的行为识别方法,基于迁移学习的行为识别方法,以及两者结合的方法。
由于这是一个新的问题,需要数据库中既有人的行为视频,也有不同动物的行为视频。幸运的是,我们不需要自己构建数据库,美国密西根大学2015年公布了一个新的行为识别的数据库,即A2D数据库,该数据库同时包含动物和人的行为视频。Xu等人构建这个数据库是为了做本体(指行为的主体)和行为的共同分类、分割,我们正好用这个数据库来做基于迁移学习的动物的行为识别。
图5显示了A2D数据库中人和部分动物对应的部分行为,从中可以看出,动物和人的行为是相似的。
实验设置如下所述。
对于情况1,我们把A2D中成人的全部视频作为训练集合,分别把鸟、猫、狗这三类动物的视频作为测试集合。我们采用原始特征直接分类,作为非迁移学习方法和实验中的迁移学习方法做对比。结果如表格1所示。
对于情况2,考虑到有四类视频,成人、鸟、猫、狗,我们分别把鸟、猫、狗这三类动物的视频作为测试集合,而把其它所有视频作为训练集合。举个例子,用鸟的视频做测试的时候,采用成人、猫和狗的视频做训练。类似于情况1,我们也用原始特征做分类,作为对比试验。因为我们针对情况2采用了集成迁移学习的融合方法,为验证效果,我们采用后融合(把多个分类器的预测概率相加)方法作为对比实验。结果如表格2所示。
对于情况3,对于鸟、猫、狗中的某一类目标动物,我们首先把它所有的数据随机划分训练集合测试集合,实验中,采用20%的数据做训练,其余做测试,另外,采用其它动物以及成人的全部数据作为额外的训练集合。我们对比了三种不同的策略,即传统的行为识别方法,基于迁移学习的行为识别方法,以及两者结合的方法。结果如表格3所示。
表格1 情况1的行为识别精度,从人迁移到动物
方法 | 鸟 | 猫 | 狗 |
非迁移学习方法 | 62.6% | 66.6% | 66.4% |
迁移学习方法 | 70.0% | 73.0% | 73.8% |
表格2 情况2的行为识别精度,从人和其它动物共同迁移到该动物,并经过模型融合
表格3 情况3的行为识别精度,三种策略的比较
方法 | 鸟 | 猫 | 狗 |
策略1,传统的方法 | 56.1% | 57.6% | 66.0% |
策略2,迁移学习的方法 | 76.0% | 81.5% | 79.3% |
策略3,结合的方法 | 78.0% | 81.6% | 79.9% |
从表格1的结果可以看出,迁移学习的方法比非迁移学习的结果好。由此说明,人的行为可以迁移到动物,并帮助动物的行为识别,特别是针对动物没有训练样本的情况下。
从表格2的结果可以看出,迁移学习的方法比非迁移学习的结果好,集成迁移学习要比后融合的结果好。同时,我们发现,表格2中的最好结果比表格1中的最好结果好。由此说明,不仅人的行为可以迁移到动物,不同动物的行为也可以互相迁移。如果要识别某一类动物的行为而没有训练数据,我们可以采用人和其它动物的数据做训练,提取特征之后,先采用迁移学习的方法减少特征之间的差异,再采用集成迁移学习的方法融合多个模型,这样可以获得最好的识别效果。
从表格3的结果可以看出,针对有部分标注的样本的情况,迁移学习方法依旧是很有效的,特别是当有标注的数据不够多时候(比如,低于20%)。另外,把传统的行为识别方法和基于迁移学习的行为识别方法结合起来,我们可以进一步提高识别精度。
综上,针对动物的行为识别中训练数据获取困难这个问题,我们提出了提出了一种新的解决思路,即基于迁移学习的动物的行为识别。该方法能有效的识别动物的行为,适用于目标动物没有训练样本的情况,以及训练样本不够多的情况。
Claims (7)
1.一种基于迁移学习的动物行为识别方法,其包括:
步骤101,针对训练数据集中的每一个训练样本和测试数据集中的每一测试样本,提取原始特征;
所述训练样本包括人的行为样本、非目标动物的行为样本和目标动物的行为样本中的一种或几种的组合;
步骤102,采用迁移学习中的领域适应学习法将所述原始特征映射到共同空间中,得到新的特征;
步骤103,利用所述新的特征训练SVM分类器,得到目标动物行为识别模型,同时对所述目标动物行为识别模型进行测试;
其中,所述训练数据集中的训练样本为人的行为样本和非目标动物的行为样本的组合时,步骤103包括:对于人的行为样本、非目标动物的行为样本,分别训练得到不同的中间识别模型,利用集成迁移学习法将所述不同的中间识别模型融合成一个目标动物识别模型;
步骤103还包括:对测试样本进行聚类为c个类别,并构造图GT=(VT,ET),VT表示测试样本集合,ET表示测试样本之间的连接边集合,当且仅当两个不同的测试样本属于同一个聚类中心时,它们之间才会有边相连接;
对于每一个待测试的目标动物行为识别模型Mk,构造图 表示测试样本之间的连接边集合,当且仅当两个不同的测试样本被待测试的目标动物行为识别模型Mk判为同一个类别时,它们之间才会有边相连接;
基于以上的分析,对于测试样本h,待测试的目标动物行为识别模型Mk的权重系数和该测试样本在图GT和图中共同相邻的节点的个数成正比,即:
式中VT,h,分别表示样本h节点在图GT,中的相邻节点的集合;
对每一个测试样本h,利用估计得到的计算测试样本属于某行为的概率,从而判断该测试样本的行为;
步骤104,利用所述动物行为识别模型对目标动物的待识别行为进行识别。
2.根据权利要求1所述的方法,其中,所述训练数据集中的训练样本仅为人的行为样本时,步骤103包括:
对于人的行为样本,训练得到第一目标动物识别模型;
利用第一目标动物识别模型识别待识别行为,得到最终的识别结果。
3.根据权利要求1所述的方法,其中所述训练数据集中的训练样本为人的行为样本、非目标动物的行为样本和目标动物的行为样本的组合时,步骤103包括:
对于目标动物的行为样本,训练得到第一目标动物识别模型;
对于人的行为样本、非目标动物的行为样本,分别训练得到不同的中间识别模型;
对于利用集成迁移学习法将所述中间识别模型融合成第二目标动物识别模型;
利用第一目标动物识别模型和第二目标动物识别模型分别识别待识别行为,并结合两个识别结果得到最终的识别结果。
4.根据权利要求1-3任一项所述的方法,其中,步骤103还包括:
利用测试样本得到的新特征对所述目标动物行为识别模型进行测试。
5.根据权利要求1所述的方法,其中,步骤101具体包括:
提取TRJ、HOG、HOF和MBH四种局部特征;
经过主成分分析方法将所述四种局部特征的维度降到原来一半;
采用词袋模型对每一种局部特征编码,针对每个视频得到上述四种局部特征的直方图特征;
将得到的直方图特征串接起来,得到原始特征。
6.根据权利要求1所述的方法,其中,如下计算测试样本属于某行为的概率:
其中,P(y|h,Mk)表示Mk判断样本h∈VT是行为y的概率,P(Mk|h)表示样本h选择Mk来分类的概率,把P(Mk|h)看做对某一个样本h的权重系数,即L为Mk的个数。
7.一种基于迁移学习的目标动物行为识别装置,其包括:
特征提取模块,用于针对训练数据集中的每一个训练样本和测试数据集中的每一测试样本,提取原始特征;
所述训练样本包括人的行为样本、非目标动物的行为样本和目标动物的行为样本中的一种或几种的组合;
特征优化模块,用于采用迁移学习中的领域适应学习法将所述原始特征映射到共同空间中,得到新的特征;
训练和测试模块,用于利用所述新的特征训练SVM分类器,得到目标动物行为识别模型,同时对所述目标动物行为识别模型进行测试;
其中,训练数据集中的训练样本为人的行为样本和非目标动物的行为样本的组合时,对于人的行为样本、非目标动物的行为样本,分别训练得到不同的中间识别模型,利用集成迁移学习法将所述不同的中间识别模型融合成一个目标动物识别模型;
对测试样本进行聚类为c个类别,并构造图GT=(VT,ET),VT表示测试样本集合,ET表示测试样本之间的连接边集合,当且仅当两个不同的测试样本属于同一个聚类中心时,它们之间才会有边相连接;
对于每一个待测试的目标动物行为识别模型Mk,构造图 表示测试样本之间的连接边集合,当且仅当两个不同的测试样本被待测试的目标动物行为识别模型Mk判为同一个类别时,它们之间才会有边相连接;
基于以上的分析,对于测试样本h,待测试的目标动物行为识别模型Mk的权重系数和该测试样本在图GT和图中共同相邻的节点的个数成正比,即:
式中VT,h,分别表示样本h节点在图GT,中的相邻节点的集合;
对每一个测试样本h,利用估计得到的计算测试样本属于某行为的概率,从而判断该测试样本的行为;
分类和识别模块,用于利用所述动物行为识别模型对目标动物的待识别行为进行识别。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610339756.8A CN106056043B (zh) | 2016-05-19 | 2016-05-19 | 基于迁移学习的动物行为识别方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610339756.8A CN106056043B (zh) | 2016-05-19 | 2016-05-19 | 基于迁移学习的动物行为识别方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106056043A CN106056043A (zh) | 2016-10-26 |
CN106056043B true CN106056043B (zh) | 2019-07-30 |
Family
ID=57177646
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610339756.8A Active CN106056043B (zh) | 2016-05-19 | 2016-05-19 | 基于迁移学习的动物行为识别方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106056043B (zh) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107832691B (zh) * | 2017-10-30 | 2021-10-26 | 北京小米移动软件有限公司 | 微表情识别方法及装置 |
CN108256561B (zh) * | 2017-12-29 | 2020-06-16 | 中山大学 | 一种基于对抗学习的多源域适应迁移方法及系统 |
CN109145943A (zh) * | 2018-07-05 | 2019-01-04 | 四川斐讯信息技术有限公司 | 一种基于特征迁移的集成分类方法及系统 |
TWI665609B (zh) * | 2018-11-14 | 2019-07-11 | 財團法人工業技術研究院 | 住戶行為辨識系統與住戶行為辨識方法 |
CN109697461A (zh) * | 2018-12-11 | 2019-04-30 | 中科恒运股份有限公司 | 基于有限数据的分类模型训练方法和终端设备 |
CN109709546B (zh) * | 2019-01-14 | 2021-11-16 | 珠海格力电器股份有限公司 | 宠物状态监测方法和装置 |
CN110569727B (zh) * | 2019-08-06 | 2022-03-29 | 华南理工大学 | 用于运动想象分类的结合类内距和类间距的迁移学习方法 |
CN111242214A (zh) * | 2020-01-13 | 2020-06-05 | 浙江工业大学 | 一种基于图像的小型动物识别方法 |
CN111325289A (zh) * | 2020-03-18 | 2020-06-23 | 中国科学院深圳先进技术研究院 | 一种行为识别方法、装置、设备及介质 |
CN112633190A (zh) * | 2020-12-28 | 2021-04-09 | 南昌工程学院 | 一种深度学习方法 |
CN113392697B (zh) * | 2021-04-26 | 2024-07-09 | 上海师范大学 | 一种基于词袋模型的人体动作识别方法 |
CN113450267B (zh) * | 2021-05-14 | 2022-08-19 | 桂林电子科技大学 | 可快速获取多种自然退化图像复原模型的迁移学习方法 |
CN113345538B (zh) * | 2021-06-23 | 2022-09-30 | 北京理工大学重庆创新中心 | 一种基于动态选取训练集的材料性能预测方法 |
CN113516231B (zh) * | 2021-08-10 | 2024-03-29 | 大连海事大学 | 一种基于dsn深度对抗迁移网络的日常行为迁移识别方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103049526A (zh) * | 2012-12-20 | 2013-04-17 | 中国科学院自动化研究所 | 基于双空间学习的跨媒体检索方法 |
CN103400160A (zh) * | 2013-08-20 | 2013-11-20 | 中国科学院自动化研究所 | 一种零训练样本行为识别方法 |
CN103500340A (zh) * | 2013-09-13 | 2014-01-08 | 南京邮电大学 | 基于主题知识迁移的人体行为识别方法 |
CN104881655A (zh) * | 2015-06-03 | 2015-09-02 | 东南大学 | 一种基于多特征时空关系融合的人类行为识别方法 |
CN105095866A (zh) * | 2015-07-17 | 2015-11-25 | 重庆邮电大学 | 一种快速行为识别方法和系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8345962B2 (en) * | 2007-11-29 | 2013-01-01 | Nec Laboratories America, Inc. | Transfer learning methods and systems for feed-forward visual recognition systems |
-
2016
- 2016-05-19 CN CN201610339756.8A patent/CN106056043B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103049526A (zh) * | 2012-12-20 | 2013-04-17 | 中国科学院自动化研究所 | 基于双空间学习的跨媒体检索方法 |
CN103400160A (zh) * | 2013-08-20 | 2013-11-20 | 中国科学院自动化研究所 | 一种零训练样本行为识别方法 |
CN103500340A (zh) * | 2013-09-13 | 2014-01-08 | 南京邮电大学 | 基于主题知识迁移的人体行为识别方法 |
CN104881655A (zh) * | 2015-06-03 | 2015-09-02 | 东南大学 | 一种基于多特征时空关系融合的人类行为识别方法 |
CN105095866A (zh) * | 2015-07-17 | 2015-11-25 | 重庆邮电大学 | 一种快速行为识别方法和系统 |
Non-Patent Citations (3)
Title |
---|
Cross-domain action recognition via collective matrix factorization with graph Laplacian regularization;Jun Tang et al;《Image and Vision Computing》;20160229;第3.1-3.2节,第3.4节,算法1,图1 * |
Jun Tang et al.Cross-domain action recognition via collective matrix factorization with graph Laplacian regularization.《Image and Vision Computing》.2016, * |
非均衡样本分类的集成迁移学习算法;于重重;《电子学报》;20120731;第40卷(第7期);第3.2节 * |
Also Published As
Publication number | Publication date |
---|---|
CN106056043A (zh) | 2016-10-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106056043B (zh) | 基于迁移学习的动物行为识别方法和装置 | |
AU2019101133A4 (en) | Fast vehicle detection using augmented dataset based on RetinaNet | |
CN109344736B (zh) | 一种基于联合学习的静态图像人群计数方法 | |
CN110826638B (zh) | 基于重复注意力网络的零样本图像分类模型及其方法 | |
Zhang et al. | Real-time sow behavior detection based on deep learning | |
Lee et al. | Hierarchical novelty detection for visual object recognition | |
CN107330451B (zh) | 基于深度卷积神经网络的服装属性检索方法 | |
CN106682696B (zh) | 基于在线示例分类器精化的多示例检测网络及其训练方法 | |
CN109101938B (zh) | 一种基于卷积神经网络的多标签年龄估计方法 | |
CN110414368A (zh) | 一种基于知识蒸馏的无监督行人重识别方法 | |
CN110163258A (zh) | 一种基于语义属性注意力重分配机制的零样本学习方法及系统 | |
CN110795585B (zh) | 基于生成对抗网络的零样本图像分类系统及其方法 | |
CN105205501B (zh) | 一种多分类器联合的弱标注图像对象检测方法 | |
CN105160400A (zh) | 基于l21范数的提升卷积神经网络泛化能力的方法 | |
CN104834940A (zh) | 一种基于支持向量机的医疗影像检查疾病分类方法 | |
EP3620958A1 (en) | Learning method, learning device for detecting lane through lane model and testing method, testing device using the same | |
CN109740728A (zh) | 一种基于多种神经网络组合的量刑计算方法 | |
CN107203775A (zh) | 一种图像分类的方法、装置和设备 | |
CN111062296A (zh) | 一种基于计算机的白细胞自动识别分类方法 | |
CN110414541A (zh) | 用于识别物体的方法、设备和计算机可读存储介质 | |
CN106326916A (zh) | 基于多尺度特征估计和高阶bing特征的目标检测方法 | |
Henila et al. | Segmentation using fuzzy cluster‐based thresholding method for apple fruit sorting | |
CN110830291B (zh) | 一种基于元路径的异质信息网络的节点分类方法 | |
Okokpujie et al. | Predictive modeling of trait-aging invariant face recognition system using machine learning | |
CN115019133A (zh) | 基于自训练和标签抗噪的图像中弱目标的检测方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |