CN108256434B - 基于混淆矩阵的高层语义视频行为识别方法 - Google Patents
基于混淆矩阵的高层语义视频行为识别方法 Download PDFInfo
- Publication number
- CN108256434B CN108256434B CN201711415758.1A CN201711415758A CN108256434B CN 108256434 B CN108256434 B CN 108256434B CN 201711415758 A CN201711415758 A CN 201711415758A CN 108256434 B CN108256434 B CN 108256434B
- Authority
- CN
- China
- Prior art keywords
- behavior
- video
- level semantic
- classifier
- svm
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000011159 matrix material Substances 0.000 title claims abstract description 18
- 238000000034 method Methods 0.000 title claims abstract description 18
- 230000006399 behavior Effects 0.000 claims abstract description 158
- 239000013598 vector Substances 0.000 claims abstract description 38
- 238000012549 training Methods 0.000 claims abstract description 31
- 238000012360 testing method Methods 0.000 claims description 27
- 230000006870 function Effects 0.000 claims description 6
- 238000000513 principal component analysis Methods 0.000 claims description 6
- 238000003064 k means clustering Methods 0.000 claims description 4
- 230000003287 optical effect Effects 0.000 claims description 4
- 238000013139 quantization Methods 0.000 claims description 3
- 230000009467 reduction Effects 0.000 claims description 3
- 238000012706 support-vector machine Methods 0.000 claims description 3
- 101100149325 Escherichia coli (strain K12) setC gene Proteins 0.000 claims description 2
- 238000013145 classification model Methods 0.000 claims description 2
- 238000011480 coordinate descent method Methods 0.000 claims description 2
- 230000008569 process Effects 0.000 claims description 2
- 238000012544 monitoring process Methods 0.000 abstract description 3
- 238000011160 research Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 238000010276 construction Methods 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/41—Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/50—Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了基于混淆矩阵的高层语义行为视频识别方法,主要解决现有技术因混淆造成识别率低的问题。其实现步骤是:1)提取行为视频的稠密轨迹,获取轨迹的底层特征;2)利用底层特征进行行为识别,获取混淆矩阵;3)针对混淆矩阵,定义能区分混淆行为的高层语义列表;4)将高层语义列表和行为视频数据相关联,为每一种高层语义训练对应的判别式分类器,并将行为视频在所有判别式分类器下的判分值串接,得到高层语义特征向量;5)获取底层特征在线性SVM分类器下的隶属度,联合隶属度和高层语义特征向量,训练LSVM分类器进行行为识别。本发明能有针对性地纠正混淆行为,提高了行为识别的准确率,可用于视频监控。
Description
技术领域
本发明属于视频图像处理技术领域,特别涉及一种视频行为识别方法,可用于视频监控。
背景技术
近年来,行为识别与视频分类日益重要的学术价值、经济效益和社会价值引起了众多学者的普遍关注,成为计算机视觉领域具有挑战性的研究课题,人体行为识别在智能视频监控、视频内容检索、新型人机交互、虚拟现实、视频编码与传输、游戏控制等多方面具有广阔的应用前景。随着视频行为识别领域研究工作的不断深入,研究者发现,底层特征对于复杂的视频行为描述能力非常有限,研究热点逐步从新底层特征的设计和提取,转移到高层语义的定义和分类模型的构建等。为此,众多学者致力于挖掘底层新特征,并在此基础上构建高层语义,取得了不菲的研究成果。
目前已提出的高层语义构建方法主要有:
(1)A.Farhadi,I.Endres,D.Hoiem,and D.Forsyth.Describing objects bytheir attributes.In CVPR,2009。该文章开创性的将识别任务由命名转向了描述,即将对象命名转变为描述对象的属性或性质,并将属性应用于对象的检测和分类,获得了较好的识别结果,但该方法未考虑对象的属性和行为类别间的一致性关系,使得对象的属性缺乏较好的判别能力,降低了行为识别的准确率。
(2)J.Liu,B.Kuipers,and S.Savarese.Recognizing human actions byattributes.In CVPR,2011。该文章将高级语义概念引用到行为识别领域,以满足复杂的行为视频表示,同时还考虑了属性和视频中行为类别间的相关性。然而,该高层语义仅考虑了名词属性和形容词属性,描述能力仍然不足。
(3)Yao B,Jiang X,Khosla A,et al.Human action recognition by learningbases of action attributes andparts.In ICCV,2011:1331-1338。该文章不仅将与行为相关的动词属性用于人体行为识别,还联合了与行为密切相关的对象和姿势部件,加入了更丰富的语义信息,获得了较高的行为识别准确率。然而对象和姿势的学习,需要额外学习对象检测器和姿势检测器,而对象检测器需要在精确检测对象的基础上实现,应用于复杂的人体行为比较困难。
发明内容
本发明目的是针对上述已有技术的不足,提出基于混淆矩阵下高层语义的视频行为识别方法,以充分利用完备的人类高级知识,有针对性地纠正视频行为混淆,提高视频行为识别的准确率。
为实现上述目的,本发明的技术方案包括如下:
(1)对所有行为视频提取稠密轨迹,采用轨迹的方向梯度直方图HOG和光流方向直方图HOF对轨迹进行描述,并对该HOG和HOF分别采用主成分分析PCA降维,得到行为视频的两个底层特征FHOG和FHOF;
(2)对两个底层特征FHOG和FHOF分别进行K-means聚类,再采用词袋模型BoW分别编码,串接得到行为视频的底层特征向量M,将M作为线性SVM分类器的训练样本,训练得到所有行为的SVM分类器集合SVM_Low_Set;
(3)采用步骤(2)训练得到的分类器集合SVM_Low_Set,对行为视频进行分类,获取分类后的混淆矩阵H;
(4)针对混淆矩阵H,人工定义能够区分混淆行为的高层语义,获取所有行为类别的高层语义集合Gset;
(5)将高层语义集合Gset与行为类别相关联,获取完整的高层语义列表L;
(6)将高层语义列表L和行为视频训练集Train_Set相关联,获取所有高层语义的判别式分类器集合SVM_Dis_Set;
(7)将行为视频测试集Test_Set中的每一个行为视频Vn,依次输入到SVM_Dis_Set中,将所有判别式分类器的判分输出结果串接,得到行为视频Vn的高层语义特征向量GFeat(Vn);
(8)将行为视频训练集Train_Set与测试集Test_Set进行交换,重复步骤(6)和步骤(7),得到所有行为视频的高层语义特征向量GFeat;
(9)利用行为视频分类器集合SVM_Low_Set,获取各行为视频类别在其隶属类别分类器下的隶属度Sco,并与行为视频的高层语义特征向量GFeat共同训练隐变量支持向量机LSVM分类器,测试时,将测试样本的隶属度和高层语义特征向量输入到训练好的LSVM中,获取视频行为分类结果。
本发明与现有技术相比具有以下优点:
1)本发明针对混淆矩阵,人工定义高层语义,能够有针对性地纠正混淆行为。
2)本发明将底层特征的隶属度和高层语义特征向量作为隐变量,能够描述语义特征与行为类别的相关性,最终提高了视频行为识别的准确率。。
附图说明
图1是本发明的实现流程图。
具体实施方式
下面结合附图,对本发明的实施做进一步详细描述。
参照图1,本发明基于混淆矩阵的高层语义视频行为识别方法,实现步骤如下:
步骤1,提取稠密轨迹,得到行为视频的底层特征。
对行为视频帧中的像素点进行稠密采样,并根据稠密光流进行特征点跟踪,提取稠密轨迹,用来表示行为的运动;
对稠密轨迹采用轨迹的方向梯度直方图HOG和光流方向直方图HOF进行描述,并对该HOG和HOF分别采用主成分分析PCA降维,得到行为视频的两个底层特征FHOG和FHOF。
步骤2,获取所有行为类的SVM分类器集合SVM_Low_Set。
(2.1)设定聚类中心个数为N,分别对底层特征FHOG和FHOF进行K-means聚类,并用N个聚类中心构建码书;
(2.2)利用步骤(2.1)构建的码书,分别对FHOG和FHOF进行量化编码,统计量化编码后的码字直方图,作为该行为视频的两个底层特征描述子;
(2.3)将两个底层特征描述子进行串接,作为该行为视频的底层特征向量M,使用线性SVM分类器进行训练,得到所有行为类别的SVM分类器集合SVM_Low_Set。
步骤3,获取混淆矩阵H。
采用步骤2训练得到的分类器集合SVM_Low_Set,对行为视频进行分类,获取分类后的混淆矩阵H;
步骤4,根据混淆矩阵H,针对错分的行为类别,获取所有行为类别的高层语义集合Gset。
(4.1)利用步骤(3)得到的混淆矩阵H,选择H中非对角线上的非零元素,将其作为行为视频中的混淆行为;
(4.2对混淆行为进行有针对性地纠正,列举混淆行为的所有属性,从该属性中选择能够区分混淆行为的属性,作为混淆行为视频的高层语义;
(4.3)对不同混淆行为执行步骤(4.2)的过程,得到所有行为类别的高层语义集合Gset。
步骤5,将高层语义集合Gset与行为类别相关联,获取完整的高层语义列表L。
(5.1)通过二进制方法获取各高层语义在所有行为类别下的二进制值:
若某类行为视频中包含某一个高层语义,则将该类行为视频的标签设置为1,并将该类行为视频作为正样本;
否则,将该类行为视频的标签设置为0,并将该类行为视频作为负样本;
(5.2)统计所有行为类别对应的二进制标签值,得到行为视频数据集完整的高层语义列表L。
步骤6,将高层语义列表L和行为视频训练集Train_Set相关联,获取所有高层语义的判别式分类器集合SVM_Dis_Set。
(6.1)将行为视频数据集中的行为视频划分为训练集Train_Set和测试集Test_Set;
(6.2)利用步骤5获得的高层语义列表L,对于每一种高层语义,利用训练集Train_Set中的行为视频,对线性SVM判别式分类器进行训练;
(6.3)针对所有的高层语义,逐一对线性SVM判别式分类器进行训练,获取所有高层语义对应的判别式分类器集合SVM_Dis_Set。
步骤7,将测试集Test_Set中的每一个行为视频Vn,依次输入到判别式分类器集合SVM_Dis_Set中,将所有判别式分类器的判分输出结果进行串接,得到行为视频Vn的高层语义特征向量GFeat(Vn)。
步骤8,获取所有行为视频的高层语义特征向量GFeat。
(8.1)将行为视频训练集Train_Set与行为视频测试集Test_Set进行交换,得到新的行为视频训练集Train_Set′和行为视频测试集Test_Set′;
(8.2)将高层语义列表L和Train_Set′相关联,获取所有高层语义的新判别式分类器集合SVM_Dis_Set′;
(8.3)将Test_Set′中的每一个行为视频V′n,依次输入到判别式分类器集合SVM_Dis_Set′中,将所有判别式分类器的判分输出结果进行串接,得到行为视频V′n的高层语义特征向量G′Feat(V′n);
(8.4)通过步骤7和步骤(8.3)得到所有行为视频的高层语义特征向量GFeat。
步骤9,利用步骤2训练好的所有行为类的SVM分类器集合SVM_Low_Set,将所有行为视频分别输入到该SVM_Low_Set中,获取其底层特征在隶属类别分类器下的隶属度Sco。
步骤10,联合隶属度Sco和高层语义特征向量GFeat,训练隐变量支持向量机LSVM分类器,进行行为识别。
(10.1)将隶属度Sco和高层语义特征向量GFeat作为行为视频的隐变量;
(10.2)根据两个隐变量Sco和GFeat,构建LSVM分类器的目标函数如下:
其中,Fw(Vn,k)表示任意行为视频Vn的底层特征和高层语义在类别k的权系数向量下的判分,k=1,2,…,L,L表示所有行为类别的总数,W1表示隶属度的权系数,W2表示高层语义向量的权系数向量,Sco(Vn,k)表示行为视频Vn的底层特征在类别k下的隶属度,GFeat(Vn)表示行为视频Vn的高层语义向量;
(10.4)将行为视频测试样本的隶属度和高层语义特征向量,输入到训练好的LSVM分类器中,获取行为视频类别。
为验证本发明的有效性,在标准的人体行为数据库KTH和UCF-Sports上,利用本发明进行人体行为识别;
识别结果为:在数据库KTH上的识别率为98.33%,在数据库UCF-Sports上的识别率为97.33%。
以上描述仅是发明的一个具体实例,并未构成对本发明的任何限制,显然对于本领域的专业人员来说,在了解了本发明的内容和原理后,都可能在不背离本发明原理、结构的情况下,进行形式和细节上的各种修改和改变,但是这些基于本发明思想的修正和改变仍在本发明的权利要求保护范围之内。
Claims (6)
1.基于混淆矩阵的高层语义行为视频识别方法,包括:
(1)对所有行为视频提取稠密轨迹,采用轨迹的方向梯度直方图HOG和光流方向直方图HOF对轨迹进行描述,并对该HOG和HOF分别采用主成分分析PCA降维,得到行为视频的两个底层特征FHOG和FHOF;
(2)对两个底层特征FHOG和FHOF分别进行K-means聚类,再采用词袋模型BoW分别编码,串接得到行为视频的底层特征向量M,将M作为线性SVM分类器的训练样本,训练得到所有行为的SVM分类器集合SVM_Low_Set;
(3)采用步骤(2)训练得到的分类器集合SVM_Low_Set,对行为视频进行分类,获取分类后的混淆矩阵H;
(4)针对混淆矩阵H,人工定义能够区分混淆行为的高层语义,获取所有行为类别的高层语义集合Gset;
(5)将高层语义集合Gset与行为类别相关联,获取完整的高层语义列表L;
(6)将高层语义列表L和行为视频训练集Train_Set相关联,获取所有高层语义的判别式分类器集合SVM_Dis_Set;
(7)将行为视频测试集Test_Set中的每一个行为视频Vn,依次输入到SVM_Dis_Set中,将所有判别式分类器的判分输出结果串接,得到行为视频Vn的高层语义特征向量GFeat(Vn);
(8)将行为视频训练集Train_Set与测试集Test_Set进行交换,重复步骤(6)和步骤(7),得到所有行为视频的高层语义特征向量GFeat;
(9)利用行为视频分类器集合SVM_Low_Set,获取各行为视频类别在其隶属类别分类器下的隶属度Sco,并与行为视频的高层语义特征向量GFeat共同训练隐变量支持向量机LSVM分类器,测试时,将测试样本的隶属度和高层语义特征向量输入到训练好的LSVM中,获取视频行为分类结果。
2.根据权利要求1所述的方法,其中步骤(2)中“训练得到所有行为类的SVM分类器集合SVM_Low_Set”,按如下步骤进行:
(2.1)设定聚类中心个数为N,分别对底层特征FHOG和FHOF进行K-means聚类,并用N个聚类中心构建码书;
(2.2)利用步骤(2.1)构建的码书,分别对FHOG和FHOF进行量化编码,统计量化编码后的码字直方图,作为该行为视频的两个底层特征描述子;
(2.3)将两个底层特征描述子进行串接,作为该行为视频的底层特征向量M,使用线性SVM分类器进行训练,得到所有行为类别的SVM分类器集合SVM_Low_Set。
3.根据权利要求1所述的方法,其中步骤(4)中“获取所有行为类别的高层语义集合Gset”,按如下步骤进行:
(4.1)利用步骤(3)得到的混淆矩阵H,选择H中非对角线上的非零元素,将其作为行为视频中的混淆行为;
(4.2)对混淆行为进行有针对性地纠正,列举混淆行为的所有属性,从该属性中选择能够区分混淆行为的属性,作为混淆行为视频的高层语义;
(4.3)对不同混淆行为执行步骤(4.2)的过程,得到所有行为类别的高层语义集合Gset。
4.根据权利要求1所述的方法,其中步骤(5)中“获取行为视频中完整的高层语义列表L”,按如下步骤进行:
(5.1)通过二进制方法,获取各高层语义在所有行为类别下的二进制值:
若某类行为视频中包含某一个高层语义,则将该类行为视频的标签设置为1,并将该类行为视频作为正样本;
否则,将该类行为视频的标签设置为0,并将该类行为视频作为负样本;
(5.2)统计所有行为类别对应的二进制标签值,得到行为视频数据集完整的高层语义列表L。
5.根据权利要求1所述的方法,其中步骤(6)中“获取所有高层语义的判别式分类器集合SVM_Dis_Set”,按如下步骤进行:
(6.1)将行为视频数据集中的行为视频划分为训练集Train_Set和测试集Test_Set;
(6.2)利用步骤(5)获得的高层语义列表L,对于每一种高层语义,利用训练集Train_Set中的行为视频,对线性SVM判别式分类器进行训练;
(6.3)针对所有的高层语义,逐一对线性SVM判别式分类器进行训练,获取所有高层语义对应的判别式分类器集合SVM_Dis_Set。
6.根据权利要求1所述的方法,其中步骤(9)中“利用LSVM分类器进行行为识别”,按如下步骤进行:
(9.1)根据步骤(2)获得的SVM分类模型集合SVM_Low_Set,将所有行为视频分别输入到分类器集合SVM_Low_Set中,获取其底层特征在隶属类别分类器下的隶属度Sco;
(9.2)将隶属度Sco和高层语义特征向量GFeat作为行为视频的隐变量;
(9.3)根据两个隐变量Sco和GFeat,构建LSVM分类器的目标函数如下:
其中,Fw(Vn,k)表示任意行为视频Vn的底层特征和高层语义在类别k的权系数向量下的判分,k=1,2,…,L,L表示所有行为类别的总数,W1表示隶属度的权系数,W2表示高层语义向量的权系数向量,Sco(Vn,k)表示行为视频Vn的底层特征在类别k下的隶属度,GFeat(Vn)表示行为视频Vn的高层语义向量;
(9.5)将行为视频测试样本的隶属度和高层语义特征向量,输入到训练好的LSVM分类器中,获取行为视频类别。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711415758.1A CN108256434B (zh) | 2017-12-25 | 2017-12-25 | 基于混淆矩阵的高层语义视频行为识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711415758.1A CN108256434B (zh) | 2017-12-25 | 2017-12-25 | 基于混淆矩阵的高层语义视频行为识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108256434A CN108256434A (zh) | 2018-07-06 |
CN108256434B true CN108256434B (zh) | 2021-09-28 |
Family
ID=62722730
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711415758.1A Active CN108256434B (zh) | 2017-12-25 | 2017-12-25 | 基于混淆矩阵的高层语义视频行为识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108256434B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109583360B (zh) * | 2018-11-26 | 2023-01-10 | 中山大学 | 一种基于时空信息和层级表示的视频人体行为识别方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101866429A (zh) * | 2010-06-01 | 2010-10-20 | 中国科学院计算技术研究所 | 多运动目标动作行为识别的训练方法和识别方法 |
CN102542302A (zh) * | 2010-12-21 | 2012-07-04 | 中国科学院电子学研究所 | 基于分等级对象语义图的复杂目标自动识别方法 |
CN103854016A (zh) * | 2014-03-27 | 2014-06-11 | 北京大学深圳研究生院 | 基于方向性共同发生特征的人体行为分类识别方法及系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10674139B2 (en) * | 2015-06-03 | 2020-06-02 | University Of Connecticut | Methods and systems for human action recognition using 3D integral imaging |
-
2017
- 2017-12-25 CN CN201711415758.1A patent/CN108256434B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101866429A (zh) * | 2010-06-01 | 2010-10-20 | 中国科学院计算技术研究所 | 多运动目标动作行为识别的训练方法和识别方法 |
CN102542302A (zh) * | 2010-12-21 | 2012-07-04 | 中国科学院电子学研究所 | 基于分等级对象语义图的复杂目标自动识别方法 |
CN103854016A (zh) * | 2014-03-27 | 2014-06-11 | 北京大学深圳研究生院 | 基于方向性共同发生特征的人体行为分类识别方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN108256434A (zh) | 2018-07-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102414680B (zh) | 利用跨域知识的语义事件检测 | |
Tarawneh et al. | Invoice classification using deep features and machine learning techniques | |
CN108171184A (zh) | 基于Siamese网络的用于行人重识别的方法 | |
CN105205501B (zh) | 一种多分类器联合的弱标注图像对象检测方法 | |
CN109325443A (zh) | 一种基于多实例多标签深度迁移学习的人脸属性识别方法 | |
CN104376326A (zh) | 一种用于图像场景识别的特征提取方法 | |
CN109492105B (zh) | 一种基于多特征集成学习的文本情感分类方法 | |
CN105894050A (zh) | 一种基于多任务学习的人脸图像种族和性别识别方法 | |
CN109213853A (zh) | 一种基于cca算法的中文社区问答跨模态检索方法 | |
CN104834941A (zh) | 基于计算机输入下的稀疏自编码的脱机手写体识别方法 | |
CN103824052A (zh) | 一种基于多层次语义特征的人脸特征提取方法及识别方法 | |
Zheng et al. | Aware progressive clustering for unsupervised vehicle re-identification | |
CN106845358A (zh) | 一种手写体字符图像特征识别的方法及系统 | |
CN105930792A (zh) | 一种基于视频局部特征字典的人体动作分类方法 | |
CN108427740A (zh) | 一种基于深度度量学习的图像情感分类与检索算法 | |
CN110414587A (zh) | 基于渐进学习的深度卷积神经网络训练方法与系统 | |
CN104978569A (zh) | 一种基于稀疏表示的增量人脸识别方法 | |
CN106529490B (zh) | 基于稀疏自编码码本实现笔迹鉴别的系统及方法 | |
Putra et al. | Analysis K-Nearest Neighbor Method in Classification of Vegetable Quality Based on Color | |
CN101996326A (zh) | 多类目标的检测装置及检测方法 | |
CN105740879B (zh) | 基于多模态判别分析的零样本图像分类方法 | |
Alshamsi et al. | Automated facial expression recognition app development on smart phones using cloud computing | |
Han et al. | Biomedical imaging modality classification using combined visual features and textual terms | |
CN108256434B (zh) | 基于混淆矩阵的高层语义视频行为识别方法 | |
CN110020638A (zh) | 人脸表情识别方法、装置、设备和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |