CN108734208B - 基于多模态深度迁移学习机制的多源异构数据融合系统 - Google Patents

基于多模态深度迁移学习机制的多源异构数据融合系统 Download PDF

Info

Publication number
CN108734208B
CN108734208B CN201810464348.4A CN201810464348A CN108734208B CN 108734208 B CN108734208 B CN 108734208B CN 201810464348 A CN201810464348 A CN 201810464348A CN 108734208 B CN108734208 B CN 108734208B
Authority
CN
China
Prior art keywords
layer
migration learning
source
output
source heterogeneous
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810464348.4A
Other languages
English (en)
Other versions
CN108734208A (zh
Inventor
李勇明
肖洁
王品
谭晓衡
刘书君
张新征
刘国金
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University
Original Assignee
Chongqing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University filed Critical Chongqing University
Priority to CN201810464348.4A priority Critical patent/CN108734208B/zh
Publication of CN108734208A publication Critical patent/CN108734208A/zh
Application granted granted Critical
Publication of CN108734208B publication Critical patent/CN108734208B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/254Fusion techniques of classification results, e.g. of results related to same input data
    • G06F18/256Fusion techniques of classification results, e.g. of results related to same input data of results relating to different input data, e.g. multimodal recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了一种基于多模态深度迁移学习机制的多源异构数据融合系统,包括:信号采集器、处理器以及结果输出模块;所述信号采集器:用于获取检测对象的多源异构信息;所述处理器:包括用于分别提取源信息和目标信息的深度特征学习模块,参数传递模块,以及预先训练好的分类器或回归器,通过所述分类器检测对象类别或通过所述回归器检测对象数值;所述结果输出模块:用于输出分类器或回归器的判断结果。本发明提供的一种基于多模态深度迁移学习机制的多源异构数据融合系统,检测过程采用分类器或回归器,可以融合多源异构数据,有效解决样本少的问题,自动提取目标高层多模态特征,精度高,而且使用方便。

Description

基于多模态深度迁移学习机制的多源异构数据融合系统
技术领域
本发明涉及人工智能和信号处理技术,具体涉及到一种基于多模态深度迁移学习机制的多源异构数据融合系统。
背景技术
目前大多数目标分类与检测研究都涉及到复杂目标,为了充分检测目标信息,就需要采用多源多模态传感器进行信息探测,然后进行融合,便于后续的分类与回归。由于多源多模态传感器因其探测信息机理不同,所探测的信息存在多源异构的特点,且由于大多数情况下目标数据样本较少,因此传统方法难以取得较好的效果。因此如何实现非大样本情况下的多源异构数据融合是一个当前研究的热点和难点。
目前多源异构数据融合方法方面的研究较少,其主要方法思路是:先对不同模态样本进行时空配准,获取对应感兴趣,然后提取特征,合并特征,对特征进行选择或者转换,形成融合后的多模态特征。这种方法思路其缺陷是:
(1)现有研究大多处于理论研究阶段,产品化较少;
(2)现有各种融合方法难以实现对原始信息实现高质量的非线性变换,从而获取高层次特征,以实现对目标的精确完整表征。
(3)现有融合方法需要对多源异构数据进行时空配准等预处理操作,难度大,且需要人工干预,无法实现端到端的处理。
(4)现有融合方法需要根据经验知识进行特征提取,主观性强,稳定性差,自适应性差,难以适应复杂多变情况下的分类和回归要求。
(5)基于传统深度学习的融合方法缺乏对小样本的解决能力,尤其是多模态小样本融合问题。传统的迁移学习不具备对原始信息实现高质量的非线性变换。
发明内容
为了解决上述问题,本发明提供一种基于多模态深度迁移学习机制的多源异构数据融合系统,通过设计多模态深度迁移学习机制实现高效的多源异构数据融合方法与系统,从而有效提高小样本情况下多源异构信息融合的准确性、自适应性和智能化水平。
为实现上述目的,本发明所采用的具体技术方案如下:
一种基于多模态深度迁移学习机制的多源异构数据融合系统,其关键在于包括:信号采集器、处理器以及结果输出模块;
所述信号采集器:用于获取检测对象的多源异构信息,包括多个模态的源信息和目标信息;
所述处理器:分别针对每一种模态建立对应的单模态源深度迁移学习模型和目标深度迁移学习模型,其中单模态源深度迁移学习模型是通过源数据集预先训练得到的,所述目标深度迁移学习模型是通过目标数据集训练得到的,且单模态源深度迁移学习模型中未完全连接的层和参数被迁移至目标深度迁移学习模型中的对应层次中;处理器还将多个目标深度迁移学习模型输出的特征进行选择和融合,然后得到多模态特征并采用分类器或回归器进行分类或回归操作;
所述结果输出模块:用于输出分类器或回归器的判断结果。
可选地,所述信号采集器采集有三个模态的源信息和目标信息,包括人脸信号、步态信号和语音信号。具体实施时,也可以根据已有的数据库以及数据获取的方便性选择其它模态的数据,比如光谱、红外、雷达等,不仅限于应用举例中所提到的三种模态信号。
可选地,所述单模态源深度迁移学习模型包括两层卷积层、两层池化层和三层全连接层。
可选地,所述目标深度迁移学习模型中包括两层卷积层、两层池化层、全局池化层、第一全连接层、批量规范化层、舍弃层和第二连接层,所述两层卷积层、两层池化层是由训练好的单模态源深度迁移学习模型直接迁移而来。
在单模态源深度迁移学习模型和目标深度迁移学习模型中,卷积层、池化层和全连接层的层数可根据具体数据情况优化而定。
可选地,所述卷积层描述为:
Figure BDA0001661705500000021
其中,Mj代表着对输入特征图进行选择,
Figure BDA0001661705500000022
代表第l-1层的第i个特征图,对应为第l层中的第i个输入,
Figure BDA0001661705500000023
代表着第l层输出的第j个特征图,
Figure BDA0001661705500000024
代表着第l层中第i个输入对应第j个输出的核函数,
Figure BDA0001661705500000025
代表第l层对应第j个输出的初始偏置。
可选地,所述池化层描述为:
Figure BDA0001661705500000026
其中,
Figure BDA0001661705500000027
代表着第l层池化输出的第j个特征图,pool是一个用来求领域平均值或最大值的函数。
可选地,所述批量规范化层中通过加入了β和γ两个训练参数实现批量规范,使其输出均值为0,方差为1,具体过程为:
Figure BDA0001661705500000031
通过批量规范化层可以得到输出B=(y1,y2,y3…yn-1,yn),其中xj表示第一全连接层的第j个输出变量,E(Fc1)表示第一全连接层所有输出的平均值,Var(Fc1)表示第一全连接层所有输出的方差,
Figure BDA0001661705500000032
为中间变量,yj为批量规范化层的第j个输出变量。
可选地,所述舍弃层用于减少神经元个数以防止过拟合,具体表示为:
Figure BDA0001661705500000033
其中,r是满足伯努利分布的独立随机变量,每一个都成为1的概率为p,wi和bi分别是权重值和偏置,B为输入变量,
Figure BDA0001661705500000034
为中间变量,f是激活函数,zi为舍弃层的第i个输出,通过这一层我们可以得到输出特征图:
D=(z1,z2,z3…zn-1,zn)。
本发明的显著效果是:
本系统通过构建多个模态的单模态深度迁移网络模型自动获取目标高层特征矢量,并进行数据融合处理,有效实现了多源异构数据的融合,解决了样本少的问题,精度高,而且使用方便。
附图说明
图1为本发明实施例提供的多模态信号深度卷积特征融合示意图;
图2为步态单模态深度迁移学习模型;
图3为人脸单模态深度迁移学习模型;
图4为语音单模态深度迁移学习模型;
图5为多模态深度融合模型。
具体实施方式
下面以基于多模态深度迁移学习的多源异构数据融合及帕金森病自动检测系统为例,说明本专利如何实现多源异构数据融合,并用于帕金森病自动检测。图1为本发明专利的示意图。首先,构造源数据集和目标数据集。其次,基于图2-图4,分别针对语音、人脸、步态建立对应的单模态源深度迁移学习模型和目标深度迁移学习模型。然后,基于图5,将三个模态的目标深度迁移学习模型进行融合,从而完成基于多模态深度迁移学习的多源异构数据融合。最后基于融合后的多模态特征,采用分类器或回归器进行分类或回归操作,实现目标分类或数值检测。为了便于描述,本实例中采用的深度神经网络是深度卷积网络(CNN)。
具体而言,将系统分为信号采集器、处理器以及结果输出模块;
首先,利用信号采集器获取相关的数据构造源数据集和目标数据集,本实施例实现了三模态的深度迁移学习模型,这三种模态分别为人脸、步态与语音。源数据集分别来自公共数据库LFW(10000个样本)、CASIA-B(10000个样本)与TIMIT(5000个样本)。目标数据集为医院采集的帕金森病人与正常人的人脸、步态及语音,这三种模态分别有100个样本,帕金森病人与正常人比例为1:1。采用统计分析获取与目标数据集相关性较大的源数据集,从而为深度迁移学习提供迁移对象。以语音样本为例,将TIMIT的5000个样本分为50组,每组100个样本,将每组100样本与目标数据集中的语音样本做相关性分析,取相关性较大的25组样本作为源数据集。
其次,利用处理器别针对每一种模态建立对应的单模态源深度迁移学习模型和目标深度迁移学习模型,本实施例采用卷积神经网络(CNN)模型,由两层卷积层、两层池化层和三层全连接层组成,利用源数据集进行训练,这里的卷积层的每个输出特征图是由多个输入特征图和内核进行卷积;池化层是通过核函数对前一层的输出进行池化处理;全连接层是通过权重来连接所有神经元。
具体而言,在卷积层,先前的特征映射层和训练的内核被卷积,然后输出特征由激活函数形成。每个输出映射由多个输入映射和内核进行卷积,一般可描述为:
Figure BDA0001661705500000041
其中,Mj代表着对输入特征图进行选择,
Figure BDA0001661705500000042
代表第l-1层的第i个特征图,对应为第l层中的第i个输入,
Figure BDA0001661705500000043
代表着第l层输出的第j个特征图,
Figure BDA0001661705500000044
代表着第l层中第i个输入对应第j个输出的核函数,
Figure BDA0001661705500000045
代表第l层对应第j个输出的初始偏置。
在池化层中,用核函数对前一层的输出特征图进行池化,可描述为:
Figure BDA0001661705500000046
其中,
Figure BDA0001661705500000047
代表着第l层池化输出的第j个特征图,pool是一个用来求领域平均值或最大值的函数,通过使用样本数据库中大量样本来训练预训练模型,我们可以得到参数k和b。
对于CNN应用来说,要得到一个完美的分类器,不仅要设计一个好的网络结构,还需要有足够的标签样本。但现实情况是标签样本的数量是有限的。迁移学习可以有效解决这个问题,它是指在其他大型数据集上预先训练好的深度学习模型的微调。在本系统中,CNN模型即单模态源深度迁移学习模型是在源数据集预先训练得到的。然后将全连接层的结构替换为新的结构,只保留未完全连接的层和参数得到重建模型。为了加速收敛和减少过拟合,在预先训练的模型之后加入了批量规范化层和舍弃层。最后将重建模型应用于目标数据集训练得到单模态目标深度迁移学习模型。
通过迁移学习获得单模态源深度迁移学习模型并将其加载到重建模型相应的卷积层中。因此,可以得到新结构中的非全连接层的输出特征图,将其定义为:
H′=(h′1,h′2,h′3…h′n-1,h′n)。
为减少可训练参数的数量,我们对所有的特征图进行全局池化处理
xj=average(h′j),
可以得到第一全连接层的输出为
Fc1=(x1,x2,x3…xn-1,xn)。
如果简单的对图层进行归一化会影响分类器的性能,为了解决这个问题,所述重建模型的全连接层中加入了批量规范化层,在批量规范化层中通过加入了β和γ两个训练参数实现批量规范,使其输出均值为0,方差为1。具体过程为
Figure BDA0001661705500000051
通过批量规范化层可以得到输出B=(y1,y2,y3…yn-1,yn)。
所述舍弃层用于减少神经元个数以防止过拟合,具体可以表示为
Figure BDA0001661705500000052
其中,r是满足伯努利分布的独立随机变量,每一个都成为1的概率为p,w和b分别是权重值和偏置,f是激活函数,通过这一层我们可以得到输出特征图
D=(z1,z2,z3…zn-1,zn)。
可以得到模型的预测分布
Figure BDA0001661705500000053
为:
Figure BDA0001661705500000054
通过最小化预测分布和真实分布之间的交叉熵可以定义目标损失函数为
Figure BDA0001661705500000061
真实分布函数为
Figure BDA0001661705500000062
通过
Figure BDA0001661705500000063
a∈classes可以得到每个样本预测类别,重建模型输出的分类结果为正常和异常两种情况。
将目标数据集应用于重建模型并进行微调得到单模态目标深度迁移学习模型。
然后,基于图5,将三个模态的目标深度迁移学习模型进行融合,从而完成基于多模态深度迁移学习的多源异构数据融合。人脸信号、步态信号、语音信号经过深度迁移网络模型将得到其高层特征f1、f2及f3。将f1、f2及f3进行特征选择,加权融合,得到多模态特征。最后基于融合后的多模态特征,采用分类器或回归器进行分类或回归操作,实现目标分类或数值检测,本实施例最终采用分类器实现目标分类。
最后通过结果输出模块输出分类器的判断结果。
基于上述系统进行数据融合后再进行分类器判断,分类判别效果可以得到明显提升,如表1所示的效果对比数据。从表中可以看出,本发明有效实现了多模态异构数据融合。融合后的分类准确率显著高于单模态下的分类结果。此外,由于本实例中,PD受试者样本较少(仅150个),有效解决样本少的问题,系统能自动提取目标高层多模态特征,精度高,而且使用方便。因此本发明专利可以有效应用与许多非大样本下的多模态异构数据融合的应用场景。
表1本发明分类结果对比
Figure BDA0001661705500000064
最后需要说明的是,上述描述为本发明的优选实施例,本领域的普通技术人员在本发明的启示下,在不违背本发明宗旨及权利要求的前提下,可以做出多种类似的表示,这样的变换均落入本发明的保护范围之内。

Claims (7)

1.一种基于多模态深度迁移学习机制的多源异构数据融合系统,其特征在于包括:信号采集器、处理器以及结果输出模块;
所述信号采集器:用于获取检测对象的多源异构信息,包括多个模态的源信息和目标信息;
所述处理器:分别针对每一种模态建立对应的单模态源深度迁移学习模型和目标深度迁移学习模型,其中单模态源深度迁移学习模型是通过源数据集预先训练得到的,所述目标深度迁移学习模型是通过目标数据集训练得到的,且单模态源深度迁移学习模型中未完全连接的层和参数被迁移至目标深度迁移学习模型中的对应层次中;处理器还将多个目标深度迁移学习模型输出的特征进行选择和融合,然后得到多模态特征并采用分类器或回归器进行分类或回归操作;
所述结果输出模块:用于输出分类器或回归器的判断结果;
所述信号采集器采集有三个模态的源信息和目标信息,包括人脸信号、步态信号和语音信号。
2.根据权利要求1所述的基于多模态深度迁移学习机制的多源异构数据融合系统,其特征在于,所述单模态源深度迁移学习模型包括两层卷积层、两层池化层和三层全连接层。
3.根据权利要求2所述的基于多模态深度迁移学习机制的多源异构数据融合系统,其特征在于,所述目标深度迁移学习模型中包括两层卷积层、两层池化层、全局池化层、第一全连接层、批量规范化层、舍弃层和第二连接层,所述两层卷积层、两层池化层是由训练好的单模态源深度迁移学习模型直接迁移而来。
4.根据权利要求3所述的基于多模态深度迁移学习机制的多源异构数据融合系统,其特征在于,所述卷积层描述为:
Figure FDA0002722518040000011
其中,Mj代表着对输入特征图进行选择,
Figure FDA0002722518040000012
代表第l-1层的第i个特征图,对应为第l层中的第i个输入,
Figure FDA0002722518040000013
代表着第l层输出的第j个特征图,
Figure FDA0002722518040000014
代表着第l层中第i个输入对应第j个输出的核函数,
Figure FDA0002722518040000015
代表第l层对应第j个输出的初始偏置。
5.根据权利要求4所述的基于多模态深度迁移学习机制的多源异构数据融合系统,其特征在于,所述池化层描述为:
Figure FDA0002722518040000021
其中,
Figure FDA0002722518040000022
代表着第l层池化输出的第j个特征图,pool是一个用来求领域平均值或最大值的函数。
6.根据权利要求4所述的基于多模态深度迁移学习机制的多源异构数据融合系统,其特征在于,所述批量规范化层中通过加入了β和γ两个训练参数实现批量规范,使其输出均值为0,方差为1,具体过程为:
Figure FDA0002722518040000023
通过批量规范化层可以得到输出B=(y1,y2,y3···yn-1,yn),其中xj表示第一全连接层的第j个输出变量,E(Fc1)表示第一全连接层所有输出的平均值,Var(Fc1)表示第一全连接层所有输出的方差,
Figure FDA0002722518040000024
为中间变量,yj为批量规范化层的第j个输出变量。
7.根据权利要求4所述的基于多模态深度迁移学习机制的多源异构数据融合系统,其特征在于,所述舍弃层用于减少神经元个数以防止过拟合,具体表示为:
rj~Bernoulli(p);
Figure FDA0002722518040000025
其中,r是满足伯努利分布的独立随机变量,每一个都成为1的概率为p,wi和bi分别是权重值和偏置,B为输入变量,
Figure FDA0002722518040000026
为中间变量,f是激活函数,zi为舍弃层的第i个输出,通过这一层我们可以得到输出特征图:
D=(z1,z2,z3···zn-1,zn)。
CN201810464348.4A 2018-05-15 2018-05-15 基于多模态深度迁移学习机制的多源异构数据融合系统 Active CN108734208B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810464348.4A CN108734208B (zh) 2018-05-15 2018-05-15 基于多模态深度迁移学习机制的多源异构数据融合系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810464348.4A CN108734208B (zh) 2018-05-15 2018-05-15 基于多模态深度迁移学习机制的多源异构数据融合系统

Publications (2)

Publication Number Publication Date
CN108734208A CN108734208A (zh) 2018-11-02
CN108734208B true CN108734208B (zh) 2020-12-25

Family

ID=63938255

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810464348.4A Active CN108734208B (zh) 2018-05-15 2018-05-15 基于多模态深度迁移学习机制的多源异构数据融合系统

Country Status (1)

Country Link
CN (1) CN108734208B (zh)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109710636B (zh) * 2018-11-13 2022-10-21 广东工业大学 一种基于深度迁移学习的无监督工业系统异常检测方法
DE102018222672A1 (de) * 2018-12-20 2020-06-25 Robert Bosch Gmbh Bestimmung der Orientierung von Objekten mit Radar und anderer elektromagnetischer Abfragestrahlung
CN109784412A (zh) * 2019-01-23 2019-05-21 复旦大学 用于步态分类的基于深度学习的多传感器信号融合方法
EP3916645A4 (en) 2019-01-25 2022-10-12 Tohoku University SIGNAL PROCESSING METHOD, SIGNAL PROCESSING DEVICE AND SIGNAL PROCESSING PROGRAM
CN112040245B (zh) * 2019-06-04 2023-07-21 万维数码有限公司 用于帧内编码深度图多层表示的系统和方法
CN110490095A (zh) * 2019-07-31 2019-11-22 中国人民解放军战略支援部队信息工程大学 一种基于神经网络的多模态特征融合调制识别方法和系统
CN111242227B (zh) * 2020-01-16 2023-05-23 天津师范大学 一种基于异构深度特征的多模态地基云识别方法
CN111354338B (zh) * 2020-02-26 2022-03-15 重庆大学 基于pso卷积核优化稀疏迁移学习的帕金森语音识别系统
CN111461176B (zh) * 2020-03-09 2023-03-21 华南理工大学 基于归一化互信息的多模态融合方法、装置、介质及设备
CN111950627B (zh) * 2020-08-11 2024-04-05 重庆大学 一种多源信息融合方法及其应用
CN112465030B (zh) * 2020-11-28 2022-06-07 河南财政金融学院 一种基于两级迁移学习的多源异构信息融合故障诊断方法
CN113159371B (zh) * 2021-01-27 2022-05-20 南京航空航天大学 基于跨模态数据融合的未知目标特征建模与需求预测方法
CN113317763B (zh) * 2021-06-30 2024-03-19 平安科技(深圳)有限公司 基于多模态的帕金森病检测装置及计算机可读存储介质
CN114241272B (zh) * 2021-11-25 2023-04-07 电子科技大学 基于深度学习的异构信息融合定位方法
CN116168258B (zh) * 2023-04-25 2023-07-11 之江实验室 一种目标物分类方法、装置、设备及可读存储介质
CN116957135A (zh) * 2023-06-26 2023-10-27 国网山东省电力公司梁山县供电公司 考虑突发气象灾害的电力应急物资需求预测方法及系统

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120330869A1 (en) * 2011-06-25 2012-12-27 Jayson Theordore Durham Mental Model Elicitation Device (MMED) Methods and Apparatus
CN104049000B (zh) * 2014-05-27 2016-06-22 天津大学 基于模态迁移复杂网络的气液相含率测量及验证方法
CN105913053B (zh) * 2016-06-07 2019-03-08 合肥工业大学 一种基于稀疏融合的单演多特征的人脸表情识别方法
CN106066892A (zh) * 2016-06-20 2016-11-02 四川上略互动网络技术有限公司 一种基于多源数据融合的旅游信息数据处理方法
CN107609572B (zh) * 2017-08-15 2021-04-02 中国科学院自动化研究所 基于神经网络和迁移学习的多模态情感识别方法、系统
CN107679491B (zh) * 2017-09-29 2020-05-19 华中师范大学 一种融合多模态数据的3d卷积神经网络手语识别方法
CN107730497B (zh) * 2017-10-27 2021-09-10 哈尔滨工业大学 一种基于深度迁移学习的血管内斑块属性分析方法
CN107784118B (zh) * 2017-11-14 2020-08-28 北京林业大学 一种针对用户兴趣语义的视频关键信息提取系统

Also Published As

Publication number Publication date
CN108734208A (zh) 2018-11-02

Similar Documents

Publication Publication Date Title
CN108734208B (zh) 基于多模态深度迁移学习机制的多源异构数据融合系统
CN111368896B (zh) 基于密集残差三维卷积神经网络的高光谱遥感图像分类方法
CN108182441B (zh) 平行多通道卷积神经网络、构建方法及图像特征提取方法
CN105975931B (zh) 一种基于多尺度池化的卷积神经网络人脸识别方法
CN106096561B (zh) 基于图像块深度学习特征的红外行人检测方法
CN106845401B (zh) 一种基于多空间卷积神经网络的害虫图像识别方法
CN109993100B (zh) 基于深层特征聚类的人脸表情识别的实现方法
CN110309856A (zh) 图像分类方法、神经网络的训练方法及装置
CN108090472B (zh) 基于多通道一致性特征的行人重识别方法及其系统
CN107169117B (zh) 一种基于自动编码器和dtw的手绘图人体运动检索方法
CN111476161A (zh) 一种融合图像和生理信号双通道的体感动态手势识别方法
AU2020200338B2 (en) Image searching apparatus, classifier training method, and program
CN111291809A (zh) 一种处理装置、方法及存储介质
CN111652247A (zh) 一种基于深度卷积神经网络的双翅目昆虫识别方法
CN111127423B (zh) 一种基于cnn-bp神经网络算法水稻病虫害识别方法
CN109145944B (zh) 一种基于纵向三维图像深度学习特征的分类方法
CN109840518B (zh) 一种结合分类与域适应的视觉追踪方法
CN116343284A (zh) 基于注意力机制的多特征户外环境情绪识别方法
CN111967362A (zh) 面向可穿戴设备的超图特征融合和集成学习的人体行为识别方法
CN113743544A (zh) 一种跨模态神经网络构建方法、行人检索方法及系统
CN110096976A (zh) 基于稀疏迁移网络的人体行为微多普勒分类方法
CN114492634B (zh) 一种细粒度装备图片分类识别方法及系统
Pei et al. Recognizing materials in cultural relic images using computer vision and attention mechanism
CN116958701A (zh) 一种基于改进vgg16与图像增强的网络异常流量检测方法
Zhang et al. Rapid computer vision detection of apple diseases based on AMCFNet

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant