CN109829413B - 一种基于快速多图融合学习的立体视觉对象识别系统 - Google Patents

一种基于快速多图融合学习的立体视觉对象识别系统 Download PDF

Info

Publication number
CN109829413B
CN109829413B CN201910071913.5A CN201910071913A CN109829413B CN 109829413 B CN109829413 B CN 109829413B CN 201910071913 A CN201910071913 A CN 201910071913A CN 109829413 B CN109829413 B CN 109829413B
Authority
CN
China
Prior art keywords
matrix
data
label
graph
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910071913.5A
Other languages
English (en)
Other versions
CN109829413A (zh
Inventor
高跃
林浩杰
张子昭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN201910071913.5A priority Critical patent/CN109829413B/zh
Publication of CN109829413A publication Critical patent/CN109829413A/zh
Application granted granted Critical
Publication of CN109829413B publication Critical patent/CN109829413B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本申请公开了一种基于快速多图融合学习的立体视觉对象识别系统,该系统包括:构建模块,计算模块以及生成模块;构建模块用于根据数据库中的图像数据,分别构建数据库的至少两个数据模态的图和图矩阵;计算模块用于根据图矩阵,计算数据库对应数据模态的概率转移矩阵,计算模块还用于根据一个数据模态的图和另一个数据模态的概率转移矩阵,计算数据库对应数据模态的第一标签矩阵;生成模块用于根据至少两个数据模态的第一标签矩阵,对数据库中的未标记图像数据进行标记,生成并发送立体视觉对象识别结果。通过本申请中的技术方案,实现了不同模态数据的融合,提高不同模态数据中信息的利用率,优化了标签预测的可靠性和准确性。

Description

一种基于快速多图融合学习的立体视觉对象识别系统
技术领域
本申请涉及机器学习的技术领域,具体而言,涉及一种基于快速多图融合学习的立体视觉对象识别系统。
背景技术
立体视觉对象的视图可以简洁、直观地对立体视觉对象进行描述,越来越多基于图的学习算法被广泛应用于机器学习的技术领域中,即通过视图数据库中已有标记的视图数据的标签信息,学习出视图数据库中未有标记的视图数据的标签信息,即预测出未标记数据的标签。同时,随着多媒体技术和数据收集技术的发展,机器学习等相关领域中出现了越来越多的多模态数据,如点云模态、视图模态和网格模态,用不同的方法或角度对某个立体视觉对象进行数据收集,因此,需要对不同模态的数据进行融合,实现各模态数据之间的信息互补。
而现有技术中,进行基于图的机械学习时,一方面是直接将多个模态的数据特征拼接为一个特征,再根据拼接的特征构建一个图,进行标签预测,这种方法由于不同模态数据的尺度不同,在进行特征拼接过程中,存在引入更多噪声的可能性,不利于提高标签预测的可靠性。另一方面是分别对不同模态的数据构建不同的图,并在不同的图上单独进行学习,再将学习的结果进行加权求和,得到最终的标签预测结果,这种方法在进行不同图的学习过程中,并没有融合其他模态数据中包含的信息,造成了数据信息的。
发明内容
本申请的目的在于:实现了不同模态数据的融合,提高不同模态数据中信息的利用率,优化了标签预测的可靠性和准确性。
本申请的技术方案是:提供了一种基于快速多图融合学习的立体视觉对象识别系统,该系统包括:构建模块,计算模块以及生成模块;构建模块用于根据数据库中的图像数据,分别构建数据库的至少两个数据模态的图和图矩阵;计算模块用于根据图矩阵,计算数据库对应数据模态的概率转移矩阵,计算模块还用于根据一个数据模态的图和另一个数据模态的概率转移矩阵,计算数据库对应数据模态的第一标签矩阵;生成模块用于根据至少两个数据模态的第一标签矩阵,对数据库中的未标记图像数据进行标记,生成并发送立体视觉对象识别结果。
上述任一项技术方案中,进一步地,构建模块具体包括:获取单元,提取单元,以及构建单元;获取单元用于获取数据库中立体视觉对象的图像数据,其中,图像数据包括已标记图像数据和未标记图像数据,已标记图像数据中包括标签;提取单元用于提取图像数据至少两种类型的特征模态数据;构建单元用于根据特征模态数据,构建数据库的图,并生成对应的图矩阵,其中,图的任一个节点为立体视觉对象,任意两个节点之间连接有边,边的取值为两个节点之间相似度的权重值。
上述任一项技术方案中,进一步地,构建单元计算两个节点之间权重值的计算公式为:
Figure GDA0002648818450000021
式中,W(i,j)为节点i和节点j之间的权重值,vi为节点i的特征模态数据,vj为节点j的特征模态数据,d(·)2为欧几里德距离函数,μ为第一超常数,σ为第二超常数。
上述任一项技术方案中,进一步地,计算模块具体包括:生成单元,计算单元以及校正单元;生成单元用于根据图,生成第二标签矩阵;计算单元用于图矩阵,计算概率转移矩阵,计算单元还用于根据一个数据模态对应的第二标签矩阵和另一个数据模态对应的概率转移矩阵,计算一个数据模态对应的传递矩阵,记作第三标签矩阵;校正单元用于根据第二标签矩阵,校正第三标签矩阵,将校正后的第三标签矩阵,记作第一标签矩阵;计算单元还用于采用迭代算法,根据一个数据模态对应的第三标签矩阵和另一个数据模态对应的概率转移矩阵,更新传递矩阵,并将更新后的传递矩阵记作第三标签矩阵。
上述任一项技术方案中,进一步地,计算模块,具体还包括:判断单元;判断单元用于判断当前的迭代次数是否达到预设迭代次数;计算单元还用于当判定当前的迭代次数达到所述预设迭代次数时,停止迭代运算,将当前的传递矩阵,记作第三标签矩阵。
上述任一项技术方案中,进一步地,识别系统还包括:优化模块;优化模块用于根据第三标签矩阵,生成相关性矩阵,并根据相关性矩阵,优化概率转移矩阵;计算单元还用于采用迭代算法,根据一个数据模态对应的第三标签矩阵和另一个数据模态对应的优化后的概率转移矩阵,更新传递矩阵,并将更新后的传递矩阵记作第三标签矩阵。
本申请的有益效果是:通过构建模块按照图像数据的数据模态,以立体视觉对象为节点,节点相似度为权重值,构建图和图矩阵,建立了图像数据之间的联系,再通过计算概率转移矩阵和第一标签矩阵,并由生成模块对第一标签矩阵进行融合运算,计算出第四标签矩阵,实现了不同模态数据的融合,进而根据第四标签矩阵对未标记图像数据进行标记,提高不同模态数据中信息的利用率,优化了标签预测的可靠性和准确性。
附图说明
本申请的上述和/或附加方面的优点在结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1是根据本申请的一个实施例的基于快速多图融合学习的立体视觉对象识别系统的示意框图;
图2是根据本申请的一个实施例的计算模块运算过程示意流程图。
具体实施方式
为了能够更清楚地理解本申请的上述目的、特征和优点,下面结合附图和具体实施方式对本申请进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互结合。
在下面的描述中,阐述了很多具体细节以便于充分理解本申请,但是,本申请还可以采用其他不同于在此描述的其他方式来实施,因此,本申请的保护范围并不受下面公开的具体实施例的限制。
如图1所示,本实施例提供了一种基于快速多图融合学习的立体视觉对象识别系统100,包括:构建模块10,计算模块20以及生成模块30;构建模块10用于根据数据库中的图像数据,分别构建数据库的至少两个数据模态的图和图矩阵;
进一步地,构建模块10中具体包括:获取单元11,提取单元12,以及构建单元13;获取单元11用于获取数据库中立体视觉对象的图像数据,其中,图像数据包括已标记图像数据和未标记图像数据,已标记图像数据中包括标签;
提取单元12用于提取图像数据至少两种类型的特征模态数据;
具体地,在本实施例中,设定数据库中的立体视觉对象的数据类型为CAD三维模型,部分三维模型为已标记图像数据,对应的标签为飞机、浴缸、床、长凳、书架,部分三维模型为未标记图像数据,不含有对应的标签,这类图像数据为待识别的图像数据。
采用多视图卷积神经网络和基于网格的卷积神经网络,对三维图像数据进行特征模态数据提取,设定多视图卷积神经网络提取的特征模态数据的类型为视图模态,记作第一模态数据,基于网格的卷积神经网络提取的特征模态数据的类型为网格模态,记作第二模态数据。
构建单元13用于根据特征模态数据,构建数据库的图,并生成对应的图矩阵,其中,图的任一个节点为立体视觉对象,任意两个节点之间连接有边,边的取值为两个节点之间相似度的权重值。
进一步地,构建单元13计算两个节点之间权重值的计算公式为:
Figure GDA0002648818450000051
式中,W(i,j)为节点i和节点j之间的权重值,vi为节点i的特征模态数据,vj为节点j的特征模态数据,d(·)2为欧几里德距离函数,μ为第一超常数,σ为第二超常数。
具体地,将数据库中的每一个立体视觉对象视为一个节点,任意两个节点之间存在一条边,使用高斯核函数度量两个节点的相似度,以表示对应边的权重,在本实施例中,对于第一模态数据,选取的任意两个节点分别为节点
Figure GDA0002648818450000052
和节点
Figure GDA0002648818450000053
对于第二模态数据,选取的任意两个节点分别为节点
Figure GDA0002648818450000054
和节点
Figure GDA0002648818450000055
对应的权重值计算公式为:
Figure GDA0002648818450000056
Figure GDA0002648818450000057
式中,W1(i,j)为第一权重值,W2(i,j)为第二权重值,d(·)2为欧几里德距离函数,μ为第一超常数,σ为第二超常数。
因此,可以根据第一权重值W1(i,j)构建视图模态下数据库的第一图,并得到第一图矩阵W1,根据第二权重值W2(i,j)构建网格模态下数据库的第二图,并得到第二图矩阵W2,这两个图矩阵W1和W2的维度与数据库中立体视觉对象的数量相等。
在本实施例中,计算模块20用于根据图矩阵,计算数据库对应数据模态的概率转移矩阵,计算模块20还用于根据一个数据模态的图和另一个数据模态的概率转移矩阵,计算数据库对应数据模态的第一标签矩阵;
具体地,分别对第一图矩阵W1和第二图矩阵W2中的每个元素进行归一化,对应的归一化计算公式为:
Figure GDA0002648818450000058
Figure GDA0002648818450000059
式中,V为图矩阵的列数。
通过计算得到的概率转移矩阵P(P1和P2)的维数和图矩阵W(W1和W2)的维数相同,图矩阵中的第i行第j列的元素值表示,在随机游走的过程中,从节点i到节点j的概率。
进一步地,计算模块20具体包括:生成单元21,计算单元22以及校正单元23;生成单元21用于根据图,生成第二标签矩阵;
具体地,构建的第二标签矩阵的每一行均为一个三维立体对象,每一列为标签类别。当某一对象属于某一个类别时,对应元素的数值设定为1,而该行的其他元素的数值设定为0;对于未标记图像数据,对应行的元素的数值设定为1/C,其中,C为标签类别的总数。
设定数据库的标签类别包括飞机、浴缸、床、长凳和书架5种,数据库中包括10个立体视觉对象,其中,仅有7个立体视觉对象的图像数据中包含标签,依次为:飞机、飞机、浴缸、床、床、长凳、书架。则以标签类别作为矩阵的行、以立体视觉对象作为矩阵的列,构建的第二标签矩阵Y0为:
Figure GDA0002648818450000061
计算单元22用于图矩阵,计算概率转移矩阵,计算单元22还用于根据一个数据模态对应的第二标签矩阵和另一个数据模态对应的概率转移矩阵,计算一个数据模态对应的传递矩阵,记作第三标签矩阵;校正单元23用于根据第二标签矩阵,校正第三标签矩阵,将校正后的第三标签矩阵,记作第一标签矩阵;计算单元22还用于采用迭代算法,根据一个数据模态对应的第三标签矩阵和另一个数据模态对应的概率转移矩阵,更新传递矩阵,并将更新后的传递矩阵记作第三标签矩阵。
具体地,根据数据库中已标记数据和未标记数据生成第二标签矩阵后,采用迭代算法,计算传递矩阵。在本实施例中,设定第一模态数据对应的第二标签矩阵为
Figure GDA0002648818450000071
第二模态数据对应的第二标签矩阵为
Figure GDA0002648818450000072
迭代次数d的取值可以根据识别系统的性能、精度,进行人为设置,第一模态数据对应的第一传递矩阵
Figure GDA0002648818450000073
和第二模态数据对应的第二传递矩阵
Figure GDA0002648818450000074
对应的计算公式为:
Figure GDA0002648818450000075
Figure GDA0002648818450000076
在计算第三标签矩阵的过程中,存在已标记图像数据对应的元素数值受到噪声干扰、而改变的可能性,为了提高标签传递的准确性,以第二标签矩阵为基准,对第三标签矩阵中的元素进行校正,当判定第三标签矩阵中已标记数据的元素发生改变时,以第二标签矩阵中对应元素的数值为依据,对第三标签矩阵中的元素进行校正,将校正后的第三标签矩阵,记作第一标签矩阵。
更具体的,如图2所示,设定数据库中包含两个数据模态,为模态A和模态B,由构建模块10分别得到图A、图矩阵A、图B和图矩阵B。由生成单元21分别根据图A和图B,生成对应的第二标签矩阵A和第二标签矩阵B,作为图A和图B的初始标签矩阵,并由计算单元22根据图矩阵A和图矩阵B,计算对应的概率转移矩阵A和概率转移矩阵B。
得到概率转移矩阵之后,由计算单元22采用迭代算法,首先,将第二标签矩阵A(B)和概率转移矩阵B(A)相乘,得到传递矩阵A(B),记作第三标签矩阵A(B),由校正单元23根据第二标签矩阵A(B)对第三标签矩阵A(B)进行校正。
之后,将之前得到的第三标签矩阵A(B)和概率转移矩阵B(A)相乘,更新当前的传递矩阵A(B),记作第三标签矩阵A(B),再由校正单元23根据第二标签矩阵A(B)对当前的第三标签矩阵A(B)进行校正。
优选地,计算模块20具体还包括:判断单元24;判断单元24用于判断当前的迭代次数与预设迭代次数t相等;计算单元22还用于当判定当前的迭代次数与预设迭代次数t相等时,停止迭代运算,将当前的传递矩阵,记作第三标签矩阵。
具体地,在计算单元22计算第三标签矩阵的过程中,为了减小时间消耗、提高识别系统100的整体响应速率,设置判断单元24,当迭代次数达到预设迭代次数t时,计算单元22停止迭代运算,将当前的传递矩阵Yd记作第三标签矩阵,由校正单元23校正后,记作第一标签矩阵。
在本实施例中,生成模块30用于根据至少两个数据模态的第一标签矩阵,对数据库中的未标记图像数据进行标记,生成并发送立体视觉对象识别结果。
具体地,生成模块30根据得到的第一模态数据的第一标签矩阵
Figure GDA0002648818450000081
和第二模态数据的第一标签矩阵
Figure GDA0002648818450000082
进行融合运算,融合运算过程中的计算公式为:
Figure GDA0002648818450000083
Label(i)=argmaxjYavg(i,j),
得到的第四标签矩阵Yavg,再根据第四标签矩阵Yavg对未标记图像数据进行标记,设定本实施例中的第四标签矩阵Yavg为:
Figure GDA0002648818450000084
生成模块30根据数据库中未标记图像数据在第四标签矩阵Yacg中的对应行元素,选取行元素中的最大值对应的下标(列数)对应的标签列别,对未标记图像数据进行标记,设定第8个立体视觉元素的第四标签矩阵Yavg(8)为:
Yavg(8)=[0.9,0,0.1,0,0],
则根据第8个立体视觉元素的第四标签矩阵Yavg(8),可以判定,第8个立体视觉对象的标签为飞机的概率为0.9,为浴缸、长凳、书架的概率均为为0,为床的概率为0.1。根据概率的大小,可以判定第8个立体视觉对象的标签为飞机,生成立体视觉对象的识别结果。
进一步地,识别系统100还包括:优化模块40;优化模块40用于根据第三标签矩阵,生成相关性矩阵,并根据相关性矩阵,优化概率转移矩阵;计算单元22还用于采用迭代算法,根据一个数据模态对应的第三标签矩阵和另一个数据模态对应的优化后的概率转移矩阵,更新传递矩阵,并将更新后的传递矩阵记作第三标签矩阵。
具体地,在进行迭代运算的过程中,通过第三标签矩阵可以得到未标记图像数据的初始识别结果,得到相关性矩阵,对任意两个节点之间边的权重值进行优化,并根据优化后的权重值,对概率转移矩阵进行优化,以提高标签预测结果的准确性,优化过程中对应的计算公式为:
C(i,j)=corr(Yavg(i,:),Yavg(j,:)),
G=W+αC,
Figure GDA0002648818450000091
式中,C为相关性矩阵,corr(·)为皮尔逊相关系数计算公式,G为优化后的图,α为预设参数,
Figure GDA0002648818450000092
为优化后的概率转移矩阵。
优选地,预设参数α的取值为0.95。
由优化模块40根据第三标签矩阵A和第三标签矩阵B,生成相关性矩阵,对图A和图B进行优化,进而得到优化后的概率转移矩阵A和优化后的概率转移矩阵B。
此时,计算单元22根据优化后的概率矩阵B(A)和之前的标签矩阵A(B),更新传递矩阵A,再由校正单元23对更新后的传递矩阵A进行校正,最终生成识别用的第一标签矩阵,提高了识别系统100对标签预测的准确性。
以上结合附图详细说明了本申请的技术方案,本申请提出了一种基于快速多图融合学习的立体视觉对象识别系统,包括:构建模块,计算模块以及生成模块;构建模块用于根据数据库中的图像数据,分别构建数据库的至少两个数据模态的图和图矩阵;计算模块用于根据图矩阵,计算数据库对应数据模态的概率转移矩阵,计算模块还用于根据一个数据模态的图和另一个数据模态的概率转移矩阵,计算数据库对应数据模态的第一标签矩阵;生成模块用于根据至少两个数据模态的第一标签矩阵,对数据库中的未标记图像数据进行标记,生成并发送立体视觉对象识别结果。通过本申请中的技术方案,实现了不同模态数据的融合,提高不同模态数据中信息的利用率,优化了标签预测的可靠性和准确性。
本申请中的步骤可根据实际需求进行顺序调整、合并和删减。
本申请装置中的单元可根据实际需求进行合并、划分和删减。
尽管参考附图详地公开了本申请,但应理解的是,这些描述仅仅是示例性的,并非用来限制本申请的应用。本申请的保护范围由附加权利要求限定,并可包括在不脱离本申请保护范围和精神的情况下针对发明所作的各种变型、改型及等效方案。

Claims (6)

1.一种基于快速多图融合学习的立体视觉对象识别系统,其特征在于,该系统包括:构建模块,计算模块以及生成模块;
所述构建模块用于根据数据库中的图像数据,分别构建所述数据库的至少两个数据模态的图和图矩阵;
所述计算模块用于根据所述图矩阵,计算所述数据库对应数据模态的概率转移矩阵,所述计算模块还用于根据一个数据模态的所述图和另一个数据模态的所述概率转移矩阵,计算所述数据库对应数据模态的第一标签矩阵,其中,所述计算模块具体包括:生成单元,计算单元以及校正单元;
所述生成单元用于根据所述图,生成第二标签矩阵;
所述计算单元用于所述图矩阵,计算概率转移矩阵,所述计算单元还用于根据一个数据模态对应的所述第二标签矩阵和另一个数据模态对应的所述概率转移矩阵,计算所述一个数据模态对应的传递矩阵,记作第三标签矩阵;
所述校正单元用于根据所述第二标签矩阵,校正所述第三标签矩阵,将校正后的所述第三标签矩阵,记作所述第一标签矩阵;
所述生成模块用于根据至少两个数据模态的所述第一标签矩阵,对所述数据库中的未标记图像数据进行标记,生成并发送立体视觉对象识别结果。
2.如权利要求1所述的基于快速多图融合学习的立体视觉对象识别系统,其特征在于,所述构建模块具体包括:获取单元,提取单元,以及构建单元;
所述获取单元用于获取所述数据库中立体视觉对象的所述图像数据,其中,所述图像数据包括已标记图像数据和未标记图像数据,所述已标记图像数据中包括标签;
所述提取单元用于提取所述图像数据至少两种类型的特征模态数据;
所述构建单元用于根据所述特征模态数据,构建所述数据库的所述图,并生成对应的所述图矩阵,其中,所述图的任一个节点为所述立体视觉对象,任意两个所述节点之间连接有边,所述边的取值为两个所述节点之间相似度的权重值。
3.如权利要求2所述的基于快速多图融合学习的立体视觉对象识别系统,其特征在于,
所述构建单元计算两个所述节点之间权重值的计算公式为:
Figure FDA0002648818440000021
式中,W(i,j)为节点i和节点j之间的权重值,vi为所述节点i的所述特征模态数据,vj为所述节点j的所述特征模态数据,d(·)2为欧几里德距离函数,μ为第一超常数,σ为第二超常数。
4.如权利要求1所述的基于快速多图融合学习的立体视觉对象识别系统,其特征在于,
所述计算单元还用于采用迭代算法,根据所述一个数据模态对应的所述第三标签矩阵和所述另一个数据模态对应的所述概率转移矩阵,更新所述传递矩阵,并将更新后的所述传递矩阵记作所述第三标签矩阵。
5.如权利要求4所述的基于快速多图融合学习的立体视觉对象识别系统,其特征在于,所述计算模块,具体还包括:判断单元;
所述判断单元用于判断迭代次数是否达到预设迭代次数;
所述计算单元还用于当判定当前的所述迭代次数达到所述预设迭代次数时,停止迭代运算,将当前的所述传递矩阵,记作所述第三标签矩阵。
6.如权利要求4所述的基于快速多图融合学习的立体视觉对象识别系统,其特征在于,所述识别系统还包括:优化模块;
所述优化模块用于根据所述第三标签矩阵,生成相关性矩阵,并根据所述相关性矩阵,优化所述概率转移矩阵;
所述计算单元还用于采用迭代算法,根据所述一个数据模态对应的所述第三标签矩阵和所述另一个数据模态对应的优化后的所述概率转移矩阵,更新所述传递矩阵,并将更新后的所述传递矩阵记作所述第三标签矩阵。
CN201910071913.5A 2019-01-25 2019-01-25 一种基于快速多图融合学习的立体视觉对象识别系统 Active CN109829413B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910071913.5A CN109829413B (zh) 2019-01-25 2019-01-25 一种基于快速多图融合学习的立体视觉对象识别系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910071913.5A CN109829413B (zh) 2019-01-25 2019-01-25 一种基于快速多图融合学习的立体视觉对象识别系统

Publications (2)

Publication Number Publication Date
CN109829413A CN109829413A (zh) 2019-05-31
CN109829413B true CN109829413B (zh) 2020-11-06

Family

ID=66862380

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910071913.5A Active CN109829413B (zh) 2019-01-25 2019-01-25 一种基于快速多图融合学习的立体视觉对象识别系统

Country Status (1)

Country Link
CN (1) CN109829413B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110276777B (zh) * 2019-06-26 2022-03-22 山东浪潮科学研究院有限公司 一种基于深度图学习的图像分割方法及装置
CN111242227B (zh) * 2020-01-16 2023-05-23 天津师范大学 一种基于异构深度特征的多模态地基云识别方法
CN111723649B (zh) * 2020-05-08 2022-08-12 天津大学 一种基于语义分解的短视频事件检测方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102024036A (zh) * 2010-11-29 2011-04-20 清华大学 基于超图的三维对象检索方法和装置
CN103049895A (zh) * 2012-12-17 2013-04-17 华南理工大学 基于平移不变剪切波变换的多模态医学图像融合方法
CN107451552A (zh) * 2017-07-25 2017-12-08 北京联合大学 一种基于3d‑cnn和卷积lstm的手势识别方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8503801B2 (en) * 2010-09-21 2013-08-06 Adobe Systems Incorporated System and method for classifying the blur state of digital image pixels

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102024036A (zh) * 2010-11-29 2011-04-20 清华大学 基于超图的三维对象检索方法和装置
CN103049895A (zh) * 2012-12-17 2013-04-17 华南理工大学 基于平移不变剪切波变换的多模态医学图像融合方法
CN107451552A (zh) * 2017-07-25 2017-12-08 北京联合大学 一种基于3d‑cnn和卷积lstm的手势识别方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"Inductive Multi-Hypergraph Learning and Its Application on View-Based 3D Object Classification";Zizhao Zhang等;《IEEE》;20181231;第27卷(第12期);全文 *
"Translating and Segmenting Multimodal Medical Volimes with Cycle and Shape-Consistency Generative Adversarial Network";Zizhao Zhang等;《arXiv:1802.09655v1》;20180227;全文 *

Also Published As

Publication number Publication date
CN109829413A (zh) 2019-05-31

Similar Documents

Publication Publication Date Title
CN110689038B (zh) 神经网络模型的训练方法、装置和医学图像处理系统
CN108764048B (zh) 人脸关键点检测方法及装置
CN109829413B (zh) 一种基于快速多图融合学习的立体视觉对象识别系统
CN110503076B (zh) 基于人工智能的视频分类方法、装置、设备和介质
CN111311708B (zh) 一种基于语义光流和逆深度滤波的视觉slam方法
CN106446754A (zh) 图像识别方法、度量学习方法、图像来源识别方法及装置
CN112949740B (zh) 一种基于多级度量的小样本图像分类方法
WO2023151237A1 (zh) 人脸位姿估计方法、装置、电子设备及存储介质
CN113361542A (zh) 一种基于深度学习的局部特征提取方法
CN110765882A (zh) 一种视频标签确定方法、装置、服务器及存储介质
CN115080801A (zh) 基于联邦学习和数据二进制表示的跨模态检索方法及系统
Qin et al. PointSkelCNN: Deep Learning‐Based 3D Human Skeleton Extraction from Point Clouds
CN114187506B (zh) 视点意识的动态路由胶囊网络的遥感图像场景分类方法
CN117393098A (zh) 基于视觉先验和跨模态对齐网络的医疗影像报告生成方法
CN114782503A (zh) 一种基于多尺度特征相似度约束的点云配准方法及系统
CN111506832B (zh) 一种基于块矩阵补全的异构对象补全方法
CN116662307A (zh) 一种基于多源数据融合的智能预警方法、系统及设备
CN110263196B (zh) 图像检索方法、装置、电子设备及存储介质
CN111461234A (zh) 基于两模态距离保持相关特征学习的单视角目标识别方法
CN107578069B (zh) 图像多尺度自动标注方法
CN113762231B (zh) 端对端的多行人姿态跟踪方法、装置及电子设备
CN111984812B (zh) 一种特征提取模型生成方法、图像检索方法、装置及设备
CN118277371B (zh) 基于交换机接口检测的图像数据智能处理方法
CN114550235B (zh) 姿态角检测方法、系统、电子设备及存储介质
CN113378746B (zh) 一种定位方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant