CN104809478A - 一种面向大规模三维重建的图像分块方法及装置 - Google Patents
一种面向大规模三维重建的图像分块方法及装置 Download PDFInfo
- Publication number
- CN104809478A CN104809478A CN201510249022.6A CN201510249022A CN104809478A CN 104809478 A CN104809478 A CN 104809478A CN 201510249022 A CN201510249022 A CN 201510249022A CN 104809478 A CN104809478 A CN 104809478A
- Authority
- CN
- China
- Prior art keywords
- image
- matrix
- images
- dimensional reconstruction
- thr
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
- G06F18/24137—Distances to cluster centroïds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T17/00—Three dimensional [3D] modelling, e.g. data description of 3D objects
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Geometry (AREA)
- Computer Graphics (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及一种面向大规模三维重建的图像分块方法,属于图像处理技术领域;包括以下步骤:首先利用图像间的特征匹配关系进行图像整体相似性度量,生成图像间相似度矩阵;然后引入谱聚类思想:首先利用谱分析将图像集中的每一个元素映射到利于聚类分析的高维空间,然后利用模糊聚类算法将整个图像集合分成若干个簇,同时对每张图像计算属于各簇的隶属度;最后通过对分类结果的分析处理,在自动生成一系列三维重建效率较高的图像子集合的同时,将与其它图像相似性较低的图像以噪声的形式予以剔除。对比现有技术,应用本发明方法能够有效降低三维重建的计算量,提高三维重建效率;同时,还能够有效剔除噪声图像,降低噪声图像对三维重建时的干扰。
Description
技术领域:
本发明涉及一种图像分块方法及装置,特别涉及一种面向大规模三维重建的图像分块方法及装置,属于图像处理技术领域。
背景技术:
物体或者环境的三维重建多年以来一直是计算机视觉的研究重点和热点之一,三维重建的目标是将二维图像转化为三维的立体图像,目前用摄像机等仪器记录下来的一般是二维的信息,而我们日常所处的环境是三维的,仅保留二维信息已经不能满足现代化生产的快速发展和需求,物体或者场景的三维重建技术变得越来越重要,高度仿真的三维建模技术正逐渐适用于各种可视化和模拟场景之中,它能够应用在减少设计费用和缩短设计周期等各个方面,并且能够为社会生活创造出巨大的经济效益。因此,三维建模前景十分有趣又诱人,可以应用到很多领域,有着很高的研究和利用价值。目前比较流行的一种三维重建技术是基于二维图像的,当某一场景的大量图像数据用于三维重建时,我们主要面临两个问题:首先是图像的质量问题,不同设备和条件下拍摄的图像质量各异,存在不少噪声过大或者与其他图像相关性不高,对整个重建并无意义的图像,强行加入重建序列只会增加整个重建过程的计算量,而且可能会重建出大量噪声点,从而影响重建精度;另一个问题是三维重建算法本身固有的难题,就是随着图像数目的增加,重建算法的计算量呈现指数级别增长,过多的图像加入重建可能会导致重建时间相当长,难以在实际系统中进行应用。
发明内容:
本发明的目的是针对以上问题,提出一种面向大规模三维重建的图像分块方法,在进行三维重建前将图像进行分块预处理,形成一系列质量和重建效率 都能有显著改善的图像子集合。
根据测试,图像数目在大约50张的时候重建效率和效果能够达到较好的状态,即可用较少的时间代价重建出效果不错的三维模型。而图像在太少的时候根本不能重建出模型,可以直接视为噪声图像。当图像太多时重建效果虽然好,但是重建效率低下。因此,本发明的思想就是将整个图像集合进行自适应聚类,生成一系列数量较小的子集,当集合中图像数目过少时视为噪声图像,可以直接丢弃;当图像数目过大时,迭代分割,直至满足能够快速重建的条件。这样得出的每个图像聚类可以理解为某一场景的图像序列,能够将当前覆盖的场景重建出来。只要满足图像集合间有重叠区域的条件,后续便可将整个大场景整合成一个整体的场景。
本发明是通过以下技术方案实现的:
一种面向大规模三维重建的图像分块方法,包括以下步骤:
步骤一、对于输入的图像集合根据图像间的匹配程度求出相似度矩阵;
步骤二、根据相似度矩阵通过以下步骤进行谱聚类:
步骤2.1根据相似度矩阵通过下述过程进行谱聚类:
步骤2.1.1利用相似度矩阵C根据下式计算对应的Graph Laplaction矩阵L,并对L做特征分解:
L=I-D-1C,D=diag(d1,d2,...dn),
其中,I表示单位矩阵,D-1表示矩阵D的逆矩阵,diag表示对角矩阵;
步骤2.1.2根据输入图像数目以及以下原则确定分类数m:如果是首次谱聚类,分类数通过谱间隙确定,如果是递归进行的谱聚类,分类数由公式m=(n+20)/50确定,其中m为分类数,n为当前图像集中图像数目;
步骤2.1.3嵌入映射:将矩阵L的特征值按照升序排列,取前k个最大的特征d1,d2,...,dk,得到对应的k个特征向量构成的特征矩阵X=(x1,x2,...,xk), 该特征矩阵的每一行可以视为每张图像映射到Rn×k空间的一个像;其中,k为预设的值;
步骤2.1.4将特征矩阵X的行向量归一化为单位向量,得到归一化后的矩阵Y;
步骤2.1.5对映射的像根据分类数m使用聚类方法将n个图像划分到m个类中;
步骤2.2、迭代谱聚类:对经过步骤2.1得到的聚类结果进行如下判定:
假设当前子类中的图像数目为α,THR1和THR2分别为预设的图像数目阈值,则:
i.如果α<THR1,则将当前子类中的所有图像归入不确定集合中;
ii.如果THR1≤α<THR2,则当前子类为一个分好类的集合;
iii.如果α>THR2,则当前子类过大,对当前子类所有图像根据步骤一结果抽取对应图像间相似度值构成新的相似度矩阵C,然后对当前子类继续执行步骤2.1进行递归谱聚类;
步骤三对不确定集合中的每一个图像Ii搜索其与已经分好类集合中图像Ij的最大相似度Cij,如果Cij大于预设的阈值THR3,则将Ii纳入图像Ij所在的集合中,反之直接丢弃。
通过以上步骤便可将离散的多源图像数据根据相互之间的相似性划分为一系列子集合,集合内部可以视为视觉连续的一块区域。
一种面向大规模三维重建的图像分块装置,包括相似度矩阵计算模块、图像聚类模块。相似度矩阵计算模块与图像聚类模块相连接。
相似度矩阵计算模块用于计算图像集中任意两张图像的相似度,然后得到相似度矩阵;
图像聚类模块用于自适应地将图像分为若干类;
作为优选,图像聚类模块中包含了谱聚类单元和不确定图像归类单元,谱聚类单元通过谱聚类算法对图像集合进行归类,同时将不确定图像归入不确定集合中,然后由不确定图像归类单元对这些图像按照步骤三的规则进行进一步的分类。
有益效果:
对比现有技术,应用本发明方法能够有效降低三维重建的计算量,提高三维重建效率;同时,本发明方法还能够有效剔除噪声图像。
附图说明:
图1为本发明实施例一种面向大规模三维重建的图像分块方法流程示意图;
图2为本发明实施例一种面向大规模三维重建的图像分块装置结构示意图。
具体实施方式
下面将结合附图和实施例对本发明加以详细说明,同时也叙述了本发明技术方案解决的技术问题及有益效果,需要指出的是,所描述的实施例仅旨在便于对本发明的理解,而对其不起任何限定作用。
实施例1
如图1所示为本发明实施例一种面向大规模三维重建的图像分块方法流程示意图,下面对流程中的步骤进行详细描述:
步骤一、对于输入的图像集合根据图像间的匹配程度求出相似度矩阵;
相似度矩阵可以由图像间的匹配程度得到,在本方法中使用相同区域的面积衡量不同图像的相似度,举例如下:
输入图像集合,对所有图像进行SIFT特征提取、匹配,求出所有不同图像对之间的仿射矩阵,然后求出N×N维图像间相似度矩阵C,N为图像数目;图 像对Ii和Ij之间的相似性由下面公式得到
其中,Cij为相似度矩阵C中第i行第j列元素值,Si表示图像Ii的大小,Sij表示图像对Ii和Ij之间的相似区域面积,通过图像Ii关于图像Ij的仿射矩阵Hij将Ii映射到图像Ij上,然后求出相似面积Sij。
步骤二、根据相似度矩阵对图像集合进行谱聚类:
步骤2.1根据相似度矩阵通过下述过程进行谱聚类
步骤2.1.1利用相似度矩阵C计算对应的Graph Laplaction矩阵L,并对L做特征分解,L的计算公式为L=I-D-1C,D=diag(d1,d2,...dn),
步骤2.1.2确定分类数m:如果是首次谱聚类,分类数通过谱间隙确定,如果是递归进行的谱聚类,分类数由公式m=(n+20)/50确定,其中m为分类数,n为当前图像集中图像数目;
步骤2.1.3嵌入映射:将矩阵L的特征值按照升序排列,取前k个最大的特征d1,d2,...,dk,得到对应的k个特征向量(n维列向量)构成的特征矩阵X=(x1,x2,...,xk),作为优选k在本方法中取值为10,X的每一行可以视为每张图像映射到Rn×k空间的一个像;
步骤2.1.4将特征矩阵X的行向量归一化为单位向量,得到归一化后的矩阵Y;
作为优选,可以采用下式进行归一化:
将矩阵Y中每一行视为图像集中每张图像新映射的向量,即每张图像由一个归一化k维行向量表示;
步骤2.1.5对映射的像(n个k维数据)采用模糊聚类法进行聚类,目标是将向量集Y=(y1,y2,...,yn)T(yi为k维行向量,i∈[1,n])划分为一系列的簇A=(A1,A2,...,Am)(Aj为n维列向量,j∈[1,m]),每个向量yi对于Aj的隶属度记为uij(i∈[1,n],j∈[1,m]);作为优选,本实施例采用模糊C均值聚类法进行聚类,具体聚类过程可以通过以下过程完成:
步骤2.1.5.1在区间(0,1)随机初始化向量集Y=(y1,y2,...,yn)T的隶属度矩阵U,使其满足
步骤2.1.5.2通过下面的公式算出整个向量集的m个聚类中心
其中,uij∈[0,1],ci=[c1i,c2i,…,cki]为第i个聚类簇Ai的中心,i∈[1,m],yj=[yj1,yj2,…,yjk]为向量集Y的第j个行向量,dij=||cj-yi||为第j个聚类中心到第i个归一化特征向量的距离,如欧氏距离,σ∈[1,∞)是一个加权系数,作为优选,σ=1.5;
步骤2.1.5.3对下面公式中的能量函数进行计算,如果能量函数值小于预设阈值THRd,或者相对于上一次计算得到的能量值的变化小于预设阈值THRc,则停止计算,这时候可以得到聚类的结果,作为优选,THRd=0.02,THRc=0.0001;否则,转到步骤2.1.5.4;
步骤2.1.5.4用步骤2.1.5.2里的公式重新计算初始化向量集Y=(y1,y2,...,yn)T的隶属度矩阵U,然后返回步骤2.1.5.2;
步骤2.2、迭代谱聚类:对首次谱聚类生成的聚类结果,进行递归聚类
设定图像数目阈值为THR1=30,THR2=80,通过求每个图像对应的向量yi到每个聚类中心的距离cj可以得到每个分类中的图像数目,假设当前子类中的图像数目为α;
iv.如果α<THR1,则当前子类中的所有图像归入不确定集合中
v.如果THR1≤α<THR2,则当前子类为一个分类好的集合
vi.如果α>THR2,则当前子类过大,为当前子类指定分类数k'=(n+20)/50,进行递归谱聚类,即重复步骤2.1
步骤三对不确定集合中图像进行归类
对于步骤二中被纳入不确定集合中的图像Ii,根据图像相似度矩阵C在已经分好类集合中搜索相似度最大的图像Ij,如果对应的相似度Cij大于预设阈值THR3,则将Ii纳入图像Ij所在的集合中,反之直接丢弃Ii,作为优选,THR3=0.4。
通过以上步骤便可将离散的多源图像数据根据相互之间的相似性划分为一系列子集合,集合内部可以视为视觉连续的一块区域。
实施例2
如图2所示为一种面向大规模三维重建的图像分块装置示意图,由图中可以看出该装置包括相似度矩阵计算模块、图像聚类模块。相似度矩阵计算模块与图像聚类模块相连接。
相似度矩阵计算模块用于计算图像集中任意两张图像的相似度,然后得到相似度矩阵;
图像聚类模块用于自适应地将图像分为若干类;
作为优选,推向聚类模块中包含了谱聚类单元和不确定图像归类单元,谱聚类单元通过谱聚类算法对图像集合进行归类,同时将不确定图像归入不确定集合中,然后由不确定图像归类单元对这些图像按照步骤三的规则进行进一步的分类。
试验结果
对于含有114张分辨率为1920*1080的图像集合,对其进行直接三维重建耗时57分39秒,而通过本实施例分块预处理将其分为两块之后需要的总时间为19分58秒,同时图像集预处理时间并没有显著增长,由原来的9分22秒变为了9分56秒;对于含有361张分辨率为7312*5474的图像集合,对其直接进行三维重建的时间为78小时,而通过本实施例分块预处理将其分为7块之后只需要6小时40分钟,同时预处理时间并没有显著增长,由5小时51分变为了5小时52分;综上所述,可以得出本发明方法对于加速三维重建有非常好的效果。
以上所述的具体描述,对发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (9)
1.一种面向大规模三维重建的图像分块方法,其特征在于,包括以下步骤:
步骤一、对于输入的图像集合根据图像间的匹配程度求出相似度矩阵;
步骤二、根据相似度矩阵通过以下步骤进行谱聚类:
步骤2.1根据相似度矩阵通过下述过程进行谱聚类:
步骤2.1.1利用相似度矩阵C通过下式计算对应的Graph Laplaction矩阵L,并对L做特征分解:
L=I-D-1C,D=diag(d1,d2,...dn),
其中,I表示单位矩阵,D-1表示D的逆矩阵,diag表示对角矩阵;
步骤2.1.2根据输入图像数目以及以下原则确定分类数m:如果是首次谱聚类,分类数通过谱间隙确定,如果是递归进行的谱聚类,分类数由公式m=(n+20)/50确定,其中m为分类数,n为当前图像集中图像数目;
步骤2.1.3嵌入映射:将矩阵L的特征值按照升序排列,取前k个最大的特征d1,d2,...,dk,得到对应的k个特征向量构成的特征矩阵X=(x1,x2,...,xk),该特征矩阵的每一行可以视为每张图像映射到Rn×k空间的一个像;其中,k为预设的值;
步骤2.1.4将特征矩阵X的行向量归一化为单位向量,得到归一化后的矩阵Y;
步骤2.1.5对映射的像根据分类数m使用聚类方法将n个图像划分到m个类中;
步骤2.2迭代谱聚类:对经过步骤2.1得到的聚类结果进行如下判定:
假设当前子类中的图像数目为α,THR1和THR2分别为预设的图像数目阈值,则:
i.如果α<THR1,则将当前子类中的所有图像归入不确定集合中;
ii.如果THR1≤α<THR2,则当前子类为一个分好类的集合;
iii.如果α>THR2,则当前子类过大,对当前子类所有图像根据步骤一结果抽取对应图像间相似度值构成新的相似度矩阵C,然后对当前子类继续执行步骤2.1进行递归谱聚类;
步骤三、对不确定集合中的每一个图像Ii搜索其与已经分好类集合中图像Ij的最大相似度Cij,如果Cij大于预设的阈值THR3,则将Ii纳入图像Ij所在的集合中,反之直接丢弃。
2.根据权利要求1所述的一种面向大规模三维重建的图像分块方法,其特征在于:所述步骤一进一步通过以下过程得到相似度矩阵:
首先,对所有图像进行SIFT特征提取、匹配,求出所有不同图像对之间的仿射矩阵;
然后,根据仿射矩阵求出N×N维图像间的相似度矩阵C,N为图像数目;矩阵元素Cij表示图像对Ii和Ij之间的相似性,其值通过下述公式计算:
其中Si表示图像Ii的大小,Sij表示图像对Ii和Ij之间的相似区域面积,通过图像Ii关于图像Ij的仿射矩阵Hij将Ii映射到图像Ij上,然后求出相似面积Sij。
3.根据权利要求1所述的一种面向大规模三维重建的图像分块方法,其特征在于:所述步骤2.1.4对特征矩阵X进行归一化得到矩阵Y,矩阵Y中元素的值通过下述公式进行计算:
其中,i∈[1,n],j∈[1,k],Xij和Yij分别表示特征矩阵X和矩阵Y的第i行第j列元素的值。
4.根据权利要求1所述的一种面向大规模三维重建的图像分块方法,其特征在于:所述步骤2.1.5采用模糊C均值聚类法进行聚类,具体过程如下:
步骤2.1.5.1在区间(0,1)随机初始化向量集Y=(y1,y2,...,yn)T的隶属度矩阵U,使其满足
步骤2.1.5.2通过下面的公式算出整个向量集的m个聚类中心:
其中,uij∈[0,1],ci=[c1i,c2i,…,cki]为第i个聚类簇Ai的中心,i∈[1,m],yj=[yj1,yj2,…,yjk]为向量集Y的第j个行向量,dij=||cj-yi||为第j个聚类中心到第i个归一化特征向量的距离,σ∈[1,∞)是一个加权系数;
步骤2.1.5.3对下面公式中的能量函数进行计算,如果能量函数值小于预设阈值THRd,或者相对于上一次计算得到的能量值的变化小于预设阈值THRc,则结束;否则,转到步骤2.1.5.2根据更新的隶属度矩阵U更新聚类中心;
5.根据权利要求4所述的一种面向大规模三维重建的图像分块方法,其特征在于:σ=1.5。
6.根据权利要求4所述的一种面向大规模三维重建的图像分块方法,其特征在于:THRd=0.02,THRc=0.0001。
7.根据权利要求1-6任一所述的一种面向大规模三维重建的图像分块方法,其特征在于:THR1=30,THR2=80。
8.一种面向大规模三维重建的图像分块装置,其特征在于:包括直接相连的相似度矩阵计算模块和图像聚类模块;所述相似度矩阵计算模块用于计算图像集中任意两张图像的相似度,然后得到相似度矩阵,所述图像聚类模块用于根据相似度矩阵自适应地将图像分类。
9.根据权利要求8所述的一种面向大规模三维重建的图像分块装置,其特征在于:所述图像聚类模块由谱聚类单元和不确定图像归类单元,谱聚类单元通过谱聚类算法对图像集合进行归类,同时将不确定图像归入不 确定集合中,然后由不确定图像归类单元对这些图像按照权利要求1所述步骤三的规则进行进一步的分类。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510249022.6A CN104809478B (zh) | 2015-05-15 | 2015-05-15 | 一种面向大规模三维重建的图像分块方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510249022.6A CN104809478B (zh) | 2015-05-15 | 2015-05-15 | 一种面向大规模三维重建的图像分块方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104809478A true CN104809478A (zh) | 2015-07-29 |
CN104809478B CN104809478B (zh) | 2018-01-09 |
Family
ID=53694289
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510249022.6A Expired - Fee Related CN104809478B (zh) | 2015-05-15 | 2015-05-15 | 一种面向大规模三维重建的图像分块方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104809478B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106446010A (zh) * | 2016-08-23 | 2017-02-22 | 北京三体高创科技有限公司 | 一种基于模糊对应函数的3d模型局部检索方法及装置 |
CN108701161A (zh) * | 2016-03-04 | 2018-10-23 | 微软技术许可有限责任公司 | 为搜索查询提供图像 |
CN109741380A (zh) * | 2018-12-27 | 2019-05-10 | 广州华迅网络科技有限公司 | 纺织品图片快速匹配方法和装置 |
CN110084254A (zh) * | 2018-01-23 | 2019-08-02 | 北京国双科技有限公司 | 基于社交网络的相似图像确定方法及装置 |
CN111862305A (zh) * | 2020-06-30 | 2020-10-30 | 北京百度网讯科技有限公司 | 处理图像的方法、装置和计算机存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101266690A (zh) * | 2007-03-15 | 2008-09-17 | 华南农业大学 | 植物根系形态三维图像重建系统及方法 |
CN101930548A (zh) * | 2010-06-24 | 2010-12-29 | 北京师范大学 | 一种基于独立成分分析算法的高空间分辨率影像的识别方法 |
US20110242319A1 (en) * | 2010-03-31 | 2011-10-06 | Aisin Aw Co., Ltd. | Image processing system and position measurement system |
CN103902979A (zh) * | 2014-04-01 | 2014-07-02 | 浙江大学 | 一种人脸特征提取及分类方法 |
-
2015
- 2015-05-15 CN CN201510249022.6A patent/CN104809478B/zh not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101266690A (zh) * | 2007-03-15 | 2008-09-17 | 华南农业大学 | 植物根系形态三维图像重建系统及方法 |
US20110242319A1 (en) * | 2010-03-31 | 2011-10-06 | Aisin Aw Co., Ltd. | Image processing system and position measurement system |
CN101930548A (zh) * | 2010-06-24 | 2010-12-29 | 北京师范大学 | 一种基于独立成分分析算法的高空间分辨率影像的识别方法 |
CN103902979A (zh) * | 2014-04-01 | 2014-07-02 | 浙江大学 | 一种人脸特征提取及分类方法 |
Non-Patent Citations (1)
Title |
---|
纳跃跃等: "一种用于谱聚类图像分割的像素相似度计算方法", 《南京大学学报(自然科学)》 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108701161A (zh) * | 2016-03-04 | 2018-10-23 | 微软技术许可有限责任公司 | 为搜索查询提供图像 |
CN108701161B (zh) * | 2016-03-04 | 2022-04-01 | 微软技术许可有限责任公司 | 为搜索查询提供图像 |
CN106446010A (zh) * | 2016-08-23 | 2017-02-22 | 北京三体高创科技有限公司 | 一种基于模糊对应函数的3d模型局部检索方法及装置 |
CN110084254A (zh) * | 2018-01-23 | 2019-08-02 | 北京国双科技有限公司 | 基于社交网络的相似图像确定方法及装置 |
CN109741380A (zh) * | 2018-12-27 | 2019-05-10 | 广州华迅网络科技有限公司 | 纺织品图片快速匹配方法和装置 |
CN111862305A (zh) * | 2020-06-30 | 2020-10-30 | 北京百度网讯科技有限公司 | 处理图像的方法、装置和计算机存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN104809478B (zh) | 2018-01-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Dupont et al. | Generative models as distributions of functions | |
Zhang et al. | Patchformer: An efficient point transformer with patch attention | |
Li et al. | Cross-modal attentional context learning for RGB-D object detection | |
Tang et al. | RGBT salient object detection: Benchmark and a novel cooperative ranking approach | |
CN115063573B (zh) | 一种基于注意力机制的多尺度目标检测方法 | |
CN112733749A (zh) | 融合注意力机制的实时行人检测方法 | |
CN104809478A (zh) | 一种面向大规模三维重建的图像分块方法及装置 | |
CN106295613A (zh) | 一种无人机目标定位方法及系统 | |
CN111310821B (zh) | 多视图特征融合方法、系统、计算机设备及存储介质 | |
CN106340004B (zh) | 一种基于模糊聚类预处理云系的并行云迹风反演方法 | |
CN109064389B (zh) | 一种手绘线条画生成现实感图像的深度学习方法 | |
CN114913379B (zh) | 基于多任务动态对比学习的遥感图像小样本场景分类方法 | |
CN113901931B (zh) | 一种基于知识蒸馏模型的红外和可见光视频的行为识别方法 | |
Zhang et al. | Real-time detection of river surface floating object based on improved RefineDet | |
Alsanad et al. | Real-time fuel truck detection algorithm based on deep convolutional neural network | |
Tripathi et al. | Real time object detection using CNN | |
Muzahid et al. | Progressive conditional GAN-based augmentation for 3D object recognition | |
Yu et al. | GPF-Net: Graph-polarized fusion network for hyperspectral image classification | |
Xu et al. | Multi‐pyramid image spatial structure based on coarse‐to‐fine pyramid and scale space | |
Zhou et al. | X-hrnet: Towards lightweight human pose estimation with spatially unidimensional self-attention | |
Wang et al. | Cross-domain learning using optimized pseudo labels: toward adaptive car detection in different weather conditions and urban cities | |
Xin et al. | Random part localization model for fine grained image classification | |
Yang et al. | Deep-learning-based mask-cut method for InSAR phase unwrapping | |
Peng et al. | Attention-guided fusion network of point cloud and multiple views for 3D shape recognition | |
Xiang et al. | Optical flow estimation using spatial-channel combinational attention-based pyramid networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
EXSB | Decision made by sipo to initiate substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20180109 Termination date: 20180515 |