CN107066520B - 一种基于多个语义层次的图片检索方法及系统 - Google Patents
一种基于多个语义层次的图片检索方法及系统 Download PDFInfo
- Publication number
- CN107066520B CN107066520B CN201710078579.7A CN201710078579A CN107066520B CN 107066520 B CN107066520 B CN 107066520B CN 201710078579 A CN201710078579 A CN 201710078579A CN 107066520 B CN107066520 B CN 107066520B
- Authority
- CN
- China
- Prior art keywords
- picture
- convolution
- feature
- candidate
- retrieval
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 238000011176 pooling Methods 0.000 claims abstract description 41
- 238000004364 calculation method Methods 0.000 claims abstract description 35
- 230000004927 fusion Effects 0.000 claims abstract description 20
- 238000013528 artificial neural network Methods 0.000 claims abstract description 8
- 230000008447 perception Effects 0.000 claims abstract description 8
- 238000013507 mapping Methods 0.000 claims abstract description 6
- 238000013527 convolutional neural network Methods 0.000 claims description 12
- 238000000605 extraction Methods 0.000 claims description 6
- 230000009467 reduction Effects 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 5
- 238000012163 sequencing technique Methods 0.000 claims description 3
- 230000000007 visual effect Effects 0.000 abstract description 5
- 239000010410 layer Substances 0.000 description 42
- 238000010586 diagram Methods 0.000 description 7
- 239000000284 extract Substances 0.000 description 4
- 239000002356 single layer Substances 0.000 description 3
- 230000006870 function Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000001537 neural effect Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5838—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Library & Information Science (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于多个语义层次的图片检索方法及系统,方法包括:将待检索的图片输入一预训练模型,并输入所述图片的像素值和带有局部区域信息的候选区域,在所述预训练模型的神经网络中,通过将所述图片中的所述候选区域映射到每一个卷积层输出的卷积特征图上后根据候选区域的大小自适应调整池化核的大小,得到相同维度的所述卷积特征图;根据所述卷积特征图对低、中、高卷积层进行区域感知的多层次池化计算,再通过串联得到不同层次的特征融合;根据特征融合结果,对图片进行检索。本发明中的特征同时包含局部信息以及全局信息,同时包含视觉信息以及语义信息,从而提高图片检索的准确率,另外,单次的前馈计算操作保证了高效率。
Description
技术领域
本发明涉及神经网络、图像处理领域,特别涉及一种基于多个语义层次的图片检索方法及系统。
背景技术
现如今用于图片检索的特征提取方法主要分为两种:基于传统特征以及基于卷积神经网络。其中,基于传统特征的方法由于图片特征都是手工设计的,表达能力很弱同时特征维度很高。此外,目前大多数基于卷积神经网络的方法是提取网络中的单层特征,其中全连接层的特征用得最多,而这些方法忽略了卷积特征图中丰富的局部信息,并且忽略了网络中低层特征图所包含的视觉信息。
具体而言,现有的用于图片检索的特征提取方法概括如下:
1,传统特征(SIFT)以及特征聚合(VLAD,Fisher Vector),缺点在于:特征维度高,特征表达能力弱,检索准确率低。
2,卷积神经网络(通过预训练以及全连接层特征),缺点在于:特征纬度高,特征缺乏局部信息,特征缺乏低层视觉信息。
发明内容
本发明要解决的技术问题是,提供了提高图片检索的准确率同时保证高效率的基于多个语义层次的图片检索方法。
解决上述技术问题,本发明提供了一种基于多个语义层次的图片检索方法,包括如下步骤:
将待检索的图片输入一预训练模型,并输入所述图片的像素值和带有局部区域信息的候选区域,
在所述预训练模型的神经网络中,通过将所述图片中的所述候选区域映射到每一个卷积层输出的卷积特征图上后根据候选区域的大小自适应调整池化核的大小,得到相同维度的所述卷积特征图;
根据所述卷积特征图对低、中、高卷积层进行区域感知的多层次池化计算,再通过串联得到不同层次的特征融合;
根据特征融合结果,对图片进行检索。
本发明是在预训练模型的基础上,通过结合局部区域信息以及融合不同层特征,提高图片检索的准确性同时保证高效率。
更进一步,通过将所述图片中的所述候选区域映射到每一个卷积层输出的卷积特征图上的具体方法如下:
待检索的图片为原始图片,设原始图片的大小为:W*H,卷积特征图的维度为:W0*H0*C,每个区域对应输出的特征图大小为:Wr*Hr*C,对于一个原始图片的候选区域(x,y,w,h),进行如下的计算:
更进一步,根据候选区域的大小自适应地调整池化核的大小,得到相同维度的所述卷积特征图的方法为:
通过一个多尺度的池化计算提取候选区域不同位置的特征,再经过跨通道的归一化之后,最后通过相加操作得到最后的特征。
多尺度的池化计算中对于多尺度为:对同一个特征图用不同大小的核进行池化计算,使得得到的特征包含不同尺度的信息。
对于多通道的特征图而言,特征图中每个位置的特征都在多个通道之间进行归一化。
更进一步,所述多尺度的池化计算提取候选区域不同部件的特征的具体计算方法如下:
更进一步,所述不同层次特征融合单元中的多层次池化包括:卷积神经网络中的不同层以及卷积特征图中的不同局部区域。
更进一步,串联得到不同层次的特征融合时还包括:PCA降维计算。
更进一步,所述候选区域包括:图片中包含的特定目标区域。
本发明还提供了一种基于多个语义层次的图片检索系统,包括:多层次池化单元和不同层次特征融合单元,
所述多层次池化单元,用以将待检索的图片输入一预训练模型,并输入所述图片的像素值和候选区域,
在所述预训练模型的神经网络中,通过将所述图片中的所述候选区域映射到每一个卷积层输出的卷积特征图上后根据候选区域的大小自适应地调整池化核的大小,得到相同维度的所述卷积特征图;
所述不同层次特征融合单元,用以根据所述卷积特征图对低、中、高卷积层进行区域感知的多层次池化计算,再通过串联得到不同层次的特征融合。
本发明还提供了一种检索系统,包括一检索候选集和所述的图片检索系统,并按照如下步骤操作:
初始化所述检索候选集,提取每张图片的特征后并储存;
通过将待检索的图片输入所述图片检索系统进行特征提取,
在所述检索候选集中计算待检索的图片与预置图片的欧式距离并排序,
返回得到相似图片的检索结果。
本发明的有益效果:
本发明是在预训练好的卷积神经网络模型基础上,通过引入局部区域候选框信息,并融合网络中不同层的特征(现有技术中仅为单层特征),来提取图片的特征,使得特征同时包含局部信息以及全局信息,同时包含视觉信息以及语义信息,从而提高图片检索的准确率,另外,单次的前馈计算操作保证了高效率。
此外,本发明还具备如下的优点:由于采用了结合局部区域信息的候选区域而准确率高。由于融合不同层的特征的多层次池化计算鲁棒性好。由于不同训练基于预训练模型,使得通用性好。由于在神经卷积网络中只有单次的前馈计算,从而整个检索过程速度得到有效地提高。
附图说明
图1是本发明一实施例中的方法流程示意图;
图2是本发明一实施例中的系统结构示意图;
图3是本发明的检索系统结构示意图;
图4是本发明中区域感知的多层次池化示意图;
图5是本发明中不同层次的特征融合示意图。
具体实施方式
现在将参考一些示例实施例描述本公开的原理。可以理解,这些实施例仅出于说明并且帮助本领域的技术人员理解和实施例本公开的目的而描述,而非建议对本公开的范围的任何限制。在此描述的本公开的内容可以以下文描述的方式之外的各种方式实施。
如本文中所述,术语“包括”及其各种变体可以被理解为开放式术语,其意味着“包括但不限于”。术语“基于”可以被理解为“至少部分地基于”。术语“一个实施例”可以被理解为“至少一个实施例”。术语“另一实施例”可以被理解为“至少一个其它实施例”。
在本申请中定义如下名词的含义:
多个语义层次,指的是卷积神经网络中不同层的输出特征所代表的语义不同,本申请中融合了不同层的特征,因此包含多个语义层次。
卷积特征图包括但不限于,卷积神经网络中卷积层输出的一系列特征。
候选区域包括但不限于,图片中可能包含特定目标的区域。
多层次包括但不限于,卷积神经网络中的不同层以及卷积特征图中的不同局部区域。
图1是本发明一实施例中的方法流程示意图,一种基于多个语义层次的图片检索方法,包括如下步骤:
步骤S100将待检索的图片输入一预训练模型,并输入所述图片的像素值和带有局部区域信息候选区域,
步骤S101在所述预训练模型的神经网络中,通过将所述图片中的所述候选区域映射到每一个卷积层输出的卷积特征图上后根据候选区域的大小自适应调整池化核的大小,得到相同维度的所述卷积特征图;
步骤S102根据所述卷积特征图对低、中、高卷积层进行区域感知的多层次池化计算,再通过串联得到不同层次的特征融合;
步骤S103根据特征融合结果,对图片进行检索。
通过上述步骤S100-步骤S103中的操作步骤可知,在本实施例中的步骤S100中引入了图片中候选区域的信息,并且融合了网络中不同层之间的特征,使得最后提取的特征同时包含低层视觉信息以及高层语义信息,大大提升了特征的鲁棒性,从而有效提升了检索准确率。同时,由于在上述步骤中只进行了单次的前馈计算,并且最后的特征经过了PCA降维,从而保证了特征提取的效率。
作为本实施例中的优选,在步骤S101中,通过将所述图片中的所述候选区域映射到每一个卷积层输出的卷积特征图上的具体方法如下:
待检索的图片为原始图片,设原始图片的大小为:W*H,卷积特征图的维度为:W0*H0*C,每个区域对应输出的特征图大小为:Wr*Hr*C,对于一个原始图片的候选区域(x,y,w,h),进行如下的计算:
作为本实施例中的优选,根据候选区域的大小自适应地调整池化核的大小,得到相同维度的所述卷积特征图的方法为:
通过一个多尺度的池化计算提取候选区域不同位置的特征,再经过跨通道的归一化之后,最后通过相加操作得到最后的特征。
其中,所述多尺度的池化计算提取候选区域不同部件的特征的具体计算方法如下:
在本实施例中,通过局部区域信息的引入以及多层次的池化计算,有效地提升了特征的表达能力以及鲁棒性。
作为本实施例中的优选,在步骤S102中所述多层次池化包括:卷积神经网络中的不同层以及卷积特征图中的不同局部区域。
步骤S102中,由于卷积神经网络是一个分层次的结构,不同层的特征表达能力存在一定的差异,不同层之间的特征存在一定的互补性。而现有技术中基于卷积神经网络的方法都是提取单层全连接层的特征,因此,本实施例中通过融合不同层的特征来提升特征的表达能力。具体来说,同时对低层以及高层的卷积层进行区域感知的多层次池化,最后串联在一起并通过降维计算来实现特征的融合。
作为本实施例中的优选,在步骤S102中串联得到不同层次的特征融合时还包括:PCA降维计算。
作为本实施例中的优选,在步骤S100中的所述候选区域包括:图片中包含的特定目标区域,候选区域带有局部区域信息。
图2是本发明一实施例中的系统结构示意图,一种基于多个语义层次的图片检索系统,包括:多层次池化单元1和不同层次特征融合单元2,所述多层次池化单元1,用以将待检索的图片输入一预训练模型,并输入所述图片的像素值和候选区域,在所述预训练模型的神经网络中,通过将所述图片中的所述候选区域映射到每一个卷积层输出的卷积特征图上后根据候选区域的大小自适应地调整池化核的大小,得到相同维度的所述卷积特征图;所述不同层次特征融合单元2,用以根据所述卷积特征图对低、中、高卷积层进行区域感知的多层次池化计算,再通过串联得到不同层次的特征融合。本实施例中多层次池化单元1由于采用了结合局部区域信息的候选区域而准确率高。不同层次特征融合单元2中由于融合不同层的特征的多层次池化计算鲁棒性好。多层次池化单元1中由于不同训练基于预训练模型,使得通用性好。由于在神经卷积网络中只有单次的前馈计算,从而整个检索过程速度得到有效地提高。
请参考图3是-图5,具体来说,如图5,对于任意一张输入图片及其候选区域框,分别选取网络中低层、中层以及高层的卷积层,进行如图4所示的区域感知的多尺度池化计算,其中公式
即采用三个不同的尺度,之后将不同层的特征串联在一起,并通过降维计算来融合,从而每一张图片都得到一个对应的特征向量。如图3所示,本实施例中的一种检索系统,包括一检索候选集和所述的图片检索系统,并按照如下步骤操作:初始化所述检索候选集,提取每张图片的特征后并储存;通过将待检索的图片输入所述图片检索系统进行特征提取,在所述检索候选集中计算待检索的图片与预置图片的欧式距离并排序,返回得到相似图片的检索结果。一个图像检索系统由候选集以及查询图片构成,可以事先对候选集中的每一张图片提取特征并存储起来,而对于一张输入的查询图片,首先提取其特征,再和候选集中的每张候选图片两两计算欧式距离,最后排序,实现检索功能。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
总体而言,本公开的各种实施例可以以硬件或专用电路、软件、逻辑或其任意组合实施。一些方面可以以硬件实施,而其它一些方面可以以固件或软件实施,该固件或软件可以由控制器、微处理器或其它计算设备执行。虽然本公开的各种方面被示出和描述为框图、流程图或使用其它一些绘图表示,但是可以理解本文描述的框、设备、系统、技术或方法可以以非限制性的方式以硬件、软件、固件、专用电路或逻辑、通用硬件或控制器或其它计算设备或其一些组合实施。
此外,虽然操作以特定顺序描述,但是这不应被理解为要求这类操作以所示的顺序执行或是以顺序序列执行,或是要求所有所示的操作被执行以实现期望结果。在一些情形下,多任务或并行处理可以是有利的。类似地,虽然若干具体实现方式的细节在上面的讨论中被包含,但是这些不应被解释为对本公开的范围的任何限制,而是特征的描述仅是针对具体实施例。在分离的一些实施例中描述的某些特征也可以在单个实施例中组合地执行。相反对,在单个实施例中描述的各种特征也可以在多个实施例中分离地实施或是以任何合适的子组合的方式实施。
Claims (8)
1.一种基于多个语义层次的图片检索方法,其特征在于包括如下步骤:
将待检索的图片输入一预训练模型,并输入所述图片的像素值和带有局部区域信息的候选区域,
在所述预训练模型的神经网络中,通过将所述图片中的所述候选区域映射到每一个卷积层输出的卷积特征图上后根据候选区域的大小自适应调整池化核的大小,得到相同维度的所述卷积特征图;
根据所述卷积特征图对低、中、高卷积层进行区域感知的多层次池化计算,再通过串联得到不同层次的特征融合;
根据特征融合结果,对图片进行检索;
通过将所述图片中的所述候选区域映射到每一个卷积层输出的卷积特征图上的具体方法如下:
待检索的图片为原始图片,设原始图片的大小为:W*H,卷积特征图的维度为:W0*H0*C,每个区域对应输出的特征图大小为:Wr*Hr*C ,对于一个原始图片的候选区域(x,y,w,h),进行如下的计算:
2.根据权利要求1所述的图片检索方法,其特征在于,根据候选区域的大小自适应地调整池化核的大小,得到相同维度的所述卷积特征图的方法为:
通过一个多尺度的池化计算提取候选区域不同位置的特征,再经过跨通道的归一化之后,最后通过相加操作得到最后的特征。
4.根据权利要求1所述的图片检索方法,其特征在于,所述多层次池化包括:卷积神经网络中的不同层以及卷积特征图中的不同局部区域。
5.根据权利要求1所述的图片检索方法,其特征在于,串联得到不同层次的特征融合时还包括:PCA降维计算。
6.根据权利要求1所述的图片检索方法,其特征在于,所述候选区域包括:图片中包含的特定目标区域。
7.一种基于多个语义层次的图片检索系统,其特征在于,包括:多层次池化单元和不同层次特征融合单元,
所述多层次池化单元,用以将待检索的图片输入一预训练模型,并输入所述图片的像素值和候选区域,
在所述预训练模型的神经网络中,通过将所述图片中的所述候选区域映射到每一个卷积层输出的卷积特征图上后根据候选区域的大小自适应地调整池化核的大小,得到相同维度的所述卷积特征图;
所述不同层次特征融合单元,用以根据所述卷积特征图对低、中、高卷积层进行区域感知的多层次池化计算,再通过串联得到不同层次的特征融合;
通过将所述图片中的所述候选区域映射到每一个卷积层输出的卷积特征图上的具体方法如下:
待检索的图片为原始图片,设原始图片的大小为:W*H,卷积特征图的维度为:W0*H0*C,每个区域对应输出的特征图大小为:Wr*Hr*C ,对于一个原始图片的候选区域(x,y,w,h),进行如下的计算:
8.一种检索系统,其特征在于,包括一检索候选集和如权利要求7所述的基于多个语义层次的图片检索系统,并按照如下步骤操作:
初始化所述检索候选集,提取每张图片的特征后并储存;
通过将待检索的图片输入所述图片检索系统进行特征提取,
在所述检索候选集中计算待检索的图片与预置图片的欧式距离并排序,
返回得到相似图片的检索结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710078579.7A CN107066520B (zh) | 2017-02-14 | 2017-02-14 | 一种基于多个语义层次的图片检索方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710078579.7A CN107066520B (zh) | 2017-02-14 | 2017-02-14 | 一种基于多个语义层次的图片检索方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107066520A CN107066520A (zh) | 2017-08-18 |
CN107066520B true CN107066520B (zh) | 2021-05-18 |
Family
ID=59598142
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710078579.7A Active CN107066520B (zh) | 2017-02-14 | 2017-02-14 | 一种基于多个语义层次的图片检索方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107066520B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108009191A (zh) * | 2017-09-24 | 2018-05-08 | 贵州师范学院 | 一种图像检索方法 |
CN110580482B (zh) * | 2017-11-30 | 2022-04-08 | 腾讯科技(深圳)有限公司 | 图像分类模型训练、图像分类、个性化推荐方法及装置 |
CN108197591A (zh) * | 2018-01-22 | 2018-06-22 | 北京林业大学 | 一种基于多特征融合迁移学习的鸟类个体识别方法 |
CN112612913A (zh) * | 2020-12-28 | 2021-04-06 | 厦门市美亚柏科信息股份有限公司 | 一种用于图像的搜索方法和系统 |
CN113688702B (zh) * | 2021-08-12 | 2024-04-26 | 武汉工程大学 | 基于融合多特征的街景图像处理方法及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103294813A (zh) * | 2013-06-07 | 2013-09-11 | 北京捷成世纪科技股份有限公司 | 一种敏感图片搜索方法和装置 |
CN105989094A (zh) * | 2015-02-12 | 2016-10-05 | 中国科学院西安光学精密机械研究所 | 基于隐层语义中层表达的图像检索方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102260805B1 (ko) * | 2014-08-06 | 2021-06-07 | 삼성전자주식회사 | 이미지 검색 장치 및 그 방법 |
US9940575B2 (en) * | 2015-06-04 | 2018-04-10 | Yahoo Holdings, Inc. | Image searching |
-
2017
- 2017-02-14 CN CN201710078579.7A patent/CN107066520B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103294813A (zh) * | 2013-06-07 | 2013-09-11 | 北京捷成世纪科技股份有限公司 | 一种敏感图片搜索方法和装置 |
CN105989094A (zh) * | 2015-02-12 | 2016-10-05 | 中国科学院西安光学精密机械研究所 | 基于隐层语义中层表达的图像检索方法 |
Also Published As
Publication number | Publication date |
---|---|
CN107066520A (zh) | 2017-08-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107066520B (zh) | 一种基于多个语义层次的图片检索方法及系统 | |
US20210279503A1 (en) | Image processing method, apparatus, and device, and storage medium | |
CN110837811B (zh) | 语义分割网络结构的生成方法、装置、设备及存储介质 | |
CN110674829B (zh) | 一种基于图卷积注意网络的三维目标检测方法 | |
CN108846826B (zh) | 物体检测方法、装置、图像处理设备及存储介质 | |
CN114202672A (zh) | 一种基于注意力机制的小目标检测方法 | |
CN114067107B (zh) | 基于多粒度注意力的多尺度细粒度图像识别方法及系统 | |
CN108734210B (zh) | 一种基于跨模态多尺度特征融合的对象检测方法 | |
US20240135139A1 (en) | Implementing Traditional Computer Vision Algorithms as Neural Networks | |
EP3635629A1 (en) | Fine-grained image recognition | |
US20210334662A1 (en) | Method for learning neuaral network and device thereof | |
CN111062981B (zh) | 图像处理方法、装置及存储介质 | |
CN110807362B (zh) | 一种图像检测方法、装置和计算机可读存储介质 | |
CN109583483A (zh) | 一种基于卷积神经网络的目标检测方法和系统 | |
Das et al. | Estimation of road boundary for intelligent vehicles based on deeplabv3+ architecture | |
CN110110578B (zh) | 一种室内场景语义标注方法 | |
EP4404148A1 (en) | Image processing method and apparatus, and computer-readable storage medium | |
EP3836083B1 (en) | Disparity estimation system and method, electronic device and computer program product | |
CN109919149A (zh) | 基于物体检测模型的物体标注方法及相关设备 | |
CN113066089A (zh) | 一种基于注意力引导机制的实时图像语义分割网络 | |
CN110415263A (zh) | 图像分割方法以及图像分割装置 | |
CN114972947B (zh) | 一种基于模糊语义建模的深度场景文本检测方法和装置 | |
CN112241736B (zh) | 一种文本检测的方法及装置 | |
JP2021039758A (ja) | 画像間の類似度を利用した類似領域強調方法およびシステム | |
CN112580435B (zh) | 人脸定位方法、人脸模型训练与检测方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20210426 Address after: 215123 unit 2-b702, creative industry park, No. 328, Xinghu street, Suzhou Industrial Park, Suzhou City, Jiangsu Province Applicant after: SUZHOU FEISOU TECHNOLOGY Co.,Ltd. Address before: 100000, No. 7, building 15, College Road, Haidian District, Beijing, 17, 2015 Applicant before: BEIJING FEISOU TECHNOLOGY Co.,Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |