CN115861715A - 基于知识表示增强的图像目标关系识别算法 - Google Patents
基于知识表示增强的图像目标关系识别算法 Download PDFInfo
- Publication number
- CN115861715A CN115861715A CN202310113097.6A CN202310113097A CN115861715A CN 115861715 A CN115861715 A CN 115861715A CN 202310113097 A CN202310113097 A CN 202310113097A CN 115861715 A CN115861715 A CN 115861715A
- Authority
- CN
- China
- Prior art keywords
- knowledge
- visual
- vector
- image
- relation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000000007 visual effect Effects 0.000 claims abstract description 53
- 238000000034 method Methods 0.000 claims abstract description 15
- 238000001514 detection method Methods 0.000 claims abstract description 13
- 238000013507 mapping Methods 0.000 claims abstract description 13
- 239000013598 vector Substances 0.000 claims description 30
- 238000012549 training Methods 0.000 claims description 17
- 238000011176 pooling Methods 0.000 claims description 9
- 238000010586 diagram Methods 0.000 claims description 8
- 238000013519 translation Methods 0.000 claims description 7
- 230000004913 activation Effects 0.000 claims description 4
- 101100001674 Emericella variicolor andI gene Proteins 0.000 claims description 3
- 230000007812 deficiency Effects 0.000 abstract description 3
- 238000004364 calculation method Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 8
- 238000004140 cleaning Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 101100379079 Emericella variicolor andA gene Proteins 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- OLBCVFGFOZPWHH-UHFFFAOYSA-N propofol Chemical compound CC(C)C1=CC=CC(C(C)C)=C1O OLBCVFGFOZPWHH-UHFFFAOYSA-N 0.000 description 1
- 229960004134 propofol Drugs 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Landscapes
- Image Analysis (AREA)
Abstract
本发明涉及图像特征识别领域,特别是指基于知识表示增强的图像目标关系识别算法,本发明解决了现有技术中因设备所采集的稀疏图像数据无法使用常规的视觉与语义混合特征来进行视觉关系检测的问题。本发明包括以下步骤:A视觉特征采集;B知识图谱建立;C其他信息来源获取;D特征映射。本发明很好地解决物联网图像数据稀疏而无法使用传统视觉关系检测算法的问题。本发明提出的基于知识表示增强的模型不仅引入先验知识来弥补输入数据稀疏的不足,还通过减少用于提取关系的视觉特征的参数并设计一个将视觉特征与先验知识相结合的损失函数,提高了视觉关系检测的效率及表现。
Description
技术领域
本发明涉及图像特征识别领域,特别是指基于知识表示增强的图像目标关系识别算法。
背景技术
视觉关系检测即对图像中可能存在的对象进行检测的同时,再根据每组对象之间的关系进行分类,其被认为是在语义上连接低级视觉信息和高级语义信息的桥梁。视觉关系通常表示图像中对象之间的关系类型,常用三元组进行表示,即主语、谓语和宾语,其中谓语可以是动词、空间位置、介词和比较词。通过对这些相互关系的检测,可以从图像中发现各种信息,也可以显著提高物联网系统的功能。此外,还可以通过自主关系推断出潜在的敏感信息泄露问题,并为安全的多媒体物联网数据处理提供指南。
对视觉关系检测的早期研究主要仅依赖于视觉特征来获取图像中的复杂视觉变量,与关系分类相关的各种信息则较为缺乏。但由于物联网数据的稀疏性,图像数据集的规模及数据集中图像的信息详细程度都将受到一定限制。例如传感设备在数据发布方面较为保守,这在当图像数据包含丰富的语义信息时尤为明显;同时由于隐私问题,图像可能在发布前会被屏蔽或混淆。图像的稀疏性所引起的上述问题都让视觉关系检测变得更加困难,故在物联网系统中,依靠完全基于视觉特征的方法并不能实现视觉关系检测。
亟待出现一种可解决上述问题的新型的关系识别方法。
发明内容
本发明提出基于知识表示增强的图像目标关系识别方法,解决了现有技术中因设备所采集的图像数据模糊不清、拍摄角度不佳以及待测目标重叠遮掩而无法使用常规的视觉与语义混合特征来进行视觉关系检测的问题。
本发明的技术方案是这样实现的:基于知识表示增强的图像目标关系识别方法,包括以下步骤:
A视觉特征采集:提取待检测图像的视觉特征;
B知识图谱建立:将知识图谱中的关系以低维向量的方式表示出来,并满足平移关系;知识图谱包括用于获取对象和关系之间的结构化信息的先验知识;
C特征映射:将步骤A中获取的视觉特征映射至步骤B中的嵌入向量空间,进而进行目标关系的计算。
所述步骤A具体的是:
A1:特征图:在不改变输入图像大小的前提下,使用一组卷积层、非线性激活层和池化层提取图像的特征图;
A2:候选区域:将A1中的特征图用于区域候选网络生成提高精度的候选区域;
A3:区域特征图:将特征图和候选区域综合后,提取区域特征图;
A4:目标类别判定:利用获取的区域特征图计算区域的类别,其中类别包括目标及背景,并利用边框回归获得对象的位置,以获得对象的视觉特征向量。
所述步骤B具体的是:
B1:将训练集中的三元组、实体集、关系集、边际和向量维度超参数输入至图谱嵌入模型,并对输入数据进行初始化;
B2:从训练集合中随机选出正面样本,再基于正面样本获得负面样本,共同构成批训练数据集;
B3:通过训练使表示向量满足平移关系。
所述步骤C的先验知识还包括将视觉特征和先验知识结合以提高视觉关系检测的损失函数。
所述步骤C具体的是:
c2:设置两组实体三元组集;
c3:根据正负样本进行训练,计算三元组损失;
本发明公开的基于知识表示增强的图像目标关系识别方法本发明能很好地解决物联网图像数据稀疏而无法使用传统视觉关系检测算法的问题。本发明提出的基于知识表示增强的模型不仅引入先验知识来弥补输入数据稀疏的不足,还通过减少用于提取关系的视觉特征的参数并设计一个将视觉特征与先验知识相结合的损失函数,提高了视觉关系检测的效率及表现。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1:具体实施方式的流程示意图;
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明公开的基于知识表示增强的图像目标关系识别方法,包括以下步骤:
A视觉特征采集:提取待检测图像的视觉特征;
B知识图谱建立:将知识图谱中的关系以低维向量的方式表示出来,并满足平移关系;知识图谱包括用于获取对象和关系之间的结构化化信息的先验知识;
C特征映射:将步骤A中获取的视觉特征映射至步骤B中的嵌入向量空间,进而进行目标关系的计算。
所述步骤A具体的是:
A1:特征图:在不改变输入图像大小的前提下,使用一组卷积层、非线性激活层和池化层提取图像的特征图;
A2:候选区域:将A1中的特征图用于区域候选网络生成提高精度的候选区域;
A3:区域特征图:将特征图和候选区域综合后,提取区域特征图;
A4:目标类别判定:利用获取的区域特征图计算区域的类别,其中类别包括目标及背景,并利用边框回归获得对象的位置,以获得对象的视觉特征向量,用于表示目标的具体类别,例如行人、马路等等。
所述步骤B具体的是:
B1:将训练集中的三元组、实体集、关系集、边际和向量维度超参数输入至图谱嵌入模型,并对输入数据进行初始化;
B2:从训练集合中随机选出正面样本,再基于正面样本获得负面样本,共同构成批训练数据集;
B3:通过训练使表示向量满足平移关系。
步骤C具体的是:
C2:设置两组实体三元组集;
C3:根据正负样本进行训练,计算三元组损失;
本发明公开的基于知识表示增强的图像目标关系识别方法本发明能很好地解决物联网图像数据稀疏而无法使用传统视觉关系检测算法的问题。本发明提出的基于知识表示增强的模型不仅引入先验知识来弥补输入数据稀疏的不足,还通过减少用于提取关系的视觉特征的参数并设计一个将视觉特征与先验知识相结合的损失函数,提高了视觉关系检测的效率及表现
如图1所示,本发明实施例包括以下步骤:
对开源的Visual Genome ,简称VG数据集进行预处理,包括图像分辨率的统一、直方图均衡化、数据清理等等,实施例中使用的版本为VG v1.4,其中包含108077张图像,每张图像平均有21个关系,区域图谱的形式进行保存,区域图谱由多个特定关系以及满足该关系的两个目标构成,例如男人、跳过、消防栓。由于VG数据集使用众包的方式实现,通过删除非字母字符与停用词,并使用自用更正库来更正拼写的方法来清理数据;将数据拆分为86462张图像作为训练集,以及21615张图像作为测试集;
A:将图片输入模型,输出图像中的一组对象以及对象的位置,具体子流程如下所示:
A1:通过使用一组卷积层、池化层、非线性激活层提取图像的特征图,网络实现具体细节如下表所示,表中前缀conv表示卷积层,pooling表示池化层;
由于对所有的卷积都做了扩边处理,致使卷积层不改变输入和输出矩阵大小,而池化层的卷积核为2×2,步长为2,故池化层会使输出图像的长宽都变为输入的,故一个M×N大小的矩阵经过该网络后大小会变为,这样生成的特征图上的一个像素点就对应着原始图片上的256个像素点,和原图的位置相对应;
A2:对该特征图再次使用上表中conv_5相同的卷积层进行处理后,生成anchors,即对应特征图上的一个像素。分别以每个anchor为中心,共使用3种规模,即128个像素点、256个像素点、512个像素点,3种比例,即1:2,1:1,2:1,生成9个anchor box。
通过softmax分类器提取出positive anchors,再计算出anchors的边框回归偏移量,以获得精确的区域。对于窗口一般使用四维变量表示,分别表示窗口的中心点坐标、宽和高,使用A表示提取得到的positive anchors,G表示真实的目标窗口,G'表示经过调整后与G更接近的回归窗口。首先需要通过线性回归获得,其中X为输入的特征向量,W为需要学习的参数,具体的计算公式如下:
经过上述计算获得修正位置后的positive anchors后,还需限定超出图像边界的positive anchors为图像边界,并剔除尺寸非常小的positive anchors,再对剩余的positive anchors进行非极大值抑制;
A3:再进行兴趣区域池化,由于proposal boxes对应的是M×N尺度的,故将其映射回的特征图尺度,再将区域投影到特征图上,将映射后的区域划分为相同大小的sections,再对每个sections进行最大池化操作,以获得固定大小的区域特征图;
对WordNet数据集进行预处理,WordNet是一个描述英文词汇之间关联特点的数据集,同时也是一个数据库,该数据库将英语名词、动词、形容词和副词与同义词联系起来,这些同义词通过语义关系相互联系,从而确定单词的定义,具体的是:将数据集中的重复词进行删除,例如 “apple apple” 和 “dog dog”;将数据集中的同义词进行合并,例如“surfboard” 和 “surf board”,具体而言,即选择数据集中出现较多的词汇并替换其他具有相同意义的词汇。
将数据集中的实体,关系映射到低维连续的向量空间中,具体子流程如下所示:
B1:确定实体列表E、关系列表L、三元组列表S、向量维度k、学习率lr、正负样本三元组之间的间隔修正、范数norm和损失值loss。在本实施例中,k为50,lr为0.01,为1.0,范数为2;将实体列表和关系列表以随机采样的方式进行初始化,采样范围为,即约为,再进行L2范数归一化,具体计算如下所示:;
B2:将数据集分成100个batch,每个样本的数量为batch_size,epochs为1,对batch中的每一个样本,随机替换头实体或者尾实体生成负样本三元组,而后将正样本和负样本放入列表中,其中生成负样本三元组时不能同时替换头实体和尾实体;计算出每一个batch的损失值,具体计算如下所示:
D:将视觉特征向量映射到知识嵌入空间,具体子流程如下所示:
D2:设置两组实体三元组集,其中:
D3:根据正负样本进行训练,计算三元组损失,为了确保相应的实体之间的距离在投影过程中逐渐减小,采用一个修改过的三元组损失函数,从而让两种模式中相互匹配的实体以固定的幅度比不匹配的实体更加接近,三元组损失的具体计算如下所示:
本发明通过先提取输入图像的特征及对应区域位置,再对区域内实体进行分类,再将知识图谱中的关系 以低维向量的方式表示出来,并且使得三元组内元素满足一定的关系,再将视觉特征空间映射到知识嵌入空间,通过引入先验知识来弥补数据稀疏与不足带来的不利影响,从而提高视觉关系检测算法的表现。
当然,在不背离本发明精神及其实质的情况下,熟悉本领域的技术人员应该可以根据本发明作出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。
Claims (5)
1.基于知识表示增强的图像目标关系识别算法,其特征在于:包括以下步骤:
A视觉特征采集:提取待检测图像的视觉特征;
B知识图谱建立:
将知识图谱中的关系以低维向量的方式表示出来,并满足平移关系;
知识图谱包括用于获取对象和关系之间的结构化信息的先验知识;
C特征映射:将步骤A中获取的视觉特征映射至步骤B中的嵌入向量空间,进而进行目标关系的计算。
2.根据权利要求1所述的基于知识表示增强的图像目标关系识别算法,其特征在于:所述步骤A具体的是:
A1:特征图:在不改变输入图像大小的前提下,使用一组卷积层、非线性激活层和池化层提取图像的特征图;
A2:候选区域:将A1中的特征图用于区域候选网络生成提高精度的候选区域;
A3:区域特征图:将特征图和候选区域综合后,提取区域特征图;
A4:目标类别判定:利用获取的区域特征图计算区域的类别,其中类别包括目标及背景,并利用边框回归获得对象的位置,以获得对象的视觉特征向量。
3.根据权利要求2所述的基于知识表示增强的图像目标关系识别算法,其特征在于:所述步骤B具体的是:
B1:将训练集中的三元组、实体集、关系集、边际和向量维度超参数输入至图谱嵌入模型,并对输入数据进行初始化;
B2:从训练集合中随机选出正面样本,再基于正面样本获得负面样本,共同构成批训练数据集;
B3:通过训练使表示向量满足平移关系。
4.根据权利要求3所述的基于知识表示增强的图像目标关系识别算法,其特征在于:所述步骤C的先验知识还包括将视觉特征和先验知识结合以提高视觉关系检测的损失函数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310113097.6A CN115861715B (zh) | 2023-02-15 | 2023-02-15 | 基于知识表示增强的图像目标关系识别算法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310113097.6A CN115861715B (zh) | 2023-02-15 | 2023-02-15 | 基于知识表示增强的图像目标关系识别算法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115861715A true CN115861715A (zh) | 2023-03-28 |
CN115861715B CN115861715B (zh) | 2023-05-09 |
Family
ID=85658073
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310113097.6A Active CN115861715B (zh) | 2023-02-15 | 2023-02-15 | 基于知识表示增强的图像目标关系识别算法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115861715B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116229377A (zh) * | 2023-05-06 | 2023-06-06 | 成都三合力通科技有限公司 | 一种人员管控报警系统及方法 |
CN116383797A (zh) * | 2023-05-31 | 2023-07-04 | 北京顶象技术有限公司 | 一种无缺口滑动验证码及其生成方法 |
Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107885760A (zh) * | 2016-12-21 | 2018-04-06 | 桂林电子科技大学 | 一种基于多种语义的知识图谱表示学习方法 |
CN108171213A (zh) * | 2018-01-22 | 2018-06-15 | 北京邮电大学 | 一种适用图文知识图谱的关系抽取方法 |
CN108256065A (zh) * | 2018-01-16 | 2018-07-06 | 智言科技(深圳)有限公司 | 基于关系检测和强化学习的知识图谱推理方法 |
CN108694469A (zh) * | 2018-06-08 | 2018-10-23 | 哈尔滨工程大学 | 一种基于知识图谱的关系预测方法 |
CN110188775A (zh) * | 2019-05-28 | 2019-08-30 | 创意信息技术股份有限公司 | 一种基于联合神经网络模型的图像内容描述自动生成方法 |
CN110781683A (zh) * | 2019-11-04 | 2020-02-11 | 河海大学 | 一种实体关系联合抽取方法 |
US20200184278A1 (en) * | 2014-03-18 | 2020-06-11 | Z Advanced Computing, Inc. | System and Method for Extremely Efficient Image and Pattern Recognition and Artificial Intelligence Platform |
US20200242140A1 (en) * | 2019-01-30 | 2020-07-30 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Method, apparatus, device and medium for determining text relevance |
WO2021073266A1 (zh) * | 2019-10-18 | 2021-04-22 | 平安科技(深圳)有限公司 | 基于图像检测的试题检查方法及相关设备 |
US20210192372A1 (en) * | 2019-12-19 | 2021-06-24 | Electronics And Telecommunications Research Institute | Multi-layered knowledge base system and processing method thereof |
WO2021237731A1 (zh) * | 2020-05-29 | 2021-12-02 | 西门子股份公司 | 一种目标检测方法、装置和计算机可读介质 |
WO2022033072A1 (zh) * | 2020-08-12 | 2022-02-17 | 哈尔滨工业大学 | 一种面向知识图谱表示学习训练的局部训练方法 |
CN114580638A (zh) * | 2022-02-14 | 2022-06-03 | 中国人民解放军战略支援部队信息工程大学 | 基于文本图增强的知识图谱表示学习方法及系统 |
CN114610897A (zh) * | 2022-02-25 | 2022-06-10 | 北京工业大学 | 基于图注意力机制的医学知识图谱关系预测方法 |
CN115099409A (zh) * | 2022-06-22 | 2022-09-23 | 南京航空航天大学 | 一种文本-图像增强的多模态知识图谱嵌入方法 |
CN115186819A (zh) * | 2022-06-22 | 2022-10-14 | 电子科技大学 | 一种结合子图结构和关系类型的知识图谱补全方法 |
-
2023
- 2023-02-15 CN CN202310113097.6A patent/CN115861715B/zh active Active
Patent Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200184278A1 (en) * | 2014-03-18 | 2020-06-11 | Z Advanced Computing, Inc. | System and Method for Extremely Efficient Image and Pattern Recognition and Artificial Intelligence Platform |
CN107885760A (zh) * | 2016-12-21 | 2018-04-06 | 桂林电子科技大学 | 一种基于多种语义的知识图谱表示学习方法 |
CN108256065A (zh) * | 2018-01-16 | 2018-07-06 | 智言科技(深圳)有限公司 | 基于关系检测和强化学习的知识图谱推理方法 |
CN108171213A (zh) * | 2018-01-22 | 2018-06-15 | 北京邮电大学 | 一种适用图文知识图谱的关系抽取方法 |
CN108694469A (zh) * | 2018-06-08 | 2018-10-23 | 哈尔滨工程大学 | 一种基于知识图谱的关系预测方法 |
US20200242140A1 (en) * | 2019-01-30 | 2020-07-30 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Method, apparatus, device and medium for determining text relevance |
CN110188775A (zh) * | 2019-05-28 | 2019-08-30 | 创意信息技术股份有限公司 | 一种基于联合神经网络模型的图像内容描述自动生成方法 |
WO2021073266A1 (zh) * | 2019-10-18 | 2021-04-22 | 平安科技(深圳)有限公司 | 基于图像检测的试题检查方法及相关设备 |
CN110781683A (zh) * | 2019-11-04 | 2020-02-11 | 河海大学 | 一种实体关系联合抽取方法 |
US20210192372A1 (en) * | 2019-12-19 | 2021-06-24 | Electronics And Telecommunications Research Institute | Multi-layered knowledge base system and processing method thereof |
WO2021237731A1 (zh) * | 2020-05-29 | 2021-12-02 | 西门子股份公司 | 一种目标检测方法、装置和计算机可读介质 |
WO2022033072A1 (zh) * | 2020-08-12 | 2022-02-17 | 哈尔滨工业大学 | 一种面向知识图谱表示学习训练的局部训练方法 |
CN114580638A (zh) * | 2022-02-14 | 2022-06-03 | 中国人民解放军战略支援部队信息工程大学 | 基于文本图增强的知识图谱表示学习方法及系统 |
CN114610897A (zh) * | 2022-02-25 | 2022-06-10 | 北京工业大学 | 基于图注意力机制的医学知识图谱关系预测方法 |
CN115099409A (zh) * | 2022-06-22 | 2022-09-23 | 南京航空航天大学 | 一种文本-图像增强的多模态知识图谱嵌入方法 |
CN115186819A (zh) * | 2022-06-22 | 2022-10-14 | 电子科技大学 | 一种结合子图结构和关系类型的知识图谱补全方法 |
Non-Patent Citations (4)
Title |
---|
HANG XU 等: "Reasoning-RCNN: Unifying Adaptive Global Reasoning" * |
YANKAI LIN 等: "Learning Entity and Relation Embeddings for Knowledge Graph Completion" * |
徐增林 等: "知识图谱技术综述" * |
黄梓航 等: "一种结合地理知识的遥感影像目标实体关联方法" * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116229377A (zh) * | 2023-05-06 | 2023-06-06 | 成都三合力通科技有限公司 | 一种人员管控报警系统及方法 |
CN116229377B (zh) * | 2023-05-06 | 2023-08-04 | 成都三合力通科技有限公司 | 一种人员管控报警系统及方法 |
CN116383797A (zh) * | 2023-05-31 | 2023-07-04 | 北京顶象技术有限公司 | 一种无缺口滑动验证码及其生成方法 |
CN116383797B (zh) * | 2023-05-31 | 2023-08-22 | 北京顶象技术有限公司 | 一种无缺口滑动验证码及其生成方法 |
Also Published As
Publication number | Publication date |
---|---|
CN115861715B (zh) | 2023-05-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115861715A (zh) | 基于知识表示增强的图像目标关系识别算法 | |
CN111160407B (zh) | 一种深度学习目标检测方法及系统 | |
CN110543906B (zh) | 基于Mask R-CNN模型的肤质自动识别方法 | |
Medina-Carnicer et al. | Unimodal thresholding for edge detection | |
Wang et al. | GKFC-CNN: Modified Gaussian kernel fuzzy C-means and convolutional neural network for apple segmentation and recognition | |
JP6892606B2 (ja) | 位置特定装置、位置特定方法及びコンピュータプログラム | |
Alshikho et al. | Artificial Intelligence and Neutrosophic Machine learning in the Diagnosis and Detection of COVID 19 | |
CN115335872A (zh) | 目标检测网络的训练方法、目标检测方法及装置 | |
US9081800B2 (en) | Object detection via visual search | |
US11367206B2 (en) | Edge-guided ranking loss for monocular depth prediction | |
Yang et al. | A sea-sky-line detection method based on Gaussian mixture models and image texture features | |
CN109033321A (zh) | 一种图像与自然语言特征提取及基于关键词的语言指示图像分割方法 | |
Li et al. | Self-supervised coarse-to-fine monocular depth estimation using a lightweight attention module | |
KR101093107B1 (ko) | 영상정보 분류방법 및 장치 | |
CN116704208B (zh) | 基于特征关系的局部可解释方法 | |
CN112465050B (zh) | 一种图像模板选择方法、装置、设备及存储介质 | |
CN107729863B (zh) | 人体指静脉识别方法 | |
CN108694398B (zh) | 一种图像分析方法及装置 | |
Shinde et al. | Feedforward back propagation neural network (FFBPNN) based approach for the identification of handwritten math equations | |
CN108154107B (zh) | 一种确定遥感图像归属的场景类别的方法 | |
Paharia et al. | Optimization of convolutional neural network hyperparameters using improved competitive gray wolf optimizer for recognition of static signs of Indian Sign Language | |
CN114663760A (zh) | 模型训练的方法、目标检测方法、存储介质及计算设备 | |
CN109993178B (zh) | 一种特征数据生成和特征匹配方法及装置 | |
Chaugule et al. | A new method using feature extraction for identifying paddy rice species for quality seed selection | |
CN110599456A (zh) | 一种医学图像的特定区域的提取方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |