WO2022061496A1 - 对象边界提取方法、装置、可移动平台及存储介质 - Google Patents
对象边界提取方法、装置、可移动平台及存储介质 Download PDFInfo
- Publication number
- WO2022061496A1 WO2022061496A1 PCT/CN2020/116759 CN2020116759W WO2022061496A1 WO 2022061496 A1 WO2022061496 A1 WO 2022061496A1 CN 2020116759 W CN2020116759 W CN 2020116759W WO 2022061496 A1 WO2022061496 A1 WO 2022061496A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- pixel
- target image
- feature information
- center
- embedding vector
- Prior art date
Links
- 238000000605 extraction Methods 0.000 title claims abstract description 82
- 238000003860 storage Methods 0.000 title claims abstract description 15
- 238000003062 neural network model Methods 0.000 claims description 31
- 238000003384 imaging method Methods 0.000 claims description 26
- 238000007781 pre-processing Methods 0.000 claims description 21
- 230000011218 segmentation Effects 0.000 claims description 18
- 238000000034 method Methods 0.000 claims description 16
- 238000005070 sampling Methods 0.000 claims description 16
- 238000004422 calculation algorithm Methods 0.000 claims description 6
- 230000000875 corresponding Effects 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 4
- 230000001537 neural Effects 0.000 claims 1
- 238000004519 manufacturing process Methods 0.000 description 10
- 239000000575 pesticide Substances 0.000 description 10
- 238000003973 irrigation Methods 0.000 description 7
- 230000002262 irrigation Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 239000000284 extract Substances 0.000 description 6
- 238000005507 spraying Methods 0.000 description 6
- 238000011176 pooling Methods 0.000 description 5
- 238000009331 sowing Methods 0.000 description 5
- 230000002596 correlated Effects 0.000 description 2
- 235000019800 disodium phosphate Nutrition 0.000 description 2
- 230000004720 fertilization Effects 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 238000009333 weeding Methods 0.000 description 2
- CWRVKFFCRWGWCS-UHFFFAOYSA-N Pentrazole Chemical compound C1CCCCC2=NN=NN21 CWRVKFFCRWGWCS-UHFFFAOYSA-N 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000003912 environmental pollution Methods 0.000 description 1
- 230000003628 erosive Effects 0.000 description 1
- 238000009313 farming Methods 0.000 description 1
- 239000003337 fertilizer Substances 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- 238000003702 image correction Methods 0.000 description 1
- 238000003707 image sharpening Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000010899 nucleation Methods 0.000 description 1
- 230000003287 optical Effects 0.000 description 1
- 241000894007 species Species 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/13—Edge detection
Abstract
一种对象边界提取方法、装置、可移动平台及存储介质,方法包括:获取目标图像;目标图像中包括有多个对象;根据目标图像确定对象中心特征信息以及目标图像中各像素的嵌入向量,其中,对象中心特征信息用于指示目标图像中属于对象中心区域的像素,嵌入向量用于指示像素在嵌入空间中的表征,根据各像素的嵌入向量以及对象中心特征信息,提取多个对象中至少一个对象的边界信息。
Description
本申请涉及图像处理技术领域,具体而言,涉及一种对象边界提取方法、装置、可移动平台及存储介质。
随着技术的发展,对象识别已成为各行各业进行相关业务所必不可少的手段,比如在农业生产场景下,农田地块识别是进行精准农业的基础,可以为后续的精准施肥、除草、播种或者灌溉等植保任务提供空间约束。又比如在机械自动化制造场景下,比如以流水线方式生产产品,产品识别是进行精准生产的基础,可以实现对产品规格进行合格化监测或者实现对产品的有效统计。
其中,对象边界提取是对象识别的重要内容,通过对象边界提取以区别出不同的对象,比如在农业生产场景下,通过农田地块边界提取以区别出不同的农田地块,以实现精准农业;又比如在机械自动化制造场景下,比如以流水线方式生产产品,通过产品边界提取以区分出不同的产品,实现精准生产。
相关技术中一种对象边界提取方法是在包括有对象的图像上,由用户进行对象标注以提取对象边界,这种方法人力成本高且效率低下。相关技术中另一种对象边界提取方法是基于语义分割的方法,识别出图像中属于对象的区域,再通过连通域算法区分出各个对象,但在至少两个对象距离相近的情况下,这种方法容易把距离相近的至少两个对象混为一体,无法准确区分,对象边界提取准确度低。
发明内容
有鉴于此,本申请的目的之一是提供一种对象边界提取方法、装置、可移动平台及存储介质。
第一方面,本申请实施例提供了一种对象边界提取方法,包括:
获取目标图像;所述目标图像中包括有多个对象;
根据所述目标图像确定对象中心特征信息以及所述目标图像中各像素的嵌入向量; 其中,所述对象中心特征信息用于指示所述目标图像中属于对象中心区域的像素;所述嵌入向量用于指示像素在嵌入空间中的表征;
根据所述各像素的嵌入向量以及所述对象中心特征信息,提取所述多个对象中至少一个对象的边界信息。
第二方面,本申请实施例提供了一种对象边界提取装置,包括处理器以及用于存储可执行指令的存储器;
当所述处理器执行所述可执行指令时,被配置为:
获取目标图像;所述目标图像中包括有多个对象;
根据所述目标图像确定对象中心特征信息以及所述目标图像中各像素的嵌入向量;其中,所述对象中心特征信息用于指示所述目标图像中属于对象中心区域的像素;所述嵌入向量用于指示所述像素在嵌入空间中的表征;
根据所述各像素的嵌入向量以及所述对象中心特征信息,提取所述多个对象中至少一个对象的边界信息。
第三方面,本申请实施例提供了一种可移动平台,包括第二方面所述的处理对象边界提取装置。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现第一方面所述的方法。
本申请实施例所提供的一种对象边界提取方法、装置、可移动平台及存储介质,根据包括有多个对象的目标对象确定对象中心特征信息以及所述目标图像中各像素的嵌入向量,然后根据所述各像素的嵌入向量以及所述对象中心特征信息进行对象实例分割,提取所述多个对象中至少一个对象的边界信息。本实施例所述对象中心特征信息用于指示所述目标图像中属于对象中心区域的像素,考虑到即使任意两个对象之间距离相近,但是距离相近的两个对象的对象中心区域还是具有一定的距离,因此基于所述对象中心特征信息可以将各个对象甚至是距离相近或者相邻的对象区别出来,保证对象实例分割的准确性,进一步地,所述嵌入向量指示所述像素在嵌入空间中的表征,所述嵌入向量可用于确定像素之间的相似度,在基于所述对象中心特征信息区分出各个对象中心后,进而可以基于所述嵌入向量以及各个对象中心进行聚类,实现对象划分,从而实现对象边界自动且准确地提取,从而获取更为准确的对象边界信息。
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种对象边界提取方法的流程示意图;
图2A、图3A以及图4A是本申请实施例提供的不同农田示意图;
图2B以及图3B是本申请实施例提供的农田地块划分示意图;
图3C以及图4B是本申请实施例提供的农田地块边界提取的示意图;
图5是本申请实施例提供的神经网络模型的结构示意图;
图6是本申请实施例提供的属于对象的像素分布示意图;
图7是本申请实施例提供的一种对象边界提取装置的结构示意图。
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
相关技术中一种对象边界提取方法是在包括有对象的图像上,由用户进行对象标注以提取对象边界,这种方法人力成本高且效率低下。相关技术中另一种对象边界提取方法是基于语义分割的方法,识别出图像中属于对象的区域,再通过连通域算法区分出各个对象,但在至少两个对象距离相近的情况下,这种方法容易把距离相近的至少两个对象混为一体,无法准确区分,对象边界提取准确度低。
基于此,本申请实施例提供了一种对象边界提取方法、装置、可移动平台及存储介质,根据包括有多个对象的目标对象确定对象中心特征信息以及所述目标图像中各像素的嵌入向量,然后根据所述各像素的嵌入向量以及所述对象中心特征信息进行对象实例分割,提取所述多个对象中至少一个对象的边界信息。本实施例所述对象中心特征信息用于指示所述目标图像中属于对象中心区域的像素,考虑到即使任意两个对象之间距离相近,但是距离相近的两个对象的对象中心区域还是具有一定的距离,因 此基于所述对象中心特征信息可以将各个对象甚至是距离相近或者相邻的对象区别出来,保证对象实例分割的准确性,进一步地,所述嵌入向量指示所述像素在嵌入空间中的表征,所述嵌入向量可用于确定像素之间的相似度,在基于所述对象中心特征信息区分出各个对象中心后,进而可以基于所述嵌入向量以及各个对象中心进行聚类,实现对象划分,从而实现对象边界自动且准确地提取,从而获取更为准确的对象边界信息。
本实施例的对象边界提取方法可应用于任何需要提取对象边界的场景中。例如可以应用于农业场景中,对农田地块进行边界提取,以便对各个农田地块分别进行管理,为后续的精准施肥、除草、播种或者灌溉该等植保任务提供空间约束,从而实现节省肥料、农药,提高亩产的有益效果,有效降低劳动强度,减少环境污染,降低生产成本,提高资源利用率及农产品产量与品质;又例如可以应用于机械自动化制造场景中,对流水线产品进行边界提取以区别不同的产品,实现对产品规格进行合格化监测或者实现对产品的有效统计。
本实施例的对象边界提取方法可以由对象边界提取装置来执行,所述对象边界提取装置可以是具有数据处理能力的电子设备,如电脑、服务器、云端服务器或者终端设备、可移动平台(例如云台、无人飞行器、无人驾驶车辆、无人驾驶船只或者移动机器人等)等;也可以是具有数据处理能力的计算机芯片或者集成电路,例如中央处理单元(Central Processing Unit,CPU)、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)或者现成可编程门阵列(Field-Programmable Gate Array,FPGA)等。
在一示例性的实施例中,当所述对象边界提取装置为具有数据处理能力的计算机芯片或者集成电路时,所述对象边界提取装置也可以安装于电子设备上,例如所述对象边界提取装置安装于可移动平台上,所述可移动平台包括但不限于无人飞行器、无人驾驶车辆、移动机器人、无人驾驶船只或者云台等。
在一示例性的实施例中,在农田场景下,所述对象边界提取装置为无人飞行器或者所述对象边界提取装置安装于所述无人飞行器上,所述对象为农田地块,在基于本申请实施例的对象提取方法提取农田地块的边界信息之后,所述无人飞行器在针对于其中一个农田地块进行植保任务(比如喷洒农药、灌溉等)时,可以基于提取的农田地块的边界信息规划所述无人飞行器在该农田地块上的飞行路线,从而基于所述飞行路线准确执行植保任务。
在一示例性的实施例中,所述对象边界提取装置为终端设备,可移动平台比如无 人飞行器利用其搭载的成像装置对包括有至少一个对象的目标区域进行采集(比如对农田区域进行采集)之后,将采集的图像传输给所述终端设备,以便所述终端设备基于采集的图像进行对象边界提取。
请参阅图1,为本申请实施例提供的一种对象边界提取方法的流程示意图,所述方法可以应用于对象边界提取装置上,所述方法包括:
在步骤S101中,获取目标图像;所述目标图像中包括有多个对象。
在步骤S102中,根据所述目标图像确定对象中心特征信息以及所述目标图像中各像素的嵌入向量;其中,所述对象中心特征信息用于指示所述目标图像中属于对象中心区域的像素;所述嵌入向量用于指示像素在嵌入空间中的表征。
在步骤S103中,根据所述各像素的嵌入向量以及所述对象中心特征信息,提取所述多个对象中至少一个对象的边界信息。
在一实施例中,为了方便对象边界的提取,所述目标图像可以是针对于所述多个对象的俯视图,考虑到俯视图可以体现出对象的整体轮廓信息,在方便提取对象边界的同时也有利于提高对象边界提取的准确性。
例如请参阅图2A、图3A以及图4A,在农业场景下,所述对象可以是农田地块,所述目标图像可以是农田俯视图,该农田俯视图可以是搭载有成像装置的无人飞行器飞行至农田区域上方之后,所述成像装置朝向农田区域采集得到。其中,所述成像装置包括但不限于相机、红外热像仪等,所述成像装置可以捕捉彩色图像、灰度图像、红外图像等。
可以理解的是,所述目标图像也可以是针对于所述多个对象的其他视觉方向的图像,例如侧视图、正视图等,可根据实际应用场景进行具体设置。
在一种实现方式中,假如要求所述目标图像为俯视图,如果所述成像装置采集到的图像不是俯视图时,或者所述成像装置不是朝指定方位采集图像,所述指定方位为采集俯视图的方位,可以根据所述成像装置采集所述图像时的位置信息,将所述图像校正处理为俯视图,然后将校正处理后的俯视图作为所述目标图像,本实施例考虑到俯视图可以体现出对象的整体轮廓信息,实现在方便提取对象边界的同时也有利于提高对象边界提取的准确性。
在一实施例中,为了进一步提高对象边界提取效率,所述目标对象可以是由多张原始图像拼接得到,每张原始图像包括有所述多个对象中的至少一个,从而实现可以一次性提取多个对象的边界信息,有利于提高对象边界提取效率。
其中,为了方便对象边界的提取,所述原始图像可以是针对于至少一个对象的俯 视图,俯视图可以体现出对象的整体轮廓信息,在方便提取对象边界的同时也有利于提高对象边界提取的准确性。当然,所述原始图像也可以是针对于至少一个对象的其他视觉方向的图像,例如侧视图等,可根据实际应用场景进行具体设置。
其中,多张所述原始图像可以由可移动平台利用自身搭载的成像装置采集得到。所述可移动平台包括但不限于无人飞行器、无人驾驶车辆或者移动机器人等。
在一种实现方式中,假如要求所述原始图像为俯视图,如果所述成像装置采集到的原始图像不是俯视图时,或者说所述成像装置不是朝指定方位采集原始图像,所述指定方位为采集俯视图的方位,可以根据所述成像装置采集所述原始图像时的位置信息将所述原始图像校正处理为俯视图,然后将多张俯视图拼接得到所述原始图像,本实施例考虑到俯视图可以体现出对象的整体轮廓信息,在方便提取对象边界的同时也有利于提高对象边界提取的准确性。
在一个示例性的实施例中,请参阅图2A、图3A以及图4A,在农业场景下,所述对象可以是农田地块,所述原始图像以及所述目标图像均可以是农田俯视图,在方便提取对象边界的同时也有利于提高对象边界提取的准确性;所述原始图像可以是搭载有成像装置的无人飞行器飞行至农田区域上方之后,所述成像装置朝向农田区域采集得到。在一个实现方式中,在无人飞行器飞行至农田区域上空以后,安装于无人飞行器机身下方的成像装置朝下方采集原始图像。在另一个实现方式中,所述成像装置通过云台安装于所述无人飞行器上,在无人飞行器飞行至农田区域上空以后,安装于无人飞行器机身侧面的成像装置随着云台的转动朝下方采集原始图像。接着,如果由所述无人飞行器执行所述对象边界提取方法,所述无人飞行器可以根据多个所述原始图像拼接得到目标图像,根据所述目标图像进行边界提取;如果由终端设备执行所述对象边界提取方法,所述无人飞行器可以将多个所述原始图像发送给所述终端设备,或者将拼接得到的目标图像发送给所述终端设备,由所述终端设备根据多张所述原始图像拼接成目标图像,或者直接获取所述目标图像进行所述对象边界提取方法。
在一些实施例中,考虑到图像的采集高度不同,图像中指示各个对象的像素数量也有所不同,采集高度越高,图像中指示各个对象的像素数量就越少,则获得的每个对象的信息越少,从而无法对各个对象进行准确的划分,降低了对象边界提取的准确性;相应的,采集高度越低,图像中指示各个对象的像素数量也越多,虽然可以保证对象边界提取的准确性,但是像素数量越多也会耗费更多的计算资源,增加计算负担,而且图像中所包括的对象的数量也会有所降低,从而降低对象边界提取效率。因此,需要保证合适的采集高度,使得图像中指示各个对象的像素数量保持在合适的范围, 既保证对象边界提取的准确性也保证计算资源的合理利用。基于此,本实施例中,用于进行对象边界提取的目标图像需要是经过预处理后的图像,其中,预处理的方式根据所述目标图像指示的采集高度所确定,所述预处理的方式包括上采样处理或者下采样处理。本实施例通过上采样处理或者下采样处理使得所述目标图像中指示各个对象的像素数量保持在合适的范围内,既保证对象边界提取的准确性也保证计算资源的合理利用,进一步有利于提高对象边界提取效率。
其中,当所述目标图像由多张原始图像拼接得到时,所述目标图像指示的采集高度可以是所述原始图像被采集时的高度。在一个例子中,所述高度可以由可移动平台例如无人飞行器利用自身搭载的距离传感器测量得到。
在一种实现方式中,可以基于实际应用场景的需要设置一个高度阈值,如果所述目标图像指示的采集高度大于高度阈值,所述预处理方式为上采样处理,其中,上采样倍数可根据所述采集高度与所述高度阈值的差值所确定,所述差值与上采样倍数成正相关关系,差值越大,上采样倍数越大,差值越小,上采样倍数越小;反之,如果所述目标图像指示的采集高度小于高度阈值,所述预处理方式为下采样处理,其中,下采样倍数可根据所述采集高度与所述高度阈值的差值所确定,所述差值与下采样倍数成正相关关系,差值越大,下采样倍数越大,差值越小,下采样倍数越小。本实施例实现通过上采样处理或者下采样处理使得所述目标图像中指示各个对象的像素数量保持在合适的范围内,既保证对象边界提取的准确性也保证计算资源的合理利用,进一步有利于提高对象边界提取效率。
在另一种实现方式中,可以预先存储有高度对应关系所确定;所述高度对应关系指示不同的采集高度所对应的预处理方式,所述预处理的方式包括上采样处理或者下采样处理,则所述目标图像所经过的预处理的方式可以根据所述目标图像指示的采集高度以及预存的高度对应关系所确定,即可以根据所述目标图像指示的采集高度从预存的高度对应关系中查找相应的预处理的方式。本实施例实现通过上采样处理或者下采样处理使得所述目标图像中指示各个对象的像素数量保持在合适的范围内,既保证对象边界提取的准确性也保证计算资源的合理利用,进一步有利于提高对象边界提取效率。
可以理解的是,为了进一步提高对象边界提取的准确性,所述目标图像还可以经过除上采样处理或下采样处理之外的其他预处理方式,诸如图像增强处理、对比度拉伸处理或者图像锐化处理等。
在一些实施例中,在获取所述目标图像之后,所述对象边界提取装置可以根据所 述目标图像确定对象中心特征信息、所述目标图像中各像素的嵌入向量以及对象特征信息,所述对象中心特征信息用于指示所述目标图像中属于对象中心区域的像素;所述嵌入向量用于指示像素在嵌入空间中的表征;所述对象特征信息用于指示所述目标图像中属于对象的像素;然后所述对象边界提取装置根据所述各像素的嵌入向量、对象中心特征信息以及所述对象特征信息进行对象划分,并提取所述多个对象中至少一个对象的边界信息。本实施例中,考虑到即使任意两个对象之间距离相近,但是距离相近的两个对象的对象中心区域还是具有一定的距离,因此基于所述对象中心特征信息可以将各个对象甚至是距离相近或者相邻的对象区别出来,即是说,所述对象中心特征信息可以用于确定所述目标对象中的对象的数量,保证对象实例分割的准确性,进一步地,可以用所述嵌入向量来确定像素之间的相似度,从而可以基于所述对象中心特征信息以及所述嵌入向量将所述对象特征信息所指示的属于对象的像素进行分类,实现对象边界自动且准确地提取,从而获取更为准确的对象边界信息。
进一步地,所述对象边界提取装置可以在离线情况下提取对象的边界信息,也可以实时在线提取对象的边界信息,满足用户的个性化需求。
在一种实现方式中,可以预先训练好一个神经网络模型,所述神经网络模型用于获取对象中心特征信息、对象特征信息以及所述嵌入向量。在训练所述神经网络模型时,首先获取若干个训练图像,所述训练图像携带有对象标签、对象中心标签以及嵌入向量标签;所述对象标签用于指示所述训练图像中的各像素是否属于对象,所述对象中心标签用于指示所述训练图像中的各像素是否属于对象中心区域,所述嵌入向量标签表征将所述训练图像中的各像素映射到嵌入空间后的结果;然后利用有监督方式或者半监督方式,根据所述若干个训练图像以及所述训练图像携带的对象标签、对象中心标签以及嵌入向量标签进行多任务学习,获得所述神经网络模型。所述神经网络模型用于同时进行三个任务,第一个任务用于对输入图像进行第一语义分割处理,获取对象特征信息;第二个任务用于对输入图像进行第二语义分割处理,获取对象中心特征信息;第三个任务用于将输入图像中的像素映射到嵌入控件,获得嵌入向量。
其中,所述对象标签可以由用户对所述训练图像进行标注得到;为了降低标注成本,提高标注效率,所述对象中心标签以及所述嵌入向量标签根据所述训练图像以及所述对象标签确定。在一个例子中,可以根据所述对象标签对所述训练图像进行图像腐蚀,从而获得所述对象中心标签。在一个例子中,可以用预设维数的向量来表征所述训练图像中的像素。
在一个例子中,在进行训练时,可以将所述若干个训练图像输入预设的模型中, 所述模型包括但不限于卷积神经网络模型,获取对象中心预测结果、对象特征预测结果以及嵌入向量预测结果,然后根据所述对象中心预测结果、对象特征预测结果以及嵌入向量预测结果分别与所述对象标签、对象中心标签以及嵌入向量标签之间的差异来调整所述预设的模型的参数,得到训练好的神经网络模型。
在一些实施例中,在获取所述目标图像之后,可以将所述目标对象输入预先训练的神经网络模型中;通过所述神经网络模型对所述第一目标图像进行第一语义分割处理,获得所述对象特征信息;以及,通过所述神经网络模型对所述第一目标图像进行第二语义分割处理,获得所述对象中心特征信息;以及,通过所述神经网络模型将所述目标对象中的各像素映射到嵌入空间,获取所述嵌入向量。
在一个例子中,所述神经网络模型可以为卷积神经网络模型,请参阅图5,所述神经网络模型10包括有输入层11、卷积层12、池化层13、以及3个子网络14,所述目标图像输入所述输入层11之后,通过卷积层12进行卷积运算,通过池化层13进行池化运算,以及通过第一个子网络14输出所述对象特征信息,通过第二个子网络14输出所述对象中心特征信息,通过第三个子网络14输出所述嵌入向量。可以理解的是,本申请实施例对于所述卷积层12和池化层13数量和排列分别不做任何限制,所述子网络14包括但不限于有卷积层、池化层和/或全连接层等,可依据实际应用场景进行具体设置。
在一些实施例中,在获取所述各像素的嵌入向量、对象中心特征信息以及所述对象特征信息之后,所述对象边界提取装置首先根据所述对象中心特征信息进行对象中心区域划分,从而可以确定出所述目标图像中有几个对象中心区域,则基于所述对象中心区域的数量可以相应确定出所述目标图像中的对象的数量。在一种实现方式中,所述对象边界提取装置可以使用连通域算法对所述对象中心特征信息指示的属于对象中心区域的像素进行划分,得到各个对象中心区域。本实施例中,考虑到即使任意两个对象之间距离相近,但是距离相近的两个对象的对象中心区域还是具有一定的距离,因此基于所述对象中心特征信息可以将各个对象甚至是距离相近或者相邻的对象区别出来,即是说,所述对象中心特征信息可以准确确定所述目标对象中的对象的数量,保证对象实例分割的准确性。
接着,从所述各像素的嵌入向量中,基于所述对象特征信息确定属于对象的像素的嵌入向量,以及根据划分的各个对象中心区域确定属于各个对象中心区域的像素的嵌入向量;即是说,根据所述对象特征信息所指示的属于对象的像素,可以从所述各像素的嵌入向量中辨别出属于对象的像素的嵌入向量;在确定各个对象中心区域之后, 可以从所述各像素的嵌入向量中辨别出属于各个对象中心区域的像素的嵌入向量。
然后,根据所述属于对象的像素的嵌入向量、以及所述属于各个对象中心区域的像素的嵌入向量,确定属于各个对象中心区域的像素分别与其他属于对象的像素的相似度;其中,所述相似度可以通过所述属于对象中心区域的像素的嵌入向量与所述其他属于对象的像素的嵌入向量在嵌入空间中的距离来确定。
在一个例子中,请参阅图6,图6中每个方格表示一个像素,比如当前目标图像中属于对象的像素有{像素1,像素2,像素3,像素4,像素5,像素6,像素7,像素8,像素9,像素10},本次划分有2个对象中心区域,属于其中一个对象中心区域的像素为像素3,属于另一个对象中心区域的像素为像素8,则除属于各个对象中心区域的像素之外的其他属于对象的像素有{像素1,像素2,像素4,像素5,像素6,像素7,像素9,像素10},所述对象边界提取装置需要确定{像素1,像素2,像素4,像素5,像素6,像素7,像素9,像素10}分别与像素3、像素8的相似度,以将{像素1,像素2,像素4,像素5,像素6,像素7,像素9,像素10}以2个对象中心区域为基准进行聚类划分。
在一种实现方式中,考虑到当属于对象中心区域的像素有多个的情况下,确定所述属于各个对象中心区域的像素分别与其他属于对象的像素的相似度需要耗费过多的计算资源,则为了减轻计算负担,对于任意一个对象中心区域,可以根据属于所述对象中心区域的像素的嵌入向量确定出一个指示所述对象中心区域的嵌入向量,比如将所述对象中心区域的像素的嵌入向量的平均值作为指示所述对象中心区域的嵌入向量,然后确定根据指示各个对象中心区域的嵌入向量以及所述属于对象的像素的嵌入向量,确定各个对象中心区域的像素分别与其他属于对象的像素的相似度。本实施例中,对于任意一个对象中心区域,确定出一个指示所述对象中心区域的嵌入向量,有利于简化计算步骤,提高计算资源的综合利用率。
最后,在确定属于各个对象中心区域的像素分别与其他属于对象的像素的相似度之后,可以根据所述属于各个对象中心区域的像素分别与其他属于对象的像素的相似度进行对象划分。本实施例使用所述嵌入向量来确定像素之间的相似度,进而基于属于各个对象中心区域的像素分别与其他属于对象的像素的相似度,将所述对象特征信息所指示的属于对象的像素按照各个对象中心区域进行聚类划分,实现对象边界自动且准确地提取,从而获取更为准确的对象边界信息。
在一示例性的实施例中,在农田场景下,所述对象为农田地块,对如图2A所示的目标图像进行农田地块划分之后,可以得到如图2B所示的各个农田地块。对如图 3A所示的目标图像进行对象农田地块划分之后,可以得到如图3B所示的各个农田地块。本实施例实现对距离相近的农田地块也可以准确划分。
在一种实现方式中,所述相似度可以通过所述属于对象中心区域的像素的嵌入向量与所述其他属于对象的像素的嵌入向量在嵌入空间中的距离来确定;对于任一对象中心区域,若属于该对象中心区域的像素的嵌入向量与所述其他属于对象的像素的嵌入向量在嵌入空间中的距离小于预设阈值,确定所述其他属于对象的像素与属于该对象中心区域的像素属于同一对象;其中,所述距离包括但不限于余弦距离、欧拉距离等。本实施例实现将属于对象的像素以各个像素中心区域为基准进行聚类划分。
在一个例子中,请参阅图6,如果像素1的嵌入向量与属于像素中心区域的像素3的嵌入向量在嵌入空间中的距离小于预设阈值,确定像素1与像素属于同一对象;如果像素7的嵌入向量与属于像素中心区域的像素8的嵌入向量在嵌入空间中的距离小于预设阈值,确定像素7与像素8属于同一对象,从而将除属于各个对象中心区域的像素之外的其他属于对象的像素以2个对象中心区域为基准进行聚类划分。
在划分得到所述目标对象中的各个对象之后,所述对象边界提取装置提取所述多个对象中至少一个对象的边界信息。所述对象的边界信息包括所述目标图像中处于所述对象边界的像素的坐标信息。所述坐标信息包括二维坐标信息和/或三维坐标信息。
在一示例性的实施例中,在农田场景下,所述对象为农田地块,对如图3A所示的目标图像进行农田地块边界提取之后,可以得到如图3C中所标注出的各个农田地块的边界。对如图4A所示的目标图像进行农田地块边界提取之后,可以得到如图4B中所标注出的各个农田地块的边界。本实施例实现对距离相近的农田地块也可以准确提取农田地块的边界。
在一实施例中,在提取所述目标图像中至少一个对象的边界信息之后,可以根据所述对象的边界信息确定所述对象的面积。在一个例子中,所述对象为农田地块,可以基于农田地块的面积进行有效农业管理,比如基于农田地块的面积确定灌溉总量或者农药总量等。在另一个例子中,所述对象为流水线产品,可以基于流水线产品的面积进行规格合格化监测。
在一实施例中,所述对象为农田地块,在提取所述目标图像中至少一个对象的边界信息之后,可以根据所述目标图像中所述对象的边界信息以及所述目标图像指示的地理位置信息,生成农田地块地图。所述地理位置信息包括但不限于经纬度信息等,在一个例子中,可以基于生成的农田地块地图进行农田监测。
在一个实施例中,所述对象为农田地块,在提取所述目标图像中至少一个对象的 边界信息之后,可以根据所述对象的边界信息,规划可移动平台针对于该对象进行植保任务的移动路线;其中,所述植保任务包括但不限于播种任务、农药喷洒任务、灌溉任务等。在一个例子中,当利用无人飞行器要对其中一个农田地块进行农药喷洒任务时,可以根据该田地块的边界信息规划所述无人飞行器进行农药喷洒任务的飞行路线,以便无人飞行器可以基于规划好的飞行路线执行所述农药喷洒任务。
进一步地,还可以按照所述对象的边界信息以及针对于该对象的植保任务,生成该对象的管理信息,从而实现对该对象进行有效的管理。在一个例子中,可以根据各个农田地块的边界信息,记录每个农田地块的耕、种、管、收整个流程的信息,不同农田地块的信息可能有所不同,比如不同农田地块种植的植物种类不同,则记录的信息可以是所述农田地块的种植种类、播种时间、灌溉量以及灌溉时间、农药播撒量以及农药播撒时间等等,从而实现对各个农田地块进行智能化管理。
相应的,请参阅图7,本申请实施例还提供了一种对象边界提取装置,所述对象边界提取装置可以是具有数据处理能力的电子设备,如电脑、服务器、云端服务器或者终端设备、可移动平台(例如云台、无人飞行器、无人驾驶车辆、无人驾驶船只或者移动机器人等)等;也可以是具有数据处理能力的计算机芯片或者集成电路,例如中央处理单元(Central Processing Unit,CPU)、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)或者现成可编程门阵列(Field-Programmable Gate Array,FPGA)等。
所述对象边界提取装置20包括处理器21以及用于存储可执行指令的存储器22。当所述处理器21执行所述可执行指令时,被配置为:
获取目标图像;所述目标图像中包括有多个对象;
根据所述目标图像确定对象中心特征信息以及所述目标图像中各像素的嵌入向量;其中,所述对象中心特征信息用于指示所述目标图像中属于对象中心区域的像素;所述嵌入向量用于指示所述像素在嵌入空间中的表征;
根据所述各像素的嵌入向量以及所述对象中心特征信息,提取所述多个对象中至少一个对象的边界信息。
装置可包括,但不仅限于,处理器21、存储器22。本领域技术人员可以理解,图7仅仅是装置20的示例,并不构成对装置20的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如设备还可以包括输入输出设备、网络接入设备、总线等。
在一实施例中,所述对象包括农田地块。
在一实施例中,所述目标图像包括针对于所述多个对象的俯视图。
在一实施例中,所述目标图像由多张原始图像拼接得到,每张原始图像包括有所述多个对象中的至少一个。
在一实施例中,所述原始图像包括针对于所述至少一个对象的俯视图。
在一实施例中,多张所述原始图像由可移动平台利用自身搭载的成像装置采集得到。
在一实施例中,如果所述原始图像不是由所述成像装置朝指定方位采集得到,所述处理器21还被配置为:根据所述成像装置采集所述原始图像时的位置信息,将所述原始图像校正处理为俯视图。
在一实施例中,所述目标图像为经过预处理后的图像;其中,预处理的方式根据所述目标图像指示的采集高度所确定。
在一实施例中,所述预处理的方式包括上采样处理或者下采样处理。
在一实施例中,所述预处理的方式根据所述目标图像指示的采集高度以及预存的高度对应关系所确定;所述高度对应关系指示不同的采集高度所对应的预处理方式。
在一实施例中,所述处理器21还被配置为:
根据所述目标对象确定对象特征信息,所述对象特征信息用于指示所述目标图像中属于所述对象的像素;根据所述各像素的嵌入向量、对象中心特征信息以及所述对象特征信息进行对象划分,并提取所述多个对象中至少一个对象的边界信息。
在一实施例中,所述处理器21具体被配置为:将所述目标对象输入预先训练的神经网络模型中;通过所述神经网络模型对所述第一目标图像进行第一语义分割处理,获得所述对象特征信息;以及,通过所述神经网络模型对所述第一目标图像进行第二语义分割处理,获得所述对象中心特征信息;以及,通过所述神经网络模型将所述目标对象中的各像素映射到嵌入空间,获取所述嵌入向量。
在一实施例中,在训练神经网络模型时,所述处理器21还被配置为:获取若干个训练图像,所述训练图像携带有对象标签、对象中心标签以及嵌入向量标签;所述对象标签用于指示所述训练图像中的各像素是否属于对象,所述对象中心标签用于指示所述训练图像中的各像素是否属于对象中心区域,所述嵌入向量标签表征将所述训练图像中的各像素映射到嵌入空间后的结果;根据所述若干个训练图像以及所述训练图像携带的对象标签、对象中心标签以及嵌入向量标签进行多任务学习,获得所述神经网络模型。
在一实施例中,所述对象标签由用户对所述训练图像进行标注得到;所述对象中心标签以及所述嵌入向量标签根据所述训练图像以及所述对象标签确定。
在一实施例中,所述处理器21具体被配置为:根据所述对象中心特征信息进行对象中心区域划分;从所述各像素的嵌入向量中,基于所述对象特征信息确定属于对象的像素的嵌入向量,以及根据划分的各个对象中心区域确定属于各个对象中心区域的像素的嵌入向量;根据所述属于对象的像素的嵌入向量、以及所述属于各个对象中心区域的像素的嵌入向量,确定属于各个对象中心区域的像素分别与其他属于对象的像素的相似度;根据所述属于各个对象中心区域的像素分别与其他属于对象的像素的相似度进行对象划分。
在一实施例中,在进行对象中心区域划分时,所述处理器21被配置为:使用连通域算法对所述对象中心特征信息指示的属于所述对象中心区域的像素进行划分,得到各个对象中心区域。
在一实施例中,所述相似度通过所述属于对象中心区域的像素的嵌入向量与所述其他属于对象的像素的嵌入向量在嵌入空间中的距离来确定。
在一实施例中,在进行对象划分时,所述处理器21被配置为:对于任一对象中心区域,若属于该对象中心区域的像素的嵌入向量与所述其他属于对象的像素的嵌入向量在嵌入空间中的距离小于预设阈值,确定所述其他属于对象的像素与属于该对象中心区域的像素属于同一对象。
在一实施例中,所述对象的边界信息包括所述目标图像中处于所述对象边界的像素的坐标信息。
在一实施例中,所述处理器21还被配置为:根据所述对象的边界信息确定所述对象的面积。
在一实施例中,所述对象为农田地块,所述处理器21还被配置为:根据所述目标图像中所述对象的边界信息以及所述目标图像指示的地理位置信息,生成农田地块地图。
在一实施例中,所述对象为农田地块,所述处理器21还被配置为:根据所述对象的边界信息,规划可移动平台针对于该对象进行植保任务的移动路线。
在一实施例中,所述处理器21还被配置为:按照所述对象的边界信息以及针对于该对象的植保任务,生成该对象的管理信息。
这里描述的各种实施方式可以使用例如计算机软件、硬件或其任何组合的计算机可读介质来实施。对于硬件实施,这里描述的实施方式可以通过使用特定用途集成电 路(ASIC)、数字信号处理器(DSP)、数字信号处理装置(DSPD)、可编程逻辑装置(PLD)、现场可编程门阵列(FPGA)、处理器、控制器、微控制器、微处理器、被设计为执行这里描述的功能的电子单元中的至少一种来实施。对于软件实施,诸如过程或功能的实施方式可以与允许执行至少一种功能或操作的单独的软件模块来实施。软件代码可以由以任何适当的编程语言编写的软件应用程序(或程序)来实施,软件代码可以存储在存储器中并且由处理器执行。
上述装置中处理器和存储器的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。
相应的,本申请实施例还提供了一种可移动平台,包括上述的对象边界提取装置。
在一实施例中,所述可移动平台包括无人飞行器、无人驾驶车辆、移动机器人或者手持云台。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器,上述指令可由装置的处理器执行以完成上述方法。例如,非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
一种非临时性计算机可读存储介质,当存储介质中的指令由终端的处理器执行时,使得终端能够执行上述方法。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本申请实施例所提供的方法和装置进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (49)
- 一种对象边界提取方法,其特征在于,包括:获取目标图像;所述目标图像中包括有多个对象;根据所述目标图像确定对象中心特征信息以及所述目标图像中各像素的嵌入向量;其中,所述对象中心特征信息用于指示所述目标图像中属于对象中心区域的像素;所述嵌入向量用于指示像素在嵌入空间中的表征;根据所述各像素的嵌入向量以及所述对象中心特征信息,提取所述多个对象中至少一个对象的边界信息。
- 根据权利要求1所述的方法,其特征在于,所述对象包括农田地块。
- 根据权利要求1所述的方法,其特征在于,所述目标图像包括针对于所述多个对象的俯视图。
- 根据权利要求1所述的方法,其特征在于,所述目标图像由多张原始图像拼接得到,每张原始图像包括有所述多个对象中的至少一个。
- 根据权利要求4所述的方法,其特征在于,所述原始图像包括针对于至少一个对象的俯视图。
- 根据权利要求4所述的方法,其特征在于,多张所述原始图像由可移动平台利用自身搭载的成像装置采集得到。
- 根据权利要求6所述的方法,其特征在于,如果所述原始图像不是由所述成像装置朝指定方位采集得到,所述方法还包括:根据所述成像装置采集所述原始图像时的位置信息,将所述原始图像校正处理为俯视图。
- 根据权利要求1所述的方法,其特征在于,所述目标图像为经过预处理后的图像;其中,预处理的方式根据所述目标图像指示的采集高度所确定。
- 根据权利要求8所述的方法,其特征在于,所述预处理的方式包括上采样处理或者下采样处理。
- 根据权利要求8所述的方法,其特征在于,所述预处理的方式根据所述目标图像指示的采集高度以及预存的高度对应关系所确定;所述高度对应关系指示不同的采集高度所对应的预处理方式。
- 根据权利要求1所述的方法,其特征在于,还包括:根据所述目标对象确定对象特征信息,所述对象特征信息用于指示所述目标图像中属于对象的像素;所述根据所述各像素的嵌入向量以及所述对象中心特征信息,提取所述多个对象中至少一个对象的边界信息,包括:根据所述各像素的嵌入向量、对象中心特征信息以及所述对象特征信息进行对象划分,并提取所述多个对象中至少一个对象的边界信息。
- 根据权利要求11所述的方法,其特征在于,所述根据所述目标对象确定对象中心特征信息以及所述目标图像中各像素的嵌入向量,以及所述根据所述目标对象确定对象特征信息,包括:将所述目标对象输入预先训练的神经网络模型中;通过所述神经网络模型对所述第一目标图像进行第一语义分割处理,获得所述对象特征信息;以及,通过所述神经网络模型对所述第一目标图像进行第二语义分割处理,获得所述对象中心特征信息;以及,通过所述神经网络模型将所述目标对象中的各像素映射到嵌入空间,获取所述嵌入向量。
- 根据权利要求12所述的方法,其特征在于,在训练神经网络模型时,所述方法还包括:获取若干个训练图像,所述训练图像携带有对象标签、对象中心标签以及嵌入向量标签;所述对象标签用于指示所述训练图像中的各像素是否属于对象,所述对象中心标签用于指示所述训练图像中的各像素是否属于对象中心区域,所述嵌入向量标签表征将所述训练图像中的各像素映射到嵌入空间后的结果;根据所述若干个训练图像以及所述训练图像携带的对象标签、对象中心标签以及嵌入向量标签进行多任务学习,获得所述神经网络模型。
- 根据权利要求13所述的方法,其特征在于,所述对象标签由用户对所述训练图像进行标注得到;所述对象中心标签以及所述嵌入向量标签根据所述训练图像以及所述对象标签确定。
- 根据权利要求11所述的方法,其特征在于,所述根据所述各像素的嵌入向量、对象中心特征信息以及所述对象特征信息进行对象划分,包括:根据所述对象中心特征信息进行对象中心区域划分;从所述各像素的嵌入向量中,基于所述对象特征信息确定属于对象的像素的嵌入向量,以及根据划分的各个对象中心区域确定属于各个对象中心区域的像素的嵌入向量;根据所述属于对象的像素的嵌入向量、以及所述属于各个对象中心区域的像素的 嵌入向量,确定属于各个对象中心区域的像素分别与其他属于对象的像素的相似度;根据所述属于各个对象中心区域的像素分别与其他属于对象的像素的相似度进行对象划分。
- 根据权利要求15所述的方法,其特征在于,所述根据所述对象中心特征信息进行对象中心区域划分,包括:使用连通域算法对所述对象中心特征信息指示的属于对象中心区域的像素进行划分,得到各个对象中心区域。
- 根据权利要求15所述的方法,其特征在于,所述相似度通过所述属于对象中心区域的像素的嵌入向量与所述其他属于对象的像素的嵌入向量在嵌入空间中的距离来确定。
- 根据权利要求15所述的方法,其特征在于,所述根据属于各个对象中心区域的像素分别与其他属于对象的像素的相似度进行对象划分,包括:对于任一对象中心区域,若属于该对象中心区域的像素的嵌入向量与所述其他属于对象的像素的嵌入向量在嵌入空间中的距离小于预设阈值,确定所述其他属于对象的像素与属于该对象中心区域的像素属于同一对象。
- 根据权利要求1所述的方法,其特征在于,所述对象的边界信息包括所述目标图像中处于所述对象边界的像素的坐标信息。
- 根据权利要求1所述的方法,其特征在于,还包括:根据所述对象的边界信息确定所述对象的面积。
- 根据权利要求1所述的方法,其特征在于,所述对象为农田地块,所述方法还包括:根据所述目标图像中所述对象的边界信息以及所述目标图像指示的地理位置信息,生成农田地块地图。
- 根据权利要求1所述的方法,其特征在于,所述对象为农田地块,所述方法还包括:根据所述对象的边界信息,规划可移动平台针对于该对象进行植保任务的移动路线。
- 根据权利要求22所述的方法,其特征在于,所述方法还包括:按照所述对象的边界信息以及针对于该对象的植保任务,生成该对象的管理信息。
- 一种对象边界提取装置,其特征在于,包括处理器以及用于存储可执行指令 的存储器;当所述处理器执行所述可执行指令时,被配置为:获取目标图像;所述目标图像中包括有多个对象;根据所述目标图像确定对象中心特征信息以及所述目标图像中各像素的嵌入向量;其中,所述对象中心特征信息用于指示所述目标图像中属于对象中心区域的像素;所述嵌入向量用于指示所述像素在嵌入空间中的表征;根据所述各像素的嵌入向量以及所述对象中心特征信息,提取所述多个对象中至少一个对象的边界信息。
- 根据权利要求24所述的装置,其特征在于,所述对象包括农田地块。
- 根据权利要求24所述的装置,其特征在于,所述目标图像包括针对于所述多个对象的俯视图。
- 根据权利要求24所述的装置,其特征在于,所述目标图像由多张原始图像拼接得到,每张原始图像包括有所述多个对象中的至少一个。
- 根据权利要求27所述的装置,其特征在于,所述原始图像包括针对于所述至少一个对象的俯视图。
- 根据权利要求27所述的装置,其特征在于,多张所述原始图像由可移动平台利用自身搭载的成像装置采集得到。
- 根据权利要求29所述的装置,其特征在于,如果所述原始图像不是由所述成像装置朝指定方位采集得到,所述处理器还被配置为:根据所述成像装置采集所述原始图像时的位置信息,将所述原始图像校正处理为俯视图。
- 根据权利要求24所述的装置,其特征在于,所述目标图像为经过预处理后的图像;其中,预处理的方式根据所述目标图像指示的采集高度所确定。
- 根据权利要求31所述的装置,其特征在于,所述预处理的方式包括上采样处理或者下采样处理。
- 根据权利要求31所述的装置,其特征在于,所述预处理的方式根据所述目标图像指示的采集高度以及预存的高度对应关系所确定;所述高度对应关系指示不同的采集高度所对应的预处理方式。
- 根据权利要求24所述的装置,其特征在于,所述处理器还被配置为:根据所述目标对象确定对象特征信息,所述对象特征信息用于指示所述目标图像中属于所述对象的像素;根据所述各像素的嵌入向量、对象中心特征信息以及所述对象特征信息进行对象划分,并提取所述多个对象中至少一个对象的边界信息。
- 根据权利要求34所述的装置,其特征在于,所述处理器具体被配置为:将所述目标对象输入预先训练的神经网络模型中;通过所述神经网络模型对所述第一目标图像进行第一语义分割处理,获得所述对象特征信息;以及,通过所述神经网络模型对所述第一目标图像进行第二语义分割处理,获得所述对象中心特征信息;以及,通过所述神经网络模型将所述目标对象中的各像素映射到嵌入空间,获取所述嵌入向量。
- 根据权利要求35所述的装置,其特征在于,在训练神经网络模型时,所述处理器还被配置为:获取若干个训练图像,所述训练图像携带有对象标签、对象中心标签以及嵌入向量标签;所述对象标签用于指示所述训练图像中的各像素是否属于对象,所述对象中心标签用于指示所述训练图像中的各像素是否属于对象中心区域,所述嵌入向量标签表征将所述训练图像中的各像素映射到嵌入空间后的结果;根据所述若干个训练图像以及所述训练图像携带的对象标签、对象中心标签以及嵌入向量标签进行多任务学习,获得所述神经网络模型。
- 根据权利要求36所述的装置,其特征在于,所述对象标签由用户对所述训练图像进行标注得到;所述对象中心标签以及所述嵌入向量标签根据所述训练图像以及所述对象标签确定。
- 根据权利要求34所述的装置,其特征在于,所述处理器具体被配置为:根据所述对象中心特征信息进行对象中心区域划分;从所述各像素的嵌入向量中,基于所述对象特征信息确定属于对象的像素的嵌入向量,以及根据划分的各个对象中心区域确定属于各个对象中心区域的像素的嵌入向量;根据所述属于对象的像素的嵌入向量、以及所述属于各个对象中心区域的像素的嵌入向量,确定属于各个对象中心区域的像素分别与其他属于对象的像素的相似度;根据所述属于各个对象中心区域的像素分别与其他属于对象的像素的相似度进行对象划分。
- 根据权利要求38所述的装置,其特征在于,在进行对象中心区域划分时,所述处理器被配置为:使用连通域算法对所述对象中心特征信息指示的属于所述对象中心区域的像素进行划分,得到各个对象中心区域。
- 根据权利要求38所述的装置,其特征在于,所述相似度通过所述属于对象中心区域的像素的嵌入向量与所述其他属于对象的像素的嵌入向量在嵌入空间中的距离 来确定。
- 根据权利要求38所述的装置,其特征在于,在进行对象划分时,所述处理器被配置为:对于任一对象中心区域,若属于该对象中心区域的像素的嵌入向量与所述其他属于对象的像素的嵌入向量在嵌入空间中的距离小于预设阈值,确定所述其他属于对象的像素与属于该对象中心区域的像素属于同一对象。
- 根据权利要求24所述的装置,其特征在于,所述对象的边界信息包括所述目标图像中处于所述对象边界的像素的坐标信息。
- 根据权利要求24所述的装置,其特征在于,所述处理器还被配置为:根据所述对象的边界信息确定所述对象的面积。
- 根据权利要求24所述的装置,其特征在于,所述对象为农田地块,所述处理器还被配置为:根据所述目标图像中所述对象的边界信息以及所述目标图像指示的地理位置信息,生成农田地块地图。
- 根据权利要求24所述的装置,其特征在于,所述对象为农田地块,所述处理器还被配置为:根据所述对象的边界信息,规划可移动平台针对于该对象进行植保任务的移动路线。
- 根据权利要求24所述的装置,其特征在于,所述处理器还被配置为:按照所述对象的边界信息以及针对于该对象的植保任务,生成该对象的管理信息。
- 一种可移动平台,其特征在于,包括如权利要求24至46任意一项所述的对象边界提取装置。
- 根据权利要求47所述的可移动平台,其特征在于,所述可移动平台包括无人飞行器、无人驾驶车辆、移动机器人或者手持云台。
- 一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至23任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2020/116759 WO2022061496A1 (zh) | 2020-09-22 | 2020-09-22 | 对象边界提取方法、装置、可移动平台及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2020/116759 WO2022061496A1 (zh) | 2020-09-22 | 2020-09-22 | 对象边界提取方法、装置、可移动平台及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2022061496A1 true WO2022061496A1 (zh) | 2022-03-31 |
Family
ID=80844760
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/CN2020/116759 WO2022061496A1 (zh) | 2020-09-22 | 2020-09-22 | 对象边界提取方法、装置、可移动平台及存储介质 |
Country Status (1)
Country | Link |
---|---|
WO (1) | WO2022061496A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115601670A (zh) * | 2022-12-12 | 2023-01-13 | 合肥恒宝天择智能科技有限公司(Cn) | 基于人工智能和高分辨率遥感影像的松材线虫病监测方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015031641A1 (en) * | 2013-08-29 | 2015-03-05 | Mayo Foundation For Medical Education And Research | System and method for boundary classification and automatic polyp detection |
CN107563413A (zh) * | 2017-08-09 | 2018-01-09 | 千寻位置网络有限公司 | 无人机航拍影像农田块对象精准提取方法 |
CN108830870A (zh) * | 2018-05-21 | 2018-11-16 | 千寻位置网络有限公司 | 基于多尺度结构学习的卫星影像高精度农田边界提取方法 |
CN111028255A (zh) * | 2018-10-10 | 2020-04-17 | 千寻位置网络有限公司 | 基于先验信息与深度学习的农田区域预筛选方法及装置 |
-
2020
- 2020-09-22 WO PCT/CN2020/116759 patent/WO2022061496A1/zh unknown
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015031641A1 (en) * | 2013-08-29 | 2015-03-05 | Mayo Foundation For Medical Education And Research | System and method for boundary classification and automatic polyp detection |
CN107563413A (zh) * | 2017-08-09 | 2018-01-09 | 千寻位置网络有限公司 | 无人机航拍影像农田块对象精准提取方法 |
CN108830870A (zh) * | 2018-05-21 | 2018-11-16 | 千寻位置网络有限公司 | 基于多尺度结构学习的卫星影像高精度农田边界提取方法 |
CN111028255A (zh) * | 2018-10-10 | 2020-04-17 | 千寻位置网络有限公司 | 基于先验信息与深度学习的农田区域预筛选方法及装置 |
Non-Patent Citations (1)
Title |
---|
CHEN YIZHE , TANG XIUYING , PENG YANKUN , XU YANG , LI CUILING: "Image Segmentation Technology for Field Parcel", TRANSACTION OF THE CHINESE SOCIETY FOR AGRICULTURAL MACHINERY, vol. 41, no. S1, 5 September 2010 (2010-09-05), pages 253 - 256, XP055913984, ISSN: 1000-1298, DOI: 10.3969/j.issn.1000-1298.2010.Supp.055 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115601670A (zh) * | 2022-12-12 | 2023-01-13 | 合肥恒宝天择智能科技有限公司(Cn) | 基于人工智能和高分辨率遥感影像的松材线虫病监测方法 |
CN115601670B (zh) * | 2022-12-12 | 2023-03-24 | 合肥恒宝天择智能科技有限公司 | 基于人工智能和高分辨率遥感影像的松材线虫病监测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10614562B2 (en) | Inventory, growth, and risk prediction using image processing | |
AU2019245339B2 (en) | Visual observer of unmanned aerial vehicle for monitoring horticultural grow operations | |
CN111080693A (zh) | 一种基于YOLOv3的机器人自主分类抓取方法 | |
CN109598241B (zh) | 基于Faster R-CNN的卫星图像海上舰船识别方法 | |
CN108711172B (zh) | 基于细粒度分类的无人机识别与定位方法 | |
David et al. | Vegetation indices and textures in object-based weed detection from UAV imagery | |
CN110770791A (zh) | 一种基于点云地图的图像边界获取方法、设备及飞行器 | |
CN110689519A (zh) | 基于yolo网络的雾滴沉积图像检测系统和方法 | |
Ramachandran et al. | A review on object detection in unmanned aerial vehicle surveillance | |
US11195064B2 (en) | Cross-modal sensor data alignment | |
Hu et al. | Research on a single-tree point cloud segmentation method based on UAV tilt photography and deep learning algorithm | |
WO2020208641A1 (en) | Recurrent pattern image classification and registration | |
WO2022061496A1 (zh) | 对象边界提取方法、装置、可移动平台及存储介质 | |
WO2020103108A1 (zh) | 一种语义生成方法、设备、飞行器及存储介质 | |
WO2020103109A1 (zh) | 一种地图生成方法、设备、飞行器及存储介质 | |
CN113298042A (zh) | 遥感影像数据的处理方法及装置、存储介质、计算机设备 | |
US11120259B2 (en) | Method and system for land encroachment detection and surveillance | |
Kargah-Ostadi et al. | Automated real-time roadway asset inventory using artificial intelligence | |
Burr et al. | Estimating waterbird abundance on catfish aquaculture ponds using an unmanned aerial system | |
CN112215714A (zh) | 基于无人机的稻穗检测方法及装置 | |
CN111079617A (zh) | 家禽识别方法、装置、可读存储介质及电子设备 | |
Farooq et al. | Lightweight deep learning model for weed detection for IoT devices | |
Chaoying et al. | A cross-border detection algorithm for agricultural spraying UAV | |
Hamzah et al. | Drone Aerial Image Identification of Tropical Forest Tree Species using the Mask R-CNN | |
CN111339953B (zh) | 一种基于聚类分析的薇甘菊监测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 20954350 Country of ref document: EP Kind code of ref document: A1 |