CN111814542A - 地理对象的提取方法、装置及电子设备 - Google Patents
地理对象的提取方法、装置及电子设备 Download PDFInfo
- Publication number
- CN111814542A CN111814542A CN202010477179.5A CN202010477179A CN111814542A CN 111814542 A CN111814542 A CN 111814542A CN 202010477179 A CN202010477179 A CN 202010477179A CN 111814542 A CN111814542 A CN 111814542A
- Authority
- CN
- China
- Prior art keywords
- image
- geographic
- generator
- satellite
- processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
- G06V20/182—Network patterns, e.g. roads or rivers
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
Abstract
本公开涉及地理对象的提取方法、装置及电子设备。该方法包括:获取卫星图像;将卫星图像处理为地图图像;根据至少两种地理对象分别对应的颜色阈值,从地图图像中确定至少两种地理图像分别对应的图像区域;对图像区域进行矢量化处理,得到至少两种地理对象。该方法能够比较全面完整地提取出道路等地理对象,并且可以在一次处理过程中提取多种地理对象。
Description
技术领域
本公开涉及图像信息提取技术领域,更具体地,涉及一种地理对象的提取方法、一种地理对象的提取装置以及一种电子设备。
背景技术
随着通信技术和终端设备的发展,地图导航在日常生活中起到了越来越重要的作用。例如,外卖业务中,地图导航是骑手配送过程中的必备工具。然而,存在路网数据中缺失大量道路数据需要完善的情况,包括非机动车道、居住区内部路、适合骑行步行的小路,新修道路等。补全上述缺失的道路数据对于准确合理地进行导航具有重要意义。
现有技术中,第一种补全道路数据的方式是基于以往通行用户的轨迹数据挖掘缺失的道路。但是,用户轨迹并不能完全覆盖路网中的缺失道路,因此这种方式只能挖掘出部分缺失道路,例如30%的缺失道路。第二种补全道路数据方式是用商业卫星遥感影像数据提取道路,但是这种方式对卫星遥感影像的质量要求较高,对于低分辨率的卫星遥感影像无法适用。
此外,建筑物等其他对象对于规划导航路线也有重要的参考价值,而现有技术通常只对道路进行挖掘,无法同时提取其他对象,这会影响最终的导航效果。
因此,有必要提出一种提取道路等地理对象的新的技术方案。
公开内容
本公开的一个目的是提供一种提取道路等地理对象的新的技术方案。
根据本发明的第一方面,提供了一种地理对象的提取方法,包括:
获取卫星图像;
将所述卫星图像处理为地图图像;
根据至少两种地理对象分别对应的颜色阈值,从所述地图图像中确定所述至少两种地理图像分别对应的图像区域;
对所述图像区域进行矢量化处理,得到所述至少两种地理对象。
可选地,所述地理对象包括道路对象和建筑物对象。
可选地,所述根据至少两种地理对象分别对应的颜色阈值,从所述地图图像中确定所述至少两种地理图像分别对应的图像区域,包括:
根据所述地理对象对应的颜色阈值,将所述地图图像处理为所述地理对象对应的二值化图像;
根据所述地理对象对应的二值化图像确定所述地理对象对应的图像区域。
可选地,在所述得到所述至少两种地理对象后,所述方法还包括:
根据所述地理对象在所述地图图像中对应的像素点,确定所述地理对象在所述卫星图像中对应的像素点;
根据所述地理图像在所述卫星图像中对应的像素点的经纬度信息,确定所述地理对象的经纬度信息。
可选地,所述将所述卫星图像处理为地图图像,包括:
基于预先训练的机器学习模型对所述卫星图像进行处理,得到所述地图图像。
可选地,所述机器学习模型基于对偶式生成对抗网络训练得到;
所述对偶式生成对抗网络包括第一生成器、第一判别器、第二生成器和第二判别器;所述第一生成器用于根据卫星图像生成地图图像,所述第一判别器用于判断第一生成器生成的地图图像为机器生成的概率,所述第二生成器用于根据第一生成器生成的地图图像还原出卫星图像,所述第二判别器用于比较卫星图像和判断第二生成器还原出的卫星图像,以判断第二生成器还原出的卫星图像为机器生成的概率。
可选地,基于至少两个进程对所述于对偶学习的生成对抗网络进行并行训练,直至第一判别器、第二判别器、第一生成器、第二生成器的损失之和收敛,其中,所述至少两个进程共享训练参数。
根据本发明的第二方面,提供了一种地理对象的提取装置,包括:
获取模块,用于获取卫星图像;
处理模块,用于将所述卫星图像处理为地图图像;
提取模块,用于根据至少两种地理对象分别对应的颜色阈值,从所述地图图像中确定所述至少两种地理图像分别对应的图像区域;
矢量化模块,用于对所述图像区域进行矢量化处理,得到所述至少两种地理对象。
根据本发明的第三方面,提供了一种电子设备,包括处理器和存储器,所述存储器存储有能够被所述处理器执行的机器可执行指令,所述处理器执行所述机器可执行指令以实现本发明第一方面所述的地理对象的提取方法。
根据本发明的第四方面,提供了一种计算机可读存储介质,存储有可执行命令,所述可执行命令被处理器执行时,实现本发明第一方面所述的地理对象的提取方法。
本实施例中地理对象的提取方法,先将卫星图像处理地图图像,再根据至少两种地理对象分别对应的颜色阈值从地图图像中提取图像区域,最后对图像区域进行矢量处理得到地理对象。该方法通过合理设置颜色阈值,可以在一次处理过程中提取多种地理对象,有利于提高最终的导航效果。此外,该方法不依赖用户轨迹,能够比较全面完整地提取出道路等地理对象。
通过以下参照附图对本公开的示例性实施例的详细描述,本公开的其它特征及其优点将会变得清楚。
附图说明
被结合在说明书中并构成说明书的一部分的附图示出了本公开的实施例,并且连同其说明一起用于解释本公开的原理。
图1是可用于实现本公开实施例的电子设备的示意图。
图2是根据本公开实施例的地理对象的提取方法的流程图。
图3是根据本公开实施例的模型结构的示意图。
图4是根据本公开实施例的图像转换的示意图。
图5是根据本公开实施例的二值化处理的示意图。
图6是根据本公开实施例的地理对象提取结果的示意图。
具体实施方式
现在将参照附图来详细描述本公开的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本公开及其应用或使用的任何限制。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,技术、方法和设备应当被视为说明书的一部分。
在这里示出和讨论的所有例子中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它例子可以具有不同的值。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
<硬件配置>
图1示出了可用于实现本公开的实施例的电子设备的硬件配置。
参见图1,电子设备1000包括处理器1100、存储器1200、接口装置1300、通信装置1400、显示装置1500和输入装置1600。处理器1100例如可以是中央处理器CPU、微控制单元MCU等。存储器1200例如包括ROM(只读存储器)、RAM(随机存取存储器)、诸如硬盘的非易失性存储器等。接口装置1300例如包括USB接口、串行接口等。通信装置1400例如是有线网卡或无线网卡。显示装置1500例如是液晶显示屏。输入装置1600例如包括触摸屏、键盘、鼠标、麦克风等。
应用于本说明书的实施例中,电子设备1000的存储器1200用于存储指令,该指令用于控制处理器1100进行操作以支持实现根据本说明书任意实施例的方法。本领域技术人员可以根据本说明书所公开方案设计指令。指令如何控制处理器进行操作,这是本领域公知,故在此不再详细描述。
本领域技术人员应当理解,尽管在图1中示出了电子设备1000的多个装置,但是,本说明书实施例的电子设备1000可以仅涉及其中的部分装置,例如,只涉及处理器1100、存储器1200和通信装置1400。
图1所示的电子设备1000例如是用于提供地图服务的服务器。
图1所示的硬件配置仅是解释性的,并且决不是为了要限制本公开、其应用或用途。
<方法实施例>
本实施例提供了一种地理对象的提取方法,例如由图1所示的电子设备1000实施。本实施例中的地理对象包括道路对象、建筑物对象等。
如图2所示,该方法包括以下步骤S1100-S1400。
在步骤S1100中,获取卫星图像。
本实施例中,卫星图像是指通过卫星远程拍摄的影像。可以基于卫星地图数据库的获取卫星图像。
在步骤S1200中,将卫星图像处理为地图图像。
本实施例中,卫星图像是卫星直接拍摄的原始图像,地图图像是按照一定规则绘制的表示地理信息的图形。地图图像可以根据卫星图像绘制而成。
在一个例子中,步骤S1200进一步包括:基于预先训练的机器学习模型对卫星图像进行处理,得到地图图像。
在一个例子中,上述机器学习模型可以基于对偶式生成对抗网络训练得到,获取机器学习模型的过程包括以下步骤。
首先,建立初始模型,初始模型包括第一生成器、第一判别器、第二生成器和第二判别器;第一生成器用于根据卫星图像生成地图图像,第一判别器用于判断第一生成器生成的地图图像为机器生成的概率,第二生成器用于根据第一生成器生成的地图图像还原出卫星图像,第二判别器用于比较卫星图像和判断第二生成器还原出的卫星图像,以判断第二生成器还原出的卫星图像为机器生成的概率。
其次,基于至少两个进程对于对偶学习的生成对抗网络进行并行训练,直至第一判别器、第二判别器、第一生成器、第二生成器的损失之和收敛,其中,至少两个进程共享训练参数,并将训练好的第一生成器作为用来进行地图处理的机器学习模型。
在上述例子中,采用生成对抗网络(Generative Adversarial Network)方法获取机器学习模型。生成对抗网络是非监督式学习的一种方法,通过轮流训练判别器(Discriminator)和生成器(Generator),令其相互对抗,来从复杂概率分布中采样,例如生成图片、文字、语音等。
在上述例子中,采用多级生成器判别器的网络结构。第一生成器生成的地图图像可以作为第二生成器和第二判别器的训练样本,第二生成器生成的卫星图像可以作为第一生成器和第一判别器的训练样本。采用上述结构进行循环训练,可以扩充训练样本的数量,有利于获得更好的生成器。
在一个例子中,第一生成器包括编码器、转换器和解码器,编码器用于提取输入图像的第一特征,转换器用于将第一特征转换为第二特征,解码器用于根据第二特征得到输出图像。
上述编码器用于提取输入图像的第一特征。编码器可以采用卷积神经网络来实现。卷积神经网络(Convolutional Neural Networks,CNN)是一类包含卷积计算且具有深度结构的前馈神经网络(Feedforward Neural Networks),是深度学习(deep learning)的代表算法之一。卷积神经网络包含了一个由卷积层和子采样层(池化层)构成的特征抽取器。在卷积神经网络的卷积层中,一个神经元只与部分邻层神经元连接。在CNN的一个卷积层中,通常包含若干个特征图(featureMap),每个特征图由一些矩形排列的神经元组成,同一特征图的神经元共享权值,这里共享的权值就是卷积核。卷积核一般以随机小数矩阵的形式初始化,在网络的训练过程中卷积核将学习得到合理的权值。共享权值(卷积核)带来的直接好处是减少网络各层之间的连接,同时又降低了过拟合的风险。子采样也叫做池化(pooling),通常有均值子采样(mean pooling)和最大值子采样(max pooling)两种形式。子采样可以看作一种特殊的卷积过程。卷积和子采样大大简化了模型复杂度,减少了模型的参数。在一个具体例子中,编码器可以包括至少一个卷积层和至少一个池化层。
上述转换器用于将第一特征转换为第二特征。在一个具体例子中,转换器包括多个Resnet模块。一个Resnet模块是一个由两个卷积层组成的神经网络层,其中部分输入数据直接添加到输出。这样做是为了确保先前网络层的输入数据信息直接作用于后面的网络层,使得相应输出与原始输入的偏差缩小,否则原始图像的特征将不会保留在输出中且输出结果会偏离目标轮廓。转换器的功能之一是保留原始图像的特征,如目标的大小和形状,采用残差网络非常适合完成这些转换。
上述解码器用于根据第二特征得到输出图像,从特征向量中还原出低级特征。解码器可以采用反卷积层(deconvolution)来实现。反卷积相对于卷积在神经网络结构的正向和反向传播中做相反的运算,适用于从特征还原图像的场景。
在一个例子中,通过多个进程对初始模型进行并行训练。通过这种方式,有利于提高模型训练效率。
以下提供一个训练机器学习模型的具体例子。在该具体例子中,使用谷歌地图(google map)的卫星图像18级瓦片数据和地图图像的18级瓦片数据作为训练数据,图像的分辨率为256×256。
在该具体例子中,使用X86构架Linux操作系统服务器下NVIDIA Titan V GPU(Graphics Processing Unit,图形处理器)作为计算环境,使用开源机器学习库pytorch,建立多级生成器判别器的并行循环对抗生成网络模型结构。
参见图3,该模型采用进程1和进程2并行训练。训练数据随机分配至进程1或者进程2。并行训练过程由pytorch进行管理。
在该具体例子中,每个训练进程按照第一生成器S、第一判别器M、第二生成器M、第二判别器S的顺序运行,其中,第一判别器M用于反馈第一生成器S,第二判别器S用于反馈第二生成器M。
在该具体例子中,第一生成器S和第二生成器M均采用编码器-转换器-解码器的结构。其中,解码器用于从第一域中尺寸为(width,height,bit)的输入图像中提取第一特征向量F1,转换器用于将第一特征向量F1转换为第二特征向量F2,解码器用于将第二特征向量F2还原为第二域中尺寸同样为(width,height,bit)的输出图像。
在该具体例子中,对于每个训练进程,构建整体损失函数。该整体损失函数包括两个判别器的损失和两个生成器的损失。第一判别器M的损失为LGAN(F,DX,Y,X)=Ex~Pdata(x)[logDX(x)]+Ey~Pdata(y)[log(1-DX(F(y)))]。第二判别器S的损失为LGAN(G,DX,X,Y)=Ey~data(y[logDY(y)]+Ex~Pdata(x)[log(1-DY(G(x)))]。其中X为原始的地图图像,x为生成的地图图像,Y为原始的卫星图像,y为生成的地图图像。第一生成器和第二生成器的损失之和为Lcyc(G,F)=Ex~Pdata(x)[‖F(G(x))-x‖1]+Ey~Pdata(y)[‖F(G(y))-y‖1]。因此,整体损失函数L(G,F,DX,DY)=LGAN(F,DX,Y,X)+LGAN(G,DX,X,Y)+Lcyc(G,F)。
根据上述整体损失函数对模型进行训练,直至模型的参数收敛。收敛状态下的第一判别器即可作为用于进行地图转换的机器学习模型。
通过生成对抗网络的方法,能够得到效果较好的机器学习模型。此外,上述方式对输入图像的分辨率要求较低并且无需人工标注训练样本。
图4是根据本公开实施例的图像转换的示意图。图4左侧为输入机器学习模型的卫星图像,图4右侧为机器学习模型输出的地图图像。可以看出,本实施例中的机器学习模型能够将卫星图像自动转换为地图图像,以便执行后续步骤。
在步骤S1200中,根据至少两种地理对象分别对应的颜色阈值,从地图图像中确定至少两种地理图像分别对应的图像区域。
本实施例中,地图图像中的同一类地理对象具有相同或者相近的颜色。例如,地图图像中的道路为白色而建筑物为灰色。通过设置合理的颜色阈值,可以将某一类地理对象在地图图像中对应的区域提取出来。将上述区域称为图像区域。
本实施例中,某一类地理对象可以对应多个阈值,例如最大阈值和最小阈值,从而形成该类地理对象对应的阈值范围。
在一个例子中,根据预设的颜色阈值,从地图图像中提取图像区域,包括:根据颜色阈值,对地图图像进行二值化处理;根据二值化处理后的图像,获取图像区域。
图像的二值化处理就是将图像上的点的灰度值为0或255,也就是将整个图像呈现出明显的黑白效果。即将256个亮度等级的灰度图像通过适当的阈值选取而获得仍然可以反映图像整体和局部特征的二值化图像。
对彩色图像进行二值化处理时,可以先将彩色图转换为灰度图,再对灰度图进行二值化处理。在一个例子中,对于彩色图像中的每个像素点,可以计算该像素点的R、G、B三个分类的平均值,将该平均值作为该灰度图中像素点的灰度值,从而得到彩色图像对应的灰度图像。
图5是根据本公开实施例的二值化处理的示意图。图5左侧为待处理的地图图像。该例子中,通过二值化处理提取道路对象,因此将颜色阈值设置为[248,248,248],相应的灰度阈值为248,可围绕该灰度阈值上下浮动10个灰度,从而得到相应的阈值范围。对于颜色值处于上述阈值范围内的像素点,将其颜色标记为黑色,对于颜色值处于上述阈值范围外的像素点,将其颜色标记为白色。二值化处理中黑白色也可以设置为相反情况,对于颜色值处于上述阈值范围内的像素点,将其颜色标记为白色,对于颜色值处于上述阈值范围外的像素点,将其颜色标记为黑色。二值化处理的结果如图5右侧所示,其中黑色部分表示道路区域,即为图像区域。可以看出,通过二值化处理能够快速准确地获取图像区域。
在上述例子中,通过二值化处理提取建筑物对象,将颜色阈值设置为[237,235,233],相应的灰度阈值为235,可围绕该灰度阈值上下浮动10个灰度。通过这种方式,能够快速准确地获取建筑物区域,从而在一次提取过程中得到两种地理对象。
二值化处理后的图像中通常存在较小的干扰点即噪点。对此,在一个例子中,对二值化图像进行去噪处理。一种去噪方式为,首先将二值化图像中的像素划分为多个连通区,每个连通区内的像素点颜色相同,并且每个连通区内任意两个像素点为直接或间接连接。其次,根据像素大小对连通区进行过滤,去除像素数量小于某个预设值的连通区,从而实现去噪效果。
在步骤S1300中,对图像区域进行矢量化处理,得到至少两种地理对象。
矢量化是一种图像的转变方法。计算机中显示的图形一般可以分为矢量图和位图。位图通过像素点阵来描述图形。矢量图使用直线和曲线来描述图形,这些图形的元素是一些点、线、矩形、多边形、圆和弧线等等,它们都是通过数学公式计算获得的。矢量图形最大的优点是无论放大、缩小或旋转等不会失真。
对图像区域进行矢量化处理后,即可得到地理对象,例如道路对象、建筑物对象等。图6示出了道路对象的提取结果,其中深色的线条为矢量化图形,代表区域中的道路。浅色的块状区域为矢量化图像,代表建筑物。据此可以补充现有地图数据中缺失的道路信息和建筑物信息。
在一个例子中,为提取到的地理对象添加经纬度信息。例如,根据地理对象在地图图像中对应的像素点,确定地理对象在卫星图像中对应的像素点;根据地理图像在卫星图像中对应的像素点的经纬度信息,确定地理对象的经纬度信息。如此,可以提取到更全面完整的地理对象信息。
本实施例中地理对象的提取方法,先将卫星图像处理地图图像,再根据至少两种地理对象分别对应的颜色阈值从地图图像中提取图像区域,最后对图像区域进行矢量处理得到地理对象。该方法通过合理设置颜色阈值,可以在一次处理过程中提取多种地理对象,有利于提高最终的导航效果。此外,该方法不依赖用户轨迹,能够比较全面完整地提取出道路等地理对象。
另外,该方法通过机器学习模型将卫星图像转换为地图图像,对输入图像的分辨率要求较低并且无需人工标注训练样本。
<装置实施例>
本实施例提供一种地理对象的提取装置,包括获取模块、处理模块、提取模块和矢量化模块。
获取模块,用于获取卫星图像。
处理模块,用于将卫星图像处理为地图图像。
提取模块,用于根据至少两种地理对象分别对应的颜色阈值,从地图图像中确定至少两种地理图像分别对应的图像区域。
矢量化模块,用于对图像区域进行矢量化处理,得到至少两种地理对象。
在一个例子中,地理对象包括道路对象和建筑物对象。
在一个例子中,提取模块用于:根据地理对象对应的颜色阈值,将地图图像处理为地理对象对应的二值化图像;根据地理对象对应的二值化图像确定地理对象对应的图像区域。
在一个例子中,该装置还包括经纬度信息添加模块,用于:根据地理对象在地图图像中对应的像素点,确定地理对象在卫星图像中对应的像素点;根据地理图像在卫星图像中对应的像素点的经纬度信息,确定地理对象的经纬度信息。
在一个例子中,处理模块用于:基于预先训练的机器学习模型对卫星图像进行处理,得到地图图像。
在一个例子中,机器学习模型基于对偶式生成对抗网络训练得到。对偶式生成对抗网络包括第一生成器、第一判别器、第二生成器和第二判别器;第一生成器用于根据卫星图像生成地图图像,第一判别器用于判断第一生成器生成的地图图像为机器生成的概率,第二生成器用于根据第一生成器生成的地图图像还原出卫星图像,第二判别器用于比较卫星图像和判断第二生成器还原出的卫星图像,以判断第二生成器还原出的卫星图像为机器生成的概率。
在一个例子中,该装置还包括训练模块,用于:基于至少两个进程对于对偶学习的生成对抗网络进行并行训练,直至第一判别器、第二判别器、第一生成器、第二生成器的损失之和收敛,其中,至少两个进程共享训练参数。
<电子设备实施例>
本实施例提供一种电子设备,包括处理器和存储器,存储器存储有能够被处理器执行的机器可执行指令,处理器执行机器可执行指令以实现本发明方法实施例描述的的地理对象的提取方法。
本公开可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本公开的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本公开的各个方面。
这里参照根据本公开实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本公开的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。对于本领域技术人员来说公知的是,通过硬件方式实现、通过软件方式实现以及通过软件和硬件结合的方式实现都是等价的。
以上已经描述了本公开的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。本公开的范围由所附权利要求来限定。
Claims (10)
1.一种地理对象的提取方法,包括:
获取卫星图像;
将所述卫星图像处理为地图图像;
根据至少两种地理对象分别对应的颜色阈值,从所述地图图像中确定所述至少两种地理图像分别对应的图像区域;
对所述图像区域进行矢量化处理,得到所述至少两种地理对象。
2.根据权利要求2所述的方法,其中,所述地理对象包括道路对象和建筑物对象。
3.根据权利要求1所述的方法,其中,所述根据至少两种地理对象分别对应的颜色阈值,从所述地图图像中确定所述至少两种地理图像分别对应的图像区域,包括:
根据所述地理对象对应的颜色阈值,将所述地图图像处理为所述地理对象对应的二值化图像;
根据所述地理对象对应的二值化图像确定所述地理对象对应的图像区域。
4.根据权利要求1所述的方法,其中,在所述得到所述至少两种地理对象后,所述方法还包括:
根据所述地理对象在所述地图图像中对应的像素点,确定所述地理对象在所述卫星图像中对应的像素点;
根据所述地理图像在所述卫星图像中对应的像素点的经纬度信息,确定所述地理对象的经纬度信息。
5.根据权利要求1所述的方法,其中,所述将所述卫星图像处理为地图图像,包括:
基于预先训练的机器学习模型对所述卫星图像进行处理,得到所述地图图像。
6.根据权利要求5所述的方法,其中,所述机器学习模型基于对偶式生成对抗网络训练得到;
所述对偶式生成对抗网络包括第一生成器、第一判别器、第二生成器和第二判别器;所述第一生成器用于根据卫星图像生成地图图像,所述第一判别器用于判断第一生成器生成的地图图像为机器生成的概率,所述第二生成器用于根据第一生成器生成的地图图像还原出卫星图像,所述第二判别器用于比较卫星图像和判断第二生成器还原出的卫星图像,以判断第二生成器还原出的卫星图像为机器生成的概率。
7.根据权利要求6所述的方法,其中,基于至少两个进程对所述于对偶学习的生成对抗网络进行并行训练,直至第一判别器、第二判别器、第一生成器、第二生成器的损失之和收敛,其中,所述至少两个进程共享训练参数。
8.一种地理对象的提取装置,包括:
获取模块,用于获取卫星图像;
处理模块,用于将所述卫星图像处理为地图图像;
提取模块,用于根据至少两种地理对象分别对应的颜色阈值,从所述地图图像中确定所述至少两种地理图像分别对应的图像区域;
矢量化模块,用于对所述图像区域进行矢量化处理,得到所述至少两种地理对象。
9.一种电子设备,包括处理器和存储器,所述存储器存储有能够被所述处理器执行的机器可执行指令,所述处理器执行所述机器可执行指令以实现权利要求1至7中任一项所述的地理对象的提取方法。
10.一种计算机可读存储介质,存储有可执行命令,所述可执行命令被处理器执行时,实现权利要求1至7中任一项所述的地理对象的提取方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010477179.5A CN111814542A (zh) | 2020-05-29 | 2020-05-29 | 地理对象的提取方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010477179.5A CN111814542A (zh) | 2020-05-29 | 2020-05-29 | 地理对象的提取方法、装置及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111814542A true CN111814542A (zh) | 2020-10-23 |
Family
ID=72847829
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010477179.5A Pending CN111814542A (zh) | 2020-05-29 | 2020-05-29 | 地理对象的提取方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111814542A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112580309A (zh) * | 2020-12-22 | 2021-03-30 | 平安国际智慧城市科技股份有限公司 | 文档数据处理方法、装置、计算机设备及存储介质 |
CN114494082A (zh) * | 2022-04-02 | 2022-05-13 | 成都理工大学工程技术学院 | 一种基于图像识别的影像地图瓦片图处理方法 |
-
2020
- 2020-05-29 CN CN202010477179.5A patent/CN111814542A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112580309A (zh) * | 2020-12-22 | 2021-03-30 | 平安国际智慧城市科技股份有限公司 | 文档数据处理方法、装置、计算机设备及存储介质 |
CN112580309B (zh) * | 2020-12-22 | 2023-08-04 | 深圳平安智慧医健科技有限公司 | 文档数据处理方法、装置、计算机设备及存储介质 |
CN114494082A (zh) * | 2022-04-02 | 2022-05-13 | 成都理工大学工程技术学院 | 一种基于图像识别的影像地图瓦片图处理方法 |
CN114494082B (zh) * | 2022-04-02 | 2022-07-08 | 成都理工大学工程技术学院 | 一种基于图像识别的影像地图瓦片图处理方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108229479B (zh) | 语义分割模型的训练方法和装置、电子设备、存储介质 | |
US10692221B2 (en) | Automatic trimap generation and image segmentation | |
US20200130177A1 (en) | Systems and methods for few-shot transfer learning | |
US11074504B2 (en) | Instance segmentation | |
US10891476B2 (en) | Method, system, and neural network for identifying direction of a document | |
US11651214B2 (en) | Multimodal data learning method and device | |
CN111488826A (zh) | 一种文本识别方法、装置、电子设备和存储介质 | |
CN111615702B (zh) | 一种从图像中提取结构化数据的方法、装置和设备 | |
CN110570433B (zh) | 基于生成对抗网络的图像语义分割模型构建方法和装置 | |
WO2019240964A1 (en) | Teacher and student based deep neural network training | |
CN110084172B (zh) | 文字识别方法、装置和电子设备 | |
CN115457531A (zh) | 用于识别文本的方法和装置 | |
US20240062426A1 (en) | Processing images using self-attention based neural networks | |
Du et al. | Segmentation and sampling method for complex polyline generalization based on a generative adversarial network | |
US11257217B2 (en) | Image segmentation using neural networks | |
CN111881944A (zh) | 图像鉴别的方法、电子设备和计算机可读介质 | |
US20190332894A1 (en) | Method for Processing Automobile Image Data, Apparatus, and Readable Storage Medium | |
CN111814542A (zh) | 地理对象的提取方法、装置及电子设备 | |
CN114429637B (zh) | 一种文档分类方法、装置、设备及存储介质 | |
EP4148685A1 (en) | Method, training method, apparatus, device, medium and computer program for character generation | |
JPWO2020240808A1 (ja) | 学習装置、分類装置、学習方法、分類方法、学習プログラム、及び分類プログラム | |
CN116982089A (zh) | 用于图像语义增强的方法和系统 | |
CN113570678A (zh) | 基于人工智能的图像上色方法、装置、电子设备 | |
CN110969641A (zh) | 图像处理方法和装置 | |
CN114972944A (zh) | 视觉问答模型的训练方法及装置、问答方法、介质、设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |