CN112686197B - 一种数据处理方法和相关装置 - Google Patents

一种数据处理方法和相关装置 Download PDF

Info

Publication number
CN112686197B
CN112686197B CN202110018195.2A CN202110018195A CN112686197B CN 112686197 B CN112686197 B CN 112686197B CN 202110018195 A CN202110018195 A CN 202110018195A CN 112686197 B CN112686197 B CN 112686197B
Authority
CN
China
Prior art keywords
road
top view
result
ground top
semantic analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110018195.2A
Other languages
English (en)
Other versions
CN112686197A (zh
Inventor
付钰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202110018195.2A priority Critical patent/CN112686197B/zh
Publication of CN112686197A publication Critical patent/CN112686197A/zh
Application granted granted Critical
Publication of CN112686197B publication Critical patent/CN112686197B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本申请实施例公开了一种数据处理方法和相关装置,至少涉及图像识别、深度学习等技术,深度模型对目标区域的地面俯视图进行语义分析和视图向量提取,并根据生成的语义分析结果和视图向量,采用道路标注类别对待识别道路进行道路实例的识别和标注,得到道路标注结果。该识别过程是基于路面本身形状连贯性、道路实例在空间高度方向上的位置等符合工程学原理的客观规律确定出的道路标注类别,而且地面俯视图将待识别道路控制在二维层面,有效的降低了识别复杂度。该相对简单、客观的道路标注类别结合地面俯视图的识别优势,更适用于深度模型进行学习、使用,且道路标注结果可用于电子地图的构建、更新等场景,从而降低了电子地图的维护成本。

Description

一种数据处理方法和相关装置
技术领域
本申请涉及数据处理领域,特别是涉及一种数据处理方法和相关装置。
背景技术
电子地图能够准确反映实际区域的地理信息,起到为用户提供地图指引的服务,用户可以通过电子地图的导航等功能的指引下找到、前往目的地。
为了能够提供优质的地图指引服务,电子地图的地图准确性是关键因素之一。目前电子地图的构建、更新多依靠人工完成,例如通过路车沿途拍摄街景、路况等视频数据,基于对视频数据进行道路识别来发现新铺设的道路、确定被取消的道路等,以此类数据实现电子地图的构建、更新。
上述相关技术过于依赖人力,导致电子地图的维护成本很高。
发明内容
为了解决上述技术问题,本申请提供了一种数据处理方法和相关装置,实现了地面俯视图中道路实例的识别和标注,降低了识别复杂度,更适用于深度模型学习。
本申请实施例公开了如下技术方案:
一方面,本申请实施例提供了一种数据处理方法,所述方法包括:
获取目标区域的地面俯视图,所述目标区域中具有待识别道路;
通过深度模型对所述地面俯视图进行针对道路识别的语义分析和视图向量提取,得到语义分析结果和视图向量,所述语义分析结果用于标识所述地面俯视图中识别出的道路像素和非道路像素,所述视图向量用于标识所述地面俯视图中归属同一道路的像素;
根据所述语义分析结果和所述视图向量,通过所述深度模型得到所述地面俯视图的道路标注结果,所述道路标注结果包括用于标识所述待识别道路的多个道路实例,所述道路实例具有对应的道路标注类别,所述道路标注类别是根据道路形状特征确定的,所述道路标注类别用于标识道路实例的层级。
另一方面,本申请实施例提供了一种数据处理方法,所述方法包括:
一种数据处理方法,其特征在于,所述方法包括:
获取目标区域的地面俯视图,所述目标区域中具有待识别道路;
通过对所述地面俯视图进行针对道路识别的语义分析和视图向量提取,得到所述地面俯视图的道路标注结果,所述道路标注结果包括用于标识所述待识别道路的多个道路实例,所述道路实例具有对应的道路标注类别,所述道路标注类别是根据道路形状特征确定的,所述道路标注类别用于标识道路实例的层级;
根据所述地面俯视图和所述道路标注结果生成区域标注图,在所述区域标注图中不同道路标注类别的道路实例具有不同的展示标识。
另一方面,本申请实施例提供了一种数据处理装置,所述装置包括获取单元、识别单元和生成单元:
所述获取单元,用于获取目标区域的地面俯视图,所述目标区域中具有待识别道路;
所述识别单元,用于通过深度模型对所述地面俯视图进行针对道路识别的语义分析和视图向量提取,得到语义分析结果和视图向量,所述语义分析结果用于标识所述地面俯视图中识别出的道路像素和非道路像素,所述视图向量用于标识所述地面俯视图中归属同一道路的像素;
所述生成单元,用于根据所述语义分析结果和所述视图向量,通过所述深度模型得到所述地面俯视图的道路标注结果,所述道路标注结果包括用于标识所述待识别道路的多个道路实例,所述道路实例具有对应的道路标注类别,所述道路标注类别是根据道路形状特征确定的,所述道路标注类别用于标识道路实例的层级。
另一方面,本申请实施例提供了一种数据处理装置,所述装置包括获取单元、识别单元和生成单元:
所述获取单元,用于获取目标区域的地面俯视图,所述目标区域中具有待识别道路;
所述识别单元,用于通过对所述地面俯视图进行针对道路识别的语义分析和视图向量提取,得到所述地面俯视图的道路标注结果,所述道路标注结果包括用于标识所述待识别道路的多个道路实例,所述道路实例具有对应的道路标注类别,所述道路标注类别是根据道路形状特征确定的,所述道路标注类别用于标识道路实例的层级;
所述生成单元,用于根据所述地面俯视图和所述道路标注结果生成区域标注图,在所述区域标注图中不同道路标注类别的道路实例具有不同的展示标识。
另一方面,本申请实施例提供了一种计算机设备,所述计算机设备包括处理器以及存储器:
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行上述方面所述的方法。
另一方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机程序,所述计算机程序用于执行上述方面所述的方法。
另一方面,本申请实施例提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述方面所述的方法。
由上述技术方案可以看出,对于具有待识别道路的目标区域,通过深度模型对该目标区域的地面俯视图进行针对道路识别的语义分析和视图向量提取,得到语义分析结果和视图向量。其中,语义分析结果用于标识地面俯视图中识别出的道路像素和非道路像素,视图向量用于标识地面俯视图中归属同一道路的像素。深度模型以该语义分析结果和视图向量作为基础数据,采用道路标注类别对待识别道路进行道路实例的识别和标注,得到待识别道路所对应道路实例的道路标注结果,该道路标注类别是根据道路形状特征确定的,且道路标注类别所标识的道路实例的层级是基于视图向量所包含像素间的遮挡关系确定的。该识别过程是基于路面本身形状连贯性或形状断开程度、道路实例在空间高度方向上的位置等符合工程学原理的客观规律确定出的道路标注类别,而不是相关技术中基于具体地图业务而主观划分的复杂规则,而且地面俯视图将待识别道路控制在二维层面,有效的降低了识别复杂度。该相对简单、客观的道路标注类别结合地面俯视图的识别优势,更适用于深度模型进行学习、使用,从而实现了深度模型在道路识别的快速应用,降低了应用成本。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种数据处理方法的应用场景示意图;
图2为本申请实施例提供的一种数据处理方法的流程示意图;
图3为本申请实施例提供的一种使用深度模型进行数据处理的示意图;
图4为本申请实施例提供的一种语义分析结果示意图;
图5为本申请实施例提供的一种视图向量示意图;
图6为本申请实施例提供的一种道路标注类别示意图;
图7为本申请实施例提供的一种深度模型训练方法的流程示意图;
图8为本申请实施例提供的另一种数据处理方法的流程示意图;
图9为本申请实施例提供的一种区域标注图示意图;
图10为本申请实施例提供的一种数据处理装置的流程示意图;
图11为本申请实施例提供的一种服务器的结构示意图;
图12为本申请实施例提供的一种终端设备的结构示意图。
具体实施方式
下面结合附图,对本申请的实施例进行描述。
在相关技术中,电子地图是根据具体地图业务进行针对性设计的,规则复杂,尤其对于道路的断开有严格的规定,例如:道路分叉时断裂为两条道路、道路弯曲超过一定弧度时断裂为两条道路。这种基于人为规则制定的电子地图具有较强的主观性,且在地图业务中无法对道路进行实例化描述,存在道路的条数无法确定、道路间的层级关系不明确等问题。这种方式不适合深度模型在道路识别中的学习和使用。
为此,本申请实施例提供了一种数据处理方法和相关装置,实现了对于道路实例的自动识别,还有效的降低了识别复杂度,适用于深度模型在道路识别中的学习和使用。
本申请实施例提供的数据处理方法是基于人工智能实现的,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
在本申请实施例中,主要涉及的人工智能软件技术包括上述计算机视觉技术、机器学习/深度学习等方向。例如可以涉及计算机视觉(Computer Vision)中的图像处理(Image Processing)、图像语义理解(Image Semantic Understanding,ISU)、图像识别(Image Recognition,IR)等。例如可以涉及机器学习(Machine learning,ML)中的深度学习(Deep Learning),包括各类人工神经网络(Artificial Neural Network,ANN)。
本申请实施例提供的数据处理方法可以应用于具有数据处理能力的数据处理设备,例如终端设备或服务器,该方法可以通过终端设备独立执行,也可以通过服务器独立执行,也可以应用于终端设备和服务器通信的网络场景,通过终端设备和服务器配合执行。其中,终端设备可以为手机、台式计算机、便携式计算机等;服务器可以理解为是应用服务器,也可以为Web服务器,在实际部署时,该服务器可以为独立服务器,也可以为集群服务器。为了便于描述,下述以服务器作为数据处理设备对本申请实施例进行介绍。
该数据处理设备可以具备实施计算机视觉技术的能力,计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取信息的人工智能系统。计算机视觉技术通常包括图像处理、图像识别、图像语义理解、图像检索、文字识别(Optical Character Recognition,OCR)、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、3D技术、虚拟现实、增强现实、同步定位与地图构建等技术,还包括常见的人脸识别、指纹识别等生物特征识别技术。
在本申请实施例中,数据处理设备可以通过计算机视觉技术对地面俯视图进行图像处理、图像识别等。
该数据处理设备可以具备机器学习能力。机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络等技术。
本申请实施例提供的数据处理方法主要涉及对各类人工神经网络的应用,以确定地面俯视图的道路标注结果。
为了便于理解,下面结合具体的应用场景,对本申请实施例提供的数据处理方法进行介绍。
参见图1,图1为本申请实施例提供的一种数据处理方法的应用场景示意图。在图1所示的场景中,包括服务器101,部署有用于道路识别的深度模型,用于执行本申请实施例提供的数据处理方法。
在应用过程中,服务器101获取目标区域的地面俯视图,该目标区域中具有待识别道路。其中,地面俯视图为针对目标区域所在地面拍摄的俯视图,例如,针对北京某区某街道所在地面拍摄的俯视图,如图1中的102所示,包括多条待识别道路。如此通过地面俯视图将待识别道路控制在二维层面,能够降低道路识别过程的数据处理量,有助于降低道路识别复杂度。
然后,服务器101利用训练好的深度模型对上述地面俯视图进行道路识别,即对地面俯视图进行语义分析和视图向量提取,得到语义分析结果和视图向量。该语义分析结果标识了地面俯视图中识别出的道路像素和非道路像素。视图向量用于标识地面俯视图中归属于同一道路的像素。也就是说,语义分析是对地面俯视图中像素进行道路像素和非道路像素的二分类识别,而视图向量是对归属同一道路的像素进行特征表示。
对于图1中的地面俯视图102,服务器101利用深度模型对其进行语义分析,即确定地面俯视图102中的道路像素和非道路像素,得到语义分析结果,如图1中的语义分析结果103所示,其中虚线部分用于表示道路像素。服务器101还利用深度模型对地面俯视图102进行视图向量提取,即确定出归属同一道路的像素,如图1中的视图向量104所示,包括5条道路和1个路口。
上述通过语义分析和视图向量提取对地面俯视图中待识别道路进行道路识别,从二维图像的像素级别实现了对于地面俯视图中待识别道路特征的提取,有效的降低了识别复杂度,且该过程得到的语义分析结果和视图向量为实现道路实例以及道路实例的道路标注类别的自动识别提供了基础数据。
鉴于相关技术中针对地图业务进行人为制定的道路规则复杂,存在无法确定道路条数、道路层级关系,以及不适用于深度模型学习等问题。故在本申请实施例中,采用道路标注类别对待识别道路进行识别和标注,该道路标注类别是根据道路形状特征确定的,也就是从道路本身的形状连贯性或形状断开程度、道路实例在空间高度方向上的位置等符合工程学原理的客观规律对道路实例进行识别、标注。
具体的,以上述语义分析结果和视图向量作为基础数据,利用深度模型进行道路实例的识别和标注,得到地面俯视图的道路标注结果,该道路标注结果包括待识别道路对应的道路实例和该道路实例的道路标注类别。其中,道路实例是指具有道路标注类别的单个个体,例如:一条道路、一个路口等。道路标注类别用于标识道路实例的层级。基于道路实例的层级,能够确定出道路实例间的层级关系。
在图1中,服务器101利用深度模型,基于语义分析结果103和视图向量104,得到地面俯视图102的道路标注结果105。该标注结果105包括6个道路实例,这6个道路实例对应的道路标注类别分别为5条道路(如105中的编号①②③④⑤所示)和1个路口(如105中的编号⑥所示)。以地面所在层级为0,则道路①③④和路口⑥对应的层级为0,道路②的层级为1,道路⑤的层级为2。基于此,可以确定出道路②在道路①③④和路口⑥之上,且道路⑤在道路②之上。
由于视图向量标识了归属同一道路的像素,即包含了归属不同道路的像素之间的遮挡关系,因此,在识别过程中利用语义分析结果和视图向量,可以实现对于道路实例的自动识别,还可以实现对于道路实例的道路标注类别的自动识别,即能够实现对于道路实例的层级的自动识别。
上述深度模型采用道路标注类别对待识别道路进行道路实例的识别和标注,相较于相关技术中基于具体地图业务而主观划分的复杂规则,有效的降低了识别复杂度。并且地面俯视图将待识别道路控制在二维层面,如此相对简单、客观的道路标注类别结合地面俯视图的识别优势,更适用于深度模型进行学习、使用,从而实现了深度模型在道路识别的快速应用,降低了应用成本。
为了更好地理解,下面对本申请实施例提供的数据处理方法进行逐步介绍。参见图2,图2为本申请实施例提供的一种数据处理方法的流程示意图。如图2所示,该数据处理方法包括以下步骤:
S201:获取目标区域的地面俯视图。
出于能够反映目标区域中道路全貌的目的,服务器获取目标区域的地面俯视图,该地面俯视图为包括待识别道路的二维平面图。
在实际应用中,服务器可以获取由拍摄设备(如卫星、无人机等)针对目标区域所在地面拍摄得到的地面俯视图,也可以从数据库中获取待识别的地面俯视图,在此不作任何限定。
服务器基于地面俯视图对目标区域所包括的道路进行识别,相较于车况图,地面俯视图更加直观地体现了目标区域的地理全貌,且地面俯视图为二维平面图,相较于三维立体图,降低了数据量,有助于降低后续基于地面俯视图进行的道路识别的数据处理量。
S202:通过深度模型对所述地面俯视图进行针对道路识别的语义分析和视图向量提取,得到语义分析结果和视图向量。
服务器中部署有训练好的深度模型。服务器基于上述S201获取到地面俯视图后,将该地面俯视图作为深度模型的输入。然后,利用深度模型对地面俯视图进行道路识别,即对地面俯视图进行语义分析和视图向量提取,得到语义分析结果和视图向量,以此作为识别道路实例和道路实例的道路标注类别的基础数据。其中,语义分析结果用于标识地面俯视图中识别出的道路像素和非道路像素,视图向量用于标识地面俯视图中归属同一道路的像素。
语义分析过程是对地面俯视图进行语义分割,即是对地面俯视图中的前景和背景进行分离,前景为道路像素,背景为非道路像素。也就是说,语义分析是对地面俯视图上进行像素级二分类识别。视图向量提取是对地面俯视图中像素进行多维度特征表示。
上述深度模型是基于人工智能技术实现的,模型结构可以是各种人工神经网络,用于对地面俯视图进行道路识别。在一种可能的实现方式中,深度模型包括下采样子模型、语义分析子模型和视图向量子模型。为了便于理解,下面结合图3对深度模型进行介绍。
参见图3,图3为本申请实施例提供的一种使用深度模型进行数据处理的示意图。如图3所示,该深度模型包括下采样子模型301、语义分析子模型302和视图向量子模型303。
下采样子模型301作为语义分析子模型302和视图向量提取子模型303的共享结构,先对地面俯视图311进行下采样的特征提取,为语义分析子模型302和视图向量提取子模型303提供相同的特征输入。然后,语义分析子模型302对下采样子模型301的输出进行针对道路识别的上采样语义分析,得到语义分析结果312,并且视图向量提取子模型303对下采样子模型301的输出进行针对道路识别的上采样视图向量提取,得到视图向量313。
下采样子模型,即图3中301所示的共享编码器(Shared encoder),包括N个特征提取层,其中第i个特征提取层的输入为第i-1个特征提取层的输出,第i个特征提取层所输出的特征提取结果的尺寸小于第i-1个特征提取层所输出的特征提取结果。
上述特征提取层包括卷积层(Convolutional Layer)、归一化层(BatchNomalization,BN)和激活层(Activation Layer),应用过程中可以根据实际需求设计每个特征提取层的具体结构,在此不作任何限定。其中,低层卷积层用于提取地面俯视图的边缘纹理等基本特征,高层卷积层用于对低层卷积层提取的边缘纹理等基本特征进行抽象化结合。归一化层对抽象化后的特征进行归一化正态分布处理。激活层对归一化后的特征进行非线性映射,用于加强深度模型的泛化能力,例如,激活层可以为整流线性单元函数(Rectified Linear Unit,ReLU)。
在一种可能的实现方式中,下采样子模型可以为可变形卷积网络(DeformableConvolutional Networks V2,DCNV2),能够很好地识别存在弯曲等几何形变的道路实例。
语义分析子模型,即图3中302所示的语义分支(Segmentation branch),包括M个语义分析层,其中第j个语义分析层的输入为第j-1个语义分析层的输出和下采样子模型301中同尺寸的特征提取层的输出,即采用特征金字塔(Feature Pyramid Networks forObject Detection,FPN)策略,通过M次上采样融合构成U型网络(U Network,U-Net)结构。
在语义分析过程中,第j个语义分析层先对第j-1个语义分析层的输出进行反卷积层(Deconvolution)操作,实现尺度放大的作用,提供更上层上采样融合所必要的特征信息,并与下采样子模型301中同尺寸的特征提取层的输出进行加和,然后经过卷积操作,实现信息的融合。
如图3所示,地面俯视图311经过下采样子模型301进行下采样被缩小后,再经过语义分析子模型302进行上采样语义分割后,输出为原始尺寸的语义分析结果。为了便于描述,图3中的语义分析结果312所包括的道路像素所在区域以虚线进行标识。在实际应用中,语义分析结果可以以掩膜(mask)的形式输出,如图4所示的一种语义分析结果示意图。
视图向量子模型,即图3中303所示的向量提取分支(Embedding branch)包括L个向量提取层,其中第k个向量提取层的输入为第k-1个向量提取层的输出和下采样子模型301中同尺寸的特征提取层的输出,即同样采用上述FPN策略,通过L次上采样融合构成U型网络(U Network,U-Net)结构,在此不再赘述。
如图3所示,视图向量提取子模型302对下采样子模型301的输出进行上采样视图向量提取后,被还原为原始尺寸的视图向量,即图3中313所示,包括4条道路和1个路口。为了便于描述,在图3中通过不同的图形标识对这4条道路和1个路口进行标识。在实际应用中,视图向量可以以不同的颜色进行标识,如图5所示的一种视图向量示意图,在此不作任何限定。
上述深度模型中的下采样子模型实现了对于地面俯视图的下采样,降低了道路识别过程中的数据处理量,而语义分析子模型实现了对于地面俯视图中道路像素与非道路像素的二分类识别,视图向量子模型实现了对于地面俯视图中归属同一道路像素的特征表示,基于此,为后续实现对于地面俯视图中道路实力提供了数据基础,有效的降低了识别复杂度。
S203:根据所述语义分析结果和所述视图向量,通过所述深度模型得到所述地面俯视图的道路标注结果。
基于上述S202得到语义分析结果和视图向量,以此作为基础数据,再通过深度模型进行识别,得到地面俯视图的道路标注结果,该道路标注结果包括用于标识地面俯视图中待识别道路的多个道路实例,且每个道路实例具有各自对应的道路标注类别。
在实际应用中,深度模型在像素级别上对地面俯视图进行语义分析和视图向量提取,然后基于语义分析结果和视图向量,通过密度聚类实现对地面俯视图中道路实例的分割与识别。
由于在相关技术中,针对地图业务进行人为制定的规则复杂,存在无法确定道路的条数、道路间的层级关系以及不适用于深度模型学习等问题。因此,在本申请实施例中,根据道路形状特征确定道路标注类别,即基于路面本身形状连贯性或形状断开程度、道路实例在空间高度上的位置等符合工程学基础的客观规律对道路实例进行划分。
在一种可能的实现方式中,道路标注类别包括根据路面形状连贯性或者说路面形状断开程度确定的道路和路口。即在道路实例的识别和标注过程中,深度模型基于路面形状连贯性或道路形状断开程度确定地面俯视图所包括的道路和路口。
路面形状连贯性或路面形状断开程度可以根据路面材质、颜色、宽度、走向等特征进行识别。例如,路面材质颜色一样,即路面形状具有连贯性,无明显断开,在此情况下确定为一条道路,即一个道路实例;分叉的道路与原道路在宽度和走向上存在较大差异,在此情况下路面形状不具有连贯性,即存在明显断开的,此时在道路分叉处可以确定多个道路实例。
在实际应用中,路面形状连贯性或路面形状断开程度还可以根据道路汇聚、分叉多寡程度进行识别。例如,将汇聚在一起的道路数量超过2条所形成的路面确定为一个路口;将一条宽路断开为两条窄路的断开路面确定为一个路口。在标注过程中,路口可以以斑马线作为边界。
上述基于路面本身形状连贯性或形状断开程度对待识别道路进行实例化识别,相较于基于具体地图业务划分的复杂规则,更具有客观性,降低了人为识别和标注的成本,更适合深度模型的学习、使用。
由于视图向量标识了地面俯视图中归属同一道路的像素,即将地面俯视图中属于同一条道路所对应的像素进行统一标识。可以理解的是,若待识别道路在空间中存在层叠结构,相应的,在地面俯视图中体现为不同道路实例的像素存在遮挡关系。例如,天桥和天桥下的道路在空间中为层叠结构,即天桥遮挡了天桥底下的道路,遮挡区域反映在地面俯视图中的像素为天桥,而不是天桥底下的道路。故此在确定道路实例过程中,深度模型利用视图向量还可以确定出道路实例的层级,即道路标注类别还用于标识道路实例的层级。
道路实例的层级用于标识道路实例在空间中的高度信息。在本申请实施例中,道路实例的层级可以为道路实例间的相对层级。在实际应用中,可以利用数据编号和/或文字等形式进行表示,例如:层级为0、1、2等;底层道路、中层道路和顶层道路等。以上述天桥和天桥底下的道路为例,若将天桥底下的道路层级设定为1,则天桥的层级可以设定为2。
道路实例的层级也可以为道路实例对应的绝对层级。在实际应用中,可以根据道路实例相对地面的高度确定的层级。例如,将相对地面的海拔在[0,4米)的道路实例对应的层级设定为1,相对地面的海拔在[4,8米)的道路实例对应的层级设定为2等。
基于上述道路标注类别所标识的道路实例的层级,可以确定出道路实例间的上下层级关系,该上下层级关系标识了多个道路实例在空间高度上的相对位置,例如,目标区域包括地面道路、天桥和高架,若天桥相对地面的海拔为4.5米,高架相对地面的海拔为7米,则在地面俯视图中,对应天桥的像素层级为1,对应高架的像素层级为2,即高架位于天桥之上。
在实际应用中,还可以根据实际场景中的路况对道路进行划分,例如,道路标注类别还可以包括道路面、步行设施和道路中线等。道路实例的层级也可以根据实际情况进行灵活调整,例如,新增高层道路等。
如图6所示为本申请实施例提供的一种道路标注类别划分方式,以文字和编号共同标注。如图6所示,道路标注(2)包括:道路面(21)、道路(22)、路口(23)、步行设施(24)和道路中线(25)。其中,道路(22)包括底层道路(221)、中层道路(222)和高层道路(223);步行设施(24)包括天桥(241)和斑马线(242)。
在图3所示的场景中,深度模型基于语义分析结果312和视图向量313进行道路实例聚类,采用上述道路标注类别对聚类得到的道路实例进行标注,得到道路标注结果,如图3中314所示,包括道路①②③④和路口⑤,其中,道路①②③和路口⑤的层级均为0,道路④的层级为1。在地面俯视图中,道路④遮挡了道路②部分区域。
上述深度模型采用道路标注类别对地面俯视图进行识别和标注,而且地面俯视图将待识别道路控制在二维层面,有效的降低了识别复杂度。该相对简单、客观的道路标注类别结合地面俯视图的识别优势,更适用于深度模型进行学习、使用,从而实现了深度模型在道路识别的快速应用,降低了应用成本。
可以理解的是,由于上述深度模型更多的是从特征层面对道路实例进行识别和标注,因而可能出现两条相邻且不同的道路在形状特征上非常相近,深度模型可能会将这两条道路识别为同一道路的可能性,例如,将路面材质颜色走势相同的两条道路识别为一条道路。
针对上述情况,本申请实施例提供了一种可能的实现方式,即在道路识别过程中,新增地面俯视图的位置信息(Position information),该位置信息用于标识地面俯视图中像素所对应区域在空间中的位置坐标。在实际应用中,可以根据地面俯视图建立x、y轴直角坐标系,则像素的位置信息包括x轴位置信息和y轴位置信息。
在道路识别过程中,根据语义分析结果、视图向量和上述地面俯视图中像素的位置信息,通过深度模型进行实例聚类,得到地面俯视图的道路标注结果。如图3所示,深度模型在语义分析结果312和视图向量313的基础上,还将地面俯视图311中像素的位置信息作为基础数据,进行道路实例聚类。
在识别和标注过程中,深度模型可以结合像素的位置信息确定出道路实例聚类中的待定聚类结果所对应道路实例的道路宽度,然后,通过判断该道路宽度是否满足阈值条件,确定待定聚类结果所对应道路实例的合理性。若道路宽度满足阈值条件,即道路宽度大于预设阈值时,表明待定聚类结果所对应道路实例的道路宽度较大,与道路实际宽度不符。对此,可以将待定识别结果进行道路实例进行拆分,并重新判断拆分后的待定道路实例的道路标注类别。
上述在道路实例识别过程中,通过引入地面俯视图中像素的位置信息,为深度模型进行道路实例的识别和标注提供了更为丰富的基础数据,提高了对于道路形状特征相似的多个道路实例的识别准确度。
为了进一步提高深度模型的识别精度,在另一种可能的实现方式中,可以通过深度模型确定地面俯视图中像素的像素高度信息。该像素高度信息用于标识地面俯视图中像素所对应区域在空间高度方向上的位置,包括像素所对应地区在空间高度方向上的绝对位置,如天桥像素对应的高度为4米,也可以包括像素所对应区域在空间高度方向上的相对位置,如地面道路像素为1层高度,高架限速为2层高度。
基于此,深度模型可以根据上述语义分析结果、视图向量和像素高度信息,得到地面俯视图的待定标注结果,该待定标注结果包括用于待识别道路的多个待定道路实例。
在实际应用中,深度模型还可以包括高度信息提取子模型,如图3中的304所示的高度分支(Height branch)。在识别过程中,高度信息提取子模型304对下采样子模型301的输出进行上采样的高度信息提取,得到地面俯视图中的像素高度信息。高度信息提取子模型包括Q个高度信息提取层,其中第q个高度信息提取层的输入为第q-1个高度信息提取层的输出和下采样子模型301中同尺寸的特征提取层的输出,即同样采样上述FPN策略,通过Q次上采样融合构成U型网络(U Network,U-Net)结构,在此不再赘述。
在实际应用中,深度模型可以基于上述道路实例分割的结果,将单个待定道路实例内的所有像素高度信息进行加权求和,最终将求和结果取整(四舍五入)作为该待定道路实例对应的实际高度信息。
深度模型得到待定道路实例对应的实际高度信息后,将该待定道路实例的实际高度信息与该待定道路实例的层级进行匹配,确定待定道路实例的层级是否可信。若待定道路实例的实际高度信息与该待定道路实例的层级匹配,表明待定道路实例的层级识别可信度较高,可以将待定标注结果确定为道路标注结果。若定道路实例的实际高度信息与该待定道路实例的层级不匹配,表明待定道路实例的层级识别可信度不高,不可以将该待定标注结果确定为道路标注结果。
上述在道路实例识别过程中,通过引入地面俯视图中的像素高度信息,对聚类得到的待定道路实例的层级进行校验,进一步提高了对于道路实例的层级识别准确度。
上述实施例提供的数据处理方法,由上述技术方案可以看出,对于具有待识别道路的目标区域,通过深度模型对该目标区域的地面俯视图进行针对道路识别的语义分析和视图向量提取,得到语义分析结果和视图向量。其中,语义分析结果用于标识地面俯视图中识别出的道路像素和非道路像素,视图向量用于标识地面俯视图中归属同一道路的像素。深度模型以该语义分析结果和视图向量作为基础数据,采用道路标注类别对待识别道路进行道路实例的识别和标注,得到待识别道路所对应道路实例的道路标注结果,该道路标注类别是根据道路形状特征确定的,且道路标注类别所标识的道路实例的层级是基于视图向量所包含像素间的遮挡关系确定的。该识别过程是基于路面本身形状连贯性或形状断开程度、道路实例在空间高度方向上的位置等符合工程学原理的客观规律确定出的道路标注类别,而不是相关技术中基于具体地图业务而主观划分的复杂规则,而且地面俯视图将待识别道路控制在二维层面,有效的降低了识别复杂度。该相对简单、客观的道路标注类别结合地面俯视图的识别优势,更适用于深度模型进行学习、使用,从而实现了深度模型在道路识别的快速应用,降低了应用成本。
针对上述实施例提供的深度模型,下面结合图7,对深度模型的训练过程进行介绍。图7为本申请实施例提供的一种深度模型训练方法的流程示意图。
如图7所示,该训练方法包括以下步骤:
S701:获取基于已标注地面俯视图确定的训练样本。
在应用过程中,服务器可以获取多个训练样本,该训练样本可以是基于已标注的地面俯视图确定的,包括已标注地面俯视图、已标注地面俯视图对应的实际语义分析结果和实际视图向量,以及已标注地面俯视图的实际道路标注结果,即道路实例标签。
上述获取的训练样本,不仅包括模型的输入(已标注地面俯视图)、输出(已标注地面俯视图的实际道路标注结果),还包括模型中间量(已标注地面俯视图对应的实际语义分析结果和实际视图向量),模型所依据的数据量丰富,有助于模型快速学习和收敛。
S702:基于初始模型对所述已标注地面俯视图生成的待定语义分析结果、待定视图向量和待定道路标注结果,根据分别与所述实际语义分析结果、所述实际视图向量以及所述实际道路标注结果间的差别信息,对所述初始模型进行训练,以得到所述深度模型。
在实际应用中,利用上述获取的多个训练样本对预先建立的初始模型进行训练。在训练过程中,利用初始模型对训练样本中的已标注地面俯视图针对道路识别进行语义分析和视图向量提取,得到已标注地面俯视图对应的待定语义分析结果和待定视图向量。然后,初始模型根据该待定语义分析结果和待定视图向量,得到待定道路标注结果。
继而,根据上述获取的待定语义分析结果与实际语义分析结果、待定视图向量与实际视图向量、待定道路标注结果与实际道路标注结果间的差别信息,对初始模型的模型参数进行调整。其中,初始模型所包括的语义分析子模型使用的损失函数为标准的交叉熵损失函数,视图向量子模型使用聚类损失。在计算道路实例损失环节,每个像素都有对应的道路实例标签。在调参过程中,分别计算类内聚合度损失与类间区域度损失约束模型的学习。
上述实施例提供的深度模型训练方法,利用已标注的地面俯视图,即基于道路标注类别进行标注的地面俯视图对模型进行训练,降低了模型训练的复杂度,使得模型能够更好地学习,从而提高深度模型对于待识别道路中道路实例的识别和标注性能。
需要说明的是,上述实施例提供的数据处理方法,可以应用于电子地图生成、纠错等场景。为了更好地理解,下面结合电子地图纠错场景,对上述实施例提供的数据处理方法进行介绍。
参见图8,图8为本申请实施例提供的另一种数据处理方法的流程示意图。如图8所示,该数据处理方法包括以下S801-S803,其中S801-S802的处理过程与上述S201-S203的处理过程类似,在此不再赘述。
S801:获取目标区域的地面俯视图,所述目标区域中具有待识别道路。
S802:通过对所述地面俯视图进行针对道路识别的语义分析和视图向量提取,得到所述地面俯视图的道路标注结果,所述道路标注结果包括用于标识所述待识别道路的多个道路实例,所述道路实例具有对应的道路标注类别,所述道路标注类别是根据道路形状特征确定的,所述道路标注类别用于标识道路实例的层级。
在一种可能的实现方式中,所述道路标注类别包括通过路面形状连贯性确定的道路和路口。
在一种可能的实现方式中,通过对所述地面俯视图进行针对道路识别的语义分析和视图向量提取,得到所述地面俯视图的道路标注结果包括:
通过深度模型对所述地面俯视图进行针对道路识别的语义分析和视图向量提取,得到语义分析结果和视图向量,所述语义分析结果用于标识所述地面俯视图中识别出的道路像素和非道路像素,所述视图向量用于标识所述地面俯视图中归属同一道路的像素;
根据所述语义分析结果和所述视图向量,通过所述深度模型得到所述地面俯视图的所述道路标注结果。
S803:根据所述地面俯视图和所述道路标注结果生成区域标注图,在所述区域标注图中不同道路标注类别的道路实例具有不同的展示标识。
在实际应用中,服务器可以根据上述S803生成的道路标注结果和地面俯视图,生成区域标注图。在该区域标注图中,利用不同的展示标识标注不同道路标注类别的道路实例。
以图3所示的场景为例,服务器根据道路标注结果314和地面俯视图311生成区域标注图,如图9所示。图9左下角虚线框所示,采用5种展示标识分别表示了道路标注结果314中的4条道路和1个路口。
由于区域标注图具有标识不用道路类别的展示标识,因此更便于后续的电子地图的生成、纠错等应用场景,由此可见,通过将深度模型应用于快速准确地道路识别,可以有效地对电子地图进行维度,降低了人工参与的程度,如此提高了维护效率和及时性,从而提高了电子地图的准确性。
基于图9所示的区域标注图可知,道路实例在地面俯视图中的区域是通过具有对应面积的多边形进行表示的,这与道路实例的实际形态具有一定的差异。为了更加形象直观地展现出道路实例在地面俯视图中的形态,在一种可能的实现方式中,可以在根据地面俯视图和道路标注结果生成区域标注图之前,对道路标注结果中的道路实例进行道路线条平滑处理,然后根据地面俯视图和进行了道路线条平滑处理后的道路标注结果生成区域标注图。也就是说,对道路实例的边缘进行线条平滑处理。
在本申请实施例中,可以利用泰森多边形(Voronoi diagram),Voronoi图或Dirichlet图对道路标注结果中的道路实例进行道路线条平滑处理。泰森多边形是由一组连接两邻点直线的垂直平分线组成的连续多边形组成。N个在平面上有区别的点,按照最邻近原则划分平面,每个点与它的最近邻区域相关联,相邻Voronoi多边形共享一条边的相关点连接形成德劳内(Delaunay)三角形。
在实际应用中,先针对道路标注结果提取道路实例的外边缘像素,然后,通过分割外边缘以得到更均衡的外边缘像素,并提取该外边缘像素的坐标。如果分割得到过多的外边缘像素,可以使用道格拉斯-普克算法(Douglas–Peucker algorithm)进行边缘简化。基于此,建立泰森多边形,然后选取所有泰森多边形的泰森图边缘像素,根据该泰森图边缘像素进行道路线条平滑。
上述经过道路线条平滑处理后得到的区域标注图,更加直观地确定出了道路实例的边缘,使得道路实例在区域标注图中的标注效果更加符合道路实例在地面俯视图中的展示效果。
将上述区域标注图应用于电子地图纠错场景中,服务器可以根据上述区域标注图与待纠错地图进行匹配,生成匹配结果。其中,待纠错地图为针对所述目标区域生成的电子地图。
在实际应用中,可以基于转向方程,使用一个线线匹配算法,计算上述区域标注图与待纠错地图之间的相似度,即匹配结果。该相似度标识了区域标注图与待纠错地图中的道路匹配程度。若相似度较大,表明区域标注图与待纠错地图中道路匹配程度较高;若相似度较小,表明区域标注图与待纠错地图中道路匹配程度较低。在实际应用中,可以设定一个预设阈值,如0.7,作为衡量待纠错地图需要进行纠错的门槛。
若上述匹配结果小于预设阈值,表明区域标注图中存在较多与待纠错地图不匹配的道路实例,此时可以通过该匹配结果确定待纠错地图中目标道路与区域标注图不匹配。在此情况下,对存在错误的待纠错地图进行道路纠错。
由于区域标注图中包括道路实例和道路实例对应的道路标注类别,因此,对于需要进行纠错的待纠错地图,可以根据区域标注图中与目标道路关联的道路实例的道路标注类别,确定出待纠错地图中的路网错误类型。路网错误类型包括目标区域内道路实例冗余和/或缺失。基于此,对该类待纠错地图进行人工判别和纠错。
在实际地图纠错场景中,服务器获取卫星实时拍摄目标区域的地面俯视图,利用训练后的深度模型对该地面俯视图进行道路识别,得到道路标注结果。根据地面俯视图和该道路标注结果,生成区域标注图,并通过显示屏向电子地图维护人员展示该区域标注图。基于该区域标注图与目标区域的待纠错地图进行匹配,并在不匹配情况下输出待纠错地图中的路网错误类型。
上述实施例提供的数据处理方法,利用深度模型针对地面俯视图输出的道路标注结果,生成具有展示标识的可视化区域标注图,并且将区域标注图与目标区域的待纠错地图进行匹配,实现了对于待纠错地图中道路实例的校验。基于区域标注图中道路实例对应的道路标注类别,简化了人工校验和修正存在路网错误的待纠错地图的时间和成本,有效地提高了对于电子地图的维护效率。
针对上述实施例提供的数据处理方法,本申请实施例还提供了一种数据处理装置。
参见图10,图10为本申请实施例提供的一种数据处理装置的结构示意图。如图10所示,该数据处理装置1000包括获取单元1001、识别单元1002和生成单元1003:
所述获取单元1001,用于获取目标区域的地面俯视图,所述目标区域中具有待识别道路;
所述识别单元1002,用于通过深度模型对所述地面俯视图进行针对道路识别的语义分析和视图向量提取,得到语义分析结果和视图向量,所述语义分析结果用于标识所述地面俯视图中识别出的道路像素和非道路像素,所述视图向量用于标识所述地面俯视图中归属同一道路的像素;
所述生成单元1003,用于根据所述语义分析结果和所述视图向量,通过所述深度模型得到所述地面俯视图的道路标注结果,所述道路标注结果包括用于标识所述待识别道路的多个道路实例,所述道路实例具有对应的道路标注类别,所述道路标注类别是根据道路形状特征确定的,所述道路标注类别用于标识道路实例的层级。
在一种可能的实现方式中,所述生成单元1003,用于:
根据所述语义分析结果、所述视图向量以及所述地面俯视图中像素的位置信息,通过所述深度模型进行道路实例聚类,得到所述地面俯视图的所述道路标注结果;
根据所述位置信息确定所述道路实例聚类中的待定聚类结果所对应道路实例的道路宽度;
若所述道路宽度满足阈值条件,将所述待定聚类结果进行道路实例拆分,并重新判断拆分后的待定道路实例的道路标注类别。
在一种可能的实现方式中,所述数据处理装置1000还包括确定单元:
所述确定单元,用于通过深度模型确定所述地面俯视图中像素的像素高度信息;
所述生成单元1003,用于:
根据所述语义分析结果和所述视图向量,通过所述深度模型得到所述地面俯视图的待定标注结果,所述待定标注结果包括用于所述待识别道路的多个待定道路实例;
基于所述待定道路实例所包括像素的像素高度信息确定所述待定道路实例的道路高度信息;
确定所述待定道路实例的层级与所述道路高度信息是否匹配;
若匹配,确定所述待定标注结果为所述道路标注结果。
在一种可能的实现方式中,所述道路标注类别包括通过路面形状连贯性确定的道路和路口。
在一种可能的实现方式中,所述深度模型包括下采样子模型、语义分析子模型和视图向量子模型,所述生成单元1003,用于:
通过所述下采样子模型对所述地面俯视图进行下采样的特征提取,所述下采样子模型包括N个特征提取层,其中第i个特征提取层的输入为第i-1个特征提取层的输出,第i个特征提取层所输出的特征提取结果的尺寸小于第i-1个特征提取层所输出的特征提取结果;
通过语义分析子模型对所述下采样子模型的输出进行针对道路识别的上采样语义分析,得到所述语义分析结果,所述语义分析子模型包括M个语义分析层,其中第j个语义分析层的输入为第j-1个语义分析层的输出和所述下采样子模型中同尺寸的特征提取层的输出;
通过视图向量子模型对所述下采样子模型的输出进行针对道路识别的上采样视图向量提取,得到所述视图向量,所述视图向量子模型包括L个向量提取层,其中第k个向量提取层的输入为第k-1个向量提取层的输出和所述下采样子模型中同尺寸的特征提取层的输出。
在一种可能的实现方式中,所述获取单元1001,还用于获取基于已标注地面俯视图确定的训练样本,所述训练样本包括所述已标注地面俯视图、所述已标注地面俯视图对应的实际语义分析结果和实际视图向量,以及所述已标注地面俯视图的实际道路标注结果;
所述数据处理装置1000还包括训练单元:
所述训练单元,用于基于初始模型对所述已标注地面俯视图生成的待定语义分析结果、待定视图向量和待定道路标注结果,根据分别与所述实际语义分析结果、所述实际视图向量以及所述实际道路标注结果间的差别信息,对所述初始模型进行训练,以得到所述深度模型。
针对上述实施例提供的数据处理装置1000,还可以用于执行另一种数据处理方法。其中:
所述获取单元1001,用于获取目标区域的地面俯视图,所述目标区域中具有待识别道路;
所述识别单元1002,用于通过对所述地面俯视图进行针对道路识别的语义分析和视图向量提取,得到所述地面俯视图的道路标注结果,所述道路标注结果包括用于标识所述待识别道路的多个道路实例,所述道路实例具有对应的道路标注类别,所述道路标注类别是根据道路形状特征确定的,所述道路标注类别用于标识道路实例的层级;
所述生成单元1003,用于根据所述地面俯视图和所述道路标注结果生成区域标注图,在所述区域标注图中不同道路标注类别的道路实例具有不同的展示标识。
在一种可能的实现方式中,所述数据处理装置1000还包括匹配单元:
所述匹配单元,用于根据所述区域标注图与待纠错地图进行匹配,生成匹配结果;所述待纠错地图为针对所述目标区域生成的电子地图;若通过所述匹配结果确定所述待纠错地图中目标道路与所述区域标注图不匹配,根据所述区域标注图中与所述目标道路关联的道路实例的道路标注类别,确定所述待纠错地图中的路网错误类型。
在一种可能的实现方式中,所述道路标注类别包括通过路面形状连贯性确定的道路和路口。
在一种可能的实现方式中,所述数据处理装置1000还包括平滑单元:
所述平滑单元,用于在所述根据所述地面俯视图和所述道路标注结果生成区域标注图之前,对所述道路标注结果中的道路实例进行道路线条平滑处理;
所述生成单元1003,用于所述根据所述地面俯视图和进行了所述道路线条平滑处理后的所述道路标注结果生成区域标注图。
上述实施例提供的数据处理装置,对于具有待识别道路的目标区域,通过深度模型对该目标区域的地面俯视图进行针对道路识别的语义分析和视图向量提取,得到语义分析结果和视图向量。其中,语义分析结果用于标识地面俯视图中识别出的道路像素和非道路像素,视图向量用于标识地面俯视图中归属同一道路的像素。深度模型以该语义分析结果和视图向量作为基础数据,采用道路标注类别对待识别道路进行道路实例的识别和标注,得到待识别道路所对应道路实例的道路标注结果,该道路标注类别是根据道路形状特征确定的,且道路标注类别所标识的道路实例的层级是基于视图向量所包含像素间的遮挡关系确定的。该识别过程是基于路面本身形状连贯性或形状断开程度、道路实例在空间高度方向上的位置等符合工程学原理的客观规律确定出的道路标注类别,而不是相关技术中基于具体地图业务而主观划分的复杂规则,而且地面俯视图将待识别道路控制在二维层面,有效的降低了识别复杂度。该相对简单、客观的道路标注类别结合地面俯视图的识别优势,更适用于深度模型进行学习、使用,从而实现了深度模型在道路识别的快速应用,降低了应用成本。
此外,利用深度模型针对地面俯视图输出的道路标注结果,生成具有展示标识的可视化区域标注图,并且将区域标注图与目标区域的待纠错地图进行匹配,实现了对于待纠错地图中道路实例的校验。基于区域标注图中道路实例对应的道路标注类别,简化了人工校验和修正存在路网错误的待纠错地图的时间和成本,有效地提高了对于电子地图的维护效率。
本申请实施例还提供了一种计算机设备,下面将从硬件实体化的角度对本申请实施例提供的用于数据处理的计算机设备进行介绍。
参见图11,图11是本申请实施例提供的一种服务器结构示意图,该服务器1400可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(centralprocessing units,CPU)1422(例如,一个或一个以上处理器)和存储器1432,一个或一个以上存储应用程序1442或数据1444的存储介质1430(例如一个或一个以上海量存储设备)。其中,存储器1432和存储介质1430可以是短暂存储或持久存储。存储在存储介质1430的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器1422可以设置为与存储介质1430通信,在服务器1400上执行存储介质1430中的一系列指令操作。
服务器1400还可以包括一个或一个以上电源1426,一个或一个以上有线或无线网络接口1450,一个或一个以上输入输出接口1458,和/或,一个或一个以上操作系统1441,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
上述实施例中由服务器所执行的步骤可以基于该图11所示的服务器结构。
其中,CPU 1422用于执行如下步骤:
获取目标区域的地面俯视图,所述目标区域中具有待识别道路;
通过深度模型对所述地面俯视图进行针对道路识别的语义分析和视图向量提取,得到语义分析结果和视图向量,所述语义分析结果用于标识所述地面俯视图中识别出的道路像素和非道路像素,所述视图向量用于标识所述地面俯视图中归属同一道路的像素;
根据所述语义分析结果和所述视图向量,通过所述深度模型得到所述地面俯视图的道路标注结果,所述道路标注结果包括用于标识所述待识别道路的多个道路实例,所述道路实例具有对应的道路标注类别,所述道路标注类别是根据道路形状特征确定的,所述道路标注类别用于标识道路实例的层级。
或者,CPU 1422用于执行如下步骤:
获取目标区域的地面俯视图,所述目标区域中具有待识别道路;
通过对所述地面俯视图进行针对道路识别的语义分析和视图向量提取,得到所述地面俯视图的道路标注结果,所述道路标注结果包括用于标识所述待识别道路的多个道路实例,所述道路实例具有对应的道路标注类别,所述道路标注类别是根据道路形状特征确定的,所述道路标注类别用于标识道路实例的层级;
根据所述地面俯视图和所述道路标注结果生成区域标注图,在所述区域标注图中不同道路标注类别的道路实例具有不同的展示标识。
可选的,CPU 1422还可以执行上述实施例提供的所述数据处理方法,在此不再赘述。
针对上文描述的数据处理方法,本申请实施例还提供了一种用于数据处理的终端设备,以使上述数据处理方法在实际中实现以及应用。
参见图12,图12为本申请实施例提供的一种终端设备的结构示意图。为了便于说明,仅示出了与本申请实施例相关的部分,具体技术细节未揭示的,请参照本申请实施例方法部分。该终端设备可以为包括手机、平板电脑、个人数字助理(Personal DigitalAssistant,简称PDA)等任意终端设备,以终端设备为手机为例:
图12示出的是与本申请实施例提供的终端设备相关的手机的部分结构的框图。参考图12,该手机包括:射频(Radio Frequency,简称RF)电路1510、存储器1520、输入单元1530、显示单元1540、传感器1550、音频电路1560、无线保真(wireless fidelity,简称WiFi)模块1570、处理器1580、以及电源1590等部件。本领域技术人员可以理解,图12中示出的手机结构并不构成对手机的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
下面结合图12对手机的各个构成部件进行具体的介绍:
RF电路1510可用于收发信息或通话过程中,信号的接收和发送,特别地,将基站的下行信息接收后,给处理器1580处理;另外,将设计上行的数据发送给基站。通常,RF电路1510包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(Low NoiseAmplifier,简称LNA)、双工器等。此外,RF电路1510还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议,包括但不限于全球移动通讯系统(Global System of Mobile communication,简称GSM)、通用分组无线服务(GeneralPacket Radio Service,简称GPRS)、码分多址(Code Division Multiple Access,简称CDMA)、宽带码分多址(Wideband Code Division Multiple Access,简称WCDMA)、长期演进(Long Term Evolution,简称LTE)、电子邮件、短消息服务(Short Messaging Service,简称SMS)等。
存储器1520可用于存储软件程序以及模块,处理器1580通过运行存储在存储器1520的软件程序以及模块,从而实现手机的各种功能应用以及数据处理。存储器1520可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器1520可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
输入单元1530可用于接收输入的数字或字符信息,以及产生与手机的用户设置以及功能控制有关的键信号输入。具体地,输入单元1530可包括触控面板1531以及其他输入设备1532。触控面板1531,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板1531上或在触控面板1531附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,触控面板1531可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器1580,并能接收处理器1580发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板1531。除了触控面板1531,输入单元1530还可以包括其他输入设备1532。具体地,其他输入设备1532可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
显示单元1540可用于显示由用户输入的信息或提供给用户的信息以及手机的各种菜单。显示单元1540可包括显示面板1541,可选的,可以采用液晶显示器(LiquidCrystal Display,简称LCD)、有机发光二极管(Organic Light-Emitting Diode,简称OLED)等形式来配置显示面板1541。进一步的,触控面板1531可覆盖显示面板1541,当触控面板1531检测到在其上或附近的触摸操作后,传送给处理器1580以确定触摸事件的类型,随后处理器1580根据触摸事件的类型在显示面板1541上提供相应的视觉输出。虽然在图12中,触控面板1531与显示面板1541是作为两个独立的部件来实现手机的输入和输入功能,但是在某些实施例中,可以将触控面板1531与显示面板1541集成而实现手机的输入和输出功能。
手机还可包括至少一种传感器1550,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板1541的亮度,接近传感器可在手机移动到耳边时,关闭显示面板1541和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于手机还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
音频电路1560、扬声器1561,传声器1562可提供用户与手机之间的音频接口。音频电路1560可将接收到的音频数据转换后的电信号,传输到扬声器1561,由扬声器1561转换为声音信号输出;另一方面,传声器1562将收集的声音信号转换为电信号,由音频电路1560接收后转换为音频数据,再将音频数据输出处理器1580处理后,经RF电路1510以发送给比如另一手机,或者将音频数据输出至存储器1520以便进一步处理。
WiFi属于短距离无线传输技术,手机通过WiFi模块1570可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图12示出了WiFi模块1570,但是可以理解的是,其并不属于手机的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。
处理器1580是手机的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器1520内的软件程序和/或模块,以及调用存储在存储器1520内的数据,执行手机的各种功能和处理数据。可选的,处理器1580可包括一个或多个处理单元;优选的,处理器1580可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器1580中。
手机还包括给各个部件供电的电源1590(比如电池),优选的,电源可以通过电源管理系统与处理器1580逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
尽管未示出,手机还可以包括摄像头、蓝牙模块等,在此不再赘述。
在本申请实施例中,该手机所包括的存储器1520可以存储程序代码,并将所述程序代码传输给所述处理器。
手机所包括的处理器1580可以根据所述程序代码中的指令执行上述实施例提供的所述数据处理方法,在此不再赘述。
本申请实施例还提供一种计算机可读存储介质,用于存储计算机程序,该计算机程序用于执行上述实施例提供的数据处理方法。
本申请实施例还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述方面的各种可选实现方式中提供的数据处理方法。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质可以是下述介质中的至少一种:只读存储器(英文:read-only memory,缩写:ROM)、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于设备及系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的设备及系统实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述,仅为本申请的一种具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应该以权利要求的保护范围为准。

Claims (15)

1.一种数据处理方法,其特征在于,所述方法包括:
获取目标区域的地面俯视图,所述目标区域中具有待识别道路;
通过深度模型对所述地面俯视图进行针对道路识别的语义分析和视图向量提取,得到语义分析结果和视图向量,所述语义分析结果用于标识所述地面俯视图中识别出的道路像素和非道路像素,所述视图向量用于标识所述地面俯视图中归属同一道路的像素;
根据所述语义分析结果和所述视图向量,通过所述深度模型得到所述地面俯视图的道路标注结果,所述道路标注结果包括用于标识所述待识别道路的多个道路实例,所述道路实例具有对应的道路标注类别,所述道路标注类别是根据道路形状特征确定的,所述道路标注类别用于标识道路实例的层级。
2.根据权利要求1所述的方法,其特征在于,所述根据所述语义分析结果和所述视图向量,通过所述深度模型得到所述地面俯视图的道路标注结果,包括:
根据所述语义分析结果、所述视图向量以及所述地面俯视图中像素的位置信息,通过所述深度模型进行道路实例聚类,得到所述地面俯视图的所述道路标注结果;
根据所述位置信息确定所述道路实例聚类中的待定聚类结果所对应道路实例的道路宽度;
若所述道路宽度满足阈值条件,将所述待定聚类结果进行道路实例拆分,并重新判断拆分后的待定道路实例的道路标注类别。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
通过深度模型确定所述地面俯视图中像素的像素高度信息;
所述根据所述语义分析结果和所述视图向量,通过所述深度模型得到所述地面俯视图的道路标注结果,包括:
根据所述语义分析结果和所述视图向量,通过所述深度模型得到所述地面俯视图的待定标注结果,所述待定标注结果包括用于所述待识别道路的多个待定道路实例;
基于所述待定道路实例所包括像素的像素高度信息确定所述待定道路实例的道路高度信息;
确定所述待定道路实例的层级与所述道路高度信息是否匹配;
若匹配,确定所述待定标注结果为所述道路标注结果。
4.根据权利要求1所述的方法,其特征在于,所述道路标注类别包括:
通过路面形状连贯性确定的道路和路口。
5.根据权利要求1所述的方法,其特征在于,所述深度模型包括下采样子模型、语义分析子模型和视图向量子模型,所述通过深度模型对所述地面俯视图进行针对道路识别的语义分析和视图向量提取,得到语义分析结果和视图向量,包括:
通过所述下采样子模型对所述地面俯视图进行下采样的特征提取,所述下采样子模型包括N个特征提取层,其中第i个特征提取层的输入为第i-1个特征提取层的输出,第i个特征提取层所输出的特征提取结果的尺寸小于第i-1个特征提取层所输出的特征提取结果,N>1,1<i≤N;
通过语义分析子模型对所述下采样子模型的输出进行针对道路识别的上采样语义分析,得到所述语义分析结果,所述语义分析子模型包括M个语义分析层,其中第j个语义分析层的输入为第j-1个语义分析层的输出和所述下采样子模型中同尺寸的特征提取层的输出,M>1,1<j≤M;
通过视图向量子模型对所述下采样子模型的输出进行针对道路识别的上采样视图向量提取,得到所述视图向量,所述视图向量子模型包括L个向量提取层,其中第k个向量提取层的输入为第k-1个向量提取层的输出和所述下采样子模型中同尺寸的特征提取层的输出,L>1,1<k≤L。
6.根据权利要求1-5任意一项所述的方法,其特征在于,所述方法还包括:
获取基于已标注地面俯视图确定的训练样本,所述训练样本包括所述已标注地面俯视图、所述已标注地面俯视图对应的实际语义分析结果和实际视图向量,以及所述已标注地面俯视图的实际道路标注结果;
基于初始模型对所述已标注地面俯视图生成的待定语义分析结果、待定视图向量和待定道路标注结果,根据分别与所述实际语义分析结果、所述实际视图向量以及所述实际道路标注结果间的差别信息,对所述初始模型进行训练,以得到所述深度模型。
7.一种数据处理方法,其特征在于,所述方法包括:
获取目标区域的地面俯视图,所述目标区域中具有待识别道路;
通过对所述地面俯视图进行针对道路识别的语义分析和视图向量提取,得到所述地面俯视图的道路标注结果,所述道路标注结果包括用于标识所述待识别道路的多个道路实例,所述道路实例具有对应的道路标注类别,所述道路标注类别是根据道路形状特征确定的,所述道路标注类别用于标识道路实例的层级;
根据所述地面俯视图和所述道路标注结果生成区域标注图,在所述区域标注图中不同道路标注类别的道路实例具有不同的展示标识。
8.根据权利要求7所述的方法,其特征在于,所述方法还包括:
根据所述区域标注图与待纠错地图进行匹配,生成匹配结果;所述待纠错地图为针对所述目标区域生成的电子地图;
若通过所述匹配结果确定所述待纠错地图中目标道路与所述区域标注图不匹配,根据所述区域标注图中与所述目标道路关联的道路实例的道路标注类别,确定所述待纠错地图中的路网错误类型。
9.根据权利要求7所述的方法,其特征在于,所述道路标注类别包括:
通过路面形状连贯性确定的道路和路口。
10.根据权利要求7-9任意一项所述的方法,其特征在于,在所述根据所述地面俯视图和所述道路标注结果生成区域标注图之前,所述方法还包括:
对所述道路标注结果中的道路实例进行道路线条平滑处理;
所述根据所述地面俯视图和所述道路标注结果生成区域标注图,包括:
所述根据所述地面俯视图和进行了所述道路线条平滑处理后的所述道路标注结果生成区域标注图。
11.一种数据处理装置,其特征在于,所述装置包括获取单元、识别单元和生成单元:
所述获取单元,用于获取目标区域的地面俯视图,所述目标区域中具有待识别道路;
所述识别单元,用于通过深度模型对所述地面俯视图进行针对道路识别的语义分析和视图向量提取,得到语义分析结果和视图向量,所述语义分析结果用于标识所述地面俯视图中识别出的道路像素和非道路像素,所述视图向量用于标识所述地面俯视图中归属同一道路的像素;
所述生成单元,用于根据所述语义分析结果和所述视图向量,通过所述深度模型得到所述地面俯视图的道路标注结果,所述道路标注结果包括用于标识所述待识别道路的多个道路实例,所述道路实例具有对应的道路标注类别,所述道路标注类别是根据道路形状特征确定的,所述道路标注类别用于标识道路实例的层级。
12.根据权利要求11所述的装置,其特征在于,所述道路标注类别包括通过路面形状连贯性确定的道路和路口。
13.一种数据处理装置,其特征在于,所述装置包括获取单元、识别单元和生成单元:
所述获取单元,用于获取目标区域的地面俯视图,所述目标区域中具有待识别道路;
所述识别单元,用于通过对所述地面俯视图进行针对道路识别的语义分析和视图向量提取,得到所述地面俯视图的道路标注结果,所述道路标注结果包括用于标识所述待识别道路的多个道路实例,所述道路实例具有对应的道路标注类别,所述道路标注类别是根据道路形状特征确定的,所述道路标注类别用于标识道路实例的层级;
所述生成单元,用于根据所述地面俯视图和所述道路标注结果生成区域标注图,在所述区域标注图中不同道路标注类别的道路实例具有不同的展示标识。
14.一种计算机设备,其特征在于,所述计算机设备包括处理器以及存储器:
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行权利要求1-6或权利要求7-10任意一项所述的方法。
15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储计算机程序,所述计算机程序用于执行权利要求1-6或权利要求7-10任意一项所述的方法。
CN202110018195.2A 2021-01-07 2021-01-07 一种数据处理方法和相关装置 Active CN112686197B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110018195.2A CN112686197B (zh) 2021-01-07 2021-01-07 一种数据处理方法和相关装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110018195.2A CN112686197B (zh) 2021-01-07 2021-01-07 一种数据处理方法和相关装置

Publications (2)

Publication Number Publication Date
CN112686197A CN112686197A (zh) 2021-04-20
CN112686197B true CN112686197B (zh) 2022-08-19

Family

ID=75456249

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110018195.2A Active CN112686197B (zh) 2021-01-07 2021-01-07 一种数据处理方法和相关装置

Country Status (1)

Country Link
CN (1) CN112686197B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113343858B (zh) * 2021-06-10 2024-03-12 广州海格通信集团股份有限公司 路网地理位置识别方法、装置、电子设备及存储介质
CN116129279B (zh) * 2023-04-14 2023-06-27 腾讯科技(深圳)有限公司 图像处理方法、装置、设备及介质
CN117011413B (zh) * 2023-09-28 2024-01-09 腾讯科技(深圳)有限公司 道路图像重建方法、装置、计算机设备和存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108921173A (zh) * 2018-06-01 2018-11-30 中南大学 一种结合osm和遥感影像提取人行天桥的深度学习方法
CN109800736A (zh) * 2019-02-01 2019-05-24 东北大学 一种基于遥感影像和深度学习的道路提取方法
WO2020073936A1 (zh) * 2018-10-12 2020-04-16 腾讯科技(深圳)有限公司 地图要素提取方法、装置及服务器
WO2020093351A1 (en) * 2018-11-09 2020-05-14 Beijing Didi Infinity Technology And Development Co., Ltd. Systems and methods for identifying a road feature
WO2020219028A1 (en) * 2019-04-23 2020-10-29 Google Llc Generation of surface maps to improve navigation
CN112131233A (zh) * 2020-08-28 2020-12-25 北京百度网讯科技有限公司 识别更新道路的方法、装置、设备和计算机存储介质
CN112183440A (zh) * 2020-10-13 2021-01-05 北京百度网讯科技有限公司 道路信息的处理方法、装置、电子设备和存储介质

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8553942B2 (en) * 2011-10-21 2013-10-08 Navteq B.V. Reimaging based on depthmap information
US20150371440A1 (en) * 2014-06-19 2015-12-24 Qualcomm Incorporated Zero-baseline 3d map initialization
CN106525057A (zh) * 2016-10-26 2017-03-22 陈曦 高精度道路地图的生成系统
EP3551967A2 (en) * 2016-12-09 2019-10-16 TomTom Global Content B.V. Method and system for video-based positioning and mapping
US10859395B2 (en) * 2016-12-30 2020-12-08 DeepMap Inc. Lane line creation for high definition maps for autonomous vehicles
US10678257B2 (en) * 2017-09-28 2020-06-09 Nec Corporation Generating occlusion-aware bird eye view representations of complex road scenes
US11301722B2 (en) * 2019-05-14 2022-04-12 Here Global B.V. Method, apparatus, and system for providing map embedding analytics

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108921173A (zh) * 2018-06-01 2018-11-30 中南大学 一种结合osm和遥感影像提取人行天桥的深度学习方法
WO2020073936A1 (zh) * 2018-10-12 2020-04-16 腾讯科技(深圳)有限公司 地图要素提取方法、装置及服务器
WO2020093351A1 (en) * 2018-11-09 2020-05-14 Beijing Didi Infinity Technology And Development Co., Ltd. Systems and methods for identifying a road feature
CN109800736A (zh) * 2019-02-01 2019-05-24 东北大学 一种基于遥感影像和深度学习的道路提取方法
WO2020219028A1 (en) * 2019-04-23 2020-10-29 Google Llc Generation of surface maps to improve navigation
CN112131233A (zh) * 2020-08-28 2020-12-25 北京百度网讯科技有限公司 识别更新道路的方法、装置、设备和计算机存储介质
CN112183440A (zh) * 2020-10-13 2021-01-05 北京百度网讯科技有限公司 道路信息的处理方法、装置、电子设备和存储介质

Also Published As

Publication number Publication date
CN112686197A (zh) 2021-04-20

Similar Documents

Publication Publication Date Title
CN112686197B (zh) 一种数据处理方法和相关装置
EP3944147A1 (en) Target detection method, model training method, device, apparatus and storage medium
CN111652121B (zh) 一种表情迁移模型的训练方法、表情迁移的方法及装置
CN109947886B (zh) 图像处理方法、装置、电子设备及存储介质
CN110852942B (zh) 一种模型训练的方法、媒体信息合成的方法及装置
CN111209423B (zh) 一种基于电子相册的图像管理方法、装置以及存储介质
US20210152751A1 (en) Model training method, media information synthesis method, and related apparatuses
CN112802111B (zh) 一种物体模型构建方法及装置
CN112329725B (zh) 一种道路场景的要素识别方法、装置、设备以及存储介质
CN116310745B (zh) 图像处理方法、数据处理方法、相关装置及存储介质
CN111556337B (zh) 一种媒体内容植入方法、模型训练方法以及相关装置
CN114092920B (zh) 一种模型训练的方法、图像分类的方法、装置及存储介质
CN114155497A (zh) 一种对象识别方法、装置及存储介质
CN114722937A (zh) 一种异常数据检测方法、装置、电子设备和存储介质
CN112435333B (zh) 一种道路场景的生成方法以及相关装置
CN113269279B (zh) 一种多媒体内容分类方法和相关装置
CN113822263A (zh) 图像标注方法、装置、计算机设备及存储介质
CN116071614A (zh) 样本数据处理方法、相关设备及存储介质
CN110795994B (zh) 路口图像选择方法及装置
CN113819913A (zh) 一种路径规划方法及装置、计算机设备和存储介质
CN113706446A (zh) 一种镜头检测方法和相关装置
CN113536876A (zh) 一种图像识别方法和相关装置
CN112270238A (zh) 一种视频内容识别方法和相关装置
CN111681255B (zh) 一种对象识别方法和相关装置
CN115578779B (zh) 一种换脸模型的训练、基于视频的换脸方法和相关装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40041949

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant