CN117150090A - 自动驾驶数据的属性图模型建立和数据管理方法、装置 - Google Patents
自动驾驶数据的属性图模型建立和数据管理方法、装置 Download PDFInfo
- Publication number
- CN117150090A CN117150090A CN202311412720.4A CN202311412720A CN117150090A CN 117150090 A CN117150090 A CN 117150090A CN 202311412720 A CN202311412720 A CN 202311412720A CN 117150090 A CN117150090 A CN 117150090A
- Authority
- CN
- China
- Prior art keywords
- data
- entities
- entity
- automatic driving
- attribute
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 58
- 238000013523 data management Methods 0.000 title claims abstract description 22
- 238000012512 characterization method Methods 0.000 claims abstract description 38
- 230000008569 process Effects 0.000 claims description 13
- 238000004088 simulation Methods 0.000 claims description 10
- 238000012986 modification Methods 0.000 claims description 5
- 230000004048 modification Effects 0.000 claims description 5
- 238000000638 solvent extraction Methods 0.000 claims description 4
- 238000007792 addition Methods 0.000 claims description 2
- 238000012217 deletion Methods 0.000 claims description 2
- 230000037430 deletion Effects 0.000 claims description 2
- 238000012216 screening Methods 0.000 claims description 2
- 238000012827 research and development Methods 0.000 abstract description 4
- 238000013500 data storage Methods 0.000 description 12
- 238000007726 management method Methods 0.000 description 11
- 230000008676 import Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 238000002372 labelling Methods 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 230000002085 persistent effect Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9024—Graphs; Linked lists
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/907—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/909—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Library & Information Science (AREA)
- Traffic Control Systems (AREA)
Abstract
本公开属于自动驾驶技术领域,具体涉及自动驾驶数据的属性图模型建立和数据管理方法、装置。所述自动驾驶数据的属性图模型建立方法包括:获取自动驾驶领域数据集,识别所述数据集中的不同实体以及所述实体之间的关系、各个所述实体的表征参数以及所述关系的表征参数;将每一个所述实体作为所述属性图模型中的一个节点,基于两个所述实体中第一实体与第二实体之间的关系确定从与所述第一实体对应的第一节点指向与所述第二实体对应的第二节点的边;将实体的表征参数作为与所述实体对应的所述节点的属性,将关系的表征参数作为与所述关系对应的所述边的属性。本发明可以为自动驾驶研发提供更加统一、高效的数据管理方案。
Description
技术领域
本公开属于自动驾驶技术领域,具体涉及自动驾驶数据的属性图模型建立和数据管理方法、装置。
背景技术
自动驾驶研发需要采集并处理海量数据,如摄像头数据、激光雷达数据、地图数据、车辆总线数据等,这些数据可以通过不同方式获取,如通过公开数据集获取,通过车辆或者路侧设备采集,通过自动驾驶场景模拟仿真系统获取等。这些数据在来源、数据类型、数据规模等方面存在很大不同,使得数据存储及查询方式存在很大差异性。这种差异性导致用户在使用这些数据时,需要采用不同的方式对数据进行存储、管理与查询。从而使得海量多模态数据数据存储和查询的过程非常复杂,不适应对海量多模态数据的数据管理。
发明内容
本公开实施例提出了一种自动驾驶数据的数据管理方案,以解决现有技术因为不同格式的数据存储及查询的方式不同因而不适用于对海量多模态数据的数据管理的问题。
本公开实施例的第一方面提供了一种自动驾驶数据的属性图模型建立方法,包括:
获取自动驾驶领域数据集,识别所述数据集中的不同实体以及所述实体之间的关系、各个所述实体的表征参数以及所述关系的表征参数;
将每一个所述实体作为所述属性图模型中的一个节点,基于两个所述实体中第一实体与第二实体之间的关系确定从与所述第一实体对应的第一节点指向与所述第二实体对应的第二节点的边;
将实体的表征参数作为与所述实体对应的所述节点的属性,将关系的表征参数作为与所述关系对应的所述边的属性。
在一些实施例中,所述识别所述数据集中的不同实体以及所述实体之间的关系、各个所述实体的表征参数以及所述关系的表征参数包括:
基于所述数据集的描述信息识别所述数据集中的不同实体以及所述实体之间的关系、各个所述实体的表征参数以及所述关系的表征参数。
在一些实施例中,在获取自动驾驶领域数据集之前,还包括:
获取自动驾驶领域和/或车路协同领域公共数据集,其中所述数据集包含预设要求的描述信息,所述描述信息包含数据来源实体信息、所述实体之间的关系信息和对所述实体和/或所述关系进行表征的参数信息;和/或
分别采集车辆在驾驶过程中形成的车侧数据和路侧设备在运行过程中形成的路侧数据,对所述数据分别添加预设标签形成数据集,按预设要求对所述数据集添加描述信息;和/或
采集自动驾驶场景仿真系统生成的数据,并对所述数据添加预设标签形成数据集,按预设要求对所述数据集添加描述信息。
在一些实施例中,所述按预设要求对所述数据集添加描述信息包括:
对所述数据集中的每种数据按预设方法生成标识所述数据来源实体的唯一标识;
基于所述唯一标识识别所述数据集中的不同实体并识别所述实体之间的关系、表征所述实体和所述关系的参数,基于所述实体、所述实体之间的关系、表征所述实体和所述关系的参数按预设要求生成描述信息。
本公开实施例的第二方面提供了一种自动驾驶数据的数据管理方法,其特征在于,包括:
获取自动驾驶数据,将所述自动驾驶数据导入属性图模型存储,其中所述属性图模型根据本公开第一方面所述方法建立;
当所述自动驾驶数据更新时,基于所述更新对所述属性图模型执行目标操作,其中,所述目标操作至少包括增加、删除、修改;
确定查询需求,基于所述属性图模型完成所述查询需求。
在一些实施例中,所述将所述自动驾驶数据导入属性图模型存储包括:
识别所述数据集包含的实体、实体之间的关系、表征所述实体和所述关系的参数;
基于所述实体在所述属性图模型中确定待导入节点,基于所述实体之间的关系在所述属性图模型中确定待导入边,基于表征所述实体的参数确定所述待导入节点中的对应属性,基于表征所述关系的参数确定所述待导入边中的对应属性;
将所述参数作为键,所述自动驾驶数据中所述参数的参数值作为键值,将键-键值对存储入所述属性。
在一些实施例中,所述识别所述数据集包含的实体包括:
基于所述数据集中的每种数据的唯一标识识别所述数据来源实体。
在一些实施例中,所述基于所述属性图模型完成所述查询需求包括:
基于对所述属性图模型中时间属性的索引或排序筛选出符合特定时间范围的节点和边以完成时间查询,其中,所述节点和所述边包含时间属性;和/或
使用空间索引或空间分区技术,在所述属性图模型中定位符合指定空间条件的节点和边以完成空间查询,其中,所述节点和所述边包含位置属性。
本公开实施例的第三方面提供了一种自动驾驶数据的属性图模型建立装置,包括:
识别模块,用于获取自动驾驶领域数据集,识别所述数据集中的不同实体以及所述实体之间的关系、各个所述实体的表征参数以及所述关系的表征参数;
第一确定模块,用于将每一个所述实体作为所述属性图模型中的一个节点,基于两个所述实体中第一实体与第二实体之间的关系确定从与所述第一实体对应的第一节点指向与所述第二实体对应的第二节点的边;
第二确定模块,用于将实体的表征参数作为与所述实体对应的所述节点的属性,将关系的表征参数作为与所述关系对应的所述边的属性。
本公开实施例的第四方面提供了一种自动驾驶数据的数据管理装置,其特征在于,包括:
导入模块,用于获取自动驾驶数据,将所述自动驾驶数据导入属性图模型存储,其中所述属性图模型根据本公开第一方面所述方法建立;
操作模块,用于当所述自动驾驶数据更新时,基于所述更新对所述属性图模型执行目标操作,其中,所述目标操作至少包括增加、删除、修改;
查询模块,用于确定查询需求,基于所述属性图模型完成所述查询需求。
综上所述,本公开各实施例提供的自动驾驶数据的属性图模型建立方法、装置,自动驾驶数据的数据管理方法、装置,通过将海量的多模态数据建模为属性图的形式,可以更好地表达数据之间的关联和依赖关系。基于属性图模式的自动驾驶数据存储和查询方案首先可以消除不同数据源和类型之间的差异性,使得数据的存储和查询方式更加统一。对于不同类型的数据,如摄像头数据、激光雷达数据、地图数据等,可以使用属性图模式将它们抽象为节点和边,并给予相应的属性。这样一来,无论数据是来自公开数据集、车辆或路测设备采集,还是通过仿真系统获取,都可以按照相同的方式进行建模和存储,保证了数据的一致性。其次,属性图模式还可以统一不同的数据存储和查询方式。属性图模式通常使用图数据库或图计算引擎来存储和管理属性图数据,这些工具提供了一致的数据访问接口和查询语言,适用于不同数据类型和规模的情况。无论是进行数据的增删改查操作,还是进行复杂的图遍历和分析,都可以使用统一的方式进行处理,简化了数据存储和查询的过程。因此,基于属性图模式的自动驾驶数据建模和存储、查询技术方案可以有效地管理海量多模态数据,实现不同数据的存储查询方式的统一建模,为自动驾驶研发提供了更加统一、高效的数据管理方案。
附图说明
通过参考附图会更加清楚的理解本公开的特征和优点,附图是示意性的而不应理解为对本公开进行任何限制,在附图中:
图1是本公开所适用的一种计算机系统的示意图;
图2是本公开所示的一个自动驾驶领域属性图模型的示例;
图3是根据本公开的一些实施例所示的一种自动驾驶数据的属性图模型建立方法的流程图;
图4是根据本公开的一些实施例所示的一种自动驾驶数据的属性图模型建立装置的示意图;
图5是根据本公开的一些实施例所示的一种自动驾驶数据的数据管理方法的流程图;
图6是根据本公开的一些实施例所示的一种自动驾驶数据的数据管理装置的示意图。
具体实施方式
在下面的详细描述中,通过示例阐述了本公开的许多具体细节,以便提供对相关披露的透彻理解。然而,对于本领域的普通技术人员来讲,本公开显而易见的可以在没有这些细节的情况下实施。应当理解的是,本公开中使用“系统”、“装置”、“单元”和/或“模块”术语,是用于区分在顺序排列中不同级别的不同部件、元件、部分或组件的一种方法。然而,如果其他表达式可以实现相同的目的,这些术语可以被其他表达式替换。
应当理解的是,当设备、单元或模块被称为“在……上”、“连接到”或“耦合到”另一设备、单元或模块时,其可以直接在另一设备、单元或模块上,连接或耦合到或与其他设备、单元或模块通信,或者可以存在中间设备、单元或模块,除非上下文明确提示例外情形。例如,本公开所使用的术语“和/或”包括一个或多个相关所列条目的任何一个和所有组合。
本公开所用术语仅为了描述特定实施例,而非限制本公开范围。如本公开说明书和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的特征、整体、步骤、操作、元素和/或组件,而该类表述并不构成一个排它性的罗列,其他特征、整体、步骤、操作、元素和/或组件也可以包含在内。
参看下面的说明以及附图,本公开的这些或其他特征和特点、操作方法、结构的相关元素的功能、部分的结合以及制造的经济性可以被更好地理解,其中说明和附图形成了说明书的一部分。然而,可以清楚地理解,附图仅用作说明和描述的目的,并不意在限定本公开的保护范围。可以理解的是,附图并非按比例绘制。
本公开中使用了多种结构图用来说明根据本公开的实施例的各种变形。应当理解的是,前面或下面的结构并不是用来限定本公开。本公开的保护范围以权利要求为准。
图1是本公开适用的一种计算机系统的示意图。如图1所示的系统,管理服务器基于存储在与之数据连接的数据服务器中的数据集, 如公共数据集、车侧数据集、路侧数据集或仿真系统数据集构建属性图模型或从所述数据集获取不同格式的数据,将所述数据导入与管理服务器数据连接的图数据库,以属性图模型存储、操作和查询所述数据。
其中,所述管理服务器可以是单机、集群或分布式服务器中的任一种。用于属性图构建的管理服务器和用于数据管理的管理服务器可以相同,也可以不同。特别的,所述管理服务器可以是自动驾驶车辆的车载控制器。
所述不同的数据集存储在数据服务器的不同文件夹。所述数据服务器可以是单机、集群或分布式服务器中的任一种。所述公共数据集指的是公开的自动驾驶领域、车路协同领域数据集, 如nuScenes、KITTI、DAIR-V2X,所述车侧数据集指的是通过采集试验车辆上的各种传感器在驾驶过程中获取的数据形成的数据集,所述路侧数据集指的是采集路侧设备在运行过程中获取的数据形成的数据集,所述仿真系统数据集指的是采集自动驾驶场景仿真系统生成的数据形成的数据集,如采集CARLA系统生成的数据。
所述图数据库基于属性图模型对自动驾驶领域数据统一建模和存储。任何基于标准图计算引擎来存储和管理属性图数据,并提供标准的数据访问和查询接口的图数据库均适用于本公开,如 Neo4j、GraphDB。
属性图由节点(Nodes)、关系(Relationships,也称为边)和属性(Properties)组成,它们之间通过关系连接起来,形成图结构。
节点(Nodes):节点代表图中的实体或对象,可以是任何事物,比如一个人、一个地点或一个概念。每个节点都有一个唯一的标识符,称为节点ID。节点还可以具有各种属性,用于描述和标识该节点,例如人的姓名、地点的名称等。节点通常用圆形来表示。
关系(Relationships,或边):关系表示节点之间的连接或关联,用于描述节点之间的关系。关系具有方向性,从一个起始节点指向一个目标节点。关系还可以有一个类型或标签,用于表示不同类型的关联。例如,一个人与另一个人之间可以有"朋友"的关系,一个地点与另一个地点之间可以有"距离"的关系。关系通常用箭头来表示。
属性(Properties):属性是附加在节点和关系上的键值对信息,用于提供更详细的描述和特征。节点和关系可以具有多个属性,例如节点的年龄、关系的权重等。属性可以是基本数据类型(如字符串、整数、布尔值等)或复杂的数据类型(如数组、日期等)。
自动驾驶领域属性图模型常用的节点和属性如下:
1. 场景(scene),是指某个特定环境,包括ID、场景名称、位置、描述等属性。
2. 帧(sample),是某个特定时刻的场景静态快照,包括ID、名称、时间索引等属性。
3. 传感器数据(sample_data),是传感器数据索引,包括ID、文件名称、数据模态等属性。
4. 传感器(sensor),是传感器信息,包括ID、传感器内外参等属性。
5. 位姿(ego_pose),是车辆或者路侧设备的实时位姿信息,包括ID、旋转、平移向量等属性。
6. 标注实体(instance),是数据标注的实体信息,包括各类数据标注,如人、车、车道线、交通标志等属性。
自动驾驶领域属性图模型常用的边如下:
1. 帧与场景的关系为包含关系,多个帧属于同一场景。
2. 一帧包含多个传感器数据,包含位姿,包含标注实体。
3. 传感器数据属于某个传感器。
图2是本公开一个自动驾驶领域属性图模型的示例。
图3是根据本公开的一些实施例所示的一种自动驾驶数据的属性图模型建立方法的流程图。在一些实施例中,所述属性图模型建立方法由图1所示系统中的管理服务器执行,所述属性图模型建立方法包括以下步骤:
S310:获取自动驾驶领域数据集,识别所述数据集中的不同实体以及所述实体之间的关系、各个所述实体的表征参数以及所述关系的表征参数。
具体的,采用以下一种或多种方式进行数据的获取:
a. 通过公开的自动驾驶领域、车路协同领域数据集的网站进行数据的下载,并将数据解压存储在数据服务器中;
b. 通过车辆进行数据采集,记录试验车辆上的各种传感器,如相机、激光雷达、GNSS、车辆底盘采集到的原始数据,加上数据标签以及元数据标签写入到数据文件中,将数据文件存储在数据服务器中;
c. 通过路侧设备进行数据采集,记录路侧智能路杆上的各种传感器,如相机、激光雷达、毫米波雷达采集到的原始数据,加上数据标签以及元数据标签写入到数据文件中,将数据文件存储在数据服务器中;
d. 采集自动驾驶场景仿真系统生成的数据作为原始数据,加上数据标签以及元数据标签写入到数据文件中,将数据文件存储在数据服务器中。
对于同一实体的数据,使用唯一标识进行区分和关联。唯一标识可以通过多种方式生成,如基于时间戳、序列号等。
再对于数据文件,生成描述文件,如:
1. 生成传感器信息描述文件:
包含传感器的唯一标识、名称、内外参等数据。
2. 生成传感器数据描述文件:
包含传感器的唯一标识、名称、数据存储位置、数据格式、数据模态、是否有标注等信息。
3. 生成标注描述文件:
包含唯一标识和标注的内容,如包围框的位置、尺寸、类别、分割区域的范围与类别等信息。
4. 生成场景描述文件:
包含场景的唯一标识、名称、地点、描述等信息。
5. 生成设备描述文件:
包含设备的唯一标识、名称、实时位置信息等。
6. 生成帧描述文件:
包含帧的唯一标识、场景标识、传感器数据标识、时间、设备标识等信息。
最后基于描述文件,识别所述数据文件中的不同实体以及所述实体之间的关系、各个所述实体的表征参数以及所述关系的表征参数。
S320:将每一个所述实体作为所述属性图模型中的一个节点,基于两个所述实体中第一实体与第二实体之间的关系确定从与所述第一实体对应的第一节点指向与所述第二实体对应的第二节点的边。
S330:将实体的表征参数作为与所述实体对应的所述节点的属性,将关系的表征参数作为与所述关系对应的所述边的属性。
具体的,基于描述信息文件,进行属性图模式建模,定义节点、边和属性。其中:
a. 节点:
每个描述信息文件抽象为一个点,包含唯一标识作为节点标识。每个点具有多个节点属性,节点属性定义为key-value形式,其中key是属性名称,value是属性值,属性名称来自描述文件中包含的数据项,属性值来自描述文件中的内容。
例如,场景节点可以具有节点属性:"name": "夜间场景","location": "北京"。
b. 边:
1.帧节点与传感器数据之间的包含关系定义为边,可以包含多种边属性,边属性定义为key-value形式。
2.帧节点与场景之间的属于关系定义为边,用于将帧节点归属到某个场景,可以包含多种边属性,边属性定义为key-value形式。
3.帧节点与设备数据之间的包含关系定义为边,可以包含多种边属性,边属性定义为key-value形式。
4.帧节点与标注数据之间的包含关系定义为边,可以包含多种边属性,边属性定义为key-value形式。
5.传感器数据与传感器信息之间的属于关系定义为边,用于将传感器数据关联到对应的传感器信息,可以包含多种边属性,边属性定义为key-value形式。
c. 属性:
每个节点属性和边属性都定义为key-value形式,其中key是属性名称,value是属性值。
图4是根据本公开的一些实施例所示的一种自动驾驶数据的属性图模型建立装置的示意图。如图4所示,所述属性图模型建立装置400包括识别模块410、第一确定模块420、第二确定模块430。所述属性图模型建立功能可以由图1所示系统中的管理服务器执行。其中:
识别模块410,用于获取自动驾驶领域数据集,识别所述数据集中的不同实体以及所述实体之间的关系、各个所述实体的表征参数以及所述关系的表征参数;
第一确定模块420,用于将每一个所述实体作为所述属性图模型中的一个节点,基于两个所述实体中第一实体与第二实体之间的关系确定从与所述第一实体对应的第一节点指向与所述第二实体对应的第二节点的边;
第二确定模块430,用于将实体的表征参数作为与所述实体对应的所述节点的属性,将关系的表征参数作为与所述关系对应的所述边的属性。
图5是根据本公开的一些实施例所示的一种自动驾驶数据的数据管理方法的流程图。在一些实施例中,所述数据管理方法由图1所示系统中的管理服务器执行,所述方法包括以下步骤:
S510:获取自动驾驶数据,将所述自动驾驶数据导入属性图模型存储,其中所述属性图模型根据图3所述方法建立。
导入(Import)指的是将外部数据引入数据库系统中。通常情况下,导入操作用于将来自不同来源的数据加载到数据库中,例如从文件、其他数据库或数据源中获取数据,并将其转换为数据库可接受的格式。导入操作可以是一次性的,也可以是定期进行的数据更新操作。
存储(Storage)指的是将数据持久地保存在数据库中以供后续访问和处理。在数据库中,数据以表、行和列的形式进行组织和存储。存储操作将已导入的数据按照预定义的结构和格式存储到数据库表中,并确保数据的完整性和一致性。存储操作还包括对数据进行索引、分区等优化,以提高数据的检索和查询效率。
因此,导入是将外部数据引入数据库系统的过程,而存储是将已导入的数据持久地保存在数据库中的过程。导入操作通常是存储操作的一部分,通过导入数据,才能实现存储和管理数据的目的。
具体的,首先将描述信息文件按建模后的属性图模型导入至图数据库中, 再基于描述信息文件确定待导入的节点、边和属性。
a. 确定待导入的节点:
1.遍历描述信息文件,提取每个文件的唯一标识作为节点标识,例如使用文件名或其他唯一标识符。
2.创建对应的节点,并设置唯一标识作为节点的标识符。
3.为每个节点添加节点属性,将描述信息文件中的属性转化为节点属性,其中key是属性名称,value是属性值。
b. 确定待导入的边:
1.根据数据之间的关系定义,确定待导入的边。
2.对于每个边,找到它们的起始节点和目标节点,并创建边来连接这两个节点。
3.为每个边添加边属性,将描述信息文件中的属性转化为边属性,其中key是属性名称,value是属性值。
c. 导入过程:
1.创建一个空的属性图数据库。
2.依次将所有节点和边添加到属性图中,以构建数据模型。
3.确保节点和边的唯一性,即同样的节点和边只能被添加一次。
4.在添加节点和边的同时,也添加节点属性和边属性。
本公开通过将海量的多模态数据建模为属性图的形式,可以更好地表达数据之间的关联和依赖关系。基于属性图模式的自动驾驶数据存储方案可以消除不同数据源和类型之间的差异性,使得数据的存储方式更加统一。对于不同类型的数据,如摄像头数据、激光雷达数据、地图数据等,可以使用属性图模式将它们抽象为节点和边,并给予相应的属性。这样一来,无论数据是来自公开数据集、车辆或路测设备采集,还是通过仿真系统获取,都可以按照相同的方式进行建模和存储,保证了数据的一致性。
S520:当所述自动驾驶数据更新时,基于所述更新对所述属性图模型执行目标操作,其中,所述目标操作至少包括增加、删除、修改。
具体的,当数据发生变更时,描述文件进行相应变更,使用脚本文件基于描述文件的变更对图数据库数据进行增加、删除、修改。
S530:确定查询需求,基于所述属性图模型完成所述查询需求。
针对自动驾驶数据,实际的数据应用中,需要对数据进行各类的查询,如数据标注任务中,需要通过一定的规则筛选出用于标注的关键帧数据; 在感知任务训练中,需要筛选出包含某一特定类型的数据等。因此,在对自动驾驶多模态数据进行属性图模式设计时,需要从其查询需求入手,设计合理的数据模式。自动驾驶多模态数据的常见查询包括两个方面,即时间维度的查询与空间维度的查询。时间查询主要查询满足特定时间条件的数据,而空间查询需要跨越多个实体之间的关联来查询符合特定条件的数据。自动驾驶常用查询用例和类别如表一所述。
a. 时间查询:
在属性图模式中,可以使用时间戳作为节点和边的属性之一,用于标识数据的时间信息;通过基于时间戳的索引或排序,可以快速筛选出符合特定时间范围的节点和边。
时间查询可以支持自动驾驶系统中的各种需求,如检索特定时间段内的传感器数据或帧数据,进行时序分析等。
b. 空间查询:
在属性图模式中,可以使用位置坐标或区域信息作为节点和边的属性之一,用于标识数据的空间信息。可以使用空间索引或空间分区技术,在属性图中快速定位符合指定空间条件的节点和边。
空间查询可以满足自动驾驶系统中与地理位置相关的查询需求,例如查找特定区域内的场景数据、检索某个位置附近的设备信息等。
表一: 自动驾驶常用查询用例和类别。
综上,本公开基于属性图模式统一不同的数据管理和查询方式。属性图模式通常使用图数据库或图计算引擎来存储和管理属性图数据,这些工具提供了一致的数据访问接口和查询语言,适用于不同数据类型和规模的情况。无论是进行数据的增删改查操作,还是进行复杂的图遍历和分析,都可以使用统一的方式进行处理,简化了数据管理和查询的过程。
图6是根据本公开的一些实施例所示的一种自动驾驶数据的数据管理装置的示意图。如图6所示,所述数据管理装置600包括导入模块610、操作模块620、查询模块630。所述数据管理功能可以由图1所示系统中的管理服务器执行。其中:
导入模块610,用于获取自动驾驶数据,将所述自动驾驶数据导入属性图模型存储,其中所述属性图模型根据图3所述方法建立;
操作模块620,用于当所述自动驾驶数据更新时,基于所述更新对所述属性图模型执行目标操作,其中,所述目标操作至少包括增加、删除、修改;
查询模块630,用于确定查询需求,基于所述属性图模型完成所述查询需求。
综上所述,本公开各实施例提供的自动驾驶数据的属性图模型建立方法、装置,自动驾驶数据的数据管理方法、装置,通过将海量的多模态数据建模为属性图的形式,可以更好地表达数据之间的关联和依赖关系。基于属性图模式的自动驾驶数据存储和查询方案首先可以消除不同数据源和类型之间的差异性,使得数据的存储和查询方式更加统一。对于不同类型的数据,如摄像头数据、激光雷达数据、地图数据等,可以使用属性图模式将它们抽象为节点和边,并给予相应的属性。这样一来,无论数据是来自公开数据集、车辆或路测设备采集,还是通过仿真系统获取,都可以按照相同的方式进行建模和存储,保证了数据的一致性。其次,属性图模式还可以统一不同的数据存储和查询方式。属性图模式通常使用图数据库或图计算引擎来存储和管理属性图数据,这些工具提供了一致的数据访问接口和查询语言,适用于不同数据类型和规模的情况。无论是进行数据的增删改查操作,还是进行复杂的图遍历和分析,都可以使用统一的方式进行处理,简化了数据存储和查询的过程。因此,基于属性图模式的自动驾驶数据建模和存储、查询技术方案可以有效地管理海量多模态数据,实现不同数据的存储查询方式的统一建模,为自动驾驶研发提供了更加统一、高效的数据管理方案。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的设备和模块的具体工作过程,可以参考前述装置实施例中的对应描述,在此不再赘述。
尽管此处所述的主题是在结合操作系统和应用程序在计算机系统上的执行而执行的一般上下文中提供的,但本领域技术人员可以认识到,还可结合其他类型的程序模块来执行其他实现。一般而言,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、组件、数据结构和其他类型的结构。本领域技术人员可以理解,此处所述的本主题可以使用其他计算机系统配置来实践,包括手持式设备、多处理器系统、基于微处理器或可编程消费电子产品、小型计算机、大型计算机等,也可使用在其中任务由通过通信网络连接的远程处理设备执行的分布式计算环境中。在分布式计算环境中,程序模块可位于本地和远程存储器存储设备的两者中。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及方法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本公开的范围。
应当理解的是,本公开的上述具体实施方式仅仅用于示例性说明或解释本公开的原理,而不构成对本公开的限制。因此,在不偏离本公开的精神和范围的情况下所做的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。此外,本公开所附权利要求旨在涵盖落入所附权利要求范围和边界、或者这种范围和边界的等同形式内的全部变化和修改例。
Claims (10)
1.一种自动驾驶数据的属性图模型建立方法,其特征在于,包括:
获取自动驾驶领域数据集,识别所述数据集中的不同实体以及所述实体之间的关系、各个所述实体的表征参数以及所述关系的表征参数;
将每一个所述实体作为所述属性图模型中的一个节点,基于两个所述实体中第一实体与第二实体之间的关系确定从与所述第一实体对应的第一节点指向与所述第二实体对应的第二节点的边;
将实体的表征参数作为与所述实体对应的所述节点的属性,将关系的表征参数作为与所述关系对应的所述边的属性。
2.根据权利要求1所述的方法,其特征在于,所述识别所述数据集中的不同实体以及所述实体之间的关系、各个所述实体的表征参数以及所述关系的表征参数包括:
基于所述数据集的描述信息识别所述数据集中的不同实体以及所述实体之间的关系、各个所述实体的表征参数以及所述关系的表征参数。
3.根据权利要求2所述方法,在获取自动驾驶领域数据集之前,还包括:
获取自动驾驶领域和/或车路协同领域公共数据集,其中所述数据集包含预设要求的描述信息,所述描述信息包含数据来源实体信息、所述实体之间的关系信息和对所述实体和/或所述关系进行表征的参数信息;和/或
分别采集车辆在驾驶过程中形成的车侧数据和路侧设备在运行过程中形成的路侧数据,对所述数据分别添加预设标签形成数据集,按预设要求对所述数据集添加描述信息;和/或
采集自动驾驶场景仿真系统生成的数据,并对所述数据添加预设标签形成数据集,按预设要求对所述数据集添加描述信息。
4.根据权利要求3所述方法,所述按预设要求对所述数据集添加描述信息包括:
对所述数据集中的每种数据按预设方法生成标识所述数据来源实体的唯一标识;
基于所述唯一标识识别所述数据集中的不同实体并识别所述实体之间的关系、表征所述实体和所述关系的参数,基于所述实体、所述实体之间的关系、表征所述实体和所述关系的参数按预设要求生成描述信息。
5.一种自动驾驶数据的数据管理方法,其特征在于,包括:
获取自动驾驶数据,将所述自动驾驶数据导入属性图模型存储,其中所述属性图模型根据权利要求1所述方法建立;
当所述自动驾驶数据更新时,基于所述更新对所述属性图模型执行目标操作,其中,所述目标操作至少包括增加、删除、修改;
确定查询需求,基于所述属性图模型完成所述查询需求。
6.根据权利要求5所述的方法,其特征在于,所述将所述自动驾驶数据导入属性图模型存储包括:
识别所述数据集包含的实体、实体之间的关系、表征所述实体和所述关系的参数;
基于所述实体在所述属性图模型中确定待导入节点,基于所述实体之间的关系在所述属性图模型中确定待导入边,基于表征所述实体的参数确定所述待导入节点中的对应属性,基于表征所述关系的参数确定所述待导入边中的对应属性;
将所述参数作为键,所述自动驾驶数据中所述参数的参数值作为键值,将键-键值对存储入所述属性。
7.根据权利要求6所述的方法,其特征在于,所述识别所述数据集包含的实体包括:
基于所述数据集中的每种数据的唯一标识识别所述数据来源实体。
8.根据权利要求5所述的方法,其特征在于,所述基于所述属性图模型完成所述查询需求包括:
基于对所述属性图模型中时间属性的索引或排序筛选出符合特定时间范围的节点和边以完成时间查询,其中,所述节点和所述边包含时间属性;和/或
使用空间索引或空间分区技术,在所述属性图模型中定位符合指定空间条件的节点和边以完成空间查询,其中,所述节点和所述边包含位置属性。
9.一种自动驾驶数据的属性图模型建立装置,其特征在于,包括:
识别模块,用于获取自动驾驶领域数据集,识别所述数据集中的不同实体以及所述实体之间的关系、各个所述实体的表征参数以及所述关系的表征参数;
第一确定模块,用于将每一个所述实体作为所述属性图模型中的一个节点,基于两个所述实体中第一实体与第二实体之间的关系确定从与所述第一实体对应的第一节点指向与所述第二实体对应的第二节点的边;
第二确定模块,用于将实体的表征参数作为与所述实体对应的所述节点的属性,将关系的表征参数作为与所述关系对应的所述边的属性。
10.一种自动驾驶数据的数据管理装置,其特征在于,包括:
导入模块,用于获取自动驾驶数据,将所述自动驾驶数据导入属性图模型存储,其中所述属性图模型根据权利要求1所述方法建立;
操作模块,用于当所述自动驾驶数据更新时,基于所述更新对所述属性图模型执行目标操作,其中,所述目标操作至少包括增加、删除、修改;
查询模块,用于确定查询需求,基于所述属性图模型完成所述查询需求。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311412720.4A CN117150090A (zh) | 2023-10-30 | 2023-10-30 | 自动驾驶数据的属性图模型建立和数据管理方法、装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311412720.4A CN117150090A (zh) | 2023-10-30 | 2023-10-30 | 自动驾驶数据的属性图模型建立和数据管理方法、装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117150090A true CN117150090A (zh) | 2023-12-01 |
Family
ID=88908443
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311412720.4A Pending CN117150090A (zh) | 2023-10-30 | 2023-10-30 | 自动驾驶数据的属性图模型建立和数据管理方法、装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117150090A (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200133472A1 (en) * | 2018-10-30 | 2020-04-30 | Johnson Controls Technology Company | System and methods for entity visualization and management with an entity node editor |
CN113094449A (zh) * | 2021-04-09 | 2021-07-09 | 天津大学 | 基于分布式键值库的大规模知识图谱存储方案 |
CN114818707A (zh) * | 2022-03-02 | 2022-07-29 | 北京航空航天大学 | 一种基于知识图谱的自动驾驶决策方法和系统 |
CN115129886A (zh) * | 2022-06-10 | 2022-09-30 | 中国第一汽车股份有限公司 | 驾驶场景的识别方法、装置及车辆 |
US20220342932A1 (en) * | 2021-04-21 | 2022-10-27 | Neo4J Sweden Ab | Tool to build and store a data model and queries for a graph database |
CN115878681A (zh) * | 2023-02-23 | 2023-03-31 | 禾多科技(北京)有限公司 | 自动驾驶数据的获取方法及装置、存储介质及电子装置 |
CN116383410A (zh) * | 2023-04-17 | 2023-07-04 | 高德软件有限公司 | 灯路关系知识图谱构建、关系预测、自动驾驶方法 |
-
2023
- 2023-10-30 CN CN202311412720.4A patent/CN117150090A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200133472A1 (en) * | 2018-10-30 | 2020-04-30 | Johnson Controls Technology Company | System and methods for entity visualization and management with an entity node editor |
CN113094449A (zh) * | 2021-04-09 | 2021-07-09 | 天津大学 | 基于分布式键值库的大规模知识图谱存储方案 |
US20220342932A1 (en) * | 2021-04-21 | 2022-10-27 | Neo4J Sweden Ab | Tool to build and store a data model and queries for a graph database |
CN114818707A (zh) * | 2022-03-02 | 2022-07-29 | 北京航空航天大学 | 一种基于知识图谱的自动驾驶决策方法和系统 |
CN115129886A (zh) * | 2022-06-10 | 2022-09-30 | 中国第一汽车股份有限公司 | 驾驶场景的识别方法、装置及车辆 |
CN115878681A (zh) * | 2023-02-23 | 2023-03-31 | 禾多科技(北京)有限公司 | 自动驾驶数据的获取方法及装置、存储介质及电子装置 |
CN116383410A (zh) * | 2023-04-17 | 2023-07-04 | 高德软件有限公司 | 灯路关系知识图谱构建、关系预测、自动驾驶方法 |
Non-Patent Citations (2)
Title |
---|
张怀涛等: "河南省高校图书馆数字化建设研究", 31 March 2003, pages: 101 - 102 * |
龚磊等: "嵌入路网图模型的自动驾驶场景描述语言", 软件学报, vol. 34, no. 9, pages 3981 - 4002 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102915346B (zh) | 面向物联网智能感知的数据索引建立与查询方法 | |
US10740396B2 (en) | Representing enterprise data in a knowledge graph | |
EP2339481A1 (en) | Enablement of three-dimensional hosting, indexing, analysing and querying structure for spatial systems | |
CN113434623B (zh) | 一种基于多源异构空间规划数据的融合方法 | |
US20230244702A1 (en) | Automated geospatial data analysis | |
US7668888B2 (en) | Converting object structures for search engines | |
CN110309264A (zh) | 基于知识图谱获取地理产品数据的方法和装置 | |
CN105612513A (zh) | 图像检索方法、图像检索系统以及信息记录介质 | |
CN113254630B (zh) | 一种面向全球综合观测成果的领域知识图谱推荐方法 | |
CN104750776A (zh) | 使用元数据访问数据库平台中的信息内容 | |
Zhu et al. | Data integration to create large-scale spatially detailed synthetic populations | |
US10628421B2 (en) | Managing a single database management system | |
Schulz et al. | Image-documentation of existing buildings using a serverbased bim collaboration format workflow | |
CN109688223A (zh) | 生态环境数据资源共享方法及装置 | |
Glake et al. | Data management in multi-agent simulation systems | |
JP4251101B2 (ja) | 画像情報処理システム | |
CN117150090A (zh) | 自动驾驶数据的属性图模型建立和数据管理方法、装置 | |
CN113032504A (zh) | 村镇社区公共服务时空数据汇聚方法及装置 | |
Curdt et al. | Development of a metadata management system for an interdisciplinary research project | |
CN110781430A (zh) | 互联网新型虚拟数据中心系统及其构造方法 | |
Ladra et al. | A toponym resolution service following the OGC WPS standard | |
CN111382165A (zh) | 一种移动国土管理系统 | |
Li et al. | Optimized conflation of authoritative and crowd-sourced geographic data: creating an integrated bike map | |
CN114490569B (zh) | 地块历史数据追溯方法、装置、设备及存储介质 | |
Rustad et al. | Exposing Military Sensor Data using SpatioTemporal Asset Catalog (STAC) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |