CN107767486A - 一种基于视频格式的端到端自动驾驶数据的存储方法及装置 - Google Patents

一种基于视频格式的端到端自动驾驶数据的存储方法及装置 Download PDF

Info

Publication number
CN107767486A
CN107767486A CN201710792055.4A CN201710792055A CN107767486A CN 107767486 A CN107767486 A CN 107767486A CN 201710792055 A CN201710792055 A CN 201710792055A CN 107767486 A CN107767486 A CN 107767486A
Authority
CN
China
Prior art keywords
data
video
attitude data
attitude
storage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710792055.4A
Other languages
English (en)
Inventor
闫泳杉
郁浩
郑超
唐坤
张云飞
姜雨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201710792055.4A priority Critical patent/CN107767486A/zh
Publication of CN107767486A publication Critical patent/CN107767486A/zh
Priority to PCT/CN2018/099391 priority patent/WO2019047663A1/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07CTIME OR ATTENDANCE REGISTERS; REGISTERING OR INDICATING THE WORKING OF MACHINES; GENERATING RANDOM NUMBERS; VOTING OR LOTTERY APPARATUS; ARRANGEMENTS, SYSTEMS OR APPARATUS FOR CHECKING NOT PROVIDED FOR ELSEWHERE
    • G07C5/00Registering or indicating the working of vehicles
    • G07C5/08Registering or indicating performance data other than driving, working, idle, or waiting time, with or without registering driving, working, idle or waiting time
    • G07C5/0841Registering performance data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/172Caching, prefetching or hoarding of files
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/174Redundancy elimination performed by the file system
    • G06F16/1744Redundancy elimination performed by the file system using compression, e.g. sparse files
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/71Indexing; Data structures therefor; Storage structures

Abstract

本发明提出了一种基于视频格式的端到端自动驾驶数据的存储方法及装置,其中的方法包括:确定视频压缩参数并读取姿态数据;根据所述姿态数据的时间戳顺序读取图像数据;使用所述视频压缩参数将所述视频文件按照所述自动驾驶系统输出的姿态数据的类型存储在预定服务器上将所述图像数据存储为视频文件。本发明通过将读取的姿态数据按照时间戳的顺序存储为图像数据并存储为视频文件,从而能够减少数据占用的存储空间,并且还能够减少网络I/O的访问量,以建立更好的自动驾驶数据模型,进而提高的深度学习在自动驾驶领域的学习效率。

Description

一种基于视频格式的端到端自动驾驶数据的存储方法及装置
技术领域
本发明涉及计算机领域,尤其涉及一种基于视频格式的端到端自动驾驶数据的存储方法及装置。
背景技术
随着深度学习的迅速发展以及人工智能的深入研究,汽车工业发生了革命性的变化,通过端到端的深度学习实现自动驾驶便是自动驾驶领域的一个主要研究方向。在现有技术中,自动驾驶系统通常采用通过前方实时采集的图像、输出转向角和速度等数据建立的模型进行深度学习。采集的数据越多,则生成的模型越有利于深度学习。但这些数据通常需要存储在特定的文件中,需要占用较大的存储空间,从而限制了深度学习在自动驾驶领域的发展。
发明内容
本发明解决的技术问题之一是自动驾驶系统前方采集的数据需要占用较大的存储空间。
根据本发明一方面的一个实施例,提供了一种基于视频格式的端到端自动驾驶数据的存储方法,包括:
确定视频压缩参数并读取姿态数据;
根据所述姿态数据的时间戳顺序读取图像数据;
使用所述视频压缩参数将所述图像数据存储为视频文件。
根据本发明另一方面的一个实施例,提供了一种基于视频格式的端到端自动驾驶数据的存储装置,包括:
用于确定视频压缩参数并读取姿态数据的装置;
用于根据所述姿态数据的时间戳顺序读取图像数据的装置;
用于使用所述视频压缩参数将所述图像数据存储为视频文件的装置。
由于本实施例通过将读取的姿态数据按照时间戳的顺序存储为图像数据并存储为视频文件,从而能够减少数据占用的存储空间,并且还能够减少网络I/O的访问量,以建立更好的自动驾驶数据模型,进而提高的深度学习在自动驾驶领域的学习效率。
本领域普通技术人员将了解,虽然下面的详细说明将参考图示实施例、附图进行,但本发明并不仅限于这些实施例。而是,本发明的范围是广泛的,且意在仅通过后附的权利要求限定本发明的范围。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1示出了根据本发明一实施例中的基于视频格式的端到端自动驾驶数据的存储方法的流程图。
图2示出了本发明的实施例一提出的基于视频格式的端到端自动驾驶数据的存储方法的流程图。
图3示出了本发明的实施例二提出的基于视频格式的端到端自动驾驶数据的存储方法的流程图。
图4示出了根据本发明一实施例中的基于视频格式的端到端自动驾驶数据的存储装置的框图。
图5示出了本发明的实施例三提出的基于视频格式的端到端自动驾驶数据的存储装置的框图。
图6示出了本发明的实施例四提出的基于视频格式的端到端自动驾驶数据的存储装置的框图。
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
在上下文中所称“计算机设备”,也称为“电脑”,是指可以通过运行预定程序或指令来执行数值计算和/或逻辑计算等预定处理过程的智能电子设备,其可以包括处理器与存储器,由处理器执行在存储器中预存的存续指令来执行预定处理过程,或是由ASIC、FPGA、DSP等硬件执行预定处理过程,或是由上述二者组合来实现。计算机设备包括但不限于服务器、个人电脑、笔记本电脑、平板电脑、智能手机等。
所述计算机设备包括用户设备与网络设备。其中,所述用户设备包括但不限于电脑、智能手机、PDA等;所述网络设备包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(Cloud Computing)的由大量计算机或网络服务器构成的云,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。其中,所述计算机设备可单独运行来实现本发明,也可接入网络并通过与网络中的其他计算机设备的交互操作来实现本发明。其中,所述计算机设备所处的网络包括但不限于互联网、广域网、城域网、局域网、VPN网络等。
需要说明的是,所述用户设备、网络设备和网络等仅为举例,其他现有的或今后可能出现的计算机设备或网络如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
后面所讨论的方法(其中一些通过流程图示出)可以通过硬件、软件、固件、中间件、微代码、硬件描述语言或者其任意组合来实施。当用软件、固件、中间件或微代码来实施时,用以实施必要任务的程序代码或代码段可以被存储在机器或计算机可读介质(比如存储介质)中。(一个或多个)处理器可以实施必要的任务。
这里所公开的具体结构和功能细节仅仅是代表性的,并且是用于描述本发明的示例性实施例的目的。但是本发明可以通过许多替换形式来具体实现,并且不应当被解释成仅仅受限于这里所阐述的实施例。
应当理解的是,虽然在这里可能使用了术语“第一”、“第二”等等来描述各个单元,但是这些单元不应当受这些术语限制。使用这些术语仅仅是为了将一个单元与另一个单元进行区分。举例来说,在不背离示例性实施例的范围的情况下,第一单元可以被称为第二单元,并且类似地第二单元可以被称为第一单元。这里所使用的术语“和/或”包括其中一个或更多所列出的相关联项目的任意和所有组合。
应当理解的是,当一个单元被称为“连接”或“耦合”到另一单元时,其可以直接连接或耦合到所述另一单元,或者可以存在中间单元。与此相对,当一个单元被称为“直接连接”或“直接耦合”到另一单元时,则不存在中间单元。应当按照类似的方式来解释被用于描述单元之间的关系的其他词语(例如“处于...之间”相比于“直接处于...之间”,“与...邻近”相比于“与...直接邻近”等等)。
这里所使用的术语仅仅是为了描述具体实施例而不意图限制示例性实施例。除非上下文明确地另有所指,否则这里所使用的单数形式“一个”、“一项”还意图包括复数。还应当理解的是,这里所使用的术语“包括”和/或“包含”规定所陈述的特征、整数、步骤、操作、单元和/或组件的存在,而不排除存在或添加一个或更多其他特征、整数、步骤、操作、单元、组件和/或其组合。
还应当提到的是,在一些替换实现方式中,所提到的功能/动作可以按照不同于附图中标示的顺序发生。举例来说,取决于所涉及的功能/动作,相继示出的两幅图实际上可以基本上同时执行或者有时可以按照相反的顺序来执行。
下面结合附图对本发明作进一步详细描述。
图1是根据本发明一个实施例的基于视频格式的端到端自动驾驶数据的存储方法的流程图。
结合图1中所示,本实施例所述的基于视频格式的端到端自动驾驶数据的存储方法包括如下步骤:
S110、确定视频压缩参数并读取姿态数据;
S120、根据所述姿态数据的时间戳顺序读取图像数据;
S130、使用所述视频压缩参数将所述图像数据存储为视频文件。
下面对各步骤做进一步详细介绍。
步骤S110中,首先确定视频压缩参数。在本实施例中可通过压缩参数对测试数据进行压缩测试,然后根据该压缩测试的压缩率确定为视频压缩参数。其中的压缩参数包括但不限于采用编解码器、帧间分配码率(crf)或颜色空间中的至少一种。
在确定视频压缩参数后,再读取姿态数据。在本实施例中可实时读取预定自动驾驶系统输出的姿态数据,并将该姿态数据存储为带有时间戳的数据序列。
步骤S120中,在读取姿态数据之后,再根据姿态数据的时间戳顺序读取图像数据。在本实施例中可按照该姿态数据的时间戳的顺序读取图像数据,并将该图像数据按照时间戳的顺序存储为图像数据序列。
步骤S130中,可使用上述的视频压缩参数将读取的图像数据存储为视频文件。在本实施例中可通过预定视频格式将该图像数据压缩存储为视频文件,该视频文件的每一帧对应为该图像数据中的一幅图像。
可选的,本实施例还将该视频文件按照自动驾驶系统输出的姿态数据的类型存储在预定服务器上。该姿态数据的类型包括但不限于速度数据、转向角数据、路网数据等。
采用本实施例提出的技术方案,通过将读取的姿态数据按照时间戳的顺序存储为图像数据并存储为视频文件,从而能够减少数据占用的存储空间,并且还能够减少网络I/O的访问量,以建立更好的自动驾驶数据模型,进而提高的深度学习在自动驾驶领域的学习效率。
实施例一
在本领域的现有技术中,通过将传感器采集的图像存储在HDF5文件中的方式供机器学习和控制软件使用。该方法会导致存储图像的HDF5文件过于庞大,并且会明显增加网络I/O的开销,所以传统的数据采集方法不利于自动驾驶系统的深度学习。
因此,本实施例提出了又一种基于视频格式的端到端自动驾驶数据的存储方法,结合图2中所示,包括如下步骤:
S210、确定视频压缩参数。
在选取压缩参数时,可以考虑自动驾驶系统所处的环境。例如在人烟稀少的高速公路上行驶时,由于路两侧的风景变化较少,则可采用颜色空间作为压缩参数,针对雪地、沙漠、森林等地区的颜色特点,将多幅图像数据中的相同颜色进行统一压缩,而只对路面的变化情况进行单独存储。
又如,在市区中行驶时,可采用帧间分配码率作为压缩参数。通过帧间分配码率能够分析哪些是重要帧,哪些是次要帧,重要帧会得到更多的字节。例如将图像中不动的物体或距离较远的移动的物体设置为次要帧,只有当距离小于阈值的移动物体才会以重要帧的形式出现在压缩参数中。这样既能够给出一种比较清晰的感觉,又能显著减小视频文件的体积,因为通常情况下人眼只会关注移动的物体,而不会去辨认背景。
S220、读取姿态数据。
自动驾驶系统会在每隔预定时间输出一组姿态数据,该姿态数据通常包括图像数据、速度数据、转向角数据以及路网数据等。本实施例主要读取其中的图像数据。
S230、按照姿态数据的时间戳的顺序读取图像数据。
自动驾驶系统输出的姿态数据都带有时间戳,该时间戳可用于表示姿态数据产生的顺序,按照时间顺序将图像数据存储能够更准确的表征该自动驾驶系统采集的图像。
因此本实施例将所有的姿态数据按照时间戳的顺序读取图像数据,以保证姿态数据与图像数据的时间戳一致。读取预定数量的图像数据后将这些图像数据存储为数据序列,以供后续步骤调用。
S240、以预定格式将该图像数据生成视频文件。
本实施例采用FFmpeg格式生成视频文件。FFmpeg可用于记录、转换数字音频、视频,并能将这些内容转化为流。FFmpeg不仅能够实现将多幅图像数据压缩生成视频文件,而且能够实现多种视频格式之间的相互转换。另外,对于选定的视频,还能够截取指定时间的缩略图以及获取静态图和动态图。
根据不同的压缩参数,每次选取用于生成视频文件的图像数据的数量也不相同。当采用颜色空间作为压缩参数时,可选择每次将1万张图像压缩生成24帧/秒的视频文件,该视频文件的长度为7分钟,占用空间一般为20-50M,原始图像占用的存储空间约为1G左右,压缩后的视频文件不仅占用存储空间较小,而且网络I/O开销也较低。
在本实施例中,将自动驾驶系统输出的姿态数据按照预定压缩参数和视频格式压缩存储为视频文件,能够显著减小姿态数据占用的存储空间,并且还能够保证存储的视频文件的清晰度和完整性,因此可以提高自动驾驶系统的深度学习效率。
实施例二
在本领域的现有技术中,通过将传感器采集的图像存储在HDF5文件中的方式供机器学习和控制软件使用。该方法会导致存储图像的HDF5文件过于庞大,并且会明显增加网络I/O的开销,图像存储还会导致存储的文件过多,不利于编辑和管理,所以传统的数据采集方法不利于自动驾驶系统的深度学习。
虽然可以通过压缩图像的方式减小占用的存储空间,但是当需要读取这些文件时,还需要额外的解压缩过程,难以提高深度学习的效率。因此,本实施例提出了一种基于视频格式的端到端自动驾驶数据的存储方法,结合图3中所示,包括如下步骤:
S310、确定视频压缩参数并读取姿态数据。
在确定视频压缩参数之前,可在测试数据上使用不同的参数,例如编解码器、帧间分配码率、颜色空间等进行测试,对比这些压缩参数的压缩情况及压缩后的图像清晰度。
在选取压缩参数时,可以考虑自动驾驶系统所处的环境。例如在市区中行驶时,由于公路两侧的建筑、行人、车辆等都很多而且颜色各异,但建筑物都是不动的,而且一部分行人和车辆也是不动的。因此可采用帧间分配码率作为压缩参数。通过帧间分配码率能够分析哪些是重要帧,哪些是次要帧。将图像中不动的物体或距离较远的移动的物体设置为次要帧,只有当距离小于阈值的移动物体才会以重要帧的形式出现在压缩参数中。这样压缩出的图像能够将移动的物体,即对自动驾驶有影像的物体进行突出显示,而其它不动的物体也不会占用较多的存储空间。相比之下,另外两种压缩参数的压缩效果要明显差一些,因此对于市区中的路况,本实施例优选的采用帧间分配码率作为压缩参数。
S320、根据姿态数据的时间戳顺序读取图像数据。
自动驾驶系统会在每隔预定时间输出一组姿态数据,并且每组姿态数据都带有时间戳,该时间戳可用于表示姿态数据产生的顺序,按照时间顺序将图像数据存储能够更准确的表征该自动驾驶系统采集的图像。
因此本实施例将所有的姿态数据按照时间戳的顺序读取图像数据,以保证姿态数据与图像数据的时间戳一致。读取预定数量的图像数据后将这些图像数据存储为数据序列,以供后续步骤调用。
S330、以预定格式将该图像数据生成视频文件。
本实施例采用AVC编码格式将图像数据生成视频文件,该视频文件的码率为208kbps,帧率为14fps,分辨率为448x 336。当采用帧间分配码率作为压缩参数时,将1万张图像压缩生成的视频文件的长度为12分钟,占用空间一般为40-70M,原始图像占用的存储空间约为1G左右,压缩后的视频文件不仅占用存储空间较小,而且网络I/O开销也较低。
S340、将视频文件所述自动驾驶系统输出的姿态数据的类型存储在预定服务器上。
该姿态数据的类型通常包括速度数据、转向角数据、路网数据等。因此本实施例将姿态数据分为两类进行存储,第一类为动态数据,包括速度数据、转向角数据、机动车数据等,第二来为静态数据,包括建筑物数据、实时路况数据、交通信号灯数据等。按照该分类存储的视频文件易于编辑和管理,能够提高深度学习的效率。
在本实施例中,将自动驾驶系统输出的姿态数据按照预定压缩参数和视频格式压缩存储为视频文件,能够显著减小姿态数据占用的存储空间,并且还能够保证存储的视频文件的清晰度和完整性,而且便于编辑和管理,避免额外的解压缩过程,因此可以提高自动驾驶系统的深度学习效率。
图4是根据本发明一个实施例的基于视频格式的端到端自动驾驶数据的存储装置的框图。
结合图4中所示,本实施例所述的基于视频格式的端到端自动驾驶数据的存储装置(以下简称“存储装置”),包括如下装置:
用于确定视频压缩参数并读取姿态数据的装置(以下简称“压缩读取装置”)410;
用于根据所述姿态数据的时间戳顺序读取图像数据的装置(以下简称“图像读取装置”)420;
用于使用所述视频压缩参数将所述图像数据存储为视频文件的装置(以下简称“视频生成装置”)430。
下面对各装置做进一步详细介绍。
首先通过压缩读取装置410确定视频压缩参数。在本实施例中可由压缩读取装置410通过压缩参数对测试数据进行压缩测试,然后根据该压缩测试的压缩率确定为视频压缩参数。其中的压缩参数包括但不限于采用编解码器、帧间分配码率(crf)或颜色空间中的至少一种。
在确定视频压缩参数后,再读取姿态数据。在本实施例中可通过压缩读取装置410实时读取预定自动驾驶系统输出的姿态数据,并将该姿态数据存储为带有时间戳的数据序列。
在读取姿态数据之后,再通过图像读取装置420根据姿态数据的时间戳顺序读取图像数据。在本实施例中可由图像读取装置420按照该姿态数据的时间戳的顺序读取图像数据,并将该图像数据按照时间戳的顺序存储为图像数据序列。
在读取图像数据之后,可通过视频生成装置430将读取的图像数据存储为视频文件。在本实施例中可由视频生成装置430通过预定视频格式将该图像数据压缩存储为视频文件,该视频文件的每一帧对应为该图像数据中的一幅图像。
可选的,本实施例还通过视频生成装置430将该视频文件按照自动驾驶系统输出的姿态数据的类型存储在预定服务器上。该姿态数据的类型包括但不限于速度数据、转向角数据、路网数据等。
采用本实施例提出的技术方案,通过将读取的姿态数据按照时间戳的顺序存储为图像数据并存储为视频文件,从而能够减少数据占用的存储空间,并且还能够减少网络I/O的访问量,以建立更好的自动驾驶数据模型,进而提高的深度学习在自动驾驶领域的学习效率。
实施例三
在本领域的现有技术中,通过将传感器采集的图像存储在HDF5文件中的方式供机器学习和控制软件使用。该方法会导致存储图像的HDF5文件过于庞大,并且会明显增加网络I/O的开销,所以传统的数据采集方法不利于自动驾驶系统的深度学习。
因此,本实施例提出了又一种基于视频格式的端到端自动驾驶数据的存储装置,结合图5中所示,包括如下装置:
用于确定视频压缩参数的装置(以下简称“压缩参数确定装置”)510;
用于读取姿态数据的装置(以下简称“姿态数据读取装置”)520;
用于按照姿态数据的时间戳的顺序读取图像数据的装置(以下简称“第一图像数据读取装置”)530;
用于以预定格式将该图像数据生成视频文件的装置(以下简称“第一视频文件生成装置”)540;
在选取压缩参数时,可以考虑自动驾驶系统所处的环境。例如在人烟稀少的高速公路上行驶时,由于路两侧的风景变化较少,则可采用颜色空间作为压缩参数,针对雪地、沙漠、森林等地区的颜色特点,通过压缩参数确定装置510将多幅图像数据中的相同颜色进行统一压缩,而只对路面的变化情况进行单独存储。
又如,在市区中行驶时,可采用帧间分配码率作为压缩参数。通过帧间分配码率能够分析哪些是重要帧,哪些是次要帧,重要帧会得到更多的字节。例如将图像中不动的物体或距离较远的移动的物体设置为次要帧,只有当距离小于阈值的移动物体才会以重要帧的形式出现在压缩参数中。这样既能够给出一种比较清晰的感觉,又能显著减小视频文件的体积,因为通常情况下人眼只会关注移动的物体,而不会去辨认背景。
自动驾驶系统会在每隔预定时间输出一组姿态数据,该姿态数据通常包括图像数据、速度数据、转向角数据以及路网数据等。本实施例主要通过姿态数据读取装置520读取其中的图像数据。
自动驾驶系统输出的姿态数据都带有时间戳,该时间戳可用于表示姿态数据产生的顺序,按照时间顺序将图像数据存储能够更准确的表征该自动驾驶系统采集的图像。
因此本实施例通过第一图像数据读取装置530将所有的姿态数据按照时间戳的顺序读取图像数据,以保证姿态数据与图像数据的时间戳一致。读取预定数量的图像数据后将这些图像数据存储为数据序列,以供后续步骤调用。
本实施例采用FFmpeg格式生成视频文件。FFmpeg可用于记录、转换数字音频、视频,并能将这些内容转化为流。FFmpeg不仅能够实现将多幅图像数据压缩生成视频文件,而且能够实现多种视频格式之间的相互转换。另外,对于选定的视频,还能够截取指定时间的缩略图以及获取静态图和动态图。
根据不同的压缩参数,每次选取用于生成视频文件的图像数据的数量也不相同。当采用颜色空间作为压缩参数时,可通过第一视频文件生成装置540选择每次将1万张图像压缩生成24帧/秒的视频文件,该视频文件的长度为7分钟,占用空间一般为20-50M,原始图像占用的存储空间约为1G左右,压缩后的视频文件不仅占用存储空间较小,而且网络I/O开销也较低。
在本实施例中,将自动驾驶系统输出的姿态数据按照预定压缩参数和视频格式压缩存储为视频文件,能够显著减小姿态数据占用的存储空间,并且还能够保证存储的视频文件的清晰度和完整性,因此可以提高自动驾驶系统的深度学习效率。
实施例四
在本领域的现有技术中,通过将传感器采集的图像存储在HDF5文件中的方式供机器学习和控制软件使用。该方法会导致存储图像的HDF5文件过于庞大,并且会明显增加网络I/O的开销,图像存储还会导致存储的文件过多,不利于编辑和管理,所以传统的数据采集方法不利于自动驾驶系统的深度学习。
虽然可以通过压缩图像的方式减小占用的存储空间,但是当需要读取这些文件时,还需要额外的解压缩过程,难以提高深度学习的效率。因此,本实施例提出了一种基于视频格式的端到端自动驾驶数据的存储装置,结合图6中所示,包括如下装置:
用于确定视频压缩参数并读取姿态数据的装置(以下简称“压缩及读取装置”)610;
用于根据姿态数据的时间戳顺序读取图像数据的装置(以下简称“第二图像数据读取装置”)620;
用于以预定格式将该图像数据生成视频文件的装置(以下简称“第二视频文件生成装置”)630;
用于将视频文件所述自动驾驶系统输出的姿态数据的类型存储在预定服务器上的装置(以下简称“分类存储装置”)640。
在确定视频压缩参数之前,可通过压缩及读取装置610在测试数据上使用不同的参数,例如编解码器、帧间分配码率、颜色空间等进行测试,对比这些压缩参数的压缩情况及压缩后的图像清晰度。
在选取压缩参数时,可以考虑自动驾驶系统所处的环境。例如在市区中行驶时,由于公路两侧的建筑、行人、车辆等都很多而且颜色各异,但建筑物都是不动的,而且一部分行人和车辆也是不动的。因此可采用帧间分配码率作为压缩参数。通过帧间分配码率能够分析哪些是重要帧,哪些是次要帧。将图像中不动的物体或距离较远的移动的物体设置为次要帧,只有当距离小于阈值的移动物体才会以重要帧的形式出现在压缩参数中。这样压缩出的图像能够将移动的物体,即对自动驾驶有影像的物体进行突出显示,而其它不动的物体也不会占用较多的存储空间。相比之下,另外两种压缩参数的压缩效果要明显差一些,因此对于市区中的路况,本实施例优选的采用帧间分配码率作为压缩参数。
自动驾驶系统会在每隔预定时间输出一组姿态数据,并且每组姿态数据都带有时间戳,该时间戳可用于表示姿态数据产生的顺序,按照时间顺序将图像数据存储能够更准确的表征该自动驾驶系统采集的图像。
因此本实施例通过第二图像数据读取装置620将所有的姿态数据按照时间戳的顺序读取图像数据,以保证姿态数据与图像数据的时间戳一致。读取预定数量的图像数据后将这些图像数据存储为数据序列,以供后续步骤调用。
本实施例通过第二视频文件生成装置630采用AVC编码格式将图像数据生成视频文件,该视频文件的码率为208kbps,帧率为14fps,分辨率为448x 336。当采用帧间分配码率作为压缩参数时,将1万张图像压缩生成的视频文件的长度为12分钟,占用空间一般为40-70M,原始图像占用的存储空间约为1G左右,压缩后的视频文件不仅占用存储空间较小,而且网络I/O开销也较低。
该姿态数据的类型通常包括速度数据、转向角数据、路网数据等。因此本实施例通过分类存储装置640将姿态数据分为两类进行存储,第一类为动态数据,包括速度数据、转向角数据、机动车数据等,第二来为静态数据,包括建筑物数据、实时路况数据、交通信号灯数据等。按照该分类存储的视频文件易于编辑和管理,能够提高深度学习的效率。
在本实施例中,将自动驾驶系统输出的姿态数据按照预定压缩参数和视频格式压缩存储为视频文件,能够显著减小姿态数据占用的存储空间,并且还能够保证存储的视频文件的清晰度和完整性,而且便于编辑和管理,避免额外的解压缩过程,因此可以提高自动驾驶系统的深度学习效率。
需要注意的是,本发明可在软件和/或软件与硬件的组合体中被实施,例如,本发明的各个装置可采用专用集成电路(ASIC)或任何其他类似硬件设备来实现。在一个实施例中,本发明的软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地,本发明的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中,例如,RAM存储器,磁或光驱动器或软磁盘及类似设备。另外,本发明的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个步骤或功能的电路。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
虽然前面特别示出并且描述了示例性实施例,但是本领域技术人员将会理解的是,在不背离权利要求书的精神和范围的情况下,在其形式和细节方面可以有所变化。这里所寻求的保护在所附权利要求书中做了阐述。

Claims (15)

1.一种基于视频格式的端到端自动驾驶数据的存储方法,包括:
确定视频压缩参数并读取姿态数据;
根据所述姿态数据的时间戳顺序读取图像数据;
使用所述视频压缩参数将所述图像数据存储为视频文件。
2.根据权利要求1所述的方法,确定视频压缩参数的步骤包括:
通过压缩参数对测试数据进行压缩测试,根据所述压缩测试的压缩率确定为所述视频压缩参数。
3.根据权利要求2所述的方法,所述压缩参数包括编解码器、帧间分配码率或颜色空间中的至少一种。
4.根据权利要求1所述的方法,读取姿态数据的步骤包括:
实时读取预定自动驾驶系统输出的姿态数据,并将所述姿态数据存储为带有时间戳的数据序列。
5.根据权利要求1所述的方法,根据所述姿态数据的时间戳顺序读取图像数据的步骤包括:
按照所述姿态数据的时间戳的顺序读取图像数据,并将所述图像数据按照所述时间戳的顺序存储为图像数据序列。
6.根据权利要求1所述的方法,使用所述视频压缩参数将所述图像数据存储为视频文件的步骤还包括:
使用所述视频压缩参数将所述视频文件按照所述自动驾驶系统输出的姿态数据的类型存储在预定服务器上。
7.一种基于视频格式的端到端自动驾驶数据的存储装置,包括:
用于确定视频压缩参数并读取姿态数据的装置;
用于根据所述姿态数据的时间戳顺序读取图像数据的装置;
用于使用所述视频压缩参数将所述图像数据存储为视频文件的装置。
8.根据权利要求7所述的装置,在所述用于确定视频压缩参数并读取姿态数据的装置中包括:
用于通过压缩参数对测试数据进行压缩测试,根据所述压缩测试的压缩率确定为所述视频压缩参数的装置。
9.根据权利要求8所述的装置,在所述用于确定视频压缩参数并读取姿态数据的装置中,所述压缩参数包括编解码器、帧间分配码率或颜色空间中的至少一种。
10.根据权利要求7所述的装置,在所述用于确定视频压缩参数并读取姿态数据的装置中还包括:
用于实时读取预定自动驾驶系统输出的姿态数据,并将所述姿态数据存储为带有时间戳的数据序列的装置。
11.根据权利要求7所述的装置,在所述用于根据所述姿态数据的时间戳顺序读取图像数据的装置中包括:
按照所述姿态数据的时间戳的顺序读取图像数据,并将所述图像数据按照所述时间戳的顺序存储为图像数据序列。
12.根据权利要求7所述的装置,在所述用于使用所述视频压缩参数将所述图像数据存储为视频文件的装置中包括:
用于使用所述视频压缩参数将所述视频文件按照所述自动驾驶系统输出的姿态数据的类型存储在预定服务器上的装置。
13.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机代码,当所述计算机代码被执行时,如权利要求1至6中任一项所述的方法被执行。
14.一种计算机程序产品,当所述计算机程序产品被计算机设备执行时,如权利要求1至6中任一项所述的方法被执行。
15.一种计算机设备,所述计算机设备包括:
一个或多个处理器;
存储器,用于存储一个或多个计算机程序;
当所述一个或多个计算机程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1至6中任一项所述的方法。
CN201710792055.4A 2017-09-05 2017-09-05 一种基于视频格式的端到端自动驾驶数据的存储方法及装置 Pending CN107767486A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201710792055.4A CN107767486A (zh) 2017-09-05 2017-09-05 一种基于视频格式的端到端自动驾驶数据的存储方法及装置
PCT/CN2018/099391 WO2019047663A1 (zh) 2017-09-05 2018-08-08 一种基于视频格式的端到端自动驾驶数据的存储方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710792055.4A CN107767486A (zh) 2017-09-05 2017-09-05 一种基于视频格式的端到端自动驾驶数据的存储方法及装置

Publications (1)

Publication Number Publication Date
CN107767486A true CN107767486A (zh) 2018-03-06

Family

ID=61265036

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710792055.4A Pending CN107767486A (zh) 2017-09-05 2017-09-05 一种基于视频格式的端到端自动驾驶数据的存储方法及装置

Country Status (2)

Country Link
CN (1) CN107767486A (zh)
WO (1) WO2019047663A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019047663A1 (zh) * 2017-09-05 2019-03-14 百度在线网络技术(北京)有限公司 一种基于视频格式的端到端自动驾驶数据的存储方法及装置
CN110033780A (zh) * 2019-04-07 2019-07-19 西安电子科技大学 基于FFmpeg和EMIF驱动的音视频数据传输方法
WO2020220198A1 (en) * 2019-04-29 2020-11-05 Baidu.Com Times Technology (Beijing) Co., Ltd. Timestamp and metadata processing for video compression in autonomous driving vehicles
CN114241622A (zh) * 2020-09-09 2022-03-25 丰田自动车株式会社 信息管理系统以及在该信息管理系统中使用的便携终端、图像管理服务器

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8126276B2 (en) * 2001-02-21 2012-02-28 International Business Machines Corporation Business method for selectable semantic codec pairs for very low data-rate video transmission
CN104284233A (zh) * 2009-10-19 2015-01-14 鹰图公司 视频和遥测数据的数据搜索、解析和同步
US20160173883A1 (en) * 2014-12-16 2016-06-16 Sean J. Lawrence Multi-focus image data compression
CN106060468A (zh) * 2016-06-23 2016-10-26 乐视控股(北京)有限公司 视频采集装置、视频传输系统和视频传输方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107767486A (zh) * 2017-09-05 2018-03-06 百度在线网络技术(北京)有限公司 一种基于视频格式的端到端自动驾驶数据的存储方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8126276B2 (en) * 2001-02-21 2012-02-28 International Business Machines Corporation Business method for selectable semantic codec pairs for very low data-rate video transmission
CN104284233A (zh) * 2009-10-19 2015-01-14 鹰图公司 视频和遥测数据的数据搜索、解析和同步
US20160173883A1 (en) * 2014-12-16 2016-06-16 Sean J. Lawrence Multi-focus image data compression
CN106060468A (zh) * 2016-06-23 2016-10-26 乐视控股(北京)有限公司 视频采集装置、视频传输系统和视频传输方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019047663A1 (zh) * 2017-09-05 2019-03-14 百度在线网络技术(北京)有限公司 一种基于视频格式的端到端自动驾驶数据的存储方法及装置
CN110033780A (zh) * 2019-04-07 2019-07-19 西安电子科技大学 基于FFmpeg和EMIF驱动的音视频数据传输方法
CN110033780B (zh) * 2019-04-07 2020-12-08 西安电子科技大学 基于FFmpeg和EMIF驱动的音视频数据传输方法
WO2020220198A1 (en) * 2019-04-29 2020-11-05 Baidu.Com Times Technology (Beijing) Co., Ltd. Timestamp and metadata processing for video compression in autonomous driving vehicles
CN114241622A (zh) * 2020-09-09 2022-03-25 丰田自动车株式会社 信息管理系统以及在该信息管理系统中使用的便携终端、图像管理服务器
CN114241622B (zh) * 2020-09-09 2024-01-16 丰田自动车株式会社 信息管理系统以及在该信息管理系统中使用的便携终端、图像管理服务器

Also Published As

Publication number Publication date
WO2019047663A1 (zh) 2019-03-14

Similar Documents

Publication Publication Date Title
CN107767486A (zh) 一种基于视频格式的端到端自动驾驶数据的存储方法及装置
CN110309458B (zh) 基于WebGL的BIM模型显示及渲染方法
CN100547616C (zh) 一种基于分级层次化深度网格的森林绘制方法
CN106354786A (zh) 一种可视分析方法及系统
CN109885626A (zh) 基于结构化数据和bim模型的城建数字档案智能管理系统
JP2009532710A (ja) データへのインデックス付けおよびデータ圧縮
CN103605506B (zh) 一种图形用户界面资源的显示方法及终端
CN107426631A (zh) 从源视频序列生成摘要视频序列
CN107809467A (zh) 一种云环境下容器镜像数据的删减方法
CN102843617A (zh) 一种实现全景视频动态热点的方法
CN107918646A (zh) 一种基于协议方式的三维模型数据处理方法及装置
CN113761609A (zh) 一种基于服务器端的云架构cad平台实时渲染系统及方法
CN104079926A (zh) 一种远程桌面软件的视频性能测试方法
Ji et al. Design and development of a maintenance and virtual training system for ancient Chinese architecture
CN113688839B (zh) 视频处理方法及装置、电子设备、计算机可读存储介质
CN106961567A (zh) 动画图像生成方法及装置
CN103065349B (zh) 一种数据渲染方法及装置
CN103093413B (zh) 一种遥感影像数据写入及读取的方法和装置
CN107783943A (zh) 一种端到端自动驾驶系统的纵向控制模型的评估方法及装置
CN106372260A (zh) 一种信息交互方法、装置及系统
CN107808360A (zh) 一种端到端自动驾驶系统的数据处理方法及装置
CN1666234B (zh) 拓扑图像模式
CN113379814B (zh) 一种三维空间关系判定方法及装置
CN106503174A (zh) 一种基于网络三维建模的场景可视化方法及系统
Chen et al. Ground material classification for UAV-based photogrammetric 3D data A 2D-3D Hybrid Approach

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180306