CN111626219B - 轨迹预测模型生成方法、装置、可读存储介质及电子设备 - Google Patents

轨迹预测模型生成方法、装置、可读存储介质及电子设备 Download PDF

Info

Publication number
CN111626219B
CN111626219B CN202010467478.0A CN202010467478A CN111626219B CN 111626219 B CN111626219 B CN 111626219B CN 202010467478 A CN202010467478 A CN 202010467478A CN 111626219 B CN111626219 B CN 111626219B
Authority
CN
China
Prior art keywords
sample image
loss
movable object
determining
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010467478.0A
Other languages
English (en)
Other versions
CN111626219A (zh
Inventor
范坤
陈迈越
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Horizon Robotics Science and Technology Co Ltd
Original Assignee
Shenzhen Horizon Robotics Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Horizon Robotics Science and Technology Co Ltd filed Critical Shenzhen Horizon Robotics Science and Technology Co Ltd
Priority to CN202010467478.0A priority Critical patent/CN111626219B/zh
Publication of CN111626219A publication Critical patent/CN111626219A/zh
Application granted granted Critical
Publication of CN111626219B publication Critical patent/CN111626219B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/56Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biomedical Technology (AREA)
  • Evolutionary Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本公开实施例公开了一种轨迹预测模型生成方法和装置,其中,该方法包括:获取样本图像序列,以及获取对样本图像序列中的目标可移动物体预先标注的移动轨迹信息;确定目标可移动物体在样本图像序列中的状态信息;基于状态信息,生成样本图像序列对应的损失权重;将样本图像序列作为预设的初始模型的输入,得到预测轨迹信息;根据预测轨迹信息及预先标注的移动轨迹信息,确定损失函数;利用损失权重对损失函数进行加权,得到损失值;根据损失值对初始模型进行训练,得到轨迹预测模型。本公开实施例有效地利用了可移动物体的状态,提高了训练得到的轨迹预测模型的预测精度,并且实现了使用较少的训练样本训练得到精度较高的模型。

Description

轨迹预测模型生成方法、装置、可读存储介质及电子设备
技术领域
本公开涉及计算机技术领域,尤其是一种轨迹预测模型生成方法、装置、可读存储介质及电子设备。
背景技术
目前的轨迹预测方法,大多采用深度神经网络模型为主要结构,它具有表达能力强、无需手动设计规则等显著优点。在训练深度神经网络时,需要大量的诸如车辆图像等作为训练样本。目前的训练方法,不考虑车辆的状态(例如静止、移动速度等状态),即直接使用样本图像训练。
发明内容
本公开的实施例提供了一种轨迹预测模型生成方法、装置、计算机可读存储介质及电子设备。
本公开的实施例提供了一种轨迹预测模型生成方法,该方法包括:获取样本图像序列,以及获取对样本图像序列中的目标可移动物体预先标注的移动轨迹信息;确定目标可移动物体在样本图像序列中的状态信息;基于状态信息,生成样本图像序列对应的损失权重;将样本图像序列作为预设的初始模型的输入,得到预测轨迹信息;根据预测轨迹信息及预先标注的移动轨迹信息,确定损失函数;利用损失权重对损失函数进行加权,得到损失值;根据损失值对初始模型进行训练,得到轨迹预测模型。
根据本公开实施例的另一个方面,提供了一种轨迹预测模型生成装置,该装置包括:获取模块,用于获取样本图像序列,以及获取对样本图像序列中的目标可移动物体预先标注的移动轨迹信息;第一确定模块,用于确定目标可移动物体在样本图像序列中的状态信息;生成模块,用于基于状态信息,生成样本图像序列对应的损失权重;预测模块,用于将样本图像序列作为预设的初始模型的输入,得到预测轨迹信息;第二确定模块,用于根据预测轨迹信息及预先标注的移动轨迹信息,确定损失函数;计算模块,用于利用损失权重对损失函数进行加权,得到损失值;训练模块,用于根据损失值对初始模型进行训练,得到轨迹预测模型。
根据本公开实施例的另一个方面,提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序用于执行上述轨迹预测模型生成方法。
根据本公开实施例的另一个方面,提供了一种电子设备,电子设备包括:处理器;用于存储处理器可执行指令的存储器;处理器,用于从存储器中读取可执行指令,并执行指令以实现上述轨迹预测模型生成方法。
基于本公开上述实施例提供的轨迹预测模型生成方法、装置、计算机可读存储介质及电子设备,通过确定目标可移动物体在样本图像序列中的状态信息,基于状态信息,生成样本图像序列对应的损失权重,利用损失权重对训练模型使用的损失函数进行加权,得到损失值,最后根据损失值对初始模型进行训练,得到轨迹预测模型,从而实现了基于可移动物体的状态信息自动对损失函数进行加权,即有效地利用了可移动物体的状态,提高了训练得到的轨迹预测模型的预测精度,并且实现了使用较少的训练样本训练得到精度较高的模型。
下面通过附图和实施例,对本公开的技术方案做进一步的详细描述。
附图说明
通过结合附图对本公开实施例进行更详细的描述,本公开的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本公开实施例的进一步理解,并且构成说明书的一部分,与本公开实施例一起用于解释本公开,并不构成对本公开的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
图1是本公开所适用的系统图。
图2是本公开一示例性实施例提供的轨迹预测模型生成方法的流程示意图。
图3是本公开的实施例的轨迹预测模型生成方法的一个应用场景的示意图。
图4是本公开一示例性实施例提供的轨迹预测模型生成装置的结构示意图。
图5是本公开另一示例性实施例提供的轨迹预测模型生成装置的结构示意图。
图6是本公开一示例性实施例提供的电子设备的结构图。
具体实施方式
下面,将参考附图详细地描述根据本公开的示例实施例。显然,所描述的实施例仅仅是本公开的一部分实施例,而不是本公开的全部实施例,应理解,本公开不受这里描述的示例实施例的限制。
应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。
本领域技术人员可以理解,本公开实施例中的“第一”、“第二”等术语仅用于区别不同步骤、设备或模块等,既不代表任何特定技术含义,也不表示它们之间的必然逻辑顺序。
还应理解,在本公开实施例中,“多个”可以指两个或两个以上,“至少一个”可以指一个、两个或两个以上。
还应理解,对于本公开实施例中提及的任一部件、数据或结构,在没有明确限定或者在前后文给出相反启示的情况下,一般可以理解为一个或多个。
另外,本公开中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本公开中字符“/”,一般表示前后关联对象是一种“或”的关系。
还应理解,本公开对各个实施例的描述着重强调各个实施例之间的不同之处,其相同或相似之处可以相互参考,为了简洁,不再一一赘述。
同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本公开及其应用或使用的任何限制。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
本公开实施例可以应用于终端设备、计算机系统、服务器等电子设备,其可与众多其它通用或专用计算系统环境或配置一起操作。适于与终端设备、计算机系统、服务器等电子设备一起使用的众所周知的终端设备、计算系统、环境和/或配置的例子包括但不限于:个人计算机系统、服务器计算机系统、瘦客户机、厚客户机、手持或膝上设备、基于微处理器的系统、机顶盒、可编程消费电子产品、网络个人电脑、小型计算机系统、大型计算机系统和包括上述任何系统的分布式云计算技术环境,等等。
终端设备、计算机系统、服务器等电子设备可以在由计算机系统执行的计算机系统可执行指令(诸如程序模块)的一般语境下描述。通常,程序模块可以包括例程、程序、目标程序、组件、逻辑、数据结构等等,它们执行特定的任务或者实现特定的抽象数据类型。计算机系统/服务器可以在分布式云计算环境中实施,分布式云计算环境中,任务是由通过通信网络链接的远程处理设备执行的。在分布式云计算环境中,程序模块可以位于包括存储设备的本地或远程计算系统存储介质上。
申请概述
在目前的可移动物体轨迹预测场景中,待预测的可移动物体状态繁多。例如当可移动物体为车辆时,在停车场附近,大部分车辆是静止的,只有少部分车辆在运动,如果使用这种数据去训练预测模型,由于数据中的大部分车辆是静止的,那么模型也就会学到车辆静止的先验分布,导致最后训练出的模型预测车辆未来轨迹时出现错误,显示轨迹时出现诸如拖尾等不正常的现象。
示例性系统
图1示出了可以应用本公开的实施例的轨迹预测模型生成方法或轨迹预测模型生成装置的示例性系统架构100。
如图1所示,系统架构100可以包括终端设备101、网络102、服务器103和摄像头104。网络102用于在终端设备101、服务器103和摄像头104之间提供通信链路的介质。网络102可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101通过网络102与服务器103交互,以接收或发送消息等。终端设备101上可以安装有各种通讯客户端应用,例如监控类应用、地图类应用、图像处理类应用等。
终端设备101可以是各种电子设备,包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等。
服务器103可以是提供各种服务的服务器,例如使用终端设备101或摄像头104采集的图像序列训练轨迹预测模型的后台模型训练服务器。后台模型训练服务器可以利用获取的样本图像序列,对初始模型进行训练,得到轨迹预测模型。
摄像头104可以安装在各种设备上,例如,可以安装在车辆上,随着车辆的移动,实时获取样本图像序列。摄像头104还可以是安装在固定位置的监控摄像头,例如,可以是安装在道路上对道路上行驶的可移动物体进行拍摄的摄像头。
需要说明的是,本公开的实施例所提供的轨迹预测模型生成方法可以由服务器103执行,也可以由终端设备101执行,相应地,轨迹预测模型生成装置可以设置于服务器103中,也可以设置于终端设备101中。
应该理解,图1中的终端设备、网络、服务器和摄像头的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络、服务器和摄像头。
示例性方法
图2是本公开一示例性实施例提供的轨迹预测模型生成方法的流程示意图。本实施例可应用在电子设备(如图1所示的终端设备101或服务器103)上,如图2所示,该方法包括如下步骤:
步骤201,获取样本图像序列,以及获取对样本图像序列中的目标可移动物体预先标注的移动轨迹信息。
在本实施例中,电子设备可以首先从远程或从本地获取样本图像序列。例如,样本图像序列可以是如图1所示的摄像头104拍摄的。电子设备再从远程或从本地获取对样本图像序列中的目标可移动物体预先标注的移动轨迹信息。其中,样本图像序列可以包括多个以时间顺序排列的样本图像,样本图像中包括至少一个可移动物体图像。目标可移动物体图像是预先指定的上述至少一个可移动物体图像中的其中一个或多个。可移动物体可以是各种可以移动的物体,例如车辆、行人等。需要说明的是,为了便于表述,这里的可移动物体是真实物体映射到样本图像中的物体图像,而非真实的物体。
在本实施例中,样本图像序列中的样本图像对应于预先标注的移动轨迹信息。移动轨迹信息用于表征目标可移动物体在样本图像序列包括的各个样本图像中的实际位置。
步骤202,确定目标可移动物体在样本图像序列中的状态信息。
在本实施例中,电子设备可以确定目标可移动物体在样本图像序列中的状态信息。具体地,电子设备可以识别样本图像序列中的可移动物体的位置、数量等属性,并根据识别出的各种属性,生成状态信息。其中,状态信息用于表征目标可移动物体的移动状态。
可选的,状态信息可以包括以下至少一种数据:目标可移动物体的移动速度、目标可移动物体周围的可移动物体的数量。电子设备可以按照各种方式确定目标可移动物体的移动速度和目标可移动物体周围的可移动物体的数量。本实现方式提供的移动速度和数量,可以有助于在训练移动轨迹模型时,能够涉及到可移动物体的运动状态和周围环境,从而使训练得到的轨迹移动模型更加适应实际需求,提高轨迹预测的准确性。
作为示例,目标可移动物体可以是车辆,车辆可以实时记录其移动速度,电子设备可以获取车辆的移动速度,样本图像序列包括的每个样本图像可以对应于实时记录的移动速度,电子设备可以将每个样本图像对应的移动速度取平均值作为目标可移动物体的移动速度。
作为另一示例,电子设备可以识别每个样本图像中的可移动物体的数量,将每个样本图像中的除目标可移动物体外的其他可移动物体的数量确定为目标可移动物体周围的可移动物体的数量。
在一些可选的实习方式中,移动速度可以基于如下步骤确定:
首先,确定目标可移动物体在样本图像序列中的第一样本图像和第二样本图像的位置之间的距离。其中,上述距离为将两个图像中的目标可移动物体映射到同一像面中的位置之间的距离。具体地,电子设备可以利用现有的目标检测方法,检测目标可移动物体在第一样本图像和第二样本图像中的像面位置。上述目标检测方法可以包括但不限于例如SSD(Single Shot MultiBox Detector)、DPM(Deformable Part Model)、RPN(RegionProposal Networks)等目标检测网络。
其中,第一样本图像和第二样本图像可以是任意指定的两个样本图像。例如,第一样本图像和第二样本图像可以是样本图像序列中排在首位和末位的样本图像,或者是相邻的两个样本图像。此外,第一样本图像和第二样本图像的数量可以是多个。例如,每对相邻的样本图像可以分别为第一样本图像和第二样本图像。
然后,基于第一样本图像和第二样本图像的帧间隔时间和距离,确定移动速度。具体地,作为示例,当第一样本图像和第二样本图像是样本图像序列中排在首位和末位的样本图像时,可以将上述距离除以第一样本图像和第二样本图像的帧间隔时间,得到移动速度。当第一样本图像和第二样本图像的数量为多个时,可以将每对第一样本图像和第二样本图像中目标可移动物体的位置之间的距离除以第一样本图像和第二样本图像的帧间隔时间,得到该对第一样本图像和第二样本图像对应的移动速度,再将各对第一样本图像和第二样本图像对应的移动速度取平均,得到目标可移动物体的移动速度。
通常,由于上述距离是目标可移动物体在图像中的位置之间的距离,因此,所确定的移动速度为目标可移动物体在图像中的移动速度,电子设备可以根据预设的在图像中的距离与实际距离的对应关系,确定目标可移动物体的实际移动速度。
目标可移动物体周围的可移动物体的数量可以基于如下步骤确定:
首先,确定样本图像序列中的每个样本图像中的目标范围内的可移动物体的数量。其中,目标范围是与目标可移动物体之间的距离小于或等于预设距离的范围。作为示例,目标范围可以是以目标可移动物体为圆心,以预设距离为半径的圆。或者,目标范围可以是以目标可移动物体为中心点,以预设长度和预设宽度确定的矩形范围。可选的,目标范围还可以是整个样本图像的范围。
然后,基于每个样本图像分别对应的数量,确定平均数量作为目标可移动物体周围的可移动物体的数量。具体地,平均数量可以是各个样本图像分别对应的数量之和除以样本图像的数量所得到的数值。
本实现方式通过识别样本图像序列,确定目标可移动物体的移动速度和目标可移动物体周围的可移动物体的数量,从而能够准确、客观地检测目标可移动物体自身的运动状态和周围环境,有助于进一步提高训练得到的轨迹预测模型的准确性。
步骤203,基于状态信息,生成样本图像序列对应的损失权重。
在本实施例中,电子设备可以基于状态信息,生成样本图像序列对应的损失权重。其中,损失权重用于对训练模型所使用的损失函数进行加权。
作为示例,电子设备可以将状态信息包括的各个数据取平均作为损失权重。
可选的,电子设备可以对状态信息包括的数据进行加权求和,得到样本图像序列对应的损失权重。
作为示例,损失权重可以基于如下公式得到:
w=0.5v+1.5n,其中,w为损失权重,v为移动速度,n为目标可移动物体周围的可移动物体的数量。0.5和1.5为权重,并且权重可调。使用该公式训练的轨迹预测模型可以倾向于学习运动的可移动物体以及旁边的可移动物体较多时的场景。如果需要增加速度快、周围的可移动物体数量多的样本对模型训练的影响,只需提高v和n对应的权重。
本实现方式通过对状态信息包括的数据进行加权求和,可以根据实际需要调整不同样本的损失权重,有利于灵活地调整训练的目的,提高训练得到的轨迹预测模型的准确性。
步骤204,将样本图像序列作为预设的初始模型的输入,得到预测轨迹信息。
在本实施例中,电子设备可以将样本图像序列输入预设的初始模型,得到预测轨迹信息。其中,初始模型可以用于表征图像序列和预测轨迹信息之间的对应关系。初始模型可以基于现有的各种类型的机器学习模型预先构建。例如,初始模型可以包括但不限于卷积神经网络、循环神经网络、LSTM(Long Short-Term Memory,长短期记忆网络)等。
步骤205,根据预测轨迹信息及预先标注的移动轨迹信息,确定损失函数。
在本实施例中,电子设备可以根据预测轨迹信息及预先标注的移动轨迹信息,确定损失函数。其中,损失函数用于计算损失值,损失值用于表征预测轨迹信息与预先标注的移动轨迹信息的差距。损失函数可以为各种形式,例如MSE(Mean Squared Error,均方误差)损失函数、RMSE(root-mean-square error,均方根误差)损失函数、MAE(Mean AbsoluteError,平均绝对误差)损失函数等。
步骤206,利用损失权重对损失函数进行加权,得到损失值。
在本实施例中,电子设备可以利用损失权重对损失函数进行加权,得到损失值。
作为示例,假设原损失函数为L0,则加权后的损失函数可以为w×L0。
步骤207,根据损失值对初始模型进行训练,得到轨迹预测模型。
在本实施例中,电子设备可以根据损失值对初始模型进行训练,得到轨迹预测模型。轨迹预测模型在使用时,可以向其输入图像序列,其中,输入的图像序列是对可移动物体拍摄的图像序列。轨迹预测模型可以对图像序列中指定的可移动物体(可以是每个可移动物体,也可以是个别可移动物体)进行轨迹预测,得到可移动物体的预测轨迹信息。
具体地,电子设备可以利用梯度下降算法和反向传播算法,对初始模型的参数进行调整,以使损失值最小,当初始模型满足预设条件时,确定训练后的初始模型为轨迹预测模型。其中,预设条件可以包括但不限于以下至少一种:训练次数超过预设次数,训练时长超过预设时长,损失值小于预设损失值阈值。
在一些可选的实习方式中,步骤205可以如下执行:
首先,确定预测轨迹信息指示的位置与预先标注的移动轨迹信息指示的位置之间的距离。具体地,预测轨迹信息和移动轨迹信息可以分别包括目标可移动物体的坐标,用于指示目标可移动物体在同一个样本图像中的位置,根据这两个坐标,可以确定两个位置之间的距离。
然后,基于距离,确定损失函数。
作为示例,损失函数可以如下述式(1)所示:
Figure BDA0002513161660000091
其中,L0为损失值,t为样本图像序列中的各个样本图像分别对应的时间点,Spred(t)用于表征预测轨迹信息指示的位置,Sreal(t)用于表征预先标注的移动轨迹信息指示的位置。需要说明的是,该损失函数仅仅是一个示例,凡是基于距离确定的损失函数,均在本可选的实现方式的范围内。
本可选的实现方式,通过基于预测轨迹信息指示的位置与移动轨迹信息指示的位置之间的距离确定损失函数,可以准确地表示目标可移动物体的实际位置和预测位置之间的差距,提高训练得到的轨迹预测模型的预测精度。
在一些可选的实现方式中,基于上述可选的实现方式中描述的距离,步骤206可以如下执行:
在损失函数中,基于损失权重和距离,得到损失值。
作为示例,基于上述式(1),可以按照如下式(2)确定损失值:
Figure BDA0002513161660000092
其中,L为加权后得到的损失值,w为损失权重。需要说明的是,式(2)是对距离的平方加权,还可以是对距离以其他方式进行加权,例如对距离直接加权,或对距离的三次方加权,凡是利用到距离和损失权重计算损失值的方法,均在本可选的实现方式的范围内。
本实现方式通过利用损失权重确定损失值,可以灵活地根据实际情况对训练时计算的损失值进行调整,提高模型与实际场景的匹配程度。
参见图3,图3是根据本实施例的轨迹预测模型生成方法的应用场景的一个示意图。在图3的应用场景中,电子设备301首先获取安装在道路上方的摄像头302对道路上行驶的车辆(即可移动物体)拍摄的样本图像序列303。其中,如图中304所示,样本图像序列303中的车辆3041(即目标可移动物体)对应于预先标注的移动轨迹信息,预先标注的移动轨迹信息如图中的3042所示,表示车辆3041在各个样本图像中的位置。然后,电子设备301确定车辆3041在样本图像序列303中的状态信息305,其中,状态信息305包括车辆3041的平均速度v(例如5米/秒)和其周围的车辆的平均数量n(例如图中所示为2)。再然后,电子设备301基于状态信息305,生成样本图像序列303对应的损失权重306。例如损失权重为w(v,n)=0.5v+1.5n。接着,电子设备301将样本图像序列303作为预设的初始模型307的输入,得到预测轨迹信息,其中,预测轨迹信息如图中的308所示,表示车辆3041在各个样本图像中的预测位置。再接着,电子设备301根据预测轨迹信息及预先标注的移动轨迹信息,确定损失函数。例如,损失函数如上述式(1)所示。随后,电子设备301利用损失权重w(v,n)对损失函数进行加权,得到损失值。例如,根据上述式(2),得到加权后的损失值。最后,利用机器学习方法,根据损失值对初始模型进行训练,得到轨迹预测模型309。
本公开的上述实施例提供的方法,通过确定目标可移动物体在样本图像序列中的状态信息,基于状态信息,生成样本图像序列对应的损失权重,利用损失权重对训练模型使用的损失函数进行加权,得到损失值,最后根据损失值对初始模型进行训练,得到轨迹预测模型,从而实现了基于可移动物体的状态信息自动对损失函数进行加权,即有效地利用了可移动物体的状态,提高了训练得到的轨迹预测模型的预测精度,并且实现了使用较少的训练样本训练得到精度较高的模型。
示例性装置
图4是本公开一示例性实施例提供的轨迹预测模型生成装置的结构示意图。本实施例可应用在电子设备上,如图4所示,轨迹预测模型生成装置包括:获取模块401,用于获取样本图像序列,以及获取对样本图像序列中的目标可移动物体预先标注的移动轨迹信息;第一确定模块402,用于确定目标可移动物体在样本图像序列中的状态信息;生成模块403,用于基于状态信息,生成样本图像序列对应的损失权重;预测模块404,用于将样本图像序列作为预设的初始模型的输入,得到预测轨迹信息;第二确定模块405,用于根据预测轨迹信息及预先标注的移动轨迹信息,确定损失函数;计算模块406,用于利用损失权重对损失函数进行加权,得到损失值;训练模块407,用于根据损失值对初始模型进行训练,得到轨迹预测模型。
在本实施例中,获取模块401可以首先从远程或从本地获取样本图像序列。例如,样本图像序列可以是如图1所示的摄像头104拍摄的。获取模块401再从远程或从本地获取对样本图像序列中的目标可移动物体预先标注的移动轨迹信息。其中,样本图像序列可以包括多个以时间顺序排列的样本图像,样本图像中包括至少一个可移动物体图像。目标可移动物体图像是预先指定的上述至少一个可移动物体图像中的其中一个或多个。可移动物体可以是各种可以移动的物体,例如车辆、行人等。需要说明的是,为了便于表述,这里的可移动物体是真实物体映射到样本图像中的物体图像,而非真实的物体。
在本实施例中,样本图像序列中的样本图像对应于预先标注的移动轨迹信息。移动轨迹信息用于表征目标可移动物体在样本图像序列包括的各个样本图像中的实际位置。
在本实施例中,第一确定模块402可以确定目标可移动物体在样本图像序列中的状态信息。具体地,第一确定模块402可以识别样本图像序列中的可移动物体的位置、数量等属性,并根据识别出的各种属性,生成状态信息。其中,状态信息用于表征目标可移动物体的移动状态。
在本实施例中,生成模块403可以基于状态信息,生成样本图像序列对应的损失权重。其中,损失权重用于对训练模型所使用的损失函数进行加权。
作为示例,生成模块403可以将状态信息包括的各个数据取平均作为损失权重。
在本实施例中,预测模块404可以基于状态信息,生成样本图像序列对应的损失权重。其中,损失权重用于对训练模型所使用的损失函数进行加权。
作为示例,预测模块404可以将状态信息包括的各个数据取平均作为损失权重。
在本实施例中,第二确定模块405可以根据预测轨迹信息及预先标注的移动轨迹信息,确定损失函数。其中,损失函数用于计算损失值,损失值用于表征预测轨迹信息与预先标注的移动轨迹信息的差距。损失函数可以为各种形式,例如MSE(Mean Squared Error,均方误差)损失函数、RMSE(root-mean-square error,均方根误差)损失函数、MAE(MeanAbsolute Error,平均绝对误差)损失函数等。
在本实施例中,计算模块406可以利用损失权重对损失函数进行加权,得到损失值。
作为示例,假设原损失函数为L0,则加权后的损失函数可以为w×L0。
在本实施例中,训练模块407可以根据损失值对初始模型进行训练,得到轨迹预测模型。
具体地,训练模块407可以利用梯度下降算法和反向传播算法,对初始模型的参数进行调整,以使损失值最小,当初始模型满足预设条件时,确定训练后的初始模型为轨迹预测模型。其中,预设条件可以包括但不限于以下至少一种:训练次数超过预设次数,训练时长超过预设时长,损失值小于预设损失值阈值。
参照图5,图5是本公开另一示例性实施例提供的轨迹预测模型生成装置的结构示意图。
在一些可选的实现方式中,状态信息可以包括以下至少一种数据:目标可移动物体的移动速度、目标可移动物体周围的可移动物体的数量。
在一些可选的实现方式中,第一确定模块402可以包括第一确定单元4021和第二确定单元4022,其中,第一确定单元4021可以包括:第一确定子单元40211,用于确定目标可移动物体在样本图像序列中的第一样本图像和第二样本图像的位置之间的距离;第二确定子单元40212,用于基于第一样本图像和第二样本图像的帧间隔时间和距离,确定移动速度;
第二确定单元4022可以包括:第三确定子单元40221,用于确定样本图像序列中的每个样本图像中的目标范围内的可移动物体的数量,其中,目标范围是与目标可移动物体之间的距离小于或等于预设距离的范围;第四确定子单元40222,用于基于每个样本图像分别对应的数量,确定平均数量作为目标可移动物体周围的可移动物体的数量。
在一些可选的实现方式中,生成模块403可以进一步用于:对状态信息包括的数据进行加权求和,得到样本图像序列对应的损失权重。
在一些可选的实现方式中,第二确定模块405可以包括:第三确定单元4051,用于确定预测轨迹信息指示的位置与预先标注的移动轨迹信息指示的位置之间的距离;第四确定单元4052,用于基于距离,确定损失函数。
在一些可选的实现方式中,计算模块406可以进一步用于:在损失函数中,基于损失权重和距离,得到损失值。
本公开上述实施例提供的轨迹预测模型生成装置,通过确定目标可移动物体在样本图像序列中的状态信息,基于状态信息,生成样本图像序列对应的损失权重,利用损失权重对训练模型使用的损失函数进行加权,得到损失值,最后根据损失值对初始模型进行训练,得到轨迹预测模型,从而实现了基于可移动物体的状态信息自动对损失函数进行加权,即有效地利用了可移动物体的状态,提高了训练得到的轨迹预测模型的预测精度,并且实现了使用较少的训练样本训练得到精度较高的模型。
示例性电子设备
下面,参考图6来描述根据本公开实施例的电子设备。该电子设备可以是如图1所示的终端设备101和服务器103中的任一个或两者、或与它们独立的单机设备,该单机设备可以与终端设备101和服务器103进行通信,以从它们接收所采集到的输入信号。
图6图示了根据本公开实施例的电子设备的框图。
如图6所示,电子设备600包括一个或多个处理器601和存储器602。
处理器601可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备600中的其他组件以执行期望的功能。
存储器602可以包括一个或多个计算机程序产品,计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器601可以运行程序指令,以实现上文的本公开的各个实施例的轨迹预测模型生成方法以及/或者其他期望的功能。在计算机可读存储介质中还可以存储诸如输入信号、信号分量、噪声分量等各种内容。
在一个示例中,电子设备600还可以包括:输入装置603和输出装置604,这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。
例如,在该电子设备是终端设备101或服务器103时,该输入装置603可以是鼠标、键盘、摄像头等设备,用于输入样本图像序列。在该电子设备是单机设备时,该输入装置603可以是通信网络连接器,用于从终端设备101和服务器103接收所输入的样本图像序列。
该输出装置604可以向外部输出各种信息,包括训练得到的轨迹预测模型。该输出设备604可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。
当然,为了简化,图6中仅示出了该电子设备600中与本公开有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备600还可以包括任何其他适当的组件。
示例性计算机程序产品和计算机可读存储介质
除了上述方法和设备以外,本公开的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本公开各种实施例的轨迹预测模型生成方法中的步骤。
所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
此外,本公开的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本公开各种实施例的轨迹预测模型生成方法中的步骤。
所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
以上结合具体实施例描述了本公开的基本原理,但是,需要指出的是,在本公开中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本公开的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本公开为必须采用上述具体的细节来实现。
本说明书中各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似的部分相互参见即可。对于系统实施例而言,由于其与方法实施例基本对应,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本公开中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
可能以许多方式来实现本公开的方法和装置。例如,可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本公开的方法和装置。用于所述方法的步骤的上述顺序仅是为了进行说明,本公开的方法的步骤不限于以上具体描述的顺序,除非以其它方式特别说明。此外,在一些实施例中,还可将本公开实施为记录在记录介质中的程序,这些程序包括用于实现根据本公开的方法的机器可读指令。因而,本公开还覆盖存储用于执行根据本公开的方法的程序的记录介质。
还需要指出的是,在本公开的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本公开的等效方案。
提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本公开。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本公开的范围。因此,本公开不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本公开的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

Claims (7)

1.一种轨迹预测模型生成方法,包括:
获取样本图像序列,以及获取对所述样本图像序列中的目标可移动物体预先标注的移动轨迹信息;
确定所述目标可移动物体在所述样本图像序列中的状态信息,所述状态信息包括以下至少一种数据:所述目标可移动物体的移动速度、所述目标可移动物体周围的可移动物体的数量;
基于所述状态信息,生成所述样本图像序列对应的损失权重;
将所述样本图像序列作为预设的初始模型的输入,得到预测轨迹信息;
根据所述预测轨迹信息及所述预先标注的移动轨迹信息,确定损失函数;
利用所述损失权重对所述损失函数进行加权,得到损失值;
根据所述损失值对所述初始模型进行训练,得到轨迹预测模型;
所述根据所述预测轨迹信息及所述预先标注的移动轨迹信息,确定损失函数,包括:
确定所述预测轨迹信息指示的位置与所述预先标注的移动轨迹信息指示的位置之间的距离;
基于所述距离,确定损失函数;
所述根据所述损失值对所述初始模型进行训练,得到轨迹预测模型,包括:
根据所述损失值,调整所述初始模型的参数,当所述初始模型满足预设条件时,确定调整参数后的初始模型为轨迹预测模型。
2.根据权利要求1所述的方法,其中,所述移动速度基于如下步骤确定:
确定所述目标可移动物体在所述样本图像序列中的第一样本图像和第二样本图像的位置之间的距离;
基于所述第一样本图像和第二样本图像的帧间隔时间和所述距离,确定所述移动速度;
所述目标可移动物体周围的可移动物体的数量基于如下步骤确定:
确定所述样本图像序列中的每个样本图像中的目标范围内的可移动物体的数量,其中,所述目标范围是与所述目标可移动物体之间的距离小于或等于预设距离的范围;
基于所述每个样本图像分别对应的数量,确定平均数量作为所述目标可移动物体周围的可移动物体的数量。
3.根据权利要求1所述的方法,其中,所述基于所述状态信息,生成所述样本图像序列对应的损失权重,包括:
对所述状态信息包括的数据进行加权求和,得到所述样本图像序列对应的损失权重。
4.根据权利要求1所述的方法,其中,所述利用所述损失权重对所述损失函数进行加权,得到损失值,包括:
在所述损失函数中,基于所述损失权重和所述距离,得到损失值。
5.一种轨迹预测模型生成装置,包括:
获取模块,用于获取样本图像序列,以及获取对所述样本图像序列中的目标可移动物体预先标注的移动轨迹信息;
第一确定模块,用于确定所述目标可移动物体在所述样本图像序列中的状态信息,所述状态信息包括以下至少一种数据:所述目标可移动物体的移动速度、所述目标可移动物体周围的可移动物体的数量;
生成模块,用于基于所述状态信息,生成所述样本图像序列对应的损失权重;
预测模块,用于将所述样本图像序列作为预设的初始模型的输入,得到预测轨迹信息;
第二确定模块,用于根据所述预测轨迹信息及所述预先标注的移动轨迹信息,确定损失函数;
计算模块,用于利用所述损失权重对所述损失函数进行加权,得到损失值;
训练模块,用于根据所述损失值对所述初始模型进行训练,得到轨迹预测模型;
所述第二确定模块包括:
第三确定单元,用于确定所述预测轨迹信息指示的位置与所述预先标注的移动轨迹信息指示的位置之间的距离;
第四确定单元,用于基于所述距离,确定损失函数;
所述训练模块进一步用于:
根据所述损失值,调整所述初始模型的参数,当所述初始模型满足预设条件时,确定调整参数后的初始模型为轨迹预测模型。
6.一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行上述权利要求1-4任一所述的方法。
7.一种电子设备,所述电子设备包括:
处理器;
用于存储所述处理器可执行指令的存储器;
所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述权利要求1-4任一所述的方法。
CN202010467478.0A 2020-05-28 2020-05-28 轨迹预测模型生成方法、装置、可读存储介质及电子设备 Active CN111626219B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010467478.0A CN111626219B (zh) 2020-05-28 2020-05-28 轨迹预测模型生成方法、装置、可读存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010467478.0A CN111626219B (zh) 2020-05-28 2020-05-28 轨迹预测模型生成方法、装置、可读存储介质及电子设备

Publications (2)

Publication Number Publication Date
CN111626219A CN111626219A (zh) 2020-09-04
CN111626219B true CN111626219B (zh) 2023-06-09

Family

ID=72260034

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010467478.0A Active CN111626219B (zh) 2020-05-28 2020-05-28 轨迹预测模型生成方法、装置、可读存储介质及电子设备

Country Status (1)

Country Link
CN (1) CN111626219B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112464577B (zh) * 2021-01-25 2021-04-20 魔门塔(苏州)科技有限公司 车辆动力学模型的构建及车辆状态信息预测方法、装置
CN113110045B (zh) * 2021-03-31 2022-10-25 同济大学 一种基于计算图的模型预测控制实时优化并行计算方法
CN113435355A (zh) * 2021-06-30 2021-09-24 中国农业大学 多目标奶牛身份识别方法及系统
CN114348019B (zh) * 2021-12-20 2023-11-07 清华大学 车辆轨迹预测方法、装置、计算机设备和存储介质
CN115345390B (zh) * 2022-10-19 2023-01-13 武汉大数据产业发展有限公司 一种行为轨迹预测方法、装置、电子设备及存储介质
CN117350177B (zh) * 2023-12-05 2024-03-22 西安热工研究院有限公司 卸船机路径生成模型的训练方法、装置、电子设备及介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110599521A (zh) * 2019-09-05 2019-12-20 清华大学 生成易受伤害道路使用者轨迹预测模型的方法及预测方法
CN110751683A (zh) * 2019-10-28 2020-02-04 北京地平线机器人技术研发有限公司 轨迹预测方法、装置、可读存储介质及电子设备
WO2020087974A1 (zh) * 2018-10-30 2020-05-07 北京字节跳动网络技术有限公司 生成模型的方法和装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11126185B2 (en) * 2018-09-15 2021-09-21 Toyota Research Institute, Inc. Systems and methods for predicting vehicle trajectory

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020087974A1 (zh) * 2018-10-30 2020-05-07 北京字节跳动网络技术有限公司 生成模型的方法和装置
CN110599521A (zh) * 2019-09-05 2019-12-20 清华大学 生成易受伤害道路使用者轨迹预测模型的方法及预测方法
CN110751683A (zh) * 2019-10-28 2020-02-04 北京地平线机器人技术研发有限公司 轨迹预测方法、装置、可读存储介质及电子设备

Also Published As

Publication number Publication date
CN111626219A (zh) 2020-09-04

Similar Documents

Publication Publication Date Title
CN111626219B (zh) 轨迹预测模型生成方法、装置、可读存储介质及电子设备
CN109145781B (zh) 用于处理图像的方法和装置
CN109740499A (zh) 视频分割方法、视频动作识别方法、装置、设备及介质
KR20210006971A (ko) 지오로케이션 예측을 위한 시스템 및 방법
CN109145828B (zh) 用于生成视频类别检测模型的方法和装置
EP3349142B1 (en) Information processing device and method
CN109118532B (zh) 视觉景深估计方法、装置、设备及存储介质
CN115616937B (zh) 自动驾驶仿真测试方法、装置、设备和计算机可读介质
CN111612842A (zh) 生成位姿估计模型的方法和装置
CN115546293B (zh) 障碍物信息融合方法、装置、电子设备和计算机可读介质
CN111639591B (zh) 轨迹预测模型生成方法、装置、可读存储介质及电子设备
CN115393592A (zh) 目标分割模型的生成方法及装置、目标分割方法及装置
CN113112643A (zh) 预测轨迹的评价方法、装置以及电子设备和存储介质
CN109635868B (zh) 障碍物类别的确定方法、装置、电子设备及存储介质
CN114758068A (zh) 空间几何信息估计模型的训练方法及装置
CN112200804A (zh) 图像检测方法、装置、计算机可读存储介质及电子设备
CN112651535A (zh) 局部路径规划方法、装置、存储介质、电子设备及车辆
US20230095093A1 (en) Training method and apparatus for a target detection model, target detection method and apparatus, and storage medium
CN113111692B (zh) 目标检测方法、装置、计算机可读存储介质及电子设备
CN115222769A (zh) 轨迹预测方法、装置和智能体
CN114648712B (zh) 视频分类方法、装置、电子设备及计算机可读存储介质
CN111586295B (zh) 图像生成方法、装置和电子设备
CN114937251A (zh) 目标检测模型的训练方法、车载目标检测方法及装置
CN114067196A (zh) 生成图像场景信息的方法及装置
CN113129330B (zh) 一种可移动设备的轨迹预测方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant