CN113706725A

CN113706725A - 一种基于unity ML插件的可移动环境的实现方法

Info

Publication number: CN113706725A
Application number: CN202111008520.3A
Authority: CN
Inventors: 白启扉
Original assignee: Dilu Technology Co Ltd
Current assignee: Dilu Technology Co Ltd
Priority date: 2021-08-31
Filing date: 2021-08-31
Publication date: 2021-11-26

Abstract

本发明公开了一种基于unity ML插件的可移动环境的实现方法，包括：步骤1，利用Unity3D开发组件搭建车辆测试的可移动训练场景，并利用Vehicle Tools资源包导入训练场景内的动态物体，并为动态物体设置运动状态；步骤2，在可移动训练场景内创建智能体，作为目标训练车辆；为目标训练车辆创建虚拟传感器；步骤3，构建训练模型，并利用可移动训练场景对目标训练车辆进行训练，得到训练好的模型文件；步骤4，将训练好的模型文件导入unity工程，TensorFlowSharp读取模型文件，并用于Brain车辆对象，由此实现特定场景的自动移动。本发明基于AI框架tensorflow，基于ML插件进行强化学习或其他机器学习，实现模拟周边可移动环境，训练得到有一定自主智能的环境物体。

Description

一种基于unity ML插件的可移动环境的实现方法

技术领域

本发明属于汽车技术领域，具体涉及一种基于unity ML插件的可移动环境的实现方法。

背景技术

目前在一些需要3D展示的项目活动中，例如城市规划，房地产虚拟楼盘等，经常需要实现一些周边路车辆等的移动，以提高展示的真实感和代入感。传统的方法是在场景中设置好周边物体移动的路径，然后通过配置随机选择路径，随机生成不同车辆，随机设置速度方向等方法，实现较为真实的周边环境。但这样的方法随机性太小，往往能轻易看出物体沿某些特定轨迹移动；同时在遇到堵塞等情况时，物体仍旧沿着事先设定的轨迹移动，无法自然的模拟特殊情况，往往导致真实性欠佳。

发明内容

发明目的：针对以上问题，本发明提出一种基于unity ML插件的可移动环境的实现方法。

技术方案：为实现本发明的目的，本发明所采用的技术方案是：一种基于unity ML插件的可移动环境的实现方法，具体包括如下步骤：

步骤1，利用Unity3D开发组件搭建车辆测试的可移动训练场景，并利用VehicleTools资源包导入训练场景内的动态物体，并为动态物体设置各自对应的运动状态；

步骤2，在可移动训练场景内创建智能体，作为目标训练车辆；为目标训练车辆创建虚拟传感器，包括位置传感器和障碍物传感器；

步骤3，构建训练模型，并利用可移动训练场景对目标训练车辆进行训练，得到训练好的模型文件；

步骤4，将训练好的模型文件导入unity工程，TensorFlowSharp读取模型文件，并用于Brain车辆对象，由此实现特定场景的自动移动。

进一步地，步骤1所述可移动训练场景包括但不限于交通道路、交通标线、路边围栏和绿化带。

进一步地，步骤2所述位置传感器，具体采用unity object的transform变量，用于实现目标训练车辆在训练场景中的定位；

所述障碍物传感器，具体通过为目标训练车辆设置一个同步移动的包围盒实现的，用于感知训练场景中的动态物体及障碍物。

进一步地，所述步骤3的具体过程如下：

步骤3.1，构建训练模型，并为训练模型设置训练周期、训练次数、训练参数以及奖惩反馈，所述训练参数包括目标训练车辆的油门、刹车和方向盘角度；

步骤3.2，训练初始化：将目标训练车辆随机放置在训练场景的任一位置；

步骤3.3，利用可移动训练场景对目标训练车辆进行训练，包括：

目标训练车辆每进行一个动作，则记录该动作所对应的奖惩反馈，由此获得当前训练周期的奖惩反馈之和；

判断当前训练周期的奖惩反馈之和是否小于预先设定的阈值；

若当前训练周期的奖惩反馈之和小于预设的奖惩反馈阈值，则对训练参数进行调整，并对目标训练车辆进行下一训练周期的训练；

否则，继续利用可移动训练场景对目标训练车辆进行下一训练周期的训练，直至达到训练次数；

步骤3.4，统计奖惩反馈之和不小于预先设定的阈值的训练周期的数量，并判断是否符合预设的训练阈值；若符合，则训练完成，得到训练好的模型文件；否则返回步骤3.2重新对目标训练车辆进行训练。

有益效果：相比于现有技术，本发明技术方案具有以下有益技术效果：

本发明所述一种基于unity ML插件的可移动环境的实现方法，基于ML插件实现了模拟周边可移动环境，底层基于目前比较流行的AI框架tensorflow，使用强化学习，模仿学习，神经进化或其他机器学习方法，训练需要模拟的物体，从而实现更真实更自然的有一定自主智能的环境物体。

附图说明

图1是一种实施例下本发明所述方法的流程图；

图2是一种实施例下本发明方法搭建的车辆测试的可移动训练场景图。

具体实施方式

下面结合附图和实施例对本发明的技术方案作进一步的说明。

本发明所述的一种基于unity ML插件的可移动环境的实现方法，参考图1，具体包括如下步骤：

步骤1，参考图2，搭建训练场景，具体包括：

利用unity官方资源商店提供的免费Windridge City资源包，搭建出包括道路，车道线，路边栏等元素模型的组合布置，他方车辆通过Vehicle Tools资源包导入。

步骤2，创建智能体，包括：

智能体就是车辆，需要创建虚拟传感器：位置传感器，障碍物传感器。位置传感器直接采用unity object的transform变量，用于实现车辆在虚拟地图中的定位，障碍物传感器通过在车辆周边设置一个同步移动的包围盒来实现，其他车辆进入包围盒就会被当前车辆感知到。

步骤3，训练模型，包括：

训练参数主要包括车辆的油门，刹车和方向盘角度，行人的速度和转角。

奖惩值体现在训练过程中，发生碰撞，偏离道路，就给与比较大的惩罚值。正常运行时间作为奖励值，运行的越久，奖励越大。

步骤4，将训练好的模型文件导入unity工程，TensorFlowSharp会读取模型文件，并作用于Brain车辆对象，在城市场景里自动移动。

对于运行效果不佳的场景，通过unity editor扩展编写的场景导出插件，可以一键导出场景里所有元素的位置，时间等信息，然后作为初始场景参数传入步骤3，有针对性的进行训练，提高训练结果的可用性。

Claims

1.一种基于unity ML插件的可移动环境的实现方法，其特征在于，具体包括如下步骤：

步骤1，利用Unity3D开发组件搭建车辆测试的可移动训练场景，并利用Vehicle Tools资源包导入训练场景内的动态物体，为动态物体设置各自对应的运动状态；

2.根据权利要求1所述的一种基于unity ML插件的可移动环境的实现方法，其特征在于，步骤1所述可移动训练场景包括但不限于交通道路、交通标线、路边围栏和绿化带。

3.根据权利要求1所述的一种基于unity ML插件的可移动环境的实现方法，其特征在于，步骤2所述位置传感器，具体采用unity object的transform变量，用于实现目标训练车辆在训练场景中的定位；

所述障碍物传感器，具体通过为目标训练车辆设置一个同步移动的包围盒实现，用于感知训练场景中的动态物体及障碍物。

4.根据权利要求1所述的一种基于unity ML插件的可移动环境的实现方法，其特征在于，所述步骤3的具体过程如下：