CN110083155B - 一种实现船舶拟人智能避碰决策的机器学习方法 - Google Patents
一种实现船舶拟人智能避碰决策的机器学习方法 Download PDFInfo
- Publication number
- CN110083155B CN110083155B CN201910318860.2A CN201910318860A CN110083155B CN 110083155 B CN110083155 B CN 110083155B CN 201910318860 A CN201910318860 A CN 201910318860A CN 110083155 B CN110083155 B CN 110083155B
- Authority
- CN
- China
- Prior art keywords
- ship
- avoidance
- scheme
- collision
- pidvca
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000010801 machine learning Methods 0.000 title claims abstract description 22
- 238000011156 evaluation Methods 0.000 claims abstract description 27
- 230000002265 prevention Effects 0.000 claims abstract description 25
- 230000007246 mechanism Effects 0.000 claims abstract description 20
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 18
- 230000008447 perception Effects 0.000 claims abstract description 12
- 238000004364 calculation method Methods 0.000 claims abstract description 8
- 230000002787 reinforcement Effects 0.000 claims abstract description 8
- 230000000694 effects Effects 0.000 claims description 36
- 238000013210 evaluation model Methods 0.000 claims description 35
- 238000005457 optimization Methods 0.000 claims description 35
- 238000012795 verification Methods 0.000 claims description 21
- 230000006399 behavior Effects 0.000 claims description 19
- 230000009471 action Effects 0.000 claims description 17
- 238000000034 method Methods 0.000 claims description 15
- 230000008569 process Effects 0.000 claims description 8
- 230000003068 static effect Effects 0.000 claims description 6
- 230000019771 cognition Effects 0.000 claims description 4
- 238000009826 distribution Methods 0.000 claims description 4
- 238000004519 manufacturing process Methods 0.000 claims description 3
- 238000013139 quantization Methods 0.000 claims description 2
- 230000001149 cognitive effect Effects 0.000 abstract description 5
- 238000013461 design Methods 0.000 abstract description 2
- 238000004458 analytical method Methods 0.000 description 5
- LFULEKSKNZEWOE-UHFFFAOYSA-N propanil Chemical compound CCC(=O)NC1=CC=C(Cl)C(Cl)=C1 LFULEKSKNZEWOE-UHFFFAOYSA-N 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 230000001364 causal effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D1/00—Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
- G05D1/02—Control of position or course in two dimensions
- G05D1/021—Control of position or course in two dimensions specially adapted to land vehicles
- G05D1/0212—Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory
- G05D1/0214—Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory in accordance with safety or protection criteria, e.g. avoiding hazardous areas
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D1/00—Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
- G05D1/02—Control of position or course in two dimensions
- G05D1/021—Control of position or course in two dimensions specially adapted to land vehicles
- G05D1/0212—Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory
- G05D1/0221—Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory involving a learning process
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D1/00—Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
- G05D1/02—Control of position or course in two dimensions
- G05D1/021—Control of position or course in two dimensions specially adapted to land vehicles
- G05D1/0257—Control of position or course in two dimensions specially adapted to land vehicles using a radar
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D1/00—Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
- G05D1/02—Control of position or course in two dimensions
- G05D1/021—Control of position or course in two dimensions specially adapted to land vehicles
- G05D1/0276—Control of position or course in two dimensions specially adapted to land vehicles using signals provided by a source external to the vehicle
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D1/00—Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
- G05D1/02—Control of position or course in two dimensions
- G05D1/021—Control of position or course in two dimensions specially adapted to land vehicles
- G05D1/0276—Control of position or course in two dimensions specially adapted to land vehicles using signals provided by a source external to the vehicle
- G05D1/0278—Control of position or course in two dimensions specially adapted to land vehicles using signals provided by a source external to the vehicle using satellite positioning signals, e.g. GPS
Landscapes
- Engineering & Computer Science (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Aviation & Aerospace Engineering (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明公开一种实现船舶拟人智能避碰决策的机器学习方法,通过离线人工学习产生类比源和范例源,构建用以在线获取避碰新知识的避碰模型、存储船舶参数的数据库,并设计自动推理机制、计算单元和评估体系;利用避碰模型和自动推理机制,通过在线机器学习实现知识发现与近似强化学习策略,获取避碰新知识,构建动态避碰知识库;推理机通过所述的自动推理机制,调用数据库的船舶参数和PIDVCA算法,实现机器智能避碰决策。机器通过自动推理机制的指导现场获取信息和形式化的避碰领域知识,学习解决任意会遇场景避碰问题的新知识,具备感知目标、认知目标进而制定科学、合理的避碰决策方案,最终具备模拟并超越人解决复杂避碰问题的思维模式。
Description
技术领域
本发明涉及交通信息工程及控制与载运工具运用工程交叉学科衍生的船舶航行智能化技术研究领域,特别是指一种实现船舶拟人智能避碰决策的机器学习方法。
背景技术
《国际海上避碰规则》(以下简称规则)是千百年来航海家航海实践的经验总结,它从会遇局面、行动规则和避碰义务分配等方面规范了船舶的避让行为,是船舶安全有序航行、预防和减少碰撞的保障,是船舶驾驶员应遵守的海上交通规则。然而因船员决策和操作过失、应急反应不当等人为因素导致的避碰事故仍时有发生,其中96%以上是由于值班驾驶员未能严格按照《规则》采取合理行动所造成。要从根本上解决人为因素导致的船舶碰撞事故,实现船舶智能避碰决策的自动化是重要途径之一。然而海上船舶之间因船舶类型、尺度、速度、航行水域及两船交会角度不同构成了无穷且不可复现的碰撞危险局面,现有的机器学习方法无法遵循《规则》精神和模拟优秀船舶驾驶员并体现其优良船艺的通常做法给船舶驾驶员一个既科学安全又经济有效的避让决策方案。
针对海上无穷且不可复现的避碰问题,需要智能避碰决策系统具有高级的拟人智能,即超越人解决复杂的避碰问题的能力,这就要求系统能提供既安全又经济(科学合理)的决策方案,也就是要求系统既要遵循规则、海员通常做法及优良船艺,同时也要具备定量分析计算的能力。然而基于大数据的深度学习方法,需要大量的学习样本,而海上会遇态势的不可再现性及高度的不确定性,以及受海上《规则》的约束,难以有效解决海上船舶避碰决策问题;其他的机器学习方法,例如强化深度学习方法等,目前尚在探索阶段尚未见到应用的实例。
有鉴于此,本发明人针对上述问题未臻完善所导致的诸多缺失及不便,而深入构思,且积极研究改良试做而开发设计出本发明。
发明内容
本发明的目的在于提供一种实现船舶拟人智能避碰决策的机器学习方法,使机器在预先设定的推理机制的引导下从现场获取信息及形式化的避碰领域知识,学习到解决任意会遇场景避碰问题的新知识,使机器具备感知目标、认知目标进而制定科学、经济、合理的避碰决策方案,最终使机器具备模拟并超越人解决复杂避碰问题的思维模式。
为了达成上述目的,本发明的解决方案是:
一种实现船舶拟人智能避碰决策的机器学习方法,包括以下步骤:
步骤1、通过离线人工学习和在线机器学习,构建动态避碰知识库:
步骤1.1、通过离线人工学习产生类比匹配推理和范例推理学习的类比源和范例源,构建用以在线获取避碰新知识的避碰模型、存储船舶参数的数据库,并设计自动推理机制、计算单元和关联避让行为的船舶碰撞危险及危险度评估体系;所述计算单元包括运动要素求解模块、目标交会特征识别模块、会遇态势识别模块、本船避让属性识别模块、PIDVCA方案生成模块、PIDVCA方案局部动态优化模块、PIDVCA方案校验与优化模块、协调避让优化模块、紧迫危险协调避让方案生成模块、模拟优良船艺的通用模块、空间搜索模块、时空搜索模块;所述关联避让行为的船舶碰撞危险及危险度评估体系包括船舶潜在危险评判模型、船舶碰撞危险度评判模型和船舶避让效果评估模型;
所述运动要素求解模块用于获取会遇目标的运动要素、碰撞参数和潜在危险评判阈值;目标交会特征识别模块用于获取会遇目标与本船的交会特征;会遇态势识别模块用于获取潜在危险目标与本船形成的会遇态势;本船避让属性识别模块用于获取本船的避让属性;PIDVCA方案生成模块用于生成PIDVCA方案;PIDVCA方案局部动态优化模块用于对能见度不良条件下来自左正横附近目标船的两船会遇场景的PIDVCA方案进行局部优化;PIDVCA方案校验与优化模块用于对多船会遇场景的PIDVCA方案进行校验和优化;协调避让优化模块用于协调目标船在其最佳避让时机执行其让路义务;紧迫危险协调避让方案生成模块用于紧迫危险情况下的协调避让方案;模拟优良船艺的通用模块基于范例源设计、用于模拟海员优良船艺的避让方案;空间搜索模块用于验证PIDVCA方案是否满足自适应危险评判阈值区间;时空搜索模块用于分别在0和最晚避让时机区间内和自适应危险评判阈值区间内搜索避让效果安全等级较高的避让时机及其最大会遇距离,并形成新的PIDVCA方案;船舶潜在危险评判模型用于判断当前会遇船舶是否与本船构成潜在碰撞危险;船舶碰撞危险度评判模型用于实时判断碰撞危险的紧迫程度;船舶避让效果评估模型用于预测PIDVCA方案的执行效果。
步骤1.2、利用所述避碰模型和自动推理机制,通过在线机器学习实现知识发现与近似强化学习策略,获取避碰新知识,构建动态避碰知识库;所述自动推理机制包括在线启发式规则推理、类比匹配推理和范例推理;所述动态避碰知识库包括综合数据库、模型库、规则库、计算单元和动态避碰信息库;
步骤2、推理机通过所述的自动推理机制,调用计算单元、船舶参数和关联避让行为的船舶碰撞危险及危险度评估体系,实现机器智能避碰决策:
步骤S2.1、推理机依次调用运动要素求解模块和潜在危险评判模块,采用在线启发式规则推理并调用避碰模型,获得会遇目标的运动要素、碰撞参数和潜在碰撞危险评判阈值,自动建立关联避让行为的船舶潜在危险评判模型和船舶碰撞危险度评判模型;其次推理机调用目标交会特征识别模块,运用类比匹配推理匹配规则库中的目标交会特征,实现对目标交会特征的感知;
步骤S2.2、根据步骤S2.1对目标交会特征的感知结果,推理机依次调用船舶潜在危险评判模型、会遇态势识别模块和本船避让属性识别模块,运用在线启发式规则推理和类比匹配推理,自动进行目标潜在危险评判、会遇态势和本船避让属性识别,进而确定本船为让路或直航船及其相应的避让措施,再根据本船应采取的避让行动,通过调用船舶碰撞危险度评判模型,得到关联本船避让行为的初始危险度评判;
步骤S2.3、根据初始危险度评判的结果确定避让重点船,推理机调用PIDVCA方案生成模块,确定由避让时机、幅度和预测复航时机构成的初始PIDVCA方案,并进行步骤S2.4;
步骤S2.4、推理机调用船舶避让效果评估模型,对初始PIDVCA方案进行避让效果预测,判断是否可以让清其他碍航物,如果可行则进行步骤S2.6,否则进行步骤S2.5;
步骤S2.5、实施避碰决策方案的校验与优化:
步骤S2.5.1、推理机根据步骤2.2所识别的会遇态势结果进行在线启发式规则推理,如果会遇态势为两船会遇场景且不属于能见度不良条件下来自左正横附近目标船的两船会遇场景,则无需进行决策优化,进行步骤S2.6;如果会遇态势为两船会遇场景且属于能见度不良条件下来自左正横附近目标船的两船会遇场景,则调用PIDVCA方案局部动态优化模块,实施近似强化学习进行决策优化,并进行步骤S2.6;如果目标船为让路船,则调用协调避让优化模块,确保本船直航的权利,实现方案局部优化,并进行步骤S2.6;如果会遇态势为多目标船场景,则进行步骤S2.5.2;
步骤S2.5.2、推理机调用PIDVCA方案生成模块和PIDVCA方案校验与优化模块,根据在线启发式规则推理判断进入相应的校验级别,对避让方案进行校验与优化:
步骤S2.5.2a、一级校验:系统调用模拟优良船艺的通用模块及船舶避让效果评估模型,运用范例推理校验初始PIDVCA方案的可行性,如果可行则进行步骤S2.6;否则调整避让时机,调用PIDVCA方案生成模块重新确定避让幅度及预测复航时机,调用船舶避让效果评估模型,校验PIDVCA方案的可行性,如果可行进行步骤S2.6,否则进行S2.5.2b;
步骤S2.5.2b、二级校验:推理机调用空间搜索模块,验证PIDVCA方案是否满足自适应危险评判阈值区间,如果满足则进行步骤S2.6,否则进行步骤S2.5.2c;
步骤S2.5.2c、三级校验:推理机调用时空搜索模块,搜索避让效果安全等级较高的避让时机及其最大会遇距离,若同时满足则生成新的PIDVCA方案并进行步骤S2.6,否则对PIDVCA方案进行改进:
如果避让重点船尚未更改,则重新确定避让重点船,进行步骤S2.5.2;如果避让重点船已更改,但原方案的避让行动尚未更改,改变原方案的避让行动,调用船舶碰撞危险度评判模型,返回步骤2.3;如果避让重点船和原方案的避让行动都已更改,进行步骤S2.5.2d;
步骤S2.5.2d、四级校验:推理机调用紧迫危险协调避让方案生成模块,提供紧迫危险态势下的协调避让决策实施方案;
步骤S2.6、推理机基于关联避让行为的船舶碰撞危险及危险度评估体系对避碰决策效果进行评价分析:若避让效果属于安全、次安全或欠安全的状态,则执行避让方案;若属于不安全状态,则执行紧迫危险协调避让方案。
所述综合数据库采用数据库表示方法实现对避碰决策过程中所需事实性知识的表示;所述模型库提供概念及决策量化所需的各类避碰模型;所述规则库以产生式规则形式提供局面划分、避碰行动规则和避碰义务分配、海员优良船艺及通常做法的因果关系知识;所述计算单元以元知识形式将数据库、规则库与模型库知识有机融合,提供机器感知、认知及决策的一系列算法;所述动态避碰信息库以数组的形式存放及交互机器自动学习过程产生的中间动态避碰信息。
所述综合数据库包括本船和目标船的导航数据、气象水文信息、船舶基本参数和电子海图的静态数据。
采用上述方法后,本发明通过将动态避碰知识库中的规则库和模型库有机融合,设计目标交会特征识别算法、潜在危险分析算法、会遇态势识别算法、危险度分析评判及避碰效果预测评估算法等一系列PIDVCA算法,使机器在预先设定的推理机制的引导下从现场获取信息及形式化的避碰领域知识,学习到解决任意会遇场景避碰问题的新知识,使机器具备感知目标、认知目标进而制定科学、经济、合理的避碰决策方案,即得到避碰问题的解决方案,使机器具备模拟并超越人解决复杂避碰问题的思维模式。
附图说明
图1为本发明具体实施的流程图。
具体实施方式
为了进一步解释本发明的技术方案,下面通过具体实施例来对本发明进行详细阐述。以下先说明本文中缩略语和关键术语定义:
1.PIDVCA——Personifying Intelligent Decision-making for VesselCollision Avoidance,中文全称“船舶拟人智能避碰决策”;
2.紧迫危险——指单靠一船的行动不能避免碰撞。定义以我船全速满舵改向90°或最近会遇距离DCPA变化最大且小于90°的最大改向角避让能在碰撞临界距离之外通过的两船距离作为紧迫危险临界距离;
3.最晚施舵时机——在目标船保向保速的情况下,单凭本船全速满舵避让90°或最近会遇距离DCPA变化最大且小于90°的最大改向角还能在安全会遇距离外与目标船安全驶过的施舵时机。
本发明为一种实现船舶拟人智能避碰决策的机器学习方法,针对船舶碰撞危险局面的复杂且不可复现性,基于对《规则》的合理量化及体现船员优良船艺及通常做法的避碰决策研究,以及在近似海试实船环境的船舶智能操控仿真平台上进行大量的仿真实验充分验证的基础上,总结了一种基于离线人工学习解决避碰领域专家经验型知识规则化、概念性知识模型化以及过程性元知识的算法表示,构建了动态避碰知识库,为在线机器学习提供技术基础。根据船舶感知系统现场获取的本船、目标船、障碍物及气象数据信息,基于采用离线学习方式建立的各类数学模型、形成的规则和设计的一系列PIDVCA(船舶拟人智能避碰决策)算法,实现机器在线实时感知,认知、分析及实现船舶拟人智能避碰决策的机器学习方法。本发明的具体实施方式为:
一种实现船舶拟人智能避碰决策的机器学习方法,包括以下步骤:
步骤1、通过离线人工学习和在线机器学习,构建动态避碰知识库:
步骤1.1、通过离线人工学习产生类比匹配推理和范例推理学习的类比源和范例源,构建用以在线获取避碰新知识的避碰模型、存储船舶参数的数据库,并设计自动推理机制、计算单元和关联避让行为的船舶碰撞危险及危险度评估体系;所述计算单元包括运动要素求解模块、目标交会特征识别模块、会遇态势识别模块、本船避让属性识别模块、PIDVCA方案生成模块、PIDVCA方案局部动态优化模块、PIDVCA方案校验与优化模块、协调避让优化模块、紧迫危险协调避让方案生成模块、模拟优良船艺的通用模块、空间搜索模块、时空搜索模块;所述关联避让行为的船舶碰撞危险及危险度评估体系包括船舶潜在危险评判模型、船舶碰撞危险度评判模型和船舶避让效果评估模型;
所述运动要素求解模块用于获取会遇目标的运动要素、碰撞参数和潜在危险评判阈值;目标交会特征识别模块用于获取会遇目标与本船的交会特征;会遇态势识别模块用于获取潜在危险目标与本船形成的会遇态势;本船避让属性识别模块用于获取本船的避让属性;PIDVCA方案生成模块用于生成PIDVCA方案;PIDVCA方案局部动态优化模块用于对能见度不良条件下来自左正横附近目标船的两船会遇场景的PIDVCA方案进行局部优化;PIDVCA方案校验与优化模块用于对多船会遇场景的PIDVCA方案进行校验和优化;协调避让优化模块用于协调目标船在其最佳避让时机执行其让路义务;紧迫危险协调避让方案生成模块用于紧迫危险情况下的协调避让方案;模拟优良船艺的通用模块基于范例源设计、用于模拟海员优良船艺的避让方案;空间搜索模块用于验证PIDVCA方案是否满足自适应危险评判阈值区间;时空搜索模块用于分别在0和最晚避让时机区间内和自适应危险评判阈值区间内搜索避让效果安全等级较高的避让时机及其最大会遇距离,并形成新的PIDVCA方案;船舶潜在危险评判模型用于判断当前会遇船舶是否与本船构成潜在碰撞危险;船舶碰撞危险度评判模型用于实时判断碰撞危险的紧迫程度;船舶避让效果评估模型用于预测PIDVCA方案的执行效果;
步骤1.2、利用所述避碰模型和自动推理机制,通过在线机器学习实现知识发现与近似强化学习策略,获取避碰新知识,构建动态避碰知识库;所述自动推理机制包括在线启发式规则推理、类比匹配推理和范例推理;所述动态避碰知识库包括综合数据库、模型库、规则库、计算单元和动态避碰信息库;
上述综合数据库采用数据库表示方法实现对避碰决策过程中所需事实性知识的表示,包括来自船载雷达、AIS、陀螺罗经、计程仪、GPS、ECDIS、能见度仪等导航设备(简称传感器)提供的本船和目标船的导航(数据)及气象水文信息以及船舶基本参数、电子海图的静态数据,如下表1所示;上述模型库提供概念及决策量化所需的各类避碰模型;上述规则库以产生式规则形式提供局面划分、避碰行动规则和避碰义务分配、海员优良船艺及通常做法的因果关系知识;上述计算单元以元知识形式将数据库、规则库与模型库知识有机融合,提供机器感知、认知及决策的一系列算法;上述动态避碰信息库以数组的形式存放及交互机器自动学习过程产生的中间动态避碰信息。
表1 检测物标信息表
步骤2、推理机通过所述的自动推理机制,调用计算单元、船舶参数和关联避让行为的船舶碰撞危险及危险度评估体系,实现机器智能避碰决策。
其中步骤2具体包括以下步骤:
步骤S2.1、推理机依次调用运动要素求解模块和潜在危险评判模块,采用在线启发式规则推理并调用避碰模型,获得会遇目标的运动要素、碰撞参数和潜在碰撞危险评判阈值,自动建立关联避让行为的船舶潜在危险评判模型和船舶碰撞危险度评判模型;其次推理机调用目标交会特征识别模块,运用类比匹配推理匹配规则库中的目标交会特征,实现对目标交会特征的感知;
步骤S2.2、根据步骤S2.1对目标交会特征的感知结果,推理机依次调用船舶潜在危险评判模型、会遇态势识别模块和本船避让属性识别模块,运用在线启发式规则推理和类比匹配推理,自动进行目标潜在危险评判、会遇态势和本船避让属性识别,进而确定本船为让路或直航船及其相应的避让措施,再根据本船应采取的避让行动,通过调用船舶碰撞危险度评判模型,得到关联本船避让行为的初始危险度评判;
步骤S2.3、根据初始危险度评判的结果确定避让重点船,推理机调用PIDVCA方案生成模块,确定由避让时机、幅度和预测复航时机构成的初始PIDVCA方案,并进行步骤S2.4;
步骤S2.4、推理机调用船舶避让效果评估模型,对初始PIDVCA方案进行避让效果预测,判断是否可以让清其他碍航物,如果可行则进行步骤S2.6,否则进行步骤S2.5;
步骤S2.5、实施避碰决策方案的校验与优化:
步骤S2.5.1、推理机根据步骤2.2所识别的会遇态势结果进行在线启发式规则推理,如果会遇态势为两船会遇场景且不属于能见度不良条件下来自左正横附近目标船的两船会遇场景,则无需进行决策优化,进行步骤S2.6;如果会遇态势为两船会遇场景且属于能见度不良条件下来自左正横附近目标船的两船会遇场景,则调用PIDVCA方案局部动态优化模块,实施近似强化学习进行决策优化,并进行步骤S2.6;如果目标船为让路船,则调用协调避让优化模块,确保本船直航的权利,实现方案局部优化,并进行步骤S2.6;如果会遇态势为多目标船场景,则进行步骤S2.5.2;
步骤S2.5.2、推理机调用PIDVCA方案生成模块和PIDVCA方案校验与优化模块,根据在线启发式规则推理判断进入相应的校验级别,对避让方案进行校验与优化:
步骤S2.5.2a、一级校验:系统调用模拟优良船艺的通用模块及船舶避让效果评估模型,运用范例推理校验初始PIDVCA方案的可行性,如果可行则进行步骤S2.6;否则调整避让时机,调用PIDVCA方案生成模块重新确定避让幅度及预测复航时机,调用船舶避让效果评估模型,校验PIDVCA方案的可行性,如果可行进行步骤S2.6,否则进行S2.5.2b;
步骤S2.5.2b、二级校验:推理机调用空间搜索模块,验证PIDVCA方案是否满足自适应危险评判阈值区间,如果满足则进行步骤S2.6,否则进行步骤S2.5.2c;
步骤S2.5.2c、三级校验:推理机调用时空搜索模块,搜索避让效果安全等级较高的避让时机及其最大会遇距离,若同时满足则生成新的PIDVCA方案并进行步骤S2.6,否则对PIDVCA方案进行改进:
如果避让重点船尚未更改,则重新确定避让重点船,进行步骤S2.5.2;如果避让重点船已更改,但原方案的避让行动尚未更改,改变原方案的避让行动,调用船舶碰撞危险度评判模型,返回步骤2.3;如果避让重点船和原方案的避让行动都已更改,进行步骤S2.5.2d;
步骤S2.5.2d、四级校验:推理机调用紧迫危险协调避让方案生成模块,提供紧迫危险态势下的协调避让决策实施方案;
步骤S2.6、推理机基于关联避让行为的船舶碰撞危险及危险度评估体系对避碰决策效果进行评价分析:若避让效果属于安全、次安全或欠安全的状态,则执行避让方案;若属于不安全状态,则执行紧迫危险协调避让方案。
通过离线人工学习获取静态避碰知识,建立以过程性知识为载体的异构知识表示,采用预先制定的自动推理机制,引导机器基于现场获取的动静态目标及静态避碰知识,采用集成学习策略自我学习实时获取动态避碰知识,构建动态避碰知识库,对任一会遇态势形成更科学合理经济有效的避让决策。具体表现在:(1)自动感知目标:对船舶的运动状态和交会特征进行识别。(2)自动认知目标:对进行船舶潜在危险判断、会遇态势识别和危险度评判。(3)自动生成、校验、优化决策,并对避让效果进行预测评估。
通过上述方法,其关键点在于通过将动态知识库中的规则库和模型库有机融合,设计目标交会特征识别算法、潜在危险分析算法、会遇态势识别算法、危险度分析评判及避碰效果预测评估算法等一系列PIDVCA算法,使机器在预先设定的推理机制的引导下从现场获取信息及形式化的避碰领域知识,学习到解决任意会遇场景避碰问题的新知识,使机器具备感知目标、认知目标进而制定科学、经济、合理的避碰决策方案,即得到避碰问题的解决方案,使机器具备模拟并超越人解决复杂避碰问题的思维模式。
上述实施例和图式并非限定本发明的产品形态和式样,任何所属技术领域的普通技术人员对其所做的适当变化或修饰,皆应视为不脱离本发明的专利范畴。
Claims (3)
1.一种实现船舶拟人智能避碰决策的机器学习方法,其特征在于包括以下步骤:
步骤1、通过离线人工学习和在线机器学习,构建动态避碰知识库:
步骤1.1、通过离线人工学习产生类比匹配推理和范例推理学习的类比源和范例源,构建用以在线获取避碰新知识的避碰模型、存储船舶参数的数据库,并设计自动推理机制、计算单元和关联避让行为的船舶碰撞危险及危险度评估体系;所述计算单元包括运动要素求解模块、目标交会特征识别模块、会遇态势识别模块、本船避让属性识别模块、PIDVCA方案生成模块、PIDVCA方案局部动态优化模块、PIDVCA方案校验与优化模块、协调避让优化模块、紧迫危险协调避让方案生成模块、模拟优良船艺的通用模块、空间搜索模块、时空搜索模块;所述关联避让行为的船舶碰撞危险及危险度评估体系包括船舶潜在危险评判模型、船舶碰撞危险度评判模型和船舶避让效果评估模型;
所述运动要素求解模块用于获取会遇目标的运动要素、碰撞参数和潜在危险评判阈值;目标交会特征识别模块用于获取会遇目标与本船的交会特征;会遇态势识别模块用于获取潜在危险目标与本船形成的会遇态势;本船避让属性识别模块用于获取本船的避让属性;PIDVCA方案生成模块用于生成PIDVCA方案;PIDVCA方案局部动态优化模块用于对能见度不良条件下来自左正横附近目标船的两船会遇场景的PIDVCA方案进行局部优化;PIDVCA方案校验与优化模块用于对多船会遇场景的PIDVCA方案进行校验和优化;协调避让优化模块用于协调目标船在其最佳避让时机执行其让路义务;紧迫危险协调避让方案生成模块用于紧迫危险情况下的协调避让方案;模拟优良船艺的通用模块基于范例源设计、用于模拟海员优良船艺的避让方案;空间搜索模块用于验证PIDVCA方案是否满足自适应危险评判阈值区间;时空搜索模块用于分别在0和最晚避让时机区间内和自适应危险评判阈值区间内搜索避让效果安全等级较高的避让时机及其最大会遇距离,并形成新的PIDVCA方案;船舶潜在危险评判模型用于判断当前会遇船舶是否与本船构成潜在碰撞危险;船舶碰撞危险度评判模型用于实时判断碰撞危险的紧迫程度;船舶避让效果评估模型用于预测PIDVCA方案的执行效果;
步骤1.2、利用所述避碰模型和自动推理机制,通过在线机器学习实现知识发现与近似强化学习策略,获取避碰新知识,构建动态避碰知识库;所述自动推理机制包括在线启发式规则推理、类比匹配推理和范例推理;所述动态避碰知识库包括综合数据库、模型库、规则库、计算单元和动态避碰信息库;
步骤2、推理机通过所述的自动推理机制,调用计算单元、船舶参数和关联避让行为的船舶碰撞危险及危险度评估体系,实现机器智能避碰决策:
步骤S2.1、推理机依次调用运动要素求解模块和潜在危险评判模块,采用在线启发式规则推理并调用避碰模型,获得会遇目标的运动要素、碰撞参数和潜在碰撞危险评判阈值,自动建立关联避让行为的船舶潜在危险评判模型和船舶碰撞危险度评判模型;其次推理机调用目标交会特征识别模块,运用类比匹配推理匹配规则库中的目标交会特征,实现对目标交会特征的感知;
步骤S2.2、根据步骤S2.1对目标交会特征的感知结果,推理机依次调用船舶潜在危险评判模型、会遇态势识别模块和本船避让属性识别模块,运用在线启发式规则推理和类比匹配推理,自动进行目标潜在危险评判、会遇态势和本船避让属性识别,进而确定本船为让路或直航船及其相应的避让措施,再根据本船应采取的避让行动,通过调用船舶碰撞危险度评判模型,得到关联本船避让行为的初始危险度评判;
步骤S2.3、根据初始危险度评判的结果确定避让重点船,推理机调用PIDVCA方案生成模块,确定由避让时机、幅度和预测复航时机构成的初始PIDVCA方案,并进行步骤S2.4;
步骤S2.4、推理机调用船舶避让效果评估模型,对初始PIDVCA方案进行避让效果预测,判断是否可以让清其他碍航物,如果可行则进行步骤S2.6,否则进行步骤S2.5;
步骤S2.5、实施避碰决策方案的校验与优化:
步骤S2.5.1、推理机根据步骤2.2所识别的会遇态势结果进行在线启发式规则推理,如果会遇态势为两船会遇场景且不属于能见度不良条件下来自左正横附近目标船的两船会遇场景,则无需进行决策优化,进行步骤S2.6;如果会遇态势为两船会遇场景且属于能见度不良条件下来自左正横附近目标船的两船会遇场景,则调用PIDVCA方案局部动态优化模块,实施近似强化学习进行决策优化,并进行步骤S2.6;如果目标船为让路船,则调用协调避让优化模块,确保本船直航的权利,实现方案局部优化,并进行步骤S2.6;如果会遇态势为多目标船场景,则进行步骤S2.5.2;
步骤S2.5.2、推理机调用PIDVCA方案生成模块和PIDVCA方案校验与优化模块,根据在线启发式规则推理判断进入相应的校验级别,对避让方案进行校验与优化:
步骤S2.5.2a、一级校验:系统调用模拟优良船艺的通用模块及船舶避让效果评估模型,运用范例推理校验初始PIDVCA方案的可行性,如果可行则进行步骤S2.6;否则调整避让时机,调用PIDVCA方案生成模块重新确定避让幅度及预测复航时机,调用船舶避让效果评估模型,校验PIDVCA方案的可行性,如果可行进行步骤S2.6,否则进行S2.5.2b;
步骤S2.5.2b、二级校验:推理机调用空间搜索模块,验证PIDVCA方案是否满足自适应危险评判阈值区间,如果满足则进行步骤S2.6,否则进行步骤S2.5.2c;
步骤S2.5.2c、三级校验:推理机调用时空搜索模块,搜索避让效果安全等级较高的避让时机及其最大会遇距离,若同时满足则生成新的PIDVCA方案并进行步骤S2.6,否则对PIDVCA方案进行改进:
如果避让重点船尚未更改,则重新确定避让重点船,进行步骤S2.5.2;如果避让重点船已更改,但原方案的避让行动尚未更改,改变原方案的避让行动,调用船舶碰撞危险度评判模型,返回步骤2.3;如果避让重点船和原方案的避让行动都已更改,进行步骤S2.5.2d;
步骤S2.5.2d、四级校验:推理机调用紧迫危险协调避让方案生成模块,提供紧迫危险态势下的协调避让决策实施方案;
步骤S2.6、推理机基于关联避让行为的船舶碰撞危险及危险度评估体系对避碰决策效果进行评价分析:若避让效果属于安全、次安全或欠安全的状态,则执行避让方案;若属于不安全状态,则执行紧迫危险协调避让方案;
所述PIDVCA为Personifying Intelligent Decision-making for Vessel CollisionAvoidance的缩写,中文全称“船舶拟人智能避碰决策”。
2.如权利要求1所述的一种实现船舶拟人智能避碰决策的机器学习方法,其特征在于:
所述综合数据库采用数据库表示方法实现对避碰决策过程中所需事实性知识的表示;所述模型库提供概念及决策量化所需的各类避碰模型;所述规则库以产生式规则形式提供局面划分、避碰行动规则和避碰义务分配、海员优良船艺及通常做法的因果关系知识;所述计算单元以元知识形式将数据库、规则库与模型库知识有机融合,提供机器感知、认知及决策的一系列算法;所述动态避碰信息库以数组的形式存放及交互机器自动学习过程产生的中间动态避碰信息。
3.如权利要求2所述的一种实现船舶拟人智能避碰决策的机器学习方法,其特征在于:
所述综合数据库包括本船和目标船的导航数据、气象水文信息、船舶基本参数和电子海图的静态数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910318860.2A CN110083155B (zh) | 2019-04-19 | 2019-04-19 | 一种实现船舶拟人智能避碰决策的机器学习方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910318860.2A CN110083155B (zh) | 2019-04-19 | 2019-04-19 | 一种实现船舶拟人智能避碰决策的机器学习方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110083155A CN110083155A (zh) | 2019-08-02 |
CN110083155B true CN110083155B (zh) | 2022-05-13 |
Family
ID=67415743
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910318860.2A Active CN110083155B (zh) | 2019-04-19 | 2019-04-19 | 一种实现船舶拟人智能避碰决策的机器学习方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110083155B (zh) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111176271B (zh) * | 2019-11-21 | 2023-05-02 | 智慧航海(青岛)科技有限公司 | 基于岸基雷达的智能船舶避碰辅助决策系统及其实现方法 |
CN111186549B (zh) * | 2020-01-15 | 2021-08-17 | 大连海事大学 | 一种具有船舶避碰功能的航向自动舵控制系统 |
CN111445086B (zh) * | 2020-04-17 | 2022-07-26 | 集美大学 | 一种基于pidvca预测复航时间的方法 |
CN111897326B (zh) * | 2020-07-07 | 2024-06-14 | 智慧航海(青岛)科技有限公司 | 一种基于循迹航行的自主驾驶船舶避碰时机确定方法 |
CN112200319A (zh) * | 2020-10-20 | 2021-01-08 | 北京计算机技术及应用研究所 | 一种实现无人车导航避障的规则推理方法及系统 |
CN112381237B (zh) * | 2020-12-09 | 2022-04-22 | 中国船舶工业系统工程研究院 | 基于岸海协同的水面无人系统的持续自主学习架构系统 |
CN113076338B (zh) * | 2021-02-04 | 2023-02-28 | 中国船级社 | 一种基于规则的智能船舶避碰自动测试场景生成方法及系统 |
CN113093730B (zh) * | 2021-03-08 | 2022-04-26 | 武汉大学 | 一种基于状态策略知识库指导的智能体自主避障方法 |
CN114550499B (zh) * | 2022-02-14 | 2024-06-18 | 武汉理工大学 | 融合COLREGs场景知识的船舶智能避碰方法及装置 |
CN114547332B (zh) * | 2022-02-14 | 2024-09-06 | 武汉理工大学 | 国际海上避碰规则知识图谱的构建方法及推理装置 |
CN115268472B (zh) * | 2022-09-28 | 2022-12-20 | 天津大学 | 一种基于机器语言表达的船舶智能航行避碰行为编码方法 |
CN115657663A (zh) * | 2022-09-30 | 2023-01-31 | 中船航海科技有限责任公司 | 一种狭窄水域船舶避碰算法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20110009983A (ko) * | 2009-07-23 | 2011-01-31 | 현대중공업 주식회사 | 선박용 충돌 회피 시스템 및 이를 사용한 충돌 회피 방법 |
PL389638A1 (pl) * | 2009-11-26 | 2010-06-21 | Akademia Morska W Szczecinie | Sposób i układ wspomagania decyzji nawigacyjnych, w procesie bezpiecznego prowadzenia obiektu pływającego |
CN103198719B (zh) * | 2013-03-27 | 2015-02-04 | 集美大学 | 基于pidvca原理的两船协调避让的优化方法 |
CN105390029B (zh) * | 2015-11-06 | 2019-04-26 | 武汉理工大学 | 基于航迹融合和航迹预测的船舶避碰辅助决策方法及系统 |
CN107577230B (zh) * | 2017-08-16 | 2020-01-14 | 武汉理工大学 | 一种面向无人船的智能避碰系统 |
CN108630017A (zh) * | 2018-05-04 | 2018-10-09 | 上海海洋大学 | 一种船舶航行避碰方法及系统 |
-
2019
- 2019-04-19 CN CN201910318860.2A patent/CN110083155B/zh active Active
Non-Patent Citations (2)
Title |
---|
Automation Method for Personifying Intelligent Decision-making for Vessel Collision Avoidance;Lina Li,et al.;《2008 IEEE International Conference on Automation and Logistics》;20080930;第1876-1881页 * |
Mechanism and simulation of Personifying Intelligent Decision-making for Vessel Collision Avoidance;Guoquan Chen,et al.;《2010 International Conference on Computer Application and System Modeling (ICCASM 2010)》;20101104;第681-684页 * |
Also Published As
Publication number | Publication date |
---|---|
CN110083155A (zh) | 2019-08-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110083155B (zh) | 一种实现船舶拟人智能避碰决策的机器学习方法 | |
Chun et al. | Deep reinforcement learning-based collision avoidance for an autonomous ship | |
Tam et al. | Review of collision avoidance and path planning methods for ships in close range encounters | |
Perera et al. | Intelligent ocean navigation and fuzzy-Bayesian decision/action formulation | |
Bakdi et al. | Fullest COLREGs evaluation using fuzzy logic for collaborative decision-making analysis of autonomous ships in complex situations | |
CN110400491A (zh) | 一种宽水域多目标辅助避碰决策方法及决策系统 | |
Junmin et al. | Mechanism of dynamic automatic collision avoidance and the optimal route in multi-ship encounter situations | |
Yan et al. | A novel path planning approach for smart cargo ships based on anisotropic fast marching | |
Wang et al. | Multi-ship encounter situation adaptive understanding by individual navigation intention inference | |
Shi et al. | Fuzzy logic-based modeling method for regional multi-ship collision risk assessment considering impacts of ship crossing angle and navigational environment | |
Pedrielli et al. | A real time simulation optimization framework for vessel collision avoidance and the case of singapore strait | |
Li et al. | Distributed multi-objective algorithm for preventing multi-ship collisions at sea | |
Du et al. | An optimized path planning method for coastal ships based on improved DDPG and DP | |
Li et al. | Towards real-time ship collision risk analysis: An improved R-TCR model considering target ship motion uncertainty | |
CN114464014A (zh) | 基于模糊逻辑的区域船舶碰撞风险处理方法、系统和介质 | |
Yang et al. | Improved reinforcement learning for collision-free local path planning of dynamic obstacle | |
Hansen et al. | Colregs-based situation awareness for marine vessels-a discrete event systems approach | |
Shu et al. | Reference path for ships in ports and waterways based on optimal control | |
Vagale et al. | Evaluation of path planning algorithms of autonomous surface vehicles based on safety and collision risk assessment | |
Liu et al. | Coordinated multi-stage and multi-objective optimization approach for ship collision avoidance decision-making | |
Yang et al. | Online risk modeling of autonomous marine systems: case study of autonomous operations under sea ice | |
Zhang et al. | Collision avoidance method for autonomous ships based on modified velocity obstacle and collision risk index | |
Chang et al. | COLREG and MASS: Analytical review to identify research trends and gaps in the Development of Autonomous Collision Avoidance | |
Cheng et al. | A probabilistic decision-making system for joining traffic lanes within an inland traffic separation scheme | |
Liu et al. | A novel data-driven method of ship collision risk evolution evaluation during real encounter situations |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |