CN114862095A - 识别复杂水域船舶交通冲突热点的区域交通划分方法 - Google Patents

识别复杂水域船舶交通冲突热点的区域交通划分方法 Download PDF

Info

Publication number
CN114862095A
CN114862095A CN202210278237.0A CN202210278237A CN114862095A CN 114862095 A CN114862095 A CN 114862095A CN 202210278237 A CN202210278237 A CN 202210278237A CN 114862095 A CN114862095 A CN 114862095A
Authority
CN
China
Prior art keywords
traffic
conflict
cluster
ship
distance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210278237.0A
Other languages
English (en)
Inventor
刘克中
辛旭日
王伟强
吴晓烈
袁志涛
陈默子
王晶尧
刘炯炯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University of Technology WUT
Original Assignee
Wuhan University of Technology WUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University of Technology WUT filed Critical Wuhan University of Technology WUT
Priority to CN202210278237.0A priority Critical patent/CN114862095A/zh
Publication of CN114862095A publication Critical patent/CN114862095A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06312Adjustment or analysis of established resource schedule, e.g. resource or task levelling, or dynamic rescheduling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06313Resource planning in a project environment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A10/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE at coastal zones; at river basins
    • Y02A10/40Controlling or monitoring, e.g. of flood or hurricane; Forecasting, e.g. risk assessment or mapping

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Development Economics (AREA)
  • Operations Research (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Educational Administration (AREA)
  • Evolutionary Biology (AREA)
  • Game Theory and Decision Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Quality & Reliability (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明公开一种识别复杂水域船舶交通冲突热点的区域交通划分方法,包括;基于船舶AIS轨迹数据进行概率冲突检测,获取船舶之间的冲突严重度;基于获取的冲突严重度构建复合距离度量模型,并基于度量结果,利用约束SSN聚类算法进行聚类;基于分层双目标优化算法,获取最优聚类解。本发明通过概率冲突检测处理交通运动的动态性和扰动;通过设计扩展聚类算法保证冲突连接性和空间紧凑性,以便将区域船舶交通划分为多个簇;通过制定分层双目标优化算法,以生成能够适应船舶交通动态变化的鲁棒性聚类方案,从而能够在高密度水域中找到具有强冲突连接性和高密度的交通集群,对各种交通场景具有适应的鲁棒性,并在船舶运动不确定性的情况下具有良好的表现。

Description

识别复杂水域船舶交通冲突热点的区域交通划分方法
技术领域
本发明涉及海上交通运输安全技术领域,具体为一种识别复杂水域船舶交通冲突热点的区域交通划分方法。
背景技术
海上安全管理一直被视为最重要的关注点之一。因为一旦发生海上交通事故,会产生不可容忍的后果,如生命损失、经济损失和/或环境污染。与运输需求快速增长相关的经济全球化使得海上交通变得更加繁忙、风险更大,特别是在受限航道和交通繁忙的港口。这往往会给海事监管部门的交通安全管理带来重大的潜在挑战,并在一定程度上增加事故发生的可能性。为了应对这些挑战,一些先进的设备和系统,如船舶交通服务(VTS)系统、海上交通服务网络和陆地雷达被设计以协助监管人员进行海上交通监控。尽管这些设施在监控海上交通行为方面提供了各种各样的智能功能,但它们在自动和自适应地识别实时局部冲突热点区域方面仍然存在一些缺陷。因此,海上交通监管人员必须根据他们的经验和直觉来识别高碰撞风险船舶交通集群,这大大增加了他们的工作量,阻碍了风险控制策略的及时实施。因此,在智能交通支持系统的开发的背景下,有必要开发新的先进技术和工具,以进一步增强海上交通态势感知能力。
为了提高繁忙水域船舶交通的运行安全性,各种定量风险分析方法已经被提出。这些方法是海上交通安全监测和管理的先决条件,使监管人员能够发布碰撞预警,并为决策提供重要支持。特别是,自动识别系统(AIS)的发展有助于获取大量基于AIS的轨迹数据,以增强船舶碰撞风险预测和评估的能力。随着数据质量的提高和获取性的改善,AIS数据的应用已从航行安全扩展到更广泛范围。其中,基于实时轨迹信息检测船舶集群成为一个新兴的研究课题。它对识别潜在高风险区域和了解局部船舶交通模式起着至关重要的作用。然而,现有的研究仍然存在一些不足,如忽略或简化船舶动态性、只关注交通密度、难以发现具有不同交通密度的集群。因此,在涉及不同交通密度和动态交通行为的复杂场景中,现有方法的应用无效且不可行。对于复杂水域中的实时冲突热点识别,需要充分考虑以下因素:1)船舶运动的时空动态和不确定性;2)会遇船舶的冲突连接性和空间紧凑性。因此,开发更先进的模型来捕获高风险的交通集群需要迫切解决。
发明内容
为克服上述现有技术的不足,本发明提供一种识别复杂水域船舶交通冲突热点的区域交通划分方法,以达到自动和自适应地发现高风险的多船会遇局面的效果。
本发明是通过以下技术方案予以实现的:
识别复杂水域船舶交通冲突热点的区域交通划分方法,包括;
基于船舶AIS轨迹数据进行概率冲突检测,获取船舶之间的冲突严重度;
基于获取的冲突严重度构建复合距离度量模型,并基于度量结果,利用约束SSN聚类算法进行聚类;
基于分层双目标优化算法,获取最优聚类解。
上述技术方案首先通过概率冲突检测处理交通运动的动态性和扰动;接着通过设计扩展聚类算法保证冲突连接性和空间紧凑性,以便于将区域船舶交通划分为多个簇;然后制定分层双目标优化算法,以生成能够适应船舶交通动态变化的鲁棒性聚类方案,从而能够在高密度水域中找到具有强冲突连接性和高密度的交通集群,对各种交通场景具有适应的鲁棒性,并且在船舶运动不确定性的情况下具有良好的表现。
作为进一步的技术方案,所述方法进一步包括:获取船舶的AIS轨迹数据;进行不确定性模式提取;进行船舶不确定运动预测;进行概率冲突检测。AIS轨迹数据涵盖静态属性和动态属性。在进行不确定性模式提取时,采用了核密度估计和Douglas-Peucker算法。基于提取的不确定性模式,结合船舶航行计划,进行船舶不确定运动预测。
作为进一步的技术方案,复合距离度量模型定义如下:
Figure BDA0003556947600000021
其中,distij表示船舶i和j之间的实际距离;C(γ)ij表示冲突严重度;R1和R2表示特定的参数,以将冲突严重程度分为三组:不可容忍、ALARP和可忽略。上式中的第一部分有助于将具有不可容忍冲突严重度的船舶合并在一起(它们之间的距离为0),第二部分使用权重来加强具有ALARP冲突严重度的船舶之间的连接关系,而第三部分表明可忽略的冲突严重度不影响距离度量。
作为进一步的技术方案,在利用约束SSN聚类算法进行聚类后,进行微调策略,包括:异常点删除及异常点添加。在聚类过程中,有时会将一些船舶分配到不适当的聚类中。这可能由以下事实来解释:1)船舶交通由于受到各种干扰在空间中的分布是随机的,在某些情况下具有不明显的集群分布特征。2)SNN度量考虑对象的k近邻列表之间的重叠,而不是恒定的密度值,以在非均匀区域中找到簇。对于复杂的交通场景,它可能导致形成密度差异显著的集群。因此,提出了一种微调策略,以进一步将船舶分配到适当的集群。
作为进一步的技术方案,异常点删除进一步包括:在同一簇中确定每个点与其第二近邻的邻接距离,并对所有的邻接距离进行排序,若具有最大邻接距离的点满足以下条件,
(1)它的邻接距离大于第三大邻接距离的预设倍,
(2)它与同一簇中的点没有不可容忍或ALARP的冲突,
则将该点设置为异常点,并以迭代的方式删除异常点。
通常,先进行异常点删除,再执行异常点添加。
作为进一步的技术方案,异常点添加进一步包括:假设异常点属于距离异常点最近的簇,计算异常点与簇中其他点之间的平均距离,当异常点的平均距离不是最大时,添加异常点到簇中;对于具有不可容忍或ALARP冲突关系的异常点,只有当这些异常点同时满足距离要求时,才添加这些异常点到簇中。
作为进一步的技术方案,分层双目标优化算法进一步包括:
基于网格搜索策略生成候选集;
在预处理阶段消除不可行的解决方案,主要考虑三个约束条件:1)数据集的噪声/离群值比率应小于noise_percent;2)生成的集群数量应大于min_nc;3)每个簇中的点数应不小于min_np;
从可行解池中搜索非支配解集,以保证所形成的簇的冲突连接性且空间紧凑性。
作为进一步的技术方案,冲突连接性基于存在冲突船舶对未被分配到同一集群的程度来度量,如下所示:
Figure BDA0003556947600000031
其中,Nvc代表没有分配到同一个簇中的冲突对的数量,C(γ)i代表冲突严重度,VCC越小,冲突连接性越好;
空间紧凑性基于CH指标进行度量,如下所示:
Figure BDA0003556947600000032
其中n是样本数,c是簇的个数,nk是属于第k个簇的样本数,zk是第k个簇的中心,z是整个数据集的中心,CH指标越大,簇间距离越大,簇内距离越小,所产生的簇的空间紧凑性越好。
与现有技术相比,本发明的有益效果在于:
(1)本发明所提出的区域交通划分方法通过整合冲突连接性和会遇船舶的密度紧凑性,有效、可靠地捕获和识别局部交通集群。与现有的相关研究相比,该方法有助于监管人员更好地理解和揭示局部交通冲突模式。
(2)本发明通过有效地组合相似性度量、约束SNN聚类和微调策略,提出了一种新的密度聚类方法,它通过将冲突关系纳入船舶之间的距离测量中以提供一个强有力的相似性度量模型,能够将高冲突船舶对分配到相同的集群,并且能够处理具有不同交通密度的场景,从而使其在复杂的海上交通水域中具有可行性和适用性。
(3)本发明为了找到最优的聚类解,设计了一种基于网格搜索策略的分层双目标优化算法,该算法通过明确考虑不同目标之间的层次优先级,对各种交通场景具有实用性和鲁棒性。
附图说明
图1为根据本发明实施例的识别复杂水域船舶交通冲突热点的区域交通划分方法的流程示意图。
图2为根据本发明实施例的船舶之间冲突定义的示意图。
图3(a)-(c)为根据本发明实施例基于异常点删除可以改进的典型簇示意图。
图4(a)-(b)为根据本发明实施例基于异常点添加可以改进的典型簇示意图。
图5为根据本发明实施例的宁波舟山港核心港区示意图。
图6(a)-(d)为根据本发明实施例的区域船舶交通聚类结果示意图。
图7为根据本发明实施例的一小时内区域和局部最大船舶交通密度和冲突严重度的演变示意图。
图8为根据本发明实施例的具有可行解决方案的船舶交通场景的百分比示意图。
图9为根据本发明实施例的多算法比较示意图。
图10(a)-(c)为根据本发明实施例的不同交通场景下扩展聚类方法与其他方法的比较示意图。
具体实施方式
以下将结合附图对本发明各实施例的技术方案进行清楚、完整的描述,显然,所描述发实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施例,都属于本发明所保护的范围。
本发明提供一种识别复杂水域船舶交通冲突热点的区域交通划分方法,以自动和自适应地发现高风险的多船会遇局面。本发明不关注监管水域内两船之间或整个全局交通的碰撞风险,而是重视捕获和识别局部冲突热点。为了实现这一目标,本发明首先提出了一种概率冲突检测方法,该方法可以处理交通运动的动态性和扰动。然后,一种能够保证冲突连接性和空间紧凑性扩展的聚类算法被设计,用于将区域船舶交通划分为多个簇。此外,还制定了一个分层双目标优化算法作为该方法框架的一个组成部分,以生成能够适应船舶交通动态变化的鲁棒性聚类方案。最后,通过在港口采集的基于AIS的轨迹数据,对所提出的模型进行了性能评估。
如图1所示,本发明所提出方法由三个模块组成:1)执行概率冲突检测,2)执行扩展聚类算法,3)搜寻分层优化聚类结果。这些模块通过一系列相关步骤进行编排和集成,以识别具有高风险/高密度的实时多船集群。每个模块中关键技术的详细描述在下面具体强调。
(1)执行概率冲突检测
为了使碰撞检测方法能够适应交通繁忙的复杂水域,本发明从概率风险的角度开发了一种概率冲突方法。它考虑了船舶时空运动固有的动态和不确定性的影响,为捕捉高风险热点和发现隐藏的交通冲突模式提供了基础。提出的冲突侦测方法涉及两个重要部分:1)冲突定义和特征描述;2)冲突严重性度量。
船舶冲突通常是指会遇船舶在将来一段时间内违反最小安全距离。本发明采用了适用于受限水域的经典船舶域模型,以定义船舶之间的冲突。图2中提供了冲突识别示例。当公式(1)在未来一段时间范围内被满足时,两船之间视为存在潜在冲突:
DistAB(t)≤SDA(t)+SDB(t) (1)
其中,DistAB表示船舶之间的距离,SDA和SDB分别表示从每个船舶中心到其船舶领域边界的距离。
由于各种不确定性会影响船舶的未来轨迹,因此公式(1)是否满足是一个概率问题。假设船舶之间的不安全间隔的概率密度函数(即船舶A和B之间的距离小于或等于安全间隔要求)由fL(t)定义,冲突在时间t的瞬时发生概率如下所示:
Figure BDA0003556947600000061
其中,L(t)代表Dist(t)-SDA(t)-SDB(t)。
为了有效地量化未来一段时间内会遇船舶之间的潜在碰撞风险,本发明通过结合最大冲突概率及其发生的时间设计一个实用的冲突严重性度量方法。这两项指标类似于DCPA和TCPA,在安全航行中同时发挥着重要的作用。一个反映了冲突发生的最大强度,而另一个反映了冲突消解的难度,因为预留时间越少,消解冲突的机会越少。因此,采用指数函数对其进行融合,如下表示:
Figure BDA0003556947600000062
其中,MPC是预测时间范围内的最大的PC(t),tMPC代表最大冲突概率的发生时间,T代表预测时间范围。
概率冲突估计在实际应用中需要重点考虑两个因素:1)未来船舶运动不确定性建模,即未来预测轨迹的概率密度函数;2)实时冲突概率计算。为了解决这些问题,本发明引入了概率冲突侦测框架,其中采用船舶运动不确定模型来处理不确定轨迹预测,并设计了两阶段蒙特卡罗模拟算法来高效准确地计算冲突严重度。两阶段蒙特卡罗模拟算法的具体步骤详见公开号CN112966332A的中国专利于2021年6月15日所公开的内容。
关于轨迹预测,交互感知预测被认为是最准确的方法。这可以归因于这样一个事实,即它允许船舶之间进行通信,而每艘船舶对自己意图有更好的了解。意图信息通常指船舶的计划轨迹,包括一系列航路点,例如WPi=1,2,…,n+1。因此,我们假设会遇船舶之间通过交互交换其航行计划。
为了考虑船舶运动动力和不确定性的影响,我们将与航行计划相关的确定性运动和与各种干扰相关的不确定性运动相结合,构建了船舶运动模型。它由三个主要部分组成:1)显示船舶物理运动的连续动态;2)与航行计划一致的离散动态;3)由各种扰动(例如环境、机械和人为因素)导致的随机分量。在此基础上,我们可以使用公式(4)预测船舶在时间T的瞬时位置。
Figure BDA0003556947600000071
其中,tc是当前的时刻,
Figure BDA0003556947600000072
代表船舶A的初始位置,
Figure BDA0003556947600000073
定义了船舶的标定速度,
Figure BDA0003556947600000074
代表与船舶标定航向相关的旋转矩阵,
Figure BDA0003556947600000075
代表船舶预测位置的不确定组成。根据预测的不确定轨迹,可以进一步计算瞬时冲突的发生概率。
关于冲突概率计算,本发明提供了一个两阶段蒙特卡洛仿真算法,以允许快速准确地估计冲突严重度。它是根据这样一个事实设计的,即我们关注预测范围内的最大冲突概率。因此,在执行大量蒙特卡洛迭代之前,我们粗略地提取具有高冲突概率的时间点。此外,本发明将Hoeffding不等式集成到模型中,以确定逼近效果的定量边界。结果表明,该算法实现了对冲突严重性的高效、稳健计算。
(2)执行扩展聚类算法
如上所述,本发明旨在开发一种将区域船舶交通划分为多个集群的方法,以实现两个基本要求:(1)冲突连接性和(2)空间紧凑性。冲突连接的船舶交通集群意味着具有高冲突严重度的船舶被分配到同一集群,而空间紧凑集群则意味着船舶根据其在空间上的接近程度被组织在一起。这两个目标对于降解区域船舶交通风险和进一步进行局部态势感知至关重要。
本质上,这两个标准有时相互冲突。这是因为船舶之间的冲突严重程度并不完全与密度有关。它还受到会遇船舶之间的收敛趋势、空间接近率、大小、速度等的影响。因此,本发明引入了一种扩展的聚类方法来解决这个问题。首先设计复合距离度量,将冲突连接性和密度紧凑性结合在一起。基于距离度量结果,进一步利用约束SSN聚类算法进行聚类。最后应用微调策略,确保所有船舶都被分配到合适的集群中。
距离度量是实现聚类算法的重要组成部分。因此,有必要开发一种新的距离度量来帮助聚类方法满足上述提及的两个划分标准。在实践中,冲突连接性比密度紧密性更受监管人员关注。这是因为高冲突严重度明确意味着存在潜在的碰撞风险,而高交通密度仅能表征交通状况复杂。此外,风险状态基于概率和/或后果可分为三类:不可容忍、尽可能低(ALARP)和可忽略。不可容忍状态表示必须采取措施消除或控制风险;ALARP状态表示当采取一些解决方案将风险降低到合理可行的最低水平时可以接受风险;可忽略的状态表明如果在操作过程中保持现有风险则无需进一步采取策略。
基于风险属性和本发明揭示实际冲突模式的目标,本发明提出了一个复合距离度量模型,通过将冲突严重度嵌入实际距离以支持鲁棒性距离度量,其定义如下:
Figure BDA0003556947600000081
其中,distij表示船舶i和j之间的实际距离,R1和R2表示特定的参数,以将冲突严重程度分为三组(即不可容忍、ALARP和可忽略)。等式(5)中的第一部分有助于将具有不可容忍冲突严重度的船舶合并在一起(它们之间的距离为0),第二部分使用权重来加强具有ALARP冲突严重度的船舶之间的连接关系,而第三部分表明可忽略的冲突严重度不影响距离度量。
聚类是一种典型的无监督学习技术,它基于相似性度量将数据集划分为多个簇。它已经被应用在许多领域,包括环境科学、地理科学、信息技术、天文学和商业智能。在现有的方法中,DBSCAN是海洋领域最热门的数据挖掘方法之一。这是因为它具有理想的特性,例如能够对任意形状的数据集进行聚类,能够识别和排除噪声样本,能够自动确定簇的数量。因此,它被选择在复杂水域中执行实时热点区域识别的任务。
尽管如此,海上交通具有复杂和动态的特点,直接应用DBSCAN可能无法产生理想的交通簇。一方面,DBSCAN无法处理密度不均衡的数据集,因为它使用固定密度标准来全局搜寻所有簇。因此,DBSCAN很难适用于所有船舶交通场景,尤其是涉及不同交通密度和变化交通行为的复杂场景。另一方面,DBSCAN可能并不总是保证高冲突船舶对被分配到同一集群中。然而,有必要将具有不可容忍冲突严重性的船舶对分组到相同的集群中,以捕获真实的局部冲突模式。
对于第一个问题,一种解决方法是使用SNN相似性度量。它对密度的变化相对不敏感,并且对于在非均匀区域发现簇非常有效。与DBSCAN中的距离度量不同,它根据两个个体的k最近邻列表之间的公共元素数量计算两个个体之间的相似性,其由以下等式定义:
Simlalirityij=intersect(NNi(k)∩NNj(k)) (6)
其中NNi(k)是个体i的k个最近邻的子集。由于距离(即相异度)被用作DBSCAN的输入,因此我们使用k减去Simlaritityij来表示个体i和j之间的相异度。
至于第二个问题,DBSCAN中添加了硬约束,以确保具有不可容忍冲突严重性的船舶对划分到同一个集群。我们采用图论的方法识别必须连接的船舶对。我们将船舶设置为节点,使用边将具有不可容忍冲突严重的船舶连接起来。然后可以获得由icc1,icc2,…,icci,…,iccs组成的必须连接的闭包(MLC),其中icci表示子图。icci中的每对船舶都可以通过至少一个序列边连接。
算法1中描述了约束SNN的详细过程。其程序是DBSCAN的扩展。三个超级参数(即EPS、MinPts和k)和一个必须连接闭包(MLC)作为输入。超级参数EPS和MinPts来自DBSCAN,表示样本点的最大邻域半径和此邻域中包含的最小点数。基于这两个参数,两点之间的关系可以定义为:直接密度可达、密度可达和密度连接。此外,可以根据直接密度可达点的数量确定核心点(算法1第6行)。超参数k是指每个点的k个最相似的邻居被保留用于SNN相似性度量。与DBSCAN相比,约束SNN的改进可以涉及两个方面:
1)SNN度量被嵌入程序中以支持更稳健的相似性度量,该度量适用于密度不同的交通场景(算法1第3行)。
2)在循环迭代期间,如果一个点属于MLC,所有在MLC中与其属于同一个子图的点都被安排到当前簇中,以满足必须连接约束(算法第10行和第15行)。
Figure BDA0003556947600000101
I:样本;Nc:簇的序列号;Nε(i):基于Eps的半径的点i的邻域;vi:1代表点i被用过,0相反;MLC(i):点i属于的于图.
在聚类过程中,有时会将一些船舶分配到不适当的聚类中。这可能由以下事实来解释:1)船舶交通由于受到各种干扰在空间中的分布是随机的,在某些情况下具有不明显的集群分布特征。2)SNN度量考虑对象的k近邻列表之间的重叠,而不是恒定的密度值,以在均匀区域中找到簇。对于复杂的交通场景,它可能导致形成密度差异显著的集群。因此,本发明提出了一种微调策略,以进一步将船舶分配到适当的集群。它包括两个阶段:1)删除远离簇的点,2)将部分异常点添加到合适的簇中。
图3(a)-(c)展示了可以使用异常值删除来改进的3个典型集群。其中,纵轴“d”表示点与其第二近邻的距离,横轴“p”表示点的序列号。显然,可以通过删除三角形来提高聚类性能。为了实现这一目标,我们在同一簇中确定每个点与其第二近邻(2-nn)的距离并对其进行排序。图3底部显示了每个点的2-nn距离。根据图3中的这些图,三角形具有比其他圆点大得多的2-nn距离。因此,我们以迭代的方式删除这些三角形。在每次迭代中,如果具有最大2-nn距离的点满足以下条件,则将其设置为异常点。
(1)它的2-nn距离大于第三大2-nn距离的th1倍,th1为自定义系数。
(2)它与同一簇中的点没有不可容忍或ALARP的冲突。
该程序将继续对当前簇进行执行,直到不删除任何其他点。使用2-nn而不是1-nn(第一近邻)的原因是对于图3(c)中远离集群的两个点彼此接近的情况,后者没有效果。算法2中提供了异常点删除的详细算法步骤。
Figure BDA0003556947600000111
Ci:属于第i个簇的子集;MHCC:与其他点存在不可容忍或者ALARP冲突关系的数据集.
图4(a)-(b)显示两个可以使用异常点添加进行改进的典型群集,其中,纵轴“d”表示点与同一簇中其他点的平均距离,横轴“p”表示点的序列号。三角形表示基于约束SNN算法获取的异常点。可以看出异常点与簇内点的距离相对较近。我们假设该离群点属于该簇,并计算每个点与簇中其他点之间的平均距离。从图4(b)中可以看出,异常点的平均距离不是最大的。因此,我们添加异常点以使集群更加紧凑。对于具有不可容忍或ALARP冲突关系的异常点(图4(b)),只有当它们同时满足距离要求时,才添加它们到簇中。算法3提供了异常点添加的程序。需要注意的是离群点优先添加到更近的簇中(算法3第2-3行)。
Figure BDA0003556947600000121
o:异常点数据集;
Figure BDA0003556947600000122
与第i个异常点之间存在不可容忍或者ALARP冲突关系的点;voi:1代表第i个异常点被处理过,否则为0.
(3)搜寻分层优化聚类结果
实现扩展聚类方法的一个难点在于如何自适应地确定超级参数的值,以确保簇的冲突连接性同时保持簇的空间紧凑性。更重要的是,这两个标准相互冲突。因此,必须考虑它们的非支配关系以允许同时优化。此外,使用不同的超参数组合会导致各种聚类结果,其中许多是不可行的解。本研究采用分层双目标优化算法求解。
Figure BDA0003556947600000123
Figure BDA0003556947600000124
CRi的噪音点百分比;
Figure BDA0003556947600000125
CRi的簇数量;
Figure BDA0003556947600000126
CRi中最小簇中点的数量.
算法4给出了分层双目标优化的总体程序。该算法首先基于网格搜索策略生成候选集。然后,在预处理阶段消除不可行的解决方案,主要考虑了三个约束条件:1)数据集的噪声/离群值比率应小于noise_percent,因为较大数量的离群点意味着无法准确检测船舶交通集群;2)生成的集群数量应大于min_nc,因为较小数量的集群无法有效降解高密度水域的区域交通风险;3)每个簇中的点数应不小于min_np,因为具有一定点数的集群才可以被视为一个簇。为了保证所形成的簇是冲突连接的且空间紧凑的,我们进一步从可行解池中搜索非支配解集。关于这两个标准的判断情况,使用两个指标来评估。冲突连接性基于存在冲突船舶对未被分配到同一集群的程度来衡量,其定义如下:
Figure BDA0003556947600000131
其中,Nvc代表没有分配到同一个簇中的冲突对的数量,C(γ)i代表相应的冲突严重度。VCC越小说明冲突连接性被有效的保证。空间紧凑性基于Calinski–Harabasz(CH)指标进行度量,如下所示:
Figure BDA0003556947600000132
其中n是样本数,c是簇的个数,nk是属于第k个簇的样本数,zk是第k个簇的中心,z是整个数据集的中心,trace B表示类间距离,trace W表示类内距离。CH指数越大,簇间距离越大,簇内距离越小。这意味着所产生的簇的空间紧凑性得到了很好的满足。
实施例
本实施例以宁波舟山港为研究区域,检验所提出的区域交通划分方法的适用性和有效性。就货物吞吐量而言,它是世界上最大的港口。同时,该水域交通繁忙、通航区域受限、交通行为动态且不确定。因此,它是复杂水域的典型代表。图5显示了港口区域,该区域在纬度29°43N和30°02N之间,经度121°52E和122°22E之间。从该地区收集2018年11月1日至2018年11月30日期间的一个月AIS数据记录。
虽然接收到的原始AIS数据信息量很大,但其存在固有的弱点,如数据传输或技术故障引起的数据噪音或位置和速度信息错误。因此,在进行实验分析之前,有必要对数据进行清理和过滤。在本研究中,我们采用了系统的清理程序,包括每个船舶属性的噪声去除、轨迹提取和分离、轨迹一致性确认和轨迹插值。
为了测试所提出的方法的性能,通过一个案例说明了它在高风险热点识别中的在线应用。图6显示了研究区域内一小时内船舶交通集群辨识的示例。在图6(a)-(b)中,展示了两个时刻船舶交通集群的可视化,其中点表示船舶交通的空间分布,线表示船舶之间无法容忍或ALARP的冲突。大多数具有不可容忍或ALARP冲突的船舶被分配到一个集群中,同一集群中的船舶具有空间紧凑性。这意味着通过将船舶交通划分为多个集群,可以有效地检测局部热点。因此,该方法通过考虑多船关系对区域船舶交通风险进行降解,为局部风险识别提供了更高的分辨率。
基于侦测到的船舶交通簇,可以进一步对重点交通簇进行识别。利用两个指标来描述每个簇的特征。一个是冲突严重度之和,另一个是密度指标,表示为:
Figure BDA0003556947600000141
其中,density(x)表示x的密度,N(x,k)表示其k近邻的子集,distance(x,y)表示点x和点y的距离。本实施例使用同一集群中船舶的平均密度计算每个集群的密度。图6(c)-(d)显示了上述图中情况下每个集群的密度和冲突严重度之和。可以清楚地发现哪些集群更值得关注。例如,观察到图6(c)中的簇1和簇2具有高冲突严重度,而图6(d)中的簇5具有高流量密度。因此,本实施例的区域交通划分方法为在何处增强态势感知和提供危险警告提供了有价值的见解。
图7进一步显示了区域和局部船舶交通的密度和冲突严重度的演变情况,展示了每个时间片的局部集群的最大密度和冲突严重度。从图中可以发现两种现象:(1)全局交通密度随时间略有变化,而局部最大交通密度则有相当大的波动。这些结果表明,区域交通密度对增强海上交通监控能力的作用不大。相比之下,检测局部高密度热点可以帮助监管人员更好地了解交通状况,提高其处理复杂交通场景的工作能力。(2)观察到全局和局部最大冲突严重度呈现出一致的趋势。这对于局部冲突风险管理具有重要的现实意义,因为局部冲突集群被有效的捕获到。综上所述,本实施例提出的区域交通划分方法有望应用于智能交通服务系统,以缓解未来监管人员的安全监控压力。
模型比较和验证是确保模型结果优越性和有效性的关键。因此,本实施例首先通过与DBSCAN算法的比较来分析所提出的区域交通划分方法的性能。
DBSCAN中的两个超级参数(即EPS和MinPts)被取为[1,1.5,…,6km]和[2,3,…,10],以搜索最佳聚类结果。图8显示了当使用这两种算法时,具有可行集群辨识方案的船舶场景的百分比(Con_DBSCAN_CSM和Con_SNN_CSM分别表示DBSCAN对应的算法和本研究提出的算法)。据观察,几乎所有交通场景都可以通过所提出的方法获得可行解,而只有33.39%的交通场景通过使用DBSCAN可以获得可行解。即使我们将异常值百分比的容忍度调整到20%,仍然有很大一部分交通场景不能基于DBSCAN获取可行的聚类方案。这些结果表明,DBSCAN在处理不同密度的复杂交通场景方面存在局限性。
为了证明扩展聚类方法中关键模块的功能和实用性,本实施例将其与以下算法进行了比较:标准SNN、采用复合距离度量的标准SNN,和不采用复合距离度量的约束SNN。图9提供了关于其支配关系的比较结果,其中“优于”表示所提出的模型优于其他算法而“劣于”相反。结果表明,该方法明显优于标准SNN和使用复合距离度量的标准SNN。这意味着为不可容忍的冲突船舶对构造硬连接约束可以显著提高聚类性能。同时,可以观察到,在不使用复合距离度量的情况下,扩展的聚类模型在一定程度上优于约束SNN。这是因为复合距离度量以更精确的方式设计,以允许同时考虑集群船舶交通的冲突连接性和空间紧凑性。然而,传统的相似性/距离度量无法处理多个聚类目标,因此当考虑多个聚类属性时,其效果较差。因此,硬约束和复合距离度量对于提高聚类性能至关重要。
图9中,A1、A2、A3和A4分别表示标准SNN(SNN)、使用复合距离度量的标准SNN(SNN_CSM)、不使用复合距离度量的约束SNN(Con_SNN)和提出的方法(Con_SNN_CSM)。
此外,本实施例进一步比较了不同模型在不同交通场景下的性能,以评估扩展聚类方法的泛化能力和稳定性。如图10(a)-(c)所示,图10(a)为Con_SNN_CSM vs SNN;图10(b)为Con_SNN_CSM vs SNN-CSM;图10(c)为Con_SNN_CSM vs Con_SNN。在船舶数量不同的情况下,该方法的性能优于所有其他模型。这些结果证实了扩展聚类方法的适用性和鲁棒性,该方法能够适应各种交通场景。
识别复杂水域中潜在的高风险船舶交通群对于海上交通安全管理至关重要。本发明提出一个系统的船舶交通划分方法来自动且自适应地捕捉高风险的多船会遇局面。它有效地集成了复合距离度量、约束SNN聚类、微调策略和分层双目标优化,使区域船舶交通能够划分为多个冲突连接且空间紧凑的集群。该方法具有以下特点:(1)能够在高密度水域中自适应地发现具有强冲突连接性和高密度的交通簇;(2)允许对密度不同的交通局面进行稳健的处理;(3)在船舶运动不确定性存在的情况下,显示出较好的性能。
以基于宁波舟山港的AIS实际数据为基础,对所提出的区域船舶交通划分方法的性能进行了评估和测试。结果表明,所提出的方法在识别复杂交通场景的局部热点区域方面表现良好,并为在何处增强态势感知和提供危险警告提供了有价值的见解。同时,通过与其他聚类方法的比较,对所提出的交通划分方法中关键模块的功能和实用性进行了检验和验证。总而言之,所开发的方法在提高监管人员的海上交通监控能力和促进风险缓解措施的实施方面显示出巨大的潜力。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案。

Claims (8)

1.识别复杂水域船舶交通冲突热点的区域交通划分方法,其特征在于,包括;
基于船舶AIS轨迹数据进行概率冲突检测,获取船舶之间的冲突严重度;
基于获取的冲突严重度构建复合距离度量模型,并基于度量结果,利用约束SSN聚类算法进行聚类;
基于分层双目标优化算法,获取最优聚类解。
2.根据权利要求1所述识别复杂水域船舶交通冲突热点的区域交通划分方法,其特征在于,所述方法进一步包括:获取船舶的AIS轨迹数据;进行不确定性模式提取;进行船舶不确定运动预测;进行概率冲突检测。
3.根据权利要求1所述识别复杂水域船舶交通冲突热点的区域交通划分方法,其特征在于,复合距离度量模型定义如下:
Figure FDA0003556947590000011
其中,distij表示船舶i和j之间的实际距离;C(γ)ij表示冲突严重度;R1和R2表示特定的参数,以将冲突严重程度分为三组:不可容忍、ALARP和可忽略。
4.根据权利要求1所述识别复杂水域船舶交通冲突热点的区域交通划分方法,其特征在于,在利用约束SSN聚类算法进行聚类后,进行微调策略,包括:异常点删除及异常点添加。
5.根据权利要求4所述识别复杂水域船舶交通冲突热点的区域交通划分方法,其特征在于,异常点删除进一步包括:在同一簇中确定每个点与其第二近邻的邻接距离,并对所有的邻接距离进行排序,若具有最大邻接距离的点满足以下条件,
(1)它的邻接距离大于第三大邻接距离的预设倍,
(2)它与同一簇中的点没有不可容忍或ALARP的冲突,
则将该点设置为异常点,并以迭代的方式删除异常点。
6.根据权利要求4所述识别复杂水域船舶交通冲突热点的区域交通划分方法,其特征在于,异常点添加进一步包括:假设异常点属于距离异常点最近的簇,计算异常点与簇中其他点之间的平均距离,当异常点的平均距离不是最大时,添加异常点到簇中;对于具有不可容忍或ALARP冲突关系的异常点,只有当这些异常点同时满足距离要求时,才添加这些异常点到簇中。
7.根据权利要求1所述识别复杂水域船舶交通冲突热点的区域交通划分方法,其特征在于,分层双目标优化算法进一步包括:
基于网格搜索策略生成候选集;
在预处理阶段消除不可行的解决方案,主要考虑三个约束条件:1)数据集的噪声/离群值比率应小于noise_percent;2)生成的集群数量应大于min_nc;3)每个簇中的点数应不小于min_np;
从可行解池中搜索非支配解集,以保证所形成的簇的冲突连接性且空间紧凑性。
8.根据权利要求7所述识别复杂水域船舶交通冲突热点的区域交通划分方法,其特征在于,冲突连接性基于存在冲突船舶对未被分配到同一集群的程度来度量,如下所示:
Figure FDA0003556947590000021
其中,Nvc代表没有分配到同一个簇中的冲突对的数量,C(γ)i代表冲突严重度,VCC越小,冲突连接性越好;
空间紧凑性基于CH指标进行度量,如下所示:
Figure FDA0003556947590000022
其中n是样本数,c是簇的个数,nk是属于第k个簇的样本数,zk是第k个簇的中心,z是整个数据集的中心,CH指标越大,簇间距离越大,簇内距离越小,所产生的簇的空间紧凑性越好。
CN202210278237.0A 2022-03-21 2022-03-21 识别复杂水域船舶交通冲突热点的区域交通划分方法 Pending CN114862095A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210278237.0A CN114862095A (zh) 2022-03-21 2022-03-21 识别复杂水域船舶交通冲突热点的区域交通划分方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210278237.0A CN114862095A (zh) 2022-03-21 2022-03-21 识别复杂水域船舶交通冲突热点的区域交通划分方法

Publications (1)

Publication Number Publication Date
CN114862095A true CN114862095A (zh) 2022-08-05

Family

ID=82627701

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210278237.0A Pending CN114862095A (zh) 2022-03-21 2022-03-21 识别复杂水域船舶交通冲突热点的区域交通划分方法

Country Status (1)

Country Link
CN (1) CN114862095A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115374855A (zh) * 2022-08-23 2022-11-22 北京交通大学 一种基于聚类的对铁路突发事件进行分级的方法
CN116580313A (zh) * 2023-03-31 2023-08-11 数字太空(北京)科技股份公司 一种基于数字孪生和遥感的异常船只识别方法及装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115374855A (zh) * 2022-08-23 2022-11-22 北京交通大学 一种基于聚类的对铁路突发事件进行分级的方法
CN115374855B (zh) * 2022-08-23 2024-05-14 北京交通大学 一种基于聚类的对铁路突发事件进行分级的方法
CN116580313A (zh) * 2023-03-31 2023-08-11 数字太空(北京)科技股份公司 一种基于数字孪生和遥感的异常船只识别方法及装置
CN116580313B (zh) * 2023-03-31 2023-11-14 数字太空(北京)科技股份公司 一种基于数字孪生和遥感的异常船只识别方法及装置

Similar Documents

Publication Publication Date Title
Zhang et al. A predictive analytics method for maritime traffic flow complexity estimation in inland waterways
Zhao et al. Maritime anomaly detection using density-based clustering and recurrent neural network
CN110647900B (zh) 基于深度神经网络的安全态势智能预测方法、装置及系统
CN114862095A (zh) 识别复杂水域船舶交通冲突热点的区域交通划分方法
Cheng et al. Using big data to track marine oil transportation along the 21st-century Maritime Silk Road
CN115099335A (zh) 多源异构数据的异常辨识和特征筛选方法、系统
Mazzorana et al. Improving risk assessment by defining consistent and reliable system scenarios
Xin et al. Maritime traffic clustering to capture high-risk multi-ship encounters in complex waters
CN117078048B (zh) 基于数字孪生的智慧城市资源管理方法及系统
Yang et al. Maritime traffic flow clustering analysis by density based trajectory clustering with noise
CN114565124A (zh) 一种基于改进图卷积神经网络的船舶交通流预测方法
US20200293945A1 (en) Apparatus and method of high dimensional data analysis in real-time
CN114118507A (zh) 一种基于多维信息融合的风险评估预警方法和装置
CN113626929B (zh) 多阶段多拓扑的船舶交通复杂度度量方法及系统
CN113326862A (zh) 审计大数据融合聚类与风险数据检测方法、介质、设备
Zhang et al. Automatic Traffic Anomaly Detection on the Road Network with Spatial‐Temporal Graph Neural Network Representation Learning
Fan et al. Online trajectory prediction for metropolitan scale mobility digital twin
CN117671992A (zh) 一种公交车智能调度方法及系统
Xin et al. Maritime traffic partitioning: An adaptive semi-supervised spectral regularization approach for leveraging multi-graph evolutionary traffic interactions
CN116611678B (zh) 数据处理方法、装置、计算机设备和存储介质
Adacher et al. Performance analysis of decentralized vs centralized control for the traffic signal synchronization problem
Li et al. Optimization of planning layout of urban building based on improved logit and PSO algorithms
CN115310682A (zh) 复杂水域船舶交通划分方法、装置、设备和介质
Zhen et al. A novel adaptive visual analytics framework for multiship encounter identification
CN110399537A (zh) 一种基于人工智能技术的警情时空预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination