CN114385765A - 一种基于航迹数据的耙吸挖泥船生产时间预估方法 - Google Patents

一种基于航迹数据的耙吸挖泥船生产时间预估方法 Download PDF

Info

Publication number
CN114385765A
CN114385765A CN202111469528.XA CN202111469528A CN114385765A CN 114385765 A CN114385765 A CN 114385765A CN 202111469528 A CN202111469528 A CN 202111469528A CN 114385765 A CN114385765 A CN 114385765A
Authority
CN
China
Prior art keywords
track
points
sub
cluster
point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111469528.XA
Other languages
English (en)
Other versions
CN114385765B (zh
Inventor
徐婷
张晴波
刘树东
戴文伯
周雨淼
杨波
季明
鲁嘉俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CCCC National Engineering Research Center of Dredging Technology and Equipment Co Ltd
Original Assignee
CCCC National Engineering Research Center of Dredging Technology and Equipment Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CCCC National Engineering Research Center of Dredging Technology and Equipment Co Ltd filed Critical CCCC National Engineering Research Center of Dredging Technology and Equipment Co Ltd
Priority to CN202111469528.XA priority Critical patent/CN114385765B/zh
Publication of CN114385765A publication Critical patent/CN114385765A/zh
Application granted granted Critical
Publication of CN114385765B publication Critical patent/CN114385765B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/231Hierarchical techniques, i.e. dividing or merging pattern sets so as to obtain a dendrogram
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/254Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Business, Economics & Management (AREA)
  • Economics (AREA)
  • Quality & Reliability (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Mathematical Physics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Algebra (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及挖泥船监控管理领域,尤其涉及一种基于航迹数据的耙吸挖泥船施工时间的预估方法。本发明提出了一种基于航迹数据的耙吸挖泥船生产时间预估方法,其特征在于,包括如下步骤:S1.从航迹数据库中提取耙吸挖泥船的航迹数据;S2.对航迹数据进行预处理;S3.基于分层聚类算法,辨识出“装舱”、“往抛泥区”、“返装舱区”、“抛泥”轨迹点,并将轨迹点打上相应标签;S4.提取出“装舱”、“往抛泥区”、“返装舱区”、“抛泥”有效子轨迹;S5.计算生产时间。本发明采用耙吸船航迹信息系统进行数据采集,具有不依赖于人工上报数据、不依赖外部传感器信息的特点,生产时间预估更为精准。

Description

一种基于航迹数据的耙吸挖泥船生产时间预估方法
技术领域
本发明涉及挖泥船监控管理领域,尤其涉及一种基于航迹数据的耙吸挖泥船施工时间的预估方法。
背景技术
近年来我国沿海港口疏浚行业发展较快,竞争也日趋激烈,提高疏浚施工质量和效率已成为疏浚企业发展的核心目标。目前,耙吸挖泥船大多采取船岸分离监控管理模式,其生产数据主要依靠人工填报,无法保证实时性和客观性,错报、漏报现象也层出不穷,因而岸端管理人员难以获取或准确判断耙吸挖泥船的实时作业状态,加大了耙吸挖泥船的监控管理工作的难度。同时各船舶间的生产数据没有共享,难以从中汲取国内外船舶的先进的管理经验。因此基于公开的数据,建立一套耙吸挖泥船生产指标体系,实现生产指标实时预估,对提高疏浚工程的质量和效率有着重要的意义。
耙吸挖泥船具有“挖、运、卸”三个关键施工过程,这些关键施工信息都蕴含在公开的航轨迹大数据中,随着人工智能与大数据技术的高速发展,使得从海量的航迹数据中辨识出耙吸船的行为特征、估算出生产时间成为可能,可有效解决生产数据上报不及时、标准不统一等问题,有助于实时掌握自有船舶和非自有船舶的施工情况,也有助于我们汲取国内外船舶的先进管理经验。
目前,在疏浚行业基于公开得航迹数据估算耙吸挖泥船生产时间的研究还比较少,而交通船领域对航迹的研究主要集中在航迹聚类算法方面,但是耙吸船施工过程十分复杂,不能直接搬用交通船领域成果。
发明内容
本发明的目的在于针对上述问题,提出一种基于航迹数据的耙吸挖泥船生产时间的预估方法,通过梳理耙吸挖泥船施工过程特征,建立自上而下的三层分层聚类算法,快速辨识出轨迹点的运动状态,通过提取出三个关键施工过程的子轨迹,预估出生产时间,可以提升耙吸挖泥船生产时间预估的精准度。
本发明技术方案:一种基于航迹数据的耙吸挖泥船生产时间预估方法,其特征在于,包括如下步骤:
S1.从航迹数据库中提取耙吸挖泥船的航迹数据;
从航迹数据库中提取统计时间内耙吸挖泥船的航迹数据,将所有航迹点串联生成一条完整的航迹路径P0,P0为航迹点按时间顺序依次排列构成的集合{x1,...xi,...xn},其中xi=(loni,lati,sogi,cogi,ti),loni为航迹点的经度,lati为航迹点的纬度,sogi为航迹点的速度,cogi为航迹点的航向,ti为通过该航迹点的时刻,n为该耙吸挖泥船航迹点数量;
S2.对航迹数据进行预处理;
此步骤完成剔除异常数据,提取有效轨迹片段。
S3.基于分层聚类算法,辨识出“装舱”、“往抛泥区”、“返装舱区”、“抛泥”轨迹点,并将轨迹点打上相应标签;
S4.提取出“装舱”、“往抛泥区”、“返装舱区”、“抛泥”有效子轨迹;
S5.计算生产时间。
计算“装舱”、“往抛泥区”、“返装舱区”、“抛泥”4种行为的累计工作时间及总工作时间。
有益效果
1、本发明采用耙吸船航迹信息系统进行数据采集,具有不依赖于人工上报数据、不依赖外部传感器信息的特点,仅通过耙吸疏浚船的历史航迹数据识别出的不同航行行为来评估疏浚效率。
2、本发明结合耙吸船航迹信息系统数据采集、分层多次聚类算法,对船舶航行行为精准辨识,逐个提取各施工阶段的子轨迹,生产时间预估更为精准。
附图说明
图1本发明处理流程图
图2本发明步骤2中对航迹数据进行预处理流程图
图3异常位置轨迹点处理示意
图4原始轨迹图示意
图5数据预处理后轨迹图示意
图6本发明分层多次聚类算法示意图
图7实施例速度时序聚类图
图8耙吸式挖泥船施工周期
图9企业施工管理的记录报告和模型结果对比(单位:小时)
具体实施方式
下面将结合具体实施例及其附图对本申请提供的技术方案作进一步说明。结合下面说明,本申请的优点和特征将更加清楚。
需要说明的是,本申请的实施例有较佳的实施性,并非是对本申请任何形式的限定。本申请实施例中描述的技术特征或者技术特征的组合不应当被认为是孤立的,它们可以被相互组合从而达到更好的技术效果。本申请优选实施方式的范围也可以包括另外的实现,且这应被本申请实施例所属技术领域的技术人员所理解。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为授权说明书的一部分。在这里示出和讨论的所有示例中,任何具体值应被解释为仅仅是示例性的,而不是作为限定。因此,示例性实施例的其它示例可以具有不同的值。
本申请的附图均采用非常简化的形式且均使用非精准的比例,仅用以方便、明晰地辅助说明本申请实施例的目的,并非是限定本申请可实施的限定条件。任何结构的修饰、比例关系的改变或大小的调整,在不影响本申请所能产生的效果及所能达成的目的下,均应落在本申请所揭示的技术内容所能涵盖的范围内。且本申请各附图中所出现的相同标号代表相同的特征或者部件,可应用于不同实施例中。
基于本发明技术方案,给出实施例:
本发明实施过程如图1所示,
S1.从航迹数据库中提取某耙吸船为期1年的航迹数据,将所有航迹点串联生成一条完整的航迹路径P0,P0为航迹点按时间顺序依次排列构成的集合{x1,...xi,...xn},其中xi=(loni,lati,sogi,cogi,ti),loni为航迹点的经度,lati为航迹点的纬度,sogi为航迹点的速度,cogi为航迹点的航向,ti为通过该航迹点的时刻,n为该耙吸船航迹点数量;
S2.对航迹数据进行预处理,如图2所示,包括以下步骤:
S21异常值过滤
对航迹路径P0的航迹点进行过滤:对任一时刻j的航迹点xj,若
sogj>20,
或者cogj<0,
或者cogj<360
则判定为异常航迹点,剔除该异常航迹点xj,形成新航迹路径P1,P1为剔除异常轨迹点后按时间顺序排列的轨迹点集合
Figure BDA0003391032260000041
其中nnew为新航迹路径中航迹点数量。
S22异常时间间隔切断
计算新航迹路径P1相邻两个轨迹点的时间间隔:
ti,i+1=(ti+1-ti)/3600,
若ti,i+1>=2,则将航迹路径从i时刻断开,输出新的轨迹路径
Figure BDA0003391032260000042
重复操作直至所有异常时间间隔被处理,输出航迹路径P2,P2由多条子轨迹路径构成{T1,...,Tj,...,Tk},其中
Figure BDA0003391032260000051
k为子轨迹的数目,xj,i为第j条子轨迹中的第i个轨迹点,nj为第j条子轨迹的轨迹点数目。
S23异常位置判断
分别计算航迹路径P2中各子轨迹的相邻两个轨迹点构成线段的平均速度
Figure BDA0003391032260000052
其中tj;i,i+1为第j个子轨迹的第i个轨迹点与第i+1个轨迹点之间的时间间隔,dj;i,i+1为第j个子轨迹的第i个轨迹点与第i+1个轨迹点之间的轨迹线段距离。
若Vj;i,i+1>20,则判断轨迹点xj,i+1为异常位置点。输出所有的异常位置轨迹点。
S24异常位置处理
若xj,i+1判断为异常位置轨迹点,计算xj,i,xj,i+2两个航迹点相连构成新的轨迹线段平均速度Vj;i,i+2,若Vj;i,i+2<=20则认为异常位置xj,i+1可以弥补,剔除航迹点xj,i+1;若Vj;i,i+2>20,则认为异常位置xj,i+1无法弥补,将航迹路径从xj,i+1断开,并剔除xj,i+1,重复操作,直至所有异常位置轨迹点被处理,输出最终航迹路径P3,P3由多条子轨迹构成{T1,...,Tj,...,Tm},其中
Figure BDA0003391032260000053
xj,i为第j条子轨迹中的第i个轨迹点,m为航迹路径P3的子轨迹的数目,nj为第j条子轨迹的轨迹点数目。
S25有效轨迹片段提取
输入S24步骤得到的航迹路径P3,计算P3各条子轨迹的持续时间
Figure BDA0003391032260000054
其中,
Figure BDA0003391032260000055
为第j条子轨迹第nj个轨迹点的时间,nj为第j条子轨迹的轨迹点数目。剔除Durj<20min的子轨迹,得到有效的轨迹路径P4,P4由多条子轨迹构成{T1,...,Tj,...,Tfinal},
Figure BDA0003391032260000056
xji为第j条子轨迹中的第i个轨迹点,final为子轨迹的数目,nj为第j条子轨迹的轨迹点数目。
S3.对预处理后的航迹数据,建立分层聚类模型,辨识出“装舱”、“往抛泥区”、“返装舱区”、“抛泥”航迹点;过程如图4所示。
其中分层聚类算法为:
S31、分层聚类算法的第一层,采用DBSCAN算法搭建施工区辨识模型,输入向量为X={lon,lat},输出向量为Y={clusterid1},其中:lon为经度;lat为纬度;clusterid1为簇类别序号,clusterid1取值1,2,3,...。
DBSCAN算法过程为:
S311、设置DBSCAN算法参数。设置参数邻域半径r取值为所有相邻轨迹点的之间的距离的中位数,设置参数领域范围内最少轨迹点数目MinPts为5,即在半径为r的邻域范围内至少包含MinPts个轨迹点;
S312、任意选择一个未访问的轨迹点p,标记轨迹点p为“已访问”,并检查轨迹点p是否满足条件:以轨迹点p为中心,半径为r的邻域范围内,是否包含至少MinPts个轨迹点,如果条件不满足则将轨迹点p标记为噪声;如果条件满足则将轨迹点p称为核心对象,进入下一步;
S313、以轨迹点p为中心创建一个新的簇C,并将轨迹点p的邻域范围内所有点加入“候选集N”;
S314、对候选集N中所有尚未处理的轨迹点q进行判断,检查其在半径为r的邻域范围内是否包含至少MinPts个轨迹点,如果是则将轨迹点q的r邻域中未归入任何一簇的轨迹点加入簇C,如果不是则将轨迹点q从“候选集N”中移除;
S315、重复步骤S314,继续检查“候选集N”中未处理的轨迹点,直至所有轨迹点被处理;
S316、重复步骤S312-S315,直至所有的轨迹点归入了某个簇或者标记未噪声,最后输出所有轨迹点的簇类别序号cluster1。
S317、辨识轨迹簇cluster1的类别
根据
Figure BDA0003391032260000061
公式,计算出关键参数q0.95、q0.5、q0.05
其中sog速度;P()表示概率值;
q0.95、q0.5、q0.05分别为速度的95%、50%、5%分位数;
若q0.05>=8kn,该类别识别为:“航行轨迹”;
若q0.95<=1kn,该类别识别为“抛锚区轨迹“;
若1kn<q0.05<4kn,且q0.95>8kn,该类别识别为“施工区轨迹”;
S32、分层聚类算法的第二层,对“施工区轨迹”采用高斯聚类算法搭建装舱轨迹辨识模型。
输入向量为X={sog},输出向量为Y={clusterid2},其中:sog为航速;clusterid2为簇类别序号,设置参数高斯混合成分的个数C=3;
高斯混合聚类算法聚类过程如下:
S321、初始化高斯混合分布的模型参数(πk,μkk),πk代表第k高斯成分的混合权重;μk代表速度均值;σk代表速度标准差;
S322、计算各个轨迹点属于各高斯成分的后验概率:
Figure BDA0003391032260000071
其中gk(X;μkk)为单高斯分布函数;
S323、选取S322步骤中后验概率最大的簇所为判决结果并输出k个样本簇,并更新模型参数
Figure BDA0003391032260000072
Figure BDA0003391032260000073
Figure BDA0003391032260000074
Figure BDA0003391032260000075
其中Nk是属于k簇的轨迹点数;N所有轨迹点数;xkn是k簇第n个轨迹点速度。
S324、重复S322、S223步骤,直至所有的参数收敛,输出最后所有轨迹点的簇类别序号cluster2。
S325、辨识轨迹簇cluster2的类别
簇类别辨识过程依据为:将平均速度低速(0-1节)的簇辨识为“抛泥轨迹”;将平均速度中速(1-4节)的簇辨识为“装舱轨迹”;将平均速度高速(>4节)的簇辨识为“往返于抛泥区和装舱区轨迹”;
S33、分层聚类算法的第三层,对“往返于抛泥区和装舱区轨迹”采用高斯聚类算法搭建往返轨迹辨识模型。
输入向量为X={sog,cog},输出向量为Y={clusterid3},其中:sog为航速;cog为航向;clusterid3为簇类别序号;将平均速度处于6-9kn的簇辨识为“往抛泥区轨迹”;将平均速度处于9-15kn的簇辨识为“返装舱区轨迹”;
S34、根据上述算法对簇cluster1、cluster2、cluster3辨识的结果,对轨迹路径P1的所有轨迹点的重新打上簇类别标签,如图7,其中:
clusteri=0,表示“其他轨迹”即并未被归入任何簇的轨迹点(聚类仅针对轨迹路径P4,轨迹路径P1有部分轨迹无簇类别标签,该部分轨迹簇类设定为0),
clusteri=1,表示“装舱轨迹”,
clusteri=2,表示“抛泥轨迹”,
clusteri=3,表示“往抛泥区轨迹”,
clusteri=4,表示“返装舱区轨迹”,
clusteri为第i个轨迹点的航迹类别标签,打上簇标签的航迹路径P1 *可以表示为
Figure BDA0003391032260000081
其中xi=(loni,lati,sogi,cogi,clusteri,ti),loni为航迹点的经度,lati为航迹点的纬度,sogi为航迹点的速度,cogi为航迹点的航向,ti为通过该航迹点的时刻,nnew为该耙吸船航迹点数量。
S4、提取出“装舱”、“往抛泥区”、“返装舱区”、“抛泥”有效子轨迹;
S41、提取所有航迹路径P1*的子轨迹。
遍历航迹路径P1*,提取所有的子轨迹Tj m,Tj m同时满足条件:
clusteri=m和LowSpeedm≤sogi≤HighSpeedm
Figure BDA0003391032260000082
为簇类别标签为m的第j条子轨迹,
Figure BDA0003391032260000083
LowSpeedm为簇类别标签为m的轨迹速度下限,取值为平均速度减去两倍标准差,
HighSpeedm为簇类别标签为m的轨迹速度下限,取值为平均速度加上两倍标准差,
其中m取值1,2,3,4,分别表示“装舱轨迹”、“抛泥轨迹”、“往抛泥区轨迹”、“返装舱区轨迹”簇。
S42、对子轨迹
Figure BDA0003391032260000091
处理。
查询子轨迹Tj m的最后一个轨迹点xk+1
A.如果满足条件:LowSpeedm≤sogk+1≤HighSpeedm且clusterk+1≠m时,则设置clusterk+1=m,并将xk+1加入Tj m中。
B.如果xk+1满足条件:
{sogk+1<LowSpeedm或者sogk+1>HighSpeedm}且clusterk+1=m时,
Figure BDA0003391032260000092
将xk+1加入
Figure BDA0003391032260000093
中,否则将xk+1移除,
Figure BDA0003391032260000094
轨迹点添加结束。
C.如果xk+1满足条件:
{sogk+1<LowMeanSpeedm或者sogk+1>HighMeanSpeedm}且clusterk+1≠1,
则将xk+1移除,
Figure BDA0003391032260000095
轨迹点添加结束。
S43:提取有效子轨迹。
计算子轨迹
Figure BDA0003391032260000096
的持续时间
Figure BDA0003391032260000097
m为子轨迹类别,j为第j条子轨迹。
如果满足条件:
Figure BDA0003391032260000098
则为有效施工子轨迹,否则将
Figure BDA0003391032260000099
移除,其中
Figure BDA00033910322600000910
分别为的装舱、抛泥、往抛泥区轨迹、返回装舱区类别的第j条轨迹的持续时间;
S44、将所有有效子轨迹
Figure BDA00033910322600000911
重新编号,生成有效轨迹集合
Figure BDA00033910322600000912
p为有效子轨迹条数,m=1,2,3,4。
S5、计算生产时间。
S51、计算“装舱”、“往抛泥区”、“返装舱区”、“抛泥”4种行为的累计工作时间ST1,ST2,ST3,ST4
Figure BDA0003391032260000101
m取值1,2,3,4,p为有效子轨迹条数其中
Figure BDA0003391032260000102
分别为的装舱、抛泥、往抛泥区轨迹、返回装舱区类别的第j条轨迹的持续时间;
S52、计算生产时间T,
Figure BDA0003391032260000103
如图9所示,为根据本算法计算得到的施工时间与运用企业施工管理的记录报告获得的施工时间的对比。
上述技术方案,通过梳理耙吸挖泥船在施工过程中的特征,建立了分层多次聚类算法模型,辨识出具有施工特征的轨迹点,并分别提取出施工过程中各阶段子轨迹,计算出相应时间,提升了生产时间预估的精准性。

Claims (5)

1.一种基于航迹数据的耙吸挖泥船生产时间预估方法,其特征在于,包括如下步骤:
S1.从航迹数据库中提取耙吸挖泥船的航迹数据;
从航迹数据库中提取统计时间内耙吸挖泥船的航迹数据,将所有航迹点串联生成一条完整的航迹路径P0,P0为航迹点按时间顺序依次排列构成的集合{x1,...xi,...xn},其中xi=(loni,lati,sogi,cogi,ti),loni为航迹点的经度,lati为航迹点的纬度,sogi为航迹点的速度,cogi为航迹点的航向,ti为通过该航迹点的时刻,n为该耙吸挖泥船航迹点数量;
S2.对航迹数据进行预处理;
此步骤完成剔除异常数据,提取有效轨迹片段;
S3.基于分层聚类算法,辨识出“装舱”、“往抛泥区”、“返装舱区”、“抛泥”轨迹点,并将轨迹点打上相应标签;
S4.提取出“装舱”、“往抛泥区”、“返装舱区”、“抛泥”有效子轨迹;
S5.计算生产时间;
计算“装舱”、“往抛泥区”、“返装舱区”、“抛泥”4种行为的累计工作时间及总工作时间。
2.如权利要求1所述一种基于航迹数据的耙吸挖泥船生产时间预估方法,其特征在于,所述步骤S2包括以下步骤:
S21异常值过滤
对航迹路径P0的航迹点进行过滤:对任一时刻j的航迹点xj,若
sogj>20,
或者cogj<0,
或者cogj<360
则判定为异常航迹点,剔除该异常航迹点xj,形成新航迹路径P1,P1为剔除异常轨迹点后按时间顺序排列的轨迹点集合
Figure FDA0003391032250000021
其中nnew为新航迹路径中航迹点数量;
S22异常时间间隔切断
计算新航迹路径P1相邻两个轨迹点的时间间隔:
ti,i+1=(ti+1-ti)/3600,
若ti,i+1>=2,则将航迹路径从i时刻断开,输出新的轨迹路径
Figure FDA0003391032250000022
重复操作直至所有异常时间间隔被处理,输出航迹路径P2,P2由多条子轨迹路径构成{T1,...,Tj,...,Tk},其中
Figure FDA0003391032250000023
k为子轨迹的数目,xj,i为第j条子轨迹中的第i个轨迹点,nj为第j条子轨迹的轨迹点数目;
S23异常位置判断
分别计算航迹路径P2中各子轨迹的相邻两个轨迹点构成线段的平均速度
Figure FDA0003391032250000024
其中tj;i,i+1为第j个子轨迹的第i个轨迹点与第i+1个轨迹点之间的时间间隔,dj;i,i+1为第j个子轨迹的第i个轨迹点与第i+1个轨迹点之间的轨迹线段距离;
若Vj;i,i+1>20,则判断轨迹点xj,i+1为异常位置点;
输出所有的异常位置轨迹点;
S24异常位置处理
若xj,i+1判断为异常位置轨迹点,计算xj,i,xj,i+2两个航迹点相连构成新的轨迹线段平均速度Vj;i,i+2,若Vj;i,i+2<=20则认为异常位置xj,i+1可以弥补,剔除航迹点xj,i+1;若Vj;i,i+2>20,则认为异常位置xj,i+1无法弥补,将航迹路径从xj,i+1断开,并剔除xj,i+1,重复操作,直至所有异常位置轨迹点被处理,输出最终航迹路径P3,P3由多条子轨迹构成{T1,...,Tj,...,Tm},其中
Figure FDA0003391032250000025
xj,i为第j条子轨迹中的第i个轨迹点,m为航迹路径P3的子轨迹的数目,nj为第j条子轨迹的轨迹点数目;
S25有效轨迹片段提取
输入S24步骤得到的航迹路径P3,计算P3各条子轨迹的持续时间
Figure FDA0003391032250000031
其中,
Figure FDA0003391032250000032
为第j条子轨迹第nj个轨迹点的时间,nj为第j条子轨迹的轨迹点数目;剔除Durj<20min的子轨迹,得到有效的轨迹路径P4,P4由多条子轨迹构成{T1,...,Tj,...,Tfinal},
Figure FDA0003391032250000033
xji为第j条子轨迹中的第i个轨迹点,final为子轨迹的数目,nj为第j条子轨迹的轨迹点数目。
3.如权利要求1所述一种基于航迹数据的耙吸挖泥船生产时间预估方法,其特征在于,所述步骤S3包括以下步骤:
S31分层聚类算法的第一层,采用DBSCAN算法搭建施工区辨识模型;输入向量为X={lon,lat},输出向量为Y={clusterid1},其中:lon为经度;lat为纬度;clusterid1为簇类别序号;
DBSCAN算法过程为:
S311设置DBSCAN算法参数;设置参数邻域半径r取值为所有相邻轨迹点的之间的距离的中位数,设置参数领域范围内最少轨迹点数目MinPts为5,即在半径为r的邻域范围内至少包含MinPts个轨迹点;
S312任意选择一个未访问的轨迹点p,标记轨迹点p为“已访问”,并检查轨迹点p是否满足条件:以轨迹点p为中心,半径为r的邻域范围内,是否包含至少MinPts个轨迹点,如果条件不满足则将轨迹点p标记为噪声;如果条件满足则将轨迹点p称为核心对象,进入下一步;
S313以轨迹点p为中心创建一个新的簇C,并将轨迹点p的邻域范围内所有点加入“候选集N”;
S314对候选集N中所有尚未处理的轨迹点q进行判断,检查其在半径为r的邻域范围内是否包含至少MinPts个轨迹点,如果是则将轨迹点q的r邻域中未归入任何一簇的轨迹点加入簇C,如果不是则将轨迹点q从“候选集N”中移除;
S315重复步骤S314,继续检查“候选集N”中未处理的轨迹点,直至所有轨迹点被处理;
S316重复步骤S312-S315,直至所有的轨迹点归入了某个簇或者标记为噪声,最后输出所有轨迹点的簇类别序号cluster1;
S317辨识轨迹簇cluster1的类别;
根据
Figure FDA0003391032250000041
公式,计算出关键参数q0.95、q0.5、q0.05
其中sog为速度,P()表示概率值;
q0.95、q0.5、q0.05分别为速度的95%、50%、5%分位数;
若q0.05>=8kn,该类别识别为:“航行轨迹”;
若q0.95<=1kn,该类别识别为“抛锚区轨迹“;
若1kn<q0.05<4kn,且q0.95>8kn,该类别识别为“施工区轨迹”;
S32分层聚类算法的第二层,对“施工区轨迹”采用高斯聚类算法搭建装舱轨迹辨识模型;
输入向量为X={sog},输出向量为Y={clusterid2},其中:sog为航速;clusterid2为簇类别序号,设置参数高斯混合成分的个数C=3;
高斯混合聚类算法聚类过程如下:
S321初始化高斯混合分布的模型参数(πk,μkk),πk代表第k高斯成分的混合权重;μk代表速度均值;σk代表速度标准差;
S322计算各个轨迹点属于各高斯成分的后验概率:
Figure FDA0003391032250000042
其中gk(X;μkk)为单高斯分布函数;
S323选取S322步骤中后验概率最大的簇所为判决结果并输出k个样本簇,并更新模型参数
Figure FDA0003391032250000043
Figure FDA0003391032250000051
Figure FDA0003391032250000052
Figure FDA0003391032250000053
其中Nk是属于k簇的轨迹点数;N所有轨迹点数;xkn是k簇第n个轨迹点速度;
S324重复S322、S223步骤,直至所有的参数收敛,输出最后所有轨迹点的簇类别序号cluster2;
S325辨识轨迹簇cluster2的类别
簇类别辨识过程依据为:将平均速度低速(0-1节)的簇辨识为“抛泥轨迹”;将平均速度中速(1-4节)的簇辨识为“装舱轨迹”;将平均速度高速(>4节)的簇辨识为“往返于抛泥区和装舱区轨迹”;
S33分层聚类算法的第三层,对“往返于抛泥区和装舱区轨迹”采用高斯聚类算法搭建往返轨迹辨识模型;
输入向量为X={sog,cog},输出向量为Y={clusterid3},其中:sog为航速;cog为航向;clusterid3为簇类别序号;将平均速度处于6-9kn的簇辨识为“往抛泥区轨迹”;将平均速度处于9-15kn的簇辨识为“返装舱区轨迹”;
S34根据上述算法对簇cluster1、cluster2、cluster3辨识的结果,对轨迹路径P1的所有轨迹点的重新打上簇类别标签,其中:
clusteri=0,表示“其他轨迹”,
clusteri=1,表示“装舱轨迹”,
clusteri=2,表示“抛泥轨迹”,
clusteri=3,表示“往抛泥区轨迹”,
clusteri=4,表示“返装舱区轨迹”,
clusteri为第i个轨迹点的航迹类别标签,打上簇标签的航迹路径P1 *可以表示为
Figure FDA0003391032250000054
其中xi=(loni,lati,sogi,cogi,clusteri,ti),loni为航迹点的经度,lati为航迹点的纬度,sogi为航迹点的速度,cogi为航迹点的航向,ti为通过该航迹点的时刻,nnew为该耙吸挖泥船航迹点数量。
4.如权利要求1所述一种基于航迹数据的耙吸挖泥船生产时间预估方法,其特征在于,所述步骤S4包括以下步骤:
S41提取所有航迹路径P1*的子轨迹
遍历航迹路径P1*,提取所有的子轨迹Tj m,Tj m同时满足条件:
clusteri=m和LowSpeedm≤sogi≤HighSpeedm
Figure FDA0003391032250000061
为簇类别标签为m的第j条子轨迹,
Figure FDA0003391032250000062
LowSpeedm为簇类别标签为m的轨迹速度下限,取值为平均速度减去两倍标准差,
HighSpeedm为簇类别标签为m的轨迹速度下限,取值为平均速度加上两倍标准差,
其中m取值1,2,3,4,分别表示“装舱轨迹”、“抛泥轨迹”、“往抛泥区轨迹”、“返装舱区轨迹”簇;
S42对子轨迹
Figure FDA0003391032250000063
处理;
查询子轨迹Tj m的最后一个轨迹点xk+1
A.如果满足条件:LowSpeedm≤sogk+1≤HighSpeedm且clusterk+1≠m时,
则设置clusterk+1=m,并将xk+1加入Tj m中;
B.如果xk+1满足条件:
{sogk+1<LowSpeedm或者sogk+1>HighSpeedm}且clusterk+1=m时,若
Figure FDA0003391032250000064
将xk+1加入
Figure FDA0003391032250000065
中,否则将xk+1移除,
Figure FDA0003391032250000066
轨迹点添加结束;
C.如果xk+1满足条件:
{sogk+1<LowMeanSpeedm或者sogk+1>HighMeanSpeedm}且clusterk+1≠1,
则将xk+1移除,
Figure FDA0003391032250000067
轨迹点添加结束;
S43提取有效子轨迹;
计算子轨迹
Figure FDA0003391032250000071
的持续时间
Figure FDA0003391032250000072
m为子轨迹类别,j为第j条子轨迹;如果满足条件:
Figure FDA0003391032250000073
Figure FDA0003391032250000074
Figure FDA0003391032250000075
Figure FDA0003391032250000076
则为有效施工子轨迹,否则将
Figure FDA0003391032250000077
移除;其中
Figure FDA0003391032250000078
分别为的装舱、抛泥、往抛泥区轨迹、返回装舱区类别的第j条轨迹的持续时间;
S44将所有有效子轨迹
Figure FDA0003391032250000079
重新编号,生成有效轨迹集合
Figure FDA00033910322500000710
p为有效子轨迹条数,m=1,2,3,4。
5.如权利要求1所述一种基于航迹数据的耙吸挖泥船生产时间预估方法,其特征在于,所述步骤S5包括以下步骤:
S51计算“装舱”、“往抛泥区”、“返装舱区”、“抛泥”4种行为的累计工作时间ST1,ST2,ST3,ST4
Figure FDA00033910322500000711
m取值1,2,3,4,p为有效子轨迹条数;
S52计算生产时间T,
Figure FDA00033910322500000712
CN202111469528.XA 2021-12-03 2021-12-03 一种基于航迹数据的耙吸挖泥船生产时间预估方法 Active CN114385765B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111469528.XA CN114385765B (zh) 2021-12-03 2021-12-03 一种基于航迹数据的耙吸挖泥船生产时间预估方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111469528.XA CN114385765B (zh) 2021-12-03 2021-12-03 一种基于航迹数据的耙吸挖泥船生产时间预估方法

Publications (2)

Publication Number Publication Date
CN114385765A true CN114385765A (zh) 2022-04-22
CN114385765B CN114385765B (zh) 2023-07-07

Family

ID=81196001

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111469528.XA Active CN114385765B (zh) 2021-12-03 2021-12-03 一种基于航迹数据的耙吸挖泥船生产时间预估方法

Country Status (1)

Country Link
CN (1) CN114385765B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115905343A (zh) * 2022-08-01 2023-04-04 中华人民共和国广东海事局 水上航运数据处理方法、装置、设备、介质和程序产品
CN116290203A (zh) * 2023-01-12 2023-06-23 中港疏浚有限公司 基于神经网络的疏浚施工参数选优模型方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004339873A (ja) * 2003-05-19 2004-12-02 Toa Harbor Works Co Ltd 浚渫における施工管理方法および装置
CN102393219A (zh) * 2011-06-20 2012-03-28 天津港工程监理咨询有限公司 耙吸船疏浚监控系统以及监控方法
CN105825242A (zh) * 2016-05-06 2016-08-03 南京大学 基于混合网格分层聚类的集群通信终端轨迹实时异常检测方法与系统
CN112785188A (zh) * 2021-02-03 2021-05-11 中交上海航道勘察设计研究院有限公司 疏浚工程运输的监管方法、系统、计算机设备和存储介质
CN113032378A (zh) * 2021-03-05 2021-06-25 北京工业大学 一种基于聚类算法和模式挖掘的船舶行为模式挖掘方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004339873A (ja) * 2003-05-19 2004-12-02 Toa Harbor Works Co Ltd 浚渫における施工管理方法および装置
CN102393219A (zh) * 2011-06-20 2012-03-28 天津港工程监理咨询有限公司 耙吸船疏浚监控系统以及监控方法
CN105825242A (zh) * 2016-05-06 2016-08-03 南京大学 基于混合网格分层聚类的集群通信终端轨迹实时异常检测方法与系统
CN112785188A (zh) * 2021-02-03 2021-05-11 中交上海航道勘察设计研究院有限公司 疏浚工程运输的监管方法、系统、计算机设备和存储介质
CN113032378A (zh) * 2021-03-05 2021-06-25 北京工业大学 一种基于聚类算法和模式挖掘的船舶行为模式挖掘方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
周海;陈姚节;陈黎;: "船舶轨迹聚类分析与应用", 计算机仿真, no. 10, pages 118 - 123 *
徐婷;戴文伯;鲁嘉俊;: "基于自动识别系统大数据的船舶施工轨迹识别与预测", 水运工程, no. 12, pages 128 - 131 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115905343A (zh) * 2022-08-01 2023-04-04 中华人民共和国广东海事局 水上航运数据处理方法、装置、设备、介质和程序产品
CN115905343B (zh) * 2022-08-01 2023-10-03 中华人民共和国广东海事局 水上航运数据处理方法、装置、设备、介质和程序产品
CN116290203A (zh) * 2023-01-12 2023-06-23 中港疏浚有限公司 基于神经网络的疏浚施工参数选优模型方法
CN116290203B (zh) * 2023-01-12 2023-10-03 中港疏浚有限公司 基于神经网络的疏浚施工参数选优模型方法

Also Published As

Publication number Publication date
CN114385765B (zh) 2023-07-07

Similar Documents

Publication Publication Date Title
CN114385765A (zh) 一种基于航迹数据的耙吸挖泥船生产时间预估方法
CN113032378B (zh) 一种基于聚类算法和模式挖掘的船舶行为模式挖掘方法
CN107610469A (zh) 一种考虑多因素影响的日维度区域交通指数预测方法
CN113032502A (zh) 一种基于改进轨迹段dbscan聚类的船舶异常检测方法
CN101968886B (zh) 基于质心跟踪框架的粒子滤波与均值漂移的细胞跟踪方法
CN111179638A (zh) 一种基于时间序列的船舶ais目标航行监控方法
CN111401573B (zh) 一种工况状态建模与修正模型方法
CN109779649A (zh) 基于大数据的盾构掘进轴线实时纠偏系统及方法
CN108230364A (zh) 一种基于神经网络的前景物体运动状态分析方法
CN112906830A (zh) 一种基于ais大数据的船舶最优航线自动生成方法
CN110210169B (zh) 一种基于lstm的盾构机故障预测方法
CN110210537A (zh) 一种基于无监督聚类的船舶历史航迹规律提取方法
CN113010567B (zh) 一种基于bds/gps定位数据时空特征的农机作业面积计算方法
CN111724074B (zh) 一种基于深度学习的路面病变检测预警方法及系统
CN111898746B (zh) 一种中断航迹接续关联深度学习方法
CN112905576A (zh) 一种基于农机作业轨迹确定农田和道路的方法及系统
CN107330587B (zh) 一种基于ais的近岸航道水深利用率计算方法
CN114118243B (zh) 一种基于航迹数据的耙吸挖泥船施工轨迹识别方法
CN114118528A (zh) 基于线性与非线性滤波器组合的船舶航迹实时预报方法
CN112200831B (zh) 一种基于动态模板的密集连接孪生神经网络目标跟踪方法
CN111582191B (zh) 基于人工智能视频分析的混凝土浇筑中浇筑量估计方法
CN103955743A (zh) 一种超高压水射流清除道路标线效果预测方法及装置
CN112528958B (zh) 一种基于网格的骤旱三维识别方法
CN110706264B (zh) 一种基于声呐点云数据的水下施工控制事件自动获取方法
CN109241656A (zh) 一种旋转机械剩余寿命预测方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant