CN111026831A - 一种基于Ais轨迹数据和卫星图像的航运信息挖掘方法 - Google Patents
一种基于Ais轨迹数据和卫星图像的航运信息挖掘方法 Download PDFInfo
- Publication number
- CN111026831A CN111026831A CN201911304103.6A CN201911304103A CN111026831A CN 111026831 A CN111026831 A CN 111026831A CN 201911304103 A CN201911304103 A CN 201911304103A CN 111026831 A CN111026831 A CN 111026831A
- Authority
- CN
- China
- Prior art keywords
- shipping information
- data
- satellite
- mining method
- points
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Remote Sensing (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
本发明揭示了一种基于Ais轨迹数据和卫星图像的航运信息挖掘方法,包括:通过分布式并行化的机器学习对海上驻留点进行初步分析,采用卫星地图图像处理对所述海上驻留点进行筛选,得到最终船舶位置。本发明提供了一种航运信息挖掘方案,能够为航运从业者提供了关键信息,例如可用于港口位置挖掘等。
Description
技术领域
本发明属于航运关键位置挖掘技术领域,具体涉及一种基于Ais轨迹数据和卫星图像的航运信息挖掘方法。
背景技术
传统港口关键位置挖掘技术,主要是基于卫星遥感影像(如灰度遥感图像、高分辨率遥感图像、SAR遥感图像等),通过海陆分割、港口轮廓提取、特征提取等步骤进行识别的。然而,该港口识别方法无法识别出偏僻或私人的小港口。
所以,针对上述技术问题,有必要提供一种新型的港口位置挖掘技术,为航运从业者提供精确的港口关键信息。
发明内容
有鉴于此,本发明的目的在于提供一种基于Ais轨迹数据和卫星图像的航运信息挖掘方法。
为了实现上述目的,本发明一实施例提供的技术方案如下:
一种基于Ais轨迹数据和卫星图像的航运信息挖掘方法,所述方法包括:
S100,通过分布式并行化的机器学习对海上驻留点进行初步分析;
S200,采用卫星地图图像处理对所述海上驻留点进行筛选,得到最终船舶位置。
一实施例中,所述分布式并行化的机器学习基于Spark大数据计算框架的网格聚类算法。
一实施例中,所述卫星地图图像处理处理的是卫星瓦片地图数据,通过所述卫星瓦片地图的颜色阈值判断驻留点是否靠岸。
一实施例中,所述方法还包括:在步骤S100之前,将Ais数据上传至分布式文件系统。
一实施例中,所述方法还包括:在S200之后,将筛选结果输出到分布式文件系统上,得到最终港口位置。
一实施例中,所述S100包括:
S101,对全量数据进行初步筛选,在映射阶段遍历所有数据记录,并按照相关字段初步对驻留点进行保留,所述字段包括速度、抛锚字段;
S102,对驻留点进行分析,通过经纬度位置精度确定网格大小,并划分网格;
S103,将每个驻留点的网格信息作为key,原始经纬度数据作为value,输出<key,value>二元组到下一个阶段。
一实施例中,所述S100还包括:
S104,对上一阶段的二元组<key,value>中的key相同的二元组进行合并,并对value进行统计,得到网格内的位置均值和位置数量;
S105,基于S104中的结果求出所有点的距离矩阵dis=[n,n],n为数据的个数,为大于等于0的自然数;
S106,如果e取值为3,所述距离矩阵dis的每一行中大于3的所有点个数的和若大于MinPts,则为1个类别;
S107,将所有类别进行重复检查,若有重复值则合并,直至没有重复;
S108,将同类别中的位置点按位置个数进行加权平均,得到结果。
一实施例中,所述S200包括:
S201,对驻留点下载所属的卫星瓦片地图,当所述卫星瓦片地图格式为颜色为#a3ccff和#fcf9f2的二色图像时,来判断驻留点是否靠岸;
S202,对所述二色图像进行判断,去除只有单色的图像。
本发明具有以下有益效果:本发明利用了分布式并行化的机器学习技术、图像处理技术,对海量Ais轨迹数据和卫星图像进行分析处理,得到了轨迹中的靠岸常驻点,进而为航运从业者提供了关键信息,例如可用于港口位置挖掘等。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明方法的流程示意图;
图2、图3分别为本发明分布式算法两个阶段的流程示意图;
图4为本发明网格聚类示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
本发明所揭示的一种基于Ais轨迹数据和卫星图像的航运信息挖掘方法,通过分布式并行化的机器学习技术聚类算法来对海上驻留点进行初步分析,并且采用卫星地图图像处理技术进行筛选,得到最终关键位置。进而为航运从业者提供了关键信息,例如可用于港口位置挖掘等。
具体地,如图1所示,本发明实施例所揭示的一种基于Ais轨迹数据和卫星图像的航运信息挖掘方法,包括:
步骤100,将Ais(Automatic identification System,船舶自动识别系统)数据上传至分布式文件系统。
步骤200,通过分布式并行化的机器学习对海上驻留点进行初步分析。
本实施例中,对步骤1中的Ais数据集使用Spark大数据计算框架的网格聚类算法进行计算,对海上驻留点进行初步分析。其中,spark是一个实现快速通用的集群计算平台。
具体地,结合图2至图4所示,步骤200包括:
S201,对全量数据进行初步筛选,在映射阶段遍历所有数据记录,并按照相关字段初步对驻留点进行保留,所述字段包括速度、抛锚字段;
S202,对驻留点进行分析,通过经纬度位置精度确定网格大小,并划分网格;
S203,将每个驻留点的网格信息作为key,原始经纬度数据作为value,输出<key,value>二元组到下一个阶段;
S204,对上一阶段的二元组<key,value>中的key相同的二元组进行合并,并对value进行统计,得到网格内的位置均值和位置数量;
S205,基于S204中的结果求出所有点的距离矩阵dis=[n,n],n为数据的个数,为大于等于0的自然数;
S206,如果e取值为3,所述距离矩阵dis的每一行中大于3的所有点个数的和若大于MinPts,则为1个类别;
S207,将所有类别进行重复检查,若有重复值则合并,直至没有重复;
S208,将同类别中的位置点按位置个数进行加权平均,得到结果。
步骤300,采用卫星地图图像处理对所述海上驻留点进行筛选,得到最终船舶位置。
本实施例中,下载处理后驻留点所在的卫星瓦片地图,通过卫星瓦片地图的颜色阈值判断驻留点是否靠岸。
具体地,步骤300包括:
S301,对驻留点下载所属的卫星瓦片地图,当所述卫星瓦片地图格式为颜色为#a3ccff和#fcf9f2的二色图像时,来判断驻留点是否靠岸;
S302,对所述二色图像进行判断,去除只有单色的图像。
步骤400,将结果输出到分布式文件系统上得到最终结果。
由以上技术方案可以看出,本发明具有以下优点:提供了一种基于Ais轨迹数据和卫星图像的航运信息挖掘方案,为航运从业者提供了关键信息,例如可用于港口位置挖掘等。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。
为了描述的方便,描述以上装置时以功能分为各种模块分别描述。当然,在实施本说明书一个或多个实施例时可以把各模块的功能在同一个或多个软件和/或硬件中实现。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本说明书一个或多个实施例的实施例可提供为方法、系统或计算机程序产品。因此,本说明书一个或多个实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书一个或多个实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书一个或多个实施例可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书一个或多个实施例,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。
Claims (8)
1.一种基于Ais轨迹数据和卫星图像的航运信息挖掘方法,其特征在于,所述方法包括:
S100,通过分布式并行化的机器学习对海上驻留点进行初步分析;
S200,采用卫星地图图像处理对所述海上驻留点进行筛选,得到最终船舶位置。
2.根据权利要求1所述的航运信息挖掘方法,其特征在于,所述分布式并行化的机器学习基于Spark大数据计算框架的网格聚类算法。
3.根据权利要求1所述的航运信息挖掘方法,其特征在于,所述卫星地图图像处理处理的是卫星瓦片地图数据,通过所述卫星瓦片地图的颜色阈值判断驻留点是否靠岸。
4.根据权利要求1所述的航运信息挖掘方法,其特征在于,所述方法还包括:在步骤S100之前,将Ais数据上传至分布式文件系统。
5.根据权利要求1或4所述的航运信息挖掘方法,其特征在于,所述方法还包括:在S200之后,将筛选结果输出到分布式文件系统上,得到最终港口位置。
6.根据权利要求1所述的航运信息挖掘方法,其特征在于,所述S100包括:
S101,对全量数据进行初步筛选,在映射阶段遍历所有数据记录,并按照相关字段初步对驻留点进行保留,所述字段包括速度、抛锚字段;
S102,对驻留点进行分析,通过经纬度位置精度确定网格大小,并划分网格;
S103,将每个驻留点的网格信息作为key,原始经纬度数据作为value,输出<key,value>二元组到下一个阶段。
7.根据权利要求6所述的航运信息挖掘方法,其特征在于,所述S100还包括:
S104,对上一阶段的二元组<key,value>中的key相同的二元组进行合并,并对value进行统计,得到网格内的位置均值和位置数量;
S105,基于S104中的结果求出所有点的距离矩阵dis=[n,n],n为数据的个数,为大于等于0的自然数;
S106,如果e[MS1]取值为3,所述距离矩阵dis的每一行中大于3的所有点个数的和若大于MinPts,则为1个类别;
S107,将所有类别进行重复检查,若有重复值则合并,直至没有重复;
S108,将同类别中的位置点按位置个数进行加权平均,得到结果。
8.根据权利要求7所述的航运信息挖掘方法,其特征在于,所述S200包括:
S201,对驻留点下载所属的卫星瓦片地图,当所述卫星瓦片地图格式为颜色为#a3ccff和#fcf9f2的二色图像时,来判断驻留点是否靠岸;
S202,对所述二色图像进行判断,去除只有单色的图像。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911304103.6A CN111026831B (zh) | 2019-12-17 | 2019-12-17 | 一种基于Ais轨迹数据和卫星图像的航运信息挖掘方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911304103.6A CN111026831B (zh) | 2019-12-17 | 2019-12-17 | 一种基于Ais轨迹数据和卫星图像的航运信息挖掘方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111026831A true CN111026831A (zh) | 2020-04-17 |
CN111026831B CN111026831B (zh) | 2023-09-15 |
Family
ID=70209632
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911304103.6A Active CN111026831B (zh) | 2019-12-17 | 2019-12-17 | 一种基于Ais轨迹数据和卫星图像的航运信息挖掘方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111026831B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017071160A1 (zh) * | 2015-10-28 | 2017-05-04 | 深圳大学 | 一种大幅面遥感图像海陆分割的方法及系统 |
CN110188093A (zh) * | 2019-05-21 | 2019-08-30 | 江苏锐天信息科技有限公司 | 一种基于大数据平台针对ais信息源的数据挖掘系统 |
CN110389366A (zh) * | 2019-08-05 | 2019-10-29 | 中国人民解放军军事科学院国防科技创新研究院 | 一种基于多源sar卫星的海上目标运动估计方法 |
-
2019
- 2019-12-17 CN CN201911304103.6A patent/CN111026831B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017071160A1 (zh) * | 2015-10-28 | 2017-05-04 | 深圳大学 | 一种大幅面遥感图像海陆分割的方法及系统 |
CN110188093A (zh) * | 2019-05-21 | 2019-08-30 | 江苏锐天信息科技有限公司 | 一种基于大数据平台针对ais信息源的数据挖掘系统 |
CN110389366A (zh) * | 2019-08-05 | 2019-10-29 | 中国人民解放军军事科学院国防科技创新研究院 | 一种基于多源sar卫星的海上目标运动估计方法 |
Non-Patent Citations (1)
Title |
---|
杨文韬: "《基于大数据的厦门港遥感影像船舶分析系统的设计与实现》" * |
Also Published As
Publication number | Publication date |
---|---|
CN111026831B (zh) | 2023-09-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Metz et al. | Efficient extraction of drainage networks from massive, radar-based elevation models with least cost path search | |
CN110598541B (zh) | 一种提取道路边缘信息的方法及设备 | |
CN112287832A (zh) | 一种基于高分辨率遥感影像的城镇违法建筑物检测方法 | |
CN113628227B (zh) | 一种基于深度学习的海岸线变化分析方法 | |
CN110807376A (zh) | 基于遥感图像的城外道路提取方法及装置 | |
CN112084923A (zh) | 一种遥感图像语义分割方法、存储介质及计算设备 | |
CN112329789B (zh) | 点云的提取方法、装置、计算机设备和存储介质 | |
US20110144962A1 (en) | Geospatial modeling system providing enhanced foliage void region inpainting features and related methods | |
CN113516053B (zh) | 一种具有旋转不变性的舰船目标精细化检测方法 | |
CN114972370A (zh) | 一种用于神经网络推理的遥感图像自适应分割方法 | |
CA2684893A1 (en) | Geospatial modeling system providing data thinning of geospatial data points and related methods | |
CN112017282A (zh) | 面向数字高程模型的任意断面集水区边界与河网提取方法 | |
Metz et al. | Accurate stream extraction from large, radar-based elevation models. | |
CN114519819A (zh) | 一种基于全局上下文感知的遥感图像目标检测方法 | |
CN113628180A (zh) | 一种基于语义分割网络的遥感建筑物检测方法及系统 | |
CN113298042A (zh) | 遥感影像数据的处理方法及装置、存储介质、计算机设备 | |
CN117152435A (zh) | 一种基于U-Net3+的遥感语义分割方法 | |
CN111026831A (zh) | 一种基于Ais轨迹数据和卫星图像的航运信息挖掘方法 | |
CN115861816A (zh) | 一种立体低涡识别方法、装置、存储介质及终端 | |
CN108597013B (zh) | 一种特定区域气象水文资料抽点填图方法 | |
Yang et al. | CADNet: Top-down contextual saliency detection network for high spatial resolution remote sensing image shadow detection | |
Widyaningrum et al. | Tailored features for semantic segmentation with a DGCNN using free training samples of a colored airborne point cloud | |
CN115222610B (zh) | 图像方法、装置、电子设备及存储介质 | |
Li et al. | A fuzzy segmentation-based approach to extraction of coastlines from IKONOS imagery | |
CN118072164A (zh) | 一种历史建筑风格识别方法、装置、设备和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |