CN105630882B

CN105630882B - 基于遥感数据深度学习的近海污染物识别与跟踪方法

Info

Publication number: CN105630882B
Application number: CN201510955938.3A
Authority: CN
Inventors: 王岢; 徐晓飞; 叶允明
Original assignee: Shenzhen Graduate School Harbin Institute of Technology
Current assignee: Shenzhen Graduate School Harbin Institute of Technology
Priority date: 2015-12-18
Filing date: 2015-12-18
Publication date: 2019-09-20
Anticipated expiration: 2035-12-18
Also published as: CN105630882A

Abstract

本发明针对现有近海环境监管技术存在的“发现不全面”、“缺乏对遥感数据的内容挖掘”的问题，基于多年来在卫星应用领域的研发和产业应用基础，提出了一个全面、系统、深入的基于遥感数据深度学习的近海污染物目标识别与跟踪的解决方案，该方案应用卫星遥感图像的深度学习模型、海量遥感数据分布式存储与并行处理技术和基于GPU加速的深度卷积网络并行模型，满足相关行业“全面、准确、快速”监控海洋污染物的应用需求。

Description

基于遥感数据深度学习的近海污染物识别与跟踪方法

技术领域

本发明属于数字图像识别领域，具体涉及一种近海污染物识别与跟踪方法。

背景技术

近几十年，随着世界工业的发展，海洋的污染也日趋加重，有害物质进入海洋环境而造成的污染，会损害生物资源，危害人类健康，妨碍捕鱼和人类在海上的其他活动，损坏海水质量和环境质量等，使海洋生态系统遭到破坏。海洋污染物主要包括石油、重金属和酸碱、放射性核素、固体废料等，其中，石油污染物是最常见的海洋污染物之一，主要是由工业生产，包括海上油井管道泄漏、油轮事故、船舶排污等造成的，每年排入海洋的石油污染物约一千万吨，一次突发性泄漏的石油量可达10万吨以上，大片海水被油膜覆盖，导致海洋生物大量死亡，严重影响海产品的价值。

因此，有必要对海上各类污染物进行快速识别并做相应的预测与预警。当前高分辨率的卫星和航空遥感技术能够拍摄出海洋表层的许多污染影像。然而，海洋遥感覆盖面积大，具有同时性，能够几乎在同等条件下把获得的资料同船舶测点取样进行对比，能连续、长期而且快速地观测海洋的特点，而且可以得到用船舶观测法不能完整观测到的海洋特征，如海洋表面水温、海流移动、海水分布、波浪、沿海岸泥沙混浊流，以及赤潮、海面油污染等。利用卫星遥感和数据挖掘技术监测海上污染物无论从理论上和实践上都证明是可行的，并且具有节约资金.适时、快速、连续大范围监测的优势，无异是未来实现海洋全面监测的必然手段。尤其是在保护海洋环境；对非法排污罚款提供依据；确定油污面积、排污量、扩散规律；为清除油污制定方案提供资料等方面都具有十分重要的意义。

遥感具有大面积、快速、动态、低成本获取区域信息的优势,由于海上污染物的复杂性,如何从大量的遥感图像中识别并跟踪污染物目标已成为一个亟需解决的科学前沿问题。目前利用遥感图像深度学习来提取海洋环境污染物目标的相关研究还未见报道。已有的遥感技术在海洋环境监测中的应用，目前国内外主要集中在海洋溢油监测，以及悬浮物、叶绿素等要素上的定量遥感识别方面，然而，海量的遥感影像具有极大的信息量，它同时具有空间分辨和时间分辨的能力，但真正把这些信息提取和挖掘出来是极其复杂和困难的。例如，例如Landsat卫星的TM图像，一幅覆盖185km×185km地面面积，象元空间分辨率为30m，象元光谱分辨率为28位的图，其数据量约为6000×6000＝36Mb。若将6个波段全部送入计算机，其数据量为：36Mb×6＝216Mb，而每天获取的整体数据量将高达TB级，为了提高对这样庞大数据的处理速度，遥感数字图像技术随之得以迅速发展。

遥感影像深度学习技术是指通过对大量的遥感影像进行机器学习，自学习出各类污染物的特征，过滤掉图像中无用的或干扰的信息，抽取图像源中关键的有用信息，准确地判断和检测出污染物目标，从而为各类工作的顺利推进提供直观且有价值的图像依据。然而，虽然深度学习有较多优点，但仍然有需要解决的科学性问题，例如：对于一个特定的框架，对于多少维的输入它可以表现得较优(如果是图像，可能是上百万维)？有什么正确的机理可以去增强一个给定的深度学习架构，以改进其鲁棒性和对扭曲和数据丢失的不变性？模型方面是否有其他更为有效且有理论依据的深度模型学习算法？

因此，从遥感影像中建模深度学习以识别污染物目标的需求角度看，深度学习模型及相关科学问题成为一个必需解决的技术难题；

综上所述，由于海量遥感影像数据处理、图像内容挖掘所存在的技术挑战目前尚未有很好的、全面的解决方案，因此针对遥感影像的新特点和新变化，研发具有自主知识产权的、创新性的、先进的针对海量遥感影像的近海污染物识别当前是非常必要和紧迫的。本发明正是针对这些技术和应用问题展开的，发明的成功研发和产业化对于公共安全、国家安全等方面将有重要的意义。

发明内容

本发明针对现有近海环境监管技术存在的“发现不全面”、“缺乏对遥感数据的内容挖掘”的问题，基于多年来在卫星应用领域的研发和产业应用基础，提出了一个全面、系统、深入的基于遥感数据深度学习的近海污染物目标识别与跟踪的解决方案。

本发明具体通过如下技术方案实现：

一种基于遥感数据深度学习的近海污染物识别与跟踪方法，基于近海污染物识别与跟踪系统，所述系统分为用于应用层、内容分析与挖掘层、资源数据集成层、资源获取层；所述方法包括：

首先，采用海量遥感影像数据分布式处理技术对多源遥感影像资源统一数据集成、分布式处理，包括数据标准化处理、噪音数据过滤、归一化、数据一致性检查，形成污染物目标数据库；

然后，通过卷积神经网络CNN建立卫星遥感图像的深度学习模型，利用空间关系减少需要学习的参数数目以提高一般前向BP算法的训练性能；利用权值共享降低网络的复杂性；

最后，由于深度卷积神经网络模型的卷积层计算量大，全连接层参数多，可将一个完整深度卷积网络的计算拆分到多个GPU上进行合理调度来并行地执行，通过模型并行和数据并行这两个数据/计算组织层次上来加速训练，快速针对特定污染物目标的识别、检测、跟踪和行为分析。

附图说明

图1是本发明的基于遥感数据深度学习的近海污染物识别与跟踪系统框图；

图2是一致性哈希的工作方式示意图；

图3是一致性哈希处理节点添加/移除时的情况示意图；

图4是卷积神经网络训练过程卷积神经网络训练过程示意图；

图5是权值共享示意图；

图6是Feature Map的示意图；

图7是ImageNet深度卷积神经网络模型；

图8是从单GPU训练到多GPU模型并行训练的概要视图；

图9是2GPU模型并行系统框架示意图；

图10是数据处理和计算流水线示意图；

图11是硬件体系结构示意图；

图12是模型并行中的模型划分方案示意图；

图13是对ImageNet网络的模型并行和数据并行划分示意图。

具体实施方式

下面结合附图说明及具体实施方式对本发明进一步说明。

本发明的基于遥感数据深度学习的近海污染物识别与跟踪系统，如附图1所示，分为用于应用层、内容分析与挖掘层、资源数据集成层、资源获取层，包括污染物目标识别、决策支持子系统、报警子系统、污染物漂移预报子系统、各种污染品化学成份及危害数据库、清污救助材料/设备性能及存货数据库、地理信息系统、污染应急反应能力评估子系统、污染损害评估子系统等，可结合无线通讯系统技术实现地面应急反应中心与海巡飞机和海上作业船舶之间的可视化信息通讯，依据海巡飞机的报告，快速生成救助、清除方案，指挥清污船快速准确地进行多项海上清污技术的集成式清污作业。

首先，通过多个不同的遥感卫星以及航拍获得的影像资源原始数据具有多源、异构、海量的特点，例如，不同种类的遥感影像在空间分辨率、光谱分辨率、辐射分辨率和时间分辨率是有区别的，图像格式和成像方式也有所不同。因此进行分析和挖掘前必须解决资源数据的集成和标准化问题。本发明采用海量遥感影像数据分布式处理技术对多源遥感影像资源统一数据集成、分布式处理，包括数据标准化处理、噪音数据过滤、归一化、数据一致性检查，形成污染物目标数据库。

然后，通过卷积神经网络CNN建立卫星遥感图像的深度学习模型，可利用空间关系减少需要学习的参数数目以提高一般前向BP算法的训练性能。由于CNN的特征检测层通过训练数据进行学习，所以在使用CNN时，避免了显式的特征抽取，而隐式地从训练数据中进行学习；并且卷积神经网络以其局部权值共享的特殊结构在图像处理方面有着独特的优越性，其布局更接近于实际的生物神经网络，权值共享降低了网络的复杂性，特别是多维输入向量的图像可以直接输入网络这一特点避免了特征提取和分类过程中数据重建的复杂度。

最后，由于深度卷积神经网络模型的卷积层计算量大，全连接层参数多，可将一个完整深度卷积网络的计算拆分到多个GPU上进行合理调度来并行地执行，通过模型并行和数据并行这两个数据/计算组织层次上来加速训练，同时能快速针对特定污染物目标的识别、检测、跟踪和行为分析。

本发明所采用的关键技术如下：

一、海量遥感影像数据分布式处理关键技术

构建一个TB级甚至PB级的海量遥感影像数据分布式存储与处理系统，需要有自适应的数据划分方式、良好的负载均衡策略来满足数据、用户规模的不断增长需求。同时，在保证系统可靠性的同时，需要权衡数据一致性与数据可用性，来满足互联网应用低延时、高吞吐率的特点。因此本发明主要从数据划分、数据一致性与可用性、负载均衡、容错机制等四个主要方面来构建一个高可靠、可扩展的海量数据存储系统。

在分布式环境下，数据存储需要跨越多个存储单元。如何进行数据的划分是影响扩展性，负载平衡，以及系统性能的关键问题。为了提供低延时的系统响应，抑制系统性能的瓶颈，系统必须在用户请求到来时将请求进行合理分发。在数据划分方面，采用一致性哈希的方式进行划分。主要通过Consistent Hashing算法进行。Key经过hash函数哈希得到值，按照值域首尾相接形成一个ring。这个Hash值形成的ring被划分成不同的范围，分配给集群系统中的不同节点进行管理。当对数据进行请求(读取/插入)时，通过计算该key/value中key的hash值，定位到相应的节点进行服务请求。整个过程如附图2所示。

采用一致性哈希进行数据划分的优势还在于，一致性哈希最大限度地抑制了节点变化(添加/移除)时数据需要进行迁移重新分布的数量，这有利于系统的扩展性。如附图3所示，当前系统访问压力过大时，通过增加新的节点可以缓解压力；而此时，新节点的加入仅仅影响它的邻居节点，避免了大量数据进行迁移的开销。

数据可用性是分布式环境下数据存储的基石；而数据一致性模型则保证数据操作的正确性。在分布式环境下，将采用副本冗余、日志等方式来解决数据的可用性问题；但是副本冗余存储会带来了数据一致性的问题。在采用副本冗余方式的分布式系统中，数据一致性与系统性能是一对不可调和的矛盾：需要牺牲系统的性能来保证数据的严格一致性，或者牺牲一致性来保证系统的性能(响应时间等)。在视频数据的挖掘应用中，可以采用第二种手段来调和这种矛盾，即允许系统通过弱化一致性模型来保证高效的系统响应，同时通过异步复制的手段来保证数据的可用性。

有效的数据划分方式为系统扩展性提供了一个基础，但是同时也给系统带来了负载均衡的问题。负载均衡是分布式环境下进行高效数据管理的关键问题。它主要包括数据的均衡和访问压力的均衡这两个方面。在访问压力均衡方面，采用虚拟节点技术，通过虚拟化的手段将节点的服务能力单元化，将访问压力较大的虚拟节点映射到服务能力较强的物理节点，以达到访问压力的均衡目的。访问压力的均衡伴同时伴随着数据的均衡。为了使数据均衡过程中，数据迁移的开销尽可能小，可采用同样的虚拟化技术，量化节点的存储能力，将虚拟后的存储节点相对均匀地分散到集群哈希环上，避免数据均衡过程中全环的数据移动。在非集中式系统中，这些均衡操作可以由任一节点发起，通过gossip通讯机制与集群中的其他节点协调完成。通过虚拟化节点或者表分裂等方式改变数据分布格局，均衡访问负载的同时，将尽可能减少存储数据迁移量或者避免数据迁移。

容错是分布式系统健壮性的标志。通过制定节点的失效侦测方法以及失效恢复方法可保证系统的可用性、可靠性。在失效侦测方面，非集中式系统中，各节点之间定期进行交互以了解节点的活动状态，从而侦测失效的存在；而在系统侦测到失效节点的存在后，需要一定的恢复策略来完成对失效节点的恢复，保证系统的可用性和可靠性。在分布式系统中，节点的失效分为临时失效(如网络分区等)和永久失效(如节点宕机、磁盘损坏等)两种情况。在副本冗余存储的分布式系统中，失效通常会造成了多副本之间的数据不一致，这时候需要对失效节点的数据进行同步来完成失效的恢复。同时，永久失效通常会造成失效节点内存中数据的丢失，日志重做通常是解决这类问题的一种办法。当然，具体的失效恢复策略在不同的系统中又各有特色。在此，临时失效和永久失效被区别对待。在临时失效发生时，将会把数据暂时放置在临时节点，待节点从临时失效中恢复过来后，数据将归还给目标节点。对于永久失效带来的数据不一致，通过对失效节点的数据进行同步来完成失效恢复。

二、面向遥感影像的深度学习模型-卷积神经网络CNN

卷积神经网络是人工神经网络的一种，它的权值共享网络结构使之更类似于生物神经网络，降低了网络模型的复杂度，减少了权值的数量。其优点在网络的输入是多维图像时表现的更为明显，使图像可以直接作为网络的输入，避免了传统识别算法中复杂的特征提取和数据重建过程。卷积网络是为识别二维形状而特殊设计的一个多层感知器，这种网络结构对平移、比例缩放、倾斜或者共他形式的变形具有高度不变性。

其核心思想是将：局部感受野、权值共享(或者权值复制)以及时间或空间亚采样这三种结构思想结合起来获得了某种程度的位移、尺度、形变不变性。

卷积神经网络是一个多层的神经网络，每层由多个二维平面组成，而每个平面由多个独立神经元组成。

如附图4所示，卷积神经网络训练过程：输入图像通过和三个可训练的滤波器和可加偏置进行卷积，滤波过程如，卷积后在C1层产生三个特征映射图，然后特征映射图中每组的四个像素再进行求和，加权值，加偏置，通过一个Sigmoid函数得到三个S2层的特征映射图。这些映射图再进过滤波得到C3层。这个层级结构再和S2一样产生S4。最终，这些像素值被光栅化，并连接成一个向量输入到传统的神经网络，得到输出。

通常，C层为特征提取层，每个神经元的输入与前一层的局部感受野相连，并提取该局部的特征，一旦该局部特征被提取后，它与其他特征间的位置关系也随之确定下来；S层是特征映射层，网络的每个计算层由多个特征映射组成，每个特征映射为一个平面，平面上所有神经元的权值相等。特征映射结构采用影响函数核小的sigmoid函数作为卷积网络的激活函数，使得特征映射具有位移不变性。

此外，由于一个映射面上的神经元共享权值，因而减少了网络自由参数的个数，降低了网络参数选择的复杂度。卷积神经网络中的每一个特征提取层(C-层)都紧跟着一个用来求局部平均与二次提取的计算层(S-层)，这种特有的两次特征提取结构使网络在识别时对输入样本有较高的畸变容忍能力。

假设如果当前有1000x1000像素的图像，有1百万个隐层神经元，那么全连接的话(每个隐层神经元都连接图像的每一个像素点)，就有1000*1000*1000000＝10¹²个连接，也就是10¹²个权值参数。然而图像的空间联系是局部的，每一个神经元都不需要对全局图像做感受，每个神经元只感受局部的图像区域，然后在更高层，将这些感受不同局部的神经元综合起来就可以得到全局的信息了。这样，就可以减少连接的数目，也就是减少神经网络需要训练的权值参数的个数了。如附图5的右边：假如局部感受野是10*10，隐层每个感受野只需要和这10*10的局部图像相连接，所以1百万个隐层神经元就只有一亿个连接，即10⁸个参数。比原来减少了四个0(数量级)，这样训练时间可减少。

隐含层的每一个神经元都连接10*10个图像区域，也就是说每一个神经元存在10*10＝100个连接权值参数。每个神经元用的是同一个卷积核去卷积图像。权值共享的意思就是不论隐层的神经元个数是多少，两层间的连接只有100个参数。

如果需要提取不同的特征，则通过加多几种滤波器。假设加到100种滤波器，每种滤波器的参数不一样，表示它提出输入图像的不同特征，例如不同的边缘。这样每种滤波器去卷积图像就得到对图像的不同特征的放映，可称为Feature Map。100种卷积核就有100个Feature Map。此100个Feature Map就组成了一层神经元。100种卷积核x每种卷积核共享100个参数＝100*100＝10K，也就是1万个参数，如附图6的右边。

隐层的参数个数和隐层的神经元个数无关，只和滤波器的大小和滤波器种类的数量有关。隐层的神经元个数和原图像，也就是输入的大小(神经元个数)、滤波器的大小和滤波器在图像中的滑动步长有关。例如，图像是1000*1000像素，而滤波器大小是10*10，假设滤波器没有重叠，也就是步长为10，这样隐层的神经元个数就是(1000*1000)/(10*10)＝100*100个神经元，图像越大，神经元个数和需要训练的权值参数个数的差额就越大。

神经网络用于模式识别的主流是有指导学习网络。对于有指导的模式识别，由于任一样本的类别是已知的，样本在空间的分布不再是依据其自然分布倾向来划分，而是要根据同类样本在空间的分布及不同类样本之间的分离程度找一种适当的空间划分方法，或者找到一个分类边界，使得不同类样本分别位于不同的区域内。这就需要一个长时间且复杂的学习过程，不断调整用以划分样本空间的分类边界的位置，使尽可能少的样本被划分到非同类区域中。

卷积网络在本质上是一种输入到输出的映射，它能够学习大量的输入与输出之间的映射关系，而不需要任何输入和输出之间的精确的数学表达式，只要用已知的模式对卷积网络加以训练，网络就具有输入输出对之间的映射能力。卷积网络执行的是有导师训练，所以其样本集是由形如：(输入向量，理想输出向量)的向量对构成的。所有这些向量对，都应该是来源于网络即将模拟的系统的实际“运行”结果。它们可以是从实际运行系统中采集来的。在开始训练前，所有的权都应该用一些不同的小随机数进行初始化。“小随机数”用来保证网络不会因权值过大而进入饱和状态，从而导致训练失败；“不同”用来保证网络可以正常地学习。实际上，如果用相同的数去初始化权矩阵，则网络无能力学习。

训练算法与传统的BP算法差不多。主要包括4步，这4步被分为两个阶段：

第一阶段，向前传播阶段：

a)从样本集中取一个样本(X,Y_p)，将X输入网络；

b)计算相应的实际输出O_p。

在此阶段，信息从输入层经过逐级的变换，传送到输出层。这个过程也是网络在完成训练后正常运行时执行的过程。在此过程中，网络执行的是计算(实际上就是输入与每层的权值矩阵相点乘，得到最后的输出结果)：

O_p＝F_n(…(F₂(F₁(X_pW⁽¹⁾)W⁽²⁾)…)W⁽ⁿ⁾)

第二阶段，向后传播阶段

a)算实际输出O_p与相应的理想输出Y_p的差；

b)按极小化误差的方法反向传播调整权矩阵。

三、GPU加速的深度学习框架

多GPU模型并行+数据并行框架，目标是期望能充分利用深度卷积神经网络模型的可并行特点，结合SGD(Stochastic Gradient Descent，随机梯度下降)训练的数据并行特性，加速模型训练过程；突破显存大小限制，使得训练超过单GPU显存的模型成为可能，并预期通过训练更复杂的网络来获得更好的模型效果。

附图7揭示了一个具有5个卷积层和3个全连接层的深度卷积神经网络，该模型可应用于图像分类。

上述目标完成后，系统可以更快地训练附图7中目标深度卷积神经网络模型。模型拆分到不同GPU上可减少对单GPU显存占用，适用于训练更深层次、更多参数的卷积神经网络。

模型并行是：适当拆分模型到不同的计算单元上利用任务可并行性达到整个模型在计算过程中并行化效果。

如附图8所示，从单GPU训练到多GPU模型并行训练的不同点在于：在使用单GPU训练的场景下，模型不进行拆分，GPU显存上存储整个模型；模型并行的场景下，将模型拆分到多个GPU上存储，因此在训练过程中每个GPU上实际只负责训练模型的一部分，通过执行引擎的调度在一个WorkerGroup内完成对整个模型的训练。

多GPU并行系统从功能上划分为用于读取和分发数据的Training DataDispatcher和用于做模型并行训练的GPU Worker，如附图9所示。训练数据从磁盘文件读取到CPU主存再拷贝到GPU显存，故此设计在各Worker计算每batch数据时，由Training DataDispatcher从文件中读取并分发下一batch数据，以达到用计算时间掩盖I/O时间的设计目标。

基于mini-batch的训练，现有技术方案在训练深度卷积神经网络时，每次从数据文件中读入和处理1个batch数据，在GPU计算某一batch时由CPU预读取和预处理下一batch。

但是随着训练集图片像素数增大，读取和处理时间随之增加，由于采用多GPU技术加速了单个batch计算时间，数据处理的性能问题随之而来，需要减少数据处理的用时，以使最终加速效果取决于计算用时。

如附图10所示，总体看来，在深度卷积神经网络训练过程中始终是在执行一条三阶段并行的流水线：计算本次batch数据——处理下次batch数据——读入再下次batch数据。

数据并行以划分Worker Group为基本组织形式，模型并行以在Worker Group内划分Worker为基本组织形式，并行训练的调度资源来源于CPU线程，计算资源来源于GPU卡。由于GPU卡通常意义上被看成是一种加速卡或协处理器卡，必须在基于CPU的主机上下文中被调用来做计算，因此遵循1个CPU线程绑定1张GPU卡能够发挥多GPU共同参与计算时的并行性效能。

下表是GPU模型并行+数据并行CPU线程、GPU与Worker Group、Worker绑定关系。

表1Worker Group与Worker绑定关系

在实际运行环境中，安装多GPU服务器的硬件体系结构如附图11所示，以下是一个8GPU节点服务器的硬件配置，每两个GPU Slot连接在一个GPU专用PCI槽位上再通过PCIeSwitch将GPU Slot 0,1,2,3连接在一颗CPU上，GPU Slot 4,5,6,7连接在另一颗CPU上，两颗CPU通过IOH(Input Output Hub)连接。

模型并行的来源是Deep CNNs网络只在特定层(如输入层、全连接层)与其他层有全面的连接，而其他较为独立的直线连接关系即可作为模型的可并行部分。将模型的可并行部分拆分到多个GPU上，同时利用多个GPU的计算能力各执行子模型的计算，如附图12所示，可以大大加快模型的单次前向-后向训练时间。

Deep CNNs网络的层次模型实际上是一张有向无环图(DAG图)，分配到每个模型并行Worker上的层集合，是有向无环图的拓扑排序子集，所有子集组成整个网络的1组模型。

考虑极端情景：需要训练超大规模Deep CNNs模型，或者使用计算能力相对较强、显存较小(一般在1GB～3GB)的桌面级GeForce系列GPU，则利用模型本身的并行性这种基本的模型划分方法将不再适用。需要将模型再做拆分以保证单个GPU都能存储下对应的子模型。

每个模型并行Worker上以一个模型并行执行引擎负责调度本Worker上子模型的执行过程。执行引擎控制所有Worker上的子模型完成前向和后向计算，各自对子模型完成参数更新后，到达主线程同步点，开始下一mini-batch训练。

多GPU模型并行和数据并行的Deep CNNs模型replicas及划分结构如附图13所示，在使用4GPU的场景下，划分了2组Worker Group用于数据并行；每个Worker Group内划分2个Worker用于模型并行。

本发明的主要贡献在于：

本发明满足相关行业“全面、准确、快速”监控海洋污染物的应用需求。

为了实现“全面”分析这个目标，本发明提出了研发多源影像资源统一集成的技术思路：即通过综合多种遥感卫星的影像的数据特征，对不同数据源发现的影像资源进行比对、数据清洗、整合、标准化和集成，从而形成一个标准化、统一的、全局性的影像资源数据仓库，为后续的深度学习、分析和挖掘提供全面统一的数据基础，从而能保证各种监控应用达到“全面性”的要求。

为了达到“快速”分析需求，本发明提出了分布式处理与并行计算的技术思路，采用网络存储系统存储海量遥感数据，通过虚拟化技术全面整合存储容量，按需分配且能够灵活调整大小。前端通过影像流协议直写网络存储系统。影像通过离散算法均衡切片，以集群响应方式提供数据并发计算服务。底层采用网络RAID技术，多层次保护用户数据安全。全系统集群工作模式，保证各设备间业务实时负载均衡，提高设备利用率，加快数据处理速度，从而达到快速分析的目标。

为了达到“准确”的分析要求，则要对海量影像内容进行深入挖掘和分析，因此本发明将重点研发基于多GPU架构的并行深度学习模型，在深度学习的图像识别应用中，深度卷积神经网络模型的卷积层计算量大，全连接层参数多。因此，提出划分计算资源方法，通过模型并行和数据并行这两个数据/计算组织层次上来加速训练，同时能快速针对特定污染物目标的识别、检测、跟踪和行为分析。

以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明，不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干简单推演或替换，都应当视为属于本发明的保护范围。

Claims

1.一种基于遥感数据深度学习的近海污染物识别与跟踪方法，其特征在于：所述方法包括：

最后，由于深度卷积神经网络模型的卷积层计算量大，全连接层参数多，将一个完整深度卷积网络的计算拆分到多个GPU上进行合理调度来并行地执行，通过模型并行和数据并行这两个数据/计算组织层次上来加速训练，快速针对特定污染物目标的识别、检测、跟踪和行为分析；具体为：采用网络存储系统存储海量遥感数据，通过虚拟化技术全面整合存储容量，按需分配且能够灵活调整大小；前端通过影像流协议直写网络存储系统；影像通过离散算法均衡切片，以集群响应方式提供数据并发计算服务；底层采用网络RAID技术，多层次保护用户数据安全。

2.根据权利要求1所述的近海污染物识别与跟踪方法，其特征在于：所述方法根据多种遥感卫星的影像的数据特征，对不同数据源发现的影像资源进行比对、数据清洗、整合、标准化和集成，从而形成一个标准化、统一的、全局性的影像资源数据仓库，为后续的深度学习、分析和挖掘提供全面统一的数据基础。

3.根据权利要求1所述的近海污染物识别与跟踪方法，其特征在于：所述方法采用全系统集群工作模式，保证各设备间业务实时负载均衡，提高设备利用率，加快数据处理速度，从而达到快速分析的目标。

4.根据权利要求1所述的近海污染物识别与跟踪方法，其特征在于：所述模型并行是将一个完整Deep CNNs网络的计算拆分到多个GPU上来执行而采取的并行手段，结合并行资源对模型各并行部分进行合理调度以达到模型并行加速效果。

5.一种基于遥感数据深度学习的近海污染物识别与跟踪系统，所述系统分为应用层、内容分析与挖掘层、资源数据集成层、资源获取层；其特征在于：所述系统包括：

多源资料数据处理装置：采用海量遥感影像数据分布式处理技术对多源遥感影像资源统一数据集成、分布式处理，包括数据标准化处理、噪音数据过滤、归一化、数据一致性检查，形成污染物目标数据库；

学习模型建立装置：通过卷积神经网络CNN建立卫星遥感图像的深度学习模型，利用空间关系减少需要学习的参数数目以提高一般前向BP算法的训练性能；利用权值共享降低网络的复杂性；

并行计算装置：由于深度卷积神经网络模型的卷积层计算量大，全连接层参数多，将一个完整深度卷积网络的计算拆分到多个GPU上进行合理调度来并行地执行，通过模型并行和数据并行这两个数据/计算组织层次上来加速训练，快速针对特定污染物目标的识别、检测、跟踪和行为分析；具体为：采用网络存储系统存储海量遥感数据，通过虚拟化技术全面整合存储容量，按需分配且能够灵活调整大小；前端通过影像流协议直写网络存储系统；影像通过离散算法均衡切片，以集群响应方式提供数据并发计算服务；底层采用网络RAID技术，多层次保护用户数据安全。