CN114942951A - 一种基于ais数据的渔船捕鱼行为分析方法 - Google Patents

一种基于ais数据的渔船捕鱼行为分析方法 Download PDF

Info

Publication number
CN114942951A
CN114942951A CN202210640301.5A CN202210640301A CN114942951A CN 114942951 A CN114942951 A CN 114942951A CN 202210640301 A CN202210640301 A CN 202210640301A CN 114942951 A CN114942951 A CN 114942951A
Authority
CN
China
Prior art keywords
data
fishing
track
network
analysis method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210640301.5A
Other languages
English (en)
Inventor
张久文
吴尽昭
蔡川
苏伟
朱龙鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lanzhou University
Guilin University of Aerospace Technology
Original Assignee
Lanzhou University
Guilin University of Aerospace Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lanzhou University, Guilin University of Aerospace Technology filed Critical Lanzhou University
Priority to CN202210640301.5A priority Critical patent/CN114942951A/zh
Publication of CN114942951A publication Critical patent/CN114942951A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2474Sequence data queries, e.g. querying versioned data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Fuzzy Systems (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于AIS数据的渔船捕鱼行为分析方法,包括:对原始数据进行异常处理得到轨迹数据序列;基于轨迹数据序列构建数据集;基于数据集识别渔船捕捞状态和渔船作业类型。本发明提供了一种渔船捕捞状态和渔船作业类型识别方法,从使用深度学习算法挖掘数据集中有用的信息出发,构建了一条包含数据处理、渔船捕捞状态识别和渔船作业类型识别的一整套实验过程和标准,为渔业的可持续发展提供了数据信息保障。

Description

一种基于AIS数据的渔船捕鱼行为分析方法
技术领域
本申请属于深度学习技术领域,具体涉及一种基于AIS数据的渔船捕鱼行为分析方法。
背景技术
渔业领域现存很多问题,如存在捕捞强度过大、幼鱼资源非法滥用、禁渔期偷捕等破坏渔业生态的行为,同时渔业的监管也是一件困难事,需要相关部门制定并实施合理有效的政策。上述种种因素对中国渔业会造成严重的破坏。为了渔业的可持续化发展,合理捕捞和加大监管力度已经成为迫在眉睫的事。
发明内容
本发明提出了一种基于AIS数据的渔船捕鱼行为分析方法,旨在通过AIS捕鱼标记数据来识别渔船捕捞状态和渔船作业类型,使用深度学习算法挖掘数据集中有用的信息,构建一条包含数据处理、渔船捕捞状态识别和渔船作业类型识别的一整套实验过程和标准,为渔业的可持续发展提供数据信息保障。
为实现上述目的,本发明提供了如下方案:一种基于AIS数据的渔船捕鱼行为分析方法,具体如下:
S1、对原始数据进行异常处理,得到轨迹数据序列;
S2、基于所述轨迹数据序列构建数据集;
S3、基于所述数据集识别渔船捕捞状态;
S4、基于所述数据集识别渔船作业类型。
优选的,所述S1中所述原始数据为不同类型渔船在固定海域捕鱼作业情况的数据,并对捕鱼状态进行标记。
优选的,所述S1中对所述原始数据进行所述异常处理,包括以下步骤:
S1.1、对所述原始数据进行清洗和降噪处理,得到预处理数据;
S1.2、基于所述预处理数据进行轨迹提取和插值处理,得到所述轨迹数据序列。
优选的,所述S1.1中对所述原始数据进行所述清洗和所述降噪处理,得到所述预处理数据,包括以下步骤:
S1.1.1、舍弃所述原始数据中无效数据的数据行;
S1.1.2、删除所述原始数据中存在空值的所述数据行;
S1.1.3、删除所述原始数据中数据完全相同的所述数据行;
S1.1.4、删除所述原始数据中超出标准数据范围的数据值,得到所述预处理数据。
优选的,所述S1.2中基于所述预处理数据进行所述轨迹提取和所述插值处理,得到所述轨迹数据序列,包括以下步骤:
S1.2.1、将所述预处理数据进行分组,对每一组所述预处理数据按时间戳递增排序,得到历史轨迹数据;
S1.2.2、将所述历史轨迹数据进行切割,得到航迹段;
S1.2.3、计算所述历史轨迹数据中轨迹点的衍生特征,得到前后所述轨迹点的时间差;
S1.2.4、根据所述时间差切割所述航迹段,得到正常时间差;
S1.2.5、删除小于所述正常时间差对应的所述轨迹点的数据,并进行插值补齐,得到所述轨迹数据序列。
优选的,所述S2中构建所述数据集,包括以下步骤:
S2.1、设置序列长度的上限和下限;
S2.2、若所述轨迹数据序列的所述序列长度低于所述下限则直接舍弃;
S2.3、若所述轨迹数据序列的所述序列长度超过所述上限则进行迭代采样处理,得到所述序列长度为所述上限的采样数据序列;
S2.4、对所述序列长度介于所述上限和所述下限之间的所述轨迹数据序列和所述采样数据序列,采用离差标准化进行归一化处理,得到所述数据集。
优选的,所述S3中识别所述渔船捕捞状态,包括以下步骤:
S3.1、将LSTM网络与CRF网络结合,得到LSTM-CRF网络;
S3.2、根据所述数据集,选取常规序列标注检测网络和LSTM-CRF网络进行预测实验,对所述预测实验的结果进行分析,得到准确性最高的网络模型为所述的LSTM-CRF网络;
S3.3、通过所述LSTM-CRF网络对所述渔船捕捞状态进行识别。
优选的,所述S4中识别所述渔船作业类型,包括以下步骤:
S4.1、根据所述数据集构建图像数据集;
S4.2、根据所述图像数据集,选取常规图像分类处理网络进行图像分类实验,将所述图像分类实验结果进行对比,得到准确率最高的最佳网络模型;
S4.3、将C-CNN结构嵌入所述最佳网络模型,其他网络参数不变,设置采样循环比,基于所述图像数据集做对比实验,得到最佳采样循环比;
S4.4、通过嵌入所述最佳采样循环比时所述C-CNN结构的所述最佳网络模型对所述渔船作业类型进行识别。
优选的,所述S4.1中构建所述图像数据集,包括以下步骤:
S4.1.1、将所述数据集中的数据进行区分,得到区分数据,根据捕鱼系数将所述区分数据生成图像,得到原始轨迹图像;
S4.1.2、对所述的原始轨迹图像进行旋转和镜像变换,得到扩充轨迹图像;
S4.1.3、根据所述原始轨迹图像和所述扩充轨迹图像构建所述图像数据集。
本发明的有益效果为:构建数据集和使用深度学习算法从数据集中挖掘有用的信息,构建LSTM-CRF网络模型,用于识别渔船捕捞状态,使用图像处理方法并采用C-CNN结构,用于识别渔船作业类型,构建了一条包含数据处理、渔船捕捞状态识别和渔船作业类型识别的一整套实验过程和标准,为渔业的可持续发展提供了数据信息保障。
本方法具有广阔的推广空间和使用价值。
附图说明
为了更清楚地说明本发明的技术方案,下面对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的流程示意图;
图2为本发明实施例中随机选取的历史轨迹数据示意图;
图3为本发明实施例中拖网作业下时间间隔统计量和频数分布示意图;
图4为本发明实施例中插值前后航迹段对比示意图;
图5为本发明实施例中LSTM-CRF网络示意图;
图6为本发明实施例中BP神经网络预测实验结果和原始标签的可视化对比图;
图7为本发明实施例中BP神经网络和LSTM网络实验结果对比图;
图8为本发明实施例中LSTM-CRF网络算法流程图;
图9为本发明实施例中LSTM网络和LSTM-CRF网络预测实验标记结果对比图;
图10为本发明实施例中拖网渔船轨迹可视化图;
图11为本发明实施例中刺网渔船轨迹可视化图;
图12为本发明实施例中原始轨迹图像及扩充轨迹图像示意图;
图13为本发明实施例中VGG-16网络模型示意图;
图14为本发明实施例中C-CNN结构嵌入ResNet结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
如图1所示,本发明提供了一种基于AIS数据的渔船捕鱼行为分析方法,本发明的原始数据来源于五种不同作业类型的渔船,分别为拖网、刺网、围网、延绳钓和曳绳钓渔船,具体实施过程如下:
1、对原始数据进行异常处理,得到轨迹数据序列,方法如下:
1.1、对不同类型渔船在固定海域捕鱼作业情况的数据进行捕鱼状态标记,得到原始数据,原始数据关键信息如表1所示;
表1
Figure BDA0003683685950000061
1.2、对原始数据进行清洗和降噪处理,得到预处理数据,具体流程和规则如下:
规则一:舍弃原始数据中捕鱼标记为-1的数据行,极大压缩数据,为后续数据处理减少运行时间和运行内存;
规则二:删除原始数据中mmsi、timestamp、lat、lon、speed、is_fishing、source列中存在空值的数据行;
规则三:删除原始数据中timestamp列和mmsi列完全相同所对应的行,由于数据传输过程中的乱码丢包重传机制,可能存在一条数据存在多行,故而需要将此类点去重,只保留一行,防止后续试验过程中影响模型准确率;
规则四:删除原始数据中超出标准数据范围的值。
1.3、将得到的预处理数据进行轨迹提取和插值处理,得到轨迹数据序列,具体如下:
如图2所示,在原始数据中,通过渔船的船舶ID将不同渔船的轨迹数据分组,并对每一组中的记录按照时间戳来递增排序,得到历史轨迹数据。
将历史轨迹数据按照时间因素分割为不同的航次,计算前后轨迹点间的时间差,以时间差大于4000秒的轨迹点为切割点,将历史轨迹数据切割为不同的航迹段,删除长度小于50的航迹段。
计算历史轨迹数据中轨迹点的衍生特征,对于轨迹分割必不可少的是时间差,所以需要计算前后轨迹点的时间差ΔT:
ΔT=T1-T0
其中,T1表述后一个轨迹点的时间戳,T0表述前一个轨迹点的时间戳。
不同经纬度的实际地面距离不等,为了消除这一微小的影响,需要计算实际海面距离差d,Haversin公式采用了正弦函数,能做到高精度的地球海平面距离计算:
Figure BDA0003683685950000081
haver sin(θ)=sin2(θ/2)=(1-cos(θ))/2
Figure BDA0003683685950000082
通过时间差ΔT来切割航迹段,切割原则是ΔT需要满足捕鱼这一实际过程,即一条渔船两次完整的捕鱼过程中必然相隔一定长的时间,所以时间间隔大于一定值就可以认为是两次不同的捕鱼记录。
如图3所示,每条渔船的航迹段中连续轨迹点的时间间隔大都分布在600-800秒,将600-800秒设置为正常时间差。删除短时间间隔数据,设置5倍于800秒间隔的阈值,将4000秒以内的时间差也认为是同一次捕鱼的轨迹点,通过插值的方法将缺失数据补齐。
如图4所示,时间差在600-4000秒以内的数据,就认为是一条完整的航迹段,将此区间的数据做插值处理,本发明采用拉格朗日插值法来对航迹中的缺失值进行插值处理,使得前后轨迹点时间差处于600-800秒之间,得到一条记录均匀的轨迹数据序列。
2、根据得到的轨迹数据序列构建数据集,由于上述得到的轨迹数据序列的序列长度长短不一,最长的序列长度包含几百个轨迹点,最短的甚至只有10个轨迹点,因此需要先进行合理的筛选再构建数据集,具体方法如下:
2.1、设置序列长度的上限lmax=100和下限lmin=50;
2.2、若轨迹数据序列的序列长度低于下限lmin=50则直接舍弃;
2.3、若轨迹数据序列的序列长度超过上限lmax=100则采用迭代采样处理,得到序列长度为上限的采样数据序列:现有样本长度为n,数据集样本长度上限lmax,有n>lmax,则可以采样出(n-lmax)个样本。
2.4、对序列长度介于上限和下限之间的轨迹数据序列和采样数据序列,采用离差标准化进行归一化处理,得到数据集,归一化处理后的数据均处于[0~1]之间。
3、根据得到的数据集对渔船捕捞状态进行识别,具体方法如下:
3.1、将LSTM网络与CRF网络结合,得到LSTM-CRF网络模型:
由BP神经网络慢慢发展出来的深度神经网络中的循环神经网络(RNN)是一种处理时序数据的模型,RNN网络在解决序列问题上比BP神经网络表现出了更好的性能,但对于长序列出现的梯度消失和梯度爆炸无能为力,所以诞生了LSTM网络(长短期记忆模型LSTM),LSTM网络就是在RNN网络的基础上引入一个记忆细胞以解决序列数据的长期依赖性问题。
LSTM网络是依靠神经网络的强大非线性拟合能力和序列数据记忆能力,而CRF网络是通过全局范围内统计归一化的条件状态转移概率矩阵,再通过后续计算选取一条样本概率最大的序列标签,LSTM网络和CRF网络可以通过结合来补充各自的不足。
如图5所示,双向LSTM网络结合CRF网络构成了LSTM-CRF网络,LSTM-CRF网络对序列数据的正向信息和反向信息能全部考虑进去,计算出一个所有可能的标签序列,经过CRF层约束,输出最优标签序列。
3.2、根据得到的数据集,选取BP神经网络、LSTM网络和LSTM-CRF网络进行预测实验,根据预测实验的结果,分析可知准确性最高的网络模型为LSTM-CRF网络,具体过程如下:
(1)BP神经网络预测实验,具体如下:
本发明选取序列长度为80的序列数据进行BP神经网络预测实验,BP神经网络的隐藏层节点设置区间为[15-25],最终实验结果是由0和1构成的标注序列。
将数据集中序列长度为80的数据选择出来,按照8:1:1的比例来设置训练集、验证集、测试集,以数据量最大的拖网渔船数据集为例,针对不同激活函数和不同节点数做对比实验,得到最优隐藏层节点数为20,最优激活函数为Leaky ReLU激活函数。
如图6所示,图6中(a)图表示原始标签,(b)图表示BP神经网络预测实验结果,其中灰点为捕鱼,黑点为非捕鱼。可见,BP神经网络效果一般,甚至将连续直线型非捕鱼航迹段中的点也存在分类错误。
(2)LSTM网络预测实验,具体如下:
LSTM网络的训练过程就是将提取出的航迹序列中的特征项输入网络,通过计算输出标签项,对比从实际航迹序列中提取的标签项和计算出标签项之间的差异,通过误差反向传播和梯度下降更新权重。
LSTM网络的目标同BP神经网络相同,即根据轨迹序列中的每个轨迹点标记出该点的捕鱼行为,本发明构建的数据集可以全部直接参与LSTM网络模型的训练,采用pytorch集成库,pytorch集成库提供了LSTM网络针对变长序列的处理方法。
LSTM网络的输入层包含5个神经元,每个神经元则对应着每个轨迹点中选取的5个和捕鱼行为相关系数比较高的特征,输出层的神经元个数为2个,对应着序列标注的结果,LSTM网络预测实验序列中单点结果只有两种情况即0和1,选择Leaky-RELU函数作为激活函数,学习率设置为0.05,batch设置为128,最大训练迭代次数设置为100次,将五种不同作业类型渔船的数据集均采用8:1:1的比例划分训练集、验证集和测试集,训练集参与模型的训练计算,验证集在每次模型训练完后参与一次验证计算来观察实验效果,测试集则用来做最终的测试,不参与模型训练过程。对每种数据集做单向LSTM网络和双向LSTM网络对比实验,可知双向LSTM网络要优于单向LSTM网络。设置提前结束训练标记,在训练的同时记录最好的验证集结果,如果后面连续5次验证集结果均差于最优验证集结果,则提前结束训练,记录最优参数的网络。
LSTM网络隐藏层节点数目区间设置为[3-13],选取拖网渔船数据量的10%来代替整体数据集来做参数选取实验,得到LSTM网络预测实验的预测值和真实值的准确率和隐藏层节点个数之间的关系,选取拖网渔船数据集时,LSTM网络对应的最优隐藏层节点数为14。
如图7所示,图7中(c)图表示使用BP神经网络的预测实验标记结果,(d)图表示使用效果最好的双向LSTM网络预测实验标记结果,(d)图中包括框内的许多误差被纠正,同时新出现了其他误差,可以看出主要的误差在于临界值处,从整体上来说LSTM网络预测的结果更准确。
(3)LSTM-CRF网络预测实验,具体如下:
CRF网络的加入就是在LSTM网络计算出的标记序列中加入概率约束,判断哪种结果出现的概率最大,从而使得结果更加准确。
如图8所示,由底部向上构成了LSTM-CRF网络模型的数据特征,输入到LSTM-CRF网络模型计算输出结果,由左到右是从时间上的展开。图8中选取了其中一条轨迹数据来做分析,LSTM-CRF网络模型最底层就是数据特征的输入,数据集来自于本发明构建的数据集,其中每个轨迹点输入有5个特征,包括归一化后的速度、经度、纬度、前后记录时间差、海平面实际距离这5个和捕鱼相关性大的特征,将这5个特征作为模型的输入,数据进入LSTM网络,在这一层的神经元上进行计算判断输出,当单层或者双层神经网络计算完成后最终输出的是二维向量,其中的值代表二分类的每一类的概率,同时这个输出会作为CRF网络的输入,经过CRF网络的概率计算,最终确定一条概率最大的标签序列。
从图8中显示的原始标签和只经过LSTM网络计算出的预测结果的标签有些许误差,表现为航迹段末端的一个分类错误,其中原始标签中最后一位标记为0,而LSTM网络计算出的预测结果的标签中如图8中LSTM网络标签最后一位是1,只用LSTM模型的计算就到此结束,然而在此基础上在添加一层CRF网络,经过CRF网络计算后,最终成功的将最后一位标签纠正了,和原始标签结果一样。
LSTM-CRF网络中LSTM部分的链式结构上仍然需要确定隐藏层节点数,确定隐藏层节点大致范围为[3-13],采用小样本试凑法进行实验得出最佳的隐藏层节点数,输入层和输出层维度保持不变,选取五种作业类型渔船相应数据集的10%来进行实验,最终得出最佳节点数目。将五种不同作业类型渔船的全数据集按照8:1:1的比例划分训练集、验证集和测试集,采用和LSTM网络相同的实验参数,得到LSTM-CRF实验结果。
如图9所示,图9中(e)图表示使用LSTM网络的预测实验标记结果,(f)图表示是使用LSTM-CRF网络预测实验的标记结果,可以看到以前拐弯路段等识别出错的点,经过CRF层的约束后比较平滑的部分成功的纠正了,但对于转弯处还是存在细微误差。
综上可知,LSTM-CRF网络模型在序列标注上均优于其他两个模型,在对渔船捕捞状态的识别上采用LSTM-CRF网络。
4、根据得到的数据集对渔船作业类型进行识别,具体方法如下:
渔船作业类型可细分为10类左右,但是其中拖网、刺网类型的渔船占了渔船总量的大部分,本发明在对渔船作业类型识别实施过程中选取拖网和刺网两种类型,将拖网和刺网渔船的捕鱼轨迹生成图片。通常情况下,如图10所示,拖网渔船的航速和航向的变化比较稳定,如图11所示,刺网渔船捕鱼轨迹图存在小范围来回重复的特征,可见这两种类型渔船的轨迹图存在差别。本发明实施例通过将这两种类型渔船的轨迹图可视化,直观的看这两类渔船轨迹之间的差别,奠定了采用轨迹图像法进行渔船作业类型分类的可能性。本发明识别渔船作业类型具体实施过程如下:
4.1、根据构建的数据集构建图像数据集,具体过程如下:
根据渔船船舶ID将不同渔船的数据进行区分,将同一条渔船的不同航次数据进行区分,当捕鱼系数超过0.5则说明该轨迹存在大面积捕鱼行为,将所有渔船捕鱼系数大于等于0.5的信息生成轨迹图像。轨迹图像为每个航次经纬度的轨迹线图,每张图片的大小都统一为高×宽为200像素×200像素,简记为200×200。
如图12所示,针对每个原始轨迹图像(图12中(g)图),依次逆时针旋转90°(对应图12中(h)图)、逆时针旋转180°(对应图12中(i)图)、逆时针旋转270°(对应图12中(j)图)后形成三张扩充轨迹图像,对原始轨迹图像进行水平镜像处理(对应图12中(k)图)和垂直镜像处理(对应图12中(l)图)后得到两张扩充轨迹图像,通过这两个操作可以在一定程度上消除依赖于轨迹绝对位置的误差。由原始轨迹图像和扩充轨迹图像构成两种不同作业类型渔船的图像数据集,最终两种作业类型渔船共生成75632张图像,其中拖网渔船46131张,刺网渔船29501张。从数据量分布上来看拖网渔船种类偏多,但也不至于和刺网渔船差太多,所以在数据分布均衡上可进行二分类的研究。
4.2、根据构建的图像数据集,选取AlexNet网络、VGG-16网络和ResNet-34网络进行图像分类实验,将图像分类实验结果进行对比,得到准确率最高的最佳网络模型,具体过程如下:
(1)AlexNet网络图像分类实验,具体过程如下:
AlexNet网络采用多次卷积、池化、下采样的操作来做图像分类,基于本发明实施例所用图像数据为轨迹轮廓灰度图,所以在通道数的选择上会进行压缩以增加计算速度,得到本发明采用的最终AlexNet网络模型框架流程及参数如表2所示。
表2
Figure BDA0003683685950000151
AlexNet网络激活函数采用Relu激活函数,分类函数选用Softmax函数,损失函数选用经典分类交叉熵函数(Categorical CrossEntropy),利用pytorch集成开发库搭建一个深度卷积神经网络,将数据集按照8;1:1的结构划分为训练集、验证集、测试集。在训练期间设置提前结束标志,每一次训练完成后使用验证集来评估结果,同时更新最优的模型参数,若出现验证集误差持续反升,则停止训练,将最优的模型作为最终训练好的模型。本发明采用指数衰减的学习率来训练,以128个图像为一批次训练100轮,设置初始学习率为0.1,在20轮后学习率衰减为0.01,40轮后学习率衰减为0.001。AlexNet网络图像分类实验结果表明,Adam优化器最优测试集准确率达到了85%左右,训练轮数为64,训练总时间为5190.4sec。
(2)VGG-16网络图像分类实验,具体过程如下:
如图13所示,VGG-16网络包含5个卷积层和3个全连接层,前两个卷积层内部均有两次卷积操作,第三个卷积层到第五个卷积层内部均有三次卷积操作,卷积层选用3×3的卷积核,卷积步长均为1,padding均为1,最大池化层大部分采用2×2池子和2×2padding。图13中黑色框代表图像卷积激活复合操作,从中可清晰的看出有13个黑色框代表13次卷积操作,点虚线框代表最大池化操作,长虚线框代表全连接层和相应的激活操作,细虚线框代表输出层。
VGG-16网络图像分类实验采用与AlexNet网络图像分类实验相同的训练比大小、迭代最大次数和指数衰减形式的学习率,采用pytorch集成开发库搭建VGG-16网络。VGG-16网络图像分类实验结果表明,Adam优化器最优测试集准确率达到了90%左右,训练轮数为62,训练总时间为4219.8sec,可见VGG-16网络相比AlexNet网络,在图像分类实验上的准确率更高,训练总时间和训练轮数均有下降。
(3)ResNet-34网络图像分类实验,具体过程如下:
ResNet-34网络结构的配置如表3所示。
表3
Figure BDA0003683685950000171
采用pytorch集成开发库搭建ResNet-34网络,采用与AlexNet网络图像分类实验相同的训练比大小、迭代最大次数和指数衰减形式的学习率。ResNet-34网络图像分类实验结果表明,Adam优化器最优测试集准确率达到了92%左右,训练轮数为69,训练总时间为6639.7sec。可见ResNet-34网络相比VGG-16网络,在图像分类实验上的准确率更高,但训练总时间和训练轮数有所增加。
综上可知,AlexNet网络、VGG-16网络和ResNet-34网络三者中ResNet-34网络的Adam优化器最优测试集准确率最高。
4.3、如图14所示,将C-CNN结构嵌入ResNet-34网络中,即使用C-CNN结构替换ResNet-34网络结构中的卷积模块,其他网络参数不变,设置采样循环比为1/4、1/9和1/16,使用图像数据集分别做对比实验。
对比实验结果表明,采用采样循环比为1/9时的Adam优化器最优测试集准确率最高,达到了93.8%,因此最佳采样循环比为1/9。
将采样循环比为1/9时的C-CNN结构嵌入ResNet-34网络中,用于识别渔船作业类型。
以上所述的实施例仅是对本发明优选方式进行的描述,并非对本发明的范围进行限定,在不脱离本发明设计精神的前提下,本领域普通技术人员对本发明的技术方案做出的各种变形和改进,均应落入本发明权利要求书确定的保护范围内。

Claims (9)

1.一种基于AIS数据的渔船捕鱼行为分析方法,其特征在于,包括以下步骤:
S1、对原始数据进行异常处理,得到轨迹数据序列;
S2、基于所述轨迹数据序列构建数据集;
S3、基于所述数据集识别渔船捕捞状态;
S4、基于所述数据集识别渔船作业类型。
2.根据权利要求1所述的基于AIS数据的渔船捕鱼行为分析方法,其特征在于:
所述S1中所述原始数据为不同类型渔船在固定海域捕鱼作业情况的数据,并对捕鱼状态进行标记。
3.根据权利要求1所述的基于AIS数据的渔船捕鱼行为分析方法,其特征在于:
所述S1中对所述原始数据进行所述异常处理,包括以下步骤:
S1.1、对所述原始数据进行清洗和降噪处理,得到预处理数据;
S1.2、基于所述预处理数据进行轨迹提取和插值处理,得到所述轨迹数据序列。
4.根据权利要求3所述的基于AIS数据的渔船捕鱼行为分析方法,其特征在于:
所述S1.1中对所述原始数据进行所述清洗和所述降噪处理,得到所述预处理数据,包括以下步骤:
S1.1.1、舍弃所述原始数据中无效数据的数据行;
S1.1.2、删除所述原始数据中存在空值的所述数据行;
S1.1.3、删除所述原始数据中数据完全相同的所述数据行;
S1.1.4、删除所述原始数据中超出标准数据范围的数据值,得到所述预处理数据。
5.根据权利要求3所述的基于AIS数据的渔船捕鱼行为分析方法,其特征在于:
所述S1.2中基于所述预处理数据进行所述轨迹提取和所述插值处理,得到所述轨迹数据序列,包括以下步骤:
S1.2.1、将所述预处理数据进行分组,对每一组所述预处理数据按时间戳递增排序,得到历史轨迹数据;
S1.2.2、将所述历史轨迹数据进行切割,得到航迹段;
S1.2.3、计算所述历史轨迹数据中轨迹点的衍生特征,得到前后所述轨迹点的时间差;
S1.2.4、根据所述时间差切割所述航迹段,得到正常时间差;
S1.2.5、删除小于所述正常时间差对应的所述轨迹点的数据,并进行插值补齐,得到所述轨迹数据序列。
6.根据权利要求1所述的基于AIS数据的渔船捕鱼行为分析方法,其特征在于:
所述S2中构建所述数据集,包括以下步骤:
S2.1、设置序列长度的上限和下限;
S2.2、若所述轨迹数据序列的所述序列长度低于所述下限则直接舍弃;
S2.3、若所述轨迹数据序列的所述序列长度超过所述上限则进行迭代采样处理,得到所述序列长度为所述上限的采样数据序列;
S2.4、对所述序列长度介于所述上限和所述下限之间的所述轨迹数据序列和所述采样数据序列,采用离差标准化进行归一化处理,得到所述数据集。
7.根据权利要求1所述的基于AIS数据的渔船捕鱼行为分析方法,其特征在于:
所述S3中识别所述渔船捕捞状态,包括以下步骤:
S3.1、将LSTM网络与CRF网络结合,得到LSTM-CRF网络;
S3.2、根据所述数据集,选取常规序列标注检测网络和LSTM-CRF网络进行预测实验,对所述预测实验的结果进行分析,得到准确性最高的网络模型为所述的LSTM-CRF网络;
S3.3、通过所述LSTM-CRF网络对所述渔船捕捞状态进行识别。
8.根据权利要求1所述的基于AIS数据的渔船捕鱼行为分析方法,其特征在于:
所述S4中识别所述渔船作业类型,包括以下步骤:
S4.1、根据所述数据集构建图像数据集;
S4.2、根据所述图像数据集,选取常规图像分类处理网络进行图像分类实验,将所述图像分类实验结果进行对比,得到准确率最高的最佳网络模型;
S4.3、将C-CNN结构嵌入所述最佳网络模型,其他网络参数不变,设置采样循环比,基于所述图像数据集做对比实验,得到最佳采样循环比;
S4.4、通过嵌入所述最佳采样循环比时所述C-CNN结构的所述最佳网络模型对所述渔船作业类型进行识别。
9.根据权利要求8所述的基于AIS数据的渔船捕鱼行为分析方法,其特征在于:
所述S4.1中构建所述图像数据集,包括以下步骤:
S4.1.1、将所述数据集中的数据进行区分,得到区分数据,根据捕鱼系数将所述区分数据生成图像,得到原始轨迹图像;
S4.1.2、对所述的原始轨迹图像进行旋转和镜像变换,得到扩充轨迹图像;
S4.1.3、根据所述原始轨迹图像和所述扩充轨迹图像构建所述图像数据集。
CN202210640301.5A 2022-06-08 2022-06-08 一种基于ais数据的渔船捕鱼行为分析方法 Pending CN114942951A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210640301.5A CN114942951A (zh) 2022-06-08 2022-06-08 一种基于ais数据的渔船捕鱼行为分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210640301.5A CN114942951A (zh) 2022-06-08 2022-06-08 一种基于ais数据的渔船捕鱼行为分析方法

Publications (1)

Publication Number Publication Date
CN114942951A true CN114942951A (zh) 2022-08-26

Family

ID=82909332

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210640301.5A Pending CN114942951A (zh) 2022-06-08 2022-06-08 一种基于ais数据的渔船捕鱼行为分析方法

Country Status (1)

Country Link
CN (1) CN114942951A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115953746A (zh) * 2023-03-13 2023-04-11 中国铁塔股份有限公司 一种船只监测方法及装置
CN116738324A (zh) * 2023-08-11 2023-09-12 太极计算机股份有限公司 模型训练方法和渔船单拖作业行为的识别方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115953746A (zh) * 2023-03-13 2023-04-11 中国铁塔股份有限公司 一种船只监测方法及装置
CN116738324A (zh) * 2023-08-11 2023-09-12 太极计算机股份有限公司 模型训练方法和渔船单拖作业行为的识别方法
CN116738324B (zh) * 2023-08-11 2023-12-22 太极计算机股份有限公司 模型训练方法和渔船单拖作业行为的识别方法

Similar Documents

Publication Publication Date Title
CN109800736B (zh) 一种基于遥感影像和深度学习的道路提取方法
Stahl et al. Divide and count: Generic object counting by image divisions
CN114942951A (zh) 一种基于ais数据的渔船捕鱼行为分析方法
KR102328734B1 (ko) 이미지를 분석하기 위해, 딥러닝 네트워크에 이용하기 위한 트레이닝 이미지에 대한 라벨링 신뢰도를 자동으로 평가하기 위한 방법 및 이를 이용한 신뢰도 평가 장치
CN111476285B (zh) 一种图像分类模型的训练方法及图像分类方法、存储介质
CN104834748A (zh) 一种利用基于深度语义排序哈希编码的图像检索方法
CN111382686B (zh) 一种基于半监督生成对抗网络的车道线检测方法
CN105678284A (zh) 一种固定位人体行为分析方法
CN113111716A (zh) 一种基于深度学习的遥感影像半自动标注方法和装置
CN116844041A (zh) 一种基于双向卷积时间自注意力机制的耕地提取方法
CN112766308A (zh) 一种远洋船舶分类方法
Liseune et al. Leveraging latent representations for milk yield prediction and interpolation using deep learning
CN112464172A (zh) 生长参数主被动遥感反演方法及装置
CN114493680B (zh) 一种基于流刺网调查的渔业资源统计方法及系统
CN115410047A (zh) 基于改进YOLO v5s的红外图像电动自行车目标检测方法
CN111709442A (zh) 一种面向图像分类任务的多层字典学习方法
KR20200058278A (ko) 지리적 공간에 대한 시공간 데이터 분석 방법 및 장치
KR102264285B1 (ko) 수질 관리를 위한 조류 정량화 방법
CN117236016B (zh) 一种基于bim的水中生态系统构建方法和系统
KR20220057405A (ko) 수질 관리를 위한 조류 정량화 방법
CN117636183A (zh) 一种基于自监督预训练的小样本遥感图像分类方法
CN114896138B (zh) 一种基于复杂网络和图神经网络的软件缺陷预测方法
CN115758153A (zh) 一种目标对象航迹数据的处理方法、装置及设备
CN114998681A (zh) 一种基于亲和系数的网络训练方法
CN115331045A (zh) 基于神经网络自适应膨胀剪枝的视觉对象分类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination