CN113177523A - 一种基于改进AlexNet的鱼类行为图像识别方法 - Google Patents

一种基于改进AlexNet的鱼类行为图像识别方法 Download PDF

Info

Publication number
CN113177523A
CN113177523A CN202110582710.XA CN202110582710A CN113177523A CN 113177523 A CN113177523 A CN 113177523A CN 202110582710 A CN202110582710 A CN 202110582710A CN 113177523 A CN113177523 A CN 113177523A
Authority
CN
China
Prior art keywords
fish
image recognition
fish behavior
algorithm
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110582710.XA
Other languages
English (en)
Inventor
赵奎
贺保卫
崔海朋
韩兵兵
沈炜皓
赵巍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qingdao Jari Industry Control Technology Co ltd
Original Assignee
Qingdao Jari Industry Control Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qingdao Jari Industry Control Technology Co ltd filed Critical Qingdao Jari Industry Control Technology Co ltd
Priority to CN202110582710.XA priority Critical patent/CN113177523A/zh
Publication of CN113177523A publication Critical patent/CN113177523A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Evolutionary Biology (AREA)
  • Software Systems (AREA)
  • Psychiatry (AREA)
  • Social Psychology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Animal Behavior & Ethology (AREA)
  • Databases & Information Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于改进AlexNet的鱼类行为图像识别方法,包括以下步骤:S1.建立基于项的柔性注意力算法,用于算法主干部分的卷积功能及算法分支部分的多层感知器、解码器及采样层搭建;S2.构建鱼类行为图像识别样本库,利用改进的AlexNet模型,将基于项的柔性注意力模块置于全连接层与输出层之间;S3.采用模型迁移方法,将训练后的鱼类图像识别知识图谱移植到优化的AlexNet模型中,得出鱼类行为识别结果。其优点在于改进了传统型鱼类行为图像识别算法,在相同识别速度下,识别精度更高,收敛速度更快,同时避免了过收敛,具有实际的工程应用价值。

Description

一种基于改进AlexNet的鱼类行为图像识别方法
技术领域
本发明涉及一种海洋生物行为图像识别处理领域,具体涉及一种基于改进AlexNet的鱼类行为图像识别方法。
背景技术
如何实现智慧渔业养殖、促进我国海洋传统渔业模式转型是我国亟待解决的 问题,渔业发展的内外部环境正在发生深刻变化:资源与环境双重约束趋紧,渔 业资源日益衰竭,水域污染严重,濒危物种增多;渔业发展方式粗放,设施装备 落后,生产成本上升,效益持续下滑;水生生物疫病增多,质量安全存在隐患。 一些长期积累的生产生态矛盾尚未有效化解,渔业转方式调结构任务日益紧迫, 现代渔业建设到了新阶段,必须由注重产量增长转到更加注重质量效益,由注重 资源利用转到更加注重生态环境保护,由注重物质投入转到更加注重科技进步和 从业者素质提高。
在智慧渔业养殖的过程中,鱼类行为的识别与其疫病防控紧紧相关,通过鱼 类行为图像识别可初步预判鱼类疫病类型,紧急采取应对措施,对提升养殖效益、 降低风险具有重要意义。当前,鱼类疫病防控大多依赖水质数据监测、人工经验 判断等间接手段,时效性差,判断准确度不高。
发明内容
为了进一步研究解决上述问题,本发明提供了一种基于改进AlexNet的鱼类 行为图像识别方法,本发明基于传统AlexNet识别算法,通过对特征权重的重新 构造与切割,建立以齐次线性差分叠加函数为核心的期望值,并构造交叉嫡损失 函数三个重点环节,建立改进的AlexNet鱼类行为图像识别算法,该方法检测识 别速度快,精确度高,且收敛速度快,大幅度降低了误检率,保证了正确率。技 术方案为,
一种基于改进AlexNet的鱼类行为图像识别方法,包括以下步骤:
S1.建立基于项的柔性注意力算法,用于算法主干部分的卷积功能及算法分 支部分的多层感知器、解码器及采样层搭建;
S2.构建鱼类行为图像识别样本库,利用改进的AlexNet模型,将基于项的 柔性注意力模块置于全连接层与输出层之间;
S3.采用模型迁移方法,将训练后的鱼类图像识别知识图谱移植到优化的AlexNet模型中,得出鱼类行为识别结果。
进一步的,步骤S1中,建立基于项的柔性注意力算法的具体步骤包括,
S11.基于项的输入采用文本形式描述,表示为词语编码序列如下:
Y={Y1,Y2,…,YC},Yi∈RK (1)
其中,Y为每张图片的文本形式,C表述文本长度,K是词表大小,R图片 文本库;
S12.初始图像经过卷积神经网络处理后,将转换为每一项都具有单独编码的 序列,通过抽取图像特征值,在最后一个卷积层使其产生L个向量,每一个向 量是原图像中的一个区域的D维度表示,也可以看成一个序列:
α={α1,…,αL},αi=RD (2)
S13.分别对每个部分的特征赋予不同权重,每个向量αi的权重At,i为:
Figure BDA0003086608480000021
其中,t为时刻值,f为多层感知器,ht-1为解码器各时刻状态。
S14.对所有项进行线性加权合并,基于项的柔性注意力采用齐次线性差分叠 加函数以获取更为精确的期望值Zt
Figure BDA0003086608480000022
进一步的,构成改进的AlexNet模型,模型的输出为n维度,代表n种不同 行为的图像的鱼类训练集种类概率,概率数值总和为1,改进AlexNet模型使用 交叉嫡损失函数衡量预测值与实际结果之间的差异性信息。交叉嫡损失函数式如 下:
Figure BDA0003086608480000031
其中,H为训练损失;e为训练样本;P为类别概率;θ为参数权重;q为预 测概率,函数为:
Figure BDA0003086608480000032
其中,x为激励函数的输入;j表示被计算种类的序号。
进一步的,采用模型靶向迁移学习算法优化设计鱼类图像识别模型算法,输 出鱼类行为图像识别结果。
进一步的,采用赋值法将鱼类行为图像识别样本库转化成图片文本库。
有益效果
本发明提出的基于改进AlexNet的鱼类行为图像识别方法在传统AlexNet算 法基础上结合了鱼类识别技术,相较于传统鱼类行为识别方法更为直接有效,准 确率显著提升,同时具有良好的商业化应用前景。
附图说明
图1为本发明的一种基于改进AlexNet的鱼类行为图像识别方法流程图;
图2为本发明所述方法实施效果图;
图3为本发明改进的AlexNet模型卷积层设置图。
具体实施方式
下面结合附图1-3和具体实施例对技术作进一步说明,以助于理解本发明的 内容。
如图1所示,一种基于改进AlexNet的鱼类行为图像识别方法,包括以下步 骤:
S1.建立基于项的柔性注意力算法,用于算法主干部分的卷积功能及算法分 支部分的多层感知器、解码器及采样层搭建;
S2.构建鱼类行为图像识别样本库,采用赋值法将鱼类行为图像识别样本库 转化成图片文本库R,利用改进的AlexNet模型,将基于项的柔性注意力模块置 于全连接层与输出层之间,图3所示;
S3.采用模型迁移方法,将训练后的鱼类图像识别知识图谱移植到优化的AlexNet模型中,得出鱼类行为识别结果。
步骤S1中,建立基于项的柔性注意力算法的具体步骤包括,
S11.基于项的输入采用文本形式描述,表示为词语编码序列如下:
Y={Y1,Y2,…,YC},Yi∈RK (1)
其中,Y为每张图片的文本形式,C表述文本长度,K是词表大小,R图片 文本库;
S12.初始图像经过卷积神经网络处理后,将转换为每一项都具有单独编码的 序列,通过抽取图像特征值,在最后一个卷积层使其产生L个向量,本申请有3 个卷积层,如图3所示,每一个向量是原图像中的一个区域的D维度表示,也 可以看成一个序列:
α={α1,…,αL},αi=RD (2)
S13.分别对每个部分的特征赋予不同权重,每个向量αi的权重At,i为:
Figure BDA0003086608480000041
其中,t为时刻值,f为多层感知器,ht-1为解码器各时刻状态。
S14.对所有项进行线性加权合并,基于项的柔性注意力采用齐次线性差分叠 加函数以获取更为精确的期望值Zt
Figure BDA0003086608480000042
构成改进的AlexNet模型,模型的输出为n维度,代表n种不同行为的图像 鱼类训练集(如追逐、吃食、撕咬等的图像样本集)种类概率,概率数值总和为 1,改进AlexNet模型使用交叉嫡损失函数衡量预测值与实际结果之间的差异性 信息。交叉嫡损失函数式如下:
Figure BDA0003086608480000043
其中,H为训练损失;e为训练样本;P为类别概率;θ为参数权重;q为预 测概率,函数为:
Figure BDA0003086608480000044
其中,x为激励函数的输入;j表示被计算种类的序号。
采用模型靶向迁移学习算法优化AlexNet模型,输出鱼类行为图像识别结果。
如图2所示,将海底探测设备截取到的含有5条鱼的图像导入至本发明所述 算法机制中,结果准确出现5个自动识别图框,并将识别结果以“fish-编号”名 称显示在图框上方。随着鱼类的游动,图框随之移动。由于本算法的引入,导致 鱼类识别精度更高,画面中出现的鱼群均可进行识别,并自动标注。
当然,上述说明并非对本技术的限制,本技术也不仅限于上述举例,本技术 领域的普通技术人员在本发明的实质范围内所做出的变化、改型、添加或替换, 也属于本技术的保护范围。

Claims (5)

1.一种基于改进AlexNet的鱼类行为图像识别方法,其特征在于,包括以下步骤:
S1.建立基于项的柔性注意力算法,用于算法主干部分的卷积功能及算法分支部分的多层感知器、解码器及采样层搭建;
S2.构建鱼类行为图像识别样本库,利用改进的AlexNet模型,将基于项的柔性注意力模块置于全连接层与输出层之间;
S3.采用切割模型迁移方法,将训练后的鱼类图像识别知识图谱移植到改进的AlexNet模型中,得出鱼类行为识别结果。
2.根据权利要求1所述的一种基于改进AlexNet的鱼类行为图像识别方法,其特征在于,步骤S1中,建立基于项的柔性注意力算法的具体步骤包括,
S11.基于项的输入采用文本形式描述,表示为词语编码序列如下:
Y={Y1,Y2,…,YC},Yi∈RK (1)
其中,Y为每张图片的文本形式,C表述文本长度,K是词表大小,R是图片文本库;
S12.初始图像经过卷积神经网络处理后,将转换为每一项都具有单独编码的序列,通过抽取图像特征值,在最后一个卷积层使其产生L个向量,每一个向量是原图像中的一个区域的D维度表示,也可以看成一个序列:
α={α1,…,αL},αi=RD (2)
S13.分别对每个部分的特征赋予不同权重,每个向量αi的权重At,i为:
Figure FDA0003086608470000011
其中,t为时刻值,f为多层感知器,ht-1为解码器各时刻状态。
S14.对所有项进行线性加权合并,基于项的柔性注意力采用齐次线性差分叠加函数以获取更为精确的期望值Zt
Figure FDA0003086608470000012
3.根据权利要求1所述的一种基于改进AlexNet的鱼类行为图像识别方法,其特征在于,构成改进的AlexNet模型,模型的输出为n维度,代表n种鱼类训练集种类概率,概率数值总和为1,改进AlexNet模型使用交叉嫡损失函数衡量预测值与实际结果之间的差异性信息;交叉嫡损失函数式如下:
Figure FDA0003086608470000013
其中,H为训练损失;e为训练样本;P为类别概率;θ为参数权重;q为预测概率,函数为:
Figure FDA0003086608470000021
其中,x为激励函数的输入;j表示被计算种类的序号。
4.根据权利要求1所述的一种基于改进AlexNet的鱼类行为图像识别方法,其特征在于,采用模型靶向迁移学习算法优化AlexNet模型,输出鱼类行为图像识别结果。
5.根据权利要求2所述的一种基于改进AlexNet的鱼类行为图像识别方法,其特征在于,采用赋值法将鱼类行为图像识别样本库转化成图片文本库。
CN202110582710.XA 2021-05-27 2021-05-27 一种基于改进AlexNet的鱼类行为图像识别方法 Pending CN113177523A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110582710.XA CN113177523A (zh) 2021-05-27 2021-05-27 一种基于改进AlexNet的鱼类行为图像识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110582710.XA CN113177523A (zh) 2021-05-27 2021-05-27 一种基于改进AlexNet的鱼类行为图像识别方法

Publications (1)

Publication Number Publication Date
CN113177523A true CN113177523A (zh) 2021-07-27

Family

ID=76927101

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110582710.XA Pending CN113177523A (zh) 2021-05-27 2021-05-27 一种基于改进AlexNet的鱼类行为图像识别方法

Country Status (1)

Country Link
CN (1) CN113177523A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113822233A (zh) * 2021-11-22 2021-12-21 青岛杰瑞工控技术有限公司 一种深海养殖异常鱼类跟踪方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110334765A (zh) * 2019-07-05 2019-10-15 西安电子科技大学 基于注意力机制多尺度深度学习的遥感影像分类方法
CN111915526A (zh) * 2020-08-05 2020-11-10 湖北工业大学 一种基于亮度注意力机制低照度图像增强算法的摄影方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110334765A (zh) * 2019-07-05 2019-10-15 西安电子科技大学 基于注意力机制多尺度深度学习的遥感影像分类方法
CN111915526A (zh) * 2020-08-05 2020-11-10 湖北工业大学 一种基于亮度注意力机制低照度图像增强算法的摄影方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
薛永杰,巨志勇: "基于改进AlexNet的鱼类识别算法", 《电子科技》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113822233A (zh) * 2021-11-22 2021-12-21 青岛杰瑞工控技术有限公司 一种深海养殖异常鱼类跟踪方法及系统

Similar Documents

Publication Publication Date Title
CN112883861B (zh) 一种基于鱼群摄食状态细粒度分类的反馈式投饵控制方法
CN112434628B (zh) 基于主动学习和协同表示的小样本图像分类方法
CN116030257B (zh) 一种基于NesT模型的语义分割方法
CN112000770A (zh) 面向智能问答的基于语义特征图的句子对语义匹配方法
CN114496069A (zh) 一种基于Transformer架构的CIRSPRCas9系统脱靶预测方法
CN114676769A (zh) 一种基于视觉Transformer的小样本昆虫图像识别方法
CN113946685A (zh) 一种融合规则和深度学习的渔业标准知识图谱构建方法
CN113177523A (zh) 一种基于改进AlexNet的鱼类行为图像识别方法
CN114782776B (zh) 基于MoCo模型的多模块知识蒸馏方法
CN116030296A (zh) 用于图文数据协同的社交平台数据挖掘方法及其系统
CN114329031A (zh) 一种基于图神经网络和深度哈希的细粒度鸟类图像检索方法
CN116777668A (zh) 基于改进编解码模型的多能源负荷预测方法和系统
CN111950619B (zh) 一种基于双重生成对抗网络的主动学习方法
CN111523612B (zh) 一种深海鱼类图像分类识别方法
CN113536952A (zh) 一种基于动作捕捉的注意力网络的视频问答方法
CN115828758B (zh) 基于改进烟花算法优化网络的海水三维预测方法及系统
CN117876735A (zh) 一种基于残差卷积网络的水生生物类别电子标注方法
CN117194989A (zh) 一种提高大型语言模型适配多模态任务效率的方法
CN116737876A (zh) 辅助科普志愿服务的教育装置
CN116486391A (zh) 场景文本识别方法、系统、存储介质及计算设备
CN115936073A (zh) 一种语言导向卷积神经网络及视觉问答方法
CN114840679B (zh) 一种基于乐理知识图谱推理的机器人智能导学方法及应用
CN116301914A (zh) 基于gap8微处理器的卷积神经网络部署方法
CN114359886A (zh) 一种基于多层次特征选择的自然场景文本识别方法
CN115019068B (zh) 一种基于编解码架构的渐进式显著目标识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210727

RJ01 Rejection of invention patent application after publication