CN113177523A - 一种基于改进AlexNet的鱼类行为图像识别方法 - Google Patents
一种基于改进AlexNet的鱼类行为图像识别方法 Download PDFInfo
- Publication number
- CN113177523A CN113177523A CN202110582710.XA CN202110582710A CN113177523A CN 113177523 A CN113177523 A CN 113177523A CN 202110582710 A CN202110582710 A CN 202110582710A CN 113177523 A CN113177523 A CN 113177523A
- Authority
- CN
- China
- Prior art keywords
- fish
- image recognition
- fish behavior
- algorithm
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 29
- 241000251468 Actinopterygii Species 0.000 claims abstract description 47
- 238000013508 migration Methods 0.000 claims abstract description 7
- 230000005012 migration Effects 0.000 claims abstract description 7
- 238000005070 sampling Methods 0.000 claims abstract description 4
- 230000006399 behavior Effects 0.000 claims description 32
- 230000006870 function Effects 0.000 claims description 20
- 238000012549 training Methods 0.000 claims description 9
- 239000013598 vector Substances 0.000 claims description 9
- 108091026890 Coding region Proteins 0.000 claims description 3
- 238000013527 convolutional neural network Methods 0.000 claims description 3
- 230000005284 excitation Effects 0.000 claims description 3
- 230000008901 benefit Effects 0.000 abstract description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 230000006806 disease prevention Effects 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 238000007792 addition Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/20—Movements or behaviour, e.g. gesture recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Biophysics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Evolutionary Biology (AREA)
- Software Systems (AREA)
- Psychiatry (AREA)
- Social Psychology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Animal Behavior & Ethology (AREA)
- Databases & Information Systems (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于改进AlexNet的鱼类行为图像识别方法,包括以下步骤:S1.建立基于项的柔性注意力算法,用于算法主干部分的卷积功能及算法分支部分的多层感知器、解码器及采样层搭建;S2.构建鱼类行为图像识别样本库,利用改进的AlexNet模型,将基于项的柔性注意力模块置于全连接层与输出层之间;S3.采用模型迁移方法,将训练后的鱼类图像识别知识图谱移植到优化的AlexNet模型中,得出鱼类行为识别结果。其优点在于改进了传统型鱼类行为图像识别算法,在相同识别速度下,识别精度更高,收敛速度更快,同时避免了过收敛,具有实际的工程应用价值。
Description
技术领域
本发明涉及一种海洋生物行为图像识别处理领域,具体涉及一种基于改进AlexNet的鱼类行为图像识别方法。
背景技术
如何实现智慧渔业养殖、促进我国海洋传统渔业模式转型是我国亟待解决的 问题,渔业发展的内外部环境正在发生深刻变化:资源与环境双重约束趋紧,渔 业资源日益衰竭,水域污染严重,濒危物种增多;渔业发展方式粗放,设施装备 落后,生产成本上升,效益持续下滑;水生生物疫病增多,质量安全存在隐患。 一些长期积累的生产生态矛盾尚未有效化解,渔业转方式调结构任务日益紧迫, 现代渔业建设到了新阶段,必须由注重产量增长转到更加注重质量效益,由注重 资源利用转到更加注重生态环境保护,由注重物质投入转到更加注重科技进步和 从业者素质提高。
在智慧渔业养殖的过程中,鱼类行为的识别与其疫病防控紧紧相关,通过鱼 类行为图像识别可初步预判鱼类疫病类型,紧急采取应对措施,对提升养殖效益、 降低风险具有重要意义。当前,鱼类疫病防控大多依赖水质数据监测、人工经验 判断等间接手段,时效性差,判断准确度不高。
发明内容
为了进一步研究解决上述问题,本发明提供了一种基于改进AlexNet的鱼类 行为图像识别方法,本发明基于传统AlexNet识别算法,通过对特征权重的重新 构造与切割,建立以齐次线性差分叠加函数为核心的期望值,并构造交叉嫡损失 函数三个重点环节,建立改进的AlexNet鱼类行为图像识别算法,该方法检测识 别速度快,精确度高,且收敛速度快,大幅度降低了误检率,保证了正确率。技 术方案为,
一种基于改进AlexNet的鱼类行为图像识别方法,包括以下步骤:
S1.建立基于项的柔性注意力算法,用于算法主干部分的卷积功能及算法分 支部分的多层感知器、解码器及采样层搭建;
S2.构建鱼类行为图像识别样本库,利用改进的AlexNet模型,将基于项的 柔性注意力模块置于全连接层与输出层之间;
S3.采用模型迁移方法,将训练后的鱼类图像识别知识图谱移植到优化的AlexNet模型中,得出鱼类行为识别结果。
进一步的,步骤S1中,建立基于项的柔性注意力算法的具体步骤包括,
S11.基于项的输入采用文本形式描述,表示为词语编码序列如下:
Y={Y1,Y2,…,YC},Yi∈RK (1)
其中,Y为每张图片的文本形式,C表述文本长度,K是词表大小,R图片 文本库;
S12.初始图像经过卷积神经网络处理后,将转换为每一项都具有单独编码的 序列,通过抽取图像特征值,在最后一个卷积层使其产生L个向量,每一个向 量是原图像中的一个区域的D维度表示,也可以看成一个序列:
α={α1,…,αL},αi=RD (2)
S13.分别对每个部分的特征赋予不同权重,每个向量αi的权重At,i为:
其中,t为时刻值,f为多层感知器,ht-1为解码器各时刻状态。
S14.对所有项进行线性加权合并,基于项的柔性注意力采用齐次线性差分叠 加函数以获取更为精确的期望值Zt:
进一步的,构成改进的AlexNet模型,模型的输出为n维度,代表n种不同 行为的图像的鱼类训练集种类概率,概率数值总和为1,改进AlexNet模型使用 交叉嫡损失函数衡量预测值与实际结果之间的差异性信息。交叉嫡损失函数式如 下:
其中,H为训练损失;e为训练样本;P为类别概率;θ为参数权重;q为预 测概率,函数为:
其中,x为激励函数的输入;j表示被计算种类的序号。
进一步的,采用模型靶向迁移学习算法优化设计鱼类图像识别模型算法,输 出鱼类行为图像识别结果。
进一步的,采用赋值法将鱼类行为图像识别样本库转化成图片文本库。
有益效果
本发明提出的基于改进AlexNet的鱼类行为图像识别方法在传统AlexNet算 法基础上结合了鱼类识别技术,相较于传统鱼类行为识别方法更为直接有效,准 确率显著提升,同时具有良好的商业化应用前景。
附图说明
图1为本发明的一种基于改进AlexNet的鱼类行为图像识别方法流程图;
图2为本发明所述方法实施效果图;
图3为本发明改进的AlexNet模型卷积层设置图。
具体实施方式
下面结合附图1-3和具体实施例对技术作进一步说明,以助于理解本发明的 内容。
如图1所示,一种基于改进AlexNet的鱼类行为图像识别方法,包括以下步 骤:
S1.建立基于项的柔性注意力算法,用于算法主干部分的卷积功能及算法分 支部分的多层感知器、解码器及采样层搭建;
S2.构建鱼类行为图像识别样本库,采用赋值法将鱼类行为图像识别样本库 转化成图片文本库R,利用改进的AlexNet模型,将基于项的柔性注意力模块置 于全连接层与输出层之间,图3所示;
S3.采用模型迁移方法,将训练后的鱼类图像识别知识图谱移植到优化的AlexNet模型中,得出鱼类行为识别结果。
步骤S1中,建立基于项的柔性注意力算法的具体步骤包括,
S11.基于项的输入采用文本形式描述,表示为词语编码序列如下:
Y={Y1,Y2,…,YC},Yi∈RK (1)
其中,Y为每张图片的文本形式,C表述文本长度,K是词表大小,R图片 文本库;
S12.初始图像经过卷积神经网络处理后,将转换为每一项都具有单独编码的 序列,通过抽取图像特征值,在最后一个卷积层使其产生L个向量,本申请有3 个卷积层,如图3所示,每一个向量是原图像中的一个区域的D维度表示,也 可以看成一个序列:
α={α1,…,αL},αi=RD (2)
S13.分别对每个部分的特征赋予不同权重,每个向量αi的权重At,i为:
其中,t为时刻值,f为多层感知器,ht-1为解码器各时刻状态。
S14.对所有项进行线性加权合并,基于项的柔性注意力采用齐次线性差分叠 加函数以获取更为精确的期望值Zt:
构成改进的AlexNet模型,模型的输出为n维度,代表n种不同行为的图像 鱼类训练集(如追逐、吃食、撕咬等的图像样本集)种类概率,概率数值总和为 1,改进AlexNet模型使用交叉嫡损失函数衡量预测值与实际结果之间的差异性 信息。交叉嫡损失函数式如下:
其中,H为训练损失;e为训练样本;P为类别概率;θ为参数权重;q为预 测概率,函数为:
其中,x为激励函数的输入;j表示被计算种类的序号。
采用模型靶向迁移学习算法优化AlexNet模型,输出鱼类行为图像识别结果。
如图2所示,将海底探测设备截取到的含有5条鱼的图像导入至本发明所述 算法机制中,结果准确出现5个自动识别图框,并将识别结果以“fish-编号”名 称显示在图框上方。随着鱼类的游动,图框随之移动。由于本算法的引入,导致 鱼类识别精度更高,画面中出现的鱼群均可进行识别,并自动标注。
当然,上述说明并非对本技术的限制,本技术也不仅限于上述举例,本技术 领域的普通技术人员在本发明的实质范围内所做出的变化、改型、添加或替换, 也属于本技术的保护范围。
Claims (5)
1.一种基于改进AlexNet的鱼类行为图像识别方法,其特征在于,包括以下步骤:
S1.建立基于项的柔性注意力算法,用于算法主干部分的卷积功能及算法分支部分的多层感知器、解码器及采样层搭建;
S2.构建鱼类行为图像识别样本库,利用改进的AlexNet模型,将基于项的柔性注意力模块置于全连接层与输出层之间;
S3.采用切割模型迁移方法,将训练后的鱼类图像识别知识图谱移植到改进的AlexNet模型中,得出鱼类行为识别结果。
2.根据权利要求1所述的一种基于改进AlexNet的鱼类行为图像识别方法,其特征在于,步骤S1中,建立基于项的柔性注意力算法的具体步骤包括,
S11.基于项的输入采用文本形式描述,表示为词语编码序列如下:
Y={Y1,Y2,…,YC},Yi∈RK (1)
其中,Y为每张图片的文本形式,C表述文本长度,K是词表大小,R是图片文本库;
S12.初始图像经过卷积神经网络处理后,将转换为每一项都具有单独编码的序列,通过抽取图像特征值,在最后一个卷积层使其产生L个向量,每一个向量是原图像中的一个区域的D维度表示,也可以看成一个序列:
α={α1,…,αL},αi=RD (2)
S13.分别对每个部分的特征赋予不同权重,每个向量αi的权重At,i为:
其中,t为时刻值,f为多层感知器,ht-1为解码器各时刻状态。
S14.对所有项进行线性加权合并,基于项的柔性注意力采用齐次线性差分叠加函数以获取更为精确的期望值Zt:
4.根据权利要求1所述的一种基于改进AlexNet的鱼类行为图像识别方法,其特征在于,采用模型靶向迁移学习算法优化AlexNet模型,输出鱼类行为图像识别结果。
5.根据权利要求2所述的一种基于改进AlexNet的鱼类行为图像识别方法,其特征在于,采用赋值法将鱼类行为图像识别样本库转化成图片文本库。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110582710.XA CN113177523A (zh) | 2021-05-27 | 2021-05-27 | 一种基于改进AlexNet的鱼类行为图像识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110582710.XA CN113177523A (zh) | 2021-05-27 | 2021-05-27 | 一种基于改进AlexNet的鱼类行为图像识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113177523A true CN113177523A (zh) | 2021-07-27 |
Family
ID=76927101
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110582710.XA Pending CN113177523A (zh) | 2021-05-27 | 2021-05-27 | 一种基于改进AlexNet的鱼类行为图像识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113177523A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113822233A (zh) * | 2021-11-22 | 2021-12-21 | 青岛杰瑞工控技术有限公司 | 一种深海养殖异常鱼类跟踪方法及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110334765A (zh) * | 2019-07-05 | 2019-10-15 | 西安电子科技大学 | 基于注意力机制多尺度深度学习的遥感影像分类方法 |
CN111915526A (zh) * | 2020-08-05 | 2020-11-10 | 湖北工业大学 | 一种基于亮度注意力机制低照度图像增强算法的摄影方法 |
-
2021
- 2021-05-27 CN CN202110582710.XA patent/CN113177523A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110334765A (zh) * | 2019-07-05 | 2019-10-15 | 西安电子科技大学 | 基于注意力机制多尺度深度学习的遥感影像分类方法 |
CN111915526A (zh) * | 2020-08-05 | 2020-11-10 | 湖北工业大学 | 一种基于亮度注意力机制低照度图像增强算法的摄影方法 |
Non-Patent Citations (1)
Title |
---|
薛永杰,巨志勇: "基于改进AlexNet的鱼类识别算法", 《电子科技》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113822233A (zh) * | 2021-11-22 | 2021-12-21 | 青岛杰瑞工控技术有限公司 | 一种深海养殖异常鱼类跟踪方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112883861B (zh) | 一种基于鱼群摄食状态细粒度分类的反馈式投饵控制方法 | |
CN112434628B (zh) | 基于主动学习和协同表示的小样本图像分类方法 | |
CN116030257B (zh) | 一种基于NesT模型的语义分割方法 | |
CN112000770A (zh) | 面向智能问答的基于语义特征图的句子对语义匹配方法 | |
CN114496069A (zh) | 一种基于Transformer架构的CIRSPRCas9系统脱靶预测方法 | |
CN114676769A (zh) | 一种基于视觉Transformer的小样本昆虫图像识别方法 | |
CN113946685A (zh) | 一种融合规则和深度学习的渔业标准知识图谱构建方法 | |
CN113177523A (zh) | 一种基于改进AlexNet的鱼类行为图像识别方法 | |
CN114782776B (zh) | 基于MoCo模型的多模块知识蒸馏方法 | |
CN116030296A (zh) | 用于图文数据协同的社交平台数据挖掘方法及其系统 | |
CN114329031A (zh) | 一种基于图神经网络和深度哈希的细粒度鸟类图像检索方法 | |
CN116777668A (zh) | 基于改进编解码模型的多能源负荷预测方法和系统 | |
CN111950619B (zh) | 一种基于双重生成对抗网络的主动学习方法 | |
CN111523612B (zh) | 一种深海鱼类图像分类识别方法 | |
CN113536952A (zh) | 一种基于动作捕捉的注意力网络的视频问答方法 | |
CN115828758B (zh) | 基于改进烟花算法优化网络的海水三维预测方法及系统 | |
CN117876735A (zh) | 一种基于残差卷积网络的水生生物类别电子标注方法 | |
CN117194989A (zh) | 一种提高大型语言模型适配多模态任务效率的方法 | |
CN116737876A (zh) | 辅助科普志愿服务的教育装置 | |
CN116486391A (zh) | 场景文本识别方法、系统、存储介质及计算设备 | |
CN115936073A (zh) | 一种语言导向卷积神经网络及视觉问答方法 | |
CN114840679B (zh) | 一种基于乐理知识图谱推理的机器人智能导学方法及应用 | |
CN116301914A (zh) | 基于gap8微处理器的卷积神经网络部署方法 | |
CN114359886A (zh) | 一种基于多层次特征选择的自然场景文本识别方法 | |
CN115019068B (zh) | 一种基于编解码架构的渐进式显著目标识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210727 |
|
RJ01 | Rejection of invention patent application after publication |