CN115565006A - 一种智能图像处理方法、电子设备及存储介质 - Google Patents

一种智能图像处理方法、电子设备及存储介质 Download PDF

Info

Publication number
CN115565006A
CN115565006A CN202211239038.5A CN202211239038A CN115565006A CN 115565006 A CN115565006 A CN 115565006A CN 202211239038 A CN202211239038 A CN 202211239038A CN 115565006 A CN115565006 A CN 115565006A
Authority
CN
China
Prior art keywords
image
features
tortoise
observation platform
processing method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211239038.5A
Other languages
English (en)
Other versions
CN115565006B (zh
Inventor
姜德迅
刘洁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin University
Original Assignee
Harbin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin University filed Critical Harbin University
Publication of CN115565006A publication Critical patent/CN115565006A/zh
Application granted granted Critical
Publication of CN115565006B publication Critical patent/CN115565006B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/7715Feature extraction, e.g. by transforming the feature space, e.g. multi-dimensional scaling [MDS]; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/80Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in fisheries management
    • Y02A40/81Aquaculture, e.g. of fish

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Image Analysis (AREA)

Abstract

本发明提出涉及一种智能图像处理方法、电子设备及存储介质,属于图像处理技术领域。包括S1.收集乌龟图像数据,建立数据库;S2.对图像数据进行特征提取,根据特征创建不同年龄和品种标签;S3.建立品种及年龄神经网络预测模型;S4.将乌龟图像数据输入品种及年龄神经网络预测模型中,输出乌龟品种及年龄。S5.验证特征提取的准确性。解决现有技术中存在乌龟品种及年龄识别难度大的技术问题,在此基础上验证特征提取的准确性,增加了训练数据的精度,从而提高了输出结果的准确性。

Description

一种智能图像处理方法、电子设备及存储介质
技术领域
本申请涉及一种图像处理方法,尤其涉及一种智能图像处理方法、电子设备及存储介质,属于图像处理技术领域。
背景技术
随着市场需求的发展,水产养殖行业不断扩大,尤其龟类养殖的行业被越来越多的人所关注,因此龟业是以市场供求为导向发展起来的产业,龟业尤其是龟类养殖业主要依托其收藏保值和投资增值价值的挖掘、发现和认可获得长足发展,而且主要发生在养殖生产环节,例如保有原种、选育良种以及引进外来品种,数以百计的龟类品种或是被驯化或是实现了本土化,人们通过学习、交流推广了人工孵化、温室培苗和室外仿生态或原生态养殖商品龟模式及技术,龟类是养在深闺人未识充满了神秘感。
乌龟被越来越多的人所关注,饲养乌龟不单单局限于养殖生产,更多的人饲养宠物乌龟,但是无论养殖人员还是饲养人员,对乌龟的了解少之甚少少,首先最基本的乌龟品类就难倒了众多饲养人员和养殖人员,因此,对乌龟品种的识别俨然成为了当务之急,为了更好的对乌龟进行科学饲养,知晓乌龟的年龄也是必不可少的事情。
发明内容
在下文中给出了关于本发明的简要概述,以便提供关于本发明的某些方面的基本理解。应当理解,这个概述并不是关于本发明的穷举性概述。它并不是意图确定本发明的关键或重要部分,也不是意图限定本发明的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。
鉴于此,为解决现有技术中存在乌龟品种及年龄识别难度大的技术问题,本发明提供一种智能图像处理方法、电子设备及存储介质以快速识别乌龟的年龄与品种。
方案一:一种智能图像处理方法,包括以下步骤:
S1.收集乌龟图像数据,建立数据库;
S2.对图像数据进行特征提取,根据特征创建不同年龄和品种标签;
S3.建立品种及年龄神经网络预测模型;
S4.将乌龟图像数据输入品种及年龄神经网络预测模型中,输出乌龟品种及年龄。
优选的,所述收集乌龟图像数据的方法是,在饲养池或乌龟长期生活地设置影像提取观测台,所述观测台上安装有用于采集乌龟生长过程的视频或图像获取设备,所述观测台为360°旋转观测台;对所述视频或图像获取设备获取的图像或视频后进行预处理;
优选的,所述对图像数据进行特征识别包括:乌龟头部或乌龟脚部或乌龟甲壳。
优选的,进行特征识别的方法是,利用YOLO模型进行特征提取,包括以下步骤:
S21.将不同品种的乌龟图像划分成S×S的网格,每个网格单独负责预测B个框,每个框包含框的位置
Figure BDA0003884295370000021
及置信度
Figure BDA0003884295370000022
信息,
Figure BDA0003884295370000023
Figure BDA0003884295370000024
表示对目标框中心坐标的预测,
Figure BDA0003884295370000025
Figure BDA0003884295370000026
表示对目标框宽和高的预测,置信度
Figure BDA0003884295370000027
表示对预测目标框与目标框IOU值C的预测;
S22.将不同品种的乌龟图像输入神经网络输出得到特征图F∈R(B×5+N)×s×s,其中S×S表示输出特征图的高和宽,B×5+N表示特征图的通道数;
S23.从特征图F中第i行第j列取出特征向量fij∈R(B=5+N)×1,将该特征向量fij前B×5个值与目标框计算MSE损失值,特征向量fij后N个值计算预测类别概率,将其与真实类别概率计算MSE损失值。
S24.将图像输入神经网络输出得到特征图F,将网络预测的置信度
Figure BDA0003884295370000028
与框的类别概率相乘得到最终的置信分数,通过设定阈值过滤置信分数低的检测结果,使用非极大值抑制算法处理其他区域特征,得到最终提取结果。
优选的,所述建立品种及年龄神经网络预测模型的方法,具体包括以下步骤:
S31.将带有不同年龄和品种标签的特征数据,按照百分制划分为训练集、测试集和验证集,由此创建品种及年龄神经网络预测模型;
S32.通过测试集得到乌龟品种及年龄预测值,根据验证集中的数据与预测值进行对比,通过验证集中所反馈的误差动态调整网络参数,降低含水率预测误差值,获得最优模型;
S33.将待预测乌龟图像输入至品种及年龄神经网络预测模型,输出预测结果。
优选的,所述观测台包括观测台支撑柱、旋转观测平台、监测设备支撑架,所述观测台支撑柱上安装有可沿观测台支撑柱上下伸缩的旋转观测平台;所述旋转观测平台上安装有可沿观测平台360°旋转的监测设备支撑架,所述安装设备支撑架安装有监测设备。
优选的,对所述视频或图像获取设备获取的图像或视频后进行预处理的方法是,采用直方图修正对图像进行增强,包括以下步骤:
S11.建立维度为256初始值为0的数组imist[256],以像素灰度值k为数组下标,将数组元素加1运算imist[k]++统计图像的灰度信息的灰度直方图;
S12.从原始的灰度直方图建立灰度累加分布的直方图数组,将直方图数组中下标为k的元素保存了灰度从O到k的像素总数;
S13.将累加分布的直方图中的每个元素除以图像的像素总数,得到均衡化的直方图;
S14.用均衡化的直方图作为查找表,扫描源图像,将源图像中的像素灰度为查找表数组下标,取出查找表中的元素作为灰度填回到源图像,完成图像的灰度均衡。
优选的,还包括以下步骤:
S5.验证特征提取的准确性,具体方法是:
S51.收集乌龟头部或乌龟脚部或乌龟甲壳图像数据;
S52.将图像分成p*p*c的小块,得到n个图像块n=(h*w)/(p*p),同时添加学习的类别块,则总共有(n+1)个块待处理,类别块将用于与所有的图像小块进行交互,最终从类别块中学习到用于分类的特征;
S53.对小块的图像进行flatten操作,将每个图像块(p*p*c)转换成1*(p*p*c)大小的一维向量,再将n个一维向量拼接起来,组成n*(p*p*c)的二维向量,对二维向量使用全连接层进行降维得到n*d的二维特征a;
S54.将输入特征a(n*d)加入位置编码,位置编码用于标示每一个图像块的相对位置;
S55.将预处理特征送入transformer encoder中得到交互特征f,将输入特征a(n*d),划分为m个头,得到m个不同的特征(a1,a2...am),将不同特征执行注意力计算得到家园特征,再将其拼接得到z(n*d),通过非线性变化w,得到与输入特征同尺寸的交互特征f(n*d);
S56.从交互特征f(n*d)中只抽取代表类别块的一维特征(1*d),用作后续的分类,通过MLP进行降维操作,将d降维为待分类的类别数(1*class_num),完成特征识别;S67.将S66识别结果与S2中识别特征进行对比,如果相同说明特征提取准确,从而验证预测结果准确。
方案二:一种电子设备,包括存储器和处理器,存储器存储有计算机程序,所述的处理器执行所述计算机程序时实现方案一所述的一种智能图像处理方法的步骤。
方案三:一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现方案一所述的一种智能图像处理方法。
本发明的有益效果如下:本发明通过对提取乌龟的特征,并对这些特征创建品种和年龄标签,利用神经网络预测模型训练数据,输出识别结果,解决现有技术中存在乌龟品种及年龄识别难度大的技术问题,在此基础上验证特征提取的准确性,增加了训练数据的精度,从而提高了输出结果的准确性。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1一种智能图像处理方法流程示意图;
图2另一种智能图像处理方法流程示意图;
图3验证特征提取方法示意图;
图4预处理特征m头划分示意图。
具体实施方式
为了使本申请实施例中的技术方案及优点更加清楚明白,以下结合附图对本申请的示例性实施例进行进一步详细的说明,显然,所描述的实施例仅是本申请的一部分实施例,而不是所有实施例的穷举。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
实施例1、参照图1-图4说明本实施方式,一种智能图像处理方法,包括以下步骤:
S1.收集乌龟图像数据,建立数据库,所述收集乌龟图像数据的方法是,在饲养池或乌龟长期生活地设置影像提取观测台,所述观测台上安装有用于采集乌龟生长过程的视频或图像获取设备,所述观测台为360°旋转观测台;对所述视频或图像获取设备获取的图像或视频后进行预处理;
所述观测台包括观测台支撑柱、旋转观测平台、监测设备支撑架,所述观测台支撑柱上安装有可沿观测台支撑柱上下伸缩的旋转观测平台;所述旋转观测平台上安装有可沿观测平台360°旋转的监测设备支撑架,所述安装设备支撑架安装有监测设备。
对所述视频或图像获取设备获取的图像或视频后进行预处理的方法是,采用直方图修正对图像进行增强,包括以下步骤:
S11.建立维度为256初始值为0的数组imist[256],以像素灰度值k为数组下标,将数组元素加1运算imist[k]++统计图像的灰度信息的灰度直方图;
S12.从原始的灰度直方图建立灰度累加分布的直方图数组,将直方图数组中下标为k的元素保存了灰度从O到k的像素总数;
S13.将累加分布的直方图中的每个元素除以图像的像素总数,得到均衡化的直方图;
S14.用均衡化的直方图作为查找表,扫描源图像,将源图像中的像素灰度为查找表数组下标,取出查找表中的元素作为灰度填回到源图像,完成图像的灰度均衡。
具体的,采用中值滤波对图像进行降噪处理;
具体的,采用巴特沃斯低通滤波器对图像进行滤波处理;
S2.对图像数据进行特征提取,根据特征创建不同年龄和品种标签;
具体的,图像数据进行特征识别包括:乌龟头部或乌龟脚部或乌龟甲壳;
具体的,若不需要识别乌龟的品种,可通过识别乌龟腹斑上的圆形纹路或甲壳上的圈或龟背甲盾片上的同心环纹的特征识别乌龟的年龄。
通过识别乌龟的乌龟头部、乌龟脚部、乌龟甲壳、识别乌龟腹斑上的圆形纹路、甲壳上的圈或龟背甲盾片上的同心环纹可以增加特征提取的准确性,增加了训练数据的精度,从而提高了输出结果的准确性。
具体的,进行特征识别的方法是,利用YOLO模型进行特征提取,包括以下步骤:
S21.将不同品种的乌龟图像划分成S×S的网格,每个网格单独负责预测B个框,每个框包含框的位置
Figure BDA0003884295370000051
及置信度
Figure BDA0003884295370000052
信息,
Figure BDA0003884295370000053
Figure BDA0003884295370000054
表示对目标框中心坐标的预测,
Figure BDA0003884295370000055
Figure BDA0003884295370000056
表示对目标框宽和高的预测,置信度
Figure BDA0003884295370000057
表示对预测目标框与目标框IOU值C的预测;
S22.将不同品种的乌龟图像输入神经网络输出得到特征图F∈R(B×5+N)×s×s,其中SΔS表示输出特征图的高和宽,B×5+N表示特征图的通道数;
S23.从特征图F中第i行第j列取出特征向量fij∈R(B×5+N)×1,将该特征向量fij前B×5个值与目标框计算MSE损失值,特征向量fij后N个值计算预测类别概率,将其与真实类别概率计算MSE损失值。
S24.将图像输入神经网络输出得到特征图F,将网络预测的置信度
Figure BDA0003884295370000058
与框的类别概率相乘得到最终的置信分数,通过设定阈值过滤置信分数低的检测结果,使用非极大值抑制算法处理其他区域特征,得到最终提取结果。
利用YOLO模型进行特征提取的速度快、准确度、高泛化能力强。
S3.建立品种及年龄神经网络预测模型;
具体的,所述建立品种及年龄神经网络预测模型的方法,具体包括以下步骤:
S31.将带有不同年龄和品种标签的特征数据,按照百分制划分为训练集、测试集和验证集,由此创建品种及年龄神经网络预测模型;
S32.通过测试集得到乌龟品种及年龄预测值,根据验证集中的数据与预测值进行对比,通过验证集中所反馈的误差动态调整网络参数,降低含水率预测误差值,获得最优模型;
S33.将待预测乌龟图像输入至品种及年龄神经网络预测模型,输出预测结果。
S4.将乌龟图像数据输入品种及年龄神经网络预测模型中,输出乌龟品种及年龄。
参照图3说明S5.验证特征提取的准确性,具体方法是:
S51.收集乌龟头部或乌龟脚部或乌龟甲壳图像数据;
S52.输入一张尺寸为w*h*c的图像,将图像分成p*p*c的小块,得到n个图像块n=(h*w)/(p*p),同时添加学习的类别块,则总共有(n+1)个块待处理,类别块将用于与所有的图像小块进行交互,最终从类别块中学习到用于分类的特征;
S53.对小块的图像进行flatten操作,将每个图像块(p*p*c)转换成1*(p*p*c)大小的一维向量,再将n个一维向量拼接起来,组成n*(p*p*c)的二维向量,对二维向量使用全连接层进行降维得到n*d的二维特征a;其中,d由人工设定,可设定为1024,2048。
S54.将输入特征a(n*d)加入位置编码,位置编码用于标示每一个图像块的相对位置;
S55.将预处理特征送入transformer encoder中得到交互特征f,将输入特征a(n*d),划分为m个头(参照图4),得到m个不同的特征(a1,a2...am),将不同特征执行注意力计算得到家园特征,再将其拼接得到z(n*d),通过非线性变化w,得到与输入特征同尺寸的交互特征f(n*d);例如有12个头,则对于某一个输入特征a(n*d),就会划分出12个不同的特征(a1,a2...a12),尺寸为n*(d/12),然后在这12个特征中执行自注意力计算,得到12个加权特征(b1,...,b12)。
自注意力计算:
qi,1=wq,1qi
qi,2=wq,2qi
S56.从交互特征f(n*d)中只抽取代表类别块的一维特征(1*d),用作后续的分类,通过MLP进行降维操作,将d降维为待分类的类别数(1*class_num),完成特征识别;S67.将S66识别结果与S2中识别特征进行对比,如果相同说明特征提取准确,从而验证预测结果准确。
实施例2、本实施例提供了一种创建不同年龄和品种标签向量的方法,包括以下步骤:
S25、对图像进行分割,并将分割后的图像以一个N×M矩阵的形式表述;
S26、将上述N×M矩阵所表述的图像数据放进一个向量化引擎中,使得图片的特征点以低维度的向量方式表达,该低维度向量表达为:
U=[U1、U2…UK]
具体方法是,包括以下步骤:
S261、加载所有图片的特征矩阵,并合并这些特征矩阵形成一个矩阵E;
S262、在特征值空间随机生成10000个中心特征值,所述的10000个中心特征值组成中心特征点向量A=[A1、A2、A3…A10000];
S263、取出E的每一行Fi=E[i],找到Fi最邻近的中心特征值Aj;
其中,i是矩阵E的行数,j是Aj在A=[A1、A2、A3…A10000]中序数;
S264、更新A=[A1、A2、A3…A10000]里的每一个Aj,使得Aj是最邻近Fi的几何中心点;
S265、重复步骤C和D,直到每一个Aj的位置变化都小于一个预定的阈值,保存中心特征点向量A=[A1、A2、A3…A10000];
S266、对于一个新图片的特征矩阵E′的每一行的Fi′=E′[i],找到A=[A1、A2、A3…A10000]里面与之最邻近的中心点;
S267、计算A=[A1、A2、A3…A10000]在E′的直方图,得到向量U=[U1、U2…UK],并输出向量U=[U1、U2…UK],结束;
S7、将S6获得的低维度的图片的特征点向量进行数据增强,得到增强后的低维度图片特征点向量C=[C1、C2…CK];
其中数据增强的方式包括:首先调整割后的图像的亮度、对比度和饱和度,然后对图像进行均值滤波,方框滤波,高斯滤波,中值滤波,双边滤波,随机将图片转动一定角度,随机将图片进行垂直或水平翻转;
步骤S8、利用S7进行数据增强处理后的低维度图片特征点向量C=[C1、C2…CK]进行分解,分解形成核向量数据,具体算法如下:
λ=θC×W
Figure BDA0003884295370000071
θ为数据增强处理后的低维度图片特征点向量平衡因子,W为图像分割后的图像模块矩阵,I1表示模块的数量,I2表示每个模块中特征点的数量,R为矩阵集合;
步骤S9、利用S8获得的核向量数据创建乌龟不同年龄和品种标签向量,具体算法为:
Figure BDA0003884295370000072
λ为核向量数据,U为低维度向量集合,N为样本数量。
一种创建不同年龄和品种标签向量方法可以代替一种创建不同年龄和品种标签方法,一种智能图像处理方法,包括以下步骤:
S1.收集乌龟图像数据,建立数据库;
S2.创建不同年龄和品种标签向量;
S3.建立品种及年龄神经网络预测模型;
S4.将乌龟图像数据输入品种及年龄神经网络预测模型中,输出乌龟品种及年龄。
该方法降低了标签匹配的时间,具有识别速度快,识别结果更精准的效果。
缩略语和关键术语定义:
imist:函数;
transformer encoder:transformer模型编码器。
实施例3、本发明的计算机装置可以是包括有处理器以及存储器等装置,例如包含中央处理器的单片机等。并且,处理器用于执行存储器中存储的计算机程序时实现上述的基于CREO软件的可修改由关系驱动的推荐数据的推荐方法的步骤。
所称处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
实施例4、计算机可读存储介质实施例
本发明的计算机可读存储介质可以是被计算机装置的处理器所读取的任何形式的存储介质,包括但不限于非易失性存储器、易失性存储器、铁电存储器等,计算机可读存储介质上存储有计算机程序,当计算机装置的处理器读取并执行存储器中所存储的计算机程序时,可以实现上述的基于CREO软件的可修改由关系驱动的建模数据的建模方法的步骤。
所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
尽管根据有限数量的实施例描述了本发明,但是受益于上面的描述,本技术领域内的技术人员明白,在由此描述的本发明的范围内,可以设想其它实施例。此外,应当注意,本说明书中使用的语言主要是为了可读性和教导的目的而选择的,而不是为了解释或者限定本发明的主题而选择的。因此,在不偏离所附权利要求书的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。对于本发明的范围,对本发明所做的公开是说明性的,而非限制性的,本发明的范围由所附权利要求书限定。

Claims (10)

1.一种智能图像处理方法,其特征在于,包括以下步骤:
S1.收集乌龟图像数据,建立数据库;
S2.对图像数据进行特征提取,根据特征创建不同年龄和品种标签;
S3.建立品种及年龄神经网络预测模型;
S4.将乌龟图像数据输入品种及年龄神经网络预测模型中,输出乌龟品种及年龄。
2.根据权利要求1所述的一种智能图像处理方法,其特征在于,所述收集乌龟图像数据的方法是,在饲养池或乌龟长期生活地设置影像提取观测台,所述观测台上安装有用于采集乌龟生长过程的视频或图像获取设备,所述观测台为360°旋转观测台;对所述视频或图像获取设备获取的图像或视频后进行预处理;
3.根据权利要求2所述的一种智能图像处理方法,其特征在于,所述对图像数据进行特征识别包括:乌龟头部或乌龟脚部或乌龟甲壳。
4.根据权利要求5所述的一种智能图像处理方法,其特征在于,进行特征识别的方法是,利用YOLO模型进行特征提取,包括以下步骤:
S21.将不同品种的乌龟图像划分成S×S的网格,每个网格单独负责预测B个框,每个框包含框的位置
Figure FDA0003884295360000011
及置信度
Figure FDA0003884295360000012
信息,
Figure FDA0003884295360000013
Figure FDA0003884295360000014
表示对目标框中心坐标的预测,
Figure FDA0003884295360000015
Figure FDA0003884295360000016
表示对目标框宽和高的预测,置信度
Figure FDA0003884295360000017
表示对预测目标框与目标框IOU值C的预测;
S22.将不同品种的乌龟图像输入神经网络输出得到特征图F∈R(B×5+N)×s×s,其中S×S表示输出特征图的高和宽,B×5+N表示特征图的通道数;
S23.从特征图F中第i行第j列取出特征向量fij∈R(B×5+N)×1,将该特征向量fij前B×5个值与目标框计算MSE损失值,特征向量fij后N个值计算预测类别概率,将其与真实类别概率计算MSE损失值。
S24.将图像输入神经网络输出得到特征图F,将网络预测的置信度
Figure FDA0003884295360000018
与框的类别概率相乘得到最终的置信分数,通过设定阈值过滤置信分数低的检测结果,使用非极大值抑制算法处理其他区域特征,得到最终提取结果。
5.根据权利要求4所述的一种智能图像处理方法,其特征在于,所述建立品种及年龄神经网络预测模型的方法,具体包括以下步骤:
S31.将带有不同年龄和品种标签的特征数据,按照百分制划分为训练集、测试集和验证集,由此创建品种及年龄神经网络预测模型;
S32.通过测试集得到乌龟品种及年龄预测值,根据验证集中的数据与预测值进行对比,通过验证集中所反馈的误差动态调整网络参数,降低含水率预测误差值,获得最优模型;
S33.将待预测乌龟图像输入至品种及年龄神经网络预测模型,输出预测结果。
6.根据权利要求5所述的一种智能图像处理方法,其特征在于,所述观测台包括观测台支撑柱、旋转观测平台、监测设备支撑架,所述观测台支撑柱上安装有可沿观测台支撑柱上下伸缩的旋转观测平台;所述旋转观测平台上安装有可沿观测平台360°旋转的监测设备支撑架,所述安装设备支撑架安装有监测设备。
7.根据权利要求6所述的一种智能图像处理方法,其特征在于,对所述视频或图像获取设备获取的图像或视频后进行预处理的方法是,采用直方图修正对图像进行增强,包括以下步骤:
S11.建立维度为256初始值为0的数组imist[256],以像素灰度值k为数组下标,将数组元素加1运算imist[k]++统计图像的灰度信息的灰度直方图;
S12.从原始的灰度直方图建立灰度累加分布的直方图数组,将直方图数组中下标为k的元素保存了灰度从O到k的像素总数;
S13.将累加分布的直方图中的每个元素除以图像的像素总数,得到均衡化的直方图;
S14.用均衡化的直方图作为查找表,扫描源图像,将源图像中的像素灰度为查找表数组下标,取出查找表中的元素作为灰度填回到源图像,完成图像的灰度均衡。
8.根据权利要求7所述的一种智能图像处理方法,其特征在于,还包括以下步骤:
S5.验证特征提取的准确性,具体方法是:
S51.收集乌龟头部或乌龟脚部或乌龟甲壳图像数据;
S52.将图像分成p*p*c的小块,得到n个图像块n=(h*w)/(p*p),同时添加学习的类别块,则总共有(n+1)个块待处理,类别块将用于与所有的图像小块进行交互,最终从类别块中学习到用于分类的特征;
S53.对小块的图像进行flatten操作,将每个图像块(p*p*c)转换成1*(p*p*c)大小的一维向量,再将n个一维向量拼接起来,组成n*(p*p*c)的二维向量,对二维向量使用全连接层进行降维得到n*d的二维特征a;
S54.将输入特征a(n*d)加入位置编码,位置编码用于标示每一个图像块的相对位置;
S55.将预处理特征送入transformer encoder中得到交互特征f,将输入特征a(n*d),划分为m个头,得到m个不同的特征(a1,a2...am),将不同特征执行注意力计算得到家园特征,再将其拼接得到z(n*d),通过非线性变化w,得到与输入特征同尺寸的交互特征f(n*d);
S56.从交互特征f(n*d)中只抽取代表类别块的一维特征(1*d),用作后续的分类,通过MLP进行降维操作,将d降维为待分类的类别数(1*class_num),完成特征识别;
S57.将S66识别结果与S2中识别特征进行对比,如果相同说明特征提取准确,从而验证预测结果准确。
9.一种电子设备,其特征在于,包括存储器和处理器,存储器存储有计算机程序,所述的处理器执行所述计算机程序时实现权利要求1-7任一项所述的一种智能图像处理方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-7任一项所述的一种智能图像处理方法。
CN202211239038.5A 2022-06-28 2022-10-11 一种智能图像处理方法、电子设备及存储介质 Active CN115565006B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202210777958 2022-06-28
CN2022107779586 2022-06-28

Publications (2)

Publication Number Publication Date
CN115565006A true CN115565006A (zh) 2023-01-03
CN115565006B CN115565006B (zh) 2023-08-11

Family

ID=84745243

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211239038.5A Active CN115565006B (zh) 2022-06-28 2022-10-11 一种智能图像处理方法、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN115565006B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109886295A (zh) * 2019-01-11 2019-06-14 平安科技(深圳)有限公司 一种基于神经网络的蝴蝶识别方法及相关设备
CN112529020A (zh) * 2020-12-24 2021-03-19 携程旅游信息技术(上海)有限公司 基于神经网络的动物识别方法、系统、设备及存储介质
CN113239877A (zh) * 2021-06-01 2021-08-10 平安科技(深圳)有限公司 基于计算机视觉的农田监测方法及其相关设备
CN113657290A (zh) * 2021-08-19 2021-11-16 江苏省血吸虫病防治研究所 一种螺类采集与细分类识别系统
CN113837086A (zh) * 2021-09-24 2021-12-24 南通大学 一种基于深度卷积神经网络的水库钓鱼人检测方法
CN113869138A (zh) * 2021-09-06 2021-12-31 深延科技(北京)有限公司 多尺度目标检测方法、装置及计算机可读存储介质
CN114140680A (zh) * 2021-12-02 2022-03-04 罗普特科技集团股份有限公司 一种基于深度学习的海面目标检测与识别方法及系统
CN114332994A (zh) * 2021-12-20 2022-04-12 深圳数联天下智能科技有限公司 训练年龄预测模型的方法、年龄检测方法及相关装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109886295A (zh) * 2019-01-11 2019-06-14 平安科技(深圳)有限公司 一种基于神经网络的蝴蝶识别方法及相关设备
CN112529020A (zh) * 2020-12-24 2021-03-19 携程旅游信息技术(上海)有限公司 基于神经网络的动物识别方法、系统、设备及存储介质
CN113239877A (zh) * 2021-06-01 2021-08-10 平安科技(深圳)有限公司 基于计算机视觉的农田监测方法及其相关设备
CN113657290A (zh) * 2021-08-19 2021-11-16 江苏省血吸虫病防治研究所 一种螺类采集与细分类识别系统
CN113869138A (zh) * 2021-09-06 2021-12-31 深延科技(北京)有限公司 多尺度目标检测方法、装置及计算机可读存储介质
CN113837086A (zh) * 2021-09-24 2021-12-24 南通大学 一种基于深度卷积神经网络的水库钓鱼人检测方法
CN114140680A (zh) * 2021-12-02 2022-03-04 罗普特科技集团股份有限公司 一种基于深度学习的海面目标检测与识别方法及系统
CN114332994A (zh) * 2021-12-20 2022-04-12 深圳数联天下智能科技有限公司 训练年龄预测模型的方法、年龄检测方法及相关装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ALEXEY DOSOVITSKIY等: "AN IMAGE IS WORTH 16X16 WORDS:TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE", 《ARXIV:2010.11929V2》, pages 1 - 22 *

Also Published As

Publication number Publication date
CN115565006B (zh) 2023-08-11

Similar Documents

Publication Publication Date Title
CN113160192B (zh) 复杂背景下基于视觉的压雪车外观缺陷检测方法及装置
CN110991533B (zh) 图像识别方法、识别装置、终端设备及可读存储介质
CN111340141A (zh) 一种基于深度学习的作物幼苗与杂草检测方法及系统
CN110083723A (zh) 一种小熊猫个体识别方法、设备及计算机可读存储介质
CN108073947B (zh) 一种识别蓝莓品种的方法
CN111553438A (zh) 一种基于卷积神经网络的图像识别方法
US11880981B2 (en) Method and system for leaf age estimation based on morphological features extracted from segmented leaves
CN111931700A (zh) 一种基于多分类器的玉米品种真伪鉴别方法和鉴别系统
CN116416626B (zh) 圆形印章数据的获取方法、装置、设备及存储介质
CN115512232A (zh) 一种农作物种子发芽情况识别模型、构建方法及其应用
CN115731282A (zh) 基于深度学习的水下鱼类重量估计方法、系统及电子设备
CN117789037A (zh) 作物生长期预测方法及装置
CN115565006B (zh) 一种智能图像处理方法、电子设备及存储介质
CN107992863B (zh) 多分辨率粮虫种类视觉识别方法
CN115761356A (zh) 图像识别方法、装置、电子设备和存储介质
CN116071653A (zh) 基于自然图像的树木多级枝干结构自动提取方法
CN115879817A (zh) 一种区域减碳量评估方法、装置、电子设备及存储介质
CN115205833A (zh) 一种少样本棉花生长状态分类方法及装置
CN114387308A (zh) 一种机器视觉特征跟踪系统
CN106557772A (zh) 用于提取局部特征子的方法、装置及图像处理方法
CN113222887A (zh) 基于深度学习的纳米铁标记神经干细胞示踪的方法
CN116645661B (zh) 一种防重码检测方法及系统
CN117911409B (zh) 一种基于机器视觉的手机屏坏线缺陷诊断方法
CN113808055B (zh) 基于混合膨胀卷积的植物识别方法、装置及存储介质
CN117557988A (zh) 一种资产铭牌字符自动识别方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant