CN116129463A - 面向端到端神经网络的动物检测方法、装置、设备及介质 - Google Patents

面向端到端神经网络的动物检测方法、装置、设备及介质 Download PDF

Info

Publication number
CN116129463A
CN116129463A CN202211437262.5A CN202211437262A CN116129463A CN 116129463 A CN116129463 A CN 116129463A CN 202211437262 A CN202211437262 A CN 202211437262A CN 116129463 A CN116129463 A CN 116129463A
Authority
CN
China
Prior art keywords
image
animal
information
characteristic
detected
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211437262.5A
Other languages
English (en)
Inventor
龙海丽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Cstarvision Technology Ltd
Original Assignee
Shenzhen Cstarvision Technology Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Cstarvision Technology Ltd filed Critical Shenzhen Cstarvision Technology Ltd
Priority to CN202211437262.5A priority Critical patent/CN116129463A/zh
Publication of CN116129463A publication Critical patent/CN116129463A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/70Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in livestock or poultry

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Human Computer Interaction (AREA)
  • Image Processing (AREA)

Abstract

本发明公开一种面向端到端神经网络的动物检测方法,包括:将待检测动物图像进行灰度直方图的转换后进行均衡化处理,得到标准动物图像,对标准动物图像进行图像增强,得到增强动物图像,将增强动物图像进行数据压缩,得到数据压缩图像,进行位置编码,得到编码图像,将编码图像传输至互联网系统中,一将编码图像进行还原后进行分割,得到分割图像,并对分割图像进行特征提取,得到特征图像;当特征图像不存在模糊信息,识别特征图像对应的动物信息,当特征图像存在模糊信息,对模糊信息进行信息复原,得到复原信息,根据特征图像中的清晰信息结合复原信息识别特征图像对应的动物信息。本发明可以提高动图图像识别的效率。

Description

面向端到端神经网络的动物检测方法、装置、设备及介质
技术领域
本发明涉及数据图像处理领域,尤其涉及一种面向端到端神经网络的动物检测方法、装置、设备及介质。
背景技术
动物检测是计算机视觉领域中的一个重要的研究课题,通常使用训练后的图像识别模型,对待识别图像进行识别,得到识别结果。随着图像识别模型的识别准确度的不断提升,图像识别模型的结构变得越来越复杂,图像识别模型在训练和使用时占用的时间和硬件资源越来越多。
目前,动物检测主要在终端设备上实处理,然而面对终端系统有限的运算能力、存储空间以及对运算实时性的高要求,使得直接在其难以运行大规模神经网络模型效率变得很低,从而使得动物检测的效率较低。
发明内容
为了解决上述技术问题,本发明提供了一种面向端到端神经网络的动物检测方法,能够提高动物检测的效率。
第一方面,本发明提供了一种面向端到端神经网络的动物检测方法,包括:
采集待检测动物图像,将所述待检测动物图像进行灰度直方图的转换,得到转换动物图像,对所述转换动物图像进行均衡化处理,得到标准动物图像,并利用预设的空间滤波技术对所述标准动物图像进行图像增强,得到增强动物图像;
将所述增强动物图像进行数据压缩,得到数据压缩图像,并对所述数据压缩图像进行位置编码,得到编码图像,将所述编码图像传输至预构建的互联网系统中;
利用所述预构建的互联网系统中的图像还原技术将所述编码图像进行还原,得到还原图像,将所述还原图像进行分割,得到分割图像,并对所述分割图像进行特征提取,得到特征图像;
判断所述特征图像是否存在模糊信息;
当所述特征图像不存在模糊信息,利用训练好的动物识别模型识别所述特征图像对应的动物信息;
当所述特征图像存在模糊信息,对所述模糊特征信息进行信息复原,得到复原特征信息,并根据所述特征图像中的清晰信息结合所述复原特征信息识别所述特征图像对应的动物信息。
在第一方面的一种可能实现方式中,所述将所述待检测动物图像进行灰度直方图的转换,得到转换动物图像包括:
将所述待检测动物图像进行降维,得到降维图像;
根据所述降维图像计算所述待检测动物图像灰度像素值的累计数值,得到灰度像素数值,并根据所述灰度像素数值,构建所述待检测动物图像灰度直方图,得到转换动物图像。
在第一方面的一种可能实现方式中,所述对所述转换动物图像进行均衡化处理,得到标准动物图像,包括:
利用下述公式计算所述待检测动物图像的直方图分布概率:
Figure BDA0003947398920000021
其中,s(rk)表示所述直方图概率累计值,rk表示所述人脸图像的第k个灰度级,mk表示第k个灰度级的像素个数,m表示所述人脸图像中的所有像素个数;
根据所述直方图分布概率,利用下述公式计算所述待检测动物图像的直方图概率累计值:
Figure BDA0003947398920000022
其中,h(yi)表示直方图概率累计值,s(rk)表示直方图分布概率,s(yi)表示在s级灰度值中第i个像素的个数;
根据所述直方图概率累计值,利用下述公式确定所述待检测动物图像的均衡化映射关系值:
ss(rk)=int{[max(pix)-min(pix)]*h(yi)+e}
其中,ss(rk)表示均衡化映射关系值,max(pix)表示待检测动物图像中最大的灰度级,min(pix)表示待检测动物图像中最小的灰度级,h(yi)表示直方图概率累计值,e表示无限不循环小数;
根据所述均衡化映射关系值,对所述待检测动物图像进行均衡化处理,得到标准动物图像。
在第一方面的一种可能实现方式中,所述对所述数据压缩图像进行位置编码,得到编码图像,包括:
利用下述公式对所述数据压缩图像进行位置编码:
Figure BDA0003947398920000031
Figure BDA0003947398920000032
其中,P(pos,2j)表示数据压缩图像中偶数字符位置,P(pos,2j+1)表示数据压缩图像中奇数字符位置,pos表示数据压缩图像中字符的位置序列,j表示数据压缩图像的第j个维度,dmodel表示位置编码函数。
在第一方面的一种可能实现方式中,所述对所述分割图像进行特征提取,得到特征图像,包括:
构建所述分割图像的直角坐标系,根据所述直角坐标系,划分所述分割图像的图像特征点,并提取所述分割图像对应的图像特征点;
根据所述图像特征点,生成所述分割图像的特征图像。
在第一方面的一种可能实现方式中,所述判断所述特征图像是否存在模糊信息包括:
计算所述特征图像的图像平均灰度值;
当所述图像平均灰度值大于预设灰度值时,则所述特征图像不存在模糊信息;
当所述图像平均灰度值不大于所述预设灰度值时,则所述特征图像存在模糊信息。
在第一方面的一种可能实现方式中,所述对所述模糊特征信息进行信息复原,得到复原特征信息包括:
利用下述公式计算所述模糊特征信息的退化线性信息:
F(x,y)=l(x,y)*f(x,y)+μ(x,y)
其中,F(x,y)表示退化线性信息,l(x,y)表示退化函数,f(x,y)表示模糊特征信息,μ(x,y)表示加性噪声,*表示卷积运算
根据所述退化线性信息,利用下述公式计算所述模糊特征信息的复原特征信息:
Figure BDA0003947398920000041
其中,
Figure BDA0003947398920000042
表示复原特征信息,sx,y表示以(x,y)为中心的尺寸为x×y的矩形窗口,F(x,y)表示退化线性信息,m,n表示sx,y矩形窗口中的坐标(m,n)点。
第二方面,本发明提供了一种面向端到端神经网络的动物检测装置,所述装置包括:
图像增强模块,用于采集待检测动物图像,将所述待检测动物图像进行灰度直方图的转换,得到转换动物图像,对所述转换动物图像进行均衡化处理,得到标准动物图像,并利用预设的空间滤波技术对所述标准动物图像进行图像增强,得到增强动物图像;
图像传输模块,用于将所述增强动物图像进行数据压缩,得到数据压缩图像,并对所述数据压缩图像进行位置编码,得到编码图像,将所述编码图像传输至预构建的互联网系统中;
特征提取模块,用于利用所述预构建的互联网系统中的图像还原技术将所述编码图像进行还原,得到还原图像,将所述还原图像进行分割,得到分割图像,并对所述分割图像进行特征提取,得到特征图像;
信息判断模块,用于判断所述特征图像是否存在模糊信息;
图像识别模块,用于当所述特征图像不存在模糊信息,利用训练好的动物识别模型识别所述特征图像对应的动物信息;
信息还原模块,用于当所述特征图像存在模糊信息,对所述模糊特征信息进行信息复原,得到复原特征信息,并根据所述特征图像中的清晰信息结合所述复原特征信息识别所述特征图像对应的动物信息。
第三方面,本发明提供一种电子设备,包括:
至少一个处理器;以及与所述至少一个处理器通信连接的存储器;
其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,以使所述至少一个处理器能够执行如上述第一方面中任意一项所述的面向端到端神经网络的动物检测方法。
第四方面,本发明提供一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现如上述第一方面中任意一项所述的面向端到端神经网络的动物检测方法。
与现有技术相比,本方案的技术原理及有益效果在于:
本方案首先通过所述采集待检测动物图像,将所述待检测动物图像进行灰度直方图的转换可以确定所述待检测动物图像的边界便于图像中物体与背景的分割,并对所述转换动物图像进行均衡化处理可以增大图像的对比度,使得图像更加的清晰,并利用预设的空间滤波技术对所述标准动物图像进行图像增强可以使所述待检测动物图像的图像特征更加明显,以便于后续的分析;其次,本发明实施例通过将所述增强动物图像进行数据压缩可以减少所述增强动物图像的存储空间,便于图像的传输提升数据处理的效率;通过所述对所述数据压缩图像进行位置编码可以保证压缩数据的顺序性为后续的图像还原做个基础保障,进一步地,本发明实施例通通过所述判断所述特征图像是否存在模糊信息以便于后续对所述特征图像的识别或对所述模糊信息进行修复提升所述特征图像的识别率,及对所述模糊特征信息进行信息复原可以将所述特征图像进行图像复原以提高所述特征图像清晰度,以便于对所述特征图像的识别更加准确。因此,本发明实施例提出的一种面向端到端神经网络的动物检测方法可以提高动物检测的效率。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一实施例提供的一种面向端到端神经网络的动物检测方法的流程示意图;
图2为本发明一实施例提供的一种面向端到端神经网络的动物检测装置的模块示意图;
图3为本发明一实施例提供的实现面向端到端神经网络的动物检测方法的电子设备的内部结构示意图。
具体实施方式
应当理解,此处所描述的具体实施方式仅仅用以解释本发明,并不用于限定本发明。
本发明实施例提供一种面向端到端神经网络的动物检测方法,所述面向端到端神经网络的动物检测方法的执行主体包括但不限于服务端、终端等能够被配置为执行本发明实施例提供的该方法的电子设备中的至少一种。换言之,所述面向端到端神经网络的动物检测方法可以由安装在终端设备或服务端设备的软件或硬件来执行,所述软件可以是区块链平台。所述服务端包括但不限于:单台服务器、服务器集群、云端服务器或云端服务器集群等。所述服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(ContentDelivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
参阅图1所示,是本发明一实施例提供的面向端到端神经网络的动物检测方法的流程示意图。其中,图1中描述的面向端到端神经网络的动物检测方法包括以下步骤S1-S6:
S1、采集待检测动物图像,将所述待检测动物图像进行灰度直方图的转换,得到转换动物图像,对所述转换动物图像进行均衡化处理,得到标准动物图像,并利用预设的空间滤波技术对所述标准动物图像进行图像增强,得到增强动物图像。
本发明实施例通过所述采集待检测动物图像,将所述待检测动物图像进行灰度直方图的转换可以确定所述待检测动物图像的边界便于图像中物体与背景的分割,其中,所述灰度直方图是指用以描述图像中每种灰度级像素的个数,反映图像中每种灰度出现的频率。
作为本发明的一个可选实施例,所述采集待检测动物图像通过智能摄像采集设备采集。
进一步的,作为本发明的一个实施例,所述将所述待检测动物图像进行灰度直方图的转换包括:
将所述待检测动物图像进行降维,得到降维图像,根据所述降维图像计算所述待检测动物图像灰度像素值的累计数值,得到灰度像素数值,并根据所述灰度像素数值构建灰度直方图。
其中,所述降维图像是指一个由若干同类型变量组成的集合,所述灰度像素值是指图像中的亮度或色阶,像素值越高图像越清晰,
可选的,所述将所述待检测动物图像进行降维通过Ravel()函数降维,所述计算所述待检测动物图像灰度像素值的累计数值通过c语言生成的脚本计算,所述根据所述灰度像素数值构建灰度直方图通过c++语言生成直方图构建函数构建。
进一步的,本发明实施例通过所述对所述转换动物图像进行均衡化处理可以增大图像的对比度,使得图像更加的清晰,其中,所述直方图均衡化是指将图像中像素个数多的灰度值进行展宽,将像素值个数少的灰度值进归并。
作为本发明的一个实施例,所述对所述转换动物图像进行均衡化处理包括:
计算所述待检测动物图像的直方图分布概率,根据所述直方图分布概率计算所述待检测动物图像的直方图概率累计值,根据所述直方图概率累计值,确定所述待检测动物图像的均衡化映射关系值,根据所述均衡化映射关系值,对所述待检测动物图像进行均衡化处理,得到标准动物图像。
作为本发明一可选实施例,通过下述公式计算所述待检测动物图像的直方图分布概率:
Figure BDA0003947398920000071
其中,s(rk)表示所述直方图概率累计值,rk表示所述人脸图像的第k个灰度级,mk表示第k个灰度级的像素个数,m表示所述人脸图像中的所有像素个数。
进一步的,作为本发明的一可选实施例所述根据所述直方图分布概率计算所述待检测动物图像的直方图概率累计值包括:
利用下述公式计算所述待检测动物图像的直方图概率累计值:
Figure BDA0003947398920000081
其中,h(yi)表示直方图概率累计值,s(rk)表示直方图分布概率,s(yi)表示在s级灰度值中第i个像素的个数。
作为本发明的一可选实施例,所述根据所述直方图概率累计值,确定所述待检测动物图像的均衡化映射关系值包括:
利用下述公式计算所述待检测动物图像的均衡化映射关系值:
ss(rk)=int{[max(pix)-min(pix)]*h(yi)+e}
其中,ss(rk)表示均衡化映射关系值,max(pix)表示待检测动物图像中最大的灰度级,min(pix)表示待检测动物图像中最小的灰度级,h(yi)表示直方图概率累计值,e表示无限不循环小数。
可选的,所述根据所述均衡化映射关系值,对所述待检测动物图像进行均衡化处理通过c语言生成的OpenCV语法处理。
进一步的,本发明实施例通过所述利用预设的空间滤波技术对所述标准动物图像进行图像增强可以使所述待检测动物图像的图像特征更加明显,以便于后续的分析。
其中,所述空间滤波技术是指一种采用滤波处理的影像增强技术。
作为本发明的一个实施例,所述利用预设的空间滤波技术对所述标准动物图像进行图像增强包括:
利用下述公式对所述标准动物图像进行图像增强:
Figure BDA0003947398920000082
其中k表示增强图像,kw表示空间滤波函数长度,kh表示空间滤波函数的宽度,w(x,y)表示kw的权重,h(x,y)表示kh的权重。
S2、将所述增强动物图像进行数据压缩,得到数据压缩图像,并对所述数据压缩图像进行位置编码,得到编码图像,将所述编码图像传输至预构建的互联网系统中。
本发明实施例通过所述将所述增强动物图像进行数据压缩可以减少所述增强动物图像的存储空间,便于图像的传输提升数据处理的效率。
其中,所述数据压缩是指按照一定算法对数据组进行重组,减少数据冗余的一种技术方法。
作为本发明的一个可选实施例,所述将所述增强动物图像进行数据压缩通过霍夫曼编码技术实现,需要说明的是,所述霍夫曼编码技术是目前较为成熟的技术,因此这里不多做赘述。
进一步的,本发明实施通过所述对所述数据压缩图像进行位置编码可以保证压缩数据的顺序性为后续的图像还原做个基础保障。
作为本发明的一个实施例,所述对所述数据压缩图像进行位置编码包括:
利用下述公式对所述数据压缩图像进行位置编码:
Figure BDA0003947398920000091
Figure BDA0003947398920000092
其中,P(pos,2j)表示数据压缩图像中偶数字符位置,P(pos,2j+1)表示数据压缩图像中奇数字符位置,pos表示数据压缩图像中字符的位置序列,j表示数据压缩图像的第j个维度,dmodel表示位置编码函数。
进一步的,本发明实施通过所述将所述编码图像传输至预构建的互联网系统中,以通过所述预构建的互联网系统将所述编码图像进行还原。
作为本发明的一可选实施例,所述将所述编码图像传输至预构建的互联网系统中通过所述智能摄像采集设备的数据传输接口传输。
S3、利用所述预构建的互联网系统中的图像还原技术将所述编码图像进行还原,得到还原图像,将所述还原图像进行分割,得到分割图像,并对所述分割图像进行特征提取,得到特征图像。
本发明实施例通过所述利用所述预构建的互联网系统中的图像还原技术将所述编码图像进行还原可以得到还原图像为后续的图像分割做个前提保障。其中,所述图像还原技术是指通过降维方法将压缩图像还原的技术。
作为本发明的一个可选实施例,所述将所述编码图像进行还原通过机器学习中的pca图像压缩还原技术还原。
进一步的,本发明实施例通过所述将所述还原图像进行分割可以有利于提取出图像中的关键信息或目标信息。其中,所述图像分割是指经图像按照设定的方法分割成若干特定的,具有独特性质的区域。
作为本发明的一个实施例,所述将所述还原图像进行分割包括:计算所述还原图像中不同级灰度的阈值,得到多级灰度阈值,根据所述多级灰度阈值对所述多级灰度阈值对应的灰度区域进行阈值分割,得到分割图像。
其中,所述灰度阈值是指图像中灰度级的区间,在阈值区间内为有效像素信息。
可选的,所述计算所述还原图像中不同级灰度的阈值通过最大熵法计算,所述根据所述多级灰度阈值对所述多级灰度阈值对应的灰度区域进行阈值分割通过阈值分割函数进行分割,所述阈值分割函数由HTML语言生成。
进一步的,本发明实施例通过所述对所述分割图像进行特征提取可以得到图像中的关键元素去除图像识别中的影响因素,为后续的图像识别做个前提保障。
作为本发明的一个实施例,所述对所述分割图像进行特征提取包括:构建所述分割图像的直角坐标系,根据所述直角坐标系,划分所述分割图像的图像特征点,并提取所述分割图像对应的图像特征点,根据所述图像特征点,生成所述分割图像的特征图像。
其中,所述直角坐标系是指一维空间中的平面坐标具有两条互相垂直,并且有公共原点的数轴,其中横轴为X轴,纵轴为Y轴的坐标系。
可选的,所述构建所述分割图像的直角坐标系通过JAVA语言生成的脚本构建,所述划分所述分割图像的图像特征点通过sift语法划分,所述提取所述分割图像对应的图像特征点通过HTML语言生成的surf函数提取。
S4、判断所述特征图像是否存在模糊信息。
本发明实施例通过所述判断所述特征图像是否存在模糊信息以便于后续对所述特征图像的识别或对所述模糊信息进行修复提升所述特征图像的识别率。
其中,所述模糊信息是指由于多种因素如光线、物体运动、摄像设备聚焦等因素导致的识别率较低的图像信息。
作为本发明的一个实施例,所述判断所述特征图像是否存在模糊信息包括:计算所述特征图像的图像平均灰度值,当所述图像平均灰度值大于预设灰度值时,则所述特征图像不存在模糊信息;当所述图像平均灰度值不大于所述预设灰度值时,则所述特征图像存在模糊信息。其中,所述预设灰度值可以设置为0.5,也可以根据实际应用场景设置。
可选的,所述计算所述特征图像的图像平均灰度值通过tenengrad梯度计算方法计算,需要说明的所述tenengrad梯度计算方法是目前较为成熟的技术,因此这里不多做赘述。
S5、当所述特征图像不存在模糊信息,利用训练好的动物识别模型识别所述特征图像对应的动物信息。
应当了解,所述当所述特征图像不存在模糊信息是指所述特征图像的图像较清晰,识别率较高可以识别所述特征图像对应的动物信息。
其中,所述训练好的动物识别模型通过深度学习神经网络生成。
作为本发明的一个实施例,所述利用训练好的动物识别模型识别所述特征图像对应的动物信息包括:获取历史动物图像,将所述特征图像与所述历史动物图像进行图像匹配,根据所述图像匹配相似度识别所述特征图像对应的动物信息。
可选的,所述获取历史动物图像通过所述预构建的互联网系统中对应的历史动物图像数据库获取,所述将所述特征图像与所述历史动物图像进行图像匹配通过所述训练好的动物识别模型中的匹配模块进行匹配,所述根据所述图像匹配相似度识别所述特征图像对应的动物信息通过原型匹配模型进行匹配识别,所述原型匹配模型通过人工神经网络生成。
S6、当所述特征图像存在模糊信息,对所述模糊特征信息进行信息复原,得到复原特征信息,并根据所述特征图像中的清晰信息结合所述复原特征信息识别所述特征图像对应的动物信息。
应当了解,所述当所述特征图像存在模糊信息是指所述特征图像中存在不清晰,识别率较低的图像信息导致无法识别或识别准确率较低的图像信息。
本发明实施例通过所述对所述模糊特征信息进行信息复原可以将所述特征图像进行图像复原以提高所述特征图像清晰度,以便于对所述特征图像的识别更加准确。
作为本发明的一个实施例,所述对所述模糊特征信息进行信息复原,得到复原特征信息包括:计算所述模糊特征信息的退化线性信息,根据所述退化线性信息,计算所述模糊特征信息的复原特征信息。
其中,所述退化线性信息是指图像在形成、记录、处理和传输过程中,由于成像系统、记录设备、传输介质和处理方法的不完善,导致图像质量的下降所产生的信息,其包括非线性退化、模糊退化、运动退化和随机噪声退化,线性退化等。
作为本发明一可选实施,利用下述公式计算所述模糊特征信息的退化线性信息:
F(x,y)=l(x,y)*f(x,y)+μ(x,y)
其中,F(x,y)表示退化线性信息,l(x,y)表示退化函数,f(x,y)表示模糊特征信息,μ(x,y)表示加性噪声,*表示卷积运算。
作为本发明一可选实施例,利用下述公式对所述模糊特征信息进行信息复原:
Figure BDA0003947398920000121
其中,
Figure BDA0003947398920000122
表示复原特征信息,sx,y表示以(x,y)为中心的尺寸为x×y的矩形窗口,F(x,y)表示退化线性信息,m,n表示sx,y矩形窗口中的坐标(m,n)点。
进一步的,作为本发明的一个实施例,所述根据所述特征图像中的清晰信息结合所述复原特征信息识别所述特征图像对应的动物信息原理与所述利用训练好的动物识别模型识别所述特征图像对应的动物信息步骤相同,因此这里不多做赘述。
本方案首先通过所述采集待检测动物图像,将所述待检测动物图像进行灰度直方图的转换可以确定所述待检测动物图像的边界便于图像中物体与背景的分割,并对所述转换动物图像进行均衡化处理可以增大图像的对比度,使得图像更加的清晰,并利用预设的空间滤波技术对所述标准动物图像进行图像增强可以使所述待检测动物图像的图像特征更加明显,以便于后续的分析;其次,本发明实施例通过将所述增强动物图像进行数据压缩可以减少所述增强动物图像的存储空间,便于图像的传输提升数据处理的效率;通过所述对所述数据压缩图像进行位置编码可以保证压缩数据的顺序性为后续的图像还原做个基础保障,进一步地,本发明实施例通通过所述判断所述特征图像是否存在模糊信息以便于后续对所述特征图像的识别或对所述模糊信息进行修复提升所述特征图像的识别率,及对所述模糊特征信息进行信息复原可以将所述特征图像进行图像复原以提高所述特征图像清晰度,以便于对所述特征图像的识别更加准确。因此,本发明实施例提出的一种面向端到端神经网络的动物检测方法可以提高动物检测的效率。
如图2所示,是本发明面向端到端神经网络的动物检测装置的功能模块图。
本发明所述面向端到端神经网络的动物检测装置200可以安装于电子设备中。根据实现的功能,所述面向端到端神经网络的动物检测装置可以包括图像增强模块201、图像传输模块202、特征提取模块203、信息判断模块204、图像识别模块205以及信息还原模块206。本发明所述模块也可以称之为单元,是指一种能够被电子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。
在本发明实施例中,关于各模块/单元的功能如下:
所述图像增强模块201,用于采集待检测动物图像,将所述待检测动物图像进行灰度直方图的转换,得到转换动物图像,对所述转换动物图像进行均衡化处理,得到标准动物图像,并利用预设的空间滤波技术对所述标准动物图像进行图像增强,得到增强动物图像;
所述图像传输模块202,用于将所述增强动物图像进行数据压缩,得到数据压缩图像,并对所述数据压缩图像进行位置编码,得到编码图像,将所述编码图像传输至预构建的互联网系统中;
所述特征提取模块203,用于利用所述预构建的互联网系统中的图像还原技术将所述编码图像进行还原,得到还原图像,将所述还原图像进行分割,得到分割图像,并对所述分割图像进行特征提取,得到特征图像;
所述信息判断模块204,用于判断所述特征图像是否存在模糊信息;
所述图像识别模块205,用于当所述特征图像不存在模糊信息,利用训练好的动物识别模型识别所述特征图像对应的动物信息;
所述信息还原模块206,用于当所述特征图像存在模糊信息,对所述模糊特征信息进行信息复原,得到复原特征信息,并根据所述特征图像中的清晰信息结合所述复原特征信息识别所述特征图像对应的动物信息。
详细地,本发明实施例中所述面向端到端神经网络的动物检测装置200中的所述各模块在使用时采用与上述的图1中所述的面向端到端神经网络的动物检测方法一样的技术手段,并能够产生相同的技术效果,这里不再赘述。
如图3所示,是本发明实现面向端到端神经网络的动物检测方法的电子设备的结构示意图。
所述电子设备可以包括处理器30、存储器31、通信总线32以及通信接口33,还可以包括存储在所述存储器31中并可在所述处理器30上运行的计算机程序,如面向端到端神经网络的动物检测程序。
其中,所述处理器30在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing Unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述处理器30是所述电子设备的控制核心(ControlUnit),利用各种接口和线路连接整个电子设备的各个部件,通过运行或执行存储在所述存储器31内的程序或者模块(例如执行面向端到端神经网络的动物检测程序等),以及调用存储在所述存储器31内的数据,以执行电子设备的各种功能和处理数据。
所述存储器31至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:SD或DX存储器等)、磁性存储器、磁盘、光盘等。所述存储器31在一些实施例中可以是电子设备的内部存储单元,例如该电子设备的移动硬盘。所述存储器31在另一些实施例中也可以是电子设备的外部存储设备,例如电子设备上配备的插接式移动硬盘、智能存储卡(Smart Media Card,SMC)、安全数字(Secure Digital,SD)卡、闪存卡(Flash Card)等。进一步地,所述存储器31还可以既包括电子设备的内部存储单元也包括外部存储设备。所述存储器31不仅可以用于存储安装于电子设备的应用软件及各类数据,例如面向端到端神经网络的动物检测程序的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
所述通信总线32可以是外设部件互连标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。所述总线被设置为实现所述存储器31以及至少一个处理器30等之间的连接通信。
所述通信接口33用于上述电子设备与其他设备之间的通信,包括网络接口和用户接口。可选地,所述网络接口可以包括有线接口和/或无线接口(如WI-FI接口、蓝牙接口等),通常用于在该电子设备与其他电子设备之间建立通信连接。所述用户接口可以是显示器(Display)、输入单元(比如键盘(Keyboard)),可选地,所述用户接口还可以是标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备中处理的信息以及用于显示可视化的用户界面。
图3仅示出了具有部件的电子设备,本领域技术人员可以理解的是,图3示出的结构并不构成对所述电子设备的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
例如,尽管图中未示出,所述电子设备还可以包括给各个部件供电的电源(比如电池),优选地,电源可以通过电源管理装置与所述至少一个处理器30逻辑相连,从而通过电源管理装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备还可以包括多种传感器、蓝牙模块、Wi-Fi模块等,在此不再赘述。
应该了解,所述实施例仅为说明之用,在专利发明范围上并不受此结构的限制。
所述电子设备中的所述存储器31存储的面向端到端神经网络的动物检测程序是多个计算机程序的组合,在所述处理器30中运行时,可以实现以下方法:
采集待检测动物图像,将所述待检测动物图像进行灰度直方图的转换,得到转换动物图像,对所述转换动物图像进行均衡化处理,得到标准动物图像,并利用预设的空间滤波技术对所述标准动物图像进行图像增强,得到增强动物图像;
将所述增强动物图像进行数据压缩,得到数据压缩图像,并对所述数据压缩图像进行位置编码,得到编码图像,将所述编码图像传输至预构建的互联网系统中;
利用所述预构建的互联网系统中的图像还原技术将所述编码图像进行还原,得到还原图像,将所述还原图像进行分割,得到分割图像,并对所述分割图像进行特征提取,得到特征图像;
判断所述特征图像是否存在模糊信息;
当所述特征图像不存在模糊信息,利用训练好的动物识别模型识别所述特征图像对应的动物信息;
当所述特征图像存在模糊信息,对所述模糊特征信息进行信息复原,得到复原特征信息,并根据所述特征图像中的清晰信息结合所述复原特征信息识别所述特征图像对应的动物信息。
具体地,所述处理器30对上述计算机程序的具体实现方法可参考图1对应实施例中相关步骤的描述,在此不赘述。
进一步地,所述电子设备集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个非易失性计算机可读取存储介质中。所述计算机可读存储介质可以是易失性的,也可以是非易失性的。例如,所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)。
本发明还提供一种计算机可读存储介质,所述可读存储介质存储有计算机程序,所述计算机程序在被电子设备的处理器所执行时,可以实现以下方法:
采集待检测动物图像,将所述待检测动物图像进行灰度直方图的转换,得到转换动物图像,对所述转换动物图像进行均衡化处理,得到标准动物图像,并利用预设的空间滤波技术对所述标准动物图像进行图像增强,得到增强动物图像;
将所述增强动物图像进行数据压缩,得到数据压缩图像,并对所述数据压缩图像进行位置编码,得到编码图像,将所述编码图像传输至预构建的互联网系统中;
利用所述预构建的互联网系统中的图像还原技术将所述编码图像进行还原,得到还原图像,将所述还原图像进行分割,得到分割图像,并对所述分割图像进行特征提取,得到特征图像;
判断所述特征图像是否存在模糊信息;
当所述特征图像不存在模糊信息,利用训练好的动物识别模型识别所述特征图像对应的动物信息;
当所述特征图像存在模糊信息,对所述模糊特征信息进行信息复原,得到复原特征信息,并根据所述特征图像中的清晰信息结合所述复原特征信息识别所述特征图像对应的动物信息。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本发明的具体实施方式,使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所发明的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种面向端到端神经网络的动物检测方法,其特征在于,所述方法包括:
采集待检测动物图像,将所述待检测动物图像进行灰度直方图的转换,得到转换动物图像,对所述转换动物图像进行均衡化处理,得到标准动物图像,并利用预设的空间滤波技术对所述标准动物图像进行图像增强,得到增强动物图像;
将所述增强动物图像进行数据压缩,得到数据压缩图像,并对所述数据压缩图像进行位置编码,得到编码图像,将所述编码图像传输至预构建的互联网系统中;
利用所述预构建的互联网系统中的图像还原技术将所述编码图像进行还原,得到还原图像,将所述还原图像进行分割,得到分割图像,并对所述分割图像进行特征提取,得到特征图像;
判断所述特征图像是否存在模糊信息;
当所述特征图像不存在模糊信息,利用训练好的动物识别模型识别所述特征图像对应的动物信息;
当所述特征图像存在模糊信息,对所述模糊特征信息进行信息复原,得到复原特征信息,并根据所述特征图像中的清晰信息结合所述复原特征信息识别所述特征图像对应的动物信息。
2.根据权利要求1所述的方法,其特征在于,所述将所述待检测动物图像进行灰度直方图的转换,得到转换动物图像包括:
将所述待检测动物图像进行降维,得到降维图像;
根据所述降维图像计算所述待检测动物图像灰度像素值的累计数值,得到灰度像素数值,并根据所述灰度像素数值,构建所述待检测动物图像灰度直方图,得到转换动物图像。
3.根据权利要求1所述的方法,其特征在于,所述对所述转换动物图像进行均衡化处理,得到标准动物图像,包括:
利用下述公式计算所述待检测动物图像的直方图分布概率:
Figure FDA0003947398910000011
其中,s(rk)表示所述直方图概率累计值,rk表示所述人脸图像的第k个灰度级,mk表示第k个灰度级的像素个数,m表示所述人脸图像中的所有像素个数;
根据所述直方图分布概率,利用下述公式计算所述待检测动物图像的直方图概率累计值:
Figure FDA0003947398910000021
其中,h(yi)表示直方图概率累计值,s(rk)表示直方图分布概率,s(yi)表示在s级灰度值中第i个像素的个数;
根据所述直方图概率累计值,利用下述公式确定所述待检测动物图像的均衡化映射关系值:
ss(rk)=int{[max(pix)-min(pix)]*h(yi)+e}
其中,ss(rk)表示均衡化映射关系值,max(pix)表示待检测动物图像中最大的灰度级,min(pix)表示待检测动物图像中最小的灰度级,h(yi)表示直方图概率累计值,e表示无限不循环小数;
根据所述均衡化映射关系值,对所述待检测动物图像进行均衡化处理,得到标准动物图像。
4.根据权利要求1所述的方法,其特征在于,所述对所述数据压缩图像进行位置编码,得到编码图像,包括:
利用下述公式对所述数据压缩图像进行位置编码:
Figure FDA0003947398910000022
Figure FDA0003947398910000023
其中,P(pos,2j)表示数据压缩图像中偶数字符位置,P(pos,2j+1)表示数据压缩图像中奇数字符位置,pos表示数据压缩图像中字符的位置序列,j表示数据压缩图像的第j个维度,dmodel表示位置编码函数。
5.根据权利要求1所述的方法,其特征在于,所述对所述分割图像进行特征提取,得到特征图像,包括:
构建所述分割图像的直角坐标系,根据所述直角坐标系,划分所述分割图像的图像特征点,并提取所述分割图像对应的图像特征点;
根据所述图像特征点,生成所述分割图像的特征图像。
6.根据权利要求1所述的方法,其特征在于,所述判断所述特征图像是否存在模糊信息包括:
计算所述特征图像的图像平均灰度值;
当所述图像平均灰度值大于预设灰度值时,则所述特征图像不存在模糊信息;
当所述图像平均灰度值不大于所述预设灰度值时,则所述特征图像存在模糊信息。
7.根据权利要求1至6中任意一项所述的方法,其特征在于,所述对所述模糊特征信息进行信息复原,得到复原特征信息包括:
利用下述公式计算所述模糊特征信息的退化线性信息:
F(x,y)=l(x,y)*f(x,y)+μ(x,y)
其中,F(x,y)表示退化线性信息,l(x,y)表示退化函数,f(x,y)表示模糊特征信息,μ(x,y)表示加性噪声,*表示卷积运算
根据所述退化线性信息,利用下述公式计算所述模糊特征信息的复原特征信息:
Figure FDA0003947398910000031
其中,
Figure FDA0003947398910000032
表示复原特征信息,sx,y表示以(x,y)为中心的尺寸为x×y的矩形窗口,F(x,y)表示退化线性信息,m,n表示sx,y矩形窗口中的坐标(m,n)点。
8.一种面向端到端神经网络的动物检测装置,其特征在于,所述装置包括:
图像增强模块,用于采集待检测动物图像,将所述待检测动物图像进行灰度直方图的转换,得到转换动物图像,对所述转换动物图像进行均衡化处理,得到标准动物图像,并利用预设的空间滤波技术对所述标准动物图像进行图像增强,得到增强动物图像;
图像传输模块,用于将所述增强动物图像进行数据压缩,得到数据压缩图像,并对所述数据压缩图像进行位置编码,得到编码图像,将所述编码图像传输至预构建的互联网系统中;
特征提取模块,用于利用所述预构建的互联网系统中的图像还原技术将所述编码图像进行还原,得到还原图像,将所述还原图像进行分割,得到分割图像,并对所述分割图像进行特征提取,得到特征图像;
信息判断模块,用于判断所述特征图像是否存在模糊信息;
图像识别模块,用于当所述特征图像不存在模糊信息,利用训练好的动物识别模型识别所述特征图像对应的动物信息;
信息还原模块,用于当所述特征图像存在模糊信息,对所述模糊特征信息进行信息复原,得到复原特征信息,并根据所述特征图像中的清晰信息结合所述复原特征信息识别所述特征图像对应的动物信息。
9.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至7中任意一项所述的面向端到端神经网络的动物检测方法。
10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任意一项所述的一种面向端到端神经网络的动物检测方法。
CN202211437262.5A 2022-11-17 2022-11-17 面向端到端神经网络的动物检测方法、装置、设备及介质 Pending CN116129463A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211437262.5A CN116129463A (zh) 2022-11-17 2022-11-17 面向端到端神经网络的动物检测方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211437262.5A CN116129463A (zh) 2022-11-17 2022-11-17 面向端到端神经网络的动物检测方法、装置、设备及介质

Publications (1)

Publication Number Publication Date
CN116129463A true CN116129463A (zh) 2023-05-16

Family

ID=86296338

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211437262.5A Pending CN116129463A (zh) 2022-11-17 2022-11-17 面向端到端神经网络的动物检测方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN116129463A (zh)

Similar Documents

Publication Publication Date Title
CN111079764B (zh) 一种基于深度学习的低照度车牌图像识别方法及装置
CN111475797A (zh) 一种对抗图像生成方法、装置、设备以及可读存储介质
KR101906796B1 (ko) 딥러닝 기반 영상 분석 장치 및 영상 분석 방법
CN107403124A (zh) 一种基于视觉图像的条形码检测识别方法
CN112528866A (zh) 跨模态人脸识别方法、装置、设备及存储介质
CN113012068B (zh) 图像去噪方法、装置、电子设备及计算机可读存储介质
CN111652233A (zh) 一种针对复杂背景的文本验证码自动识别方法
CN112507897A (zh) 跨模态人脸识别方法、装置、设备及存储介质
CN114049568A (zh) 基于图像比对的标的物形变检测方法、装置、设备及介质
CN112561879A (zh) 模糊度评价模型训练方法、图像模糊度评价方法及装置
CN117152182B (zh) 一种超低照度网络相机图像处理方法、装置及电子设备
CN112528903B (zh) 人脸图像获取方法、装置、电子设备及介质
CN113792672A (zh) 公共场所健康码获取方法、装置、设备及介质
CN116311212B (zh) 基于高速摄像机实现运动状态下的船号识别方法及装置
CN113240585A (zh) 基于生成对抗网络的图像处理方法、装置及存储介质
CN110795995B (zh) 数据处理方法、装置及计算机可读存储介质
CN112633200A (zh) 基于人工智能的人脸图像比对方法、装置、设备及介质
CN116129463A (zh) 面向端到端神经网络的动物检测方法、装置、设备及介质
CN115798004A (zh) 基于局部区域的人脸打卡方法、装置、电子设备及介质
CN115482169A (zh) 低照度图像增强方法、装置、电子设备及存储介质
CN114882582A (zh) 基于联邦学习模式的步态识别模型训练方法与系统
CN114049676A (zh) 疲劳状态检测方法、装置、设备及存储介质
CN114463734A (zh) 文字识别方法、装置、电子设备及存储介质
CN113792671A (zh) 人脸合成图像的检测方法、装置、电子设备及介质
CN116109526B (zh) 基于车辆后视镜的显示画面增强方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination