CN114708621A - 水下海胆图像识别模型的训练方法、识别方法及装置 - Google Patents

水下海胆图像识别模型的训练方法、识别方法及装置 Download PDF

Info

Publication number
CN114708621A
CN114708621A CN202210605189.1A CN202210605189A CN114708621A CN 114708621 A CN114708621 A CN 114708621A CN 202210605189 A CN202210605189 A CN 202210605189A CN 114708621 A CN114708621 A CN 114708621A
Authority
CN
China
Prior art keywords
image
sea urchin
underwater
data set
underwater sea
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210605189.1A
Other languages
English (en)
Other versions
CN114708621B (zh
Inventor
彭小红
梁子祥
李思东
陈亮
张军
李一凡
赵晓鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Ocean University
Original Assignee
Guangdong Ocean University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Ocean University filed Critical Guangdong Ocean University
Priority to CN202210605189.1A priority Critical patent/CN114708621B/zh
Priority to PCT/CN2022/101036 priority patent/WO2023231094A1/zh
Publication of CN114708621A publication Critical patent/CN114708621A/zh
Application granted granted Critical
Publication of CN114708621B publication Critical patent/CN114708621B/zh
Priority to US18/107,418 priority patent/US20240020966A1/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/05Underwater scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/251Fusion techniques of input or preprocessed data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/90Determination of colour characteristics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/36Applying a local operator, i.e. means to operate on image points situated in the vicinity of a given point; Non-linear local filtering operations, e.g. median filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/80Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/80Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
    • G06V10/803Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of input or preprocessed data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/80Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in fisheries management
    • Y02A40/81Aquaculture, e.g. of fish

Abstract

本发明公开一种水下海胆图像识别模型的训练方法、识别方法及装置,所述训练方法包括:构建水下海胆图像识别模型;获取水下海胆图像数据集;对所述水下海胆图像数据集进行多尺度彩色复原;通过暗通道先验方法对所述水下海胆图像数据集进行处理;将多尺度彩色复原的水下海胆图像数据集和通过暗通道先验方法处理后的水下海胆图像数据集进行图像融合;将融合后的图像数据集进行锐化处理得到训练图像数据集;利用所述训练图像数据集对所述水下海胆图像识别模型进行训练。本发明通过对图像进行多尺度彩色复原及暗通道先验处理,再基于点锐度权重方法进行图像融合并锐化处理,提高了图像质量,提高了后续海胆目标检测的准确率。

Description

水下海胆图像识别模型的训练方法、识别方法及装置
技术领域
本发明属于水下图像目标检测领域,更具体地,涉及一种水下海胆图像识别模型的训练方法、识别方法及装置。
背景技术
随着人工智能技术的不断发展,人工智能技术也被应用到水下海胆自动化捕捞中。水下海胆自动化捕捞中最重要的一环之一就是水下海胆目标检测,由于水下环境复杂,光照强度低,所以水下海胆图像通常会出现模糊,对比度低及色差等一系列的问题。常见的目标识别检测方法比如SSD,YOLO等,在陆地环境中具有不错的检测准确率,但却不能很好地应对复杂的水下环境。
发明内容
提供了本发明以解决现有技术中存在的上述问题。因此,需要一种水下海胆图像识别模型的训练方法、识别方法及装置,以解决水下海胆检测中存在的一系列问题,诸如水下海胆图像通常会出现模糊,对比度低及色差等。
根据本发明的第一方案,提供了一种水下海胆图像识别模型的训练方法,所述方法包括:构建水下海胆图像识别模型;获取水下海胆图像数据集;对所述水下海胆图像数据集进行多尺度彩色复原;通过暗通道先验方法对所述水下海胆图像数据集进行处理;将多尺度彩色复原的水下海胆图像数据集和通过暗通道先验方法处理后的水下海胆图像数据集进行图像融合;将融合后的图像数据集进行锐化处理得到训练图像数据集;利用所述训练图像数据集对所述水下海胆图像识别模型进行训练。
根据本发明的第二技术方案,提供一种水下海胆图像识别方法,所述方法包括:利用如本发明各实施例所述的训练方法训练得到的水下海胆图像识别模型对水下海胆图像进行识别。
根据本发明的第三技术方案,提供一种水下海胆图像识别模型的训练装置,所述装置包括处理器,所述处理器被配置为:构建水下海胆图像识别模型;获取水下海胆图像数据集;对所述水下海胆图像数据集进行多尺度彩色复原;通过暗通道先验方法对所述水下海胆图像数据集进行处理;将多尺度彩色复原的水下海胆图像数据集和通过暗通道先验方法处理后的水下海胆图像数据集进行图像融合;将融合后的图像数据集进行锐化处理得到训练图像数据集;利用所述训练图像数据集对所述水下海胆图像识别模型进行训练。
根据本发明的第四技术方案,提供一种水下海胆图像识别装置,所述装置包括处理器,所述处理器被配置为:利用如本发明各实施例所述的训练方法训练得到的水下海胆图像识别模型对水下海胆图像进行识别。
根据本发明第五技术方案,提供了一种存储有指令的非暂时性计算机可读存储介质,当所述指令由处理器执行时,执行根据本发明各个实施例所述的训练方法或识别方法。
根据本发明各个方案的水下海胆图像识别模型的训练方法、识别方法及装置,通过对图像进多尺度彩色复原及暗通道先验处理,再基于点锐度权重方法进行图像融合并锐化处理,提高了图像质量,提高了后续海胆目标检测的准确率。
附图说明
在不一定按比例绘制的附图中,相同的附图标记可以在不同的视图中描述相似的部件。具有字母后缀或不同字母后缀的相同附图标记可以表示相似部件的不同实例。附图大体上通过举例而不是限制的方式示出各种实施例,并且与说明书以及权利要求书一起用于对所发明的实施例进行说明。在适当的时候,在所有附图中使用相同的附图标记指代同一或相似的部分。这样的实施例是例证性的,而并非旨在作为本装置或方法的穷尽或排他实施例。
图1示出了根据本发明实施例的一种水下海胆图像识别模型的训练方法的流程图;
图2示出了根据本发明实施例的SSD模型的网络结构图;
图3示出了根据本发明实施例的多尺度彩色复原算法流程图;
图4示出了根据本发明实施例的基于点锐度权重的图像融合算法示意图;
图5示出了根据本发明实施例的基于点锐度权重的图像融合算法流程图;
图6示出了根据本发明实施例的水下海胆图像的目标检测流程图。
具体实施方式
为使本领域技术人员更好的理解本发明的技术方案,下面结合附图和具体实施方式对本发明作详细说明。下面结合附图和具体实施例对本发明的实施例作进一步详细描述,但不作为对本发明的限定。本文中所描述的各个步骤,如果彼此之间没有前后关系的必要性,则本文中作为示例对其进行描述的次序不应视为限制,本领域技术人员应知道可以对其进行顺序调整,只要不破坏其彼此之间的逻辑性导致整个流程无法实现即可。
本发明实施例提供一种水下海胆图像识别模型的训练方法,请参阅图1,图1示出了根据本发明实施例的一种水下海胆图像识别模型的训练方法的流程图。该训练方法包括:
步骤S100,构建水下海胆图像识别模型。
在一些实施例中,请参阅图2,是水下海胆图像识别模型的示意图,所述水下海胆图像识别模型选择以SSD模型为基础,通过如下方法构建:SSD(Single Shot MultiBoxDetector)模型特征提取部分使用了VGG的卷积层,将VGG的两个的全连接层转换成普通的卷积层,并将多个卷积层都连接到最后的检测分类层做回归。本发明构建的SSD模型是SSD300,其输入图像的大小是 300x300,特征提取部分使用了 VGG16 的卷积层,并将 VGG16的两个全连接层转换成了普通的卷积层(图中conv6和conv7),之后又接了多个卷积(conv8_1,conv8_2,conv9_1,conv9_2,conv10_1,conv10_2),最后用一个Global Average Pool来变成1x1的输出(Pool 11)。 从图中我们可以看出,SSD将conv4_3、conv7、conv8_2、conv9_2、conv10_2、Pool 11都连接到了最后的检测分类层做回归。
步骤S200,获取水下海胆图像数据集。需要说明的是,水下海胆图像数据集至少包括一个水下海胆图像,可以通过调取现有的水下海胆图像组成,也可以通过实地采集得到。例如,通过采集终端在水下采集到相应的水下海胆图像以构成所述水下海胆图像数据集。采集终端可以是专用的水下影像设备,在水下采集多个水下海胆图像或者水下海胆视频,如果是水下海胆视频时,可以逐帧对其进行提取,得到若干个视频帧,每个视频帧即是一个水下海胆图像。上述水下海胆图像数据集的获取方式仅仅只是示例,在实际应用本方法时,包括但不限于如上所述的获取方式。
步骤S300,对所述水下海胆图像数据集进行多尺度彩色复原(Multi ScaleRetinex with Color Restoration,MSRCR)。
在一些实施例中,请参阅图3,是对所述水下海胆图像数据集进行多尺度彩色复原的流程图。具体是通过如下公式(1)对所述水下海胆图像数据集进行多尺度彩色复原:
Figure 917099DEST_PATH_IMAGE001
公式(1)
其中,
Figure 892009DEST_PATH_IMAGE002
表示其中一个通道的反射分量;
Figure 701702DEST_PATH_IMAGE003
表示其中一个通道的色彩恢复因子,
Figure 912103DEST_PATH_IMAGE004
的表达式如公式(2)所示;
Figure 733429DEST_PATH_IMAGE005
表示尺度个数,一般取值为3;
Figure 269452DEST_PATH_IMAGE006
表示第
Figure 176228DEST_PATH_IMAGE007
个尺度的加权系数,且
Figure 190321DEST_PATH_IMAGE008
Figure 131732DEST_PATH_IMAGE009
表示原始图像的第
Figure 573078DEST_PATH_IMAGE010
个通道;
Figure 701571DEST_PATH_IMAGE011
表示第
Figure 519354DEST_PATH_IMAGE007
个尺度上的高斯滤波函数,
Figure 580851DEST_PATH_IMAGE011
的表达式如公式(3)所示;
Figure 458677DEST_PATH_IMAGE012
公式(2)
其中,
Figure 340045DEST_PATH_IMAGE013
是增益常数,一般取值为46,
Figure 433291DEST_PATH_IMAGE014
的取值大小控制着非线性的强度,一般取值为125。
Figure 83715DEST_PATH_IMAGE015
公式(3)
其中
Figure 132442DEST_PATH_IMAGE016
表示在第
Figure 501107DEST_PATH_IMAGE007
个尺度下高斯环绕函数的尺度参数。
步骤S400,通过暗通道先验方法对所述水下海胆图像数据集进行处理。暗通道先验方法是图像处理领域常规的方法,本实施例在此不作详细阐述。
步骤S500,将多尺度彩色复原的水下海胆图像数据集和通过暗通道先验方法处理后的水下海胆图像数据集进行图像融合。
在一些实施例中,请参阅图4和图5,所述将多尺度彩色复原的水下海胆图像数据集和通过暗通道先验方法处理后的水下海胆图像数据集进行图像融合,包括:
步骤S501,计算多尺度彩色复原的水下海胆图像和通过暗通道先验方法处理后的水下海胆图像的清晰度。
在一些实施例中,通过如下公式(4)计算多尺度彩色复原的水下海胆图像和通过暗通道先验方法处理后的水下海胆图像的清晰度:
Figure 660693DEST_PATH_IMAGE017
公式(4)
其中M表示图像的行数,N表示列数;p表示图像的清晰度,
Figure 24678DEST_PATH_IMAGE018
表示图像灰度变化的幅度,
Figure 119673DEST_PATH_IMAGE019
表示图像像素间距的变化量。
步骤S502,根据清晰度计算出融合权重系数。
在一些实施例中,通过如下公式(5)计算出融合权重系数:
Figure 100267DEST_PATH_IMAGE020
公式(5)
Figure 673331DEST_PATH_IMAGE021
是当前图像的清晰度,
Figure 422981DEST_PATH_IMAGE022
是另一图像的清晰度,
Figure 688877DEST_PATH_IMAGE023
是融合权重系数。
步骤S503,基于所述融合权重系数,对多尺度彩色复原的水下海胆图像和通过暗通道先验方法处理后的水下海胆图像按照RGB三通道进行拆分,并根据对应的通道进行融合,获得融合后的图像。
步骤S600,将融合后的图像数据集进行锐化处理得到训练图像数据集。
在一些实施例中,对步骤S500获得的融合图像进行高斯滤波,然后将当前图像的像素值和经过高斯滤波之后的结果做差,并映射到0-255之间,如下公式(6)所示:
Figure 891189DEST_PATH_IMAGE024
公式(6)
其中,
Figure 533523DEST_PATH_IMAGE025
是锐化处理后的结果图像,
Figure 137679DEST_PATH_IMAGE026
是原图像,
Figure 574477DEST_PATH_IMAGE027
是高斯模糊处理后的图像,
Figure 1435DEST_PATH_IMAGE028
是锐化调整参数,一般取0.6。使用上述方法对图像进行锐化时,减低的图像噪声的同时,还可以起到一定的图像平滑作用。
步骤S700,利用所述训练图像数据集对所述水下海胆图像识别模型进行训练。最后得到训练好的水下海胆图像识别模型。
本发明实施例提供一种水下海胆图像识别方法,所述方法包括:利用如本发明各实施例所述的训练方法训练得到的水下海胆图像识别模型对水下海胆图像进行识别。
在一些实施例中,请参阅图6,是水下海胆图像识别方法的流程图,所述水下海胆图像识别方法包括:
步骤S601,对水下海胆图像进行多尺度彩色复原。该步骤可以通过如上所述的公式(1)-公式(3)实现。
步骤S602,通过暗通道先验方法对水下海胆图像进行处理。
步骤S603,将多尺度彩色复原的水下海胆图像和通过暗通道先验方法处理后的水下海胆图像进行图像融合。该步骤可以通过如上所述的公式(4)-公式(5)实现。
步骤S604,将融合后的图像进行锐化处理后输入至训练好的水下海胆图像识别模型中进行识别。该步骤中的锐化处理可以通过如上所述的公式(6)实现。
本发明实施例提供一种水下海胆图像识别模型的训练装置,所述装置包括处理器,所述处理器被配置为:构建水下海胆图像识别模型;获取水下海胆图像数据集;对所述水下海胆图像数据集进行多尺度彩色复原;通过暗通道先验方法对所述水下海胆图像数据集进行处理;将多尺度彩色复原的水下海胆图像数据集和通过暗通道先验方法处理后的水下海胆图像数据集进行图像融合;将融合后的图像数据集进行锐化处理得到训练图像数据集;利用所述训练图像数据集对所述水下海胆图像识别模型进行训练。
在一些实施例中,所述处理器被进一步配置为:通过如下公式(1)对所述水下海胆图像数据集进行多尺度彩色复原:
Figure 916301DEST_PATH_IMAGE001
公式(1)
其中,
Figure 640543DEST_PATH_IMAGE002
表示其中一个通道的反射分量;
Figure 248242DEST_PATH_IMAGE003
表示其中一个通道的色彩恢复因子,
Figure 425146DEST_PATH_IMAGE004
的表达式如公式(2)所示;
Figure 143703DEST_PATH_IMAGE005
表示尺度个数,一般取值为3;
Figure 722452DEST_PATH_IMAGE006
表示第
Figure 501052DEST_PATH_IMAGE007
个尺度的加权系数,且
Figure 165252DEST_PATH_IMAGE008
Figure 687500DEST_PATH_IMAGE009
表示原始图像的第
Figure 120755DEST_PATH_IMAGE010
个通道;
Figure 70257DEST_PATH_IMAGE011
表示第
Figure 956173DEST_PATH_IMAGE007
个尺度上的高斯滤波函数,
Figure 282112DEST_PATH_IMAGE029
的表达式如公式(3)所示;
Figure 569874DEST_PATH_IMAGE012
公式(2)
其中,
Figure 690277DEST_PATH_IMAGE013
是增益常数,一般取值为46,
Figure 331998DEST_PATH_IMAGE014
的取值大小控制着非线性的强度,一般取值为125。
Figure 196049DEST_PATH_IMAGE015
公式(3)
其中
Figure 72738DEST_PATH_IMAGE016
表示在第
Figure 754255DEST_PATH_IMAGE007
个尺度下高斯环绕函数的尺度参数。
在一些实施例中,所述处理器被进一步配置为:计算多尺度彩色复原的水下海胆图像和通过暗通道先验方法处理后的水下海胆图像的清晰度;根据清晰度计算出融合权重系数;基于所述融合权重系数,对多尺度彩色复原的水下海胆图像和通过暗通道先验方法处理后的水下海胆图像按照RGB三通道进行拆分,并根据对应的通道进行融合,获得融合后的图像。
在一些实施例中,所述处理器被进一步配置为:通过如下公式(4)计算多尺度彩色复原的水下海胆图像和通过暗通道先验方法处理后的水下海胆图像的清晰度:
Figure 490130DEST_PATH_IMAGE030
公式(4)
其中M表示图像的行数,N表示列数;p表示图像的清晰度,
Figure 16926DEST_PATH_IMAGE031
表示图像灰度变化的幅度,
Figure 154647DEST_PATH_IMAGE019
表示图像像素间距的变化量。
在一些实施例中,所述处理器被进一步配置为:通过如下公式(5)计算出融合权重系数:
Figure 741486DEST_PATH_IMAGE020
公式(5)
Figure 699077DEST_PATH_IMAGE021
是当前图像的清晰度,
Figure 29565DEST_PATH_IMAGE022
是另一图像的清晰度,
Figure 146425DEST_PATH_IMAGE023
是融合权重系数。
本发明实施例提供一种水下海胆图像识别装置,所述装置包括处理器,所述处理器被配置为:利用如本发明各实施例所述的训练方法训练得到的水下海胆图像识别模型对水下海胆图像进行识别。
在一些实施例中,所述处理器被进一步配置为:对水下海胆图像进行多尺度彩色复原;通过暗通道先验方法对水下海胆图像进行处理;将多尺度彩色复原的水下海胆图像和通过暗通道先验方法处理后的水下海胆图像进行图像融合;将融合后的图像进行锐化处理后输入至训练好的水下海胆图像识别模型中进行识别。
本发明实施例还提供了一种存储有指令的非暂时性计算机可读介质,当指令由处理器执行时,执行根据本发明任一实施例所述的训练方法或识别方法。
此外,尽管已经在本文中描述了示例性实施例,其范围包括任何和所有基于本发明的具有等同元件、修改、省略、组合(例如,各种实施例交叉的方案)、改编或改变的实施例。权利要求书中的元件将被基于权利要求中采用的语言宽泛地解释,并不限于在本说明书中或本申请的实施期间所描述的示例,其示例将被解释为非排他性的。因此,本说明书和示例旨在仅被认为是示例,真正的范围和精神由以下权利要求以及其等同物的全部范围所指示。
以上描述旨在是说明性的而不是限制性的。例如,上述示例(或其一个或更多方案)可以彼此组合使用。例如本领域普通技术人员在阅读上述描述时可以使用其它实施例。另外,在上述具体实施方式中,各种特征可以被分组在一起以简单化本发明。这不应解释为一种不要求保护的发明的特征对于任一权利要求是必要的意图。相反,本发明的主题可以少于特定的发明的实施例的全部特征。从而,以下权利要求书作为示例或实施例在此并入具体实施方式中,其中每个权利要求独立地作为单独的实施例,并且考虑这些实施例可以以各种组合或排列彼此组合。本发明的范围应参照所附权利要求以及这些权利要求赋权的等同形式的全部范围来确定。

Claims (10)

1.一种水下海胆图像识别模型的训练方法,其特征在于,所述方法包括:
构建水下海胆图像识别模型;
获取水下海胆图像数据集;
对所述水下海胆图像数据集进行多尺度彩色复原;
通过暗通道先验方法对所述水下海胆图像数据集进行处理;
将多尺度彩色复原的水下海胆图像数据集和通过暗通道先验方法处理后的水下海胆图像数据集进行图像融合;
将融合后的图像数据集进行锐化处理得到训练图像数据集;
利用所述训练图像数据集对所述水下海胆图像识别模型进行训练。
2.根据权利要求1所述的方法,其特征在于,通过如下公式(1)对所述水下海胆图像数据集进行多尺度彩色复原:
Figure 219000DEST_PATH_IMAGE001
公式(1)
其中,
Figure 788522DEST_PATH_IMAGE002
表示其中一个通道的反射分量;
Figure 798066DEST_PATH_IMAGE003
表示其中一个通道的色彩恢复因子,
Figure 769433DEST_PATH_IMAGE004
的表达式如公式(2)所示;
Figure 432496DEST_PATH_IMAGE005
表示尺度个数,取值为3;
Figure 99100DEST_PATH_IMAGE006
表示第
Figure 36969DEST_PATH_IMAGE007
个尺度的加权系数,且
Figure 3788DEST_PATH_IMAGE008
Figure 840682DEST_PATH_IMAGE009
表示原始图像的第
Figure 650375DEST_PATH_IMAGE010
个通道;
Figure 1722DEST_PATH_IMAGE011
表示第
Figure 947681DEST_PATH_IMAGE007
个尺度上的高斯滤波函数,
Figure 93492DEST_PATH_IMAGE011
的表达式如公式(3)所示;
Figure 859322DEST_PATH_IMAGE012
公式(2)
其中,
Figure 14360DEST_PATH_IMAGE013
是增益常数,一般取值为46,
Figure 549247DEST_PATH_IMAGE014
的取值大小控制着非线性的强度,一般取值为125;
Figure 990592DEST_PATH_IMAGE015
公式(3)
其中
Figure 243719DEST_PATH_IMAGE016
表示在第
Figure 936869DEST_PATH_IMAGE007
个尺度下高斯环绕函数的尺度参数。
3.根据权利要求1或2所述的方法,其特征在于,所述将多尺度彩色复原的水下海胆图像数据集和通过暗通道先验方法处理后的水下海胆图像数据集进行图像融合,包括:
计算多尺度彩色复原的水下海胆图像和通过暗通道先验方法处理后的水下海胆图像的清晰度;
根据清晰度计算出融合权重系数;
基于所述融合权重系数,对多尺度彩色复原的水下海胆图像和通过暗通道先验方法处理后的水下海胆图像按照RGB三通道进行拆分,并根据对应的通道进行融合,获得融合后的图像。
4.根据权利要求3所述的方法,其特征在于,通过如下公式(4)计算多尺度彩色复原的水下海胆图像和通过暗通道先验方法处理后的水下海胆图像的清晰度:
Figure 857420DEST_PATH_IMAGE017
公式(4)
其中M表示图像的行数,N表示列数;p表示图像的清晰度,
Figure 610613DEST_PATH_IMAGE018
表示图像灰度变化的幅度,
Figure 353965DEST_PATH_IMAGE019
表示图像像素间距的变化量。
5.根据权利要求3所述的方法,其特征在于,通过如下公式(5)计算出融合权重系数:
Figure 850806DEST_PATH_IMAGE020
公式(5)
Figure 360284DEST_PATH_IMAGE021
是当前图像的清晰度,
Figure 284378DEST_PATH_IMAGE022
是另一图像的清晰度,
Figure 777676DEST_PATH_IMAGE023
是融合权重系数。
6.一种水下海胆图像识别方法,其特征在于,所述方法包括:利用如权利要求1至5任一项所述的训练方法训练得到的水下海胆图像识别模型对水下海胆图像进行识别。
7.根据权利要求6所述的方法,其特征在于,所述方法包括:
对水下海胆图像进行多尺度彩色复原;
通过暗通道先验方法对水下海胆图像进行处理;
将多尺度彩色复原的水下海胆图像和通过暗通道先验方法处理后的水下海胆图像进行图像融合;
将融合后的图像进行锐化处理后输入至训练好的水下海胆图像识别模型中进行识别。
8.一种水下海胆图像识别模型的训练装置,其特征在于,所述装置包括处理器,所述处理器被配置为:
构建水下海胆图像识别模型;
获取水下海胆图像数据集;
对所述水下海胆图像数据集进行多尺度彩色复原;
通过暗通道先验方法对所述水下海胆图像数据集进行处理;
将多尺度彩色复原的水下海胆图像数据集和通过暗通道先验方法处理后的水下海胆图像数据集进行图像融合;
将融合后的图像数据集进行锐化处理得到训练图像数据集;
利用所述训练图像数据集对所述水下海胆图像识别模型进行训练。
9.一种水下海胆图像识别装置,其特征在于,所述装置包括处理器,所述处理器被配置为:利用如权利要求1至5任一项所述的训练方法训练得到的水下海胆图像识别模型对水下海胆图像进行识别。
10.一种存储有指令的非暂时性计算机可读存储介质,当所述指令由处理器执行时,执行根据权利要求1至5中任一项所述的训练方法或6至7中任一项所述的识别方法。
CN202210605189.1A 2022-05-31 2022-05-31 水下海胆图像识别模型的训练方法、识别方法及装置 Active CN114708621B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202210605189.1A CN114708621B (zh) 2022-05-31 2022-05-31 水下海胆图像识别模型的训练方法、识别方法及装置
PCT/CN2022/101036 WO2023231094A1 (zh) 2022-05-31 2022-06-24 水下海胆图像识别模型的训练方法、识别方法及装置
US18/107,418 US20240020966A1 (en) 2022-05-31 2023-02-08 Training method of underwater sea urchin image recognition model, and underwater sea urchin image recognition method and device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210605189.1A CN114708621B (zh) 2022-05-31 2022-05-31 水下海胆图像识别模型的训练方法、识别方法及装置

Publications (2)

Publication Number Publication Date
CN114708621A true CN114708621A (zh) 2022-07-05
CN114708621B CN114708621B (zh) 2022-08-19

Family

ID=82177005

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210605189.1A Active CN114708621B (zh) 2022-05-31 2022-05-31 水下海胆图像识别模型的训练方法、识别方法及装置

Country Status (3)

Country Link
US (1) US20240020966A1 (zh)
CN (1) CN114708621B (zh)
WO (1) WO2023231094A1 (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104318524A (zh) * 2014-10-15 2015-01-28 烟台艾睿光电科技有限公司 一种基于YCbCr色彩空间的图像增强方法、装置及系统
US20150228061A1 (en) * 2012-10-26 2015-08-13 Sk Telecom Co., Ltd. Image correction device for accelerating image correction and method for same
US20160071244A1 (en) * 2014-09-04 2016-03-10 National Taipei University Of Technology Method and system for image haze removal based on hybrid dark channel prior
CN107798661A (zh) * 2017-10-17 2018-03-13 华南理工大学 一种自适应的图像增强方法
US20190287219A1 (en) * 2018-03-15 2019-09-19 National Chiao Tung University Video dehazing device and method
CN111210395A (zh) * 2020-01-09 2020-05-29 大连海事大学 基于灰度值映射的Retinex水下图像增强方法
CN111563854A (zh) * 2020-04-28 2020-08-21 大连海事大学 用于水下图像增强处理的粒子群优化方法
CN114299060A (zh) * 2022-01-04 2022-04-08 东北电力大学 一种适用于复杂水下环境的深度学习大坝裂缝检测方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109325504A (zh) * 2018-09-07 2019-02-12 中国农业大学 一种水下海参识别方法及系统
CN112330548A (zh) * 2020-10-14 2021-02-05 北京理工大学珠海学院 基于多尺度融合的水下图像修复方法、装置、设备及介质
CN113192049B (zh) * 2021-05-17 2024-02-06 杭州电子科技大学 基于LatLRR和Retinex增强的可见光和红外图像融合方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150228061A1 (en) * 2012-10-26 2015-08-13 Sk Telecom Co., Ltd. Image correction device for accelerating image correction and method for same
US20160071244A1 (en) * 2014-09-04 2016-03-10 National Taipei University Of Technology Method and system for image haze removal based on hybrid dark channel prior
CN104318524A (zh) * 2014-10-15 2015-01-28 烟台艾睿光电科技有限公司 一种基于YCbCr色彩空间的图像增强方法、装置及系统
CN107798661A (zh) * 2017-10-17 2018-03-13 华南理工大学 一种自适应的图像增强方法
US20190287219A1 (en) * 2018-03-15 2019-09-19 National Chiao Tung University Video dehazing device and method
CN111210395A (zh) * 2020-01-09 2020-05-29 大连海事大学 基于灰度值映射的Retinex水下图像增强方法
CN111563854A (zh) * 2020-04-28 2020-08-21 大连海事大学 用于水下图像增强处理的粒子群优化方法
CN114299060A (zh) * 2022-01-04 2022-04-08 东北电力大学 一种适用于复杂水下环境的深度学习大坝裂缝检测方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
D. ABIN ETC.: "Fusion based approach for Underwater Image Enhancement", 《2021 INTERNATIONAL CONFERENCE ON COMMUNICATION INFORMATION AND COMPUTING TECHNOLOGY (ICCICT)》 *
任彦光: "基于边缘计算平台的水下图像处理方法研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
彭小红等: "深度学习驱动的水下图像预处理研究进展综述", 《计算机工程与应用》 *
曾祥波: "基于暗通道先验和Retinex水下图像处理研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
范新南等: "结合MSRCR与多尺度融合的水下图像增强算法", 《国外电子测量技术》 *
赫更新等: "改进暗通道的大坝图像去雾算法", 《应用科技》 *

Also Published As

Publication number Publication date
WO2023231094A1 (zh) 2023-12-07
US20240020966A1 (en) 2024-01-18
CN114708621B (zh) 2022-08-19

Similar Documents

Publication Publication Date Title
CN110008817B (zh) 模型训练、图像处理方法、装置、电子设备及计算机可读存储介质
US11138478B2 (en) Method and apparatus for training, classification model, mobile terminal, and readable storage medium
CN108520504B (zh) 一种基于生成对抗网络端到端的模糊图像盲复原方法
JP2020160616A (ja) 生成装置、コンピュータプログラム、生成方法
CN109241867B (zh) 采用人工智能算法识别数字岩心图像的方法及装置
JP7353803B2 (ja) 画像処理装置、画像処理方法、及びプログラム
CN112330613B (zh) 一种细胞病理数字图像质量的评价方法及系统
CN111882555B (zh) 基于深度学习的网衣检测方法、装置、设备及存储介质
CN111047618B (zh) 基于多尺度的无参考屏幕内容图像质量评估方法
CN115170410A (zh) 融合小波变换和注意力机制的图像增强方法及装置
CN114202491B (zh) 一种增强光学图像的方法及系统
Saleem et al. A non-reference evaluation of underwater image enhancement methods using a new underwater image dataset
CN113781468A (zh) 一种基于轻量级卷积神经网络的舌图像分割方法
CN111476739B (zh) 水下图像增强方法、系统及存储介质
Alaei A new document image quality assessment method based on hast derivations
CN114708621B (zh) 水下海胆图像识别模型的训练方法、识别方法及装置
CN114898096A (zh) 一种人物图像的分割和标注方法及系统
Zeng et al. Single image motion deblurring based on modified denseNet
CN109886901B (zh) 一种基于多通路分解的夜间图像增强方法
JP4883030B2 (ja) 画像処理装置、画像処理方法、及び画像処理プログラム
Wang et al. Underwater image quality optimization: Researches, challenges, and future trends
CN113012067B (zh) 基于Retinex理论和端到端深度网络的水下图像复原方法
Tao et al. MTIE-Net: Multi-technology fusion of low-light image enhancement network
US20220092357A1 (en) Information processing apparatus, information processing method, and storage medium
Arndt et al. In Focus-hybrid deep learning approaches to the HDC2021 challenge.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant