CN115546236A - 基于小波变换的图像分割方法及装置 - Google Patents

基于小波变换的图像分割方法及装置 Download PDF

Info

Publication number
CN115546236A
CN115546236A CN202211482148.4A CN202211482148A CN115546236A CN 115546236 A CN115546236 A CN 115546236A CN 202211482148 A CN202211482148 A CN 202211482148A CN 115546236 A CN115546236 A CN 115546236A
Authority
CN
China
Prior art keywords
image
sub
matrix
segmented
segmentation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211482148.4A
Other languages
English (en)
Other versions
CN115546236B (zh
Inventor
纪德益
陶明渊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba China Co Ltd
Original Assignee
Alibaba China Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba China Co Ltd filed Critical Alibaba China Co Ltd
Priority to CN202211482148.4A priority Critical patent/CN115546236B/zh
Publication of CN115546236A publication Critical patent/CN115546236A/zh
Application granted granted Critical
Publication of CN115546236B publication Critical patent/CN115546236B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20048Transform domain processing
    • G06T2207/20064Wavelet transform [DWT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Image Analysis (AREA)

Abstract

本说明书实施例提供基于小波变换的图像分割方法及装置,其中所述基于小波变换的图像分割方法包括:获取待分割图像;将所述待分割图像输入至图像降采样处理模型做降采样处理,获得所述待分割图像对应的图像特征矩阵;根据所述图像特征矩阵将所述待分割图像切分为预设数量的待分割子图像组;将每个待分割子图像组分别输入至对应的图像识别模型,获得每个图像识别模型输出的图像分割子结果;根据所述图像特征矩阵和每个图像分割子结果生成所述待分割图像对应的图像分割结果。通过将待分割子图像组输入至对应的基于小波变换图像识别模型中并行处理,降低了网络执行时间,保证了较好的图像分割性能。

Description

基于小波变换的图像分割方法及装置
技术领域
本说明书实施例涉及图像分割技术领域,特别涉及基于小波变换的图像分割方法。
背景技术
人工智能(Artificial Intelligence,AI)技术是一门综合学科,涉及领域广发,既有硬件层面的技术,也由软件层面的技术,其中,利用人工智能技术进行图像分割,在视频监控、公共安全等多个领域均发挥着重要的作用。
图像分割是把图像分成若干个特定的、具有独特性质的区域,并提出感兴趣目标的技术和过程,是图像处理到的图像分析的关键步骤。目前在对于超高分辨率图像进行分割时,分割效果好的方式需要较长的处理时长,处理速度快的方式获得的分割效果较差,无法平衡运行时长和分割性能,因此,亟需一种方式,取得处理时间和分割性能间的平衡。
发明内容
有鉴于此,本说明书实施例提供了基于小波变换的图像分割方法。本说明书一个或者多个实施例同时涉及基于小波变换的图像分割装置,一种计算设备,一种计算机可读存储介质以及一种计算机程序,以解决现有技术中存在的技术缺陷。
根据本说明书实施例的第一方面,提供了一种基于小波变换的图像分割方法,包括:
获取待分割图像;
将所述待分割图像输入至图像降采样处理模型做降采样处理,获得所述待分割图像对应的图像特征矩阵;
根据所述图像特征矩阵将所述待分割图像切分为预设数量的待分割子图像组,其中,每个待分割子图像组包括至少两个待分割子图像;
将每个待分割子图像组分别输入至对应的图像识别模型,获得每个图像识别模型输出的图像分割子结果,其中,所述图像识别模型为基于小波变换的神经网络模型;
根据所述图像特征矩阵和每个图像分割子结果生成所述待分割图像对应的图像分割结果。
根据本说明书实施例的第二方面,提供了一种基于小波变换的图像分割装置,包括:
获取模块,被配置为获得待分割图像;
特征提取模块,被配置为将所述待分割图像输入至图像降采样处理模型做降采样处理,获得所述待分割图像对应的图像特征矩阵;
分割模块,被配置为根据所述图像特征矩阵将所述待分割图像切分为预设数量的待分割子图像组,其中,每个待分割子图像组包括至少两个待分割子图像;
识别模块,被配置为将每个待分割子图像组分别输入至对应的图像识别模型,获得每个图像识别模型输出的图像分割子结果,其中,所述图像识别模型为基于小波变换的神经网络模型;
生成模块,被配置为根据所述图像特征矩阵和每个图像分割子结果生成所述待分割图像对应的图像分割结果。
根据本说明书实施例的第三方面,提供了一种计算设备,包括:
存储器和处理器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,该计算机可执行指令被处理器执行时实现上述基于小波变换的图像分割方法的步骤。
根据本说明书实施例的第四方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该指令被处理器执行时实现上述基于小波变换的图像分割方法的步骤。
根据本说明书实施例的第五方面,提供了一种计算机程序,其中,当所述计算机程序在计算机中执行时,令计算机执行上述基于小波变换的图像分割方法的步骤。
本说明书一个实施例,通过获取待分割图像;将所述待分割图像输入至图像降采样处理模型做降采样处理,获得所述待分割图像对应的图像特征矩阵;根据所述图像特征矩阵将所述待分割图像切分为预设数量的待分割子图像组,其中,每个待分割子图像组包括至少两个待分割子图像;将每个待分割子图像组分别输入至对应的图像识别模型,获得每个图像识别模型输出的图像分割子结果,其中,所述图像识别模型为基于小波变换的神经网络模型;根据所述图像特征矩阵和每个图像分割子结果生成所述待分割图像对应的图像分割结果。
通过本说明书实施例的处理方法,通过双支网络处理待分割图像,一支网络通过全局降采样,提取待分割图像的图像特征,一支网络将待分割图像进行切换、分组的处理,获得多个待分割子图像组,并分别将待分割子图像组输入至多个基于小波变换图像识别模型中进行处理,在处理过程中,两支网络的信息交互,并最终根据两支网络的信息进行融合,获得最终的图像分割结果。通过将待分割子图像组输入至对应的基于小波变换图像识别模型中并行处理,降低了网络执行时间,通过两支网络的信息交互,保证了较好的图像分割性能。
附图说明
图1是本说明书一个实施例提供的一种基于小波变换的图像分割方法的示意图;
图2是本说明书一个实施例提供的一种基于小波变换的图像分割方法的流程图;
图3是本说明书一个实施例提供的图像卷积神经网络模型的数据处理示意图;
图4是本说明书一个实施例提供的图像识别模型的结构示意图;
图5是本说明书一个实施例提供的小波变换嵌入层的结构示意图;
图6是本说明书一个实施例提供的编码器的结构示意图;
图7是本说明书一个实施例提供的基于小波变换自注意力层的特征处理示意图;
图8是本说明书一个实施例提供的待分割图像和图像分割结果的示意图;
图9是本说明书一个实施例提供的一种应用于超分辨率图像分割场景的基于小波变换的图像分割方法的处理过程示意图;
图10是本说明书一个实施例提供的一种基于小波变换的图像分割装置的结构示意图;
图11是本说明书一个实施例提供的一种计算设备的结构框图。
具体实施方式
在下面的描述中阐述了很多具体细节以便于充分理解本说明书。但是本说明书能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本说明书内涵的情况下做类似推广,因此本说明书不受下面公开的具体实施的限制。
在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
首先,对本说明书一个或多个实施例涉及的名词术语进行解释。
Vision Transformer:VIT,是目前计算机视觉领域热门的深度网络结构,将Transformer模型首次应用于计算机视觉领域,其基本组成部分是自注意力模块。
Wavelet Transformer:小波Transformer,是将小波变换(wavelet transform,WT)和Transformer的结构融合,旨在降低网络计算量,同时保持网络性能。
Patch-Group Wavelet Transformer:图像块分组的小波Transformer,将输入的图像进行切块,并分别进行小波Transformer操作的处理。
Ultra-high Resolution Image Segmentation:超高分辨率图像分割,是语义分割领域的一个学术分支,其输入图像分辨率较高。
小波变换(wavelet transform,WT):是一种新的变换分析方法,它继承和发展了短时傅立叶变换局部化的思想,同时又克服了窗口大小不随频率变化等缺点,能够提供一个随频率改变的“时间-频率”窗口,是进行信号时频分析和处理的理想工具。
离散小波变换(Discrete wavelet transform,DWT):是对基本小波的尺度和平移进行离散化。在图像处理中,常采用二进小波作为小波变换函数,即使用2的整数次幂进行划分。
图像分割是把图像分成若干个特定的、具有独特性质的区域,并提出感兴趣目标的技术和过程,是图像处理到的图像分析的关键步骤。对于超高分辨率图像进行分割时,由于输入的图像具备超多像素,在实际应用时常常需要平衡算法性能和计算资源,目前的处理方法分为两类:
1、使用双支网络,一支网络输入降采样的输入图片,直接提取全局特征;一支网络依次输入切块的图片块,提取局部特征。这两支网络均为深度网络。这种方法可以取得较好的分割效果,但是运行时间较长。
2、使用双支网络,一支网络为浅层网络,直接输入全图;另一支为深层网络,输入降采样的输入图片。这种方法的处理速度更快,但是性能比较一般,尤其是对局部细节刻画较差。
基于此,在本说明书中,提供了基于小波变换的图像分割方法,本说明书同时涉及基于小波变换的图像分割装置,一种计算设备,以及一种计算机可读存储介质,在下面的实施例中逐一进行详细说明。
参见图1,图1示出了本说明书一实施例提供的一种基于小波变换的图像分割方法的示意图。如图1所示,本说明书实施例提供的图像分割方法应用于终端100中,该终端100可以是笔记本电脑、智能终端、服务器、云服务器等终端设备。
在终端100中获取到待分割图像,对待分割图像分两支网络进行处理:
第一支网络输入至图像降采样处理模型中进行全局降采样,通过深度卷积神经网络(Convolutional Neural Networks,CNN)提取待分割图像的全局特征矩阵,用M*N表示。图像降采样处理模型可以为图像卷积神经网络模型,下文中以图像卷积神经网络模型为例进行解释说明。
第二支网络根据全局特征矩阵的尺寸,将待分割图像切分为M*N个图像块,并根据每个图像块对应的特征值,将图像块进行分组,获得多个待分割子图像组,通过特征值将图像块进行分组,可以使得后续图像识别模型在处理时,可以处理相同类型的图像块,有利于提升处理速度。再将每个待分割图像组分别输入至对应的基于小波变换的图像识别模型(Wavelet Transformer,小波Transformer)中进行处理,从而获得每个图像识别模型输出的图像分割子结果。
根据第一支网络里全局特征矩阵的图像块位置信息将图像分割子结果进行还原,最终获得待分割图像对应的图像分割结果。
在实际应用中,在第一支网络中进行两个尺度的全局降采样,相应的,在第二支网络中同样进行两次的切块、分组、输入至图像识别模型进行处理,在两支网络分别处理的过程中,两支网络之间通过信息流通从而协助图像切块、分组、融合还原,最后获得待分割图像对应的图像分割结果,通过两次不同尺度的全局降采样,可以获得更好的图像分割效果。
通过双支网络处理待分割图像,一支网络通过全局降采样,提取待分割图像的图像特征,一支网络将待分割图像进行切换、分组的处理,获得多个待分割子图像组,并分别将待分割子图像组输入至多个基于小波变换图像识别模型中进行处理,在处理过程中,两支网络的信息交互,并最终根据两支网络的信息进行融合,获得最终的图像分割结果。通过将待分割子图像组输入至对应的基于小波变换图像识别模型中并行处理,降低了网络执行时间,通过两支网络的信息交互,保证了较好的图像分割性能。
参见图2,图2示出了根据本说明书一个实施例提供的一种基于小波变换的图像分割方法的流程图,具体包括以下步骤。
步骤202:获取待分割图像。
其中,待分割图像具体可以理解为在本说明书中需要进行图像分割任务的图像,优选的,在本说明书实施例中的待分割图像为超高分辨率图像,通常情况下,图像分辨率大于5000*5000的图像可以被称为超高分辨率图像。
在实际应用中,待分割图像可以是通过可以移动存储设备(例如U盘、移动硬盘)从拷贝获得,或者从图像采集设备(如相机、无人机)采集的图像中获取,或者从互联网中获取,或者接收图像分割任务,从图像分割任务中携带获得,在本说明书实施例中,对待分割图像的获取方式不做限定,以实际应用为准。
在本说明书提供的一具体实施方式中,以通过无人机采集的图像信息为例,无人机与终端通过无线通信协议连接,当无人机采集到图像a后,将图像a通过无线通信协议传输至终端,终端获取到该图像a,需要对该图像a进行图像分割任务,从而可以确定该图像a为待分割图像。
步骤204:将所述待分割图像输入至图像降采样处理模型做降采样处理,获得所述待分割图像对应的图像特征矩阵。
图像卷积神经网络用于对输入的图片进行全局降采样处理,对待分割图像进行降采样处理,生成待分割图像对应的图像特征矩阵。
本说明书采用的基于小波变换的图像分割方法,在通过图像降采样处理模型提取图像特征矩阵的过程中,也会用到小波变换,具体的,小波变换(wavelet transform,WT)是一种新的变换分析方法,它继承和发展了短时傅立叶变换局部化的思想,同时又克服了窗口大小不随频率变化等缺点,能够提供一个随频率改变的“时间-频率”窗口,是进行信号时频分析和处理的理想工具。它的主要特点是通过变换能够充分突出问题某些方面的特征,能对时间(空间)频率的局部化分析,通过伸缩平移运算对信号(函数)逐步进行多尺度细化,最终达到高频处时间细分,低频处频率细分,能自动适应时频信号分析的要求,从而可聚焦到信号的任意细节。
本说明书提供的图像卷积神经网络模型是基于小波变换的神经网络模型,更进一步的,是基于离散小波变换的残差神经网络模型。离散小波变换是对基本小波的尺度和平移进行离散化。在图像处理中,可以采用二进小波作为小波变换函数,即使用2的整数次幂进行划分。
参见图3,图3示出本说明书一实施例提供的图像卷积神经网络模型的数据处理示意图。如图3所示,当待处理图片输入至图像卷积神经网络模型后,先通过一次离散小波变换。通过离散小波变换将待处理图像的长和宽做降采样,获得预设数量的第一子图像,再通过残差网络(Residual Network,ResNet)提取每个第一子图像的特征,并进行融合,从而获得初始图像特征矩阵,再对初始图像特征矩阵进行离散小波变换,获得预设数量的第二子图像,再通过反向小波变换获得模型输出的图像特征矩阵。
在实际应用中,初始图像特征矩阵包括一个m*n的数组,数组中的值分别对应每个图像块的图像特征分类,初始图像特征矩阵用于第二支网络中对待分割图像进行切分和分组。
在本说明书提供的一具体实施方式中,沿用上例,将待分割图像a输入至图像卷积神经网络模型中处理,获得初始图像特征矩阵W1和图像特征矩阵W2。
步骤206:根据所述图像特征矩阵将所述待分割图像切分为预设数量的待分割子图像组,其中,每个待分割子图像组包括至少两个待分割子图像。
具体的,在此的图像特征矩阵可以理解为在图像卷积神经网络模型中进行处理过程中的初始图像特征矩阵。根据图像特征矩阵将所述待分割图像切分为预设数量的待分割子图像组的过程中,图像特征矩阵的取值取决于是否存在有初始图像特征矩阵,若在上述的降采样处理过程中,存在初始图像特征矩阵,则用初始图像特征矩阵进行分割;若在上述的降采样处理过程中没有初始图像特征矩阵,则用图像特征矩阵进行分割。在实际应用中,初始图像特征矩阵中每个参数的值代表了每个图像分块的图像类型,还需要根据初始图像特征矩阵的尺寸信息对待分割图像进行切分处理,从而获得待分割图像对应的待分割子图像组。每个待分割子图像组中包括多个待分割子图像。
更进一步的,根据所述图像特征矩阵将所述待分割图像切分为预设数量的待分割子图像组,包括:
获取所述图像特征矩阵的矩阵尺寸信息和矩阵特征值;
根据所述矩阵尺寸信息将所述待分割图像切分为多个待分割子图像;
根据矩阵特征值将多个待分割子图像分为预设数量的待分割子图像组。
在获得初始图像特征矩阵之后,可以获得初始图像特征矩阵的矩阵尺寸信息和矩阵特征值,其中,矩阵尺寸信息具体是指该初始图像特征矩阵的行和列信息,例如初始图像特征矩阵是M*N的矩阵,则矩阵尺寸信息为M*N,更进一步的,若初始图像特征矩阵是8*8的矩阵,则矩阵尺寸信息为8*8。
矩阵特征值具体是指在初始特征矩阵中每个参数的值,其代表的物理含义是每个参数值对应图片的图片类型。
在确定了矩阵尺寸信息之后,即可根据该矩阵尺寸信息对待分割图像进行图像切分,例如,待分割图像的分辨率为A*B,矩阵尺寸信息为M*N,则可以将待分割图像切分为M*N个待分割子图像。更进一步的,例如待分割图像的分辨率为5000*5000,矩阵尺寸信息为8*8,则可以根据矩阵尺寸信息将待分割图像切分为8*8=64个待分割子图像,每个待分割子图像的分辨率为62.5*62.5,这里的切分是指将待分割图像进行物理层面的切分。
矩阵特征值中每个特征值对应每个待分割子图像的图像类型,在一张图像中的图像类型是预先设置好的,例如,可以设置为8个类型,则可以用(0、1、2、3、4、5、6、7)来表示每个待分割子图像的图像类型。
在通过矩阵尺寸信息将待分割图像切分为多个待分割子图像之后,根据每个待分割子图像对应的图像类型进行分类,将具有相同矩阵特征值的待分割子图像划分至同一个待分割子图像组中,从而获得预设数量的待分割子图像组。需要注意的是,待分割子图像组的数量与预先设置的图像类型的数量相同。若预设的图像类型共有8个类型,则会有8个待分割子图像组;若预设的图像类型共有4个,则会有4个待分割子图像组。图像类型的数量可以根据实际情况来设置,在本说明书实施例中对此不做限定。
在本说明书提供的一具体实施方式中,沿用上例,初始图像特征矩阵W1的尺寸信息为8*8,待分割图像a的分辨率为5000*5000,将待分割图像a分割为64个待分割子图像,再根据每个待分割子图像对应的矩阵特征值将64个待分割子图像分为8个待分割子图像组,每个待分割子图像组中包括8个待分割子图像,同一个待分割子图像组中的待分割子图像具有相同的矩阵特征值。
步骤208:将每个待分割子图像组分别输入至对应的图像识别模型,获得每个图像识别模型输出的图像分割子结果,其中,所述图像识别模型为基于小波变换的神经网络模型。
在本说明书提供的实例中,预先训练了多个相同的图像识别模型,或者是将同一个图像识别模型根据待分割子图像组的数量复制多份,以使每个待分割子图像对应一个图像识别模型。当确定了待分割自图像组的数量之后,会获取对应数量的图像识别模型,为每个待分割子图像组分配对应的图像识别模型,并分别将每个待分割子图像组输入至对应的图像识别模型进行处理,获得每个图像识别模型输出的图像分割子结果。需要注意的是,本说明书实施例提供的图像识别模型均为基于小波变换的神经网络模型,如基于小波变换的Transformer模型。
在实际应用中,每个图像识别模型处理待分割子图像组的处理流程是相同的,为了便于理解,下面将以一个图像识别模型处理待分割子图像组的处理流程进行解释说明,其他的处理流程均可按照下述方法进行处理。
具体的,将每个待分割子图像组分别输入至对应的图像识别模型,包括:
在每个待分割子图像组中确定目标待分割子图像组,并确定所述目标待分割子图像组对应的目标图像识别模型;
将所述目标待分割子图像组中的待分割子图像拼接生成待输入子图像;
将所述待输入子图像输入至所述目标图像识别模型。
其中,目标待分割子图像组具体可以理解为在多个待分割子图像组中进行识别的图像组,例如一共有8个待分割子图像组,此时需要对1号待分割子图像组进行图像识别,则将1号待分割子图像组作为目标待分割子图像组。同时确定该目标待分割子图像组对应的目标图像识别模型,目标图像识别模型具体是指与目标待分割子图像组对应的图像识别模型。
例如,一共有8个待分割子图像组和8个图像识别模型,1号待分割子图像组输入到1号图像识别模型中进行处理,当确定1号待分割子图像组为目标待分割子图像组后,则可以确定1号图像识别模型为目标图像识别模型。
将目标待分割子图像组中的待分割子图像进行拼接,生成待输入子图像,在本说明书提供的实施例中,这里的拼接具体是指将待分割子图像按照序列的形式进行拼接,具体的,可以根据每个待分割子图像的序号顺序进行拼接。从而获得一个长序列的待输入子图像。
在获得了待输入子图像之后,即可将待输入子图像输入至目标图像识别模型中进行处理。
下面结合图像识别模型的具体结构对待输入子图像的识别过程进行进一步解释说明。参见图4,图4示出了本说明书一实施例提供的图像识别模型的结构示意图,具体的,图像识别模型包括小波变换嵌入层、编码器、解码器和输出层;待输入子图像的数据流通是通过小波变换嵌入层、编码器、解码器、输出层之后,输出图像分割子结果。
具体的,获得每个图像识别模型输出的图像分割子结果,包括:
S2082、将所述待输入子图像输入至所述小波变换嵌入层,获得子图像待编码矩阵。
具体的,参见图5,图5示出了本说明书一实施例提供的小波变换嵌入层的结构示意图,其中,所述小波变换嵌入层包括卷积子层、小波变换子层、融合子层。
将所述待输入子图像输入至所述小波变换嵌入层,获得子图像待编码矩阵,包括:
将所述待输入子图像输入至所述卷积子层进行特征提取,获得第一特征矩阵;
将所述第一特征矩阵输入至所述小波变换子层做降采样处理,获得第二特征矩阵集合,其中,所述第二特征矩阵集合中包括每个待分割子图像对应的第二特征矩阵;
将所述第二特征矩阵集合输入至所述融合子层进行特征融合,获得子图像待编码矩阵。
在实际应用中,小波变换嵌入层的输入为待输入子图像中的多个待分割子图像,在小波变换嵌入层中,是对每个待分割子图像分别进行处理。
如图5所示,输入了4个待分割子图像,对于每个待分割子图像,以待分割子图像的尺寸为h*w*C为例,h为待分割子图像的高,w为待分割子图像的宽,C为待分割子图像的通道数,通过卷积子层进行特征提取,将通道数变为原来的四分之一,获得第一特征矩阵h*w*(C/4)。
将第一特征矩阵输入至小波变换子层,在小波变换子层执行小波变换处理,具体的,执行离散小波变换处理,对于每个待分割子图像对应的第一特征矩阵生成4个第二特征矩阵,组成第二特征矩阵集合,所述第二特征矩阵集合中包括每个待分割子图像对应的第二特征矩阵其中,每个第二特征矩阵的尺寸为(h/2)*(w/2)*(C/4)。
再将第二特征矩阵集合输入至融合子层进行特征融合,最终获得子图像待编码矩阵h*w。
S2084、将所述子图像待编码矩阵输入至所述编码器,获得子图像编码矩阵。
在获取了子图像待编码矩阵之后,将子图像待编码矩阵输入至编码器,获得编码器输出的图像编码矩阵,编码器的作用是对输入的特征进行特征提取,为后续的解码环节提供有效的信息。具体的,所述编码器包括n个顺次连接的编码层,每个编码层包括基于小波变换自注意力层和前馈神经网络层,其中,n为大于等于2的正整数;
对于任一编码层,包括:
接收待处理子图像特征矩阵;
将所述待处理子图像特征矩阵输入至基于小波变换自注意力层,获得第一子层矩阵;
将所述第一子层矩阵输入至前馈神经网络层,获得子图像特征矩阵。
参见图6,图6示出了本说明书一实施例提供的编码器的结构示意图,在编码器中包括n个顺次连接的编码层,每个编码层接收上一个编码层的输出,在每个编码层中均包括一个小波变换自注意力层和前馈神经网络层。
对于第1个编码层,接收待处理子图像特征矩阵,包括:接收所述子图像待编码矩阵;
对于除第1个编码层的其他编码层,接收待处理子图像特征矩阵,包括:接收上一个编码层输出的子图像特征矩阵。
对于每个编码层,均是处理输入的待处理子图像特征矩阵,在实际应用中,编码器与小波变换嵌入层相连,因此,第1个编码层接收到的是小波变换嵌入层输出的子图像待编码矩阵,待处理子图像特征矩阵即为子图像待编码矩阵;除了第1个编码层之外的其他编码层,均是接收上一个编码层输出的子图像特征矩阵,待处理子图像特征矩阵即为子图像特征矩阵。
更进一步的,将所述待处理子图像特征矩阵输入至基于小波变换自注意力层,获得第一子层矩阵,包括:
对所述待处理子图像特征矩阵进行线性转换得到键矩阵、查询矩阵和值矩阵;
对所述键矩阵和所述值矩阵进行小波变换处理,获得第一参考键矩阵和第一参考值矩阵,对所述键矩阵和值矩阵进行反向小波变换处理,获得第二参考键矩阵和第二参考值矩阵;
根据所述第一参考键矩阵和所述查询矩阵进行多头注意力计算,获得第一多头注意力矩阵;
根据所述第一多头注意力矩阵和所述第一参考值矩阵进行多头注意力计算,获得第二多头注意力矩阵;
融合所述第二参考键矩阵、所述第二参考值矩阵和所述第二多头注意力矩阵,获得第一子层矩阵。
参见图7,图7示出了本说明书一实施例提供的基于小波变换自注意力层的特征处理示意图。
待处理子图像特征矩阵进行线性转换之后,获得键矩阵(WK)、查询矩阵(WQ)和值矩阵(WV),对键矩阵(WK)和查询矩阵(WQ)进行离散小波变换和融合处理,获得各自对应的第一参考键矩阵和第一参考值矩阵。
对第一参考键矩阵和第一参考值矩阵进行反向小波变换处理,获得对应的第二参考键矩阵和第二参考值矩阵。
将第一参考键矩阵和查询矩阵进行一次多头注意力计算,获得第一多头注意力矩阵;将第一多头注意力矩阵和第一参考值矩阵进行一次多头注意力计算,获得第二多头注意力矩阵。
再对第二参考键矩阵、第二参考值矩阵和第二多头注意力矩阵进行融合,获得基于小波变换自注意力层输出的第一子层矩阵。
在获得第一子层矩阵之后,将其输入至前馈神经网络层进行处理,最终获得前馈神经网络层输出的子图像特征矩阵。
至此,一个编码层的处理操作已经完成,对于编码器中的任一个编码层均执行上述的操作,在此不再赘述。
S2086、将所述子图像编码矩阵输入至所述解码器,获得子图像解码矩阵。
解码器的作用是根据编码器的输出特征矩阵和解码器输出的上一次预测的结果,输出序列的下一个结果。在本说明书实施例中,解码器中包括多个顺次连接的解码层,每个解码层接收编码器输出的子图像编码矩阵和上一个编码层的输出结果进行计算,并获得当前解码层的输出。
最后一个解码层的输出作为解码器的输出,从而获得解码器输出的子图像解码矩阵。
S2088、将所述子图像解码矩阵输入至所述输出层,获得所述待输入子图像对应的图像分割子结果。
将子图像解码矩阵输入至输出层,在输出层做归一化处理,获得每个待输入子图像对应的图像分割子结果,具体的,是会输出每个待输入子图像对应的子图像,在子图像中会用预设的颜色将待输入子图像中的识别部分进行区分。从而获得待输入子图像对应的图像分割子结果。
步骤210:根据所述图像特征矩阵和每个图像分割子结果生成所述待分割图像对应的图像分割结果。
每个图像识别模型的输入是某个图片类型的多个待分割子图像,输出是每个待分割子图像对应的图像分割子结果,因此,经过图像识别模型的处理,可以获得每个待分割子图像对应的图像分割子结果,此时,只需要将多个图像分割子结果进行拼接,即可获得待分割图像对应的图像分割结果。
具体的,根据所述图像特征矩阵和每个图像分割子结果生成所述待分割图像对应的图像分割结果,包括:
根据所述图像特征矩阵确定每个图像分割子结果对应的位置信息;
根据每个图像分割子结果对应的位置信息,拼接每个图像分割子结果,生成目标图像,其中,所述目标图像中包括所述待分割图像对应的图像分割结果。
在实际应用中,在图像识别模型对待分割子图像进行处理的过程中,将每个待分割子图像的位置信息打乱,无法复原,此时可以根据图像特征矩阵来确定每个图像分割子结果对应的位置信息,换句话说,图像特征矩阵为还原图像分割结果提供了位置参考。
在确定了每个图像分割子结果对应的位置信息之后,根据位置信息拼接每个图像分割子结果,从而生成目标图像,具体的,目标图像为待分割图像对应的图像分割结果。参见图8,图8示出了本说明书一实施例提供的待分割图像和图像分割结果的示意图。如图8所示,图中左侧部分为待分割图像,右侧部分为经过本说明书提供的图像分割方法处理后,获得的图像分割结果。
在本说明书提供的另一具体实施方式中,所述方法还包括:
将所述目标图像输入至图像降采样处理模型做二次降采样处理,获得所述目标图像对应的第二图像特征矩阵,其中,所述二次降采样的尺度小于所述降采样的尺度;
根据所述第二图像特征矩阵将所述目标图像切分为第二预设数量的目标子图像组,其中,每个目标子图像组包括至少两个目标子图像;
将每个目标子图像组分别输入至对应的图像识别模型,获得每个图像识别模型输出的图像分割子结果;
根据所述第二图像特征矩阵和每个图像分割子结果获得所述目标图像对应的图像分割结果。
在实际应用中,为了获得更好的图像分割效果,可以对待处理图像进行至少两次的图像分割处理,即可以对获取到的目标图像再次经过图像降采样处理模型进行二次降采样处理,获得第二图像特征矩阵,需要注意的是,这里的二次降采样的尺度与第一次的降采样尺度不同,如果第一次的降采样尺度为8*8,则二次降采样的尺度可以为4*4。
再根据第二次的降采样尺度对目标图像进行切分、分组,并输入至各自对应的图像识别模型中进行处理,获得每个图像识别模型输出的图像分割子结果,再将每个图像分割子结果进行拼接,获得最终的图像分割结果。
第二次图像分割处理的处理流程与第一次图像分割处理的处理流程相似,具体的操作步骤参见上述的步骤描述,在此不再赘述。
通过本说明书实施例的处理方法,通过双支网络处理待分割图像,一支网络通过全局降采样,提取待分割图像的图像特征,一支网络将待分割图像进行切换、分组的处理,获得多个待分割子图像组,并分别将待分割子图像组输入至多个基于小波变换图像识别模型中进行处理,在处理过程中,两支网络的信息交互,并最终根据两支网络的信息进行融合,获得最终的图像分割结果。通过将待分割子图像组输入至对应的基于小波变换图像识别模型中并行处理,降低了网络执行时间,通过两支网络的信息交互,保证了较好的图像分割性能。
下述结合附图9,以本说明书提供的基于小波变换的图像分割方法在超分辨率图像分割场景的应用为例,对所述基于小波变换的图像分割方法进行进一步说明。其中,图9示出了本说明书一个实施例提供的一种基于小波变换的图像分割方法的处理过程示意图。
如图9所示,对于超高分辨率的待分割图像,分为上下两支网络分别处理,并在处理过程中进行信息交互。
在第一支网络中,先根据8*8的分割尺寸,将待分割图像分为64个待分割子图像,同时在第二支网络中,通过离散小波变换,将待分割图像切分为4个子图像,再通过残差网络1对4个子图像进行特征提取,获得待分割子图像对应的8*8初始图像特征矩阵,在初始图像特征矩阵中有0-7共计8个图片分类,根据0-7的图片分类将64个待分割子图像分为8个待分割子图像组,将8个待分割子图像组分别输入至基于小波变换图像识别模型中进行处理。获得每个图像识别模型输出的图像子分割结果。
在第二支网络中对初始特征矩阵进行离散小波变换和残差网络的特征提取,获得待分割图像对应的图像特征矩阵,将图像特征矩阵的位置信息提供给第一支网络,第一支网络根据图像特征矩阵的位置信息对每个图像子分割结果进行恢复,获得目标图像,目标图像中包括第一次图像分割结果。
为了更好的获得图像分割效果,对目标图像进行第二次图像分割,在第二次处理过程中,根据4*4的尺寸,将目标图像分为16个待分割子图像。同时在第二支网络中,通过离散小波变换,将目标图像切分为4个子图像,再通过残差网络3对4个子图像进行特征提取,获得目标图像对应的4*4的初始图像特征矩阵,在初始图像特征矩阵中有0-3共计4个图片分类,根据0-3的图片分类将16个待分割子图像分为4个待分割子图像组,将4个待分割子图像组分别输入至基于小波变换图像识别模型中进行处理。获得每个图像识别模型输出的图像子分割结果。
在第二支网络中,对4*4的初始图像特征矩阵输入至残差网络4中进行特征提取,获得图像特征矩阵,并将图像特征矩阵的位置信息提供给第一支网络,第一支网络根据图像特征矩阵的位置信息对每个图像子分割结果进行恢复,获得第一支网络输出的初始分割图像。同时在第二支网络中,对图像特征矩阵进行空间金字塔池化,并进行与离散小波变换数量相同数量的反向小波变换处理,获得第二支网络输出的初始特征信息。
最终根据初始分割图像和初始特征进行融合,获得待分割图像对应的最终图像分割结果。
通过本说明书实施例的处理方法,通过双支网络处理待分割图像,一支网络通过全局降采样,提取待分割图像的图像特征,一支网络将待分割图像进行切换、分组的处理,获得多个待分割子图像组,并分别将待分割子图像组输入至多个基于小波变换图像识别模型中进行处理,在处理过程中,两支网络的信息交互,并最终根据两支网络的信息进行融合,获得最终的图像分割结果。通过将待分割子图像组输入至对应的基于小波变换图像识别模型中并行处理,降低了网络执行时间,通过两支网络的信息交互,保证了较好的图像分割性能。
与上述方法实施例相对应,本说明书还提供了基于小波变换的图像分割装置实施例,图10示出了本说明书一个实施例提供的一种基于小波变换的图像分割装置的结构示意图。如图10所示,该装置包括:
获取模块1002,被配置为获得待分割图像;
特征提取模块1004,被配置为将所述待分割图像输入至图像降采样处理模型做降采样处理,获得所述待分割图像对应的图像特征矩阵;
分割模块1006,被配置为根据所述图像特征矩阵将所述待分割图像切分为预设数量的待分割子图像组,其中,每个待分割子图像组包括至少两个待分割子图像;
识别模块1008,被配置为将每个待分割子图像组分别输入至对应的图像识别模型,获得每个图像识别模型输出的图像分割子结果,其中,所述图像识别模型为基于小波变换的神经网络模型;
生成模块1010,被配置为根据所述图像特征矩阵和每个图像分割子结果生成所述待分割图像对应的图像分割结果。
可选的,所述分割模块1006,进一步被配置为:
获取所述图像特征矩阵的矩阵尺寸信息和矩阵特征值;
根据所述矩阵尺寸信息将所述待分割图像切分为多个待分割子图像;
根据矩阵特征值将多个待分割子图像分为预设数量的待分割子图像组。
可选的,所述识别模块1008,进一步被配置为:
在每个待分割子图像组中确定目标待分割子图像组,并确定所述目标待分割子图像组对应的目标图像识别模型;
将所述目标待分割子图像组中的待分割子图像拼接生成待输入子图像;
将所述待输入子图像输入至所述目标图像识别模型。
可选的,图像识别模型包括小波变换嵌入层、编码器、解码器和输出层;
所述识别模块1008,进一步被配置为:
将所述待输入子图像输入至所述小波变换嵌入层,获得子图像待编码矩阵;
将所述子图像待编码矩阵输入至所述编码器,获得子图像编码矩阵;
将所述子图像编码矩阵输入至所述解码器,获得子图像解码矩阵;
将所述子图像解码矩阵输入至所述输出层,获得所述待输入子图像对应的图像分割子结果。
可选的,所述小波变换嵌入层包括卷积子层、小波变换子层、融合子层;
所述识别模块1008,进一步被配置为:
将所述待输入子图像输入至所述卷积子层进行特征提取,获得第一特征矩阵;
将所述第一特征矩阵输入至所述小波变换子层做降采样处理,获得第二特征矩阵集合其中,所述第二特征矩阵集合中包括每个待分割子图像对应的第二特征矩阵;
将所述第二特征矩阵集合输入至所述融合子层进行特征融合,获得子图像待编码矩阵。
可选的,所述编码器包括n个顺次连接的编码层,每个编码层包括基于小波变换自注意力层和前馈神经网络层,其中,n为大于等于2的正整数;
所述识别模块1008,进一步被配置为:
对于任一编码层,包括:
接收待处理子图像特征矩阵;
将所述待处理子图像特征矩阵输入至基于小波变换自注意力层,获得第一子层矩阵;
将所述第一子层矩阵输入至前馈神经网络层,获得子图像特征矩阵。
可选的,所述识别模块1008,进一步被配置为:
对于第1个编码层,接收待处理子图像特征矩阵,包括:接收所述子图像待编码矩阵;
对于除第1个编码层的其他编码层,接收待处理子图像特征矩阵,包括:接收上一个编码层输出的子图像特征矩阵。
可选的,所述识别模块1008,进一步被配置为:
对所述待处理子图像特征矩阵进行线性转换得到键矩阵、查询矩阵和值矩阵;
对所述键矩阵和所述值矩阵进行小波变换处理,获得第一参考键矩阵和第一参考值矩阵,对所述键矩阵和值矩阵进行反向小波变换处理,获得第二参考键矩阵和第二参考值矩阵;
根据所述第一参考键矩阵和所述查询矩阵进行多头注意力计算,获得第一多头注意力矩阵;
根据所述第一多头注意力矩阵和所述第一参考值矩阵进行多头注意力计算,获得第二多头注意力矩阵;
融合所述第二参考键矩阵、所述第二参考值矩阵和所述第二多头注意力矩阵,获得第一子层矩阵。
可选的,所述生成模块1010,进一步被配置为:
根据所述图像特征矩阵确定每个图像分割子结果对应的位置信息;
根据每个图像分割子结果对应的位置信息,拼接每个图像分割子结果,生成目标图像,其中,所述目标图像中包括所述待分割图像对应的图像分割结果。
可选的,所述装置还包括二次处理模块,被配置为:
将所述目标图像输入至图像降采样处理模型做二次降采样处理,获得所述目标图像对应的第二图像特征矩阵,其中,所述二次降采样的尺度小于所述降采样的尺度;
根据所述第二图像特征矩阵将所述目标图像切分为第二预设数量的目标子图像组,其中,每个目标子图像组包括至少两个目标子图像;
将每个目标子图像组分别输入至对应的图像识别模型,获得每个图像识别模型输出的图像分割子结果;
根据所述第二图像特征矩阵和每个图像分割子结果获得所述目标图像对应的图像分割结果。
通过本说明书实施例的处理装置,通过双支网络处理待分割图像,一支网络通过全局降采样,提取待分割图像的图像特征,一支网络将待分割图像进行切换、分组的处理,获得多个待分割子图像组,并分别将待分割子图像组输入至多个基于小波变换图像识别模型中进行处理,在处理过程中,两支网络的信息交互,并最终根据两支网络的信息进行融合,获得最终的图像分割结果。通过将待分割子图像组输入至对应的基于小波变换图像识别模型中并行处理,降低了网络执行时间,通过两支网络的信息交互,保证了较好的图像分割性能。
上述为本实施例的一种基于小波变换的图像分割装置的示意性方案。需要说明的是,该基于小波变换的图像分割装置的技术方案与上述的基于小波变换的图像分割方法的技术方案属于同一构思,基于小波变换的图像分割装置的技术方案未详细描述的细节内容,均可以参见上述基于小波变换的图像分割方法的技术方案的描述。
图11示出了根据本说明书一个实施例提供的一种计算设备1100的结构框图。该计算设备1100的部件包括但不限于存储器1110和处理器1120。处理器1120与存储器1110通过总线1130相连接,数据库1150用于保存数据。
计算设备1100还包括接入设备1140,接入设备1140使得计算设备1100能够经由一个或多个网络1160通信。这些网络的示例包括公用交换电话网(PSTN,Public SwitchedTelephone Network)、局域网(LAN,Local Area Network)、广域网(WAN,Wide AreaNetwork)、个域网(PAN,Personal Area Network)或诸如因特网的通信网络的组合。接入设备1140可以包括有线或无线的任何类型的网络接口(例如,网络接口卡(NIC,networkinterface controller))中的一个或多个,诸如IEEE802.11无线局域网(WLAN,WirelessLocal Area Network)无线接口、全球微波互联接入(Wi-MAX,WorldwideInteroperability for Microwave Access)接口、以太网接口、通用串行总线(USB,Universal Serial Bus)接口、蜂窝网络接口、蓝牙接口、近场通信(NFC,Near FieldCommunication)。
在本说明书的一个实施例中,计算设备1100的上述部件以及图11中未示出的其他部件也可以彼此相连接,例如通过总线。应当理解,图11所示的计算设备结构框图仅仅是出于示例的目的,而不是对本说明书范围的限制。本领域技术人员可以根据需要,增添或替换其他部件。
计算设备1000可以是任何类型的静止或移动计算设备,包括移动计算机或移动计算设备(例如,平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如,智能手机)、可佩戴的计算设备(例如,智能手表、智能眼镜等)或其他类型的移动设备,或者诸如台式计算机或个人计算机(PC,Personal Computer)的静止计算设备。计算设备1100还可以是移动式或静止式的服务器、云端服务器。
其中,处理器1120用于执行如下计算机可执行指令,该计算机可执行指令被处理器执行时实现上述数据处理方法的步骤。上述为本实施例的一种计算设备的示意性方案。需要说明的是,该计算设备的技术方案与上述的基于小波变换的图像分割方法的技术方案属于同一构思,计算设备的技术方案未详细描述的细节内容,均可以参见上述基于小波变换的图像分割方法的技术方案的描述。
本说明书一实施例还提供一种计算机可读存储介质,其存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现上述基于小波变换的图像分割方法的步骤。
上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是,该存储介质的技术方案与上述的基于小波变换的图像分割方法的技术方案属于同一构思,存储介质的技术方案未详细描述的细节内容,均可以参见上述基于小波变换的图像分割方法的技术方案的描述。
本说明书一实施例还提供一种计算机程序,其中,当所述计算机程序在计算机中执行时,令计算机执行上述基于小波变换的图像分割方法的步骤。
上述为本实施例的一种计算机程序的示意性方案。需要说明的是,该计算机程序的技术方案与上述的基于小波变换的图像分割方法的技术方案属于同一构思,计算机程序的技术方案未详细描述的细节内容,均可以参见上述基于小波变换的图像分割方法的技术方案的描述。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
所述计算机指令包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本说明书实施例并不受所描述的动作顺序的限制,因为依据本说明书实施例,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本说明书实施例所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
以上公开的本说明书优选实施例只是用于帮助阐述本说明书。可选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书实施例的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本说明书实施例的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本说明书。本说明书仅受权利要求书及其全部范围和等效物的限制。

Claims (13)

1.一种基于小波变换的图像分割方法,包括:
获取待分割图像;
将所述待分割图像输入至图像降采样处理模型做降采样处理,获得所述待分割图像对应的图像特征矩阵;
根据所述图像特征矩阵将所述待分割图像切分为预设数量的待分割子图像组,其中,每个待分割子图像组包括至少两个待分割子图像;
将每个待分割子图像组分别输入至对应的图像识别模型,获得每个图像识别模型输出的图像分割子结果,其中,所述图像识别模型为基于小波变换的神经网络模型;
根据所述图像特征矩阵和每个图像分割子结果生成所述待分割图像对应的图像分割结果。
2.如权利要求1所述的方法,根据所述图像特征矩阵将所述待分割图像切分为预设数量的待分割子图像组,包括:
获取所述图像特征矩阵的矩阵尺寸信息和矩阵特征值;
根据所述矩阵尺寸信息将所述待分割图像切分为多个待分割子图像;
根据矩阵特征值将多个待分割子图像分为预设数量的待分割子图像组。
3.如权利要求1所述的方法,将每个待分割子图像组分别输入至对应的图像识别模型,包括:
在每个待分割子图像组中确定目标待分割子图像组,并确定所述目标待分割子图像组对应的目标图像识别模型;
将所述目标待分割子图像组中的待分割子图像拼接生成待输入子图像;
将所述待输入子图像输入至所述目标图像识别模型。
4.如权利要求3所述的方法,图像识别模型包括小波变换嵌入层、编码器、解码器和输出层;
获得每个图像识别模型输出的图像分割子结果,包括:
将所述待输入子图像输入至所述小波变换嵌入层,获得子图像待编码矩阵;
将所述子图像待编码矩阵输入至所述编码器,获得子图像编码矩阵;
将所述子图像编码矩阵输入至所述解码器,获得子图像解码矩阵;
将所述子图像解码矩阵输入至所述输出层,获得所述待输入子图像对应的图像分割子结果。
5.如权利要求4所述的方法,所述小波变换嵌入层包括卷积子层、小波变换子层、融合子层;
将所述待输入子图像输入至所述小波变换嵌入层,获得子图像待编码矩阵,包括:
将所述待输入子图像输入至所述卷积子层进行特征提取,获得第一特征矩阵;
将所述第一特征矩阵输入至所述小波变换子层做降采样处理,获得第二特征矩阵集合,其中,所述第二特征矩阵集合中包括每个待分割子图像对应的第二特征矩阵;
将所述第二特征矩阵集合输入至所述融合子层进行特征融合,获得子图像待编码矩阵。
6.如权利要求4所述的方法,所述编码器包括n个顺次连接的编码层,每个编码层包括基于小波变换自注意力层和前馈神经网络层,其中,n为大于等于2的正整数;
对于任一编码层,包括:
接收待处理子图像特征矩阵;
将所述待处理子图像特征矩阵输入至基于小波变换自注意力层,获得第一子层矩阵;
将所述第一子层矩阵输入至前馈神经网络层,获得子图像特征矩阵。
7.如权利要求6所述的方法,
对于第1个编码层,接收待处理子图像特征矩阵,包括:接收所述子图像待编码矩阵;
对于除第1个编码层的其他编码层,接收待处理子图像特征矩阵,包括:接收上一个编码层输出的子图像特征矩阵。
8.如权利要求6所述的方法,将所述待处理子图像特征矩阵输入至基于小波变换自注意力层,获得第一子层矩阵,包括:
对所述待处理子图像特征矩阵进行线性转换得到键矩阵、查询矩阵和值矩阵;
对所述键矩阵和所述值矩阵进行小波变换处理,获得第一参考键矩阵和第一参考值矩阵,对所述键矩阵和值矩阵进行反向小波变换处理,获得第二参考键矩阵和第二参考值矩阵;
根据所述第一参考键矩阵和所述查询矩阵进行多头注意力计算,获得第一多头注意力矩阵;
根据所述第一多头注意力矩阵和所述第一参考值矩阵进行多头注意力计算,获得第二多头注意力矩阵;
融合所述第二参考键矩阵、所述第二参考值矩阵和所述第二多头注意力矩阵,获得第一子层矩阵。
9.如权利要求1所述的方法,根据所述图像特征矩阵和每个图像分割子结果生成所述待分割图像对应的图像分割结果,包括:
根据所述图像特征矩阵确定每个图像分割子结果对应的位置信息;
根据每个图像分割子结果对应的位置信息,拼接每个图像分割子结果,生成目标图像,其中,所述目标图像中包括所述待分割图像对应的图像分割结果。
10.如权利要求9所述的方法,所述方法还包括:
将所述目标图像输入至图像降采样处理模型做二次降采样处理,获得所述目标图像对应的第二图像特征矩阵,其中,所述二次降采样的尺度小于所述降采样的尺度;
根据所述第二图像特征矩阵将所述目标图像切分为第二预设数量的目标子图像组,其中,每个目标子图像组包括至少两个目标子图像;
将每个目标子图像组分别输入至对应的图像识别模型,获得每个图像识别模型输出的图像分割子结果;
根据所述第二图像特征矩阵和每个图像分割子结果获得所述目标图像对应的图像分割结果。
11.一种基于小波变换的图像分割装置,包括:
获取模块,被配置为获得待分割图像;
特征提取模块,被配置为将所述待分割图像输入至图像降采样处理模型做降采样处理,获得所述待分割图像对应的图像特征矩阵;
分割模块,被配置为根据所述图像特征矩阵将所述待分割图像切分为预设数量的待分割子图像组,其中,每个待分割子图像组包括至少两个待分割子图像;
识别模块,被配置为将每个待分割子图像组分别输入至对应的图像识别模型,获得每个图像识别模型输出的图像分割子结果,其中,所述图像识别模型为基于小波变换的神经网络模型;
生成模块,被配置为根据所述图像特征矩阵和每个图像分割子结果生成所述待分割图像对应的图像分割结果。
12.一种计算设备,包括:
存储器和处理器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,该计算机可执行指令被处理器执行时实现权利要求1-10任意一项所述方法的步骤。
13.一种计算机可读存储介质,其存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现权利要求1-10任意一项所述方法的步骤。
CN202211482148.4A 2022-11-24 2022-11-24 基于小波变换的图像分割方法及装置 Active CN115546236B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211482148.4A CN115546236B (zh) 2022-11-24 2022-11-24 基于小波变换的图像分割方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211482148.4A CN115546236B (zh) 2022-11-24 2022-11-24 基于小波变换的图像分割方法及装置

Publications (2)

Publication Number Publication Date
CN115546236A true CN115546236A (zh) 2022-12-30
CN115546236B CN115546236B (zh) 2023-04-07

Family

ID=84720243

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211482148.4A Active CN115546236B (zh) 2022-11-24 2022-11-24 基于小波变换的图像分割方法及装置

Country Status (1)

Country Link
CN (1) CN115546236B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116342884A (zh) * 2023-03-28 2023-06-27 阿里云计算有限公司 图像分割及模型训练的方法、服务器

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001275119A (ja) * 2000-03-28 2001-10-05 Canon Inc 画像処理装置及びその方法、コンピュータ可読メモリ
CN1928886A (zh) * 2006-06-27 2007-03-14 电子科技大学 基于图像分割和二维小波变换的虹膜识别方法
US20080095473A1 (en) * 2006-10-20 2008-04-24 Samsung Electronics Co.; Ltd Wavelet transformation-based image encoder, decoder and method for generating thumbnail image
US20110069897A1 (en) * 2009-09-24 2011-03-24 Sony Corporation Image processing device and method
CN111126258A (zh) * 2019-12-23 2020-05-08 深圳市华尊科技股份有限公司 图像识别方法及相关装置
WO2022105125A1 (zh) * 2020-11-17 2022-05-27 平安科技(深圳)有限公司 图像分割方法、装置、计算机设备及存储介质
CN114724019A (zh) * 2022-03-31 2022-07-08 湘潭大学 一种基于小波变换和可分离卷积语义分割的遥感图像海冰智能监测方法
CN114792370A (zh) * 2022-03-17 2022-07-26 上海长征医院 一种全肺图像分割方法、装置、电子设备及存储介质
CN114842216A (zh) * 2022-04-28 2022-08-02 贵州大学 一种基于小波变换的室内rgb-d图像语义分割方法
CN114943721A (zh) * 2022-06-07 2022-08-26 哈尔滨理工大学 一种建立基于改进U-Net网络的颈部超声图像分割方法
CN114972897A (zh) * 2022-06-06 2022-08-30 京东科技控股股份有限公司 图像特征处理方法、装置、产品、介质及设备

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001275119A (ja) * 2000-03-28 2001-10-05 Canon Inc 画像処理装置及びその方法、コンピュータ可読メモリ
CN1928886A (zh) * 2006-06-27 2007-03-14 电子科技大学 基于图像分割和二维小波变换的虹膜识别方法
US20080095473A1 (en) * 2006-10-20 2008-04-24 Samsung Electronics Co.; Ltd Wavelet transformation-based image encoder, decoder and method for generating thumbnail image
US8045824B2 (en) * 2006-10-20 2011-10-25 Samsung Electronics Co., Ltd. Wavelet transformation-based image encoder, decoder and method for generating thumbnail image
US20110069897A1 (en) * 2009-09-24 2011-03-24 Sony Corporation Image processing device and method
CN111126258A (zh) * 2019-12-23 2020-05-08 深圳市华尊科技股份有限公司 图像识别方法及相关装置
WO2022105125A1 (zh) * 2020-11-17 2022-05-27 平安科技(深圳)有限公司 图像分割方法、装置、计算机设备及存储介质
CN114792370A (zh) * 2022-03-17 2022-07-26 上海长征医院 一种全肺图像分割方法、装置、电子设备及存储介质
CN114724019A (zh) * 2022-03-31 2022-07-08 湘潭大学 一种基于小波变换和可分离卷积语义分割的遥感图像海冰智能监测方法
CN114842216A (zh) * 2022-04-28 2022-08-02 贵州大学 一种基于小波变换的室内rgb-d图像语义分割方法
CN114972897A (zh) * 2022-06-06 2022-08-30 京东科技控股股份有限公司 图像特征处理方法、装置、产品、介质及设备
CN114943721A (zh) * 2022-06-07 2022-08-26 哈尔滨理工大学 一种建立基于改进U-Net网络的颈部超声图像分割方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
SAJAD RANJBAR ET AL: "An image-based system for pavement crack evaluation using transfer learning and wavelet transform", 《INTERNATIONAL JOURNAL OF PAVEMENT RESEARCH AND TECHNOLOGY》 *
刘海: "基于Contourlet变换的图像智能分割方法研究", 《计算机测量与控制》 *
张林耀等: "基于孪生网络目标工件精确分割跟踪方法研究", 《国外电子测量技术》 *
李景兰等: "基于聚类和小波变换的彩色图像分割方法", 《现代电子技术》 *
黄兴滨等: "基于小波变换的纹理图像分割", 《自动化技术与应用》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116342884A (zh) * 2023-03-28 2023-06-27 阿里云计算有限公司 图像分割及模型训练的方法、服务器
CN116342884B (zh) * 2023-03-28 2024-02-06 阿里云计算有限公司 图像分割及模型训练的方法、服务器

Also Published As

Publication number Publication date
CN115546236B (zh) 2023-04-07

Similar Documents

Publication Publication Date Title
CN110225341B (zh) 一种任务驱动的码流结构化图像编码方法
US20140254936A1 (en) Local feature based image compression
KR102299958B1 (ko) 다수의 상이한 비트레이트로 영상 압축을 하기 위한 시스템들 및 방법들
WO2021050007A1 (en) Network-based visual analysis
Lu et al. Learning a deep vector quantization network for image compression
CN114926338A (zh) 模型训练方法及装置、电子设备和存储介质
CN110321962B (zh) 一种数据处理方法及装置
CN113205449A (zh) 表情迁移模型的训练方法及装置、表情迁移方法及装置
Zhang et al. Msfc: Deep feature compression in multi-task network
CN115546236B (zh) 基于小波变换的图像分割方法及装置
CN114648535A (zh) 一种基于动态transformer的食品图像分割方法及系统
CN116978011A (zh) 一种用于智能目标识别的图像语义通信方法及系统
CN116547969A (zh) 基于机器学习的图像译码中色度子采样格式的处理方法
Joy et al. Modelling of depth prediction algorithm for intra prediction complexity reduction
CN116508320A (zh) 基于机器学习的图像译码中的色度子采样格式处理方法
WO2023203509A1 (en) Image data compression method and device using segmentation and classification
CN116468947A (zh) 刀具图像识别方法、装置、计算机设备及存储介质
TW202318265A (zh) 基於注意力的圖像和視訊壓縮上下文建模
CN112200275B (zh) 人工神经网络的量化方法及装置
CN115239563A (zh) 一种基于神经网络的点云属性有损压缩装置及方法
CN115147317A (zh) 一种基于卷积神经网络的点云颜色质量增强方法及系统
CN113518229B (zh) 环路滤波网络的训练方法、装置、计算机设备和存储介质
Ren The advance of generative model and variational autoencoder
CN115760871A (zh) 基于随机游走核自注意力机制的图像处理方法及装置
KR20210038027A (ko) 신경망 압축 훈련 방법 및 압축된 신경망을 이용하는 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant