CN110287969A - 基于图残差注意力网络的摩尔文本图像二值化系统 - Google Patents
基于图残差注意力网络的摩尔文本图像二值化系统 Download PDFInfo
- Publication number
- CN110287969A CN110287969A CN201910514286.8A CN201910514286A CN110287969A CN 110287969 A CN110287969 A CN 110287969A CN 201910514286 A CN201910514286 A CN 201910514286A CN 110287969 A CN110287969 A CN 110287969A
- Authority
- CN
- China
- Prior art keywords
- module
- feature
- output
- power module
- channel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/28—Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Image Processing (AREA)
- Image Analysis (AREA)
Abstract
本发明公开一种基于图残差注意力网络的摩尔文本图像二值化系统,首先利用多尺度卷积神经网络提取不同分辨率的特征,分别去除不同分辨率特征中的摩尔纹图案并保留文本图像中内容信息,避免梯度消失;再通过三重注意力模块利用通道信息和空间信息以及各分支之间的关系,引导网络关注特征中的目标区域,进一步去除摩尔纹图案;所设置的图像二值化模块利用多个顺次连接的生成自适应局部阈值的卷积层和促进二值化的参数化层,能准确地将去除摩尔纹文本图像进行二值化;可以充分去除不同频带范围和通道上的摩尔纹、提高图像二值化精度。
Description
技术领域
本发明涉及计算机视觉技术领域,具体涉及一种训练简单、性能鲁棒的基于图残差注意力网络的摩尔文本图像二值化系统。
背景技术
文本图像二值化是大多数文本分析任务(如文本内容识别,光字符识别)的基础和关键步骤,其本质上是给文本图像的目标文字和背景分配不同的二进制值。很多情况下人们需要利用相机等设备记录电子屏幕上的文档,而摩尔纹的出现给这类文本图像的二值化带来了新的挑战。目前,深度学习的兴起分别给图像二值化和去除摩尔纹问题带来了突破,大幅度地提升了图像二值化系统和去摩尔纹系统的性能。但是目前深度学习网络在去摩尔纹的同时,可能会丢失部分内容信息,并且由于未考虑各尺度分支之间的联系使得去摩尔纹不彻底;同时现有二值化网络并不适用处理带有摩尔纹文本的图像,尤其是难以处理有大规模摩尔纹的图像。迄今为止,并没有专门用于摩尔文本图像二值化的系统。
发明内容
本发明是为了解决现有技术所存在的上述技术问题,提供一种训练简单、性能鲁棒的基于图残差注意力网络的摩尔文本图像二值化系统。
本发明的技术解决方案是:一种基于图残差注意力网络的摩尔文本图像二值化系统,其特征在于:由去摩尔纹模块和图像二值化模块相接而成且将去摩尔纹模块的输出特征与图像二值化模块的输出特征相减,所述去摩尔纹模块由相互连接的多尺度卷积残差模块和三重注意力模块构成,所述图像二值化模块包括多个顺次连接的生成自适应局部阈值的卷积层、非线性激活函数层和参数化层;
所述多尺度卷积残差模块包括5个并列的分辨率分支,每个分辨率分支由依次连接的下采样层、残差模块和上采样层构成;所述下采样层是卷积核为3×3、步长为2、通道为64或32的卷积层;所述残差模块由6个级联的子残差块构成,每个子残差块包括两层卷积核为3×3、步长为1、通道为64的卷积层、参数归一化层和非线性激活函数层,每个子残差块输入特征与输出特征进行融合;所述上采样层为卷积核为4×4、步长为2、通道分别为64或者32的反卷积层和卷积核为3×3、步长为1、通道为1的卷积层;
所述三重注意力模块设有5个通道注意力模块和5个空间注意力模块,每个通道注意力模块依次通过相对应的空间注意力模块与图残差注意力模块相接;
所述通道注意力模块包括最大池化、平均池化、共享多层感知网络和非线性激活,按照公式(1)获取通道注意力模块的输出特征:
其中,Fi(i=1,2,...,5)表示第i个分辨率分支的上采样层输出特征,Fi'(i=1,2,...,5)表示第i个通道注意力模块的输出特征,Fi平均表示第i个分辨率分支的上采样层输出特征经平均池化后的输出特征,Fi最大表示第i个分辨率分支的上采样层输出特征经最大池化后的输出特征,W0,W1表示共享多层感知网络的两个权重矩阵,σ(·)表示非线性激活函数操作,表示矩阵相乘操作;
所述每个空间注意力模块包括最大池化、平均池化、7×7卷积层和非线性激活层,按照式(2)获取第i个空间注意力模块的输出特征,
其中,Fi'(i=1,2,...,5)表示第i个通道注意力模块的输出特征,Fi”(i=1,2,...,5)表示第i个空间注意力模块的输出特征,F'i平均表示第i个通道注意力模块的输出特征经平均池化后的输出特征,F'i最大表示第i个通道注意力模块的输出特征经过最大池化后的输出特征,f7×7(·)表示对F'i平均和F'i最大进行通道上级联并经过7×7卷积,σ(·)表示非线性激活函数操作,表示矩阵相乘操作;
所述图残差注意力模块按照式(3)获取输出特征,
Fi输出=R([softmax(D·DT)·D]i+Ni) (3)
其中,Ni表示第i个空间注意力模块输出特征向量化后的向量,即节点i,Fi输出表示图残差注意力模块第i个分支的输出特征,D和DT分别表示Ni级联得到的融合矩阵以及其矩阵转置,D和DT经过softmax计算权重再与D相乘得到更新矩阵,[·]i表示将更新矩阵拆分为各个分支的输出向量,即输出节点i,Ni与[·]i通过跳跃连接进行特征融合,R(·)i表示将特征融合结果进行矩阵化操作;
所述去摩尔纹模块和图像二值化模块在训练阶段同时进行训练,损失函数如下所示:
L总=L去摩+L二值
其中,L去摩为去摩尔纹模块对应的损失函数,L二值为图像二值化模块对应的损失函数;
其中,表示L2范数的平方,Xd为去摩尔纹模块的输出图像,Xc是与Xd对应的原始干净的文本图像;
其中,Y是图像二值化模块的输出图像,Xb是与Y对应的原始二值文本图像。
本发明采用深度卷积神经网络,首先利用多尺度卷积神经网络提取不同分辨率的特征,分别去除不同分辨率特征中的摩尔纹图案并保留文本图像中内容信息,避免梯度消失;再通过三重注意力模块利用通道信息和空间信息以及各分支之间的关系,引导网络关注特征中的目标区域,进一步去除摩尔纹图案;所设置的图像二值化模块利用多个顺次连接的生成自适应局部阈值的卷积层和促进二值化的参数化层,能准确地将去除摩尔纹文本图像进行二值化;可以充分去除不同频带范围和通道上的摩尔纹、提高图像二值化精度。本发明采用模块化设计,各模块之间可以相互独立,方便模型的构建和更新,具有训练简单、性能鲁棒等优点。
附图说明
图1是本发明实施例的结构框图。
图2是本发明实施例三重注意力模块的结构示意图。
图3是本发明实施例图残差注意力模块的结构示意图。
图4是本发明实施例与现有技术对比的实验效果图。
具体实施方式
本发明的一种基于图残差注意力网络的摩尔文本图像二值化系统如图1所示,由去摩尔纹模块和图像二值化模块相接而成且将去摩尔纹模块的输出特征与图像二值化模块的输出特征相减,去摩尔纹模块由相互连接的多尺度卷积残差模块和三重注意力模块构成,图像二值化模块包括多个顺次连接的生成自适应局部阈值的卷积层、非线性激活函数层和参数化层;
所述多尺度卷积残差模块包括5个并列的分辨率分支,每个分辨率分支由依次连接的下采样层、残差模块和上采样层构成;所述下采样层是卷积核为3×3、步长为2、通道为64或32的卷积层,逐次将原始图像的特征下采样为不同分辨率的特征;所述残差模块由6个串联的子残差块构成,每个子残差块包括两层卷积核为3×3、步长为1、通道为64的卷积层、参数归一化层和非线性激活函数层,每个子残差块输入特征与输出特征进行融合,去除下采样层输出的不同分辨率特征中的摩尔纹的同时,保留文本图像中内容信息,避免梯度消失;所述上采样层为卷积核为4×4、步长为2、通道分别为64或者32的反卷积层和卷积核为3×3、步长为1、通道为1的卷积层,将残差模块输出的不同分辨率特征上采样为与本发明输入图像相同的分辨率;
所述三重注意力模块设有5个通道注意力模块和5个空间注意力模块,每个通道注意力模块依次通过相对应的空间注意力模块与图残差注意力模块相接;
所述通道注意力模块如图2所示包括最大池化、平均池化、共享多层感知网络和非线性激活,将上采样层输出特征经过最大池化和平均池化,得到的两个特征通过共享网络后进行特征融合,具体按照公式(1)获取通道注意力模块的输出特征:
其中,Fi(i=1,2,...,5)表示第i个分辨率分支的上采样层输出特征,Fi'(i=1,2,...,5)表示第i个通道注意力模块的输出特征,Fi平均表示第i个分辨率分支的上采样层输出特征经平均池化后的输出特征,Fi最大表示第i个分辨率分支的上采样层输出特征经最大池化后的输出特征,W0,W1表示共享多层感知网络的两个权重矩阵,σ(·)表示非线性激活函数操作,表示矩阵相乘操作;
所述每个空间注意力模块如图2所示包括最大池化、平均池化、7×7卷积层和非线性激活层,将通道注意力模块的输出特征经过最大池化和平均池化,得到的两个特征通过特征提取层获取所述空间注意力模块的输出,具体按照式(2)获取第i个空间注意力模块的输出特征,
其中,Fi'(i=1,2,...,5)表示第i个通道注意力模块的输出特征,Fi”(i=1,2,...,5)表示第i个空间注意力模块的输出特征,F'i平均表示第i个通道注意力模块的输出特征经平均池化后的输出特征,F'i最大表示第i个通道注意力模块的输出特征经过最大池化后的输出特征,f7×7(·)表示对F'i平均和F'i最大进行通道上级联并经过7×7卷积,σ(·)表示非线性激活函数操作,表示矩阵相乘操作;
所述图残差注意力模块如图3所示,输入特征1~5为5个空间注意力模块的输出特征,节点1~5为5个空间注意力模块输出特征向量化后的向量,经过级联得到融合矩阵、矩阵转置、权重计算及更新矩阵,获得处理后的向量,即输出节点1~5,节点1~5分别与输出节点1~5跳跃连接实现特征融合,再将融合结果进行矩阵化操作,得到输出特征1~5,具体按照式(3)获取输出特征,
Fi输出=R([softmax(D·DT)·D]i+Ni) (3)
其中,Ni表示第i个空间注意力模块输出特征向量化后的向量,即节点i,Fi输出表示图残差注意力模块第i各分支的输出特征,D和DT分别表示Ni级联得到的融合矩阵以及其矩阵转置,D和DT经过softmax计算权重再与D相乘得到更新矩阵,[·]i表示将更新矩阵拆分为各个分支的输出向量,即输出节点i,Ni与[·]i通过跳跃连接进行特征融合,R(·)i表示将融合结果进行矩阵化操作;图残差注意力模块利用各分支特征之间的关系,引导关注特征中目标区域并进一步抑制摩尔纹图案,通过跳跃连接避免图像信息丢失,保证内容的完整性;
所述去摩尔纹模块和图像二值化模块在训练阶段同时进行训练,损失函数如下所示:
L总=L去摩+L二值
其中,L去摩为去摩尔纹模块对应的损失函数,L二值为图像二值化模块对应的损失函数;
其中,表示L2范数的平方,Xd为去摩尔纹模块的输出图像,Xc是与Xd对应的原始干净的文本图像;
其中,Y是图像二值化模块的输出图像,Xb是与Y对应的原始二值文本图像。
图4是本发明和其他方法在用相同数据集测试后的实验效果图中,Otsu为传统二值化方法,FCNs是现有的关于深度学习方法。
结果表明:本发明提供的基于图残差注意力网络的摩尔文本二值化系统可以充分挖掘文本和摩尔纹的特征,利用通道和空间信息以及各分支之间的关系,充分的去除摩尔纹图案,精准地实现文本图像二值化,提高二值化图像的视觉效果和定量精度。
Claims (1)
1.一种基于图残差注意力网络的摩尔文本图像二值化系统,其特征在于:由去摩尔纹模块和图像二值化模块相接而成且将去摩尔纹模块的输出特征与图像二值化模块的输出特征相减,所述去摩尔纹模块由相互连接的多尺度卷积残差模块和三重注意力模块构成,所述图像二值化模块包括多个顺次连接的生成自适应局部阈值的卷积层、非线性激活函数层和参数化层;
所述多尺度卷积残差模块包括5个并列的分辨率分支,每个分辨率分支由依次连接的下采样层、残差模块和上采样层构成;所述下采样层是卷积核为3×3、步长为2、通道为64或32的卷积层;所述残差模块由6个级联的子残差块构成,每个子残差块包括两层卷积核为3×3、步长为1、通道为64的卷积层、参数归一化层和非线性激活函数层,每个子残差块输入特征与输出特征进行融合;所述上采样层为卷积核为4×4、步长为2、通道分别为64或者32的反卷积层和卷积核为3×3、步长为1、通道为1的卷积层;
所述三重注意力模块设有5个通道注意力模块和5个空间注意力模块,每个通道注意力模块依次通过相对应的空间注意力模块与图残差注意力模块相接;
所述通道注意力模块包括最大池化、平均池化、共享多层感知网络和非线性激活,按照公式(1)获取通道注意力模块的输出特征:
其中,Fi(i=1,2,...,5)表示第i个分辨率分支的上采样层输出特征,Fi'(i=1,2,...,5)表示第i个通道注意力模块的输出特征,Fi平均表示第i个分辨率分支的上采样层输出特征经平均池化后的输出特征,Fi最大表示第i个分辨率分支的上采样层输出特征经最大池化后的输出特征,W0,W1表示共享多层感知网络的两个权重矩阵,σ(·)表示非线性激活函数操作,表示矩阵相乘操作;
所述空间注意力模块包括最大池化、平均池化、7×7卷积层和非线性激活层,按照式(2)获取第i个空间注意力模块的输出特征,
其中,Fi'(i=1,2,...,5)表示第i个通道注意力模块的输出特征,Fi”(i=1,2,...,5)表示第i个空间注意力模块的输出特征,F'i平均表示第i个通道注意力模块的输出特征经平均池化后的输出特征,F'i最大表示第i个通道注意力模块的输出特征经过最大池化后的输出特征,f7×7(·)表示对F'i平均和F'i最大进行通道上级联并经过7×7卷积,σ(·)表示非线性激活函数操作,表示矩阵相乘操作;
所述图残差注意力模块按照式(3)获取输出特征,
Fi输出=R([softmax(D·DT)·D]i+Ni) (3)
其中,Ni表示第i个空间注意力模块输出特征向量化后的向量,即节点i,Fi输出表示图残差注意力模块第i个分支的输出特征,D和DT分别表示Ni级联得到的融合矩阵以及其矩阵转置,D和DT经过softmax计算权重再与D相乘得到更新矩阵,[·]i表示将更新矩阵拆分为各个分支的输出向量,即输出节点i,Ni与[·]i通过跳跃连接进行特征融合,R(·)i表示将特征融合结果进行矩阵化操作;
所述去摩尔纹模块和图像二值化模块在训练阶段同时进行训练,损失函数如下所示:
L总=L去摩+L二值
其中,L去摩为去摩尔纹模块对应的损失函数,L二值为图像二值化模块对应的损失函数;
其中,表示L2范数的平方,Xd为去摩尔纹模块的输出图像,Xc是与Xd对应的原始干净的文本图像;
其中,Y是图像二值化模块的输出图像,Xb是与Y对应的原始二值文本图像。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910514286.8A CN110287969B (zh) | 2019-06-14 | 2019-06-14 | 基于图残差注意力网络的摩尔文本图像二值化系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910514286.8A CN110287969B (zh) | 2019-06-14 | 2019-06-14 | 基于图残差注意力网络的摩尔文本图像二值化系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110287969A true CN110287969A (zh) | 2019-09-27 |
CN110287969B CN110287969B (zh) | 2022-09-16 |
Family
ID=68004203
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910514286.8A Active CN110287969B (zh) | 2019-06-14 | 2019-06-14 | 基于图残差注意力网络的摩尔文本图像二值化系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110287969B (zh) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110969632A (zh) * | 2019-11-28 | 2020-04-07 | 北京推想科技有限公司 | 一种深度学习模型的训练方法、图像处理方法及装置 |
CN111369450A (zh) * | 2020-02-21 | 2020-07-03 | 华为技术有限公司 | 去除摩尔纹的方法与装置 |
CN111489300A (zh) * | 2020-03-11 | 2020-08-04 | 天津大学 | 基于无监督学习的屏幕图像去摩尔纹方法 |
CN111586298A (zh) * | 2020-05-09 | 2020-08-25 | 北京华严互娱科技有限公司 | 一种基于多尺度网络和动态特征编码的实时摩尔纹去除方法 |
CN111583129A (zh) * | 2020-04-09 | 2020-08-25 | 天津大学 | 基于卷积神经网络AMNet的屏摄图像摩尔纹去除方法 |
CN112836696A (zh) * | 2019-11-22 | 2021-05-25 | 搜狗(杭州)智能科技有限公司 | 一种文字数据的检测方法、装置及电子设备 |
WO2021134874A1 (zh) * | 2019-12-31 | 2021-07-08 | 深圳大学 | 二维码去摩尔纹的深度残差网络的训练方法 |
CN113239822A (zh) * | 2020-12-28 | 2021-08-10 | 武汉纺织大学 | 基于时空双流卷积神经网络的危险行为检测方法及系统 |
WO2021208600A1 (zh) * | 2020-04-15 | 2021-10-21 | 腾讯科技(深圳)有限公司 | 一种图像处理方法、智能设备及计算机可读存储介质 |
CN113723516A (zh) * | 2021-08-31 | 2021-11-30 | 平安科技(深圳)有限公司 | 基于神经网络的摩尔纹去除方法、装置、设备及介质 |
CN113763364A (zh) * | 2021-09-09 | 2021-12-07 | 深圳市涌固精密治具有限公司 | 一种基于卷积神经网络的图像缺陷检测方法 |
CN114757832A (zh) * | 2022-06-14 | 2022-07-15 | 之江实验室 | 基于交叉卷积注意力对抗学习的人脸超分辨方法和装置 |
CN117523344A (zh) * | 2024-01-08 | 2024-02-06 | 南京信息工程大学 | 一种基于相位质量加权卷积神经网络的干涉相位解缠方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108664632A (zh) * | 2018-05-15 | 2018-10-16 | 华南理工大学 | 一种基于卷积神经网络和注意力机制的文本情感分类算法 |
CN108765296A (zh) * | 2018-06-12 | 2018-11-06 | 桂林电子科技大学 | 一种基于递归残差注意力网络的图像超分辨率重建方法 |
CN109165660A (zh) * | 2018-06-20 | 2019-01-08 | 扬州大学 | 一种基于卷积神经网络的显著物体检测方法 |
-
2019
- 2019-06-14 CN CN201910514286.8A patent/CN110287969B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108664632A (zh) * | 2018-05-15 | 2018-10-16 | 华南理工大学 | 一种基于卷积神经网络和注意力机制的文本情感分类算法 |
CN108765296A (zh) * | 2018-06-12 | 2018-11-06 | 桂林电子科技大学 | 一种基于递归残差注意力网络的图像超分辨率重建方法 |
CN109165660A (zh) * | 2018-06-20 | 2019-01-08 | 扬州大学 | 一种基于卷积神经网络的显著物体检测方法 |
Non-Patent Citations (2)
Title |
---|
余萍等: "基于矩阵2-范数池化的卷积神经网络图像识别算法", 《图学学报》 * |
陈书贞等: "利用多尺度卷积神经网络的图像超分辨率算法", 《信号处理》 * |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112836696A (zh) * | 2019-11-22 | 2021-05-25 | 搜狗(杭州)智能科技有限公司 | 一种文字数据的检测方法、装置及电子设备 |
CN110969632A (zh) * | 2019-11-28 | 2020-04-07 | 北京推想科技有限公司 | 一种深度学习模型的训练方法、图像处理方法及装置 |
WO2021134874A1 (zh) * | 2019-12-31 | 2021-07-08 | 深圳大学 | 二维码去摩尔纹的深度残差网络的训练方法 |
CN111369450A (zh) * | 2020-02-21 | 2020-07-03 | 华为技术有限公司 | 去除摩尔纹的方法与装置 |
CN111369450B (zh) * | 2020-02-21 | 2024-02-02 | 华为技术有限公司 | 去除摩尔纹的方法与装置 |
WO2021164725A1 (zh) * | 2020-02-21 | 2021-08-26 | 华为技术有限公司 | 去除摩尔纹的方法与装置 |
CN111489300B (zh) * | 2020-03-11 | 2022-07-08 | 天津大学 | 基于无监督学习的屏幕图像去摩尔纹方法 |
CN111489300A (zh) * | 2020-03-11 | 2020-08-04 | 天津大学 | 基于无监督学习的屏幕图像去摩尔纹方法 |
CN111583129A (zh) * | 2020-04-09 | 2020-08-25 | 天津大学 | 基于卷积神经网络AMNet的屏摄图像摩尔纹去除方法 |
WO2021208600A1 (zh) * | 2020-04-15 | 2021-10-21 | 腾讯科技(深圳)有限公司 | 一种图像处理方法、智能设备及计算机可读存储介质 |
CN111586298A (zh) * | 2020-05-09 | 2020-08-25 | 北京华严互娱科技有限公司 | 一种基于多尺度网络和动态特征编码的实时摩尔纹去除方法 |
CN113239822A (zh) * | 2020-12-28 | 2021-08-10 | 武汉纺织大学 | 基于时空双流卷积神经网络的危险行为检测方法及系统 |
CN113723516A (zh) * | 2021-08-31 | 2021-11-30 | 平安科技(深圳)有限公司 | 基于神经网络的摩尔纹去除方法、装置、设备及介质 |
CN113723516B (zh) * | 2021-08-31 | 2024-05-14 | 平安科技(深圳)有限公司 | 基于神经网络的摩尔纹去除方法、装置、设备及介质 |
CN113763364A (zh) * | 2021-09-09 | 2021-12-07 | 深圳市涌固精密治具有限公司 | 一种基于卷积神经网络的图像缺陷检测方法 |
CN113763364B (zh) * | 2021-09-09 | 2024-04-12 | 深圳市涌固精密治具有限公司 | 一种基于卷积神经网络的图像缺陷检测方法 |
CN114757832A (zh) * | 2022-06-14 | 2022-07-15 | 之江实验室 | 基于交叉卷积注意力对抗学习的人脸超分辨方法和装置 |
CN117523344A (zh) * | 2024-01-08 | 2024-02-06 | 南京信息工程大学 | 一种基于相位质量加权卷积神经网络的干涉相位解缠方法 |
CN117523344B (zh) * | 2024-01-08 | 2024-03-19 | 南京信息工程大学 | 一种基于相位质量加权卷积神经网络的干涉相位解缠方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110287969B (zh) | 2022-09-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110287969A (zh) | 基于图残差注意力网络的摩尔文本图像二值化系统 | |
CN106910176B (zh) | 一种基于深度学习的人脸图像去遮挡方法 | |
CN110188685A (zh) | 一种基于双注意力多尺度级联网络的目标计数方法及系统 | |
CN108921822A (zh) | 基于卷积神经网络的图像目标计数方法 | |
CN109543502A (zh) | 一种基于深度多尺度神经网络的语义分割方法 | |
CN109829959B (zh) | 基于人脸解析的表情编辑方法及装置 | |
CN107766794A (zh) | 一种特征融合系数可学习的图像语义分割方法 | |
CN110059698A (zh) | 用于街景理解的基于边缘稠密重建的语义分割方法及系统 | |
CN109859288A (zh) | 基于生成对抗网络的图像上色方法及装置 | |
CN110223234A (zh) | 基于级联收缩扩张的深度残差网络图像超分辨率重建方法 | |
Wu et al. | Dynamic attention network for semantic segmentation | |
CN111179196B (zh) | 一种基于分而治之的多分辨率深度网络图像去高光方法 | |
CN110059769A (zh) | 用于街景理解的基于像素重排重建的语义分割方法及系统 | |
CN110503613A (zh) | 基于级联空洞卷积神经网络的面向单幅图像去雨方法 | |
CN110210524A (zh) | 一种图像增强模型的训练方法、图像增强方法及装置 | |
CN103208097A (zh) | 图像多方向形态结构分组的主分量分析协同滤波方法 | |
CN109635763A (zh) | 一种人群密度估计方法 | |
CN107766934A (zh) | 一种基于并列卷积单元的深度卷积神经网络方法 | |
CN109259764A (zh) | 一种确定动态脑功能网络阈值方法 | |
CN109858496A (zh) | 一种基于加权深度特征的图像特征提取方法 | |
CN113870124A (zh) | 基于弱监督的双网络互激励学习阴影去除方法 | |
CN113222819A (zh) | 一种基于深度卷积神经网络的遥感图像超分辨重建方法 | |
CN111310767A (zh) | 一种基于边界增强的显著性检测方法 | |
Dalmasse et al. | Studying the transfer of magnetic helicity in solar active regions with the connectivity-based helicity flux density method | |
CN110223224A (zh) | 一种基于信息过滤网络的图像超分辨实现算法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |