CN113781356A - 图像去噪模型的训练方法、图像去噪方法、装置及设备 - Google Patents
图像去噪模型的训练方法、图像去噪方法、装置及设备 Download PDFInfo
- Publication number
- CN113781356A CN113781356A CN202111097620.8A CN202111097620A CN113781356A CN 113781356 A CN113781356 A CN 113781356A CN 202111097620 A CN202111097620 A CN 202111097620A CN 113781356 A CN113781356 A CN 113781356A
- Authority
- CN
- China
- Prior art keywords
- image
- noise
- training
- denoising
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012549 training Methods 0.000 title claims abstract description 136
- 238000000034 method Methods 0.000 title claims abstract description 98
- 238000004088 simulation Methods 0.000 claims abstract description 118
- 238000003062 neural network model Methods 0.000 claims abstract description 46
- 230000008859 change Effects 0.000 claims description 31
- 238000012545 processing Methods 0.000 claims description 22
- 230000006835 compression Effects 0.000 claims description 21
- 238000007906 compression Methods 0.000 claims description 21
- 238000005286 illumination Methods 0.000 claims description 18
- 238000004590 computer program Methods 0.000 claims description 16
- 230000006870 function Effects 0.000 claims description 12
- 230000004927 fusion Effects 0.000 claims description 10
- 230000009466 transformation Effects 0.000 claims description 7
- 238000010586 diagram Methods 0.000 description 18
- 230000008569 process Effects 0.000 description 13
- 230000000694 effects Effects 0.000 description 10
- 238000012360 testing method Methods 0.000 description 10
- 238000004891 communication Methods 0.000 description 9
- 230000003287 optical effect Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 230000009471 action Effects 0.000 description 4
- 238000012015 optical character recognition Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 230000003321 amplification Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000010267 cellular communication Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000007499 fusion processing Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/70—Denoising; Smoothing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/50—Image enhancement or restoration using two or more images, e.g. averaging or subtraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Image Processing (AREA)
Abstract
本公开提供一种图像去噪模型的训练方法、图像去噪方法、装置及设备,其中图像去噪模型的训练方法包括:获取第一图像以及第二图像;其中,第一图像不包含手写噪声;第二图像包含手写噪声;基于第一图像和第二图像生成噪声仿真图像;对第一图像执行二值化操作,得到第一图像对应的二值图像;采用噪声仿真图像和二值图像对预设的神经网络模型进行训练,并将训练结束时的神经网络模型作为图像去噪模型。本公开有效改善了训练样本的获取成本较高、数量受限的问题,而且,通过大量的训练样本训练所得的图像去噪模型的鲁棒性更佳,性能更好,因而能够更好地实现手写噪声去除。
Description
技术领域
本公开涉及图像处理领域,尤其涉及图像去噪模型的训练方法、图像去噪方法、装置及设备。
背景技术
在应用图像处理技术的一些场景中,需要去除图像中所包含的手写字迹,诸如,去除扫描试卷上的手写答案、去除扫描证件上的手写涂鸦等,这些手写字迹被视为图像中所包含的手写噪声。然而,常见的图像去噪方法主要集中在去除图像因抖动、过暗、过曝等方面带来的噪声,由于手写噪声分布不均衡等特点,去除手写噪声的难度较大。相关技术中虽然提出了采用神经网络模型去除手写噪声的方式。但是,相关技术在训练神经网络模型时存在的最主要问题在于获取训练样本的方式费时费力,所需成本较高,训练样本的数量非常受限。
发明内容
为了解决上述技术问题或者至少部分地解决上述技术问题,本公开提供了一种训练方法、图像去噪方法、装置及设备。
根据本公开的一方面,提供了一种图像去噪模型的训练方法,包括:获取第一图像以及第二图像;其中,所述第一图像不包含手写噪声;所述第二图像包含手写噪声;基于所述第一图像和所述第二图像生成噪声仿真图像;对所述第一图像执行二值化操作,得到所述第一图像对应的二值图像;采用所述噪声仿真图像和所述二值图像对预设的神经网络模型进行训练,并将训练结束时的神经网络模型作为图像去噪模型。
根据本公开的另一方面,提供了一种图像去噪方法,包括:获取待去噪的目标图像;其中,所述目标图像包含有手写噪声;将所述目标图像输入至预先训练得到的图像去噪模型;其中,所述图像去噪模型是采用上述训练方法得到的;通过所述图像去噪模型对所述目标图像进行去噪处理,得到所述目标图像对应的去噪图像。
根据本公开的另一方面,提供了一种图像去噪模型的训练装置,包括:图像获取模块,用于获取第一图像以及第二图像;其中,所述第一图像不包含手写噪声;所述第二图像包含手写噪声;噪声仿真模块,用于基于所述第一图像和所述第二图像生成噪声仿真图像;图像二值化模块,用于对所述第一图像执行二值化操作,得到所述第一图像对应的二值图像;模型训练模块,用于采用所述噪声仿真图像和所述二值图像对预设的神经网络模型进行训练,并将训练结束时的神经网络模型作为图像去噪模型。
根据本公开的另一方面,提供了一种图像去噪装置,包括:获取模块,用于获取待去噪的目标图像;其中,所述目标图像包含有手写噪声;图像输入模块,用于将所述目标图像输入至预先训练得到的图像去噪模型;其中,所述图像去噪模型是采用上述训练方法得到的;模型去噪模块,用于通过所述图像去噪模型对所述目标图像进行去噪处理,得到所述目标图像对应的去噪图像。
根据本公开的另一方面,提供了一种电子设备,包括:处理器;以及存储程序的存储器,其中,所述程序包括指令,所述指令在由所述处理器执行时使所述处理器执行上述图像去噪模型的训练方法或者上述图像去噪方法。
根据本公开的另一方面,提供了一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序用于执行上述图像去噪模型的训练方法或者上述图像去噪方法。
本公开实施例中提供的上述技术方案,首先获取第一图像(不包含手写噪声)以及第二图像(包含手写噪声),然后基于第一图像和第二图像生成噪声仿真图像,并对第一图像执行二值化操作,得到第一图像对应的二值图像,最后采用噪声仿真图像和二值图像对预设的神经网络模型进行训练,得到图像去噪模型。上述方式无需人为标注图像上的手写噪声或者无需人为针对同一图像内容制作有噪声图像和无噪声图像,省时省力,有效节约了训练样本的获取成本,可以便捷地获取用于训练模型的图像(也即训练样本),有效改善了训练样本的获取成本较高、数量受限的问题。
进一步,由于上述方式可有效降低训练样本的获取成本,便于实现训练样本的数量扩增,因此能够通过大量的训练样本进行模型训练,使得最终训练所得的图像去噪模型的鲁棒性更佳,性能更好,因而能够更好地实现手写噪声去除。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本公开实施例提供的一种图像去噪模型的训练方法的流程示意图;
图2为本公开实施例提供的一种原始图像示意图;
图3为本公开实施例提供的一种原始图像的裁剪结果示意图;
图4为本公开实施例提供的一种添加噪声后的图像示意图;
图5为本公开实施例提供的一种二值图像示意图;
图6为本公开实施例提供的一种泊松融合效果图;
图7为本公开实施例提供的另一种图像去噪模型的训练方法的流程示意图;
图8为本公开实施例提供的一种图像去噪方法的流程图;
图9为本公开实施例提供的一种模型去噪效果图;
图10为本公开实施例提供的一种图像去噪模型的训练装置的结构示意图;
图11为本公开实施例提供的一种图像去噪装置的结构示意图;
图12为本公开实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
本公开使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
为了能够更清楚地理解本公开的上述目的、特征和优点,下面将对本公开的方案进行进一步描述。需要说明的是,在不冲突的情况下,本公开的实施例及实施例中的特征可以相互组合。
在图像处理技术中通常会涉及到一个重要的预处理过程,该过程也可称之为图像质量提升过程,主要目的在于去除图像中不必要的噪声,从而有助于使去噪后的图像可以更好应用于内容理解、图文识别等场景。
以现代智能教育场景为例,OCR(Optical Character Recognition,光学字符识别)技术是非常重要的文字识别技术,可以应用在诸如自动批改试卷等多个教学场景,从而有效提升相关教务的工作效率。以自动批改试卷为例,题干文本内容的识别是关键的环节之一,一般采取的识别手段是通过相机拍摄图像,后续结合相关OCR算法对图像进行识别,但是现实场景拍摄的图像一般存在复杂多变的噪声,比如高斯噪声模糊、抖动模糊、过暗、过曝、低对比度等,现有常见的图像去噪方法也主要集中在图像抖动、过暗、过曝等方面,然而,在很多图像去噪场景下需要去除手写内容(手写噪声),手写噪声一般分布不均衡,种类繁多,有的会覆盖题干信息,因此手写噪声的去除也是提升OCR题干识别的重要手段,除此之外,诸如去除证件等重要文件的扫描图像上的涂鸦字迹等场景也都需要涉及到手写内容的去除。
在相关技术中,虽然提出了采用神经网络模型去除手写噪声的方式。但是,相关技术在训练神经网络模型时存在的最主要问题在于获取训练样本的方式费时费力,所需成本较高,训练样本的数量非常受限。具体而言,对于去除手写噪声而言,相关技术中需要大量的针对同一图像内容的有噪-无噪图像对,也即,对于同一图像而言,需要人工制作包含不手写噪声的图像A以及包含手写噪声的图像A’,其中,图像A和图像A’中除了手写内容,其余的图像内容相同。示例性地,可以先获取不包含手写噪声的图像A,然后在该图像上人为添加手写字迹,得到包含手写噪声的图像A’;或者,也可以先获取包含手写字迹的图像A’,然后采用措施去除该图像A’上的手写字迹,得到不包含手写噪声的图像A。可以理解的是,上述方式所需人工成本较高;此外,也可以采取在包含有手写内容的图像上直接标注手写内容所在的位置等方式构建训练样本,但上述方式均需要耗费较大的人工成本,难以获取大量的模型训练样本,也即获取到的模型训练样本数量较为受限,致使模型训练效果不佳,训练所得的模型的鲁棒性和去手写效果也不佳。
基于此,本公开实施例提供了一种图像去噪模型的训练方法、图像去噪方法、装置及设备,有效改善了相关技术中训练样本的获取成本较高、数量受限的问题,能够方便快捷地获取大量的训练样本,且通过大量的训练样本训练所得的图像去噪模型的鲁棒性更佳,性能更好,因而能够更好地实现手写噪声去除,从而较好地提升图像质量。为便于理解,以下详细说明:
图1为本公开实施例提供的一种图像去噪模型的训练方法的流程示意图,该方法可以由图像去噪模型的训练装置执行,其中该装置可以采用软件和/或硬件实现,一般可集成在电子设备中。如图1所示,该方法主要包括如下步骤S102~步骤S108:
步骤S102,获取第一图像以及第二图像;其中,第一图像不包含手写噪声;第二图像包含手写噪声。其中,第一图像以及第二图像中的图像内容可以不同。也即,第一图像和第二图像可以是不同的图像,诸如,第一图像是试卷的扫描图像,而第二图像仅是包含有手写字迹的文稿图像。当然,第二图像中也可能包含有非手写内容,在此不进行限制。
由于第一图像和第二图像不需要受到内容一致的限制,因此可以较为便捷地获取到大量的第一图像以及第二图像。除此之外,在获取第一图像和第二图像时,还可以根据需求而将获取到的原始图像进行随机裁剪,诸如,将获取到的不包含手写噪声的第一原始图像按照指定尺寸随机裁剪得到多张第一图像,将获取到的包含手写噪声的第二原始图像按照指定尺寸随机裁剪得到多张第二图像,从而进一步达到数据扩增的目的。示例性地,将不包含手写内容的扫描试卷随机裁剪得到多张试卷局部图像,试卷局部图像即可作为第一图像;将包含手写内容的文稿图像(手写文稿)随机裁剪得到多张手写局部图像,每张手写局部图像都包含有部分手写字迹,手写局部图像即可作为第二图像。为便于理解,以获取第一图像为例,可参见图2所示的一种原始图像示意图,示意出了不包含手写噪声的第一原始图像,具体为英文试卷扫描图,对图2中所示的第一原始图像进行裁剪,可以得到多张第一图像,为便于理解,可参见图3所示的一种原始图像的裁剪结果示意图,示意出了对原始图像进行裁剪后得到的多张第一图像中的一张。应当注意的是,图2和图3仅为包含有印刷文本内容的图像示意图,旨在表现图像的大致形式,而图像中的具体内容并非重点,无需过多关注。
步骤S104,基于第一图像和第二图像生成噪声仿真图像。
在一些实施方式中,可以直接将第一图像和第二图像进行融合,得到噪声仿真图像。如前述步骤可知,由于不限制第一图像和第二图像的内容一致,而且还可以通过随机裁剪方式获得第一图像和第二图像,因此可以便捷地获取到大量的第一图像和第二图像,基于第一图像和第二图像可以进一步生成数量更多的噪声仿真图像。此外,考虑到包含手写内容的第二图像的获取难度高于不包含手写内容的第一图像,因此也可以获取大量的第一图像以及少量的第二图像,通过图像融合的方式同样可以得到大量的噪声仿真图像。
在另一些实施方式中,还可以对第一图像执行噪声添加处理,得到添加噪声后的第一图像;然后将添加噪声后的第一图像和第二图像进行融合,得到噪声仿真图像。在该实施方式中,噪声仿真图像不仅包含手写噪声,还可以包含额外添加的其它噪声,有助于使得通过噪声仿真图像训练得到的模型不仅能够去除手写噪声,还可以去除其它噪声,具有更为丰富的图像去噪功能。为便于理解,可以参照图4所示的一种添加噪声后的图像示意图,图4在图3的基础上添加了基于图像色差变化、局部光照变化和图像压缩损失进行噪声模拟的模拟噪声,得到了添加噪声后的第一图像。通过给第一图像添加噪声,还可以进一步得到包含有各种噪声的丰富的第一图像,采用数量/形式丰富的第一图像与第二图像进行融合,可以得到数量更多以及噪声形式更丰富的噪声仿真图像。
步骤S106,对第一图像执行二值化操作,得到第一图像对应的二值图像。二值化操作也即将图像上像素点的灰度值设置为0或255,也就是将整个图像呈现出明显的只有黑和白的视觉效果,为便于理解,可参见图5所示的一种二值图像示意图,通过执行二值化操作,可以有效去除图像部分噪声,并重点突出第一图像中的文本内容。
步骤S108,采用噪声仿真图像和二值图像对预设的神经网络模型进行训练,并将训练结束时的神经网络模型作为图像去噪模型。
将噪声仿真图像和二值图像作为训练样本,在一些具体实施方式中,噪声仿真图像作为神经网络模型的主要输入,基于二值化操作得到的二值图像作为训练模型所需的监督信息,以便于训练所得的模型可以对噪声仿真图像进行去噪处理,得到内容清楚的去噪图像。而通过第一图像和第二图像也可以方便快捷地合成大量的噪声仿真图像,基于大量的噪声仿真图像对神经网络模型进行训练,并采用二值图像对模型的去噪结果进行监督,最终可以得到可靠性较强,去噪性能较好的图像去噪模型。图像去噪模型能够对噪声仿真图像进行去噪,得到类似二值化的提升图像,通过将手写噪声去除,有助于后续进一步提升其余内容(诸如试卷题干内容)的识别精度。
本公开实施例提供的上述图像去噪模型的训练方法,无需人为标注图像上的手写噪声或者无需人为针对同一图像内容制作有噪声图像和无噪声图像,省时省力,有效节约了训练样本的获取成本,可以便捷地获取用于训练模型的图像(也即训练样本),有效改善了训练样本的获取成本较高、数量受限的问题。进一步,由于上述方式可有效降低训练样本的获取成本,便于实现训练样本的数量扩增,因此能够通过大量的训练样本进行模型训练,使得最终训练所得的图像去噪模型的鲁棒性更佳,性能更好,因而能够更好地实现手写噪声去除。
为了能够使图像去噪模型去除更多的噪声,本公开实施例可以为第一图像添加除手写噪声之外的其它模拟噪声,使得噪声仿真图像也具有丰富噪声类型,进而使得基于噪声仿真图像训练所得的图像去噪模型能够去除手写噪声之外的其它噪声,进一步提升图像质量。在一些实施方式中,可以按照预设的噪声模拟方式为第一图像添加模拟噪声;噪声模拟方式包括以下中的一种或多种:基于图像色差变化进行噪声模拟、基于局部光照变化进行噪声模拟、基于图像压缩损失进行噪声模拟。为便于理解,以下针对上述三种噪声模拟方式分别进行阐述说明:
(一)基于图像色差变化进行噪声模拟
当噪声模拟方式包括基于图像色差变化进行噪声模拟时,按照预设的噪声模拟方式为第一图像添加模拟噪声的步骤,可以参照如下步骤a至步骤d执行:
步骤a,获取第一图像中指定区域的像素值。示例性地,该指定区域包括边角区域。
步骤b,基于指定区域的像素值得到多个像素值组;其中,每个像素值组包含有两个指定区域的像素值。在实际应用中,可以从指定区域的像素值中随机选取多个像素值,任意两个像素值即可组成一个像素值组,由此可以得到多个像素值组。
步骤c,计算每个像素值组中的两个像素值之间的差值。通过这种方式,可以得到第一图像中的多个像素值差值。
步骤d,根据每个像素值组相对应的差值对第一图像进行噪声模拟,以给第一图像添加用于表征图像色差变化的模拟噪声。不同像素值组对应的像素差值不同,基于像素差值来模拟第一图像中的图像色差变化,为此添加相应噪声。通过上述方式,可以使第一图像有效模拟现实场景中底色/色差的变化。
(二)基于局部光照变化进行噪声模拟
当噪声模拟方式包括基于局部光照变化进行噪声模拟时,按照预设的噪声模拟方式为第一图像添加模拟噪声的步骤,可以参照如下步骤A~步骤B执行:
步骤A,从第一图像中随机选取局部平面。示例性地,可以在第一图像中随机选取三个点,基于选取的三个点即可确定局部平面。
步骤B,利用高斯模糊算法以及伽马变换算法(也即,幂律变换算法)对局部平面进行噪声模拟,以给第一图像添加用于表征局部光照变化的模拟噪声。高斯模糊算法和伽马变换算法具体可参照相关技术,在此不再赘述,本公开实施例通过对局部平面进行高斯模糊算法以及伽马变换算法,可较好实现第一图像中局部平面的随机光照变化效果,从而模拟现实场景中局部阴影或者局部过亮等情形。
(三)基于图像压缩损失进行噪声模拟
当噪声模拟方式包括基于图像压缩损失进行噪声模拟时,按照预设的噪声模拟方式为第一图像添加模拟噪声的步骤,可以参照如下步骤执行:对第一图像进行有损压缩处理,以给第一图像添加用于表征图像压缩损失的模拟噪声。示例性地,由于相机拍照所得的实际图像往往存在图像jpeg压缩损失,因此,可以对第一图像进行jpeg有损压缩处理,经jpeg有损压缩处理后的第一图像即可认为被添加了表征图像压缩损失的模拟噪声。
在实际应用中,可以采用上述(一)~(三)中的一种或多种噪声模拟方式为第一图像添加模拟噪声,诸如,可以首先对第一图像添加用于表征图像色差变化的模拟噪声,在此基础上再添加用于表征局部光照变化的模拟噪声,在此基础上再对添加了用于表征图像色差变化和局部光照变化的模拟噪声的第一图像进行jpeg压缩,得到最终添加噪声后的第一图像。又诸如,可以仅对第一图像添加用于表征图像色差变化的模拟噪声或者添加用于表征局部光照变化的模拟噪声等,具体可根据实际需求而选用上述(一)~(三)中的一种或多种实现,在此不进行限制。
之后,可以进一步采用泊松融合算法对添加噪声后的第一图像和第二图像进行融合处理。为便于理解,可参见图6所示的一种泊松融合效果图,箭头前的虚线框内的两张图像为输入图像,箭头之后的图像为输出图像。其中,虚线框中左边的图像为添加了噪声的第一图像,右边的图像为第二图像(即示意出手写字迹-3)。箭头之后的输出图像即为虚线框中的两张图像经泊松融合后所得的融合图像,通过这种方式,可以得到更为真实的包含有手写噪声的噪声仿真图像,而且由于可以便捷地获取到大量的添加噪声后的第一图像以及第二图像,基于泊松融合方式可进一步获得更多的噪声仿真图像,达到数据扩增效果,较好改善了相关技术中缺乏训练样本的问题。
本公开实施例给出了采用噪声仿真图像和二值图像对预设的神经网络模型进行训练的一种具体实施方式,可以参照如下步骤(1)~步骤(3):
步骤(1),将噪声仿真图像输入至预设的神经网络模型,并获取神经网络模型针对噪声仿真图像进行去噪处理后得到的去噪图像。
在一些实施示例中,神经网络模型可以选用U-Net网络实现。U-Net网络是一种全卷积神经网络,是一个端到端的编解码网络结构,并通过两阶段对应的特征拼接有效的传输了上下层特征信息,可以更好的得到图像更细节的特征。U-Net网络的网络结构具体可参照相关技术实现,在此不再赘述,本公开实施例仅将U-Net网络作为一种示例性网络结构,在实际应用中,还可以采用其它网络结构实现,在此不进行限制。
神经网络模型的输入包括噪声仿真图像和第一图像相应的二值图像,二值图像作为噪声仿真图像的监督信息,用于监督U-Net网络对噪声仿真图像进行去噪处理,以尽可能输出符合预期的不包含噪声的图像。
步骤(2),根据二值图像、去噪图像以及预设的损失函数计算神经网络模型的去噪损失值。示例性的,损失函数可以选用L2损失函数。具体而言,可以计算二值图像与去噪图像的L2损失函数值,L2损失函数值即为去噪损失值,可合理表征二值图像与去噪图像之间的差异,去噪损失值越小,说明去噪图像与二值图像越接近,神经网络模型的去噪性能较好,可以有效去除噪声仿真图像中的手写噪声等噪声,使去噪图像可以达到类似二值图像的效果。
步骤(3),根据去噪损失值调整神经网络模型的网络参数,直至调整后的神经网络模型的去噪损失值符合训练结束条件。
具体实现时,可通过反向传播算法调整神经网络模型的网络参数,直至整后的神经网络模型的去噪损失值符合训练结束条件时确定训练结束,训练结束时的神经网络模型即为图像去噪模型。训练结束条件诸如可以为去噪损失值收敛至指定阈值内,此时说明神经网络模型得到的去噪图像与二值图像较为接近,神经网络模型可以达到符合预期的去噪效果。
在前述实施例的基础上,本公开实施例提供了另一种图像去噪模型的训练方法的流程示意图,参见图7所示,主要包括如下步骤S702~步骤S710:
步骤S702,获取第一图像以及第二图像;其中,第一图像不包含手写噪声;第二图像包含手写噪声。
步骤S704,按照预设的噪声模拟方式为第一图像添加模拟噪声;噪声模拟方式包括基于图像色差变化进行噪声模拟、基于局部光照变化进行噪声模拟、基于图像压缩损失中的一种或多种。
步骤S706,采用泊松融合算法对添加噪声后的第一图像和第二图像进行融合处理,得到噪声仿真图像。
步骤S708,对第一图像执行二值化操作,得到第一图像对应的二值图像。应当注意的是,此处的第一图像即为最初获取的未被添加噪声的第一图像。因此该步骤也可以在步骤S704之前执行。
步骤S710,采用噪声仿真图像和二值图像对预设的U-Net全卷积网络进行训练,并将训练结束时的U-Net全卷积网络作为图像去噪模型。
通过上述方式,无需人为标注图像上的手写噪声或者无需人为针对同一图像内容制作有噪声图像和无噪声图像,且第一图像和第二图像不受内容一致性约束,可以更为便捷地获取一定数量的第一图像和第二图像,利用第一图像(添加了模拟噪声,但不包含手写噪声)以及第二图像进行泊松融合,可以获得数量更多且接近真实的噪声仿真图像,可有效降低训练样本的获取成本,便于实现训练样本的数量扩增,基于大量的噪声仿真图像和二值图像对U-Net全卷积网络进行训练,最终所得的图像去噪模型的鲁棒性更佳,不仅能够实现手写噪声去除,还可以有效去除诸如图像色差变化、局部光照变化、图像压缩损失等带来的噪声。
在前述图像去噪模型的训练方法的基础上,本公开实施例进一步提供了一种图像去噪方法,参见图8所示的一种图像去噪方法的流程图,主要包括如下步骤S802~步骤S806:
步骤S802,获取待去噪的目标图像;其中,目标图像包含有手写噪声。诸如,目标图像可以为包含有手写字迹的试卷扫描图像,或者包含有手写涂鸦的证件扫描图像。目标图像包含有手写内容(手写噪声),也可以包含有非手写内容,诸如包含有印刷字体或者图画等。
步骤S804,将目标图像输入至预先训练得到的图像去噪模型;其中,图像去噪模型是采用前述任一项训练方法得到的,在此不再赘述。
步骤S806,通过图像去噪模型对目标图像进行去噪处理,得到目标图像对应的去噪图像。
为便于理解,参见本公开实施例提供的图9所示的一种模型去噪效果图,图像去噪模型的输入为目标图像,图像去噪模型的输出为去噪图像。从图9中可见,图像去噪模型具有良好的去噪效果,可以有效去除括号中的手写答案,此外,还可以将目标图像中的诸如局部光照变换、色差变化等相关噪声也去除,使得最终得到的去噪图像非常清楚地体现出题干内容。
本公开实施例提供的上述图像去噪模型的训练方式中,可以非常便捷地获取大量用于训练模型的图像,通过大量的训练样本训练所得的图像去噪模型的鲁棒性更佳,性能更好,因而能够更好地实现手写噪声等无用噪声的去除。
对应于前述图像去噪模型的训练方法,本公开实施例还提供了一种图像去噪模型的训练装置,图10为本公开实施例提供的一种图像去噪模型的训练装置的结构示意图,该装置可由软件和/或硬件实现,一般可集成在电子设备中。如图10所示,图像去噪模型的训练装置1000包括:
图像获取模块1002,用于获取第一图像以及第二图像;其中,第一图像不包含手写噪声;第二图像包含手写噪声;
噪声仿真模块1004,用于基于第一图像和第二图像生成噪声仿真图像;
图像二值化模块1006,用于对第一图像执行二值化操作,得到第一图像对应的二值图像;
模型训练模块1008,用于采用噪声仿真图像和二值图像对预设的神经网络模型进行训练,并将训练结束时的神经网络模型作为图像去噪模型。
上述装置无需人为标注图像上的手写噪声或者无需人为针对同一图像内容制作有噪声图像和无噪声图像,省时省力,有效节约了训练样本的获取成本,可以便捷地获取用于训练模型的图像(也即训练样本),有效改善了训练样本的获取成本较高、数量受限的问题。
进一步,由于上述装置可有效降低训练样本的获取成本,便于实现训练样本的数量扩增,因此能够通过大量的训练样本进行模型训练,使得最终训练所得的图像去噪模型的鲁棒性更佳,性能更好,因而能够更好地实现手写噪声去除。
在一些实施方式中,噪声仿真模块1004具体用于:对第一图像执行噪声添加处理,得到添加噪声后的第一图像;将添加噪声后的第一图像和第二图像进行融合,得到噪声仿真图像。
在一些实施方式中,噪声仿真模块1004具体用于:按照预设的噪声模拟方式为第一图像添加模拟噪声;噪声模拟方式包括以下中的一种或多种:基于图像色差变化进行噪声模拟、基于局部光照变化进行噪声模拟、基于图像压缩损失进行噪声模拟。
在一些实施方式中,当噪声模拟方式包括基于图像色差变化进行噪声模拟时,噪声仿真模块1004具体用于:获取第一图像中指定区域的像素值;基于指定区域的像素值得到多个像素值组;其中,每个像素值组包含有两个指定区域的像素值;计算每个像素值组中的两个像素值之间的差值;根据每个像素值组相对应的差值对第一图像进行噪声模拟,以给第一图像添加用于表征图像色差变化的模拟噪声。
在一些实施方式中,当噪声模拟方式包括基于局部光照变化进行噪声模拟时,噪声仿真模块1004具体用于:从第一图像中随机选取局部平面;利用高斯模糊算法以及伽马变换算法对局部平面进行噪声模拟,以给第一图像添加用于表征局部光照变化的模拟噪声。
在一些实施方式中,当噪声模拟方式包括基于图像压缩损失进行噪声模拟时,噪声仿真模块1004具体用于:对第一图像进行有损压缩处理,以给第一图像添加用于表征图像压缩损失的模拟噪声。
在一些实施方式中,噪声仿真模块1004具体用于:采用泊松融合算法对添加噪声后的第一图像和第二图像进行融合处理。
在一些实施方式中,模型训练模块1008具体用于:将噪声仿真图像输入至预设的神经网络模型,并获取神经网络模型针对噪声仿真图像进行去噪处理后得到的去噪图像;根据二值图像、去噪图像以及预设的损失函数计算神经网络模型的去噪损失值;根据去噪损失值调整神经网络模型的网络参数,直至调整后的神经网络模型的去噪损失值符合训练结束条件。
本公开实施例所提供的图像去噪模型的训练装置可执行本公开任意实施例所提供的图像去噪模型的训练方法,具备执行方法相应的功能模块和有益效果。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置实施例的具体工作过程,可以参考方法实施例中的对应过程,在此不再赘述。
对应于前述图像去噪方法,本公开实施例还提供了一种图像去噪装置,图11为本公开实施例提供的一种图像去噪装置的结构示意图,该装置可由软件和/或硬件实现,一般可集成在电子设备中。如图11所示,图像去噪装置1100包括:
获取模块1102,用于获取待去噪的目标图像;其中,目标图像包含有手写噪声;
图像输入模块1104,用于将目标图像输入至预先训练得到的图像去噪模型;其中,图像去噪模型是采用上述任一项的训练方法得到的;
模型去噪模块1106,用于通过图像去噪模型对目标图像进行去噪处理,得到目标图像对应的去噪图像。
本公开实施例提供的上述图像去噪模型的训练方式中,可以非常便捷地获取大量用于训练模型的图像,通过大量的训练样本训练所得的图像去噪模型的鲁棒性更佳,性能更好,因而能够更好地实现手写噪声等无用噪声的去除。
本公开实施例所提供的图像去噪装置可执行本公开任意实施例所提供的图像去噪方法,具备执行方法相应的功能模块和有益效果。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置实施例的具体工作过程,可以参考方法实施例中的对应过程,在此不再赘述。
本公开示例性实施例还提供一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器。所述存储器存储有能够被所述至少一个处理器执行的计算机程序,所述计算机程序在被所述至少一个处理器执行时用于使所述电子设备执行根据本公开实施例的图像去噪模型的训练方法或者图像去噪方法。
本公开示例性实施例还提供一种存储有计算机程序的非瞬时计算机可读存储介质,其中,所述计算机程序在被计算机的处理器执行时用于使所述计算机执行根据本公开实施例的方法。
本公开示例性实施例还提供一种计算机程序产品,包括计算机程序,其中,所述计算机程序在被计算机的处理器执行时用于使所述计算机执行根据本公开实施例的方法。
所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
此外,本公开的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本公开实施例所提供的图像去噪模型的训练方法或者图像去噪方法。所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
参考图11,现将描述可以作为本公开的服务器或客户端的电子设备1100的结构框图,其是可以应用于本公开的各方面的硬件设备的示例。电子设备旨在表示各种形式的数字电子的计算机设备,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图12所示,电子设备1200包括计算单元1201,其可以根据存储在只读存储器(ROM)1202中的计算机程序或者从存储单元12012加载到随机访问存储器(RAM)1203中的计算机程序,来执行各种适当的动作和处理。在RAM 1203中,还可存储设备1200操作所需的各种程序和数据。计算单元1201、ROM 1202以及RAM 1203通过总线1204彼此相连。输入/输出(I/O)接口1205也连接至总线1204。
电子设备1200中的多个部件连接至I/O接口1205,包括:输入单元1206、输出单元1207、存储单元1208以及通信单元1209。输入单元1206可以是能向电子设备1200输入信息的任何类型的设备,输入单元1206可以接收输入的数字或字符信息,以及产生与电子设备的用户设置和/或功能控制有关的键信号输入。输出单元1207可以是能呈现信息的任何类型的设备,并且可以包括但不限于显示器、扬声器、视频/音频输出终端、振动器和/或打印机。存储单元1208可以包括但不限于磁盘、光盘。通信单元1209允许电子设备1200通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据,并且可以包括但不限于调制解调器、网卡、红外通信设备、无线通信收发机和/或芯片组,例如蓝牙TM设备、WiFi设备、WiMax设备、蜂窝通信设备和/或类似物。
计算单元1201可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元1201的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元1201执行上文所描述的各个方法和处理。例如,在一些实施例中,图像去噪模型的训练方法或者图像去噪方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元1208。在一些实施例中,计算机程序的部分或者全部可以经由ROM 1202和/或通信单元1209而被载入和/或安装到电子设备1200上。在一些实施例中,计算单元1201可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行图像去噪模型的训练方法或者图像去噪方法。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
如本公开使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本公开的具体实施方式,使本领域技术人员能够理解或实现本公开。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本公开的精神或范围的情况下,在其它实施例中实现。因此,本公开将不会被限制于本文所述的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (13)
1.一种图像去噪模型的训练方法,包括:
获取第一图像以及第二图像;其中,所述第一图像不包含手写噪声;所述第二图像包含手写噪声;
基于所述第一图像和所述第二图像生成噪声仿真图像;
对所述第一图像执行二值化操作,得到所述第一图像对应的二值图像;
采用所述噪声仿真图像和所述二值图像对预设的神经网络模型进行训练,并将训练结束时的神经网络模型作为图像去噪模型。
2.如权利要求1所述的图像去噪模型的训练方法,其中,所述基于所述第一图像和所述第二图像生成噪声仿真图像的步骤,包括:
对所述第一图像执行噪声添加处理,得到添加噪声后的所述第一图像;
将添加噪声后的所述第一图像和所述第二图像进行融合,得到噪声仿真图像。
3.如权利要求2所述的图像去噪模型的训练方法,其中,所述对所述第一图像执行噪声添加处理的步骤,包括:
按照预设的噪声模拟方式为所述第一图像添加模拟噪声;所述噪声模拟方式包括以下中的一种或多种:基于图像色差变化进行噪声模拟、基于局部光照变化进行噪声模拟、基于图像压缩损失进行噪声模拟。
4.如权利要求3所述的图像去噪模型的训练方法,其中,当所述噪声模拟方式包括基于图像色差变化进行噪声模拟时,所述按照预设的噪声模拟方式为所述第一图像添加模拟噪声的步骤,包括:
获取所述第一图像中指定区域的像素值;
基于所述指定区域的像素值得到多个像素值组;其中,每个所述像素值组包含有两个所述指定区域的像素值;
计算每个所述像素值组中的两个像素值之间的差值;
根据每个所述像素值组相对应的差值对所述第一图像进行噪声模拟,以给所述第一图像添加用于表征图像色差变化的模拟噪声。
5.如权利要求3所述的图像去噪模型的训练方法,其中,当所述噪声模拟方式包括基于局部光照变化进行噪声模拟时,所述按照预设的噪声模拟方式为所述第一图像添加模拟噪声的步骤,包括:
从所述第一图像中随机选取局部平面;
利用高斯模糊算法以及伽马变换算法对所述局部平面进行噪声模拟,以给所述第一图像添加用于表征局部光照变化的模拟噪声。
6.如权利要求3所述的图像去噪模型的训练方法,其中,当所述噪声模拟方式包括基于图像压缩损失进行噪声模拟时,所述按照预设的噪声模拟方式为所述第一图像添加模拟噪声的步骤,包括:
对所述第一图像进行有损压缩处理,以给所述第一图像添加用于表征图像压缩损失的模拟噪声。
7.如权利要求2所述的图像去噪模型的训练方法,其中,所述将添加噪声后的所述第一图像和所述第二图像进行融合的步骤,包括:
采用泊松融合算法对添加噪声后的所述第一图像和所述第二图像进行融合处理。
8.如权利要求1所述的图像去噪模型的训练方法,其中,所述采用所述噪声仿真图像和所述二值图像对预设的神经网络模型进行训练的步骤,包括:
将所述噪声仿真图像输入至预设的神经网络模型,并获取所述神经网络模型针对所述噪声仿真图像进行去噪处理后得到的去噪图像;
根据所述二值图像、所述去噪图像以及预设的损失函数计算所述神经网络模型的去噪损失值;
根据所述去噪损失值调整所述神经网络模型的网络参数,直至调整后的所述神经网络模型的去噪损失值符合训练结束条件。
9.一种图像去噪方法,包括:
获取待去噪的目标图像;其中,所述目标图像包含有手写噪声;
将所述目标图像输入至预先训练得到的图像去噪模型;其中,所述图像去噪模型是采用权利要求1至8任一项所述的训练方法得到的;
通过所述图像去噪模型对所述目标图像进行去噪处理,得到所述目标图像对应的去噪图像。
10.一种图像去噪模型的训练装置,包括:
图像获取模块,用于获取第一图像以及第二图像;其中,所述第一图像不包含手写噪声;所述第二图像包含手写噪声;
噪声仿真模块,用于基于所述第一图像和所述第二图像生成噪声仿真图像;
图像二值化模块,用于对所述第一图像执行二值化操作,得到所述第一图像对应的二值图像;
模型训练模块,用于采用所述噪声仿真图像和所述二值图像对预设的神经网络模型进行训练,并将训练结束时的神经网络模型作为图像去噪模型。
11.一种图像去噪装置,包括:
获取模块,用于获取待去噪的目标图像;其中,所述目标图像包含有手写噪声;
图像输入模块,用于将所述目标图像输入至预先训练得到的图像去噪模型;其中,所述图像去噪模型是采用权利要求1至8任一项所述的训练方法得到的;
模型去噪模块,用于通过所述图像去噪模型对所述目标图像进行去噪处理,得到所述目标图像对应的去噪图像。
12.一种电子设备,包括:
处理器;以及
存储程序的存储器,
其中,所述程序包括指令,所述指令在由所述处理器执行时使所述处理器执行根据权利要求1-8中任一项所述的图像去噪模型的训练方法或者权利要求9所述的图像去噪方法。
13.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序用于执行上述权利要求1-8中任一项所述的图像去噪模型的训练方法或者权利要求9所述的图像去噪方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111097620.8A CN113781356B (zh) | 2021-09-18 | 2021-09-18 | 图像去噪模型的训练方法、图像去噪方法、装置及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111097620.8A CN113781356B (zh) | 2021-09-18 | 2021-09-18 | 图像去噪模型的训练方法、图像去噪方法、装置及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113781356A true CN113781356A (zh) | 2021-12-10 |
CN113781356B CN113781356B (zh) | 2024-06-04 |
Family
ID=78852336
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111097620.8A Active CN113781356B (zh) | 2021-09-18 | 2021-09-18 | 图像去噪模型的训练方法、图像去噪方法、装置及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113781356B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115565212A (zh) * | 2022-01-20 | 2023-01-03 | 荣耀终端有限公司 | 图像处理方法、神经网络模型训练方法及装置 |
CN115631103A (zh) * | 2022-10-17 | 2023-01-20 | 北京百度网讯科技有限公司 | 图像生成模型的训练方法和装置、图像生成方法及装置 |
CN115937050A (zh) * | 2023-03-02 | 2023-04-07 | 图兮数字科技(北京)有限公司 | 图像处理方法、装置、电子设备和存储介质 |
CN118195930A (zh) * | 2022-12-09 | 2024-06-14 | 英特灵达信息技术(深圳)有限公司 | 图像去噪模型训练方法、图像去噪方法、装置及电子设备 |
Citations (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006243141A (ja) * | 2005-03-01 | 2006-09-14 | Canon Inc | 画像処理装置 |
CN101854462A (zh) * | 2009-03-12 | 2010-10-06 | 索尼公司 | 图像处理设备、图像处理方法和计算机程序 |
CN102521516A (zh) * | 2011-12-20 | 2012-06-27 | 北京商纳科技有限公司 | 一种自动生成错题本的方法及系统 |
CN103139490A (zh) * | 2011-11-29 | 2013-06-05 | 索尼公司 | 图像处理装置、图像处理方法和程序 |
US9330340B1 (en) * | 2014-05-06 | 2016-05-03 | Google Inc. | Noise estimation for images using polynomial relationship for pixel values of image features |
CN106355561A (zh) * | 2016-08-30 | 2017-01-25 | 天津大学 | 基于噪点先验约束的全变分图像去噪方法 |
CN109142374A (zh) * | 2018-08-15 | 2019-01-04 | 广州市心鉴智控科技有限公司 | 基于超小样本训练高效质检模型的方法及系统 |
CN109492627A (zh) * | 2019-01-22 | 2019-03-19 | 华南理工大学 | 一种基于全卷积网络的深度模型的场景文本擦除方法 |
CN110335330A (zh) * | 2019-07-12 | 2019-10-15 | 创新奇智(北京)科技有限公司 | 图像模拟生成方法及其系统、深度学习算法训练方法及电子设备 |
CN111275139A (zh) * | 2020-01-21 | 2020-06-12 | 杭州大拿科技股份有限公司 | 手写内容去除方法、手写内容去除装置、存储介质 |
CN111488881A (zh) * | 2020-04-10 | 2020-08-04 | 杭州睿琪软件有限公司 | 文本图像中手写内容去除方法、装置、存储介质 |
CN111563512A (zh) * | 2020-04-30 | 2020-08-21 | 广东小天才科技有限公司 | 一种答案自动涂抹的方法、装置、电子设备及存储介质 |
CN111563510A (zh) * | 2020-04-30 | 2020-08-21 | 广东小天才科技有限公司 | 一种图像处理的方法和系统 |
CN111770321A (zh) * | 2019-03-27 | 2020-10-13 | 佳能株式会社 | 图像处理设备、摄像设备、图像处理方法和存储介质 |
CN112308095A (zh) * | 2019-07-30 | 2021-02-02 | 顺丰科技有限公司 | 图片预处理及模型训练方法、装置、服务器及存储介质 |
US20210064859A1 (en) * | 2019-08-30 | 2021-03-04 | Canon Kabushiki Kaisha | Image processing system, image processing method, and storage medium |
CN112597925A (zh) * | 2020-12-28 | 2021-04-02 | 作业帮教育科技(北京)有限公司 | 手写字迹的识别/提取、擦除方法及擦除系统、电子设备 |
-
2021
- 2021-09-18 CN CN202111097620.8A patent/CN113781356B/zh active Active
Patent Citations (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006243141A (ja) * | 2005-03-01 | 2006-09-14 | Canon Inc | 画像処理装置 |
CN101854462A (zh) * | 2009-03-12 | 2010-10-06 | 索尼公司 | 图像处理设备、图像处理方法和计算机程序 |
CN103139490A (zh) * | 2011-11-29 | 2013-06-05 | 索尼公司 | 图像处理装置、图像处理方法和程序 |
CN102521516A (zh) * | 2011-12-20 | 2012-06-27 | 北京商纳科技有限公司 | 一种自动生成错题本的方法及系统 |
US9330340B1 (en) * | 2014-05-06 | 2016-05-03 | Google Inc. | Noise estimation for images using polynomial relationship for pixel values of image features |
CN106355561A (zh) * | 2016-08-30 | 2017-01-25 | 天津大学 | 基于噪点先验约束的全变分图像去噪方法 |
CN109142374A (zh) * | 2018-08-15 | 2019-01-04 | 广州市心鉴智控科技有限公司 | 基于超小样本训练高效质检模型的方法及系统 |
CN109492627A (zh) * | 2019-01-22 | 2019-03-19 | 华南理工大学 | 一种基于全卷积网络的深度模型的场景文本擦除方法 |
CN111770321A (zh) * | 2019-03-27 | 2020-10-13 | 佳能株式会社 | 图像处理设备、摄像设备、图像处理方法和存储介质 |
CN110335330A (zh) * | 2019-07-12 | 2019-10-15 | 创新奇智(北京)科技有限公司 | 图像模拟生成方法及其系统、深度学习算法训练方法及电子设备 |
CN112308095A (zh) * | 2019-07-30 | 2021-02-02 | 顺丰科技有限公司 | 图片预处理及模型训练方法、装置、服务器及存储介质 |
US20210064859A1 (en) * | 2019-08-30 | 2021-03-04 | Canon Kabushiki Kaisha | Image processing system, image processing method, and storage medium |
CN111275139A (zh) * | 2020-01-21 | 2020-06-12 | 杭州大拿科技股份有限公司 | 手写内容去除方法、手写内容去除装置、存储介质 |
CN111488881A (zh) * | 2020-04-10 | 2020-08-04 | 杭州睿琪软件有限公司 | 文本图像中手写内容去除方法、装置、存储介质 |
CN111563512A (zh) * | 2020-04-30 | 2020-08-21 | 广东小天才科技有限公司 | 一种答案自动涂抹的方法、装置、电子设备及存储介质 |
CN111563510A (zh) * | 2020-04-30 | 2020-08-21 | 广东小天才科技有限公司 | 一种图像处理的方法和系统 |
CN112597925A (zh) * | 2020-12-28 | 2021-04-02 | 作业帮教育科技(北京)有限公司 | 手写字迹的识别/提取、擦除方法及擦除系统、电子设备 |
Non-Patent Citations (3)
Title |
---|
ALEXANDRA CARLSON ET AL.: "Modeling camera effects to improve visual learning from synthetic data", 《PROCEEDINGS OF THE EUROPEAN CONFERENCE ON COMPUTER VISION (ECCV) WORKSHOPS》, 14 September 2018 (2018-09-14) * |
叶亮: "地基云图像的云状识别技术研究", 《中国博士学位论文全文数据库 基础科学辑》, no. 2020, 15 January 2020 (2020-01-15) * |
蔡普庆: "成像光谱重建及纹理色差客观评估研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》, no. 2008, 15 September 2008 (2008-09-15) * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115565212A (zh) * | 2022-01-20 | 2023-01-03 | 荣耀终端有限公司 | 图像处理方法、神经网络模型训练方法及装置 |
CN115631103A (zh) * | 2022-10-17 | 2023-01-20 | 北京百度网讯科技有限公司 | 图像生成模型的训练方法和装置、图像生成方法及装置 |
CN115631103B (zh) * | 2022-10-17 | 2023-09-05 | 北京百度网讯科技有限公司 | 图像生成模型的训练方法和装置、图像生成方法及装置 |
CN118195930A (zh) * | 2022-12-09 | 2024-06-14 | 英特灵达信息技术(深圳)有限公司 | 图像去噪模型训练方法、图像去噪方法、装置及电子设备 |
CN115937050A (zh) * | 2023-03-02 | 2023-04-07 | 图兮数字科技(北京)有限公司 | 图像处理方法、装置、电子设备和存储介质 |
CN115937050B (zh) * | 2023-03-02 | 2023-10-13 | 图兮数字科技(北京)有限公司 | 图像处理方法、装置、电子设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113781356B (zh) | 2024-06-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113781356B (zh) | 图像去噪模型的训练方法、图像去噪方法、装置及设备 | |
CN108205674B (zh) | 社交app的内容识别方法、电子设备、存储介质及系统 | |
US11398016B2 (en) | Method, system, and computer-readable medium for improving quality of low-light images | |
CN112101386B (zh) | 文本检测方法、装置、计算机设备和存储介质 | |
CN111292272B (zh) | 图像处理方法、装置、介质以及电子设备 | |
CN113850238B (zh) | 文档检测方法、装置、电子设备及存储介质 | |
CN110163786A (zh) | 一种去除水印的方法、装置及设备 | |
CN109697442B (zh) | 一种字符识别模型的训练方法和装置 | |
CN111915635A (zh) | 支持自阅卷的试题解析信息生成方法及系统 | |
CN116645678A (zh) | 一种基于矢量图形绘制的图像处理方法及装置 | |
CN113688839B (zh) | 视频处理方法及装置、电子设备、计算机可读存储介质 | |
CN113516697A (zh) | 图像配准的方法、装置、电子设备及计算机可读存储介质 | |
CN113850239B (zh) | 多文档检测方法、装置、电子设备及存储介质 | |
CN111401465A (zh) | 训练样本优化方法、装置、设备及存储介质 | |
CN116777734A (zh) | 背景渗透图像的生成方法、装置、设备及存储介质 | |
CN114724144B (zh) | 文本识别方法、模型的训练方法、装置、设备及介质 | |
CN113850805B (zh) | 多文档检测方法、装置、电子设备及存储介质 | |
CN116977195A (zh) | 复原模型的调整方法、装置、设备及存储介质 | |
CN111556251A (zh) | 电子书生成方法、设备及介质 | |
CN112396009A (zh) | 一种基于全卷积神经网络模型的算题批改方法、算题批改装置 | |
CN112417920A (zh) | 基于高拍仪的扫描输入方法、装置、设备及介质 | |
CN113610064B (zh) | 笔迹识别方法和装置 | |
US9940698B1 (en) | Cleaning writing boards based on strokes | |
CN115019323B (zh) | 手写擦除方法、装置、电子设备及存储介质 | |
CN116541539A (zh) | 一种试卷对比方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |