CN113256490A - 文档图像的处理方法、装置及介质 - Google Patents

文档图像的处理方法、装置及介质 Download PDF

Info

Publication number
CN113256490A
CN113256490A CN202010095055.0A CN202010095055A CN113256490A CN 113256490 A CN113256490 A CN 113256490A CN 202010095055 A CN202010095055 A CN 202010095055A CN 113256490 A CN113256490 A CN 113256490A
Authority
CN
China
Prior art keywords
document image
processed
image
processing
illumination
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010095055.0A
Other languages
English (en)
Inventor
彭鑫
刘坚强
吴鹏杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Xiaomi Pinecone Electronic Co Ltd
Original Assignee
Beijing Xiaomi Pinecone Electronic Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Xiaomi Pinecone Electronic Co Ltd filed Critical Beijing Xiaomi Pinecone Electronic Co Ltd
Priority to CN202010095055.0A priority Critical patent/CN113256490A/zh
Publication of CN113256490A publication Critical patent/CN113256490A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformation in the plane of the image
    • G06T3/40Scaling the whole image or part thereof

Abstract

本公开是关于一种文档图像的处理方法、装置及介质。所述处理方法包括:根据处理设备的处理能力和预期的处理效果,将待处理文档图像缩放至预设尺寸;根据所述预设尺寸的待处理文档图像,获得第一光照背景图像;将所述第一光照图像放大,获得与所述待处理文档图像的尺寸一致的第二光照背景图像;基于所述待处理文档图像与所述第二光照背景图像,按照预设算法获取处理后文档图像。本公开所提供的文档图像的处理方法,通过先获得光照背景图像,再通过获得的光照背景图像获得处理后文档图像,可以有效降低处理难度,减少处理出现错误的情况。

Description

文档图像的处理方法、装置及介质
技术领域
本公开涉及计算机视觉领域,尤其涉及一种文档图像的处理方法、装置及介质。
背景技术
相关技术中,随着智能终端设备的普及,人们能够便捷的拍摄照片记录生活。而拍摄文档是一个重要的应用场景和应用类别。用户拍摄的文档图片相对于扫描件,常常受到光照和阴影的影响,容易出现背景与文字主体对比度低,内容不清晰的问题。这使得对于文档图片而言,优化和自动去阴影功能成为用户所亟需的功能。
发明内容
为克服相关技术中存在的问题,本公开提供一种文档图像的处理方法、装置及介质。
根据本公开实施例的第一方面,提供一种文档图像的处理方法,包括:
根据处理设备的处理能力和预期的处理效果,将待处理文档图像缩放至预设尺寸;
根据所述预设尺寸的待处理文档图像,获得第一光照背景图像;
将所述第一光照背景图像放大,获得与所述待处理文档图像的尺寸一致的第二光照背景图像;
基于所述待处理文档图像与所述第二光照背景图像,按照预设算法获取处理后文档图像。
其中,所述根据所述预设尺寸的待处理文档图像,获得第一光照背景图像包括:
基于所述预设尺寸的待处理文档图像得到初始光照背景图像;
基于所述预定尺寸的待处理文档图像,修正所述初始光照背景图像,得到所述第一光照背景图像。
其中,所述基于所述预设尺寸的待处理文档图像得到初始光照背景图像包括:
使用GAN模型,基于所述预设尺寸的待处理文档图像得到初始光照背景图像。
其中,所述基于所述预定尺寸的待处理文档图像,修正所述初始光照背景图像,得到所述第一光照背景图像包括:
将所述预定尺寸的待处理文档图像与所述初始光照背景图像按照像素级运算处理后,得到所述第一光照背景图像。
其中,所述基于所述待处理图像与所述第二光照图像,按照预设算法获取处理后文档图像包括:
按照下述算法获取所述处理后文档图像:
所述处理后文档图像=所述待处理文档图像/所述第二光照背景图像*255。
其中,所述处理方法还包括:
对所述第一光照图像进行平滑处理。
其中,所述处理方法还包括:
对所述处理后文档图像进行后处理。
根据本公开实施例的第二方面,提供一种文档图像的处理装置,包括:
缩放模块,被配置为根据处理设备的处理能力和预期的处理效果,将待处理文档图像缩放至预设尺寸;
处理模块,被配置为根据所述预设尺寸的待处理文档图像,获得第一光照背景图像;
所述缩放模块被配置为将所述第一光照图像放大,获得与所述待处理文档图像的尺寸一致的第二光照背景图像;
获取模块,被配置为基于所述待处理文档图像与所述第二光照背景图像,按照预设算法获取处理后文档图像。
其中,所述处理模块被配置为:
基于所述预设尺寸的待处理文档图像得到初始光照背景图像;
基于所述预定尺寸的待处理文档图像,修正所述初始光照背景图像,得到所述第一光照背景图像。
其中,所述处理模块被配置为:
使用GAN模型,基于所述预设尺寸的待处理文档图像得到初始光照背景图像。
其中,所述处理模块被配置为:
将所述预定尺寸的待处理文档图像与所述初始光照背景图像按照像素级运算处理后,得到所述第一光照背景图像。
其中,所述获得模块被配置为:
按照下述算法获取所述处理后文档图像:
所述处理后文档图像=所述待处理文档图像/所述第二光照背景图像*255。
其中,所述处理装置还包括:
平滑处理模块,被配置为对所述第一光照图像进行平滑处理。
其中,所述处理装置还包括:
后处理模块,被配置为对所述处理后文档图像进行后处理。
根据本公开实施例的第三方面,提供一种文档图像的处理装置,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
根据处理设备的处理能力和预期的处理效果,将待处理文档图像缩放至预设尺寸;
根据所述预设尺寸的待处理文档图像,获得第一光照背景图像;
将所述第一光照图像放大,获得与所述待处理文档图像的尺寸一致的第二光照背景图像;
基于所述待处理文档图像与所述第二光照背景图像,按照预设算法获取处理后文档图像。
根据本公开实施例的第四方面,提供一种非临时性计算机可读存储介质,当所述存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行一种文档图像的处理方法,所述处理方法包括:
根据处理设备的处理能力和预期的处理效果,将待处理文档图像缩放至预设尺寸;
根据所述预设尺寸的待处理文档图像,获得第一光照背景图像;
将所述第一光照图像放大,获得与所述待处理文档图像的尺寸一致的第二光照背景图像;
基于所述待处理文档图像与所述第二光照背景图像,按照预设算法获取处理后文档图像。
本公开的实施例提供的技术方案可以包括以下有益效果:本公开所提供的文档图像的处理方法,通过先获得光照背景图像,再通过获得的光照背景图像获得处理后文档图像,可以有效降低处理难度,减少处理出现错误的情况。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是根据一示例性实施例示出的待处理图像的示意图;
图2是根据一示例性实施例示出的一种文档图像处理方法的流程图;
图3为根据一示例性实施例示出的预设尺寸的待处理图像的示意图;
图4为根据一示例性实施例示出的第一光照背景图像示例图;
图5为图2中步骤22中根据预设尺寸的待处理文档图像,获得第一光照背景图像的方法的流程图;
图6为图5中步骤221中基于预设尺寸的待处理文档图像得到初始光照背景图像的方法的流程图;
图7为图5中步骤222中基于预定尺寸的待处理文档图像,修正初始光照背景图像,得到第一光照背景图像的方法的流程图;
图8是根据一示例性实施例示出的一种文档图像处理方法的流程图;
图9是根据一实施例示出的第二光照背景图像;
图10为图2中步骤24中基于待处理图像与第二光照背景图像,按照预设算法获取处理后文档图像的方法流程图;
图11为根据一示例性实施例示出的处理后文档图像的示意图
图12是根据一示例性实施例示出的一种文档图像处理方法的流程图;
图13是根据一示例性实施例示出的一种文档图像的处理装置的框图
图14是根据一示例性实施例示出的一种文档图像的处理装置的框图(移动终端的一般结构)。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
在本实施例中,处理设备可以是计算机,平板电脑,手机等电子设备。以手机为例,随着手机的普及,人们随时使用手机进行拍摄,其中,文档的拍摄已经成为一个重要的应用场景。图1是根据一示例性实施例示出的待处理图像的示意图。参考图1,由于文档拍摄受周围环境的影响,所拍摄的文档图像无法达到扫描件的效果,原本纯白背景的文档,拍摄为文档图片后,背景不再是纯白色,而且文档图像中还会受光照和阴影的影响,光照的地方比较亮,阴影的地方比较暗,出现背景与文字主体对比度交底,内容不清晰,影响用户体验。因此需要对文档图像进行后期处理,以期达到或接近扫描件的效果。在文档图像中,包括前景内容和背景内容,前景内容为文字,图片等,背景内容为除文字、图片以为的内容,在拍摄的文档图像中,背景为光照阴影部分,为便于说明,本文将光照阴影部分的背景称为光照背景。本公开所提供的文档图像的处理方法详细说明了如何减轻光照和阴影的影响,并提高前景和背景的对比度。
图2是根据一示例性实施例示出的一种文档图像处理方法的流程图,该文档图像处理方法应用于电子设备。参考图2,文档图像处理方法包括:
步骤S21,根据处理设备的处理能力和预期的处理效果,将待处理文档图像缩放至预设尺寸;
步骤S22,根据预设尺寸的待处理文档图像,获得第一光照图像;
步骤S23,将第一光照图像缩放,获得与待处理图像尺寸一致的第二光照图像;
步骤S24,基于待处理图像与第二光照图像,按照预设算法获取处理后文档图像。
本公开所提供的文档图像的处理方法,通过将待处理文档图像缩放至预设尺寸,以满足处理设备的处理能力,同时对预设尺寸下的文档图像进行处理,先获得第一光照背景图像,将所得到的第一光照背景图像恢复至原尺寸后,按照预设规则获取处理后文档图像,即的到去光照以及阴影的文档图像。本公开所提供的文档图像的处理方法,通过先获得光照背景图像,再通过获得的光照背景图像获得处理后文档图像,可以有效降低处理难度,减少处理出现错误的情况。
目前的电子设备,特别是移动设备,摄像装置具有很高的像素,所拍摄的图片具有很高的像素尺寸,如果在原始拍摄的图片的基础上进行图片处理,会有很高的运算需求,而普通的电子设备很难具备充足的运算能力,导致不能进行大型的图片处理工作,或者处理速度过慢,无法满足使用者正常的需求。如果将图像缩小后进行处理,在将处理后图像放大至原来的尺寸,又会出现边缘突变,背景不均匀等问题。
因此,本公开所提供的处理方法中,步骤21中,根据处理设备的处理能力和预期的处理效果,将待处理文档图像缩放至预设尺寸。以便于处理设备在自身的处理能力下,对待处理文档图像进行处理。
本公开实施例中提供了一种文档图像的处理方法。步骤22中,根据预设尺寸的待处理文档,获得第一光照背景图像。如图3所示。图3为根据一示例性实施例示出的预设尺寸的待处理图像的示意图。
图4为根据一示例性实施例示出的第一光照背景图像示例图。如图4所示,第一光照背景图像是对预定尺寸的待处理图3像进行的背景提取后得到的光照背景图像。
图5为根据一示例性实施例示出的获得第一光照背景图像的方法流程图。如图5所示,图2步骤22中根据预设尺寸的待处理文档图像,获得第一光照背景图像的方法包括:
步骤221,基于预设尺寸的待处理文档图像得到初始光照背景图像;
步骤222,基于预定尺寸的待处理文档图像,修正初始光照图像,得到第一光照背景图像。
在本公开中,步骤221中,可以使用任何方法实现基于预设尺寸的待处理文档图像得到初始光照背景图像。例如,可以选用GAN(Generative Adversarial Networks)模型对预设尺寸的待处理文档图像进行处理,得到初始光照背景图像。如图6所示,图6示出了,图5中,步骤221中基于预设尺寸的待处理文档图像得到初始光照背景图像的方法包括:
步骤2211,使用GAN模型,基于预设尺寸的待处理文档图像得到初始光照背景图像。
在本公开中,使用GAN(Generative Adversarial Networks)模型获取到初始光照背景图像,而不是直接获取到处理后文档图像,这样可以降低处理难度,且可以提高处理的准确度,降低处理错误率。在本公开中,应用GAN模型获取光照背景图像,由于光照背景图像自身具有均匀的特质,GAN模型不需要学习特别多的细节,降低了GAN模型的处理难度,能够保证最终得到的处理后文档图像中的有效文字和图片不会走样或者变形,极大地减少了处理错误。
GAN模型包括生成模型和判别模型,其中生成模型可以为CNN(ConvolutionalNeural Networks)网络编码器;判别模型可以为双线性插值网络和卷积模型构成的编码器。可以使用优化函数对GAN模型进行优化,优化函数可以包括多个加权损失函数。损失函数可以选择下列函数中的任意两个或以上:
L1损失函数(回归损失函数),图像梯度损失函数、判别器损失函数、VGG(visualgeometrygroup)CNN损失函数、PSNR(Peak Signal-to-Noise Ratio)损失函数、SSIM(structural similarity index)损失函数。
以全部使用上述损失函数为例,构建优化函数如下:
Loss=α1*LossL12*Lossgrad3*LossD4*Lossvgg5*LossPSNR6*LossSSIM
其中,Loss表示优化函数,LossL1表示L1损失函数,Lossgrad表示图像梯度损失函数,LossD表示辨别器损失函数,Lossvgg表示VGG CNN损失函数,LossPSNR表示PSNR损失函数,LossSSIM表示SSIM损失函数,α16表示权重值。
本公开实施例中提供了一种文档图像的处理方法。如图7所示,图7示出了图5中,步骤222中基于预定尺寸的待处理文档图像,修正初始光照背景图像,得到第一光照背景图像的方法包括:
步骤2221,将预定尺寸的待处理文档图像与初始光照背景图像按照像素级运算处理后,得到第一光照背景图像。
本公开中,在获得初始光照背景图像后,为了提高获得的光照背景图像的准确性,对获得的初始光照背景图像进行修正。可以将预设尺寸的待处理文档图像与初始光照背景图像按照像素级运算进行处理,例如可以按照像素级乘法或者按照来看像素级加法进行运算以对初始光照背景图像进行修正,得到第一光照背景图像。本公开实施例中提供了一种文档图像的处理方法。在本公开中,文档图像的处理方法还包括对第一光照背景图像进行平滑处理,如图8所示,图8中示出了文档图像的处理方法包括:
步骤223,对第一光照背景图像进行平滑处理。
为了使得到的第一光照背景图像均匀,同时减轻文字或者图片周围在使用GAN模型进行处理时,处理不准确而导致文字或者图片留下阴影区域而导致视觉上文字模糊的问题,对第一光照背景图形进行平滑处理。处理方式可以选择任意能达到上述效果的方式,例如可以选择高斯卷积进行模糊处理。
本公开实施例中提供了一种文档图像的处理方法。为了能得到与待处理文档图像尺寸一致的处理后文档,将第一光照背景图像进行缩放,获得与待处理图像尺寸一致的第二光照背景图像;图9是根据一实施例示出的第二光照背景图像。
在得到第二光照背景图像后,基于待处理图像与第二光照背景图像,按照预设算法获取处理后文档图像。如图10所示,图10示出了图2中,步骤24中基于待处理图像与第二光照背景图像,按照预设算法获取处理后文档图像的方法包括:
步骤241,按照下述算法获取处理后文档图像:
处理后文档图像=待处理文档图像/第二光照图像*255。
本公开中,通过上述算法使用原始待处理文档与第二光照背景图像进行除法运算,在待处理文档图像中,去除光照背景,由于光照背景图是均匀平滑的,因此使得去除光照背景后的处理后文档图像中,背景均匀,前景突出,文字不会出现毛边,变形等影响视觉的缺陷。
图11为根据一示例性实施例示出的处理后文档图像的示意图。如图11所示,在处理后文档图像中,已经去除了待处理图像中的光照阴影的影响,而作为前景的文字,并未出现边缘突出等问题,有效改善了图像的视觉效果。由于是针对缩小后的文档图像进行的提取第一光照背景图像的操作,降低了对运算能力需求,使其可以在常规设备上运行。
本公开实施例中提供了一种文档图像的处理方法。在本公开中,在得到处理后文档图片后,为了使处理后文档图片的整体对比度、加深文字等前景颜色等效果,本公开还对处理后文档图片进行了后处理,如图12所示,图12中示出了文档图像的处理方法包括:
步骤25,对处理后文档图片进行后处理。
后处理方式可以包括任何可以增加处理后文档图片的整体对比度、加深文字等前景颜色等效果的方式,例如,可以对整个图片进行对比度拉伸,加深文字部分的灰度,和/或进一步加深文字的颜色。
本公开通过使用GAN模型,基于待处理文档图像获得初步光照背景图像,并经过修正获得第一光照背景图像,并对所获得的的第一光照背景图像进行缩放获得与待处理文档图像尺寸一致的第二光照背景图像,并基于第二光照背景图和待处理文档图像,得到处理后文档图像,可以精确地的获得包括光照阴影部分的第二光照背景图像,在待处理文档图像上去除掉第二光照背景图像后,可以准确地提取包括文字、图片等部分的前景部分,有效提高文档图片的处理效果。本公开所提供的文档图像的处理方法可以处理各种复杂文档图像以及复杂颜色对比度的文档图片。
本公开所提供的文档图片的处理方法,可以根据处理设备的处理能力,将待处理文档图像进行缩放,以便于处理设备进行处理,本公开所提供的文档图片的处理方法可以是适用于任何处理设备,其普适性强。
本公开是通过GAN模块获取第一光照背景图像,而不是得到处理后文档图片,其处理难度大大降低,能够保证最终得到的处理后文档图像中的有效文字和图片不会走样或者变形,极大地减少了处理错误;且这样的处理方式,可以提高时效,降低耗时,使得该方法可以应用于任何处理设备,例如手机等终端设备,以能替代昂贵的扫描设备。
为了对比本方法与市场已有产品的方法,选取了多种类型的场景,对200张实拍文档图像进行对比分析。该200张实拍文档图像包括手写笔记、论文合同、发票等。并从五个维度与市场已有产品进行了对比,对比结果参见表1。表1中按照单项满分5分为例给出的对比分数。由表1可以看出,经过本公开提供的文档图像的处理方法处理后文档图片具有较强的色彩保留以及文字清晰度,提高了用户体验。
表1:与市场已有产品对比
市场已有产品 本公开提供的方法
色彩保留 4.41 4.74
细节保留 4.59 4.81
文字清晰度 4.59 4.83
噪点/色块 4.03 4.58
阴影去除 2.1 4.41
本公开实施例中提供了一种文档图像的处理装置。图13是根据一示例性实施例示出的一种文档图像的处理装置的框图。参照图13,该装置包括缩放模块101,处理模块102,获取模块103。
缩放模块,被被配置为根据处理设备的处理能力和预期的处理效果,将待处理文档图像缩放至预设尺寸;
处理模块,被配置为根据预设尺寸的待处理文档图像,获得第一光照背景图像;
缩放模块被配置为将第一光照图像放大,获得与待处理文档图像的尺寸一致的第二光照背景图像;
获取模块,被配置为基于待处理文档图像与第二光照背景图像,按照预设算法获取处理后文档图像。
其中,处理模块被配置为:
基于预设尺寸的待处理文档图像得到初始光照背景图像;
基于预定尺寸的待处理文档图像,修正初始光照背景图像,得到第一光照背景图像。
其中,处理模块被配置为:
使用GAN模型,基于预设尺寸的待处理文档图像得到初始光照背景图像。
其中,处理模块被配置为:
将预定尺寸的待处理文档图像与初始光照背景图像按照像素级运算处理后,得到第一光照背景图像。
其中,获得模块被配置为:
按照下述算法获取处理后文档图像:
处理后文档图像=待处理文档图像/第二光照背景图像*255。
如图11所示,处理装置还包括:
平滑处理模块104,被配置为对第一光照图像进行平滑处理。
如图11所示,处理装置还包括:
后处理模块105,被配置为对处理后文档图像进行后处理。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图14是根据一示例性实施例示出的一种用于文档图像的处理装置1400的框图。例如,装置1400可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图14,装置1400可以包括以下一个或多个组件:处理组件1402,存储器1404,电力组件1406,多媒体组件1408,音频组件1410,输入/输出(I/O)的接口1412,传感器组件1414,以及通信组件1416。
处理组件1402通常控制装置1400的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件1402可以包括一个或多个处理器1420来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件1402可以包括一个或多个模块,便于处理组件1402和其他组件之间的交互。例如,处理组件1402可以包括多媒体模块,以方便多媒体组件1408和处理组件1402之间的交互。
存储器1404被配置为存储各种类型的数据以支持在设备1400的操作。这些数据的示例包括用于在装置1400上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器1404可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电力组件1406为装置1400的各种组件提供电力。电力组件1406可以包括电源管理系统,一个或多个电源,及其他与为装置1400生成、管理和分配电力相关联的组件。
多媒体组件1408包括在所述装置1400和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件1408包括一个前置摄像头和/或后置摄像头。当设备1400处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件1410被配置为输出和/或输入音频信号。例如,音频组件1410包括一个麦克风(MIC),当装置1400处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器1404或经由通信组件1416发送。在一些实施例中,音频组件1410还包括一个扬声器,用于输出音频信号。
I/O接口1412为处理组件1402和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件1414包括一个或多个传感器,用于为装置1400提供各个方面的状态评估。例如,传感器组件1414可以检测到设备1400的打开/关闭状态,组件的相对定位,例如所述组件为装置1400的显示器和小键盘,传感器组件1414还可以检测装置1400或装置1400一个组件的位置改变,用户与装置1400接触的存在或不存在,装置1400方位或加速/减速和装置1400的温度变化。传感器组件1414可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件1414还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件1414还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件1416被配置为便于装置1400和其他设备之间有线或无线方式的通信。装置1400可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件1416经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件1416还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置1400可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器1404,上述指令可由装置1400的处理器1420执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行一种文档图像的处理方法,所述处理方法包括:
根据处理设备的处理能力和预期的处理效果,将待处理文档图像缩放至预设尺寸;
根据所述预设尺寸的待处理文档图像,获得第一光照背景图像;
将所述第一光照图像放大,获得与所述待处理文档图像的尺寸一致的第二光照背景图像;
基于所述待处理文档图像与所述第二光照背景图像,按照预设算法获取处理后文档图像。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

Claims (16)

1.一种文档图像的处理方法,应用于电子设备,其特征在于,所述处理方法包括:
根据处理设备的处理能力和预期的处理效果,将待处理文档图像缩放至预设尺寸;
根据所述预设尺寸的待处理文档图像,获得第一光照背景图像;
将所述第一光照背景图像放大,获得与所述待处理文档图像的尺寸一致的第二光照背景图像;
基于所述待处理文档图像与所述第二光照背景图像,按照预设算法获取处理后文档图像。
2.根据权利要求1所述的文档图像的处理方法,其特征在于,所述根据所述预设尺寸的待处理文档图像,获得第一光照背景图像包括:
基于所述预设尺寸的待处理文档图像得到初始光照背景图像;
基于所述预定尺寸的待处理文档图像,修正所述初始光照背景图像,得到所述第一光照背景图像。
3.根据权利要求2所述的文档图像的处理方法,其特征在于,所述基于所述预设尺寸的待处理文档图像得到初始光照背景图像包括:
使用GAN模型,基于所述预设尺寸的待处理文档图像得到初始光照背景图像。
4.根据权利要求2所述的文档图像的处理方法,其特征在于,所述基于所述预定尺寸的待处理文档图像,修正所述初始光照背景图像,得到所述第一光照背景图像包括:
将所述预定尺寸的待处理文档图像与所述初始光照背景图像按照像素级运算处理后,得到所述第一光照背景图像。
5.根据权利要求1所述的文档图像的处理方法,其特征在于,所述基于所述待处理图像与所述第二光照图像,按照预设算法获取处理后文档图像包括:
按照下述算法获取所述处理后文档图像:
所述处理后文档图像=所述待处理文档图像/所述第二光照背景图像*255。
6.根据权利要求1所述的文档图像的处理方法,其特征在于,所述处理方法还包括:
对所述第一光照图像进行平滑处理。
7.根据权利要求1所述的文档图像的处理方法,其特征在于,所述处理方法还包括:
对所述处理后文档图像进行后处理。
8.一种文档图像的处理装置,其特征在于,所述处理装置包括:
缩放模块,被配置为根据处理设备的处理能力和预期的处理效果,将待处理文档图像缩放至预设尺寸;
处理模块,被配置为根据所述预设尺寸的待处理文档图像,获得第一光照背景图像;
所述缩放模块被配置为将所述第一光照图像放大,获得与所述待处理文档图像的尺寸一致的第二光照背景图像;
获取模块,被配置为基于所述待处理文档图像与所述第二光照背景图像,按照预设算法获取处理后文档图像。
9.根据权利要求8所述的文档图像的处理装置,其特征在于,所述处理模块被配置为:
基于所述预设尺寸的待处理文档图像得到初始光照背景图像;
基于所述预定尺寸的待处理文档图像,修正所述初始光照背景图像,得到所述第一光照背景图像。
10.根据权利要求9所述的文档图像的处理装置,其特征在于,所述处理模块被配置为:
使用GAN模型,基于所述预设尺寸的待处理文档图像得到初始光照背景图像。
11.根据权利要求9所述的文档图像的处理装置,其特征在于,所述处理模块被配置为:
将所述预定尺寸的待处理文档图像与所述初始光照背景图像按照像素级运算处理后,得到所述第一光照背景图像。
12.根据权利要求8所述的文档图像的处理装置,其特征在于,所述获得模块被配置为:
按照下述算法获取所述处理后文档图像:
所述处理后文档图像=所述待处理文档图像/所述第二光照背景图像*255。
13.根据权利要求8所述的文档图像的处理装置,其特征在于,所述处理装置还包括:
平滑处理模块,被配置为对所述第一光照图像进行平滑处理。
14.根据权利要求8所述的文档图像的处理装置,其特征在于,所述处理装置还包括:
后处理模块,被配置为对所述处理后文档图像进行后处理。
15.一种文档图像的处理装置,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
根据处理设备的处理能力和预期的处理效果,将待处理文档图像缩放至预设尺寸;
根据所述预设尺寸的待处理文档图像,获得第一光照背景图像;
将所述第一光照图像放大,获得与所述待处理文档图像的尺寸一致的第二光照背景图像;
基于所述待处理文档图像与所述第二光照背景图像,按照预设算法获取处理后文档图像。
16.一种非临时性计算机可读存储介质,当所述存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行一种文档图像的处理方法,所述处理方法包括:
根据处理设备的处理能力和预期的处理效果,将待处理文档图像缩放至预设尺寸;
根据所述预设尺寸的待处理文档图像,获得第一光照背景图像;
将所述第一光照图像放大,获得与所述待处理文档图像的尺寸一致的第二光照背景图像;
基于所述待处理文档图像与所述第二光照背景图像,按照预设算法获取处理后文档图像。
CN202010095055.0A 2020-02-13 2020-02-13 文档图像的处理方法、装置及介质 Pending CN113256490A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010095055.0A CN113256490A (zh) 2020-02-13 2020-02-13 文档图像的处理方法、装置及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010095055.0A CN113256490A (zh) 2020-02-13 2020-02-13 文档图像的处理方法、装置及介质

Publications (1)

Publication Number Publication Date
CN113256490A true CN113256490A (zh) 2021-08-13

Family

ID=77219937

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010095055.0A Pending CN113256490A (zh) 2020-02-13 2020-02-13 文档图像的处理方法、装置及介质

Country Status (1)

Country Link
CN (1) CN113256490A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103310422A (zh) * 2013-06-28 2013-09-18 新晨易捷(北京)科技有限公司 获取图像的方法及装置
CN104463161A (zh) * 2013-09-24 2015-03-25 柯尼卡美能达美国研究所有限公司 使用自动图像修补的彩色文档图像分割和二值化
US20170124412A1 (en) * 2015-10-30 2017-05-04 Xiaomi Inc. Method, apparatus, and computer-readable medium for area recognition
CN109035274A (zh) * 2018-08-23 2018-12-18 湖北工业大学 基于背景估计与u型卷积神经网络的文档图像二值化方法
CN110458918A (zh) * 2019-08-16 2019-11-15 北京百度网讯科技有限公司 用于输出信息的方法和装置
CN110516577A (zh) * 2019-08-20 2019-11-29 Oppo广东移动通信有限公司 图像处理方法、装置、电子设备及存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103310422A (zh) * 2013-06-28 2013-09-18 新晨易捷(北京)科技有限公司 获取图像的方法及装置
CN104463161A (zh) * 2013-09-24 2015-03-25 柯尼卡美能达美国研究所有限公司 使用自动图像修补的彩色文档图像分割和二值化
US20170124412A1 (en) * 2015-10-30 2017-05-04 Xiaomi Inc. Method, apparatus, and computer-readable medium for area recognition
CN109035274A (zh) * 2018-08-23 2018-12-18 湖北工业大学 基于背景估计与u型卷积神经网络的文档图像二值化方法
CN110458918A (zh) * 2019-08-16 2019-11-15 北京百度网讯科技有限公司 用于输出信息的方法和装置
CN110516577A (zh) * 2019-08-20 2019-11-29 Oppo广东移动通信有限公司 图像处理方法、装置、电子设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
完颜勇: "基于对比度增强和背景估计的文档图像二值化", 《电子科技》, vol. 31, no. 4, pages 20 - 24 *

Similar Documents

Publication Publication Date Title
CN105095881B (zh) 人脸识别方法、装置及终端
CN106127751B (zh) 图像检测方法、装置以及系统
CN111461182B (zh) 图像处理方法、图像处理装置及存储介质
CN107967459B (zh) 卷积处理方法、装置及存储介质
CN109784164B (zh) 前景识别方法、装置、电子设备及存储介质
US11847769B2 (en) Photographing method, terminal, and storage medium
CN109509195B (zh) 前景处理方法、装置、电子设备及存储介质
CN106454411B (zh) 台标处理方法和装置
CN112200040A (zh) 遮挡图像检测方法、装置及介质
CN110796012B (zh) 图像处理方法、装置、电子设备及可读存储介质
CN111625213B (zh) 画面显示方法、装置和存储介质
CN109003272B (zh) 图像处理方法、装置及系统
CN114500821B (zh) 拍照方法及装置、终端及存储介质
CN107992894B (zh) 图像识别方法、装置及计算机可读存储介质
CN107730443B (zh) 图像处理方法、装置及用户设备
CN113660531A (zh) 视频处理方法及装置、电子设备和存储介质
CN112288657A (zh) 图像处理方法、图像处理装置及存储介质
US11417028B2 (en) Image processing method and apparatus, and storage medium
CN113256490A (zh) 文档图像的处理方法、装置及介质
CN114120034A (zh) 一种图像分类方法、装置、电子设备及存储介质
CN115641269A (zh) 一种图像修补方法、装置及可读存储介质
CN114418865A (zh) 图像处理方法、装置、设备及存储介质
CN106874444B (zh) 图片处理方法及装置
CN113255412B (zh) 文档图像的处理方法、装置及介质
CN114648478A (zh) 图像处理方法、装置、芯片、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination