CN111767924B - 图像处理方法、图像处理装置、电子设备、存储介质 - Google Patents
图像处理方法、图像处理装置、电子设备、存储介质 Download PDFInfo
- Publication number
- CN111767924B CN111767924B CN202010636558.4A CN202010636558A CN111767924B CN 111767924 B CN111767924 B CN 111767924B CN 202010636558 A CN202010636558 A CN 202010636558A CN 111767924 B CN111767924 B CN 111767924B
- Authority
- CN
- China
- Prior art keywords
- image
- binarized
- pixel
- pixels
- processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims abstract description 149
- 238000003672 processing method Methods 0.000 title claims abstract description 50
- 230000002194 synthesizing effect Effects 0.000 claims abstract description 34
- 230000015654 memory Effects 0.000 claims description 26
- 238000001914 filtration Methods 0.000 claims description 21
- 238000013528 artificial neural network Methods 0.000 claims description 9
- 238000011084 recovery Methods 0.000 claims description 6
- 238000000034 method Methods 0.000 description 43
- 238000010586 diagram Methods 0.000 description 17
- 238000004891 communication Methods 0.000 description 16
- 230000015572 biosynthetic process Effects 0.000 description 9
- 238000003786 synthesis reaction Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 8
- 230000006835 compression Effects 0.000 description 7
- 238000007906 compression Methods 0.000 description 7
- 239000002131 composite material Substances 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 238000002156 mixing Methods 0.000 description 5
- 238000012549 training Methods 0.000 description 5
- 238000007781 pre-processing Methods 0.000 description 4
- 230000002902 bimodal effect Effects 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 238000010187 selection method Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 241000699670 Mus sp. Species 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 239000004984 smart glass Substances 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/28—Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/20—Image enhancement or restoration by the use of local operators
-
- G06T5/73—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/13—Edge detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10004—Still image; Photographic image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20212—Image combination
- G06T2207/20221—Image fusion; Image merging
Abstract
一种图像处理方法、图像处理装置、电子设备、非瞬时性计算机可读存储介质。图像处理方法包括:获取原始图像,其中,原始图像包括至少一个对象;通过第一二值化模型对原始图像进行处理,以得到原始图像的第一二值化图像;对第一二值化图像进行处理,以得到像素外接轮廓图像,其中,像素外接轮廓图像包括多个外接轮廓像素,多个外接轮廓像素包围的区域内的像素为至少一个对象中的至少部分对象对应的像素;通过第二二值化模型对原始图像进行处理,以得到第二二值化图像;根据多个外接轮廓像素在像素外接轮廓图像中的位置,对第二二值化图像和第一二值化图像进行合成,以得到合成图像,其中,合成图像为二值化图像。
Description
技术领域
本公开的实施例涉及一种图像处理方法、图像处理装置、电子设备、非瞬时性计算机可读存储介质。
背景技术
在数字图像处理中,图像二值化(Image Binarization)处理就是将图像上的像素点的灰度值设置为0或255,对图像进行图像二值化处理可以使图像中的数据量大为减少,从而能凸显出感兴趣的目标的轮廓,此外,也能方便对图像进行处理和分析,例如,便于提取图像中的信息。
发明内容
本公开至少一实施例提供一种图像处理方法,包括:获取原始图像,其中,所述原始图像包括至少一个对象;通过第一二值化模型对所述原始图像进行处理,以得到所述原始图像的第一二值化图像;对所述第一二值化图像进行处理,以得到像素外接轮廓图像,其中,所述像素外接轮廓图像包括多个外接轮廓像素,所述多个外接轮廓像素包围的区域内的像素为所述至少一个对象中的至少部分对象对应的像素;通过第二二值化模型对所述原始图像进行处理,以得到第二二值化图像;根据所述多个外接轮廓像素在所述像素外接轮廓图像中的位置,对所述第二二值化图像和所述第一二值化图像进行合成,以得到合成图像,其中,所述合成图像为二值化图像。
例如,在本公开至少一实施例提供的图像处理方法中,通过所述第一二值化模型对所述原始图像进行处理,以得到所述原始图像的第一二值化图像,包括:对所述原始图像进行压缩处理,以得到输入图像,其中,所述输入图像的尺寸小于所述原始图像的尺寸;通过所述第一二值化模型对所述输入图像进行处理,以得到所述原始图像的第一二值化图像。
例如,在本公开至少一实施例提供的图像处理方法中,通过所述第一二值化模型对所述输入图像进行处理,以得到所述原始图像的第一二值化图像,包括:通过所述第一二值化模型对所述输入图像进行处理,以得到所述输入图像的二值化预测图像;将所述二值化预测图像进行恢复尺寸处理,以得到所述第一二值化图像,其中,所述第一二值化图像的尺寸和所述原始图像的尺寸相同。
例如,在本公开至少一实施例提供的图像处理方法中,对所述第一二值化图像进行处理,以得到像素外接轮廓图像,包括:对所述第一二值化图像进行模糊化处理,得到模糊图像;对所述模糊图像和所述第一二值化图像进行异或处理,以得到所述像素外接轮廓图像。
例如,在本公开至少一实施例提供的图像处理方法中,根据所述像素外接轮廓图像中的所述多个外接轮廓像素的位置,对所述第二二值化图像和所述第一二值化图像进行合成,以得到所述合成图像,包括:获取所述像素外接轮廓图像中的所述多个外接轮廓像素的位置;提取所述第二二值化图像中与所述多个外接轮廓像素的位置对应的位置处的多个目标第二二值化像素;根据所述第二二值化图像和所述第一二值化图像的像素对应关系,将所述第二二值化图像中的所述多个目标第二二值化像素分别合成到所述第一二值化图像中的相同位置,以得到所述合成图像。
例如,在本公开至少一实施例提供的图像处理方法中,所述第二二值化图像中的所有第二二值化像素排列为n行m列,所述第一二值化图像中的所有第一二值化像素排列为n行m列,所述合成图像中的所有合成像素排列为n行m列,根据所述第二二值化图像和所述第一二值化图像的像素对应关系,将所述第二二值化图像中的所述多个目标第二二值化像素分别合成到所述第一二值化图像中的相同位置,包括:确定所述多个目标第二二值化像素中的第q个目标第二二值化像素,其中,所述第q个目标第二二值化像素位于所述第二二值化图像的第i行第j列;确定所述第一二值化图像中的位于所述第i行第j列的第q个目标第一二值化像素;将所述第q个目标第一二值化像素的灰阶值替换为所述第q个目标第二二值化像素的灰阶值,以得到所述合成图像中位于所述第i行第j列的第q个目标合成像素,其中,所述第q个目标合成像素的灰阶值为所述第q个目标第二二值化像素的灰阶值,n、m、q、i、j均为正整数,且i小于等于n,j小于等于m,q小于等于所述多个目标第二二值化像素的数量。
例如,在本公开至少一实施例提供的图像处理方法中,通过第二二值化模型对所述原始图像进行处理,以得到第二二值化图像,包括:对所述原始图像进行灰度化处理,得到灰度图像;根据第一阈值,对所述灰度图像进行处理,得到中间二值化图像;以所述中间二值化图像为导向图,对所述灰度图像进行导向滤波处理,得到滤波图像;根据第二阈值,确定所述滤波图像中的高值像素点,其中,所述高值像素点的灰度值大于所述第二阈值;根据预设扩充系数,对所述高值像素点的灰度值进行扩充处理,得到扩充图像;对所述扩充图像进行清晰化处理,得到清晰图像;以及对所述清晰图像的对比度进行调整,得到所述第二二值化图像。
例如,在本公开至少一实施例提供的图像处理方法中,所述第一二值化模型为基于神经网络的模型。
本公开至少一实施例提供一种图像处理装置,包括:获取模块,用于获取原始图像,其中,所述原始图像包括至少一个对象;第一二值化模块,用于通过第一二值化模型对所述原始图像进行处理,以得到所述原始图像的第一二值化图像;处理模块,用于对所述第一二值化图像进行处理,以得到像素外接轮廓图像,其中,所述像素外接轮廓图像包括多个外接轮廓像素,所述多个外接轮廓像素包围的区域内的像素为所述至少一个对象中的至少部分对象对应的像素;第二二值化模块,用于通过第二二值化模型对所述原始图像进行处理,以得到第二二值化图像;合成模块,用于根据所述多个外接轮廓像素在所述像素外接轮廓图像中的位置,对所述第二二值化图像和所述第一二值化图像进行合成,以得到所述合成图像,其中,所述合成图像为二值化图像。
例如,在本公开至少一实施例提供的图像处理装置中,所述第一二值化模块执行通过第一二值化模型对所述原始图像进行处理,以得到所述原始图像的第一二值化图像的操作时,包括执行以下操作:对所述原始图像进行压缩处理,以得到输入图像,其中,所述输入图像的尺寸小于所述原始图像的尺寸;通过所述第一二值化模型对所述输入图像进行处理,以得到所述原始图像的第一二值化图像。
例如,在本公开至少一实施例提供的图像处理装置中,所述第一二值化模块执行通过所述第一二值化模型对所述输入图像进行处理,以得到所述原始图像的第一二值化图像的操作时,包括执行以下操作:通过所述第一二值化模型对所述输入图像进行处理,以得到所述输入图像的二值化预测图像;将所述二值化预测图像进行恢复尺寸处理,以得到所述第一二值化图像,其中,所述第一二值化图像的尺寸和所述原始图像的尺寸相同。
例如,在本公开至少一实施例提供的图像处理装置中,所述处理模块执行对所述第一二值化图像进行处理,以得到像素外接轮廓图像的操作时,包括执行以下操作:对所述第一二值化图像进行模糊化处理,得到模糊图像;对所述模糊图像和所述第一二值化图像进行异或处理,以得到所述像素外接轮廓图像。
例如,在本公开至少一实施例提供的图像处理装置中,所述合成模块执行根据所述像素外接轮廓图像中的所述多个外接轮廓像素的位置,对所述第二二值化图像和所述第一二值化图像进行合成,以得到所述原始图像的合成图像的操作时,包括执行以下操作:获取所述像素外接轮廓图像中的所述多个外接轮廓像素的位置;提取所述第二二值化图像中与所述多个外接轮廓像素的位置对应的位置处的多个目标第二二值化像素;根据所述第二二值化图像和所述第一二值化图像的像素对应关系,将所述第二二值化图像中的所述多个目标第二二值化像素分别合成到所述第一二值化图像中的相同位置,以得到所述原始图像的合成图像。
例如,在本公开至少一实施例提供的图像处理装置中,所述第二二值化图像中的所有第二二值化像素排列为n行m列,所述第一二值化图像中的所有第一二值化像素排列为n行m列,所述合成图像中的所有合成像素排列为n行m列,所述合成模块执行根据所述第二二值化图像和所述第一二值化图像的像素对应关系,将所述第二二值化图像中的所述多个目标第二二值化像素分别合成到所述第一二值化图像中的相同位置的操作时,包括执行以下操作:确定所述多个目标第二二值化像素中的第q个目标第二二值化像素,其中,所述第q个目标第二二值化像素位于所述第二二值化图像的第i行第j列;确定所述第一二值化图像中的位于所述第i行第j列的第q个目标第一二值化像素;将所述第q个目标第一二值化像素的灰阶值替换为所述第q个目标第二二值化像素的灰阶值,以得到所述合成图像中位于所述第i行第j列的第q个目标合成像素,其中,所述第q个目标合成像素的灰阶值为所述第q个目标第二二值化像素的灰阶值,n、m、q、i、j均为正整数,且i小于等于n,j小于等于m,q小于等于所述多个目标第二二值化像素的数量。
例如,在本公开至少一实施例提供的图像处理装置中,所述第二二值化模块包括:灰度化模块,用于对所述原始图像进行灰度化处理,得到灰度图像;中间二值化模块,用于根据第一阈值,对所述灰度图像进行处理,得到中间二值化图像;滤波模块,用于以所述中间二值化图像为导向图,对所述灰度图像进行导向滤波处理,得到滤波图像;确定模块,用于根据第二阈值,确定所述滤波图像中的高值像素点,其中,所述高值像素点的灰度值大于所述第二阈值;扩充模块,用于根据预设扩充系数,对所述高值像素点的灰度值进行扩充处理,得到扩充图像;清晰化模块,用于对所述扩充图像进行清晰化处理,得到清晰图像,对所述清晰图像的对比度进行调整,得到所述第二二值化图像。
本公开至少一实施例提供一种电子设备,包括:存储器,用于非瞬时性地存储计算机可读指令;处理器,用于运行所述计算机可读指令,所述计算机可读指令被所述处理器运行时实现根据本公开任一实施例所述的图像处理方法。
本公开至少一实施例提供一种非瞬时性计算机可读存储介质,其中,所述非瞬时性计算机可读存储介质存储有计算机可读指令,所述计算机可读指令被处理器执行时实现根据本公开任一实施例所述的图像处理方法。
附图说明
为了更清楚地说明本公开实施例的技术方案,下面将对实施例的附图作简单地介绍,显而易见地,下面描述中的附图仅仅涉及本公开的一些实施例,而非对本公开的限制。
图1为本公开至少一实施例提供的一种图像处理方法的示意性流程图;
图2为本公开至少一实施例提供的一种原始图像的示意图;
图3示出了本公开一实施例提供的一种输入图像;
图4为本公开一实施例提供的第一二值化图像的示意图;
图5为本公开一实施例提供的一种模糊图像的示意图;
图6为本公开一实施例提供的一种像素外接轮廓图像;
图7为本公开一实施例提供的一种第二二值化图像的示意图;
图8为本公开一实施例提供的一种合成图像的示意图;
图9为本公开至少一实施例提供的一种图像处理装置的示意性框图;
图10为本公开至少一实施例提供的一种电子设备的示意性框图;
图11为本公开至少一实施例提供的一种非瞬时性计算机可读存储介质的示意图;
图12为本公开至少一实施例提供的一种硬件环境的示意图。
具体实施方式
为了使得本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例的附图,对本公开实施例的技术方案进行清楚、完整地描述。显然,所描述的实施例是本公开的一部分实施例,而不是全部的实施例。基于所描述的本公开的实施例,本领域普通技术人员在无需创造性劳动的前提下所获得的所有其他实施例,都属于本公开保护的范围。
除非另外定义,本公开使用的技术术语或者科学术语应当为本公开所属领域内具有一般技能的人士所理解的通常意义。本公开中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电性的连接,不管是直接的还是间接的。“上”、“下”、“左”、“右”等仅用于表示相对位置关系,当被描述对象的绝对位置改变后,则该相对位置关系也可能相应地改变。
为了保持本公开实施例的以下说明清楚且简明,本公开省略了部分已知功能和已知部件的详细说明。
本公开至少一实施例提供一种图像处理方法、图像处理装置、电子设备、非瞬时性计算机可读存储介质。图像处理方法包括:获取原始图像,其中,原始图像包括至少一个对象;通过第一二值化模型对原始图像进行处理,以得到原始图像的第一二值化图像;对第一二值化图像进行处理,以得到像素外接轮廓图像,其中,像素外接轮廓图像包括多个外接轮廓像素,多个外接轮廓像素包围的区域内的像素为至少一个对象中的至少部分对象对应的像素;通过第二二值化模型对原始图像进行处理,以得到第二二值化图像;根据像素外接轮廓图像中的多个外接轮廓像素的位置,对第二二值化图像和第一二值化图像进行合成,以得到原始图像的合成图像。例如,合成图像为二值化图像。
该图像处理方法能够可以将原始图像(例如,彩色图像或不清晰的图像)转换为黑白对比较为明显且清晰的二值化图像,有效提高二值化图像的质量,提高图像内容的辨识度,此外,由于转换后的图像噪声干扰较少且黑白对比明显,从而可以有效改善打印效果。
需要说明的是,本公开实施例提供的图像处理方法可应用于本公开实施例提供的图像处理装置,该图像处理装置可被配置于电子设备上。该电子设备可以是个人计算机、移动终端等,该移动终端可以是手机、平板电脑等具有各种操作系统的硬件设备。
下面结合附图对本公开的实施例进行详细说明,但是本公开并不限于这些具体的实施例。
图1为本公开至少一实施例提供的一种图像处理方法的示意性流程图;图2为本公开至少一实施例提供的一种原始图像的示意图。
例如,如图1所示,本公开实施例提供的图像处理方法包括步骤S10至S14。
如图1所示,首先,图像处理方法包括步骤S10:获取原始图像。
例如,原始图像包括至少一个对象,对象可以为字符,字符可以包括中文(例如,汉字或拼音)、英文、日文、法文、韩文、拉丁文、数字等,此外,对象还可以包括各种符号(例如,大于符号、小于符号、百分号等)和各种图形等。至少一个对象可以包括印刷或者机器输入的字符,也可以包括手写字符。例如,如图2所示,在一些实施例中,原始图像中的对象可以包括印刷体的单词和字母(例如,英文、日文、法文、韩文、德文、拉丁文等不同国家的语言和文字)、印刷体的数字(例如,日期、重量、尺寸等)、印书体的符号和图像等、手写的单词和字母、手写的数字、手写的符号和图形等。
例如,原始图像可以为各种类型的图像,例如,可以为购物清单的图像、餐饮小票的图像、试卷的图像、合同的图像等。如图2所示,原始图像可以为信件的图像。
例如,原始图像的形状可以为矩形等。原始图像的形状和尺寸等可以由用户根据实际情况自行设定。
例如,原始图像可以为通过图像采集装置(例如,数码相机或手机等)拍摄的图像,原始图像可以为灰度图像,也可以为彩色图像。需要说明的是,原始图像是指以可视化方式呈现待处理物体(例如,试卷、合作、购物小票等)的形式,例如待处理物体的图片等。又例如,原始图像也可以通过扫描等方式得到。例如,原始图像可以为图像采集装置直接采集到的图像,也可以是对采集得到的图像进行预处理之后获得的图像。例如,为了避免原始图像的数据质量、数据不均衡等对图像处理的影响,在处理原始图像前,本公开的至少一实施例提供的图像处理方法还可以包括对原始图像进行预处理的操作。预处理例如可以包括对图像采集装置直接采集到的图像进行剪裁、伽玛(Gamma)校正或降噪滤波等处理。预处理可以消除原始图像中的无关信息或噪声信息,以便于更好地对原始图像进行图像处理。
接下来,如图1所示,在步骤S11,通过第一二值化模型对原始图像进行处理,以得到原始图像的第一二值化图像。
例如,第一二值化模型为基于神经网络的模型。例如,第一二值化模型可以采用机器学习技术实现并且例如运行在通用计算装置或专用计算装置上。该第一二值化模型为预先训练得到的神经网络模型。例如,第一二值化模型可以采用U-net神经网络、与U-net神经网络类似的神经网络、Mask-rcnn神经网络等神经网络实现。
例如,第一二值化模型用于对原始图像进行二值化处理,以得到第一二值化图像。二值化处理是将原始图像上的像素点的灰度值设置为第一灰度值(例如,0)或第二灰度值(例如,255),也就是使得整个原始图像呈现出明显的黑白效果的过程。
例如,可以通过大量原始训练图像和该原始训练图像的二值化后的图像对待训练的第一二值化模型进行训练,然后建立第一二值化模型(例如,U-net神经网络等神经网络模型)。对该待训练的第一二值化模型进行训练以建立第一二值化模型的过程可以参考神经网络领域中的训练过程,具体过程不再赘述。
需要说明的是,在一些实施例中,还可以采用现有的二值化处理方法对原始图像进行二值化处理以得到第一二值化图像。例如,二值化处理方法可以包括阈值法,阈值法包括:设置二值化阈值,将原始图像中的每个像素的灰阶值与二值化阈值进行比较,若原始图像中的某像素的灰阶值大于或等于二值化阈值,则将该像素的灰阶值设置为255灰阶,若原始图像中的某像素的灰阶值小于二值化阈值,则将该像素的灰阶值设置为0灰阶,由此即可实现对原始图像进行二值化处理。例如,二值化阈值的选取方法包括双峰法、P参数法、大律法(OTSU法)、最大熵值法、迭代法等。
例如,在一些实施例中,步骤S11可以包括:对原始图像进行压缩处理,以得到输入图像;通过第一二值化模型对输入图像进行处理,以得到原始图像的第一二值化图像。
图3示出了本公开一实施例提供的一种输入图像,例如,图3中的输入图像可以为对图2中的原始图像进行压缩处理后的图像。
例如,输入图像的尺寸小于原始图像的尺寸。需要说明的是,在通过第一二值化模型进行二值化预测处理时,如果原始图像太大,则处理速度会比较慢,从而为了提高处理速度,则可以对原始图像进行压缩处理以得到压缩后的输入图像,然后通过第一二值化模型对输入图像进行二值化预测处理。
例如,在一些实施例中,输入图像的尺寸可以为1500*1500。需要说明的是,输入图像的尺寸不限于此,可以根据实际情况设置,用户可以预先设定压缩比例等,压缩比例与处理速度和图像质量等因素相关,用户可以综合考虑处理速度和图像质量等因素来设置压缩比例。若需要使得处理速度较快,则压缩比例可以较大,从而使得输入图像的尺寸较小,然而,此时,最终得到的第一二值化图像的质量可能较差;若需要得到最终得到的第一二值化图像的质量较好,则压缩比例可以较小,从而使得输入图像的尺寸较大,此时,处理速度则较慢,即第一二值化模型对输入图像进行二值化处理的过程较长。在一些示例中,输入图像的长宽比和原始图像的长宽比可以相同,在另一些示例中,输入图像的长宽比和原始图像的长宽可以不相同,此时,相对于原始图像,输入图像产生形变,当对输入图像进行处理后,得到二值化预测图像,该二值化预测图像的尺寸需要恢复到与原始图像的尺寸相同,例如,目前,主流的例如iphone手机拍摄得到的照片的分辨率是1200万像素,即4000*3000,此时,原始图像的尺寸可以为4000*3000,对该原始图像进行压缩处理后得到的输入图像的尺寸也可以为1500*1500,此时,输入图像产生形变。
图4为本公开一实施例提供的第一二值化图像的示意图。
例如,在步骤S11中,通过第一二值化模型对输入图像进行处理,以得到原始图像的第一二值化图像,包括:通过第一二值化模型对输入图像进行处理,以得到输入图像的二值化预测图像;将二值化预测图像进行恢复尺寸处理,以得到第一二值化图像。
例如,图4中的第一二值化图像为图2所示的原始图像的二值化图像。例如,第一二值化图像的尺寸和原始图像的尺寸相同。
例如,如图4所示,在第一二值化图像中,黑色像素表示对象对应的像素,而白色像素则表示背景对应的像素。
例如,二值化预测图像的尺寸和输入图像的尺寸相同。
需要说明的是,在得到二值化预测图像之后,将二值化预测图像进行恢复尺寸处理,即按照扩大比例对二值化预测图进行尺寸扩大,以使得第一二值化图像的尺寸和原始图像的尺寸相同,从而可以方便后期在对应位置进行像素合成。在恢复尺寸处理中,扩大比例可以与压缩比例相对应,例如,若压缩比例为1/K,则扩大比例可以为K。
例如,在一些实施例中,可以采用插值法对二值化预测图像进行恢复尺寸处理,以得到第一二值化图像。
图5为本公开一实施例提供的一种模糊图像的示意图,图6为本公开一实施例提供的一种像素外接轮廓图像。
接下来,如图1所示,在步骤S12,对第一二值化图像进行处理,以得到像素外接轮廓图像。
例如,图6示出的像素外接轮廓图像为对图4所示的第一二值化图像进行处理后得到的像素外接轮廓图像。
例如,如图6所示,像素外接轮廓图像包括多个外接轮廓像素,图6中白色像素表示外接轮廓像素。多个外接轮廓像素包围的区域内的像素为至少一个对象中的至少部分对象对应的像素,图6中白色像素内部的黑色像素则表示对象的像素。
例如,在一些实施例中,步骤S12包括:对第一二值化图像进行模糊化处理,得到模糊图像;对模糊图像和第一二值化图像进行异或处理,以得到像素外接轮廓图像。
例如,图5示出的模糊图像可以为对图4所示的第一二值化图像进行模糊化处理后得到的模糊图像。如图4和图5所示,对第一二值化图像进行模糊化处理之后,该第一二值化图像中的对象的掩模区域(Mask区域)变大。
例如,在一些实施例中,可以采用高斯滤波对第一二值化图像进行模糊化处理。需要说明的是,在本公开中,模糊化处理的方法不限于高斯滤波,还可以为其它合适的方法,例如,中值滤波、均值滤波等。
例如,图6中的白色像素表示模糊图像和第一二值化图像之间的不同像素,也就是说,对于图6中的任一白色像素,在模糊图像中该白色像素对应的位置处的像素的灰阶值与在第一二值化图像中该白色像素对应的位置处的像素的灰阶值不相同。图6中的黑色像素表示模糊图像和第一二值化图像之间的相同像素,也就是说,对于图6中的任一黑色像素,在模糊图像中该黑色像素对应的位置处的像素的灰阶值与在第一二值化图像中该黑色像素对应的位置处的像素的灰阶值相同。
图7为本公开一实施例提供的一种第二二值化图像的示意图。
接下来,如图1所示,在步骤S13,通过第二二值化模型对原始图像进行处理,以得到第二二值化图像。
例如,图7所示的第二二值化图像为通过第二二值化模型对图2所示的原始图像进行处理后得到的图像。
例如,在步骤S13中,第二二值化模型进行的处理(例如,lessink处理)是根据原始图像进行处理的,例如,第二二值化模型进行的处理可以用来去除原始图像中的部分灰度像素,同时增强对象(例如,字符)的细节信息,即可以保留更多细节像素特征。第二二值化模型进行的处理可还以去除原始图像中的图像噪声干扰,使得对象的细节更加突出。
对图3所示的输入图像进行二值化预测处理得到的二值化预测图像在细节部分表现不好,具有锯齿,因此,需要对图像的细节像素进行补充,从而使最终得到的合成图像具有较好的效果。
例如,在一些实施例中,步骤S13可以包括:对原始图像进行灰度化处理,得到灰度图像;根据第一阈值,对灰度图像进行处理,得到中间二值化图像;以中间二值化图像为导向图,对灰度图像进行导向滤波处理,得到滤波图像;根据第二阈值,确定滤波图像中的高值像素点,其中,高值像素点的灰度值大于第二阈值;根据预设扩充系数,对高值像素点的灰度值进行扩充处理,得到扩充图像;对扩充图像进行清晰化处理,得到清晰图像;以及对清晰图像的对比度进行调整,得到第二二值化图像。
例如,灰度化处理的方法包括分量法、最大值法、平均值法和加权平均法等。
例如,可以采用阈值法对灰度图像进行二值化处理以得到中间二值化图像。例如,常用的二值化阈值选取方法有双峰法、P参数法、大律法(OTSU法)、最大熵值法、迭代法等,第一阈值的选取方法可采用上述方法中的任一种。第一阈值可以根据实际情况设置,在此不作具体限制。
例如,在步骤S13中,在导向滤波处理中,以中间二值化图像为导向图,灰度图像为导向滤波处理中的输入图像,滤波图像为导向滤波处理中的输出图像,由此,通过中间二值化图像对灰度图像进行导向滤波处理,可以输出与灰度图像大体上相似且边缘纹理处与中间二值化图像相似的滤波图像,经过导向滤波处理后,图像中的噪声明显减少。
例如,第二阈值为滤波图像的灰度均值与灰度值的标准差之和,即第二阈值等于滤波图像中的各个像素点的灰度值的平均值加上滤波图像中的各个像素点的灰度值的标准差。
例如,在一些实施例中,预设扩充系数为1.2~1.5,例如,1.3。将每个高值像素点的灰度值都乘以预设扩充系数,以对高值像素点的灰度值进行扩充处理,从而得到黑白对比更加明显的扩充图像。
例如,在步骤S13中,在一些实施例中,对扩充图像进行清晰化处理,得到清晰图像,包括:采用高斯滤波对扩充图像进行模糊化处理,得到扩充图像对应的模糊图像;根据预设混合系数,将扩充图像对应的模糊图像和扩充图像按比例进行混合,得到清晰图像。通过对扩充图像进行清晰化处理,可以得到相对于扩充图像更加清晰的清晰图像。
例如,假设f1(i,j)为扩充图像在(i,j)处的像素点的灰度值,f2(i,j)为扩充图像对应的模糊图像在(i,j)处的像素点的灰度值,f3(i,j)为清晰图像在(i,j)处的像素点的灰度值,k1为扩充图像的预设混合系数,k2为扩充图像对应的模糊图像的预设扩充系数,则f1(i,j)、f2(i,j)、f3(i,j)满足如下关系:
f3(i,j)=k1f1(i,j)+k2f2(i,j)。
例如,扩充图像的预设混合系数可以为1.5,扩充图像对应的模糊图像的预设混合系数可以为-0.5。
例如,在步骤S13中,对清晰图像的对比度进行调整包括:根据清晰图像的灰度均值,对清晰图像的每个像素点的灰度值进行调整。由此,通过对清晰图像的对比度进行调整,从而可以得到黑白对比更为明显的第二二值化图像。
例如,可以通过如下公式对清晰图像的每个像素点的灰度值进行调整:
其中,f'(i,j)为第二二值化图像在(i,j)处的像素点的灰度值,为清晰图像中的各个像素点的灰度值的平均值,f(i,j)为清晰图像在(i,j)处的像素点的灰度值,t为强度值。例如,强度值可为0.1~0.5,例如,强度值可为0.2。在实际应用中,强度值可根据最终所要达到的效果进行选取。
图8为本公开一实施例提供的一种合成图像的示意图。
最后,如图1所示,在步骤S14,根据多个外接轮廓像素在像素外接轮廓图像中的位置,对第二二值化图像和第一二值化图像进行合成,以得到合成图像。
需要说明的是,“对第二二值化图像和第一二值化图像进行合成,以得到合成图像”表示将第一二值化图像中的与多个外接轮廓像素的位置对应的像素的灰阶值替换为第二二值化图像中的与多个外接轮廓像素的位置对应的像素的灰阶值,即将第一二值化图像中的与多个外接轮廓像素的位置对应的像素全部替换成效果更好的像素。
图8为对图4所示的第一二值化图像和图7所示的第二二值化图像进行合成得到的图像。例如,如图8所示,合成图像为二值化图像。
例如,在一些实施例中,步骤S14包括:获取像素外接轮廓图像中的多个外接轮廓像素的位置;提取第二二值化图像中与多个外接轮廓像素的位置对应的位置处的多个目标第二二值化像素;根据第二二值化图像和第一二值化图像的像素对应关系,将第二二值化图像中的多个目标第二二值化像素分别合成到第一二值化图像中的相同位置,以得到原始图像的合成图像。
例如,在一些实施例中,第二二值化图像的尺寸、第一二值化图像的尺寸和合成图像的尺寸均可以相同。
例如,第二二值化图像中的所有第二二值化像素排列为n行m列,第一二值化图像中的所有第一二值化像素排列为n行m列,合成图像中的所有合成像素排列为n行m列,像素外接轮廓图像中的所有像素排列为n行m列。也就是说,第二二值化图像中的所有第二二值化像素的数量为n*m,第一二值化图像中的所有第一二值化像素的数量为n*m,合成图像中的所有合成像素的数量为n*m,像素外接轮廓图像中的所有像素的数量为n*m。
例如,多个目标第二二值化像素和多个外接轮廓像素一一对应,且目标第二二值化像素的位置和该目标第二二值化像素对应的外接轮廓像素的位置相同。例如,若在像素外接轮廓图像中,位于第i行第j列的像素为外接轮廓像素,相应地,在第二二值化图像中,位于第i行第j列的第二二值化像素为目标第二二值化像素。
例如,在步骤S14中,根据第二二值化图像和第一二值化图像的像素对应关系,将第二二值化图像中的多个目标第二二值化像素分别合成到第一二值化图像中的相同位置,包括:确定多个目标第二二值化像素中的第q个目标第二二值化像素,其中,第q个目标第二二值化像素位于第二二值化图像的第i行第j列;确定第一二值化图像中的位于第i行第j列的第q个目标第一二值化像素;将第q个目标第一二值化像素的灰阶值替换为第q个目标第二二值化像素的灰阶值,以得到合成图像中位于第i行第j列的第q个目标合成像素。
例如,n、m、q、i、j均为正整数,且i小于等于n,j小于等于m,q小于等于多个目标第二二值化像素的数量。
例如,“将第q个目标第一二值化像素的灰阶值替换为第q个目标第二二值化像素的灰阶值,以得到第q个目标合成像素”可以使得对象(例如,字符)周边光滑。也就是说,第q个目标合成像素的灰阶值和第q个目标第二二值化像素的灰阶值相同。
例如,在第一二值化图像中,未与多个目标第二二值化像素对应的第一二值化像素则直接作为合成图像中的合成像素,也就是说,若第一二值化图像中的位于第p1行第p2列的第一二值化像素与多个目标第二二值化像素中的任一个目标第二二值化像素均不对应,即第二二值化图像中的位于第p1行第p2列的第二二值化像素不是目标第二二值化像素,则该第一二值化图像中的位于第p1行第p2列的第一二值化像素作为合成图像中的位于第p1行第p2列的合成像素,即位于第p1行第p2列的第一二值化像素的灰阶值和位于第p1行第p2列的合成像素的灰阶值相同。
需要说明的是,在本公开中,第二二值化图像中的像素被称为第二二值化像素,第一二值化图像中的像素被称为第一二值化像素,合成图像中的像素被称为合成像素了,“第二二值化像素”、“第一二值化像素”、“合成像素”等仅仅是用于区分像素位于不同的图像,并不表示这些像素的结构、性质等有任何不同。此外,目标第二二值化像素表示第二二值化图像中的与外接轮廓像素对应的像素,目标第一二值化像素表示第一二值化图像中的与目标第二二值化像素对应的像素,目标合成像素表示合成图像中的与目标第二二值化像素对应的像素。
与上述的图像处理方法相对应,本公开至少一实施例还提供一种图像处理装置,图9为本公开至少一实施例提供的一种图像处理装置的示意性框图。
例如,如图9所示,图像处理装置900包括:获取模块901、第一二值化模块902、处理模块903、第二二值化模块904和合成模块905。
获取模块901用于获取原始图像。原始图像包括至少一个对象。
第一二值化模块902用于通过第一二值化模型对原始图像进行处理,以得到原始图像的第一二值化图像。
处理模块903用于对第一二值化图像进行处理,以得到像素外接轮廓图像。例如,像素外接轮廓图像包括多个外接轮廓像素,多个外接轮廓像素包围的区域内的像素为至少一个对象中的至少部分对象对应的像素。
第二二值化模块904用于通过第二二值化模型对原始图像进行处理,以得到第二二值化图像。
合成模块905用于根据像素外接轮廓图像中的多个外接轮廓像素的位置,对第二二值化图像和第一二值化图像进行合成,以得到原始图像的合成图像。例如,合成图像为二值化图像。
例如,在一些实施例中,第一二值化模块902执行通过第一二值化模型对原始图像进行处理,以得到原始图像的第一二值化图像的操作时,第一二值化模块902执行以下操作:对原始图像进行压缩处理,以得到输入图像,其中,输入图像的尺寸小于原始图像的尺寸;通过第一二值化模型对输入图像进行处理,以得到原始图像的第一二值化图像。
例如,在一些实施例中,第一二值化模块902执行通过第一二值化模型对输入图像进行处理,以得到原始图像的第一二值化图像的操作时,第一二值化模块902执行以下操作:通过第一二值化模型对输入图像进行处理,以得到输入图像的二值化预测图像;将二值化预测图像进行恢复尺寸处理,以得到第一二值化图像。例如,第一二值化图像的尺寸和原始图像的尺寸相同。
例如,在一些实施例中,处理模块903执行对第一二值化图像进行处理,以得到像素外接轮廓图像的操作时,处理模块903执行以下操作:对第一二值化图像进行模糊化处理,得到模糊图像;对模糊图像和第一二值化图像进行异或处理,以得到像素外接轮廓图像。
例如,在一些实施例中,合成模块905执行根据像素外接轮廓图像中的多个外接轮廓像素的位置,对第二二值化图像和第一二值化图像进行合成,以得到原始图像的合成图像的操作时,合成模块905执行以下操作:获取像素外接轮廓图像中的多个外接轮廓像素的位置;提取第二二值化图像中与多个外接轮廓像素的位置对应的位置处的多个目标第二二值化像素;根据第二二值化图像和第一二值化图像的像素对应关系,将第二二值化图像中的多个目标第二二值化像素分别合成到第一二值化图像中的相同位置,以得到原始图像的合成图像。
例如,第二二值化图像中的所有第二二值化像素排列为n行m列,第一二值化图像中的所有第一二值化像素排列为n行m列,合成图像中的所有合成像素排列为n行m列。在一些实施例中,合成模块905执行根据第二二值化图像和第一二值化图像的像素对应关系,将第二二值化图像中的多个目标第二二值化像素分别合成到第一二值化图像中的相同位置的操作时,合成模块905包括执行以下操作:确定多个目标第二二值化像素中的第q个目标第二二值化像素,其中,第q个目标第二二值化像素位于第二二值化图像的第i行第j列;确定第一二值化图像中的位于第i行第j列的第q个目标第一二值化像素;将第q个目标第一二值化像素的灰阶值替换为第q个目标第二二值化像素的灰阶值,以得到合成图像中位于第i行第j列的第q个目标合成像素。
例如,第q个目标合成像素的灰阶值为第q个目标第二二值化像素的灰阶值,n、m、q、i、j均为正整数,且i小于等于n,j小于等于m,q小于等于多个目标第二二值化像素的数量。
例如,在一些实施例中,第二二值化模块904包括:灰度化模块、中间二值化模块、滤波模块、确定模块、扩充模块和清晰化模块。
例如,灰度化模块用于对原始图像进行灰度化处理,得到灰度图像。
中间二值化模块用于根据第一阈值,对灰度图像进行处理,得到中间二值化图像。
滤波模块用于以中间二值化图像为导向图,对灰度图像进行导向滤波处理,得到滤波图像。
确定模块用于根据第二阈值,确定滤波图像中的高值像素点,其中,高值像素点的灰度值大于第二阈值。
扩充模块用于根据预设扩充系数,对高值像素点的灰度值进行扩充处理,得到扩充图像。
清晰化模块用于对扩充图像进行清晰化处理,得到清晰图像,对清晰图像的对比度进行调整,得到第二二值化图像。
例如,获取模块901、第一二值化模块902、处理模块903、第二二值化模块904和/或合成模块905包括存储在存储器中的代码和程序;处理器可以执行该代码和程序以实现如上所述的获取模块901、第一二值化模块902、处理模块903、第二二值化模块904和/或合成模块905的一些功能或全部功能。例如,获取模块901、第一二值化模块902、处理模块903、第二二值化模块904和/或合成模块905可以是专用硬件器件,用来实现如上所述的获取模块901、第一二值化模块902、处理模块903、第二二值化模块904和/或合成模块905的一些或全部功能。例如,获取模块901、第一二值化模块902、处理模块903、第二二值化模块904和/或合成模块905可以是一个电路板或多个电路板的组合,用于实现如上所述的功能。在本申请实施例中,该一个电路板或多个电路板的组合可以包括:(1)一个或多个处理器;(2)与处理器相连接的一个或多个非暂时的存储器;以及(3)处理器可执行的存储在存储器中的固件。
需要说明的是,获取模块901用于实现图1所示的步骤S10,第一二值化模块902用于实现图1所示的步骤S11,处理模块903用于实现图1所示的步骤S12,第二二值化模块904用于实现图1所示的步骤S13,合成模块905用于实现图1所示的步骤S14。从而关于获取模块901的具体说明可以参考上述图像处理方法的实施例中图1所示的步骤S10的相关描述,关于第一二值化模块902的具体说明可以参考上述图像处理方法的实施例中图1所示的步骤S11的相关描述,关于处理模块903的具体说明可以参考上述图像处理方法的实施例中图1所示的步骤S12的相关描述,关于第二二值化模块904的具体说明可以参考上述图像处理方法的实施例中图1所示的步骤S13的相关描述,关于合成模块905的具体说明可以参考上述图像处理方法的实施例中图1所示的步骤S14的相关描述。此外,图像处理装置可以实现与前述图像处理方法相似的技术效果,在此不再赘述。
本公开至少一实施例还提供一种电子设备,图10为本公开至少一实施例提供的一种电子设备的示意性框图。
例如,如图10所示,电子设备包括处理器1001、通信接口1002、存储器1003和通信总线1004。处理器1001、通信接口1002、存储器1003通过通信总线1004实现相互通信,处理器1001、通信接口1002、存储器1003等组件之间也可以通过网络连接进行通信。本公开对网络的类型和功能在此不作限制。
例如,存储器1003用于非瞬时性地存储计算机可读指令。处理器1001用于运行计算机可读指令时,计算机可读指令被处理器1001运行时实现根据上述任一实施例所述的图像处理方法。关于该图像处理方法的各个步骤的具体实现以及相关解释内容可以参见上述图像处理方法的实施例,在此不作赘述。
例如,处理器1001执行存储器1003上所存储的程序而实现图像处理方法的实现方式,与前述图像处理方法的实施例部分所提及的实现方式相同,这里也不再赘述。
例如,通信总线1004可以是外设部件互连标准(PCI)总线或扩展工业标准结构(EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
例如,通信接口1002用于实现电子设备与其他设备之间的通信。
例如,处理器1001和存储器1003可以设置在服务器端(或云端)。
例如,处理器1001可以控制电子设备中的其它组件以执行期望的功能。处理器1001可以是中央处理器(CPU)、网络处理器(NP)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。中央处理元(CPU)可以为X86或ARM架构等。
例如,存储器1003可以包括一个或多个计算机程序产品的任意组合,计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。非易失性存储器例如可以包括只读存储器(ROM)、硬盘、可擦除可编程只读存储器(EPROM)、便携式紧致盘只读存储器(CD-ROM)、USB存储器、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机可读指令,处理器1001可以运行所述计算机可读指令,以实现电子设备的各种功能。在存储介质中还可以存储各种应用程序和各种数据等。
例如,关于电子设备执行图像处理的过程的详细说明可以参考图像处理方法的实施例中的相关描述,重复之处不再赘述
图11为本公开至少一实施例提供的一种非瞬时性计算机可读存储介质的示意图。例如,如图11所示,在存储介质1100上可以非暂时性地存储一个或多个计算机可读指令1101。例如,当计算机可读指令1101由处理器执行时可以执行根据上文所述的图像处理方法中的一个或多个步骤。
例如,该存储介质1100可以应用于上述电子设备和/或图像处理装置900中。例如,存储介质1100可以包括电子设备中的存储器1003。
例如,关于存储介质1100的说明可以参考电子设备的实施例中对于存储器的描述,重复之处不再赘述。
图12示出了为本公开至少一实施例提供的一种硬件环境的示意图。本公开提供的电子设备可以应用在互联网系统。
利用图12中提供的计算机系统可以实现本公开中涉及的图像处理装置和/或电子设备的功能。这类计算机系统可以包括个人电脑、笔记本电脑、平板电脑、手机、个人数码助理、智能眼镜、智能手表、智能指环、智能头盔及任何智能便携设备或可穿戴设备。本实施例中的特定系统利用功能框图解释了一个包含用户界面的硬件平台。这种计算机设备可以是一个通用目的的计算机设备,或一个有特定目的的计算机设备。两种计算机设备都可以被用于实现本实施例中的图像处理装置和/或电子设备。计算机系统可以包括实施当前描述的实现图像处理所需要的信息的任何组件。例如,计算机系统能够被计算机设备通过其硬件设备、软件程序、固件以及它们的组合所实现。为了方便起见,图12中只绘制了一台计算机设备,但是本实施例所描述的实现图像处理所需要的信息的相关计算机功能是可以以分布的方式、由一组相似的平台所实施的,分散计算机系统的处理负荷。
如图12所示,计算机系统可以包括通信端口250,与之相连的是实现数据通信的网络,例如,计算机系统可以通过通信端口250发送和接收信息及数据,即通信端口250可以实现计算机系统与其他电子设备进行无线或有线通信以交换数据。计算机系统还可以包括一个处理器组220(即上面描述的处理器),用于执行程序指令。处理器组220可以由至少一个处理器(例如,CPU)组成。计算机系统可以包括一个内部通信总线210。计算机系统可以包括不同形式的程序储存单元以及数据储存单元(即上面描述的存储器或存储介质),例如硬盘270、只读存储器(ROM)230、随机存取存储器(RAM)240,能够用于存储计算机处理和/或通信使用的各种数据文件,以及处理器组220所执行的可能的程序指令。计算机系统还可以包括一个输入/输出组件260,输入/输出组件260用于实现计算机系统与其他组件(例如,用户界面280等)之间的输入/输出数据流。
通常,以下装置可以连接输入/输出组件260:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置;包括例如磁带、硬盘等的存储装置;以及通信接口。
虽然图12示出了具有各种装置的计算机系统,但应理解的是,并不要求计算机系统具备所有示出的装置,可以替代地,计算机系统可以具备更多或更少的装置
对于本公开,还有以下几点需要说明:
(1)本公开实施例附图只涉及到与本公开实施例涉及到的结构,其他结构可参考通常设计。
(2)为了清晰起见,在用于描述本发明的实施例的附图中,层或结构的厚度和尺寸被放大。可以理解,当诸如层、膜、区域或基板之类的元件被称作位于另一元件“上”或“下”时,该元件可以“直接”位于另一元件“上”或“下”,或者可以存在中间元件。
(3)在不冲突的情况下,本公开的实施例及实施例中的特征可以相互组合以得到新的实施例。
以上所述仅为本公开的具体实施方式,但本公开的保护范围并不局限于此,本公开的保护范围应以所述权利要求的保护范围为准。
Claims (15)
1.一种图像处理方法,包括:
获取原始图像,其中,所述原始图像包括至少一个对象;
通过第一二值化模型对所述原始图像进行处理,以得到所述原始图像的第一二值化图像;
对所述第一二值化图像进行处理,以得到像素外接轮廓图像,其中,所述像素外接轮廓图像包括多个外接轮廓像素,所述多个外接轮廓像素包围的区域内的像素为所述至少一个对象中的至少部分对象对应的像素;
通过第二二值化模型对所述原始图像进行处理,以得到第二二值化图像;
根据所述多个外接轮廓像素在所述像素外接轮廓图像中的位置,对所述第二二值化图像和所述第一二值化图像进行合成,以得到合成图像,其中,所述合成图像为二值化图像;
其中,根据所述多个外接轮廓像素在所述像素外接轮廓图像中的位置,对所述第二二值化图像和所述第一二值化图像进行合成,以得到合成图像,包括:
获取所述像素外接轮廓图像中的所述多个外接轮廓像素的位置;
提取所述第二二值化图像中与所述多个外接轮廓像素的位置对应的位置处的多个目标第二二值化像素;
根据所述第二二值化图像和所述第一二值化图像的像素对应关系,将所述第二二值化图像中的所述多个目标第二二值化像素分别合成到所述第一二值化图像中的相同位置,以得到所述合成图像。
2.根据权利要求1所述的图像处理方法,其中,通过所述第一二值化模型对所述原始图像进行处理,以得到所述原始图像的第一二值化图像,包括:
对所述原始图像进行压缩处理,以得到输入图像,其中,所述输入图像的尺寸小于所述原始图像的尺寸;
通过所述第一二值化模型对所述输入图像进行处理,以得到所述原始图像的第一二值化图像。
3.根据权利要求2所述的图像处理方法,其中,通过所述第一二值化模型对所述输入图像进行处理,以得到所述原始图像的第一二值化图像,包括:
通过所述第一二值化模型对所述输入图像进行处理,以得到所述输入图像的二值化预测图像;
将所述二值化预测图像进行恢复尺寸处理,以得到所述第一二值化图像,其中,所述第一二值化图像的尺寸和所述原始图像的尺寸相同。
4.根据权利要求1所述的图像处理方法,其中,对所述第一二值化图像进行处理,以得到像素外接轮廓图像,包括:
对所述第一二值化图像进行模糊化处理,得到模糊图像;
对所述模糊图像和所述第一二值化图像进行异或处理,以得到所述像素外接轮廓图像。
5.根据权利要求1所述的图像处理方法,其中,所述第二二值化图像中的所有第二二值化像素排列为n行m列,所述第一二值化图像中的所有第一二值化像素排列为n行m列,所述合成图像中的所有合成像素排列为n行m列,
根据所述第二二值化图像和所述第一二值化图像的像素对应关系,将所述第二二值化图像中的所述多个目标第二二值化像素分别合成到所述第一二值化图像中的相同位置,包括:
确定所述多个目标第二二值化像素中的第q个目标第二二值化像素,其中,所述第q个目标第二二值化像素位于所述第二二值化图像的第i行第j列;
确定所述第一二值化图像中的位于所述第i行第j列的第q个目标第一二值化像素;
将所述第q个目标第一二值化像素的灰阶值替换为所述第q个目标第二二值化像素的灰阶值,以得到所述合成图像中位于所述第i行第j列的第q个目标合成像素,
其中,所述第q个目标合成像素的灰阶值为所述第q个目标第二二值化像素的灰阶值,n、m、q、i、j均为正整数,且i小于等于n,j小于等于m,q小于等于所述多个目标第二二值化像素的数量。
6.根据权利要求1~5任一项所述的图像处理方法,其中,通过第二二值化模型对所述原始图像进行处理,以得到第二二值化图像,包括:
对所述原始图像进行灰度化处理,得到灰度图像;
根据第一阈值,对所述灰度图像进行处理,得到中间二值化图像;
以所述中间二值化图像为导向图,对所述灰度图像进行导向滤波处理,得到滤波图像;
根据第二阈值,确定所述滤波图像中的高值像素点,其中,所述高值像素点的灰度值大于所述第二阈值;
根据预设扩充系数,对所述高值像素点的灰度值进行扩充处理,得到扩充图像;
对所述扩充图像进行清晰化处理,得到清晰图像;以及
对所述清晰图像的对比度进行调整,得到所述第二二值化图像。
7.根据权利要求1~5任一项所述的图像处理方法,其中,所述第一二值化模型为基于神经网络的模型。
8.一种图像处理装置,包括:
获取模块,用于获取原始图像,其中,所述原始图像包括至少一个对象;
第一二值化模块,用于通过第一二值化模型对所述原始图像进行处理,以得到所述原始图像的第一二值化图像;
处理模块,用于对所述第一二值化图像进行处理,以得到像素外接轮廓图像,其中,所述像素外接轮廓图像包括多个外接轮廓像素,所述多个外接轮廓像素包围的区域内的像素为所述至少一个对象中的至少部分对象对应的像素;
第二二值化模块,用于通过第二二值化模型对所述原始图像进行处理,以得到第二二值化图像;
合成模块,用于根据所述多个外接轮廓像素在所述像素外接轮廓图像中的位置,对所述第二二值化图像和所述第一二值化图像进行合成,以得到合成图像,其中,所述合成图像为二值化图像;
其中,所述合成模块执行根据所述多个外接轮廓像素在所述像素外接轮廓图像中的位置,对所述第二二值化图像和所述第一二值化图像进行合成,以得到合成图像的操作时,包括执行以下操作:
获取所述像素外接轮廓图像中的所述多个外接轮廓像素的位置;
提取所述第二二值化图像中与所述多个外接轮廓像素的位置对应的位置处的多个目标第二二值化像素;
根据所述第二二值化图像和所述第一二值化图像的像素对应关系,将所述第二二值化图像中的所述多个目标第二二值化像素分别合成到所述第一二值化图像中的相同位置,以得到所述原始图像的合成图像。
9.根据权利要求8所述的图像处理装置,其中,所述第一二值化模块执行通过第一二值化模型对所述原始图像进行处理,以得到所述原始图像的第一二值化图像的操作时,包括执行以下操作:
对所述原始图像进行压缩处理,以得到输入图像,其中,所述输入图像的尺寸小于所述原始图像的尺寸;
通过所述第一二值化模型对所述输入图像进行处理,以得到所述原始图像的第一二值化图像。
10.根据权利要求9所述的图像处理装置,其中,所述第一二值化模块执行通过所述第一二值化模型对所述输入图像进行处理,以得到所述原始图像的第一二值化图像的操作时,包括执行以下操作:
通过所述第一二值化模型对所述输入图像进行处理,以得到所述输入图像的二值化预测图像;
将所述二值化预测图像进行恢复尺寸处理,以得到所述第一二值化图像,其中,所述第一二值化图像的尺寸和所述原始图像的尺寸相同。
11.根据权利要求8所述的图像处理装置,其中,所述处理模块执行对所述第一二值化图像进行处理,以得到像素外接轮廓图像的操作时,包括执行以下操作:
对所述第一二值化图像进行模糊化处理,得到模糊图像;
对所述模糊图像和所述第一二值化图像进行异或处理,以得到所述像素外接轮廓图像。
12.根据权利要求8所述的图像处理装置,其中,所述第二二值化图像中的所有第二二值化像素排列为n行m列,所述第一二值化图像中的所有第一二值化像素排列为n行m列,所述合成图像中的所有合成像素排列为n行m列,
所述合成模块执行根据所述第二二值化图像和所述第一二值化图像的像素对应关系,将所述第二二值化图像中的所述多个目标第二二值化像素分别合成到所述第一二值化图像中的相同位置的操作时,包括执行以下操作:
确定所述多个目标第二二值化像素中的第q个目标第二二值化像素,其中,所述第q个目标第二二值化像素位于所述第二二值化图像的第i行第j列;
确定所述第一二值化图像中的位于所述第i行第j列的第q个目标第一二值化像素;
将所述第q个目标第一二值化像素的灰阶值替换为所述第q个目标第二二值化像素的灰阶值,以得到所述合成图像中位于所述第i行第j列的第q个目标合成像素,
其中,所述第q个目标合成像素的灰阶值为所述第q个目标第二二值化像素的灰阶值,n、m、q、i、j均为正整数,且i小于等于n,j小于等于m,q小于等于所述多个目标第二二值化像素的数量。
13.根据权利要求8~12任一项所述的图像处理装置,其中,所述第二二值化模块包括:
灰度化模块,用于对所述原始图像进行灰度化处理,得到灰度图像;
中间二值化模块,用于根据第一阈值,对所述灰度图像进行处理,得到中间二值化图像;
滤波模块,用于以所述中间二值化图像为导向图,对所述灰度图像进行导向滤波处理,得到滤波图像;
确定模块,用于根据第二阈值,确定所述滤波图像中的高值像素点,其中,所述高值像素点的灰度值大于所述第二阈值;
扩充模块,用于根据预设扩充系数,对所述高值像素点的灰度值进行扩充处理,得到扩充图像;
清晰化模块,用于对所述扩充图像进行清晰化处理,得到清晰图像,对所述清晰图像的对比度进行调整,得到所述第二二值化图像。
14.一种电子设备,包括:
存储器,用于非瞬时性地存储计算机可读指令;
处理器,用于运行所述计算机可读指令,所述计算机可读指令被所述处理器运行时实现根据权利要求1~7任一项所述的图像处理方法。
15.一种非瞬时性计算机可读存储介质,其中,所述非瞬时性计算机可读存储介质存储有计算机可读指令,所述计算机可读指令被处理器执行时实现根据权利要求1~7中任一项所述的图像处理方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010636558.4A CN111767924B (zh) | 2020-07-03 | 2020-07-03 | 图像处理方法、图像处理装置、电子设备、存储介质 |
PCT/CN2021/102912 WO2022002002A1 (zh) | 2020-07-03 | 2021-06-29 | 图像处理方法、图像处理装置、电子设备、存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010636558.4A CN111767924B (zh) | 2020-07-03 | 2020-07-03 | 图像处理方法、图像处理装置、电子设备、存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111767924A CN111767924A (zh) | 2020-10-13 |
CN111767924B true CN111767924B (zh) | 2024-01-26 |
Family
ID=72724061
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010636558.4A Active CN111767924B (zh) | 2020-07-03 | 2020-07-03 | 图像处理方法、图像处理装置、电子设备、存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN111767924B (zh) |
WO (1) | WO2022002002A1 (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111767924B (zh) * | 2020-07-03 | 2024-01-26 | 杭州睿琪软件有限公司 | 图像处理方法、图像处理装置、电子设备、存储介质 |
CN115100228B (zh) * | 2022-07-25 | 2022-12-20 | 江西现代职业技术学院 | 图像处理方法、系统、可读存储介质及计算机设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101443897A (zh) * | 2006-05-16 | 2009-05-27 | 东京毅力科创株式会社 | 图像二值化方法、图像处理装置及计算机程序 |
CN107563977A (zh) * | 2017-08-28 | 2018-01-09 | 维沃移动通信有限公司 | 一种图像处理方法、移动终端及计算机可读存储介质 |
CN109754379A (zh) * | 2018-12-29 | 2019-05-14 | 北京金山安全软件有限公司 | 一种图像处理方法及装置 |
CN109785369A (zh) * | 2017-11-10 | 2019-05-21 | 中国移动通信有限公司研究院 | 一种虚拟现实人像采集方法及装置 |
CN110008954A (zh) * | 2019-03-29 | 2019-07-12 | 重庆大学 | 一种基于多阈值融合的复杂背景文本图像提取方法及系统 |
CN111325657A (zh) * | 2020-02-18 | 2020-06-23 | 北京奇艺世纪科技有限公司 | 图像处理方法、装置、电子设备和计算机可读存储介质 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10832085B2 (en) * | 2018-09-06 | 2020-11-10 | International Business Machines Corporation | Image binarization using mean restrain |
CN111767924B (zh) * | 2020-07-03 | 2024-01-26 | 杭州睿琪软件有限公司 | 图像处理方法、图像处理装置、电子设备、存储介质 |
-
2020
- 2020-07-03 CN CN202010636558.4A patent/CN111767924B/zh active Active
-
2021
- 2021-06-29 WO PCT/CN2021/102912 patent/WO2022002002A1/zh active Application Filing
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101443897A (zh) * | 2006-05-16 | 2009-05-27 | 东京毅力科创株式会社 | 图像二值化方法、图像处理装置及计算机程序 |
CN107563977A (zh) * | 2017-08-28 | 2018-01-09 | 维沃移动通信有限公司 | 一种图像处理方法、移动终端及计算机可读存储介质 |
CN109785369A (zh) * | 2017-11-10 | 2019-05-21 | 中国移动通信有限公司研究院 | 一种虚拟现实人像采集方法及装置 |
CN109754379A (zh) * | 2018-12-29 | 2019-05-14 | 北京金山安全软件有限公司 | 一种图像处理方法及装置 |
CN110008954A (zh) * | 2019-03-29 | 2019-07-12 | 重庆大学 | 一种基于多阈值融合的复杂背景文本图像提取方法及系统 |
CN111325657A (zh) * | 2020-02-18 | 2020-06-23 | 北京奇艺世纪科技有限公司 | 图像处理方法、装置、电子设备和计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111767924A (zh) | 2020-10-13 |
WO2022002002A1 (zh) | 2022-01-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20190304066A1 (en) | Synthesis method of chinese printed character images and device thereof | |
CN111275139B (zh) | 手写内容去除方法、手写内容去除装置、存储介质 | |
US20230222631A1 (en) | Method and device for removing handwritten content from text image, and storage medium | |
CN109117846B (zh) | 一种图像处理方法、装置、电子设备和计算机可读介质 | |
US20150070373A1 (en) | Clarification of Zoomed Text Embedded in Images | |
CN106202086B (zh) | 一种图片处理、获取方法、装置及系统 | |
CN111767924B (zh) | 图像处理方法、图像处理装置、电子设备、存储介质 | |
WO2023284502A1 (zh) | 图像处理方法、装置、设备和存储介质 | |
CN110717497A (zh) | 图像相似度匹配方法、装置及计算机可读存储介质 | |
JP7389824B2 (ja) | オブジェクト識別方法と装置、電子機器及び記憶媒体 | |
CN110738203A (zh) | 字段结构化输出方法、装置及计算机可读存储介质 | |
CN113436222A (zh) | 图像处理方法、图像处理装置、电子设备及存储介质 | |
US20220060602A1 (en) | Image processing method, image processing device, electronic apparatus and storage medium | |
CN113223025A (zh) | 图像处理方法及装置、神经网络的训练方法及装置 | |
CN113537189A (zh) | 手写文字识别方法、装置、设备及存储介质 | |
WO2023130966A1 (zh) | 图像处理方法、图像处理装置、电子设备、存储介质 | |
CN111027545A (zh) | 卡证图片标志检测方法、装置、计算机设备及存储介质 | |
Esmaile et al. | Optical character recognition using active contour segmentation | |
CN113344832A (zh) | 图像处理方法及装置、电子设备和存储介质 | |
CN113033325A (zh) | 图像处理方法及装置、智能发票识别设备和存储介质 | |
Panchal et al. | An investigation on feature and text extraction from images using image recognition in Android | |
CN111160358A (zh) | 一种图像二值化方法、装置、设备、介质 | |
CN111556251A (zh) | 电子书生成方法、设备及介质 | |
CN113486828B (zh) | 图像处理方法、装置、设备和存储介质 | |
US9020295B1 (en) | Image glyph enhancement |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |