CN111491069B - 一种文档图像的色彩模式自动设定方法 - Google Patents
一种文档图像的色彩模式自动设定方法 Download PDFInfo
- Publication number
- CN111491069B CN111491069B CN202010599925.8A CN202010599925A CN111491069B CN 111491069 B CN111491069 B CN 111491069B CN 202010599925 A CN202010599925 A CN 202010599925A CN 111491069 B CN111491069 B CN 111491069B
- Authority
- CN
- China
- Prior art keywords
- color
- area
- image
- document image
- mode
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/46—Colour picture communication systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/46—Colour picture communication systems
- H04N1/56—Processing of colour picture signals
- H04N1/60—Colour correction or control
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Facsimile Image Signal Circuits (AREA)
- Color Image Communication Systems (AREA)
Abstract
本发明属于图像处理领域,具体属于一种文档图像的色彩模式自动设定方法。该方法考虑了文档的版式结构和高层的语义信息,首先对文档图像进行版式分析,确定文档图像中的不同版式区域;然后分析文档图像中各区域的色彩模式;最后根据分析的彩色模式对文档图像进行设定和保存。该方法可以更精细合理地对文档图像的色彩模式进行设定;并且在提高文档图像的清晰度的同时,避免重要视觉信息的丢失;还可以精简文档图像的有效信息,较大地减少所占用的存储空间。
Description
技术领域
本发明属于图像处理领域,具体涉及一种文档图像的色彩模式自动设定方法。
背景技术
文档图像为通过扫描仪、相机或者其他成像设备将纸质文档电子化后所得到的图像数据。文档图像的色彩设定与所采用的一系列图像处理操作相关,通常需要经过降噪、去模糊、对比度增强、阈值化等处理步骤才能得到干净清晰的文档图像。现有的技术方案主要关注的是文档图像中文本的清晰度和背景的整洁度,所以一般都会对文本和背景之间的对比度进行增强,即将文本和背景区域的灰度分布拉向整个灰度级的两端,进而采用阈值化方法将文本和背景设定为黑白两种色彩。
现有的文档图像色彩模式设定方案是针对整幅图像来操作的,没有考虑图像中不同区域的差异性;也存在一些基于图像局部自适应的对比度增强和阈值化方法,但是这些方法所考虑的局部区域仍然属于底层的无差别的像素区域,没有特定的语义类别。因此现有方法均忽略了文档的版式结构和高层的语义信息,无法兼顾文档中不同文本、图像、表格元素的色彩属性,在处理过程中会带来信息的损失。
发明内容
为提供准确、清晰的文档图像色彩,本发明提供了一种文档图像的色彩模式自动设定方法。
一种文档图像的色彩模式自动设定方法,包括如下步骤:
对文档图像进行版式分析,确定文档图像中的不同版式区域;
对文档图像中的各区域进行色彩模式分析;
根据色彩模式分析将各区域的色彩模式确定为彩色模式、灰度模式或黑白模式,并对文档图像进行保存。
如上所述的一种文档图像的色彩模式自动设定方法,其中:所述色彩模式分析的方法为分析各区域的色彩分布范围和峰值特征。
如上所述的一种文档图像的色彩模式自动设定方法,其中:所述对文档图像进行版式分析的步骤,具体分为:
对文档图像的像素进行分类,得到各像素所属的语义类别;
将文档图像中相邻的且被分为同一类别的像素聚合在一起,形成若干个连通的类别一致的版式区域。
如上所述的一种文档图像的色彩模式自动设定方法,其中:所述对文档图像进行保存指:将所述确定为彩色模式的部分,每个像素用3个字节保存;将所述灰度模式的部分,每个像素用1个字节保存;将所述黑白模式的部分,每个像素用1个比特保存。
如上所述的一种文档图像的色彩模式自动设定方法,其中:所述版式区域分为背景区域、文本区域、图表区域。
如上所述的一种文档图像的色彩模式自动设定方法,其中:所述色彩模式分析步骤具体分为:
利用色彩空间转换和色彩属性分析得到区域色彩属性,色彩属性分为彩色、灰度和二值属性;
若整个文档的背景区域的色彩属性为彩色属性,则整幅图像不分区域设定色彩模式,仍保持原始的色彩模式;
若所述背景区域的色彩属性不是彩色属性,则分析图表区域的色彩属性并重新设定图表、文本和背景色彩模式;
所述分析图表区域的色彩属性并重新设定图表、文本和背景色彩模式方法为:
如果图表区域为彩色属性,则所述图表区域图像保持彩色模式;如果为灰度属性,则将所述图表区域图像转换为灰度模式;如果为二值属性,则转换为黑白模式;将文本和背景区域转换为黑白模式。
如上所述的一种文档图像的色彩模式自动设定方法,其中:所述色彩空间转换为将文档图像转换到HSV色彩空间,所述色彩空间由色调H、饱和度S、明度V三个通道组成;所述色彩属性分析为对图像中某一个像素,若同时满足V和S大于某一阈值,则将该像素标记为彩色属性;对于所述文档图像中某一个版式区域,如果其被标记为彩色属性的像素点的数量占整个区域像素总数的比值超过某一阈值,则所述区域被标记为彩色属性;对于所述文档图像中未被标记为彩色属性的区域,统计其所有像素的灰度值在256个灰度级上的直方图分布状况,若不具有明显的双峰特性,则将其标记为灰度属性,否则标记为二值属性。
如上所述的一种文档图像的色彩模式自动设定方法,其中:所述对文档进行保存,还包括黑白模式的文档图像、非黑白模式的区域图像集合以及区域图像集合到文档图像的映射关系。
如上所述的一种文档图像的色彩模式自动设定方法,其中:对于所述的黑白模式的文档图像,所保存的信息还包括全部的背景和文字区域,以及被转化为黑白模式的图表区域,未被转化为黑白模式的图表区域可任意取值;
对于所述的非黑白模式的区域图像集合,所保存的信息还包括截取得到的所有的彩色模式和灰度模式的图表区域的图像,集合中的各区域图像被唯一编号。
如上所述的一种文档图像的色彩模式自动设定方法,其中:对于所述的区域图像集合到文档图像的映射关系,包括如下信息:一是区域图像的编号,二是所述区域图像在文档图像中的坐标位置;所述坐标位置为区域外接矩形框的左边界、右边界、上边界和下边界,或为区域轮廓上的坐标点序列。
与现有方法相比,本发明具有以下优点:
本发明通过版式分析方法获得了文档内部的高层语义结构,将图像分割为若干个不同类型的区域,基于此可以更精细合理地对文档图像的色彩模式进行设定。
本发明通过分析某个图像区域内不同色彩通道的分布范围和峰值特征,确定其基本的色彩属性,并选取和设定该区域的色彩模式,在提高文档图像的清晰度的同时,避免重要视觉信息的丢失。
本发明在分区域设定色彩模式的基础上,将设定完成后的图像分拆为不同部分信息来分别保存,可以精简文档图像的有效信息,较大地减少所占用的存储空间。
附图说明
图1是本发明提供的一种文档图像色彩模式自动设定方法的一种实施例的的流程图。
图2是本发明提供的一种文档图像色彩模式自动设定方法的另一实施例的流程图。
具体实施方式
首先,对本发明相关的专业术语解释如下:
文档图像:通过扫描仪、相机或者其他成像设备将纸质文档电子化后所得到的图像数据。
色彩模式:将颜色分解为若干分量,并以此确定图像中每个像素的表示方式,常见的有彩色、灰度和黑白三种色彩模式,其中彩色模式通常由三个通道表示,编码了颜色的亮度、色调和饱和度信息;灰度模式由一个通道表示,仅编码了亮度信息,通常分为256级;黑白模式,又称位图模式,由一个通道表示,只有黑白两级。
文档图像版式分析:采用计算机视觉的方法分析文档图像的物理和逻辑结构,定位和识别文档内部的各项元素(如文本、表格、图像、图形等),从而形成对文档结构的完整描述的技术。
下面结合附图及实施例对本发明进行具体说明。
如图1所示,本发明提供的一种文档图像色彩模式自动设定方法,考虑了文档的版式结构和高层的语义信息,首先对文档图像进行版式分析,确定文档图像中的不同版式区域;然后分析文档图像中各区域的色彩分布范围和峰值特征;最后 设定文档图像各区域的色彩模式并对结果进行保存。
如图2所示,本发明提供的一种文档图像色彩模式自动设定方法,包括如下阶段:
文档图像载入、文档图像版式分析、文档色彩模式设定和设定结果保存四个处理阶段:
步骤一、文档图像载入阶段。载入的文档图像主要指通过扫描仪或者相机等成像设备得到的文档的彩色模式图像,也可以接受其他色彩模式的文档图像;
步骤二、文档图像版式分析阶段。文档图像版式分析可以将整个文档图像划分为若干个连续的区域。为获得更好的效果,可以将这些区域标记为背景、文本、图表三种类型。该阶段具体可分为以下步骤:
步骤S201、图像预处理,即对原始文档图像进行降噪、去模糊、对比度增强等操作,以去除不必要的干扰因素,提高版式分析的准确度;
步骤S202、像素分类,即对文档图像中每一个像素,抽取其所在图像区域的亮度、颜色、纹理等表示特征,或者采用深度学习等特征学习方法来学习得到区域的表示特征,并通过规则或者机器学习的方法,估计该像素所属的语义类别(例如,背景、文本或图表类别);
步骤S203、区域聚合,即将文档图像中相邻的被分为同一类别的像素聚合在一起,形成若干个连通的类别一致的区域;
步骤S204、区域后处理,即对聚合得到的区域,分析其所属类别和形状特性,以及其与相邻区域之间的位置关系,通过滤除长度、宽度或面积较小的区域、合并外接矩形框重叠度较大的相同类别的区域、拆分存在较小局部直径的区域等操作进一步提高精度。
步骤S204、将得到的区域进行标记,例如可标记为背景、文本、图表区域。
步骤三、文档色彩模式设定阶段。该阶段先对于各区域进行色彩分布范围和峰值特征分析,并根据分析结果对各区域进行色彩模式设定。详细步骤如下:
步骤S301、利用色彩空间转换得到区域色彩属性。将文档图像转换到HSV色彩空间,该色彩空间由色调(H)、饱和度(S) 、明度(V)三个通道组成,基于HSV色彩空间可以更方便直观地分析图像的色彩属性,其主要遵循的规则如下;
1)对于图像中某一个像素来说,其HSV三通道的值分别为h,s,v,其中h的取值范围为0—180,s的取值范围为0—255,v的取值范围为0—255,若同时满足v和s大于某一阈值(例如最优值为v>46且s>43),则可将该像素被标记为彩色属性;
2)对于图像中某一个区域来说,如果其被标记为彩色属性的像素点的数量占整个区域像素总数的比值超过某一阈值,则该区域被标记为彩色属性;
3)对于图像中未被标记为彩色属性的区域,统计其所有像素的灰度值在256个灰度级上的直方图分布状况,若其不具有明显的双峰特性,则将其标记为灰度属性,否则标记为二值属性。
步骤S302、文档整体色彩属性分析。分析整个文档图像的背景区域色彩属性,如果其为彩色属性,则整幅图像不分区域设定色彩模式,仍保持原始的色彩模式,不执行步骤S303和S304;
步骤S303、图像和表格色彩模式设定。分析图表区域的色彩属性,如果其被标记为彩色属性,则该区域图像保持彩色模式;如果其被标记为灰度属性,则转换为灰度模式;如果其被标记为二值属性,则通过对比度增强,阈值化等图像操作转换为黑白模式;
步骤S304、文本和背景色彩模式设定。对于文本和背景区域,通过对比度增强,阈值化操作等转换为黑白模式。
步骤四、色彩模式设定结果的保存。彩色模式图像由于包含三个通道,每个像素需要占用3个字节,灰度模式图像只包含一个通道,每个像素占用1个字节,黑白模式图像也只包含一个通道,并且每个像素仅占用1个比特。因此,如果采用了分区设定色彩模式,则可以将文档图像分拆为若干部分信息来分别保存和加载,从而减少所占用的存储空间。更优的,具体需要保存的信息如下:
1、黑白模式的文档图像,包含了全部的背景和文字区域,以及被转化为黑白模式的图表区域,未被转化为黑白模式的图表区域的像素点可任意取值;
2、非黑白模式的区域图像集合,包括截取得到的所有的彩色模式和灰度模式的图表区域的图像,集合中的各区域图像被唯一编号;
3、区域图像集合到文档图像的映射关系,包括两方面的信息,一是区域图像的编号,二是该区域图像在文档图像中的坐标位置,可以为区域外接矩形框的左边界、右边界、上边界和下边界,也可为区域轮廓上的坐标点序列。
本发明通过版式分析获得了文档内部的高层语义结构,基于此可以实现更为精细合理的色彩模式设定。并且在提高文档图像的清晰度的同时,可以避免重要视觉信息的丢失。该方法还能够精简文档图像的有效信息,减少其所占用的存储空间。
本发明虽然以较佳实施例公开如上,但其并不是用来限定本发明,任何本领域技术人员在不脱离本发明的精神和范围内,都可以做出可能的变动和修改,因此本发明的保护范围应当以本发明权利要求所界定的范围为准。
Claims (7)
1.一种文档图像的色彩模式自动设定方法,包括如下步骤:
对文档图像进行版式分析,确定文档图像中的不同版式区域;所述版式区域分为背景区域、文本区域、图表区域;
对文档图像中的各区域进行色彩模式分析;所述色彩模式分析步骤具体分为:利用色彩空间转换和色彩属性分析得到区域色彩属性,色彩属性分为彩色、灰度和二值属性;所述色彩空间转换为将文档图像转换到HSV色彩空间,所述色彩空间由色调H、饱和度S、明度V三个通道组成;所述色彩属性分析为:对图像中某一个像素,若同时满足V和S大于某一阈值,则将所述像素标记为彩色属性;对于所述文档图像中某一个版式区域,如果其被标记为彩色属性的像素点的数量占整个区域像素总数的比值超过某一阈值,则所述区域被标记为彩色属性;对于所述文档图像中未被标记为彩色属性的区域,统计其所有像素的灰度值在256个灰度级上的直方图分布状况,若不具有双峰特性,则将其标记为灰度属性,否则标记为二值属性;
根据色彩模式分析将各区域的色彩模式确定为彩色模式、灰度模式或黑白模式,并对文档图像进行保存;具体为:若整个文档的背景区域的色彩属性为彩色属性,则整幅图像不分区域设定色彩模式,仍保持原始的色彩模式;若所述背景区域的色彩属性不是彩色属性,则分析图表区域的色彩属性并重新设定图表、文本和背景色彩模式;所述分析图表区域的色彩属性并重新设定图表、文本和背景色彩模式方法为:如果图表区域为彩色属性,则所述图表区域图像保持彩色模式;如果为灰度属性,则将所述图表区域图像转换为灰度模式;如果为二值属性,则转换为黑白模式;将文本和背景区域转换为黑白模式。
2.如权利要求1所述的一种文档图像的色彩模式自动设定方法,其特征在于:所述色彩模式分析的方法为分析各区域的色彩分布范围和峰值特征。
3.如权利要求1所述的一种文档图像的色彩模式自动设定方法,其特征在于:所述对文档图像进行版式分析的步骤,具体分为:
对文档图像的像素进行分类,得到各像素所属的语义类别;
将文档图像中相邻的且被分为同一类别的像素聚合在一起,形成若干个连通的类别一致的版式区域。
4.如权利要求1所述的一种文档图像的色彩模式自动设定方法,其特征在于:所述对文档图像进行保存指:将所述确定为彩色模式的部分,每个像素用3个字节保存;将所述灰度模式的部分,每个像素用1个字节保存;将所述黑白模式的部分,每个像素用1个比特保存。
5.如权利要求4所述的一种文档图像的色彩模式自动设定方法,其特征在于:所述对文档图像进行保存,还包括保存黑白模式的文档图像、非黑白模式的区域图像集合以及区域图像集合到文档图像的映射关系。
6.如权利要求5所述的一种文档图像的色彩模式自动设定方法,其特征在于:对于所述的黑白模式的文档图像,所保存的信息还包括全部的背景和文字区域,以及被转化为黑白模式的图表区域,未被转化为黑白模式的图表区域可任意取值;
对于所述的非黑白模式的区域图像集合,所保存的信息还包括截取得到的所有的彩色模式和灰度模式的图表区域的图像,集合中的各区域图像被唯一编号。
7.如权利要求6所述的一种文档图像的色彩模式自动设定方法,其特征在于:对于所述的区域图像集合到文档图像的映射关系,包括如下信息:一是区域图像的编号,二是所述区域图像在文档图像中的坐标位置;所述坐标位置为区域外接矩形框的左边界、右边界、上边界和下边界,或为区域轮廓上的坐标点序列。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010599925.8A CN111491069B (zh) | 2020-06-29 | 2020-06-29 | 一种文档图像的色彩模式自动设定方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010599925.8A CN111491069B (zh) | 2020-06-29 | 2020-06-29 | 一种文档图像的色彩模式自动设定方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111491069A CN111491069A (zh) | 2020-08-04 |
CN111491069B true CN111491069B (zh) | 2020-10-02 |
Family
ID=71810595
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010599925.8A Active CN111491069B (zh) | 2020-06-29 | 2020-06-29 | 一种文档图像的色彩模式自动设定方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111491069B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104680490A (zh) * | 2015-02-13 | 2015-06-03 | 中科创达软件股份有限公司 | 一种增强文本图像可视性的方法 |
CN104966051A (zh) * | 2015-06-03 | 2015-10-07 | 中国科学院信息工程研究所 | 一种文档图像的版式识别方法 |
CN106407919A (zh) * | 2016-09-05 | 2017-02-15 | 珠海赛纳打印科技股份有限公司 | 基于图像处理的文本分离方法及装置和图像形成设备 |
CN110942435A (zh) * | 2019-11-27 | 2020-03-31 | 讯飞智元信息科技有限公司 | 一种文档图像处理的方法和装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6249240B2 (ja) * | 2015-03-27 | 2017-12-20 | 京セラドキュメントソリューションズ株式会社 | 画像処理装置 |
-
2020
- 2020-06-29 CN CN202010599925.8A patent/CN111491069B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104680490A (zh) * | 2015-02-13 | 2015-06-03 | 中科创达软件股份有限公司 | 一种增强文本图像可视性的方法 |
CN104966051A (zh) * | 2015-06-03 | 2015-10-07 | 中国科学院信息工程研究所 | 一种文档图像的版式识别方法 |
CN106407919A (zh) * | 2016-09-05 | 2017-02-15 | 珠海赛纳打印科技股份有限公司 | 基于图像处理的文本分离方法及装置和图像形成设备 |
CN110942435A (zh) * | 2019-11-27 | 2020-03-31 | 讯飞智元信息科技有限公司 | 一种文档图像处理的方法和装置 |
Non-Patent Citations (1)
Title |
---|
基于OCR的文档图片检测与信息提取系统的研究;邹亚劼;《中国优秀硕士博士学位论文数据库》;20150630;第1.3.1-1.3.2、第4章 * |
Also Published As
Publication number | Publication date |
---|---|
CN111491069A (zh) | 2020-08-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6865290B2 (en) | Method and apparatus for recognizing document image by use of color information | |
US7221790B2 (en) | Processing for accurate reproduction of symbols and other high-frequency areas in a color image | |
JP4745296B2 (ja) | デジタル画像の領域分離方法および領域分離システム | |
US8837836B2 (en) | Image processing device identifying attribute of region included in image | |
US9092892B2 (en) | Image processing device determining binarizing threshold value | |
US9230186B2 (en) | Image processing device generating binary image data by selecting specific component | |
JP4745297B2 (ja) | デジタル画像における均一な色の領域を特定する方法およびシステム | |
US8385643B2 (en) | Determination of inputted image to be document or non-document | |
JP2008148298A (ja) | 画像における異なった内容の領域を識別する方法、画像における異なった内容の領域を識別する装置、および画像における異なった内容の領域を識別するコンピュータ・プログラムを具現するコンピュータ読み取り可能な媒体 | |
EP2645332B1 (en) | Image processing device that separates image into plural regions | |
US20140355896A1 (en) | Image processing apparatus and image processing method | |
JP4423333B2 (ja) | 背景領域特定方法、背景領域特定システム、背景色決定方法、制御プログラム、および、記録媒体 | |
US20100172576A1 (en) | Color Analyzer And Calibration Tool | |
JP4077919B2 (ja) | 画像処理方法及び装置及びその記憶媒体 | |
CN113392819B (zh) | 一种批量化学术图像自动分割标注装置和方法 | |
CN112215781B (zh) | 一种改进的局部二值化方法 | |
CN108305284B (zh) | 一种文字笔画宽度的确定方法及装置 | |
JP5335581B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
JP2010074342A (ja) | 画像処理装置、画像形成装置、及びプログラム | |
CN111491069B (zh) | 一种文档图像的色彩模式自动设定方法 | |
JP2009301090A (ja) | 画像処理装置および画像処理プログラム | |
JP2004199622A (ja) | 画像処理装置、画像処理方法、記録媒体およびプログラム | |
CN110807747B (zh) | 一种基于前景蒙版的文档图像降噪方法 | |
US11069043B1 (en) | Background noise reduction using a variable range of color values dependent upon the initial background color distribution | |
CN110674336A (zh) | 一种识别、检索影像文件的系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |