CN106407919A - 基于图像处理的文本分离方法及装置和图像形成设备 - Google Patents

基于图像处理的文本分离方法及装置和图像形成设备 Download PDF

Info

Publication number
CN106407919A
CN106407919A CN201610805468.7A CN201610805468A CN106407919A CN 106407919 A CN106407919 A CN 106407919A CN 201610805468 A CN201610805468 A CN 201610805468A CN 106407919 A CN106407919 A CN 106407919A
Authority
CN
China
Prior art keywords
pixel
image
content
pending image
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610805468.7A
Other languages
English (en)
Other versions
CN106407919B (zh
Inventor
马杨晓
蒙丽娜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhuhai Pantum Electronics Co Ltd
Original Assignee
Zhuhai Seine Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhuhai Seine Technology Co Ltd filed Critical Zhuhai Seine Technology Co Ltd
Priority to CN201610805468.7A priority Critical patent/CN106407919B/zh
Publication of CN106407919A publication Critical patent/CN106407919A/zh
Priority to US15/694,571 priority patent/US10270938B2/en
Application granted granted Critical
Publication of CN106407919B publication Critical patent/CN106407919B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/40062Discrimination between different image types, e.g. two-tone, continuous tone
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/73Deblurring; Sharpening
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/13Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/409Edge or detail enhancement; Noise or error suppression
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20172Image enhancement details
    • G06T2207/20192Edge enhancement; Edge preservation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/0077Types of the still picture apparatus
    • H04N2201/0094Multifunctional device, i.e. a device capable of all of reading, reproducing, copying, facsimile transception, file transception

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Signal Processing (AREA)
  • Artificial Intelligence (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Character Input (AREA)
  • Image Analysis (AREA)
  • Human Computer Interaction (AREA)

Abstract

本发明提供一种基于图像处理的文本分离方法及装置和图像形成设备,其中,该方法包括:获取待处理图像中各像素点的灰度值后,确定各像素点的边缘强度值;根据各像素点的边缘强度值,确定与待处理图像对应的二值图;根据二值图和各像素点的灰度值,确定各像素点的文本区域判定值后,判定待处理图像中的文本内容区域和非文本内容区域,以对待处理的图像文件识别出文本内容部分,对该图像文件的文本内容区域、非文本内容区域分别加强处理,避免文字区域进行黑白打印或复印后的模糊现象;在对该图像文件中的图像区域进行黑白打印得到半色调图像区域,采用上述的文本分离方法及装置和图像形成设备能够消除对该半色调图像区域再复印后出现的条纹现象。

Description

基于图像处理的文本分离方法及装置和图像形成设备
技术领域
本发明涉及图像处理技术领域,尤其涉及一种基于图像处理的文本分离方法及装置和图像形成设备。
背景技术
在对图像文件进行黑白打印/复印的时候,由于图像文件内容的多样性例如在图像文件中可能同时包含文字和图像,图像文件的输出效果并不理想,因此需要对不同的内容元素进行不同的处理。
现有技术中使用图文分离的方法对不同的内容进行识别,其中部分方案通过对文字边缘识别并加粗处理,而不能有效识别出文字内容部分,容易出现文字内容镂空现象;部分方案由于识别过程非常复杂,图文分离处理速度变慢,导致打印/复印速度变慢。
发明内容
本发明提供一种基于图像处理的文本分离方法及装置、图像形成设备,用以解决现有技术中不能有效识别出文字内容部分而导致图像文件中的文本区域进行黑白打印/复印的时候之后出现模糊的问题。
本发明的一方面是提供一种基于图像处理的文本分离方法,包括:
获取待处理图像中各像素点的灰度值;
根据各像素点的灰度值,确定各像素点的边缘强度值;
根据各像素点的边缘强度值,确定与所述待处理图像对应的二值图;
根据所述二值图和各像素点的灰度值,确定各像素点的文本区域判定值;
根据各像素点的文本区域判定值,判定所述待处理图像中的文本内容区域和非文本内容区域。
本发明的另一方面是提供一种基于图像处理的文本分离装置,包括:
获取模块,用于获取待处理图像中各像素点的灰度值;
检测模块,用于根据各像素点的灰度值,确定各像素点的边缘强度值;
第一图文分离模块,用于根据各像素点的边缘强度值,确定与所述待处理图像对应的二值图;
第二图文分离模块,用于根据所述二值图和各像素点的灰度值,确定各像素点的文本区域判定值;
判定模块,用于根据各像素点的文本区域判定值,判定所述待处理图像中的文本内容区域和非文本内容区域。
本发明的又一方面是提供一种基于图像处理的图像形成设备,所述设备上设置有如上任一项所述的基于图像处理的文本分离装置。
本发明的技术效果是:通过获取待处理图像中各像素点的灰度值;根据各像素点的灰度值,确定各像素点的边缘强度值;根据各像素点的边缘强度值,确定与待处理图像对应的二值图;根据二值图和各像素点的灰度值,确定各像素点的文本区域判定值;根据各像素点的文本区域判定值,判定待处理图像中的文本内容区域和非文本内容区域,从而在确定出了待处理图像中的文本内容区域和非文本内容区域之后,便于对待处理图像中的文本内容区域、待处理图像中的非文本内容区域分别进行处理,以加强各区域,从而在对图像文件进行打印黑白打印时,可以有效地识别出文字内容部分,对该图像文件的文本内容区域、非文本内容区域分别加强处理,避免出现文字区域进行黑白打印或复印之后的模糊现象,提高了打印以及复印之后的清晰度;并且,在对图像文件中的图像区域进行黑白打印的时候,根据图像区域而得到的黑白打印输出内容称为半色调图像区域,再对该半色调图像区域进行复印时采取上述文本分离方法及装置和图像形成设备之后,消除了现有技术中该半色调图像区域复印后出现的莫尔(moire)条纹现象,提高了复印之后的清晰度,提高了复印的效果。
附图说明
图1为本发明实施例一提供的基于图像处理的文本分离方法的流程图;
图2为本发明实施例二提供的基于图像处理的文本分离方法的流程图;
图3为本发明实施例二提供的基于图像处理的文本分离方法中的目标像素的3×3处理窗口的示意图;
图4为本发明实施例二提供的基于图像处理的文本分离方法的第一检测滤波器的示意图;
图5为本发明实施例二提供的基于图像处理的文本分离方法的第二检测滤波器的示意图;
图6为本发明实施例二提供的基于图像处理的文本分离方法的检测滤波器的取值示意图一;
图7为本发明实施例二提供的基于图像处理的文本分离方法的检测滤波器的取值示意图二;
图8为本发明实施例二提供的基于图像处理的文本分离方法的区域转换滤波器的示意图;
图9为本发明实施例三提供的基于图像处理的文本分离装置的结构示意图;
图10为本发明实施例四提供的基于图像处理的文本分离装置的结构示意图;
图11为本发明实施例五提供的基于图像处理的图像形成设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例一提供的基于图像处理的文本分离方法的流程图,如图1所示,本实施例的方法包括:
步骤101、获取待处理图像中各像素点的灰度值。
在本实施例中,具体的,本实施例的执行主体可以为计算机、计算机中的处理器、以及任意可以执行本实施例方法的装置。将待处理图像输入到装置中之后,可以获取到待处理图像中各像素点的灰度值,Gray(i,j)表示待处理图像中目标像素点(i,j)的灰度值,i∈[1,M],j∈[1,N],i、j、M、N为正整数,M为待处理图像的宽度,N为待处理图像的高度。
步骤102、根据各像素点的灰度值,确定各像素点的边缘强度值。
在本实施例中,具体的,可以根据每个像素点的灰度值,利用梯度算子,去计算每个像素点的边缘强度值。例如梯度算子可以是拉普拉斯算子、或者Sobel算子。
步骤103、根据各像素点的边缘强度值,确定与待处理图像对应的二值图。
在本实施例中,具体的,根据每一个像素点的边缘强度值从而可以确定出与待处理图像对应的二值图,二值图中的取值有两个值为255和0。
步骤104、根据二值图和各像素点的灰度值,确定各像素点的文本区域判定值。
在本实施例中,具体的,可以根据二值图中每一个像素点的取值,以及每一个像素点的灰度值,计算出一个文本区域判定值,每一像素点具有各自的一个文本区域判定值。
步骤105、根据各像素点的文本区域判定值,判定待处理图像中的文本内容区域和非文本内容区域。
在本实施例中,具体的,就可以根据各像素点的文本区域判定值,分别一一的对各像素点进行判定,进而判定每一个像素点是属于文本内容区域还是非文本内容区域。在对每一个像素点进行判定之后,就可以得到待处理图像中的文本内容区域和非文本内容区域。
从而在确定出了待处理图像中的文本内容区域和非文本内容区域之后,便于对待处理图像中的文本内容区域、待处理图像中的非文本内容区域分别进行处理,以加强各区域。
在本实施例中,步骤101~步骤105在具体实施的时候,有两种实施方式。
第一种实施方式为,对待处理图像中的每一个像素点进行以下处理,直至确定出与待处理图像对应的二值图:针对待处理图像中的每一个像素点,获取当前像素点的灰度值;根据当前像素点的灰度值,确定当前像素点的边缘强度值;根据当前像素点的边缘强度值,确定当前像素点在与待处理图像对应的二值图中的取值。
获取到完整的二值图后,再对每个像素点确定文本区域判定值;根据文本区域判定值,判定每个像素点为文本内容区域或非文本内容区域。
第二种实施方式为,可以重复以下过程直至确定出待处理图像中的所有的文本内容区域和所有的非文本内容区域:第一部分分割过程;第二部分分割过程。其中,第一部分分割过程包括了重复以下过程直至确定预设数量的像素点中所有像素点在二值图中的取值:获取待处理图像中预设数量的像素点的灰度值;针对预设数量的像素点中的每一个像素点,根据当前像素点的灰度值,确定当前像素点的边缘强度值;针对预设数量的像素点中的每一个像素点,根据当前像素点的边缘强度值,确定当前像素点在与待处理图像对应的二值图中的取值。第二部分分割过程包括了重复以下过程直至确定预设数量的像素点中所有像素点为文本内容区域或非文本内容区域:针对预设数量的像素点中的每一个像素点,根据和当前像素点相邻的像素点在二值图中的取值、以及当前像素点的灰度值,确定当前像素点的文本区域判定值;针对预设数量的像素点中的每一个像素点,根据当前像素点的文本区域判定值,判定当前像素点为文本内容区域或非文本内容区域。
具体来说,步骤101~步骤105在具体实施的时候,可以对待处理图像中的所有像素点执行步骤101-步骤103的第一次分割过程,确定出整个二值图;然后对待处理图像中的所有像素点执行步骤104-步骤105的第二次分割过程。
或者,将步骤101-步骤105分为了第一部分分割过程和第二部分分割过程。可以对预设数量的像素点,进行第一部分分割过程,从而针对预设数量的像素点执行步骤101-步骤103的第一次分割过程,进而确定出预设数量的像素点在对应的二值图中的取值;然后,对该预设数量的像素点,进行第二部分分割过程,从而针对该预设数量的像素点执行步骤104-步骤105的第二次分割过程,进而将预设数量的像素点中的每一个像素点,判定为文本内容区域或非文本内容区域;然后依次类推,重复第一部分分割过程和第二部分分割过程,每一次都确定出预设数量的像素点中的每一个像素点,是属于文本内容区域还是非文本内容区域,直至处理完待处理图像中的所有像素点。具体可以为依据打印或者扫描中的常用方式,对待处理的图像分成多个块(band),对每个band的像素进行依次执行第一分割过程和第二分割过程,这样提高了文本分离的处理速度。
在本实施例中,具体的,在步骤105之后,通过两次分割处理可以精确识别出待处理图像中的非文本内容区域和文本内容区域。然后就可以对待处理图像中的文本内容区域、以及待处理图像中的非文本内容区域进行打印预处理,在打印预处理之后,可以使得待处理图像得到的黑白打印输出内容清晰。
具体来说,对待处理图像中的文本内容区域进行打印预处理,具有两种处理方式。
第一种处理方式为,判断每一个像素点是否属于文本内容区域;若确定当前像素点为文本内容区域,然后就可以对当前像素点进行加黑处理处理;若确定当前像素点为非文本内容区域,不做任何处理;从而可以对待处理图像中的文本内容区域中的每一个像素点,进行加黑处理处理,使得根据待处理图像中的文本内容区域得到的黑白打印输出内容清晰。
第二种处理方式为,首先判断每一个像素点属于文本内容区域,还是属于非文本内容区域;若确定当前像素点为文本内容区域,然后就可以对当前像素点进行锐化滤波处理;若确定当前像素点为非文本内容区域,然后就可以对当前像素点进行平滑滤波处理;从而对待处理图像中的文本内容区域中的每一个像素点,进行锐化滤波处理,使得根据待处理图像中的文本内容区域得到的黑白打印输出内容清晰,并且对待处理图像中的非文本内容区域中的每一个像素点,进行平滑滤波处理,可以消除根据待处理图像中的非文本内容区域得到的黑白打印输出内容中的莫尔条纹。
然后在打印预处理之后,对每一个像素点的像素数据进行合成处理并输出。
本实施例通过获取待处理图像中各像素点的灰度值;根据各像素点的灰度值,确定各像素点的边缘强度值;根据各像素点的边缘强度值,确定与待处理图像对应的二值图;根据二值图和各像素点的灰度值,确定各像素点的文本区域判定值;根据各像素点的文本区域判定值,判定待处理图像中的文本内容区域和非文本内容区域。从而在确定出了待处理图像中的文本内容区域和非文本内容区域之后,便于对待处理图像中的文本内容区域、待处理图像中的非文本内容区域分别进行处理,以加强各区域,从而在对图像文件进行打印黑白打印时采用上述的文本分离方法对文字的文本内容区域识别并加强处理之后,避免出现文字区域进行黑白打印或复印之后的模糊现象,提高了打印以及复印之后的清晰度;并且,在对图像文件中的图像区域进行黑白打印的时候,此时得到的黑白打印输出内容称为半色调图像区域,同时再对根据该半色调图像区域进行复印时采用上述的文本分离方法,消除了现有技术中该半色调图像区域复印后出现的莫尔条纹现象,提高了复印之后的清晰度,提高了复印的效果。
图2为本发明实施例二提供的基于图像处理的文本分离方法的流程图,在实施例一的基础上,如图2所示,本实施例的方法,在步骤101之前,还包括:
步骤201、获取待处理图像,并确定待处理图像是彩色图像或灰度图像。
其中,步骤201的具体实现方式为:获取待处理图像,并检测待处理图像是否具有三个颜色通道或具有灰度数据;
若确定待处理图像具有三个颜色通道,则确定待处理图像为彩色图像;
若确定待处理图像具有灰度数据,则确定待处理图像为灰度图像。
在本实施例中,具体的,获取待处理图像,然后首先需要对待处理图像进行彩色判定,以判断待处理图像是彩色图像还是灰度图像。
具体来说,由于待处理图像都是以像素为基本单位的多个像素点组成,如果是彩色图像的待图像处理,则彩色图像的待图像处理中的一个像素点由红、绿、蓝三个颜色分量进行编码表示,可以表示成一个数组(R(i,j),G(i,j),B(i,j)),其中,i,j为像素点的坐标值,例如,一个像素点的每个颜色分量用8位的数值编码表示,则每个颜色分量总有256个数值可以表示,这三个颜色分量的数值各代表像素点在三个颜色分量中的强度。举例来说,一个像素点表示成(255,0,0)则该像素为红色。
如果是灰度图像的待处理图像,则待处理图像的每一个像素点用一个灰度等级表示,可以表示成Gray(i,j)。
从而可以对待处理图像进行颜色通道以及是否具有灰度数据的检测,检测到有三个颜色通道的输入时,可以确定待处理图像为彩色图像;检测到具有灰度数据,可以确定待处理图像为灰度图像。
步骤202、若确定待处理图像为彩色图像,则将待处理图像进行灰度转换,以生成待处理图像的灰度图像。
其中,步骤202的具体实现方式为:若确定待处理图像为彩色图像,则根据灰度转换公式Gray(i,j)=a*R(i,j)+b*G(i,j)+c*B(i,j),对待处理图像中的各像素点进行灰度转换,以生成待处理图像的灰度图像;
其中,Gray(i,j)为像素点(i,j)的灰度值,R(i,j)为像素点(i,j)的红色颜色分量,G(i,j)为像素点(i,j)的绿色颜色分量,B(i,j)为像素点(i,j)的蓝色颜色分量,a、b、c分别为预设的红色颜色分量的乘积因数、绿色颜色分量的乘积因数、蓝色颜色分量的乘积因数,i∈[1,M],j∈[1,N],i、j、M、N为正整数,M为待处理图像的宽度,N为待处理图像的高度。
具体来说,在对待处理图像进行灰度转换使,使每个像素点的三个颜色分量的数值各自乘以一个乘积因数并求和得出的结果,作为每个像素点的灰度值,通过灰度转换,原先彩色的待处理图像从而具有三个颜色分量,表示变成了只有一个灰度等级。
步骤203、若确定待处理图像为灰度图像,则执行步骤101,获取各像素点的灰度值。
步骤1021、根据各像素点的灰度值,确定各像素点的梯度值。
步骤1021的具体实现方式为:
根据第一检测滤波器的梯度算子、第二检测滤波器的梯度算子,分别对各像素点的灰度值进行计算,以确定各像素点的隔行梯度值、隔列梯度值;
每一个像素点的隔行梯度值每一个像素点的隔列梯度值
其中,i∈[1,M],j∈[1,N],i、j、M、N、n为正整数,M为待处理图像的宽度,N为待处理图像的高度;Gray(i+p,j+q)为像素点(i+p,j+q)的灰度值,a(p,q)为第一检测滤波器的梯度算子的(2n+1)*(2n+1)模板的值,b(p,q)为第二检测滤波器的梯度算子的(2n+1)*(2n+1)模板的值,p∈[-n,n],q∈[-n,n],p、q为整数,且n小于N和M。
具体来说,预先设定了两个检测滤波器,第一检测滤波器和第二检测滤波器,在每个检测滤波器中具有一个梯度算子;采用第一检测滤波器的梯度算子对每一个像素点的灰度值进行计算,得到每一个像素点的隔行梯度值采用第二检测滤波器的梯度算子对每一个像素点的灰度值进行计算,得到每一个像素点的隔列梯度值
以n=1的3×3模板为例,图3为本发明实施例二提供的基于图像处理的文本分离方法中的目标像素的3×3处理窗口的示意图,如图3所示,像素点(i,j)为目标像素点,获取目标像素点(i,j)周围的相邻像素,此时是以3×3模板去获取目标像素点(i,j)周围的相邻像素点(i-1,j+1)、(i-1,j)、(i-1,j-1)、(i,j+1)、(i,j-1)、(i+1,j+1)、(i+1,j)、(i+1,j-1);进而得到目标像素点和与目标像素点相邻的8个相邻像素点。确定第一检测滤波器、第二检测滤波器,图4为本发明实施例二提供的基于图像处理的文本分离方法的第一检测滤波器的示意图,图5为本发明实施例二提供的基于图像处理的文本分离方法的第二检测滤波器的示意图,如图4和图5所示,第一检测滤波器提供一参数数组[a(-1,1),a(-1,0),a(-1,-1),a(0,1),a(0,0),a(0,-1),a(1,1),a(1,0),a(1,-1)],每一个参数对应各个位置的像素点,第二检测滤波器提供一参数数组[b(-1,1),b(-1,0),b(-1,-1),b(0,1),b(0,0),b(0,-1),b(1,1),b(1,0),b(1,-1)],每一个参数对应各个位置的像素点。3×3模板内的每一个像素点的灰度值乘以第一检测滤波器和第二检测滤波器上对应的参数,然后进行求和,进而得到目标像素点(i,j)的隔行梯度值Gradient_a(i,j)=a(-1,1)*Gray(i-1,j+1)+a(0,1)*Gray(i,j+1)+a(1,1)*Gray(i+1,j+1)+a(-1,0)*Gray(i-1,j)+a(0,0)*Gray(i,j)+a(1,0)*Gray(i+1,j)+a(-1,-1)*Gray(i-1,j-1)+a(0,-1)*Gray(i,j-1)+a(1,-1)*Gray(i+1,j-1),目标像素点(i,j)的隔列梯度值Gradient_b(i,j)=b(-1,1)*Gray(i-1,j+1)+b(0,1)*Gray(i,j+1)+b(1,1)*Gray(i+1,j+1)+b(-1,0)*Gray(i-1,j)+b(0,0)*Gray(i,j)+b(1,0)*Gray(i+1,j)+b(-1,-1)*Gray(i-1,j-1)+b(0,-1)*Gray(i,j-1)+b(1,-1)*Gray(i+1,j-1)。其中,图6为本发明实施例二提供的基于图像处理的文本分离方法的检测滤波器的取值示意图一,图7为本发明实施例二提供的基于图像处理的文本分离方法的检测滤波器的取值示意图二,如图6和图7所示,第一检测滤波器的各参数设定,可以采用图6中A、B两模板中的任意一个,且第二检测滤波器的各参数设定,可以采用图7中的A、B两模板中的任意一个。
步骤1022、根据各像素点的梯度值,确定各像素点的边缘强度值。
步骤1022的具体实现方式为:
针对每一个像素点,根据每一个像素点的隔行梯度值、隔列梯度值,确定每一个像素点的边缘强度值;
其中,每一个像素点的边缘强度值strength(i,j)=(abs(Gradient_a(i,j))+abs(Gradient_b(i,j)))/2;Gradient_a(i,j)为像素点的隔行梯度值,Gradient_b(i,j)为像素点的隔列梯度值;abs表示取绝对值。
具体来说,针对每一个像素点,根据每一个像素点的隔行梯度值Gradient_a(i,j)、隔列梯度值Gradient_b(i,j),去计算出每一个像素点的边缘强度值strength(i,j)。可以采用公式strength(i,j)=(abs(Gradient_a(i,j))+abs(Gradient_b(i,j)))/2,计算出像素点的边缘强度值strength(i,j)。
这里的步骤1021和步骤1022为实施例一中步骤102的详细分解步骤。
步骤103,具体包括:
针对每一个像素点,确定当前像素点的边缘强度值是否大于第一分割阈值;
针对每一个像素点,若当前像素点的边缘强度值大于第一分割阈值,则确定当前像素点为文本边缘区域,并确定当前像素点在二值图中的取值为bw(i,j)=255;
针对每一个像素点,若当前像素点的边缘强度值小于等于第一分割阈值,则确定当前像素点为图像区域,并确定当前像素点在二值图中的取值为bw(i,j)=0。
在本实施例中,具体的,在确定与待处理图像对应的二值图的时候,首先设定出一个第一分割阈值threshold1;然后针对每一个像素点,确定每一个像素点的边缘强度值strength(i,j)是否大于第一分割阈值threshold1,进而判断出每一个像素点所属区域是文本边缘区域还是图像区域,并生成该像素点在二值图中的取值bw(i,j)。
具体来说,针对每一个像素点,若当前像素点的边缘强度值大于第一分割阈值,即strength(i,j)>threshold1,从而此时可以确定当前像素点为文本边缘区域,同时可以确定当前像素点在二值图中的取值为bw(i,j)=255。针对每一个像素点,若当前像素点的边缘强度值小于等于第一分割阈值,即strength(i,j)<=threshold1,从而此时可以确定当前像素点为图像区域,同时可以确定当前像素点在二值图中的取值为bw(i,j)=0。其中,第一分割阈值threshold1的取值范围为[0,2f-1],f与像素点的比特位数相关,例如,如果图像的像素点为8比特的数据,就为[0,255]。一般情况下,第一分割阈值threshold1取值为64。
步骤104,具体包括:
针对每一个像素点,根据当前像素点的灰度值,以及与当前像素点相邻的预设个数的像素点在二值图中的取值,确定当前像素点的文本区域判定值。
其中,像素点的文本区域判定值Gray(i,j)为像素点(i,j)的灰度值,i∈[1,M],j∈[1,N],i、j、M、N、n为正整数,M为待处理图像的宽度,N为待处理图像的高度;bw(i+r,j+t)为与像素点(i,j)在(2n+1)*(2n+1)的模板内相邻的像素点在二值图中的取值,r∈[-n,n],t∈[-n,n],r、t为整数,且n小于N和M。
在本实施例中,具体的,提供了一个区域转换滤波器,区域转换滤波器提供了(2n+1)*(2n+1)的模板。针对每一个像素点,根据当前像素点(i,j)的灰度值Gray(i,j),与当前像素点(i,j)相邻的预设个数的像素点在二值图中的取值bw(i+r,j+t),以及区域转换滤波器的(2n+1)*(2n+1)的模板中的各参数值,确定当前像素点的文本区域判定值
以区域转换滤波器提供了3*3的模板为例,图8为本发明实施例二提供的基于图像处理的文本分离方法的区域转换滤波器的示意图,如图8所示,区域转换滤波器提供一组参数数组,每一个对应目标像素点以及周边相邻的8个像素点,从而可以将目标像素点的灰度值、与目标像素点相邻的周围相邻的8个像素点在二值图中的取值,分别与图8中的参数各自相乘之后求和,从而可以得到当前像素点的文本区域判定值Region(i,j)=bw(i-1,j+1)+bw(i,j+1)+bw(i+1,j+1)+bw(i-1,j)-8*Gray(i,j)+bw(i+1,j)+bw(i-1,j-1)+bw(i,j-1)+bw(i+1,j-1);其中,bw(i-1,j+1)、bw(i,j+1)、bw(i+1,j+1)、bw(i-1,j)、bw(i+1,j)、bw(i-1,j-1)、bw(i,j-1)、bw(i+1,j-1)分别为与像素点(i,j)在3*3的模板内相邻的像素点在二值图中的取值。
步骤1051、针对每一个像素点,确定当前像素点的文本区域判定值是否大于第二分割阈值。
在本实施例中,具体的,在根据各像素点的文本区域判定值,判定待处理图像中的文本内容区域和非文本内容区域的时候,可以首先设定一个第二分割阈值threshold2;将每一个像素点的文本区域判定值Region(i,j)与第二分割阈值threshold2进行比较,确定当前像素点的文本区域判定值Region(i,j)是否大于第二分割阈值threshold2。
其中,第二分割阈值threshold2的取值范围为[0,2f-1],f与像素点的比特位数相关,例如,如果图像的像素点为8比特的数据,就为[0,255]。一般情况下,第二分割阈值threshold2取值为80。
步骤1052、针对每一个像素点,若确定当前像素点的文本区域判定值大于第二分割阈值,则确定当前像素点为文本内容区域;生成确定为文本内容区域的像素点的索引值index(i,j)=1。
在本实施例中,具体的,针对每一个像素点,若确定当前像素点的文本区域判定值Region(i,j)大于第二分割阈值threshold2,即Region(i,j)>threshold2,那么可以确定当前像素点为文本内容区域,同时为当前的确定为文本内容区域的像素点,生成一个索引值index(i,j)=1。
步骤1053、针对每一个像素点,若确定当前像素点的文本区域判定值小于等于第二分割阈值,则确定当前像素点为非文本内容区域;生成确定为非文本内容区域的像素点的索引值index(i,j)=0。
在本实施例中,具体的,针对每一个像素点,若确定当前像素点的文本区域判定值Region(i,j)小于等于第二分割阈值threshold2,即Region(i,j)<=threshold2,那么可以确定当前像素点为非文本内容区域,同时为当前的确定为非文本内容区域的像素点,生成一个索引值index(i,j)=0。
从而将每一个像素点各自的文本区域判定值Region(i,j),与第二分割阈值threshold2进行比较之后,区分出每一个像素点为文本内容区域还是非文本内容区域,并生成对应的索引值index(i,j)。完成这里的分割之后,可以确定在非文本内容区域就包括了文本边缘区域和图像区域。
这里的步骤1051、步骤1052、步骤1053为实施例一中步骤105的详细分解步骤。
在步骤105之后,还包括:
步骤204、对待处理图像中的文本内容区域、以及待处理图像中的非文本内容区域进行打印预处理,以使根据待处理图像得到的黑白打印输出内容清晰。
其中,对待处理图像中的文本内容区域进行打印预处理,包括:
对待处理图像中的文本内容区域中的每一个像素点,进行加黑处理处理,以使根据待处理图像中的文本内容区域得到的黑白打印输出内容清晰;或者,对待处理图像中的文本内容区域中的每一个像素点,进行锐化滤波处理,以使根据待处理图像中的文本内容区域得到的黑白打印输出内容清晰;并对待处理图像中的非文本内容区域中的每一个像素点,进行平滑滤波处理,以消除根据待处理图像中的非文本内容区域得到的黑白打印输出内容中的莫尔条纹。
具体来说,对待处理图像中的文本内容区域进行打印预处理,具有两种处理方式。
第一种处理方式为,首先通过每一个像素点的索引值index(i,j),判断每一个像素点是否属于文本内容区域;若当前像素点的索引值index(i,j)=1,则确定当前像素点为文本内容区域,然后就可以对当前像素点进行加黑处理处理;若当前像素点的索引值index(i,j)=0,则确定当前像素点为非文本内容区域,不做任何处理;从而可以对待处理图像中的文本内容区域中的每一个像素点,进行加黑处理处理,使得根据待处理图像中的文本内容区域得到的黑白打印输出内容清晰。
第二种处理方式为,首先通过每一个像素点的索引值index(i,j),判断每一个像素点属于文本内容区域,还是属于非文本内容区域;若当前像素点的索引值index(i,j)=1,则确定当前像素点为文本内容区域,然后就可以对当前像素点进行锐化滤波处理;若当前像素点的索引值index(i,j)=0,则确定当前像素点为非文本内容区域,然后就可以对当前像素点进行平滑滤波处理;从而对待处理图像中的文本内容区域中的每一个像素点,进行锐化滤波处理,使得根据待处理图像中的文本内容区域得到的黑白打印输出内容清晰,并且对待处理图像中的非文本内容区域中的每一个像素点,进行平滑滤波处理,可以消除根据待处理图像中的非文本内容区域得到的黑白打印输出内容中的莫尔条纹。
然后在,打印预处理之后,对每一个像素点的像素数据进行合成处理并输出。
从而通过区分出待处理图像中的文本内容区域和非文本内容区域,可以对不同区域的像素点进行不同的进一步处理。对文本内容区域中的每一个像素点进行加黑处理或者锐化滤波处理,解决了具有彩色文字或不同浓度的文字的待处理图像在黑白打印输出之后,输出的文字不清楚的问题。对非文本内容区域的每一个像素进行平滑滤波处理,可以有效消除根据待处理图像中的非文本内容区域得到的黑白打印输出内容中的moire条纹。
本实施例通过确定待处理图像是彩色图像或灰度图像,将彩色图像转换为灰度图像;获取待处理图像中各像素点的灰度值;根据各像素点的灰度值,确定各像素点的边缘强度值;根据各像素点的边缘强度值,确定与待处理图像对应的二值图;根据二值图和各像素点的灰度值,确定各像素点的文本区域判定值;根据各像素点的文本区域判定值,判定待处理图像中的文本内容区域和非文本内容区域;然后对待处理图像中的文本内容区域、以及待处理图像中的非文本内容区域进行打印预处理,以使根据待处理图像得到的黑白打印输出内容清晰。从而对待处理图像中的文本内容区域、待处理图像中的非文本内容区域分别进行处理,以加强各区域,可以对文本内容区域中的每一个像素点进行加黑处理或者锐化滤波处理,从而在对图像文件进行打印黑白打印时,可以有效地识别出文字内容部分,避免出现文字区域特别是彩色文字区域进行黑白打印或复印之后的模糊现象,提高了打印以及复印之后的清晰度;并且,可以对非文本内容区域的每一个像素进行平滑滤波处理,消除了现有技术中非文本内容复印后出现的条纹现象,提高了复印之后的清晰度,提高了复印的效果。
图9为本发明实施例三提供的基于图像处理的文本分离装置的结构示意图,如图9所示,本实施例提供的装置,包括:
获取模块31,用于获取待处理图像中各像素点的灰度值;
检测模块32,用于根据各像素点的灰度值,确定各像素点的边缘强度值;
第一图文分离模块33,用于根据各像素点的边缘强度值,确定与待处理图像对应的二值图;
第二图文分离模块34,用于根据二值图和各像素点的灰度值,确定各像素点的文本区域判定值;
判定模块35,用于根据各像素点的文本区域判定值,判定待处理图像中的文本内容区域和非文本内容区域。
本实施例的基于图像处理的文本分离装置可执行本发明实施例一提供的基于图像处理的文本分离方法,其实现原理相类似,此处不再赘述。其中,获取模块31、检测模块32、第一图文分离模块33、第二图文分离模块34、判定模块35,具体还用于:
重复以下过程直至确定出待处理图像中的所有的文本内容区域和所有的非文本内容区域;
第一部分分割过程;
第二部分分割过程;
其中,第一部分分割过程包括了重复以下过程直至确定预设数量的像素点中所有像素点在二值图中的取值:获取模块31获取待处理图像中预设数量的像素点的灰度值;针对预设数量的像素点中的每一个像素点,检测模块32根据当前像素点的灰度值,确定当前像素点的边缘强度值;针对预设数量的像素点中的每一个像素点,第一图文分离模块33根据当前像素点的边缘强度值,确定当前像素点在与待处理图像对应的二值图中的取值;
第二部分分割过程包括了重复以下过程直至确定预设数量的像素点中所有像素点为文本内容区域或非文本内容区域:针对预设数量的像素点中的每一个像素点,第二图文分离模块34根据和当前像素点相邻的像素点在二值图中的取值、以及当前像素点的灰度值,确定当前像素点的文本区域判定值;针对预设数量的像素点中的每一个像素点,判定模块35根据当前像素点的文本区域判定值,判定当前像素点为文本内容区域或非文本内容区域。
上述对预定数量的像素点重复循环处理第一部分分割过程和第二部分分割过程,有效提高了文本分离装置的处理速度。
本实施例的文本分离装置通过获取待处理图像中各像素点的灰度值;根据各像素点的灰度值,确定各像素点的边缘强度值;根据各像素点的边缘强度值,确定与待处理图像对应的二值图;根据二值图和各像素点的灰度值,确定各像素点的文本区域判定值;根据各像素点的文本区域判定值,判定待处理图像中的文本内容区域和非文本内容区域。从而在确定出了待处理图像中的文本内容区域和非文本内容区域之后,便于对待处理图像中的文本内容区域、待处理图像中的非文本内容区域分别进行处理,以加强各区域,从而在对图像文件进行打印黑白打印时采用上述的文本分离方法对文字的文本内容区域识别并加强处理之后,避免出现文字区域进行黑白打印或复印之后的模糊现象,提高了打印以及复印之后的清晰度;并且,在对图像文件中的图像区域进行黑白打印的时候,根据图像区域而得到的黑白打印输出内容称为半色调图像区域,再对该半色调图像区域进行复印使用上述的文本分离装置之后,消除了现有技术中的条纹现象,提高了复印之后的清晰度,提高了复印的效果。
图10为本发明实施例四提供的基于图像处理的文本分离装置的结构示意图,在实施例三的基础上,如图10所示,本实施例提供的装置,检测模块32,包括:
梯度确定子模块321,用于根据各像素点的灰度值,确定各像素点的梯度值;
边缘强度确定子模块322,用于根据各像素点的梯度值,确定各像素点的边缘强度值。
梯度确定子模块321,具体用于:
根据第一检测滤波器的梯度算子、第二检测滤波器的梯度算子,分别对各像素点的灰度值进行计算,以确定各像素点的隔行梯度值、隔列梯度值;
其中,每一个像素点的隔行梯度值每一个像素点的隔列梯度值i∈[1,M],j∈[1,N],i、j、M、N、n为正整数,M为待处理图像的宽度,N为待处理图像的高度;Gray(i+p,j+q)为像素点(i+p,j+q)的灰度值,a(p,q)为第一检测滤波器的梯度算子的(2n+1)*(2n+1)模板的值,b(p,q)为第二检测滤波器的梯度算子的(2n+1)*(2n+1)模板的值,p∈[-n,n],q∈[-n,n],p、q为整数,且n小于N和M。
边缘强度确定子模块322,具体用于:针对每一个像素点,根据每一个像素点的隔行梯度值、隔列梯度值,确定每一个像素点的边缘强度值;
其中,每一个像素点的边缘强度值strength(i,j)=(abs(Gradient_a(i,j))+abs(Gradient_b(i,j)))/2;Gradient_a(i,j)为像素点的隔行梯度值,Gradient_b(i,j)为像素点的隔列梯度值;abs表示取绝对值。
第一图文分离模块33,具体用于:
针对每一个像素点,确定当前像素点的边缘强度值是否大于第一分割阈值;
针对每一个像素点,若当前像素点的边缘强度值大于第一分割阈值,则确定当前像素点为文本边缘区域,并确定当前像素点在二值图中的取值为bw(i,j)=255;
针对每一个像素点,若当前像素点的边缘强度值小于等于第一分割阈值,则确定当前像素点为图像区域,并确定当前像素点在二值图中的取值为bw(i,j)=0。
第二图文分离模块34,具体用于:
针对每一个像素点,根据当前像素点的灰度值,以及与当前像素点相邻的预设个数的像素点在二值图中的取值,确定当前像素点的文本区域判定值;
其中,像素点的文本区域判定值Gray(i,j)为像素点(i,j)的灰度值,i∈[1,M],j∈[1,N],i、j、M、N、n为正整数,M为待处理图像的宽度,N为待处理图像的高度;bw(i+r,j+t)为与像素点(i,j)在(2n+1)*(2n+1)的模板内相邻的像素点在二值图中的取值,r∈[-n,n],t∈[-n,n],r、t为整数,且n小于N和M。
判定模块35,包括:
判定子模块351,用于针对每一个像素点,确定当前像素点的文本区域判定值是否大于第二分割阈值;
第一确定子模块352,用于针对每一个像素点,若确定当前像素点的文本区域判定值大于第二分割阈值,则确定当前像素点为文本内容区域;
第二确定子模块353,用于针对每一个像素点,若确定当前像素点的文本区域判定值小于等于第二分割阈值,则确定当前像素点为非文本内容区域。
第一确定子模块352,还用于:
在确定当前像素点为文本内容区域之后,生成确定为文本内容区域的像素点的索引值index(i,j)=1;
第二确定子模块353,还用于:
在确定当前像素点为非文本内容区域之后,生成确定为非文本内容区域的像素点的索引值index(i,j)=0。
本实施例提供的装置,还包括:
图像处理模块41,用于在判定模块35根据各像素点的文本区域判定值,判定待处理图像中的文本内容区域和非文本内容区域之后,对待处理图像中的文本内容区域中的每一个像素点,进行加黑处理处理,以使根据待处理图像中的文本内容区域得到的黑白打印输出内容清晰;
或者,图像处理模块41,用于在判定模块35根据各像素点的文本区域判定值,判定待处理图像中的文本内容区域和非文本内容区域之后,对待处理图像中的文本内容区域中的每一个像素点,进行锐化滤波处理,以使根据待处理图像中的文本内容区域得到的黑白打印输出内容清晰;还用于对待处理图像中的非文本内容区域中的每一个像素点,进行平滑滤波处理,以消除根据待处理图像中的非文本内容区域得到的黑白打印输出内容中的条纹。
本实施例提供的装置,还包括:
彩色判断模块42,用于在获取模块31获取待处理图像中各像素点的灰度值之前,获取待处理图像,并确定待处理图像是彩色图像或灰度图像;
灰度转换模块43,用于若彩色判断模块42确定待处理图像为彩色图像,则将待处理图像进行灰度转换,以生成待处理图像的灰度图像;
若彩色判断模块42确定待处理图像为灰度图像,则把待处理图像直接输出到获取模块31。
灰度转换模块43,具体用于:
若彩色判断模块42确定待处理图像为彩色图像,则根据灰度转换公式Gray(i,j)=a*R(i,j)+b*G(i,j)+c*B(i,j),对待处理图像中的各像素点进行灰度转换,以生成待处理图像的灰度图像;
其中,Gray(i,j)为像素点(i,j)的灰度值,R(i,j)为像素点(i,j)的红色颜色分量,G(i,j)为像素点(i,j)的绿色颜色分量,B(i,j)为像素点(i,j)的蓝色颜色分量,a、b、c分别为预设的红色颜色分量的乘积因数、绿色颜色分量的乘积因数、蓝色颜色分量的乘积因数,i∈[1,M],j∈[1,N],i、j、M、N为正整数,M为待处理图像的宽度,N为待处理图像的高度。
彩色判断模块42,具体用于:
检测待处理图像是否具有三个颜色通道或具有灰度数据;
若确定待处理图像具有三个颜色通道,则确定待处理图像为彩色图像;
若确定待处理图像具有灰度数据,则确定待处理图像为灰度图像。
本实施例的基于图像处理的文本分离装置可执行本发明实施例二提供的基于图像处理的文本分离方法,其实现原理相类似,此处不再赘述。
本实施例基于图像处理的文本分离装置通过确定待处理图像是彩色图像或灰度图像,将彩色图像转换为灰度图像;获取待处理图像中各像素点的灰度值;根据各像素点的灰度值,确定各像素点的边缘强度值;根据各像素点的边缘强度值,确定与待处理图像对应的二值图;根据二值图和各像素点的灰度值,确定各像素点的文本区域判定值;根据各像素点的文本区域判定值,判定待处理图像中的文本内容区域和非文本内容区域;然后对待处理图像中的文本内容区域、以及待处理图像中的非文本内容区域进行打印预处理,以使根据待处理图像得到的黑白打印输出内容清晰。从而对待处理图像中的文本内容区域、待处理图像中的非文本内容区域分别进行处理,以加强各区域,可以对文本内容区域中的每一个像素点进行加黑处理或者锐化滤波处理,从而在对图像文件进行打印黑白打印时,可以有效地识别出文字内容部分的像素并加黑处理或者锐化滤波处理,避免出现文字区域特别是彩色文字区域进行黑白打印或复印之后的模糊现象,提高了打印以及复印之后的清晰度;并且,可以对对非文本内容区域的每一个像素进行平滑滤波处理,消除了现有技术中的条纹现象,提高了非文本内容区域复印之后的清晰度,提高了复印的效果。
图11为本发明实施例五提供的基于图像处理的图像形成设备的结构示意图,如图11所示,设备上设置有如上述实施例中提供的基于图像处理的文本分离装置。
基于图像处理的图像形成设备为一个复合装置,包括控制单元1001、调制解调器1002、存储单元1003、打印单元1004、扫描单元1005、显示单元1006、网络接口1007、以及USB接口1008。其中,该调制解调器1002可以使基于图像处理的图像形成设备与远程的计算机装置进行通信,打印单元1004用于打印输出文稿,扫描单元1005用于复制文稿并把扫描到的待处理图像存储在存储单元1003中;存储单元1003存储基于图像处理的文本分离装置中的程序;基于图像处理的文本分离装置中的程序可被控制单元1001执行,从而控制单元1001处理扫描到的待处理图像,然后对扫描到的待处理图像进行图文分离处理,并把处理过的图像存储在存储单元1003中;显示单元1006用于获取用户的操作指令,以及把扫描到的待处理图像或处理过的图像进行显示;网络接口1007使基于图像处理的图像形成设备与网络中的计算机进行通信;USB接口1008用于使得基于图像处理的图像形成设备通过USB电缆与外部的计算机进行连接通信。
控制单元1001控制整个基于图像处理的图像形成设备的操作,基于图像处理的图像形成设备从USB接口1008或者网络接口1007,接收到打印任务,然后把打印数据从打印单元1004输出;控制单元1001通过显示单元1006接收用户的扫描指令,从扫描单元1005中获取扫描到的待处理图像,并把扫描到的待处理图像进行处理后,通过USB接口1008或网络接口1007传送到外部的计算机装置中。同时,控制单元1001还可以把扫描到的待处理图像进行处理后得到的图像,通过打印单元1004进行复印输出。
基于图像处理的图像形成设备集成了扫描、复印、打印等功能,基于图像处理的图像形成设备并不局限于现在公知的传真机、打印机、扫描仪、复印机、多功能一体机,不作具体限定。
另外,在本实施例中,具体的,在基于图像处理的图像形成设备上,设置上述实施例中提供的基于图像处理的文本分离装置到控制单元1001中,控制单元1001可以执行上述实施例中提供的基于图像处理的文本分离装置的功能。本实施例通过在基于图像处理的图像形成设备上,设置上述实施例中提供的基于图像处理的文本分离装置,确定待处理图像是彩色图像或灰度图像,将彩色图像转换为灰度图像;获取待处理图像中各像素点的灰度值;根据各像素点的灰度值,确定各像素点的边缘强度值;根据各像素点的边缘强度值,确定与待处理图像对应的二值图;根据二值图和各像素点的灰度值,确定各像素点的文本区域判定值;根据各像素点的文本区域判定值,判定待处理图像中的文本内容区域和非文本内容区域;然后对待处理图像中的文本内容区域、以及待处理图像中的非文本内容区域进行打印预处理,以使根据待处理图像得到的黑白打印输出内容清晰。从而对待处理图像中的文本内容区域、待处理图像中的非文本内容区域分别进行处理,以加强各区域,可以对文本内容区域中的每一个像素点进行加黑处理或者锐化滤波处理,从而在对图像文件进行打印黑白打印时,可以有效地识别出文字内容部分并加黑处理或者锐化滤波处理,避免出现文字区域特别是彩色文字区域进行黑白打印或复印之后的模糊现象,提高了打印以及复印之后的清晰度;并且,可以对对非文本内容区域的每一个像素进行平滑滤波处理,消除了现有技术中的条纹现象,提高了非文本内容区域复印之后的清晰度,提高了复印的效果。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (17)

1.一种基于图像处理的文本分离方法,其特征在于,包括:
获取待处理图像中各像素点的灰度值;
根据各像素点的灰度值,确定各像素点的边缘强度值;
根据各像素点的边缘强度值,确定与所述待处理图像对应的二值图;
根据所述二值图和各像素点的灰度值,确定各像素点的文本区域判定值;
根据各像素点的文本区域判定值,判定所述待处理图像中的文本内容区域和非文本内容区域。
2.根据权利要求1所述的方法,其特征在于,所述根据各像素点的灰度值,确定各像素点的边缘强度值,包括:
根据第一检测滤波器的梯度算子、第二检测滤波器的梯度算子,分别对各像素点的灰度值进行计算,以确定各像素点的隔行梯度值、隔列梯度值之后,根据各像素点的隔行梯度值、隔列梯度值,确定各像素点的边缘强度值;
其中,每一个像素点的隔行梯度值每一个像素点的隔列梯度值i∈[1,M],j∈[1,N],i、j、M、N、n为正整数,M为所述待处理图像的宽度,N为所述待处理图像的高度;Gray(i+p,j+q)为像素点(i+p,j+q)的灰度值,a(p,q)为第一检测滤波器的梯度算子的(2n+1)*(2n+1)模板的值,b(p,q)为第二检测滤波器的梯度算子的(2n+1)*(2n+1)模板的值,p∈[-n,n],q∈[-n,n],p、q为整数,且n小于N和M。
3.根据权利要求2所述的方法,其特征在于,所述根据各像素点的隔行梯度值、隔列梯度值,确定各像素点的边缘强度值,包括:
每一个像素点的边缘强度值strength(i,j)=(abs(Gradient_a(i,j))+abs(Gradient_b(i,j)))/2;abs表示取绝对值。
4.根据权利要求1所述的方法,其特征在于,所述根据所述二值图和各像素点的灰度值,确定各像素点的文本区域判定值,包括:
针对每一个像素点,根据当前像素点的灰度值,以及与当前像素点相邻的预设个数的像素点在所述二值图中的取值,确定当前像素点的文本区域判定值;
其中,像素点的文本区域判定值Gray(i,j)为像素点(i,j)的灰度值,i∈[1,M],j∈[1,N],i、j、M、N、n为正整数,M为所述待处理图像的宽度,N为所述待处理图像的高度;bw(i+r,j+t)为与像素点(i,j)在(2n+1)*(2n+1)的模板内相邻的像素点在所述二值图中的取值,r∈[-n,n],t∈[-n,n],r、t为整数,且n小于N和M。
5.根据权利要求1所述的方法,其特征在于,所述根据各像素点的文本区域判定值,判定所述待处理图像中的文本内容区域和非文本内容区域,包括:
针对每一个像素点,确定当前像素点的文本区域判定值是否大于第二分割阈值;
针对每一个像素点,若确定当前像素点的文本区域判定值大于第二分割阈值,则确定当前像素点为文本内容区域;
针对每一个像素点,若确定当前像素点的文本区域判定值小于等于第二分割阈值,则确定当前像素点为非文本内容区域。
6.根据权利要求1所述的方法,其特征在于,在所述根据各像素点的文本区域判定值,判定所述待处理图像中的文本内容区域和非文本内容区域之后,还包括:
对所述待处理图像中的文本内容区域中的每一个像素点,进行加黑处理或者锐化滤波处理,以使根据所述待处理图像中的文本内容区域得到的黑白打印输出内容清晰;
对所述待处理图像中的非文本内容区域中的每一个像素点,进行平滑滤波处理,以消除根据所述待处理图像中的非文本内容区域得到的黑白打印输出内容中的条纹。
7.根据权利要求1所述的方法,其特征在于,所述方法包括:
重复以下过程直至确定出所述待处理图像中的所有的文本内容区域和所有的非文本内容区域;
第一部分分割过程;
第二部分分割过程;
其中,第一部分分割过程包括了重复以下过程直至确定预设数量的像素点中所有像素点在二值图中的取值:获取待处理图像中预设数量的像素点的灰度值;针对预设数量的像素点中的每一个像素点,根据当前像素点的灰度值,确定当前像素点的边缘强度值;针对预设数量的像素点中的每一个像素点,根据当前像素点的边缘强度值,确定当前像素点在与待处理图像对应的二值图中的取值;
第二部分分割过程包括了重复以下过程直至确定预设数量的像素点中所有像素点为文本内容区域或非文本内容区域:针对所述预设数量的像素点中的每一个像素点,根据和当前像素点相邻的像素点在所述二值图中的取值、以及当前像素点的灰度值,确定当前像素点的文本区域判定值;针对预设数量的像素点中的每一个像素点,根据当前像素点的文本区域判定值,判定当前像素点为文本内容区域或非文本内容区域。
8.根据权利要求1-7任一项所述的方法,其特征在于,在所述获取待处理图像中各像素点的灰度值之前,还包括:
获取所述待处理图像,并确定所述待处理图像是彩色图像或灰度图像;
若确定所述待处理图像为彩色图像,则将所述待处理图像进行灰度转换,以生成所述待处理图像的灰度图像;
若确定所述待处理图像为灰度图像,则执行所述获取待处理图像中各像素点的灰度值的步骤。
9.一种基于图像处理的文本分离装置,其特征在于,包括:
获取模块,用于获取待处理图像中各像素点的灰度值;
检测模块,用于根据各像素点的灰度值,确定各像素点的边缘强度值;
第一图文分离模块,用于根据各像素点的边缘强度值,确定与所述待处理图像对应的二值图;
第二图文分离模块,用于根据所述二值图和各像素点的灰度值,确定各像素点的文本区域判定值;
判定模块,用于根据各像素点的文本区域判定值,判定所述待处理图像中的文本内容区域和非文本内容区域。
10.根据权利要求9所述的装置,其特征在于,所述检测模块,包括:
梯度确定子模块,用于:根据第一检测滤波器的梯度算子、第二检测滤波器的梯度算子,分别对各像素点的灰度值进行计算,以确定各像素点的隔行梯度值、隔列梯度值;
其中,每一个像素点的隔行梯度值每一个像素点的隔列梯度值i∈[1,M],j∈[1,N],i、j、M、N、n为正整数,M为所述待处理图像的宽度,N为所述待处理图像的高度;Gray(i+p,j+q)为像素点(i+p,j+q)的灰度值,a(p,q)为第一检测滤波器的梯度算子的(2n+1)*(2n+1)模板的值,b(p,q)为第二检测滤波器的梯度算子的(2n+1)*(2n+1)模板的值,p∈[-n,n],q∈[-n,n],p、q为整数,且n小于N和M;
边缘强度确定子模块,用于根据各像素点的隔行梯度值、隔列梯度值,确定各像素点的边缘强度值。
11.根据权利要求10所述的装置,其特征在于,所述边缘强度确定子模块,具体用于计算:
每一个像素点的边缘强度值strength(i,j)=(abs(Gradient_a(i,j))+abs(Gradient_b(i,j)))/2;abs表示取绝对值。
12.根据权利要求9所述的装置,其特征在于,所述第二图文分离模块,具体用于:
针对每一个像素点,根据当前像素点的灰度值,以及与当前像素点相邻的预设个数的像素点在所述二值图中的取值,确定当前像素点的文本区域判定值;
其中,像素点的文本区域判定值Gray(i,j)为像素点(i,j)的灰度值,i∈[1,M],j∈[1,N],i、j、M、N、n为正整数,M为所述待处理图像的宽度,N为所述待处理图像的高度;bw(i+r,j+t)为与像素点(i,j)在(2n+1)*(2n+1)的模板内相邻的像素点在所述二值图中的取值,r∈[-n,n],t∈[-n,n],r、t为整数,且n小于N和M。
13.根据权利要求9所述的装置,其特征在于,所述判定模块,包括:
判定子模块,用于针对每一个像素点,确定当前像素点的文本区域判定值是否大于第二分割阈值;
第一确定子模块,用于针对每一个像素点,若确定当前像素点的文本区域判定值大于第二分割阈值,则确定当前像素点为文本内容区域;
第二确定子模块,用于针对每一个像素点,若确定当前像素点的文本区域判定值小于等于第二分割阈值,则确定当前像素点为非文本内容区域。
14.根据权利要求9所述的装置,其特征在于,还包括:
图像处理模块,用于在所述判定模块根据各像素点的文本区域判定值,判定所述待处理图像中的文本内容区域和非文本内容区域之后,对所述待处理图像中的文本内容区域中的每一个像素点,进行加黑处理或者锐化滤波处理,以使根据所述待处理图像中的文本内容区域得到的黑白打印输出内容清晰;
用于对所述待处理图像中的非文本内容区域中的每一个像素点,进行平滑滤波处理,以消除根据所述待处理图像中的非文本内容区域得到的黑白打印输出内容中的条纹。
15.根据权利要求9所述的装置,其特征在于,所述装置具体用于:
重复以下过程直至确定出所述待处理图像中的所有的文本内容区域和所有的非文本内容区域;
第一部分分割过程;
第二部分分割过程;
其中,第一部分分割过程包括了重复以下过程直至确定预设数量的像素点中所有像素点在二值图中的取值:所述获取模块获取待处理图像中预设数量的像素点的灰度值;针对预设数量的像素点中的每一个像素点,所述检测模块根据当前像素点的灰度值,确定当前像素点的边缘强度值;针对预设数量的像素点中的每一个像素点,所述第一图文分离模块根据当前像素点的边缘强度值,确定当前像素点在与待处理图像对应的二值图中的取值;
第二部分分割过程包括了重复以下过程直至确定预设数量的像素点中所有像素点为文本内容区域或非文本内容区域:针对所述预设数量的像素点中的每一个像素点,所述第二图文分离模块根据和当前像素点相邻的像素点在所述二值图中的取值、以及当前像素点的灰度值,确定当前像素点的文本区域判定值;针对预设数量的像素点中的每一个像素点,所述判定模块根据当前像素点的文本区域判定值,判定当前像素点为文本内容区域或非文本内容区域。
16.根据权利要求9-15任一项所述的装置,其特征在于,还包括:
彩色判断模块,用于在所述获取模块获取待处理图像中各像素点的灰度值之前,获取所述待处理图像,并确定所述待处理图像是彩色图像或灰度图像;
灰度转换模块,用于若所述彩色判断模块确定所述待处理图像为彩色图像,则将所述待处理图像进行灰度转换,以生成所述待处理图像的灰度图像;
若所述彩色判断模块确定所述待处理图像为灰度图像,则把所述待处理图像传送到所述获取模块进行处理。
17.一种基于图像处理的图像形成设备,其特征在于,所述设备上设置有如权利要求9-16任一项所述的基于图像处理的文本分离装置。
CN201610805468.7A 2016-09-05 2016-09-05 基于图像处理的文本分离方法及装置和图像形成设备 Active CN106407919B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201610805468.7A CN106407919B (zh) 2016-09-05 2016-09-05 基于图像处理的文本分离方法及装置和图像形成设备
US15/694,571 US10270938B2 (en) 2016-09-05 2017-09-01 Image-processing-based text separation method, text separation device, and image formation apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610805468.7A CN106407919B (zh) 2016-09-05 2016-09-05 基于图像处理的文本分离方法及装置和图像形成设备

Publications (2)

Publication Number Publication Date
CN106407919A true CN106407919A (zh) 2017-02-15
CN106407919B CN106407919B (zh) 2019-09-10

Family

ID=57999848

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610805468.7A Active CN106407919B (zh) 2016-09-05 2016-09-05 基于图像处理的文本分离方法及装置和图像形成设备

Country Status (2)

Country Link
US (1) US10270938B2 (zh)
CN (1) CN106407919B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107025638A (zh) * 2017-03-28 2017-08-08 北京小米移动软件有限公司 图像处理的方法及装置
CN108171235A (zh) * 2018-01-08 2018-06-15 北京奇艺世纪科技有限公司 标题区域检测方法及系统
CN108304843A (zh) * 2017-12-25 2018-07-20 山东浪潮云服务信息科技有限公司 一种图像审批方法及审批装置
CN109597592A (zh) * 2018-12-03 2019-04-09 珠海趣印科技有限公司 一种App文本智能增强方法
CN109858324A (zh) * 2018-12-10 2019-06-07 西南石油大学 语言图文识别系统及其实现方法
CN111491069A (zh) * 2020-06-29 2020-08-04 北京灵伴即时智能科技有限公司 一种文档图像的色彩模式自动设定方法
CN111723804A (zh) * 2019-03-18 2020-09-29 株式会社理光 图文分离装置、图文分离方法及计算机可读取记录介质
CN108550101B (zh) * 2018-04-19 2023-07-25 腾讯科技(深圳)有限公司 图像处理方法、装置及存储介质

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220108435A1 (en) * 2020-10-02 2022-04-07 Baker Hughes Oilfield Operations Llc Automated turbine blade to shroud gap measurement

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6178010B1 (en) * 1996-12-10 2001-01-23 Fuji Xerox Co., Ltd. Image processing device
US20020159096A1 (en) * 2001-03-29 2002-10-31 Sharp Laboratories Of America, Inc. Adaptive image filtering based on a distance transform
CN101615252A (zh) * 2008-06-25 2009-12-30 中国科学院自动化研究所 一种自适应图像文本信息提取方法
CN104182722A (zh) * 2013-05-24 2014-12-03 佳能株式会社 文本检测方法和装置以及文本信息提取方法和系统
CN104200209A (zh) * 2014-08-29 2014-12-10 南京烽火星空通信发展有限公司 一种图像文字检测方法
CN105740774A (zh) * 2016-01-25 2016-07-06 浪潮软件股份有限公司 一种图像的文本区域定位方法及装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5379130A (en) * 1992-12-02 1995-01-03 Industrial Technology Research Institute Text/image separation method
KR100213089B1 (ko) * 1997-01-29 1999-08-02 윤종용 루프필터링 방법 및 루프필터
AUPP128498A0 (en) * 1998-01-12 1998-02-05 Canon Kabushiki Kaisha A method for smoothing jagged edges in digital images
JP3558893B2 (ja) * 1998-10-08 2004-08-25 シャープ株式会社 画像処理装置および画像処理方法
JP4960817B2 (ja) * 2007-09-19 2012-06-27 キヤノン株式会社 画像処理装置、および画像処理方法
JP5073773B2 (ja) * 2010-04-08 2012-11-14 シャープ株式会社 画像処理装置、画像形成装置、画像処理方法及びプログラム
JP5564553B2 (ja) * 2012-10-22 2014-07-30 Eizo株式会社 画像処理装置、画像処理方法及びコンピュータプログラム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6178010B1 (en) * 1996-12-10 2001-01-23 Fuji Xerox Co., Ltd. Image processing device
US20020159096A1 (en) * 2001-03-29 2002-10-31 Sharp Laboratories Of America, Inc. Adaptive image filtering based on a distance transform
CN101615252A (zh) * 2008-06-25 2009-12-30 中国科学院自动化研究所 一种自适应图像文本信息提取方法
CN104182722A (zh) * 2013-05-24 2014-12-03 佳能株式会社 文本检测方法和装置以及文本信息提取方法和系统
CN104200209A (zh) * 2014-08-29 2014-12-10 南京烽火星空通信发展有限公司 一种图像文字检测方法
CN105740774A (zh) * 2016-01-25 2016-07-06 浪潮软件股份有限公司 一种图像的文本区域定位方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
查宇飞 等: "《视频目标跟踪方法》", 31 July 2015, 北京:国防工业出版社 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107025638A (zh) * 2017-03-28 2017-08-08 北京小米移动软件有限公司 图像处理的方法及装置
CN107025638B (zh) * 2017-03-28 2020-02-07 北京小米移动软件有限公司 图像处理的方法及装置
CN108304843A (zh) * 2017-12-25 2018-07-20 山东浪潮云服务信息科技有限公司 一种图像审批方法及审批装置
CN108171235A (zh) * 2018-01-08 2018-06-15 北京奇艺世纪科技有限公司 标题区域检测方法及系统
CN108171235B (zh) * 2018-01-08 2021-01-22 北京奇艺世纪科技有限公司 标题区域检测方法及系统
CN108550101B (zh) * 2018-04-19 2023-07-25 腾讯科技(深圳)有限公司 图像处理方法、装置及存储介质
CN109597592A (zh) * 2018-12-03 2019-04-09 珠海趣印科技有限公司 一种App文本智能增强方法
CN109858324A (zh) * 2018-12-10 2019-06-07 西南石油大学 语言图文识别系统及其实现方法
CN111723804A (zh) * 2019-03-18 2020-09-29 株式会社理光 图文分离装置、图文分离方法及计算机可读取记录介质
CN111723804B (zh) * 2019-03-18 2024-05-17 株式会社理光 图文分离装置、图文分离方法及计算机可读取记录介质
CN111491069A (zh) * 2020-06-29 2020-08-04 北京灵伴即时智能科技有限公司 一种文档图像的色彩模式自动设定方法
CN111491069B (zh) * 2020-06-29 2020-10-02 北京灵伴即时智能科技有限公司 一种文档图像的色彩模式自动设定方法

Also Published As

Publication number Publication date
US10270938B2 (en) 2019-04-23
CN106407919B (zh) 2019-09-10
US20180069984A1 (en) 2018-03-08

Similar Documents

Publication Publication Date Title
CN106407919A (zh) 基于图像处理的文本分离方法及装置和图像形成设备
DE69935120T2 (de) Automatische Verbesserung der Druckqualität basiert auf Grösse, Form, Orientierung und Farbe von Strukturen
CA2036751C (en) Method for preparing polychromatic printing plates
DE69032318T2 (de) Vorrichtung zur Bildverarbeitung
DE69118939T2 (de) Bildverarbeitungsgerät
DE19842572B4 (de) Verfahren zur automatischen Entfernung von Bildfehlern
DE69026159T2 (de) Bildverarbeitungsgerät
EP1453006A1 (en) Converted digital colour image with improved colour distinction for colour-blinds
JP4840495B2 (ja) 画像処理装置及びコンピュータプログラム
CN107346580A (zh) 票据信息识别方法及装置
JP4153567B2 (ja) 背景依存の黒色のイメージを生成するカラー印刷における色料決定方法
US8620081B2 (en) Image processing apparatus, method, and storage medium for determining attributes
US6934412B2 (en) Detecting small amounts of color in an image
US5270837A (en) Method and apparatus for enabling intelligent post-processing of differing data types
DE69933808T2 (de) Bildverarbeitungsvorrichtung, -verfahren und Speichermedium
CN104751444A (zh) 一种从相似图像中筛选显著差异的方法及装置
CN106504252A (zh) 一种彩色图像的颜色分割方法及装置
US7545540B2 (en) Method and system for processing color image data
US6785416B1 (en) System and method for the processing of scanned image data using a pixel window
DE102011079513A1 (de) Fleckencodierungen unter Anwendung eines Nachbarschaftsarrays
US6781593B1 (en) Method and apparatus for color quantization
EP3750300A1 (en) Encoding dot patterns into printed images based on source pixel color
JPS62147860A (ja) 中間調フアクシミリ信号処理方式
RU2368007C1 (ru) Способ сегментации текста по цветовому признаку в процессе копирования
EP1453008A1 (en) Cocverted digital colour image with improved colour distinction for colour-blinds

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20201120

Address after: 519060 A, building 3, building 01, 3883 Zhuhai Avenue, Zhuhai, Guangdong, China

Patentee after: ZHUHAI PANTUM ELECTRONICS Co.,Ltd.

Address before: 519060 Area A, 7th Floor, Building 01, No. 3883, Zhuhai Avenue, Xiangzhou District, Zhuhai City, Guangdong Province

Patentee before: Zhuhai Saine Printing Technology Co.,Ltd.