CN1333574C - 一种数字图像中提取文本区域的方法 - Google Patents

一种数字图像中提取文本区域的方法 Download PDF

Info

Publication number
CN1333574C
CN1333574C CNB2004100804061A CN200410080406A CN1333574C CN 1333574 C CN1333574 C CN 1333574C CN B2004100804061 A CNB2004100804061 A CN B2004100804061A CN 200410080406 A CN200410080406 A CN 200410080406A CN 1333574 C CN1333574 C CN 1333574C
Authority
CN
China
Prior art keywords
digital picture
text filed
value
image
negative
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB2004100804061A
Other languages
English (en)
Other versions
CN1755708A (zh
Inventor
周兴平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Primax Electronics Ltd
Original Assignee
Primax Electronics Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Primax Electronics Ltd filed Critical Primax Electronics Ltd
Priority to CNB2004100804061A priority Critical patent/CN1333574C/zh
Publication of CN1755708A publication Critical patent/CN1755708A/zh
Application granted granted Critical
Publication of CN1333574C publication Critical patent/CN1333574C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Facsimile Image Signal Circuits (AREA)
  • Character Input (AREA)

Abstract

本发明涉及一种数字图像中提取文本区域的方法,该方法包括如下步骤:扫描该数字图像,获得该图像的亮度值;平滑过滤该数字图像;将图像划分为多个块;计算各块中水平方向以及竖直方向的边缘个数;及根据该边缘个数确定文本块;其中,计算各块中边缘的个数的步骤,还包括如下步骤:微分该块中的像素值;根据该微分数据,标记该块的正向峰值以及负向峰值;累加该峰值个数,根据该峰值个数确定边缘个数;根据该边缘个数确定文本块的步骤,是若该边缘个数大于一第二基准值,则将该块标记为文本块。本发明运用关系像素间的区别,简单有效地提取数字图像中的文本区域,在降低成本的同时得到了比较好的处理效果,同时提高了标记文本区域的准确性。

Description

一种数字图像中提取文本区域的方法
技术领域
本发明涉及一种数字图像处理方法,特别是涉及一种数字图像中提取文本区域的方法。
背景技术
在很多内容丰富的数字图像中,一幅图通常都同时包括图形区域、文本区域、连续的图像区域等。在对数字图像进行处理时,针对不同的区域,通常会有不同的处理方式。图形与文本一般都要求具有较清晰的边缘,特别是文本区域,具有较清晰的边缘才能较容易地识别出其中的文字内容,而图像区域则更注重内容,例如在打印的时候如果选用节约碳粉的打印方式,则将整幅图都进行淡化处理,这样图像、图形、文字同时被淡化,虽然对图像的处理效果比较明显,但是不能区别对待文字和图形的边缘和内部,因为文字和图形的打印结果只需要知道位置和形状就可以,用户更关心轮廓边缘,轮廓内部的可以不要或更淡。
又如在数字复印机中,文件首先通过一个扫描单元进行扫描,经过扫描单元处理之后,文件转换为灰度图像或RGB彩色图像。图像根据例如一位驱动或多位驱动的驱动形式进一步处理。如果数字复印机是一个彩色复印机,则必须执行一个过网(Screen)功能,将8位灰度图像或8位RGB图像转换为1位或多位图像的步骤,彩色匹配步骤必须在过网功能之前执行,一些产品通过有规律的矩阵执行过网操作,另一些产品使用误差混淆来消除波纹干扰。虽然执行点阵过网中的半色调对于表现连续的色调源文件具有比较好的处理效果,但是会降低文本与图形的质量,使文本或图线的边缘更加平滑,从而导致边缘不够清晰。
因此,当前急需一种自动识别图像中的文本区域,从而可对文本区域进行区别处理,使文本或图形区域获得清晰、尖锐的边缘,但对于其它连续的色调图像与半色调图像,通过平滑过滤使整个图像更加光滑。
发明内容
本发明所要解决的技术问题在于提供一种数字图像中提取文本区域的方法,主要的目的在于提取图像中的文本区域,从而可以对文本区域进行区别处理。
为了实现上述目的,本发明提供了一种数字图像中提取文本区域的方法,其特点在于,该方法包括如下步骤:扫描该数字图像,获得该图像的亮度值;平滑过滤该数字图像;将图像划分为多个块;计算各块中水平方向以及竖直方向的边缘个数;及根据该边缘个数确定文本块;其中,计算各块中边缘的个数的步骤,还包括如下步骤:微分该块中的像素值;根据该微分数据,标记该块的正向峰值以及负向峰值;累加该峰值个数,根据该峰值个数确定边缘个数;根据该边缘个数确定文本块的步骤,是若该边缘个数大于一第二基准值,则将该块标记为文本块。
上述数字图像中提取文本区域的方法,其特点在于,若该数字图像为彩色图像,则还包括将图像转换为灰度图像的步骤。
上述数字图像中提取文本区域的方法,其特点在于,该平滑过滤该数字图像的步骤,是用高斯过滤器对图像进行平滑过滤。
上述数字图像中提取文本区域的方法,其特点在于,将图像划分为多个块的步骤,是按照每块包括N*N个像素进行划分。
上述数字图像中提取文本区域的方法,其特点在于,N的个数包括10、16、32或64。
上述数字图像中提取文本区域的方法,其特点在于,该边缘为一边的像素与另一边的像素与其有明显的灰度差别的像素集。
上述数字图像中提取文本区域的方法,其特点在于,该块的正向峰值以及负向峰值的步骤,还包括如下步骤:确定该微分数据中数字符号发生变化的像素点:分别累计该微分数据中正数和以及负数和;将该正数和以及该负数和的绝对值与一第一基准值进行比较;及根据该比较结果标记该正向峰值以及该负向峰值。
上述数字图像中提取文本区域的方法,其特点在于,该第一基准值为70。
上述数字图像中提取文本区域的方法,其特点在于,根据该比较结果标记该正向峰值以及该负向峰值的步骤,还包括:若该正数和大于基准值,则标记正向峰值;及若该负数和的绝对值大于基准值,则标记负向峰值。
上述数字图像中提取文本区域的方法,其特点在于,该第二基准值为40。
本发明的功效,在于运用关系像素间的区别,简单有效地提取数字图像中的文本区域,在降低成本的同时得到了比较好的处理效果,同时提高了标记文本区域的准确性。
以下结合附图和具体实施例对本发明进行详细描述,但不作为对本发明的限定。
附图说明
图1为本发明所提数字图像中提取文本区域的方法的总体流程图;
图2为本发明实施例的运作流程图;
图3为本发明实施例块区域中的像素值示意图;
图4为本发明实施例块区域中的像素值经过微分后的示意图;
图5为本发明实施例块区域中峰值标记的示意图;
图6为本发明实施例块区域中标记峰值过程的示意图;及
图7A~7I为本发明实施例增强文本区域效果的处理示意图。
其中,附图标记:
步骤110-扫描该数字图像,获得该图像的亮度值
步骤120-平滑过滤该数字图像
步走130-将图像划分为多个块
步骤140-计算各块中边缘的个数
步骤150-根据该边缘个数确定文本块
步骤2010-扫描图像,获得图像的亮度值
步骤2020-平滑过滤该数字图像
步骤2030-将图像划分为多个块
步骤2040-微分该块中的像素值
步骤2050-确定该微分数据中数字符号发生变化的像素点,分别累计该微分数据中正数和以及负数和
步骤2060-正数和的绝对值是否大于70?
步骤2070-负数和的绝对值是否大于70?
步骤2080-标记正向峰值
步骤2090-标记负向峰值
步骤2100-累加峰值个数
步骤2110-累加横向以及纵向的峰值总数
步骤2120-峰值总数是否大于40?
步骤2130-将该块标记为文本块
具体实施方式
本发明为一种数字图像中提取文本区域的方法,首先由图1说明本发明的系统,该图为本发明的数字图像中提取文本区域的方法的总体流程图,说明如下:
步骤110,首先扫描该数字图像,获得该图像的亮度值;步骤120,然后平滑过滤该数字图像;步骤130,将图像划分为多个块;步骤140,计算各块中水平方向以及竖直方向的边缘个数;步骤150,最后根据该边缘个数确定文本块。
接着,通过图2来进一步说明本发明的流程,该图为本发明实施例的运作流程图,说明如下:
步骤2010,首先扫描图像,获得图像的亮度值,如果由扫描仪得到的图像是单色图像,那么该提取图像亮度值得步骤可以跳过,如果由扫描仪获得的图像是包含有RGB色彩值的彩色图像,则需要提取图像的亮度值,将图像转换为灰度图像。如果图像是RGB格式的,则图像的亮度值为:
Lightness=R*0.30+G*0.59+B*0.11
如果原始图像是其它格式的,可以将其转换为GRB格式,再提取亮度值。从RGB色彩空间到其它如YcbCr或Lab色彩空间的转换算法有很多,用户可以使用3-D查表或通过公式计算。
步骤2020,然后对图像进行预处理,对于图像中的每一个像素,使用平滑过滤对图像进行预处理,来消除对原始图像半色调(Halftone)处理而导致的调节误差。这种平滑处理并不会影响原始图像。在本实施例中,用高斯过滤器用作平滑过滤器。
步骤2030,再将图像划分为多个块,每一块具有N*N个像素,N可以为10、16、32或64。本实施例中N=10。请参考图3,经过划分某一块(10*10)的数据如图所示。
对于每一块,计算具有在水平与垂直方向上划分大的对比区域的边缘的个数,根据预先定义的第一基准值来判断当前块是否为文本区域。边缘为一边的像素与另一边的像素与其有明显的灰度差别的像素集。如果当前块的边缘个数较多的块,则该块为文本区域。
步骤2040,具体做法为微分当前块中的像素值,微分后得到的数据如图4所示。
步骤2050,确定该微分数据中数字符号发生变化的像素点,分别累计该微分数据中正数和以及负数和;步骤2060、2070,再判断正数和以及负数和的绝对值是否大于一第一基准值,本实施例中第一基准值优选为70,当符号由正数到负数改变时,如果在符号改变之前,持续正向之和大于或等于70,步骤2080,则将其标记为正向峰值;当符号由负数到正数改变,如果在符号改变之前,持续负向之和小于或等于-70,步骤2090,则将其标记为负向峰值。也就是将正数和与负数和的绝对值与70进行比较,根据比较结果进行标记,标记后的块数据如图5所示。
具体计算示意图请参见图6。例如,对于第一个微分序列[-5 -40 -46 -10 2754 17 11 9 1],其中第5个元素为(27),之后的元素都为正数,负数的和为sum=-5-40-46-10=-101<=-70,因比这里峰值个数count=count+1;相应的,最后一个元素1,虽然正负号没有改变,正数的和sum=27+54+17+11+9=118>=70,因此峰值个数count=count+1,如果符号在此处发生改变,则和大于或等于70,因此将其累加。
步骤2100,然后计算正向峰值与负向峰值数量的和。垂直方向微分步骤与上述类似,步骤2110,累计水平方向与垂直方向的峰值总和。再根据该总和进行判断,步骤2120,判断峰值个数是否大于一第二基准值,本实施例中第二基准值为40。如果垂直峰值数+水平峰值数的总和大于等于40,步骤2130,则将当前块标记为文本区域。
采用上述方法对所有块进行处理,从而将整幅图像的所有文本区域都标记出来。然后可以有针对性地对文本区域进行处理。例如对文字点的平滑、填充、消除锯齿等,从而使文字及其边缘更加清晰,增强了数字图像的效果。具体做法请参见图7A~7I,根据图中的方法增强文本区域的效果。
当然,本发明还可有其他多种实施例,在不背离本发明精神及其实质的情况下,熟悉本领域的技术人员可根据本发明作出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明权利要求的保护范围。

Claims (10)

1、一种数字图像中提取文本区域的方法,其特征在于,该方法包括如下步骤:
扫描该数字图像,获得该图像的亮度值;
平滑过滤该数字图像;
将图像划分为多个块;
计算各块中水平方向以及竖直方向的边缘个数;及
根据该边缘个数确定文本块
其中,
计算各块中边缘个数的步骤,包括:
微分该块中的像素值;
根据该微分数据,标记该块的正向峰值以及负向峰值;
累加该峰值个数,根据该峰值个数确定边缘个数;
根据该边缘个数确定文本块的步骤,是若该边缘个数大于一第二基准值,则将该块标记为文本块。
2、根据权利要求1所述的数字图像中提取文本区域的方法,其特征在于,若该数字图像为彩色图像,则还包括将图像转换为灰度图像的步骤。
3、根据权利要求1所述的数字图像中提取文本区域的方法,其特征在于,该平滑过滤该数字图像的步骤,是用高斯过滤器对图像进行平滑过滤。
4、根据权利要求1所述的数字图像中提取文本区域的方法,其特征在于,将图像划分为多个块的步骤,是按照每块包括N*N个像素进行划分。
5、根据权利要求4所述的数字图像中提取文本区域的方法,其特征在于,N的个数包括10、16、32或64。
6、根据权利要求1所述的数字图像中提取文本区域的方法,其特征在于,该边缘为一边的像素与另一边的像素与其有明显的灰度差别的像素集。
7、根据权利要求1所述的数字图像中提取文本区域的方法,其特征在于,该块的正向峰值以及负向峰值的步骤,还包括如下步骤:
确定该微分数据中数字符号发生变化的像素点:
分别累计该微分数据中正数和以及负数和;
将该正数和以及该负数和的绝对值与一第一基准值进行比较;及
根据该比较结果标记该正向峰值以及该负向峰值。
8、根据权利要求7所述的数字图像中提取文本区域的方法,其特征在于,该第一基准值为70。
9、根据权利要求7所述的数字图像中提取文本区域的方法,其特征在于,根据该比较结果标记该正向峰值以及该负向峰值的步骤,还包括:
若该正数和大于基准值,则标记正向峰值;及
若该负数和的绝对值大于基准值,则标记负向峰值。
10、根据权利要求7所述的数字图像中提取文本区域的方法,其特征在于,该第二基准值为40。
CNB2004100804061A 2004-09-29 2004-09-29 一种数字图像中提取文本区域的方法 Expired - Fee Related CN1333574C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB2004100804061A CN1333574C (zh) 2004-09-29 2004-09-29 一种数字图像中提取文本区域的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2004100804061A CN1333574C (zh) 2004-09-29 2004-09-29 一种数字图像中提取文本区域的方法

Publications (2)

Publication Number Publication Date
CN1755708A CN1755708A (zh) 2006-04-05
CN1333574C true CN1333574C (zh) 2007-08-22

Family

ID=36688919

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2004100804061A Expired - Fee Related CN1333574C (zh) 2004-09-29 2004-09-29 一种数字图像中提取文本区域的方法

Country Status (1)

Country Link
CN (1) CN1333574C (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101256630B (zh) * 2007-02-26 2010-06-30 富士通株式会社 用于改善文档图像二值化性能的去噪声装置和方法
CN101470805B (zh) * 2007-12-28 2012-01-04 北大方正集团有限公司 静态图像目标的特征信息提取方法及装置
EP2136317B1 (en) 2008-06-19 2013-09-04 Samsung Electronics Co., Ltd. Method and apparatus for recognizing characters
KR101002899B1 (ko) * 2008-06-19 2010-12-21 삼성전자주식회사 문자 인식 방법 및 장치
KR101773616B1 (ko) * 2011-05-16 2017-09-13 엘지디스플레이 주식회사 영상처리방법과 이를 이용한 입체영상 표시장치
US20190155883A1 (en) * 2016-05-18 2019-05-23 Nokia Technologies Oy Apparatus, method and computer program product for recovering editable slide

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4996603A (en) * 1988-06-28 1991-02-26 Fujitsu Limited Image processing system
US6473522B1 (en) * 2000-03-14 2002-10-29 Intel Corporation Estimating text color and segmentation of images
CN1394313A (zh) * 2000-11-02 2003-01-29 密刻爱你有限公司 电子文档中嵌入和提取文本的方法
CN1471302A (zh) * 2002-07-27 2004-01-28 ���ǵ�����ʽ���� 用于提高数字图像质量的方法和装置
CN1487476A (zh) * 2002-10-04 2004-04-07 ��ʿͨ��ʽ���� 图像生成装置及方法
CN1512439A (zh) * 2002-12-26 2004-07-14 ��ʿͨ��ʽ���� 视频文本处理装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4996603A (en) * 1988-06-28 1991-02-26 Fujitsu Limited Image processing system
US6473522B1 (en) * 2000-03-14 2002-10-29 Intel Corporation Estimating text color and segmentation of images
CN1394313A (zh) * 2000-11-02 2003-01-29 密刻爱你有限公司 电子文档中嵌入和提取文本的方法
CN1471302A (zh) * 2002-07-27 2004-01-28 ���ǵ�����ʽ���� 用于提高数字图像质量的方法和装置
CN1487476A (zh) * 2002-10-04 2004-04-07 ��ʿͨ��ʽ���� 图像生成装置及方法
CN1512439A (zh) * 2002-12-26 2004-07-14 ��ʿͨ��ʽ���� 视频文本处理装置

Also Published As

Publication number Publication date
CN1755708A (zh) 2006-04-05

Similar Documents

Publication Publication Date Title
CN101098387B (zh) 图像处理设备和图像处理方法
CN100446540C (zh) 彩色图像压缩方法和装置
CN110008954B (zh) 一种基于多阈值融合的复杂背景文本图像提取方法及系统
CN101616231B (zh) 图像处理装置、图像形成装置及图像处理方法
JP4568460B2 (ja) 画像処理装置及び記録媒体
EP1100257A1 (en) Image processor, image processing method, and medium on which image processing program is recorded
CN101933047B (zh) 数字图像中的牙齿定位与白化
CN101141548B (zh) 图像颜色判定装置及图像颜色判定方法
US8441701B2 (en) Image processing apparatus, image processing method, image processing program, and storage medium
JP5830338B2 (ja) 帳票認識方法および帳票認識装置
CN104618703B (zh) 一种白平衡调整方法
CN101197919A (zh) 成像设备及其图像质量提高方法
US9843694B2 (en) Image reading device and method, reading area display device and method, and program
CN1226884C (zh) 信号处理设备和方法
CN101662569A (zh) 图像处理装置、图像形成装置及图像处理方法
JP3334042B2 (ja) 画像処理装置およびこれを搭載した画像読取装置と画像形成装置、並びに画像処理方法、および画像処理手順を記憶したコンピュータ読み取り可能な記憶媒体
CN1333574C (zh) 一种数字图像中提取文本区域的方法
CN101247465B (zh) 图像处理方法和装置、图像形成装置
CN103379346A (zh) 一种yuv格式图像的色度信息处理方法、装置及系统
JP4105539B2 (ja) 画像処理装置およびそれを備えた画像形成装置ならびに画像処理方法、画像処理プログラムおよび記録媒体
CN106815580A (zh) 一种车牌定位方法
US7433516B2 (en) Method of extracting a textual area in a digital image
CN105657213A (zh) 图像处理装置和图像形成装置
CN101291384A (zh) 图文分离及文字增强方法
US7324704B2 (en) Method of repairing scratches in digital images

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: ZHISHEN SCIENCE & TECHNOLOGY CO. LTD.

Free format text: FORMER OWNER: DEXIN SCIENCE + TECHNOLOGY CO., LTD.

Effective date: 20061027

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20061027

Address after: Taipei City, Taiwan, China

Applicant after: Zhishen Science and Technology Co., Ltd.

Address before: Taiwan, China

Applicant before: Destiny Technology Corporation

C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20070822

Termination date: 20150929

EXPY Termination of patent right or utility model