CN1306447C - 影像图文分离方法 - Google Patents

影像图文分离方法 Download PDF

Info

Publication number
CN1306447C
CN1306447C CNB2004100064052A CN200410006405A CN1306447C CN 1306447 C CN1306447 C CN 1306447C CN B2004100064052 A CNB2004100064052 A CN B2004100064052A CN 200410006405 A CN200410006405 A CN 200410006405A CN 1306447 C CN1306447 C CN 1306447C
Authority
CN
China
Prior art keywords
pure color
pixels
threshold value
document image
pixel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB2004100064052A
Other languages
English (en)
Other versions
CN1661622A (zh
Inventor
毛清龙
姚舜晏
李福文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Primax Electronics Ltd
Original Assignee
Primax Electronics Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Primax Electronics Ltd filed Critical Primax Electronics Ltd
Priority to CNB2004100064052A priority Critical patent/CN1306447C/zh
Publication of CN1661622A publication Critical patent/CN1661622A/zh
Application granted granted Critical
Publication of CN1306447C publication Critical patent/CN1306447C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Abstract

本发明涉及一种影像图文分离(Photo/Text Separation)方法,利用每一种纯色(Source Color)在色谱中所具有的特定亮度与彩度范围,并且将文件影像依照色彩模式转换成为多个纯色色板后(Source Color Plane),对各个纯色色板执行亮度或彩度运算程序,借以辨别文件影像中所具有的图文类型。

Description

影像图文分离方法
技术领域
本发明涉及一种有关于影像处理的方法,忧其涉及一种应用于图文分离上,利用亮度或彩度分离出文件影像中图文类型的方法。
背景技术
随着数字化时代的来临,文件影像分析技术已被广泛的应用于数字化相关影像处理与应用,例如:车牌的辨识、指纹辨识、军事卫星照片的影像辨识、扫描机、打印机、文字辨识软件以及数字资料的储存。文件影像分析技术的好坏、正确与否其结果都会影响系统后续的处理或者决定是否能够达到,节省下更多的时间与空间的目的,甚至牵动整个系统的处理能力。所以任何功能类似的文件影像分析技术,莫不将寻找一种既能正确而又能迅速辨识文件影像的方法,用以大大提高文件影像分析系统的实用性。
目前文件影像的分析技术的发展大多着重于文字分离技术,因为有关于文字色彩的设定,使用者大多选择以纯色或灰阶的方式显示,因此文字资料所使用的色彩较为单纯,所以有关于文字分离技术的研究,发展的较早也较为完整。而今,文件影像分析技术的研究仍然着重在:利用区域性的灰阶统计特性,与明显的对象具有灰阶能量集中的特性,分析文件影像。例如,辨识黑白文件影像中的文字资料;利用去除每个文字本身多余的讯息,找出其具有代表性的稳定参数,以供文件影像辨识之用。例如,消除黑白文件影像中的文字边缘噪声以增加辨识率;自动地辨识中英文混合的文件影像。例如,在中英混合的文件影像中自动分离出使用者需要的中文文字资料,或者是英文文字资料,而不需要使用者一一圈选,甚至是着重于处理歪斜文字的歪斜校正辨识、加速辨认速度以及提高辨识率,都是现今文件影像分析技术的发展重点。
由于数字化信息的发达,现在文件影像中通常包含纯色或混色的文字与图形资料,而如上所述的现有文件影像的辨识技术,都着重于处理灰阶的文字资料的文件影像分析技术,因此,倘若文件影像具有纯色或混色的文字与图形资料,但是所提供的辨识技术却只能处理灰阶的文字资料,实际上对于后续的处理程序并没有很显著的帮助,举例来说:使用彩色打印机打印具有纯色文字资料与混色图形资料的文件影像,现有的文件影像分析技术的处理方式,因为对于纯色文字资料(例如:黑色)的边缘的辨识度并不是非常敏锐,因此会将纯色文字资料辨识为混色图形资料,因此,当打印纯色文字资料时,必须利用CMY三种颜色的墨水去打印,不仅浪费了彩色的墨水,而且也因为必须处理三种颜色的墨水的混合,而使得打印的速度变慢,此外,打印出来的文字的效果是由彩色墨水混合出来接近于纯色而非纯色,因此打印出来的文件影像会产生颜色上的失真,而上述的失真对于部分以颜色表示数据的研究资料是完全不被允许的。
根据以上所述,由于现有利用灰阶能量集中的特性处理文件影像的方式,对于具有纯色与混色资料的辨识能力并不是非常敏锐,因此现有技术不适合应用在处理具有纯色与混色资料的文件影像之中。
因此,若能提供一种能够分离纯色与混色资料的图文分离方法,不仅能够节省处理的时间,在彩色打印机的应用上更减少彩色墨水的浪费。
发明内容
本发明所要解决的技术问题在于提供一种影像图文分离方法,可用以辨别文件影像中所具有的图文类型,克服现有技术中处理具有纯色与混色资料的文件影像所存在的问题。
为了实现上述目的,本发明提供了一种影像图文分离方法,包含有下列步骤:首先,转换一文件影像成为多个纯色色板;接着,设立纯色像素连续门槛值(Consecutive Point Threshold,Tc),并对各个纯色色板执行亮度运算程序;最后根据密度门槛值(Connected Length Density Threshold,Td)与亮度运算程序的结果,设定文件影像的图文类型。
本发明提供的一种影像图文分离方法,该方法包含下列步骤:
转换一文件影像成为多个纯色色板;
设定一纯色像素连续门槛值,并对各该纯色色板执行一亮度运算程序;及
根据一密度门槛值与该亮度运算程序的结果,依序指定该文件影像中的图文类型;
其中,该亮度运算程序还包含下列步骤:
划分各该纯色色板成为多个像素区块;
执行该像素区块中多个像素点的亮度落点运算;
根据该纯色像素连续门槛值与纯色像素点连续产生的数目间的差值,逐一设定该像素点的一状态值;及
累加该像素区块中该像素点的该状态值。
上述的影像图文分离方法,其中该文件影像可选自YCC、YUV、YIQ、HIS及HSV的色彩模式群组中的任一组色彩模式群组。
上述的影像图文分离方法,其中该状态值是在该像素点属于纯色像素,且,纯色像素点连续产生的数目不小于该纯色像素连续门槛值时,取得一积分。
上述的影像图文分离方法,其中根据该密度门槛值与该亮度运算程序的结果,指定该文件影像中的图文类型的步骤还包含:当该状态值的累加不小于该密度门槛值时,指定该文件影像中的该像素区块为文字类型的资料。
上述的影像图文分离方法,其中根据该密度门槛值与该亮度运算程序的结果,指定该文件影像中的图文类型的步骤还包含,当该状态值的累加小于该密度门槛值时,指定该文件影像中的该像素区块为图形类型的资料。
本发明还提供另一种影像图文分离方法,其该方法包含下列步骤:
转换一文件影像成为多个纯色色板;
设定一纯色像素连续门槛值,并对各该纯色色板执行一彩度运算程序;及
根据一密度门槛值与该彩度运算程序的结果,依序指定该文件影像中的图文类型;
其中,该彩度运算程序还包含下列步骤:
划分各该纯色色板成为多个像素区块;
执行该像素区块中多个像素点的彩度落点运算;
根据该纯色像素连续门槛值与纯色像素点连续产生的数目间的差值,逐一设定该像素点的一状态值;及
累加该像素区块中该像素点的该状态值。
上述的影像图文分离方法,其中该文件影像可选自RGB与CMYK的色彩模式群组中的任一组色彩模式群组。
上述的影像图文分离方法,其中该状态值是在该像素点属于纯色像素,且,纯色像素点连续产生的数目不小于该纯色像素连续门槛值时,取得一积分。
上述的影像图文分离方法,其中根据该密度门槛值与该彩度运算程序的结果,指定该文件影像中的图文类型的步骤还包含,当该状态值的累加不小于该密度门槛值时,指定该文件影像中的该像素区块为文字资料。
上述的影像图文分离方法,其中根据该密度门槛值与该彩度运算程序的结果,指定该文件影像中的图文类型的步骤还包含,当该状态值的累加小于该密度门槛值时,指定该文件影像中的该像素区块为图形资料。
本发明方法主要的技术特征是利用每一种纯色在色谱中都具有特定的亮度与彩度范围(Specified Color and Intensity Range),用以个别地分离出文件影像中图文类型。
以下结合附图和具体实施例对本发明进行详细描述,但不作为对本发明的限定。
附图说明
图1为本发明的影像图文分离方法的第一实施例的主要流程图;
图2为本发明的影像图文分离方法中第一实施例所提的亮度运算程序的流程图;
图3为本发明的影像图文分离方法的第二实施例的主要流程图;及
图4为本发明的影像图文分离方法中第二实施例所提的彩度运算程序的流程图。
具体实施方式
本发明的影像图文分离方法,是利用每一种纯色在色谱中所具有的特定亮度与彩度范围,再将文件影像依照色彩模式,转换成为个别的纯色色板后,对各个纯色色板执行亮度或彩度运算程序,借以辨别文件影像中所具有的图文类型。
请参阅图1,该图为本发明的影像图文分离方法的第一实施例的主要流程图。其所包含的流程步骤,说明如下:
首先,步骤100,将文件影像转换成为可使影像亮度与颜色信息分离的纯色色板,其中,可使影像亮度与颜色信息分离的色彩记录模式为YCC、YUV、YIQ、HIS或HSV……等等,而所转换的纯色色板相应的成为Y.Cr.Cv、Y.U.V、Y.I.Q、H.I.S或H.S.V,第一实施例所提的文件影像将举出以YCC色彩模式记录的文件影像并转换成为Y.Cr.Cv的纯色色板为例子。
接着,步骤200,设立纯色像素连续门槛值(Consecutive Point Threshold,Tc)以便接续于各个纯色色板执行亮度运算程序,其中纯色像素连续门槛值(Tc),是用以确认文件影像中纯色像素连续产生的数目,因此纯色像素连续门槛值(Tc)设定值的大小,与所判断出的纯色像素的精确度成正比。
最后,步骤300,根据密度门槛值(Connected Length Density Threshold,Td)与亮度运算程序的结果,依序的设定文件影像的图文类型。当各纯色色板中的各像素区块(pixel section)在亮度运算程序最后产生的结果不小于密度门槛值(Td)时该像素区块被视为纯色资料;相反地,当最后产生的结果小于密度门槛值(Td)时则该像素区块被视为图形资料。又因为一般的使用者大多将文字色彩设定为以纯色方式显示,图形色彩设定以混色的方式显示,因此,本发明将具有纯色资料的像素区块视为文字类型的资料,同样地也将具有混色资料的像素区块视为图形类型的资料,以达到影像图文分离的目的。
请参阅图2,为本发明的影像图文分离方法中第一实施例所提的亮度运算程序的流程图。其所包含的流程步骤,说明如下
首先,步骤210,划分各纯色色板成为多个像素区块(n×n Window),每一个像素区块都由多个水平行(X1至Xn行)与多个垂直列(Y1至Yn列)所组成的,举例来说:将Y.Cr.Cv纯色色板中Y色板、Cr色板以及Cv色板个别的划分为多个像素区块(n×n Window),其中,每一个像素区块都具有n行的水平行(X1至Xn行)与n列的垂直列(Y1至Yn列)。
然后,步骤220,在各水平行与垂直列交合处((X1,Y1)……(Xn,Yn-1)……(Xn,Yn))执行落点运算,落点运算会先依序在各垂直列与水平列的交合处取一像素点并确认其亮度,然后再根据各纯色色板中所具有的纯色区域范围的不同,个别地确认出亮度落在纯色区域范围的纯色像素点,举例来说:Y.Cr.Cv纯色色板中Y代表明暗程度-灰度讯号,Cr为红绿色差,Cv为黄蓝色差,因此Y纯色色板中的纯色区域范围可辨识出黑与白的纯色像素点、Cr纯色色板的纯色区域范围可辨识出红与绿的纯色像素点以及Cv纯色色板的纯色区域范围可辨识出黄与蓝纯色像素点。
接着,步骤230,依序确认各纯色像素点产生时,其后面接续产生的像素点是否也为纯色像素点。若为是,则再确认纯色像素点连续产生的数目不小于预设的纯色像素连续门槛值(Tc)即产生相应的状态值(取得一积分),并继续对该像素区块中未被确认的纯色像素点执行上述程序;若为不是,则将该纯色像素点视为混色像素点(未取得积分)。
最后,步骤240,当像素区块的全部状态值的加总(总积分)不小于预设的密度门槛值(Td)时,即将该像素区块视为纯色资料。
如上所述,当每一像素区块都完成其状态值的加总与密度门槛值(Td)的差额比较后,即可得到各纯色色板中,具有纯色资料与混色资料的像素区块的范围,当像素区块被确认为纯色资料时,相同的该像素区块也被视为文字类型的资料;当像素区块被确认为混色资料时,相同的像素区块也被视为图形类型的资料,因此便可得知文件影像中的图文类型的分布状况。
如上所述,本发明还可运用于彩色打印机中,当全部的状态值的加总与密度门槛值(Td)的差额比较完成后,将各纯色色板再重新组合并根据各纯色色板所代表的纯色区域范围,确认文件影像上全部的纯色资料的像素区块与实际的颜色,举例来说:当Y、Cr、Cv色板中的Y色板中的纯色资料像素区块,当使用者执行打印程序时,即会针对纯色资料的像素区块执行单色(纯色)打印,因此,不仅可节省彩色墨水的的浪费;并减少执行不必要的混色打印所造成时间的浪费;还可确实的让使用者得到所需的颜色并免颜色的失真。
请参阅图3与图4,为本发明的影像图文分离方法中的第二实施例的主要流程图与彩度运算程序的流程图。其与第一实施例主要的差异在于:利用每一种纯色在色谱中都具有其特定的彩度范围,因此第二实施例,利用彩度做为纯色像素点的辨识标准,因此第二实施例,将可应用于以颜色信息做为色彩记录模式的文件影像,例如:由RGB与CMYK色彩模式所记录的文件影像,而其转换的纯色色板也相应的成为R.G.B与C.M.Y.K色板。而其主要的方法步骤与第一实施例相同,在此不再赘述。
当然,本发明还可有其它多种实施例,在不背离本发明精神及其实质的情况下,熟悉本领域的技术人员当可根据本发明作出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。

Claims (10)

1、一种影像图文分离方法,其特征在于,该方法包含下列步骤:
转换一文件影像成为多个纯色色板;
设定一纯色像素连续门槛值,并对各该纯色色板执行一亮度运算程序;及
根据一密度门槛值与该亮度运算程序的结果,依序指定该文件影像中的图文类型;
其中,该亮度运算程序还包含下列步骤:
划分各该纯色色板成为多个像素区块;
执行该像素区块中多个像素点的亮度落点运算;
根据该纯色像素连续门槛值与纯色像素点连续产生的数目间的差值,逐一设定该像素点的一状态值;及
累加该像素区块中该像素点的该状态值。
2、根据权利要求1所述的影像图文分离方法,其特征在于,该文件影像可选自YCC、YUV、YIQ、HIS及HSV的色彩模式群组中的任一组色彩模式群组。
3、根据权利要求1所述的影像图文分离方法,其特征在于,该状态值是在该像素点属于纯色像素,且,纯色像素点连续产生的数目不小于该纯色像素连续门槛值时,取得一积分。
4、根据权利要求1所述的影像图文分离方法,其特征在于,根据该密度门槛值与该亮度运算程序的结果,指定该文件影像中的图文类型的步骤还包含:当该状态值的累加不小于该密度门槛值时,指定该文件影像中的该像素区块为文字类型的资料。
5、根据权利要求1所述的影像图文分离方法,其特征在于,根据该密度门槛值与该亮度运算程序的结果,指定该文件影像中的图文类型的步骤还包含,当该状态值的累加小于该密度门槛值时,指定该文件影像中的该像素区块为图形类型的资料。
6、一种影像图文分离方法,其特征在于,该方法包含下列步骤:
转换一文件影像成为多个纯色色板;
设定一纯色像素连续门槛值,并对各该纯色色板执行一彩度运算程序;及
根据一密度门槛值与该彩度运算程序的结果,依序指定该文件影像中的图文类型;
其中,该彩度运算程序还包含下列步骤:
划分各该纯色色板成为多个像素区块;
执行该像素区块中多个像素点的彩度落点运算;
根据该纯色像素连续门槛值与纯色像素点连续产生的数目间的差值,逐一设定该像素点的一状态值;及
累加该像素区块中该像素点的该状态值。
7、根据权利要求6所述的影像图文分离方法,其特征在于,该文件影像可选自RGB与CMYK的色彩模式群组中的任一组色彩模式群组。
8、根据权利要求6所述的影像图文分离方法,其特征在于,该状态值是在该像素点属于纯色像素,且,纯色像素点连续产生的数目不小于该纯色像素连续门槛值时,取得一积分。
9、根据权利要求6所述的影像图文分离方法,其特征在于,根据该密度门槛值与该彩度运算程序的结果,指定该文件影像中的图文类型的步骤还包含,当该状态值的累加不小于该密度门槛值时,指定该文件影像中的该像素区块为文字资料。
10、根据权利要求6所述的影像图文分离方法,其特征在于,根据该密度门槛值与该彩度运算程序的结果,指定该文件影像中的图文类型的步骤还包含,当该状态值的累加小于该密度门槛值时,指定该文件影像中的该像素区块为图形资料。
CNB2004100064052A 2004-02-27 2004-02-27 影像图文分离方法 Expired - Fee Related CN1306447C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB2004100064052A CN1306447C (zh) 2004-02-27 2004-02-27 影像图文分离方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2004100064052A CN1306447C (zh) 2004-02-27 2004-02-27 影像图文分离方法

Publications (2)

Publication Number Publication Date
CN1661622A CN1661622A (zh) 2005-08-31
CN1306447C true CN1306447C (zh) 2007-03-21

Family

ID=35010927

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2004100064052A Expired - Fee Related CN1306447C (zh) 2004-02-27 2004-02-27 影像图文分离方法

Country Status (1)

Country Link
CN (1) CN1306447C (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102005029B (zh) * 2009-09-01 2013-03-06 致伸科技股份有限公司 图像处理方法及装置
CN101916327B (zh) * 2010-07-09 2011-11-09 北京商纳科技有限公司 一种生成错题本的方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0922442A (ja) * 1995-07-04 1997-01-21 Advantest Corp イメージ・ドキュメント資料の電子管理システム
CN1261190A (zh) * 1999-01-19 2000-07-26 株式会社理光 从彩色图像数据抽取文字方法、装置及记录媒体
US6289122B1 (en) * 1999-04-15 2001-09-11 Electronics For Imaging, Inc. Intelligent detection of text on a page
JP2002015323A (ja) * 2000-04-26 2002-01-18 Fujitsu Ltd 文書画像レイアウト識別方法および装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0922442A (ja) * 1995-07-04 1997-01-21 Advantest Corp イメージ・ドキュメント資料の電子管理システム
CN1261190A (zh) * 1999-01-19 2000-07-26 株式会社理光 从彩色图像数据抽取文字方法、装置及记录媒体
US6289122B1 (en) * 1999-04-15 2001-09-11 Electronics For Imaging, Inc. Intelligent detection of text on a page
JP2002015323A (ja) * 2000-04-26 2002-01-18 Fujitsu Ltd 文書画像レイアウト識別方法および装置

Also Published As

Publication number Publication date
CN1661622A (zh) 2005-08-31

Similar Documents

Publication Publication Date Title
CN1617567A (zh) 彩色图像压缩方法和装置
CN1767579A (zh) 图像处理装置和方法
CN102318330A (zh) 用于处理数字图像的图像处理系统和处理数字图像的图像处理方法
US20060209125A1 (en) Color image processing apparatus
US7295341B2 (en) System for processing monochrome and full-color digital image data
US20100182659A1 (en) Application driven spot color optimizer for reprographics
CN102263882A (zh) 图像处理设备和图像处理方法
US6125200A (en) Removing non-text information from a color image
CN101166225A (zh) 图像处理装置和图像处理方法
CN1599412A (zh) 处理彩色图像数据的方法
CN1306447C (zh) 影像图文分离方法
CN1640677A (zh) 彩色打印方法
US6744918B1 (en) Document analysis method to detect BW/color areas and corresponding scanning device
CN1317673C (zh) 利用神经网络分辨影像中文字与图形的系统及其方法
US9374502B2 (en) Method for converting a full colour image to a monochrome image
CN101309341B (zh) 成像设备及其控制方法
CN101620668A (zh) 近单色文字特征撷取的影像辨识处理系统及其方法
US6480622B1 (en) Image processing method for eliminating color shifts generated in contour region in image obtained from image input apparatus
CN1439935A (zh) 成像方法
CN1755708A (zh) 一种数字图像中提取文本区域的方法
RU2368007C1 (ru) Способ сегментации текста по цветовому признаку в процессе копирования
CN1640676A (zh) 彩色打印方法
CN110674336A (zh) 一种识别、检索影像文件的系统
JP4189679B2 (ja) 印刷制御装置、印刷制御方法および印刷制御プログラム
CN1581926A (zh) 自动检测图文的半色调处理方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: ZHISHEN SCIENCE & TECHNOLOGY CO. LTD.

Free format text: FORMER OWNER: DEXIN SCIENCE + TECHNOLOGY CO., LTD.

Effective date: 20061027

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20061027

Address after: Taipei City, Taiwan, China

Applicant after: Zhishen Science and Technology Co., Ltd.

Address before: Taipei city of Taiwan Province

Applicant before: Destiny Technology Corporation

C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20070321

Termination date: 20160227