附图说明
本发明是参照附图进行描述的,这些图面只为图解的目的而提供,在任何方面都不是对发明的限制。
图1为示出本发明的实施方式1的图像处理装置的构成的框图。
图2为示出实施方式1的图像处理装置的处理流程的流程图。
图3为示出输入的原图像的示例的示图。
图4为示出从图3的原图像生成的边缘图像的情况的示图。
图5A、5B及5C为示出将利用实施方式1的图像处理装置得到的边缘图像与利用现有的方法得到的边缘图像进行比较的示图。
图6为示出本发明的实施方式2的图像处理装置的构成的框图。
图7为示出实施方式2的图像处理装置的处理流程的流程图。
图8为示出本发明的实施方式3的图像处理装置的构成的框图。
图9为示出实施方式3的图像处理装置的处理流程的流程图。
图10A、10B及10C为示出非反转字符用的边缘图像和反转字符用的边缘图像的示例的示图。
图11为示出计算字符区域的大小的方法的示图。
图12为示出在对非反转字符的字符串和反转字符的字符串混杂的原图像合成边缘图像的情况的示图。
图13为示出本发明的实施方式4的图像处理装置的构成的框图。
图14为示出实施方式4的图像处理装置的处理流程的流程图。
图15A、15B及15C为示出实施方式4的图像处理装置的图像处理示例的示图。
符号说明:
图像输入部1;图像修正部2;色空间变换部3;边缘图像生成部4;图像输出部5;页存储器6;边缘图像合成部7;字符串区域提取部8;图像二值化部9;图像合成部10;图像处理装置100
具体实施方式
下面根据附图对本发明的实施方式进行说明。
图1为示出本发明的实施方式1的图像处理装置100的构成的框图。如同图所示,此图像处理装置100的构成包括;图像输入部1;图像修正部2;色空间变换部3;边缘图像生成部4;图像输出部5及页存储器6。
图像输入部1是输入图像信息的单元,具体言之,也可以是复印机、扫描仪、传真机、数码相机等输入设备,将预先存储于存储器件等中的图像的信息输入的单元。图像修正部2,作为用于边缘检测的前处理,进行通过滤除去掉网点等的图像修正。色空间变换部3,将修正后的图像变换为适于进行边缘处理的浓度及色彩信息。边缘图像生成部4从变换为适于边缘处理的信息的图像生成边缘图像。图像输出部5,是将生成的边缘图像输出的单元,具体言之,可以是复印机、打印机、传真机、显示器等输出设备,也可以是将边缘图像文件化输出到存储器件的单元。页存储器6是将输入的图像的信息及各处理进行中的图像的信息进行存储的存储器。
下面对本实施方式的图像处理装置100的工作予以说明。图2为示出实施方式1的图像处理装置100的处理流程的流程图。首先,利用图像输入部1,输入彩色或灰度的图像信息而存储于页存储器6(步骤S101)。接着,利用图像修正部2,对存放于页存储器6中的图像,比如,进行去掉网点等的修正处理(步骤S102)。之后,利用色空间变换部3,将该图像信息变换为适于边缘处理的浓度及色信息等信息,比如,将以RGB值表示的图像变换为浓度、彩度、色调分量、辉度分量、色度等(步骤S103)。接着,利用边缘图像生成部4,从变换为适于边缘处理的信息的图像中,对主扫描方向及副扫描方向的每一个进行边缘检测,生成边缘图像(步骤S104)。然后,利用图像输出部5,输出生成的边缘图像(步骤S105)。
下面利用图3及图4对步骤S104的边缘图像生成的步骤予以说明。
图3是输入的原图像的示例。此原图像,是由背景及在此背景上配置的比背景的浓度高的字符构成的。图4为示出从图3所示的原图像生成的由浓度构成的边缘图像的生成情况的示图,图4的(a)为图3的原图像在X轴方向上的A-B区间的浓度分布,图4的(b)为对图4的(a)的浓度分布利用下述的式(1)计算的差分处理的结果。
f′(x)=f(x)-f(x-1)......(1)
此处,f(x)是在原图像的X轴上的位置(x)处的图像单位的浓度值,f(x-1)是在原图像的位置(x)的图像单位的相邻的位置(x-1)处的图像单位的浓度值,f′(x)是在边缘图像的位置(x)处的图像单位的浓度值(差分值)。这样,从浓度分布,可求出与各个图像单位每一个相邻的图像单位的浓度的差分值。另外,所谓像素,是划分原图像的单位,比如,1像素、N×N(N是任意整数)像素的集合。
通过采取图4的(b)的差分的值的绝对值,如图4的(c)所示,检测与字符的轮廓相当的边缘。不过,由于在此状态下,在字符中存在中空,并且正好图像单位的宽度字符线段的宽度仍然是粗的,不能说是字符可读性高的边缘图像。
于是,如图(4)的(d)所示,对于差分的值为负者,将其绝对值对以1图像单位大小邻接的图像单位的差分值分别移动相加。在图4的(d)的示例中,在X轴方向上向X坐标的值变小的方向(左)将绝对值移动1图像单位量地相加。
另外,在将式(1)改变为
f′(x)=f(x)-f(x+1)......(1′)
时,也可以将差分的值变为负者的绝对值在X轴方向上向X坐标变大的方向(右)移动正好1图像单位进行相加。
在图4中,示出从原图像生成利用在一方的轴方向(X轴方向)上的浓度的边缘图像的场合,但也可对两轴方向(X轴方向和Y轴方向)进行同样的处理,将各方向的处理结果合成生成边缘图像是自不待言的。以下示出此时的计算例。
在设f(x,y)为原图像的(x,y)坐标位置的图像单位的浓度值,f′(x,y)为边缘图像的(x,y)坐标位置的图像单位的浓度值时,可由下式(2)计算出边缘图像:
f′(x,y)=fx′(x,y)+fy′(x,y)......(2)
其中,fx=f(x,y-1)-f(x-1,y-1)+f(x,y)-f(x-1,y)+f(x,y+1)-f(x-1,y+1),
但是,在f(x)≥0的场合,fx′(x,y)=fx,在fx<0的场合,fx′(x,y)=fx′(x-1,y)-fx。
另外,fy=f(x-1,y)-f(x-1,y-1)+f(x,y)-f(x,y-1)+f(x+1,y)-f(x+1,y-1),
但是,在fy≥0的场合,fy′(x,y)=fy,在fy<0的场合,fy′(x,y)=fy′(x,y-1)-fy。
图5A、5B及5C为将利用本实施方式的图像处理装置100得到的边缘图像与利用现有的方法得到的边缘图像进行比较的示图。图5A是原图像的示例,由该原图像取差分的值的绝对值所得到的边缘图像为图5B,而由本实施方式得到的边缘图像为图5C。通过比较图5B和图5C的各边缘图像可知,根据本实施方式,可以在防止边缘图像的字符的线宽变宽的同时,抑制字符中的中空而得到字符可读性高的边缘图像。
下面对本发明的实施方式2予以说明。
图6为示出实施方式2的图像处理装置200的构成的框图。如同图所示,此图像处理装置200的构成包括:图像输入部1;图像修正部2;色空间变换部3;边缘图像生成部4;图像输出部5;页存储器6以及边缘图像合成部7。在此图像处理装置200中,边缘图像生成部4,在实施方式1中,生成只是像浓度的边缘图像或色彩信息的边缘图像这样的一个边缘图像,但在此实施方式中则在浓度的边缘图像之外也同时生成色空间信息(比如,彩度、色调分量、辉度分量、色度等)的边缘图像。边缘图像合成部7,将边缘图像生成部4生成的多个边缘图像合成输出到图像输出部5。其他的模块的功能与实施方式1相同。
图7为示出此实施方式2的图像处理装置200的处理的流程图。
首先,利用图像输入部1,输入彩色或灰度的图像信息而存储于页存储器6(步骤S701)。接着,利用图像修正部2,对存放于页存储器6中的图像,比如,进行去掉网点等的修正处理(步骤S702)。之后,利用色空间变换部3,将该图像信息变换为适于边缘处理的浓度及色信息等信息,比如,将以RGB值表示的图像变换为浓度、彩度、色调分量、辉度分量、色度等(步骤S703)。接着,利用边缘图像生成部4,从变换为适于边缘处理的信息的图像中,对主扫描方向及副扫描方向的每一个,针对浓度和色彩信息的每一种,进行边缘检测,生成浓度的边缘图像和色彩信息的边缘图像(步骤S704)。此时,利用与实施方式1同样的步骤,生成浓度的边缘图像和色彩信息的边缘图像。接着,将生成的各边缘图像由边缘图像合成部7进行合成(步骤S705),作为一个合成边缘图像从图像输出部5输出(步骤S706)。
在边缘图像的合成方法中,可以考虑对各个边缘图像的图像单位的值附加与信息的属性(浓度、彩度、色调分量、辉度分量、色度等)相应的权重,求出其平均值的方法及对各个边缘图像的图像单位值附加与色彩信息的属性相应的权重,将集合成为最大值的图像单位者作为合成边缘图像的等方法。
这样,在该实施方式2的图像处理装置200中,变换部,将输入的图像的信息变换为浓度和色彩信息,图像处理部,对利用变换部得到的浓度和色彩信息的每一个生成边缘图像,将这些边缘图像合成而生成一个边缘图像。所以,根据此实施方式2的图像处理装置200,对于浓度及色彩不同的各种字符和背景的组合,可以得到字符可读性高的边缘图像。
下面对本发明的实施方式3予以说明。
图8为示出实施方式3的图像处理装置300的构成的框图。如同图所示,此图像处理装置300的构成包括:图像输入部1;图像修正部2;色空间变换部3;边缘图像生成部4;图像输出部5;页存储器6;边缘图像合成部7以及字符串区域提取部8。在此图像处理装置300中,字符串区域提取部8,从边缘图像提取字符串区域,计算出各个字符区域的大小及其平均值。另外,对边缘图像生成部4,附加从一个原图像生成非反转字符用的边缘图像及反转字符用的边缘图像的功能。边缘图像合成部7,具有根据利用字符串区域提取部8算出的字符串区域每一个的字符区域的大小的平均值,选择由边缘图像生成部4生成的非反转字符用的边缘图像及反转字符用的边缘图像中的任何一个,将这些合成而生成一个边缘图像的功能。其他的模块的功能与实施方式1相同。
图9为示出此实施方式3的图像处理装置300的处理的流程图。
首先,利用图像输入部1,输入彩色或灰度的图像信息而存储于页存储器6(步骤S901)。接着,利用图像修正部2,对存放于页存储器6中的图像,比如,进行去掉网点等的修正处理(步骤S902)。之后,利用色空间变换部3,将该图像信息变换为适于边缘处理的浓度及色信息等信息,比如,将以RGB值表示的图像变换为浓度、彩度、色调分量、辉度分量、色度等(步骤S903)。接着,利用边缘图像生成部4,从变换为适于边缘处理的信息的图像中,对主扫描方向及副扫描方向的每一个进行边缘检测,生成非反转字符用的边缘图像f′(x,y)和反转字符用的边缘图像f′inv(x,y)(步骤S904)。
反转字符用的边缘图像f′inv(x,y)可利用下式(3)算出。
f′inv(x,y)=fx′(x,y)+fy′(x,y)......(3)
其中,fx=-{f(x,y-1)-f(x-1,y-1)+f(x,y)-f(x-1,y)+f(x,y+1)-f(x-1,y+1)},
但是,在fx≥0的场合,fx′(x,y)=fx,在fx<0的场合,fx′(x,y)=fx′(x-1,y)-fx。
另外,fy=-{f(x-1,y)-f(x-1,y-1)+f(x,y)-f(x,y-1)+f(x+1,y)-f(x+1,y-1)},但是,在fy≥0的场合,fy′(x,y)=fy,在fy<0的场合,fy′(x,y)=fy′(x,y-1)-fy。
此结果,比如,对于图10A的原图像,可以得到图10B所示的非反转字符用的边缘图像f′(x,y)和图10C所示的反转字符用的边缘图像f′inv(x,y)。这样,对于反转字符的非反转字符用的边缘图像f′(x,y)成为切边形状的字符。对于非反转字符的反转字符用的边缘图像f′inv(x,y)也一样。
之后,利用字符串区域提取部8,从边缘图像f′(x,y)和边缘图像f′inv(x,y)提取字符串区域(步骤S905)。字符串区域的提取,可利用通过标示处理从边缘图像中提取连接成分,利用对连接成分的布局的分析判定连接成分连续并排列成为直线形状的区域为字符串的方法等而实现。此时,如图11所示,将各个连接部分看作是一个字符区域71、73,求出该字符区域71、73的宽度W和高度H,对各个字符串区域72、74,预先求出其中包含的字符区域71、73的宽度W和高度H的值的平均值。
比如,如图12所示,从非反转字符的字符串和反转字符的字符串混杂的原图像80中可以得到边缘图像f′(x,y)和边缘图像f′inv(x,y),可得到6个字符串区域81-86。
之后,利用边缘图像合成部7,在边缘图像f′(x,y)和边缘图像f′inv(x,y)中从对应的字符串区域中分别选择字符可读性高的一方生成一个合成边缘图像87(步骤S906)。此处,字符可读性高的字符串区域,根据每个字符串区域的上述字符区域的宽度和高度的值的平均值判定。
就是说,如图11所示,对于反转字符的非反转字符用的边缘图像f′(x,y)成为切边形状的字符,这种场合的各个字符区域71的大小比作为对于反转字符的反转字符用的边缘图像f′inv(x,y)得到的笔划形状的字符的字符区域73的大小大。一般,因为笔划形状的字符的可读性比切边形状的字符的可读性高,可以将字符区域的宽度和高度的值的平均值小的一方的字符串区域判定为可读性高的字符串区域。
此结果,在图12的示例中,字符串区域81、82、86判定为字符可读性高的字符串区域,将这些字符串区域81、82、86的边缘图像合成生成一个合成边缘图像87。最后,由图像输出部5将这样生成的合成边缘图像87输出(步骤S907)。
这样,在此实施方式3的图像处理装置300中,图像输入部,输入非反转字符的区域和反转字符的区域混杂的图像的信息,图像处理部,在生成非反转字符用的边缘图像的同时生成反转字符用的边缘图像,从生成的各边缘图像在每个字符串的区域选择一方的边缘图像,将这些合成而生成一个边缘图像。特别是,图像处理部,从生成的各边缘图像中,选择在每个字符串的区域中包含的字符区域的大小的平均值小的一方的边缘图像。
所以,根据此实施方式3的图像处理装置300,从非反转字符和反转字符混杂的文档图像可以得到字符可读性高的边缘图像。
下面对本发明的实施方式4予以说明。
图13为示出实施方式4的图像处理装置400的构成的框图。如同图所示,此图像处理装置400的构成包括:图像输入部1;图像修正部2;色空间变换部3;边缘图像生成部4;图像输出部5;页存储器6;字符串区域提取部8;图像二值化部9以及图像合成部10。在此图像处理装置400中,字符串区域提取部8,从边缘图像提取字符串区域,计算出各个字符区域的大小及其平均值。图像二值化部9,对利用图像输入部1输入的原图像进行二值化处理。图像合成部10,将利用边缘图像生成部4生成的边缘图像和利用图像二值化部9生成的二值图像进行合成。其他的模块的功能与图1所示的实施方式1相同。图14为示出实施方式4的图像处理装置400的处理的流程图。首先,利用图像输入部1,输入彩色或灰度的图像信息并存储于页存储器6(步骤S1401)。接着,利用图像修正部2,对存放于页存储器6中的图像,比如,进行去掉网点等的修正处理(步骤S1402)。之后,利用色空间变换部3,将该图像信息变换为适于边缘处理的浓度及色信息等信息,比如,将以RGB值表示的图像变换为浓度、彩度、色调分量、辉度分量、色度等(步骤S1403)。接着,利用边缘图像生成部4,从变换为适于边缘处理的信息的图像中,对主扫描方向及副扫描方向的每一个进行边缘检测,生成边缘图像(步骤S1404)。此时,利用与实施方式1相同的步骤生成边缘图像。
之后,利用字符串区域提取部8,从边缘图像提取字符串区域,对每个字符串区域,求出包含于其中的字符区域的宽度和高度的值的平均值(步骤S1405)。接着,图像合成部10,以阈值为基准对从边缘图像中提取的字符串区域的字符区域的宽度和高度的值的平均值进行评价(步骤S1406)。利用此评价,在判定不存在字符区域的宽度和高度的值的平均值大于等于阈值的字符串区域的场合(步骤S1406的“否”),将在步骤S1404中生成的边缘图像从图像输出部5输出(步骤S1407)。
在判定存在字符区域的宽度和高度的值的平均值大于等于阈值的字符串区域的场合(步骤S1406的“是”),利用图像二值化部9,对该字符区域的宽度和高度的值的平均值大于等于阈值的字符串区域进行原图像的二值化处理(步骤S1408)。二值化处理,优选是对该字符串区域的原图像取直方图等将基底部分与字符部分适当分离。另外,在本来的图像的字符是反转字符的场合,以使字符部分变黑的方式将使基底部分和字符部分的二值化处理的结果的值反转的结果作为最终的二值化图像输出。
图像合成部10,在由图像二值化部9取得二值化图像时,采用此二值化图像代替相同的字符串区域的边缘图像,将其与其他字符串区域的边缘图像或二值化图像合成而生成一个合成边缘图像(步骤S1409)。最后,将这样生成的合成边缘图像从图像输出部5输出(步骤S1407)。
图15A、15B及15C示出以上的图像处理具体示例。图15A是原图像,图15B是由原图像生成的边缘图像,使包含在图像的一个字符串区域91中的字符区域的大小的平均值大于等于阈值,使包含于其他的字符串区域92、93、94的字符区域的大小的平均值在阈值以下。在本实施方式中,因为在边缘图像的生成中只移动一图像单位的量地相加,所以在得到防止中空的效果的字符大小上有限制,在字符的大小超过此限制的场合,结果就成为具有中空的切边形状。于是,对于字符区域的大小的平均值大于等于阈值的字符串区域91,采用二值化图像代替边缘图像,合成其与其他字符串区域92、93、94的边缘图像,成为图15C所示的一个输出图像。
这样,在此实施方式4的图像处理装置400中,图像处理部,在生成的边缘图像中,在判定是字符区域的大小的平均值大于等于阈值的字符串的区域时,生成针对此字符串区域的原图像的二值化图像,以该二值化图像代替同字符串区域的边缘图像,与其他字符串区域的图像进行合成。
由此,在原图像中,即使是在字符的大小不同的字符串区域混杂存在的场合,也可以得到没有中空的可读性高的字符的图像。
如上所述,根据本发明的各实施方式的图像处理装置及图像处理方法,可以从彩色文档或灰度文档等得到字符可读性优异的边缘图像。
另外,本发明并不限定于上述的图示示例,在不脱离本发明的精神范围内,可以得到种种改变是自不待言的。
比如,在上述各实施方式中,在边缘检测中使用的是差分滤波器,但也可以使用二阶微分滤波器(拉普拉斯滤波器)。