CN100379255C - 图像处理装置及图像处理方法 - Google Patents

图像处理装置及图像处理方法 Download PDF

Info

Publication number
CN100379255C
CN100379255C CNB2005100510490A CN200510051049A CN100379255C CN 100379255 C CN100379255 C CN 100379255C CN B2005100510490 A CNB2005100510490 A CN B2005100510490A CN 200510051049 A CN200510051049 A CN 200510051049A CN 100379255 C CN100379255 C CN 100379255C
Authority
CN
China
Prior art keywords
image
character
edge
zone
mentioned
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CNB2005100510490A
Other languages
English (en)
Other versions
CN1678016A (zh
Inventor
土桥外志正
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Digital Solutions Corp
Original Assignee
Toshiba Corp
Toshiba Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Solutions Corp filed Critical Toshiba Corp
Publication of CN1678016A publication Critical patent/CN1678016A/zh
Application granted granted Critical
Publication of CN100379255C publication Critical patent/CN100379255C/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/12Digital output to print unit, e.g. line printer, chain printer
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/12Edge-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/162Quantising the image signal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • G06T2207/10008Still image; Photographic image from scanner, fax or copier
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30176Document
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • General Engineering & Computer Science (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Character Input (AREA)

Abstract

本发明提供图像处理装置及图像处理方法。从变换为适于边缘处理的浓度及色信息的图像的信息中,对每个确定的图像单位,求出与在确定的方向上邻接的其他图像单位之间的差分的值,并且对求出的负的差分值,将该差分的绝对值与上述邻接的其他图像单位的差分的值移动相加而生成边缘图像。

Description

图像处理装置及图像处理方法
技术领域
本发明涉及由彩色文档及灰度文档等构成字符的边缘图像的图像处理装置及图像处理方法。
背景技术
关于以彩色文档及灰度文档等为对象的字符识别技术,为得到将文档中的字符的轮廓从背景中分离的图像使用称为边缘检测的方法。此边缘检测,是检测在邻接的像素之间的浓度及色彩等的值的变化(差分值)的方法(比如,参照特开2001-175808号公报(段落0010等))。由此,比如,可以从字符的浓度比背景的浓度高的图像等得到与字符的轮廓相对应的边缘图像等。
然而,只在原样不变使用邻接像素间的浓度及色彩等的值的差分的绝对值形成的边缘图像中,存在变成沿着字符的轮廓线的部分浓,其内侧淡的所谓的中空形状,或字符的线宽变粗的倾向,存在字符接触,难以获得字符可读性高的图像的问题。
发明内容
根据本发明的一种方式的图像处理装置包括:输入图像信息的输入部;将利用输入部输入的图像的信息变换为适于边缘检测的信息的变换部;以及根据通过变换部得到的图像的信息,计算在确定方向上邻接的图像单位间的差分的值,在计算的差分的值为负时,将该差分的绝对值相加于与之对应的图像单位的差分的值而生成边缘图像的图像处理部。
根据本发明的一种方式,图像处理方法是将输入的图像的信息变换为适于边缘检测的信息;根据该变换后的图像信息,计算在确定的方向上与邻接的其他图像单位之间的差分的值,在计算出的差分值为负时,将该差分的绝对值相加于与之对应的图像单位的差分的值而生成边缘图像。
附图说明
本发明是参照附图进行描述的,这些图面只为图解的目的而提供,在任何方面都不是对发明的限制。
图1为示出本发明的实施方式1的图像处理装置的构成的框图。
图2为示出实施方式1的图像处理装置的处理流程的流程图。
图3为示出输入的原图像的示例的示图。
图4为示出从图3的原图像生成的边缘图像的情况的示图。
图5A、5B及5C为示出将利用实施方式1的图像处理装置得到的边缘图像与利用现有的方法得到的边缘图像进行比较的示图。
图6为示出本发明的实施方式2的图像处理装置的构成的框图。
图7为示出实施方式2的图像处理装置的处理流程的流程图。
图8为示出本发明的实施方式3的图像处理装置的构成的框图。
图9为示出实施方式3的图像处理装置的处理流程的流程图。
图10A、10B及10C为示出非反转字符用的边缘图像和反转字符用的边缘图像的示例的示图。
图11为示出计算字符区域的大小的方法的示图。
图12为示出在对非反转字符的字符串和反转字符的字符串混杂的原图像合成边缘图像的情况的示图。
图13为示出本发明的实施方式4的图像处理装置的构成的框图。
图14为示出实施方式4的图像处理装置的处理流程的流程图。
图15A、15B及15C为示出实施方式4的图像处理装置的图像处理示例的示图。
符号说明:
图像输入部1;图像修正部2;色空间变换部3;边缘图像生成部4;图像输出部5;页存储器6;边缘图像合成部7;字符串区域提取部8;图像二值化部9;图像合成部10;图像处理装置100
具体实施方式
下面根据附图对本发明的实施方式进行说明。
图1为示出本发明的实施方式1的图像处理装置100的构成的框图。如同图所示,此图像处理装置100的构成包括;图像输入部1;图像修正部2;色空间变换部3;边缘图像生成部4;图像输出部5及页存储器6。
图像输入部1是输入图像信息的单元,具体言之,也可以是复印机、扫描仪、传真机、数码相机等输入设备,将预先存储于存储器件等中的图像的信息输入的单元。图像修正部2,作为用于边缘检测的前处理,进行通过滤除去掉网点等的图像修正。色空间变换部3,将修正后的图像变换为适于进行边缘处理的浓度及色彩信息。边缘图像生成部4从变换为适于边缘处理的信息的图像生成边缘图像。图像输出部5,是将生成的边缘图像输出的单元,具体言之,可以是复印机、打印机、传真机、显示器等输出设备,也可以是将边缘图像文件化输出到存储器件的单元。页存储器6是将输入的图像的信息及各处理进行中的图像的信息进行存储的存储器。
下面对本实施方式的图像处理装置100的工作予以说明。图2为示出实施方式1的图像处理装置100的处理流程的流程图。首先,利用图像输入部1,输入彩色或灰度的图像信息而存储于页存储器6(步骤S101)。接着,利用图像修正部2,对存放于页存储器6中的图像,比如,进行去掉网点等的修正处理(步骤S102)。之后,利用色空间变换部3,将该图像信息变换为适于边缘处理的浓度及色信息等信息,比如,将以RGB值表示的图像变换为浓度、彩度、色调分量、辉度分量、色度等(步骤S103)。接着,利用边缘图像生成部4,从变换为适于边缘处理的信息的图像中,对主扫描方向及副扫描方向的每一个进行边缘检测,生成边缘图像(步骤S104)。然后,利用图像输出部5,输出生成的边缘图像(步骤S105)。
下面利用图3及图4对步骤S104的边缘图像生成的步骤予以说明。
图3是输入的原图像的示例。此原图像,是由背景及在此背景上配置的比背景的浓度高的字符构成的。图4为示出从图3所示的原图像生成的由浓度构成的边缘图像的生成情况的示图,图4的(a)为图3的原图像在X轴方向上的A-B区间的浓度分布,图4的(b)为对图4的(a)的浓度分布利用下述的式(1)计算的差分处理的结果。
f′(x)=f(x)-f(x-1)......(1)
此处,f(x)是在原图像的X轴上的位置(x)处的图像单位的浓度值,f(x-1)是在原图像的位置(x)的图像单位的相邻的位置(x-1)处的图像单位的浓度值,f′(x)是在边缘图像的位置(x)处的图像单位的浓度值(差分值)。这样,从浓度分布,可求出与各个图像单位每一个相邻的图像单位的浓度的差分值。另外,所谓像素,是划分原图像的单位,比如,1像素、N×N(N是任意整数)像素的集合。
通过采取图4的(b)的差分的值的绝对值,如图4的(c)所示,检测与字符的轮廓相当的边缘。不过,由于在此状态下,在字符中存在中空,并且正好图像单位的宽度字符线段的宽度仍然是粗的,不能说是字符可读性高的边缘图像。
于是,如图(4)的(d)所示,对于差分的值为负者,将其绝对值对以1图像单位大小邻接的图像单位的差分值分别移动相加。在图4的(d)的示例中,在X轴方向上向X坐标的值变小的方向(左)将绝对值移动1图像单位量地相加。
另外,在将式(1)改变为
f′(x)=f(x)-f(x+1)......(1′)
时,也可以将差分的值变为负者的绝对值在X轴方向上向X坐标变大的方向(右)移动正好1图像单位进行相加。
在图4中,示出从原图像生成利用在一方的轴方向(X轴方向)上的浓度的边缘图像的场合,但也可对两轴方向(X轴方向和Y轴方向)进行同样的处理,将各方向的处理结果合成生成边缘图像是自不待言的。以下示出此时的计算例。
在设f(x,y)为原图像的(x,y)坐标位置的图像单位的浓度值,f′(x,y)为边缘图像的(x,y)坐标位置的图像单位的浓度值时,可由下式(2)计算出边缘图像:
f′(x,y)=fx′(x,y)+fy′(x,y)......(2)
其中,fx=f(x,y-1)-f(x-1,y-1)+f(x,y)-f(x-1,y)+f(x,y+1)-f(x-1,y+1),
但是,在f(x)≥0的场合,fx′(x,y)=fx,在fx<0的场合,fx′(x,y)=fx′(x-1,y)-fx。
另外,fy=f(x-1,y)-f(x-1,y-1)+f(x,y)-f(x,y-1)+f(x+1,y)-f(x+1,y-1),
但是,在fy≥0的场合,fy′(x,y)=fy,在fy<0的场合,fy′(x,y)=fy′(x,y-1)-fy。
图5A、5B及5C为将利用本实施方式的图像处理装置100得到的边缘图像与利用现有的方法得到的边缘图像进行比较的示图。图5A是原图像的示例,由该原图像取差分的值的绝对值所得到的边缘图像为图5B,而由本实施方式得到的边缘图像为图5C。通过比较图5B和图5C的各边缘图像可知,根据本实施方式,可以在防止边缘图像的字符的线宽变宽的同时,抑制字符中的中空而得到字符可读性高的边缘图像。
下面对本发明的实施方式2予以说明。
图6为示出实施方式2的图像处理装置200的构成的框图。如同图所示,此图像处理装置200的构成包括:图像输入部1;图像修正部2;色空间变换部3;边缘图像生成部4;图像输出部5;页存储器6以及边缘图像合成部7。在此图像处理装置200中,边缘图像生成部4,在实施方式1中,生成只是像浓度的边缘图像或色彩信息的边缘图像这样的一个边缘图像,但在此实施方式中则在浓度的边缘图像之外也同时生成色空间信息(比如,彩度、色调分量、辉度分量、色度等)的边缘图像。边缘图像合成部7,将边缘图像生成部4生成的多个边缘图像合成输出到图像输出部5。其他的模块的功能与实施方式1相同。
图7为示出此实施方式2的图像处理装置200的处理的流程图。
首先,利用图像输入部1,输入彩色或灰度的图像信息而存储于页存储器6(步骤S701)。接着,利用图像修正部2,对存放于页存储器6中的图像,比如,进行去掉网点等的修正处理(步骤S702)。之后,利用色空间变换部3,将该图像信息变换为适于边缘处理的浓度及色信息等信息,比如,将以RGB值表示的图像变换为浓度、彩度、色调分量、辉度分量、色度等(步骤S703)。接着,利用边缘图像生成部4,从变换为适于边缘处理的信息的图像中,对主扫描方向及副扫描方向的每一个,针对浓度和色彩信息的每一种,进行边缘检测,生成浓度的边缘图像和色彩信息的边缘图像(步骤S704)。此时,利用与实施方式1同样的步骤,生成浓度的边缘图像和色彩信息的边缘图像。接着,将生成的各边缘图像由边缘图像合成部7进行合成(步骤S705),作为一个合成边缘图像从图像输出部5输出(步骤S706)。
在边缘图像的合成方法中,可以考虑对各个边缘图像的图像单位的值附加与信息的属性(浓度、彩度、色调分量、辉度分量、色度等)相应的权重,求出其平均值的方法及对各个边缘图像的图像单位值附加与色彩信息的属性相应的权重,将集合成为最大值的图像单位者作为合成边缘图像的等方法。
这样,在该实施方式2的图像处理装置200中,变换部,将输入的图像的信息变换为浓度和色彩信息,图像处理部,对利用变换部得到的浓度和色彩信息的每一个生成边缘图像,将这些边缘图像合成而生成一个边缘图像。所以,根据此实施方式2的图像处理装置200,对于浓度及色彩不同的各种字符和背景的组合,可以得到字符可读性高的边缘图像。
下面对本发明的实施方式3予以说明。
图8为示出实施方式3的图像处理装置300的构成的框图。如同图所示,此图像处理装置300的构成包括:图像输入部1;图像修正部2;色空间变换部3;边缘图像生成部4;图像输出部5;页存储器6;边缘图像合成部7以及字符串区域提取部8。在此图像处理装置300中,字符串区域提取部8,从边缘图像提取字符串区域,计算出各个字符区域的大小及其平均值。另外,对边缘图像生成部4,附加从一个原图像生成非反转字符用的边缘图像及反转字符用的边缘图像的功能。边缘图像合成部7,具有根据利用字符串区域提取部8算出的字符串区域每一个的字符区域的大小的平均值,选择由边缘图像生成部4生成的非反转字符用的边缘图像及反转字符用的边缘图像中的任何一个,将这些合成而生成一个边缘图像的功能。其他的模块的功能与实施方式1相同。
图9为示出此实施方式3的图像处理装置300的处理的流程图。
首先,利用图像输入部1,输入彩色或灰度的图像信息而存储于页存储器6(步骤S901)。接着,利用图像修正部2,对存放于页存储器6中的图像,比如,进行去掉网点等的修正处理(步骤S902)。之后,利用色空间变换部3,将该图像信息变换为适于边缘处理的浓度及色信息等信息,比如,将以RGB值表示的图像变换为浓度、彩度、色调分量、辉度分量、色度等(步骤S903)。接着,利用边缘图像生成部4,从变换为适于边缘处理的信息的图像中,对主扫描方向及副扫描方向的每一个进行边缘检测,生成非反转字符用的边缘图像f′(x,y)和反转字符用的边缘图像f′inv(x,y)(步骤S904)。
反转字符用的边缘图像f′inv(x,y)可利用下式(3)算出。
f′inv(x,y)=fx′(x,y)+fy′(x,y)......(3)
其中,fx=-{f(x,y-1)-f(x-1,y-1)+f(x,y)-f(x-1,y)+f(x,y+1)-f(x-1,y+1)},
但是,在fx≥0的场合,fx′(x,y)=fx,在fx<0的场合,fx′(x,y)=fx′(x-1,y)-fx。
另外,fy=-{f(x-1,y)-f(x-1,y-1)+f(x,y)-f(x,y-1)+f(x+1,y)-f(x+1,y-1)},但是,在fy≥0的场合,fy′(x,y)=fy,在fy<0的场合,fy′(x,y)=fy′(x,y-1)-fy。
此结果,比如,对于图10A的原图像,可以得到图10B所示的非反转字符用的边缘图像f′(x,y)和图10C所示的反转字符用的边缘图像f′inv(x,y)。这样,对于反转字符的非反转字符用的边缘图像f′(x,y)成为切边形状的字符。对于非反转字符的反转字符用的边缘图像f′inv(x,y)也一样。
之后,利用字符串区域提取部8,从边缘图像f′(x,y)和边缘图像f′inv(x,y)提取字符串区域(步骤S905)。字符串区域的提取,可利用通过标示处理从边缘图像中提取连接成分,利用对连接成分的布局的分析判定连接成分连续并排列成为直线形状的区域为字符串的方法等而实现。此时,如图11所示,将各个连接部分看作是一个字符区域71、73,求出该字符区域71、73的宽度W和高度H,对各个字符串区域72、74,预先求出其中包含的字符区域71、73的宽度W和高度H的值的平均值。
比如,如图12所示,从非反转字符的字符串和反转字符的字符串混杂的原图像80中可以得到边缘图像f′(x,y)和边缘图像f′inv(x,y),可得到6个字符串区域81-86。
之后,利用边缘图像合成部7,在边缘图像f′(x,y)和边缘图像f′inv(x,y)中从对应的字符串区域中分别选择字符可读性高的一方生成一个合成边缘图像87(步骤S906)。此处,字符可读性高的字符串区域,根据每个字符串区域的上述字符区域的宽度和高度的值的平均值判定。
就是说,如图11所示,对于反转字符的非反转字符用的边缘图像f′(x,y)成为切边形状的字符,这种场合的各个字符区域71的大小比作为对于反转字符的反转字符用的边缘图像f′inv(x,y)得到的笔划形状的字符的字符区域73的大小大。一般,因为笔划形状的字符的可读性比切边形状的字符的可读性高,可以将字符区域的宽度和高度的值的平均值小的一方的字符串区域判定为可读性高的字符串区域。
此结果,在图12的示例中,字符串区域81、82、86判定为字符可读性高的字符串区域,将这些字符串区域81、82、86的边缘图像合成生成一个合成边缘图像87。最后,由图像输出部5将这样生成的合成边缘图像87输出(步骤S907)。
这样,在此实施方式3的图像处理装置300中,图像输入部,输入非反转字符的区域和反转字符的区域混杂的图像的信息,图像处理部,在生成非反转字符用的边缘图像的同时生成反转字符用的边缘图像,从生成的各边缘图像在每个字符串的区域选择一方的边缘图像,将这些合成而生成一个边缘图像。特别是,图像处理部,从生成的各边缘图像中,选择在每个字符串的区域中包含的字符区域的大小的平均值小的一方的边缘图像。
所以,根据此实施方式3的图像处理装置300,从非反转字符和反转字符混杂的文档图像可以得到字符可读性高的边缘图像。
下面对本发明的实施方式4予以说明。
图13为示出实施方式4的图像处理装置400的构成的框图。如同图所示,此图像处理装置400的构成包括:图像输入部1;图像修正部2;色空间变换部3;边缘图像生成部4;图像输出部5;页存储器6;字符串区域提取部8;图像二值化部9以及图像合成部10。在此图像处理装置400中,字符串区域提取部8,从边缘图像提取字符串区域,计算出各个字符区域的大小及其平均值。图像二值化部9,对利用图像输入部1输入的原图像进行二值化处理。图像合成部10,将利用边缘图像生成部4生成的边缘图像和利用图像二值化部9生成的二值图像进行合成。其他的模块的功能与图1所示的实施方式1相同。图14为示出实施方式4的图像处理装置400的处理的流程图。首先,利用图像输入部1,输入彩色或灰度的图像信息并存储于页存储器6(步骤S1401)。接着,利用图像修正部2,对存放于页存储器6中的图像,比如,进行去掉网点等的修正处理(步骤S1402)。之后,利用色空间变换部3,将该图像信息变换为适于边缘处理的浓度及色信息等信息,比如,将以RGB值表示的图像变换为浓度、彩度、色调分量、辉度分量、色度等(步骤S1403)。接着,利用边缘图像生成部4,从变换为适于边缘处理的信息的图像中,对主扫描方向及副扫描方向的每一个进行边缘检测,生成边缘图像(步骤S1404)。此时,利用与实施方式1相同的步骤生成边缘图像。
之后,利用字符串区域提取部8,从边缘图像提取字符串区域,对每个字符串区域,求出包含于其中的字符区域的宽度和高度的值的平均值(步骤S1405)。接着,图像合成部10,以阈值为基准对从边缘图像中提取的字符串区域的字符区域的宽度和高度的值的平均值进行评价(步骤S1406)。利用此评价,在判定不存在字符区域的宽度和高度的值的平均值大于等于阈值的字符串区域的场合(步骤S1406的“否”),将在步骤S1404中生成的边缘图像从图像输出部5输出(步骤S1407)。
在判定存在字符区域的宽度和高度的值的平均值大于等于阈值的字符串区域的场合(步骤S1406的“是”),利用图像二值化部9,对该字符区域的宽度和高度的值的平均值大于等于阈值的字符串区域进行原图像的二值化处理(步骤S1408)。二值化处理,优选是对该字符串区域的原图像取直方图等将基底部分与字符部分适当分离。另外,在本来的图像的字符是反转字符的场合,以使字符部分变黑的方式将使基底部分和字符部分的二值化处理的结果的值反转的结果作为最终的二值化图像输出。
图像合成部10,在由图像二值化部9取得二值化图像时,采用此二值化图像代替相同的字符串区域的边缘图像,将其与其他字符串区域的边缘图像或二值化图像合成而生成一个合成边缘图像(步骤S1409)。最后,将这样生成的合成边缘图像从图像输出部5输出(步骤S1407)。
图15A、15B及15C示出以上的图像处理具体示例。图15A是原图像,图15B是由原图像生成的边缘图像,使包含在图像的一个字符串区域91中的字符区域的大小的平均值大于等于阈值,使包含于其他的字符串区域92、93、94的字符区域的大小的平均值在阈值以下。在本实施方式中,因为在边缘图像的生成中只移动一图像单位的量地相加,所以在得到防止中空的效果的字符大小上有限制,在字符的大小超过此限制的场合,结果就成为具有中空的切边形状。于是,对于字符区域的大小的平均值大于等于阈值的字符串区域91,采用二值化图像代替边缘图像,合成其与其他字符串区域92、93、94的边缘图像,成为图15C所示的一个输出图像。
这样,在此实施方式4的图像处理装置400中,图像处理部,在生成的边缘图像中,在判定是字符区域的大小的平均值大于等于阈值的字符串的区域时,生成针对此字符串区域的原图像的二值化图像,以该二值化图像代替同字符串区域的边缘图像,与其他字符串区域的图像进行合成。
由此,在原图像中,即使是在字符的大小不同的字符串区域混杂存在的场合,也可以得到没有中空的可读性高的字符的图像。
如上所述,根据本发明的各实施方式的图像处理装置及图像处理方法,可以从彩色文档或灰度文档等得到字符可读性优异的边缘图像。
另外,本发明并不限定于上述的图示示例,在不脱离本发明的精神范围内,可以得到种种改变是自不待言的。
比如,在上述各实施方式中,在边缘检测中使用的是差分滤波器,但也可以使用二阶微分滤波器(拉普拉斯滤波器)。

Claims (8)

1.一种图像处理装置,其特征在于具备:
输入图像的信息的输入部;
将利用上述输入部输入的图像的信息变换为适于边缘检测的信息的变换部;以及
根据通过上述变换部得到的图像的信息,对于每个确定的图像单位,计算与在确定的方向上邻接的其它图像单位之间的差分的值而生成边缘图像的图像处理部,
上述图像处理部,在计算出的上述差分的值为负时,使该差分的绝对值移动相加于上述在确定的方向上邻接的其它的图像单位的差分的值,
上述输入部,输入混有非反转字符的区域和反转字符的区域的图像的信息;
上述图像处理部,在生成非反转字符用的边缘图像的同时,生成反转字符用的边缘图像,从生成的上述各边缘图像在每个字符串的区域选择一方的边缘图像,将这些合成而生成一个边缘图像。
2.如权利要求1所述的图像处理装置,其特征在于:
上述变换部,将上述输入的图像的信息变换为浓度和色彩信息;
上述图像处理部,对利用上述变换部得到的浓度和色彩信息的每一种生成边缘图像,合成这些边缘图像而生成一个边缘图像。
3.如权利要求1所述的图像处理装置,其特征在于:
上述图像处理部,从生成的上述各边缘图像中,选择在上述每个字符串的区域中其所包含的字符区域的大小的平均值小的一方的边缘图像。
4.如权利要求1所述的图像处理装置,其特征在于:
上述图像处理部,在生成的边缘图像中,判定字符区域的大小的平均值是大于等于阈值的字符串的区域,生成相对此字符串区域的原图像的二值化图像,以该二值化图像代替相同字符串区域的边缘图像,与其他字符串区域的图像进行合成。
5.一种图像处理方法,
将输入的图像的信息变换为适于边缘检测的信息;根据该变换后的图像的信息,对于每个确定的图像单位,计算与在确定的方向上邻接的其它图像单位间的差分的值,在计算出的差分的值为负时,将该差分的绝对值移动相加于上述在确定的方向上邻接的其它的图像单位的差分的值而生成边缘图像,其特征在于:
输入混有非反转字符的区域和反转字符的区域的图像的信息;
由该输入的图像的信息,在生成上述非反转字符用的边缘图像的同时,生成反转字符用的边缘图像,从生成的上述各边缘图像在每个字符串的区域选择一方的边缘图像,将这些合成而生成一个边缘图像。
6.如权利要求5所述的图像处理方法,其特征在于:
将上述输入的图像的信息变换为浓度和色彩信息;
对上述变换后的浓度和色彩信息的每一种生成边缘图像,合成这些边缘图像而生成一个边缘图像。
7.如权利要求5所述的图像处理方法,其特征在于:
从生成的上述各边缘图像中,选择在上述每个字符串的区域中其所包含的字符区域的大小的平均值小的一方的边缘图像。
8.如权利要求5所述的图像处理方法,其特征在于:
在生成的边缘图像中,判定字符区域的大小的平均值是大于等于阈值的字符串的区域,生成相对此字符串区域的原图像的二值化图像,以该二值化图像代替相同字符串区域的边缘图像,与其他字符串区域的图像进行合成。
CNB2005100510490A 2004-03-30 2005-02-25 图像处理装置及图像处理方法 Active CN100379255C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP101431/2004 2004-03-30
JP2004101431A JP3990375B2 (ja) 2004-03-30 2004-03-30 画像処理装置および画像処理方法

Publications (2)

Publication Number Publication Date
CN1678016A CN1678016A (zh) 2005-10-05
CN100379255C true CN100379255C (zh) 2008-04-02

Family

ID=35050304

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2005100510490A Active CN100379255C (zh) 2004-03-30 2005-02-25 图像处理装置及图像处理方法

Country Status (5)

Country Link
US (1) US7359568B2 (zh)
JP (1) JP3990375B2 (zh)
KR (1) KR100704389B1 (zh)
CN (1) CN100379255C (zh)
TW (1) TWI256597B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102956029A (zh) * 2011-08-18 2013-03-06 株式会社Pfu 图像处理装置以及图像处理方法

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4807618B2 (ja) * 2006-03-06 2011-11-02 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
JP4818091B2 (ja) * 2006-12-13 2011-11-16 キヤノン株式会社 情報処理装置、画像処理装置、情報処理装置の制御方法及び画像処理装置の制御方法
US8428387B2 (en) * 2007-03-06 2013-04-23 Shimadzu Corporation Edge evaluation method, edge detection method, image correction method, and image processing system
CN101436248B (zh) * 2007-11-14 2012-10-24 佳能株式会社 用于根据图像生成文本字符串的方法和设备
JP2010056672A (ja) * 2008-08-26 2010-03-11 Oki Data Corp 画像処理装置
JP5718920B2 (ja) * 2010-07-29 2015-05-13 本田技研工業株式会社 車両周辺監視装置
JP2013050762A (ja) * 2011-08-30 2013-03-14 Mega Chips Corp 線分および円弧検出装置
WO2013031418A1 (ja) * 2011-08-30 2013-03-07 株式会社メガチップス 線分および円弧検出装置
JP6049000B2 (ja) * 2011-09-21 2016-12-21 株式会社メガチップス 線分および円弧検出装置
CN103177709B (zh) * 2011-12-20 2015-03-11 北大方正集团有限公司 字符显示方法和装置
JP5547226B2 (ja) 2012-03-16 2014-07-09 株式会社東芝 画像処理装置、及び画像処理方法
CN103577816A (zh) * 2012-07-24 2014-02-12 夏普株式会社 图像处理装置和图像处理方法
CN105009198B (zh) * 2013-02-28 2017-05-17 株式会社东芝 显示处理装置以及显示处理方法
CN104217202B (zh) * 2013-06-03 2019-01-01 支付宝(中国)网络技术有限公司 信息识别方法、设备和系统
JP2015176252A (ja) * 2014-03-13 2015-10-05 オムロン株式会社 画像処理装置および画像処理方法
CN105225221B (zh) * 2014-07-02 2018-02-06 中国科学院广州生物医药与健康研究院 图像边缘检测方法及系统
DE102015100927A1 (de) * 2015-01-22 2016-07-28 MAQUET GmbH Assistenzeinrichtung und Verfahren zur bildgebenden Unterstützung eines Operateurs während eines chirurgischen Eingriffs unter Verwendung mindestens eines medizinischen Instrumentes
US9684844B1 (en) * 2016-07-15 2017-06-20 StradVision, Inc. Method and apparatus for normalizing character included in an image
CN106446908A (zh) * 2016-08-31 2017-02-22 乐视控股(北京)有限公司 图像中目标检测方法及装置
US10909406B2 (en) * 2018-01-08 2021-02-02 Newgen Software Technologies Limited Image processing system and method
CN111768410B (zh) * 2019-05-22 2024-04-05 北京沃东天骏信息技术有限公司 图像处理方法和装置
EP3939009A1 (en) * 2019-05-31 2022-01-19 Apple Inc. Method and device for generating a resultant image based on colors extracted from an input image
JP7341758B2 (ja) * 2019-07-08 2023-09-11 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1198653A (zh) * 1997-05-06 1998-11-11 华通电脑股份有限公司 化学蚀刻形成盲孔的多层电路板制法
CN1258058A (zh) * 1998-12-14 2000-06-28 佳能株式会社 图像处理方法和装置,图像处理系统以及存储介质
CN1394322A (zh) * 2000-10-25 2003-01-29 索尼株式会社 图像处理设备
CN1449543A (zh) * 2000-09-14 2003-10-15 夏普公司 图像处理装置、图像处理方法和记录该方法的记录介质

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3092024B2 (ja) * 1991-12-09 2000-09-25 松下電器産業株式会社 画像処理方法
US6041145A (en) * 1995-11-02 2000-03-21 Matsushita Electric Industrial Co., Ltd. Device and method for smoothing picture signal, device and method for encoding picture and device and method for decoding picture
JP3832520B2 (ja) * 1996-08-19 2006-10-11 富士ゼロックス株式会社 画像形成装置および画像処理装置
JPH11308438A (ja) 1998-04-20 1999-11-05 Ricoh Co Ltd 画像処理装置
JP3680922B2 (ja) * 1999-07-14 2005-08-10 シャープ株式会社 画像処理装置
JP4146047B2 (ja) 1999-09-28 2008-09-03 株式会社東芝 画像の傾き検知方法及び文書画像処理装置
JP3890840B2 (ja) 1999-12-22 2007-03-07 富士通株式会社 画像処理装置、画像処理方法、及び画像処理プログラムを記録した、コンピュータ読み取り可能な記録媒体
JP4085584B2 (ja) * 2001-02-28 2008-05-14 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置および画像形成装置
US8999632B2 (en) 2012-10-04 2015-04-07 Vertex Pharmaceuticals Incorporated Method for measuring ATR inhibition mediated increases in DNA damage

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1198653A (zh) * 1997-05-06 1998-11-11 华通电脑股份有限公司 化学蚀刻形成盲孔的多层电路板制法
CN1258058A (zh) * 1998-12-14 2000-06-28 佳能株式会社 图像处理方法和装置,图像处理系统以及存储介质
CN1449543A (zh) * 2000-09-14 2003-10-15 夏普公司 图像处理装置、图像处理方法和记录该方法的记录介质
CN1394322A (zh) * 2000-10-25 2003-01-29 索尼株式会社 图像处理设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102956029A (zh) * 2011-08-18 2013-03-06 株式会社Pfu 图像处理装置以及图像处理方法
CN102956029B (zh) * 2011-08-18 2016-02-17 株式会社Pfu 图像处理装置以及图像处理方法

Also Published As

Publication number Publication date
CN1678016A (zh) 2005-10-05
JP2005285006A (ja) 2005-10-13
KR100704389B1 (ko) 2007-04-05
US20050219581A1 (en) 2005-10-06
JP3990375B2 (ja) 2007-10-10
KR20060042142A (ko) 2006-05-12
TWI256597B (en) 2006-06-11
TW200539063A (en) 2005-12-01
US7359568B2 (en) 2008-04-15

Similar Documents

Publication Publication Date Title
CN100379255C (zh) 图像处理装置及图像处理方法
CN101588445B (zh) 一种基于深度的视频感兴趣区域提取方法
JP4469873B2 (ja) 画像文書の検索装置、プログラム、及び記録媒体
JP5934174B2 (ja) 印刷文書を認証するための方法及びプログラム
CN104811684B (zh) 一种图像的三维美颜方法及装置
KR20120068470A (ko) 스테레오 영상 정합 장치 및 그 방법
CN111563908B (zh) 一种图像处理方法及相关装置
CN110348263A (zh) 一种基于图像识别的二维随机码图像识别与提取方法
CN109961399A (zh) 基于图像距离变换的最佳缝合线搜寻方法
CN108377374A (zh) 用于产生与图像相关的深度信息的方法和系统
CN107644391B (zh) 一种用于打印文档溯源的数字水印处理方法及装置
CN109983753A (zh) 图像处理装置、图像处理方法和程序
CN112699885A (zh) 一种基于对抗生成网络gan的语义分割训练数据增广方法和系统
JP2000181992A (ja) カラー文書画像認識装置
JP2006031165A (ja) 画像照合装置、画像照合方法および画像照合プログラム。
CN113487473B (zh) 一种添加图像水印的方法、装置、电子设备及存储介质
JP3860540B2 (ja) エントロピーフィルタ及び該フィルタを用いた領域抽出法
JP6643301B2 (ja) 欠陥検査装置及び欠陥検査方法
JP7160211B2 (ja) 機械学習モデル、生成装置、コンピュータプログラム
CN114782239A (zh) 一种基于卷积神经网络的数字水印添加方法及系统
JP6055952B1 (ja) 画像検査装置、画像検査方法、およびプログラム
JP2005078482A (ja) 対象物進行方向検出方法
CN104867149B (zh) 基于局部平面线性点的翻拍图像鉴别方法
US11640535B2 (en) Probability acquisition apparatus and probability acquisition method
Fukuda et al. Optical integrity of diminished reality using deep learning

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: TOSHIBA SOLVING PLAN CO., LTD.; APPLICANT

Free format text: FORMER OWNER: TOSHIBA SOLVING PLAN CO., LTD.

Effective date: 20070622

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20070622

Address after: Tokyo, Japan, Japan

Applicant after: Toshiba Solutions Corporation

Co-applicant after: Toshiba Corporation

Address before: Tokyo, Japan, Japan

Applicant before: Toshiba Solutions Corporation

C14 Grant of patent or utility model
GR01 Patent grant