CN1099068C - 字体识别装置和方法 - Google Patents
字体识别装置和方法 Download PDFInfo
- Publication number
- CN1099068C CN1099068C CN98103134A CN98103134A CN1099068C CN 1099068 C CN1099068 C CN 1099068C CN 98103134 A CN98103134 A CN 98103134A CN 98103134 A CN98103134 A CN 98103134A CN 1099068 C CN1099068 C CN 1099068C
- Authority
- CN
- China
- Prior art keywords
- stroke
- change
- rate
- literal
- thickness
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Character Discrimination (AREA)
- Character Input (AREA)
Abstract
本发明公开即使对含有斜笔划和杂划等的文字图像也能容易且正确识别该文字字体的字体识别装置、字体识别方向和信息存储媒体,其中备有抽出文字笔划粗细的笔划粗细抽出部、笔划粗细变化率抽出部和识别部(比较识别部),笔划粗细变化率抽出部从该笔划粗细抽出部抽出的文字笔划粗细中求其变化率。识别部根据笔划粗细变化率抽出部12求得的笔划粗细的变化率,识别文字的字体。
Description
技术领域
本发明涉及进行文字书写体(铅字或字体)识别的字体识别装置、字体识别方法以及储存其程序的信息存储媒体。
背景技术
现有技术中,例如日本特开平6-208649号公报揭示了字体识别技术。该字体识别技术,推断文字的纵方向和横方向的笔划宽度,通过这些笔划宽度的比较,识别字体是宋体(明朝体)还是黑体。更具体地说,该字体识别技术,根据文字图像的水平方向和垂直方向的运笔宽度频率(ランレングスヒストグラム)模式(最频值),推断横方向和纵方向的笔划宽度,将这些宽度作比较,识别文字的书写体是宋体还是黑体。
但是,上述现有的字体识别技术中,只有对例如“中”、“田”等那样笔划多是水平或垂直直线的文字,并且,在图像中没有杂乱笔划(ノイズ)时,才能良好地识别字体。
在日本、中国、台湾等使用的汉字中,例如,像“宋”、“知”等字,构成文字的笔划中,多存在着斜笔划。这样,当文字中存在着斜笔划时,现有的字体识别技术(例如上述特开平6-208649号公报记载的技术)中,会出现运笔宽度频率的峰值(最频值)错误,不能抽出正确的线宽,从而在实用化方面存在问题。
尤其是当各笔划宽度均匀且各笔划宽度都是细的细黑体时,不容易与其它字体区别开。
发明内容
本发明的目的是提供字体识别装置和字体识别方法以及信息存储媒体,用本发明的装置和方法,即使对于含有斜笔划和杂乱笔划(ノイズ)的文字图像,也能容易且正确地识别其字体。
为了实现上述目的,本发明采取以下技术方案:
本发明记载的字体识别装置,其特征在于,备有:
抽出文字笔划粗细的笔划粗细抽出部11、
从该笔划抽出部11抽出的文字笔划的粗细求其变化率的笔划粗细变化率抽出部12、
根据该笔划粗细变化率抽出部12求出的笔划粗细变化率,识别上述文字字体的识别部(比较识别部)13。
所记载的字体识别装置,在权利要求1记载的字体识别装置中,其特征在于,上述笔划粗细抽出部11,抽出构成文字的各笔划的粗细;上述笔划粗细变化率抽出部12,把由上述笔划粗细抽出部11抽出的各笔划粗细的变化率平均值,作为文字的笔划粗细变化率抽出。
所记载的字体识别装置,是在所述的字体识别装置中,其特征在于,上述笔划粗细抽出部11,只抽出构成文字的各笔划中的特定方向笔划的粗细;上述笔划粗细变化率抽出部12,从上述笔划粗细抽出部11抽出的特定方向笔划的粗细求其变化率,将特定方向笔划的粗细变化率的平均值,作为文字笔划粗细的变化率抽出。
所记载的字体识别装置,其特征在于,上述识别部13,将文字笔划粗细的变化率与预定的阈值进行比较,识别该文字的字体。
所记载的字体识别装置,其特征在于,上述阈值是预定文件图像所包含的全部文字的笔划粗细变化率的平均值乘以预定常数而决定的,这时,上述识别部,将包含在文件图像中的各文字的笔划粗细变化率与阈值进行比较,分别识别各文字的字体。
所记载的字体识别装置,其特征在于,上述的特定方向是斜方向。
所记载的字体识别装置,其特征在于,上述文字是以汉字为主体的印刷活字。
所记载的字体识别装置,其特征在于,上述字体识别装置,根据从①一文字单位切出的文字、②行单位或列单位切出的行列、以及③文字的一部分(部分单位)切出的部首中选择的文字信息被切取的文字图像,由经编程的计算机识别文字的字体。
所记载的字体识别方法,用经编程的计算机识别文字字体,其特征在于备有以下步骤:
抽出文字笔划粗细的粗细抽出步骤、
从该粗细抽出步骤抽出的文字笔划粗细中,抽出其笔划粗细变化率的变化率抽出步骤、
根据该变化率抽出步骤抽出的笔划粗细变化率,识别该文字字体的字体识别步骤。
所记载的字体识别方法,其特征在于,
上述粗细抽出步骤包含抽出构成文字的各笔划的粗细、同时从该粗细抽出步骤抽出的各笔划的粗细中,求其粗细变化率并作为文字笔划粗细变化率抽出的变化率抽出步骤。
所记载的字体识别方法,其特征在于,上述笔划粗细抽出步骤包含从构成文字的各笔划中只抽出特定方向笔划的粗细的特定方向粗细抽出步骤;包含从由该特定方向粗细步骤抽出的特定方向的各笔划粗细中,求其粗细变化率并作为文字特定方向笔划粗细的变化率抽出的变化率抽出步骤。
所记载的字体识别方法,其特征在于,上述变化率抽出步骤将变化率作为平均值抽出。
所记载的字体识别方法,其特征在于,上述字体识别步骤,把由上述变化率抽出步骤抽出的笔划粗细的变化率与预定的阈值进行比较,识别文字的字体。
所记载的字体识别方法,其特征在于,包含阈值设定步骤,该阈值设定步骤从上述变化率抽出步骤抽出的笔划粗细变化率求全部文字的笔划变化率的平均值,在所求得的平均值上乘以预定常数,设定阈值;上述识别步骤,把由上述变化率抽出步骤抽出的笔划粗细变化率与由上述阈值设定步骤设定的阈值进行比较,识别文字的字体。
所记载的字体识别方法,其特征在于,上述的预定常数,是预先设定的或者是以后设定的。
所记载的字体识别方法,其特征在于,上述的特定方向是斜方向。
所记载的字体识别方法,其特征在于,根据上述文字是以汉字为主体的印刷活字。
所记载的字体识别方法,其特征在于,上述字体识别方法,根据从①一文字单位切出的文字、②行单位或列单位切出的行列、以及③文字的一部分(部分单位)切出的部首中选择出的文字信息被切取的文字图像,用经编程的计算机识别文字的字体。
这里,本发明中的一个笔划,是指从某一个端点到与其相连的端点,当途中有包含交点的分支点时,是指从端点到该交点。另外,一个笔划也可以是从分支点(包含交点)到分支点。
宋体、教科书体等的印刷活字,多数是起源于使用毛笔的笔力、笔压等而使笔划粗细有变化。例如,如图12(a)所示,用宋体表现的“宋”这一印刷活字,笔划La,依着笔顺越到前端La1越细。而笔划Lb,依着笔顺越到前端Lb1越粗。另外,该文字中,如圆圈c内所示,存在着称为“棱”的三角形力点。这样,这些字体例如与粗细一样的黑体(见图12(b))相比,其特征是与笔划长度方向直交的粗细不同(变化率)。另外,该特征在汉字等的印刷活字中,在斜方向(特定方向)尤为显著。
根据所记载的发明,文字笔划的粗细由笔划粗细抽出部抽出,该笔划粗细抽出部抽出的文字笔划的粗细,由笔划粗细变化率抽出部将其笔划粗细的变化差异作为变化率求出。接着,识别部根据该笔划粗细变化率抽出部求出的笔划粗细变化率,识别文字的字体,所以,起源于使用毛笔而产生的粗细变化,作为笔划粗细的变化率表现。
这样,可容易且正确并高精度地识别文字图像的文字的字体。
根据所记载的发明,是在所记载的字体识别装置中,构成文字的各笔划的粗细由上述笔划粗细抽出部抽出,并且,笔划粗细抽出部所抽出的各笔划的粗细变化率平均值,由上述笔划粗细变化率抽出部作为文字的笔划粗细变化率抽出。
根据所记载的发明,是在所记载的字体识别装置中,从构成文字的各笔划中,只抽出特定方向笔划的粗细,从该抽出的特定方向笔划的粗细中,求其变化率,将特定方向笔划的粗细的变化率平均值,作为文字笔划的粗细变化率抽出。如果选择斜方向作为该特定方向,则可以掌握汉字等印刷活字的特征。尤其是,对于过去难以识别的细黑体,也能以高精度正确地识别。
本发明的效果:
如上所述,根据本发明,在文字图像中,抽出文字的笔划粗细变化率,根据抽出的文字笔划粗细变化率,识别该文字的字体,所以,可容易且正确并高精度地识别文字图像的文字字体。特别是对过去难以识别的细黑体也能高精度且正确地识别。
附图说明下面,参照附图说明本发明的实施例。
图1是表示本发明字体识别装置构造的图。
图2是表示一个文字图像例的图。
图3是表示图1中的字体识别部构造的图。
图4是表示对图2所示文字实施细线化处理结果的骨架图像的图。
图5是在图2、图4所示文字图像例中,表示一个笔划L1的粗细Dk和该笔划L1的粗细变化率(即微分值)Wk的图。
图6是表示图1所示字体识别装置的硬件构造的图。
图7是说明图1所示字体识别装置的处理动作的流程图。
图8是说明图1所示字体识别装置的处理动作的流程图。
图9是说明图1所示字体识别装置的处理动作的流程图。
图10是说明图1所示字体识别装置的处理动作的流程图。
图11是字体混杂的文字图像中,笔划粗细的变化率和该粗细笔划出现频度的相关图。
图12是说明汉字特征的图。
具体实施方式
图1是表示本发明字体识别装置构造的图。如图1所示,该字体识别装置备有:将文件例如作为2值图像读入的图像输入部1、存储图像部1所读入文件图像等的存储器2、从文件图像中抽出文字图像的文字切出处理部3、对文字切出处理部3切出的文字图像进行其字体识别的字体识别部4、进行全体控制的控制部5、输出字体识别部4的字体识别结果的结果输出部6。
文字切出处理部3,从文件图像中将文字图像ARi(下标i是特定文字图像的序号,以下简称为文字序号)切出为矩形状。即,在图2例中,从一个文件图像中,由下标i特定的文字图像(文字)ARi作为外接矩形区域被切出。该文字具有笔划L1、L2…(Lj)。这里,本实施例中的一个笔划L,是指从一个端点到含有交点的分支点,如果无分支点(包含交点)时,则是指从端点到端点。另外,下标j是特定各笔划L的序号,以下简称为笔划序号。
图3是表示图1中的字体识别部4构造的图。图3例中,字体识别部4备有笔划粗细抽出部11、笔划粗细变化率抽出部12和比较识别部13。笔划粗细抽出部11在文字图像AR中,抽出文字笔划的粗细。笔划粗细变化率抽出部12从笔划粗细抽出部11抽出的文字笔划的粗细求其变化率。比较识别部13将笔划粗细变化率抽出部12求得的笔划粗细变化率与预定的阈值比较,进行字体的识别。
这里,作为第1抽出例,笔划粗细抽出部11抽出构成文字的全部笔划的粗细,并且,笔划粗细变化率抽出部12对全部的笔划,求出由笔划粗细抽出部11抽出的笔划粗细的变化率,将全部笔划的粗细变化率的平均值,最终作为该文字笔划粗细的变化率抽出。
另外,第2抽出例,不象第1抽出例那样抽出全部的笔划,而是仅抽出特定的、例如斜方向的笔划。即,作为第2抽出例,笔划粗细抽出部11从构成文字的全部笔划中,仅抽出特定方向笔划的粗细,并且,笔划粗细变化率抽出部12对特定方向的笔划,求出由笔划粗细抽出部11抽出的笔划的粗细变化率,将特定方向笔划的粗细变化率平均值,最终作为该文字笔划的粗细变化率抽出。
下面,参照图2和图4,说明笔划粗细抽出部11的抽出例。图2中的斜线部分是文字部分,通过对图2的文字图像ARi实施细线化处理,如图4所示,形成轮廓(骨架)图像。在该图4中,斜线部分表示骨架像素Tk。这里,下标k是特定像素的序号,以下简称为像素序号。
图4中,对于一个像素Tk的向量rk,可以将其作为两骨架像素Tk-2、Tk+2连接线的方向求出,该两骨架像素Tk-2、Tk+2相对于像素Tk前后分开。
从图4的骨架画像ARi抽出构成文字的一个笔划的粗细时,先从一个端点(例如像素T1)到另一个端点或分支点(例如像素Tn)追踪骨架,把从该追踪结果得到的从一个端点(像素T1)到下一个分支点Tn的部分,判断为一个笔划L1的骨架L1′,分别对构成该笔划L1的骨架L1′的各像素(即各点)T1、…、Tn求出微小的向量r1、…、rn。
在与该笔划L1的骨架L1′对应的细线化前的文字图像笔划(图2中L1所示的笔划)中的某一点(构成骨架L1′的像素Tk)中,可将与该向量rk约垂直方向的Vk的宽度,作为对于该点(像素Tk)的笔划粗细Dk抽出。
根据数字图像的常用方法,例如,对向量rk进行8方向的量子化处理,可以将与某像素Tk的向量rk垂直方向的Vk的宽度,作为对该像素Tk的笔划粗细Dk的近似值抽出。
图2、图4的例中,由一个笔划L1的下标k特定的一个点(像素Tk)中的粗细Dk,作为“2.8”抽出,由下标k′特定的另一个点Tk′中的粗细Dk′的近似值,作为“5”抽出。这样,在该笔划L1的各点T1、…、Tn中,可以如上述那样地抽出笔划的粗细D1、…、Dn。
这时,笔划粗细变化率抽出部12,根据在上述笔划的各点中抽出的笔划Dk的粗细,例如如下述地求其变化率。
即,一个笔划L1的各点Tk(k=1~n)的粗细,作Dk(k=1~n)抽出时,该笔划的粗细Dk的变化率Wk,例如可用下式I求出。
Wk=(Dk-Dk-1)/Dk-1 式I
即,该例中,笔划粗细的变化率Wk,作为对于笔划粗细的微分值求出。
该笔划粗细Dk的变化率Wk,也可以不是式1所示那样的相对于各点Tk的笔划粗细Dk的相对值,而是以像素为单位表现的绝对值。该值例如由下式(式I′)表示。
Wk=(Dk+1-Dk-1)/2 (k=4~n-3) 式I′
该式I′中,为了提高字体识别正确率,当一个笔划Li的骨架Li的像素n小于7时(n<7时),判断为无效,不进行该笔划的粗细Dk的变化率Wk的抽出。根据这样的构成,只抽出长度(像素数)为预定以上的笔划。这样,对笔划的抽出附以像素数n的下限,通过只抽出预定长度以上的笔划,可排除成为杂划(ノィズ)的短笔划,提高字体识别的正确率。
图5(a)、(b)中,对于图2、图4的文字图像像ARi,表示按照式I′计算的一个笔划L1的粗细Dk和该笔划L1的粗细变化率(即微分值)Wk。
这样求出的由笔划序号j特定的一个笔划的粗细变化率的平均值(Wj),例如,与式I′对应地,用下式(式II)求出。
n-3
(Wj)=∑Wk/(n-6) 式II
k=4
另外,该一个笔划的粗细变化率的平均值(Wj),对于由其文字序号i特定的文字的全部笔划Lj进行加算,由下式(式III)求出平均值Wi。
n
Wi=∑(Wj)/(n) 式III
j=1
该平均值Wi,是文字(或文字序号i的文字图像)的全部笔划的粗细变化率的平均值。另外,这样求出的一个文字序号的笔划粗细变化率的平均值Wi,对于全部的文字(ARi)加算,由下式(式IV)更加平均化,求出平均值Wm。
n
Wm=∑Wi/(n) 式IV
j=1
该平均值Wm,是被读入文件中的笔划粗细变化率的平均值。以上的平均是算术平均,但也可以是加权平均。
按照第1抽出例抽出文字笔划的粗细、并且抽出笔划粗细变化率时,如下述地进行。即,笔划粗细抽出部11,从细线化了的骨架画像AR′抽出全部的端点,从某一个端点到下一个端点或分支点追踪骨架,把该追踪结果得到的从一个端点到另一个端点或分支点的部分,判断为一个笔划Lj。接着,将构成文字的各笔划的粗细Wk…如上述地抽出,对各笔划Lj…抽出粗细(Wj)。另外,笔划粗细变化率抽出部12,把构成文字的各笔划的粗细变化率(Wj)(各笔划的粗细变化率的平均值(Wj))用上述的方法求出,将各笔划的粗细变化率(Wj)的平均值作为该文字的笔划粗细变化率Wi,最终抽出。
具体地说,在图2例中,构成文字的笔划Lj是L1和L2两个。该两个笔划L1、L2各自的粗细变化率(Wj)((W1)、(W2))的平均值,作为该文字i的笔划粗细的变化率Wi抽出。该平均值Wi,根据需要,可以以切出的文字单位进一步平均化,作为文件的平均值Wm。
按照第2抽出例抽出文字笔划的粗细、并且抽出笔划粗细变化率时,如下述地进行。即,笔划粗细抽出部11,求出构成文字的各笔划的方向R,从其中仅抽出特定方向的笔划L的粗细D。并且,这时,笔划粗细变化率抽出部12,对特定方向的笔划L,求出由笔划粗细抽出部11抽出的笔划L的粗细Dk的变化率Wk,把特定方向笔划的粗细变化率(Wj)的平均值,作为该文字的笔划粗细变化率Wi,最终抽出。
另外,一个笔划的方向(特定方向),例如可如下述地求出。即,在图2的例中,例如笔划L1的方向R1,可以作为构成该笔划L1的骨架L1′的各像素(即各点)T1、…、Tn的向量r1、…、rn的平均求出。对于笔划L2的方向R2,也可用同样的方法求出。因此,例如采用方向R1作为特定方向时,从构成文字的二个笔划L1、L2中,方向R1的笔划L1的粗细变化率(W1)不被平均化,可直接地作为该文字的笔划粗细变化Wi抽出。
这时,通过对笔划方向进行例如垂直方向、水平方向、斜方向的8方向量子化,可以选择作为特定方向的斜方向的笔划Lj抽出。
对于方向R1有若干个笔划L1、L2时,对于各笔划L,求的变化率(Wj)的平均值,按照式III求出,作为该文字的笔划粗细变化率Wi抽出。
图6是表示图1所示字体识别装置的硬件构造的图。如图6所示,该字体识别装置,例如可用PC电脑等实现,备有控制全体的CPU21、储存CPU21的控制程序等的ROM22、作为CPU21的作业区使用的RAM23、把文件作为文件图像读入的扫描器24、由扫描器24读入的文件以页为单位储存的文件图像外存储器25和结果输出装置(例如显示器或打印机)26。该结果输出装置26输入对包含在文件图像中的各文字图像进行字体识别结果的信息。
使图6和图1对应时,扫描器24与图像输入部1对应,文件图像外存储器25与存储器2对应,结果输出装置26与结果输出部6对应。另外,CPU21具有图1的控制部5、文字切出处理部3和字体识别部4的功能。
CPU21具有的控制部5、文字切出处理部3、字体识别部4等的功能,例如可以以软件包(具体地说,是CD-ROM等的信息储存媒体)的形式提供,为此,在图6例中设置信息存储媒体(记录媒体)30时,设有驱动它的媒体驱动装置31。
换言之,本发明的字体识别装置,在使备有图像扫描器、显示器等的通用计算机系统读入存储在CD-ROM等信息存储媒体30内的程序码,使该通用计算机系统的微处理器执行字体识别处理的装置构成中也能实施。这时,作为容纳本发明字体识别处理程序的信息存储媒体30,不限于是CD-ROM,也可以采用ROM、RAM、FD等。
下面,参照图7至图9的流程图,说明上述构造的字体识别装置的处理动作。图7、图8是说明全部处理动作的流程图,图9是在图7、图8的处理动作中,表示求笔划粗细变化率Wi处理的流程图。
如图7、图8所示,先在步骤S101,由图像输入部1读入记载着作为字体识别对象文字的文件(例如原稿),将其作为文件图像存储在存储器2内。
接着,在步骤S102,由文字切出处理部3从文件图像中仅把文字图像AR以矩形状切出,进行求其外接矩形区域座标的文字矩形切出处理。这样,对包含在文件图像中的各文字图像ARi进行切出处理,对于切出的各文字图像ARi(文字矩形)以第1、第2、第3的顺序,依次注上文字序号i。
接着,在步骤S103,把用于检索各文字图像ARi的文字序号i初始设定为“1”。接着,在步骤S104,对各文字图像求从第1个到第i个文字的笔划粗细的变化率Wi。
在该步骤S104中的求文字笔划粗细变化率Wi的处理,例如可如图9所示地进行。图9的处理例,是按照上述的第1抽出例,采用构成文字的全部笔划Li,抽出笔划粗细的变化率Wi。
如图9所示,先在步骤S201,文字图像ARi被细线化处理成为骨架图像。接着在步骤S202,从在步骤S201细线化了的骨架图像中抽出端点T1,把全部端点T1存储到存储器2内。这时,对抽出的各端点T1依次注以笔划序号j,存储(Lj)。接着在步骤S203,把检索端点T1用的笔划序号j初始设定为“1”。
接着,在步骤S204,从第j个端点Tj到下一个端点或分支点追踪骨架,把该追踪结果得到的从一个端点T1到下一个端点或分支点的部分,判断为一个笔划Lj(笔划的骨架Lj′)。接着,如前所述,求该笔划的粗细Dk,据此依次求出笔划粗细的变化率Wk和(Wj)。
然后,在步骤S205,在笔划序号j的值上加“1”(j+1)。在步骤S206,判断被加算了的第j个端点是否存在,如果存在,返回步骤S204,对下一个端点,进行与上述同样的处理(抽出文字中的一个笔划的粗细变化率Wk和(Wj)的处理)。
这样,在步骤S202,对存储在存储器2内的全部端点T1进行追踪,依次求出包含在该文字图像ARi内的各笔划的粗细变化率(Wj)。在步骤S206,如果第j个端点T1不存在(结束了全部端点T1的处理时),则移至步骤S207。
在步骤S207,在该一个文字图像(文字矩形)ARi内,求全部笔划的粗细变化率(Wj)的平均值,将该平均值作为该文字图像ARi的笔划粗细变化率Wi最终抽出。
在图7的步骤S104中,象图9的步骤S201至S207那样地求出第i个文字的笔划粗细变化率Wi后,在图7的步骤S105中,在文字序号i的值上仅加“1”(i+1)。接着,在步骤S106,判断已加算的第i个文字是否存在,如果存在,返回步骤S104,对下一个文字进行与上述同样的处理(抽出该文字的笔划粗细变化率Wi的处理)。
这样,对在步骤S101输入的文件图像中包含的各文字图像ARi,依次进行求笔划粗细变化率Wi的处理。在步骤S106,如果第i个文字不存在(结束了对全部的文字图像ARi求笔划粗细变化率Wi的处理时),移至步骤S107。在步骤S107,求出在步骤S104所求得的各文字笔划粗细变化率Wi的平均值。即,求出在步骤S101输入的文件图像中所包含的各文字笔划粗细变化率Wi的平均值Wm。
图11表示用上述方法,对宋体文字与黑体文字混存的文件图像进行解析之一例。将笔划粗细变化率W作为横轴,将该粗细的笔划出现频度作为纵轴。图中,黑体文字以笔划粗细变化率W小的峰G出现,宋体文字以笔划粗细有一定变化的峰M出现。另外,这时的文件图像全部的笔划粗细的平均值(用上述方法计算得到的笔划粗细平均值Wm),用虚线Wm表示。
假设虚线Ws表示该平均值Wm乘以一定值后的线,则可以引出能明确区别黑体的峰G与宋体峰M的线。因此,在本发明中,将该平均值Wm乘以一定的常数的值设定为阈值Ws,将该阈值Ws与各文字ARi所示的粗细变化率Wi比较,则容易区别宋体和黑体。
在步骤S108,把在步骤S107所求得的笔划粗细变化率的平均值Wm乘以预定常数的值决定为阈值Ws。即,决定用于识别在步骤S101输入的文件图像的各文字ARi字体的识别函数的阈值Ws。
作为该阈值Ws,也可以采用预定常数的阈值Ws′。这时,由于不必对全部文字求平均值Wm,所以,步骤S107、S108可以省略。另外,该常数阈值Ws′,也可以凭经验求出,作为预定程序的设定值,另外,也可以是使用者根据要识别的字体设定的值。
这样,在步骤S107、S108决定了阈值Ws后,在步骤S109,为了识别各文字的字体,先把文字序号i的值初期设定为“1”。接着在步骤S110,将第i个(第1个)文字的笔划粗细变化率Wi与在步骤S108决定的阈值Ws进行比较,识别第i个(第1个)文字的字体。具体地说,如果第i个文字的笔划粗细变化率Wi大于阈值Ws,则如图11所示,移至步骤S111,判断为该第i个(第1个)文字的字体是宋体。如果第i个(第1个)文字的笔划粗细变化率Wi小于阈值Ws,则移至步骤S112,判断为该第i个(第1个)文字的字体是黑体。
然后,在步骤S113,对文字序号i的值加“1”(i+1)。在步骤S114,判断加算后的第i个文字是否存在,如果存在,返回步骤S110,对下一个文字进行与上述同样的处理(识别该文字字体的处理)。这样,对包含在文件图像内的各文字(i=1、2、…),依次进行识别其字体的处理。如果在步骤S114第i个文字不存在(对全部的文字识别字体的处理结束时),结束全部的处理。
因此,本发明具有可适当设定阈值Ws(或Ws′)的特征。通常,宋体相对于黑体虽然具有特定的特征量,但即便同是宋体的文字,因印刷活字的不同,其粗细变化率也有比较大的分散。如本发明这样,通过将阈值Ws(或Ws′)设定在适当的位置使其变化,可以正确地区别宋体和黑体的字体。
图9的例中,是按照第1抽出例,采用全部的笔划,抽出笔划粗细的变化率,但也可以从构成文字的各笔划中,只用预定的特定方向的笔划,抽出文字笔划粗细的变化率。图10流程图表示的处理例,是在图7的步骤S104中,不采用图9的处理,而是按照第2抽出例,只用预定的特定方向的笔划抽出文字笔划的粗细变化率。
如图10所示,先在步骤S301,将文字图像细线化,接着在步骤S302,从在步骤S301被细线化了的文字图像(骨架图像)中抽出端点,把全部端点存在存储器2内。这时,对抽出的各端点依次注以笔划序号j存储起来。接着,在步骤S303,把用于检索端点的笔划序号j初期设定为“1”。
接着,在步骤S304,从第j个端点到下一个端点或分支点,追踪骨架,把该追踪结果得到的从一个端点到下一个端点或分支点的部分,判断为一个笔划(笔划的骨架),抽出该笔划的方向。然后,在步骤S305,判断该笔划的方向是否是预定的特定方向,如果是预定的特定方向,在步骤S306,如前述地求出该笔划的粗细,据此求出笔划的粗细变化率。另外,在步骤S305,如果该笔划的方向不是预定的特定方向,则不求该笔划的粗细变化率。
接着,在步骤S307,在笔划序号j的值上加“1”(j+1)。在步骤S308,判断加算后的第j个端点是否存在,如果存在,返回步骤S304,对下一个端点进行与上述同样的处理(从构成文字的笔划中,抽出特定方向笔划的粗细变化率的处理)。
这样,在步骤S302,对存储在存储器2内的全部端点进行追踪,从该文字像素包含的各笔划中,只对预定的特定方向的笔划依次求其粗细的变化率,在步骤S308如果第j个端点不存在时(全部端点的处理结束时),在步骤S309,在该一个文字图像内,只对判断为是预定特定方向的各笔划,求该笔划的粗细变化率平均值,并将其作为该文字图像ARi的笔划粗细变化率Wi最终抽出。
这样,在本发明中,构成文字的笔划中,例如存在着斜笔划时,对该斜笔划,也将该笔划的粗细变化率作为该笔划的正确特征量抽出,所以,对于包含斜笔划的文字图像,也能用小的程序容易且正确地高精度识别。
具体地说,在高度化的文件图像处理中,为了更严密地再现文字图像,不仅需要文字码而且也需要字体信息。字体信息,例如在文件中,通常,普通的部分用宋体,重要的部分(标题行、关键词等)用黑体。所以,在自动地抽出这些重要部分时,本发明是非常有用的。
本发明的特征,是对于过去很难识别的细黑体也能高精度正确地识别。
这样,本发明中,可高精度地识别文字图像的文字字体,根据这样得到的文字字体的识别结果,例如对于再现文件图像是有用的。
通常,对于西文活字字体的判断,是以词为单位识别判断。而汉字等活字字体的识别单位,不是词而是文字。因此,本发明中,该识别单位,除了以文字单位切出的文字信息外,例如,对于包含由部首等文字的一部分、若干文字、行单位的文字、列单位的文字等切出的文字信息的图像,也可同样地识别。
根据本发明,如果给与原稿单位的信息,可判断整个原稿是黑体还是宋体。另外,如果给与文字单位的信息,则可识别以文字单位的字体。另外,文字被分割成2或3部分并作为一个文字图像识别时,或者2或3以上的文字作为一个文字图像识别时,也不会有大的误差。因此,在文字切出处理部3的作为文字的文字图像AR的切出,包含以文字单位的文字切出、以行单位的行切出、以列单位的列切出和文字的部分单位的部分切出等。
但是,在字体混杂的文件图像中,最好以略文字单位切出并附在本发明的字体识别装置上。这时,所谓的略文字单位,是指可以分作为“左偏旁”和“右偏旁”那样的部首。
另外,上述例中,作为识别的字体,是指识别日文中的宋体、黑体中的任一种,但本发明中,作为识别的字体,可以识别宋体、黑体以外的其它字体。另外,还可以识别宋体、黑体和其它的字体。例如,可进行中国、台湾使用的活字字体(宋体、黑体等)的识别。
计算机系统(计算机)附加有安装、执行等的程序,为了程序的流通等,信息存储媒体30也可作为存储着程序的记录媒体采用。这样,作为由存储着可识别字体程序的计算机读取的记录媒体普及。
以上详细说明了本发明的实施例,但具体构造并不限于该实施例,在不脱离本发明要旨范围内的设计变更等均包含在本发明内。
例如,本发明的字体识别装置中,计算机硬件和软件系统是采用通常的系统,将该系统的构成要素的一部分置换为同等的要素,是普通专业人员能做到的。另外,也包含通常的系统化方法的附加或置换。踊蛑没弧*
Claims (18)
1.字体识别装置,其特征在于,备有:
抽出构成文字的各笔划的粗细的笔划粗细抽出部、
求出该笔划粗细抽出部抽出的每一笔笔划的粗细变化率的笔划粗细变化率抽出机构;
根据该笔划粗细变化率抽出部求出的笔划粗细变化率,识别上述文字字体的识别部。
2.如权利要求1所述的字体识别装置,其特征在于,上述笔划粗细抽出部,抽出每一笔笔划的粗细的变化率平均值,作为文字的笔划粗细变化率。
3.如权利要求1所述的字体识别装置,其特征在于,上述笔划粗细抽出部,只抽出构成文字的各笔划中的特定方向笔划的粗细;上述笔划粗细变化率抽出部,从上述笔划粗细抽出部抽出的特定方向笔划的粗细求其变化率,将特定方向笔划的粗细变化率的平均值,作为文字笔划的粗细变化率抽出。
4.如权利要求1所述的字体识别装置,其特征在于,上述识别部,将文字笔划粗细的变化率与预定的阈值进行比较,识别该文字的字体。
5.如权利要求4所述的字体识别装置,其特征在于,上述阈值是预定文件图像所包含的全部文字笔划的粗细变化率的平均值乘以预定常数而决定的,这时,上述识别部,将包含在文件图像中的各文字的笔划粗细变化率与阈值进行比较,分别识别各文字的字体。
6.如权利要求3所述的字体识别装置,其特征在于,上述的特定方向是斜方向。
7.如权利要求1至6中任一项所述的字体识别装置,其特征在于,上述文字是以汉字为主体的印刷活字。
8.如权利要求1至6中任一项所述的字体识别装置,其特征在于,上述字体识别装置,是根据被切取了文字信息的文字图像,由被编程的计算机识别文字的字体的装置,所述文字信息是从切除了一文字单位的文字、切除了行单位或列单位的行列、以及切除了文字的一部分的部首中选择出的。
9.字体识别方法,其是用编程的计算机识别文字字体的方法,其特征在于包括以下步骤:
抽出构成文字的各笔划粗细的粗细抽出步骤;
抽出由该粗细抽出步骤抽出的每一笔笔划的粗细变化率的变化率抽出步骤;
根据该变化率抽出步骤抽出的笔划粗细变化率,识别该文字字体的字体识别步骤。
10.如权利要求9所述的字体识别方法,其特征在于,
上述粗细抽出步骤包含抽出构成文字的各笔划的粗细的同时,抽出每一笔笔划的粗细的变化率的平均值,作为文字笔划粗细的变化率的变化率抽出步骤。
11.如权利要求9所述的字体识别方法,其特征在于,上述粗细抽出步骤包含从构成文字的各笔划中只抽出特定方向笔划的粗细的特定方向笔划粗细抽出步骤;及包含从由该特定方向粗细步骤抽出的特定方向的各笔划粗细中,求其粗细变化率并作为文字特定方向笔划粗细的变化率抽出的变化率抽出步骤。
12.如权利要求10或11所述的字体识别方法,其特征在于,上述变化率抽出步骤将变化率作为平均值抽出。
13.如权利要求9至12中任一项所述的字体识别方法,其特征在于,上述字体识别步骤,通过把由上述变化率抽出步骤抽出的笔划粗细的变化率与预定的阈值进行比较,来识别文字的字体。
14.如权利要求12所述的字体识别方法,其特征在于,包含阈值设定步骤,该阈值设定步骤是从上述变化率抽出步骤抽出的笔划粗细变化率,求出全部文字的笔划变化率的平均值,在所求得的平均值上乘以预定常数,由此设定阈值;
上述识别步骤,把由上述变化率抽出步骤抽出的笔划粗细变化率与由上述阈值设定工序设定的阈值进行比较,由此识别文字的字体。
15.如权利要求14所述的字体识别方法,其特征在于,上述的预定常数,是预先设定的或者是以后设定的。
16.如权利要求11所述的字体识别方法,其特征在于,上述的特定方向是斜方向。
17.如权利要求9所述的字体识别方法,其特征在于,上述文字是以汉字为主体的印刷活字。
18.如权利要求17所述的字体识别方法,其特征在于,上述字体识别方法,是根据被切取了文字信息的文字图像,由被编程的计算机识别文字的字体,所述文字信息是从切除了一文字单位的文字、切除了行单位或列单位的行列、以及切除了文字的一部分的部首中选择出的。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP205255/97 | 1997-07-15 | ||
JP20525597 | 1997-07-15 | ||
JP205255/1997 | 1997-07-15 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1205474A CN1205474A (zh) | 1999-01-20 |
CN1099068C true CN1099068C (zh) | 2003-01-15 |
Family
ID=16503967
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN98103134A Expired - Fee Related CN1099068C (zh) | 1997-07-15 | 1998-07-14 | 字体识别装置和方法 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN1099068C (zh) |
TW (1) | TW369642B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108038427B (zh) * | 2017-11-29 | 2020-06-23 | 维沃移动通信有限公司 | 一种文字识别方法及移动终端 |
CN109816847B (zh) * | 2018-12-20 | 2021-01-01 | 深圳怡化电脑股份有限公司 | 一种判断手写字迹涂改的方法、装置及终端设备 |
CN116563869B (zh) * | 2023-07-10 | 2023-09-19 | 平安银行股份有限公司 | 页面图像文字处理方法、装置、终端设备和可读存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06208649A (ja) * | 1993-01-11 | 1994-07-26 | Fuji Xerox Co Ltd | 文字認識装置 |
US5355449A (en) * | 1991-09-30 | 1994-10-11 | Destiny Technology Corporation | Method and apparatus for outline font character generation in dot matrix devices |
CN1118897A (zh) * | 1993-12-30 | 1996-03-20 | 佳能株式会社 | 字符图形产生装置和方法 |
-
1998
- 1998-07-03 TW TW087110811A patent/TW369642B/zh not_active IP Right Cessation
- 1998-07-14 CN CN98103134A patent/CN1099068C/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5355449A (en) * | 1991-09-30 | 1994-10-11 | Destiny Technology Corporation | Method and apparatus for outline font character generation in dot matrix devices |
JPH06208649A (ja) * | 1993-01-11 | 1994-07-26 | Fuji Xerox Co Ltd | 文字認識装置 |
CN1118897A (zh) * | 1993-12-30 | 1996-03-20 | 佳能株式会社 | 字符图形产生装置和方法 |
Also Published As
Publication number | Publication date |
---|---|
TW369642B (en) | 1999-09-11 |
CN1205474A (zh) | 1999-01-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1269069C (zh) | 字符识别装置及方法 | |
CN1145872C (zh) | 手写汉字自动分割和识别方法以及使用该方法的系统 | |
CN1324532C (zh) | 被动嵌入的交互编码 | |
CN1258894A (zh) | 用于识别字符的装置和方法 | |
CN1752991A (zh) | 文字识别装置、文字识别方法及文字识别程序 | |
CN1991865A (zh) | 从复杂背景文档图像提取文本的装置、方法、程序及介质 | |
CN1933549A (zh) | 用于确定图像质量的图像处理装置及其方法 | |
CN1834992A (zh) | 检测文档图像中的字符的方向 | |
CN1609846A (zh) | 用于识别,锚定和回流数字墨水注释的数字墨水注释方法和系统 | |
CN1141666C (zh) | 利用标准笔划识别输入字符的在线字符识别系统 | |
CN101044508A (zh) | 图形数据的高速缓冲存储器有效光栅化 | |
CN1855990A (zh) | 成像设备及其处理方法和由计算机执行该方法的程序 | |
CN1285058C (zh) | 图像检索装置和图像检索方法 | |
CN1955981A (zh) | 字符识别装置、字符识别方法、以及字符数据 | |
CN1099068C (zh) | 字体识别装置和方法 | |
CN1711558A (zh) | 相似图像提取装置、相似图像提取方法以及相似图像提取程序 | |
CN1217122A (zh) | 图象识别的方法和装置以及利用此方法和装置的复印机和打印机 | |
CN1132092C (zh) | 打印机控制装置及打印机控制方法 | |
CN1207673C (zh) | 半色调点消除方法及其系统 | |
CN1484165A (zh) | 文件信息的输入设备,输入方法,输入程序以及记录介质 | |
CN1896997A (zh) | 字符串检索装置及使计算机执行字符串检索方法的程序 | |
CN1147659A (zh) | 字符处理装置,字符处理方法及存贮器 | |
CN1497525A (zh) | 设定轮廊字体的印字线宽度的技术 | |
CN1921535A (zh) | 图像检索装置,图像处理装置,图像检索方法,以及图像处理方法 | |
CN1110018C (zh) | 特征值抽取方法及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C06 | Publication | ||
PB01 | Publication | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20030115 Termination date: 20140714 |
|
EXPY | Termination of patent right or utility model |