CN1105367C - 字体识别装置、字体识别方法及信息记录媒体 - Google Patents

字体识别装置、字体识别方法及信息记录媒体 Download PDF

Info

Publication number
CN1105367C
CN1105367C CN 97126259 CN97126259A CN1105367C CN 1105367 C CN1105367 C CN 1105367C CN 97126259 CN97126259 CN 97126259 CN 97126259 A CN97126259 A CN 97126259A CN 1105367 C CN1105367 C CN 1105367C
Authority
CN
China
Prior art keywords
sweep length
frequency plot
horizontal direction
vertical direction
average
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN 97126259
Other languages
English (en)
Other versions
CN1188944A (zh
Inventor
阿部悌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Publication of CN1188944A publication Critical patent/CN1188944A/zh
Application granted granted Critical
Publication of CN1105367C publication Critical patent/CN1105367C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)
  • Character Input (AREA)

Abstract

本发明涉及字体识别装置、字体识别方法及信息记录媒体,字体识别部4包括扫描宽度频率图处理部11、特征量计算部12及识别部13,处理部11对文字图像制作垂直方向和水平方向的扫描宽度频率图,再分别求得各自的平均扫描宽度,特征量计算部12计算上述垂直方向与水平方向的平均扫描宽度之比作为特征量,识别部13根据该特征量识别字体。即使是包含斜笔划和噪音信号的文字图像也能容易且正确地识别该文字字体。

Description

字体识别装置、字体识别方法及信息记录媒体
技术领域
本发明涉及进行文字字体(font)识别的字体识别装置、字体识别方法及信息记录媒体。
背景技术
以往,在例如特开平6-208649号中公开了一种字体识别技术,推定文字纵向及横向的文字线宽,根据它们的线宽比,识别文字字体是明朝体还是黑体(均为日文字体名称)。更具体地说,该字体识别技术是由文字图像的水平方向和垂直方向的扫描宽度频率图(ランレングスヒストグラム)的最频值,推定横向及纵向的文字线宽,根据它们的线宽比,识别文字字体是明朝体还是黑体的。
但是,在上述以往的字体识别技术中,存在只有当象“中”、“田”那样构成文字的笔划大多是水平或垂直的直线、且图像没有躁音信号场合才能进行良好识别的问题。即,由于大部分文字存在斜笔划,当文字中存在斜笔划时,在上述以往的字体识别技术中,根据上述扫描宽度频率图的最频值,往往不能检测出正确的线宽。另外,未必能说明朝体的横笔划比黑体的细。因此,上述以往的字体识别技术存在不能正确识别大多数文字的字体、不适合实用化的问题。
发明内容
本发明就是鉴于上述先有技术所存在的问题而提出来的,本发明的目的在于,提供一种即使对于包含斜笔划即躁音信号的文字图像、也能很容易且正确地识别该文字字体的字体识别装置、字体识别方法及信息记录媒体。
另外,本发明的目的还在于,提供一种即使是粗写的明朝体文字图像、细写的黑体的文字图像也能正确识别该字体的字体识别装置、字体识别方法及信息记录媒体。
为了实现上述目的,本发明提出一种字体识别装置,它设有:主处理器,用以执行各种模块处理,扫描器,用于将打印的汉字转换为数字图像,扫描器接口卡,用于对扫描器和主处理器提供信据传输装置,其特征在于:包括扫描宽度频率图处理装置及识别装置,上述扫描宽度频率图处理装置对文字图像制作垂直方向的扫描宽度频率图和水平方向的扫描宽度频率图,从上述垂直方向的扫描宽度频率图求得垂直方向的平均扫描宽度,从上述水平方向的扫描宽度频率图求得水平方向的平均扫描宽度;上述识别装置计算由扫描宽度频率图处理装置所得的垂直方向的平均扫描宽度与水平方向的平均扫描宽度之比作为特征量,根据该特征量,识别文字的字体。
根据本发明的字体识别装置,其特征还在于,上述扫描宽度频率图处理装置将制作扫描宽度频率图时的扫描宽度(ランレンクス)限定在比预先决定的阈值小的范围,制作垂直方向的扫描宽度频率图和水平方向的扫描宽度频率图,求取垂直方向的平均扫描宽度和水平方向的平均扫描宽度。
根据本发明的字体识别装置,其特征还在于,上述扫描宽度频率图处理装置将制作扫描宽度频率图时的扫描宽度限定在比与文字的尺寸成比例而决定的阈值小的范围,制作垂直方向的扫描宽度频率图和水平方向的扫描宽度频率图,求取垂直方向的平均扫描宽度和水平方向的平均扫描宽度。
根据本发明的字体识别装置,其特征还在于,上述扫描宽度频率图处理装置对于从文字图像在水平方向仅仅提取比预先决定的阈值长的扫描线(ラン)的图像求得垂直方向的扫描宽度频率图,对于从文字图像在垂直方向仅仅提取比预先决定的阈值长的扫描线的图像求得水平方向的扫描宽度频率图,从垂直方向的扫描宽度频率图求得垂直方向的平均扫描宽度,从水平方向的扫描宽度频率图求得水平方向的平均扫描宽度。
根据本发明的字体识别装置,其特征还在于,上述扫描宽度频率图处理装置对于从文字图像在水平方向仅仅提取比与文字的尺寸成比例而决定的阈值长的扫描线的图像求得垂直方向的扫描宽度频率图,对于从文字图像在垂直方向仅仅提取比与文字的尺寸成比例而决定的阈值长的扫描线的图像求得水平方向的扫描宽度频率图,从垂直方向的扫描宽度频率图求得垂直方向的平均扫描宽度,从水平方向的扫描宽度频率图求得水平方向的平均扫描宽度。
本发明还提出一种字体识别方法,其特征在于,对文字图像制作垂直方向的扫描宽度频率图和水平方向的扫描宽度频率图,从上述垂直方向的扫描宽度频率图求得垂直方向的平均扫描宽度,从上述水平方向的扫描宽度频率图求得水平方向的平均扫描宽度,计算垂直方向的平均扫描宽度与水平方向的平均扫描宽度之比作为特征量,根据该特征量,识别文字的字体。
本发明还提出一种信息记录媒体,其特征在于,记录下列程序:对文字图像制作垂直方向的扫描宽度频率图和水平方向的扫描宽度频率图,从上述垂直方向的扫描宽度频率图求得垂直方向的平均扫描宽度,从上述水平方向的扫描宽度频率图求得水平方向的平均扫描宽度,计算垂直方向的平均扫描宽度与水平方向的平均扫描宽度之比作为特征量,根据该特征量,识别文字的字体。
下面说明本发明的效果,根据如上所述,本发明的装置包括扫描宽度频率图处理装置及识别装置,上述扫描宽度频率图处理装置对文字图像制作垂直方向的扫描宽度频率图和水平方向的扫描宽度频率图,从上述垂直方向的扫描宽度频率图求得垂直方向的平均扫描宽度,从上述水平方向的扫描宽度频率图求得水平方向的平均扫描宽度;上述识别装置计算由扫描宽度频率图处理装置所得的垂直方向的平均扫描宽度与水平方向的平均扫描宽度之比作为特征量,根据该特征量,识别文字的字体,因此,能容易、正确、精度良好地识别文字图像的文字字体。
附图说明
图1是表示本发明涉及的字体识别装置的构成例的图;
图2是表示一个文字图像例的图;
图3是表示图1的字体识别部的构成例的图;
图4是用于说明图1、图3的字体识别装置的处理动作例的流程图;
图5是表示图1、图3的字体识别装置的处理的具体例的图;
图6是表示图1、图3的字体识别装置的处理的具体例的图;
图7是表示图1的字体识别部的另一个构成例的图;
图8是用于说明图1、图7的字体识别装置的处理动作例的流程图;
图9是表示图1、图7的字体识别装置的处理的具体例的图;
图10是表示图1、图7的字体识别装置的处理的具体例的图;
图11是表示图1的字体识别装置的硬件构成例的图。
具体实施方式
下面,参照附图说明本发明的实施例,图1是表示本发明涉及的字体识别装置的构成例的图,如图1所示,该字体识别装置包括将文书作为例如双值图像读入的图像输入部1、存储由图像输入部1读入的文书图像等的存储器2、从文书图像分离出文字图像的文字截取处理部3、对由文字截取处理部3截取的文字图像进行该文字的字体识别的字体识别部4、对整体进行控制的控制部5以及输出由字体识别部4得出的文字字体的识别结果的结果输出部6。
这里,文字截取处理部3是从文书图像截取例如象图2所示一个文字图像,即,在图2例中,一个文字图像“永”用文字的外接矩形区域AR被截取出来。
图3表示图1的字体识别部4的构成例,在图3例中,字体识别部4包括扫描宽度频率图处理部11、特征量计算部12及识别部13.扫描宽度频率图处理部11对文字图像制作垂直方向的扫描宽度频率图和水平方向的扫描宽度频率图,从垂直方向的扫描宽度频率图求垂直方向的平均扫描宽度,从水平方向的扫描宽度频率图求水平方向的平均扫描宽度;特征量计算部1 2计算由扫描宽度频率图处理部11得出的垂直方向的平均扫描宽度与水平方向平均扫描宽度之比作为特征量;识别部13根据特征量计算部12算出的特征量识别文字字体。
更具体地说,识别部13将垂直方向的平均扫描宽度与水平方向的平均扫描宽度之比与所定阈值比较,判别字体。
下面参照图4流程图说明这种构成的字体识别装置(图1、图3的字体识别装置)的处理动作例。
在步骤S101中,通过图像输入部1读入作为字体识别对象的记载有文字的文书(例如原稿),将其作为文书图像存入存储器2内。随后,在步骤S102中,通过文字截取处理部3从文书图像仅仅截取出文字图像进行求其外接矩形区域座标的文字矩形截取处理。这样,对包含在文书图像中的各文字图像进行截取,对截出的各文字图像进行字体的识别处理。
在步骤S103中,对各文字图像之中一个文字图像制作文字矩形内的图像的垂直方向的扫描宽度频率图,从该垂直方向的扫描宽度频率图求得垂直方向的平均扫描宽度。在步骤S104中,制作文字矩形内的图像的水平方向扫描宽度频率图,从该水平方向的扫描宽度频率图求得水平方向的平均扫描宽度。
接着,在步骤S105中,求得步骤S103中所得的垂直方向的平均扫描宽度与步骤S104中所得的水平方向的平均扫描宽度之此,即垂直方向的平均扫描宽度/水平方向的平均扫描宽度。
然后,在步骤S106中,判断在步骤S105中求得的平均扫描宽度之比是否比所定阈值(例如0,7)大,若比所定阈值大,就进入步骤S107,判定该文字字体是黑体。若在步骤S106判断平均扫描宽度之比比所定阈值小时,就进入步骤S108,判定该文字字体是明朝体。
这样,对包含在文书图像中的各文字图像之一进行字体识别之后,在步骤S109中,判定是否有其它文字矩形,若有其它文字矩形,就回到步骤S103,对后面的文字进行同样处理,识别其字体。
对包含在文书图像中的各文字顺序进行识别其字体的处理,若在步骤S109判定不存在其它文字矩形时(全部文字字体识别处理结束时),则处理全部结束。
图5、图6表示图1、图3的字体识别装置的处理具体例,文字图像是例如图5 a那样的明朝体文字“永”时,扫描宽度频率图处理部11制作的垂直方向的扫描宽度频率图与水平方向的扫描宽度频率图如图5b所示。图5a的文字图象场合,由图5b可知,水平方向的平均扫描宽度A1比垂直方向的平均扫描宽度A2大,因此,如图5c所示,垂直方向的平均扫描宽度与水平方向的平均扫描宽度之比小,由于该比值小,能识别图5a的文字图像是明朝体。
当文字图像是例如图6a那样的黑体文字“永”时,扫描宽度频率图处理部11制作的垂直方向的扫描宽度频率图与水平方向的扫描宽度频率图如图6b所示。图6a的文字图像场合,由图6b可知,水平方向的平均扫描宽度A1与垂直方向的平均扫描宽度A2之差几乎没有,因此,如图6c所示,垂直方向的平均扫描宽度与水平方向的平均扫描宽度之比大,由于该比值大,能识别图6a的文字图像是黑体。
这样,在该字体识别装置中,由垂直方向的扫描宽度频率图求垂直方向的平均扫描宽度,由水平方向的扫描宽度频率图求水平方向的平均扫描宽度,将垂直方向的平均扫描宽度与水平方向的平均扫描宽度之比作为特征量,识别文字字体,能以非常高的精度高效地识别文字。即,在以往的字体识别方式中,是根据文字图像的水平方向和垂直方向的扫描宽度频率图的最频值,推定横向及纵向的文字线宽,由上述线宽之比识别文字字体是明朝体还是黑体,如前所述,以往这种方法不能正确识别文字字体是明朝体还是黑体。与此相反,在本发明的字体识别方式中,能正确识别文字的字体。
另外,上述方法是将垂直方向的平均扫描宽度与水平方向的平均扫描宽度之比作为特征量的,虽然也可以考虑将垂直方向的平均扫描宽度和水平方向的平均扫描宽度本身作为特征量来取代上述特征量,但是,这时,当识别对象文字是粗的明朝体和细的黑体场合,恐怕会引起误识别。
与此相反,按照明朝体中纵笔划比横笔划粗、黑体中纵笔划与横笔划的粗细差别几乎没有这样的状况,如本发明那样,使用垂直方向的平均扫描宽度和水平方向的平均扫描宽度之比时,当识别对象文字是粗的明朝体和细的黑体场合,也能精度良好地识别文字字体是明朝体还是黑体。
在本发明的字体识别装置中,扫描宽度频率图处理部11在制作扫描宽度频率图时,也可以将扫描宽度限定在此预先决定的所定阈值小的范围制作垂直方向和水平方向的扫描宽度频率图。这种场合,在垂直方向的扫描宽度频率图上能正确地得出水平笔划的粗细,在水平方向的扫描宽度频率图上能正确地得出垂直笔划的粗细。
就是说,若以例如纵向的扫描宽度频率图为例,制作纵向的扫描宽度频率图后求其平均是以得出横笔划粗细为目的,例如文字“—”的场合,可制作全部的扫描宽度频率图,可是这样的文字与其说是理想文字不如说是特例。与此相反,通常文字中制作纵向的扫描宽度频率图时,横笔划以外的部分还有不少(大部分场合比横笔划粗),这样取平均的话,得出的值比横笔划的粗细要大。因此,限定在比所定阈值小的范围制作扫描宽度频率图,能够得出本来想提取的横笔划的粗细,这里例如设定比预料的横笔划粗细的最大值还稍大的值作为所定的阈值。
横向扫描宽度频率图也同样,限定在比所定阈值(例如设定比预料的纵笔划粗细的最大值还稍大的值作为该阈值)小的范围制作扫描宽度频率图,能得出本来想提取的纵笔划的粗细。
因此,根据这样制作的垂直方向和水平方向的扫描宽度频率图,将垂直方向的平均扫描宽度与水平方向的平均扫描宽度之比作为特征量识别文字字体时,能精度非常好地识别文字字体。
另外,在本发明的字体识别装置中,当扫描宽度频率图处理部11制作扫描宽度频率图时,也可以采用与文字尺寸大小成比例决定的阈值作为上述所定的阈值,限定在比上述阈值小的范围制作垂直方向和水平方向的扫描宽度频率图。
这里,如图2所示,文字截取处理部3从文书图像以文字的外接矩形区域AR截取文字图像时,文字的尺寸大小可以检测该外接矩形区域AR的大小(例如高度)。
这样,当将扫描宽度限定在比与文字大小成比例决定的阈值小的范围制作垂直方向和水平方向的扫描宽度频率图时,在垂直方向的扫描宽度频率图中能正确地提取水平笔划的粗细,在水平方向的扫描宽度频率图中能正确地提取垂直笔划的粗细。因此,根据这样制作的垂直方向和水平方向的扫描宽度频率图,将垂直方向的平均扫描宽度与水平方向的平均扫描宽度之比作为特征量识别文字的字体时,能精度非常好地识别文字字体。
图7表示图1的字体识别部4的另一个构成例,在字体识别部4中还设有提取比所定阈值长的扫描线的扫描线提取部15。即,在图7构成例中,扫描线提取部15从文字图像在水平方向仅仅提取比预先决定的阈值长的水平方向扫描线,在垂直方向仅仅提取比预先决定的阈值长的垂直方向扫描线,扫描宽度频率图处理部11对于从文字图像在水平方向仅仅提取比预先决定的阈值长的水平方向扫描线的图像求得垂直方向的扫描宽度频率图,对于从文字图像在垂直方向仅仅提取比预先决定的阈值长的垂直方向扫描线的图像求得水平方向的扫描宽度频率图。
图8是表示字体识别部4如图7那样构成的字体识别装置的处理动作例的流程图。
请参照图8,在步骤S201,通过图像输入部1读入作为字体识别对象的记载有文字的文书(例如原稿),将其作为文书图像存入存储器2内。随后,在步骤S202中,通过文字截取处理部3从文书图像仅仅截取出文字图像,进行求其外接矩形区域座标的文字矩形截取处理。这样,对包含在文书图像中的各文字图像进行截取,对截出的各文字图像进行字体的识别处理。
在步骤S203中,对各文字图像之中一个文字图像、也就是文字矩形内的图像,在水平方向提取扫描线,这时形成提取了比所定阈值长的水平方向扫描线的图像。在步骤S204中,对于提取了比所定阈值长的水平方向扫描线的图像制作垂直方向的扫描宽度频率图,从垂直方向的扫描宽度频率图求取垂直方向的平均扫描宽度。在步骤S205中,对各文字图像之中一个文字图像、也就是文字矩形内的图像,在垂直方向提取扫描线,这时,形成提取了比所定阈值长的垂直方向扫描线的图像。在步骤S206中,对于提取了比所定阈值长的垂直方向扫描线的图像制作水平方向的扫描宽度频率图,从水平方向的扫描宽度频率图求取水平方向的平均扫描宽度。
接着,在步骤S207中,求取步骤S204中所得的垂直方向的平均扫描宽度与步骤S206中所得的水平方向的平均扫描宽度之比。
然后,在步骤S208中,判断在步骤S207中求得的平均扫描宽度之比是否比所定阈值(例如0,7)大,若比所定阈值大,就进入步骤S209,判定该文字字体是黑体。若在步骤S208中判断平均扫描宽度之比比所定阈值小时,就进入步骤S210,判定该文字字体是明朝体。
这样,对包含在文书图像中的各文字图像之一进行字体识别之后,在步骤S211中,判定是否有其它文字矩形,若有其它文字矩形,就回到步骤S203,对后面的文字进行同样的处理,识别其字体。
对包含在文书图像中的各文字顺序进行识别其字体的处理,若在步骤S211判定不存在其它文字矩形时(全部文字字体识别处理结束时),则处理全部结束。
图9、图10表示这种构成的字体识别装置的处理具体例,文字图像是例如图9a那样的明朝体的文字“永”时,由扫描线提取部15提取的水平方向、垂直方向的扫描线图像如图9b所示,对于图9b的水平方向、垂直方向的扫描线图像,由扫描宽度频率图处理部11分别制作的垂直方向及水平方向的扫描宽度频率图如图9c所示。图9a所示文字图像场合,从图9c可知,水平方向的平均扫描宽度A1比垂直方向的平均扫描宽度A2大,因此,如图9d所示,垂直方向的平均扫描宽度与水平方向的平均扫描宽度之比小,由于该比值小,能识别图9a文字图像是明朝体。
文字图像是例如图10a那样的黑体的文字“永”时,由扫描线提取部15提取的水平方向、垂直方向的扫描线图像如图10b所示,对于图10b的水平方向、垂直方向的扫描线图像,由扫描宽度频率图处理部11分别制作的垂直方向及水平方向的扫描宽度频率图如图10c所示。图10a所示文字图像场合,从图10c可知,水平方向的平均扫描宽度A1与垂直方向的平均扫描宽度A2的差几乎没有,因此,如图10d所示,垂直方向的平均扫描宽度与水平方向的平均扫描宽度之比大,由于该比值大,能识别图10a文字图像是黑体。
这样,使用图7的构成例作为图1的字体识别部4时,抽出比所定阈值长的扫描线,对于该抽出图像进行字体识别处理,识别字体时,能显著地减少包含在原来图像中的躁音信号等的影响,高精度识别字体成为可能。另外,抽出比所定阈值长的扫描线(水平方向扫描线,垂直方向扫描线)成为仅抽出水平笔划、垂直笔划的粗细,斜笔划影响非常少,因此能精度良好地识别字体。
在上述说明中,图1的字体识别部为图7的构成例时,扫描线抽出部15从文字图像中在水平方向仅仅抽出比预先决定的阈值长的水平方向扫描线,在垂直方向仅仅抽出比预先决定的阈值长的垂直方向扫描线,但是,扫描线抽出部15也可以从文字图像中在水平方向仅仅抽出比与文字尺寸大小成比例而决定的阈值长的水平方向扫描线,在垂直方向仅仅抽出比与文字尺寸大小成比例而决定的阈值长的垂直方向扫描线。这时,扫描宽度频率图处理部11对于从文字图像中在水平方向仅仅抽出比与文字尺寸大小成比例而决定的阈值长的水平方向扫描线图像制作垂直方向的扫描宽度频率图,对于在垂直方向仅仅抽出比与文字尺寸大小成比例而决定的阈值长的垂直方向扫描线图像制作水平方向的扫描宽度频率图。
这种场合也是分别仅仅抽出水平笔划、垂直笔划的粗细,斜笔划影响非常小,而且,最初抽出长扫描线时,采用与文字的尺寸大小成比例决定阈值的方法,即使文字尺寸大小变动也能稳定地抽出扫描线,能精度非常好地识别字体。
在上述例中,作为字体以明朝体、黑体为例作了说明,但是,本发明当然也可识别除了明朝体、黑体以外的其它字体。
这样,在本发明中能精度良好地识别文字图像的文字字体,根据所得的文字字体的识别结果,对于例如再现文书图像将是有用的。
图11表示图1的字体识别装置的硬件构成例,该字体识别装置由例如个人计算机等实现,其包括:控制整体的CPU21,存储CPU21的控制程序等的ROM22,作为CPU21的工作区等使用的RAM23,读入文书作为文书图像的扫描器24,将由扫描器24读入的文书图像以例如页单位存储的文书图像外存储器25,输出对包含在文书图像中的各文字图像进行字体识别的结果情报的结果输出装置(例如显示器、打印机)26。
这里,扫描器24、文书图像外存储器25、结果输出装置26分别与图1的图像输入部1、存储器2、结果输出部6对应。另外,CPU21具有图1的控制部5、文字截取处理部3及字体识别部4的功能。
CPU21中作为控制部5、文字截取处理部3、字体识别部4等的功能可以用例如软件包(具体地说,CD-ROM等的信息记录媒体)的形式提供,因此,在图11的例中,设有信息记录媒体30时,设置驱动其的媒体驱动装置31。
换句话说,本发明的字体识别装置也可以通过在设有图像扫描器、显示器等通用计算机系统中读入记录在CD-ROM等的信息记录媒体上的程序,由该通用计算机系统的微处理器实行字体识别处理。这时,用于实现本发明的字体识别处理的程序(即硬件系统中使用的程序)以记录在媒体上的状态提供。作为记录程序等的信息记录媒体并不限于CD-ROM,也可以使用ROM、RAM、软磁盘、存储卡等。记录在媒体上的程序通过设置在硬件系统中的存储装置例如硬盘装置被实行,可实现本发明的字体识别处理的功能。
另外,用于实现本发明的字体识别处理的程序不仅能以媒体的形式提供,也可以通过通信(例如共用存储装置)提供。
这样,本发明的字体识别处理可通过程序实现,这时,在本发明的字体识别处理中,能以小程序,高速且高精度地识别字体。

Claims (7)

1.一种字体识别装置,它设有:
主处理器,用以执行各种模块处理,
扫描器,用于将打印的汉字转换为数字图像,
扫描器接口卡,用于对扫描器和主处理器提供信据传输装置,
其特征在于:包括扫描宽度频率图处理装置及识别装置,上述扫描宽度频率图处理装置对文字图像制作垂直方向的扫描宽度频率图和水平方向的扫描宽度频率图,从上述垂直方向的扫描宽度频率图求得垂直方向的平均扫描宽度,从上述水平方向的扫描宽度频率图求得水平方向的平均扫描宽度;上述识别装置计算由扫描宽度频率图处理装置所得的垂直方向的平均扫描宽度与水平方向的平均扫描宽度之比作为特征量,根据该特征量,识别文字的字体。
2.根据权利要求1中所述的字体识别装置,其特征在于,上述扫描宽度频率图处理装置将制作扫描宽度频率图时的扫描宽度限定在比预先决定的阈值小的范围,制作垂直方向的扫描宽度频率图和水平方向的扫描宽度频率图,求取垂直方向的平均扫描宽度和水平方向的平均扫描宽度。
3.根据权利要求1中所述的字体识别装置,其特征在于,上述扫描宽度频率图处理装置将制作扫描宽度频率图时的扫描宽度限定在比与文字的尺寸成比例而决定的阈值小的范围,制作垂直方向的扫描宽度频率图和水平方向的扫描宽度频率图,求取垂直方向的平均扫描宽度和水平方向的平均扫描宽度。
4.根据权利要求1中所述的字体识别装置,其特征在于,上述扫描宽度频率图处理装置对于从文字图像在水平方向仅仅提取比预先决定的阈值长的扫描线的图像求得垂直方向的扫描宽度频率图,对于从文字图像在垂直方向仅仅提取比预先决定的阈值长的扫描线的图像求得水平方向的扫描宽度频率图,从垂直方向的扫描宽度频率图求得垂直方向的平均扫描宽度,从水平方向的扫描宽度频率图求得水平方向的平均扫描宽度。
5.根据权利要求1中所述的字体识别装置,其特征在于,上述扫描宽度频率图处理装置对于从文字图像在水平方向仅仅提取比与文字的尺寸成比例而决定的阈值长的扫描线的图像求得垂直方向的扫描宽度频率图,对于从文字图像在垂直方向仅仅提取比与文字的尺寸成比例而决定的阈值长的扫描线的图像求得水平方向的扫描宽度频率图,从垂直方向的扫描宽度频率图求得垂直方向的平均扫描宽度,从水平方向的扫描宽度频率图求得水平方向的平均扫描宽度。
6.一种字体识别方法,其特征在于,对文字图像制作垂直方向的扫描宽度频率图和水平方向的扫描宽度频率图,从上述垂直方向的扫描宽度频率图求得垂直方向的平均扫描宽度,从上述水平方向的扫描宽度频率图求得水平方向的平均扫描宽度,计算垂直方向的平均扫描宽度与水平方向的平均扫描宽度之比作为特征量,根据该特征量,识别文字的字体。
7.一种信息记录媒体,其特征在于,记录下列程序:对文字图像制作垂直方向的扫描宽度频率图和水平方向的扫描宽度频率图,从上述垂直方向的扫描宽度频率图求得垂直方向的平均扫描宽度,从上述水平方向的扫描宽度频率图求得水平方向的平均扫描宽度,计算垂直方向的平均扫描宽度与水平方向的平均扫描宽度之比作为特征量,根据该特征量,识别文字的字体。
CN 97126259 1996-12-24 1997-12-24 字体识别装置、字体识别方法及信息记录媒体 Expired - Fee Related CN1105367C (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP356216/96 1996-12-24
JP356216/1996 1996-12-24
JP8356216A JPH10187887A (ja) 1996-12-24 1996-12-24 書体識別装置および書体識別方法および情報記録媒体

Publications (2)

Publication Number Publication Date
CN1188944A CN1188944A (zh) 1998-07-29
CN1105367C true CN1105367C (zh) 2003-04-09

Family

ID=18447922

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 97126259 Expired - Fee Related CN1105367C (zh) 1996-12-24 1997-12-24 字体识别装置、字体识别方法及信息记录媒体

Country Status (2)

Country Link
JP (1) JPH10187887A (zh)
CN (1) CN1105367C (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100708864B1 (ko) * 2005-12-21 2007-04-17 삼성에스디아이 주식회사 이차전지
CN109784146B (zh) * 2018-12-05 2023-11-07 广州企图腾科技有限公司 一种字体种类识别方法、电子设备、存储介质
CN111339803B (zh) * 2018-12-19 2023-10-24 新方正控股发展有限责任公司 字体识别方法、装置、设备及计算机可读存储介质

Also Published As

Publication number Publication date
CN1188944A (zh) 1998-07-29
JPH10187887A (ja) 1998-07-21

Similar Documents

Publication Publication Date Title
CN110569832B (zh) 基于深度学习注意力机制的文本实时定位识别方法
JP4698289B2 (ja) カメラで取得されたドキュメント用の低解像度のocr
US5452374A (en) Skew detection and correction of a document image representation
US5465304A (en) Segmentation of text, picture and lines of a document image
CN1162803C (zh) 票单类判别装置和方法
Crandall et al. Extraction of special effects caption text events from digital video
US20090074300A1 (en) Automatic adaption of an image recognition system to image capture devices
CN1207924C (zh) 取决于图像的面部检测方法
CN1542656A (zh) 信息处理装置、信息处理方法、存储介质及程序
WO2019200802A1 (zh) 合同影像图片的识别方法、电子装置及可读存储介质
US6473524B1 (en) Optical object recognition method and system
CN1607542A (zh) 图像处理装置和图像处理方法
CN111191649A (zh) 一种识别弯曲多行文本图像的方法与设备
CN1367460A (zh) 字符串识别装置、字符串识别方法及其存储介质
KR101011908B1 (ko) 디지털 이미지의 노이즈 감소 방법 및 이를 이용한 이미지 처리 장치
CN113139535A (zh) 一种ocr文档识别方法
EP0949580B1 (en) Classification-driven thresholding of a normalized grayscale image
CN1368705A (zh) 采用概率密度函数的模式识别装置及其方法
CN1105367C (zh) 字体识别装置、字体识别方法及信息记录媒体
US8768058B2 (en) System for extracting text from a plurality of captured images of a document
CN112560856B (zh) 车牌检测识别方法、装置、设备及存储介质
WO2013177240A1 (en) Textual information extraction method using multiple images
Kavallieratou et al. A slant removal algorithm
CN114267035A (zh) 一种文档图像处理方法、系统、电子设备及可读介质
JPH10162102A (ja) 文字認識装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20030409

Termination date: 20131224