CN101303731B - 印刷线生成方法 - Google Patents

印刷线生成方法 Download PDF

Info

Publication number
CN101303731B
CN101303731B CN2007101069358A CN200710106935A CN101303731B CN 101303731 B CN101303731 B CN 101303731B CN 2007101069358 A CN2007101069358 A CN 2007101069358A CN 200710106935 A CN200710106935 A CN 200710106935A CN 101303731 B CN101303731 B CN 101303731B
Authority
CN
China
Prior art keywords
reference point
straight line
printing
group
those
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2007101069358A
Other languages
English (en)
Other versions
CN101303731A (zh
Inventor
蔡文瀚
吕信德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Compal Electronics Inc
Original Assignee
Compal Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Compal Electronics Inc filed Critical Compal Electronics Inc
Priority to CN2007101069358A priority Critical patent/CN101303731B/zh
Publication of CN101303731A publication Critical patent/CN101303731A/zh
Application granted granted Critical
Publication of CN101303731B publication Critical patent/CN101303731B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)

Abstract

一种印刷线生成方法,此方法是先找出一行印刷文字上缘或下缘的趋近线,接着利用此趋近线找出印刷文字另一缘的两条印刷线,再以这两条印刷线为基准,找出印刷文字这一缘的两条印刷线,最后再利用这些印刷线与印刷文字边缘参考点的关系,删除不必要的印刷线。因此,本发明所求出的印刷线能够提供后续辨识文字方向性、文字大小写及标点符号之用,进而提高文字辨识的效率及正确率。

Description

印刷线生成方法
技术领域
本发明是有关于一种文字辨识方法,且特别是有关于一种英文语系文字的印刷线的生成方法。
背景技术
在资讯爆炸的时代,一般人时常会需要阅读大量的书籍或报章杂志,若看到值得保存的文章段落或是重点时,通常是采用影印或剪辑的方式存档或是直接用笔标记。而对于文字工作者来说,在阅读完一篇文章后,若需要使用里面的资料,就必需藉由重新键入(Key-in)的方式输入到电脑中,才能够对此资料进行编辑或存档的动作,不仅费力且耗时。
为了解决这个问题,目前有业者研发了光学辨识技术,使用者只需藉由一般的扫描器设备,将所欲保存的文件扫描成图档,再利用文字辨识的软件,将此图档中的文字部份撷取出来,并转换成对应的数位字元。提供使用者可以迅速取得文件的电子档,而能够方便地编辑或处理文件。目前的光学辨识技术所运用的领域十分广泛,举凡图书馆文献资料存档、企业内部文件管理,甚至证照、票据的辨识,都可利用此光学辨识技术轻易达成,不仅能精准地辨识资料,更能够省下大量资料比对与查核的人力与时间。
光学文字辨识通常简称为OCR(Optical Character Recognition),其主要用途是针对既有的书面文件进行文字识别的动作。首先文件需先透过平台型或掌上型扫描器,将欲辨识的文件先行扫描成图档。由于在扫描文件时可能会因为文件本身不干净、字元模糊,或是扫描器解析度的问题,使得输入的影像可能存在着一些杂讯,这些杂讯都会影响到后续文字辨识的准确率。因此,光学文字辨识软件会先针对扫描的文件图档进行倾斜校正、杂讯移除、影像边缘锐利化等处理。接着,光学文字辨识软件会对处理后的图档进行图文分离的动作,将文件中所有的文字、图形和表格分离,并且针对部份文字笔划不连接的情形,正确地切割或合并文字。然后,光学文字辨识软件将进行文件辨识的动作,利用将文字图像拿来与文字资料库比对,并同时透过中文校正的功能,进行词库、前后文相关字词的确认后,最后输出精准的辨识的结果。辨识出来的文字可直接存成Word、PDF、纯文字格式的档案,如此不但可减轻资料输入的负担,同时也可增加资料输入的速度及正确性。
然而,现行的光学文字辨识软件仍存在着许多问题,这些问题时常会造成文字辨识错误或无法辨识,而造成使用者的困扰。举例来说,在扫描文件时可能会因为文件摆放不正,而造成扫描的图档倾斜、倒置(横向移动)或是比例失真(纵向移动),或者是因为字元的字型大小不同但形状相同,而造成无法辨识大小写,以及标点符号字型小不易辨识等情形。
发明内容
有鉴于此,本发明的目的就是在提供一种印刷线生成方法,藉由找出一行印刷文字的多条印刷线,而能够提供后续辨识文字时,判断文字方向性、文字大小写及标点符号、校正文字影像倾斜之用。
为达上述或其他目的,本发明提出一种印刷线生成方法,此方法适用于产生一行印刷文字的多条印刷线,其中这行印刷文字中包括多个印刷字元,此方法包括下列步骤:a.扫描一行印刷文字,并标记这行印刷文字中各个印刷字元的第一边缘及第二边缘;b.分别撷取各个印刷字元的第一边缘的一个第一边缘参考点及第二边缘的一个第二边缘参考点;c.利用最小平方法(least square),求取这些第一边缘参考点所趋近的第一直线;d.以此第一直线作为第一基准线,计算各个第二边缘参考点与此第一基准线之间的垂直距离;e.根据各个第二边缘参考点所算出的垂直距离,利用一种群聚演算法将这些第二边缘参考点区分为第一群及第二群;f.利用最小平方法,分别求取此第一群及第二群的第二边缘参考点所趋近的第二直线及第三直线;g.以此第一群及第二群中参考点数目最多者所对应求出的第二直线或第三直线作为第二基准线,计算各个第一边缘参考点与此第二基准线之间的垂直距离;h.根据各个第一边缘参考点所算出的垂直距离,利用群聚演算法将这些第一边缘参考点区分为第三群及第四群;i.利用最小平方法,分别求取此第三群及第四群的第一边缘参考点所趋近的第四直线及第五直线;以及j.以第二直线、第三直线、第四直线及第五直线作为此行印刷文字的印刷线。
在本发明的一实施例中,上述的步骤a.之后更包括:a1.辨识并调整此行印刷文字的一主方向,其中此主方向包括水平方向及垂直方向其中之一。
在本发明的一实施例中,上述的步骤a.之后更包括:a2.分别计算各个印刷字元的字元高度;a3.将各个印刷字元的字元高度与一个预设高度值比较,而将字元高度小于此预设高度值的印刷字元归类为小字元。
在本发明的一实施例中,上述的步骤a3.之后更包括:a4.分别撷取剩余的各个印刷字元中心的中心参考点;a5.利用最小平方法,求取这些中心参考点所趋近的中心线;a6.判断各个印刷字元的下缘是否位于此中心线的上方,而将下缘位于中心线的上方的印刷字元归类为小字元;以及a7.判断各个印刷字元的上缘是否位于此中心线的下方,而将上缘位于中心线的下方的印刷字元归类为小字元。
在本发明的一实施例中,上述的小字元不列入后续生成印刷线的参考。
在本发明的一实施例中,上述的步骤f.包括先判断第一群或第二群所包含的第二边缘参考点的数目是否为1,若第一群的数目为1,则将第二群的第二边缘参考点所趋近的第三直线平移至第一群的第二边缘参考点做为第二直线;若第二群的数目为1,则将第一群的第二边缘参考点所趋近的第二直线平移至第二群的第二边缘参考点做为第三直线。
在本发明的一实施例中,上述的步骤i.包括先判断第三群或第四群所包含的第一边缘参考点的数目是否为1,若第三群的数目为1,则将第四群的第一边缘参考点所趋近的第五直线平移至第三群的第一边缘参考点做为第四直线;若第四群的数目为1,则将第三群的第一边缘参考点所趋近的第四直线平移至第四群的第一边缘参考点做为第五直线。
在本发明的一实施例中,其中以印刷文字的一中心线为基准,第二直线位于第三直线的外侧,而第五直线位于第四直线的外侧。
在本发明的一实施例中,上述的步骤i.之后更包括:i1.计算第二直线与第三直线之间的第一区间距离、第三直线与第四直线之间的第二区间距离,以及第四直线与第五直线之间的第三区间距离;i2.计算第一群、第二群、第三群及第四群所包含的第一参考点数目、第二参考点数目、第三参考点数目及第四参考点数目;i3.若该第一区间距离小于一基准值,同时该第一参考点数目大于该第二参考点数目时,将该第三直线删除;以及i4.若该第三区间距离小于一基准值,且该第四参考点数目大于该第三参考点数目时,将该第四直线删除。
在本发明的一实施例中,更包括:k.计算第二直线与第三直线之间的第一连接区块数目,以及第四直线与第五直线之间的第二连接区块数目;1.若此第一连接区块数目大于第二连接区块数目,则判断此行印刷文字为正立;反之,m.若此第一连接区块数目小于第二连接区块数目,则判断此行印刷文字为倒立。在本发明的一实施例中,上述的第一边缘及第二边缘分别为印刷字元的上缘及下缘或分别为该些印刷字元的一下缘及一上缘,而各个印刷字元的第一边缘参考点及第二边缘参考点包括各个印刷字元的第一边缘及第二边缘的中点及端点其中之一。
在本发明的一实施例中,上述的群聚演算法包括K平均(K-Mean)演算法。
本发明先找出一行印刷文字上缘或下缘的趋近线,接着利用此趋近线找出印刷文字另一缘的两条印刷线,再以这两条印刷线为基准,找出印刷文字这一缘的两条印刷线,最后再利用这些印刷线与印刷文字边缘参考点的关系,删除不必要的印刷线,而能够提供后续辨识文字方向性、文字大小写及标点符号之用,提高文字辨识的效率及正确率。
为让本发明的上述和其他目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附图式,作详细说明如下。
附图说明
图1是依照本发明较佳实施例所绘示的印刷线示意图。
图2是依照本发明较佳实施例所绘示的小字元判断方法流程图。
图3是依照本发明较佳实施例所绘示的印刷线生成方法流程图。
图4是依照本发明较佳实施例所绘示的印刷线生成方法的一个范例。
图5是依照本发明较佳实施例所绘示的印刷线删除方法的流程图。
图6是依照本发明较佳实施例所绘示的辨识文字方向性的方法流程图。
401-405:第一边缘参考点
406-410:第二边缘参考点
400:第一直线
420:第二直线
430:第三直线
440:第四直线
450:第五直线
S201-S207:本发明较佳实施例的小字元判断方法的各步骤
S301-S313:本发明较佳实施例的印刷线生成方法的各步骤
S501-S506:本发明较佳实施例的印刷线删除方法的各步骤
S601-S604:本发明较佳实施例的辨识文字方向性的方法的各步骤
具体实施方式
通常在撰写英文语系的文字时,依照其字型的特性,都会依循着一定的轨迹调整或排列书写文字的大小及位置,这些隐藏的”参考线”就类似当初在学习书写这些文字时,写字本上所列印的四条直线,使用者只要依照这些直线书写文字,就能够写出整齐、清楚的文章。同样地,这些英文语系的文字在列印时也会遵循着这些参考线,这些参考线也就是本文所谓的印刷线。
图1是依照本发明较佳实施例所绘示的印刷线示意图。请参照图1,本实施例依照印刷文字”typeface analysis”中各个印刷字元的字型,定义出四条印刷线,这些印刷线依其所在位置可区分为顶线(top line)、上层线(upper line)、基线(base line)及底线(bottom line),而这些印刷线之间的区域则可分为上层区(upper zone)、中间区(central zone)及下层区(lower zone)。值得注意的是,图1中每个印刷字元都可视为是由多个互相连接的区块(connect-component,CC)所构成,而这些连接在一起的区块则称为CC群。
通常一份文件在经过扫描后,即可取得其中所有文字及图型的影像,此时再利用图文分离技术即可找出影像中所有可能的CC群,这些CC群可能是印刷字元,也可能是杂讯,而由于这些杂讯或标点符号等小CC群对本发明后续产生印刷线的步骤来说没有助益,因此本发明即包括先将扫描影像中可能不是字母的CC群滤除。
图2是依照本发明较佳实施例所绘示的小字元判断方法流程图。请参照图2,本实施例在扫描完一行印刷文字后,找出其中较小或位置较偏的印刷字元。而藉由将这些印刷字元剔除后,而能够增加本发明后续判断印刷线的准确性。
首先,扫描影像中的每个印刷字元会先被标记一个外框,此外框包括印刷字元的上、下、左、右等四个边缘,此时就可根据这些标记的外框,计算出每个印刷字元的字元高度(步骤S201)。
这些印刷字元的字元高度则接着拿来和一个预设高度值比较,而判断出各个印刷字元的字元高度是否小于此预设高度值(步骤S202)。此预设高度值例如是所有印刷字元的字元高度平均值的一半,在此不限定其范围。
其中,若印刷字元的字元高度小于预设高度值,则可将此印刷字元归类为小字元(步骤S207)。在剔除字元高度较小的印刷字元后,下一步则分别撷取剩余的各个印刷字元的一个中心参考点(步骤S203),并利用最小平方法(least square),求取这些中心参考点所趋近的一条中心线(步骤S204),而使各个印刷字元的中心参考点距离此中心线的总和为最小。
在中心线定义出来后,接着即可用来判断剩余的印刷字元中是否还存在着小字元。其中例如先判断印刷字元的下缘是否位于中心线的上方(步骤S205),若为真则将此印刷字元归类为小字元(步骤S207);否则就继续判断印刷字元的上缘是否位于中心线的下方(步骤S206),若为真则将此印刷字元归类为小字元(步骤S207)。简单来说,本实施例的目的就是要找出不会通过中心线的印刷字元,这些印刷字元可能是杂讯或是标点符号,其外型往往比实际的字母小,也通常不会印在中心线上。据此,本发明将这些小字元剔除而不列入后续生成该些印刷线的参考,避免其影响到后续生成印刷线的准确度。
值得一提的是,在本实施例判断小字元之初,可先根据扫描影像中CC群的分布,辨识并调整此行印刷文字的主方向,此主方向例如是水平方向(即0度或180度)或垂直方向(90度或270度),此步骤能够区分出文件是直放或横放,从而调整后续进行文字辨识的方向。
在清除了可能的杂讯及标点符号等小字元之后,即可开始进行本发明的印刷线生成方法的主要步骤。图3是依照本发明较佳实施例所绘示的印刷线生成方法流程图。请先参照图3,本实施例用以生成一行印刷文字的多条印刷线,其中此行印刷文字则包括有多个印刷字元。然而,在实际的应用中,本发明也包括可应用在辨识多行印刷文字或是一整编文章的印刷线,而不限制其范围,以下仅以一行印刷文字来举例说明本发明的印刷线生成方法的详细步骤。
首先,本实施例在一行印刷文字扫描完成后,即标记此行印刷文字中各个印刷字元的第一边缘及第二边缘(步骤S301)。其中,此第一边缘及第二边缘例如是印刷字元的上缘及下缘,或者是刚好相反,两种情况皆适用,。
下一步则是分别撷取各个印刷字元的第一边缘的一个第一边缘参考点及第二边缘的一个第二边缘参考点(步骤S302)。这些第一边缘参考点及第二边缘参考点例如是各各个印刷字元的第一边缘及第二边缘的中点或是端点,而这些参考点在影像中的座标值将可先记录到一个记忆体阵列中,待稍后计算有需要时再拿出来使用。
接着则可利用最小平方法,求取第一边缘参考点所趋近的第一直线(步骤S303)。这个第一直线则被当作第一基准线,用以计算各个第二边缘参考点与第一基准线之间的垂直距离(步骤S304)。
然后,根据这些第二边缘参考点所对应的垂直距离,可利用一种群聚演算法将这些第二边缘参考点区分为两群,包括第一群及第二群(步骤S305)。其中,此群聚演算法例如是K平均(K-Mean)演算法,而在此演算法中,每个群集各有一个群聚中心,而此群聚中心的特性则是该群集的所有成员至群聚中心的距离和为最小值。举例来说,若第一群的资料为3、3、4、3、2、3,群聚中心为3,而所有的距离和为|3-3|+|3-3|+|4-3|+|3-3|+|2-3|+|3-3|=2为此群集中的最小值。同理,若第二群的资料为5、5、6、5、4、5,群聚中心为5,而所有的距离和为|5-5|+|5-5|+|6-5|+|5-5|+|4-5|+|5-5|=2为最小。
在将第二边缘参考点分群过后,即可利用上述最小平方法,分别求取此第一群及第二群的第二边缘参考点所趋近的第二直线及第三直线(步骤S306)。在此步骤中,若第一群及第二群的参考点个数都是两个以上,则可分别求出对应的趋近线。然而,若其中一群的参考点个数只有1个时,则必须采用其它做法求出趋近线。若是第一群的参考点数目为1时,则将第二群的第二边缘参考点所趋近的第三直线平行移动到第一群的唯一一个第二边缘参考点上,而将此平行的直线当做第二直线;同理,若是第二群的参考点数目为1时,则将第一群的第二边缘参考点所趋近的第二直线平行移动到第二群的唯一一个第二边缘参考点上,而将此平行的直线当做第三直线。
下一步则是比较第一群及第二群所包含的参考点的个数,而判断第一群的参考点的数目是否大于第二群(步骤S307)。若为大于,则以第二直线作为第二基准线(步骤S308);否则,则以第三直线作为第二基准线(步骤S309)。然后就可计算各个第一边缘参考点与此第二基准线之间的垂直距离(步骤S310)。
根据这些垂直距离的资料,即可采用上述的群聚演算法将第一边缘参考点区分为第三群及第四群(步骤S311),并同样利用最小平方法,分别求取第三群及第四群的第一边缘参考点所趋近的第四直线及第五直线(步骤S312)。最后,则可将上述求出的第二直线、第三直线、第四直线及第五直线等4条直线拿来作为印刷文字的印刷线步骤S313)。这些印刷线可清楚划分出一行印刷文字的上、中、下等三个区域,而能够提供后续辨别辨识文字方向性、文字大小写及标点符号之用,提高文字辨识的效率及正确率。为了使本发明的方法更清楚明了,以下则举一个实际应用的例子,说明上述生成印刷线的详细步骤。
图4是依照本发明较佳实施例所绘示的印刷线生成方法的一个范例。请参照图4,本实施例以一个简单的”Super”印刷文字为例,逐步找出其所对应的四条印刷线。
请先参照图4(a),首先,在将”Super”扫描成影像后,即可标记此”Super”中每个印刷字元的4个边缘,而在后续的步骤中,将会使用到其中的上缘及下缘部份。接着,就可取各个印刷字元下缘的虚线的中点做为第一边缘参考点406-410,以及取各个印刷字元上缘的虚线的中点做为第二边缘参考点401-405。
接着请参照图4(b),在参考点标示过后,则先取用第一边缘参考点406-410,利用最小平方法,求取第一边缘参考点406-410所趋近的第一直线400,这个第一直线400则接着被当作第一基准线,拿来计算印刷字元上缘各个第二边缘参考点401-405与第一基准线之间的垂直距离。
请继续参照图4(c),根据这些第二边缘参考点406-410所对应的垂直距离,则可利用前述实施例的群聚演算法将这些第二边缘参考点406-410区分为第一群及第二群两群,再利用最小平方法,分别求取此第一群及第二群的第二边缘参考点406-410所趋近的第二直线420及第三直线430。如图4(c)所示,其中第二边缘参考点401自成一群,而第二边缘参考点402-405则为另一群。值得注意的是,由于第二边缘参考点401的那一群只包括一个参考点,故无法自行产生趋近线,而必需仰赖其余的趋近线来推知。也就是说,可先求出第二边缘参考点402-405所趋近的第三直线403,而以平行位移的方式移动到第二边缘参考点401上,而将此平行第三直线403的直线当做第二直线402。
请继续参照图4(d),比较第一群及第二群所包含的参考点的个数可知,第二群所包括的参考点的个数较多,因此就以第三直线403为第二基准线,计算各个第一边缘参考点406-410与第二基准线之间的垂直距离。
请继续参照图4(e),根据这些第一边缘参考点406-410所对应的垂直距离,同样利用群聚演算法将这些第一边缘参考点406-410区分为第三群及第四群两群,再利用最小平方法,分别求取此第三群及第四群的第一边缘参考点406-410所趋近的第四直线440及第五直线450。至此,即可以第二直线420、第三直线430、第四直线440及第五直线450做为印刷文字”Super”的四条印刷线。
值得注意的是,在某些情况下(例如印刷文字全都是大写)分群后两群的群聚中心非常接近,因此所求出的趋近线也会非常接近甚至重迭,此时再分成两条也没有意义,因此可将其中一条删除,取一条代表即可。
图5是依照本发明较佳实施例所绘示的印刷线删除方法的流程图。请参照图5,本实施例延续上述印刷线生成方法的实施例,在求出印刷文字的四条印刷线后,可根据印刷线之间的距离及所代表的参考点数目,决定是否删除一条或两条印刷线。也就是说,采用本实施例的印刷线删除方法筛选完印刷线后,可能最后会产生两条、三条或四条印刷线等三种可能。
本实施例是以印刷文字的一中心线为基准,假设第二直线是位于第三直线的外侧,而第五直线则是位于第四直线的外侧。首先,分别计算第二直线与第三直线之间的第一区间距离、第三直线与第四直线之间的第二区间距离,以及第四直线与第五直线之间的第三区间距离(步骤S501)。其中,这些区间距离的计算方式例如是取两条直线之间最短的距离,这两条直线的线段仅止于印刷文字的左右两端,因此即使两条直线不平行,也不会有重迭的情况产生,一定可以找到一个最小值。当然,本实施例也不限定于这种作法,使用者也可求两条直线中点之间的距离做为区间距离。
下一步则是计算第一群、第二群、第三群及第四群所包含的第一参考点数目、第二参考点数目、第三参考点数目及第四参考点数目(步骤S502)。而在上述区间距离及参考点数目决定后,这些资讯就可以用来决定是否删除上述直线。
其中,可先判断是否第一区间距离小于基准值,且第一参考点数目大于第二参考点数目(步骤S503)。若为真,则代表第二直线与第三直线相近,而且较外侧的第二直线所通过的参考点个数较多,因此可以将第三直线改成第二直线,也可视为是将第三直线删除(步骤S504);否则就继续判断是否第三区间距离小于基准值,且第四参考点数目大于第三参考点数目(步骤S505)。若为真,则代表第四直线与第五直线相近,而且较外侧的第五直线所通过的参考点个数较多,因此可以将第四直线改成第五直线,也可视为是将第四直线删除(步骤S506)。上述的基准值例如是第二区间(即中间区)距离的0.4倍,但不限定其范围。
在经由上述生成、删除印刷线的步骤后,即可取得所需的两条、三条或四条印刷线,这些印刷线则可用来做为后续辨识文字方向性、文字大小写及标点符号之用,以下仅就辨识文字方向性的部份举例说明。
图6是依照本发明较佳实施例所绘示的辨识文字方向性的方法流程图。请参照图6,本实施例接续在上述印刷线生成方法的实施例之后,用以判断扫描的印刷文字是正立还是倒立的。
根据统计,在一行印刷文字中,上层区(请参照图1)所包括的连接区块数目(即CC群数目)会大于下层区所包括的连接区块数目,因此只要比较这两个区域的连接区块数目就可判别此印刷文字是为正立还是倒立。
本实施例同样假设第二直线是位于第三直线的外侧,而第五直线则是位于第四直线的外侧。首先,计算该第二直线与该第三直线之间的一第一连接区块数目,以及该第四直线与该第五直线之间的一第二连接区块数目(步骤S601)。
接着则判断第一连接区块的数目是否大于第二连接区块的数目(步骤S602)。若为真,则可判定此印刷文字为正立(步骤S603);反之,则可判定此印刷文字为倒立(步骤S604)。
综上所述,本发明的印刷线生成方法至少具有下列优点:
1.可求得精确的印刷线,因此可分析出文件的角度,而进行角度校正,提高后续文件处理的效率及正确性。
2.不必计算文字影像的投影量,可有效降低杂讯的干扰。
3.按照文字的特性求出不同数目的印刷线,且两两印刷线之间不必平行,可以因应印刷文字扭曲或大小不一等情况做适当的调整。
4.统计上下层区域中的连接区块数目,方便判断出印刷文字是否为正立或倒立。
以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,虽然本发明已以较佳实施例揭露如上,然而并非用以限定本发明,任何熟悉本专业的技术人员,在不脱离本发明技术方案范围内,当可利用上述揭示的技术内容作出些许更动或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本发明技术方案的范围内。

Claims (14)

1.一种印刷线生成方法,适于生成一行印刷文字的多条印刷线,其中该行印刷文字包括多个印刷字元,其特征在于该印刷线生成方法包括下列步骤:
a.扫描该行印刷文字,并标记该行印刷文字中各该些印刷字元的一第一边缘及一第二边缘;
b.分别撷取各该些印刷字元的该第一边缘的一第一边缘参考点及该第二边缘的一第二边缘参考点;
c.利用一最小平方法,求取该些第一边缘参考点所趋近的一第一直线;
d.以该第一直线作为一第一基准线,计算各该些第二边缘参考点与该第一基准线之间的一垂直距离;
e.根据该些垂直距离,利用一群聚演算法将该些第二边缘参考点区分为一第一群及一第二群;
f.利用该最小平方法,分别求取该第一群及该第二群的该些第二边缘参考点所趋近的一第二直线及一第三直线;
g.以该第一群及该第二群中参考点数目最多者所对应求出的该第二直线或该第三直线作为一第二基准线,计算各该些第一边缘参考点与该第二基准线之间的该垂直距离;
h.根据该些垂直距离,利用该群聚演算法将该些第一边缘参考点区分为一第三群及一第四群;
i.利用该最小平方法,分别求取该第三群及该第四群的该些第一边缘参考点所趋近的一第四直线及一第五直线;以及
j.以该第二直线、该第三直线、该第四直线及该第五直线作为该行印刷文字的该些印刷线。
2.根据权利要求1所述的印刷线生成方法,其特征在于其中在步骤a.之后更包括:
a1.辨识并调整该行印刷文字的一主方向。
3.根据权利要求2所述的印刷线生成方法,其特征在于其中该主方向包括水平方向及垂直方向其中之一。
4.根据权利要求1所述的印刷线生成方法,其特征在于其中在步骤a.之后更包括:
a2.分别计算各该些印刷字元的一字元高度;
a3.将各该些印刷字元的该字元高度与一预设高度值比较,而将该字元高度小于该预设高度值的该些印刷字元归类为多个小字元。
5.根据权利要求4所述的印刷线生成方法,其特征在于其中在步骤a3.之后更包括:
a4.分别撷取剩余的各该些印刷字元中心的一中心参考点;
a5.利用该最小平方法,求取该些中心参考点所趋近的一中心线;
a6.判断各该些印刷字元的一下缘是否位于该中心线的上方,而将该下缘位于该中心线的上方的该些印刷字元归类为该些小字元;以及
a7.判断各该些印刷字元的一上缘是否位于该中心线的下方,而将该上缘位于该中心线的下方的该些印刷字元归类为该些小字元。
6.根据权利要求5所述的印刷线生成方法,其特征在于其中该些小字元不列入后续生成该些印刷线的参考。
7.根据权利要求1所述的印刷线生成方法,其特征在于其中该步骤f.包括:
判断该第一群或该第二群所包含的该些第二边缘参考点的数目是否为1;
若该第一群的数目为1,则将该第二群的该些第二边缘参考点所趋近的该第三直线平移至该第一群的该第二边缘参考点做为该第二直线;以及
若该第二群的数目为1,则将该第一群的该些第二边缘参考点所趋近的该第二直线平移至该第二群的该第二边缘参考点做为该第三直线。
8.根据权利要求1所述的印刷线生成方法,其特征在于其中该步骤i.包括:
判断该第三群或该第四群所包含的该些第一边缘参考点的数目是否为1;
若该第三群的数目为1,则将该第四群的该些第一边缘参考点所趋近的该第五直线平移至该第三群的该第一边缘参考点做为该第四直线;以及
若该第四群的数目为1,则将该第三群的该些第一边缘参考点所趋近的该第四直线平移至该第四群的该第一边缘参考点做为该第五直线。
9.根据权利要求1所述的印刷线生成方法,其特征在于其中以该行印刷文字的一中心线为基准,该第二直线位于该第三直线的外侧,而该第五直线位于该第四直线的外侧。
10.根据权利要求9所述的印刷线生成方法,其特征在于其中该步骤i.之后更包括:
i1.计算该第二直线与该第三直线之间的一第一区间距离、该第三直线与该第四直线之间的一第二区间距离,以及该第四直线与该第五直线之间的一第三区间距离;
i2.计算该第一群、该第二群、该第三群及该第四群所包含的一第一参考点数目、一第二参考点数目、一第三参考点数目及一第四参考点数目;以及
i3.若该第一区间距离小于一基准值,同时该第一参考点数目大于该第二参考点数目时,将该第三直线删除;以及
i4.若该第三区间距离小于一基准值,且该第四参考点数目大于该第三参考点数目时,将该第四直线删除。
11.根据权利要求10所述的印刷线生成方法,其特征在于其中在该步骤j之后更包括:
k.计算该第二直线与该第三直线之间的一第一连接区块数目,以及该第四直线与该第五直线之间的一第二连接区块数目;
l.若该第一连接区块数目大于该第二连接区块数目,则判断该行印刷文字为正立;以及
m.若该第一连接区块数目小于该第二连接区块数目,则判断该行印刷文字为倒立。
12.根据权利要求1所述的印刷线生成方法,其特征在于其中该第一边缘及该第二边缘分别为该些印刷字元的一上缘及一下缘或分别为该些印刷字元的一下缘及一上缘。
13.根据权利要求1所述的印刷线生成方法,其特征在于其中各该些印刷字元的该第一边缘参考点及该第二边缘参考点包括各该些印刷字元的该第一边缘及该第二边缘的中点及端点其中之一。
14.根据权利要求1所述的印刷线生成方法,其特征在于其中该群聚演算法包括K平均演算法。
CN2007101069358A 2007-05-09 2007-05-09 印刷线生成方法 Expired - Fee Related CN101303731B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2007101069358A CN101303731B (zh) 2007-05-09 2007-05-09 印刷线生成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2007101069358A CN101303731B (zh) 2007-05-09 2007-05-09 印刷线生成方法

Publications (2)

Publication Number Publication Date
CN101303731A CN101303731A (zh) 2008-11-12
CN101303731B true CN101303731B (zh) 2010-09-01

Family

ID=40113630

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007101069358A Expired - Fee Related CN101303731B (zh) 2007-05-09 2007-05-09 印刷线生成方法

Country Status (1)

Country Link
CN (1) CN101303731B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5073955A (en) * 1989-06-16 1991-12-17 Siemens Aktiengesellschaft Method for recognizing previously localized characters present in digital gray tone images, particularly for recognizing characters struck into metal surfaces
JP2000043356A (ja) * 1998-07-28 2000-02-15 Hitachi Ltd 紙葉類印字装置
CN1338671A (zh) * 2001-09-26 2002-03-06 倚天资讯股份有限公司 集手写辨识输入与虚拟键盘式输入为一体的输入装置
CN1084503C (zh) * 1996-04-09 2002-05-08 财团法人工业技术研究院 文书辨识的切字错误自动更正方法及装置
CN1266643C (zh) * 2004-11-12 2006-07-26 清华大学 基于阿拉伯字符集的印刷体字符识别方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5073955A (en) * 1989-06-16 1991-12-17 Siemens Aktiengesellschaft Method for recognizing previously localized characters present in digital gray tone images, particularly for recognizing characters struck into metal surfaces
CN1084503C (zh) * 1996-04-09 2002-05-08 财团法人工业技术研究院 文书辨识的切字错误自动更正方法及装置
JP2000043356A (ja) * 1998-07-28 2000-02-15 Hitachi Ltd 紙葉類印字装置
CN1338671A (zh) * 2001-09-26 2002-03-06 倚天资讯股份有限公司 集手写辨识输入与虚拟键盘式输入为一体的输入装置
CN1266643C (zh) * 2004-11-12 2006-07-26 清华大学 基于阿拉伯字符集的印刷体字符识别方法

Also Published As

Publication number Publication date
CN101303731A (zh) 2008-11-12

Similar Documents

Publication Publication Date Title
US5926565A (en) Computer method for processing records with images and multiple fonts
JP5073022B2 (ja) カメラで取得されたドキュメント用の低解像度のocr
Aradhye A generic method for determining up/down orientation of text in roman and non-roman scripts
JP3088019B2 (ja) 媒体処理装置及び媒体処理方法
JP3962891B2 (ja) 文書画像処理装置、文書画像処理方法、及び記憶媒体
JP3345224B2 (ja) パターン抽出装置、パターン再認識用テーブル作成装置及びパターン認識装置
US6917708B2 (en) Handwriting recognition by word separation into silhouette bar codes and other feature extraction
US8208726B2 (en) Method and system for optical character recognition using image clustering
CN101326518A (zh) 用于墨水笔记的手写体识别
US11715318B2 (en) Systems and methods for spatial-aware information extraction from electronic source documents
JP2016071898A (ja) 帳票認識装置、帳票認識システム、帳票認識システムのプログラム、帳票認識システムの制御方法、帳票認識システムプログラムを搭載した記録媒体
US7929772B2 (en) Method for generating typographical line
CN108052936B (zh) 一种盲文图像自动倾斜校正方法及系统
JPS63182793A (ja) 文字切り出し方式
CN107958261B (zh) 一种盲文点检测方法及系统
StevensÝ et al. Automatic processing of document annotations
CN108062548B (zh) 一种盲文方自适应定位方法及系统
CN101303731B (zh) 印刷线生成方法
JP4356908B2 (ja) 財務諸表自動入力装置
JP2006252575A (ja) 財務諸表自動入力装置及び財務諸表自動入力方法
JP3463008B2 (ja) 媒体処理方法及び媒体処理装置
CN107886808B (zh) 一种盲文方辅助标注方法及系统
JPH04352295A (ja) 文字列方向判別装置
Krisnadi et al. A multiple-choice test recognition system based on android and RBFNN
CN101311946B (zh) 文字辨识方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20100901

Termination date: 20140509