CN1955981A - 字符识别装置、字符识别方法、以及字符数据 - Google Patents

字符识别装置、字符识别方法、以及字符数据 Download PDF

Info

Publication number
CN1955981A
CN1955981A CN 200610142562 CN200610142562A CN1955981A CN 1955981 A CN1955981 A CN 1955981A CN 200610142562 CN200610142562 CN 200610142562 CN 200610142562 A CN200610142562 A CN 200610142562A CN 1955981 A CN1955981 A CN 1955981A
Authority
CN
China
Prior art keywords
character
data
pixel
font
font size
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 200610142562
Other languages
English (en)
Other versions
CN100568265C (zh
Inventor
鲤沼敦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Publication of CN1955981A publication Critical patent/CN1955981A/zh
Application granted granted Critical
Publication of CN100568265C publication Critical patent/CN100568265C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Discrimination (AREA)
  • Character Input (AREA)

Abstract

公开了一种用来识别通过以光学方式扫描原件而获得的图像数据中的字符的技术。确定所扫描的字符的字体类型与字体大小。通过比较具有所确定的字体类型与字体大小的、包括与对应于字符的字符代码相关联地存储的字体类型与字体大小的字符数据,识别对应于所扫描字符的字符代码。

Description

字符识别装置、字符识别方法、以及字符数据
技术领域
本发明涉及从光学扫描的文件的图像数据中识别字符的字符识别装置与字符识别方法、以及用于字符识别的字符数据。
背景技术
存在常规字符识别技术,用来数字化在利用字处理器准备的原始文件的上打印的字符,并且在诸如计算机等信息处理装备中利用这些数字化的字符。具体地,通过利用图像扫描器等等读取原件来识别字符,将所识别的字符转换为拉丁字母字符、数字、日语双字节字符(平假名、日本汉字等等)等等的字符代码,并且保存字符代码。
在常规字符识别装置中,平均多种典型字体(gothic(哥特体)、minchou(明朝体)、serif(衬线)、sans-serif(无衬线)、单间距等等)的特征量,以创建识别字典,其包括用于识别字符的字符模式。但是,无法通过创建具有平均特征量的字符模式以足够的精度识别字符。
相应地,人们已经提出了以下字符识别技术:对于每种字体类型创建识别字典(例如参见专利文件1)。该技术涉及:检测在字处理器中包含的字体类型,并且为每种字体类型的每个字符创建参照模式,并且在识别字典中登记这些参照模式。所登记的参照模式用于识别扫描器等等读取的图像数据中的字符。
人们还提出另一种字符识别技术:抽取扫描器等等读取的图像数据中的字符形状的特征量,计算所抽取的特征量与各种字体类型的预定特征量之间的相似性,并且根据所计算的相似性识别字体类型(例如参见专利文件2)。在这一技术中,对于每种字体类型,字符轮廓线(profile line)信息是预定的。一旦识别了字体类型,就根据字符的轮廓线信息,纠正图像数据中字符的形状。然后存储或显示纠正后的字符。相应地,只有通过识别字体类型,才能避免错误识别字符,而不用进行字符识别。
专利文件1:日本公开专利申请第2002-27935号
专利文件2:日本公开专利申请第H8-123904号
但是,在专利文件1公开的字符识别方法中,虽然为每种字体类型都登记参照模式,但是不能以足够的精度识别字符。这是因为用来识别字符的特征量是不规则的。专利文件1中描述的特征量包括:字符线倾角、环的数目、线宽度、以及字符面积的那些特征量。但是,在某些情况下,单单这些不足以识别字符。如果为了提高识别率而增加特征量,则识别速度会下降。
另外,在专利文件2中,字符被保存为轮廓线信息。由此,可以与原纸件中相同的形状获取字符。但是,所获取的字符信息不是字符代码,由此难于在字处理软件等等中进行再处理。
发明内容
本发明提供了字符识别装置、字符识别方法、以及字符数据,其中消除了上述缺点中的一或多个。
本发明的优选实施例提供了用于字符识别的字符识别装置、字符识别方法、以及字符数据,利用其可以高精度与高速度识别字符。
本发明的一个实施例提供了一种字符识别装置,用来识别通过以光学方式扫描原件而获得的图像数据中的字符,该装置包括:字体类型确定单元,被配置来确定所扫描的字符的字体类型;字体大小确定单元,被配置来确定所扫描的字符的字体大小;存储器,用来存储用于识别对应于所扫描字符的字符代码的字符数据,该字符数据包括与对应于字符的字符代码相关联地存储的字体类型与字体大小;以及字符识别单元,被配置来通过比较具有字体类型确定单元所确定的字体类型、以及字体大小确定单元所确定的字体大小的字符数据,识别对应于所扫描字符的字符代码。
本发明的一个实施例提供了一种用于识别通过以光学方式扫描原件而获得的图像数据中的所扫描字符的字符数据,该字符数据包括与对应于字符的字符代码相关联地存储的字体类型与字体大小,其中所扫描字符由被分为预定数目的像素的位图数据表示,并且字符数据包括每个字符的、按字符预定方向逐行计数的、在像素行中首先出现的黑像素的数目。
本发明的一个实施例提供了一种用于识别通过以光学方式扫描原件而获得的图像数据中的所扫描字符的字符数据,该字符数据包括与对应于字符的字符代码相关联地存储的字体类型与字体大小,其中所扫描字符由被分为预定数目的像素的位图数据表示,并且字符数据对应于每个字符的、包括关于每个像素为黑还是白的信息的像素字符数据。
本发明的一个实施例提供了一种用于识别通过以光学方式扫描原件而获得的图像数据中的所扫描字符的字符数据,该字符数据包括与对应于字符的字符代码相关联地存储的字体类型与字体大小,其中所扫描字符由被分为预定数目的像素的位图数据表示,并且字符数据包括每个字符中的多个像素对之间的多个距离。
本发明的一个实施例提供了一种字符识别方法,用来识别通过以光学方式扫描原件而获得的图像数据中的字符,该方法包括以下步骤:(a)确定所扫描的字符的字体类型;(b)确定所扫描的字符的字体大小;(c)通过比较具有步骤(a)所确定的字体类型、以及步骤(b)所确定的字体大小的、包括与对应于字符的字符代码相关联地存储的字体类型与字体大小的字符数据,识别对应于所扫描字符的字符代码。
根据本发明的一个实施例,提供了可以利用其以高精度与高速度识别字符的字符识别装置、字符识别方法、以及用于字符识别的字符数据。
附图说明
从以下参照附图的详细描述中,可以清楚本发明的其他目的、特征、以及优点,其中
图1为包含字符识别装置的字符识别系统的总体方框图;
图2为字符识别装置的硬件配置的例子;
图3为字符识别装置的功能方框图;
图4为日语双字节字符“漢”的位图数据的例子;
图5为字符数据的例子;
图6为字符尺度测度的例子;
图7为利用字符的区别部分的尺度的字符数据的例子;
图8为日语双字节字符“合”的不同字体类型的位图数据;
图9为由字符识别装置执行的字符识别过程的流程图;
图10A、10B为倾斜方式下扫描的原件的例子;
图11为由字符识别装置执行的识别倾斜字符的过程的流程图;
图12为倾斜倾角θ的像素字符数据的例子;
图13为用于创建字符数据的系统的方框图;
图14为通过使用由字符数据创建单元创建的字符数据来执行的字符识别过程的流程图。
具体实施方式
以下参照附图描述本发明的实施例。根据本发明的字符识别方法用于根据本发明的字符识别装置的实施例;由此,与字符识别装置的实施例一道描述字符识别方法的实施例。
<第一实施例>
图1为包含根据本发明第一实施例的字符识别装置的字符识别系统的总体方框图。该字符识别系统包括:字符识别装置1、扫描器2、以及打印机3,其通过网络4互连,从而相互通信。字符识别装置1包括以后描述的字符数据5。字符识别装置1可以与扫描器2集成配置、或者与扫描器2以及打印机3两者集成配置。扫描器2可以具有传真功能。
以下给出由字符识别装置1执行的字符识别方法的大概。字符识别装置1包括字符数据5,其为各种字体类型(例如MS minchou,MS gothic,OSAKA)的每个字符的预定数字化位图数据。字符数据5根据其字体大小(点数)存储。
通过获取每个像素的黑或白值来获得位图数据。如果确定了字符的字体类型与字体大小,则字符的位图数据成为该字体类型与字体大小特有的二进制(黑与白)图像。相应地,可以利用字符数据5,以非常高的精度识别字符。
扫描器2读取以特定字体类型的字符打印的原件,并且将所读取的信息送往字符识别装置1。字符识别装置1确定打印字符的字体类型与字体大小,并且通过参照字符数据5来进行字符识别。
扫描器2以光学手段扫描放置在曝光玻璃上的原件。光被照射在原件上,并且反射光被输入到一维成像设备(例如CCD),由此被转换为电信号。扫描器2控制光源以及纸传送的移动速度,同时进行A/D转换处理,以将电信号转换为数字数据。通过进行常规的图像处理,例如阴影处理、缩放处理、边沿处理、伽码处理、以及二进制化处理,从数字数据获取图像数据。扫描器2可以为平头型、或者将文件递送给固定光源的文件递送型。
打印机3打印从字符识别装置1或扫描器2接收的打印数据。由打印机3执行的成像方法可以为激光方法、LED方法、液晶快门方法、喷墨方法等等。
图2为字符识别装置1的硬件配置的例子。字符识别装置1例如被配置为计算机。字符识别装置1包括:CPU 11、输入/输出设备12、显示设备13、驱动器设备14、主存储器15、辅助存储器16、以及通信设备17,这些通过总线B互连。
输入输出设备12处理用户从键盘或者鼠标输入的各种操作信号,并且控制从扫描器2接收的图像数据的输入与输出、或者送往打印机3的打印数据的输入与输出。显示设备13在显示器屏幕上显示GUI(图形用户界面),包括操作字符识别装置1所必须的各种窗口与数据。通信设备17为用于连接到字符识别装置1的接口,其例如由NIC(网络接口卡)或者调制解调器实现。
用于操作字符识别装置1的字符识别程序由记录介质18(例如存储卡或者CD-ROM)提供,或者通过网络4下载。将记录介质18插入驱动器设备14,并且通过驱动器设备14将数据与程序从记录介质18安装到辅助存储器16中。
辅助存储器16由硬盘设备或者存储元件实现,并且保存OS(操作系统)、字符数据、程序、文件等等。字符识别程序从辅助存储器16加载到CPU 11中,并且CPU 11在主存储器15中展开字符识别程序,以执行该字符识别程序。
图3为字符识别装置1的功能方框图。字符识别装置1包括:字体类型确定单元21、字体大小确定单元22、倾斜角度确定单元23、以及字符识别单元24。字体类型确定单元21确定通过扫描器2获取的图像数据中字符的字体类型。字体大小确定单元22确定图像数据中字符的字体大小。倾斜角度确定单元23确定原件或图像数据相对于主扫描方向的倾斜角度。字符识别单元24通过参照字符数据5,根据所确定的字符的字体类型与字体大小,确定字符的字符代码。在另一实施例中,字符识别单元24还根据所确定的原件或图像数据的倾斜角度来确定字符代码。
字符识别程序使CPU 11发挥字体类型确定单元21、字体大小确定单元22、倾斜角度确定单元23、以及字符识别单元24的作用。
以下描述字符数据5。图4为日语双字节字符“漢”的位图数据的例子。在图4中,字体类型为MS minchou,字体大小为10.5点。位图数据可以通过向每个像素分配黑与白来指示字符的形状。因为字符数据5的字符以位图数据的形式表示,所以可以进行字符识别。
例如,将所扫描原件的字符分为与字符数据5相同数目的像素,并且在所扫描的字符与字符数据5之间比较每个像素,从而确定颜色(黑或白)是否匹配。
在图4中,像素的数目为256×256(为了简化,图4实际所示的像素数目为64×64);但是,当文件以英文编写时,可以减少像素数目,或者字符可以诸如1024×1024等高清晰度显示。在图4中,为了解释的目的,将左下顶点当作原点。将从原点向右的方向称为X方向,将向上方向称为Y方向。其相反方向分别称为-X方向与-Y方向。
字符数据5的每个字符由不同的字符数据项表示。通过数字化从向左、向右、向上、或者向下方向首先在像素行中出现的黑像素的数目,来表示根据第一实施例的字符数据5的数据项。例如,对于字符“漢”,从左边在X方向上,计数首先在每个像素行中出现的黑像素的数目,在第四像素行处出现三个黑像素X41、X42、X43。在第五像素行处,除像素X41、X42、X43之外,还出现另一个黑像素X51。黑像素的位置对于每个字符都不同;因此,使用给定方向(例如X方向)上每个像素行中首先出现的黑像素的数目,来确定像素数据项,从而每个字符数据项对应于每个字符特有的识别信息。根据第一实施例,在字符数据项的X方向上首先出现的像素行中的黑像素的数目为(0,0,0,3,1,1,...)。由此,第一实施例中每个字符数据项包括256个数目,每个数目表示首先出现的黑像素的数目。
也可以或者可替换地在Y方向、或者-X方向、或者-Y方向上,计数首先出现的黑像素的数目。例如,当在-Y方向对字符“漢”计数时,在第4像素行处首先出现四个黑像素-Y41、-Y42、-Y43、-Y44。在第5像素行处首先出现的黑像素为-Y51到-Y57。如上所述,可以从单个字符中抽取四个字符数据项,即对应于X方向、Y方向、-X方向、和/或-Y方向的任何方向的一或多个字符数据项。
因此,对于上述的字符数据项,可以从任何方向扫描字符,并且可以在扫描整个字符之前开始字符识别。在扫描整个字符之后,可以通过利用对应于所有四个方向的字符数据项或者对应于这些方向的任何一个或者组合的字符数据项,进行字符识别。
当进行字符识别时,不知道何时开始出现黑像素(换言之,不知道第一个黑像素位于256个像素行的何处)。因此,字符数据项从存在黑像素的像素行开始数字化黑像素的数目。在字符“漢”的情况下,从(0,0,0,3,1,1,...)中省略(0,0,0)。
当字符的字体大小不同时,位图数据具有稍微不同的形状,即使在外形字体(outline font)的情况下也如此。例如,相同字符的12点字体大小与10.5点字体大小是不可比的,因为黑像素出现的位置是不同的。在10.5点字体大小的情况下,可能在第四像素行出现一个黑像素,而在12点字体大小的情况下,可能在第四像素行出现两个黑像素。根据第一实施例的字符数据5的字符数据项根据其字体大小存储。字体大小可以为一般使用的清晰度,例如8、9、10、10.5、11、12、14、16、18、20点。
图5为字符数据5的例子。在图5中,与字体大小与字体类型相关联地提供出现在四个方向上的黑像素的数目。可以理解,字符数据5还包括其他字体大小的数据。
在图5中,计数从白反转到黑的像素的数目;但是,可以计数从黑反转到白的像素的数目,并且将其用于字符数据5。
字符识别装置1根据字体大小进行字符识别,从而可以配置字符数据5以包括字符区别部分的尺度。图6为字符尺度测度的例子。该例子中,垂直与水平尺度决定了字符的总体大小。
如图6所示,可以由黑像素的连贯部分划分字符的位图数据。在字符“漢”的情况下,左部分具有三划,即三个连贯部分,右部分在顶部与底部具有两个连贯部分。从每个连贯部分中抽取相距最远的两个像素,其间的距离对应于字符数据。在图6中,长度1至3指示左侧三划的每一个中相距最远的两个像素的尺度,长度4与5指示右顶部连贯部分以及右底部连贯部分中相距最远的两个像素的尺度。
可以使用连贯部分之间的间距,作为字符数据。例如,获取连贯部分边沿像素之间的间距。在图6中,第一划与第二划的边沿部分之间的间距为dis1与dis 3,第二划与第三划的边沿部分之间的间距为dis 2,第一划与第三划的边沿部分之间的间距为dis 4,第二划与第三划的边沿部分之间的另一间距为dis 5。在图6中,抽取连贯部分右侧上的边沿部分之间的间距、以及连贯部分左侧上的边沿部分之间的间距;但是,可以理解,可以抽取一个连贯部分右侧与另一个连贯部分左侧之间的间距。类似地,也可以抽取左侧与右顶部连贯部分以及右底部连贯部分上每个笔划之间的间距。另外,可以计算每个连贯部分的外切矩形,并且可以使用外切矩形的对角线作为字符数据。
另外,可以抽取垂直方向或水平方向中的两个像素,并且可以使用这两个像素之间的间距作为字符数据。在“漠”的位图数据中,最左像素行包含三个黑像素,最右像素行包含两个黑像素。从最左像素行与最右像素行中抽取像素,并且抽取其间的距离。在图6中,最左像素行与最右像素行中两个顶部像素之间的距离为LR1,最左像素行与最右像素行中两个底部像素之间的距离为LR2。
另外,在“漠”的位图数据中,最顶部像素行包含四个黑像素,最底部像素行包含六个黑像素。从最顶部像素行与最底部像素行中抽取像素,并且抽取其间的距离。在图6中,抽取最顶部像素行与最底部像素行中最左像素,并且其间的距离为TB1,抽取最顶部像素行与最底部像素行中最右像素,并且其间的距离为TB2。
图7为利用字符的区别部分的尺度的字符数据5的例子。字体类型与字体大小与图5所示的相同。另外,存储垂直方向、水平方向、连贯部分1至n(在“漢”的情况下,n=5)、垂直方向上的像素间距、以及水平方向上的像素间距的尺度。
在第一实施例中,可以用表示绝对距离的单位(例如mm,cm等等)而非像素数来指示尺度。根据第一实施例的字符数据5根据字体大小存储。通过以绝对值表示字符连贯部分的尺度,可以高精度进行字符识别。
除图6与7所示的尺度之外,或者可替换地,可以使用角度作为指示字符区别部分的参数。在图6中,获得连接两个像素的直线来抽取尺度,因此,可以使用该直线与另一直线来获得角度。例如,可以获得由dis 1与dis 3形成的角度,或者由dis 1与length 5(长度5)形成的角度。因此,通过不仅使用尺度,而且使用由字符中区别部分的尺度形成的角度,可以更高的精度进行字符识别。
接着,描述确定在所扫描的原件上打印的字符的字体类型的方法。假设当确定字体大小时已经确定了字体大小。
图8为日语双字节字符“合”的不同字体类型的位图数据。在图8中,显示字体类型MS minchou、MS gothic、以及HG楷书作为例子如图8所示,线宽度、黑像素的比例、以及形状在MS minchou、MS gothic、以及HG楷书之间显著不同。字体类型确定单元21根据线宽度等等确定字体类型。
就线宽度与黑像素的比例而言,字体类型满足以下条件:MS minchou<HG楷书<MS gothic。在图8中,在每种字体类型中指示四个部分作为线宽度。可以根据所扫描的字符中不同线宽度的平均宽度确定字体类型。也可以根据不同字符的线宽度的平均宽度确定字体类型。
当使用黑像素的比例来确定字体类型时,检测所扫描字符的外切矩形,并且根据相对于外切矩形的面积的黑像素比例,确定字体类型。黑像素比例对于每个字符都不同。字体类型确定单元21获取例如一行或一页中字符的黑像素比例,平均所获得的这些比例,并且根据该平均比例确定字体类型。
字体类型确定单元21可以根据例如一个笔划内线宽度的变化来确定字体类型。在MS gothic中,一个笔划内线宽度基本恒定。但是,在HG楷书中,一个笔划的线宽度有显著变化。因此,可以通过计算从一个笔划的开始点(例如A1、B1、C1)到结束点(例如A2、B2、C2)的线宽度变化率来确定字体类型。
字符数据5包括指示与字体大小与字体类型相关的线宽度、黑像素比例、以及线宽度变化率的信息。因此,一旦确定了字体大小,就可以容易地确定字体类型。
图9为由具有上述配置的字符识别装置1执行的字符识别过程的流程图。将原件置于扫描器2之上,以依次扫描,并且将图像数据依次送往字符识别装置1。
首先,扫描原件的第一行以确定字体大小与字体类型(步骤S11)。当检测到没有任何字符的行间(其指示已经扫描了第一行)时,字体大小确定单元22确定字体大小(步骤S12)。可以用任何方法来确定字体大小,例如通过获得围绕行中每个字符的外切矩形,并且根据(多个)外切矩形的大小来确定字体大小。外切矩形一般对每个字符不同,即使字体大小相同也如此。由此,获得几个字符的外切矩形的平均大小,并且根据平均大小来确定字体大小。已知原件的大小,因此,可以根据相对于原件大小的外切矩形大小来确定字体大小。另外,可以根据成像设备检测的像素数目,通过检测外切矩形,来确定字体大小。
字体类型确定单元21确定字体大小(步骤S13)。如上所述,一旦确定了字体大小,就可以根据在字符数据5中包含的诸如线宽度等信息确定字体类型。
字符识别装置1确定原件的方向,即字符的走向(步骤S14)。在置于扫描器2中的原件上打印的字符的走向是未知的。字符识别装置1根据字符的形状,确定字符的走向。例如,根据每个字符的外切矩形的垂直/水平比例、直线的方向、以及线边沿的方向等等,确定字符的走向。可以通过利用参照模式的任何模式匹配方法进行字符识、并且检测其中可以识别字符的方向,来确定方向。
字符识别单元24通过利用字符数据5,对第一行中的字符进行字符识别(步骤S15)。字符识别单元24通过参照字符数据5,根据所确定的字体类型与字体大小,来识别字符。已经扫描了第一行。字符识别单元24可以使用图5所示四个方向的字符数据项中的任何一个,和/或字符的尺度,例如间距和/或角度。
字符识别装置1确定是否对所有行都完成了字符识别(步骤S16),如果没有(步骤S16中的“否”),则字符识别装置1扫描下一行(步骤S17),并且进行字符识别(步骤S18)。
已经在第一行的字符识别过程中确定了字体类型与字体大小,因此从第二行以及其后,可以在读取整行之前开始字符识别。已知字符的走向,从而根据走向,对应于参照图5所述的X方向、Y方向、-X方向、-Y方向中的任何一个抽取字符数据。因此,可以在主扫描方向上逐行地抽取字符识别的候选。例如,当在扫描的同时检测到三个黑像素首先在一行中出现时,抽取字符数据项第一行处指示三个黑像素的字符作为候选。接着,当在扫描的同时检测到出现五个黑像素时,从先前抽取的那些候选字符中,抽取在字符数据项第二行处指示五个黑像素的候选字符。根据第一实施例,可以在读取整个字符之前开始字符识别,从而加速字符识别过程。当完成了所有行的字符识别时,图9所示流程图的处理结束。
当扫描整行后进行字符识别时,可以通过例如X方向、Y方向、-X方向、或-Y方向的字符数据中的任何一个来进行字符识别,或者可以组合地使用这些中的多个字符数据项。
在图9的过程中,使用图5所示的字符数据进行字符识别;但是,也可以除图5所示的字符数据之外,或者作为其替换地使用图6与7所示的字符的区别部分的尺度及其之间的角度来进行字符识别。当使用尺度时,优选地是在扫描整行之后、然后使用尺度来进行字符识别;但是,可以在扫描整行之前,根据扫描区域中可用于抽取的尺度,逐步缩窄候选字符。
根据第一实施例,按照字体类型与字体大小,预先存储字符数据。按照足够水平清晰度上的每个像素,将字符数据与所扫描文件的字符比较。因此,可以非常高的精度识别字符。另外,预先存储的字符数据只需要包含经常使用的字体类型(例如,MS minchou,MS gothic,HG楷书)以及经常使用的字体大小(例如,10.5点,12点),从而防止字符数据量过大。另外,在扫描第一行、并且确定字体大小与字体类型之后,可以在读取整个字符之前,对每个字符开始进行字符识别,因此,可以加快识别速度。
<第二实施例>
第二实施例描述了即使当所扫描的字符是倾斜的时也能够以与第一实施例相同的方式进行字符识别的字符识别装置。根据第二实施例的字符数据具有与第一实施例不同的配置。根据第二实施例的字符识别装置的系统配置与功能块与第一实施例的相同。
在图4所示的字符的位图数据中,向256×256个像素的每一个分配黑或白(此后,“像素字符数据”)。通过利用像素字符数据本身作为用于字符识别的字符数据,可以进一步提高识别准确性。更具体地,确定位图数据的原点在任意位置上,并且在256×256个像素的每一个中存储为1(黑像素)或0(白像素)的比特。根据第二实施例的字符识别装置1根据字体类型与字体大小存储像素字符数据。可以在使用之前解压用于字符识别的像素字符数据。除此之外,还可以压缩像素字符数据以减少文件量。
当所扫描的原件为倾斜时,如图10A所示,读取字符时其相对于一维成像设备的主扫描方向倾斜。图10B为当所扫描的原件倾斜从而字符是倾斜的时的图像数据的例子;这改变了其上首先出现黑像素的像素的位置。根据第二实施例的字符识别装置检测原件的倾斜角度,根据所检测的倾斜角度倾斜字符数据的像素字符数据,并且进行字符识别。
图11为由字符识别装置1执行的识别倾斜字符的过程的流程图。与图9所示相同的步骤以相同的步骤标号表示。
首先,扫描原件的第一行(步骤S11)。倾斜角度确定单元23根据对应于第一行的图像数据,检测倾斜角度(步骤S20)。可以任何方法检测倾斜角度。例如,倾斜角度确定单元23可以用假定基线的连接行中字符的基底部分(最底部部分),并且计算基线与主扫描方向之间的角度θ。如果检测到原件插入的角度,则也可以获取作为文件插入方向与主扫描方向之间角度的倾斜角度。
接着,字符识别装置1按照倾斜角度θ纠正通过扫描原件的第一行而获得的第一行的图像数据的倾斜,并且例如以与第一实施例相同的方式确定字体大小、字体类型、以及字符走向(步骤S12至步骤S14),并且根据图5或7所示的字符数据,对第一行中的字符进行字符识别(步骤S15)。也可以通过根据像素字符数据确定每个像素为黑还是白,来对第一行中的字符进行字符识别。
接着,字符识别单元24将字符数据倾斜倾斜角度θ(步骤S21)。例如,将图12所示的实线中的像素字符数据倾斜倾斜角度θ,从而获得虚线指示的虚框。通过对像素字符数据执行该过程,即使当原件倾斜时,虚框的一侧也会匹配主扫描方向,从而可以使用倾斜后的像素字符数据进行字符识别。
例如,如果虚框的侧A匹配主扫描方向,则可以通过从侧A开始、计数每行中出现的黑像素,以与第一实施例中的字符数据相同的方式使用像素字符数据。
步骤S21之后,执行与图9所示的相同的步骤。即,从第二行向后,字符识别单元24可以在扫描整个行之前开始进行字符识别。已经知道了字符走向与倾斜角度θ,因此可以根据倾斜了倾斜角度θ的像素字符数据,在主扫描方向上逐行地抽取用于字符识别的候选字符。
根据第二实施例,即使当原件是倾斜的时,也可以在读取整个字符之前开始进行字符识别。因此,可以加速字符识别过程。当对所有行完成字符识别时,图11所示的流程图的过程结束。
在第二实施例中,获得了与第一实施例相同的效果,另外,即使当原件是倾斜的时,也可以通过使字符数据符合倾斜角度,以高速进行字符识别。如果在扫描整行之后进行字符识别,则可以在字符识别之前纠正对应行的图像数据的倾斜。在这种情况下,可以通过利用根据第一实施例的字符数据,或者通过利用没有被倾斜的像素字符数据,来进行字符识别。
在使用像素字符数据的情况下,对于每个像素位置确定每个像素为黑还是白,这与确定黑像素出现的次数不同。因此,可以更高的精度进行字符识别。
<第三实施例>
在第一与第二实施例中,预先在字符识别装置1中存储字符数据或者像素字符数据。但是,可以根据待识别的字符的字体类型或者字体大小来生成字符数据。
图13为用于创建字符数据的系统的方框图。通过作为计算机的字符识别装置1来实现该系统。
一般地,由OS提供的多个字体数据31项被存储在对应于字符识别装置1的个人计算机中。在字体数据31中,与字符代码相关联地存储外形字体数据与位图数据。还提供字符33的字体与走向以进行字符识别。
当应用软件指定预定字符代码的字符的字体类型与字体大小时,格栅化器32根据字符代码、字体类型、以及字体大小,生成位图数据34。
将位图数据34分为预定像素(例如256×256),如图4所示,其中在每个像素中分配黑或白。具体地,字符数据创建单元36将位图数据34分为预定像素,并且向每个像素位置分配黑或白,由此生成像素字符数据。字符数据创建单元36也可以根据分为像素的位图数据34或者像素字符数据,生成指示出现的黑像素的数目的字符数据。像素字符数据与字符数据由图13中的35表示。
图14为通过使用由字符数据创建单元36创建的字符数据来执行字符识别过程的流程图。与图9所示相同的步骤以相同的步骤标号表示。
首先,根据通过扫描原件的第一行而获得的图像数据,确定字符的字体大小与走向(步骤S11、S12、S13),并且进行字符识别(步骤S30)。按照使用参照模式的模式匹配方法,进行步骤S30中的字符识别。相应地,第一行的字符识别的识别率为预定精度。
字体类型确定单元21确定第一行中字符的字体类型(步骤S31)。已经识别了第一行中的字符,从而格栅化器32可以生成对应于所识别的字符代码的多种字体类型的字符的位图数据。再次对第一行中字符进行模式匹配,这次使用不同字体类型的位图数据。字体类型确定单元21确定与字符匹配的字体类型作为原件中使用的字体类型。
当确定了字体类型时,字符数据创建单元36创建对应于所确定的字体类型与字体大小的字符数据与像素字符数据(步骤S32)。因此,以与第一与第二实施例相同的方式获取字符数据。
步骤S32之后,进行与第一实施例相同的那些步骤。即,利用所创建的字符数据进行字符识别(步骤S17、S18),直到对所有行完成了处理(步骤S16)。字符数据或像素字符数据指示每个像素为黑像素还是白像素,因此,可以非常高的精度识别字符。
根据第三实施例,即使当在原件上打印的字符是不常用的字体类型时,也可以识别字体类型并且创建字符数据。因此,可以非常高的精度识别许多种字体的字符。
本发明不限于具体公开的实施例,并且在不脱离本发明的范围的前提下可以进行变动与修改。
本申请基于2005年10月28日提交的日本优选权专利申请第2005-315074号,其全部内容通过引用融入本文。

Claims (13)

1.一种字符识别装置,用来识别通过以光学方式扫描原件而获得的图像数据中的字符,该装置包括:
字体类型确定单元,被配置来确定所扫描的字符的字体类型;
字体大小确定单元,被配置来确定所扫描的字符的字体大小;
存储器,用来存储用于识别对应于所扫描字符的字符代码的字符数据,该字符数据包括与对应于字符的字符代码相关联地存储的字体类型与字体大小;以及
字符识别单元,被配置来通过比较具有字体类型确定单元所确定的字体类型、以及字体大小确定单元所确定的字体大小的字符数据,识别对应于所扫描字符的字符代码。
2.如权利要求1所述的装置,其中
所扫描字符由被分为预定数目的像素的位图数据表示,并且
字符数据包括每个字符的、按字符预定方向逐行计数的、在像素行中首先出现的黑像素的数目。
3.如权利要求2所述的装置,其中
所述预定方向为以下中的至少一个或者其组合:向左方向、向右方向、向上方向、以及向下方向。
4.如权利要求1所述的装置,其中
所扫描字符由被分为预定数目的像素的位图数据表示,并且
字符数据对应于每个字符的、包括关于每个像素为黑还是白的信息的像素字符数据。
5.如权利要求1所述的装置,其中
所扫描字符由被分为预定数目的像素的位图数据表示,并且
字符数据包括每个字符中的多个像素对之间的多个距离。
6.如权利要求4所述的装置,还包括:
倾斜角度确定单元,被配置来确定原件倾斜的倾斜角度;其中
在根据由倾斜角度确定单元确定的倾斜角度将像素字符数据倾斜之后,字符识别单元识别对应于所扫描字符的字符代码。
7.如权利要求1所述的装置,还包括:
字符数据创建单元,被配置来基于从定义所扫描的字符的字体数据生成的位图数据创建附加字符数据;其中
字符数据创建单元基于表示其字体类型由字体类型确定单元确定的、并且其字体大小由字体大小确定单元确定的、所扫描的字符的位图数据来创建附加字符数据;以及
字符识别单元通过比较由字符数据创建单元以字体类型确定单元确定的字体类型、以及由字体大小确定单元确定的字体大小创建的字符数据,来识别对应于所扫描字符的字符代码。
8.一种用于识别通过以光学方式扫描原件而获得的图像数据中的所扫描字符的字符数据,该字符数据包括与对应于字符的字符代码相关联地存储的字体类型与字体大小,其中
所扫描字符由被分为预定数目的像素的位图数据表示,并且
字符数据包括每个字符的、按字符预定方向逐行计数的、在像素行中首先出现的黑像素的数目。
9.如权利要求8所述的字符数据,其中
所述预定方向为以下中的至少一个或者其组合:向左方向、向右方向、向上方向、以及向下方向。
10.一种用于识别通过以光学方式扫描原件而获得的图像数据中的所扫描字符的字符数据,该字符数据包括与对应于字符的字符代码相关联地存储的字体类型与字体大小,其中
所扫描字符由被分为预定数目的像素的位图数据表示,并且
字符数据对应于每个字符的、包括关于每个像素为黑还是白的信息的像素字符数据。
11.一种用于识别通过以光学方式扫描原件而获得的图像数据中的所扫描字符的字符数据,该字符数据包括与对应于字符的字符代码相关联地存储的字体类型与字体大小,其中
所扫描字符由被分为预定数目的像素的位图数据表示,并且
字符数据包括每个字符中的多个像素对之间的多个距离。
12.一种字符识别方法,用来识别通过以光学方式扫描原件而获得的图像数据中的字符,该方法包括以下步骤:
(a)确定所扫描的字符的字体类型;
(b)确定所扫描的字符的字体大小;
(c)通过比较具有步骤(a)所确定的字体类型、以及步骤(b)所确定的字体大小的、包括与对应于字符的字符代码相关联地存储的字体类型与字体大小的字符数据,识别对应于所扫描字符的字符代码。
13.如权利要求12所述的字符识别方法,其中
所扫描字符由被分为预定数目的像素的位图数据表示,并且
字符数据对应于:
每个字符的、按字符预定方向逐行计数的、在像素行中首先出现的黑像素的数目,所述预定方向为以下中的至少一个或者其组合:向左方向、向右方向、向上方向、以及向下方向,或者
每个字符的、包括关于每个像素为黑还是白的信息的像素字符数据,或者
每个字符中的多个像素对之间的多个距离。
CNB2006101425625A 2005-10-28 2006-10-30 字符识别装置、字符识别方法 Expired - Fee Related CN100568265C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2005315074A JP4881605B2 (ja) 2005-10-28 2005-10-28 文字認識装置、記憶媒体、文字認識方法
JP315074/05 2005-10-28

Publications (2)

Publication Number Publication Date
CN1955981A true CN1955981A (zh) 2007-05-02
CN100568265C CN100568265C (zh) 2009-12-09

Family

ID=38063297

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2006101425625A Expired - Fee Related CN100568265C (zh) 2005-10-28 2006-10-30 字符识别装置、字符识别方法

Country Status (3)

Country Link
JP (1) JP4881605B2 (zh)
CN (1) CN100568265C (zh)
TW (1) TWI338865B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104915332A (zh) * 2015-06-15 2015-09-16 广东欧珀移动通信有限公司 一种生成排版模板的方法及装置
CN110163203A (zh) * 2019-04-09 2019-08-23 浙江口碑网络技术有限公司 字符识别方法、装置、存储介质及计算机设备
CN110858302A (zh) * 2018-08-24 2020-03-03 英业达科技有限公司 在画面影像中编辑监控脚本的系统及方法
CN110858305A (zh) * 2018-08-24 2020-03-03 英业达科技有限公司 使用已安装字体辨识画面文字的系统及方法
CN114792420A (zh) * 2013-06-28 2022-07-26 谷歌有限责任公司 比较使用连续扫描提取的卡数据

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010140291A1 (ja) * 2009-06-02 2010-12-09 日本電気株式会社 情報処理装置
CN102194117B (zh) * 2010-03-05 2013-03-27 北京大学 文稿页面方向检测方法和装置
JP5857719B2 (ja) * 2011-12-19 2016-02-10 コニカミノルタ株式会社 情報処理装置、情報処理装置の制御方法および制御プログラム
CN112329803B (zh) * 2019-08-05 2022-08-26 北京大学 一种基于标准字形生成的自然场景文字识别方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58222384A (ja) * 1982-06-18 1983-12-24 Ricoh Co Ltd フオント識別方式
JPH0528321A (ja) * 1991-07-19 1993-02-05 Hitachi Ltd 画像認識方法および画像認識システム
JPH09185683A (ja) * 1995-12-28 1997-07-15 Advantest Corp 文字検査装置の画像処理方法とその装置
JPH09269974A (ja) * 1996-04-01 1997-10-14 Toshiba Corp オンライン文字認識装置
JP3370934B2 (ja) * 1997-06-05 2003-01-27 松下電器産業株式会社 光学的文字読み取り方法とその装置
JP2001092923A (ja) * 1999-09-17 2001-04-06 Oki Electric Ind Co Ltd Ic型番識別方法
JP4385536B2 (ja) * 2001-03-19 2009-12-16 コニカミノルタビジネステクノロジーズ株式会社 文字認識装置、文字認識方法ならびに文字認識プログラムおよびこれを記録したコンピュータ読み取り可能な記録媒体
JP2003050971A (ja) * 2001-08-07 2003-02-21 Riso Kagaku Corp フォント選択プログラム、画像処理装置及び画像形成装置
JP4469566B2 (ja) * 2003-06-27 2010-05-26 株式会社日本デジタル研究所 文字認識方法

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114792420A (zh) * 2013-06-28 2022-07-26 谷歌有限责任公司 比较使用连续扫描提取的卡数据
CN114792420B (zh) * 2013-06-28 2023-10-13 谷歌有限责任公司 比较数据的方法、非暂时性计算机可读存储设备以及系统
CN104915332A (zh) * 2015-06-15 2015-09-16 广东欧珀移动通信有限公司 一种生成排版模板的方法及装置
CN110858302A (zh) * 2018-08-24 2020-03-03 英业达科技有限公司 在画面影像中编辑监控脚本的系统及方法
CN110858305A (zh) * 2018-08-24 2020-03-03 英业达科技有限公司 使用已安装字体辨识画面文字的系统及方法
CN110858305B (zh) * 2018-08-24 2024-02-20 英业达科技有限公司 使用已安装字体辨识画面文字的系统及方法
CN110858302B (zh) * 2018-08-24 2024-02-20 英业达科技有限公司 在画面影像中编辑监控脚本的系统及方法
CN110163203A (zh) * 2019-04-09 2019-08-23 浙江口碑网络技术有限公司 字符识别方法、装置、存储介质及计算机设备
CN110163203B (zh) * 2019-04-09 2021-08-24 浙江口碑网络技术有限公司 字符识别方法、装置、存储介质及计算机设备

Also Published As

Publication number Publication date
JP4881605B2 (ja) 2012-02-22
JP2007122500A (ja) 2007-05-17
CN100568265C (zh) 2009-12-09
TW200717338A (en) 2007-05-01
TWI338865B (en) 2011-03-11

Similar Documents

Publication Publication Date Title
CN1955981A (zh) 字符识别装置、字符识别方法、以及字符数据
RU2571378C2 (ru) Устройство и способ поиска различий в документах
US6640010B2 (en) Word-to-word selection on images
US7664321B2 (en) Image processing method, system, program, program storage medium and information processing apparatus
CN1258894A (zh) 用于识别字符的装置和方法
CN1269069C (zh) 字符识别装置及方法
CN1834992A (zh) 检测文档图像中的字符的方向
CN1752991A (zh) 文字识别装置、文字识别方法及文字识别程序
US8391607B2 (en) Image processor and computer readable medium
JP2009003937A (ja) デジタル画像におけるテキスト方向判定方法およびシステム、ならびに、制御プログラムおよび記録媒体
EP3540644B1 (en) Image processing device, image processing method, and image processing program
Borovikov A survey of modern optical character recognition techniques
EP0949580A2 (en) Classification-driven thresholding of a normalized grayscale image
EP3776332A2 (en) An image processing system and an image processing method
JP4893643B2 (ja) 検出方法および検出装置
US5638466A (en) Method and apparatus for deskewing images of symbols having a non-linear baseline
US7889925B2 (en) Method, system and computer program for encoding and decoding a pixelized target graphic symbol
CN1107280C (zh) 中英文表单的识别系统及识别方法
EP0692768A2 (en) Full text storage and retrieval in image at OCR and code speed
JP2002279351A (ja) 文字認識装置、文字認識方法ならびに文字認識プログラムおよびこれを記録したコンピュータ読み取り可能な記録媒体
JP4159948B2 (ja) 2次元コード読み取り装置、2次元コード読み取り方法及び2次元コード読み取りプログラム、記憶媒体
US11659106B2 (en) Information processing apparatus, non-transitory computer readable medium, and character recognition system
US20230029990A1 (en) Image processing system and image processing method
US20230260308A1 (en) System and method for improved ocr efficacy through image segmentation
JP2662404B2 (ja) 光学文字読取装置における辞書作成方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20091209

Termination date: 20191030

CF01 Termination of patent right due to non-payment of annual fee