CN104981819A

CN104981819A - 字符识别系统、字符识别程序以及字符识别方法

Info

Publication number: CN104981819A
Application number: CN201380072613.XA
Authority: CN
Inventors: 相原辉夫
Original assignee: PSC Inc Japan
Current assignee: PSC Inc Japan
Priority date: 2013-02-13
Filing date: 2013-03-29
Publication date: 2015-10-14
Also published as: KR20150116821A; EP2958055A1; JP2014154066A; US20150356764A1; US9639970B2; MY173006A; EP2958055A4; JP6080586B2; WO2014125658A1; SG11201506275XA; KR102024127B1

Abstract

提供一种能够以高的准确率识别计算机的显示器上显示的字符的字符识别系统。字符识别系统(1)用于识别计算机的显示器(30)上显示的字符，其中，所述字符识别系统(1)具有：存储装置(122)，其针对规定的显示字体和字符尺寸的组合，记录有识别辞典，所述识别辞典具有关于具备该显示字体和字符尺寸的各字符的构成点的配置的信息；以及字符识别部(25)，其参照识别辞典，提取与关于显示器(30)上显示的识别对象字符的构成点的配置的信息完全一致的字符，由此确定识别对象字符。

Description

字符识别系统、字符识别程序以及字符识别方法

技术领域

本发明涉及字符识别系统。

背景技术

以往，提供了用于光学读取被打印在纸上的字符而进行识别的光学字符识别系统，例如，在下述专利文献1、2中作了公开。

另一方面，如下述专利文献3所公开的那样，为了在系统之间或应用程序之间进行数据的交接，需要借助通过画面捕捉得到的图像数据，识别计算机的显示器上显示的字符。

现有技术文献

专利文献

专利文献1：日本特开2008-305126号公报

专利文献2：日本特开2010-26805号公报

专利文献3：日本特开2011-81537号公报

发明内容

发明所要解决的课题

但是，显示器上的显示字符与被打印在纸上的字符相比，点的分辨率粗，所以即使采用现有的光学字符识别的手法，有时候识别率也会大幅下降。尤其是对于为了增大显示数据量而使用的小字符尺寸的字符而言，识别率极端地降低。

本发明就是鉴于上述课题而完成的，其目的在于提供一种字符识别系统，其能够以高的准确率识别显示在计算机的显示器上的字符。

用于解决课题的手段

为了解决上述课题，本发明的字符识别系统用于识别计算机的显示器上显示的字符，其特征在于，所述字符识别系统具有：存储装置，其针对规定的显示字体和字符尺寸的组合，记录有识别辞典，所述识别辞典具有关于具备该显示字体和字符尺寸的各字符的构成点的配置的信息；以及字符识别部，其参照所述识别辞典，提取与关于所述显示器上显示的识别对象字符的构成点的配置的信息完全一致的字符，由此确定所述识别对象字符。

此外，本发明的字符识别程序用于使计算机识别显示器上显示的字符，其特征在于，所述字符识别程序使所述计算机执行以下步骤：识别辞典生成步骤，针对规定的显示字体和字符尺寸的组合，生成识别辞典，所述识别辞典具有关于具备该显示字体和字符尺寸的各字符的构成点的配置的信息；以及字符识别步骤，参照所述识别辞典，提取与关于所述显示器上显示的识别对象字符的构成点的配置的信息完全一致的字符，由此确定所述识别对象字符。

此外，本发明的字符识别方法用于识别计算机的显示器上显示的字符，其特征在于，所述字符识别方法具有以下步骤：识别辞典生成步骤，针对规定的显示字体和字符尺寸的组合，生成识别辞典，所述识别辞典具有关于具备该显示字体和字符尺寸的各字符的构成点的配置的信息；以及字符识别步骤，参照所述识别辞典，提取与关于所述显示器上显示的识别对象字符的构成点的配置的信息完全一致的字符，由此确定所述识别对象字符。

发明效果

根据本发明，即使是显示在计算机的显示器上的分辨率低的字符，也能够高精度地进行字符识别。

附图说明

图1是概略地示出本发明的实施方式的字符识别系统的结构的示意图。

图2是示出本发明的实施方式的识别辞典的内容的图。

图3是概略地示出本发明的实施方式的字符识别系统的功能的框图。

图4是示出本发明的实施方式的识别辞典的生成处理的流程的流程图。

图5是示出本发明的实施方式的字符识别的处理的流程的流程图。

图6是用于说明本发明的实施方式的字符识别的处理的图。

具体实施方式

下面，参照附图详细说明本发明的实施方式的字符识别系统。图1是概略地示出本实施方式的字符识别系统的结构的示意图。图2是示出本实施方式的识别辞典的内容的图。图3是概略地示出本实施方式的字符识别系统的功能的框图。

如图1所示，字符识别系统1具有：计算机主体10；显示器30，其是显示来自计算机主体10的输出信息的显示装置；以及键盘和鼠标等输入装置32，其用于将信息输入到计算机主体10。

本实施方式的字符识别系统1是用于识别显示器30上显示的字符的系统，其特征在于，在进行字符识别时，不是利用光学字符识别，而是根据关于构成字符的构成点的配置的信息是否完全一致，来进行字符的确定。在本实施方式中，以识别应用程序A在显示器30上的显示窗口内的规定的识别对象区域中显示的显示字符的情况为例进行说明。

计算机主体10具有：用于进行各种运算的CPU(Central Processing Unit，中央处理单元)等运算装置11；以及用于存储各种信息的HDD(Hard Disc Drive，硬盘驱动器)和作为运算处理的工作区进行使用的RAM(Random Access Memory，随机存取存储器)等存储装置12。

存储装置12具有：程序保存部121，其保存有安装于计算机主体10的OS(Operating System：操作系统)、字符识别程序、识别辞典生成程序、字体检查程序、应用程序A等各种程序；识别辞典DB(数据库)122，其保存有在进行字符识别时使用的识别辞典；用于字体检查的字体检查用辞典DB 123；以及视频存储器125，其临时保持显示器30上显示的画面内容。

关于程序保存部121，字符识别程序是用于执行后述的字符识别处理的程序，识别辞典生成程序是用于执行后述的识别辞典的生成处理的程序。此外，字体检查程序是用于在进行识别辞典的生成和字符识别时，取得识别对象字符的显示字体和字符尺寸的信息的程序。

在识别辞典DB 122中，按照显示字体和字符尺寸的每种组合，生成识别辞典并进行记录。参照图2来说明识别辞典的识别辞典记录的内容。识别辞典DB 122内的各记录具有“辞典ID”、“显示字体”、“字符尺寸”、“字符代码”、“外框内点配置”、“外框尺寸”、“外框位置”的项目。

“辞典ID”是各识别辞典的识别符，如果是相同显示字体和字符尺寸的组合，则为相同的识别符，如果显示字体和字符尺寸的至少一个不同，则为不同的识别符。“显示字体”、“字符尺寸”和“字符代码”是作为该记录的生成源的字符的字体、尺寸、字符代码。

“外框内点配置”是包含构成辞典生成源的字符的全部构成点的最小矩形外框内的点配置位置的信息。例如，将配置有黑色点的位置设为“1”，将没有配置的空白位置设为“0”，从矩形外框内的左上朝向右下，按照每行以“00110101110000”的形式进行记录。

“外框尺寸”是上述最小矩形外框的纵横的尺寸信息(点的个数)。“外框位置”是从基线(标准底线)到上述最小矩形外框的下边的距离。在本实施方式中，“外框内点配置”、“外框尺寸”、“外框位置”的项目相当于关于字符的构成点的配置的信息。

字体检查用辞典DB 123内记录的字体检查用辞典是用于在进行识别辞典的生成和字符识别时，取得识别对象字符的显示字体和字符尺寸的信息的辞典。字体检查用辞典仅针对例如“あいうえお”等规定的检查用的多种字符，具有与关于计算机主体10中安装的全部字体的全部尺寸的上述识别辞典相同的信息。

接着，参照图3来说明字符识别系统1的功能。如该图所示，字符识别系统1具有：字体检查部20，其具有识别显示器30上显示的显示字符的显示字体和字符尺寸的功能；辞典生成部21，其具有预先生成上述识别辞典的功能；以及字符识别部25，其具有进行字符识别的功能。

这各个部分的功能是使运算装置11执行程序保存部121中保存的字体检查程序、识别辞典生成程序、字符识别程序来实现的。

接着，进一步参照图4来说明识别辞典DB 122中记录的识别辞典的生成处理的流程。图4是示出本实施方式的识别辞典的生成处理的流程的流程图。

识别辞典的生成是在后述的字符识别处理之前进行的，辞典生成部21生成针对之后待识别的识别对象字符的显示字体和字符尺寸的组合的识别辞典。当然，在已经针对相同显示字体和字符尺寸的组合生成了识别辞典的情况下，无需再次进行辞典的生成，只要使用已经登记的识别辞典即可。

在识别辞典的生成时，在计算机主体10中执行识别辞典生成程序。首先，在S11中，进行生成识别辞典所需的显示字体和字符尺寸的取得。该字符尺寸等的取得是启动字体检查程序而进行的。

这里生成的识别辞典是应用程序A在显示窗口内的规定的识别对象区域内显示的识别对象字符的显示字体和字符尺寸的组合的识别辞典，所以字体检查程序参照记录在字体检查用辞典DB 123内的字体检查用辞典，自动确定该识别对象字符的显示字体和字符尺寸。

具体而言，字体检查部20通过画面捕捉从视频存储器125取得识别对象字符的图像数据，一边参照字体检查用辞典DB 123，一边提取与构成识别对象字符的点的配置信息完全一致的字符。由此，确定与识别对象字符相同字体和相同尺寸的字符，能够取得识别对象区域中显示的字符的显示字体和字符尺寸的信息。

另外，参照该字体检查用辞典DB 123提取字符的处理与后述的字符识别的处理相同，所以省略详细的说明。此外，字体检查用辞典是仅针对检查用的多种字符的辞典，所以在进行字体检查时，操作员需要预先进行字符的输入等作业，以使该检查用的字符作为识别对象字符显示在识别对象区域内。

与现有的光学字符识别不同，在本实施方式中，根据字符的构成点的配置位置是否相同，进行字符的识别，如果显示字体或字符尺寸不同，则会被识别为其他字符。因此，识别辞典也需要按照显示字体和字符尺寸的每种组合，生成各自的识别辞典。另外，如果可能的话，可以由操作员手动设定S11的字体检查。

接着，进到S12，将在S11中取得的显示字体和字符尺寸的字符依次显示在显示器30(视频存储器125)上。这里显示的字符是具有该显示字体和字符尺寸并安装于计算机主体10的全部字符。具体而言，因显示字体不同而不同，例如是JIS非汉字、JIS第一汉字、JIS第二汉字中包含的全部字符。

当显示最初的字符时，在S13中，进行外框的设定。该外框是包含构成所显示的字符的全部构成点的最小的矩形外框。接着，在S14中，将识别辞典记录与关于外框内的点的配置的信息共同登记到识别辞典DB 122内。识别辞典记录的具体内容为上述的“辞典ID”、“显示字体”、“字符尺寸”、“字符代码”、“外框内点配置”、“外框尺寸”、“外框位置”的信息。

接着，在S15中，判定是否针对与该显示字体和字符尺寸的组合相关的全部字符结束了辞典登记，在存在仍未登记的字符的情况下，返回S12，重复S12～S14的处理，对下一个字符进行辞典登记。在S15中，在判断为针对全部字符进行了辞典登记的情况下，结束针对该显示字体和字符尺寸的组合而进行的识别辞典的登记。

不需要针对计算机主体10的OS所具有的全部显示字体的全部字符尺寸预先进行该识别辞典的生成，也可以在进行字符识别时，针对具有识别对象区域内显示的字符的显示字体和字符尺寸的组合的全部字符生成识别辞典。

接着，参照图5和图6来说明本实施方式的字符识别的处理的流程。图5是示出本实施方式的字符识别处理的流程的流程图。图6是用于说明本实施方式的字符识别处理的图。

首先，在S21中，取得识别对象字符的显示字体和字符尺寸。该字符尺寸等的取得是启动字体检查程序来进行的，是与上述的S11相同的处理。此外，在接着识别辞典的生成而进行字符识别处理的情况下，由于已经通过S11进行了显示字体和字符尺寸的取得，所以可省略S21。

通过该显示字体和字符尺寸的取得，确定识别辞典DB 122内记录的识别辞典之中的、在本次的字符识别中使用的识别辞典。

接着，在S22中，进行识别对象字符的外框设定。具体而言，从视频存储器125取得应用程序A的识别对象区域的图像数据，按照该区域内显示的每个字符进行了分割后，按照每个字符设定包含了各字符的全部构成点的最小的矩形外框。图6表示按照每个字符设定了最小矩形外框的情况。

在S23中，进行基于“外框尺寸”的信息而实施的字符的缩减(一次筛选)。即，提取识别辞典中含有的字符之中具有与针对识别对象字符设定的外框的尺寸相同尺寸的字符。

接着，在S24中，判定是否通过S23中的筛选将字符确定为一个。在通过一次筛选缩至一个字符的情况下，能够确定识别对象字符是此字符，所以字符识别处理结束。

在S24中，在判断为未确定的情况下，进到S25，进行基于“外框内点配置”的信息而实施的字符的缩减(二次筛选)。即，提取通过一次筛选提取出的字符之中具有与针对识别对象字符设定的外框内的点配置位置相同的配置位置的字符。

接着，在S26中，判定是否通过S25中的筛选将字符确定为一个，在确定为一个的情况下，结束字符识别，在不是这样的情况下进到S27，进行三次筛选。例如，在识别对象字符为“’”或者“，”的字符的情况下，“外框尺寸”和“外框内点配置”相同，所以进到S27。在S27中，根据“外框位置”的信息进行字符的缩减，确定字符。

在识别对象区域内包含多个字符的情况下，可以按照每个字符重复进行S23～S27。此外，在通过S21的字体检查，在识别对象区域内存在多个显示字体和字符尺寸的组合的情况下，可以参照多个识别辞典进行字符识别。

此外，上述的筛选顺序也可适当变更。此外，虽然在上述实施方式中，设定了最小矩形外框之后，使用“外框尺寸”、“外框位置”、“外框内点配置”进行了字符识别，但是，作为用于进行字符识别的“关于构成字符的点的配置的信息”，可以使用各种各样的其他信息，例如，可以使用外框内的第1行的黑点的数等。

以上，说明了本实施方式的字符识别系统，根据本实施方式，基于构成字符的点的配置信息，进行显示在显示器30上的显示字符的识别，从而能够以大致100％的识别率进行字符识别。

本实施方式的识别字符对象是显示在计算机的显示器30(视频存储器125)上的字符，不像被打印在纸上的字符那样存在污损或残缺，所以，只要根据点的配置信息，即可可靠地确定字符。

不过，如果字符的显示字体或字符尺寸不同，则点配置也不同，所以在本实施方式的字符识别的情况下，需要预先掌握识别对象字符的显示字体和字符尺寸，然后生成基于相同的显示字体和字符尺寸的组合的识别辞典，执行字符识别处理。

此外，如本实施方式那样，使用多个构成字符的点的配置信息，分阶段进行筛选，从而能够降低字符识别的处理负荷，进行高速高效的字符识别。

接着，说明本实施方式的变形例。首先，在显示器30上的显示字符是实施了抗锯齿处理的字符的情况下，如果在进行上述的字体检查、识别辞典的生成、字符识别等处理之前，以相同的基准从字符的图像数据中减去指定彩度之外、指定明度之外的点，则能够进行排除了抗锯齿处理的影响的字符识别。

此外，在显示器30上的显示字符是下划线、粗体字符等实施了字符修饰的字符的情况下，在生成识别辞典和字体检查用辞典时，也可以追加地生成实施了相同的字符修饰的字符的识别辞典记录，由此，针对被修饰过的字符也能够准确地进行字符识别。

此外，即使在包含半角字符的情况下，也能够通过生成半角字符的识别辞典，准确地进行字符识别。

以上，对本发明的实施方式进行了说明，但是本发明的实施方式不限于上述实施方式，能够在不脱离本发明的主旨范围内进一步进行各种变更。例如，在上述实施方式中，通过单个计算机实现字符识别系统，但是，也可通过由多个计算机进行的分散处理来实现。

标号说明

1：字符识别系统；10：计算机主体；11：运算装置；12：存储装置；121：程序保存部；122：识别辞典DB；123：字体检查用辞典DB；125：视频存储器；20：字体检查部；21：辞典生成部；25：字符识别部；30：显示器；32：输入装置。

Claims

1.一种字符识别系统，其用于识别计算机的显示器上显示的字符，其特征在于，

所述字符识别系统具有：

存储装置，其针对规定的显示字体和字符尺寸的组合，记录有识别辞典，所述识别辞典具有关于具备该显示字体和字符尺寸的各字符的构成点的配置的信息；以及

字符识别部，其参照所述识别辞典，提取与关于所述显示器上显示的识别对象字符的构成点的配置的信息完全一致的字符，由此确定所述识别对象字符。

2.根据权利要求1所述的字符识别系统，其特征在于，

所述字符识别系统具有辞典生成部，所述辞典生成部一边将具有所述显示字体和所述字符尺寸的字符依次显示在视频存储器上，一边取得关于各字符的构成点的配置的信息，生成所述识别辞典。

3.根据权利要求1或2所述的字符识别系统，其特征在于，

所述字符识别部参照针对与预先取得的所述识别对象字符的显示字体和字符尺寸的组合相同的组合的识别辞典，进行字符识别。

4.根据权利要求1至3中的任意一项所述的字符识别系统，其特征在于，

关于所述构成点的配置的信息是包含各字符的全部构成点的矩形外框内的点配置位置的信息。

5.一种字符识别程序，其用于使计算机识别显示器上显示的字符，其特征在于，

所述字符识别程序使所述计算机执行以下步骤：

识别辞典生成步骤，针对规定的显示字体和字符尺寸的组合，生成识别辞典，所述识别辞典具有关于具备该显示字体和字符尺寸的各字符的构成点的配置的信息；以及

字符识别步骤，参照所述识别辞典，提取与关于所述显示器上显示的识别对象字符的构成点的配置的信息完全一致的字符，由此确定所述识别对象字符。

6.一种字符识别方法，其用于识别计算机的显示器上显示的字符，其特征在于，

所述字符识别方法具有以下步骤：