CN104981819A - 字符识别系统、字符识别程序以及字符识别方法 - Google Patents
字符识别系统、字符识别程序以及字符识别方法 Download PDFInfo
- Publication number
- CN104981819A CN104981819A CN201380072613.XA CN201380072613A CN104981819A CN 104981819 A CN104981819 A CN 104981819A CN 201380072613 A CN201380072613 A CN 201380072613A CN 104981819 A CN104981819 A CN 104981819A
- Authority
- CN
- China
- Prior art keywords
- character
- dictionary
- display
- character recognition
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T1/00—General purpose image data processing
- G06T1/60—Memory management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
- G06T11/60—Editing figures and text; Combining figures or text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/22—Character recognition characterised by the type of writing
- G06V30/224—Character recognition characterised by the type of writing of printed characters having additional code marks or containing code marks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/24—Character recognition characterised by the processing or recognition method
- G06V30/242—Division of the character sequences into groups prior to recognition; Selection of dictionaries
- G06V30/244—Division of the character sequences into groups prior to recognition; Selection of dictionaries using graphical properties, e.g. alphabet type or font
- G06V30/245—Font recognition
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09G—ARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
- G09G5/00—Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators
- G09G5/36—Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators characterised by the display of a graphic pattern, e.g. using an all-points-addressable [APA] memory
- G09G5/39—Control of the bit-mapped memory
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computer Hardware Design (AREA)
- Character Discrimination (AREA)
Abstract
提供一种能够以高的准确率识别计算机的显示器上显示的字符的字符识别系统。字符识别系统(1)用于识别计算机的显示器(30)上显示的字符,其中,所述字符识别系统(1)具有:存储装置(122),其针对规定的显示字体和字符尺寸的组合,记录有识别辞典,所述识别辞典具有关于具备该显示字体和字符尺寸的各字符的构成点的配置的信息;以及字符识别部(25),其参照识别辞典,提取与关于显示器(30)上显示的识别对象字符的构成点的配置的信息完全一致的字符,由此确定识别对象字符。
Description
技术领域
本发明涉及字符识别系统。
背景技术
以往,提供了用于光学读取被打印在纸上的字符而进行识别的光学字符识别系统,例如,在下述专利文献1、2中作了公开。
另一方面,如下述专利文献3所公开的那样,为了在系统之间或应用程序之间进行数据的交接,需要借助通过画面捕捉得到的图像数据,识别计算机的显示器上显示的字符。
现有技术文献
专利文献
专利文献1:日本特开2008-305126号公报
专利文献2:日本特开2010-26805号公报
专利文献3:日本特开2011-81537号公报
发明内容
发明所要解决的课题
但是,显示器上的显示字符与被打印在纸上的字符相比,点的分辨率粗,所以即使采用现有的光学字符识别的手法,有时候识别率也会大幅下降。尤其是对于为了增大显示数据量而使用的小字符尺寸的字符而言,识别率极端地降低。
本发明就是鉴于上述课题而完成的,其目的在于提供一种字符识别系统,其能够以高的准确率识别显示在计算机的显示器上的字符。
用于解决课题的手段
为了解决上述课题,本发明的字符识别系统用于识别计算机的显示器上显示的字符,其特征在于,所述字符识别系统具有:存储装置,其针对规定的显示字体和字符尺寸的组合,记录有识别辞典,所述识别辞典具有关于具备该显示字体和字符尺寸的各字符的构成点的配置的信息;以及字符识别部,其参照所述识别辞典,提取与关于所述显示器上显示的识别对象字符的构成点的配置的信息完全一致的字符,由此确定所述识别对象字符。
此外,本发明的字符识别程序用于使计算机识别显示器上显示的字符,其特征在于,所述字符识别程序使所述计算机执行以下步骤:识别辞典生成步骤,针对规定的显示字体和字符尺寸的组合,生成识别辞典,所述识别辞典具有关于具备该显示字体和字符尺寸的各字符的构成点的配置的信息;以及字符识别步骤,参照所述识别辞典,提取与关于所述显示器上显示的识别对象字符的构成点的配置的信息完全一致的字符,由此确定所述识别对象字符。
此外,本发明的字符识别方法用于识别计算机的显示器上显示的字符,其特征在于,所述字符识别方法具有以下步骤:识别辞典生成步骤,针对规定的显示字体和字符尺寸的组合,生成识别辞典,所述识别辞典具有关于具备该显示字体和字符尺寸的各字符的构成点的配置的信息;以及字符识别步骤,参照所述识别辞典,提取与关于所述显示器上显示的识别对象字符的构成点的配置的信息完全一致的字符,由此确定所述识别对象字符。
发明效果
根据本发明,即使是显示在计算机的显示器上的分辨率低的字符,也能够高精度地进行字符识别。
附图说明
图1是概略地示出本发明的实施方式的字符识别系统的结构的示意图。
图2是示出本发明的实施方式的识别辞典的内容的图。
图3是概略地示出本发明的实施方式的字符识别系统的功能的框图。
图4是示出本发明的实施方式的识别辞典的生成处理的流程的流程图。
图5是示出本发明的实施方式的字符识别的处理的流程的流程图。
图6是用于说明本发明的实施方式的字符识别的处理的图。
具体实施方式
下面,参照附图详细说明本发明的实施方式的字符识别系统。图1是概略地示出本实施方式的字符识别系统的结构的示意图。图2是示出本实施方式的识别辞典的内容的图。图3是概略地示出本实施方式的字符识别系统的功能的框图。
如图1所示,字符识别系统1具有:计算机主体10;显示器30,其是显示来自计算机主体10的输出信息的显示装置;以及键盘和鼠标等输入装置32,其用于将信息输入到计算机主体10。
本实施方式的字符识别系统1是用于识别显示器30上显示的字符的系统,其特征在于,在进行字符识别时,不是利用光学字符识别,而是根据关于构成字符的构成点的配置的信息是否完全一致,来进行字符的确定。在本实施方式中,以识别应用程序A在显示器30上的显示窗口内的规定的识别对象区域中显示的显示字符的情况为例进行说明。
计算机主体10具有:用于进行各种运算的CPU(Central Processing Unit,中央处理单元)等运算装置11;以及用于存储各种信息的HDD(Hard Disc Drive,硬盘驱动器)和作为运算处理的工作区进行使用的RAM(Random Access Memory,随机存取存储器)等存储装置12。
存储装置12具有:程序保存部121,其保存有安装于计算机主体10的OS(Operating System:操作系统)、字符识别程序、识别辞典生成程序、字体检查程序、应用程序A等各种程序;识别辞典DB(数据库)122,其保存有在进行字符识别时使用的识别辞典;用于字体检查的字体检查用辞典DB 123;以及视频存储器125,其临时保持显示器30上显示的画面内容。
关于程序保存部121,字符识别程序是用于执行后述的字符识别处理的程序,识别辞典生成程序是用于执行后述的识别辞典的生成处理的程序。此外,字体检查程序是用于在进行识别辞典的生成和字符识别时,取得识别对象字符的显示字体和字符尺寸的信息的程序。
在识别辞典DB 122中,按照显示字体和字符尺寸的每种组合,生成识别辞典并进行记录。参照图2来说明识别辞典的识别辞典记录的内容。识别辞典DB 122内的各记录具有“辞典ID”、“显示字体”、“字符尺寸”、“字符代码”、“外框内点配置”、“外框尺寸”、“外框位置”的项目。
“辞典ID”是各识别辞典的识别符,如果是相同显示字体和字符尺寸的组合,则为相同的识别符,如果显示字体和字符尺寸的至少一个不同,则为不同的识别符。“显示字体”、“字符尺寸”和“字符代码”是作为该记录的生成源的字符的字体、尺寸、字符代码。
“外框内点配置”是包含构成辞典生成源的字符的全部构成点的最小矩形外框内的点配置位置的信息。例如,将配置有黑色点的位置设为“1”,将没有配置的空白位置设为“0”,从矩形外框内的左上朝向右下,按照每行以“00110101110000”的形式进行记录。
“外框尺寸”是上述最小矩形外框的纵横的尺寸信息(点的个数)。“外框位置”是从基线(标准底线)到上述最小矩形外框的下边的距离。在本实施方式中,“外框内点配置”、“外框尺寸”、“外框位置”的项目相当于关于字符的构成点的配置的信息。
字体检查用辞典DB 123内记录的字体检查用辞典是用于在进行识别辞典的生成和字符识别时,取得识别对象字符的显示字体和字符尺寸的信息的辞典。字体检查用辞典仅针对例如“あいうえお”等规定的检查用的多种字符,具有与关于计算机主体10中安装的全部字体的全部尺寸的上述识别辞典相同的信息。
接着,参照图3来说明字符识别系统1的功能。如该图所示,字符识别系统1具有:字体检查部20,其具有识别显示器30上显示的显示字符的显示字体和字符尺寸的功能;辞典生成部21,其具有预先生成上述识别辞典的功能;以及字符识别部25,其具有进行字符识别的功能。
这各个部分的功能是使运算装置11执行程序保存部121中保存的字体检查程序、识别辞典生成程序、字符识别程序来实现的。
接着,进一步参照图4来说明识别辞典DB 122中记录的识别辞典的生成处理的流程。图4是示出本实施方式的识别辞典的生成处理的流程的流程图。
识别辞典的生成是在后述的字符识别处理之前进行的,辞典生成部21生成针对之后待识别的识别对象字符的显示字体和字符尺寸的组合的识别辞典。当然,在已经针对相同显示字体和字符尺寸的组合生成了识别辞典的情况下,无需再次进行辞典的生成,只要使用已经登记的识别辞典即可。
在识别辞典的生成时,在计算机主体10中执行识别辞典生成程序。首先,在S11中,进行生成识别辞典所需的显示字体和字符尺寸的取得。该字符尺寸等的取得是启动字体检查程序而进行的。
这里生成的识别辞典是应用程序A在显示窗口内的规定的识别对象区域内显示的识别对象字符的显示字体和字符尺寸的组合的识别辞典,所以字体检查程序参照记录在字体检查用辞典DB 123内的字体检查用辞典,自动确定该识别对象字符的显示字体和字符尺寸。
具体而言,字体检查部20通过画面捕捉从视频存储器125取得识别对象字符的图像数据,一边参照字体检查用辞典DB 123,一边提取与构成识别对象字符的点的配置信息完全一致的字符。由此,确定与识别对象字符相同字体和相同尺寸的字符,能够取得识别对象区域中显示的字符的显示字体和字符尺寸的信息。
另外,参照该字体检查用辞典DB 123提取字符的处理与后述的字符识别的处理相同,所以省略详细的说明。此外,字体检查用辞典是仅针对检查用的多种字符的辞典,所以在进行字体检查时,操作员需要预先进行字符的输入等作业,以使该检查用的字符作为识别对象字符显示在识别对象区域内。
与现有的光学字符识别不同,在本实施方式中,根据字符的构成点的配置位置是否相同,进行字符的识别,如果显示字体或字符尺寸不同,则会被识别为其他字符。因此,识别辞典也需要按照显示字体和字符尺寸的每种组合,生成各自的识别辞典。另外,如果可能的话,可以由操作员手动设定S11的字体检查。
接着,进到S12,将在S11中取得的显示字体和字符尺寸的字符依次显示在显示器30(视频存储器125)上。这里显示的字符是具有该显示字体和字符尺寸并安装于计算机主体10的全部字符。具体而言,因显示字体不同而不同,例如是JIS非汉字、JIS第一汉字、JIS第二汉字中包含的全部字符。
当显示最初的字符时,在S13中,进行外框的设定。该外框是包含构成所显示的字符的全部构成点的最小的矩形外框。接着,在S14中,将识别辞典记录与关于外框内的点的配置的信息共同登记到识别辞典DB 122内。识别辞典记录的具体内容为上述的“辞典ID”、“显示字体”、“字符尺寸”、“字符代码”、“外框内点配置”、“外框尺寸”、“外框位置”的信息。
接着,在S15中,判定是否针对与该显示字体和字符尺寸的组合相关的全部字符结束了辞典登记,在存在仍未登记的字符的情况下,返回S12,重复S12~S14的处理,对下一个字符进行辞典登记。在S15中,在判断为针对全部字符进行了辞典登记的情况下,结束针对该显示字体和字符尺寸的组合而进行的识别辞典的登记。
不需要针对计算机主体10的OS所具有的全部显示字体的全部字符尺寸预先进行该识别辞典的生成,也可以在进行字符识别时,针对具有识别对象区域内显示的字符的显示字体和字符尺寸的组合的全部字符生成识别辞典。
接着,参照图5和图6来说明本实施方式的字符识别的处理的流程。图5是示出本实施方式的字符识别处理的流程的流程图。图6是用于说明本实施方式的字符识别处理的图。
首先,在S21中,取得识别对象字符的显示字体和字符尺寸。该字符尺寸等的取得是启动字体检查程序来进行的,是与上述的S11相同的处理。此外,在接着识别辞典的生成而进行字符识别处理的情况下,由于已经通过S11进行了显示字体和字符尺寸的取得,所以可省略S21。
通过该显示字体和字符尺寸的取得,确定识别辞典DB 122内记录的识别辞典之中的、在本次的字符识别中使用的识别辞典。
接着,在S22中,进行识别对象字符的外框设定。具体而言,从视频存储器125取得应用程序A的识别对象区域的图像数据,按照该区域内显示的每个字符进行了分割后,按照每个字符设定包含了各字符的全部构成点的最小的矩形外框。图6表示按照每个字符设定了最小矩形外框的情况。
在S23中,进行基于“外框尺寸”的信息而实施的字符的缩减(一次筛选)。即,提取识别辞典中含有的字符之中具有与针对识别对象字符设定的外框的尺寸相同尺寸的字符。
接着,在S24中,判定是否通过S23中的筛选将字符确定为一个。在通过一次筛选缩至一个字符的情况下,能够确定识别对象字符是此字符,所以字符识别处理结束。
在S24中,在判断为未确定的情况下,进到S25,进行基于“外框内点配置”的信息而实施的字符的缩减(二次筛选)。即,提取通过一次筛选提取出的字符之中具有与针对识别对象字符设定的外框内的点配置位置相同的配置位置的字符。
接着,在S26中,判定是否通过S25中的筛选将字符确定为一个,在确定为一个的情况下,结束字符识别,在不是这样的情况下进到S27,进行三次筛选。例如,在识别对象字符为“’”或者“,”的字符的情况下,“外框尺寸”和“外框内点配置”相同,所以进到S27。在S27中,根据“外框位置”的信息进行字符的缩减,确定字符。
在识别对象区域内包含多个字符的情况下,可以按照每个字符重复进行S23~S27。此外,在通过S21的字体检查,在识别对象区域内存在多个显示字体和字符尺寸的组合的情况下,可以参照多个识别辞典进行字符识别。
此外,上述的筛选顺序也可适当变更。此外,虽然在上述实施方式中,设定了最小矩形外框之后,使用“外框尺寸”、“外框位置”、“外框内点配置”进行了字符识别,但是,作为用于进行字符识别的“关于构成字符的点的配置的信息”,可以使用各种各样的其他信息,例如,可以使用外框内的第1行的黑点的数等。
以上,说明了本实施方式的字符识别系统,根据本实施方式,基于构成字符的点的配置信息,进行显示在显示器30上的显示字符的识别,从而能够以大致100%的识别率进行字符识别。
本实施方式的识别字符对象是显示在计算机的显示器30(视频存储器125)上的字符,不像被打印在纸上的字符那样存在污损或残缺,所以,只要根据点的配置信息,即可可靠地确定字符。
不过,如果字符的显示字体或字符尺寸不同,则点配置也不同,所以在本实施方式的字符识别的情况下,需要预先掌握识别对象字符的显示字体和字符尺寸,然后生成基于相同的显示字体和字符尺寸的组合的识别辞典,执行字符识别处理。
此外,如本实施方式那样,使用多个构成字符的点的配置信息,分阶段进行筛选,从而能够降低字符识别的处理负荷,进行高速高效的字符识别。
接着,说明本实施方式的变形例。首先,在显示器30上的显示字符是实施了抗锯齿处理的字符的情况下,如果在进行上述的字体检查、识别辞典的生成、字符识别等处理之前,以相同的基准从字符的图像数据中减去指定彩度之外、指定明度之外的点,则能够进行排除了抗锯齿处理的影响的字符识别。
此外,在显示器30上的显示字符是下划线、粗体字符等实施了字符修饰的字符的情况下,在生成识别辞典和字体检查用辞典时,也可以追加地生成实施了相同的字符修饰的字符的识别辞典记录,由此,针对被修饰过的字符也能够准确地进行字符识别。
此外,即使在包含半角字符的情况下,也能够通过生成半角字符的识别辞典,准确地进行字符识别。
以上,对本发明的实施方式进行了说明,但是本发明的实施方式不限于上述实施方式,能够在不脱离本发明的主旨范围内进一步进行各种变更。例如,在上述实施方式中,通过单个计算机实现字符识别系统,但是,也可通过由多个计算机进行的分散处理来实现。
标号说明
1:字符识别系统;10:计算机主体;11:运算装置;12:存储装置;121:程序保存部;122:识别辞典DB;123:字体检查用辞典DB;125:视频存储器;20:字体检查部;21:辞典生成部;25:字符识别部;30:显示器;32:输入装置。
Claims (6)
1.一种字符识别系统,其用于识别计算机的显示器上显示的字符,其特征在于,
所述字符识别系统具有:
存储装置,其针对规定的显示字体和字符尺寸的组合,记录有识别辞典,所述识别辞典具有关于具备该显示字体和字符尺寸的各字符的构成点的配置的信息;以及
字符识别部,其参照所述识别辞典,提取与关于所述显示器上显示的识别对象字符的构成点的配置的信息完全一致的字符,由此确定所述识别对象字符。
2.根据权利要求1所述的字符识别系统,其特征在于,
所述字符识别系统具有辞典生成部,所述辞典生成部一边将具有所述显示字体和所述字符尺寸的字符依次显示在视频存储器上,一边取得关于各字符的构成点的配置的信息,生成所述识别辞典。
3.根据权利要求1或2所述的字符识别系统,其特征在于,
所述字符识别部参照针对与预先取得的所述识别对象字符的显示字体和字符尺寸的组合相同的组合的识别辞典,进行字符识别。
4.根据权利要求1至3中的任意一项所述的字符识别系统,其特征在于,
关于所述构成点的配置的信息是包含各字符的全部构成点的矩形外框内的点配置位置的信息。
5.一种字符识别程序,其用于使计算机识别显示器上显示的字符,其特征在于,
所述字符识别程序使所述计算机执行以下步骤:
识别辞典生成步骤,针对规定的显示字体和字符尺寸的组合,生成识别辞典,所述识别辞典具有关于具备该显示字体和字符尺寸的各字符的构成点的配置的信息;以及
字符识别步骤,参照所述识别辞典,提取与关于所述显示器上显示的识别对象字符的构成点的配置的信息完全一致的字符,由此确定所述识别对象字符。
6.一种字符识别方法,其用于识别计算机的显示器上显示的字符,其特征在于,
所述字符识别方法具有以下步骤:
识别辞典生成步骤,针对规定的显示字体和字符尺寸的组合,生成识别辞典,所述识别辞典具有关于具备该显示字体和字符尺寸的各字符的构成点的配置的信息;以及
字符识别步骤,参照所述识别辞典,提取与关于所述显示器上显示的识别对象字符的构成点的配置的信息完全一致的字符,由此确定所述识别对象字符。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013025232A JP6080586B2 (ja) | 2013-02-13 | 2013-02-13 | 文字認識システム、文字認識プログラム及び文字認識方法 |
JP2013-025232 | 2013-02-13 | ||
PCT/JP2013/059508 WO2014125658A1 (ja) | 2013-02-13 | 2013-03-29 | 文字認識システム、文字認識プログラム及び文字認識方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104981819A true CN104981819A (zh) | 2015-10-14 |
Family
ID=51353681
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201380072613.XA Pending CN104981819A (zh) | 2013-02-13 | 2013-03-29 | 字符识别系统、字符识别程序以及字符识别方法 |
Country Status (8)
Country | Link |
---|---|
US (1) | US9639970B2 (zh) |
EP (1) | EP2958055A4 (zh) |
JP (1) | JP6080586B2 (zh) |
KR (1) | KR102024127B1 (zh) |
CN (1) | CN104981819A (zh) |
MY (1) | MY173006A (zh) |
SG (1) | SG11201506275XA (zh) |
WO (1) | WO2014125658A1 (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6269256B2 (ja) * | 2014-03-31 | 2018-01-31 | 京セラドキュメントソリューションズ株式会社 | 情報処理装置、画像形成装置、情報処理方法、及び情報処理プログラム |
JP7087829B2 (ja) * | 2018-08-27 | 2022-06-21 | 富士通株式会社 | 情報処理装置、書込制御プログラム、及び書込制御方法 |
KR102643324B1 (ko) * | 2020-10-29 | 2024-03-07 | 닛폰세이테츠 가부시키가이샤 | 식별 장치, 식별 방법 및 프로그램 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040141644A1 (en) * | 2002-10-17 | 2004-07-22 | Nec Corporation | Portable communication apparatus having a character recognition function |
CN1675652A (zh) * | 2002-08-07 | 2005-09-28 | 松下电器产业株式会社 | 字符识别处理设备、字符识别处理方法和便携式终端设备 |
CN1752993A (zh) * | 2004-09-24 | 2006-03-29 | 北京中星微电子有限公司 | 一种显示操作终端进行光符识别的方法 |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63106882A (ja) * | 1986-10-24 | 1988-05-11 | Tokyo Keiki Co Ltd | 活字文字認識装置の文字フオント決定方式 |
JPH03214377A (ja) * | 1990-01-19 | 1991-09-19 | Sony Corp | 文字認識装置 |
US5781914A (en) * | 1995-06-30 | 1998-07-14 | Ricoh Company, Ltd. | Converting documents, with links to other electronic information, between hardcopy and electronic formats |
JPH0922442A (ja) * | 1995-07-04 | 1997-01-21 | Advantest Corp | イメージ・ドキュメント資料の電子管理システム |
JP3382071B2 (ja) * | 1995-09-13 | 2003-03-04 | 株式会社東芝 | 文字コード取得装置 |
JPH1196289A (ja) * | 1997-09-19 | 1999-04-09 | Nec Corp | 画面データ変換装置及び方法 |
US6151423A (en) * | 1998-03-04 | 2000-11-21 | Canon Kabushiki Kaisha | Character recognition with document orientation determination |
US6473517B1 (en) * | 1999-09-15 | 2002-10-29 | Siemens Corporate Research, Inc. | Character segmentation method for vehicle license plate recognition |
JP3945778B2 (ja) * | 2004-03-12 | 2007-07-18 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 設定装置、プログラム、記録媒体、及び設定方法 |
JP2008071214A (ja) * | 2006-09-15 | 2008-03-27 | Kochi Univ Of Technology | 文字認識辞書作成方法及びその装置及び文字認識方法及びその装置及びプログラムを格納した記憶媒体 |
JP2008305126A (ja) | 2007-06-07 | 2008-12-18 | Seiko Epson Corp | 文字認識方法および文字認識システム |
US20080310721A1 (en) * | 2007-06-14 | 2008-12-18 | John Jinhwan Yang | Method And Apparatus For Recognizing Characters In A Document Image |
US7929764B2 (en) * | 2007-06-15 | 2011-04-19 | Microsoft Corporation | Identifying character information in media content |
CN101419661B (zh) | 2007-10-26 | 2011-08-24 | 国际商业机器公司 | 基于图像中的文本进行图像显示的方法和系统 |
JP2010026805A (ja) | 2008-07-18 | 2010-02-04 | Denso Corp | 文字認識装置及び文字認識方法 |
US20100128994A1 (en) | 2008-11-24 | 2010-05-27 | Jan Scott Zwolinski | Personal dictionary and translator device |
JP5493807B2 (ja) * | 2009-02-04 | 2014-05-14 | 株式会社リコー | 画像通信装置、画像通信システム及び制御プログラム |
JP5343617B2 (ja) * | 2009-02-25 | 2013-11-13 | 富士通株式会社 | 文字認識プログラム、文字認識方法および文字認識装置 |
JP5469985B2 (ja) | 2009-10-06 | 2014-04-16 | 株式会社ピーエスシー | データ受渡方法及び汎用データ取得方法 |
-
2013
- 2013-02-13 JP JP2013025232A patent/JP6080586B2/ja active Active
- 2013-03-29 EP EP13875167.2A patent/EP2958055A4/en not_active Withdrawn
- 2013-03-29 CN CN201380072613.XA patent/CN104981819A/zh active Pending
- 2013-03-29 SG SG11201506275XA patent/SG11201506275XA/en unknown
- 2013-03-29 MY MYPI2015702473A patent/MY173006A/en unknown
- 2013-03-29 WO PCT/JP2013/059508 patent/WO2014125658A1/ja active Application Filing
- 2013-03-29 KR KR1020157018711A patent/KR102024127B1/ko active IP Right Grant
-
2015
- 2015-08-13 US US14/826,163 patent/US9639970B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1675652A (zh) * | 2002-08-07 | 2005-09-28 | 松下电器产业株式会社 | 字符识别处理设备、字符识别处理方法和便携式终端设备 |
US20040141644A1 (en) * | 2002-10-17 | 2004-07-22 | Nec Corporation | Portable communication apparatus having a character recognition function |
CN1752993A (zh) * | 2004-09-24 | 2006-03-29 | 北京中星微电子有限公司 | 一种显示操作终端进行光符识别的方法 |
Non-Patent Citations (1)
Title |
---|
XIANLI WU ET AL.: "a recognition algorithm for chinese characters in diverse fonts", 《INTERNATIONAL CONFERENCE ON IMAGE PROCESSING(ICIP),IEEE》 * |
Also Published As
Publication number | Publication date |
---|---|
JP2014154066A (ja) | 2014-08-25 |
KR102024127B1 (ko) | 2019-09-23 |
WO2014125658A1 (ja) | 2014-08-21 |
US20150356764A1 (en) | 2015-12-10 |
MY173006A (en) | 2019-12-18 |
EP2958055A4 (en) | 2016-09-21 |
SG11201506275XA (en) | 2015-09-29 |
US9639970B2 (en) | 2017-05-02 |
JP6080586B2 (ja) | 2017-02-15 |
EP2958055A1 (en) | 2015-12-23 |
KR20150116821A (ko) | 2015-10-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10853638B2 (en) | System and method for extracting structured information from image documents | |
US20240119219A1 (en) | Determining functional and descriptive elements of application images for intelligent screen automation | |
US8295590B2 (en) | Method and system for creating a form template for a form | |
US8494273B2 (en) | Adaptive optical character recognition on a document with distorted characters | |
US8467614B2 (en) | Method for processing optical character recognition (OCR) data, wherein the output comprises visually impaired character images | |
CN111291572B (zh) | 一种文字排版方法、装置及计算机可读存储介质 | |
WO2015183015A1 (ko) | 문자 인식 방법 및 그 장치 | |
CN107633055B (zh) | 一种将图片转成html文档的方法 | |
JP2005173730A (ja) | 帳票ocrプログラム、方法及び装置 | |
US11475688B2 (en) | Information processing apparatus and information processing method for extracting information from document image | |
JP2008204226A (ja) | 帳票認識装置およびそのプログラム | |
US8750571B2 (en) | Methods of object search and recognition | |
CN104981819A (zh) | 字符识别系统、字符识别程序以及字符识别方法 | |
Khan et al. | TabAug: data driven augmentation for enhanced table structure recognition | |
CN112508000A (zh) | 一种用于ocr图像识别模型训练数据生成的方法及设备 | |
JP7486574B2 (ja) | コンテキスト・フリーの再帰的な文書分解による拡張性のある構造学習 | |
WO2010035390A1 (ja) | Gui評価システム、gui評価方法およびgui評価用プログラム | |
JP7178445B2 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
CN110858305B (zh) | 使用已安装字体辨识画面文字的系统及方法 | |
Zinjore et al. | Identification and removal of Devanagari script and extraction of roman words from printed bilingual text document | |
US20100254606A1 (en) | Method of recognizing text information from a vector/raster image | |
JP2024091186A (ja) | 電子文書の閲覧用電子機器 | |
Ahmed et al. | Arabic Scene Text Acquisition and Statistics | |
CN106845473B (zh) | 用于确定图像是否为带地址信息的图像的方法和装置 | |
JP2022162380A (ja) | 情報処理装置、情報処理方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20151014 |