CN105739882B - 用于字符识别的计算机可读记录介质、方法及设备 - Google Patents
用于字符识别的计算机可读记录介质、方法及设备 Download PDFInfo
- Publication number
- CN105739882B CN105739882B CN201510969247.9A CN201510969247A CN105739882B CN 105739882 B CN105739882 B CN 105739882B CN 201510969247 A CN201510969247 A CN 201510969247A CN 105739882 B CN105739882 B CN 105739882B
- Authority
- CN
- China
- Prior art keywords
- stroke
- character
- target verification
- data
- probability
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0487—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
- G06F3/0488—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures
- G06F3/04883—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures for inputting data by handwriting, e.g. gesture or text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/32—Digital ink
- G06V30/333—Preprocessing; Feature extraction
- G06V30/347—Sampling; Contour coding; Stroke extraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/24—Character recognition characterised by the processing or recognition method
- G06V30/242—Division of the character sequences into groups prior to recognition; Selection of dictionaries
- G06V30/244—Division of the character sequences into groups prior to recognition; Selection of dictionaries using graphical properties, e.g. alphabet type or font
- G06V30/2455—Discrimination between machine-print, hand-print and cursive writing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/32—Digital ink
- G06V30/36—Matching; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- General Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Character Discrimination (AREA)
Abstract
本申请涉及用于字符识别的计算机可读记录介质、方法及设备。字符识别设备包括存储装置和处理器,处理器执行方法,所述方法包括:根据与输入操作对应的输入坐标数据来生成输入笔划数据;根据输入笔划数据来生成笔划组合候选以及与笔划组合候选对应的评估数据,笔划候选包括目标验证笔划,目标验证笔划被组合以构成目标验证字符;基于目标验证笔划的出现概率、存储在存储装置中的每个笔划的出现概率数据以及评估数据来从笔划组合候选中标识第一笔划组合;以及基于第一笔划组合来输出与输入操作对应的字符。出现概率指示目标验证笔划在目标验证字符中的每个目标验证字符中出现的概率。出现概率数据是基于目标验证笔划的出现概率生成的。
Description
技术领域
本文所讨论的实施方式涉及一种用于字符识别的计算机可读记录介质、方法及设备。
背景技术
以往,已知一种用于识别手工输入的字符的字符识别技术。例如,一种已知的字符识别技术通过输入到框中的笔划(笔迹)来识别字符。另一种已知的字符识别技术通过将输入笔划转换成位置信息,并依靠转换的位置信息和字形的位置信息来识别字符。
<现有技术文献>
专利文献1:日本特开专利公开No.2000-105798
专利文献2:日本特开专利公开No.2013-238917
然而,对于常规字符识别技术,如根据输入到框中的笔划来识别字符的字符识别技术而言,字符可能由于无法区分之前输入或之后输入的笔划而被错误地识别。在通过依靠笔划和字形的位置信息来识别字符的情况下,字符可能由于难以精确确定字符之间的边界而被错误地识别(特别是,在识别用少量笔划输入的字符如数字的情况下)。
也就是说,对于通过相应笔划来估计字符的常规字符识别技术而言,在识别用少量笔划输入的和具有简单字符形状的字符的情况下,仅通过从输入笔划获得的信息不能精确地识别字符。
发明内容
根据本发明内容的一个方面,提供了一种存储有字符识别程序的非暂态计算机可读记录介质,该字符识别程序使得计算机执行处理。处理包括:根据与输入操作对应的输入坐标数据来生成输入笔划数据;根据输入笔划数据来生成多个笔划组合候选以及与多个笔划组合候选对应的评估数据,多个笔划候选包括目标验证笔划,目标验证笔划被组合以构成一个或更多个目标验证字符;基于目标验证笔划的出现概率、存储在存储装置中的每个笔划的出现概率数据以及评估数据,从多个笔划组合候选中标识第一笔划组合;以及基于第一笔划组合来输出与输入操作对应的字符。目标验证笔划的出现概率指示目标验证笔划在一个或更多个目标验证字符中的每个目标验证字符中出现的概率。出现概率数据是基于目标验证笔划的出现概率生成的。
本发明的目的和优点将借助于在权利要求中特别指出的元件及组合来实现和获得。
要理解的是,前面的一般描述和下面的详细描述都是示例性和解释性的,而不对如要求保护的本发明内容进行限制。
附图说明
图1是示出了根据本发明的实施方式的程序配置的示意图;
图2是示出了根据本发明的实施方式的字符识别设备的硬件配置的示意图;
图3是示出了根据本发明的实施方式的字符识别设备的功能(功能部分)的示意图;
图4是示出了根据本发明的实施方式的统计数据生成部的功能配置的示意图;
图5是示出了根据本发明的实施方式的字符确定部的功能配置的示意图;
图6是示出了根据本发明的实施方式的字符识别设备的操作的流程图;
图7是示出了根据本发明的实施方式的统计数据生成部的操作的流程图;
图8是示出了根据本发明的实施方式的数值数据提取部的操作的示意图;
图9是示出了根据本发明的实施方式的笔划词典数据库的示例的示意图;
图10是示出了根据本发明的实施方式的笔划数据库的示意图;
图11是用于描述根据本发明的实施方式的出现概率计算部的操作的示意图;
图12是示出了根据本发明的实施方式的统计数据库的示意图;
图13是示出了根据本发明的实施方式的字符确定部的操作流程图;
图14A和图14B是用于描述评估值表的示意图;
图15是示出了根据本发明的实施方式的由模式生成部生成的笔划的组合的模式的示意图;
图16A和图16B是用于描述根据本发明的实施方式的统计验证结果表的示意图;
图17是示出了根据本发明的第二实施方式的分割位置表的示意图;
图18是示出了根据本发明的实施方式的笔划时间表的示意图;
图19A和图19B是示出了根据本发明的实施方式的使用笔划时间表设置的值的示意图;
图20A和图20B是示出了根据本发明的实施方式的时间验证结果表的配置的示意图;以及
图21A和图21B是用于描述根据本发明的实施方式的结果表的示意图。
具体实施方式
接下来,将参照附图来描述本发明的实施方式。图1是示出了根据本发明的实施方式的程序配置的示意图。
统计数据生成程序10、字符确定程序20和识别程序30是在本实施方式中主要使用的程序。
统计数据程序10从大量文档数据(例如,所谓的“大数据”)中提取数字,并且生成统计数据,该统计数据指示包括在所提取的数字中的笔划的每个组合的出现概率。要注意的是,术语“笔划”指的是笔迹。例如,一个笔划与从起点至终点的一个笔迹对应。
字符确定程序20参照所生成的统计数据,并且基于输入的笔划的组合来确定字符之间的边界。也就是说,在输入的笔划中,字符确定程序20确定笔划中的哪些笔划构成单个字符。
识别程序30识别由被确定为构成单个字符的笔划所指示的字符。
可以将本实施方式中的统计数据生成程序10、字符确定程序20和识别程序30共同安装在单个设备中,或者分开地安装在相应的设备中。替选地,可以将字符确定程序20和识别程序30作为字符识别程序安装在单个设备中。
在下面的实施方式中,将统计数据生成程序10、字符确定程序20和识别程序30安装在单个设备中。在下面的实施方式中,将其中安装有统计数据生成程序10、字符确定程序20和识别程序30的设备称为“字符识别设备”。
图2是示出了根据本发明的实施方式的字符识别设备1的硬件配置的示意图。本实施方式的字符识别设备1包括操作显示装置11、驱动装置12、辅助存储装置13、存储装置14、运算处理装置(处理器)15以及接口装置16,这些装置通过总线B彼此连接。
操作显示装置11例如是用于输入各种信号和显示(输出)各种信号的触摸面板。接口装置16例如包括用于连接到网络的调制解调器或LAN(局域网)卡。
统计数据生成程序10、字符确定程序20和识别程序30是对字符识别设备1进行控制的多种程序中的一部分程序。统计数据生成程序10、字符确定程序20和识别程序30中的每个可以通过记录介质17分发或从网络下载的方式来提供。记录有的统计数据生成程序10、字符确定程序20和识别程序30的记录介质17包括各种类型的记录介质。例如,记录介质17可以是以光学、电或磁性地记录信息的记录介质如CD-ROM、软盘或磁光盘。记录介质17还可以是电记录信息的记录介质如ROM或闪存。
此外,当记录有统计数据生成程序10、字符确定程序20和识别程序30的记录介质17被安装至驱动装置12时,记录在记录介质17中的每个程序经由驱动装置12安装到辅助存储装置13中。替选地,从网络下载的每个程序经由接口装置16安装到辅助存储装置13中。
除了存储安装的统计数据生成程序10、字符确定程序20和识别程序30以外,辅助存储装置13还存储例如所需的文件和数据。存储装置14在计算机启动时从辅助存储装置13中读出统计数据生成程序10、字符确定程序20和识别程序30,并且将所读出的程序存储在其中。然后,运算处理装置15根据存储在存储装置14中的每个程序来实现下面描述的各种处理。
图3是示出了字符识别设备1的功能(功能部)的示意图。本实施方式的字符识别设备1包括统计数据生成部100、字符确定部200和识别部300。
本实施方式的统计数据生成部100通过使用运算处理装置15执行统计数据生成程序10来实现。本实施方式的字符确定部200通过使用运算处理装置15执行字符确定程序20来实现。本实施方式的识别部300通过使用运算处理装置15执行识别程序30来实现。
本实施方式的字符识别设备1被描述作为主要接收数字的输入和识别数字的设备。
在本实施方式中,统计数据生成部100中预先包括有大容量文本数据库110、笔划词典数据库120和笔划时间表。
大容量文本数据库110存储有大容量数据如大数据。笔划词典数据库120存储有指示笔划的类型的笔划数据和指示每个笔划的使用率的使用率数据。笔划时间表230存储有针对输入笔划的时间的阈值。
统计数据生成部100从大容量文本数据库110中提取数值数据(由数字指示的数据),并且将数值数据存储在数值数据库130中。然后,统计数据生成部100通过参照笔划词典数据库120来计算包括在数值数据的数值字符中的笔划的每个组合出现的次数,并且将所计算的出现次数存储在笔划数据库140中。然后,统计数据生成部100生成与笔划的每个组合对应的N-gram统计数据,通过参照笔划数据库140来计算笔划的每个组合的出现概率,以及将所计算的出现概率存储在统计数据库150中。
本实施方式的字符确定部200包括输入接收部210和组合确定部220。当字符确定部200的输入接收部210接收输入到字符识别设备1的字符时,将输入字符的笔划的坐标值存储到输入笔划表211中。然后,字符确定部200的组合确定部220确定如下估计值:该估计值指示对每个输入笔划与存储在笔划词典数据库120中的笔划信息匹配的度。然后,组合确定部220将估计值存储在评估值表212中。
然后,组合确定部220确定根据输入到字符识别设备1的笔划的数量获得的笔划的组合的模式。然后,组合确定部220通过使用存储在统计数据库150中的笔划的每个组合的出现概率和存储在评估值表212中的估计值来计算每个模式的得分。然后,组合确定部220生成包括每个模式的计算得分的统计验证结果表213。
然后,组合确定部220参照统计验证结果表213,并且根据具有较高得分的预定数量的模式来确定可能是字符的边界(字符之间的边界)的位置。然后,组合确定部220生成包括所确定的边界位置的边界位置表214。然后,组合确定部220使用笔划时间表230的数据来验证输入笔划经过的时间,并且生成时间验证结果表215。
然后,组合确定部220参照边界位置表214和时间验证结果表215,并且生成结果表216,结果表216指示由输入到字符确定部200的多个笔划所构成的字符的边界的位置。
下面将详细描述本实施方式的统计数据生成部100和字符确定部200。
当生成结果表216时,识别部300基于结果表216中所指示的字符的边界来进行字符识别处理,并且输出所识别的字符作为字符识别处理的结果。
对于上述实施方式,相对于根据输入笔划的数量获得的笔划的组合的每个模式来计算基于评估值(根据输入的笔划和笔划数据获得)和笔划的组合的出现概率的得分。此外,对于上述实施方式,通过根据具有较高得分的笔划的组合的模式获得字符的界线(边界)来进行字符识别。因此,可以更精确地识别具有少量笔划的字符(例如,用几笔书写的数值字符)。此外,可以更精确地进行基于具有构成多个字符的可能性的笔划的字符识别。
接下来,将参照图4来描述根据本发明的实施方式的统计数据生成部100。图4是示出了根据本发明的实施方式的统计数据生成部100的功能配置的示意图。
本实施方式的统计数据生成部100包括文本数据参照部160、数值数据提取部170、笔划信息变换部180以及出现概率计算部190。
本实施方式的文本数据参照部160指的是大容量文本数据库110。例如,大容量文本数据库110可以设置在字符识别设备1内,或者设置在字符识别设备1外部的网络内。例如,大容量文本数据(例如,大数据)存储在大容量文本数据库110中。术语“大数据”指的是巨大团块的复杂数据集。
数值数据提取部170从大容量文本数据库110中提取指示数值形式的数值数据。也就是说,数值数据提取部170从大容量文本数据库110中提取为数值形式的文本数据。
笔划信息变换部180参照笔划词典数据库120,笔划信息变换部180获取包括在所提取的数值数据的数字中的笔划的组合,以及组合中的每个组合出现的次数。然后,笔划信息变换部180将所获取的笔划的组合和出现次数存储在笔划数据库140中。下面将详细描述笔划词典数据库120和笔划数据库140。
出现概率计算部190根据包括在数字中的笔划的组合来收集N-gram统计数据,计算由N个笔划构成的每个组合的出现概率,以及将计算结果存储在统计数据库150中。
下面将详细描述由统计数据生成的每个部分所执行的处理。
图5是示出了根据本发明的实施方式的字符确定部200的功能配置的示意图。本实施方式的字符确定部200包括输入接收部210和组合确定部220。
输入接收部210接收输入至字符识别设备1的笔划。组合确定部220包括输入笔划验证部221、评估值生成部222、模式生成部223、统计数据验证部224、边界位置输出部225、时间验证部226以及结果输出部227。
输入笔划验证部221生成输入笔划表211,在输入笔划表211中,输入笔划被存储作为坐标值。此外,输入笔划验证部221获取笔划被输入到字符识别设备1时的笔划时间信息,并且将笔划时间信息存储在输入笔划表211中。本实施方式的笔划时间信息与从检测到输入笔划的终点时的时间到检测到下一输入笔划的起点时的时间的非连续时段对应。
然后,输入笔划验证部221使用存储在笔划词典数据库120中的笔划信息来验证输入笔划。
评估值生成部222根据输入笔划验证部221的验证结果来生成每个输入笔划的评估值。在本实施方式中,笔划的评估值是指示输入笔划与存储在笔划词典数据库120中的笔划信息匹配的度的值(第一评估值)。
模式生成部223生成可以根据输入笔划的数量预期的笔划的组合的一个或更多个模式(组合候选)。统计数据验证部224使用存储在统计数据库150中的数据来验证每个生成的模式,基于包括在模式中的笔划的评估值和模式的出现概率(第二评估值)来计算得分,以及将所计算的得分存储在统计验证结果表213中。
边界位置输出部225通过参照统计验证结果表213来输出边界位置表214,边界位置表214指示字符在每个模式中的位置。
时间验证部226使用存储在笔划时间表230中的信息来验证由每个输入笔划获得的笔划时间信息,并且生成根据笔划时间信息的验证结果来改变其得分的时间验证结果表215。结果输出部227基于时间验证结果表215来输出存储每个输入笔划的字符的边界位置的结果表。
下面将详细描述由字符确定部200的每个部执行的处理。
接下来,描述根据本发明的实施方式的字符识别设备1的操作。图6是示出了根据本发明的实施方式的字符识别设备1的操作的流程图。
本实施方式的字符识别设备1通过字符确定部200的输入接收部210接收输入至字符识别设备1的一个或更多个笔划(步骤S61)。然后,字符识别设备1参照统计数据库150(步骤S62),并且通过组合确定部220来确定输入笔划的字符的边界位置(步骤S63)。也就是说,字符识别设备1根据输入到字符识别设备1的笔划来确定构成单个字符的笔划的组合。
然后,字符识别设备1通过识别部基于构成单个字符的笔划的组合来进行字符识别(步骤S64),并且输出字符作为由识别部进行的字符识别的结果(步骤S65)。
要注意的是,通过统计数据生成部100生成统计数据库150的处理不包括在图6所示的流程图中,这是因为假定统计数据库150在接收笔划的输入时已经被生成。然而,可以包括生成统计数据库150的处理。也就是说,当笔划输入到字符识别设备1时,字符识别设备1可以通过统计数据生成部100来生成统计数据库150。
接下来,描述根据本发明的实施方式的通过统计数据生成部100来生成统计数据库150的处理。
图7是示出了根据本发明的实施方式的统计数据生成部100的处理的流程图。本实施方式的统计数据生成部100通过文本数据参照部160读取存储在大容量文本数据库110中的文本数据(步骤S71)。然后,统计数据生成部100通过数值数据提取部170从由大容量文本数据库110读取的文本数据(步骤S71)中提取数值数据,并且将所提取的数值数据存储在数值数据库130中(步骤S72)。
然后,统计数据生成部100通过笔划数据变换部180对构成包括在所提取的文本数据中的数字的笔划的一个或更多个组合以及每个组合出现的次数进行计算,并且将计算的组合和出现次数存储在笔划数据库140中(步骤S73)。
然后,统计数据生成部100通过出现概率计算部190基于构成包括在数值数据中的数字的笔划来计算N-gram组合(步骤S74),并且生成计算每个N-gram组合的出现概率的统计数据(步骤S75)。
接下来,描述在统计数据生成部100的上述处理中进行的每个步骤。
图8是示出了根据本发明的实施方式的数值数据提取部170的处理的示意图。例如,在文本数据如“目前,2014年,7月,18日,13时,20分”存储在大容量文本数据库110中情况下,本实施方式的数值数据提取部170提取包括在文本数据中的数值数据“2014”、“7”、“18”、“13”和“20”。
接下来,参照图9和图10来描述根据本发明的实施方式的笔划数据变换部180的处理。图9是示出了根据本发明的实施方式的笔划词典数据库120的示意图。本实施方式的笔划词典数据库120包括笔划数据121和使用率数据122。
本实施方式的笔划数据121和使用率数据122是通过统计获得的各种预先存在的数据。笔划数据121和使用率数据122预先存储在字符识别设备1中。
本实施方式的笔划数据121包括数字0至9的数字和彼此关联的目标验证笔划。本实施方式的目标验证笔划指的是使用输入到字符识别设备1的笔划来验证的笔划。此外,数字0至9是使用输入到字符识别设备1的笔划的组合来验证的目标验证字符。本实施方式的目标验证笔划是构成目标验证字符的笔划。
在图9所示的笔划数据121中,目标验证笔划以行来布置,符号a至c被分配给根据目标验证字符获得的目标验证笔划中的每个目标验证笔划。因此,在本实施方式中,根据目标验证字符和分配给目标验证笔划的符号来标识目标验证笔划。
例如,从数字“1”获得的多个笔划中的单个笔划由数字“1”和符号“b”来标识。此外,从数字“1”获得的多个笔划中的另一单个笔划由数字“1”和符号“a”来标识。
在本实施方式中,目标验证字符和指示目标验证笔划的类型的符号的组合在下文中被称为标识目标验证笔划的代码。例如,由数字“1”和符号“a”的组合标识的目标验证笔划的代码被称为“代码la”。类似地,由“数字4”和符号“b”的组合标识的目标验证笔划的代码被称为“代码4b”。
本实施方式的使用率数据122指示每个目标验证笔划的使用率。换言之,每个目标验证笔划的使用率指示目标验证笔划出现在数值数据库130中的概率。
例如,在本实施方式的使用率数据122中,与代码1a对应的目标验证笔划被使用的比率指示当数字“1”被书写(输入)时为“0.8”的使用率,而与代码1b对应的目标验证笔划的比率指示当数字“1”被书写(输入)时为“0.1”的使用率。
同样,与代码1b和1c对应的目标验证笔划的比率指示当数字“1”被书写(输入)时使用率为“0.1”。根据本实施方式,在指示不独立地构成目标验证字符的目标验证笔划(非独立目标验证笔划)的情况下,使用分配给要与该非独立目标验证笔划组合在一起的另一目标验证笔划的符号,以标识要组合的目标验证笔划。
例如,在目标验证字符为数字“1”的情况下,代码1c的目标验证笔划不独立地构成目标验证字符“1”,而是通过与代码1b的目标验证笔划组合在一起来构成目标验证字符“1”。因此,代码1c的使用率在图9中被指示为“0.1(b+c)”。
类似地,在书写数字“4”(目标验证字符“4”)的情况下,代码“4a”和“4b”的目标验证笔划被使用的比率在图9中用使用率“0.9(a+b)”来指示。此外,在书写数字“4”的情况下,代码“4c”的目标验证笔划被使用的比率用使用率“0.2”来表示。
本实施方式的笔划数据变换部180参照笔划数据121和使用率数据122,并且对构成包括在由数值数据提取部170提取的数值数据中的数字的目标验证字符的每个组合出现的次数的进行计算。
图10是示出了根据本发明的实施方式的笔划数据库140的示意图。本实施方式的笔划数据库140包括一个或更多个模式,所述一个或更多个模式包括构成由数值数据提取部170所提取的数字的目标验证笔划的组合。模式中的每个模式与每个组合出现的次数关联。
例如,在提取的数值数据为“2014”的情况下,构成“2014”的目标验证笔划的组合的模式与每个组合出现的次数关联,如图10所示。
首先,笔划数据变换部180获取构成“2014”的目标验证笔划的所有组合。
构成包括在“2014”中的数字“2”的目标验证笔划仅为代码“2a”的目标验证笔划。
对于数字“0”而言存在两种模式,一种是数字“0”仅由代码“0a”的目标验证笔划构成的情况,另一种是数字“0”由代码“0a”的目标验证笔划和代码“0b”的目标验证笔划的组合构成的情况。
对于数字“1”而言存在三种模式,一种为数字“1”仅由代码“1a”的目标验证笔划构成的情况,另一种为数字“1”仅由代码“1b”的目标验证笔划构成的情况,以及再一种为数字“1”由代码“1b”的目标验证笔划和代码“1c”的目标验证笔划的组合构成的情况。
对于数字“4”而言存在二种模式,一种为数字“4”由代码“4a”的目标验证笔划和代码“4b”目标验证笔划的组合构成的情况,以及另一种为数字“4”仅由代码“4c”的目标验证笔划构成的情况。
因此,如图10所示,构成“2014”的目标验证笔划的组合的模式的数量是由编号为1至12的模式所指示的12种模式。
本实施方式的笔划数据变换部180基于数值“2014”在大容量文本数据库110中出现的次数和笔划词典数据库120的使用率数据来获得构成“2014”的目标验证笔划的每个组合出现的次数。
图10的实施方式示出了在数值“2014”在大容量文本数据库110中出现了n次的情况下目标验证笔划的每个组合出现的次数。
接下来,描述模式编号“1”出现的次数。在模式编号“1”中,数值“2014”由代码“2a”、代码“1a”、代码“4a”和代码“4b”构成。
在使用率数据122中,代码“2a”的使用率数据为“1”,代码“0a”的使用率数据为“0.9”。此外,代码“1a”的使用率数据为“0.8”,以及代码“4a”和代码“4b”的组合的使用率数据为“0.9”。
本实施方式的笔划数据变换部180将每个代码的使用率数据与数值“2014”的出现次数相乘,并且假定相乘结果是模式编号“1”的组合的出现次数。因此,模式编号“1”的组合的出现次数为“0.648n”(=1×0.9×0.8×0.9)×n。出现次数指示数值“2014”是由模式编号“1”的目标验证笔划的组合形成的次数。也就是说,出现次数指示模式编号“1”的目标验证笔划的组合在形成数值“2014”的情况下出现的频率。
如图10所示,本实施方式的笔划数据变换部180获取从模式“1”至模式“12”的每个组合出现的次数。
本实施方式的笔划数据变换部180对从数值提取部170提取的每个数值进行上述处理,以获得目标验证笔划的组合的模式和每个组合出现的次数,以及将所获取的模式和出现次数存储在笔划数据库140中。
本实施方式的出现概率计算部190基于N-gram模型来计算出现概率。出现概率指示“N”个代码的组合在存储在笔划数据库140中的目标验证笔划的所有组合中出现的度。
图11示出了假定“N”=2,从图10的模式编号“1”的组合中获取两个代码的组合,以及计算由两个代码构成的每个组合出现的次数的示例。计算由两个代码构成的每个组合出现的次数的处理可以执行作为计算出现概率的处理的一部分。
模式编号“1”的目标验证笔划的组合为“2a-0a-1a-4a4b”。因此,出现概率计算部190根据模式编号“1”的组合获取由两个代码“2a-0a”、“0a-1a”、“1a-4a”和“4a-4b”构成的组合。
接下来,描述对笔划数据库140的组合“2a-0a”的出现次数进行计算的处理。
本实施方式的出现概率计算部190通过从存储在笔划数据库140中的所有目标验证笔划的组合的模式中提取包括组合“2a-0a”的模式,并且计算与所提取的模式对应的出现次数的合计值来确定组合“2a-0a”的出现次数。
例如,在图10所示的笔划数据库140中,组合“2a-0a”被包括在模式编号1至12的所有模式中。因此,组合“2a-0a”的出现次数与模式编号1至12的模式中的每个模式的出现次数的总数对应。
此外,在笔划数据库140中,组合“0a-1a”仅包括在模式编号1和2的模式中。因此,组合“0a-1a”的出现次数与模式编号1的模式的出现次数和模式编号2的模式的出现次数的总数对应。
本实施方式的出现概率计算部190对包括在笔划数据库140中的所有目标验证笔划的组合的模式进行上述处理。然后,从组合“0a-0a”开始对上述处理的结果进行排序,并且上述处理的结果以排序的状态存储在统计数据库150中。
图12示出了根据本发明的实施方式的统计数据库150。本实施方式的统计数据库150存储有两个代码的组合、每个组合的出现次数以及出现概率。虽然,从组合“0a-0a”开始以排序的状态将两个代码的组合存储在统计数据库150中,但是统计数据库150可以用不同的方式来存储两个代码的组合。
本实施方式的出现概率与通过将两个代码的每个组合的出现次数除以所有组合的出现次数的合计值获得的值对应。因此,在图12的示例中,组合“0a-0b”的出现概率与组合“0a-0b”的出现次数“0.81”除以每个组合的出现次数的合计值“111.36”对应。
根据本实施方式,通过进行上述处理来生成统计数据库150。虽然,统计数据生成部100和统计数据库150包括在本实施方式的字符识别设备1中,但是统计数据生成部100和统计数据库150不一定需要包括在字符识别设备1中。例如,可以将统计数据生成部100和统计数据库150设置在可以与字符识别设备1通信的外部设备中。替选地,可以仅将统计数据库150设置在外部设备中。
接下来,描述根据本发明的另一实施方式的字符确定部200。图13示出了根据本发明的另一实施方式的字符确定部的处理的流程图。
本实施方式的字符确定部200通过输入接收部210接收输入到字符确定部200的笔划(步骤S1301)。
然后,字符确定部200开始通过组合确定部220的输入笔划验证部221来识别一个或更多个笔划(步骤S1302)。
更具体地,当接收到笔划时,输入笔划验证部221获取包括输入时间(即,输入笔划的起点时开始和输入笔划的终点时结束的时间)和非连续时间(即,当输入笔划的终点时开始和输入随后笔划的起点时结束的时间)的笔划时间数据,并且将笔划时间数据存储在输入笔划表211中。此外,输入笔划验证部221将输入笔划以坐标值的形式存储在输入笔划表211中。
然后,组合确定部220通过输入笔划验证部221使用存储在笔划词典数据库120中的数据来验证输入笔划,并且通过评估值生成部222来生成每个笔划的评估值(即,指示输入笔划与存储在笔划词典数据库120中的数据匹配的度的值)(步骤S1303)。
然后,组合确定部220通过模式生成部223,参照笔划词典数据库120,并且生成可以由输入笔划的数量预期的目标验证笔划的代码的组合模式。然后,组合确定部220通过统计数据验证部224,参照统计数据库150,基于包括在生成的模式中的笔划的评估水平和包括在生成的模式中的两个代码的组合的出现概率来计算得分,以及将计算的结果存储在统计验证结果表213中(步骤S1304)。
然后,组合确定部220通过边界位置输出部225,参照统计验证结果表213,确定构成每个模式的字符的边界,以及将确定位置存储在边界位置表214中(S1305)。
然后,组合确定部220通过时间验证部226使用存储在笔划时间表230中的数据来验证笔划时间数据,并且将由验证产生的得分存储在时间验证结果表215中(步骤S1306)。
然后,组合确定部220通过结果输出部,参照边界位置表214和时间验证结果表215,输出由输入笔划构成的字符的边界的位置,以及将输出存储在结果表216中(步骤S1307)。
本实施方式的字符确定部200将字符的边界的位置输出至识别部300。识别部300可以基于由字符确定部200提供的字符的边界的位置来区分包括在单个字符中的输入笔划。因此,识别部300可以通过使用现有技术的字符识别处理来识别字符。
接下来,进一步详尽地描述组合确定部220的处理的每个步骤。图14A和图14B是用于描述根据本发明的实施方式的评估值表的的示意图。图14A示出了输入笔划的示例。图14B示出了针对每个输入笔划的评估值表的示例。
在下面的示例中,如图14A所示,假定数值“17”用三个笔划s1、s2和s3来书写(输入)。
本实施方式的输入笔划验证部221使用存储在笔划词典数据库120中的笔划数据121来验证存储在输入笔划表211中的每个笔划的坐标值。然后,评估值生成部222生成每个笔划的评估值表。图14B示出了指示使用笔划数据来验证笔划s1的结果的评估值表212-s1,指示使用笔划数据来验证笔划s2的结果的评估值表212-s2,以及指示使用笔划数据来验证笔划s3的结果的评估值表212-s3。
本实施方式的评估值生成部222使用包括在笔划数据121中的每个目标验证笔划来验证笔划s1,并且获取指示笔划s1与目标验证笔划匹配的水平的评估值。可以使用用于字符识别的已知技术来获取评估值(匹配水平)。
然后,评估值生成部222获取与具有最高评估值的目标验证笔划对应的三个代码,并且将与代码对应的评估值降序地存储在评估值表212-s1中。
类似地,评估值生成部222对笔划s2和笔划s3进行相同的处理,并且将处理的结果分别存储在评估值表212-s2和评估值表212-s3中。
根据评估值表212-s1,笔划s1相对于代码1a的目标验证笔划展示有最高评估水平。也就是说,笔划s1具有与代码1a的目标验证笔划的形状最相似的形状。
类似地,笔划s2相对于代码4b的目标验证笔划展示出最高匹配水平,以及笔划s3相对于代码7b的目标验证笔划展示出最高匹配水平。
如上所述,本实施方式的评估值表212包括构成目标验证字符的目标验证笔划的组合的多个候选。此外,评估值表212包括与目标验证笔划的组合的多个候选对应的评估值。
在图14A和图14B所示的示例中,具有最高评估值的三个目标验证笔划的代码降序存储在评估值表212中。然而,要存储在评估值表212中的目标验证笔划的代码的数量不特别地限制。例如,评估值生成部222可以将评估值存储作为使用包括在笔划数据121中的所有目标验证笔划来验证输入笔划的结果。
接下来,参照图15来描述根据本发明的实施方式的模式生成部223的处理。图15是示出了由模式生成部223生成的笔划的组合的模式的示意图。
本实施方式的模式生成部223使用存储在评估值表212中的目标验证笔划的代码,以生成与输入笔划的数量相等的目标验证笔划的代码的组合模式。
在本实施方式中,输入笔划的数量为三。因此,模式生成部223参照笔划数据121,并且生成三个代码的组合模式。
在图15的示例中,模式生成部223生成从“1a-1a-1a”、“1a-1a-1b”、“1a-1a-1c”,…开始的三个代码的组合模式。本实施方式的笔划数据121包括19个目标验证笔划。因此,模式生成部223生成19×19×19种模式。
接下来,参照图16A和图16B来描述根据本发明的实施方式的统计数据验证部224的处理。图16A是示出了在三个笔划被输入的情况下的统计验证结果表213的示意图。图16B是示出了用于计算笔划的每个组合的得分的公式的示意图。
在本实施方式中,在第i个笔划的评估值是“Hi”,第(i-1)个笔划和第i个笔划的组合的出现概率被假定为“P(i)”的情况下,由模式生成部223生成的模式的得分通过下面的公式(1)来计算。
公式(1)
目标验证笔划的组合得分公式(1)=Σ(Hi×P(i))×α
本实施方式的统计数据验证部224通过使用公式(1)对由模式生成部223生成的所有组合进行计算。由此,计算每个模式的得分。要注意的是,“α”是当对得分进行加权时使用的系数,并且是预先设置的值。
例如,图15所示的模式“1a-1a-1a”的得分“Su”被获得如下。
Su={(统计数据库150的代码“--1a”的组合的出现概率)×(评估值表212-s1的代码1a的评估值)+(统计数据库150的代码“1a–1a”的组合的出现概率)×(评估值表212-s2的代码1a的评估值)+(统计数据库150的代码“1a–1a”的组合的出现概率)×(评估值表212-s3的代码1a的估计值)}。
本实施方式的统计数据验证部224对由模式生成部223生成的所有模式进行上述处理,并且计算所有模式的得分。然后,统计数据验证部224将笔划的组合的模式与每个模式的得分关联,并且将关联的数据(记录)存储在统计验证结果表213中。当将与每个模式的得分关联的笔划的组合模式的记录存储在统计验证结果表213中时,统计数据验证部224可以从具有最高得分的记录降序存储记录。此外,统计数据验证部224可以仅将预定数量的记录存储在统计验证结果表213中。
如图16A所示,可以理解,在本实施方式中模式“1a7a7b”具有最大值。
接下来,参照图14B描述对图16B所示的模式“1a-7a-7b”的得分的计算。
在图14B的评估值表212-s1中,模式“1a-7a-7b”的第一笔划的代码“1a”的评估值H1为95。此外,在图14B的评估值表212-s2中,模式“1a-7a-7b”的第二笔划的代码“7a”的评估值H2为85。此外,在图14B的评估值表212-s3中,模式“1a-7a-7b”的第三笔划的代码“7b”的评估值H3为90。
与评估值H1相乘的出现概率P1指示第0笔划和第一笔划的组合的出现概率。因此,在本实施方式中,出现概率P1是统计数据库150的代码“--1a”的组合的出现概率。代码“--1a”的组合指示代码“1a”是第一笔划。类似地,代码“1a--”的组合指示最后的笔划是代码“1a”。
与评估值H2相乘的出现概率P2指示模式“1a-7a-7b”的第一笔划和第二笔划的组合的出现概率。因此,在本实施方式中,出现概率P2是统计数据库150的代码“1a–7a”的组合的出现概率。类似地,与评估值H3相乘的出现概率P3指示模式“1a-7a-7b”的第二笔划和第三笔划的组合的出现概率。因此,在本实施方式中,出现概率P3是统计数据库150的代码“7a–7b”的组合的出现概率。
因此,在本实施方式中,模式“1a-7a-7b”的得分Su1被表示为:
Su1=(95×出现概率P1+85×出现概率P2+90×出现概率P3)
×α。
通过计算如上所述的得分,使用目标验证笔划出现的频率(出现频率)对输入笔划和目标验证笔划之间的相似度得分进行加权。
在图16A所示的示例中,根据模式“1a-7a-7b”计算出的得分Su1为84。此外,根据模式“7a-1a-3a”计算出的得分Su2为79,以及根据模式“1a-1a-7b”计算出的得分Su3为68。
接下来,参照图17描述根据本发明的实施方式的边界位置输出部225的处理。
本实施方式的边界位置表214包括数据项如“模式”、“边界(边界位置)”以及“得分”。项“边界”的值指示字符的边界的位置。项“得分”的值指示与指示边界位置的模式对应的得分。
本实施方式的边界位置输出部225从统计验证结果表213降序提取预定数量的数据,并且输出由包括在所提取的记录中的目标验证笔划的组合模式构成的字符的边界位置。
在本实施方式中,从统计验证结果表213降序提取具有最高得分的两个记录。因此,所提取的记录是伴随其相应得分的模式“1a-7a-7b”和模式“7a-1a-3a”。
在本实施方式中,表示目标验证笔划的代码使用目标组合字符和分配给目标验证笔划的符号(标记)来指示。因此,代码“1a”是由笔划数据121的数字“1”和符号“a”标识的目标验证笔划(参见图9)。也就是说,在本实施方式中,包括在代码中的数字指示由代码标识的目标验证笔划构成的字符。因此,在指示目标验证笔划的代码的组合模式中,包括在代码中的数字改变的部分被认为是字符的边界。
例如,在由代码的组合构成的模式“1a-7a-7b”中,第一笔划的代码是“1a”,第二笔划的代码是“7a”,以及第三笔划的代码是“7b”。因此,在模式“1a-7a-7b”中,第一笔划与第二笔划之间的部分被认为是字符的边界。
因此,在本示例中,单个字符由输入笔划s1书写,以及另一单个字符由输入笔划s2和输入笔划s3书写。因此,笔划s1之后的部分是字符的边界。
此外,例如,在由代码的组合构成的模式“7a-1a-3a”中,第一笔划的代码是“7a”,第二笔划的代码是“1a”,以及第三笔划的代码是“3a”。因此,在模式“7a-1a-3a”中,字符的边界处在第一笔划与第二笔划之间。
因此,在本实施方式中,输入笔划s1的部分和s2之后的部分分别是字符的边界。因此,笔划s1、s2及s3中的每个表示单个字符。
因此,本实施方式的边界位置输出部225将具有值“s1”(指示笔划s1)的项“边界位置”与具有值“84”的项“得分”关联,并且将关联的数据存储在边界位置表214中。此外,边界位置输出部225将具有值“s1s2”(指示笔划s1和笔划s2)的项“边界位置”与具有值“79”的项“得分”关联,并且将关联的数据存储在边界位置表214中。
接下来,参照图18至图20B描述根据本发明的实施方式的时间验证部226的处理。本实施方式的时间验证部基于存储在输入笔划表和笔划时间表230中的笔划时间数据来确定要与得分相加的值。
图18是示出了根据本发明的实施方式的笔划时间表230的示意图。本实施方式的笔划时间表230预先存储在字符识别设备1中。
本实施方式的笔划时间表230包括数据项如“状态”、“时间”和“相加值”。项“状态”的值指示笔划的输入中断时的状态。例如,在项“状态”的值是“字符的边界”的情况下,项“状态”指示笔划的输入由于一个字符与另一字符之间的边界而被中断的状态。此外,在项“状态”的值是“字符的中间”的情况下,项“状态”指示笔划的输入由于在输入期间一个笔划和另一笔划状态之间的间隔而被中断的状态。
项“时间”的值指示笔划的输入被中断的时间(笔划输入的间隔时间)。项“相加值”的值指示要与得分相加的值。
本实施方式的时间验证部226参照笔划时间数据和笔划时间表230,并且确定在笔划输入期间输入中断时间的状态。例如,在本实施方式中,时间验证部226在输入中断时间为0.5秒或更多的情况下确定笔划的输入由于字符和另一字符之间的边界而被中断。此外,时间验证部226在输入中断时间小于0.5秒的情况下确定字符处于输入的中间。
在本实施方式中,分别预先设定项“时间”的值和项“相加值”的值。
接下来,参照图19A和图19B来描述根据本发明的实施方式的被设置至笔划时间表230的值(设置值)。图19A和图19B是用于说明根据本发明的实施方式的笔划时间表230的设置值的示意图。
图19A是示出了笔划输入在一个字符与另一字符之间的边界处中断的时间(中断时间)与测试对象(测试人员)的比例之间的关系的曲线图。图19B是示出了笔划输入在字符输入中间中断的时间与测试对象(测试人员)的比例之间的关系的曲线图。
图19A和图19B的曲线图是通过允许测试对象将字符串输入至字符识别设备并且测量笔划输入中断的时间而获得的结果。
笔划输入的中断时间随着测试对象的字符书写速度变快而变短,并且随着测试对象的字符书写速度变慢而变长。
此外,在笔划输入由于一个字符与另一字符之间的边界而中断的情况下,认为中断时间比笔划输入在输入字符的中间中断的时间长。因此,输入笔划的中断时间在输入笔划的中断时间较长时倾向于指示一个字符和另一字符之间的边界,以及在输入字符的中断时间较短时倾向于指示字符输入的中间。
因此,在由于一个字符与另一字符之间的边界引起的中断时间长于预定阈值时间的情况下,将相加值与得分相加。此外,在字符的中断时间变得短于预定阈值时间时,将相加值与得分相加。
在使用图19A的曲线图示出的实施方式中,在中断时间等于或大于时间t1的情况下,中断时间是由于一个字符与另一字符之间的边界引起的,其中,在时间t1,测试对象的比例相对于中断时间变得最高。此外,在使用图19B的曲线图示出的实施方式中,在中断时间小于时间t2的情况下,中断时间是由于处于输入字符的中间引起的,其中,在时间t2,测试对象的比例相对于中断时间变得最高。在图18所示的笔划时间表230中,假定时间t1=时间t2=0.5秒。
接下来,参照图20A和图20B来描述根据本发明的实施方式的时间验证结果表215。图20A和图20B是用于描述根据本发明的实施方式的时间验证结果表215的示意图。更具体地,图20A示出了笔划时间数据的示例,图20B示出了时间验证结果表215的示例。
在图20A的示例中,从笔划s1输入的终点到笔划s2输入的起点的输入中断时间为0.9秒。因此,在笔划s1的输入结束和笔划s2的输入开始之间的中断时间处于字符的边界的情况下将相加值“20”与得分相加,而在笔划s1的输入结束和笔划s2的输入开始之间的中断时间处于输入字符的中间的情况下不将相加值与得分相加。
此外,从笔划s2输入的终点和笔划s3输入的起点的输入中断时间为0.2秒。因此,在笔划s2的输入结束和笔划s3的输入开始之间的中断时间是由于字符的边界引起的情况下,不将相加值与得分相加,而在笔划s2的输入结束和笔划s3的输入开始之间的中断时间是由于处于输入字符的中间引起的情况下,将相加值“20”与得分相加。
本实施方式的时间验证部226参照笔划时间表230和笔划时间数据,并且获得在经过确定为字符边界之间之后要加至模式“1a-7a-7b”和模式“7a-1a-3a”的得分的值。
模式“1a-7a-7b”的字符边界的位置被确定为在笔划s1之后。
因此,从笔划s1的输入结束到笔划s2的输入开始的中断被确定为是由于一个字符与另一字符之间的边界引起的。在图20A所示的笔划时间数据中,笔划s1的输入结束和笔划s2的输入开始之间的中断时间为0.9秒。由于笔划s1的输入结束和笔划s2的输入开始之间的中断时间大于或等于0.5秒,因此时间验证部226获得相加值“20”。
此外,在模式“1a-7a-7b”中从笔划s2的输入结束到笔划s3的输入开始的中断被确定为是由于处于输入字符的中间引起的。因此,在图20A所示的笔划时间数据中,笔划s2的输入结束和笔划s3的输入开始之间的中断时间为0.2秒。由于笔划s2的输入结束和笔划s3的输入开始之间的中断时间小于0.5秒,因此时间验证部226获得相加值“20”。
因此,加至模式“1a-7a-7b”的相加值为“40”(=20+20)。
模式“7a-1a-3a”的字符边界的位置被确定为处于笔划s1之后和笔划s2之后。
因此,从笔划s1的输入结束到笔划s2的输入开始的中断以及从笔划s2的输入结束到笔划s3的输入开始的中断被确定为是由于一个字符与另一字符之间的边界引起的。在图20A所示的笔划时间数据中,笔划s1的输入结束和笔划s2的输入开始之间的中断时间为0.9秒。由于笔划s1的输入结束和笔划s2的输入开始之间的中断时间大于或等于0.5秒,因此时间验证部226获得相加值“20”。
此外,在模式“7a-1a-3a”中从笔划s2的输入结束到笔划s3的输入开始的中断为0.2秒。由于笔划s2的输入结束和笔划s3的输入开始之间的中断时间小于0.5秒,因此时间验证部226未获得相加值。
因此,加至模式“7a-1a-3a”的相加值为“20”(=20+0)。
本实施方式的时间验证部226将针对每个模式得到的相加值与相应的模式和边界位置关联,并且将关联的数据存储在时间验证结果表215中。
接下来,参照图21A和图21B来描述根据本发明的实施方式的结果输出部227的处理。图21A和图21B是用于描述根据本发明的实施方式的结果表216的示意图。图21A示出了结果表216的示例。图21B示出了由识别部300识别的笔划的示例。
本实施方式的结果输出部227参照时间验证结果表215和边界位置表214,并且将时间验证结果表215的相加值与边界位置表214的得分相加的结果输出至结果表216。
图21所示的结果表216包括彼此关联的模式、边界位置以及得分(与相加值相加)。在本实施方式中,在与相应的相加值相加以后模式“1a-7a-7b”的得分为“124”(=84+40),以及在与相应的相加值相加以后模式“7a-1a-3a”的得分为“99”(=79+20)。
本实施方式的结果输出部227将由输入笔划构成的字符的边界位置输出至识别部300。在本实施方式中,字符的边界位置是字符的在与相应相加值相加以后具有最高得分的边界位置。
因此,结果输出部227向识别部300报告,笔划s1之后的位置(其为模式“1a-7a-7b”的边界位置)是三个输入笔划中的字符边界。
当向识别部300报告字符的边界位置时,识别部300识别笔划s1指示单个字符,笔划s2和笔划s3构成单个字符,如图21B所示。
因此,本实施方式的识别部300可以以与通过输入到框中的笔划识别字符的方法类似的方式来识别字符。
通过上述实施方式,可以根据输入笔划的数量生成包括在笔划词典数据库120的笔划数据121中的目标验证笔划的组合的多个模式。此外,可以获得指示输入笔划与目标验证笔划之间的相似度的评估值。
此外,可以基于包括在输入笔划的组合中的目标验证笔划的出现概率和获得的评估值来计算与每个生成的模式对应的得分。可以标识具有最高得分的模式。此外,可以基于笔划数据121来获得字符的边界位置,并将字符的边界位置报告给识别部300。
也就是说,通过上述实施方式,可以根据与输入笔划具有最高相似度的目标验证笔划的出现概率来标识输入笔划的组合,并且基于所标识的输入笔划的组合来进行字符识别。因此,即使在少量笔划被输入的情况下,甚至可以对具有构成多个字符的可能性的笔划精确进行字符识别。
此外,通过上述实施方式,可以通过使用当输入笔划时获得的笔划时间数据得到字符的边界位置。因此,可以精确识别字符的边界。当在上述实施方式中计算得分时,系数α的值越小,则笔划时间数据对得分的值的影响越大。
在本文中引用的所有实施方式和条件语言旨在用于教导的目的,以帮助读者理解发明人为推动现有技术作出的本发明内容和构思,并且其应被解释为不限于这些具体引用的示例和条件,对说明书中的这些示例的组织也与本发明的优势和劣势的展示无关。虽然详细描述了本发明的实施方式,但是应理解的是,可以在不脱离本发明内容的范围和精神的情况下对本发明做出各种改变、替代以及变型。
Claims (7)
1.一种存储有字符识别程序的非暂态计算机可读记录介质,所述字符识别程序使得计算机执行以下处理,所述处理包括:
根据与输入操作对应的输入坐标数据来生成输入笔划数据;
根据所述输入笔划数据来生成多个笔划组合候选以及与所述多个笔划组合候选对应的评估数据,所述多个笔划组合候选包括目标验证笔划,所述目标验证笔划被组合以构成一个或更多个目标验证字符;
基于所述目标验证笔划的出现概率、存储在存储装置中的每个笔划的出现概率数据以及所述评估数据,从所述多个笔划组合候选中标识第一笔划组合;以及
基于所述第一笔划组合来输出与所述输入操作对应的字符,
其中,所述目标验证笔划的出现概率指示所述目标验证笔划在所述一个或更多个目标验证字符中的每个目标验证字符中出现的概率,以及
其中,所述出现概率数据是基于所述目标验证笔划的出现概率生成的。
2.根据权利要求1所述的非暂态计算机可读记录介质,
其中,所述输入笔划数据包括关于所述输入操作的时间数据,所述时间数据指示用于输入笔划的时间,以及
其中,所述时间数据在用于标识所述第一笔划组合的一个笔划与另一笔划之间使用。
3.根据权利要求1所述的非暂态计算机可读记录介质,其中,所述处理还包括通过基于所述目标验证笔划的组合确定一个字符与另一字符之间的边界,标识所述第一笔划组合。
4.根据权利要求1所述的非暂态计算机可读记录介质,其中,与所述多个笔划组合候选对应的所述评估数据包括指示每个目标验证笔划与所述输入笔划匹配的水平的值。
5.根据权利要求1所述的非暂态计算机可读记录介质,其中,所述处理还包括:从根据大数据提取的数值中提取数字,所述目标验证字符包括所提取的数字,以及
其中,所述出现概率是基于以下生成的:
指示构成所提取的数字的所述目标验证笔划的类型的笔划数据,
所述目标验证笔划的出现概率,以及
每个目标验证字符的出现概率。
6.一种用于使包括存储装置的计算机执行字符识别方法的方法,所述字符识别方法包括:
根据与输入操作对应的输入坐标数据来生成输入笔划数据;
根据所述输入笔划数据来生成多个笔划组合候选以及与所述多个笔划组合候选对应的评估数据,所述多个笔划组合候选包括目标验证笔划,所述目标验证笔划被组合以构成一个或更多个目标验证字符;
基于所述目标验证笔划的出现概率、存储在所述存储装置中的每个笔划的出现概率数据以及所述评估数据,从所述多个笔划组合候选中标识第一笔划组合;以及
基于所述第一笔划组合来输出与所述输入操作对应的字符,
其中,所述目标验证笔划的出现概率指示所述目标验证笔划在所述一个或更多个目标验证字符中的每个目标验证字符中出现的概率,以及
其中,所述出现概率数据是基于所述目标验证笔划的出现概率生成的。
7.一种字符识别设备,包括:
存储装置;以及
处理器,所述处理器执行字符识别处理,所述字符识别处理包括:
根据与输入操作对应的输入坐标数据来生成输入笔划数据,
根据所述输入笔划数据来生成多个笔划组合候选以及与所述多个笔划组合候选对应的评估数据,所述多个笔划组合候选包括目标验证笔划,所述目标验证笔划被组合以构成一个或更多个目标验证字符,
基于所述目标验证笔划的出现概率、存储在所述存储装置中的每个笔划的出现概率数据以及所述评估数据,从所述多个笔划组合候选中标识第一笔划组合,以及
基于所述第一笔划组合来输出与所述输入操作对应的字符;
其中,所述目标验证笔划的出现概率指示所述目标验证笔划在所述一个或更多个目标验证字符中的每个目标验证字符中出现的概率,以及
其中,所述出现概率数据是基于所述目标验证笔划的出现概率生成的。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014265900A JP6451316B2 (ja) | 2014-12-26 | 2014-12-26 | 文字認識プログラム、文字認識方法及び文字認識装置 |
JP2014-265900 | 2014-12-26 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105739882A CN105739882A (zh) | 2016-07-06 |
CN105739882B true CN105739882B (zh) | 2019-06-11 |
Family
ID=56164567
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510969247.9A Active CN105739882B (zh) | 2014-12-26 | 2015-12-22 | 用于字符识别的计算机可读记录介质、方法及设备 |
Country Status (3)
Country | Link |
---|---|
US (1) | US9594952B2 (zh) |
JP (1) | JP6451316B2 (zh) |
CN (1) | CN105739882B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015141260A1 (ja) * | 2014-03-17 | 2015-09-24 | 株式会社河合楽器製作所 | 手書き音楽記号認識装置およびプログラム |
JP6451316B2 (ja) * | 2014-12-26 | 2019-01-16 | 富士通株式会社 | 文字認識プログラム、文字認識方法及び文字認識装置 |
US20170177205A1 (en) * | 2015-12-22 | 2017-06-22 | Mediatek Inc. | Input method for recognizing user input according to vector combination derived from single-stroke input and associated non-transitory machine readable medium |
US10013603B2 (en) * | 2016-01-20 | 2018-07-03 | Myscript | System and method for recognizing multiple object structure |
CN112990176B (zh) * | 2021-04-09 | 2023-07-18 | 北京有竹居网络技术有限公司 | 书写质量评价方法、装置和电子设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1215201A (zh) * | 1997-10-16 | 1999-04-28 | 富士通株式会社 | 字符识别/修正方式 |
CN101017531A (zh) * | 2006-02-10 | 2007-08-15 | 富士通株式会社 | 字符检索装置 |
CN101051352A (zh) * | 2006-03-30 | 2007-10-10 | 株式会社东芝 | 字符识别装置和方法 |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01277985A (ja) * | 1988-04-28 | 1989-11-08 | Nec Corp | オンライン文字認識装置 |
JP2000502479A (ja) | 1996-10-04 | 2000-02-29 | フィリップス エレクトロニクス ネムローゼ フェンノートシャップ | 時系列フレームから取出した集合体化観測を用いる特徴ベクトルに基づくオンライン手書き文字認識方法および装置 |
JP3595900B2 (ja) | 1998-09-28 | 2004-12-02 | 富士通株式会社 | 手書き文字認識装置及び記録媒体 |
JP4536239B2 (ja) * | 1999-10-15 | 2010-09-01 | パナソニック株式会社 | 文字入力装置及び方法並びにコンピュータ読み取り可能な記録媒体 |
US7003158B1 (en) * | 2002-02-14 | 2006-02-21 | Microsoft Corporation | Handwriting recognition with mixtures of Bayesian networks |
US7929767B2 (en) * | 2004-09-22 | 2011-04-19 | Microsoft Corporation | Analyzing subordinate sub-expressions in expression recognition |
US20080008387A1 (en) * | 2006-07-06 | 2008-01-10 | Cheng Yi-Hsun E | Method and apparatus for recognition of handwritten symbols |
JP2009289188A (ja) * | 2008-05-30 | 2009-12-10 | Nec Corp | 文字入力装置、文字入力方法および文字入力用プログラム |
US8175389B2 (en) * | 2009-03-30 | 2012-05-08 | Synaptics Incorporated | Recognizing handwritten words |
JP5471254B2 (ja) * | 2009-09-30 | 2014-04-16 | 富士通株式会社 | 検証装置、検証方法、検証プログラム及び作成装置 |
JP5349645B1 (ja) | 2012-05-11 | 2013-11-20 | 株式会社東芝 | 電子機器および手書き文書処理方法 |
JP5458161B1 (ja) * | 2012-10-23 | 2014-04-02 | 株式会社東芝 | 電子機器および方法 |
JP5701839B2 (ja) * | 2012-10-26 | 2015-04-15 | 株式会社東芝 | 電子機器および方法 |
JP2014092817A (ja) * | 2012-10-31 | 2014-05-19 | Fuji Xerox Co Ltd | 文字認識装置及びプログラム |
JP2014127188A (ja) * | 2012-12-27 | 2014-07-07 | Toshiba Corp | 整形装置及び方法 |
US20140210829A1 (en) * | 2013-01-31 | 2014-07-31 | Kabushiki Kaisha Toshiba | Electronic apparatus and handwritten document processing method |
JP2015032050A (ja) * | 2013-07-31 | 2015-02-16 | 株式会社東芝 | 表示制御装置、表示制御方法およびプログラム |
JP6092462B2 (ja) * | 2014-03-12 | 2017-03-08 | 株式会社東芝 | 電子機器、方法及びプログラム |
JP6342194B2 (ja) * | 2014-03-28 | 2018-06-13 | 株式会社東芝 | 電子機器、方法及びプログラム |
US9864508B2 (en) * | 2014-06-24 | 2018-01-09 | Apple Inc. | Character recognition on a computing device |
JP6451316B2 (ja) * | 2014-12-26 | 2019-01-16 | 富士通株式会社 | 文字認識プログラム、文字認識方法及び文字認識装置 |
JP6492894B2 (ja) * | 2015-04-01 | 2019-04-03 | 富士通株式会社 | 認識プログラム、認識方法及び認識装置 |
-
2014
- 2014-12-26 JP JP2014265900A patent/JP6451316B2/ja active Active
-
2015
- 2015-12-07 US US14/960,655 patent/US9594952B2/en active Active
- 2015-12-22 CN CN201510969247.9A patent/CN105739882B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1215201A (zh) * | 1997-10-16 | 1999-04-28 | 富士通株式会社 | 字符识别/修正方式 |
CN101017531A (zh) * | 2006-02-10 | 2007-08-15 | 富士通株式会社 | 字符检索装置 |
CN101051352A (zh) * | 2006-03-30 | 2007-10-10 | 株式会社东芝 | 字符识别装置和方法 |
Also Published As
Publication number | Publication date |
---|---|
JP6451316B2 (ja) | 2019-01-16 |
US9594952B2 (en) | 2017-03-14 |
JP2016126468A (ja) | 2016-07-11 |
CN105739882A (zh) | 2016-07-06 |
US20160188970A1 (en) | 2016-06-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105739882B (zh) | 用于字符识别的计算机可读记录介质、方法及设备 | |
WO2020073714A1 (zh) | 训练样本获取方法,账户预测方法及对应装置 | |
CN107193973B (zh) | 语义解析信息的领域识别方法及装置、设备及可读介质 | |
CN106934275B (zh) | 一种基于个人信息的口令强度评测方法 | |
CN110010156A (zh) | 基于对事件子部分的序列的建模的声音事件检测 | |
CN108711421A (zh) | 一种语音识别声学模型建立方法及装置和电子设备 | |
CN103559880B (zh) | 语音输入系统和方法 | |
CN108959474B (zh) | 实体关系提取方法 | |
CN110276023A (zh) | Poi变迁事件发现方法、装置、计算设备和介质 | |
CN106649276B (zh) | 标题中核心产品词的识别方法以及装置 | |
Yin et al. | Gesture spotting and recognition using salience detection and concatenated hidden markov models | |
CN107423278A (zh) | 评价要素的识别方法、装置及系统 | |
CN109905385A (zh) | 一种webshell检测方法、装置及系统 | |
CN101454826A (zh) | 语音识别词典/语言模型制作系统、方法、程序,以及语音识别系统 | |
US11182605B2 (en) | Search device, search method, search program, and recording medium | |
CN110489424A (zh) | 一种表格化信息提取的方法、装置、存储介质及电子设备 | |
CN110175851A (zh) | 一种作弊行为检测方法及装置 | |
CN109857645A (zh) | 一种针对应用程序的自动化测试方法及装置 | |
JP6274114B2 (ja) | 制御方法、制御プログラム、および制御装置 | |
CN110807183A (zh) | 一种多维度特征体系的滑动验证码人机行为识别方法 | |
CN104156373B (zh) | 编码格式检测方法及装置 | |
CN110019837A (zh) | 用户画像的生成方法及装置、计算机设备及可读介质 | |
CN114639152A (zh) | 基于人脸识别的多模态语音交互方法、装置、设备及介质 | |
CN109670304A (zh) | 恶意代码家族属性的识别方法、装置及电子设备 | |
CN113159203B (zh) | 歌曲标记模型训练、歌曲标记方法、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |