CN107533651B

CN107533651B - 识别装置、识别方法及计算机可读取的记录介质

Info

Publication number: CN107533651B
Application number: CN201580078064.6A
Authority: CN
Inventors: 铃木智久
Original assignee: Toshiba Corp; Toshiba Digital Solutions Corp
Current assignee: Toshiba Corp; Toshiba Digital Solutions Corp
Priority date: 2015-05-11
Filing date: 2015-05-11
Publication date: 2021-05-04
Anticipated expiration: 2035-05-11
Also published as: CN107533651A; WO2016181458A1; US10515297B2; US20180012111A1

Abstract

与对照处理同步地执行与对照处理不同的处理。具备：候选检测部，从输入图像检测字符候选，所述字符候选是被推测为包含字符的像素的集合；识别部，对字符候选的每一个进行识别，生成至少一个识别候选，所述识别候选是识别结果的候选的字符；对照部，将至少一个识别候选的每一个与将识别对象的字符串模型化而得的知识辞典进行对照，生成将被推测为包含于输入图像的字符串和知识辞典进行对照而得到的对照结果；以及命令处理部，执行所赋予的命令，知识辞典为有限自动机，表示字符的实字符代码和指定命令的虚拟字符代码的其中一方被分配给边，对照部在按照被分配了虚拟字符代码的边使知识辞典的状态转变的情况下，将由分配给该边的虚拟字符代码指定的命令赋予给命令处理部。

Description

识别装置、识别方法及计算机可读取的记录介质

技术领域

本发明的实施方式涉及识别装置、识别方法及计算机可读取的记录介质。

背景技术

作为进行字符识别中的知识处理的方法，已知如下方法：将识别对象的字符串模型化而储存至知识辞典，将与模型相符合的字符串作为知识辞典的结果。例如，已知如下系统，其中，具备登记了想要对照的单词的单词辞典部和具有受理被登记在单词辞典部中的单词的有限自动机的单词对照部，将有限自动机受理到的单词作为知识处理的结果加以输出。此外，已知对通过上下文无关文法记述的地名表述和字符识别候选进行对照从而进行知识处理的技术。

发明内容

但是，在现有技术中，难以与知识处理同步地执行检测字符串和字符串之间的空白而使空白的检测结果反映到对照的得分等与知识处理不同的处理。

本发明要解决的课题在于，使用知识辞典进行字符识别，并且与对照处理同步地执行与对照处理不同的处理。

实施方式所涉及的识别装置具备：候选检测部，从输入图像检测字符候选，所述字符候选是被推测为包含字符的像素的集合；识别部，对所述字符候选的每一个进行识别，生成至少一个识别候选，所述识别候选是识别结果的候选的字符；对照部，将所述至少一个识别候选的每一个与将识别对象的字符串模型化而得的知识辞典进行对照，生成将被推测为包含于所述输入图像中的字符串和知识辞典进行对照而得到的对照结果；以及命令处理部，执行所赋予的命令，所述知识辞典为有限自动机，表示字符的实字符代码和指定命令的虚拟字符代码的其中一方被分配给边(edge)，在按照分配有所述虚拟字符代码的边而使所述知识辞典的状态转变的情况下，所述对照部将由分配给该边的所述虚拟字符代码指定的命令赋予给所述命令处理部。

根据上述构成的识别装置，能够使用知识辞典进行字符识别，并且与对照处理同步地执行与对照处理不同的处理。

附图说明

图1是表示实施方式所涉及的识别装置10的结构的图。

图2是表示实施方式所涉及的识别装置10的处理的流程图。

图3是表示输入图像的一例的图。

图4是表示样式数据的结构的图。

图5是表示根据输入图像而生成一系列的字符候选的处理的图。

图6是表示片段数据的结构的图。

图7是表示片段编号的一例的图。

图8是表示字符候选数据的结构的图。

图9是表示字符候选编号的一例的图。

图10是表示字符候选的起点编号及终点编号的一例的图。

图11是表示字符候选矩阵的一例的图。

图12是表示字符识别辞典的结构的图。

图13是表示识别候选的排列的结构的图。

图14是表示知识辞典的结构的图。

图15是表示代码的编码方法的一例的图。

图16是表示命令数据的一例的图。

图17是表示对照结果数据的结构的图。

图18是表示对照处理的流程图。

图19是表示知识辞典搜索处理的流程图。

图20是表示知识辞典搜索处理中的数据访问的流程的一例的图。

图21是表示命令执行处理的流程图。

图22是表示命令执行处理中的数据访问的流程的一例的图。

图23是表示字符间的空白的确认的情形的图。

图24是表示结果提取的处理的流程的流程图。

图25是表示在结果提取中参照的数据和在栈(stack)上堆积的字符代码的一例的图。

图26是表示实施方式所涉及的识别装置10的硬件结构的图。

具体实施方式

图1是表示实施方式所涉及的识别装置10的结构的图。识别装置10对例如由扫描仪等读取到的输入图像中包含的字符串进行识别，输出所识别出的字符串。

识别装置10具备输入部30、输入图像存储部32、样式数据存储部34、候选检测部36、候选存储部38、字符识别辞典存储部40、识别部42、知识辞典存储部44、对照部46、对照结果存储部48、命令处理部51、结果提取部54以及输出部56。

输入部30输入由扫描仪等获取到的输入图像。输入部30也可以经由网络等从其他计算机将输入图像输入。输入图像存储部32存储由输入部30输入的输入图像。

样式数据存储部34存储用于确定记载有输入图像中的字符串的区域的样式数据。

候选检测部36基于在样式数据存储部34中存储的样式数据，从输入图像检测字符候选。各个字符候选是被推测为包含一个字符的像素的集合。候选检测部36将所检测到的字符候选写入至候选存储部38。

候选存储部38存储字符候选。进而，候选存储部38与字符候选分别相对应地存储识别候选，所述识别候选是该字符候选的识别结果的候选的字符。

字符识别辞典存储部40存储字符识别辞典。字符识别辞典存储用于计算识别对象的图像与预先登记的字符的每一个之间的类似度的信息。

识别部42基于在字符识别辞典存储部40中存储的字符识别辞典，识别在候选存储部38中存储的各个字符候选。并且，识别部42针对一个字符候选，生成表示识别结果的候选的字符的至少一个识别候选。识别部42将所生成的至少一个识别候选与字符候选相对应地写入至候选存储部38。

知识辞典存储部44存储将识别对象的字符串模型化而得的知识辞典。在本实施方式中，知识辞典是将识别对象的字符串模型化后的确定有限自动机。知识辞典对边(edge)分配表示字符的实字符代码和指定命令的虚拟字符代码的其中一方。

对照部46将至少一个识别候选的每一个与知识辞典对照，生成将被推测为包含于输入图像中的字符串和知识辞典进行对照而得到的对照结果。在该过程中，对照部46按照被分配了识别候选的边而使知识辞典的状态依次转变，从而进行对照。此外，对照部46生成包含表示所对应的字符串的似真度(plausibility)的得分的对照结果。并且，对照部46将所生成的对照结果写入至对照结果存储部48。

进而，对照部46在按照分配了虚拟字符代码的边而使知识辞典的状态转变的情况下，将由分配给该边的虚拟字符代码指定的命令赋予给命令处理部51。

对照结果存储部48存储由对照部46生成的对照结果。对照结果存储部48存储将排列字符候选的识别候选而得到的字符串从开头起与知识辞典逐渐对照的过程中的、开始时刻、中途阶段及完成时刻的对照结果。另外，也可以是，对照部46在对照的中途阶段中，以节约存储区域为目的，删除得分低的对照结果。

命令处理部51执行从对照部46赋予的命令。命令处理部51作为一例，执行对得分加上所指定的值的处理或确认字符间的空白的处理等。

结果提取部54在对照部46的对照及命令处理部51的处理全部完成后，根据在对照结果存储部48中存储的对照结果，基于得分而选择1个以上的对照结果，提取由所选择的1个以上的对照结果确定的字符串。结果提取部54作为一例，提取由得分最好的对照结果确定的字符串。

输出部56将由结果提取部54提取到的字符串输出至外部。

图2是表示实施方式所涉及的识别装置10的处理的流程图。首先，在步骤S1中，识别装置10将输入图像输入。

接下来，在步骤S2中，识别装置10从输入图像检测字符候选，所述字符候选是被推测为包含一个字符的像素的集合。接下来，在步骤S3中，识别装置10基于字符识别辞典，对字符候选的每一个进行识别，生成至少一个识别候选，所述识别候选是识别结果的候选的字符。

接下来，在步骤S4中，识别装置10将至少一个识别候选的每一个与知识辞典进行对照，生成将被推测为包含于输入图像中的字符串和知识辞典进行对照而得到的对照结果。而且，在步骤S4中，识别装置10在按照分配有虚拟字符代码的边而使知识辞典的状态转变的情况下，执行由被分配给该边的虚拟字符代码指定的命令。

接下来，在步骤S5中，识别装置10在对照处理全部完成后，根据对照结果，基于得分而选择一个对照结果，提取由所选择的对照结果确定的字符串，设为识别结果的字符串。在字符候选的个数为0个的情况下，即在输入图像上不包含字符的情况下，没有生成在步骤S5中应选择的对照结果，但在该情况下将识别结果的字符串设为空字符串。最后，在步骤S6中，识别装置10输出识别结果的字符串。

图3是表示输入图像的一例的图。在本实施方式中，输入图像如图3所示，是通过扫描仪等获取用于订购商品的订单而得到的图像数据。在输入图像的预先决定的记入框的内侧，记入有订购者的名字。在本实施方式中，识别装置10识别在预先决定的记入框的内侧记入的日语的名字的字符串，输出表示所识别出的字符串的文本数据。

图4是表示样式数据的结构的图。样式数据存储部34存储预先制作的样式数据。

样式数据如图4所示，包含表示输入图像中包含的记入框的个数的值和储存记入框的个数相应量的记入框记录的排列。在本例中，排列的最初的条目的索引为0。即，排列为0起始。另外，只要没有特殊的记载，在本实施方式中使用的其他排列也为0起始。记入框记录分别与输入图像中包含的各个记入框以一对一的方式对应。

各个记入框记录包含表示输入图像内的对应的记入框的位置的信息。在本例中，表示记入框的位置的信息是对应的记入框的左右端的X坐标(横向的坐标)及上下端的Y坐标(纵向的坐标)。

图5是表示根据输入图像生成一系列的字符候选的处理的图。候选检测部36基于记入框记录所示的信息，确定记入框的区域(例如图5中的虚线所包围的区域)，从所确定的区域提取部分区域图像。接下来，候选检测部36将所提取的部分区域图像二值化而生成二值图像。接下来，候选检测部36在二值图像上提取黑像素的连结成分，对各个连结成分进行标记(labeling)。所标记的各个连结成分是构成字符的要素，称为片段。接下来，候选检测部36组合连续排列的1个以上的片段，生成字符候选。字符候选是被推测为表示一个字符的像素的集合。

图6是表示片段数据的结构的图。候选存储部38存储表示片段的片段数据。片段数据如图6所示，包含表示片段的个数的值和储存片段的个数相应量的片段记录的排列。片段记录分别与各个片段以一对一的方式对应。

各个片段记录包含表示对应的片段的位置的信息和表示片段的形状的二值图像。在本例中，表示片段的位置的信息是对应的片段的左右端的X坐标及上下端的Y坐标，表示该片段的外切矩形。表示片段的形状的二值图像是在该片段的外切矩形内将该连结成分上的像素设为黑像素、将剩余的设为白像素而成的图像。

候选检测部36针对各个片段，计算中心的X坐标和中心的Y坐标。中心的X坐标是左右端的X坐标的平均值。中心的Y坐标是上下端的Y坐标的平均值。并且，候选检测部36将排列内的多个片段记录以中心的X坐标的升序进行排列。由此，候选检测部36能够将排列内的多个片段记录在记入框中的字符记入方向(在本例中是从左向右的方向)上排列。

图7是表示片段编号的一例的图。各个片段记录通过排列的索引来识别。将以字符记入方向排列片段记录后的索引称为片段编号。因此，如图7所示，片段编号与各个片段相对应。

图8是表示字符候选数据的结构的图。候选检测部36组合连续排列的1个以上的片段，生成字符候选。在该过程中，候选检测部36以外切矩形的横宽度L成为预先决定的长度(Lmax)以下的全部模式组合1个以上的片段，生成字符候选。

候选存储部38存储表示字符候选的字符候选数据。字符候选数据如图8所示，包含表示所生成的字符候选的个数的值、字符候选矩阵(细节后述)、储存字符候选的个数相应量的字符候选记录的排列。字符候选记录分别与各个字符候选以一对一的方式对应。

各个字符候选记录包含表示对应的字符候选的位置的信息、对应的字符候选的起点编号及终点编号(细节后述)、表示字符候选的形状的二值图像、以及包括识别候选条目的识别候选的排列(细节后述)。在本例中，表示字符候选的位置的信息是对应的字符候选的左右端的X坐标及上下端的Y坐标，表示在二值图像上的该字符候选的外切矩形。表示字符候选的形状的二值图像是在该字符候选的外切矩形内将该字符候选上的像素设为黑像素、将剩余的设为白像素而成的图像。识别候选条目由识别部42设定值，在候选检测部36中不设定值。

图9是表示字符候选编号的一例的图。各个字符候选记录由排列的索引来识别。将字符候选记录的索引称为字符候选编号。因此，如图9所示，字符候选编号与各个字符候选相对应。

图10是表示字符候选的起点编号及终点编号的一例的图。字符候选是组合连续排列的1个以上的片段而生成的。因此，能够通过针对成为源的1个以上的片段的排列之中的开头的片段的片段编号与向针对最后的片段的片段编号加上1后的值的组，来唯一地识别字符候选。

在本实施方式中，将针对开头的片段的片段编号称为该字符候选的起点编号，将针对最后的片段的片段编号加上1后的值称为该字符候选的终点编号。从而，如图10所示，起点编号及终点编号与各个字符候选相对应。另外，起点编号及终点编号表示字符候选的划分位置，因此将起点编号及终点编号这两者统一也称为位置编号。

图11是表示字符候选矩阵的一例的图。字符候选矩阵如图11所示，是将起点编号设为第一索引、将终点编号设为第二索引的字符候选编号的二维排列。字符候选矩阵在字符候选记录开始生成之前，通过将全部条目设定为-1而被初始化。并且，候选检测部36每次制作字符候选时，向字符候选矩阵的对应的条目写入字符候选编号。

图12是表示字符识别辞典的结构的图。字符识别辞典存储部40存储预先制作的字符识别辞典。字符识别辞典如图12所示，包含表示辞典条目的个数的值和储存辞典条目的排列。

各个辞典条目包含字符代码和预先决定的D_sub个基底矢量。基底矢量是表示与字符代码对应的字符的部分空间的特征矢量。作为一例，将对应的字符的二值图像在纵向及横向上分割成预先任意决定的个数，求得分割后的区域各自的黑像素的个数的比率，将所求得的一系列的比率设为特征矢量的要素，从而计算出特征矢量。

图13是表示识别候选的排列的结构的图。在字符候选记录中储存的识别候选的排列如图13所示，包含预先决定的N_cand个识别候选条目。各个识别候选条目包含字符代码和类似度。

识别部42对字符候选的每一个进行字符识别，生成至少一个识别候选，所述识别候选是识别结果的候选的字符。在本实施方式中，识别部42针对各个字符候选记录，生成预先决定的N_cand个识别候选条目，写入识别候选的排列。

更具体而言，识别部42从对应的字符候选记录中包含的二值图像提取特征矢量，通过部分空间法与在字符识别辞典的各个辞典条目中储存的基底矢量进行对照，计算出类似度。识别部42对于类似度从上位开始N_cand个的辞典条目，分别提取在该辞典条目中储存的字符代码，生成包含所提取到的字符代码和所计算出的类似度的识别候选条目。并且，识别部42将所生成的N_cand个识别候选条目写入对应的字符候选记录的识别候选的排列。进而，识别部42将各个字符候选记录的识别候选的排列中包含的识别候选条目整理为以类似度的降序进行排列。

图14是表示知识辞典的结构的图。知识辞典存储部44存储设计者等预先制作的知识辞典。

在本实施方式中，知识辞典是将识别对象的字符串模型化后的确定有限自动机。在本实施方式中，也将确定作为有限自动机的知识辞典称为DFAα。例如由设计者通过标准表现来记述识别对象的字符串，将该标准表现变换为确定有限自动机，由此生成DFAα。根据标准表现而生成非确定有限自动机或确定有限自动机的方法、从非确定有限自动机生成确定有限自动机的方法例如在A.V.エイホ、R.セシィ、J.D.ウルマン著，原田健一译，コンパイラI，初版1986，pp.134-172等中记载。

DFAα如图14所示，包含表示状态数的值、储存有数量为状态数的状态记录的状态排列、以及储存有数量为边数的边记录的边排列。

各个状态记录与DFAα中包含的各个状态以一对一的方式对应，由状态记录的编号即状态编号唯一地识别状态。另外，状态排列为0起始，从而状态编号为0的状态是开始状态。各个状态记录包含受理状态标记、指向边排列内的边记录的指针、以及边记录的要素数。

受理状态标记表示该状态是否为受理状态。受理状态标记作为一例，在是1的情况下表示是受理状态，在是0的情况下表示不是受理状态。

指向边记录的指针表示边排列内的、从该状态引出的边的集合的储存位置。边记录的要素数表示从该状态引出的边的个数。通过指向边记录的指针及要素数，能够确定与从该状态引出的全部边对应的边记录。

各个边记录与DFAα中包含的各个边以一对一的方式对应。各个边记录包含转变目标的状态编号和代码。

转变目标的状态编号表示确定基于该边的转变目标的状态的状态编号。另外，状态编号为0的状态是开始状态。

代码表示产生由该边表示的转变的输入记号。在本实施方式中，在代码中，储存表示字符的实字符代码、或指定命令的虚拟字符代码。在DFAα中，对边分配了实字符代码的情况下，根据表示识别候选的字符的字符代码，发生按照该边而从某状态向其他状态的转变。此外，在DFAα中，对边分配了虚拟字符代码的情况下，与识别候选的字符无关地，发生按照该边而从某状态向其他状态的转变，且输出由虚拟字符代码指定的命令代码。

图15是表示代码的编码方法的一例的图。知识辞典的边记录中包含的代码作为一例，开头的比特表示符号比特，第2个比特表示是实字符代码还是虚拟字符代码的区分。例如，在第2个比特为0的情况下，表示实字符代码，在第2个比特为1的情况下，表示虚拟字符代码，通过该代码指定后述的命令代码。

图16是表示命令数据的一例的图。命令处理部51执行命令解释器(interpreter)，对由虚拟字符代码指定的命令代码进行解释，执行由命令代码定义的处理。命令数据例如由字符串的排列定义，通过将虚拟字符代码的上位2比特置换为0而成的编号设为排列的要素的编号，来指定命令数据。例如，图16的命令代码#0由字符串被记述为“ADD_SCORE 300”，是对后述的得分加上指定的值300的加法命令。此外，例如，图16的命令代码#1由字符串被记述为“CHECK_SPACE 5mm”，是确认字符间的空白是否为5mm以上的间隔确认命令。

图17是表示对照结果数据的结构的图。对照部46将字符候选中包含的识别候选的每个从开头起依次与知识辞典进行对照，生成将知识辞典与被推测为在输入图像的记入框内记载的字符串进行对照而得到的对照结果。并且，对照部46将所生成的对照结果写入至对照结果存储部48。

对照结果存储部48存储对照结果数据。对照结果数据按各个位置编号的每个，包含对照结果的个数和对照结果的排列。

对照结果的个数表示与该位置编号相关联的对照结果的个数。对照结果的排列储存与该位置编号相关联的对照结果。各个对照结果包含状态编号α、得分、代码、以及位置编号与对照结果的编号的对。此外，通过与储存目标的排列相关联的位置编号和作为储存目标的排列内的排列要素的编号所成的对，唯一地识别各个对照结果。以后，将与对照结果的储存目标的排列相关联的位置编号称呼为“与对照结果相关联的位置编号”，将作为对照结果的储存目标的排列内的排列要素的编号称呼为“对照结果的编号”。

状态编号α表示知识辞典(DFAα)的状态。即，状态编号α表示按照从开头的识别候选至该位置的识别候选为止的各个字符而将DFAα从开始状态依次转变的情况下到达的状态。

得分表示与从开头的识别候选至该位置的识别候选为止分别相对应的类似度累积而成的值。即，得分表示从开头的识别候选至该位置的识别候选为止的字符串的似真度。代码是表示该位置的识别候选的字符的字符代码。

位置编号和对照结果的编号的对表示一边从开头至该位置为止一个一个地找寻字符候选、一边将字符候选的识别候选作为输入记号而使DFAα转变、一边生成对照结果的过程中的与紧前的对照结果相关联的位置编号和紧前的对照结果的编号。在结果提取部54提取识别结果的字符串时参照位置编号和对照结果的编号的对。

图18是表示对照处理的流程图。参照图18说明图2的步骤S4所示的对照处理的细节。

首先，在步骤S11中，对照部46将对照结果数据初始化。具体而言，对照部46针对对照结果数据的全部位置编号，将对照结果的个数设定为0，并且将对照结果的排列设为空。

接下来，在步骤S12中，对照部46与位置编号0相关联地生成一个新的对照结果。一个新的对照结果中，状态编号α被设定为0，得分被设定为0，位置编号及对照结果的编号被设定为-1，代码被设定为-1。接下来，在步骤S13中，对照部46将与位置编号0相关联的对照结果的个数设定为1。接下来，在步骤S14中，对照部46对表示位置编号的变量Pst代入0。

接下来，在步骤S15中，对照部46判断Pst是否为Pstmax以下。Pstmax是从最后的位置编号Ped减去了1后的值。对照部46在Pst为Pstmax以下的情况下(步骤S15的真)，将处理前进至步骤S16。

在步骤S16中，对照部46判断在从对应的状态引出的边中是否存在被分配了虚拟字符代码的边。并且，在存在被分配了虚拟字符代码的边的情况下，对照部46使状态转变，且将由虚拟字符代码指定的命令代码赋予给命令处理部51，使其执行命令。另外，关于命令的执行处理的细节，参照图21及图22在后面叙述。

接下来，在步骤S17中，对照部46将与Pst相关联的对照结果限缩为从得分最上位起至第Npr个。即，对照部46删除得分比第Npr个低的对照结果。

接下来，在步骤S18中，对照部46对与Pst相关联的各个对照结果，使用知识辞典执行知识辞典搜索处理。由此，对照部46能够生成与比Pst更靠后的位置编号相关联的新的对照结果。另外，关于知识辞典搜索处理，参照图19及图20在后面叙述。

接下来，在步骤S19中，对照部46对Pst加上1。若结束步骤S19，则对照部46将处理返回步骤S15。并且，对照部46反复进行步骤S16至步骤S19的处理，直至Pst超过Pstmax为止。

在Pst没有变为Pstmax以下的情况下(步骤S15的伪)，对照部46将处理前进至步骤S20。在步骤S20中，对照部46针对与最后的位置编号Ped相关联的各个对照结果，执行与步骤S16同样的处理。并且，若结束步骤S20的处理，则对照部46结束本流程。

图19是表示知识辞典搜索处理的流程图。图20表示知识辞典搜索处理中的数据访问的流程的一例。

参照图19及图20，说明图18的步骤S18的知识辞典搜索处理。首先，在步骤S31中，对照部46参照对照结果数据，列举与Pst相关联的全部对照结果。

接下来，在步骤S32中，对照部46参照字符候选数据的排列内的字符候选记录，将以Pst为起点位置的全部字符候选进行字符候选数据的排列内的列举。对照部46对字符候选矩阵中的起点编号与Pst一致的全部条目进行扫描，收集-1以外的字符候选的编号，从而能够列举以Pst为起点位置的全部字符候选。

接下来，对照部46对在步骤S32中列举的全部字符候选记录分别执行步骤S34～步骤S48的处理(步骤S33和步骤S49之间的循环处理)。以后，将与该循环处理中的处理对象的字符候选记录对应的字符候选称为“字符候选Cc”。

在步骤S34中，对照部46参照与字符候选Cc对应的字符候选记录的识别候选的排列，列举该字符候选的全部识别候选条目。

接下来，对照部46对在步骤S34中列举的全部识别候选条目分别执行步骤S36～步骤S47的处理(步骤S35和步骤S48之间的循环处理)。以后，将与该循环处理中的处理对象的识别候选条目对应的识别候选称为“识别候选Cr”。

接下来，对照部46对在步骤S31中列举的、与Pst相关联的全部对照结果分别执行步骤S37～步骤S46的处理(步骤S36和步骤S47之间的循环处理)。以后，将与该循环处理中的处理对象的对照结果称为“对照结果Mp”。

在步骤S37中，对照部46参照知识辞典(DFAα)，列举与处理对象的对照结果Mp中包含的状态编号α对应的状态记录。

接下来，在步骤S38中，对照部46根据在步骤S37中列举的状态记录中包含的指向边记录的指针及边记录的要素数，确定储存有表示从状态编号α的状态引出的边的边记录的范围，从而列举表示从状态编号α的状态引出的边的全部边记录。

接下来，对照部46对在步骤S38中列举的全部边记录分别执行步骤S40～步骤S45的处理(步骤S39和步骤S46之间的循环处理)。以后，将该循环处理中的处理对象的边记录称为“边记录Er”。

在步骤S40中，对照部46判断在识别候选Cr的识别候选条目中设定的字符代码和在边记录Er中设定的字符代码是否一致。在不一致的情况下(步骤S40的否)，对照部46将处理转变至下一边记录，反复进行从步骤S40起的处理。在一致的情况下(步骤S40的是)，对照部46将处理前进至步骤S41。

在步骤S41中，对照部46与字符候选Cc的字符候选记录的终点位置相关联地生成新的对照结果Mn，写入至对照结果数据。

接下来，在步骤S42中，对照部46对新的对照结果Mn，设定在边记录Er中设定的状态编号(转变目标的状态编号)作为状态编号α。

接下来，在步骤S43中，对照部46对新的对照结果Mn，设定在识别候选Cr的识别候选条目中设定的字符代码作为代码。

接下来，步骤S44中，对照部46对新的对照结果Mn，设定与对照结果Mp相关联的位置编号Pst作为位置编号。此外，对照部46针对新的对照结果Mn，储存处理对象的对照结果Mp的编号作为对照结果的编号。

接下来，在步骤S45中，对照部46对新的对照结果Mn，设定在处理对象的对照结果Mp中储存的得分和在识别候选Cr的识别候选条目中储存的类似度相加后的值作为得分。

在步骤S46中，若关于全部边记录，结束了步骤S40～步骤S45的处理，则对照部46脱离循环而将处理前进至步骤S47。

在步骤S47中，若关于与Pst相关联的全部对照结果，结束了步骤S37～步骤S46的处理，则对照部46脱离循环而将处理前进至步骤S48。

在步骤S48中，若关于与字符候选Cc对应的全部识别候选条目，结束了步骤S36～步骤S47的处理，则对照部46脱离循环而将处理前进至步骤S49。

并且，在步骤S49中，若关于全部字符候选记录，结束步骤S34～步骤S48的处理，则对照部46脱离循环，并结束本流程。

这样，对照部46对第一字符候选的对照结果写入表示通过对照而到达的知识辞典(DFAα)的状态的编号(状态编号α)。并且，对照部46将接着第一字符候选的第二字符候选与知识辞典(DFAα)进行对照时，从写入至第一字符候选的对照结果的编号(状态编号α)所示的状态沿着与第二字符候选的识别候选的状态转变对应的边，对第二字符候选进行对照。

图21是表示命令执行处理的流程图。图22表示命令执行处理中的数据的流程。图23是表示字符间的空白的确认的情形的图。

参照图21及图22，说明图18的步骤S16的命令执行处理。首先，在步骤S51中，对照部46参照对照结果数据，列举与Pst相关联的全部对照结果。

接下来，对照部46对在步骤S51中列举的、与Pst相关联的全部对照结果分别执行步骤S53～步骤S61的处理(步骤S52和步骤S62之间的循环处理)。以后，将该循环处理中的处理对象的对照结果称为“对照结果Mp”。

在步骤S53中，对照部46参照知识辞典(DFAα)，列举与处理对象的对照结果Mp中设定的状态编号α对应的状态记录。

接下来，在步骤S54中，对照部46参照在步骤S53中列举的状态记录中设定的指向边记录的指针及边记录的要素数，列举表示从状态编号α的状态引出的边的全部边记录。

接下来，对照部46对在步骤S54中列举的全部边记录分别执行步骤S56～步骤S60的处理(步骤S55和步骤S61之间的循环处理)。以后，将该循环处理中的处理对象的边记录称为“边记录Er”。

在步骤S56中，对照部46判断边记录Er的代码是否为虚拟字符代码。对照部46作为一例，从代码的开头检测第2比特，判断是否为虚拟字符代码。在不是虚拟字符代码的情况下(步骤S56的否)，对照部46将处理转变至下一边记录，反复进行从步骤S56起的处理。在是虚拟字符代码的情况下(步骤S56的是)，对照部46将处理前进至步骤S57。

在步骤S57中，对照部46与Pst相关联地生成新的对照结果Mn，写入至对照结果数据。

接下来，在步骤S58中，对照部46对新的对照结果Mn，设定在边记录Er中设定的状态编号(转变目标的状态编号)作为状态编号α。

接下来，在步骤S59中，对照部46针对新的对照结果Mn，复制对照结果Mp对应的值作为状态编号α以外的要素(得分、代码、位置编号及对照结果的编号)。由此，对照部46能够使状态按照被分配了虚拟字符代码的边转变。

接下来，在步骤S60中，对照部46调用命令处理部51，赋予由虚拟字符代码指定的命令代码，使其执行命令。命令处理部51安装命令解释器，对所赋予的命令代码进行解释，并执行由该命令代码定义的处理。

例如，命令处理部51在被赋予了加法命令“ADD_SCORE”的情况下，对对应的对照结果的得分加上由自变量指定的值。由此，命令处理部51在预先决定的条件的情况下对得分施加权重，能够对字符串的似真度的评价进行操作。

此外，例如，在图21的步骤S60中与位置编号Pst相关联的对照结果Mp的处理中，通过虚拟字符代码执行了包含间隔确认命令“CHECK_SPACE”的命令代码的情况下，如图23所示，命令处理部51确认位置编号Pst的紧前的片段与紧后的片段的间隔，从而确认位置编号Pst的前后的字符间的空白。并且，在间隔是指定的距离以下的情况下，命令处理部51删除对照结果Mp。由此，命令处理部51例如确认姓和名之间的划分的空白，在没有检测到比预先决定的距离长的空白的情况下，能够删除对照结果。

接下来，在步骤S61中，若针对全部边记录，结束了步骤S56～步骤S60的处理，则对照部46脱离循环而将处理前进至步骤S62。

在步骤S62中，若针对与Pst相关联的全部对照结果，结束了步骤S53～步骤S61的处理，则对照部46脱离循环，结束本流程。

这样，对照部46对第一字符候选的对照结果写入表示通过对照而到达的知识辞典(DFAα)的状态的编号(状态编号α)。并且，对照部46在将接着第一字符候选的第二字符候选与知识辞典(DFAα)进行对照时，从写入至第一字符候选的对照结果的编号(状态编号α)所示的状态沿着与第二字符候选的识别候选的状态转变对应的边，对第二字符候选进行对照，生成第二字符候选的对照结果。

进而，对照部46在检测到被分配了虚拟字符代码的边的情况下，按照该边使状态转变，且能够将由虚拟字符代码指定的命令代码赋予给命令处理部51，使其执行命令。

图24是表示由结果提取部进行的字符串的提取处理的流程的流程图。图25是表示在结果提取中参照的数据和在栈中堆积的字符代码的情形的图。

图2的步骤S5所示的结果提取由结果提取部54进行。后面参照图24及图25说明结果提取的细节。首先，在步骤S70中，结果提取部54确认字符候选的个数是否为0，在字符候选的个数为0的情况下，在步骤S84中将识别结果的字符串设为空字符串而结束本流程。在字符候选的个数不是0的情况下，在步骤S71中，结果提取部54列举了与最后的位置编号Ped相关联的全部对照结果之后，执行步骤S72以后的处理。

接下来，在步骤S72中，结果提取部54针对在步骤S71中列举的对照结果的每个，从知识辞典(DFAα)取得与状态编号α对应的状态记录，确认受理状态标记。

接下来，在步骤S73中，结果提取部54判断是否存在与状态编号α对应的状态是受理状态的对照结果。以后，将与状态编号α对应的状态为受理状态的对照结果称为“在DFAα中受理状态的对照结果”。在存在DFAα中受理状态的对照结果的情况下(步骤S73的是)，在步骤S74中，结果提取部54在DFAα中受理状态的对照结果之中，选择得分最大的对照结果作为对照结果Mx。在不存在DFAα中受理状态的对照结果的情况下(步骤S73的否)，在步骤S75中，结果提取部54在所列举的全部对照结果之中，选择得分最大的对照结果作为对照结果Mx。

步骤S74或步骤S75的处理的接下来，在步骤S76中，结果提取部54对表示位置编号的变量p代入与所选择的对照结果Mx相关联的位置编号px。此外，结果提取部54对表示对照结果的编号的变量m代入所选择的对照结果Mx的编号mx。

接下来，在步骤S77中，结果提取部54将作为FILO(先进后出(First In LastOut))存储器的栈设为空。

接下来，在步骤S78中，判断p和m所指的对照结果的代码是否为-1。在p和m所指的对照结果的代码不是-1的情况下(步骤S78的伪)，结果提取部54将处理前进至步骤S79。

在步骤S79中，结果提取部54将在p和m所指的对照结果中储存的代码堆积在栈中。接下来，在步骤S80中，结果提取部54对p代入在p和m所指的对照结果中储存的位置编号，对m代入在p和m所指的对照结果中储存的对照结果的编号。

并且，若结束步骤S80的处理，则结果提取部54将处理返回至步骤S78，反复进行步骤S79和步骤S80的处理，直至在p和m所指的对照结果中储存的代码成为-1为止。由此，结果提取部54如图25所示，能够从字符串的末尾起按顺序选择字符代码，在栈中积累。

在p和m所指的对照结果的代码为-1的情况(步骤S78的真)、即在指向与位置编号0相关联的对照结果的情况下，结果提取部54将处理前进至步骤S81。在步骤S81中，结果提取部54将在存储器中储存的识别结果的字符串初始化为空字符串。

接下来，在步骤S82中，判断栈是否为空。在栈不是空的情况下(步骤S82的伪)，结果提取部54在步骤S83中，从栈顶取出一个代码，追加到存储器中储存的识别结果的字符串的末尾。

若结束步骤S83的处理，则结果提取部54将处理返回步骤S82，反复进行步骤S83的处理，直至栈成为空为止。由此，结果提取部54能够生成从字符串的开头至末尾。

并且，在栈成为空的情况下(步骤S82的真)，结果提取部54结束本流程的处理。

以上那样，本实施方式所涉及的识别装置10能够使用知识辞典进行字符识别，并且与对照处理同步地执行与对照处理不同的处理。

图26是表示实施方式所涉及的识别装置10的硬件结构的图。

识别装置10能够通过可执行程序的一般的计算机系统来实现。识别装置10作为一例，具备显示器110、键盘112、扫描仪114、外部存储装置116、通信装置118和计算机120。

显示器110是显示装置，显示所识别出的字符串等。键盘112是输入装置，受理来自用户的操作而输入信息。扫描仪114读取在纸张等上记载的信息而取得输入图像等。外部存储装置116是硬盘驱动器或光盘驱动器等，存储各种信息。通信装置118经由因特网等而与外部的计算机等之间输入输出信息，例如从外部取得输入图像，或向外部输出字符串。

计算机120作为一例，具有CPU122、输入输出控制部124和存储装置126。CPU122、输入输出控制部124及存储装置126通过总线128连接。

CPU122执行程序而进行识别装置10的整体控制。输入输出控制部124是与显示器110、键盘112、扫描仪114、外部存储装置116及通信装置118等之间的接口。此外，输入输出控制部124还控制经由总线128的数据传输等。

存储装置126包含ROM、RAM或硬盘驱动器等。在存储装置126中，利用同一地址空间，对ROM、RAM或硬盘驱动器等的任意设备都能够进行访问。存储装置126存储程序、输入图像、样式数据、辞典数据(字符识别辞典及知识辞典)、作业数据(字符候选及对照结果)、及命令数据等。这些数据也可以被存储至构成存储装置的任意设备(ROM、RAM及硬盘驱动器)中。此外，也可以是这些数据的一部分或全部被存储至外部存储装置116、或经由通信装置118访问的服务器等中。

由本实施方式的识别装置10执行的程序能够通过可安装的形式或可执行的形式的文件被记录至CD-ROM、软磁盘(FD)、CD-R、DVD等计算机可读取的记录介质中而加以提供。此外，也可以构成为将由本实施方式的识别装置10执行的程序储存在与因特网等网络连接的计算机上，通过经由网络而下载来加以提供。此外，也可以构成为将由本实施方式的识别装置10执行的程序经由因特网等网络进行提供或发布。

由本实施方式的识别装置10执行的程序成为包含上述的各部(输入部30、候选检测部36、识别部42、对照部46、命令处理部51、结果提取部54及输出部56)的模块结构，作为实际的硬件，CPU(处理器)从上述存储介质读出并执行程序从而上述各部被加载至主存储装置上，在存储装置126上生成输入部30、候选检测部36、识别部42、对照部46、命令处理部51、结果提取部54及输出部56。另外，也可以是输入部30、候选检测部36、识别部42、对照部46、命令处理部51、结果提取部54及输出部56的一部分或全部由硬件构成。

说明了本发明的几个实施方式，但这些实施方式作为例而提示，没有意图限定发明的范围。这些新的实施方式能够通过其他各种方式来实施，能够在不脱离发明的主旨的范围内，进行各种省略、置换、变更。这些实施方式、其变形被包含于发明的范围、主旨中，且被包含于在权利要求书中记载的发明及其均等的范围。

Claims

1.一种识别装置，其中，具备：

候选检测部，从输入图像检测字符候选，所述字符候选是被推测为包含字符的像素的集合；

识别部，对所述字符候选的每一个进行识别，生成至少一个识别候选，所述识别候选是识别结果的候选的字符；

对照部，将所述至少一个识别候选的每一个与将识别对象的字符串模型化而得的知识辞典进行对照，生成对照结果，该对照结果是对被推测为包含于所述输入图像中的字符串和知识辞典进行对照而得到的；以及

命令处理部，执行所赋予的命令，

所述知识辞典为有限自动机，表示字符的实字符代码和指定命令的虚拟字符代码的其中一方被分配给边，在对边分配了所述实字符代码的情况下，根据表示所述识别候选的字符的字符代码，按照该边而发生状态的转变，对边分配了所述虚拟字符代码的情况下，与所述识别候选的字符无关地，按照该边而发生状态的转变，且输出由所述虚拟字符代码指定的命令代码，

所述对照部按照分配有所述识别候选的边依次使所述知识辞典的状态转变，由此进行对照，在按照分配有所述虚拟字符代码的边而使所述知识辞典的状态转变的情况下，将由分配给该边的所述虚拟字符代码指定的命令赋予给所述命令处理部。

2.如权利要求1所述的识别装置，其中，

所述对照部生成包含表示对应的字符串的似真度的得分的一个以上的对照结果，

所述识别装置还具备结果提取部，所述结果提取部基于所述得分，从所述一个以上的对照结果选择一个对照结果，提取由所选择的对照结果确定的字符串。

3.如权利要求2所述的识别装置，其中，

所述命令处理部处理将指定的值加到对应的对照结果的得分中的加法命令。

4.如权利要求2所述的识别装置，其中，

所述命令处理部处理间隔确认命令，所述间隔确认命令是确认与对照结果相关联的位置前后的字符间的空白，在该空白为指定的距离以下的情况下，删除对应的对照结果。

5.如权利要求2所述的识别装置，其中，

所述知识辞典为确定有限自动机，

所述对照部对第一字符候选的对照结果写入表示通过对照而到达的所述确定有限自动机的状态的编号，

在将接着所述第一字符候选的第二字符候选与所述确定有限自动机进行对照时，从写入至所述第一字符候选的对照结果中的编号所示的状态沿着与第二字符候选的识别候选的状态转变对应的边，对第二字符候选进行对照。

6.一种识别方法，其中，包含：

候选检测步骤，从输入图像检测字符候选，所述字符候选是被推测为包含字符的像素的集合；

识别步骤，对所述字符候选的每一个进行识别，生成至少一个识别候选，所述识别候选是识别结果的候选的字符；

对照步骤，将所述至少一个识别候选的每一个与将识别对象的字符串模型化而得的知识辞典进行对照，生成对照结果，该对照结果是对被推测为包含于所述输入图像中的字符串和知识辞典进行对照而得到的；以及

命令处理步骤，执行所赋予的命令，

所述知识辞典为有限自动机，表示字符的实字符代码及包含命令的虚拟字符代码的其中一方被分配给边，在对边分配了所述实字符代码的情况下，根据表示所述识别候选的字符的字符代码，按照该边而发生状态的转变，对边分配了所述虚拟字符代码的情况下，与所述识别候选的字符无关地，按照该边而发生状态的转变，且输出由所述虚拟字符代码指定的命令代码，

在所述对照步骤中，按照分配有所述识别候选的边依次使所述知识辞典的状态转变，由此进行对照，在按照分配有所述虚拟字符代码的边而使所述知识辞典的状态转变的情况下，执行分配给该边的所述虚拟字符代码中包含的命令。

7.一种计算机可读取的记录介质，记录有用于使计算机作为识别装置发挥作用的程序，其中，

所述程序使所述计算机执行：

命令处理步骤，执行所赋予的命令，

在所述对照步骤中，按照分配有所述识别候选的边依次使所述知识辞典的状态转变，由此进行对照，在按照分配有所述虚拟字符代码的边而使所述知识辞典的状态转变的情况下，执行由分配给该边的所述虚拟字符代码指定的命令。