CN103714332B - 字符识别设备和字符识别方法 - Google Patents

字符识别设备和字符识别方法 Download PDF

Info

Publication number
CN103714332B
CN103714332B CN201310286604.2A CN201310286604A CN103714332B CN 103714332 B CN103714332 B CN 103714332B CN 201310286604 A CN201310286604 A CN 201310286604A CN 103714332 B CN103714332 B CN 103714332B
Authority
CN
China
Prior art keywords
character
pattern
code
character recognition
characteristic information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310286604.2A
Other languages
English (en)
Other versions
CN103714332A (zh
Inventor
织田英人
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Publication of CN103714332A publication Critical patent/CN103714332A/zh
Application granted granted Critical
Publication of CN103714332B publication Critical patent/CN103714332B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/1916Validation; Performance evaluation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/217Validation; Performance evaluation; Active pattern learning techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/19147Obtaining sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Character Discrimination (AREA)

Abstract

公开了字符识别设备和字符识别方法。一种字符识别设备,包括估计值输出单元、生成单元、学习单元以及确定单元。估计值输出单元针对每个互不相同的字符识别程序输出多个估计值。每个估计值均指示字符图案与每个字符码的对应程度。生成单元生成关于字符图案的特征信息。特征信息包括由估计值输出单元输出的估计值作为元素。基于字符图案的特征信息,学习单元学习以逐个字符码为基础对特征信息的多种分类。确定单元基于如下条件来确定未知字符图案的字符码,所述条件是在所学习的以逐个字符码为基础对特征信息的多种分类当中的哪一种分类包括了由生成单元生成的关于该未知字符图案的特征信息。未知字符图案是字符码未知的字符图案。

Description

字符识别设备和字符识别方法
技术领域
本发明涉及字符识别设备和字符识别方法。
背景技术
一些字符识别程序用于识别由人绘制的手写字符的字符码。在日本未审查专利申请公开第8-96082号中,描述了目的在于通过相互比较从多个字符识别程序获得的各输出结果来改进字符识别的准确度的发明。
对于一些字符,字符识别程序可能以高准确度输出结果,而对于另一些字符,该字符识别程序可能以低准确度输出结果。当仅以简单方式比较来自字符识别程序的各输出结果时,很难考虑这样的情况。
发明内容
本发明的目的在于提供一种字符识别设备和字符识别方法,其通过使用将不同的字符识别方法相互结合的统计的机器学习来以高准确度获得字符识别结果。
根据本发明的第一方面,提供一种字符识别设备,其包括估计值输出单元、生成单元、学习单元、以及确定单元。估计值输出单元针对每个互不相同的字符识别程序输出多个估计值。每个估计值都指示已被输入的字符图案与将使用字符识别程序识别的每个字符码的对应程度。生成单元生成关于已被输入的字符图案的特征信息。特征信息包括通过估计值输出单元输出的估计值作为元素。基于由生成单元生成的关于预先指定了字符码的字符图案的特征信息,学习单元学习以逐个字符码为基础对特征信息的多种分类。确定单元基于如下条件来确定未知字符图案的字符码,其中所述条件是在所学习的以逐个字符码为基础对特征信息的多种分类当中的哪一种分类包括了由生成单元生成的关于该未知字符图案的特征信息。未知字符图案是字符码未知的字符图案。
根据本发明的第二方面,在根据第一方面的字符识别设备中,字符识别程序包括第一字符识别程序和第二字符识别程序。将由第一字符识别程序识别的至少一些字符码与将由第二字符识别程序识别的至少一些字符码匹配。
根据本发明的第三方面,根据第一或第二方面的字符识别设备还包括指定单元和添加单元。对于预先指定了字符码的每个字符图案,指定单元将针对字符图案由确定单元确定的字符码与针对字符图案指定的字符码进行比较,并且基于通过比较获得的结果来指定准确率等于或小于阈值的字符码。添加单元将用于对指定单元所指定的字符码进行识别的字符识别程序添加到估计值输出单元。
根据本发明的第四方面,提供一种字符识别方法,包括以下步骤:针对每个互不相同的字符识别程序输出估计值,每个估计值均指示已被输入的字符图案与将使用字符识别程序来识别的每个字符码的对应程度;生成关于已被输入的字符图案的特征信息,特征信息包括估计值作为元素;基于所生成的关于预先指定了字符码的字符图案的特征信息,学习以逐个字符码为基础对特征信息的多种分类;以及基于如下条件来确定未知字符图案的字符码,其中所述条件是在所学习的以逐个字符码为基础对特征信息的多种分类当中的哪一种分类包括了所生成的关于该未知字符图案的特征信息,未知字符图案是字符码未知的字符图案。
根据第一和第四方面,与不使用本发明的配置的情况相比,通过使用相互结合不同的字符识别方法的统计的机器学习,获得了具有高准确度的字符识别结果。
根据本发明的第二方面,与不使用通过不同字符识别方法所获得的针对相同字符码的多个结果来执行估计的情况相比,获得了具有高准确度的字符识别结果。
根据本发明的第三方面,通过添加被配置成用于对其他字符识别方法输出了具有低准确度的结果的字符码进行识别的字符识别方法,获得了具有高准确度的字符识别结果。
附图说明
将基于附图详细地描述本发明的示例性实施例,其中:
图1是根据示例性实施例的字符识别设备的功能框图;
图2是用于描述生成特征矢量的处理的示图;
图3是学习处理的流程图;
图4是字符识别处理的流程图;以及
图5是设置字符识别引擎的处理的流程图。
具体实施方式
以下将参考附图描述用于实现本发明的示例性实施例(此后称为示例性实施例)。
功能块
图1示出根据示例性实施例的字符识别设备1的功能框图。如图1中所示,字符识别设备1包括培训数据获取单元11、字符图案输入单元12、字符识别引擎管理单元13、特征矢量生成单元14、鉴别器培训单元15、鉴别器数据保持单元16、未知图案获取单元17、字符辨识单元18、以及辨识结果输出单元19。
包括在字符识别设备1中的上述单元的功能可以以计算机读取并随后执行存储在计算机可读信息存储介质中的程序的方式实现,所述计算机包括诸如中央处理单元(CPU)之类的控制单元、诸如存储器之类的存储单元、以及从外部装置接收数据/将数据发送到外部装置的输入/输出单元。可以经由诸如光盘、磁盘、磁带、磁光盘、或闪存之类的信息存储介质来将程序提供给作为计算机的字符识别设备1。可替换地,可以经由诸如互联网之类的数据通信网络来提供程序。
培训数据获取单元11获取用于对识别字符的鉴别器(辨识模型)进行培训的培训数据。例如,当培训数据是离线字符图案时,培训数据可以包括关于字符图案的信息和由该字符图案指示的字符码。当培训数据是在线字符图案时,培训数据可以包括关于字符图案的信息、该字符图案的笔划顺序数据(笔划数据)、以及由该字符图案指示的字符码。
字符图案输入单元12将通过以下描述的培训数据获取单元11和未知图案获取单元17所获取的字符图案输入到字符识别引擎管理单元13中。对于离线字符图案,字符图案输入单元12将字符图案(字符图像)输入到字符识别引擎管理单元13中,而对于在线字符图案,字符图案输入单元12将字符图案(字符图像)及其笔划顺序数据输入到字符识别引擎管理单元13中。
字符识别引擎管理单元13包括多个字符识别引擎,即,字符识别程序,并且对将信息输入到字符识别引擎和将信息从字符识别引擎输出进行管理。
字符识别引擎管理单元13包括互不相同的字符识别引擎E1至EN(其中,N是等于或大于2的整数)。字符识别引擎E1至EN可以是用于离线字符识别的引擎,或者可以是用于在线字符识别的引擎。字符识别引擎Ei(其中,i是从1到N中的任何整数)被配置成识别数量为Mi的字符码,而且生成并随后输出Mi维估计矢量Wi,该矢量的元素是与相应Mi个字符码相对应的关于已从字符图案输入单元12输入的字符图案的估计值(诸如,可能性、相似性、或距离)。将由字符识别引擎Ei识别的字符码可能不同于将由其它字符识别引擎识别的字符码。可替换地,将由字符识别引擎Ei识别的至少一些字符码可能与将由其它字符识别引擎识别的至少一些字符码匹配。
特征矢量生成单元14根据各估计矢量来生成针对已由字符图案输入单元12输入到字符识别引擎管理单元13的字符图案的特征矢量,其中各估计矢量中的每个估计矢量是按照字符图案从包括在字符识别引擎管理单元13中的字符识别引擎E1至EN中的相应一个输出的。
图2是用于描述生成特征矢量的处理的示图。如图2中所示,特征矢量生成单元14顺序地将从各个字符识别引擎E1至EN输出的估计矢量W1至WN连接起来,以生成(M1+M2+...+MN)维特征矢量W。在图2中,Si(x,cj)表示正确度,诸如,可能性、距离、或相似性,其指示字符图案X有多大可能对应于字符识别引擎Ei中的第j个字符码(其中,j是编号)。
鉴别器培训单元15基于由特征矢量生成单元14生成的特征矢量和针对字符图案确定的字符码来使得鉴别器学习由培训数据获取单元11获取的培训数据中的字符图案。特别是,诸如AdaBoost或支持矢量机器之类的机器学习模型可以用作鉴别器。鉴别器培训单元15可以基于以逐个字符码为基础的特征矢量组来生成用于识别字符码的参数。
鉴别器数据保持单元16保持由鉴别器培训单元15生成的参数。
未知图案获取单元17获取将被识别的字符图案。例如,未知图案获取单元17可以获取被输入到连接至字符识别设备1的输入设备(诸如,触摸板)中的手写字符来作为未知图案。
字符图案输入单元12将由未知图案获取单元17获取的未知图案输入到字符识别引擎管理单元13中。然后,每个字符识别引擎E1至EN生成针对该未知图案的估计矢量。特征矢量生成单元14基于由字符识别引擎E1至EN生成的估计矢量来生成针对未知图案的特征矢量。针对未知图案生成特征矢量的处理类似于针对包括在培训数据中的字符图案生成特征矢量的处理。
字符辨识单元18基于由特征矢量生成单元14生成的针对未知图案的特征矢量和保持在鉴别器数据保持单元16中的并且是通过学习对字符码的辨识而获得的参数,来辨识对应于未知图案的字符码。
辨识结果输出单元19输出由字符辨识单元18辨识的字符码。例如,辨识结果输出单元19生成用于输出由字符辨识单元18辨识的字符码的输出信息,并且可以将输出信息输出到例如连接到字符识别设备1的显示器或打印机。
流程图
以下将参考图3至图5中的流程图来详细描述在字符识别设备1中执行的处理。
学习处理
图3是在字符识别设备1中执行的学习处理的流程图。学习处理是使得鉴别器基于培训数据(指导数据)来学习对字符码的辨识的处理。
如图3中所示,字符识别设备1将变量l(其中,1是从1到L中的任何整数)设置为1作为初始值(在步骤S101中),并且选择培训数据D1(在步骤S102中)。
然后,字符识别设备1将变量i(其中,i是从1到N中的任何整数)设置为1作为初始值(在步骤S103中),并且选择字符识别引擎Ei(在步骤S104中)。
然后,字符识别设备1将变量j(其中,j是从1到Mi中的任何整数,并且Mi指示了字符识别引擎Ei能够辨识的字符的数量)设置为1作为初始值(在步骤S105中),计算指示了培训数据Dl有多大可能对应于字符识别引擎Ei中的第j个字符的得分wj(在步骤S106中),并且添加所计算的得分wj作为特征矢量Wl的元素(在步骤S107中)。
如果第j个字符不是字符识别引擎Ei中的最后一个字符,即,不满足表达式j=Mi(在步骤S108中为否),则字符识别设备1使j增加1(在步骤S109中),并且处理返回到步骤S106。如果第j个字符是字符识别引擎Ei中的最后一个字符,即,满足表达式j=Mi(在步骤S108中为是),则字符识别设备1确定变量i是否达到N,即,培训数据Dl是否已被最后一个字符识别引擎处理(在步骤S110中)。
如果变量i未达到N(在步骤S110中为否),则字符识别设备1使i增加1(在步骤S111中),并且处理返回到步骤S104。如果变量i达到N(在步骤S110中为是),则字符识别设备1确定变量l是否到达L,即,最后一个培训数据是否已被处理(在步骤S112中)。
如果变量l未达到L(在步骤S112中为否),则字符识别设备1使l增加1(在步骤S113中),并且处理返回到步骤S102。如果变量l达到L(在步骤S112中为是),则字符识别设备1基于针对各段培训数据D1至DL生成的特征矢量W1至WL通过学习对在鉴别器中的字符码的辨识来计算学习参数(在步骤S114中),存储所计算的学习参数(在步骤S115),并且结束处理。
字符识别处理
以下将描述识别未知字符图案并且由已学习了对字符码的辨识的鉴别器所执行的处理(字符识别处理)。
图4是在字符识别设备1中执行的字符识别处理的流程图。如图4中所示,字符识别设备1获取未知字符图案P(在步骤S201中)。
然后,字符识别设备1将变量i(其中,i是从1到N中的任何整数)设置为1作为初始值(在步骤S202中),并且选择字符识别引擎Ei(在步骤S203中)。
然后,字符识别设备1将变量j(其中,j是从1到Mi中的任何整数,并且Mi指示了字符识别引擎Ei能够辨识的字符的数量)设置为1作为初始值(在步骤S204中),计算指示了字符图案P有多大可能对应于字符识别引擎Ei中的第j个字符的得分wj(在步骤S205中),并且添加所计算的得分wj作为特征矢量WP的元素(在步骤S206中)。
如果第j个字符不是字符识别引擎Ei中的最后一个字符,即,不满足表达式j=Mi(在步骤207中为否),则字符识别设备1使j增加1(在步骤S208中),并且处理返回到步骤S205。如果第j个字符是字符识别引擎Ei中的最后一个字符,即,满足表达式j=Mi(在步骤S207中为是),则字符识别设备1确定变量i是否达到N,即,字符图案P是否已被最后一个字符识别引擎处理(在步骤S209中)。
如果变量i未达到N(在步骤209中为否),则字符识别设备1使i增加1(在步骤S210中),并且处理返回到步骤S203。如果变量i达到N(在步骤S209中为是),则字符识别设备1基于针对未知字符图案P生成的特征矢量WP和已通过由鉴别器执行的学习获得的学习参数来辨识对应于字符图案P的字符(在步骤S211中),输出辨识结果(在步骤S212中),并且结束处理。
设置字符识别引擎的处理
以下将描述在学习处理之后执行的设置字符识别引擎的处理。
图5是设置字符识别引擎的处理的流程图。设置字符识别引擎的处理是这样的处理:当学习了对字符码的辨识的鉴别器具有针对字符码不足的辨识率时,添加字符识别引擎以补充对辨识率不足的字符码的辨识。
如图5中所示,字符识别设备1将变量k(其中,k是从1到K中的任何整数)设置为1作为初始值(在步骤S301中),并且选择测试数据Tk(在步骤S302中)。测试数据可以是包括字符图案和字符图案的字符码的信息,其类似于培训数据。
然后,字符识别设备1将变量i(其中,i是从1到N中的任何整数)设置为1作为初始值(在步骤S303中),并且选择字符识别引擎Ei(在步骤S304中)。
然后,字符识别设备1将变量j(其中,j是从1到Mi中的任何整数,并且Mi指示字符识别引擎Ei能够辨识的字符的数量)设置为1作为初始值(在步骤S305中),计算指示了测试数据Tk有多大可能对应于字符识别引擎Ei中的第j个字符的得分wj(在步骤S306中),并且添加所计算的得分wj作为特征矢量Wk的元素(在步骤S307中)。
如果第j个字符不是字符识别引擎Ei中的最后一个字符,即,不满足表达式j=Mi(在步骤S308中为否),则字符识别设备1使j增加1(在步骤S309中),并且处理返回到步骤S306。如果第j个字符是字符识别引擎Ei中的最后一个字符,即,满足表达式j=Mi(在步骤S308为是),则字符识别设备1确定变量i是否达到N,即,测试数据Tk是否已被最后一个字符识别引擎处理(在步骤S310中)。
如果变量i未达到N(在步骤S310中为否),则字符识别设备1使i增加1(在步骤S311中),并且处理返回到步骤S304。如果变量i达到N(在步骤S310中为是),则字符识别设备1基于针对测试数据Tk计算出的特征矢量Wk和通过由鉴别器执行的学习所获得的学习参数来辨识与测试数据Tk的字符图案相对应的字符码(在步骤S312中)。然后,字符识别设备1记录指示了在步骤S312中辨识的字符码是否与针对测试数据Tk的字符图案所确定的字符码相匹配的匹配信息(在步骤S313中)。
然后,字符识别设备1确定变量k是否达到K,即,最后一个测试数据是否已被处理(在步骤S314中)。如果变量k未达到K(在步骤S314中为否),则字符识别设备1使k增加1(在步骤S315中),并且处理返回到步骤S302。如果变量k达到K(在步骤S314中为是),则字符识别设备1基于在步骤S313中记录的针对每个字符码的匹配信息来确定是否存在准确率等于或小于阈值的字符码(在步骤S316中)。
如果不存在准确率等于或小于阈值的字符码(在步骤S316中为否),则字符识别设备1结束处理。如果存在准确率等于或小于阈值的字符码(在步骤S316中为是),则字符识别设备1把将对准确率等于或小于阈值的字符码进行识别所用到的新字符识别引擎添加至字符识别引擎E1至EN(在步骤S317中),并且结束设置字符识别引擎的处理。
在设置字符识别引擎的处理完成之后,可以再次执行图3中所示的学习处理。可以重复执行图3中所示的学习处理和图5中所示的设置字符识别引擎的处理,直到在图5的流程图中的步骤S316中确定不存在准确率等于或小于阈值的字符码为止。
在上述字符识别设备1中,即使在单个字符识别引擎以高准确度识别出一些字符而以低准确度识别出一些字符时,使用通过结合多个字符识别引擎的字符识别结果而获得的特征矢量,以通过利用经由机器学习预先获得的字符码分类结果来辨识字符图案的字符码。与输出结果是从单个字符识别引擎获得的或者是通过对从各个字符识别引擎获得的各个结果进行比较而获得的情况相比,字符识别设备1实现了高准确度的字符识别。
本发明不限于上述示例性实施例。在上述流程图中,处理的是离线字符图案。不必说,本发明可以以类似方式应用至在线字符图案。
提供本发明的示例性实施例的以上说明,用于说明和描述的目的。其不是排他性的或者将本发明限于所披露的准确形式。明显地,多种修改和改变对于本领域技术人员来说是显而易见的。选择和描述上述实施例是为了最好地解释本发明的原理及其实际应用,由此使本领域技术人员能够理解用于多个实施例的发明,并且多种修改适于所预期的特定使用。本发明的范围由所附权利要求及其等价物限定。

Claims (3)

1.一种字符识别设备,包括:
估计值输出单元,其针对互不相同的多个字符识别程序的每一个输出多个估计值,所述多个估计值中的每一个均指示已被输入的字符图案与将使用所述字符识别程序来识别的多个字符码中的每一个的对应程度;
生成单元,其生成关于已被输入的所述字符图案的特征信息,所述特征信息包括由所述估计值输出单元输出的所述多个估计值作为元素;
学习单元,其基于由所述生成单元生成的关于预先指定了字符码的字符图案的特征信息来学习以逐个字符码为基础对特征信息的多种分类;
确定单元,其基于如下条件来确定未知字符图案的字符码,其中所述条件是在所学习的以逐个字符码为基础对特征信息的多种分类当中的哪一种分类包括了由所述生成单元生成的关于所述未知字符图案的特征信息,所述未知字符图案是字符码未知的字符图案;
指定单元,对于预先指定了字符码的多个字符图案中的每个,所述指定单元将针对字符图案由所述确定单元确定的字符码与针对所述字符图案指定的字符码进行比较,并且基于通过所述比较获得的结果来指定准确率等于或小于阈值的字符码;以及
添加单元,其将用于对所述指定单元所指定的所述字符码进行识别的字符识别程序添加至所述估计值输出单元。
2.根据权利要求1所述的字符识别设备,
其中,所述多个字符识别程序包括第一字符识别程序和第二字符识别程序,并且
其中,将由所述第一字符识别程序识别的多个字符码中的至少一些与将由所述第二字符识别程序识别的多个字符码中的至少一些匹配。
3.一种字符识别方法,包括:
针对互不相同的多个字符识别程序的每一个输出多个估计值,所述多个估计值中的每一个均指示已被输入的字符图案与将使用所述字符识别程序来识别的多个字符码中的每一个的对应程度;
生成关于已被输入的所述字符图案的特征信息,所述特征信息包括所述多个估计值作为元素;
基于所生成的关于预先指定了字符码的字符图案的特征信息,来学习以逐个字符码为基础对特征信息的多种分类;
基于如下条件来确定未知字符图案的字符码,其中所述条件是在所学习的以逐个特征码为基础对特征信息的多种分类当中的哪一种分类包括了所生成的关于所述未知字符图案的特征信息,所述未知字符图案是字符码未知的字符图案;
对于预先指定了字符码的多个字符图案中的每个,将针对字符图案确定的字符码与针对所述字符图案指定的字符码进行比较,并且基于通过所述比较获得的结果来指定准确率等于或小于阈值的字符码;以及
添加用于对所指定的所述字符码进行识别的字符识别程序。
CN201310286604.2A 2012-10-01 2013-07-09 字符识别设备和字符识别方法 Active CN103714332B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2012219462A JP6003492B2 (ja) 2012-10-01 2012-10-01 文字認識装置及びプログラム
JP2012-219462 2012-10-01

Publications (2)

Publication Number Publication Date
CN103714332A CN103714332A (zh) 2014-04-09
CN103714332B true CN103714332B (zh) 2018-09-07

Family

ID=50385273

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310286604.2A Active CN103714332B (zh) 2012-10-01 2013-07-09 字符识别设备和字符识别方法

Country Status (3)

Country Link
US (1) US9135525B2 (zh)
JP (1) JP6003492B2 (zh)
CN (1) CN103714332B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9898187B2 (en) 2013-06-09 2018-02-20 Apple Inc. Managing real-time handwriting recognition
US9495620B2 (en) 2013-06-09 2016-11-15 Apple Inc. Multi-script handwriting recognition using a universal recognizer
US20140361983A1 (en) * 2013-06-09 2014-12-11 Apple Inc. Real-time stroke-order and stroke-direction independent handwriting recognition
DK179374B1 (en) 2016-06-12 2018-05-28 Apple Inc Handwriting keyboard for monitors
JP6532619B2 (ja) * 2017-01-18 2019-06-19 三菱電機株式会社 音声認識装置
US11194467B2 (en) 2019-06-01 2021-12-07 Apple Inc. Keyboard management user interfaces
CN112926334A (zh) * 2019-12-06 2021-06-08 北京三星通信技术研究有限公司 确定词表示向量的方法、装置及电子设备
CN112270325B (zh) * 2020-11-09 2024-05-24 携程旅游网络技术(上海)有限公司 字符验证码识别模型训练方法、识别方法、系统、设备及介质
US11961317B2 (en) * 2021-11-24 2024-04-16 Oracle Financial Services Software Limited Extracting textual information from image documents

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1388947A (zh) * 2000-08-31 2003-01-01 惠普公司 字符识别系统
US7302099B2 (en) * 2003-11-10 2007-11-27 Microsoft Corporation Stroke segmentation for template-based cursive handwriting recognition
US7369702B2 (en) * 2003-11-07 2008-05-06 Microsoft Corporation Template-based cursive handwriting recognition
CN101460960A (zh) * 2006-05-31 2009-06-17 微软公司 用于提供手写识别的组合器
US7865018B2 (en) * 2005-06-02 2011-01-04 Microsoft Corporation Personalized implicit and explicit character shape adaptation and recognition

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61272887A (ja) * 1985-05-28 1986-12-03 Toshiba Corp 文字認識方式
JP3110552B2 (ja) * 1992-05-07 2000-11-20 三菱電機株式会社 文字認識装置
JP3265701B2 (ja) * 1993-04-20 2002-03-18 富士通株式会社 多判定器によるパターン認識装置
JP2673871B2 (ja) * 1993-08-26 1997-11-05 日本アイ・ビー・エム株式会社 ニューラル・ネットワークによるパターン認識方法及び装置
JPH0896083A (ja) * 1994-09-28 1996-04-12 Sumitomo Metal Ind Ltd 文字認識装置
JPH0896082A (ja) 1994-09-29 1996-04-12 Toshiba Corp 文字認識装置及び文字認識方法
JPH08272907A (ja) * 1995-03-28 1996-10-18 Toshiba Corp 文字認識装置及び方法
US5835633A (en) * 1995-11-20 1998-11-10 International Business Machines Corporation Concurrent two-stage multi-network optical character recognition system
JPH09288717A (ja) 1996-04-24 1997-11-04 Brother Ind Ltd 文字認識装置
JP3595900B2 (ja) 1998-09-28 2004-12-02 富士通株式会社 手書き文字認識装置及び記録媒体
JP2001022883A (ja) 1999-07-12 2001-01-26 Ricoh Co Ltd 文字認識方式及び該文字認識方式の機能を実現させるための記録媒体
US7254269B2 (en) * 2000-08-31 2007-08-07 Hewlett-Packard Development Company, L.P. Character recognition system
US7031530B2 (en) * 2001-11-27 2006-04-18 Lockheed Martin Corporation Compound classifier for pattern recognition applications
US20040146200A1 (en) * 2003-01-29 2004-07-29 Lockheed Martin Corporation Segmenting touching characters in an optical character recognition system to provide multiple segmentations
US7848566B2 (en) * 2004-10-22 2010-12-07 Carnegie Mellon University Object recognizer and detector for two-dimensional images using bayesian network based classifier
US7496547B2 (en) * 2005-06-02 2009-02-24 Microsoft Corporation Handwriting recognition using a comparative neural network
JP2011257805A (ja) * 2010-06-04 2011-12-22 Sony Corp 情報処理装置および方法、並びにプログラム
US8548256B2 (en) * 2010-07-01 2013-10-01 Intellectual Ventures Fund 83 Llc Method for fast scene matching
JP2014092817A (ja) * 2012-10-31 2014-05-19 Fuji Xerox Co Ltd 文字認識装置及びプログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1388947A (zh) * 2000-08-31 2003-01-01 惠普公司 字符识别系统
US7369702B2 (en) * 2003-11-07 2008-05-06 Microsoft Corporation Template-based cursive handwriting recognition
US7302099B2 (en) * 2003-11-10 2007-11-27 Microsoft Corporation Stroke segmentation for template-based cursive handwriting recognition
US7865018B2 (en) * 2005-06-02 2011-01-04 Microsoft Corporation Personalized implicit and explicit character shape adaptation and recognition
CN101460960A (zh) * 2006-05-31 2009-06-17 微软公司 用于提供手写识别的组合器

Also Published As

Publication number Publication date
US9135525B2 (en) 2015-09-15
JP2014071813A (ja) 2014-04-21
JP6003492B2 (ja) 2016-10-05
CN103714332A (zh) 2014-04-09
US20140093161A1 (en) 2014-04-03

Similar Documents

Publication Publication Date Title
CN103714332B (zh) 字符识别设备和字符识别方法
CN110362677B (zh) 文本数据类别的识别方法及装置、存储介质、计算机设备
CN111027378B (zh) 行人重识别的方法、装置、终端及存储介质
CN111368024A (zh) 文本语义相似度的分析方法、装置及计算机设备
CN110046706B (zh) 模型生成方法、装置及服务器
CN103415825A (zh) 用于手势识别的系统和方法
CN104573652A (zh) 确定人脸图像中人脸的身份标识的方法、装置和终端
JP2011054179A5 (zh)
CN110033170A (zh) 识别风险商家的方法及装置
CN110288085B (zh) 一种数据处理方法、装置、系统及存储介质
TWI776566B (zh) 動作識別方法、電腦設備及電腦可讀儲存介質
CN106022208A (zh) 人体动作识别方法及装置
CN110705584A (zh) 情绪识别方法、装置、计算机装置及存储介质
CN109299594A (zh) 身份验证方法及装置
CN112270325B (zh) 字符验证码识别模型训练方法、识别方法、系统、设备及介质
CN109740567A (zh) 关键点定位模型训练方法、定位方法、装置及设备
CN109685104B (zh) 一种识别模型的确定方法和装置
CN109408175B (zh) 通用高性能深度学习计算引擎中的实时交互方法及系统
CN107729947A (zh) 一种人脸检测模型训练方法、装置和介质
CN113220828B (zh) 意图识别模型处理方法、装置、计算机设备及存储介质
CN113220854B (zh) 机器阅读理解的智能对话方法及装置
JP2017054323A (ja) 生体認証装置、生体認証方法、及び生体認証プログラム
CN109621427A (zh) 恶意用户的处理方法、装置、服务器及存储介质
US9042641B2 (en) Character recognition apparatus, character recognition method, and computer-readable medium
CN111126617B (zh) 一种选择融合模型权重参数的方法、装置及设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder

Address after: Tokyo

Patentee after: Fuji film business innovation Co.,Ltd.

Address before: Tokyo

Patentee before: Fuji Xerox Co.,Ltd.

CP01 Change in the name or title of a patent holder