CN1752992A - 文字识别装置、文字识别方法及文字识别程序 - Google Patents

文字识别装置、文字识别方法及文字识别程序 Download PDF

Info

Publication number
CN1752992A
CN1752992A CNA2005100535676A CN200510053567A CN1752992A CN 1752992 A CN1752992 A CN 1752992A CN A2005100535676 A CNA2005100535676 A CN A2005100535676A CN 200510053567 A CN200510053567 A CN 200510053567A CN 1752992 A CN1752992 A CN 1752992A
Authority
CN
China
Prior art keywords
font
aforementioned
written
hand
literal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2005100535676A
Other languages
English (en)
Inventor
斋藤照花
小山俊哉
榊原正义
馆野昌一
田中圭
中村浩太郎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Publication of CN1752992A publication Critical patent/CN1752992A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/242Division of the character sequences into groups prior to recognition; Selection of dictionaries
    • G06V30/244Division of the character sequences into groups prior to recognition; Selection of dictionaries using graphical properties, e.g. alphabet type or font
    • G06V30/2455Discrimination between machine-print, hand-print and cursive writing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)

Abstract

本发明提供一种可进行混合有铅字和手写文字的文件的电子化之文字识别装置、文字识别方法及文字识别程序。利用图像输入部11,生成混合有铅字和手写文字之原稿的图像,且该图像利用铅字部/手写部分离处理部12,分离为基于前述铅字的铅字部和基于前述手写文字的手写部。利用铅字部OCR处理部13和手写部OCR处理部18对它们分别进行OCR处理,且将铅字OCR的结果在登记词典17中进行登记。利用手写部OCR处理部18之手写部的候补识别为复数个,当存在与其附近的铅字OCR结果一致的铅字时,利用该铅字进行手写部的OCR处理,并将该结果由OCR结果合成处理部21合成为铅字OCR。

Description

文字识别装置、文字识别方法及文字识别程序
技术领域
本发明关于一种原稿的文字识别装置、文字识别方法及文字识别程序,特别是关于一种可对混合有铅字和手写文字的文书进行电子化之文字识别装置、文字识别方法及文字识别程序。
背景技术
近年来,电子邮件等利用电子之文书的流通不断增加,但另一方面,以纸的形式被输出的文书也大量存在。其原因之一是,利用在纸面上的手写而进行补写的方式容易实现。
对将文字符号等电子信息以纸质进行输出的铅字文字,藉由利用光学文字识别(OCR:Optical Character Reader)软件,可以高概率返回经过数字化的电子信息。但是,在习知技术中,以手写记述的文字信息如果对格位指定、只是数字等条件不严格地进行限制,则无法得到可实用的识别率,形成联机/脱机信息转换的障碍。
作为对手写文字进行识别之习知的文字识别装置,已知有一种例如对来自文字读取装置的文字数据,藉由利用图形配比进行识别的印刷文字识别装置和利用特征抽出的手写文字识别装置而同时进行识别,并比较各自的识别结果,且选择其中一个较好的结果之读取装置(例如,参照专利文献1)。
而且,象例如FAX的发送单等,多数情况下字面都已形式化,而只对该字面中的发送者、所属部门等部分项目进行手写并发送。在这种情况下,如果能够识别手写部分,则可轻松地将接收文件作为电子信息进行转送或保存。
作为可用于该用途之可能性高的文字识别装置,有一种专利文献2所示的装置。该专利文献2所述的光学读取方法,是将读取纸片上的标记和印刷或手写的文字等信息进行光学读取,并将光学读取的文字数据向复数个识别装置进行发送,且利用这些复数个识别装置对文字数据进行识别,再将标志数据和利用复数个识别装置被识别的文字识别数据进行合成,可对混合有标志和利用印刷或手写所书写的文字之读取纸片进行高速地读取。
[专利文献1]日本专利早期公开之特开平7-37034号公报([0019]、[0023]、[0024]、图1、图3)
[专利文献2]日本专利早期公开之特开2000-315246号公报([0020]~[0036]、图1、图2、图3)
但是,如利用习知的文字识别装置,在专利文献1的情况下,是单独地处理铅字识别和手写识别,而并不进行例如使手写的识别处理反映铅字数据这样的处理,因此使用于手写识别的限制增多,只能在邮件、帐单、申请书这种大量用途等的特定情况下利用手写输入。
而且,如利用专利文献2,则读取纸片上的标记和铅字/手写文字为对象,使适用对象的原稿受到限制,无法进行不包含标记之一般性文件的手写识别。而且,登记读取纸片的负载大,难以进行灵活的格式变更。另外,因为格位指定、只是数字等条件严格,所以一般的文件无法得到可实用的识别率,难以用于联机/脱机信息转换。
发明内容
因此,本发明的目的是提供一种可进行混合有铅字和手写文字的文件的电子化之文字识别装置、文字识别方法及文字识别程序。
本发明为了达成上述目的,提供一种文字识别装置,其特征在于:包括将混合有铅字和手写文字的文件数据分离为铅字部和手写部之分离处理部、对前述铅字部进行文字识别的铅字部识别处理部、利用前述铅字部的文字识别结果而对前述手写部进行文字识别之手写部识别处理部。
因为铅字部的文字识别率较手写部的文字识别率高,所以藉由利用铅字部的文字识别结果对手写部进行文字识别,可提高手写部的文字识别率。
上述手写部识别处理部也可根据铅字部的文字的位置或使用频次而决定利用的范围,并利用所决定之范围的铅字部的文字识别结果,对手写部进行文字识别。因为与接近手写部的铅字或使用频次高的铅字有关联,容易被补写上手写部,所以决定为利用接近手写部之铅字、频次高之铅字的范围,并藉由利用所决定之范围的铅字部的文字识别结果,而使手写文字的识别率提高。
而且,上述手写部识别处理部也可利用铅字部的文字识别结果及其关联词、近义词以及反义词,而对手写部进行文字识别。即使在不具有与手写部相同之文字的铅字部的情况下,也可利用与手写部有某些关系的铅字部,所以手写文字的识别率提高。
另外,上述手写部识别处理部也可将铅字部的文字识别结果,依据铅字部的文字的位置或使用频次而附加加权值进行利用,并对手写部进行文字识别。因为与接近手写部的铅字或使用频次高的铅字有关联,容易被补写上手写部,所以藉由对与手写部越接近的铅字或使用频次越高的铅字,越是加大加权值,可提高手写文字的识别率。
本发明为了达成上述目的,提供一种文字识别装置,其特征在于:包括将混合有铅字和手写文字的文件数据分离为铅字部和手写部之分离处理部、对前述铅字部进行文字识别的铅字部识别处理部、利用前述铅字部的文字识别结果而对前述手写部进行文字识别之手写部识别处理部、将前述铅字部的文字识别结果和前述手写部的文字识别结果进行合成之合成处理部。
藉由将铅字部的文字识别结果和手写部的文字识别结果进行合成输出,可将混合有铅字和手写文字的文件数据转换为电子数据的形式。
本发明为了达成上述目的,提供一种文字识别装置,其特征在于:包括将混合有铅字和手写文字的文件数据分离为铅字部和手写部之分离处理部、参照关于属性的词典对前述铅字部进行文字识别之铅字部识别处理部、对前述手写部进行文字识别的手写部识别处理部、在前述铅字部的文字识别结果中,使与前述属性对应的手写部的文字列相对应之匹配处理部。
藉由参照关于属性的词典,可识别文件数据中的铅字部所包含的属性,并可匹配与属性对应的手写部。
本发明为了达成上述目的,提供一种文字识别装置,其特征在于:包括将混合有铅字和手写文字的复数个文件数据分离为铅字部和手写部之分离处理部、对前述复数个文件数据的前述铅字部进行文字识别,且将频次高的文字列作为属性进行存储之铅字部识别处理部、对前述手写部进行文字识别的手写部识别处理部、在前述铅字部的文字识别结果中,使与前述属性对应的手写部的文字列相对应之匹配处理部。
即使不使用关于属性的词典,也可藉由将在复数个文件数据中频次高的文字列作为属性,而匹配与属性对应的手写部。
上述匹配处理部也可采用将手写部的文字识别结果,在铅字部的文字识别结果中,与位于手写部周边的铅字建立关联并进行存储之构成。而且,上述匹配处理部也可采用将手写部的文字识别结果,在铅字部的文字识别结果中,与位于手写部的上、下、左或右的铅字建立关联并进行存储之构成。
本发明为了达成上述目的,提供一种文字识别方法,其特征在于:将混合有铅字和手写文字的文件数据分离为铅字部和手写部,并对前述铅字部进行文字识别,且利用前述铅字部的文字识别结果而对前述手写部进行文字识别。
本发明为了达成上述目的,提供一种文字识别方法,其特征在于:将混合有铅字和手写文字的文件数据分离为铅字部和手写部,并参照关于属性的词典对前述铅字部进行文字识别,且对前述手写部进行文字识别,并在前述铅字部的文字识别结果中,使与前述属性对应的手写部的文字列相对应。
本发明为了达成上述目的,提供一种文字识别方法,其特征在于:将混合有铅字和手写文字的复数个文件数据分离为铅字部和手写部,并对前述复数个文件数据的前述铅字部进行文字识别,且将频次高的文字列作为属性进行存储,且对前述手写部进行文字识别,并在前述铅字部的文字识别结果中,使与前述属性对应的手写部的文字列相对应。
本发明为了达成上述目的,提供一种文字识别程序,用于使计算机执行将混合有铅字和手写文字的文件数据分离为铅字部和手写部之分离处理单元、对前述铅字部进行文字识别的铅字部识别处理单元、利用前述铅字部的文字识别结果而对前述手写部进行文字识别之手写部识别处理单元。
本发明为了达成上述目的,提供一种文字识别程序,用于使计算机执行将混合有铅字和手写文字的文件数据分离为铅字部和手写部之分离处理单元、参照关于属性的词典对前述铅字部进行文字识别之铅字部识别处理单元、对前述手写部进行文字识别的手写部识别处理单元、在前述铅字部的文字识别结果中,使与前述属性对应的手写部的文字列相对应之匹配处理单元。
本发明为了达成上述目的,提供一种文字识别程序,用于使计算机执行将混合有铅字和手写文字的复数个文件数据分离为铅字部和手写部之分离处理单元、对前述复数个文件数据的前述铅字部进行文字识别,且将频次高的文字列作为属性进行存储之铅字部识别处理单元、对前述手写部进行文字识别的手写部识别处理单元、在前述铅字部的文字识别结果中,使与前述属性对应的手写部的文字列相对应之匹配处理单元。
如利用本发明,可对混合有铅字和手写的文书进行电子化。
附图说明
图1所示为关于本发明的第1实施形态之文字识别装置的框图。
图2所示为混合有铅字及手写文字的OCR对象之原稿的一个例子的平面图。
图3所示为从取入到图1的图像输入部中的图像,将铅字部分和手写部分进行分离之图像数据,(a)表示铅字部的图像数据,(b)表示手写部的图像数据。
图4所示为登记词典中的登记内容之说明图。
图5所示为利用图1的OCR结果合成处理部之处理结果的图像图。
图6所示为关于本发明的第2实施形态之文字识别装置的框图。
图7所示为在第2实施形态中被操作的混合有铅字及手写之OCR对象的原稿的1个例子,(a)所示为作为原稿之FAX发送单的平面图,(b)所示为其它的FAX发送单的平面图。
图8所示为关于本发明的第3实施形态之文字识别装置的框图。
图9所示为被输入图像输入部之作为原稿的会员申请书。
图10所示为从图9的会员申请书,利用铅字部OCR处理部被抽出之属性的登记内容的说明图。
图11所示为图8的属性·属性值抽出结果存储部所保存之属性和属性值的登记内容的说明图。
符号的说明
1:文字识别装置
11:图像输入部
12:铅字部/手写部分离处理部
13:铅字部OCR处理部
14:铅字部OCR词典
15:词典登录处理部
16:关联词·近义词·反义词词典
17:登录词典
18:手写部OCR处理部
19:手写OCR词典
20:OCR结果存储部
21:OCR结果合成处理部
22:OCR结果输出部
23:最终OCR结果存储部
25:扫描原稿
26:铅字识别结果
27:手写识别结果
28:OCR结果合成图像
31:属性定义部
32:匹配处理部
33、34:FAX发送单
41:属性·属性值抽出结果存储部
42:会员申请书
43、44:登记内容
180:前处理部
181:个别文字识别部
182:后处理部
250:铅字部
251:手写部
252、330:铅字部
331、332:手写部
420:铅字部
421:手写部
具体实施方式
[第1实施形态]
图1所示为关于本发明的第1实施形态之文字识别装置。该文字识别装置1包括利用扫描设备等读取原稿并输入图像数据之图像输入部11、将由图像输入部11所读取之图像数据分离为铅字部和手写部之铅字部/手写部分离处理部12、执行铅字部的文字识别处理之铅字部OCR处理部13、存储有铅字OCR用的词典之铅字部OCR词典14、进行向登记词典17的登记处理之词典登记处理部15、存储有关联词,近义词及反义词的关联词·近义词·反义词词典16、利用铅字OCR之登记有文字,单词组的登记词典17、利用特征抽出法等执行手写部的文字识别处理之手写部OCR处理部18、存储有手写OCR用的词典之手写OCR词典19、存储有铅字部及手写部的文字识别结果之OCR结果存储部20、将铅字部和手写部的文字识别结果进行合成之OCR结果合成处理部21、将利用OCR结果合成处理部21被合成的结果进行输出之OCR结果输出部22、将从OCR结果输出部22所输出的内容进行存储之最终OCR结果存储部23。另外,利用手写部OCR处理部18和OCR结果合成处理部21,构成输出处理部。
铅字部/手写部分离处理部12根据图像数据内的像素的浓淡及文字颜色等,生成直方图,并据此将图像数据分离为由铅字部构成的图像数据和由手写部构成的图像数据。另外,如果能够特定由铅字部构成的图像数据,也可将除此之外的区域所存在的图像部分看作手写部。
铅字部OCR处理部13利用图形配比法,对所分离出之铅字的文字图形和在铅字OCR词典14中所存储之铅字图形进行比较,并将相似度最高的作为铅字部的识别结果而输出。
铅字部OCR14、关联词·近义词·反义词词典16、登记词典17、手写OCR词典19、OCR结果存储部20及最终OCR结果存储部23,可采用在1或复数个硬盘中分别确保各个区域之构成。
登记词典17将铅字内的个别文字/单词(名词/固有名词)、及铅字内的单词的近义词(意思相近的单词)、关联词、与领域相对应的用语等,作为登记词典信息进行登记。作为与领域对应的用语,有例如对[我公司]、[贵公司]等文字的商务用语词典,对[姓名]等文字的人名词典,对[存储器]、[CPU]等的[计算机用语词典]。
手写部OCR处理部18包括进行倾斜修正和从图像数据将包含文字的矩形区域按每1文字分离等前处理之前处理部180、对利用前处理部180所分离出的矩形区域,利用手写OCR词典19按每1文字进行文字识别处理之个别文字识别部181、利用登记词典17以单词单位等文字列进行语言处理等的后处理部182。
个别文字识别部181将从分割出的手写文字中所抽出之特征数据和在手写OCT词典19中所登记之文字的特征数据进行比较,将相似度最高的作为手写文字的识别结果进行输出。
而且,手写部OCR处理部18利用藉由铅字部OCR处理部13之铅字部的识别结果,进行手写部的文字识别,其利用之铅字的范围及处理考虑以下事项。
(1)为段落或文字框内、页内、文件内、同文件组内。
(2)藉由手写文字和铅字文字的邻接程度和使用频次,而决定所利用之铅字的范围。
(3)藉由手写文字和铅字文字的邻接程度和使用频次,而进行铅字登记信息的加权。另外,当在文件校正中使用时,因为最近的具有错字的可能性,所以使位置最近的除外。
(4)其它的手写文字周边的铅字,由于具有对相同的内容进行订正的情况,所以使加权提高。
(第1实施形态的动作)
下面,参照图2~图5对第1实施形态的动作进行说明。图2所示为混合有铅字及手写之OCR对象的原稿的一个例子。图3所示为从取入的图像将铅字部分和手写部分进行分离的识别结果,(a)表示铅字部识别结果,(b)表示手写部识别结果。图4所示为登记词典17中的登记内容,图5所示为利用OCR结果合成处理部21的处理结果。
图2所示的扫描原稿25是在基于利用个人电脑和字处理器制作原稿并打印出之铅字部250的文件中,补写例如[自动地]的文字而作为利用用户手写的手写部251。该手写部251在本实施形态中,为了容易与铅字区域进行区别,利用与铅字部250的颜色不同之红色等颜色的笔而书写。
当利用图像输入部11读取入扫描原稿25时,扫描原稿25被数字信号化,并被输出到铅字部/手写部分离处理部12。
铅字部/手写部分离处理部12将被输入之扫描原稿25的图像数据,分离为如图3(a)所示含有铅字部250的铅字图像数据26,和如同图(b)所示含有手写部251的手写图像数据27。
接着,铅字部OCR处理部13参照铅字部OCR词典14对图3(a)的铅字部250进行文字识别处理,并将其结果作为铅字识别结果而在OCR结果存储部20中进行保存。
接着,词典登记处理部15如图4所示,掌握铅字部250内的语句出现的频次、语句的位置(座标),另外还参照关联词·近义词·反义词词典16抽出对各语句的关联词、近义词、反义词,并将它们在登记词典17中进行保存。例如,[安装]这一语句在图3(a)所示的铅字部250内,被标记于第1行、第3行、第7行的3处位置。因此,[安装]的频次为[3],而作为其反义词有[卸载]一词,但近义词没有。而且,[手册]这一语句,只出现在第1行,所以其频次为[1],而反义词没有,但作为近义词有[说明书]一词。关于其它的语句,也同样地进行词典登记的处理。
接着,手写部OCR处理部18进行如图3(b)所示之对手写部251的OCR处理。即,在利用前处理部180进行分割等之后,利用个别文字识别部181将[自动地]一词作为1文字单位进行识别,再由后处理部182进行语言处理。在该阶段,决定对[自动]、[地]的候补识别。手写文字因书写人而形成各种各样的字体,所以候补单词未必为一个。因此,通常情况下,[自动]被确定为[自动]的机会少,而提示被判定为近的复数个单词作为候补识别。表1表示该候补识别的一个例子。另外,如果候补识别只为1个,则其成为唯一选择。
[表1]
  候补识别   信赖度
  自动   30%
  自恸   30%
  自卫   30%
  白线   10%
表1所示为对手写部251的内容,显示有复数个候补识别的情况。这里,[自动]、[自恸]、[自卫]、[白线]作为对手写部251一文的候补单词而显示。此时,关于各个单词,对[自动地]的[自动]部分之OCR处理上的信赖度可分别以%计算表示。这里,3个单词同样都为30%。
后处理部182参照登记词典17,决定应选择[自动]、[自恸]、[自卫]、[白线]中的哪一个。关于各个单词,利用扫描原稿25上的对[自动]一词的近度和铅字的出现频次,分别计算复数个单词的准确度。如图3及图4所示,[自动]一词存在于铅字部250内,且其出现频次多,并在与手写部251接近的位置上存在[自动]的铅字,所以在4个候补单词中,可提高[自动]的优先顺序(信赖度),并将其确定为OCR结果。所确定的结果,可作为手写识别结果而存储于OCR结果存储部20中。
接着,在手写部OCR处理部18的处理结束后,OCR结果合成处理部21从OCR结果存储部20读出对铅字部250的OCR处理结果和对手写部251的OCR处理结果,并如图5所示将铅字部250和铅字部252进行合成而得到OCR结果合成图像28。该OCR结果合成图像28由OCR结果输出部22被保存于最终OCR结果存储部23中。藉由以上过程,完成原稿图像的电子化。
(第1实施形态的效果)
如利用第1实施形态,可得到以下的效果。
(1)利用与手写OCR相比识别率高的铅字OCR的结果,由手写部OCR处理部18进行手写部251的文字或文字列的OCR处理,所以可使手写文字的识别率提高。
(2)对手写识别没有限制,使不依赖于特定的帐单等的手写文字之电子化和灵活应用成为可能。
[第2实施形态]
图6所示为关于本发明的第2实施形态之文字识别装置。该文字识别装置1除了在第1实施形态中的词典登记处理部15、关联词·近义词·反义词词典16、登记词典17及OCR结果存储部20以外,还附加有在利用图像输入部11的图像输入时对属性进行定义的属性定义部31,并取代OCR结果合成处理部21而设置有匹配处理部32,其它的构成与第1实施形态相同。
属性定义部31是利用用户的输入操作,将要从读取对象的原稿例如FAX发送单中取出之与发送地址、发送人、张数等属性相对应的项目名,和对这些项目名的近义词等的词条组作为属性定义,在铅字OCR词典14中进行登记。
铅字部OCR处理部13在该实施形态中,将词条组也作为单词识别结果输出。
匹配处理部32进行利用铅字部OCR处理部13及手写部OCR处理部18之OCR结果的匹配处理。
(第2实施形态的动作)
下面,参照图7对第2实施形态的动作进行说明。
图7所示为在第2实施形态中被操作之混合有铅字及手写的OCR对象的原稿的一个例子,在同图中,(a)表示作为原稿的FAX发送单,(b)表示其它的FAX发送单。作为原稿的FAX发送单33,具有基于包括发送地址、发送人、发送张数、发送内容等项目名在内之铅字部330的属性,和对该属性,将表示职务名、发送人的姓名、发送张数的数字,表示发送内容的文章等以手写写入之手写部331。
用户预先将要从图7所示的FAX发送单33中取出的属性、近义词等词条组作为属性定义,并在铅字OCR词典14中如表2所示进行登记。藉此,图7(a)的FAX发送单33的[送达地址]也好,图7(b)的FAX发送单34的[收信人]也好,都被分配以[属性:送达地址]。
[表2]
  属性:送达地址   属性:发送人   属性:张数
  送达地址   发送人   发送张数
  收信人   发送地址   总发送张数
  收件人   发信人
  发信地址
接着,利用图像输入部11将FAX发送单33以扫描设备等进行扫描输入。铅字部/手写部分离处理部12将所输入之FAX发送单33的图像数据,如第1实施形态所说明地,分离为铅字部330和手写部331。铅字部OCR处理部13参照铅字OCR词典14,进行铅字部330的OCR处理,而手写部OCR处理部18参照手写OCR词典19,进行手写部331的OCR处理。
匹配处理部32进行利用铅字部OCR处理部13及手写部OCR处理部18之OCR结果的匹配处理。该处理将所登记的词条组和利用手写部OCR处理部18的OCR结果进行匹配,并将与写入位置最接近的属性分配给利用手写部OCR处理部18的OCR结果。而且,将FAX发送单33上的手写部331的位置信息也进行保存。接着,由铅字部330和手写部331的位置关系,使两者进行匹配。在图7(a)的FAX发送单33中,铅字OCR结果的[送达地址]和手写OCR结果的[海外事业部长先生]被匹配。此时,也可只使被付以属性的铅字进行匹配。
最后,OCR结果输出部22将形成组的属性(送达地址、发送人等)及属性值(海外事业部长先生、A社中央分社山田等)、属性及属性值作为铅字部330,331被铅字化之电子信息,在最终OCR结果存储部23中进行存储。
(第2实施形态的效果)
如利用该第2实施形态,可得到下述的效果。
(1)藉由对混合有铅字部330和手写部331的FAX发送单33,识别属性和利用手写之属性值的组,并进行从FAX发送单33向电子信息之形式的变更,可不用严密地登记决定的格式而轻松地进行手写数据的收集。
(2)因为不必严密地登记格式,所以可轻松地进行格式的变更,且因为手写部331和铅字部330不需要进行严密的位置对合,所以可缩短位置对合处理的时间,还可减少读取错误。
(3)由于将属性和属性值进行匹配,所以也可在接受了FAX发送单时,将其形成电子信息,并利用与FAX发送单不同格式的电子邮件,而向发送地址的“海外事业部长”进行转送。
[第3实施形态]
图8所示为关于本发明的第3实施形态之文字识别装置。本实施形态采用在第2实施形态中,不进行属性定义,并取代最终OCR结果存储部23而设置属性·属性值抽出结果存储部41,且在该属性·属性值抽出结果存储部41中将利用铅字部OCR处理部13及手写部OCR处理部18的OCR结果进行保存之构成,其它的构成与第2实施形态相同。
铅字部OCR处理部13在该实施形态中,对抽出的单词进行计数,并将频次多的单词作为属性,在属性·属性值抽出结果存储部41中进行登记。
(第3实施形态的动作)
下面,参照图9~图11对第3实施形态的动作进行说明。
图9所示为被输入图像输入部11之作为原稿的会员申请书。图10所示为从图9的会员申请书中,利用铅字部OCR处理部所抽出之属性的一个例子,图11所示为在属性·属性值抽出结果存储部41中所保存之属性和属性值的一个例子。
会员申请书42是由利用铅字的铅字部420和线格形成规定的印刷格式,并在该印刷格式内将利用手写的姓名、住址等作为手写部421写入。该会员申请书42准备有姓名等不同的复数张。
首先,复数张会员申请书42藉由利用扫描设备等依次进行扫描而被输入图像输入部11。接着,铅字部/手写部分离处理部12如第1实施形态所说明的,将图像数据分离为铅字部420和手写部421。铅字部OCR处理部13参照铅字OCR词典14进行铅字部420的OCR处理,而手写部OCR处理部18参照手写OCR词典19进行手写部421的OCR处理。
在铅字部OCR处理部13的处理中,对所抽出的单词进行计数,并将对会员申请书42总张数的比例大即频次多的单词作为属性之登录内容43,如图10所示,被在属性·属性值抽出结果存储部41中进行登记。而且,对每个会员申请书42,分别将会员申请书42上的单词的位置也保存于属性·属性值抽出结果存储部41中。另外,也可预先将属性在属性·属性值抽出结果存储部41中进行登记。
接着,由铅字部420和手写部421的距离、位于手写部421的上下,左右之铅字部420等的位置关系,利用匹配处理部32使两者进行匹配。这里,采用一种使相同线格内、框内、基底颜色内的铅字部420,和手写部421进行匹配的规则。另外,为了回避建立双重的关联,建立过一次关联的铅字部420从名单中除去。最后,利用OCR结果输出部22,使形成组的属性和属性值以图11所示的形态,在属性·属性值抽出结果存储部41中作为登记内容44被保存。
(第3实施形态的效果)
如利用该第3实施形态,可得到以下的效果。
(1)可不用预先将格式进行登录,而进行付与了属性之手写数据的收集。
(2)也可适用于当对调查进行统计时,在扫描征求意见表之后,将问题和回答成组积蓄这样的用途。
另外,在第3实施形态中,是将会员申请书42作为例子进行了说明,但本发明并不限定于会员申请书42,可适用于具有相同的格式,且具有铅字部和手写部之复数个原稿的全部。
[其它的实施形态]
另外,本发明并不限定于上述各实施形态,在不改变其要旨的范围内可进行各种各样的变形,且在各实施形态间可任意地进行构成要素的组合。

Claims (15)

1、一种文字识别装置,其特征在于:包括
将混合有铅字和手写文字的文件数据分离为铅字部和手写部之分离处理部;
对前述铅字部进行文字识别的铅字部识别处理部;以及
利用前述铅字部的文字识别结果而对前述手写部进行文字识别之手写部识别处理部。
2、如权利要求1所述的文字识别装置,其特征在于:前述手写部识别处理部根据前述铅字部的文字的位置或使用频次而决定利用的范围,并利用所决定之范围的前述铅字部的文字识别结果,对前述手写部进行文字识别。
3、如权利要求1所述的文字识别装置,其特征在于:前述手写部识别处理部利用前述铅字部的文字识别结果及其关联词、近义词以及反义词,而对前述手写部进行文字识别。
4、如权利要求1所述的文字识别装置,其特征在于:前述手写部识别处理部将前述铅字部的文字识别结果,依据前述铅字部的文字的位置或使用频次而附加加权值进行利用,并对前述手写部进行文字识别。
5、一种文字识别装置,其特征在于:包括
将混合有铅字和手写文字的文件数据分离为铅字部和手写部之分离处理部;
对前述铅字部进行文字识别的铅字部识别处理部;
利用前述铅字部的文字识别结果而对前述手写部进行文字识别之手写部识别处理部;以及
将前述铅字部的文字识别结果和前述手写部的文字识别结果进行合成之合成处理部。
6、一种文字识别装置,其特征在于:包括
将混合有铅字和手写文字的文件数据分离为铅字部和手写部之分离处理部;
参照关于属性的词典对前述铅字部进行文字识别之铅字部识别处理部;
对前述手写部进行文字识别的手写部识别处理部;以及
在前述铅字部的文字识别结果中,使与前述属性对应的手写部的文字列相对应之匹配处理部。
7、一种文字识别装置,其特征在于:包括
将混合有铅字和手写文字的复数个文件数据分离为铅字部和手写部之分离处理部;
对前述复数个文件数据的前述铅字部进行文字识别,且将频次高的文字列作为属性进行存储之铅字部识别处理部;
对前述手写部进行文字识别的手写部识别处理部;以及
在前述铅字部的文字识别结果中,使与前述属性对应的手写部的文字列相对应之匹配处理部。
8、如权利要求6或7所述的文字识别装置,其特征在于:前述匹配处理部将前述手写部的文字识别结果,在前述铅字部的文字识别结果中,与位于前述手写部周边的铅字建立关联并进行存储。
9、如权利要求6或7所述的文字识别装置,其特征在于:前述匹配处理部将前述手写部的文字识别结果,在前述铅字部的文字识别结果中,与位于前述手写部的上、下、左或右的铅字建立关联并进行存储。
10、一种文字识别方法,其特征在于:
将混合有铅字和手写文字的文件数据分离为铅字部和手写部;
对前述铅字部进行文字识别;以及
利用前述铅字部的文字识别结果而对前述手写部进行文字识别。
11、一种文字识别方法,其特征在于:
将混合有铅字和手写文字的文件数据分离为铅字部和手写部;
参照关于属性的词典对前述铅字部进行文字识别;
对前述手写部进行文字识别;以及
在前述铅字部的文字识别结果中,使与前述属性对应的手写部的文字列相对应。
12、一种文字识别方法,其特征在于:
将混合有铅字和手写文字的复数个文件数据分离为铅字部和手写部;
对前述复数个文件数据的前述铅字部进行文字识别,且将频次高的文字列作为属性进行存储;
对前述手写部进行文字识别;以及
在前述铅字部的文字识别结果中,使与前述属性对应的手写部的文字列相对应。
13、一种文字识别程序,用于使计算机执行
将混合有铅字和手写文字的文件数据分离为铅字部和手写部之分离处理单元;
对前述铅字部进行文字识别的铅字部识别处理单元;以及
利用前述铅字部的文字识别结果而对前述手写部进行文字识别之手写部识别处理单元。
14、一种文字识别程序,用于使计算机执行
将混合有铅字和手写文字的文件数据分离为铅字部和手写部之分离处理单元;
参照关于属性的词典对前述铅字部进行文字识别之铅字部识别处理单元;
对前述手写部进行文字识别的手写部识别处理单元;以及
在前述铅字部的文字识别结果中,使与前述属性对应的手写部的文字列相对应之匹配处理单元。
15、一种文字识别程序,用于使计算机执行
将混合有铅字和手写文字的复数个文件数据分离为铅字部和手写部之分离处理单元;
对前述复数个文件数据的前述铅字部进行文字识别,且将频次高的文字列作为属性进行存储之铅字部识别处理单元;
对前述手写部进行文字识别的手写部识别处理单元;以及
在前述铅字部的文字识别结果中,使与前述属性对应的手写部的文字列相对应之匹配处理单元。
CNA2005100535676A 2004-09-21 2005-03-08 文字识别装置、文字识别方法及文字识别程序 Pending CN1752992A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2004273932A JP2006092027A (ja) 2004-09-21 2004-09-21 文字認識装置、文字認識方法および文字認識プログラム
JP2004273932 2004-09-21

Publications (1)

Publication Number Publication Date
CN1752992A true CN1752992A (zh) 2006-03-29

Family

ID=36074051

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2005100535676A Pending CN1752992A (zh) 2004-09-21 2005-03-08 文字识别装置、文字识别方法及文字识别程序

Country Status (3)

Country Link
US (1) US20060062459A1 (zh)
JP (1) JP2006092027A (zh)
CN (1) CN1752992A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101901075A (zh) * 2010-06-25 2010-12-01 北京捷通华声语音技术有限公司 一种点密度非线性归一化文字识别方法和装置
CN101320429B (zh) * 2007-06-04 2013-04-24 富士施乐株式会社 图像处理装置和图像处理方法
CN101689203B (zh) * 2007-06-29 2013-09-18 佳能株式会社 图像处理设备和图像处理方法
CN101458699B (zh) * 2007-12-12 2015-11-25 佳能株式会社 图像处理装置和图像处理方法
CN106326887A (zh) * 2016-08-29 2017-01-11 东方网力科技股份有限公司 一种光学字符识别结果的校验方法及装置

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007179276A (ja) * 2005-12-27 2007-07-12 Internatl Business Mach Corp <Ibm> 適合判定方法、装置、およびプログラム
JP4810287B2 (ja) * 2006-04-13 2011-11-09 キヤノン株式会社 データ処理装置及びそのデータ登録方法
CN100440250C (zh) * 2007-03-09 2008-12-03 清华大学 印刷体蒙古文字符识别方法
JP2009076240A (ja) * 2007-09-19 2009-04-09 Canon Inc 電子放出装置及びこれを用いた画像表示装置
JP5247177B2 (ja) * 2008-02-08 2013-07-24 キヤノン株式会社 文書管理装置、文書管理方法およびプログラム
EP2515257A4 (en) * 2009-12-15 2016-12-07 Fujitsu Frontech Ltd METHOD, DEVICE AND PROGRAM FOR CHARACTER RECOGNITION
CN101980156A (zh) * 2010-11-22 2011-02-23 上海合合信息科技发展有限公司 自动提取电子邮件地址并新建电子邮件的方法
JP5669041B2 (ja) * 2011-01-28 2015-02-12 株式会社日立製作所 文書処理装置及び文書処理方法
JP2012190114A (ja) * 2011-03-09 2012-10-04 Seiko Epson Corp 印刷データを用いた売上分析用プログラム、売上情報取得装置、及び、売上情報取得方法
US8941874B2 (en) * 2012-11-07 2015-01-27 Xerox Corporation Method and apparatus for automatically entering data in a print order based upon a prose attribute entry
US9256592B1 (en) * 2012-11-07 2016-02-09 Amazon Technologies, Inc. System for detecting and correcting broken words
JP2016015115A (ja) * 2014-06-09 2016-01-28 株式会社リコー 情報処理装置、情報処理方法、及び記録媒体
WO2016061292A1 (en) * 2014-10-17 2016-04-21 SimonComputing, Inc. Method and system for imaging documents in mobile applications
KR102574900B1 (ko) * 2016-01-20 2023-09-06 엘지전자 주식회사 이동 단말기 및 그 제어 방법
JP6780380B2 (ja) * 2016-08-30 2020-11-04 コニカミノルタ株式会社 画像処理装置及びプログラム
US10949662B2 (en) * 2017-12-27 2021-03-16 Seiko Epson Corporation Image processing apparatus
JP7247496B2 (ja) * 2018-09-14 2023-03-29 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム
JP7262993B2 (ja) * 2018-12-19 2023-04-24 キヤノン株式会社 画像処理システム、画像処理方法、画像処理装置
US10783323B1 (en) * 2019-03-14 2020-09-22 Michael Garnet Hawkes Analysis system
US10846553B2 (en) * 2019-03-20 2020-11-24 Sap Se Recognizing typewritten and handwritten characters using end-to-end deep learning
JP7387339B2 (ja) 2019-08-30 2023-11-28 キヤノン株式会社 画像処理システム、画像処理方法、及びプログラム
JP2022092119A (ja) * 2020-12-10 2022-06-22 キヤノン株式会社 画像処理装置、画像処理方法およびプログラム
JP2022136656A (ja) * 2021-03-08 2022-09-21 株式会社東芝 情報処理装置、プログラム及びシステム
JP2022148922A (ja) * 2021-03-24 2022-10-06 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム
JP2022162474A (ja) * 2021-04-12 2022-10-24 キヤノン株式会社 画像処理システム、画像処理方法、及びプログラム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5181255A (en) * 1990-12-13 1993-01-19 Xerox Corporation Segmentation of handwriting and machine printed text
JPH0772906B2 (ja) * 1991-07-10 1995-08-02 富士ゼロックス株式会社 文書認識装置
JP2001184453A (ja) * 1999-12-22 2001-07-06 Hitachi Ltd 帳票処理システムおよび帳票ファイリングシステム
US7254269B2 (en) * 2000-08-31 2007-08-07 Hewlett-Packard Development Company, L.P. Character recognition system
US6909805B2 (en) * 2001-01-31 2005-06-21 Matsushita Electric Industrial Co., Ltd. Detecting and utilizing add-on information from a scanned document image
US20050289182A1 (en) * 2004-06-15 2005-12-29 Sand Hill Systems Inc. Document management system with enhanced intelligent document recognition capabilities

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101320429B (zh) * 2007-06-04 2013-04-24 富士施乐株式会社 图像处理装置和图像处理方法
CN101689203B (zh) * 2007-06-29 2013-09-18 佳能株式会社 图像处理设备和图像处理方法
CN101458699B (zh) * 2007-12-12 2015-11-25 佳能株式会社 图像处理装置和图像处理方法
CN101901075A (zh) * 2010-06-25 2010-12-01 北京捷通华声语音技术有限公司 一种点密度非线性归一化文字识别方法和装置
CN101901075B (zh) * 2010-06-25 2012-08-15 北京捷通华声语音技术有限公司 一种点密度非线性归一化文字识别方法和装置
CN106326887A (zh) * 2016-08-29 2017-01-11 东方网力科技股份有限公司 一种光学字符识别结果的校验方法及装置
CN106326887B (zh) * 2016-08-29 2019-05-21 东方网力科技股份有限公司 一种光学字符识别结果的校验方法及装置

Also Published As

Publication number Publication date
JP2006092027A (ja) 2006-04-06
US20060062459A1 (en) 2006-03-23

Similar Documents

Publication Publication Date Title
CN1752992A (zh) 文字识别装置、文字识别方法及文字识别程序
CN1139884C (zh) 信息处理方法和装置
CN1877598A (zh) 手机中使用图像识别进行名片信息的采集与录入的方法
CN1248138C (zh) 图像处理方法与图像处理系统
CN1126608C (zh) 识别邮件发送信息的方法和装置
CN1320485C (zh) 图像检索装置和图像检索装置的关键词赋予方法
CN1752991A (zh) 文字识别装置、文字识别方法及文字识别程序
JP4257925B2 (ja) 画像処理方法、画像処理装置、原稿読取装置、画像形成装置、コンピュータプログラム及び記録媒体
CN1226696C (zh) 用于检索草体手写注释的方法
CN1186287A (zh) 用于字符识别的方法和装置
JP2008102907A (ja) 画像処理方法、画像処理装置、原稿読取装置、画像形成装置、コンピュータプログラム及び記録媒体
CN1141666C (zh) 利用标准笔划识别输入字符的在线字符识别系统
US8953228B1 (en) Automatic assignment of note attributes using partial image recognition results
CN1525378A (zh) 票据定义数据生成方法以及票据处理装置
US10460192B2 (en) Method and system for optical character recognition (OCR) of multi-language content
CN1041773C (zh) 由字符图象直方图0-1图形表示识别字符的方法和装置
CN1367460A (zh) 字符串识别装置、字符串识别方法及其存储介质
JP2011008549A (ja) 画像処理装置、画像読取装置、複合機、画像処理方法、プログラム、記録媒体
CN1174338C (zh) 字符识别方法
CN1310182C (zh) 用于增强文档图像和字符识别的方法和装置
CN1916940A (zh) 模板优化的字符识别方法和系统
CN1549192A (zh) 手写字体的计算机识别与自动输入方法
CN1269060C (zh) 处理和重复使用中文古籍的方法及其所采用的计算机软硬件系统
CN1459073A (zh) 识别并处理数字图像中的命令的方法和装置,其中用户通过例如将其环绕而标记命令
CN109508712A (zh) 一种基于图像的汉语文字识别方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication