CN102737239A - 收据数据识别装置及其方法 - Google Patents

收据数据识别装置及其方法 Download PDF

Info

Publication number
CN102737239A
CN102737239A CN2011102921074A CN201110292107A CN102737239A CN 102737239 A CN102737239 A CN 102737239A CN 2011102921074 A CN2011102921074 A CN 2011102921074A CN 201110292107 A CN201110292107 A CN 201110292107A CN 102737239 A CN102737239 A CN 102737239A
Authority
CN
China
Prior art keywords
data
receipt
definition
project
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2011102921074A
Other languages
English (en)
Other versions
CN102737239B (zh
Inventor
野崎一成
梅村泰广
渡边起一郎
羽佐田理惠
铃木惇也
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Japan Co ltd
Fujitsu Ltd
Original Assignee
Fujitsu Computer Technologies Ltd
Fujitsu Marketing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Computer Technologies Ltd, Fujitsu Marketing Ltd filed Critical Fujitsu Computer Technologies Ltd
Publication of CN102737239A publication Critical patent/CN102737239A/zh
Application granted granted Critical
Publication of CN102737239B publication Critical patent/CN102737239B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)

Abstract

本发明涉及收据数据识别装置以及其方法,从各租户的店铺正确且高效率地收集营业额管理数据,谋求租户营业额管理业务的高速化、效率化。针对从收据图像中读取的识别字符,收据数据提取部(141)根据在按每个店铺而不同的定义数据中注册的收据内的项目名称的字符串和从收据内位置起的金额项目的位置数据提取识别字符,倾斜检测部(142)根据提取出的识别字符的位置数据检测出识别字符的倾斜,倾斜校正部(143)在检测出识别字符的倾斜的情况下,根据检测出的倾斜对相应的金额项目的位置数据进行校正,收据数据特别指定部(144)使用校正后的位置数据根据识别字符和位置数据提取出表示金额项目的识别字符,营业额管理数据生成部(15)根据与项目名称一致的识别字符和表示金额项目的识别字符输出或存储识别结果的数据。

Description

收据数据识别装置及其方法
技术领域
本发明涉及收据数据识别装置及其方法,特别涉及例如为了对大型购物中心等的多个店铺的营业额进行管理,从通过字符识别而读取的收据数据中正确地提取所需要的数据的技术。
背景技术
在对在购物中心、大型购物中心等中开店的租户(运营店铺的公司等)的店铺进行管理的租户管理部门中,收集各店铺的一天的营业额,制作现金营业额、联票营业额,…等的营业额细目(营业额管理项目)。在该营业额细目制作时,收集从各店铺提供的细算收据,进行营业额管理项目的数值的计算。可是,现状是由于从各店铺提供的细算收据的形式依赖于向每个店铺导入的POS系统,所以是以各种各样的形式制作的。因此,租户管理部门处理的细算收据在项目的种类、项目名、印字尺寸、印字字体等方面是多种多样的。
例如,针对细算收据的项目名称,即使营业额合计、营业额计、合计营业额、总营业额、…等表示同等的内容,也会根据POS系统而印字出不同的名称。此外,由于开店的租户的店铺的更换等频繁地进行,所以也必须应对新的细算收据的形式。因此,现状是在租户管理部门中,在将细算收据作为统一的营业额数据进行总计的营业额总计作业中需要大量的劳动力,为此的人的以及时间上的负担需要巨大的成本。
再有,在专利文献1中公开了文书图像识别装置。在该文书图像识别装置中,参照文书图像提取构成字符的成分的集合,基于此提取横和纵的行候补,对行候补估计可靠度。之后,基于估计的行可靠度,提取准确度高的行的集合,基于该结果,使用准确度高的行的集合的字符成分的配置来估计倾斜。然后,从构成文书图像的基础要素的集合中提取行方向确定的行集合,交替执行根据行彼此的关联的段提取和将段作为制约的行提取,提取出行和段。
此外,在专利文献2中公开了收据处理装置。在该收据处理装置中,根据收据的图像识别字符来生成文本数据,从文本数据中选择规定的字符串,检测出包含有被选择的规定的字符串的行位置。然后,从基于检测出的行位置而确定的文本数据上的规定的行范围中依次选择以行为单位的行数据(line data),从行数据中提取出与品种相关的数据。
专利文献
专利文献1:日本特开平11-219407号公报;
专利文献2:日本特开2004-164218号公报。
为了对上述那样的、从购物中心等的各店铺提供的细算收据(以下称为收据)进行总计,在运营购物中心等的公司(组织)的租户管理部门中,历来,事务员以目视来读取收据,以手工作业将读取的数据输入到数据处理装置中。该营业额总计作业的作业量由于店铺数有时也达到100个店铺以上,而且是每天必须进行的作业,因此负担非常大。
作为用于减轻该负担的一个方案,考虑从各店铺的终端经由网络自动收集各店铺的营业额数据(收据数据)。可是,通常各店铺的企业实体不同,因此需要分别获得网络开设的承诺,进而存在通过被导入的系统而连接的网络种类、应用的追加/修正的难易度不同等的难以解决的问题。
作为尽可能不进行已有的系统的变更、特别是各店铺的终端等信息设备的变更而减轻上述的作业负担的其它方案,可以考虑不是由人读取收据数据,而是通过字符图像的识别来进行读取的方法。即,例如通过具有OCR(Optical Character Recognition,光学字符识别)功能的读取装置、扫描仪等对各店铺的收据进行读取,针对读取的收据项目和其数值数据提取出营业额管理项目所需要的内容,重新输入成营业额管理数据的方法。
可是,在该方法的情况下,也必须解决以通常的现有的字符图像识别不能解决的问题。接着,针对该问题进行说明。
在通过具有OCR功能的读取装置等来读取收据的情况下,需要在将收据夹入透明片材中、或粘贴在纸上等来进行固定的状态下使读取装置等进行读取。
例如,被透明片材夹持的收据是细长的狭缝状的形式,在读入时,被夹持的细算收据(收据)有时相对于片材而产生倾斜。此外,有被片材等夹持的收据不是收据整体以固定的角度倾斜,而是从中途以其它的角度倾斜的情况。此外,在印字时,有时因为打印机的送纸偏离、调整不完备等,在收据的中途的行中,被印字的项目与其前面的行的项目相比空出空间、或具有倾斜。此外,有时也在收据的中途,纸的一部分被折弯地固定。
图15是说明在收据的OCR处理中产生错误识别的例子的图。如图15所示那样,例如在收据22u是长的片材的情况下等,有时从收据上部221u起在收据下部222u的中途一部分纸弯曲地倾斜。在这样的状态下,在以读取装置来读取被片材夹持的收据22u并进行OCR处理的情况下,有时不是在收据项目中的项目名称和金额的对应是正确的对应关系的行中进行读取,而是项目名称和金额以不同的行的关系来进行读取。结果,有时将收据项目的金额错误识别为另外的收据项目的金额来对营业额进行总计。
在图16(A)中示出了收据项目的金额未被错误识别的情况的一个例子,在图16(B)中示出了收据项目的金额被错误识别的情况的一个例子。
图16(A)示出了收据22v中的倾斜的收据下部222v。设从作为收据22v的基准的方向Lb起的倾斜的角度α1(相对于图示的虚线的角度)为收据项目的金额不被错误识别的范围。例如,与位于收据下部项目222v的收据项目名称“总营业额”(图中示出的Str#101)对应的金额项目Dat#101是“¥654,735”,通过OCR处理被正确地识别为“总营业额¥654,735”。
另一方面,图16(B)示出了细算收据22w中的倾斜的收据下部222w。设从作为收据22w的基准的方向Lc起的倾斜的角度α2(相对于图示的虚线的角度)为收据项目的金额被错误识别的范围。例如,与位于收据下部222w的收据项目名称“总营业额”(图中示出的Str#102)对应的金额项目Dat#102正确的应为“¥654,735”,但在此,根据OCR处理的结果被错误识别为“总营业额  ¥623,603”。
该错误识别的原因是因为OCR处理结果的输出仅仅是各项目的字符串和它们的坐标信息,因此根据该坐标信息,与位于项目名称“总营业额”(Str#102)的下段的行的项目名称“纯营业额”对应的金额项目Dat#102的“623,603”起因于倾斜角度α2的大小而被作为位于和收据项目名称“总营业额”相同的行的字符串进行识别。
在相对于作为基准的方向,收据22整体为相同的倾斜角度的情况下,作为解决方案,在OCR处理中检测出收据22整体的倾斜角度,校正收据整体的行的倾斜,由此提取出正确的金额。可是,在图15所示的那样的情况下,在收据上部221u中倾斜角度较小、在从中途的部分起的收据下部222u中较大地倾斜的情况下,即使检测出收据22u整体倾斜的角度并校正,也不能适用于如图15所示那样的行的一部分为不同的倾斜的情况。
如以上说明那样,在以读取装置等读取这样的收据22u、对收据的数值数据进行OCR处理的情况下,有时会处理与收据项目名称不对应的金额项目。由此,在营业额管理数据中产生总计误差。为了对其进行检查,需要以手工作业来核对细算收据的作业,人的负担未被减轻。
发明内容
 本发明鉴于以上的方面,其目的在于不大幅度地改变各店铺的信息设备等的现状的系统,而从各租户的店铺的收据中正确且高效率地收集营业额管理数据,谋求营业额管理业务的高速化、效率化。
本发明的特征在于,为了例如将每个店铺印刷的收据重新总计为统一的营业额管理项目,针对读取收据图像而得到的识别字符,根据在按每个发行收据的店铺而不同的定义数据中注册的收据内的项目名称的字符串、和从收据内位置起的金额项目的相对位置数据,提取出需要的识别字符,根据提取出的识别字符的位置数据检测出识别字符的倾斜,在检测出识别字符的倾斜的情况下,根据检测出的倾斜对相应的金额项目的相对位置数据进行校正,使用校正后的相对位置数据,根据识别字符和其位置数据提取出表示金额项目的识别字符,根据与项目名称一致的识别字符和表示金额项目的识别字符,输出或存储识别结果的数据。
即,在以读取机来读取收据图像时,即使由于收据是细长的狭缝(slit)状的形式而在收据中产生倾斜、或从收据的中途倾斜的情况下,也能正确地读取收据内的项目和金额,能从以多个不同的形式印刷的收据中正确地仅提取出需要的项目,将营业额管理所需要的收据内的项目和金额作为识别结果的数据进行输出或存储。具体地本发明具备以下的单元。
(1)本发明的特征在于,具备:图像数据存储部,存储通过对收据图像进行字符识别而得到的识别字符及其位置数据;定义数据存储部,存储定义数据,其中所述定义数据按收据中的成为读取对象的各项目名称的每一个,对在收据印字的项目名称的字符串、和从所述项目名称的收据内位置起的与该项目名称对应的金额项目的相对位置数据进行定义;收据数据提取部,从存储在所述图像数据存储部的识别字符中提取与在所述定义数据中定义的项目名称的字符串一致的识别字符;倾斜检测部,根据提取出的识别字符的位置数据,检测出识别字符的倾斜;倾斜校正部,在检测出识别字符的倾斜的情况下,根据检测出的倾斜对所述定义数据中的相应的金额项目的相对位置数据进行校正;收据数据特别指定部,使用校正后的相对位置数据,根据存储在所述图像数据存储部中的识别字符及其位置数据提取出表示所述金额项目的识别字符;以及数据生成部,根据与所述项目名称一致的识别字符和表示所述金额项目的识别字符,生成识别结果的数据,输出或存储识别结果的数据。
由此,针对想要变换为事先输入的营业额管理项目的收据项目,在定义数据中注册项目名称和与其对应的金额栏的相对位置,检测出从收据图像读取的识别字符的倾斜,因此即使在有识别字符的倾斜的情况下,通过对识别字符的倾斜进行校正,能对与项目名称对应的金额栏的相对位置进行校正,能正确地读取营业额管理项目所需要的收据项目的金额。
(2)此外,本发明的特征在于,进而在所述发明中,所述收据是以按每个店铺而不同的格式进行印刷的收据,在所述定义数据存储部中,按每个店铺存储所述定义数据,使用按每个发行收据的店铺而不同的定义数据,执行所述收据数据提取部、所述倾斜检测部、所述倾斜校正部、所述收据数据特别指定部、和所述数据生成部的处理。
由此,即使在按每个店铺进行印刷的收据的项目名称、印字位置不同的情况下,也按每个店铺在定义数据中注册项目名称和与此对应的金额栏的相对位置,因此能与每个店铺的收据项目名称以及与其对应的金额栏的位置的差异无关地从收据图像中读取需要的收据数据。
(3)此外,本发明的特征在于,进而在所述发明中,存储在所述定义数据存储部中的定义数据包含与在所述收据印字的项目名称的字符串对应地在多个店铺的营业额管理中共同使用的营业额管理项目名称的数据,所述数据生成部生成将与所述项目名称一致的识别字符变换成在所述定义数据中定义的对应的营业额管理项目名称的识别结果的数据。
由此,即使在按每个店铺进行印刷的收据的项目名称、印字位置不同的情况下,也针对想要变换为事先输入的营业额管理项目的收据项目,按每个店铺在定义数据中注册项目名称和与其对应的金额栏的相对位置,因此能与每个店铺的收据项目名称以及与其对应的金额栏的位置的差异无关地从收据图像中读取需要的收据数据,生成统一的营业额管理数据。
本发明的效果如下所述。
(1)通过根据收据在定义数据中预先注册营业额管理项目所需要的收据项目,从而能使用其自动地提取需要的收据数据,因此能实现营业额信息的输入作业的省力化以及高速化。
(2)利用预先按每个店铺进行注册、设定的定义数据,能在图像的解析中利用是什么样的种类的收据、具有什么样的项目名称、与金额相关的相对位置等信息,能提高包含字符识别等的读取的精度。
(3)针对从收据中读取的每个别字符能检测出字符串的倾斜,并使用其来校正与定义数据的金额相关的相对位置,因此在收据的一部分行中存在倾斜的情况下,能避免收据数据提取的错误识别,能提取出正确的收据数据。因此,能进一步提高包含字符识别等的读取的精度。此外,由于能减少错误识别,所以能实现检查作业的省力化以及高速化。
(4)此外,能够从收据项目不同的各店铺的收据数据中,统一地收集营业额管理部门需要的基本的数据,并保存在营业额管理数据库等中。
附图说明
图1是表示本发明的实施方式的装置结构例的图。
图2是说明收据夹持用片材的图。
图3是表示营业额管理项目和收据项目的对应关系的例子的图。
图4是本发明的实施方式的收据数据识别装置的处理流程图。
图5是表示收据图像的例子的图。
图6是表示识别字符数据的一个例子的图。
图7是表示识别字符表的例子的图。
图8是说明定义数据表的图。
图9是收据数据处理的流程图。
图10是倾斜校正处理的流程图。
图11是说明倾斜检测处理以及倾斜校正处理的图。
图12是表示特别指定的收据数据的一个例子的图。
图13是营业额管理数据生成处理的流程图。
图14是表示营业额管理DB的例子的图。
图15是说明本发明的课题的图。
图16是说明本发明的课题的图。
具体实施方式
以下,一边使用附图,一边针对本发明的实施方式详细地进行说明。再有,在以下主要针对对店铺营业额进行总计的装置的例子进行说明,但本发明并不仅限于营业额总计,在用于对采购总计数据、印字在其它凭单等的实绩数据进行总计的装置等中也能同样地适用。
图1表示用于说明本发明的概要的装置结构例。在图1中,1是由CPU以及硬盘、存储器等的存储装置等构成的、基于从收据中读取的数据来执行与营业额的总计相关的处理的收据数据识别装置,20是标记有与各店铺对应的标识码21(在图2中示出)的、对各店铺的收据22(在图2中示出)进行夹持的收据夹持用片材。收据22是以按每个店铺而不同的格式进行印刷的收据。
再有,收据22按每个租户的店铺,通过在各店铺中准备的现金出纳机(cash register)等印刷有对例如一天的店铺的营业额进行总计的结果。此外,这些收据22作为与营业额总计相关的一个例子而示出,除了营业额总计以外,与采购总计、其它帐票处理相关也可。
最初,针对收据夹持用片材20进行说明。图2是表示收据夹持用片材20的一个实施方式的结构的图。特别地,图2(A)是从透明薄膜231侧观察收据夹持用片材20的俯视图,图2(B)是说明在收据夹持用片材20中收据22被透明片材23夹持之前的状态的立体图。
如图2(A)所示那样,例如,收据夹持用片材20将各店铺的收据22夹持在带有衬纸的透明片材23中。在透明片材23的右上端角以印刷或封印(seal)等标记有与该店铺对应的标识码21(QR码(注册商标)等的2维码等)。
如图2(B)所示那样,在透明片材23中,例如透明薄膜(片材)231和衬纸232在一端233被连接(粘接等),在夹持收据22之前的状态下,透明片材23处于半开封状态。在该半开封状态下的透明片材23的衬纸232上载置有收据22,通过将例如密接面稍微具有粘接性的透明薄膜231和衬纸232贴合,从而夹持收据22。再有,上述的标识码21例如在定位于衬纸232的右上端角的范围内通过印刷、封印等被标记。
接着,针对收据数据识别装置1处理的、每个店铺的收据22中的收据项目、和租户管理部门总计的营业额管理项目的对应关系进行说明。
图3是表示营业额管理项目和收据项目的对应关系的一个例子的图。在图3的例子中,租户管理部门在店铺的营业额管理中实际需要的营业额总计的数据是从No.1的现金营业额到No.11的顾客数这11个营业额管理项目。可是,这些营业额管理项目作为各店铺的收据22的收据项目,并不是直接以1对1的关系被印字的。因此,使用每个店铺的对应关系信息1022(1022a),根据各店铺的收据项目进行计算11个的各营业额管理项目的处理。
在图3示出的收据22a的情况下,在对应关系信息1022(1022a)中示出了第14个收据项目的“现金营业额金额”相当于No.1的营业额管理项目的“现金营业额”。针对其它的营业额管理项目,也分别通过对应关系信息1022进行对应。再有,在图3中示出的那样的每个店铺的营业额管理项目和收据项目的对应关系信息1022预先被注册并储存在定义数据存储部102(在图1中示出)中。
在图3中,在收据22a示出的收据项目,例如第14个示出为“现金营业额金额”等,但实际上,第14个(第n个)并不是位于收据内的从最上段的位置起固定的行的位置。根据店铺当日的收据总计结果,在第n个以前的收据项目中存在印字行数增加、或在印刷时被省略的收据项目等。因此,在收据数据识别装置1中对包含收据项目中的收据项目名称和与其对应的金额项目的相对位置(相对的金额栏的位置)的定义数据预先进行注册,与对应关系信息1022一起使用,由此谋求上述课题的解决。
收据数据识别装置1根据以上那样的定义数据以及对应关系信息1022,按每个店铺码,对“营业额日期”、营业额管理项目No.1“现金营业额”、No.2“赊销营业额”、No.3“信用营业额”、…等的与营业额相关的项目所对应的金额进行总计,储存在营业额管理数据存储部103中。因此,收据数据识别装置1执行以下说明的处理。
收据数据识别装置1从收据夹持用片材20中读取收据22。收据数据识别装置1使用针对收据22的定义数据,提取出包含收据项目中的项目名称以及金额的收据数据。收据数据识别装置1使用营业额管理项目和收据项目的对应关系信息1022,将提取出的收据数据的项目变换为营业额管理数据。即,提取营业额管理数据所需要的收据项目,将收据项目的金额作为营业额管理数据进行总计。
如以上那样,收据数据识别装置1按每个发行收据22的店铺使用定义数据,执行收据数据识别处理。
以下,针对用于执行上述的收据数据识别处理的、在图1中示出的收据数据识别装置1的结构,具体地进行说明。
图像数据存储部101存储通过读取机10读取的收据夹持用片材20的图像数据。图像数据是包含通过对收据22的图像进行OCR处理而得到的识别字符及其坐标(位置数据)的数据。进而,图像数据包含标识码21也可。此外,图像数据存储部101与图像数据关联地储存收据夹持用片材20的图像文件、例如位图形式文件等也可。
定义数据存储部102是储存在收据数据识别装置1中使用的定义数据的存储单元。定义数据按每个店铺包含收据22的收据项目以及金额的位置等的信息。
具体地,在定义数据中,与在收据22上印字的收据项目名称的字符串对应地,注册有在多个店铺的营业额管理中共同使用的营业额管理项目名称。例如,定义数据包含:在收据22上印字的收据项目名称的字符串,和从收据项目名称的收据内位置起的、与该收据项目名称对应的金额项目的相对位置数据,该定义数据按照收据22中的成为读取对象的各收据项目名称的每一个而被定义。这样的定义数据按每个进行总计的店铺的收据22被预先制作,并储存在定义数据存储部102中。再有,定义数据的细节使用图8在后面叙述。
营业额管理数据存储部103是对收据数据识别装置1生成的营业额管理数据进行保存的存储单元。营业额管理数据是使按每个店铺而不同的收据项目与统一的营业额管理项目对应地收集各店铺的收据项目的金额的结果的数据。再有,营业额管理数据的细节使用图14在后面叙述。
读取机10是在图像的扫描中使用光学方式等、对收据夹持用片材20的图像进行读取的装置。当收据夹持用片材20被输入时,读取机10将收据夹持用片材20变换为图像数据。图像数据包含例如图像文件、根据OCR的识别字符数据。读取机10将变换后的图像数据保存在图像数据存储部101中。例如,读取机10是扫描仪、OCR处理装置等利用众所周知的技术的装置。
图像数据读入部11读出在图像数据存储部101中保存的图像数据。再有,图像数据读入部11从收据数据识别装置1的外部的输入装置输入图像数据也可。外部的输入装置是读取装置、网络装置等。在该情况下,例如经由网络等,输入装置(未图示)输入通过设置在收据数据识别装置1的设置场所以外的读取装置所输入的收据夹持用片材20的图像数据,并保存在图像数据存储部101中。
店铺特别指定部12对收据夹持用片材20的标识码21进行标识,特别指定店铺码(或店铺)。再有,在图1的结构例中,用于店铺码的标识码21在收据夹持用片材20上被识别标记化,但店铺码的读取方法并不限定于本实施例。例如,在收据22的读取时,用户经由数字键盘、读卡器等外部输入装置输入店铺码也可。在该情况下,店铺特别指定部12接收从外部的输入装置输入的店铺码。此外,读取机10读取收据夹持用片材20的标识码21,店铺特别指定部12根据该读取的标识码21特别指定店铺码也可。
定义数据读入部13当接收通过店铺特别指定部12特别指定的店铺码时,从定义数据存储部102中检索与店铺码对应的定义数据。定义数据读入部13读出从定义数据存储部102中检索到的定义数据,将读出的定义数据发送到收据数据处理部14。
收据数据处理部14使用每个店铺码的定义数据,从图像数据中提取出包含收据项目名称及其金额的收据数据,根据提取出的收据数据特别指定营业额管理项目所需要的收据数据。因此,收据数据处理部14如图1所示那样,包含以下的功能部。
收据数据提取部141从存储在图像数据存储部101中的图像数据的识别字符数据中检索与在定义数据定义的收据项目名称的字符串一致的识别字符,提取该识别字符数据。识别字符数据包含:表示根据收据数据识别装置1预先准备的词典(未图示)的候补字符与通过OCR处理的识别字符的差异度的值、和表示字符范围的相对的坐标位置(相对位置)。再有,针对识别字符数据,使用图6在后面叙述。
倾斜检测部142使用被提取出的识别字符数据的识别字符的相对位置,检测识别字符的倾斜。例如,为了检测识别字符的倾斜,倾斜检测部142针对与收据项目名称的字符串一致的、1个或多个识别字符,求取相对于预先成为基准的方向的相对位置的偏离。倾斜检测部142将相对位置的偏离的方向相对于预先成为基准的方向所形成的角作为倾斜的角度来进行求取。再有,针对倾斜的检测方法,使用图11在后面叙述。
倾斜校正部143在识别字符的倾斜被检测出的情况下,参照定义数据,根据检测出的倾斜的角度,校正与收据项目名称的字符串一致的识别字符所对应的金额项目的相对位置。另一方面,倾斜校正部143在识别字符的倾斜未被检测出的情况下,不校正与收据项目名称的字符串一致的识别字符所对应的金额项目的相对位置。
收据数据特别指定部144当从倾斜校正部143中接收与收据项目名称对应的金额项目的相对位置时,从存储在图像数据存储部101中的识别字符中,提取与该金额项目的相对位置对应的识别字符。由此,收据数据特别指定部144能正确地特别指定与收据项目名称对应的金额项目。
营业额管理数据生成部15使用通过收据数据处理部14特别指定的收据数据,生成营业额管理数据。具体地,营业额管理数据生成部15使用与收据项目名称一致的识别字符、和在定义数据中定义的与对应的营业额管理项目名称对应起来的对应关系信息1022,对识别结果中的金额项目的数值数据进行运算(变换),生成营业额管理数据。营业额管理数据包含:店铺码、营业额管理项目以及与营业额管理项目对应的金额。
例如,营业额管理数据生成部15根据营业额管理项目和收据项目的对应关系信息1022,按每个店铺码,变换为与“营业额日期”、营业额管理项目No.1“现金营业额”、No.2“赊销营业额”、No.3“信用营业额”、…等与营业额相关的项目对应的金额,将其存储在营业额管理数据存储部103中。
以下,根据图4、图9、图10以及图13的处理流程图,一边也使用其它的图,一边针对在图1中示出的收据数据识别装置1的详细的功能进行说明。
图4是本发明的实施方式的收据数据识别装置1的处理流程图。根据图4,针对收据数据识别装置1执行的处理具体地进行说明。
起动收据数据识别装置1,开始本处理。当向读取机10输入收据夹持用片材20时,读取机10读取收据夹持用片材20,将读取的收据夹持用片材20的图像数据保存在图像数据存储部101中(步骤S11)。
为了具体地进行说明,使用图5~图7,说明从收据的图像数据进行OCR处理的字符串。
图5示出了通过读取机10读取的收据22b的图像的例子。通过读取机10生成的图像数据包含利用OCR处理的识别字符数据。读取机10当对收据22(22b)的图像进行OCR处理时,生成识别字符数据,存储在图像数据读入部11中。识别字符数据包含由识别字符组成的字符串的字符数以及字符串的坐标、构成字符串的字符的坐标以及来自词典的作为候补字符的识别字符列表。OCR处理的识别字符的对象是在收据22上印刷的字符串#1、字符串#2、…字符串#14、…等。例如,字符串#14是“総売上”(总营业额)。
图6是表示利用OCR处理的识别字符数据的一个例子的图。特别地,在图6中针对在图5中示出的字符串#14“総売上”(总营业额)的识别字符数据110而进行表示。
在图6中,识别字符数据110包含字符串#14“総売上”(总营业额)的字符数3、坐标(x,y)-(x’,y’)。此外,识别字符数据110针对构成字符串#14的字符#141“総”、#142“売”、以及#143“上”的3个字符,包含每一个的坐标。例如,字符#141“総”的坐标是(x1,y1)-(x’1,y’1),针对其它的字符,也如图所示。再有,(x,y)-(x’,y’)等表示图示的长方形框的坐标,从纸面上观察,(x,y)是与左上对应的坐标,(x’,y’)是与右下对应的坐标。例如,左上是朝向坐标原点的方向,右下是从原点坐标离开的方向。坐标原点例如被设为在收据夹持用片材20中的图像的特定位置。
进而,识别字符数据110包含字符#141“総”、#142“売”、以及#143“上”的3个字符的识别字符列表。识别字符列表根据来自词典的被作为候补字符的识别位次,储存有被作为其候补的识别字符、和该识别字符与读取的字符的差异度(或一致度)。例如,在字符#141“総”的识别字符列表中,位次“1”是识别字符“総”,差异度是“1311”,位次“2”是“脆”,差异度是“1581”,对于其它的位次也同样地被示出。差异度表示例如越是接近0的数值,与预先准备的词典(未图示)的候补字符一致的程度越大,该值越大,与词典的候补字符差异的程度越大。对于字符#142“売”以及#143“上”的识别字符列表也如图6所示。
图7是表示在图像数据存储部101中保存的识别字符表1011的一个例子的图。识别字符表1011是按每个被读入的图像数据来储存识别字符数据的表。进而,识别字符表1011按收据22的每个被识别的字符串,包含识别字符数据。识别字符数据如上所述。
在图7中示出的识别字符表1011储存在图5中示出的字符串#1~#14、…等识别字符数据。例如,上述的字符串#14“総売上”(总营业额)、构成字符串#14的字符#141“総”、#142“売”、以及#143“上”被储存在识别字符表1011中。对于其它的字符串也同样地被储存。再有,由于在图7中示出的识别字符表1011中的项目、设定等的定义和图6的识别字符数据的这些定义是同样的,所以在此省略说明。
接着,当图像数据读入部11从图像数据存储部101中读入图像数据时,店铺特别指定部12根据图像数据判别收据夹持用片材20的标识码21,从判别出的标识码21中读取店铺码(步骤S12)。
具体地,店铺特别指定部12对例如QR码等进行译码,根据译码后的数据特别指定店铺码、或与店铺码对应的标识号码等。再有,通过读取机10对QR码进行译码,店铺特别指定部12根据译码后的数据来特别指定店铺码也可,该特别指定方法并不被限定。
接着,定义数据读入部13当接收通过店铺特别指定部12特别指定的店铺码时,从定义数据存储部102中取得与店铺码对应的定义数据(步骤S13)。
具体地,在图8中示出对定义数据表1021进行说明的图。以下,使用图8,说明定义数据读入部13取得的定义数据的一个例子。
在图8中示出的收据22t是为了某个店铺的定义数据的制作而准备的收据22(作为基准收据)的图像的一部分。此外,在图8中,定义数据表1021是对预先制作的定义数据进行储存并被存储在定义数据存储部102中的数据。再有,在收据22t中显示有行号码、收据项目名称和金额。假设从该收据22t,第14行(BX14)的“现金营业额金额”、和第18行(BX18)的“其它兑换券金额”是提取对象的收据项目。
在定义数据表1021中,提取对象的收据项目作为定义数据而被注册。为了预先制作定义数据,使用作为每个店铺的基准的基准收据(收据22t),基于基准收据,制作对每个店铺的收据22的定义数据。
在定义数据表1021中,储存有对象的店铺码、和提取出的每个收据项目的“读取项目”、“项目属性”、“读取字符”以及“金额栏的读取位置”。“店铺码”是与成为对象的收据的店铺对应的每个店铺的标识号码。“读取项目”是营业额管理项目的名称。“项目属性”是要读取的收据项目名称的属性。该属性例如是“1”、“2”或“3”的任一个值。“1”被设为是在与营业额管理项目对应的收据项目名称与基准收据未重复(通常的项目)的情况下的属性,“2”被设为是在有重复的同一名称且设定锚点(anchor)字符的情况下的属性,“3”被设为是在有重复的同一名称且设定多个关键词的情况下的属性。“读取字符”是与营业额管理项目对应的在基准收据印字的收据项目名称。“金额栏的读取位置”是从读取字符起的收据项目的金额(包含数值字符、货币记号等)的相对位置。
在图8中示出的被设为基准收据的收据22t中,在图像位置BX14有被设为“现金营业额金额”以及“¥139,639”的字符串Str#1以及Dat#1。此外,字符串Str#1和字符串Dat#1的相对距离设为Dis#1。在图像位置BX18有被设为“其它兑换券金额”以及“¥8,000”的字符串Str#2以及Dat#2。此外,字符串Str#2和字符串Dat#2的相对距离设为Dis#2。
在图8中示出的定义数据表1021对根据在图8中示出的收据22t而制作的定义数据进行储存。如图8所示那样,在定义数据表1021中,“店铺码”:“100001”被设定为成为基准收据的对象的店铺码。“读取项目#1”:“现金营业额”是对营业额管理项目中的项目名称“现金营业额”进行设定的结果。“项目属性#1”:“1”是对上述的通常的项目进行设定的结果。“读取字符#1”:“现金营业额金额”是对在收据22t的图像位置BX14中的字符串Str#1进行设定的结果。“金额栏的读取位置#1”:“(x11,y11)-(x’11,y’11)”是作为字符串Str#1和字符串Dat#1的相对距离Dis#1而对从字符串Str#1的位置起到字符串Dat#1的位置的相对位置进行设定的结果。再有,示出了作为相对位置而储存有图示的字符串Dat#1的长方形框的左上的坐标(x11,y11)、同右下的坐标(x’11,y’11)。再有,这些坐标是相对的坐标。对于其它的定义数据也同样地被储存。再有,在图8中示出的定义数据表1021中的#n是用于区别多个定义数据的设定项目的标识符。n被设为是1、2等整数。
以上说明的定义数据表1021在收据数据提取部141提取收据数据时,经由定义数据读入部13被参照。收据数据提取部141基于储存在定义数据表1021中的定义数据,针对读入的图像数据(收据22的识别字符),提取收据项目。即,收据数据提取部141利用基准收据的定义数据,能判断要提取的收据项目。
再有,实际上,即使在细算收据(收据22)是以相同的POS系统进行印刷的情况下,也存在由于偶尔的输出导致跳过(漏掉)中途的收据项目的一部分而进行印刷的情况。因此,当以固定坐标制作在定义数据表1021中的“金额栏的读取位置”时,无法应对这样的跳过一部分的收据项目而进行印刷的情况。因此,如图8中示出的定义数据表1021那样,通过作为定义数据使用从收据项目名称的字符串位置起的相对位置的坐标位置,从而能够应对这样的跳过一部分的收据项目而进行印刷的情况。此外,在图8中,以收据项目名称和其对应的金额在相同的行进行印刷的例子进行了说明,但收据项目名称和其对应的金额在不同的行也可。在该情况下,在定义数据中注册该不同的行的金额的相对位置等。
接着,收据数据处理部14当从定义数据读入部13中接收与店铺码对应的定义数据时,执行收据数据处理(步骤S14)。针对该收据数据处理的详细的流程,使用图9在后面叙述。
在通过收据数据处理部14进行收据数据处理之后,营业额管理数据生成部15根据处理后的收据数据生成营业额管理数据。营业额管理数据生成部15将生成的营业额管理数据保存在营业额管理数据存储部103中(步骤S15)。在对营业额管理数据进行保存之后,收据数据识别装置1结束本处理。再有,针对步骤S15的详细的处理流程,使用图13在后面叙述。
以上说明的处理流程是收据数据识别装置1执行的处理整体的流程。
图9是在图4示出的步骤S14中的收据数据处理的详细的处理流程图。根据图9,针对收据数据处理部14执行的收据数据处理,具体地进行说明。
收据数据提取部141从图像数据中仅提取成为收据22的对象的行的项目名称(步骤S21)。
具体地,收据数据提取部141当从图像数据读入部11接收图像数据(识别字符数据)时,从收据22的第1行仅提取项目名称。例如,在为图5的图像数据的情况下,收据22b的字符串#1“2010年10月10日(日) 22:30 No:0002”被提取。字符串#2“**”、…、字符串#7“销售合计”、字符串#8“297点”、字符串#9“¥226,701”、…等被提取,空行等未被提取。再有,在该步骤S21中,作为项目名称,也包含收据项目名称、金额、记号(例如“**”)等而被提取。
接着,收据数据提取部141参照在定义数据表1021中储存的定义数据(步骤S22)。
具体地,定义数据读入部13从储存在定义数据存储部102中的定义数据表1021读出与店铺码对应的定义数据。定义数据读入部13将读出的定义数据发送至收据数据提取部141。收据数据提取部141在步骤S23以后的处理中,使用从定义数据读入部13发送的定义数据。再有,收据数据提取部141将从定义数据读入部13发送的定义数据保存在工作存储器(未图示)中,在工作存储器上参照定义数据。
接着,收据数据提取部141检查提取出的项目名称是否在定义数据中被设定(步骤S23)。
具体地,收据数据提取部141针对在图5中示出的字符串#14“総売上”(总营业额),检查在定义数据表1021的读取字符#n(n为整数)中是否存在一致的。
接着,在定义数据中设置了的情况下(步骤S23:“是”),倾斜检测部142针对与定义数据的读取字符一致的识别字符计算倾斜(步骤S24)。另一方面,在定义数据中没有设定的情况下(步骤S23:“否”),将处理转移至步骤S28。
具体地,倾斜检测部142根据与定义数据的读取字符一致的识别字符的y坐标来检测倾斜。
图11是说明倾斜检测处理以及倾斜校正处理的图。特别地,图11(A)是表示在收据22d中的收据项目的排列的例子的图,图11(B)是对识别字符的倾斜的检测以及校正的工作进行说明的图。
如图11(A)以及图11(B)所示那样,字符串Str#20“総売上”(总营业额)是由识别字符Str#21“総”、Str#22「売」以及Str#23「上」组成字符串,设这些字符在图像数据上相对于成为基准的方向,形成倾斜的角度α。
针对从图像数据读入部11发送的识别字符,收据数据提取部141参照定义数据表1021的读取字符#n,检查是否存在一致的内容。例如,针对作为识别字符的字符串Str#20“総売上”(总营业额),设对应于定义数据表1021的读取字符#n“総売上”(总营业额)。
收据数据提取部141针对从图像数据读入部11发送的字符串Str#20“総売上”(总营业额),参照工作存储器上的识别字符表1011。收据数据提取部141取得在识别字符表1011上检索命中的识别字符Str#21“総”、Str#22「売」以及Str#23「上」的图像数据(识别字符数据)。即,收据数据提取部141作为收据项目名称而提取字符串Str#20“総売上”(总营业额)。
倾斜检测部142使用通过收据数据提取部141而取得的识别字符数据,如以下那样,求取识别字符的倾斜。
例如,通过收据数据提取部141取得的图像数据是如图6的例子所示那样的Str#21“総”的坐标位置(x1,y1)-(x’1,y’1),Str#22「売」的坐标位置(x2,y2)-(x’2,y’2),Str#23「上」的坐标位置(x3,y3)-(x’3,y’3)等。再有,坐标位置(x1,y1)-(x’1,y’1)等表示长方形框的左上以及右下的坐标。此外,作为在图11(B)中示出的坐标(在图示中是黑点)Pt1=(x’1,y’1)、坐标Pt2=(x’2,y’2)、坐标Pt3=(x’3,y’3)而进行说明。
倾斜检测部142针对在图11(B)中示出的x坐标间距离k1以及y坐标间距离k2,通过使用坐标Pt1~Pt3,从而如以下所示那样计算倾斜的角度α。当求取k1、k2、tan(α)时,成为
Figure 778012DEST_PATH_IMAGE001
的关系。
接着,倾斜校正部143根据计算出的倾斜判断是否需要校正识别字符的倾斜(步骤S25)。在不需要校正倾斜的情况下(步骤S25:“否”),处理进入步骤S27。另一方面,在需要校正倾斜的情况下(步骤S25:“是”),倾斜校正部143执行倾斜校正处理(步骤S26)。
当具体地进行说明时,倾斜校正部143将计算出的倾斜角度α和预先确定的容许角度进行比较,在小于容许角度的情况下,判断为对在图11(B)中示出的金额项目Dat#30不需要校正Y坐标。另一方面,在计算出的倾斜的角度α是在容许角度以上的情况下,倾斜校正部143判断为对在图11(B)中示出的金额项目Dat#30需要校正Y坐标。再有,图11(B)的例子是计算出的倾斜的角度α在容许角度以上的情况。
图12是表示被特别指定的收据数据的一个例子的图。特别地,在图12中将收据22内的不同的行的字符串作为例子,进行比较说明。
(1)在未进行倾斜检测的情况下
收据数据提取部141使用OCR处理的结果以及定义数据表1021,识别为与收据项目名称的字符串Str#10“現金在高”(现金现额)对应的金额项目是Dat#10“¥335,275”。此外,识别为与收据项目名称的字符串Str#20“総売上”(总营业额)对应的金额项目是Dat#30“¥623,603”。这不是正确的结果。通过对其进行倾斜的检测,从而如下那样提取出正确的金额项目,解决问题。
(2)在进行倾斜检测的情况下
针对在图12中示出的字符串Str#10“現金在高”(现金现额),倾斜检测部142检测出倾斜的角度α1。倾斜校正部143将倾斜角度α1和预先确定的容许角度进行比较,判断为小于容许角度,不进行校正处理。
针对在图12中示出的字符串Str#20“総売上”(总营业额),倾斜检测部142检测出倾斜的角度α2。倾斜校正部143将倾斜角度α2和预先确定的容许角度进行比较,判断为在容许角度以上,进行校正处理。
图10是在步骤S26中的倾斜校正处理的详细的处理流程图。以下,根据图10,针对收据数据处理部14执行的倾斜校正处理,具体地进行说明。
收据数据提取部141从定义数据中取得与收据项目名称对应的金额项目的位置信息(金额栏的位置)(步骤S261)。
为了具体地进行说明,图11(A)表示成为收据数据的提取对象的收据22d。在图11(A)中,在收据22d中有作为收据项目名称而被识别的字符串Str#10~#30、和与其分别对应的金额项目(金额的字符串)Dat#10~#30。例如,设成作为收据项目名称而被识别的字符串是Str#10“現金在高”(现金现额)、Str#20“総売上”(总营业额)以及Str#30“純売上”(纯营业额),设与其分别对应的金额项目是Dat#10“¥335,275”、Dat#20“¥654,735”以及Dat#30“¥623,603”。
收据数据提取部141使用与收据22d对应的店铺码的定义数据表1021(例如图8),从“读取字符#10”中取得收据项目名称的字符串Str#10,从“金额栏的读取位置#10”中取得对应的金额项目Dat#10的位置信息(金额栏的位置)。此外,同样地,针对字符串Str#20以及Str#30,也同样地取得金额项目Dat#20以及Dat#30的位置信息。
接着,倾斜校正部143根据检测出的倾斜的角度计算出金额栏的位置的Y坐标的校正量(步骤S262)。接着,倾斜校正部143根据计算出的校正量对金额栏的位置的Y坐标进行校正(步骤S263)。
具体地,倾斜校正部143对金额项目Dat#30,如以下说明那样,校正金额栏的位置的Y坐标。
校正前的金额栏的位置如图11(B)的实线长方形框所示那样,位于从“金额栏的读取位置#20”取得的位置信息(x21,y21)-(x’21,y’21)。倾斜校正部143使用检测出的倾斜的角度α,计算出取得的位置信息的y坐标的校正量△y。在此,设为
。再有,在上述示出的倾斜角度以及校正量的计算方法是一个例子,是其它的计算方法也可。例如,如
Figure 848790DEST_PATH_IMAGE003
那样,使用金额栏的读取位置#20的左端和右端的x坐标的平均值进行计算也可。
由此,如图11(B)的虚线长方形框所示那样,倾斜校正部143将校正后的金额栏的位置校正为(x21,y21+△y)-(x’21,y’21+△y)。由于在图11(B)的虚线长方形框内存在金额项目Dat#20“¥654,735”,所以倾斜校正部143判断为与字符串Str#20对应的金额项目是Dat#20。
在以上说明的校正处理后,结束步骤S26(S261~S263)。在此,返回到图9的处理流程图的步骤S27,根据图9进行说明。
接着,收据数据特别指定部144使用在定义数据设定的金额的位置信息或校正后的金额的位置信息,取得金额项目(步骤S27)。
具体地,收据数据特别指定部144取得与校正后的位置信息的坐标或未被校正而直接作为金额的位置信息的坐标接近的、定义数据的“读取项目#n”的坐标的字符串。
例如,针对在图12中示出的字符串Str#10“現金在高”(现金现额)的金额项目,由于倾斜的角度α1小于容许角度,所以倾斜校正部143不执行倾斜校正处理。由此,收据数据特别指定部144识别为与字符串Str#10“現金在高”(现金现额)对应的金额项目是Dat#10“¥335,275”。即,特别指定收据项目名称“現金在高”(现金现额)以及金额项目“¥335,275”的收据数据。
另一方面,在图12中,针对字符串Str#20“総売上”(总营业额)的金额项目,由于通过倾斜检测部142检测出的倾斜的角度α2在容许角度以上,所以倾斜校正部143执行倾斜校正处理。在执行倾斜校正处理后,倾斜校正部143针对字符串Str#20“総売上”(总营业额)的金额项目,设为处于方向L#21的距离Dis#21的金额项目Dat#20“¥654,735”。由此,收据数据特别指定部144识别为与字符串Str#20“総売上”(总营业额)对应的金额项目Dat#20“¥654,735”。即,特别指定收据项目名称“総売上”(总营业额)以及金额项目“654,735”的收据数据。
接着,判断收据项目的最终行的处理是否结束(步骤S28)。在收据项目的最终行的处理未结束的情况下(步骤S28:“否”),使处理返回至步骤S21,重复进行从下一个收据项目的行起的步骤S21~S27的处理。另一方面,在收据项目的最终行的处理结束的情况下(步骤S28:“是”),结束本处理。
通过以上的校正处理,如图11(A)所示那样,收据数据特别指定部144能够特别指定例如与收据项目名称Str#20“総売上”(总营业额)对应的金额项目Dat#20“¥654,735”。
如以上那样,收据数据处理部14使用定义数据,对从收据图像读取的收据项目的识别字符,能针对每一个检测出倾斜,根据检测出的倾斜执行校正处理,提取需要的收据数据。
此外,收据数据处理部14能够提取出营业额管理数据所需要的收据数据,能以预先确定的对应关系将提取出的收据数据的收据项目名称以及金额变换(总计)为营业额管理项目的营业额管理数据。
通过以上说明的收据数据识别处理,能对各个收据行的识别字符进行倾斜的检测和该倾斜的校正,因此能排除收据用纸在中途被折弯的情况、印刷偏离等的影响,能正确地提取出收据项目名称以及对应的金额项目。由此,能正确地对营业额管理数据进行总计。
图13表示在步骤S15中的营业额管理数据生成处理的详细的处理流程图。根据图13,针对营业额管理数据生成部15执行的营业额管理数据生成处理具体地进行说明。
营业额管理数据生成部15从收据数据特别指定部144中取得营业额总计所需要的收据数据(步骤S31)。
具体地,营业额管理数据生成部15从收据数据特别指定部144中取得收据数据,该收据数据包含:店铺码、包含根据识别字符而特别指定的收据项目名称以及其金额的数据、和在图3中示出的对应关系信息1022。
接着,营业额管理数据生成部15使用对应关系信息1022,作为营业额管理项目的营业额管理数据而进行总计(步骤S32)。
具体地,营业额管理数据生成部15根据对应关系信息1022,基于营业额管理项目和收据项目的对应关系,将与收据项目名称对应的金额作为营业额管理项目的营业额管理数据而进行总计。通过以上,收据项目的金额(数值数据)被变换成营业额管理项目的数值数据。
接着,营业额管理数据生成部15将成为保存对象的店铺码的营业额管理数据保存在营业额管理数据存储部103的营业额管理DB1031中(步骤S33)。
例如,图14表示营业额管理DB(数据库)1031的例子。在营业额管理DB1031中,如图14所示那样,按每个店铺码储存有“营业额日期”、营业额管理项目No.1“现金营业额”、No.2“赊销营业额”、No.3“信用营业额”、…等的与营业额相关的细算项目所对应的数值(金额)。
通过以上,在营业额管理DB1031中,按每个店铺是完全不同的格式(片材形式)的收据22的收据项目被一元化,能将在从各租户的店铺输出的收据中未取得统一的收据项目、名称、数值等作为取得了统一性的营业额管理项目的营业额管理数据,不通过手工输入的作业而自动地进行收集。由此,由于租户管理部门的业务负责人能自动地总计每个店铺的营业额,所以能高效率地、高速地进行店铺的营业额管理业务。
此外,由于不需要变更在各店铺中准备的现金出纳机等的收据输出装置,所以对于租户侧来说能抑制多余的开销。
以上的收据数据识别装置进行的处理能通过计算机和软件程序实现,也能将该程序记录在计算机可读取的记录介质中,也能通过网络来提供。
附图标记的说明
1   收据数据识别装置;
10   读取机;
11   图像数据读入部;
12   店铺特别指定部;
13   定义数据读入部;
14   收据数据处理部;
15   营业额管理数据生成部;
20   收据夹持用片材;
101   图像数据存储部;
102   定义数据存储部;
103   营业额管理数据存储部;
141   收据数据提取部;
142   倾斜检测部;
143   倾斜校正部;
144   收据数据特别指定部。

Claims (6)

1.一种收据数据识别装置,其特征在于,具备:
图像数据存储部,存储通过对收据图像进行字符识别而得到的识别字符及其位置数据;
定义数据存储部,存储定义数据,其中所述定义数据按收据中的成为读取对象的各项目名称的每一个,对在收据印字的项目名称的字符串、和从所述项目名称的收据内位置起的与该项目名称对应的金额项目的相对位置数据进行定义;
收据数据提取部,从存储在所述图像数据存储部的识别字符中提取与在所述定义数据中定义的项目名称的字符串一致的识别字符;
倾斜检测部,根据提取出的识别字符的位置数据,检测出识别字符的倾斜;
倾斜校正部,在检测出识别字符的倾斜的情况下,根据检测出的倾斜对所述定义数据中的相应的金额项目的相对位置数据进行校正;
收据数据特别指定部,使用校正后的相对位置数据,根据存储在所述图像数据存储部中的识别字符及其位置数据提取出表示所述金额项目的识别字符;以及
数据生成部,根据与所述项目名称一致的识别字符和表示所述金额项目的识别字符,生成识别结果的数据,输出或存储识别结果的数据。
2.根据权利要求1所述的收据数据识别装置,其特征在于,
所述收据是以按每个店铺而不同的格式进行印刷的收据,
在所述定义数据存储部中,按每个店铺存储所述定义数据,
使用按每个发行收据的店铺而不同的定义数据,执行所述收据数据提取部、所述倾斜检测部、所述倾斜校正部、所述收据数据特别指定部、和所述数据生成部的处理。
3.根据权利要求2所述的收据数据识别装置,其特征在于,
存储在所述定义数据存储部中的定义数据,与在所述收据印字的项目名称的字符串对应地,包含在多个店铺的营业额管理中共同使用的营业额管理项目名称的数据,
所述数据生成部生成将与所述项目名称一致的识别字符变换成在所述定义数据中定义的对应的营业额管理项目名称的识别结果的数据。
4.一种收据数据识别方法,具备:
参照图像数据存储单元和定义数据存储单元,从存储在所述图像数据存储单元中的识别字符中提取出与在所述定义数据中定义的项目名称的字符串一致的识别字符的处理步骤,其中,所述图像数据存储单元存储通过对收据图像进行字符识别而得到的识别字符及其位置数据,所述定义数据存储单元存储定义数据,所述定义数据按收据中的成为读取对象的各项目名称的每一个,对在收据印字的项目名称的字符串、和从所述项目名称的收据内位置起的与该项目名称对应的金额项目的相对位置数据进行定义;
根据提取出的识别字符的位置数据,检测出识别字符的倾斜的处理步骤;
在检测出识别字符的倾斜的情况下,根据检测出的倾斜对所述定义数据中的相应的金额项目的相对位置数据进行校正的处理步骤;
使用校正后的相对位置数据,根据存储在所述图像数据存储单元中的识别字符及其位置数据提取出表示所述金额项目的识别字符的处理步骤;以及
根据与所述项目名称一致的识别字符和表示所述金额项目的识别字符,生成识别结果的数据,输出或存储识别结果的数据的处理步骤。
5.根据权利要求4所述的收据数据识别方法,其特征在于,
所述收据是以按每个店铺而不同的格式进行印刷的收据,在所述定义数据存储单元中存储有每个店铺的所述定义数据的情况下,在从所述收据中提取识别字符的处理步骤中,参照发行了所述收据的店铺的定义数据。
6.根据权利要求5所述的收据数据识别方法,其特征在于,
在所述定义数据与在所述收据印字的项目名称的字符串对应地包含在多个店铺的营业额管理中共同使用的营业额管理项目名称的数据的情况下,在生成所述识别结果的数据的处理步骤中,生成将与所述项目名称一致的识别字符变换成在所述定义数据中定义的对应的营业额管理项目名称的识别结果的数据。
CN201110292107.4A 2011-04-08 2011-09-29 收据数据识别装置及其方法 Active CN102737239B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2011085854A JP5202677B2 (ja) 2011-04-08 2011-04-08 レシートデータ認識装置およびそのプログラム
JP2011-085854 2011-04-08

Publications (2)

Publication Number Publication Date
CN102737239A true CN102737239A (zh) 2012-10-17
CN102737239B CN102737239B (zh) 2015-01-07

Family

ID=46992708

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110292107.4A Active CN102737239B (zh) 2011-04-08 2011-09-29 收据数据识别装置及其方法

Country Status (2)

Country Link
JP (1) JP5202677B2 (zh)
CN (1) CN102737239B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110807453A (zh) * 2018-08-06 2020-02-18 研祥智能科技股份有限公司 基于ocr的产品字符在线检测方法、装置及系统
WO2020224131A1 (zh) * 2019-05-09 2020-11-12 杭州睿琪软件有限公司 票据识别方法、装置、电子设备和计算机可读存储介质
CN113435993A (zh) * 2021-08-27 2021-09-24 聆笙(北京)科技有限公司 一种收据数据识别系统及其方法

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6108927B2 (ja) * 2013-04-16 2017-04-05 株式会社富士通マーケティング 店舗別売上データ管理システム及び店舗別売上データ管理プログラム
JP6559945B2 (ja) * 2014-12-02 2019-08-14 東芝テック株式会社 情報処理装置およびプログラム
CN105139009A (zh) * 2015-07-10 2015-12-09 安徽清新互联信息科技有限公司 一种基于边缘特征的信用卡卡号识别方法
JP2018018303A (ja) * 2016-07-28 2018-02-01 京セラドキュメントソリューションズ株式会社 情報抽出装置及びこれを備えた画像形成装置
JP6745952B2 (ja) * 2019-07-17 2020-08-26 東芝テック株式会社 電子レシートシステムおよび電子レシートシステムにおける電子レシート表示方法
JP6952169B2 (ja) * 2019-07-17 2021-10-20 東芝テック株式会社 電子レシートシステムおよび電子レシートシステムにおける電子レシート処理方法
CN111444792B (zh) * 2020-03-13 2023-05-09 安诚迈科(北京)信息技术有限公司 票据识别方法、电子设备、存储介质及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1265499A (zh) * 1999-03-01 2000-09-06 株式会社日立制作所 账票处理方法与账票处理系统
JP2004164218A (ja) * 2002-11-12 2004-06-10 Seiko Epson Corp レシート処理装置およびその方法、並びにコンピュータプログラム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09319824A (ja) * 1996-05-30 1997-12-12 Hitachi Ltd 帳票認識方法
JP4281236B2 (ja) * 2000-09-27 2009-06-17 コニカミノルタビジネステクノロジーズ株式会社 画像認識装置、画像認識方法、および、画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体
JP2005092635A (ja) * 2003-09-18 2005-04-07 Ricoh Co Ltd レシート情報収集処理システム
JP2008234586A (ja) * 2007-03-23 2008-10-02 Nomura Research Institute Ltd 消費情報取得端末、消費情報取得サーバおよび家計簿管理装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1265499A (zh) * 1999-03-01 2000-09-06 株式会社日立制作所 账票处理方法与账票处理系统
CN1822026A (zh) * 1999-03-01 2006-08-23 株式会社日立制作所 帐票处理系统与帐票处理方法
JP2004164218A (ja) * 2002-11-12 2004-06-10 Seiko Epson Corp レシート処理装置およびその方法、並びにコンピュータプログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110807453A (zh) * 2018-08-06 2020-02-18 研祥智能科技股份有限公司 基于ocr的产品字符在线检测方法、装置及系统
WO2020224131A1 (zh) * 2019-05-09 2020-11-12 杭州睿琪软件有限公司 票据识别方法、装置、电子设备和计算机可读存储介质
US11361570B2 (en) 2019-05-09 2022-06-14 Hangzhou Glorify Software Limited Receipt identification method, apparatus, device and storage medium
US12008828B2 (en) 2019-05-09 2024-06-11 Hangzhou Glority Software Limited Receipt identification method, apparatus, electronic device and computer-readable storage medium
CN113435993A (zh) * 2021-08-27 2021-09-24 聆笙(北京)科技有限公司 一种收据数据识别系统及其方法

Also Published As

Publication number Publication date
JP2012221183A (ja) 2012-11-12
JP5202677B2 (ja) 2013-06-05
CN102737239B (zh) 2015-01-07

Similar Documents

Publication Publication Date Title
CN102737239B (zh) 收据数据识别装置及其方法
CN102737224A (zh) 收据数据识别装置及其方法
CN105528604B (zh) 一种基于ocr的票据自动识别与处理系统
EP2937818B1 (en) Information code, information code generation method, information code reader device, and information code usage system
CN109308476A (zh) 票据信息处理方法、系统及计算机可读存储介质
CN111476109A (zh) 票据处理方法、票据处理装置和计算机可读存储介质
CN108960223A (zh) 基于票据智能识别自动生成凭证的方法
EP3229195A1 (en) Image processing device
JP2020030858A (ja) 画像処理装置及び画像処理方法
BR112013015346B1 (pt) Método e dispositivo para classificar um objeto em dados de imagem em uma dentre um conjunto de classes usando um classificador, meio legível por computador não transitório e sistema
CN110457973A (zh) 一种票据识别的方法及系统
WO2019194051A1 (ja) 画像処理装置、画像処理方法、およびプログラムを記憶する記憶媒体
CN101257554A (zh) 文档处理装置、文档处理系统和文档处理方法
JP2019185141A (ja) 画像処理装置、画像処理方法およびプログラム
CN102346843B (zh) 按商店收集收据数据的收据数据收集装置
CN103488965A (zh) 运单信息录入和彩色色块编码解码系统
CN109726369A (zh) 一种基于标准文献的智能模板化题录技术实现方法
CN104318231A (zh) 一种选票图像快速定位的方法
US20080169341A1 (en) Apparatus and method for automated ticket and boarding
Hamzah et al. Data capturing: Methods, issues and concern
TWM626292U (zh) 業務導向要項鍵值辨識系統
JP3732254B2 (ja) フォーマット情報生成方法及びフォーマット情報生成装置
JPH11288445A (ja) 帳票認識方法及び装置
JP5712415B2 (ja) 帳票処理システム及び帳票処理方法
CN104680414A (zh) 帐票数据管理系统、方法、以及帐票数据管理装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20210818

Address after: Tokyo, Japan

Patentee after: Fujitsu Japan Co.,Ltd.

Patentee after: FUJITSU COMP TECHNOLOGIES Ltd.

Address before: No. 27, No. 7, Ding mu, Houle 1, Wenjing District, Tokyo, Japan

Patentee before: FUJITSU BUSINESS SYSTEMS Ltd.

Patentee before: FUJITSU COMP TECHNOLOGIES Ltd.

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20220210

Address after: Kawasaki County of Kanagawa City, Japan

Patentee after: FUJITSU Ltd.

Address before: Tokyo, Japan

Patentee before: Fujitsu Japan Co.,Ltd.

Patentee before: FUJITSU Ltd.

Effective date of registration: 20220210

Address after: Tokyo, Japan

Patentee after: Fujitsu Japan Co.,Ltd.

Patentee after: FUJITSU Ltd.

Address before: Tokyo, Japan

Patentee before: Fujitsu Japan Co.,Ltd.

Patentee before: FUJITSU COMP TECHNOLOGIES Ltd.