CN109960684A - 图像处理装置及存储介质 - Google Patents
图像处理装置及存储介质 Download PDFInfo
- Publication number
- CN109960684A CN109960684A CN201811591937.5A CN201811591937A CN109960684A CN 109960684 A CN109960684 A CN 109960684A CN 201811591937 A CN201811591937 A CN 201811591937A CN 109960684 A CN109960684 A CN 109960684A
- Authority
- CN
- China
- Prior art keywords
- date
- original copy
- control unit
- date information
- image data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/126—Character encoding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/416—Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/412—Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Character Input (AREA)
- Processing Or Creating Images (AREA)
Abstract
一种图像处理装置及存储介质,用于在通过对于文档图像数据的字符识别来提取多个日期信息时,适当地选择原稿的发行日。图像处理装置包括控制部,该控制部获取通过读取原稿而生成的文档图像数据,并通过字符识别来识别上述文档图像数据中包含的字符串,当从上述字符串提取了多个日期信息时,上述控制部选择上述多个日期信息中的包含时刻信息的日期信息,作为上述原稿的发行日。当未提取到包含时刻信息的日期信息时,上述控制部基于上述文档图像数据判别上述原稿的类型,并根据上述原稿的类型从上述多个日期信息中选择作为上述原稿的发行日的日期信息。
Description
技术领域
本发明涉及对通过读取原稿而生成的文档图像数据进行处理的图像处理装置及存储介质。
背景技术
公开有一种信息处理终端装置,其对于通过读取特定格式的原稿而生成的图像数据,自动生成文件名,并且对预先针对每个格式指定的多个识别位置的指定数据进行识别处理,将识别到的所述多个位置的字符串经由分隔字符连接,从而生成文件名(参照专利文献1)。
专利文献1:日本专利特开2008-71050号公报
在对文档图像数据进行字符识别处理时,有时提取多个日期信息。在提取多个日期信息时,难以判别哪个日期信息表示该文档图像数据的原稿的发行日。
发明内容
本发明是鉴于上述问题而提出的,提供图像处理装置及存储介质,用于在通过对于文档图像数据的字符识别来提取多个日期信息时,适当地选择原稿的发行日。
关于本发明的一方面,图像处理装置包括控制部获取通过读取原稿而生成的文档图像数据,并通过字符识别来识别上述文档图像数据中包含的字符串,当从上述字符串提取到多个日期信息时,上述控制部选择上述多个日期信息中包含时刻信息的日期信息作为上述原稿的发行日。
根据该结构,当从文档图像数据中包含的字符串提取多个日期信息时,如果包含含有时刻信息的日期信息,则图像处理装置选择包含该时刻信息的日期信息作为上述发行日。由此,在通过对于文档图像数据的字符识别而提取到多个日期信息时,能够从中适当地选择原稿的发行日。
关于本发明的一方面,当未提取到包含时刻信息的日期信息时,上述控制部基于上述文档图像数据判别上述原稿的类型,并根据上述原稿的类型从上述多个日期信息中选择作为上述原稿的发行日的日期信息。
根据该结构,在从包含在文档图像数据中的字符串中提取的多个日期信息中没有包含时刻信息的日期信息时等、由于某种原因而未选择包含时刻信息的日期信息时,图像处理装置能够根据原稿的类型,从多个日期信息中适当地选择原稿的发行日。
关于本发明的一方面,上述控制部基于上述文档图像数据中包含的字符串,判别上述原稿的类型。此外,上述控制部基于上述文档图像数据表示的上述原稿的尺寸,判别上述原稿的类型。
根据这些结构,图像处理装置能够基于文档图像数据,适当地判别原稿的类型。
关于本发明的一方面,当上述原稿的类型是收据时,上述控制部优先选择上述多个日期信息中在先的日期信息。
除了收据的发行日以外,有时在收据中还记载有例如,与商品的活动、广告、积分的有效期限等有关的各种日期信息。即使在这种情况下,通过优先选择更在先的日期信息,也能够适当地选择原稿(收据)的发行日。
关于本发明的一方面,当上述原稿的类型是住宿设施的收据时,上述控制部优先选择上述多个日期信息中在后的日期信息。
在住宿设施的收据中基本上记载有入住的日期信息和退房的日期信息,在这种情况下,通过优先选择多个日期信息中在后的日期信息,能够选择退房的日期作为原稿(住宿设施的收据)的发行日。
关于本发明的一方面,上述控制部也可以将与对期间进行限定的字符串一起描述的日期信息从选择项中排除。
与表示对期间进行限定的字符串一起描述的日期信息与原稿的发行日相符的可能性较低,因此通过不选择这种日期信息,能够避免选择不适当的日期信息作为原稿的发行日。
关于本发明的一方面,上述控制部也可以将比上述文档图像数据的生成日期时间在后的日期信息从选择项中排除。
比文档图像数据的生成日期时间在后的日期信息不可能与原稿的发行日相符,因此通过不选择这种日期信息,能够避免选择不适当的日期信息作为原稿的发行日。
关于本发明的一方面,上述控制部将包含上述发行日的文件名作为上述文档图像数据的文件名显示于显示部。
根据该结构,图像处理装置向用户呈现文件名,该文件名包含了作为原稿的发行日的日期信息、即从文档图像数据所包含的字符串中提取的日期信息。因此,用户通过确认所呈现(显示在显示部上)的文件名,能够将文档图像数据附加包含了原稿发行日的文件名而进行保存。
本发明的技术思想也可以通过除图像处理装置类别以外的其它类别来实现。例如,能够将以下程序作为发明来掌握:作为使计算机对通过读取原稿而生成的文档图像数据执行处理的图像处理程序,其中,上述图像处理程序执行通过字符识别来识别上述文档图像数据中包含的字符串的控制功能,当从上述字符串中提取多个日期信息时,上述控制功能选择上述多个日期信息中的包括时刻信息的日期信息,作为上述原稿的发行日。此外,与这种图像处理程序的处理相对应的方法的发明、存储该程序的计算机可读存储介质也作为发明而成立。
附图说明
图1是简单地示出图像处理装置的结构的图。
图2是示出文件保存处理的流程图。
图3是示出文件保存设置画面的一例的图。
图4是示出步骤S130的详细内容的流程图。
图5A是示出步骤S120的一个变形例的图,图5B是示出步骤S120的另一变形例的图。
图6是示出发行日确定显示处理的流程图。
图7是示出扫描数据管理画面的一例的图。
附图标记说明
10…图像处理装置;11…控制部;12…显示部;13…操作受理部;14…通信IF;15…存储部;20…数据获取部;21…文件名生成部;22…显示控制部;30…扫描仪;40…文件保存设置画面;41…原稿图像显示栏;42…文件夹设置栏;43…文件名输入栏;44…文件名候选栏;44a…第一栏;44b…第二栏;50…扫描数据管理画面;51…原稿图像显示栏;52…发行日输入栏;A…程序;T…表。
具体实施方式
以下,参照各图说明本发明的实施方式。另外,各图仅是用于说明本实施方式的例示。
1.装置结构的概略说明:
图1简单地示出本实施方式涉及的图像处理装置10的结构。图像处理装置10与读取装置(扫描仪30)可通信地连接,该读取装置以光学方式读取原稿,生成作为读取结果的规定格式的图像数据并将该图像数据向外部输出。扫描仪30只要是包括已知产品并作为扫描仪发挥功能的装置即可。
图像处理装置10例如,通过个人计算机(PC)、智能手机、平板型终端、便携式电话机、或者具有与它们相同程度的处理能力的信息处理装置来实现。此外,可以将能够实现本实施方式涉及的控制部11的硬件称为图像处理装置。
例如,图像处理装置10包括控制部11、显示部12、操作受理部13、通信接口(IF)14、存储部15等。例如,控制部11适当包括处理器(例如CPU11a。也可以是ASIC、ASIC与CPU等的协作)、具有ROM11b、RAM11c等的一个或多个IC、其它存储器等。例如,存储部15是硬盘驱动器(HDD)、闪速存储器等非易失性存储装置。存储部15也可以是控制部11的一部分。
在控制部11中,处理器(CPU11a)通过将RAM11c等用作工作区域,根据保存在ROM11b、存储部15等中的程序执行运算处理,从而控制图像处理装置10的运行。控制部11搭载程序A作为程序中的一个,并根据程序A实现数据获取部20、文件名生成部21、显示控制部22等的各功能。程序A是使计算机对通过读取原稿而生成的文档图像数据执行处理的图像处理程序。此外,程序A是用于执行文档图像数据的保存和管理的应用程序。
通信IF14是依据包含已知通信标准的规定通信协议,以有线或无线方式与外部执行通信的IF。在图1的示例中,图像处理装置10经由通信IF14与扫描仪30连接。当然,图像处理部10也能够经由通信IF14或者未图示的其它通信IF与外部网络连接,控制部11(程序A)例如也能够通过上述网络(局域网、因特网通信网等)将从扫描仪30获取的文档图像数据上载到外部服务器(未图示)。
显示部12是用于显示视觉信息的单元,并且例如由液晶显示器(LCD)、有机EL显示器等构成。显示部12也可以是包括显示器和用于驱动该显示器的驱动电路的结构。操作受理部13是用于接收用户的操作的单元,例如通过物理按钮、触摸面板、鼠标、键盘等来实现。当然,触摸面板也可以作为显示部12的一个功能来实现。此外,可以包括显示部12及操作受理部13而称为操作面板等。
显示部12、操作受理部13、存储部15等在图1中示出的一部分结构也可以是外接于图像处理装置10的外围设备。此外,也可以将包括图1所示的图像处理装置10和扫描仪30的系统作为一个发明来理解。或者,作为实际状态,图像处理装置10和扫描仪30也可以整体包括在一个装置中。当图像处理装置10和扫描仪30包括在一个装置中时,可以将这种结构(一个装置)称为读取装置等。此外,包括图像处理装置10和扫描仪30的结构(一个装置)也可以是同时具有作为打印机(复印机)、传真机等的多个功能的复合机。
2.伴随文件名显示的文件保存处理:
图2通过流程图示出控制部11根据程序A执行的文件保存处理。
首先,扫描仪30通过读取用户任意设置的原稿来生成图像数据。在本实施方式中,用户使扫描仪30读取的原稿是至少记载了字符的原稿。原稿例如是收据、账单或合同书等。扫描仪30将作为原稿的读取结果的图像数据(文档图像数据)向图像处理装置10发送。控制部11可以经由通信IF14向扫描仪30指示开始原稿的读取,扫描仪30也可以根据来自控制部11的该读取开始的指示开始原稿的读取。
控制部11(数据获取部20)经由通信IF14获取如上所述从扫描仪30发送的文档图像数据(步骤S100)。另外,数据获取部20也可以不从扫描仪30直接获取(接收)文档图像数据,而从作为从扫描仪30传送文档图像数据的传送目的地的存储部(例如,存储部15)获取该文档图像数据。
控制部11(文件名生成部21)将在步骤S100中获取的文档图像数据作为对象,执行字符识别(OCR:Optical Character Recognition/Reader:光学字符识别/读取器),从而识别包含在文档图像数据中的字符串(步骤S110)。在这种情况下,将包含在文档图像数据中的字符串和可识别的对象转换为字符数据(文本数据)。字符识别处理是公知的技术,因此省略其进一步的说明。
在步骤S120中,文件名生成部21从在步骤S110中识别到的文档图像数据中包含的字符串(以下,为数据内字符串)中,检索预先登记的特定字符串。特定字符串是指已登记在表T中的字符串。表T存储于图像处理装置10内的存储部(例如,存储部15)。但是,表T也可以存储在外部的服务器中,图像处理装置10也可以通过上述网络访问上述服务器来适当地参照表T。
特定字符串基本上是表示原稿类型(原稿是什么用途、主旨的文件)的词语。例如,作为特定字符串,“发票(invoice)”、“账单(bill)”、“合同(contract)”等设想包含在原稿内的文档中的词语、即直接表示原稿类型的词语,被预先登记在表T中。进一步地,由执行程序A的控制部11在以前接收输入而作为文件名的字符串也可以被登记在表T中作为特定字符串的一种。也就是说,执行程序A的控制部11通过将用户操作操作受理部13等而输入到文件名输入栏(参照图3的附图标记43。)中的文件名所包含的词语(例如,原稿发行源的店铺、设施、公司的名称)登记在表T中,从而能够增加表T中登记的特定字符串的数量。
在步骤S130中,文件名生成部21从数据内字符串提取日期信息。也就是说,文件名生成部21提取能够判别为表示日期的字符串,作为日期信息,该字符串包含规定位数的数字、这样的数字和例如斜线“/”或汉字“年”、“月”、“日”等。在图2中,日期信息的提取(步骤S130)为在特定字符串的检索(步骤S120)之后执行的状态,但是这些步骤S120、S130的处理顺序既可以相反,也可以根据控制部11的处理能力同时实施。
后面,使用图4等对步骤S130的详细内容进行描述。
在步骤S140中,文件名生成部21使用步骤S120、S130的结果,生成在对步骤S100中获取的文档图像数据进行保存时附加的文件名。在这种情况下,文件名生成部21生成包含步骤120中利用检索从数据内字符串中检测到的特定字符串,和在步骤S130中从数据内字符串提取的日期信息的文件名。具体而言,文件名生成部21将特定字符串作为前缀,将日期信息作为后缀,生成用下划线“_”或连字符“-”等将这些特定字符串和日期信息连接的文件名。例如,当在步骤S120中利用检索从数据内字符串中检测到“发票(invoice)”作为特定字符串,并在步骤S130提取“09/30/17”作为日期信息时,能够生成所谓“发票(invoice)_2017/09/30”的文件名。
在步骤S150中,控制部11(显示控制部22)使在步骤S140中生成的文件名显示在显示部12上。
图3示出显示控制部22在步骤S150中使显示部12显示的文件保存设置画面40的一例。文件保存设置画面40包括原稿图像显示栏41、文件夹设置栏42、文件名输入栏43等。在原稿图像显示栏41中,显示基于在步骤S100中获取的文档图像数据的图像IM、即原稿,用户能够通过原稿图像显示栏41视觉辨认由扫描仪30读取的原稿。
文件夹设置栏42是用于对作为步骤S100中获取的文档图像数据的保存目的地的文件夹(例如,存储部15内的文件夹)进行设置的输入栏。用户能够通过操作操作受理部13等,在文件夹设置栏42中设置任意的文件夹(已有的文件夹或新创建的文件夹)。
文件名输入栏43是用于对附加到步骤S100中获取的文档图像数据的文件名进行设置的输入栏。用户能够通过操作操作受理部13等向文件名输入栏43字符输入任意的文件名,从而设置文件名。但是,在本实施方式中,如图3所示,显示控制部22在文件名输入栏43的附近显示文件名候选栏44。文件名候选栏44包括用于基于文件名的设置历史显示文件名的第一栏44a,和用于显示在步骤S140中生成的文件名的第二栏44b。在第一栏44a中,例如显示以前(最近)在文件名输入栏43中设置(在文件保存时实际采用为文件名)的文件名。在第二栏44b中,显示在步骤S140中生成的文件名,例如,如上所述的“发票(invoice)_2017/09/30”。
显示控制部22在文件名输入栏43中设置从文件名候选栏44选择的文件名。也就是说,用户通过进行从文件名候选栏44中选择文件名的操作(点击或轻敲显示在文件名候选栏44中的文件名等),能够在文件名输入栏43中设置该选择的文件名。
控制部11根据用户对文件保存设置画面40的输入,确定文件名(步骤S160)。具体而言,当检测到对文件保存设置画面40中的规定按钮(在
图3的示例中,为OK按钮45)的操作时,控制部11将该时间点在文件名输入栏43中设置的文件名确定为在步骤S100中获取的文档图像数据的文件名。即,用户通过在文件名候选栏44(第二栏44b)中视觉辨认在步骤S140中自动生成的文件名,将其选择并确认(按下OK按钮45),能够对扫描仪30读取的原稿的扫描数据(文档图像数据)附加文件名。
然后,控制部11将在步骤S100中获取的文档图像数据进行保存,作为附加了在步骤S160中确定的文件名的文件(步骤S170)。在这种情况下,在操作了上述规定按钮(OK按钮45)的时间点,将文件保存到在文件夹设置栏42中设置的文件夹中。这样的步骤S160及步骤S170几乎同时执行。至此,图2的流程图结束。
另外,显示控制部22在步骤S150中使显示部12显示的步骤S140中生成的文件名不限于一个。根据步骤S120中的特定字符串的检索结果,有时从数据内字符串中成功地检索多个特定字符串。因此,在步骤S140中,文件名生成部21针对在步骤S120中利用检索从数据内字符串中检测到的每个特定字符串,生成包含特定字符串的文件名。然后,在步骤S150中,能够显示包含各不相同的特定字符串的多个文件名。在图3的示例中,在文件名候选栏44(第二栏44b)中显示了两个文件名“发票(invoice)_2017/09/30”和“账单(bill)_2017/09/30”。这表示在步骤S120中,从数据内字符串中检测到所谓“发票(invoice)”和“账单(bill)”这两个特定字符串的事例。
根据步骤S120中的特定字符串的检索结果,有时不能从数据内字符串中检测到任一特定字符串。在这种情况下,文件名生成部21在步骤S140中不能生成包含了特定字符串的文件名,因此既可以不生成文件名,也可以生成不包含特定字符串但包含步骤S130中提取的日期信息的文件名。同样地,根据步骤S130中的日期信息的提取结果,有时不能从数据内字符串提取任一日期信息。在这种情况下,文件名生成部21在步骤S140中不能生成包含了日期信息的文件名,因此既可以不生成文件名,也可以生成不包含日期信息但包含了通过步骤S120的检索检测到的特定字符串的文件名。考虑到这种例外的事例,在步骤S150中,可能在文件名候选栏44的第二栏44b中,显示不包含日期信息但包含了特定字符串的文件名,或显示不包含特定字符串但包含了日期信息的文件名,或者不显示任一文件名。
3.步骤S130的详细内容:
图4通过流程图示出步骤S130的详细内容。在步骤S130中,控制部11首先执行从数据内字符串提取日期信息(步骤S131)。可以将根据程序A执行图4的流程图的控制部11称为日期信息提取部或发行日选择部等。
在步骤S132中,控制部11对步骤S131中从数据内字符串提取的日期信息应用预先设定的排除条件,将与排除条件相符的日期信息从日期信息中排除(在步骤S133及其以后的处理中不被视为日期信息)。可以考虑到各种排除条件,在本实施方式中,将与对期间进行限定的字符串(以下,为对期间进行限定用关键字)一起描述的情况作为排除条件中的一个。所谓期间限定用关键字,例如是“直到(until)”、“终止(expire)”、“之前(before)”等、对期间进行限定的意思的单词。在作为原稿的收据等中,除了原稿的发行日以外,经常还记载有例如与商品的活动、广告、积分的有效期限等有关的各种日期信息。而且,与原稿的发行日不相符的这些日期信息大多伴随着期限限定用关键字。
期间限定用关键字例如与上述特定字符串分开地预先登记在表T中。控制部11将在数据内字符串中与期间限定用关键字一起描述的日期信息从日期信息中排除。所谓在数据内字符串中与期间限定用关键字一起描述日期信息,是指例如期间限定用关键字和日期信息存在于数据内字符串的一行内或连续的二行内的情况等。
此外,在本实施方式中,将比在步骤S100中获取的文档图像数据的生成日期在后的日期信息作为排除条件的一个。例如,能够根据文档图像数据的属性信息来判别文档图像数据的生成日期时间。原稿在其被发行之后,由扫描仪30读取并生成文档图像数据。因此,指示比文档图像数据的生成日期时间在后的(将来的)日期的日期信息不可能与原稿的发行日相符。因此,控制部11将从数据内字符串提取的日期信息中比文档图像数据的生成日期时间在后的日期信息从日期信息中排除。
在步骤S133中,控制部11判定是否从数据内字符串提取了多个日期信息。也就是说,判定在步骤S131中从数据内字符串中成功提取的日期信息、即作为在步骤S132中应用了排除条件的结果未被排除而残留的日期信息是否存在多个。当在步骤S133中判定为从数据内字符串提取了多个日期信息时(步骤S133中为是),控制部11前进到步骤S134,当判定为未从数据内字符串提取多个日期信息时(步骤S133中为否),控制部11结束步骤S130(图4)。
在步骤S133中判定为“否”而完成步骤S130是指从数据内字符串提取一个日期信息的情况和不能从数据内字符串提取任一日期信息的情况中的任意一种情况。作为步骤S130的结果,当从数据内字符串提取了一个日期信息时,包含了该提取的日期信息的文件名被生成(步骤S140),并显示在显示部12上(步骤S150)。作为步骤S130的结果,不能从数据内字符串提取任一日期信息时的步骤S140及其以后的处理为如上所述。
在步骤S134中,控制部11判定从数据内字符串提取的多个日期信息中是否包含含有时刻信息的日期信息。如果在从数据内字符串提取的多个日期信息中存在这样的日期信息,即例如与能够从“09/30/17.08:28pm”那样使用符号和数字的组合等判别为时刻信息的字符串“08:28pm”一起(例如,在一行内或连续的二行内)描述的日期信息,则控制部11判定为存在包含时刻信息的日期信息(步骤S134中为是),前进到步骤S135。另一方面,当未判定为存在包含时刻信息的日期信息时(步骤S134中为否),前进到步骤S136。
在步骤S135中,控制部11选择从数据内字符串提取的多个日期信息中的、如上所述包含时刻信息的日期信息,并结束步骤S130(图4)。在原稿(例如,收据等)中,详细记载到时刻而不是日期的日期信息指示原稿的发行日的可能性非常高。因此,在本实施方式中,当能够从数据内字符串提取多个日期信息时,优先选择包含时刻信息的日期信息。步骤S135中日期信息的选择是确定步骤S130中的日期信息提取的处理。因此,当以步骤S135完成步骤S130时,步骤S135中选择的日期信息在步骤S140及其以后的步骤中视为在步骤S130中提取的日期信息。另外,在步骤S130中提取的日期信息即使是包含了时刻信息的日期信息,在步骤S150中,控制部11也不需要在显示部12显示时刻信息(参照图3的第二栏44b)。
当在从数据内字符串提取的多个日期信息中存在包含时刻信息的多个日期信息时,控制部11可以在步骤S135中选择所有这些包含时刻信息的多个日期信息。但是,鉴于在原稿中记载的多个日期信息中在先的日期信息很有可能是该原稿的发行日的实际情况,在步骤S135中,当从数据内字符串提取的多个日期信息中存在包含时刻信息的多个日期信息时,只要选择这些包含时刻信息的多个日期信息中、表示日期时间更在先的日期信息即可。
在步骤S136中(当未选择包含时刻信息的日期信息时),控制部11基于在步骤S100中获取的文档图像数据判别原稿的类型。基于文档图像数据的原稿类型的判别方法主要有两种。
一种是基于文档图像数据表示的原稿尺寸(原稿的纵横长度)的判别方法。原稿尺寸包含在文档图像数据的属性信息中。或者,即使在原稿尺寸未包含在文档图像数据的属性信息中的情况下,控制部11也能够基于文档图像数据的像素数和分辨率(每英寸的像素数)掌握原稿尺寸。当文档图像数据表示的原稿尺寸与规定的收据尺寸相符时,控制部11判别为原稿的类型是收据。在多数情况下,收据是相对较小且长条状的纸张,因此控制部11预先规定收据尺寸的范围(纵横各自的长度范围),当原稿尺寸与规定的收据尺寸的范围相符时,判别为原稿的类型是收据。
但是,当文档图像数据表示的原稿尺寸与所谓的信件尺寸相符时,控制部11判别为原稿的类型是第二种收据。上述收据尺寸的范围规定与信件尺寸不同尺寸的范围。因此,可以说,当原稿尺寸与上述收据尺寸的范围相符时,控制部11判别为原稿的类型是第一种收据,当原稿尺寸与信件尺寸相符时,控制部11判别为原稿的类型是第二种收据。顺便提及,作为第二种收据,可以设想酒店等住宿设施发行的收据。
基于文档图像数据的原稿类型的另一种判别方法是基于数据内字符串的判别方法。当从数据内字符串中成功地检索到例如所谓“宾馆(hotel)”一词或与其它住宿设施相关的规定关键字时,控制部11判别为原稿的类型是第二种收据。除此以外,控制部11根据数据内字符串中的上述特定字符串的检索结果,能够判别(推测)原稿的类型是第一种收据、账单或合同书等。
在步骤S137中,控制部11从自数据内字符串提取的多个日期信息中,根据在步骤S136中判别的原稿类型选择日期信息,并结束步骤S130(图4)。步骤S137中日期信息的选择也是确定步骤S130中日期信息提取的处理。因此,当以步骤S137完成步骤S130时,步骤S137中选择的日期信息在步骤S140及其以后的步骤中视为在步骤S130中提取的日期信息。
对步骤S137的具体示例进行说明。控制部11根据原稿的类型从自数据内字符串提取的多个日期信息中,选择在先的日期信息和在后的日期信息中的一个。当原稿的类型是收据(第一种收据)时,控制部11优先选择多个日期信息中在先的日期信息。这是因为,如上所述,有时在收据中记载有与商品的活动、广告、积分的有效期限等有关的日期(在收据的发行日之后的日期),避免选择比这种收据的发行日在后的日期。另一方面,当原稿的类型是第二种收据时,控制部11优先选择多个日期信息中在后的日期信息。这是因为,在住宿设施的收据中基本上记载有入住的日期信息和退房的日期信息,通过优先选择更在后的日期信息,能够选择实际发行原稿的日期、即退房的日期。另外,当在步骤S136中判别为原稿的类型与第一种收据和第二种收据中的任一种都不相符时,控制部11在步骤S137中只要优先选择多个日期信息中在先的日期信息即可。
从目前为止的说明可以看出,在完成步骤S130(图4)的时间点从数据内字符串提取的日期信息是很有可能表示原稿的发行日的日期信息。换言之,控制部11从数据内字符串中选择并提取表示原稿的发行日的日期信息。另外,当可从数据内字符串提取的日期信息为一个时(当在步骤S133中判定为“否”而完成步骤S130时),控制部11将该提取的日期信息视为原稿的发行日。因此,可以说,控制部11在步骤S130中通过从数据内字符串提取日期信息来选择原稿的发行日。此外,在完成步骤S130的时间点从数据内字符串提取的日期信息是与上述的排除条件(参照步骤S132)不相符的日期信息。也就是说,在步骤S130中,控制部11从最终提取的选择项中排除与期间限定用关键字一起描述的日期信息,此外,从最终提取的选择项中排除比文档图像数据的生成日期时间在后的日期信息。由此,能够避免选择与原稿发行日相符的可能性极低的不适当的日期信息作为原稿的发行日。步骤S132在图4的流程图中不是必须的,但执行该步骤,能够更适当地选择原稿的发行日。
4.总结:
如此,根据本实施方式,图像处理装置10包括控制部11,该控制部11获取通过读取原稿而生成的文档图像数据(步骤S100),并通过字符识别来识别文档图像数据中包含的字符串(数据内字符串)。控制部11从数据内字符串中检索预先登记在表T中的特定字符串(步骤S120),将包含了通过检索检测到的特定字符串的文件名作为文档图像数据的文件名显示在显示部12上(步骤S140、S150)。根据该结构,控制部11向用户呈现包含了通过上述检索检测到的特定字符串的文件名。因此,用户通过进行确认所呈现(显示在显示部12上)的文件名的规定操作,能够对文档图像数据设置适当的文件名。此外,根据该结构,不论原稿中文档的格式和原稿的尺寸如何,都呈现对于原稿而言适当的文件名(包含了特定字符串的文件名),能够大大减少用户的麻烦。
此外,根据本实施方式,例如“发票(invoice)”、“账单(bill)”、“合同(contract)”等设想包含在原稿(收据、账单、合同书等)的数据内字符串中的词语、即直接表示原稿类型的词语,或以前由用户输入作为文件名的字符串登记在表T中作为特定字符串。其结果,控制部11通过从数据内字符串中检索特定字符串,能够向用户呈现反映了原稿类型和以前用户对文件命名倾向的适当的文件名,使对于文档图像数据的适当的命名变得容易。此外,通过将反映了这种原稿类型和以前用户对文件命名的倾向的适当的文件名附加于文档图像数据并进行保存,以后用户在检索已保存在存储部15等中的文件时,能够容易地找到所期望的文件。
此外,根据本实施方式,控制部11从数据内字符串提取日期信息(步骤S130),使显示的文件名包含该提取的日期信息(步骤S140、S150)。根据该结构,控制部11向用户呈现不仅包括从数据内字符串中通过上述检索而检测到的特定字符串,还包括从数据内字符串提取的日期信息即原稿的发行日的更适当的文件名,能够使对文档图像数据的命名变得容易。
进一步地,根据本实施方式,在控制部11执行的步骤S130中,当从数据内字符串提取了多个日期信息时,选择多个日期信息中的包含时刻信息的日期信息作为原稿的发行日。也就是说,当从数据内字符串提取了多个日期信息时(步骤S133中为是),控制部11从多个日期信息中选择上述发行日。此时,作为优先事项,当多个日期信息中包含含有时刻信息的日期信息时(步骤S134中为是),选择包含时刻信息的日期信息(步骤S135)。由此,在从数据内字符串提取了多个日期信息时,能够选择与原稿发行日相符的可能性相对较高的日期信息作为原稿的发行日。
此外,根据本实施方式,当未选择包含时刻信息的日期信息时(步骤S134中为否),控制部11基于文档图像数据判别原稿的类型(步骤S136),并根据原稿的类型从上述多个日期信息中选择日期信息(步骤S137)。由此,即使在从数据内字符串提取了的多个日期信息中不存在包含时刻信息的日期信息,或者即使存在包含时刻信息的日期信息也与上述排除条件相符的情况下,也能够根据原稿的类型从多个日期信息中适当地选择原稿的发行日。
5.变形例:
本实施方式不限于上述方式,还可以包括各种变形例。以下,对本实施方式中包含的多个变形例进行说明。
图5A示出步骤S120(图2)的一个变形例。此外,图5B示出步骤S120(图2)的另一变形例。在图5A的示例中,步骤S120包括步骤S121、S122、S123的各个步骤。此外,在图5B的示例中,步骤S120包括步骤S121、S123的各个步骤。步骤S121是与目前为止说明的步骤S120相同的处理。
在图5A的示例中,控制部11在执行步骤S121之后,根据步骤S121中的特定字符串的检索结果、即是否能够从数据内字符串中检测到特定字符串来进行分支处理(步骤S122)。也就是说,当能够从数据内字符串中检测到一个以上的特定字符串时(步骤S122中为是),控制部11结束步骤S120,前进到下一步骤(在图2的示例中为步骤S130)。另一方面,当不能从数据内字符串中检测到任一特定字符串时(步骤S122中为否),控制部11前进到步骤S123,并在完成步骤S120之后,前进到下一步骤(在图2的示例中为步骤S130)。
在步骤S123中,控制部11基于原稿尺寸确定表示原稿的类型的字符串。如上所述,控制部11能够基于文档图像数据掌握原稿尺寸。当原稿尺寸与上述收据尺寸的范围相符时,控制部11将例如“收据(recept)”这样的字符串确定为表示原稿的类型(第一种收据)的字符串。此外,当原稿尺寸与信件尺寸相符时,将例如“宾馆收据(hotel receipt)”这样的字符串确定为表示原稿的类型(第二种收据)的字符串。此外,当原稿尺寸与规定的名片尺寸相符时,控制部11将例如“名片(name card)”这样的字符串确定为表示原稿的类型(名片)的字符串。如此,在步骤S123中,控制部11根据规定的策略(例如,预先确定的原稿尺寸与字符串的对应关系),确定表示从原稿尺寸推测的原稿类型的字符串。
如上所述,在步骤S140(图2)中,控制部11使用步骤S120、S130的结果,生成在对步骤S100中获取的文档图像数据进行保存时附加的文件名。
在执行图5A所示的步骤S120的结构中,当在步骤S121中从数据内字符串中成功地检索特定字符串时,控制部11在步骤S140中,生成包含了通过步骤S121的检索从数据内字符串中检测到的特定字符串的文件名。然后,在步骤S150中,显示包含了特定字符串的文件名。另一方面,当在步骤S121中不能从数据内字符串中检测到特定字符串时,在步骤S140中,生成包含了在步骤S123中基于原稿尺寸确定的字符串的文件名,并且在步骤S150中,显示包含了基于原稿尺寸确定的字符串的文件名。
在图5B的示例中,控制部11执行步骤S121、S123这两者。因此,在执行图5B所示的步骤S120的结构中,当在步骤S121中从数据内字符串中成功地检索特定字符串时,控制部11在步骤S140中,生成包含了通过步骤S121的检索从数据内字符串中检测到的特定字符串的文件名。进一步地,与在步骤S121中是否从数据内字符串中成功地检索特定字符串无关,控制部11在步骤S140中也生成包含了在步骤S123中基于原稿尺寸确定的字符串的文件名。其结果,基本上在步骤S150中,显示包含了特定字符串的文件名和包含了基于原稿尺寸确定的字符串的文件名。
根据图5A的示例,即使未从数据内字符串中成功地检索特定字符串,控制部11也能够在保存文档图像数据时向用户呈现适当的文件名。此外,根据图5B的示例,控制部11能够在保存文档图像数据时向用户呈现更多适当的文件名的选择项。
到目前为止,步骤S130(图4)作为图2的流程图的一部分、即对文档图像数据附加文件名而进行保存的过程的一部分进行了说明。然而,步骤S130(图4)中说明的内容也可以通过与图2的流程图分开来理解。例如,对于通过步骤S130确定为原稿的发行日的日期信息,控制部11也可以将其显示在显示部12上作为原稿的发行日(Issue date)。
图6通过流程图示出控制部11根据程序A执行的作为本实施方式的一个变形例的发行日确定显示处理。
步骤S200、S210、S220是与目前为止说明的步骤S100、S110、S130相同的处理,因此省略其说明。
在步骤S230中,控制部11将通过步骤S220(=S130,图4)提取的日期信息(选择作为原稿的发行日的日期信息)显示在显示部12上作为原稿的发行日(issue date)。
图7示出控制部11(显示控制部22)在步骤S230中显示在显示部12上的扫描数据管理画面50的一例。在图7的示例中,扫描数据管理画面50在画面的左侧包含原稿图像显示栏51。在原稿图像显示栏51中,显示基于在步骤S200中获取的文档图像数据的图像IM2、即原稿(例如,收据),用户可以通过原稿图像显示栏51视觉辨认扫描仪30读取的原稿。此外,在图7的示例中,扫描数据管理画面50在画面的右侧包含多个设置输入栏。用户可以对各设置输入栏进行基于原稿内容的输入。
在显示这种扫描数据管理画面50的情况下,控制部11使在步骤S220中确定为原稿的发行日的日期信息显示在作为多个设置输入栏中的一个的发行日输入栏52中。在图7的示例中,并不是在原稿图像显示栏51中显示整个原稿,而是如附图标记D1、D2所示,在原稿的各位置存在日期信息。其中,日期信息D2伴随有期间限定用关键字“终止(expire)”,因此作为步骤S220(=S130,图4)的结果,日期信息D2不会被提取为日期信息(不会被选择为原稿的发行日)。另一方面,日期信息D1包含时刻信息,因此作为步骤S220(=S130,图4)的结果,日期信息D1被提取为日期信息(被选择为原稿的发行日)。因此,在图7的示例中,“2017/09/30”这一日期自动地显示在发行日输入栏52中,作为原稿的发行日。
例如,当从用户接收到用于结束对于扫描数据管理画面50的设置输入的规定操作时,控制部11将扫描数据管理画面50的各设置输入栏中当前的设置内容与在步骤S200中获取的文档图像数据一起保存(步骤S240),关闭扫描数据管理画面50,结束图6的流程图。用户能够通过再次打开扫描数据管理画面50对与文档图像数据一起保存的设置内容进行随时编辑。
另外,图3和图7仅示出文件名和原稿的发行日在步骤S150(图2)和步骤S230(图6)中的显示状态的一例。步骤S150(图2)和步骤S230(图6)中的显示状态,例如显示部12所显示的画面上的布局或设计、显示部12所显示的画面的目的或作用是各样的。
进一步地,本实施方式的文件名的生成、显示的方法也能够应用于用于保存文件的文件夹的文件夹名的生成、显示。也就是说,控制部11从数据内字符串中检索预先登记的特定字符串,使包含了通过检索检测到的特定字符串的文件夹名显示在显示部12(例如,在文件夹设置栏42的附近)上,作为文档图像数据的保存目标地的文件夹名。此外,控制部11也可以从数据内字符串提取日期信息,并使上述提取的日期信息包含在上述显示的文件夹名中。用户通过如此选择显示在显示部12上的文件夹名,能够在将文档图像数据进行文件保存时容易地确定保存目标地的文件夹(新创建的文件夹)的文件夹名。
Claims (10)
1.一种图像处理装置,其特征在于,包括:
控制部,获取通过读取原稿而生成的文档图像数据,并通过字符识别来识别所述文档图像数据中包含的字符串,
当从所述字符串提取到多个日期信息时,所述控制部选择所述多个日期信息中包含时刻信息的日期信息作为所述原稿的发行日。
2.根据权利要求1所述的图像处理装置,其特征在于,
当未提取到包含时刻信息的日期信息时,所述控制部基于所述文档图像数据判别所述原稿的类型,并根据所述原稿的类型从所述多个日期信息中选择作为所述原稿的发行日的日期信息。
3.根据权利要求2所述的图像处理装置,其特征在于,
所述控制部基于所述文档图像数据中包含的字符串,判别所述原稿的类型。
4.根据权利要求2所述的图像处理装置,其特征在于,
所述控制部基于所述文档图像数据表示的所述原稿的尺寸,判别所述原稿的类型。
5.根据权利要求2至4中任一项所述的图像处理装置,其特征在于,
当所述原稿的类型是收据时,所述控制部优先选择所述多个日期信息中在先的日期信息。
6.根据权利要求2至5中任一项所述的图像处理装置,其特征在于,
当所述原稿的类型是住宿设施的收据时,所述控制部优先选择所述多个日期信息中在后的日期信息。
7.根据权利要求1至6中任一项所述的图像处理装置,其特征在于,
所述控制部不提取与对期间进行限定的字符串一起描述的日期信息。
8.根据权利要求1至7中任一项所述的图像处理装置,其特征在于,
所述控制部不提取比所述文档图像数据的生成日期更在后的日期信息。
9.根据权利要求1至8中任一项所述的图像处理装置,其特征在于,
所述控制部将包含所述发行日的文件名作为所述文档图像数据的文件名显示于显示部。
10.一种存储介质,其特征在于,
存储图像处理程序,所述图像处理程序用于使计算机执行对通过读取原稿而生成的文档图像数据的处理,
所述图像处理程序执行通过字符识别来识别所述文档图像数据中包含的字符串的控制功能,
当从所述字符串提取到多个日期信息时,所述控制功能选择所述多个日期信息中的包含时刻信息的日期信息作为所述原稿的发行日。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017-249294 | 2017-12-26 | ||
JP2017249294A JP7040000B2 (ja) | 2017-12-26 | 2017-12-26 | 画像処理装置および画像処理プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109960684A true CN109960684A (zh) | 2019-07-02 |
Family
ID=65013507
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811591937.5A Pending CN109960684A (zh) | 2017-12-26 | 2018-12-25 | 图像处理装置及存储介质 |
Country Status (4)
Country | Link |
---|---|
US (2) | US10936896B2 (zh) |
EP (1) | EP3506155A1 (zh) |
JP (1) | JP7040000B2 (zh) |
CN (1) | CN109960684A (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11030450B2 (en) * | 2018-05-31 | 2021-06-08 | Vatbox, Ltd. | System and method for determining originality of computer-generated images |
JP7447614B2 (ja) | 2020-03-27 | 2024-03-12 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置 |
JP2022096218A (ja) * | 2020-12-17 | 2022-06-29 | キヤノン株式会社 | 情報処理装置、情報処理システム、その制御方法及びプログラム |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050195446A1 (en) * | 2004-02-25 | 2005-09-08 | Kiyoshi Kasatani | Multi-function image forming apparatus with improved scan-to-email function |
JP2008071050A (ja) * | 2006-09-13 | 2008-03-27 | Sharp Corp | 情報処理端末装置、情報処理装置、ファイル管理サーバ、情報処理システム、ファイル名自動生成方法、プログラムおよび記録媒体 |
CN101430696A (zh) * | 2004-06-25 | 2009-05-13 | 苹果公司 | 用于搜索和存储数据的方法和系统 |
US20140093170A1 (en) * | 2007-12-12 | 2014-04-03 | Yoshihisa Ohguro | Document processing device, image processing apparatus, document processing method and computer program product |
US20170351913A1 (en) * | 2016-06-07 | 2017-12-07 | The Neat Company, Inc. d/b/a Neatreceipts, Inc. | Document Field Detection And Parsing |
US20180176405A1 (en) * | 2014-08-28 | 2018-06-21 | Canon Kabushiki Kaisha | Information processing apparatus, method of controlling the same, and storage medium |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6212504B1 (en) * | 1998-01-12 | 2001-04-03 | Unisys Corporation | Self-authentication of value documents using encoded indices |
JP3084490U (ja) | 2001-09-04 | 2002-03-22 | 日本エヌ・シー・アール株式会社 | 特典情報が印字されたレシート |
US20150012339A1 (en) * | 2004-06-01 | 2015-01-08 | Daniel W. Onischuk | Computerized voting system |
JP2007148569A (ja) | 2005-11-24 | 2007-06-14 | Canon Inc | 情報処理装置及びその制御方法、プログラム、記憶媒体 |
JP2011118513A (ja) | 2009-12-01 | 2011-06-16 | Toshiba Corp | 文字認識装置および帳票識別方法 |
US20140257996A1 (en) | 2013-03-08 | 2014-09-11 | Lg Cns Co., Ltd. | Financial Apparatus, Method and System for Receiving and Refunding Fees |
JP6268352B2 (ja) | 2013-12-17 | 2018-01-31 | 株式会社日本デジタル研究所 | 会計データ入力システム、方法、およびプログラム |
JP2016035690A (ja) | 2014-08-04 | 2016-03-17 | 大日本印刷株式会社 | 調査システム、調査方法、サーバ、ユーザ端末、プログラム、記録媒体 |
JP6482361B2 (ja) * | 2015-04-09 | 2019-03-13 | キヤノン株式会社 | 原稿読取装置、原稿読取装置の制御方法、プログラム、及び記憶媒体 |
-
2017
- 2017-12-26 JP JP2017249294A patent/JP7040000B2/ja active Active
-
2018
- 2018-12-19 US US16/226,034 patent/US10936896B2/en active Active
- 2018-12-24 EP EP18215839.4A patent/EP3506155A1/en not_active Ceased
- 2018-12-25 CN CN201811591937.5A patent/CN109960684A/zh active Pending
-
2021
- 2021-01-20 US US17/248,322 patent/US11749008B2/en active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050195446A1 (en) * | 2004-02-25 | 2005-09-08 | Kiyoshi Kasatani | Multi-function image forming apparatus with improved scan-to-email function |
CN101430696A (zh) * | 2004-06-25 | 2009-05-13 | 苹果公司 | 用于搜索和存储数据的方法和系统 |
JP2008071050A (ja) * | 2006-09-13 | 2008-03-27 | Sharp Corp | 情報処理端末装置、情報処理装置、ファイル管理サーバ、情報処理システム、ファイル名自動生成方法、プログラムおよび記録媒体 |
US20140093170A1 (en) * | 2007-12-12 | 2014-04-03 | Yoshihisa Ohguro | Document processing device, image processing apparatus, document processing method and computer program product |
CN103873719A (zh) * | 2012-12-07 | 2014-06-18 | 株式会社理光 | 文档处理设备、图像处理装置和文档处理方法 |
US20180176405A1 (en) * | 2014-08-28 | 2018-06-21 | Canon Kabushiki Kaisha | Information processing apparatus, method of controlling the same, and storage medium |
US20170351913A1 (en) * | 2016-06-07 | 2017-12-07 | The Neat Company, Inc. d/b/a Neatreceipts, Inc. | Document Field Detection And Parsing |
Also Published As
Publication number | Publication date |
---|---|
US11749008B2 (en) | 2023-09-05 |
US20190197337A1 (en) | 2019-06-27 |
JP2019114193A (ja) | 2019-07-11 |
US10936896B2 (en) | 2021-03-02 |
US20210142094A1 (en) | 2021-05-13 |
JP7040000B2 (ja) | 2022-03-23 |
EP3506155A1 (en) | 2019-07-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109961069B (zh) | 图像处理装置以及存储介质 | |
US8069173B2 (en) | Information processing apparatus and method of controlling the same, information processing method, and computer program | |
JP4118349B2 (ja) | 文書選択等の方法及び文書サーバ | |
CN101178725B (zh) | 用于信息检索的设备和方法 | |
JP2008276766A (ja) | フォーム自動埋込方法及び装置 | |
EP3543912A1 (en) | Image processing device, image processing method, and image processing program | |
JP2007286864A (ja) | 画像処理装置、画像処理方法、プログラムおよび記録媒体 | |
JP2006085733A (ja) | ファイリング・検索装置およびファイリング・検索方法 | |
CN109960684A (zh) | 图像处理装置及存储介质 | |
US9442677B2 (en) | Access of a digital version of a file based on a printed version of the file | |
US20060206447A1 (en) | Document managing apparatus | |
JP7131137B2 (ja) | 画像処理装置および画像処理プログラム | |
US11797551B2 (en) | Document retrieval apparatus, document retrieval system, document retrieval program, and document retrieval method | |
CN110097040B (zh) | 图像处理装置以及存储介质 | |
US20060206499A1 (en) | Document managing apparatus | |
KR20060116114A (ko) | 광학 문자 판독을 이용한 문서 검색 및 텍스트 정보 추출시스템 및 그 방법 | |
US8463804B2 (en) | File processing apparatus operating a file based on previous execution history of the file | |
JP7331551B2 (ja) | 情報処理装置及び情報処理プログラム | |
US20160364458A1 (en) | Methods and Systems for Using Field Characteristics to Index, Search For, and Retrieve Forms | |
CN114611475A (zh) | 信息处理装置、信息处理方法和计算机可读介质 | |
JP2008176625A (ja) | 文字認識結果の管理装置およびその方法並びにコンピュータプログラム | |
JP7456580B2 (ja) | 情報処理装置、情報処理システム及び情報処理方法 | |
JP2003316802A (ja) | イメージ管理システム、イメージ管理方法及びイメージ管理プログラム | |
US11481447B2 (en) | Information processing device and non-transitory computer readable medium | |
US20150074005A1 (en) | Method and apparatus for facilitating patent searching |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |