CN112615970B - 控制设置元数据的画面的显示的方法、存储介质及设备 - Google Patents

控制设置元数据的画面的显示的方法、存储介质及设备 Download PDF

Info

Publication number
CN112615970B
CN112615970B CN202011074932.2A CN202011074932A CN112615970B CN 112615970 B CN112615970 B CN 112615970B CN 202011074932 A CN202011074932 A CN 202011074932A CN 112615970 B CN112615970 B CN 112615970B
Authority
CN
China
Prior art keywords
metadata
screen
character string
displayed
cpu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011074932.2A
Other languages
English (en)
Other versions
CN112615970A (zh
Inventor
中村峻
奥田拓洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Publication of CN112615970A publication Critical patent/CN112615970A/zh
Application granted granted Critical
Publication of CN112615970B publication Critical patent/CN112615970B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00095Systems or arrangements for the transmission of the picture signal
    • H04N1/00114Systems or arrangements for the transmission of the picture signal with transmission of additional information signals
    • H04N1/00122Systems or arrangements for the transmission of the picture signal with transmission of additional information signals of text or character information only
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/32101Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N1/32128Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title attached to the image data, e.g. file header, transmitted message header, information on the same page or in the same computer file as the image
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00352Input means
    • H04N1/00384Key input means, e.g. buttons or keypads
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • G06V10/225Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition based on a marking or identifier characterising the area
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • G06V10/235Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition based on user input or interaction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00204Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server
    • H04N1/00244Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server with a server, e.g. an internet server
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00352Input means
    • H04N1/00355Mark-sheet input
    • H04N1/00358Type of the scanned marks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00352Input means
    • H04N1/00355Mark-sheet input
    • H04N1/00358Type of the scanned marks
    • H04N1/0036Alphanumeric symbols
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00352Input means
    • H04N1/00384Key input means, e.g. buttons or keypads
    • H04N1/00389Programmable function keys, e.g. for one-touch operation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00352Input means
    • H04N1/00395Arrangements for reducing operator input
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00405Output means
    • H04N1/00408Display of information to the user, e.g. menus
    • H04N1/00411Display of information to the user, e.g. menus the display also being used for user input, e.g. touch screen
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00405Output means
    • H04N1/00408Display of information to the user, e.g. menus
    • H04N1/00413Display of information to the user, e.g. menus using menus, i.e. presenting the user with a plurality of selectable options
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00405Output means
    • H04N1/00408Display of information to the user, e.g. menus
    • H04N1/00413Display of information to the user, e.g. menus using menus, i.e. presenting the user with a plurality of selectable options
    • H04N1/00437Intelligent menus, e.g. anticipating user selections
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/0077Types of the still picture apparatus
    • H04N2201/0094Multifunctional device, i.e. a device capable of all of reading, reproducing, copying, facsimile transception, file transception

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Computing Systems (AREA)
  • Facsimiles In General (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明提供了控制设置元数据的画面的显示的方法、存储介质及设备。基于从多个元数据模板中确定的一个元数据模板,来显示包括扫描图像、所确定的一个元数据模板中定义的多个键、以及各自与所述多个键中的不同键相对应的值输入栏,以及在用户选择画面中显示的多个键中的任一个键的情况下,在扫描图像上、以被判断为与对应于键的值的数据格式匹配的字符串区域能够被识别为值候选的方式显示该字符串区域。

Description

控制设置元数据的画面的显示的方法、存储介质及设备
技术领域
本公开涉及用于使用从通过扫描获得的图像数据提取的字符信息将元数据设置到图像数据的技术。
背景技术
通常,已经存在用于通过对经由扫描文档获取的图像数据进行光学字符识别(OCR)处理而从该文档提取数字数据中的字符串的技术。也已经存在用于通过将图像数据划分成针对各元素(诸如图像数据中的字符串和背景等)的区域块来识别图像数据的结构的技术。
另一方面,图像处理设备可以在将通过扫描获取的图像数据传输到后续系统之前将要由后续系统使用的额外信息(元数据)附加至图像数据。要附加的元数据的类型取决于接收图像数据的系统。例如,当扫描表格(例如收据)并将该表格传输至记账系统时,图像处理设备可以对要被用于记账处理的信息(例如,金额)进行字符识别处理以获取元数据,将该元数据附加至该表格的图像数据,然后传输表格图像数据。
日本特开2017-194953公开了一种用于确定收据图像上的价格数据的位置、强调显示预览图像上的用户可选位置并且提示用户选择该位置的技术。
根据日本特开2017-194953所公开的技术,用户可以容易地从表格的图像数据中所包括的字符串块中选择要作为元数据被附加至该图像数据的价格数据。
然而,日本特开2017-194953所公开的技术无法使用户容易地选择图像数据上除了价格数据以外的数据并将价格数据设置为元数据。
发明内容
根据本公开的一个方面,一种用于控制画面的显示的方法,所述画面用于将元数据设置到扫描图像,所述方法包括:基于从用于定义要被用作元数据的多个键和与各个键相对应的值的数据格式的多个元数据模板中确定的一个元数据模板,来显示包括所述扫描图像、所确定的一个元数据模板中定义的多个键、以及各自与所述多个键中的不同键相对应的值输入栏的画面;在用户选择所述画面中显示的所述多个键中的任一个键的情况下,在所述画面中的所述扫描图像上、以使得被判断为与数据格式匹配的字符串区域能够被识别为候选的方式显示该字符串区域,所述判断是基于与所确定的一个元数据模板中定义的所选择的键相对应的值的数据格式来进行的;以及在用户选择所显示的能够被识别为候选的所述字符串区域中的任一个字符串区域的情况下,将所选择的字符串区域的字符识别结果设置在所述画面中的与所选择的键相对应的值输入栏中。
一种存储有程序的非暂时性计算机可读存储介质,所述程序用于使处理器进行以下处理:基于从用于定义要被用作元数据的多个键和与各个键相对应的值的数据格式的多个元数据模板中确定的一个元数据模板,来显示包括扫描图像、所确定的一个元数据模板中定义的多个键、以及各自与所述多个键中的不同键相对应的值输入栏的画面;在用户选择所述画面中显示的所述多个键中的任一个键的情况下,在所述画面中的所述扫描图像上、以使得被判断为与数据格式匹配的字符串区域能够被识别为候选的方式显示该字符串区域,所述判断是基于与所确定的一个元数据模板中定义的所选择的键相对应的值的数据格式来进行的;以及在用户选择所显示的能够被识别为候选的所述字符串区域中的任一个字符串区域的情况下,将所选择的字符串区域的字符识别结果设置在所述画面中的与所选择的键相对应的值输入栏中。
一种用于控制画面的显示的设备,所述画面用于将元数据设置到扫描图像,所述设备进行:基于从用于定义要被用作元数据的多个键和与各个键相对应的值的数据格式的多个元数据模板中确定的一个元数据模板,来显示包括所述扫描图像、所确定的一个元数据模板中定义的多个键、以及各自与所述多个键中的不同键相对应的值输入栏的画面;在用户选择所述画面中显示的所述多个键中的任一个键的情况下,在所述画面中的所述扫描图像上、以使得被判断为与数据格式匹配的字符串区域能够被识别为候选的方式显示该字符串区域,所述判断是基于与所确定的一个元数据模板中定义的所选择的键相对应的值的数据格式来进行的;以及在用户选择所显示的能够被识别为候选的所述字符串区域中的任一个字符串区域的情况下,将所选择的字符串区域的字符识别结果设置在所述画面中的与所选择的键相对应的值输入栏中。
通过以下参考附图对典型实施例的描述,本发明的其它特征将变得明显。
附图说明
图1是示出图像处理系统的示例结构的图。
图2是示出图像形成设备的示例结构的图。
图3A和图3B是各自示出构成图像处理系统的服务器的示例结构的图。
图4是示出图像形成设备的操作单元的示例结构的图。
图5是示出图像处理系统的整体处理过程的流程图。
图6是示出由图像处理服务器进行的处理过程的流程图。
图7是示出在图像形成设备的操作单元上显示的画面的示例的图。
图8是示出由图像形成设备执行的处理过程的流程图。
图9是示出在图像形成设备的操作单元上显示的画面的示例的图。
图10A和图10B是示出在图像形成设备的操作单元上显示的画面的示例的图。
图11是示出由图像形成设备进行的处理过程的流程图。
图12是示出由图像形成设备进行的处理过程的流程图。
图13A和图13B是示出在图像形成设备的操作单元上显示的画面的示例的图。
图14A和图14B是示出在图像形成设备的操作单元上显示的画面的示例的图。
图15A和图15B是示出在图像形成设备的操作单元上显示的画面的示例的图。
图16A和图16B是示出在图像形成设备的操作单元上显示的画面的示例的图。
图17是示出在图像形成设备的操作单元上显示的画面的示例的图。
图18A和图18B是示出在图像形成设备的操作单元上显示的画面的示例的图。
图19是示出由图像形成设备进行的处理过程的流程图。
图20是示出在图像形成设备的操作单元上显示的画面的示例的图。
图21是示出图像处理系统进行的整体处理过程的流程图。
图22是示出图像形成设备进行的处理过程的流程图。
图23是示出在图像形成设备的操作单元上显示的画面的示例的图。
图24是示出由图像处理服务器进行的处理过程的流程图。
图25是示出由图像形成设备进行的处理过程的流程图。
图26A和图26B是示出在图像形成设备的操作单元上显示的画面的示例的图。
具体实施方式
图1是示出图像形成系统的示例结构的图。图像形成系统包括经由网络106彼此连接以相互通信的图像形成设备101和102、信息处理终端103和104、图像处理服务器105、以及存储服务器107。
虽然图1示出图像形成系统包括两个图像形成设备(即图像形成设备101和102)的情况,但是图像形成设备的数量并不限于此,而是可以为任意数量(一个或多个)。下文将描述代表图像形成设备101和102的图像形成设备101的结构,并且将省略关于图像形成设备102的冗余描述。网络106可以是能够使图像形成系统中的设备相互通信的任意类型的诸如局域网(LAN)和因特网等的网络。
图像形成设备101能够从信息处理终端103和104接收图像数据打印请求(打印数据),打印图像数据,通过图像形成设备101上的扫描仪读取图像数据,以及打印由扫描仪读取的图像数据。图像形成设备101还能够存储从信息处理终端103和104接收到的打印数据,并且将由图像形成设备101的扫描仪读取的图像传输至信息处理终端103和104。图像形成设备101进一步能够将图像数据传输至图像处理服务器105以请求图像处理,并且打印被存储在存储服务器107中的文档。图像形成设备101还能够实现诸如多功能外围设备(MFP)等的已知的图像形成设备的功能。
图像处理服务器105能够进行图像形成设备101所请求的图像处理,传输由图像处理生成的图像数据,以及请求存储服务器107存储图像数据。虽然图1示出图像形成系统包括两种服务器(即图像处理服务器105和存储服务器107)各一个的情况,但是图像处理服务器105的数量和存储服务器107的数量并不限于此,而是可以为任意数量(一个或多个)。这两种服务器根据应用可以具有不同作用。在本结构中,图像处理服务器105和存储服务器107可以被配置在云(即因特网)上。
图2是示出图像形成设备101的硬件结构的示例的图。图像形成设备101包括控制器201、打印机202、扫描仪203和操作单元204。控制器201包括中央处理单元(CPU)211、随机存取存储器(RAM)212、硬盘驱动器(HDD)213、网络接口(I/F)214、打印机I/F 215、扫描仪I/F 216、操作单元I/F 217、以及扩展I/F 218。CPU 211能够传递数据至RAM 212、HDD 213、网络I/F 214、打印机I/F 215、扫描仪I/F 216、操作单元I/F 217、以及扩展I/F 218,以及从RAM 212、HDD 213、网络I/F 214、打印机I/F 215、扫描仪I/F 216、操作单元I/F 217、以及扩展I/F 218接收数据。CPU 211还将从HDD 213读取的指令(程序)加载到RAM 212中,并且执行被加载到RAM 212中的指令。
HDD 213能够存储可以由CPU 211执行的指令(程序)、图像形成设备101使用的设置值、与用户所请求的处理相关的数据。RAM 212是用于暂时地存储由CPU 211从HDD 213读取的指令的区域。RAM 212还能够存储要被用于执行指令的各种类型的数据。例如,CPU 211能够通过将输入数据加载到RAM 212中来进行图像处理。
网络I/F 214是用于与图像形成系统中的设备进行网络通信的接口。网络I/F 214能够向CPU 211通知数据接收,并且将被加载到RAM 212上的数据传输至网络106。打印机I/F 215能够将从CPU 211接收到的打印数据传输至打印机202,并且将从打印机202接收到的打印机状态传输至CPU 211。扫描仪I/F 216能够将从CPU 211传输的图像读取指示传输至扫描仪203,将从扫描仪203接收到的图像数据传输至CPU 211,并且将从扫描仪203接收到的扫描仪状态传输至CPU 211.操作单元I/F 217能够将从操作单元204输入的用户指示传输至CPU 211,并且将与要由用户操作的画面有关的信息传输至操作单元204。扩展I/F 218是用于将外部装置连接至图像形成设备101的接口。扩展I/F 218具有例如通用串行总线(USB)格式接口。当诸如USB存储器等的外部存储装置被连接至扩展I/F 218时,图像形成设备101能够读取被存储在外部存储装置中的数据,以及将数据写入外部存储装置。
打印机202能够将从打印机I/F 215接收到的图像数据打印在纸张上,并将打印机202的状态传输至打印机I/F 215。扫描仪203能够根据从扫描仪I/F 216接收到的图像读取指示来读取放置于原稿定位板或自动原稿进给器(ADF)上的纸张上所打印的信息,数字化该信息,并且将该信息传输至扫描仪I/F 216。扫描仪203能够将原稿定位板的状态传输至扫描仪I/F 216。操作单元204是能够使用户向图像形成设备101发出各种指示的接口。例如,操作单元204具有带触摸板的液晶显示器(LCD)画面,向用户显示操作画面,以及接收来自用户的操作。将在下文详细描述操作单元204。
图3A是示出图像处理服务器105的结构的图。图像处理服务器105包括CPU 301、RAM 302、HDD 303和网络I/F 304。CPU 301能够控制整体设备,并且控制到RAM 302、HDD303和网络I/F 304的数据传输,以及来自RAM 302、HDD 303和网络I/F 304的数据接收。CPU301读取来自HDD 303的控制程序(指令),将控制程序加载到RAM 302中,并且执行被存储在RAM 302中的指令。图像处理服务器105能够对经由网络I/F 304从图像形成设备101接收到的图像数据进行图像处理。能够由图像处理服务器105执行的图像处理包括对图像数据的光学字符识别(OCR)处理和块划分处理,该块划分处理用于将图像数据划分成针对各元素(诸如图像数据中的字符串和背景等)的区域块。
图3B是示出存储服务器107的结构的图。存储服务器107包括CPU 311、RAM 312、HDD 313和网络I/F 314。CPU 311能够控制到RAM 312、HDD 313和网络I/F 314的数据传输,以及来自RAM 312、HDD 313和网络I/F 314的数据接收。CPU 311还从HDD 313读取控制程序(指令),将控制程序加载到RAN 312中,并且执行被存储在RAM 312中的指令。HDD 313能够累积经由网络I/F 304从图像处理服务器105接收到的图像数据。存储服务器107能够在将元数据模板和与元数据模板相关联的元数据附加至图像数据之后将接收到的图像数据存储在HDD 313中。元数据模板是指要被附加至图像数据的元数据的键类型和值类型(值的数据格式)的定义。元数据模板能够针对表格的各个使用目的来预设。表1和表2示出能够针对图像数据而设置的元数据模板的示例。
[表1]
[表2]
文档类型选项 预估单 发货单 订货单
表1示出两个不同的元数据模板和各个元数据的内容。表1所示的示例根据使用目的包括两个不同的元数据模板“记账”和“法务”。能够针对各个元数据模板设置不同的元数据键类型。参考表1中所示的示例,在设置元数据模板“记账”的情况下,例如,可以针对元数据键类型设置“对象编号”、“到期日”、“总额”和“文档类型”。另一方面,在设置元数据模板“法务”的情况下,例如,可以针对元数据键类型设置“对象编号”、“客户”和“日期”。将在下文中描述设置元数据模板“记账”的示例情况。要被附加至表格图像的元数据包括元数据键和元数据值。元数据项名称可以被设置到要被附加至表格图像的元数据键,并且相应地,在元数据模板中定义的键类型被设置到元数据键。与元数据键相对应的值能够从表格图像中提取并且被设置到元数据值。基于元数据模板针对元数据值定义类型(数据格式),并且与值类型相对应的数据被设置到元数据值。值类型的示例包括文本型、日期型、数值型和选择型。文本型表示任意字符串。日期型表示具有日期格式的字符串。数值型表示代表数字或金额的字符串。选择型表示由用户从预定选项中选择的数据。
参考表1中示出的示例,在选择元数据模板“记账”的情况中,“对象编号”作为元数据键被包括在元数据模板中,并且文本型值可以被设置为与该元数据键相对应的元数据值。表1中所示的示例表示这样的情形,即,处理某个表格图像,从表格图像中提取值“ABC-123”,并且将该值设置为元数据值。
元数据模板“记账”还包括元数据键“到期日”,并且日期型值可以被设置为元数据值。日期型值表示这样的类型,即,在表示“2015年10月25日”的情况下,例如仅常规格式,诸如“10-25-2015”、“10/25/2015”和“2015年10月25日”可以被输入。日期型的其它格式也可以应用,只要日期是以常规格式表示的即可。
元数据模板“记账”进一步包括元数据键“总额”,并且数值型值可以被设置为元数据值。数值型表示仅数值值可以被输入的类型。在表1所示的示例中,值“47875000”从表格图像被提取用于元数据键“总额”,并且将该值设置为元数据值。除了数值值以外的字符串不能被添加为数值型的元数据值。
元数据模板“记账”进一步包括元数据键“文档类型”,并且选择型值可以被设置为元数据值。在表1所示的示例中,可以针对元数据键“文档类型”从表2中所示的值中选择元数据值。在表2所示的示例中,针对“文档类型”仅可以设置“预估单”、“发货单”和“订货单”中的值。在设置选择型的元数据键的情况下,对用户或管理员而言有必要将针对各个单独的元数据键的元数据值选项预设至图像处理服务器105。
在元数据模板“法务”中、值类型“数值型”、“文本型”和“日期型”被相应地设置到元数据键“对象编号”、“客户”和“日期”。在表1所示的示例中,从表格图像提取的“123456”、“川崎太郎”和“2017年12月22日”被设置为元数据值。
在上述方式中,元数据可以基于元数据模板的定义而被附加至存储在存储服务器107的HDD 313中的图像数据。这使用户能够通过针对存储服务器107指定元数据键来搜索图像数据。例如,在表1所示的示例中,用户能够基于元数据模板“记账”来搜索图像数据,以及基于元数据模板、同时针对“文档类型”指定“定货单”来搜索图像数据。这意味着用户能够通过指定期望的元数据键来搜索图像数据,因此能够以较高的精确度来进行搜索。
另外,将元数据附加至存储在存储服务器107的HDD 313中的图像数据,有助于与后续系统的顺畅合作。例如,在将原稿图像数据登记到记账系统时,用户有时需要输入与原稿图像相关的记账信息。在这样的情况下,如果没有记账信息作为元数据被附加至原稿图像,则用户需要在检查原稿图像的内容的同时输入记账信息。根据本典型实施例,当图像数据被上传至存储服务器107时,要被用于后续系统的元数据可以预先被附加至图像数据。这使得元数据能够看起来好像其来自存储服务器107一样被传递并被登记到记账系统,由此提高了发布的效率。
图4示出图像形成设备101的操作单元204的示例。操作单元204包括触摸板401、设置键402、取消键404和开始键403。用户使用触摸板401和设置键402来设置各个作业,并且按下开始键403来开始作业。一旦作业开始可以通过在作业执行期间按下取消键404来取消。作业的示例包括复制作业,以及传输(经由网络I/F 214扫描的)图像数据至图像处理服务器106。
以下将给出用于将由元数据模板定义的元数据附加至通过利用图像形成设备101扫描文档而获取的图像数据并且将该图像数据传输至存储服务器107的一系列处理过程的描述。
图5是示出根据本典型实施例的整体系统的处理过程的流程图。步骤S501和S502中的处理以及步骤S511至S517中的处理由图像形成设备101进行。与这些处理相关的程序被存储在HDD 213中,并且被加载到RAM 212中并由CPU 211来执行。步骤S503至S510中的处理由图像处理服务器105进行。与该处理相关的程序被存储在HDD 303中,并且被加载到RAM302中并由CPU 301来执行。步骤S506和S507中的处理以及步骤S518和S519中的处理由存储服务器107进行。与这些处理相关的程序被存储在HDD 313中,并且被加载到RAM 312中并由CPU 311来执行。
在接收到由用户按下开始键403所发出的原稿扫描指示时,在步骤S501中,CPU211指示扫描仪203扫描原稿,并获取扫描仪203所生成的扫描图像数据。在步骤S502,CPU211将在步骤S501中获取的图像数据经由网络I/F 214传输至图像处理服务器105。
在步骤S503中,图像处理服务器105的CPU 301经由网络I/F 304从图像形成设备101接收图像数据。在步骤S504中,CPU 301对接收到的图像数据进行图像处理,以生成要在元数据被附加至图像数据时使用的数据。图6是示出在步骤S504中由图像处理服务器105进行的图像处理的详情的流程图。与图6中所示的流程图的处理相关的程序被存储在图像处理服务器105的HDD 303中,并且被加载到RAM 302中并由CPU 301执行。
在步骤S601中,CPU 301读取被包含在步骤S503中接收到的图像数据中的一页图像数据。在步骤S602中,CPU 301对在步骤S601中读取的一页图像数据进行块划分处理。块划分处理是指用于分析图像数据的内容(格式结构)、并将图像数据划分成背景区域和字符串区域的处理。块划分处理的结果被存储在HDD 303中。在块划分处理的结果中,将通过块划分处理所获得的各区域的属性(即,与背景区域和字符串区域中的哪个被分配至各区域有关的信息)与同图像数据上的对应区域有关的位置信息相关联。根据本典型实施例,图像数据上的各区域被表示为方形,并且针对各区域的位置信息通过该区域的左上点的坐标、方形的宽度和方形的高度的组合来表示。下文中,通过块划分处理所获取的针对各字符串区域的方形区域被称为“块”。通过块划分处理所获取的各划分区域的形状不限于方形形状,而是可以被定义为任何形状,只要各划分区域被唯一地表示即可。
在步骤S603中,CPU 301读取在步骤S602中存储在HDD 303中的块划分结果,对具有字符串属性的各划分区域进行OCR处理,并且获取被包含在字符串区域中的字符串的字符编码。在步骤S604中,CPU 301将在步骤S603中获取的针对各字符串区域的字符编码信息、在步骤S602中获取的针对字符串区域的位置信息、以及在步骤S601中读取的页图像数据彼此相关联,并将它们存储在HDD 303中。在步骤S605中,CPU 301判断是否在步骤S503中接收到的图像数据中的任何页图像数据未通过步骤S601至S604中的处理而被处理。在存在尚未被处理的页图像数据的情况下(步骤S605中为“否”),处理返回至步骤S601。然后,CPU301针对剩余页图像数据的数量重复地进行步骤S601至S604中的处理。另一方面,在不存在这样的页图像数据的情况下(步骤S605中为“是”),流程图的处理结束。通过上述过程利用在图像处理服务器105中进行图像处理,能够获取到从图像形成设备101接收到的原稿的各页图像数据中包括的字符串信息与针对各字符串区域的位置信息彼此相关联。
继续描述图5中所示的流程图。在步骤S505中,已经进行以上参考图6所述的步骤S504中的处理的CPU 301,经由网络I/F 304向存储服务器107发出元数据模板获取请求。在步骤S506中,存储服务器107的CPU 311经由网络I/F 314从图像处理服务器105接收元数据模板获取请求。在步骤S507中,CPU 311将预先存储在HDD 313中的元数据模板传输至图像处理服务器105。根据本典型实施例,表1和表2中示出的元数据模板被传输至图像处理服务器105。
在步骤S508中,图像处理服务器105的CPU 301经由网络I/F 304从存储服务器107接收元数据模板,并将该元数据模板存储在HDD 303中。在步骤S509中,CPU 301生成用于在元数据被附加至扫描图像数据时从用户接收指示的画面的描绘数据。所生成的画面描绘数据是用于要被显示在图像形成设备101的触摸板401上的画面的数据。根据本典型实施例,描绘数据包括在网页描述语言(诸如超文本标记语言(HTML)等)中描述的页描述数据、以及在脚本语言(诸如JavaScript(注册商标)等)中描述的脚本数据。页描述数据还包括在步骤S503中接收到的图像数据、在步骤S504中生成的图像处理结果数据、以及在步骤S508中从存储服务器107接收到的元数据模板,作为静态数据。脚本数据根据页描述数据中包括的静态数据、以及从图像形成设备101的操作单元204输入的用户指示而包括针对画面显示的控制过程。下面将描述使用这些数据的图像形成设备101上的特定画面显示的控制过程。
在步骤S510中,图像处理服务器105的CPU 301经由网络I/F 304将所生成的描绘数据传输至图像形成设备101。
在步骤S511中,图像形成设备101的CPU 211经由网络I/F 214接收从图像处理服务器105传输的描绘数据。在步骤S512中,CPU 211基于所接收到的描绘数据中包括的静态数据而将画面显示在触摸板401上。在步骤S512中显示的画面是这样的画面,即,该画面用于提示图像形成设备101的用户指定要被用于扫描图像的各页的元数据模板。因此,在下文中,该画面被称为元数据模板确定画面。
图7是示出在步骤S512中显示在触摸板401上的元数据模板确定画面701的示例的图。元数据模板确定画面701包括预览显示部702、页计数显示部703、所选择的元数据模板显示部704、下拉列表按钮705、以及页转换指示部706。预览显示部702以页为单位显示扫描图像。页计数显示部703显示当前显示在预览显示部702中的页图像的页码。在图7所示的示例中,显示包括两页的扫描图像数据的第一页。所选择的元数据模板显示部704显示所显示的页图像中的当前选择的元数据模板。图7所示的示例表示接收用户指示之前的状态,其中针对预览显示部702中所显示的页图像,未选择元数据模板。下拉列表按钮705在被按下时显示能够针对所显示的页图像选择的元数据模板的列表。下文将描述下拉列表按钮705被按下时画面显示的示例。页转换指示部706显示由用户使用以在步骤S501中生成的扫描图像数据的页之间进行显示转换的按钮。在该示例中,由于显示包括两页的扫描图像数据的第一页,因此仅显示用于选择下一页的按钮。页转换指示部706被配置为针对各页动态地改变显示内容。例如,当显示第二页作为最后页时,显示用于将图像数据和元数据传输至存储服务器107的按钮。
在步骤S513中,基于图像形成设备101的用户的操作,CPU 211进行用于确定要与被显示在元数据模板确定画面中的页图像相关联的元数据模板的处理。
图8是示出步骤S513中的元数据模板确定处理的详细过程的流程图。与该流程图的处理相关的程序被包括在步骤S511中接收到的数据中,并且被加载到RAM 212中并由CPU211执行。
在步骤S801中,CPU 211判断用户是否按下图7中所示的元数据模板确定画面中的下拉列表按钮705。在按钮未被按下的情况下(步骤S801中为“否”),CPU 211重复地进行步骤S801中的判断,直到按钮被按下为止。另一方面,在按钮被按下的情况下(步骤S801中为“是”),处理进入步骤S802。在步骤S802中,CPU 211读取步骤S511中接收到数据中包括的、作为静态数据的多个元数据模板的列表。在步骤S803中,CPU 211将在步骤S802中读取的多个元数据模板的列表显示在触摸板401上。
图9是示出当CPU 211进行步骤S803时显示在触摸板401上的画面的示例的图。CPU211将在步骤S802中读取的元数据模板作为元数据模板选择候选列表901显示在上文参考图7所述的元数据模板确定画面701上。在该示例中,由于表1中所示的元数据模板被包括在画面数据中,因此在元数据模板选择候选列表901中显示“记账”和“法务”。用户可以从元数据模板选择候选列表901中选择要与被显示在元数据模板确定画面701上的页图像相关联的元数据模板。
继续描述图8中所示的流程图。在步骤S804中,CPU 211判断用户是否触摸了触摸板401。在触摸板401未被触摸的情况下(步骤S804中为“否”),CPU 211重复地进行步骤S804中的处理。另一方面,在触摸板401被触摸的情况下(步骤S80中为“是”),处理进入步骤S805。在步骤S805中,CPU 211判断所触摸的位置是否是元数据模板选择候选列表901。在所触摸的位置不是元数据模板选择候选列表901的情况下(步骤S805中为“否”),处理进入步骤S806。在步骤S806中,CPU 211停止显示元数据模板选择候选列表901,并且重新显示图7中所示的画面。然后,处理返回至步骤S801。另一方面,在所触摸的位置是元数据模板选择候选列表901的情况下(步骤S805中为“是”),处理进入步骤S807。在步骤S807中,CPU 211设置由用户从元数据模板选择候选列表901中选择作为选择对象的元数据模板,并且在步骤S808中,CPU 211将画面显示在触摸板401上。该流程图的处理结束。在步骤S808中显示的画面被图像形成设备101的用户使用,以基于步骤S807中设置的元数据模板将元数据设置到扫描图像的各页。该画面被称为元数据设置画面。
图10A示出通过CPU 211在步骤S808中显示在触摸板401上的元数据设置画面1001的示例。元数据设置画面1001包括图7中示出的元数据模板确定画面701和额外显示的元数据设置部1002。元数据设置部1002包括元数据键显示部1003、元数据值图像显示部1004以及元数据值输入表单(值输入栏)1005。
元数据键显示部1003被配置为根据步骤S807中选择和设置的元数据模板、基于步骤S511中接收到的数据中包括的脚本数据而动态地改变。在图10A示出的示例中,由于元数据模板“记账”被设置到扫描图像的第一页的图像,因此与表1中所示的元数据模板“记账”相关联的元数据键“对象编号”、“到期日”、“总额”和“文档类型”以按钮的形式被显示。在图像形成设备101的用户从上文描述的元数据模板选择候选列表901选择其它元数据模板中的任一个的情况下,元数据键显示部1003动态地改变为显示与所选择的元数据模板相对应的元数据键。
元数据值图像显示部1004是这样的区域,即,该区域用于以扩大的方式显示由用户在下文描述的处理中从显示在预览显示部702中的块中选择的块部分的图像。用户可以通过检查显示在元数据值图像显示部1004中的图像来检查要被设置为元数据键的值的元数据值。元数据值输入表单1005包括输入栏,该输入栏用于在下文描述的处理中设置与相应的元数据键相关联的元数据值。
继续图5中示出的流程图的描述。在完成步骤S513中的元数据模板确定处理时,然后在步骤S514中,图像形成设备101的CPU 211进行元数据设置处理。
图11是示出步骤S514中的元数据模板确定处理的详细过程的流程图。与该流程图的处理相关的程序被包括在步骤S511中接收到的数据中,并且被加载到RAM 212中并由CPU211执行。
在步骤S1101中,CPU 211判断是否按下元数据设置画面1001中的元数据键显示部1003中显示的元数据键的任意按钮。在没有按钮被按下的情况下(步骤S1101中为“否”),CPU 211继续步骤S1101中的判断处理。另一方面,在任意按钮被按下的情况下(步骤S1101中为“是”),处理进入步骤S1102。在步骤S1102中,CPU 211从与在所选择的元数据模板显示部704中当前选择的元数据模板有关的信息中读取针对与被按下的按钮相对应的元数据键的类型信息。在步骤S1103中,CPU 211进行与针对步骤S1102中获取的元数据键的类型信息相对应的候选块显示处理。
图12是示出步骤S1103中的详细处理的流程图。与该流程图的处理相关的程序被包括在步骤S511中接收到的数据中,并且被加载到RAM 212中并由CPU 211执行。
在步骤S1201中,CPU 211获取作为步骤S504中的图像处理的结果的绘图数据中包括的与页图像数据中的一个块(一个字符串区域)有关的块信息、以及与块相对应的OCR结果信息(字符识别结果信息),作为处理对象。在步骤S1202中,CPU 211判断针对在步骤S1102中获取的元数据键的类型信息。
在CPU 211将类型信息判断为文本型(步骤S1202中为“文本型”)的情况下,处理进入步骤S1203。在步骤S1203中,基于在步骤S1201中获取的块信息中包括的位置信息,CPU211在预览显示部702上的适当位置处以方形形状显示候选块。候选块显示的示例将在下文中参考附图进行描述。
在CPU 211将类型信息判断为日期型的情况下(步骤S1202中为“日期型”),处理进入步骤S1204。在步骤S1204中,CPU 211判断步骤S1201中获取的块信息中包括的OCR结果信息是否与日期常规格式匹配。在CPU 211判断为OCR结果信息与常规格式匹配的情况下(步骤S1204中为“是”),处理进入步骤S1203。在步骤S1203中,CPU 211将对应的块以方形形状显示为候选块。另一方面,在CPU 211判断为OCR结果信息与常规格式不匹配的情况下(步骤S1204中为“否”),处理进入步骤S1207。步骤S1204的判断中使用的日期常规格式作为脚本数据被包括在步骤S511中接收到的描绘数据中。特定日期格式的示例包括常规格式,诸如“\d{1,4}[/\-\.]\d{1,2}[/\-\.]\d{1,4}”等等。然而,格式并不重要,只要其是通常可识别的日期格式中的一种格式即可。根据这些常规格式,通过如上所述的步骤S1203中的处理,CPU 211仅将OCR结果信息具有日期格式(诸如“11-28-2018”、“11/05/1979”等等)的块作为候选块以方形形状显示在预览显示部702上的适当位置处。候选块显示的示例将在下文中参考附图描述。
在CPU 211将类型信息判断为数值型的情况下(步骤S1202中为“数值型”),处理进入步骤S1205。在步骤S1205中,CPU 211判断步骤S1201中获取的块信息中包括的OCR结果信息是否与数值常规格式匹配。在CPU 211判断为OCR结果信息与常规格式匹配的情况下(步骤S1205中为“是”),处理进入步骤S1203。在步骤S1203中,CPU 211将块以方形形状显示为候选块。另一方面,在CPU 211判断为OCR结果信息与常规格式不匹配的情况下(步骤S1205中为“否”),处理进入步骤S1207。步骤S1205的判断中使用的数值常规格式作为脚本数据被包括在步骤S511中接收到的描绘数据中。特定数值格式的示例包括常规格式,诸如“^[0-9]*$”和“^\d{1,3}(,\d{3})*$”。然而,格式并不重要,只要其是通常可识别的数值格式中的一种数值格式即可。根据上述常规格式,通过如上所述的步骤S1203中的处理,CPU 211仅将OCR结果信息具有数值格式(诸如“123456”、“246000”和“143,000,000”等)的块作为候选块以方形形状显示在预览显示部702上的适当位置处。候选块显示的示例将在下文中参考附图描述。
在CPU 211将类型信息判断为选择型的情况下(步骤S1202中为“选择型”),处理进入步骤S1206。在步骤S1206中,CPU 211将如表2中所示的元数据值选择候选列表显示在元数据值输入表单1005上。列表显示的示例将在下文中参考附图描述。在步骤S1206完成时,流程图的处理便结束。
在步骤S1203完成时,处理进入步骤S1207。在步骤S1207中,CPU 211判断作为步骤S504中的图像处理的结果的描绘数据中包括的页图像数据中的块信息中的任意块信息是否在步骤S1201中未被处理。在任意块未被处理的情况下(步骤S1207中为“是”),处理返回至步骤是1201。在步骤S1201中,CPU 211处理下一个块。另一方面,在全部块已经被处理的情况下(步骤S1207中为“否”),该流程图的处理结束。
当上文参考图12描述的流程图的处理结束时,处理返回至图11所示的流程图。在步骤S1104中,CPU 211判断用户是否选择步骤S1203中被显示为与元数据键相对应的元数据值的设置候选或者步骤S1206中显示的列表上的选择候选的块。在选择候选没有被选择的情况下(步骤S1104中为“否”),处理进入步骤S1108。在步骤S1108中,CPU 211判断用户是否在元数据值输入栏中直接输入元数据值。直接输入元数据值是指,当用户期望的字符串块未存在于在步骤S1203中显示的选择候选块中时,或者当与选择的元数据键的类型信息相对应的候选块不存在时,通过使用操作单元204直接输入期望的元数据值的用户操作。可选地,例如,用户可以通过触摸元数据值输入表单1005的区域(例如,与元数据键“对象编号”相对应的输入表单1007)或者进行其它方法来直接输入元数据值。在用户未以这种方式直接输入元数据值的情况下(步骤S1108中为“否”),处理返回至步骤S1104。另一方面,在用户直接输入元数据值的情况下(步骤S1108中为“是”),处理进入步骤S1109。在步骤S1109中,CPU 211将用于直接输入元数据值的画面显示在触摸板401上。
图10B示出在步骤S1109中显示在触摸板401上的画面的示例。软键盘1008与图10A中所示的画面重叠。通过操作软键盘1008,用户能够直接输入与步骤S1101中选择的元数据键相对应的元数据值。在直接输入元数据值之后,用户按下“OK”按钮1009,以向CPU 211通知直接输入完成。在步骤S1110中,CPU 211判断是否接收到用户直接输入完成的通知。在未接收到通知的情况下(步骤S1110中为“否”),CPU 211继续步骤S1110中的处理。另一方面,在接收到通知的情况下(步骤S1110中为“是”),处理进入步骤S1111。在步骤S1111中,CPU211将由用户直接输入的字符串设置在元数据值输入表单1005的指定输入表单(例如,输入表单1007)中。步骤S1106将在下文中描述。
继续对步骤S1104中的处理的描述。当用户选择步骤S1203中被显示为元数据值的设置候选或者步骤S1206中显示的列表中的选择候选的块时(步骤S1104中为“是”),处理进入步骤S1105。在步骤S1105中,CPU 211获得所选择的元数据值的设置候选块的OCR结果信息或者与列表上的选择候选相对应的串信息,并且将该字符串信息设置在元数据值输入表单1005的适当输入栏(例如,输入表单1007)中。在步骤S1106中,CPU 211描绘反映步骤S1105中的元数据值设置的画面。步骤S1106中描绘的画面的示例将在下文中参考附图描述。
在步骤S1107中,CPU 211判断是否设置了与在元数据键显示部1003中显示的所有元数据键相对应的元数据值。在存在未设置元数据值的任何元数据键的情况下(步骤S1107中为“否”),处理返回至步骤S1101。另一方面,在针对所有元数据键设置元数据值的情况下(步骤S1107中为“是”),CPU 211结束该流程图中的元数据设置处理。
当上文参考图11描述的流程图的处理结束时,处理返回至图5所示的流程图。在完成元数据设置处理之后,然后CPU 211在步骤S515中判断是否从用户接收到页转换指示。页转换指示是指用户按下页转换指示部706中的按钮的操作。
在未接收到页转换指示的情况下(步骤S515中为“否”),CPU 211继续步骤S515中的处理。另一方面,在接收到页转换指示的情况下(步骤S515中为“是”),处理进入步骤S516。在步骤S516中,CPU 211判断当前页图像是否为扫描图像数据的最后页。
在当前页不是最后页的情况下(步骤S516中为“否”),处理返回至步骤S512。在步骤S512中,CPU 211针对扫描图像数据中的要设置元数据模板和元数据的下一页图像再次进行处理。另一方面,在当前页是最后页的情况下(步骤S516中为“是”),处理进入步骤S517。在步骤S517中,CPU 211将扫描图像数据与在步骤S513和S514中添加至各页的元数据一起经由网络I/F 214传输至存储服务器107用于登记。然后,在本典型实施例中,在当用户发出页转换指示时显示最后页的情况下,设置到扫描图像数据的各页的元数据被传输至存储服务器107,用于发出元数据传输指示的方法并不限于此。例如,可以进一步提供用于发出元数据传输指示的按钮,并且在元数据已经被设置到扫描图像数据的各页之后,元数据可以在用户发出元数据传输指示时被传输至存储服务器107。
在步骤S518中,存储服务器107的CPU 311经由网络I/F 314接收在步骤S517中被传输的图像数据和元数据。在步骤S519中,CPU 311将图像数据和元数据存储在HDD 313中。然后,图5所示的整体系统的流程图的处理结束。页图像数据和元数据彼此相关联,并且在步骤S519中被存储在存储服务器107中,因此存储服务器107的用户能够通过使用元数据键和元数据值而在存储服务器107上搜索页图像数据。
上文描述的处理使得图像形成设备101的用户更容易将元数据附加至扫描图像数据的各个页图像数据。具体示例将在下文中参考附图描述。
将描述通过步骤S501至S513的处理而显示图10A所示的画面的状态下的情况。然后,例如,图像形成设备101的用户按下图10A中所示的元数据键“对象编号”的按钮。CPU211在步骤S1101中检测按钮的按下并且在步骤S1102中获取类型信息(“文本型”)。基于该类型信息(“文本型”),CPU 211针对图10A所示的页图像数据中的块的数量重复地进行步骤S1201至S1203和S1207中的处理。作为该处理的结果,显示图13A所示的画面。针对“文本型”的元数据键,任何字符串可以被设置为元数据值,因此页图像上的全部块变成选择候选,如图13A所示。
例如,在步骤S1104中,用户选择块1302。在这种情况下,步骤S1105和S1106中设置元数据值的显示画面如图13B所示。如图13B所示,对应于块1302的字符串“ABC-123”被设置在对应于元数据键“对象编号”的元数据值输入表单1305中,并且所选择的块1302的图像被提取并且以扩大的方式被显示在块1304中。以这种方式显示图像使得用户能够检查元数据值输入表单1305中设置的元数据值是否与图像数据的所选择的块中实际描述的字符串匹配。
在完成步骤S1107中的处理之后,然后在步骤S1101中,例如,用户按下元数据键“到期日”的按钮。由于元数据键“到期日”是“日期型”,因此CPU 211按步骤S1102、S1201、S1202和S1204的顺序进行处理。CPU 211仅针对页图像数据中的被判断为与日期常规格式匹配的块来进行步骤S1203。作为该处理的结果,显示图14A所示的画面。在预览显示部702中显示的页图像数据中,仅块1402(字符串“2015年11月1日”)和块1403(字符串“2015年10月25日”)各自以方形形状被显示为元数据值候选块。在步骤S1104中,例如,用户选择块1403。这种情况下,步骤S1105和S1106中设置元数据值的显示画面如图14B所示。如图14B所示,对应于块1403的字符串“2015年10月25日”被设置在对应于元数据键“到期日”的元数据值输入表单1406中,并且所选择的块1403的图像被提取并以扩大方式被显示在块1405中。
在完成步骤S1107中的处理之后,然后在步骤S1101中,例如,用户按下元数据键“总额”的按钮。由于元数据键“总额”是“数值型”,因此CPU 211按步骤S1102、S1201、S1202和S1205的顺序进行处理。CPU 211仅针对页图像数据中的被判断为与数值常规格式匹配的块来进行步骤S1203。作为该处理的结果,显示图15A所示的画面。在预览显示部702中显示的页图像数据中,仅包括数值字符串的块各自以方形形状被显示为元数据值候选块。在步骤S1104中,例如,用户选择块1502(字符串“4,875,000”)。这种情况下,步骤S1105和S1106中设置元数据值的显示画面如图15B所示。如图15B所示,对应于块1502的字符串“4875000”被设置在对应于元数据键“总额”的元数据值输入表单1505中,并且所选择的块1502的图像被提取并以扩大方式被显示在块1504中。根据本典型实施例,当在元数据值输入表单1505中输入OCR结果时,分隔符(逗号)从作为具有诸如逗号等的分隔符的数值值的数值数据(诸如“4,875,000”等的金额数据)中被删除。然而,本发明不限于此。具有诸如逗号等的分隔符的数值值可以被输入元数据值输入表单1505中,只要系统能够处理具有诸如逗号等的分隔符的数值值即可。
在完成步骤S1107中的处理之后,然后在步骤S1101中,例如,用户按下元数据键“文档类型”的按钮。由于元数据键“文档类型”是“选择型”,因此CPU 211按步骤S1102、S1201、S1202和S1206的顺序进行处理,并且元数据值选择候选列表被显示在元数据值输入表单1505中。作为该处理的结果,显示如图16A所示的画面。如图16A所示,表2中所示的文档类型选项(“预估单”、“发货单”和“订货单”)的列表被显示在元数据值输入表单1603下方。在步骤S1104中,例如,用户选择元素1604(值“订货单”)。这种情况下,步骤S1105和S1106中设置元数据值的显示画面如图16B所示。如图16B所示,对应于元素1604的字符串“订货单”被设置在对应于元数据键“文档型”的元数据值输入表单1603中。
通过上文描述的处理,针对图像数据的第一页完成了步骤S514中的处理。然后在步骤S515中,例如,用户按下页转换指示部706中的“下一个”按钮。在步骤S516中,页图像数据的第二页变成元数据设置对象。在完成步骤S512之后,然后在步骤S513中,CPU 211对页图像数据的第二页进行元数据模板确定处理。例如,用户从元数据模板选择候选列表901中选择元数据模板“法务”。这种情况下,作为步骤S513中的处理结果显示的画面如图17所示。该画面与同上文参考图10A描述的页画面数据的第一页相对应的元数据设置画面1001几乎相同。对应于表1中所示的元数据模板“法务”的元数据键“对象编号”、“客户”和“日期”被显示在元数据键显示部1003中。页计数显示部703的页码被更新至第二页,并且显示在页转换指示部706上的按钮被更新至“返回”和“发送至服务器”。“返回”按钮被用于使页转换到页图像数据的前一页,即,页图像数据的第一页。“发送至服务器”按钮被用于将扫描图像和元数据传输至存储服务器107。
在步骤S1101中,在显示图17所示的画面的状态下,例如,用户按下元数据键“对象编号”的按钮1702。由于元数据模板“法务”的元数据键“对象编号”是“数值型”,与页图像数据的第一页不同,因此CPU 211按步骤S1102、S1201、S1202和S1205的顺序进行处理。CPU211仅针对页图像数据中的与数值常规格式匹配的块来进行步骤S1203。作为该处理的结果,显示图18A所示的画面。在预览显示部702中显示的页图像数据中,仅包括数值字符串的块各自以方形形状被显示为元数据值候选块。在步骤S1104中,例如,用户选择块1802(字符串“12349876”)。在这种情况下,步骤S1105和S1106中设置元数据值的显示画面如图18B所示。如图18B所示,对应于块1802的包括数值字符串的字符串“12349876”被设置在对应于元数据键“对象编号”的元数据值输入表单1804中,并且所选择的块1802的图像作为提取图像被显示在块1803中。随后处理与针对页图像数据的第一页的处理相同,并且其冗余描述将被省略。
如上所述,根据本典型实施例,元数据值选择候选的对象块和元数据值列表根据针对扫描图像数据的各页设置的元数据模板的元数据键中设置的类型信息而被动态地缩减并显示。因此,提高了用户附加元数据时的可操作性和便利性。
以下将集中于这样的典型情况来描述第二典型实施例,即,在该情况下,当根据日期型和数值型的元数据键的选择显示候选块时,考虑到OCR处理中的字符误识别的可能性而显示候选块。在第二典型实施例的描述中,与根据第一典型实施例中的结构和处理相同的结构和处理被赋予相同的附图标记,并且省略对其的详细描述。
图19是示出根据第二典型实施例的图11中所示的步骤S1103的详细处理的流程图。与流程图的处理相关的程序被包括在步骤S511中接收到的数据中,并且被加载到RAM212中并由CPU 211执行。
在步骤S1201中,与第一典型实施例类似,CPU 211获取针对页图像数据中的一个块(一个字符串区域)的块信息以及与块相对应的OCR结果信息作为处理对象。在步骤S1202中,与第一典型实施例类似,CPU 211判断步骤S1102中获取的元数据键的类型信息。在图像形成设备101的用户选择的元数据键的类型信息是日期型或数值型(步骤S1202中为“日期型”或“数值型”)的情况下,CPU 211在与第一典型实施例不同的过程中进行处理。针对各值类型的处理将在下文中描述。
在CPU 211将元数据键的类型信息判断为日期型(步骤S1202中为“日期型”)的情况下,处理进入步骤S1204。在步骤S1204中,CPU 211判断步骤S1201中获取的块信息中包括的OCR结果信息是否与日期常规格式完全匹配。在CPU 211判断为OCR结果信息与日期常规格式匹配的情况下(步骤S1204中为“是”),处理进入步骤S1203。在步骤S1203中,CPU 211将块以方形形状显示为候选块。另一方面,在CPU 211判断为OCR结果信息与日期常规格式不匹配的情况下(步骤S1204中为“否”),处理进入步骤S1901。在步骤S1901中,CPU 211计算步骤S1201中获取的块的OCR结果信息与日期常规格式之间的匹配率。作为用于计算OCR结果信息与日期常规格式之间的匹配率的方法的示例,CPU 211计算日期常规格式中的匹配字符的数量与OCR结果信息中的字符串中的字符的总数量之比。匹配率并不限于匹配字符的数量的比,而是可以使用其它指标来获得。
在步骤S1902中,CPU 211判断在步骤S1901中计算出的匹配率是否大于或等于预定阈值。阈值可以是预先存储在HDD 213中的值,或者是用户通过图像形成设备101的设置所指定的值。用于确定阈值的方法并不重要。在匹配率大于或等于阈值的情况下(步骤S1902中为“是”),处理进入步骤S1203。在步骤S1203中,CPU 211以方形形状将块显示为候选块。另一方面,在匹配率小于阈值的情况下(步骤S1902中为“否”),处理进入步骤S1207。
在CPU 211将元数据键的类型信息判断为数值型(步骤S1202中为“数值型”)的情况下,处理进入步骤S1205。在步骤S1205中,CPU 211判断步骤S1201中获取的块信息中包括的OCR结果信息是否与数值常规格式完全匹配。在CPU 211判断为OCR结果信息与数值常规格式匹配的情况下(步骤S1205中为“是”),处理进入步骤S1203。在步骤S1203中,CPU 211将块以方形形状显示为候选块。另一方面,在CPU 211判断为OCR结果信息与数值常规格式不匹配的情况下(步骤S1205中为“否”),处理进入步骤S1903。在步骤S1903中,CPU 211计算步骤S1201中获取的块中包括的OCR结果信息与数值常规格式之间的匹配率。作为用于计算OCR结果信息与数值常规格式之间的匹配率的方法的示例,CPU 211计算数值常规格式中的匹配字符的数量与OCR结果信息中的字符串中的字符的总数量之比。匹配率并不限于匹配字符的数量的比,而是可以使用其它指标来获得。
在步骤S1904中,CPU 211判断在步骤S1903中计算出的匹配率是否大于或等于预定阈值。阈值可以是预先存储在HDD 213中的值,或者是用户通过图像形成设备101的设置所指定的值。用于确定阈值的方法并不重要。在匹配率大于或等于阈值的情况下(步骤S1904中为“是”),处理进入步骤S1203。在步骤S1203中,CPU 211以方形形状将块显示为与候选块匹配的块。另一方面,在匹配率小于阈值的情况下(步骤S1904中为“否”),处理进入步骤S1207。
图20是示出在这样的情况下显示的画面的示例的图,即,在该情况下,用户针对页图像数据的第一页在步骤S1101中按下元数据键“总额”的按钮。由于元数据键“总额”是“数值型”,因此CPU 211按步骤S1102、S1201、S1202和S1205的顺序进行处理。在图20所示的示例中,例如,针对块1502的OCR结果包括字符并且被误识别为“4875O00”。作为步骤S1205中由CPU 211针对块1502进行的判断的结果,CPU 211判断为OCR结果与数值常规格式不完全匹配。因此,处理进入步骤S1903。在步骤S1903中,CPU 211计算OCR结果与数值常规格式之间的匹配率,即,(被判断为满足数值常规格式的字符的数量)/(OCR结果中的字符的总数量)=6/7≈0.86。在步骤S1904中,在匹配率的阈值被设置为0.80的情况下,CPU 211判断为步骤S1903中计算出的匹配率大于或等于阈值。因此,在步骤S1203中,CPU 211将块1502显示为元数据值候选块。
根据第二典型实施例,即使在由图像处理服务器105进行的基于块的OCR处理的结果包括误识别的字符的情况下,与用户选择的元数据键的类型高度匹配的块也可以被显示为元数据值候选块。
当用户以这种方式从显示的候选块中选择OCR结果包括误识别的字符的块时,在步骤S1104中,所选择的块的OCR结果被显示在元数据值输入表单1005上。尽管显示的OCR结果包括误识别的字符,但用户仍然能够通过简单地指定误识别的字符以及进行校正操作来改变至适当的元数据。
根据第二典型实施例的变型例,下述处理也是可应用的。在CPU 211判断为匹配率大于或等于阈值的情况下(步骤S1904中为“是”),然后在步骤S1203中,对应的块被显示为候选块。在用户选择候选块的情况下(步骤S1104中为“是”),然后在步骤S1105中,CPU211再次对所选择的块进行OCR处理(其中OCR结果限于数值值),并在元数据值输入表单上显示由此得到的OCR结果。以这种方式通过将字符类型限制于数值值再次进行OCR处理提高了获取正确数值OCR结果的可能性,并且因此能够降低用户需要进行校正操作的频率。同样,当用户选择在步骤S1902中判断为具有大于或等于阈值的匹配率的候选块时,通过将字符类型限制于日期相关的字符类型,再次对候选块进行OCR处理。这提高了正确的OCR结果被显示在元数据值输入表单中的可能性。
以下将参考附图集中于与上述方法不同的元数据模板确定方法来描述第三典型实施例。根据本典型实施例的元数据模板确定方法的使用,使得更容易确定元数据模板。在第三典型实施例的描述中,与根据第一典型实施例和第二典型实施例的结构和处理相同的结构和处理被赋予相同的附图标记,并且省略对其的详细描述。
图21是示出根据本典型实施例的、在图1所示的根据先前典型实施例的系统结构中的整体系统的处理的流程图。步骤S2101、S501、S2102、S511、S2106以及S514至S517中的处理由图像形成设备101进行。与该处理相关的程序被存储在HDD 213中,并且被加载到RAM212中并由CPU 211执行。步骤S2103、S504、S2104和S2105以及S510中的处理由图像处理服务器105进行。与该处理相关的程序被存储在HDD 303中,并且被加载到RAM 302中并由CPU301执行。步骤S518和S519中的处理由存储服务器107进行。与该处理有关的程序被存储在HDD 313中,并且被加载到RAM 312中并由CPU 311执行。
在步骤S2101中,CPU 211进行用于确定图像数据类型的处理。图像数据类型(原稿类型)被用作用于指定与要由图像形成设备101扫描的原稿相对应的元数据模板的信息。更具体地,CPU 211根据步骤S2101中确定的图像数据类型改变要设置的元数据模板。具体的图像数据类型和处理将在下文中详细描述。
图22是示出步骤S2101中的图像数据类型确定处理的详情的流程图。与该处理有关的程序被存储在HDD 213中,并且被加载到RAM 212中并由CPU 211执行。
在步骤S2201中,CPU 211在触摸板上描绘用于选择图像数据类型的画面。
图23示出在步骤S2201中在触摸板401上描绘的画面的示例。参考图23中所示的示例,触摸板401显示分别将“记账”和“法务”指定为图像数据类型的选择按钮2301和2302,以及用于指定无图像数据类型(“无类型”)的选择按钮2303。
继续对图22中所示的流程图的描述。在步骤S2202中,CPU 211判断用户是否按下如上参考图23所述的显示在图像数据类型选择画面中的选择按钮2301至2303中的任一选择按钮。在CPU 211判断为没有选择按钮被按下的情况下(步骤S2202中为“否”),CPU 211重复地进行步骤2202中的处理,直到用户按下任一选择按钮为止。另一方面,在CPU 211判断为任一选择按钮被按下的情况下(步骤S2202中为“是”),处理进入步骤S2203。在步骤S2203中,CPU 211将与被按下的按钮相对应的图像数据类型存储在RAM 212或HDD 213中。然后,图22所示的流程图的处理结束。
将给出对在步骤S2202中用户按下与“记账”相对应的图像类型的选择按钮2301的处理的描述。
继续图21所示的流程图的描述。在步骤S501中,CPU 211进行原稿扫描处理。在步骤S2102中,CPU 211将生成的图像数据和在步骤S2203中被存储的图像数据类型经由网络I/F 214传输至图像处理服务器105。在步骤S2103中,图像处理服务器105的CPU 301经由网络I/F 304从图像形成设备101接收图像数据和对应的图像数据类型。在步骤S504中,CPU301对接收到的图像数据进行图像处理。在步骤S2104中,CPU 301基于在步骤S2103中接收到的图像数据类型来进行元数据模板确定处理。
图24是示出步骤S2104中的元数据模板确定处理的详情的流程图。与该处理相关的程序被存储在HDD 303中,并且被加载到RAM 302中并由CPU 301执行。
在步骤S2401中,CPU 301获取在步骤S2103中接收到的图像数据类型。
在步骤S2402中,CPU 301从HDD 303读取表1所示的元数据模板,并且判断与步骤S2401中获取的图像数据类型相对应的元数据模板是否存在。根据第三典型实施例的图像处理服务器105预先将表1和表2所示的元数据模板和元数据的组合存储在HDD 303中。然而,本发明并不限于此。图像处理服务器105可以在该定时从存储服务器107获取元数据模板。在与图像数据类型相对应的元数据模板存在的情况下(步骤S2402中为“是”),处理进入步骤S2403。在步骤S2403中,CPU 301确定将元数据模板应用于在步骤S2103中接收到的扫描图像数据。另一方面,当与图像数据类型相对应的元数据模板不存在时(步骤S2402中为“否”),处理进入步骤S2404。在步骤S2404中,CPU301确定不将元数据模板附加至在步骤S2103中接收到的扫描图像数据。在图23所示的画面中选择图像数据类型“记账”的情况下,由于元数据模板“记账”存在于表1中,因此CPU 301确定将元数据模板应用于扫描图像数据。在图23所示的画面中选择“无类型”按钮(即,选择按钮2303)的情况下,步骤S2402中的确定的结果为“否”。
继续对图21中所示的流程图的描述。在步骤S2105中,CPU 301生成在将元数据附加至扫描图像数据时用于从用户接收指示的画面的描绘数据。生成的画面描绘数据是要显示在图像形成设备101的触摸板401上的画面所用的数据。根据本典型实施例,描绘数据包括网页描述语言(诸如超文本标记语言(HTML)等)中描述的页描述数据、以及脚本语言(诸如JavaScript(注册商标)等)中描述的脚本数据。页描述数据包括步骤S2103中接收到的图像数据、步骤S504中生成的图像处理结果数据、以及步骤S2104中确定的元数据模板,作为静态数据。脚本数据包括用于控制与页描述数据中包括的静态数据以及要从图像形成设备101的操作单元204输入的用户指示相对应的画面显示的程序。在步骤S510中,CPU 301将步骤S2105中生成的描绘数据传输至图像形成设备101。在步骤S2106中,图像形成设备101的CPU 211基于步骤S511中接收到的描绘数据中包括的静态数据而将在触摸板401上描绘画面。步骤S2106中描绘在触摸板401上的画面将以预先选择元数据模板“记账”的状态显示。该画面与图13A所示的根据第一典型实施例的画面相同。图21所示的步骤S514至S519中的处理与根据第一典型实施例的处理相同,因此其冗余描述将被省略。
根据第三典型实施例,当在开始扫描之前提示用户指定图像数据类型时,将选择与图像数据类型相对应的元数据模板。例如,当共同地扫描具有相同图像数据类型的原稿时,用户可以一次设置相同的元数据模板,从而使得设置元数据模板更容易。
以下将参考集中于对图5所示的步骤S514中的元数据设置处理的变型例来描述第四典型实施例,其中已经被用户选择为元数据值的块可以被这样显示。在本典型实施例的描述中,与第一典型实施例中的结构和处理相同的结构和处理被赋予相同的附图标记,并且省略对其的详细描述。
图25是示出与根据第四典型实施例的元数据设置处理(步骤S514)相关的处理的详情的流程图。与该流程图的处理相关的程序被包括在步骤S511中接收到的数据中,并且被加载到RAM 212中并由CPU 211执行。
在CPU 211判断为用户选择了元数据键(步骤S1101中为“是”)的情况下,处理进入步骤S1102。在步骤S1102中,CPU 211获取所选择的元数据键的类型信息。
在步骤S1103中,CPU 211进行与步骤S1102中获取的类型信息相对应的候选块确定处理。根据第一典型实施例,候选块具有图12的步骤S1203以及图13A、图14A和图15A所示的方形框。然而,根据第四典型实施例,显示方法不限于方形框,而可以是容许用户识别候选块的其它方法。例如,方形框可以闪烁、使用虚线表示、或以不同背景色显示。例如,在用户按下图26A中所示的元数据设置画面1001中的“日期型”的“到期日”键1404的情况下,日期型候选块2701和2701(分别为“2015年10月25日”和“2015年11月1日”)闪烁,或者以虚线闭合来代替以简单的方形闭合。
在用户从值候选块中选择候选块2701的情况下(图25中所示的步骤S1104中为“是”),处理进入步骤S1105。在步骤S1105中,CPU 211将对应于块2701的字符串“2015年10月25日”设置为对应于“到期日”键1404的元数据值。在步骤S2501中,CPU 211通过以预定的半透明色遮蔽所选择的块2701来强调显示该块,以使用户识别作为已经被选择为元数据值的块的块2701。用于强调显示所选择的块的方法不同于步骤S1103中用于强调显示候选块的方法。例如,步骤S1103中显示的候选块的背景色可以以淡颜色(例如淡黄色)来强调显示,而步骤S2501中显示的已经被选择的块的背景色可以以深颜色(例如深蓝色)来强调显示。图26B示出在步骤S2501中强调显示步骤S1104中选择的块的画面显示的示例。块2701通过以预定的半透明色被遮蔽而被强调显示。
根据第四典型实施例,已经被选择作为元数据键值的块可以被这样显示,因此提高了用户的可识别性。
其它实施例
本发明的实施例还可以通过如下的方法来实现,即,通过网络或者各种存储介质将执行上述实施例的功能的软件(程序)提供给系统或装置,该系统或装置的计算机或是中央处理单元(CPU)、微处理单元(MPU)读出并执行程序的方法。
虽然已经参考典型实施例描述了本发明,但应当理解的是本发明并不限于所描述的典型实施例。所附权利要求的范围符合最宽泛的解释,从而涵盖全部此类变型以及等同的结构和功能。

Claims (10)

1.一种用于控制画面的显示的方法,所述画面用于将元数据设置到扫描图像,所述方法包括:
管理多个元数据模板,其中,在所述多个元数据模板中定义不同键的组合,以及在各所述键中定义对应的数据格式;
基于扫描文档时的用户输入选择从所述多个元数据模板中确定的一个元数据模板;
基于所述一个元数据模板,来显示包括通过扫描所述文档所生成的扫描图像、所述一个元数据模板中定义的多个键、以及各自与所述多个键中的不同键相对应的值输入栏的画面;
在用户选择所述画面中显示的所述多个键中的任一个键的情况下,在所述画面中的所述扫描图像上、以使得被判断为与数据格式匹配的字符串区域能够被识别为候选的方式显示该字符串区域,所述判断是基于与所述一个元数据模板中定义的所选择的键相对应的值的数据格式来进行的;以及
在用户选择所显示的能够被识别为候选的所述字符串区域中的任一个字符串区域的情况下,将所选择的字符串区域的字符识别结果设置在所述画面中的与所选择的键相对应的值输入栏中。
2.根据权利要求1所述的方法,还包括:在用户发出预定指示的情况下,将在所述画面中设置的所述键和所述值存储为所述扫描图像的元数据。
3.根据权利要求1所述的方法,其中,所述值的数据格式包括以下项其中至少之一:表示任意字符串的文本型,表示具有日期格式的字符串的日期型,以及表示包括数字或金额的字符串的数值型。
4.根据权利要求3所述的方法,
其中,所述值的数据格式还包括表示要由用户从预定选项中选择的数据的选择型,以及
其中,在与用户从所示画面中显示的所述多个键中选择的键相对应的值的数据格式是所述选择型的情况下,提示用户从所述预定选项中选择期望选项,并且将所选择的选项设置在与所选择的键相对应的值输入栏中。
5.根据权利要求1所述的方法,其中,所述多个元数据模板是从外部设备获取的。
6.根据权利要求1所述的方法,其中,在用户选择所述画面中显示的所述多个键中的任一个键的情况下,在所述画面中的所述扫描图像上、以使得被判断为与数据格式完全匹配的字符串区域能够被识别为候选的方式显示该字符串区域,所述判断是基于与所述一个元数据模板中定义的所选择的键相对应的值的数据格式来进行的。
7.根据权利要求1所述的方法,其中,在用户选择所述画面中显示的所述多个键中的任一个键的情况下,在所述画面中的所述扫描图像上、以使得被判断为具有大于或等于阈值的数据格式匹配率的字符串区域能够被识别为候选的方式显示该字符串区域,所述判断是基于与所述一个元数据模板中定义的所选择的键相对应的值的数据格式来进行的。
8.根据权利要求1所述的方法,其中,在用户选择所显示的能够被识别为候选的所述字符串区域中的一个字符串区域的情况下,将所选择的字符串区域的字符识别结果设置在所述画面中的与所选择的键相对应的值输入栏中,并且在所述扫描图像上将所选择的字符串区域能够识别地显示为已经被选择的字符串区域。
9.一种存储有程序的非暂时性计算机可读存储介质,所述程序用于使处理器进行以下处理:
管理多个元数据模板,其中,在所述多个元数据模板中定义不同键的组合,以及在各所述键中定义对应的数据格式;
基于扫描文档时的用户输入选择从所述多个元数据模板中确定的一个元数据模板;
基于所述一个元数据模板,来显示包括通过扫描所述文档所生成的扫描图像、所述一个元数据模板中定义的多个键、以及各自与所述多个键中的不同键相对应的值输入栏的画面;
在用户选择所述画面中显示的所述多个键中的任一个键的情况下,在所述画面中的所述扫描图像上、以使得被判断为与数据格式匹配的字符串区域能够被识别为候选的方式显示该字符串区域,所述判断是基于与所述一个元数据模板中定义的所选择的键相对应的值的数据格式来进行的;以及
在用户选择所显示的能够被识别为候选的所述字符串区域中的任一个字符串区域的情况下,将所选择的字符串区域的字符识别结果设置在所述画面中的与所选择的键相对应的值输入栏中。
10.一种用于控制画面的显示的设备,所述画面用于将元数据设置到扫描图像,所述设备进行:
管理多个元数据模板,其中,在所述多个元数据模板中定义不同键的组合,以及在各所述键中定义对应的数据格式;
基于扫描文档时的用户输入选择从所述多个元数据模板中确定的一个元数据模板;
基于所述一个元数据模板,来显示包括通过扫描所述文档所生成的扫描图像、所述一个元数据模板中定义的多个键、以及各自与所述多个键中的不同键相对应的值输入栏的画面;
在用户选择所述画面中显示的所述多个键中的任一个键的情况下,在所述画面中的所述扫描图像上、以使得被判断为与数据格式匹配的字符串区域能够被识别为候选的方式显示该字符串区域,所述判断是基于与所述一个元数据模板中定义的所选择的键相对应的值的数据格式来进行的;以及
在用户选择所显示的能够被识别为候选的所述字符串区域中的任一个字符串区域的情况下,将所选择的字符串区域的字符识别结果设置在所述画面中的与所选择的键相对应的值输入栏中。
CN202011074932.2A 2019-10-03 2020-10-09 控制设置元数据的画面的显示的方法、存储介质及设备 Active CN112615970B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2019182961A JP7443012B2 (ja) 2019-10-03 2019-10-03 メタデータを設定するための設定方法、プログラム、装置
JP2019-182961 2019-10-03

Publications (2)

Publication Number Publication Date
CN112615970A CN112615970A (zh) 2021-04-06
CN112615970B true CN112615970B (zh) 2023-09-01

Family

ID=72613881

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011074932.2A Active CN112615970B (zh) 2019-10-03 2020-10-09 控制设置元数据的画面的显示的方法、存储介质及设备

Country Status (6)

Country Link
US (2) US11363163B2 (zh)
EP (1) EP3800875B1 (zh)
JP (1) JP7443012B2 (zh)
KR (1) KR20210040260A (zh)
CN (1) CN112615970B (zh)
RU (1) RU2020132287A (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7225017B2 (ja) * 2019-04-19 2023-02-20 キヤノン株式会社 タッチパネルを用いた文字入力のための画像処理装置、その制御方法及びプログラム
JP7472089B2 (ja) 2021-09-14 2024-04-22 ウイングアーク1st株式会社 情報処理装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4920499A (en) * 1987-09-30 1990-04-24 E. I. Du Pont De Nemours And Company Expert system with natural-language rule updating
US7415471B1 (en) * 2001-11-30 2008-08-19 Midland Loan Services, Inc. Methods and systems for automated data collection and analysis for use in association with asset securitization
JP2010102668A (ja) * 2008-10-27 2010-05-06 Hitachi Software Eng Co Ltd メタデータ抽出装置およびその方法

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8162125B1 (en) * 1996-05-29 2012-04-24 Cummins-Allison Corp. Apparatus and system for imaging currency bills and financial documents and method for using the same
US8165958B1 (en) * 1999-03-26 2012-04-24 Metavante Corporation Electronic bill presentation and payment method and system
JP2005184789A (ja) * 2003-11-27 2005-07-07 Fuji Photo Film Co Ltd 画像編集装置および方法並びにプログラム
US20050289182A1 (en) * 2004-06-15 2005-12-29 Sand Hill Systems Inc. Document management system with enhanced intelligent document recognition capabilities
US8150156B2 (en) * 2006-01-04 2012-04-03 International Business Machines Corporation Automated processing of paper forms using remotely-stored templates
WO2009022356A2 (en) * 2007-08-13 2009-02-19 Iserv Commerce India Pvt. Ltd. Method and system for sms-based electronic form processing
JP4752897B2 (ja) 2008-10-31 2011-08-17 ソニー株式会社 画像処理装置、画像表示方法および画像表示プログラム
US10726200B2 (en) * 2011-02-04 2020-07-28 Benjamin Chou Systems and methods for user interfaces that provide enhanced verification of extracted data
JP6080409B2 (ja) * 2012-07-09 2017-02-15 キヤノン株式会社 情報処理装置、情報処理方法、およびプログラム
US20140258838A1 (en) 2013-03-11 2014-09-11 Sap Ag Expense input utilities, systems, and methods
RU2651144C2 (ru) * 2014-03-31 2018-04-18 Общество с ограниченной ответственностью "Аби Девелопмент" Ввод данных с изображений документов с фиксированной структурой
US9117118B1 (en) * 2015-01-26 2015-08-25 Fast Yeti, Inc. Systems and methods for capturing and processing documents
US10740372B2 (en) * 2015-04-02 2020-08-11 Canon Information And Imaging Solutions, Inc. System and method for extracting data from a non-structured document
US20170214823A1 (en) * 2016-01-27 2017-07-27 Zonchi Pty Ltd Computer system for reformatting input fax data into an output markup language format
US9881225B2 (en) 2016-04-20 2018-01-30 Kabushiki Kaisha Toshiba System and method for intelligent receipt processing
US10630639B2 (en) * 2017-08-28 2020-04-21 Go Daddy Operating Company, LLC Suggesting a domain name from digital image metadata
CN109726173B (zh) * 2017-10-31 2023-01-31 京瓷办公信息系统株式会社 文件管理系统及文件管理方法
JP6871840B2 (ja) * 2017-11-06 2021-05-19 株式会社日立製作所 計算機及び文書識別方法
WO2019157025A1 (en) * 2018-02-06 2019-08-15 Vatbox, Ltd. System and method for generating an electronic template corresponding to an image of an evidence
US11631266B2 (en) * 2019-04-02 2023-04-18 Wilco Source Inc Automated document intake and processing system

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4920499A (en) * 1987-09-30 1990-04-24 E. I. Du Pont De Nemours And Company Expert system with natural-language rule updating
US7415471B1 (en) * 2001-11-30 2008-08-19 Midland Loan Services, Inc. Methods and systems for automated data collection and analysis for use in association with asset securitization
JP2010102668A (ja) * 2008-10-27 2010-05-06 Hitachi Software Eng Co Ltd メタデータ抽出装置およびその方法

Also Published As

Publication number Publication date
US11363163B2 (en) 2022-06-14
KR20210040260A (ko) 2021-04-13
EP3800875B1 (en) 2023-05-24
RU2020132287A (ru) 2022-04-01
EP3800875A1 (en) 2021-04-07
US20220272226A1 (en) 2022-08-25
JP2021060663A (ja) 2021-04-15
RU2020132287A3 (zh) 2022-04-01
US20210105380A1 (en) 2021-04-08
CN112615970A (zh) 2021-04-06
JP7443012B2 (ja) 2024-03-05

Similar Documents

Publication Publication Date Title
CN109961069B (zh) 图像处理装置以及存储介质
JP7434001B2 (ja) 情報処理装置、プログラム、情報処理方法
CN112615970B (zh) 控制设置元数据的画面的显示的方法、存储介质及设备
US11463594B2 (en) Image processing apparatus for inputting characters using touch panel, control method thereof and storage medium
US11252287B2 (en) Image processing apparatus that displays guidance for user operation, control method thereof and storage medium
US20200050405A1 (en) Image processing apparatus, method for controlling the same and storage medium
JP2018041415A (ja) 情報処理装置、情報処理方法および情報処理プログラム
CN102694940A (zh) 信息处理装置及其控制方法
US11265431B2 (en) Image processing apparatus for inputting characters using touch panel, control method thereof and storage medium
US10936896B2 (en) Image processing apparatus and image processing program
US20130057884A1 (en) Information processing apparatus, computer program, and control method
US11575799B2 (en) Image processing apparatus for setting property including character strings and separators to scanned image, control method thereof and storage medium
US10832081B2 (en) Image processing apparatus and non-transitory computer-readable computer medium storing an image processing program
US11588945B2 (en) Data input support apparatus that displays a window with an item value display area, an overview image display area, and an enlarged image display area
US11620434B2 (en) Information processing apparatus, information processing method, and storage medium that provide a highlighting feature of highlighting a displayed character recognition area
JP2020024582A (ja) 画像処理装置及びその制御方法、並びにプログラム
JP2009095006A (ja) 画像形成装置、方法、プログラム
US11151200B2 (en) Information processing apparatus and non-transitory computer readable medium storing information processing program for managing attribute information of document
JP5708372B2 (ja) 文書ファイルの差分抽出システム、画像処理装置、文書ファイルの差分抽出方法及びプログラム
US20230368555A1 (en) Information processing apparatus, information processing method, and storage medium
JP2021083068A (ja) 画像処理装置、画像処理システム、画像処理装置の制御方法
CN111698376A (zh) 图像处理装置、图像处理系统及非暂时性记录介质
JP2017220712A (ja) Fax送信デバイス、方法、およびプログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant