CN109426821A - 对扫描图像进行预定处理的设备、其控制方法和存储介质 - Google Patents

对扫描图像进行预定处理的设备、其控制方法和存储介质 Download PDF

Info

Publication number
CN109426821A
CN109426821A CN201810960344.5A CN201810960344A CN109426821A CN 109426821 A CN109426821 A CN 109426821A CN 201810960344 A CN201810960344 A CN 201810960344A CN 109426821 A CN109426821 A CN 109426821A
Authority
CN
China
Prior art keywords
character
character zone
scan image
zone
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810960344.5A
Other languages
English (en)
Other versions
CN109426821B (zh
Inventor
宫本大次郎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Publication of CN109426821A publication Critical patent/CN109426821A/zh
Application granted granted Critical
Publication of CN109426821B publication Critical patent/CN109426821B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/63Scene text, e.g. street names
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/16File or folder operations, e.g. details of user interfaces specifically adapted to file systems
    • G06F16/164File meta data generation
    • G06F16/166File name conversion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • G06V30/1456Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields based on user interactions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/768Arrangements for image or video recognition or understanding using pattern recognition or machine learning using context analysis, e.g. recognition aided by known co-occurring patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00204Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server
    • H04N1/00209Transmitting or receiving image data, e.g. facsimile data, via a computer, e.g. using e-mail, a computer network, the internet, I-fax
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00326Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus
    • H04N1/00328Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information
    • H04N1/00331Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information with an apparatus performing optical character recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00405Output means
    • H04N1/00408Display of information to the user, e.g. menus
    • H04N1/0044Display of information to the user, e.g. menus for image preview or review, e.g. to help the user position a sheet
    • H04N1/00461Display of information to the user, e.g. menus for image preview or review, e.g. to help the user position a sheet marking or otherwise tagging one or more displayed image, e.g. for selective reproduction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/0077Types of the still picture apparatus
    • H04N2201/0094Multifunctional device, i.e. a device capable of all of reading, reproducing, copying, facsimile transception, file transception

Abstract

一种对扫描图像进行预定处理的设备、其控制方法和存储介质。通过使用扫描图像的字符识别结果,用户可以通过简单操作来为该扫描图像设置诸如文件名等的补充信息。所述设备包括:显示控制单元,用于显示进行预定处理所用的UI画面,所述UI画面以用户能够选择的方式显示所述扫描图像中的字符区域;以及设置单元,用于对用户经由UI画面所选择的字符区域进行OCR处理,并且通过使用在OCR处理中所提取的字符串来设置预定处理的补充信息,其中,在用户选择多个字符区域的情况下,设置单元基于多个所选择的字符区域之间的位置关系来判断是否应在所提取的字符串之间插入分隔符,并且在判断为应插入分隔符的情况下,在所提取的字符串之间插入分隔符。

Description

对扫描图像进行预定处理的设备、其控制方法和存储介质
技术领域
本发明涉及使用扫描图像的字符识别结果并且为该扫描图像设置文件名等的技术。
背景技术
传统上,通过扫描来数字化纸质文档的方法已被广泛用作文档管理方法。此外,在数字化文档时,存在对所扫描的图像数据进行光学字符识别处理(OCR处理)并且将所识别的字符用于数字化后的文档文件的文件名的技术。例如,日本特开2008-176624公开了如下的技术:针对所扫描的图像数据预先设置进行OCR处理的多个区域,然后根据表示预先设置的文件名的格式的规则和各区域的字符识别结果来设置文件名。日本特开2008-176624还公开了:在设置表示文件名的格式的规则时,可以在多个区域的字符识别结果之间添加诸如连字符等的特定符号(分隔符)。
然而,在日本特开2008-176624所公开的方法中,需要针对各种文档设置OCR处理的对象区域和表示文件名的格式的规则。因此,为了向各种类型的文档适当地添加文件名,需要根据文档的类型来预先设置规则,这需要大量的时间和精力来完成该工作。另外,在日本特开2008-176624所公开的方法中,由于要在各区域的字符识别结果之间插入的分隔符遵循预先设置的规则,因此根据实际的扫描图像不能灵活地判断在添加文件名时是否插入分隔符。将参考附图给出具体示例。图1示出为报价单(quotation)的扫描图像设置文件名的情形。现在,假定对一个连续的字符串的每个区域(字符区域)进行OCR处理,并且设置在字符区域之间插入“_(下划线)”作为分隔符的规则。在图1所示的示例中,由于在“QUOTATION”的各字符(字母)之间存在空格,因此尽管“QUOTATION”不应分开这一事实,但将“QUOTATION”划分成各自包括一个字符的字符区域。结果,设置了文件名“Q_U_O_T_A_T_I_O_N”。在这种情况下,期望不应在字符识别结果之间插入分隔符,但日本特开2008-176624的技术不能应对这种情况。
本发明是为了解决上述问题而做出的,并且本发明的目的是使用扫描图像的字符识别结果,并且使得用户能够通过简单操作来为扫描图像设置文件名等。
发明内容
根据本发明,提供一种用于对通过扫描文档所获得的扫描图像进行预定处理的设备,所述设备包括:显示控制单元,用于显示进行所述预定处理所用的UI画面,所述UI画面以用户能够选择的方式显示所述扫描图像中的字符区域;以及设置单元,用于对用户经由所述UI画面所选择的字符区域进行OCR处理,并且通过使用在所述OCR处理中所提取的字符串来设置所述预定处理所用的补充信息,其中,在用户选择多个字符区域的情况下,所述设置单元基于多个所选择的字符区域之间的位置关系来判断是否应在所提取的字符串之间插入分隔符,并且在判断为应插入分隔符的情况下,在所提取的字符串之间插入分隔符。
一种用于对通过扫描文档所获得的扫描图像进行预定处理的设备的控制方法,所述控制方法包括以下步骤:利用显示控制单元,显示进行所述预定处理所用的UI画面,所述UI画面以用户能够选择的方式显示所述扫描图像中的字符区域;以及利用设置单元,对用户经由所述UI画面所选择的字符区域进行OCR处理,并且通过使用在所述OCR处理中所提取的字符串来设置所述预定处理所用的补充信息,其中,在进行设置的步骤中,在用户选择多个字符区域的情况下,基于多个所选择的字符区域之间的位置关系来判断是否应在所提取的字符串之间插入分隔符,并且在判断为应插入分隔符的情况下,在所提取的字符串之间插入分隔符。
一种非暂时性计算机可读存储介质,其存储程序,所述程序用于使计算机进行用于对通过扫描文档所获得的扫描图像进行预定处理的设备的控制方法,所述控制方法包括以下步骤:利用显示控制单元,显示进行所述预定处理所用的UI画面,所述UI画面以用户能够选择的方式显示所述扫描图像中的字符区域;以及利用设置单元,对用户经由所述UI画面所选择的字符区域进行OCR处理,并且通过使用在所述OCR处理中所提取的字符串来设置所述预定处理所用的补充信息,其中,在进行设置的步骤中,在用户选择多个字符区域的情况下,基于多个所选择的字符区域之间的位置关系来判断是否应在所提取的字符串之间插入分隔符,并且在判断为应插入分隔符的情况下,在所提取的字符串之间插入分隔符。
通过以下参考附图对典型实施例的说明,本发明的其它特征将变得明显。
附图说明
图1是示出现有技术的问题的图;
图2是示出图像处理系统的整体结构的图;
图3A是示出MFP的硬件结构的图;
图3B是示出文件服务器的硬件结构的图;
图4是示出MFP的软件结构的图;
图5是示出从扫描图像的生成起直到上传为止的操作控制的流程的流程图;
图6示出扫描设置画面的示例;
图7A和图7B示出预览画面的示例;
图8示出在预览画面上生成文件名的状态;
图9示出上传画面的示例;
图10是示出根据第一实施例的文件名生成处理的详情的流程图;
图11是示出根据第二实施例的文件名生成处理的详情的流程图;以及
图12是示出用于在连续的字符区域中自动选择字符串的处理的详情的流程图。
具体实施例
以下参考附图来根据优选实施例详细说明本发明。在以下实施例中示出的结构仅是示例性的,并且本发明不限于示意性示出的结构。
第一实施例
图像处理系统的结构
图2是示出根据本实施例的图像处理系统的整体结构的图。图像处理系统包括MFP110和文件服务器120,其中MFP 110和文件服务器120经由LAN(局域网)彼此连接以进行通信。
MFP(多功能打印机)110是具有诸如扫描器和打印机等的多个功能的多功能设备,并且是图像处理设备的示例。文件服务器120是用于存储并管理数字化的文档文件的外部服务器的示例。本实施例的图像处理系统包括MFP 110和文件服务器120,但不限于此。例如,MFP 110也可以用作文件服务器120。此外,可以采用代替LAN而是经由例如因特网的连接形式。此外,MFP 110连接至PSTN(公共交换电话网络),并且可以通过传真向传真机(未示出)发送图像数据并从传真机(未示出)接收图像数据。
图3A是MFP 110的硬件结构的图。MFP 110包括控制单元210、操作单元220、打印机单元221、扫描器单元222和调制解调器223。控制单元210包括以下的单元211~219以控制MFP 110的整体操作。CPU 211加载ROM 212中所存储的控制程序,并且执行并控制MFP 110的诸如扫描、打印和通信等的各种功能。RAM 213用作CPU 211的主存储器或者诸如工作区等的临时存储区域。应当注意,在本实施例中,一个CPU 211使用一个存储器(RAM 213或HDD214)来进行如后面将说明的流程图所示的各处理,但本发明不限于此。例如,多个CPU可以通过与多个RAM或HDD一起工作来进行处理。HDD 214是用于存储图像数据和各种程序的大容量存储单元。操作单元I/F 215是连接操作单元220和控制单元210的接口。操作单元220具有触摸面板和键盘等,并且接收用户的操作、输入和指示。打印机I/F 216是连接打印机单元221和控制单元210的接口。将打印所用的图像数据从控制单元210经由打印机I/F 216传送至打印机单元221并打印在打印介质上。扫描器I/F 217是连接扫描器单元222和控制单元210的接口。扫描器单元222扫描放置在压板或ADF(自动文档进给器)(未示出)上的文档以生成图像数据,并且将该图像数据经由扫描器I/F 217输入至控制单元210。MFP 110不仅可以从打印机单元221打印输出(复制)扫描器单元222所生成的图像数据,而且还可以发送图像数据的文件或通过电子邮件发送图像数据。调制解调器I/F 218是连接调制解调器223和控制单元210的接口。调制解调器223通过传真向PSTN上的传真机发送图像数据并从该传真机接收图像数据。网络I/F 219是使控制单元210(MFP 110)连接至LAN的接口。MFP110通过使用网络I/F 219来向LAN上的外部设备(例如,文件服务器120)发送图像数据和信息并从该外部设备接收各种信息。
图3B是文件服务器120的硬件结构的图。文件服务器120包括CPU 311、ROM 312、RAM 313、HDD 314和网络I/F 315。CPU 311加载ROM 312中所存储的控制程序,并且进行各种处理以控制文件服务器120的整体操作。RAM 313用作CPU 311的主存储器或者诸如工作区等的临时存储区域。HDD 314是用于存储图像数据和各种程序的大容量存储单元。网络I/F 315是使文件服务器120连接至LAN的接口。文件服务器120通过使用网络I/F 315来向LAN上的其它设备(例如,MFP 110)发送各种信息并从这些其它设备接收各种信息。
MFP的软件结构
图4是MFP 110的软件结构的图。将MFP 110的软件大致分成本机功能模块410和附加功能模块420这两者。本机功能模块410中所包括的单元是MFP 110中基本配备的功能模块。另一方面,附加功能模块420中所包括的单元是MFP 110中附加配备的功能模块,诸如通过应用的安装所实现的功能模块等。本实施例的附加功能模块420是基于Java(注册商标)的应用,并且可以容易地实现向MFP 110的功能添加。顺便提及,可以在MFP 110中安装其它应用(未示出)。以下将说明形成这两个功能模块410和420的各单元。
应用显示单元423进行显示控制,以将用于接收用户所进行的各种操作的UI画面显示在操作单元220的触摸面板上。后面将详细说明要显示的UI画面。扫描指示单元421响应于经由UI画面所输入的用户指示来将包括扫描设置信息和传送设置信息的扫描请求发送至扫描执行单元411,并且使扫描执行单元411进行扫描处理。扫描请求还包括请求ID,其中该请求ID用于标识后面将说明的应用接收单元422所接收到的图像数据是否对应于该扫描请求。
如果从扫描指示单元421接收到扫描请求,则扫描执行单元411经由扫描器I/F217控制扫描器单元222以进行扫描处理。因此,扫描文档并生成图像数据。将通过扫描所生成的图像数据(以下称为“扫描图像数据”)连同指定该图像数据的目的地的传送设置信息一起传递至传送单元412。传送单元412根据传送设置来传送从扫描执行单元411接收到的扫描图像数据。对于扫描图像数据的目的地,可以设置文件服务器120或者LAN上的PC(未示出)等。然而,在本实施例中,假定将扫描执行单元411所生成的所有扫描图像数据一次传送至附加功能模块420。传送单元412具有FTP(文件传输协议)客户端功能,并且通过使用FTP将扫描图像数据传送至具有FTP服务器功能的应用接收单元422。
应用接收单元422接收从传送单元412在内部传送的扫描图像数据,并且将该扫描图像数据传递至应用传送单元424。应用传送单元424将所接收到的扫描图像数据传递至图像分析单元425。图像分析单元425对所接收到的扫描图像数据进行图像分析处理,诸如指定字符区域和字符识别等。然后,将扫描图像数据及其分析结果经由应用传送单元424传递至预览显示单元426。基于扫描图像数据及其分析结果,预览显示单元426生成供用户设置文件名所用的UI画面,并且进行诸如在操作单元220的液晶面板上显示等的显示控制。
上传指示单元427生成供用户设置文件夹路径所用的UI画面,并且将该UI画面显示在操作单元220的触摸面板上。应用传送单元424将扫描图像数据传送(发送)至文件服务器120。如果传送完成,则应用传送单元424向应用显示单元423通知传送已完成。如果从应用传送单元424接收到通知,则应用显示单元423更新显示内容。此外,应用传送单元424具有SMB(服务器消息块)客户端功能。因此,通过使用SMB来针对具有SMB服务器功能的文件服务器120进行文件操作和文件夹操作。应当注意,要使用的协议不限于SMB。可以使用WebDAV、FTP或SMTP等。此外,可以使用诸如SOAP或REST等的除文件传输目的所使用的协议以外的协议。
接着,将说明MFP 110中的在从文档生成扫描图像并将该扫描图像上传到文件服务器120时的操作控制。图5是示出从扫描图像的生成起直到上传为止的控制流程的流程图。可以通过在控制单元210中由CPU 211执行HDD 214中所存储的控制程序来实现这一系列处理。以下将给出详细说明。
在步骤501(S501)中,利用应用显示单元423在操作单元220的触摸面板上显示用于进行扫描处理的各种设置的UI画面(以下称为“扫描设置画面”)。图6示出扫描设置画面的示例。图6的扫描设置画面600具有五个设置按钮601~605。[颜色设置]按钮601是用于设置扫描文档时的彩色/单色的按钮。[分辨率设置]按钮602是用于设置扫描文档时的分辨率的按钮。[双面扫描设置]按钮603是在需要扫描文档的两面的情况下使用的设置按钮。[混合文档设置]按钮604是在需要一次扫描不同大小的文档的情况下使用的设置按钮。[图像格式设置]按钮605是在指定扫描图像数据的保存格式时使用的设置按钮。在使用这些设置按钮601~605进行设置时,显示在MFP 110中支持的范围内可以设置的候选(选项),并且用户从所显示的候选中选择期望的设置。应当注意,说明了上述的设置按钮作为示例。并非所有这些设置项均应包括,并且可以包括除这些设置项以外的设置项。用户经由扫描设置画面600进行与扫描处理有关的详细设置。[取消]按钮620是在停止扫描设置时使用的按钮。[开始扫描]按钮621是用于指示开始对放置在压板等上的文档的扫描处理的按钮。
在步骤502中,利用应用显示单元423,根据用户所进行的按钮操作的内容来区分处理。在检测到按下了[开始扫描]按钮621的情况下,利用应用显示单元423向扫描指示单元421通知利用设置按钮601~605所设置的内容以及开始扫描处理的接收。另一方面,在检测到按下了[取消]按钮620的情况下,本处理结束。
在步骤503中,响应于来自扫描指示单元421的指示,利用扫描执行单元411进行扫描处理。在步骤504中,将如此获得的扫描图像数据通过传送单元412使用FTP在内部传送至应用接收单元422,并且进一步经由应用传送单元424传送至图像分析单元425。
在步骤505中,在图像分析单元425中,进行针对扫描图像数据的分析处理。更具体地,首先,关于扫描图像数据,进行图像信号的二值化、在扫描时移位的文档的倾斜的修正以及沿位置正确方向的文档转动等,以校正扫描图像数据的状态,使得平滑地进行分析处理。然后,对校正后的扫描图像(二值图像)进行边缘提取等,以指定图像中的字符区域、即假定为一个连续的字符串的块(单位区域)。以下的表1示出对给定的报价单的扫描图像的一部分所进行的图像分析处理的结果的示例。
表1
编号 区域的X坐标 区域的Y坐标 区域宽度 区域高度
1 40 5 5 5
2 45 5 5 5
3 50 5 5 5
4 55 5 5 5
5 60 5 5 5
6 65 5 5 5
7 70 5 5 5
8 75 5 5 5
9 80 5 5 5
10 38 20 10 5
11 5 20 30 5
12 78 20 30 5
13 78 28 18 5
14 5 35 23 5
15 5 45 33 5
16 75 40 30 5
17 75 50 43 5
在以上的表1中,[编号]表示所指定的各字符区域的唯一编号。在该示例中,序列号1~17是按识别顺序附加的。[区域的X坐标]表示所指定的各字符区域的左上角的X坐标。[区域的Y坐标]表示所指定的各字符区域的左上角的Y坐标。在下文,在对字符区域使用术语“坐标”的情况下,除非另外说明,否则该术语是指字符区域的左上角的位置坐标。[区域宽度]表示所指定的各字符区域的左边和右边之间的距离。[区域高度]表示所指定的各字符区域的上边和下边之间的距离。在本实施例中,[区域的X坐标]、[区域的Y坐标]、[区域宽度]和[区域高度]全部利用像素来表示,但也可以利用点或英寸等来表示。将与从扫描图像提取的各字符区域有关的信息(以下称为“字符区域信息”)作为图像分析数据传递至应用传送单元424。图像分析数据例如采用CSV或XML格式,但也可以采用其它格式。此外,图像分析数据可以在临时存储在HDD 214中之后在预定定时进行传递。
在步骤506中,利用预览显示单元426将在步骤S503中获得的扫描图像预览显示在操作单元220的触摸面板上。该预览显示所用的画面数据是由应用显示单元423生成并提供的。用户可以经由预览显示了扫描图像的UI画面(以下称为“预览画面”)设置扫描图像数据的文件名。图7A示出预览画面的示例。在预览画面700中,将所获得的扫描图像显示在位于画面中央的预览区域710中。此外,在预览区域710中,还连同该扫描图像一起显示用于改变该扫描图像的显示状态的多个按钮711~714。按钮711和712在不能显示扫描图像整体时出现,并且用于沿垂直方向滚动显示区域。通常,MFP 110中所配备的触摸板的大小并不是很大。因此,例如,在通过扫描具有横向书写的A4大小的纵向文档来获得扫描图像的情况下,进行初始设置,使得扫描图像以其整个宽度方向(短边方向)恰好适合预览区域71的状态、上对齐缩小显示。也就是说,在初始设置中,A4大小的纵向扫描图像的下部未显示在预览区域710内。在这种情况下,通过按“↓”按钮712,向下滚动显示区域并且可以显示下部。此外,在扫描图像为A4大小横向或A3大小等的情况下,可以进一步提供用于沿水平方向滚动显示区域的按钮。按钮713和714是用于缩放显示区域的按钮。按下“+”按钮713使得能够放大,并且按下“-”按钮714使得能够缩小。利用按钮操作的动作可以通过利用用户的手指的操作(诸如对预览画面的轻扫、捏合/分开等)来实现。在预览区域710中,基于上述的字符区域信息以可识别的方式向用户显示在步骤505的图像分析处理中指定的字符区域。图7B示出在图7A所示的预览画面700中利用框以可识别的方式显示各字符区域的状态,并且字符区域对应于以上的表1。如果用户从预览区域710内所显示的字符区域中选择(例如,用手指触摸)任何字符区域,则该字符区域中所包括的字符串显示(即,自动输入)在文件名输入栏701中,并且成为形成文件名的字符串的一部分。[后退]按钮720是在停止预览显示时使用的按钮。[下一步]按钮721是用于移动到设置所获得的扫描图像数据的上传目的地的画面的按钮。此外,按钮702是用于设置文件名的格式等的按钮。应当注意,将以上类型的各种按钮以及字符区域的显示和选择的方面作为示例进行了说明,并且这些按钮和方面不限于这些示例。例如,可以存在用于修正并改变文件名输入栏701中所显示的字符串、或者用于确认文件名的按钮。
在步骤507中,利用预览显示单元426生成所获得的扫描图像的文件名。图8示出生成文件名之后的预览画面700的状态。在该示例中,通过顺次选择与“Q”、“U”、“O”、“T”、“A”、“T”、“I”、“O”、“N”、“TokyoCorporation”和“04.14.2017”相对应的字符区域,将字符串“QUOTATION_TokyoCorporation_04.14.2017”显示并设置在文件名输入栏701中。此外,在预览区域710中,用户所触摸的字符区域的框改变为粗框以表示选择了这些框作为文件名的一部分。后面将说明文件名生成处理的详情。在生成期望的文件名并且用户按下[下一步]按钮721之后,处理进入步骤508。
在步骤508中,与步骤502相同,利用预览显示单元426,根据用户所进行的按钮操作的内容来区分处理。在检测到按下了[下一步]按钮721的情况下,将与在文件名输入栏701中正在显示的文件名(被设置为文件名的字符串)有关的信息发送至上传指示单元427,并且处理进入步骤509。另一方面,在检测到按下了[后退]按钮720的情况下,处理返回至步骤501(扫描设置画面的显示)。
在步骤509中,利用上传指示单元427在操作单元220的触摸面板上显示用于设置扫描图像数据的传送目的地的UI画面(以下称为“上传设置画面”)。用户经由上传设置画面进行与向文件服务器120的上传有关的详细设置。图9示出上传设置画面的示例。用户向文件夹路径输入栏901输入在向文件服务器120的外部传送时的文件夹路径的名称(路径名)。在图9的示例中,输入“04_04_2017”作为路径名。输入方法的示例是用于响应于对文件夹路径输入栏901的轻击而显示键盘画面的子窗口(未示出)、并且提示用户经由该键盘画面输入路径名的方法。可选地,可以从存储在HDD 214内的地址簿中选择并设置路径名。[后退]按钮920是在停止与上传有关的详细设置时使用的按钮。[上传]按钮921是用于指示向在文件夹路径输入栏901中设置的文件夹路径的上传的按钮。
在步骤510中,与步骤508相同,利用上传指示单元427,根据用户所进行的按钮操作的内容来区分处理。在检测到按下了[上传]按钮921的情况下,处理进入步骤511。此时,将输入至文件夹路径输入栏901的路径名、在步骤507中生成的文件名、以及与文件服务器设置有关的各种信息传递至应用传送单元424。顺便提及,文件服务器设置是将扫描图像数据存储在文件服务器120中所需的信息,并且具体包括诸如主机名、文件夹路径的起点、以及登录所用的用户名和密码等的信息。另一方面,在检测到按下了[后退]按钮920的情况下,处理返回至步骤506(预览画面的显示)。
在步骤511中,利用应用传送单元424基于从上传指示单元427接收到的信息来生成扫描图像数据的存储目的地路径。更具体地,通过将文件夹路径添加至文件服务器设置(文件服务器120的主机名、文件夹路径的起点)来生成存储目的地路径。因此,生成存储目的地路径(例如,“\\server01\Share\04_04_2017”)。然后,在步骤512中,利用应用传送单元424进行对文件服务器120的访问。此时,将文件服务器设置中所包括的用户名和密码发送至文件服务器120。在接收到了用户名和密码的文件服务器120中,进行验证处理。
在步骤513中,利用应用传送单元424,根据文件服务器120中的验证结果来区分处理。也就是说,在从文件服务器120接收到验证成功通知的情况下,处理进入步骤514。另一方面,在接收到验证失败的通知的情况下,本处理结束。
在步骤514中,利用应用传送单元424将扫描图像数据向外部传送至利用在步骤511中生成的存储目的地路径表示的文件夹并且存储在文件服务器120中。
以上说明是根据本实施例的从扫描图像的生成起直到上传为止的操作控制的内容。应当注意,在本实施例中,假定对与通过扫描所生成的一页相对应的图像数据进行步骤505~步骤507的处理。例如,可以在预览画面700中设置用于对下一页进行图像分析的按钮,并且可以预览显示通过分析所获得的下一页,使得可以从接着的页的字符区域中设置形成文件名的字符串。
文件名生成
图10是示出预览显示单元426中的文件名生成处理(步骤507)的详情的流程图。将根据图10的流程来给出说明。
在步骤1001中,监视用户对触摸面板上所显示的预览画面700的触摸操作的有无。如果检测到触摸操作,则处理进入步骤1002。在接着的步骤1002中,根据触摸操作的内容来区分处理。在触摸操作的内容是按下[下一步]按钮721或[后退]按钮720的情况下,本处理结束。在触摸操作的内容不是按下[下一步]按钮721或[后退]按钮720的情况下,处理进入步骤1003。
在步骤1003中,获得进行触摸操作的触摸面板上的位置坐标(x,y)。在接着的步骤1004中,判断与触摸操作有关的位置坐标与哪个字符区域重叠。例如,基于与触摸操作有关的位置坐标是否包括在预览区域710中所显示的各字符区域内(在由表示字符区域的四个角的位置坐标指定的矩形内)来进行判断。在与触摸操作有关的位置坐标与字符区域其中之一重叠的情况下,处理进入步骤1005。另一方面,在与触摸操作有关的位置坐标不与任何字符区域重叠的情况下,处理返回至步骤1001。
在步骤1005中,获得同与触摸操作有关的位置坐标重叠的字符区域中的字符串。通过对通过触摸操作所选择的字符区域(以下称为“选择字符区域”)进行OCR处理、并且利用图像分析单元425提取字符串,来获得该字符串。然后,在步骤1006中,获得文件名输入栏701中当前显示的文件名。在接着的步骤1007中,判断所获得的文件名的内容是否为“空”。如这里使用的文件名为“空”表示在文件名输入栏701中没有显示字符串的空栏状态。在所获得的文件名为“空”的情况下,处理进入步骤1010。另一方面,在所获得的文件名不为“空”的情况下,处理进入步骤1008。
在步骤1008中,基于当前选择的字符区域和上次选择的字符区域之间的位置关系,判断这两个字符区域是否在特定方向上连续。由于横向书写所用的通用语言(例如,日语和英语)的文本为从左向右,因此检查字符区域是否在右方向上连续(当前选择的字符区域是否在上次选择的字符区域的右侧)。当然,根据文档的格式或要使用的语言来检查垂直方向(下方向)上或者左方向上的连续性。更具体地,在以下的两个条件下,检查字符区域是否在特定方向上连续。
-两个字符区域具有相同的基准位置(在该示例中为左上角的Y坐标)。
-两个字符区域彼此相邻(在这两个字符区域之间不存在字符区域)。
应当注意,在比较基准位置时,考虑到扫描图像的倾斜等,将存在约数个像素的误差的基准位置判断为相同。此外,代替比较字符区域的特定坐标,可以使用字符区域的特定边(例如,下边)的位置作为基准来进行判断。可选地,可以附加地进行用于将相邻的字符区域之间的距离与预定阈值进行比较的阈值处理,并且仅在该距离等于或小于阈值的情况下,才判断为两个字符区域彼此相邻。可以使用任何预定阈值,但预定阈值可以例如小于字符区域高度的三倍、优选为字符区域的高度的约两倍。作为判断的结果,在当前选择的字符区域在上次选择的字符区域的右侧的情况下,处理进入步骤1010。另一方面,在当前选择的字符区域不在上次选择的字符区域的右侧的情况下,处理进入步骤1009。顺便提及,在纵向书写而不是横向书写的情况下,可以在上述条件下检查当前选择的字符区域是否在上次选择的字符区域的下侧。
在步骤1009中,进行用以向在步骤1006中获得的文件名的末尾添加预定分隔符的处理。将举例说明下划线作为预定分隔符,但预定分隔符不限于此。可以使用除下划线以外的符号和字符(例如,连字符)。此外,还可以使用不是可见字符的空格。
在步骤1010中,将在步骤1005中获得的字符串(从所选择的字符区域中提取的字符串)设置为文件名的构成元素。此时,在存在已设置的字符串的情况下,将在步骤1005中获得的字符串添加到已设置的字符串的末尾。然后,在步骤1011中,将当前设置的字符串显示(自动输入)在文件名输入栏701中。
以上说明是文件名生成处理的内容。根据该处理,仅在用户所选择的多个字符区域不连续的情况下,才在字符区域的字符识别结果之间插入分隔符,并且生成扫描图像的文件名。
现在,将参考以上的表1来说明用于生成图8所示的文件名“QUOTATION_TokyoCorporation_04.14.2017”的过程。首先,如以下所示,表1中的序列号1~17与字符区域相关联。
1:“Q”
2:“U”
3:“O”
4:“T”
5:“A”
6:“T”
7:“I”
8:“O”
9:“N”
10:“TokyoCorporation”
11:“Messrs.”
12:“Quotation No.”
13:“R-1234”
14:“Proposed Delivery Date”
15:“04.14.2017”
16:“Yokohama Corporation”
17:“Yokohama City 1000-1”
首先,如果检测到对“Q”的字符区域的触摸操作,则获得该字符区域的坐标和字符“Q”(步骤1001~步骤1006)。在该阶段文件名输入栏701没有显示字符串并且处于“空”状态(步骤1007中为“是”),因而在文件名输入栏701中显示“Q”(步骤1011)。在预览区域710中,为了表示根据用户的触摸操作而选择了“Q”作为文件名的一部分,将“Q”的字符区域的框改变为粗框。
接着,如果检测到对“U”的字符区域的触摸操作,则获得该字符区域的坐标和字符“U”(步骤1001~步骤1006)。在该阶段文件名输入栏701显示有字符“Q”并且不为“空”(步骤1007中为“否”)。因此,在上述两个条件下判断当前选择的“U”的字符区域和与上次选择有关的“Q”的字符区域是否彼此相邻(步骤1008)。首先,两个字符区域的Y坐标都为“5”(参见表1)。因此,满足了第一条件。接着,通过根据X坐标对Y坐标“5”上的所有字符区域进行排序、并且判断上次选择的字符区域和当前选择的字符区域是否按排序之后的顺序彼此相邻,来检查第二条件。现在,在“Q”的字符区域的Y坐标上,存在“U”的字符区域和“O”的字符区域。通过按升序根据X坐标对这三个字符区域进行排序,“Q”、“U”和“O”按该顺序横向排列,并且上次选择的字符区域和当前选择的字符区域彼此相邻(步骤1008中为“是”)。因此,将字符“U”添加到文件名输入栏701中的字符“Q”之后(步骤1010)。此时,文件名为“QU”。然后,响应于对字符区域的触摸操作,进行相同的处理,并且将字符“O”添加到文件名输入栏701中的字符“U”之后(步骤1010)。对“T”、“A”、“T”、“I”、“O”和“N”的字符区域也进行相同的处理。此时,文件名为“QUOTATION”。此外,在预览区域710中,与“Q”的字符区域相同,将“U”、“O”、“T”、“A”、“T”、“I”、“O”和“N”的字符区域的框改变为粗框。
接着,如果检测到对“Tokyo Corporation”的字符区域的触摸操作,则获得该字符区域的坐标和字符“Tokyo Corporation”(步骤1001~步骤1006)。在这种情况下,当前选择的“Tokyo Corporation”的字符区域和与上次选择有关的“N”的字符区域彼此不相邻(步骤1008中为“否”)。因此,将作为分隔符的下划线“_”附加地设置到文件名输入栏701中、字符“QUOTATION”之后(步骤1009)。此时,文件名为“QUOTATION_”。之后,进一步添加字符“TokyoCorporation”(步骤1010),并且文件名变为“QUOTATION_TokyoCorporation”。然后,如果检测到用户对“04.14.2017”的字符区域的触摸操作,则获得该字符区域的坐标和字符“04.14.2017”(步骤1001~步骤1006)。当前选择的“04.14.2017”的字符区域和与上次选择有关的“Tokyo Corporation”的字符区域彼此不相邻(步骤1008中为“否”)。因此,将作为分隔符的下划线“_”附加地设置到文件名输入栏701中、字符“TokyoCorporation”之后(步骤1009)。此时,文件名为“QUOTATION_TokyoCorporation_”。之后,进一步添加字符“04.14.2017”(步骤1010),最终获得文件名“QUOTATION_TokyoCorporation_04.14.2017”。此外,在预览区域710中,与“Q”、“U”、“O”、“T”、“A”、“T”、“I”、“O”和“N”的字符区域相同,将“Tokyo Corporation”和“04.14.2017”的框改变为粗框。
以上说明是文件名生成处理的内容。在本实施例中,已经说明了通过使用扫描图像内的字符区域的字符识别结果来设置文件名的情形的示例。然而,本发明的应用范围不限于设置文件名的情形。例如,文件名生成处理可应用于诸如扫描图像的上传目的地等的数据传送目的地设置、或者FAX(传真)发送或电子邮件发送中的目的地设置。在这种情况下,例如,在上述的图9所示的上传设置画面900中,可以可选地显示扫描图像中的字符区域的字符识别结果作为文件夹路径的候选,使得可以根据用户选择来设置路径名。此外,在目的地设置画面(未示出)中,可以可选地显示扫描图像中的字符区域的字符识别结果作为FAX号码或电子邮件地址的候选,使得可以根据用户选择来设置FAX号码或电子邮件地址。以这种方式,在除文件名设置以外的情形中,例如,在设置与扫描图像有关的各种信息(补充信息)(诸如设置数据传送目的地等)的情形中,本发明广泛适用。
如上所述,根据本实施例,通过顺次选择扫描图像中的字符区域,用户可以容易地将插入了分隔符的文件名等设置在适当位置。
第二实施例
接着,作为第二实施例,将说明以下方面:在将期望添加到文件名等的单词的构成字符划分成多个字符区域的情况下,将这些字符区域自动选择为一个连续的字符串、而无需用户逐一地选择每个字符区域。应当注意,将省略针对与第一实施例共通的内容(诸如MFP 110中的扫描操作控制的流程等)的说明。以下将主要说明作为本实施例的特征的文件名生成处理。
图11是示出根据本实施例的预览显示单元426的文件名生成处理的详情的流程图。步骤1101~步骤1109的处理与第一实施例的图10的流程中的步骤1001~步骤1009的处理相同。与图1的流程的不同之处为在文件名被判断为“空”(步骤1107中为“是”)之后的处理和添加分隔符(步骤1109)之后的处理。也就是说,在步骤1110中,预览显示单元426进行以下处理:从当前选择的字符区域中自动选择被判断为连续的字符区域中的字符串,作为形成文件名的字符串。图12是示出用于在连续的字符区域中自动选择字符串的处理的详情的流程图。以下将根据图12的流程来给出说明。
在步骤1201中,将从当前选择的字符区域中提取的字符串存储在专用缓冲器(以下称为“选择字符串缓冲器”)中。在接着的步骤1202中,参考预先准备的字典数据,判断字典数据是否包括与选择字符串缓冲器中所存储的字符串的开头一致的单词。在这种情况下,例如,假定字典数据预先存储在附加功能模块420中。字典数据包括例如常用单词的词汇表或通过用户预先登记期望单词所生成的原始词汇表、或者存储有用户用于文件名的字符串的历史信息。表2示出字典数据的示例。
表2
编号 单词
1 order form
2 Quotation
3 delivery statement
4 order acknowledgment
5 ...
6 ...
现在,在上述的图7B的预览画面700中,假定选择“Q”的字符区域。在这种情况下,将作为从“Q”的字符区域中提取的字符串的“Q”与表2所示的字典数据中的各单词进行比较,并且判断是否存在开头一致的单词。在该示例中,判断为编号2的“quotation”在开头一致。以这种方式,在字典数据包括开头一致的单词的情况下,处理进入步骤1203。另一方面,在字典数据不包括开头一致的单词的情况下,本处理结束并且处理进入图11的流程的步骤1111。
在步骤1203中,判断是否存在从当前选择的字符区域连续的字符区域。在本实施例中,根据在图10的流程的步骤1008的处理中使用的相同方法,来判断右侧是否存在连续的字符区域。在存在连续的字符区域的情况下,处理进入步骤1204。另一方面,在不存在连续的字符区域的情况下,本处理结束,并且处理进入图11的流程的步骤1111。
在步骤1204中,对判断为连续的字符区域进行OCR处理,并且将通过OCR处理所获得的字符串附加地存储在上述的选择字符串缓冲器中。因此,将与当前选择的字符区域连续的字符区域中的字符串以在当前选择的字符区域中的字符串之后的方式存储在选择字符串缓冲器中。然后,处理返回至步骤1202,并且判断字典数据是否包括与具有附加存储的字符串的选择字符串缓冲器中所存储的字符串的开头一致的单词。在不存在连续的字符串时,本处理结束。因此,将从与当前选择的字符区域连续的所有字符区域中提取的字符串顺次存储在选择字符串缓冲器中。
以上说明是字符串自动选择处理的内容。因此,在选择“Q”的字符区域的情况下,例如,还自动选择了在“Q”的右侧连续的“U”和“O”的字符区域。也就是说,用户可以省略对“U”的字符区域和“O”的字符区域的触摸操作和选择。将返回参考图11的流程来进行说明。
在步骤1111中,将选择字符串缓冲器内所存储的所有字符串都设置为文件名的构成元素。此时,在文件名输入栏701包括已设置的字符串的情况下,将选择字符串缓冲器内所存储的字符串添加到已设置的字符串的末尾。然后,在步骤1112中,将在步骤1111的附加设置之后的字符串显示在文件名输入栏701中。
以上说明是根据本实施例的文件名生成处理的内容。
变形例
在一些情况下,以上述方式获得的文件名可能违背用户的意图而不包括分隔符。因此,用户可以手动插入分隔符使得可以纠正文件名。在这种情况下,例如,基于字符区域是连续的判断结果,如果在字符区域之间没有插入分隔符,则在字符区域之间显示用于插入分隔符的按钮。在上述的图7B的示例中,在预览区域710中,在“Q”的字符区域和“U”的字符区域之间以及在“U”的字符区域和“O”的字符区域之间显示该按钮。然后,如果用户按下该按钮,则配置分隔符以插入在形成文件名的字符串中的相应位置。此时,每次按下该按钮时,可以切换分隔符的类型(例如,连字符、下划线、空格和无分隔符这四个类型)。此外,代替在预览区域710中设置按钮,可以在文件名输入栏701中所显示的字符串中显示表示分隔符的插入的候选位置的气球。顺便提及,本变形例也可应用于第一实施例。
根据本实施例,在将期望添加至文件名等的单词的构成字符划分成多个字符区域的情况下,将这些字符区域自动选择为一个连续的字符串,而无需用户选择所有的字符区域。这使得用户能够更高效地为扫描图像设置文件名等。
其它实施例
本发明的实施例还可以通过如下的方法来实现,即,通过网络或者各种存储介质将执行上述实施例的功能的软件(程序)提供给系统或装置,该系统或装置的计算机或是中央处理单元(CPU),微处理单元(MPU)读出并执行程序的方法。
根据本发明,通过使用扫描图像的字符识别结果,用户可以通过简单操作为扫描图像设置文件名等。
尽管已经参考典型实施例说明了本发明,但是应该理解,本发明不限于所公开的典型实施例。所附权利要求书的范围符合最宽的解释,以包含所有这类修改、等同结构和功能。

Claims (15)

1.一种用于对通过扫描文档所获得的扫描图像进行预定处理的设备,所述设备包括:
显示控制单元,用于显示进行所述预定处理所用的UI画面,所述UI画面以用户能够选择的方式显示所述扫描图像中的字符区域;以及
设置单元,用于对用户经由所述UI画面所选择的字符区域进行OCR处理,并且通过使用在所述OCR处理中所提取的字符串来设置所述预定处理所用的补充信息,
其中,在用户选择多个字符区域的情况下,所述设置单元基于多个所选择的字符区域之间的位置关系来判断是否应在所提取的字符串之间插入分隔符,并且在判断为应插入分隔符的情况下,在所提取的字符串之间插入分隔符。
2.根据权利要求1所述的设备,其中,在用户当前选择的字符区域和紧挨在当前选择的字符区域之前选择的字符区域在特定方向上不连续的情况下,所述设置单元插入分隔符。
3.根据权利要求2所述的设备,其中,所述设置单元基于当前选择的字符区域中的基准位置与紧挨在当前选择的字符区域之前选择的字符区域中的基准位置是否相同、以及当前选择的字符区域与紧挨在当前选择的字符区域之前选择的字符区域是否相邻,来判断当前选择的字符区域和紧挨在当前选择的字符区域之前选择的字符区域是否在特定方向上连续。
4.根据权利要求3所述的设备,其中,在当前选择的字符区域和紧挨在当前选择的字符区域之前选择的字符区域之间不存在其它字符区域的情况下,所述设置单元判断为当前选择的字符区域与紧挨在当前选择的字符区域之前选择的字符区域相邻。
5.根据权利要求4所述的设备,其中,在对当前选择的字符区域与紧挨在当前选择的字符区域之前选择的字符区域是否相邻进行判断的情况下,所述设置单元将这两个字符区域之间的距离与预定阈值进行比较,并且仅在该距离等于或小于所述预定阈值的情况下,才判断为这两个字符区域彼此相邻。
6.根据权利要求5所述的设备,其中,所述预定阈值小于用户所选择的字符区域的高度的三倍。
7.根据权利要求1所述的设备,其中,所述设置单元具有登记了多个单词的字典数据,以及
在所述字典数据包括与从用户当前选择的字符区域中提取的字符串的开头一致的单词的情况下,所述设置单元进一步对与所选择的字符区域在特定方向上连续的字符区域进行所述OCR处理,并且通过使用在所述OCR处理中所提取的字符串来设置所述补充信息。
8.根据权利要求2所述的设备,其中,所述特定方向是基于所述文档的格式或所述文档中使用的语言所确定的。
9.根据权利要求1所述的设备,其中,
所述显示控制单元显示用于在形成所述设置单元所设置的补充信息的字符串之间插入分隔符的按钮,以及
所述设置单元将分隔符插入用户所按下的所述按钮的位置。
10.根据权利要求1所述的设备,其中,
所述预定处理是用于存储与所述扫描图像有关的数据的处理,以及
所述补充信息是存储所述扫描图像时的文件名。
11.根据权利要求1所述的设备,其中,
所述预定处理是用于将与所述扫描图像有关的数据上传到预定位置中的处理,以及
所述补充信息是表示上传目的地的路径名。
12.根据权利要求1所述的设备,其中,
所述预定处理是用于通过传真发送与所述扫描图像有关的数据的处理,以及
所述补充信息是传真号码。
13.根据权利要求1所述的设备,其中,
所述预定处理是用于通过电子邮件发送与所述扫描图像有关的数据的处理,以及
所述补充信息是电子邮件地址。
14.一种用于对通过扫描文档所获得的扫描图像进行预定处理的设备的控制方法,所述控制方法包括以下步骤:
利用显示控制单元,显示进行所述预定处理所用的UI画面,所述UI画面以用户能够选择的方式显示所述扫描图像中的字符区域;以及
利用设置单元,对用户经由所述UI画面所选择的字符区域进行OCR处理,并且通过使用在所述OCR处理中所提取的字符串来设置所述预定处理所用的补充信息,
其中,在进行设置的步骤中,在用户选择多个字符区域的情况下,基于多个所选择的字符区域之间的位置关系来判断是否应在所提取的字符串之间插入分隔符,并且在判断为应插入分隔符的情况下,在所提取的字符串之间插入分隔符。
15.一种非暂时性计算机可读存储介质,其存储程序,所述程序用于使计算机进行用于对通过扫描文档所获得的扫描图像进行预定处理的设备的控制方法,所述控制方法包括以下步骤:
利用显示控制单元,显示进行所述预定处理所用的UI画面,所述UI画面以用户能够选择的方式显示所述扫描图像中的字符区域;以及
利用设置单元,对用户经由所述UI画面所选择的字符区域进行OCR处理,并且通过使用在所述OCR处理中所提取的字符串来设置所述预定处理所用的补充信息,
其中,在进行设置的步骤中,在用户选择多个字符区域的情况下,基于多个所选择的字符区域之间的位置关系来判断是否应在所提取的字符串之间插入分隔符,并且在判断为应插入分隔符的情况下,在所提取的字符串之间插入分隔符。
CN201810960344.5A 2017-08-22 2018-08-22 对扫描图像进行预定处理的设备、其控制方法和存储介质 Active CN109426821B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2017159540A JP6891073B2 (ja) 2017-08-22 2017-08-22 スキャン画像にファイル名等を設定するための装置、その制御方法及びプログラム
JP2017-159540 2017-08-22

Publications (2)

Publication Number Publication Date
CN109426821A true CN109426821A (zh) 2019-03-05
CN109426821B CN109426821B (zh) 2023-09-19

Family

ID=65435189

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810960344.5A Active CN109426821B (zh) 2017-08-22 2018-08-22 对扫描图像进行预定处理的设备、其控制方法和存储介质

Country Status (4)

Country Link
US (1) US10860785B2 (zh)
JP (1) JP6891073B2 (zh)
KR (1) KR102408019B1 (zh)
CN (1) CN109426821B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113225446A (zh) * 2020-01-21 2021-08-06 佳能株式会社 使文档计算机化的图像处理系统及其控制方法和存储介质

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7062388B2 (ja) * 2017-08-22 2022-05-06 キヤノン株式会社 スキャン画像にファイル名等を設定するための装置、その制御方法及びプログラム
JP7102284B2 (ja) * 2018-08-23 2022-07-19 株式会社Pfu ファイル管理装置、ファイル管理方法、及びプログラム
JP7330742B2 (ja) * 2019-04-19 2023-08-22 キヤノン株式会社 スキャン画像にプロパティを設定するための画像処理装置、その制御方法及びプログラム
JP7358663B2 (ja) 2019-04-19 2023-10-10 キヤノン株式会社 タッチパネルを用いた文字入力のための画像処理装置、その制御方法及びプログラム
JP7225017B2 (ja) * 2019-04-19 2023-02-20 キヤノン株式会社 タッチパネルを用いた文字入力のための画像処理装置、その制御方法及びプログラム
JP7297510B2 (ja) 2019-04-19 2023-06-26 キヤノン株式会社 ユーザ操作のためのガイダンスを表示する画像処理装置、その制御方法及びプログラム
JP7387282B2 (ja) * 2019-04-19 2023-11-28 キヤノン株式会社 スキャン画像のプレビュー表示を行なう画像処理装置、その制御方法及びプログラム
JP7400548B2 (ja) * 2020-03-03 2023-12-19 富士フイルムビジネスイノベーション株式会社 情報処理装置、画像処理装置、情報処理システム、及びプログラム
JP7434001B2 (ja) 2020-03-13 2024-02-20 キヤノン株式会社 情報処理装置、プログラム、情報処理方法
JP2021163983A (ja) 2020-03-30 2021-10-11 キヤノン株式会社 サーバー、情報処理方法、プログラム
JP2021184190A (ja) * 2020-05-22 2021-12-02 キヤノン株式会社 画像処理装置、画像処理方法、およびプログラム
JP2022091530A (ja) * 2020-12-09 2022-06-21 キヤノン株式会社 情報処理装置、画像処理システム、制御方法、並びにプログラム
JP2022095391A (ja) * 2020-12-16 2022-06-28 富士フイルムビジネスイノベーション株式会社 情報処理装置、及び情報処理プログラム
JP2023040888A (ja) * 2021-09-10 2023-03-23 キヤノン株式会社 画像処理システム、サーバとその制御方法、及びプログラム
JP2023160049A (ja) * 2022-04-21 2023-11-02 キヤノン株式会社 情報処理装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050063009A1 (en) * 2003-08-07 2005-03-24 Mikinori Ehara Information processing apparatus, and computer product
CN1839396A (zh) * 2003-08-20 2006-09-27 奥西-技术有限公司 文档扫描仪
CN101355626A (zh) * 2007-07-23 2009-01-28 佳能株式会社 图像处理设备和方法、计算机程序和可读存储介质
US20130329263A1 (en) * 2012-06-06 2013-12-12 Canon Kabushiki Kaisha Image processing apparatus, and image processing method and program therefor
US20140141836A1 (en) * 2009-07-18 2014-05-22 Abbyy Software Ltd. Entering Information Through an OCR-Enabled Viewfinder
US20160072968A1 (en) * 2014-09-08 2016-03-10 Konica Minolta, Inc. Electronic document generation apparatus, recording medium, and electronic document generation system

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5689342A (en) * 1994-11-17 1997-11-18 Canon Kabushiki Kaisha Image processing method and apparatus which orders text areas which have been extracted from an image
JP2008071050A (ja) * 2006-09-13 2008-03-27 Sharp Corp 情報処理端末装置、情報処理装置、ファイル管理サーバ、情報処理システム、ファイル名自動生成方法、プログラムおよび記録媒体
JP2008176624A (ja) 2007-01-19 2008-07-31 Seiko Epson Corp 文字認識結果の管理装置およびその方法並びにコンピュータプログラム
US9129036B2 (en) * 2008-02-22 2015-09-08 Tigerlogic Corporation Systems and methods of identifying chunks within inter-related documents
US8566088B2 (en) * 2008-11-12 2013-10-22 Scti Holdings, Inc. System and method for automatic speech to text conversion
US8373724B2 (en) * 2009-01-28 2013-02-12 Google Inc. Selective display of OCR'ed text and corresponding images from publications on a client device
JP5430312B2 (ja) * 2009-09-15 2014-02-26 シャープ株式会社 データ処理装置、データ名生成方法及びコンピュータプログラム
JP5594269B2 (ja) * 2011-09-29 2014-09-24 コニカミノルタ株式会社 ファイル名作成装置、画像形成装置、およびファイル名作成プログラム
CN102831106A (zh) * 2012-08-27 2012-12-19 腾讯科技(深圳)有限公司 一种移动终端的电子文档生成方法及移动终端
KR102147935B1 (ko) * 2013-08-29 2020-08-25 삼성전자주식회사 데이터 처리 방법 및 그 전자 장치
JP2015215878A (ja) * 2014-04-21 2015-12-03 株式会社リコー 画像処理装置及び画像処理システム
JP6220770B2 (ja) * 2014-12-12 2017-10-25 株式会社エヌ・ティ・ティ・データ 帳票定義装置、帳票定義方法、及び帳票定義プログラム
JP6762722B2 (ja) * 2016-01-18 2020-09-30 キヤノン株式会社 情報処理装置、制御方法、及びプログラム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050063009A1 (en) * 2003-08-07 2005-03-24 Mikinori Ehara Information processing apparatus, and computer product
CN1839396A (zh) * 2003-08-20 2006-09-27 奥西-技术有限公司 文档扫描仪
CN101355626A (zh) * 2007-07-23 2009-01-28 佳能株式会社 图像处理设备和方法、计算机程序和可读存储介质
US20140141836A1 (en) * 2009-07-18 2014-05-22 Abbyy Software Ltd. Entering Information Through an OCR-Enabled Viewfinder
US20130329263A1 (en) * 2012-06-06 2013-12-12 Canon Kabushiki Kaisha Image processing apparatus, and image processing method and program therefor
US20160072968A1 (en) * 2014-09-08 2016-03-10 Konica Minolta, Inc. Electronic document generation apparatus, recording medium, and electronic document generation system

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113225446A (zh) * 2020-01-21 2021-08-06 佳能株式会社 使文档计算机化的图像处理系统及其控制方法和存储介质

Also Published As

Publication number Publication date
KR20190021161A (ko) 2019-03-05
CN109426821B (zh) 2023-09-19
KR102408019B1 (ko) 2022-06-14
JP2019041150A (ja) 2019-03-14
US10860785B2 (en) 2020-12-08
JP6891073B2 (ja) 2021-06-18
US20190065451A1 (en) 2019-02-28

Similar Documents

Publication Publication Date Title
CN109426821A (zh) 对扫描图像进行预定处理的设备、其控制方法和存储介质
CN109426817B (zh) 用于进行预定处理的设备及其控制方法和存储介质
US11386046B2 (en) Apparatus for setting file name for scan image, method of controlling same, and storage medium
JP7034730B2 (ja) スキャン画像に関連する情報を設定するための装置、方法、およびプログラム
JP6849387B2 (ja) 画像処理装置、画像処理システム、画像処理装置の制御方法、及びプログラム
US11062134B2 (en) Apparatus for setting file name and the like for scan image, control method thereof, and storage medium
US11144189B2 (en) Determination and relocation of movement targets based on a drag-and-drop operation of a thumbnail across document areas
CN113225446A (zh) 使文档计算机化的图像处理系统及其控制方法和存储介质
JP6762722B2 (ja) 情報処理装置、制御方法、及びプログラム
US20240073330A1 (en) Image processing apparatus for inputting characters using touch panel, control method thereof and storage medium
US9521279B2 (en) Image reproducing method and digital processing machine using such method
US11252287B2 (en) Image processing apparatus that displays guidance for user operation, control method thereof and storage medium
US11265431B2 (en) Image processing apparatus for inputting characters using touch panel, control method thereof and storage medium
CN103139421A (zh) 图像处理装置及其控制方法
US20040196471A1 (en) Image forming apparatus and image forming method for making image output setting easily
US20230156138A1 (en) Information processing apparatus, method of controlling information processing apparatus, and storage medium
US11575799B2 (en) Image processing apparatus for setting property including character strings and separators to scanned image, control method thereof and storage medium
US11012584B2 (en) Image forming apparatus, method of processing image, and recording medium storing image processing program
JP2019068323A (ja) スキャン画像にファイル名を設定するための装置、その制御方法及びプログラム
JP2019161639A (ja) 画像処理装置、プログラム、画像処理方法
JP2017139693A (ja) 情報処理装置、情報処理方法及びプログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant