CN113179356A - 信息处理装置、控制方法以及记录介质 - Google Patents

信息处理装置、控制方法以及记录介质 Download PDF

Info

Publication number
CN113179356A
CN113179356A CN202110107829.1A CN202110107829A CN113179356A CN 113179356 A CN113179356 A CN 113179356A CN 202110107829 A CN202110107829 A CN 202110107829A CN 113179356 A CN113179356 A CN 113179356A
Authority
CN
China
Prior art keywords
handwritten
file name
file
image data
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110107829.1A
Other languages
English (en)
Other versions
CN113179356B (zh
Inventor
小西阳介
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Publication of CN113179356A publication Critical patent/CN113179356A/zh
Application granted granted Critical
Publication of CN113179356B publication Critical patent/CN113179356B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00326Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus
    • H04N1/00328Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information
    • H04N1/00331Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information with an apparatus performing optical character recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/04Scanning arrangements, i.e. arrangements for the displacement of active reading or reproducing elements relative to the original or reproducing medium, or vice versa
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/14Details of searching files based on file metadata
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/416Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/16File or folder operations, e.g. details of user interfaces specifically adapted to file systems
    • G06F16/164File meta data generation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/28Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
    • G06V30/287Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of Kanji, Hiragana or Katakana characters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/02Arrangements for detecting or preventing errors in the information received by diversity reception
    • H04L1/04Arrangements for detecting or preventing errors in the information received by diversity reception using frequency diversity
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/0077Types of the still picture apparatus
    • H04N2201/0094Multifunctional device, i.e. a device capable of all of reading, reproducing, copying, facsimile transception, file transception

Abstract

本发明的信息处理装置包括:判定部,其根据图像数据判定包含有手写图形的区域;识别部,其根据所述手写图形识别手写字符;获取部,其获取文件名;以及生成部,其基于所述图像数据,当通过所述识别部识别出手写字符时,生成基于该手写字符的文件名的文件,当通过所述识别部未识别出手写字符时,生成通过所述获取部获取到的所述文件名的文件。

Description

信息处理装置、控制方法以及记录介质
技术领域
本发明涉及信息处理装置等。
背景技术
以往来,在图像形成装置中,存在将读取到的原稿等的图像数据从图像形成装置发送到其他装置的装置。例如,已知图像形成装置读取由使用者发出了读取的指示的原稿,将读取到的原稿的图像数据作为附件,向由使用者指示的发送目的地发送邮件的Scan toE-mail(扫描到邮件)功能。
一般来说,在从图像形成装置向其他装置发送文件时,使用者需要操作操作面板输入文件名,或者选择预先准备的项目来决定文件名。因此,提出了简易地设定文件名的技术。例如,公开了如下技术:通过对图像数据进行OCR(Optical Character Recognition,光学字符识别)处理来提取字符串,选择多个字符串作为文件名,合成高频率的名词作为文件名,或者从提取出的字符串提取特征词作为文件名(例如,参照专利文献1)。
现有技术文献
专利文献
专利文献1:特开2005-275849
发明内容
本发明所要解决的技术问题
专利文献1记载的技术是图像形成装置基于进行OCR处理而提取的字符串来设定文件名。但是,也考虑到使用者所期望的文件名未出现在图像数据内的情况。在这种情况下,即使图像形成装置从图像数据中提取字符串,所提取的字符串中也不包含使用者所期望的文件名。因此,即使让使用者选择提取的字符串,或从提取的字符串提取特征词,图像形成装置也不能设定使用者所期望的文件名。
另外,提取出的字符串中高频率的名词被认为是多个文章所包含的名词,有可能是不表示特征性意义的名词。因此,图像形成装置中存在即使组合高频率的名词,也将不表示特定的意思且内容难以掌握的字符串设定为文件名的可能性。
鉴于上述问题,本发明的目的在于,提供能够让使用者容易地设定文件名的信息处理装置等。
用于解决问题的方案
为了解决上述问题,本发明的信息处理装置的特征在于,包括:
判定部,其根据图像数据判定包含有手写图形的区域;
识别部,其根据所述手写图形识别手写字符;
获取部,其获取文件名;以及
生成部,其基于所述图像数据,当通过所述识别部识别出手写字符时,生成基于该手写字符的文件名的文件,当通过所述识别部未识别出手写字符时,生成通过所述获取部获取到的所述文件名的文件。
本发明的控制方法的特征在于,包括:
判定步骤,根据图像数据判定包含有手写图形的区域;
识别步骤,根据所述手写图形识别手写字符;
获取步骤,获取文件名;以及
生成步骤,基于所述图像数据,当通过所述识别步骤识别出手写字符时,生成基于该手写字符的文件名的文件,当通过所述识别步骤未识别出手写字符时,生成通过所述获取步骤获取到的所述文件名的文件。
本发明的记录介质为存储有程序的非暂时性记录介质,其特征在于,所述程序用于使计算机执行以下步骤:
判定步骤,根据图像数据判定包含有手写图形的区域;
识别步骤,根据所述手写图形识别手写字符;
获取步骤,获取文件名;以及
生成步骤,基于所述图像数据,当通过所述识别步骤识别出手写字符时,生成基于该手写字符的文件名的文件,当通过所述识别步骤未识别出手写字符时,生成通过所述获取步骤获取到的所述文件名的文件。
发明效果
根据本发明,使用者能够容易地设定文件名。
附图说明
图1是第一实施方式中的图像形成装置的外观立体图。
图2是用于说明第一实施方式中的图像形成装置的功能构成的框图。
图3是示出第一实施方式中的手写区域信息的数据构成的图。
图4是用于说明第一实施方式中的文件发送处理的流程的流程图。
图5是用于说明第一实施方式的动作例的图。
图6是用于说明第二实施方式中的动作例的图。
图7是用于说明第三实施方式中的文件发送处理的流程的流程图。
图8是用于说明第四实施方式中的文件发送处理的流程的流程图。
图9是用于说明第四实施方式中的手写字符涂覆处理的流程图。
图10是用于说明第四实施方式中的动作例的图。
图11是用于说明第五实施方式中的文件发送处理的流程图。
图12是用于说明第五实施方式中的标记识别处理的流程图。
图13是用于说明第六实施方式中的文件发送处理的流程图。
图14是用于说明第七实施方式中的文件发送处理的流程图。
具体实施方式
以下,参照附图说明本发明的实施方式。在本实施方式中,作为一个示例,对具备应用了本发明的信息处理装置的图像形成装置进行说明。另外,本发明也可以应用于终端装置、服务器装置等信息处理装置、扫描仪等图像读取装置。
[1.第一实施方式]
[1.1功能构成]
参照图1和图2说明本实施方式的图像形成装置10的功能构成。图1是图像形成装置10的外观立体图,图2是图像形成装置10的功能构成图。如图2所示,图像形成装置10包括控制部100、图像输入部110、图像处理部120、图像形成部130、显示部140、操作输入部150、通信部160和存储部170。
控制部100是用于控制整个图像形成装置10的功能部。控制部100例如由一个或多个运算装置(CPU(Central Processing Unit,中央处理单元))等构成,
通过读出各种程序并执行,来实现各种功能。另外,控制部100通过读出存储部170中存储的程序并执行,还作为手写判定部102、字符识别部104、文件名设定部106、文件生成部108发挥功能。
本实施方式的手写判定部102根据图像数据判定包含手写图形的区域(手写区域)。手写图形是指由使用者在原稿上手写的图形,包括字符(例如,英文数字、平假名、片假名、汉字、符号等)、点、线、矩形等。
手写判定部102例如基于图像数据所包含的边缘的像素的特征来判定是否是手写图形。此处,假定在图像数据中,通过手写制作的图形的边缘处的像素的浓度的变化与手写以外(例如,作为印刷的字符的活字、手写以外的图形)的边缘的像素的浓度的变化相比,缓慢地变化。基于该假设,手写判定部102判定手写图形中包含的边缘的像素的浓度的变化是否缓慢。
手写判定部102针对每个边缘计算上升或者下降的部分中的像素的浓度的变化量。而且,手写判定部102将计算出的浓度的变化量与表示通过手写制作的字符的视为边缘的浓度的变化量的上限的阈值进行比较。如果所关注的边缘的上升或者下降的部分中的像素的浓度的变化量未达到阈值,则手写判定部102判定为所关注的边缘是通过手写制作的手写图形的边缘。另外,如果所关注的边缘的上升或者下降的部分中的像素的浓度的变化量为阈值以上,则手写判定部102判定为所关注的边缘是通过手写以外的方法制作的图形的边缘。而且,将手写图形的边缘包含一定范围的区域判定为手写区域。
此外,作为根据图像数据判定手写区域的方法,除了上述方法以外,也能够利用例如日本专利第4420877号公报中记载的方法等公知的技术。
手写判定部102将能够确定图像数据中包含的手写区域的信息作为手写区域信息存储在存储部170的手写区域信息存储区域174中。手写区域信息例如包含能够确定包含手写图形的矩形状的区域的图像数据的坐标(例如“(30,50)-(280,90)”)。此外,图像数据的坐标是指,在将图像数据的左上的像素作为原点,将从原点到所关注的像素为止所包含的横向的像素数设为x,将纵向的像素数设为y的情况下,表现为(x,y)的坐标。另外,手写区域信息也可以是设想了包含手写图形的多边形状的区域的情况下的顶点的坐标。
另外,使用者在原稿上进行手写时,考虑在不包含活字的字符、照片的空白的部分等原稿内的一部分区域中通过手写来记载字符。因此,为了根据图像数据中的一部分区域判定手写区域,手写判定部102也可以在设定了与原稿的空白的区域对应的区域(空白区域)的基础上,从空白区域判定手写区域。
例如,手写判定部102将从图像数据的各边的端到规定的距离(例如,相当于3cm的距离、像素数)为止的区域设定为空白区域,由此将包含记载于图像数据的边缘的手写图形的区域作为手写区域。在该情况下,手写判定部102不将包含有在图像数据的边缘以外的区域记载的手写图形(例如,构成使用者记载为笔记的字符的手写图形)的区域作为手写区域来处理。
此外,空白区域的设定方法不限于上述范围。例如,手写判定部102可以将图像数据的角落的周边的区域设定为空白区域,也可以仅将从图像数据的特定的边(例如,下边)的端到规定的距离(像素数)为止的区域设定为空白区域。
另外,手写判定部102也可以基于后述的图像处理部120所执行的图像数据的区域的分离的处理的结果来设定空白区域。例如,在通过图像处理部120执行了将图像数据分离为字符区域、照片区域、网点区域、基底区域的处理的情况下,手写判定部102也可以将不包含在任一个区域中的区域设为空白区域。此外,这里的字符区域是指包含印刷的字符即活字的字符的区域。这种情况下的空白区域是指包含印刷的字符、图形、图案的区域以外的区域,且是基底的区域以外的区域。
字符识别部104从图像数据识别字符。字符识别部104例如通过对图像数据执行OCR(Optical Character Recognition:光学字符识别)处理,来进行手写字符以及活字的字符的识别。在本实施方式中,手写字符是指由手写图形构成的字符,且是基于手写图形被识别的字符。另外,活字的字符是指基于手写图形以外的图形被识别的字符,具体而言,是指基于通过印刷表示的字体被识别的字符。
例如,字符识别部104对由手写判定部102判定的手写区域中包含的手写图形进行字符的识别。通过这样,字符识别部104能够基于手写图形来识别手写字符。其结果,字符识别部104即使在图像数据中表示手写字符和活字的字符的情况下,也不识别活字的字符。此外,在本实施方式中,字符识别部104将识别到的字符作为字符识别结果信息176存储在存储部170中。另外,手写字符也可以是2个字符以上的字符串。
此外,字符识别部104也可以不使用手写判定部102所判定的手写区域的信息,而直接从图像数据识别手写字符。例如,存储部170预先存储包含手写字符的模式的词典DB。字符识别部104也可以通过利用词典DB,通过模式识别来识别手写字符。此时,字符识别部104可以从图像数据仅直接识别手写字符,也可以一并识别手写字符以外的字符(例如,活字的字符),从识别为字符的对象去除活字的字符,仅识别手写字符。另外,字符识别部104可以利用机械学习进行字符识别,也可以利用外部的手写字符识别库。
文件名设定部106设定由后述的文件生成部108生成的文件的文件名。在本实施方式中,文件名是指由基础名(基底名)和扩展名构成的字符串,并且不包含表示文件夹、设备、主机、协议的字符串。另外,在本实施方式中,扩展名是指由在句号和接着句号之后的一个以上的字符构成的字符串。例如,“sample.jpg”是文件名。其中,“sample”是基础名,“.jpg”是扩展名。另外,文件名设定部106将所设定的文件名作为文件名设定结果信息178存储在存储部170中。
文件生成部108生成文件。在本实施方式中,文件生成部108基于存储在图像数据存储区域172中的图像数据生成文件。例如,文件生成部108生成将一个或多个图像数据结合到一个文件的文件(例如PDF(Portable Doctorument Format,便携式文档格式)格式的文件),此外,文件生成部108也可以针对每个图像数据生成其他文件(例如,JPEG(JointPhotographic Experts Group,联合图像专家组)格式的文件或TIFF(Tagged Image FileFormat,目标文件格式)格式的文件)。文件生成部108生成的文件的格式例如可以由使用者指定,也可以预先确定。
图像输入部110是读取原稿的图像来生成图像数据的功能部。例如,图像输入部110由扫描装置等构成,该扫描装置通过CCD(Charge Coupled Device,电荷耦合器件)、CIS(Contact Image Sensor,接触式图像传感器)等图像传感器将图像转换为电信号,通过对电信号进行量化和编码来生成数字数据。另外,图像输入部110也可以一次读出多个原稿,在读出多个原稿的情况下,针对每一张原稿生成图像数据。
图像处理部120是对图像数据实施各种图像处理的功能部。例如,图像处理部120进行将图像数据分离为字符区域、照片区域、网点区域、基底区域中的任一个的处理,或者进行根据图像数据检测边缘的处理。
图像形成部130是在记录介质(例如,记录纸张)上形成图像数据的功能部。例如,图像形成部130从图1的供纸托盘132供给记录纸张,在记录纸张的表面形成图像,并将形成有图像的记录纸张排到排纸托盘134上。图像形成部130由使用电子照相方式的激光打印机等构成。
显示部140是用于向使用者显示各种信息的功能部,例如由LCD(Liquid crystaldisplay,液晶显示器)、有机EL(Electro-luminescence,电致发光)显示器等构成。另外,操作输入部150是用于受理使用者的操作指示的功能部,且由硬键(例如,十字键)、按钮等构成。此外,图像形成装置10也可以具备触摸面板,其一体形成有显示部140和操作输入部150。检测触摸面板的输入的方式是例如电阻膜方式、红外方式、电磁感应方式、电容方式之类的常规检测方式既可。
通信部160是与其他装置、网络连接,并且进行从图像形成装置10到其他装置的文件发送、从其他装置到图像形成装置10的作业接收这样的通信的功能部。通信部160例如构成为可通信的接口,作为连接方法,通过有线/无线的任一方或双方来实现。
存储部170是存储图像形成装置10的操作所需的各种程序、各种数据的功能部。存储部170例如由作为半导体存储器的SSD(Solid State Drive,固态驱动器)、HDD(HardDisk Drive,硬盘驱动器)等构成。
在本实施方式中,存储部170确保图像数据存储区域172和手写区域信息存储区域174,并存储字符识别结果信息176和文件名设定结果信息178。
图像数据存储区域172是存储由图像输入部110生成的图像数据的区域。
手写区域信息存储区域174是存储手写区域信息的区域。例如,如图3所示,手写区域信息包括可确定手写区域的坐标(例如“(30,50)-(280,90)”)。
字符识别结果信息176是表示字符识别部104识别出的字符的信息,例如为“会议A资料”这样的文本数据。另外,文件名设定结果信息178是表示由文件名设定部106设定的文件名的信息,例如为“会议A资料.pdf”这样的文本数据。
[1.2处理的流程]
参照图4,说明图像形成装置10的文件发送处理。文件发送处理是指图像形成装置10生成基于图像数据的文件并发送给其他装置的处理。文件发送处理是控制部100从存储部170读出程序并执行的处理。
首先,控制部100获取图像数据(步骤S102)。图像数据的获取例如通过控制部100控制图像输入部110来读取一个或多个原稿,并基于从图像输入部110输入的RGB信号生成图像数据,从而获取图像数据。另外,控制部100可以将获取到的图像数据存储在图像数据存储区域172中,也可以对图像数据赋予表示生成日期时间、读取的顺序的编号、数据名这样的属性。
接着,控制部100判定起始页的手写区域的存在(步骤S104)。例如,首先,手写判定部102判定起始页的手写区域,将手写区域信息存储到手写区域信息存储区域174。接着,控制部100判定手写区域信息存储区域174中是否存储有手写区域信息。在这种情况下,如果在手写区域信息存储区域174中存储有手写区域信息,则控制部100可以判定为在起始页中存在手写区域。此外,起始页是由图像输入部110最先读出的原稿(起始页的原稿)。如果图像输入部110读出的原稿为1页,则读出的原稿直接成为原稿的起始页,如果图像输入部110读出的原稿为2页以上,则最先读出的原稿成为原稿的起始页。控制部100既可以在获取了起始页的图像数据时执行步骤S104的处理,也可以在获取了多个原稿的图像数据全部之后执行步骤S104的处理。此外,在图像数据存储区域172存储有图像数据的情况下,控制部100也可以基于作为图像数据的属性的生成日期时间、读取的顺序这样的信息,确定原稿的起始页的图像数据并读出。
接着,控制部100验证在步骤S104中执行的手写区域的判定的结果,并判定是否存在手写区域(步骤S106)。
在存在手写区域的情况下,字符识别部104执行字符识别处理(步骤S106:是→步骤S108)。具体而言,首先,字符识别部104从手写区域信息存储区域174读出手写区域信息,并获取手写区域的坐标。接着,字符识别部104读出与起始页的原稿对应的图像数据中由手写区域的坐标确定的区域的图像数据,并从读出的图像数据识别字符。字符识别部104将识别出的字符(文本数据)作为字符识别结果信息176存储在存储部170中。这样,字符识别部104通过从手写区域的手写图形来识别字符,能够识别手写字符。
接着,文件名设定部106读出字符识别结果信息176,设定基于字符识别部104的识别结果的文件名(步骤S110)。例如,文件名设定部106将在字符识别结果信息176中存储的文本数据中附加了与文件生成部108生成的文件的格式对应的扩展名的字符串设定为文件名。此外,在字符识别结果信息176是包含有句号和接着句号之后的一个以上的字符串的文本数据的情况下,文件名设定部106也可以将作为字符识别结果信息176存储的整个文本数据设定为文件名。文件名设定部106将所设定的文件名作为文件名设定结果信息178进行存储。
另一方面,步骤S106中,在不存在手写区域的情况下,文件名设定部106获取文件名(步骤S106:否→步骤S112)。对于文件名设定部106获取文件名的方法而言,例如可以从由使用者输入的字符串获取,也可以获取连号的文件名。此外,也可以获取执行处理时的日期时间、随机的字符串作为文件名。即,文件名设定部106在不存在手写字符的情况下,获取通过通常的方法设定的文件名。文件名设定部106将获取到的文件名作为文件名进行设定(步骤S114)。即,文件名设定部106将所设定的文件名存储到文件名设定结果信息178中。
接着,文件生成部108基于文件名设定结果信息178和存储在图像数据存储区域172中的图像数据,生成文件(步骤S116)。文件生成部108在生成将一个或多个图像数据结合到一个文件中的文件的情况下,将作为文件名设定结果信息178存储的文件名设为原样生成的文件的文件名即可。另外,文件生成部108在将一个或多个图像数据针对每个图像数据分别生成为不同的文件的情况下,也可以将对作为文件名设定结果信息178存储的文件名的基础名标注了连号、日期时间的文件名设为所生成的文件的文件名。通过这样,能够防止在多个文件中成为相同的文件名。
接着,控制部100将由文件生成部108生成的文件经由通信部160发送到其他装置(步骤S118)。例如,控制部100将由文件生成部108生成的文件添附到邮件中,并发送到由使用者指定的地址,或者发送到外部的服务器装置等规定的存储目的地。
[1.3动作例]
参照附图5说明本实施方式的动作例。首先,参照图5的(a),对将从图像数据的各边的端部起的规定距离作为空白区域的情况进行说明。图5的(a)是示出由图像输入部110读出的起始页的原稿的图像数据的图。图5的(a)的区域E100表示整个图像数据的区域。另外,区域E102表示比空白区域更靠内侧的区域。在这种情况下,空白区域是区域E102的外侧并且是区域E100的内侧的区域。
另外,图5的(a)中,假设在区域R100及区域R102所示的位置存在由使用者手写的字符(手写字符)。其中,在区域R100中,在原稿的空白部分,包含作为文件名而通过手写记载为“会議A資料(会议A资料)”的图像,在区域R102中,包含作为针对资料的备注而记载为“要修改”的图像。另外,区域R104是空白区域且是存在活字的字符的区域,具体而言,包括页面编号“-1-”被印刷为活字的图像。
手写判定部102在从空白区域判定手写区域的情况下,如下进行判定。区域R100是存在于空白区域中的区域,在区域R100中包含手写图形的图像,因此手写判定部102将区域R100判定为手写区域。由于区域R102是不存在于空白区域中的区域,所以手写判定部102不判定为是手写区域。区域R104是存在于空白区域中的区域,但不包含手写图形,因此手写判定部102不判定为是手写区域。因此,手写判定部102仅将区域R100判定为手写区域。
由于图像数据中存在作为手写区域的区域R100,因此字符识别部104对由手写判定部102判定为手写区域的区域R100进行字符识别处理。作为字符识别处理的结果,识别“会议A资料”这样的字符,并将其作为字符识别结果信息176进行存储。
接着,文件名设定部106基于字符识别结果信息176设定文件名。在字符识别结果信息176中存储有“会议A资料”这样的字符,不包含句号以及接着句号后的一个以上的字符。因此,文件名设定部106将对“会议A资料”赋予了扩展名的字符串设定为文件名。例如,如果文件生成部108生成的文件是PDF文件,则文件名设定部106将对“会议A资料”这样的字符串赋予了作为PDF文件的扩展名的“.pdf”的“会议A资料.pdf”设定为文件名。文件名设定部106将名为“会议A资料.pdf”的文件名作为文件名设定结果信息178进行存储。
文件生成部108读出作为文件名设定结果信息178存储的“会议A资料.pdf”,将生成的文件的文件名设为“会议A资料.pdf”。这样,基于由使用者在原稿的空白部分中作为文件名而记载为“会議A資料(会议A资料)”的字符串而不是基于记笔记的“要修正”这样的字符串、“-1-”这样的活字的字符串,生成作为文件名的基础名的文件。
此外,图5的(a)中,通过手写记载有“会議A資料(会议A资料)”的区域位于图像数据的区域E100的上边附近的空白处,但即使区域R100位于图像数据的区域E100的上边附近以外的空白处,作为文件名也设定“会议A资料.pdf”。例如,即使区域R100位于图像数据的区域E100的下边附近的空白处,由于与存在于空白区域的手写区域相当的区域只有区域R100,因此,基于包括在区域R100中的图像数据来设定文件名。
接着,参照图5的(b),对将字符区域、照片区域、网点区域、基底区域以外的区域作为空白区域的情况进行说明。图5的(b)是示出由图像输入部110读出的起始页的原稿的图像数据的图。图5的(b)的区域E110表示图像数据的整个区域。另外,区域E110中包含的双点划线所示的区域是由图像处理部120分离为字符区域、照片区域、网点区域中的任一个的区域。
这里,在区域R110中,在原稿的空白部分处包含通过手写作为文件名而记载为“会議A資料(会议A资料)”的图像。区域R110包含图像,因此不会由图像处理部120判定为基底区域。因此,基底区域是区域E110中由双点划线包围的区域和区域R110以外的区域。
因此,区域R110是字符区域、照片区域、网点区域、基底区域以外的区域,且是空白区域。手写判定部102判定作为字符区域、照片区域、网点区域、基底区域以外的区域的区域R110是否为手写区域。在区域R110由手写判定部102判定为是手写区域的情况下,基于区域R110所包含的图像设定文件名。
这样,根据本实施方式,作为读取到的原稿的图像数据的文件,控制部100能够生成基于起始页的手写字符的识别结果而设定的文件名的文件,并将其发送至其他装置。此时,使用者在设定空白区域的情况下,通过在空白区域的任意位置记载手写字符,在不设定空白区域的情况下,通过在原稿的任意位置记载手写字符,能够设定为文件名。另外,在没有手写字符的情况下(未识别手写字符的情况下),由于以规定的方法获取文件名,所以使用者在无需设定基于手写字符的文件名的情况下,不需要在原稿上通过手写来记载表示文件名的字符。因此,例如,不需要在原稿中设置用于通过手写记载文件名的栏,另外,即使有用于通过手写记载文件名的栏,在该栏中没有记载任何手写字符,也通过规定的方法设定文件名。
另外,即使在图像数据中混合存在手写字符和活字字符的情况下,控制部100也基于手写字符设定文件名。因此,例如,即使是在上侧表现有活字的字符,在下侧表现有手写字符的图像数据,也设定有基于下侧表示的手写字符的文件名。
此外,在基于上述说明的处理中,也可以变更步骤的顺序。例如,也可以在步骤S102之后执行从步骤S112到步骤S116的处理,并预先生成文件。具体而言,首先,文件名设定部106进行文件名的获取及设定。接着,文件生成部108生成由文件名设定部106设定的文件名的文件,并将其存储在存储部170中。然后,在起始页中存在手写区域的情况下,控制部100执行步骤S108和步骤S110的处理,将存储部170中存储的文件的文件名变更为基于文件名设定结果信息178的文件名。即使以这种方式执行处理,也根据图像数据设定基于手写区域的文件名,并生成设定的文件名的文件。
在本实施方式中,已说明了手写判定部102判定手写区域,字符识别部104从手写区域中包含的手写图形中识别字符。此处,在字符识别部104无法从手写区域中包含的手写图形中识别字符的情况下,也可以将文件名设定部106获取的文件名设定为文件名。具体而言,在步骤S106中,进一步判定是否从手写区域中包含的手写图形中识别手写字符。在该情况下,在识别到手写字符的情况下,设定基于手写字符的文件名,在未识别到手写字符的情况下,设定由文件名设定部106获取到的文件名。
另外,即使字符识别部104能够识别字符,在该字符不适合作为文件名的情况下,文件名设定部106也可以设定文件名设定部106获取到的文件名,而不是字符识别部104的识别结果。不适合作为文件名的情况例如是指,识别出的字符数是1个字符等短的字符数的情况、识别出的字符是“例如”“但是”“恐怕”这样的不是通常独立使用的词的情况。通过这样,文件名设定部106可以将基于手写字符中的、使用者打算设定为文件名而记载的手写字符来设定文件名。
另外,在本实施方式中,说明了图像形成装置10将生成的文件发送到其他装置,但也可以将生成的文件存储在图像形成装置10的存储部170中。通过这样,能够根据需要向使用者输出设定了基于手写区域的文件名的文件。
另外,在本实施方式中,为了识别手写字符,字符识别部104说明了使用手写判定部102所存储的手写区域信息,但如果能够识别手写字符,也可以使用其他方法。例如,手写判定部102取代将手写区域信息存储在手写区域信息存储区域174中,而从原稿的图像数据中切出包含手写图形的部分,并将与原稿的图像数据分开切出的图像数据存储在存储部170中。然后,字符识别部104通过以切出的图像数据为对象执行字符识别处理,从而能够识别手写字符。另外,字符识别部104也可以对原稿的图像数据执行字符识别处理,并与识别出的字符一起赋予表示该字符是手写还是活字的属性。在这种情况下,文件名设定部106基于被识别的字符中的、被赋予表示是手写的属性的字符来设定文件名即可。
根据本实施方式,图像形成装置能够生成基于手写区域的文件名的文件,并将其发送到其他装置。因此,使用者通过以手写的方式在原稿的起始页中记载期望的文件名,能够使图像形成装置生成所记载的手写的文件名的文件,并进行发送。即,使用者无需确认在原稿的活字中是否包含期望的文件名、或者操作操作输入部来输入文件名。这样,根据本实施方式,能够提供便利性高的图像形成装置。
[2.第二实施方式]
接着,对第二实施方式进行说明。第二实施方式与第一实施方式不同,是将基于文件名设定结果信息178的文件名作为文件名候补显示于显示部140,并能够进行编辑的实施方式。
在本实施方式中,在文件发送处理的步骤S110之后,控制部100进行将基于文件名设定结果信息178的文件名显示于显示部140的控制。例如,为了显示所设定的文件名,控制部100显示图6所示那样的显示画面W200。在显示画面W200中,包含有显示文件名的区域E200。在显示画面W200刚显示于显示部140之后,在区域E200中显示由步骤S110的处理而设定的文件名。
在显示画面W200中,包含区域E202,该区域E202显示用于编辑显示于区域E200的文件名的软键盘。使用者通过操作被包含在区域E202中的软键盘,能够编辑显示在区域E200中的文件名。
在使用者选择了确认按钮B200的情况下,文件名设定部106将显示于区域E200的字符串作为文件名设定结果信息178进行存储。其结果,文件生成部108基于存储在图像数据存储区域172中的图像数据生成记载于区域E200的文件名的文件。此外,显示画面W200中也可以包含用于中止文件的生成的取消按钮B202。另外,也可以包含按钮B204,该按钮B204用于取消基于文件名设定结果信息178的文件名(基于字符识别部104的识别结果的文件名),并以通常的方法来设定文件名。在选择了按钮B204的情况下,文件名设定部106获取在通常的方法中设定的文件名,并将获取到的文件名作为文件名设定结果信息178进行存储。
根据本实施方式,能够使使用者确认是否设定了使用者所期望的文件名。另外,即使在设定有使用者不期望的文件名的情况下,也能够仅通过对使用者施加必要的修正来设定文件名。
[3.第三实施方式]
接着,对第三实施方式进行说明。本实施方式与第一实施方式不同,是生成不包含原稿的起始页的图像数据的文件的实施方式。本实施方式将第一实施方式的图4替换为图7。此外,对相同的功能部和处理赋予相同的附图标记,并省略说明。
参照图7说明本实施方式的文件发送处理的流程。在本实施方式中,在步骤S110中通过文件名设定部106设定了文件名之后,控制部100从图像数据存储区域172删除原稿的起始页的图像数据(步骤S302)。例如,控制部100基于作为图像数据的属性的生成日期时间、读取的顺序这样的信息,确定与起始页的原稿对应的图像数据,并将所确定的图像数据从图像数据存储区域172删除。
之后,文件生成部108通过在步骤S116中执行生成文件的处理,生成基于原稿的起始页的图像数据以外的图像数据的文件(不包含起始页的图像数据的文件)。
此外,在步骤S106中,在判定为原稿的起始页的图像数据中没有手写区域的情况下,控制部100不进行原稿的起始页的图像数据的删除。即,在原稿的起始页的图像数据中没有手写区域的情况下,文件生成部108生成包含原稿的起始页的图像数据在内并基于存储于图像数据存储区域172的图像数据的文件。
此外,图像形成装置10也可以在起始页中存在手写区域的情况下,切换是删除起始页,还是即使在起始页中存在手写区域的情况下也不删除起始页。是否删除起始页的设定例如
可以包括图像形成装置10删除起始页的模式和不删除起始页的模式,并由使用者选择使其动作的模式。作为其他方法,控制部100也可以根据是否在起始页上仅存在手写区域来进行切换。具体而言,在原稿的起始页的图像数据中不存在手写区域以外的区域的情况下,认为起始页的原稿是在白纸上进行了手写的原稿,控制部100删除起始页。在原稿的起始页的图像数据中存在手写区域以外的区域的情况下,认为除手写字符以外还包含活字、照片等,控制部100不删除起始页。
另外,文件生成部108也可以生成包含将从起始页的图像数据识别的手写字符表示为活字的字符的图像数据在内而不包含起始页的图像数据的文件。通过这样,能够将手写字符作为有效的字符保留。
根据本实施方式,使用者能够通过在起始页的原稿进行手写来指定文件名,进而,能够使图像形成装置生成基于没有起始页的原稿的文件。因此,发送文件的使用者能够防止手写字符被接收文件的使用者视觉辨认。另外,能够防止生成如通过手写仅记载了文件名的起始页的图像文件那样的、仅由手写字符形成且对使用者来说不必要的文件。
[4.第四实施方式]
接着对第四实施方式进行说明。本实施方式与第一实施方式不同,是通过以手写区域内的背景色涂覆手写区域中包含的手写图形,从而清除手写字符的实施方式。本实施方式将第一实施方式的图4替换为图8。此外,对相同的功能部和处理赋予相同的附图标记,并省略说明。
参照图8说明本实施方式的文件发送处理的流程。在本实施方式中,在步骤S110中通过文件名设定部106设定了文件名之后,控制部100执行手写字符涂覆处理(步骤S402)。手写字符涂覆处理是指针对存储于图像数据存储区域172中的原稿的起始页的图像数据,用与背景色大致相同的像素替换手写区域内的手写图形(手写字符)的像素的处理。通过手写字符涂覆处理,手写字符涂覆处理的对象的图像数据成为原稿中所记载的手写图形(手写字符)以背景色涂覆的图像数据。参照图9对手写字符涂覆处理进行说明。
首先,控制部100获取在步骤S108中通过字符识别部104而成为字符识别处理的对象的手写区域的图像数据(步骤S4002)。具体而言,控制部100从图像数据存储区域172读出原稿的起始页的图像数据,进而从手写区域信息存储区域174读出手写区域信息。而且,控制部100从原稿的起始页的图像数据中确定由手写区域信息确定的区域,并获取确定的区域的图像数据即可。
接着,控制部100使像素值的相加结果初始化为0,并将背景像素值设定为0(步骤S4004)。像素值的相加结果是指:控制部100读取图像数据的像素并将所读取的像素的像素值相加后的值。像素值的相加结果根据图像数据所包含的颜色的成分的数量,存储各个颜色的成分的像素值的相加结果。例如,如果图像数据为灰色标度等的图像数据中包含的颜色的成分的数量为1,则在像素值的相加结果中存储1的值。在图像数据为彩色的情况等下,如果图像数据中包含的颜色的成分的数量为多个(例如,R成分、G成分和B成分这3个),
则存储与颜色的成分的数量对应的值。
接着,控制部100通过沿着行读取手写区域的图像数据,由此从行的前端侧逐个像素地在横向上进行扫描,并搜索当前扫描的行中的边缘像素(步骤S4006)。行是指在横向上扫描手写区域的图像数据时的一行的区域。线的高度既可以是一个像素,也可以是多个像素。
接着,控制部100判定所读取的像素中是否包含边缘像素(步骤S4008)。在判定为包含边缘像素的情况下,接着控制部100判定是否是上升沿(步骤S4008;Yes→步骤S4010)。在判定为是上升沿的情况下,控制部100基于像素值的相加结果来设定背景像素值(步骤S4010:Yes→步骤S4012)。此处,控制部100将背景像素值设为与边缘像素周围的像素的像素值大致相同的像素值。例如,作为背景像素值,控制部100针对每个颜色的成分,设定将像素值的相加结果除以行的前端的像素或从最后读取的下降沿的像素到上升沿的像素紧前的像素为止的区间中所包含的像素的数量而得到的值。通过这样,边缘像素的周围的背景中的像素值的平均值被设定为背景像素值。例如,在行的高度为多个像素的情况下,将多个像素的像素值的平均值设定为背景像素值。另外,控制部100可以将在紧接上升沿之前读入的像素的像素值设定为背景像素值,也可以将线上的像素中的、不是边缘像素的像素的像素值的平均值设定为背景像素值。
另一方面,在步骤S4010中,在未判定为是上升沿的情况下,控制部100将从上升沿的像素到当前的像素中所包含的像素的像素值替换为背景像素值(步骤S4010:No→步骤S4014)。此处,在步骤S4012中,背景像素值被设定为与边缘像素的周围的像素值大致相同的像素值。因此,通过步骤S4014的处理,将边缘像素的像素值替换为基于边缘像素的周边的区域所包含的像素的像素值而计算出的像素值。其结果,边缘像素的像素值替换为与边缘像素的周边的像素值接近的值,边缘像素成为难以被使用者视觉辨认的颜色。然后,控制部100将像素值的相加结果初始化为0(步骤S4016)。
此外,在步骤S4008中,在未判定为所读取的像素中包含有边缘像素的情况下(在所读取的像素中不包含边缘像素的情况下),控制部100针对颜色的每个成分,将当前的像素值与像素值的相加结果相加(步骤S4008;No→步骤S4018)。
接着,控制部100判定是否读取到直到与线的前端相反一侧的端即行末端为止的像素(步骤S4020)。在未读取到行末端的情况下,返回到步骤S4006(步骤S4020;No→步骤S4006)。另一方面,在读取到行末端的情况下,接着,控制部100判定边缘像素是否持续(步骤S4020;Yes—步骤S4022)。在边缘像素持续的情况下,将从最后读取的上升沿的像素到当前的像素为止的像素值替换为背景像素值(步骤S4022;Yes→步骤S4024)。
接着,控制部100将像素值的相加结果初始化为0,并将背景像素值设定为0(步骤S4026)。接着,控制部100判定是否已进行了所有行的处理(步骤S4028)。
在执行了所有行的处理的情况下,控制部100使以背景像素值涂覆了手写区域的手写区域的图像数据反映在原稿的起始页的图像数据中(步骤S4028;Yes→步骤S4030)。具体而言,控制部100从图像数据存储区域172读出原稿的起始页的图像数据,并将该原稿的起始页的图像数据替换为手写区域以背景像素值被涂覆的图像数据并重新存储。此外,控制部100通过读出存储在手写区域信息存储区域174的手写区域信息,确定手写区域的位置。这样,原稿的起始页的图像数据被替换为以背景像素值涂覆手写区域内的手写图形的图像数据。
另一方面,在未处理所有行的情况下,变更读入像素的行(例如,变更为下一行),返回到步骤S4006(步骤S4028;No→步骤S4032)。
返回到图8,文件生成部108生成文件(步骤S116)。此处,在起始页中存在手写区域的情况下,通过步骤S402的处理,原稿的起始页的图像数据替换为手写区域以背景像素值被涂覆的图像数据。因此,在起始页中存在手写区域的情况下,通过步骤S116的处理,生成包含了手写区域被涂覆的起始页的图像数据的发送数据。
参照图10说明本实施方式中的动作例。图10的(a)是示出了“会議A資料(会议A资料)”这一手写区域的图像数据的图。另外,将图10的(a)的区域E400所示的区域设为第一行的区域。
图10的(b)是示出了第一行的区域的图。图10的(b)中,区间1a、区间2a、区间3a、区间4a、区间5a表示包含为了计算背景像素值而使用的像素的区间。图10的(b)中,位置1b、位置2b、位置3b、位置4b表示上升沿的位置。图10的(c)中,位置1c、位置2c、位置3c、位置4c表示下降沿的位置。
控制部100从行的前端的像素起向右逐个像素地扫描行,并读取行上的像素。图10的(b)的示例中,从行的前端(左端)的像素到包含有上升沿的像素的位置1b为止依次读入行上的像素,并将读入的像素的像素值与像素值的相加结果相加。即,控制部100将不包含上升沿或下降沿的边缘像素且不包含手写字符(被识别为手写字符的手写图形)的区间中所包含的像素的像素值与像素值的相加结果相加。
接着,由于在位置1b处包含上升沿的像素,因此在该时刻,控制部100设定背景像素值。而且,由于在位置1c处包含下降沿的像素,因此控制部100通过将从位置1b到位置1c为止所包含的像素替换为背景像素值来进行涂覆。即,从位置1b到位置1c为止被包含的像素以在从行的前端的像素到位置1b为止的区间即区间1a中所包含的像素的像素值的平均值被涂覆。另外,控制部100将像素值的相加结果初始化。
接着,控制部100在右方向上读取像素。此处,位置2b包含上升沿的像素,因此在该时刻,控制部100设定背景像素值。此时所设定的背景像素值以从包含有紧前的下降沿的位置1c到包含有上升沿的位置2b为止的区间即区间2a中所包含的像素的像素值的平均值被涂覆。
以下,同样地,从包含上升沿的位置3b到包含下降沿的位置3c为止,以作为区间的区间3a中所包含的像素的像素值的平均值被涂覆。另外,从包含上升沿的位置4b到包含下降沿的位置4c为止,以作为区间的区间4a中所包含的像素的像素值的平均值被涂覆。另外,由于从包含下降沿的位置4c到线的末端(右端)不包含边缘像素,因此控制部100不对从位置4c到线的末端为止的区间即区间5a进行涂覆。
根据本实施方式,图像形成装置通过以背景像素值涂覆由使用者记载的手写图形,能够在得到接近不包含手写字符的状态的原稿的图像的基础上来生成文件。对于使用者来说,也可以考虑为了设定文件名而记载的手写字符是根据与原本的原稿的记载内容的关系而额外的记载的情况。在这样的情况下,由于通过图像形成装置涂覆(清除)多余的记载,因此能够防止使用者为了设定文件名而记载的手写字符被接收到文件的其他使用者视觉辨认到。
此外,在本实施方式中,作为清除手写字符的情况进行了说明,例如,也可以在清除手写字符之后,在表示清除的手写字符的位置上合成将手写字符表示为活字的字符的图像。例如,控制部100在执行手写字符涂覆处理的步骤S4030之前,通过读出字符识别结果信息176,并生成以规定的字体输出识别出的字符的图像数据,从而生成活字的字符的图像数据。然后,控制部100使生成的活字的字符的图像数据相对于成为手写字符涂覆处理的对象的图像数据,在表示已清除的手写字符的位置处重叠。由此,在步骤S4030中,能够将手写字符作为活字的字符,并保留于记载有手写字符的位置处。
[5.第五实施方式]
接着,对第三实施方式进行说明。本实施方式与第一实施方式不同,是在手写区域存在文件名提取用标记的情况下,设定基于手写区域的文件名的实施方式。文件名提取用标记是指圆形记号、双重圆形记号、箭头等记号。本实施方式将第一实施方式的图4替换为图11。此外,对相同的功能部和处理赋予相同的附图标记,并省略说明。
参照图11说明本实施方式的文件发送处理的流程。在本实施方式中,在原稿的起始页的图像数据中包含有手写区域的情况下,文件名设定部106执行标记识别处理(步骤S106;Yes→步骤S502)。参照图12来说明标记识别处理。
首先,文件名设定部106从手写区域信息存储区域174获取手写区域信息(步骤S5002)。文件名设定部106基于在所获取到的手写区域信息中存储的坐标的信息,基于原稿的起始页的图像数据来确定手写区域,并获取手写区域的图像数据。
接着,文件名设定部106基于手写区域的图像数据获取1字符量的手写字符的区域(步骤S5004)。例如,文件名设定部106将手写区域的图像数据分割为1字符量的矩形状的区域,并将各个区域作为1字符量的手写字符的区域来获取。此外,1字符量的手写字符的区域例如也可以是多边形状的区域。
接着,文件名设定部106基于在步骤S5004中获取到的1字符量的手写字符的区域,从手写区域的图像数据中切出1字符量的图像数据(步骤S5006)。然后,文件名设定部106进行基于在步骤S5006中切出的1字符量的图像数据的图像与文件名提取用标记的图像的图案匹配处理(步骤S5008)。文件名提取用标记既可以由图像形成装置10的使用者设定,也可以在图像形成装置10中预先设定。另外,文件名提取用标记的图像数据也可以存储于存储部170中。
接着,文件名设定部106判定1字符量的图像与文件名提取用标记的图像是否匹配(步骤S5010)。关于判定为1字符量的图像与文件名提取用标记的图像匹配的情况下的类似度、在图案匹配中重视的特征量等,可以预先设定,也可以由使用者设定。此外,也可以进行使用了机械学习的图案匹配处理。
在1字符量的图像与文件名提取用标记的图像匹配的情况下,文件名设定部106重新生成将从手写区域去除了文件名提取量标记的区域后的区域作为新的手写区域的手写区域信息(步骤S5010;Yes→步骤S5012)。具体而言,文件名设定部106将在步骤S5002中读出的手写区域信息替换为在步骤S5012中重新生成的去除了文件名提取量标记的区域后的手写区域的手写区域信息,并重新存储。然后,文件名设定部106基于在步骤S5012中重新生成的手写区域信息,从原稿的起始页的图像数据切出手写区域的图像数据(步骤S5014)。
另一方面,在1字符量的图像与文件名提取用标记的图像不匹配的情况下,文件名设定部106判定是否存在下一个手写字符(步骤S5010;No→步骤S5016)。例如,在存在步骤S5002中获取到的手写区域的图像数据中的、未切出的图像的情况下,文件名设定部106判定为存在下一个手写字符。然后,在存在下一个手写字符的情况下,文件名设定部106返回到步骤S5004(步骤S5016;Yes—步骤S5004)。在不存在下一个手写字符的情况下,结束标记识别处理(步骤S5016;No)。
回到图11,文件名设定部106判定手写区域中是否存在文件名提取用标记(步骤S504)。具体而言,文件名设定部106在标记识别处理中,判定为手写区域内的任一个字符与文件名提取用标记匹配、或重新生成了手写区域信息的情况下,判定为手写区域中存在文件名提取用标记即可。
在手写区域中存在文件名提取用标记的情况下,在步骤S108中,字符识别部104对在步骤S5014中切出的图像数据执行字符识别处理。
此外,步骤S504中,在判定为手写区域中不存在文件名提取用标记的情况下,文件名设定部106获取文件名并对其进行设定(步骤S504;No→步骤S112→步骤S114)。即,即使在原稿的起始页的图像数据中存在手写区域,但在手写区域中不包含文件名提取用标记的情况下,文件名设定部106忽略手写区域。
根据本实施方式,即使在原稿的起始页中包含有手写区域的情况下,图像形成装置也能够根据文件名提取用标记的有无,来切换是否设定基于手写图形的识别结果的文件名。由此,使用者通过在想要成为文件名的手写字符上附加文件名提取用标记,由于通过图像形成装置确定为文件名,因此能够将所需的手写字符设定为文件名。
[6.第六实施方式]
第六实施方式是如下实施方式:即使为起始页以外的图像数据,也在手写区域中存在文件名提取用标记的情况下,设定基于手写区域的文件名。本实施方式将第五实施方式的图11替换为图13。此外,对相同的功能部和处理赋予相同的附图标记,并省略说明。
在本实施方式的文件发送处理中,在获取图像数据的处理之后,控制部100将1代入表示页面编号的变量N(步骤S602),获取第N页的图像数据(步骤S604)。
接着,控制部100判定第N页的手写区域的存在(步骤S606)。例如,首先,手写判定部102根据第N页的图像数据判定手写区域,并将手写区域信息存储到手写区域信息存储区域174中。接着,控制部100判定手写区域信息存储区域174中是否存储有手写区域信息。
另外,在由控制部100判定为存在手写区域的情况下,文件名设定部106执行标记识别处理,并判定是否存在文件名提取用标记(步骤S106;Yes→步骤S502→步骤S504)。此时,在不存在文件名提取用标记的情况下,控制部100判定是否获取了所有页面的图像数据(步骤S504;No→步骤S608)。
在未获取所有页面的图像数据的情况下,控制部100在N上加1,并返回到步骤S604(步骤S608;No→步骤S610→步骤S604)。
此外,在步骤S106中,在未判定为存在手写区域的情况下,控制部100也执行步骤S608的处理(步骤S106;No→步骤S608)。
这样,根据本实施方式,能够从起始页的图像数据起依次执行标记识别处理,在存在有文件名提取用标记的阶段,进行手写字符识别,并设定基于识别结果的文件名。因此,即使是起始页以外的页面,使用者也能够通过手写来记载字符,进而通过记载文件名提取用标记,来指定作为文件名设定的字符。
[7.第七实施方式]
接着,对第七实施方式进行说明。本实施方式是在原稿的起始页的图像数据中包含多个(2个以上)手写区域的情况下也适当地设定文件名的实施方式。本实施方式将第一实施方式的图4替换为图14。此外,对相同的功能部和处理赋予相同的附图标记,并省略说明。
参照图14说明本实施方式的文件发送处理的流程。在本实施方式中,在步骤S108中,字符识别部104执行字符识别处理,但此时,作为字符识别结果信息176,与识别出的字符一起,还存储包含该识别出的字符的区域的信息。区域的信息是指能够确定区域的坐标、区域的大小(面积)的信息。接着,文件名设定部106判定在原稿的起始页的图像数据中是否存在多个(2个以上)手写区域(步骤S702)。具体而言,在存储部170中存储有多个字符识别结果信息176的情况下,文件名设定部106判定为存在多个手写区域即可。
在存在多个手写区域的情况下,文件名设定部106执行从多个字符识别结果信息176选择一个字符识别结果信息176的字符识别结果信息选择处理(步骤S702;Yes→步骤S704)。具体而言,文件名设定部106基于以下的方法来选择一个字符识别结果信息176。
(1)基于手写区域的大小的方法
该方法是基于原稿中记载的多个手写中的、由使用者记载的最大的手写区域来设定文件名的方法。例如,文件名设定部106基于字符识别结果信息176中的区域信息,选择区域大小最大的字符识别结果信息176。此外,文件名设定部106也可以基于字符识别结果信息176中的区域信息,选择区域大小最小的字符识别结果信息176。另外,也可以由使用者来设定由文件名设定部106选择的手写区域的大小的基准。
(2)基于手写区域的位置的方法
该方法是基于原稿中记载的多个手写中的、位于原稿最上侧的手写区域来设定文件名的方法。例如,文件名设定部106选择字符识别结果信息176中的包含有最靠近图像数据的上边的区域的信息的字符识别结果信息176。此外,文件名设定部106可以基于位于最靠近原稿的下侧(也可以是左侧、右侧)的手写区域来设定文件名,也可以基于位于最靠近原稿的任一个角的位置的手写区域来设定文件名。另外,也可以由使用者来设定由文件名设定部106选择的手写区域的位置。
(3)基于手写图像的颜色的方法
该方法是基于原稿中所记载的多个手写图形中的、用特定颜色(例如红色)记载的手写图形来设定文件名的方法。文件名设定部106针对每个字符识别结果信息176,识别由区域的信息确定的区域中所包含的手写图形的颜色。然后,文件名设定部106选择识别出的颜色为规定的颜色的字符识别结果信息176。规定的颜色可以预先设定于图像形成装置10中,也可以由使用者设定。另外,文件名设定部106可以基于手写区域中的除手写图形以外的部分的颜色(例如,背景的颜色)来选择字符识别结果信息176。
(4)基于有无文件名提取用标记的方法
该方法是基于原稿中所记载的多个手写中的、记载有文件名提取用标记的手写区域来设定文件名的方法。文件名设定部106针对每个字符识别结果信息176,对由区域的信息确定的区域执行第五实施方式中说明的标记识别处理。文件名设定部106选择字符识别结果信息176,其包含确定包含体育文件名提取用标记的区域信息作为区域的信息。
(5)基于字符识别部104的识别结果的方法
该方法是基于原稿中所记载的多个手写图形中的、记载有特定的字符、图案的手写区域来设定文件名的方法。文件名设定部106选择字符识别结果信息176中的、包含有特定的字符的字符识别结果信息176。特定的字符是指,例如,可以是“附加”、“资料”这样的特定的语句,也可以是表示“pdf”、“jpg”、“tiff”这样的扩展名的字符,也可以是如“20190601”那样表示年月日的8字符的数字的图案。作为特定的字符的语句、图案可以在图像形成装置10中预先设定,也可以由使用者设定。
对于上述方法中的、作为文件名设定部106选择字符识别结果信息176的方法而使用的方法,既可以由使用者选择,也可以组合多种方法。另外,文件名设定部106也可以通过上述方法以外的方法来选择字符识别结果信息176。
这样,即使在手写区域为多个的情况下,文件名设定部106也能够基于一个字符识别结果信息来设定文件名。此外,在手写区域只存在一个的情况下,文件名设定部106跳过步骤S704的处理,并转移到步骤S110(步骤S702:No)。在这种情况下,文件名设定部106与第一实施方式同样地,基于一个字符识别结果信息来设定文件名。
根据本实施方式,即使在原稿的起始页中包含有多个手写区域的情况下,图像形成装置也能够在选择一个手写区域之后设定文件名。
另外,在通过图像形成装置基于有无提取用标记来设定文件名的情况下,使用者通过在多个手写区域中的一个手写区域中记载文件名提取用标记,从而能够指定手写的字符中的作为文件名设定的字符。
[8.变形例]
在上述说明中,对具备信息处理装置的图像形成装置进行了说明,但也可以将本发明的信息处理装置应用于终端装置、服务器装置、扫描仪等图像读取装置等。即,在终端装置、服务器装置、图像读取装置等中,也可以构成为生成基于与起始页的原稿对应的图像数据而设定的文件名的文件。
另外,本发明不限于上述的各实施方式,可以进行各种变更。即,在不脱离本发明的主旨的范围内组合适当变更的技术手段而得到的实施方式也包含于本发明的技术范围内。
另外,上述的实施方式为了便于说明,有分别说明的部分,但也可以在技术上可能的范围内组合执行,这是不言而喻的。例如,也可以组合第三实施方式和第七实施方式,在原稿的起始页的图像数据中,设定基于多个手写区域中包含有文件提取量标记的手写区域的文件名,并删除原稿的起始页的图像数据。
此外,本实施方式的各装置中所运作的程序是控制CPU等的程序(使计算机发挥功能的程序),以实现上述实施方式的功能。并且,由这些装置中处理的信息在其被处理时被临时存储在临时存储装置(例如,RAM),其后,被存储在各种ROM(Read Only Memory,只读存储器)、HDD等的存储装置中,并根据需要通过CPU进行读出、修改和写入。
此处,作为存储程序的记录介质,也可以是半导体介质(例如,ROM、非易失性存储卡等)、光学记录介质/磁光记录介质(例如,DVD(Digital Versatile Disc,数字多功能盘)、MO(Magneto Optical Disc,磁光盘)、MD(Mini Disc,迷你盘)、CD(Compact Disc,光盘),BD(Blu-ray Disc,蓝光盘)(注册商标)等)、磁记录介质(例如,磁带、软盘等)等的任一种。此外,通过执行所下载的程序,不仅可实现上述的实施方式的功能,还可以基于该程序的指示,通过操作系统或其他应用程序等共同处理,实现本发明的功能。
另外,在流通至市场的情况下,可以在可移动型记录介质中保存程序而进行流程,或经由因特网等网络而传送至服务器计算机中。此时,服务器计算机的储存装置当然也包含在本发明中。
附图标记说明
10 图像形成装置
100 控制部
102 手写判定部
104 字符识别部
106 文件名设定部
108 文件生成部
110 图像输入部
120 图像处理部
130 图像形成部
140 显示部
150 操作输入部
160 通信部
170 存储部
172 图像数据存储区域
174 手写区域信息存储区域
176 字符识别结果信息
178 文件名设定结果信息

Claims (10)

1.一种信息处理装置,其特征在于,包括:
判定部,其根据图像数据判定包含有手写图形的区域;
识别部,其根据所述手写图形识别手写字符;
获取部,其获取文件名;以及
生成部,其基于所述图像数据,当通过所述识别部识别出手写字符时,生成基于该手写字符的文件名的文件,当通过所述识别部未识别出手写字符时,生成通过所述获取部获取到的所述文件名的文件。
2.如权利要求1所述的信息处理装置,其特征在于,
所述判定部从所述图像数据的空白区域中判定包含有手写图形的区域。
3.如权利要求1所述的信息处理装置,其特征在于,
所述判定部根据均未包含于字符区域、照片区域、网点区域、基底区域的任一区域中的区域,判定包含有手写图形的区域。
4.如权利要求1至3中任一项所述的信息处理装置,其特征在于,
所述文件名可编辑。
5.如权利要求1至4中任一项所述的信息处理装置,其特征在于,
在所述图像数据为多个页面的原稿的图像数据的情况下,所述文件生成部基于所述原稿的起始页的图像数据,当由所述识别部识别出手写字符时,生成基于该手写字符的文件名的文件。
6.如权利要求5所述的信息处理装置,其特征在于,
所述文件生成部基于所述原稿的起始页的图像数据之外的图像数据来生成所述文件。
7.如权利要求1至5中任一项所述的信息处理装置,其特征在于,所述文件生成部生成清除了所述手写字符的文件。
8.如权利要求1至4中任一项所述的信息处理装置,其特征在于,
在由所述判定部判定的区域包含规定的标记的情况下,所述文件生成部生成基于根据该区域中包含的手写图形识别出的所述手写字符的文件名的文件。
9.一种控制方法,其特征在于,包括:
判定步骤,根据图像数据判定包含有手写图形的区域;
识别步骤,根据所述手写图形识别手写字符;
获取步骤,获取文件名;以及
生成步骤,基于所述图像数据,当通过所述识别步骤识别出手写字符时,生成基于该手写字符的文件名的文件,当通过所述识别步骤未识别出手写字符时,生成通过所述获取步骤获取到的所述文件名的文件。
10.一种存储有程序的非暂时性记录介质,其特征在于,所述程序用于使计算机执行以下步骤:
判定步骤,根据图像数据判定包含有手写图形的区域;
识别步骤,根据所述手写图形识别手写字符;
获取步骤,获取文件名;以及
生成步骤,基于所述图像数据,当通过所述识别步骤识别出手写字符时,生成基于该手写字符的文件名的文件,当通过所述识别步骤未识别出手写字符时,生成通过所述获取步骤获取到的所述文件名的文件。
CN202110107829.1A 2020-01-27 2021-01-27 信息处理装置、控制方法以及记录介质 Active CN113179356B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2020-010843 2020-01-27
JP2020010843A JP7414554B2 (ja) 2020-01-27 2020-01-27 情報処理装置、制御方法及びプログラム

Publications (2)

Publication Number Publication Date
CN113179356A true CN113179356A (zh) 2021-07-27
CN113179356B CN113179356B (zh) 2023-05-12

Family

ID=76921711

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110107829.1A Active CN113179356B (zh) 2020-01-27 2021-01-27 信息处理装置、控制方法以及记录介质

Country Status (3)

Country Link
US (1) US11693825B2 (zh)
JP (1) JP7414554B2 (zh)
CN (1) CN113179356B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1063781A (ja) * 1996-08-19 1998-03-06 Sharp Corp 手書き文字入力方法
JP2002074321A (ja) * 2000-09-04 2002-03-15 Funai Electric Co Ltd 画像読取装置及びその制御方法
US20040093568A1 (en) * 2002-11-10 2004-05-13 Microsoft Corporation Handwritten file names
US6885481B1 (en) * 2000-02-11 2005-04-26 Hewlett-Packard Development Company, L.P. System and method for automatically assigning a filename to a scanned document
JP2005311729A (ja) * 2004-04-22 2005-11-04 Kyocera Mita Corp ファイル名作成装置及びファイル名作成プログラム
JP2006211261A (ja) * 2005-01-27 2006-08-10 Kyocera Mita Corp 画像読取り装置および画像読取りプログラム
CN1936927A (zh) * 2005-09-22 2007-03-28 夏普株式会社 图像判定方法、图像处理装置以及图像输出装置
CN104463157A (zh) * 2014-11-07 2015-03-25 李宇 手写字符的电子识别方法
US20190303701A1 (en) * 2018-03-29 2019-10-03 Minako KAZUME Information processing system, method of processing information, and storage medium

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005275849A (ja) * 2004-03-25 2005-10-06 Canon Inc 文書処理装置および文書処理方法
JP2019117500A (ja) * 2017-12-27 2019-07-18 京セラドキュメントソリューションズ株式会社 情報処理装置
JP7391672B2 (ja) * 2020-01-21 2023-12-05 キヤノン株式会社 文書を電子化するための画像処理システム、その制御方法及びプログラム

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1063781A (ja) * 1996-08-19 1998-03-06 Sharp Corp 手書き文字入力方法
US6885481B1 (en) * 2000-02-11 2005-04-26 Hewlett-Packard Development Company, L.P. System and method for automatically assigning a filename to a scanned document
JP2002074321A (ja) * 2000-09-04 2002-03-15 Funai Electric Co Ltd 画像読取装置及びその制御方法
US20040093568A1 (en) * 2002-11-10 2004-05-13 Microsoft Corporation Handwritten file names
JP2005311729A (ja) * 2004-04-22 2005-11-04 Kyocera Mita Corp ファイル名作成装置及びファイル名作成プログラム
JP2006211261A (ja) * 2005-01-27 2006-08-10 Kyocera Mita Corp 画像読取り装置および画像読取りプログラム
CN1936927A (zh) * 2005-09-22 2007-03-28 夏普株式会社 图像判定方法、图像处理装置以及图像输出装置
CN104463157A (zh) * 2014-11-07 2015-03-25 李宇 手写字符的电子识别方法
US20190303701A1 (en) * 2018-03-29 2019-10-03 Minako KAZUME Information processing system, method of processing information, and storage medium

Also Published As

Publication number Publication date
JP2021117750A (ja) 2021-08-10
CN113179356B (zh) 2023-05-12
US11693825B2 (en) 2023-07-04
US20210232541A1 (en) 2021-07-29
JP7414554B2 (ja) 2024-01-16

Similar Documents

Publication Publication Date Title
EP2162859B1 (en) Image processing apparatus, image processing method, and computer program
US8203748B2 (en) Image processing apparatus, control method therefor, and program
US9454696B2 (en) Dynamically generating table of contents for printable or scanned content
US8126270B2 (en) Image processing apparatus and image processing method for performing region segmentation processing
US20040247206A1 (en) Image processing method and image processing system
US7805022B2 (en) Image processing apparatus, image processing method and computer program
EP1752895A1 (en) Image processing apparatus for image retrieval and control method therefor
US20120250048A1 (en) Image processing apparatus and image processing method
US11341733B2 (en) Method and system for training and using a neural network for image-processing
US9641705B2 (en) Image forming apparatus for reading indicia on a sheet and inserting images on a subsequent printed sheet at a location corresponding to the location of the read indicia
US20070127085A1 (en) Printing system, printing method and program thereof
US8837818B2 (en) Document image processing apparatus, document image processing method, and computer-readable recording medium having recorded document image processing program
US8355577B2 (en) Image processing apparatus and method
US8339623B2 (en) Paper document processing apparatus, paper document processing method, and computer readable medium
JP2006209353A (ja) 画像判断装置、画像形成装置、画像判断方法、画像判断プログラム、画像形成プログラムおよびコンピュータ読取り可能な記録媒体
US11146705B2 (en) Character recognition device, method of generating document file, and storage medium
CN113179356B (zh) 信息处理装置、控制方法以及记录介质
US20200202156A1 (en) Information processing device and information processing method
US8810827B2 (en) Image processing apparatus, image processing method, and storage medium
US11113521B2 (en) Information processing apparatus
US20050099656A1 (en) Method and apparatus for printing information on a page containing preprinted objects
JP2006201885A (ja) 画像判断装置、画像形成装置、画像判断方法、画像判断プログラム、画像形成プログラムおよびコンピュータ読取り可能な記録媒体
JP2007334437A (ja) 画像処理装置及び方法、並びにプログラム及び記憶媒体
JP2010026986A (ja) 画像形成装置
JP2010067187A (ja) 文書処理装置、文書処理方法および文書処理プログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant