CN110557515A - 图像处理装置、图像处理方法和存储介质 - Google Patents
图像处理装置、图像处理方法和存储介质 Download PDFInfo
- Publication number
- CN110557515A CN110557515A CN201910463948.3A CN201910463948A CN110557515A CN 110557515 A CN110557515 A CN 110557515A CN 201910463948 A CN201910463948 A CN 201910463948A CN 110557515 A CN110557515 A CN 110557515A
- Authority
- CN
- China
- Prior art keywords
- image
- luminance
- original
- document
- processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012545 processing Methods 0.000 title claims abstract description 300
- 238000003860 storage Methods 0.000 title claims abstract description 42
- 238000003672 processing method Methods 0.000 title abstract description 4
- 238000000034 method Methods 0.000 claims description 156
- 238000012937 correction Methods 0.000 claims description 56
- 238000001514 detection method Methods 0.000 claims description 23
- 238000005520 cutting process Methods 0.000 claims description 10
- 230000000717 retained effect Effects 0.000 claims description 6
- 230000008569 process Effects 0.000 description 94
- 230000006870 function Effects 0.000 description 80
- 238000006243 chemical reaction Methods 0.000 description 39
- 230000005540 biological transmission Effects 0.000 description 23
- 239000011521 glass Substances 0.000 description 22
- 230000015572 biosynthetic process Effects 0.000 description 13
- 238000003705 background correction Methods 0.000 description 12
- 238000009966 trimming Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 6
- 238000009336 multiple cropping Methods 0.000 description 6
- 238000012015 optical character recognition Methods 0.000 description 6
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 239000003086 colorant Substances 0.000 description 2
- 238000005286 illumination Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000004380 ashing Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/414—Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/38—Circuits or arrangements for blanking or otherwise eliminating unwanted parts of pictures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/10—Selection of transformation methods according to the characteristics of the input images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/64—Three-dimensional objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00567—Handling of original or reproduction media, e.g. cutting, separating, stacking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/387—Composing, repositioning or otherwise geometrically modifying originals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/387—Composing, repositioning or otherwise geometrically modifying originals
- H04N1/3872—Repositioning or masking
- H04N1/3873—Repositioning or masking defined only by a limited number of coordinate points or parameters, e.g. corners, centre; for trimming
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/387—Composing, repositioning or otherwise geometrically modifying originals
- H04N1/3872—Repositioning or masking
- H04N1/3873—Repositioning or masking defined only by a limited number of coordinate points or parameters, e.g. corners, centre; for trimming
- H04N1/3875—Repositioning or masking defined only by a limited number of coordinate points or parameters, e.g. corners, centre; for trimming combined with enlarging or reducing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/40—Picture signal circuits
- H04N1/40093—Modification of content of picture, e.g. retouching
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/46—Colour picture communication systems
- H04N1/56—Processing of colour picture signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/46—Colour picture communication systems
- H04N1/56—Processing of colour picture signals
- H04N1/60—Colour correction or control
- H04N1/6002—Corrections within particular colour systems
- H04N1/6005—Corrections within particular colour systems with luminance or chrominance signals, e.g. LC1C2, HSL or YUV
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Computer Graphics (AREA)
- Geometry (AREA)
- Facsimiles In General (AREA)
Abstract
本发明提供一种图像处理装置、图像处理方法和存储介质。图像处理装置通过以保留通过用扫描器读取原稿而获取的信号值当中的、高亮度侧的信号值的方式调整亮度,来生成第一图像。图像处理装置还通过以增加包含在第一图像中的像素的亮度的方式进行调整,来生成第二图像,并且基于检测到的、与原稿对应的区域的位置,从生成的第二图像来裁剪原稿图像。
Description
技术领域
实施例的方面涉及一种用于从通过读取放置在玻璃台板上的原稿而获取的图像裁剪与原稿对应的区域的装置、图像处理方法和存储介质。
背景技术
多裁剪处理是传统已知的处理,其中诸如表格原稿、非标准尺寸收据、名片和卡片等多个原稿被布置在平板扫描器的玻璃台板上并一起被扫描,并且从生成的扫描图像中裁剪各原稿的图像。
在多裁剪处理中,要读取的原稿(例如表格,收据,名片和卡片)通常是打印了文本和/或图像的白色片材。此外,用于按压原稿的玻璃台板盖(压板)的颜色通常是白色的,并且扫描图像中没有原稿的部分(背景)与玻璃台板盖一样是白色的。因为白色原稿与白色背景之间的亮度差异很小,所以这有时候导致对扫描图像执行多裁剪处理的期间的原稿的边缘的检测失败。因此,讨论了便于从通过在玻璃台板上方进行扫描而获取的扫描图像中检测白色原稿的边缘的方法。例如,日本特开第2003-338920号公报讨论了一种方法,其中在将原稿放置在扫描器的玻璃台板上之后,用黑色片材覆盖原稿并执行扫描,使得除原稿以外的区域看起来为黑色以便于检测原稿的边缘。此外,日本特开第2017-103593号公报讨论了一种方法,其中在玻璃台板盖打开的情况下执行扫描,使得没有原稿的部分以黑色输出,以便于检测白色原稿的边缘。
然而,在日本特开第2003-338920号公报中讨论的方法中,用户将原稿放置在玻璃台板上,然后将黑色片材放置在原稿上,这对于用户来说是繁重的。此外,在日本特开第2017-103593号公报中所讨论的方法中,由于玻璃台板盖保持打开,因此在执行扫描期间照明光会照射到用户的眼睛上,这会给用户带来不适感。此外,当打开玻璃台板盖时,不能从上方按压原稿,因此在卷曲原稿(例如,收据)的情况下,原稿可能从玻璃台板部分地抬起,这导致扫描图像的图像质量降低。
发明内容
根据实施例的一个方面,一种装置包括:第一调整单元,其被构造为通过调整亮度以在通过用扫描器读取原稿而获取的信号值中保留高亮度侧的信号值来生成第一图像;检测单元,其被构造为检测生成的第一图像中的与原稿对应的区域的位置;第二调整单元,其被构造为通过进行调整以增加包含在第一图像中的像素的亮度来生成第二图像;以及裁剪单元,其被构造为基于与检测到的原稿对应的区域的位置从生成的第二图像裁剪与原稿对应的原稿图像。
根据下面参照附图对示例性实施例的描述,本公开的另外的特征将变得清楚。
附图说明
图1例示了根据本公开的第一示例性实施例的可应用系统的整体构造。
图2例示了根据本公开的第一示例性实施例的图像读取装置的硬件构造的示例。
图3例示了根据本公开的第一示例性实施例的整体图像处理功能的序列。
图4A至图4E例示了根据本公开的第一示例性实施例的用户界面(UI)显示。
图5A至图5D例示了根据本公开的第一示例性实施例的样本图像。
图6A和图6B是例示根据本公开第一示例性实施例的使用增益调整的归一化处理的示意图。
图7是例示根据本公开的第一示例性实施例的使用增益调整的归一化处理(normalization process)的流程图。
图8是例示根据本公开的第一示例性实施例的整体图像处理功能的流程图。
图9是例示根据本公开的第一示例性实施例的多裁剪坐标检测处理的流程图。
图10A和图10B例示了根据本公开第一示例性实施例的多裁剪坐标检测处理中的样本图像。
图11是例示根据本公开的第一示例性实施例的亮度调整处理的流程图。
图12例示了根据本公开的第一示例性实施例的亮度调整处理。
图13例示了根据本公开的第一示例性实施例的亮度调整处理。
图14是例示根据本公开的第一示例性实施例的图像裁剪处理的流程图。
图15A、图15B和图15C例示了根据本公开第一示例性实施例的图像裁剪处理中的样本图像。
图16是例示根据本公开的第二示例性实施例的整体图像处理功能的流程图。
图17例示了指示根据本公开的第二示例性实施例的图像处理功能的设置值的表的示例。
图18例示了根据本公开的第三示例性实施例的整体图像处理功能的序列。
图19是例示亮度调整处理的第二方法的流程图。
图20是例示三维查找表(LUT)的构造的概念图。
图21例示了三维LUT与输入像素信号P之间的关系。
图22A至图22D例示了使用三维LUT的处理。
图23例示了亮度调整处理的具体示例。
具体实施方式
下面将详细描述本公开的各种示例性实施例。应当注意,示例性实施例中描述的部件仅仅是示例,并不旨在限制本公开的范围。
<系统构造>
下面将描述第一示例性实施例。图1例示了可应用本示例性实施例的系统的整体构造。
如图1所示,图像处理装置100和个人计算机(PC)/服务器终端101连接到包括以太网(注册商标)或无线LAN的局域网(LAN)104并连接到因特网105。此外,移动终端103经由公共无线通信网络102连接到因特网105。图像处理装置100、PC/服务器终端101和移动终端103经由LAN 104或公共无线通信网络102连接到因特网105,并且可以相互通信。可以省略PC/服务器终端101和移动终端103中的一个,或者仅图像处理装置100可以进行由PC/服务器终端101或移动终端103进行的处理。
图像处理装置100是包括操作单元、扫描器单元和打印机单元的多功能外围设备。在根据本示例性实施例的系统中,图像处理装置100用作被构造为读取诸如名片、驾驶执照或明信片之类的单个或多个原稿的扫描终端。此外,图像处理装置100进行多裁剪处理,以从通过读取原稿而获取的扫描图像提取各原稿的原稿图像。此外,图像处理装置100包括显示单元和操作单元,例如触摸面板和硬件按钮。图像处理装置100通过显示单元显示错误通知或指令通知,并且进行诸如扫描操作或设置操作等操作。
PC/服务器终端101显示由图像处理装置100生成的图像。此外,PC/服务器终端101存储由图像处理装置100生成的图像并进行光学字符识别(OCR)处理以生成可重复使用的元数据。可选地,PC/服务器终端101可以进行由图像处理装置100进行的多裁剪处理。此外,PC/服务器终端101还能够与诸如云或服务器等外部存储器通信,并且可以将存储的图像或元数据发送到外部存储器。虽然在本示例性实施例中将描述PC/服务器终端101存储图像、生成元数据并将图像或元数据发送到外部存储器的处理的流程,但是图像处理装置100可以包括相同的功能。这使得处理能够仅由图像处理装置100进行。
此外,移动终端103是包括操作单元、无线通信单元和被构造为使网络浏览器操作的应用单元的智能手机或平板终端。在根据本示例性实施例的系统中,类似于PC/服务器终端101,移动终端103用作显示终端、操作终端和元数据生成/存储终端。仅PC/服务器终端101和移动终端103中的任一个可以包括显示功能、操作功能和元数据生成/存储功能。
上述部件仅仅是示例,并非每个部件都是必需的。例如,除了读取原稿的扫描功能和显示/操作功能之外,图像处理装置100还可以包括图像存储功能、元数据生成功能、元数据存储功能和向外部存储器发送的功能。在图像处理装置100具有上述构造的情况下,图像处理装置100可以执行下面描述的处理。
<图像处理装置100的硬件构造>
图2是例示图像处理装置100的构造的框图。控制单元110包括中央处理单元(CPU)111、存储装置112、网络接口(I/F)单元113、扫描器I/F单元114和显示/操作单元I/F单元115,所有这些都以彼此可通信的方式经由系统总线116连接。控制单元110控制图像处理装置100的整体操作。
CPU 111读取存储在存储装置112中的控制程序,并进行诸如读取控制和发送控制等各种控制。
存储装置112存储并保存程序、图像、元数据、设置数据和处理结果数据。存储装置112包括:只读存储器(ROM)117,其是非易失性存储器;随机存取存储器(RAM)118,其是易失性存储器;以及硬盘驱动器(HDD)119,其是大容量存储区。
ROM 117保持控制程序。CPU 111读取存储在ROM 117中的控制程序并控制图像处理装置100。
RAM 118被用作临时存储区,例如,CPU 111的主存储器或工作区。
HDD 119是大容量存储区,并且被用作用于存储图像和元数据的存储区。
网络I/F单元113是用于将控制单元110(图像处理装置100)连接到LAN 104的接口。网络I/F单元113将图像发送到LAN 104上的外部装置,例如PC/服务器终端101或移动终端103,并从LAN 104上的外部装置接收各种信息。
扫描器I/F单元114是用于连接扫描器单元120和控制单元110的接口。扫描器单元120读取原稿上的图像,生成图像,并将生成的图像经由扫描器I/F单元114输入到控制单元110。
显示/操作单元I/F单元115是用于连接显示/操作单元121和控制单元110的接口。显示/操作单元121包括具有触摸面板功能的液晶显示部分和硬件键,例如数字键、开始按钮和取消按钮。开始按钮是用于开始复制或扫描处理的按钮。取消按钮是用于暂停或停止由图像处理装置100正执行的处理的按钮。
虽然图像处理装置100还包括诸如打印机单元的其他单元,但是在本示例性实施例中不使用这些单元,因此省略其描述。
具有上述硬件构造,根据本示例性实施例的图像处理装置100能够提供图像处理功能。
<执行“扫描并发送”功能的过程>
下面将参照图3描述用户使用“扫描并发送”功能执行多裁剪处理的序列。图像处理装置100的CPU 111读取存储在存储装置112中的控制程序并执行控制程序,从而实现本示例性实施例中描述的处理。
“扫描并发送”功能是连接到诸如LAN的网络的图像处理装置扫描原稿并将获取的图像发送到外部装置的功能。具体地,“扫描并发送”功能是这样的功能,其中扫描器读取原稿以生成图像,并且对图像执行图像处理和格式转换,然后将得到的图像发送到服务器上的用户指定的文件夹,附加到电子邮件,或发送到复印机中的HDD。
在发出使用功能的指令的步骤S400中,用户操作显示/操作单元121并从主菜单中选择“扫描并发送”功能。图像处理装置100经由显示/操作单元121接收“扫描并发送”功能的选择。图4A例示在显示/操作单元121上显示的主菜单用户界面(UI)500。主菜单UI 500是其上可由图像处理装置100执行的各功能被显示为按钮的画面。例如,显示“复印”功能按钮501、“扫描并发送”功能按钮502、“扫描并存储”功能按钮503、“使用存储的文件”功能按钮504和“打印”功能按钮505。图像处理装置100经由主菜单UI 500从用户接收对功能的选择。在本示例性实施例中,用户轻击“扫描并发送”功能按钮502以选择“扫描并发送”功能。
在步骤S401中,图像处理装置100的显示/操作单元121显示用户指定的功能的设置画面(即,在选择了“扫描并发送”功能的情况下的“扫描并发送”功能的设置画面)。图4B例示了“扫描并发送”设置UI 510的示例,其是在显示/操作单元121上显示的设置画面。“扫描并发送”设置UI 510例示了在“扫描并发送”功能中使用的各种设置的状态。例如,“发送目的地”511显示生成的图像的发送目的地的地址。如果用户轻击“发送目的地”511,则显示发送目的地设置画面(未例示),使得用户可以输入图像的发送目的地。在本示例性实施例中,经过了多裁剪处理的图像被发送到PC/服务器终端101。具体地,PC/服务器终端101的统一资源定位符(URL)、因特网协议(IP)地址和电子邮件地址被设置为“发送目的地”511。“扫描/发送设置”512显示如下设置的各状态:要生成的图像的颜色设置、要生成的图像文件的格式设置以及原稿类型设置。此外,“其他功能”513是用于设置未在“扫描并发送”设置UI510上显示的应用功能的按钮。
在步骤S402中,图像处理装置100接收关于可在“扫描并发送”设置UI 510上设置的基本设置项的设置指令。在步骤S402中可接收的设置的示例包括要生成的图像的颜色设置和要生成的图像文件的格式。图像处理装置100在“发送目的地”511或“扫描/发送设置”512上接收轻击操作,并且接收与各轻击操作对应的设置项的输入。
在步骤S403中,图像处理装置100在图像处理装置100的RAM 118中存储与在步骤S402中由用户指令指定的基本设置相关的设置值。
接下来,在步骤S404中,通过用户轻击操作选择“其他功能”513。
在步骤S405中,图像处理装置100经由设置UI 510从用户接收对“其他功能”513的选择,并在显示/操作单元121上显示应用功能设置画面。图4C例示用于设置应用功能的“其他功能”设置UI 520的示例。“其他功能”设置UI 520显示用于设置图像处理装置100可执行的“扫描并发送”功能的各种应用功能的按钮。“其他功能”设置UI 520显示例如“N合1打印”按钮521、“颜色类型”按钮522、“原稿类型”按钮523、“颜色调整”按钮524、“文件名设置”按钮525和“多裁剪”按钮526。多裁剪”按钮526是用于输入指令以从通过扫描彼此相邻地放置在玻璃台板上的多个原稿而生成的图像,提取与各原稿对应的原稿图像的按钮。在本示例性实施例中,“其他功能”设置UI 520还显示设置项,该设置项也是可在设置UI 510上设置的设置项。可选地,“其他功能”设置UI 520可被构造为显示除了在设置UI 510上可设置的设置项之外的设置项。
在步骤S406中,用户轻击“其他功能”设置UI 520中的“多裁剪”按钮526。
如果用户选择“多裁剪”按钮526,则在步骤S407中,图像处理装置100将指示要执行多裁剪处理的多裁剪处理标志设置为开(ON)。多裁剪处理标志被存储在RAM 118中。此外,在步骤S407中,图像处理装置100在显示/操作单元121上显示,指示选择了图4D所示的多裁剪的画面520。如果用户选择“多裁剪”按钮526,则“其他功能”设置UI 520上的“多裁剪”按钮526的颜色被反转,并且显示指示多裁剪处理被设置为开的画面。在本示例性实施例中,将描述在将多裁剪处理设置为开的情况下进行的处理。如果用户轻击并选择“其他功能”设置UI520上的“关闭”按钮527,则显示/操作单元121显示图4B所示的“扫描并发送”设置UI 510。
在步骤S408中,用户选择开始键506以输入执行“扫描并发送”功能的指令。如果按下开始键506,则图像处理装置100确定发出了开始读取原稿的指令。如果接收到开始键506的按下,则图像处理装置100在RAM 118中设置用于扫描原稿的各种设置,并开始准备原稿读取处理。
首先,在步骤S409中,图像处理装置100在RAM 118中设置用于亮度增益调整的参数。亮度增益调整是通过读取原稿来调整由扫描器单元120获取的图像的亮度的处理。在步骤S407中多裁剪处理标志被设置为开的情况下,图像处理装置100在RAM 118中设置与在多裁剪处理被设置为关(off)的情况下设置的参数不同的参数。
在步骤S410中,图像处理装置100使扫描器单元120驱动扫描器并读取放置在玻璃台板上的原稿。
在步骤S411中,图像处理装置100将在步骤S410中读取的图像转换为在图像处理中可处理的位图格式的图像。例如,在步骤S411中,图像处理装置100将从扫描器单元120输入的亮度信号值转换为8位数字信号。此外,图像处理装置100对转换后的亮度信号值进行阴影校正。阴影校正是对输入亮度信号值进行的校正处理,以消除在扫描器单元120的照明系统、图像形成系统和图像捕获系统中发生的各种失真。此后,图像处理装置100使用在步骤S409中设置的设置值对经过阴影校正后的亮度信号值进行亮度增益调整。在执行多裁剪处理的情况下的亮度增益调整中,与不执行多裁剪的情况下生成的正常扫描图像相比,生成其中与高亮度侧的信号值有关的信息被保留的图像。在正常扫描图像中,在阴影校正之后的亮度信号值高于预定基准值的情况下,将该亮度信号值视为白色(即,亮度值255)以防止不均匀的白色亮度,而在执行多裁剪处理的情况下进行亮度增益调整,以将高亮度侧的亮度信号值输出为不同的值。图像处理装置100还进行图像质量调整处理,例如颜色平衡调整、背景浓度去除、锐度处理和对比度调整,并将图像作为数据存储在HDD 119中。
图5A是例示将多个原稿放置在玻璃台板上的状态的示意图。在图5A中,三个原稿被布置在能够读取面积为A3大小的区域的扫描器单元120上。作为要放置的原稿的示例,标准尺寸的原稿(例如,A4尺寸的发票(invoice))和多个非标准尺寸的原稿(例如,收据(receipt))彼此相邻地放置在玻璃台板上。放置在玻璃台板上的原稿的类型、数量和布置不限于上述那些。
图5B例示了在多裁剪处理被设置为关,并且图像处理装置100使用被设置为标准值的、图像形成时的亮度增益调整参数来进行处理的情况下生成的图像。图6A是例示在多裁剪处理被设置为关的情况下的亮度增益调整的示意图。在多裁剪处理被设置为关的情况下,经过阴影校正的亮度值比白色基准值(255)高的每个区域被输出为白色基准值(255)。因此,如图5B所示,原稿的白色部分和玻璃台板盖的白色部分都被输出为相同亮度的白色。在这种情况下,由于原稿A和C的背景是白色的,因此该原稿背景的白色部分与玻璃台板盖的白色部分之间不再存在差异,因此难以检测原稿的边界。
图5C例示了如下情况下的图像的示例,其中,多裁剪处理被设置为开,图像形成时的亮度增益调整参数被设置为与标准值不同的值,并且图像处理装置100在保留高亮度侧的信号值的状态下进行处理。图6B是例示在多裁剪处理被设置为开的情况下的亮度增益调整的示意图。在将多裁剪处理设置为开的情况下,将阴影校正后的亮度乘以预定增益调整参数,并输出所获得的值。例如,在图6B中,图像处理装置100将阴影校正之后的信号值(即,260的白色值)乘以亮度增益调整参数,并将获得的值输出为亮度值250。如图6B所示,在多裁剪处理被设置为开的情况下,与在多裁剪处理被设置为关的情况下生成的图像相比,通过亮度增益调整参数将高亮度侧的信号值转换为低亮度值。因此,在将多裁剪处理设置为开的情况下,输出图像完全比在多裁剪处理被设置为关的情况下暗,但是原稿的白色和玻璃台板盖的白色更可能以不同的亮度值输出,以便于检测原稿的边界。
在步骤S412中,图像处理装置100获取在步骤S411中已进行了亮度增益调整并被存储在HDD 119中的图像。图像处理装置100的CPU 111基于获取的图像中包含的原稿的边缘而检测四个顶点的坐标,输出检测到的原稿的四个顶点的坐标的值,并将这些值存储在RAM 118中。下面将描述在步骤S412中执行的多裁剪坐标检测处理的细节。
在步骤S413中,图像处理装置100进行图像亮度调整处理,以将在步骤S411中生成的图像的亮度值调整为适合于要发送的图像的亮度值。在步骤S411中生成的图像完全是暗的,如图5C所示,以提高多裁剪坐标检测的精度。图像处理装置100将使用用于多裁剪的设置值进行了亮度增益调整的图像的亮度数字地转换为,与使用如图5B所示的标准值进行了亮度增益调整的图像的亮度等同的亮度,并将得到的图像存储在HDD 119中。下面将描述图像亮度调整处理的细节。也就是说,如果在步骤S413中进行了增加用于多裁剪的图像的整体亮度的处理,则将图像转换为具有与使用正常设置扫描的图像的亮度等同的亮度的图像,并且将转换的图像用作用于发送的图像。
在步骤S414中,图像处理装置100执行图像裁剪处理,以从在步骤S413中经过了数字转换处理并被存储在HDD 119中的图像数据提取分别与原稿对应的区域的部分图像。图像处理装置100基于在步骤S412中检测到的原稿的四个顶点的坐标值,从步骤S413中转换的图像中裁剪分别与原稿对应的区域的部分图像,并进行诸如倾斜校正的仿射变换,以获取矩形原稿图像。图像处理装置100压缩裁剪后的原稿的原稿图像并将压缩图像存储在HDD119中。
在步骤S415中,图像处理装置100在显示/操作单元121的多裁剪处理结果UI画面上显示进行了多裁剪处理的原稿的图像。图4E例示了显示/操作单元121上显示的画面的示例,以示出多裁剪处理的结果。“原稿检测结果”UI 530是布置有通过多裁剪处理裁剪的图像的画面。
在步骤S416中,用户检查在显示/操作单元121上显示的裁剪结果图像,然后发出存储并发送所显示的原稿图像的指令。换句话说,如果用户按下开始键506,则图像处理装置100确定发出存储并发送所显示的原稿图像的指令。
在步骤S417中,图像处理装置100将裁剪后的原稿图像发送到PC/服务器终端101,PC/服务器终端101是在图4B中的“发送目的地”511中设置的发送目的地。要发送到PC/服务器终端101的图像文件被转换为在“扫描并发送”设置UI 510和“其他功能”设置UI 520中设置的格式和名称的文件。
在步骤S418中,PC/服务器终端101存储从图像处理装置100发送的多裁剪后的原稿的图像文件。虽然PC/服务器终端101可以简单地存储接收到的图像文件,但是可选地,PC/服务器终端101可以对图像文件进行诸如光学字符识别(OCR)处理的字符识别处理,并在将处理结果添加到图像文件之后存储图像文件。这使得可以增加图像可搜索性并在系统中登记从图像提取的信息。
如果用户在步骤S419中向PC/服务器终端101发出显示原稿图像的指令,则在步骤S420中,PC/服务器终端101显示用户针对其发出显示指令的原稿图像。在对存储在PC/服务器终端101中的图像进行诸如OCR处理等处理的情况下,PC/服务器终端101可以在步骤S420中显示OCR处理的结果。虽然描述了用户直接操作PC/服务器终端101以输入观看指令并且所存储的图像被显示在PC/服务器终端101的显示单元上的情况,但是本示例性实施例不限于这种情况。例如,在用户操作移动终端103并向PC/服务器终端101发送观看请求的情况下,可以将图像从PC/服务器终端101发送到移动终端103并在其上显示。
<“扫描并发送”功能的软件构造>
图7是例示在“扫描并发送”功能中多裁剪处理被设置为开的情况下由图像处理装置100执行的处理的流程图。CPU 111执行存储在ROM 117或HDD 119中的控制程序,从而实现下面描述的处理。
如果在多裁剪处理被设置为开的状态下按下开始键506,则执行图7所示的处理。
在步骤S600中,CPU 111从ROM 117读取用于执行亮度增益调整的参数,并将该参数存储在RAM 118中。将在多裁剪处理被设置为开的情况下用于亮度增益处理的参数预先存储在ROM 117中。
在步骤S601中,CPU 111经由扫描器I/F单元114控制扫描器单元120并扫描原稿。
在步骤S602中,CPU 111使用在步骤S600中获取的参数对在步骤S601中通过扫描原稿而获取的图像执行亮度增益调整。下面将描述在步骤S602中执行的亮度增益调整的细节。在步骤S602中,CPU 111在亮度增益调整之前进行阴影校正,并且基于预定的白色基准来归一化图像的亮度。此外,在亮度增益调整之后,CPU 111将图像亮度转换为诸如sRGB的标准化RGB信号。此时,使用三维查找表(LUT)或一维LUT进行转换处理。在执行了步骤S602的处理之后,将如图5C所示的进行了亮度增益调整的图像(适合于多裁剪处理的图像)存储在RAM 118中。
在步骤S603中,CPU 111检测在步骤S602中进行了亮度增益调整的图像上要裁剪的坐标。CPU 111使用亮度增益调整后的图像作为输入图像来检测原稿的边缘的直线,并且基于由边缘的直线包围的原稿的矩形来检测各原稿的四个顶点的坐标。下面将参照图9描述CPU 111在步骤S603中执行的处理。图像处理装置100基于在步骤S603中检测到的坐标,识别图像中的与原稿对应的区域。
在步骤S604中,CPU 111通过重新调整在步骤S602中进行了亮度增益调整的图像(适合于多裁剪处理的图像)的亮度来生成亮度适于发送的图像。在步骤S604中,CPU 111执行处理以增加整体亮度增益调整后的图像的亮度。CPU 111执行步骤S604的处理,从而生成图5D所示的图像,并将生成的图像存储在RAM 118中。下面将参照图11描述在步骤S604中执行的处理的细节。
在步骤S605中,CPU 111使用在步骤S603中检测到的坐标和在步骤S604中进行了亮度调整的图像来进行图像裁剪。在步骤S605中,CPU 111基于在步骤S603中检测到的各原稿的四个顶点,从亮度调整后的图像裁剪与原稿的区域对应的部分图像。然后,CPU 111将裁剪后的图像存储在RAM 118中。下面将参照图14描述步骤S605的细节。
在步骤S606中,CPU 111在显示/操作单元121上显示裁剪后的图像,如图4E所示。
在步骤S607中,CPU 111确定是否从用户接收到发送指令。如果用户按下开始键506,则接收来自用户的发送指令。如果没有从用户接收到发送指令(步骤S607中的“否”),则CPU 111继续执行步骤S607的处理。另一方面,如果从用户接收到发送指令(步骤S607中的“是”),则处理进入步骤S608。
在步骤S608中,CPU 111将裁剪后的图像发送到PC/服务器终端101。CPU 111将裁剪后的图像发送到用户指定的发送目的地。尽管图像被发送到作为外部装置的PC/服务器终端101,但是在本示例性实施例中,裁剪后的图像可以存储在图像处理装置100的存储装置112中。在存储装置112中存储裁剪后的图像的情况下,用户将存储装置112的存储目的地文件夹的地址指定为裁剪后的图像的发送目的地。
在上面的示例中,在图7的步骤S607中等待来自用户的发送指令。可选地,除了步骤S607中的发送指令之外,还可以从用户接收重试扫描和原稿检测的指令。例如,图像处理装置100在图4E中的“原稿检测结果”显示UI 530上显示重试按钮(未例示)。如果用户轻击重试按钮,则处理返回到步骤S600。以这种方式,在裁剪结果与用户预期的不同的情况下,迅速地重试扫描。尽管在步骤S600中由CPU 111设置的亮度增益调整参数可以具有相同的值,但是可以使用亮度增益调整参数的改变值来进行扫描。例如,可以根据重试次数增加亮度增益调整参数的值。此外,在用户选择了显示的原稿图像中的一个并且在图7的步骤S607中发出修改原稿裁剪位置的指令的情况下,可以显示从中剪裁原稿图像的图像(或者可以放大显示原稿图像周围的区域),使得用户可以手动修改裁剪位置。
<亮度增益调整处理>
接下来,将描述在图7中的步骤S602中执行的亮度增益调整处理的细节。
图8是例示在步骤S602中的亮度增益调整中由CPU 111执行的处理的流程图。用于执行图8所示的处理的程序存储在诸如ROM 117或HDD 119的存储装置112中。CPU 111执行存储在ROM 117或HDD 119中的程序以实现该处理。除了在亮度增益调整处理中要使用的参数值在多裁剪处理是开的情况和多裁剪处理是关的情况之间不同,在这两种情况下执行该亮度增益调整处理。
在步骤S1000中,CPU 111从ROM 117读取用于亮度增益调整的参数,并将读取的参数设置到RAM 118。在多裁剪处理被设置为开的情况下使用的参数大于在多裁剪处理被设置为关的情况下使用的参数。例如,在本示例性实施例中,在多裁剪处理被设置为关的情况下的亮度增益调整参数是255,而在多裁剪处理被设置为开的情况下的亮度增益调整参数是265。用于亮度增益调整的参数预先存储在ROM 117中,并且是出厂前设置在图像处理装置100中的值。用于亮度增益调整的参数可以在出厂后由维修人员重置。
在步骤S1001中,CPU 111使用在步骤S1000中存储在RAM 118中的亮度增益调整参数,调整基于通过扫描获取的图像的白色基准而归一化的亮度。在步骤S1001中,CPU 111使用下面指定的式1执行亮度增益调整。在式1中,d是从扫描器的电荷耦合器件(CCD)传感器输出的RGB信号的信号值。式1表示信号值被转换为基于白色基准而归一化的信号值。如这里所使用的,术语“白色基准”是指用于确定输出图像中的哪一白色水平(level)的信号值被调整为255的亮度水平的基准。在多裁剪处理是关的情况下进行亮度增益调整之后获得的亮度值为255的信号值被调整,使得该亮度值是比在多裁剪处理是开的情况下的亮度增益调整中的255暗的值。在式1中,d'是作为亮度增益调整的结果而获得的信号值。如上所述,在步骤S1001中用于调整图像的亮度的处理线性地转换图像的各像素的亮度。在本示例性实施例中,在将多裁剪处理设置为关的情况下的亮度增益调整参数是255,从而该处理基本上等同于通过处理(through processing)。这是因为信号已经基于白色基准被归一化。可以根据需要改变亮度增益调整参数。
下面将参照图6A和图6B中所示的示意图来描述在步骤S1001中进行的处理。图6A例示了将多裁剪处理设置为关的情况,而图6B例示了将多裁剪处理设置为开的情况。CPU111获取CCD传感器的输出,对输出进行归一化以将白色基准设置为255(阴影校正后的信号),然后使用式1计算调整后的信号值。例如,在将多裁剪设置为关并且阴影校正后的信号值为260的情况下,在亮度增益调整之后信号值为260。另一方面,在多裁剪处理被设置为开并且阴影校正后的信号值是260的情况下,在亮度增益调整之后的信号值是250.2。如上所述,在多裁剪处理被设置为开的情况下,亮度增益调整后的信号值低于多裁剪被设置为关的情况下的亮度增益调整后的信号值,并且生成的图像整体上比正常图像暗。
在步骤S1002中,CPU 111对亮度增益调整之后的信号值执行处理。在步骤S1002中,CPU 111将亮度增益调整之后的信号值为255以上的范围内的每个信号值用255替换。例如,在多裁剪被设置为开的情况下,如果阴影校正之后的信号值是275,则亮度增益调整之后的信号值是265。CPU 111在步骤S1002中对该范围中的信号值执行舍入处理,以将信号值从265改变为255。以这种方式,CPU 111用预定亮度替换图像中的比某个亮度更亮的部分的亮度,并输出图像。此外,在步骤S1002中,CPU 111将值舍入到最接近的整数。
将再次参照图6A和图6B描述在步骤S1002中执行的舍入处理。括号中指定的关于亮度值的数字是在亮度增益调整之后获得的信号值。CPU 111用255替换亮度增益调整值超过255的部分的输出信号。例如,在图6A中,亮度增益调整之后的玻璃台板盖的白色(260)和原稿的白色(265)各自用255替换。在图6B中,亮度增益调整之后的原稿的白色(255)输出为255,而第二原稿的白色(265)用255替换。
在多裁剪处理被设置为关的情况下,玻璃台板盖的白色(260)和原稿的白色(265)各自用255替换。另一方面,在多裁剪处理被设置为开的情况下,通过亮度增益调整将玻璃台板盖的白色260和原稿的白色265分别转换为(250.2)和(255),从而在进行了舍入处理的亮度值之间出现差异。这使得可以检测通过正常扫描不可检测的原稿的边缘。虽然在本示例性实施例中将多裁剪处理被设置为开的情况下的亮度增益调整参数设置为265,但是可以将亮度增益调整参数设置为更暗的值。
<多裁剪坐标检测处理的方法>
接下来,将参照图9描述从在图7中的步骤S603中执行的亮度增益调整之后获得的图像检测各原稿的四个顶点的坐标的处理。用于执行图9中所示的处理的程序存储在ROM117或HDD 119中。CPU 111读取并执行程序,从而实现该处理。
存在用于进行多裁剪的坐标检测处理的各种方法。这里,下面将描述检测轮廓和基于检测到的轮廓检测具有四个顶点的矩形的典型方法。可选地,可以使用任何其他方法来提取原稿轮廓并确定要裁剪的区域。
在步骤S700中,CPU 111将存储在HDD 119中的亮度增益调整后的图像展开到RAM118上。CPU 111将以联合图像专家组(JPEG)格式压缩并存储在HDD 119中的亮度增益调整后的图像展开到RAM 118上。在步骤S700中,将图5C所示的亮度增益调整后的图像展开到RAM 118上。
在步骤S701中,CPU 111将在步骤S700中展开的图像转换为原稿坐标检测处理所需的图像。在步骤S701中由CPU 111执行的处理的示例包括其中三通道RGB图像被转换为单通道灰色图像的灰化(graying)转换,以及分辨率降低处理。步骤S701中的处理是用于增加后续处理的速度的处理,并且可以被跳过。
在步骤S702中,CPU 111从在步骤S701中生成的图像提取边缘成分,并生成边缘部分图像。在步骤S702中执行的处理可以通过用于提取原稿的边缘成分的公知方法来实现,并且通过例如下面描述的方法来实现。
使用用于估计图像亮度的梯度的Sobel方法、Prewitt方法或Roberts Cross方法提取边缘部分。此外,还可以使用将图像的亮度梯度的连续性考虑在内的Canny方法。此外,通过不仅进行边缘提取处理,还进行局部自适应二值化处理以进行局部不同的阈值处理,可以检测边缘。此外,在步骤S702中,CPU 111可以执行上述方法之一或进行多个处理并对处理结果进行逻辑与(AND)运算(AND运算)以提取原稿的边缘。
在步骤S703中,CPU 111从在步骤S702中生成的图像的边缘部分图像,去除由大约几个像素的簇形成的孤立点。大约几个像素的小簇通常不是原稿的边缘部分而是噪声。因此,为了去除可能在诸如轮廓检测处理的后续处理中导致错误判断的噪声,CPU 111去除边缘部分中的这样的几个像素的小簇。
在步骤S704中,CPU 111对去除了孤立点的边缘部分图像执行线段连接处理。如果原稿的边缘部分的亮度的梯度不均匀,则可以断开边缘部分图像中的轮廓线。在步骤S703中,CPU 111执行直线连接处理以连接断开的轮廓线。在步骤S703中执行的处理是公知的方法。例如,使用霍夫变换连接线段。此外,可以使用图像扩展处理来连接线段。图10A例示了作为执行步骤S701至S704的结果而获得的图像。由点{0,0}、{X,0}、{0,Y}和{X,Y}包围的图像800指示整体扫描图像。
在步骤S705中,CPU 111从生成的边缘部分图像提取由边缘部分包围的轮廓。CPU111在检查指定边缘部分的像素的连续性的同时检测轮廓。此外,CPU 111获取轮廓的使轮廓线的曲线的方向在此处改变的各拐点的坐标。
在步骤S706中,CPU 111使用在步骤S705中检测到的拐点的坐标从图像检测矩形。CPU 111检测由在步骤S705中检测到的拐点的坐标和连续边缘线包围的矩形。用于检测的方法是,例如,检测通过连接边缘线形成的对象的外接矩形的方法。
在步骤S707中,CPU 111从在步骤S706中检测到的矩形,选择与原稿的边缘部分对应的矩形。例如,在扫描图10A中的原稿A的情况下,指定原稿的边缘部分的矩形和形成打印在原稿A中的表的多个矩形被检测。因此,从多个矩形选择形成原稿A的边缘的矩形。在步骤S707中,CPU 111仅将多个矩形当中的最外面的矩形确定为有效矩形,并将包含在另一个矩形中的矩形确定为无效矩形。以这种方式,由原稿的片材形成的矩形被确定为有效矩形,而原稿中的诸如表或图等矩形被确定为无效矩形。
在步骤S708中,CPU 111将有效矩形的顶点的坐标变换为在步骤S701中图像尺寸减小的情况下的输入图像尺寸的坐标。在步骤S701中未转换图像尺寸的情况下,跳过步骤S708。
在步骤S709中,CPU 111将各原稿的四个顶点的坐标存储在HDD119中。坐标数据的存储目的地可以是存储装置112中的任何位置。
图10B是例示检测到的各原稿的四个顶点的坐标的示意图。图10B例示了在左上端为原点的情况下的宽度为X像素和高度为Y像素的图像。在图像800中,图像801、802和803分别与原稿A、B和C对应。通过步骤S700到步骤S709的处理,将图像800划分成分别与原稿A到C对应的图像801到803,并且获取各图像的四个顶点的坐标值。在本示例性实施例中的图像801(原稿A)的情况下,获取图像801的四个顶点的坐标值801{x1,y1}、801{x2,y2}、801{x3,y3}和801{x4,y4}。针对所获取的原稿的数量(801{xi,yi}至803{xi,yi}:(i=1至4))获取四个顶点。
<图像亮度调整处理的方法>
接下来,将参照图11描述由CPU 111在图7中的步骤S604中执行的图像亮度调整处理。用于执行图11所示的处理的程序存储在ROM 117或HDD 119中。CPU 111执行存储在ROM117或HDD 119中的控制程序,从而实现该处理。
在图7中的步骤S602中经过了亮度增益调整的图像整体上比正常扫描图像暗,并且不适合用作要存储/发送的图像。因此,在步骤S604中,CPU 111生成要以增加的图像的亮度存储并发送的图像。虽然可以任意设置图像的亮度要被增加的水平,但是亮度可以增加到与多裁剪处理被设置为关的情况下相同的水平。
在图像亮度调整处理中,要使用的方法不限于特定方法,并且可以使用任何方法,只要可以增加整体图像的亮度即可。下面将描述三种方法作为示例。在本示例性实施例中,使用三种方法之一来调整图像的亮度。
第一种方法是使用伽马校正处理来增加图像的亮度的校正方法。图11是例示图像亮度调整处理的流程的流程图。用于实现图11所示的处理的程序存储在ROM 117或HDD 119中,并且CPU 111读取并执行该程序,从而实现该处理。
在步骤S1100中,CPU 111将图像信号值从RGB颜色空间的转换为YUV颜色空间。虽然在步骤S1100中转换的颜色空间是YUV颜色空间,但是转换的颜色空间可以是由亮度和色差定义的任何颜色空间,例如YCbCr颜色空间。
在步骤S1100中,CPU 111使用下式2执行从RGB到YUV的转换:
Y=0.299×R+0.587×G+0.114×B,
U=-0.169×R-0.331×G+0.500×B,以及
V=0.500×R-0.419×G-0.081×B。
在步骤S1101中,CPU 111执行伽马校正处理,以增加作为亮度信号的Y信号的亮度。CPU 111使用下式3校正转换之后的Y信号的信号值。
其中γ>1.0
图12例示了伽马值为2.0的情况下的转换表。基于在多裁剪处理被设置为开的情况下的亮度增益调整参数的值来确定伽马值。具体地,基于在执行亮度增益调整时图像要被调整到的暗度的设置来确定该值。伽马值预先存储在ROM 117或HDD 119中。在图12中,横轴表示输入信号,而纵轴表示输出信号。执行步骤S1101中的处理,从而进行校正以增加整体图像的亮度。
在步骤S1102中,CPU 111使用步骤S1101中的校正后的Y'信号值和步骤S1100中的转换的U和V值来计算R'、G'和B'值。CPU 111使用下式4将YUV信号转换为RGB信号。CPU 111将校正后的图像存储在HDD 119中。
式4:
R'=1.000×Y'+1.402×V
G'=1.000×Y'-0.344×U-0.714×V
B'=1.000×Y'+1.772×U
执行图11所示的处理,从而进行校正以增加在图7中的步骤S602中生成的整体图像的亮度。图5D例示通过使用图5C中所示的图像执行处理而获取的图像作为输入图像,并且图5D中的图像的亮度接近作为利用标准亮度获取的图像的、图5B中的图像的亮度。以这种方式,从被校正为完全暗的图像获取适于存储的亮图像,以便于提取原稿的边缘部分。在上述方法中,RGB值被转换为由亮度和色差定义的颜色空间,并且仅调整亮度信号。以这种方式,即使在图像的亮度增加之后,也保留了图像中包含的色差。
第二种方法是用于图像亮度调整的方法,其比第一种方法简单。在第二种方法中,增加图像的亮度而不执行从RGB空间到其他颜色空间的转换。CPU 111获取RGB信号并使用下式5将获取的RGB信号转换为R'、G'和B'信号:
其中γ>1.0,
其中γ>1.0,以及
其中γ>1.0。
上述转换公式使得能够在整体图像的亮度增加的同时进行转换。
使用伽马校正处理来增加图像的亮度的上述校正方法使得可以将扫描图像的亮度转换为与使用比正常设置暗的设置扫描的扫描图像中的正常亮度等同的亮度。然而,存在这样的情况:预先进行设置,使得进行与上述处理不同的伽马校正处理(下文中,称为“图像形成中的伽马校正”)作为“扫描并发送”功能中的步骤S411中的图像形成处理中的图像处理。例如,即使扫描目标原稿最初是白色片材,扫描图像也可能具有轻微的背景颜色,这取决于片材的质量或扫描器的光源或传感器的状态,使得进行图像形成中的伽马校正处理以去除背景颜色。因此,在步骤S411中进行图像形成中的伽马校正的情况下,可以在消除图像形成中的伽马校正的效果之后进行亮度校正,然后可以再次进行图像形成中的伽马校正。
图19是例示图像亮度调整处理的过程的流程图。用于实现图19所示的处理的程序存储在ROM 117或HDD 119中,并且CPU 111读取并执行该程序,从而实现该处理。
在步骤S1103中,CPU 111进行转换从而消除图像形成中的伽马校正的影响(即,从而通过反函数进行乘法运算)。例如,使用1.8的幂(或约1.0至约3.0的幂)的值对图像形成中的亮度输入执行伽马校正。
式6:
上述转换公式使得可以进行转换从而消除图像形成中的伽马校正的影响(即,从而通过反函数进行乘法运算)。
然后,在步骤S1104中,CPU 111进行转换以调整图像的亮度。例如,通过将输入信号值乘以预定系数来调整亮度。
式7:
R'=R×比率,其中比率>1.0
G'=255×比率,其中比率>1.0
B'=255×比率,其中比率>1.0
然后,在步骤S1105中,CPU 111进行转换以进行与图像形成中的伽马校正等同的伽马校正。例如,对图像形成中的亮度输入执行使用1/1.8的幂(或约1/1.0到约1/3.0的幂)的值的伽马校正。
式8:
可以使用上述转换公式来进行转换以进行与图像形成中的伽马校正等同的伽马校正。
作为第三种方法,将描述使用三维LUT的转换处理。使用三维LUT将输入RGB数据转换为不同的RGB数据。图20例示了三维LUT的概念构造,并且在R、G和B的三个方向上分别设置0到255的正交轴。正交轴与输入RGB数据的各像素对应。LUT的入口点离散地分布在正交轴上,并且为各入口点存储三维LUT的RGB输出值。在下文中,入口点将被称为“网格点”。图13例示了在网格点间隔为17的情况下的网格点表的示例。图13中的输入R、输入G和输入B是图20中的正交轴上的坐标。输出R、输出G和输出B是对应于输入R、输入G和输入B的组合的输出值。例如,在输入R、输入G和输入B为(0,0,17)的情况下,输出R、输出G和输出B是(0,0,19)。
除了与网格点对应的RGB值之外的值也被输入到三维LUT。在这种情况下,通过内插处理确定输出RGB值。具体地,如果输入RGB值被输入到三维LUT,则确定包括坐标的四个网格点,即,作为三角锥的顶点的网格。然后,基于网格的输出RGB值和各网格与输入RGB值的坐标之间的距离,通过线性插值确定输出RGB值。更多细节如日本特开第2005-354421号公报中所讨论的。
例如,在包括输入像素信号P的四个网格如图21所示的情况下,四个网格是C0、C1、C2和C3。
存储在网格中的输出RGB值是
C0:(R_C0,G_C0,B_C0),
C1:(R_C1,G_C1,B_C1),
C2:(R_C2,G_C2,B_C2),和
C3:(R_C3,G_C3,B_C3),
并且网格之间的距离是N。
此外,在选择四个网格时,基于各网格与输入RGB值的坐标之间的距离来计算A0、A1、A2和A3的加权因子。
然后,通过如下线性插值来导出三维LUT相对于输入RGB信号的输出RGB值R2、G2和B2,
R2=(A0×R_C0+A1×R_C1+A2×R_C2+A3×R_C3)/N,
G2=(A0×G_C0+A1×G_C1+A2×G_C2+A3×G_C3)/N,和
B2=(A0×B_C0+A1×B_C1+A2×B_C2+A3×B_C3)/N。
如上所述,使用三维LUT使得可以非线性地转换输入RGB信号并输出具有不同颜色空间特性的RGB信号。增加网格点的数量会增加插值计算的精度,但是要使用的存储器的量会增加。
在步骤S602中,将亮度增益调整后的RGB信号转换为标准化RGB信号,例如sRGB,因为亮度增益调整后的RGB信号仅具有依赖于光学设备的特性。在转换中,经常组合使用用于伽马校正的一维LUT和三维LUT,因为转换通常是非线性转换并且不能通过简单的线性计算处理来执行。
转换中使用的三维LUT的参数预期要针对正常扫描而被优化并被设计,在正常扫描中,多裁剪被设置为关。在这种情况下,由于在步骤S602中进行非线性转换,所以即使在步骤S604中的亮度调整处理中进行线性处理,也不可能将RGB值返回到与正常扫描时的RGB值等同的RGB值。在这种情况下,还通过在该步骤中使用三维LUT进行RGB信号转换来进行亮度调整处理。
接下来,将参照图22A至图22D描述生成用于亮度调整的亮度调整三维LUT的方法。图22A例示了在多裁剪设置是关的情况下RGB信号的流程。输入RGB 2201是通过进行阴影校正并基于预定的白色基准对图像的亮度进行归一化而获得的信号。对信号进行亮度增益调整,但是在多裁剪设置是关的情况下,亮度增益调整处理基本上等同于通过处理。因此,亮度增益调整之后的RGB 2202等同于输入RGB 2201。即使在这种情况下,也进行用255替换信号值为255以上的范围内的信号值的处理。此后,通过使用伽马校正一维LUT的处理和使用颜色空间转换三维LUT的处理而转换为标准化RGB的信号是正常输出RGB 2203。由于多裁剪设置是关,因此不进行后续处理。
图22B例示了在多裁剪设置是开的情况下RGB信号的流程。输入RGB 2204是通过进行阴影校正并基于预定的白色基准对图像的亮度进行归一化而获得的信号。该信号等同于输入RGB 2201。对信号进行亮度增益调整,以在亮度增益调整之后获得RGB 2205。此后,对该信号进行使用伽马校正一维LUT的处理和使用颜色空间转换三维LUT的处理,以生成尚未进行亮度调整的RGB 2206。在生成未进行亮度调整的RGB 2206时使用的伽马校正一维LUT和颜色空间转换三维LUT是具有与图22A中的参数相同的参数的LUT。然而,由于进行了亮度增益调整,因此正常输出RGB 2203和未进行亮度调整的RGB 2206不是相同的输出。该信号是亮度调整三维LUT 2201和裁剪坐标检测处理的输入信号。步骤S604中的亮度调整处理的目的是将进行了亮度调整的RGB 2206转换为等同于正常输出RGB 2203的信号。换句话说,亮度调整三维LUT 2201的作用是对未进行亮度调整的RGB 2206进行转换,以将亮度调整之后的输出信号2207调整为等同于正常输出RGB 2203的信号。由于插值计算的精度和位精度,信号不会变成相同,使得目的是输出基本上等同于正常输出RGB 2203的信号。
将描述如何获得用于目标的亮度调整三维LUT 2201的参数。首先,获取在输入RGB2201和输入RGB 2204的RGB值相同的情况下正常输出RGB 2203和在亮度调整之后的RGB2207的RGB值的组合。通过改变输入RGB 2201和输入RGB 2204的RGB值来获取各种组合以生成组合表。对于R、G和B中的各个,RGB值从零变为X。X是输入RGB 2204的信号值当中的最小值,其在图22B中在亮度增益调整之后获取信号值为255的RGB 2205。在本示例性实施例中,X是265,如图6B中所指定的。组合表包含亮度调整三维LUT 2201的输入和输出的组合。输入是未进行亮度调整的RGB 2206的RGB值,并且输出是正常输出RGB 2203的RGB值。通过基于组合表获取存储在三维LUT的网格点中的RGB值来获取亮度调整三维LUT 2201的参数。网格点的坐标是未进行亮度调整的RGB 2206的RGB值,并且存储在网格点中的值是正常输出RGB2203,其对应于亮度调整之后的RGB 2207的RGB值。对于在未获取正常输出RGB 2203的值作为亮度调整之后的RGB 2207的RGB值的网格点,通过对存储在该网格点的坐标附近的其他网格点中的正常输出RGB 2203的RGB值进行插值来获取这些值。以这种方式,生成能够进行非线性亮度调整处理的亮度调整三维LUT。
在上述方法中,使用三维LUT的处理将被进行两次。使用三维LUT的处理的计算成本高。此外,在使用亮度调整三维LUT的处理要由外部服务器进行的情况下,各设备类型的亮度调整三维LUT将被保持在外部服务器中。将参照图22C和图22D描述为了解决上述问题而仅使用三维LUT一次的方法。在图22C中,图22B中的亮度调整三维LUT 2201被划分成在裁剪坐标检测处理之前和之后提供的非线性校正三维LUT 2203和亮度调整一维LUT 2204。亮度调整一维LUT 2204仅进行将亮度增益返回到原始值的处理。具体地,使用下式6对R、G和B信号中的各信号进行计算处理。
在式6中,IN是亮度调整一维LUT 2204的输入,并且OUT是亮度调整一维LUT 2204的输出。在OUT的值超过255的情况下,进行将值调整为255的处理。使用与式1中的值相同的亮度增益调整参数。虽然在本示例性实施例中参数是265,但是参数可以是与式1中的参数相同的任何其他值。使用式6来进行用于将在式1中对信号值进行的亮度增益调整处理撤消回原来的处理。然而,不考虑使用伽马校正一维LUT的处理和使用颜色空间转换三维LUT的处理。因此,通过非线性校正三维LUT 2203来适应该处理。具体地,非线性校正三维LUT2203的作用是在颜色空间转换之后处理RGB 2008并输出未进行亮度调整的输出信号2209,并且亮度调整一维LUT 2204的作用是进一步处理输出信号2209并将输出信号2209调整为等同于正常输出RGB 2203的信号。由于插值计算的精度和位精度,信号不会变成相同,因此目的是输出等同于正常输出RGB 2203的信号。
将描述如何获得非线性校正三维LUT 2203的参数。首先,获得与用于获得亮度调整三维LUT 2201的参数的组合表相同的组合表。虽然在获得亮度调整三维LUT 2201的参数的情况下的输入值是未进行亮度调整的RGB 2206,但是在获得非线性校正三维LUT 2203的情况下的输入值是进行了颜色空间转换的RGB 2208。RGB 2206和RGB 2208的值相同。接下来,使用式1来转换组合表的输出值(正常输出RGB 2203的RGB值),因为要获得的值是未进行亮度调整的、并且作为非线性校正三维LUT 2203的输出的RGB 2209。如果使用亮度调整一维LUT 2204处理转换后的值,则亮度调整后的RGB 2210和正常输出RGB 2203变为等同值。然而,未进行亮度调整的RGB 2209仅具有零到(255×255/亮度增益调整参数)的值。在亮度增益调整参数是265的情况下,RGB 2209是约245。对于裁剪坐标检测处理,接近255的值是重要的,因此保留接近255的值作为非线性校正三维LUT 2203的输出值。因此,在转换后的输出值是(255×255/亮度增益调整参数)的值的情况下,进行校正以直接输出输入值的信号值作为输出值。另一方面,在校正后的输出值小于(255×255/亮度增益调整参数)的值的情况下,校正后的输出值仍为(255×255/亮度增益调整参数)的值。由于在使用亮度调整一维LUT 2204的处理中输出255,因此即使进行上述校正处理,也不会出现问题。图23例示了具体示例。图23例示了在亮度增益调整参数是265的情况下来自组合表的两个组合示例。在组合索引(Index)1的情况下,输出值RGB(80,53,124)被转换,获得使用式1转换的输出值RGB(77.0,51.0,119.3)。因为没有RGB值满足校正条件(255×255/265≈245.4),因此不进行校正处理,使得已进行校正处理的输出值与转换之后的输出相同。如果使用亮度调整一维LUT 2204处理已进行了校正处理的输出值RGB,则获得进行了亮度调整的RGB(80,53,124),并且获得的RGB是与输出值RGB相同,因此可以理解转换处理是正确的。在组合索引2的情况下,转换输出值RGB(228,255,255),并且获得使用式1转换的输出值RGB(219.4,245.4,245.4)。对G和B进行校正处理,G和B是满足校正条件(255×255/265=245.4)的RGB值。对于G,输入值是243,其小于245.4,因此该值仍为245.4。对于B,输入值是250,其超过245.4,因此该值是250。结果,进行了校正处理的输出值RGB是(219.4,245.4,250)。如果使用亮度调整一维LUT 2204处理已进行了校正处理的输出值RGB,则获得进行了亮度调整的RGB(228,255,255)。获得的RGB与输出值RGB相同,因此可以理解转换处理是正确的。对于B,执行将超过255的值调整为255的处理。如上所述计算的校正后的输出值RGB被称为非线性校正三维LUT 2203的输出。此外,进行了颜色空间转换的RGB 2208被称为非线性校正三维LUT 2203的输入。如果从输入/输出组合表获得存储在三维LUT的网格点中的RGB值,则获得非线性校正三维LUT 2203的参数。网格点的坐标是已进行颜色空间转换的RGB 2208的RGB值,并且存储在网格点中的值是校正后的输出值的RGB值,颜色-空间转换后的RGB 2208的RGB值与该校正后的输出值的RGB值被相关联作为组合。在组合表不包含作为网格点的坐标的颜色空间转换后的RGB 2208的RGB值的情况下,对作为在该网格点的坐标附近的坐标的组合的校正后的输出值的RGB值进行插值,以确定要存储在网格点中的值。以这种方式,生成能够进行非线性亮度调整处理并且可以与亮度调整一维LUT组合的非线性校正三维LUT2203。如上所述生成的非线性校正三维LUT 2203可以与颜色空间转换三维LUT 2202组合。这在图22D中例示。在图22D中,颜色空间转换和非线性校正三维LUT 2205是颜色空间转换三维LUT 2202和非线性校正三维LUT 2203的组合。LUT 2202和2203组合使得进行三维LUT处理的次数减少到一次。
如上所述,即使在多裁剪处理是关的情况下的处理中进行非线性处理,也使用三维LUT将在多裁剪处理是开的情况下的最终信号值调整为与在多裁剪处理是关的情况下的信号等同的信号。
尽管在本示例性实施例中描述了用于图像亮度调整处理的三种方法,但是这些方法不旨在限制图像亮度调整方法,并且可以使用除了上述方法之外的任何方法,只要它能够增加整体图像的亮度。
<图像裁剪输出处理的方法>
接下来,图14是例示CPU 111裁剪、输出和存储与原稿对应的图像的处理的流程图。用于执行图14所示的处理的程序存储在ROM 117或HDD 119中,并且CPU 111执行程序从而实现该处理。
在步骤S900中,CPU 111将在图7的步骤S604中存储在HDD 119中的图像展开到RAM118上。具体地,在步骤S900中,CPU 111展开存储在HDD 119中的JPEG压缩图像。
在步骤S901中,CPU 111获取在图7中的步骤S603中检测到的并存储在HDD 119中的坐标。
在步骤S902中,CPU 111使用在步骤S900中获取的图像和在步骤S901中获取的各原稿的四个顶点的坐标来执行图像裁剪处理。使用公知的方法来裁剪图像。例如,在通过连接在步骤S901中获取的四个点而形成的矩形不倾斜的情况下,CPU 111裁剪由这四个顶点包围的区域。此外,在通过连接四个顶点形成的矩形倾斜的情况下,CPU 111使用仅考虑旋转的公知仿射变换来确定要裁剪的区域。此外,CPU 111可以使用如下单应矩阵来确定要使用投影转换而裁剪的区域,该单应矩阵除了考虑旋转之外,还考虑梯形校正和失真校正。
在步骤S903中,CPU 111压缩在步骤S902中裁剪的图像并将压缩的图像存储在HDD119中。图15A至图15C例示了在步骤S903中存储在HDD 119中的图像。在步骤S903中,来自图5D中的输入图像的图15A、图15B和图15C中的原稿的图像存储在HDD 119中。
虽然在本示例性实施例中作为示例描述了“扫描并发送”功能的处理,但是无论该功能是否是“扫描并发送”功能,本示例性实施例都是可执行的。例如,本示例性实施例可在扫描图像被存储在图像处理装置100中的“扫描并存储”功能或多裁剪后的原稿图像被传真发送的传真发送功能中执行。
此外,在本示例性实施例中,图像处理装置100执行裁剪坐标检测、图像亮度校正和图像裁剪处理。图像处理装置100可以进行扫描并将亮度增益调整后的图像发送到服务器、个人计算机(PC)或云。然后,可以在服务器、PC或云上执行裁剪坐标检测、图像亮度校正和图像裁剪处理。
如上所述,在进行多裁剪处理的情况下,以这样的方式生成扫描图像:在扫描原稿时保留高亮度侧的信号,以便于从扫描图像检测与原稿对应的区域,并且调整扫描图像的亮度以生成具有适于存储的亮度的图像。
下面将描述第二示例性实施例。在第一示例性实施例中,使用处理的图像提取原稿的边缘部分,以在改变用于亮度增益调整的参数的同时使其整体上比正常图像暗。然后,校正用于提取原稿的边缘部分的图像的亮度,以增加整体图像的亮度,从而生成用于存储的图像。存在以下若干情况,其中,如果使用上面第一示例性实施例中描述的方法进行数字处理以校正图像的亮度来增加亮度,则可以在以正常亮度获取的图像中改变色调和灰度。在第二示例性实施例中,将描述这样一种方法,其中,基于多裁剪处理设置来选择是使用数字处理进行原稿亮度调整还是使用在正常扫描中使用的参数来重新扫描原稿并进行亮度增益调整。
在扫描诸如图片的原稿(其优先考虑诸如图像颜色色调和灰度的图像质量)的情况下,在使用用于多裁剪的参数进行亮度增益调整之后执行重新扫描,然后使用用于在正常扫描中使用的参数来进行亮度增益调整。以这种方式,可以在保留原稿的图像质量和颜色色调的同时增加裁剪坐标的精度。另一方面,在扫描不必优先考虑图像质量的原稿的情况下,例如单色原稿或纯文本原稿,可以通过使用数字处理增加图像亮度来减少获取各原稿的图像所需的处理时间。
在扫描原稿并将扫描原稿发送到外部装置和将扫描原稿存储在图像处理装置100中的情况下,进行各种类型的图像处理。例如,在发出进行二值化处理然后存储数据的指令或者进行文本识别然后将数据存储为文本串数据的指令的情况下,要存储的图像的颜色色调或灰度的降低不会引起任何问题。因此,在发出二值化处理指令或文本识别处理指令的情况下,图像处理装置100从通过使用用于多裁剪的参数来校正经过亮度增益调整的图像的亮度而获取的图像,提取与原稿对应的图像。在设置进行JPEG转换的设置或专用于整体图片的处理的情况下,确保了颜色色调和灰度。因此,对使用用于多裁剪的参数通过第一扫描获取的图像进行亮度增益调整,并且检测各原稿的边缘。然后,使用用于正常扫描的参数对通过第二扫描获取的图像进行亮度增益调整,并且生成用于存储的图像。以这种方式,保留了用于存储的图像的颜色色调和灰度。
在本示例性实施例中,根据处理是优先考虑图像质量的后续处理还是优先考虑处理速度的后续处理(不优先考虑图像质量的后续处理)来切换处理。图16是例示根据第二示例性实施例的图像处理装置100执行的处理的流程图。用于执行图16所示的处理的程序存储在ROM 117或HDD 119中。CPU 111读取并执行存储在ROM 117或HDD 119中的处理,从而实现处理。与图7中的处理类似的处理被赋予与图7中相同的附图标记。将仅描述与图7不同的处理。
在步骤S1601中,CPU 111确定所设置的设置值是否是优先考虑图像质量的设置值。虽然存在用于确定是否设置了优先考虑图像质量的设置的各种方法,但是CPU 111确定是否使用本示例性实施例中的图17所示的表来设置优先考虑图像质量的设置。CPU 111参照用户设置的设置值并确定是否设置了优先考虑图像质量的设置值。如果没有设置优先考虑图像质量的设置值(步骤S1601中的“否”),则CPU 111执行步骤S604和后续步骤中的处理。在未设置优先考虑图像质量的设置的情况下,与第一示例性实施例中一样,使用数字处理来增加通过使用用于多裁剪的亮度增益调整参数进行亮度增益调整而获取的图像的亮度。以这种方式,减少了完成多裁剪处理所需的时间。
另一方面,如果设置了优先考虑图像质量的设置值(步骤S1601中的“是”),则CPU111执行步骤S1602和后续步骤中的处理。
在步骤S1602中,CPU 111从ROM 117读取在多裁剪处理被设置为关的情况下使用的亮度增益调整参数,并且将读取的亮度增益调整参数存储在RAM中。在多裁剪处理被设置为关的情况下使用的亮度增益调整参数的值小于在步骤S600中设置的亮度增益调整参数的值。在多裁剪处理是关的情况下使用的亮度增益调整参数被预先存储在ROM 117中。
在步骤S1603中,CPU 111经由扫描器I/F单元114控制扫描器单元120以扫描原稿。在步骤S1603中由CPU 111执行的处理类似于在步骤S601中由CPU 111执行的处理。
在步骤S1604中,CPU 111使用在步骤S1602中获取的亮度增益调整参数来调整在步骤S1603中获取的图像的亮度。在步骤S1604中执行的处理类似于上面参照图8描述的处理,因此省略其描述。执行步骤S1604中的处理,从而生成图5B所示的图像。后续处理类似于步骤S605和后续步骤中的处理,因此省略其描述。在如上述的步骤S1602至S1604中设置优先考虑图像质量的设置的情况下,使用与正常扫描中的参数相同的参数来进行亮度增益调整。以这种方式,从保证图像质量和颜色色调与不进行多裁剪处理的情况中的图像质量和颜色色调类似的图像,裁剪原稿的图像。
如上所述,根据设置值来切换生成要从其裁剪图像的图像的方法。以这种方式,处理在优先考虑诸如颜色色调和灰度等图像质量的情况与优先考虑性能和速度(诸如用户手分离速度)的情况之间进行切换。
在本示例性实施例中,基于根据用户指令设置的设置值来对处理进行切换。可选地,可以通过分析在步骤S601中通过扫描获取的图像来确定是否进行优先考虑图像质量的处理。例如,CPU 111可以基于扫描图像中包含的颜色的数量或者基于灰度的存在/不存在来切换是执行步骤S1601和后续步骤中的处理,还是执行步骤S604和后续步骤中的处理。此时,如果图像中包含的颜色的数量是预定数量以上,或者如果图像包含灰度区域,则CPU111执行步骤S1601和后续步骤。
此外,在本示例性实施例中,在设置优先考虑图像质量的设置的情况下,再次扫描原稿,并且使用与步骤S602中使用的亮度增益调整参数不同的亮度增益调整参数来执行亮度增益调整。在图像处理装置100包括用于存储在步骤S601中通过扫描原稿而获取的图像的存储器的情况下,可以在步骤S1604中对存储在存储器中的图像执行亮度增益调整。在这种情况下,在步骤S1603中不需要重新扫描原稿。因此,即使在优先考虑图像质量的情况下,也可以执行多裁剪处理而无需两次扫描原稿。
将描述第三示例性实施例。在第一示例性实施例中,改变用于亮度增益调整的参数,并且使用被处理成整体上比正常图像暗的图像来提取原稿的边缘部分。然后,校正用于提取原稿的边缘部分的图像的亮度,并增加整体图像的亮度,从而生成用于存储的图像。在第一示例性实施例中描述的方法中,校正原稿的整体图像的亮度,然后从图像的一部分裁剪部分。由于调整了整体图像的亮度,因此也会调整不必在最终图像中调整的部分的亮度,这降低了处理性能。在第三示例性实施例中,将描述这样一种方法,其中,裁剪检测到的各原稿的图像,然后仅对裁剪后的图像进行亮度调整,以提高处理性能。
图18例示了当用户使用“扫描并发送”功能时执行多裁剪处理的序列。图18与图3的不同之处在于,改变了步骤S414中的图像裁剪处理的细节,并且在图像裁剪处理(步骤S414)与多裁剪处理结果UI显示处理(步骤S415)之间添加了裁剪后的图像亮度调整处理(步骤S422)。
步骤S400至S412以及步骤S415和后续步骤中的处理类似于第一示例性实施例中的处理,因此省略其详细描述。
在步骤S414中的图像裁剪处理中,图像处理装置100从在步骤S411中作为数据存储在HDD 119中的图像,裁剪与原稿对应的各原稿图像。图像处理装置100还基于原稿的左上、右上、右下和左下的四个顶点的坐标,使用诸如倾斜校正的仿射变换来裁剪矩形原稿图像。图像处理装置100压缩裁剪后的图像并将压缩图像存储在HDD 119中。
在步骤S422中的裁剪后的图像亮度调整处理中,图像处理装置100调整在步骤S414中裁剪并存储在HDD 119中的各原稿图像的亮度。步骤S422中的亮度调整处理类似于上面在第一示例性实施例中描述的步骤S413中的图像亮度调整处理。具体地,在步骤S422中的裁剪后的图像亮度调整处理中,进行增加各原稿图像的亮度的处理,从而生成具有与使用正常设置扫描的图像的亮度等同的亮度的图像。
如上所述,从适合于原稿位置检测的图像来检测坐标位置,并且从图像裁剪原稿的各图像,并且调整裁剪后的原稿图像的亮度,由此生成用于发送的图像,从而提高处理性能。
其他实施例
还可以通过读出并执行记录在存储介质(也可更完整地称为“非临时性计算机可读存储介质”)上的计算机可执行指令(例如,一个或更多程序)以执行上述实施例中的一个或更多个的功能、和/或包括用于执行上述实施例中的一个或更多个的功能的一个或更多个电路(例如,专用集成电路(ASIC))的系统或装置的计算机,来实现本发明的实施例,并且,可以利用通过由所述系统或装置的所述计算机例如读出并执行来自所述存储介质的所述计算机可执行指令以执行上述实施例中的一个或更多个的功能、和/或控制所述一个或更多个电路执行上述实施例中的一个或更多个的功能的方法,来实现本发明的实施例。所述计算机可以包括一个或更多个处理器(例如,中央处理单元(CPU)、微处理单元(MPU)),并且可以包括分开的计算机或分开的处理器的网络,以读出并执行所述计算机可执行指令。所述计算机可执行指令可以例如从网络或所述存储介质被提供给计算机。所述存储介质可以包括例如硬盘、随机存取存储器(RAM)、只读存储器(ROM)、分布式计算系统的存储器、光盘(诸如压缩光盘(CD)、数字通用光盘(DVD)或蓝光光盘(BD)TM)、闪存设备以及存储卡等中的一者或更多。
发明的实施例还可以通过如下的方法来实现,即,通过网络或者各种存储介质将执行上述实施例的功能的软件(程序)提供给系统或装置,该系统或装置的计算机或是中央处理单元(CPU)、微处理单元(MPU)读出并执行程序的方法。
虽然参照示例性实施例描述了本公开,但是应当理解,本公开不限于所公开的示例性实施例。权利要求的范围应当被赋予最宽的解释,以涵盖所有这类变型例以及等同的结构和功能。
Claims (19)
1.一种图像处理装置,包括:
第一调整单元,其被构造为,通过以保留通过用扫描器读取原稿而获取的信号值当中的、高亮度侧的信号值的方式调整亮度,来生成第一图像;
检测单元,其被构造为,检测与生成的第一图像中的原稿对应的区域的位置;
第二调整单元,其被构造为,通过以增加包含在第一图像中的像素的亮度的方式进行调整,来生成第二图像;以及
裁剪单元,其被构造为,基于检测到的位置,从生成的第二图像来裁剪与原稿对应的原稿图像。
2.根据权利要求1所述的装置,
其中,第一图像包含多个原稿的图像,
其中,检测单元检测,分别与包含在第一图像中的所述多个原稿对应的各区域的位置,并且
其中,裁剪单元基于分别与所述多个原稿对应的区域的位置,从第二原稿来裁剪与所述多个原稿对应的各原稿图像。
3.根据权利要求1所述的装置,其中,第一调整单元通过如下处理来生成第一图像:通过以将在用扫描器读取原稿时的、高亮度侧的预定亮度值调整为第一亮度值的方式进行增益调整,然后进行将进行了增益调整的像素的亮度值高于第一亮度值的像素的亮度值替换为具有第一亮度值的像素的亮度值,来生成第一图像。
4.根据权利要求3所述的装置,其中,第一调整单元以将所述预定亮度值调整为第一亮度值的方式对各像素的亮度值线性地进行增益调整。
5.根据权利要求1所述的装置,还包括:
显示单元,其被构造为,显示裁剪后的原稿图像。
6.根据权利要求1所述的装置,还包括:
文本识别处理单元,其被构造为,对裁剪后的原稿图像执行文本识别处理;和
存储单元,其被构造为,将裁剪后的原稿图像与对原稿图像执行的文本识别处理的结果相关联地存储。
7.根据权利要求1所述的装置,还包括:
发送单元,其被构造为,将裁剪后的原稿图像发送到指定的目的地。
8.根据权利要求1所述的装置,其中,第二调整单元通过以增加包含在第一图像中的像素的亮度的方式进行伽马校正处理,来生成第二图像。
9.根据权利要求1所述的装置,其中,第二调整单元通过以增加包含在第一图像中的像素的亮度的方式使用预定的三维查找表进行调整,来生成第二图像。
10.根据权利要求1所述的装置,还包括:
接收单元,其被构造为,从用户接收关于是否裁剪原稿图像的设置;和
控制单元,其被构造为,
在接收单元接收到裁剪原稿图像的设置的情况下,进行控制,使得第一调整单元、检测单元、第二调整单元和裁剪单元进行处理,并且
在接收单元接收到不裁剪原稿图像的设置的情况下,进行控制,以输出由第一调整单元调整的图像,使得当扫描器读取原稿时高亮度侧的高于预定信号值的信号值是白色的亮度值。
11.一种图像处理装置,包括:
第一调整单元,其被构造为,通过以保留通过用扫描器读取原稿而获取的信号值当中的、高亮度侧的信号值的方式调整亮度,来生成第一图像;
检测单元,其被构造为,检测与生成的第一图像中的原稿对应的区域的位置;
裁剪单元,其被构造为,基于检测到的、与原稿对应的区域的位置,从生成的第一图像来裁剪与原稿对应的第一原稿图像;以及
第二调整单元,其被构造为,通过以增加包含在裁剪后的第一原稿图像中的像素的亮度的方式进行调整,来生成第二原稿图像。
12.一种非暂时性计算机可读存储介质,其存储用于使处理器进行如下步骤的程序:
通过以保留通过用扫描器读取原稿而获取的信号值当中的、高亮度侧的信号值的方式调整亮度,来生成第一图像;
检测与生成的第一图像中的原稿对应的区域的位置;
通过以增加包含在第一图像中的像素的亮度的方式进行调整,来生成第二图像;以及
基于检测到的、与原稿对应的区域的位置,从生成的第二图像来裁剪与原稿对应的原稿图像。
13.根据权利要求12所述的非暂时性计算机可读存储介质,
其中,第一图像包含多个原稿的图像,
其中,检测步骤检测,分别与包含在第一图像中的所述多个原稿对应的各区域的位置,并且
其中,裁剪步骤基于分别与所述多个原稿对应的区域的位置,从第二原稿来裁剪与所述多个原稿对应的各原稿图像。
14.根据权利要求12所述的非暂时性计算机可读存储介质,其中,生成第一图像的步骤通过如下处理来生成第一图像:通过以将在用扫描器读取原稿时的、高亮度侧的预定亮度值调整为第一亮度值的方式进行增益调整,然后进行将进行了增益调整的像素的亮度值高于第一亮度值的像素的亮度值替换为具有第一亮度值的像素的亮度值,来生成第一图像。
15.一种非暂时性计算机可读存储介质,其存储用于使处理器进行如下步骤的程序:
通过以保留通过用扫描器读取原稿而获取的信号值当中的、高亮度侧的信号值的方式调整亮度,来生成第一图像;
检测与生成的第一图像中的原稿对应的区域的位置;
基于检测到的、与原稿对应的区域的位置,从生成的第一图像来裁剪与原稿对应的第一原稿图像;以及
通过以增加包含在裁剪后的第一原稿图像中的像素的亮度的方式进行调整,来生成第二原稿图像。
16.一种由装置的处理单元执行的方法,所述方法包括:
通过以保留通过用扫描器读取原稿而获取的信号值当中的、高亮度侧的信号值的方式调整亮度,来生成第一图像;
检测与生成的第一图像中的原稿对应的区域的位置;
通过以增加包含在第一图像中的像素的亮度的方式进行调整,来生成第二图像;以及
基于检测到的、与原稿对应的区域的位置,从生成的第二图像来裁剪与原稿对应的原稿图像。
17.根据权利要求16所述的方法,
其中,第一图像包含多个原稿的图像,
其中,检测步骤检测,分别与包含在第一图像中的所述多个原稿对应的各区域的位置,并且
其中,裁剪步骤基于分别与所述多个原稿对应的区域的位置,从第二原稿来裁剪与所述多个原稿对应的各原稿图像。
18.根据权利要求16所述的方法,其中,生成第一图像的步骤通过如下处理来生成第一图像:通过以将在用扫描器读取原稿时的、高亮度侧的预定亮度值调整为第一亮度值的方式进行增益调整,然后进行将进行了增益调整的像素的亮度值高于第一亮度值的像素的亮度值替换为具有第一亮度值的像素的亮度值,来生成第一图像。
19.一种由图像处理装置的处理单元执行的方法,所述方法包括:
通过以保留通过用扫描器读取原稿而获取的信号值当中的、高亮度侧的信号值的方式调整亮度,来生成第一图像;
检测与生成的第一图像中的原稿对应的区域的位置;
基于检测到的、与原稿对应的区域的位置,从生成的第一图像来裁剪与原稿对应的第一原稿图像;以及
通过以增加包含在裁剪后的第一原稿图像中的像素的亮度的方式进行调整,来生成第二原稿图像。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018-103878 | 2018-05-30 | ||
JP2018103878 | 2018-05-30 | ||
JP2019-016307 | 2019-01-31 | ||
JP2019016307A JP2019213190A (ja) | 2018-05-30 | 2019-01-31 | 画像処理装置、画像処理方法、および、プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110557515A true CN110557515A (zh) | 2019-12-10 |
CN110557515B CN110557515B (zh) | 2022-05-31 |
Family
ID=68694041
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910463948.3A Active CN110557515B (zh) | 2018-05-30 | 2019-05-30 | 图像处理装置、图像处理方法和存储介质 |
Country Status (2)
Country | Link |
---|---|
US (1) | US11308318B2 (zh) |
CN (1) | CN110557515B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3873078B1 (en) * | 2020-02-14 | 2023-05-31 | Ricoh Company, Ltd. | Device, process execution system, process execution method, and carrier means |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7130436B2 (ja) * | 2018-05-25 | 2022-09-05 | キヤノン株式会社 | マルチクロップ処理を行う画像処理装置、マルチクロップ処理によって原稿単位の画像を生成する方法、および、プログラム |
JP7155845B2 (ja) * | 2018-10-10 | 2022-10-19 | 京セラドキュメントソリューションズ株式会社 | 画像読取装置及び画像形成装置 |
JP2020198546A (ja) * | 2019-06-03 | 2020-12-10 | キヤノン株式会社 | 画像処理装置、画像処理方法及びプログラム |
US11341605B1 (en) * | 2019-09-30 | 2022-05-24 | Amazon Technologies, Inc. | Document rectification via homography recovery using machine learning |
US11216922B2 (en) * | 2019-12-17 | 2022-01-04 | Capital One Services, Llc | Systems and methods for recognition of user-provided images |
JP2022011034A (ja) * | 2020-06-29 | 2022-01-17 | キヤノン株式会社 | データ入力支援装置、データ入力支援方法及びプログラム |
DE102021115924A1 (de) * | 2021-06-21 | 2022-12-22 | Lasersoft Imaging Ag | Verfahren zum Scannen von Vorlagen |
CN115273114B (zh) * | 2022-07-21 | 2024-09-10 | 厦门哲林软件科技有限公司 | 文档图像优化方法和介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060221411A1 (en) * | 2005-03-31 | 2006-10-05 | Canon Kabushiki Kaisha | Image reading apparatus and control method of image reading apparatus |
CN101610340A (zh) * | 2008-06-17 | 2009-12-23 | 佳能株式会社 | 图像处理方法以及图像处理装置 |
US20110002015A1 (en) * | 2008-07-04 | 2011-01-06 | Canon Kabushiki Kaisha | Image processing method and program storage medium |
JP2013157965A (ja) * | 2012-01-31 | 2013-08-15 | Oki Data Corp | 画像処理装置 |
CN103905700A (zh) * | 2012-12-26 | 2014-07-02 | 佳能株式会社 | 图像处理设备、摄像设备和图像处理方法 |
US20180103169A1 (en) * | 2015-12-01 | 2018-04-12 | Sharp Kabushiki Kaisha | Image reading apparatus |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003338920A (ja) | 2002-05-21 | 2003-11-28 | Canon Inc | 画像読取装置 |
JP2005354421A (ja) | 2004-06-10 | 2005-12-22 | Canon Inc | 色空間変換装置、色空間変換方法および画像形成コントローラ |
WO2008137051A1 (en) * | 2007-05-01 | 2008-11-13 | Compulink Management Center, Inc. | Photo-document segmentation method and system |
US20170155792A1 (en) * | 2015-12-01 | 2017-06-01 | Sharp Kabushiki Kaisha | Image reading apparatus |
JP6580965B2 (ja) | 2015-12-01 | 2019-09-25 | シャープ株式会社 | 画像読取装置 |
JP7130436B2 (ja) * | 2018-05-25 | 2022-09-05 | キヤノン株式会社 | マルチクロップ処理を行う画像処理装置、マルチクロップ処理によって原稿単位の画像を生成する方法、および、プログラム |
-
2019
- 2019-05-17 US US16/415,499 patent/US11308318B2/en active Active
- 2019-05-30 CN CN201910463948.3A patent/CN110557515B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060221411A1 (en) * | 2005-03-31 | 2006-10-05 | Canon Kabushiki Kaisha | Image reading apparatus and control method of image reading apparatus |
CN101610340A (zh) * | 2008-06-17 | 2009-12-23 | 佳能株式会社 | 图像处理方法以及图像处理装置 |
US20110002015A1 (en) * | 2008-07-04 | 2011-01-06 | Canon Kabushiki Kaisha | Image processing method and program storage medium |
JP2013157965A (ja) * | 2012-01-31 | 2013-08-15 | Oki Data Corp | 画像処理装置 |
CN103905700A (zh) * | 2012-12-26 | 2014-07-02 | 佳能株式会社 | 图像处理设备、摄像设备和图像处理方法 |
US20180103169A1 (en) * | 2015-12-01 | 2018-04-12 | Sharp Kabushiki Kaisha | Image reading apparatus |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3873078B1 (en) * | 2020-02-14 | 2023-05-31 | Ricoh Company, Ltd. | Device, process execution system, process execution method, and carrier means |
Also Published As
Publication number | Publication date |
---|---|
US20190370539A1 (en) | 2019-12-05 |
US11308318B2 (en) | 2022-04-19 |
CN110557515B (zh) | 2022-05-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110557515B (zh) | 图像处理装置、图像处理方法和存储介质 | |
KR102553581B1 (ko) | 멀티 크롭 처리를 행하는 화상 처리 장치, 멀티 크롭 처리에 의해 문서 단위의 화상을 생성하는 방법 및 저장 매체 | |
US9307115B2 (en) | Image processing device generating rectangular image data from intermediate image data | |
US10194050B2 (en) | Image processing apparatus, image processing method, and storage medium in which background removal is performed to remove a background included in an input image based on pixel values | |
WO2014069233A1 (ja) | 画像処理装置およびそれを備えた画像形成装置、画像形成方法、記録媒体 | |
KR20100106915A (ko) | 화상 처리 장치 및 제어 방법 | |
JP7367159B2 (ja) | 画像処理装置、画像処理方法、および、プログラム | |
JP2018133691A (ja) | 画像読取装置および画像読取方法 | |
JP6628279B2 (ja) | 画像処理装置、画像処理方法、画像処理プログラムおよび記録媒体 | |
US8531733B2 (en) | Image processing system with electronic book reader mode | |
JP7382834B2 (ja) | 画像処理装置、画像処理方法、及びプログラム | |
CN107920184B (zh) | 图像处理装置以及图像处理方法 | |
JP2019134232A (ja) | 画像形成装置、その方法およびプログラム | |
JP5025611B2 (ja) | 画像処理装置、画像形成装置、コンピュータプログラム、記録媒体及び画像処理方法 | |
JP2018182464A (ja) | 画像処理装置及びプログラム | |
JP2017135690A (ja) | 画像処理装置、画像処理方法、及びプログラム | |
JP2019213190A (ja) | 画像処理装置、画像処理方法、および、プログラム | |
US11863717B2 (en) | Image reading apparatus and image reading method | |
US10587775B2 (en) | Image processing apparatus, image processing method, and storage medium for edge enhancement based on plural conditions | |
JP2017055436A (ja) | 画像処理装置、画像形成装置、画像処理プログラム及び記録媒体 | |
JP6560942B2 (ja) | 画像形成装置及びその制御方法、並びに制御プログラム | |
JP5265040B2 (ja) | 画像処理装置、画像形成装置、コンピュータプログラム、記録媒体及び画像処理方法 | |
JP2022189063A (ja) | 画像データ生成装置および画像データ生成方法 | |
JP2020123898A (ja) | 画像処理装置、画像形成装置、画像処理プログラムおよび画像処理方法 | |
JP2013115730A (ja) | 画像処理装置、画像処理方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |