CN111510567A - 使用多个图像的图像阴影检测 - Google Patents
使用多个图像的图像阴影检测 Download PDFInfo
- Publication number
- CN111510567A CN111510567A CN201911078233.2A CN201911078233A CN111510567A CN 111510567 A CN111510567 A CN 111510567A CN 201911078233 A CN201911078233 A CN 201911078233A CN 111510567 A CN111510567 A CN 111510567A
- Authority
- CN
- China
- Prior art keywords
- intensity
- image
- intensity map
- map
- graph
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 48
- 230000008859 change Effects 0.000 claims description 72
- 238000000034 method Methods 0.000 claims description 62
- 238000004590 computer program Methods 0.000 claims description 27
- 239000011159 matrix material Substances 0.000 claims description 21
- 238000009432 framing Methods 0.000 claims description 16
- 230000003213 activating effect Effects 0.000 claims description 2
- 230000004913 activation Effects 0.000 claims 2
- 230000000977 initiatory effect Effects 0.000 claims 2
- 238000012545 processing Methods 0.000 description 23
- 238000005192 partition Methods 0.000 description 11
- 230000033001 locomotion Effects 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 6
- 230000009471 action Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 238000011156 evaluation Methods 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000003708 edge detection Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 238000012937 correction Methods 0.000 description 3
- 230000004313 glare Effects 0.000 description 3
- 230000006641 stabilisation Effects 0.000 description 3
- 238000011105 stabilization Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000009499 grossing Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 230000003139 buffering effect Effects 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000001010 compromised effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 238000012015 optical character recognition Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00002—Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for
- H04N1/00005—Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for relating to image data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/174—Segmentation; Edge detection involving the use of two or more images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/50—Image enhancement or restoration using two or more images, e.g. averaging or subtraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/70—Denoising; Smoothing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/13—Edge detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
- G06T7/254—Analysis of motion involving subtraction of images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/10—Image acquisition
- G06V10/17—Image acquisition using hand-held instruments
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/50—Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00002—Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for
- H04N1/00026—Methods therefor
- H04N1/00037—Detecting, i.e. determining the occurrence of a predetermined state
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10004—Still image; Photographic image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20021—Dividing image into blocks, subimages or windows
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20076—Probabilistic image processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20212—Image combination
- G06T2207/20216—Image averaging
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30168—Image quality inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30176—Document
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/90—Dynamic range modification of images or parts thereof
- G06T5/94—Dynamic range modification of images or parts thereof based on local image properties, e.g. for local contrast enhancement
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/414—Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Quality & Reliability (AREA)
- Studio Devices (AREA)
- Image Analysis (AREA)
Abstract
本公开的实施例涉及使用多个图像的图像阴影检测。当用户握住相对于对象定位的相机时,可以获得如由相机捕获的对象的第一图像和对象的第二图像。可以比较第一图像的第一强度图与从该第一强度图和第二图像的第二强度图获得的组合强度图之间的强度变化。然后,可以基于强度变化在第一图像内标识阴影。
Description
技术领域
本说明书涉及数字图像处理中的阴影检测。
背景技术
当捕获到不想要的阴影时,通常会降低数字图像的图像质量。此外,数字图像的后续使用可能不可用或受到损害。例如,可能模糊在数字图像中捕获的文本。然后,期望的图像处理可能包括误差,例如,如果处理不正确地将阴影解释为数字图像的实际图像元素。
随着频繁使用移动设备相机捕获数字图像,包含不想要的阴影是特别频繁和有问题的。例如,用户经常将他们的移动设备定位在文档上方以捕获文档的图像。在这些以及类似的上下文中,移动设备的定位经常导致捕获文档上的阴影。
然而,阴影检测通常是困难的,有问题的并且容易出错。例如,现有技术可以标识假阳性,诸如通过将图像元素不正确地标识为阴影。现有技术也易于检测假阴性,其中实际阴影不被如此标识。
另外,现有技术对用户来说可能是麻烦的。例如,这些技术可能需要不期望的长处理时间来完成,或者可能需要用户的过多输入。
发明内容
根据一个一般方面,计算机程序产品有形地体现在非瞬态计算机可读存储介质上并且包括指令。当由至少一个计算设备执行时,指令被配置为使得至少一个计算设备获得由相机捕获的对象的第一图像和对象的第二图像。指令在被执行时还被配置为使得至少一个计算设备比较第一图像的第一强度图与第二图像的第二强度图和从至少第一强度图和第二强度图获得的组合强度图中的至少一个之间的强度变化,并且基于强度变化标识第一图像内的阴影。
根据另一个一般方面,计算机程序产品有形地体现在非瞬态计算机可读存储介质上并且包括指令。当由至少一个计算设备执行时,指令被配置为使得至少一个计算设备将针对第一图像的第一强度图划分为第一部分强度图,并且将针对第二图像的第二强度图划分为第二部分强度图。指令在被执行时还被配置为使得至少一个计算设备基于第一部分强度图和第二部分强度图生成组合强度图,基于组合强度图与第一强度图部分和第二强度图部分中的至少一个的比较来生成至少一个变化图,并且基于至少一个变化图标识第一图像和第二图像中的至少一个内的阴影。
根据另一个一般方面,一种方法包括在用户握住相对于对象定位的相机的同时获得由相机捕获的对象的第一图像和对象的第二图像。该方法包括比较第一图像的第一强度图和从第一强度图和第二图像的第二强度图获得的组合强度图之间的强度变化,并且基于强度变化标识第一图像内的阴影。
在附图和以下描述中阐述了一个或多个实现的细节。根据说明书和附图以及权利要求,其他特征将是明显的。
附图说明
图1是用于使用多个图像的图像阴影检测的系统的框图。
图2图示了可以在图1的系统中使用的示例输入图像和对应的强度图。
图3图示了图2的示例强度图的示例处理。
图4图示了使用图3的技术处理图2的强度图。
图5图示了图1的系统的第一示例实现。
图6图示了图1的系统的第二示例实现。
图7图示了图1的系统的第三示例实现。
图8图示了图1的系统的第四示例实现,其中没有检测到阴影。
图9图示了图1的系统的第五示例实现,其中检测到边界检测失败。
图10图示了图1的系统的第六示例实现,其中避免了假阳性阴影检测。
图11是图示图1的系统的示例操作的流程图。
图12是图示图1的系统的示例操作的更详细的示例流程图。
具体实施方式
该文档描述了使用多个图像(诸如多个图像帧)提供图像阴影检测的系统和技术。这些系统和技术克服了先前系统和技术的技术挑战,并改进了执行相关自动处理的(多个)过程。例如,所描述的技术提供使用由用户的移动设备相机捕获的文档的多个图像帧执行的快速且准确的阴影检测,包括在定位相机以捕获文档图像时依赖于用户手的小动作。
例如,多个图像或图像帧可以包括由移动设备或其他相机设备临时显示、捕获、缓冲、高速缓存和/或以其他方式利用的预览帧。例如,当移动设备切换到相机模式时,移动设备的屏幕通常将显示包括在移动设备的当前视野中的任何内容的图像,甚至在用户激活图像捕获功能之前(例如,按下图像捕获图标或按钮)。例如,通过缓冲这些预览图像帧,一旦实际启动图像捕获功能(例如,按下图像捕获图标或按钮),移动设备相机就能够实现更快和/或更准确的图像捕获。
类似地,文档捕获应用包括为捕获和处理文档及其内容而设计和优化的专用应用(例如,文本识别)。当文档捕获应用被激活时,文档捕获应用可以进入校准模式,例如,以执行要捕获的文档的边缘检测或其他初步处理。在这样的校准模式期间,再次,可以主动捕获并存储预览图像帧以用于应用的正常操作,以及用于实现本文提供的所描述的阴影检测技术。
这种所描述的阴影检测技术利用有效、快速、准确、完整且广泛适用的(多种)算法以用于检测和标识阴影,并且用于提供校正措施以减少或消除检测到的阴影的负面影响。例如,当检测到阴影时,所描述的技术可以被用来自动打开正在使用的相机的闪光或闪光灯/手电筒,以便在实际图像捕获发生之前消除阴影。
在其他示例中,可以标识和表征所捕获的图像内检测到的阴影,例如在图像元数据内。然后,随后可以使用图像元数据来使图像编辑技术,例如能够去除阴影。在其他示例中,类似的图像元数据可以被用来实现期望的图像处理,而不必移除检测到的阴影。例如,可以处理包括文本的所捕获的文档的图像用于文本识别,并且可以使用表征检测到的阴影的存在的图像元数据来确保准确地执行文本识别处理。
所描述的技术是高度可配置的,并且能够在可用资源和期望结果之间实现期望的权衡。例如,可以使用少至两个图像或使用更多数目的图像来实现这些技术。一般而言,例如,使用较少的图像帧可提供更快的结果,而使用更多图像帧可提供更准确的结果(假设相同或相似的资源的可用性的情况下,通常需要更长的时间)。当更大的处理资源可用时,可以使用更多图像帧来实现所描述的技术,同时提供快速、高度准确的结果。
因此,所描述的技术是快速的,并且提供很少或没有提供用户执行图像捕获所经历的延迟。当发生阴影检测时,可以向用户提供多个选项,诸如自动或手动激活闪光或闪光灯,建议重新定位相机或光源以避免检测到的阴影,或者建议利用可能解释阴影存在的可用图像处理技术。例如,可以在适当配置的用户界面的上下文中提供这些选项中的一些。
所描述的技术提供了对可能阴影的包容性检测,从而避免了假阴性阴影检测的可能性。尽管如此,所描述的技术还提供了可能被错误地标识为阴影的异常值的检测和标识,从而避免了假阳性阴影检测。此外,所描述的技术使得能够检测可能期望检测或校正的其他图像元素,诸如在捕获的图像内错误或不期望地包含边界误差(诸如,当捕获图像或不正确地裁剪图像时)。
在示例实现中,每个图像帧的强度图可以被构造。然后,各个强度图可以被划分或分成多个部分,诸如相对于强度图定义的网格或矩阵的单元。可以处理每个强度图的每个部分以获得组合强度度量(例如,平均强度度量),从而形成组合强度图。然后,可以计算每个单独部分的度量与组合强度图的对应部分的度量之间的变化。具有在(多个)阈值范围内(或在阈值范围之外)的变化的部分可以被标识为用于包括阴影的可能候选。可以相对于彼此考虑连续部分,以标识和消除不是实际阴影的异常值,或者相反地,标识(多个)检测到的阴影的边缘或边界。
此外,附加图像帧可以被用于阴影检测结果的附加细化。例如,可以使用关于每个图像帧的检测到的变化之间的差异。例如,当使用三个图像帧时,图像帧的两个图像帧将图像部分标识为异常值而第三个图像帧不标识,然后,在三个检查的图像帧内以二对一多数存在所标识的异常值可以被视为进一步指示,该进一步指示是相关图像部分包括异常值而不是实际阴影。
另外,本文所描述的系统和技术有利地改进了现有技术领域。例如,如所描述的,改进了基于计算机的数字图像捕获和编辑。此外,系统和技术可以被用于执行文本识别和其他数字图像处理技术的更自动且更有效和更快速的方法。
图1是用于使用多个图像的图像阴影检测的系统100的框图。在图1的示例中,阴影检测器101被配置为提供上述许多特征和优点,并且相对于图1的其余部分会在下面更详细地阐述。
特别地,如图所示,系统100包括具有至少一个存储器104的计算设备102,以及至少一个CPU(中央处理单元)106。计算设备102可以通过合适的网络(图1中未示出)与一个或多个其他计算设备通信。如本文所述,计算设备102可以被实现为移动设备,诸如平板设备或移动电话设备,以及可以被用来提供图像获取功能的各种其他类型的计算设备。
如图所示,系统100可以包括图像捕获应用108,其可以被用来实现和提供阴影检测器101。至少一个处理器(CPU)106可以表示并行执行的计算设备102上的两个或更多个处理器,并且利用使用至少一个存储器104存储的对应指令。至少一个存储器104表示至少一个非瞬态计算机可读存储介质。因此,类似地,至少一个存储器104可以表示由计算设备102利用的一个或多个不同类型的存储器。除了存储允许至少一个处理器106实现应用108的指令之外,至少一个存储器104可以被用来存储数据。
如图1所示,存储器104的具体示例被单独图示为缓冲器110。如下面更详细描述的,缓冲器110通常可以表示任何缓冲器,高速缓冲存储器或其他合适类型的存储器,其可以由阴影检测器101用来执行本文所述的阴影检测的类型,包括存储由相机112捕获的数据。
具体而言,在图1的示例中,相机112被图示为计算设备102的组件,并且可以访问计算设备102的其他组件并且可以与其接口连接,计算设备102的其他组件包括图像捕获应用108、缓冲器110和光源114。如上所述,在本文描述的许多示例实现中,计算设备102可以被描述为智能手机或移动电话,其被配置为提供本文描述的各种特征和功能。在这些和类似的实现中,相机112的相机视图116可以表示智能手机或其他移动设备的显示屏,其通常被用来使得由相机112捕获的图像内容118成帧并且捕获由相机112捕获的图像内容118。在这样的实现中,光源114可以表示结合到移动设备中的灯,闪光灯或手电筒,并且被配置为与相机112接口连接以在闪光摄影期间用作相机112的闪光。
当然,在其他实现中,相机112可以表示具有足够计算和联网能力的独立设备,以提供本文描述的系统100的各个方面。在这样的实现中,例如,光源114可以表示相机112的闪光。
无论计算设备102的具体硬件实现如何,相机视图116都可以被理解为表示合适的显示器或由这样的显示器提供的视图,用户可以利用该视图定向和定位计算设备102(或其一部分),相对于要捕获的图像内容118。因此,在上面引用的智能手机或其他移动设备场景中,希望捕获图像内容118的图像的用户可以相对于图像内容118保持和定位他或她的智能手机或其他移动设备,并且定位和定向以捕获希望捕获的整个图像内容118。
然而,如上所述,通常发生图像内容118的一部分至少部分地被阴影120遮挡,用户不希望阴影120包括在被捕获的图像内。特别地,下面描述了各种示例,其中图像内容118表示文档或其他纸张。在这样的场景中,用户通常将文档放置在水平表面上,并且相对于文档保持智能电话或计算设备102的其他示例,以便使用相机112捕获文档的内容。
结果,通常对于照亮要捕获的文档的光被智能手机或用以执行捕获的其他移动设备至少部分地被阻挡,从而导致阴影120的存在。因此,阴影120可能导致所捕获图像的美学质量降低。此外,通常情况下,出于获得和分析文档内容的明确目的,诸如当用户希望在文档内执行书面文本的文本识别时,捕获文档的图像。结果,除了所捕获的图像的美学质量的任何降低之外,阴影120也可能导致图像捕获应用108的操作中的功能性误差。
如上所述并且在下面详细描述的,与图像捕获应用108相关联的阴影检测器101可以被配置为检测阴影120的存在、形状和其他特征,并且采取校正动作以便避免刚才提到的负面影响的类型。例如,在检测到阴影120时,阴影检测器101可以启动光源114的操作,以便因而消除阴影120的存在。在其他实现中,阴影检测器101可以存储表征阴影120将结合所捕获的图像被存储的元数据,使得稍后可以利用这些元数据以用于所捕获的图像的捕获后处理。
在下面关于图2-图10描述的更具体的示例实现中,图像捕获应用108可以表示文档扫描应用,其被特别设计为捕获文档图像并执行相关联的处理。例如,图像捕获应用108可以被配置为执行正被捕获的文档的边界或边缘检测,以确保执行文档内容的期望处理所需的阈值图像质量,并且以其他方式促进平滑捕获、处理和存储/访问所捕获的文档内容。
这种文档扫描应用广泛流行,因为它们允许移动电话用户在许多不同的设置和上下文中捕获文档和相关联内容,并且不需要单独的扫描硬件元件或设备。其结果是为用户提供了许多优点,诸如存储电子文件而不必维持纸质备份副本的能力,以及诸如电子邮件发送或以其他方式共享文档内容的能力,从大量文档中间搜索期望文档内容的能力,以及以其他方式通常享受电子存储和访问数据的好处的能力。
尽管如此,如同所引用的,通过使用相机112的这种文档扫描也提出了特定的挑战。除了包含阴影120的可能性之外,纸质文档易于暴露出来自外部光源的眩光,并且这种眩光可能使得正被捕获的文档的文本模糊,或者以其他方式干扰图像捕获应用108的操作。特别地,光源114本身可以是这种眩光的源,使得许多用户最初尝试在不使用光源114的情况下执行期望的文档捕获。
在另外的示例中,如上所述,通常需要正被捕获的文档的最小图像质量,以便确保图像捕获应用108的期望操作。例如,所捕获的文档的文本必须足够清楚以启用其光学字符识别。
更进一步地,当将计算设备102相对于正被捕获的文档定位时,用户将能够完全静止地握住他或她的手的程度存在实际限制。换言之,即使用户将试图在捕获期望图像的同时将他或她的手保持在单个稳定位置,也总是存在用户手的至少一些小的移动,并且因此计算设备102(例如,智能手机)本身也是如此。
为了确保针对图像捕获应用108的期望操作所需的足够的图像质量、边界检测和其他图像捕获特性,图像捕获应用108可以在相机视图116内提供图像捕获窗口122。换言之,如图所示,图像捕获窗口122定义并可视地指示边界和定向,其可以被用来促进用户相对于正被捕获的文档或其他图像内容118对准和定位计算设备102以及因此相机视图116的努力。在特定示例实现中,图像捕获应用108可以使用图像捕获窗口122来执行用户尝试捕获图像内容118的初始检测。
然后,图像捕获应用108可以提供指令124,其被图示为“捕获中...保持稳定!”,其向用户警告捕获过程正在进行。当图像捕获应用108确定图像内容118已成功成帧时,可以执行对应的图像捕获。例如,在图1中,捕获图标125表示用于执行这种图像捕获的任何已知或未来技术。例如,捕获图标125可以表示相机视图116的用户界面元素,或者计算设备102的物理按钮。在其他实现中,捕获图标125可以表示或包括自动捕获功能性,该自动捕获功能性在用户响应于指令124检测到计算设备102的合适定位时被执行。
因此,在这些和相关实现期间,成帧时段表示用户在相机视图116内使得图像内容118成帧的时间窗口或时段,诸如可以通过使用图像捕获窗口122发生。在成帧时段中,可以例如使用缓冲器110捕获并临时存储图像,并且阴影检测器101可以使用这些图像来检测和表征阴影120。
在刚刚给出的具体示例中,并且在其他示例中,成帧时段可以是明确的,可定义的时段,在该时段期间由用户执行尝试的相机稳定,其中需要这种稳定以满足或超过最小阈值稳定,该最小阈值稳定如由图像捕获应用108确定、并且在继续捕获和存储图像内容118的图像之前被建立。
然而,如上所引用的,应当理解,系统100可以被用在许多不同的图像捕获场景中。例如,图像内容118实际上可以表示可以使用相机112拍摄的任何物理项目或对象,并且不限于关于本文所提供的系统100的任何其他示例实现描述的文档或图像内容。
此外,成帧时段不需要是明确定义的时段,并且可以更通常地指代用户相对于图像内容118定位计算设备102,并且在使用捕获图标125来捕获图像内容118之前的任何时段。换句话说,成帧时段可以指在定位相机视图116以在其中显示图像内容118的图像之后,并且在通过使用捕获图标125来捕获图像内容118的图像之前的任何时段。
在成帧时段期间捕获的图像或图像帧,其通常在用户的预览过程期间被查看,该预览过程在几乎任何类型的数字图像捕获之前发生,因此这些被捕获的图像或图像帧在本文中可以被称为预览图像或预览帧。在这方面,图像帧通常应该被理解为指代一系列两个或更多个图像中的任何单个或离散图像,包括在时间上彼此接近地被捕获的相同图像内容118的两个或更多个图像。
在成帧时段期间,阴影检测器101可以实现强度图生成器126,其被配置为利用当用户相对于图像内容118定位相机视图116时依次捕获的至少两个图像128、130。因此,如刚才所引用的,图像128、130可以被理解为表示或包括在各种实现中在成帧时段期间连续捕获或在时间上彼此接近的至少两个图像帧,在该成帧时段中,用户尝试保持相机视图116相对于图像内容118稳定。
因此,强度图生成器126可以被配置为继续从图像128生成强度图132,并且还生成关于图像130的强度图134。强度图132、134的具体示例在下面例如关于图2被提供。
然而,一般而言,应当理解,这种强度图通常是指对应图像的表示,其中所讨论的图像的像素值在强度图中被量化,该强度图在形状、位置和定向上对应于其下面的图像。换言之,在该上下文中的单词强度通常是指正被捕获的图像的像素值与已经到达相机112的(多个)相关传感器的光量或光强度成比例的事实。例如,强度图132因此可以表示相对于由相机112捕获的光的像素值的变化,并且被映射到图像128的对应位置或像素。如上所引用的,强度图132、134的示例在下面例如关于图2被图示和描述。
如图1所示,阴影检测器101还包括部分强度图生成器136,其被配置为从强度图132生成部分强度图138,并且从强度图134生成部分强度图140。如下面关于图3和图4的上下文中的特定示例所图示和描述的,部分强度图138、140将相应的对应强度图132、134分成限定的部分。
例如,强度图132可以被划分为合适的矩阵、网格或其他内部划分。然后,在某些实现中,每个部分对应于对应矩阵或网格的单元。
如下面详细描述的,如果需要,则部分强度图138(和部分强度图140)的每个部分可以经过某些局部处理。例如,可以使用针对该部分的局部平均值或平均强度值和/或周围或附近部分来定义部分强度图138的每个部分。
组合强度图生成器142可以被配置为将部分强度图138、140彼此组合地利用,以生成组合强度图144。例如,如果部分强度图138、140定义诸如10×10网格或100×100网格的部分,则组合强度图144将对应地被设置为10×10或100×100的大小。更普遍地,各种图的网格大小或其他比例可以变化到几乎任何程度(例如,15×15或20×20),应当理解,通常在网格大小、处理时间和结果质量之间存在折衷。以这种方式,例如,组合强度图144的每个部分将对应于每个部分强度图138、140的对应部分。
例如,如下面详细说明和描述的,例如,如图5-图10所示,组合强度图144的每个部分可以表示部分强度图138、140的两个对应部分的平均值(mean)或平均值(average)。例如,如果部分强度图138在位置(1,1)处具有值x1,并且部分强度图140在位置(1,1)处具有值x2,则组合强度图144在位置(1,1)处的值可以是(x1+x2)/2。
然后,阴影检测器101的变化图生成器146可以被配置为生成变化图148,其表示部分强度图138的部分与组合强度图144的对应部分之间的变化。类似地,变化图生成器146可以生成变化图150,其表示部分强度图140的部分的值与组合强度图144的对应部分的值之间的变化。如下面详细图示和描述的,变化图148、150捕获并量化由于在捕获图像128、130的成帧时段期间用户的小移动而发生的强度变化。
例如,在成帧时段期间,恰好落在图像128内的阴影120的边界下方的图像内容118的一部分可能碰巧恰好在图像130内的阴影120的边界之外,由于用户的干预移动。也就是说,给定像素可以在图像128中被遮蔽但是不在图像130中被遮蔽。相反地,但是类似地,在捕获图像128期间最初在阴影120的边界之外的图像内容118的一部分,可能在捕获图像130期间位于阴影120的边界内。
换句话说,应当理解,与图像内容118的图像128、130中始终在阴影120内或者始终在阴影120外的其他像素相比,可以移入或移出阴影120的这种像素将表现出更大的强度变化。然后,在实践中,单个变化图148可以提供关于阴影120的存在的有价值信息,其可以被用来采取后续的校正动作,如上所引用并在下面详细描述的。
此外,变化图150将为阴影120提供类似但可能稍微不同的特征。结果,相互组合地考虑变化图148、150可以提供关于表征阴影120的附加水平的细节和准确性。
因此,阴影检测器101包括变化图评估器152,其可以被配置为执行变化图148、150的各种类型的分析或其他评估。此外,尽管图1的简化示例仅图示了包含两个图像128、130,但是应当理解,如下面的许多示例中所描述的,可以捕获更多数目的图像并利用它们来生成对应数目的变化图。
例如,可以利用三个或更多个图像来计算三个或更多个对应的强度图,因此可以利用这些图来计算三个或更多个对应的部分强度图。在这些场景中,组合强度图144可以表示所有三个或更多个生成的部分强度图的组合。因此,还可以确定三个或更多个对应的变化图。
以这种方式,变化图评估器152可以利用所有确定的变化图及其组合,来尝试准确地和完整地定义和表征阴影120的边界和其他特征。如关于图9所描述的,变化图评估器152可以被配置为利用各种可用变化图来确定图像内容118及其图像的其他特征。例如,变化图评估器152可以确定关于图像内容118的捕获可能已经发生的边缘或边界检测失败。此外,变化图评估器152可以采取校正动作以确保不发生假阳性阴影检测,诸如当图像内容118自然地包括可能被误认为存在阴影的颜色变化时。
最后在图1中,阴影检测器101还可以包括解决方案管理器154,其可以被配置为利用变化图评估器152的输出来实现特定响应。例如,如所引用的,解决方案管理器154可以确定激活光源114是有利的。例如,从用户的角度来看,用户可以定位相机视图116,使得图像内容118是在图像捕获窗口122内被捕获的。
虽然指令124指示用户保持计算设备102稳定,但是阴影检测器101可以确定阴影120的存在,并且可以自动激活光源114以消除或减少阴影120的存在。在其他示例中,可以更新指令124以指示用户重新定位相机视图116,以便消除阴影120。在其他示例实现中,解决方案管理器154可以存储表征阴影120的元数据,以用于稍后处理捕获的图像。
因此,图1的系统100提供了针对使用相同图像内容118的多个图像执行数字图像处理以标识和表征阴影120的技术问题的解决方案。例如,特定对象的整体,诸如特定纸质文档或一组对象可以在两个图像138、140内被捕获两次。类似地,可以在图像128、130内捕获特定文档或其他对象的相同部分。如所描述的,通过使用本文所描述的统计方法和图像处理技术及其变体来计算这些多个图像内的所包含的阴影的变化,能够实现用于移除或以其他方式寻址阴影120的多种可能的解决方案。
图2图示了输入图像202,包括图像202A、202B、202C和202D。换言之,图2的输入图像202A-202D通常对应于图1的图像128、130。
如上所引用的,图2-图10的示例通常涉及输入图像202和下面描述的其他输入图像包括纸质文档的场景。输入图像202A-202D是在成帧时段期间发生的图像序列,其中智能手机或其他移动设备的用户试图相对于正被捕获的文档定向和定位移动设备。当然,还如上所引用的,应当理解,所描述的技术也适用于已经捕获相同图像内容的两个或更多个图像的其他场景,并且包括被检测到的阴影不是由执行图像捕获的移动设备引起的情况。
在图2的示例中,使用文档边界或边缘检测算法处理各种输入图像202A-202D,以获得正被捕获的文档的经透视校正的图像204。具体而言,如图所示,经透视校正的图像204A、204B、204C和204D分别对应于原始输入图像202A、202B、202C和202D。因此,例如,经透视校正的图像204A表示所图示的示例文档的文档图像。
实际上,用以获得文档图像204A-204D的透视校正技术可以由阴影检测器101执行,或者由图像捕获应用108的适当功能性执行。也就是说,例如,通常执行这种透视校正,使得用户不存储具有不期望的背景边缘的图像。
然后,强度图生成器126可以继续生成强度图206,其对应于图1的强度图132、134。具体而言,如图所示,强度图206包括强度图206A、206B、206C和206D的图像,分别对应于经透视校正的文档图像204A、204B、204C和204D。
如上所引用的,强度图206A-206D通常表示光强度的逐像素映射,其中强度值在每个单独的强度图206A-206D的上下文内相对于彼此被量化和表达。存在用于生成图2的强度图206A-206D的类型的各种技术,包括平滑处理和其他处理技术(例如,合适的平滑滤波器),其被设计用来去除伪影,和/或相对于彼此、或者相对于共同的强度值标度标准化各种强度值。
出于图2和以下示例的目的,强度图206A-206D应该被理解为包括强度值,该强度值在逐个像素或逐个部分的基础上映射到相应的经透视校正的图像204A-204D的对应的像素或部分。以这种方式,如下面详细描述的,分别在原始输入图像202A、202B、202C和202D内捕获的阴影208、210、212和214被捕获并包括在强度图206A、206B、206C和206D内,如图所示。
图3和图4图示并描述了用于计算部分强度图的示例技术,诸如图1的部分强度图138、140。下面关于图5-图10说明和描述了这种部分强度图的具体的结果示例。应当理解,用以计算下面关于图3-图10所提供和描述的部分强度图的特定统计技术是非限制性的,并且可以使用其他合适的统计和图像处理技术。例如,代替取平均数或平均值,可以使用中间数或中值。
在图3的示例中,表示例如强度图132的强度图206A被作为示例。如图所示,在强度图206A的分区版本302中,强度图206A被分成指定数目的图像块。在该示例中,分区强度图302被划分为维度10×10的矩阵或网格(即,具有10×10=100个单元)。当然,在分区过程中可以使用其他大小或维度,包括使用非矩形和/或不规则分区,和/或分区的块或其他形状的大小或形状不必相同。
然后,对于分区强度图302的10×10图像块内的每个图像块,可以通过将每个这样的图像块与周围图像块一起考虑来计算局部平均强度值。为了说明局部平均强度的示例计算,分区强度图302的区段304被放大,并且图示了第一区块306,其包括单元302A、302B、302C、302D的至少一部分。具体地,如图所示,块306包括所有单元302A,以及相邻单元302B、302C、302D的部分。同时,第二块308被图示为包括所有单元302B,以及单元302A、302C、302D的相邻部分。
如可以观察到的,通过计算针对块306、308的所有像素/单元的平均强度值,可以计算局部平均强度值,并且将其分配给例如分区强度图302的10×10=100个分区中的每一个分区。因此,通过考虑相邻分区的重叠和邻接部分,由图3中的重叠310表示,所描述的用于确定针对10×10=100个单元的每个单元的局部平均强度值的计算可以以最小化可能发生在分区强度图302的分区之间的边界处的不连续性和其他潜在不规则性的方式而被提供。在其他示例实现中,可以针对每个单元302A、302B、302C和302D的像素单独地计算局部平均强度。
图4图示了图3的计算技术的示例实现,其相对于图2的强度图206A-206D。如图所示,对应于图3的块306、308的图像块402、404,可以相对于强度图206A而被定义,从而定义重叠部分406。强度图206B-206D的对应区域408也支持对那些强度图的局部平均强度值的相同的计算。
图5图示了图1的系统100的第一示例实现,其使用上面关于图2-图4中所描述的技术。具体而言,如图所示,图5包括示例强度图502、504、506、508,其通常对应于图2-图4的示例强度图206A-206D。如已经相对于对应的强度图206A-206D所描述和图示的,强度图502、504、506、508可以包括对应的相应阴影503、505、507和509。
使用刚刚关于图3和图4所描述的技术,可以计算部分强度图510、512、514和516。换言之,部分强度图510、512、514、516通常对应于图1的部分强度图138、140,并且它们与对应的相应强度图502、504、506和508以一对一的关系而被生成。
因此,例如,部分强度图510提供针对强度图502的局部平均强度值。例如,部分强度图510被图示为被划分为相对于分区强度图302在上面描述的相同的10×10=100个分区或单元。然后,每个这样的单元与一个或多个相邻单元的至少一部分一起被处理,以获得所得到的局部平均强度值。例如,部分强度图510的部分511包括强度值“195”,并且对应于图3的部分302A。
同时,可以对剩余强度图504、506、508并行地执行相同的计算,从而获得对应的相应部分强度图512、514、516。因此,例如,部分强度图512将包括第一部分513,其被图示为包括局部平均强度值“192”。类似地,部分强度图514包括具有局部平均强度值“192”的第一部分515。在该示例中,部分强度图516的第一部分517的局部平均强度被图示为具有值“189”。
随后,对应于图1的组合强度图144的组合强度图518可以被计算。如图所示,组合强度图518可以被计算为具有与每个部分强度图510、512、514、516相同的维度。特别地,组合强度图的每个分区或部分表示每个部分强度图510、512、514、516的对应部分的一些统计组合或聚合。
具体地,如刚刚所引用的,部分511、513、515、517被图示为分别包括195、192、192和189的局部平均强度值。因此,组合强度图518的第一部分519的值被图示为组合或全局平均值,并且因此具有(195+192+192+189)/4=192的值。如图所示,可以使用部分强度图510、512、514、516的每组4个对应部分来计算组合强度图518的剩余99个值的对应组合或全局平均值。
更普遍来说,针对图5的示例,部分强度图510、512、514、516各自表示针对对应的相应强度图502、504、506、508中的每一个的局部平均强度值的10×10矩阵。使用每个这样的矩阵,组合强度图518,可以被计算为针对全局平均强度值的10×10的矩阵,其中使用等式(1)计算全局平均强度矩阵的每个单元:
全局平均强度(J)=((局部平均强度(1,J)+局部平均强度(2,J)+...+局部平均强度(I,J))/强度图图像的总数目
等式(1)
在符号上,在等式(1)中,可以使用局部平均强度(I,J)来表示第I强度图图像的第J块的局部平均强度。将强度图图像的总数表达为I,使得使用等式(1)计算每个第J个块的全局平均强度,以获得与各个部分强度图相同维度的全局平均强度(J)矩阵。
然后可以利用图1的变化图生成器146来生成变化图520、522、524和526,其通常对应于图1的变化图148、150。以变化图520为例,可以观察到,变化图520是与组合强度图518具有相同维度的矩阵,以及对应的部分强度图510。即,如上面关于图1所图示和描述的,变化图520表示部分强度图510的各个单元与组合强度图518的对应单元之间的变化。
因此,例如,变化图520的第一单元521图示了单元519的值“192”与单元511的值“195”之间存在的1.56%的差异。类似地,变化图522表示部分强度图512的每个单元与组合强度图518的每个对应单元之间的各个单元变化。因此,变化图522的第一单元523图示了单元519的值“192”与单元513的值“192”之间的0%的差异。
更普遍的,可以使用等式(2)来计算每个变化图520、522、524、526的每个单元的值:
变化(P,J)=((局部平均强度(P,J)-全局平均强度(J))/(全局平均强度(J)))*100
等式(2)
在符号上,在等式(2)中,第I强度图图像的第J个块的局部平均强度被表示为局部平均强度(I,J),而第J个块的全局平均强度被表示为全局平均强度(J)。因此,等式(2)表示第P强度图图像的第J块的变化。
在图5的示例中,变化图520、522、524、526中的每一个内的百分比单元值大于2%或小于-2%,在名义上被认为基本上表示阴影边缘,其对应于阴影503、505、507、509。换句话说,在该示例中,预期在没有阴影的情况下,部分强度图510、512、514、516与组合强度图518之间的强度值的变化将落在-2%至2%的范围内。
另一方面,还如上所述,由于用户的手和/或移动设备被用于图像捕获的小的移动,可能发生这些阈值之外的强度变化,这可能导致例如阴影503、505、507、509的边缘处的小差异。例如,关于变化图520,相邻单元的部分列528被阴影线化以表示强度值变化的存在,该强度值变化大于2%。类似地,强度值变化的部分行530包括其中强度值变化低于-2%的相邻单元。
如可以观察到的,部分列528和部分行530通常对应于阴影503的侧边缘和顶边缘。虽然没有单独标记,但是可以观察到,变化图522类似地包括部分列和部分行,其通常在形状和位置上对应于阴影505的顶边缘和侧边缘。类似的注释适用于相对于阴影507在变化图524中被阴影线化的部分列和部分行,以及相对于阴影509的变化图526的部分列/部分行。
当然,在一些情况下,可能发生变化图将包括一个或多个单元,其在所建立的阈值范围之外但实际上不对应于阴影,并且因此表示假阳性。例如,这样的异常值单元可以对应于包括的深色(例如,黑色)的图像部分,其可能被错误地解释为阴影,或者可以简单地表示计算伪影(例如,作为以次优或部分不适用的方式选择阈值范围的结果)。例如,在变化图520中,两个单元532被图示为包括大于2%的值,而不对应于原始强度图502内的(多个)阴影。
类似地,但相反地,也可以观察到假阴性。例如,可以从变化图522和524观察到,表示相应阴影505、507的顶边缘的所包括的部分行是不完整的(例如,不完全延伸到变化图522、524的右边缘)。
如上面参考图1所述,变化图评估器152可以被配置为实现各种技术,以最小化或防止这种假阳性和/或假阴性。例如,变化图评估器152可以最初标识相关的阈值范围,并且可以继续指定在相关范围之外的所有可用变化图的所有个体单元。换言之,例如,变化图评估器152可以将变化图520、522、524、526中的各种单元指定为阴影线化的单元。
为了区分阴影和假阳性异常值,变化图评估器152可以强制要求对应于阴影的单元必须具有最小数目的相邻阴影边缘候选。例如,部分列528包括五个垂直相邻的阴影候选。类似地,部分行530包括五个水平相邻的阴影候选。另一方面,如图所示,异常值单元532单独出现,并且不与在所建立的阈值范围之外的其他暗影候选相邻。
除了可以关于个体变化图执行的这种评估技术之外,应当理解,变化图评估器152还可以被配置为利用多个变化图520、522、524、526的可用性来执行组合或聚合的变化图评估。例如,为了去除假阳性异常值,变化图评估器152可以比较两个或更多个变化图的各个单元。例如,在变化图520的两个异常值单元532中,在对应于变化图522的对应单元534中的值0.38%的单元中观察到2.17%的值。通过与剩余变化图524、526进行类似的比较,变化图评估器152可以推断出相关单元的大部分值在可接受的阈值强度值范围内,使得所讨论的单元不太可能对应于阴影边缘。
尽管图5在示例中被图示为生成四个变化图,但是应当理解,可以配置所捕获的图像的数目和对应的变化图,并且其可以改变。例如,在一些实现中,所计算的变化图的数目可以被指定为奇数。然后,当变化图评估器152考虑每个变化图的每个单元时,可以基于所讨论的单元的大多数结果最终表征任何潜在的假阳性或假阴性。例如,对于变化图522的单元534,对变化图520和524的考虑将导致所讨论的单元不代表阴影边缘的2:1多数期望。
最后在图5中,示例图像536、538、540、542分别是变化图520、522、524、526的大小调整版本的示例,其中大小调整后的图像536、538、540、542图示了阴影移动区域和原始图像之间的对应关系,并且使用本文描述的技术来计算变化。如可以观察到的,图像536-542中的每一个通常图示了对应阴影503、505、507、509的阴影边缘的形状。此外,如本文所述,总的来说,图像536-542支持快速、可靠和准确的阴影边缘检测。
在各种实现中,可以使用多种技术中的一种或多种来计算在评估变化图中所使用的阈值范围。例如,可以针对各种文档(例如,彩色或黑白文档,杂志或报纸页面,收据,笔记本和任何其他期望的测试文档)捕获测试数据。对于每个测试的文档,可以指定多个输入图像,并且其可以以规则间隔在后台被捕获。例如,可以在数十或数百毫秒的量级上选择间隔范围,例如200毫秒。然后,如上所述,可以基于局部平均强度、全局平均强度和变化对所捕获的数据集执行统计分析。
在一些实现中,可以将结果与测试数据中的已知阴影进行比较,以使阈值范围相关。在各种示例中,可以基于与可接受的阴影包含或排除水平相关的设计选择来设置阈值范围。例如,在避免包含阴影非常重要的情况下,可以相应地设置阈值范围(例如,狭窄地,诸如低于-1%且高于1%)。类似地,但相反地,如果更高水平的阴影包含是可容忍的,则可以设置更宽的阈值范围。在各种实现中,相关的可配置参数可以由图像捕获应用的设计者、管理员或用户设置。
图6图示了图1的系统100的单独示例实现。在图6的示例中,原始强度图602、604、606、608分别包括阴影603、605、607、609。
如图所示,部分强度图610对应于强度图602,并且部分强度图612对应于强度图604。类似地,部分强度图614对应于强度图606,并且部分强度图616对应于强度图608。
根据部分强度图610、612、614、616,可以计算组合强度图618。如图所示,在图6的示例中,根据上面关于图3-图5所描述的技术,使用局部平均强度值计算部分强度图610、612、614、616。组合强度图618被计算为包括从部分强度图610、612、614、616的各个对应单元确定的全局平均强度值。
因此,可以关于部分强度图610和组合强度图618计算变化图620。可以关于部分强度图612和组合强度图618计算变化图622。变化图624可以关于部分强度图614和组合强度图618而被计算。可以相对于部分强度图616和全局强度图618计算变化图626。
单独地和集合地对变化图620、622、624、626的评估可以由变化图评估器152根据上述技术来执行。例如,可以观察到变化图620、622、624、626中的每一个具有各种阴影线化的单元,其可以被理解为对应于具有在建立的阈值范围之外的值的单元,该建立的阈值范围用于标识阴影边缘候选单元。
在每个变化图内,可以针对相邻单元评估阴影线化的单元。此外,可以聚合地考虑不同变化图620、622、624、626中的单元以关于各个单元进行确定。例如,变化图620的单元628被阴影线化,以指示其值在建立的阈值范围之外。由于单元628邻接多个其他阴影边缘候选单元,并且由于变化图622、624、626的对应单元也都在建立的阈值范围之外,因此变化图评估器152可以继续将单元628分类为代表阴影边缘。
在另一示例中,变化图620的单元630在建立的阈值范围内,并且最初不被标识为阴影边缘单元。变化图622的对应单元632也在建立的阈值范围内,变化图624的单元634也是如此。另一方面,变化图626的单元635对应于单元630、632、634,但在相关的阈值范围外。因此,由于单元635是在阈值范围之外的四个单元630、632、634、635的集合中的唯一单元,因此变化图评估器152可以确定不包括所讨论的单元作为代表阴影边缘。
最后在图6中,包括图像636、638、640、642以图示对应变化图620、622、624、626的大小调整版本,并且大小调整为原始强度图602、604、606、608的大小。如图所示,调整大小的图像636、638、640、642清楚地图示了变化图620、622、624、626的所标识的阴影线化的值相对于阴影603、605、607、609的对应关系。
图7是图1的系统100的第三示例实现。在图7的示例中,黑白图像被用来生成强度图702、704、706、708。如图所示,每个强度图具有对应的阴影703、705、707、709。
然后,可以针对对应的相应强度图702、704、706、708计算部分强度图710、712、714、716。然后,可以基于部分强度图710、712、714、716生成组合强度图718。。
得到的变化图720、722、724、726图示了所得到的阴影检测。类似于图5和图6,图7图示了所描述的技术能够基于当用户相对于正被捕获的相关文档定位移动设备时可能发生的小阴影移动来标识和表征阴影703、705、707、709。
图8图示了图1的系统100的第四示例实现。在图8中,强度图802、804、806、808的图像图示了很少或不存在阴影。因此,当考虑部分强度图810、812、814、816和组合强度图818时,得到的变化图820、822、824、826指示在原始输入图像内没有可见的阴影或阴影移动。
图9图示了图1的系统100的第五示例实现。在图9中,强度图902、904、906、908的图像分别对应于部分强度图910、912、914、916。所得到的组合强度图918可以再次被用来生成对应的变化图920、922、924、926。
在图9的示例中,强度图902的图像的部分903对应于边界检测失败。换言之,例如,重新参考图2,假设从经透视校正的图像204生成示例强度图206,经透视校正的图像204通过对输入图像202执行边界检测以去除存在于正被捕获的原始内容之外但在图像捕获窗口内(例如,在图1的相机视图116的图像捕获窗口122内)的不想要的图像部分而被生成。
然而,在一些情况下,被执行以获得经透视校正的图像204的边界检测可能是不完美的或不完整的。在这种情况下,超出正被捕获的文档的实际边界的图像部分可能不正确地被包括在所捕获的图像中。如图9所示,并且如上所引用的,部分903表示这种边界检测误差的示例。
如可以从图9的示例可视地理解,部分903可能被误认为是阴影。尽管如此,下面描述的技术可以被用作用以避免关于阴影检测的这种假阳性误差的技术的示例。此外,出于标识这种边界检测失败的目的,可以独立地利用所描述的技术。
具体地,如图所示,对应于强度图902的图像的变化图920包括具有在-2%至2%阈值范围之外的值的单元的部分行922。为了帮助区分用于阴影检测的上述技术,定义了附加或替代阈值范围。具体地,可以将最大值设置为超过原始阈值范围,使得可以将附加阈值范围之外的单元值与检测到的阴影适当地区分开。在图9的示例中,附加阈值范围可以被设置在超过-15%或高于15%的值处。
换言之,所描述的技术建立了多个变化值窗口,其对应于不同的单元分类。在该示例中,包含低于-15%或高于15%的变化指示刚引用的边界检测误差的类型。在这种情况下,由于边界检测903产生的局部平均强度图910中的强度值的存在可能严重偏斜对应的全局平均值,如图9所图示并在下面描述的。结果,并且也如关于图9所图示和描述的,变化值将不仅对于变化图920而且对于变化图922、924、926也是偏斜的。在这种场景中,例如,可能希望简单地去除相关图像,例如图像902,并继续进行剩余图像904、906、908。
因此,根据上文,当评估变化图920、922、924、926时,变化图评估器152可以确定部分行928包括在阴影检测值范围之外的值。具体地,变化图评估器152可以执行检测部分行928中的相邻单元的数目的算法,这些相邻单元具有小于-15%的单元值。
可以观察到,变化图922、924、926包括对应于部分行928的多个单元,其高于2%但低于15%,但是未被标识为阴影部分。如上刚刚所引用的,这样的单元值不指示阴影部分的存在,而是作为由变化图920的部分行928的大的异常值引起的统计伪影而出现。换句话说,对应于部分强度图910内的部分903的强度值,当与部分强度图912、914、916的对应单元一起被平均化时,导致组合强度图918的对应单元内的偏斜的组合(平均化)值。因此,即使强度图904的对应图像不包括阴影部分或边界检测失败,组合强度图和部分强度图912的单元之间的变化也将显示远高于2%的值。在这种场景中,可以从阴影检测的分析中丢弃具有文档边界检测失败的图像。在这种情况下,可以获得新的输入图像,或者可以仅使用剩余的强度图904、906、908来重复分析。
图10图示了图1的系统100的第六示例实现。在图10的示例中,图示了强度图1002、1004、1006、1008的图像。为了清楚和简明起见,在图10的示例中没有单独图示针对强度图1002、1004、1006、1008的图像的相应部分强度图和组合强度图。相反,仅图示了对应的变化图1010、1012、1014、1016。
在图10的示例中,假设原始输入图像在所包括的颜色和阴影中具有大的变化。结果,如图所示,各种变化图1010、1012、1014、1016都包括在-2%至2%的阈值范围之外的大数目和大百分比的单元。
换言之,在图10的示例中,由于正被捕获的文档的性质,包括许多潜在的假阳性结果。尽管如此,可以使用各种技术来确保避免假阳性误差。
例如,使用上述技术,变化图评估器152可以确定变化图1010-1016具有许多相对不一致性,并且在总体上不展示检测到的阴影部分。此外,在附加的实现中,变化图评估器152可以执行算法,其中相对于在-2%到2%的建立的阈值范围之外的变化图单元的数目或百分比来设置频率阈值。
例如,可以设置70%的频率阈值,使得包括超过70%的具有在阈值范围2%之外的值的其单元的任何变化图可以被标识,以用于考虑作为包括假阳性。利用上述其他变化图评估,可以针对个体变化图以及关于变化图的聚合应用频率阈值的考虑。例如,在计算奇数数目的变化图的场景中,然后可以利用大多数变化图已经超过频率阈值的确定来采取适当的校正动作。
图11是图示图1的系统100的示例实现的流程图。在图11的示例中,操作1102-1106被图示为单独的顺序操作。然而,在备选实现中,可以包括附加或备选操作,并且可以省略操作1102-1106中的一个或多个。在任何这样的实现中,各种操作和子操作可以以部分或完全重叠或并行的方式被执行,或者以嵌套、迭代或分支的方式被执行。
在图11的示例中,可以从相机获得对象的第一图像和对象的第二图像(1102)。例如,相机112可以捕获图像128、130,并且阴影检测器101(例如,强度图生成器126)可以从缓冲器110获得第一图像128和第二图像130。
可以在第一图像的第一强度图与第二图像的第二强度图和从第一强度图和第二强度图获得的组合强度图中的至少一个之间比较强度变化(1104)。例如,变化图评估器152可以评估强度图132和组合强度图144之间的变化,如变化图148中所包括的。在其他实现中,可以通过使用第一强度图和第二个强度图,而不使用组合图,来获得强度变化。
可以基于强度变化在第一图像内标识阴影(1106)。例如,变化图评估器152可以检测到,变化在建立的阈值范围(诸如本文所述的-2%到2%的阈值范围)之外,并且可以基于此标识阴影包含。
图12是图示图1的系统100的附加实现的流程图。在图12的示例中,针对多个图像的多个强度图确定局部平均强度图(1202)。以上提供了诸如部分强度图138、140的这种局部平均强度图的许多示例,诸如图5的510、512、514、516,图6的610、612、614、616和图7的710、712、714、716。
然后,可以确定全局平均强度图(1204),诸如分别为图5的518、图6的618和图7的718。可以计算针对每个局部平均强度图的变化图(1206)。例如,图5的变化图520/522/524/526,图6的620/622/624/626与图7的720/722/724/726可以被计算。
可以将每个变化图的每个部分(例如,单元)的变化值与全局平均强度图进行比较(1208)。对于每个单元,如果变化百分比低于-2%或高于2%(或在任何适当建立的阈值范围之外),则检测到阴影候选单元(1210)。
如果变化值在用于检测边界检测误差的范围之外,则可以丢弃相关的局部平均强度图,并且重复计算(1212)。最初可以将-2%和2%之间的变化百分比标识为不对应于具有阴影的图像部分(1214)。
如关于图10所描述的那样,如果变化的频率高于定义的阈值(1216),例如70%,则系统可以确定对相关图像执行阴影检测是不可行的(1218)。因此,可以采取校正动作,诸如指示用户重新定位相机,或者简单地按原样捕获图像以便避免假阳性阴影检测。在其他场景中,可以激活闪光或闪光灯,以便确保消除可能的阴影。
否则,可以基于最终和/或组合变化值进行阴影确定(1220)。例如,如所描述的,变化图评估器152可以考虑所有候选阴影单元并且可以确定这些单元是否孤立地出现,并且可能表示异常单元,或者作为多个相邻单元(例如,部分行或部分列),这可能表示阴影边缘。还如所描述的,变化图评估器152还可以考虑针对所讨论的图像的变化图的组合,诸如通过考虑变化图的每个候选阴影单元以及剩余变化图的对应单元的组合,以便确定是否大多数这种对应的单元指示阴影的存在。
这里描述的各种技术的实现可以在数字电子电路装置中被实现,或者在计算机硬件、固件、软件或它们的组合中被实现。各种实现可以被实现为计算机程序产品,即有形地体现在信息载体中的计算机程序,例如,在机器可读存储设备中,用于由数据处理装置执行或控制数据处理装置的操作,数据处理装置例如,可编程处理器、计算机或多台计算机。计算机程序(诸如上述(多种)计算机程序),可以用任何形式的编程语言来编写,包括编译或解译语言,并且可以以任何形式被部署,包括作为独立程序或作为模块、组件、子例程或适用于计算环境的其他单元。可以部署计算机程序以在一个计算机上或在一个站点的多个计算机上执行,或者分布在多个站点上并通过通信网络互连。
方法步骤可以由执行计算机程序的一个或多个可编程处理器执行,以通过对输入数据进行操作并生成输出来执行功能。方法步骤也可以由专用逻辑电路装置执行,并且装置可以被实现为专用逻辑电路装置,例如FPGA(现场可编程门阵列)或ASIC(专用集成电路)。
通过示例,适合于执行计算机程序的处理器包括通用和专用微处理器,以及任何类型的数字计算机的任何一个或多个处理器。通常,处理器将从只读存储器或随机存取存储器或两者接收指令和数据。计算机的元件可以包括至少一个用于执行指令的处理器和一个或多个用于存储指令和数据的存储器设备。通常,计算机还可以包括一个或多个大容量存储设备,或者被可操作地耦合以从一个或多个大容量存储设备接收数据或将数据传递到一个或多个大容量存储设备,该一个或多个大容量存储设备用于存储数据,例如磁盘、磁光盘或光盘。适用于实施计算机程序指令和数据的信息载体包括所有形式的非易失性存储器,包括例如半导体存储器设备,例如EPROM、EEPROM和闪速存储器设备;磁盘,例如内部硬盘或可移除磁盘;磁光盘;以及CD ROM和DVD-ROM磁盘。处理器和存储器可以由专用逻辑电路装置补充或并入专用逻辑电路装置中。
为了提供与用户的交互,可以在具有显示设备的计算机上实现各种实现,例如,用于向用户显示信息的阴极射线管(CRT)或液晶显示器(LCD)监视器,以及键盘和指向设备,例如鼠标或轨迹球,用户可以通过该设备向计算机提供输入。其他类型的设备也可以被用来提供与用户的交互;例如,被提供给用户的反馈可以是任何形式的感官反馈,例如视觉反馈、听觉反馈或触觉反馈;并且可以以任何形式接收来自用户的输入,包括声学、语音或触觉输入。
各种实现可以在计算系统中被实现,该计算系统包括后端组件例如作为数据服务器,或者包括中间件组件(例如应用服务器),或者包括前端组件(例如,具有用户可以通过其与实现交互的图形用户界面或Web浏览器的客户端计算机),或者包括这种后端、中间件或前端组件的任何组合。组件可以通过任何形式或介质的数字数据通信互连,例如通信网络。通信网络的示例包括局域网(LAN)和广域网(WAN),例如因特网。
虽然已经如本文所述说明了所描述的实现的某些特征,但是本领域技术人员现在将想到许多修改、替换、改变和等同物。因此,应该理解,所附权利要求旨在覆盖落入实施例范围内的所有这些修改和变化。
Claims (20)
1.一种计算机程序产品,所述计算机程序产品被有形地体现在非瞬态计算机可读存储介质上并且包括指令,所述指令在由至少一个计算设备执行时被配置为使所述至少一个计算设备:
获得由相机捕获的对象的第一图像和所述对象的第二图像;
比较所述第一图像的第一强度图与所述第二图像的第二强度图和组合强度图中的至少一个之间的强度变化,所述组合强度图至少从所述第一强度图和所述第二强度图被获得;以及
基于所述强度变化标识所述第一图像内的阴影。
2.根据权利要求1所述的计算机程序产品,其中所述指令在被执行时还被配置为使所述至少一个计算设备:
将所述第一强度图划分为第一部分强度图;
将所述第二强度图划分为第二部分强度图;以及
生成所述组合强度图,包括将所述第一强度图的每个部分与所述第二强度图的每个对应部分组合。
3.根据权利要求2所述的计算机程序产品,其中所述指令在被执行时还被配置为使所述至少一个计算设备:
针对所述第一部分强度图的每个部分生成对应的第一局部平均强度;
针对所述第二部分强度图的每个部分生成对应的第二局部平均强度;以及
生成所述组合强度图,包括使用所述对应的第一平均局部强度和所述对应的第二局部平均强度,针对所述组合强度图的每个部分生成全局平均强度。
4.根据权利要求2所述的计算机程序产品,其中所述指令在被执行以比较所述强度变化时还被配置为使所述至少一个计算设备:
生成具有多个部分的第一变化图,所述第一变化图的所述多个部分对应于所述第一部分强度图的多个部分,并且还对应于所述组合强度图的多个部分,其中所述第一变化图的每个部分包括所述组合强度图的对应多个部分和所述第一部分强度图的对应多个部分之间的相对差异。
5.根据权利要求4所述的计算机程序产品,其中所述指令在被执行时还被配置为使所述至少一个计算设备:
针对所述第一变化图的每个部分,确定其中的所述相对差异是否在阈值范围之外;以及
确定在所述阈值范围之外的所述第一变化图的每个部分是用于表示所述阴影的对应阴影部分的候选部分。
6.根据权利要求5所述的计算机程序产品,其中所述指令在被执行时还被配置为使所述至少一个计算设备:
确定所述第一变化图的每个候选部分是否与最小数目的附加候选部分相邻;以及
将每个最小相邻候选部分指定为所述阴影的所述对应阴影部分。
7.根据权利要求5所述的计算机程序产品,其中所述指令在被执行时还被配置为使所述至少一个计算设备:
生成具有多个部分的第二变化图,所述第二变化图的所述多个部分对应于所述第二部分强度图的多个部分,并且还对应于所述组合强度图的多个部分,其中所述第二变化图的每个部分包括所述组合强度图的对应多个部分和所述第二部分强度图的对应多个部分之间的相对差异。
8.根据权利要求7所述的计算机程序产品,其中所述指令在被执行时还被配置为使所述至少一个计算设备:
针对所述第二变化图的每个部分,确定其中的所述相对差异是否在所述阈值范围之外;
确定在所述阈值范围之外的所述第二变化图的每个部分是用于表示所述阴影的所述对应阴影部分的第二候选部分;以及
基于每个候选部分和每个第二候选部分,确定所述第一图像的每个对应部分是否应该被指定为所述阴影的所述对应阴影部分。
9.根据权利要求1所述的计算机程序产品,其中所述指令在被执行时还被配置为使所述至少一个计算设备:
基于所述阴影的所述标识激活所述相机的光源。
10.根据权利要求1所述的计算机程序产品,其中所述指令在被执行时还被配置为使所述至少一个计算设备:
在所述相机的查看帧的激活之后的成帧时段期间获得所述第一图像和所述第二图像,在所述成帧时段期间,在图像捕获的启动在所述相机处被接收之前,所述相机相对于所述查看帧内的所述对象被定位。
11.一种计算机程序产品,所述计算机程序产品被有形地体现在非瞬态计算机可读存储介质上并且包括指令,所述指令在由至少一个计算设备执行时被配置为使所述至少一个计算设备:
将针对第一图像的第一强度图划分为第一部分强度图;
将针对第二图像的第二强度图划分为第二部分强度图;
基于所述第一部分强度图和所述第二部分强度图生成组合强度图;
基于所述组合强度图与第一强度图部分和第二强度图部分中的至少一个的比较,生成至少一个变化图;以及
基于所述至少一个变化图,标识所述第一图像和所述第二图像中的至少一个内的阴影。
12.根据权利要求11所述的计算机程序产品,其中所述指令在被执行时还被配置为使所述至少一个计算设备:
将所述第一强度图划分为所述第一部分强度图,所述第一部分强度图的每个部分包括第一单元矩阵的单元;
将所述第二强度图划分为所述第二部分强度图,所述第二部分强度图的每个部分包括与所述第一单元矩阵具有相同大小和维度的第二单元矩阵的单元;以及
生成包括第三单元矩阵的所述组合强度图,其中所述第三单元矩阵的每个单元是所述第一矩阵和所述第二矩阵的对应单元的组合。
13.根据权利要求12所述的计算机程序产品,其中所述指令在被执行时还被配置为使所述至少一个计算设备:
生成包括第四单元矩阵的变化图,其中每个单元表示所述第三矩阵的对应多个单元与所述第一矩阵和所述第二矩阵中的至少一个的对应多个单元之间的相对差异。
14.根据权利要求11所述的计算机程序产品,其中所述指令在被执行时还被配置为使所述至少一个计算设备:
当用户相对于对象定位相机时,从所述相机获得所述第一图像和所述第二图像。
15.根据权利要求11所述的计算机程序产品,其中所述指令在被执行时还被配置为使所述至少一个计算设备:
在由用户对相机的查看帧的激活之后的成帧时段期间获得所述第一图像和所述第二图像,在所述成帧时段期间,在图像捕获的启动在所述相机处从所述用户被接收之前,所述用户相对于所述查看帧内的所述对象定位和定向所述相机。
16.一种在用于获得数字图像的数字媒体环境中的阴影检测的计算机实现的方法,包括:
用于比较在成帧时段期间从相机获得的多个图像的对应部分的步骤,所述成帧时段发生在对象在所述相机的视图帧内被成帧之后并且在图像捕获信号在所述相机处被接收到之前;以及
基于所述比较,标识所述多个图像中的至少一个图像内的阴影。
17.根据权利要求16所述的方法,其中用于比较的所述步骤包括:
将第一图像的第一强度图划分为第一部分强度图;
将第二图像的第二强度图划分为第二部分强度图;以及
生成组合强度图,包括将所述第一强度图的每个部分与所述第二强度图的每个对应部分组合。
18.根据权利要求17所述的方法,其中用于比较的所述步骤包括:
生成具有多个部分的第一变化图,所述第一变化图的所述多个部分对应于所述第一部分强度图的多个部分,并且还对应于所述组合强度图的多个部分,其中所述第一变化图的每个部分包括所述组合强度图的对应多个部分和所述第一部分强度图的对应多个部分之间的相对差异。
19.根据权利要求18所述的方法,包括:
针对所述第一变化图的每个部分,确定其中的所述相对差异是否在阈值范围之外;以及
确定在所述阈值范围之外的所述第一变化图的每个部分是用于表示所述阴影的对应阴影部分的候选部分。
20.根据权利要求18所述的方法,包括:
针对所述第一变化图的每个部分,确定其中的所述相对差异是否在针对边界检测误差的阈值范围之外;以及
确定在针对所述边界检测误差的所述阈值范围之外的所述第一变化图的每个部分表示所述第一图像中的边界检测误差。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US16/260,762 US10997453B2 (en) | 2019-01-29 | 2019-01-29 | Image shadow detection using multiple images |
US16/260,762 | 2019-01-29 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111510567A true CN111510567A (zh) | 2020-08-07 |
CN111510567B CN111510567B (zh) | 2023-05-26 |
Family
ID=69137166
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911078233.2A Active CN111510567B (zh) | 2019-01-29 | 2019-11-06 | 使用多个图像的图像阴影检测 |
Country Status (5)
Country | Link |
---|---|
US (1) | US10997453B2 (zh) |
CN (1) | CN111510567B (zh) |
AU (1) | AU2019268165B2 (zh) |
DE (1) | DE102019007837A1 (zh) |
GB (1) | GB2581000B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102704815B1 (ko) * | 2019-09-19 | 2024-09-06 | 엘지전자 주식회사 | 아웃도어 영역에서 이종의 위치정보 획득 메커니즘을 적용하는 방법 및 이를 구현하는 로봇과 클라우드 서버 |
CN112215833B (zh) * | 2020-10-22 | 2021-09-28 | 江苏云从曦和人工智能有限公司 | 图像质量评估方法、装置以及计算机可读存储介质 |
CN112559786B (zh) * | 2020-12-08 | 2024-03-15 | 中国联合网络通信集团有限公司 | 一种光学遥感影像成像时间的确定方法及装置 |
JP2024121891A (ja) * | 2023-02-28 | 2024-09-09 | 富士フイルム株式会社 | 画像処理装置、画像処理方法、プログラム、及び、記録媒体 |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040041919A1 (en) * | 2002-08-27 | 2004-03-04 | Mutsuhiro Yamanaka | Digital camera |
US20070104389A1 (en) * | 2005-11-09 | 2007-05-10 | Aepx Animation, Inc. | Detection and manipulation of shadows in an image or series of images |
US20080055266A1 (en) * | 2006-08-31 | 2008-03-06 | Sony Corporation | Imaging and display apparatus, information input apparatus, object detection medium, and object detection method |
KR100862494B1 (ko) * | 2007-04-25 | 2008-10-08 | 삼성전기주식회사 | 렌즈 쉐이딩 분포에 따른 영상의 에지 강조 방법 |
US20090028424A1 (en) * | 2005-08-19 | 2009-01-29 | Matsushita Electric Industrial Co., Ltd. | Image processing method, image processing system, and image processing porgram |
US20110317875A1 (en) * | 2010-06-23 | 2011-12-29 | Conwell William Y | Identifying and Redressing Shadows in Connection with Digital Watermarking and Fingerprinting |
WO2012056361A1 (en) * | 2010-10-26 | 2012-05-03 | Koninklijke Philips Electronics N.V. | Apparatus and method for hybrid reconstruction of an object from projection data. |
JP2013240016A (ja) * | 2012-05-17 | 2013-11-28 | Sharp Corp | 撮像装置および制御方法 |
KR101475896B1 (ko) * | 2014-06-23 | 2014-12-23 | 서울공간정보 주식회사 | 영상데이터와 수치좌표데이터 합성을 통해 영상이미지의 오차를 수정하는 영상처리시스템 |
CN105701844A (zh) * | 2016-01-15 | 2016-06-22 | 苏州大学 | 基于颜色特征的障碍物或阴影检测方法 |
US20160328827A1 (en) * | 2014-01-07 | 2016-11-10 | Dacuda Ag | Dynamic updating of a composite image |
CN107808366A (zh) * | 2017-10-21 | 2018-03-16 | 天津大学 | 一种基于块匹配的自适应光转移单幅阴影去除方法 |
US20180376072A1 (en) * | 2017-06-21 | 2018-12-27 | Samsung Electronics Co., Ltd. | Electronic device for providing property information of external light source for interest object |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6088468A (en) * | 1995-05-17 | 2000-07-11 | Hitachi Denshi Kabushiki Kaisha | Method and apparatus for sensing object located within visual field of imaging device |
JP3848709B2 (ja) * | 1996-10-01 | 2006-11-22 | 三菱電機株式会社 | 監視用画像処理装置 |
JP4311598B2 (ja) * | 2000-11-20 | 2009-08-12 | 富士フイルム株式会社 | 異常陰影検出方法および装置 |
GB0519769D0 (en) * | 2005-09-28 | 2005-11-09 | Imp College Innovations Ltd | Imaging system |
US8411149B2 (en) * | 2006-08-03 | 2013-04-02 | Alterface S.A. | Method and device for identifying and extracting images of multiple users, and for recognizing user gestures |
US7693331B2 (en) * | 2006-08-30 | 2010-04-06 | Mitsubishi Electric Research Laboratories, Inc. | Object segmentation using visible and infrared images |
AU2007354731A1 (en) * | 2007-06-08 | 2008-12-11 | Tele Atlas B.V. | Method of and apparatus for producing a multi-viewpoint panorama |
DE102007029476A1 (de) * | 2007-06-26 | 2009-01-08 | Robert Bosch Gmbh | Bildverarbeitungsvorrichtung zur Schattendetektion bzw. -unterdrückung, Verfahren und Computerprogramm |
US8280106B2 (en) * | 2007-09-29 | 2012-10-02 | Samsung Electronics Co., Ltd. | Shadow and highlight detection system and method of the same in surveillance camera and recording medium thereof |
CN101833749B (zh) * | 2009-03-12 | 2012-03-28 | 株式会社理光 | 检测图像中阴影的装置和方法 |
US9230308B2 (en) * | 2011-06-30 | 2016-01-05 | Weyerhaeuser Nr Company | Method and apparatus for removing artifacts from aerial images |
US9036907B2 (en) * | 2012-07-16 | 2015-05-19 | Mitsubishi Electric Research Laboratories, Inc. | Method and apparatus for extracting depth edges from images acquired of scenes by cameras with ring flashes forming hue circles |
CN104156937B (zh) * | 2013-05-15 | 2017-08-11 | 株式会社理光 | 阴影检测方法和装置 |
WO2015029047A1 (en) * | 2013-08-26 | 2015-03-05 | Hewlett-Packard Development Company, L.P. | Temporal median filtering to remove shadow |
US10298898B2 (en) * | 2013-08-31 | 2019-05-21 | Ml Netherlands C.V. | User feedback for real-time checking and improving quality of scanned image |
EP3089101A1 (en) * | 2013-12-03 | 2016-11-02 | Dacuda AG | User feedback for real-time checking and improving quality of scanned image |
US9158985B2 (en) * | 2014-03-03 | 2015-10-13 | Xerox Corporation | Method and apparatus for processing image of scene of interest |
WO2016071020A1 (en) * | 2014-11-06 | 2016-05-12 | Sony Corporation | Imaging system including lens with longitudinal chromatic aberration, endoscope and imaging method |
US20160307147A1 (en) * | 2015-04-15 | 2016-10-20 | Wal-Mart Stores, Inc. | Product placement monitoring apparatus and method |
US9430715B1 (en) * | 2015-05-01 | 2016-08-30 | Adobe Systems Incorporated | Identifying and modifying cast shadows in an image |
KR101729536B1 (ko) * | 2016-01-19 | 2017-05-02 | 연세대학교 산학협력단 | 이동 물체 검출 장치 및 그 방법 |
EP3300022B1 (en) * | 2016-09-26 | 2019-11-06 | Canon Kabushiki Kaisha | Image processing apparatus, image processing method, and program |
-
2019
- 2019-01-29 US US16/260,762 patent/US10997453B2/en active Active
- 2019-11-06 CN CN201911078233.2A patent/CN111510567B/zh active Active
- 2019-11-12 DE DE102019007837.3A patent/DE102019007837A1/de active Pending
- 2019-11-21 AU AU2019268165A patent/AU2019268165B2/en active Active
- 2019-11-21 GB GB1916975.4A patent/GB2581000B/en active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040041919A1 (en) * | 2002-08-27 | 2004-03-04 | Mutsuhiro Yamanaka | Digital camera |
US20090028424A1 (en) * | 2005-08-19 | 2009-01-29 | Matsushita Electric Industrial Co., Ltd. | Image processing method, image processing system, and image processing porgram |
US20070104389A1 (en) * | 2005-11-09 | 2007-05-10 | Aepx Animation, Inc. | Detection and manipulation of shadows in an image or series of images |
US20080055266A1 (en) * | 2006-08-31 | 2008-03-06 | Sony Corporation | Imaging and display apparatus, information input apparatus, object detection medium, and object detection method |
KR100862494B1 (ko) * | 2007-04-25 | 2008-10-08 | 삼성전기주식회사 | 렌즈 쉐이딩 분포에 따른 영상의 에지 강조 방법 |
US20110317875A1 (en) * | 2010-06-23 | 2011-12-29 | Conwell William Y | Identifying and Redressing Shadows in Connection with Digital Watermarking and Fingerprinting |
WO2012056361A1 (en) * | 2010-10-26 | 2012-05-03 | Koninklijke Philips Electronics N.V. | Apparatus and method for hybrid reconstruction of an object from projection data. |
JP2013240016A (ja) * | 2012-05-17 | 2013-11-28 | Sharp Corp | 撮像装置および制御方法 |
US20160328827A1 (en) * | 2014-01-07 | 2016-11-10 | Dacuda Ag | Dynamic updating of a composite image |
KR101475896B1 (ko) * | 2014-06-23 | 2014-12-23 | 서울공간정보 주식회사 | 영상데이터와 수치좌표데이터 합성을 통해 영상이미지의 오차를 수정하는 영상처리시스템 |
CN105701844A (zh) * | 2016-01-15 | 2016-06-22 | 苏州大学 | 基于颜色特征的障碍物或阴影检测方法 |
US20180376072A1 (en) * | 2017-06-21 | 2018-12-27 | Samsung Electronics Co., Ltd. | Electronic device for providing property information of external light source for interest object |
CN107808366A (zh) * | 2017-10-21 | 2018-03-16 | 天津大学 | 一种基于块匹配的自适应光转移单幅阴影去除方法 |
Also Published As
Publication number | Publication date |
---|---|
AU2019268165B2 (en) | 2021-10-07 |
AU2019268165A1 (en) | 2020-08-13 |
US10997453B2 (en) | 2021-05-04 |
DE102019007837A1 (de) | 2020-08-27 |
GB2581000B (en) | 2023-08-16 |
GB2581000A (en) | 2020-08-05 |
US20200242388A1 (en) | 2020-07-30 |
CN111510567B (zh) | 2023-05-26 |
GB201916975D0 (en) | 2020-01-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111510567B (zh) | 使用多个图像的图像阴影检测 | |
RU2653461C2 (ru) | Обнаружение блика в кадре данных изображения | |
US10453204B2 (en) | Image alignment for burst mode images | |
JP4309926B2 (ja) | 顔特徴点検出装置、顔特徴点検出方法及びプログラム | |
US8213052B2 (en) | Digital image brightness adjustment using range information | |
US10204432B2 (en) | Methods and systems for color processing of digital images | |
US20170039684A1 (en) | Detecting glare in a frame of image data | |
US10169673B2 (en) | Region-of-interest detection apparatus, region-of-interest detection method, and recording medium | |
US10810711B2 (en) | Information processing apparatus, storage medium, and information processing method | |
CA2901779C (en) | Enhanced analysis for image-based serpentine belt wear evaluation | |
US9094617B2 (en) | Methods and systems for real-time image-capture feedback | |
KR101377910B1 (ko) | 화상 처리 방법 및 화상 처리 장치 | |
JP6542230B2 (ja) | 投影ひずみを補正するための方法及びシステム | |
US9613427B2 (en) | Information processing method and electronic device | |
US9230309B2 (en) | Image processing apparatus and image processing method with image inpainting | |
EP3038057A1 (en) | Methods and systems for color processing of digital images | |
US20170372495A1 (en) | Methods and systems for color processing of digital images | |
US20170178342A1 (en) | Methods and systems for image processing of digital images |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |