CN116612255A - 基于局部图像确定全局光源位置的方法及设备 - Google Patents

基于局部图像确定全局光源位置的方法及设备 Download PDF

Info

Publication number
CN116612255A
CN116612255A CN202210117783.6A CN202210117783A CN116612255A CN 116612255 A CN116612255 A CN 116612255A CN 202210117783 A CN202210117783 A CN 202210117783A CN 116612255 A CN116612255 A CN 116612255A
Authority
CN
China
Prior art keywords
light source
brightness
parameter set
determining
convolution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210117783.6A
Other languages
English (en)
Inventor
宗达
孟亚州
蔡亚娟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hisense Visual Technology Co Ltd
Original Assignee
Hisense Visual Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hisense Visual Technology Co Ltd filed Critical Hisense Visual Technology Co Ltd
Priority to CN202210117783.6A priority Critical patent/CN116612255A/zh
Publication of CN116612255A publication Critical patent/CN116612255A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T19/00Manipulating 3D models or images for computer graphics
    • G06T19/006Mixed reality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Graphics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computer Hardware Design (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Image Analysis (AREA)

Abstract

本申请涉及AR技术领域,提供一种基于局部图像确定全局光源位置的方法及设备,通过将摄像头采集的局部彩色图像转换为灰度图,并利用灰度图像的特性分两种情况确定光源位置,一是当灰度图中存在光源时,自定义不同尺度的卷积核以表征不同视野,每种尺度的卷积核的数量为多个,并采用不同尺度的卷积核对灰度图进行卷积,根据卷积结果确定光源位置;二是当灰度图中不存在光源时,将灰度图等分为多个子区域,分别确定每个子区域的亮度参数集合,并根据各个亮度参数集合确定光源位置。针对灰度图中是否包含光源的两种情况,采用不同的方式确定光源位置,提高了光源位置估计的准确性,进而提高了虚拟物体光照的真实性。

Description

基于局部图像确定全局光源位置的方法及设备
技术领域
本申请涉及增强现实(Augmented Reality,AR)技术领域,尤其涉及一种基于局部图像确定全局光源位置的方法及设备。
背景技术
AR技术将虚拟的三维物体、视频、文字、图片等计算机生成的物体实时叠加显示到真实场景中,通过虚实融合实现自然的人机交互,其在医疗卫生、军事仿真、工业维修、教育娱乐等行业具有广泛的应用前景。
在AR体验中用户对光照有微妙的感觉,通常将光照一致性作为虚实融合的重要指标。光照一致性能准确反映虚拟物体与真实环境之间的明暗、环境贴图、阴影等光照匹配关系,当显示的虚拟物体的阴影或亮暗与真实环境不一致时,用户会感觉到该虚拟物体并不属于该真实环境,降低了AR体验。因此,为了使虚拟物体表面有明确的亮度变化及正确方向的阴影,需要准确确定光源的位置。
目前,相关技术在基于图像估计光源的位置时,首先确定图像的高亮区域,再结合深度图像求法线,从而获得光源位置。但由于高亮区域不仅受光源影响,也会受真实环境中物体颜色的影响,例如,一张纯白的纸张下图像中也可能被认定为高亮区域,因此,在某一特定的场景中无法准确的确定高领区域,导致光源位置估计不准确。并且,有的AR产品中不支持深度图的获取,深度图的获取会带来额外的成本,其准确度也会对光源位置造成较大的影响。
发明内容
本申请实施例提供了一种基于局部图像确定全局光源位置的方法及设备,用于提高光源位置估计的准确性。
一方面,本申请实施例提供一种基于局部图像确定全局光源位置的方法,应用于AR场景,包括:
获取摄像头采集的局部彩色图像,并将所述局部彩色图像转换为灰度图;
当所述灰度图中存在光源时,采用自定义的不同尺度的卷积核对所述灰度图进行卷积,并根据卷积结果确定光源位置;其中,每种尺度的卷积核的数量为多个;
当所述灰度图中不存在光源时,将所述灰度图等分为多个子区域,分别确定每个子区域的亮度参数集合,并根据各个亮度参数集合确定光源位置。
另一方面,本申请实施例提供一种AR设备,包括处理器、存储器、摄像头、显示器,所述显示器、所述摄像头、所述存储器与所述处理器通过总线连接;
所述显示器用于显示图像;
所述存储器存储有计算机程序,所述处理器根据所述计算机程序,执行以下操作:
获取所述摄像头采集的局部彩色图像,并将所述局部彩色图像转换为灰度图;
当所述灰度图中存在光源时,采用自定义的不同尺度的卷积核对所述灰度图进行卷积,并根据卷积结果确定光源位置;其中,每种尺度的卷积核的数量为多个;
当所述灰度图中不存在光源时,将所述灰度图等分为多个子区域,分别确定每个子区域的亮度参数集合,并根据各个亮度参数集合确定光源位置。
另一方面,本申请实施例提供一种计算机可读存储介质,计算机可读存储介质存储有计算机可执行指令,计算机可执行指令用于使计算机执行基于局部图像确定全局光源位置的方法。
本申请的上述实施例中,获取摄像头采集的局部彩色图像,并将局部彩色图像转换为灰度图,当灰度图中存在光源时,自定义不同尺度的卷积核以表征不同视野,每种尺度的卷积核的数量为多个,并采用不同尺度的卷积核对灰度图进行卷积,根据卷积结果确定光源位置;当灰度图中不存在光源时,将灰度图等分为多个子区域,分别确定每个子区域的亮度参数集合,并根据各个亮度参数集合确定光源位置。针对灰度图中是否包含光源的两种情况,采用不同的方式确定光源位置,提高了光源位置估计的准确性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1示例性示出了本申请实施例提供的基于局部图像确定全局光源位置的方法流程图;
图2示例性示出了本申请实施例提供的包含光源的灰度图中各像素值的特征图;
图3示例性示出了本申请实施例提供的5*5尺度的两个卷积核;
图4示例性示出了本申请实施例提供的7*7尺度的两个卷积核;
图5示例性示出了本申请实施例提供的包含光源时光源位置的确定方法流程图;
图6示例性示出了本申请实施例提供的5*5尺度的第一卷积核与灰度图的卷积过程示意图;
图7示例性示出了本申请实施例提供的5*5尺度的第二卷积核与灰度图的卷积过程示意图;
图8示例性示出了本申请实施例提供的7*7尺度的第一卷积核与灰度图的卷积过程示意图;
图9示例性示出了本申请实施例提供的7*7尺度的第二卷积核与灰度图的卷积过程示意图;
图10示例性示出了本申请实施例提供的图像分割示意图;
图11示例性示出了本申请实施例提供的表征亮度变化的亮度趋势函数的求解示意图;图12示例性示出了本申请实施例提供的不包含光源时光源位置的确定方法流程图;图13示例性示出了本申请实施例提供的确定光源位置后的AR效果图;
图14示例性示出了本申请实施例提供的AR设备的结构图。
具体实施方式
为使本申请的目的、实施方式和优点更加清楚,下面将结合本申请示例性实施例中的附图,对本申请示例性实施方式进行清楚、完整地描述,显然,所描述的示例性实施例仅是本申请一部分实施例,而不是全部的实施例。
基于本申请描述的示例性实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请所附权利要求保护的范围。此外,虽然本申请中公开内容按照示范性一个或几个实例来介绍,但应理解,可以就这些公开内容的各个方面也可以单独构成一个完整实施方式。
本申请中说明书和权利要求书及上述附图中的术语″第一″、″第二″等,是用于区别类似或同类的对象或实体,而不必然意味着限定特定的顺序或先后次序,除非另外注明(Unless otherwise indicated)。应该理解这样使用的用语在适当情况下可以互换,例如能够根据本申请实施例图示或描述中给出那些以外的顺序实施。
在AR场景中,可以将模拟仿真的虚拟物体是放置在真实画面上,另虚实两种信息互为补充,从而实现对真实环境的″增强″。
受摄像头视场角的限制,AR设备通常只能采集到真实场景的局部视野图像。在真实场景中加入虚拟物体时,为了提高虚实融合的真实性,虚拟物体需要与真实环境具有一致的光照效果,包括光照的颜色、强度和方向等。因此,准确的光源位置估计能使虚拟物体表面有明确的亮度变化及正确的阴影方向。
在实际应用场景中,摄像头的视野中可能不会出现光源。目前通常采用复杂的深度学习网络对图像进行学习,拟合光照信息的高斯球面来估计光源的位置。但是由于训练深度学习网络的高动态图像难以获得,同时深度学习方法的泛化能力较弱,对于未训练的场景适用性较差,因此,该方法不准确的确定环境光源。
鉴于此,本申请实施例提供了一种基于局部图像确定全局光源位置的方法及设备,在摄像头局部视野较窄的情况下,能够准确确定360°全局光源的位置。具体的,首先,对摄像头采集的局部RGB图像进行光源检测,当图像中存在光源时,使用滤波方式(即使用卷积核对图像进行卷积)确定光源位置,当图像中不存在光源时,对图像进行分区,并确定每个子区域内光照灰度变化、亮度均值等参数,以此确定图像外全局的光源位置。
参见图1,为本申请实施例提供的基于局部图像确定全局光源位置的方法流程图,该流程由AR设备执行,主要包括以下几步:
S101:获取摄像头采集的局部彩色图像,并将局部彩色图像转换为灰度图。
在执行S101时,AR设备获取RGB摄像头采集的当前视场角下的局部彩色图像,为了获取到图像亮度信息,将局部彩色图像转换为灰度图,转换公式如下:
Gray=R*0.299+G*0.587+B*0.014公式1
其中,R、G、B分别表示红、绿、蓝三个通道分量的颜色值。
S102:确定灰度图中是否存在光源,若存在,执行S103,否则,执行S104。
通常的,根据灰度图中各像素点的分布状态,可以确定灰度图中是否存在光源。具体的,包含光源的灰度图中各像素点的分布状态如图2所示,光源在360°空间内由内向外传播,因此,每一光圈的像素点的灰度值基本相同,且层高斯分布,即内圈像素值大(零度高),像素点个数少,外圈像素值小(亮度低),像素点个数多。
S103:采用自定义的不同尺度的卷积核对灰度图进行卷积,并根据卷积结果确定光源位置。
在本申请的实施例中,当灰度图中存在光源时,自定义不同尺度的卷积核用以模拟不同视野下的光电探测器,每种尺度的卷积核的数量为多个。
以每种尺度至少包含两个卷积核为例,为区别描述,分别记为第一卷积核和第二卷积核。其中,第一卷积核中每一层的卷积参数之和为0,第二卷积核中相邻两层的卷积参数之和小于预设参数阈值。
参见图3,示出了5*5尺度的两个卷积核。其中,第一卷积核的最外层和次外层的卷积参数由-1和1相间组成,最内层卷积参数为0;第二卷积核中最外层卷积参数均为-0.6,次外层卷积参数均为1,最内层卷积参数为0。
参见图4,示出了7*7尺度的两个卷积核。其中,第一卷积核除最内层卷积参数为0外,其余3层的卷积参数均由-1和1相间组成;第二卷积核由外到内,每一层的卷积参数分别为-0.6、1、-1.6、0。
基于上述自定义的不同尺度的卷积核,确定灰度图中光源的位置,具体参见图5:
S1031:针对每一种尺度的多个卷积核,执行以下操作:将多个卷积核,分别与图灰度进行全图卷积操作,确定一个候选区域,候选区域内的像素值与每一个卷积核的乘积小于预设像素阈值。
以每种尺度包含两个卷积核为例,具体实施时,将每种尺度的第一卷积核与灰度图进行全图卷积,卷积过程中,当灰度图中与第一卷积核尺度相同的局部区域内的像素值与第一卷积核的乘积小于第一预设像素阈值时,将该局部区域作为第一候选区域;同时,将同种尺度的第二卷积核与灰度图进行全图卷积时,第一候选区域内的像素值与第二卷积核的乘积应当小于第二预设像素阈值。其中,第一预设像素阈值可以相同也可以不同。
例如,以5*5尺度的两个卷积核与灰度图进行卷积为例,参见图6和图7,在图6中,候选区域1与第一卷积核的乘积小于第一预设像素阈值,在图7中,候选区域1与第二卷积核的乘积小于第二预设像素阈值。
再例如,以7*7尺度的两个卷积核与灰度图进行卷积为例,参见图8和图9,在图8中,候选区域2与第一卷积核的乘积小于第一预设像素阈值,在图9中,候选区域2与第二卷积核的乘积小于第二预设像素阈值。
S1032:将不同尺度的多个卷积核确定的不同候选区域的并集,确定为光源位置。
以图6-图9为例,5*5尺度的两个卷积核确定了一个候选区域1,7*7尺度的两个卷积核确定了一个候选区域2将候选区域1和候选区域2的并区域作为灰度图中的光源位置。
当灰度图中不存在光源时,需要估计光源在360°全局空间内的位置。具体如下:
S104:将灰度图等分为多个子区域,分别确定每个子区域的亮度参数集合,并根据各个亮度参数集合确定光源位置。
在一种可选的实施方式中,执行S104时,以灰度图的中心为原点,将360°的平面灰度图以45°为间隔,等分为8个子区域,参见图10。
需要说明的是,图10仅是一种示例,例如,还可以设置90°的间隔。
将灰度图,确定每个子区域的亮度参数集合。可选的,每个亮度参数集合包括亮度均值、亮度众数以及亮度趋势函数中的至少一个。其中,亮度均值为一个子区域内各像素点的灰度值的均值;亮度众数为一个子区域内出现次数最多的灰度值;亮度趋势函数为一个子区域内,以灰度图的中心点为原点的线性函数。
下面详细描述本申请实施例中每个亮度参数集合中亮度趋势函数的计算过程。
假设亮度趋势函数为y=ax+b,其中,y为灰度图像中每一层像素点的亮度均值,x为像素点的层数。
在一种可选的实施方式中,AR设备采用最小二乘法,根据灰度图的最外侧30层像素点的灰度值,求解拟合函数,使得min(y)=(ax1+b-y1)2+(ax2+b-y2)2+…+(ax30+b-y30)2最小。
由于(x1,y1)、(x1,y1)…(x30,y30)是已知量,求解拟合函数问题可转换为求y=f(a,b)的最小值,即求解(a,b)点,使得f(a,b)有极小值,如图11所示。y=f(a,b)为二次函数,因此,可对y求导,当倒数为0时,y有最小值。求导公式如下:
通过公式2和3,可以解得a和b,从而得到每个子区域对应的亮度参数集合中的亮度趋势函数。
进一步地,确定各个子区域的亮度参数集合后,在执行S104时,根据各个亮度参数集合确定光源位置,具体参见图12:
S1041:分别确定各个亮度参数集合中,每个亮度参数的最大值。
以亮度参数集合包含亮度均值、亮度众数和亮度趋势函数为例,遍历各个亮度参数集合,可以得到亮度均值的最大值和亮度众数的最大值,以及每个亮度参数集合中,相应的亮度趋势函数的趋势信息。
例如,以图10分割的子区域为例,假设子区域1对应的亮度参数集合1中的亮度趋势函数y1=a1x+b1,原点为灰度图的中心,当a<0时,子区域1中亮度由内向外逐渐变亮,即子区域1由内向外亮度呈上升趋势。
再例如,扔以图10分割的子区域为例,假设子区域2对应的亮度参数集合2中的亮度趋势函数y2=a2x+b2,原点为灰度图的中心,当a>0时,子区域2中亮度由内向外逐渐变亮,即子区域2由内向外亮度呈上升趋势。
S1042:确定各个亮度参数的最大值是否位于同一亮度参数集合,且该亮度集合中的亮度趋势函数由内向外呈上升趋势,若是,执行S1043,否则,执行S1044。
在本申请的实施例中,当最大的亮度均值和亮度众数均位于同一亮度参数集合时,且该亮度参数集合中亮度趋势函数由内向外呈上升趋势时,表明该亮度参数集合对应的子区域很可能为光源的方向。
S1043:将亮度参数集合对应的子区域,确定为光源的方向区域。
例如,各个亮度参数集合中,最大的亮度均值位于亮度参数集合1,最大的亮度众数也位于亮度参数集合1,并且,亮度参数集合1中的亮度趋势函数呈上升趋势,则确定亮度参数集合1对应的子区域1为光源的方向区域。
S1044:按照预设规则,从各个亮度参数集合选取出目标参数集合,并将目标参数集合对应的子区域,确定光源的方向区域。
在本申请的实施例中,亮度均值的最大值、亮度众数的最大值,以及亮度趋势函数所表征的相应子区域内由内到外的亮度变化,均可以作为光源方向的指示信息。
一种可选的实施方式中,S1044中的预设规则为投票选择法。其中,投票选择法是一种少数服从多数的机器学习方法,根据投票结果的不同,光源的方向区域的确定方式也不同。
方式一
将各个亮度参数集合中,将包含指示光源方向最多的亮度参数的亮度参数集合对应的子区域,确定为光源的方向区域。
例如,如果一个亮度参数集合中同时包含最大的亮度均值和最大的亮度众数,即该亮度参数集合包含的指示光源方向的信息数量占该集合的2/3,则将该亮度参数集合作为一个目标参数集合,并将该目标参数集合对应的子区域确定为光源的方向区域。
再例如,如果一个亮度参数集合中包含最大的亮度均值或最大的亮度众数,且该亮度参数集合中的亮度趋势函数由内向外呈上升趋势,即该亮度参数集合包含的指示光源方向的信息数量占该集合的2/3,则将该亮度参数集合作为一个目标参数集合,并将该目标参数集合对应的子区域确定为光源的方向区域。
方式二
将包含指示光源方向的亮度参数的多个亮度参数集合各自对应的子区域,均确定为光源的方向区域。
例如,亮度参数集合1包含最大的亮度均值,亮度参数集合8包含最大的亮度众数,亮度参数集合7中亮度趋势函数由内向外呈上升趋势,则将亮度参数集合1、8、7均作为一个目标参数集合,并将各个目标参数集合对应的子区域1、8、7确定为光源的方向区域。
S1045:根据方向区域对应的亮度参数集合中的亮度趋势函数,确定光源位置。
根据上述S1043和S1044的描述可知,确定的光源的方向区域可能有一个,也可能有多个。
当确定的方向区域为1个时,则根据该方向区域对应额亮度参数集合中的亮度趋势函数y=ax+b,确定光源的位置。
具体的,令y=255.0,表示360°空间内最亮的点,此时,求解得到的x为光源距离灰度图的中心点的距离,即光源的位置。
当确定的方向区域为多个时,则根据每个方向区域对应的亮度参数集合中的亮度趋势函数,确定目标亮度趋势函数,并根据所述目标亮度趋势函数,确定光源位置。
以两个方向区域为例,亮度趋势函数分别为y1=a1x+b、y2=a2x+b,则确定a1和a2的均值,以及b1和b2的均值,得到目标函数y=a’x+b’,其中,a’=(a1+a2)/2,b’=(b1+b2)/2。进一步地,另y=255.0,求解得到的x为光源距离灰度图的中心点的距离,即光源的位置。
本申请的上述实施例中,实现了基于摄像头视野内的局部彩色图像确定全局光源位置的方法,为了获取到亮度信息,将获取的局部彩色图像转换为灰度图,针对灰度图中是否包含光源,分两种情况进行判别。具体的,当灰度图包含光源时,本申请根据光源的特性,自定义了多种尺度的卷积核,每种尺度的卷积核的数量为多个,基于自定义的卷积核,可以准确确定灰度图中的光源位置;当灰度图不包含光源时,则以灰度图的中心为原点将灰度图等分为多个子区域,统计每个子区域内的亮度均值、亮度众数、由内到外的亮度变化趋势等指示光源方向的亮度参数,基于这些亮度参数,准确估计全局光源位置。该方法无需进行深度学习模型的训练,且适用于不同的应用场景(如餐厅、卧室、书房等)、具有较强的泛化能力和鲁棒性。
按照本申请上述实施例提供的方法准确确定光源位置后,根据光源位置,可以为真实环境中添加的虚拟物体调节表面亮度变化、阴影方向等,使得虚拟物体与真实环境具有光照一致性,提高了虚实融合的真实性,进而提升了的用户体验。
参见图13,为按照本申请实施例提供的方法得到的AR效果图,其中,茶壶为添加的虚拟物体,该茶壶的表面亮度和光影与真实环境的光照强度一致,提高画面的真实性。
基于相同的技术构思,本申请实施例提供一种AR设备,该设备可实现上述实施例中的基于局部图像确定全局光源位置的方法步骤,且能达到相同的技术效果。
参见图14,该AR设备包含处理器1401、存储器1402、摄像头1403、显示器1404,其中,显示器1404、摄像头1403、存储器1402与处理器1401通过总线1405连接;
显示器1404用于显示图像;
存储器1402存储有计算机程序,处理器1401根据存储器1402存储的计算机程序,执行以下操作:
获取摄像头1403采集的局部彩色图像,并将局部彩色图像转换为灰度图;
当灰度图中存在光源时,采用自定义的不同尺度的卷积核对灰度图进行卷积,并根据卷积结果确定光源位置;其中,每种尺度的卷积核的数量为多个;
当灰度图中不存在光源时,将灰度图等分为多个子区域,分别确定每个子区域的亮度参数集合,并根据各个亮度参数集合确定光源位置。
可选的,处理器1401采用自定义的不同尺度的卷积核对灰度图进行扫描,并根据扫描结果确定光源位置,具体操作为:
针对每一种尺度的多个卷积核,执行以下操作:将多个卷积核,分别与图灰度进行全图卷积操作,确定一个候选区域,候选区域内的像素值与每一个卷积核的乘积小于预设像素阈值;
将不同尺度的多个卷积核确定的不同候选区域的并集,确定为光源位置。
可选的,每种尺度至少包含第一卷积核和第二卷积核,第一卷积核中每一层的卷积参数之和为0,第二卷积核中相邻两层的卷积参数之和小于预设参数阈值。
可选的,处理器1401根据各个亮度参数集合确定光源位置,具体操作为:
分别确定各个亮度参数集合中,每个亮度参数的最大值;
若各个亮度参数的最大值位于同一亮度参数集合,且亮度集合中的亮度趋势函数由内向外呈上升趋势,则将亮度参数集合对应的子区域,确定为光源的方向区域,否则,按照预设规则,从各个亮度参数集合选取出目标参数集合,并将目标参数集合对应的子区域,确定光源的方向区域;
根据方向区域对应的亮度参数集合中的亮度趋势函数,确定光源位置。
可选的,处理器1401按照预设规则,从各个亮度参数集合选取出目标参数集合,并将目标参数集合对应的子区域,确定光源的方向区域,具体操作为:
将各个亮度参数集合中,将包含指示光源方向最多的亮度参数的亮度参数集合对应的子区域,确定为光源的方向区域;或者
将包含指示光源方向的亮度参数的多个亮度参数集合各自对应的子区域,均确定为光源的方向区域。
可选的,当方向区域为多个时,处理器1401根据方向区域对应的亮度参数集合中的亮度趋势函数,确定光源位置,具体操作为:
根据每个方向区域对应的亮度参数集合中的亮度趋势函数,确定目标亮度趋势函数;根据目标亮度趋势函数,确定光源位置。
可选的,每个亮度参数集合包括亮度均值、亮度众数以及亮度趋势函数中的至少一个。
本申请实施例图14中涉及的处理器可以是中央处理器(Central ProcessingUnit,CPU),通用处理器,图形处理器(Graphics Processing Unit,GPU)数字信号处理器(Digital Signal Processor,DSP),专用集成电路(Application-specific IntegratedCircuit,ASIC),现场可编程门阵列(Field Programmable Gate Array,FPGA)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等等。其中,所述存储器可以集成在所述处理器中,也可以与所述处理器分开设置。
需要说明的是,图14仅是一种示例,给出了AR设备执行本申请实施例提供的基于局部图像确定全局光源位置的方法步骤所必要的硬件,未示出的,该AR设备还包含人机交互设备的常用硬件,如扬声器、麦克风、左右眼镜片等。
本申请实施例还提供一种计算机可读存储介质,用于存储一些指令,这些指令被执行时,可以完成前述实施例的方法。
本申请实施例还提供一种计算机程序产品,用于存储计算机程序,该计算机程序用于执行前述实施例的方法。
最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。
为了方便解释,已经结合具体的实施方式进行了上述说明。但是,上述示例性的讨论不是意图穷尽或者将实施方式限定到上述公开的具体形式。根据上述的教导,可以得到多种修改和变形。上述实施方式的选择和描述是为了更好的解释原理以及实际的应用,从而使得本领域技术人员更好的使用所述实施方式以及适于具体使用考虑的各种不同的变形的实施方式。

Claims (10)

1.一种基于局部图像确定全局光源位置的方法,其特征在于,应用于增强现实AR场景,包括:
获取摄像头采集的局部彩色图像,并将所述局部彩色图像转换为灰度图;
当所述灰度图中存在光源时,采用自定义的不同尺度的卷积核对所述灰度图进行卷积,并根据卷积结果确定光源位置;其中,每种尺度的卷积核的数量为多个;
当所述灰度图中不存在光源时,将所述灰度图等分为多个子区域,分别确定每个子区域的亮度参数集合,并根据各个亮度参数集合确定光源位置。
2.如权利要求1所述的方法,其特征在于,所述采用自定义的不同尺度的卷积核对所述灰度图进行扫描,并根据扫描结果确定光源位置,包括:
针对每一种尺度的多个卷积核,执行以下操作:将所述多个卷积核,分别与所述图灰度进行全图卷积操作,确定一个候选区域,所述候选区域内的像素值与每一个卷积核的乘积小于预设像素阈值;
将不同尺度的多个卷积核确定的不同候选区域的并集,确定为光源位置。
3.如权利要求1或2所述的方法,其特征在于,每种尺度至少包含第一卷积核和第二卷积核,所述第一卷积核中每一层的卷积参数之和为0,所述第二卷积核中相邻两层的卷积参数之和小于预设参数阈值。
4.如权利要求1所述的方法,其特征在于,所述根据各个亮度参数集合确定光源位置,包括:
分别确定所述各个亮度参数集合中,每个亮度参数的最大值;
若各个亮度参数的最大值位于同一亮度参数集合,且所述亮度集合中的亮度趋势函数由内向外呈上升趋势,则将所述亮度参数集合对应的子区域,确定为光源的方向区域,否则,按照预设规则,从所述各个亮度参数集合选取出目标参数集合,并将所述目标参数集合对应的子区域,确定光源的方向区域;
根据所述方向区域对应的亮度参数集合中的亮度趋势函数,确定光源位置。
5.如权利要求4所述的方法,其特征在于,所述按照预设规则,从所述各个亮度参数集合选取出目标参数集合,并将所述目标参数集合对应的子区域,确定光源的方向区域,包括:
将所述各个亮度参数集合中,将包含指示光源方向最多的亮度参数的亮度参数集合对应的子区域,确定为光源的方向区域;或者
将包含指示光源方向的亮度参数的多个亮度参数集合各自对应的子区域,均确定为光源的方向区域。
6.如权利要求5所述的方法,其特征在于,当方向区域为多个时,所述根据所述方向区域对应的亮度参数集合中的亮度趋势函数,确定光源位置,包括:
根据每个方向区域对应的亮度参数集合中的亮度趋势函数,确定目标亮度趋势函数;
根据所述目标亮度趋势函数,确定光源位置。
7.如权利要求1或4-6中任一项所述的方法,其特征在于,每个亮度参数集合包括亮度均值、亮度众数以及亮度趋势函数中的至少一个。
8.一种增强现实AR设备,其特征在于,包括处理器、存储器、摄像头、显示器,所述显示器、所述摄像头、所述存储器与所述处理器通过总线连接;
所述显示器用于显示图像;
所述存储器存储有计算机程序,所述处理器根据所述计算机程序,执行以下操作:
获取所述摄像头采集的局部彩色图像,并将所述局部彩色图像转换为灰度图;
当所述灰度图中存在光源时,采用自定义的不同尺度的卷积核对所述灰度图进行卷积,并根据卷积结果确定光源位置;其中,每种尺度的卷积核的数量为多个;
当所述灰度图中不存在光源时,将所述灰度图等分为多个子区域,分别确定每个子区域的亮度参数集合,并根据各个亮度参数集合确定光源位置。
9.如权利要求8所述的AR设备,其特征在于,所述处理器采用自定义的不同尺度的卷积核对所述灰度图进行扫描,并根据扫描结果确定光源位置,具体操作为:
针对每一种尺度的多个卷积核,执行以下操作:将所述多个卷积核,分别与所述图灰度进行全图卷积操作,确定一个候选区域,所述候选区域内的像素值与每一个卷积核的乘积小于预设像素阈值;
将不同尺度的多个卷积核确定的不同候选区域的并集,确定为光源位置。
10.如权利要求8所述的AR设备,其特征在于,所述处理器根据各个亮度参数集合确定光源位置,具体操作为:
分别确定所述各个亮度参数集合中,每个亮度参数的最大值;
若各个亮度参数的最大值位于同一亮度参数集合,且所述亮度集合中的亮度趋势函数呈上升趋势,则将所述亮度参数集合对应的子区域,确定为光源的方向区域,否则,按照预设规则,从所述各个亮度参数集合选取出目标参数集合,并将所述目标参数集合对应的子区域,确定光源的方向区域;
根据所述方向区域对应的亮度参数集合中的亮度趋势函数,确定光源位置。
CN202210117783.6A 2022-02-08 2022-02-08 基于局部图像确定全局光源位置的方法及设备 Pending CN116612255A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210117783.6A CN116612255A (zh) 2022-02-08 2022-02-08 基于局部图像确定全局光源位置的方法及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210117783.6A CN116612255A (zh) 2022-02-08 2022-02-08 基于局部图像确定全局光源位置的方法及设备

Publications (1)

Publication Number Publication Date
CN116612255A true CN116612255A (zh) 2023-08-18

Family

ID=87678739

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210117783.6A Pending CN116612255A (zh) 2022-02-08 2022-02-08 基于局部图像确定全局光源位置的方法及设备

Country Status (1)

Country Link
CN (1) CN116612255A (zh)

Similar Documents

Publication Publication Date Title
US8264546B2 (en) Image processing system for estimating camera parameters
US8130244B2 (en) Image processing system
TWI767985B (zh) 用於處理影像性質圖的方法及裝置
US10950039B2 (en) Image processing apparatus
WO2011104151A1 (en) Confidence map, method for generating the same and method for refining a disparity map
US20210152796A1 (en) Image calibration for projected images
WO2022105276A1 (zh) 投影区域确定方法、装置、投影设备及可读存储介质
CN108537758A (zh) 一种基于显示器与人眼视觉特性的图像对比度增强方法
CN112153303B (zh) 一种视觉数据处理方法、装置、图像处理设备和存储介质
CN111311720B (zh) 一种纹理图像的处理方法和装置
Piórkowski et al. Automatic detection of game engine artifacts using full reference image quality metrics
US10902669B2 (en) Method for estimating light for augmented reality and electronic device thereof
CN116612255A (zh) 基于局部图像确定全局光源位置的方法及设备
CN114066715A (zh) 图像风格迁移方法、装置、电子设备以及存储介质
WO2023005743A1 (zh) 图像处理方法及装置、计算机设备、存储介质和计算机程序产品
Jung et al. Visual discomfort visualizer using stereo vision and time-of-flight depth cameras
JP7125847B2 (ja) 3dモデル表示装置、3dモデル表示方法及び3dモデル表示プログラム
Zhao et al. Objective assessment of perceived sharpness of projection displays with a calibrated camera
Dolhasz et al. Measuring observer response to object-scene disparity in composites
CN107452039B (zh) 压缩rgb颜色空间的方法及装置
Kunert et al. Cube-ssim: A metric for evaluating 360-degree images as cube maps
Setkov et al. Evaluation of color descriptors for projector-camera systems
CN113436284B (zh) 一种图像处理方法、装置、计算机设备和存储介质
Shen et al. Robust stereoscopic crosstalk prediction
Nishidate et al. Precise Detection of Changes in Relatively Static Environments for Single-Board Computers

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination