CN112257653A - 空间装饰效果图确定方法、装置、存储介质与电子设备 - Google Patents
空间装饰效果图确定方法、装置、存储介质与电子设备 Download PDFInfo
- Publication number
- CN112257653A CN112257653A CN202011233469.1A CN202011233469A CN112257653A CN 112257653 A CN112257653 A CN 112257653A CN 202011233469 A CN202011233469 A CN 202011233469A CN 112257653 A CN112257653 A CN 112257653A
- Authority
- CN
- China
- Prior art keywords
- space
- image
- decorated
- decoration effect
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000000694 effects Effects 0.000 title claims abstract description 171
- 238000005034 decoration Methods 0.000 title claims abstract description 145
- 238000000034 method Methods 0.000 title claims abstract description 63
- 238000003860 storage Methods 0.000 title claims abstract description 17
- 238000010586 diagram Methods 0.000 claims abstract description 75
- 238000009877 rendering Methods 0.000 claims abstract description 14
- 238000012549 training Methods 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 9
- 230000003042 antagnostic effect Effects 0.000 claims description 5
- 238000000605 extraction Methods 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims 1
- 230000006870 function Effects 0.000 description 21
- 238000012545 processing Methods 0.000 description 9
- 238000005070 sampling Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 5
- 238000013473 artificial intelligence Methods 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 230000000007 visual effect Effects 0.000 description 4
- 230000003190 augmentative effect Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 2
- 239000011521 glass Substances 0.000 description 2
- 238000011176 pooling Methods 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 241000052343 Dares Species 0.000 description 1
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000004043 dyeing Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/35—Categorising the entire scene, e.g. birthday party or wedding scene
- G06V20/36—Indoor scenes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T15/00—3D [Three Dimensional] image rendering
- G06T15/005—General purpose rendering architectures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computer Graphics (AREA)
- Processing Or Creating Images (AREA)
Abstract
本公开提供了一种空间装饰效果图确定方法、空间装饰效果图确定装置、计算机可读存储介质与电子设备,涉及计算机视觉技术领域。该空间装饰效果图确定方法包括:获取待装饰空间的图像集,根据所述图像集生成待装饰空间框架图;根据所述待装饰空间框架图和装饰风格数据集,获得空间装饰效果图数据集;获取目标效果图指示信息和观看位置信息,根据所述目标效果图指示信息和所述观看位置信息,从所述空间装饰效果图数据集提取相应的目标空间装饰效果图。本公开提高了渲染的效率,节约了空间装饰效果图制作的时间。
Description
技术领域
本公开涉及计算机视觉技术领域,尤其涉及一种空间装饰效果图确定方法、空间装饰效果图确定装置、计算机可读存储介质与电子设备。
背景技术
随着计算机视觉技术的不断发展,以增强现实(Augmented Reality,简称AR)为基础的AR空间装饰效果展示逐渐进入了公众的视野,并越来越受到用户的青睐。
举例而言,用户可以通过AR显示设备,在待装饰空间中,直接观看空间装饰后的效果图,而且可以根据自身喜好切换装饰效果图,以获得更多的家装体验。
然而,现有所用于AR空间装饰效果展示的三维效果图,是通过三维设计软件和渲染器对室内草图进行设计、修改和渲染而成。整个技术流程需要花费大量的时间,并且无法做到全方位、全角度的装饰效果展示。
发明内容
本公开提供了一种空间装饰效果图确定方法、空间装饰效果图确定装置、计算机可读存储介质与电子设备,进而至少在一定程度上改善相关技术中空间装饰效果图确定需要花费大量时间的问题。
根据本公开的第一方面,提供一种空间装饰效果图确定方法,包括:获取待装饰空间的图像集,根据所述图像集生成待装饰空间框架图;根据所述待装饰空间框架图和装饰风格数据集,获得空间装饰效果图数据集;获取目标效果图指示信息和观看位置信息,根据所述目标效果图指示信息和所述观看位置信息,从所述空间装饰效果图数据集提取相应的目标空间装饰效果图。
根据本公开的第二方面,提供一种空间装饰效果图确定装置,所述装置包括:框架图生成模块,用于获取待装饰空间的图像集,根据所述图像集生成待装饰空间框架图;效果图数据集确定模块,用于根据所述待装饰空间框架图和装饰风格数据集,获得空间装饰效果图数据集;效果图提取模块,用于获取目标效果图指示信息和观看位置信息,根据所述目标效果图指示信息和所述观看位置信息,从所述空间装饰效果图数据集提取相应的目标空间装饰效果图。
根据本公开的第三方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面的空间装饰效果图确定方法及其可能的实施方式。
根据本公开的第四方面,提供一种电子设备,包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行上述第一方面的空间装饰效果图确定方法及其可能的实施方式。
本公开的技术方案具有以下有益效果:
一方面,根据获取的待装饰空间的图像集可以直接生成待装饰空间框架图,相比于传统采用三维软件人为绘制三维框架图而言,可以节省人力,提高工作的效率。另一方面,根据待装饰空间框架图和装饰风格数据集,获得空间装饰效果图数据集,可以在待装饰空间框架图的基础上,同时进行装饰风格渲染,无需渲染器等工具,可以提高渲染的效率。再一方面,根据目标效果图指示信息和观看位置信息,从空间装饰效果图数据集提取相应的目标空间装饰效果图,便于用户获取需要的空间装饰效果图,达到一种“AR看房”的视觉体验,也能节约装饰的成本。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施方式,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出本示例性实施方式中一种空间装饰效果图确定方法及装置的示例性应用环境的系统架构的示意图;
图2示出本示例性实施方式中一种电子设备的计算机系统的结构示意图;
图3示出本示例性实施方式中空间装饰效果图确定方法的流程图;
图4示出本示例性实施方式中一种对抗网络模型示意图;
图5示出本示例性实施方式中一种U-Net结构的示意图;
图6示出本示例性实施方式中观看位置坐标示意图;
图7示出本示例性实施方式中的一种空间装饰效果图确定过程的流程示意图;
图8示出本示例性实施方式的一种空间装饰效果图确定装置的结构示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中,提供许多具体细节从而给出对本公开的实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而省略所述特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知技术方案以避免喧宾夺主而使得本公开的各方面变得模糊。
此外,附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的步骤。例如,有的步骤还可以分解,而有的步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。另外,下面所有的术语“第一”、“第二”仅是为了区分的目的,不应作为本公开内容的限制。
图1示出了可以应用本公开实施例的一种空间装饰效果图确定方法及装置的示例性应用环境的系统架构的示意图。
如图1所示,系统架构100可以包括终端设备101、102中的一个或多个,网络103和服务器104。网络103用以在终端设备101、102和服务器104之间提供通信链路的介质。终端设备101、102可以是具有显示屏的各种电子设备,终端设备101、102的显示屏上可以呈现由服务器104所获得的空间装饰效果图。
终端设备101、102包括但不限于便携式计算机、智能手机、平板电脑、AR(Augmented Reality,增强现实)眼镜、AR头盔等能够实现AR处理及AR显示功能的设备。应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。比如服务器104可以是多个服务器组成的服务器集群等。
在实现空间装饰效果图的显示过程中,终端设备101、102可以进行用户观看位置信息采集,以供服务器104根据当前用户的位置确定目标空间装饰效果图。
本公开所说的观看位置信息可以是终端设备101、102获取的待装饰空间的图像信息,例如,用户在所在位置通过终端设备101、102拍摄的空间照片;也可以是终端设备101、102在空间中的位置坐标信息,其中,位置坐标的参考坐标系可以是终端设备101、102进行定位时自身的坐标系,也可以是服务器104预先构建场景地图时所确定的坐标系。可以理解的是,针对终端设备101、102,往往需要利用预先构建的场景地图来完成定位。本公开对参考坐标系针对的是哪一个坐标系不做限制,只要确定出的位置坐标信息能够统一在同一坐标系即可。
在确定出终端设备101、102的位置信息后,服务器104可以将确定出的目标空间装饰效果图通过网络103发送给终端设备101、102,以供终端设备101、102呈现。
下面描述的空间装饰效果图确定方法的各个步骤应用于服务器104,也就是说,由服务器104执行空间装饰效果图确定方法的各个步骤。在这种情况下,空间装饰效果图确定装置设置于服务器104中。
图2示出了适于用来实现本公开实施例的电子设备的计算机系统的结构示意图。本公开示例性实施方式中终端设备101、102和服务器104中至少服务器104可以被配置为图2的形式。需要说明的是,图2示出的电子设备的计算机系统200仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图2所示,计算机系统200包括中央处理单元(CPU)201,其可以根据存储在只读存储器(ROM)202中的程序或者从存储部分208加载到随机访问存储器(RAM)203中的程序而执行各种适当的动作和处理。在RAM203中,还存储有系统操作所需的各种程序和数据。CPU201、ROM202以及RAM203通过总线204彼此相连。输入/输出(I/O)接口205也连接至总线204。
以下部件连接至I/O接口205:包括键盘、鼠标等的输入部分206;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分207;包括硬盘等的存储部分208;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分209。通信部分209经由诸如因特网的网络执行通信处理。驱动器210也根据需要连接至I/O接口205。可拆卸介质211,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器210上,以便于从其上读出的计算机程序根据需要被安装入存储部分208。
特别地,根据本公开的实施例,下文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分209从网络上被下载和安装,和/或从可拆卸介质211被安装。在该计算机程序被中央处理单元(CPU)201执行时,执行本申请的方法和装置中限定的各种功能。在一些实施例中,计算机系统200还可以包括AI(ArtificialIntelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
就本公开所述的空间装饰效果图确定方案而言,终端设备101、102在获取到待装饰空间的图像信息后传递给服务器104的中央处理单元(CPU)201,中央处理单元(CPU)201可以利用当前帧及其对应的深度信息,并结合预先构建的地图信息,确定终端设备101、102在待装饰控件中的位置。接下来,中央处理单元(CPU)201可以确定出与上述位置对应的目标空间装饰效果图。
现有的室内空间装饰设计一般需要依靠3D Max、Auto CAD、Sketch Up等设计软件和Brazil、VRay等渲染器来对室内草图进行设计、修改和渲染。例如:首先,设计师通过视觉设备对室内环境进行多角度拍摄,并对房型结构、墙面、门窗和房顶等位置进行标记。利用3D Max设计软件,在草图中添加家具,壁纸、灯饰等装饰素材,并对房屋色调按用户需求进行调整和修改。最后,利用渲染器对图像进行渲染出图,并根据用户需求进行渲染调整。整个技术流程的用时一般需要一周甚至更长的时间。
基于此,本公开实施例提供了一种基于人工智能的空间装饰效果图确定方法,以下将对本公开实施例的技术方案进行详细阐述:
本示例性实施方式中所提供的空间装饰效果图确定方法,主要用于空间的装饰方面,例如,室内空间的装饰等。基于人工智能技术可以将室内空间的装饰效果预先呈现在用户眼前,以供用户根据自己的喜欢选择实际装饰的方案,为用户提供了一种“AR(AugmentedReality,增强现实)看房”的视觉体验,也能节约装饰的成本。
下面结合图3对本公开示例性实施方式的空间装饰效果图确定方法进行具体说明。如图3所示,该空间装饰效果图确定方法可以包括:
步骤S310,获取待装饰空间的图像集,根据所述图像集生成待装饰空间框架图。
步骤S320,根据所述待装饰空间框架图和装饰风格数据集,获得空间装饰效果图数据集。
步骤S330,获取目标效果图指示信息和观看位置信息,根据所述目标效果图指示信息和所述观看位置信息,从所述空间装饰效果图数据集提取相应的目标空间装饰效果图。
该空间装饰效果图确定方法实现了以下技术效果:一方面,根据获取的待装饰空间的图像集可以直接生成待装饰空间框架图,相比于传统采用三维软件人为绘制三维框架图而言,可以节省人力,提高工作的效率。另一方面,根据待装饰空间框架图和装饰风格数据集,获得空间装饰效果图数据集,可以在待装饰空间框架图的基础上,同时进行装饰风格渲染,无需渲染器等工具,可以提高渲染的效率。再一方面,根据目标效果图指示信息和观看位置信息,从空间装饰效果图数据集提取相应的目标空间装饰效果图,便于用户获取需要的空间装饰效果图,达到一种“AR看房”的视觉体验,也能节约装饰的成本。
下面分别对每个步骤的实现过程进行具体说明:
在步骤S310中,获取待装饰空间的图像集,根据所述图像集生成待装饰空间框架图。
在实际应用中,可以通过多种方式获取待装饰空间的图像集。举例而言,可以利用照相机对待装饰空间进行多角度拍摄,获得多张图像以组成图像集。
本示例性实施方式中,可以先获取待装饰空间的视频流数据,然后根据视频流数据获取图像集。具体的,可以通过全景相机对待装饰空间进行全方位视频流数据采集,然后将该视频流数据上传至服务器104,其中,服务器104可以是云端计算平台。
服务器104在获取到上述视频流数据后,可以将该视频流数据解析为多个单帧图像,以获得待装饰空间的图像集,从而可以获得待装饰空间内部的任意方位和任意角度的图像,以便于全方位展示装饰效果图。
本示例性实施方式中,为了提高服务器104处理过程的速率和有效性,可以在将视频流数据解析为多个单帧图像之后,对多个单帧图像中的无效图像进行筛除,以获得参考图像。其中的无效图像指的是像素较低的不清楚图像,或者是拍摄角度错误的图像等,本示例性实施方式对此不作特殊限定。
本示例性实施方式中,在获取到待装饰空间的图像集之后,需要根据该图像集生成待装饰空间框架图,其中的待装饰空间框架图就是待装饰空间的内部结构图,例如,可以包括由墙体、地板和天花板等组成的内部结构,本示例性实施方式对此不作特殊限定。
本示例性实施方式中,根据图像集生成待装饰空间框架图具体可以包括:基于上述从图像集中筛选的参考图像,可以参照该参考图像确定生成图像;其中,生成图像是接近于参考图像的图像。为了判别生成图像与参考图像的区别,可以确定生成图像与参考图像的特征差值;其中,特征差值是指描述生成图像的特征与描述参考图像的特征的信息之间的差值,例如,形状、颜色等特征,其可以表现为向量、矩阵或者其他形式。同时,生成图像的特征与描述参考图像的特征可以通过卷积神经网络(例如ResNet、Inception等)模型或其他特征提取模型从染色图像中提取得到;这同样属于本公开的保护范围。
在获取到特征差值后,可以根据参考图像、生成图像以及特征差值调整生成图像,以使得生成图像更加接近于参考图像,最终获得反映真实空间结构的待装饰空间框架图。
在实际应用中,实现上述的通过参考图像生成待装饰空间框架图的模型可以有多种,在本示例性实施方式中,以对抗网络模型为例进行说明。利用对抗网络模型来执行根据图像集生成待装饰空间框架图。
参考图4,示出了本示例性实施方式所示的一种对抗网络模型示意图;如图4所示,对抗网络模型包括生成器401和判别器402;其中,生成器401和判别器402可以为卷积神经网络模型、残差网络模型,还可以为如LinkNet、DenseNet、U-Net等网络模块;本示例性实施例中对此不作特殊限定。
在实际应用中,生成器401通过捕获参考图像的分布,来随机产生一种“伪图像”,即生成图像,以供判别器402对“伪图像”和参考图像进行判别。
本示例性实施方式中,生成器401可以为深度学习网络,以Encoder-Decoder(编码-解码)的模型结构为骨干网络。其中,编码就是将输入序列转化成一个固定长度的向量;解码就是将之前生成的固定向量再转化成输出序列,从而达到输入参考图像生成生成图像。其中,Encoder-Decoder包含了如图5所示的U-Net结构。
其中,U-Net结构提供了多次上采样架构和下采样架构。下采样的采样过程可以捕捉语义信息,即像素信息,与之对应的上采样过程可以进行精确地定位。U-Net结构可以利用非常少的图像进行端到端的训练,并获得较好的模型。
U-Net结构将输入图像进行2次3*3的卷积操作之后,进行一次2*2的最大池化,同时使卷积核数目进行翻倍,例如,卷积数目可以为1、64、128、256、512和1024。执行4次上述操作,即可完成对输入图像的4次下采样。然后进行2次3*3的卷积操作,取一半的卷积核进行上采样(也称为转置卷积),并剪切对应下采样层的特征图与上采样的特征图进行拼接。最后,输出U-Net生成的图像并进行训练。
在训练过程中,U-Net使用的是带有边界权值的损失函数:
对抗网络模型中的判别器402的主要任务是分辨生成器401生成的“伪图像”与真实图像之间的区别,即生成图像与参考图像的差别。可以通过判别器402确定出生成图像与参考图像的特征差值。也就是说,判别器402主要用于对生成器401输出的生成图像与参考图像进行判别,如果判别器402有效,但无法区分生成图像与参考图像,则说明生成器401生成的图像可以满足要求。本示例性实施方式中,判别器402可以为卷积神经网络;举例而言,该卷积神经网络可以包括输入层、卷积层、池化层以及全连接层。
本示例性实施方式中,判别器402的骨干网络为残差神经网络ResNet50,如表1所示。该ResNet50网络总共有50层网络层数,每个卷积块都会包括有一个残差块,用以防止梯度爆炸和消失的问题,以解决随着网络加深,准确率下降的问题。
表1
判别器402的具体流程为:将生成器401输出的生成图像和真实的参考图像分别输入到上述ResNet50网络中,并最后分别输出各自的高维特征图,其中,高维特征图的大小可以为7*7*2048。
在训练过程中,可以采用损失函数来评判生成图像的特征图和参考图像的特征图之间的差别。本示例性实施方式中,可以采用多种方式计算损失函数。例如,本示例性实施方式中可以采用感知损失函数Perceptual Loss来表示判别器402的损失函数,即:
其中,和φj(y)分别表示真实的参考图像和生成器的生成图像经过ResNet50输出的特征图;Cj,Hj,Wj分别表示特征图的维度,可选的,Cj,Hj,Wj可以分别为2048,7,7;表示计算的是两个特征图之间的L2范数距离,也称为欧式距离。再例如,本示例实施方式中还可以采用损失函数Squaring Loss、Hinge Loss、Contrastive Loss等其他损失函数表示判别器402的损失函数,且本示例性实施例中并不以此为限。
在实际操作中,可以根据损失函数修正对抗网络模型,直至损失函数达到目标值。在修正过程中,如果损失函数没有达到目标值时,可以进行反向传播,利用梯度下降等优化算法对对抗网络模型中的生成器401和判别器402的参数分别进行修正,直至损失函数达到目标值。
在整个迭代训练过程中,生成器401不断努力让生成的图像越来越像真的,而判别器402则不断努力识别出图像之间的真假。随着反复训练至结束,生成器401生成的生成图像非常接近于真实的参考图像,而判别器402已经无法识别出真假图像之间的区别。此时,对抗网络模型已经可以从图像集生成待装饰空间框架图。
在完成利用对抗网络模型生成待装饰空间框架图之后,还需要根据待装饰空间框架图和装饰风格数据集,获得空间装饰效果图数据集。
本示例性实施方式中,利用装饰风格数据集对上述对抗网络模型进行训练,获得空间装饰风格图;将空间装饰风格图渲染在待装饰空间框架图上,获得空间装饰效果图数据集。其中,装饰风格数据集可以是现有的MegaDepth、NYU和InLoc等公开的数据集,也可以是设计师自己设计的作品数据集;通过将上述数据集输入到对抗网络模型中,对对抗网络模型中的生成器401和判别器402进行迭代训练,获得包含中式、欧式、美式等多种装饰风格的空间装饰效果图数据集。
在实际训练过程中,训练参数可以采用多种算法获得,例如,Mini-batch更新模型参数和Adam算法等。并且在训练过程中可以设置训练学习率为0.01,设置训练步数为50万步数。如果需要对对抗网络模型进行精细训练,增加网络的泛化能力,可以将训练学习率减小为0.001,以防止对抗网络模型过拟合。
接着,对训练后的对抗网络模型进行测试,并根据测试结果微调训练参数,直至获得的渲染后的空间装饰效果图符合实际效果。在完成上述步骤后,可以将对抗网络模型结构和参数进行固化,生成文件传输给服务器104,例如云端服务器进行适配,以供终端设备101、102进行调用和出图。
需要说明的是,生成空间装饰效果图数据集的服务器和接收生成文件的服务器可以是同一个服务器,也可以是不同的服务器,本示例性实施方式对此不作限定。
在获得空间装饰效果图数据集后,为了便于终端设备101、102调用需要的目标空间装饰效果图。本示例性实施方式还包括:获取目标效果图指示信息和观看位置信息,根据目标效果图指示信息和观看位置信息,从空间装饰效果图数据集提取相应的目标空间装饰效果图。
具体地,获取目标效果图指示信息和图像展示设备的初始观看位置信息,根据目标效果图指示信息和初始观看位置信息,从空间装饰效果图数据集提取相应的空间装饰效果图视频流数据。此处的图像展示设备可以是手机、AR眼镜等具有AR展示功能的终端设备。
在用户进入待装饰空间后,可以通过上述终端设备确定想要观看的装饰风格的空间装饰效果图,终端设备会生成目标效果图指示信息,上传给服务器;另外,终端设备会指示用户在待装饰空间内拍摄一张图片,并将该图片作为初始观看位置图像上传给服务器。服务器在获取到目标效果图指示信息后,会调取相应的装饰风格的空间装饰效果图视频流数据;并根据初始观看位置图像将空间装饰效果图视频流数据与用户所在的待装饰空间进行匹配,并将匹配好的数据传输给终端设备,用户可以通过终端设备观看所展示的装饰效果图。
在用户观看装饰效果图的过程中,会根据需要改变自身的位置,此时,服务器可以通过用户获取到当前观看位置信息,并根据该当前观看位置信息从空间装饰效果图视频流数据中提取目标空间装饰效果图,进行展示。从而可以达到随着用户的走动,实时展示相应空间的装饰效果图的目的,以提升AR看房的真实感。
本示例性实施方式中,获取当前观看位置信息可以是获取终端设备相对于待装饰空间的位置坐标信息;根据该位置坐标信息,从上述空间装饰效果图视频流数据中提取目标空间装饰效果图。其中,如图6所示,位置坐标信息可以包括位置坐标(x,y)和观看角度坐标θ等。
在实际应用中,终端设备可以不断获取自身相对于待装饰空间的位置坐标信息,上传到服务器中,以供服务器调整所展示的空间装饰效果图。
参照图7,示出了本示例性实施方式的一种空间装饰效果图确定过程的流程示意图;如图7所示,步骤S710,可以通过全景相机等采集待装饰空间的图像集;步骤S720,通过对抗网络模型获取空间装饰效果图数据集;步骤S730,将空间装饰效果图数据集上传至云端等服务器,服务器存储;步骤S740,终端设备获取目标效果图指示信息和观看位置信息,上传至服务器;步骤S750,终端设备从服务器下载获取目标空间装饰效果图;步骤S760,终端设备呈现目标空间装饰效果图;步骤S770,终端设备获取当前观看位置信息,并上传至服务器,并从服务器中重新下载目标空间装饰效果图进行展示,如此循环,直到用户完成AR看房的任务为止。
综上所述,本示例性实施方式提供的一种空间装饰效果图确定方法及AR看房技术,属于计算机视觉领域,为用户实时、全方位地展示了室内装饰渲染效果。该空间装饰效果图确定过程无需依靠任何商用设计软件和渲染器,节约了人力成本和软件成本。所使用的对抗网络模型能快速地生成控件装饰渲染效果图,替代了当前繁重的3D渲染器渲染流程,将近一周的制作周期变成实时呈现。另外,本示例性实施方式使用全景相机采集房屋视频流,可对用户所敢兴趣的任意位置和角度进行装饰渲染效果展示,并实现了实时跟踪用户兴趣位置。
应当注意,尽管在附图中以特定顺序描述了本公开中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。
本公开的示例性实施方式还提供一种空间装饰效果图确定装置。如图8所示,该空间装饰效果图确定装置800可以包括:
框架图生成模块810,用于获取待装饰空间的图像集,根据所述图像集生成待装饰空间框架图;
效果图数据集确定模块820,用于根据所述待装饰空间框架图和装饰风格数据集,获得空间装饰效果图数据集;
效果图提取模块830,用于获取目标效果图指示信息和观看位置信息,根据所述目标效果图指示信息和所述观看位置信息,从所述空间装饰效果图数据集提取相应的目标空间装饰效果图。
上述装置中各部分的具体细节在方法部分实施方式中已经详细说明,因而不再赘述。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
需要说明的是,本公开所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该电子设备执行时,使得该电子设备实现上述实施例中所述的方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其他实施方式。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施方式仅被视为示例性的,本公开的真正范围和精神由权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限定。
Claims (10)
1.一种空间装饰效果图确定方法,其特征在于,包括:
获取待装饰空间的图像集,根据所述图像集生成待装饰空间框架图;
根据所述待装饰空间框架图和装饰风格数据集,获得空间装饰效果图数据集;
获取目标效果图指示信息和观看位置信息,根据所述目标效果图指示信息和所述观看位置信息,从所述空间装饰效果图数据集提取相应的目标空间装饰效果图。
2.根据权利要求1所述的空间装饰效果图确定方法,其特征在于,根据所述图像集生成待装饰空间框架图,包括:
从所述图像集中筛选参考图像,参照所述参考图像确定生成图像;
确定所述生成图像与所述参考图像的特征差值;
根据所述参考图像、所述生成图像以及所述特征差值调整所述生成图像获得所述待装饰空间框架图。
3.根据权利要求2所述的空间装饰效果图确定方法,其特征在于,根据所述待装饰空间框架图和装饰风格数据集,获得空间装饰效果图数据集,包括:
利用对抗网络模型执行根据所述图像集生成待装饰空间框架图;
利用所述装饰风格数据集对所述对抗网络模型进行训练,获得空间装饰风格图;
将所述空间装饰风格图渲染在所述待装饰空间框架图上,获得所述空间装饰效果图数据集。
4.根据权利要求3所述的空间装饰效果图确定方法,其特征在于,所述对抗网络模型包括生成器和判别器;利用对抗网络模型执行根据所述图像生成待装饰空间框架图包括:
通过所述生成器参照所述参考图像确定生成图像;
通过所述判别器确定所述生成图像与所述参考图像的特征差值,并根据所述参考图像、所述生成图像以及所述特征差值调整所述生成图像获得所述待装饰空间框架图。
5.根据权利要求1所述的空间装饰效果图确定方法,其特征在于,所述观看位置信息包括初始观看位置信息和当前观看位置信息,其中,获取目标效果图指示信息和观看位置信息,根据所述目标效果图指示信息和所述观看位置信息,从所述空间装饰效果图数据集提取相应的目标空间装饰效果图,包括:
获取目标效果图指示信息和图像展示设备的初始观看位置信息,根据所述目标效果图指示信息和所述初始观看位置信息,从所述空间装饰效果图数据集提取相应的空间装饰效果图视频流数据;
获取所述图像展示设备的当前观看位置信息,根据所述当前观看位置信息从所述空间装饰效果图视频流数据中提取目标空间装饰效果图。
6.根据权利要求5所述的空间装饰效果图确定方法,其特征在于,获取目标效果图指示信息和图像展示设备的初始观看位置信息,根据目标效果图指示信息和所述初始观看位置信息,从所述空间装饰效果图数据集提取相应的空间装饰效果图视频流数据,包括:
获取所述图像展示设备提供的所述目标效果图指示信息和所述待装饰空间的初始观看位置图像;
根据所述目标效果图指示信息,从所述空间装饰效果图数据集提取目标空间装饰效果图视频流数据;
根据所述初始观看位置图像,将所述目标空间装饰效果图视频流数据与所述待装饰空间进行匹配。
7.根据权利要求5所述的空间装饰效果图确定方法,其特征在于,获取所述图像展示设备的当前观看位置信息,根据所述当前观看位置信息从所述空间装饰效果图视频流数据中提取目标空间装饰效果图,包括:
获取所述图像展示设备相对于所述待装饰空间的位置坐标信息;
根据所述位置坐标信息,从所述空间装饰效果图视频流数据中提取目标空间装饰效果图。
8.一种空间装饰效果图确定装置,其特征在于,所述装置包括:
框架图生成模块,用于获取待装饰空间的图像集,根据所述图像集生成待装饰空间框架图;
效果图数据集确定模块,用于根据所述待装饰空间框架图和装饰风格数据集,获得空间装饰效果图数据集;
效果图提取模块,用于获取目标效果图指示信息和观看位置信息,根据所述目标效果图指示信息和所述观看位置信息,从所述空间装饰效果图数据集提取相应的目标空间装饰效果图。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7任一项所述的空间装饰效果图确定方法。
10.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1至7任一项所述的空间装饰效果图确定方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011233469.1A CN112257653A (zh) | 2020-11-06 | 2020-11-06 | 空间装饰效果图确定方法、装置、存储介质与电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011233469.1A CN112257653A (zh) | 2020-11-06 | 2020-11-06 | 空间装饰效果图确定方法、装置、存储介质与电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112257653A true CN112257653A (zh) | 2021-01-22 |
Family
ID=74266457
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011233469.1A Pending CN112257653A (zh) | 2020-11-06 | 2020-11-06 | 空间装饰效果图确定方法、装置、存储介质与电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112257653A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113204829A (zh) * | 2021-06-07 | 2021-08-03 | 东易日盛家居装饰集团股份有限公司 | 一种基于神经网络的家装场景设计方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107168672A (zh) * | 2017-05-15 | 2017-09-15 | 上海驹旗网络科技有限公司 | 显示方法和装置 |
CN107770233A (zh) * | 2016-08-23 | 2018-03-06 | 周振华 | 一种装修过程管控方法及装置 |
US20200120330A1 (en) * | 2018-03-08 | 2020-04-16 | Richard N. Berry | System & method for providing a simulated environment |
CN111402112A (zh) * | 2020-03-09 | 2020-07-10 | 北京字节跳动网络技术有限公司 | 图像处理方法、装置、电子设备及计算机可读介质 |
CN111589156A (zh) * | 2020-05-20 | 2020-08-28 | 北京字节跳动网络技术有限公司 | 图像处理方法、装置、设备及计算机可读存储介质 |
-
2020
- 2020-11-06 CN CN202011233469.1A patent/CN112257653A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107770233A (zh) * | 2016-08-23 | 2018-03-06 | 周振华 | 一种装修过程管控方法及装置 |
CN107168672A (zh) * | 2017-05-15 | 2017-09-15 | 上海驹旗网络科技有限公司 | 显示方法和装置 |
US20200120330A1 (en) * | 2018-03-08 | 2020-04-16 | Richard N. Berry | System & method for providing a simulated environment |
CN111402112A (zh) * | 2020-03-09 | 2020-07-10 | 北京字节跳动网络技术有限公司 | 图像处理方法、装置、电子设备及计算机可读介质 |
CN111589156A (zh) * | 2020-05-20 | 2020-08-28 | 北京字节跳动网络技术有限公司 | 图像处理方法、装置、设备及计算机可读存储介质 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113204829A (zh) * | 2021-06-07 | 2021-08-03 | 东易日盛家居装饰集团股份有限公司 | 一种基于神经网络的家装场景设计方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114119849B (zh) | 三维场景渲染方法、设备以及存储介质 | |
CN106910247B (zh) | 用于生成三维头像模型的方法和装置 | |
US11189043B2 (en) | Image reconstruction for virtual 3D | |
US20180276882A1 (en) | Systems and methods for augmented reality art creation | |
CN113822977A (zh) | 图像渲染方法、装置、设备以及存储介质 | |
CN114631127A (zh) | 说话头的小样本合成 | |
KR102612529B1 (ko) | 신규 뷰 합성을 위한 신경 블렌딩 | |
CN115690382B (zh) | 深度学习模型的训练方法、生成全景图的方法和装置 | |
US20230368459A1 (en) | Systems and methods for rendering virtual objects using editable light-source parameter estimation | |
CN114549722A (zh) | 3d素材的渲染方法、装置、设备及存储介质 | |
US20230206511A1 (en) | Methods, systems, and media for generating an immersive light field video with a layered mesh representation | |
CN112598780A (zh) | 实例对象模型构建方法及装置、可读介质和电子设备 | |
CN115100337A (zh) | 一种基于卷积神经网络的全身人像视频重照明方法和装置 | |
CN113012270A (zh) | 一种立体显示的方法、装置、电子设备及存储介质 | |
CN112381707A (zh) | 图像生成方法、装置、设备以及存储介质 | |
CN115661320A (zh) | 图像处理方法及电子设备 | |
US20220222842A1 (en) | Image reconstruction for virtual 3d | |
CN114358112A (zh) | 视频融合方法、计算机程序产品、客户端及存储介质 | |
CN112257653A (zh) | 空间装饰效果图确定方法、装置、存储介质与电子设备 | |
JP7476511B2 (ja) | 画像処理システム、画像処理方法及びプログラム | |
CN117058343A (zh) | 一种基于nerf的vr看展方法、系统、电子设备和存储介质 | |
CN111192305B (zh) | 用于生成三维图像的方法和装置 | |
CN116708862A (zh) | 直播间的虚拟背景生成方法、计算机设备及存储介质 | |
US20230122149A1 (en) | Asymmetric communication system with viewer position indications | |
CN111243099A (zh) | 一种处理图像的方法和装置以及在ar设备中显示图像的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |