CN113449122B

CN113449122B - 一种三维场景图的解说内容生成方法和装置

Info

Publication number: CN113449122B
Application number: CN202110779169.1A
Authority: CN
Inventors: 许玲
Original assignee: Guangzhou Haochuan Network Technology Co ltd
Current assignee: Guangzhou Haochuan Network Technology Co ltd
Priority date: 2021-07-09
Filing date: 2021-07-09
Publication date: 2023-01-17
Anticipated expiration: 2041-07-09
Also published as: CN113449122A

Abstract

本发明提供一种三维场景图的解说内容生成方法和装置，所述方法包括:获取平面场景图像，并将平面场景图像转化为三维场景图像；然后识别三维场景图像中的所有场景，生成每一场景的锚点坐标；然后将每一场景与数据库的场景进行相似度匹配，并基于最优相似度选定对应的解说词；然后将每一场景的锚点坐标和解说词输入人工智能模型进行综合训练，并获得训练结果；最后将三维场景图像、锚点坐标、解说词和训练结果进行融合，生成三维场景图像的完整解说内容。本发明能够自动编辑生成三维场景图像，无需人工编辑，减少人工成本，提高了三维场景图像的生成效率；同时为三维场景图像智能匹配对应的解说内容，为用户提供智能解说，提高用户的观看体验。

Description

一种三维场景图的解说内容生成方法和装置

技术领域

本发明属于图像处理技术领域，具体涉及一种三维场景图的解说内容生成方法和装置。

背景技术

目前，随着计算机图形图像处理技术的快速发展，由于三维虚拟场景可以将平面场景图片形象生动地再现为现实场景，能够给人们带来了良好的视觉效果和体验，从而在三维可视化技术领域得到了广泛的运用。

现有技术中，在制作带有解说功能的三维场景图像时，通常是将获取到的二维场景图片进行手动剪切，然后人工锚点，最后为某些场景适配对应的人工解说，整个过程操作十分麻烦，费时费力，人工成本过高。

发明内容

本发明的目的是提供一种三维场景图的解说内容生成方法和装置，用于解决现有技术中存在的至少一个问题。

为了实现上述目的，本发明采用以下技术方案：

第一方面，本发明提供一种三维场景图的解说内容生成方法，包括：

获取平面场景图像，并将所述平面场景图像转化为三维场景图像；

识别所述三维场景图像中的所有场景，生成每一场景的锚点坐标；

将每一场景与数据库的场景进行相似度匹配，并基于最优相似度选定对应的解说词；

将每一场景的锚点坐标和解说词输入人工智能模型进行综合训练，并获得训练结果；

将所述三维场景图像、所述锚点坐标、所述解说词和所述训练结果进行融合，生成所述三维场景图像的完整解说内容。

在一种可能的设计中，还包括：

将所述训练结果、所述锚点坐标和所述解说词导入虚拟机器人中。

在一种可能的设计中，还包括：

接收图像解说指令，在所述三维场景图像中展示所述虚拟机器人，并通过所述虚拟机器人对所述三维场景图像进行导引和解说。

在一种可能的设计中，将所述平面场景图像转化为三维场景图像，包括：

基于畸变算法模型将所述平面场景图像变形为三维场景图像。

在一种可能的设计中，将所述平面场景图像转化为三维场景图像之后，还包括：

将所述三维场景图像投影在二维平面上获得二维图片；

按比例切割所述二维图片得到多个切片，并将每一切片按比例参数进行保存。

在一种可能的设计中，识别所述三维场景图像中的所有场景，生成每一场景的锚点坐标，包括：

将每一切片转化为四维的矩阵数据；

将所述矩阵数据与数据库中的场景数据进行相似度匹配，当相似度超过阈值时，判定该切片中的场景为数据库中已有的场景；

基于每一场景在所述三维场景图像中的绝对位置生成位置锚点，并基于每一场景相互之间的位置关系生成关系锚点。

在一种可能的设计中，所述训练结果包括：所述三维场景图像中各个场景的调用顺序以及各个场景的解说词的调用顺序。

第二方面，本发明提供一种三维场景图的解说内容生成装置，包括：

图像转化模块，用于获取平面场景图像，并将所述平面场景图像转化为三维场景图像；

场景识别与锚点生成模块，用于识别所述三维场景图像中的所有场景，生成每一场景的锚点坐标；

解说词选定模块，用于将每一场景与数据库的场景进行相似度匹配，并基于最优相似度选定对应的解说词；

训练结果获取模块，用于将每一场景的锚点坐标和解说词输入人工智能模型进行综合训练，并获得训练结果；

完整内容生成模块，用于将所述三维场景图像、所述锚点坐标、所述解说词和所述训练结果进行融合，生成所述三维场景图像的完整解说内容。

在一种可能的设计中，还包括：

数据导入模块，用于将所述训练结果、所述锚点坐标和所述解说词导入虚拟机器人中。

在一种可能的设计中，还包括：

引导和解说模块，用于接收图像解说指令，在所述三维场景图像中展示所述虚拟机器人，并通过所述虚拟机器人对所述三维场景图像进行导引和解说。

在一种可能的设计中，在将所述平面场景图像转化为三维场景图像，所述图像转化模块具体用于：

在一种可能的设计中，所述装置还包括：

二维图片获取模块，用于将所述三维场景图像投影在二维平面上获得二维图片；

切片保存模块，用于按比例切割所述二维图片得到多个切片，并将每一切片按比例参数进行保存。

在一种可能的设计中，在识别所述三维场景图像中的所有场景，生成每一场景的锚点坐标时，所述场景识别与锚点生成模块具体用于：

将每一切片转化为四维的矩阵数据；

第三方面，本发明提供一种计算机设备，包括依次通信相连的存储器、处理器和收发器，其中，所述存储器用于存储计算机程序，所述收发器用于收发消息，所述处理器用于读取所述计算机程序，执行如第一方面任意一种可能的设计中所述的基于裸眼VR的视频播放方法。

第四方面，本发明提供一种计算机可读存储介质，所述计算机可读存储介质上存储有指令，当所述指令在计算机上运行时，执行如第一方面任意一种可能的设计中所述的三维场景图的解说内容生成方法。

第五方面，本发明提供一种包含指令的计算机程序产品，当所述指令在计算机上运行时，使所述计算机执行如第一方面任意一种可能的设计中所述的三维场景图的解说内容生成方法。

有益效果：

1.本发明通过获取平面场景图像，并将所述平面场景图像转化为三维场景图像；然后识别所述三维场景图像中的所有场景，生成每一场景的锚点坐标；然后将每一场景与数据库的场景进行相似度匹配，并基于最优相似度选定对应的解说词；然后将每一场景的锚点坐标和解说词输入人工智能模型进行综合训练，并获得训练结果；最后将所述三维场景图像、所述锚点坐标、所述解说词和所述训练结果进行融合，生成所述三维场景图像的完整解说内容。本发明能够自动编辑生成三维场景图像，无需人工编辑，减少人工成本，提高了三维场景图像的生成效率；同时为三维场景图像智能匹配对应的解说内容，为用户提供智能引导和解说，提高用户的观看体验。

2.本发明以虚拟机器人作为载体，利用虚拟机器人引导和解说三维场景图像，增强三维场景图像与用户之间的交互，提高用户体验。

附图说明

图1为本发明提供的三维场景图的解说内容生成方法的流程图；

图2为本发明提供的三维场景图的解说内容生成装置的结构框图。

具体实施方式

为使本说明书实施例的目的、技术方案和优点更加清楚，下面将结合本说明书实施例中的附图，对本说明书实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本说明书一部分实施例，而不是全部的实施例。

实施例

第一方面，如图1所示，本实施例提供一种三维场景图的解说内容生成方法，包括但不限于由步骤S101～S105实现：

步骤S101.获取平面场景图像，并将所述平面场景图像转化为三维场景图像；

其中，需要说明的是，获取平面场景图像可以是通过图像采集装置采集平面场景图像，其中，所述图像采集装置包括：摄像装置和扫描装置，例如高清相机、高清摄像机、结构光扫描装置和线激光扫描装置等。

其中，需要说明的是，通过获取平面场景图像，能够获取到图像的几何信息，包括但不限于几何形状的类型和几何形状的图案等；还能获取到图像的内容信息，包括但不限于颜色信息、纹理信息和文字信息等。

作为步骤S101一个可选的实施方式，将所述平面场景图像转化为三维场景图像，包括：

基于畸变算法模型将所述平面场景图像变形为三维场景图像；其中，通过畸变算法将二维的平面场景图像变形为具有360度的三维场景图像，能够获得场景图像的立体图，在获得三维场景图像之后，所述方法还包括：

将所述三维场景图像投影在二维平面上获得二维图片；优选的，在获得二维图片之后，将所述二维图片进行保存；

按比例切割所述二维图片得到多个切片，并将每一切片按比例参数进行保存；优选的，将切片按比例参数进行保存时，可以将切片按比例参数保存在xml文件中。

作为步骤S102.识别所述三维场景图像中的所有场景，生成每一场景的锚点坐标；

其中，需要说明的是，可以利用人工智能模型识别所述三维场景图像的所有场景，例如，该三维场景图像可以是商品房的全景图，则包括客厅，卧室，卫生间和厨房等场景；具体包括：

步骤S102a.将每一切片转化为四维的矩阵数据；

步骤S102b.将所述矩阵数据与数据库中的场景数据进行相似度匹配，当相似度超过阈值时，判定该切片为数据库中已有的场景；

其中，在数据库中存储有现有的所有场景数据，将所述矩阵数据与数据库中的场景数据进行相似度匹配时，可以基于该矩阵数据与数据库中的场景数据的相似度，判断该切片中是否包含数据库有已有的数据；其中，所述阈值可以设定为80％、85％、90％或95％等，具体不做限定，优选的为80％。

步骤S102c.基于每一场景在所述三维场景图像中的绝对位置生成位置锚点，并基于每一场景相互之间的位置关系生成关系锚点。

其中，人工智能模型在分析切片数据时，会分析各个场景所在的位置以及各个场景相互的位置关系，从而根据各个场景在三维场景图像中的绝对位置生成位置锚点，并根据各个场景之间的位置关系生成关系锚点；例如：客厅和卧室是左右关系，当前场景是客厅，根据此关系可以建立一个向右的箭头，用户点击该箭头即可跳转到卧室。

步骤S103.将每一场景与数据库的场景进行相似度匹配，并基于最优相似度选定对应的解说词；

其中，人工智能模型在识别出场景后，可赋予每一场景唯一的ID，则基于场景ID到数据库中查找匹配，即可获取对应的解说词。

步骤S104.将每一场景的锚点坐标和解说词输入人工智能模型进行综合训练，并获得训练结果；

其中，需要说明的是，只有锚点坐标和解说词文本的情况下，尚无法根据根据相应场景做出最恰当的解说，因为场景的不同、场景之间的相互关系不同或者解说词顺序也会出现不同情况的解说内容；因此，需要基于人工智能模型进行一定数量的训练，才会对不同场景的解说，场景之间转换的解说以及不同场景不同语音做出正确选择；其中，训练获得的结果数据，可以保存在data文件中。

其中，需要说明的是，所述训练结果包括：所述三维场景图像中各个场景的调用顺序以及各个场景的解说词的调用顺序。

在步骤S104一个可选的实施方式中，在获得训练结果后，还包括：

步骤S105.将所述三维场景图像、所述锚点坐标、所述解说词和所述训练结果进行融合，生成所述三维场景图像的完整解说内容。

其中，需要说明的是，训练结果包含对三维场景图像各个场景的调用顺序和解说词的调用顺序，锚点数据包含三维场景图像各场景的位置和关系；通过根据各数据的交叉关系进行顺序调用，能够获取最合适的解说内容；其中的顺序关系和组织关系可以以数据的格式保存，供虚拟机器人出场解说时调用，则在一种可能的设计中，还包括：

基于上述公开的内容，能够自动编辑生成三维场景图像，无需人工编辑，减少人工成本，提高了三维场景图像的生成效率；同时为三维场景图像智能匹配对应的解说内容，为用户提供智能引导和解说，提高用户的观看体验；此外，以虚拟机器人作为载体，利用虚拟机器人引导和解说三维场景图像，增强三维场景图像与用户之间的交互，提高用户体验。

第二方面，如图2所示，本发明提供一种三维场景图的解说内容生成装置，包括：

在一种可能的设计中，还包括：

在一种可能的设计中，所述装置还包括：

切片保存模块，用于按比例切割所述二维图片得到多个场景切片，并将每一场景切片按比例参数进行保存。

将每一场景转化为四维的矩阵场景数据；

将所述矩阵场景数据与数据库中的场景数据进行相似度匹配，当相似度超过阈值时，判定该场景为数据库中已有的场景；

本实施例第二方面提供的装置的工作过程、工作细节和技术效果，可以参见实施例第一方面，于此不再赘述。

第三方面，本发明提供一种计算机设备，包括依次通信相连的存储器、处理器和收发器，其中，所述存储器用于存储计算机程序，所述收发器用于收发消息，所述处理器用于读取所述计算机程序，执行如第一方面任意一种可能的设计中所述的三维场景图的解说内容生成方法。

具体举例的，所述存储器可以但不限于包括随机存取存储器(Random-AccessMemory，RAM)、只读存储器(Read-Only Memory，ROM)、闪存(Flash Memory)、先进先出存储器(First Input First Output，FIFO)和/或先进后出存储器(First Input Last Output，FILO)等等；所述收发器可以但不限于为WiFi(无线保真)无线收发器、蓝牙无线收发器、GPRS(General Packet Radio Service，通用分组无线服务技术)无线收发器和/或ZigBee(紫蜂协议，基于IEEE802.15.4标准的低功耗局域网协议)无线收发器等；所述处理器可以不限于采用型号为STM32F105系列的微处理器。

本实施例第三方面提供的装置的工作过程、工作细节和技术效果，可以参见实施例第一方面，于此不再赘述。

第四方面，本发明提供一种计算机可读存储介质，所述计算机可读存储介质上存储有指令，当所述指令在计算机上运行时，执行如第一方面任意一种可能的设计中所述的三维场景图的解说内容生成方法。其中，所述可读存储介质是指存储数据的载体，可以但不限于包括软盘、光盘、硬盘、闪存、优盘和/或记忆棒(Memory Stick)等，所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。

本实施例第四方面提供的装置的工作过程、工作细节和技术效果，可以参见实施例第一方面，于此不再赘述。

第五方面，本发明提供一种包含指令的计算机程序产品，当所述指令在计算机上运行时，使所述计算机执行如第一方面任意一种可能的设计中所述的三维场景图的解说内容生成方法。其中，所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。

本实施例第五方面提供的装置的工作过程、工作细节和技术效果，可以参见实施例第一方面，于此不再赘述。

最后应说明的是：以上所述仅为本发明的优选实施例而已，并不用于限制本发明的保护范围。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种三维场景图的解说内容生成方法，其特征在于，包括：

将所述三维场景图像、所述锚点坐标、所述解说词和所述训练结果进行融合，生成所述三维场景图像的完整解说内容；

将所述平面场景图像转化为三维场景图像之后，还包括：

将所述三维场景图像投影在二维平面上获得二维图片；

按比例切割所述二维图片得到多个切片，并将每一切片按比例参数进行保存；

识别所述三维场景图像中的所有场景，生成每一场景的锚点坐标，包括：

将每一切片转化为四维的矩阵数据；

基于每一场景在所述三维场景图像中的绝对位置生成位置锚点，并基于每一场景相互之间的位置关系生成关系锚点；

其中，每一场景对应有唯一的ID，基于场景ID到数据库中查找匹配，获取对应的解说词。

2.根据权利要求1所述的三维场景图的解说内容生成方法，其特征在于，还包括：

3.根据权利要求2所述的三维场景图的解说内容生成方法，其特征在于，还包括：

4.根据权利要求1所述的三维场景图的解说内容生成方法，其特征在于，

将所述平面场景图像转化为三维场景图像，包括：

5.根据权利要求1所述的三维场景图的解说内容生成方法，其特征在于，所述训练结果包括：所述三维场景图像中各个场景的调用顺序以及各个场景的解说词的调用顺序。

6.一种三维场景图的解说内容生成装置，其特征在于，包括：

完整内容生成模块，用于将所述三维场景图像、所述锚点坐标、所述解说词和所述训练结果进行融合，生成所述三维场景图像的完整解说内容；

将所述平面场景图像转化为三维场景图像之后，还包括：

将所述三维场景图像投影在二维平面上获得二维图片；

将每一切片转化为四维的矩阵数据；

7.根据权利要求 6所述的三维场景图的解说内容生成装置，其特征在于，还包括：

8.根据权利要求7所述的三维场景图的解说内容生成装置，其特征在于，还包括：