CN111461250A

CN111461250A - 一种街景模型生成方法、装置、系统及存储介质

Info

Publication number: CN111461250A
Application number: CN202010275032.8A
Authority: CN
Inventors: 姜男; 熊鑫; 刘浏
Original assignee: Shanghai Chengshi Information Technology Co ltd
Current assignee: Shanghai Chengshi Information Technology Co ltd
Priority date: 2020-04-09
Filing date: 2020-04-09
Publication date: 2020-07-28

Abstract

本发明公开了一种街景模型生成方法、装置、系统及存储介质，主要涉及计算机信息技术领域。包括获取采集的图像数据，所述图像数据是带有坐标信息的城市街景图像数据；对图像数据进行训练并提取特征，生成图像模型；获取城市信息，根据城市信息与图像模型进行匹配，生成街景图片。本发明的有益效果在于：它能够获得代表性的街景模型。

Description

一种街景模型生成方法、装置、系统及存储介质

技术领域

本发明涉及计算机信息技术领域，具体是一种街景模型生成方法、装置、系统及存储介质。

背景技术

图像识别、物体检测、图像生成是计算机视觉领域重要的研究问题，在人脸识别、安全监控以及动态追踪等很多方面都有广泛的应用前景。图像识别是指利用计算机对图像进行处理、分析和理解，一事被各种不同模式的目标和对像的技术。物体检测是指对于任意一帧或者连续帧图像，检测和识别其中特定的目标，并返回目标的位置、大小信息、例如输出包围目标的边界框。图像生成是指计算机对图像进行处理和理解，进行模仿和生成新图像的技术。目前，深度学习已经被广泛的应用于图像分类、物体检测等方面，但是图像生成技术却发展缓慢，目前大部分只停留在单一物体或者场景进行生成，无法生成良好的复杂语义环境下的图像例如街景图片等。同时神经网络是一种大规模、多参数优化的工具。依靠大量的训练数据，神经网络能够学习出数据中难以总结的隐藏特征，从而完成多项复杂的任务，如物体检测、图片生成等等，因此技术会出现以下缺陷：(1)在街景生成方面并无应用的先例。(2)需要手机巨大的真实的街景数据来进行训练，这些图片必须具有当地特色例如建筑风貌等代表性。(3)深度学习计算复杂度较高，对其在实时性较高的场景中产生了限制。

发明内容

本发明的目的在于提供一种街景模型生成方法、装置、系统及存储介质，它能够获得代表性的街景模型。

本发明为实现上述目的，通过以下技术方案实现：

一种街景模型生成方法，包括：

获取采集的图像数据，所述图像数据是带有坐标信息的城市街景图像数据；

对图像数据进行训练并提取特征，生成图像模型；

获取城市信息，根据城市信息与图像模型进行匹配，生成街景图片。

进一步的，所述城市信息包括城市名称。

进一步的，所述采集的图像数据为对城市街景随机采集10000张带有坐标信息的图像数据，进行标签化，并且将数据数进行删选，得到5000张具有地方特色的街景图像数据。

进一步的，所述对图像数据进行训练并提取特征，包括使用DenseNet在Pytorch的深度学习框架下训练，所生成的模型使用模型服务技术布局在阿里云服务器上进行流水生成，每张图像生成在1s左右。

作为本发明的另一个方面，提供了一种街景模型生成装置，包括：

获取单元，配置用于获取采集的采集图像数据，所述图像数据是带有坐标信息的城市街景图像数据；

训练单元，配置用于对图像数据进行训练并提取特征，生成图像模型；

确认单元，配置用于获取城市信息，根据城市信息与图像模型进行匹配，生成街景图片。

作为本发明的另一个方面，提供了一种街景模型生成系统，包括上述的一种街景模型生成装置、输入单元和显示单元；

所述输入单元配置用于向获取单元输入图像数据；

所述显示单元配置用于输入城市信息，并对应该城市信息将由确认单元生成的街景图片结果显示到前端。

作为本发明的另一个方面，提供了一种计算机可读的存储介质，其中存储有代码，所述代码经运行以通过计算设备执行上述的方法。

对比现有技术，本发明的有益效果在于：

街景图像生成在深度学习尚未实现之前是通过传统的传播算子方法(PM)来对图像进行降噪和特征提取等处理，速度较慢并且对于街景等复杂语义场景效果较差。其次街景数据量和信息较大，用传统的方法会导致测试集的包容度不够。

本申请的方法是业界首次将深度学习框架用在街景生成上，通过在DenseNet中输入大批量训练样本来训练模型。将用在城市规划行业中，将各城市的风貌特征很好地展示给研究院进行分析等。

附图说明

附图1是本发明实施例1中步骤一的图像信息示例图。

附图2是本发明实施例1中步骤二的原理图。

附图3是本发明实施例1中步骤三的结果显示图例。

具体实施方式

下面结合具体实施例，进一步阐述本发明。应理解，这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解，在阅读了本发明讲授的内容之后，本领域技术人员可以对本发明作各种改动或修改，这些等价形式同样落于本申请所限定的范围。

下述实施例中所涉及的仪器、试剂、材料等，若无特别说明，均为现有技术中已有的常规仪器、试剂、材料等，可通过正规商业途径获得。下述实施例中所涉及的实验方法，检测方法等，若无特别说明，均为现有技术中已有的常规实验方法，检测方法等。

实施例1：一种街景模型生成方法

步骤一：海量的街景图片(带坐标)的轨迹数据收集

我们经过采集部分城市的街景数据，每个城市随机采集10000张带有坐标信息的图像数据，进行标签化，并且将数据数进行删选5000张具有地方特色的街景数据。

步骤二：利用处理好的数据进行训练并提取特征进行生成图片

经过处理后，图片数据可直接进入卷积神经网络进行训练。在卷积神经网络方面，我们使用了当下比较前沿的DenseNet。DenseNet是一种具有密集连接的卷积神经网络。在该网络中，任何两层之间都具有直接的连接，也就是说，网络每一层的输入都是前面所有层输出的并集，二该层所学习的特征图也会被直接传给其后面所有层作为输入。该网络比传统的PM算法，可以提取更复杂语义特征，并且改善了网络中信息和梯度的传递，这就让网络容易取得较好的效果。并采用对抗生成的策略，自行判别生成的图像的真假程度，利用高性能图形处理单元(GPU)使用DenseNet在Pytorch的深度学习框架下训练。在进行四万多次训练，将其使用模型服务技术布局在阿里云服务器上进行流水生成，每张图像生成在1s左右。

步骤三：在网页上实现简单的可视化，生成风貌图像

首先，用户可以在前端输入城市名称信息。后台收到请求的信息经过若干步骤进行计算，将得到的结果绘画成图片，然后将结果图片返回到前端进行显示。

Claims

1.一种街景模型生成方法，其特征在于，包括：

对图像数据进行训练并提取特征，生成图像模型；

2.根据权利要求1所述的一种街景模型生成方法，其特征在于，所述城市信息包括城市名称。

3.根据权利要求1所述的一种街景模型生成方法，其特征在于，所述采集的图像数据为对城市街景随机采集10000张带有坐标信息的图像数据，进行标签化，并且将数据数进行删选，得到5000张具有地方特色的街景图像数据。

4.根据权利要求1所述的一种街景模型生成方法，其特征在于，所述对图像数据进行训练并提取特征，包括使用DenseNet在Pytorch的深度学习框架下训练，所生成的模型使用模型服务技术布局在阿里云服务器上进行流水生成，每张图像生成在1s左右。

5.一种街景模型生成装置，其特征在于，包括：

6.根据权利要求5所述的一种街景模型生成装置，其特征在于，所述城市信息包括城市名称。

7.根据权利要求5所述的一种街景模型生成装置，其特征在于，所述对图像数据进行训练并提取特征，包括使用DenseNet在Pytorch的深度学习框架下训练，所生成的模型使用模型服务技术布局在阿里云服务器上进行流水生成，每张图像生成在1s左右。

8.根据权利要求5所述的一种街景模型生成装置，其特征在于，所述采集的图像数据为对城市街景随机采集10000张带有坐标信息的图像数据，进行标签化，并且将数据数进行删选，得到5000张具有地方特色的街景图像数据。

9.一种街景模型生成系统，其特征在于，包括权利要求5-8任一项所述的一种街景模型生成装置、输入单元和显示单元；

所述输入单元配置用于向获取单元输入图像数据；

10.一种计算机可读的存储介质，其中存储有代码，其特征在于，所述代码经运行以通过计算设备执行如权利要求1-4任一所定义的方法。