CN111464743A

CN111464743A - 一种摄影构图匹配方法及系统

Info

Publication number: CN111464743A
Application number: CN202010275026.2A
Authority: CN
Inventors: 姜男; 熊鑫; 刘浏
Original assignee: Shanghai Chengshi Information Technology Co ltd
Current assignee: Shanghai Chengshi Information Technology Co ltd
Priority date: 2020-04-09
Filing date: 2020-04-09
Publication date: 2020-07-28

Abstract

本发明公开了一种摄影构图匹配方法及系统，主要涉及计算机信息技术领域。包括收集图片，并对图片进行数据处理，所述数据处理为对人工对图片标记第一标签信息和第二标签信息，所述第一标签信息为构图线，所述第二标签信息为拍摄建议，获得样本数据；将样本数据导入DensentNet卷积神经网络结构进行训练，获得构图模型；获取目标影像，所述目标影像是拍摄的照片；使用构图模型对目标影像进行识别，匹配对应的第一标签信息和第二标签信息。本发明的有益效果在于：基于卷积神经的深入学习，能够给人提供对应的拍摄建议。

Description

一种摄影构图匹配方法及系统

技术领域

本发明涉及计算机信息技术领域，具体是一种摄影构图匹配方法及系统。

背景技术

图像识别、物体检测是计算机视觉领域的重要研究问题，在人脸识别、安全监控以及动态追踪等很多方面都有广泛的应用前景。图像识别是指利用计算机对图像进行处理、分析和理解，以识别各种不同模式的目标和对像的技术。物体检测是指对于任意一帧或连续帧图像，检测和识别其中特定的目标，并返回目标的位置、大小信息，例如输出包围目标的边界框。近年来随着随着智能手机的的不断发展和进步，手机自带的相机的功能也逐步增多。但是对于图片分析上的操作比较少，无法更好的指导人来拍出更好的图片，拍照前指导目前的难度：1.主要是专业性较强，没有相关专业知识的人很难对照片有一些抽象的理解。2.需要巨大的相关的数据集进行训练。

发明内容

本发明的目的在于提供一种摄影构图匹配方法及系统，它基于卷积神经的深入学习，能够给人提供对应的拍摄建议。

本发明为实现上述目的，通过以下技术方案实现：

一种摄影构图匹配方法，包括

收集图片，并对图片进行数据处理，所述数据处理为对人工对图片标记第一标签信息和第二标签信息，所述第一标签信息为构图线，所述第二标签信息为拍摄建议，获得样本数据；

将样本数据导入DensentNet卷积神经网络结构进行训练，获得构图模型；

获取目标影像，所述目标影像是拍摄的照片；

使用构图模型对目标影像进行识别，匹配对应的第一标签信息和第二标签信息。

所述导入DensentNet卷积神经网络结构进行训练，包括利用高性能处理单元使用改善过后的vgg在PyTorch框架下训练。在模型训练完成之后，将其使用模型服务技术布局在阿里服务器上进行流水运算。

所述第二标签信息为通过语言描述记载的信息。

一种摄影构图匹配系统，包括服务端和客户端，

所述服务端包括：

导入单元，配置用于导入样本数据，所述样本数据为通过对原始图片进行数据处理而获得，所述数据处理包括人工对图片标记第一标签信息和第二标签信息，所述第一标签信息为构图线，所述第二标签信息为拍摄建议；

训练单元，配置用于将样本数据进行训练，获得构图模型；

识别单元，配置用于使用构图模型对目标影像进行识别，匹配对应的第一标签信息和第二标签信息；

第一通讯单元，配置接收客户端发来的目标影像，并将匹配的第一标签信息和第二标签信息反馈至客户端；

所述客户端配置于移动讯通上的APP，包括：

获取单元，获取目标影像，所述目标影像是APP所在的语音通讯装置拍摄的照片；

第二通讯单元，配置用于向客户端发送目标影像，并接收客户端发来的与目标影像匹配的第一标签信息和第二标签信息。

对比现有技术，本发明的有益效果在于：

1.本发明是业界首次将深度学习框架应用在识别结构线并且分类上，通过对网络进行改善后分为多种结构线类型，准确率高达在90％

2.本发明将用在摄影行业，对其拍摄进行智能指导的作用。

附图说明

附图1是本发明的实施例1的步骤一示意图。

附图2是本发明的实施例1的步骤二示意图。

附图3是本发明的实施例1的步骤三示意图。

具体实施方式

下面结合具体实施例，进一步阐述本发明。应理解，这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解，在阅读了本发明讲授的内容之后，本领域技术人员可以对本发明作各种改动或修改，这些等价形式同样落于本申请所限定的范围。

实施例1：一种摄影构图匹配方法及系统

首先，在没有用卷进神经网络之前，图像处理一直用opencv等处理，由于计算量较大实现起来比较困难。对于拍照前的指导需要比较专业的知识理论来支撑。

根据以上的原因，我们将图片识别稍加修改，采用识别图片结构线及其他相关等特征后，按照摄影相关细节进行推荐，使人们能进行改进，从而排出更好的照片。该方法专利的流程可以分为三个步骤，首先手机带有标签信息的数据，进一步，我们把这些图片作为标定数据采用我DensentNet卷积神经网络结构进行训练，训练好的神经网络可以对任意尺度的照片进行结构的识别，最后我们根据这个推荐网络，开发了一款app来实现和用户的交互。

三个步骤详细内容如下：

步骤一：我们需要通过专业人士来标定大量的照片，我们需要把图片进行填充，最终实现了多种建议的推荐，每个类型结构线包含了1万至10万张带有标签的照片。数据处理如图一所示：

步骤二：将网络进行修改，利用处理完毕的数据集进行训练。

经过处理后，图片数据可以直接进入卷积神经网络进行训练。在神经网络选择方面，我们使用了当下比较前沿的DenseNet。DenseNet是一种具有密集连接的卷积神经网络。在该网络中，任何两层之间都有直接的连接，也就是说，网络每一层的输入都是前面所有层输出的并集，而该层所学习的特征图也会被直接传给其后面所有层作为输入。该网络比传统的卷积网络有更少的参数，因为它不需要再重新学习多余的特征图。并且改善了网络中信息和梯度的传递，这就让网络更容易训练。首先将整个数据分割成70％数据作为训练集，30％作为测试数据集。利用高性能处理单元(GPU)使用改善过后的vgg在PyTorch框架下训练。在模型训练完成之后，将其使用模型服务技术布局在阿里服务器上进行流水运算，每张用户手绘的计算时间在0.7秒左右。然后将结果与定义的结构线进行匹配然后给出相关拍摄的建议。

步骤三：在app上实现交互功能

当训练好的模型可以对用户照片进行识别结构线后，我们开发了一个功能模块识别图片结构线并且做出推荐。首先用户在手机上进行拍摄，点击图片上传。其次，上传之后的图片经过若干步骤的处理之后输入识别模型，将结构线画出并返回相似度最高的一个结构线进行推荐。首先加载图片，然后上传图片，最后得到结果。

Claims

1.一种摄影构图匹配方法，其特征在于，包括

获取目标影像，所述目标影像是拍摄的照片；

2.根据权利要求1所述一种摄影构图匹配方法，其特征在于，所述导入DensentNet卷积神经网络结构进行训练，包括利用高性能处理单元使用改善过后的vgg在PyTorch框架下训练。在模型训练完成之后，将其使用模型服务技术布局在阿里服务器上进行流水运算。

3.根据权利要求1所述一种摄影构图匹配方法，其特征在于，所述第二标签信息为通过语言描述记载的信息。

4.一种摄影构图匹配系统，其特征在于，包括服务端和客户端，

所述服务端包括：

训练单元，配置用于将样本数据进行训练，获得构图模型；

所述客户端配置于移动讯通上的APP，包括：