CN110188595A

CN110188595A - 一种基于ar和cnn算法的动物园游览系统及游览方法

Info

Publication number: CN110188595A
Application number: CN201910293588.7A
Authority: CN
Inventors: 朱全银; 唐文骏; 周蕾; 葛启航; 高尚兵; 李翔
Original assignee: Huaiyin Institute of Technology
Current assignee: Huaiyin Institute of Technology
Priority date: 2019-04-12
Filing date: 2019-04-12
Publication date: 2019-08-30

Abstract

本专利公开发明了一种基于AR和CNN算法的动物园游览系统及游览方法，包括：图像获取单元，获取用户所需辨识的动物图像；模型数据库，用以存放制作的动物模型；图像处理单元，调用CNN卷积神经网络，对不同动物图片进行图像识别；显示单元，调用模型数据库内的三维贴图数据展示动物的三维模型。本发明既利用CNN卷积神经网络算法建立图像识别模型，弥补了AR增强现实技术中图像识别出现误差的问题；又增强了动物园游览系统的趣味性，满足了用户游览动物园的需求。

Description

一种基于AR和CNN算法的动物园游览系统及游览方法

技术领域

本发明属于图像识别技术领域，特别涉及一种基于AR和CNN算法的动物园游览系统及游览方法。

背景技术

动物园是搜集饲养各种动物，进行科学研究和迁地保护，供公众观赏并进行科学普及和宣传保护教育的场所。动物园有两个基本特点：一是饲养管理着野生动物，二是向公众开放。符合这两个基本特点的场所即是广义上的动物园，包括水族馆、专类动物园等类型。动物园的基本功能是对野生动物的综合保护和对公众的保护教育。

由于动物园的场地、人力、布局设计等原因，在动物园中常常找不到所想参观的园区。并且大多数动物园在对野生动物知识科普、保护教育方面做得并不理想。由于动物园的展示形式大多是围栏辅以一定的文字说明，所能展示、提供的介绍信息量严重不足。甚至许多动物园并没有文字说明。游客很难了解到动物的科普及保护知识，所以动物园中存在表达介绍方式单一，没有交互功能，缺少趣味性等缺点。

冯万利，朱全银等人已有的研究基础包括：Wanli Feng.Research of themestatement extraction for chinese literature based on lexicalchain.International Journal of Multimedia and Ubiquitous Engineering,Vol.11,No.6(2016), pp.379-388；Wanli Feng,Ying Li,Shangbing Gao,Yunyang Yan,JianxunXue.A novel flame edge detection algorithm via a novel active contourmodel.International Journal of Hybrid Information Technology,Vol.9,No.9(2016),pp.275-282；刘金岭,冯万利.基于属性依赖关系的模式匹配方法[J].微电子学与计算机,2011, 28(12):167-170；刘金岭,冯万利,张亚红.初始化簇类中心和重构标度函数的文本聚类[J].计算机应用研究,2011,28(11):4115-4117；刘金岭,冯万利,张亚红. 基于重新标度的中文短信文本聚类方法[J].计算机工程与应用,2012, 48(21):146-150.；朱全银,潘禄,刘文儒,等.Web科技新闻分类抽取算法[J].淮阴工学院学报,2015,24(5):18-24；李翔,朱全银.联合聚类和评分矩阵共享的协同过滤推荐[J].计算机科学与探索,2014,8(6):751-759；Quanyin Zhu,Sunqun Cao.A Novel Classifier-independent FeatureSelection Algorithm for Imbalanced Datasets. 2009,p:77-82；Quanyin Zhu,YunyangYan,Jin Ding,Jin Qian.The Case Study for Price Extracting of Mobile PhoneSell Online.2011,p:282-285；Quanyin Zhu,Suqun Cao,Pei Zhou,Yunyang Yan,HongZhou.Integrated Price Forecast based on Dichotomy Backfilling and DisturbanceFactor Algorithm.International Review on Computers and Software,2011,Vol.6(6):1089-1093；朱全银，冯万利等人申请、公开与授权的相关专利：冯万利,邵鹤帅,庄军.一种智能冷藏车状态监测无线网络终端装置:CN203616634U[P].2014；朱全银，胡蓉静，何苏群，周培等.一种基于线性插补与自适应滑动窗口的商品价格预测方法.中国专利:ZL20111 0423015.5,2015.07.01；朱全银，曹苏群，严云洋，胡蓉静等，一种基于二分数据修补与扰乱因子的商品价格预测方法.中国专利:ZL 2011 1 0422274.6,2013.01.02；李翔，朱全银，胡荣林，周泓.一种基于谱聚类的冷链物流配载智能推荐方法.中国专利公开号:CN105654267A,2016.06.08。

AR增强现实技术：

AR增强现实技术(Augmented Reality)是通过计算机的高强度复杂计算产生虚拟信息，之后将虚拟信息覆盖在真实世界的场景上，以此增强用户对现实环境的认知、理解的一种新兴技术。是一种实时地计算摄影机影像的位置及角度并加上相应图像、视频、3D模型的技术，这种技术的目标是在屏幕上把虚拟世界嵌套在现实世界之中，与用户产生交互活动。

CNN算法:

CNN是一种前馈神经网络，它的人工神经元可以响应一部分覆盖范围内的周围单元，对于大型图像处理有出色表现。卷积神经网络由一个或多个卷积层和顶端的全连通层(对应经典的神经网络)组成，同时也包括关联权重和池化层 (pooling layer)。这一结构使得卷积神经网络能够利用输入数据的二维结构。与其他深度学习结构相比，卷积神经网络在图像和语音识别方面能够给出更好的结果。这一模型也可以使用反向传播算法进行训练。相比较其他深度、前馈神经网络，卷积神经网络需要考量的参数更少，使之成为一种颇具吸引力的深度学习结构。

发明内容

发明目的：针对现有技术中存在的问题，本发明提出一种基于AR和CNN算法的动物园游览系统及游览方法，为游览动物园的游客提供便捷、方便的服务，普及野生动物知识。

技术方案：为解决上述技术问题，本发明提供一种基于AR和CNN算法的动物园游览系统，包括图像获取单元、图像处理单元、模型数据库和图像显示单元；所述图像获取单元与图像处理单元连接，所述图像处理单元与模型数据库均与图像显示单元连接；其中：

图像获取单元：通过图像获取单元获得动物图像T；

图像处理单元：通过图像处理单元用CNN图像识别算法对图像进行处理得出最大元素Gn；

模型数据库：构建动物模型N得到模型数据集M；

图像显示单元：调用与最大元素Gn对应的模型N在屏幕上显示。

根据如上述的一种基于AR和CNN算法的动物园游览系统的游览方法，包括如下步骤：

(1)在图像获取部分使用手机内置摄像头获取动物图像信息T；

(2)通过不同的动物图片预先训练CNN卷积神经网络图像识别模型；

(3)将步骤(1)获取的动物图像信息T置入图像识别模型，得出结果数据集G＝G{G1，G2，G3...Gn}；其中n为动物种类编号；设动物种类为m，n∈[0,m]；

(4)建立动物模型N，N＝n；

(5)对模型数据进行处理的到模型数据集M＝M{1,2,3...N}；

(6)比较步骤(3)中得到的结果数据集G中各元素的大小，得到最大的元素Gn；

(7)调用与最大元素Gn对应的模型N在屏幕上显示。

进一步的，所述步骤(2)中通过不同的动物图片预先训练CNN卷积神经网络图像识别模型的具体步骤如下：

(2.1)将图片置于卷积层Conv1中，卷积核大小为1x 11，使用ReLU函数作为激活函数，输出C1；

(2.2)将C1置于卷积层Conv2中，卷积核大小为11x 1，使用ReLU函数作为激活函数，输出C2；

(2.3)输入C2，运用pooling函数降采样构建池化层输出P2；

(2.4)输入P2，卷积层Conv3中，卷积核为3x 3，使用ReLU函数作为激活函数，输出C3；

(2.5)输入C3，运用pooling函数降采样构建池化层P3；

(2.6)输入P3，卷积层Conv4中，卷积核大小为3x 3，使用ReLU函数作为激活函数，输出C4；

(2.7)输入C4，运用pooling函数降采样构建池化层P4；

(2.8)输入P4.卷积层Conv5中，卷积核大小为3x 3，使用ReLU函数作为激活函数，输出C5；

(2.9)输入C5，运用pooling函数降采样构建池化层P5；

(2.10)输入P5卷积层Conv6中，卷积核大小为3x 3，使用ReLU函数作为激活函数，输出C6；

(2.11)输入C6卷积层Conv7中，卷积核大小为3x 3，使用ReLU函数作为激活函数，输出C7；

(2.12)输入C7运用pooling函数降采样构建池化层P7；

(2.13)构建全连接层fc8，以ReLU函数作为激励函数，神经元个数定义为 4096；

(2.14)构建全连接层fc9，以ReLU函数作为激励函数，神经元个数定义为 4096；

(2.15)构建全连接层fc10，以ReLU函数作为激励函数，神经元个数定义为1000，结合softmax逻辑回归行分类。

进一步的，所述步骤(3)中将动物图像信息T置入图像识别模型进行训练，得出结果数据集G的具体步骤如下：

(3.1)定义循环变量为t,并赋值t＝1；

(3.2)人工对动物图片打标签，标签记为1，2，…,n；其中n为动物种类编号，得到xml格式的文件；

(3.3)初始化图片和标签，遍历图片，将图片处理成符合要求的大小后，将图片储存为tfrecords格式；

(3.4)判断图片储存格式是否为tfrecords格式，如是执行步骤(3.5)，如不是则返回步骤(3.3)；

(3.5)根据步骤(2.1)到(2.15)的CNN图像识别训练模型构建步骤之中；

(3.6)t＝t+1

(3.7)当t<1000时执行步骤(3.5)，否则执行步骤(3.9)；

(3.8)停止训练。

进一步的，所述步骤(7)中通过图像显示单元显示最大元素Gn对应的动物模型N的具体步骤如下：

(7.1)通过摄像头获取动物图片；

(7.2)调用CNN图像识别训练模型；

(7.3)输入图像；

(7.4)识别动物图片，识别失败执行步骤(4.3)，否则执行步骤(4.5)；

(7.5)连接模型数据库下载对应模型；

(7.6)通过屏幕展现模型。

与现有技术相比，本发明的优点在于：

(1)本发明使用简单：只需选择所需动物，即可查询动物的三维立体形象、生活习惯、生存环境等知识。为游客的游览过程提供了额外的科普环节，尤其适合对孩子进行有关动物的科普教育活动。

(2)本发明轻便、贴身：使用手机APP为载体，图像获取装置使用手机内置摄像头，便于操作，在拍摄动物照片的同时做到寓教于乐，留下纪念的同时有获得了知识，不需额外携带多余的器械。

(3)本发明提供动物的详细三维模型：游客观赏动物是往往只能在远处观看，无法详细观察动物的外形细节，本发明提供了动物的详细三维模型方便游客更详实的观察动物，提升游览体验。

附图说明

图1为本发明的结构示意图；

图2为本发明的总体流程图；

图3为图2中通过不同的动物图片预先训练CNN卷积神经网络图像识别模型的流程图；

图4为图2中将动物图像信息T置入图像识别模型进行训练，得出结果数据集G的流程图；

图5为图2中通过图像显示单元显示最大元素Gn对应的动物模型N的流程图。

具体实施方式

下面结合附图和具体实施方式，进一步阐明本发明。

如图1-5示，本发明所述的一种基于AR和CNN算法的动物园游览系统，包括图像获取单元、图像处理单元、模型数据库和图像显示单元；所述图像获取单元与图像处理单元连接，所述图像处理单元与模型数据库均与图像显示单元连接；其中：

图像获取单元：通过图像获取单元获得动物图像T；

模型数据库：构建动物模型N得到模型数据集M；

根据如上述的一种基于AR和CNN算法的动物园游览系统的游览方法，利用 CNN卷积神经网络算法建立图像识别模型，弥补了AR增强现实技术中图像识别出现误差的问题，其中包括系统结构框图步骤A、CNN图像识别算法步骤C、训练图像识别模型步骤C，系统整体流程步骤D四部分：

系统整体流程步骤A1到A7如下

步骤A1：在图像获取部分使用手机内置摄像头获取动物图像信息T；

步骤A2：通过不同的动物图片预先训练CNN卷积神经网络图像识别模型；

步骤A3：将步骤A1获取的动物图像信息T置入图像识别模型，得出结果数据集G＝G{G1，G2，G3...Gn}；其中n为动物种类编号。设动物种类为m，n ∈[0,m]；

步骤A4：建立动物模型N，N＝n。

步骤A5：对模型数据进行处理的到模型数据集M＝M{1,2,3...N}

步骤A6：比较步骤A3中得到的结果数据集G中各元素的大小，得到最大的元素Gn；

步骤A7：调用与最大元素Gn对应的模型N在屏幕上显示

CNN图像识别训练模型构建步骤B1到B15如下：

步骤B1：将图片置于卷积层Conv1中，卷积核大小为1x 11，使用ReLU 函数作为激活函数，输出C1；

步骤B2：将C1置于卷积层Conv2中，卷积核大小为11x 1，使用ReLU函数作为激活函数，输出C2；

步骤B3：输入C2，运用pooling函数降采样构建池化层输出P2；

步骤B4：输入P2，卷积层Conv3中，卷积核为3x 3，使用ReLU函数作为激活函数，输出C3；

步骤B5：输入C3，运用pooling函数降采样构建池化层P3；

步骤B6：输入P3，卷积层Conv4中，卷积核大小为3x 3，使用ReLU函数作为激活函数，输出C4；

步骤B7：输入C4，运用pooling函数降采样构建池化层P4；

步骤B8：输入P4.卷积层Conv5中，卷积核大小为3x 3，使用ReLU函数作为激活函数，输出C5；

步骤B9：输入C5，运用pooling函数降采样构建池化层P5；

步骤B10：输入P5卷积层Conv6中，卷积核大小为3x 3，使用ReLU函数作为激活函数，输出C6；

步骤B11：输入C6卷积层Conv7中，卷积核大小为3x 3，使用ReLU函数作为激活函数，输出C7；

步骤B12：输入C7运用pooling函数降采样构建池化层P7；

步骤B13：构建全连接层fc8，以ReLU函数作为激励函数，神经元个数定义为4096；

步骤B14：构建全连接层fc9，以ReLU函数作为激励函数，神经元个数定义为4096；

步骤B15：构建全连接层fc10，以ReLU函数作为激励函数，神经元个数定义为1000，结合softmax逻辑回归行分类；

训练图像识别模型步骤C

步骤C1：定义循环变量为t,并赋值t＝1；

步骤C2：人工对动物图片打标签，标签记为1，2，…,n；其中n为动物种类编号，得到xml格式的文件；

步骤C3：初始化图片和标签，遍历图片，将图片处理成符合要求的大小后，将图片储存为tfrecords格式；

步骤C4：判断图片储存格式是否为tfrecords格式，如是执行步骤C5，如不是则返回步骤C3；

步骤C5：根据步骤B1到B15的CNN图像识别训练模型构建步骤之中；

步骤C6：t＝t+1

步骤C7：当t<1000时执行步骤C5，否则执行步骤C9；

步骤C8：停止训练

系统整体流程步骤D

步骤D1：通过摄像头获取动物图片；

步骤D2：调用CNN图像识别训练模型；

步骤D3：输入图像；

步骤D4：识别动物图片，识别失败执行步骤D3，否则执行步骤D5；步骤D5：连接模型数据库下载对应模型；

步骤D6：通过屏幕展现模型。

Claims

1.一种基于AR和CNN算法的动物园游览系统，其特征在于，包括图像获取单元、图像处理单元、模型数据库和图像显示单元；所述图像获取单元与图像处理单元连接，所述图像处理单元与模型数据库均与图像显示单元连接；其中：

图像获取单元：通过图像获取单元获得动物图像T；

模型数据库：构建动物模型N得到模型数据集M；

2.根据权利要求1中所述的一种基于AR和CNN算法的动物园游览系统的游览方法，其特征在于：包括如下步骤：

(1)在图像获取部分使用手机内置摄像头获取动物图像信息T；

(4)建立动物模型N，N＝n；

(5)对模型数据进行处理的到模型数据集M＝M{1,2,3...N}；

(7)调用与最大元素Gn对应的模型N在屏幕上显示。

3.根据权利要求2所述的一种基于AR和CNN算法的动物园游览方法，其特征在于：所述步骤(2)中通过不同的动物图片预先训练CNN卷积神经网络图像识别模型的具体步骤如下：

(2.1)将图片置于卷积层Conv1中，卷积核大小为1x11，使用ReLU函数作为激活函数，输出C1；

(2.2)将C1置于卷积层Conv2中，卷积核大小为11x1，使用ReLU函数作为激活函数，输出C2；

(2.3)输入C2，运用pooling函数降采样构建池化层输出P2；

(2.4)输入P2，卷积层Conv3中，卷积核为3x3，使用ReLU函数作为激活函数，输出C3；

(2.5)输入C3，运用pooling函数降采样构建池化层P3；

(2.6)输入P3，卷积层Conv4中，卷积核大小为3x3，使用ReLU函数作为激活函数，输出C4；

(2.7)输入C4，运用pooling函数降采样构建池化层P4；

(2.8)输入P4.卷积层Conv5中，卷积核大小为3x3，使用ReLU函数作为激活函数，输出C5；

(2.9)输入C5，运用pooling函数降采样构建池化层P5；

(2.10)输入P5卷积层Conv6中，卷积核大小为3x3，使用ReLU函数作为激活函数，输出C6；

(2.11)输入C6卷积层Conv7中，卷积核大小为3x3，使用ReLU函数作为激活函数，输出C7；

(2.12)输入C7运用pooling函数降采样构建池化层P7；

(2.13)构建全连接层fc8，以ReLU函数作为激励函数，神经元个数定义为4096；

(2.14)构建全连接层fc9，以ReLU函数作为激励函数，神经元个数定义为4096；

4.根据权利要求2所述的一种基于AR和CNN算法的动物园游览方法，其特征在于：所述步骤(3)中将动物图像信息T置入图像识别模型进行训练，得出结果数据集G的具体步骤如下：

(3.1)定义循环变量为t,并赋值t＝1；

(3.6)t＝t+1

(3.7)当t<1000时执行步骤(3.5)，否则执行步骤(3.9)；

(3.8)停止训练。

5.根据权利要求2所述的一种基于AR和CNN算法的动物园游览方法，其特征在于：所述步骤(7)中通过图像显示单元显示最大元素Gn对应的动物模型N的具体步骤如下：

(7.1)通过摄像头获取动物图片；

(7.2)调用CNN图像识别训练模型；

(7.3)输入图像；

(7.5)连接模型数据库下载对应模型；

(7.6)通过屏幕展现模型。