CN110188595A - 一种基于ar和cnn算法的动物园游览系统及游览方法 - Google Patents
一种基于ar和cnn算法的动物园游览系统及游览方法 Download PDFInfo
- Publication number
- CN110188595A CN110188595A CN201910293588.7A CN201910293588A CN110188595A CN 110188595 A CN110188595 A CN 110188595A CN 201910293588 A CN201910293588 A CN 201910293588A CN 110188595 A CN110188595 A CN 110188595A
- Authority
- CN
- China
- Prior art keywords
- model
- animal
- image
- picture
- cnn
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004422 calculation algorithm Methods 0.000 title claims abstract description 26
- 238000000034 method Methods 0.000 title claims abstract description 20
- 241001465754 Metazoa Species 0.000 claims abstract description 54
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 46
- 238000012545 processing Methods 0.000 claims abstract description 17
- 238000010422 painting Methods 0.000 claims abstract description 13
- 238000010171 animal model Methods 0.000 claims abstract description 10
- 230000004913 activation Effects 0.000 claims description 20
- 238000011176 pooling Methods 0.000 claims description 16
- 238000012549 training Methods 0.000 claims description 11
- 210000002569 neuron Anatomy 0.000 claims description 10
- 238000013480 data collection Methods 0.000 claims description 9
- 230000005284 excitation Effects 0.000 claims description 9
- 238000010276 construction Methods 0.000 claims description 4
- 125000004122 cyclic group Chemical group 0.000 claims description 3
- 238000007477 logistic regression Methods 0.000 claims description 3
- 230000003190 augmentative effect Effects 0.000 abstract description 5
- 230000006870 function Effects 0.000 description 40
- 238000005516 engineering process Methods 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 238000013135 deep learning Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 241001269238 Data Species 0.000 description 1
- 101001050287 Mus musculus Transcription factor Jun Proteins 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 230000019771 cognition Effects 0.000 description 1
- 238000004883 computer application Methods 0.000 description 1
- 238000003708 edge detection Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000004377 microelectronic Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 229910052709 silver Inorganic materials 0.000 description 1
- 239000004332 silver Substances 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/53—Querying
- G06F16/538—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/14—Travel agencies
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Tourism & Hospitality (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Strategic Management (AREA)
- Databases & Information Systems (AREA)
- General Business, Economics & Management (AREA)
- Primary Health Care (AREA)
- Marketing (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本专利公开发明了一种基于AR和CNN算法的动物园游览系统及游览方法,包括:图像获取单元,获取用户所需辨识的动物图像;模型数据库,用以存放制作的动物模型;图像处理单元,调用CNN卷积神经网络,对不同动物图片进行图像识别;显示单元,调用模型数据库内的三维贴图数据展示动物的三维模型。本发明既利用CNN卷积神经网络算法建立图像识别模型,弥补了AR增强现实技术中图像识别出现误差的问题;又增强了动物园游览系统的趣味性,满足了用户游览动物园的需求。
Description
技术领域
本发明属于图像识别技术领域,特别涉及一种基于AR和CNN算法的动物园游览系统及游览方法。
背景技术
动物园是搜集饲养各种动物,进行科学研究和迁地保护,供公众观赏并进行科学普及和宣传保护教育的场所。动物园有两个基本特点:一是饲养管理着野生动物,二是向公众开放。符合这两个基本特点的场所即是广义上的动物园,包括水族馆、专类动物园等类型。动物园的基本功能是对野生动物的综合保护和对公众的保护教育。
由于动物园的场地、人力、布局设计等原因,在动物园中常常找不到所想参观的园区。并且大多数动物园在对野生动物知识科普、保护教育方面做得并不理想。由于动物园的展示形式大多是围栏辅以一定的文字说明,所能展示、提供的介绍信息量严重不足。甚至许多动物园并没有文字说明。游客很难了解到动物的科普及保护知识,所以动物园中存在表达介绍方式单一,没有交互功能,缺少趣味性等缺点。
冯万利,朱全银等人已有的研究基础包括:Wanli Feng.Research of themestatement extraction for chinese literature based on lexicalchain.International Journal of Multimedia and Ubiquitous Engineering,Vol.11,No.6(2016), pp.379-388;Wanli Feng,Ying Li,Shangbing Gao,Yunyang Yan,JianxunXue.A novel flame edge detection algorithm via a novel active contourmodel.International Journal of Hybrid Information Technology,Vol.9,No.9(2016),pp.275-282;刘金岭,冯万利.基于属性依赖关系的模式匹配方法[J].微电子学与计算机,2011, 28(12):167-170;刘金岭,冯万利,张亚红.初始化簇类中心和重构标度函数的文本聚类[J].计算机应用研究,2011,28(11):4115-4117;刘金岭,冯万利,张亚红. 基于重新标度的中文短信文本聚类方法[J].计算机工程与应用,2012, 48(21):146-150.;朱全银,潘禄,刘文儒,等.Web科技新闻分类抽取算法[J].淮阴工学院学报,2015,24(5):18-24;李翔,朱全银.联合聚类和评分矩阵共享的协同过滤推荐[J].计算机科学与探索,2014,8(6):751-759;Quanyin Zhu,Sunqun Cao.A Novel Classifier-independent FeatureSelection Algorithm for Imbalanced Datasets. 2009,p:77-82;Quanyin Zhu,YunyangYan,Jin Ding,Jin Qian.The Case Study for Price Extracting of Mobile PhoneSell Online.2011,p:282-285;Quanyin Zhu,Suqun Cao,Pei Zhou,Yunyang Yan,HongZhou.Integrated Price Forecast based on Dichotomy Backfilling and DisturbanceFactor Algorithm.International Review on Computers and Software,2011,Vol.6(6):1089-1093;朱全银,冯万利等人申请、公开与授权的相关专利:冯万利,邵鹤帅,庄军.一种智能冷藏车状态监测无线网络终端装置:CN203616634U[P].2014;朱全银,胡蓉静,何苏群,周培等.一种基于线性插补与自适应滑动窗口的商品价格预测方法.中国专利:ZL20111 0423015.5,2015.07.01;朱全银,曹苏群,严云洋,胡蓉静等,一种基于二分数据修补与扰乱因子的商品价格预测方法.中国专利:ZL 2011 1 0422274.6,2013.01.02;李翔,朱全银,胡荣林,周泓.一种基于谱聚类的冷链物流配载智能推荐方法.中国专利公开号:CN105654267A,2016.06.08。
AR增强现实技术:
AR增强现实技术(Augmented Reality)是通过计算机的高强度复杂计算产生虚拟信息,之后将虚拟信息覆盖在真实世界的场景上,以此增强用户对现实环境的认知、理解的一种新兴技术。是一种实时地计算摄影机影像的位置及角度并加上相应图像、视频、3D模型的技术,这种技术的目标是在屏幕上把虚拟世界嵌套在现实世界之中,与用户产生交互活动。
CNN算法:
CNN是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现。卷积神经网络由一个或多个卷积层和顶端的全连通层(对应经典的神经网络)组成,同时也包括关联权重和池化层 (pooling layer)。这一结构使得卷积神经网络能够利用输入数据的二维结构。与其他深度学习结构相比,卷积神经网络在图像和语音识别方面能够给出更好的结果。这一模型也可以使用反向传播算法进行训练。相比较其他深度、前馈神经网络,卷积神经网络需要考量的参数更少,使之成为一种颇具吸引力的深度学习结构。
发明内容
发明目的:针对现有技术中存在的问题,本发明提出一种基于AR和CNN算法的动物园游览系统及游览方法,为游览动物园的游客提供便捷、方便的服务,普及野生动物知识。
技术方案:为解决上述技术问题,本发明提供一种基于AR和CNN算法的动物园游览系统,包括图像获取单元、图像处理单元、模型数据库和图像显示单元;所述图像获取单元与图像处理单元连接,所述图像处理单元与模型数据库均与图像显示单元连接;其中:
图像获取单元:通过图像获取单元获得动物图像T;
图像处理单元:通过图像处理单元用CNN图像识别算法对图像进行处理得出最大元素Gn;
模型数据库:构建动物模型N得到模型数据集M;
图像显示单元:调用与最大元素Gn对应的模型N在屏幕上显示。
根据如上述的一种基于AR和CNN算法的动物园游览系统的游览方法,包括如下步骤:
(1)在图像获取部分使用手机内置摄像头获取动物图像信息T;
(2)通过不同的动物图片预先训练CNN卷积神经网络图像识别模型;
(3)将步骤(1)获取的动物图像信息T置入图像识别模型,得出结果数据集G=G{G1,G2,G3...Gn};其中n为动物种类编号;设动物种类为m,n∈[0,m];
(4)建立动物模型N,N=n;
(5)对模型数据进行处理的到模型数据集M=M{1,2,3...N};
(6)比较步骤(3)中得到的结果数据集G中各元素的大小,得到最大的元素Gn;
(7)调用与最大元素Gn对应的模型N在屏幕上显示。
进一步的,所述步骤(2)中通过不同的动物图片预先训练CNN卷积神经网络图像识别模型的具体步骤如下:
(2.1)将图片置于卷积层Conv1中,卷积核大小为1x 11,使用ReLU函数作为激活函数,输出C1;
(2.2)将C1置于卷积层Conv2中,卷积核大小为11x 1,使用ReLU函数作为激活函数,输出C2;
(2.3)输入C2,运用pooling函数降采样构建池化层输出P2;
(2.4)输入P2,卷积层Conv3中,卷积核为3x 3,使用ReLU函数作为激活函数,输出C3;
(2.5)输入C3,运用pooling函数降采样构建池化层P3;
(2.6)输入P3,卷积层Conv4中,卷积核大小为3x 3,使用ReLU函数作为激活函数,输出C4;
(2.7)输入C4,运用pooling函数降采样构建池化层P4;
(2.8)输入P4.卷积层Conv5中,卷积核大小为3x 3,使用ReLU函数作为激活函数,输出C5;
(2.9)输入C5,运用pooling函数降采样构建池化层P5;
(2.10)输入P5卷积层Conv6中,卷积核大小为3x 3,使用ReLU函数作为激活函数,输出C6;
(2.11)输入C6卷积层Conv7中,卷积核大小为3x 3,使用ReLU函数作为激活函数,输出C7;
(2.12)输入C7运用pooling函数降采样构建池化层P7;
(2.13)构建全连接层fc8,以ReLU函数作为激励函数,神经元个数定义为 4096;
(2.14)构建全连接层fc9,以ReLU函数作为激励函数,神经元个数定义为 4096;
(2.15)构建全连接层fc10,以ReLU函数作为激励函数,神经元个数定义为1000,结合softmax逻辑回归行分类。
进一步的,所述步骤(3)中将动物图像信息T置入图像识别模型进行训练,得出结果数据集G的具体步骤如下:
(3.1)定义循环变量为t,并赋值t=1;
(3.2)人工对动物图片打标签,标签记为1,2,…,n;其中n为动物种类编号,得到xml格式的文件;
(3.3)初始化图片和标签,遍历图片,将图片处理成符合要求的大小后,将图片储存为tfrecords格式;
(3.4)判断图片储存格式是否为tfrecords格式,如是执行步骤(3.5),如不是则返回步骤(3.3);
(3.5)根据步骤(2.1)到(2.15)的CNN图像识别训练模型构建步骤之中;
(3.6)t=t+1
(3.7)当t<1000时执行步骤(3.5),否则执行步骤(3.9);
(3.8)停止训练。
进一步的,所述步骤(7)中通过图像显示单元显示最大元素Gn对应的动物模型N的具体步骤如下:
(7.1)通过摄像头获取动物图片;
(7.2)调用CNN图像识别训练模型;
(7.3)输入图像;
(7.4)识别动物图片,识别失败执行步骤(4.3),否则执行步骤(4.5);
(7.5)连接模型数据库下载对应模型;
(7.6)通过屏幕展现模型。
与现有技术相比,本发明的优点在于:
(1)本发明使用简单:只需选择所需动物,即可查询动物的三维立体形象、生活习惯、生存环境等知识。为游客的游览过程提供了额外的科普环节,尤其适合对孩子进行有关动物的科普教育活动。
(2)本发明轻便、贴身:使用手机APP为载体,图像获取装置使用手机内置摄像头,便于操作,在拍摄动物照片的同时做到寓教于乐,留下纪念的同时有获得了知识,不需额外携带多余的器械。
(3)本发明提供动物的详细三维模型:游客观赏动物是往往只能在远处观看,无法详细观察动物的外形细节,本发明提供了动物的详细三维模型方便游客更详实的观察动物,提升游览体验。
附图说明
图1为本发明的结构示意图;
图2为本发明的总体流程图;
图3为图2中通过不同的动物图片预先训练CNN卷积神经网络图像识别模型的流程图;
图4为图2中将动物图像信息T置入图像识别模型进行训练,得出结果数据集G的流程图;
图5为图2中通过图像显示单元显示最大元素Gn对应的动物模型N的流程图。
具体实施方式
下面结合附图和具体实施方式,进一步阐明本发明。
如图1-5示,本发明所述的一种基于AR和CNN算法的动物园游览系统,包括图像获取单元、图像处理单元、模型数据库和图像显示单元;所述图像获取单元与图像处理单元连接,所述图像处理单元与模型数据库均与图像显示单元连接;其中:
图像获取单元:通过图像获取单元获得动物图像T;
图像处理单元:通过图像处理单元用CNN图像识别算法对图像进行处理得出最大元素Gn;
模型数据库:构建动物模型N得到模型数据集M;
图像显示单元:调用与最大元素Gn对应的模型N在屏幕上显示。
根据如上述的一种基于AR和CNN算法的动物园游览系统的游览方法,利用 CNN卷积神经网络算法建立图像识别模型,弥补了AR增强现实技术中图像识别出现误差的问题,其中包括系统结构框图步骤A、CNN图像识别算法步骤C、训练图像识别模型步骤C,系统整体流程步骤D四部分:
系统整体流程步骤A1到A7如下
步骤A1:在图像获取部分使用手机内置摄像头获取动物图像信息T;
步骤A2:通过不同的动物图片预先训练CNN卷积神经网络图像识别模型;
步骤A3:将步骤A1获取的动物图像信息T置入图像识别模型,得出结果数据集G=G{G1,G2,G3...Gn};其中n为动物种类编号。设动物种类为m,n ∈[0,m];
步骤A4:建立动物模型N,N=n。
步骤A5:对模型数据进行处理的到模型数据集M=M{1,2,3...N}
步骤A6:比较步骤A3中得到的结果数据集G中各元素的大小,得到最大的元素Gn;
步骤A7:调用与最大元素Gn对应的模型N在屏幕上显示
CNN图像识别训练模型构建步骤B1到B15如下:
步骤B1:将图片置于卷积层Conv1中,卷积核大小为1x 11,使用ReLU 函数作为激活函数,输出C1;
步骤B2:将C1置于卷积层Conv2中,卷积核大小为11x 1,使用ReLU函数作为激活函数,输出C2;
步骤B3:输入C2,运用pooling函数降采样构建池化层输出P2;
步骤B4:输入P2,卷积层Conv3中,卷积核为3x 3,使用ReLU函数作为激活函数,输出C3;
步骤B5:输入C3,运用pooling函数降采样构建池化层P3;
步骤B6:输入P3,卷积层Conv4中,卷积核大小为3x 3,使用ReLU函数作为激活函数,输出C4;
步骤B7:输入C4,运用pooling函数降采样构建池化层P4;
步骤B8:输入P4.卷积层Conv5中,卷积核大小为3x 3,使用ReLU函数作为激活函数,输出C5;
步骤B9:输入C5,运用pooling函数降采样构建池化层P5;
步骤B10:输入P5卷积层Conv6中,卷积核大小为3x 3,使用ReLU函数作为激活函数,输出C6;
步骤B11:输入C6卷积层Conv7中,卷积核大小为3x 3,使用ReLU函数作为激活函数,输出C7;
步骤B12:输入C7运用pooling函数降采样构建池化层P7;
步骤B13:构建全连接层fc8,以ReLU函数作为激励函数,神经元个数定义为4096;
步骤B14:构建全连接层fc9,以ReLU函数作为激励函数,神经元个数定义为4096;
步骤B15:构建全连接层fc10,以ReLU函数作为激励函数,神经元个数定义为1000,结合softmax逻辑回归行分类;
训练图像识别模型步骤C
步骤C1:定义循环变量为t,并赋值t=1;
步骤C2:人工对动物图片打标签,标签记为1,2,…,n;其中n为动物种类编号,得到xml格式的文件;
步骤C3:初始化图片和标签,遍历图片,将图片处理成符合要求的大小后,将图片储存为tfrecords格式;
步骤C4:判断图片储存格式是否为tfrecords格式,如是执行步骤C5,如不是则返回步骤C3;
步骤C5:根据步骤B1到B15的CNN图像识别训练模型构建步骤之中;
步骤C6:t=t+1
步骤C7:当t<1000时执行步骤C5,否则执行步骤C9;
步骤C8:停止训练
系统整体流程步骤D
步骤D1:通过摄像头获取动物图片;
步骤D2:调用CNN图像识别训练模型;
步骤D3:输入图像;
步骤D4:识别动物图片,识别失败执行步骤D3,否则执行步骤D5;步骤D5:连接模型数据库下载对应模型;
步骤D6:通过屏幕展现模型。
Claims (5)
1.一种基于AR和CNN算法的动物园游览系统,其特征在于,包括图像获取单元、图像处理单元、模型数据库和图像显示单元;所述图像获取单元与图像处理单元连接,所述图像处理单元与模型数据库均与图像显示单元连接;其中:
图像获取单元:通过图像获取单元获得动物图像T;
图像处理单元:通过图像处理单元用CNN图像识别算法对图像进行处理得出最大元素Gn;
模型数据库:构建动物模型N得到模型数据集M;
图像显示单元:调用与最大元素Gn对应的模型N在屏幕上显示。
2.根据权利要求1中所述的一种基于AR和CNN算法的动物园游览系统的游览方法,其特征在于:包括如下步骤:
(1)在图像获取部分使用手机内置摄像头获取动物图像信息T;
(2)通过不同的动物图片预先训练CNN卷积神经网络图像识别模型;
(3)将步骤(1)获取的动物图像信息T置入图像识别模型,得出结果数据集G=G{G1,G2,G3...Gn};其中n为动物种类编号;设动物种类为m,n∈[0,m];
(4)建立动物模型N,N=n;
(5)对模型数据进行处理的到模型数据集M=M{1,2,3...N};
(6)比较步骤(3)中得到的结果数据集G中各元素的大小,得到最大的元素Gn;
(7)调用与最大元素Gn对应的模型N在屏幕上显示。
3.根据权利要求2所述的一种基于AR和CNN算法的动物园游览方法,其特征在于:所述步骤(2)中通过不同的动物图片预先训练CNN卷积神经网络图像识别模型的具体步骤如下:
(2.1)将图片置于卷积层Conv1中,卷积核大小为1x11,使用ReLU函数作为激活函数,输出C1;
(2.2)将C1置于卷积层Conv2中,卷积核大小为11x1,使用ReLU函数作为激活函数,输出C2;
(2.3)输入C2,运用pooling函数降采样构建池化层输出P2;
(2.4)输入P2,卷积层Conv3中,卷积核为3x3,使用ReLU函数作为激活函数,输出C3;
(2.5)输入C3,运用pooling函数降采样构建池化层P3;
(2.6)输入P3,卷积层Conv4中,卷积核大小为3x3,使用ReLU函数作为激活函数,输出C4;
(2.7)输入C4,运用pooling函数降采样构建池化层P4;
(2.8)输入P4.卷积层Conv5中,卷积核大小为3x3,使用ReLU函数作为激活函数,输出C5;
(2.9)输入C5,运用pooling函数降采样构建池化层P5;
(2.10)输入P5卷积层Conv6中,卷积核大小为3x3,使用ReLU函数作为激活函数,输出C6;
(2.11)输入C6卷积层Conv7中,卷积核大小为3x3,使用ReLU函数作为激活函数,输出C7;
(2.12)输入C7运用pooling函数降采样构建池化层P7;
(2.13)构建全连接层fc8,以ReLU函数作为激励函数,神经元个数定义为4096;
(2.14)构建全连接层fc9,以ReLU函数作为激励函数,神经元个数定义为4096;
(2.15)构建全连接层fc10,以ReLU函数作为激励函数,神经元个数定义为1000,结合softmax逻辑回归行分类。
4.根据权利要求2所述的一种基于AR和CNN算法的动物园游览方法,其特征在于:所述步骤(3)中将动物图像信息T置入图像识别模型进行训练,得出结果数据集G的具体步骤如下:
(3.1)定义循环变量为t,并赋值t=1;
(3.2)人工对动物图片打标签,标签记为1,2,…,n;其中n为动物种类编号,得到xml格式的文件;
(3.3)初始化图片和标签,遍历图片,将图片处理成符合要求的大小后,将图片储存为tfrecords格式;
(3.4)判断图片储存格式是否为tfrecords格式,如是执行步骤(3.5),如不是则返回步骤(3.3);
(3.5)根据步骤(2.1)到(2.15)的CNN图像识别训练模型构建步骤之中;
(3.6)t=t+1
(3.7)当t<1000时执行步骤(3.5),否则执行步骤(3.9);
(3.8)停止训练。
5.根据权利要求2所述的一种基于AR和CNN算法的动物园游览方法,其特征在于:所述步骤(7)中通过图像显示单元显示最大元素Gn对应的动物模型N的具体步骤如下:
(7.1)通过摄像头获取动物图片;
(7.2)调用CNN图像识别训练模型;
(7.3)输入图像;
(7.4)识别动物图片,识别失败执行步骤(4.3),否则执行步骤(4.5);
(7.5)连接模型数据库下载对应模型;
(7.6)通过屏幕展现模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910293588.7A CN110188595A (zh) | 2019-04-12 | 2019-04-12 | 一种基于ar和cnn算法的动物园游览系统及游览方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910293588.7A CN110188595A (zh) | 2019-04-12 | 2019-04-12 | 一种基于ar和cnn算法的动物园游览系统及游览方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110188595A true CN110188595A (zh) | 2019-08-30 |
Family
ID=67714155
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910293588.7A Pending CN110188595A (zh) | 2019-04-12 | 2019-04-12 | 一种基于ar和cnn算法的动物园游览系统及游览方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110188595A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110728630A (zh) * | 2019-09-03 | 2020-01-24 | 北京爱博同心医学科技有限公司 | 基于增强现实的互联网图像处理方法及增强现实眼镜 |
CN113873216A (zh) * | 2021-08-13 | 2021-12-31 | 兰州飞天网景信息产业有限公司 | 一种应用在动物园产业的xr产品构成系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180018539A1 (en) * | 2016-07-12 | 2018-01-18 | Beihang University | Ranking convolutional neural network constructing method and image processing method and apparatus thereof |
CN108875811A (zh) * | 2018-06-01 | 2018-11-23 | 平安科技(深圳)有限公司 | 动物种类的分类方法、装置、计算机设备和存储介质 |
CN109087376A (zh) * | 2018-07-31 | 2018-12-25 | Oppo广东移动通信有限公司 | 图像处理方法、装置、存储介质及电子设备 |
-
2019
- 2019-04-12 CN CN201910293588.7A patent/CN110188595A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180018539A1 (en) * | 2016-07-12 | 2018-01-18 | Beihang University | Ranking convolutional neural network constructing method and image processing method and apparatus thereof |
CN108875811A (zh) * | 2018-06-01 | 2018-11-23 | 平安科技(深圳)有限公司 | 动物种类的分类方法、装置、计算机设备和存储介质 |
CN109087376A (zh) * | 2018-07-31 | 2018-12-25 | Oppo广东移动通信有限公司 | 图像处理方法、装置、存储介质及电子设备 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110728630A (zh) * | 2019-09-03 | 2020-01-24 | 北京爱博同心医学科技有限公司 | 基于增强现实的互联网图像处理方法及增强现实眼镜 |
CN113873216A (zh) * | 2021-08-13 | 2021-12-31 | 兰州飞天网景信息产业有限公司 | 一种应用在动物园产业的xr产品构成系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhang et al. | Empowering things with intelligence: a survey of the progress, challenges, and opportunities in artificial intelligence of things | |
Caldera et al. | Review of deep learning methods in robotic grasp detection | |
Yu et al. | Sketch-a-net: A deep neural network that beats humans | |
CN110148120A (zh) | 一种基于cnn与迁移学习的病害智能识别方法及系统 | |
Alojaiman | Technological modernizations in the industry 5.0 era: A descriptive analysis and future research directions | |
CN108961369A (zh) | 生成3d动画的方法和装置 | |
CN108416003A (zh) | 一种图片分类方法和装置、终端、存储介质 | |
Wu et al. | ClothGAN: generation of fashionable Dunhuang clothes using generative adversarial networks | |
CN110532417A (zh) | 基于深度哈希的图像检索方法、装置及终端设备 | |
CN107132912A (zh) | 一种gis与bim增强现实在建筑规划的互动演示方法及系统 | |
US11734902B2 (en) | Contextual control of digital files built on the blockchain and projected in augmented reality | |
CN110188595A (zh) | 一种基于ar和cnn算法的动物园游览系统及游览方法 | |
CN109978175A (zh) | 用于机器学习模型的并行化坐标下降法 | |
CN110427564A (zh) | 将深度学习集成到广义加性混合效应(game)框架中 | |
Giuffrida et al. | A YOLOv2 convolutional neural network-based human–machine interface for the control of assistive robotic manipulators | |
As et al. | Artificial intelligence in urban planning and design: Technologies, implementation, and impacts | |
Libo et al. | Wireless multimedia sensor network for rape disease detections | |
CN116319862A (zh) | 一种智能匹配数字图书馆的系统及方法 | |
CN109766790A (zh) | 一种基于自适应特征通道的行人检测方法 | |
CN103714195B (zh) | 在非对应数据集之间对基础设施布局进行绘图的方法和系统 | |
Karimov et al. | Comparing neural style transfer and gradient-based algorithms in brushstroke rendering tasks | |
Manzoor et al. | 3D recognition based on sensor modalities for robotic systems: A survey | |
Jo et al. | Generative artificial intelligence and building design: early photorealistic render visualization of façades using local identity-trained models | |
Galbraith et al. | Implicit visualization and inverse modeling of growing trees | |
Wu et al. | Artificial intelligence algorithms in ice and snow tourism promotion from digital technology |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190830 |
|
RJ01 | Rejection of invention patent application after publication |