CN112257673A - 基于旅游图像的动物识别方法、系统、设备及存储介质 - Google Patents
基于旅游图像的动物识别方法、系统、设备及存储介质 Download PDFInfo
- Publication number
- CN112257673A CN112257673A CN202011287094.7A CN202011287094A CN112257673A CN 112257673 A CN112257673 A CN 112257673A CN 202011287094 A CN202011287094 A CN 202011287094A CN 112257673 A CN112257673 A CN 112257673A
- Authority
- CN
- China
- Prior art keywords
- animal
- image
- information
- images
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Remote Sensing (AREA)
- Image Analysis (AREA)
Abstract
本发明提供了基于旅游图像的动物识别方法、系统、设备及存储介质,该方法包括:通过经过训练的动物分类网络对图像进行动物分类,获得图像的动物信息;以及将图像的动物信息与预设的动物集合进行对比,执行动物信息命中的动物种类所对应的操作信息,动物集合中包括多种动物种类,并且每种动物种类对应至少一操作信息。本发明能够实现对开放场景进行自动识别的机制,减少人工成本,提升效率,并且,利用检测和分类,能够识别图像中的动物种类,并进行相应的操作。
Description
技术领域
本发明涉及图片识别领域,具体地说,涉及基于旅游图像的动物识别方法、系统、设备及存储介质。
背景技术
在当前大数据时代,人人持有手机或相机,越来越多的图片被拍下,携程图库也随之拥有更多的图片,如何整理这么多图片并应用成为一个问题。图片千姿百态,涉及各个场景和角度,质量参差不齐,数量庞大。人工也无法有这么多精力和资源去整理这些图片。近些年深度学习的崛起,使智能代替人工,大部分的机器视觉是要服务于人像类应用,识别动物的方案非常少。
因此,本发明提供了一种基于旅游图像的动物识别方法、系统、设备及存储介质。
发明内容
针对现有技术中的问题,本发明的目的在于提供基于旅游图像的动物识别方法、系统、设备及存储介质,克服了现有技术的困难,能够实现对开放场景进行自动识别的机制,减少人工成本,提升效率,并且,利用检测和分类,能够识别图像中的动物种类,并进行相应的操作。
本发明的实施例提供一种基于旅游图像的动物识别方法,包括以下步骤:
S110、通过经过训练的动物分类网络对图像进行动物分类,获得图像的动物信息;以及
S120、将所述图像的动物信息与预设的动物集合进行对比,执行所述动物信息命中的动物种类所对应的操作信息,所述动物集合中包括多种动物种类,并且每种所述动物种类对应至少一操作信息。
优选地,所述步骤S110包括以下步骤:
S111、对线上图片进行挖掘;
S112、建立目标检测模型,对图片进行画面识别,当含有动物图像的概率大于预设阈值,则输出至少一包含动物图像的检测框;
S113、通过动物分类模型,对框内动物进行分类标示。
优选地,所述步骤S113中,包括以下步骤
S1131、将训练集图片统一到一个预设图片尺寸,并对图片进行预处理,包含旋转、水平位置平移、垂直位置平移、投影、缩放、水平翻转;
S1132、搭建对应的深度卷积神经网络,基础模型选取xception深度学习模型,包括两层全连接层,并在训练时加入bn层和dropout层;dropout层随机丢弃50%的节点,防止模型过拟合,加入bn层,通过将同一个batch下单图片均值和方差一致化,加快训练速度,提高模型精度;
S1133、将检测框中的图像输入分类模型,对图片做旋转、平移、缩放、翻转处理;模型预训练采取imagenet预训练模型,冻结训练层,仅训练后面的全连接层,优化算法采取RMSProp优化算法,输出所述图像的动物信息。
优选地,所述预设图片尺寸为299像素×299像素。
优选地,所述步骤S110还包括以下步骤:
S114、获得所述图像生成时的定位信息;
所述步骤S120中,当所述动物信息命中的动物种类所对应的操作信息,则根据所述图像的动物种类以及定位信息预设操作信息。
优选地,所述步骤S120中还包括提供一实时更新的区域电子地图,所述区域电子地图采集范围内所有图像获取设备的图像以及生成图像时所述图像获取设备的定位信息。
优选地,所述动物集合包括危险动物的名单以及预设安全半径,当随所述区域电子地图获得危险动物的图像时,基于获得危险动物的所述图像获取设备的定位信息为中心结合预设安全半径生成一个警戒范围,并将拍摄到所述危险动物的图像的定位信息发送警告信息给所述警戒范围内的所有移动终端。
优选地,基于在所述警戒范围内的移动终端的当前定位信息获得离开所述警戒范围的距离最短路径获得撤离路径,所述警告信息包含所述撤离路径。
优选地,所述移动终端基于所述区域电子地图输入目标动物,所述区域电子地图根据所述移动终端的定位信息以及最接近的拍摄到目标动物的定位信息生成参观路径。
本发明的实施例还提供一种基于旅游图像的动物识别系统,用于实现上述的基于旅游图像的动物识别方法,所述基于旅游图像的动物识别系统包括:
动物分类模块,通过经过训练的动物分类网络对图像进行动物分类,获得图像的动物信息;以及
操作信息模块,将所述图像的动物信息与预设的动物集合进行对比,执行所述动物信息命中的动物种类所对应的操作信息,所述动物集合中包括多种动物种类,并且每种所述动物种类对应至少一操作信息。
本发明的实施例还提供一种基于旅游图像的动物识别设备,包括:
处理器;
存储器,其中存储有所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行上述基于旅游图像的动物识别方法的步骤。
本发明的实施例还提供一种计算机可读存储介质,用于存储程序,所述程序被执行时实现上述基于旅游图像的动物识别方法的步骤。
本发明的目的在于提供基于旅游图像的动物识别方法、系统、设备及存储介质,能够实现对开放场景进行自动识别的机制,减少人工成本,提升效率,并且,利用检测和分类,能够识别图像中的动物种类,并进行相应的操作。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显。
图1是本发明的基于旅游图像的动物识别方法的流程图。
图2至6是实施本发明的基于旅游图像的动物识别方法的过程示意图。
图7是本发明的基于旅游图像的动物识别系统的模块示意图。
图8是本发明的基于旅游图像的动物识别设备的结构示意图。
图9是本发明一实施例的计算机可读存储介质的结构示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的实施方式。相反,提供这些实施方式使得本发明将全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的结构,因而将省略对它们的重复描述。
图1是本发明的基于旅游图像的动物识别方法的流程图。如图1所示,本发明的实施例提供一种基于旅游图像的动物识别方法,包括以下步骤:
S110、通过经过训练的动物分类网络对图像进行动物分类,获得图像的动物信息。以及
S120、将图像的动物信息与预设的动物集合进行对比,执行动物信息命中的动物种类所对应的操作信息,动物集合中包括多种动物种类,并且每种动物种类对应至少一操作信息。
本发明要解决的问题:针对现在大量图片无标签的情况,建立算法模型,过滤掉大量非动物图片,对含动物图片进行识别,判断是否为特定动物,方便后续其它模型的处理。
在一个优选实施例中,步骤S110包括以下步骤:
S111、对线上图片进行挖掘。
S112、建立目标检测模型,对图片进行画面识别,当含有动物图像的概率大于预设阈值,则输出至少一包含动物图像的检测框。
S113、通过动物分类模型,对框内动物进行分类标示。
在一个优选实施例中,步骤S113中,包括以下步骤
S1131、将训练集图片统一到一个预设图片尺寸,并对图片进行预处理,包含旋转、水平位置平移、垂直位置平移、投影、缩放、水平翻转。
S1132、搭建对应的深度卷积神经网络,基础模型选取xception深度学习模型,包括两层全连接层,并在训练时加入bn层和dropout层。dropout层随机丢弃50%的节点,防止模型过拟合,加入bn层,通过将同一个batch下单图片均值和方差一致化,加快训练速度,提高模型精度。
S1133、将检测框中的图像输入分类模型,对图片做旋转、平移、缩放、翻转处理。模型预训练采取imagenet预训练模型,冻结训练层,仅训练后面的全连接层,优化算法采取RMSProp优化算法,输出图像的动物信息。
在一个优选实施例中,预设图片尺寸为299像素×299像素。
在一个优选实施例中,步骤S110还包括以下步骤:
S114、获得图像生成时的定位信息。
步骤S120中,当动物信息命中的动物种类所对应的操作信息,则根据图像的动物种类以及定位信息预设操作信息。
在一个优选实施例中,步骤S120中还包括提供一实时更新的区域电子地图,区域电子地图采集范围内所有图像获取设备的图像以及生成图像时图像获取设备的定位信息。
在一个优选实施例中,动物集合包括危险动物的名单以及预设安全半径,当随区域电子地图获得危险动物的图像时,基于获得危险动物的图像获取设备的定位信息为中心结合预设安全半径生成一个警戒范围,并将拍摄到危险动物的图像的定位信息发送警告信息给警戒范围内的所有移动终端。
在一个优选实施例中,基于在警戒范围内的移动终端的当前定位信息获得离开警戒范围的距离最短路径获得撤离路径,警告信息包含撤离路径。
在一个优选实施例中,移动终端基于区域电子地图输入目标动物,区域电子地图根据移动终端的定位信息以及最接近的拍摄到目标动物的定位信息生成参观路径。
如图2至6所示,举例说明本发明的基于旅游图像的动物识别方法的实施过程。参考图2至6所示,使用本发明的基于旅游图像的动物识别方法,包括以下步骤:
如图2所示,在一个国家动物园中,多个用户30、31、32、33、34、35、36、37、38在野生动物园中游玩,其中,如图3所示,用户30是用手机11拍摄了老虎的照片,该照片具有手机11记录的拍摄地点的GPS信息,并上传到服务器。如图4所示,国家动物园设置的监控摄像头2拍摄到了犀牛的照片,该照片具有预设的监控摄像头2的GPS信息,并上传到服务器。如图5所示,用户37是用手机13拍摄了羚羊的照片,该照片具有手机13记录的拍摄地点的GPS信息,并上传到服务器。服务器通过经过训练的动物分类网络对图像进行动物分类,获得图像的动物信息。
本实施例中,动物识别分类方法具体包含以下步骤:
S01:对线上图片进行挖掘,包括但不限于景点、玩乐等。对于S01,在本案实施中,挖掘不同类型的线上图片,选取一些可能出现动物的场景,对图片中动物进行分类,保证每个类别图片不少于500张。具体类别包含老虎、狮子、大熊猫、猴子、火烈鸟、袋鼠、考拉、大象、鹿、熊、马/斑马、羊驼、猫狗、家禽、企鹅、水生动物、其他动物和无动物。
S02:建立目标检测模型,对图片进行画面识别,判断是否含有动物。目标检测模型可以筛除大部分非动物图片,控制后续分类模型的输入不再杂乱。对于S02中目标检测模型,由于标注动物检测数据较为耗时,采取开源的目标检测模型,经测试,fasterrcnn-inceptionresnetv2模型效果较好,检测模型的训练数据基于open image的开放式数据集,共500-600个类别,选取其中100多个动物类别,若画面预测中含该100多个动物类别标签,且预测概率大于0.3,则视为该图片中可能含有动物,将该类别对应的检测框进行裁剪输出。若画面预测标签中不含动物类别,则视为不含动物,不进入S03的分类模型。
S03:若图片检测出含动物,框选出动物,并输出最高概率动物框,建立动物分类模型,对框内动物进行分类。若未检测出动物则不进入分类模型。对于S03中的分类模型的实现,具体流程图如附图2所示。具体的,包含以下步骤:
步骤一:数据集预处理。将训练集图片统一固定到299×299,并对图片进行预处理,包含旋转、水平位置平移、垂直位置平移、投影、缩放、水平翻转等。可以通过变换操作得到不同的图片,增加训练集数量,有效减少过拟合现象,最后进行归一化操作,消除特征间单位和尺度差异的影响。
步骤二:网络搭建。在本发明中,根据目标特点,搭建对应的深度卷积神经网络,基础模型选取xception深度学习模型,模型较快且准确率较高。修改最后的全连接层,将原模型中最后的全连接层替换为两层全连接层,并在训练时加入bn层和dropout层。Dropout随机丢弃50%的节点,防止模型过拟合,加入bn层,通过将同一个batch下单图片均值和方差一致化,加快训练速度,提高模型精度。最后加入分类层进行分类,包含动物和其它在内,共18个类别。
步骤三:模型训练。在本发明中,分类模型输入为S02中的检测框。然后对图片做旋转、平移、缩放、翻转等处理,加强模型的鲁棒性。模型预训练采取imagenet预训练模型,由于动物数据集和imagenet数据集具有一定的相似性,故在训练过程中并未对模型进行全部训练,而是冻结训练层,仅训练后面的全连接层,优化算法采取RMSProp优化算法。由于线上训练样本极度不均衡,部分类别数量较多,而部分类别数量很少,在训练时采取对不同数量的类别采取不同权重,数量少的类别在训练时占较大权重,所以在迭代模型的损失函数时,对于数量较少的类别可以着重去优化。最后迭代模型,直到其在验证集上的测试效果达到最优。
步骤四:模型预测。利用步骤三中训练好的模型对线上OTA图片做前向预测,输出图像的动物类别,如无动物不输出。对于预测图片做归一化处理,不做其他预处理。
S04:人工干预和确认图片分类,并进行纠错。
对于S04,将S03中预测的道德类别,与人工合适,若模型预测类别与人工相同,则为正确,反之为错误,需要进一步调整训练。针对错误的case,总结错误类型,如训练集中缺乏相关数据,则使用爬虫补充相应数据到训练集中,重复多轮迭代。
最后,将图像的动物信息与预设的动物集合进行对比,执行动物信息命中的动物种类所对应的操作信息,动物集合中包括多种动物种类,并且每种动物种类对应至少一操作信息。提供一实时更新的区域电子地图,区域电子地图采集范围内所有图像获取设备的图像以及生成图像时图像获取设备的定位信息,在区域电子地图中根据照片出别处的动物类别以及照片的定位信息生成老虎21、犀牛22、羚羊23的图标。
本实施例中,动物集合包括危险动物的名单以及预设安全半径(200米),危险动物的名单包括老虎和犀牛等。当随区域电子地图获得危险动物的图像时,基于获得危险动物的图像获取设备的定位信息为中心结合预设安全半径(200米)生成一个圆形的警戒范围,并将拍摄到危险动物的图像的定位信息发送警告信息给警戒范围内的所有移动终端。
如图6所示,位于危险动物老虎21的定位信息为圆心,200米为半径的圆形警戒范围25中的用户30、31的手机货收到警告信息,警告信息包含基于各自的当前定位信息获得离开警戒范围25的距离最短路径获得撤离路径40、41,从而提醒用户30、31尽早从危险动物的附近撤离,避免危险事故(老虎袭击用户)的发生,提高了用户30、31的人员安全性。位于危险动物犀牛22的定位信息为圆心,200米为半径的圆形警戒范围25中的用户38的手机货收到警告信息,警告信息包含基于各自的当前定位信息获得离开警戒范围26的距离最短路径获得撤离路径42从而提醒用户38尽早从危险动物的附近撤离,避免危险事故(犀牛袭击用户)的发生,提高了用户38的人员安全性。用户34、35利用移动终端基于区域电子地图输入目标动物羚羊,则区域电子地图根据移动终端的定位信息以及最接近的拍摄到目标动物羚羊23的定位信息分别生成参观路径60、61,参观路径60被发送到用户35的手机,参观路径61被发送到用户34的手机,从而引导用户34、35更快看到目标动物羚羊23。
本发明基于线上海量图片,利用检测和分类,能够过滤大部分无动物的图片,然后进一步对可能含动物的图片,根据我们的需求进行分类,实现了一个对开放场景进行自动识别的机制,减少人工成本,提升效率,便于后续对识别结果的进一步利用。本发明的基于旅游图像的动物识别方法能够实现对开放场景进行自动识别的机制,减少人工成本,提升效率,并且,利用检测和分类,能够识别图像中的动物种类,并进行相应的操作。
图7是本发明的基于旅游图像的动物识别系统的模块示意图。如图7所示,本发明的基于旅游图像的动物识别系统5包括:
动物分类模块51,通过经过训练的动物分类网络对图像进行动物分类,获得图像的动物信息。
操作信息模块52,将图像的动物信息与预设的动物集合进行对比,执行动物信息命中的动物种类所对应的操作信息,动物集合中包括多种动物种类,并且每种动物种类对应至少一操作信息。
本发明的基于旅游图像的动物识别系统能够实现对开放场景进行自动识别的机制,减少人工成本,提升效率,并且,利用检测和分类,能够识别图像中的动物种类,并进行相应的操作。
本发明实施例还提供一种基于旅游图像的动物识别设备,包括处理器。存储器,其中存储有处理器的可执行指令。其中,处理器配置为经由执行可执行指令来执行的基于旅游图像的动物识别方法的步骤。
如上所示,该实施例本发明的基于旅游图像的动物识别系统能够实现对开放场景进行自动识别的机制,减少人工成本,提升效率,并且,利用检测和分类,能够识别图像中的动物种类,并进行相应的操作。
所属技术领域的技术人员能够理解,本发明的各个方面可以实现为系统、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“平台”。
图8是本发明的基于旅游图像的动物识别设备的结构示意图。下面参照图8来描述根据本发明的这种实施方式的电子设备600。图8显示的电子设备600仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图8所示,电子设备600以通用计算设备的形式表现。电子设备600的组件可以包括但不限于:至少一个处理单元610、至少一个存储单元620、连接不同平台组件(包括存储单元620和处理单元610)的总线630、显示单元640等。
其中,存储单元存储有程序代码,程序代码可以被处理单元610执行,使得处理单元610执行本说明书上述电子处方流转处理方法部分中描述的根据本发明各种示例性实施方式的步骤。例如,处理单元610可以执行如图1中所示的步骤。
存储单元620可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)6201和/或高速缓存存储单元6202,还可以进一步包括只读存储单元(ROM)6203。
存储单元620还可以包括具有一组(至少一个)程序模块6205的程序/实用工具6204,这样的程序模块6205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线630可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备600也可以与一个或多个外部设备700(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备600交互的设备通信,和/或与使得该电子设备600能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口650进行。并且,电子设备600还可以通过网络适配器660与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。网络适配器660可以通过总线630与电子设备600的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备600使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储平台等。
本发明实施例还提供一种计算机可读存储介质,用于存储程序,程序被执行时实现的基于旅游图像的动物识别方法的步骤。在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在终端设备上运行时,程序代码用于使终端设备执行本说明书上述电子处方流转处理方法部分中描述的根据本发明各种示例性实施方式的步骤。
如上所示,该实施例本发明的基于旅游图像的动物识别系统能够实现对开放场景进行自动识别的机制,减少人工成本,提升效率,并且,利用检测和分类,能够识别图像中的动物种类,并进行相应的操作。
图9是本发明的计算机可读存储介质的结构示意图。参考图9所示,描述了根据本发明的实施方式的用于实现上述方法的程序产品800,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
综上,本发明的目的在于提供基于旅游图像的动物识别方法、系统、设备及存储介质,本发明的基于旅游图像的动物识别系统能够实现对开放场景进行自动识别的机制,减少人工成本,提升效率,并且,利用检测和分类,能够识别图像中的动物种类,并进行相应的操作。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。
Claims (12)
1.一种基于旅游图像的动物识别方法,其特征在于,包括以下步骤:
S110、通过经过训练的动物分类网络对图像进行动物分类,获得图像的动物信息;以及
S120、将所述图像的动物信息与预设的动物集合进行对比,执行所述动物信息命中的动物种类所对应的操作信息,所述动物集合中包括多种动物种类,并且每种所述动物种类对应至少一操作信息。
2.根据权利要求1所述的基于旅游图像的动物识别方法,其特征在于,所述步骤S110包括以下步骤:
S111、对线上图片进行挖掘;
S112、建立目标检测模型,对图片进行画面识别,当含有动物图像的概率大于预设阈值,则输出至少一包含动物图像的检测框;
S113、通过动物分类模型,对框内动物进行分类标示。
3.根据权利要求2所述的基于旅游图像的动物识别方法,其特征在于,所述步骤S113中,包括以下步骤
S1131、将训练集图片统一到一个预设图片尺寸,并对图片进行预处理,包含旋转、水平位置平移、垂直位置平移、投影、缩放、水平翻转;
S1132、搭建对应的深度卷积神经网络,基础模型选取xception深度学习模型,包括两层全连接层,并在训练时加入bn层和dropout层;dropout层随机丢弃50%的节点,防止模型过拟合,加入bn层,通过将同一个batch下单图片均值和方差一致化,加快训练速度,提高模型精度;
S1133、将检测框中的图像输入分类模型,对图片做旋转、平移、缩放、翻转处理;模型预训练采取imagenet预训练模型,冻结训练层,仅训练后面的全连接层,优化算法采取RMSProp优化算法,输出所述图像的动物信息。
4.根据权利要求3所述的基于旅游图像的动物识别方法,其特征在于,所述预设图片尺寸为299像素×299像素。
5.根据权利要求1所述的基于旅游图像的动物识别方法,其特征在于,所述步骤S110还包括以下步骤:
S114、获得所述图像生成时的定位信息;
所述步骤S120中,当所述动物信息命中的动物种类所对应的操作信息,则根据所述图像的动物种类以及定位信息预设操作信息。
6.根据权利要求5所述的基于旅游图像的动物识别方法,其特征在于,所述步骤S120中还包括提供一实时更新的区域电子地图,所述区域电子地图采集范围内所有图像获取设备的图像以及生成图像时所述图像获取设备的定位信息。
7.根据权利要求6所述的基于旅游图像的动物识别方法,其特征在于,所述动物集合包括危险动物的名单以及预设安全半径,当随所述区域电子地图获得危险动物的图像时,基于获得危险动物的所述图像获取设备的定位信息为中心结合预设安全半径生成一个警戒范围,并将拍摄到所述危险动物的图像的定位信息发送警告信息给所述警戒范围内的所有移动终端。
8.根据权利要求7所述的基于旅游图像的动物识别方法,其特征在于,基于在所述警戒范围内的移动终端的当前定位信息获得离开所述警戒范围的距离最短路径获得撤离路径,所述警告信息包含所述撤离路径。
9.根据权利要求7所述的基于旅游图像的动物识别方法,其特征在于,所述移动终端基于所述区域电子地图输入目标动物,所述区域电子地图根据所述移动终端的定位信息以及最接近的拍摄到目标动物的定位信息生成参观路径。
10.一种基于旅游图像的动物识别系统,用于实现权利要求1所述的基于旅游图像的动物识别方法,其特征在于,包括:
动物分类模块,通过经过训练的动物分类网络对图像进行动物分类,获得图像的动物信息;以及
操作信息模块,将所述图像的动物信息与预设的动物集合进行对比,执行所述动物信息命中的动物种类所对应的操作信息,所述动物集合中包括多种动物种类,并且每种所述动物种类对应至少一操作信息。
11.一种基于旅游图像的动物识别设备,其特征在于,包括:
处理器;
存储器,其中存储有所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1至10任意一项所述基于旅游图像的动物识别方法的步骤。
12.一种计算机可读存储介质,用于存储程序,其特征在于,所述程序被执行时实现权利要求1至10任意一项所述基于旅游图像的动物识别方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011287094.7A CN112257673A (zh) | 2020-11-17 | 2020-11-17 | 基于旅游图像的动物识别方法、系统、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011287094.7A CN112257673A (zh) | 2020-11-17 | 2020-11-17 | 基于旅游图像的动物识别方法、系统、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112257673A true CN112257673A (zh) | 2021-01-22 |
Family
ID=74265965
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011287094.7A Pending CN112257673A (zh) | 2020-11-17 | 2020-11-17 | 基于旅游图像的动物识别方法、系统、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112257673A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113627271A (zh) * | 2021-07-18 | 2021-11-09 | 武汉大学 | 一种移动式岩石矿物快速智能识别方法 |
CN113671892A (zh) * | 2021-08-18 | 2021-11-19 | 迟明海 | 一种基于云平台的动物管理方法和动物管理系统 |
CN113852792A (zh) * | 2021-09-18 | 2021-12-28 | 杭州禹疆智能科技有限公司 | 一种基于人工智能的监控系统及监控方法 |
-
2020
- 2020-11-17 CN CN202011287094.7A patent/CN112257673A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113627271A (zh) * | 2021-07-18 | 2021-11-09 | 武汉大学 | 一种移动式岩石矿物快速智能识别方法 |
CN113671892A (zh) * | 2021-08-18 | 2021-11-19 | 迟明海 | 一种基于云平台的动物管理方法和动物管理系统 |
CN113671892B (zh) * | 2021-08-18 | 2024-03-12 | 迟明海 | 一种基于云平台的动物管理方法和动物管理系统 |
CN113852792A (zh) * | 2021-09-18 | 2021-12-28 | 杭州禹疆智能科技有限公司 | 一种基于人工智能的监控系统及监控方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112257673A (zh) | 基于旅游图像的动物识别方法、系统、设备及存储介质 | |
CN108303747B (zh) | 检查设备和检测枪支的方法 | |
CN112529020B (zh) | 基于神经网络的动物识别方法、系统、设备及存储介质 | |
CN111598164B (zh) | 识别目标对象的属性的方法、装置、电子设备和存储介质 | |
CN111753863A (zh) | 一种图像分类方法、装置、电子设备及存储介质 | |
EP3765995B1 (en) | Systems and methods for inter-camera recognition of individuals and their properties | |
US20200349364A1 (en) | Method and apparatus for training lane line identifying model, device, and storage medium | |
US20210303899A1 (en) | Systems and methods for automatic recognition of vehicle information | |
CN111680753A (zh) | 一种数据标注方法、装置、电子设备及存储介质 | |
CN112949578B (zh) | 车灯状态识别方法、装置、设备及存储介质 | |
CN115004269A (zh) | 监视装置、监视方法及程序 | |
CN110490058B (zh) | 行人检测模型的训练方法、装置、系统和计算机可读介质 | |
CN109242882B (zh) | 视觉跟踪方法、装置、介质及设备 | |
CN114663871A (zh) | 图像识别方法、训练方法、装置、系统及存储介质 | |
US20210406568A1 (en) | Utilizing multiple stacked machine learning models to detect deepfake content | |
US11670098B2 (en) | Systems and methods for automatic recognition of vehicle information | |
CN113239883A (zh) | 分类模型的训练方法、装置、电子设备以及存储介质 | |
Kostoeva et al. | Indoor 3D interactive asset detection using a smartphone | |
CN113705293A (zh) | 图像场景的识别方法、装置、设备及可读存储介质 | |
CN116563860A (zh) | 基于人工智能的数据脱敏方法、装置、计算机设备及介质 | |
CN113869431B (zh) | 虚假信息检测方法、系统、计算机设备及可读存储介质 | |
CN114120287A (zh) | 数据处理方法、装置、计算机设备和存储介质 | |
Khurat et al. | An open-source based automatic car detection system using iot | |
Selçuk et al. | Development of a Traffic Speed Limit Sign Detection System Based on Yolov4 Network | |
CN112733578A (zh) | 车辆重识别方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |