CN111339999A - 一种用于视觉导航机器人图像处理系统及处理方法 - Google Patents

一种用于视觉导航机器人图像处理系统及处理方法 Download PDF

Info

Publication number
CN111339999A
CN111339999A CN202010207544.0A CN202010207544A CN111339999A CN 111339999 A CN111339999 A CN 111339999A CN 202010207544 A CN202010207544 A CN 202010207544A CN 111339999 A CN111339999 A CN 111339999A
Authority
CN
China
Prior art keywords
module
picture
robot
pictures
image processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010207544.0A
Other languages
English (en)
Inventor
任斌
刘志佳
卢杰鑫
雷震霆
陈瑾庭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dongguan University of Technology
Original Assignee
Dongguan University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dongguan University of Technology filed Critical Dongguan University of Technology
Priority to CN202010207544.0A priority Critical patent/CN111339999A/zh
Publication of CN111339999A publication Critical patent/CN111339999A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • G01C21/20Instruments for performing navigational calculations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Remote Sensing (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Automation & Control Theory (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种用于视觉导航机器人图像处理系统,包括机器人和计算机终端,所述机器人包括卷积神经网络模块、分类模块、存储模块及第一无线通讯模块,所述计算机终端包括无线摄像头模块、图片处理模块、分类模型模块及第二无线通讯模块。本发明仅取图片最上层像素点作为训练样本搭配更为简单快速的全连接神经网络,将大幅降低模型的训练时长;而且图片经过裁剪出最上一层的操作后,不同分类的图片的特征值明确且差别大,模型训练和模型判断时都会有更高的准确性和抗干扰性;与此同时,视觉导航驾驶时把图片送去网络判断分类模型将会更为快速,提高了机器人的实时性。

Description

一种用于视觉导航机器人图像处理系统及处理方法
技术领域
本发明属于机器人技术领域,具体涉及一种用于视觉导航机器人图像处理系统及处理方法。
背景技术
在智能机器人的研究中,机器人的导航是一个十分重要的问题,导航是智能机器人的核心技术,也是实现真正地智能化和完全自主移动的关键技术。机器人导航的方式有很多一种,例如惯性导航、视觉导航、GPS定位导航、利用传感器的数据导航等等。视觉方法时近年发展起来的一种先进的导航方案,视觉传感器为机器人提供了十分丰富的外界信息,并且在不需要传感器的运动以及物体无任何接触的情况下,就可以达到对环境和目标的识别,这是其他传感器难以做到的,此外视觉传感器所提供的信息往往比其他传感器丰富得多,更有利于机器人对当前坏境的识别和导航。
现有方案中将整张图片作为训练样本训练神经网络,由于图片的信息量本较大,在训练样本庞大时,这会导致神经网络的训练过程异常耗时,对电脑配置也有不少的要求;由于一张图片的特征多,会导致训练出来的模型抗干扰性较差,不利于提升系统的鲁棒性;此外,在机器人视觉导航驾驶过程中,将实时采集的图片送入神经网络判断,也需要消耗一部分时间,降低机器人的实时性。
发明内容
本发明的目的在于提供一种用于视觉导航机器人图像处理系统,以解决上述背景技术中提出现有技术中图片量大神经网络的训练过程异常耗时的问题。
为实现上述目的,本发明采用了如下技术方案:
一种用于视觉导航机器人图像处理系统,包括机器人和计算机终端,所述机器人包括卷积神经网络模块、分类模块、存储模块及第一无线通讯模块,所述计算机终端包括无线摄像头模块、图片处理模块、分类模型模块及第二无线通讯模块,所述机器人和计算机终端通过第一无线通讯模块和第二无线通讯模块信号连接。
优选的,所述无线摄像头模块采用多广角CMOS摄像头。
优选的,所述图片处理模块包括图片抓取模块和图片识别模块,所述图片抓取模块用于图片处理模块中抓取图片,所述图片识别模块用于识别图片抓取模块抓取来的图片并将识别结果输出给计算机终端。
优选的,所述分类模块包括特征识别模块,用于识别所提取的图片的特征,将所识别的特征与所设置的图片的基本特征进行比对。
本发明还提供一种用于视觉导航机器人图像处理方法,包括以下步骤:
S1、使用无线摄像头模块进行拍摄赛道阶段图片并传输给计算机终端,所述计算机终端中的图片处理模块对图片进行压缩、滤波、剪切,裁取图片的最上端并保存;
S2、利用计算机终端通过第二无线通讯模块将处理后的图片传输给机器人,所述机器人中的卷积神经网络模块对图片进行分类判断,得到分类结果,从而指导机器人做出相应的动作完成道路的驾驶并通过存储模块进行保存;
S3、图片处理模块中仅取图片最上层一行的像素点作为训练样本训练一个全连接神经网络,得到分类模型;
S4、机器人视觉导航时实时采集的图片进过处理后也是取最上层一行的像素点递送给网络做判断,机器人由此作出相应的反应;
S5、利用图片处理模块中由人工去除掉一些模糊或者不能分辨方向的图片后,首先将图片进行适当压缩以及裁剪,降低图片的信息量,进过压缩以及裁剪后的图片。
优选的,所述S2中,为了神经网络更容易对各种路况进行比较准确的分类,同时为了尽可能减轻因光线和环境问题而引发的各种问题,将裁剪后的图像经过滤波和二值化处理。
优选的,所述S3中分类模型模块对裁取后的图片进行分类处理,并对照整个赛道的路径进行对比。
优选的,所述S2中图片的处理为缩放处理,采集到的图片像素值为640*480,经过缩放后像素值为320*240。
本发明的技术效果和优点:本发明提出的一种用于视觉导航机器人图像处理系统,与现有技术相比,具有以下优点:
本发明仅取图片最上层像素点作为训练样本搭配更为简单快速的全连接神经网络,将大幅降低模型的训练时长;而且图片经过裁剪出最上一层的操作后,不同分类的图片的特征值明确且差别大,模型训练和模型判断时都会有更高的准确性和抗干扰性;与此同时,视觉导航驾驶时把图片送去网络判断分类模型将会更为快速,提高了机器人的实时性。
附图说明
图1为本发明一种用于视觉导航机器人图像处理系统的结构示意图;
图2为本发明的操作流程示意图;
图3为本发明实施例1中压缩和裁剪后的图片示意图;
图4为本发明实施例1中滤波和二值化后的图片示意图;
图5为本发明实施例1中训练样本示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供了如图1-4所示的一种用于视觉导航机器人图像处理系统,包括机器人和计算机终端,所述机器人包括卷积神经网络模块、分类模块、存储模块及第一无线通讯模块,所述计算机终端包括无线摄像头模块、图片处理模块、分类模型模块及第二无线通讯模块,所述机器人和计算机终端通过第一无线通讯模块和第二无线通讯模块信号连接。所述无线摄像头模块采用多广角CMOS摄像头。所述图片处理模块包括图片抓取模块和图片识别模块,所述图片抓取模块用于图片处理模块中抓取图片,所述图片识别模块用于识别图片抓取模块抓取来的图片并将识别结果输出给计算机终端。所述分类模块包括特征识别模块,用于识别所提取的图片的特征,将所识别的特征与所设置的图片的基本特征进行比对。
实施例1
本发明还提出一种用于视觉导航机器人图像处理方法,包括以下步骤:
S1、使用无线摄像头模块进行拍摄赛道阶段图片并传输给计算机终端,所述计算机终端中的图片处理模块对图片进行压缩、滤波、剪切,裁取图片的最上端并保存;
S2、利用计算机终端通过第二无线通讯模块将处理后的图片传输给机器人,所述机器人中的卷积神经网络模块对图片进行分类判断,得到分类结果,图片的处理为缩放处理,采集到的图片像素值为640*480,经过缩放后像素值为320*240,从而指导机器人做出相应的动作完成道路的驾驶并通过存储模块进行保存,为了神经网络更容易对各种路况进行比较准确的分类,同时为了尽可能减轻因光线和环境问题而引发的各种问题,将裁剪后的图像经过滤波和二值化处理;
S3、图片处理模块中仅取图片最上层一行的像素点作为训练样本训练一个全连接神经网络,得到分类模型,分类模型模块对裁取后的图片进行分类处理,并对照整个赛道的路径进行对比;
S4、机器人视觉导航时实时采集的图片进过处理后也是取最上层一行的像素点递送给网络做判断,机器人由此作出相应的反应;
S5、利用图片处理模块中由人工去除掉一些模糊或者不能分辨方向的图片后,首先将图片进行适当压缩以及裁剪,降低图片的信息量,进过压缩以及裁剪后的图片。
卷积神经网络模块代码为:
tf.reset_default_graph()#清除默认图形堆栈并重置全局默认图形.
#输入层
tf_X=tf.placeholder(tf.float32,[None,width],name='input')#图像尺寸n180 480 1
tf_Y=tf.placeholder(tf.float32,[None,4])#n 4
#全连接层
fc_w1=tf.Variable(tf.random_normal([480,100]))#50个神经元
fc_b1=tf.Variable(tf.random_normal([100]))
fc_out1=tf.nn.relu(tf.matmul(tf_X,fc_w1)+fc_b1)#使用relu激活函数
#dropout层占位
dropout_keep_prob=tf.placeholder(tf.float32,name='keep')
fc1_drop=tf.nn.dropout(fc_out1,dropout_keep_prob)
#输出层
out_w1=tf.Variable(tf.random_normal([100,4]))#100个神经元,输出结果为4分类
out_b1=tf.Variable(tf.random_normal([4]))
pred=tf.nn.softmax(tf.matmul(fc1_drop,out_w1)+out_b1,name='pred')
#把N*1的向量归一化为0-1的值,分类一般用这个激励函数
#定义损耗函数和训练过程
loss=-tf.reduce_mean(tf_Y*tf.log(tf.clip_by_value(pred,1e-11,1.0)))
train_step=tf.train.AdamOptimizer(1e-3,name='train_step').minimize(loss)。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种用于视觉导航机器人图像处理系统,包括机器人和计算机终端,其特征在于:所述机器人包括卷积神经网络模块、分类模块、存储模块及第一无线通讯模块,所述计算机终端包括无线摄像头模块、图片处理模块、分类模型模块及第二无线通讯模块,所述机器人和计算机终端通过第一无线通讯模块和第二无线通讯模块信号连接。
2.根据权利要求1所述的一种用于视觉导航机器人图像处理系统,其特征在于:所述无线摄像头模块采用多广角CMOS摄像头。
3.根据权利要求1所述的一种用于视觉导航机器人图像处理系统,其特征在于:所述图片处理模块包括图片抓取模块和图片识别模块,所述图片抓取模块用于图片处理模块中抓取图片,所述图片识别模块用于识别图片抓取模块抓取来的图片并将识别结果输出给计算机终端。
4.根据权利要求1所述的一种用于视觉导航机器人图像处理系统,其特征在于:所述分类模块包括特征识别模块,用于识别所提取的图片的特征,将所识别的特征与所设置的图片的基本特征进行比对。
5.一种权利要求1所述的用于视觉导航机器人图像处理方法,其特征在于:包括以下步骤:
S1、使用无线摄像头模块进行拍摄赛道阶段图片并传输给计算机终端,所述计算机终端中的图片处理模块对图片进行压缩、滤波、剪切,裁取图片的最上端并保存;
S2、利用计算机终端通过第二无线通讯模块将处理后的图片传输给机器人,所述机器人中的卷积神经网络模块对图片进行分类判断,得到分类结果,从而指导机器人做出相应的动作完成道路的驾驶并通过存储模块进行保存;
S3、图片处理模块中仅取图片最上层一行的像素点作为训练样本训练一个全连接神经网络,得到分类模型;
S4、机器人视觉导航时实时采集的图片进过处理后也是取最上层一行的像素点递送给网络做判断,机器人由此作出相应的反应;
S5、利用图片处理模块中由人工去除掉一些模糊或者不能分辨方向的图片后,首先将图片进行适当压缩以及裁剪,降低图片的信息量,进过压缩以及裁剪后的图片。
6.根据权利要求2所述的一种用于视觉导航机器人图像处理方法,其特征在于:所述S2中,为了神经网络更容易对各种路况进行比较准确的分类,同时为了尽可能减轻因光线和环境问题而引发的各种问题,将裁剪后的图像经过滤波和二值化处理。
7.根据权利要求2所述的一种用于视觉导航机器人图像处理方法,其特征在于:所述S3中分类模型模块对裁取后的图片进行分类处理,并对照整个赛道的路径进行对比。
8.根据权利要求2所述的一种用于视觉导航机器人图像处理方法,其特征在于:所述S2中图片的处理为缩放处理,采集到的图片像素值为640*480,经过缩放后像素值为320*240。
CN202010207544.0A 2020-03-23 2020-03-23 一种用于视觉导航机器人图像处理系统及处理方法 Pending CN111339999A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010207544.0A CN111339999A (zh) 2020-03-23 2020-03-23 一种用于视觉导航机器人图像处理系统及处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010207544.0A CN111339999A (zh) 2020-03-23 2020-03-23 一种用于视觉导航机器人图像处理系统及处理方法

Publications (1)

Publication Number Publication Date
CN111339999A true CN111339999A (zh) 2020-06-26

Family

ID=71182551

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010207544.0A Pending CN111339999A (zh) 2020-03-23 2020-03-23 一种用于视觉导航机器人图像处理系统及处理方法

Country Status (1)

Country Link
CN (1) CN111339999A (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101537618A (zh) * 2008-12-19 2009-09-23 北京理工大学 体育场捡球机器人视觉系统
CN203387597U (zh) * 2013-07-11 2014-01-08 深圳中科智酷机器人科技有限公司 一种光斑导航机器人
CN103984950A (zh) * 2014-04-22 2014-08-13 北京联合大学 一种适应白天检测的运动车辆刹车灯状态识别方法
CN106940562A (zh) * 2017-03-09 2017-07-11 华南理工大学 一种移动机器人无线集群系统及神经网络视觉导航方法
US20180329424A1 (en) * 2017-05-11 2018-11-15 Bot3, Inc. Portable mobile robot and operation thereof
US10452071B1 (en) * 2016-02-29 2019-10-22 AI Incorporated Obstacle recognition method for autonomous robots
CN110458127A (zh) * 2019-03-01 2019-11-15 腾讯医疗健康(深圳)有限公司 图像处理方法、装置、设备以及系统
CN110598637A (zh) * 2019-09-12 2019-12-20 齐鲁工业大学 一种基于视觉及深度学习的无人驾驶系统及方法
CN211956492U (zh) * 2020-03-23 2020-11-17 东莞理工学院 一种用于视觉导航机器人图像处理系统

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101537618A (zh) * 2008-12-19 2009-09-23 北京理工大学 体育场捡球机器人视觉系统
CN203387597U (zh) * 2013-07-11 2014-01-08 深圳中科智酷机器人科技有限公司 一种光斑导航机器人
CN103984950A (zh) * 2014-04-22 2014-08-13 北京联合大学 一种适应白天检测的运动车辆刹车灯状态识别方法
US10452071B1 (en) * 2016-02-29 2019-10-22 AI Incorporated Obstacle recognition method for autonomous robots
CN106940562A (zh) * 2017-03-09 2017-07-11 华南理工大学 一种移动机器人无线集群系统及神经网络视觉导航方法
US20180329424A1 (en) * 2017-05-11 2018-11-15 Bot3, Inc. Portable mobile robot and operation thereof
CN110458127A (zh) * 2019-03-01 2019-11-15 腾讯医疗健康(深圳)有限公司 图像处理方法、装置、设备以及系统
CN110598637A (zh) * 2019-09-12 2019-12-20 齐鲁工业大学 一种基于视觉及深度学习的无人驾驶系统及方法
CN211956492U (zh) * 2020-03-23 2020-11-17 东莞理工学院 一种用于视觉导航机器人图像处理系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李军锋、李逃昌、彭继慎: "《农业机器人视觉导航路径识别方法研究》", 《计算机工程》, vol. 44, no. 9, 30 September 2018 (2018-09-30), pages 38 - 44 *

Similar Documents

Publication Publication Date Title
CN110688925B (zh) 基于深度学习的级联目标识别方法及系统
CN111899227A (zh) 基于无人机作业的铁路扣件缺陷自动采集辨识方法
CN101198987B (zh) 对象检测装置及其学习装置
CN110796009A (zh) 基于多尺度卷积神经网络模型的海上船只检测方法及系统
CN113052029A (zh) 基于动作识别的异常行为监管方法、装置及存储介质
CN111340151B (zh) 一种用于辅助车辆自动驾驶的天气现象识别系统和方法
CN108830254B (zh) 一种基于数据均衡策略和密集注意网络的细粒度车型检测与识别方法
CN108133235B (zh) 一种基于神经网络多尺度特征图的行人检测方法
CN112836683B (zh) 用于便携式摄像设备的车牌识别方法、装置、设备和介质
CN114721403B (zh) 基于OpenCV的自动驾驶控制方法、装置及存储介质
CN211956492U (zh) 一种用于视觉导航机器人图像处理系统
CN116092119A (zh) 基于多维度特征融合的人体行为识别系统及其工作方法
CN115409992A (zh) 一种远程驾驶巡逻车系统
CN113052071B (zh) 危化品运输车驾驶员分心行为快速检测方法及系统
CN106339684A (zh) 一种行人检测的方法、装置及车辆
Prakash et al. Automatic feature extraction and traffic management using machine learning and open CV model
CN110334703B (zh) 一种昼夜图像中的船舶检测和识别方法
CN111339999A (zh) 一种用于视觉导航机器人图像处理系统及处理方法
CN115588217A (zh) 一种基于深度自注意网络的人脸属性检测方法
CN114429578A (zh) 古建筑脊兽装饰件巡检方法
Steinmann et al. Fast and lightweight person detector for unmanned aerial vehicles
CN115908886A (zh) 图像分类方法、图像处理设备及存储装置
Pagire et al. Underwater fish detection and classification using deep learning
CN113239931A (zh) 一种物流站车牌识别的方法
CN112861667A (zh) 一种基于多类别目标分割的机器人抓取检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination