CN107253194B - 一种运载机器人手臂操控多点映射智能控制方法及系统 - Google Patents
一种运载机器人手臂操控多点映射智能控制方法及系统 Download PDFInfo
- Publication number
- CN107253194B CN107253194B CN201710636783.6A CN201710636783A CN107253194B CN 107253194 B CN107253194 B CN 107253194B CN 201710636783 A CN201710636783 A CN 201710636783A CN 107253194 B CN107253194 B CN 107253194B
- Authority
- CN
- China
- Prior art keywords
- joint
- individual
- wolf
- prediction model
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J9/00—Programme-controlled manipulators
- B25J9/16—Programme controls
- B25J9/1615—Programme controls characterised by special kind of manipulator, e.g. planar, scara, gantry, cantilever, space, closed chain, passive/active joints and tendon driven manipulators
- B25J9/162—Mobile manipulator, movable base with manipulator arm mounted on it
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J9/00—Programme-controlled manipulators
- B25J9/16—Programme controls
- B25J9/1628—Programme controls characterised by the control loop
- B25J9/1653—Programme controls characterised by the control loop parameters identification, estimation, stiffness, accuracy, error analysis
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J9/00—Programme-controlled manipulators
- B25J9/16—Programme controls
- B25J9/1656—Programme controls characterised by programming, planning systems for manipulators
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B2219/00—Program-control systems
- G05B2219/30—Nc systems
- G05B2219/40—Robotics, robotics mapping to robotics vision
- G05B2219/40298—Manipulator on vehicle, wheels, mobile
Landscapes
- Engineering & Computer Science (AREA)
- Robotics (AREA)
- Mechanical Engineering (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Orthopedic Medicine & Surgery (AREA)
- Feedback Control In General (AREA)
Abstract
本发明公开了一种运载机器人手臂操控多点映射智能控制方法及系统,该方法包括:步骤1:对运载机器人手臂进行多次抓取训练,获得运载机器人在不同固定抓取点完成抓取任务的抓取样本集;步骤2:依据各手臂关节控制值的变化幅度a%对抓取样本集中进行关节分类,获得各类关节样本集;步骤3:利用步骤2得到的关节样本集构建运载机器人手臂关节控制值的预测模型;步骤4:将运载机器人基座与抓取台底端边缘之间的距离作为输入值,通过预测模型,分别得到各个关节的控制值并输出控制值,完成抓取任务控制。本发明通过建立机器人基座、抓取台之间距离与机器人手臂姿态之间的映射,避免了繁琐的运动学方程建立;获取准确的关节控制值,控制灵活。
Description
技术领域
本发明属于机器人控制领域,特别涉及一种运载机器人手臂操控多点映射智能控制方法及系统。
背景技术
近些年来,移动机器人被广泛应用于室内运输,如医院利用移动机器人运输医疗设备、超市的服务型机器人、工厂制造环境下的机器人等。而机器人手臂是机器人机械系统的重要组成部分,也是机器人实现其服务功能的主要载体。
机械手臂的控制问题一直是该行业的难点问题。早期,大部分手臂采用PID控制,能够实现中等以下速度的跟踪,但是在高精度、快速的场合下,传统的PID控制并不能满足其控制要求。在这种情况下,出现了模糊控制、神经网络控制、模糊神经网络控制、专家控制等智能控制方法。
如今神经网络广泛应用于机器人手臂控制:通过求解运动学方程来获得训练样本,利用神经网络建立手臂关节空间坐标与笛卡尔空间坐标的映射关系。然而通过求解运动学方程获得大量样本的方法并不实用,而且机器人手臂关节处的电机更换会使得之前构建的神经网络需重新训练。因此,机器人的维护存在着极大的不便。基于上述原因,迫切地需要一种更为智能的手臂控制方法。
发明内容
本发明提供了一种运载机器人手臂操控多点映射智能控制方法及系统,其目的在于,克服上述现有技术中存在的问题,通过建立机器人基座、抓取台之间距离与机器人手臂姿态之间的映射,避免繁琐的运动学方程建立;结合抓取中关节控制值变化幅度并将关节分为三类,并且对这三类关节采用了不同的优化算法和神经网络组合进行训练和预测,提高了手臂关节的控制精度。
一种运载机器人手臂操控多点映射智能控制方法,包括以下步骤:
步骤1:当运载机器人位于指定抓取距离区间内的固定抓取点时,利用远程服务器控制运载机器人手臂进行多次抓取训练,获得运载机器人在不同固定抓取点完成抓取任务的抓取样本集;
每个抓取样本包括运载机器人基座所在固定抓取点与抓取台底端边缘之间的距离和完成抓取任务过程中所有关节的控制值矩阵,所述所有关节的控制值矩阵大小为N*M,N表示运载机器人手臂关节个数,M表示抓取过程手臂动作次数;
运载机器人在指定抓取距离区间中某个固定点抓取点时,运载机器人基座不移动,只有手臂进行运动,完成抓取任务;
利用远程服务器控制运载机器人手臂进行抓取,同时自动记录距离和对应的控制值矩阵,获取样本的方法不同于传统反求运动学方程的复杂方法,避免了复杂的建模和求解过程。
步骤2:依据各手臂关节控制值的变化幅度a%对抓取样本集中进行关节分类,获得各类关节样本集;
从每个抓取样本中提取出各个关节样本,每个关节样本包括距离和控制值向量,所述关节样本中的距离是指运载机器人基座所在的固定抓取点与抓取台底端边缘之间的距离,所述关节样本中的控制值向量,是指运载机器人基座位于固定抓取点时,完成抓取任务过程中对应的关节控制值向量,向量大小为1*M;
依据关节控制值变化幅度a%,对抓取样本集对应的所有关节样本进行分类:
若a%<20%,该类关节作为第一类关节;
若20%≤a%≤50%,该类关节作为第二类关节;
若a%>50%,该类关节作为第三类关节;
每个关节样本的关节控制值变化幅度a%是指每个关节在一次抓取过程所有动作中的最大控制值和最小控制值之差与对应关节的控制量程之比;
N组关节样本被划分成三类;
步骤3:利用步骤2得到的关节样本集构建运载机器人手臂关节控制值的预测模型;
依次各类关节样本集中的每个关节样本的距离和控制值向量分别作为训练模型的输入数据和输出数据进行训练,构建预测模型,包括第一类关节预测模型、第二类关节预测模型以及第三类关节预测模型;
其中,第一类关节预测模型使用的训练模型为基于Elman神经网络模型;
第二类关节预测模型使用的训练模型为多核支持向量机MKSVM模型;
第三类关节预测模型使用的训练模型为小波神经网络模型;
运用多种优化算法和神经网络的组合对手臂的抓取进行控制,针对不同关节选择精度更加高的组合进行预测,提高了系统的稳定性;
步骤4:利用运载机器人基座所在固定抓取点与抓取台底端边缘之间的距离作为三类关节预测模型的输入值,分别得到各个关节的控制值,输出运载机器人手臂所有关节的控制值,完成抓取任务控制。
进一步的,所述第一类关节预测模型以第一类关节样本集中各关节样本的距离和控制值向量分别作为Elman神经网络模型的输入数据和输出数据进行训练后,获得的基于Elman神经网络的第一类关节控制预测模型;
所述基于Elman神经网络的第一类关节控制预测模型输入层节点个数为2,隐含层个数为5,输出层节点个数为2,承接层节点个数为5;隐含层函数采用tansig函数,输出层神经元的传递函数采用logsig函数;训练过程中的最大迭代次数设置为100,训练学习率为0.1,阈值为0.001;
所述基于Elman神经网络的第一类关节控制预测模型的权值和阈值采用自适应惯性权重磷虾群算法AKH寻优获得。
进一步的,所述基于Elman神经网络的第一类关节控制预测模型的权值和阈值采用自适应惯性权重磷虾群算法AKH寻优获得的过程如下:
步骤3.1:以磷虾个体位置作为基于Elman神经网络的第一类关节控制预测模型的权值和阈值,随机初始化磷虾种群并设置磷虾种群参数;
磷虾种群包含多个磷虾个体;
磷虾种群规模的取值范围为[20,200],诱导速度惯性权重wn的取值范围为[0.5,0.7],觅食速度惯性权重wf的取值范围为[0.5,0.7],最大诱导速度的取值范围为[0.02,0.08],最大觅食速度的取值范围为[0.02,0.08],最大扩散速度的取值范围为[0.002,0.01],步长缩放因子的取值范围为[0.1,0.5],最大迭代次数T的取值范围为[200,1000],搜索精度的取值范围为[0.001,0.1];
步骤3.2:设定适应度函数,并确定初始最优磷虾个体位置和迭代次数t,t=1;
将磷虾个体位置对应的权值和阈值代入基于Elman神经网络的第一类关节控制预测模型中,并利用磷虾位置确定的基于Elman神经网络的第一类关节控制预测模型计算第一类关节样本集中每个关节样本的关节控制预测值,将所有关节样本的关节控制预测值和实际值的均方差MSE的倒数作为第一适应度函数f1(x);
利用第一适应度函数计算每个磷虾个体位置的适应度,以最大适应度对应的磷虾个体位置作为初始最优磷虾个体位置
步骤3.3:利用每个磷虾个体的当前的诱导速度、觅食速度以及扩散速度,更新每个磷虾个体的运动速度和位置;
步骤3.4:对每个更新后的磷虾个体位置进行基于遗传算法的交叉操作,交叉因子的取值范围为[0.3,0.5];
进行交叉操作,以增加种群的多样性;
步骤3.5:计算当前磷虾种群中每个磷虾个体位置的适应度,以当前磷虾种群中最大适应度对应的磷虾个体位置作为当前最优磷虾个体位置
步骤3.6:依据当前最优磷虾个体的适应度值和前一次迭代过程中的最优磷虾个体的适应度值按照以下公式,对磷虾个体的惯性权重进行动态调整,并更新磷虾个体的诱导速度和觅食速度:
其中,所述磷虾个体的惯性权重包括诱导速度惯性权重和觅食速度惯性权重,和
分别表示初始化的诱导速度惯性权重和觅食速度惯性权重,和分别表示在第t次迭代后,磷虾个体的诱导速度惯性权重和觅食速度惯性权重;
步骤3.7:判断是否满足达到搜索精度或者最大迭代次数,若不满足,则令t=t+1,返回步骤3.3,否则,输出当前最优的磷虾个体位置,得到基于Elman神经网络的第一类关节控制预测模型的最优权值和阈值;
所述达到搜索精度是指当前最优磷虾个体的适应度值和前一次迭代过程中的最优磷虾个体的适应度值之差小于设定的搜索精度。
进一步的,所述第二类关节预测模型以第二类关节样本集中各关节样本的距离和控制值向量分别作为多核支持向量机MKSVM模型的输入数据和输出数据进行训练后,获得的基于多核支持向量机MKSVM的第二类关节控制预测模型;
所述基于多核支持向量机MKSVM的第二类关节控制预测模型的核函数为高斯函数,参数c、g和d采用改进狼群算法寻优获得。
进一步的,所述基于多核支持向量机MKSVM的第二类关节控制预测模型的参数c、g和d采用改进狼群算法寻优获得的过程如下:
步骤5.1:以个体狼的位置作为基于多核支持向量机MKSVM的第二类关节控制预测模型的参数c、g和d,初始化狼群并设置狼群参数;
狼群包含多只个体狼;
狼群规模的取值范围为[20,200],狼的视觉半径的取值范围[1,5],可记忆步数为1,逃跑概率的取值范围为[0.02,0.08],最大搜索精度的取值范围为[0.005,0.1],最大迭代次数的取值范围[500,1000];
步骤5.2:设定适应度函数,并确定初始最优头狼位置和迭代次数t,t=1;
将个体狼位置对应的参数c、g和d代入基于多核支持向量机MKSVM的第二类关节控制预测模型中,并利用个体狼位置确定的基于多核支持向量机MKSVM的第二类关节控制预测模型计算第二类关节样本集中每个关节样本的关节控制预测值,将所有关节样本的关节控制预测值和实际值的均方差MSE的倒数作为第二适应度函数f2(x);
利用第二适应度函数计算每匹个体狼位置的适应度,以最大适应度对应的个体狼位置作为初始最优头狼位置;
步骤5.3:寻找每匹个体狼的第一次更新位置,以第一次更新位置更新个体狼位置,并以所有个体狼的第一次更新位置,更新狼群最优头狼位置,j=1,j表示个体狼位置更新次数;
按照公式(1)计算每匹个体狼的第一次更新位置x1(t),并判断计算得到的第一次更新位置是否为从未达到过的新位置,若到达过,则重复步骤5.3直到重新获得第一次更新位置,若未到达过,则利用个体狼的第一个更新位置计算得适应度;
xj(t)=xj-1(t)+β(r)(P(t)-xj-1(t))+rand() (1)
其中,xj-1(t)和xj(t)表示个体狼在第t次迭代过程中的第j-1次更新位置和第j次更新位置,x0(t)表示个体狼在第t次迭代过程中迭代操作开始前的初始位置;β(r)为中间计算量,t和Gen分别表示当前迭代次数和最大迭代次数,w为大于2的常数,β0为最大激励因子,取正数,r表示当前个体狼位置x0(t)的视野范围内适应度最好的同伴个体狼位置的适应度f2(P(t))与当前个体狼位置的适应度f2(x0(t))之差的绝对值,r=|f2(P(t)-f2(x0(t))|;rand()为[0,1]中的一个随机数;
更新个体狼最优位置是指个体狼最新的位置的适应度优于个体狼当前个体最优位置的适应度,则以最新的位置作为个体最优位置;
更新狼群头狼最优位置是指狼群中某匹狼最新的位置的适应度优于当前狼群最优头狼位置的适应度,则以最新的位置作为狼群最优头狼位置;
步骤5.4:判断每个个体狼的第一次更新位置是否满足以下条件,进行第二次位置更新,更新个体狼最优位置,j=2:
第一次更新位置在其视野范围内且第一次更新位置的适应度优于其初始位置的适应度;
若满足,则令个体狼按照公式(1)寻找第二次更新位置x2(t),当第二次更新位置的适应度优于当前个体狼最优位置的适应度时,利用第二次更新位置作为个体狼最优位置,进入步骤5.5获取第三次更新位置;
若不满足,则第二次更新位置与第一次更新位置相同,个体狼位置不变,并转到步骤5.6,获取第三次更新位置;
步骤5.5:按公式(2)寻找满足步骤5.4中所述条件的个体狼在其视野范围内的第三次更新位置,更新个体狼最优位置和狼群头狼最优位置,j=3,进入步骤5.7;
x3(t)=x2(t)+rand()·v·(Gbest-x2(t)) (2)
其中:x2(t)、x3(t)表示个体狼在第t次迭代过程中的第二次更新位置和第三次更新位置;
Gbest为狼群当前最优头狼位置;v为狼的视觉半径;rand()为[-1,1]中的一个随机数;
步骤5.6:按照公式(3)寻找不满足步骤5.4中所述条件的个体狼的第三次更新位置x3(t),更新狼群头狼最优位置,j=3,进入步骤5.7;
x3(t)=x2(t)+escape()·s·(xc(t)-x2(t)) (3)
其中,xc(t)表示第t次迭代过程中,所有个体狼进行第二次更新后,狼群的质心位置;s为狼的移动步长,s≤v;escape()为随机函数;
步骤5.7依适应度值将经过三次更新后的所有个体狼从低到高进行排序;
步骤5.8将排在前面的n+1个个体狼按非线性单纯形法搜索每个个体的最优位置,其余的个体重复步骤5.4-步骤5.6搜索每个个体狼最优位置,得到最优狼群;从最优狼群中选取全局最优头狼位置;
其中,n为随机正整数;
步骤5.9判断是否达到最大迭代次数或者达到最大搜索精度,若达到,则输出全局最优头狼位置对应的基于多核支持向量机MKSVM的第二类关节控制预测模型的参数c、g和d;否则,令t+1,转到步骤5.3,进行下一次迭代。
进一步的,所述第三类关节预测模型以第三类关节样本集中各关节样本的距离和控制值向量分别作为小波神经网络模型的输入数据和输出数据进行训练后,获得的基于小波神经网络的第三类关节控制预测模型;
所述基于小波神经网络的第三类关节控制预测模型的输入层节点个数为2,隐含层小波神经元个数为4,输出层节点个数为4,隐含层小波神经元采用Mexican Hat小波函数,输出层节点采用Sigmoid函数;训练过程中的最大迭代次数设置为1000,训练学习率为0.1,阈值为0.00004;
所述基于小波神经网络的第三类关节控制预测模型的权值、阈值和伸缩平移系数采用混沌蝙蝠算法寻优获得。
进一步的,所述基于小波神经网络的第三类关节控制预测模型的权值、阈值和伸缩平移系数采用混沌蝙蝠算法寻优获得的过程如下:
步骤7.1:以蝙蝠个体位置作为基于小波神经网络的第三类关节控制预测模型的权值、阈值和伸缩平移系数,初始化蝙蝠种群,并设置蝙蝠种群参数;
蝙蝠种群规模的取值范围为[200,500],蝙蝠个体最大脉冲频度r0的取值范围为[0.25,0.5],最大脉冲声音强度A0的取值范围为[0.25,0.5],搜索精度的取值范围为[0.001,0.1],脉冲频率的取值范围为[0,1.5],蝙蝠搜索频度增加系数的取值范围为[0.02,0.08],声音强度衰减系数的取值范围为[0.8,0.96],最大迭代次数的取值范围为[100,500],最大搜索精度的取值范围为[0.01,0.1];
步骤7.2:设定适应度函数,并确定初始最优蝙蝠个体位置和迭代次数t,t=1;
将蝙蝠个体位置对应的权值、阈值和伸缩平移系数代入基于小波神经网络的第三类关节控制预测模型中,并利用蝙蝠个体位置确定的基于小波神经网络的第三类关节控制预测模型计算第三类关节样本集中每个关节样本的关节控制预测值,将所有关节样本的关节控制预测值和实际值的差值E构建第三适应度函数f3(x),f3(x)=1/(E+1);
利用第三适应度函数计算每只蝙蝠个体位置的适应度,以最大适应度对应的蝙蝠个体位置作为初始最优蝙蝠个体位置;
步骤7.3:利用设定的脉冲频率对蝙蝠个体的速度以及位置进行更新;
步骤7.4:若Rand1>ri,则对处于个体最优位置的蝙蝠进行随机扰动,生成蝙蝠个体的扰动位置;
其中,Rand1为在[0,1]上均匀分布的随机数,ri为第i只蝙蝠的脉冲频度;
步骤7.5:若Rand2>Ai,蝙蝠个体的扰动位置的适应度优于扰动前的蝙蝠个体位置的适应度,则将蝙蝠个体移动到扰动位置,否则保持原位;
其中,Rand2为在[0,1]上均匀分布的随机数,Ai为第i只蝙蝠的声音强度;
步骤7.6:如果步骤7.5条件得到满足,则利用蝙蝠搜索频度增加系数和声音强度衰减系数更新蝙蝠个体的脉冲频度和脉冲声音强度,并跳转步骤7.1,否则跳转到步骤7.7;
步骤7.7:计算当前蝙蝠种群中每个蝙蝠个体位置的适应度,按照由大到小的顺序选出前m%个蝙蝠个体进行位置和速度的混沌优化,得到更新后的前m%个蝙蝠个体,m的取值范围为[5,20];
混沌优化使种群个体多样性增加,跳出局部最优继续迭代搜索;
步骤7.8:判断是否达到最大迭代次数或者达到最大搜索精度,若是,则从更新后的前m%个蝙蝠个体中依据适应度值选出全局最优蝙蝠个体,输出全局最优蝙蝠个体对应的基于小波神经网络的第三类关节控制预测模型的最佳权值、阈值和伸缩平移系数,否则,令t=t+1,转到步骤7.3继续下一次迭代。
一种运载机器人手臂操控多点映射智能控制系统,采用上述的方法对运载机器人手臂进行控制,包括:
抓取样本集获取单元,通过运载机器人位于指定抓取距离区间内的固定抓取点时,利用远程服务器控制运载机器人手臂进行多次抓取训练,获得运载机器人在不同固定抓取点完成抓取任务的多个抓取样本;
每个抓取样本包括运载机器人基座所在固定抓取点与抓取台底端边缘之间的距离和完成抓取任务过程中所有关节的控制值矩阵,所述所有关节的控制值矩阵大小为N*M,N表示运载机器人手臂关节个数,M表示抓取过程手臂动作次数;
三类关节样本集分类单元,依据各手臂关节控制值的变化幅度a%对抓取样本集进行关节分类,获得各类关节样本集;
从每个抓取样本中提取出各个关节样本,每个关节样本包括距离和控制值向量,所述关节样本中的距离是指运载机器人基座所在的固定抓取点与抓取台底端边缘之间的距离,所述关节样本中的控制值向量,是指运载机器人基座位于固定抓取点时,完成抓取任务过程中对应的关节控制值向量,向量大小为1*M;
依据关节控制值变化幅度a%,对抓取样本集对应的所有关节样本进行分类:
若a%<20%,该类关节作为第一类关节;
若20%≤a%≤50%,该类关节作为第二类关节;
若a%>50%,该类关节作为第三类关节
每个关节样本的关节控制值变化幅度a%是指每个关节在一次抓取过程所有动作中的最大控制值和最小控制值之差与对应关节的控制量程之比;
手臂关节控制值预测模型构建单元,利用三类关节样本集分类单元得到的各类关节样本集分别输入训练模型进行训练,构建运载机器人手臂关节控制值的预测模型;
所述训练过程是指将各类关节样本集中的每个关节样本的距离和控制值向量分别作为训练模型的输入数据和输出数据进行训练,得到预测模型;
所述手臂关节控制值的预测模型包括第一类关节预测模型、第二类关节预测模型以及第三类关节预测模型;
其中,第一类关节预测模型使用的训练模型为基于Elman神经网络模型;
第二类关节预测模型使用的训练模型为多核支持向量机MKSVM模型;
第三类关节预测模型使用的训练模型为小波神经网络模型;
控制单元,利用运载机器人基座所在固定抓取点与抓取台底端边缘之间的距离作为三类关节预测模型的输入值,分别得到各个关节的控制值,输出运载机器人手臂所有关节的控制值,进行抓取任务控制。
进一步地,所述指定区域设置为运载机器人基座与抓取台底部边缘距离18-28cm的直线区域内。
进一步地,所述运载机器人基座与抓取台底部边缘距离采用运载机器人自带的超声波传感器进行测量,且所述超声波传感器位于运载机器人基座的两侧,对称设置。
运载机器人基座的超声波传感器是一般用作避障,本发明不需要在运载机器人身上增加任何距离测量装置,扩展了自带的超声波传感器用途。
有益效果
1、运用该控制方法,建立了机器人基座、抓取台之间距离与机器人手臂姿态之间的映射,而不需要建立复杂的运动学方程。同时,手臂关节处电机的更换不会造成神经网络训练的失效,方便了机器人的维护。
2、获取样本的方法更加便捷。利用远程服务器控制机器人手臂进行抓取,记录下距离和对应的关节控制值,避免了求解动力学方程。
3、操控精度高,控制灵活。根据样本记录的关节控制值,分析各个关节在抓取中的变化幅度,将关节分为三类,并且对这三类关节采用了不同的优化算法和神经网络组合进行训练和预测。
4.机器人基座的超声波传感器一般用作避障,本发明所述方案避开了常规思考,结合应用需求,不需要在机器人身上增加任何装置,将自带的超声波传感器开发出一种新的用途。
附图说明
图1为运载机器人抓取过程示意图;
图2为Elman神经网络模型
图3为小波神经网络模型
图4为本发明所述方法的机器人手臂抓取控制流程图
具体实施方式
下面将结合附图和实施例对本发明做进一步的说明。
运载机器人抓取过程示意图如图1所示;机器人手臂抓取控制流程图如图4所示。
一种运载机器人手臂操控多点映射智能控制方法,包括以下步骤:
步骤1:当运载机器人位于指定抓取距离区间内的固定抓取点时,利用远程服务器控制运载机器人手臂进行多次抓取训练,获得包含50组运载机器人在不同固定抓取点完成抓取任务的抓取样本的样本集;
每个抓取样本包括运载机器人基座所在固定抓取点与抓取台底端边缘之间的距离和完成抓取任务过程中所有关节的控制值矩阵,所述所有关节的控制值矩阵大小为8*10,8表示运载机器人手臂关节个数,10表示抓取过程手臂动作次数;
步骤2:依据各手臂关节控制值的变化幅度a%对抓取样本集中进行关节分类,获得各类关节样本集;
从每个抓取样本中提取出各个关节样本,每个关节样本包括距离和控制值向量,所述关节样本中的距离是指运载机器人基座所在的固定抓取点与抓取台底端边缘之间的距离,所述关节样本中的控制值向量,是指运载机器人基座位于固定抓取点时,完成抓取任务过程中对应的关节控制值向量,向量大小为1*10;
依据关节控制值变化幅度a%,对抓取样本集对应的所有关节样本进行分类:
若a%<20%,该类关节作为第一类关节;
若20%≤a%≤50%,该类关节作为第二类关节;
若a%>50%,该类关节作为第三类关节;
每个关节样本的关节控制值变化幅度a%是指每个关节在一次抓取过程所有动作中的最大控制值和最小控制值之差与对应关节的控制量程之比;
步骤3:利用步骤2得到的50组关节样本集构建运载机器人手臂关节控制值的预测模型;
依次各类关节样本集中的每个关节样本的距离和控制值向量分别作为训练模型的输入数据和输出数据进行训练,构建预测模型,包括第一类关节预测模型、第二类关节预测模型以及第三类关节预测模型;
其中,第一类关节预测模型使用的训练模型为基于Elman神经网络模型;
图2所示,第一类关节预测模型使用的训练模型为基于Elman神经网络模型;
第一类关节预测模型以第一类关节样本集中各关节样本的距离和控制值向量分别作为Elman神经网络模型的输入数据和输出数据进行训练后,获得的基于Elman神经网络的第一类关节控制预测模型;
所述基于Elman神经网络的第一类关节控制预测模型输入层节点个数为2,隐含层个数为5,输出层节点个数为2,承接层节点个数为5;隐含层函数采用tansig函数,输出层神经元的传递函数采用logsig函数;训练过程中的最大迭代次数设置为100,训练学习率为0.1,阈值为0.001;
基于Elman神经网络的第一类关节控制预测模型的权值和阈值采用自适应惯性权重磷虾群算法AKH寻优获得。
所述基于Elman神经网络的第一类关节控制预测模型的权值和阈值采用自适应惯性权重磷虾群算法AKH寻优获得的过程如下:
步骤3.1:以磷虾个体位置作为基于Elman神经网络的第一类关节控制预测模型的权值和阈值,随机初始化磷虾种群并设置磷虾种群参数;
磷虾种群规模的取值范围为[20,200],诱导速度惯性权重wn的取值范围为[0.5,0.7],觅食速度惯性权重wf的取值范围为[0.5,0.7],最大诱导速度的取值范围为[0.02,0.08],最大觅食速度的取值范围为[0.02,0.08],最大扩散速度的取值范围为[0.002,0.01],步长缩放因子的取值范围为[0.1,0.5],最大迭代次数T的取值范围为[200,1000],搜索精度的取值范围为[0.001,0.1];
步骤3.2:设定适应度函数,并确定初始最优磷虾个体位置和迭代次数t,t=1;
将磷虾个体位置对应的权值和阈值代入基于Elman神经网络的第一类关节控制预测模型中,并利用磷虾位置确定的基于Elman神经网络的第一类关节控制预测模型计算第一类关节样本集中每个关节样本的关节控制预测值,将所有关节样本的关节控制预测值和实际值的均方差MSE的倒数作为第一适应度函数f1(x);
利用第一适应度函数计算每个磷虾个体位置的适应度,以最大适应度对应的磷虾个体位置作为初始最优磷虾个体位置
步骤3.3:利用每个磷虾个体的当前的诱导速度、觅食速度以及扩散速度,更新每个磷虾个体的运动速度和位置;
步骤3.4:对每个更新后的磷虾个体位置进行基于遗传算法的交叉操作,交叉因子的取值范围为[0.3,0.5];
步骤3.5:计算当前磷虾种群中每个磷虾个体位置的适应度,以当前磷虾种群中最大适应度对应的磷虾个体位置作为当前最优磷虾个体位置
步骤3.6:依据当前最优磷虾个体的适应度值和前一次迭代过程中的最优磷虾个体的适应度值按照以下公式,对磷虾个体的惯性权重进行动态调整,并更新磷虾个体的诱导速度和觅食速度:
其中,所述磷虾个体的惯性权重包括诱导速度惯性权重和觅食速度惯性权重,和
分别表示初始化的诱导速度惯性权重和觅食速度惯性权重,和分别表示在第t次迭代后,磷虾个体的诱导速度惯性权重和觅食速度惯性权重;
步骤3.7:判断是否满足达到搜索精度或者最大迭代次数,若不满足,则令t=t+1,返回步步骤3否则,输出当前最优的磷虾个体位置,得到基于Elman神经网络的第一类关节控制预测模型的最优权值和阈值;
所述达到搜索精度是指当前最优磷虾个体的适应度值和前一次迭代过程中的最优磷虾个体的适应度值之差小于设定的搜索精度。
第二类关节预测模型使用的训练模型为多核支持向量机MKSVM模型;
所述第二类关节预测模型以第二类关节样本集中各关节样本的距离和控制值向量分别作为多核支持向量机MKSVM模型的输入数据和输出数据进行训练后,获得的基于多核支持向量机MKSVM的第二类关节控制预测模型;
所述基于多核支持向量机MKSVM的第二类关节控制预测模型的核函数为高斯函数,参数c、g和d采用改进狼群算法寻优获得。
所述基于多核支持向量机MKSVM的第二类关节控制预测模型的参数c、g和d采用改进狼群算法寻优获得的过程如下:
步骤5.1:以个体狼的位置作为基于多核支持向量机MKSVM的第二类关节控制预测模型的参数c、g和d,初始化狼群并设置狼群参数;
狼群规模的取值范围为[20,200],狼的视觉半径的取值范围[1,5],可记忆步数为1,逃跑概率的取值范围为[0.02,0.08],最大搜索精度的取值范围为[0.005,0.1],最大迭代次数的取值范围[500,1000];
步骤5.2:设定适应度函数,并确定初始最优头狼位置和迭代次数t,t=1;
将个体狼位置对应的参数c、g和d代入基于多核支持向量机MKSVM的第二类关节控制预测模型中,并利用个体狼位置确定的基于多核支持向量机MKSVM的第二类关节控制预测模型计算第二类关节样本集中每个关节样本的关节控制预测值,将所有关节样本的关节控制预测值和实际值的均方差MSE的倒数作为第二适应度函数f2(x);
利用第二适应度函数计算每匹个体狼位置的适应度,以最大适应度对应的个体狼位置作为初始最优头狼位置;
步骤5.3:寻找每匹个体狼的第一次更新位置,以第一次更新位置更新个体狼位置,并以所有个体狼的第一次更新位置,更新狼群最优头狼位置,j=1,j表示个体狼位置更新次数;
按照公式(1)计算每匹个体狼的第一次更新位置x1(t),并判断计算得到的第一次更新位置是否为从未达到过的新位置,若到达过,则重复步骤5.3直到重新获得第一次更新位置,若未到达过,则利用个体狼的第一个更新位置计算得适应度;
xj(t)=xj-1(t)+β(r)(P(t)-xj-1(t))+rand() (1)
其中,xj-1(t)和xj(t)表示个体狼在第t次迭代过程中的第j-1次更新位置和第j次更新位置,x0(t)表示个体狼在第t次迭代过程中迭代操作开始前的初始位置;β(r)为中间计算量,t和Gen分别表示当前迭代次数和最大迭代次数,w为大于2的常数,β0为最大激励因子,取正数,r表示当前个体狼位置x0(t)的视野范围内适应度最好的同伴个体狼位置的适应度f2(P(t))与当前个体狼位置的适应度f2(x0(t))之差的绝对值,r=|f2(P(t)-f2(x0(t))|;rand()为[0,1]中的一个随机数;
步骤5.4:判断每个个体狼的第一次更新位置是否满足以下条件,进行第二次位置更新,更新个体狼最优位置,j=2:
第一次更新位置在其视野范围内且第一次更新位置的适应度优于其初始位置的适应度;
若满足,则令个体狼按照公式(1)寻找第二次更新位置x2(t),当第二次更新位置的适应度优于当前个体狼最优位置的适应度时,利用第二次更新位置作为个体狼最优位置,进入步骤5,获取第三次更新位置;
若不满足,则第二次更新位置与第一次更新位置相同,个体狼位置不变,并转到步骤5.6,获取第三次更新位置;
步骤5.5:按公式(2)寻找满足步骤5.4中所述条件的个体狼在其视野范围内的第三次更新位置,更新个体狼最优位置和狼群头狼最优位置,j=3,进入步骤5.7;
x3(t)=x2(t)+rand()·v·(Gbest-x2(t)) (2)
其中:x2(t)、x3(t)表示个体狼在第t次迭代过程中的第二次更新位置和第三次更新位置;Gbest为狼群当前最优头狼位置;v为狼的视觉半径;rand()为[-1,1]中的一个随机数;
步骤5.6:按照公式(3)寻找不满足步骤5.4中所述条件的个体狼的第三次更新位置x3(t),更新狼群头狼最优位置,j=3,进入步骤5.7;
x3(t)=x2(t)+escape()·s·(xc(t)-x2(t)) (3)
其中,xc(t)表示第t次迭代过程中,所有个体狼进行第二次更新后,狼群的质心位置;s为狼的移动步长,s≤v;escape()为随机函数;
步骤5.7:依适应度值将经过三次更新后的所有个体狼从低到高进行排序;
步骤5.8:将排在前面的n+1个个体狼按非线性单纯形法搜索每个个体的最优位置,其余的个体重复步骤5.4-步骤5.6搜索每个个体狼最优位置,得到最优狼群;从最优狼群中选取全局最优头狼位置;
其中,n为随机正整数;
步骤5.9:判断是否达到最大迭代次数或者达到最大搜索精度,若达到,则输出全局最优头狼位置对应的基于多核支持向量机MKSVM的第二类关节控制预测模型的参数c、g和d;否则,令t+1,转到步骤5.3,进行下一次迭代。
第三类关节预测模型使用的训练模型为小波神经网络模型;
所述第三类关节预测模型以第三类关节样本集中各关节样本的距离和控制值向量分别作为小波神经网络模型的输入数据和输出数据进行训练后,获得的基于小波神经网络的第三类关节控制预测模型,图3所示;
所述基于小波神经网络的第三类关节控制预测模型的输入层节点个数为2,隐含层小波神经元个数为4,输出层节点个数为4,隐含层小波神经元采用Mexican Hat小波函数,输出层节点采用Sigmoid函数;训练过程中的最大迭代次数设置为1000,训练学习率为0.1,阈值为0.00004;
基于小波神经网络的第三类关节控制预测模型的权值、阈值和伸缩平移系数采用混沌蝙蝠算法寻优获得。
所述基于小波神经网络的第三类关节控制预测模型的权值、阈值和伸缩平移系数采用混沌蝙蝠算法寻优获得的过程如下:
步骤7.1:以蝙蝠个体位置作为基于小波神经网络的第三类关节控制预测模型的权值、阈值和伸缩平移系数,初始化蝙蝠种群,并设置蝙蝠种群参数;
蝙蝠种群规模的取值范围为[200,500],蝙蝠个体最大脉冲频度r0的取值范围为[0.25,0.5],最大脉冲声音强度A0的取值范围为[0.25,0.5],搜索精度的取值范围为[0.001,0.1],脉冲频率的取值范围为[0,1.5],蝙蝠搜索频度增加系数的取值范围为[0.02,0.08],声音强度衰减系数的取值范围为[0.8,0.96],最大迭代次数的取值范围为[100,500],最大搜索精度的取值范围为[0.01,0.1];
步骤7.2:设定适应度函数,并确定初始最优蝙蝠个体位置和迭代次数t,t=1;
将蝙蝠个体位置对应的权值、阈值和伸缩平移系数代入基于小波神经网络的第三类关节控制预测模型中,并利用蝙蝠个体位置确定的基于小波神经网络的第三类关节控制预测模型计算第三类关节样本集中每个关节样本的关节控制预测值,将所有关节样本的关节控制预测值和实际值的差值E构建第三适应度函数f3(x),f3(x)=1/(E+1);
利用第三适应度函数计算每只蝙蝠个体位置的适应度,以最大适应度对应的蝙蝠个体位置作为初始最优蝙蝠个体位置;
步骤7.3:利用设定的脉冲频率对蝙蝠个体的速度以及位置进行更新;
步骤7.4:若Rand1>ri,则对处于个体最优位置的蝙蝠进行随机扰动,生成蝙蝠个体的扰动位置;
其中,Rand1为在[0,1]上均匀分布的随机数,ri为第i只蝙蝠的脉冲频度;
步骤7.5:若Rand2>Ai,蝙蝠个体的扰动位置的适应度优于扰动前的蝙蝠个体位置的适应度,则将蝙蝠个体移动到扰动位置,否则保持原位;
其中,Rand2为在[0,1]上均匀分布的随机数,Ai为第i只蝙蝠的声音强度;
步骤7.6:如果步骤7.5条件得到满足,则利用蝙蝠搜索频度增加系数和声音强度衰减系数更新蝙蝠个体的脉冲频度和脉冲声音强度,并跳转步骤7.4,否则跳转到步骤7.7;
步骤7.7:计算当前蝙蝠种群中每个蝙蝠个体位置的适应度,按照由大到小的顺序选出前m%个蝙蝠个体进行位置和速度的混沌优化,得到更新后的前m%个蝙蝠个体,m的取值范围为[5,20];
步骤7.8:判断是否达到最大迭代次数或者达到最大搜索精度,若是,则从更新后的前m%个蝙蝠个体中依据适应度值选出全局最优蝙蝠个体,输出全局最优蝙蝠个体对应的基于小波神经网络的第三类关节控制预测模型的最佳权值、阈值和伸缩平移系数,否则,令t=t+1,转到步骤7.3继续下一次迭代。
步骤4:利用运载机器人基座所在固定抓取点与抓取台底端边缘之间的距离作为三类关节预测模型的输入值,分别得到各个关节的控制值,输出运载机器人手臂所有关节的控制值(控制值是指手臂各个关节的旋转角度,多关节旋转角度的耦合形成整体的手臂运动),完成抓取任务控制。
一种运载机器人手臂操控多点映射智能控制系统,采用上述的方法对运载机器人手臂进行控制,包括:
抓取样本集获取单元,通过运载机器人位于指定抓取距离区间内的固定抓取点时,利用远程服务器控制运载机器人手臂进行多次抓取训练,获得运载机器人在不同固定抓取点完成抓取任务的多个抓取样本;
每个抓取样本包括运载机器人基座所在固定抓取点与抓取台底端边缘之间的距离和完成抓取任务过程中所有关节的控制值矩阵,所述所有关节的控制值矩阵大小为8*10,8表示运载机器人手臂关节个数,10表示抓取过程手臂动作次数;
三类关节样本集分类单元,依据各手臂关节控制值的变化幅度a%对抓取样本集进行关节分类,获得各类关节样本集;
从每个抓取样本中提取出各个关节样本,每个关节样本包括距离和控制值向量,所述关节样本中的距离是指运载机器人基座所在的固定抓取点与抓取台底端边缘之间的距离,所述关节样本中的控制值向量,是指运载机器人基座位于固定抓取点时,完成抓取任务过程中对应的关节控制值向量,向量大小为1*10;
依据关节控制值变化幅度a%,对抓取样本集对应的所有关节样本进行分类:
若a%<20%,该类关节作为第一类关节;
若20%≤a%≤50%,该类关节作为第二类关节;
若a%>50%,该类关节作为第三类关节
每个关节样本的关节控制值变化幅度a%是指每个关节在一次抓取过程所有动作中的最大控制值和最小控制值之差与对应关节的控制量程之比;
手臂关节控制值预测模型构建单元,利用三类关节样本集分类单元得到的各类关节样本集分别输入训练模型进行训练,构建运载机器人手臂关节控制值的预测模型;
所述训练过程是指将各类关节样本集中的每个关节样本的距离和控制值向量分别作为训练模型的输入数据和输出数据进行训练,得到预测模型;
所述手臂关节控制值的预测模型包括第一类关节预测模型、第二类关节预测模型以及第三类关节预测模型;
其中,第一类关节预测模型使用的训练模型为基于Elman神经网络模型;
第二类关节预测模型使用的训练模型为多核支持向量机MKSVM模型;
第三类关节预测模型使用的训练模型为小波神经网络模型;
控制单元,利用运载机器人基座所在固定抓取点与抓取台底端边缘之间的距离作为三类关节预测模型的输入值,分别得到各个关节的控制值,输出运载机器人手臂所有关节的控制值,进行抓取任务控制。
所述指定区域设置为运载机器人基座与抓取台底部边缘距离18-28cm的直线区域内。
所述运载机器人基座与抓取台底部边缘距离采用运载机器人自带的超声波传感器进行测量,且所述超声波传感器位于运载机器人基座的两侧,对称设置。
本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。
Claims (10)
1.一种运载机器人手臂操控多点映射智能控制方法,其特征在于,包括以下步骤:
步骤1:当运载机器人位于指定抓取距离区间内的固定抓取点时,利用远程服务器控制运载机器人手臂进行多次抓取训练,获得运载机器人在不同固定抓取点完成抓取任务的抓取样本集;
每个抓取样本包括运载机器人基座所在固定抓取点与抓取台底端边缘之间的距离和完成抓取任务过程中所有关节的控制值矩阵,所述所有关节的控制值矩阵大小为N*M,N表示运载机器人手臂关节个数,M表示抓取过程手臂动作次数;
步骤2:依据各手臂关节控制值的变化幅度a%对抓取样本集中进行关节分类,获得各类关节样本集;
从每个抓取样本中提取出各个关节样本,每个关节样本包括距离和控制值向量,所述关节样本中的距离是指运载机器人基座所在的固定抓取点与抓取台底端边缘之间的距离,所述关节样本中的控制值向量,是指运载机器人基座位于固定抓取点时,完成抓取任务过程中对应的关节控制值向量,向量大小为1*M;
依据关节控制值变化幅度a%,对抓取样本集对应的所有关节样本进行分类:
若a%<20%,该类关节作为第一类关节;
若20%≤a%≤50%,该类关节作为第二类关节;
若a%>50%,该类关节作为第三类关节
每个关节样本的关节控制值变化幅度a%是指每个关节在一次抓取过程所有动作中的最大控制值和最小控制值之差与对应关节的控制量程之比;
步骤3:利用步骤2得到的关节样本集构建运载机器人手臂关节控制值的预测模型;
依次各类关节样本集中的每个关节样本的距离和控制值向量分别作为训练模型的输入数据和输出数据进行训练,构建预测模型,包括第一类关节预测模型、第二类关节预测模型以及第三类关节预测模型;
其中,第一类关节预测模型使用的训练模型为基于Elman神经网络模型;
第二类关节预测模型使用的训练模型为多核支持向量机MKSVM模型;
第三类关节预测模型使用的训练模型为小波神经网络模型;
步骤4:利用运载机器人基座所在固定抓取点与抓取台底端边缘之间的距离作为三类关节预测模型的输入值,分别得到各个关节的控制值,输出运载机器人手臂所有关节的控制值,完成抓取任务。
2.根据权利要求1所述的方法,其特征在于,所述第一类关节预测模型以第一类关节样本集中各关节样本的距离和控制值向量分别作为Elman神经网络模型的输入数据和输出数据进行训练后,获得的基于Elman神经网络的第一类关节控制预测模型;
所述基于Elman神经网络的第一类关节控制预测模型输入层节点个数为2,隐含层个数为5,输出层节点个数为2,承接层节点个数为5;
隐含层函数采用tansig函数,输出层神经元的传递函数采用logsig函数,最大迭代次数设置为100,训练学习率为0.1,阈值为0.001;
所述基于Elman神经网络的第一类关节控制预测模型的权值和阈值采用自适应惯性权重磷虾群算法AKH寻优获得。
3.根据权利要求2所述的方法,其特征在于,所述基于Elman神经网络的第一类关节控制预测模型的权值和阈值采用自适应惯性权重磷虾群算法AKH寻优获得的过程如下:
步骤3.1:以磷虾个体位置作为基于Elman神经网络的第一类关节控制预测模型的权值和阈值,初始化磷虾种群并设置磷虾种群参数;
磷虾种群规模的取值范围为[20,200],诱导速度惯性权重wn的取值范围为[0.5,0.7],觅食速度惯性权重wf的取值范围为[0.5,0.7],最大诱导速度的取值范围为[0.02,0.08],最大觅食速度的取值范围为[0.02,0.08],最大扩散速度的取值范围为[0.002,0.01],步长缩放因子的取值范围为[0.1,0.5],最大迭代次数T的取值范围为[200,1000],搜索精度的取值范围为[0.001,0.1];
步骤3.2:设定适应度函数,并确定初始最优磷虾个体位置和迭代次数t,t=1;
将磷虾个体位置对应的权值和阈值代入基于Elman神经网络的第一类关节控制预测模型中,并利用磷虾位置确定的基于Elman神经网络的第一类关节控制预测模型计算第一类关节样本集中每个关节样本的关节控制预测值,将所有关节样本的关节控制预测值和实际值的均方差MSE的倒数作为第一适应度函数f1(x);
利用第一适应度函数计算每个磷虾个体位置的适应度,以最大适应度对应的磷虾个体位置作为初始最优磷虾个体位置
步骤3.3:利用每个磷虾个体的当前的诱导速度、觅食速度以及扩散速度,更新每个磷虾个体的运动速度和位置;
步骤3.4:对每个更新后的磷虾个体位置进行基于遗传算法的交叉操作,交叉因子的取值范围为[0.3,0.5];
步骤3.5:计算当前磷虾种群中每个磷虾个体位置的适应度,以当前磷虾种群中最大适应度对应的磷虾个体位置作为当前最优磷虾个体位置
步骤3.6:依据当前最优磷虾个体的适应度值和前一次迭代过程中的最优磷虾个体的适应度值按照以下公式,对磷虾个体的惯性权重进行动态调整,并更新磷虾个体的诱导速度和觅食速度:
<mrow>
<msubsup>
<mi>w</mi>
<mi>n</mi>
<mi>t</mi>
</msubsup>
<mo>=</mo>
<mfenced open = "{" close = "">
<mtable>
<mtr>
<mtd>
<msubsup>
<mi>w</mi>
<mi>n</mi>
<mn>0</mn>
</msubsup>
</mtd>
<mtd>
<mrow>
<mi>f</mi>
<mn>1</mn>
<mrow>
<mo>(</mo>
<msubsup>
<mi>x</mi>
<mi>k</mi>
<mi>t</mi>
</msubsup>
<mo>)</mo>
</mrow>
<mo><</mo>
<mi>f</mi>
<mn>1</mn>
<mrow>
<mo>(</mo>
<msubsup>
<mi>x</mi>
<mi>k</mi>
<mrow>
<mi>t</mi>
<mo>-</mo>
<mn>1</mn>
</mrow>
</msubsup>
<mo>)</mo>
</mrow>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mn>0</mn>
</mtd>
<mtd>
<mrow>
<mi>f</mi>
<mn>1</mn>
<mrow>
<mo>(</mo>
<msubsup>
<mi>x</mi>
<mi>k</mi>
<mi>t</mi>
</msubsup>
<mo>)</mo>
</mrow>
<mo>&GreaterEqual;</mo>
<mi>f</mi>
<mn>1</mn>
<mrow>
<mo>(</mo>
<msubsup>
<mi>x</mi>
<mi>k</mi>
<mrow>
<mi>t</mi>
<mo>-</mo>
<mn>1</mn>
</mrow>
</msubsup>
<mo>)</mo>
</mrow>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
<mo>,</mo>
<msubsup>
<mi>w</mi>
<mi>f</mi>
<mi>t</mi>
</msubsup>
<mo>=</mo>
<mfenced open = "{" close = "">
<mtable>
<mtr>
<mtd>
<msubsup>
<mi>w</mi>
<mi>f</mi>
<mn>0</mn>
</msubsup>
</mtd>
<mtd>
<mrow>
<mi>f</mi>
<mn>1</mn>
<mrow>
<mo>(</mo>
<msubsup>
<mi>x</mi>
<mi>k</mi>
<mi>t</mi>
</msubsup>
<mo>)</mo>
</mrow>
<mo><</mo>
<mi>f</mi>
<mn>1</mn>
<mrow>
<mo>(</mo>
<msubsup>
<mi>x</mi>
<mi>k</mi>
<mrow>
<mi>t</mi>
<mo>-</mo>
<mn>1</mn>
</mrow>
</msubsup>
<mo>)</mo>
</mrow>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mn>0</mn>
</mtd>
<mtd>
<mrow>
<mi>f</mi>
<mn>1</mn>
<mrow>
<mo>(</mo>
<msubsup>
<mi>x</mi>
<mi>k</mi>
<mi>t</mi>
</msubsup>
<mo>)</mo>
</mrow>
<mo>&GreaterEqual;</mo>
<mi>f</mi>
<mn>1</mn>
<mrow>
<mo>(</mo>
<msubsup>
<mi>x</mi>
<mi>k</mi>
<mrow>
<mi>t</mi>
<mo>-</mo>
<mn>1</mn>
</mrow>
</msubsup>
<mo>)</mo>
</mrow>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
</mrow>
其中,所述磷虾个体的惯性权重包括诱导速度惯性权重和觅食速度惯性权重,和分别表示初始化的诱导速度惯性权重和觅食速度惯性权重,和分别表示在第t次迭代后,磷虾个体的诱导速度惯性权重和觅食速度惯性权重;
步骤3.7:判断是否满足达到搜索精度或者最大迭代次数,若不满足,则令t=t+1,返回步骤3.3,否则,输出当前最优的磷虾个体位置,得到基于Elman神经网络的第一类关节控制预测模型的最优权值和阈值;
所述达到搜索精度是指当前最优磷虾个体的适应度值和前一次迭代过程中的最优磷虾个体的适应度值之差小于搜索精度。
4.根据权利要求1所述的方法,其特征在于,所述第二类关节预测模型以第二类关节样本集中各关节样本的距离和控制值向量分别作为多核支持向量机MKSVM模型的输入数据和输出数据进行训练后,获得的基于多核支持向量机MKSVM的第二类关节控制预测模型;
所述基于多核支持向量机MKSVM的第二类关节控制预测模型的核函数为高斯函数,参数c、g和d采用改进狼群算法寻优获得。
5.根据权利要求4所述的方法,其特征在于,所述基于多核支持向量机MKSVM的第二类关节控制预测模型的参数c、g和d采用改进狼群算法寻优获得的过程如下:
步骤5.1:以个体狼的位置作为基于多核支持向量机MKSVM的第二类关节控制预测模型的参数c、g和d,初始化狼群并设置狼群参数;
狼群规模的取值范围为[20,200],狼的视觉半径的取值范围[1,5],可记忆步数为1,逃跑概率的取值范围为[0.02,0.08],最大搜索精度的取值范围为[0.005,0.1],最大迭代次数的取值范围[500,1000];
步骤5.2:设定适应度函数,并确定初始最优头狼位置和迭代次数t,t=1;
将个体狼位置对应的参数c、g和d代入基于多核支持向量机MKSVM的第二类关节控制预测模型中,并利用个体狼位置确定的基于多核支持向量机MKSVM的第二类关节控制预测模型计算第二类关节样本集中每个关节样本的关节控制预测值,将所有关节样本的关节控制预测值和实际值的均方差MSE的倒数作为第二适应度函数f2(x);
利用第二适应度函数计算每匹个体狼位置的适应度,以最大适应度对应的个体狼位置作为初始最优头狼位置;
步骤5.3:寻找每匹个体狼的第一次更新位置,以第一次更新位置更新个体狼位置,并以所有个体狼的第一次更新位置,更新狼群最优头狼位置,j=1,j表示个体狼位置更新次数;
按照公式(1)计算每匹个体狼的第一次更新位置x1(t),并判断计算得到的第一次更新位置是否为从未达到过的新位置,若到达过,则重复步骤5.3直到重新获得第一次更新位置,若未到达过,则利用个体狼的第一个更新位置计算得适应度;
xj(t)=xj-1(t)+β(r)(P(t)-xj-1(t))+rand() (1)
其中,xj-1(t)和xj(t)表示个体狼在第t次迭代过程中的第j-1次更新位置和第j次更新位置,x0(t)表示个体狼在第t次迭代过程中迭代操作开始前的初始位置;β(r)为中间计算量,t和Gen分别表示当前迭代次数和最大迭代次数,w为大于2的常数,β0为最大激励因子,取正数,r表示当前个体狼位置x0(t)的视野范围内适应度最好的同伴个体狼位置的适应度f2(P(t))与当前个体狼位置的适应度f2(x0(t))之差的绝对值,r=|f2(P(t)-f2(x0(t))|;rand()为[0,1]中的一个随机数;
步骤5.4:判断每个个体狼的第一次更新位置是否满足以下条件,进行第二次位置更新,更新个体狼最优位置,j=2:
第一次更新位置在其视野范围内且第一次更新位置的适应度优于其初始位置的适应度;
若满足,则令个体狼按照公式(1)寻找第二次更新位置x2(t),当第二次更新位置的适应度优于当前个体狼最优位置的适应度时,利用第二次更新位置作为个体狼最优位置,进入步骤5.5,获取第三次更新位置;
若不满足,则第二次更新位置与第一次更新位置相同,个体狼位置不变,并转到步骤5.6,获取第三次更新位置;
步骤5.5:按公式(2)寻找满足步骤5.4中所述条件的个体狼在其视野范围内的第三次更新位置,更新个体狼最优位置和狼群头狼最优位置,j=3,进入步骤5.7;
x3(t)=x2(t)+rand()·v·(Gbest-x2(t)) (2)
其中:x2(t)、x3(t)表示个体狼在第t次迭代过程中的第二次更新位置和第三次更新位置;Gbest为狼群当前最优头狼位置;v为狼的视觉半径;rand()为[-1,1]中的一个随机数;
步骤5.6:按照公式(3)寻找不满足步骤5.4中所述条件的个体狼的第三次更新位置x3(t),更新狼群头狼最优位置,j=3,进入步骤5.7;
x3(t)=x2(t)+escape()·s·(xc(t)-x2(t)) (3)
其中,xc(t)表示第t次迭代过程中,所有个体狼进行第二次更新后,狼群的质心位置;s为狼的移动步长,s≤v;escape()为随机函数;
步骤5.7:依适应度值将经过三次更新后的所有个体狼从低到高进行排序;
步骤5.8:将排在前面的n+1个个体狼按非线性单纯形法方法搜索每个个体的最优位置,其余的个体重复步骤5.4-步骤5.6搜索每个个体狼最优位置,得到最优狼群;从最优狼群中选取全局最优头狼位置;
其中,n为随机正整数;
步骤5.9:判断是否达到最大迭代次数或者达到最大搜索精度,若达到,则输出全局最优头狼位置对应的基于多核支持向量机MKSVM的第二类关节控制预测模型的参数c、g和d;否则,令t+1,转到步骤5.3,进行下一次迭代。
6.根据权利要求1所述的方法,其特征在于,所述第三类关节预测模型以第三类关节样本集中各关节样本的距离和控制值向量分别作为小波神经网络模型的输入数据和输出数据进行训练后,获得的基于小波神经网络的第三类关节控制预测模型;
所述基于小波神经网络的第三类关节控制预测模型的输入层节点个数为2,隐含层小波神经元个数为4,输出层节点个数为4,隐含层小波神经元采用Mexican Hat小波函数,输出层节点采用Sigmoid函数;训练过程中的最大迭代次数设置为1000,训练学习率为0.1,阈值为0.00004;
所述基于小波神经网络的第三类关节控制预测模型的权值、阈值和伸缩平移系数采用混沌蝙蝠算法寻优获得。
7.根据权利要求6所述的方法,其特征在于,所述基于小波神经网络的第三类关节控制预测模型的权值、阈值和伸缩平移系数采用混沌蝙蝠算法寻优获得的过程如下:
步骤7.1:以蝙蝠个体位置作为基于小波神经网络的第三类关节控制预测模型的权值、阈值和伸缩平移系数,初始化蝙蝠种群,并设置蝙蝠种群参数;
蝙蝠种群规模的取值范围为[200,500],蝙蝠个体最大脉冲频度r0的取值范围为[0.25,0.5],最大脉冲声音强度A0的取值范围为[0.25,0.5],脉冲频率的取值范围为[0,1.5],蝙蝠搜索频度增加系数的取值范围为[0.02,0.08],声音强度衰减系数的取值范围为[0.8,0.96],最大迭代次数的取值范围为[100,500],最大搜索精度的取值范围为[0.01,0.1];
步骤7.2:设定适应度函数,并确定初始最优蝙蝠个体位置和迭代次数t,t=1;
将蝙蝠个体位置对应的权值、阈值和伸缩平移系数代入基于小波神经网络的第三类关节控制预测模型中,并利用蝙蝠个体位置确定的基于小波神经网络的第三类关节控制预测模型计算第三类关节样本集中每个关节样本的关节控制预测值,将所有关节样本的关节控制预测值和实际值的差值E构建第三适应度函数f3(x),f3(x)=1/(E+1);
利用第三适应度函数计算每只蝙蝠个体位置的适应度,以最大适应度对应的蝙蝠个体位置作为初始最优蝙蝠个体位置;
步骤7.3:利用设定的脉冲频率对蝙蝠个体的速度以及位置进行更新;
步骤7.4:若Rand1>ri,则对处于个体最优位置的蝙蝠进行随机扰动,生成蝙蝠个体的扰动位置;
其中,Rand1为在[0,1]上均匀分布的随机数,ri为第i只蝙蝠的脉冲频度;
步骤7.5:若Rand2>Ai,蝙蝠个体的扰动位置的适应度优于扰动前的蝙蝠个体位置的适应度,则将蝙蝠个体移动到扰动位置,否则保持原位;
其中,Rand2为在[0,1]上均匀分布的随机数,Ai为第i只蝙蝠的声音强度;
步骤7.6:如果步骤7.5条件得到满足,则利用蝙蝠搜索频度增加系数和声音强度衰减系数更新蝙蝠个体的脉冲频度和脉冲声音强度,并跳转步骤7.4,否则跳转到步骤7.7;
步骤7.7:计算当前蝙蝠种群中每个蝙蝠个体位置的适应度,按照由大到小的顺序选出前m%个蝙蝠个体进行位置和速度的混沌优化,得到更新后的前m%个蝙蝠个体,m的取值范围为[5,20];
步骤7.8:判断是否达到最大迭代次数或者达到最大搜索精度,若是,则从更新后的前m%个蝙蝠个体中依据适应度值选出全局最优蝙蝠个体,输出全局最优蝙蝠个体对应的基于小波神经网络的第三类关节控制预测模型的最佳权值、阈值和伸缩平移系数,否则,令t=t+1,转到步骤7.3继续下一次迭代。
8.一种运载机器人手臂操控多点映射智能控制系统,其特征在于,采用权利要求1-权利要求7任一项所述的方法对运载机器人手臂进行控制,包括:
抓取样本集获取单元,通过运载机器人位于指定抓取距离区间内的固定抓取点时,利用远程服务器控制运载机器人手臂进行多次抓取训练,获得运载机器人在不同固定抓取点完成抓取任务的多个抓取样本;
每个抓取样本包括运载机器人基座所在固定抓取点与抓取台底端边缘之间的距离和完成抓取任务过程中所有关节的控制值矩阵,所述所有关节的控制值矩阵大小为N*M,N表示运载机器人手臂关节个数,M表示抓取过程手臂动作次数;
三类关节样本集分类单元,依据各手臂关节控制值的变化幅度a%对抓取样本集进行关节分类,获得各类关节样本集;
从每个抓取样本中提取出各个关节样本,每个关节样本包括距离和控制值向量,所述关节样本中的距离是指运载机器人基座所在的固定抓取点与抓取台底端边缘之间的距离,所述关节样本中的控制值向量,是指运载机器人基座位于固定抓取点时,完成抓取任务过程中对应的关节控制值向量,向量大小为1*M;
依据关节控制值变化幅度a%,对抓取样本集对应的所有关节样本进行分类:
若a%<20%,该类关节作为第一类关节;
若20%≤a%≤50%,该类关节作为第二类关节;
若a%>50%,该类关节作为第三类关节
每个关节样本的关节控制值变化幅度a%是指每个关节在一次抓取过程所有动作中的最大控制值和最小控制值之差与对应关节的控制量程之比;
手臂关节控制值预测模型构建单元,利用三类关节样本集分类单元得到的各类关节样本集分别输入训练模型进行训练,构建运载机器人手臂关节控制值的预测模型;
所述训练过程是指将各类关节样本集中的每个关节样本的距离和控制值向量分别作为训练模型的输入数据和输出数据进行训练,得到预测模型;
所述手臂关节控制值的预测模型包括第一类关节预测模型、第二类关节预测模型以及第三类关节预测模型;
其中,第一类关节预测模型使用的训练模型为基于Elman神经网络模型;
第二类关节预测模型使用的训练模型为多核支持向量机MKSVM模型;
第三类关节预测模型使用的训练模型为小波神经网络模型;
控制单元,利用运载机器人基座所在固定抓取点与抓取台底端边缘之间的距离作为三类关节预测模型的输入值,分别得到各个关节的控制值,输出运载机器人手臂所有关节的控制值,进行抓取任务控制。
9.根据权利要求8所述的系统,其特征在于,所述指定区域设置为运载机器人基座与抓取台底部边缘距离18-28cm的直线区域内。
10.根据权利要求8所述的系统,其特征在于,所述运载机器人基座与抓取台底部边缘距离采用运载机器人自带的超声波传感器进行测量,且所述超声波传感器位于运载机器人基座的两侧,对称设置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710636783.6A CN107253194B (zh) | 2017-07-31 | 2017-07-31 | 一种运载机器人手臂操控多点映射智能控制方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710636783.6A CN107253194B (zh) | 2017-07-31 | 2017-07-31 | 一种运载机器人手臂操控多点映射智能控制方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107253194A CN107253194A (zh) | 2017-10-17 |
CN107253194B true CN107253194B (zh) | 2018-04-03 |
Family
ID=60025444
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710636783.6A Active CN107253194B (zh) | 2017-07-31 | 2017-07-31 | 一种运载机器人手臂操控多点映射智能控制方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107253194B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107908841B (zh) * | 2017-11-03 | 2020-10-20 | 南京邮电大学 | 三维壁面可抓取位置判别算法 |
CN110293553B (zh) * | 2018-03-21 | 2021-03-12 | 北京猎户星空科技有限公司 | 控制机械臂操作物体的方法、装置及模型训练方法、装置 |
CN109144102B (zh) * | 2018-09-19 | 2021-08-20 | 沈阳航空航天大学 | 一种基于改进蝙蝠算法的无人机航路规划方法 |
CN109460056B (zh) * | 2018-11-06 | 2021-12-24 | 哈尔滨工程大学 | 基于量子磷虾群演化机制的无人机集群作战博弈决策方法 |
CN110154024B (zh) * | 2019-05-22 | 2020-09-15 | 清华大学 | 一种基于长短期记忆神经网络增量模型的装配控制方法 |
JP2022070451A (ja) * | 2020-10-27 | 2022-05-13 | セイコーエプソン株式会社 | ロボットのパラメーターセットの調整を支援する方法、プログラム、および情報処理装置 |
CN112731952B (zh) * | 2020-12-24 | 2022-03-01 | 深圳市优必选科技股份有限公司 | 一种机器人质心规划方法、装置、可读存储介质及机器人 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE69030592T2 (de) * | 1989-01-05 | 1997-09-18 | Atr Auditory Visual Perception | Generierungsverfahren für Bewegungstrajektoren in einem dynamischen System |
CN101859377A (zh) * | 2010-06-08 | 2010-10-13 | 杭州电子科技大学 | 基于多核支持向量机的肌电信号分类方法 |
CN104899656A (zh) * | 2015-06-05 | 2015-09-09 | 三峡大学 | 一种基于总体平均经验模态分解与改进Elman神经网络的风功率组合预测方法 |
CN105446821A (zh) * | 2015-11-11 | 2016-03-30 | 哈尔滨工程大学 | 一种基于改进神经网络的智能水下机器人推进器故障诊断方法 |
-
2017
- 2017-07-31 CN CN201710636783.6A patent/CN107253194B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE69030592T2 (de) * | 1989-01-05 | 1997-09-18 | Atr Auditory Visual Perception | Generierungsverfahren für Bewegungstrajektoren in einem dynamischen System |
CN101859377A (zh) * | 2010-06-08 | 2010-10-13 | 杭州电子科技大学 | 基于多核支持向量机的肌电信号分类方法 |
CN104899656A (zh) * | 2015-06-05 | 2015-09-09 | 三峡大学 | 一种基于总体平均经验模态分解与改进Elman神经网络的风功率组合预测方法 |
CN105446821A (zh) * | 2015-11-11 | 2016-03-30 | 哈尔滨工程大学 | 一种基于改进神经网络的智能水下机器人推进器故障诊断方法 |
Also Published As
Publication number | Publication date |
---|---|
CN107253194A (zh) | 2017-10-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107253194B (zh) | 一种运载机器人手臂操控多点映射智能控制方法及系统 | |
Zhao et al. | Survey on computational-intelligence-based UAV path planning | |
Sehgal et al. | Deep reinforcement learning using genetic algorithm for parameter optimization | |
CN103412490B (zh) | 用于多机器人动态路径规划的多克隆人工免疫网络算法 | |
Ding et al. | Sim-to-real transfer for optical tactile sensing | |
Putra et al. | Neural network implementation for invers kinematic model of arm drawing robot | |
CN107414830B (zh) | 一种运载机器人手臂操控多层映射智能控制方法及系统 | |
CN113341706B (zh) | 基于深度强化学习的人机协作流水线系统 | |
CN107253195A (zh) | 一种运载机器人手臂操控自适应混合学习映射智能控制方法及系统 | |
Yue et al. | Deep reinforcement learning and its application in autonomous fitting optimization for attack areas of UCAVs | |
CN113687654A (zh) | 一种基于进化算法的神经网络训练方法及路径规划方法 | |
CN109227550A (zh) | 一种基于rbf神经网络的机械臂控制方法 | |
CN108955689A (zh) | 基于自适应细菌觅食优化算法的rbpf-slam方法 | |
Ge et al. | A real-time gesture prediction system using neural networks and multimodal fusion based on data glove | |
Xie et al. | Artificial physics optimisation: a brief survey | |
Mahanta et al. | An improved multi-objective antlion optimization algorithm for the optimal design of the robotic gripper | |
Kratzer et al. | Towards combining motion optimization and data driven dynamical models for human motion prediction | |
Sasaki et al. | Variational policy search using sparse Gaussian process priors for learning multimodal optimal actions | |
Yunqiang et al. | Research on multi-objective path planning of a robot based on artificial potential field method | |
Valizadeh et al. | [Retracted] The Optimal Adaptive‐Based Neurofuzzy Control of the 3‐DOF Musculoskeletal System of Human Arm in a 2D Plane | |
Guo et al. | Learning pushing skills using object detection and deep reinforcement learning | |
Duc et al. | An approach for UAV indoor obstacle avoidance based on AI technique with ensemble of ResNet8 and Res-DQN | |
CN112380655B (zh) | 一种基于rs-cmsa算法的机器人逆运动学求解方法 | |
CN114859940A (zh) | 机器人移动控制方法、装置、设备以及存储介质 | |
Gräve et al. | Improving imitated grasping motions through interactive expected deviation learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |