CN112561227A - 一种基于递归神经网络的多机器人协同方法及系统 - Google Patents

一种基于递归神经网络的多机器人协同方法及系统 Download PDF

Info

Publication number
CN112561227A
CN112561227A CN202011157828.XA CN202011157828A CN112561227A CN 112561227 A CN112561227 A CN 112561227A CN 202011157828 A CN202011157828 A CN 202011157828A CN 112561227 A CN112561227 A CN 112561227A
Authority
CN
China
Prior art keywords
robot
task
neural network
information
recurrent neural
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011157828.XA
Other languages
English (en)
Inventor
孙越
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Jixincui Information Technology Co ltd
Original Assignee
Nanjing Jixincui Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Jixincui Information Technology Co ltd filed Critical Nanjing Jixincui Information Technology Co ltd
Priority to CN202011157828.XA priority Critical patent/CN112561227A/zh
Publication of CN112561227A publication Critical patent/CN112561227A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Economics (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • Medical Informatics (AREA)
  • Game Theory and Decision Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Manipulator (AREA)

Abstract

本发明公开了一种基于递归神经网络的多机器人协同方法及系统,包括,利用递归神经网络算法对机器人进行行为记忆学习;搭建中央控制器对每个学习的所述机器人下达指令任务;当接收到一组所述任务时,根据所述递归神经网络对所述任务进行归类处理,完成多机器人协同分解任务。本发明使用的递归神经网络能够对多机器人进行神经网络学习,自主完成有效的系统控制,从而使多机器人更加快速的完成协同任务,且多机器人协作既可以独立完成工作,也可以协作完成工作,并能根据任务的形式自动推算机器人协作方式,使得机器人协作节拍可以无缝执行。

Description

一种基于递归神经网络的多机器人协同方法及系统
技术领域
本发明涉及多机器人协同的技术领域,尤其涉及一种基于递归神经网络的多机器人协同方法及系统。
背景技术
机器人技术的发展使得机器人的能力不断提高,其应用领域和范围也随之不断扩展,人们希望机器人能完成更加复杂的任务,如制造过程的复杂装配、空间站维修、海洋勘探、消防救灾、清理有害废料等,对于这些复杂的任务,用单一机器人已难以完成,而需要多机器人相互协作才能完成。
传统的机器人是面向单独应用而设计和发展的,其控制系统的体系结构和控制机理等方面难于满足多机器人协作应用的要求;因此,需要对多机器人群体的组织结构、多机器人之间的合作和协调机制、多机器人协作系统的设计与实现等问题进行深度的研究,以使机器人的应用进一步扩展。
发明内容
本部分的目的在于概述本发明的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本申请的说明书摘要和发明名称中可能会做些简化或省略以避免使本部分、说明书摘要和发明名称的目的模糊,而这种简化或省略不能用于限制本发明的范围。
鉴于上述现有存在的问题,提出了本发明。
因此,本发明提供了一种基于递归神经网络的多机器人协同方法及系统,能够解决多机器人之间的协调合作问题。
为解决上述技术问题,本发明提供如下技术方案:包括,利用递归神经网络算法对机器人进行行为记忆学习;搭建中央控制器对每个学习的所述机器人下达指令任务当接收到一组所述任务时,根据所述递归神经网络对所述任务进行归类处理,完成多机器人协同分解任务。
作为本发明所述的基于递归神经网络的多机器人协同方法的一种优选方案,其中:所述递归神经网络包括,通过cell线直接穿过各个时刻的隐藏层以无损保留各时刻变换下的信息;若在当前时刻,则需去除无用信息;若去除所述无用信息之后,则添加信息;根据Ct状态得到任务模式并下达给所述机器人对应的指令,若所述机器人完成任务时会反馈完成信号所述递归神经网络接收所述信号并规划接下来的动作达到协同。
作为本发明所述的基于递归神经网络的多机器人协同方法的一种优选方案,其中:所述cell线只会进行简单的变大变小及添加新内容。
作为本发明所述的基于递归神经网络的多机器人协同方法的一种优选方案,其中:去除所述无用信息包括,输入x及上一个时刻的隐藏层输入ht-1,判断需要去除的所述无用信息;利用sigmoid函数输出一个0到1之间的向量,且所述向量中每个元素对应Ct-1状态里的一个信息,若要完全抹掉,则是0,表达公式如下:
ft=σ(Wf·[ht-1,xt]+bf)
其中,WF为权重矩阵,bf为偏置值,σ为sigmoid函数。
作为本发明所述的基于递归神经网络的多机器人协同方法的一种优选方案,其中:添加所述新信息包括,输入x及上一个时刻的隐藏层输入ht-1,利用sigmoid的门判断需要的所述新信息;结合tanh门函数表示需要更新信息的数值,且两者相乘以得到具体更新的信息和对应数值;将其加入到Ct-1中,根据得到的数值获得所述当前状态Ct,表达公式如下:
it=σ(Wi·[ht-1,xt]+bi)
Figure BDA0002743338820000021
其中,Wi为函数矩阵,bi为矩阵偏置值,Wc为状态矩阵,bc为状态值。
作为本发明所述的基于递归神经网络的多机器人协同方法的一种优选方案,其中:所述归类处理包括三种任务形式,即全局规划任务、自由协商任务和隐式合作任务。
作为本发明所述的基于递归神经网络的多机器人协同方法的一种优选方案,其中:所述全局规划任务包括,对每次完成的任务进行分解和规划计算;将复杂的任务分解成所述机器人可以执行的动作命令并产生联合行动规划;对合作型任务,则形成一种合作规划;统计所有机器人的信息、任务的信息以及环境的信息。
作为本发明所述的基于递归神经网络的多机器人协同方法的一种优选方案,其中:所述自由协商任务包括,当前时刻的所述机器人不能独立完成任务,需要请求其他机器人与之协作;通过与所述其他机器人进行信息交换,进行性能评估,最终形成联合行动规划以实现协作完成任务合作的规划方法。
作为本发明所述的基于递归神经网络的多机器人协同方法的一种优选方案,其中:所述隐式合作任务包括,所述机器人通过自己掌握的领域知识、多机器人共同的目标以及获取的环境信息,通过换位推理获取所述其他机器人的当前意图,并以此为依据,单独建立机器人之间的合作关系,确定机器人的下一步动作,实现多机器人之间的合作。
作为本发明所述的基于递归神经网络的多机器人协同系统的一种优选方案,其中:包括,数据存储学习模块,用于存储所有机器人的信息、环境信息和任务信息,添加搭载所述递归神经网络算法以对所述机器人进行行为学习训练;中央控制模块与所述数据存储学习模块相连接并设置于上表面,其通过所述中央处理器进行任务推演计算,对每个学习的所述机器人下达指令任务;协同分析模块并行连接设置于所述数据存储学习模块和所述中央控制模块之间,其在每次执行任务前会对上一次的任务进行分析,从而对任务进行协同拆解分配至需要的对应机器人。
本发明的有益效果:本发明使用的递归神经网络能够对多机器人进行神经网络学习,自主完成有效的系统控制,从而使多机器人更加快速的完成协同任务,且多机器人协作既可以独立完成工作,也可以协作完成工作,并能根据任务的形式自动推算机器人协作方式,使得机器人协作节拍可以无缝执行。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。其中:
图1为本发明第一个实施例所述的基于递归神经网络的多机器人协同方法的流程示意图;
图2为本发明第一个实施例所述的基于递归神经网络的多机器人协同方法的递归神经网络原理结构示意图;
图3为本发明第一个实施例所述的基于递归神经网络的多机器人协同方法的递归神经网络原理结构中cell线结构示意图;
图4为本发明第一个实施例所述的基于递归神经网络的多机器人协同方法的递归神经网络原理结构中去除无用信息机制结构示意图;
图5为本发明第一个实施例所述的基于递归神经网络的多机器人协同方法的又一种递归神经网络原理结构中去除无用信息机制结构示意图;
图6为本发明第一个实施例所述的基于递归神经网络的多机器人协同方法的添加新信息示意图;
图7为本发明第一个实施例所述的基于递归神经网络的多机器人协同方法的又一种流程示意图;
图8为本发明第二个实施例所述的基于递归神经网络的多机器人协同系统的模块结构分布示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合说明书附图对本发明的具体实施方式做详细的说明,显然所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明的保护的范围。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。
其次,此处所称的“一个实施例”或“实施例”是指可包含于本发明至少一个实现方式中的特定特征、结构或特性。在本说明书中不同地方出现的“在一个实施例中”并非均指同一个实施例,也不是单独的或选择性的与其他实施例互相排斥的实施例。
本发明结合示意图进行详细描述,在详述本发明实施例时,为便于说明,表示器件结构的剖面图会不依一般比例作局部放大,而且所述示意图只是示例,其在此不应限制本发明保护的范围。此外,在实际制作中应包含长度、宽度及深度的三维空间尺寸。
同时在本发明的描述中,需要说明的是,术语中的“上、下、内和外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一、第二或第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
本发明中除非另有明确的规定和限定,术语“安装、相连、连接”应做广义理解,例如:可以是固定连接、可拆卸连接或一体式连接;同样可以是机械连接、电连接或直接连接,也可以通过中间媒介间接相连,也可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
实施例1
参照图1~图7,为本发明的第一个实施例,提供了一种基于递归神经网络的多机器人协同方法,包括:
S1:利用递归神经网络算法对机器人进行行为记忆学习。参照图2,其中需要说明的是,递归神经网络包括:
通过cell线直接穿过各个时刻的隐藏层以无损保留各时刻变换下的信息;
若在当前时刻,则需去除无用信息;
若去除无用信息之后,则添加信息;
参照图3,cell线只会进行简单的变大变小及添加新内容(X号表示乘以一个倍率、+号表示添加新内容);
参照图4,去除无用信息包括:
输入x及上一个时刻的隐藏层输入ht-1,判断需要去除的无用信息;
利用sigmoid函数输出一个0到1之间的向量,且向量中每个元素对应Ct-1状态里的一个信息,若要完全抹掉,则是0,表达公式如下:
ft=σ(Wf·[ht-1,xt]+bf)
其中,WF为权重矩阵,bf为偏置值,σ为sigmoid函数;
参照图5,若当前输入的是性别,那么在ft()的输出中,与性别相关的那一项就置0,从而把Ct-1传过来的信息中,性别这一项给抹掉,即当Ct-1的状态与sigmoid函数的输出相乘时,对应项就置0了。
参照图6,添加新信息包括:
输入x及上一个时刻的隐藏层输入ht-1,利用sigmoid的门判断需要的新信息;
结合tanh门函数表示需要更新信息的数值,且两者相乘以得到具体更新的信息和对应数值;
将其加入到Ct-1中,根据得到的数值获得当前状态Ct,表达公式如下:
it=σ(Wi·[ht-1,xt]+bi)
Figure BDA0002743338820000061
其中,Wi为函数矩阵,bi为矩阵偏置值,Wc为状态矩阵,bc为状态值。
S2:搭建中央控制器对每个学习的机器人下达指令任务。本步骤需要说明的是:
根据Ct状态得到任务模式并下达给机器人对应的指令,若机器人完成任务时会反馈完成信号。
S3:当接收到一组任务时,根据递归神经网络对任务进行归类处理,完成多机器人协同分解任务。其中还需要说明的是,归类处理包括三种任务形式,即全局规划任务、自由协商任务和隐式合作任务,具体如下:
全局规划任务包括:
对每次完成的任务进行分解和规划计算;
将复杂的任务分解成机器人可以执行的动作命令并产生联合行动规划;
对合作型任务,则形成一种合作规划;
统计所有机器人的信息、任务的信息以及环境的信息;
自由协商任务包括:
当前时刻的机器人不能独立完成任务,需要请求其他机器人与之协作;
通过与其他机器人进行信息交换,进行性能评估,最终形成联合行动规划以实现协作完成任务合作的规划方法;
隐式合作任务包括:
机器人通过自己掌握的领域知识、多机器人共同的目标以及获取的环境信息,通过换位推理获取其他机器人的当前意图,并以此为依据,单独建立机器人之间的合作关系,确定机器人的下一步动作,实现多机器人之间的合作;
递归神经网络接收完成信号并规划接下来的动作达到协同。
参照图7,本实施例还需要说明的是,多机器人协调控制主要存在两个问题,第一,在执行合作任务过程中,如何保持机器人相互之间的动作的协调一致;第二,在系统运行过程中,如何预防和消除冲突或死锁、当冲突或死锁发生后如何采取有效的措施解除冲突或死锁;在多机器人工作运行中,由于外界环境的动态变化及资源的有限性和共享性,机器人在完成各自目标的过程中无法避免地产生冲突或死锁,因此必须采取有效措施加以预防、消除,从而确保机器人系统有序的运行。本实施例对于动态冲突的消除方法主要有:
(1)磋商法:发生冲突的机器人之间通过通信进行磋商,共同研究存在的问题,提出修改各自的计划,使各个机器人都能满足目标要求;
(2)惯例法:每一个机器人都拥有一些惯例准则,当冲突发生时,各个机器人根据惯例来解除冲突;
(3)熟人模型法:一个机器人拥有系统中其它机器人的模型,运行时通过感知了解其它机器人的意图、行为,基于模型和知识来推测它们的规划和目标,从而避免各自行为的冲突。
优选的是,为了对本发明方法中采用的技术效果加以验证说明,本实施例选择以传统的随机森林机器人协同方法与采用本发明方法进行对比试验,以科学论证的手段对比试验结果,验证本发明方法所具有的真实效果。
传统的随机森林机器人协同方法仅适用于单机器人独立控制应用,为验证本发明方法相较于传统方法具有较好的多机器人协同控制平衡趋势,本实施例中将采用传统的随机森林机器人协同方法和本发明方法分别对仿真机器人的多个协同合作进行实时测量对比。
测试环境:将仿真机器人运行在仿真平台模拟运行并模拟三种任务模式下(全局规划任务、自由协商任务和隐式合作任务)的应用场景,分别利用传统方法的单机器人进行任务运行测试并获得测试结果,采用本发明方法,则开启自动化测试设备并运用MATLB实现本发明方法的仿真测试,根据实验结果得到仿真数据,每种方法各测试十组数据,计算获得每组数据的误差值与仿真模拟输入的实际机器人运行参数并进行对比计算误差,结果如下表所示:
表1:协同效率、误差对比数据表。
Figure BDA0002743338820000071
Figure BDA0002743338820000081
参照表1,能够直观的看出,因传统方法无法自主实现对多个机器人进行协同控制,需人工干预,故其测试时间过长,且误差度较大,即精确度较低,而本发明方法脱离了人工操作,实现自主学习协同控制,加快了工作效率,缩短了多机器人协同应用时间,极大的提高了协同控制效率,并提高了协同平衡准确度。
实施例2
参照图8,为本发明的第二个实施例,该实施例不同于第一个实施例的是,提供了一种基于递归神经网络的多机器人协同系统,其特征在于:包括,
数据存储学习模块100,用于存储所有机器人的信息、环境信息和任务信息,添加搭载递归神经网络算法以对机器人进行行为学习训练;
中央控制模块200与数据存储学习模块100相连接并设置于上表面,其通过中央处理器进行任务推演计算,对每个学习的机器人下达指令任务;
协同分析模块300并行连接设置于数据存储学习模块100和中央控制模块200之间,其在每次执行任务前会对上一次的任务进行分析,从而对任务进行协同拆解分配至需要的对应机器人。
优选的是,机器人协同系统加入递归神经网络算法,协同系统就成为了机器人的大脑,在系统中添加所有机器人的信息、环境信息、任务信息,当任务执行时,通过递归神经网络进行推演计算,每次执行任务前会对上一次的任务进行分析,从而协同系统会对任务进行拆解分配至需要的机器人。
应当认识到,本发明的实施例可以由计算机硬件、硬件和软件的组合、或者通过存储在非暂时性计算机可读存储器中的计算机指令来实现或实施。所述方法可以使用标准编程技术-包括配置有计算机程序的非暂时性计算机可读存储介质在计算机程序中实现,其中如此配置的存储介质使得计算机以特定和预定义的方式操作——根据在具体实施例中描述的方法和附图。每个程序可以以高级过程或面向对象的编程语言来实现以与计算机系统通信。然而,若需要,该程序可以以汇编或机器语言实现。在任何情况下,该语言可以是编译或解释的语言。此外,为此目的该程序能够在编程的专用集成电路上运行。
此外,可按任何合适的顺序来执行本文描述的过程的操作,除非本文另外指示或以其他方式明显地与上下文矛盾。本文描述的过程(或变型和/或其组合)可在配置有可执行指令的一个或多个计算机系统的控制下执行,并且可作为共同地在一个或多个处理器上执行的代码(例如,可执行指令、一个或多个计算机程序或一个或多个应用)、由硬件或其组合来实现。所述计算机程序包括可由一个或多个处理器执行的多个指令。
进一步,所述方法可以在可操作地连接至合适的任何类型的计算平台中实现,包括但不限于个人电脑、迷你计算机、主框架、工作站、网络或分布式计算环境、单独的或集成的计算机平台、或者与带电粒子工具或其它成像装置通信等等。本发明的各方面可以以存储在非暂时性存储介质或设备上的机器可读代码来实现,无论是可移动的还是集成至计算平台,如硬盘、光学读取和/或写入存储介质、RAM、ROM等,使得其可由可编程计算机读取,当存储介质或设备由计算机读取时可用于配置和操作计算机以执行在此所描述的过程。此外,机器可读代码,或其部分可以通过有线或无线网络传输。当此类媒体包括结合微处理器或其他数据处理器实现上文所述步骤的指令或程序时,本文所述的发明包括这些和其他不同类型的非暂时性计算机可读存储介质。当根据本发明所述的方法和技术编程时,本发明还包括计算机本身。计算机程序能够应用于输入数据以执行本文所述的功能,从而转换输入数据以生成存储至非易失性存储器的输出数据。输出信息还可以应用于一个或多个输出设备如显示器。在本发明优选的实施例中,转换的数据表示物理和有形的对象,包括显示器上产生的物理和有形对象的特定视觉描绘。
如在本申请所使用的,术语“组件”、“模块”、“系统”等等旨在指代计算机相关实体,该计算机相关实体可以是硬件、固件、硬件和软件的结合、软件或者运行中的软件。例如,组件可以是,但不限于是:在处理器上运行的处理、处理器、对象、可执行文件、执行中的线程、程序和/或计算机。作为示例,在计算设备上运行的应用和该计算设备都可以是组件。一个或多个组件可以存在于执行中的过程和/或线程中,并且组件可以位于一个计算机中以及/或者分布在两个或更多个计算机之间。此外,这些组件能够从在其上具有各种数据结构的各种计算机可读介质中执行。这些组件可以通过诸如根据具有一个或多个数据分组(例如,来自一个组件的数据,该组件与本地系统、分布式系统中的另一个组件进行交互和/或以信号的方式通过诸如互联网之类的网络与其它系统进行交互)的信号,以本地和/或远程过程的方式进行通信。
应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (10)

1.一种基于递归神经网络的多机器人协同方法,其特征在于:包括,
利用递归神经网络算法对机器人进行行为记忆学习;
搭建中央控制器对每个学习的所述机器人下达指令任务;
当接收到一组所述任务时,根据所述递归神经网络对所述任务进行归类处理,完成多机器人协同分解任务。
2.根据权利要求1所述的基于递归神经网络的多机器人协同方法,其特征在于:所述递归神经网络包括,
通过cell线直接穿过各个时刻的隐藏层以无损保留各时刻变换下的信息;
若在当前时刻,则需去除无用信息;
若去除所述无用信息之后,则添加信息;
根据Ct状态得到任务模式并下达给所述机器人对应的指令,若所述机器人完成任务时会反馈完成信号;
所述递归神经网络接收所述信号并规划接下来的动作达到协同。
3.根据权利要求1或2所述的基于递归神经网络的多机器人协同方法,其特征在于:所述cell线只会进行简单的变大变小及添加新内容。
4.根据权利要求3所述的基于递归神经网络的多机器人协同方法,其特征在于:去除所述无用信息包括,
输入x及上一个时刻的隐藏层输入ht-1,判断需要去除的所述无用信息;
利用sigmoid函数输出一个0到1之间的向量,且所述向量中每个元素对应Ct-1状态里的一个信息,若要完全抹掉,则是0,表达公式如下:
t=σ(Wf·[ht-1,xt]+bf)
其中,WF为权重矩阵,bf为偏置值,σ为sigmoid函数。
5.根据权利要求4所述的基于递归神经网络的多机器人协同方法,其特征在于:添加所述新信息包括,
输入x及上一个时刻的隐藏层输入ht-1,利用sigmoid的门判断需要的所述新信息;
结合tanh门函数表示需要更新信息的数值,且两者相乘以得到具体更新的信息和对应数值;
将其加入到Ct-1中,根据得到的数值获得所述当前状态Ct,表达公式如下:
it=σ(Wi·[ht-1,xt]+bi)
Figure FDA0002743338810000021
其中,Wi为函数矩阵,bi为矩阵偏置值,Wc为状态矩阵,bc为状态值。
6.根据权利要求1或5所述的基于递归神经网络的多机器人协同方法,其特征在于:所述归类处理包括三种任务形式,即全局规划任务、自由协商任务和隐式合作任务。
7.根据利要求6所述的基于递归神经网络的多机器人协同方法,其特征在于:所述全局规划任务包括,
对每次完成的任务进行分解和规划计算;
将复杂的任务分解成所述机器人可以执行的动作命令并产生联合行动规划;
对合作型任务,则形成一种合作规划;
统计所有机器人的信息、任务的信息以及环境的信息。
8.根据利要求7所述的基于递归神经网络的多机器人协同方法,其特征在于:所述自由协商任务包括,
当前时刻的所述机器人不能独立完成任务,需要请求其他机器人与之协作;
通过与所述其他机器人进行信息交换,进行性能评估,最终形成联合行动规划以实现协作完成任务合作的规划方法。
9.根据利要求8所述的基于递归神经网络的多机器人协同方法,其特征在于:所述隐式合作任务包括,
所述机器人通过自己掌握的领域知识、多机器人共同的目标以及获取的环境信息,通过记忆学习中获取的信息判断所述其他机器人需要完成的目标及环境信息,获取所述其他机器人的当前意图,并以此为依据,单独建立机器人之间的合作关系,确定机器人的下一步动作,实现多机器人之间的合作。
10.一种基于递归神经网络的多机器人协同系统,其特征在于:包括,
数据存储学习模块(100),用于存储所有机器人的信息、环境信息和任务信息,添加搭载所述递归神经网络算法以对所述机器人进行行为学习训练;
中央控制模块(200)与所述数据存储学习模块(100)相连接并设置于上表面,其通过所述中央处理器进行任务推演计算,对每个学习的所述机器人下达指令任务;
协同分析模块(300)并行连接设置于所述数据存储学习模块(100)和所述中央控制模块(200)之间,其在每次执行任务前会对上一次的任务进行分析,从而对任务进行协同拆解分配至需要的对应机器人。
CN202011157828.XA 2020-10-26 2020-10-26 一种基于递归神经网络的多机器人协同方法及系统 Pending CN112561227A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011157828.XA CN112561227A (zh) 2020-10-26 2020-10-26 一种基于递归神经网络的多机器人协同方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011157828.XA CN112561227A (zh) 2020-10-26 2020-10-26 一种基于递归神经网络的多机器人协同方法及系统

Publications (1)

Publication Number Publication Date
CN112561227A true CN112561227A (zh) 2021-03-26

Family

ID=75042587

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011157828.XA Pending CN112561227A (zh) 2020-10-26 2020-10-26 一种基于递归神经网络的多机器人协同方法及系统

Country Status (1)

Country Link
CN (1) CN112561227A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114924513A (zh) * 2022-06-07 2022-08-19 中迪机器人(盐城)有限公司 一种多机器人协同控制系统及方法
CN116339220A (zh) * 2023-05-30 2023-06-27 北京中兵天工防务技术有限公司 用于协同不同无人系统共同完成任务的方法、装置及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120179638A1 (en) * 2011-01-11 2012-07-12 National Tsing Hua University Relative variable selection system and selection method thereof
CN109992000A (zh) * 2019-04-04 2019-07-09 北京航空航天大学 一种基于分层强化学习的多无人机路径协同规划方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120179638A1 (en) * 2011-01-11 2012-07-12 National Tsing Hua University Relative variable selection system and selection method thereof
CN109992000A (zh) * 2019-04-04 2019-07-09 北京航空航天大学 一种基于分层强化学习的多无人机路径协同规划方法及装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
STARY_CAT_FOUNDER: "一天搞懂深度学习—学习笔记3(RNN)", 《HTTPS://BLOG.CSDN.NET/U013735511/ARTICLE/DETAILS/78233390》 *
姚俊武等: "多机器人系统协调协作控制技术综述", 《黄石理工学院学报》 *
朱小虎XIAOHUZHU: "理解LSTM网络", 《HTTPS://WWW.JIANSHU.COM/P/9DC9F41F0B29》 *
李响等: "基于评价选择策略的Internet多机器人协作控制研究", 《计算机工程与应用》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114924513A (zh) * 2022-06-07 2022-08-19 中迪机器人(盐城)有限公司 一种多机器人协同控制系统及方法
CN116339220A (zh) * 2023-05-30 2023-06-27 北京中兵天工防务技术有限公司 用于协同不同无人系统共同完成任务的方法、装置及系统
CN116339220B (zh) * 2023-05-30 2023-08-01 北京中兵天工防务技术有限公司 用于协同不同无人系统共同完成任务的方法、装置及系统

Similar Documents

Publication Publication Date Title
Sriram et al. DICE: An object-oriented programming environment for cooperative engineering design
Bernstein Architecture| Design| Data: practice competency in the era of computation
US7266534B2 (en) System and method and product of manufacture for automated test generation via constraint satisfaction with duplicated sub-problems
RU2502131C1 (ru) Способ автоматизированного управления проектированием бортовых интеллектуальных систем
CN112561227A (zh) 一种基于递归神经网络的多机器人协同方法及系统
CN110942202A (zh) 应急演练推演方法、计算机存储介质及电子设备
Reddi et al. Simulation of new product development and engineering changes
JP6333160B2 (ja) プロジェクト評価装置及びプロジェクト評価方法及びプロジェクト評価プログラム
EP3968202A1 (en) Customizable reinforcement of learning column placement in structural design
US20190005169A1 (en) Dynamic Design of Complex System-of-Systems for Planning and Adaptation to Unplanned Scenarios
Qiao et al. Dynamic human error risk assessment of group decision-making in extreme cooperative scenario
Dudek et al. SPSysML: A meta-model for quantitative evaluation of Simulation-Physical Systems
Wu et al. Model Healing: Toward a framework for building designs to achieve code compliance
Yan et al. Application of the quality function deployment method in the mechanical structure design of subsea power devices
Kim et al. A model-based approach to refine process parameters in smart manufacturing
Chaharbaghi Using simulation to solve design and operational problems
Visser et al. Integrating the latest artificial intelligence algorithms into the RoboCup rescue simulation framework
Bazarova et al. Construction of individual trajectories of training specialists in the field of information and communication technologies
Mayer Exploring the notion of situation for responsive manufacturing systems specification issues
Angelopoulou et al. The system dynamics architecture of UTASiMo: a simulation-based task analysis tool to predict human error probability
RU2730387C2 (ru) Способ автоматизированного проектирования системы управления многопараметрическим объектом и программно-аппаратный комплекс для его реализации
Mykoniatis et al. The system dynamics architecture of UTASiMo: A simulation-based task analysis tool to predict human error probability
US20230107271A1 (en) Modeling bounded rationality in multi-agent simulations using rationally inattentive reinforcement learning
Al Khawli A metamodeling approach towards virtual production intelligence
Arnold Modelling for reproducibility, transparency, and continuous learning: Revisiting Jakeman’s 10 steps

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination