CN107831685B - 一种群体机器人的控制方法和系统 - Google Patents
一种群体机器人的控制方法和系统 Download PDFInfo
- Publication number
- CN107831685B CN107831685B CN201710954602.4A CN201710954602A CN107831685B CN 107831685 B CN107831685 B CN 107831685B CN 201710954602 A CN201710954602 A CN 201710954602A CN 107831685 B CN107831685 B CN 107831685B
- Authority
- CN
- China
- Prior art keywords
- task
- robot
- action
- strategy
- parameters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 27
- 230000009471 action Effects 0.000 claims abstract description 92
- 238000005457 optimization Methods 0.000 claims abstract description 38
- 238000012545 processing Methods 0.000 claims abstract description 28
- 230000006870 function Effects 0.000 claims description 92
- 238000011156 evaluation Methods 0.000 claims description 31
- 230000004931 aggregating effect Effects 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 5
- 230000008569 process Effects 0.000 abstract description 10
- 238000004891 communication Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 9
- 235000013305 food Nutrition 0.000 description 8
- 230000003993 interaction Effects 0.000 description 8
- 230000006872 improvement Effects 0.000 description 5
- 238000013439 planning Methods 0.000 description 5
- 238000003860 storage Methods 0.000 description 4
- 230000006399 behavior Effects 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 238000013468 resource allocation Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 238000012384 transportation and delivery Methods 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 230000032683 aging Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000010411 cooking Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000037213 diet Effects 0.000 description 1
- 235000005911 diet Nutrition 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B19/00—Programme-control systems
- G05B19/02—Programme-control systems electric
- G05B19/04—Programme control other than numerical control, i.e. in sequence controllers or logic controllers
- G05B19/042—Programme control other than numerical control, i.e. in sequence controllers or logic controllers using digital processors
- G05B19/0423—Input/output
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B2219/00—Program-control systems
- G05B2219/20—Pc systems
- G05B2219/25—Pc structure of the system
- G05B2219/25257—Microcontroller
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/02—Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
Landscapes
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Automation & Control Theory (AREA)
- Feedback Control In General (AREA)
Abstract
本发明公开了一种群体机器人的控制方法和系统,该方法包括:基于历史记录建立预测模型,基于所述预测模型输出预期任务值;以单体机器人的功能约束,基于头脑风暴优化算法处理所述预期任务值以生成若干行动策略,以预设的目标函数和约束条件为目标条件处理所述行动策略以获取最优策略;基于所述最优策略控制群体机器人。该系统用于执行对应方法。本发明基于历史记录建立预测模型以输出预期任务值,基于任务值和机器人功能输出任务的组合,基于头脑风暴算法处理任务的组合并输出最优的行动策略以控制群体机器人,能够合理控制群体机器人以实现复杂任务。
Description
技术领域
本发明涉及机器人控制技术领域,尤其涉及一种群体机器人的控制方法和系统。
背景技术
随着老龄化进程的加快,人力成本也在显著提高,机器人作为单纯人力的替代方案越来越受到重视。在类似餐厅等工作环境,工作岗位众多,如果是功能单一的机器人,则整体的成本太高,因此多功能的机器人正在逐渐取代单一功能的机器人,而此时,需要面临给群体的机器人分配一个合理的任务的问题。
发明内容
为了解决任务分配问题,本发明通过提供一种群体机器人的控制方法和系统。
本发明采用的技术方案一方面为一种群体机器人的控制方法,所述群体机器人为能实现最少一种功能的单体机器人的集合,包括步骤:基于历史记录建立预测模型,基于所述预测模型输出预期任务值;以单体机器人的功能约束,基于头脑风暴优化算法处理所述预期任务值以生成若干行动策略,以预设的目标函数和约束条件为目标条件处理所述行动策略以获取最优策略;基于所述最优策略控制群体机器人。
优选地,所述行动策略包括单体机器人编号robot和任务编号task,其中,所述任务编号task用于标记所述单体机器人能实现的功能;基于task读取任务参数,基于robot读取能力参数,基于所述能力参数、任务参数调用对应的评价函数。
优选地,基于头脑风暴优化算法处理所述预期任务值的步骤包括以单体机器人的功能约束,随机生成若干行动策略,将所述若干行动策略聚集成m个簇,按预设概率Pb在簇内或簇间随机选择已有的行动策略并生成新行动策略,基于所述评价函数比较所述新行动策略与父代行动策略,以时间为目标条件迭代选择耗时最少的行动策略,标记该耗时最少的行动策略为最优策略。
优选地,所述任务参数包括路径参数,所述能力参数包括单体机器人的位置和移动速度;基于贪婪算法处理所述路径参数和能力参数以获取耗时最少的行动策略,标记该行动策略为最优策略。
优选地,获取外部参数以动态更新目标函数和约束条件。
优选地,还包括基于增量学习调节所述预测模型。
本发明采用的技术方案另一方面为一种群体机器人的控制系统,用于执行上述方法,包括:预测模块,用于基于历史记录建立预测模型,基于所述预测模型输出预期任务值;计算模块,用于以单体机器人的功能约束,基于头脑风暴优化算法处理所述预期任务值以生成若干行动策略,以预设的目标函数和约束条件为目标条件处理所述行动策略以获取最优策略;控制模块,用于基于所述最优策略控制群体机器人。
优选地,所述行动策略包括单体机器人编号robot和任务编号task,其中,所述任务编号task用于标记所述单体机器人能实现的功能;基于task读取任务参数,基于robot读取能力参数,基于所述能力参数、任务参数调用对应的评价函数。
优选地,基于头脑风暴优化算法处理所述预期任务值的步骤包括以单体机器人的功能约束,随机生成若干行动策略,将所述若干行动策略聚集成m个簇,按预设概率Pb在簇内或簇间随机选择已有的行动策略并生成新行动策略,基于所述评价函数比较所述新行动策略与父代行动策略,以时间为目标条件迭代选择耗时最少的行动策略,标记该耗时最少的行动策略为最优策略。
优选地,所述任务参数包括路径参数,所述能力参数包括单体机器人的位置和移动速度;基于贪婪算法处理所述路径参数和能力参数以获取耗时最少的行动策略,标记该行动策略为最优策略。
优选地,获取外部参数以动态更新目标函数和约束条件。
优选地,所述预测模块,还用于基于增量学习调节所述预测模型。
本发明的有益效果基于历史记录建立预测模型以输出预期任务值,基于任务值和机器人功能输出任务的组合,基于头脑风暴算法处理任务的组合并输出最优的行动策略以控制群体机器人,能够合理控制群体机器人以实现复杂任务。
附图说明
图1所示为基于本发明实施例的一种群体机器人的控制方法的示意图;
图2所示为基于本发明实施例的餐厅系统的示意图;
图3所示为基于本发明实施例的服务器、机器人的结构示意图;
图4所示为基于本发明实施例的头脑风暴优化算法的示意图;
图5所示为基于本发明实施例的系统的软件架构的示意图;
图6所示为基于本发明实施例的用户场景逻辑关系图;
图7所示为基于本发明实施例的预测模块数据流图。
具体实施方式
以下结合实施例对本发明进行说明。
基于发明的实施例1,如图1所示的一种群体机器人的控制方法,所述群体机器人为能实现最少一种功能的单体机器人的集合,包括步骤:基于历史记录建立预测模型,基于所述预测模型输出预期任务值;以单体机器人的功能约束,基于头脑风暴优化算法处理所述预期任务值以生成若干行动策略,以预设的目标函数和约束条件为目标条件处理所述行动策略以获取最优策略;基于所述最优策略控制群体机器人。
所述行动策略包括单体机器人编号robot和任务编号task,其中,所述任务编号task用于标记所述单体机器人能实现的功能;基于task读取任务参数,基于robot读取能力参数,基于所述能力参数、任务参数调用对应的评价函数。
基于头脑风暴优化算法处理所述预期任务值的步骤包括以单体机器人的功能约束,随机生成若干行动策略,将所述若干行动策略聚集成m个簇,按预设概率Pb在簇内或簇间随机选择已有的行动策略并生成新行动策略,基于所述评价函数比较所述新行动策略与父代行动策略,以时间为目标条件迭代选择耗时最少的行动策略,标记该耗时最少的行动策略为最优策略。
所述任务参数包括路径参数,所述能力参数包括单体机器人的位置和移动速度;基于贪婪算法处理所述路径参数和能力参数以获取耗时最少的行动策略,标记该行动策略为最优策略。
获取外部参数以动态更新目标函数和约束条件。
还包括基于增量学习调节所述预测模型。
本发明以不同工种的服务机器人为单体机器人,实现同质同构、同质异构、异质同构和异质异构群体机器人协作系统,其中包括实现动态资源分配、调度的动态优化和资源储备预测;群体机器人是由具有最少一种功能的机器人组成的群体,机器人包括基本的通信、控制、驱动、显示、传感器等模块。如图2所示的餐厅系统,包括前台服务机器人(工种1~n),服务器(用于存储预测模型并进行预测,用于实现动态优化算法,即实施例中的头脑风暴优化算法),后厨服务机器人(工种1~n),各个机器人进行全局或局部的无线通信。其中,如图3所示,服务器为并行化运算服务器(包括多核CPU/GPU,用于:a.利用历史订单数据使用神经网络等方法建立数据的预测模型;b.利用预测模型根据实时数据基于增量学习的方法对预测模型进行微调并预测接下来预定时间段的订单需求;c.面对动态变化的订单数据,协调群体服务机器人的任务分配与路径规划),机器人包括机器人智能核心模块,该模块包括实现无需机器人协作情况下的机器人自身路径规划功能模块、接收任务后对机器人行为进行控制的控制功能模块,用于环境感知的传感功能模块,用于交互目的的显示功能模块,用于机器人驱动控制的驱动功能模块,用于机器人间以及机器人与服务器间通信的通信模块。
以历史记录建立预测模型,最简单的方式即根据时间和订单量的关系作为预测的基础;可以引进其他的相关的因素作为预测模型的补充,类似的理论如神经网络理论都已经在预测模型方面取得了长足的发展并作为现有技术广为公开;基于预测模型可以获取一个预期任务值,该任务值最少包括要做什么任务,何时要做这个任务,在本实施例中,应用场景为餐厅,任务可以归结做菜和送餐,其中,做菜为单体机器人能实现的功能,对应的参数为消耗时间(属于上述的能力参数,在本例子中描述为食材准备、食物烹制、订单物品组合、路径规划、出单送餐等任务/功能的完成;其中实质为单体机器人完成某个功能的能力),送餐的实质为路径寻找的过程,则上述过程的预期任务值为在某时间内完成做菜并把菜送到某地;在随机时刻,群体机器人的位置和正在实现的功能是不确定的,所以控制这些群体机器人进行下一步运作的可能的选择很多(有很多个任务的组合,即安排某一个机器人(robot)去实现某个功能(task)的组合很多),由于单体机器人所能够实现的功能是基于机器人本身的属性,则要求某个机器人实现某个功能也是有限制的,该限制即所述功能约束(即不能要求单体机器人去做它不能实现的功能),则在该功能约束的条件下,随机形成若干个组合(即所述行动策略),同时,评价这些组合是否符合我们的要求,需要一个评价的基准(即所述的评价函数,根据具体的任务值和能力值从预设的函数组中选择一个合适的函数,标记其为评价函数,例如当task=″送餐″时,评价函数即为路径优化算法,评价函数的值即为机器人按优化的路径行走所需花费的时间。所以,当此评价函数运行完毕时,送餐机器人的行走路径也就同时确定),同时本例子中采用一个目标函数和约束条件作为结束算法的条件,评价函数输出的评价值符合目标函数(在本例子中,将最大化订单出单时效作为目标函数,预设的出单最大时长、烹制好的食物的新鲜度作为约束条件,即目标函数的惩罚因子)和约束条件的要求,则确定该评价值对应的行动策略是符合要求的;约束条件可以是时间限制,即餐厅最终的目的,在合适的时间内提供饮食,而客户等待时间,食材的新鲜程度等都与时间相关且会影响餐厅的生意,所述随机形成的组合中,耗费时间最少的组合就是本例子想要找到的最优的组合;本例子中,采用头脑风暴优化算法首先进行组合的生成,如图4所示,根据单体机器人性能的限制(单体机器人能实现若干功能,则分配给该单体机器人的任务只在其能实现的功能内),随机生成n个任务分配策略,选用适当的评价函数评价每一个策略,然后判断当前算法迭代是否达到最大迭代次数或评价结果已满足服务质量要求,是则结束,否则进入循环体:将n个策略聚集成m个簇,按概率Pb在簇内或簇间随机选择已有策略作为父代按规则生成新策略,然后选用适当的评价函数评价每一个新策略,并保留新策略与相应的父代策略中评价更好的一个。当算法迭代结束时,标记当前策略集合中评价最好的策略为最优策略。作为进一步的改进,目标函数和约束条件可以根据外部数据(包括服务器获取最新订单数据并与群体服务机器人通信获得机器人的环境感知数据,以此更新目标函数和约束条件,例如订单数据动态变化时,对各种食物的需求量、不同工种服务机器人的需求随之动态变化,每一时刻群体机器人在环境中的分布情况动态变化。在服务器与控制模块中,针对动态变化的需求和环境,头脑风暴优化算法要动态优化任务分配策略,任务分配最优策略确定的同时也就意味着完成了对资源的动态优化与调度。例如各种食材的储备,烹制某种食物的特种机器人数量调整,对某项工作由一群同种机器人中的哪些机器人完成,机器人完成任务时走哪条路径等)进行更新(算法原理:在原有的簇进行组合以生产新的簇,然后根据预设的评价函数评价新的簇是否能够比之前的簇更好,如果更好则保留该簇以作为这一代的代表并进行存储,通过逐代组合和评价,当到达最大迭代次数或者评价结果符合要求时,结束算法);得到最优策略之后,基于最优策略选定对应的单体机器人并分配对应的任务。
作为上述实施例的进一步改进,使用增量学习的方式改善预测模型,所述的增量学习(Incremental Learning)是指一个学习系统能不断地从新样本中学习新的知识,并能保存大部分以前已经学习到的知识。增量学习非常类似于人类自身的学习模式,本实施例中为通过更新历史记录来修正预测模型,能够持续的改善模型,增加实用性。
作为上述实施例的说明,单体机器人编号robot为单体机器人具体的ID,任务编号task为单体机器人能够实现的功能的编号,在上述餐厅的实施例中,需要数量化的参数来描述具体的行为(即任务参数,包括各种坐标,运动速度,完成功能的时间等),例如,制作A菜,然后从B地点送到C地点,这个行为涉及做菜和送菜两个过程,则所述能力参数即包括做菜速度和送菜速度,前者可以简单归结为某编号的单体机器人做什么菜需要花费的时间和该机器人到达厨房(做菜地点)所花费的时间,后者可以归结为某编号的单体机器人从地点D移动到地点B(即厨房),然后从B地点送到C地点;而能实现这个过程的组合(即行动策略,由头脑风暴优化算法随机生成)很多,因此需要一个评价函数进行判断哪一个组合才是最好的组合,本例中采用实现所述做菜/送菜过程中耗时最短来评价哪一个组合是最好的组合。
作为上述实施例的进一步改进,获取外部的新的任务值(即所述更新任务值),即增加新的影响因素,由于这个新的影响因素,需要针对这个影响因素进行新的行动策略的生成,将该新的行动策略和之前已经存在的行动策略组合,然后经过如上述处理过程,输出一个最优的行动策略。
作为上述实施例的说明,头脑风暴优化算法的要旨在于不确定最终的组合,只是针对若干已经存在的问题(即所述的任务值),提供若干解(即行动策略),通过不断的将解进行组合或者生成额外的解以生成新的解,然后根据一个评价函数(基于具体的任务值和能力值读取的函数)的输出值(即评价值)来调整组合的保留,即如果新的组合能够比之前的组合更优越,则新的组合会被保留(如上述例子中即采用耗时最短的组合作为优越的组合),通过不断的形成新的组合,并进行评价,当新组合的评价值符合目标函数和约束条件的要求或者迭代的次数达到阈值的时候,得到目标的组合(即最优的行动策略)。
作为上述实施例的进一步改进,采用贪婪算法处理所述任务参数和能力参数以获取最优路径,具体如下:
第一步,将机器人所要行走的环境用图论的理论表示为有向图G=(V,E),v为所有节点v的集合;E为所有节点的连线/边e=(u,v)的集合,边e的长度le(u,v)≥0。路径p的长度l(P)则定义为p中包含的所有边的长度的和。若设定机器人的起始点为s,终点t,则我们的目标为寻找从s到t的最短路径,即minl(P)。至此,我们可以定义使用G的前提条件是:在所建立起的图G中,s可以到达图中的任何一个节点,即集合V不包含真实环境中的障碍物(如其它机器人、人员、临时物体)等机器人目前不可达的地点。
第二步,利用贪婪算法计算从起始点s到终点t的最短路径。路径Pv可按如下步骤反向递推得到:如果边(u,v)是节点v获得最小值min{e=(u,v):u∈s}d(u)+le(u,v)时所记录的边,则路径Pv等于路径Pu再额外加上一条边(u,v)。即我们只需以节点v为起点,走过在节点v上存储的反向到节点u的边;然后再走过在节点u上存储的反向到节点u的前一个节点的边;如此反复直到到达节点s。根据算法的迭代过程我们知道这是一定会实现的,将如此得到的从v到s的反向路径反向就可以得到Pv。所以,一旦贪婪算法到达终点t,算法就终止,我们就可以得到点s到终点t的最短路径Pt。
作为上述实施例的进一步改进,也可以采用头脑风暴算法处理路径,过程如上述处理行动策略的过程一致。
基于发明的实施例2,一种群体机器人的控制系统,用于执行上述方法,包括:预测模块,用于基于历史记录建立预测模型,基于所述预测模型输出预期任务值;计算模块,用于以单体机器人的功能约束,基于头脑风暴优化算法处理所述预期任务值以生成若干行动策略,以预设的目标函数和约束条件为目标条件处理所述行动策略以获取最优策略;控制模块,用于基于所述最优策略控制群体机器人。
所述行动策略包括单体机器人编号robot和任务编号task,其中,所述任务编号task用于标记所述单体机器人能实现的功能;基于task读取任务参数,基于robot读取能力参数,基于所述能力参数、任务参数调用对应的评价函数。
基于头脑风暴优化算法处理所述预期任务值的步骤包括以单体机器人的功能约束,随机生成若干行动策略,将所述若干行动策略聚集成m个簇,按预设概率Pb在簇内或簇间随机选择已有的行动策略并生成新行动策略,基于所述评价函数比较所述新行动策略与父代行动策略,以时间为目标条件迭代选择耗时最少的行动策略,标记该耗时最少的行动策略为最优策略。
所述任务参数包括路径参数,所述能力参数包括单体机器人的位置和移动速度;基于贪婪算法处理所述路径参数和能力参数以获取耗时最少的行动策略,标记该行动策略为最优策略。
所述计算模块,还用于获取外部参数以动态更新目标函数和约束条件。
所述预测模块,还用于基于增量学习调节所述预测模型。
如图5所示系统的软件架构,其中计算负载均衡模块负责均衡多核CPU/GPU并行运算任务以及群体服务机器人计算单元之间的计算负载;订单管理模块负责对历史、在线等订单数据的预处理、订单进度跟踪和出单情况记录等;调度管理模块负责多任务多机器人情况下的任务规划与分配,以及群体机器人间的协作;存储资源分配负责服务器间和群体机器人间存储资源的均衡;网络负载均衡负责服务器与互联网、服务器与群体机器人以及群体机器人相互之间因通信需求引起的网络流量管理、控制,均衡网络负载;资源管理器负责协调分布式存储、通信网络等资源,在二者之间寻求平衡;局部/全局通信控制模块,机器人与邻居机器人通信时采用局部通信,与非邻居机器人以及与服务器间通信时采用全局通信,从而以最高的效率实现通信;防撞控制模块为机器人行走或站定时避免碰撞事故提供安全保障;显示交互模块用于机器人身上集成的带有触摸功能的显示屏的显示控制与交互信号提取反馈;计算机视觉处理模块用于对机器人摄像头信号的处理,主要用于机器人对环境的感知、人机交互等功能,该模块将为防撞控制、路径规划等功能提供环境感知能力基础支持;语音交互模块用于基于语音识别、语义分析的人机交互等功能,用户可以通过该模块利用语音交互实现订单预定等功能。
在上述有向图的理论基础上,我们在CPU/GPU的服务器,结合基于传感器模块的机器人群对环境的感知,利用群体智能算法——头脑风暴优化算法实现群体机器人整体路径的动态优化,在同种机器人群中选择最适合的群体服务机器人以最优的路径完成最合适的任务,使得整体的任务完成时效最高,即为优化算法的解。每个机器人单独运行路径优化算法,最后由服务器选出最适合的一个机器人以最优路径去完成任务;而当前步骤对应的场景为,由服务器运行头脑风暴优化算法从一群可用的服务机器人中选出部分群体机器人执行多个同种任务,头脑风暴路径优化算法对每个机器人路径规划完成的同时也就意味着任务分配完成,因为任务属于同种类型。例如,在一群服务机器人中,头脑风暴路径优化算法得到的优化解为:机器人r1走路径P1花费时间t1,机器人r2走路径P2花费时间t2,机器人r3走路径P3花费时间t3,使得每个机器人完成任务花费的时间ti,i∈{1,2,3}小于预设的服务时长tmax且总时间t1+t2+t3最小。具体地,针对路径优化,头脑风暴路径优化算法的解可表示为向量:[robot,path],其中变量robot∈{r1,r2,…,rn}为当前可选机器人的编号;变量path为图G中以机器人robot为起点的路径。因为每次变量robot变化时,机器人的出发点变化,整个环境地图的拓扑结构可能就会随之改变,路径path的生成规则也需相应变化。
如图6所示为用户场景逻辑关系图,当前订单数据和在线预测模型的预测数据一起输入动态优化模块参与演化计算,其中通信模块为群体智能算法的实现提供基础,评估模块对动态优化的结果即解进行评估,一旦达到标准则进入执行状态,由执行模块输出资源分配策略,包括群体机器人的协作策略,通过通信模块通知群体服务机器人,同时将订单存入历史数据,以便预测模型使用。
如图7所示为预测模块数据流图,深度学习利用历史数据建立并训练神经网络预测模型,预测模型预测(订单预测)提前准备食物的时间、种类与数量(资源贮存),增量学习在此基础上根据时段、天气、地区是否举行大型活动等其它因素做适当调整(实时数据/准实时数据),最后记录成功预测与失败预测的所有环境场景(环境变化),用来归类总结成败的经验教训,用来演化成迁移学习模型。
以上所述,只是本发明的较佳实施例而已,本发明并不局限于上述实施方式,只要其以相同的手段达到本发明的技术效果,都应属于本发明的保护范围。在本发明的保护范围内其技术方案和/或实施方式可以有各种不同的修改和变化。
Claims (4)
1.一种群体机器人的控制方法,所述群体机器人为能实现最少一种功能的单体机器人的集合,其特征在于,包括步骤:
基于历史记录建立预测模型,基于所述预测模型输出预期任务值;
以单体机器人的功能约束,基于头脑风暴优化算法处理所述预期任务值以生成若干行动策略,以预设的目标函数和约束条件为目标条件处理所述行动策略以获取最优策略;
基于所述最优策略控制群体机器人;
所述行动策略包括单体机器人编号robot和任务编号task,其中,所述任务编号task用于标记所述单体机器人能实现的功能;
基于task读取任务参数,基于robot读取能力参数,基于所述能力参数、任务参数调用对应的评价函数;所述任务参数包括路径参数,所述能力参数包括单体机器人的位置和移动速度;
基于头脑风暴优化算法处理所述预期任务值的步骤包括以单体机器人的功能约束,随机生成若干行动策略,将所述若干行动策略聚集成m个簇,按预设概率Pb在簇内或簇间随机选择已有的行动策略并生成新行动策略,基于所述评价函数比较所述新行动策略与父代行动策略,以时间为目标条件迭代选择耗时最少的行动策略,标记该耗时最少的行动策略为最优策略;
获取外部参数以动态更新目标函数和约束条件;
基于增量学习调节所述预测模型;
利用头脑风暴优化算法对群体机器人的整体路径进行动态优化,得到优化结果;
根据所述优化结果更新所述单体机器人对应的所述路径参数。
2.根据权利要求1所述的一种群体机器人的控制方法,其特征在于,基于贪婪算法处理所述路径参数和能力参数以获取耗时最少的行动策略,标记该行动策略为最优策略。
3.一种群体机器人的控制系统,用于执行权利要求1所述方法,其特征在于,包括:
预测模块,用于基于历史记录建立预测模型,基于所述预测模型输出预期任务值;
计算模块,用于以单体机器人的功能约束,基于头脑风暴优化算法处理所述预期任务值以生成若干行动策略,以预设的目标函数和约束条件为目标条件处理所述行动策略以获取最优策略;
控制模块,用于基于所述最优策略控制群体机器人;
所述行动策略包括单体机器人编号robot和任务编号task,其中,所述任务编号task用于标记所述单体机器人能实现的功能;
基于task读取任务参数,基于robot读取能力参数,基于所述能力参数、任务参数调用对应的评价函数;所述任务参数包括路径参数,所述能力参数包括单体机器人的位置和移动速度;
基于头脑风暴优化算法处理所述预期任务值的步骤包括以单体机器人的功能约束,随机生成若干行动策略,将所述若干行动策略聚集成m个簇,按预设概率Pb在簇内或簇间随机选择已有的行动策略并生成新行动策略,基于所述评价函数比较所述新行动策略与父代行动策略,以时间为目标条件迭代选择耗时最少的行动策略,标记该耗时最少的行动策略为最优策略;
所述计算模块,还用于获取外部参数以动态更新目标函数和约束条件;
所述预测模块,还用于基于增量学习调节所述预测模型;
所述控制模块,还用于利用头脑风暴优化算法对群体机器人的整体路径进行动态优化,得到优化结果;
根据所述优化结果更新所述单体机器人对应的所述路径参数。
4.根据权利要求3所述的一种群体机器人的控制系统,其特征在于,基于贪婪算法处理所述路径参数和能力参数以获取耗时最少的行动策略,标记该行动策略为最优策略。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710954602.4A CN107831685B (zh) | 2017-10-13 | 2017-10-13 | 一种群体机器人的控制方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710954602.4A CN107831685B (zh) | 2017-10-13 | 2017-10-13 | 一种群体机器人的控制方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107831685A CN107831685A (zh) | 2018-03-23 |
CN107831685B true CN107831685B (zh) | 2023-03-14 |
Family
ID=61648180
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710954602.4A Active CN107831685B (zh) | 2017-10-13 | 2017-10-13 | 一种群体机器人的控制方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107831685B (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI680364B (zh) * | 2018-11-27 | 2019-12-21 | 財團法人資訊工業策進會 | 用於教練式驅動多機器人合作運作系統之教練裝置及其合作運作控制方法 |
CN109471361B (zh) * | 2018-12-17 | 2020-09-29 | 中国地质大学(武汉) | 一种异构多机器人系统的多目标跟踪控制方法 |
CN109696908B (zh) * | 2019-01-18 | 2022-06-21 | 南方科技大学 | 机器人及其航迹设置方法和系统 |
CN109917815B (zh) * | 2019-04-23 | 2022-02-22 | 中原工学院 | 基于全局最优头脑风暴算法的无人机三维路径设计方法 |
CN111079990B (zh) * | 2019-11-29 | 2022-11-25 | 炬星科技(深圳)有限公司 | 集群机器人调度方法、装置、系统、设备及计算机可读存储介质 |
CN111080023A (zh) * | 2019-12-24 | 2020-04-28 | 中国航空工业集团公司西安飞机设计研究所 | 一种基于头脑风暴优化的舰载飞机出动调度规划方法 |
CN112659127A (zh) * | 2020-12-25 | 2021-04-16 | 达闼机器人有限公司 | 多机器人控制方法、装置、系统、存储介质及电子设备 |
CN113485119B (zh) * | 2021-07-29 | 2022-05-10 | 中国人民解放军国防科技大学 | 一种改进群机器人进化能力的异质同质群体协同进化方法 |
CN114216473B (zh) * | 2021-11-19 | 2024-01-30 | 深圳优地科技有限公司 | 行驶路径的选择方法、装置、设备以及可读存储介质 |
CN115344011A (zh) * | 2022-03-17 | 2022-11-15 | 兰州理工大学 | 一种节能分布式两阶段装配零等待流水车间调度问题的优化系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102914967A (zh) * | 2012-09-21 | 2013-02-06 | 浙江工业大学 | 采摘机器人的自主导航和人机协同采摘作业系统 |
CN104865825A (zh) * | 2015-03-19 | 2015-08-26 | 杭州电子科技大学 | 一种多机器人合作时序预测控制方法 |
CN105045094A (zh) * | 2015-08-03 | 2015-11-11 | 南通大学 | 多机器人群体的任务搜索和任务执行方法 |
CN107168054A (zh) * | 2017-05-10 | 2017-09-15 | 沈阳工业大学 | 多机器人任务分配及路径规划方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9766931B2 (en) * | 2012-04-30 | 2017-09-19 | Massachusetts Institute Of Technology | Uniprocessor schedulability testing for non-preemptive task sets |
-
2017
- 2017-10-13 CN CN201710954602.4A patent/CN107831685B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102914967A (zh) * | 2012-09-21 | 2013-02-06 | 浙江工业大学 | 采摘机器人的自主导航和人机协同采摘作业系统 |
CN104865825A (zh) * | 2015-03-19 | 2015-08-26 | 杭州电子科技大学 | 一种多机器人合作时序预测控制方法 |
CN105045094A (zh) * | 2015-08-03 | 2015-11-11 | 南通大学 | 多机器人群体的任务搜索和任务执行方法 |
CN107168054A (zh) * | 2017-05-10 | 2017-09-15 | 沈阳工业大学 | 多机器人任务分配及路径规划方法 |
Also Published As
Publication number | Publication date |
---|---|
CN107831685A (zh) | 2018-03-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107831685B (zh) | 一种群体机器人的控制方法和系统 | |
Shyalika et al. | Reinforcement learning in dynamic task scheduling: A review | |
Zhou et al. | A hybrid approach combining modified artificial bee colony and cuckoo search algorithms for multi-objective cloud manufacturing service composition | |
CN106875090B (zh) | 一种面向动态任务的多机器人分布式任务分配形成方法 | |
CN104317658B (zh) | 一种基于MapReduce的负载自适应任务调度方法 | |
CN112418497B (zh) | 一种面向制造物联的物料配送路径优化方法 | |
CN104050324B (zh) | 针对单星任务规划问题的数学模型的构建方法及求解方法 | |
CN105729491A (zh) | 机器人任务的执行方法、装置及系统 | |
CN103092683A (zh) | 用于数据分析的基于启发式的调度 | |
CN114281104B (zh) | 一种基于改进蚁群算法的多无人机协同调控方法 | |
Hildebrandt et al. | Supervised learning for arrival time estimations in restaurant meal delivery | |
Ho et al. | Federated deep reinforcement learning for task scheduling in heterogeneous autonomous robotic system | |
CN112035264B (zh) | 一种面向地理大数据的云计算资源调度方法及系统 | |
CN104506576B (zh) | 一种无线传感器网络及其节点任务迁移方法 | |
CN103279818A (zh) | 基于启发式遗传算法的云工作流调度方法 | |
Liu et al. | A framework for scheduling in cloud manufacturing with deep reinforcement learning | |
Tran et al. | Using Fuzzy Clustering Chaotic-based Differential Evolution to solve multiple resources leveling in the multiple projects scheduling problem | |
Ibrahim et al. | Applications of multi-agent deep reinforcement learning: Models and algorithms | |
CN110086855A (zh) | 基于蚁群算法的Spark任务智能感知调度方法 | |
Ye et al. | SHWS: Stochastic hybrid workflows dynamic scheduling in cloud container services | |
Dantu et al. | A comparison of deterministic and stochastic approaches for allocating spatially dependent tasks in micro-aerial vehicle collectives | |
Xu et al. | Task allocation for unmanned aerial vehicles in mobile crowdsensing | |
Qian et al. | A workflow-aided Internet of things paradigm with intelligent edge computing | |
CN112700099A (zh) | 基于强化学习和运筹学的资源调度规划方法 | |
CN118396294A (zh) | 一种基于量子多智能体强化学习的云制造调度方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |