CN111563588A - 编码场景和任务相关学习信息及传输到可传输神经网络层 - Google Patents
编码场景和任务相关学习信息及传输到可传输神经网络层 Download PDFInfo
- Publication number
- CN111563588A CN111563588A CN202010090238.3A CN202010090238A CN111563588A CN 111563588 A CN111563588 A CN 111563588A CN 202010090238 A CN202010090238 A CN 202010090238A CN 111563588 A CN111563588 A CN 111563588A
- Authority
- CN
- China
- Prior art keywords
- task
- neural network
- specific
- robotic device
- network layer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 68
- 238000000034 method Methods 0.000 claims description 33
- 238000013473 artificial intelligence Methods 0.000 claims description 7
- 230000015654 memory Effects 0.000 description 20
- 230000008569 process Effects 0.000 description 9
- 238000003860 storage Methods 0.000 description 9
- 230000004044 response Effects 0.000 description 8
- 230000005540 biological transmission Effects 0.000 description 7
- 239000003795 chemical substances by application Substances 0.000 description 7
- 238000004891 communication Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 6
- 230000007246 mechanism Effects 0.000 description 5
- 238000004519 manufacturing process Methods 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 230000001154 acute effect Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 235000013601 eggs Nutrition 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000000135 prohibitive effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J9/00—Programme-controlled manipulators
- B25J9/16—Programme controls
- B25J9/1602—Programme controls characterised by the control system, structure, architecture
- B25J9/161—Hardware, e.g. neural networks, fuzzy logic, interfaces, processor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J9/00—Programme-controlled manipulators
- B25J9/0093—Programme-controlled manipulators co-operating with conveyor means
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J9/00—Programme-controlled manipulators
- B25J9/16—Programme controls
- B25J9/1656—Programme controls characterised by programming, planning systems for manipulators
- B25J9/1661—Programme controls characterised by programming, planning systems for manipulators characterised by task planning, object-oriented languages
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B19/00—Programme-control systems
- G05B19/02—Programme-control systems electric
- G05B19/04—Programme control other than numerical control, i.e. in sequence controllers or logic controllers
- G05B19/05—Programmable logic controllers, e.g. simulating logic interconnections of signals according to ladder diagrams or function charts
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
Abstract
一种系统包括机器人装置,该机器人装置包括非暂时性计算机可读介质和机器人控制器。该非暂时性计算机可读介质存储包括基础神经网络层的一个或多个机器专用模块。该机器人控制器接收任务专用模块,该任务专用模块包括与使任务能够执行的一个或多个任务专用的神经网络层相对应的信息。该机器人控制器从操作环境收集一个或多个值,并使用这些值作为到包括基础神经网络层和任务专用神经网络层的完整神经网络的输入,从而生成输出值。该机器人控制器继而可以基于该输出值执行任务。
Description
技术领域
本发明总体上涉及与将与场景和任务相关的学习信息编码和传输到可传输的神经网络层中有关的方法、系统和装置。所公开的技术可以应用于例如在工厂设置中增强后勤和任务执行。
背景技术
机器学习的最新进展引发了大量研究和实践开发,从而导致了从门户网站到工业自动化的各种技术领域的广泛应用。在采用新颖的学习算法方面,尤其是工业自动化领域已被证明既充满希望,又具有挑战性,例如在使用通用物理硬件智能地抓取各种对象的分类任务中可以看到。虽然广义上的机器学习和人工智能(AI)技术为工业自动化带来了革命性的机遇——特别是在工业4.0的杰出愿景的推动下,旨在实现生产线的大规模定制,但这一领域也凸显了专家将要解决当前最先进的学习算法的缺点,以实现广泛应用。在未来几十年中,能够快速可靠地弥合工业自动化中AI技术的潜力与实现之间的鸿沟很可能会成为制造业自动化市场中的关键区别因素之一。
减慢当前最先进学习算法的采用的一个方面是将学习到的策略和决策结构转移到不同的代理甚至部署到不同环境的代理。我们当前的发明解决了装置暴露于各种不同环境和相关任务的后一问题。特别是,如果可能的环境和任务的数量很大,那么训练单个算法来捕获代理可能面临的所有可能的场景可能会变得令人望而却步。例如,当使用神经网络时,随着将节点添加到给定网络中,可能的神经元连接呈指数增长。计算时间取决于节点及其连接的数量。增加可能会对处理时间造成严重影响。尤其是当学习算法在嵌入式装置上运行时,而不是在配备GPU的普通计算PC上,这种尺寸问题尤其突出。同时,行业正朝着边缘自动化的方向发展,它在流程附近提供了更多的智能。在这些边缘装置上,可用的计算资源相当有限,并且在内存,速度和占用空间方面都有一些限制。因此,将大型通用网络部署到支持AI的边缘装置通常是不可行的。
发明内容
本发明的实施例通过提供与将与场景和任务相关的学习信息编码和传输到可传输的神经网络层中有关的方法、系统和装置,解决并克服了上述缺点和短处中的一个或多个。
根据一些实施例,一种系统包括机器人装置,机器人装置包括非暂时性计算机可读介质和机器人控制器。非暂时性计算机可读介质存储包括基础神经网络层的一个或多个机器专用模块。机器人控制器接收任务专用模块,所述任务专用模块包括与使任务能够执行的一个或多个任务专用的神经网络层相对应的信息。机器人控制器从操作环境收集一个或多个值,并使用这些值作为到包括基础神经网络层和任务专用神经网络层的完整神经网络的输入,以生成输出值。机器人控制器然后可以基于输出值执行任务。
根据其他实施例,一种系统包括对象,对象包括非暂时性计算机可读介质和网络组件。非暂时性计算机可读介质存储多个任务专用模块。每个任务专用模块包括与任务专用的神经网络层相对应的信息,使得能够执行涉及对象的任务。网络组件根据请求将一个或多个任务专用模块传输到机器人装置。机器人装置将所传输的任务专用模块与机器专用模块进行组合,以形成用于执行涉及对象的分配任务的完整神经网络。
根据其他实施例,一种方法包括一种机器人装置,该机器人装置存储包括基础神经网络层的一个或多个机器专用模块。机器人装置接收任务专用模块,该任务专用模块包括与使得能够执行任务的一个或多个任务专用的神经网络层相对应的信息,并且机器人装置从操作环境中收集一个或多个值。机器人装置然后使用这些值作为到包括基础神经网络层和任务专用神经网络层的神经网络的输入,以生成输出值。机器人装置然后可以基于输出值执行任务。
通过以下参考附图进行的说明性实施例的详细描述,本发明的其他特征和优点将变得显而易见。
附图说明
当结合附图阅读时,从以下详细描述中将最好地理解本发明的前述和其他方面。为了说明本发明,在附图中示出了当前优选的实施方式,然而,应当理解,本发明不限于所公开的特定手段。附图中包括以下附图:
图1A示出了根据一些实施例的如何将机器模块转移到机器人装置的第一示例;
图1B示出了根据一些实施例的如何将机器模块转移到机器人装置的第二示例;
图1C示出了根据一些实施例的如何将机器模块转移到机器人装置的第三示例;
图1D示出了根据一些实施例的如何将机器模块转移到机器人装置的第四示例;
图2示出了单个对象如何存储多个任务专用模块;
图3示出了根据一些实施例的可以用于在对象上存储任务专用模块的示例性RFID(射频标识符)标签;以及
图4示出了在其中可以实现任务计划计算机的示例性计算环境。
具体实施方式
本文描述的系统、方法和装置通常涉及将与场景和任务相关的学习信息编码和传输到可传输的神经网络层中。本文所述的技术基于以下理解:即使当机器人暴露于不同的环境和任务时,许多相关属性也是装置专用的并且保持不变。在下文中,我们概述了一种技术解决方案,使经过装置特定功能预培训的代理能够从其所暴露的基础结构中并结合各个代理要执行的选定任务继承其他模块化扩展到其决策结构。本文描述的解决方案围绕灵活的模块化架构发展,其中神经网络层或一组层可以与特定任务或技能相关联。任务专用层可以存储在被动元件上,而通用层可以存储在移动或主动组件上。
利用本文描述的技术,神经网络策略被分解成任务专用模块和机器专用模块,其中任务专用模块在执行给定任务所需的机器之间共享,并且机器专用模块在同一机器上的所有任务之间共享。本文描述的任务专用模块和机器专用模块可以被传输以:(1)学习如何执行特定任务,例如拾取对象;(2)结合机器专用模块以获得更好的任务性能。以这种方式,可以在机器之间共享抓取任务信息(例如,配备有聚焦在不同视点的摄像头的两个机器人装置)。
如本文所用,术语“模块”是指单独的神经网络层或一组神经网络层。对于每个模块,需要存储和交换的信息由权重和网络形状(例如每层节点数)组成。例如,可以通过可扩展标记语言(XML)文件或用户定义的二进制文件来管理此信息。或者,如果最终用户使用现有的机器学习软件,则模块可以以其自己的I/O格式存储,以存储和加载经过训练的网络。重要的因素是发送器和接收器事先知道要在装置和对象之间共享的信息的格式。
图1A示出了根据一些实施例的如何将机器模块转移到机器人装置120的第一示例。在此示例中,机器人装置120正在接近由可编程逻辑控制器(PLC)125控制的传送带130。机器人装置120的任务是抓取传送带130上的盒子135。机器人装置120具有存储机器专用模块105的非暂时性计算机可读介质,该机器专用模块105包括第一组神经网络层,在此称为“基础”神经网络层。这些网络层例如表示机器相关的信息,例如机器人上可以使用哪种类型的相机(例如RGB,深度),哪种分辨率,对光的敏感度,温度等,可以使用哪种夹具等。因此,根据机器的约束,“基础”神经网络将提取最佳的功能和策略集。PLC 125将任务专用模块110发送到机器人装置120。该传输可以是例如对来自机器人装置120的请求的响应。替代地,当机器人装置120在盒子135的一定距离内时,可以将任务专用模块110推送到机器人装置120。任务专用模块110包括使得能够执行任务(在这种情况下为抓取任务)的任务专用神经网络层。任务专用信息可以单独或组合地隐式编码以下任意内容:在何处以及如何处理对象(例如在不损坏的情况下)(例如,鸡蛋和重石头将采用不同的信息);要成功执行诸如装配之类的任务应遵循的程序;使用什么工具以及如何使用它们(例如,考虑光滑的对象与可变形的对象);对象的不可预见的行为(例如,隐藏的液体或可能移动重心的运动部件)等。该信息可以隐式编码在任务专用神经网络中。
继续参考图1A,然后,机器人装置120从操作环境中收集执行任务所需的一个或多个值。这些值可以是,例如,由位置、温度和/或图像传感器收集的数据。在一些实施例中,机器人装置120被预配置为具有执行特定任务所需的值的知识。在其他实施例中,可以将这些值的描述作为任务专用模块110的一部分来提供。例如,除了任务专用神经网络层之外,PLC125还可以提供所需值的列表。机器人装置120使用这些值作为到包括基础神经网络层和任务专用神经网络层的完整神经网络115的输入,以生成输出值。机器人装置120然后可以使用输出值执行任务。
图1B示出了根据一些实施例的如何将机器模块转移到机器人装置120的第二示例。在此示例中,机器人装置140已在抓取盒子135。此外,机器人装置140具有完整神经网络115的副本,包括任务专用模块110。在这种情况下,机器人装置140可以与第二机器人装置120共享任务专用模块110,以教导后者如何抓取盒子135。通常,本领域中已知的任何技术都可以用于在机器人装置140和机器人装置120之间传输信息。例如,在一个实施例中,两个机器人装置经由无线网络(图1B中未示出)进行通信。
图1C示出了根据一些实施例的如何将机器模块转移到机器人装置120的第三示例。在此示例中,盒子135具有包括任务专用模块110的射频标识符(RFID)标签。机器人装置120包括RFID标签读取器,该RFID标签读取器用于从RFID标签检索任务专用模块110。通过RFID检索信息的技术在本领域中是众所周知的,因此本文不对这些技术进行详细描述。下面参考图3描述可以与本发明一起使用的RFID标签的一个示例。应当注意,上述一般概念可以扩展到其他类似的存储和传输机制。例如,在一个实施例中,任务专用模块110存储在盒子135上的蓝牙智能标签中。然后,机器人装置120通过蓝牙检索任务专用模块110。
图1D示出了根据一些实施例的如何将机器模块转移到机器人装置120的第四示例。机器人设备120从盒子135读取标识符155。在图1D的示例中,机器人装置120使用图像扫描仪(图1D中未示出)来读取QR码。然而,通常,本领域中已知的任何技术都可以用于读取标识符155。例如,在一些实施例中,标识符155可以存储在盒子135上的RFID标签或蓝牙智能标签中。机器人装置120通过网络145将标识符155发送到任务计划计算机150。该网络145可以是例如私有内部网或因特网。作为响应,任务计划计算机150将任务专用模块110发送给机器人装置120。然后,与上述其他示例一样,机器人装置120将任务专用模块110与机器专用模块105组合在一起,以形成完整神经网络115,该完整神经网络115可用于完成涉及盒子135的任务。
确切的任务可以在标识符155本身中指定。例如,盒子135可以提供特定的“抓取”标识符。替代地,标识符155可以仅识别盒子135本身,并且机器人装置120指定其希望完成的任务。例如,除了将标识符155提供给任务计划计算机150之外,机器人装置120还可以发送期望的命令(例如,“抓取”)。无论哪种情况,由机器人装置120提供的信息都可以直接用作在任务计划计算机150可以访问的存储介质上标识任务专用模块110的方式。例如,在一个实施例中,任务计划计算机150包括基于对象标识符和/或任务标识符被索引的数据库。
在一些实施例中,任务计划计算机150调度在机器人装置120上执行的任务。例如,任务计划计算机150可以分配涉及检索盒子135并将其运输到操作环境中的另一位置的任务。在这种情况下,用于任务的指令被推送到机器人装置120,使得它可以相应地执行。除了这些指令之外,可以将任务专用模块110和完成分配的任务所需的任何其他任务专用模块推送到机器人装置120。因此,机器人装置120将在需要时使该信息容易获得。
在一些实施例中,可以将任务专用模块110和机器专用模块105进行混合和匹配,以执行新任务或任务和机器组合的集合,或者在特别困难的组合的情况下,从良好的初始化开始新任务的学习过程。例如,对象可以根据针对该对象的预期机器人动作的集合来存储不同的任务专用模块,如图2中的概念所示。因此,任务和机器专用组件的这种模块化分解有助于避免创建难以管理的大小的通用神经网络结构,而对它们的性能没有任何保证。某些任务有可能分解为子任务。由系统实现决定分解任务和传输的方式。如果需要其他抓取任务,则提供的组合可以启动学习过程。通过转移学习并调整先前掌握的任务的权重,可以形成专用网络。请注意,转移学习所需的资源比从零开始训练网络要少得多,因为它假设只需要重新训练少量权重(通常在网络输出的完全连接层中)。因此,这种方法特别适用于边缘处的低性能系统。
本文所述的技术对于实现边缘上的AI应用至关重要。机器可以自主地与环境交互,而无需创建通用的AI组件,这在过去没有被证明是成功的。近年来,人工智能应用程序的几乎所有成功都在于特定领域的垂直应用程序。本公开的模块化方法使得能够对自主系统进行模块化学习,从而减少了存储器和计算需求。
此外,在训练数据稀缺的应用中,所公开的模块化方法有助于AI应用的部署,从而使任何代理轻松转移任何获得的知识。特别是,通过分解任务专用和机器专用组件中学习到的策略,可以训练较小的、可管理的动作,而不是通用的机器人反馈策略。
此外,本文描述的技术可以在概念上理解为将神经网络分成固定部分和柔性部分。固定部分是机器专用的,并且可以部署到硬件加速器的推理优化部分。神经网络的柔性、任务专用的部分用于训练新的类别并动态地适应当前的分类器。这些部分可以部署到硬件加速器的柔性部分,例如SHAVE,GPU或CPU。
图3示出了根据一些实施例的可以用于在对象上存储任务专用模块的示例性RFID标签。该RFID标签300是有源RFID标签,其包括电源310(例如,电池);然而,应当理解,无源RFID标签可以类似地用于实施本发明。计算机可读介质305存储任务专用模块305A,305B,305C。计算机可读介质305优选地由非易失性存储介质组成,使得在电源310发生故障或更换的情况下它将保留其内容。解调器325解调通过天线连接330接收的信号。这些信号可以包括例如从机器人装置接收到的特定任务的描述。控制逻辑315使用解调的信号来选择一个或多个任务专用模块305A,305B,305C。调制器320调制由控制逻辑315(例如,包括一个或多个任务专用模块)生成的输出信号。通过驱动天线连接330,经调制的信号被发送到机器人装置或其他接收器。
图4示出了在其中可以实现任务计划计算机150(图1D中所示)的示例性计算环境400。计算环境400包括计算机系统410,计算机系统410是可以在其上实现本发明的实施例的计算系统的一个示例。诸如计算机系统410和计算环境400之类的计算机和计算环境是本领域技术人员已知的,因此在此简要描述。
如图4所示,计算机系统410可以包括诸如总线421的通信机制或用于在计算机系统410内传递信息的其他通信机制。计算机系统410还包括与总线421耦合的一个或多个处理器420,用于处理信息。处理器420可以包括一个或多个中央处理单元(CPU),图形处理单元(GPU)或本领域中已知的任何其他处理器。
计算机系统410还包括耦合到总线421的系统存储器430,用于存储将由处理器420执行的信息和指令。系统存储器430可以包括易失性和/或非易失性存储器形式的计算机可读存储介质,例如只读存储器(ROM)431和/或随机存取存储器(RAM)432。系统存储器RAM432可以包括其他动态存储设备(例如,动态RAM,静态RAM和同步DRAM)。系统存储器ROM431可以包括其他静态存储设备(例如,可编程ROM,可擦除PROM和电可擦除PROM)。另外,系统存储器430可以用于在处理器420执行指令期间存储临时变量或其他中间信息。基本输入/输出系统(BIOS)433包含可在ROM 431中存储的基本例程,这些例程有助于在计算机系统410中的元件之间(例如在启动期间)传输信息。RAM 432可以包含数据和/或程序模块,它们可以被处理器420立即访问和/或当前由处理器420操作。系统存储器430可以另外包括例如操作系统434,应用程序435,任务专用模块436和程序数据437。应用程序435可以包括例如一个或多个可执行应用程序,其响应于从机器人装置480接收到的请求,使得能够检索一个或多个任务专用模块436。
计算机系统410还包括联接到总线421的盘控制器440,以控制用于存储信息和指令的一个或多个存储装置,例如硬盘441和可移动介质驱动器442(例如,光盘驱动器,固态硬盘等)。可以使用适当的装置接口(例如,小型计算机系统接口(SCSI),集成设备电子设备(IDE),通用串行总线(USB)或火线)将存储装置添加到计算机系统410。
计算机系统410可以响应于处理器420执行包含在诸如系统存储器430之类的存储器中的一个或多个指令的一个或多个序列,来执行本发明实施例的部分或全部处理步骤。可以从诸如硬盘441或可移动介质驱动器442之类的另一计算机可读介质将这样的指令读入系统存储器430。硬盘441可以包含一个或多个本发明的实施例使用的数据存储和数据文件。例如,在一些实施例中,硬盘441可以用于存储任务专用模块,作为RAM 432的替代或补充。数据存储内容和数据文件可以加密以提高安全性。处理器420还可以在多处理布置中采用以执行系统存储器430中包含的一个或多个指令序列。在替代实施例中,可以使用硬连线电路代替软件指令或与软件指令结合使用。因此,实施例不限于硬件电路和软件的任何特定组合。
如上所述,计算机系统410可以包括至少一个计算机可读介质或存储器,用于保存根据本发明的实施例编程的指令并且用于包含本文描述的数据结构,表,记录或其他数据。如本文所使用的术语“计算机可读介质”是指参与向处理器420提供指令以供执行的任何介质。计算机可读介质可以采用许多形式,包括但不限于非易失性介质,易失性介质和传输介质。非易失性介质的非限制性示例包括光盘,固态驱动器,磁盘和磁光盘,例如硬盘441或可移动介质驱动器442。易失性介质的非限制性示例包括动态存储器,例如系统存储器430。传输介质的非限制性示例包括同轴电缆,铜线和光纤,包括构成总线421的线。传输介质也可以采用声波或光波的形式,例如在无线电波和红外数据通信期间生成的声波或光波。
当在联网环境中使用时,计算机系统410可以包括调制解调器472,用于通过诸如互联网的网络471与机器人装置480或其他远程计算系统建立通信。调制解调器472可以经由用户网络接口470或经由另一种适当的机制连接至总线421。应当注意,尽管在图4所示的示例中,机器人装置480被示为通过网络471连接到计算机系统410,参照图4,在本发明的其他实施例中,计算机系统410可以直接连接到机器人装置480。例如,在一个实施例中,计算机系统410和机器人装置480位于同一房间或相邻房间中,并且使用本领域公知的任何传输介质来连接装置。
网络471可以是本领域中公知的任何网络或系统,包括因特网,内联网,局域网(LAN),广域网(WAN),城域网(MAN),直接连接或系列连接,蜂窝电话网络或能够促进计算机系统410与其他计算机(例如,机器人装置480)之间的通信的任何其他网络或介质。网络471可以是有线的,无线的或其组合。可以使用以太网,通用串行总线(USB),RJ-11或本领域中通常已知的任何其他有线连接来实现有线连接。可以使用Wi-Fi,WiMAX和蓝牙,红外,蜂窝网络,卫星或本领域通常已知的任何其他无线连接方法来实现无线连接。另外,几个网络可以单独工作或彼此通信以促进网络471中的通信。
计算机系统410的一般架构可用于实现机器人装置480的内部计算系统。在一些实施例中,上述计算机系统410的各种组件可以以简化形式使用。例如,机器人装置480可以使用单个处理器和相对少量的系统存储器430。另外,可以省略诸如硬盘441和可移动介质驱动器442的组件。此外,机器人装置480可以存储诸如机器专用模块之类的附加数据,以使其能够执行本文描述的技术。
本公开的实施例可以用硬件和软件的任何组合来实现。另外,本公开的实施例可以被包括在具有例如计算机可读的非暂时性介质的制品(例如,一个或多个计算机程序产品)中。介质在其中体现了例如用于提供和促进本公开的实施例的机制的计算机可读程序代码。制品可以作为计算机系统的一部分包含在内,也可以单独出售。
虽然本文已经公开了各种方面和实施例,但是其他方面和实施例对于本领域技术人员将是显而易见的。本文各种公开的方面和实施例是为了说明的目的,而不是限制性的,其真实范围和精神由所附权利要求指示。
除非从下面的讨论中另外明显指出,否则将理解,诸如“应用”,“生成”,“标识”,“确定”,“处理”,“计算”,“选择”等术语可以指计算机系统或类似电子计算设备的操作和过程,其将表示为计算机系统寄存器和存储器中物理(例如电子)数量的数据操纵和转换为类似表示为计算机系统存储器或寄存器或其他此类信息存储、传输或显示装置中物理数量的其他数据。可以使用计算机软件来实现本文描述的方法的实施例。如果以符合公认标准的编程语言编写,则可以编译旨在实现这些方法的指令序列,以在各种硬件平台上执行以及与各种操作系统接口。另外,没有参考任何特定的编程语言来描述本发明的实施例。应当理解,可以使用各种编程语言来实现本发明的实施例。
本文所使用的可执行应用程序包括代码或机器可读指令,用于例如响应于用户命令或输入而调节处理器以实现预定功能,例如操作系统,上下文数据获取系统或其他信息处理系统的功能。可执行过程是一段代码或机器可读指令,子例程或代码的其他不同部分,或者是用于执行一个或多个特定过程的可执行应用程序的一部分。这些过程可以包括:接收输入数据和/或参数;对接收到的输入数据执行操作和/或响应于接收到的输入参数执行功能;以及提供结果输出数据和/或参数。
本文的功能和处理步骤可以响应于用户命令而自动地或全部地或部分地执行。自动执行的活动(包括步骤)是响应一个或多个可执行指令或装置操作而执行的,而无需用户直接启动活动。
附图的系统和过程不是唯一的。可以根据本发明的原理导出其他系统,过程和流程,以实现相同的目的。尽管已经参考特定实施例描述了本发明,但是应当理解,本文示出和描述的实施例和变型仅用于说明目的。在不脱离本发明的范围的情况下,本领域技术人员可以对当前设计进行修改。如本文所述,可以使用硬件组件,软件组件和/或其组合来实现各种系统,子系统,代理,管理器和过程。根据35U.S.C.112(f)的规定,此处的任何权利要求要素均不可解释为使用短语“用于……的装置”明确地叙述的元件。
Claims (20)
1.一种系统,包括:
机器人装置,其包括:
非暂时性计算机可读介质,其存储包括基础神经网络层的一个或多个机器专用模块;
机器人控制器,其配置为:
接收任务专用模块,所述任务专用模块包括与使任务能够执行的一个或多个任务专用的神经网络层相对应的信息;
从操作环境收集一个或多个值;
使用所述值作为包括基础神经网络层和任务专用神经网络层的神经网络的输入,以生成输出值;以及
根据输出值执行任务。
2.根据权利要求1所述的系统,还包括:
任务计划计算机,其配置为:
安排要在机器人装置上执行的任务,以及
将任务专用模块传输到所述机器人装置。
3.根据权利要求1所述的系统,其中,所述任务涉及对象的操纵,并且所述任务专用模块从所述对象接收。
4.根据权利要求1所述的系统,其中,所述任务涉及对象的操纵,并且所述任务专用模块从控制保持所述对象的装置的可编程逻辑控制器接收。
5.根据权利要求4所述的系统,其中,保持所述对象的装置是传送带。
6.根据权利要求1所述的系统,其中,所述任务涉及对象的操纵,并且所述机器人控制器还配置为:
读取位于所述对象上的标识符;
使用所述标识符从外部计算机系统请求所述任务专用模块。
7.根据权利要求1所述的系统,其中,所述任务涉及对象的操纵,并且所述任务专用模块从第二机器人装置接收。
8.根据权利要求1所述的系统,其中,与一个或多个任务专用的神经网络层相对应的信息包括:
(i)多个神经网络权重值,以及
(ii)描述任务专用的神经网络层的形状的一个或多个特征。
9.根据权利要求8所述的系统,其中,描述任务专用的神经网络层的形状的特征包括对构成任务专用的神经网络层的神经网络架构的描述。
10.根据权利要求1所述的系统,其中,与一个或多个任务专用的神经网络层相对应的信息以可扩展标记语言(XML)进行编码。
11.根据权利要求1所述的系统,其中,所述机器人装置包括用于执行神经网络的人工智能(AI)加速器。
12.一种系统,包括:
对象,其包括:
存储有多个任务专用模块的非暂时性计算机可读介质,其中,每个任务专用模块包括与任务专用的神经网络层相对应的信息,使得能够执行涉及所述对象的任务;
网络组件,配置为根据请求将一个或多个任务专用模块传输到机器人装置,
其中,机器人装置将所传输的任务专用模块与机器专用模块进行组合,以形成用于执行涉及对象的分配任务的完整神经网络。
13.根据权利要求12所述的系统,其中,所传输的任务专用模块对应于抓取对象的指令。
14.根据权利要求12所述的系统,其中,与一个或多个任务专用的神经网络层相对应的信息包括:
(i)多个神经网络权重值;以及
(ii)描述任务专用的神经网络层的形状的一个或多个特征。
15.根据权利要求14所述的系统,其中,描述任务专用的神经网络层的形状的特征包括每个任务专用的神经网络层上包含多少个节点的描述。
16.根据权利要求12所述的系统,其中,与一个或多个任务专用的神经网络层相对应的信息以可扩展标记语言(XML)进行编码。
17.一种方法,包括:
通过机器人装置存储包括基础神经网络层的一个或多个机器专用模块;
通过机器人装置接收任务专用模块,所述任务专用模块包括与使任务能够执行的一个或多个任务专用的神经网络层相对应的信息;
通过机器人装置从操作环境收集一个或多个值;
通过机器人装置使用所述值作为包括基础神经网络层和任务专用神经网络层的神经网络的输入,以生成输出值;以及
通过机器人装置根据输出值执行任务。
18.根据权利要求17所述的方法,其中,所述任务涉及对象的操纵,并且所述任务专用模块从控制一装置的可编程逻辑控制器接收。
19.根据权利要求17所述的方法,其中,所述任务涉及对象的操纵,并且所述方法还包括:
读取位于所述对象上的标识符;
使用所述标识符从外部计算机系统请求所述任务专用模块。
20.根据权利要求17所述的方法,其中,所述任务涉及对象的操纵,并且所述任务专用模块从第二机器人装置接收。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP19156887.2 | 2019-02-13 | ||
EP19156887.2A EP3696733B1 (en) | 2019-02-13 | 2019-02-13 | Encoding and transferring scene and task dependent learning information into transferable neural network layers |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111563588A true CN111563588A (zh) | 2020-08-21 |
CN111563588B CN111563588B (zh) | 2024-04-30 |
Family
ID=65433564
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010090238.3A Active CN111563588B (zh) | 2019-02-13 | 2020-02-13 | 编码场景和任务相关学习信息及传输到可传输神经网络层 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20200254609A1 (zh) |
EP (1) | EP3696733B1 (zh) |
CN (1) | CN111563588B (zh) |
WO (1) | WO2020167641A1 (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP4003665A1 (en) * | 2019-09-15 | 2022-06-01 | Google LLC | Determining environment-conditioned action sequences for robotic tasks |
EP3904013B1 (en) * | 2020-04-27 | 2022-07-20 | C.R.F. Società Consortile per Azioni | System for assisting an operator in a work station |
WO2022082463A1 (zh) * | 2020-10-20 | 2022-04-28 | 华为技术有限公司 | 通信方法、装置及系统 |
CN114131598B (zh) * | 2021-11-24 | 2024-02-02 | 深圳大学 | 层次化机器人技能表达方法、终端及计算机可读存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0589394A1 (en) * | 1992-09-21 | 1994-03-30 | Toyoda Koki Kabushiki Kaisha | Method and apparatus for controlling a robot using a neural network |
KR100752098B1 (ko) * | 2006-03-07 | 2007-08-24 | 한국과학기술연구원 | 신경망 기반 로봇 시스템 |
US20130218335A1 (en) * | 2012-02-21 | 2013-08-22 | GM Global Technology Operations LLC | Procedural memory learning and robot control |
CN106898350A (zh) * | 2017-01-16 | 2017-06-27 | 华南理工大学 | 一种基于深度学习的智能工业机器人语音交互与控制方法 |
CN107977706A (zh) * | 2017-08-09 | 2018-05-01 | 小蚁科技(香港)有限公司 | 模块化分布式人工神经网络 |
WO2018140969A1 (en) * | 2017-01-30 | 2018-08-02 | Google Llc | Multi-task neural networks with task-specific paths |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB9902115D0 (en) * | 1999-02-01 | 1999-03-24 | Axeon Limited | Neural networks |
US20100017033A1 (en) * | 2008-07-18 | 2010-01-21 | Remus Boca | Robotic systems with user operable robot control terminals |
US8307061B1 (en) * | 2011-10-27 | 2012-11-06 | Google Inc. | System and method for determining manufacturer instructions executable by a robotic device |
US9492923B2 (en) * | 2014-12-16 | 2016-11-15 | Amazon Technologies, Inc. | Generating robotic grasping instructions for inventory items |
US20170076195A1 (en) * | 2015-09-10 | 2017-03-16 | Intel Corporation | Distributed neural networks for scalable real-time analytics |
-
2019
- 2019-02-13 EP EP19156887.2A patent/EP3696733B1/en active Active
-
2020
- 2020-02-10 WO PCT/US2020/017460 patent/WO2020167641A1/en active Application Filing
- 2020-02-12 US US16/788,904 patent/US20200254609A1/en active Pending
- 2020-02-13 CN CN202010090238.3A patent/CN111563588B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0589394A1 (en) * | 1992-09-21 | 1994-03-30 | Toyoda Koki Kabushiki Kaisha | Method and apparatus for controlling a robot using a neural network |
KR100752098B1 (ko) * | 2006-03-07 | 2007-08-24 | 한국과학기술연구원 | 신경망 기반 로봇 시스템 |
US20130218335A1 (en) * | 2012-02-21 | 2013-08-22 | GM Global Technology Operations LLC | Procedural memory learning and robot control |
CN106898350A (zh) * | 2017-01-16 | 2017-06-27 | 华南理工大学 | 一种基于深度学习的智能工业机器人语音交互与控制方法 |
WO2018140969A1 (en) * | 2017-01-30 | 2018-08-02 | Google Llc | Multi-task neural networks with task-specific paths |
US20190354868A1 (en) * | 2017-01-30 | 2019-11-21 | Google Llc | Multi-task neural networks with task-specific paths |
CN107977706A (zh) * | 2017-08-09 | 2018-05-01 | 小蚁科技(香港)有限公司 | 模块化分布式人工神经网络 |
Non-Patent Citations (4)
Title |
---|
ANDREAS等: "Modular Multitask Reinforcement Learning with Policy Sketches", pages 1 - 11 * |
COLINE DEVIN等: "Learning modular neural network policies for multi-task and multi-robot transfer", pages 2169 - 2176 * |
孙健鹏: "模块化可重构机器人控制系统的研究与设计", no. 5, pages 140 - 284 * |
范爱华主编: "《计算机组成与结构》", 中国矿业大学出版社, pages: 177 - 178 * |
Also Published As
Publication number | Publication date |
---|---|
EP3696733C0 (en) | 2024-03-27 |
US20200254609A1 (en) | 2020-08-13 |
EP3696733B1 (en) | 2024-03-27 |
EP3696733A1 (en) | 2020-08-19 |
CN111563588B (zh) | 2024-04-30 |
WO2020167641A1 (en) | 2020-08-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111563588B (zh) | 编码场景和任务相关学习信息及传输到可传输神经网络层 | |
US9630318B2 (en) | Feature detection apparatus and methods for training of robotic navigation | |
US20210229281A1 (en) | Collaborative multi-robot tasks using action primitives | |
Lopes et al. | Controlling robots using artificial intelligence and a consortium blockchain | |
EP3482265B1 (en) | Skill interface for industrial applications | |
Papadopoulos et al. | Towards open and expandable cognitive AI architectures for large-scale multi-agent human-robot collaborative learning | |
EP3857324B1 (en) | Dynamically refining markers in an autonomous world model | |
US20220324115A1 (en) | Systems, devices, and methods for developing robot autonomy | |
CN111385348A (zh) | 一种云脑机器人系统 | |
Naidoo et al. | A distributed framework for programming the artificial intelligence of mobile robots in smart manufacturing systems | |
Lyu et al. | Multi-agent modelling of cyber-physical systems for IEC 61499-based distributed intelligent automation | |
Contreras | Industrial robots migration towards industry 4.0 components | |
Simon et al. | Multi-robots Coordination System for Urban Search and Rescue Assistance Based on Supervisory Control Theory | |
Singh et al. | PSO-Based Nature-Inspired Mechanisms for Robots during Smart Decision-Making for Industry 4.0 | |
Park et al. | A Smart Machining System | |
Giannetto | Increasing the abilities of mobile robots with Computer Vision algorithms | |
Nedeljkovic et al. | Integration of Smart Vision Sensor into Manipulator Control System using OPC-UA | |
Shanahan et al. | Robotics and Artificial Intelligence in the Nuclear Industry: From Teleoperation to Cyber Physical Systems | |
Manjunath et al. | Robot Movement Based on Color Detection | |
Usova et al. | Model of Smart Manufacturing System | |
López-Juárez et al. | Modeling and object recognition skill transfer in industrial intelligent robots | |
Singh et al. | 5 PSO-Based Inspired Mechanisms Nature-for Robots during Smart Decision-Making for Industry 4.0 | |
Motegi | Autonomous Behavior of Biped Robot by Learning Camera Images | |
Prakash et al. | Robotic Operating System and Human–Robot Interaction for Automated Guided Vehicles (AGVs): An Application of Internet of Things in Industries | |
CN117545598A (zh) | 用于自主箱中抓取的高级传感器融合和多标准决策 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |