CN113435126B - 知识分享处理方法、智能机器人设备、知识分享系统、任务学习系统 - Google Patents
知识分享处理方法、智能机器人设备、知识分享系统、任务学习系统 Download PDFInfo
- Publication number
- CN113435126B CN113435126B CN202110767235.3A CN202110767235A CN113435126B CN 113435126 B CN113435126 B CN 113435126B CN 202110767235 A CN202110767235 A CN 202110767235A CN 113435126 B CN113435126 B CN 113435126B
- Authority
- CN
- China
- Prior art keywords
- model
- data information
- application program
- intelligent
- server
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 27
- 238000012549 training Methods 0.000 claims abstract description 56
- 238000013480 data collection Methods 0.000 claims abstract description 4
- 238000000034 method Methods 0.000 claims description 85
- 230000008569 process Effects 0.000 claims description 38
- 230000006854 communication Effects 0.000 claims description 19
- 238000004891 communication Methods 0.000 claims description 19
- 230000003993 interaction Effects 0.000 claims description 19
- 230000005540 biological transmission Effects 0.000 claims description 14
- 230000007175 bidirectional communication Effects 0.000 claims description 2
- 238000005457 optimization Methods 0.000 abstract description 71
- 230000001976 improved effect Effects 0.000 abstract description 7
- 238000004088 simulation Methods 0.000 abstract description 6
- 238000002474 experimental method Methods 0.000 abstract description 4
- 230000006870 function Effects 0.000 description 49
- 238000012545 processing Methods 0.000 description 19
- 238000004422 calculation algorithm Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 12
- 230000009471 action Effects 0.000 description 8
- 230000008859 change Effects 0.000 description 7
- 230000006399 behavior Effects 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 6
- 238000005406 washing Methods 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 5
- 238000010801 machine learning Methods 0.000 description 5
- 239000011664 nicotinic acid Substances 0.000 description 5
- 238000013473 artificial intelligence Methods 0.000 description 4
- 238000004590 computer program Methods 0.000 description 4
- 230000004927 fusion Effects 0.000 description 4
- 238000001514 detection method Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000007613 environmental effect Effects 0.000 description 3
- 230000002452 interceptive effect Effects 0.000 description 3
- 238000004806 packaging method and process Methods 0.000 description 3
- 230000002787 reinforcement Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 230000001939 inductive effect Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 239000003599 detergent Substances 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000005021 gait Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Abstract
本发明公开一种用于机器人设备的知识分享的服务器端及机器人端处理方法、服务器、智能机器人设备、知识分享系统、以及任务学习系统,本发明实施例实现了利用机器人设备对智能模型和/或应用程序的使用来收集数据,和利用收集的数据信息对服务器端存储的智能模型和/或应用程序进行优化,并通过服务器与机器人设备交互的分享和分发架构,实现了从不同的多台机器人设备分布式地收集数据和实验的架构模式,解决了从一台机器人设备无法获取大量的数据,只能依靠仿真环境进行模型和程序的训练、优化而产生的模型优化效率低、无法复现真实情景等问题,使得智能模型和应用程序的优化速度得以显著提升。
Description
技术领域
本发明涉及人工智能技术领域,尤其涉及一种用于机器人设备的知识分享的服务器端处理方法、服务器、用于机器人设备的知识分享的机器人端处理方法、智能机器人设备、用于机器人设备的知识分享系统、以及机器人任务学习系统。
背景技术
近年来,以深度学习为代表的人工智能技术获得了显著的进步。尤其是在应用方面,已经能够对输入信息进行复杂的分析,例如图像中物品的识别和抓握点的分析,也能够对机器人动作依据任务的完成情况进行优化,例如谷歌公司利用深度强化学习技术优化机器人开门动作、苏黎世联邦理工学院利用仿真技术和深度强化学习技术优化名为ANYmal的四足机器人的步态。这些进步一定程度上将机器人应用程序或模型与具体机型或任务之间的关系解耦,使得机器人应用程序和模型的通用性获得增强。
然而,大多数应用于机器人且有效的人工智能模型是需要大量的数据和实验进行训练和优化的。而从一台机器人获取如此大量的数据是不现实的,且仿真环境无法全面准确地复现真实情景,这就导致了很难快速训练和优化出符合实际场景的有效人工智能模型。
发明内容
本发明实施例提供一种机器人设备的知识分享方案,以解决现有技术中难以快速训练和优化出符合实际场景的有效人工智能模型的问题。
第一方面,本发明实施例提供一种用于机器人设备的知识分享的服务器端处理方法,该方法包括:
从第一机器人设备获取第一数据信息存储,其中,所述第一数据信息为通过在第一机器人设备上使用本地智能模型和/或应用程序而得到的数据信息;
根据所述第一数据信息对服务器端存储的第一智能模型和/或第一应用程序进行优化,得到第二智能模型和/或第二应用程序存储;以及
将第二智能模型和/或第二应用程序传输至第二机器人设备,以使得所述第二机器人设备获得由于第一机器人设备的使用而获得优化的第一智能模型和/或第一应用程序。
第二方面,本发明实施例提供一种用于机器人设备的知识分享的机器人端处理方法,该方法包括:
从服务器端获取智能模型和/或应用程序;
在第一机器人设备上通过使用本地智能模型和/或应用程序获取第一数据信息存储;
将所述第一数据信息传输至所述服务器端,以使得所述服务器端能够根据所述第一数据信息对其上存储的所述智能模型和/或应用程序进行优化。
第三方面,本发明实施例提供了一种用于机器人设备的知识分享的服务器,其包括:
第一数据获取模块,用于从第一机器人设备获取第一数据信息存储,其中,所述第一数据信息为通过在第一机器人设备上使用本地智能模型和/或应用程序而得到的数据信息;
优化模块,用于根据所述第一数据信息对所述服务器上存储的所述第一智能模型和/或第一应用程序进行优化,得到第二智能模型和/或第二应用程序存储;以及
分发模块,用于将第二智能模型和/或第二应用程序传输至第二机器人设备,以使得所述第二机器人设备获得由于第一机器人设备的使用而获得优化的第一智能模型和/或第一应用程序。
第四方面,本发明实施例提供了一种智能机器人设备,其包括:
下载模块,用于从服务器端获取智能模型和/或应用程序;
数据收集模块,用于在所述智能机器人设备上,收集通过在所述智能机器人设备上使用本地智能模型和/或应用程序而产生的第一数据信息;
数据传输模块,用于将所述第一数据信息传输至所述服务器端,以使得所述服务器端能够根据所述第一数据数据信息对服务器上存储的所述智能模型和/或应用程序进行优化。
第五方面,本发明提供了一种用于机器人设备的知识分享系统,其包括至少一个第一机器人设备、至少一个第二机器人设备和至少一个服务器,其中,所述第一机器人设备和第二机器人设备均能够与所述服务器进行双向通信;
所述第一机器人设备用于在使用本地智能模型和/或应用程序过程中收集第一数据信息传输至所述服务器;
所述服务器用于根据所述第一数据信息对服务器端存储的所述第一智能模型和/或第一应用程序进行优化,得到第二智能模型和/或第二应用程序存储;
所述第二机器人设备用于从所述服务器获取所述第二智能模型和/或第二应用程序,以获得由于第一机器人设备的使用被优化的第一智能模型和/或第一应用程序。
第六方面,本发明提供了一种机器人任务学习系统,其包括至少一个机器人设备和服务器,其中,所述机器人设备均能够与所述服务器进行双向通信;
所述机器人设备用于在使用本地智能模型和/或应用程序过程中收集第一数据信息传输至所述服务器;
所述服务器用于根据所述第一数据信息对服务器端存储的所述第一智能模型和/或第一应用程序进行优化,得到第二智能模型和/或第二应用程序存储。
本发明实施例实现了利用机器人设备对智能模型和/或应用程序的使用来收集数据,和利用收集的数据信息对服务器端存储的智能模型和/或应用程序进行优化。由于第一机器人设备可以是任意的使用本地智能模型和/或应用程序的机器人设备,本发明实施例通过在不同的第一机器人设备上进行智能模型和/或应用程序的使用和从不同的第一机器人设备上获取第一数据信息,实现了从不同的多台机器人设备分布式地收集数据和实验的架构模式,解决了从一台机器人设备无法获取大量的数据,只能依靠仿真环境进行模型和程序的训练、优化而产生的模型优化效率低、无法复现真实情景等问题,使得智能模型和应用程序的优化速度得以显著提升。并且,由于本发明实例在机器人设备上收集第一数据信息是基于实际使用场景进行的数据收集,因而获取的数据能够全面准确地复现真实情景,提升了对模型的优化效果。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示意性地显示了本发明一实施方式的服务器原理结构;
图2示意性地显示了本发明一实施方式的用于机器人设备的知识分享的服务器端处理方法流程图;
图3示意性地显示了本发明一实施方式的根据图2所示的知识分享方法形成的一种通讯拓扑结构图;
图4示意性地显示了本发明一实施方式的图3所示的拓扑结构中机器人设备之间进行知识分享的交互流程图;
图5示意性地显示了本发明一实施方式的步骤S22的具体实现方法流程图;
图6示意性地显示了本发明另一实施方式的步骤S22的具体实现方法流程图;
图7示意性地显示了本发明一实施方式的对图2和图5所示的实施方式的实例展示图;
图8示意性地显示了本发明一实施方式的对图2和图6所示的实施方式的实例展示图;
图9示意性地显示了本发明另一实施方式的用于机器人设备的知识分享的服务器端处理方法流程图;
图10示意性地显示了本发明又一实施方式的用于机器人设备的知识分享的服务器端处理方法流程图;
图11示意性地显示了本发明一实施方式的交易系统参与知识共享的交互流程图;
图12示意性地显示了本发明一实施方式的用于机器人设备的知识分享的服务器的原理架构图;
图13示意性地显示了本发明一实施方式的优化模块的原理架构图;
图14示意性地显示了本发明另一实施方式的优化模块的原理架构图;
图15示意性地显示了本发明另一实施方式的用于机器人设备的知识分享的服务器的原理架构图;
图16示意性地显示了本发明又一实施方式的用于机器人设备的知识分享的服务器的原理架构;
图17示意性地显示了本发明一实施方式的用于机器人设备的知识分享的机器人端处理方法流程图;
图18示意性地显示了本发明另一实施方式的用于机器人设备的知识分享的机器人端处理方法流程图;
图19示意性地显示了本发明一实施方式的智能机器人设备的原理架构图;
图20示意性地显示了本发明另一实施方式的智能机器人设备的原理架构图;
图21示意性地显示了本发明又一实施方式的智能机器人设备的原理架构图;
图22示意性地显示了本发明再一实施方式的智能机器人设备的原理架构图;
图23示意性地显示了本发明一实施方式的用于机器人设备的知识分享系统的原理框图;
图24示意性地显示了本发明一实施方式的机器人任务学习系统的原理框图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
本发明可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、元件、数据结构等等。也可以在分布式计算环境中实践本发明,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”,不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
最后,还需要说明的是,本申请中所用的术语一般为本领域技术人员常用的术语,如果与常用术语不一致,以本申请中的术语为准。
本文中,术语“智能模型”是指用于实现机器人设备的抽象功能的模型,其一般基于人工智能模型或类脑计算模型实现,其例如具体可以是用于机器人感知的智能模型、用于路径规划的智能模型、或用于动作控制的智能模型等。
本文中,术语“应用程序”是指用于提供机器人设备的基础功能的程序和/或用于提供使得机器人设备能够在相应场景中执行具体任务的功能的程序。
本文中,术语“状态”是指机器人设备或服务器所处的抽象的状态,不同的状态指代机器人设备或服务器存有不同的数据,或存有与机器人设备或服务器的系统行为相关的不同的标志变量。
本文中,术语“功能”是指智能模型或应用程序提供的某一具体能力,该能力由智能模型或应用程序定义,或仅由智能模型或应用程序中的一部分定义。在能力由智能模型或应用程序定义时,术语“功能”指的是该智能模型或应用程序;在能力仅由智能模型或应用程序中的一部分定义时,术语“功能”指的是该智能模型或应用程序中的一部分。其中,所谓的一部分,是指与获得的新功能相对应的智能模型的新增能力或应用程序的相应新增模块,而非智能模块或应用程序的全部。
以下将结合附图对本发明实施例的具体实现方式进行更详细的说明。
本发明实施例中的服务器是指提供计算服务的设备,服务器的构成包括处理器、硬盘、内存、系统总线等,服务器和通用的计算机架构类似,但是由于需要提供高可靠的服务,因此在处理能力、稳定性、可靠性、安全性、可扩展性、可管理性等方面要求较高。图1示意性地显示了根据本发明一实施方式的服务器,如图1所示,本发明实施例中的服务器至少包括用于存储可执行指令的存储器10,和与存储器10通信连接、用于执行存储器中存储的可执行指令的处理器20。处理器20通过执行存储器10中的相应的可执行指令实现在机器人设备间的知识分享,以实现利用多台机器人设备分布式地同步收集数据和实验,加快模型的优化速度,并且,机器人设备收集的数据是实际场景下的使用数据,因而据此获取的优化模型能够准确地反映和浮现真实情景,模型的可用性高。其中,可执行指令具体可以是下文的用于机器人设备的知识分享的服务器端处理方法对应的程序指令。
图2示意性地显示了根据本发明一实施方式的用于机器人设备的知识分享的服务器端处理方法,本实施例中,处理方法的执行主体为服务器的处理器,在具体应用中,该服务器可以是一台计算机,也可以是多台计算机组成的分布式服务器集群,示例性地,执行主体可以是图1所示的服务器。如图2所示,该方法包括:
步骤S21:从第一机器人设备获取第一数据信息存储,其中,所述第一数据信息为通过在第一机器人设备上使用本地智能模型和/或应用程序而得到的数据信息。
步骤S22:根据所述第一数据信息对服务器端存储的第一智能模型和/或第一应用程序进行优化,得到第二智能模型和/或第二应用程序存储。
步骤S23:将第二智能模型和/或第二应用程序传输至第二机器人设备,以使得所述第二机器人设备获得由于第一机器人设备的使用而获得优化的第一智能模型和/或第一应用程序。
在具体应用中,在第一机器人设备上使用的本地智能模块和/应用程序优选是来自服务器端的,示例性地,第一机器人设备可以通过从服务器下载服务器端存储的智能模型和/或应用程序而得到本地智能模型和/应用程序。在得到本地智能模型和/应用程序后,第一机器人设备就可以在本地利用该智能模型和/或应用程序来增加机器人设备的功能或提升已有功能的性能,并能够利用本地智能模型和/或应用程序来执行任务或向用户提供相应的功能服务等,以由此实现对本地智能模型和/或应用程序的使用。
其中,在使用本地智能模型和/或应用程序过程中,第一机器人设备优选能够在运行过程中储存使用数据、优化相关智能模型和/或应用程序,以收集得到与使用本地智能模型和/或应用程序相关的数据信息,即第一数据信息。
在本发明实施例中,机器人设备还可以向服务器上传使用数据、智能模型、和/或应用程序,由此使得服务器能够通过步骤S21获取机器人设备上的第一数据信息。
在步骤S22中,服务器将利用从第一机器人设备获取的第一数据信息来改进应用程序和/或优化智能模型。其中,优化的智能模型和/或应用程序是与第一机器人设备上的本地智能模型和/或应用程序相对应的智能模型和/或应用程序,本发明实施例将其称之为第一智能模型和/或第一应用程序。优选地,与第一机器人设备上的本地智能模型和/或应用程序相对应的第一智能模型和/或第一应用程序优选是指第一机器人设备上的本地智能模型和/或应用程序即是从服务器端下载的第一智能模型和/或第一应用程序,也就是说,本地智能模型和/或应用程序与第一智能模型和/或第一应用程序是相同的智能模型和/或应用程序,其在服务器端存储时的状态被称之为第一智能模型和/或第一应用程序,其在第一机器人设备上时的状态被称之为机器人设备上的本地智能模型和/或应用程序。而在步骤S22中得到的第二智能模型和/或第二应用程序,则是对第一智能模型和/或第一应用程序优化后的智能模型和/或应用程序。
在步骤S22中,根据第一数据信息对服务器端存储的第一智能模型和/或第一应用程序进行优化的具体实现方案,根据第一数据信息的内容不同,可以实现为通过基于机器学习的优化算法、基于统计的参数优化或功能增减、基于仿生或类脑计算的优化方式、人工参与的优化方法、多模型融合算法、或基于分布式计算的结果融合算法中的任一种优化方式或二种以上的组合。其中,这些优化算法的具体实现原理和方式可以参照现有技术进行实现,本发明实施例对此不进行赘述。
在步骤S23中,服务器将优化得到的第二智能模型和/或第二应用程序传输至第二机器人设备,即将第一智能模型和/或第一应用程序对应的优化结果传输至第二机器人设备,由此在第二机器人设备上获得的就是针对第一智能模型和/或第一应用程序的优化模型和/或程序,而该优化的智能模型和/或应用程序是基于第一机器人设备的使用,即利用第一机器人设备上的使用数据进行优化得到的。
对本领域技术人员来说,不难理解的是,本发明实施例中的第一机器人设备和第二机器人设备的角色是可以互换的,当机器人设备是作为收集第一数据信息的对象时,其即是本发明实施例中的第一机器人设备,而当机器人设备的角色是从服务器端获取优化后的第二智能模型和/或第二应用程序时,其即是本发明实施例中的第二机器人设备。而优化后的第二智能模型和/或第二应用程序在作为被优化对象的场景时,其又转换成为该场景下的第一智能模型和/或第一应用程序。而被传输至第二机器人设备的第二智能模型和/或第二应用程序即成为了第二机器人设备上的本地智能模型和/或应用程序,当第二机器人设备成为收集第一数据信息的机器人设备时,第二机器人设备在该场景下即转换成了第一机器人设备,而其上的第二智能模型和/或第二应用程序即成为了步骤S21中所指的本地智能模型和/或应用程序。即本发明实施例中的第一智能模型和/或第一应用程序、第二智能模型和/或第二应用程序只是为了区分在一轮交互中的被优化对象和对被优化对象的优化结果,第一机器人设备和第二机器人设备只是为了区分在一轮交互中的分享数据信息提供者和分享结果获得者。
由此,本发明实施例就实现了利用机器人设备对智能模型和/或应用程序的使用来收集数据,和利用收集的数据信息进行模型或程序的优化。由于第一机器人设备可以是任意的使用本地智能模型和/或应用程序的机器人设备,本发明实施例通过在不同的第一机器人设备上进行智能模型和/或应用程序的使用和从不同的第一机器人设备获取第一数据信息,实现了从不同的多台机器人设备分布式地收集数据和实验的架构模式,解决了从一台机器人设备无法获取大量的数据,只能依靠仿真环境进行模型和程序的训练、优化而产生的模型优化效率低、无法复现真实情景等问题,使得智能模型和应用程序的优化速度得以显著提升。并且,由于本发明实例在机器人设备上收集第一数据信息是基于实际使用场景进行的数据收集,因而获取的数据能够全面准确地复现真实情景,提升了对模型的优化效果。
以下将结合图3和图4的具体示例对图2所示的用于机器人设备的知识分享的服务器端处理方法进行说明。
图3示意性地显示了根据图2所示的知识分享方法形成的一种实施方式的通讯拓扑结构。如图3所示,本实施方式包括至少一台服务器1和至少两台机器人设备(机器人设备A和机器人设备B)。各机器人设备和服务器之间可以通过网络传输数据。这些数据携带了应用程序、智能模型或第一数据信息。在具体应用中,本发明实施例的机器人设备均可以从服务器下载和安装应用程序或智能模型,由此得到用于增加机器人的功能或提升已有功能的性能的本地智能模型和/或应用程序。并且,本发明实施例的机器人设备配置为在运行过程中,能够储存使用数据,优化相关应用程序和模型,由此以获取第一数据信息。此外,在本发明实施例中,机器人设备也可以向服务器上传第一数据信息,服务器将其用于统计信息、改进或优化智能模型和/或应用程序。
图4示意性地显示了图3所示的拓扑结构中机器人设备之间进行知识分享的交互流程。如图4所示,处于状态2.1的服务器1上存储有智能模型a,即第一智能模型。机器人设备A通过从服务器1下载智能模型a,由此机器人设备A获得智能模型a,而智能模型a在机器人设备A上则成为其本地智能模型,机器人设备A通过获得该智能模型其功能得到更新。用户2通过使用机器人设备A上的智能模型来使机器人设备A完成相应的任务,机器人设备A则在使用本地智能模型a过程中收集第一数据信息并上传至服务器1。服务器1接收到第一数据信息后,根据第一数据信息优化服务器端的智能模型a,即优化其上存储的第一智能模型,并根据优化结果得到新的智能模型a’,即第二智能模型,由此,服务器1进入新的状态2.2。之后,服务器1即可根据机器人设备B的请求或订阅,在机器人设备B需要下载智能模型a(即第一智能模型)时,将经过机器人设备A的使用而被优化的新的智能模型a’(即第二智能模型)分发给机器人设备B。
其中,需要说明的是,在图4所示的交互流程中,机器人设备A充当图2所示的第一机器人设备的角色,即用于收集和提供第一数据信息;而机器人设备B充当图2所示的第二机器人设备的角色,以在从服务器端下载相应的智能模型和/或应用程序时,通过本发明实施例提供的知识分享机制获得由于第一机器人设备的使用而被优化的第一智能模型和/或第一应用程序,即第二智能模型和/或第二应用程序。这样,就可以通过大量的机器人设备对智能模型和/或应用程序的使用,而使得服务器上的智能模型和/或应用程序(如图4所示实例中的智能模型a),被不同的机器人设备使用并不断被优化,由此就解决了现有技术中无法从一台机器人设备获取大量的数据,只能依靠仿真环境进行模型和程序的训练、优化而产生的模型优化效率低、无法复现真实情景等问题,使得智能模型和应用程序的优化速度、效率均得以显著提升。
示例性地,作为一种优选实现例,第一数据信息可以实现为包括第一机器人设备在使用本地智能模型和/或应用程序过程中产生的使用数据信息,具体地,使用数据信息例如可以包括第一机器人设备上的外部传感器记录,还可以包括在第一机器人设备上产生的内部状态信息,或者也可以包括第一机器人设备接收到的用户反馈信息。其中,示例性地,传感器记录包括关节角度、速度、力度、相机、深度相机、电流、电机和供电等部件温度、内存占用、触觉传感器、关节力矩传感器等的数据记录。用户反馈信息可以是满意度调查,该满意度调查的用户反馈信息将作为奖励传输给智能模型以用于强化学习;也可以是对关键指标的评价;还可以是用户标注的标签类型,例如在物品的检测识别任务中,用户反馈的物品的检测识别位置或名称标签。其中,用户反馈信息可以实现为由应用程序通过机器人设备的用户界面向用户询问,并通过接收用户输入获取到用户反馈信息。
示例性地,第一机器人设备对使用数据信息的收集可以是通过使用rosbag的记录功能实现,也可以是通过Python的deque+pickle功能实现,这些均为现有技术,故本发明实施例对第一机器人设备进行使用数据信息收集的具体实现方式不再进行详细赘述。更优地,在收集到使用数据信息后,第一机器人设备还对收集的使用数据信息进行压缩和降采样后,再在本地进行存储,以进一步降低网络传输的数据量和节约存储空间。示例性地,对于视频类型的使用数据信息可以使用FFmpeg编码进行存储。
以第一数据信息包括在第一机器人设备上使用本地智能模型和/或应用程序过程中收集的使用数据信息为例,图5示意性地显示了本发明一种实施方式的步骤S22的具体实现方法流程,如图5所示,该方法具体包括:
步骤S221A:从第一数据信息中解析获取使用数据信息,并对使用数据信息进行分类存储。
步骤S222A:从分类存储的使用数据信息中获取与第一智能模型和/或第一应用程序相关的使用数据信息。
步骤S223A:利用获取的相关的使用数据信息对服务器端存储的第一智能模型和/或第一应用程序进行优化处理,得到第二智能模型和/或第二应用程序。
其中,第一机器人设备在与服务器端进行通信时,可以根据预定的通讯协议进行数据交互,其中,预定的通讯协议可以是基于标准的通讯协议实现,例如TCP/IP协议和CAN总线协议,也可以根据需求采用自定义的私有协议实现,本发明实施例对此不进行限制。更优地,在第一机器人设备利用预定的通讯协议上传使用数据信息前,还会将使用数据信息按预设的文件格式进行打包,而在步骤S221A中,服务器端在接收到第一数据信息后,会根据通信协议和预设的文件格式对接收到的数据进行解析,从中获取使用数据信息。其中,将使用数据信息按预设的文件格式进行打包可以根据对文件格式的需求按照现有的文件格式和打包方式实现,而服务器端对接收到的第一数据信息的解析则按照第一机器人设备上的打包方式进行反向解包即可,这些均可以参照现有技术进行实现,本发明实施例对此不进行限制和赘述。
在步骤S221A中,服务器端在解析得到使用数据信息后,还对使用数据信息进行归类,并将其进行分类存储。示例性地,对使用数据信息进行分类可以包括按数据类型、产生使用数据信息的本地智能模型和/或应用程序、使用数据信息的来源等中的一种或二种以上的组合进行分类。按照数据类型进行分类例如,可以根据使用数据信息的数据所属的类型,如图像数据、视频数据、语音数据、力传感器数据等进行分类。按照产生使用数据信息的本地智能模型和/或应用程序进行分类,例如可以是根据使用数据信息是在使用什么智能模型和/或应用程序的时候产生和收集的,将其与相应的智能模型和/或应用程序进行关联存储。按照使用数据信息的来源进行分类,例如可以是根据使用数据产生的来源进行分类存储,如是来自驱动器或摄像头的数据等,将其与来源信息进行关联存储。
示例性地,在使用数据信息包括有用户反馈信息的实现例中,对使用数据信息进行分类存储,还可以实现为根据用户反馈信息类型或用户标注的标签类型将使用数据信息进行分类存储。
具体地,服务器端可以通过部署数据库系统来实现对使用数据信息的分类存储,也可以采用文件系统或其他合适的方式来实现对使用数据信息的分类存储,本发明实施例对此不进行限制。
在该实施例中,第一机器人设备配置为将其使用所有本地智能模型和/或应用程序过程中收集的使用数据信息均上传至服务器。这样,服务器端获取的第一数据信息就包括了使用不同智能模型和/或应用程序过程中收集的使用数据信息。而由于服务器端本身也存储有不同的智能模型和/或应用程序,因此,在步骤S222A中,本发明实施例优选将服务器配置为从分类存储的使用数据信息中获取与第一智能模型和/或第一应用程序匹配或者说关联的数据,以在步骤S223A中利用获取的匹配或关联的使用数据信息对相应的智能模型和/或应用程序进行优化处理。具体地,在步骤S221A中将使用数据信息进行分类存储时,优选会将使用数据信息与产生其的智能模型和/或应用程序进行关联存储,由此,在步骤S222A中就可以根据使用数据信息所关联的智能模型和/或应用程序来选择与之匹配的服务器端存储的智能模型和/或应用程序作为第一智能模型和/或第一应用程序,即作为优化对象。
在步骤S223A中,本发明实施例优选利用获取的与第一智能模型和/或第一应用程序相关的使用数据信息,对第一智能模型和/或第一应用程序进行增量训练和优化。具体地,根据第一智能模型和/或第一应用程序的类型,在步骤S223A中,可使用基于机器学习优化算法、基于统计的参数优化或功能增减优化方式、基于仿生或类脑计算的优化方式、或人工参与的优化方法等方式中中一种或二者以上的结合,来优化第一智能模型和/或第一应用程序。这些优化方式的具体实现算法可以参照现有技术并根据第一智能模型和/或第一应用程序的类型进行选取,这些均是利用现有技术即可实现的,故本发明实施例对此不进行赘述。
在另一优选实现例中,机器人设备还配置为能够在运行过程中,直接在机器人设备本地优化相应的本地智能模型和/或应用程序。由此,第一机器人设备在使用本地智能模型和/或应用程序过程中,还能够直接利用收集的使用数据信息对第一机器人设备上的本地智能模型和/或应用程序进行本地训练和优化。在该优选实现例中,示例性地,第一数据信息还可以实现为包括根据在第一机器人设备上使用本地智能模型和/或应用程序过程中收集的使用数据信息对第一机器人设备上的本地智能模型和/或应用程序进行本地训练得到的第三智能模型和/或第三应用程序,其中,本发明实施例中的第三智能模型和/或第三应用程序是指对第一机器人设备上的相应本地智能模型和/或应用程序优化后得到的智能模型和/或应用程序。
以第一数据信息还包括根据在第一机器人设备上使用本地智能模型和/或应用程序过程中收集的使用数据信息对第一机器人设备上的本地智能模型和/或应用程序进行本地训练得到的第三智能模型和/或第三应用程序为例,图6示意性地显示了本发明另一种实施方式的步骤S22的具体实现方法流程,如图6所示,该方法包括:
步骤S221B:从所述第一数据信息中解析获取第三智能模型和/或第三应用程序,并对所述第三智能模型和/或第三应用程序进行分类存储。
步骤S222B:从分类存储的第三智能模型和/或第三应用程序中获取与所述第一智能模型和/或第一应用程序相关的第三智能模型和/或第三应用程序。
步骤S223B:利用获取的相关的第三智能模型和/或第三应用程序对服务器端存储的第一智能模型和/或第一应用程序进行优化处理,得到第二智能模型和/或第二应用程序。
本发明实施例所示的方法与图5所示的方法的不同之处在于,在本发明实施例中,第一机器人设备在收集了使用数据信息后,会在本地首先对相应的智能模型和/或应用程序进行优化,得到优化后的本地智能模型和/或应用程序,即本发明实施例称之为的第三智能模型和/或第三应用程序。在步骤S221B中,服务器从第一机器人设备接收到的并非是使用数据信息,而是在第一机器人设备上优化后得到的第三智能模型和/或第三应用程序。其中,第一机器人设备和服务器之间进行通信和数据传输的方式与前文所述一致,即也是根据预定的通讯协议进行交互,并优选在数据传输之前根据预设文件格式对需要传输的数据,即第三智能模型和/或第三应用程序,进行打包。而服务器端在接收到第一机器人设备传输来的第一数据信息后,即根据通讯协议和预设文件格式对其进行解析,以获取到第三智能模型和/或第三应用程序。同时,在步骤S221B中,服务器端具体可以是采用按照第三智能模型的功能范围(如图像处理功能或运动控制功能)、第三应用程序更新的功能或模块的类型、第三智能模型和/或第三应用程序各自所对应的原始版本(如更新之前所对应的本地智能模型和/或应用程序所对应的在服务器端存储的相应智能模型和/或应用程序的版本号)等的一种或者其任何组合来第三智能模型和/或第三应用程序进行分类存储。而在步骤S222B中,服务器端可以相应根据第三智能模型和/或第三应用程序各自所对应的原始版本来确定出当前接收到的第三智能模型和/或第三应用程序所对应的第一智能模型和/或第一应用程序,以便在步骤S223B中利用获取的第三智能模型和/或第三应用程序对服务器端存储的相关联的第一智能模型和/或第一应用程序进行优化处理。具体地,在步骤S223B中可以根据多个机器人设备端的优化结果(即多个第一机器人设备传输来的不同的第三智能模型和/或第三应用程序),使用基于机器学习的优化算法、多模型融合算法、基于分布式计算的结果融合算法、基于仿生或类脑计算的优化方式、或人工参与的优化方法等中的一种或二者以上的组合,来优化服务器端的相应的第一智能模型和/或第一应用程序。
在使用数据信息包括用户反馈信息的情况下,机器人设备还可以根据用户反馈信息和其他使用数据信息共同来优化本地智能模型和/或应用程序并将得到的优化结果上传至服务器。
其中,示例性地,在机器人设备上利用使用数据信息来优化本地智能模型和/或应用程序具体可以是使用基于机器学习的优化算法或基于仿生或类脑计算的优化方式实现。
作为一种优选实现例,在具体实现中,服务器端在完成对其上存储的第一智能模型和/或第一应用程序的优化处理后,还可以将优化后得到的第二智能模型和/或第二应用程序传输至第一机器人设备,以对第一机器人设备上的与第一智能模型和/或第一应用程序相关的本地智能模型和/或应用程序进行更新,使得第一机器人设备也能够对本地智能模型和/或应用程序进行升级。
其中,第一机器人设备和第二机器人设备从服务器端获取第二智能模型和/或第二应用程序,可以是基于服务器端的推送,也可以是基于机器人设备自己的主动请求。基于服务器端的推送例如可以是服务器端在完成优化处理后即实时向机器人设备主动推送;也可以是基于固定的或由管理员发布的推送周期,向机器人设备进行推送;还可以是基于对机器人设备端的模型和应用程序的分析来进行智能推送。而机器人设备的主动请求例如可以是基于用户的搜索请求进行发布等。本发明实施例对此不进行限制。
在一些实施例中,服务器端包括从机器人设备端发起的数据库查询检索功能,例如机器人设备端可以通过向服务器发送模型c的查询指令,以下载用户所需的应用程序和智能模型,由此可以实现在机器人设备端的主动请求下,来获取特定的应用程序或智能模型,特定的应用程序或智能模型例如可以是服务器端存储的第一智能模型和/或第一应用程序,或服务器优化后获得的第二智能模型和/或第二应用程序等。
以机器人设备从服务器获取智能模型c为例,机器人设备从服务器端获取智能模型和/或应用程序的交互过程具体可以为:处于初始状态的服务器基于机器人设备上已安装的智能模型和应用程序以及该机器人设备的使用数据信息和搜索历史将模型c推荐给机器人设备A(可以使用现有的推荐算法来确定推荐内容,并采用消息推送的方式来主动将模型c发送给机器人设备A),机器人设备A进入获得通知的状态,用户得到相关通知。用户据此使用查询功能,机器人设备A将模型c的查询指令发送给服务器。服务器收到查询指令后进入交易的状态,在用户进行购买操作后将模型c传输给机器人设备A,机器人A在获得模型c后进入获得相应新功能的状态。
需要说明的是,在具体实现中,机器人设备从服务器端获取智能模型和/或应用程序时,用户收到通知、执行查询后,进行购买不是必要的操作。在一些实施例中,服务器和机器人设备A之间可自行依照相关协议流程执行智能模型和应用程序的分发。
优选地,在第一机器人设备上使用的本地智能模型和/或应用程序为从服务器端获取的第一智能模型和/或第一应用程序。在其他实现例中,第一机器人设备上的本地智能模型和/或应用程序还可以是由研发人员安装部署的,或者是由机器人设备自身的学习而自动产生的。
图7示意性地对图2和图5所示的实施方式进行实例展示,如图7所示,以优化智能模型a为例,在本发明实施例中,服务器1在初始状态7.1下存有智能模型a 1.0,机器人设备A在初始状态7.4下无模型。在服务器1将智能模型a传输给机器人设备A后,机器人设备A进入存有本地智能模型a 1.0的状态7.5。用户2在使用机器人设备A或提供智能模型a相关的用户反馈信息后,机器人设备A获得与本地智能模型a相关的使用数据信息(使用数据信息中可以包括有用户反馈信息,也可以不包括)并进入同时存有本地智能模型a 1.0和使用数据信息的状态7.6。接着,机器人设备A将使用数据信息传输至服务器1,服务器1将此分类保存并进入存有使用数据信息的状态7.2。之后,服务器根据使用数据信息确定出待优化的对象,如本实施例中根据使用数据信息关联的智能模型,服务器端将待优化的对象确定为智能模型a 1.0,即作为第一智能模型,并利用相关的使用数据信息使之升级为第二智能模型a 1.1,之后服务器进入状态7.3。在进行优化处理后,服务器将第二智能模型a 1.1传输给机器人设备B,由此机器人设备B从服务器获得第二智能模型a’,并从初始状态7.8进入存有智能模型a 1.1的状态7.9。至此,机器人设备B获得了由于机器人设备A的使用而获得优化的智能模型a 1.1。同时,服务器还会将第二智能模型a 1.1传输给机器人设备A,以对机器人设备A上的本地智能模型a进行优化升级,机器人设备A在获得第二智能模型a 1.1后会对自身的本地智能模型进行更新,并进入存有智能模型a 1.1的状态7.7。
图8示意性地对图2和图6所示的实施方式进行实例展示,如图8所示,以优化模型a为例,在本发明实施例中服务器在初始状态8.1下存有模型a1.0,机器人设备A在初始状态8.4下无模型,机器人设备B在初始状态8.8下也无模型。在服务器将模型a1.0传输给机器人设备A后,机器人设备A进入存有模型a1.0的状态8.5。用户2在使用机器人设备A或提供模型a 1.0相关的用户反馈信息后,机器人设备A根据收集的使用数据信息更新模型a1.0获得模型a1.0.1并进入状态8.6。接着,模型a1.0.1被传输至服务器,服务器将此保存并进入状态8.2。此时服务器上同时存储有优化前的模型a1.0和来自不同机器人设备A的模型a 1.0.1,接着,服务器会根据来自不同机器人设备A的模型A1.0.1优化模型a 1.0(此时的模型a 1.0即为确定的优化对象第一智能模型),使之升级为模型a1.1(升级后得到的优化的模型a1.1,即为第二智能模型),服务器进入状态8.3。接着,机器人设备B可以根据自身的搜索请求或服务器的推送而从服务器获得模型a1.1,并从初始状态8.8进入状态8.9。至此,机器人设备B获得了由于包括机器人设备A在内的其他机器人设备的使用而获得优化的模型a。进一步地,服务器还会将第二智能模型a 1.1传输给机器人设备A,以对机器人设备A上的本地智能模型a进行优化升级,机器人设备A在获得第二智能模型a 1.1后会对自身的本地智能模型进行更新,并进入存有智能模型a 1.1的状态8.7(在其他实现例中,对机器人设备A的进一步更新也可以是不必要的)。需要说明的是,a1.0、a1.0.1、a1.1可以视为前文提及的在分类存储时所使用的智能模型和/或应用程序的版本信息,在本发明实例中的机器人设备A即为第一机器人设备,机器人设备B即为第二机器人设备,其均不限于是指一台机器人设备,而可以指任意的多台机器人设备,由此,服务器可能会同时获得不同的第一机器人设备发送来的优化后的模型a 1.0.1(在机器人设备A存在多个的情况下,可以通过1.0.n的n来标识是来自哪个第一机器人设备的优化后的智能模型a)。
在具体实现中,服务器向第一机器人设备和第二机器人设备传输信息也是采用前文所述的基于预定通讯协议的方式。同时,优选地,服务器也采用与机器人设备端相同的文件格式对待传输的数据进行打包,相应地机器人设备在接收到服务器传输的数据后,根据通讯协议和预设的文件格式进行解包即可得到服务器传来的智能模型和/或应用程序,该过程与前文所述的机器人设备向服务器传输第一数据信息的方式是基于同一原理的。而机器人设备在解析得到智能模型和/或应用程序后,通过安装该智能模型和/或应用程序即可按需使用其提供的功能。需要说明的是,本发明实施例提及的功能指的是智能模型或应用程序,或它们中的一部分。所谓的一部分,是指与获得的新功能相对应的智能模型的新增能力或应用程序的相应新增模块,例如,智能模型通过训练后获得新能力(如CNN模型通过训练后获得了能识别新物体的能力),或应用程序添加了新的End-user development模块(该新增模块涉及处理某种半成品实物的步骤)。
在另一优选实施例中,第一机器人设备还将其在使用本地智能模型和/或应用程序过程中获得的新能力传输至服务器。图9示意性地显示了该实施例的服务器端处理方法流程,该方法的执行主体为上述的服务器的处理器,如图9所示,该方法包括:
步骤S24:从第一机器人设备获取第二数据信息存储,其中,所述第二数据信息为通过在第一机器人设备上对本地智能模型和/或应用程序进行训练调整而得到的与新能力相关的模型或数据信息,其中,所述新能力指在对所述本地智能模型和/或应用程序进行训练调整之后产生的、原有本地智能模型和/或应用程序所不具备的能力。
其中,步骤S24中的新能力可以是以新增的功能的形式呈现,也可能是在原有功能上的新增能力的形式呈现,只要是机器人设备在原有的本地智能模型和/或应用程序中不具备的能力或功能即视为产生的新能力。示例性地,以新功能的形式呈现,例如可以是,某一具有垃圾处理智能模型和应用程序的机器人设备,在使用扔垃圾的功能过程中,根据收集的使用数据信息对垃圾处理智能模型和应用程序进行训练调整,由此得到了对待处理垃圾进行分类的新功能。以在原有功能上的新增能力的形式呈现,例如可以是,机器人设备上安装有物体识别智能模型和应用程序(如利用CNN模型进行物体识别的应用程序),该物体识别针对的主要是对人物的识别,在使用该物体识别功能过程中,根据收集的使用数据信息对物体识别智能模型进行训练调整,由此得到了能识别新物体如能识别各种动物的能力。需要说明的是,服务器从第一机器人设备获取第二数据信息所采用的数据传输方式,如通讯协议和文件格式等,可以采用与第一数据信息或第二智能模型和/或第二应用程序等相同的方式,具体可以参照前文叙述,在此不再赘述。
优选地,在第一机器人设备上对本地智能模型和/或应用程序进行训练调整而得到与新能力相关的模型或数据信息,即产生第二数据信息的具体实现过程,可以在没有用户主动参与的情况下进行,具体例如可以是通过第一机器人设备主动收集内部状态和/或传感器记录等使用数据信息,并利用使用数据信息在本地对相应的智能模型和/或应用程序进行训练调整得到。在其他实现例中,产生第二数据信息的具体实现过程,也可以在用户主动参与的情况下进行,具体例如为用户根据自己的想法和要求主动发起对机器人设备的相应能力的训练,如通过训练机器人、设置工作流程、设置任务目标等方式提供用户反馈信息,以获取用户反馈信息作为使用数据信息来优化相应的模型和/或应用程序,以使得机器人设备在本地获得新能力。本发明实施例对第一机器人设备获得新能力的具体途径和方式不进行限制。当然,在前文的优化处理中,第一机器人设备和服务器也均可以仅利用内部状态和/或传感器记录等不包括用户反馈信息的使用数据信息进行优化处理,或同时利用包括用户反馈信息、内部状态和/或传感器记录等的使用数据信息进行优化处理。
其中,第一机器人设备主动收集使用数据信息的方式、以及利用使用数据信息在本地对相应的智能模型和/或应用程序进行训练的方式可以参照前文叙述。在用户主动参与的情况下进行相应智能模型和/或应用程序的训练时,机器人设备优选提供有用户交互界面,用户交互界面在具体实现中可以采用多种界面和互动方式,例如提供允许用户进行选择的交互界面、提供允许用户进行评分的交互界面、或提供允许用户进行示教的交互接口等,本发明实施例不对此进行限制。示例性地,用户可以通过以下方式的任意一种或其结合来参与相应智能模型和/或应用程序的训练,向机器人设备提供反馈信息,以使得机器人设备能够根据用户提供的反馈信息对相应智能模型和/或应用程序进行训练:
一,机器人设备在无法确定执行某一操作的策略时,可根据其当前的能力向用户提供机器人设备能够执行的所有操作选项,请用户代为选择,例如被某种垃圾是否应该放入可回收垃圾桶中,通过用户对选项的选择,机器人设备即可获取到相应的用户反馈信息,并根据用户反馈信息对相应的智能模型和/或应用程序进行训练调整,由此获得对垃圾进行分类的新能力;
二,机器人设备在完成一项工作后,可请求用户打分以评判完成的质量,例如在整理衣物后请用户以打分的形式评价整理效果,通过用户输入的打分信息,机器人设备即可获取到相应的用户反馈信息,并根据用户反馈信息对相应的智能模型和/或应用程序进行训练调整,由此获得整理衣物的新能力,例如本来只能叠普通厚度的衣物,通过用户反馈信息在整理衣物功能中增加了处理加厚羽绒服的新能力;或者
三,当机器人设备发现需要使用的工具或被要求的任务在数据库中无记录时,机器人设备可请求用户示教,例如使用某新型洗衣机时,请求用户演示操作过程,机器人设备通过获取用户演示的反馈信息,并根据该反馈信息对相应的智能模型和/或应用程序进行训练,由此获得使用某新型洗衣机的新能力。在具体实现中,由于一个智能模型或应用程序可以对应多种功能,比如需要使用的工具或被要求的任务,为方便机器人设备对智能模型或应用程序按照功能进行检索和调用,本发明实施例优选在智能模型或应用程序安装时,会将相关的信息注入数据库(如将各智能模型或应用程序对应的功能、其需要使用的工具、及其被要求的任务,按模型或应用程序分类关联存储至数据库中)。这样,数据库中就会产生一张数据表以供机器人设备在使用工具或被要求任务时,进行相关的检索,由此来发现需要使用的工具或被要求的任务在数据库中是否存在记录。示例性地,检索所需的相关信息可以由用户或计划的任务给出,也可以为来自于对场景和物品的识别,例如对洗衣机型号的识别。当无法识别洗衣机型号时,或识别后发现机器人设备已安装的模型或应用程序中没有对应的功能,而进一步在数据库检索后也没有相关功能时,即可触发用户演示的行为。
其中,机器人设备以用户示教演示的方式获取用户反馈信息,可以是通过记录用户示教演示的视频,并根据对视频的分析来获取所需的用户反馈信息,如关键动作、操作步骤、操作范围等。以使用新型洗衣机为例,用户在演示操作的过程中,机器人设备可以以视频的形式记录操作过程,并分析人的动作,记录被操作的按钮或开关,于此同时,由于使用洗衣机是常见的功能,相关的应用程序或智能模型框架可以内置关键的操作步骤节点,请用户分段演示例如通电-开门-放入衣物-放入洗涤剂-关门-设置等步骤。机器人设备也可以将提取出的被用户操作的按钮及附近的照片在用户交互界面显示,并请用户选取范围或标注,由此来获取用户反馈信息,并将其用于智能模型的训练或应用程序的更新。其中,机器人设备根据用户反馈信息对相关智能模型和/或应用程序进行训练调整的实现方式可以参照现有技术来实现或采用前文述及的优化方式实现,本发明实施例不对此进行限制。
作为另一优选实现例,图10示意性地显示了本发明另一实施例的服务器端处理方法流程,如图10所示,本方法在图9所示方法的基础上还包括:
步骤S25:将第二数据信息传输至第二机器人设备,以使得第二机器人设备获得由于第一机器人设备的学习而产生的新能力。
在步骤S25中,服务器将第二数据信息传输至第二机器人设备的具体实现方式与其将第二智能模型和/或第二应用程序传输至第二机器人设备的方式相同,故在此不再赘述。
根据本发明图9和图10所示的实施例,机器人设备还可以对其学习产生的新能力进行分享,使得服务器和其他机器人设备可以直接获取到该新能力,进一步提高对智能模型和/或应用程序的优化速度和优化效率。
作为一种更优的实现例,服务器端和机器人设备端还实现为通过交易系统来发起数据传输。在该实现例中,在服务器端接入有交易系统,在机器人设备端接入有交易系统客户端。其中,交易系统是指基于虚拟或真实的货币进行支付处理的系统,其可以通过接入第三方交易系统如支付宝、微信等实现。通过接入交易系统,本发明实施例能够使得用户通过分享第一数据信息和第二数据信息而获得鼓励或经济回报,相应地,其他用户则需要在下载应用程序或智能模型前进行购买行为以获得对第一机器人设备的用户分享的信息的使用权。通过接入交易系统和进行支付处理,可以使得本发明实施例的知识分享具有应用市场属性,可激励用户参与到机器人学习中,分享所拥有的机器人设备学习到的新功能或收集到的第一数据信息,能够更加有效地促进训练数据的收集和模型的优化。具体地,用户通过分享第一数据信息和第二数据信息而获得鼓励或经济回报,可以实现为:服务器在从第一机器人设备获取第一数据信息和第二数据信息之前,还包括向第一机器人设备关联的用户账户支付奖励;或者实现为:服务器在从第一机器人设备获取第一数据信息和第二数据信息之后,根据其他用户即第二机器人设备的用户的购买行为,在发生购买行为或预定的支付行为(如其他用户愿意支付的金额或者给定定价后购买下载的次数)后,向第一机器人设备关联的用户账户支付奖励。而其他用户在下载应用程序或智能模型前进行购买行为以获得对第一机器人设备的用户分享的信息的使用权具体可以实现为:服务器在将第二智能模型和/或第二应用程序传输至第二机器人设备、或将所述第二数据信息传输至第二机器人设备之前,还包括从第二机器人设备关联的用户账户获取支付内容。其中,机器人设备上关联的用户账户可以是用户在相应的交易系统中拥有的账户。
图11示意性地显示了一个优选实施例中交易系统参与知识共享的交互流程。在此图中,“功能”指代了某一应用程序或智能模型的部分或全部。如图11所示,处于初始状态11.1的服务器不包括功能x,处于初始状态11.3的机器人设备A也不含有功能x。在用户2对机器人设备A使用的过程中,通过对机器人设备A进行训练和调整,使机器人设备A获得了功能x并进入了状态11.4。用户2可以执行出售操作,将功能x的模型或数据上传给服务器1。处于初始状态11.5的机器人设备B不包含功能x,用户3执行购买操作后,机器人设备B可从服务器获得功能x的模型或数据并进入状态11.6。至此,机器人设备B就拥有了用户2添加的功能x,而用户2则间接获得了用户3支付的部分或全部货币。
在本发明实施例的优选实现例中,还可以在机器人设备端设置用户权限,以使得用户能够根据权限设置来灵活确定上传至服务器端的第一数据信息和第二数据信息。示例性地,用户权限可以实现为包括系统级别权限和用户级别权限。其中,系统级别权限用于决定是否允许机器人设备分享第一数据信息和第二数据信息至服务器;用户级别权限用于决定是否允许机器人设备分享某一本地智能模型或应用程序的第一数据信息、或某一本地智能模型或应用程序对应的第二数据信息至服务器。
在其他优选实现例中,第一机器人设备向服务器传输数据、或服务器向第一机器人设备和/或第二机器人设备传输数据还可以设置为实时传输、空闲时间传输、全部传输、采样传输等模式。
图12示意性地显示了本发明一种实施方式的用于机器人设备的知识分享的服务器的原理架构,如图12所示,该服务器1配置为包括
第一数据获取模块13,用于从第一机器人设备获取第一数据信息存储,其中,所述第一数据信息为通过在第一机器人设备上使用本地智能模型和/或应用程序而得到的数据信息;
优化模块14,用于根据所述第一数据信息对所述服务器上存储的所述第一智能模型和/或第一应用程序进行优化,得到第二智能模型和/或第二应用程序存储;以及
分发模块15,用于将第二智能模型和/或第二应用程序传输至第二机器人设备,以使得所述第二机器人设备获得由于第一机器人设备的使用而获得优化的第一智能模型和/或第一应用程序。
其中,在其他优选实现例中,服务器上的分发模块15还用于将第二智能模型和/或第二应用程序传输至第一机器人设备,以使得所述第一机器人设备能够利用第二智能模型和/或第二应用程序对所述第一机器人设备上的与第一智能模型和/或第一应用程序相关的本地智能模型和/或应用程序进行更新。
以第一数据信息包括在第一机器人设备上使用本地智能模型和/或应用程序过程中收集的使用数据信息为例,图13示意性地显示了本发明一种实施方式的优化模块的原理架构,如图13所示,优化模块14配置为包括
第一解包单元14A,用于从所述第一数据信息中解析获取使用数据信息;
第一归纳分类单元14B,用于对所述使用数据信息进行分类存储;和
第一优化处理单元14C,用于从分类存储的使用数据信息中获取与第一智能模型和/或第一应用程序相关的使用数据信息,并利用获取的相关的使用数据信息对服务器端存储的第一智能模型和/或第一应用程序进行优化处理,得到第二智能模型和/或第二应用程序。
以第一数据信息包括根据在第一机器人设备上使用本地智能模型和/或应用程序过程中收集的使用数据信息对第一机器人设备上的本地智能模型和/或应用程序进行本地训练得到的第三智能模型和/或第三应用程序为例,图14示意性地显示了本发明另一种实施方式的优化模块的原理架构,如图14所示,优化模块14在图13的基础上配置为还包括
第二解包单元14a,用于从所述第一数据信息中解析获取第三智能模型和/或第三应用程序;
第二归纳分类单元14b,用于对所述第三智能模型和/或第三应用程序进行分类存储;和
第二优化处理单元14c,用于从分类存储的第三智能模型和/或第三应用程序中获取与第一智能模型和/或第一应用程序相关的第三智能模型和/或第三应用程序,并利用获取的相关的第三智能模型和/或第三应用程序对服务器端存储的第一智能模型和/或第一应用程序进行优化处理,得到第二智能模型和/或第二应用程序。
图15示意性地显示了本发明另一实施方式的用于机器人设备的知识分享的服务器的原理架构,如图15所示,该服务器1在图12的基础上配置为还包括
第二数据获取模块16,用于从第一机器人设备获取第二数据信息存储,其中,所述第二数据信息为通过在第一机器人设备上对本地智能模型和/或应用程序进行训练调整而得到的与新能力相关的模型或数据信息,其中,所述新能力指在对所述本地智能模型和/或应用程序进行训练调整之后产生的、原有本地智能模型和/或应用程序所不具备的能力。
其中,相应地,在该发明实施例中,分发模块13还用于将所述第二数据信息传输至第二机器人设备,以使得所述第二机器人设备获得由于第一机器人设备的学习而产生的新能力。
图16示意性地显示了本发明另一实施方式的用于机器人设备的知识分享的服务器的原理架构,如图16所示,该服务器1在图15的基础上配置为还包括交易模块,其用于通过交易系统来发起与第一机器人设备和第二机器人设备之间的数据传输,具体实现为包括
第一交易模块17,用于通过向第一机器人设备关联的用户账户支付奖励来从第一机器人设备获取第一数据信息和/或第二数据信息,其中,支付奖励可以是在获取第一数据信息和/或第二数据信息之前即进行支付,也可以是在获取第一数据信息和/或第二数据信息之后并在其他用户(即第二机器人设备关联的用户)从向服务器发起对第一数据信息和/或第二数据信息的购买或支付行为时才进行支付;和
第二交易模块18,用于在将第二智能模型和/或第二应用程序传输至第二机器人设备之前、或将所述第二数据信息传输至第二机器人设备之前,从第二机器人设备关联的用户账户获取支付内容。
需要说明的是,本发明的图12~16提及的服务器上的各模块之间可以自由组合,并不限于图示的模块配置方式。另外,图12~16提及的服务器上的各模块和单元的具体实现方式,可以参照适用前文方法部分的叙述,在此不再赘述。优选地,本发明实施例中在第一机器人设备上使用的本地智能模型和/或应用程序是从所述服务器获取的。
图17示意性地显示了本发明一种实施方式的用于机器人设备的知识分享的机器人端处理方法,该方法的执行主体为机器人设备的处理器。如图17所示,该方法包括:
步骤S181:从服务器端获取智能模型和/或应用程序。
步骤S182:在第一机器人设备上通过使用本地智能模型和/或应用程序获取第一数据信息存储。
步骤S183:将所述第一数据信息传输至所述服务器端,以使得所述服务器端能够根据所述第一数据信息对其上存储的所述智能模型和/或应用程序进行优化。
在步骤S181中,机器人设备从服务器端获取的智能模型和/或应用程序可以是上述的第一智能模型和/或第一应用程序,也可以是上述的优化后的第二智能模型和/或第二应用程序。机器人设备在从服务器端获取了智能模型和/或应用程序之后,该智能模型和/或应用程序即成为机器人设备上的本地智能模型和/或应用程序。
在步骤S182中,本地智能模型和/或应用程序可以为机器人设备当前使用的任意本地智能模型和/或应用程序,第一数据信息与相应的本地智能模型和/或应用程序相关联,且第一数据信息可以为在第一机器人设备上使用本地智能模型和/或应用程序过程中收集的使用数据信息;第一数据信息还可以为根据在第一机器人设备上使用本地智能模型和/或应用程序过程中收集的使用数据信息对第一机器人设备上的本地智能模型和/或应用程序进行本地训练得到的第三智能模型和/或第三应用程序。第一机器人设备是指正在收集第一数据信息并上传至服务器的机器人设备,其可以是一台机器人设备,也可以同时指多个不同的机器人设备。其中,第一机器人设备上使用本地收集的使用数据信息对其上的本地智能模型和/或应用程序进行本地训练得到的第三智能模型和/或第三应用程序可以是基于机器学习的优化算法或基于仿生或类脑计算的优化方式实现。
在优选实现例中,使用数据信息可以是在第一机器人设备上使用本地智能模型和/或应用程序过程中产生的内部状态或外部传感器记录,也可以是通过第一机器人设备上的用户交互界面获取的用户反馈信息,还可以是二者的组合。
在步骤S183中,第一机器人设备向服务器传输第一数据信息的方式,以及服务器利用第一数据信息对其上的智能模型和/或应用程序进行优化的处理过程,可以参照前文服务端处理方法的相关叙述,在此不再赘述。
图18示意性地显示了本发明另一种实施方式的用于机器人设备的知识分享的机器人端处理方法,该方法的执行主体为机器人设备的处理器。如图18所示,该方法包括:
步骤S191:在第一机器人设备上对本地智能模型和/或应用程序进行训练调整,生成第二数据信息存储。其中,所述第二数据信息为通过在第一机器人设备上对本地智能模型和/或应用程序进行训练调整而得到的与新能力相关的模型或数据信息,所述新能力指在对所述本地智能模型和/或应用程序进行训练调整之后产生的、原有本地智能模型和/或应用程序所不具备的能力。
步骤S192:将所述第二数据信息传输至所述服务器端,以使得所述服务器端能够获取所述第一机器人设备上产生的新能力。
在步骤S191中,第一机器人设备可以利用其本地收集的内部状态和传感器记录等使用数据信息,或者利用用户反馈信息,或者利用包括了用户反馈信息在内的使用数据信息对本地智能模型和/或应用程序进行训练调整,以生成第二数据信息,其具体实现方式可以参照前文叙述。其中,在其他实现例中,通过步骤S191的训练调整,还可以生成第一数据信息,此时生成的第一数据信息是指根据在第一机器人设备上使用本地智能模型和/或应用程序过程中收集的使用数据信息对第一机器人设备上的本地智能模型和/或应用程序进行本地训练得到的第三智能模型和/或第三应用程序。
在步骤S192中,第一机器人设备向服务器传输第二数据信息的方式,可以参照前文服务端处理方法的相关叙述,在此不再赘述。
在一些实施例中,由于机器人端系统存在于多种不同型号的机器人平台上,为了使得本发明实施例的知识分享方法能够与不同的机器人平台兼容,本发明实施例优选还在机器人设备端提供有跨平台的应用程序接口。该应用程序接口优选实现为用于分别与机器人设备底层和智能模型或应用程序交互的中间层,即该中间层向下与机器人设备的底层进行交互,向上与机器人端系统进行交互,并根据机器人端系统传输的用户指令和机器人设备的底层信息来调用智能模型和/或应用程序,由此来屏蔽不同模型和应用程序在调用过程或训练过程中的差异。具体地,该中间层可以通过提供通用的应用程序接口、并定义包括硬件种类和机器人构型的底层信息,来屏蔽不同平台之间不必要的区别,以便于应用程序或智能模型的跨平台使用和分发。示例性地,以机器人设备控制机械手抓取物品为例,当机器人端的系统发出指令让机械手抓取某物品时,本发明实施例的机器人端系统直接与中间层交互,向中间层传输用户指令,以使得中间层根据用户指令和机器人设备的底层信息,如机器人构型(关节数量、关节可旋转的角度、各节肢体长度)来选取合适的模型,并将指令和构型作为参数通过中间层输入模型,模型计算后通过中间层传输给机器人系统内部通讯模块,相关的运动控制模块再调用相关驱动控制对应的关节。由此,本发明实施例还能通过提供作为中间层的应用程序接口来实现智能模型的高级功能与机器人硬件平台的低耦合度,可以使以智能模型为基础的应用程序更易于跨平台使用。并且,应用程序接口还可利用这一特点,进一步地简化相关应用程序的跨平台开发和分发。
机器人在真实的使用环境中,会出现环境或任务的突变导致切换智能模型的需求,例如,机器人从结构化地形走入非结构化地形以完成搜救任务时,就需要对当前使用的智能模型进行切换,以适应非结构地形的走路方式。因此,在本发明的一些优选实施例中,机器人端的处理方法还可以实现为包括:根据条件对当前使用的智能模型和/或应用程序进行切换控制,以自动更换当前使用的智能模型和/或应用程序。其中,条件在具体实现中可以预设为环境变化条件(如非结构地形进入非结构化地形)、任务变化条件(如在某一任务执行完毕后,自动切换为其他另一任务)、基于周期的时间变化条件(如在预设的时间段执行固定的某一智能模型或应用程序,而在其他时间段执行另一预设的智能模型或应用程序)等,用户可以根据需求来进行条件的预定义和设置,并由机器人端来根据条件的预定义内容进行条件是否得到满足的检测和判断,在满足条件时,即将当前使用的智能模型和/或应用程序切换为对应的其他智能模型和/或应用程序。作为一种示例性实现例,基于任务变化条件对当前使用的智能模型和/或应用程序进行切换控制,可以实现为:在智能模型或应用程序安装时,将相关的信息注入数据库(如将各智能模型或应用程序对应的功能、其需要使用的工具、及其被要求的任务,按模型或应用程序分类关联存储至数据库中),机器人设备在每次进行任务切换时,都基于该数据库中存储的相关信息,来获取与当前任务关联的智能模型或应用程序,以实现基于任务变化的模型和/或应用的自动选择切换功能。作为另一种示例性实现,基于环境变化条件对当前使用的智能模型和/或应用程序进行切换控制,可以实现为:根据环境变化条件实时计算当前机器人设备上的各智能模型和/或应用程序的置信率,通过比较各个模型或者应用对当前任务计算结果的置信率,进行模型的选择切换,如选择置信率最高的模型或应用程序作为当前使用的智能模型和/或应用程序。
图19示意性地显示了本发明一实施方式的智能机器人设备的原理架构,如图19所示,该机器人设备上配置有
下载模块201,用于从服务器端获取智能模型和/或应用程序;
数据收集模块202,用于在所述智能机器人设备上,收集智能机器人设备使用本地智能模型和/或应用程序过程中产生的第一数据信息;
数据传输模块203,用于将所述第一数据信息传输至所述服务器端,以使得所述服务器端能够根据所述第一数据数据信息对服务器上存储的所述智能模型和/或应用程序进行优化。
其中,优选地,第一数据信息包括在所述智能机器人设备上使用本地智能模型和/或应用程序过程中收集的使用数据信息;和/或
根据在智能机器人设备上使用本地智能模型和/或应用程序过程中收集的使用数据信息对智能机器人设备上的本地智能模型和/或应用程序进行本地训练得到的第三智能模型和/或第三应用程序。
图20示意性地显示了本发明另一实施方式的智能机器人设备的原理架构,如图20所示,该机器人设备在图19的基础上还配置有
用户交互模块204,用于获取用户反馈信息;和
用于采集使用过程中的外部数据信息的传感器205。
其中,在本发明实施例中,使用数据信息包括通过所述用户交互模块获取的用户反馈信息、在所述智能机器人设备上使用本地智能模型和/或应用程序过程中产生的内部状态、和/或在所述智能机器人设备上使用本地智能模型和/或应用程序过程中产生的外部传感器记录。
图21示意性地显示了本发明一实施方式的智能机器人设备的原理架构,如图21所示,该机器人设备上在图20的基础上还配置有
学习模块206,用于在第一机器人设备上对本地智能模型和/或应用程序进行训练调整,生成第一数据信息和/或第二数据信息存储。其中,此时生成的第一数据信息是指根据在第一机器人设备上使用本地智能模型和/或应用程序过程中收集的使用数据信息对第一机器人设备上的本地智能模型和/或应用程序进行本地训练得到的第三智能模型和/或第三应用程序。所述第二数据信息为通过在第一机器人设备上对本地智能模型和/或应用程序进行训练调整而得到的与新能力相关的模型或数据信息,所述新能力指在对所述本地智能模型和/或应用程序进行训练调整之后产生的、原有本地智能模型和/或应用程序所不具备的能力。
其中,在本发明实施例中,数据传输模块203还用于将所述第二数据信息传输至所述服务器端,以使得所述服务器端能够获取所述第一机器人设备上产生的新能力。
图22示意性地显示了本发明一实施方式的智能机器人设备的原理架构,如图22所示,该机器人设备上在图22的基础上还配置有
切换控制模块207,用于根据获取到的实时条件信息对当前正在使用的本地智能模型和/或应用程序进行切换。
需要说明的是,本发明的图19~22提及的智能机器人设备上的各模块之间可以自由组合,并不限于图示的模块配置方式。另外,图19~22提及的服务器上的各模块和单元的具体实现方式,可以参照适用前文方法部分的叙述,在此不再赘述。
图23示意性地显示了本发明一种实施方式的用于机器人设备的知识分享系统,如图23所示,该系统包括至少一个第一机器人设备A、至少一个第二机器人设备B和至少一个服务器1,其中,所述第一机器人设备和第二机器人设备均能够与所述服务器进行双向通信;
所述第一机器人设备用于在使用本地智能模型和/或应用程序过程中收集第一数据信息传输至所述服务器;
所述服务器用于根据所述第一数据信息对服务器端存储的所述第一智能模型和/或第一应用程序进行优化,得到第二智能模型和/或第二应用程序存储;
所述第二机器人设备用于从所述服务器获取所述第二智能模型和/或第二应用程序,以获得由于第一机器人设备的使用被优化的第一智能模型和/或第一应用程序。
其中,优选地,第一数据信息包括在所述第一机器人设备上使用本地智能模型和/或应用程序过程中收集的使用数据信息;和/或
根据在第一机器人设备上使用本地智能模型和/或应用程序过程中收集的使用数据信息对第一机器人设备上的本地智能模型和/或应用程序进行本地训练得到的第三智能模型和/或第三应用程序。
在其他优选实现例中,本发明实施例系统中的第一机器人设备还用于对本地智能模型和/或应用程序进行训练调整,生成第二数据信息存储,并将所述第二数据信息传输至所述服务器,其中,所述第二数据信息为通过在第一机器人设备上对本地智能模型和/或应用程序进行训练调整而得到的与新能力相关的模型或数据信息,其中,所述新能力指在对所述本地智能模型和/或应用程序进行训练调整之后产生的、原有本地智能模型和/或应用程序所不具备的能力;
所述第二机器人设备还用于从所述服务器获取所述第二数据信息,以获得由于第一机器人设备的学习而产生的新能力。
在本发明实施例中第一机器人设备A是指用于收集第一数据信息和生成第二数据信息传输给服务器端,以进行知识分享的机器人设备,第二机器人设备B是指用于从服务器端获取第一机器人设备A的分享结果的机器人设备。因此,不难理解的是,根据在具体实现中机器人设备在不同场景下承担的角色,机器人设备的角色是变化的,即第一机器人设备A和第二机器人设备B的角色是可以相互转化的。
更优地,在其他实现例中,第一机器人设备经由预设的交易系统接口发起向服务器传输第一数据信息和/或第二数据信息的请求;
第二机器人设备经由预设的交易系统接口发起从服务器获取第一数据信息和/或第二数据信息的请求。
其中,系统中涉及的服务器、第一机器人设备和第二机器人设备的相应功能的具体实现,可以参照前文方法部分的叙述,在此不再赘述。
图24示意性地显示了本发明一种实施方式的机器人任务学习系统,如图24所示,该系统包括至少一个机器人设备4和服务器1,其中,机器人设备4均能够与服务器1进行双向通信;
机器人设备4用于在使用本地智能模型和/或应用程序过程中收集第一数据信息传输至服务器1;
服务器1用于根据第一数据信息对服务器端存储的所述第一智能模型和/或第一应用程序进行优化,得到第二智能模型和/或第二应用程序存储。
优选地,第一数据信息包括在第一机器人设备上使用本地智能模型和/或应用程序过程中收集的使用数据信息;和/或根据在第一机器人设备上使用本地智能模型和/或应用程序过程中收集的使用数据信息对第一机器人设备上的本地智能模型和/或应用程序进行本地训练得到的第三智能模型和/或第三应用程序。
其中,图23和24中所示的服务器可以是单台计算机设备,也可以是多台计算机设备组成的服务器集群,本发明实施例对此不进行限制。
通过将上述实施例的知识分享方法应用到机器人任务学习中,可以实现利用构建的机器人任务学习系统对特定任务进行快速学习,例如,利用机器人设备训练农场。并且,可以通过多台机器人设备进行同步学习,并将收集的数据或优化后的智能模型或应用程序传送到服务器,以实现对只能模型或应用程序进行分布式、并行的优化,提高学习效率和优化速度。
在一些实施例中,本发明实施例提供一种非易失性计算机可读存储介质,所述存储介质中存储有一个或多个包括执行指令的程序,所述执行指令能够被电子设备(包括但不限于计算机,服务器,或者网络设备等)读取并执行,以用于执行本发明上述任一项实施例的用于机器人设备的知识分享的服务器端处理方法。
在一些实施例中,本发明实施例还提供一种计算机程序产品,所述计算机程序产品包括存储在非易失性计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行上述任一项实施例的用于机器人设备的知识分享的服务器端处理方法。
在一些实施例中,本发明实施例还提供一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述任一实施例的用于机器人设备的知识分享的服务器端处理方法。
在一些实施例中,本发明实施例还提供一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任一项实施例的用于机器人设备的知识分享的服务器端处理方法。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。
Claims (17)
1.用于机器人设备的知识分享的服务器端处理方法,其特征在于,所述方法包括
从第一机器人设备获取第一数据信息存储,其中,所述第一数据信息为通过在第一机器人设备上使用本地智能模型和/或应用程序而得到的数据信息;
根据所述第一数据信息对服务器端存储的第一智能模型和/或第一应用程序进行优化,得到第二智能模型和/或第二应用程序存储;以及
将第二智能模型和/或第二应用程序传输至第二机器人设备,以使得所述第二机器人设备获得由于第一机器人设备的使用而获得优化的第一智能模型和/或第一应用程序。
2.根据权利要求1所述的方法,其特征在于,其中,所述第一数据信息包括在第一机器人设备上使用本地智能模型和/或应用程序过程中收集的使用数据信息;
所述根据所述第一数据信息对服务器端存储的第一智能模型和/或第一应用程序进行优化,得到第二智能模型和/或第二应用程序包括
从所述第一数据信息中解析获取使用数据信息,并对所述使用数据信息进行分类存储;
从分类存储的使用数据信息中获取与所述第一智能模型和/或第一应用程序相关的使用数据信息,并利用获取的相关的使用数据信息对服务器端存储的第一智能模型和/或第一应用程序进行优化处理,得到第二智能模型和/或第二应用程序。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括
将所述第二智能模型和/或第二应用程序传输至第一机器人设备,以对所述第一机器人设备上的与所述第一智能模型和/或第一应用程序相关的本地智能模型和/或应用程序进行更新。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述第一数据信息包括根据在第一机器人设备上使用本地智能模型和/或应用程序过程中收集的使用数据信息对第一机器人设备上的本地智能模型和/或应用程序进行本地训练得到的第三智能模型和/或第三应用程序;
所述根据所述第一数据信息对服务器端存储的第一智能模型和/或第一应用程序进行优化,得到第二智能模型和/或第二应用程序包括:
从所述第一数据信息中解析获取第三智能模型和/或第三应用程序,并对所述第三智能模型和/或第三应用程序进行分类存储;
从分类存储的第三智能模型和/或第三应用程序中获取与所述第一智能模型和/或第一应用程序相关的第三智能模型和/或第三应用程序,并利用获取的相关的第三智能模型和/或第三应用程序对服务器端存储的第一智能模型和/或第一应用程序进行优化处理,得到第二智能模型和/或第二应用程序。
5.根据权利要求1至3任一项所述的方法,其特征在于,所述方法还包括
从第一机器人设备获取第二数据信息存储,其中,所述第二数据信息为通过在第一机器人设备上对本地智能模型和/或应用程序进行训练调整而得到的与新能力相关的模型或数据信息,其中,所述新能力指在对所述本地智能模型和/或应用程序进行训练调整之后产生的、原有本地智能模型和/或应用程序所不具备的能力;以及
将所述第二数据信息传输至第二机器人设备,以使得所述第二机器人设备获得由于第一机器人设备的学习而产生的新能力。
6.根据权利要求4所述的方法,其特征在于,所述方法还包括
从第一机器人设备获取第二数据信息存储,其中,所述第二数据信息为通过在第一机器人设备上对本地智能模型和/或应用程序进行训练调整而得到的与新能力相关的模型或数据信息,其中,所述新能力指在对所述本地智能模型和/或应用程序进行训练调整之后产生的、原有本地智能模型和/或应用程序所不具备的能力;以及
将所述第二数据信息传输至第二机器人设备,以使得所述第二机器人设备获得由于第一机器人设备的学习而产生的新能力。
7.根据权利要求6所述的方法,其特征在于,在从第一机器人设备获取第一数据信息和第二数据信息之前和/或之后,还包括
向第一机器人设备关联的用户账户支付奖励;或
在将第二智能模型和/或第二应用程序传输至第二机器人设备、或将所述第二数据信息传输至第二机器人设备之前,还包括
从第二机器人设备关联的用户账户获取支付内容。
8.用于机器人设备的知识分享的机器人端处理方法,其特征在于,所述方法包括
从服务器端获取智能模型和/或应用程序;
在第一机器人设备上通过使用本地智能模型和/或应用程序获取第一数据信息存储;
将所述第一数据信息传输至所述服务器端,以使得所述服务器端能够根据所述第一数据信息对其上存储的所述智能模型和/或应用程序进行优化。
9.根据权利要求8所述的方法,其特征在于,所述第一数据信息包括在第一机器人设备上使用本地智能模型和/或应用程序过程中收集的使用数据信息;和/或
根据在第一机器人设备上使用本地智能模型和/或应用程序过程中收集的使用数据信息对第一机器人设备上的本地智能模型和/或应用程序进行本地训练得到的第三智能模型和/或第三应用程序;
其中,所述使用数据信息包括通过第一机器人设备上的用户交互界面获取的用户反馈信息和/或在第一机器人设备上使用本地智能模型和/或应用程序过程中产生的内部状态或外部传感器记录。
10.根据权利要求8至9任一项所述的方法,其特征在于,所述方法还包括
在第一机器人设备上对本地智能模型和/或应用程序进行训练调整,生成第二数据信息存储,其中,所述第二数据信息为通过在第一机器人设备上对本地智能模型和/或应用程序进行训练调整而得到的与新能力相关的模型或数据信息,所述新能力指在对所述本地智能模型和/或应用程序进行训练调整之后产生的、原有本地智能模型和/或应用程序所不具备的能力;
将所述第二数据信息传输至所述服务器端,以使得所述服务器端能够获取所述第一机器人设备上产生的新能力。
11.智能机器人设备,其特征在于,包括
下载模块,用于从服务器端获取智能模型和/或应用程序;
数据收集模块,用于在所述智能机器人设备上,收集通过在所述智能机器人设备上使用本地智能模型和/或应用程序而产生的第一数据信息;
数据传输模块,用于将所述第一数据信息传输至所述服务器端,以使得所述服务器端能够根据所述第一数据数据信息对服务器上存储的所述智能模型和/或应用程序进行优化。
12.根据权利要求11所述的智能机器人设备,其特征在于,所述第一数据信息包括在所述智能机器人设备上使用本地智能模型和/或应用程序过程中收集的使用数据信息;和/或
根据在智能机器人设备上使用本地智能模型和/或应用程序过程中收集的使用数据信息对智能机器人设备上的本地智能模型和/或应用程序进行本地训练得到的第三智能模型和/或第三应用程序。
13.根据权利要求11或12所述的智能机器人设备,其特征在于,还包括
用户交互模块,用于获取用户反馈信息;和
用于采集使用过程中的外部数据信息的传感器;
其中,所述使用数据信息包括通过所述用户交互模块获取的用户反馈信息、在所述智能机器人设备上使用本地智能模型和/或应用程序过程中产生的内部状态、和/或在所述智能机器人设备上使用本地智能模型和/或应用程序过程中产生的外部传感器记录。
14.根据权利要求13所述的智能机器人设备,其特征在于,还包括
学习模块,用于在第一机器人设备上对本地智能模型和/或应用程序进行训练调整,生成第三智能模型和/或第三应用程序、和/或第二数据信息存储,其中,所述第二数据信息为通过在第一机器人设备上对本地智能模型和/或应用程序进行训练调整而得到的与新能力相关的模型或数据信息,所述新能力指在对所述本地智能模型和/或应用程序进行训练调整之后产生的、原有本地智能模型和/或应用程序所不具备的能力;
其中,所述数据传输模块还用于将所述第二数据信息传输至所述服务器端,以使得所述服务器端能够获取所述第一机器人设备上产生的新能力;
以及包括
切换控制模块,用于根据获取到的实时条件信息对当前正在使用的本地智能模型和/或应用程序进行切换。
15.用于机器人设备的知识分享系统,其特征在于,包括至少一个第一机器人设备、至少一个第二机器人设备和至少一个服务器,其中,所述第一机器人设备和第二机器人设备均能够与所述服务器进行双向通信;
所述第一机器人设备用于在使用本地智能模型和/或应用程序过程中收集第一数据信息传输至所述服务器;
所述服务器用于根据所述第一数据信息对服务器端存储的第一智能模型和/或第一应用程序进行优化,得到第二智能模型和/或第二应用程序存储;
所述第二机器人设备用于从所述服务器获取所述第二智能模型和/或第二应用程序,以获得由于第一机器人设备的使用被优化的第一智能模型和/或第一应用程序。
16.根据权利要求15所述的系统,其特征在于,所述第一机器人设备还用于对本地智能模型和/或应用程序进行训练调整,生成第二数据信息存储,并将所述第二数据信息传输至所述服务器,其中,所述第二数据信息为通过在第一机器人设备上对本地智能模型和/或应用程序进行训练调整而得到的与新能力相关的模型或数据信息,所述新能力指在对所述本地智能模型和/或应用程序进行训练调整之后产生的、原有本地智能模型和/或应用程序所不具备的能力;
所述第二机器人设备还用于从所述服务器获取所述第二数据信息,以获得由于第一机器人设备的学习而产生的新能力;
其中,所述第一机器人设备经由预设的交易系统接口发起向服务器传输第一数据信息和/或第二数据信息的请求;
所述第二机器人设备经由预设的交易系统接口发起从服务器获取第一数据信息和/或第二数据信息的请求。
17.机器人任务学习系统,其特征在于,包括至少一个机器人设备和服务器,其中,所述机器人设备均能够与所述服务器进行双向通信;
所述机器人设备用于在使用本地智能模型和/或应用程序过程中收集第一数据信息传输至所述服务器;
所述服务器用于根据所述第一数据信息对服务器端存储的第一智能模型和/或第一应用程序进行优化,得到第二智能模型和/或第二应用程序存储。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110767235.3A CN113435126B (zh) | 2021-07-07 | 2021-07-07 | 知识分享处理方法、智能机器人设备、知识分享系统、任务学习系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110767235.3A CN113435126B (zh) | 2021-07-07 | 2021-07-07 | 知识分享处理方法、智能机器人设备、知识分享系统、任务学习系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113435126A CN113435126A (zh) | 2021-09-24 |
CN113435126B true CN113435126B (zh) | 2024-02-02 |
Family
ID=77759342
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110767235.3A Active CN113435126B (zh) | 2021-07-07 | 2021-07-07 | 知识分享处理方法、智能机器人设备、知识分享系统、任务学习系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113435126B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114210766B (zh) * | 2021-12-15 | 2024-02-02 | 中国林业科学研究院木材工业研究所 | 一种圆锯片智能化整平方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108108821A (zh) * | 2017-12-29 | 2018-06-01 | 广东欧珀移动通信有限公司 | 模型训练方法及装置 |
CN110337698A (zh) * | 2018-02-13 | 2019-10-15 | 日本电气香港有限公司 | 智能服务终端和平台系统及其方法 |
CN110866588A (zh) * | 2019-11-08 | 2020-03-06 | 中国科学院软件研究所 | 一种实现智能虚拟数字动物的可学习能力模型个性化的训练学习方法与系统 |
CN111209931A (zh) * | 2019-12-23 | 2020-05-29 | 深圳智链物联科技有限公司 | 数据处理方法、平台、终端设备及存储介质 |
CN111242321A (zh) * | 2019-04-18 | 2020-06-05 | 中科寒武纪科技股份有限公司 | 一种数据处理方法及相关产品 |
CN112507623A (zh) * | 2020-12-15 | 2021-03-16 | 交控科技股份有限公司 | 一种算法中台构建方法及系统 |
CN112541569A (zh) * | 2020-11-24 | 2021-03-23 | 常州罗盘星检测科技有限公司 | 一种基于机器学习的传感器在线训练系统和方法 |
-
2021
- 2021-07-07 CN CN202110767235.3A patent/CN113435126B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108108821A (zh) * | 2017-12-29 | 2018-06-01 | 广东欧珀移动通信有限公司 | 模型训练方法及装置 |
CN110337698A (zh) * | 2018-02-13 | 2019-10-15 | 日本电气香港有限公司 | 智能服务终端和平台系统及其方法 |
CN111242321A (zh) * | 2019-04-18 | 2020-06-05 | 中科寒武纪科技股份有限公司 | 一种数据处理方法及相关产品 |
CN110866588A (zh) * | 2019-11-08 | 2020-03-06 | 中国科学院软件研究所 | 一种实现智能虚拟数字动物的可学习能力模型个性化的训练学习方法与系统 |
CN111209931A (zh) * | 2019-12-23 | 2020-05-29 | 深圳智链物联科技有限公司 | 数据处理方法、平台、终端设备及存储介质 |
CN112541569A (zh) * | 2020-11-24 | 2021-03-23 | 常州罗盘星检测科技有限公司 | 一种基于机器学习的传感器在线训练系统和方法 |
CN112507623A (zh) * | 2020-12-15 | 2021-03-16 | 交控科技股份有限公司 | 一种算法中台构建方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN113435126A (zh) | 2021-09-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Srinivas et al. | Universal planning networks: Learning generalizable representations for visuomotor control | |
Francesca et al. | AutoMoDe: A novel approach to the automatic design of control software for robot swarms | |
US20220171907A1 (en) | Creation of digital twin of the interaction among parts of the physical system | |
CN112216101B (zh) | 一种基于弹性学习框架的交通预测方法及系统 | |
CN110083334A (zh) | 模型上线的方法及装置 | |
Bignold et al. | A conceptual framework for externally-influenced agents: An assisted reinforcement learning review | |
Papadopoulos et al. | Towards open and expandable cognitive AI architectures for large-scale multi-agent human-robot collaborative learning | |
JP6963778B2 (ja) | サービス提供システム及びプログラム | |
CN113435126B (zh) | 知识分享处理方法、智能机器人设备、知识分享系统、任务学习系统 | |
KR102546871B1 (ko) | 인공지능 모델 기반 b2b 식자재 및 부자재의 유통의 주문 히스토리의 패턴 분석을 통한 주문 정보 추천 방법, 장치 및 시스템 | |
Hertzberg et al. | The RACE project: Robustness by autonomous competence enhancement | |
US20200311560A1 (en) | Integrated Intelligence Systems and Processes | |
CN115394143A (zh) | 一种基于数字孪生的虚拟仿真教育系统及其交互方法 | |
Bagga et al. | ANEGMA: an automated negotiation model for e-markets | |
Janssen et al. | Cloud based centralized task control for human domain multi-robot operations | |
Khatoon et al. | Analysis of use cases enabling AI/ML to IOT service platforms | |
WO2021138939A1 (zh) | 一种云脑机器人系统 | |
KR102552856B1 (ko) | 커머스 연계 콘텐츠 제공 플랫폼 서비스를 위한 키워드 추출 및 콘텐츠 템플릿 생성 자동화 방법, 장치 및 시스템 | |
CN112287799A (zh) | 基于人工智能的视频处理方法、装置及电子设备 | |
CN116976353A (zh) | 一种数据处理方法、装置、设备以及可读存储介质 | |
Terdjimi et al. | Multi-purpose Adaptation in the Web of Things | |
US20200334530A1 (en) | Differentiable neuromodulated plasticity for reinforcement learning and supervised learning tasks | |
JP6899103B2 (ja) | サービス提供システム及びプログラム | |
CN115423016A (zh) | 多任务预测模型的训练方法、多任务预测方法及装置 | |
Merkle et al. | Cooperative web agents by combining semantic technologies with reinforcement learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |