CN110738303A

CN110738303A - 机器模型更新方法、设备、系统及存储介质

Info

Publication number: CN110738303A
Application number: CN201810792103.4A
Authority: CN
Inventors: 鲍亮; 王孟昊; 汤进举
Original assignee: Ecovacs Robotics Suzhou Co Ltd
Current assignee: Ecovacs Robotics Suzhou Co Ltd
Priority date: 2018-07-18
Filing date: 2018-07-18
Publication date: 2020-01-31

Abstract

本申请实施例提供一种机器模型更新方法、设备、系统及存储介质。在本申请实施例中，一种机器模型更新方法，包括：响应用户发出的更新触发操作，显示一配置界面，所述配置界面显示机器人对应的标注数据集；响应所述用户发出的标注数据选择操作，从所述标注数据集中选择训练样本集；响应所述用户发出的训练操作，指示所述模型训练设备根据所述训练样本集对所述机器人当前使用的机器模型训练得到新的机器模型。在本实施例中，用户可以通过终端设备对机器人使用的机器模型进行更新控制，这样用户可以根据需求随时更新机器人使用的机器模型，灵活性更强，模型更新效率也较高。

Description

机器模型更新方法、设备、系统及存储介质

技术领域

本申请涉及人工智能技术领域，尤其涉及一种机器模型更新方法、设备、系统及存储介质。

背景技术

神经网络模型是人工智能的基础。随着人工智能的发展，使用神经网络模型的产品越来越多。神经网络模型可分为有监督的和无监督的两种类型。有监督的神经网络模型利用标记数据来指导聚类过程，可以得到更好的效果，在机器人等产品领域得到广泛应用。

在实际使用过程中，为了提高模型效果，经常对有监督的神经网络模型进行更新迭代。现有模型更新过程包括：服务端收集大量产品使用过程中产生的与模型相关的数据集，对数据集进行标注，然后利用标注后的数据集重新训练模型，训练完成后发布新的模型供产品使用。

但是，现有模型更新过程存在灵活性较差等问题。

发明内容

本申请的多个方面提供一种机器模型更新方法、设备、系统及存储介质，用于解决现有模型更新过程中存在灵活性较差的问题。

本申请实施例提供一种机器模型更新方法，适用于终端设备，包括：

响应用户发出的更新触发操作，显示一配置界面，所述配置界面显示机器人对应的标注数据集；

响应所述用户发出的标注数据选择操作，从所述标注数据集中选择训练样本集；

响应所述用户发出的训练操作，指示所述模型训练设备根据所述训练样本集对所述机器人当前使用的机器模型训练得到新的机器模型；其中，所述模型训练设备为所述机器人或所述机器人对应的服务器。

本申请实施例提供一种机器模型更新方法，适用于模型训练设备，包括：

接收终端设备发送的训练指示，根据所述指示确定训练样本集，所述训练样本集是从所述机器人对应的标注数据集选择出的；

根据所述训练样本集对所述机器人当前使用的机器模型训练得到新的机器模型。

响应用户发出的更新触发操作，显示一配置界面，所述配置界面显示至少一个模型参数，

响应用户发出的参数选择操作，从所述至少一个模型参数中选择目标模型参数；

响应所述用户发出的训练操作，向模型训练设备发送所述目标模型参数，以供模型训练设备根据目标模型参数对机器人当前使用的机器模型训练得到新的机器模型；其中，所述模型训练设备为所述机器人或所述机器人对应的服务器。

接收终端设备发送的目标模型参数，所述目标模型参数是从至少一个模型参数中选择出的；

根据所述目标模型参数对机器人当前使用的机器模型训练以得到新的机器模型。

本申请实施例提供一种终端设备，包括：存储器、电子显示屏、处理器以及通信组件；

所述存储器，用于存储计算机程序；

所述处理器，用于执行所述计算机程序，以用于：

响应用户发出的更新触发操作，在所述电子显示屏上显示一配置界面，所述配置界面显示机器人对应的标注数据集；

本申请实施例提供一种存储有计算机程序的计算机可读存储介质，当所述计算机程序被一个或多个处理器执行时，致使所述一个或多个处理器执行包括以下的动作：

本申请实施例提供一种模型更新系统，包括：终端设备和机器人；

所述终端设备，用于响应用户发出的更新触发操作，显示一配置界面，所述配置界面显示所述机器人对应的标注数据集；响应所述用户发出的标注数据选择操作，从所述标注数据集中选择训练样本集；响应所述用户发出的训练操作，向所述机器人发送指示；

所述机器人，用于接收所述终端设备发送的指示，根据所述指示确定训练样本集，根据所述训练样本集对所述机器人当前使用的机器模型训练以得到新的机器模型。

本申请实施例提供一种模型更新系统，包括：终端设备、机器人和服务器；

所述终端设备，用于响应用户发出的更新触发操作，显示一配置界面，所述配置界面显示所述机器人对应的标注数据集；响应所述用户发出的标注数据选择操作，从所述标注数据集中选择训练样本集；响应所述用户发出的训练操作，向所述服务器发送指示；

所述机器人，用于接收所述服务器下发的新的机器模型；

所述服务器，用于接收所述终端设备发送指示，根据所述指示确定训练样本集，根据所述训练样本集对所述机器人当前使用的机器模型训练以得到新的机器模型，将所述新的机器模型发送至所述机器人。

在本实施例中，用户可以通过终端设备对机器人使用的机器模型进行更新控制，这样用户可以根据需求随时更新机器人使用的机器模型，灵活性更强，模型更新效率也较高。另外，界面化操作，对用户来说，很容易掌握，可极大降低用户的学习和使用门槛。

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1为本申请一示例性实施例提供的模型更新系统的构架示意图；

图2a为本申请一示例性实施例机器模型更新方法的流程图；

图2b为本申请又一示例性实施例机器模型更新方法的流程图；

图2c为本申请又一示例性实施例机器模型更新方法的流程图；

图2d为本申请又一示例性实施例机器模型更新方法的流程图；

图2e为本申请一示例性实施例配置界面的示意图；

图2f为本申请一示例性实施例配置模型界面的示意图；

图2g为本申请一示例性实施例查看修改数据集界面的示意图；

图3a为本申请又一示例性实施例机器模型更新方法的流程图；

图3b为本申请又一示例性实施例机器模型更新方法的流程图；

图4为本申请又一示例性实施例提供的模型更新系统的构架示意图；

图5a为本申请又一示例性实施例机器模型更新方法的流程图；

图5b为本申请又一示例性实施例机器模型更新方法的流程图；

图5c为本申请又一示例性实施例机器模型更新方法的流程图；

图5d为本申请又一示例性实施例机器模型更新方法的流程图；

图6a为本申请又一示例性实施例机器模型更新方法的流程图；

图6b为本申请又一示例性实施例机器模型更新方法的流程图；

图7为本申请一示例性实施例终端设备的结构示意图；

图8为本申请一示例性实施例机器人的结构示意图；

图9为本申请一示例性实施例服务器的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然，所描述的实施例仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

针对现有模型更新过程存在灵活性较差等技术问题，本申请实施例提供一种解决方案，在本实施例中，用户可以通过终端设备对机器人使用的机器模型进行更新控制，这样用户可以根据需求随时更新机器人使用的机器模型，灵活性更强，模型更新效率也较高。另外，界面化操作，对用户来说，很容易掌握，可极大降低用户的学习和使用门槛。

以下结合附图，详细说明本申请各实施例提供的技术方案。

图1为本申请示例性实施例提供的一种模型更新系统的结构示意图。如图1所示，该系统10包括：终端设备10a和机器人10b。

在本实施例中，终端设备10a是指用户使用的，具有用户所需的计算、上网、通信等功能的计算机设备，其实现形式可以有多种，例如可以是智能手机、个人电脑、穿戴设备、平板电脑等。

机器人10b除了具有基础服务功能之外，还可以具有计算、通信、上网等功能。根据应用场景的不同，机器人10b的基础服务功能也会有所不同。例如，对应用于家庭、办公楼、商场等场景中的扫地机器人10b而言，其基本服务功能是对所在场景中的地面进行清扫；对应用于家庭、办公楼、商场等场景中的擦玻璃机器人10b而言，其基本服务功能是对所在场景中玻璃进行清洁；对跟随机器人10b而言，其基本服务功能是跟随目标对象；对迎宾机器人10b而言，其基本服务功能是欢迎顾客，并引导顾客到达目的地。

终端设备10a可与机器人10b通信连接，主要对机器人10b进行各种控制，例如控制机器人10b进行机器模型更新等。在本实施例中，终端设备10a与机器人10b之间可以是无线或有线连接。例如，终端设备10a设有信号输出接口，机器人10b设有相应的信号输入接口，通过USB线等数据传输线进行互联。或者，终端设备与10a机器人10b内部设有适配的无线通信模块，例如蓝牙模块，WIFI模块，网卡等，则终端设备10a与机器人10b可以通过无线通信模块实现无线连接。

本实施例中的终端设备10a具有人机交互功能，支持与用户交互，用户通过终端设备10a可以对机器人10b进行各种控制。例如，用户可以通过终端设备10a控制机器人10b开机、关机，控制机器人10b启动作业任务，调整机器人10b的作业方式，对机器人10b进行温控等等。

在本实施例中，终端设备10a包括一电子显示屏，用户可以通过电子显示屏与终端设备10a进行交互；终端设备10a可以在其电子显示屏上显示对机器人10b进行相关控制所需的界面，这样用户可以通过该界面向机器人10b发出各种操控指令，实现对机器人10b进行控制的目的。

本实施例中的机器人10b需要依赖一定机器模型工作。当然，根据应用场景和基本服务功能的不同，机器人10b所使用的机器模型也会有所不同。例如，机器人10b使用的机器模型可以是有监督的神经网络模型，也可以是有监督的其它机器模型。下面结合具体应用场景对机器模型进行举例说明：

例如，扫地机器人使用的机器模型可以包括物品识别类模型，用于识别工作环境中的桌椅、地毯、床柜等，还可以包括清扫模式识别模型，用于根据自适应切换清扫模式。又例如，跟随机器人使用的机器模型可以包括定位跟踪类模型，用于定位所需跟随目标的具体位置，跟随目标运动，还可以包括障碍物识别模型，用于进行障碍物识别以躲避障碍。又例如，迎宾机器人使用的机器模型可以包括人机对话模型，用于对人机对话状态以及对话状态之间的转移和动作等进行管理，以便于识别是否有人接近以及识别人的语音并能针对语音与人交流等。

在图1所示系统10中，终端设备10a和机器人10b相互配合，可以采用多种方式控制机器人10b进行模型更新。例如，在不同实施方式中，用户可通过终端设备10a对机器模型更新过程中的不同阶段进行主要控制，下面列举两种实施方式：

示例性实施方式A：用户通过终端设备10a为机器人10b选择模型训练所需的训练样本集，并通过终端设备10a控制机器人10b基于该训练样本集进行模型更新。

示例性实施方式B：用户通过终端设备10a配置模型训练所需的目标模型参数，并通过终端设备10a控制机器人10b基于该目标模型参数进行模型更新。

下面结合图1所示模型更新系统10，对示例性实施方式A进行说明：

如图2a所示，从终端设备10a角度进行描述，给出一示例性实施例A中的模型更新方法，包括：

S101：响应用户发出的更新触发操作，显示一配置界面，该配置界面显示机器人对应的标注数据集；

S102：响应用户发出的标注数据选择操作，从标注数据集中选择训练样本集；

S103：响应用户发出的训练操作，指示机器人根据训练样本集对机器人当前使用的机器模型训练得到新的机器模型。

如图2b所示，从机器人10b角度进行描述，给出一示例性实施例A中的模型更新方法，包括：

S201：接收终端设备发送的指示，根据该指示确定训练样本集，训练样本集是从机器人对应的标注数据集选择出的；

S202：根据训练样本集对机器人当前使用的机器模型训练得到新的机器模型。

在示例性实施方式A中，用户需要针对机器人使用的机器模型进行更新时，可以向终端设备发出更新触发操作。终端设备响应于用户发出的更新触发操作，显示一配置界面，在该配置界面上显示机器人对应的标注数据集。其中，配置界面可以为应用界面或者网页。其中，应用界面的实现形式可以为弹窗，悬浮窗，设置选项页面。

在本实施例中，用户发出更新触发操作的方式包括但不限于下述方式：

方式1：用户可以转动或翻转终端设备，终端设备监测到转动或翻转动作时，自动显示配置界面，并在显示界面上显示机器人对应的标注数据集。

方式2：用户利用手指在终端设备的电子显示屏上进行触控操作，例如在电子显示屏上画一个圆圈、对勾等，终端设备监测到触控操作时，自动显示配置界面，并在配置界面上显示机器人对应的标注数据集。

方式3：终端设备上设置物理按键，该物理按键被按下或被长按可触发模型更新。基于此，终端设备可以检测该物理按键是否被按下或被长按，当检测到物理按键被按下或长按时，可以自动显示配置界面，并在配置界面上显示机器人对应的标注数据集。

其中，终端设备在配置界面上显示机器人对应的标注数据集的实现方式可以包括但不限于以下几种方式：

第一种方式，终端设备显示配置界面之后，自动获取机器人对应的标注数据集，并显示在配置界面上。

第二种方式，终端设备显示配置界面之后，在该配置界面上显示一些控件，例如数据加载控件，设置控件、下拉框选项、页面设置选项等，用户通过点击数据加载控件或下拉框选项或页面设置选项等可以发出数据加载操作；终端设备可根据该数据加载操作，获取机器人对应的标注数据集并显示在配置界面上。

在一可选实施方式中，机器人获得标注数据集之后保存至本地，终端设备需要使用标注数据集时可实时向机器人请求。基于此，在上述两种方式中，终端设备在显示配置界面之后，可以自动向机器人发送数据请求，或者，可响应用户发出的数据加载操作向机器人发出数据请求，以请求获取标注数据集；然后，接收机器人根据该数据请求返回的标注数据集，进而将该标注数据集显示在配置界面上。

进一步，在上述终端设备向机器人请求标注数据集的实施方式中，机器人接收终端设备发送的数据请求，根据该数据请求确定终端设备是否具有访问权限，当确定终端设备具有访问权限时，向终端设备返回标注数据集。对终端设备来说，可接收机器人在确定终端设备具有访问权限时返回的标注数据集，并显示在配置界面上。

在另一可选实施方式中，机器人获得标注数据集之后，可以实时上传至终端设备，终端设备将机器人上传的标注数据集存储在本地。基于此，在上述两种方式中，终端设备在显示配置界面之后，自动从本地获取标注数据集，或者，可响应用户发出的数据加载操作从本地获取标注数据集，并显示在配置界面上。

针对上述第二种方式，如图2c所示，终端设备显示标注数据集的一种实施方式包括以下步骤：

S1101：用户发出更新触发操作，终端设备响应用户的更新触发操作，显示配置界面，该配置界面上显示有数据加载按钮；

S1102：用户点击配置界面上的数据加载按钮发出数据加载操作，终端设备响应于该数据加载操作，向机器人发出请求访问标注数据集的数据请求；

S1103：机器人接收终端设备发送的数据请求；

S1104：机器人判断终端设备是否具有访问权限；

S1105：当判断出终端设备具有访问权限时，机器人向终端设备发送标注数据集；

S1106：终端设备接收机器人在确定终端设备具有访问权限时返回的标注数据集，并显示在配置界面上。

进一步，机器人判断终端设备是否具有访问权限包括：在触控板上显示确认页面，以供用户确定是否允许终端设备访问标注数据集。显示确认页面上可以附带终端设备的ID、设备型号、设备拥有者信息，使得用户通过查看上述信息判断终端设备是否具有访问权限。若用户允许终端设备访问标注数据集，可以点击确认页面上的“确认”或“是”等按钮，以发出确认指令。机器人响应用户发出的确认指令，确定终端设备具有访问权限，进而向终端设备返回标注数据集。

需要说明的是，在一示例性实施例中，当确定终端设备不具有访问权限时，机器人可以拒绝终端设备的数据请求。例如，机器人向终端设备发送拒绝消息，终端设备在配置界面上展示拒绝消息，以提醒用户机器人拒绝了数据请求。

无论采用上述何种方式，终端设备在配置界面上显示标注数据集之后，用户可以在终端设备显示的配置界面上执行标注数据选择操作，从标注数据集中选取进行模型训练所需的训练样本集。该训练样本集是标注数据集的子集或全集。

其中，标注数据集包括模型更新相关的数据和数据的标注结果。根据机器人的应用场景的不同，模型更新相关的数据会有所不同，亦即机器人对应的标注数据集也会有所不同。假设需要更新的机器模型与机器人所处工作环境相关，则模型更新相关的数据可以是机器人在工作过程中采集到的环境数据；相应地，标注数据集可以是机器人或终端设备利用机器人当前使用的机器模型对收集到的其工作环境的环境数据进行标注得到的。

本实施例提供的机器人可以是扫地机器人，擦玻璃机器人，跟随机器人、迎宾机器人等可自动执行工作的机器装置。机器人上安装有传感器，传感器可用来收集机器人所处工作环境中的环境数据。例如，在机器人工作过程中，机器人上的传感器可自动收集机器人工作环境中的环境数据。这里的环境数据可以包含任何能够体现机器人工作环境的数据，例如可以包含视觉传感器采集到的环境图像，也可以包括激光雷达传感器采集到的周围障碍物的信息等。值得说明的是，机器人上可以设置一个或者多个不同类型的传感器。

例如，对于扫地机器人来说，可以采集厨房、客厅、卫生间、卧室等工作环境中的环境数据，这些环境数据可以包括：客厅、厨房、卫生间、卧室等各区域的面积，环境中的障碍物(例如桌椅，床柜，地毯等)以及障碍物的位置，地面干湿程度等。例如，扫地机器人上设置摄像头采集机器人工作环境的图像，以便获取各区域的面积，还可以设置激光雷达传感器采集机器人工作环境中的障碍物及障碍物的位置等数据，也可以设置湿度传感器采集地面的干湿程度等数据。在获得环境数据之后，扫地机器人可以利用当前使用的机器模型对这些环境数据进行标注，从而得到标注数据集。标注数据集中包括环境数据以及环境数据的标注结果(可简称为标签)。其中，可以将收集到的环境数据输入机器人当前使用的机器模型进行模型计算得到输出结果，该输出结果即为环境数据的标注结果。值得说明的是，根据机器模型的不同，标注结果也会有所不同。如果机器模型是分类模型，则标注结果是环境数据所属的类别；如果机器模型是判别类模型，则标注结果为“是”或“否”的结果。在本实施例中，利用机器人当前使用的机器模型对收集到的环境数据进行自动标注，有利于提高数据的标注效率。值得说明的是，上述标注过程也可以由用户手动标注。

在实际应用中，用户使用扫地机器人清扫客厅的过程中，发现扫地机器人无法避开客厅中放置的茶几、电视柜等物件，为了提高机器模型识别准确度，可以对扫地机器人当前使用的机器模型进行更新，以获得能够解决客厅清扫中存在的问题的新的机器模型。在该情况下，用户可以从标注数据集中选择与客厅环境相关的标注数据形成训练样本集并控制机器人基于该训练样本进行模型训练。显然，标注数据集并不限于上述的按照环境区域进行分类，还可以按照地面状况进行分类，比如，可以分为瓷砖、地板、地毯等类别的标注数据。针对数据集中不同类型的标注数据，用户可以根据机器人在实际使用过程中存在的问题有选择的形成训练样本集，这有利于提高新模型的精度，减少模型训练的样本数，提高模型训练的效率。

对终端设备来说，可响应于用户发出的标注数据选择操作，从标注数据集中选择训练样本集，然后响应用户发出的训练操作，以指示机器人根据该训练样本集对机器人当前使用的机器模型继续训练得到新的机器模型。可选地，终端设备可以在配置界面上显示训练按钮、选项等控件，以供用户发出训练操作。用户可以点击训练按钮、选项等控件发出训练操作。

本实施例中，终端设备响应用户发出的训练操作，指示机器人根据训练样本集对机器人当前使用的机器模型训练得到新的机器模型包括但不限于下述方式：

方式一：终端设备响应用户发出的训练操作，向机器人发送训练指令，指示机器人根据训练样本集对机器人当前使用的机器模型训练得到新的机器模型。

在方式一中，终端设备可以仅向机器人发送训练模型的训练指令，该训练指令可以携带有指向训练样本集的信息，例如可以携带训练样本集的标识信息，或者携带有训练样本集中各训练样本的标识信息。对机器人而言，接收终端设备发送的指示，根据所述指示确定训练样本集包括：接收终端设备发送的训练指令，机器人根据训练指令中携带的标识信号或者训练样本集中各训练样本的标识信息，从标注数据集中确定出训练模型所需的训练样本集，根据训练样本集对机器人当前使用的机器模型继续训练得到新的机器模型。

方式二：终端设备响应用户发出的训练操作，向机器人发送训练样本集，指示机器人根据训练样本集对机器人当前使用的机器模型训练得到新的机器模型。

在方式二中，终端设备可以向机器人发送训练模型的训练样本集，在本实施例中，终端设备从标注数据集中选择出的训练样本集存储在终端设备。对机器人而言，接收终端设备发送的指示，根据所述指示确定训练样本集包括：接收终端设备发送的训练样本集，在成功接收训练样本集后，根据该训练样本集对机器人当前使用的机器模型继续训练得到新的机器模型。需要说明的是，机器人在成功接收到训练样本集后，可以经过一段时间的时间间隔，再进行模型的训练，或者，也可以在成功接收到训练样本集后即可进行模型训练，或者，机器人也可以在接收到用户发出的语音指令之后再进行模型训练，或者，机器人也可以在接收到终端设备在发送训练样本集之后再次发送的训练模型的指令时，再进行模型训练。

方式三：终端设备响应用户发出的训练操作，向机器人发送训练样本集和训练指令，指示机器人根据训练样本集对机器人当前使用的机器模型训练得到新的机器模型。

在方式三中，终端设备可以向机器人发送训练样本集和训练指令，在本实施例中，终端设备从标注数据集中选择出的训练样本集存储在终端设备。对机器人而言，接收终端设备发送的指示，根据所述指示确定训练样本集包括：接收终端设备发送的训练样本集和训练指令，并在成功接收训练样本集之后，机器人执行训练指令根据训练样本集对机器人当前使用的机器模型继续训练得到新的机器模型。

本申请实施例，用户针对性的选择训练样本集对机器模型进行训练，灵活性更强，可显著提高机器人模型更新的效率，也可以提高机器模型的结果精度。

在一可选实施例中，用户除了通过终端设备选择训练样本集之外，还可以通过终端设备配置模型训练过程中的模型参数。如图2d所示，该方法包括如下步骤：

S1011：响应用户发出的更新触发操作，显示一配置界面，该配置界面显示机器人对应的标注数据集和至少一个模型参数；

S1012：响应用户发出的标注数据选择操作，从标注数据集中选择训练样本集。

S1013：响应用户发出的参数选择操作，从至少一个模型参数中选择目标模型参数；

S1014：响应于用户发出的训练操作，将训练样本集和目标模型参数发送给机器人，以供机器人根据目标模型参数和训练样本集对机器人当前使用的机器模型训练得到新的机器模型。

首先说明，本实施例并不限定步骤S1012和步骤S1013之间的执行顺序，可如图2d所示先执行S1012，再执行S1013，也可以先执行S1013，再执行S1012。

在本实施例中，终端设备响应用户发出的更新触发操作，一方面在配置界面上显示机器人对应的标注数据集，另一方面在配置界面上显示至少一个模型参数。关于在配置界面上显示机器人对应的标注数据集的实施方式可参见前述实施例中的描述，在此不再赘述。关于在配置界面上显示至少一个模型参数：终端设备可以预先在本地存储与机器人使用的机器模型相关的至少一个模型参数，当用户发出更新触发操作时，终端设备可以直接从本地获取至少一个模型参数并显示在配置界面上；或者，也可以实时从服务器获取至少一个模型参数并显示在配置界面上。

其中，这些模型参数是与模型训练相关的一些参数，例如可以包括机器模型的类型和相应类型下的超参数。机器模型的类型与机器人的功能相关，例如与扫地机器人、跟随机器人、陪护机器人等适配的机器模型的类型会有所不同。超参数包括学习速率，迭代次数，模型层数，每层神经元的个数等。用户可通过终端设备选择自己需要的模型参数，选择不同模型参数训练得到的机器模型会有所不同。这里的不同既包括模型属性的不同，也包括模型效果的不同。

在本实施例中，并不限定配置界面的样式，凡是可以展示标注数据集和至少一个模型参数的界面样式均适用于本申请实施例。例如，一种配置界面的样式如图2e所示。在图2e所示配置界面的上部显示有标注数据集，中部显示有至少一个模型参数，下部显示有“训练模型”按钮和“同步模型”等按钮。值得说明的是，图2e仅为配置界面的一种样式示例，配置界面的样式并不限于图2e所示。

可选地，用户可以通过配置界面发出参数选择操作。终端设备响应用户发出的参数选择操作，向用户展示配置模型参数的界面(简称为配置模型)，如图2f所示，该配置模型参数界面上显示有至少一个模型参数，如参数1，参数2，参数3，……，参数n，还显示有“修改”控件。用户可以通过“修改”控件，从参数1-参数n中选择所需的目标模型参数。

在本申请上述或者下述实施例中，响应用户发出的标注数据选择操作，从标注数据集中选择训练样本集之前，还包括：响应用户发出的数据加载操作，向机器人发送数据请求；机器人判断终端设备是否具有访问权限，当终端设备具有访问权限时，机器人向终端设备发送标注数据集；接收机器人在确定终端设备具有访问权限时返回的标注数据集，并显示在配置界面上。关于机器人判断终端设备是否具有访问权限在上述实施例中，已做出详细描述，在此不再赘述。

在本申请上述或者下述实施例中，用户还可以通过配置界面查看标注数据集，并且可以对标注数据集进行修改。基于此，终端设备在响应用户发出的标注数据选择操作，从标注数据集中选择训练样本集之前，还包括：响应用户发出的修正操作，确定标注数据集中与修正操作关联的标注数据，并对标注数据进行修正。

可选地，终端设备可以在配置界面上显示相应的控件、下拉框选项或者页面设置选项等，供用户发出查看指令或修改指令；然后，向用户展示图2g所示的查看/修正数据集的界面，以供用户发出查看/修正操作。在图2g所示的界面上，显示有标注数据集以及修正相关的控件，如“修改”控件和“删除”控件；终端设备响应于用户对标注数据的选择操作和对修正控件的触发操作，可以确定与修正操作关联的标注数据，进而对该标注数据进行修正。这里的修正包括修改错误数据，修改错误标签，删除错误数据及其标签等。当然，除了通过配置界面发出查看指令或修改指令之外，用户也可以通过语音等方式通过终端设备向机器人发出查看指令或修改指令。值得说明的是，无论用户是以哪种方式发出的修改指令，修改指令中可以携带待修改数据的指示信息，例如可以是数据编号、名称等。

在一可选实施例中，用户通过终端设备控制机器人进行模型训练，这样机器人可以获得新的机器模型。机器人在获得新的机器模型之后，用户还可以通过终端设备控制机器人进行模型更新，即终端设备在向机器人发送训练指令之后，还可响应用户发出的更新操作，向机器人发送更新指令，以指示机器人将机器人当前使用的机器模型替换为新的机器模型。

值得说明的是，终端设备向机器人发送更新指令并非必选的操作，机器人可以在模型训练完成后，也可以自行确定是否进行模型的更新操作以替换当前的机器模型，而无需用户控制。例如，机器人可响应于模型更新周期到达的事件，自动将当前使用的机器模型替换为新的机器模型。可选地，在机器人内部设置模型更新周期，例如，每隔3天、5天，或者每周一、周五等，这样每当模型更新周期到达时，机器人就自动将当前使用的机器模型替换为新的机器模型。

下面结合图1所示模型更新系统10，对示例性实施方式B进行说明：

如图3a所示，从终端设备10a角度进行描述，一示例性实施例B中的模型更新方法，包括：

S301：响应用户发出的更新触发操作，显示一配置界面，配置界面显示至少一个模型参数；

S302：响应用户发出的参数选择操作，从至少一个模型参数中选择目标模型参数；

S303:响应用户发出的训练操作，向机器人发送目标模型参数，以供机器人根据目标模型参数对机器人当前使用的机器模型训练得到新的机器模型。

如图3b所示，从机器人10b角度，图中给出一示例性实施例B中的模型更新方法，包括：

S401：接收终端设备发送的目标模型参数，目标模型参数是从至少一个模型参数中选择出的；

S402：根据目标模型参数对机器人当前使用的机器模型训练以得到新的机器模型。

在示例性实施方式B中，用户需要针对机器人使用的机器模型进行更新时，可以向终端设备发出更新触发操作。终端设备响应于用户发出的更新触发操作，显示一配置界面，在该配置界面上显示有模型参数，其中，配置界面可以为应用界面或者网页，其中，应用界面的实现形式可以为弹窗，悬浮窗，设置选项页面。

关于用户发出更新触发操作的方式在示例性实施方式A中已有详细描述，在此不再赘述。

其中，终端设备在配置界面上显示模型参数的实现方式可以包括但不限于以下几种方式：

第一种方式，终端设备显示配置界面之后，自动获取模型参数，并显示在配置界面上。

第二种方式，终端设备显示配置界面之后，在该配置界面上显示一些控件，例如模型加载控件，设置控件、下拉框选项、页面设置选项等，用户通过点击模型加载控件或下拉框选项或页面设置选项等可以发出模型加载操作；终端设备可根据该模型加载操作，获取模型参数并显示在配置界面上。

值得说明的是，模型参数可存储在终端设备本地，也可以存储在服务器中。若模型参数可存储在服务器中，终端设备需要使用模型参数时可实时向服务器请求。基于此，在上述两种方式中，终端设备在显示配置界面之后，可以自动向服务器人发送参数请求，或者，可响应用户发出的模型加载操作向服务器发出参数请求，以请求获取模型参数；然后，接收服务器根据该参数请求返回的模型参数，进而将该模型参数显示在配置界面上。

终端设备在配置界面上显示模型参数之后，用户可以在终端设备显示的配置界面上执行模型参数选择操作，从标注数据集中选取进行模型训练所需的目标模型参数。该目标模型参数是模型参数的子集或全集。

需要说明的是，用户可通过终端设备选择自己需要的模型参数。这里的模型参数主要包括：机器模型的类型和相应类型下的超参数。机器模型的类型与机器人的功能相关，例如与扫地机器人、跟随机器人、陪护机器人等适配的机器模型的类型会有所不同。超参数包括学习速率，迭代次数，模型层数，每层神经元的个数等。例如，用户需要对扫地机器人进行模型训练时，通过终端设备的配置界面选择与扫地机器人匹配的模型类型和相应的超参数。

对终端设备来说，可响应于用户发出的模型参数选择操作，从模型参数中选择目标模型参数，然后响应用户发出的训练操作，向机器人发送目标模型参数，以指示机器人根据目标模型参数对机器人当前使用的机器模型继续训练得到新的机器模型。可选地，终端设备可以在配置界面上显示训练按钮、选项等控件，以供用户发出训练操作。用户可以点击训练按钮、选项等控件发出训练操作。

在一可选实施例中，终端设备可以仅向机器人发送训练模型的指令，并将目标模型参数携带在训练模型的指令中一并发送给机器人。对机器人而言，可接收终端设备发送的训练模型的指令，并从该指令中解析出目标模型参数，之后，根据目标模型参数对机器人当前使用的机器模型继续训练得到新的机器模型。

在另一可选实施例中，终端设备向机器人发送目标模型参数。对机器人而言，接收目标模型参数，当成功接收目标模型参数之后，根据目标模型参数对机器人当前使用的机器模型继续训练得到新的机器模型。需要说明的是，机器人在成功接收到机器模型后，可以经过一段时间的时间间隔，再进行模型的训练，或者，也可以在成功接收到训练样本集后即可进行模型训练，或者，机器人也可以在接收到用户发出的语音指令之后再进行模型训练，或者，机器人也可以在接收到终端设备在发送训练样本集之后发送的训练模型的指令时，再进行模型训练。

值得说明的是，用户除了可以通过终端设备配置模型训练过程中的模型参数之外，还可以通过终端设备选择模型训练所需的训练样本集。其中，用户通过终端设备配置模型参数和选择训练样本集，以控制机器人按照用户选择出的目标模型参数根据训练样本集对其当前使用的机器模型继续训练得到新的机器模型的过程可参见图2d所示实施例的描述，在此不再赘述。

另外，关于其它一些可选操作的描述，也可以前述实施例中的描述，在此不再赘述。

本申请实施例，用户针对性的选择模型参数对机器模型进行训练，灵活性更强，可显著提高机器人模型更新的效率，也可以提高机器模型的结果精度。

图4为本申请示例性实施例提供的另一种模型更新系统的结构示意图。如图4所示，该系统20包括：终端设备20a、机器人20b以及服务器20c。

在本实施例中，终端设备20a是指用户使用的，具有用户所需的计算、上网、通信等功能的计算机设备，其实现形式可以有多种，例如可以是智能手机、个人电脑、穿戴设备、平板电脑等。

机器人20b除了具有基础服务功能之外，还可以具有计算、通信、上网等功能。根据应用场景的不同，机器人20b的基础服务功能也会有所不同。例如，对应用于家庭、办公楼、商场等场景中的扫地机器人20b而言，其基本服务功能是对所在场景中的地面进行清扫；对应用于家庭、办公楼、商场等场景中的擦玻璃机器人20b而言，其基本服务功能是对所在场景中玻璃进行清洁；对跟随机器人20b而言，其基本服务功能是跟随目标对象；对迎宾机器人20b而言，其基本服务功能是欢迎顾客，并引导顾客到达目的地。

终端设备20a可与机器人20b通信连接，主要对机器人20b进行各种控制，例如控制机器人10b进行机器模型更新。在本实施例中，终端设备20a与机器人20b之间可以是无线或有线连接。例如，终端设备20a设有信号输出接口，机器人20b设有相应的信号输入接口，通过USB线等数据传输线进行互联。或者，终端设备与20a机器人20b内部设有适配的无线通信模块，例如蓝牙模块，WIFI模块，网卡等，则终端设备20a与机器人20b可以通过无线通信模块实现无线连接。

本实施例中的终端设备20a具有人机交互功能，支持与用户交互，用户通过终端设备20a可以对机器人20b进行各种控制。例如，用户可以通过终端设备20a控制机器人20b开机、关机，控制机器人20b启动作业任务，调整机器人20b的作业方式，对机器人20b进行温控等等。

在本实施例中，终端设备20a包括一电子显示屏，用户可以通过电子显示屏与终端设备20a进行交互；终端设备20a可以在其电子显示屏上显示对机器人20b进行相关控制所需的界面，用户通过该界面向机器人20b发出各种操控指令，实现对机器人20b进行控制的目的。

本实施例中的机器人20b需要依赖一定机器模型工作。当然，根据应用场景和基本服务功能的不同，机器人20b所使用的机器模型也会有所不同。例如，机器人20b使用的机器模型可以是有监督的神经网络模型，也可以是有监督的其它机器模型。下面结合具体应用场景对机器模型进行举例说明：

服务器20c可与机器人20b和终端设备20a通信连接，主要为机器人20b提供数据支持、计算服务以及一些管理服务，并可与终端设备20a配合完成对机器人20b的一些控制，例如可以模型更新控制。在本实施例中，并不限定服务器20c的实现形态，例如服务器20c可以是常规服务器、云服务器、云主机、虚拟中心等服务器设备。其中，服务器20c设备的构成主要包括处理器、硬盘、内存、系统总线等，和通用的计算机架构类型。

其中，机器人、20b服务器20c和终端设备20a彼此之间可以是无线或有线连接。可选地，机器人20b、服务器20c和终端设备20a之间可以采用WIFI、蓝牙、红外等方式建立通信连接。或者，机器人20b、服务器20c和终端设备20a之间也可以通过移动网络建立通信连接。其中，移动网络的网络制式可以为2G(GSM)、2.5G(GPRS)、3G(WCDMA、TD-SCDMA、CDMA2000、UTMS)、4G(LTE)、4G+(LTE+)、WiMax等中的任意一种。

在图4所示系统20中，终端设备20a、机器人20b和服务器20c之间相互配合，可采用多种方式控制机器人20b进行模型更新。例如，在不同实施方式中，用户可通过终端设备20a对机器模型更新过程中的不同阶段进行主要控制，下面列举两种实施方式：

示例性实施方式C：用户通过终端设备20a为机器人20b选择模型训练所需的训练样本集，并控制服务器20c基于该训练样本集为机器人20b进行模型更新。

示例性实施方式D：用户通过终端设备20a配置模型训练所需的目标模型参数，并控制服务器20c基于该目标模型参数为机器人20b进行模型更新。

需要说明的是，上述两种示例性实施方式中，机器人20b对收集到的与模型更新相关的数据自动标注，获得标注数据集，则用户通过终端设备20a可以从机器人20b获取标注数据集。机器人20b也可以将标注数据集发送至服务器20c，或者机器人20b将采集的数据发送至服务器20c，服务器20c对数据标注形成标注数据集，则用户通过终端设备20a从服务器20c获取标注数据集。下面实施例均基于用户通过终端设备20a从服务器获20c获取标注数据集为例进行说明。

下面结合图4所示模型更新系统20，对示例性实施方式C进行说明：

如图5a所示，从终端设备20a角度进行描述，给出一示例性实施例C中的模型更新方法，包括：

S501：响应用户发出的更新触发操作，显示一配置界面，配置界面显示机器人对应的标注数据集；

S502：响应用户发出的标注数据选择操作，从标注数据集中选择训练样本集；

S503：响应用户发出的训练操作，指示服务器根据训练样本集对机器人当前使用的机器模型训练得到新的机器模型。

如图5b所示，从服务器20c角度进行描述，给出一示例性实施例C中的模型更新方法，包括：

S601：接收终端设备发送的训练指示，根据该指示确定训练样本集，训练样本集是从机器人对应的标注数据集选择出的；

S602：根据训练样本集对机器人当前使用的机器模型训练得到新的机器模型。

在示例性实施方式C中，用户需要针对机器人使用的机器模型进行更新时，可以向终端设备发出更新触发操作。终端设备响应于用户发出的更新触发操作，显示一配置界面，在该配置界面上显示机器人对应的标注数据集。其中，配置界面可以为应用界面或者网页。其中，应用界面的实现形式可以为弹窗，悬浮窗，设置选项页面。

在一可选实施方式中，机器人获得标注数据集之后上传至服务器，终端设备需要使用标注数据集时可实时向服务器请求。基于此，在上述两种方式中，终端设备在显示配置界面之后，可以自动向服务器发送数据请求，或者，可响应用户发出的数据加载操作向服务器发出数据请求，以请求获取标注数据集；然后，接收服务器根据该数据请求返回的标注数据集，进而将该标注数据集显示在配置界面上。

进一步，在上述终端设备向机器人请求标注数据集的实施方式中，服务器接收终端设备发送的数据请求，根据该数据请求确定终端设备是否具有访问权限，当确定终端设备具有访问权限时，向终端设备返回标注数据集。对终端设备来说，可接收服务器在确定终端设备具有访问权限时返回的标注数据集，并显示在配置界面上。

在另一可选实施方式中，服务器获得标注数据集之后，可以实时下发至终端设备，终端设备将服务器下发的标注数据集存储在本地。基于此，在上述两种方式中，终端设备在显示配置界面之后，自动从本地获取标注数据集，或者，可响应用户发出的数据加载操作从本地获取标注数据集，并显示在配置界面上。

针对上述第二种方式，如图5c所示，终端设备显示标注数据集的一种实施方式包括以下步骤：

S2101：用户发出更新触发操作，终端设备响应用户的更新触发操作，显示配置界面，该配置界面上显示有数据加载按钮；

S2102：用户点击配置界面上的数据加载按钮发出数据加载操作，终端设备响应于该数据加载操作，向服务器发出请求访问标注数据集的数据请求；

S2103：服务器接收终端设备发送的数据请求；

S2104：服务器判断终端设备是否具有访问权限；

S2105：当判断出终端设备具有访问权限时，服务器向终端设备发送标注数据集；

S2106：终端设备接收服务器在确定终端设备具有访问权限时返回的标注数据集，并显示在配置界面上。

进一步，服务器判断终端设备是否具有访问权限包括：服务器预先存储合法终端设备的标识，当接收到数据请求时，可以将数据请求中携带的终端设备的标识与合法终端设备的标识进行匹配；若数据请求中携带的终端设备的标识在合法终端设备的标识中，则确定发起数据请求的终端设备具有访问权限，进而向终端设备返回标注数据集。

需要说明的是，在一示例性实施例中，当确定终端设备不具有访问权限时，服务器可以拒绝终端设备的数据请求。例如，服务器向终端设备发送拒绝消息，终端设备在配置界面上展示拒绝消息，以提醒用户机器人拒绝了数据请求。

终端设备在配置界面上显示标注数据集之后，用户可以在终端设备显示的配置界面上执行标注数据选择操作，从标注数据集中选取进行模型训练所需的训练样本集。该训练样本集是标注数据集的子集或全集。

其中，标注数据集包括模型更新相关的数据和数据的标注结果。根据机器人的应用场景的不同，模型更新相关的数据会有所不同，亦即机器人对应的标注数据集也会有所不同。假设需要更新的机器模型与机器人所处工作环境相关，则模型更新相关的数据可以是机器人在工作过程中采集到的环境数据；相应地，标注数据集可以是利用机器人当前使用的机器模型对收集到的其工作环境的环境数据进行标注得到的。

例如，对于扫地机器人来说，可以采集厨房、客厅、卫生间、卧室等工作环境中的环境数据，这些环境数据可以包括：客厅、厨房、卫生间、卧室等各区域的面积，环境中的障碍物(例如桌椅，床柜，地毯等)以及障碍物的位置，地面干湿程度等。例如，扫地机器人上设置摄像头采集机器人工作环境的图像，以便获取各区域的面积，还可以设置激光雷达传感器采集机器人工作环境中的障碍物及障碍物的位置等数据，也可以设置湿度传感器采集地面的干湿程度等数据。在获得环境数据之后，扫地机器人可以利用当前使用的机器模型对这些环境数据进行标注，从而得到标注数据集；然后将标注数据集上传至服务器。

在实际应用中，用户使用扫地机器人清扫客厅的过程中，发现扫地机器人无法避开客厅中放置的茶几、电视柜等物件，为了提高机器模型识别准确度，可以对扫地机器人当前使用的机器模型进行更新，以获得能够解决客厅清扫中存在的问题的新的机器模型。

在该情况下，用户可以从标注数据集中选择与客厅环境相关的标注数据形成训练样本集并控制机器人基于该训练样本进行模型训练。显然，标注数据集并不限于上述的按照环境区域进行分类，还可以按照地面状况进行分类，比如，可以分为瓷砖、地板、地毯等类别的标注数据。针对数据集中不同类型的标注数据，用户可以根据机器人在实际使用过程中存在的问题有选择的形成训练样本集，这有利于提高新模型的精度，减少模型训练的样本数，提高模型训练的效率。

对终端设备来说，可响应于用户发出的标注数据选择操作，从标注数据集中选择训练样本集，然后响应用户发出的训练操作，指示服务器根据该训练样本集对机器人当前使用的机器模型继续训练得到新的机器模型。可选地，终端设备可以在配置界面上显示训练按钮、选项等控件，以供用户发出训练操作。用户可以点击训练按钮、选项等控件发出训练操作。

本实施例中，终端设备响应用户发出的训练操作，指示服务器根据训练样本集对机器人当前使用的机器模型训练得到新的机器模型包括但不限于下述方式：

方式一：终端设备响应用户发出的训练操作，向服务器发送训练指令，指示服务器根据训练样本集对机器人当前使用的机器模型训练得到新的机器模型。

在方式一中，终端设备可以仅向服务器发送训练模型的训练指令，该训练指令可以携带有指向训练样本集的信息，例如可以携带训练样本集的标识信息，或者携带有训练样本集中各训练样本的标识信息。对服务器而言，接收终端设备发送的指示，根据所述指示确定训练样本集包括：接收终端设备发送的训练指令，服务器根据训练指令中携带的标识信号或者训练样本集中各训练样本的标识信息，从标注数据集中确定出训练模型所需的训练样本集，根据训练样本集对机器人当前使用的机器模型继续训练得到新的机器模型。

方式二：终端设备响应用户发出的训练操作，向服务器发送训练样本集，指示服务器根据训练样本集对机器人当前使用的机器模型训练得到新的机器模型。

在方式二中，终端设备可以向服务器发送训练模型的训练样本集，在本实施例中，终端设备从标注数据集中选择出的训练样本集存储在终端设备。对服务器而言，接收终端设备发送的指示，根据所述指示确定训练样本集包括：可接收终端设备发送的训练样本集，在成功接收训练样本集后，根据该训练样本集对机器人当前使用的机器模型继续训练得到新的机器模型。需要说明的是，服务器在成功接收到训练样本集后，可以经过一段时间的时间间隔，再进行模型的训练，或者，也可以在成功接收到训练样本集后即可进行模型训练，或者，服务器也可以在接收到用户发出的语音指令之后再进行模型训练，或者，服务器也可以在接收到终端设备在发送训练样本集之后再次发送的训练模型的指令时，再进行模型训练。

方式三：终端设备响应用户发出的训练操作，向服务器发送训练样本集和训练指令，指示服务器根据训练样本集对机器人当前使用的机器模型训练得到新的机器模型。

在方式三中，终端设备可以向服务器发送训练样本集和训练指令，在本实施例中，终端设备从标注数据集中选择出的训练样本集存储在终端设备。对服务器而言，接收终端设备发送的指示，根据所述指示确定训练样本集包括：接收训练样本集和训练指令，并在成功接收训练样本集之后，服务器执行训练指令根据训练样本集对机器人当前使用的机器模型继续训练得到新的机器模型。

在一可选实施例中，用户除了通过终端设备选择训练样本集之外，还可以通过终端设备配置模型训练过程中的模型参数。如图5d所示，该方法包括如下步骤：

S2011：响应用户发出的更新触发操作，显示一配置界面，该配置界面显示机器人对应的标注数据集和至少一个模型参数；

S2012：响应用户发出的标注数据选择操作，从标注数据集中选择训练样本集。

S2013：响应用户发出的参数选择操作，从至少一个模型参数中选择目标模型参数；

S2014：响应于用户发出的训练操作，将训练样本集和目标模型参数发送给服务器，以供服务器根据目标模型参数和训练样本集对机器人当前使用的机器模型训练得到新的机器模型。

首先说明，本实施例并不限定步骤S2012和步骤S2013之间的执行顺序，可如图5d所示先执行S2012，再执行S2013，也可以先执行S2013，再执行S2012。

在本实施例中，并不限定配置界面的样式，凡是可以展示标注数据集和至少一个模型参数的界面样式均适用于本申请实施例。例如，一种配置界面的样式如图2e所示，相关描述参见前述实施例。

可选地，用户可以通过配置界面发出参数选择操作。终端设备响应用户发出的参数选择操作，向用户展示配置模型参数的界面(简称为配置模型)，如图2f所示，相关描述参见前述实施例。

可选地，终端设备可以在配置界面上显示相应的控件、下拉框选项或者页面设置选项等，供用户发出查看指令或修改指令；然后，向用户展示图2g所示的查看/修正数据集的界面，以供用户发出查看/修正操作，相关描述参见前述实施例。

在一可选实施例中，用户通过终端设备控制服务器进行模型训练，这样可以获得新的机器模型。服务器在获得新的机器模型之后，用户还可以向终端设备发出更新操作，终端设备响应用户发出的更新操作，控制服务器将新的机器模型下发至机器人，以使机器人将当前使用的机器模型替换为新的机器模型。

下面结合图4所示模型更新系统20，对示例性实施方式D进行说明。

如图6a所示，从终端设备20a角度进行描述，一示例性实施例D中的模型更新方法，包括：

S701：响应用户发出的更新触发操作，显示一配置界面，配置界面显示至少一个模型参数，

S702：响应用户发出的参数选择操作，从至少一个模型参数中选择目标模型参数；

S703:响应用户发出的训练操作，向服务器发送目标模型参数，以供服务器根据目标模型参数对机器人当前使用的机器模型训练得到新的机器模型。

如图6b所示，从服务器20c角度进行描述，一示例性实施例D中的模型更新方法，包括：

S801：接收终端设备发送的目标模型参数，目标模型参数是从至少一个模型参数中选择出的；

S802：根据目标模型参数对机器人当前使用的机器模型训练以得到新的机器模型。

在示例性实施方式D中，用户需要针对机器人使用的机器模型进行更新时，可以向终端设备发出更新触发操作。终端设备响应于用户发出的更新触发操作，显示一配置界面，在该配置界面上显示有模型参数，其中，配置界面可以为应用界面或者网页，其中，应用界面的实现形式可以为弹窗，悬浮窗，设置选项页面。

关于用户发出更新触发操作的方式在示例性实施方式C中已有详细描述，在此不再赘述。

对终端设备来说，可响应于用户发出的模型参数选择操作，从模型参数中选择目标模型参数，然后响应用户发出的训练操作，向服务器发送目标模型参数，以指示服务器根据目标模型参数对机器人当前使用的机器模型继续训练得到新的机器模型。可选地，终端设备可以在配置界面上显示训练按钮、选项等控件，以供用户发出训练操作。用户可以点击训练按钮、选项等控件发出训练操作。

在一可选实施例中，终端设备可以向服务器发送训练模型的指令，并将目标模型参数携带在训练模型的指令中一并发送给服务器。对服务器而言，可接收终端设备发送的训练模型的指令，并从该指令中解析出目标模型参数，之后，根据目标模型参数对机器人当前使用的机器模型继续训练得到新的机器模型。

在另一可选实施例中，终端设备可以仅向服务器发送目标模型参数。对服务器而言，接收目标模型参数，并在成功接收目标模型参数之后，根据目标模型参数对机器人当前使用的机器模型继续训练得到新的机器模型。需要说明的是，服务器在成功接收到机器模型后，可以经过一段时间的时间间隔，再进行模型的训练，或者，也可以在成功接收到训练样本集后即可进行模型训练，或者，服务器也可以在接收到用户发出的语音指令之后再进行模型训练，或者，服务器也可以在接收到终端设备在发送训练样本集之后发送的训练模型的指令时，再进行模型训练。

值得说明的是，用户除了可以通过终端设备配置模型训练过程中的模型参数之外，还可以通过终端设备选择模型训练所需的训练样本集。其中，用户通过终端设备配置模型参数和选择训练样本集，以控制服务器按照用户选择出的目标模型参数根据训练样本集对机器人当前使用的机器模型继续训练得到新的机器模型的过程可参见图5d所示实施例的描述，在此不再赘述。

图7为本申请一示例性实施例提供的一种终端设备的结构示意图。如图7所示，该终端包括：电子显示屏701、、处理器702存储器703以及通信组件704。

电子显示屏701，用于显示配置界面。

其中，电子显示屏701包括液晶显示器(LCD)和触摸面板(TP)。如果电子显示屏包括触摸面板，电子显示屏可以被实现为触摸屏，以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。触摸传感器可以不仅感测触摸或滑动动作的边界，而且还检测与触摸或滑动操作相关的持续时间和压力。

存储器703，用于存储计算机程序，并可被配置为存储其它各种数据以支持在终端设备上的操作。这些数据的示例包括用于在终端设备上操作的任何应用程序或方法的指令，标注数据集等。

其中，存储器703中可以存储不同的计算机程序，这样处理器可以执行不同计算机程序，采用不同的方式控制机器人进行模型更新。

在方式1中，存储器703中存储第一计算机程序，处理器702可以执行第一计算机程序，可用于：

响应用户发出的更新触发操作，在电子显示屏上显示一配置界面，配置界面显示机器人对应的标注数据集；响应用户发出的标注数据选择操作，从标注数据集中选择训练样本集；响应用户发出的训练操作指示模型训练设备根据训练样本集对机器人当前使用的机器模型继续训练得到新的机器模型。

可选地，处理器702还用于：响应所述用户发出的训练操作，指示所述模型训练设备根据所述训练样本集对所述机器人当前使用的机器模型训练得到新的机器模型，包括以下至少一种操作：响应所述用户发出的训练操作，向模型训练设备发送训练指令，以指示所述模型训练设备根据所述训练样本集对所述机器人当前使用的机器模型训练得到新的机器模型；响应所述用户发出的训练操作，向所述模型训练设备发送所述训练样本集，以指示所述模型训练设备根据所述训练样本集对所述机器人当前使用的机器模型训练得到新的机器模型；响应所述用户发出的训练操作，向所述模型训练设备发送所述训练样本集和训练指令，以指示所述模型训练设备根据所述训练样本集对所述机器人当前使用的机器模型训练得到新的机器模型。

进一步可选地，处理器702还用于：在配置界面上显示至少一个模型参数；响应用户发出的参数选择操作，从至少一个模型参数中选择目标模型参数；通过通信组件将目标模型参数发送给模型训练设备，以供模型训练设备根据目标模型参数训练新的机器模型。

进一步可选地，处理器702在响应用户发出的标注数据选择操作，从标注数据集中选择训练样本集之前，还包括：响应用户发出的数据加载操作，通过通信组件向模型训练设备发送数据请求；通过通信组件接收模型训练设备在确定终端设备具有访问权限时返回的标注数据集，并显示在配置界面上。

进一步可选地，处理器702响应用户发出的标注数据选择操作，从标注数据集中选择训练样本集之前，还包括：响应用户发出的修正操作，确定标注数据集中与修正操作关联的标注数据，并对标注数据进行修正。

进一步可选地，处理器702响应用户发出的训练操作，指示所述模型训练设备根据所述训练样本集对所述机器人当前使用的机器模型训练得到新的机器模型还包括：响应用户发出的更新操作，通过通信组件向模型训练设备发送更新指令，以指示机器人将机器人当前使用的机器模型替换为新的机器模型。

在方式2中，存储器703中存储第二计算机程序，处理器可以执行第二计算机程序，可用于：响应用户发出的更新触发操作，显示一配置界面，配置界面显示至少一个模型参数，响应用户发出的参数选择操作，从至少一个模型参数中选择目标模型参数；响应用户发出的训练操作，向模型训练设备发送目标模型参数，以供模型训练设备根据目标模型参数对机器人当前使用的机器模型训练得到新的机器模型。

进一步可选地，处理器702还用于：在配置界面上显示机器人对应的标注数据集；响应用户发出的标注数据选择操作，从标注数据集中选择训练样本集；将训练样本集发送给模型训练设备，以供模型训练设备根据训练样本集和目标模型参数对机器人当前使用的机器模型继续训练得到新的机器模型。

进一步可选地，处理器702响应用户发出的训练操作，向模型训练设备发送训练指令之后，还包括：响应用户发出的更新操作，向模型训练设备发送更新指令，以指示模型训练设备将机器人当前使用的机器模型替换为新的机器模型。

相应地，本申请实施例还提供一种存储有计算机程序的计算机可读存储介质。当计算机可读存储介质存储第一计算机程序，且第一计算机程序被一个或多个处理器执行时，致使一个或多个处理器执行相应图2a或图5a所示方法实施例中的各步骤。当计算机可读存储介质存储第二计算机程序，且第二计算机程序被一个或多个处理器执行时，致使一个或多个处理器执行相应图3a或图6a所示方法实施例中的各步骤。

本申请实施例还提供一些机器人。如图8所示，该机器人包括：机械本体81，机械本体上设有传感器82，一个或多个处理器83，以及一个或多个存储计算机程序的存储器84。

机械本体81上除了设有一个或多个处理器83以及一个或多个存储器84之外，还设置有机器人的一些基本组件，例如清扫组件、电源组件、驱动组件等等。传感器82可以包括激光雷达传感器、视觉传感器、干湿度传感器等，视觉传感器可以是摄像头、相机等。可选地，驱动组件可以包括驱动轮、驱动电机、万向轮等。可选地，清扫组件可以包括清扫电机、清扫刷、起尘刷、吸尘风机等。不同机器人所包含的这些基本组件以及基本组件的构成均会有所不同，本申请实施例仅是部分示例。

值得说明的是，传感器82、一个或多个处理器83、一个或多个存储器84可设置于机械本体内部，也可以设置于机械本体的表面。

机械本体是机器人赖以完成作业任务的执行机构，可以在确定的环境中执行处理器83指定的操作。其中，机械本体一定程度上体现了机器人的外观形态。在本实施例中，并不限定机器人的外观形态，例如可以是圆形、椭圆形、三角形、凸多边形等。

一个或多个存储器84，主要用于存储计算机程序，该计算机程序可被一个或多个处理器83执行，致使一个或多个处理器83可以对机器人使用的机器模型进行更新操作。除了存储计算机程序之外，一个或多个存储器84还可被配置为存储其它各种数据以支持在机器人上的操作。这些数据的示例包括用于在机器人上操作的任何应用程序或方法的指令，以扫地机器人为例，存储器84中还可以存储机器人所在环境/场景的地图数据，待清扫区域的信息，清扫模式，定点清扫参数等等。

一个或多个处理器83，可以看作是机器人的控制系统，可用于执行一个或多个存储器84中存储的计算机程序，以对机器人使用的机器模型进行更新操作。其中，一个或多个存储器84中可以存储不同的计算机程序，这样一个或多个处理器83可以执行不同计算机程序，采用不同的方式对机器人使用的机器模型进行更新操作。

例如，在方式1中，一个或多个存储器84中存储第三计算机程序，一个或多个处理器83可以执行第三计算机程序，可用于：接收终端设备发送的指示，根据指示确定训练样本集，训练样本集是从机器人对应的标注数据集选择出的；根据训练样本集对机器人当前使用的机器模型继续训练得到新的机器模型。

可选地，一个或多个处理器83在接收终端设备发送的指示，根据指示确定训练样本集时，具体用于：接收终端设备发送的训练指令，机器人根据训练指令中携带的标识信号或者训练样本集中各训练样本的标识信息，从标注数据集中确定出训练模型所需的训练样本集；或者，直接接收终端设备发送的训练样本集；或者，接收终端设备发送的训练样本集和训练指令。

进一步可选地，一个或多个处理器83在接收终端设备发送的指示之前，还包括：接收终端设备发送的数据请求；判断终端设备是否具有访问权限；在终端设备具有访问权限时，向终端设备返回标注数据集。

进一步可选地，一个或多个处理器83判断终端设备是否具有访问权限，包括：在触控板上显示确认页面，以供用户确定是否允许终端设备访问标注数据集；响应用户发出的确认操作，确定终端设备具有访问权限。

进一步可选地，一个或多个处理器83根据训练样本集对机器人当前使用的机器模型继续训练得到新的机器模型之后，还包括：接收终端设备发送的更新指令；根据更新指令，将机器人当前使用的机器模型替换为新的机器模型。

例如，在方式2中，一个或多个存储器84中存储第四计算机程序，一个或多个处理器83可以执行第四计算机程序，可用于：接收终端设备发送的目标模型参数，目标模型参数是从至少一个模型参数中选择出的；根据目标模型参数对机器人当前使用的机器模型继续训练以得到新的机器模型。

相应地，本申请实施例还提供一种存储有计算机程序的计算机可读存储介质。当计算机可读存储介质存储第三计算机程序，且第三计算机程序被一个或多个处理器执行时，致使一个或多个处理器执行相应图2b所示方法实施例中的各步骤。当计算机可读存储介质存储第四计算机程序，且第四计算机程序被一个或多个处理器执行时，致使一个或多个处理器执行相应图3b所示方法实施例中的各步骤。

本申请实施例相应的提供一种服务器。如图9所示，服务器包括：通信组件901，一个或多个处理器902，以及一个或多个存储计算机程序的存储器903。进一步，服务器还可以包括电源组件904。

一个或多个存储器903，主要用于存储计算机程序，该计算机程序可被一个或多个处理器902执行，致使一个或多个处理器902可以对机器人使用的机器模型进行更新操作。除了存储计算机程序之外，一个或多个存储器903还可被配置为存储其它各种数据以支持在服务器上的操作。这些数据的示例包括用于在服务器上操作的任何应用程序或方法的指令。

其中，一个或多个存储器903中可以存储不同的计算机程序，这样一个或多个处理器902可以执行不同计算机程序，采用不同的方式对机器人使用的机器模型进行更新操作。

在方式1中，一个或多个存储器903中存储第五计算机程序，一个或多个处理器902可以执行第五计算机程序，用于：通过通信组件901接收终端设备发送指示，根据确指示定训练样本集，训练样本集是从机器人对应的标注数据集选择出的；根据训练样本集对机器人当前使用的机器模型继续训练得到新的机器模型。

可选地，一个或多个处理器903在接收终端设备发送的指示，根据指示确定训练样本集时，具体用于：接收终端设备发送的训练指令，机器人根据训练指令中携带的标识信号或者训练样本集中各训练样本的标识信息，从标注数据集中确定出训练模型所需的训练样本集；或者，直接接收终端设备发送的训练样本集；或者，接收终端设备发送的训练样本集和训练指令。

进一步可选地，一个或多个处理器902在接收终端设备发送的指示之前，还包括：通过通信组件901接收终端设备发送的数据请求；判断终端设备是否具有访问权限；在终端设备具有访问权限时，向终端设备返回标注数据集。

进一步可选地，一个或多个处理器902根据训练样本集对机器人当前使用的机器模型继续训练得到新的机器模型之后，还包括：通过通信组件901接收终端设备发送的更新指令；根据更新指令，将新的机器模型下发给机器人，以使机器人将其当前使用的机器模型替换为新的机器模型。

进一步可选地，一个或多个处理器902通过通信组件901接收机器人上报的标注数据集；或者通过通信组件901接收机器人上报的环境数据，根据机器人当前使用的机器模型对环境数据进行标注，以获得标注数据集。

例如，在方式2中，一个或多个存储器903中存储第六计算机程序，一个或多个处理器902可以执行第六计算机程序，可用于：通过通信组件901接收终端设备发送的目标模型参数，目标模型参数是从至少一个模型参数中选择出的；根据目标模型参数对机器人当前使用的机器模型继续训练以得到新的机器模型。

相应地，本申请实施例还提供一种存储计算机程序的计算机可读存储介质。当计算机可读存储介质存储第五计算机程序，且第五计算机程序被一个或多个处理器执行时，致使一个或多个处理器执行相应图5b所示方法实施例中的各步骤。当计算机可读存储介质存储第六计算机程序，且第六计算机程序被一个或多个处理器执行时，致使一个或多个处理器执行相应图6b所示方法实施例中的各步骤。

上述服务器或者机器人中的存储器，可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(SRAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。

上述服务器或者机器人中的通信组件，可被配置为便于通信组件所在设备和其他设备之间有线或无线方式的通信。通信组件所在设备可以接入基于通信标准的无线网络，如WiFi，2G或3G，或它们的组合。在一个示例性实施例中，通信组件经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中，通信组件还包括近场通信(NFC)模块，以促进短程通信。例如，在NFC模块可基于射频识别(RFID)技术，红外数据协会(IrDA)技术，超宽带(UWB)技术，蓝牙(BT)技术和其他技术来实现。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

以上所述仅为本申请的实施例而已，并不用于限制本申请。对于本领域技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本申请的权利要求范围之内。

Claims

1.一种机器模型更新方法，适用于终端设备，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，响应所述用户发出的训练操作，指示所述模型训练设备根据所述训练样本集对所述机器人当前使用的机器模型训练得到新的机器模型，包括以下至少一种操作：

响应所述用户发出的训练操作，向模型训练设备发送训练指令，以指示所述模型训练设备根据所述训练样本集对所述机器人当前使用的机器模型训练得到新的机器模型；

响应所述用户发出的训练操作，向所述模型训练设备发送所述训练样本集，以指示所述模型训练设备根据所述训练样本集对所述机器人当前使用的机器模型训练得到新的机器模型；

响应所述用户发出的训练操作，向所述模型训练设备发送所述训练样本集和训练指令，以指示所述模型训练设备根据所述训练样本集对所述机器人当前使用的机器模型训练得到新的机器模型。

3.根据权利要求1所述的方法，其特征在于，还包括：

在所述配置界面上显示至少一个模型参数；

响应所述用户发出的参数选择操作，从所述至少一个模型参数中选择目标模型参数；

将所述目标模型参数发送给所述模型训练设备，以供所述模型训练设备根据所述目标模型参数训练所述新的机器模型。

4.根据权利要求1所述的方法，其特征在于，响应所述用户发出的标注数据选择操作，从所述标注数据集中选择训练样本集之前，还包括：

响应所述用户发出的数据加载操作，向所述模型训练设备发送数据请求；

接收所述模型训练设备在确定所述终端设备具有访问权限时返回的所述标注数据集，并显示在所述配置界面上。

5.根据权利要求1所述的方法，其特征在于，响应所述用户发出的标注数据选择操作，从所述标注数据集中选择训练样本集之前，还包括：

响应所述用户发出的修正操作，确定所述标注数据集中与所述修正操作关联的标注数据，并对所述标注数据进行修正。

6.根据权利要求1所述的方法，其特征在于，响应所述用户发出的训练操作，指示所述模型训练设备根据所述训练样本集对所述机器人当前使用的机器模型训练得到新的机器模型之后，还包括：

响应所述用户发出的更新操作，向所述模型训练设备发送更新指令，以指示所述模型训练设备将所述机器人当前使用的机器模型替换为所述新的机器模型。

7.根据权利要求1-6任一项所述的方法，其特征在于，所述配置界面为网页或者应用界面。

8.根据权利要求1-6任一项所述的方法，其特征在于，所述标注数据集是所述模型训练设备利用所述机器人当前使用的机器模型对所述机器人或所述终端设备收集到的所述机器人工作环境的环境数据进行标注得到的。

9.一种机器模型更新方法，适用于模型训练设备，其特征在于，所述方法包括：

接收终端设备发送的指示，根据所述指示确定训练样本集，所述训练样本集是从所述机器人对应的标注数据集选择出的；

10.根据权利要求9所述的方法，其特征在于，在接收终端设备发送的指示之前，还包括：

接收所述终端设备发送的数据请求；

判断所述终端设备是否具有访问权限；

在所述终端设备具有访问权限时，向所述终端设备返回所述标注数据集。

11.根据权利要求10所述的方法，其特征在于，所述判断所述终端设备是否具有访问权限，包括：

在触控板上显示确认页面，以供用户确定是否允许所述终端设备访问所述标注数据集；

响应所述用户发出的确认操作，确定所述终端设备具有访问权限。

12.根据权利要求9-11任一项所述的方法，其特征在于，根据所述训练样本集对所述机器人当前使用的机器模型训练得到新的机器模型之后，还包括：

接收所述终端设备发送的更新指令；

根据所述更新指令，将所述机器人当前使用的机器模型替换为所述新的机器模型。

13.根据权利要求12所述的方法，其特征在于，根据所述更新指令，将所述机器人当前使用的机器模型替换为所述新的机器模型，包括：

若所述模型训练设备为所述机器人，则直接将当前使用的机器模型替换为所述新的机器模型；

若所述模型训练设备为所述机器人对应的服务器，则将所述新的机器模型下发给所述机器人，以指示所述机器人将其当前使用的机器模型替换为所述新的机器模型。

14.根据权利要求13所述的方法，其特征在于，在所述模型训练设备为所述服务器时，所述方法还包括：

所述服务器接收所述机器人上报的所述标注数据集；或者

所述服务器接收所述机器人上报的环境数据，根据所述机器人当前使用的机器模型对所述环境数据进行标注，以获得所述标注数据集。

15.一种机器模型更新方法，适用于终端设备，其特征在于，包括：

16.根据权利要求15所述的方法，其特征在于，还包括：

在所述配置界面上显示所述机器人对应的标注数据集；

将所述训练样本集发送给所述模型训练设备，以供所述模型训练设备根据所述训练样本集和所述目标模型参数对所述机器人当前使用的机器模型训练得到新的机器模型。

17.根据权利要求15或16所述的方法，其特征在于，响应用户发出的参数选择操作，从所述至少一个模型参数中选择目标模型参数之前，还包括：

向服务器发送参数请求，以请求所述至少一个模型参数；

接收所述服务器根据所述参数请求返回的所述至少一个模型参数，并显示于所述配置界面上。

18.一种机器模型更新方法，适用于模型训练设备，其特征在于，所述方法包括：

19.一种终端设备，其特征在于，包括：存储器、电子显示屏、处理器以及通信组件；

所述存储器，用于存储计算机程序；

所述处理器，用于执行所述计算机程序，以用于：

20.一种存储有计算机程序的计算机可读存储介质，其特征在于，当所述计算机程序被一个或多个处理器执行时，致使所述一个或多个处理器执行包括以下的动作：

21.一种模型更新系统，其特征在于，包括：终端设备和机器人；

22.一种模型更新系统，其特征在于，包括：终端设备、机器人和服务器；

所述机器人，用于接收所述服务器下发的新的机器模型；

所述服务器，用于接收所述终端设备发送的指示，根据所述指示确定训练样本集，根据所述训练样本集对所述机器人当前使用的机器模型训练以得到新的机器模型，将所述新的机器模型发送至所述机器人。