WO2024037155A1

WO2024037155A1 - 用于足式机器人的状态估计方法、装置、计算机设备及计算机可读存储介质

Info

Publication number: WO2024037155A1
Application number: PCT/CN2023/099676
Authority: WO
Inventors: 吴闫明; 迟万超; 王海涛; 姜鑫洋; 张晟浩; 郑宇�
Original assignee: 腾讯科技（深圳）有限公司
Priority date: 2022-08-17
Filing date: 2023-06-12
Publication date: 2024-02-22
Also published as: CN115355905A

Abstract

本申请公开了一种用于足式机器人的状态估计方法、状态估计装置、计算机设备、计算机可读存储介质、一种计算机程序产品。方法包括：获取足式机器人的第一传感器信息和第二传感器信息，并基于第一传感器信息和第二传感器信息，利用第一卡尔曼滤波器确定足式机器人的第一状态信息，并保存一段时间的第一状态信息作为第二卡尔曼滤波的历史信息；获取足式机器人的第三传感器信息，并基于第三传感器信息和所述历史信息，利用第二卡尔曼滤波器确定足式机器人的第二状态信息；以及基于足式机器人的第二状态信息，对足式机器人在当前时刻的第一状态信息进行更新，以确定足式机器人的当前时刻的状态信息。

Description

用于足式机器人的状态估计方法、装置、计算机设备及计算机可读存储介质

相关申请的交叉引用

本申请基于申请号为202210985184.6、申请日为2022年8月17日的中国专利申请提出，并要求该中国专利申请的优先权，该中国专利申请的全部内容在此引入本申请作为参考。

技术领域

本申请实施例涉及足式机器人技术领域，具体涉及足式机器人规划控制技术领域，尤其涉及用于足式机器人的状态估计方法、用于足式机器人的状态估计装置、及计算机设备、以及计算机可读存储介质。

背景技术

在足式机器人的运动过程中，相关技术通常可使用多种手段来实时确定足式机器人的状态(如位置和姿态信息等)。例如，可以使用多种传感器融合来估计足式机器人的本体状态。然而使用惯性测量单元(Inertial Measurement Unit，IMU)和腿部编码器等基于本体感知的传感器进行状态估计时，由于足式机器人在运动过程中往往会出现足端侧滑、变形、机械结构误差等，并且传感器噪音、漂移等也会影响状态估计结果，从而导致估计值不准确。随着足式机器人的运动时长的增加，误差值也会累积。由于足式机器人的控制通常需要当前状态估计值来控制各个关节电机，不准确的状态估计值可能导致难以准确控制足式机器人。

因此，需要对相关技术的状态估计方法进行改进，以在保证实时获取状态估计值的情形下尽可能地消除累积误差。

发明内容

本申请实施例提供了一种用于足式机器人的状态估计方法、装置、计算机设备及计算机可读存储介质，可以在实时获取足式机器人的状态估计值的情况下提高状态估计值的精度。

本申请实施例提供了一种用于足式机器人的状态估计方法，由计算机设备执行，所述方法包括：获取所述足式机器人的第一传感器信息和第二传感器信息，并基于所述第一传感器信息和第二传感器信息，利用第一卡尔曼滤波器确定所述足式机器人的第一状态信息，并保存一段时间的第一状态信息作为第二卡尔曼滤波的历史信息；获取所述足式机器人的第三传感器信息，并基于所述第三传感器信息和所述历史信息，利用所述第二卡尔曼滤波器确定所述足式机器人的第二状态信息；以及基于所述足式机器人的第二状态信息，对足式机器人在当前时刻的第一状态信息进行更新，以确定所述足式机器人的当前时刻的状态信息。

又一方面，本申请实施例提供了一种用于足式机器人的状态估计装置，所述装置包括：第一传感器，被配置为获取所述足式机器人的第一传感器信息；第二传感器，被配置为获取所述足式机器人的第二传感器信息；第三传感器，被配置为获取所述足式机器人的第三传感器信息；第一卡尔曼滤波器，被配置为基于所述第一传感器信息和所述第二传感器信息，确定所述足式机器人的第一状态信息，并保存一段时间的第一状态信息作为历史信息；第二卡尔曼滤波器，被配置为基于所述第三传感器信息和所述历史信息，利用第二卡尔曼滤波器确定所述足式机器人的第二状态信息；其中，所述第一卡尔曼滤波器还被配置为基于所述第二状态信息以及所述足式机器人在当前时刻对应的第一状态信息，确定所述足式机器人在当前时刻的状态信息。

又一方面，本申请实施例提供了一种计算机设备，包括输入接口和输出接口，还包括：处理器，适于实现一条或多条指令；以及，计算机可读存储介质；所述计算机可读存储介质存储有一条或多条指令，所述一条或多条指令适于由所述处理器加载并执行上述的足式机器人的状态估计方法。

又一方面，本申请实施例提供了一种计算机可读存储介质，所述计算机可读存储介质存储有一条或多条指令，所述一条或多条指令适于由处理器加载并执行上述的足式机器人的状态估计方法。

又一方面，本申请实施例提供了一种计算机程序产品，所述计算机程序产品包括计算机程序；所述计算机程序被处理器执行时，实现上述的足式机器人的状态估计方法。

由此，本申请实施例的各个方面融合了以不同频率工作的不同传感器的输出信息，采用两个卡尔曼滤波器解决了融合不同传感器信息的频率不同、延迟不同等问题，实现了高实时性、高鲁棒性、高有效性的多传感器融合状态估计，显著减小了足式机器人长时间运动时状态估计带来的累积误差。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对实施例的描述中所需要使用的附图作简单的介绍。显而易见地，下面描述中的附图仅仅是本申请的一些示例性实施例，对于本领域普通技术人员来说，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。以下附图并未刻意按实际尺寸等比例缩放绘制，重点在于示出本申请实施例的主旨。

图1是示出根据本申请实施例的足式机器人的示意图。

图2是示出根据本申请实施例的用于足式机器人的状态估计方法的流程图。

图3是示出根据本申请实施例的根据用于足式机器人的状态估计方法的示意图，其中示意性地示出了第一状态信息和第二状态信息。

图4是示出根据本申请实施例的用于足式机器人的状态估计装置的部分结构图。

图5是示出根据本申请实施例的用于足式机器人的状态估计装置执行方法的示意图。

图6是示出根据本申请实施例的方法的执行效果与传统方案的对比图。

图7示出了根据本申请实施例的电子设备的示意图。

图8示出了根据本申请实施例的示例性计算设备的架构的示意图。

图9示出了根据本申请实施例的存储介质的示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请实施例，本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请实施例保护的范围。

在本申请实施例的描述中，需要理解的是，术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”、“顺时针”、“逆时针”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本申请实施例和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本申请实施例的限制。此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个所述特征。在本申请实施例的描述中，“多个”的含义是两个或两个以上，除非另有明确具体的限定。

在本申请实施例的描述中，需要说明的是，除非另有明确的规定和限定，术语“安装”、“相连”、“连接”应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体地连接；可以是机械连接，也可以是电连接或可以相互通讯；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通或两个元件的相互作用关系。对于本领域的普通技术人员而言，可以根据具体情况理解上述术语在本申请实施例中的具体含义。

在本申请实施例中，除非另有明确的规定和限定，第一特征在第二特征之“上”或之“下”可以包括第一和第二特征直接接触，也可以包括第一和第二特征不是直接接触而是通过它们之间的另外的特征接触。而且，第一特征在第二特征“之上”、“上方”和“上面”包括第一特征在第二特征正上方和斜上方，或仅仅表示第一特征水平高度高于第二特征。第一特征在第二特征“之下”、“下方”和“下面”包括第一特征在第二特征正下方和斜下方，或仅仅表示第一特征水平高度小于第二特征。

下文的公开提供了许多不同的实施方式或例子用来实现本申请实施例的不同结构。为了简化本申请实施例，下文中对特定例子的部件和设置进行描述。当然，它们仅仅为示例，并且目的不在于限制本申请实施例。此外，本申请实施例可以在不同例子中重复参考数字和/或参考字母，这种重复是为了简化和清楚的目的，其本身不指示所讨论各种实施方式和/或设置之间的关系。此外，本申请实施例提供了的各种特定的工艺和材料的例子，但是本领域普通技术人员可以意识到其他工艺的应用和/或其他材料的使用。

虽然本申请实施例对根据本申请实施例的装置中的某些模块做出了各种引用，然而，任何数量的不同模块可以被使用并运行在用户终端和/或服务器上。所述模块仅是说明性的，并且所述装置和方法的不同方面可以使用不同模块。

本申请实施例中使用了流程图用来说明根据本申请实施例的方法和装置所执行的操作。应当理解的是，前面或下面操作不一定按照顺序来精确地执行。相反，根据需要，可以按照倒序或同时处理各种步骤。同时，也可以将其他操作添加到这些过程中，或从这些过程移除某一步或数步操作。

本申请实施例的足式机器人是一种使用腿进行移动的足式机器人，其以动物为仿生对象，目的是依据工程技术和科学研究成果模拟动物的运动形式和复制动物的运动能力。足式机器人对各种环境(包括结构化环境(诸如公路、铁路、经处理的平整路面等)和非结构化环境(诸如山地、沼泽、崎岖不平的路面等))具有很强的适应能力，其能够适应地形的各种变化、翻越较高的障碍物，而且能够有效地减小载荷、提高系统的能量利用效率。足式机器人按照足数可分为单足、双足、四足、六足、八足等，其中，四足足式机器人具有超强的运动能力，其比双足足式机器人静态稳定性好，且比六足、八足足式机器人运动简单灵活，因此，四足足式机器人是研究足式机器人的一种常见选择。四足足式机器人的步态是四足足式机器人为了能够进行连续的移动，其四条腿在时间和空间上的协调关系。四足足式机器人的步态来自于四足哺乳动物的步态，其可以包括但不限于以下简化的三种形式：行走(walk)、小跑(trot)和跳跃(bound)。

本申请实施例的控制足式机器人的方法可以是基于人工智能(Artificial intelligence，AI)的。人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。例如，对于基于人工智能的控制足式机器人的方法而言，其能够以类似于人类引导活体动物运动的方式来规划足式机器人的运动轨迹和步态，使得足式机器人的运动更灵活仿生。人工智能通过研究各种智能机器的设计原理与实现方法，使本申请实施例的控制足式机器人的方法具有自动高效地基于足式机器人的当前运动状态设计足式机器人的后续运动轨迹和步态的功能。

综上所述，本申请实施例提供的方案涉及人工智能、机器学习等技术，下面将结合附图对本申请实施例进行进一步地描述。

图1是示出根据本申请实施例的足式机器人100的示意图。如图1所示，以四足足式机器人为例，图1中的左图和右图分别示出了示例足式机器人的内部透视图和外部结构图。

该示例足式机器人能够基于四条机械腿进行移动。其中，每条机械腿可以包括大腿和小腿，且可包括大腿和小腿，且每条机械腿可包括至少一个关节。例如，每条机械腿上可以包括多个下肢关节，例如髋关节两个自由度和膝关节1个自由度。值得注意的是，“关节”一词在本申请实施例中指示足式机器人的两个或两个以上的组件之间能够活动的连接。关节可以在关节电机输出的力和力矩的控制下进行运动。例如，关节可以通过转动一个角度，以使得其他关节及其连杆机构能够在空间中产生一定的移动量，从而导致足式机器人100的姿态/运动状态的改变。

除此之外，每条机械腿还可配置有多个电机，这些电机可以分别用来控制或组合控制四足足式机器人的髋关节两个自由度和膝关节1个自由度。需要说明的是，足式机器人上还可配置各式各样的测量组件，如IMU传感器和关节编码器等；其中，IMU传感器可以实时地提供足式机器人的加速度和姿态信息，关节编码器可以实时地提供足式机器人的各个关节的关节角信息(如关节角的角度、角速度反馈值等)。

示例足式机器人在上述提及的多个电机的控制下，已经能够实现多种运动，例如，包括空翻或跳跃等动作运动。然而控制该足式机器人执行这些动作往往需要准确的状态数据。如果状态数据不准确，各项控制方案就难以实现足式机器人的准确灵活控制。

在控制足式机器人的运动过程中，相关技术提供了多种手段来实时确定足式机器人的状态(如位置和姿态信息等)。例如，可以使用多种传感器来估计足式机器人的本体状态。例如，在工业界已经提出了多种融合IMU数据、关节编码器的数据、激光数据、动作捕捉数据等等来确定足式机器人本体状态的方法，但这些方法都无法解决本体感知的传感器状态估计器在长时间运行下的状态漂移，导致不可避免产生累积误差。

因此，针对上述问题，本申请实施例提供了一种用于足式机器人的状态估计方法，所述方法包括：获取所述足式机器人的第一传感器信息和第二传感器信息，并基于所述第一传感器信息和第二传感器信息，利用第一卡尔曼滤波器确定所述足式机器人的第一状态信息，并保存一段时间的第一状态信息作为第二卡尔曼滤波的历史信息；获取所述足式机器人的第三传感器信息，并基于所述第三传感器信息和所述历史信息，利用所述第二卡尔曼滤波器确定所述足式机器人的第二状态信息；以及基于所述足式机器人的第二状态信息，对足式机器人在当前时刻的第一状态信息进行更新，以确定所述足式机器人的当前时刻的状态信息。

又一方面，本申请实施例还提供了一种用于足式机器人的状态估计装置，所述装置包括：第一传感器，被配置为获取所述足式机器人的第一传感器信息；第二传感器，被配置为获取所述足式机器人的第二传感器信息；第三传感器，被配置为获取所述足式机器人的第三传感器信息；第一卡尔曼滤波器，被配置为基于所述第一传感器信息和所述第二传感器信息，确定所述足式机器人的第一状态信息，并保存一段时间的第一状态信息作为历史信息；第二卡尔曼滤波器，被配置为基于所述第三传感器信息和所述历史信息，利用第二卡尔曼滤波器确定所述足式机器人的第二状态信息；其中，所述第一卡尔曼滤波器还被配置为基于所述第二状态信息以及所述足式机器人在当前时刻对应的第一状态信息，确定所述足式机器人在当前时刻的状态信息。

相比于传统的状态估计方案，本申请实施例的各个方面融合了以不同工作频率的传感器的传感器信息，采用两个卡尔曼滤波器解决了相关技术的的方案中仅能以较低频率融合不同传感器信息进而导致的延迟高等问题，实现了高实时性、高鲁棒性、高有效性的多传感器融合状态估计，显著减小了足式机器人长时间运动时状态估计带来的累积误差。

以下参考图2至图9来进一步描述本申请实施例的各个方面的示例。本领域技术人员应当理解本申请实施例并不以此为限。

图2是示出根据本申请实施例的用于足式机器人的状态估计方法20的流程图。图3是示出根据本申请实施例的根据用于足式机器人的状态估计方法20的示意图，其中示意性地示出了第一状态信息和第二状态信息。

根据本申请实施例的用于足式机器人的状态估计方法20可以包括如图2所示的操作S201-S203。如图2所示，方法20包括操作S201至操作S203之一或全部，也可以包括更多的操作。操作S201至操作S203的执行主体可以是位于足式机器人上的各个组件(例如，位于足式机器人上的各种传感器和计算组件)，也可以是位于足式机器人外部的各种组件(例如，位于足式机器人外部的各种传感器和计算组件)。本申请实施例并不对操作S201至操作S203的执行主体进行限制。方法20可以由后续详述的装置40进行处理。

作为一个示例，方法20可以由任意的计算设备执行。此处的计算机设备可以是终端或服务器；或者，此处的计算机设备也可以是由终端和服务器共同执行，对此不作限定。其中，终端可以是智能手机、电脑(如平板电脑、笔记本电脑、台式计算机等)、智能穿戴设备(如智能手表、智能眼镜)、智能语音交互设备、智能家电(如智能电视)、车载终端或飞行器等；服务器可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network，内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器，等等。进一步的，终端和服务器可位于区块链网络内或区块链网络外，对此不作限定；更进一步的，终端和服务器还可将内部所存储的任一数据上传至区块链网络进行存储，以防止内部所存储的数据被篡改，提升数据安全性。

例如，在操作S201中，获取所述足式机器人的第一传感器信息和第二传感器信息，并基于所述第一传感器信息和第二传感器信息，利用第一卡尔曼滤波器确定所述足式机器人的第一状态信息，并将保存一段时间的第一状态信息作为第二卡尔曼滤波的历史信息。

可选地，所述第一传感器信息可以是通过第一传感器采集的任意信息。可选地，第一传感器信息带有时间戳。第一传感器可以采用第一频率工作，以获得第一时间戳集合中的多个时间戳对应的第一传感器信息。也即，所述第一传感器信息可以包括第一传感器在第一时间戳集合中的每个时间戳采集的信息。第一频率可能相对较高，进而保证第一传感器的实时性。示例性的第一频率可以为0.01kHZ至1kHZ。例如，第一传感器可以包括以下各项设备中的至少一项：触觉传感器、力和力矩传感器、惯性测量单元(IMU)等等。本申请实施例并不对传感器信息的种类和具体的信号形式进行限制。又例如，在足式机器人100还包括机械臂的情况下，所述第一传感器还可以包括机械臂对应的力和力矩传感器。在机械臂上还包括手指端的情况下，所述第一传感器还可以包括手指端的触觉传感器等。在一些实施例中，第一传感器可以物理地附着在足式机器人上，其附着位置可以随着足式机器人的构型的变化而变化，本申请实施例并不以此为限。在又一些实施例中，第一传感器也可以未物理地附着在足式机器人上，本申请实施例并不以此为限。

可选地，所述第二传感器信息可以是通过第二传感器采集的任意信息。可选地，第二传感器也带有时间戳。第二传感器可以以第二频率工作，以获得第二时间戳集合中的多个时间戳对应的第二传感器信息。所述第二传感器信息可以用于计算足式机器人的动作和姿态相关的信息。例如，第二传感器可以是关节编码器，其用于采集所述足式机器人的第二传感器信息，从而获得所述足式机器人的各个关节的关节角信息(如关节角的角度、角速度反馈值等)。可选地，所述关节编码器也可以以第二频率工作。示例性的第二频率可以为0.1至1kHZ。第二频率可以略低于第一频率。

第一卡尔曼滤波器(Kalman Filter)既可以是一种标准的卡尔曼滤波器，也可以是一种扩展卡尔曼滤波器。具体地，卡尔曼滤波器是一种高效率的递归滤波器(自回归滤波器)，它能够从一系列的不完全及包含噪音的测量信息(例如，第一传感器信息和第二传感器信息)中，估计足式机器人的状态。卡尔曼滤波会根据各测量信息在不同时间下的值，考虑各时间下的联合分布，再产生对未知变量的估计(例如，第一状态信息)，因此会比只以单一测量值为基础的估计方式更准确。所谓的扩展卡尔曼滤波是标准卡尔曼滤波在非线性情形下的一种扩展形式，其可将非线性函数进行泰勒展开，省略高阶项，保留展开项的一阶项，以此来实现非线性函数线性化。以下的各个示例虽然是以标准的卡尔曼滤波器为例进行的说明，但是本领域技术人员应当理解本申请实施例并不以此为限。

在一个具体实现中，第一传感器信息和第二传感器信息带有时间戳，所述基于所述第一传感器信息和第二传感器信息，利用第一卡尔曼滤波器确定所述足式机器人的第一状态信息：将带有时间戳的第一传感器信息和第二传感器信息，将第一传感器信息和第二传感器信息，依次作为第一卡尔曼滤波器的输入；以及通过第一卡尔曼滤波器进行状态估计，得到带有时间戳的足式机器人的第一状态信息，并将带有时间戳的第一状态信息保存为历史信息，所述第一状态信息包括第一卡尔曼滤波器输出的带有时间戳的多个状态估计结果。

可选的，参考图3，假设当前时刻为T_b，而多个时间戳被包括从时刻T_a到时刻T_b对应的时间段内。可将上述多个时间戳中的每个时间戳对应的第一传感器信息和第二传感器信息依次作为第一卡尔曼滤波器的输入，以通过第一卡尔曼滤波器进行状态估计，得到足式机器人在时间段[T_a,T_b]中的每个时间戳对应的第一状态信息。值得注意的是，第一状态信息包括第一卡尔曼滤波器输出的多个时间戳对应的多个状态估计结果。

在一个示例中，所述第一状态信息可以为以下数据组成的时序数值序列：各个时间步(每个时间步对应一个时间戳)对应的质心和足端相关信息。时序数值序列中的每个元素对应一个状态估计结果。可选地，该时序数值序列中的每个元素可以具有多个维度，其分别表示某个时间步对应的质心和足端在x轴方向上的位置、质心在y轴方向上的位置、质心在z方向(重力方向)上的位置、足式机器人的倾斜角(pitch)、足式机器人的偏航角(yaw)以及足式机器人的滚动角(roll)等等，本申请实施例并不以此为限。

上述过程可以实时进行，也即，每采集一个时间戳对应的第一传感器信息和第二传感器信息，就输入至第一卡尔曼滤波器以得到一个状态估计结果(例如，图3中以曲线表示的第一状态信息，曲线中的每个点对应于一个时刻的状态信息)。

举例来说，在时间戳T_a，第一卡尔曼滤波器输出的状态估计结果为S_a。在时间戳T_b-1，第一卡尔曼滤波器输出的状态估计结果为S_b-1。以下，术语“状态估计结果S_a至S_b-1”包括从时刻T_a到时刻T_b-1对应的历史时间段内的每个时间戳T_i(T_a<T_i<T_b-1)对应的状态估计结果S_i。之后将参考图4和图5中描述的示例进一步说明通过第一卡尔曼滤波器获得第一状态信息的示例方案，本申请实施例在此就不再赘述。

然后，可以保存一段时间的第一状态信息(例如，时间段[T_a,T_b-1]中的每个时间戳对应的第一状态估计结果S_a至S_b-1)作为第二卡尔曼滤波的历史信息。

接着，在操作S202中，获取所述足式机器人的第三传感器信息，并基于所述第三传感器信息和所述历史信息，利用所述第二卡尔曼滤波器确定所述足式机器人的第二状态信息。

可选地，所述第三传感器信息可以是通过第三传感器采集的任意信息。第三传感器可以以第三频率工作，以在固定时间段仅获得所述多个时刻中的一个时刻对应的第三传感器信息。第三频率可能相对较低，例如低于第一频率。示例性的第三频率可以为10至50HZ。传感器的工作频率和准确度是相互制约的，即工作频率越高，则准确性随之下降，由于第三传感器采集的第三传感器信息的实时性相较于第一传感器低，但准确度相较第一传感器高，不会随着足式机器人的运动累积误差。

可选地，所述第三传感器可以包括以下各项设备中的至少一项：距离传感器(TOF)、提供视觉信息的相机或摄像头、雷达、位置传感器(例如GPS传感器)、激光传感器等等。

类似地，第二卡尔曼滤波器也可以是一种标准的卡尔曼滤波器或一种扩展卡尔曼滤波器。可选的，可确定所述第三传感器信息对应的时间戳，将所述历史信息和所述第三传感器信息作为第二卡尔曼滤波器的输入；并通过第二卡尔曼滤波器进行状态估计，得到所述第三传感器信息对应的时间戳的状态估计结果作为所述第二状态信息。此外，在另一实施例中，为进一步缩减计算量，可仅将上述历史信息中与第三传感器信息对应的时间戳对应的状态估计结果以及第三传感器信息作为第二卡尔曼滤波器的输入，以通过第二卡尔曼滤波器进行状态估计，得到所述第三传感器信息对应的时间戳的状态估计结果，将状态估计结果作为所述第二状态信息。

具体地，第二卡尔曼滤波器进行状态估计的过程可以被简述如下：首先，基于所述第三传感器信息对应的时间戳，确定历史信息中与所述时间戳对应的状态估计结果，与所述时间戳对应的状态估计结果是指，与所述时间戳对应的状态估计结果的时间戳，基于所述第三传感器信息对应的时间戳相同；然后，基于所述第三传感器信息以及所述历史信息中与所述时间戳对应的状态估计结果，利用所述第二卡尔曼滤波器进行状态估计，以获取所述时间戳对应的状态估计结果，将状态估计结果作为所述第二状态信息。

例如，参考图3，以第三传感器为提供视觉信息的相机或摄像头为例，相机或摄像头可能在时刻T_a开启快门以捕获足式机器人在时刻T_a的图像，然后对该图像进行处理，最后在当前时刻T_b，将时刻T_a对应的第三传感器信息提供给第二卡尔曼滤波器。在时刻T_b，第二卡尔曼滤波器可以根据时刻T_a对应的第一状态信息，结合时刻T_a的第三传感器信息，输出时间段T_a至T_b-1中的各个时间戳的状态估计结果。

如图3所示，在时刻T_a，第一卡尔曼滤波器的状态估计结果S_a与第二卡尔曼滤波器的状态估计结果之间存在状态增量ΔS，表示第一卡尔曼滤波器的状态估计结果S_a与第二卡尔曼滤波器的状态估计结果之间的差异。在一个示例中，第二卡尔曼滤波器可以将该状态增量ΔS叠加到所述足式机器人在当前时刻T_b对应的第一状态信息S_b，以确定所述足式机器人的当前时刻的状态信息也就是说，将状态增量ΔS叠加到所述足式机器人在当前时刻T_b对应的第一状态信息S_b，将得到的叠加结果作为所述足式机器人的当前时刻的状态信息

此外，在另一个示例中，第二卡尔曼滤波器可以基于该状态增量ΔS一一校正第一卡尔曼滤波器在时间段T_a至T_b-1中的各个时间戳确定的状态估计结果(各个时间戳确定的状态估计结果记为S_a至S_b-1)，以得到第二状态信息至其中，为第三传感器信息估计的时刻T_b-1对应的状态估计结果。例如，可以通过以下公式对第一状态信息中的每个时间戳对应的状态估计结果进行校正：其中，a<i<b。在另一个示例中，第二卡尔曼滤波器可以以时刻T_a对应的第一卡尔曼滤波器的状态估计结果S_a与第二卡尔曼滤波器的状态估计结果之间的偏移量为初始值，迭代地更新时间段T_a至T_b-1中的各个时间戳的状态估计结果，以获得第二状态信息至在另一个示例中，第二卡尔曼滤波器还可以进一步结合足式机器人的腿部运动学模型或动力学模型，基于第二卡尔曼滤波器的状态估计结果依次更新时间段T_a至T_b-1中的各个时间戳的状态估计结果以获得第二状态信息至本申请实施例对此不进行限制。

动力学模型是描述机器人的力和运动之间的关系的数学方程，作为示例，动力学模型可以是虚拟模型控制器(Virtual Model Controller，VMC)模型，弹簧负载倒立摆模(Spring Loaded Inverted Pendulum，SLIP)和浮动机体模型。

之后将参考图4和图5中描述的示例进一步说明通过第二卡尔曼滤波器获得第二状态信息的示例方案，本申请实施例在此就不再赘述。

在操作S203中，获取所述足式机器人在当前时刻对应的第一状态信息，并基于所述足式机器人的第二状态信息，确定所述足式机器人的当前时刻的状态信息。

参考图3，继续以当前时刻为T_b为例进行说明。为了得到当前时刻T_b的状态S_b，在时刻T_b，第一传感器可以采集T_b时刻对应的第一传感器信息，关节编码器可以采集T_b时刻对应的第二传感器信息。此时，第一卡尔曼滤波器可以T_b时刻对应的第一传感器信息和第二传感器信息为输入，得到时刻T_b对应的第一状态估计结果S_b，并以操作S202中的状态增量ΔS对第一状态估计结果S_b进行校正，以得到通过状态增量ΔS消除了S_b中的累积误差，进而得到了相对准确的也即，所述足式机器人的当前时刻的状态信息为经第一卡尔曼滤波器和第二卡尔曼滤波器融合后的信息，其准确度较高。

由此，本申请实施例的方法20融合了以不同频率工作的不同传感器的传感器信息以及第二传感器信息，采用两个卡尔曼滤波器解决了融合不同传感器信息的频率低、延迟高等问题，实现了高实时性、高鲁棒性、高有效性的多传感器融合状态估计，显著减小了足式机器人长时间运动时状态估计带来的累积误差。尤其是，方法20简化了卡尔曼滤波器的分析与调整，减少了运行时间。此外，第二卡尔曼滤波器可以在第三传感器信息不可用时直接被关闭，而不影响整个状态估计装置的运行。

接下来，参考图4，结合图1描述足式机器人100以及图2至图3描述的方法20，进一步描述操作S201至操作S203的一些细节。其中，图4是示出根据本申请实施例的用于足式机器人的状态估计装置40的部分结构图。

如图4所示，用于足式机器人的状态估计装置40可选地包括第一传感器、第二传感器、第三传感器、第一卡尔曼滤波器和第二卡尔曼滤波器。其中，第一卡尔曼滤波器可以以高频低延时状态运行，而第二卡尔曼滤波器可以以低频高延时状态运行。

第一传感器，被配置为获取所述足式机器人在第一时间戳集合中的每个时间戳对应的第一传感器信息以及所述足式机器人在当前时刻对应的第一传感器信息。由前述可知，足式机器人中的第一传感器可包括IMU传感器，IMU传感器可以以第一频率在多个时刻采集足式机器人的姿态信息和加速度，以作为该时刻对应的第一传感器信息。IMU传感器可以被配置为在多个不同的离散时刻，获取这些时刻对应的各个关节的三轴姿态角(或角速率)以及加速度。IMU传感器输出的数据包括时间戳、三维加速度、三维角速度、朝向等等，本申请实施例并不以此为限。

例如，作为第二传感器的关节编码器可选地被配置为获取所述足式机器人在第二时间戳集合中的每个时间戳对应的第二传感器信息，以及获取所述足式机器人在当前时刻对应的第二传感器信息。作为一个示例，关节编码器可以在每个时刻采集足式机器人的每条机械腿上的各个关节的关节角信息(如关节角度、角速度反馈值等)，以作为该时刻对应的第二传感器信息。例如，关节编码器可以被配置为针对多个不同的时间戳，获取这些时间戳对应的所有关节的角度q[]和关节角速度

第一卡尔曼滤波器，被配置为基于所述多个时间戳对应的第一传感器信息和所述第二传感器信息，确定所述足式机器人的第一状态信息。可选地，第一卡尔曼滤波器还包括观测模型和预测模型。所述观测模型用于状态观测，通过状态观测可获取状态观测数据。所述预测模型用于状态预测，通过状态预测可获取状态预测数据。如之后详述的，所述预测模型通过第一传感器信息获取预测状态和对应协方差，所述观测模型通过第二传感器信息获得观测状态和对应协方差。当然本申请实施例并不以此为限。

具体地，假设第一时间戳集合和第二时间戳集合均包括时间戳T_i。针对时间戳T_i，所述第一卡尔曼滤波器进行状态估计以获取时间戳T_i对应的状态估计结果，包括：将时间戳T_i对应的第一传感器信息输入至观测模型，以获取时间戳T_i对应的状态观测数据；将时间戳T_i的前一时间戳T_i-1对应的状态估计结果和时间戳T_i对应的第一传感器信息输入至预测模型，以获取时间戳T_i对应的状态预测数据；以及使用基于时间戳T_i对应的第二传感器获得的测量值，对时间戳T_i对应的状态预测数据进行校正，以获取时间戳T_i对应的状态估计结果。例如，所述测量值是时间戳T_i对应的第二传感器信息经过运动学解算后得到的。

作为一个示例，假设观测模型是基于观测矩阵H的，用于实现观测量到状态观测数据的映射，时间戳T_i对应的状态观测数据记为Y_i，观测模型可以被表示为Y_i＝Hx_i，其中x_i为时间戳T_i对应的观测量，其是基于第一传感器信息而确定的。作为又一个示例，预测模型可以被表示为其中m_i～N(0,Q_i)为预测噪音，A为状态转移矩阵，B为控制矩阵。

在具体实现中，第一卡尔曼滤波器确定足式机器人在时刻T_i的第一状态信息的大致原理如下：

首先，可调用足式机器人中的IMU传感器，采集足式机器人在时刻T_i的第一传感器信息，其中，时刻T_i的第一传感器信息包括时刻T_i的加速度信息(其可包括足式机器人在多个方向(如竖直方向、水平方向)上的加速度)和姿态信息，以及调用第二传感器关节编码器确定足式机器人的各个关节在时刻T_i的关节角信息(如关节角的角度、角速度反馈值等)。

然后，可将时刻T_i的姿态信息和关节角信息汇入观测模型计算出状态观测数据，该状态观测数据可包括：多个状态观测量的值。多个状态观测量的值包括：足式机器人的各条机械腿的足端在时刻T_i的观测位置、足式机器人的质心在时刻T_i的观测位置。作为一个示例，观测模型可以输出一组以时间戳标识的位姿数据。例如，所述位姿数据可选地包括世界坐标系/机体坐标系下质心和足端的XYZ坐标轴的值、朝向数据(以一个四元数表示)、以及足式机器人100在世界坐标系/机体坐标系下沿XYZ坐标轴的速度等等。

同时，还可将足式机器人在时刻T_i的前一时刻T_i-1的状态估计结果、足式机器人在时刻T_i的加速度信息、姿态信息中的至少一项汇入至预测模型，以计算出时刻T_i的状态预测数据。该状态预测数据可包括多个状态预测量的值以及先验协方差。多个状态预测量的值包括足式机器人的各条机械腿的足端在时刻T_i的预测位置、足式机器人的质心在时刻T_i的预测位置、足式机器人的质心在时刻T_i的速度等。

接着，第一卡尔曼滤波器可以基于时刻T_i的状态观测数据和时刻T_i状态预测数据确定时刻T_i对应的状态估计结果。第一卡尔曼滤波器的目标是在给定时刻T_i的状态观测数据、测量值和状态预测数据的情况下，使用状态观测数据和测量值对状态预测数据进行校正以获取对应的状态估计结果。

第三传感器，被配置为获取所述足式机器人在所述多个时间戳中的一个时间戳对应的第三传感器信息。由前述可知，足式机器人中的第三传感器可包括提供视觉信息的相机或摄像头(以下又叫做视觉传感器)，视觉里程计可以将视觉传感器采集到的图像信息转化为足式机器人在世界坐标系下的位置信息和姿态信息。第三传感器例如是一种双目单通道的相机，并且每次拍摄1456*1088像素的照片，且该照片中的每个像素用八比特来表示。第三传感器可以每隔0.1s触发一次拍摄，当然本申请实施例并不以此为限，第三传感器还可以以更长或更短的时间间隔触发一次拍摄。第三传感器还例如是一种单目单通道的相机，其拍摄的照片的分辨率为640x576或512x512，相片中每个像素用16比特表示。当然本申请实施例并不以此为限。

第二卡尔曼滤波器，被配置为基于所述多个时间戳中的一个时间戳对应的第三传感器信息和所述第一状态信息，利用第二卡尔曼滤波器确定所述足式机器人的第二状态信息。可选地，第二卡尔曼滤波器还包括视觉里程计(Visual odometry)。视觉里程计可以通过分析一系列图像序列，来确定足式机器人的朝向和位置。

在具体实现中，第二卡尔曼滤波器确定足式机器人在时间戳T_i的第二状态信息的大致原理如下：

首先，可调用视觉传感器采集足式机器人在时间戳T_i-c的第三传感器信息。如前述可知，第三传感器采集的数据存在延迟。时间戳T_i-c采集到的第三传感器信息可能会在时间戳T_i才被视觉里程计计算结束并解析出时间戳T_i-c的测量信息。作为一个示例，第三传感器信息延时的最大值为c个时间戳对应的时长。类似地，该测量信息可包括：多个状态观测量的值。多个测量信息值包括：足式机器人的质心在时间戳T_i-c的位置、足式机器人的质心在时间戳T_i-c的速度等等。

然后，可从第一卡尔曼滤波器中获取历史信息，其包括第一卡尔曼滤波器计算的时间戳T_i-c至时间戳T_i的状态估计结果。也即，第一卡尔曼滤波器的历史数据窗口为c个时间戳对应的时长。第二卡尔曼滤波器可以基于视觉里程计获取的时间戳T_i-c的测量信息以及历史信息中来自第一卡尔曼滤波器的时间戳T_i-c的状态估计结果，确定校正后的时间戳T_i-c的状态估计结果作为时间戳T_i-c的第二状态信息。基于校正后的时间戳T_i-c的状态估计结果，第二卡尔曼滤波器可以预测时间戳T_i-c+1的状态估计结果。以此类推，直到第二卡尔曼滤波器计算出时间戳T_i的状态估计结果作为第二状态信息。

进一步地，所述第一卡尔曼滤波器，还被配置为基于所述第二状态信息以及所述足式机器人在当前时刻对应的第一状态信息，确定所述足式机器人在当前时刻的状态信息。

如上所示，假设当前时刻为T_b，上述的第一传感器已经采集到了时刻T_b的第一传感器信息并且关节编码器也采集到了时刻T_b的第二传感器信息。同时，第二卡尔曼滤波器还可以基于第一卡尔曼滤波器提供的第一状态估计结果S_a和时间戳T_a对应的第三传感器信息，计算出状态增量ΔS，表征第一卡尔曼滤波器提供的第一状态估计结果S_a和时间戳T_a对应的第三传感器信息之间的差异。此时，第一卡尔曼滤波器可以基于上述信息，计算出时刻T_b对应的状态信息。相比于第一卡尔曼滤波器直接使用由第一卡尔曼滤波器在T_b-1估计的状态估计结果来估计时刻T_b的状态信息，使用来自第二卡尔曼滤波器的状态增量ΔS所估计的时刻T_b的状态信息更为准确。

如图4所示，第一卡尔曼滤波器可以以第一频率(例如，图4示出的0.1至1kHZ)向控制器输出所述足式机器人的当前时刻的状态信息。同时，第二卡尔曼滤波器可以以第二频率(例如，图4示出的10至50HZ)向第一卡尔曼滤波器输出第二状态信息。因此，第一卡尔曼滤波器可以间隔0.02s至0.1s，基于第二状态信息调整当前时刻的状态信息，从而避免了累积误差。

由此，本申请实施例的装置40融合了以不同频率工作的不同传感器的传感器信息以及第二传感器信息，采用两个卡尔曼滤波器解决了融合不同传感器信息的不同、延迟不同等问题，实现了高实时性、高鲁棒性、高有效性的多传感器融合状态估计，显著减小了足式机器人长时间运动时状态估计带来的累积误差。尤其是，执行方法20的装置40简化了卡尔曼滤波器的分析与调整，减少了运行时间。此外，第二卡尔曼滤波器可以在第三传感器信息不可用时直接被关闭，而不影响整个状态估计装置的运行。

接下来，参考图5和图6，结合图1描述足式机器人100、图2至图3描述的方法20以及参考图4描述的装置40，进一步描述上述各个组件执行上述各个操作的一些细节。其中，图5是示出根据本申请实施例的用于足式机器人的状态估计装置40执行方法20的示意图。图6是示出根据本申请实施例的方法20的执行效果与传统方案的对比图。

参考图5，结合上述内容，可以使用预测模型来对各个状态量进行观测(这一过程又称为状态预测)。预测模型的输入可以可选地包括第一传感器信息。其中，第一传感器信息包括：世界坐标系和机身坐标系之间的旋转矩阵R(以下又记为^WR_B，表示机身坐标系B相对于世界坐标系W的旋转矩阵)，机身坐标系下角速度ω、机身坐标系下的加速度a等等。令预测模型输出x为x＝[p^T v^T p₁ ^T p₂ ^T p₃ ^T p₄ ^T]^T。

其中，p表示足式机器人在世界坐标系下的机身质心位置，v表示世界坐标系下的机身质心速度，表示世界坐标系下的足端位置，表示世界坐标系下足端速度(假设足端速度为零，也即足端和地面无滑动)，f_i为机械腿的索引。以图1中示出足式机器人100为例，在f_i＝1时，p_fi表示左前腿在世界坐标系下的足端位置，表示左前腿在世界坐标系下足端速度。在f_i＝2时，表示右前腿在世界坐标系下的足端位置，表示右前腿在世界坐标系下足端速度。在f_i＝3时，表示左后腿在世界坐标系下的足端位置，表示左后腿在世界坐标系下足端速度。在f_i＝4时，表示右后腿在世界坐标系下的足端位置，表示右后腿在世界坐标系下足端速度。

具体地，预测模型可以基于以下描述的第一方程(1)至第三方程(3)来分别预测足式机器人的本体位置、本体速度和足端位置以获取上述的x。第一方程(1)又称为足式机器人本体位置离散预测方程。第二方程(2)又称为足式机器人本体速度离散预测方程。第三方程(3)又称为足式机器人足端位置离散预测方程。

v_k+1＝v_k+(^WR_Ba_k+g)dt (2)

其中，a_k为机身坐标系下的加速度，dt为时间步长，g表示重力加速度，下标k表示时间步的索引。

参考图5，结合上述内容，还可以使用观测模型来对各个状态量进行观测(这一过程又称为状态观测)。观测模型可以至少部分地基于图5示出的腿部运动学模型来进行状态观测。观测模型可以以第一传感器信息和第二传感器信息为输入，以状态观测数据为输出。

第二传感器信息包括关节角信息p。状态观测数据包括世界坐标系下足端相对于质心的位置q_rel、世界坐标系下足端相对于质心的速度可选地，观测模型还可以以足端触地检测器为输入，以得到更精确的足端观测数据。

具体地，腿部运动学模型是对足式机器人的腿部进行数学建模得到的。例如可以采用MIT Cheetah运动学建模技术，腿部运动学模型用于表示足式机器人的腿部末端运动状态和关节运动状态之间的关系，例如足式机器人质心与足端之间的位置和速度相对关系，其用来消除质心与足端之间的状态漂移。例如，在一个具体实现中，所述基于所述第一传感器信息和第二传感器信息，利用第一卡尔曼滤波器确定所述足式机器人的第一状态信息还可以包括：基于所述第二传感器信息，基于所述足式机器人的腿部运动学模型，确定所述足式机器人的运动信息；至少部分地基于所述运动信息，利用第一卡尔曼滤波器确定所述足式机器人的第一状态信息。

在一个示例中，观测模型可以基于所述足式机器人的腿部运动学模型，计算所述足式机器人的本体与足端之间的相对位置测量残差、以及所述足式机器人的本体与足端之间的相对速度测量残差，然后将所述足式机器人的本体与足端之间的相对位置测量残差、以及所述足式机器人的本体与足端之间的相对速度测量残差(也即上述的运动信息)，作为所述状态观测数据。

观测模型可以对应地以第四方程(4)和第五方程(5)计算测量残差。其中，第四方程(4)用于计算足式机器人本体与足端之间的相对位置测量残差，第五方程(5)用于计算足式机器人本体与足端之间的相对速度测量残差。其中，ω_b为机身坐标系下角速度。

如上所述，第一卡尔曼滤波器可被配置为基于所述多个时间戳对应的第一传感器信息和所述第二传感器信息，确定所述足式机器人的第一状态信息。假设第一卡尔曼滤波器在时刻T_k(对应于第k个时间步)，获取到各个关节电机在时刻T_k的控制输入u_k、第一传感器在时刻T_k采集到的第一传感器信息z_k。同时，第一卡尔曼滤波器还知晓时刻T_k-1对应的先验状态第一卡尔曼滤波器的目标是基于上述各个值来估计状态均值μ和协方差σ。第一卡尔曼滤波器的状态空间方程可以以第六方程(6)和第七方程(7)示出。
x_k＝Ax_k-1+Bu_k+m_k (6)
z_k＝Cx_k-1+n_k (7)

其中m_k～N(0,Q_k)为预测噪音，n_k～N(0,R_k)为观测噪音，A为状态转移矩阵，B为控制矩阵，C为观测矩阵。第一卡尔曼滤波器可以以第八方程(8)至第十二方程(12)，对状态观测数据和状态预测数据进行处理，以融合得到时间步k对应的状态估计结果。

其中P为误差协方差矩阵，初始值由可以设定经验值或任意值。K为卡尔曼增益矩阵，I为单位矩阵，x^-表示x的先验值。表示x的估计值。也即，标识P_k的先验估计值。标识x_k的先验估计值。其中，的值为第四方程(4)计算得到的足式机器人本体与足端之间的相对位置测量残差和第五方程(5)计算得到的相对速度测量残差的组合。其中，z_k又称为测量值，其是通过对第二传感器信息进行运动学解算得到的；又称为观测量或状态观测数据。从而，即可以被定义为残差。由此，第一卡尔曼滤波器能够估计出时刻T_k对应的状态估计结果，并可以将多个时间步对应的状态估计结果作为第一状态信息，经信息同步后输出至第二卡尔曼滤波器。作为一个示例，第一卡尔曼滤波器估计出时刻T_k对应的状态估计结果包括时刻T_k对应的后验状态和后验协方差

继续参考图5，假设第三传感器为前述的视觉传感器。视觉传感器输出的第三传感器信息z′_s为z′_s＝[p_vo ^T v_vo ^T]，其中，p_vo为视觉传感器在时间步s测量得到的世界坐标系下机身位置，v_vo为视觉传感器在时间步s测量得到的世界坐标系下机身速度。由此，第二卡尔曼滤波器对应的状态空间方程可以第十三方程(13)示出。
z′_s＝C′_sx_s+n′_s (13)

其中，n′_k～N(0,R′_k),s＝k-N。也即，第三传感器信息相对于上述的第一卡尔曼滤波器的信息存在延迟N个时间步(时间戳)的输出。因此，第三传感器和第一状态信息可以通过信息同步，以获得用于校正第一状态信息的测量误差。

具体地，如上所述，由于视觉数据具有一定的延迟，所以优先地，可以将第一状态信息以及误差协方差矩阵，与第三传感器信息z和第三传感器对应的误差协方差矩阵进行时间同步。也即，可以如上所述，将对应于时间步s的第三传感器信息、与对应于时间步s的第一卡尔曼滤波器的状态估计结果、以及误差协方差矩阵，作为后续方程中的迭代参数，基于上述的卡尔曼滤波器的原理进行融合。

例如，第三传感器可以使用第十四方程(14)获取用于校正第一状态信息的相对位置测量残差p_vo-p和相对速度测量残差v_vo-v。

接着第二卡尔曼滤波器可以基于第十五方程(15)至第十七方程(17)来将上述的经时间同步后的第一状态信息和第三传感器信息进行融合，以获得第二状态信息。其中，相对位置测量残差和相对速度测量残差可以用于组成第十七方程中

其中P′为第二卡尔曼滤波器使用的误差协方差矩阵。K′为第二卡尔曼滤波器使用的卡尔曼增益矩阵，I为单位矩阵，x^-表示x的先验值。标识第二卡尔曼滤波器是输出的状态估计值的先验估计值。如上所述，等于第一卡尔曼滤波器在时间步s输出的后验状态等于第一卡尔曼滤波器在时间步s输出的后验协方差由此，实现了将第一卡尔曼滤波器获得的后验状态和后验协方差作为所述第二卡尔曼滤波器的先验状态和先验协方差来与第二卡尔曼滤波器的观测信息进行融合，进而获取时间步s对应的状态估计结果作为所述第二状态信息。

由于第一卡尔曼滤波器在接收到时刻T_k对应的第二状态信息之后，还能结合时刻T_k对应的第一传感器信息和第二传感器信息，基于上述的第一方程(1)至第十二方程(12)确定时刻T_k对应的状态估计结果。

此时，第一卡尔曼滤波器可以基于和之间的状态增量ΔS，将状态增量ΔS叠加到第一卡尔曼滤波器在时刻T_k对应的状态估计结果，以实现对时间步k处的状态估计结果进行校正。

此外，在另一些示例中，第二卡尔曼滤波器还能够通过反复迭代N次，从时间步s对应的估计出时刻T_k对应的状态估计结果作为第二状态信息输出至第一卡尔曼滤波器，以对当前的状态信息进行校正。本申请实施例并不以此为限。

如图6所示，示出了动作捕捉系统真值数据、传统方法估计结果、以及以采用方法20获得的估计结果对应的三条曲线，其横轴均为时间，竖轴为位置数据。在足式机器人自由运动200秒后，X、Y方向位置的累积误差分别减少了96.08％，62.52％，均方根误差分别减少了92.94％，58.63％。另外速度的均方根误差也分别减小了31.05％和16.47％。可见，方法20融合了视觉数据后可以明显减小累积误差。

由此，本申请实施例的装置40融合了以不同频率工作的不同传感器的传感器信息以及第二传感器信息，采用两个卡尔曼滤波器解决了融合不同传感器信息的频率不同、延迟不同等问题，实现了高实时性、高鲁棒性、高有效性的多传感器融合状态估计，显著减小了足式机器人长时间运动时状态估计带来的累积误差。尤其是，执行方法20的装置40简化了卡尔曼滤波器的分析与调整，减少了运行时间。此外，第二卡尔曼滤波器可以在第三传感器信息不可用时直接被关闭，而不影响整个状态估计装置40的运行。

可选的，本申请实施例还提供了一种足式机器人，包括存储器和处理器，存储器中存储有计算机程序，该处理器执行计算机程序时实现上述各方法实施例中的步骤。

本申请实施例还提供了一种计算机可读存储介质，用于存储计算机程序。该计算机可读存储介质可应用于足式机器人，并且该计算机程序使得足式机器人执行本申请实施例中的状态估计方法中的相应流程，为了简洁，在此不再赘述。

本申请实施例还提供了一种计算机程序产品，该计算机程序产品包括计算机指令，该计算机指令存储在计算机可读存储介质中。足式机器人的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得足式机器人执行本申请实施例中的状态估计方法中的相应流程，为了简洁，在此不再赘述。

本申请实施例还提供了一种计算机程序，该计算机程序包括计算机指令，计算机指令存储在计算机可读存储介质中。足式机器人的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得足式机器人执行本申请实施例中的状态估计方法中的相应流程，为了简洁，在此不再赘述。

根据本申请实施例的又一方面，还提供了一种电子设备，用于实施根据本申请实施例的方法。图7示出了根据本申请实施例的电子设备2000的示意图。

如图7所示，所述电子设备2000可以包括一个或多个处理器2010，和一个或多个存储器2020。其中，所述存储器2020中存储有计算机可读代码，所述计算机可读代码当由所述一个或多个处理器2010运行时，可以执行如上所述的方法。

本申请实施例中的处理器可以是一种集成电路芯片，具有信号的处理能力。上述处理器可以是通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、操作及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等，可以是X86架构或ARM架构的。

一般而言，本申请实施例的各种示例实施例可以在硬件或专用电路、软件、固件、逻辑，或其任何组合中实施。某些方面可以在硬件中实施，而其他方面可以在可以由控制器、微处理器或其他计算设备执行的固件或软件中实施。当本申请实施例的各方面被图示或描述为框图、流程图或使用某些其他图形表示时，将理解此处描述的方框、装置、系统、技术或方法可以作为非限制性的示例在硬件、软件、固件、专用电路或逻辑、通用硬件或控制器或其他计算设备，或其某些组合中实施。

例如，根据本申请实施例的方法或装置也可以借助于图8所示的计算设备3000的架构来实现。如图8所示，计算设备3000可以包括总线3010、一个或多个CPU 3020、只读存储器(ROM)3030、随机存取存储器(RAM)3040、连接到网络的通信端口3050、输入/输出组件3060、硬盘3070等。计算设备3000中的存储设备，例如ROM 3030或硬盘3070可以存储本申请实施例提供的方法的处理和/或通信使用的各种数据或文件以及CPU所执行的程序指令。计算设备3000还可以包括用户界面3080。当然，图8所示的架构只是示例性的，在实现不同的设备时，根据实际需要，可以省略图8示出的计算设备中的一个或多个组件。

根据本申请实施例的又一方面，还提供了一种计算机可读存储介质。图9示出了根据本申请实施例的存储介质4000的示意图。

如图9所示，所述计算机可读存储介质4020上存储有计算机可读指令4010。当所述计算机可读指令4010由处理器运行时，可以执行参照以上附图描述的根据本申请实施例的方法。本申请实施例中的计算机可读存储介质可以是易失性存储器或非易失性存储器，或可包括易失性和非易失性存储器两者。非易失性存储器可以是只读存储器(ROM)、可编程只读存储器(PROM)、可擦除可编程只读存储器(EPROM)、电可擦除可编程只读存储器(EEPROM)或闪存。易失性存储器可以是随机存取存储器(RAM)，其用作外部高速缓存。通过示例性但不是限制性说明，许多形式的RAM可用，例如静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、同步动态随机存取存储器(SDRAM)、双倍数据速率同步动态随机存取存储器(DDRSDRAM)、增强型同步动态随机存取存储器(ESDRAM)、同步连接动态随机存取存储器(SLDRAM)和直接内存总线随机存取存储器(DR RAM)。应注意，本文描述的方法的存储器旨在包括但不限于这些和任意其它适合类型的存储器。应注意，本文描述的方法的存储器旨在包括但不限于这些和任意其它适合类型的存储器。

本申请实施例还提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行根据本申请实施例的方法。

需要说明的是，附图中的流程图和框图，图示了按照本申请实施例各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，所述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

在上面详细描述的本申请实施例的示例实施例仅仅是说明性的，而不是限制性的。本领域技术人员应该理解，在不脱离本申请实施例的原理和精神的情况下，可对这些实施例或其特征进行各种修改和组合，这样的修改应落入本申请实施例的范围内。

Claims

一种用于足式机器人的状态估计方法，由计算机设备执行，所述方法包括：

获取所述足式机器人的第一传感器信息和第二传感器信息；

基于所述第一传感器信息和第二传感器信息，利用第一卡尔曼滤波器确定所述足式机器人的第一状态信息，并保存一段时间的第一状态信息作为第二卡尔曼滤波的历史信息；

获取所述足式机器人的第三传感器信息，并基于所述第三传感器信息和所述历史信息，利用所述第二卡尔曼滤波器确定所述足式机器人的第二状态信息；以及

基于所述足式机器人的第二状态信息，对所述足式机器人在当前时刻的第一状态信息进行更新，以确定所述足式机器人的当前时刻的状态信息。
如权利要求1所述的方法，其中，所述第一传感器信息是由以第一频率工作的第一传感器采集的，所述第二传感器信息是由以第二频率工作的第二传感器采集的，所述第三传感器信息是由以第三频率工作的第三传感器采集的，所述第一频率、所述第二频率和所述第三频率互不相同。
如权利要求2所述的方法，其中，所述第二传感器是关节编码器，所述基于所述第一传感器信息和第二传感器信息，利用第一卡尔曼滤波器确定所述足式机器人的第一状态信息还包括：

基于所述第二传感器信息和所述足式机器人的腿部运动学模型，确定所述足式机器人的运动信息；

至少部分地基于所述运动信息，利用第一卡尔曼滤波器确定所述足式机器人的第一状态信息。
如权利要求1至3任一项所述的方法，其中，

所述第一传感器信息和所述第二传感器信息分别带有时间戳；

所述基于所述第一传感器信息和第二传感器信息，利用第一卡尔曼滤波器确定所述足式机器人的第一状态信息，包括：

将所述第一传感器信息和所述第二传感器信息，依次作为第一卡尔曼滤波器的输入；以及

通过第一卡尔曼滤波器进行状态估计，得到带有时间戳的足式机器人的第一状态信息，并将带有时间戳的第一状态信息保存为历史信息，其中，所述第一状态信息包括第一卡尔曼滤波器输出的带有时间戳的多个状态估计结果。
如权利要求4所述的方法，其中，所述利用第二卡尔曼滤波器确定所述足式机器人的第二状态信息，包括：

确定所述第三传感器信息对应的时间戳；

将与所述第三传感器信息的时间戳对应的历史信息和所述第三传感器信息作为第二卡尔曼滤波器的输入；以及

通过第二卡尔曼滤波器进行状态估计，得到所述第三传感器信息对应的时间戳的状态估计结果作为所述第二状态信息。
如权利要求5所述的方法，其中，所述通过第二卡尔曼滤波器进行状态估计，得到足式机器人的第二状态信息，包括：

基于所述第三传感器信息对应的时间戳，确定所述历史信息中与所述时间戳对应的状态估计结果；

基于所述第三传感器信息以及所述历史信息中与所述时间戳对应的状态估计结果，利用所述第二卡尔曼滤波器进行状态估计，以获取所述时间戳对应的状态估计结果，将所述状态估计结果作为所述第二状态信息。
如权利要求6所述的方法，其中，

所述对所述足式机器人在当前时刻的第一状态信息进行更新，以确定所述足式机器人的当前时刻的状态信息，包括：

将所述第二状态信息相对于所述第一状态信息的状态增量，叠加到所述足式机器人在当前时刻对应的第一状态信息，以确定所述足式机器人的当前时刻的状态信息。
如权利要求4至7任一项所述的方法，其中，所述第一卡尔曼滤波器包括预测模型和观测模型，所述预测模型用于通过所述第一传感器信息获取预测状态和对应协方差，所述观测模型通过第二传感器信息获得观测状态和对应协方差。
如权利要求6所述的方法，其中，所述利用所述第二卡尔曼滤波器进行状态估计，以获取所述时间戳对应的状态估计结果，包括：

以第三传感器信息延时的最大值作为历史数据窗口，保存所述历史数据窗口区间内由所述第一卡尔曼滤波器获得的后验状态和后验协方差；

将所述后验状态和后验协方差对应作为所述第二卡尔曼滤波器的先验状态和先验协方差，将所述先验状态、所述先验协方差与所述第二卡尔曼滤波器的观测信息进行融合，以获取所述时间戳对应的状态估计结果。
如权利要求8所述的方法，其中，所述观测模型用于至少部分地基于所述足式机器人的腿部运动学模型来进行状态观测，所述腿部运动学模型用于指示足式机器人质心与足端之间的相对位置和速度关系。
如权利要求10所述的方法，其中，所述观测模型进行所述状态观测的方式包括：

基于所述足式机器人的腿部运动学模型，计算所述足式机器人的本体与足端之间的相对位置测量残差、以及所述足式机器人的本体与足端之间的相对速度测量残差，

将所述足式机器人的本体与足端之间的相对位置测量残差以及所述足式机器人的本体与足端之间的相对速度测量残差，作为状态观测数据。
如权利要求6所述的方法，其中，所述方法还包括：

基于所述第三传感器信息，获取所述第三传感器信息对应的时间戳的所述足式机器人的本体在世界坐标系下的位置和速度；以及

基于所述第三传感器信息对应的时间戳的所述足式机器人的本体在世界坐标系下的位置和速度，计算用于校正所述第一卡尔曼滤波的状态估计信息的累积误差。
一种用于足式机器人的状态估计装置，所述装置包括：

第一传感器，被配置为获取所述足式机器人的第一传感器信息；

第二传感器，被配置为获取所述足式机器人的第二传感器信息；

第三传感器，被配置为获取所述足式机器人的第三传感器信息；

第一卡尔曼滤波器，被配置为基于所述第一传感器信息和所述第二传感器信息，确定所述足式机器人的第一状态信息，并将保存一段时间的第一状态信息作为历史信息；

第二卡尔曼滤波器，被配置为基于所述第三传感器信息和所述历史信息，利用第二卡尔曼滤波器确定所述足式机器人的第二状态信息；

其中，所述第一卡尔曼滤波器还被配置为基于所述第二状态信息以及所述足式机器人在当前时刻对应的第一状态信息，确定所述足式机器人在当前时刻的状态信息。
一种计算机设备，包括输入接口和输出接口，还包括：

处理器，适于实现一条或多条指令；以及，计算机可读存储介质；

所述计算机可读存储介质存储有一条或多条指令，所述一条或多条指令适于由所述处理器加载并执行如权利要求1-12任一项所述的足式机器人的状态估计方法。
一种计算机可读存储介质，所述计算机可读存储介质存储有一条或多条指令，所述一条或多条指令适于由处理器加载并执行如权利要求1-12任一项所述的足式机器人的状态估计方法。
一种计算机程序产品，所述计算机程序产品包括计算机程序；所述计算机程序被处理器执行时，实现如权利要求1-12任一项所述的足式机器人的状态估计方法。