CN115312054B - 一种基于语音交互的四足机器人运动控制方法及系统 - Google Patents
一种基于语音交互的四足机器人运动控制方法及系统 Download PDFInfo
- Publication number
- CN115312054B CN115312054B CN202210938799.3A CN202210938799A CN115312054B CN 115312054 B CN115312054 B CN 115312054B CN 202210938799 A CN202210938799 A CN 202210938799A CN 115312054 B CN115312054 B CN 115312054B
- Authority
- CN
- China
- Prior art keywords
- voice
- robot
- control
- signal
- motion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000033001 locomotion Effects 0.000 title claims abstract description 72
- 230000003993 interaction Effects 0.000 title claims abstract description 45
- 238000000034 method Methods 0.000 title claims abstract description 32
- 238000012545 processing Methods 0.000 claims abstract description 9
- 238000004458 analytical method Methods 0.000 claims abstract description 5
- 230000005021 gait Effects 0.000 claims description 19
- 210000004394 hip joint Anatomy 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 8
- 210000000629 knee joint Anatomy 0.000 claims description 6
- 210000002414 leg Anatomy 0.000 claims description 5
- 230000009471 action Effects 0.000 claims description 4
- 239000003550 marker Substances 0.000 claims description 4
- 230000003139 buffering effect Effects 0.000 claims description 3
- 230000005236 sound signal Effects 0.000 claims description 3
- 230000002618 waking effect Effects 0.000 claims description 3
- 230000000875 corresponding effect Effects 0.000 description 13
- 230000009191 jumping Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 230000003068 static effect Effects 0.000 description 5
- 210000000689 upper leg Anatomy 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000001276 controlling effect Effects 0.000 description 2
- WHXSMMKQMYFTQS-UHFFFAOYSA-N Lithium Chemical compound [Li] WHXSMMKQMYFTQS-UHFFFAOYSA-N 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 229910052744 lithium Inorganic materials 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000002604 ultrasonography Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J11/00—Manipulators not otherwise provided for
- B25J11/0005—Manipulators having means for high-level communication with users, e.g. speech generator, face recognition means
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J9/00—Programme-controlled manipulators
- B25J9/08—Programme-controlled manipulators characterised by modular constructions
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J9/00—Programme-controlled manipulators
- B25J9/16—Programme controls
- B25J9/1656—Programme controls characterised by programming, planning systems for manipulators
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J9/00—Programme-controlled manipulators
- B25J9/16—Programme controls
- B25J9/1679—Programme controls characterised by the tasks executed
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
- G10L17/24—Interactive procedures; Man-machine interfaces the user being prompted to utter a password or a predefined phrase
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/225—Feedback of the input speech
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Robotics (AREA)
- Mechanical Engineering (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Manipulator (AREA)
Abstract
本公开属于机器人运动控制技术领域,具体涉及一种基于语音交互的四足机器人运动控制方法及系统,包括:获取语音信号;对所获取的语音信号进行识别解析,得到语音控制信号;基于所得到的语音控制信号,启动四足机器人内部的语音控制模块,处理所得到的语音控制信号,得到控制指令;根据所得到的控制指令,实现对四足机器人的语音控制。
Description
技术领域
本公开属于机器人运动控制技术领域,具体涉及一种基于语音交互的四足机器人运动控制方法及系统。
背景技术
本部分的陈述仅仅是提供了与本公开相关的背景技术信息,不必然构成在先技术。
近年来随着深度学习算法的发展,语音识别算法也取得了长足的进步。目前语音识别的相关应用也逐渐渗透到社会的各个领域,给人们的生活带来便利。语音识别技术在智能家居、智能客服、工业控制、医疗和机器人领域都有相关应用。相较于其他交互技术,语音识别技术可以将复杂的操作转化为语音指令,从而解放人类的双手和降低操作难度。
目前在机器人领域,语音识别技术多见于服务型或娱乐机器人,多用智能取号、语音对话等静态交互,语音技术应用于机器人运动控制较少,尤其对于移动机器人或特种作业机器人,一般还是采用遥操作控制方式。对于四足机器人来说,由于其运动灵活、负载能力强、环境适应性高,使得其有了广泛的应用前景。四足机器人具有趴、站、走、跑、跳等多种运动模式,对角步态Trot、跳跃步态bond等多种步态类型,激光、视觉、超声等多种感知下自主导航避障方式,关节锁死、执行器失能等紧急避险处理方法,目前四足机器人上述控制与交互一般采用遥控器操作,由于模式多、交互复杂,无法满足使用者的友好交互体验感。由此开发了一套基于语音交互的四足机器人控制方法及系统,取代遥控器,将繁琐复杂的遥控操作转化为通俗易懂的语音指令,同时增加一定的人机交互能力,提高四足机器人的智能性。
发明内容
为了解决上述问题,针对四足机器人的语音交互控制进行了相关的研究,本公开提出了一种基于语音交互的四足机器人运动控制方法及系统,实现四足机器人的语音运动控制,极大程度上提高了使用者与机器人之间的交互体验感。
根据一些实施例,本公开的第一方案提供了一种基于语音交互的四足机器人运动控制方法,采用如下技术方案:
一种基于语音交互的四足机器人运动控制方法,包括:
获取语音信号;
对所获取的语音信号进行识别解析,得到语音控制信号;
基于所得到的语音控制信号,启动四足机器人内部的语音控制模块,处理所得到的语音控制信号,得到控制指令;
根据所得到的控制指令,实现对四足机器人的语音控制。
作为进一步的技术限定,在获取语音信号的过程中,通过设置在机器人上的麦克风阵列进行语音信号的采集。
进一步的,在语音信号的识别解析的过程中,通过离线识别引擎识别所提取到的语音信号特征,通过声学模型识别语音信息的内容并将所识别到的内容转换成标记符,在语言模型的作用下所述标记符生成相对应的语音控制信号。
作为进一步的技术限定,在获取语音信号之前,需要设置用于唤醒四足机器人进行语音识别的语音唤醒词,基于所设置的语音唤醒词唤醒四足机器人,对四足机器人发布命令以获取语音信号。
作为进一步的技术限定,所述四足机器人采用电机驱动,自由度为12,包括躯干以及与所述躯干相连接的四条腿,每条腿上均设置有分别用于控制横滚髋关节、俯仰髋关节和俯仰膝关节的3个直流无刷电机。
进一步的,启动四足机器人,选择是否采用语音控制模式,若采用,则将控制模式调到语音控制模式,基于语音控制模块接收并处理所采集到的语音控制信号,得到控制指令;根据所得到的控制指令,四足机器人做出与所得到的控制指令相匹配的动作,,并给出语音状态反馈,实现四足机器人的语音交互控制。
根据一些实施例,本公开的第二方案提供了一种基于语音交互的四足机器人运动控制系统,采用如下技术方案:
一种基于语音交互的四足机器人运动控制系统,包括:
获取模块,其被配置为获取语音信号;
识别模块,其被配置为对所获取的语音信号进行识别解析,得到语音控制信号;
处理模块,其被配置为基于所得到的语音控制信号,启动四足机器人内部的语音控制模块,处理所得到的语音控制信号,得到控制指令;
控制模块,其被配置为根据所得到的控制指令,实现对四足机器人的语音控制。
作为进一步的技术限定,四足机器人语音控制器主要包含麦克风阵列,ATS3605D芯片,UP Board板,无线模块,扬声器和电源几部分。其中,ATS3605D作为主控芯片,麦克风阵列负责声音的采集,UP Board板作为声音识别处理器,利用声音识别引擎对采集到的声音信号进行识别,并返回识别结果,用于机器人控制和交互。扬声器作为语音播报随时检测语音识别状态,无线模块可以用于连接四足机器人主控制器的无线网络,是实现语音控制的手持操作模式的基础,电池为整个语音控制器提供能量输入。
进一步的,语音控制可以分为机载操作模式与手持操作模式,机载模式即将语音控制器布置在四足机器人躯干中,通过网线将其与四足机器人主控制器连接。手持模式即将语音控制器通过无线模块与四足机器人主控制器上的无线路由器进行连接。
根据一些实施例,本公开的第三方案提供了一种计算机可读存储介质,采用如下技术方案:
一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现如本公开第一方面所述的基于语音交互的四足机器人运动控制方法中的步骤。
根据一些实施例,本公开的第四方案提供了一种电子设备,采用如下技术方案:
一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,所述处理器执行所述程序时实现如本公开第一方面所述的基于语音交互的四足机器人运动控制方法中的步骤。
与现有技术相比,本公开的有益效果为:
本公开实现了四足机器人的语音控制,可以实现四足机器人不同运动模式的切换、运动速度调整等,取代遥控器;有较好的兼容性,可以很好的移植到其他机器人平台或是遥控平台;可实现远程控制,可通过手持或是固定位置实现四足机器人的运程控制,可实现远程控制,可通过手持或是机载实现四足机器人的远程控制,只需将语音控制器与四足机器人控制器连接在同一个局域网下即可实现。
附图说明
构成本公开的一部分的说明书附图用来提供对本公开的进一步理解,本公开的示意性实施例及其说明用于解释本公开,并不构成对本公开的不当限定。
图1是本公开实施例一中的基于语音交互的四足机器人运动控制方法的流程图;
图2是本公开实施例一中的装配语音模块的四足机器人机械结构示意图;
图3是本公开实施例一中的语音控制模块的结构示意图;
图4是本公开实施例一中的四足机器人与语音模块的电气与通信连接的结构示意图;
图5是本公开实施例一中的语音交互控制的方法流程图;
图6是本公开实施例一中的语音指令解析图;
图7是本公开实施例二中的基于语音交互的四足机器人运动控制系统的结构框图;
其中,1、躯干,2、语音控制器,3、侧摆电机,4,、大腿电机,5、小腿电机,6、髋关节,7、膝关节,8、无线模块,9、麦克风阵列,10、UP Board板,11、扬声器。
具体实施方式
下面结合附图与实施例对本公开作进一步说明。
应该指出,以下详细说明都是例示性的,旨在对本公开提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本公开所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本公开的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
在本公开中,术语如“上”、“下”、“左”、“右”、“前”、“后”、“竖直”、“水平”、“侧”、“底”等指示的方位或位置关系为基于附图所示的方位或位置关系,只是为了便于叙述本公开各部件或元件结构关系而确定的关系词,并非特指本公开中任一部件或元件,不能理解为对本公开的限制。
本公开中,术语如“固接”、“相连”、“连接”等应做广义理解,表示可以是固定连接,也可以是一体地连接或可拆卸连接;可以是直接相连,也可以通过中间媒介间接相连。对于本领域的相关科研或技术人员,可以根据具体情况确定上述术语在本实公开中的具体含义,不能理解为对本公开的限制。
在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。
实施例一
本公开实施例一介绍了一种基于语音交互的四足机器人运动控制方法。
如图1所示的一种基于语音交互的四足机器人运动控制方法,包括:
获取语音信号;
对所获取的语音信号进行识别解析,得到语音控制信号;
基于所得到的语音控制信号,启动四足机器人内部的语音控制模块,处理所得到的语音控制信号,得到控制指令;
根据所得到的控制指令,实现对四足机器人的语音控制。
在本实施例中,主要针对四足机器人的运动语音控制,当发出特定语音时,语音模块可以将其采集,通过语音识别功能识别出语音指令,实现四足机器人的由卧倒到站立,进行前进,后退,左转,右转,原地踏步,再由站立到卧倒的运动控制,同时配备语音播报功能,在机器人识别语音指令成功后,发出对应语音以表明机器人接收到特定指令。
如图2、图3和图4所示,四足机器人采用电力驱动,自由度为12,包括躯干以及与躯干相连的四条腿,每条腿的上包括3个直流无刷电机,分别为横滚髋关节、俯仰髋关节和俯仰膝关节。四足机器人包含有锂电池,执行器,控制器,电源管理板,SPI信号转接板。控制器采用UP Board板,运行机器人控制算法,其上面部署了Ubuntu操作系统,并安装了PREEMPT-RT补丁,可以实现软实时操作。SPI信号转接板通过SPI与控制器通信,然后将控制器指令通过CAN接口发送给执行器,同时读取执行器反馈的状态数据发送给控制器。
本四足机器人语音控制器可实现不同运动模式的切换,大致分为四类:基本运动、步态切换、自主运动和紧急避险。基本运动即为四足机器人一些基本动作,包括:前进、后退、左转、右转、站起来、趴下、停止。步态切换为不同步态之间的变换,基本步态包括:对角小跑,跳跃,静步态越障,行走,奔跑。自主运动包括:激光建图,人员跟随,自主避障,自主导航,对话交互。紧急避险主要是针对机器人异常工作状态来说,当机器人失去平衡摔倒或处于异常工作状态时,使机器人恢复正常,包括恢复站立、参数清零、关闭电机等指令。当机器人接收到语音控制器识别的指令后,会根据不同的指令设定相应的参数,最基本的比如步高,步频,步长,x轴方向速度,y轴方向速度等等,将这些参数传给四足机器人WBC求解器中,其中WBC求解器为一种机器人运动控制算法,由WBC求解出对应的关节扭矩、位置和速度命令,实现对四足机器人不同运动状态的控制。
在本四足机器人的语音控制中,唤醒词为“小狗小狗”,唤醒后麦克风阵列确定主麦方向并收集语音指令。在给出命令时,如有需要可以加前缀词“小狗”、“狗”,或者不加前缀,同时注意,在指示灯灭的时候给出指令设别成功率较高。这是因为语音模块每次录音的时间是固定的,录音完成后会进行识别,而识别时指示灯会熄灭。
如图6所示,对应基本运动模式,其不同指令对应命令为:前进—“前进/向前”,后退—“后退/向后”,左转—“左转/向左”,右转—“右转/向右”,停止—“停下来/停止”,站起来—“站起来/预备”,趴下—“趴下/卧倒”。当语音指令为前进时,对应的将运动调为运动模式,x轴速度设为0.5m/s,角速度设为0,步频默认为2.5Hz,步高为0.04m,给定以上初值后,将其传递给四足机器人控制器即可实现前进功能。对应的,后退将x轴速度设为-0.5m/s,其余均相等;
当给定左转命令时,将模式调为运动模式,角速度设为0.5rad/s,x轴速度设为0,步频默认设为2.5Hz,步高为0.04m。对应的,右转将角速度设为-0.05rad/s,其余均与左转相同。停止,即将角速度与x轴速度均设为0。站起来、趴下均为单独的运动模式,当收到对应命令时,四足机器人会切换到相应状态。除站起来和趴下指令外,其他运动均可直接由上个状态切换过去,该模式下可以实现四足机器人的基本运动;
步态切换对应的命令为:对角小跑—“对角步态/对角小跑”,跳跃—“跳跃/跳一跳”,静步态越障—“静步态/爬台阶”,行走—“走一走/散步”,奔跑—“奔跑/跑起来”,以上几条命令均可以改变四足机器人的步态,不同步态对应于不同的前进速度,适应于不同的环境,比如正常行走使用对角小跑步态,快速行走可以使用奔跑步态,跨越障碍物可以使用跳跃或静步态,不同步态之间切换无需缓冲可直接切换;
自主运动对应的指令为:激光建图—“建图/3D建图”,人员跟随—“跟着我/开始跟随”,自主避障—“注意前方障碍/避障”,自主导航—“去目标点/自动导航”。自主避障,开启自主避障功能后,四足机器人可以在运动过程中,自动识别障碍物并避开;人员跟随可以实现四足机器人对特定人员的跟随;自主导航,可以预先给四足机器人指定位置,依靠四足机器人上面的视觉模块自动识别周围环境,并顺利到达目的地;激光建图,可以在特定环境下,搭建栅格地图,在这几个指令下,基本采用对角小跑步态,前进速度为0.5m/s,若是转弯,角速度为0.5rad/s,同时也支持改变自主运动指令的速度以及步态切换;
紧急避险对应的指令为:参数清零—“参数清零/参数置零”,该状态为初始化机器人运动参数,便于下一步状态调整;关闭电机—“关闭电机”,主要是用来使电机失能,不再处于伺服状态;恢复站立—“恢复站立”,通过翻滚,使机器人发生侧翻时,恢复正常姿态,可随时恢复站立。
如图5所示,语音控制具体流程为:当命令者给出语音控制命令时,首先是通过麦克风阵列对声音命令进行采集,然后通过离线识别引擎对采集到的语音进行语音识别,识别出里面的控制信息后将其转化为对应的命令,一方面将命令通过TCP/IP协议传递给四足机器人运动控制器,实现四足机器人的运动,完成后刷新麦克风模块的主麦方向;另一方面将命令转化为语音文件,通过扬声器将语音文件播放出来,让命令发布者确定机器人是否接收到命令。具体的操作为:首先四足机器人自启动,此时选择是否采用语音控制,若采用语音控制,则将控制模式调到语音控制模式,然后给语音控制器通电,并使用网线或是通过无线网络将其与控制器相连接,在语音控制器上启动ros节点后,发出语音命令,四足机器人作出相应动作,同时进行语音播报,播放成功识别的命令。
对于涉及到的语音播报功能,提供了两个版本,分别为离线版和在线版,在线版需要有网络连接,使用时可以使用无线网卡连接网络,实现语音命令的在线合成与播放。离线版是将已有的命令提前通过语音模块生成,识别成功到相应命令时播放对应语音文件即可。
本实施例实现了四足机器人的语音控制,可以实现四组机器人不同运动模式的切换,基本取代遥控器;有较好的兼容性,可以很好的移植到其他机器人平台或是遥控平台;可实现远程控制,可通过手持或是固定位置实现四足机器人的运程控制,只需将语音控制器与四足机器人控制器连接在同一个局域网下即可实现。
实施例二
本公开实施例二介绍了一种基于语音交互的四足机器人运动控制系统。
如图7所示的一种基于语音交互的四足机器人运动控制系统,包括:
获取模块,其被配置为获取语音信号;
识别模块,其被配置为对所获取的语音信号进行识别解析,得到语音控制信号;
处理模块,其被配置为基于所得到的语音控制信号,启动四足机器人内部的语音控制模块,处理所得到的语音控制信号,得到控制指令;
控制模块,其被配置为根据所得到的控制指令,实现对四足机器人的语音控制。
在本实施例中,主要针对四足机器人的运动系统进行介绍,说明语音控制器的基本组成。
四足机器人的语音控制器包括:ATS3605D芯片、麦克风阵列、UP Board板、无线模块、扬声器和电源。其中,ATS3605D作为主控芯片,上面集成了高品质的音频编解码器,麦克风阵列负责声音的采集,UP Board板作为声音识别处理器,利用声音识别引擎对采集到的声音信号进行识别,并返回识别结果,用于机器人控制和交互。扬声器作为语音播报的输出,可随时检测语音识别的状态,对于不同的识别状态采用不同的语音播报,便于人员调试。无线模块可以用于连接四足机器人主控制器的无线网络,是实现语音控制的手持操作模式的基础,电池为整个语音控制器提供能量输入。
四足机器人语音控制器包括两种布置模式,分别为机载与手持模式,机载模式即将语音控制器布置在四足机器人躯干中,通过网线将其与四足机器人主控制器连接。手持模式即将语音控制器通过无线模块与四足机器人主控制器上的无线路由器进行连接。二者均使用TCP/IP协议作为语音模块与四足机器人运动控制器的通信协议,其中语音控制器作为客户端,四足机器人主控制器作为服务器端,通过客户端与服务器端数据交换完成语音信号与机器人状态信息传递。
详细步骤与实施例一提供的基于语音交互的四足机器人运动控制方法相同,在此不再赘述。
实施例三
本公开实施例三提供了一种计算机可读存储介质。
一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现如本公开实施例一所述的基于语音交互的四足机器人运动控制方法中的步骤。
详细步骤与实施例一提供的基于语音交互的四足机器人运动控制方法相同,在此不再赘述。
实施例四
本公开实施例四提供了一种电子设备。
一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,所述处理器执行所述程序时实现如本公开实施例一所述的基于语音交互的四足机器人运动控制方法中的步骤。
详细步骤与实施例一提供的基于语音交互的四足机器人运动控制方法相同,在此不再赘述。
上述虽然结合附图对本公开的具体实施方式进行了描述,但并非对本公开保护范围的限制,所属领域技术人员应该明白,在本公开的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本公开的保护范围以内。
Claims (8)
1.一种基于语音交互的四足机器人运动控制方法,其特征在于,包括:
获取语音信号;
对所获取的语音信号进行识别解析,得到语音控制信号;
基于所得到的语音控制信号,启动四足机器人内部的语音控制模块,处理所得到的语音控制信号,得到控制指令;
根据所得到的控制指令,设定相应的参数,将这些参数传给四足机器人WBC求解器中,其中WBC求解器为一种机器人运动控制算法,由WBC求解出对应的关节扭矩、位置和速度命令,实现对四足机器人不同运动状态的语音控制;
所述不同运动状态大致分为四类:基本运动、步态切换、自主运动和紧急避险;不同步态之间切换无需缓冲可直接切换;
在获取语音信号之前,需要设置用于唤醒四足机器人进行语音识别的语音唤醒词,基于所设置的语音唤醒词唤醒四足机器人,对四足机器人发布命令以获取语音信号;在获取语音信号的过程中,通过设置在机器人上的麦克风阵列进行语音信号的采集;唤醒后麦克风阵列确定主麦方向并收集语音指令;运动指令完成后刷新麦克风模块的主麦方向。
2.如权利要求1中所述的一种基于语音交互的四足机器人运动控制方法,其特征在于,在语音信号的识别解析的过程中,通过离线识别引擎识别所提取到的语音信号的梅尔倒谱系数特征,通过声学模型识别语音信息的内容并将所识别到的内容转换成标记符,在语言模型的作用下所述标记符生成相对应的语音控制信号。
3.如权利要求1中所述的一种基于语音交互的四足机器人运动控制方法,其特征在于,所述四足机器人采用电机驱动,自由度为12,包括躯干以及与所述躯干相连接的四条腿,每条腿上均设置有分别用于控制横滚髋关节、俯仰髋关节和俯仰膝关节的3个直流无刷电机;
启动四足机器人,选择是否采用语音控制模式,若采用,则将控制模式调到语音控制模式,基于语音控制模块接收并处理所采集到的语音控制信号,得到控制指令;根据所得到的控制指令,四足机器人做出与所得到的控制指令相匹配的动作,实现四足机器人的语音交互控制。
4.一种基于语音交互的四足机器人运动控制系统,其特征在于,包括:
获取模块,其被配置为获取语音信号;
识别模块,其被配置为对所获取的语音信号进行识别解析,得到语音控制信号;
处理模块,其被配置为基于所得到的语音控制信号,启动四足机器人内部的语音控制模块,处理所得到的语音控制信号,得到控制指令;
控制模块,其被配置为根据所得到的控制指令,设定相应的参数,将这些参数传给四足机器人WBC求解器中,其中WBC求解器为一种机器人运动控制算法,由WBC求解出对应的关节扭矩、位置和速度命令,实现对四足机器人不同运动状态的语音控制;
所述不同运动状态大致分为四类:基本运动、步态切换、自主运动和紧急避险;不同步态之间切换无需缓冲可直接切换;
在获取语音信号之前,需要设置用于唤醒四足机器人进行语音识别的语音唤醒词,基于所设置的语音唤醒词唤醒四足机器人,对四足机器人发布命令以获取语音信号;在获取语音信号的过程中,通过设置在机器人上的麦克风阵列进行语音信号的采集;唤醒后麦克风阵列确定主麦方向并收集语音指令;运动指令完成后刷新麦克风模块的主麦方向。
5.如权利要求4中所述的一种基于语音交互的四足机器人运动控制系统,其特征在于,四足机器人语音控制器包含麦克风阵列,ATS3605D芯片,UP Board板,无线模块,扬声器和电源;其中,ATS3605D作为主控芯片,麦克风阵列负责声音的采集,UP Board板作为声音识别处理器,利用声音识别引擎对采集到的声音信号进行识别,并返回识别结果,用于机器人控制和交互;扬声器作为语音播报随时检测语音识别状态,无线模块可以用于连接四足机器人主控制器的无线网络,是实现语音控制的手持操作模式的基础,电池为整个语音控制器提供能量输入。
6.如权利要求4中所述的一种基于语音交互的四足机器人运动控制系统,其特征在于,语音控制可以分为机载操作模式与手持操作模式,机载模式即将语音控制器布置在四足机器人躯干中,通过网线将其与四足机器人主控制器连接;手持模式即将语音控制器通过无线模块与四足机器人主控制器上的无线路由器进行连接。
7.一种计算机可读存储介质,其上存储有程序,其特征在于,该程序被处理器执行时实现如权利要求1-3中任一项所述的基于语音交互的四足机器人运动控制方法中的步骤。
8.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-3中任一项所述的基于语音交互的四足机器人运动控制方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210938799.3A CN115312054B (zh) | 2022-08-05 | 2022-08-05 | 一种基于语音交互的四足机器人运动控制方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210938799.3A CN115312054B (zh) | 2022-08-05 | 2022-08-05 | 一种基于语音交互的四足机器人运动控制方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115312054A CN115312054A (zh) | 2022-11-08 |
CN115312054B true CN115312054B (zh) | 2024-06-07 |
Family
ID=83861596
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210938799.3A Active CN115312054B (zh) | 2022-08-05 | 2022-08-05 | 一种基于语音交互的四足机器人运动控制方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115312054B (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002323900A (ja) * | 2001-04-24 | 2002-11-08 | Sony Corp | ロボット装置、プログラム及び記録媒体 |
CN106239506A (zh) * | 2016-08-11 | 2016-12-21 | 北京光年无限科技有限公司 | 智能机器人的多模态输入数据处理方法及机器人操作系统 |
CN106328132A (zh) * | 2016-08-15 | 2017-01-11 | 歌尔股份有限公司 | 一种智能设备的语音交互控制方法和装置 |
CN106782519A (zh) * | 2016-12-23 | 2017-05-31 | 深圳先进技术研究院 | 一种机器人 |
CN108231069A (zh) * | 2017-08-30 | 2018-06-29 | 深圳乐动机器人有限公司 | 清洁机器人的语音控制方法、云服务器、清洁机器人及其存储介质 |
CN110010129A (zh) * | 2019-04-09 | 2019-07-12 | 山东师范大学 | 一种基于六足机器人的语音交互系统 |
CN110010125A (zh) * | 2017-12-29 | 2019-07-12 | 深圳市优必选科技有限公司 | 一种智能机器人的控制方法、装置、终端设备及介质 |
CN110109541A (zh) * | 2019-04-25 | 2019-08-09 | 广州智伴人工智能科技有限公司 | 一种多模态交互的方法 |
CN110254554A (zh) * | 2019-06-24 | 2019-09-20 | 重庆大学 | 一种老年人关怀机器人 |
CN110815234A (zh) * | 2018-08-07 | 2020-02-21 | 圈乐斯株式会社 | 交互机器人的控制方法及控制服务器 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2002091356A1 (fr) * | 2001-05-02 | 2002-11-14 | Sony Corporation | Dispositif robot, appareil de reconnaissance de caracteres, procede de lecture de caracteres, programme de commande et support d'enregistrement |
WO2019198310A1 (ja) * | 2018-04-10 | 2019-10-17 | ソニー株式会社 | 情報処理装置及び情報処理方法、並びにロボット装置 |
-
2022
- 2022-08-05 CN CN202210938799.3A patent/CN115312054B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002323900A (ja) * | 2001-04-24 | 2002-11-08 | Sony Corp | ロボット装置、プログラム及び記録媒体 |
CN106239506A (zh) * | 2016-08-11 | 2016-12-21 | 北京光年无限科技有限公司 | 智能机器人的多模态输入数据处理方法及机器人操作系统 |
CN106328132A (zh) * | 2016-08-15 | 2017-01-11 | 歌尔股份有限公司 | 一种智能设备的语音交互控制方法和装置 |
CN106782519A (zh) * | 2016-12-23 | 2017-05-31 | 深圳先进技术研究院 | 一种机器人 |
CN108231069A (zh) * | 2017-08-30 | 2018-06-29 | 深圳乐动机器人有限公司 | 清洁机器人的语音控制方法、云服务器、清洁机器人及其存储介质 |
CN110010125A (zh) * | 2017-12-29 | 2019-07-12 | 深圳市优必选科技有限公司 | 一种智能机器人的控制方法、装置、终端设备及介质 |
CN110815234A (zh) * | 2018-08-07 | 2020-02-21 | 圈乐斯株式会社 | 交互机器人的控制方法及控制服务器 |
CN110010129A (zh) * | 2019-04-09 | 2019-07-12 | 山东师范大学 | 一种基于六足机器人的语音交互系统 |
CN110109541A (zh) * | 2019-04-25 | 2019-08-09 | 广州智伴人工智能科技有限公司 | 一种多模态交互的方法 |
CN110254554A (zh) * | 2019-06-24 | 2019-09-20 | 重庆大学 | 一种老年人关怀机器人 |
Also Published As
Publication number | Publication date |
---|---|
CN115312054A (zh) | 2022-11-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100898435B1 (ko) | 로봇 장치 및 그 제어 방법 | |
US7103447B2 (en) | Robot apparatus, and behavior controlling method for robot apparatus | |
CN102895092A (zh) | 一种基于多传感器融合的助行机器人三维环境识别系统 | |
KR20030007713A (ko) | 로봇 장치를 위한 동작 교시 장치 및 동작 교시 방법, 및기억 매체 | |
CN109093633A (zh) | 一种可分体式机器人及其控制方法 | |
CN105701196A (zh) | 面向智能机器人的音频处理方法和智能机器人 | |
CN105816303A (zh) | 一种基于gps和视觉导航的导盲系统及其方法 | |
JP2009131914A (ja) | ロボット制御システム | |
CN115312054B (zh) | 一种基于语音交互的四足机器人运动控制方法及系统 | |
CN113787517A (zh) | 自移动机器人控制方法、装置、设备及可读存储介质 | |
JP2002307350A (ja) | ロボット装置、ロボット装置の動作制御方法、ロボット装置の制御システム、プログラム及び記録媒体 | |
CN113183167A (zh) | 一种足式机器人的运动控制系统 | |
JP4449372B2 (ja) | ロボット装置及びその行動制御方法 | |
WO2023020269A1 (zh) | 自移动机器人控制方法、装置、设备及可读存储介质 | |
JP4281286B2 (ja) | ロボット装置及びその制御方法 | |
CN114932961B (zh) | 一种四足机器人运动控制系统 | |
CN211484452U (zh) | 一种自移动清洁机器人 | |
CN212193178U (zh) | 伴随式导游机器人 | |
CN212241058U (zh) | 智能平台装置、电路系统与其智能系统 | |
CN207361125U (zh) | 一种可移动的元器件自动存取装置 | |
CN114171026A (zh) | 基于语音识别的清洁机器人任务部署的控制系统和方法 | |
CN113793605A (zh) | 自主移动设备语音控制方法、装置、设备及可读存储介质 | |
CN117532633A (zh) | 一种能够为用户服务的语言交互式机器人 | |
CN211842006U (zh) | 一种家用机器人系统 | |
CN109646256A (zh) | 一种基于北斗的智能旅行箱导盲系统及导盲方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |