CN113409786B - 语音控制方法、装置、电子设备及计算机可读存储介质 - Google Patents
语音控制方法、装置、电子设备及计算机可读存储介质 Download PDFInfo
- Publication number
- CN113409786B CN113409786B CN202110767481.9A CN202110767481A CN113409786B CN 113409786 B CN113409786 B CN 113409786B CN 202110767481 A CN202110767481 A CN 202110767481A CN 113409786 B CN113409786 B CN 113409786B
- Authority
- CN
- China
- Prior art keywords
- logistics
- logistics robot
- identity information
- robot
- voice command
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 230000009471 action Effects 0.000 claims abstract description 79
- 230000004913 activation Effects 0.000 claims abstract description 79
- 230000000875 corresponding effect Effects 0.000 claims abstract description 35
- 238000012545 processing Methods 0.000 claims abstract description 21
- 238000012790 confirmation Methods 0.000 claims description 17
- 238000004891 communication Methods 0.000 claims description 9
- 238000005516 engineering process Methods 0.000 claims description 7
- 230000009467 reduction Effects 0.000 claims description 7
- 238000012544 monitoring process Methods 0.000 claims 2
- 238000012840 feeding operation Methods 0.000 claims 1
- 230000003213 activating effect Effects 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 11
- 238000004590 computer program Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 230000004044 response Effects 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000009792 diffusion process Methods 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000011946 reduction process Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Manipulator (AREA)
Abstract
本公开提供一种语音控制方法、装置、电子设备及计算机可读存储介质;涉及仓储物流技术领域。该语音控制方法包括:当至少一个物流机器人接收到用户下发的激活语音命令时,进入激活状态;其中,物流机器人进入所述激活状态后,能够进行语音处理;至少一个物流机器人广播与激活语音命令对应的激活消息,以使其他物流机器人在接收到激活消息时进入激活状态;各物流机器人接收用户下发的控制语音命令,该控制语音命令包括被指定执行动作的特定物流机器人的特定身份信息和动作命令;各物流机器人对控制语音命令进行分析,并确定特定身份信息与自身的身份信息是否相同,并在相同时根据动作命令执行相应的动作。本公开可以提高仓储物流环节的工作效率。
Description
技术领域
本公开涉及仓储物流技术领域,具体而言,涉及基于仓储物流技术的一种语音控制方法、语音控制装置、电子设备及计算机可读存储介质。
背景技术
随着电子商务和互联网经济的蓬勃发展,对商品供应方的仓储管理能力也提出了越来越高的要求。为了在仓储物流环节提高操作效率和节省人力,自动导向车辆(AGV)类型的物流机器人被越来越多地使用以完成仓储、分拣等场所中的例如货架装卸货、搬运等工作,并且针对物流机器人的控制方式逐步从按键控制、触摸屏控制转变为通过语音进行控制。
然而,由于仓储环境往往面积较大且嘈杂,用户的语音命令经常不能够很好地被物流机器人所接收到,因而出现语音命令下达后物流机器人无响应、语音命令误识别等一系列问题。
因此,需要一种用于物流机器人的改进的语音控制方法,能够至少一定程度上解决上述问题。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开实施例的目的在于提供一种语音控制方法、语音控制装置、电子设备及计算机可读存储介质,从而至少在一定程度上解决了仓储环境对物流机器人识别语音命令造成影响的问题,从而提高了仓储物流环节的工作效率。
根据本公开的一个方面,提供一种语音控制方法,应用于物流机器人集群,所述物流机器人集群包括多个物流机器人,包括:
当至少一个物流机器人接收到用户下发的激活语音命令时,所述至少一个物流机器人进入激活状态;其中,所述物流机器人进入所述激活状态后,能够进行语音处理;
所述至少一个物流机器人广播与所述激活语音命令对应的激活消息,以使其他物流机器人在接收到所述激活消息时进入所述激活状态;
各所述物流机器人接收用户下发的控制语音命令,所述控制语音命令包括被指定执行动作的特定物流机器人的特定身份信息和动作命令;
各所述物流机器人对所述控制语音命令进行分析,并确定所述特定身份信息与自身的身份信息是否相同,并在相同时根据所述动作命令执行相应的动作。
在本公开的一种示例性实施例中,所述方法还包括:其身份信息与所述特定身份信息不同的物流机器人确认是否接收到所述特定物流机器人发出的确认消息,所述确认消息用于指示所述特定物流机器人已确定自身的身份信息与所述特定身份信息相同并且已分析出所述动作命令;当未接收到所述确认消息时,其身份信息与所述特定身份信息不同的物流机器人广播所述特定身份信息和所述动作命令。
在本公开的一种示例性实施例中,所述控制语音命令还包括物流机器人集群的分组编号信息;所述各所述物流机器人对所述控制语音命令进行分析,包括:在第一分析阶段,各所述物流机器人从所述控制语音命令中分析出所述分组编号信息,并根据自身的分组信息确定是否属于与所述分组编号信息对应的分组;以及在第二分析阶段,确定属于所述对应的分组的一个或多个物流机器人从所述控制语音命令中分析出所述特定身份信息和所述动作命令。
在本公开的一种示例性实施例中,属于不同的分组的物流机器人所能够识别的动作命令不同。
在本公开的一种示例性实施例中,所述对所述语音命令进行分析,包括:通过语义分析对所述控制语音命令中的所述动作命令进行分析。
在本公开的一种示例性实施例中,所述相应的动作包括:放下货架操作、举起货架操作、下线操作、复位操作、移动至指定位置操作中的至少一种。
在本公开的一种示例性实施例中,在所述接收用户下发的控制语音命令之后,所述方法还包括:对所述控制语音命令进行降噪处理。
根据本公开的一个方面,提供一种语音控制装置,应用于物流机器人集群,所述物流机器人集群包括多个物流机器人,包括:
激活模块,用于当至少一个物流机器人接收到用户下发的激活语音命令时,使所述至少一个物流机器人进入激活状态;其中,所述物流机器人进入所述激活状态后,能够进行语音处理;
广播模块,用于使所述至少一个物流机器人广播与所述激活语音命令对应的激活消息,以使其他物流机器人在接收到所述激活消息时进入所述激活状态;
接收模块,用于使各所述物流机器人接收用户下发的控制语音命令,所述控制语音命令包括被指定执行动作的特定物流机器人的特定身份信息和动作命令;
处理模块,用于使各所述物流机器人对所述控制语音命令进行分析,并确定所述特定身份信息与自身的身份信息是否相同,并在相同时根据所述动作命令执行相应的动作。
根据本公开的一个方面,提供一种电子设备,包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行上述任意一项所述的方法。
根据本公开的一个方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一项所述的方法。
本公开示例性实施例可以具有以下部分或全部有益效果:
在公开示例实施方式所提供的语音控制方法中,一方面,通过使用激活语音命令或激活消息使物流机器人先进入激活状态再下发控制语音命令,使得物流机器人能够在监听的状态下更好地接收用户的控制语音命令,从而提高了物流机器人在仓储环境下对控制语音命令的接收和识别的成功率,进而提高了仓储物流环节的工作效率。另一方面,通过使接收到激活语音命令的部分物流机器人向其他物流机器人广播对应的激活消息,使得能够以传导扩散式的方式使一工作区域内的所有物流机器人均进入激活状态,因此尤其对于物流机器人集群能够提高集群内各机器人接收控制语音命令的质量,因而提高了物流机器人集群对控制语音命令的接收和识别的成功率,进一步提高了仓储物流环节的工作效率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示意性示出了根据本公开的一个实施例的语音控制方法的流程图;
图2示出了根据本公开一个实施例的通过激活语音命令使物流机器人集群进入激活状态的过程的示意图;
图3示出了根据本公开一个实施例的对物流机器人集群下发控制语音命令的过程的示意图;
图4示出了根据本公开一个实施例的对属于不同分组的物流机器人下发控制语音命令的过程的示意图;
图5示意性示出了根据本公开的一个实施例的语音控制装置的框图;
图6示出了适于用来实现本公开实施例的电子设备的计算机系统的结构示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中,提供许多具体细节从而给出对本公开的实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而省略所述特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知技术方案以避免喧宾夺主而使得本公开的各方面变得模糊。
此外,附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
以下对本公开实施例的技术方案进行详细阐述:
本示例实施方式提供了一种语音控制方法,应用于物流机器人集群,该物流机器人集群包括多个物流机器人。参考图1所示,该语音控制方法可以包括以下步骤:
步骤S110.当至少一个物流机器人接收到用户下发的激活语音命令时,所述至少一个物流机器人进入激活状态;其中,所述物流机器人进入所述激活状态后,能够进行语音处理;
步骤S120.所述至少一个物流机器人广播与所述激活语音命令对应的激活消息,以使其他物流机器人在接收到所述激活消息时进入所述激活状态;
步骤S130.各所述物流机器人接收用户下发的控制语音命令,所述控制语音命令包括被指定执行动作的特定物流机器人的特定身份信息和动作命令;
步骤S140.各所述物流机器人对所述控制语音命令进行分析,并确定所述特定身份信息与自身的身份信息是否相同,并在相同时根据所述动作命令执行相应的动作。
通过本示例实施方式所提供的语音控制方法,一方面,通过使用激活语音命令或激活消息使物流机器人先进入激活状态再下发控制语音命令,使得物流机器人能够在监听的状态下更好地接收用户的控制语音命令,从而提高了物流机器人在仓储环境下对控制语音命令的接收和识别的成功率,进而提高了仓储物流环节的工作效率。另一方面,通过使接收到激活语音命令的部分物流机器人向其他物流机器人广播对应的激活消息,使得能够以传导扩散式的方式使一工作区域内的所有物流机器人均进入激活状态,因此尤其对于物流机器人集群能够提高集群内各机器人接收控制语音命令的质量,因而提高了物流机器人集群对控制语音命令的接收和识别的成功率,进一步提高了仓储物流环节的工作效率。
下面,以示例性实施例的方式,对上述步骤进行更加详细的说明。
在步骤S110,当至少一个物流机器人接收到用户下发的激活语音命令时,所述至少一个物流机器人进入激活状态;其中,所述物流机器人进入所述激活状态后,能够进行语音处理。
在本示例实施方式中,物流机器人集群中的各物流机器人可配备有语音拾取装置,该语音拾取装置例如可以是麦克风或麦克风阵列。激活语音命令可以是预设的一个或多个词语,并由用户经由语音的方式下发。该激活语音命令可以是具有或不具有特定含义的词语的组合,为了方便用户记忆,本示例实施方式中例如可以为具有特定含义的多个词语的组合。举例来说,该激活语音命令例如可以是“嗨,机器人”。而各物流机器人可以被设置成在未进入激活状态时,仅针对该激活语音命令进行监测,并且仅在监测到该激活语音命令时才进入激活状态。举例来说,各物流机器人可以被设置成在未进入激活状态时,当接收到语音命令,则通过语音识别算法对该语音命令进行识别,如果识别的结果为该语音命令是“嗨,机器人”,则各物流机器人响应于该语音命令而进入激活状态;如果识别的结果为该语音命令为其他的语音命令,则各物流机器人不进行响应。其中,上述语音识别算法例如可以是基于动态时间规整(DTW)的算法;除此之外,该语音识别算法也可以是其他的适于识别特定语音命令的算法,例如基于非参数模型的矢量量化(VQ)的算法等,本示例实施方式对此不做特别限定。
如图2所示,当至少一个物流机器人202接收到由用户201下发的特定的激活语音命令,例如“嗨,机器人”时,则该至少一个物流机器人202可以进入激活状态。由于物流机器人在运行过程中往往依靠自身集成的电源模块,例如电池模组来供电,因此出于物流机器人的续航时间方面的考虑,在物流机器人未进入激活状态时,可以减小供应给语音拾取装置的电流从而使该语音拾取装置工作在低功率模式下,以便降低不必要的能耗。而当物流机器人进入激活状态时,则可以增大供应给语音拾取装置的电流从而使该语音拾取装置工作在高功率模式下,并且还可以相应调节语音拾取装置的配置参数,例如提高语音拾取装置的接收灵敏度等,以便能够更好地接收来自用户的控制语音命令并提高接收质量。在一个示例中,在进入激活状态时,物流机器人还可以发送响应信号,例如物流机器人上配置的状态指示灯可以闪烁或显示特定颜色(例如黄色),物流机器人还可以通过自身配备的扬声器播放回应语音,例如“我在”;此外,物流机器人例如还可以根据实际情况而暂停运行或保持继续运行,本示例实施方式对此不做特别限定。
在步骤S120,所述至少一个物流机器人广播与所述激活语音命令对应的激活消息,以使其他物流机器人在接收到所述激活消息时进入所述激活状态。
在本示例实施方式中,由于仓储环境往往面积较大、封闭且嘈杂,使得用户的语音命令的有效传播距离通常十分有限。这就造成在某一工作区域中,可能仅有靠近用户的数个物流机器人能够有效地接收到用户的激活语音命令并进入激活状态。针对这种情况,如图2所示,则可以由有效接收到激活语音命令的至少一个物流机器人202根据该激活语音命令生成对应的激活消息,并且将该激活消息向其他物流机器人207进行广播。其中,该激活消息例如可以是具有约定的格式和内容的一条专属报文。当其他物流机器人207收到该激活消息时可以进行解码分析,当识别出所收到的消息为激活消息时,则其他物流机器人207响应于该激活消息同样进入激活状态。此外,在收到激活消息之后,其他物流机器人207还可以继续广播该激活消息,使得在处于某一工作区域中的物流机器人集群中,能够以传导扩散式的方式传递激活消息,从而使得物流机器人集群中的各物流机器人递进地都能够进入激活状态。
在一个示例中,可以基于紫蜂(ZigBee)技术实现物流机器人之间的通信,例如广播激活消息与接收激活消息等。除此之外,还可以基于其他的设备间区域性通信技术来实现物流机器人之间的通信,例如Ad-Hoc网络技术等,本示例实施方式对此不做特别限定。
在一个示例中,可以将各物流机器人设置成在经过预设时间后退出激活状态。举例来说,在进入激活状态后,如果在20秒内没有接收到来自用户的进一步的控制语音命令,则各物流机器人可以退出激活状态,例如可以减小供应给语音拾取装置的电流、降低语音拾取装置的接收灵敏度、停止发送响应信号、恢复运行等,从而回到正常工作状态下。
在步骤S130,各所述物流机器人接收用户下发的控制语音命令,所述控制语音命令包括被指定执行动作的特定物流机器人的特定身份信息和动作命令。
在本示例实施方式中,在激活状态下,用户可以向各物流机器人下发控制语音命令,该控制语音命令可以包括用户所指定的特定物流机器人的特定身份信息和动作命令。举例来说,可以对在当前工作区域中的所有物流机器人分别预先设置身份信息,例如可以对共50个物流机器人分别预设编号1至50,使得当物流机器人检测到与自身编号相符的语音命令时能够获知该语音命令是针对自身所下发的。例如,用户要指定编号为3的物流机器人执行货物托举任务,则用户可以下发控制语音命令“3号车,托举”,这种情况下该3号物流机器人即为特定物流机器人,并且其身份信息“3号”即为特定身份信息,以及其中的“托举”即为具体的动作命令。
在步骤S140,各所述物流机器人对所述控制语音命令进行分析,并确定所述特定身份信息与自身的身份信息是否相同,并在相同时根据所述动作命令执行相应的动作。
在本示例实施方式中,当接收到用户下发的控制语音命令时,各物流机器人可以各自分析控制语音命令中的特定身份信息和动作命令。举例来说,用户下发了控制语音命令“3号车,托举”,则各物流机器人可以基于语音识别算法分析该控制语音命令中的特定身份信息,即“3号”,以及所要执行的动作命令,即“托举”;当分析得到特定身份信息为“3号”时,各物流机器人可以将自身的身份信息,例如编号,与该特定身份信息进行比对;当确定自身的编号例如是5号,不是3号时,则物流机器人可以不响应分析得到的动作命令;而当确定自身的编号与特定身份信息相同,即为3号时,则该3号物流机器人确定自身即为特定物流机器人,并且可以根据分析得到的动作命令执行托举的动作。
在一个示例中,物流机器人还可以通过例如为自然语言处理(NLP)分析算法的语义识别算法来分析控制语音命令中的动作命令。在这种情况下,用户在下发动作命令时,可以不限于特定的命令内容。举例来说,当物流机器人是基于语音识别算法来识别动作命令时,如果用户下发的动作命令为“托举”,则特定物流机器人能够识别出该动作命令的内容是指示执行托举货物的动作,并能够根据该动作命令的指示执行相应的动作;但如果用户下发的动作命令为“举上去”,与物流机器人所能够识别的各动作命令的内容均不同,此时物流机器人则无法正确地识别出动作命令的内容。而通过语义识别技术,例如对于“托举”这一动作命令,用户可以不局限于特定的形式,而是可以下发“托举”、“举上去”、“抬升”等一系列含义相近但意图相同的动作命令,而物流机器人对此均能够正确识别所要执行的动作。
通过上述示例,用户可以以更灵活的形式下发动作命令,而不必要求用户必须下发符合指定的形式的动作命令,由此一方面能够降低物流机器人的操作人员的培训成本,使其不必严格记忆动作命令的指定形式;另一方面能够加快现场操作人员下发动作命令的速度,从而提高现场操作效率。
在一个示例中,如图3所示,在对用户301发出的控制语音命令进行分析并确定自身的身份信息与特定身份信息相同并且已分析出动作命令之后,特定物流机器人304例如可以广播确认(ACK)消息,以通知其身份信息与特定身份信息不同的非特定物流机器人303:控制语音命令已被正确接收到。而非特定物流机器人303可以在接收到控制语音命令之后的预设时间段内,例如5秒内,检测是否接收到该确认消息。如果接收到该确认消息,则非特定物流机器人303可以忽略之前接收到的控制语音命令并继续正常运行;如果在预设时间段内未能接收到该确认消息,则非特定物流机器人303判定特定物流机器人304未能正确地接收到控制语音命令;在此情况下,一个或多个非特定物流机器人303可以将自身分析得到的特定身份信息和动作命令进行广播,例如一个或多个非特定物流机器人303可以广播与“3号车,托举”相对应的报文或消息,从而使得身份为“3号车”的特定物流机器人304能够正确获知用户301下发的控制语音命令为指定自身执行“托举”的动作,并相应地响应于控制语音命令去执行托举动作。
通过上述示例,在由于可能的环境因素而导致特定物流机器人接收控制语音命令失败的情况下,通过“检测确认消息——判断——广播”的保障机制,能够由非特定物流机器人来确保特定物流机器人正确地接收到控制语音命令并执行相应的动作,从而使得用户无需反复确认控制语音命令是否已被正确接收或重复性地下发控制语音命令,保证了物流机器人集群在接收和响应命令方面的稳定性,进而有助于提高物流机器人集群的操作效率。
在一个示例中,如图4所示,可以对各物流机器人预先设置不同的分组信息。举例来说,例如对于包括50个物流机器人的集群,可以按作业区域或作业内容将20个物流机器人405划分为用于运输的分组A,而将另外30个物流机器人406划分为用于装卸的分组B,并且可以在这50个物流机器人的存储装置中按照分组情况预先写入各自的分组信息,例如写入与组内编号A1至A20和B1至B30相对应的各分组识别码以及组内成员列表。相应地,用户401下发的控制语音命令中还可以包括物流机器人集群的分组编号信息,例如分组A或分组B。在此情况下,当这50个物流机器人接收到控制语音命令并进行分析时,则首先可以在第一分析阶段分别从控制语音命令中分析出分组编号信息,例如分组A或分组B;并且分别根据自身的分组识别码来确定自身是否属于与分组编号信息对应的分组,即是否属于用户在控制语音命令中所指定的分组。举例来说,用户下发的控制语音命令为“分组B,3号车、5号车,装卸”,一物流机器人406可以在第一分析阶段从控制语音命令中分析出分组编号信息为“分组B”,而自身的分组识别码对应于编号B16,则该物流机器人即可获知自身属于用户所指定的分组B;在此情况下,属于分组A的物流机器人405相应地可以获知自身不属于用户所指定的分组B,则可以退出激活状态并继续执行原任务动作。
之后,在第二分析阶段,属于用户所指定的分组的物流机器人可以对控制语音命令进行进一步分析,并从中分析得到特定身份信息和动作命令。在上文的举例中,当分组识别码对应于编号B16的物流机器人通过分析控制语音命令获知自身属于用户所指定的分组之后,则可以继续分析控制语音命令,从而得到特定身份信息为“3号车、5号车”,动作命令为“装卸”;则该物流机器人可以按照前文所述的方式将自身的身份信息与特定身份信息进行比对,例如当其身份信息为“5号”时,则可以根据动作命令执行相应的对货物进行装卸的动作。除此之外,当属于分组B的特定物流机器人正确接收到控制语音命令之后,还可以根据组内成员列表并且通过前文所述的方式向属于分组B的物流机器人广播确认消息;而属于分组B的非特定物流机器人在预设时间段内如果没有接收到确认消息,则可以相应地根据组内成员列表并且通过前文所述的方式在分组B内广播特定身份信息和动作命令。
通过上述示例,能够通过在物流机器人集群中划分组别来实现更精细化的控制,从而至少在一定程度上减少在用户下发语音命令时对物流机器人集群中未被指定的物流机器人的影响,使得能够缩短其等待指令和中断任务的时间,从而有助于提高物流机器人集群的工作效率。
在上述示例中,还可以将分别属于分组A和分组B的物流机器人设置成能够识别的动作命令不同。例如,可以设置属于分组A的物流机器人的动作命令识别库,使其能够识别运输命令但无法识别装卸命令;而相应地,还可以设置属于分组B的物流机器人的动作命令识别库,使其能够识别装卸命令但无法识别运输命令。通过这种方式,能够实现由专属的物流机器人执行对应的专属动作命令,从而能够至少在一定程度上降低由于操作人员的误操作而使物流机器人进行跨区域作业,进而导致现场运作混乱的风险。
在一个示例中,物流机器人能够响应于用户的控制语音命令而执行放下货架操作、举起货架操作、下线操作、上线操作、复位操作、移动至指定位置操作中的至少一种,即,物流机器人能够执行放下和抬升货架之类的装卸操作、离场停止运行和上场恢复运行之类的运营操作、重新注册并恢复任务的操作、按照命令中的坐标位置进入指定坐标点的操作等。还可以通过扩展物流机器人的语音命令库的方式,使得物流机器人能够响应于语音命令完成更多种仓储物流环节的任务动作。从而使得对物流机器人的控制更加灵活高效,并且控制功能可扩展性强。
在一个示例中,为了实现对控制语音命令的高质量的识别,还可以在物流机器人侧对接收到的控制语音命令进行降噪处理。例如,可以采用维纳滤波降噪的方法来进行降噪处理;除此之外,例如还可以采用基于深度神经网络(DNN)或循环神经网络(RNN)的音频降噪算法对控制语音命令进行降噪处理,本示例对此不做特别限定。通过上述方式,可以更好地去除仓储环境中的背景噪音,从而提高控制语音命令的接收和识别质量,降低由于噪音影响而造成识别失败的概率。
进一步的,本示例实施方式中,还提供了一种语音控制装置,应用于物流机器人集群,该物流机器人集群包括多个物流机器人。参考图5所示,该语音控制装置500可以包括激活模块510、广播模块520、接收模块530和处理模块540。其中:
激活模块510可以用于当至少一个物流机器人接收到用户下发的激活语音命令时,使所述至少一个物流机器人进入激活状态;其中,所述物流机器人进入所述激活状态后,能够进行语音处理;
广播模块520可以用于使所述至少一个物流机器人广播与所述激活语音命令对应的激活消息,以使其他物流机器人在接收到所述激活消息时进入所述激活状态;
接收模块530可以用于使各所述物流机器人接收用户下发的控制语音命令,所述控制语音命令包括被指定执行动作的特定物流机器人的特定身份信息和动作命令;
处理模块540可以用于使各所述物流机器人对所述控制语音命令进行分析,并确定所述特定身份信息与自身的身份信息是否相同,并在相同时根据所述动作命令执行相应的动作。
在本公开的一种示例性实施例中,接收模块530还可以用于使其身份信息与所述特定身份信息不同的物流机器人确认是否接收到所述特定物流机器人发出的确认消息,所述确认消息用于指示所述特定物流机器人已确定自身的身份信息与所述特定身份信息相同;以及广播模块520还可以用于使其身份信息与所述特定身份信息不同的物流机器人在未接收到所述确认消息时广播所述特定身份信息和所述动作命令。
在本公开的一种示例性实施例中,所述控制语音命令还包括物流机器人集群的分组编号信息;处理模块540可以具体用于:在第一分析阶段,使各所述物流机器人从所述控制语音命令中分析出所述分组编号信息,并根据自身的分组信息确定是否属于与所述分组编号信息对应的分组;以及在第二分析阶段,使确定属于所述对应的分组的一个或多个物流机器人从所述控制语音命令中分析出所述特定身份信息和所述动作命令。
在本公开的一种示例性实施例中,处理模块540还可以用于使属于不同的分组的物流机器人所能够识别的动作命令不同。
在本公开的一种示例性实施例中,处理模块540使各所述物流机器人通过语义分析对所述语音命令进行分析。
在本公开的一种示例性实施例中,所述相应的动作包括:放下货架操作、举起货架操作、下线操作、复位操作、移动至指定位置操作中的至少一种。
在本公开的一种示例性实施例中,处理模块540还可以用于使各所述物流机器人对所述控制语音命令进行降噪处理。
上述语音控制装置中各模块或单元的具体细节已经在对应的语音控制装置中进行了详细的描述,因此此处不再赘述。
图6示出了适于用来实现本公开实施例的电子设备的计算机系统的结构示意图。
需要说明的是,图6示出的电子设备的计算机系统600仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图6所示,计算机系统600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有系统操作所需的各种程序和数据。CPU601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)显示器、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
特别地,根据本公开的实施例,下文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元(CPU)601执行时,执行本申请的方法和装置中限定的各种功能。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该电子设备执行时,使得该电子设备实现如上述实施例中所述的方法。
需要说明的是,本公开所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
Claims (9)
1.一种语音控制方法,应用于物流机器人集群,所述物流机器人集群处于仓储环境,所述物流机器人集群包括多个物流机器人,其特征在于,包括:
当至少一个物流机器人接收到用户下发的激活语音命令时,所述至少一个物流机器人进入激活状态,并根据所述激活语音命令生成对应的激活消息;
所述至少一个物流机器人通过区域性通信技术广播所述激活消息,以使其他物流机器人在接收到所述激活消息时进入所述激活状态;
各所述物流机器人在监听状态下接收用户下发的控制语音命令,所述控制语音命令包括被指定执行动作的特定物流机器人的特定身份信息和动作命令;
各所述物流机器人对所述控制语音命令进行分析,并确定所述特定身份信息与自身的身份信息是否相同,并在相同时根据所述动作命令执行相应的动作;
其身份信息与所述特定身份信息不同的各物流机器人确认是否接收到所述特定物流机器人发出的确认消息,所述确认消息用于指示所述特定物流机器人已确定自身的身份信息与所述特定身份信息相同并且已分析出所述动作命令;当未接收到所述确认消息时,其身份信息与所述特定身份信息不同的物流机器人广播所述特定身份信息和所述动作命令。
2.如权利要求1所述的语音控制方法,其特征在于,所述控制语音命令还包括物流机器人集群的分组编号信息;
所述各所述物流机器人对所述控制语音命令进行分析,包括:
在第一分析阶段,各所述物流机器人从所述控制语音命令中分析出所述分组编号信息,并根据自身的分组信息确定是否属于与所述分组编号信息对应的分组;以及
在第二分析阶段,确定属于所述对应的分组的一个或多个物流机器人从所述控制语音命令中分析出所述特定身份信息和所述动作命令。
3.如权利要求2所述的语音控制方法,其特征在于,属于不同的分组的物流机器人所能够识别的动作命令不同。
4.如权利要求1所述的语音控制方法,其特征在于,所述对所述控制语音命令进行分析,包括:
通过语义分析对所述控制语音命令中的所述动作命令进行分析。
5.如权利要求1所述的语音控制方法,其特征在于,所述相应的动作包括:放下货架操作、举起货架操作、下线操作、上线操作、复位操作、移动至指定位置操作中的至少一种。
6.如权利要求1至5中任一项所述的语音控制方法,其特征在于,在所述接收用户下发的控制语音命令之后,所述方法还包括:
对所述控制语音命令进行降噪处理。
7.一种语音控制装置,应用于物流机器人集群,所述物流机器人集群处于仓储环境,所述物流机器人集群包括多个物流机器人,其特征在于,包括:
激活模块,用于当至少一个物流机器人接收到用户下发的激活语音命令时,使所述至少一个物流机器人进入激活状态,并根据所述激活语音命令生成对应的激活消息;
广播模块,用于使所述至少一个物流机器人通过区域性通信技术广播与所述激活消息,以使其他物流机器人在接收到所述激活消息时进入所述激活状态;
接收模块,用于使各所述物流机器人在监听状态下接收用户下发的控制语音命令,所述控制语音命令包括被指定执行动作的特定物流机器人的特定身份信息和动作命令;其身份信息与所述特定身份信息不同的各物流机器人确认是否接收到所述特定物流机器人发出的确认消息,所述确认消息用于指示所述特定物流机器人已确定自身的身份信息与所述特定身份信息相同并且已分析出所述动作命令;
处理模块,用于使各所述物流机器人对所述控制语音命令进行分析,并确定所述特定身份信息与自身的身份信息是否相同,并在相同时根据所述动作命令执行相应的动作;当未接收到所述确认消息时,其身份信息与所述特定身份信息不同的物流机器人广播所述特定身份信息和所述动作命令。
8.一种电子设备,其特征在于,包括:
存储器;以及
耦合到所述存储器的处理器,所述处理器被配置为基于存储在所述存储器中的指令,执行如权利要求1-6任一项所述的语音控制方法。
9.一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现如权利要求1-6任一项所述的语音控制方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110767481.9A CN113409786B (zh) | 2021-07-07 | 2021-07-07 | 语音控制方法、装置、电子设备及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110767481.9A CN113409786B (zh) | 2021-07-07 | 2021-07-07 | 语音控制方法、装置、电子设备及计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113409786A CN113409786A (zh) | 2021-09-17 |
CN113409786B true CN113409786B (zh) | 2023-12-05 |
Family
ID=77685290
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110767481.9A Active CN113409786B (zh) | 2021-07-07 | 2021-07-07 | 语音控制方法、装置、电子设备及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113409786B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114267356B (zh) * | 2021-12-30 | 2024-04-02 | 重庆特斯联智慧科技股份有限公司 | 一种人机交互物流机器人及其控制方法 |
CN115499500A (zh) * | 2022-08-11 | 2022-12-20 | 北京百度网讯科技有限公司 | 消息推送方法、装置、设备和存储介质 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106463116A (zh) * | 2014-06-11 | 2017-02-22 | 霍尼韦尔国际公司 | 使用语音作为控制机制的工厂控制系统 |
CN106448678A (zh) * | 2012-05-29 | 2017-02-22 | 三星电子株式会社 | 用于在电子装置中执行语音命令的方法和设备 |
CN109119078A (zh) * | 2018-10-26 | 2019-01-01 | 北京石头世纪科技有限公司 | 自动机器人控制方法、装置、自动机器人和介质 |
CN109308595A (zh) * | 2018-09-29 | 2019-02-05 | 炬星科技(深圳)有限公司 | 一种基于行走机器人的周转箱跟踪系统、方法及装置与终端和存储介质 |
CN109801025A (zh) * | 2019-03-08 | 2019-05-24 | 苏州新东洋智能科技有限公司 | 一种智能物流仓储管理系统 |
CN109920425A (zh) * | 2019-04-03 | 2019-06-21 | 北京石头世纪科技股份有限公司 | 机器人语音控制方法、装置、机器人和介质 |
CN111392531A (zh) * | 2020-04-17 | 2020-07-10 | 蓓安科仪(北京)技术有限公司 | 医用机器人开启电梯的方法及其控制系统 |
CN111941431A (zh) * | 2020-09-04 | 2020-11-17 | 上海木木聚枞机器人科技有限公司 | 一种医院物流机器人自动跟随方法、系统及存储介质 |
CN112340384A (zh) * | 2020-10-29 | 2021-02-09 | 温州职业技术学院 | 一种基于计算机应用技术的物流输送方法及装置 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190102509A (ko) * | 2018-02-26 | 2019-09-04 | 삼성전자주식회사 | 음성 명령을 수행하는 방법 및 시스템 |
US11328724B2 (en) * | 2018-03-23 | 2022-05-10 | Hewlett-Packard Development Company, L.P. | Execution of workflow tasks corresponding to voice commands |
-
2021
- 2021-07-07 CN CN202110767481.9A patent/CN113409786B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106448678A (zh) * | 2012-05-29 | 2017-02-22 | 三星电子株式会社 | 用于在电子装置中执行语音命令的方法和设备 |
CN106463116A (zh) * | 2014-06-11 | 2017-02-22 | 霍尼韦尔国际公司 | 使用语音作为控制机制的工厂控制系统 |
CN109308595A (zh) * | 2018-09-29 | 2019-02-05 | 炬星科技(深圳)有限公司 | 一种基于行走机器人的周转箱跟踪系统、方法及装置与终端和存储介质 |
CN109119078A (zh) * | 2018-10-26 | 2019-01-01 | 北京石头世纪科技有限公司 | 自动机器人控制方法、装置、自动机器人和介质 |
CN109801025A (zh) * | 2019-03-08 | 2019-05-24 | 苏州新东洋智能科技有限公司 | 一种智能物流仓储管理系统 |
CN109920425A (zh) * | 2019-04-03 | 2019-06-21 | 北京石头世纪科技股份有限公司 | 机器人语音控制方法、装置、机器人和介质 |
CN111392531A (zh) * | 2020-04-17 | 2020-07-10 | 蓓安科仪(北京)技术有限公司 | 医用机器人开启电梯的方法及其控制系统 |
CN111941431A (zh) * | 2020-09-04 | 2020-11-17 | 上海木木聚枞机器人科技有限公司 | 一种医院物流机器人自动跟随方法、系统及存储介质 |
CN112340384A (zh) * | 2020-10-29 | 2021-02-09 | 温州职业技术学院 | 一种基于计算机应用技术的物流输送方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN113409786A (zh) | 2021-09-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113409786B (zh) | 语音控制方法、装置、电子设备及计算机可读存储介质 | |
CN103827963B (zh) | 使用说话者检验的背景语音辨识助理 | |
CN108922564B (zh) | 情绪识别方法、装置、计算机设备及存储介质 | |
CN108845321A (zh) | 目标对象的识别方法、装置及无人驾驶智能设备 | |
US11467553B2 (en) | Efficient configuration of scenarios for event sequencing | |
WO2020168896A1 (zh) | 用于无人配送机器人的手势控制方法、装置、设备及介质 | |
US9299034B2 (en) | Predicting change-points in continuous time-series data using two classifier stages | |
US20190130898A1 (en) | Wake-up-word detection | |
CN112820324B (zh) | 多标签语音活动检测方法、装置及存储介质 | |
JP2021179642A (ja) | 音声インタラクティブの処理方法、装置、電子機器、記憶媒体及びプログラム | |
US12062361B2 (en) | Wake word method to prolong the conversational state between human and a machine in edge devices | |
CN113085882B (zh) | 一种故障处理方法、装置、电子设备和存储介质 | |
CN113261055B (zh) | 电子装置及其控制方法 | |
US20220392436A1 (en) | Method for voice recognition, electronic device and storage medium | |
CN112784755B (zh) | 一种轻型的人脸跟踪方法和存储设备 | |
US20210311443A1 (en) | Information processing apparatus, information processing method, and non-transitory storage medium | |
CN109358755B (zh) | 用于移动终端的手势检测方法、装置和移动终端 | |
CN114005431A (zh) | 语音系统的配置方法、装置、设备以及可读存储介质 | |
US10646998B2 (en) | System and method for optimizing resource usage of a robot | |
CN112183833A (zh) | 基于时间预测的agv多车碰撞判定方法、装置及设备 | |
CN113401749A (zh) | 电梯系统与机器乘客交互的故障诊断方法、可读存储介质、电子设备及故障诊断系统 | |
CN112416441A (zh) | 基于物联网的设备管理方法及装置、系统 | |
CN111401564A (zh) | 用于机器学习的模型更新方法、装置、电子设备及存储介质 | |
CN111626081B (zh) | 一种装卸口的状态确定方法、装置及存储介质 | |
CN114758181A (zh) | 一种图像检测方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |