CN112002326A - 一种交互方法及机器人设备 - Google Patents
一种交互方法及机器人设备 Download PDFInfo
- Publication number
- CN112002326A CN112002326A CN202011169228.5A CN202011169228A CN112002326A CN 112002326 A CN112002326 A CN 112002326A CN 202011169228 A CN202011169228 A CN 202011169228A CN 112002326 A CN112002326 A CN 112002326A
- Authority
- CN
- China
- Prior art keywords
- target
- voice signal
- signal
- voice
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 33
- 230000003993 interaction Effects 0.000 title claims abstract description 19
- 230000009471 action Effects 0.000 claims abstract description 47
- 230000002996 emotional effect Effects 0.000 claims description 21
- 230000015654 memory Effects 0.000 claims description 17
- 238000004590 computer program Methods 0.000 claims description 5
- 230000000875 corresponding effect Effects 0.000 description 20
- 230000004044 response Effects 0.000 description 10
- 230000006870 function Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 230000002093 peripheral effect Effects 0.000 description 6
- 238000010801 machine learning Methods 0.000 description 5
- 230000008451 emotion Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 230000001914 calming effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 206010012374 Depressed mood Diseases 0.000 description 1
- 230000009118 appropriate response Effects 0.000 description 1
- 230000000994 depressogenic effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000000366 juvenile effect Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000036651 mood Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G08—SIGNALLING
- G08C—TRANSMISSION SYSTEMS FOR MEASURED VALUES, CONTROL OR SIMILAR SIGNALS
- G08C17/00—Arrangements for transmitting signals characterised by the use of a wireless electrical link
- G08C17/02—Arrangements for transmitting signals characterised by the use of a wireless electrical link using a radio link
-
- G—PHYSICS
- G08—SIGNALLING
- G08C—TRANSMISSION SYSTEMS FOR MEASURED VALUES, CONTROL OR SIMILAR SIGNALS
- G08C23/00—Non-electrical signal transmission systems, e.g. optical systems
- G08C23/04—Non-electrical signal transmission systems, e.g. optical systems using light waves, e.g. infrared
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1822—Parsing for meaning understanding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification
- G10L17/26—Recognition of special voice characteristics, e.g. for use in lie detectors; Recognition of animal voices
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/63—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for estimating an emotional state
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computer Networks & Wireless Communication (AREA)
- Child & Adolescent Psychology (AREA)
- General Health & Medical Sciences (AREA)
- Hospice & Palliative Care (AREA)
- Psychiatry (AREA)
- Signal Processing (AREA)
- Manipulator (AREA)
- Toys (AREA)
Abstract
本发明实施例提供一种交互方法及机器人设备。其中的方法包括:通过麦克风采集第一语音信号;对第一语音信号进行语音识别,以确定使用对象为目标群体,并启动目标群体对应的目标模式;在目标模式下,接收目标指示信号,并根据目标指示信号执行对应的目标动作指令;其中,目标指示信号包含以下一种或多种:语音信号、手势信号、射频信号、红外信号。实施本发明实施例,可以实现满足不同群体的使用需求,并根据群体不同自动确定模式,从而提高了机器人设备使用的便利性。
Description
技术领域
本发明涉及电子技术领域,具体涉及一种交互方法及机器人设备。
背景技术
随着电子技术的进步,服务型机器人逐渐发展起来并走进人们的生活中。目前,针对于不同的服务对象,市场上存在不同功能的机器人满足人们的需求。例如,对于儿童有儿童智能机器人以满足儿童娱乐的需求。而针对于有宠物需求的人群来说,有宠物机器人可实现宠物的各种功能。
然而,在实践中发现,当前智能机器人的交互方式和功能单一,从而降低了交互的便利性。
发明内容
本发明实施例提供一种交互方法及机器人设备,可以提高交互的便利性。
本发明第一方面提供一种交互方法,包括:
通过麦克风采集第一语音信号;
对所述第一语音信号进行语音识别,以确定使用对象为目标群体,并启动所述目标群体对应的目标模式;
在所述目标模式下,接收目标指示信号,并根据所述目标指示信号执行对应的目标动作指令;
其中,所述目标指示信号包含以下一种或多种:语音信号、手势信号、射频信号、红外信号。
结合本发明实施例第一方面,在本发明实施例第一方面的第一种可能的实现方式中,所述对所述第一语音信号进行语音识别,以确定使用对象为目标群体,包括:
通过语音识别,获得所述第一语音信号的第一音色信息和第一音调信息;
根据所述第一音色信息和所述第一音调信息确定使用对象的年龄范围信息和情绪状况信息。
结合本发明实施例第一方面,在本发明实施例第一方面的第二种可能的实现方式中,所述启动所述目标群体对应的目标模式之后,所述方法还包括:
通过所述麦克风周期性采集第二语音信号,并对所述第二语音信号进行语音识别,以确定使用对象是否为目标群体;
若否,调整所述目标模式,调整后执行的动作指令不同于所述目标动作指令。
结合本发明实施例第一方面,在本发明实施例第一方面的第三种可能的实现方式中,所述目标指示信号为第三语音信号,所述根据所述目标指示信号执行对应的目标动作指令,包括:
对所述第三语音信号进行语义识别得到目标意图,并获得所述第三语音信号的第二音色信息和第二音调信息;
根据所述目标意图、所述第二音色信息和所述第二音调信息中的一个或多个,确定并执行目标动作指令。
结合本发明实施例第一方面,在本发明实施例第一方面的第四种可能的实现方式中,所述通过麦克风采集第一语音信号之前,所述方法还包括:
响应于开机操作,开机;
接收用于工作模式设置指令;
所述通过麦克风采集第一语音信号,包括:
当所述工作模式设置指令指示根据群体区分工作模式时,通过麦克风采集第一语音信号。
本发明第二方面提供一种机器人设备,包括:处理器、存储器和麦克风;
所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令,所述处理器用于调用所述计算机指令以使得所述机器人设备执行:
通过麦克风采集第一语音信号;
对所述第一语音信号进行语音识别,以确定使用对象为目标群体,并启动所述目标群体对应的目标模式;
在所述目标模式下,接收目标指示信号,并根据所述目标指示信号执行对应的目标动作指令;
其中,所述目标指示信号包含以下一种或多种:语音信号、手势信号、射频信号、红外信号。
结合本发明实施例第二方面,在本发明实施例第二方面的第二种可能的实现方式中,所述处理器,具体用于调用所述计算机指令以使得所述机器人设备执行:
通过语音识别,获得所述第一语音信号的第一音色信息和第一音调信息;
根据所述第一音色信息和所述第一音调信息确定使用对象的年龄范围信息和情绪状况信息。
结合本发明实施例第二方面,在本发明实施例第二方面的第三种可能的实现方式中,所述处理器,还用于调用所述计算机指令以使得所述机器人设备执行:
通过所述麦克风周期性采集第二语音信号,并对所述第二语音信号进行语音识别,以确定使用对象是否为目标群体;
若否,调整所述目标模式,调整后执行的动作指令不同于所述目标动作指令。
结合本发明实施例第二方面,在本发明实施例第二方面的第四种可能的实现方式中,所述目标指示信号为第三语音信号,所述处理器,具体用于调用所述计算机指令以使得所述机器人设备执行:
对所述第三语音信号进行语义识别得到目标意图,并获得所述第三语音信号的第二音色信息和第二音调信息;
根据所述目标意图、所述第二音色信息和所述第二音调信息中的一个或多个,确定并执行目标动作指令。
结合本发明实施例第二方面,在本发明实施例第二方面的第三种可能的实现方式中,所述处理器,还用于调用所述计算机指令以使得所述机器人设备执行:
响应于开机操作,开机;
接收用于工作模式设置指令;
当所述工作模式设置指令指示根据群体区分工作模式时,通过麦克风采集第一语音信号。
第三方面,本申请实施例提供了一种芯片,该芯片应用于机器人设备,该芯片包括一个或多个处理器,该处理器用于调用计算机指令以使得该机器人设备执行如第一方面以及第一方面中任一可能的实现方式描述的方法。
第四方面,本申请实施例提供一种包含指令的计算机程序产品,当上述计算机程序产品在机器人设备上运行时,使得上述机器人设备执行如第一方面以及第一方面中任一可能的实现方式描述的方法。
第五方面,本申请实施例提供一种计算机可读存储介质,包括指令,当上述指令在机器人设备上运行时,使得上述机器人设备执行如第一方面以及第一方面中任一可能的实现方式描述的方法。
第六方面,本申请实施例还提供另一种机器人设备,包括:
采集单元,用于通过麦克风采集第一语音信号;
识别单元,用于对所述第一语音信号进行语音识别,以确定使用对象为目标群体,并启动所述目标群体对应的目标模式;
接收单元,用于在所述目标模式下,接收目标指示信号;
执行单元,用于根据所述目标指示信号执行对应的目标动作指令;
其中,所述目标指示信号包含以下一种或多种:语音信号、手势信号、射频信号、红外信号。
结合本发明实施例第六方面,在本发明实施例第六方面的第二种可能的实现方式中,识别单元,具体用于,通过语音识别,获得所述第一语音信号的第一音色信息和第一音调信息;
根据所述第一音色信息和所述第一音调信息确定使用对象的年龄范围信息和情绪状况信息。
结合本发明实施例第六方面,在本发明实施例第六方面的第三种可能的实现方式中,采集单元,还用于,通过所述麦克风周期性采集第二语音信号,并对所述第二语音信号进行语音识别,以确定使用对象是否为目标群体;
若否,调整所述目标模式,调整后执行的动作指令不同于所述目标动作指令。
结合本发明实施例第六方面,在本发明实施例第六方面的第四种可能的实现方式中,所述目标指示信号为第三语音信号,执行单元,具体用于对所述第三语音信号进行语义识别得到目标意图,并获得所述第三语音信号的第二音色信息和第二音调信息;
根据所述目标意图、所述第二音色信息和所述第二音调信息中的一个或多个,确定并执行目标动作指令。
结合本发明实施例第六方面,在本发明实施例第六方面的第五种可能的实现方式中,该机器人设备10还可以包括:
开机单元,用于响应于开机操作,开机;
接收单元,用于接收用于进行工作模式设置指令;
采集单元,具体用于当所述工作模式设置指令指示根据群体区分工作模式时,通过麦克风采集第一语音信号。
本发明实施例中,机器人设备可采集第一语音信号,并根据采集到的第一语音信号确定当前使用该机器人设备的目标群体。针对于不同的群体,机器人设备可以设置不同的动作指令来响应指示信号。这样,机器人设备可以满足不同群体的使用需求,并根据群体不同自动确定模式,从而提高了使用的便利性。
附图说明
图1是本发明实施例提供的一种网络架构示意图;
图2是本发明实施例提供的一种交互方法的流程示意图;
图3是本发明实施例提供的另一种交互方法的流程示意图;
图4是本发明实施例公开的一种机器人设备10的结构示意图;
图5是本发明实施例提供的另一种机器人设备10的结构示意图。
具体实施方式
本发明实施例提供了一种交互方法及机器人设备,可以提高机器人设备使用的便利性。以下分别进行详细说明。
为了更好地理解本发明实施例提供的一种交互方法及机器人设备,下面先对本发明实施例使用的网络架构进行描述。请参阅图1,图1是本发明实施例提供的一种网络架构示意图。如图1所示,该网络架构可以包括机器人设备10和控制设备20。其中,机器人设备10和控制设备20之间可进行通信。
控制设备20可以是智能手机、平板电脑等,也可以是遥控设备、手柄等,本发明实施例对此不作限制。控制设备20可以向机器人设备20发送指令,以指示机器人设备执行动作指令。
例如,控制设备20可以是手机,并安装有与机器人设备10关联的APP。用户可通过该控制设备20上的APP操作,响应于该用户操作,控制设备20可向机器人设备10发送用于播放音乐的指示信号。机器人设备10接收到该指示信号后,可执行播放音乐的动作指令,即播放音乐。
不限于播放音乐的指示信号,本发明实施例中,控制设备20还可响应于用户操作,向机器人设备10发送其他功能的指示信号,机器人设备10可执行对应的功能,本申请实施例对具体的功能不作限定。
机器人设备20,可以执行动作指令。具体的,机器人设备20可以是响应于接收到来自控制设备20的指示信号,执行的动作指令。机器人设备20还可以是根据自身设定程序执行该动作指令。例如根据定时程序,当定时达到定时器时间时,即执行闹钟程序。示例仅用于解释本发明实施例不应构成限定。
机器人设备10还可以是根据接收到的语音指令、手势指令等执行动作指令。
机器人设备10和控制设备20之间可通过射频信号、红外信号等进行通信。还可以是通过网络连接进行通信,例如蓝牙连接、WiFi连接、ZigBee连接、移动通信连接等。本发明实施例对机器人设备10和控制设备20之间通信的具体方式不作限定。
本发明实施例中,机器人设备10可用于执行本发明实施例提供的交互方法,例如图2、图3所示出的交互方法。
下面具体介绍本发明实施例提供交互方法。
请参阅图2,图2是本发明实施例提供的一种交互方法的流程示意图。如图2所示,该方法可以包括以下步骤。
S101、机器人设备10通过麦克风采集第一语音信号。
本发明实施例中,机器人设备10可安装有麦克风,可以是一个也可以是多个。机器人设备10可调用该麦克风采集当前的第一语音信号。例如,当前使用该机器人设备10的用户为一个家庭中的小孩子。小孩在使用该机器人设备10时,可通过语音控制该机器人设备10。由于小孩的音色和音调与成人不同,机器人设备10可通过接收到的第一语音信号确定目标群体,具体参考步骤S102。
S102、机器人设备10对第一语音信号进行语音识别,以确定使用对象为目标群体,并启动目标群体对应的目标模式。
本申请实施例对语音识别所采用的具体算法不作限制。示例性的,目标群体可包含不同的年龄段和不同的性别,例如目标群体可包含男童、女童、青少年男、青少年女、成人女、成人男。目标群体还可包含不同的情绪状态,例如目标群体可包含如下分类:
1男童:悲伤、喜悦两种。
2女童:悲伤、喜悦两种。
3青少年男:悲伤、喜悦两种。
4青少年女:悲伤、喜悦两种。
5成人女:悲伤、喜悦两种。
6成人男:悲伤、喜悦两种。
可以理解的,上述对目标群体的举例,仅用于解释本发明实施例,不应构成限定,目标群体还可以有其他的分类方式。
在本发明的一些实施例中,机器人设备10对第一语音信号进行语音识别,以确定使用对象为目标群体,可具体包含机器人设备10通过语音识别,获得该第一语音信号的第一音色信息和第一音调信息。之后,机器人设备10根据该第一音色信息和该第一音调信息确定使用对象的年龄范围信息和情绪状况信息。
具体的,由于不同的年龄范围和不同的情绪状态下,使用对象的声音的音色和音调不同,机器人设备10可通过所采集的第一语音信号的音调和音色(即第一音色信息和第一音调信息)来确定使用对象的年龄、情绪状态,还可确定使用对象的性别。机器人设备10还可根据年龄、情绪状态、性别等区分出不同的群体,并对不同的群体设置不同的模式。
示例性的,针对于悲伤的儿童群体(包含男童群体、女童群体),机器人设备10可输出欢快的儿歌、或者安慰、鼓励语音,这样的目标动作指令,以实现安抚效果。针对于欢快的儿童群体,机器人设备10可输出寓言讲解,以引导使用对象学习。再例如,针对于悲伤的青少年群体,机器人设备10可启动倾诉模式,在该模式下,机器人可与使用对象对话,并根据接收到的使用对象的语音信号作出响应。例如当语音识别到使用对象不想讲话想听音乐时,机器人设备10可播放可安抚悲伤情绪的歌曲。
可以理解的,上述对机器人设备针对不同群体,设置的模式的举例,仅用于解释本发明实施例,不应构成限定。模式还可包含其他类型,本发明实施例对此不作限制。
S103、机器人设备10在目标模式下,接收目标指示信号。
S104、机器人设备10根据目标指示信号执行对应的目标动作指令。
根据前面步骤S102识别到的目标群体,不同的群体机器人设备10可设置不同的模式。在不同的模式下,机器人设备10会对目标群体执行不同的动作。例如前例中,对于悲伤的青少年和悲伤的儿童群体,机器人设备10设置的模式下做出的动作也不同。
本发明实施例中,机器人设备10可采集第一语音信号,并根据采集到的第一语音信号确定当前使用该机器人设备的目标群体。针对于不同的群体,机器人设备10可以设置不同的动作指令来响应指示信号。这样,机器人设备10可以满足不同群体的使用需求,并根据群体不同自动确定模式,从而提高了使用的便利性。
本申请实施例中,在适用对象使用机器人设备10期间,机器人设备10可持续周期性的检测当前目标群体是否改变。具体的,机器人设备10启动目标群体对应的目标模式之后,机器人设备10还可通过麦克风周期性采集第二语音信号,并对第二语音信号进行语音识别,以确定使用对象是否为目标群体。若是,机器人设备10可继续处于该目标模式运行。
若否,机器人设备10可调整目标模式,调整后执行的动作指令不同于调整前的目标动作指令。例如,当使用对象的目标群体由悲伤的儿童群体转变为喜悦的儿童群体时,机器人设备10可改变模式。改变模式后,机器人设备10所输出的动作与改变模式前不同,针对于相同的指令信号,机器人设备10做出的动作指令也不同。
在本申请的另一些实施例中,在确定目标群体和目标模式之后,机器人设备10还可根据接收到的语音信号确定当前使用对象的情绪,并根据不同的情绪做出不同的反应。具体的,目标指示信号可以为第三语音信号,机器人设备10根据目标指示信号执行对应的目标动作指令可具体实现为:
机器人设备10对第三语音信号进行语义识别得到目标意图,并获得第三语音信号的第二音色信息和第二音调信息。之后机器人设备10根据目标意图、第二音色信息和第二音调信息中的一个或多个,确定并执行目标动作指令。
举例说明,对于识别到的悲伤的青少年这个群体来说,机器人设备10可启动安抚模式。在该安抚模式下,当使用对象发出语音信号“播放音乐”时,机器人设备10可根据该语音信号(即第三语音信号),进行语义识别。具体的,可抽取语音信号中的信息,理解语音信号中文本的因果关系,以实现对自然语言的理解。机器人设备10还可识别语音信号“播放音乐”的音色和音调,通过该音色和音调确定使用者的情绪状态。例如,当前情绪状态为悲伤且压抑,则可播放适合安抚悲伤且压抑的情绪的音乐。再例如,如果当前情绪状态为悲伤且暴躁,则也播放适合安抚悲伤且暴躁的情绪的音乐。
这样,在不同模式下,机器人设备10仍然可以实时检测适用对象的情绪状态,并根据情绪状态选择合适的响应,从而提高使用对象使用的便利性,提高用户体验。
在本发明的一些实施例中,机器人设备10还可进行机器学习,在识别到使用对象所属的目标群体后,可对该目标群体后续的动作指令进行记录。并将记录得到的数据作为训练数据对机器学习模型进行训练。当训练数据足够多时,机器人设备10可得到训练完成的机器学习模型。后续该同一目标群体使用该机器人设备10时,当机器人设备10可根据该训练完成的机器学习模型执行对应的动作指令。这样,由于该机器学习模型是根据该目标群体的习惯动作指令训练完成的,更加贴合该目标群体的使用习惯,从而能更加精确的预测该目标群体的使用习惯,从而提高使用对象使用的便利性,提高用户体验。
请参阅图3,图3是本发明实施例提供的另一种交互方法的流程示意图。如图3所示,该方法可以包括以下步骤。
S201、机器人设备10响应于开机操作,开机。
本申请实施例中,机器人设备10可在开机时,被设置工作模式。其中,工作模式可包含固定工作模式,也可包含根据群体区分的工作模式。
在固定工作模式下,机器人设备10可不改变工作模式,例如,固定在儿童工作模式下,机器人设备10可按照儿童的需求响应指令信号,做出动作指令。在根据群体区分的工作模式下,机器人设备10可执行步骤S203~S206的步骤。
S202、机器人设备10接收用于进行工作模式设置指令。
具体的,该用于进行工作模式设置指令可以是机器人设备10接收到的使用对象的语音信号、手势信号等,也可以是机器人设备10接收到的来自控制设备20的射频信号、红外信号等。该用于进行工作模式设置指令还可以是作用在机器人设备10上的机械按键、虚拟按键的用户操作等。本申请实施例对该设置指令的具体形式不作限制。
S203、当工作模式设置指令指示根据群体区分工作模式时,通过麦克风采集第一语音信号。
本申请实施例中,指示根据群体区分工作模式,是指,机器人设备10可根据采集的语音信号(例如第一语音信号),识别使用对象所属于的目标群体,并工作在该目标群体所适合的模式下,以更加贴合使用对象的使用需求,从而提高使用机器人设备10的便利性。
本申请实施例中,机器人设备10还可被设置指令设置工作在固定的工作模式。在固定工作模式下,机器人设备10可针对于特定的群体进行响应。例如,在儿童工作模式下,机器人设备10可按照儿童的需求响应指令信号,做出动作指令。例如,响应于接收到用于播放音乐的指令,机器人设备10在儿童工作模式下可播放儿歌等。
S204、对第一语音信号进行语音识别,以确定使用对象为目标群体,并启动目标群体对应的目标模式。
S205、在目标模式下,接收目标指示信号。
S206、根据目标指示信号执行对应的目标动作指令。
在本发明的一些实施例中,机器人设备10对第一语音信号进行语音识别,以确定使用对象为目标群体,可具体包含机器人设备10通过语音识别,获得该第一语音信号的第一音色信息和第一音调信息。之后,机器人设备10根据该第一音色信息和该第一音调信息确定使用对象的年龄范围信息和情绪状况信息。
具体的,由于不同的年龄范围和不同的情绪状态下,使用对象的声音的音色和音调不同,机器人设备10可通过所采集的第一语音信号的音调和音色(即第一音色信息和第一音调信息)来确定使用对象的年龄、情绪状态,还可确定使用对象的性别。机器人设备10还可根据年龄、情绪状态、性别等区分出不同的群体,并对不同的群体设置不同的模式。
示例性的,针对于悲伤的儿童群体(包含男童群体、女童群体),机器人设备10可输出欢快的儿歌、或者安慰、鼓励语音,这样的目标动作指令,以实现安抚效果。针对于欢快的儿童群体,机器人设备10可输出寓言讲解,以引导使用对象学习。再例如,针对于悲伤的青少年群体,机器人设备10可启动倾诉模式,在该模式下,机器人可与使用对象对话,并根据接收到的使用对象的语音信号作出响应。例如当语音识别到使用对象不想讲话想听音乐时,机器人设备10可播放可安抚悲伤情绪的歌曲。
可以理解的,上述对机器人设备针对不同群体,设置的模式的举例,仅用于解释本发明实施例,不应构成限定。模式还可包含其他类型,本发明实施例对此不作限制。
根据前面步骤S204识别到的目标群体,不同的群体机器人设备10可设置不同的模式。在不同的模式下,机器人设备10会对目标群体执行不同的动作。例如前例中,对于悲伤的青少年和悲伤的儿童群体,机器人设备10设置的模式下做出的动作也不同。
本发明实施例中,机器人设备10可采集第一语音信号,并根据采集到的第一语音信号确定当前使用该机器人设备的目标群体。针对于不同的群体,机器人设备10可以设置不同的动作指令来响应指示信号。这样,机器人设备10可以满足不同群体的使用需求,并根据群体不同自动确定模式,从而提高了使用的便利性。
请参阅图4,图4是本发明实施例公开的一种机器人设备10的结构示意图。如图4所示,该机器人设备10可以包括:
采集单元401,用于通过麦克风采集第一语音信号;
识别单元402,用于对所述第一语音信号进行语音识别,以确定使用对象为目标群体,并启动所述目标群体对应的目标模式;
接收单元403,用于在所述目标模式下,接收目标指示信号;
执行单元404,用于根据所述目标指示信号执行对应的目标动作指令;
其中,所述目标指示信号包含以下一种或多种:语音信号、手势信号、射频信号、红外信号。
在图4所描述的机器人设备10中,机器人设备10可采集第一语音信号,并根据采集到的第一语音信号确定当前使用该机器人设备的目标群体。针对于不同的群体,机器人设备10可以设置不同的动作指令来响应指示信号。这样,机器人设备10可以满足不同群体的使用需求,并根据群体不同自动确定模式,从而提高了使用的便利性。
作为一种可能的实施方式,识别单元402,具体用于,通过语音识别,获得所述第一语音信号的第一音色信息和第一音调信息;
根据所述第一音色信息和所述第一音调信息确定使用对象的年龄范围信息和情绪状况信息。
作为一种可能的实施方式,采集单元401,还用于,通过所述麦克风周期性采集第二语音信号,并对所述第二语音信号进行语音识别,以确定使用对象是否为目标群体;
若否,调整所述目标模式,调整后执行的动作指令不同于所述目标动作指令。
作为一种可能的实施方式,所述目标指示信号为第三语音信号,执行单元404,具体用于对所述第三语音信号进行语义识别得到目标意图,并获得所述第三语音信号的第二音色信息和第二音调信息;
根据所述目标意图、所述第二音色信息和所述第二音调信息中的一个或多个,确定并执行目标动作指令。
作为一种可能的实施方式,如图4所示,该机器人设备10还可以包括:
开机单元405,用于响应于开机操作,开机;
接收单元403,还用于接收用于进行工作模式设置指令;
采集单元401,具体用于当所述工作模式设置指令指示根据群体区分工作模式时,通过麦克风采集第一语音信号。
请参阅图5,图5是本发明实施例提供的另一种机器人设备10的结构示意图。如图5所示,该机器人设备10可以包括:至少一个处理器501、例如CPU,存储器502,收发器503、至少一个通信总线504以及麦克风505。其中,通信总线504用于实现这些组件之间的连接通信。存储器502可以是高速RAM存储器,还可以是非不稳定的存储器(non-volatilememory),例如至少一个磁盘存储器。存储器502可选的可以包含至少一个位于远离前述处理器501的存储装置。其中:
处理器501用于调用存储器502中存储的程序代码执行以下操作:
通过麦克风505采集第一语音信号;
对所述第一语音信号进行语音识别,以确定使用对象为目标群体,并启动所述目标群体对应的目标模式;
在所述目标模式下,接收目标指示信号,并根据所述目标指示信号执行对应的目标动作指令;
其中,所述目标指示信号包含以下一种或多种:语音信号、手势信号、射频信号、红外信号。
作为一种可能的实施方式,处理器501具体用于调用存储器502中存储的所述计算机指令以使得所述机器人设备10执行:
通过语音识别,获得所述第一语音信号的第一音色信息和第一音调信息;
根据所述第一音色信息和所述第一音调信息确定使用对象的年龄范围信息和情绪状况信息。
作为一种可能的实施方式,所述处理器501,还用于调用存储器502中存储的所述计算机指令以使得所述机器人设备10执行:
通过所述麦克风周期性采集第二语音信号,并对所述第二语音信号进行语音识别,以确定使用对象是否为目标群体;
若否,调整所述目标模式,调整后执行的动作指令不同于所述目标动作指令。
作为一种可能的实施方式,所述目标指示信号为第三语音信号,所述处理器501,具体用于调用存储器502中存储的所述计算机指令以使得所述机器人设备执行:
对所述第三语音信号进行语义识别得到目标意图,并获得所述第三语音信号的第二音色信息和第二音调信息;
根据所述目标意图、所述第二音色信息和所述第二音调信息中的一个或多个,确定并执行目标动作指令。
作为一种可能的实施方式,所述处理器501,还用于调用存储器502中存储的所述计算机指令以使得所述机器人设备执行:
响应于开机操作,开机;
接收用于进行工作模式设置指令;
当所述工作模式设置指令指示根据群体区分工作模式时,通过麦克风采集第一语音信号。
在图5所描述的机器人设备10中,机器人设备10可采集第一语音信号,并根据采集到的第一语音信号确定当前使用该机器人设备的目标群体。针对于不同的群体,机器人设备10可以设置不同的动作指令来响应指示信号。这样,机器人设备10可以满足不同群体的使用需求,并根据群体不同自动确定模式,从而提高了使用的便利性。
本申请实施例中,图5所描述的机器人设备10仅为本发明实施例提供的一个例子,并且,机器人设备10可具有比示出的部件更多或更少的部件,可以组合两个或更多个部件,或者可具有部件的不同配置实现。
具体的,机器人设备10还可包含外围系统(未示出),主要用于实现机器人设备10和用户/外部环境之间的交互功能,主要包括机器人设备10的输入输出装置。具体实现中,外围系统可包括:触摸屏控制器、摄像头控制器、音频控制器以及传感器管理模块。其中,各个控制器可与各自对应的外围设备(如触摸屏、摄像头、音频电路以及传感器)耦合。需要说明的,外围系统还可以包括其他I/O外设。外围系统还可包含麦克风505。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory ,ROM)、随机存取器(RandomAccess Memory,RAM)、磁盘或光盘等。
以上对本发明实施例公开的车辆体检方法及服务器进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种交互方法,其特征在于,包括:
通过麦克风采集第一语音信号;
对所述第一语音信号进行语音识别,以确定使用对象为目标群体,并启动所述目标群体对应的目标模式;
在所述目标模式下,接收目标指示信号,并根据所述目标指示信号执行对应的目标动作指令;
其中,所述目标指示信号包含以下一种或多种:语音信号、手势信号、射频信号、红外信号。
2.根据权利要求1所述的方法,其特征在于,所述对所述第一语音信号进行语音识别,以确定使用对象为目标群体,包括:
通过语音识别,获得所述第一语音信号的第一音色信息和第一音调信息;
根据所述第一音色信息和所述第一音调信息确定使用对象的年龄范围信息和情绪状况信息。
3.根据权利要求1所述的方法,其特征在于,所述启动所述目标群体对应的目标模式之后,所述方法还包括:
通过所述麦克风周期性采集第二语音信号,并对所述第二语音信号进行语音识别,以确定使用对象是否为目标群体;
若否,调整所述目标模式,调整后执行的动作指令不同于所述目标动作指令。
4.根据权利要求1~3任一项所述的方法,其特征在于,所述目标指示信号为第三语音信号,所述根据所述目标指示信号执行对应的目标动作指令,包括:
对所述第三语音信号进行语义识别得到目标意图,并获得所述第三语音信号的第二音色信息和第二音调信息;
根据所述目标意图、所述第二音色信息和所述第二音调信息中的一个或多个,确定并执行目标动作指令。
5.根据权利要求1~3任一项所述的方法,其特征在于,所述通过麦克风采集第一语音信号之前,所述方法还包括:
响应于开机操作,开机;
接收用于进行工作模式设置指令;
所述通过麦克风采集第一语音信号,包括:
当所述工作模式设置指令指示根据群体区分工作模式时,通过麦克风采集第一语音信号。
6.一种机器人设备,其特征在于,包括:处理器、存储器和麦克风;
所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令,所述处理器用于调用所述计算机指令以使得所述机器人设备执行:
通过麦克风采集第一语音信号;
对所述第一语音信号进行语音识别,以确定使用对象为目标群体,并启动所述目标群体对应的目标模式;
在所述目标模式下,接收目标指示信号,并根据所述目标指示信号执行对应的目标动作指令;
其中,所述目标指示信号包含以下一种或多种:语音信号、手势信号、射频信号、红外信号。
7.根据权利要求6所述的机器人设备,其特征在于,所述处理器,具体用于调用所述计算机指令以使得所述机器人设备执行:
通过语音识别,获得所述第一语音信号的第一音色信息和第一音调信息;
根据所述第一音色信息和所述第一音调信息确定使用对象的年龄范围信息和情绪状况信息。
8.根据权利要求6所述的机器人设备,其特征在于,所述处理器,还用于调用所述计算机指令以使得所述机器人设备执行:
通过所述麦克风周期性采集第二语音信号,并对所述第二语音信号进行语音识别,以确定使用对象是否为目标群体;
若否,调整所述目标模式,调整后执行的动作指令不同于所述目标动作指令。
9.根据权利要求6~8任一项所述的机器人设备,其特征在于,所述目标指示信号为第三语音信号,所述处理器,具体用于调用所述计算机指令以使得所述机器人设备执行:
对所述第三语音信号进行语义识别得到目标意图,并获得所述第三语音信号的第二音色信息和第二音调信息;
根据所述目标意图、所述第二音色信息和所述第二音调信息中的一个或多个,确定并执行目标动作指令。
10.根据权利要求6~8任一项所述的机器人设备,其特征在于,所述处理器,还用于调用所述计算机指令以使得所述机器人设备执行:
响应于开机操作,开机;
接收用于进行工作模式设置指令;
当所述工作模式设置指令指示根据群体区分工作模式时,通过麦克风采集第一语音信号。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011169228.5A CN112002326A (zh) | 2020-10-28 | 2020-10-28 | 一种交互方法及机器人设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011169228.5A CN112002326A (zh) | 2020-10-28 | 2020-10-28 | 一种交互方法及机器人设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112002326A true CN112002326A (zh) | 2020-11-27 |
Family
ID=73474468
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011169228.5A Pending CN112002326A (zh) | 2020-10-28 | 2020-10-28 | 一种交互方法及机器人设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112002326A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113724454A (zh) * | 2021-08-25 | 2021-11-30 | 上海擎朗智能科技有限公司 | 移动设备的互动方法、移动设备、装置及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106537493A (zh) * | 2015-09-29 | 2017-03-22 | 深圳市全圣时代科技有限公司 | 语音识别系统及方法、客户端设备及云端服务器 |
CN109949797A (zh) * | 2019-03-11 | 2019-06-28 | 北京百度网讯科技有限公司 | 一种训练语料的生成方法、装置、设备及存储介质 |
CN110414582A (zh) * | 2019-07-21 | 2019-11-05 | 珠海格力电器股份有限公司 | 一种模型训练方法、装置、计算设备及存储介质 |
-
2020
- 2020-10-28 CN CN202011169228.5A patent/CN112002326A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106537493A (zh) * | 2015-09-29 | 2017-03-22 | 深圳市全圣时代科技有限公司 | 语音识别系统及方法、客户端设备及云端服务器 |
CN109949797A (zh) * | 2019-03-11 | 2019-06-28 | 北京百度网讯科技有限公司 | 一种训练语料的生成方法、装置、设备及存储介质 |
CN110414582A (zh) * | 2019-07-21 | 2019-11-05 | 珠海格力电器股份有限公司 | 一种模型训练方法、装置、计算设备及存储介质 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113724454A (zh) * | 2021-08-25 | 2021-11-30 | 上海擎朗智能科技有限公司 | 移动设备的互动方法、移动设备、装置及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6811758B2 (ja) | 音声対話方法、装置、デバイス及び記憶媒体 | |
US10832674B2 (en) | Voice data processing method and electronic device supporting the same | |
KR102298947B1 (ko) | 음성 데이터 처리 방법 및 이를 지원하는 전자 장치 | |
CN110288987B (zh) | 用于处理声音数据的系统和控制该系统的方法 | |
KR102389625B1 (ko) | 사용자 발화를 처리하는 전자 장치 및 이 전자 장치의 제어 방법 | |
CN112513833A (zh) | 用于基于预先合成的对话提供人工智能服务的电子设备和方法 | |
CN108604179A (zh) | 设备上语音助理的实现 | |
CN102144209A (zh) | 电子设备中的多层次话音反馈 | |
CN106971723A (zh) | 语音处理方法和装置、用于语音处理的装置 | |
KR102628211B1 (ko) | 전자 장치 및 그 제어 방법 | |
KR20200113105A (ko) | 응답을 제공하는 전자 장치와 이의 동작 방법 | |
KR102440651B1 (ko) | 자연어 표현 제공 방법 및 이를 지원하는 전자 장치 | |
CN110010125A (zh) | 一种智能机器人的控制方法、装置、终端设备及介质 | |
US11495223B2 (en) | Electronic device for executing application by using phoneme information included in audio data and operation method therefor | |
US20240005918A1 (en) | System For Recognizing and Responding to Environmental Noises | |
JP7063937B2 (ja) | 音声対話するための方法、装置、電子デバイス、コンピュータ読み取り可能な記憶媒体、及びコンピュータプログラム | |
CN108632653A (zh) | 语音管控方法、智能电视及计算机可读存储介质 | |
KR102369309B1 (ko) | 파셜 랜딩 후 사용자 입력에 따른 동작을 수행하는 전자 장치 | |
KR20210001082A (ko) | 사용자 발화를 처리하는 전자 장치와 그 동작 방법 | |
US10976997B2 (en) | Electronic device outputting hints in an offline state for providing service according to user context | |
CN112002326A (zh) | 一种交互方法及机器人设备 | |
KR102421745B1 (ko) | Tts 모델을 생성하는 시스템 및 전자 장치 | |
CN111933137A (zh) | 语音唤醒测试方法及装置、计算机可读介质和电子设备 | |
WO2023093280A1 (zh) | 语音控制方法、装置、电子设备及存储介质 | |
CN112219235A (zh) | 包括处理用户语音的电子设备和控制电子设备上语音识别的方法的系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20201127 |