CN109119077A - 一种机器人语音交互系统 - Google Patents
一种机器人语音交互系统 Download PDFInfo
- Publication number
- CN109119077A CN109119077A CN201810947206.3A CN201810947206A CN109119077A CN 109119077 A CN109119077 A CN 109119077A CN 201810947206 A CN201810947206 A CN 201810947206A CN 109119077 A CN109119077 A CN 109119077A
- Authority
- CN
- China
- Prior art keywords
- information
- voice
- user
- voice output
- face image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000002452 interceptive effect Effects 0.000 title claims abstract description 21
- 230000002996 emotional effect Effects 0.000 claims description 66
- 230000036651 mood Effects 0.000 claims description 8
- 230000015572 biosynthetic process Effects 0.000 claims description 7
- 238000000034 method Methods 0.000 claims description 7
- 238000003786 synthesis reaction Methods 0.000 claims description 7
- 230000010365 information processing Effects 0.000 claims description 6
- 230000008569 process Effects 0.000 claims description 6
- 230000001815 facial effect Effects 0.000 claims description 5
- 238000010586 diagram Methods 0.000 description 11
- 238000004891 communication Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000008451 emotion Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000011946 reduction process Methods 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000000151 deposition Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/24—Speech recognition using non-acoustical features
- G10L15/25—Speech recognition using non-acoustical features using position of the lips, movement of the lips or face analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/63—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for estimating an emotional state
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
- G10L2015/227—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of the speaker; Human-factor methodology
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Child & Adolescent Psychology (AREA)
- General Health & Medical Sciences (AREA)
- Hospice & Palliative Care (AREA)
- Psychiatry (AREA)
- Signal Processing (AREA)
- Manipulator (AREA)
- Toys (AREA)
Abstract
本发明涉及机器人领域,具体公开了一种机器人语音交互系统,所述机器人语音交互系统包括人脸图像采集装置,用于采集所述机器人视野范围内的人脸图像信息;用户语音信息采集装置,用于采集用户的语音信息;中央控制器,用于根据所述人脸图像信息以及用户的语音信息确定相应的语音输出信息;以及语音输出装置,用于输出所述确定的语音输出信息。本发明实施例通过同时采集用户的人脸图像信息以及语音信息,并根据上述信息共同确定相应的语音输出信息,使得相应的语音输出信息既能够有效地回复用户,还能满足用户的情感需求,有效地解决了现有机器人语音交互系统中存在的“机械式交流”的技术问题。
Description
技术领域
本发明涉及机器人领域,特别是涉及一种机器人语音交互系统。
背景技术
机器人技术作为20世纪最为伟大的发明之一,目前也随着技术的不断创新,逐渐应用于各大领域之中。而人机交互技术一直都是机器人领域的重要研究课题,其中随着语音识别技术的日臻成熟,并通过预先存储的语言数据库,已经实现了机器人与人的“简单沟通”。
然而,本领域当前的语音交互系统都只注重于与用户在语言内容上的交流,而没有注重于用户情感上的需求。因此,实际中机器人与用户的交流大多都是“木讷”的,都是处于一种被动回答的形式,这样会极大地降低人机交互的趣味性。
可见,现有技术中,采用语音识别系统作为机器人的语音交互系统只能够理解用户的语言内容而无法理解用户的情绪,无法满足部分用户的情感需求,同时只能够被动回答用户的问题,而无法与用户进行“拟人化的沟通”。同时由于语音交互系统的单一性,在缺少感情的基调上,很容易出现交流上的障碍。
发明内容
本发明实施例提供一种机器人语音交互系统,旨在解决现有技术中采用语音识别系统作为机器人的语音交互系统中存在的无法理解用户的情绪,无法满足用户的情感需求,同时也无法与用户进行“拟人化的沟通”的技术问题。
本发明实施例提供一种机器人语音交互系统,所述机器人语音交互系统包括中央控制器,与所述中央控制器通信的人脸图像采集装置、用户语音采集装置以及语音输出装置;
所述人脸图像采集装置,用于采集所述机器人视野范围内的人脸图像信息,并发送给中央控制器;
所述用户语音采集装置,用于采集用户的语音信息,并发送给中央控制器;
所述中央控制器,用于接收所述人脸图像信息,并根据所述人脸图像信息获取人脸情绪特征信息;用于接受所述用户的语音信息;用于根据所述人脸情绪特征信息以及所述用户的语音信息,确定语音输出信息,并发送给语音输出装置;以及
所述语音输出装置,用于接收所述语音输出信息,并根据所述语音输出信息输出语音。
本发明实施例提供的机器人语音交互系统通过用户语音信息采集装置能够获取用户的语音信息,便于机器人能够对用户的问题做出相应的回答,而人脸图像信息采集装置能够获取用户当前的情绪信息,便于机器人判断用户的情感需求,同时获取用户的语音信息以及用户当前的情绪信息,从而使得机器人能够使用更加“拟人化的口吻”对用户的问题做出相应的回答。此外,语音输出装置能够模拟输出多种不同类型的语气,从而在于用户进行沟通时,更加的生动形象,极大地满足了用户的情感需求。
附图说明
图1是本发明实施例提供的一种机器人语音交互系统的结构示意图;
图2是本发明实施例提供的中央控制器的结构示意图;
图3是本发明实施例提供的人脸图像信息接收单元的结构示意图;
图4是本发明又一种实施例提供的中央控制器的结构示意图;
图5是本发明又一种实施例提供的第二信息处理单元的结构示意图;
图6是本发明又一种实施例提供的语音输出装置的结构示意图;
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例提供的机器人语音交互系统通过用户语音信息采集装置能够获取用户的语音信息,便于机器人能够对用户的问题做出相应的回答,而人脸图像信息采集装置能够获取用户当前的情绪信息,便于机器人判断用户的情感需求,同时获取用户的语音信息以及用户当前的情绪信息,从而使得机器人能够使用更加“拟人化的口吻”对用户的问题做出相应的回答。
图1示出了本发明实施例提供的一种机器人语音交互系统的结构示意图,详述如下。
本发明实施例提供的机器人语音交互系统,包括:
人脸图像采集装置101,用于采集所述机器人视野范围内的人脸图像信息,并发送给中央控制器。
在本发明实施例中,所述人脸图像采集装置优选设置在机器人“眼部区域”,当所述人脸图像采集装置设置在机器人“眼部区域”时,可以有效的限制机器人需要正对当前交流的用户才可以采集人脸图像,避免出现机器人在与用户沟通时未正对用户的情况,使得机器人更加的拟人化。
在本发明实施例中,所述人脸图像采集装置可以是照相机、摄像机等周期性的获取人脸图像信息的装置,也可以是监视器、录影机等持续性的获取人脸图像信息的装置,还可以是其他能够将光信号转化为电信号的装置。其中,所述人脸图像采集装置优选摄像机,并周期性的对用户进行拍摄生成含有人脸图像信息的相片文件,并将所述含有人脸图像信息的相片文件发送给中央控制器。
用户语音采集装置102,用于采集用户的语音信息,并发送给中央控制器。
在本发明实施例中,所述用户语音采集装置优选话筒,当所述用户语音采集装置使用话筒时,能够即时的获取用户的语音信息,并即时的将所述语音信息发送给中央控制器,可以有效地提高机器人的沟通效率,也可以选择录音设备,将用户的完整的语音信息保存后并发送给中央控制器,还可以选择其他能够将声波转化为电信号的装置。
作为本发明的一个实施例,所述用户语音采集装置在获取到用户的语音信息后能够对所述用户的语音信息进行降噪处理,再将处理后的语音信息发送给中央控制器,所述降噪处理可以有效的避免中央控制器接收到受到噪音信号干扰的语音信息,能够有效地提高机器人的沟通效率。
中央控制器103,用于接收所述人脸图像信息,并根据所述人脸图像信息获取人脸情绪特征信息;用于接受所述用户的语音信息;用于根据所述人脸情绪特征信息以及所述用户的语音信息,确定语音输出信息,并发送给语音输出装置。
作为本发明的一个实施例,所述人脸情绪特征信息包括人脸对应的情绪信息如开心、愤怒、伤心等。
作为本发明的一个实施例,所述确定的语音输出信息与人脸情绪特征信息以及所述的用户的语音信息均有关系,以下述一个例子作简要说明:
当接收到用户同样的语音信息“你好”时,如果判断用户的情绪特征信息为开心时,则输出的语音信息为“你好”,如果判断用户的情绪特征信息为难过时,则输出的语音信息为“你好,请问你怎么了”。
所述由人脸情绪特征信息以及所述的用户的语音信息共同确定的语音输出信息能够使得机器人更加智能化,拟人化,能够满足用户的情感需求,进一步的,还可以作为用户的“倾诉对象”
作为本发明的另一个实施例,所述中央控制器还用于根据所述人脸图像信息获取与所述人脸对应的性别和年龄信息。
所述中央控制器还用于根据所述人脸情绪特征信息、所述人脸对应的性别和年龄以及所述用户的语音信息,确定语音输出信息,并发送给语音输出装置。
作为本发明的另一个实施例,所述确定的语音输出信息与所述人脸情绪特征信息、所述的用户的语音信息以及所述人脸对应的性别和年龄均有关系,以下述一个例子作简要说明。
当接收到用户同样的语音信息“你好”时,如果确定人脸对应的性别与年龄分别为男、青年,则输出的语音信息为“先生,你好”,如果确定人脸对应的性别与年龄分别为女、年幼时,则输出的语音信息为“小妹妹,你好”。
所述由人脸情绪特征信息、所述人脸对应的性别和年龄以及所述用户的语音信息共同确定的语音输出信息进一步的使得机器人更加智能化、拟人化,同时也有利于用户与机器人进行沟通,用户能够根据机器人输出的语音信息主动判断出机器人正在沟通的对象。
作为本发明的又一个实施例,所述语音输出信息包括语音输出内容信息以及语音输出语气信息,所述语音输出语气信息包括开心的语气、安慰的语气、鼓励的语气等。
作为本发明的又一个实施例,所述语音输出内容信息与人脸情绪特征信息以及所述的用户的语音信息均有关系,所述语音输出语气信息与人脸情绪特征信息有关系,以下述一个例子作简要说明。
如果确定所述人脸情绪特征为难过,需要安慰时,所述语音输出语气信息为安慰的语气。如果确定所述人脸情绪特征为低沉,需要鼓励时,所述语音输出语气信息为鼓励的语气。
语音输出装置104,用于接收所述语音输出信息,并根据所述语音输出信息输出语音。
在本发明实施例中,所述语音输出装置能够将电信号转化为声信号如扬声器、声卡等。
作为本发明的一个实施例,所述语音输出装置的声音大小可以由用户主动设置,进一步的,也可以根据获取到的人脸对应的性别和年龄或者获取的用户的语音信息自动调控声音大小,以下述一个例子作简要说明。
当获取到的人脸对应的年龄为年迈时或者获取到用户的语音信息为“你说什么”时,所述语音输出装置能够自动适当的增加音量。
作为本发明的又一个实施例,当接收到语音输出内容信息以及语音输出语气信息,需要对语音输出内容信息以及语音输出语气信息进行合成,并生成具有所述语气的语音输出。
所述语音输出装置预先存储有各语音输出语气的模板,将语音输出内容信息与语音输出语气的模板合成即可生成相应语气的语音输出。
图2示出了本发明实施例提供的中央控制器的结构示例图,为了便于说明,仅示出与本发明相关的部分。
在本发明实施例中,中央控制器包括人脸图像信息接收单元201、用户语音信息接收单元202以及第一信息处理单元203。
人脸图像信息接收单元201,用于接收所述人脸图像信息,并根据所述人脸图像信息获取人脸情绪特征信息。
作为本发明的另一个实施例,所述人脸图像信息接收单元还用于接收所述人脸图像信息,并根据所述人脸图像信息获取所述人脸对应的性别和年龄信息。
所述人脸对应的性别和年龄信息能够影响机器人所确定的语音输出,可以使得机器人更加智能化。
用户语音信息接收单元202,用于接收所述用户的语音信息。
第一信息处理单元203,用于根据所述人脸情绪特征信息以及所述用户的语音信息,确定语音输出信息,并发送给语音输出装置。
作为本发明的另一个实施例,所述第一信息处理单元还用于根据所述人脸情绪特征信息、所述人脸对应的性别和年龄以及所述用户的语音信息,确定语音输出信息,并发送给语音输出装置。
图3示出了本发明实施例提供的人脸图像信息接收单元的结构示意图,为了便于说明,仅示出与本发明相关的部分。
在本发明实施例中,人脸图像信息接收单元包括人脸图像信息接收模块301以及人脸情绪特征信息获取模块302。
人脸图像信息接收模块301,用于接收所述人脸图像信息。
人脸情绪特征信息获取模块302,用于根据所述人脸图像信息与预存的标准人脸情绪图像信息与人脸情绪特征信息的对应关系,获取与所述人脸图像信息对应的人脸情绪特征信息。
在本发明实施例中,所述人脸情绪特征信息获取模块中预先存储有标准人脸情绪图像,所述人脸情绪特征信息获取模块接收到所述人脸图像信息后,将所述人脸图像信息与所述预先存储有标准人脸情绪图像进行比对,并确认人脸情绪特征信息。
图4示出了本发明又一种实施例提供的中央控制器的结构示意图,为了便于说明,仅示出与本发明相关的部分。
本发明实施例中,中央控制器包括人脸图像信息接收单元401、用户语音信息接收单元402以及第一信息处理单元403。
人脸图像信息接收单元401,用于接收所述人脸图像信息,并根据所述人脸图像信息获取人脸情绪特征信息。
在本发明实施例中,所述人脸图像信息接收单元401与前述人脸图像信息接收单元201一致。
用户语音信息接收单元402,用于接收所述用户的语音信息。
在本发明实施例中,所述用户语音信息接收单元402与前述用户语音信息接收单元202一致。
第二信息处理单元403,用于根据所述人脸情绪特征信息以及述用户的语音信息,确定语音输出内容信息和语音输出语气信息,并发送给语音输出装置。
在本发明实施例中,所述语音输出内容信息为语音输出的内容部分,所述语音输出语气信息为语音输出的语气部分。
在本发明实施例中,所述语音输出内容信息与人脸情绪特征信息以及所述的用户的语音信息均有关系,所述语音输出语气信息与人脸情绪特征信息有关系。
图5示出了本发明又一种实施例提供的第二信息处理单元的结构示意图,为了便于说明,仅示出与本发明相关的部分。
在本发明实施例中,第二信息处理单元包括语音输出内容信息确定模块501以及语音输出语气信息确定模块502。
语音输出内容信息确定模块501,用于根据所述人脸情绪特征信息、所述用户的语音信息以及预存的语音输出内容信息与人脸情绪特征信息、用户的语音信息的对应关系,确定与所述人脸情绪特征信息以及用户的语音信息相对应的语音输出内容信息,并发送给语音输出装置。
在本发明实施例中,所述语音输出内容信息确定模块中预先存储有语音输出内容信息与人脸情绪特征信息、用户的语音信息的对应关系,所述语音输出内容信息确定模块接收到所述人脸情绪特征信息以及所述用户的语音信息后,根据预存的语音输出内容信息与人脸情绪特征信息、用户的语音信息的对应关系,确认语音输出内容信息。
语音输出语气信息确定模块502,用于根据所述人脸情绪特征信息以及预存的语音输出语气信息与人脸情绪特征信息的对应关系,确定与所述人脸情绪特征信息相对应的语音输出语气信息,并发送给语音输出装置。
在本发明实施例中,所述语音输出语气信息确定模块中预先存储有语音输出语气信息与人脸情绪特征信息的对应关系,所述语音输出语气信息确定模块接收到所述人脸情绪特征信息后,根据预存的语音输出语气信息与人脸情绪特征信息的对应关系,确认语音输出语气信息。
图6示出了本发明又一种实施例提供的语音输出装置的结构示意图,为了便于说明,仅示出与本发明相关的部分。
在本发明实施例中,语音输出装置包括:
语音输出内容信息接收单元601,用于接收所述语音输出内容信息。
语音输出语气信息接收单元602,用于接收所述语音输出语气信息。
语音合成单元603,用于根据所述语音输出内容信息以及所述语音输出语气信息合成相应的语音。
在本发明实施例中,所述语音合成单元中预先存储有各语音输出语气的模板,将语音输出内容信息与语音输出语气的模板合成即可合成相应语气的语音输出。
语音输出单元604,用于输出所述合成的的相应的语音。
本发明实施例提供的机器人语音交互系统通过用户语音信息采集装置能够获取用户的语音信息,便于机器人能够对用户的问题做出相应的回答,而人脸图像信息采集装置能够获取用户当前的情绪信息,便于机器人判断用户的情感需求,同时获取用户的语音信息以及用户当前的情绪信息,从而使得机器人能够使用更加“拟人化的口吻”对用户的问题做出相应的回答。此外,语音输出装置能够模拟输出多种不同类型的语气,从而在于用户进行沟通时,更加的生动形象,极大地满足了用户的情感需求。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (9)
1.一种机器人语音交互系统,其特征在于,所述机器人语音交互系统包括中央控制器,与所述中央控制器通信的人脸图像采集装置、用户语音采集装置以及语音输出装置;
所述人脸图像采集装置,用于采集所述机器人视野范围内的人脸图像信息,并发送给中央控制器;
所述用户语音采集装置,用于采集用户的语音信息,并发送给中央控制器;
所述中央控制器,用于接收所述人脸图像信息,并根据所述人脸图像信息获取人脸情绪特征信息;用于接受所述用户的语音信息;用于根据所述人脸情绪特征信息以及所述用户的语音信息,确定语音输出信息,并发送给语音输出装置;以及
所述语音输出装置,用于接收所述语音输出信息,并根据所述语音输出信息输出语音。
2.根据权利要求1所述的系统,其特征在于,所述中央控制器还用于根据所述人脸图像信息获取与所述人脸对应的性别和年龄信息;
所述用于根据所述人脸情绪特征信息以及所述用户的语音信息,确定语音输出信息,并发送给语音输出装置,具体为:
用于根据所述人脸情绪特征信息、与所述人脸对应的性别和年龄以及所述用户的语音信息,确定语音输出信息,并发送给语音输出装置。
3.根据权利要求1所述的系统,其特征在于,所述中央控制器包括:
人脸图像信息接收单元,用于接收所述人脸图像信息,并根据所述人脸图像信息获取人脸情绪特征信息;
用户语音信息接收单元,用于接收所述用户的语音信息;以及
第一信息处理单元,用于根据所述人脸情绪特征信息以及所述用户的语音信息,确定语音输出信息,并发送给语音输出装置。
4.根据权利要求3所述的系统,其特征在于,所述人脸图像信息接收单元包括;
人脸图像信息接收模块,用于接收所述人脸图像信息;以及
人脸情绪特征信息获取模块,用于根据所述人脸图像信息与预存的标准人脸情绪图像信息与人脸情绪特征信息的对应关系,获取与所述人脸图像信息对应的人脸情绪特征信息。
5.根据权利要求3所述的系统,其特征在于,所述第一信息处理单元具体用于根据所述人脸情绪特征信息、所述用户的语音信息以及预存的语音输出信息与人脸情绪特征信息、用户的语音信息的对应关系,确定与所述人脸情绪特征信息以及用户的语音信息相对应的语音输出信息,并发送给语音输出装置。
6.根据权利要求1所述的系统,其特征在于,所述语音输出信息包括语音输出内容信息和语音输出语气信息;
所述中央控制器,用于接收所述人脸图像信息,并根据所述人脸图像信息获取人脸情绪特征信息;用于接受所述用户的语音信息;用于根据所述人脸情绪特征信息以及所述用户的语音信息,确定语音输出内容信息和语音输出语气信息,并发送给语音输出装置;以及
所述语音输出装置,用于接收所述语音输出内容信息和语音输出语气信息,并根据所述语音输出内容信息和语音输出语气信息输出语音。
7.根据权利要求6所述的系统,其特征在于,所述中央控制器包括:
人脸图像信息接收单元,用于接收所述人脸图像信息,并根据所述人脸图像信息获取人脸情绪特征信息;
用户语音信息接收单元,用于接收所述用户的语音信息;以及
第二信息处理单元,用于根据所述人脸情绪特征信息以及述用户的语音信息,确定语音输出内容信息和语音输出语气信息,并发送给语音输出装置。
8.根据权利要求7所述的系统,其特征在于,所述第二信息处理单元包括:
语音输出内容信息确定模块,用于根据所述人脸情绪特征信息、所述用户的语音信息以及预存的语音输出内容信息与人脸情绪特征信息、用户的语音信息的对应关系,确定与所述人脸情绪特征信息以及用户的语音信息相对应的语音输出内容信息,并发送给语音输出装置;以及
语音输出语气信息确定模块,用于根据所述人脸情绪特征信息以及预存的语音输出语气信息与人脸情绪特征信息的对应关系,确定与所述人脸情绪特征信息相对应的语音输出语气信息,并发送给语音输出装置。
9.根据权利要求6所述的系统,其特征在于,所述语音输出装置包括:
语音输出内容信息接收单元,用于接收所述语音输出内容信息;
语音输出语气信息接收单元,用于接收所述语音输出语气信息;
语音合成单元,用于根据所述语音输出内容信息以及所述语音输出语气信息合成相应的语音;以及
语音输出单元,用于输出所述合成的的相应的语音。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810947206.3A CN109119077A (zh) | 2018-08-20 | 2018-08-20 | 一种机器人语音交互系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810947206.3A CN109119077A (zh) | 2018-08-20 | 2018-08-20 | 一种机器人语音交互系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109119077A true CN109119077A (zh) | 2019-01-01 |
Family
ID=64853556
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810947206.3A Pending CN109119077A (zh) | 2018-08-20 | 2018-08-20 | 一种机器人语音交互系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109119077A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110085225A (zh) * | 2019-04-24 | 2019-08-02 | 北京百度网讯科技有限公司 | 语音交互方法、装置、智能机器人及计算机可读存储介质 |
CN110444212A (zh) * | 2019-09-10 | 2019-11-12 | 安徽大德中电智能科技有限公司 | 一种智能家居机器人语音识别装置及识别方法 |
CN114516341A (zh) * | 2022-04-13 | 2022-05-20 | 北京智科车联科技有限公司 | 用户交互方法、系统及车辆 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106537294A (zh) * | 2016-06-29 | 2017-03-22 | 深圳狗尾草智能科技有限公司 | 一种机器人交互内容的生成方法、系统及机器人 |
CN206906843U (zh) * | 2017-06-30 | 2018-01-19 | 深圳光启合众科技有限公司 | 机器人的控制装置及机器人 |
CN107645523A (zh) * | 2016-07-21 | 2018-01-30 | 北京快乐智慧科技有限责任公司 | 一种情绪交互的方法和系统 |
CN108009490A (zh) * | 2017-11-29 | 2018-05-08 | 宁波高新区锦众信息科技有限公司 | 一种基于识别情绪的聊天机器人系统及该系统的判断方法 |
CN108326855A (zh) * | 2018-01-26 | 2018-07-27 | 上海器魂智能科技有限公司 | 一种机器人的交互方法、装置、设备以及存储介质 |
-
2018
- 2018-08-20 CN CN201810947206.3A patent/CN109119077A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106537294A (zh) * | 2016-06-29 | 2017-03-22 | 深圳狗尾草智能科技有限公司 | 一种机器人交互内容的生成方法、系统及机器人 |
CN107645523A (zh) * | 2016-07-21 | 2018-01-30 | 北京快乐智慧科技有限责任公司 | 一种情绪交互的方法和系统 |
CN206906843U (zh) * | 2017-06-30 | 2018-01-19 | 深圳光启合众科技有限公司 | 机器人的控制装置及机器人 |
CN108009490A (zh) * | 2017-11-29 | 2018-05-08 | 宁波高新区锦众信息科技有限公司 | 一种基于识别情绪的聊天机器人系统及该系统的判断方法 |
CN108326855A (zh) * | 2018-01-26 | 2018-07-27 | 上海器魂智能科技有限公司 | 一种机器人的交互方法、装置、设备以及存储介质 |
Non-Patent Citations (1)
Title |
---|
"海关眼•商品归类系列"编委会: "《机电商品归类指南》", 31 May 2017 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110085225A (zh) * | 2019-04-24 | 2019-08-02 | 北京百度网讯科技有限公司 | 语音交互方法、装置、智能机器人及计算机可读存储介质 |
CN110085225B (zh) * | 2019-04-24 | 2024-01-02 | 北京百度网讯科技有限公司 | 语音交互方法、装置、智能机器人及计算机可读存储介质 |
CN110444212A (zh) * | 2019-09-10 | 2019-11-12 | 安徽大德中电智能科技有限公司 | 一种智能家居机器人语音识别装置及识别方法 |
CN114516341A (zh) * | 2022-04-13 | 2022-05-20 | 北京智科车联科技有限公司 | 用户交互方法、系统及车辆 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109119077A (zh) | 一种机器人语音交互系统 | |
JP4439740B2 (ja) | 音声変換装置及び方法 | |
Chern et al. | A smartphone-based multi-functional hearing assistive system to facilitate speech recognition in the classroom | |
CN106886162A (zh) | 智能家居管理的方法及其机器人装置 | |
CN108702580A (zh) | 具有自动语音转录的听力辅助 | |
CN109246515B (zh) | 一种可提升个性化音质功能的智能耳机及方法 | |
CN107360387A (zh) | 一种视频录制的方法、装置及终端设备 | |
CN110459204A (zh) | 语音识别方法、装置、存储介质及电子设备 | |
WO2019134473A1 (zh) | 语音识别系统、方法和装置 | |
CN110232925A (zh) | 生成会议记录的方法、装置和会议终端 | |
CN110874137B (zh) | 一种交互方法以及装置 | |
CN105244042B (zh) | 一种基于有限状态自动机的语音情感交互装置与方法 | |
CN109999314A (zh) | 一种基于脑电波监测智能助眠系统及其睡眠耳机 | |
CN109887508A (zh) | 一种基于声纹的会议自动记录方法、电子设备及存储介质 | |
Gregory | Sounds of power and deference: Acoustic analysis of macro social constraints on micro interaction | |
CN110349582B (zh) | 显示装置与远场语音处理电路 | |
CN109346057A (zh) | 一种智能儿童玩具的语音处理系统 | |
CN108877794A (zh) | 用于人机交互的方法、装置、电子设备和计算机可读存储介质 | |
CN109599094A (zh) | 声音美容与情感修饰的方法 | |
CN109785835A (zh) | 一种通过移动终端实现声音录制的方法及装置 | |
CN108364638A (zh) | 一种语音数据处理方法、装置、电子设备和存储介质 | |
CN109300478A (zh) | 一种听力障碍者的辅助对话装置 | |
WO2022007846A1 (zh) | 语音增强方法、设备、系统以及存储介质 | |
CN111276150A (zh) | 一种基于麦克风阵列的智能语音转文字及同声翻译系统 | |
US20230239800A1 (en) | Voice Wake-Up Method, Electronic Device, Wearable Device, and System |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190101 |
|
RJ01 | Rejection of invention patent application after publication |