CN112259094A - 一种语音客服机器人系统 - Google Patents
一种语音客服机器人系统 Download PDFInfo
- Publication number
- CN112259094A CN112259094A CN202011124068.2A CN202011124068A CN112259094A CN 112259094 A CN112259094 A CN 112259094A CN 202011124068 A CN202011124068 A CN 202011124068A CN 112259094 A CN112259094 A CN 112259094A
- Authority
- CN
- China
- Prior art keywords
- voice
- robot
- information
- subsystem
- customer service
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004891 communication Methods 0.000 claims abstract description 33
- 230000003993 interaction Effects 0.000 claims abstract description 30
- 230000010365 information processing Effects 0.000 claims abstract description 6
- 238000005516 engineering process Methods 0.000 claims description 5
- 230000000694 effects Effects 0.000 claims description 3
- 238000001914 filtration Methods 0.000 claims description 3
- 238000009432 framing Methods 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 3
- 230000002452 interceptive effect Effects 0.000 claims 3
- 238000006243 chemical reaction Methods 0.000 description 5
- 238000000034 method Methods 0.000 description 3
- 241000282414 Homo sapiens Species 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 201000004569 Blindness Diseases 0.000 description 1
- 208000036626 Mental retardation Diseases 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/24—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/45—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of analysis window
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/225—Feedback of the input speech
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Manipulator (AREA)
Abstract
本发明公开了一种语音客服机器人系统,包括语音交互系统和机器人控制系统,语音交互系统用于对用户语音输入以及机器人语音输出做信息输出做信息处理,语音输入子系统将用户的语音输入信息转化为文本信息,然后输出文本信息给语音信息解析子系统,语音信息解析子系统根据文本信息,根据不同的应用场景进行理解并给出答案,语音反馈子系统把解析答案转换为语音,然后输入该语音;机器人控制系统包括机器人执行系统和通信子系统,通信子系统作为桥梁将语音交互系统与机器人执行系统进行通信连接,机器人执行系统将语音文本转换为相应的机器人控制信息来实现用户对机器人的具体控制。本发明的语音客服机器人系统智能化程度高。
Description
技术领域
本发明涉及语音机器人系统领域,具体涉及一种语音客服机器人系统。
背景技术
随着机器人技术的发展,服务机器人逐渐广泛走入了人们的生活之中,这也使得人机交互越来越频繁,特别是一些公共场合以及家庭环境,因而方便自然的人机交互逐渐成为人们的关注点。人机交互技术的研究在过去几十年里一直在探索中日益更新升级,也开辟了不同的研究分支,包括语音、图像等,这众多交互方式中,语音交互突破了对手指和平米的依赖,增强了机器主动交流与反应,尤其对于反应迟钝的老人、智障人群、视盲人群以及文盲人群,其大大提高了人机交互的效率,并且能够满足人类情感的表达。
服务机器人的应用范围很广,可细分为专业领域服务机器人以及个人家庭服务机器人,这是一种能够协助人类高效率完成一些有助于其生活、工作等有益性服务的机器人,但是不从事一些生产性工作,他具有半自主性,甚至全自主性工作模式。
现有的语音客服机器人已经应用在各种场所,但是现有的语音客服机器人均是采用微机直接处理录入的语音信息,只是具有机器外壳的语音转换系统,智能化程度不高。
发明内容
本发明提出了一种语音客服机器人系统,解决了现有的语音客服机器人均是采用微机直接处理录入的语音信息,只是具有机器外壳的语音转换系统,智能化程度不高的问题。
本发明的技术方案是这样实现的:
一种语音客服机器人系统,包括语音交互系统和机器人控制系统,
所述语音交互系统用于对用户语音输入以及机器人语音输出做信息输出做信息处理,包括语音输入子系统、语音信息解析子系统和语音反馈子系统,所述语音输入子系统将用户的语音输入信息转化为文本信息,然后输出文本信息给所述语音信息解析子系统,所述语音信息解析子系统根据文本信息,根据不同的应用场景进行理解并给出答案,所述语音反馈子系统把解析答案转换为语音,然后输入该语音;
所述机器人控制系统包括机器人执行系统和通信子系统,所述通信子系统作为桥梁将所述语音交互系统与所述机器人执行系统进行通信连接,所述机器人执行系统将语音文本转换为相应的机器人控制信息来实现用户对机器人的具体控制。
优选的,所述语音信息解析子系统内负载信息查询系统,当用户需要语音查询通讯记录时,用户提供关键词信息给所述信息查询系统,信息查询系统通过匹配查询通讯记录,并将信息反馈给用户。
优选的,所述通信子系统包括嵌入式的Android系统、ROS系统和通信模块,所述ROS系统与所述机器人执行系统共同控制机器人的执行控制。
优选的,所述语音输入子系统包括模数转换器的麦克风,用于把连续变化的语音模拟信号转换为离散数字信号,然后形成文本信息。
优选的,所述语音输入子系统对语音转换为文本信息包括一下步骤:
A、对录入的语音数据进行预滤波去除干扰,然后通过模数转换器转化为离散数字信号,并且通过PCM进行脉冲编码;
B、获取数字语音信号后,通过预加重提高高频特性,然后使用加窗和分帧技术获取语音帧,筛选有效语音信息的部分,进一步排除噪声干扰,提高语音识别效果;
C、提取语音特征,提取MFCC特征信息;
D、将语音特征信息通过声学模型和语音模型转换为字符序列。
优选的,还包括数据库,所述数据库与所述语音交互系统和所述机器人控制系统通信连接,用于记录和存储工作中产生的所有数据。
优选的,所述语音交互系统还包括语音登入系统,所述语音登入系统分配用户登入权限,并且每个登入权限分配一个语音登入指令。
优选的,还包括一键还原系统,所述一键还原系统与所述语音交互系统和所述机器人控制系统通信连接,用于强制控制语音交互系统和所述机器人控制系统,从而进行强制停止系统工作。
本发明的有益效果是,
本发明通过包括语音交互系统和机器人控制系统,其中语音交互系统和机器人控制系统通过预先独立工作,降低了信息处理的难度。
语音交互系统用于对用户语音输入以及机器人语音输出做信息输出做信息处理,包括语音输入子系统、语音信息解析子系统和语音反馈子系统,语音输入子系统将用户的语音输入信息转化为文本信息,然后输出文本信息给语音信息解析子系统,语音信息解析子系统根据文本信息,根据不同的应用场景进行理解并给出答案,语音反馈子系统把解析答案转换为语音,然后输入该语音;实现智能的语音转换。
机器人控制系统包括机器人执行系统和通信子系统,通信子系统作为桥梁将语音交互系统与机器人执行系统进行通信连接,机器人执行系统将语音文本转换为相应的机器人控制信息来实现用户对机器人的具体控制,实现智能的语音控制。
综上,本发明的语音客服机器人系统智能化程度高,适用于各种不同应用场景。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明语音客服机器人系统的系统原理框图;
图2为本发明语音输入子系统对语音转换为文本信息的运行原理图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参照图1-2,一种语音客服机器人系统,包括语音交互系统和机器人控制系统,
语音交互系统用于对用户语音输入以及机器人语音输出做信息输出做信息处理,包括语音输入子系统、语音信息解析子系统和语音反馈子系统,语音输入子系统将用户的语音输入信息转化为文本信息,然后输出文本信息给语音信息解析子系统,语音信息解析子系统根据文本信息,根据不同的应用场景进行理解并给出答案,语音反馈子系统把解析答案转换为语音,然后输入该语音;
机器人控制系统包括机器人执行系统和通信子系统,通信子系统作为桥梁将语音交互系统与机器人执行系统进行通信连接,机器人执行系统将语音文本转换为相应的机器人控制信息来实现用户对机器人的具体控制。
语音信息解析子系统内负载信息查询系统,当用户需要语音查询通讯记录时,用户提供关键词信息给信息查询系统,信息查询系统通过匹配查询通讯记录,并将信息反馈给用户。
通信子系统包括嵌入式的Android系统、ROS系统和通信模块,ROS系统与机器人执行系统共同控制机器人的执行控制。
语音输入子系统包括模数转换器的麦克风,用于把连续变化的语音模拟信号转换为离散数字信号,然后形成文本信息。
语音输入子系统对语音转换为文本信息包括一下步骤:
A、对录入的语音数据进行预滤波去除干扰,然后通过模数转换器转化为离散数字信号,并且通过PCM进行脉冲编码;
B、获取数字语音信号后,通过预加重提高高频特性,然后使用加窗和分帧技术获取语音帧,筛选有效语音信息的部分,进一步排除噪声干扰,提高语音识别效果;其中具体的获取有效语音信息采用端点检测的方式来获取。
C、提取语音特征,提取MFCC特征信息;
D、将语音特征信息通过声学模型和语音模型转换为字符序列;其中具体的声学模型时通过声学、语音学这些知识把语音特征映射为音素单元,语音模型就是通过语言学知识把字词单元拼接为完整的、有意义的且符合说话者表达含义的句子,通过模型训练等到一个参考模型。然后把一段没经过训练的语音信息号的特征序列与参考模型的特征参数进行模式匹配,得到识别结果的文本信息。
还包括数据库,数据库与语音交互系统和机器人控制系统通信连接,用于记录和存储工作中产生的所有数据,其中信息查询系统也是从数据库中调取通讯信息,从而便于跟踪查找。
语音交互系统还包括语音登入系统,语音登入系统分配用户登入权限,并且每个登入权限分配一个语音登入指令,当用户需要对本实施例中的机器人进行操作时,首先需要验证用户的信息,只有授权的用户才可使用。
还包括一键还原系统,一键还原系统与语音交互系统和机器人控制系统通信连接,用于强制控制语音交互系统和机器人控制系统,从而进行强制停止系统工作,当整个系统出现故障,或者有外部的非法用户访问本申请的机器人系统时,为了避免信息外泄,采用一键还原系统,还原信息,避免产生危害行为。
以上仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (8)
1.一种语音客服机器人系统,其特征在于,包括语音交互系统和机器人控制系统,
所述语音交互系统用于对用户语音输入以及机器人语音输出做信息输出做信息处理,包括语音输入子系统、语音信息解析子系统和语音反馈子系统,所述语音输入子系统将用户的语音输入信息转化为文本信息,然后输出文本信息给所述语音信息解析子系统,所述语音信息解析子系统根据文本信息,根据不同的应用场景进行理解并给出答案,所述语音反馈子系统把解析答案转换为语音,然后输入该语音;
所述机器人控制系统包括机器人执行系统和通信子系统,所述通信子系统作为桥梁将所述语音交互系统与所述机器人执行系统进行通信连接,所述机器人执行系统将语音文本转换为相应的机器人控制信息来实现用户对机器人的具体控制。
2.如权利要求1所述的语音客服机器人系统,其特征在于,所述语音信息解析子系统内负载信息查询系统,当用户需要语音查询通讯记录时,用户提供关键词信息给所述信息查询系统,信息查询系统通过匹配查询通讯记录,并将信息反馈给用户。
3.如权利要求1所述的语音客服机器人系统,其特征在于,所述通信子系统包括嵌入式的Android系统、ROS系统和通信模块,所述ROS系统与所述机器人执行系统共同控制机器人的执行控制。
4.如权利要求3所述的语音客服机器人系统,其特征在于,所述语音输入子系统包括模数转换器的麦克风,用于把连续变化的语音模拟信号转换为离散数字信号,然后形成文本信息。
5.如权利要求4所述的语音客服机器人系统,其特征在于,所述语音输入子系统对语音转换为文本信息包括一下步骤:
A、对录入的语音数据进行预滤波去除干扰,然后通过模数转换器转化为离散数字信号,并且通过PCM进行脉冲编码;
B、获取数字语音信号后,通过预加重提高高频特性,然后使用加窗和分帧技术获取语音帧,筛选有效语音信息的部分,进一步排除噪声干扰,提高语音识别效果;
C、提取语音特征,提取MFCC特征信息;
D、将语音特征信息通过声学模型和语音模型转换为字符序列。
6.如权利要求1所述的语音客服机器人系统,其特征在于,还包括数据库,所述数据库与所述语音交互系统和所述机器人控制系统通信连接,用于记录和存储工作中产生的所有数据。
7.如权利要求1所述的语音客服机器人系统,其特征在于,所述语音交互系统还包括语音登入系统,所述语音登入系统分配用户登入权限,并且每个登入权限分配一个语音登入指令。
8.如权利要求6所述的语音客服机器人系统,其特征在于,还包括一键还原系统,所述一键还原系统与所述语音交互系统和所述机器人控制系统通信连接,用于强制控制语音交互系统和所述机器人控制系统,从而进行强制停止系统工作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011124068.2A CN112259094A (zh) | 2020-10-20 | 2020-10-20 | 一种语音客服机器人系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011124068.2A CN112259094A (zh) | 2020-10-20 | 2020-10-20 | 一种语音客服机器人系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112259094A true CN112259094A (zh) | 2021-01-22 |
Family
ID=74245613
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011124068.2A Pending CN112259094A (zh) | 2020-10-20 | 2020-10-20 | 一种语音客服机器人系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112259094A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106560892A (zh) * | 2015-09-30 | 2017-04-12 | 深圳光启合众科技有限公司 | 智能机器人及其云端交互方法、云端交互系统 |
CN107015964A (zh) * | 2017-03-22 | 2017-08-04 | 北京光年无限科技有限公司 | 面向智能机器人开发的自定义意图实现方法及装置 |
CN109961780A (zh) * | 2017-12-22 | 2019-07-02 | 深圳市优必选科技有限公司 | 一种人机交互方法、装置、服务器和存储介质 |
CN110491382A (zh) * | 2019-03-11 | 2019-11-22 | 腾讯科技(深圳)有限公司 | 基于人工智能的语音识别方法、装置及语音交互设备 |
US20200005772A1 (en) * | 2018-06-28 | 2020-01-02 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Interactive method and device of robot, and device |
CN111488433A (zh) * | 2020-06-28 | 2020-08-04 | 南京银行股份有限公司 | 一种适用于银行的提升现场体验感的人工智能交互系统 |
-
2020
- 2020-10-20 CN CN202011124068.2A patent/CN112259094A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106560892A (zh) * | 2015-09-30 | 2017-04-12 | 深圳光启合众科技有限公司 | 智能机器人及其云端交互方法、云端交互系统 |
CN107015964A (zh) * | 2017-03-22 | 2017-08-04 | 北京光年无限科技有限公司 | 面向智能机器人开发的自定义意图实现方法及装置 |
CN109961780A (zh) * | 2017-12-22 | 2019-07-02 | 深圳市优必选科技有限公司 | 一种人机交互方法、装置、服务器和存储介质 |
US20200005772A1 (en) * | 2018-06-28 | 2020-01-02 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Interactive method and device of robot, and device |
CN110491382A (zh) * | 2019-03-11 | 2019-11-22 | 腾讯科技(深圳)有限公司 | 基于人工智能的语音识别方法、装置及语音交互设备 |
CN111488433A (zh) * | 2020-06-28 | 2020-08-04 | 南京银行股份有限公司 | 一种适用于银行的提升现场体验感的人工智能交互系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6311159B1 (en) | Speech controlled computer user interface | |
CN112101045B (zh) | 一种多模态语义完整性识别方法、装置及电子设备 | |
CN109147768A (zh) | 一种基于深度学习的语音识别方法及系统 | |
CN110047481B (zh) | 用于语音识别的方法和装置 | |
CN111312219B (zh) | 电话录音标注方法、系统、存储介质和电子设备 | |
CN110648691B (zh) | 基于语音的能量值的情绪识别方法、装置和系统 | |
US20060206333A1 (en) | Speaker-dependent dialog adaptation | |
CN110277088B (zh) | 智能语音识别方法、装置及计算机可读存储介质 | |
WO2020205233A1 (en) | Direct speech-to-speech translation via machine learning | |
SG128406A1 (en) | Character recognizing and translating system and voice recognizing and translating system | |
US9412364B2 (en) | Enhanced accuracy for speech recognition grammars | |
US5956671A (en) | Apparatus and methods for shift invariant speech recognition | |
US20220238118A1 (en) | Apparatus for processing an audio signal for the generation of a multimedia file with speech transcription | |
CN111429914A (zh) | 麦克风控制方法、电子装置及计算机可读存储介质 | |
CN112087726A (zh) | 彩铃识别的方法及系统、电子设备及存储介质 | |
CN112420053A (zh) | 智能交互式人机对话系统 | |
CN112259094A (zh) | 一种语音客服机器人系统 | |
CN86100298A (zh) | 语音识别 | |
CN116978359A (zh) | 音素识别方法、装置、电子设备及存储介质 | |
CN115691500A (zh) | 一种基于时延神经网络的电力客服语音识别方法及装置 | |
EP0903727A1 (en) | A system and method for automatic speech recognition | |
Moore | Research challenges in the automation of spoken language interaction | |
Kai et al. | Research on Intelligent Human-Computer Interaction Technology of Tobacco System | |
Moore | Speech pattern processing | |
Joseph et al. | Comprehensive Assessment of Automatic Speech Recognition System for building Artificial Intelligent Schemes |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |