CN106057194A

CN106057194A - 一种语音交互系统

Info

Publication number: CN106057194A
Application number: CN201610468878.7A
Authority: CN
Inventors: 王袁明; 张洪雷; 刘长伟; 王飞; 洪伟; 李锟德; 寇小丰; 刘媛媛
Original assignee: Zhejiang Hozon New Energy Automobile Co Ltd
Current assignee: Zhejiang Hozon New Energy Automobile Co Ltd
Priority date: 2016-06-25
Filing date: 2016-06-25
Publication date: 2016-10-26

Abstract

本发明涉及人机交互领域、语音识别领域，尤其涉及一种语音交互系统。包括语音交互装置以及云处理装置，其特征在于：所述语音交互装置包括设置在汽车中的：语音输入单元、语音处理单元、车载交互终端和语音输出单元；所述云处理装置包括：云服务器、数据存储单元、语音解析单元、语音反馈单元；所述车载交互终端和所述云服务器之间通过网络进行数据交互；其特征在于：所述云处理装置还包括语音学习单元；所述语音学习单元，在所述语音解析单元匹配失败时进行跟读学习。

Description

一种语音交互系统

技术领域

本发明本发明涉及人机交互领域、语音识别领域，尤其涉及一种语音交互系统。

背景技术

随着互联网与人工智能技术的不断发展，语音交互系统近些年可以说是快速的发展。而车载的人机交互系统的历史尽管只有三、四年的历史，但是发展却是突飞猛进。作为驾驶者最安全、最便捷的信息交互方式，语音交互已经成为车载系统发展的必然趋势。但是目前的车载系统语音识别不能根据不同人的口音特性、发音习惯、语种的不同而自适应其口音，使语音识别的成功率特别低，与人交互的体验感不强。而且基本上是基于本地的语音系统，其处理能力非常有限。

发明内容

本发明提出一种基于云端处理带自学习功能的车载语音交互系统方式，可以解决语音交互时不能根据不同人口音的差别识别语音的问题，同时具有自学习功能，能不断地补充完善云语音库。

一种语音交互系统，包括语音交互装置以及云处理装置，其特征在于：所述语音交互装置包括设置在汽车中的：语音输入单元、语音处理单元、车载交互终端和语音输出单元；所述云处理装置包括：云服务器、数据存储单元、语音解析单元、语音反馈单元；所述车载交互终端和所述云服务器之间通过网络进行数据交互；其特征在于：所述云处理装置还包括语音学习单元；所述语音学习单元，在所述语音解析单元匹配失败时进行跟读学习。

作为优选，在跟读学习模式下：所述语音学习单元，通过所述云服务器发送标准语音数据至所述语音交互装置；所述语音输出单元，通过所述车载交互终端接收所述云处理装置发送的标准语音数据，并根据所述标准语音数据输出标准语音；所述语音输入单元，接收所述用户输入的跟读语音并发送至所述语音处理单元；所述语音处理单元，对来自所述语音输入单元的跟读语音进行语音处理，生成跟读语音数据，并通过车载交互终端发送至所述云处理装置；所述语音学习单元，根据所述跟读语音数据和所述标准语音数据生成新的个性语音类别添加至存储在所述数据存储单元中的语音数据库，所述个性语音类别包括语音特征数据。

作为优选，所述语音学习单元包括语音特征提取模块，所述语音特征提取模块用于比较所述标准语音数据与所述跟读语音数据，生成语音特征数据。

作为优选，所述语音特征提取模块用于比较所述标准语音数据和所述跟读语音数据的语速信息，所述语音特征数据包括用户语速特征的语速信息。

作为优选，所述语音特征提取模块用于比较所述标注语音数据和所述跟读语音数据的语调信息，所述语音特征包括用于语调特征的语调信息。

作为优选，所述语音数据库包括语种数据库。

作为优选，所述语音数据库包括方言数据库。

作为优选，所述车载交互终端包括参数设置单元，所述参数设置模块接收用户输入的反馈参数并发送至所述语音反馈单元；所述反馈参数包括反馈语种信息，所述语音反馈单元根据所述反馈参数生成与所述反馈语种对应的语音反馈数据。

作为优选，所述语音交互装置包括激活单元，所述激活单元包含存储有激活指令的存储模块；所述激活单元与所述语音处理单元连接，所述激活单元与所述车载交互终端连接；所述激活单元在所述语音指令包含激活指令时，激活所述车载交互终端。

作为优选，所述激活指令可通过所述语音输入单元输入，并经过所述语音处理单元处理后存储至所述存储模块。

附图说明

图1 语音交互系统框图。

图2 车载交互终端激活流程图。

图3一般语音交互流程图。

图4跟读学习流程图。

具体实施方式

下面将结合附图对本发明的实施方式进行详细描述。一种语音交互系统，包括语音交互装置以及设置在云端的云处理装置。

语音交互装置包括设置在汽车中的：语音输入单元、语音处理单元、车载交互终端、激活单元和语音输出单元，语音输入单元的信号输出至语音处理单元，语音处理单元的信号分别输出至车载交互终端和激活单元，激活单元的信号输出至车载交互终端用于唤醒车载交互终端。云处理装置包括：云服务器、数据存储单元、语音解析单元、语音反馈单元、语音学习单元，云服务器的信号输出至语音解析单元，用于对经语音交互终端输入的语音数据进行语音匹配，云服务器的信号输出至语音学习单元，语音学习单元包括特征提取单元，用于对经语音交互终端输入的语音数据进行语音特征提取。语音解析单元的信号分别输出至语音反馈单元和语音学习单元，以分别启动语音反馈单元和语音学习单元的进行工作。语音学习单元的信号输出至云服务器。车载交互终端和云服务器之间通过网络进行数据交互。

基于本语音交互系统的语音交互操作包括以下功能阶段：

一.车载交互终端的激活

语音输入单元，接收用户输入的包含有激活指令的语音指令并发送至语音处理单元；

语音处理单元，对来自语音输入单元的语音指令进行语音处理，生成语音指令数据，并发送至激活单元；

激活单元，比较来自语音处理单元的语音指令数据与存储在其存储模块中的激活指令数据，在判断用户的输入的语音指令中包含有激活指令时，激活车载交互终端。

其中，激活指令数据可以通过预语音输入单元输入，并经过语音处理单元处理后存储至存储模块。

用户上车后，可以通过包含激活指令例如“你好”、“小丽”等的特殊指令唤醒车载交互终端。

二.一般语音交互

语音输入单元，接收用户输入的语音指令并发送至语音处理单元。

语音处理单元，对来自语音输入单元的语音指令进行语音处理，生成语音指令数据，并通过车载交互终端发送至云处理装置。

语音解析单元，通过云服务器接收语音指令数据与语音数据库进行匹配。该匹配是指通过在数据存储模块中检索、对比，查找与用于输入的语音指令的语种相同的语种信息库，使得用户输入的语音指令能够被解读。

语音反馈单元，在语音解析单元匹配成功时，根据语音指令数据，结合与用户输入的语音指令对应的语种信息库，生成语音反馈数据，并通过后台服务器发送至语音交互装置。

语音输出单元，通过车载交互终端接收云处理装置的语音反馈数据，并根据语音反馈数据输出反馈语音。

语音数据库还包括方言数据库和语种数据库。车载交互终端包括参数设置单元，参数设置模块接收用户输入的反馈参数并发送至语音反馈单元；反馈参数包括反馈语种信息，语音反馈单元根据语音解析单元的解析结果以及该反馈参数生成与反馈语种对应的语音反馈数据。语音交互系统可以根据用户的设置，选择合适的语种以及方言来与其交流。如果用户说的是四川方言，我们语音数据库里面存有四川方言的语系，便可直接匹配四川语音进行回复沟通。

三.跟读学习

语音学习单元，在语音解析单元匹配失败时通过云服务器发送标准语音数据。

语音输出单元，通过车载交互终端接收云处理装置的标准语音数据，并根据标准语音数据输出标准语音。

语音输入单元，接收用户输入的跟读语音并发送至语音处理单元。

语音处理单元，对来自语音输入单元的跟读语音进行语音处理，生成跟读语音数据，并通过车载交互终端发送至云处理装置。

语音学习单元，根据跟读语音数据和标准语音数据生成新的个性语音类别添加至存储在数据存储单元中的语音数据库，个性语音类别包括语音特征数据。语音特征提取模块用于比较标准语音数据与跟读语音数据的语速信息以及语调信息，生成包括语速特征和语调特征的语音特征数据。跟读模式下对用于的语音进行学习，通过语速特征以及语调特征对无法识别的新用户的语音数据进行标记，建立用户的个性语音类别。

同时，语音数据库还包括方言数据库和语种数据库。当系统再次接收到该用户输入的语音指令时，语音分析单元能够将新添加的该用户的个性语音类别与该语音指令数据进行匹配，结合方言数据数据库和语种数据库结合，可以对用户语音指令数据进行解析。车载交互终端包括参数设置单元，参数设置模块接收用户输入的反馈参数并发送至语音反馈单元；反馈参数包括反馈语种信息，语音反馈单元根据语音解析单元的解析结果以及该反馈参数生成与反馈语种对应的语音反馈数据。

虽然结合附图描述了本发明的实施方式，但是本领域普通技术人员可以在所附权利要求的范围内做出各种变形或修改。

Claims

1.一种语音交互系统，包括语音交互装置以及云处理装置，其特征在于：

所述语音交互装置包括设置在汽车中的：语音输入单元、语音处理单元、车载交互终端和语音输出单元；所述云处理装置包括：云服务器、数据存储单元、语音解析单元、语音反馈单元；所述车载交互终端和所述云服务器之间通过网络进行数据交互；其特征在于：所述云处理装置还包括语音学习单元；所述语音学习单元，在所述语音解析单元匹配失败时进行跟读学习。

2.根据权利要求1所述的一种语音交互系统，其特征在于：在跟读学习模式下，

所述语音学习单元，通过所述云服务器发送标准语音数据至所述语音交互装置；

所述语音输出单元，通过所述车载交互终端接收所述云处理装置发送的标准语音数据，并根据所述标准语音数据输出标准语音；

所述语音输入单元，接收所述用户输入的跟读语音并发送至所述语音处理单元；

所述语音处理单元，对来自所述语音输入单元的跟读语音进行语音处理，生成跟读语音数据，并通过车载交互终端发送至所述云处理装置；

所述语音学习单元，根据所述跟读语音数据和所述标准语音数据生成新的个性语音类别添加至存储在所述数据存储单元中的语音数据库，所述个性语音类别包括语音特征数据。

3.根据权利要求2所述的一种语音交互系统，其特征在于：所述语音学习单元包括语音特征提取模块，所述语音特征提取模块用于比较所述标准语音数据与所述跟读语音数据，生成语音特征数据。

4.根据权利要求3所述的一种语音交互系统，其特征在与：所述语音特征提取模块用于比较所述标准语音数据和所述跟读语音数据的语速信息，所述语音特征数据包括用户语速特征的语速信息。

5.根据权利要求3所述的一种语音交互系统，其特征在于：所述语音特征提取模块用于比较所述标注语音数据和所述跟读语音数据的语调信息，所述语音特征包括用于语调特征的语调信息。

6.根据权利要求4或5所述的一种语音交互系统，其特征在于：所述语音数据库包括语种数据库。

7.根据权利要求6所述的一种语音交互系统，其特征在于：所述语音数据库包括方言数据库。

8.根据权利要求6所述的一种语音交互系统，其特征在于：所述车载交互终端包括参数设置单元，所述参数设置模块接收用户输入的反馈参数并发送至所述语音反馈单元；所述反馈参数包括反馈语种信息，所述语音反馈单元根据所述反馈参数生成与所述反馈语种对应的语音反馈数据。

9.根据权利要求1所述的一种语音交互系统，其特征在于：所述语音交互装置包括激活单元，所述激活单元包含存储有激活指令数据的存储模块；所述激活单元与所述语音处理单元连接，所述激活单元与所述车载交互终端连接；所述激活单元在所述语音指令包含激活指令时，激活所述车载交互终端。

10.根据权利要求9所述的一种语音交互系统，其特征在于：所述激活指令可通过所述语音输入单元输入，并经过所述语音处理单元处理后存储至所述存储模块。