CN102956232A

CN102956232A - 嵌入式智能语音处理引擎

Info

Publication number: CN102956232A
Application number: CN 201110236368
Authority: CN
Inventors: 李世英; 姚曙光; 罗毅; 王小龙; 刘德欣
Original assignee: INFORMEDIA ELECTRONIC CO Ltd
Current assignee: INFORMEDIA ELECTRONIC CO Ltd
Priority date: 2011-08-17
Filing date: 2011-08-17
Publication date: 2013-03-06

Abstract

本发明提供了一种嵌入式智能语音处理引擎：一种嵌入式智能语音处理引擎的实现方法，其特征在于包括如下步骤：用户客户端从音频文件中提取文件的语音特征参数，上传至服务器；服务器接收文件后，识别语音参数，进行特征比对和语句判别，并从数据库中调取相应的语音文件，将该语音文件返回客户端。具有如下特点：1.模块的小型化，为适应分布式的系统模式，将庞大的语料库与相应的计算处理进行动态调度，实施网络分布式管理，减小客户端承载压力。2.分布式并行计算对于语音识别，引擎在客户端对接收的发音信号进行实时运算，实时提取其语音特征后提交服务器进行多服务器分布式联动匹配计算，获取对应音素数据后返回。

Description

嵌入式智能语音处理引擎

技术领域

本发明设计一种远程语音处理系统，尤其设计一种分布嵌入式智能语音处理引擎。

背景技术

分布式语音识别伴随着无线网络的推广应运而生，其基本思路是将语音识别过程分成几个功能相对独立的模块，将这几个模块的计算分布到网络上的不同设备，通过定义和规范模块接口使模块协同工作，共同完成语音识别，提高了语音识别性能。它的优点是对终端计算能力和存储量要求低、灵活性强，为嵌入式系统的语音技术应用开辟了新道路。

语音合成技术在2000年时已达到用户基本可接受的准实用水平，2005年开始获得了较为广泛的应用。未来语音合成技术将从清晰度和自然度的要求上升至对个性化合成的要求，如对语音、语调、情绪的丰富性要求等。

发明内容

针对以上亟待解决的问题的提出，本发明提供了一种嵌入式智能语音处理引擎：

一种嵌入式智能语音处理引擎的实现方法，其特征在于包括如下步骤：

用户客户端从音频文件中提取文件的语音特征参数，上传至服务器；

服务器接收文件后，识别语音参数，进行特征比对和语句判别，并从数据库中调取相应的语音文件，将该语音文件返回客户端。

所述客户端包括语音识别集群SRC(Speech recognize Cluster)和语音合成集群SSC(Speech Synthesis Cluster)。

语音识别集群SRC(Speech recognize Cluster)和语音合成集群SSC(SpeechSynthesis Cluster)采用Master/Slave结构，该Master/Slave架构中Master负责Slave的调度管理。

由于采用了上述技术方案本发明提供的分布式智能语音处理引擎具有如下突出的特点：

1.模块的小型化，为适应分布式的系统模式，将庞大的语料库与相应的计算处理进行动态调度，实施网络分布式管理，减小客户端承载压力。

2.分布式并行计算对于语音识别，引擎在客户端对接收的发音信号进行实时运算，实时提取其语音特征后提交服务器进行多服务器分布式联动匹配计算，获取对应音素数据后返回。对于语音识别，引擎将待合成文本直接提交到后台进行分布式处理。

附图说明

本发明只有一幅附图

图1为本发明的结构示意图

具体实施方式

图1为本发明的结构示意图，如图1所示：一种嵌入式智能语音处理引擎的实现方法，包括

服务器接收文件后，识别语音参数，进行特征比对和语句判别，并从数据库中调取相应的语音文件，将该语音文件返回客户端。语音识别分为特征提取和特征比对、词句判别两个阶段，分布式语音识别(DSR)技术采用客户机/服务器方法，整个处理过程分布于终端和网络两端。终端执行语音特征参数提取任务，是语音识别系统的前端。提取的特征参数传输至服务器端识别器。服务器端识别器负责特征比对和词句判别。

语音识别集群SRC(Speech recognize Cluster)和语音合成集群SSC(SpeechSynthesis Cluster)采用Master/Slave结构，该Master/Slave架构中Master负责Slave的调度管理。语音识别和合成的后台服务基于分布式架构，主要采用Master/Slave结构，Master负责Slave的调度管理，在Slave失效时进行其他Slave节点的动态迁移。计算时，运用Map/Reduce原理进行运算的分解，最终将结果整合起来反馈给客户端。

Claims

1.一种嵌入式智能语音处理引擎的实现方法，其特征在于包括如下步骤：

2.根据权利要求1所述的一种嵌入式智能语音处理引擎的实现方法，其特征还在于：所述客户端包括语音识别集群Speech recognize Cluster和语音合成集群Speech Synthesis Cluster。

3.根据权利要求2所述的一种嵌入式智能语音处理引擎的实现方法，其特征还在于：语音识别集群SRC和语音合成集群SSC采用Master/Slave结构，该Master/Slave架构中Master负责Slave的调度管理。