CN202587038U - 语音数据处理平台及系统 - Google Patents

语音数据处理平台及系统 Download PDF

Info

Publication number
CN202587038U
CN202587038U CN 201220151755 CN201220151755U CN202587038U CN 202587038 U CN202587038 U CN 202587038U CN 201220151755 CN201220151755 CN 201220151755 CN 201220151755 U CN201220151755 U CN 201220151755U CN 202587038 U CN202587038 U CN 202587038U
Authority
CN
China
Prior art keywords
module
client
data processing
voice
communication module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN 201220151755
Other languages
English (en)
Inventor
沈嘉鑫
许军
邵颖
王钢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai car sound intelligent technology Co., Ltd.
Original Assignee
SHANGHAI CHEYIN NETWORK TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANGHAI CHEYIN NETWORK TECHNOLOGY Co Ltd filed Critical SHANGHAI CHEYIN NETWORK TECHNOLOGY Co Ltd
Priority to CN 201220151755 priority Critical patent/CN202587038U/zh
Application granted granted Critical
Publication of CN202587038U publication Critical patent/CN202587038U/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本实用新型提供了一种语音数据处理平台及系统。所述系统包括语音数据处理平台和客户端;所述系统包括设置于语音数据处理平台或客户端的语音识别模块;所述语音数据处理平台包括:用于与客户端进行通讯的局端通讯模块;数据处理模块,连接所述局端通讯模块以对接收到的语音识别模块识别出的文本进行处理;语音合成模块,用于将所述数据处理模块的处理结果生成个性化语音并发送到客户端;所述客户端包括:用于连接所述局端通讯模块的客户端通讯模块;播放模块,连接所述客户端通讯模块以将所述语音数据处理平台发送来的语音进行播放。本实用新型可以采用TTS技术生成个性化语音,从而提高的用户使用体验感。

Description

语音数据处理平台及系统
技术领域
本实用新型涉及移动通讯技术领域,特别是指一种语音数据处理平台及系统。
背景技术
随着移动通讯技术的发展和电子技术的发展,越来越多客户端设备(例如移动终端)具有了数据处理功能和数据通讯功能。现有的语音数据处理平台一般都包括:用于与客户端设备通讯的局端通讯模块,用于进行语音识别的语音识别模块。这样可以将从客户端设备接收到的语音进行识别后,进行相应的处理。这种方式可以极大的方便使用者的使用。但是对于现有的语音数据处理平台,只能通过单一的语音向客户端设备播放信息,这种方式造成用户体验感很差。
实用新型内容
针对现有的客户端设备存在的上述缺陷和问题,本实用新型实施例的目的是提出一种能够降低客户端设备成本和使用复杂度的语音数据处理平台及系统。
为了达到上述目的,本实用新型实施例提出了一种语音数据处理系统,包括语音数据处理平台和客户端;所述系统包括设置于语音数据处理平台或客户端的语音识别模块;
所述语音数据处理平台还包括:
用于与客户端进行通讯的局端通讯模块;
数据处理模块,连接所述局端通讯模块以对接收到的语音识别模块识别出的文本进行处理;
语音合成模块,用于将所述数据处理模块的处理结果生成个性化语音并发送到客户端;
所述客户端包括:
用于连接所述局端通讯模块的客户端通讯模块;
播放模块,连接所述客户端通讯模块以将所述语音数据处理平台发送来的语音进行播放。
本实用新型实施例还提出了一种语音数据处理平台,包括:
用于与客户端进行通讯的局端通讯模块;
数据处理模块,连接所述局端通讯模块以对接收到的语音识别模块识别出的文本进行处理;
语音合成模块,用于将所述数据处理模块的处理结果生成个性化语音并发送到客户端;
本实用新型实施例提出了一种语音数据处理平台、系统,可以采用TTS技术生成个性化语音,从而提高的用户使用体验感。
附图说明
为了更清楚地说明本实用新型实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本实用新型的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本实用新型实施例的一种系统的结构示意图;
图2为本实用新型实施例的另一种系统的结构示意图;
图3为本实用新型实施例的语音数据处理平台的结构示意图。
具体实施方式
下面将结合本实用新型的附图,对本实用新型的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本实用新型一部分实施例,而不是全部的实施例。基于本实用新型中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本实用新型保护的范围。
语音合成(Text To Speech),简称TTS技术,涉及声学、语言学、数字信号处理技术、多媒体技术等多个学科技术,是中文信息处理领域的一项前沿技术。语音合成就是一个将文本转化为语音输出的过程,这个过程的工作主要是将输入的文本按字或词分解为音素,并且对文本中的数字、货币单位、单词变形以及标点等要特殊处理的符号进行分析,以及将音素生成数字音频然后用扬声器播放出来或者存为声音文件以后用多媒体软件播放。本申请的发明点在于,利用以后的TTS技术来实现个性化语音播放,同时在语音数据处理平台可以进行翻译。
实施例1
本实用新型实施例提出了一种语音数据处理系统,其结构如图1所示,包括:语音数据处理平台1和客户端2;
所述语音数据处理平台1包括:局端通讯模块11,语音识别模块12、数据处理模块13、TTS模块14(即语音合成模块);
所述局端通讯模块11用于连接客户端2以与客户端2进行通讯。所述语音识别模块12连接局端通讯模块11和数据处理模块13,以将所述客户端2发送来的语音进行识别,并将识别后的文本发送到所述数据处理模块13。所述数据处理模块13用于接收所述语音识别模块识别出的文本,并对所述文本继续进行处理。TTS模块14,连接所述数据处理模块13以将处理后的文本转换为个性化的语音,并通过局端通讯模块11发送到客户端2。其中,客户端可以预先接入该语音数据处理平台1,对自己喜好的语音类型进行设定。语音数据处理平台1根据该设定以及该客户端的唯一标识来确定每个用户喜好的个性化语音并存储。这样以后用户每次接入时听到的都是自己喜欢的语音,提高用户的使用体验感。
申请人在此需要说明,上述各个模块均为已有技术,本实用新型的发明点在于将上述各个模块集中在一起连接形成一个语音数据处理平台和系统。
所述客户端2包括:客户端通讯模块21和播放模块22。客户端通讯模块11用于连接局端通讯模块21,播放模块22,连接所述客户端通讯模块21以将所述语音数据处理平台1发送来的语音进行播放。
其中,所述数据处理模块包括机器翻译单元和/或导航单元。所述机器翻译单元用于对文本进行多语言翻译后发送到TTS模块;所述导航单元用于根据文本生成导航信息后发送到TTS模块。
这样客户端可以直接将语音发送到语音数据处理平台,然后由语音数据处理平台进行语音识别后,进行相应的处理。该处理可以包括但不限于:进行多语言翻译,进行导航。当然,为了提供更好的服务,该语音数据处理平台可以设置多个各种单元以完成不同的服务。多语言翻译、导航只是本实用新型实现的一个具体方式,而非对本实用新型做出的限定。同时,通过语音数据处理平台1通过TTS模块14转换为语音后,还可以将对应的文本也采用邮件/短消息方式发送到客户端2。
更进一步的,所述客户端包括信号输送模块以向机械设备输送信号以指令机械设备进行固定动作。其中,客户端可以通过无线或蓝牙对连接的机械设备进行信号输送,以指令机械设备的固定动作输出(机器玩具)。这样可以使语音数据处理平台1通过客户端对机械设备直接进行控制。
实施例2
本实用新型另一实施例还提出了一种语音数据处理系统,其与第一实施例的区别在于语音识别模块设置在客户端。其结构如图2所示,包括:语音数据处理平台1和客户端2;
所述语音数据处理平台1包括:局端通讯模块11、数据处理模块13、TTS模块14;
所述数据处理模块13连接局端通讯模块11,以将客户端2的语音识别模块23识别出的文本继续进行处理。TTS模块14,连接所述数据处理模块13以将处理后的文本转换为个性化的语音,并通过局端通讯模块11发送到客户端2。其中,客户端可以预先接入该语音数据处理平台1,对自己喜好的语音类型进行设定。语音数据处理平台1根据该设定以及该客户端的唯一标识来确定每个用户喜好的个性化语音并存储。这样以后用户每次接入时听到的都是自己喜欢的语音,提高用户的使用体验感。
所述客户端2包括:客户端通讯模块21和播放模块22、语音识别模块23。客户端通讯模块21用于连接局端通讯模块11,播放模块22,连接所述客户端通讯模块21以将所述语音数据处理平台1发送来的语音进行播放。客户端2在接收到用户的语音后,首先通过语音识别模块23进行识别后,将识别后的文本通过客户端通讯模块21发送到语音数据处理平台1。语音数据处理平台1进行相应处理后再通过语音的方式发送到客户端2。
其中,所述数据处理模块包括机器翻译单元和/或导航单元。所述机器翻译单元用于对文本进行多语言翻译后发送到TTS模块;所述导航单元用于根据文本生成导航信息后发送到TTS模块。
更进一步的,所述客户端包括信号输送模块以向机械设备输送信号以指令机械设备进行固定动作。其中,客户端可以通过无线或蓝牙对连接的机械设备进行信号输送,以指令机械设备的固定动作输出(机器玩具)。这样可以使语音数据处理平台1通过客户端对机械设备直接进行控制。
实施例3
本实用新型第三实施例提出了一种语音数据处理平台,其结构如图3所示,包括:局端通讯模块11、数据处理模块13、TTS模块14;
所述数据处理模块13连接局端通讯模块11,以将客户端2的语音识别模块23识别出的文本继续进行处理。TTS模块14,连接所述数据处理模块13以将处理后的文本转换为个性化的语音,并通过局端通讯模块11发送到客户端2。其中,客户端可以预先接入该语音数据处理平台1,对自己喜好的语音类型进行设定。语音数据处理平台1根据该设定以及该客户端的唯一标识来确定每个用户喜好的个性化语音并存储。这样以后用户每次接入时听到的都是自己喜欢的语音,提高用户的使用体验感。
其中,所述语音数据处理平台1还包括:
语音识别模块12,所述语音识别模块12分别连接所述局端通讯模块11和数据处理模块13,以将所述客户端发送来的语音进行识别,并将识别后的文本发送到所述数据处理模块13。
以上所述,仅为本实用新型的具体实施方式,但本实用新型的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本实用新型揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本实用新型的保护范围之内。因此,本实用新型的保护范围应所述以权利要求的保护范围为准。

Claims (8)

1.一种语音数据处理系统,其特征在于,包括:语音数据处理平台和客户端;所述系统包括设置于语音数据处理平台或客户端的语音识别模块;
所述语音数据处理平台还包括:
用于与客户端进行通讯的局端通讯模块;
数据处理模块,连接所述局端通讯模块以对接收到的语音识别模块识别出的文本进行处理;
语音合成模块,用于将所述数据处理模块的处理结果生成个性化语音并发送到客户端;
所述客户端包括:
用于连接所述局端通讯模块的客户端通讯模块;
播放模块,连接所述客户端通讯模块以将所述语音数据处理平台发送来的语音进行播放。
2.根据权利要求1所述的语音数据处理系统,其特征在于,所述数据处理模块包括机器翻译单元和/或导航单元;
所述机器翻译单元用于对文本进行多语言翻译后发送到语音合成模块;
所述导航单元用于根据文本生成导航信息后发送到语音合成模块。
3.根据权利要求1或2所述的语音数据处理系统,其特征在于,所述语音识别模块设置于所述客户端,所述语音识别模块连接所述客户端通讯模块以将识别后的语音发送到所述语音数据处理平台。
4.根据权利要求1或2所述的语音数据处理系统,其特征在于,所述语音识别模块设置于所述语音数据处理平台,所述语音识别模块分别连接所述局端通讯模块和数据处理模块,以将所述客户端发送来的语音进行识别,并将识别后的文本发送到所述数据处理模块。
5.根据权利要求1所述的语音数据处理系统,其特征在于,所述客户端包括信号输送模块以向机械设备输送信号以指令机械设备进行固定动作。
6.一种语音数据处理平台,其特征在于,包括:
用于与客户端进行通讯的局端通讯模块;
数据处理模块,连接所述局端通讯模块以对接收到的语音识别模块识别出的文本进行处理;
语音合成模块,用于将所述数据处理模块的处理结果生成个性化语音并发送到客户端。
7.根据权利要求6所述的语音数据处理平台,其特征在于,所述数据处理模块包括机器翻译单元和/或导航单元;
所述机器翻译单元用于对文本进行多语言翻译后发送到语音合成模块;
所述导航单元用于根据文本生成导航信息后发送到语音合成模块。
8.根据权利要求6或7所述的语音数据处理平台,其特征在于,所述语音数据处理平台还包括:
语音识别模块,所述语音识别模块分别连接所述局端通讯模块和数据处理模块,以将所述客户端发送来的语音进行识别,并将识别后的文本发送到所述数据处理模块。
CN 201220151755 2012-04-11 2012-04-11 语音数据处理平台及系统 Expired - Fee Related CN202587038U (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201220151755 CN202587038U (zh) 2012-04-11 2012-04-11 语音数据处理平台及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201220151755 CN202587038U (zh) 2012-04-11 2012-04-11 语音数据处理平台及系统

Publications (1)

Publication Number Publication Date
CN202587038U true CN202587038U (zh) 2012-12-05

Family

ID=47256394

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201220151755 Expired - Fee Related CN202587038U (zh) 2012-04-11 2012-04-11 语音数据处理平台及系统

Country Status (1)

Country Link
CN (1) CN202587038U (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106470199A (zh) * 2015-08-21 2017-03-01 石家庄市善理通益科技有限公司 语音数据的处理方法、装置及对讲系统
CN113160827A (zh) * 2021-04-07 2021-07-23 深圳鱼亮科技有限公司 一种基于多语言模型的语音转写系统及方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106470199A (zh) * 2015-08-21 2017-03-01 石家庄市善理通益科技有限公司 语音数据的处理方法、装置及对讲系统
CN113160827A (zh) * 2021-04-07 2021-07-23 深圳鱼亮科技有限公司 一种基于多语言模型的语音转写系统及方法

Similar Documents

Publication Publication Date Title
CN106409283B (zh) 基于音频的人机混合交互系统及方法
CN1912994B (zh) 语音的声调校正
KR101703214B1 (ko) 문자 데이터의 내용을 문자 데이터 송신자의 음성으로 출력하는 방법
CN103561217A (zh) 一种生成字幕的方法及终端
CN102006373A (zh) 基于语音命令控制的车载服务系统及方法
US20110270601A1 (en) Universal translator
CN106453043A (zh) 基于多语言转换的即时通信系统
CN103187079A (zh) 车载信息系统
AU2001247708A1 (en) Web-based speech recognition with scripting and semantic objects
CN105117391A (zh) 翻译语言
CN104078044A (zh) 移动终端及其录音搜索的方法和装置
CN104320533A (zh) 移动设备的通话方法及系统
US20100211389A1 (en) System of communication employing both voice and text
CN202216698U (zh) 导航声音与音乐声音切换系统
CN104202455A (zh) 智能语音拨号的方法及装置
CN106412032A (zh) 一种远程音频文字转换传输方法及系统
CN109346057A (zh) 一种智能儿童玩具的语音处理系统
CN106537497A (zh) 信息管理系统和信息管理方法
CN104468941A (zh) 信息显示方法和装置
CN103491406A (zh) 一种基于语音识别的android智能电视系统
CN101846525B (zh) 导航信息处理、获取方法及装置
CN101763756A (zh) 基于网络的交互式智能外语听写训练系统和方法
CN202587038U (zh) 语音数据处理平台及系统
CN106528715B (zh) 一种音频内容校核方法及装置
CN102056093A (zh) 将文字短信转换成语音短信的方法

Legal Events

Date Code Title Description
C14 Grant of patent or utility model
GR01 Patent grant
CP03 Change of name, title or address
CP03 Change of name, title or address

Address after: 200335 Shanghai city Changning District Admiralty Road No. 999 Building 1 floor 904-906 room 9

Patentee after: Shanghai car sound intelligent technology Co., Ltd.

Address before: 200233 Room 305, building 4, No. 396, Guilin road, Xuhui District, Shanghai

Patentee before: Shanghai Cheyin Network Technology Co., Ltd.

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20121205

Termination date: 20210411