CN201336138Y - 一种文本朗读设备 - Google Patents
一种文本朗读设备 Download PDFInfo
- Publication number
- CN201336138Y CN201336138Y CNU2008201245097U CN200820124509U CN201336138Y CN 201336138 Y CN201336138 Y CN 201336138Y CN U2008201245097 U CNU2008201245097 U CN U2008201245097U CN 200820124509 U CN200820124509 U CN 200820124509U CN 201336138 Y CN201336138 Y CN 201336138Y
- Authority
- CN
- China
- Prior art keywords
- text
- identification
- voice
- module
- system platform
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Telephonic Communication Services (AREA)
Abstract
本实用新型公开了一种文本朗读设备,包括:系统平台、内部文件存储模块、标识解析模块、一个以上的语音引擎和声音输出模块;其中:系统平台与其它模块连接,控制其它模块的运行;标识解析模块接收系统平台发送的文本文件,提取该文本文件中的角色语音标识,查询自身保存的该角色语音标识对应的语音引擎标识,向语音引擎标识所对应的语音引擎发送语音合成命令;语音引擎收到语音合成命令后,采用语音合成命令所要求的角色将从系统平台接收的文本文件合成为语音数据,将语音数据发送至语音输出模块;语音输出模块播放语音数据。本实用新型提出的文本朗读设备能够实现多个语音引擎的协调工作,为用户提供高品质的语音服务。
Description
技术领域
本实用新型涉及语音文本朗读电子产品领域,尤其涉及一种文本朗读设备。
背景技术
现有的文本朗读设备的工作模式是一个语音引擎包含多个发音角色,如图1所示,图1为现有技术中文本朗读设备的工作模式实例。其中,在一个语音引擎中包含6种角色语言,即:中英文混合男声、中文男声、英文男声、中英文混合女声、中文女声和英文女声。但是,一个语音引擎不可能包含所有的语言,对于多语种混合编排的文本,仅有一个语音引擎的文本朗读设备难以合成出高品质的语音。
实用新型内容
本实用新型提供一种文本朗读设备,能够协调自身包含的多个语音引擎,为用户提供高品质的语音服务。
本实用新型的技术方案是这样实现的:
一种文本朗读设备,包括:系统平台、内部文件存储模块、标识解析模块、一个以上的语音引擎和声音输出模块;其中:
所述系统平台,分别与内部文件存储模块、标识解析模块、语音引擎和声音输出模块连接,控制所述各模块的运行;从内部文件存储模块提取文本文件,并将所述文本文件发送至标识解析模块和语音引擎;
所述内部文件存储模块保存文本文件;
所述标识解析模块,分别与系统平台和语音引擎连接,接收系统平台发送的文本文件,提取所述文本文件中的角色语音标识,查询自身保存的所述角色语音标识对应的语音引擎标识,向所述语音引擎标识所对应的语音引擎发送语音合成命令;
所述语音引擎,分别与系统平台、标识解析模块和声音输出模块连接,接收标识解析模块发送的语音合成命令,在系统平台的控制下,采用语音合成命令所要求的角色将从系统平台接收的文本文件合成为语音数据,将所述语音数据发送至声音输出模块;
所述声音输出模块,分别与系统平台和语音引擎连接,接收所述语音引擎发送的语音数据,在系统平台的控制下,播放所述语音数据。
可见,在本实用新型中,文本朗读设备包含多个语音引擎,对文本文件中不同语种的文本内容用不同的角色语音标识进行统一和规范的标识,由文本朗读设备中的标识解析模块提取出角色语音标识并选择相应的语音引擎和角色,由该语音引擎将文本文件合成为语音数据,声音输出模块播放该语音数据,从而实现了多个语音引擎的协调工作,为用户提供高品质的语音服务。
附图说明
图1为现有技术中文本朗读设备的工作模式实例;
图2为本实用新型实施例文本朗读设备的结构示意图;
图3为本实用新型实施例文本朗读设备的语音引擎示意图。
具体实施方式
为使本实用新型的目的、技术方案和优点更加清楚明白,下面结合实施例和附图,对本实用新型进一步详细说明。
参见图2,图2为本实用新型实施例文本朗读设备的结构示意图,包括:系统平台201、内部文件存储模块202、标识解析模块203、一个以上的语音引擎204和声音输出模块205;其中:
所述系统平台201,分别与内部文件存储模块202、标识解析模块203、语音引擎204和声音输出模块205连接,控制所述各模块的运行;从内部文件存储模块202提取文本文件,并将所述文本文件发送至标识解析模块203和语音引擎204;
所述内部文件存储模块202保存文本文件;
所述标识解析模块203,分别与系统平台201和语音引擎连接204,接收系统平台201发送的文本文件,提取所述文本文件中的角色语音标识,查询自身保存的所述角色语音标识对应的语音引擎标识,向所述语音引擎标识所对应的语音引擎204发送语音合成命令;
所述语音引擎204,分别与系统平台201、标识解析模块203和声音输出模块205连接,接收标识解析模块203发送的语音合成命令,在系统平台201的控制下,采用语音合成命令所要求的角色将从系统平台201接收的文本文件合成为语音数据,将所述语音数据发送至声音输出模块205;
所述声音输出模块205,分别与系统平台201和语音引擎204连接,接收所述语音引擎204发送的语音数据,在系统平台201的控制下,播放所述语音数据。
本实用新型提出的文本朗读设备可以包含一个以上的语音引擎,以下以包含2个语音引擎为例详细介绍。
参见图3,图3为本实用新型实施例文本朗读设备的语音引擎示意图,该文本朗读设备包含语音引擎一和语音引擎二,其中,语音引擎一能够提供6种角色语音,即中英文混合男声、中文男声、英文男声、中英文混合女声、中文女声和英文女声;语音引擎二能够提供4种角色语音,即英文男声、英文女声、西班牙文男声和西班牙文女声。
文本朗读设备中的标识解析模块保存角色语音标识对应的默认语音引擎标识,其中,角色语音标识包括语言标识和男女声标识,如表1所示。
角色语音标识 | 默认语音引擎标识 |
中文男声(cn-m) | 引擎一;角色三 |
中文女声(cn-w) | 引擎一;角色四 |
英文男声(en-m) | 引擎二;角色一 |
英文女声(en-w) | 引擎一;角色六 |
西班牙文男声(esp-m) | 引擎二;角色三 |
西班牙文女声(esp-w) | 引擎二;角色四 |
表1
上述表1可以在文本朗读设备出厂时预先保存,也可以由用户根据需要进行变更。
当上述文本文件中的角色语音标识包括语言标识和男女声标识时,标识解析模块查询所述角色语音标识所对应的默认语音引擎标识。
文本朗读设备中的标识解析模块还可以保存角色语音标识对应的特定语音引擎标识;如表2所示。其中,角色语音标识包括语言标识、男女声标识和特征值,特征值统一按照“两位音色特征编码+两位年龄特征编码”构成。
角色语音标识(角色-特征值) | 特定语音引擎标识 |
中英文混合男声cn-m-XXXX | 引擎一;角色一 |
中文男声cn-m-XXYY | 引擎一;角色二 |
英文男声en-m-XXLL | 引擎一;角色三 |
中英文混合女声cn-w-XXXX | 引擎一;角色四 |
中文女声cn-w-XXYY | 引擎一;角色五 |
英文女声en-w-XXLL | 引擎一;角色六 |
英文男声en-m-XXUU | 引擎二;角色一 |
英文女声en-w-XXUU | 引擎二;角色二 |
西班牙文男声esp-m-XXUU | 引擎二;角色三 |
西班牙文女声esp-w-XXSS | 引擎二;角色四 |
表2
在表2中,保存了所有语音引擎能够提供的角色语音。
当上述文本文件中的角色语音标识包括语言标识、男女声标识和特征值时,标识解析模块查询所述角色语音标识所对应的特定语音引擎标识。
文本内容提供商提供的多语种混合编排的文本文件内容中,对于要求不同发音人的内容进行标识。如在中英文混合编排的文本中:
玛丽说:<vsayrole=en-w>“This is an apple.”</vsayrole>小李说:“这句话的意思是’这是一个苹果’”
在上述文本中,<vsayrole=en-w>......</vsayrole>即为角色语音标识,该角色语音标识包含语言标识和男女声标识,没有特征值。标识提取及查询模块提取出该角色语音标识,查找表1,选择对应的默认语音引擎标识(引擎一;角色六);向对应的语音引擎,即语音引擎一发送语音合成命令。语音引擎一采用角色六将该标识所对应的文本内容合成为语音数据。
如果角色语音标识不仅包含语言标识和男女声标识,还包含特征值,则首先在表2中查询,如果有对应的特定语音引擎标识,则使用指定的语音引擎和角色合成语音文件;如果没有,则选择特征值中前两部分相对应的默认语音引擎标识,或者根据特征值前两部分相对应的默认值进行变换,实现所要求的语音合成特征。
此外,对于没有使用角色语音标识,即“<vsayrole=en-w>......</vsayrole>”标记的文本内容,可以使用预先设定的主角色进行语音合成。
如图2所示,上述文本朗读设备还可以包括:扩展存储卡206和解密模块207;所述扩展存储卡206与系统平台201连接,所述解密模块207分别与扩展存储卡206和系统平台201连接;
所述扩展存储卡206保存预先使用扩展存储卡的唯一标识号进行加密的文本文件;
所述解密模块207提取扩展存储卡的唯一标识号,利用所述扩展存储卡的唯一标识号作为解密密钥,对所述经预先加密的文本文件进行解密,将解密后的文本文件提供给系统平台201;
所述系统平台201将解密后的文本文件提供给标识解析模块203和语音引擎204。
其中,扩展存储卡206具体可以为MicroSD卡,内容出版商预先采用MicroSD卡的唯一标识号对文本文件进行加密,并写入到MicroSD卡中,形成每个MicroSD卡都不同的加密文件;文本朗读设备在读取文件时,需要首先提取MicroSD卡的唯一标识号,将该唯一标识号作为解密密钥对文件进行解密,这样能够加强电子出版物的版权保护。
上述文本朗读设备中,内部文件存储模块或扩展存储卡能够为自身保存的文本文件添加强制排序符,如“XXXX-文件名称”,保存含有强制排序符的文本文件,按照强制排序符对文本文件进行强制排序。在朗读过程中,语音引擎能够识别出强制排序符“XXXX”并予以剔出,将剔除强制排序符后的文本文件合成为语音数据,用户只能听到正常的文件名称。
上述文本朗读设备能够在无线信息阅读服务系统订阅所需的文本内容服务,并与服务系统之间通过流文本的方式实现内容的实时语音合成并输出。
文本朗读设备可以进一步包括:全球统一身份识别卡208和无线通信模块209;其中,所述全球统一身份识别卡208和系统平台201连接,所述无线通信模块209分别与全球统一身份识别卡208和系统平台201连接;
所述全球统一身份识别卡208保存文本朗读设备的全球统一身份识别号码;
所述无线通信模块209提取全球统一身份识别卡208所保存的全球统一身份识别号码,利用该全球统一身份识别号码从网络中的无线信息阅读服务系统订阅并接收文本文件数据流,将接收的文本文件数据流通过系统平台201提供给标识解析模块203和语音引擎204。
上述文本朗读设备还包括计算机联机接口210,与所述系统平台201连接,用于与计算机建立数据连接。
上述文本朗读设备可以集成在移动终端中。
综上,上述文本朗读设备包含一个以上的多语种语音引擎,适合多语种混合编排文本的朗读,能够为用户提供高品质的语音服务;能够读取加密的文本内容并解密,以语音合成的方式朗读出来;具备强制排序和自动识别功能,将文本内容按照强制排序符的顺序朗读出来,同时不输出顺序符;并且,上述文本朗读设备具备全球统一身份识别卡,以此通过无线通信向服务系统订阅所需的文本文件,通过流文本的方式实现内容的实时语音合成并输出。
以上所述的具体实施例,对本实用新型的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本实用新型的较佳实施例而已,并非用于限定本实用新型的保护范围,凡在本实用新型的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本实用新型的保护范围之内。
Claims (8)
1、一种文本朗读设备,其特征在于,所述文本朗读设备包括:系统平台、内部文件存储模块、标识解析模块、一个以上的语音引擎和声音输出模块;其中:
所述系统平台,分别与内部文件存储模块、标识解析模块、语音引擎和声音输出模块连接,控制所述各模块的运行;从内部文件存储模块提取文本文件,并将所述文本文件发送至标识解析模块和语音引擎;
所述内部文件存储模块保存文本文件;
所述标识解析模块,分别与系统平台和语音引擎连接,接收系统平台发送的文本文件,提取所述文本文件中的角色语音标识,查询自身保存的所述角色语音标识对应的语音引擎标识,向所述语音引擎标识所对应的语音引擎发送语音合成命令;
所述语音引擎,分别与系统平台、标识解析模块和声音输出模块连接,接收标识解析模块发送的语音合成命令,在系统平台的控制下,采用语音合成命令所要求的角色将从系统平台接收的文本文件合成为语音数据,将所述语音数据发送至声音输出模块;
所述声音输出模块,分别与系统平台和语音引擎连接,接收所述语音引擎发送的语音数据,在系统平台的控制下,播放所述语音数据。
2、根据权利要求1所述的文本朗读设备,其特征在于,所述标识解析模块保存角色语音标识对应的默认语音引擎标识,所述角色语音标识包括语言标识和男女声标识;
当所述文本文件中的角色语音标识包括语言标识和男女声标识时,标识解析模块查询所述角色语音标识所对应的默认语音引擎标识。
3、根据权利要求1所述的文本朗读设备,其特征在于,所述标识解析模块保存角色语音标识对应的特定语音引擎标识;所述角色语音标识包括语言标识、男女声标识和特征值;
当所述文本文件中的角色语音标识包括语言标识、男女声标识和特征值时,标识解析模块查询所述角色语音标识所对应的特定语音引擎标识。
4、根据权利要求1所述的文本朗读设备,其特征在于,所述文本朗读设备进一步包括:扩展存储卡和解密模块;所述扩展存储卡与系统平台连接,所述解密模块分别与扩展存储卡和系统平台连接;
所述扩展存储卡保存预先使用扩展存储卡的唯一标识号进行加密的文本文件;
所述解密模块提取扩展存储卡的唯一标识号,利用所述扩展存储卡的唯一标识号作为解密密钥,对所述经预先加密的文本文件进行解密,将解密后的文本文件提供给系统平台;
所述系统平台将解密后的文本文件提供给标识解析模块和语音引擎。
5、根据权利要求1或4所述的文本朗读设备,其特征在于,所述内部文件存储模块或扩展存储卡保存含有强制排序符的文本文件,按照所述强制排序符将文本文件进行强制排序;
所述语音引擎将剔除强制排序符后的文本文件合成为语音数据。
6、根据权利要求1所述的文本朗读设备,其特征在于,所述文本朗读设备进一步包括:全球统一身份识别卡和无线通信模块;其中,所述全球统一身份识别卡和系统平台连接,所述无线通信模块分别与全球统一身份识别卡和系统平台连接;
所述全球统一身份识别卡保存文本朗读设备的全球统一身份识别号码;
所述无线通信模块提取全球统一身份识别卡所保存的全球统一身份识别号码,利用该全球统一身份识别号码从网络中的无线信息阅读服务系统订阅并接收文本文件数据流,将接收的文本文件数据流通过系统平台提供给标识解析模块和语音引擎。
7、根据权利要求1所述的文本朗读设备,其特征在于,所述文本朗读设备还包括计算机联机接口,与所述系统平台连接,用于与计算机建立数据连接。
8、根据权利要求1所述的文本朗读设备,其特征在于,所述文本朗读设备集成在移动终端中。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNU2008201245097U CN201336138Y (zh) | 2008-12-19 | 2008-12-19 | 一种文本朗读设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNU2008201245097U CN201336138Y (zh) | 2008-12-19 | 2008-12-19 | 一种文本朗读设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN201336138Y true CN201336138Y (zh) | 2009-10-28 |
Family
ID=41287796
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNU2008201245097U Expired - Fee Related CN201336138Y (zh) | 2008-12-19 | 2008-12-19 | 一种文本朗读设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN201336138Y (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107277646A (zh) * | 2017-08-08 | 2017-10-20 | 四川长虹电器股份有限公司 | 一种音视频资源的字幕配置系统 |
CN108091321A (zh) * | 2017-11-06 | 2018-05-29 | 芋头科技(杭州)有限公司 | 一种语音合成方法 |
CN108231059A (zh) * | 2017-11-27 | 2018-06-29 | 北京搜狗科技发展有限公司 | 处理方法和装置、用于处理的装置 |
CN108305611A (zh) * | 2017-06-27 | 2018-07-20 | 腾讯科技(深圳)有限公司 | 文本转语音的方法、装置、存储介质和计算机设备 |
CN109036372A (zh) * | 2018-08-24 | 2018-12-18 | 科大讯飞股份有限公司 | 一种语音播报方法、装置及系统 |
CN109979430A (zh) * | 2017-12-28 | 2019-07-05 | 深圳市优必选科技有限公司 | 一种机器人讲故事的方法、装置、机器人及存储介质 |
CN110060656A (zh) * | 2019-05-05 | 2019-07-26 | 标贝(深圳)科技有限公司 | 模型管理和语音合成方法、装置和系统及存储介质 |
CN110097878A (zh) * | 2018-01-30 | 2019-08-06 | 阿拉的(深圳)人工智能有限公司 | 多角色语音提示方法、云端设备、提示系统及存储介质 |
CN110211564A (zh) * | 2019-05-29 | 2019-09-06 | 泰康保险集团股份有限公司 | 语音合成方法及装置、电子设备和计算机可读介质 |
CN110634336A (zh) * | 2019-08-22 | 2019-12-31 | 北京达佳互联信息技术有限公司 | 有声电子书生成方法及装置 |
CN112133278A (zh) * | 2020-11-20 | 2020-12-25 | 成都启英泰伦科技有限公司 | 一种个性化语音合成模型网络训练及个性化语音合成方法 |
-
2008
- 2008-12-19 CN CNU2008201245097U patent/CN201336138Y/zh not_active Expired - Fee Related
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108305611A (zh) * | 2017-06-27 | 2018-07-20 | 腾讯科技(深圳)有限公司 | 文本转语音的方法、装置、存储介质和计算机设备 |
CN107277646A (zh) * | 2017-08-08 | 2017-10-20 | 四川长虹电器股份有限公司 | 一种音视频资源的字幕配置系统 |
CN108091321A (zh) * | 2017-11-06 | 2018-05-29 | 芋头科技(杭州)有限公司 | 一种语音合成方法 |
CN108091321B (zh) * | 2017-11-06 | 2021-07-16 | 芋头科技(杭州)有限公司 | 一种语音合成方法 |
CN108231059A (zh) * | 2017-11-27 | 2018-06-29 | 北京搜狗科技发展有限公司 | 处理方法和装置、用于处理的装置 |
CN108231059B (zh) * | 2017-11-27 | 2021-06-22 | 北京搜狗科技发展有限公司 | 处理方法和装置、用于处理的装置 |
CN109979430B (zh) * | 2017-12-28 | 2021-04-20 | 深圳市优必选科技有限公司 | 一种机器人讲故事的方法、装置、机器人及存储介质 |
CN109979430A (zh) * | 2017-12-28 | 2019-07-05 | 深圳市优必选科技有限公司 | 一种机器人讲故事的方法、装置、机器人及存储介质 |
CN110097878A (zh) * | 2018-01-30 | 2019-08-06 | 阿拉的(深圳)人工智能有限公司 | 多角色语音提示方法、云端设备、提示系统及存储介质 |
CN109036372A (zh) * | 2018-08-24 | 2018-12-18 | 科大讯飞股份有限公司 | 一种语音播报方法、装置及系统 |
CN110060656A (zh) * | 2019-05-05 | 2019-07-26 | 标贝(深圳)科技有限公司 | 模型管理和语音合成方法、装置和系统及存储介质 |
CN110060656B (zh) * | 2019-05-05 | 2021-12-10 | 标贝(北京)科技有限公司 | 模型管理和语音合成方法、装置和系统及存储介质 |
CN110211564A (zh) * | 2019-05-29 | 2019-09-06 | 泰康保险集团股份有限公司 | 语音合成方法及装置、电子设备和计算机可读介质 |
CN110634336A (zh) * | 2019-08-22 | 2019-12-31 | 北京达佳互联信息技术有限公司 | 有声电子书生成方法及装置 |
CN112133278A (zh) * | 2020-11-20 | 2020-12-25 | 成都启英泰伦科技有限公司 | 一种个性化语音合成模型网络训练及个性化语音合成方法 |
CN112133278B (zh) * | 2020-11-20 | 2021-02-05 | 成都启英泰伦科技有限公司 | 一种个性化语音合成模型网络训练及个性化语音合成方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN201336138Y (zh) | 一种文本朗读设备 | |
CN107993646A (zh) | 一种实现实时语音互译的方法 | |
CN102982800A (zh) | 具有影音文件处理功能的电子装置及影音文件处理方法 | |
CN102811284A (zh) | 一种语音输入自动翻译为目标语言的方法 | |
CN101867632A (zh) | 一种手机语音即时翻译系统和翻译方法 | |
CN108536655A (zh) | 一种基于手持智能终端的场景化朗读音频制作方法及系统 | |
CN106844677A (zh) | 一种信息分享的方法及装置 | |
CN104468959A (zh) | 移动终端通话过程中显示图像的方法、装置及移动终端 | |
CN101187855A (zh) | 进行语音阅读的手机 | |
US20120245935A1 (en) | Electronic device and server for processing voice message | |
CN104202455A (zh) | 智能语音拨号的方法及装置 | |
KR100727066B1 (ko) | 동적 템플릿을 이용한 무선 웹 페이지 제공 방법 및 장치 | |
CN103838875A (zh) | 一种基于二维码的信息采集系统及其方法 | |
CN101309449A (zh) | 一种基于手机彩信/短信的远程翻译服务方法 | |
CN107657469A (zh) | 一种广告信息的推送方法、装置及机顶盒 | |
CN112035630A (zh) | 结合rpa和ai的对话交互方法、装置、设备及存储介质 | |
US20120215521A1 (en) | Software Application Method to Translate an Incoming Message, an Outgoing Message, or an User Input Text | |
CN106844735A (zh) | 一种自动建立个人专属语料库的方法 | |
CN104052656A (zh) | 用于改进电子邮件的设备和方法 | |
CN205910881U (zh) | 一种语音控制有声阅读器 | |
CN107293284A (zh) | 一种基于智能终端的语音合成方法及语音合成系统 | |
CN106713818A (zh) | 视频通话中语音处理系统及其方法 | |
CN206649899U (zh) | 一种实现实时语音互译的通信装置 | |
CN207302623U (zh) | 一种远程语音处理系统 | |
CN101120598B (zh) | 感情图标消息转换系统及其方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20091028 Termination date: 20121219 |