CN101753695A

CN101753695A - 手机短信语音朗读方法

Info

Publication number: CN101753695A
Application number: CN200810218315A
Authority: CN
Inventors: 何斌
Original assignee: Konka Group Co Ltd
Current assignee: Konka Group Co Ltd
Priority date: 2008-12-10
Filing date: 2008-12-10
Publication date: 2010-06-23

Abstract

本发明涉及一种手机短信语音朗读方法，包括下列步骤：接收短信；在1至n级语音库中检索接收到的短信中在语音库中存有相应语音数据的字的语音数据，并将检索到语音数据的字、以及相应的语音数据记录到短信语音对照表；然后将短信语音对照表中，没有检索到语音数据的字的语音数据用预定的提示语音数据填入；最后将短信语音对照表中的语音按照短信文字的顺序串接起来后将其播放出来。实施本发明的手机短信语音朗读方法，具有以下有益效果：实施时所需要的存储空间小，便于在处理器速度较低的中低端手机上实施本方法，且成本低廉。

Description

手机短信语音朗读方法

技术领域

本发明涉及移动通信领域，更具体地说，涉及一种手机短信语音朗读方法。

背景技术

现在世界各国的人口中都有一定比例的盲人，这些盲人出门在外时，常常不知道自己的具体方位，周边的服务机构有哪些。但是，在中国某些地区，经过注册的盲人通过用手机拨通特服号码“96931”或者“38491689”就能在数秒钟之内获得自己所处的准确位置以及附近的交通、商店、医院、警察局等信息。坐在公交车上，如果不知道是否到站，盲人也可拨打这个号码，就可以提醒自己在哪里下车。这类系统还能自动提供在当前乘车点的公交线路及时间，方便盲人出行。

为了让盲人也能“看”短信，使盲人与聋哑人可以沟通，定位系统呼叫中心还开通了“05190”的短讯端口，盲人只要拨打这个特服号码，就可以收听他人发来的经过转换的语音信息。同时还可以拨打“1258”，由服务人员为其待发短讯到对方手机上。

但这些都需要通过服务中心的支持，才能做到这一点。每次服务，中心还会收取一定费用。如果盲人用户自己的手机就能支持自行“朗读”别人发来的短信，那么对于盲人用户来说，会带来很大的便利。

目前，美国微软公司有一种TTS发音引擎技术，可以流畅地将文本转换为英文或者中文朗读出来。TTS的全称为Text To Speech，即“从文本到语音”。它同时运用语言学和心理学的原理，在内置芯片的支持下，通过神经网络的设计，把文字智能化地转化为自然语音流。

TTS技术对文本文件进行实时转换，转换时间以秒计算。在其特有智能语音控制器作用下，文本输出的语音音律流畅，使得听者在听取信息时感觉自然，毫无机器语音输出的冷漠与生涩感。TTS语音合成技术即将覆盖国标一、二级汉字，具有英文接口，自动识别中、英文，支持中英文混读。所有声音采用真人普通话为标准发音，实现了120～150个汉字/秒的语音合成，朗读速度达到3～4个/秒，使用户可以听到清晰悦耳的音质和连贯流畅的语调。

应用了这种技术的软件，一般在个人电脑上使用。在高端手机上，也有利用了此技术的软件出现。该技术尽管语音朗读的效果很好，但是，其需要的软硬件配置要求较高，成本很昂贵，不利于在广大发展中国家推广使用。市场上对能朗读短信的适合中低端盲人用户使用的手机的需求很大。

发明内容

本发明要解决的技术问题在于，针对现有技术的上述对软硬件配置的要求高、成本高昂的缺陷，提供一种成本较低的手机短信语音朗读方法。

本发明解决其技术问题所采用的技术方案是：提供一种手机短信语音朗读方法，包括下列步骤：

S1：接收短信；

S2：设置语音库级别计数器n＝1；转步骤S3；

S3：在n级语音库检索S1中接收到的短信中在n级语音库中存有相应语音数据的字的语音数据，并将检索到的语音的字、以及相应的语音数据记录到短信语音对照表；转步骤S4；

S4：判断是否所有的字都已经检索到对应的语音数据；如果是，转步骤S6；否则，转步骤S5；

S5：判断是否各级语音库都已经检索完毕；如果是，转步骤S5.1；否则，转步骤S5.2；

S5.1：将短信语音对照表中，没有检索到语音数据的字的语音数据用预定的提示语音数据填入；转步骤S6；

S5.2：将语音库级别计数器n加1；转步骤S3；

S6：将短信语音对照表中的语音数据按照短信文字的顺序串接起来；转步骤S7；

S7：将步骤S6中串接好的短信语音播放出来；转S8；

S8：结束。

在本发明所述的手机短信语音朗读方法，所述语音库包括1级语音库、2级语音库、......N级语音库，所述1级语音库中存放的是常用字中使用频率高于预定值x₁的字及其对应的语音数据；所述2级语音库中存放的是常用字中使用频率高于预定值x₂的字及其对应的语音数据；......所述N级语音库存放的是常用字中使用频率低于预定值x_N-1的字及其对应的语音数据；所述N的值为大于2的正整数；所述x₁＞x₂＞x_N-1。

在本发明所述的手机短信语音朗读方法中，所述语音数据为AMR语音数据。

在本发明所述的手机短信语音朗读方法中，所述1级语音库至N级语音库中总共包括3000～5000个常用汉字的语音数据。

在本发明所述的手机短信语音朗读方法中，所述步骤S7中，播放短信语音是通过对短信语音数据进行语音合成处理后播放出的。

在本发明所述的手机短信语音朗读方法中，所述步骤S1中接收短信后，还包括发出语音提示“语音朗读短信还是显示到屏幕？”的步骤。

实施本发明的手机短信语音朗读方法，具有以下有益效果：本方法通过简化设计，剔除了不常用的汉字，对于不认识的汉字采用预定的语音来标记，大大减少了实施时所需要的存储空间；并且由于其检索范围大为减小、检索速度快，十分便于在处理器速度较低的中低端手机上实施本方法；本方法实施成本低廉，对广大中低端手机用户尤其是盲人用户具有极大的吸引力。

附图说明

下面将结合附图及实施例对本发明作进一步说明，附图中：

图1是本发明手机短信语音朗读方法的流程图。

具体实施方式

图1是本发明手机短信语音朗读方法的流程图。

首先是步骤S1：接收短信，发出语音提示“语音朗读短信还是显示到屏幕？”

然后用户通过手机上的某个按键对上述语音提示做出选择，如果用户选择“显示到屏幕”所对应的按键，则手机将按照正常的短信显示流程将短信显示在手机的屏幕上，然后到步骤S8结束；如果用户选择“语音朗读短信”所对应的按键，则转步骤S2，进入本发明的方法的各个步骤。

步骤S2：设置语音库级别计数器n＝1；然后转步骤S3。

S3：在n级语音库检索S1中接收到的短信中设有相应语音的字的语音数据，并将检索到的语音的字、以及相应的语音数据记录到短信语音对照表；转步骤S4；

S5：判断是否所有的语音库都已经检索完毕；如果是，转步骤S5.1；否则，转步骤S5.2；

S5.1：将短信语音对照表中，没有检索到语音的字的语音数据用预定的提示语音数据填入；转步骤S6；

S5.2：将语音库级别计数器n加1；转步骤S3；

S7：将步骤S6中串接好的短信语音播放出来；转S8；

S8：结束。

上述步骤中，语音库包括1级语音库、2级语音库、......N级语音库，N的值为大于2的正整数。

为了减少检索的时间，加快语音合成速度，可以将常用字进行分级的语音检索。将语音库分为多级(按照常用程度从高到低分为1、2、3、4......N级)，每个级别的语音库中的数据都是互相不重复的，也就是说，在某个级别的语音库中出现了某个字的语音数据后，其余级别的语音库中则不会出现此字的语音数据。1级语音库至N级语音库中共包括3000～5000个常用汉字的语音数据。1级语音库中存放的是常用字中使用频率高于预定值x₁的字及其对应的语音数据；2级语音库中存放的是常用字中使用频率高于预定值x₂的字及其对应的语音数据；......N级语音库存放的是常用字中使用频率低于预定值x_N-1的字及其对应的语音数据；N的值为大于2的正整数；上述x₁＞x₂＞x_N-1。也就是说，1级语音库中存放的是常用字中的最常用的字的语音数据。1级语音库中存放的字的使用频率比2级语音库中存放的使用频率高，2级语音库中存放的字的使用频率比3级语音库中存放的使用频率高......依次类推。

对语音库的检索按照如下顺序：先从1级语音库开始检索，如果检索不到则转到下一级语音库进行检索。这种分级检索顺序有利于平均检索时间较少，检索速度比较快。检索到语音的字，以及相应的语音数据会记录入短信语音对照表。在短信语音对照表中，没有检索到语音数据的字用预定的提示语音数据替代(该预定的提示语音数据以特殊语音数据表示该字没法检索到相应语音)

下面的表1是一个实施例的1级短信语音数据对照表：

表1：

字	语音
字	语音	我	“我”对应的语音数据
你	“你”对应的语音数据	我	“我”对应的语音数据
你	“你”对应的语音数据	A	“你”对应的语音数据
，	“，”对应的语音数据	A	“你”对应的语音数据
，	“，”对应的语音数据	1	“1”对应的语音数据
他	“他”对应的语音数据	1	“1”对应的语音数据
他	“他”对应的语音数据	……

注：英文字母、标点符号、阿拉伯数字都存放在1级短信语音对照表，标点以正常的汉语语音来阅读，例如，语音将逗号“，”读为“逗号”。

本方法中的语音库中，剔除了不常用的汉字，对于英文则按照单个字母朗读，对于不认识的汉字则采用预定的提示语音来标记(该预定的提示语音采用一定的特殊语音表示该字没法检索到相应语音，盲人用户听到该语音即可知晓该字没有检索到相应语音。在这种情况下，用户可以利用上下文大致猜测到其含义)，通过将常用字语音数据存储在数据库文件中(该文件按照5000个常用字来计算，每个字录制成AMR(Adaptibve Multi-Rate，自适应多码率)语音后大约占用1K存储空间，则数据库文件占用5～6M的存储空间。因为目前T卡的成本已经很低，而且其广泛地应用在了中低端手机上，所以将数据库文件存储在T卡上有利于成本的降低)。然后，根据接收到的短信，在常用字语音数据库中检索到短信的每个字的相应的语音数据，然后通过语音合成，即可将短信的内容播放给盲人用户。

本发明的手机短信语音朗读方法采用了简化的合成语音文件的方法，虽然不能做到象微软的TTS智能语音技术那样流畅的效果，而且不能做到实时的合成并播放(因为检索出文字时对应的语音会需要一定的检索时间，盲人用户会需要一定的时间来等待短信被合成为语音)，但是在成本上会大大优于微软的TTS技术，中低端手机的生产厂商无需购买国外昂贵的专利，因此采用本发明的方法的成本具有很大的优势，适合广大的中低端的盲人用户群，因此必然具有很广阔的市场前景。

以上实施例仅表达了本发明的优选实施方式，其描述较为具体和详细，但并不能因此而理解为对本发明专利范围的限制；应当指出的是，对于本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围；因此，凡跟本发明权利要求范围所做的等同变换与修饰，均应属于本发明权利要求的涵盖范围。

Claims

1.一种手机短信语音朗读方法，其特征在于，包括下列步骤：

S1：接收短信；

S2：设置语音库级别计数器n＝1；转步骤S3；

S3：在n级语音库检索S1中接收到的短信中在n级语音库中存有相应语音数据的字的语音数据，并将检索到语音数据的字、以及相应的语音数据记录到短信语音对照表；转步骤S4；

S5.1：将短信语音对照表中，没有在语音库中检索到语音数据的字的语音数据用预定的提示语音数据填入；转步骤S6；

S5.2：将语音库级别计数器n加1；转步骤S3；

S6：将短信语音对照表中的语音按照短信文字的顺序串接起来；转步骤S7；

S7：将步骤S6中串接好的短信语音播放出来；转S8；

S8：结束。

2.根据权利要求1所述的手机短信语音朗读方法，其特征在于，所述语音库包括1级语音库、2级语音库、......N级语音库，所述1级语音库中存放的是常用字中使用频率高于预定值x₁的字及其对应的语音数据；所述2级语音库中存放的是常用字中使用频率高于预定值x₂的字及其对应的语音数据；......所述N级语音库存放的是常用字中使用频率低于预定值x_N-1的字及其对应的语音数据；所述N的值为大于2的正整数；所述x₁＞x₂＞x_N-1。

3.根据权利要求1所述的手机短信语音朗读方法，其特征在于，所述语音数据为AMR语音数据。

4.根据权利要求2所述的手机短信语音朗读方法，其特征在于，所述1级语音库至N级语音库中总共包括3000～5000个常用汉字的语音数据。

5.根据权利要求2所述的手机短信语音朗读方法，其特征在于，所述1级语音库中包括英文字母、标点符号、阿拉伯数字所对应的语音数据。

6.根据权利要求1所述的手机短信语音朗读方法，其特征在于，所述步骤S7中，播放短信语音是通过对短信语音数据进行语音合成处理后播放出的。

7.根据权利要求1所述的手机短信语音朗读方法，其特征在于，所述步骤S1中接收短信后，还包括发出语音提示“语音朗读短信还是显示到屏幕？”的步骤。