CN1726531A

CN1726531A - 用于生成语音的设备,可连接到或含有该设备的装置以及相关的计算机程序产品

Info

Publication number: CN1726531A
Application number: CNA2003801063436A
Authority: CN
Inventors: N·克里莫夫斯卡; G·克林哈尔特; A·托马松
Original assignee: Sony Ericsson Mobile Communications AB
Current assignee: Sony Mobile Communications AB
Priority date: 2002-12-16
Filing date: 2003-11-14
Publication date: 2006-01-25
Anticipated expiration: 2023-11-14
Also published as: CN100527223C

Abstract

本发明涉及一种用于生成和显示器(2)，尤其是诸如移动电话(1)的便携式设备上显示的信息相关联的语音的设备。一个转换电路把显示的数据转换为帮助用户操作该设备的听得到的语音。本发明也涉及安排来与这样的设备配合或含有这样的设备的装置和相关的计算机程序产品。

Description

用于生成语音的设备，可连接到或含有该设备的装置以及相关的计算机程序产品

技术领域

本发明涉及一种用于生成与显示器，尤其是诸如移动电话等的便携式设备上的显示器上示出的信息相关联的语音的设备。一个转换电路把示出的数据转换为帮助用户操作该装置的可收听的语音。本发明也涉及被安排用于与这样的设备配合或含有这样的设备的装置和相关的计算机程序产品。

背景技术

在诸如移动电话等的便携式设备中，显示器用于显示控制操作和设置设备的菜单，或其他关于消息或游戏的信息。显示器通常很小，这对于用户可能是个问题，尤其是如果他视力受损这更会是个问题。而且由于其他原因，也存在对显示可收听版本的需要。

本发明通过把显示的信息转换为可收听语音解决了该问题。

发明内容

在第一方面中，本发明提供一种用于生成语音的设备，其中一个微控制器可连接到一个装置，用于接收将转换为语音的数据，并且把该数据发送到转换电路；和一个可连接到扬声器系统的转换电路，用于把所述数据转换为语音信号。

最好，数据用ASCII字符提供。

适合的是，转换电路支持多种可选择的语言并且转换电路能够通过连接的装置下载语言。

适合的是，转换电路支持多种可选择的声音并且转换电路能够通过连接的装置下载声音。

最好，语音信号的速度可调。

最好，微控制器可连接到包含诸如多种语言，缩略语表和字典的语言信息的存储器。

最好，微控制器可连接到包含声音设置的存储器。

适合的是，微控制器可借助于一个系统连接器连接到该装置，系统连接器具有用于音频信号、串行频道、电源线和模拟和数字接地线的接口。

该设备可以用一个功能盖实现，包括一个覆盖装置的前部的壳和与装置的处理器配合的微处理器。

可连接装置可以是一个便携式电话，一个寻呼机，一个发信机或一个电子管理器。

在第二方面，本发明提供一种具有用于显示各种可读数据的显示器的装置，其中一个控制单元被安排用于提取可读数据，以发送到如上所述用于生成语音的设备中。

可读数据可以包括来自菜单的文字、文字消息、帮助信息、日历或使用装置采取行动的确认。

适合的是，控制单元被安排用于每次从显示器提取可读数据的一部分，比如一行或一个词，并且以固定或可控的速率自动把它发送到语音生成设备，和/或控制单元被安排用于每次从显示器提取一行并根据显示器中的滚动把它发送到语音生成设备。

适合的是，控制单元也进行安排来每次从显示器提取一部分可读数据，比如一个字符、一行或一个词并根据向装置输入的字符把它发送到语音生成设备。

这样，控制单元可以被安排用于在被诸如字母、符号、空格或标点符号等确定字符的输入触发时发送可读数据。

最好，控制单元被安排用于从选择的文件中提取可读数据并以固定或可控速率把数据自动发送到语音生成设备。

在第三方面，本发明提供一种具有用于显示多种可读数据的显示器，包括控制单元和用于生成语音的设备，用于生成语音的设备包括一个转换电路，用于把数据转换为语音信号并可连接到扬声器系统，其中控制单元被安排用于提取可读数据，以发送到语音生成设备。

扬声器系统可以与该装置集成。

适合的是，数据用ASCII字符提供。

适合的是，转换电路支持多种可选择的语言并且能够下载语言。

适合的是，转换电路支持多种可选择的声音并且能够下载声音。

最好，语音信号的速度可调。

适合的是，该装置可连接到包含诸如多种语言，缩略语表和字典的语言信息的存储器。

适合的是，该装置可连接到包含声音设置的存储器。

最好，可读数据包括来自菜单的文字、文字消息、帮助信息、日历或利用装置采取行动的确认。

适合的是，控制单元被安排用于每次从显示器提取可读数据的一部分，比如一个字符、一行或一个词并根据向装置输入的字符把它发送到语音生成设备。

这样，控制单元可被安排用于在被诸如字母、符号、空格或标点符号的确定字符的输入触发时发送可读数据。

该装置可以是一个便携式电话，一个寻呼机，一个发信机或一个电子管理器。

在第四方面，本发明提供一种可下载到具有用于显示多种可读数据的显示器的装置的内部存储器中的计算机程序产品，其中计算机程序产品包括实现以上所述装置的功能的软件代码部分。

计算机程序产品能可以在一个计算机可读介质上实现。

附图说明

下面将参照附图详细说明本发明的实施例，其中：

图1是本发明的主框架的框图，

图2是系统连接器的前视图，

图3是一个数据流向图，和

图4是一个使用本发明的移动电话的例子。

具体实施方式

本发明将就包括文字到语音转换的移动电话进行说明。本发明也可以应用到很多其他设备，例如寻呼机、发信机、电子管理器和类似的便携设备。

文字到语音转换是很多领域和应用中感兴趣的特征。更感兴趣的一点是在移动电话中的使用。现在移动电话几乎每个人都使用，并且像这样的特征对于视力受损者和使用电话时需要关注其他事情的用户(例如使用不用手操作设备的汽车司机)而言是一个重要的辅助。文字到语音转换硬件上用文字到语音电路完成。一个高亮的菜单条、一个SMS或其他可读数据被发送到微控制器。数据可以作为ASCII字符接收，并且这些由微控制器转发到文字到语音电路。文字到语音电路把字符转换为音频信号并把它们发送到扬声器系统。

本发明通过如出消息和菜单来帮助用户定位自身同时浏览菜单系统，使得电话更加用户友好。

图1示出了本发明的一个实施例，其中语音生成设备被实现为一个附件。附件通过其系统连接器附属到移动电话1。该附件可以用一个所谓的有源或功能盖实现，那是覆盖例如电话的前部并且也连接到电话的系统连接器的盖。功能盖包含一个微处理器保持附加功能并与电话的处理器配合。因而，该配件的实际外形取决于移动电话并且在这里没有示出。

语音生成设备5在虚线方框内示出，并包括微控制器6，接收来自移动电话的、要被转换的数据并把数据传递到文字到语音(TTS)电路7。TTS电路7把文字转换为音频信号并通过一个(可选的)放大器8把信号发送到扬声器9。

在另一个实施例中，语音生成设备加入到移动电话并可以使用内部硬件、软件和扬声器系统11，见图4。现有的电话通常配有一个微处理器和一个能够进行编程的数字信号处理器来执行需要的文字到语音转换，因此，文字到语音转换可以用软件产品实现，例如在可读介质上的或可通过因特网传递的计算机程序。

微控制器可以例如是一个市场上可获得的电路，包括可编程闪存，通用目的输入/输出线路和工作寄存器，内部和外部中断信号、可编程串行通用异步收发器(UART)和用于串行外部接口的一个端口。寄存器进行编程以用理想的方式控制微控制器的行为。微控制器可响应以接收将转换为语音的数据并把数据发送到TTS电路。

TTS电路7可以是一个市场上可获得的电路。电路应当具有设计来驱动扬声器的输出端，并且最好也有用于耳机或外部扬声器的电话插口(te1esocket)。为了得到更大的音量，可以使用一个通用放大器8，例如一个全微分音频功率放大器。

TTS电路也应当支持SMS(短消息服务)并且最好是一个可修改缩略语列表。TTS电路也应当支持多种语言。在优选实施例中，可能通过一个允许用户下载不同的语言的串行端口编程其他语言。内置一个标准扬声器声音，但是最好它也可能下载不同的扬声器声音，或者连接包含声音数据的外部存储器，例如所谓的存储棒。当语音生成设备连接或集成到移动电话或发信机时，可以通过远程通信网络或因特网下载数据库。

TTS电路接收要通过其输入端口而被读出的数据，例如ASCII字符，把它转换为可读音频并把该音频发送到一个模拟输出端。一个典型的电路包括一个文字处理器，一个平滑滤波器和多层存储器存储阵列。声音和音频信号以它们原始、未压缩的形式存储在存储器中，这提供良好的声音再现质量。

语音转换是常规的，在这里不详细说明。简单地说，文字到语音机制包括文字标准化、字词到音素转换和音素映射。文字标准化是把输入文字转换为可发音的字词的处理。它扩展缩略语并把数字串转换为口头字词。缩略语表能够进行修改。这使得能够由开发者或终端用户定做该设备，提供加入特别用于文字的缩略语的灵活性。即使只支持唯一的SMS字符，表示诸如微笑的图标；-)将由其对应的真实口语意思代替。这意味着一个包含缩略语和图标的SMS将被正确朗读。

TTS电路将具有能够保存至少256个字符的内部输入缓冲器，从而接收由160个字符组成的整个SMS。这表示在连接装置中不需要任何额外的存储器。

微控制器6最好连接到音量控制以调整所连接的扬声器系统的音量。例如，能够提供两个按钮，一个增加音量，一个减小音量。按钮适于连接到微控制器的中断管脚。

语音生成设备提供有用于通过其系统连接器将该设备连接到电话的接口。系统连接器接口包括音频信号，两个连续频道，电源线和模拟和数字接地线。图2中示出了一个典型的系统连接器接口10。

移动电话被安排用于从在显示器上显示的数据中提取文字和字符并把它发送到语音生成设备。提取的文字串可以被发送到该设备以在系统总线上放置该数据。所有的文字串存储在一个列表中并且一个文字ID是一个用于指出不同文字串的指针。

图3示出了系统中模块之间的数据流向示意图。不同的模块需要恰当的接口来彼此正确地通信。电话1和微控制器6之间的接口由通用异步收发器UART组成，同时微控制器6和TTS电路7通过串行外围接口通信。UART可以形成商品化的微控制器的一部分。

图4示出了本发明操作的一个例子。移动电话1包括当前显示例如SMS的消息部分的显示器2。辅助键盘包括用于在显示器上移动的滚动按钮3。当前，显示器的一行4通过把文字高亮来进行标记。在自动模式下，控制单元以固定的或可调的速度提取一行或一个字词并且自动把它发送到语音生成设备以便转换为口头音频信号。最好有可能在文字中暂停、倒带以及快速前进。读出文字的语音速度能够进行调整以适合每个人。

在另一种模式中，用户通过按钮3在显示器上滚动，以选择一行来发送到转换电路并大声读出。用户也可以选择整个文字或一个文件，比如一个消息或下载的文章。所选择的文字被发送到转换电路。

在另一种模式中，当用户写入一个消息，比如一个SMS时，起动文字到语音转换。在输入一个字幕或符号后，这被大声读出。当完成整个字词时，例如在输入空格时被触发，字词发送到转换电路并被大声读出。进而，当输入标点符号时，可以读整个最新的句子，并且在它发送之前能够读出整个消息。控制单元独立于一组确定的字符(诸如空格和标点符号)而发送将自动读出的文字，以及(可选地)每个输入符号或字母。

电话中的文字到语音转换不只对视觉受损的人和汽车司机有帮助，而且对使电话个性化的进一步的步骤也是有帮助的。移动电话中带有文字到语音功能的一些可能性是：

-与声音控制交互。来自用户的一个声音命令能够用于控制电话中的功能，像打一个电话或在菜单中导航，并且接着语音功能能够确认该命令并可能加入帮助消息。

-扩展的帮助功能，给出对所选标题的口头解释，像如何安装一个电子邮件帐户的一步步的指令。整个指令指南能够以这种方式访问。该功能能够通过一个快捷方式或通过语音识别起动和控制。

-通过在可连接到该设备或移动电话的存储棒中保存文字，有可能读出像图书一样大的文字消息。

-从一个日历中读出提醒或警报。

-读出从因特网或通过WAP下载的页面或文章。

-作为一个与GPS(全球定位系统)和黄页路由服务结合在一起的导航辅助使用。

可能有不同的声音。可以设想能够获得像电影明星一样的流行声音进行下载，或作为可连接的存储棒进行销售。口头音频信号也可以与音乐文件，例如MIDI(电子乐器数字接口)文件结合。

本发明也可以实现为可与一个装置连接的分离的附件，或者含有这样的设备的装置。本发明也涉及一种可与这样的设备连接的装置。本发明可以由硬件或由包括在自包含装置中的软件或它们的各种组合实现。本发明的范围仅仅由附加的权利要求进行限制。

Claims

1、一种用于生成语音的设备(5)，其特征在于：

一个微控制器(6)，可连接到一个装置，用于接收将转换为语音的数据，并且把该数据发送到转换电路(7)；

一个可连接到扬声器系统(9)用于把所述数据转换为语音信号的转换电路(7)。

2、按照权利要求1的设备，其特征在于数据用ASCII字符提供。

3、按照权利要求1或2的设备，其特征在于转换电路(7)支持多种可选择的语言。

4、按照权利要求3的设备，其特征在于转换电路(7)能够通过连接装置下载语言。

5、按照权利要求1到4中任一个的设备，其特征在于转换电路(7)支持多种可选择的声音。

6、按照权利要求5的设备，其特征在于转换电路(7)能够通过连接装置(1)下载声音。

7、按照权利要求1到6中任一个的设备，其特征在于语音信号的速度可调。

8、按照权利要求1到7中任一个的设备，其特征在于微控制器(6)可连接到包含诸如多种语言、缩略语表和字典的语言信息的存储器。

9、按照权利要求1到8中任一个的设备，其特征在于微控制器(6)可连接到包含声音设置的存储器。

10、按照权利要求1到9中任一个的设备，其特征在于微控制器(6)可借助于一个系统连接器连接到该装置(1)，系统连接器具有用于音频信号、串行频道、电源线和模拟和数字接地线的接口(10)。

11、按照权利要求10的设备，其特征在于该设备用一个功能盖实现，包括一个覆盖装置(1)的前部的壳和与装置(1)的处理器配合的微处理器。

12、按照权利要求1到11中任一个的设备，其特征在于可连接装置(1)是一个便携式电话，一个寻呼机，一个发信机或一个电子管理器。

13、一种具有用于显示各种可读数据的显示器(2)的装置，其特征在于一个控制单元被安排用于提取可读数据，以发送到前面的任一个权利要求所述的用于生成语音的设备(5)中。

14、按照权利要求13的装置，其特征在于可读数据可以包括来自菜单的文字、文字消息、帮助信息、日历或利用装置(1)所采取的行动的确认。

15、按照权利要求13或14的装置，其特征在于控制单元被安排用于每次从显示器(2)提取可读数据的一部分，比如一行或一个字词，并且以固定或可控的速率自动把它发送到语音生成设备。

16、按照权利要求13、14或15的装置，其特征在于控制单元被安排用于每次从显示器(2)提取可读数据的一部分，比如一行或一个字词并根据显示器(2)中的滚动把它发送到语音生成设备(5)。

17、按照权利要求13、14、15或16的装置，其特征在于控制单元被安排用于每次从显示器(2)提取一部分可读数据，比如一行或一个字词或一个字符，并根据向装置输入的字符把它发送到语音生成设备(5)。

18、按照权利要求17的装置，其特征在于控制单元被安排用于在由诸如字母、符号、空格或标点符号的确定字符的输入触发时发送可读数据。

19、按照权利要求13到18的装置，其特征在于控制单元被安排用于从选择的文件中提取可读数据并以固定或可控速率把数据自动发送到语音生成设备(5)。

20、一种具有用于显示多种可读数据的显示器的装置(1)，其特征在于包括控制单元和用于生成语音的设备，用于生成语音的设备包括一个转换电路，用于把数据转换为语音信号并可连接到扬声器系统(9；11)，其中控制单元被安排用于提取可读数据以发送到语音生成设备。

21、按照权利要求20的装置，其特征在于扬声器系统(11)与该装置集成。

22、按照权利要求20或21的装置，其特征在于数据用ASCII字符提供。

23、按照权利要求20、21或22的装置，其特征在于转换电路支持多种可选择的语言。

24、按照权利要求23的装置，其特征在于该装置(1)能够下载语言。

25、按照权利要求20到24中任一个的装置，其特征在于转换电路支持多种可选择的声音。

26、按照权利要求25的装置，其特征在于该装置(1)能够下载声音。

27、按照权利要求20到26中任一个的装置，其特征在于语音信号的速度可调。

28、按照权利要求20到27中任一个的装置，其特征在于该装置(1)可连接到包含诸如多种语言、缩略语表和字典的语言信息的存储器。

29、按照权利要求20到28中任一个的装置，其特征在于该装置(1)可连接到包含声音设置的存储器。

30、按照权利要求20到29中任一个的装置，其特征在于可读数据包括来自菜单的文字、文字消息、帮助信息、日历或利用装置所采取的行动的确认。

31、按照权利要求20到29中任一个的装置，其特征在于控制单元被安排用于每次从显示器提取可读数据的一部分，比如一行或一个字词，并且以固定或可控的速率自动把它发送到语音生成设备。

32、按照权利要求20到31中任一个的装置，其特征在于控制单元被安排用于每次从显示器提取可读数据的一部分，比如一行或一个字词，并根据显示器(2)中的滚动把它发送到语音生成设备。

33、按照权利要求20到32中任一个的装置，其特征在于控制单元被安排用于每次从显示器提取可读数据的一部分，比如一个字符、一行或一个字词并根据向装置输入的字符把它发送到语音生成设备(5)。

34、按照权利要求33的装置，其特征在于控制单元被安排用于在由诸如字母、符号、空格或标点符号的确定字符的输入触发时发送可读数据。

35、按照权利要求20到34中任一个的装置，其特征在于控制单元被安排用于从选择的文件中提取可读数据并以固定或可控速率把数据自动发送到语音生成设备(5)。

36、按照权利要求13到35中任一个的装置，其特征在于该装置是一个便携式电话，一个寻呼机，一个发信机或一个电子管理器。

37、一种可下载到具有用于显示多种可读数据的显示器的装置(1)的内部存储器中的计算机程序产品，其特征在于包括实现按照权利要求20到36中任一个装置的功能的软件代码部分。

38、一种按照权利要求37的计算机程序产品，在一个计算机可读介质上实现。