CN1655231A

CN1655231A - 文本语音转换系统的表情图释处理方法

Info

Publication number: CN1655231A
Application number: CNA2004100781977A
Authority: CN
Inventors: 姜容成
Original assignee: LG Electronics China Research and Development Center Co Ltd
Current assignee: LG Electronics China Research and Development Center Co Ltd
Priority date: 2004-02-10
Filing date: 2004-09-17
Publication date: 2005-08-17
Anticipated expiration: 2024-09-17
Also published as: CN1292400C; KR20050080671A

Abstract

本发明涉及当文本语音转换(TTS)系统将字符串转换为语音信号时，如果发现表情图释，则输出它的相应发音的技术。本发明由如下三个步骤构成：第1步骤，为将TTS引擎中输入的字符串转换为语音信号，在进行语言学处理的同时，以相应发音输出该字符串中包含的表情图释；第2步骤，为了确定转换为上述语音信号的句子的韵律而确定音调、音长等与声音有关的信息，然后根据上述表情图释表示的感情适当调节韵律；第3步骤，将调整了的上述韵律的语音信号输出到外部。

Description

文本语音转换系统的表情图释处理方法

技术领域

本发明涉及文本语音转换(TTS：Text To Speech)系统处理表情(emotion)图释的技术，特别是涉及一种当TTS引擎将字符串转换为语音信号时，如果发现表情图释，则输出它的相应发音的TTS系统的表情图释处理方法。

发明背景

TTS系统主要是将字符串转换为人类语音的系统，根本目的是使人不用去看由字符串构成的文本，而是用耳朵去听。这种TTS技术是比语音识别技术更贴近生活的技术，可用于将各种文本信息转换为语音的服务。最近，随着电子邮件的普及，可以从外部利用电话读取新接收的邮件，这也是受益于TTS技术。除此之外，TTS技术还可以利用语音听取通过文字处理器输入的句子、网页浏览器在屏幕上显示的HTML文档。对于视觉障碍者来说，可以将互联网上的信息转换为语音后听取，从而可以和普通人一样获得各种有用的信息。最近，开发出超越了过去机械音水平的合成音，可以发出类似人类语音的合成音的技术，利用TTS技术的服务正呈现出面向大众的逐渐扩大的趋势。

然而，人们使用的语言具有生命力，并且在时刻发生变化，在像现在这样通过各种网络以文字交流思想的情况下，其变化的速度正日益加快。

最近以来，在计算机通信等领域中，表情图释的使用频率正逐渐增加。上述“表情图释”用于表现使用者的感情或意愿，是感情和图标(icon)的合成语，通过组合键盘上的各种符号和文字制成。例如，笑脸可以表示为:)或:-)，转向左侧看就是一张笑脸。据说最初是1980年代卡耐基-梅隆大学的学生斯科特·费尔曼(Scott Fahlman)使用的。它可以人为地将易于变得生硬死板的计算机通信引向柔和而充满乐趣的境界，使机器与机器之间的通信变得更加人性化。

然而，在现有技术下的TTS系统中，只能将通常的文字转换为语音，将表情图释处理成单纯的句子符号或毫无趣味的符号，在向用户充分传递文档内容方面存在困难。

发明内容

因此，本发明目的是克服现有技术中的不足，提供一种TTS系统的表情图释处理方法。

为实现上述目的，本发明的TTS系统的表情图释处理方法由如下三个步骤构成：第1步骤，为将TTS引擎中输入的字符串转换为语音信号，进行文本的句子处理，非中文文字处理，动词、形容词等词性分析及句法分析及发音标记转换等操作，同时以相应发音输出该字符串中包含的表情图释；第2步骤，为了确定转换为所述语音信号的句子的韵律而确定音调、音长等声音信息，然后根据所述表情图释表示的感情适当调节韵律；第3步骤，参照语音数据库生成实际语音信号后，对该语音信号进行D/A转换并进行放大处理。

如上述所作的详细说明，本发明具有如下效果，即，当TTS引擎将字符串转换为语音信号时，如果发现表情图释，则利用表情图释发音词典输出与该表情相应的声音，从而，当将包含表情图释的文字的内容转换为相应的声音并输出时，可以直接传递其内容。

附图说明

图1是本发明的表情图释处理方法的系统构成图；

图2是图1中的表情图释发音词典的发音示例表。

附图主要部分的符号说明

1：文本输入部 2：语言学处理部

3：韵律处理部 4：语音信号处理部

5：语音信号输出部 6：辞典部

7：表情图释发音词典 8：语音数据库

具体实施方式

下面参照图1及图2，详细说明本发明的表情图释处理步骤。

字符串从外部装置或内部存储器输入TTS引擎的文本输入部1后，语言学处理部2为了将其转换为语音信号，参考辞典部6的数字/缩略语符号辞典、词类辞典、发音词典中的各种数据，执行文本的句子处理、句法分析、非中文文字处理、语素分析及句法分析、发音标记转换等作业。

这时，上述语言学处理部2利用表情图释发音词典7识别上述字符串中包含的表情图释后，不是将其处理成单纯的符号，而是以表情图释发音词典7中收入的发音进行输出。

作为参考，图2显示了上述表情图释发音词典7中记录的各表情图释的发音示例。举例来说，^^、^_^、:)、^o^、^_^等表情图释的发音是″笑了″。又例如，对于-.-、-.-、-.-的表情图释，发音为″无表情″。

而后，韵律处理部3在用声音输出句子时，为了确定韵律而确定音调、音的长短等。这时，根据上述表情图释表示的感情适当调节韵律。

接着，语音信号处理部4参考存储语音数据库8的实际语音数据生成实际语音信号，语音信号输出部5对上述生成的实际语音信号进行D/A转换，同时放大为适当的电平后输出，以使人能够听到。

Claims

1.一种文本语音转换系统的表情图释处理方法，其特征是由如下步骤构成：

第1步骤，在进行语言学处理的同时，以相应发音输出该字符串中包含的表情图释，用以将文本语音转换引擎中输入的字符串转换为语音信号；

第2步骤，为了确定转换为所述语音信号的句子的韵律而确定与声音有关的信息，然后根据所述表情图释表示的感情适当调节韵律；

第3步骤，将调节了的所述韵律的语音信号输出到外部。

2.根据权利要求1所述的文本语音转换系统的表情图释处理方法，其特征是输入文本语音转换引擎的字符串是由外部装置或内部存储器提供的。

3.根据权利要求1所述的文本语音转换系统的表情图释处理方法，其特征是所述第1步骤还包括：

在利用表情图释发音词典识别所述字符串中包含的表情图释后，以表情图释发音词典中收入的发音进行输出的步骤。

4.根据权利要求1所述的文本语音转换系统的表情图释处理方法，其特征是所述与声音有关的信息包括音调和音长。

5.根据权利要求3所述的文本语音转换系统的表情图释处理方法，其特征是，所述表情图释发音词典存储着与各表情图释对应的发音。