CN1655231A - 文本语音转换系统的表情图释处理方法 - Google Patents
文本语音转换系统的表情图释处理方法 Download PDFInfo
- Publication number
- CN1655231A CN1655231A CNA2004100781977A CN200410078197A CN1655231A CN 1655231 A CN1655231 A CN 1655231A CN A2004100781977 A CNA2004100781977 A CN A2004100781977A CN 200410078197 A CN200410078197 A CN 200410078197A CN 1655231 A CN1655231 A CN 1655231A
- Authority
- CN
- China
- Prior art keywords
- expression
- explanation
- text
- voice
- character string
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- A—HUMAN NECESSITIES
- A23—FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
- A23L—FOODS, FOODSTUFFS, OR NON-ALCOHOLIC BEVERAGES, NOT COVERED BY SUBCLASSES A21D OR A23B-A23J; THEIR PREPARATION OR TREATMENT, e.g. COOKING, MODIFICATION OF NUTRITIVE QUALITIES, PHYSICAL TREATMENT; PRESERVATION OF FOODS OR FOODSTUFFS, IN GENERAL
- A23L7/00—Cereal-derived products; Malt products; Preparation or treatment thereof
- A23L7/10—Cereal-derived products
-
- A—HUMAN NECESSITIES
- A23—FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
- A23P—SHAPING OR WORKING OF FOODSTUFFS, NOT FULLY COVERED BY A SINGLE OTHER SUBCLASS
- A23P30/00—Shaping or working of foodstuffs characterised by the process or apparatus
- A23P30/20—Extruding
Landscapes
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Food Science & Technology (AREA)
- Polymers & Plastics (AREA)
- Health & Medical Sciences (AREA)
- Nutrition Science (AREA)
- Manufacturing & Machinery (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
本发明涉及当文本语音转换(TTS)系统将字符串转换为语音信号时,如果发现表情图释,则输出它的相应发音的技术。本发明由如下三个步骤构成:第1步骤,为将TTS引擎中输入的字符串转换为语音信号,在进行语言学处理的同时,以相应发音输出该字符串中包含的表情图释;第2步骤,为了确定转换为上述语音信号的句子的韵律而确定音调、音长等与声音有关的信息,然后根据上述表情图释表示的感情适当调节韵律;第3步骤,将调整了的上述韵律的语音信号输出到外部。
Description
技术领域
本发明涉及文本语音转换(TTS:Text To Speech)系统处理表情(emotion)图释的技术,特别是涉及一种当TTS引擎将字符串转换为语音信号时,如果发现表情图释,则输出它的相应发音的TTS系统的表情图释处理方法。
发明背景
TTS系统主要是将字符串转换为人类语音的系统,根本目的是使人不用去看由字符串构成的文本,而是用耳朵去听。这种TTS技术是比语音识别技术更贴近生活的技术,可用于将各种文本信息转换为语音的服务。最近,随着电子邮件的普及,可以从外部利用电话读取新接收的邮件,这也是受益于TTS技术。除此之外,TTS技术还可以利用语音听取通过文字处理器输入的句子、网页浏览器在屏幕上显示的HTML文档。对于视觉障碍者来说,可以将互联网上的信息转换为语音后听取,从而可以和普通人一样获得各种有用的信息。最近,开发出超越了过去机械音水平的合成音,可以发出类似人类语音的合成音的技术,利用TTS技术的服务正呈现出面向大众的逐渐扩大的趋势。
然而,人们使用的语言具有生命力,并且在时刻发生变化,在像现在这样通过各种网络以文字交流思想的情况下,其变化的速度正日益加快。
最近以来,在计算机通信等领域中,表情图释的使用频率正逐渐增加。上述“表情图释”用于表现使用者的感情或意愿,是感情和图标(icon)的合成语,通过组合键盘上的各种符号和文字制成。例如,笑脸可以表示为:)或:-),转向左侧看就是一张笑脸。据说最初是1980年代卡耐基-梅隆大学的学生斯科特·费尔曼(Scott Fahlman)使用的。它可以人为地将易于变得生硬死板的计算机通信引向柔和而充满乐趣的境界,使机器与机器之间的通信变得更加人性化。
然而,在现有技术下的TTS系统中,只能将通常的文字转换为语音,将表情图释处理成单纯的句子符号或毫无趣味的符号,在向用户充分传递文档内容方面存在困难。
发明内容
因此,本发明目的是克服现有技术中的不足,提供一种TTS系统的表情图释处理方法。
为实现上述目的,本发明的TTS系统的表情图释处理方法由如下三个步骤构成:第1步骤,为将TTS引擎中输入的字符串转换为语音信号,进行文本的句子处理,非中文文字处理,动词、形容词等词性分析及句法分析及发音标记转换等操作,同时以相应发音输出该字符串中包含的表情图释;第2步骤,为了确定转换为所述语音信号的句子的韵律而确定音调、音长等声音信息,然后根据所述表情图释表示的感情适当调节韵律;第3步骤,参照语音数据库生成实际语音信号后,对该语音信号进行D/A转换并进行放大处理。
如上述所作的详细说明,本发明具有如下效果,即,当TTS引擎将字符串转换为语音信号时,如果发现表情图释,则利用表情图释发音词典输出与该表情相应的声音,从而,当将包含表情图释的文字的内容转换为相应的声音并输出时,可以直接传递其内容。
附图说明
图1是本发明的表情图释处理方法的系统构成图;
图2是图1中的表情图释发音词典的发音示例表。
附图主要部分的符号说明
1:文本输入部 2:语言学处理部
3:韵律处理部 4:语音信号处理部
5:语音信号输出部 6:辞典部
7:表情图释发音词典 8:语音数据库
具体实施方式
下面参照图1及图2,详细说明本发明的表情图释处理步骤。
字符串从外部装置或内部存储器输入TTS引擎的文本输入部1后,语言学处理部2为了将其转换为语音信号,参考辞典部6的数字/缩略语符号辞典、词类辞典、发音词典中的各种数据,执行文本的句子处理、句法分析、非中文文字处理、语素分析及句法分析、发音标记转换等作业。
这时,上述语言学处理部2利用表情图释发音词典7识别上述字符串中包含的表情图释后,不是将其处理成单纯的符号,而是以表情图释发音词典7中收入的发音进行输出。
作为参考,图2显示了上述表情图释发音词典7中记录的各表情图释的发音示例。举例来说,^^、^_^、:)、^o^、^_^等表情图释的发音是″笑了″。又例如,对于-.-、-.-、-.-的表情图释,发音为″无表情″。
而后,韵律处理部3在用声音输出句子时,为了确定韵律而确定音调、音的长短等。这时,根据上述表情图释表示的感情适当调节韵律。
接着,语音信号处理部4参考存储语音数据库8的实际语音数据生成实际语音信号,语音信号输出部5对上述生成的实际语音信号进行D/A转换,同时放大为适当的电平后输出,以使人能够听到。
Claims (5)
1.一种文本语音转换系统的表情图释处理方法,其特征是由如下步骤构成:
第1步骤,在进行语言学处理的同时,以相应发音输出该字符串中包含的表情图释,用以将文本语音转换引擎中输入的字符串转换为语音信号;
第2步骤,为了确定转换为所述语音信号的句子的韵律而确定与声音有关的信息,然后根据所述表情图释表示的感情适当调节韵律;
第3步骤,将调节了的所述韵律的语音信号输出到外部。
2.根据权利要求1所述的文本语音转换系统的表情图释处理方法,其特征是输入文本语音转换引擎的字符串是由外部装置或内部存储器提供的。
3.根据权利要求1所述的文本语音转换系统的表情图释处理方法,其特征是所述第1步骤还包括:
在利用表情图释发音词典识别所述字符串中包含的表情图释后,以表情图释发音词典中收入的发音进行输出的步骤。
4.根据权利要求1所述的文本语音转换系统的表情图释处理方法,其特征是所述与声音有关的信息包括音调和音长。
5.根据权利要求3所述的文本语音转换系统的表情图释处理方法,其特征是,所述表情图释发音词典存储着与各表情图释对应的发音。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020040008771 | 2004-02-10 | ||
KR1020040008771A KR20050080671A (ko) | 2004-02-10 | 2004-02-10 | 티티에스 시스템의 이모티콘 처리 방법 |
KR10-2004-0008771 | 2004-02-10 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1655231A true CN1655231A (zh) | 2005-08-17 |
CN1292400C CN1292400C (zh) | 2006-12-27 |
Family
ID=34909935
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2004100781977A Expired - Fee Related CN1292400C (zh) | 2004-02-10 | 2004-09-17 | 文本语音转换系统的表情图释处理方法 |
Country Status (2)
Country | Link |
---|---|
KR (1) | KR20050080671A (zh) |
CN (1) | CN1292400C (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008086685A1 (fr) * | 2007-01-04 | 2008-07-24 | Zte Corporation | Procédé et dispositif pour la transmission d'un message multimédia au moyen d'un message à texte court |
CN101072258B (zh) * | 2007-03-29 | 2012-06-06 | 腾讯科技(深圳)有限公司 | 一种语音点播方法及装置 |
CN103761963A (zh) * | 2014-02-18 | 2014-04-30 | 大陆汽车投资(上海)有限公司 | 包含情感类信息的文本的处理方法 |
CN104053131A (zh) * | 2013-03-12 | 2014-09-17 | 华为技术有限公司 | 一种文本通讯信息处理方法及相关设备 |
CN104699675A (zh) * | 2015-03-18 | 2015-06-10 | 北京交通大学 | 翻译信息的方法和装置 |
CN105139848A (zh) * | 2015-07-23 | 2015-12-09 | 小米科技有限责任公司 | 数据转换方法和装置 |
CN106951105A (zh) * | 2017-03-03 | 2017-07-14 | 深圳市联谛信息无障碍有限责任公司 | 一种使用无障碍服务阅读表情符号的方法 |
CN110189742A (zh) * | 2019-05-30 | 2019-08-30 | 芋头科技(杭州)有限公司 | 确定情感音频、情感展示、文字转语音的方法和相关装置 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023136605A1 (en) * | 2022-01-11 | 2023-07-20 | Samsung Electronics Co., Ltd. | Method and electronic device for intelligently reading displayed contents |
-
2004
- 2004-02-10 KR KR1020040008771A patent/KR20050080671A/ko not_active Application Discontinuation
- 2004-09-17 CN CNB2004100781977A patent/CN1292400C/zh not_active Expired - Fee Related
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008086685A1 (fr) * | 2007-01-04 | 2008-07-24 | Zte Corporation | Procédé et dispositif pour la transmission d'un message multimédia au moyen d'un message à texte court |
CN101072258B (zh) * | 2007-03-29 | 2012-06-06 | 腾讯科技(深圳)有限公司 | 一种语音点播方法及装置 |
CN104053131A (zh) * | 2013-03-12 | 2014-09-17 | 华为技术有限公司 | 一种文本通讯信息处理方法及相关设备 |
CN103761963A (zh) * | 2014-02-18 | 2014-04-30 | 大陆汽车投资(上海)有限公司 | 包含情感类信息的文本的处理方法 |
CN104699675A (zh) * | 2015-03-18 | 2015-06-10 | 北京交通大学 | 翻译信息的方法和装置 |
CN104699675B (zh) * | 2015-03-18 | 2018-01-30 | 北京交通大学 | 翻译信息的方法和装置 |
CN105139848A (zh) * | 2015-07-23 | 2015-12-09 | 小米科技有限责任公司 | 数据转换方法和装置 |
CN105139848B (zh) * | 2015-07-23 | 2019-01-04 | 小米科技有限责任公司 | 数据转换方法和装置 |
CN106951105A (zh) * | 2017-03-03 | 2017-07-14 | 深圳市联谛信息无障碍有限责任公司 | 一种使用无障碍服务阅读表情符号的方法 |
CN110189742A (zh) * | 2019-05-30 | 2019-08-30 | 芋头科技(杭州)有限公司 | 确定情感音频、情感展示、文字转语音的方法和相关装置 |
CN110189742B (zh) * | 2019-05-30 | 2021-10-08 | 芋头科技(杭州)有限公司 | 确定情感音频、情感展示、文字转语音的方法和相关装置 |
Also Published As
Publication number | Publication date |
---|---|
CN1292400C (zh) | 2006-12-27 |
KR20050080671A (ko) | 2005-08-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7062437B2 (en) | Audio renderings for expressing non-audio nuances | |
US7644000B1 (en) | Adding audio effects to spoken utterance | |
US20060069567A1 (en) | Methods, systems, and products for translating text to speech | |
US9240180B2 (en) | System and method for low-latency web-based text-to-speech without plugins | |
US20100217591A1 (en) | Vowel recognition system and method in speech to text applictions | |
CN111223498A (zh) | 情绪智能识别方法、装置及计算机可读存储介质 | |
CN111477216A (zh) | 一种用于对话机器人的音意理解模型的训练方法及系统 | |
CN1742273A (zh) | 多模态语音-语音语言翻译和显示 | |
EP1371057B1 (en) | Method for enabling the voice interaction with a web page | |
JP2004355630A (ja) | 音声アプリケーション言語タグとともに実装される理解同期意味オブジェクト | |
JP2004355629A (ja) | 高度対話型インターフェースに対する理解同期意味オブジェクト | |
CN110197655A (zh) | 用于合成语音的方法和装置 | |
CN1292400C (zh) | 文本语音转换系统的表情图释处理方法 | |
EP1685556A1 (en) | Audio dialogue system and voice browsing method | |
CN111508466A (zh) | 一种文本处理方法、装置、设备及计算机可读存储介质 | |
CN1333501A (zh) | 一种动态汉语语音合成方法 | |
CN116092472A (zh) | 一种语音合成方法和合成系统 | |
CN116129868A (zh) | 一种结构化画本的生成方法和生成系统 | |
Kehoe et al. | Designing help topics for use with text-to-speech | |
Trivedi | Fundamentals of Natural Language Processing | |
CN1275174C (zh) | 具有语音辨识辅助功能的中文输入方法及其系统 | |
JP3691773B2 (ja) | 文章解析方法とその方法を利用可能な文章解析装置 | |
CN101055571A (zh) | 声控翻译机 | |
JP2003044072A (ja) | 音声読み上げ設定装置、音声読み上げ装置、音声読み上げ設定方法、音声読み上げ設定プログラム及び記録媒体 | |
JP2015179198A (ja) | 読み上げ装置、読み上げ方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20061227 Termination date: 20091019 |