CN107240393A - 一种语音合成方法 - Google Patents

一种语音合成方法 Download PDF

Info

Publication number
CN107240393A
CN107240393A CN201710703208.3A CN201710703208A CN107240393A CN 107240393 A CN107240393 A CN 107240393A CN 201710703208 A CN201710703208 A CN 201710703208A CN 107240393 A CN107240393 A CN 107240393A
Authority
CN
China
Prior art keywords
voice messaging
text message
synthesized
speech synthesis
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710703208.3A
Other languages
English (en)
Inventor
王强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Haixiang Education Technology Co Ltd
Original Assignee
Guangdong Haixiang Education Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Haixiang Education Technology Co Ltd filed Critical Guangdong Haixiang Education Technology Co Ltd
Priority to CN201710703208.3A priority Critical patent/CN107240393A/zh
Publication of CN107240393A publication Critical patent/CN107240393A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/04Details of speech synthesis systems, e.g. synthesiser structure or memory management
    • G10L13/047Architecture of speech synthesisers

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)

Abstract

本发明提供了一种语音合成方法,应用于语音合成设备,所述方法包括步骤:读取待合成的文本信息,并发送与所述待合成的文本信息对应的语音转化指令;读取所述文本信息中的所有字符,并根据所述字符确定对应的词汇;根据所述词汇,将所述文本信息转换成对应的语音信息;合成所述语音信息,并通过所述应用于语音合成设备发送语音信息。本发明提供的一种语音合成方法,均可以生成进行语音合成工作的执行文件,还可而已通过打印接口将接收到的文本信息打印出来,便于用户的查阅,将所述语音合成系统加入移动终端中,从而来语音输出移动终端所接收的文本信息,因而提高了移动终端的用户使用体验。

Description

一种语音合成方法
技术领域
本发明属于语音合成技术领域,特别是涉及一种语音合成方法。
背景技术
语音识别和语音合成技术是信息处理领域的重要分支,是实现人机语音交互的两项关键技术,这两项技术使计算机具有类似于人一样的说话和听懂人说话的能力,是当今信息产业的重 要竞争市场。语音合成(Speech Synthesis)是指由人工通过一定的机器设备产生出语音。语音合成是一门跨学科的技术,它涉及声学、语言学、心理学、数字信号处理、人工智能、计算机科学等多个学科技术,是信息处理领域的一项前沿技术,它的研究将推动相关学科的进步和发展。目前语音合成技术已是世界强国竞相研究的热点之一,国内外很多科研机构致力于此项技术。近20年来,语音合成技术取得显著进步,开始从实验室走向市场。语音合成技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。特别是随着计算机技术、多媒体技术以及人工智能的不断发展,语音合成技术作为一种新的信息传递技术逐渐被计算机产品或其他的电子产品所使用,以新的技术应用在人机交互介质中。具体方法是利用计算机将任意组合的文本转化为声音文件,并通过声卡、电话语音卡等多媒体设备将声音输出的技术,简单的说就是让机器把文字资料“读” 出来。这种新的信息传递方式比传统的信息输入输出方式更加灵活、快捷和方便,因此语音编码取代字符编码成为信息的主要传递元素将成为信息技术发展的必然趋势,这也使得语音合成一直受到各国科学界的广泛关注。在中国,语音合成技术具有非常惊人的市场潜力,是一个活跃的研究课题 。
语音合成用于将文本文件转换成自然语音输出,从而可以有效地帮助有 视觉障碍的人阅读文本信息,或者只是简单的用来增加文本文档等的可读性。
早期的语音合成系统一般采用专用的芯片实现,如德州仪器公司的 TMS50C10/TMS50C57芯片以及皇家飞利浦公司的PH84H36芯片等,但是 上述的芯片一般主要应用于家用电器或儿童玩具中。而计算机或移动终端等 电子设备中的语音合成系统一般都是通过软件的形式实现。
所以现有的语音合成系统的实现形式多样,各个厂家都具有自己定制的 语音合成系统,而且各个厂家的语音合成系统之间相互不兼容。从而限制了 语音合成系统的应用与发展。
发明内容
本发明的目的在于提供语音合成方法,以语音合成装置均可以生成进行语音合成工作的执行文件,还可而已通过打印接口将接收到的文本信息打印出来,便于用户的查阅,将所述语音合成系统加入移动终端中,从而来语音输出移动终端所接收的文本信息,因而提高了移动终端的用户使用体验。。
为了达到上述目的,本发明提供了一种语音合成方法,应用于语音合成设备,所述方法包括步骤:
读取待合成的文本信息,并发送与所述待合成的文本信息对应的语音转化指令;
读取所述文本信息中的所有字符,并根据所述字符确定对应的词汇;
根据所述词汇,将所述文本信息转换成对应的语音信息;
合成所述语音信息,并通过所述应用于语音合成设备发送语音信息。
优选的,在所述读取待合成的文本信息,并发送与所述待合成的文本信息对应的语音转化指令之前,所述方法还包括:
接收语音信息对应的语音合成执行指令,并生成所述语音信息对应的执行文件;
所述读取待合成的文本信息,并发送与所述待合成的文本信息对应的语音转化指令,包括;
根据所述执行文件以及所读取待合成的文本信息,并发送与所述待合成的文本信息对应的语音转化指令。
优选的,在所述读取待合成的文本信息,并发送与所述待合成的文本信息对应的语音转化指令之前,所述方法还包括:
接收语音信息对应的语音合成执行指令,并生成所述语音信息对应的执行文件;
获取所述文本信息中的短语信息,调用预存的分析资料库,对比分析短语信息,根据所述短语信息,将所述文本信息转换成对应的语音信息;
合成所述语音信息,并通过所述应用于语音合成设备发送语音信息。
优选的,在所述读取待合成的文本信息,并发送与所述待合成的文本信息对应的语音转化指令之前,所述方法还包括:
接收语音信息对应的语音合成执行指令,并生成所述语音信息对应的执行文件;
获取所述文本信息中的语句信息,调用预存的分析资料库,对比分析语句信息,根据所述语句信息,将所述文本信息转换成对应的语音信息;
合成所述语音信息,并通过所述应用于语音合成设备发送语音信息。
优选的,所述语音合成设备还包括打印接口。
优选的,所述合成所述语音信息,并通过所述应用于语音合成设备发送语音信息,包括:
所述语音合成设备将所述文本信息转化为打印文本信息并输出至所述打印接口,合成所述语音信息,并通过所述应用于语音合成设备发送语音信息。
优选的,所述合成所述语音信息,并通过所述应用于语音合成设备发送语音信息,包括:
根据GMM-HMM语音转化模型,合成所述语音信息,并通过所述应用于语音合成设备发送语音信息。
优选的,所述GMM-HMM语音转化模型为HMM语音合成模型。
与现有技术相比,本发明的有益效果在于:
本发明提高了一种语音合成方法,应用于语音合成设备,所述方法包括步骤:读取待合成的文本信息,并发送与所述待合成的文本信息对应的语音转化指令;读取所述文本信息中的所有字符,并根据所述字符确定对应的词汇;根据所述词汇,将所述文本信息转换成对应的语音信息;合成所述语音信息,并通过所述应用于语音合成设备发送语音信息。本发明的语音合成装置均可以生成进行语音合成工作的执行文件,还可而已通过打印接口将接收到的文本信息打印出来,便于用户的查阅,将所述语音合成系统加入移动终端中,从而来语音输出移动终端所接收的文本信息,因而提高了移动终端的用户使用体验。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对本发明或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1本发明提供的语音合成方法的第一种流程示意图。
图2本发明提供的语音合成方法的第二种流程示意图。
图3本发明提供的语音合成方法的第三种流程示意图。
具体实施方式
下面将结合本发明中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面通过具体实施例,对本发明进行详细的说明。
参见图1,图1为语音合成方法的流程示意图,所述方法包括步骤:
S101,读取待合成的文本信息,并发送与所述待合成的文本信息对应的语音转化指令;
S102,读取所述文本信息中的所有字符,并根据所述字符确定对应的词汇;
S103,根据所述词汇,将所述文本信息转换成对应的语音信息;
S104,合成所述语音信息,并通过所述应用于语音合成设备发送语音信息。
进一步的,参见图2,在所述读取待合成的文本信息,并发送与所述待合成的文本信息对应的语音转化指令之前,所述方法还包括:
S105,接收语音信息对应的语音合成执行指令,并生成所述语音信息对应的执行文件;
所述S101,可以为S101A;根据所述执行文件以及所读取待合成的文本信息,并发送与所述待合成的文本信息对应的语音转化指令。
可选的,参见图3,所述语音合成设备还包括打印接口,所述S104具体还可以为S104A:
S104A,所述语音合成设备将所述文本信息转化为打印文本信息并输出至所述打印接口,合成所述语音信息,并通过所述应用于语音合成设备发送语音信息。
所述文件生成模块生成用于执行语音合成的执行文件,并将所述执行文件烧录至所述通信模块。所述通信模块依据所述执行文件生成文本解析子模块和语音合成子模块。
具体的,所述合成所述语音信息,并通过所述应用于语音合成设备发送语音信息,包括:根据GMM-HMM语音转化模型,合成所述语音信息,并通过所述应用于语音合成设备发送语音信息,所述GMM-HMM语音转化模型为HMM语音合成模型。
文本接口从外部设备读入文本信息,并发送至所述文本解析子模块,所述文本解析子模块将文本信息中的所有词汇分别转化为语音信息。所述语音合成子模块将所述语音信息合成为音频信息。所述音频接口将所述音频信息发送至外部设备。
本实施例的语音合成系统通过与移动终端的结合,从而来语音输出移动终端所接收的文本信息,因而提高了移动终端的用户使用体验。
本实施例的语音合成系统中还包括一打印接口,其中本实施例的通信模块将所述文本接口接收的文本信息转化为打印文本信息,并通过所述打印接口输出至外部打印设备或系统中。
本实施例的语音合成系统的工作流程包括以下步骤:所述文件生成模块生成用于执行语音合成的执行文件,并将所述执行文件烧录至所述通信模块。所述通信模块依据所述执行文件生成文本解析子模块和语音合成子模块。文本接口从外部设备读入文本信息,并发送至所述文本解 析子模块。所述通信模块将所述文本信息转化为打印文本信息并通过所述打印接口输出至外部打印设备或打印系统中。所述文本解析子模块将文本信息中的所有词汇分别转化为 语音信息。所述语音合成子模块将所述语音信息合成为音频信息。所述音频接口将所述音频信息发送至外部设备。本实施例的语音合成系统通过通信模块和打印接口将接收到的文本 信息打印出来,便于用户的查阅。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (8)

1.一种语音合成方法,其特征在于,应用于语音合成设备,所述方法包括以下步骤:
读取待合成的文本信息,并发送与所述待合成的文本信息对应的语音转化指令;
读取所述文本信息中的所有字符,并根据所述字符确定对应的词汇;
根据所述词汇,将所述文本信息转换成对应的语音信息;
合成所述语音信息,并通过所述应用于语音合成设备发送语音信息。
2.根据权利要求1所述的一种语音合成方法,其特征在于,在所述读取待合成的文本信息,并发送与所述待合成的文本信息对应的语音转化指令之前,所述方法还包括:
接收语音信息对应的语音合成执行指令,并生成所述语音信息对应的执行文件;
所述读取待合成的文本信息,并发送与所述待合成的文本信息对应的语音转化指令,包括;
根据所述执行文件以及所读取待合成的文本信息,并发送与所述待合成的文本信息对应的语音转化指令。
3.根据权利要求1所述的一种语音合成方法,其特征在于,在所述读取待合成的文本信息,并发送与所述待合成的文本信息对应的语音转化指令之前,所述方法还包括:
接收语音信息对应的语音合成执行指令,并生成所述语音信息对应的执行文件;
获取所述文本信息中的短语信息,调用预存的分析资料库,对比分析短语信息,根据所述短语信息,将所述文本信息转换成对应的语音信息;
合成所述语音信息,并通过所述应用于语音合成设备发送语音信息。
4.根据权利要求1所述的一种语音合成方法,其特征在于,在所述读取待合成的文本信息,并发送与所述待合成的文本信息对应的语音转化指令之前,所述方法还包括:
接收语音信息对应的语音合成执行指令,并生成所述语音信息对应的执行文件;
获取所述文本信息中的语句信息,调用预存的分析资料库,对比分析语句信息,根据所述语句信息,将所述文本信息转换成对应的语音信息;
合成所述语音信息,并通过所述应用于语音合成设备发送语音信息。
5.根据权利要求1所述的一种语音合成方法,其特征在于,所述语音合成设备还包括打印接口。
6.根据权利要求1所述的一种语音合成方法,其特征在于,所述合成所述语音信息,并通过所述应用于语音合成设备发送语音信息,包括:
所述语音合成设备将所述文本信息转化为打印文本信息并输出至所述打印接口,合成所述语音信息,并通过所述应用于语音合成设备发送语音信息。
7.根据权利要求1所述的一种语音合成方法,其特征在于,所述合成所述语音信息,并通过所述应用于语音合成设备发送语音信息,包括:
根据GMM-HMM语音转化模型,合成所述语音信息,并通过所述应用于语音合成设备发送语音信息。
8.根据权利要求4所述的一种语音合成方法,其特征在于,所述GMM-HMM语音转化模型为HMM语音合成模型。
CN201710703208.3A 2017-08-16 2017-08-16 一种语音合成方法 Pending CN107240393A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710703208.3A CN107240393A (zh) 2017-08-16 2017-08-16 一种语音合成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710703208.3A CN107240393A (zh) 2017-08-16 2017-08-16 一种语音合成方法

Publications (1)

Publication Number Publication Date
CN107240393A true CN107240393A (zh) 2017-10-10

Family

ID=59991986

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710703208.3A Pending CN107240393A (zh) 2017-08-16 2017-08-16 一种语音合成方法

Country Status (1)

Country Link
CN (1) CN107240393A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101000764A (zh) * 2006-12-18 2007-07-18 黑龙江大学 基于韵律结构的语音合成文本处理方法
CN101266789A (zh) * 2007-03-14 2008-09-17 佳能株式会社 语音合成设备及方法
CN103093751A (zh) * 2011-10-28 2013-05-08 上海移远通信技术有限公司 语音合成系统及其语音合成方法
CN105959271A (zh) * 2016-04-25 2016-09-21 乐视控股(北京)有限公司 一种文字内容信息的语音转换方法、播放方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101000764A (zh) * 2006-12-18 2007-07-18 黑龙江大学 基于韵律结构的语音合成文本处理方法
CN101266789A (zh) * 2007-03-14 2008-09-17 佳能株式会社 语音合成设备及方法
CN103093751A (zh) * 2011-10-28 2013-05-08 上海移远通信技术有限公司 语音合成系统及其语音合成方法
CN105959271A (zh) * 2016-04-25 2016-09-21 乐视控股(北京)有限公司 一种文字内容信息的语音转换方法、播放方法及装置

Similar Documents

Publication Publication Date Title
CN100424632C (zh) 用于高级交互接口的语义对象同步理解
CN101923858B (zh) 一种实时同步互译语音终端
TW200926139A (en) Grapheme-to-phoneme conversion using acoustic data
CN105280179A (zh) 一种文字转语音的处理方法及系统
WO2009151509A2 (en) Multilingual asynchronous communications of speech messages recorded in digital media files
CN103543979A (zh) 一种输出语音的方法、语音交互的方法及电子设备
CN101115088A (zh) 聋哑人专用手机
CN106486121A (zh) 应用于智能机器人的语音优化方法及装置
CN111128175B (zh) 口语对话管理方法及系统
KR20110080096A (ko) 확장 도메인을 이용한 대화 시스템 및 그 자연어 인식 방법
CN112349266B (zh) 一种语音编辑方法及相关设备
JP6448950B2 (ja) 音声対話装置及び電子機器
CN104679733B (zh) 一种语音对话翻译方法、装置及系统
CN113409761B (zh) 语音合成方法、装置、电子设备以及计算机可读存储介质
Reddy et al. Speech-to-Text and Text-to-Speech Recognition Using Deep Learning
JP2024529889A (ja) ロバストな直接音声間翻訳
CN102376304B (zh) 文本朗读系统及其文本朗读方法
TWI220205B (en) Device using handheld communication equipment to calculate and process natural language and method thereof
CN109859746B (zh) 一种基于tts的语音识别语料库生成方法及系统
CN107240393A (zh) 一种语音合成方法
Tan [Retracted] Design of Intelligent Speech Translation System Based on Deep Learning
Dewatri et al. Potential tools to support learning: OpenAI and Elevenlabs integration
CN112530399A (zh) 一种语音数据的扩充方法、系统、电子设备及存储介质
CN111104118A (zh) 一种基于aiml的自然语言指令执行方法及系统
Dandge et al. Multilingual Global Translation using Machine Learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20171010

RJ01 Rejection of invention patent application after publication