CN102169689B

CN102169689B - 一种语音合成插件的实现方法

Info

Publication number: CN102169689B
Application number: CN201110074067.6A
Authority: CN
Inventors: 胡佳文; 费流波; 陈澄
Original assignee: Shenzhen TCL New Technology Co Ltd
Current assignee: Shenzhen TCL New Technology Co Ltd
Priority date: 2011-03-25
Filing date: 2011-03-25
Publication date: 2014-04-02
Anticipated expiration: 2031-03-25
Also published as: CN102169689A

Abstract

本发明属于语音合成技术领域，提供一种语音合成插件的实现方法。该方法包括：步骤S100，发送语音合成请求；步骤S200，利用电视端的Http Server检测并解析语音合成请求；步骤S300，利用合成引擎将文字信息进行语音合成并缓存，并利用语音播放器播放合成的语音。本发明通过利用电视端的Http Server检测并解析语音合成请求，利用合成引擎合成语音流，利用播放器播放语音，无需编写标准NPAPI插件中的大量接口，简化网络电视的语音合成插件的开发过程。

Description

一种语音合成插件的实现方法

技术领域

本发明属于语音合成技术领域，特别是一种语音合成插件的实现方法。

背景技术

目前，语音合成技术已经获得了广泛应用，特别是在网络设备上的应用尤其广泛。现在网络电视发展迅速，然而基于电视浏览器的语音合成技术却发展缓慢。

基于电视浏览器的语音合成技术发展缓慢的主要原因是：网络电视采用通常的NPAPI(网景插入式应用程序编程接口)标准插件的形式进行语音合成插件的开发，要实现的接口很多，开发过程较繁琐。

因此，有必要提供一种语音合成插件的实现方法，能够简化网络电视的语音合成插件的开发过程。

发明内容

本发明的目的在于提供一种语音合成插件的实现方法，旨在解决现有技术中进行语音合成插件的开发，要实现的接口很多，开发过程较繁琐的问题。

本发明是这样实现的，一种语音合成插件的实现方法，该方法包括：步骤S100，发送语音合成请求；步骤S200，利用电视端的HttpServer检测并解析语音合成请求；步骤S300，利用合成引擎将文字信息进行语音合成并缓存，并利用语音播放器播放合成的语音。

该语音合成插件的实现方法中，步骤S100具体包括如下步骤：步骤S101，用户点击语音合成页面的播放控制按钮；步骤S102，JS处理语音合成页面的按键操作，将请求的播放状态和所要播放的文字发送给http server。其中，步骤S101中，语音合成页面的每个播放控制按钮表示一个播放状态，且用户在点击播放控制按钮时，已经有需要进行语音播放的文字；步骤S102中，Java scrip处理用户在语音合成页面上的按键操作，并通过GET或POST方式将请求的播放状态和所要播放的文字发送给电视端的http server。

该语音合成插件的实现方法的步骤S200中，电视端的http server检测是否有请求到来，如果位于电视端的http server检测到语音合成页面发出的语音合成请求，则解析此请求，并获取请求的内容。此外，步骤S200中，http server以GET方式或POST方式解析http包头，解析出的内容包括：播放状态以及要播放的文字内容。

该语音合成插件的实现方法，步骤S300具体包括：步骤S301，Http Server传入播放状态和待语音合成的文字；步骤S302，合成引擎获取到待合成的文字以及播放状态；步骤S303，合成引擎判断播放状态是否为播放；如果否，则转步骤S304，等待播放状态的到来；如果是，则转步骤S305，合成引擎进行合成，并输出合成后的语音流写入一个buf缓冲区内，并记录下写入缓冲区中的位置writepos；在上述步骤S302至步骤305，合成引擎获取到待合成的文字以及播放状态并进行语音流合成的同时，语音播放器执行以下步骤：步骤S306，播放器获取播放状态；如果播放器获取的播放状态为是，则执行步骤S307；否则等待播放状态来临；步骤S307，判断buf缓冲区是否为空；如果为空，则执行步骤S308，如果不为空，则执行步骤S309；步骤S308，播放器等待合成引擎输出语音流；步骤S309，播放器从buf缓冲区中读入数据，记录读buf缓冲区的位置readpos，并开始播放；在播放时，需要进行步骤S310，判断writepos是否大于readpos；如果是，则进行步骤S311，否则进行步骤S312；步骤S311，合成引擎继续合成语音流，播放器继续播放合成的语音流；步骤S312，播放器停止播放，等待合成引擎输出语音流。其中，步骤S305中的buf缓冲区是环形的缓冲区。

本发明通过电视端的Http Server接收并解析语音合成界面的播放状态以及待播放的文字内容，利用合成引擎合成语音流，利用播放器播放语音，无需编写标准NPAPI插件中的大量接口，简化网络电视的语音合成插件的开发过程。

附图说明

图1是本发明语音合成插件实现方法的流程图；

图2是实现图1中步骤S100的流程图；

图3是实现图1中步骤S300的流程图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

请参阅图1，是本发明语音合成插件实现方法的流程图。该语音合成插件的合成方法包括如下步骤：

步骤S100，发送语音合成请求；

该步骤S100的流程图如图2所示，该步骤具体包括：

步骤S101，用户点击语音合成页面的播放控制按钮；

网络电视的浏览器启动之后，用户进入语音合成页面，并点击页面上的播放控制按钮，每个播放控制按钮表示一个播放状态，如播放，暂停，停止，继续，另外，用户在点击播放控制按钮时，已经默认有需要进行语音播放的文字；

步骤S102，JS处理按键操作，将请求的播放状态和所要播放的文字发送给http server；

Java scrip处理用户在语音合成页面上的按键操作，并通过GET或POST方式将请求的播放状态和所要播放的文字发送给http server；通常，Http Server设置在电视端；

接下来进行步骤S200，利用电视端的Http Server检测并解析语音合成请求；

位于电视端的http server一直检测是否有请求到来，如果位于电视端的http server检测到语音合成页面发出的语音合成请求，则解析此请求，并获取请求的内容，具体来说，http server检测到网页页面操作请求之后，解析http包头，如果前端网页的请求方式是GET方式，http server就会以GET方式对包头进行解析；如果前端网页的请求方式是POST方式，http server就以POST方式解析，并发送解析出来的内容，解析出的内容包括：播放状态以及要播放的文字内容。

Http server解析出播放状态以及待播放的文字内容后，将播放状态和待播放的文字内容写入一个共享内存中，直至处理完语音合成请求后，将共享内存中的待播放文字传送至合成引擎，将播放状态传送至合成引擎和语音播放器。

然后，执行步骤S300，利用合成引擎将文字信息进行语音合成并缓存，并利用语音播放器播放合成的语音；

步骤S300的流程图如图3所示，执行步骤S300的具体流程如下：

步骤S301，Http Server传入播放状态和待语音合成的文字；

步骤S302，合成引擎获取到待合成的文字以及播放状态；

步骤S303，合成引擎判断播放状态是否为播放；

如果否，则转步骤S304，等待播放状态的到来；

如果是，则转步骤S305，合成引擎进行合成，并输出合成后的语音流写入一个buf缓冲区内，并记录下写入缓冲区中的位置writepos；该缓冲区是环形的缓冲区；

在上述步骤S302至步骤305，合成引擎获取到待合成的文字以及播放状态并进行语音流合成的同时，播放器执行以下步骤：

步骤S306，播放器获取播放状态；如果播放器获取的播放状态为是，则执行步骤S307；否则等待播放状态来临(图未示)；

步骤S307，判断buf缓冲区是否为空；如果为空，则执行步骤S308，如果不为空，则执行步骤S309；

步骤S308，播放器等待合成引擎输出语音流；

步骤S309，播放器从buf缓冲区中读入数据，记录读buf缓冲区的位置readpos，并开始播放；

在播放时，需要进行步骤S310，判断writepos是否大于readpos；如果是，则进行步骤S311，否则进行步骤S312；

步骤S311，合成引擎继续合成语音流，播放器继续播放合成的语音流；

步骤S312，播放器停止播放，等待合成引擎输出语音流。

本发明通过电视端的Http Server接收并解析语音合成界面的播放状态以及待播放的文字内容，利用合成引擎合成语音流，利用播放器播放语音流，无需编写标准NPAPI插件中的大量接口，简化网络电视的语音合成插件的开发过程。

此外，本发明中播放器播放过程中，buf缓冲区中readpos不能超过writepos，这样确保读的速度不超过写的速度，从而保证播放语音流的正确性。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

Claims

1.一种语音合成插件的实现方法，该方法包括：

步骤S100，发送语音合成请求；

步骤S200，利用电视端的Http Server检测并解析语音合成请求；

步骤S300，利用合成引擎将文字信息进行语音合成并缓存，并利用语音播放器播放合成的语音；

步骤S300具体包括：

步骤S301，Http Server传入播放状态和待语音合成的文字；

步骤S302，合成引擎获取到待合成的文字以及播放状态；

步骤S303，合成引擎判断播放状态是否为播放，如果否，则转步骤S304，如果是，则转步骤S305；

步骤S304，等待播放状态的到来；

步骤S305，合成引擎进行合成，并输出合成后的语音流写入一个缓冲区内，并记录下写入缓冲区中的位置writepos；

在上述步骤S302至步骤305，合成引擎获取到待合成的文字以及播放状态并进行语音流合成的同时，语音播放器执行以下步骤：

步骤S306，播放器获取播放状态；如果播放器获取的播放状态为是，则执行步骤S307；否则等待播放状态来临；

步骤S307，判断缓冲区是否为空；如果为空，则执行步骤S308，如果不为空，则执行步骤S309；

步骤S308，播放器等待合成引擎输出语音流；

步骤S309，播放器从缓冲区中读入数据，记录读缓冲区的位置readpos，并开始播放；

步骤S312，播放器停止播放，等待合成引擎输出语音流。

2.根据权利要求1所述的语音合成插件的实现方法，其特征在于，该步骤S100具体包括如下步骤：

步骤S101，用户点击语音合成页面的播放控制按钮；

步骤S102，Java Scrip（JS）处理语音合成页面的按键操作，将请求的播放状态和所要播放的文字发送给http server。

3.根据权利要求2所述的语音合成插件的实现方法，其特征在于，步骤S101中，语音合成页面的每个播放控制按钮表示一个播放状态，且用户在点击播放控制按钮时，已经有需要进行语音播放的文字。

4.根据权利要求2所述的语音合成插件的实现方法，其特征在于，步骤S102中，Java Scrip处理用户在语音合成页面上的按键操作，并通过GET或POST方式将请求的播放状态和所要播放的文字发送给电视端的http server。

5.根据权利要求1所述的语音合成插件的实现方法，其特征在于，步骤S200中，电视端的http server检测是否有请求到来，如果位于电视端的http server检测到语音合成页面发出的语音合成请求，则解析此请求，并获取请求的内容。

6.根据权利要求5所述的语音合成插件的实现方法，其特征在于，步骤S200中，http server以GET方式或POST方式解析http包头，解析出的内容包括：播放状态以及要播放的文字内容。

7.根据权利要求1所述的语音合成插件的实现方法，其特征在于，步骤S305中的缓冲区是环形的缓冲区。