CN102324995B

CN102324995B - 语音广播方法及系统

Info

Publication number: CN102324995B
Application number: CN 201110099503
Authority: CN
Inventors: 邵晓风; 董阳; 马一人; 殷彦君; 张天扬; 郝春平
Original assignee: EASYWAY TECHNOLOGY Co Ltd; Transport Bureau of the Ministry of Railways
Current assignee: Easyway Co ltd; China State Railway Group Co Ltd
Priority date: 2011-04-20
Filing date: 2011-04-20
Publication date: 2013-12-25
Anticipated expiration: 2031-04-20
Also published as: CN102324995A

Abstract

本发明提供一种语音广播方法，获取预设的包括变量信息和类别标识信息的广播信息，根据类别标识信息获取对应的模板文件，根据变量信息和模板文件合成广播词文本文件，采用TTS引擎对广播词文本文件进行语音转换，获取广播词语音文件并播放。本发明还提供一种语音广播系统。采用本发明提供的语音广播方法及系统，在需要进行语音播放时，能够根据广播内容获取对应的语音文件，提高语音广播的时效性。

Description

语音广播方法及系统

技术领域

本发明涉及语音广播技术，尤其涉及一种语音广播方法和一种语音广播系统。

背景技术

在轨道交通、金融、医疗等多个领域，均需要用到语音广播系统。特别是在铁路客运业务中，需要在车站内通过广播方式向旅客通知各车次列车的进出站时间、检票时间和地点、候车室地点、站台地点等信息。

目前，铁路客运车站采用播放语音片段的方法进行广播。具体方法为，预先录制多条语音片段并存储到语音库，其中每条语音片段为一个短句、词组、词或字；当需要播放广播业务时，根据所需播放的内容，人工地从语音库中选择一条或多条语音片段，通过对选择的语音片段进行拼接，获得所需播放内容对应的语音文件并进行播放。

采用现有的语音播放方法和系统，如果需要广播的内容超出了预先录制的语音库，则需要临时补录对应的语音片段补充到语音库中，这不仅使得语音播放系统的维护工作繁杂，并且延误了该需要广播的内容的播放时间，因此无法及时地向站内旅客通知列车运营的相关信息，语音广播的时效性差。

发明内容

本发明实施例提供一种语音广播方法，用以解决现有技术中的缺陷，提高语音广播的时效性。

本发明实施例还提供一种语音广播系统，用以解决现有技术中的缺陷，提高语音广播的时效性。

本发明实施例提供一种语音广播方法，包括：

获取预设的广播信息，所述广播信息包括：变量信息、类别标识信息；

根据所述类别标识信息获取对应的模板文件；

根据所述变量信息和所述模板文件，合成广播词文本文件；

采用从文字到语音转换TTS引擎对所述广播词文本文件进行语音转换，获取广播词语音文件并播放。

如上所述的方法，其中，所述获取预设的广播信息之前还包括：

根据列车时刻表和广播信息的类别，存储所述广播信息；

存储模板文件、类别标识信息以及所述类别标识信息与所述模板文件的对应关系；

根据列车时刻表和当前时刻，执行所述获取预设的广播信息的步骤。

如上所述的方法，其中，

所述模板文件包括：广播内容常量信息和广播内容变量链接；

所述根据所述变量信息和所述模板文件，合成广播词文本文件包括：将所述变量信息加入所述广播内容变量链接；或，获取所述变量信息中的相似变量信息，根据所述相似变量信息，以及预设的相似变量信息与简称变量信息的对应关系，获取所述相似变量信息对应的简称变量信息，将所述简称变量信息加入所述广播内容变量链接；

所述采用TTS引擎对所述广播词文本文件进行语音转换，获取广播词语音文件包括：从语音库获取所述广播内容常量信息和所述广播内容变量链接对应的语音元素；采用引擎算法根据所述语音元素合成广播词语音文件。

如上所述的方法，其中，

所述模板文件还包括：广播内容常量文字的播放属性标识和/或广播内容变量链接的播放属性标识；

所述采用TTS引擎对所述广播词文本文件进行语音转换，获取广播词语音文件还包括：根据所述广播内容常量文字的播放属性标识和/或广播内容变量链接的播放属性标识，采用引擎算法控制所述语音元素的播放属性。

如上所述的方法，其中，

所述模板文件还包括：一个以上语言标识；

所述采用TTS引擎对所述广播词文本文件进行语音转换，获取广播词语音文件还包括：根据所述一个以上语言标识，从一种以上语言的对应的语音库获取所述广播内容常量信息和所述广播内容变量链接对应的语音元素，采用引擎算法根据所述语音元素合成一种以上语言的广播词语音文件。

如上所述的方法，其中，

所述广播信息还包括：附加信息；

所述根据所述类别标识信息获取对应的模板文件之前还包括：存储模板文件、类别标识信息、附加信息以及所述类别标识信息、所述附加信息与所述模板文件的对应关系；

所述根据所述类别标识信息获取对应的模板文件包括：根据所述类别标识信息、附加信息和所述类别标识信息、所述附加信息与所述模板文件的对应关系，获取所述类别标识信息和附加信息对应的模板文件。

如上所述的方法，其中，所述从语音库获取所述广播内容常量信息和所述广播内容变量链接对应的语音元素包括：

从定制语音库和/或基础语音库获取所述广播内容常量信息和所述广播内容变量链接对应的语音元素。

本发明还公开了一种语音广播系统，包括：

广播信息模块，用于存储预设的广播信息并发送给广播词合成模块，所述广播信息包括：变量信息、类别标识信息；

模板文件模块，用于存储预设的所述类别标识信息对应的模板文件；

广播词合成模块，用于获取所述广播信息，根据所述类别标识信息查询模板文件模块，获取所述类别标识信息对应的模板文件，根据所述变量信息和所述模板文件，合成广播词文本文件；

从文字到语音转换TTS引擎模块，用于对所述广播词文本文件进行语音转换，获取广播词语音文件；

播放设备，用于播放所述广播词语音文件。

如上所述的系统，其中，

所述系统还包括：简称变量模块，用于存储相似变量信息与简称变量信息的对应关系；

所述广播词合成模块还用于获取所述变量信息中的相似变量信息，根据所述相似变量信息查询所述简称变量模块，获取所述相似变量信息对应的简称变量信息，根据所述简称变量信息和所述模板文件，合成广播词文本文件。

如上所述的系统，其中，还包括：

广播操作触发模块，用于根据列车时刻表和当前时刻向所述广播词合成模块发送包括所述广播信息的触发信号。

由上述技术方案可知，本发明通过预先设置包括变量信息和类别标识信息的广播信息，根据类别标识信息获取模板文件，根据变量信息和模板文件合成广播词文本文件，采用TTS引擎将广播词文本文件转换为广播词语音文件并播出，因此，在需要进行语音播放时，能够根据广播内容获取对应的语音文件，从而提高语音广播的时效性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例一的语音广播方法的流程图；

图2为本发明实施例二的语音广播方法的流程图；

图3为本发明实施例三的语音广播系统的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

图1为本发明实施例一的语音广播方法的流程图。如图1所示，该方法包括如下过程。

步骤101：获取预设的广播信息。

在本步骤中，该广播信息包括：变量信息、类别标识信息。

步骤102：根据类别标识信息获取对应的模板文件。

步骤103：根据变量信息和模板文件，合成广播词文本文件。

步骤104：采用从文字到语音转换(Text to Speach，简称TTS)引擎对广播词文本文件进行语音转换，获取广播词语音文件并播放。

在本发明实施例一中，预先设置包括变量信息和类别标识信息的广播信息，根据类别标识信息获取模板文件，根据变量信息和模板文件合成广播词文本文件，采用TTS引擎将广播词文本文件转换为广播词语音文件并播出，因此，在需要进行语音播放时，能够根据广播内容获取对应的语音文件，从而提高语音广播的时效性。

图2为本发明实施例二的语音广播方法的流程图。本发明实施例二以应用于铁路车站的语音广播为例。如图2所示，该方法包括如下过程。

步骤201：根据列车时刻表和广播信息的类别，存储广播信息。

在本步骤中，根据列车时刻表设置广播信息，其中，每一条广播信息中至少包括：变量信息和类别标识信息。该变量信息可以根据具体应用的需要进行设置，包括但不限于如下的一种或多种的组合：列车车次信息、始发站信息、始发时刻信息、本站进站时刻信息、本站出站时刻信息、本站停靠时间长度信息、停靠站台地点信息、检票时间信息、检票地点信息。类别标识信息可以根据具体应用的需要进行设置，包括但不限于如下的一种或多种的组合：进站广播标识信息、出站广播标识信息、检票广播标识信息。

步骤202：存储模板文件、类别标识信息以及类别标识信息与模板文件的对应关系。

在本步骤中，根据不同的广播类别分别设置不同的模板文件，并在存储模板文件时采用类别标识信息对其进行标识。上述模板文件中包括：广播内容常量信息和广播内容变量链接。例如，类别标识信息为检票广播标识信息的模板文件，具体内容包括：“请乘坐＊列车的旅客到＊＊检票”，其中，“＊”表示第一广播内容变量链接，用于加入车次相关的信息，“＊＊”表示第二广播内容变量链接，用于加入检票地点相关的信息。

上述步骤201与步骤202的执行顺序可以互换或同时执行。

步骤203：根据列车时刻表和当前时刻，触发一次广播操作，具体为，触发执行以下步骤204。

步骤204：获取预设的广播信息。

步骤205：根据类别标识信息获取对应的模板文件。

步骤206：根据变量信息和模板文件，合成广播词文本文件。

在本步骤中，合成广播词文本文件的具体方法为：将模板文件中的变量信息加入模板文件中的广播内容变量链接，即获得广播词文本文件。仍以一次检票相关的语音广播为例，模板文件的具体内容包括：“请乘坐＊列车的旅客到＊＊检票”，变量信息以“D21次”“第一检票口”为例，则将“D21次”加入以“＊”表示的第一广播内容变量链接，将“第一检票口”加入以“＊＊”表示的第二广播内容变量链接，合成获得的广播词文本文件为“请乘坐D21次列车的旅客到第一检票口检票”。

步骤207：采用TTS引擎对广播词文本文件进行语音转换，获取广播词语音文件并播放。

在本步骤中，语音转换的具体方法包括：首先，从语音库获取广播内容常量信息和广播内容变量链接对应的语音元素；然后，采用引擎算法根据语音元素合成广播词语音文件。在本步骤之前，可以预先设置语音库，具体地，语音库可以包括定制语音库和/或基础语音库。其中，定制语音库为根据语音广播方法的应用场景设置的语音库，其中存储根据应用场景录制的语音元素。仍以应用于铁路车站的语音广播为例，定制语音库中存储具有铁路风格的音调的语音元素。基础语音库为语音广播的通用语音库，其中存储用不区分应用场景的语音元素。上述从语音库获取广播内容常量信息和广播内容变量链接对应的语音元素的具体方法为：从定制语音库和/或基础语音库获取广播内容常量信息和广播内容变量链接对应的语音元素。当定制语音库和基础语音库均存在的情况下，首先从定制语音库中获取上述对应的语音元素，在定制语音库中不包括所需的语音元素的情况下，再从基础语音库中获取该语音元素。

在上述实施例的基础上，进一步地，上述根据变量信息和模板文件，合成广播词文本文件还可以采用另一种处理方法，该方法的具体过程如下。预先设置并存储相似变量信息、简称变量信息以及相似变量信息与简称变量信息的对应关系。仍以一次检票相关的语音广播为例，如果相似变量信息为：“第一检票口”、“第二检票口”，对应的简称变量信息为：“第一、二检票口”。在合成广播词文本文件时，首先获取变量信息中的相似变量信息，例如，如果变量信息为：“D21次”“第一检票口”、“第二检票口”，则从中获取到相似变量信息为：“第一检票口”、“第二检票口”。然后，根据获取的相似变量信息，以及预设的相似变量信息与简称变量信息的对应关系，获取该相似变量信息对应的简称变量信息，例如，根据上述获取的相似变量信息以及存储的对应关系，获取到该相似变量信息对应的简称变量信息为：“第一、二检票口”。最后，将简称变量信息加入广播内容变量链接，例如，根据上述获取的简称变量信息，将“第一、二检票口”加入到广播内容变量链接中，最终获得所需的广播词文本文件为“请乘坐D21次列车的旅客到第一、二检票口检票”。采用上述方法，避免了语音广播内容中对于相似语句的重复，既节省了广播时间，又能够采用符合人们日常语言习惯的语句进行自动化的语音广播，提高了语音广播的真实性。

在上述实施例的基础上，进一步地，模板文件中还可以包括：广播内容常量文字的播放属性标识和/或广播内容变量链接的播放属性标识。上述播放属性标识包括但不限于以下一种或几种的组合：慢语速标识、快语速标识、大音量标识、小音量标识、加重语气标识。则，在采用TTS引擎对广播词文本文件进行语音转换时，根据上述广播内容常量文字的播放属性标识和/或广播内容变量链接的播放属性标识，采用引擎算法控制语音元素的播放属性。例如，根据慢语速标识，由引擎算法控制对于语音元素进行慢速播放。采用上述方法，可以根据应用场景的需要，灵活地控制语音播放的语速和语气，提高语音播放传递信息的准确性。

在上述实施例的基础上，进一步地，模板文件中还可以包括：一个以上语言标识。例如，一个模板文件中包括：普通话标识、粤语标识、英语标识。则，在采用TTS引擎对广播词文本文件进行语音转换时，根据模板文件中的一个以上语言标识，从一种以上语言的对应的语音库获取广播内容常量信息和广播内容变量链接对应的语音元素，采用引擎算法根据语音元素合成一种以上语言的广播词语音文件。如果一个模板文件中包括普通话标识、粤语标识和英语标识，则TTS引擎分别从普通话、粤语以及英语语音库中获取对应的语音元素，分别生成普通话、粤语以及英语的广播词语音文件并播放。采用上述方法，能够实现多语种语音广播。

在上述实施例的基础上，进一步地，广播信息中还可以包括：附加信息。例如，一条广播信息中的附件信息为“第一站台出站”。在根据类别标识信息获取对应的模板文件之前还包括：存储模板文件、类别标识信息、附加信息以及类别标识信息、附加信息与模板文件的对应关系。例如，类别标识信息均为出站标识信息的两个模板文件，附件信息为“第一站台出站”对应的模板文件为“请通过地下通道出站”，附件信息为“第二站台出站”对应的模板文件为“请通过天桥出站”。并且，根据类别标识信息获取对应的模板文件包括：根据类别标识信息、附加信息和类别标识信息、附加信息与模板文件的对应关系，获取类别标识信息和附加信息对应的模板文件。例如，根据出站标识信息、以及附件信息为“第一站台出站”，获取到对应的模板文件为“请通过地下通道出站”。则在进行语音转换后，最终播放的广播内容为“请通过地下通道出站”，从而通过语音广播对车站内的旅客给以准确的指示。采用上述方法，对于同一类型的广播业务，能够根据实际应用场景的需求，灵活地播放不同的具体内容，从而提高语音播放传递信息的准确性。

在本发明实施例二中，对根据变量信息和模板文件合成的广播词文本文件进行语音转换并播出，从而提高语音广播的时效性。并且，设置相似变量信息与简称变量信息的对应关系，因此能够对相似的播放内容采用符合人们语言习惯的简称表达方式，通过设置广播内容的播放属性标识进行语速语气可变语音广播，通过设置语言标识进行多语种广播，通过附加信息区分同类的模板文件播放不同的内容，从而进一步提高了通过语音广播传递的信息的准确性。

图3为本发明实施例三的语音广播系统的结构示意图。如图3所示，该系统至少包括：广播信息模块31、模板文件模块32、广播词合成模块33、TTS引擎模块34和播放设备35。

其中，广播信息模块31存储预设的广播信息并发送给广播词合成模块33。该广播信息包括：变量信息、类别标识信息。模板文件模块32存储预设的类别标识信息对应的模板文件。广播词合成模块33获取广播信息，根据类别标识信息查询模板文件模块32，获取类别标识信息对应的模板文件，根据变量信息和模板文件，合成广播词文本文件。TTS引擎模块34对广播词文本文件进行语音转换，获取广播词语音文件。播放设备35播放广播词语音文件。

在上述实施例的基础上，模板文件具体包括：广播内容常量信息和广播内容变量链接。具体地，广播词合成模块33将变量信息加入广播内容变量链接。TTS引擎模块34从语音库获取广播内容常量信息和广播内容变量链接对应的语音元素，采用引擎算法根据语音元素合成广播词语音文件。

在上述实施例的基础上，该系统还可以进一步包括：简称变量模块36。简称变量模块36存储相似变量信息与简称变量信息的对应关系。并且，广播词合成模块33还获取变量信息中的相似变量信息，根据相似变量信息查询简称变量模块36，获取相似变量信息对应的简称变量信息，根据简称变量信息和模板文件，合成广播词文本文件。

在上述实施例的基础上，该系统还可以进一步包括：广播操作触发模块30。广播操作触发模块30根据列车时刻表和当前时刻向广播词合成模块33发送包括广播信息的触发信号。

在上述实施例的基础上，进一步地，模板文件中还可以包括：广播内容常量文字的播放属性标识和/或广播内容变量链接的播放属性标识。TTS引擎模块34还可以根据广播内容常量文字的播放属性标识和/或广播内容变量链接的播放属性标识，采用引擎算法控制语音元素的播放属性。

在上述实施例的基础上，进一步地，模板文件还可以包括：一个以上语言标识。TTS引擎模块34还可以根据一个以上语言标识，从一种以上语言的对应的语音库获取广播内容常量信息和广播内容变量链接对应的语音元素，采用引擎算法根据语音元素合成一种以上语言的广播词语音文件。

在上述实施例的基础上，进一步地，广播信息中还可以包括：附加信息。模板文件模块32还存储模板文件、类别标识信息、附加信息以及类别标识信息、附加信息与模板文件的对应关系。广播词合成模块33还根据类别标识信息、附加信息和类别标识信息、附加信息与模板文件的对应关系，获取类别标识信息和附加信息对应的模板文件。

在上述实施例的基础上，进一步地，TTS引擎模块34具体可以从定制语音库和/或基础语音库获取广播内容常量信息和广播内容变量链接对应的语音元素。

本发明实施例三中的语音广播系统的工作流程和运行方法采用本发明实施例一和本发明实施例二中的语音广播方法。其中，广播信息模块31、模板文件模块32、广播词合成模块33、TTS引擎模块34、播放设备35、简称变量模块36和广播操作触发模块30的具体工作方式参见本发明实施例一和本发明实施例二中的语音广播方法进行，在此不再赘述。

在本发明实施例三中，在广播信息模块中设置包括变量信息和类别标识信息的广播信息，广播词合成模块根据类别标识信息从模板文件模块获取模板文件，根据变量信息和模板文件合成广播词文本文件，TTS引擎模块将广播词文本文件转换为广播词语音文件通过播放设备播出，因此，在需要进行语音播放时，能够根据广播内容获取对应的语音文件，从而提高语音广播的时效性。

需要说明的是：对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明并不受所描述的动作顺序的限制，因为依据本发明，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本发明所必须的。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述的程序可以存储于一计算机可读取存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质包括：ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种语音广播方法，其特征在于，包括：

根据所述类别标识信息获取对应的模板文件；

根据所述变量信息和所述模板文件，合成广播词文本文件；

采用从文字到语音转换TTS引擎对所述广播词文本文件进行语音转换，获取广播词语音文件并播放；

其中，所述模板文件包括：广播内容常量信息和广播内容变量链接；

2.根据权利要求1所述的方法，其特征在于，所述获取预设的广播信息之前还包括：

根据列车时刻表和广播信息的类别，存储所述广播信息；

3.根据权利要求2所述的方法，其特征在于，

4.根据权利要求2所述的方法，其特征在于，

所述模板文件还包括：一个以上语言标识；

5.根据权利要求2所述的方法，其特征在于，

所述广播信息还包括：附加信息；

6.根据权利要求3至5中任意一项所述的方法，其特征在于，所述从语音库获取所述广播内容常量信息和所述广播内容变量链接对应的语音元素包括：

7.一种语音广播系统，其特征在于，包括：

播放设备，用于播放所述广播词语音文件；

所述广播词合成模块具体用于将所述变量信息加入所述广播内容变量链接；或者，所述系统还包括：简称变量模块，用于存储相似变量信息与简称变量信息的对应关系；所述广播词合成模块还用于获取所述变量信息中的相似变量信息，根据所述相似变量信息查询所述简称变量模块，获取所述相似变量信息对应的简称变量信息，根据所述简称变量信息和所述模板文件，合成广播词文本文件；

所述TTS引擎模块具体用于从语音库获取广播内容常量信息和广播内容变量链接对应的语音元素，采用引擎算法根据语音元素合成广播词语音文件。

8.根据权利要求7所述的系统，其特征在于，还包括：