CN115580742A

CN115580742A - 一种声文同步的广播方法及广播系统

Info

Publication number: CN115580742A
Application number: CN202211246920.2A
Authority: CN
Inventors: 邓红星; 王子兵; 林弟; 明德; 张常华; 朱正辉; 赵定金
Original assignee: Guangzhou Baolun Electronics Co Ltd
Current assignee: Guangzhou Baolun Electronics Co Ltd
Priority date: 2022-10-12
Filing date: 2022-10-12
Publication date: 2023-01-06
Anticipated expiration: 2042-10-12
Also published as: CN115580742B

Abstract

本发明公开一种声文同步的广播方法及广播系统，所述方法包括：获取用户根据LED终端样式制定的文本切分规则、语音合成规则和播报内容；根据所述语音合成规则将所述播报内容合成播报语音；根据所述语音合成规则中的定义语速、展示字符数对所述播报语音进行分段并设置时间节点，并将分段后的所述播报语音推流至音频设备进行声音播放；将当前对所述音频设备的推流时长与全部时间节点进行匹配，当推流时长与一个时间节点匹配时，将所述时间节点对应的播报语音分段中的文本内容推送到LED终端进行文本播放。采用本发明，能利用文本合成语音，并在播报时通过时间点匹配同步在LED屏上展示。

Description

一种声文同步的广播方法及广播系统

技术领域

本发明涉及广播技术领域，尤其涉及一种声文同步的广播方法及系统。

背景技术

DMB全称为数字多媒体广播(Digital Multimedia Broadcasting)。DMB广播可以传输文字、图像、音视频等业务，具有节省频谱资源、发射功率低信息量大和CD音质等优点。DMB作为通用多媒体信息传输技术，可以广泛用于各行各业，如学校的管理和电教、宣传，景区信息宣传和公共安全提示等，DMB在社区、学校等单位中逐步普及。LED点阵屏是利用LED点阵模块或像素单元组成的平面式点阵屏幕，广泛应用于政府、医院、景区，校园等地方，起到宣传、警示、提示等作用。如今，LED点阵屏从单色点阵屏，双基色屏发展到全彩屏多灰度点阵屏，在色彩、亮度等方面都有了很大的提升，带给人们很好的视觉效果。

但是，现有数字多媒体广播只实现了声文播报，播放和文本展示的内容不一样，led只起到文本展示作用，并不能配合声音播放一起播放相同内容，由于播放和文本展示的内容不一样，容易混淆接听者的接听信息，对于耳聋或者失明患者而言，更难以辨别信息的时效性。

发明内容

本发明实施例提供一种声文同步的广播方法及广播系统，能利用文本合成语音，并在播报时通过时间点匹配同步在led屏上展示。

为实现上述目的，本申请实施例的第一方面提供一种声文同步的广播方法，包括：

获取用户根据LED终端样式制定的文本切分规则、语音合成规则和播报内容；所述LED终端样式决定展示字符数，所述展示字符数决定所述文本切分规则中时间节点的设置方式；

根据所述语音合成规则将所述播报内容合成播报语音；

根据所述语音合成规则中的定义语速、展示字符数对所述播报语音进行分段并设置时间节点，并将分段后的所述播报语音推流至音频设备进行声音播放；每个时间节点对应一个播报语音分段；

将当前对所述音频设备的推流时长与全部时间节点进行匹配，当推流时长与一个时间节点匹配时，将所述时间节点对应的播报语音分段中的文本内容推送到LED终端进行文本播放。

在第一方面的一种可能的实现方式中，所述根据所述语音合成规则中的定义语速、展示字符数对所述播报语音进行分段并设置时间节点，具体包括：

根据所述语音合成规则中的定义语速计算所述播报语音的总时长；

根据所述播报内容的字符总数与所述展示字符数，计算播报语音的分段数；

根据所述播报语音的总时长和分段数，计算每个播报语音分段时长，并对每个播报语音分段加上时间节点。

在第一方面的一种可能的实现方式中，所述并将分段后的所述播报语音推流至音频设备进行声音播放，具体包括：

建立推流的循环线程；循环线程中循环次数等于媒体文件的帧数，所述媒体文件是指音频设备与服务之间传递信息的文件；

根据固定的循环间隔时间和循环次数，计算出当前对所述音频设备的推流时长。

在第一方面的一种可能的实现方式中，所述媒体文件包括PCM格式、MP3格式和ACC格式。

在第一方面的一种可能的实现方式中，所述语音合成规则的参数包括：合成语音的定义语速、采用的声音引擎、合成增益和合成音量。

在第一方面的一种可能的实现方式中，将所述时间节点对应的播报语音分段中的文本内容推送到LED终端进行文本播放，具体包括:

提取所述时间节点对应的播报语音分段中的文本内容；

根据用户预设置将所述文本内容转换成设置约定协议；

向LED终端推送所述文本内容和所述约定协议，使LED终端按照约定协议进行文本播放。

在第一方面的一种可能的实现方式中，所述文本切分规则具体为：根据展示字符数，对播报内容的文本进行分段，每段分段文本的字符数等于展示字符数。

在第一方面的一种可能的实现方式中，所述约定协议包括字体大小、当前展示的文字、字体颜色和最大展示字符数。

本申请实施例的第二方面提供一种声文同步的广播系统，包括客户端、服务器、音频设备和LED终端；所述服务器与和所述客户端通信连接；

所述客户端用于，根据LED终端样式制定的文本切分规则、语音合成规则和播报内容；所述LED终端样式决定展示字符数，所述展示字符数决定所述文本切分规则中时间节点的设置方式；

所述服务器用于，根据所述语音合成规则将所述播报内容合成播报语音；

所述服务器还用于，根据所述语音合成规则中的定义语速、展示字符数对所述播报语音进行分段并设置时间节点，并将分段后的所述播报语音推流至音频设备进行声音播放；每个时间节点对应一个播报语音分段；

所述服务器还用于，将当前对所述音频设备的推流时长与全部时间节点进行匹配，当推流时长与一个时间节点匹配时，将所述时间节点对应的播报语音分段中的文本内容推送到LED终端进行文本播放。

相比于现有技术，本发明实施例提供的一种声文同步的广播方法及广播系统，根据所述语音合成规则中的定义语速、展示字符数对所述播报语音进行分段并设置时间节点，并将分段后的所述播报语音推流至音频设备进行声音播放；将当前对所述音频设备的推流时长与全部时间节点进行匹配，当推流时长与一个时间节点匹配时，将所述时间节点对应的播报语音分段中的文本内容推送到LED终端进行文本播放。换言之，LED终端播放进行文本播放时播放语音分段的时间节点对应的现实时间与音频设备进行声音播放时推流时长对应的现实时间是一致的，播报时同步在LED屏上展示相应文本，可为听力弱的群体或实力差的群体提供较好的体验。

附图说明

图1是本发明一实施例提供的一种声文同步的广播方法的流程示意图；

图2是本发明一实施例中服务器与LED终端之间约定协议的格式示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参见图1，本发明一实施例提供一种声文同步的广播方法，包括：

S10、获取用户根据LED终端样式制定的文本切分规则、语音合成规则和播报内容；所述LED终端样式决定展示字符数，所述展示字符数决定所述文本切分规则中时间节点的设置方式。

S11、根据所述语音合成规则将所述播报内容合成播报语音。

S12、根据所述语音合成规则中的定义语速、展示字符数对所述播报语音进行分段并设置时间节点，并将分段后的所述播报语音推流至音频设备进行声音播放；每个时间节点对应一个播报语音分段，每一个播报语音分段对应一个所述播报内容的文本分段。

S13、将当前对所述音频设备的推流时长与全部时间节点进行匹配，当推流时长与一个时间节点匹配时，将所述时间节点对应的文本分段推送到LED终端进行文本播放。

获取用户提供的文本切分规则、语音合成规则和播报内容后，按照语音合成规则把播报内容合成语音，并把合成的播报语音按照一定的规则分割成多段语音，按照播报语音分段的长度在每段语音分段对应节点打上时间标志(用于之后的推流进行同步推送)。

在推送流信息时，监控当前推流的时长，使用当前时长去匹配节点里的时间标志，当有符合的节点时，把节点内的文本提取处理推送到LED终端进行展示。

示例性地，所述根据所述语音合成规则中的定义语速、展示字符数对所述播报语音进行分段并设置时间节点，具体包括：

语音合成规则需要设定定义语速、声音引擎、增益、音量，其中，定义语速不同，生成后的播报语音长度不同，那么播报语音对应的文本切分成段后对应的时间节点就不同，以展示字符数为10时为例：语速1：572ms/字、语速2：460ms/字，语速3：235ms/字。使用语速3合成一百字的语音，那么语音时长为100X235ms＝23500ms(23.5s),按照10个字符切割的规则，第一段文字是在0-2.35s，第二段文字是2.35-4.70s，第三段文字是7.05s以此类推。

一般而言，展示字符数是根据LED终端字体显示数量设定的，进而根据展示字符数(如：一次显示10个字符)去切分播报内容中的文本(如：1402字符)：1402/10＝140余2，共分成141段。

由于每个时间节点对应一个播报语音分段，每一个播报语音分段对应一个所述播报内容的文本分段，因此每一个播报语音分段、播报语音分段对应的播报内容的文本分段都会加上(对应)一个时间节点。

示例性地，所述并将分段后的所述播报语音推流至音频设备进行声音播放，具体包括：

在程序内部会创建一个推流的循环线程，循环的次数是媒体文件的帧数，如：媒体文件一共40000帧，那么就需要循环40000次，而每次循环的时长就根据媒体文件读取出来的数据流决定(补充4)，假设每次是20ms，那么图上的第一段文本就会在推流的一开始就同时发送到LED终端，那么在循环到60次时(1s200ms＝1200ms＝1200/20)就推送第二段文字,循环到240次时(4s800ms＝4800ms＝4800/20)就推送第三段文字，以此类推，应为推的帧数和循环的次数相同，并且每次循环的间隔时间也是一样的(例如：20ms)那么就可以计算出当前的播放时长(播放到第几毫秒)。

示例性地，所述媒体文件包括PCM格式、MP3格式和ACC格式。

1、PCM格式：假设音频采样率＝9000，采样通道＝2，位深度＝8，采样间隔＝20ms；

计算一秒钟总的数据量，采样间隔采用20ms，每秒钟需采集50次(1s＝1000ms)，那么：

一秒钟总的数据量＝9000*2*8/8＝18000(Byte)；

每帧音频数据大小＝18000/50＝360(Byte)；

每个通道样本数＝360/2＝180(Byte)；

2、MP3格式：帧大小1152个sample，采样率为44100Hz,帧播放时长:mp3dur＝1152/44100＝0.02608s＝26.08ms；

3、ACC格式：帧大小1024个sample，采样率为44100Hz,帧播放时长：accdur＝1024/44100＝0.02322s＝23.22ms。

示例性地，所述将所述时间节点对应的播报语音分段中的文本内容推送到LED终端进行文本播放，具体包括:

提取所述时间节点对应的播报语音分段中的文本内容；

根据用户预设置将所述文本内容转换成设置约定协议；

LED终端和服务器之间通信遵循约定协议，约定协议一般需要包括：字体大小(fontSize)，当前展示的文字(text)，字体颜色(fontColor)，最大显示字符数(maxAmount)等，都是在协议内，如图2所示。

示例性地，所述文本切分规则具体为：根据展示字符数，对播报内容的文本进行分段，每段分段文本的字符数等于展示字符数。

示例性地，所述约定协议包括字体大小、当前展示的文字、字体颜色和最大展示字符数。

示例性地，所述语音合成规则的参数包括：合成语音的定义语速、采用的声音引擎、合成增益和合成音量。

合成语音时需要指定：定义语速(1/2/3/4/5/6)，语音引擎(男声、女声、XXX的声音等)，音量和增益(增益极小就是清音，大点就是过载，再大就是失真)。

相比于现有技术，本发明实施例提供的一种声文同步的广播方法，根据所述语音合成规则中的定义语速、展示字符数对所述播报语音进行分段并设置时间节点，并将分段后的所述播报语音推流至音频设备进行声音播放；将当前对所述音频设备的推流时长与全部时间节点进行匹配，当推流时长与一个时间节点匹配时，将所述时间节点对应的播报语音分段中的文本内容推送到LED终端进行文本播放。换言之，LED终端播放进行文本播放时播放语音分段的时间节点对应的现实时间与音频设备进行声音播放时推流时长对应的现实时间是一致的，播报时同步在led屏上展示相应文本，可为听力弱的群体或实力差的群体提供较好的体验。所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的装置的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赞述。

本申请一实施例提供一种声文同步的广播系统，包括客户端、服务器、音频设备和LED终端；所述服务器与和所述客户端通信连接。

所述客户端用于，根据LED终端样式制定的文本切分规则、语音合成规则和播报内容；所述LED终端样式决定展示字符数，所述展示字符数决定所述文本切分规则中时间节点的设置方式。

所述服务器用于，根据所述语音合成规则将所述播报内容合成播报语音。

所述服务器还用于，根据所述语音合成规则中的定义语速、展示字符数对所述播报语音进行分段并设置时间节点，并将分段后的所述播报语音推流至音频设备进行声音播放；每个时间节点对应一个播报语音分段。

音频设备只有声音大小可以设置，声音大小不会对同步有影响。

在LED终端可以控制播放终端音量的大小，LED终端字体样式，大小，颜色，屏幕信息刷新方向(上下、左右),字体显示数量。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赞述。

相比于现有技术，本发明实施例提供的一种声文同步的广播系统，根据所述语音合成规则中的定义语速、展示字符数对所述播报语音进行分段并设置时间节点，并将分段后的所述播报语音推流至音频设备进行声音播放；将当前对所述音频设备的推流时长与全部时间节点进行匹配，当推流时长与一个时间节点匹配时，将所述时间节点对应的播报语音分段中的文本内容推送到LED终端进行文本播放。换言之，LED终端播放进行文本播放时播放语音分段的时间节点对应的现实时间与音频设备进行声音播放时推流时长对应的现实时间是一致的，播报时同步在LED屏上展示相应文本，可为听力弱的群体或实力差的群体提供较好的体验。

以上所述是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也视为本发明的保护范围。

Claims

1.一种声文同步的广播方法，其特征在于，包括：

根据所述语音合成规则将所述播报内容合成播报语音；

根据所述语音合成规则中的定义语速、展示字符数对所述播报语音进行分段并设置时间节点，并将分段后的所述播报语音推流至音频设备进行声音播放；每个时间节点对应一个播报语音分段，每一个播报语音分段对应一个所述播报内容的文本分段；

将当前对所述音频设备的推流时长与全部时间节点进行匹配，当推流时长与一个时间节点匹配时，将所述时间节点对应的文本分段推送到LED终端进行文本播放。

2.如权利要求1所述声文同步的广播方法，其特征在于，所述根据所述语音合成规则中的定义语速、展示字符数对所述播报语音进行分段并设置时间节点，具体包括：

3.如权利要求1所述声文同步的广播方法，其特征在于，所述并将分段后的所述播报语音推流至音频设备进行声音播放，具体包括：

4.如权利要求3所述声文同步的广播方法，其特征在于，所述媒体文件包括PCM格式、MP3格式和ACC格式。

5.如权利要求1所述声文同步的广播方法，其特征在于，所述将所述时间节点对应的播报语音分段中的文本内容推送到LED终端进行文本播放，具体包括:

提取所述时间节点对应的播报语音分段中的文本内容；

根据用户预设置将所述文本内容转换成设置约定协议；

6.如权利要求5所述声文同步的广播方法，其特征在于，所述约定协议包括字体大小、当前展示的文字、字体颜色和最大展示字符数。

7.如权利要求1所述声文同步的广播方法，其特征在于，所述文本切分规则具体为：

根据展示字符数，对播报内容的文本进行分段，每段分段文本的字符数等于展示字符数。

8.如权利要求1所述声文同步的广播方法，其特征在于，所述语音合成规则的参数包括：合成语音的定义语速、采用的声音引擎、合成增益和合成音量。

9.一种声文同步的广播系统，其特征在于，包括客户端、服务器、音频设备和LED终端；所述服务器与和所述客户端通信连接；

所述服务器还用于，根据所述语音合成规则中的定义语速、展示字符数对所述播报语音进行分段并设置时间节点，并将分段后的所述播报语音推流至音频设备进行声音播放；每个时间节点对应一个播报语音分段，每一个播报语音分段对应一个所述播报内容的文本分段；

所述服务器还用于，将当前对所述音频设备的推流时长与全部时间节点进行匹配，当推流时长与一个时间节点匹配时，将所述时间节点对应的文本分段推送到LED终端进行文本播放。