CN115580742A - 一种声文同步的广播方法及广播系统 - Google Patents
一种声文同步的广播方法及广播系统 Download PDFInfo
- Publication number
- CN115580742A CN115580742A CN202211246920.2A CN202211246920A CN115580742A CN 115580742 A CN115580742 A CN 115580742A CN 202211246920 A CN202211246920 A CN 202211246920A CN 115580742 A CN115580742 A CN 115580742A
- Authority
- CN
- China
- Prior art keywords
- text
- voice
- broadcast
- time
- pushing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 25
- 230000001360 synchronised effect Effects 0.000 title claims description 9
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 42
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 42
- 230000011218 segmentation Effects 0.000 claims abstract description 18
- 230000002194 synthesizing effect Effects 0.000 claims abstract description 9
- 238000004891 communication Methods 0.000 claims description 4
- 239000011159 matrix material Substances 0.000 description 6
- 238000005070 sampling Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 2
- 206010011878 Deafness Diseases 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/4302—Content synchronisation processes, e.g. decoder synchronisation
- H04N21/4307—Synchronising the rendering of multiple content streams or additional data on devices, e.g. synchronisation of audio on a mobile phone with the video output on the TV screen
- H04N21/43072—Synchronising the rendering of multiple content streams or additional data on devices, e.g. synchronisation of audio on a mobile phone with the video output on the TV screen of multiple content streams on the same device
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/439—Processing of audio elementary streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/488—Data services, e.g. news ticker
- H04N21/4888—Data services, e.g. news ticker for displaying teletext characters
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/60—Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client
- H04N21/63—Control signaling related to video distribution between client, server and network components; Network processes for video distribution between server and clients or between remote clients, e.g. transmitting basic layer and enhancement layers over different transmission paths, setting up a peer-to-peer communication via Internet between remote STB's; Communication protocols; Addressing
- H04N21/64—Addressing
- H04N21/6405—Multicasting
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/83—Generation or processing of protective or descriptive data associated with content; Content structuring
- H04N21/845—Structuring of content, e.g. decomposing content into time segments
- H04N21/8456—Structuring of content, e.g. decomposing content into time segments by decomposing the content in the time domain, e.g. in time segments
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Telephonic Communication Services (AREA)
- Circuits Of Receivers In General (AREA)
Abstract
本发明公开一种声文同步的广播方法及广播系统,所述方法包括:获取用户根据LED终端样式制定的文本切分规则、语音合成规则和播报内容;根据所述语音合成规则将所述播报内容合成播报语音;根据所述语音合成规则中的定义语速、展示字符数对所述播报语音进行分段并设置时间节点,并将分段后的所述播报语音推流至音频设备进行声音播放;将当前对所述音频设备的推流时长与全部时间节点进行匹配,当推流时长与一个时间节点匹配时,将所述时间节点对应的播报语音分段中的文本内容推送到LED终端进行文本播放。采用本发明,能利用文本合成语音,并在播报时通过时间点匹配同步在LED屏上展示。
Description
技术领域
本发明涉及广播技术领域,尤其涉及一种声文同步的广播方法及系统。
背景技术
DMB全称为数字多媒体广播(Digital Multimedia Broadcasting)。DMB广播可以传输文字、图像、音视频等业务,具有节省频谱资源、发射功率低信息量大和CD音质等优点。DMB作为通用多媒体信息传输技术,可以广泛用于各行各业,如学校的管理和电教、宣传,景区信息宣传和公共安全提示等,DMB在社区、学校等单位中逐步普及。LED点阵屏是利用LED点阵模块或像素单元组成的平面式点阵屏幕,广泛应用于政府、医院、景区,校园等地方,起到宣传、警示、提示等作用。如今,LED点阵屏从单色点阵屏,双基色屏发展到全彩屏多灰度点阵屏,在色彩、亮度等方面都有了很大的提升,带给人们很好的视觉效果。
但是,现有数字多媒体广播只实现了声文播报,播放和文本展示的内容不一样,led只起到文本展示作用,并不能配合声音播放一起播放相同内容,由于播放和文本展示的内容不一样,容易混淆接听者的接听信息,对于耳聋或者失明患者而言,更难以辨别信息的时效性。
发明内容
本发明实施例提供一种声文同步的广播方法及广播系统,能利用文本合成语音,并在播报时通过时间点匹配同步在led屏上展示。
为实现上述目的,本申请实施例的第一方面提供一种声文同步的广播方法,包括:
获取用户根据LED终端样式制定的文本切分规则、语音合成规则和播报内容;所述LED终端样式决定展示字符数,所述展示字符数决定所述文本切分规则中时间节点的设置方式;
根据所述语音合成规则将所述播报内容合成播报语音;
根据所述语音合成规则中的定义语速、展示字符数对所述播报语音进行分段并设置时间节点,并将分段后的所述播报语音推流至音频设备进行声音播放;每个时间节点对应一个播报语音分段;
将当前对所述音频设备的推流时长与全部时间节点进行匹配,当推流时长与一个时间节点匹配时,将所述时间节点对应的播报语音分段中的文本内容推送到LED终端进行文本播放。
在第一方面的一种可能的实现方式中,所述根据所述语音合成规则中的定义语速、展示字符数对所述播报语音进行分段并设置时间节点,具体包括:
根据所述语音合成规则中的定义语速计算所述播报语音的总时长;
根据所述播报内容的字符总数与所述展示字符数,计算播报语音的分段数;
根据所述播报语音的总时长和分段数,计算每个播报语音分段时长,并对每个播报语音分段加上时间节点。
在第一方面的一种可能的实现方式中,所述并将分段后的所述播报语音推流至音频设备进行声音播放,具体包括:
建立推流的循环线程;循环线程中循环次数等于媒体文件的帧数,所述媒体文件是指音频设备与服务之间传递信息的文件;
根据固定的循环间隔时间和循环次数,计算出当前对所述音频设备的推流时长。
在第一方面的一种可能的实现方式中,所述媒体文件包括PCM格式、MP3格式和ACC格式。
在第一方面的一种可能的实现方式中,所述语音合成规则的参数包括:合成语音的定义语速、采用的声音引擎、合成增益和合成音量。
在第一方面的一种可能的实现方式中,将所述时间节点对应的播报语音分段中的文本内容推送到LED终端进行文本播放,具体包括:
提取所述时间节点对应的播报语音分段中的文本内容;
根据用户预设置将所述文本内容转换成设置约定协议;
向LED终端推送所述文本内容和所述约定协议,使LED终端按照约定协议进行文本播放。
在第一方面的一种可能的实现方式中,所述文本切分规则具体为:根据展示字符数,对播报内容的文本进行分段,每段分段文本的字符数等于展示字符数。
在第一方面的一种可能的实现方式中,所述约定协议包括字体大小、当前展示的文字、字体颜色和最大展示字符数。
本申请实施例的第二方面提供一种声文同步的广播系统,包括客户端、服务器、音频设备和LED终端;所述服务器与和所述客户端通信连接;
所述客户端用于,根据LED终端样式制定的文本切分规则、语音合成规则和播报内容;所述LED终端样式决定展示字符数,所述展示字符数决定所述文本切分规则中时间节点的设置方式;
所述服务器用于,根据所述语音合成规则将所述播报内容合成播报语音;
所述服务器还用于,根据所述语音合成规则中的定义语速、展示字符数对所述播报语音进行分段并设置时间节点,并将分段后的所述播报语音推流至音频设备进行声音播放;每个时间节点对应一个播报语音分段;
所述服务器还用于,将当前对所述音频设备的推流时长与全部时间节点进行匹配,当推流时长与一个时间节点匹配时,将所述时间节点对应的播报语音分段中的文本内容推送到LED终端进行文本播放。
相比于现有技术,本发明实施例提供的一种声文同步的广播方法及广播系统,根据所述语音合成规则中的定义语速、展示字符数对所述播报语音进行分段并设置时间节点,并将分段后的所述播报语音推流至音频设备进行声音播放;将当前对所述音频设备的推流时长与全部时间节点进行匹配,当推流时长与一个时间节点匹配时,将所述时间节点对应的播报语音分段中的文本内容推送到LED终端进行文本播放。换言之,LED终端播放进行文本播放时播放语音分段的时间节点对应的现实时间与音频设备进行声音播放时推流时长对应的现实时间是一致的,播报时同步在LED屏上展示相应文本,可为听力弱的群体或实力差的群体提供较好的体验。
附图说明
图1是本发明一实施例提供的一种声文同步的广播方法的流程示意图;
图2是本发明一实施例中服务器与LED终端之间约定协议的格式示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参见图1,本发明一实施例提供一种声文同步的广播方法,包括:
S10、获取用户根据LED终端样式制定的文本切分规则、语音合成规则和播报内容;所述LED终端样式决定展示字符数,所述展示字符数决定所述文本切分规则中时间节点的设置方式。
S11、根据所述语音合成规则将所述播报内容合成播报语音。
S12、根据所述语音合成规则中的定义语速、展示字符数对所述播报语音进行分段并设置时间节点,并将分段后的所述播报语音推流至音频设备进行声音播放;每个时间节点对应一个播报语音分段,每一个播报语音分段对应一个所述播报内容的文本分段。
S13、将当前对所述音频设备的推流时长与全部时间节点进行匹配,当推流时长与一个时间节点匹配时,将所述时间节点对应的文本分段推送到LED终端进行文本播放。
获取用户提供的文本切分规则、语音合成规则和播报内容后,按照语音合成规则把播报内容合成语音,并把合成的播报语音按照一定的规则分割成多段语音,按照播报语音分段的长度在每段语音分段对应节点打上时间标志(用于之后的推流进行同步推送)。
在推送流信息时,监控当前推流的时长,使用当前时长去匹配节点里的时间标志,当有符合的节点时,把节点内的文本提取处理推送到LED终端进行展示。
示例性地,所述根据所述语音合成规则中的定义语速、展示字符数对所述播报语音进行分段并设置时间节点,具体包括:
根据所述语音合成规则中的定义语速计算所述播报语音的总时长;
根据所述播报内容的字符总数与所述展示字符数,计算播报语音的分段数;
根据所述播报语音的总时长和分段数,计算每个播报语音分段时长,并对每个播报语音分段加上时间节点。
语音合成规则需要设定定义语速、声音引擎、增益、音量,其中,定义语速不同,生成后的播报语音长度不同,那么播报语音对应的文本切分成段后对应的时间节点就不同,以展示字符数为10时为例:语速1:572ms/字、语速2:460ms/字,语速3:235ms/字。使用语速3合成一百字的语音,那么语音时长为100X235ms=23500ms(23.5s),按照10个字符切割的规则,第一段文字是在0-2.35s,第二段文字是2.35-4.70s,第三段文字是7.05s以此类推。
一般而言,展示字符数是根据LED终端字体显示数量设定的,进而根据展示字符数(如:一次显示10个字符)去切分播报内容中的文本(如:1402字符):1402/10=140余2,共分成141段。
由于每个时间节点对应一个播报语音分段,每一个播报语音分段对应一个所述播报内容的文本分段,因此每一个播报语音分段、播报语音分段对应的播报内容的文本分段都会加上(对应)一个时间节点。
示例性地,所述并将分段后的所述播报语音推流至音频设备进行声音播放,具体包括:
建立推流的循环线程;循环线程中循环次数等于媒体文件的帧数,所述媒体文件是指音频设备与服务之间传递信息的文件;
根据固定的循环间隔时间和循环次数,计算出当前对所述音频设备的推流时长。
在程序内部会创建一个推流的循环线程,循环的次数是媒体文件的帧数,如:媒体文件一共40000帧,那么就需要循环40000次,而每次循环的时长就根据媒体文件读取出来的数据流决定(补充4),假设每次是20ms,那么图上的第一段文本就会在推流的一开始就同时发送到LED终端,那么在循环到60次时(1s200ms=1200ms=1200/20)就推送第二段文字,循环到240次时(4s800ms=4800ms=4800/20)就推送第三段文字,以此类推,应为推的帧数和循环的次数相同,并且每次循环的间隔时间也是一样的(例如:20ms)那么就可以计算出当前的播放时长(播放到第几毫秒)。
示例性地,所述媒体文件包括PCM格式、MP3格式和ACC格式。
1、PCM格式:假设音频采样率=9000,采样通道=2,位深度=8,采样间隔=20ms;
计算一秒钟总的数据量,采样间隔采用20ms,每秒钟需采集50次(1s=1000ms),那么:
一秒钟总的数据量=9000*2*8/8=18000(Byte);
每帧音频数据大小=18000/50=360(Byte);
每个通道样本数=360/2=180(Byte);
2、MP3格式:帧大小1152个sample,采样率为44100Hz,帧播放时长:mp3dur=1152/44100=0.02608s=26.08ms;
3、ACC格式:帧大小1024个sample,采样率为44100Hz,帧播放时长:accdur=1024/44100=0.02322s=23.22ms。
示例性地,所述将所述时间节点对应的播报语音分段中的文本内容推送到LED终端进行文本播放,具体包括:
提取所述时间节点对应的播报语音分段中的文本内容;
根据用户预设置将所述文本内容转换成设置约定协议;
向LED终端推送所述文本内容和所述约定协议,使LED终端按照约定协议进行文本播放。
LED终端和服务器之间通信遵循约定协议,约定协议一般需要包括:字体大小(fontSize),当前展示的文字(text),字体颜色(fontColor),最大显示字符数(maxAmount)等,都是在协议内,如图2所示。
示例性地,所述文本切分规则具体为:根据展示字符数,对播报内容的文本进行分段,每段分段文本的字符数等于展示字符数。
示例性地,所述约定协议包括字体大小、当前展示的文字、字体颜色和最大展示字符数。
示例性地,所述语音合成规则的参数包括:合成语音的定义语速、采用的声音引擎、合成增益和合成音量。
合成语音时需要指定:定义语速(1/2/3/4/5/6),语音引擎(男声、女声、XXX的声音等),音量和增益(增益极小就是清音,大点就是过载,再大就是失真)。
相比于现有技术,本发明实施例提供的一种声文同步的广播方法,根据所述语音合成规则中的定义语速、展示字符数对所述播报语音进行分段并设置时间节点,并将分段后的所述播报语音推流至音频设备进行声音播放;将当前对所述音频设备的推流时长与全部时间节点进行匹配,当推流时长与一个时间节点匹配时,将所述时间节点对应的播报语音分段中的文本内容推送到LED终端进行文本播放。换言之,LED终端播放进行文本播放时播放语音分段的时间节点对应的现实时间与音频设备进行声音播放时推流时长对应的现实时间是一致的,播报时同步在led屏上展示相应文本,可为听力弱的群体或实力差的群体提供较好的体验。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赞述。
本申请一实施例提供一种声文同步的广播系统,包括客户端、服务器、音频设备和LED终端;所述服务器与和所述客户端通信连接。
所述客户端用于,根据LED终端样式制定的文本切分规则、语音合成规则和播报内容;所述LED终端样式决定展示字符数,所述展示字符数决定所述文本切分规则中时间节点的设置方式。
所述服务器用于,根据所述语音合成规则将所述播报内容合成播报语音。
所述服务器还用于,根据所述语音合成规则中的定义语速、展示字符数对所述播报语音进行分段并设置时间节点,并将分段后的所述播报语音推流至音频设备进行声音播放;每个时间节点对应一个播报语音分段。
所述服务器还用于,将当前对所述音频设备的推流时长与全部时间节点进行匹配,当推流时长与一个时间节点匹配时,将所述时间节点对应的播报语音分段中的文本内容推送到LED终端进行文本播放。
音频设备只有声音大小可以设置,声音大小不会对同步有影响。
在LED终端可以控制播放终端音量的大小,LED终端字体样式,大小,颜色,屏幕信息刷新方向(上下、左右),字体显示数量。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赞述。
相比于现有技术,本发明实施例提供的一种声文同步的广播系统,根据所述语音合成规则中的定义语速、展示字符数对所述播报语音进行分段并设置时间节点,并将分段后的所述播报语音推流至音频设备进行声音播放;将当前对所述音频设备的推流时长与全部时间节点进行匹配,当推流时长与一个时间节点匹配时,将所述时间节点对应的播报语音分段中的文本内容推送到LED终端进行文本播放。换言之,LED终端播放进行文本播放时播放语音分段的时间节点对应的现实时间与音频设备进行声音播放时推流时长对应的现实时间是一致的,播报时同步在LED屏上展示相应文本,可为听力弱的群体或实力差的群体提供较好的体验。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。
Claims (9)
1.一种声文同步的广播方法,其特征在于,包括:
获取用户根据LED终端样式制定的文本切分规则、语音合成规则和播报内容;所述LED终端样式决定展示字符数,所述展示字符数决定所述文本切分规则中时间节点的设置方式;
根据所述语音合成规则将所述播报内容合成播报语音;
根据所述语音合成规则中的定义语速、展示字符数对所述播报语音进行分段并设置时间节点,并将分段后的所述播报语音推流至音频设备进行声音播放;每个时间节点对应一个播报语音分段,每一个播报语音分段对应一个所述播报内容的文本分段;
将当前对所述音频设备的推流时长与全部时间节点进行匹配,当推流时长与一个时间节点匹配时,将所述时间节点对应的文本分段推送到LED终端进行文本播放。
2.如权利要求1所述声文同步的广播方法,其特征在于,所述根据所述语音合成规则中的定义语速、展示字符数对所述播报语音进行分段并设置时间节点,具体包括:
根据所述语音合成规则中的定义语速计算所述播报语音的总时长;
根据所述播报内容的字符总数与所述展示字符数,计算播报语音的分段数;
根据所述播报语音的总时长和分段数,计算每个播报语音分段时长,并对每个播报语音分段加上时间节点。
3.如权利要求1所述声文同步的广播方法,其特征在于,所述并将分段后的所述播报语音推流至音频设备进行声音播放,具体包括:
建立推流的循环线程;循环线程中循环次数等于媒体文件的帧数,所述媒体文件是指音频设备与服务之间传递信息的文件;
根据固定的循环间隔时间和循环次数,计算出当前对所述音频设备的推流时长。
4.如权利要求3所述声文同步的广播方法,其特征在于,所述媒体文件包括PCM格式、MP3格式和ACC格式。
5.如权利要求1所述声文同步的广播方法,其特征在于,所述将所述时间节点对应的播报语音分段中的文本内容推送到LED终端进行文本播放,具体包括:
提取所述时间节点对应的播报语音分段中的文本内容;
根据用户预设置将所述文本内容转换成设置约定协议;
向LED终端推送所述文本内容和所述约定协议,使LED终端按照约定协议进行文本播放。
6.如权利要求5所述声文同步的广播方法,其特征在于,所述约定协议包括字体大小、当前展示的文字、字体颜色和最大展示字符数。
7.如权利要求1所述声文同步的广播方法,其特征在于,所述文本切分规则具体为:
根据展示字符数,对播报内容的文本进行分段,每段分段文本的字符数等于展示字符数。
8.如权利要求1所述声文同步的广播方法,其特征在于,所述语音合成规则的参数包括:合成语音的定义语速、采用的声音引擎、合成增益和合成音量。
9.一种声文同步的广播系统,其特征在于,包括客户端、服务器、音频设备和LED终端;所述服务器与和所述客户端通信连接;
所述客户端用于,根据LED终端样式制定的文本切分规则、语音合成规则和播报内容;所述LED终端样式决定展示字符数,所述展示字符数决定所述文本切分规则中时间节点的设置方式;
所述服务器用于,根据所述语音合成规则将所述播报内容合成播报语音;
所述服务器还用于,根据所述语音合成规则中的定义语速、展示字符数对所述播报语音进行分段并设置时间节点,并将分段后的所述播报语音推流至音频设备进行声音播放;每个时间节点对应一个播报语音分段,每一个播报语音分段对应一个所述播报内容的文本分段;
所述服务器还用于,将当前对所述音频设备的推流时长与全部时间节点进行匹配,当推流时长与一个时间节点匹配时,将所述时间节点对应的文本分段推送到LED终端进行文本播放。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211246920.2A CN115580742B (zh) | 2022-10-12 | 2022-10-12 | 一种声文同步的广播方法及广播系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211246920.2A CN115580742B (zh) | 2022-10-12 | 2022-10-12 | 一种声文同步的广播方法及广播系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115580742A true CN115580742A (zh) | 2023-01-06 |
CN115580742B CN115580742B (zh) | 2023-05-16 |
Family
ID=84585526
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211246920.2A Active CN115580742B (zh) | 2022-10-12 | 2022-10-12 | 一种声文同步的广播方法及广播系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115580742B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101751630A (zh) * | 2008-12-02 | 2010-06-23 | 厦门雅迅网络股份有限公司 | 一种远程控制车载led屏播放文字广告的方法 |
WO2015037871A1 (ko) * | 2013-09-10 | 2015-03-19 | Kim Kyung-Cheol | 텍스트 인식을 이용한 음성재생 서비스 제공 시스템, 서버 및 단말 |
CN104519403A (zh) * | 2014-12-25 | 2015-04-15 | 西安诺瓦电子科技有限公司 | 一种音频控制装置及方法 |
CN106856091A (zh) * | 2016-12-21 | 2017-06-16 | 北京智能管家科技有限公司 | 一种多语言文本的自动播报方法及系统 |
CN110176235A (zh) * | 2019-05-23 | 2019-08-27 | 腾讯科技(深圳)有限公司 | 语音识别文的展示方法、装置、存储介质和计算机设备 |
CN110797003A (zh) * | 2019-10-30 | 2020-02-14 | 合肥名阳信息技术有限公司 | 一种文本转语音显示字幕信息的方法 |
CN114564165A (zh) * | 2022-02-23 | 2022-05-31 | 成都智元汇信息技术股份有限公司 | 基于公共交通的文本、音频自适应方法、显示终端、系统 |
-
2022
- 2022-10-12 CN CN202211246920.2A patent/CN115580742B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101751630A (zh) * | 2008-12-02 | 2010-06-23 | 厦门雅迅网络股份有限公司 | 一种远程控制车载led屏播放文字广告的方法 |
WO2015037871A1 (ko) * | 2013-09-10 | 2015-03-19 | Kim Kyung-Cheol | 텍스트 인식을 이용한 음성재생 서비스 제공 시스템, 서버 및 단말 |
CN104519403A (zh) * | 2014-12-25 | 2015-04-15 | 西安诺瓦电子科技有限公司 | 一种音频控制装置及方法 |
CN106856091A (zh) * | 2016-12-21 | 2017-06-16 | 北京智能管家科技有限公司 | 一种多语言文本的自动播报方法及系统 |
CN110176235A (zh) * | 2019-05-23 | 2019-08-27 | 腾讯科技(深圳)有限公司 | 语音识别文的展示方法、装置、存储介质和计算机设备 |
CN110797003A (zh) * | 2019-10-30 | 2020-02-14 | 合肥名阳信息技术有限公司 | 一种文本转语音显示字幕信息的方法 |
CN114564165A (zh) * | 2022-02-23 | 2022-05-31 | 成都智元汇信息技术股份有限公司 | 基于公共交通的文本、音频自适应方法、显示终端、系统 |
Also Published As
Publication number | Publication date |
---|---|
CN115580742B (zh) | 2023-05-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106303658B (zh) | 应用于视频直播的交互方法和装置 | |
EP2154885A1 (en) | A caption display method and a video communication system, apparatus | |
CN110784730B (zh) | 直播视频数据的传输方法、装置、设备和存储介质 | |
CN103988520B (zh) | 接收装置、控制接收装置的方法、分发装置、分发方法、分发系统 | |
CN102209227A (zh) | 在视频会议中增加翻译的方法和系统 | |
CN108924583B (zh) | 视频文件生成方法及其设备、系统、存储介质 | |
US20060106597A1 (en) | System and method for low bit-rate compression of combined speech and music | |
EP1903698A2 (en) | Method and apparatus for generating digital audio signals including images | |
CN108111872B (zh) | 一种音频直播系统 | |
JP2003299051A (ja) | 情報出力装置および情報出力方法 | |
CN114040255A (zh) | 直播字幕生成方法、系统、设备及存储介质 | |
JP4159043B2 (ja) | テレビジョン放送システム | |
CN114218413A (zh) | 一种用于视频播放视频剪辑的后台系统 | |
WO2021136334A1 (zh) | 视频生成方法和装置、电子设备以及计算机可读存储介质 | |
CN115580742B (zh) | 一种声文同步的广播方法及广播系统 | |
JP6876924B2 (ja) | 送信装置、送信方法、受信装置および受信方法 | |
US20020069414A1 (en) | Method for re-utilizing contents data for digital broadcasting and system therefor | |
EP3171610B1 (en) | Transmission device, transmission method, reception device, and reception method | |
CN106254962A (zh) | 一种直播客户端快速启动播放的方法及系统 | |
CN111031325A (zh) | 数据处理方法及系统 | |
CN112055253B (zh) | 独立字幕流的添加复用方法和装置 | |
KR100860376B1 (ko) | 분산되어 제공된 멀티미디어 오브젝트들을 동기시키기 위한시스템 및 관련 단말, 방법 그리고 컴퓨터 프로그램 제품 | |
US8781048B2 (en) | Apparatus for synchronization of audio data and visual data and method therefor | |
CN105812880B (zh) | 一种音频数据的展示方法及终端设备 | |
CN112995568B (zh) | 一种基于视频客服系统及构建方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: No. 56 Nanli East Road, Shiqi Town, Panyu District, Guangzhou City, Guangdong Province, 510000 Applicant after: Guangdong Baolun Electronics Co.,Ltd. Address before: No.19 Chuangyuan Road, Zhongcun street, Panyu District, Guangzhou, Guangdong 510000 Applicant before: GUANGZHOU ITC ELECTRONIC TECHNOLOGY Co.,Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |