CN111564153A - 广播电台智能主播音乐节目系统 - Google Patents

广播电台智能主播音乐节目系统 Download PDF

Info

Publication number
CN111564153A
CN111564153A CN202010253289.3A CN202010253289A CN111564153A CN 111564153 A CN111564153 A CN 111564153A CN 202010253289 A CN202010253289 A CN 202010253289A CN 111564153 A CN111564153 A CN 111564153A
Authority
CN
China
Prior art keywords
voice
unit
host
song
sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010253289.3A
Other languages
English (en)
Other versions
CN111564153B (zh
Inventor
李广达
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan Shengguang Information Technology Co ltd
Original Assignee
Hunan Shengguang Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan Shengguang Information Technology Co ltd filed Critical Hunan Shengguang Information Technology Co ltd
Priority to CN202010253289.3A priority Critical patent/CN111564153B/zh
Publication of CN111564153A publication Critical patent/CN111564153A/zh
Application granted granted Critical
Publication of CN111564153B publication Critical patent/CN111564153B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/04Details of speech synthesis systems, e.g. synthesiser structure or memory management
    • G10L13/047Architecture of speech synthesisers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/174Form filling; Merging
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/06Elementary speech units used in speech synthesisers; Concatenation rules
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
    • G10L2013/083Special characters, e.g. punctuation marks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种广播电台智能主播音乐节目系统,包括输入单元,解析单元、切音单元、主持词合成单元、主持词播报单元、主持词启动单元、音乐播放单元、计时单元、判断单元、切换单元和数据库,本广播电台智能主播音乐节目系统将主播的海量声音节目素材通过采集专业主播声音进行切分,然后重组进行再创造,最终成为AI主播,根据节目需要,AI主播可以用上万种方式来介绍一首歌,并且不会重复,主播的声音可通过语音拼接技术将播出时段的前后歌曲完美串联,最终形成专业音乐节目,替代真人主播,满足电台对优秀主持人的需求,同时也为电台纯粹播放音乐的时段提供了吸引听众的多重选择。

Description

广播电台智能主播音乐节目系统
技术领域
本发明涉及自动播报技术领域,尤其涉及一种广播电台智能主播音乐节目系统。
背景技术
广播电台的音乐节目一般是主持人根据自己时段的歌曲顺序提前做好歌曲相关工作整理,然后到直播时根据当时的状态完成歌曲的引出和解说工作。这个工种对于主持人的专业素养要求很高,无论是嗓音、语气和内容都是电台考量的重点,有时主持人还可能在直播时因其他因素影响节目质量,并且主持人在解说是伴有一定几率的出错风险,特别是市县级电台能够招聘到的优秀电台主持人更是屈指可数,同时每个主持人都需要休息(非工作时间,法定节假日),也有跳槽和请假的可能,因此优秀稳定的音乐主持人对于电台来说成为亟需。
发明内容
本发明的目的是为了解决现有技术中主持人直播出错而电台优秀稳定的音乐主持人稀缺的问题,而提出的一种广播电台智能主播音乐节目系统,通过主持人的语音拼接将前后歌曲完美串联,最终形成专业音乐节目,完美替代真人主播,保持音乐节目播出质量的稳定性。
为了实现上述目的,本发明采用了如下技术方案:
广播电台智能主播音乐节目系统,包括包括输入单元,解析单元、切音单元、主持词合成单元、主持词播报单元、主持词启动单元、音乐播放单元和数据库。
所述的输入单元用于歌曲名称的输入。
所述的解析单元用于对所述输入单元的歌曲名称信息进行解析,形成读取拼音语句资料。
所述的查询单元用于根据解析单元的分解的拼音语句素材,查询数据库,得到歌曲名称对应的主持人的主持语音资料。
所述的切音单元可对应歌曲名称的拼音判断,将所述主持人的主持语音中关于歌曲名称拼音的声母语音片段和韵母语音片段进行分析,分析声母语音片段和韵母语音片段的频率大小。
本切音单元根据分析结果,以频率密集的所述声母语音片段的后端为节点进行切分,以频率密集的所述声母语音片段的后端为节点进行切分形成语音拼接素材;
所述的主持词合成单元包括歌单合成子单元和主持词拼接子单元,所述歌单合成子单元用于将所述切音单元的得到的语音拼接素材,进行对应的合成,形成与主持人口播相似的歌单,所述主持词拼接子单元将歌单与主持人常用并与歌曲相匹配的主持词语音进行拼接,形成连贯的主持词播放语音。
所述的主持词播报单元将主持词播放语音进行播放。
所述的主持词启动单元在歌曲之间、歌曲前奏部分或者歌曲结尾部分插入主持词播放语音。
所述的音乐播放单元从数据库调取输入单元输入的歌曲音乐。
所述的数据库用于储存主持人主持的语音素材和音乐相关材料,包括歌曲、歌手、歌手故事等语音材料。
优选的,所述查询单元内部设置筛选子单元,所述筛选子单元用于预设时间内连续选取数据库中同一主持人与歌曲名称相匹配的声母和韵母语音素材,保持主持人播报的连续性;
优选的,本广播电台智能主播音乐节目系统还包括计时单元、判断单元和切换单元,所述计时单元用于计算同一主持人播报的时间,判断单元用于判断播报时间是否达到预设时间,切换单元连接筛选子单元,用于控制筛选子单元切换选择不同主持人语音素材与最接近歌曲名称声母和韵母语音素材,用于控制同一主持人连续播报的时间。
优选的,所述预设时间为1小时-2小时。
优选的,述所述切音单元中频率密集的所述声母语音片段为频率为8000赫兹以上的所述声母语音片段,能够使被切分后的语音素材进行合成时语音更加柔和、不僵硬,不会出现卡顿和语音突变不协调的现象,具有较佳的发音效果,更接近人员的实时人工播放。
优选的,所述切音单元还包括静音切分功能,用于根据音量在20分贝以下的语音片段为节点进行切分,保持成时语音的连贯性。
优选的,所述主持词启动单元中包括声音调节子单元,当主持词启动单元在音乐播放中插入主持词时,所述声音调节子单元调低音乐的声量,使听众可听清主持人的声音。
优选的,主持人播放语音形成方法包括以下步骤:
步骤S1,在输入单元中输入歌曲名称;
步骤S2,解析单元根据所述歌曲名称文字语句资料转换成拼音语句资料;
步骤S3,查询单元根据所述拼音语句资料中的拼音在数据库中找到对应的主持人关于歌曲名称拼音相关的拼音语音片段;
步骤S4,切音单元根据步骤S2得到的所述拼音中的声母和韵母,在主持人关于歌曲名称拼音相关的拼音语音片段中找到对应的声母语音片段和韵母语音片段;
当所述声母语音片段的频率在8000赫兹以上时,以该所述声母语音片段后端为节点进行切分,形成对应的语音素材;或者以音量在20分贝以下的语音片段为节点进行切分,形成对应的语音素材;
步骤S5,根据步骤S4中所述语音素材,根据步骤S4中所述语音素材,形成与主持人口播相似的歌单,主持词拼接子单元将歌单与主持人常用并与歌曲相匹配的主持词语音进行拼接,形成连贯的主持词播放语音。
本实施例中,包括输入单元包括语音输入和文字输入。
本系统的运行过程包括:
S101:在输入单元输入歌曲名称;
S102:系统中的解析单元对所述输入单元的歌曲名称信息进行解析,形成读取拼音语句资料;
S103:系统中的查询单元根据解析单元的分解的拼音语句素材,查询数据库,得到歌曲名称对应的主持人的主持语音资料,查询单元内部的筛选子单元在预设时间内连续选取数据库中同一主持人与歌曲名称相匹配声母和韵母语音素材;
S104:切音单元对应歌曲名称的拼音判断,将所述主持人的主持语音中关于歌曲名称拼音的声母语音片段和韵母语音片段进行分析,分析其声母语音片段和韵母语音片段的频率大小,本切音单元根据分析结果,以频率密集的所述声母语音片段的后端为节点进行切分,以频率密集的所述声母语音片段的后端为节点进行切分形成语音拼接素材;
所述切音单元中频率密集的所述声母语音片段为频率为8000赫兹以上的所述声母语音片段;所述切音单元还包括静音切分功能,用于根据音量在20分贝以下的语音片段为节点进行切分;
S105:主持词合成单元:用于根据所述切音单元的语音拼接素材,进行一一对应的所述语音素材进行合成,形成主持词播放语音,形成AI主播的语音,AI主播可播报与每首歌曲匹配的口播内容(内容包括歌曲故事、歌手介绍、社会事实、心灵鸡汤等);
S106:在音乐播放单元从数据库调取输入单元输入的歌曲音乐,按照顺序进行播放,主持词启动单元在歌曲之间、歌曲前奏部分或者歌曲结尾部分插入主持词播放语音,主持词播报单元将主持词播放语音进行播放,形成连续音乐节目;
当主持词启动单元在音乐播放中插入主持词时,所述声音调节子单元调低音乐的声量,方便听众听清主播的声音;
S107:计时单元计算同一主持人播报的时间,当同一主持人播报达到预设时间,切换单元可控制筛选子单元,切换另一主持人进行播报,保持前后节目无缝衔接,让听众以为有主播在电台直播而不会轻易换台。
本发明还包括一种音乐播放平台,其搭载了本发明中广播电台智能主播音乐节目系统。
本发明的有益效果是:
(1)本广播电台智能主播音乐节目系统将主播的海量声音节目素材通过采集专业主播声音用傅立叶调制声波转换将主播声音进行再创造,无需联网,最终成为AI主播。根据节目需要,AI主播可以用上万种方式来介绍首歌并且不会重复,同时还可播报电台频点等实时时间,完成优秀主播90%以上的工作内容,主播的声音可通过语音拼接技术将播出时段的前后歌曲完美串联,最终形成专业音乐节目,完美替代真人主播。
(2)本广播电台智能主播音乐节目系统中多为男女AI主播可以全天24小时进行在电台音乐节目主持,可任意编排每个主持时段,保持每一次说话都是最佳的状态,满足电台对优秀主持人的需求,同时也为电台纯粹播放音乐的时段提供了吸引听众的多重选择。
(3)本发明中主持人播放语音形成方法中通过对语音资料采用声母语音片段的频率在8000赫兹以上为切分节点进行切分的方式,能够使被切分后的语音素材进行合成时语音更加柔和、不僵硬,不会出现卡顿和语音突变不协调的现象,具有较佳的发音效果,更接近人员的实时人工播放。
附图说明
图1为本广播电台智能主播音乐节目系统的结构示意图;
图2为本广播电台智能主播音乐节目系统中主持人播放语音形成方法步骤图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
参照图1-2,广播电台智能主播音乐节目系统,包括包括输入单元,解析单元、切音单元、主持词合成单元、主持词播报单元、主持词启动单元、音乐播放单元和数据库。
所述的输入单元用于歌曲名称的输入。
所述的解析单元用于对所述输入单元的歌曲名称信息进行解析,形成读取拼音语句资料。
所述的查询单元用于根据解析单元的分解的拼音语句素材,查询数据库,得到歌曲名称对应的主持人的主持语音资料。
所述的切音单元可对应歌曲名称的拼音判断,将所述主持人的主持语音中关于歌曲名称拼音的声母语音片段和韵母语音片段进行分析,分析声母语音片段和韵母语音片段的频率大小。
本切音单元根据分析结果,以频率密集的所述声母语音片段的后端为节点进行切分,以频率密集的所述声母语音片段的后端为节点进行切分形成语音拼接素材;
所述的主持词合成单元包括歌单合成子单元和主持词拼接子单元,所述歌单合成子单元用于将所述切音单元的得到的语音拼接素材,进行对应的合成,形成与主持人口播相似的歌单,所述主持词拼接子单元将歌单与主持人常用并与歌曲相匹配的主持词语音进行拼接,形成连贯的主持词播放语音。
所述的主持词播报单元将主持词播放语音进行播放。
所述的主持词启动单元在歌曲之间、歌曲前奏部分或者歌曲结尾部分插入主持词播放语音。
所述的音乐播放单元从数据库调取输入单元输入的歌曲音乐。
所述的数据库用于储存主持人主持的语音素材和音乐相关材料,包括歌曲、歌手、歌手故事等语音材料。
本实施例中,所述查询单元内部设置筛选子单元,所述筛选子单元用于预设时间内连续选取数据库中同一主持人与歌曲名称相匹配声母和韵母语音素材。
本实施例中,广播电台智能主播音乐节目系统还包括计时单元、判断单元和切换单元,所述计时单元用于计算同一主持人播报的时间,判断单元用于判断播报时间是否达到预设时间,切换单元连接筛选子单元,用于控制筛选子单元切换选择不同主持人语音素材与最接近歌曲名称声母和韵母语音素材。
本实施例中,所述预设时间为1小时-2小时。
本实施例中,述所述切音单元中频率密集的所述声母语音片段为傅立叶调制声波中频率为8000赫兹以上的所述声母语音片段。所述声母语音片段的频率为8000赫兹以上的声母为s、sh、q、x等。
本实施例中,所述切音单元还包括静音切分功能,用于根据音量在20分贝以下的语音片段为节点进行切分。
本实施例中,所述主持词启动单元中包括声音调节子单元,当主持词启动单元在音乐播放中插入主持词时,所述声音调节子单元调低音乐的声量。
优选的,主持人播放语音形成方法包括以下步骤:
步骤S1,在输入单元中输入歌曲名称;
步骤S2,解析单元根据所述歌曲名称文字语句资料转换成拼音语句资料;
步骤S3,查询单元根据所述拼音语句资料中的拼音在数据库中找到对应的主持人关于歌曲名称拼音相关的拼音语音片段;
步骤S4,切音单元根据步骤S2得到的所述拼音中的声母和韵母,在主持人关于歌曲名称拼音相关的拼音语音片段中找到对应的声母语音片段和韵母语音片段;
当所述声母语音片段的频率在8000赫兹以上时,以该所述声母语音片段后端为节点进行切分,形成对应的语音素材;或者以音量在20分贝以下的语音片段为节点进行切分,形成对应的语音素材。
步骤S5,根据步骤S4中所述语音素材,根据步骤S4中所述语音素材,形成与主持人口播相似的歌单,主持词拼接子单元将歌单与主持人常用并与歌曲相匹配的主持词语音进行拼接,形成连贯的主持词播放语音。
本实施例中,包括输入单元包括语音输入和文字输入,输入的方式可多样。
本系统的运行过程包括:
S101:在输入单元输入歌曲名称;
S102:系统中的解析单元对所述输入单元的歌曲名称信息进行解析,形成读取拼音语句资料;
S103:系统中的查询单元根据解析单元的分解的拼音语句素材,查询数据库,得到歌曲名称对应的主持人的主持语音资料,查询单元内部的筛选子单元在预设时间内连续选取数据库中同一主持人与歌曲名称相匹配声母和韵母语音素材;
S104:切音单元对应歌曲名称的拼音判断,将所述主持人的主持语音中关于歌曲名称拼音的声母语音片段和韵母语音片段进行分析,分析其声母语音片段和韵母语音片段的频率大小,本切音单元根据分析结果,以频率密集的所述声母语音片段的后端为节点进行切分,以频率密集的所述声母语音片段的后端为节点进行切分形成语音拼接素材;
所述切音单元中频率密集的所述声母语音片段为频率为8000赫兹以上的所述声母语音片段;所述切音单元还包括静音切分功能,用于根据音量在20分贝以下的语音片段为节点进行切分。
S105:主持词合成单元:根据步骤S4中所述语音素材,根据步骤S4中所述语音素材,形成与主持人口播相似的歌单,主持词拼接子单元将歌单与主持人常用并与歌曲相匹配的主持词语音进行拼接,形成连贯的主持词播放语音,即AI主播的语音,AI主播可播报与每首歌曲匹配的口播内容(内容包括歌曲故事、歌手介绍、社会事实、心灵鸡汤等)。
S106:在音乐播放单元从数据库调取输入单元输入的歌曲音乐,按照顺序进行播放,主持词启动单元在歌曲之间、歌曲前奏部分或者歌曲结尾部分插入主持词播放语音,主持词播报单元将主持词播放语音进行播放,形成连续音乐节目;
当主持词启动单元在音乐播放中插入主持词时,所述声音调节子单元调低音乐的声量,方便听众听清主播的声音;
S107:计时单元计算同一主持人播报的时间,当同一主持人播报达到预设时间,切换单元可控制筛选子单元,切换另一主持人进行播报,保持前后节目无缝衔接,让听众以为有主播在电台直播而不会轻易换台。
实施例1
S101:在输入单元输入歌曲名称“山丘”;
S102:系统中的解析单元对所述输入单元的歌曲名称信息进行解析,形成读取拼音语句资料“shān qiū”;
S103:系统中的查询单元根据解析单元的分解的拼音语句素材,查询数据库,得到歌曲名称拼音相匹配的主持人的主持语音资料“shānū”、“qiū”;
查询单元内部的筛选子单元在一个时间内连续选取数据库中同一主持人与歌曲名称相匹配声母和韵母语音素材;
S104:切音单元对照歌曲名称的拼音“shān qiū”,将所述主持人的主持语音中关于“shān”、“qiū”的声母语音片段和韵母语音片段进行分析,分析其声母语音片段和韵母语音片段的频率大小,本切音单元根据分析结果,以频率密集的所述声母语音片段的后端为节点进行切分,本实施例中sh、q为8000赫兹以上的声母语音,进行切分后,变成了“sh ānqiū”。
S105:所述歌单合成子单元用于将所述切音单元的得到的语音拼接素材,进行对应的合成,形成与主持人口播相似的歌单“shānqiū”,所述主持词拼接子单元将歌单与主持人常用并与歌曲相匹配的主持词语音进行拼接,形成连贯的主持词播放语音,即AI主播的语音,AI主播可播报与每首歌曲匹配的口播内容(内容包括歌曲故事、歌手介绍、社会事实、心灵鸡汤等)。
本实施例中,数据库中储存有主持人常用的主持词语,“jiē xià lái shōu tīnɡde ɡē qǔ shì”(接下来收听的歌曲是)、“zhè shǒu hǎo ɡē lái zì”(这首好歌来自)等,所以本实施例可形成一下主持人语音:
“jiē xià lái shōu tīnɡ de ɡē qǔ sh씓lǐ zōnɡ shènɡ”de“shān qiū”或者“zhè shǒu hǎo ɡē lái z씓lǐ zōnɡ shènɡ”de“shān qiū”。
本实施例中的歌手名称可根据歌曲名称自动识别,然后进行入歌曲名称一样的语音合成过程,形成形成与主持人口播相似的歌手名字语音。
S106:在音乐播放单元从数据库调取输入单元输入的歌曲音乐,按照顺序进行播放,主持词启动单元在歌曲之间、歌曲前奏部分或者歌曲结尾部分插入主持词播放语音,主持词播报单元将主持词播放语音进行播放,形成连续音乐节目;
当主持词启动单元在音乐播放中插入主持词时,所述声音调节子单元调低音乐的声量,方便听众听清主播的声音;
S107:计时单元计算同一主持人播报的时间,当同一主持人播报达到1个小时,切换单元可控制筛选子单元,切换另一主持人进行播报,保持前后节目无缝衔接,让听众以为有主播在电台直播而不会轻易换台。
实施例2
S101:在输入单元输入歌曲名称“心殇”;
S102:系统中的解析单元对所述输入单元的歌曲名称信息进行解析,形成读取拼音语句资料“xīn shānɡ”;
S103:系统中的查询单元根据解析单元的分解的拼音语句素材,查询数据库,得到歌曲名称拼音相匹配的主持人的主持语音资料“xīn”、“shānɡ”;
查询单元内部的筛选子单元在一个时间内连续选取数据库中同一主持人与歌曲名称相匹配声母和韵母语音素材;
S104:切音单元对照歌曲名称的拼音“xīn shānɡ”,将所述主持人的主持语音中关于“xīn”、“shānɡ”的声母语音片段和韵母语音片段进行分析,分析其声母语音片段和韵母语音片段的频率大小,本切音单元根据分析结果,以频率密集的所述声母语音片段的后端为节点进行切分,本实施例中sh、x为8000赫兹以上的声母语音,进行切分后,变成了“x īnsh ānɡ”。
S105:所述歌单合成子单元用于将所述切音单元的得到的语音拼接素材,进行对应的合成,形成与主持人口播相似的歌单“xīn shānɡ”,所述主持词拼接子单元将歌单与主持人常用并与歌曲相匹配的主持词语音进行拼接,形成连贯的主持词播放语音,即AI主播的语音,AI主播可播报与每首歌曲匹配的口播内容(内容包括歌曲故事、歌手介绍、社会事实、心灵鸡汤等)。
本实施例中,数据库中储存有主持人常用的主持词语,“jiē xià lái shōu tīnɡde ɡē qǔ shì”(接下来收听的歌曲是)、“zhè shǒu hǎo ɡē lái zì”(这首好歌来自)等,所以本实施例可形成一下主持人语音:
“jiē xià lái shōu tīnɡ de ɡē qǔ sh씓shuǐ shànɡ fēnɡ”de“xīn shānɡ”或者“zhè shǒu hǎo ɡē lái z씓shuǐ shànɡ fēnɡ”de“xīn shānɡ”。
本实施例中的歌手名称可根据歌曲名称自动识别,然后进行入歌曲名称一样的语音合成过程,形成形成与主持人口播相似的歌手名字语音。
S106:在音乐播放单元从数据库调取输入单元输入的歌曲音乐,按照顺序进行播放,主持词启动单元在歌曲之间、歌曲前奏部分或者歌曲结尾部分插入主持词播放语音,主持词播报单元将主持词播放语音进行播放,形成连续音乐节目;
当主持词启动单元在音乐播放中插入主持词时,所述声音调节子单元调低音乐的声量,方便听众听清主播的声音;
S107:计时单元计算同一主持人播报的时间,当同一主持人播报达到1个小时,切换单元可控制筛选子单元,切换另一主持人进行播报,保持前后节目无缝衔接,让听众以为有主播在电台直播而不会轻易换台。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

Claims (10)

1.广播电台智能主播音乐节目系统,其特征在于,包括:
输入单元,用于歌曲名称,歌手名称的输入;
解析单元:用于对所述输入单元的歌曲名称,歌手名称信息进行解析,形成读取拼音语句资料;
查询单元:用于根据解析单元的分解的拼音语句素材,查询数据库,得到歌曲名称对应的主持人的主持语音资料;
切音单元:对应歌曲名称的拼音判断,将所述主持人的主持语音中关于歌曲名称拼音的声母语音片段和韵母语音片段进行分析,分析声母语音片段和韵母语音片段的频率大小;
本切音单元根据分析结果,以频率密集的所述声母语音片段的后端为节点进行切分,以频率密集的所述声母语音片段的后端为节点进行切分形成语音拼接素材;
主持词合成单元:包括歌单合成子单元和主持词拼接子单元,所述歌单合成子单元用于将所述切音单元的得到的语音拼接素材,进行对应的合成,形成与主持人口播相似的歌单,所述主持词拼接子单元将歌单与主持人常用并与歌曲相匹配的主持词语音进行拼接,形成连贯的主持词播放语音;
主持词播报单元:将主持词播放语音进行播放;
主持词启动单元:在歌曲之间、歌曲前奏部分或者歌曲结尾部分插入主持词播放语音;
音乐播放单元:从数据库调取输入单元输入的歌曲音乐;
和数据库:用于储存主持人主持的语音素材和音乐。
2.根据权利要求1所述的广播电台智能主播音乐节目系统,其特征在于,所述查询单元内部设置筛选子单元,所述筛选子单元用于在预设时间内连续选取数据库中同一主持人与歌曲名称相匹配声母和韵母语音素材。
3.根据权利要求2所述的广播电台智能主播音乐节目系统,其特征在于,所述还包括计时单元、判断单元和切换单元,所述计时单元用于计算同一主持人播报的时间,判断单元用于判断播报时间是否达到预设时间,切换单元连接筛选子单元,用于控制筛选子单元切换选择不同主持人语音素材与最接近歌曲名称声母和韵母语音素材。
4.根据权利要求3所述的广播电台智能主播音乐节目系统,其特征在于,所述预设时间为1小时-2小时。
5.根据权利要求1所述的广播电台智能主播音乐节目系统,其特征在于,所述切音单元中频率密集的所述声母语音片段为频率为8000赫兹以上的所述声母语音片段。
6.根据权利要求1所述的广播电台智能主播音乐节目系统,其特征在于,所述切音单元还包括静音切分功能,用于根据音量在20分贝以下的语音片段为节点进行切分。
7.根据权利要求1所述的广播电台智能主播音乐节目系统,其特征在于,所述主持词启动单元中包括声音调节子单元,当主持词启动单元在音乐播放中插入主持词时,所述声音调节子单元调低音乐的声量。
8.根据权利要求7所述的广播电台智能主播音乐节目系统,其特征在于,主持人播放语音形成方法包括以下步骤:
步骤S1,在输入单元中输入歌曲名称;
步骤S2,解析单元根据所述歌曲名称文字语句资料转换成拼音语句资料;
步骤S3,查询单元根据所述拼音语句资料中的拼音在数据库中找到对应的主持人关于歌曲名称拼音相关的拼音语音片段;
步骤S4,切音单元根据步骤S2得到的所述拼音中的声母和韵母,在主持人关于歌曲名称拼音相关的拼音语音片段中找到对应的声母语音片段和韵母语音片段;
当所述声母语音片段的频率在8000赫兹以上时,以该所述声母语音片段后端为节点进行切分,形成对应的语音素材;或者以音量在20分贝以下的语音片段为节点进行切分,形成对应的语音素材;
步骤S5,根据步骤S4中所述语音素材,形成与主持人口播相似的歌单,主持词拼接子单元将歌单与主持人常用并与歌曲相匹配的主持词语音进行拼接,形成连贯的主持词播放语音。
9.根据权利要求8所述的主持人播放语音形成方法,其特征在于,包括输入单元包括语音输入和文字输入。
10.一种音乐播放平台,其特征在于,搭载了根据权利要求1所述的广播电台智能主播音乐节目系统。
CN202010253289.3A 2020-04-02 2020-04-02 广播电台智能主播音乐节目系统 Active CN111564153B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010253289.3A CN111564153B (zh) 2020-04-02 2020-04-02 广播电台智能主播音乐节目系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010253289.3A CN111564153B (zh) 2020-04-02 2020-04-02 广播电台智能主播音乐节目系统

Publications (2)

Publication Number Publication Date
CN111564153A true CN111564153A (zh) 2020-08-21
CN111564153B CN111564153B (zh) 2021-10-01

Family

ID=72073085

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010253289.3A Active CN111564153B (zh) 2020-04-02 2020-04-02 广播电台智能主播音乐节目系统

Country Status (1)

Country Link
CN (1) CN111564153B (zh)

Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1126349A (zh) * 1995-03-06 1996-07-10 郑元成 用于连续汉语语音合成的半音节方法
JP2003335468A (ja) * 2002-05-20 2003-11-25 Mitsubishi Electric Corp エレベータの自動放送装置
EP1686796A1 (en) * 2005-01-05 2006-08-02 Alcatel Electronic program guide presented by an avatar featuring a talking head speaking with a synthesized voice
CN1889170A (zh) * 2005-06-28 2007-01-03 国际商业机器公司 基于录制的语音模板生成合成语音的方法和系统
CN101261831A (zh) * 2007-03-05 2008-09-10 凌阳科技股份有限公司 一种音标分解与合成方法
CN101369423A (zh) * 2007-08-17 2009-02-18 株式会社东芝 语音合成方法和装置
CN102495970A (zh) * 2011-12-20 2012-06-13 山西大学 会议主持系统及其实现方法
US20120163576A1 (en) * 2010-12-27 2012-06-28 Avaya Inc. System and method for changing conference moderators during a conference call
CN106205601A (zh) * 2015-05-06 2016-12-07 科大讯飞股份有限公司 确定文本语音单元的方法及系统
CN107423364A (zh) * 2017-06-22 2017-12-01 百度在线网络技术(北京)有限公司 基于人工智能的回答话术播报方法、装置及存储介质
CN107705643A (zh) * 2017-11-16 2018-02-16 四川文理学院 一种机器人主持教学方法及其装置
CN108470064A (zh) * 2018-03-26 2018-08-31 黑龙江省经济管理干部学院 一种基于智能机器人的新闻稿生成方法
CN108521588A (zh) * 2018-04-18 2018-09-11 武汉斗鱼网络科技有限公司 一种基于时间分片的主播排名方法及系统、服务器及存储介质
JP2018169434A (ja) * 2017-03-29 2018-11-01 富士通株式会社 音声合成装置、音声合成方法及び音声合成システムならびに音声合成用コンピュータプログラム
CN108899009A (zh) * 2018-08-17 2018-11-27 百卓网络科技有限公司 一种基于音素的中文语音合成系统
CN109389968A (zh) * 2018-09-30 2019-02-26 平安科技(深圳)有限公司 基于双音节混搭的波形拼接方法、装置、设备及存储介质
CN110399542A (zh) * 2019-07-17 2019-11-01 合肥善达信息科技有限公司 一种天气预报稿件自动生成与播报方法
CN110517662A (zh) * 2019-07-12 2019-11-29 云知声智能科技股份有限公司 一种智能语音播报的方法及系统

Patent Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1126349A (zh) * 1995-03-06 1996-07-10 郑元成 用于连续汉语语音合成的半音节方法
JP2003335468A (ja) * 2002-05-20 2003-11-25 Mitsubishi Electric Corp エレベータの自動放送装置
EP1686796A1 (en) * 2005-01-05 2006-08-02 Alcatel Electronic program guide presented by an avatar featuring a talking head speaking with a synthesized voice
CN1889170A (zh) * 2005-06-28 2007-01-03 国际商业机器公司 基于录制的语音模板生成合成语音的方法和系统
CN101261831A (zh) * 2007-03-05 2008-09-10 凌阳科技股份有限公司 一种音标分解与合成方法
CN101369423A (zh) * 2007-08-17 2009-02-18 株式会社东芝 语音合成方法和装置
US20120163576A1 (en) * 2010-12-27 2012-06-28 Avaya Inc. System and method for changing conference moderators during a conference call
CN102495970A (zh) * 2011-12-20 2012-06-13 山西大学 会议主持系统及其实现方法
CN106205601A (zh) * 2015-05-06 2016-12-07 科大讯飞股份有限公司 确定文本语音单元的方法及系统
JP2018169434A (ja) * 2017-03-29 2018-11-01 富士通株式会社 音声合成装置、音声合成方法及び音声合成システムならびに音声合成用コンピュータプログラム
CN107423364A (zh) * 2017-06-22 2017-12-01 百度在线网络技术(北京)有限公司 基于人工智能的回答话术播报方法、装置及存储介质
CN107705643A (zh) * 2017-11-16 2018-02-16 四川文理学院 一种机器人主持教学方法及其装置
CN108470064A (zh) * 2018-03-26 2018-08-31 黑龙江省经济管理干部学院 一种基于智能机器人的新闻稿生成方法
CN108521588A (zh) * 2018-04-18 2018-09-11 武汉斗鱼网络科技有限公司 一种基于时间分片的主播排名方法及系统、服务器及存储介质
CN108899009A (zh) * 2018-08-17 2018-11-27 百卓网络科技有限公司 一种基于音素的中文语音合成系统
CN109389968A (zh) * 2018-09-30 2019-02-26 平安科技(深圳)有限公司 基于双音节混搭的波形拼接方法、装置、设备及存储介质
CN110517662A (zh) * 2019-07-12 2019-11-29 云知声智能科技股份有限公司 一种智能语音播报的方法及系统
CN110399542A (zh) * 2019-07-17 2019-11-01 合肥善达信息科技有限公司 一种天气预报稿件自动生成与播报方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
HIROKAZU AKADOMARI: "HMM-based Speech Synthesizer for Easily Understandable Speech Broadcasting", 《2018 IEEE 7TH GLOBAL CONFERENCE ON CONSUMER ELECTRONICS (GCCE)》 *
北京大学中文系现代汉语教研室: "《现代汉语》", 31 August 2012 *
王绍轶: "人工智能语音技术在广电媒体的应用", 《传媒论坛》 *

Also Published As

Publication number Publication date
CN111564153B (zh) 2021-10-01

Similar Documents

Publication Publication Date Title
EP2659485B1 (en) Semantic audio track mixer
US6462264B1 (en) Method and apparatus for audio broadcast of enhanced musical instrument digital interface (MIDI) data formats for control of a sound generator to create music, lyrics, and speech
US7230177B2 (en) Interchange format of voice data in music file
JP7424359B2 (ja) 情報処理装置、歌唱音声の出力方法、及びプログラム
JP2000194360A (ja) 音の電子的発生方法及び装置
JP7363954B2 (ja) 歌唱合成システム及び歌唱合成方法
US20230345086A1 (en) System and method for providing descriptive video
CN111564153B (zh) 广播电台智能主播音乐节目系统
Burger et al. RVG 1-a database for regional variants of contemporary German
JP2002132281A (ja) 歌声メッセージ生成・配信方法及びその装置
CN110992984B (zh) 音频处理方法及装置、存储介质
CN113572977B (zh) 视频制作方法及装置
DE102004020710B4 (de) Anordnung zur Erzeugung von Informationsansagen
CN111583901B (zh) 一种广播电台智能天气预报系统及天气预报语音切分方法
US20190005933A1 (en) Method for Selectively Muting a Portion of a Digital Audio File
Kin et al. Quality assessment of musical and speech signals broadcasted via Single Frequency Network DAB+
EP0986807A1 (en) Method and apparatus for reproducing a recorded voice with alternative performance attributes and temporal properties
JP4244706B2 (ja) 音声再生装置
JPH0916196A (ja) 音声合成装置
JPH0887286A (ja) 通信カラオケシステム
CN113611282A (zh) 广播节目智能播报系统及方法
JPH05224696A (ja) 音声情報検索再生装置
Savino et al. The prosody of Italian newsreading: a diachronic analysis
van Donzel Prosodic characteristics of information structure in spontaneous discourse in Dutch
Don Segmentative function of prosody in discourse

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: No.104, North building, No.10 Lanni Road, Tianxin District, Changsha, Hunan 410000

Applicant after: Hunan Shengguang Information Technology Co.,Ltd.

Address before: No.104, North building, No.10 Lanni Road, Tianxin District, Wuhan City, Hubei Province, 430000

Applicant before: Hunan Shengguang Information Technology Co.,Ltd.

CB02 Change of applicant information
CB02 Change of applicant information

Address after: No.104, North building, No.10 Lanni Road, Tianxin District, Changsha, Hunan 410000

Applicant after: Hunan Shengguang Technology Co.,Ltd.

Address before: No.104, North building, No.10 Lanni Road, Tianxin District, Changsha, Hunan 410000

Applicant before: Hunan Shengguang Information Technology Co.,Ltd.

GR01 Patent grant
GR01 Patent grant