CN111276126A - 一种时政要闻语音合成的方法及其终端 - Google Patents
一种时政要闻语音合成的方法及其终端 Download PDFInfo
- Publication number
- CN111276126A CN111276126A CN202010106875.5A CN202010106875A CN111276126A CN 111276126 A CN111276126 A CN 111276126A CN 202010106875 A CN202010106875 A CN 202010106875A CN 111276126 A CN111276126 A CN 111276126A
- Authority
- CN
- China
- Prior art keywords
- voice
- unit
- headline
- administration
- text content
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 31
- 230000002194 synthesizing effect Effects 0.000 title claims abstract description 23
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 50
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 50
- 230000002123 temporal effect Effects 0.000 claims description 18
- 238000002372 labelling Methods 0.000 claims description 10
- 238000000605 extraction Methods 0.000 claims description 9
- 230000035943 smell Effects 0.000 claims description 9
- 230000033764 rhythmic process Effects 0.000 abstract description 17
- 230000002996 emotional effect Effects 0.000 abstract description 14
- 239000000284 extract Substances 0.000 abstract description 2
- 238000005457 optimization Methods 0.000 abstract description 2
- 239000000686 essence Substances 0.000 description 18
- 230000000694 effects Effects 0.000 description 12
- 239000007787 solid Substances 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000008451 emotion Effects 0.000 description 3
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
- G10L13/10—Prosody rules derived from text; Stress or intonation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了一种时政要闻语音合成的方法及其终端,方法包括:获取现有时政要闻播报语音;提取语音中的语音特征信息;接收待播报时政要闻的文本内容;根据时政要闻的文本内容以及语音特征信息进行时政要闻语音合成。本发明的一种时政要闻语音合成的方法及其终端,本方法通过对现有的时政要闻播报语音提取语音特征信息进行学习,结合提供的时政要闻的文本内容,合成时政要闻语音;合成时政要闻语音有较好的情感表达、节奏以及音质,听感度优质,真实程度高,满足广播级听感的要求。且通过敏感语的判断,进一步提高合成的时政要闻语音合规性。在时政要闻这一垂直领域,实现语音合成的优化能力突破,有利于重要政策的及时宣传。
Description
技术领域
本发明涉及语音合成技术领域,尤其涉及一种时政要闻语音合成的方法及其终端。
背景技术
语音合成技术是通过机械的、电子的方法产生人造语音的技术。它是将计算机自己产生的、或外部输入的文字信息转变为可以听得懂的、流利的口语输出的技术。
语音合成技术当前发展较快,在许多行业中有着成熟的应用,目前百度、阿里、搜狗、科大讯飞都有语音合成技术,广泛应用在教育、军工、医疗、服务行业、新闻播报等等领域。
由于现有的语音合成技术生成的声音缺乏情感表达、节奏、音质,导致其与专业真人主播差距较大,特别是在时政要闻这一特定领域的声音合成中,由于对情感表达、节奏、音质的要求,应用的语音合成技术要求更高;因此现有的语音合成技术不能满足要求。
发明内容
有鉴于此,本发明的一种时政要闻语音合成的方法及其终端,本方法语音合成的时政要闻具有较好的情感表达、节奏以及音质,真实程度高。
一种时政要闻语音合成的方法,方法包括:
获取现有时政要闻播报语音;
提取语音中的语音特征信息;
接收待播报时政要闻的文本内容;
根据时政要闻的文本内容以及语音特征信息进行时政要闻语音合成。
优选地,方法还包括判断合成的时政要闻语音是否涉及敏感语。
优选地,若判断出合成的时政要闻语音不涉及敏感语,则将合成的时政要闻语音分发至平台播放。
优选地,若判断出合成的时政要闻语音涉及敏感语,则将合成的时政要闻语音进行删除。
优选地,所述接收的待播报时政要闻的文本内容识别分类方法为:
获取现有时政要闻文本内容,提取文本内容中的文本特征信息;
接收待分类的文本内容;
判断接收的文本内容与文本特征信息是否相匹配;
若匹配成功,对与文本特征信息匹配的文本内容进行标注;
将待分类的文本归类于时政要闻。
一种时政要闻语音合成的终端,终端包括获取单元、提取单元、第一接收单元以及语音合成单元,所述获取单元、提取单元、第一接收单元以及语音合成单元依次连接,其中:
获取单元,用于获取现有时政要闻播报语音;
提取单元,用于提取语音中的语音特征信息;
第一接收单元,用于接收待播报时政要闻的文本内容;
语音合成单元,用于根据时政要闻的文本内容以及语音特征信息进行时政要闻语音合成。
优选地,还包括第一判断单元,所述第一判断单元与语音合成单元连接,所述第一判断单元用于判断语音合成单元合成的时政要闻语音是否涉及敏感语。
优选地,还包括分发单元,所述分发单元连接于第一判断单元,所述第一判断单元判断语音合成单元合成的时政要闻语音不涉及敏感语时,则所述分发单元用于将合成的时政要闻语音分发至平台播放。
优选地,还包括删除单元,所述删除单元连接于第一判断单元,所述第一判断单元判断语音合成单元合成的时政要闻语音涉及敏感语时,则所述删除单元用于将合成的时政要闻语音进行删除。
优选地,所述第一接收单元包括获取提取单元、第二接收单元、第二判断单元、标注单元以及归类单元,所述获取提取单元、第二接收单元、第二判断单元、标注单元以及归类单元依次连接,其中:
提取单元,用于获取现有时政要闻文本内容,提取文本内容中的文本特征信息;
第二接收单元,用于接收待分类的文本内容;
第二判断单元,用于判断接收的文本内容与文本特征信息是否相匹配;
标注单元,用于若匹配成功,对与文本特征信息匹配的文本内容进行标注;
归类单元,用于将待分类的文本归类于时政要闻。
本发明的有益效果在于:本发明的一种时政要闻语音合成的方法及其终端,本方法通过对现有的时政要闻播报语音提取语音特征信息进行学习,结合提供的时政要闻的文本内容,合成时政要闻语音;合成时政要闻语音有较好的情感表达、节奏以及音质,听感度优质,真实程度高,满足广播级听感的要求。且通过敏感语的判断,进一步提高合成的时政要闻语音合规性。在时政要闻这一垂直领域,实现语音合成的优化能力突破,有利于重要政策的及时宣传。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为一种时政要闻语音合成的方法实施例1的流程图;
图2为一种时政要闻语音合成的方法实施例2的流程图;
图3为一种时政要闻语音合成的方法实施例2的接收待播报时政要闻的文本内容的流程图;
图4为一种时政要闻语音合成的终端实施例1的框图示意图;
图5为一种时政要闻语音合成的终端实施例2的框图示意图。
图6为一种时政要闻语音合成的终端实施例2的第一接收单元框图示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
请参看图1,一种时政要闻语音合成的方法实施例1的流程图,一种时政要闻语音合成的方法,方法包括:
S11,获取现有时政要闻播报语音;获取主播或者专业人士对现有的时政要闻的播报语音内容,例如:收集某一个主播在一段时间内的时政要闻作为时政要闻播报语音的样本,或者收集不同主播的不同时间段的时政要闻作为时政要闻播报语音的样本;一般地,尽可能收集多的时政要闻播报语音的样本,且保证收集的时政要闻播报的语音准确无误,对尽可能多的正确样本进行学习,这样才能确保在合成时政要闻语音时精确。
S12,提取语音中的语音特征信息;对获取的现有时政要闻播报语音中提取语音特征信息;现有确定的相关的时政要闻播报语音为专业的人员进行的语音播报,对有限多的时政要闻播报语音进行语音识别,获取相关的语音特征信息,语音特征信息包括时政要闻播报时的声调、语速、停顿、专有名词、国家、各级政府领导人、语气、节奏、音质、停顿时间以及情感表达等信息。提取的时政要闻语音中的语音特征信息进行存储,存储时可以存储在云盘也可以存储在固体硬盘中。
S13,接收待播报时政要闻的文本内容;接收确定的待播报时政要闻的文本内容;当然也可以通过接收还未确定是否为时政要闻文本;如果是接收的未确定的时政要闻文本,则需要对接收的未确定的时政要闻文本进行识别,将时政要闻识别出来。
S14,根据时政要闻的文本内容以及语音特征信息进行时政要闻语音合成;根据时政要闻的文本内容以及语音特征信息进行时政要闻语音合成,其主要是通过时政要闻的文本内容转换为语音效果,并结合提取出来的语音特征信息,调用语音特征信息,对转换出来的语音进行修饰,例如:对语音效果进行语气、节奏、音质、停顿时间以及情感表达等方面的修饰。使得转换出来的语音效果达到主播级别。语音合成的时政要闻具有较好的情感表达、节奏以及音质,真实程度高。
请参看图4,一种时政要闻语音合成的终端实施例1的流程图,一种时政要闻语音合成的终端,终端300包括获取单元31、提取单元32、第一接收单元33以及语音合成单元34,获取单元31、提取单元32、第一接收单元33以及语音合成单元34依次连接,其中:
获取单元31,用于获取现有时政要闻播报语音;获取主播或者专业人士对现有的时政要闻的播报语音内容,例如:收集某一个主播在一段时间内的时政要闻作为时政要闻播报语音的样本,或者收集不同主播的不同时间段的时政要闻作为时政要闻播报语音的样本;一般地,尽可能收集多的时政要闻播报语音的样本,且保证收集的时政要闻播报的语音准确无误,对尽可能多的正确样本进行学习,这样才能确保在合成时政要闻语音时精确。
提取单元32,用于提取语音中的语音特征信息;对获取的现有时政要闻播报语音中提取语音特征信息;现有确定的相关的时政要闻播报语音为专业的人员进行的语音播报,对有限多的时政要闻播报语音进行语音识别,获取相关的语音特征信息,语音特征信息包括时政要闻播报时的语气、节奏、音质、停顿时间以及情感表达等等信息。提取的时政要闻语音中的语音特征信息进行存储,存储时可以存储在云盘也可以存储在固体硬盘中。
第一接收单元33,用于接收待播报时政要闻的文本内容;接收确定的待播报时政要闻的文本内容;当然也可以通过接收还未确定是否为时政要闻文本;如果是接收的未确定的时政要闻文本,则需要对接收的未确定的时政要闻文本进行识别,将时政要闻识别出来。
语音合成单元34,用于根据时政要闻的文本内容以及语音特征信息进行时政要闻语音合成;根据时政要闻的文本内容以及语音特征信息进行时政要闻语音合成,其主要是通过时政要闻的文本内容转换为语音效果,并结合提取出来的语音特征信息,调用语音特征信息,对转换出来的语音进行修饰,例如:对语音效果进行语气、节奏、音质、停顿时间以及情感表达等方面的修饰。使得转换出来的语音效果达到主播级别。语音合成的时政要闻具有较好的情感表达、节奏以及音质,真实程度高。
请参看图2,一种时政要闻语音合成的方法实施例2的流程图,一种时政要闻语音合成的方法,方法包括:
S21,获取现有时政要闻播报语音;获取主播或者专业人士对现有的时政要闻的播报语音内容,例如:收集某一个主播在一段时间内的时政要闻作为时政要闻播报语音的样本,或者收集不同主播的不同时间段的时政要闻作为时政要闻播报语音的样本;一般地,尽可能收集多的时政要闻播报语音的样本,且保证收集的时政要闻播报的语音准确无误,对尽可能多的正确样本进行学习,这样才能确保在合成时政要闻语音时精确。
S22,提取语音中的语音特征信息;对获取的现有时政要闻播报语音中提取语音特征信息;现有确定的相关的时政要闻播报语音为专业的人员进行的语音播报,对有限多的时政要闻播报语音进行语音识别,获取相关的语音特征信息,语音特征信息包括时政要闻播报时的语气、节奏、音质、停顿时间以及情感表达等等信息。提取的时政要闻语音中的语音特征信息进行存储,存储时可以存储在云盘也可以存储在固体硬盘中。
S23,接收待播报时政要闻的文本内容;接收确定的待播报时政要闻的文本内容;当然也可以通过接收还未确定是否为时政要闻文本;如果是接收的未确定的时政要闻文本,则需要对接收的未确定的时政要闻文本进行识别,将时政要闻文本识别出来,请参看图3,识别方法为:
S231,获取现有时政要闻文本内容,提取文本内容中的特征信息;获取现有确定的相关的时政要闻文本内容,对时政要闻文本提取文本内容中的特征信息;其中,现有确定的相关的时政要闻为专业的人员对有限多的文本进行时政要闻分析并分类,将确定的时政要闻作为现有时政要闻文本内容样本,提取文本内容中的相关特征信息;特征信息包括领导人信息、地区信息、职务信息、时间信息等信息中的一种或多种,例如:领导人信息为“普京”、地区信息“俄罗斯”、职务信息“总统”、时间信息“2019”。为了保证提取的特征信息足够多,一般可以需要尽可能多的获取现有时政要闻。
S232,接收待分类的文本内容;接收待分类的文本内容;接收投稿人或者记者撰写的文本内容,对文本内容标记为待分类的文本内容。一般地,待分类的文本内容如果是时政要闻,其必然包括领导人信息、地区信息、职务信息、时间信息等信息;如果是其它类型的相关新闻,一般都不会有领导人信息以及职务等信息。
S233,判断接收的文本内容与特征信息是否相匹配;将接收的文本内容与时政要闻提取的特征信息进行匹配;一般地,通过接收的待分类的文本内容全文与特征信息进行匹配;可以设定匹配多少项,才对接收待分类的文本内容划分为时政要闻;例如:待分类的文本内容中有领导人信息以及职务信息与特征信息2项相匹配,预设2项及2项以上满足匹配,则可将待分配的文本内容分类为时政要闻;如果预设3项及3项以上满足匹配,则将待分配的文本内容分类为非时政要闻。
S234,若匹配成功,对与特征信息匹配的文本内容进行标注;如果待分配的文本内容与特征信息匹配成功时,则可以将与特征信息匹配的文本内容进行标注,对与特征信息匹配的文本内容进行标注,可以提高辨识度,提高用户可视度,便于检验或者可读。
S235,将待分类的文本归类于时政要闻;当待分类的文本内容与特征信息匹配成功时,即可以将待分类的文本归类于时政要闻。例如:待分类的文本中涉及到某国领导人,以及该领导人的职务,该国地区位置信息等,且与特征信息中包含的信息匹配了,则说明匹配成功了,可以将该待分类的文本归类于时政要闻。若匹配不成功,将待分类的文本归类于非时政要闻;如果待分类的文本内容与特征信息匹配不成功时,即可以将待分类的文本归类于非时政要闻。例如:待分类的文本中不涉及到领导人姓名,且不涉及职务,地区等信息;则将该待分类的文本归类为非时政要闻。接收时,如果识别文本为时政要闻,则进行下一步,如果识别文本为非时政要闻,继续接收时政要闻文本。
S24,根据时政要闻的文本内容以及语音特征信息进行时政要闻语音合成;根据时政要闻的文本内容以及语音特征信息进行时政要闻语音合成,其主要是通过时政要闻的文本内容转换为语音效果,并结合提取出来的语音特征信息,调用语音特征信息,对转换出来的语音进行修饰,例如:对语音效果进行语气、节奏、音质、停顿时间以及情感表达等方面的修饰。使得转换出来的语音效果达到主播级别。语音合成的时政要闻具有较好的情感表达、节奏以及音质,真实程度高。将合成的时政要闻语音进行存储,存储方式可以为云端存储或者硬盘存储。
S25,判断合成的时政要闻语音是否涉及敏感语;在对时政要闻的文本内容合成完时政要闻语音后,再对合成的时政要闻语音进行合规性的判断,即判断合成后的时政要闻语音是否会涉及到一些敏感语,例如:涉政,涉恐,涉黄等敏感语。
S26,分发至平台播放;若判断出合成的时政要闻语音不涉及敏感语,则可以将合成的时政要闻语音分发至平台播放,例如:将时政要闻语音向全国县级融媒体输出相关音频内容,让党的声音深入人心。
S27,将合成的时政要闻语音删除;若判断出合成的时政要闻语音涉及敏感语,则可以将合成的时政要闻语音进行删除,减少存储空间,提高运行速度。
请参看图5,一种时政要闻语音合成的终端实施例2的流程图,一种时政要闻语音合成的终端,终端400包括获取单元41、提取单元42、第一接收单元43、语音合成单元44、第一判断单元45、分发单元46以及删除单元47,获取单元41、提取单元42、第一接收单元43、语音合成单元44以及第一判断单元45依次连接,分发单元46以及删除单元47分别与第一判断单元45连接,其中:
获取单元41,用于获取现有时政要闻播报语音;获取主播或者专业人士对现有的时政要闻的播报语音内容,例如:收集某一个主播在一段时间内的时政要闻作为时政要闻播报语音的样本,或者收集不同主播的不同时间段的时政要闻作为时政要闻播报语音的样本;一般地,尽可能收集多的时政要闻播报语音的样本,且保证收集的时政要闻播报的语音准确无误,对尽可能多的正确样本进行学习,这样才能确保在合成时政要闻语音时精确。
提取单元42,用于提取语音中的语音特征信息;对获取的现有时政要闻播报语音中提取语音特征信息;现有确定的相关的时政要闻播报语音为专业的人员进行的语音播报,对有限多的时政要闻播报语音进行语音识别,获取相关的语音特征信息,语音特征信息包括时政要闻播报时的语气、节奏、音质、停顿时间以及情感表达等等信息。提取的时政要闻语音中的语音特征信息进行存储,存储时可以存储在云盘也可以存储在固体硬盘中。
第一接收单元43,用于接收待播报时政要闻的文本内容;接收确定的待播报时政要闻的文本内容;当然也可以通过接收还未确定是否为时政要闻文本;如果是接收的未确定的时政要闻文本,则需要对接收的未确定的时政要闻文本进行识别,将时政要闻文本识别出来。请参看图6,第一接收单元43包括获取提取单元431、接收单元432、判断单元433、标注单元434以及归类单元435;获取提取单元431、接收单元432、判断单元433、标注单元434以及归类单元435依次连接,其中:
获取提取单元431,用于接收待分类的文本内容;接收待分类的文本内容;接收投稿人或者记者撰写的文本内容,对文本内容标记为待分类的文本内容。一般地,待分类的文本内容如果是时政要闻,其必然包括领导人信息、地区信息、职务信息、时间信息等信息;如果是其它类型的相关新闻,一般都不会有领导人信息以及职务等信息。
接收单元432,接收待分类的文本内容;接收待分类的文本内容;接收投稿人或者记者撰写的文本内容,对文本内容标记为待分类的文本内容。一般地,待分类的文本内容如果是时政要闻,其必然包括领导人信息、地区信息、职务信息、时间信息等信息;如果是其它类型的相关新闻,一般都不会有领导人信息以及职务等信息。
判断单元433,用于用于判断接收的文本内容与特征信息是否相匹配;将接收的文本内容与时政要闻提取的特征信息进行匹配;一般地,通过接收的待分类的文本内容全文与特征信息进行匹配;可以设定匹配多少项,才对接收待分类的文本内容划分为时政要闻;例如:待分类的文本内容中有领导人信息以及职务信息与特征信息2项相匹配,预设2项及2项以上满足匹配,则可将待分配的文本内容分类为时政要闻;如果预设3项及3项以上满足匹配,则将待分配的文本内容分类为非时政要闻。
标注单元434,用于对与特征信息匹配的文本内容进行标注;如果待分配的文本内容与特征信息匹配成功时,则可以将与特征信息匹配的文本内容进行标注,对与特征信息匹配的文本内容进行标注,可以提高辨识度,提高用户可视度,便于检验或者可读。
归类单元435,用于若匹配成功,将待分类的文本归类于时政要闻;当待分类的文本内容与特征信息匹配成功时,即可以将待分类的文本归类于时政要闻。例如:待分类的文本中涉及到某国领导人,以及该领导人的职务,该国地区位置信息等,且与特征信息中包含的信息匹配了,则说明匹配成功了,可以将该待分类的文本归类于时政要闻。若匹配不成功,将待分类的文本归类于非时政要闻;如果待分类的文本内容与特征信息匹配不成功时,即可以将待分类的文本归类于非时政要闻。例如:待分类的文本中不涉及到领导人姓名,且不涉及职务,地区等信息;则将该待分类的文本归类为非时政要闻。
接收时,如果识别文本为时政要闻,则进行下一步,如果识别文本为非时政要闻,继续接收时政要闻文本。
语音合成单元44,用于根据时政要闻的文本内容以及语音特征信息进行时政要闻语音合成;根据时政要闻的文本内容以及语音特征信息进行时政要闻语音合成,其主要是通过时政要闻的文本内容转换为语音效果,并结合提取出来的语音特征信息,调用语音特征信息,对转换出来的语音进行修饰,例如:对语音效果进行语气、节奏、音质、停顿时间以及情感表达等方面的修饰。使得转换出来的语音效果达到主播级别。语音合成的时政要闻具有较好的情感表达、节奏以及音质,真实程度高。将合成的时政要闻语音进行存储,存储方式可以为云端存储或者硬盘存储。
第一判断单元45,用于判断合成的时政要闻语音是否涉及敏感语;在对时政要闻的文本内容合成完时政要闻语音后,再对合成的时政要闻语音进行合规性的判断,即判断合成后的时政要闻语音是否会涉及到一些敏感语,例如:涉政,涉恐,涉黄等敏感语。
分发单元46,用于分发至平台播放;若判断出合成的时政要闻语音不涉及敏感语,则可以将合成的时政要闻语音分发至平台播放,例如:将时政要闻语音向全国县级融媒体输出相关音频内容,让党的声音深入人心。
删除单元47,用于将合成的时政要闻语音删除;若判断出合成的时政要闻语音涉及敏感语,则可以将合成的时政要闻语音进行删除,减少存储空间,提高运行速度。
以上所描述的实施例仅仅是示意性的,本发明实施例可以根据实际需要进行顺序调整、合并和删减。
实施例对本方案进行了详细的介绍,本文中应用了具体个例对本发明的结构原理及实施方式进行了阐述,以上实施例只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种时政要闻语音合成的方法,其特征在于,方法包括:
获取现有时政要闻播报语音;
提取语音中的语音特征信息;
接收待播报时政要闻的文本内容;
根据时政要闻的文本内容以及语音特征信息进行时政要闻语音合成。
2.根据权利要求1所述的方法,其特征在于,方法还包括判断合成的时政要闻语音是否涉及敏感语。
3.根据权利要求2所述的方法,其特征在于,若判断出合成的时政要闻语音不涉及敏感语,则将合成的时政要闻语音分发至平台播放。
4.根据权利要求2所述的方法,其特征在于,若判断出合成的时政要闻语音涉及敏感语,则将合成的时政要闻语音进行删除。
5.根据权利要求1-2任一所述的方法,其特征在于,所述接收的待播报时政要闻的文本内容识别分类方法为:
获取现有时政要闻文本内容,提取文本内容中的文本特征信息;
接收待分类的文本内容;
判断接收的文本内容与文本特征信息是否相匹配;
若匹配成功,对与文本特征信息匹配的文本内容进行标注;
将待分类的文本归类于时政要闻。
6.一种时政要闻语音合成的终端,其特征在于,终端包括获取单元、提取单元、第一接收单元以及语音合成单元,所述获取单元、提取单元、第一接收单元以及语音合成单元依次连接,其中:
获取单元,用于获取现有时政要闻播报语音;
提取单元,用于提取语音中的语音特征信息;
第一接收单元,用于接收待播报时政要闻的文本内容;
语音合成单元,用于根据时政要闻的文本内容以及语音特征信息进行时政要闻语音合成。
7.根据权利要求6所述的终端,其特征在于,还包括第一判断单元,所述第一判断单元与语音合成单元连接,所述第一判断单元用于判断语音合成单元合成的时政要闻语音是否涉及敏感语。
8.根据权利要求7所述的终端,其特征在于,还包括分发单元,所述分发单元连接于第一判断单元,所述第一判断单元判断语音合成单元合成的时政要闻语音不涉及敏感语时,则所述分发单元用于将合成的时政要闻语音分发至平台播放。
9.根据权利要求7所述的终端,其特征在于,还包括删除单元,所述删除单元连接于第一判断单元,所述第一判断单元判断语音合成单元合成的时政要闻语音涉及敏感语时,则所述删除单元用于将合成的时政要闻语音进行删除。
10.根据权利要求6-7任一所述的终端,其特征在于,所述第一接收单元包括获取提取单元、第二接收单元、第二判断单元、标注单元以及归类单元,所述获取提取单元、第二接收单元、第二判断单元、标注单元以及归类单元依次连接,其中:
提取单元,用于获取现有时政要闻文本内容,提取文本内容中的文本特征信息;
第二接收单元,用于接收待分类的文本内容;
第二判断单元,用于判断接收的文本内容与文本特征信息是否相匹配;
标注单元,用于若匹配成功,对与文本特征信息匹配的文本内容进行标注;归类单元,用于将待分类的文本归类于时政要闻。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010106875.5A CN111276126A (zh) | 2020-02-20 | 2020-02-20 | 一种时政要闻语音合成的方法及其终端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010106875.5A CN111276126A (zh) | 2020-02-20 | 2020-02-20 | 一种时政要闻语音合成的方法及其终端 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111276126A true CN111276126A (zh) | 2020-06-12 |
Family
ID=71002779
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010106875.5A Pending CN111276126A (zh) | 2020-02-20 | 2020-02-20 | 一种时政要闻语音合成的方法及其终端 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111276126A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112349268A (zh) * | 2020-11-09 | 2021-02-09 | 湖南芒果听见科技有限公司 | 一种应急广播音频处理系统及其运行方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104464716A (zh) * | 2014-11-20 | 2015-03-25 | 北京云知声信息技术有限公司 | 一种语音播报系统和方法 |
CN108959329A (zh) * | 2017-05-27 | 2018-12-07 | 腾讯科技(北京)有限公司 | 一种文本分类方法、装置、介质及设备 |
-
2020
- 2020-02-20 CN CN202010106875.5A patent/CN111276126A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104464716A (zh) * | 2014-11-20 | 2015-03-25 | 北京云知声信息技术有限公司 | 一种语音播报系统和方法 |
CN108959329A (zh) * | 2017-05-27 | 2018-12-07 | 腾讯科技(北京)有限公司 | 一种文本分类方法、装置、介质及设备 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112349268A (zh) * | 2020-11-09 | 2021-02-09 | 湖南芒果听见科技有限公司 | 一种应急广播音频处理系统及其运行方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11600259B2 (en) | Voice synthesis method, apparatus, device and storage medium | |
CN111667814B (zh) | 一种多语种的语音合成方法及装置 | |
CN111526382B (zh) | 一种直播视频文本生成方法、装置、设备及存储介质 | |
CN109308892B (zh) | 语音合成播报方法、装置、设备及计算机可读介质 | |
CN107731219B (zh) | 语音合成处理方法、装置及设备 | |
CN107516509B (zh) | 用于新闻播报语音合成的语音库构建方法及系统 | |
CN105245917A (zh) | 一种多媒体语音字幕生成的系统和方法 | |
CN110970014A (zh) | 语音转换、文件生成、播音、语音处理方法、设备及介质 | |
CN110166818B (zh) | 待配音视频的生成方法、计算机设备及存储介质 | |
CN109710949B (zh) | 一种翻译方法及翻译机 | |
CN103491429A (zh) | 一种音频处理方法和音频处理设备 | |
US20140019137A1 (en) | Method, system and server for speech synthesis | |
CN111639233A (zh) | 学习视频字幕添加方法、装置、终端设备和存储介质 | |
CN109346057A (zh) | 一种智能儿童玩具的语音处理系统 | |
CN111510765B (zh) | 基于教学视频的音频标签智能标注方法、设备及存储介质 | |
CN108305611B (zh) | 文本转语音的方法、装置、存储介质和计算机设备 | |
US9666211B2 (en) | Information processing apparatus, information processing method, display control apparatus, and display control method | |
CN111276126A (zh) | 一种时政要闻语音合成的方法及其终端 | |
CN112599130B (zh) | 一种基于智慧屏的智能会议系统 | |
CN111369969A (zh) | 一种新闻资讯编播的方法及其终端 | |
CN110992984B (zh) | 音频处理方法及装置、存储介质 | |
CN111221987A (zh) | 混合音频标记方法和装置 | |
CN111177494A (zh) | 基于气象的语音交互中的语义分析方法 | |
CN111354350A (zh) | 语音处理方法及装置、语音处理设备、电子设备 | |
CN113299276B (zh) | 多人多语种识别和翻译方法与装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200612 |