CN105047193B - 语音播报方法和装置 - Google Patents

语音播报方法和装置 Download PDF

Info

Publication number
CN105047193B
CN105047193B CN201510535732.5A CN201510535732A CN105047193B CN 105047193 B CN105047193 B CN 105047193B CN 201510535732 A CN201510535732 A CN 201510535732A CN 105047193 B CN105047193 B CN 105047193B
Authority
CN
China
Prior art keywords
language material
user
broadcasted
module
language
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510535732.5A
Other languages
English (en)
Other versions
CN105047193A (zh
Inventor
郭小华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201510535732.5A priority Critical patent/CN105047193B/zh
Publication of CN105047193A publication Critical patent/CN105047193A/zh
Application granted granted Critical
Publication of CN105047193B publication Critical patent/CN105047193B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明提出一种语音播报方法和装置,其中,该语音播报方法包括:获得待播报的内容;从保存的语声素材中为所述待播报的内容选择对应的语声素材;使用选择的语声素材将所述待播报的内容转换为语音进行播报。本发明在有语音播报需求的场景下,可以从保存的语声素材中选择语声素材,使用选择的语声素材将待播报内容转化为语音进行播报,从而可以使用户有更多的语声素材的选择权,并且为待播报的内容选择的是与待播报的内容对应的语声素材,可以实现不同的待播报内容使用不同的语声素材,语声素材的使用方式灵活多变,提高了用户的体验度。

Description

语音播报方法和装置
技术领域
本发明涉及语音处理技术领域,尤其涉及一种语音播报方法和装置。
背景技术
在实际生活中,每个人说话时的语声,都有自己的特点。声音不单单是为了输出内容,更可以有自己的身份社交属性。
现有的语音播报产品中,集成并提供了部分的语声素材。这些语声素材都是线下提前录制完成,提供给用户使用或下载使用。一般根据明星、地域、性别或者语音特色等进行分类。用户可以选择这些语声素材进行语音播报,并且选择了一种语声素材后,所有的语音播报都使用这种语声素材进行播报。
现有的语音播报产品中,用户只可以在这些被产品提供的有限的语声素材中进行选择,可选择的语声素材的种类有限;并且,这种单方向的产品提供语声素材、用户选择使用语声素材的方式,是产品到人的单向关系,缺乏用户与产品,用户与用户之间的交互性;另外,用户在选择了一种语声素材后,所有的语音播报都使用这种语声素材,使用方式不灵活。
发明内容
本发明的目的旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的第一个目的在于提出一种语音播报方法。该方法在有语音播报需求的场景下,可以从保存的语声素材中选择语声素材,使用选择的语声素材将待播报内容转化为语音进行播报,从而可以使用户有更多的语声素材的选择权,并且为待播报的内容选择对应的语声素材,可以实现不同的待播报内容使用不同的语声素材,语声素材的使用方式灵活多变,提高了用户的体验度。
本发明的第二个目的在于提出一种语音播报装置。
为了实现上述目的,本发明第一方面实施例的语音播报方法,包括:获得待播报的内容;从保存的语声素材中为所述待播报的内容选择对应的语声素材;使用选择的语声素材将所述待播报的内容转换为语音进行播报。
本发明实施例的语音播报方法中,获得待播报的内容之后,从保存的语声素材中为上述待播报的内容选择对应的语声素材,然后使用选择的语声素材将上述待播报的内容转换为语音进行播报,从而可以使用户有更多的语声素材的选择权,并且为待播报的内容选择的是与待播报的内容对应的语声素材,可以实现不同的待播报内容使用不同的语声素材,语声素材的使用方式灵活多变,提高了用户的体验度。
为了实现上述目的,本发明第二方面实施例的语音播报装置,包括:获得模块,用于获得待播报的内容;选择模块,用于从保存的语声素材中为所述获得模块获得的待播报的内容选择对应的语声素材;播报模块,用于使用所述选择模块选择的语声素材将所述待播报的内容转换为语音进行播报。
本发明实施例的语音播报装置中,获得模块获得待播报的内容之后,选择模块从保存的语声素材中为上述待播报的内容选择对应的语声素材,然后播报模块使用选择的语声素材将上述待播报的内容转换为语音进行播报,从而可以使用户有更多的语声素材的选择权,并且选择模块为待播报的内容选择的是与待播报的内容对应的语声素材,可以实现不同的待播报内容使用不同的语声素材,语声素材的使用方式灵活多变,提高了用户的体验度。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本发明语音播报方法一个实施例的流程图;
图2为本发明语音播报方法中选择语声素材一个实施例的示意图;
图3为本发明语音播报方法另一个实施例的流程图;
图4为本发明语音播报方法中配置不同位置下的语声素材一个实施例的示意图;
图5为本发明语音播报方法中配置不同内容下的语声素材一个实施例的示意图;
图6为本发明语音播报方法再一个实施例的流程图;
图7为本发明语音播报方法中语音录入引导提示一个实施例的示意图;
图8为本发明语音播报方法中语声素材保存和上传界面一个实施例的示意图;
图9为本发明语音播报方法再一个实施例的流程图;
图10为本发明语音播报方法中下载语声素材的界面一个实施例的示意图;
图11为本发明语音播报装置一个实施例的结构示意图;
图12为本发明语音播报装置另一个实施例的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。相反,本发明的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。
图1为本发明语音播报方法一个实施例的流程图,如图1所示,该语音播报方法可以包括:
步骤101,获得待播报的内容。
步骤102,从保存的语声素材中为上述待播报的内容选择对应的语声素材。
其中,上述保存的语声素材可以包括上述用户创建的语声素材和/或与上述用户有社交关系的其他用户的语声素材。
图2为本发明语音播报方法中选择语声素材一个实施例的示意图,图2所示的界面中,“我自己”表示上述用户创建的语声素材,而“爸爸”、“妈妈”、“朋友小A”、“朋友小B”和“舍友”表示与上述用户有社交关系的其他用户的语声素材。
也就是说,本实施例中,在为待播报的内容选择语声素材时,可以从保存的语声素材中选择,而保存的语声素材包括上述用户创建的语声素材和/或与上述用户有社交关系的其他用户的语声素材,从而可以使用户有更多的语声素材的选择权,提高了用户体验度。
步骤103,使用选择的语声素材将上述待播报的内容转换为语音进行播报。
上述语音播报方法中,获得待播报的内容之后,从保存的语声素材中为上述待播报的内容选择对应的语声素材,然后使用选择的语声素材将上述待播报的内容转换为语音进行播报,从而可以使用户有更多的语声素材的选择权,并且为待播报的内容选择的是与待播报的内容对应的语声素材,可以实现不同的待播报内容使用不同的语声素材,语声素材的使用方式灵活多变,提高了用户的体验度。
图3为本发明语音播报方法另一个实施例的流程图,如图3所示,步骤102可以为:
步骤301,根据上述用户设置的播报内容与语声素材的对应关系,从保存的语声素材中为上述待播报的内容选择对应的语声素材;或者,根据上述用户当前所在的位置,以及上述用户设置的上述用户所在位置与语声素材的对应关系,从保存的语声素材中为上述待播报的内容选择对应的语声素材。
本实施例中,可以通过场景设置,保证在不同场景下使用不同的语声素材进行播报。
本实施例的一种实现方式中,用户可以按位置配置语声素材,也就是说,用户可以设置上述用户所在位置与语声素材的对应关系,图4为本发明语音播报方法中配置不同位置下的语声素材一个实施例的示意图,如图4所示,用户可以设置当用户在公司时,使用自己的语声素材;当用户在家时,使用老公的语声素材;在默认情形下,使用自己的语声素材;等等。其中,这里的默认情形可以为当用户在公司和家之外的位置时,使用自己的语声素材。
这样,在从保存的语声素材中为上述待播报的内容选择对应的语声素材时,可以通过定位系统确定上述用户当前所在的位置,然后根据上述用户当前所在的位置,以及上述用户设置的所述用户所在位置与语声素材的对应关系,为上述待播报的内容选择对应的语声素材。
本实施例的一种实现方式中,用户可以按内容配置语声素材,也就是说,用户可以设置播报内容与语声素材的对应关系,图5为本发明语音播报方法中配置不同内容下的语声素材一个实施例的示意图,如图5所示,用户可以设置当播报天气类内容时,使用女儿的语声素材;当播报新闻类内容时,使用儿子的语声素材;默认情形下,使用自己的语声素材;等等。这里的默认情形可以为当播报除天气和新闻类内容之外的内容时,使用自己的语声素材。
这样,在从保存的语声素材中为上述待播报的内容选择对应的语声素材时,可以通过对不同播报内容的区分,根据上述用户设置的播报内容与语声素材的对应关系,从保存的语声素材中为上述待播报的内容选择对应的语声素材。
本实施例可以实现不同的待播报内容使用不同的语声素材,语声素材的使用方式灵活多变,提高了用户的体验度。
图6为本发明语音播报方法再一个实施例的流程图,如图6所示,步骤102之前,还可以包括:
步骤601,获得上述用户创建的语声素材。
具体地,获得上述用户创建的语声素材可以为:接收到用户的语声素材创建请求之后,向上述用户展示语音录入引导提示;接收上述用户根据上述语音录入引导提示录入的语音元素;在确定上述语音元素有效并且达到语音合成的满足度之后,将上述语音元素生成语声素材。
图7为本发明语音播报方法中语音录入引导提示一个实施例的示意图,如图7所示,接收到用户的语声素材创建请求之后,可以向用户展示图7所示的语音录入引导提示,用于引导用户说出基本的语音元素,并判断有效性,在确定上述语音元素有效并且达到语音合成的满足度之后,将上述语音元素生成语声素材。
步骤602,保存上述用户创建的语声素材。
本实施例中,默认将上述用户创建的语声素材存入本地,在需要使用的时候选择上述语声素材进行使用。
图8为本发明语音播报方法中语声素材保存和上传界面一个实施例的示意图,如图8所示,在保存上述用户创建的语声素材之后,会给出“您已成功录入语声素材,并存入本地”的提示。
进一步地,步骤601之后,还可以包括:
步骤603,将上述用户创建的语声素材上传到云端服务器,以便上述云端服务器保存上述用户创建的语声素材,以及保存上述用户设置的针对上述用户创建的语声素材的访问权限。
具体地,在创建上述用户的语声素材之后,可以将上述用户创建的语声素材上传至云端服务器,用户通过权限配置管理,设置针对上述用户创建的语声素材的访问权限,这样,上述云端服务器可以保存上述用户创建的语声素材,以及保存上述用户设置的针对上述用户创建的语声素材的访问权限。
图6中,以步骤603在步骤602之后执行为例示出,但本实施例并不仅限于此,本实施例对步骤602与步骤603的执行顺序不作限定,步骤602与步骤603可以并行执行,也可以先后执行。
继续参见图8,用户针对上述用户创建的语声素材设置的访问权限可以包括:
1)、私有权限:不允许除了自己之外的任何人使用;
2)、公开权限:任何人可以下载使用;
3)、半开开权限:允许自己所有好友下载使用;
4)、自定义权限:允许自己选中好友下载使用。
图9为本发明语音播报方法再一个实施例的流程图,如图9所示,步骤102之前,还可以包括:
步骤901,接收上述用户的下载请求。
步骤902,根据上述下载请求,从云端服务器下载上述用户有访问权限的语声素材,并保存下载的语声素材。
图10为本发明语音播报方法中下载语声素材的界面一个实施例的示意图,如图10所示,本实施例中,用户可以登录云端服务器的语声素材库,下载上述用户有访问权限的语声素材至本地。
本发明提供的语音播报方法中,用户可以创建并使用自己的语声素材,可以分享自己的语声素材,可以下载并使用用户有访问权限的语声素材,可以在不同的播放场景下选择使用不同的语声素材。在有语音播报需求的场景下,使用选择的语声素材,将待播报的内容转化为语音进行播报。
并且,本发明中,使得用户有更多的语声素材的选择权,使得有社交关系的用户间可以进行交互,使得语音播报有更灵活的选择性,为用户提供了更好的人性化化体验。
图11为本发明语音播报装置一个实施例的结构示意图,本实施例中的语音播报装置可以实现本发明图1、图3、图6和图9所示实施例的流程。其中,上述语音播报装置可以为终端设备中安装的具有语音播报功能的应用程序,也可以为独立的语音播放设备,本实施例对上述语音播报装置的形式不作限定。
上述终端设备可以为手机或电脑等具有录音和播音功能的终端设备,本实施例对上述终端设备的形态不作限定。
如图11所示,上述语音播报装置可以包括:获得模块1101、选择模块1102和播报模块1103;
其中,获得模块1101,用于获得待播报的内容;
选择模块1102,用于从保存的语声素材中为获得模块1101获得的待播报的内容选择对应的语声素材;其中,上述保存的语声素材可以包括上述用户创建的语声素材和/或与上述用户有社交关系的其他用户的语声素材。如图2所示,图2所示的界面中,“我自己”表示上述用户创建的语声素材,而“爸爸”、“妈妈”、“朋友小A”、“朋友小B”和“舍友”表示与上述用户有社交关系的其他用户的语声素材。
也就是说,本实施例中,在选择模块1102为待播报的内容选择语声素材时,可以从保存的语声素材中选择,而保存的语声素材包括上述用户创建的语声素材和/或与上述用户有社交关系的其他用户的语声素材,从而可以使用户有更多的语声素材的选择权,提高了用户体验度。
播报模块1103,用于使用选择模块1102选择的语声素材将上述待播报的内容转换为语音进行播报。
上述语音播报装置中,获得模块1101获得待播报的内容之后,选择模块1102从保存的语声素材中为上述待播报的内容选择对应的语声素材,然后播报模块1103使用选择的语声素材将上述待播报的内容转换为语音进行播报,从而可以使用户有更多的语声素材的选择权,并且选择模块1102为待播报的内容选择的是与待播报的内容对应的语声素材,可以实现不同的待播报内容使用不同的语声素材,语声素材的使用方式灵活多变,提高了用户的体验度。
图12为本发明语音播报装置另一个实施例的结构示意图,与图11所示的语音播报装置相比,不同之处在于,图12所示的语音播报装置中,
选择模块1102,具体用于根据上述用户设置的播报内容与语声素材的对应关系,从保存的语声素材中为上述待播报的内容选择对应的语声素材;或者,根据上述用户当前所在的位置,以及上述用户设置的上述用户所在位置与语声素材的对应关系,从保存的语声素材中为上述待播报的内容选择对应的语声素材。
本实施例中,可以通过场景设置,保证在不同场景下使用不同的语声素材进行播报。
本实施例的一种实现方式中,用户可以按位置配置语声素材,也就是说,用户可以设置上述用户所在位置与语声素材的对应关系,如图4所示,用户可以设置当用户在公司时,使用自己的语声素材;当用户在家时,使用老公的语声素材;在默认情形下,使用自己的语声素材;等等。其中,这里的默认情形可以为当用户在公司和家之外的位置时,使用自己的语声素材。
这样,在选择模块1102从保存的语声素材中为上述待播报的内容选择对应的语声素材时,可以通过定位系统确定上述用户当前所在的位置,然后根据上述用户当前所在的位置,以及上述用户设置的所述用户所在位置与语声素材的对应关系,为上述待播报的内容选择对应的语声素材。
本实施例的一种实现方式中,用户可以按内容配置语声素材,也就是说,用户可以设置播报内容与语声素材的对应关系,如图5所示,用户可以设置当播报天气类内容时,使用女儿的语声素材;当播报新闻类内容时,使用儿子的语声素材;默认情形下,使用自己的语声素材;等等。这里的默认情形可以为当播报除天气和新闻类内容之外的内容时,使用自己的语声素材。
这样,选择模块1102在从保存的语声素材中为上述待播报的内容选择对应的语声素材时,可以通过对不同播报内容的区分,根据上述用户设置的播报内容与语声素材的对应关系,从保存的语声素材中为上述待播报的内容选择对应的语声素材。
本实施例可以实现不同的待播报内容使用不同的语声素材,语声素材的使用方式灵活多变,提高了用户的体验度。
进一步地,上述语音播报装置还可以包括:保存模块1104;
获得模块1101,还用于在选择模块1102为上述待播报的内容选择对应的语声素材之前,获得上述用户创建的语声素材;
保存模块1104,用于保存获得模块1101获得的上述用户创建的语声素材。本实施例中,保存模块1104默认将上述用户创建的语声素材存入本地,在需要使用的时候选择上述语声素材进行使用,如图8所示,在保存模块1104保存上述用户创建的语声素材之后,会给出“您已成功录入语声素材,并存入本地”的提示。
进一步地,上述语音播报装置还可以包括:接收模块1105;
接收模块1105,用于接收上述用户的语声素材创建请求;
获得模块1101可以包括:展示子模块11011和生成子模块11012;
其中,展示子模块11011,用于在接收模块1105接收到上述用户的语声素材创建请求之后,向上述用户展示语音录入引导提示;
接收模块1105,还用于接收上述用户根据展示子模块11011展示的语音录入引导提示录入的语音元素;
生成子模块11012,用于在确定上述语音元素有效并且达到语音合成的满足度之后,将接收模块1105接收的语音元素生成语声素材。
如图7所示,接收模块1105接收到用户的语声素材创建请求之后,可以向用户展示图7所示的语音录入引导提示,用于引导用户说出基本的语音元素,并判断有效性,生成子模块11012在确定上述语音元素有效并且达到语音合成的满足度之后,将上述语音元素生成语声素材。
进一步地,上述语音播报装置还可以包括:上传模块1106;
上传模块1106,用于在获得模块1101获得上述用户创建的语声素材之后,将上述用户创建的语声素材上传到云端服务器,以便云端服务器保存上述用户创建的语声素材,以及保存上述用户设置的针对上述用户创建的语声素材的访问权限。
具体地,在创建上述用户的语声素材之后,上传模块1106可以将上述用户创建的语声素材上传至云端服务器,用户通过权限配置管理,设置针对上述用户创建的语声素材的访问权限,这样,上述云端服务器可以保存上述用户创建的语声素材,以及保存上述用户设置的针对上述用户创建的语声素材的访问权限。
继续参见图8,用户针对上述用户创建的语声素材设置的访问权限可以包括:
1)、私有权限:不允许除了自己之外的任何人使用;
2)、公开权限:任何人可以下载使用;
3)、半开开权限:允许自己所有好友下载使用;
4)、自定义权限:允许自己选中好友下载使用。
进一步地,上述语音播报装置还可以包括:接收模块1105、下载模块1107和保存模块1104;
接收模块1105,用于在选择模块1102为上述待播报的内容选择对应的语声素材之前,接收上述用户的下载请求;
下载模块1107,用于根据接收模块1105接收的下载请求,从云端服务器下载上述用户有访问权限的语声素材;
保存模块1104,用于保存下载模块1107下载的语声素材。
如图10所示,本实施例中,用户可以登录云端服务器的语声素材库,下载上述用户有访问权限的语声素材至本地。
本发明提供的语音播报装置中,用户可以创建并使用自己的语声素材,可以分享自己的语声素材,可以下载并使用用户有访问权限的语声素材,可以在不同的播放场景下选择使用不同的语声素材。在有语音播报需求的场景下,播报模块1103使用选择的语声素材,将待播报的内容转化为语音进行播报。
并且,本发明中,使得用户有更多的语声素材的选择权,使得有社交关系的用户间可以进行交互,使得语音播报有更灵活的选择性,为用户提供了更好的人性化化体验。
需要说明的是,在本发明的描述中,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(Programmable Gate Array;以下简称:PGA),现场可编程门阵列(Field ProgrammableGate Array;以下简称:FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,本发明各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (10)

1.一种语音播报方法,其特征在于,包括:
获得待播报的内容;
从保存的语声素材中为所述待播报的内容选择对应的语声素材;
使用选择的语声素材将所述待播报的内容转换为语音进行播报;
所述保存的语声素材包括与所述用户有社交关系的其他用户的语声素材、与所述用户有社交关系的其他用户的语声素材和所述用户创建的语声素材;
所述从保存的语声素材中为所述待播报的内容选择对应的语声素材之前,还包括:
接收所述用户的下载请求;
根据所述下载请求,从云端服务器下载所述用户有访问权限的语声素材,并保存下载的语声素材。
2.根据权利要求1所述的方法,其特征在于,所述从保存的语声素材中为所述待播报的内容选择对应的语声素材包括:
根据所述用户设置的播报内容与语声素材的对应关系,从保存的语声素材中为所述待播报的内容选择对应的语声素材;或者,
根据所述用户当前所在的位置,以及所述用户设置的所述用户所在位置与语声素材的对应关系,从保存的语声素材中为所述待播报的内容选择对应的语声素材。
3.根据权利要求1所述的方法,其特征在于,所述从保存的语声素材中为所述待播报的内容选择对应的语声素材之前,还包括:
获得所述用户创建的语声素材,并保存所述用户创建的语声素材。
4.根据权利要求3所述的方法,其特征在于,所述获得所述用户创建的语声素材包括:
接收到所述用户的语声素材创建请求之后,向所述用户展示语音录入引导提示;
接收所述用户根据所述语音录入引导提示录入的语音元素;
在确定所述语音元素有效并且达到语音合成的满足度之后,将所述语音元素生成语声素材。
5.根据权利要求3或4所述的方法,其特征在于,所述获得所述用户创建的语声素材之后,还包括:
将所述用户创建的语声素材上传到云端服务器,以便所述云端服务器保存所述用户创建的语声素材,以及保存所述用户设置的针对所述用户创建的语声素材的访问权限。
6.一种语音播报装置,其特征在于,包括:
获得模块,用于获得待播报的内容;
选择模块,用于从保存的语声素材中为所述获得模块获得的待播报的内容选择对应的语声素材;
播报模块,用于使用所述选择模块选择的语声素材将所述待播报的内容转换为语音进行播报;
所述保存的语声素材包括与所述用户有社交关系的其他用户的语声素材、与所述用户有社交关系的其他用户的语声素材和所述用户创建的语声素材;
所述装置,还包括:接收模块、下载模块和保存模块;
所述接收模块,用于在所述选择模块为所述待播报的内容选择对应的语声素材之前,接收所述用户的下载请求;
所述下载模块,用于根据所述接收模块接收的下载请求,从云端服务器下载所述用户有访问权限的语声素材;
所述保存模块,用于保存所述下载模块下载的语声素材。
7.根据权利要求6所述的装置,其特征在于,
所述选择模块,具体用于根据所述用户设置的播报内容与语声素材的对应关系,从保存的语声素材中为所述待播报的内容选择对应的语声素材;或者,根据所述用户当前所在的位置,以及所述用户设置的所述用户所在位置与语声素材的对应关系,从保存的语声素材中为所述待播报的内容选择对应的语声素材。
8.根据权利要求6所述的装置,其特征在于,还包括:保存模块;
所述获得模块,还用于在所述选择模块为所述待播报的内容选择对应的语声素材之前,获得所述用户创建的语声素材;
所述保存模块,用于保存所述获得模块获得的所述用户创建的语声素材。
9.根据权利要求8所述的装置,其特征在于,还包括:接收模块;
所述接收模块,用于接收所述用户的语声素材创建请求;
所述获得模块包括:展示子模块和生成子模块;
所述展示子模块,用于在所述接收模块接收到所述用户的语声素材创建请求之后,向所述用户展示语音录入引导提示;
所述接收模块,还用于接收所述用户根据所述展示子模块展示的语音录入引导提示录入的语音元素;
所述生成子模块,用于在确定所述语音元素有效并且达到语音合成的满足度之后,将所述接收模块接收的语音元素生成语声素材。
10.根据权利要求8或9所述的装置,其特征在于,还包括:上传模块;
所述上传模块,用于在所述获得模块获得所述用户创建的语声素材之后,将所述用户创建的语声素材上传到云端服务器,以便所述云端服务器保存所述用户创建的语声素材,以及保存所述用户设置的针对所述用户创建的语声素材的访问权限。
CN201510535732.5A 2015-08-27 2015-08-27 语音播报方法和装置 Active CN105047193B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510535732.5A CN105047193B (zh) 2015-08-27 2015-08-27 语音播报方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510535732.5A CN105047193B (zh) 2015-08-27 2015-08-27 语音播报方法和装置

Publications (2)

Publication Number Publication Date
CN105047193A CN105047193A (zh) 2015-11-11
CN105047193B true CN105047193B (zh) 2019-02-22

Family

ID=54453683

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510535732.5A Active CN105047193B (zh) 2015-08-27 2015-08-27 语音播报方法和装置

Country Status (1)

Country Link
CN (1) CN105047193B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107968828B (zh) * 2017-11-30 2020-09-04 美的集团股份有限公司 家电语音播报方法、装置及设备
CN109616094A (zh) * 2018-12-29 2019-04-12 百度在线网络技术(北京)有限公司 语音合成方法、装置、系统及存储介质
CN109712646A (zh) * 2019-02-20 2019-05-03 百度在线网络技术(北京)有限公司 语音播报方法、装置和终端
CN111432030B (zh) * 2020-04-17 2023-11-28 支付宝(杭州)信息技术有限公司 一种信息发布方法、装置、设备及介质
CN112489636A (zh) * 2020-10-15 2021-03-12 南京创维信息技术研究院有限公司 一种智能语音播报助手选择方法和系统
CN112466279B (zh) * 2021-02-02 2021-05-18 深圳市阿卡索资讯股份有限公司 一种英语口语发音自动纠正方法和装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103117057A (zh) * 2012-12-27 2013-05-22 安徽科大讯飞信息科技股份有限公司 一种特定人语音合成技术在手机漫画配音中的应用方法
US8909538B2 (en) * 2004-01-12 2014-12-09 Verizon Patent And Licensing Inc. Enhanced interface for use with speech recognition
CN104200803A (zh) * 2014-09-16 2014-12-10 北京开元智信通软件有限公司 一种语音播放方法、装置及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8909538B2 (en) * 2004-01-12 2014-12-09 Verizon Patent And Licensing Inc. Enhanced interface for use with speech recognition
CN103117057A (zh) * 2012-12-27 2013-05-22 安徽科大讯飞信息科技股份有限公司 一种特定人语音合成技术在手机漫画配音中的应用方法
CN104200803A (zh) * 2014-09-16 2014-12-10 北京开元智信通软件有限公司 一种语音播放方法、装置及系统

Also Published As

Publication number Publication date
CN105047193A (zh) 2015-11-11

Similar Documents

Publication Publication Date Title
CN105047193B (zh) 语音播报方法和装置
US11523152B2 (en) Dynamic video background responsive to environmental cues
US9431002B2 (en) Real time popularity based audible content aquisition
US20150296033A1 (en) Life Experience Enhancement Via Temporally Appropriate Communique
CN103414787B (zh) 一种基于云服务的内容公播系统和方法
CN105581570B (zh) 浴室的控制系统、方法和浴室镜
CN111279709B (zh) 提供视频推荐
US20150317699A1 (en) Method, apparatus, device and system for inserting audio advertisement
US20150295879A1 (en) Life Experience Memorialization Enhancement Via Coordinated Coupling
CN104618446A (zh) 一种实现多媒体推送的方法和装置
US11641500B2 (en) Method and system for customized content
US20240129349A1 (en) Systems and methods for concurrent content presentation
US10755707B2 (en) Selectively blacklisting audio to improve digital assistant behavior
CA3223975A1 (en) Image analysis system
US20150052621A1 (en) Media content streaming service
US10397296B2 (en) Comment link for shared streaming media content
US20160182942A1 (en) Real Time Combination of Listened-To Audio on a Mobile User Equipment With a Simultaneous Video Recording
CN108124188B (zh) 一种影音系统运行方法
CN105551504A (zh) 一种基于哭声触发智能移动终端功能应用的方法及装置
CN105915653B (zh) 媒体文件的下载方法和装置
CN105828135B (zh) 音视频播放系统中的播放控制方法、装置及播放设备
US11388467B1 (en) Media content distribution platform
EP4055598A1 (en) User generated content with esrb ratings for auto editing playback based on a player's age, country, legal requirements
CN111698563A (zh) 基于ai虚拟主播的内容发送方法、装置和存储介质
CN109067838B (zh) 一种数据的推送方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant