CN111259125A

CN111259125A - 语音播报的方法和装置、智能音箱、电子设备、存储介质

Info

Publication number: CN111259125A
Application number: CN202010037206.7A
Authority: CN
Inventors: 侯柏岑
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Baidu Online Network Technology Beijing Co Ltd; Shanghai Xiaodu Technology Co Ltd
Priority date: 2020-01-14
Filing date: 2020-01-14
Publication date: 2020-06-09
Anticipated expiration: 2040-01-14
Also published as: CN111259125B

Abstract

本公开实施例公开了一种语音播报的方法和装置、智能音箱、电子设备、存储介质，涉及人工智能技术领域。包括：响应于用户发起的针对目标语言的学习请求，获取用户应用目标语言的能力信息和/或场景信息，从目标语言对应的学习内容中，确定与能力信息和/或场景信息对应的目标学习内容，基于目标学习内容进行语音播报，通过针对用户的能力信息进行相应学习内容的语音播报，可以实现满足不同语言能力的用户的学习需求，即可实现学习需求多样化的语音播报；和/或，通过针对用户应用该语言的场景进行相应学习内容的语音播报，可以实现满足不同应用场景时相同用户或不同用户的学习需求，即可实现场景需求多样化的语音播报。

Description

语音播报的方法和装置、智能音箱、电子设备、存储介质

技术领域

本公开涉及计算机技术领域，尤其涉及人工智能技术领域，具体涉及一种语音播报的方法和装置、智能音箱、电子设备、存储介质。

背景技术

随着人工智能的发展，智能设备被广泛地应用于生活、学习和工业生产中。如，智能设备(包括智能音箱等)可用于辅助用户的语言学习。

在现有技术中，智能设备主要针对儿童的语言学习，如智能设备中可预先存储部分词汇或者短语，当开启智能设备的语言学习功能时，智能设备可对词汇或短语进行播报。当然，用户也可基于需求对词汇或者短语进行更新。

然而，发明人在实现本公开实施例的过程中，发现至少存在以下问题：由于不同的用户的语言能力不同，和/或，用户应用语言的场景不同(如商务用语和生活用语等)，用户需要学习的知识点和可接受的知识点也不相同，因此当采用现有技术中的智能设备基于预存的词汇或者短语进行语音播报时，可能造成语音播报缺乏灵活性，无法满足不同用户的学习需求的问题。

发明内容

根据本公开实施例的一个方面，本公开实施例提供了一种语音播报的方法，所述方法包括：

响应于用户发起的针对目标语言的学习请求，获取所述用户应用所述目标语言的能力信息和/或场景信息；

从所述目标语言对应的学习内容中，确定与所述能力信息和/或场景信息对应的目标学习内容；

基于所述目标学习内容进行语音播报。

在本公开实施例中，通过针对用户的能力信息进行相应学习内容的语音播报，可以实现满足不同语言能力的用户的学习需求，即可实现学习需求多样化的语音播报；和/或，通过针对用户应用该语言的场景进行相应学习内容的语音播报，可以实现满足不同应用场景时相同用户或不同用户的学习需求，即可实现场景需求多样化的语音播报。

因此，通过获取能力信息和/或场景信息，并基于能力信息和/或场景信息确定目标学习内容，以便基于目标学习内容进行语音播报，可以实现语音播报的多样性和灵活性，提高用户的学习体验等技术效果。

在一些实施例中，响应于所述学习请求中携带对话指令，在所述从所述目标语言对应的学习内容中，确定与所述能力信息和/或场景信息对应的目标学习内容之后，所述方法还包括：

接收所述用户发起的音频信息；

对所述音频信息进行解析，得到所述音频信息对应的意图；

以及，所述基于所述目标学习内容进行语音播报包括：

从所述目标学习内容中选取与所述意图对应的内容，并基于选取出的内容进行语音播报。

在现有技术中，语音播报往往是语言资源的播放，而在本公开实施例中，可通过对话指令进入对话模式，且通过对音频信息进行解析得到意图，并基于意图确定应答意图的内容，以便基于应答意图的内容进行语音播报，可以实现基于目标学习内容与用户进行对话，从而提高用户使用目标语言进行交流的能力。

在一些实施例中，在所述获取所述用户应用所述目标语言的能力信息和/或场景信息之后，所述方法还包括：

采集所述用户的图像信息；

根据所述图像信息对所述能力信息和/或场景信息进行调整。

在本公开实施例中，可对能力信息和/或场景信息进行适应性地调整，以使得用户学习的内容更加贴合用户自身的情况，从而实现提高用户学习的积极性，且提高用户的学习进度。

在一些实施例中，响应于所述学习请求中携带语音播报模式，所述基于所述目标学习内容进行语音播报包括：基于所述语音播报模式对所述目标学习内容进行语音播报。

在本公开实施例中，通过语音播报模式进行语音播报，可以满足不同用户的语音播报的需求，且实现语音播报的灵活性和多样性，且便于用户更加准确地掌握学习内容，提高学习效率。

在一些实施例中，在所述基于所述语音播报模式对所述目标学习内容进行语音播报之后，所述方法还包括：

接收所述用户发起的调整所述语音播报模式的调整指令；

基于所述调整指令对所述语音播报模式进行调整；

基于调整后的语音播报模式对所述目标学习内容进行语音播报。

在一些实施例中，响应于所述学习请求中携带语音信息，所述获取所述用户应用所述目标语言的能力信息和/或场景信息包括：

采集所述用户的所述语音信息；

对所述语音信息进行分析，得到所述能力信息和/或场景信息。

根据本公开实施例的一个方面，本公开实施例提供了一种语音播报的装置，所述装置包括：

获取模块，用于响应于用户发起的针对目标语言的学习请求，获取所述用户应用所述目标语言的能力信息和/或场景信息；

确定模块，用于从所述目标语言对应的学习内容中，确定与所述能力信息和/或场景信息对应的目标学习内容；

播报模块，用于基于所述目标学习内容进行语音播报。

在一些实施例中，响应于所述学习请求中携带对话指令，所述装置还包括：

第一接收模块，用于接收所述用户发起的音频信息；

解析模块，用于对所述音频信息进行解析，得到所述音频信息对应的意图；

以及，所述播报模块用于，从所述目标学习内容中选取与所述意图对应的内容，并基于选取出的内容进行语音播报。

在一些实施例中，所述装置还包括：

采集模块，用于采集所述用户的图像信息；

第一调整模块，用于根据所述图像信息对所述能力信息和/或场景信息进行调整。

在一些实施例中，响应于所述学习请求中携带语音播报模式，所述播报模块用于，基于所述语音播报模式对所述目标学习内容进行语音播报。

在一些实施例中，所述装置还包括：

第二接收模块，用于接收所述用户发起的调整所述语音播报模式的调整指令；

第二调整模块，用于基于所述调整指令对所述语音播报模式进行调整；

所述播报模块用于，基于调整后的语音播报模式对所述目标学习内容进行语音播报。

在一些实施例中，响应于所述学习请求中携带语音信息，所述获取模块用于，采集所述用户的所述语音信息，对所述语音信息进行分析，得到所述能力信息和/或场景信息。

根据本公开实施例的一个方面，本公开实施例提供了一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行如上任一实施例所述的方法。

根据本公开实施例的一个方面，本公开实施例提供了一种智能音箱，包括：如上任一实施例项所述的语音播报的装置；或者，如上述实施例所述的电子设备。

根据本公开实施例的一个方面，本公开实施例提供了一种存储有计算机指令的非瞬时计算机可读存储介质，所述计算机指令用于使所述计算机执行如上任一实施例所述的方法。

本公开实施例提供了一种语音播报的方法和装置、智能音箱、电子设备、存储介质，包括：响应于用户发起的针对目标语言的学习请求，获取用户应用目标语言的能力信息和/或场景信息，从目标语言对应的学习内容中，确定与能力信息和/或场景信息对应的目标学习内容，基于目标学习内容进行语音播报，通过针对用户的能力信息进行相应学习内容的语音播报，可以实现满足不同语言能力的用户的学习需求，即可实现学习需求多样化的语音播报；和/或，通过针对用户应用该语言的场景进行相应学习内容的语音播报，可以实现满足不同应用场景时相同用户或不同用户的学习需求，即可实现场景需求多样化的语音播报，即通过获取能力信息和/或场景信息，并基于能力信息和/或场景信息确定目标学习内容，以便基于目标学习内容进行语音播报，可以实现语音播报的多样性和灵活性，提高用户的学习体验等技术效果。

上述可选方式所具有的其他效果将在下文中结合具体实施例加以说明。

附图说明

附图用于更好地理解本方案，不构成对本公开的限定。其中：

图1为本公开实施例的语音播报的方法的流程示意图；

图2为本公开实施例的语音播报的方法的场景示意图；

图3为本公开实施例的语音播报的装置的显示界面的示意图；

图4为本公开另一实施例的语音播报的装置的显示界面的示意图；

图5为本公开另一实施例的语音播报的装置的显示界面的示意图；

图6为本公开另一实施例的语音播报的装置的显示界面的示意图；

图7为本公开另一实施例的语音播报的装置的显示界面的示意图；

图8为本公开另一实施例的语音播报的方法的场景示意图；

图9为本公开另一实施例的语音播报的方法的流程示意图；

图10为本公开另一实施例的语音播报的装置的显示界面的示意图；

图11为本公开另一实施例的语音播报的装置的显示界面的示意图；

图12为本公开实施例的语音播报的装置的示意图；

图13为本公开另一实施例的语音播报的装置的示意图；

图14为本公开实施例的电子设备的框图。

具体实施方式

以下结合附图对本公开实施例的示范性实施例做出说明，其中包括本公开实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本公开实施例的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

基于上述背景技术的描述可知，智能设备可用于语言的学习。

然而，在现有技术中，智能设备大多以固定的方式进行语音播报。例如：双语儿歌“爸爸的妈妈叫奶奶、grandma、grandma”；或者，播报英文歌曲；或者，播报英文新闻，等等。也就是说，在现有技术中，智能设备更多的是作为语言资源的播放的设备，存在缺乏语音播报的灵活性，无法满足不同用户的学习需求的问题。

而本公开发明人在经过创造性劳动后，想到一种灵活性较强的语音播报的方法，如针对用户的语言能力和/或针对不同的语言的应用场景进行适应性的语音播报。具体地，智能设备可接收用户发起的不同语言的学习请求，并对用户使用某种语言的语言能力信息和/或场景信息进行确定，以便选取与相应的学习内容进行语音播报。

例如，智能设备接收用户发起的针对英语的学习请求，且确定出用户使用英语的能力信息为英语六级，则可选取与英语六级对应的学习内容，并基于选取出的学习内容进行语音播报，如播报英语六级对应的英语短文等。

基于上述对比分析可知，采用本公开实施例的语音播报的方法，通过针对用户的能力信息进行相应学习内容的语音播报，可以实现满足不同语言能力的用户的学习需求，即可实现学习需求多样化的语音播报；和/或，通过针对用户应用该语言的场景进行相应学习内容的语音播报，可以实现满足不同应用场景时相同用户或不同用户的学习需求，即可实现场景需求多样化的语音播报。

下面以具体地实施例对本公开的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合，对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图，对本公开的实施例进行描述。

根据本公开实施例的一个方面，本公开实施例提供了一种语音播报的方法。

请参阅图1，图1为本公开实施例的语音播报的方法的流程示意图。

如图1所示，该方法包括：

S101：响应于用户发起的针对目标语言的学习请求，获取用户应用目标语言的能力信息和/或场景信息。

其中，本公开实施例的语音播报的方法的执行主体可以为语音播报的装置。在一些实施例中，语音播报的装置可以为独立的设备，如智能设备，包括居家使用的智能音箱；也可为设置于其他设备上的装置，如设置于车辆上的语音播报的装置；也可以为集成于其他设备上的组件，如集成于车载盒子上的语音播报的组件；也可以为集成于其他设备上的芯片，如集成于学习机上的语音播报芯片，等等。

也就是说，本公开实施例的语音播报的装置可以为独立存在的装置，也可以为与其他装置或设备一体合成的组件，也可以为可以运行本公开实施例的语音播报的方法的芯片。

其中，目标语言用于表征用户想要学习的语言。即，目标语言为众多语言中的一种，如英语、法语和德语等。

也就是说，当用户有学习某种语言的需求时，则可向语音播报的装置发起针对该语言的学习请求。

其中，用户可至少通过两种方式向语音播报的装置发起学习请求。

例如，用户可通过手动输入的方式向语音播报的装置发起学习请求，也可以通过语音的方式向语音播报的装置发起学习请求。

其中，用户通过手动输入的方式向语音播报的装置发起学习请求又可至少分为两种方式。

例如，用户可通过按压语音播报的装置上的按钮向语音播报装置发起学习请求，也可通过在语音播报的装置的显示器输入并向语音播报的装置发起学习请求。

在一些实施例中，若学习请求中携带文本信息，则语音播报的装置可对文本信息进行分析，得到能力信息和/或场景信息。

例如，基于上述示例，用户通过在语音播报的装置的显示器上输入并学习请求时，可同时输入与能力信息和/或场景信息对应的文本信息。语音播报的装置在接收到学习请求时，从学习请求中提取文本信息，并对文本信息进行分析，得到能力信息和/或场景信息。

在另一些实施例中，若学习请求中携带语音信息，则语音播报的装置可对文本信息进行解析，得到能力信息和/或场景信息。

例如，基于上述示例，用户通过语音的方式向语音播报的装置发起学习请求时，可同时在学习请求的语音中携带与能力信息和/或场景信息对应的语音信息。语音播报的装置在接收到学习请求时，从学习请求中提取语音信息，并对文本语音进行分析，得到能力信息和/或场景信息。

其中，能力信息用于表征用户对目标语言应用的水平。也就是说，能力信息可以理解为用户对目标语言掌握的熟练程度。

例如，若目标语言为英语，则能力信息用于表征用户应用英语的水平，即用户应用英语的能力。能力信息可通过英语等级进行体现，如英语四六级等。

其中，场景信息用于表征用户目标语言应用的场合。也就是说，场景信息可以理解为用户应用目标语言的场景。

例如，若目标语言为英语，则场景信息用于表征用户应用英语的场合，如商务英语、雅思英语和托福英语等。

S102：从目标语言对应的学习内容中，确定与能力信息和/或场景信息对应的目标学习内容。

其中，不同的语言对应的学习内容不同。如英语的学习内容可包括英语单词、英语短语和英语语法等，而汉语的学习内容可包括汉语拼音、词组和成语等。

该步骤可具体包括：选取与目标语言对应的学习内容，并从选取出的学习内容中选取与能力信息和/或场景信息对应的学习内容。

基于上述示例，若目标语言为英语，能力信息为六级，则该步骤包括：从各语言对应的各学习内容中选取与英语对应的学习内容，并从英语对应的学习内容中选取与六级对应的学习内容。

同理，基于上述示例，若目标语言为英语，场景信息为商务英语，则该步骤包括：从各语言对应的各学习内容中选取与英语对应的学习内容，并从英语对应的学习内容中选取与商务英语对应的学习内容。

同理，基于上述示例，若目标语言为英语，能力信息为初级，场景信息为商务英语，则该步骤包括：从各语言对应的各学习内容中选取与英语对应的学习内容，并从英语对应的学习内容中选取与商务英语对应的学习内容，并从商务英语对应的学习内容中选取与初级对应的学习内容(即目标学习内容)。当然，也可先从英语对应的学习内容中选取与初级对应的学习内容，然后从初级对应的学习内容中选取与商务英语对应的学习内容(即目标学习内容)。

也就是说，当基于能力信息和场景信息从目标语言对应的学习内容中选取相应的学习内容时，可先基于能力信息进行选取，也可基于场景信息进行选取，在本公开实施例中，对学习内容选取的先后顺序不做限定。

S103：基于目标学习内容进行语音播报。

在本公开实施例中，由于目标学习内容是基于能力信息和/或场景信息确定的，因此，当语音播报的装置基于目标学习内容进行语音播报时，实际是基于用户的需求进行语音播报，所以，可以实现满足不同应用场景时相同用户或不同用户的学习需求，即可实现场景需求多样化的语音播报的技术效果。

为使更加深刻地理解本公开实施例的方案，现以目标语言为英语，语音播报的装置为智能音箱，且结合如图2所示的应用场景对本公开实施例的方案进行详细地阐述。

在如图2所示的应用场景中，用户100可通过手动输入的方式与智能音箱200进行交互。

其中，智能音箱200的桌面显示示意图可参见图3。当然，用户可以基于需求对至少部分应用软件进行删减，也可基于需求增加应用软件。

在本公开实施例中，用户可通过点击“学习”进入如图4所示的显示界面。

其中，图4中示范性地介绍了八种学习的类型。用户可通过点击“语言”进入如图5所示的显示界面。

其中，图4中示范性地介绍了四种语言的类型。

在一些实施例中，用户可通过点击“英语”进入如图6所示的显示界面。

如图6所示，用户可在“输入文本信息”处输入相关的信息，如用户应用英语的能力信息和/或场景信息，并点击“开始学习”(即学习请求)进入学习状态。

在另一些实施例中，用户可通过点击“英语”进入如图7所示的显示界面。

如图7所示，用户点击“英语”后，可对学习方向进行选择，并可选择相应的能力信息和/或场景信息，并点击“开始学习”(即学习请求)进入学习状态。

值得说明的是，上述显示界面只是用于对本公开实施例的语音播报的方法的示范性地说明，而不能理解为对本公开实施例的语音播报的方法的限定，更不能理理解为对智能音箱的显示界面地限定。

上述应用场景为用户通过手动输入的方式与智能音箱进行交互的应用场景。下面将以用户通过语音的方式与语音播报的装置，且目标语言为英语，语音播报的装置为智能机器人为例，并结合如图8所示的应用场景对本公开实施例的方案进行详细地阐述。

在如图8所示的应用场景中，用户100可通过语音的方式与智能机器300人进行交互，进而实现语言的学习。

例如，用户通过唤醒词对智能机器人进行唤醒。如：“小度小度”。

智能机器人接收到唤醒词进入唤醒状态，并回复：“在呢在呢”。

用户：我要学习英语短句(即学习请求)。

智能机器人：收到，主人。小度为您带来的第一个英语短句为“今天星期五，Todayis Friday……。

结合图9可知，在一些实施例中，响应于学习请求中携带对话指令，在S102之后，该方法还包括：

S21：接收用户发起的音频信息。

其中，对话指令用于表征启动语音播报的装置基于用户发出的语句确定回复该语句的回复语句，并基于该回复语句进行语音播报的功能的指令。

例如，对话指令可以为触发语句“I want to speak with you in English”，或者“Can you answer my question in English”。

当然，在另一些实施例中，用户也可通过在显示界面上选择“对话”，以便触发对话指令，如图10所示。

S22：对音频信息进行解析，得到音频信息对应的意图。

其中，意图用于表征音频信息所表达的内容。

基于上述示例，若用户选取的为英语六级的学习请求，且学习请求中携带对话指令，且用户发起的音频信息为“I am working 70hours this week！I cannot bear it”(该音频信息属于英语六级的学习内容中某一语句)。

则语音播报的装置对该音频信息进行解析，得到意图“我这个星期工作了70个小时。我受不了了”。

以及，S103包括：从目标学习内容中选取与意图对应的内容，并基于选取出的内容进行语音播报。

基于上述示例，语音播报的装置从目标学习内容(即英语六级对应的学习内容)中选取与“我这个星期工作了70个小时。我受不了了”对应的内容“You are totally maxedout.I would be dead if I worked this hard”。

在一些实施例中，在S101之后，该方法还可包括：

S11：采集用户的图像信息。

在一些实施例中，语音播报的装置可以包括摄像头，通过摄像头对图像信息进行采集。

S12：根据图像信息对能力信息和/或场景信息进行调整。

在本公开实施例中，通过图像信息对能力信息和/或场景信息进行调整，可以避免因用户的误操作导致的期望学习的内容与实际学习的内容不相同的问题。

例如，用户可在语音播报的装置上创建至少一个用户信息，包括用户名和用户的图像等，用户在完成某次学习后，语音播报的装置可自动更新用户的信息，如更新用户的学习时长，用户的能力信息等。

语音播报的装置采集用户的图像信息，并基于该图像信息确定该用户为已经创建了用户信息的用户，且基于用户信息可知该用户的能力信息为六级，若用户选择的能力信息为四级，则语音播报的装置可对用户选择的能力信息(即四级)进行调整(具体可为调整至六级)。

当然，在一些实施例中，语音播报的装置在对能力信息进行调整之前，可向用户发起询问信息，以询问用户是否对能力信息进行调整。

例如，语音播报的装置可生成并在显示界面上显示询问信息“是否将四级调整为六级”，用户可在显示界面选择“是”，以确定将四级调整为六级，也可在显示界面选择“否”，以确定不做调整。

当然，语音播报的装置也可通过语音的方式向用户发起询问，如“主人，您已战胜四级，是否挑战六级呢”。而用户则可通过语音的方式进行回复。如，若用户回复“挑战六级”，则语音播报的装置将能力信息由四级调整为六级。

在一些实施例中，响应于学习请求中携带语音播报模式，基于目标学习内容进行语音播报包括：基于语音播报模式对目标学习内容进行语音播报。

其中，语音播报模式用于表征语音播报时使用的语言的种类，如双语播报或者单语播报，且若当为双语播报时，语音播报的语言的顺序。即，可从两方面对语音播报模式进行理解，一方面为语音播报的语言的种类，另一方面为语音播报的语言的先后顺序。

例如，若目标语言为英语，语音播报时可采用英语播报，也可采用汉英语双报，若为汉英语双报，则可先播报英语，再播报汉语，也可先播报汉语，再播报英语。

在一些实施例中，用户可在语音播报的装置的显示界面上进行语音播报模式的选择，可参阅图11。

如图11所示，若用户选择“英语播报”，则语音播报的装置仅播报英语；若用户选择“汉英语双报”，则语音播报的装置先播报汉语，再播报英语；若用户选择“英汉语双报”，则语音播报的装置先播报英语，再播报汉语。

在一些实施例中，用户还可向语音播报的装置发起调整语音播报模式的调整指令，语音播报的装置基于调整指令对语音播报模式进行调整，并基于调整后的语音播报模式对目标学习内容进行语音播报。

基于上述示例，若用户之前选择的语音播报模式为“英语播报”，而为了保证学习的效果，用户向语音播报的装置发起了调整指令，且调整后的语音播报模式为“英汉语双报”，则语音播报的装置后续对目标学习内容进行语音播报时，先播报英语，再播报汉语。

根据本公开实施例的另一个方面，本公开实施例还提供了一种语音播报的装置。

请参阅图12，图12为本公开实施例的语音播报的装置的示意图。

如图12所示，该装置包括：

获取模块11，用于响应于用户发起的针对目标语言的学习请求，获取所述用户应用所述目标语言的能力信息和/或场景信息；

确定模块12，用于从所述目标语言对应的学习内容中，确定与所述能力信息和/或场景信息对应的目标学习内容；

播报模块13，用于基于所述目标学习内容进行语音播报。

结合图13可知，在一些实施例中，响应于所述学习请求中携带对话指令，所述装置还包括：

第一接收模块14，用于接收所述用户发起的音频信息；

解析模块15，用于对所述音频信息进行解析，得到所述音频信息对应的意图；

以及，所述播报模块13用于，从所述目标学习内容中选取与所述意图对应的内容，并基于选取出的内容进行语音播报。

结合图13可知，在一些实施例中，所述装置还包括：

采集模块16，用于采集所述用户的图像信息；

第一调整模块17，用于根据所述图像信息对所述能力信息和/或场景信息进行调整。

结合图13可知，在一些实施例中，所述装置还包括：

第二接收模块18，用于接收所述用户发起的调整所述语音播报模式的调整指令；

第二调整模块19，用于基于所述调整指令对所述语音播报模式进行调整；

所述播报模块13用于，基于调整后的语音播报模式对所述目标学习内容进行语音播报。

在一些实施例中，响应于所述学习请求中携带语音信息，所述获取模块11用于，采集所述用户的所述语音信息，对所述语音信息进行分析，得到所述能力信息和/或场景信息。

根据本公开的实施例的另一个方面，本公开还提供了一种电子设备和一种可读存储介质。

如图14所示，是根据本公开实施例的电子设备的框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本公开实施例的实现。

如图14所示，该电子设备包括：一个或多个处理器101、存储器102，以及用于连接各部件的接口，包括高速接口和低速接口。各个部件利用不同的总线互相连接，并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理，包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如，耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中，若需要，可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样，可以连接多个电子设备，各个设备提供部分必要的操作(例如，作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图14中以一个处理器101为例。

存储器102即为本公开实施例所提供的非瞬时计算机可读存储介质。其中，所述存储器存储有可由至少一个处理器执行的指令，以使所述至少一个处理器执行本公开实施例所提供的语音播报的方法。本公开实施例的非瞬时计算机可读存储介质存储计算机指令，该计算机指令用于使计算机执行本公开实施例所提供的语音播报的方法。

存储器102作为一种非瞬时计算机可读存储介质，可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块，如本公开实施例中的推荐对应的程序指令/模块。处理器101通过运行存储在存储器102中的非瞬时软件程序、指令以及模块，从而执行服务器的各种功能应用以及数据处理，即实现上述方法实施例中的语音播报的方法。

存储器102可以包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需要的应用程序；存储数据区可存储根据电子设备的使用所创建的数据等。此外，存储器102可以包括高速随机存取存储器，还可以包括非瞬时存储器，例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中，存储器102可选包括相对于处理器101远程设置的存储器，这些远程存储器可以通过网络连接至电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、区块链服务网络(Block-chain-based Service Network，BSN)、移动通信网及其组合。

电子设备还可以包括：输入装置103和输出装置104。处理器101、存储器102、输入装置103和输出装置104可以通过总线或者其他方式连接，图14中以通过总线连接为例。

输入装置103可接收输入的数字或字符信息，以及产生与电子设备的用户设置以及功能控制有关的键信号输入，例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置104可以包括显示设备、辅助照明装置(例如，LED)和触觉反馈装置(例如，振动电机)等。该显示设备可以包括但不限于，液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中，显示设备可以是触摸屏。

此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令，并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的，术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如，磁盘、光盘、存储器、可编程逻辑装置(PLD))，包括，接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、区块链服务网络(Block-chain-based ServiceNetwork，BSN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本公开保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等，均应包含在本公开保护范围之内。

Claims

1.一种语音播报的方法，其特征在于，所述方法包括：

基于所述目标学习内容进行语音播报。

2.根据权利要求1所述的方法，其特征在于，响应于所述学习请求中携带对话指令，在所述从所述目标语言对应的学习内容中，确定与所述能力信息和/或场景信息对应的目标学习内容之后，所述方法还包括：

接收所述用户发起的音频信息；

对所述音频信息进行解析，得到所述音频信息对应的意图；

以及，所述基于所述目标学习内容进行语音播报包括：

3.根据权利要求1所述的方法，其特征在于，在所述获取所述用户应用所述目标语言的能力信息和/或场景信息之后，所述方法还包括：

采集所述用户的图像信息；

根据所述图像信息对所述能力信息和/或场景信息进行调整。

4.根据权利要求1至3中任一项所述的方法，其特征在于，响应于所述学习请求中携带语音播报模式，所述基于所述目标学习内容进行语音播报包括：基于所述语音播报模式对所述目标学习内容进行语音播报。

5.根据权利要求4所述的方法，其特征在于，在所述基于所述语音播报模式对所述目标学习内容进行语音播报之后，所述方法还包括：

接收所述用户发起的调整所述语音播报模式的调整指令；

基于所述调整指令对所述语音播报模式进行调整；

6.根据权利要求1至3中任一项所述的方法，其特征在于，响应于所述学习请求中携带语音信息，所述获取所述用户应用所述目标语言的能力信息和/或场景信息包括：

采集所述用户的所述语音信息；

7.一种语音播报的装置，其特征在于，所述装置包括：

播报模块，用于基于所述目标学习内容进行语音播报。

8.根据权利要求7所述的装置，其特征在于，响应于所述学习请求中携带对话指令，所述装置还包括：

第一接收模块，用于接收所述用户发起的音频信息；

9.根据权利要求7所述的装置，其特征在于，所述装置还包括：

采集模块，用于采集所述用户的图像信息；

10.根据权利要求7至9中任一项所述的装置，其特征在于，响应于所述学习请求中携带语音播报模式，所述播报模块用于，基于所述语音播报模式对所述目标学习内容进行语音播报。

11.根据权利要求10所述的装置，其特征在于，所述装置还包括：

12.根据权利要求7至9中任一项所述的装置，其特征在于，响应于所述学习请求中携带语音信息，所述获取模块用于，采集所述用户的所述语音信息，对所述语音信息进行分析，得到所述能力信息和/或场景信息。

13.一种电子设备，其特征在于，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-6中任一项所述的方法。

14.一种智能音箱，其特征在于，包括：如权利要求7至12中任一项所述的语音播报的装置；或者，如权利要求13所述的电子设备。

15.一种存储有计算机指令的非瞬时计算机可读存储介质，其特征在于，所述计算机指令用于使所述计算机执行权利要求1-6中任一项所述的方法。