WO2021008128A1

WO2021008128A1 - 一种基于智能语音识别的学习方法、终端及存储介质

Info

Publication number: WO2021008128A1
Application number: PCT/CN2020/073079
Authority: WO
Inventors: 岳顺
Original assignee: 深圳创维－Rgb电子有限公司
Priority date: 2019-07-15
Filing date: 2020-01-20
Publication date: 2021-01-21
Also published as: CN110430465B; CN110430465A

Abstract

本公开公开了一种基于智能语音识别的学习方法、终端及存储介质，本公开通过智能语音识别提取在线视频的学习场景，并将学习场景转换为学习数据，以便于用户在观看学习类的视频时，能够灵活控制知识点的播放，提升用户的学习能力。

Description

一种基于智能语音识别的学习方法、终端及存储介质

技术领域

本公开涉及终端应用领域，例如涉及一种基于智能语音识别的学习方法、终端及存储介质。

背景技术

随着互联网技术的发展，消费者可以更加容易地利用互联网来获取各种各样的在线视频资源，并利用在线视频资源来进行观看和学习；针对一些学习的视频资源，用户大都是反复观看视频内容，以此来获取视频中的知识，因此，缺乏与视频内容之间的互动，不能加强对学习内容的理解。

伴随着硬件和软件的发展，智能语音识别的技术也得到了快速的发展；虽然，智能语音识别能够利用算法精准地将语音信息转换为文字信息，并理解用户的意图；但是，对于需要学习的用户来说，智能语音识别并不能获取用户的学习进度，从而找到用户现阶段需要的学习资源，提升用户的学习能力。

因此，现有技术还有待于改进和发展。

发明内容

本公开要解决的技术问题在于，针对现有技术缺陷，本公开提供一种基于智能语音识别的学习方法、终端及存储介质，通过智能语音识别提取在线视频的学习场景，并将学习场景转换为学习数据，以便于用户在观看学习类的视频时，能够灵活控制知识点的播放，提升用户的学习能力。

本公开解决技术问题所采用的技术方案如下：

本公开提供一种基于智能语音识别的学习方法，其中，所述基于智能语音识别的学习方法包括以下步骤：

终端获取服务器配置的在线学习视频，并将所述在线学习视频以列表的形式在所述终端的显示屏上进行显示；

当所述终端接收用户输入的播放指令时，根据所述播放指令播放所述在线学习视频，并进入学习模式；

当所述终端进入所述学习模式时，通过智能语音识别接收用户输入的语音指令，并根据所述语音指令将所述在线学习视频切换到对应的学习场景。

进一步地，所述学习场景包括单词学习场景、对话学习场景以及单词对话交叉学习场景。

进一步地，所述终端获取服务器配置的在线学习视频，并将所述在线学习视频以列表的形式在所述终端的显示屏上进行显示之前还包括：

在所述服务器上配置所述线学习视频。

进一步地，所述终端获取服务器配置的在线学习视频，并将所述在线学习视频以列表的形式在所述终端的显示屏上进行显示具体包括以下步骤：

所述终端向所述服务器发送获取所述在线学习视频的请求；

所述终端接收所述服务器发送的所述在线学习视频的列表，并将所述列表显示在所述终端的显示屏上。

进一步地，所述当所述终端接收用户输入的播放指令时，根据所述播放指令播放所述在线学习视频，并进入学习模式具体包括以下步骤：

当所述终端接收所述播放指令时，判断所述播放指令是否为播放所述在线学习视频的指令；

当所述播放指令为播放所述在线学习视频的指令时，向所述服务器发送下载所述在线学习视频的请求；

接收并播放从所述服务器下载的所述在线学习视频，并在所述终端的显示屏上提示所述用户是否进入所述学习模式；

当所述用户选择进入学习模式时，所述终端开启智能语音识别功能。

进一步地，所述当所述终端接收所述播放指令时，判断所述播放指令是否为播放所述在线学习视频的指令之前还包括：

将所述终端的显示屏上的在线视频划分为在线学习视频专区和非学习视频区域。

进一步地，所述在所述终端的显示屏上提示所述用户是否进入所述学习模式具体包括：

以对话框的形式提示所述用户是否进入学习模式。

进一步地，所述当所述播放指令为播放所述在线学习视频的指令时，向所述服务器发送下载所述在线学习视频的请求之后还包括以下步骤：

当所述在线学习视频下载完成时，在所述终端的显示屏上向所述用户提示学习规则和学习方式。

进一步地，所述当所述终端进入所述学习模式时，通过智能语音识别接收用户输入的语音指令，并根据所述语音指令将所述在线学习视频切换到对应的学习场景具体包括以下步骤：

当所述终端进入所述学习模式时，通过智能语音识别接收用户输入的语音指令；

根据所述语音指令将所述在线学习视频切换到对应的学习场景，并播放所述在线学习视频中对应的学习内容。

进一步地，所述根据所述语音指令将所述在线学习视频切换到对应的学习场景，并播放所述在线学习视频中对应的学习内容具体包括以下步骤：

根据所述语音指令将所述在线学习视频切换到对应的学习场景，并播放所述在线学习视频中对应的学习内容；

当所述终端播放所述学习内容时，判断所述用户是否在预设时间内输入语音信息；

当所述用户在预设时间内输入语音信息时，跳转到与所述语音信息对应的时间点；

根据所述时间点播放所述学习内容中与所述语音信息对应的学习片段。

进一步地，所述当所述终端进入所述学习模式时，通过智能语音识别接收用户输入的语音指令，并根据所述语音指令将所述在线学习视频切换到对应的学习场景还包括：

当所述终端进入所述学习模式时，通过智能语音识别接收用户输入的语音内容学习片段。

进一步地，所述当所述终端进入所述学习模式时，通过智能语音识别接收用户输入的语音指令，并根据所述语音指令将所述在线学习视频切换到对应的学习场景之后还包括以下步骤：

当所述终端播放完成时，将所述用户在所述学习场景中输入的语音信息上传到所述服务器中；

接收所述服务器发送的评分和错误纠正，并根据所述语音信息在所述终端的显示屏上向所述用户提出相应的学习建议。

本公开还提供一种终端，其中，包括处理器，以及与所述处理器连接的存储器，所述存储器存储有基于智能语音识别的学习程序，所述基于智能语音识别的学习程序被所述处理器执行时用于实现所述基于智能语音识别的学习方法。

进一步地，所述终端具备语音采集功能以及智能语音识别功能。

本公开还提供一种存储介质，其中，所述存储介质存储有基于智能语音识别的学习程序，所述基于智能语音识别的学习程序被所述处理器执行时用于实现所述基于智能语音识别的学习方法。

本公开提供一种基于智能语音识别的学习方法、终端及存储介质，通过获取服务器配置的在线学习视频，并以列表的形式显示在终端的显示屏中，以便于用户从列表中选择需要的学习视频；当用户选择相应的在线学习视频后，提示用户进入学习模式；当进入学习模式时，根据用户输入的语音指令进入在线学习视频中相应的学习场景，以便于用户在学习场景中学习相应的学习内容；另外，在用户学习完成之后，根据用户在学习过程中的语音信息向用户提出相应的学习建议，以便于用户在后续学习过程中进行纠错；本公开通过智能语音识别提取在线视频的学习场景，并将学习场景转换为学习数据，以便于用户在观看学习类的视频时，能够灵活控制知识点的播放，提升用户的学习能力。

附图说明

图1是本公开中基于智能语音识别的学习方法较佳实施例的流程图。

图2是本公开中终端与服务器的功能框图。

图3是本公开中用户使用时的交互时序图。

图4是本公开中终端的处理流程图(其一)。

图5是本公开中终端的处理流程图(其二)。

图6是本公开中终端与服务器创建学习内容的时序图。

图7是本公开中终端的原理框图。

具体实施方式

为使本公开的目的、技术方案及优点更加清楚、明确，以下参照附图并举实施例对本公开进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本公开，并不用于限定本公开。

实施例1

本公开较佳实施例所述的基于智能语音识别的学习方法，如图1所示，图1是本公开基于智能语音识别的学习方法较佳实施例的流程图。

所述基于智能语音识别的学习方法包括以下步骤：

步骤S100，终端获取服务器配置的在线学习视频，并将所述在线学习视频以列表的形式在所述终端的显示屏上进行显示。

如图2所示，在本实施例中，主要通过两个设备来实现基于智能语音识别的学习方法，其一为终端设备(即播放设备)，它能够通过网络获取并播放在线视频，同时，它还需要具备语音采集的功能，即可以使用远场语音或者近场语音；而且，它还需要支持智能语音识别的功能，能够识别用户的语音指令以及视频内容播放的音频数据，并能初步判断所播放的视频是否具有可学习性。

另一设备则为后台服务器，它需要具备语音识别的能力，能够将终端设备上传的音频和视频进行识别分析，并能将所述终端设备上传的音频和视频进行相应的处理，得到相应的学习数据，并保存为数据库，以便于终端在进入学习模式时，能够获取到所述学习数据；而且，服务器还需要具备对用户输入的语音信息进行处理和分析的能力，即对用户输入的语音信息进行分析，得到评分，并给出纠正的建议与方法；在得到评分和建议之后，将用户的评分结果进行保存，并在一个使用周期内给出综合评价与学习建议。

在本实施例中，需要预先在服务器上配置在线学习视频，服务器在配置所述在线学习视频时，通过分析每一个用户在日常使用时播放的在线视频的音频内容，进而判断所述在线视频是否属于在线学习视频，如果是，则将所述在线视频中的学习片段保存为学习数据，以供用户再次学习时进入学习模式；所述服务器配置完所述在线学习视频后，将所述在线学习视频保存在相应的列表中，以便于用户可以从列表中查找到需要的学习内容。

当用户使用终端设备时，终端会获取服务器配置的在线学习视频，并且，将所述在线学习视频以列表的形式显示在显示屏当中，以此展现给用户查看，以便于用户从所述列表中查找到需要的学习内容；具体地，终端在获取服务器配置的在线学习视频时，会向服务器发送一个获取在线学习视频的请求，之后，服务器接收所述请求时，会将预先配置的列表发送给终端，以便于终端将所述列表显示在显示屏上。

即所述步骤S100具体包括以下步骤：

步骤S110，所述终端向所述服务器发送获取所述在线学习视频的请求；

步骤S120，所述终端接收所述服务器发送的所述在线学习视频的列表，并将所述列表显示在所述终端的显示屏上。

通过获取服务器配置的在线学习视频的列表，并显示在显示屏当中，以便于用户在学习的过程当中，针对性地从列表中查询到相应的学习内容。

步骤S200，当所述终端接收用户输入的播放指令时，根据所述播放指令播放所述在线学习视频，并进入学习模式。

在本实施例中，当用户在终端设备上点击在线视频时，终端设备会根据用户的点击操作进行判断，判断用户所点击的视频是否为在线学习视频；具体表现为，在终端的显示屏上划分为在线学习视频专区和非学习视频区域，当用户在所述在线学习视频专区中进行操作时，即可判定用户所输入的播放指令为播放在线学习视频的指令。

当判定用户输入的播放指令为播放在在线学习视频的指令时，终端会向服务器下载相应的学习视频和用于学习模式的学习数据(即学习片段)；并且，在下载完成时，终端向用户提示学习规则和学习方式；当终端在播放下载的学习视频时，会以对话框的形式提示用户是否进入学习模式；当用户选择进入学习模式时，终端开启智能语音识别功能，以便于用户在所述学习模式中进行语音对话学习。

即所述步骤S200具体包括以下步骤：

步骤S210，当所述终端接收所述播放指令时，判断所述播放指令是否为播放所述在线学习视频的指令；

步骤S220，当所述播放指令为播放所述在线学习视频的指令时，向所述服务器发送下载所述在线学习视频的请求；

步骤S230，当所述在线学习视频下载完成时，在所述终端的显示屏上向所述用户提示学习规则和学习方式；

步骤S240，接收并播放从所述服务器下载的所述在线学习视频，并在所述终端的显示屏上提示所述用户是否进入所述学习模式；

步骤S250，当所述用户选择进入学习模式时，所述终端开启智能语音识别功能。

通过判断用户点击的视频是否为在线学习视频，使得终端可以根据用户的点击操作提示用户是否进入学习模式，然后再根据用户的选择进入到相应的学习模式。

步骤S300，当所述终端进入所述学习模式时，通过智能语音识别接收用户输入的语音指令，并根据所述语音指令将所述在线学习视频切换到对应的学习场景。

在本实施例中，主要有三种学习场景：其一为以单词为主的单词学习场景，在这种学习场景当中，终端播放一个单词，用户跟着学习一个单词；其二为语言对话的学习场景，在这种学习场景当中，终端与用户之间采取对话的形式进行学习；其三为单词和对话的交叉学习场景，在这种学习场景当中，结合单词学习场景和对话学习场景。

当用户进入到相应的学习场景时，播放设备支持两种语音对话输入：一种为语音指令，比如：“下一个单词”，“重新开始”，“结束”等；另一种则为语音内容学习片段，比如：某个单词，某段对话等；语音识别到语音输入时，会跳转到对应的内容进行播放对应的学习片段。

在本实施例中，通过智能语音识别接收用户输入的语音指令，然后再根据语音指令将在线学习视频切换到对应的学习场景，并播放在线学习视频中对应的学习内容；具体地，当终端播放学习内容时，会判断用户是否在预设时间(比如10秒)内输入语音信息；当用户在预设时间内输入语音信息时，终端会将正在播放的在线学习视频跳转到与所述语音信息对应的时间点；比如，用户在播放在线学习视频时，用户输入“下一个单词”的语音信息，此时，终端会将当前播放的在线学习视频跳转到“下一个单词”的时间点，然后再根据该时间点播放学习内容中与语音信息对应的学习片段。

另外，在本实施例中，当终端播放完成时，终端会将学习过程中用户输入的语音信息上传到服务器当中，然后，根据服务器发送的评分和错误纠正，在显示屏上显示该评分和错误纠正，并在显示屏上显示相应的学习建议等。

即所述步骤S300具体包括以下步骤：

步骤S310，当所述终端进入所述学习模式时，通过智能语音识别接收用户输入的语音指令；

步骤S320，根据所述语音指令将所述在线学习视频切换到对应的学习场景，并播放所述在线学习视频中对应的学习内容；

步骤S330，当所述终端播放完成时，将所述用户在所述学习场景中输入的语音信息上传到所述服务器中；

步骤S340，接收所述服务器发送的评分和错误纠正，并根据所述语音信息在所述终端的显示屏上向所述用户提出相应的学习建议。

在上述步骤当中，所述步骤S320具体包括以下步骤：

步骤S321，根据所述语音指令将所述在线学习视频切换到对应的学习场景，并播放所述在线学习视频中对应的学习内容；

步骤S322，当所述终端播放所述学习内容时，判断所述用户是否在预设时间内输入语音信息；

步骤S323，当所述用户在预设时间内输入语音信息时，跳转到与所述语音信息对应的时间点；

步骤S324，根据所述时间点播放所述学习内容中与所述语音信息对应的学习片段。

通过智能语音识别提取在线视频的学习场景，并能将学习场景转化为学习数据，方便用户在观看学习类视频时，能够语音交互，灵活的控制知识点的播放，加深学习印象。

以下结合图3至图6对本实施例进行进一步地说明：

在本实施例中，主要是通过分析用户播放在线视频的音频内容，来判断视频的类型是否属于在线学习的视频，如果是，则分析视频的学习片段，将其保存为学习数据供用户再进行学习模式的状态下进行语音控制。

当用户进入学习模式播放视频时，播放设备会先提示用户学习内容，方便用户提前了解学习内容，并且能够有针对性的学习对应的片段；当用户说出学习内容相关的语音指令，播放设备会跳转到对应的学习片段进行播放，当播放完成时就会暂停；当用户说出语音控制指令时，播放设备也会跳转到对应的学习片段进行播放。

在用户语音输入的同时，播放设备会把用户的语音输入，上传到服务器端，进行语音的分析，对它进行评分与错误纠正，这样可以为用户的语音输入给出有效的建议，能够逐步的提升自己的学习能力与知识能力；后台服务器也会根据使用的使用时段与使用周期给出一个学习曲线，保证在学习的过程中有一个稳定或者逐步提升的学习能力。

具体地，如图3所示，当用户使用播放设备时，播放设备会获取服务器配置的学习内容专区的数据(该数据由每个用户使用在线视频后的学习数据组成，或者由人工手动直接编辑)，并将数据展示给用户，以供用户进行查看；当用户点击对应的学习片源时，播放设备就会从服务器获取对应的学习数据(学习数据为学习片段的有序列表，主要包含类型[关键字类型/语言片段类型]，播放标签[关键字/语音片段]，播放时间点，片段时长等)。

当播放设备获取完成之后，提示用户“是否进入学习模式”，当用户选择进入学习模式时，播放设备给出学习规则；学习规则主要包括学习片段的内容，以及学习语音识别的规则；比如：语音内容规则，让用户说出关键字[单词学习/根据语音场景回复的关键字]或者说出语音场景的语音片段；语音指令规则，让用户说出控制学习的语音指令，比如：再来一次，下一个，重来，结束等。

当播放设备进入学习模式时，如果用户在10S内没有语音输入，播放设备就进入正常播放；在正常播放过程中，如果接收到了用户输入的语音指令，检测用户输入的语音指令为关键字，则跳转到与该关键字所对应的学习片段，并匹配到该关键字所对应的时间点进行播放；当播放完成之后，则暂停；如果在播放过程中再次接收到语音指令，则再次进行匹配；如果匹配失败，则给出提示；如果接收到的语音指令为语言片段，则跳转到与该语言片段所对应的时间点进行播放，并在这种学习场景中记录上下文，进行场景化的学习。

在学习的过程中，只要用户输入语音，播放设备会把用户的语音上传到服务器，进行发音的评分与纠正，并记录下当前的语音与评分，多次使用则会统计最高值，最低值，平均值，记录多段语音给用户提示与纠正；当用户使用完成之后，播放设备会把当前的片源的总体评分与发音建议提示给用户。

如图6所示，图6是描述是学习数据的创建时序图；用户在播放在线片源时，播放设备会对在线视频的音频进行解码，并识别该在线视频中的内容，如果满足以下条件，则判定该在线视频为支持学习模式的片源：

1.以某类型的单词为主的片源，中间间隔有规律的时间；

2.以某类型的场景对话为主的片源。

当播放设备识别到支持学习模式的片源时，提示用户是否进入学习模式；如果用户选择进入学习模式，则把该在线视频的音频解码发送给服务器，由服务器进行整个音频数据的分析；服务器会根据上述的条件，生成对应的学习片段信息；当整个音频数据被分析完之后，服务器会把整个学习片段的内容进行组织，生成学习规则，比如：将所有单词列出，或者把对应的学习场景进行编排等；最后，服务器根据学习规则生成对应的语言内容指令集。

当服务器处理完成之后，会把处理结果返回给播放设备，并在播放设备上进行显示(显示学习规则和语言内容指令集)；当播放设备播放在线学习视频时，如果用户要进入学习模式，服务器会将学习数据发送给播放设备，然后按照图3中的使用时序图，在用户、播放设备以及服务器之间进行语音交互；为了确认学习数据的有效性，服务器后台会支持人工编辑和调整，同样也支持人工手动录入，方便创建学习专区。

如图4和图5所示，播放设备在处理时包括以下步骤：

步骤S11，获取服务器配置的在线学习视频并显示；

步骤S12，判断用户选择的在线视频是否为在线学习视频；如果是，则执行步骤S13；如果否，则返回步骤S11；

步骤S13，播放并提示是否进入学习模式；

步骤S14，判断用户选择是否为进入学习模式；如果是，则执行步骤S15；如果否，则返回步骤S13；

步骤S15，下载学习内容规则和学习内容列表；

步骤S16，下载完成，提示学习规则和学习方式；

步骤S17，判断用户在10s内是否有语音输入；如果是，则执行步骤S18；如果否，则执行步骤S21；

步骤S18，语音学习内容输入；

步骤S19，切换到对应的学习内容时间点，进行播放，并上传语音到服务器；

步骤S20，学习点播完成；

步骤S21，进入正常播放；

步骤S22，接收学习内容输入；

步骤S23，接收语音操作指令；

步骤S24，切换到对应的学习内容播放；

步骤S25，播放完成；

步骤S26，给出评分与建议。

本实施例中的基于智能语音识别的学习方法，不仅仅脱离了单调的视频观看学习，而且也带来了互动学习的乐趣，更能提升学习效率；以语音互动的方式替代只观看，也提升可以口语的表达，真正做到在学习场景学习；同时，服务器后端也会采集用户的语音输入进行评分与标准的发音对比，给出学习的建议与学习轨迹分析，这样就更容易提升学习效率和错误纠正。

实施例2

请参见图7，图7是本公开较佳实施例中终端的功能原理框图。

如图7所示，本公开实施例提供了一种终端，本公开实施例的移动终端可以为移动终端(比如手机或者平板电脑)，也可以为智能终端(比如智能电视或者其他智能设备)，其中，本实施例的终端包括处理器10，以及与所述处理器10连接的存储器20；

所述存储器20存储有基于智能语音识别的学习程序，该基于智能语音识别的学习程序被所述处理器10执行时用于实现上述基于智能语音识别的学习方法；具体如上所述。

实施例3

本公开实施例提供了一种存储介质，其中，所述存储介质存储有基于智能语音识别的学习程序，该基于智能语音识别的学习程序被处理器执行时用于实现上述基于智能语音识别的学习方法；具体如上所述。

综上所述，本公开提供一种基于智能语音识别的学习方法、终端及存储介质，通过获取服务器配置的在线学习视频，并以列表的形式显示在终端的显示屏中，以便于用户从列表中选择需要的学习视频；当用户选择相应的在线学习视频后，提示用户进入学习模式；当进入学习模式时，根据用户输入的语音指令进入在线学习视频中相应的学习场景，以便于用户在学习场景中学习相应的学习内容；另外，在用户学习完成之后，根据用户在学习过程中的语音信息向用户提出相应的学习建议，以便于用户在后续学习过程中进行纠错；本公开通过智能语音识别提取在线视频的学习场景，并将学习场景转换为学习数据，以便于用户在观看学习类的视频时，能够灵活控制知识点的播放，提升用户的学习能力。

当然，本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关硬件(如处理器，控制器等)来完成，所述的程序可存储于一计算机可读取的存储介质中，所述程序在执行时可包括如上述各方法实施例的流程。其中所述的存储介质可为存储器、磁碟、光盘等。

应当理解的是，本公开的应用不限于上述的举例，对本领域普通技术人员来说，可以根据上述说明加以改进或变换，所有这些改进和变换都应属于本公开所附权利要求的保护范围。

Claims

一种基于智能语音识别的学习方法，其特征在于，所述基于智能语音识别的学习方法包括以下步骤：

终端获取服务器配置的在线学习视频，并将所述在线学习视频以列表的形式在所述终端的显示屏上进行显示；

当所述终端接收用户输入的播放指令时，根据所述播放指令播放所述在线学习视频，并进入学习模式；

当所述终端进入所述学习模式时，通过智能语音识别接收用户输入的语音指令，并根据所述语音指令将所述在线学习视频切换到对应的学习场景。
根据权利要求1所述的基于智能语音识别的学习方法，其特征在于，所述学习场景包括单词学习场景、对话学习场景以及单词对话交叉学习场景。
根据权利要求1所述的基于智能语音识别的学习方法，其特征在于，所述终端获取服务器配置的在线学习视频，并将所述在线学习视频以列表的形式在所述终端的显示屏上进行显示之前还包括：

在所述服务器上配置所述线学习视频。
根据权利要求1所述的基于智能语音识别的学习方法，其特征在于，所述终端获取服务器配置的在线学习视频，并将所述在线学习视频以列表的形式在所述终端的显示屏上进行显示具体包括以下步骤：

所述终端向所述服务器发送获取所述在线学习视频的请求；

所述终端接收所述服务器发送的所述在线学习视频的列表，并将所述列表显示在所述终端的显示屏上。
根据权利要求1所述的基于智能语音识别的学习方法，其特征在于，所述当所述终端接收用户输入的播放指令时，根据所述播放指令播放所述在线学习视频，并进入学习模式具体包括以下步骤：

当所述终端接收所述播放指令时，判断所述播放指令是否为播放所述在线学习视频的指令；

当所述播放指令为播放所述在线学习视频的指令时，向所述服务器发送下载所述在线学习视频的请求；

接收并播放从所述服务器下载的所述在线学习视频，并在所述终端的显示屏上提示所述用户是否进入所述学习模式；

当所述用户选择进入学习模式时，所述终端开启智能语音识别功能。
根据权利要求5所述的基于智能语音识别的学习方法，其特征在于，所述当所述终端接收所述播放指令时，判断所述播放指令是否为播放所述在线学习视频的指令之前还包括：

将所述终端的显示屏上的在线视频划分为在线学习视频专区和非学习视频区域。
根据权利要求5所述的基于智能语音识别的学习方法，其特征在于，所述在所述终端的显示屏上提示所述用户是否进入所述学习模式具体包括：

以对话框的形式提示所述用户是否进入学习模式。
根据权利要求5所述的基于智能语音识别的学习方法，其特征在于，所述当所述播放指令为播放所述在线学习视频的指令时，向所述服务器发送下载所述在线学习视频的请求之后还包括以下步骤：

当所述在线学习视频下载完成时，在所述终端的显示屏上向所述用户提示学习规则和学习方式。
根据权利要求1所述的基于智能语音识别的学习方法，其特征在于，所述当所述终端进入所述学习模式时，通过智能语音识别接收用户输入的语音指令，并根据所述语音指令将所述在线学习视频切换到对应的学习场景具体包括以下步骤：

当所述终端进入所述学习模式时，通过智能语音识别接收用户输入的语音指令；

根据所述语音指令将所述在线学习视频切换到对应的学习场景，并播放所述在线学习视频中对应的学习内容。
根据权利要求9所述的基于智能语音识别的学习方法，其特征在于，所述根据所述语音指令将所述在线学习视频切换到对应的学习场景，并播放所述在线学习视频中对应的学习内容具体包括以下步骤：

根据所述语音指令将所述在线学习视频切换到对应的学习场景，并播放所述在线学习视频中对应的学习内容；

当所述终端播放所述学习内容时，判断所述用户是否在预设时间内输入语音信息；

当所述用户在预设时间内输入语音信息时，跳转到与所述语音信息对应的时间点；

根据所述时间点播放所述学习内容中与所述语音信息对应的学习片段。
根据权利要求9所述的基于智能语音识别的学习方法，其特征在于，所述当所述终端进入所述学习模式时，通过智能语音识别接收用户输入的语音指令，并根据所述语音指令将所述在线学习视频切换到对应的学习场景还包括：

当所述终端进入所述学习模式时，通过智能语音识别接收用户输入的语音内容学习片段。
根据权利要求1所述的基于智能语音识别的学习方法，其特征在于，所述当所述终端进入所述学习模式时，通过智能语音识别接收用户输入的语音指令，并根据所述语音指令将所述在线学习视频切换到对应的学习场景之后还包括以下步骤：

当所述终端播放完成时，将所述用户在所述学习场景中输入的语音信息上传到所述服务器中；

接收所述服务器发送的评分和错误纠正，并根据所述语音信息在所述终端的显示屏上向所述用户提出相应的学习建议。
一种终端，其特征在于，包括处理器，以及与所述处理器连接的存储器，所述存储器存储有基于智能语音识别的学习程序，所述基于智能语音识别的学习程序被所述处理器执行时用于实现权利要求1-12任一项所述基于智能语音识别的学习方法。
根据权利要求13所述的终端，其特征在于，所述终端具备语音采集功能以及智能语音识别功能。
一种存储介质，其特征在于，所述存储介质存储有基于智能语音识别的学习程序，所述基于智能语音识别的学习程序被所述处理器执行时用于实现权利要求1-12任一项所述基于智能语音识别的学习方法。