CN111935529B

CN111935529B - 教育类音视频资源的播放方法、设备及存储介质

Info

Publication number: CN111935529B
Application number: CN202010671190.5A
Authority: CN
Inventors: 王大禹; 唐瑶; 池宇峰
Original assignee: Perfect World Holding Group Ltd
Current assignee: Perfect World Holding Group Ltd
Priority date: 2020-07-13
Filing date: 2020-07-13
Publication date: 2023-01-10
Anticipated expiration: 2040-07-13
Also published as: CN111935529A

Abstract

本申请实施例提供一种教育类音视频资源的播放方法、设备及存储介质。在教育类音视频资源的播放方法中，第一资源的播放页面展示的标签查看图标，可向用户提供查看第一资源对应的至少一个标签的操作入口，以供用户查看该至少一个标签。用户从该至少一个标签中选择某一标签时，可在进度条上展示该标签对应的进度节点，并根据用户对进度节点的选择操作，播放该标签对应的资源片段。基于这种实施方式，用户在播放第一资源时，可根据标签有选择性地观看或者收听媒体内容，增加了播放方式的灵活性，有以利于降低用户寻找目标片段所需的时间成本。

Description

教育类音视频资源的播放方法、设备及存储介质

技术领域

本申请涉及多媒体技术领域，尤其涉及一种教育类音视频资源的播放方法、设备及存储介质。

背景技术

在线教育通过视频点播的方式实现了教学内容的传播以及师生之间的良好互动，突破了传统教育在时间和空间上的限制，极大地方便了学生的学习。然而，当教学视频的时间较长、内容较为丰富时，学生很难在时间有限的情况下，快速找到视频内的知识点并进行有选择性的观看。这无形中增加了在线学习所需的时间成本，且不利于后续基于教学视频进行针对性地复习。

一种现有的视频播放方式中，由人工根据视频内容确定剧情关键词，并手动在视频上添加剧情关键词对应的时间码。进而，观众在观看视频时，可通过进度条上的剧情关键词选择视频进度。但是，这种方式所需的人力成本较高且效率较低。因此，有待提出一种新的解决方案。

发明内容

本申请的多个方面提供一种教育类音视频资源的播放方法、设备及存储介质，用以增加播放方式的灵活性，降低用户寻找目标片段所需的时间成本。

本申请实施例还提供一种教育类音视频资源的播放方法，包括：在第一资源的播放页面展示标签查看图标；响应对所述标签查看图标的触发操作，展示根据所述第一资源生成的至少一个标签；响应对所述至少一个标签中的第一标签的选择操作，在进度条上展示所述第一标签对应的至少一个进度节点；响应对所述至少一个进度节点中的第一进度节点的触发操作，播放所述第一进度节点对应的资源片段。

进一步可选地，展示根据所述第一资源生成的至少一个标签，包括：在所述播放页面上展示悬浮窗口；在所述悬浮窗口内，展示所述至少一个标签；以及，突出显示被选中的标签。

进一步可选地，在进度条上展示所述第一标签对应的至少一个进度节点，还包括：展示所述至少一个进度节点各自对应的悬浮窗口；在所述至少一个进度节点各自对应的悬浮窗口中，展示所述至少一个进度节点各自对应的资源片段的标识。

进一步可选地，还包括：在所述播放页面展示保存图标；在播放所述第一进度节点对应的资源片段的过程中，响应对所述保存图标的重触发操作，将所述第一进度节点对应的资源片段保存到观看记录中。

进一步可选地，所述至少一个标签，包括：内容标签和/或类型标签。

进一步可选地，展示根据所述第一资源生成的至少一个标签之前，还包括：提取所述第一资源中的音频数据；对所述音频数据进行语音转写，以将所述音频数据转化为文本数据；根据所述文本数据的内容，确定所述第一资源对应的至少一个标签；根据所述至少一个标签对应的播放时刻，建立所述至少一个标签和所述第一资源包含的多个资源片段的对应关系。

进一步可选地，根据所述文本数据，确定所述第一资源对应的至少一个标签，包括：确定所述文本数据包含的多个句子；对所述多个句子分别进行分词处理，得到所述多个句子包含的多个词语；从所述多个词语中，选择满足设定条件的至少一个词语，作为所述至少一个标签。

进一步可选地，从所述多个词语中，选择满足设定条件的至少一个词语，作为所述至少一个标签，包括：针对所述多个词语中的任一词语，计算所述词语在所属的句子中的词频；以及，根据预设的语料库，计算所述词语的逆文档频率；根据所述词频和所述逆文档频率，计算所述词语的词频-逆文档频率；根据所述多个词语的数量以及所述多个词语各自的词频-逆文档频率，从所述多个词语中，选择满足所述设定条件的至少一个词语，作为所述至少一个标签。

本申请实施例还提供一种电子设备，包括：存储器、处理器和显示组件；所述存储器用于存储一条或多条计算机指令；所述处理器用于执行所述一条或多条计算机指令以用于：执行本申请实施例提供的方法中的步骤。

本申请实施例还提供一种存储有计算机程序的计算机可读存储介质，计算机程序被执行时能够实现本申请实施例提供的方法中的步骤。

本申请实施例提供的教育类音视频资源的播放方法中，第一资源的播放页面展示的标签查看图标，可向用户提供查看第一资源对应的至少一个标签的操作入口，以供用户查看该至少一个标签。用户从该至少一个标签中选择某一标签时，可在进度条上展示该标签对应的进度节点，并根据用户对进度节点的选择操作，播放该标签对应的资源片段。基于这种实施方式，用户在播放第一资源时，可根据标签有选择性地观看或者收听媒体内容，增加了播放方式的灵活性，有以利于降低用户寻找目标片段所需的时间成本。

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1为本申请一示例性实施例提供的教育类音视频资源的播放方法的流程示意图；

图2a为本申请一示例性实施例提供的播放页面的示意图；

图2b为本申请另一示例性实施例提供的播放页面的示意图；

图3为本申请一示例性实施例提供的教学视频播放方法的流程示意图；

图4为本申请一示例性实施例提供的电子设备的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然，所描述的实施例仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

针对现有技术中，确定视频的剧情关键词对人工依赖较高且效率较低的技术问题，在本申请一些实施例中，提供了一种解决方案，以下将结合附图，详细说明本申请各实施例提供的技术方案。

图1为本申请一示例性实施例提供的教育类音视频资源的播放方法的流程示意图，如图1所示，该方法包括：

步骤101、在第一资源的播放页面展示标签查看图标。

步骤102、响应对所述标签查看图标的触发操作，展示根据所述第一资源生成的至少一个标签。

步骤103、响应对所述至少一个标签中的第一标签的选择操作，在进度条上展示所述第一标签对应的至少一个进度节点。

步骤104、响应对所述至少一个进度节点中的第一进度节点的触发操作，播放所述第一进度节点对应的资源片段。

教育类音视频资源，可包括存储有教学相关信息的多媒体文件，用户可通过显示设备播放该教育类音视频资源，以实现随时随地的线上学习。在步骤101中，第一资源，可以是教育类音视频资源中的任意一种，例如，第一资源可实现为视频资源或者音频资源，或者其他形式的多媒体资源，本实施包含但不限于此。例如，当第一资源实现为音频资源时，该音频资源可包括：新闻广播类的音频资源、有声书类的音频资源、音乐授课类的音频资源、教学授课类的音频资源等等。当第一资源实现为视频资源时，视频资源可包括：科普讲堂类的视频资源、讲座类的视频资源、教学视频资源等等。当第一资源为视频类资源时，和现有技术的电影电视剧视频资源具有对应的文本剧本相比，教育类的视频资源没有原始的文本剧本，教育类的视频资源具有更多内容的不确定性，需要将教育类的视频资源对应的音频资源进行提取。

其中，通过浏览器播放第一资源时，该播放页面可以是浏览器提供的网页页面；通过终端设备上运行的应用程序播放第一资源时，该播放页面可以是应用程序提供的播放页面，本实施例对此不做限制。

其中，播放页面展示有标签查看图标，该查看图标可实现为控件，例如按钮控件。该查看图标可展示在播放页面的工具栏中，或者可展示在播放窗口外侧，或者可悬浮展示在播放窗口上，本实施例不做限制。标签查看图标的一种典型的展示方式如图2a所示，在图2a的示意中，视频播放窗口的左侧包含一功能栏，该功能栏内展示有“标签”按钮，以供用户查看该视频对应的标签。

接下来，在步骤102中，响应对该标签查看图标的触发操作，可展示该第一资源对应的至少一个标签。在本步骤中，展示该至少一个标签时，可按照列表的形式进行展示，或者按照宫格排列的方式进行展示，本实施例不做限制。一种典型的展示方式如图2a所示，在图2a的示意中，用户点击视频播放窗口左侧功能栏内的“标签”按钮后，弹出悬浮框，该悬浮窗内以列表形式展示该视频包含的所有标签。

其中，该至少一个标签是根据该第一资源生成的。例如，在一种实施方式中，可对该第一资源进行内容识别，并根据内容识别的结果自动生成该至少一个标签。例如，在另一种实施方式中，可对该第一资源包含的画面进行图像识别，并根据图像识别的结果自动生成该至少一个标签。又例如，在又一种实施方式中，可根据该第一资源播放时产生的历史弹幕数据自动生成该至少一个标签。上述各实施方式均为根据第一资源生成该至少一个标签的可选实施方式，实际中，可单独执行上述方式或者可对上述方式进行任意组合执行，本实施例包含但不限于此。

向用户展示该至少一个标签后，用户可根据需求选择需要查看的标签。接下来，在步骤103中，响应对该至少一个标签中的第一标签的选择操作，可在进度条上展示该第一标签对应的至少一个进度节点。其中，第一标签指的是用户选中的标签，此处采用“第一”对标签进行限定，仅用于方便描述和区分，并不代表标签的顺序。

在本实施例中，每个标签对应一个或者多个进度节点，故而，用户可通过触发进度节点查看与标签对应的内容。其中，标签与第一资源的播放进度的对应关系可预先确定，将在后续的实施例中进行介绍，此处不赘述。

其中，进度条，指的是播放窗口中用于展示第一资源的播放进度的界面元素。进度节点，即进度条上的锚定点，用户可通过触发进度节点来调整第一资源的播放进度。在进度条上展示与标签对应的进度节点的一种方式如图2a所示，用户选择的第一标签为“社会心理学”，该标签呈高亮展示；同时，在视频的进度条上展示“社会心理学”这一标签对应的多个锚定点。

向用户展示第一标签对应的至少一个进度节点后，用户可根据需求选择进度节点。接下来，在步骤104中，响应对该至少一个进度节点中的第一进度节点的触发操作，可播放第一进度节点对应的资源片段。其中，第一进度节点指的是用户选中的进度节点，此处采用“第一”对进度节点进行限定，仅用于方便描述和区分，并不代表任何顺序。基于此，用户可在播放第一资源的过程中，实现基于标签的进度调整操作。

本实施例中，第一资源的播放页面展示的标签查看图标，可向用户提供查看第一资源对应的至少一个标签的操作入口，以供用户查看该至少一个标签。用户从该至少一个标签中选择某一标签时，可在进度条上展示该标签对应的进度节点，并根据用户对进度节点的选择操作，播放该标签对应的资源片段。基于这种实施方式，用户在播放第一资源时，可根据标签有选择性地观看或者收听媒体内容，增加了播放方式的灵活性，有以利于降低用户寻找目标片段所需的时间成本。

在本申请的上述以及下述各实施例中，响应用户对标签查看图标的触发操作，展示根据第一资源生成的至少一个标签的一种可选的实施方式，可实现为：响应用户对标签查看图标的触发操作，在播放页面上展示一悬浮窗口，并在该悬浮窗口内，展示该至少一个标签；其中，该悬浮窗口可如图2a所示。在另一些实施例中，响应用户对标签查看图标的触发操作，可展示下拉菜单，并在该下拉菜单中展示该至少一个标签，不再进行图示。

可选地，当用户根据实际需求从该至少一个标签中选择任一标签时，可突出显示被选中的标签，以便于用户查看。可选地，突出展示的方式可包括：高亮展示、添加指示箭头、文本加粗、添加文字标识或者其他可选的方式，本实施例不做限制。

在本申请的上述以及下述各实施例中，响应用户对该至少一个标签中的第一标签的选择操作，在进度条上展示第一标签对应的至少一个进度节点时，还可进一步展示该至少一个进度节点各自对应的悬浮窗口；以及，在该至少一个进度节点各自对应的悬浮窗口中，展示该至少一个进度节点各自对应的资源片段的标识。其中，资源片段的标识可以是资源片段的名称或者编号等等，该标识可由开发人员确定，本实施例不做限制。

例如，在一种情况下，第一标签对应进度节点A，则可在进度条上展示该进度节点A，并在该进度节点A附近展示一悬浮窗口A1，该悬浮窗口A1中展示有进度节点A对应的资源片段的标识A`。

又例如，在另一种情况下，第一标签对应进度节点A、B、C，则可在进度条上展示该进度节点A、B、C，并在该进度节点A附近展示一悬浮窗口A1、该进度节点B附近展示一悬浮窗口B1、该进度节点C附近展示一悬浮窗口C1；其中，悬浮窗口A1中展示有进度节点A对应的资源片段的标识A`、悬浮窗口B1中展示有进度节点B对应的资源片段的标识B`、悬浮窗口C1中展示有进度节点C对应的资源片段的标识C`。

图2a示意了一种展示该至少一个进度节点各自对应的资源片段的标识的可选实施方式，如图2a所示，用户选中“社会心理学标签”时，进度条上展示了3个锚定点，锚定点附近的悬浮窗内展示了标签对应的片段名称。其中，片段名称可在展示一定时长(例如3秒、5秒)后消失，锚定点不随时间消失。当片段名称消失后，捕捉到锚定点对应的悬浮事件(例如鼠标移动到锚定点)时，可再次展示该锚定点对应的片段名称。用于将当前进度节点拖动至选定的锚定点即可移动进度条，以观看选定的片段。

基于这种实施方式，用户可获知标签对应的至少一个片段的大致主题，以便于用户快速选择想要观看或者收听的片段，避免选择错误，进一步降低时间成本。

在本申请的上述以及下述各实施例中，进一步可选地，可在第一资源的播放页面展示保存图标；在播放第一进度节点对应的资源片段的过程中，响应对该保存图标的重触发操作，可将第一进度节点对应的资源片段保存到观看记录中。

可选地，该保存图标可展示在进度条下方，如图2a所示。当然，在一些其他的实施例中，保存图标也可以展示在播放页面的其他位置，例如播放页面的左上角、右上角或者又下角的区域，本实施例不做限制。

基于这种实施方式，进一步细化了保存操作的粒度，实现了以资源片段为保存单位的保存操作，进而，用户可在观看记录中选择某一资源片段，以便于针对性地重复观看或者收听，进一步降低了观看或者收听所需的时间成本。

在本申请的上述以及下述各实施例中，可选地，该至少一个标签，可包括：内容标签和/或类型标签。

其中，内容标签，包括与第一资源的内容相关的标签，例如标签“社会心理学”、“潜意识”、“行为论”等。用户选择“潜意识”，可以观看或者收听与潜意识内容相关的片段。

其中，类型标签，包括与第一资源的功能相关的标签，例如标签“习题”、“实例”、“作业”等。用户选择“习题”，可观看或者收听本节教学视频课内的习题部分视频。

在展示第一资源对应的至少一个标签之前，可对第一资源进行内容识别，并基于对第一资源的内容进行识别的结果自动生成上述标签。以下实施将详细介绍根据第一资源自动生成标签的可选实施方式。

在教育类资源为无对应指定文本的情况下，可提取第一资源中的音频数据，并对该音频数据进行语音转写，以将该音频数据转化为文本数据。其中，第一资源实现为视频资源时，可采用Ffmpeg(Fast Forward Mpeg，一种用于记录、转换数字音频、视频，并能将其转化为流的计算机程序)工具，从视频资源中提取音频数据，并可将提取到的音频数据保存为指定格式，例如mp3格式。其中，对该音频数据进行语音转写时，可基于现有的语音转写(Long Form ASR)技术，针对语音的长时相关性进行语言建模，以将音频数据转换成文本数据，此处不做赘述。

接下来，可根据该文本数据的内容，确定第一资源对应的至少一个标签。

可选地，在一些实施例中，可确定该文本数据包含的多个句子，并对该多个句子分别进行分词处理，得到该多个句子包含的多个词语；接着，从该多个词语中，选择满足设定条件的至少一个词语，作为该至少一个标签。

在一些可选的实施例中，该设定条件，可以包括：词语的词频-逆文档频频率对应的条件。以下将以多个词语中的任一词语为例，介绍词语的词频-逆文档频频率的可选计算方式。

针对该多个词语中的任一词语，可计算该词语在所属的句子中的词频；以及，根据预设的语料库，计算该词语的逆文档频率；接下来，根据该词频和该逆文档频率，计算该词语的词频-逆文档频率。

其中，可将文本数据的每一句话作为一个文档，得到计数为j个文档。

一种计算序号为i的词语在文档j中的词频的方法可如公式1所示：

其中，n_ij为序号为i的词语在第j篇文档中出现的次数，V表示词典的大小。

其中，逆文档频率(nverse Document Frequency，IDF)用于表示一个词语普遍重要性，它的大小与一个词的常见程度成反比。一种根据语料库计算序号为i的词语的逆文档频率的方法可如公式2所示：

其中，D为语料库的文档总数，D_i表示出现了第i个词语的文档的数量。

将词频率与逆文档频率相乘，可计算得到词语的词频-逆文档频率(tf-idf)，该指标可以更好的突出文本中的重要信息。

计算得到该多个词语各自的tf-idf后，可根据该多个词语的数量以及该多个词语各自的词频-逆文档频率，从该多个词语中，选择满足所述设定条件的至少一个词语，作为至少一个标签。

可选地，可按照tf-idf从大到小的顺序对该多个词语进行排序，并可按照从大到小的顺序，从多个词语中选择排序靠前的N个词语或者M％个词语作为标签。其中，N为正整数，M可根据实际需求或者词语的数量进行设置。当词语得到的词语的数量较多时，M和N可取较大值；当词语得到的词语的数量较多时，M和N可取较小值，本实施例不做限制。例如，在一些情况下，若词语得到的词语较多，则可选择排序靠前的前20个词语作为标签，或者可选择排序靠前的20％个词语作为标签。

以下将结合具体的例子进行说明。

假设，文本数据中包含一句子：从真假角度可分为真需求、伪需求和弱需求。对该句子做分词处理，得到：从/真假/角度/可/分/为/真需求、/伪需求/和/弱需求。其中，“从”、“可”、“和”这样不携带任何主题信息的高频词称为停止词。此处，可去掉例句中的停止词，保留如下词语：真假、角度、真需求、伪需求、弱需求。

接着，基于上述公式1和公式2计算保留下的每个词语的tf-idf，得到如下结果：

序号	词语	词频	逆文档频率	词频-逆文档频率
					1	真需求	0.02	2.713	0.0543
2	伪需求	0.02	2.410	0.0482
					3	弱需求	0.02	2.603	0.0521
4	角度	0.02	0.603	0.0121
					5	真假	0.03	0.872	0.0276

基于上述tf-idf结果可知，例句中的“真需求”、“伪需求”、“弱需求”三个词的词频-逆文档频率较高，可筛选作为该句子中的关键词，即标签。

在另一些可选的实施例中，选择满足设定条件的至少一个词语作为该至少一个标签时，该设定条件，可以包括：词语对应的语义满足设定的语义条件。例如，在一些实施例中，可对每个词语进行语义分析，得到每个词语对应的语义分析结果。接着，从该多个语义中，确定语义分析结果与文本数据的主题内容较为接近的词语，作为该至少一个标签。

在又一些可选的实施例中，选择满足设定条件的至少一个词语作为该至少一个标签时，该设定条件，可以包括：词语与预先设置的词语模板匹配，不再赘述。

可选地，基于上述实施例确定的至少一个词语，均可作为内容标签。在一些可选的实施例中，可从该至少一个词语中，筛选出用于描述视频片段的功能的部分词语，作为类型标签。例如，可从该至少一个词语中，确定用于描述授课功能的“开讲”、“上课”、“讲义”等词语，作为授课类型标签；或者，可从该至少一个词语中，确定用于描述课堂练习功能的“习题”、“实例”、“作业”等词语，作为课堂练习类型的标签。

基于上述各实施例确定至少一个标签后，可根据该至少一个标签对应的播放时刻，建立该至少一个标签和该第一资源包含的多个资源片段的对应关系。

其中，该多个资源片段，通过预先对第一资源进行切分得到。

在一些可选的实施例中，可预先按照时长对第一资源进行切分，得到多个资源片段。例如，可将30分钟的视频，切分为10个3分钟的视频，或者6个5分钟的视频。

在另一些可选的实施例中，可识别第一资源对应的文本数据中具有承上启下功能的关键词或者关键句，例如“接下来”、“在以下的时间中”、“下一部分”等等。识别到具有承上启下功能的关键词或者关键句后，可根据关键词或者关键句对应的播放时刻对第一资源进行切分，得到多个资源片段。

当然，在一些可选的其他实施例中，还可采用手动切分等方式将第一资源切分为多个片段，不再赘述。

将标签与资源片段绑定后，可生成一系列具有标签的资源片段。进而，可在用户选择查看某一标签时，确定该标签对应的资源片段，并展示该资源片段对应的进度节点。

在本申请的上述以及下述各实施例中，上述实施例获取到的该至少一个标签，可被描述为一级标签，每个一级标签下可包含一个或者多个二级标签。响应用户对该至少一个一级标签中的第一标签的选择操作，在进度条上展示第一标签对应的至少一个进度节点时，还可进一步展示该至少一个进度节点各自对应的悬浮窗口；以及，在该至少一个进度节点各自对应的悬浮窗口中，展示第一标签对应的二级标签，如图2b所示。在图2b中，“刘备”为一级标签，“三顾茅庐”、“桃园结义”以及“白帝城托孤”是该一级标签的二级标签。

其中，二级标签可根据一级标签所在的上下文信息进行计算或者根据一级标签所在的句子进行计算。以下将进行示例性说明。

可选地，在一种实施方式中，根据tf-idf从对文本数据进行分词得到的词语中确定标签后，针对每一标签，可确定其对应的播放时刻t。接着，确定该播放时刻所在的播放时间段T，该播放时间段T以该播放时刻t为中心。接着，可根据对文本数据进行分词得到的每个词语分别对应的播放时刻，从多个词语中，确定播放时刻在该时间段T内的词语。接着，可从该时间段T内的词语中，确定tf-idf大于设定阈值的词语，作为该标签L1的二级标签。

例如，例如，某一标签L1的播放时刻为t1时，可确定(t1-△t)～(t1+△t)对应的时间段。接着，从分词得到的多个词语中，确定播放时刻在(t1-△t)～(t1+△t)时间段之内的词语。接着，从(t1-△t)～(t1+△t)时间段之内的词语中，选择tf-idf值排序靠前的一个或者多个词语，作为标签L1的二级标签。

可选地，在另一种实施方式中，根据tf-idf从对文本数据进行分词得到的词语中确定标签后，针对每个标签，可确定其所在的一个或者多个句子。接着，确定该标签对应的一个或者多个句子，作为该标签的二级标签。

例如，例如，针对某一标签L2，其在文本数据中对应的句子为S1、S2、S3，则可将句子为S1、S2、S3作为标签L2的二级标签。故而，当用户选中标签L2时，可在标签L2对应的进度节点上方以悬浮窗口的形式展示标签L2对应的二级标签，以供用户根据二级标签选择需要查看的片段。

基于本实施例提供的一级标签和二级标签，可对教学类的音视频数据进行不同级别的分类，进一步细化教学内容的分类粒度，可进一步方便用户灵活地选择需要观看的音视频片段，降低用户学习所需的时间成本。

前述各实施例提供的教育类音视频资源的播放方法，可应用于影视视频的播放场景、有声读物的播放场景，在线教育的教学视频播放场景。以下将以在线教育场景为例，进一步对本申请实施例在播放教学视频时的应用进行说明。

图3为本申请一示例性实施例提供的教学视频的播放方法的流程示意图，如图3所示，该方法包括：

步骤301、提取教学视频中的音频数据。

步骤302、对该音频数据进行语音转写，以将该音频数据转化为文本数据。

步骤303、根据该文本数据的内容，确定该教学视频对应的至少一个标签。

步骤304、根据该至少一个标签对应的播放时刻，建立该至少一个标签和该教学视频包含的多个教学视频片段的对应关系。

步骤305、在教学视频的播放页面展示标签查看图标。

步骤306、响应对该标签查看图标的触发操作，展示根据该教学视频生成的至少一个标签。

步骤307、响应对该至少一个标签中的第一标签的选择操作，在进度条上展示该第一标签对应的至少一个进度节点。

步骤308、响应对该至少一个进度节点中的第一进度节点的触发操作，播放该第一进度节点对应的教学视频片段。

在本实施例中，可采用FFmpeg工具从教学视频中提取音频数据，并保存为mp3文件。接着，可利用现有的语音转写(Long Form ASR)技术，将音频数据转换成文本数据。由于教学视频具有更强的规范性及标准的发音，因此，语音转写的准确率高达98％，可实现更精准的识别。

基于本实施例，用户在观看教学视频时，可根据标签进行有选择性的观看，学习方式更灵活，且大大节省了学习的时间成本。与此同时，通过智能筛选标签，并将标签与视频片段绑定，可向用户提供更人性化的学习方式，极大地提高了学习的兴趣和效率。

需要说明的是，上述实施例所提供方法的各步骤的执行主体均可以是同一设备，或者，该方法也由不同设备作为执行主体。比如，步骤201至步骤204的执行主体可以为设备A；又比如，步骤201和202的执行主体可以为设备A，步骤203的执行主体可以为设备B；等等。

另外，在上述实施例及附图中的描述的一些流程中，包含了按照特定顺序出现的多个操作，但是应该清楚了解，这些操作可以不按照其在本文中出现的顺序来执行或并行执行，操作的序号如201、202等，仅仅是用于区分开各个不同的操作，序号本身不代表任何的执行顺序。另外，这些流程可以包括更多或更少的操作，并且这些操作可以按顺序执行或并行执行。需要说明的是，本文中的“第一”、“第二”等描述，是用于区分不同的消息、设备、模块等，不代表先后顺序，也不限定“第一”和“第二”是不同的类型。

图4是本申请一示例性实施例提供的电子设备的结构示意图，该电子设备可用于执行前述各实施例记载的教育类音视频资源的播放方法。如图4所示，该电子设备包括：存储器401、处理器402以及显示组件403。

存储器401，用于存储计算机程序，并可被配置为存储其它各种数据以支持在电子设备上的操作。这些数据的示例包括用于在电子设备上操作的任何应用程序或方法的指令，联系人数据，电话簿数据，消息，图片，第一资源等。

处理器402，与存储器401耦合，用于执行存储器401中的计算机程序，以用于：在第一资源的播放页面展示标签查看图标；响应对所述标签查看图标的触发操作，展示根据所述第一资源生成的至少一个标签；响应对所述至少一个标签中的第一标签的选择操作，在进度条上展示所述第一标签对应的至少一个进度节点；响应对所述至少一个进度节点中的第一进度节点的触发操作，播放所述第一进度节点对应的资源片段。

进一步可选地，处理器402在展示根据所述第一资源生成的至少一个标签时，具体用于：在所述播放页面上展示悬浮窗口；在所述悬浮窗口内，展示所述至少一个标签；以及，突出显示被选中的标签。

进一步可选地，处理器402在进度条上展示所述第一标签对应的至少一个进度节点时，还用于：展示所述至少一个进度节点各自对应的悬浮窗口；在所述至少一个进度节点各自对应的悬浮窗口中，展示所述至少一个进度节点各自对应的资源片段的标识。

进一步可选地，处理器402还用于：在所述播放页面展示保存图标；在播放所述第一进度节点对应的资源片段的过程中，响应对所述保存图标的重触发操作，将所述第一进度节点对应的资源片段保存到观看记录中。

进一步可选地，处理器402在展示根据所述第一资源生成的至少一个标签之前，还用于：提取所述第一资源中的音频数据；对所述音频数据进行语音转写，以将所述音频数据转化为文本数据；根据所述文本数据的内容，确定所述第一资源对应的至少一个标签；根据所述至少一个标签对应的播放时刻，建立所述至少一个标签和所述第一资源包含的多个资源片段的对应关系。

进一步可选地，处理器402在根据所述文本数据，确定所述第一资源对应的至少一个标签时，具体用于：确定所述文本数据包含的多个句子；对所述多个句子分别进行分词处理，得到所述多个句子包含的多个词语；从所述多个词语中，选择满足设定条件的至少一个词语，作为所述至少一个标签。

进一步可选地，处理器402从所述多个词语中，选择满足设定条件的至少一个词语，作为所述至少一个标签时，具体用于：针对所述多个词语中的任一词语，计算所述词语在所属的句子中的词频；以及，根据预设的语料库，计算所述词语的逆文档频率；根据所述词频和所述逆文档频率，计算所述词语的词频-逆文档频率；根据所述多个词语的数量以及所述多个词语各自的词频-逆文档频率，从所述多个词语中，选择满足所述设定条件的至少一个词语，作为所述至少一个标签。

进一步，如图4所示，该电子设备还包括：通信组件404、电源组件405、音频组件406等其它组件。图4中仅示意性给出部分组件，并不意味着电子设备只包括图4所示组件。

其中，存储器401可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(SRAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。

其中，显示组件403包括屏幕，其屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板，屏幕可以被实现为触摸屏，以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界，而且还检测与所述触摸或滑动操作相关的持续时间和压力。

其中，通信组件404被配置为便于通信组件所在设备和其他设备之间有线或无线方式的通信。通信组件所在设备可以接入基于通信标准的无线网络，如WiFi，2G、3G、4G或5G，或它们的组合。在一个示例性实施例中，通信组件经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中，通信组件可基于近场通信(NFC)技术、射频识别(RFID)技术、红外数据协会(IrDA)技术、超宽带(UWB)技术、蓝牙(BT)技术和其他技术来实现。

其中，电源组件405，为电源组件所在设备的各种组件提供电力。电源组件可以包括电源管理系统，一个或多个电源，及其他与为电源组件所在设备生成、管理和分配电力相关联的组件。

本实施例中，电子设备在播放第一资源时，第一资源的播放页面展示的标签查看图标，可向用户提供查看第一资源对应的至少一个标签的操作入口，以供用户查看该至少一个标签。用户从该至少一个标签中选择某一标签时，可在进度条上展示该标签对应的进度节点，并根据用户对进度节点的选择操作，播放该标签对应的资源片段。基于这种实施方式，用户在播放第一资源时，可根据标签有选择性地观看或者收听媒体内容，增加了播放方式的灵活性，有以利于降低用户寻找目标片段所需的时间成本。

相应地，本申请实施例还提供一种存储有计算机程序的计算机可读存储介质，计算机程序被执行时能够实现上述方法实施例中可由电子设备执行的各步骤。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

以上所述仅为本申请的实施例而已，并不用于限制本申请。对于本领域技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本申请的权利要求范围之内。

Claims

1.一种教育类音视频资源的播放方法，其特征在于，包括：

在第一资源的播放页面展示标签查看图标；响应对所述标签查看图标的触发操作，展示根据所述第一资源生成的至少一个标签；所述至少一个标签为一级标签，且各自对应至少一个二级标签；

响应对所述至少一个标签中的第一标签的选择操作，在进度条上展示所述第一标签对应的至少一个进度节点，并在所述至少一个进度节点各自对应的悬浮窗口中，展示所述第一标签对应的二级标签；

响应对所述至少一个进度节点中的第一进度节点的触发操作，播放所述第一进度节点对应的资源片段，所述资源片段与所述二级标签关联；

其中，所述二级标签是根据其对应一级标签所在的上下文信息或句子计算出的；

其中，所述至少一个标签是通过下述方式选择的：确定文本数据包含的多个句子；对所述多个句子分别进行分词处理，得到所述多个句子包含的多个词语；针对所述多个词语中的任一词语，计算所述词语在所属的句子中的词频；以及，根据预设的语料库，计算所述词语的逆文档频率；根据所述词频和所述逆文档频率，计算所述词语的词频-逆文档频率；根据所述多个词语的数量以及所述多个词语各自的词频-逆文档频率，从所述多个词语中，选择满足设定条件的至少一个词语，作为所述至少一个标签。

2.根据权利要求1所述的方法，其特征在于，展示根据所述第一资源生成的至少一个标签，包括：

在所述播放页面上展示悬浮窗口；

在所述悬浮窗口内，展示所述至少一个标签；以及，突出显示被选中的标签。

3.根据权利要求1所述的方法，其特征在于，在进度条上展示所述第一标签对应的至少一个进度节点，还包括：

展示所述至少一个进度节点各自对应的悬浮窗口；

在所述至少一个进度节点各自对应的悬浮窗口中，展示所述至少一个进度节点各自对应的资源片段的标识。

4.根据权利要求1所述的方法，其特征在于，还包括：

在所述播放页面展示保存图标；

在播放所述第一进度节点对应的资源片段的过程中，响应对所述保存图标的重触发操作，将所述第一进度节点对应的资源片段保存到观看记录中。

5.根据权利要求1-4任一项所述的方法，其特征在于，所述至少一个标签，包括：内容标签和/或类型标签。

6.根据权利要求1-4任一项所述的方法，其特征在于，展示根据所述第一资源生成的至少一个标签之前，还包括：

提取所述第一资源中的音频数据；

对所述音频数据进行语音转写，以将所述音频数据转化为文本数据；

根据所述文本数据的内容，确定所述第一资源对应的至少一个标签；

根据所述至少一个标签对应的播放时刻，建立所述至少一个标签和所述第一资源包含的多个资源片段的对应关系。

7.一种电子设备，其特征在于，包括：存储器、处理器和显示组件；

所述存储器用于存储一条或多条计算机指令；

所述处理器用于执行所述一条或多条计算机指令以用于：执行权利要求1-6任一项所述的方法中的步骤。

8.一种存储有计算机程序的计算机可读存储介质，其特征在于，计算机程序被执行时能够实现权利要求1-6任一项所述的方法中的步骤。