CN107343223A

CN107343223A - 视频片段的识别方法和装置

Info

Publication number: CN107343223A
Application number: CN201710551569.0A
Authority: CN
Inventors: 朱海军
Original assignee: Beijing Muhua Mdt Infotech Ltd
Current assignee: Beijing Muhua Mdt Infotech Ltd
Priority date: 2017-07-07
Filing date: 2017-07-07
Publication date: 2017-11-10
Anticipated expiration: 2037-07-07
Also published as: CN107343223B

Abstract

本发明提供了一种视频片段的识别方法和装置，包括：提取教学视频中包含的每个视频片段的知识点标签，得到至少一个知识点标签；基于视频片段的知识点标签和视频片段的字幕信息对目标试题按照知识点进行分类，得到至少一种类别的试题分组，目标试题为所属于教学视频的试题，且不同类别的试题分组对应的知识点标签不同；基于获取到的每个试题分组的答题结果在知识点标签中确定目标知识点标签所对应的目标知识点，其中，目标知识点为至少一个知识点中难度大于预设难度的知识点；将视频片段中目标知识点所对应的视频片段作为难点片段，缓解了采用现有技术中的方法进行难点识别时识别精度较差，且识别过程较为缓慢的技术问题。

Description

视频片段的识别方法和装置

技术领域

本发明涉及视频数据处理技术领域，尤其是涉及一种视频片段的识别方法和装置。

背景技术

视频是在线学习的重要载体，老师在录制教学视频时，不同老师录制的视频侧重点不同，对知识点的难易把握也不尽相同。传统的教学视频较长，一节课对应一个视频，一个视频包含多个知识点。因此，想要从该视频中识别较难的知识点，以及识别这些知识点对应于视频的起始位置是相当困难的。现有技术方案中，一般是通过大量学生反馈，得出视频难点大概位置。但是人工反馈存在一定的缺点，例如，当网络课堂视频数量较大，学生数量较多时，由于缺少面对面的沟通，学生的主动式反馈比较困难。且众多学生中个别学生的反馈，不一定是难点；大量学生反馈同一个问题，才有可能是难点，需要引起老师重视，进而优化教案，更新教学视频。

发明内容

有鉴于此，本发明的目的在于提供一种视频片段的识别方法和装置，以缓解采用现有技术中的方法进行难点识别时识别精度较差，且识别过程较为缓慢的技术问题。

第一方面，本发明实施例提供了一种视频片段的识别方法，包括：提取教学视频中包含的每个视频片段的知识点标签，得到至少一个知识点标签，其中，所述至少一个知识点标签用于指示至少一个知识点；基于所述视频片段的知识点标签和所述视频片段的字幕信息对目标试题按照知识点进行分类，得到至少一种类别的试题分组，其中，所述目标试题为所属于所述教学视频的试题，且不同类别的所述试题分组对应的知识点标签不同；基于获取到的每个所述试题分组的答题结果在所述知识点标签中确定目标知识点标签所对应的目标知识点，其中，所述目标知识点为所述至少一个知识点中难度大于预设难度的知识点；将所述视频片段中所述目标知识点所对应的视频片段作为难点片段。

进一步地，提取教学视频中包含的每个视频片段的知识点标签包括：提取所述视频片段的字幕信息；对所述字幕信息进行文本分割处理，处理得到至少一个文本分割片段；采用TextRank算法在每个文本分割片段中提取TopN关键词，并将提取到的所述TopN关键词作为所述视频片段的知识点标签。

进一步地，对所述字幕信息进行文本分割处理，处理得到至少一个文本分割片段包括：对所述字幕信息执行目标处理，得到处理之后的所述字幕信息，其中，所述目标处理包括：分词处理和去停用词处理；基于文本分割算法对处理之后的所述字幕信息进行文本分割，分割之后得到所述至少一个文本分割片段。

进一步地，提取所述视频片段的字幕信息包括：判断所述视频片段是否包含所述字幕信息；如果判断出所述视频片段包含所述字幕信息，则提取所述字幕信息；如果判断出所述视频片段不包含所述字幕信息，则提取所述视频片段的音频信息，并将所述音频信息转换为所述字幕信息。

进一步地，基于所述视频片段的知识点标签和所述视频片段的字幕信息对目标试题按照知识点进行分类，得到至少一种类别的试题分组包括：构建训练语料，其中，所述训练语料中包括所述至少一个知识点标签和字幕碎片，其中，所述字幕碎片为通过对所述字幕信息进行处理得到的碎片；通过所述训练语料对分类模型进行训练；基于训练好的所述分类模型对所述目标试题进行分类，得到所述至少一种类别的试题分组。

进一步地，构建训练语料包括：将所述视频片段的字幕信息进行切分，得到所述字幕碎片，其中，所述字幕碎片中包括至少一个关键词；通过所述训练语料对分类模型进行训练包括：将所述字幕碎片和所述至少一个知识点标签作为所述分类模型的输入，将目标概率信息作为所述分类模型的输出，对所述分类模型进行训练，其中，所述目标概率信息表示所述至少一个关键词中每个关键词为所述至少一个知识点标签中的知识点标签的概率。

进一步地，基于获取到的每个所述试题分组的答题结果在所述知识点标签中确定目标知识点标签所对应的目标知识点包括：获取全部学习人员对所述试题分组中每个试题的答题结果；在所述答题结果中统计第一答题结果的数量和第二答题结果的数量，其中，所述第一答题结果为正确的答题结果，所述第二答题结果为错误的答题结果；基于第二答题结果的数量判断当前所述试题分组所对应的知识点标签是否为所述目标知识点标签；其中，如果判断出是，则将当前所述试题分组所对应的知识点标签作为所述目标知识点标签。

进一步地，在将所述教学视频中所述目标知识点所对应的视频片段作为难点片段之后，所述方法还包括：生成目标图像，其中，所述目标图像中包括每个所述视频片段的难点视频的起始时间、每个所述视频片段的难点视频的结束时间和每个所述视频片段的难点视频的难易程度；将所述目标图像推送至教师，以使教师根据所述目标图像确定难点视频，其中，所述教师为所述教学视频中的教师。

第二方面，本发明实施例还提供一种视频片段的识别装置，包括：提取单元，用于提取教学视频中包含的每个视频片段的知识点标签，得到至少一个知识点标签，其中，所述至少一个知识点标签用于指示至少一个知识点；分类单元，用于基于所述视频片段的知识点标签和所述视频片段的字幕信息对目标试题按照知识点进行分类，得到至少一种类别的试题分组，其中，所述目标试题为所属于所述教学视频的试题，且不同类别的所述试题分组对应的知识点标签不同；第一确定单元，用于基于获取到的每个所述试题分组的答题结果在所述知识点标签中确定目标知识点标签所对应的目标知识点，其中，所述目标知识点为所述至少一个知识点中难度大于预设难度的知识点；第二确定单元，用于将所述视频片段中所述目标知识点所对应的视频片段作为难点片段。

进一步地，所述提取单元包括：第一提取模块，用于提取所述视频片段的字幕信息；分割处理模块，用于对所述字幕信息进行文本分割处理，处理得到至少一个文本分割片段；第二提取模块，用于采用TextRank算法在每个文本分割片段中提取TopN关键词，并将提取到的所述TopN关键词作为所述视频片段的知识点标签。

在本发明实施例中，首先提取教学视频中包含的每个视频片段的知识点标签，然后，基于知识点标签和视频片段的字幕信息对目标试题按照知识点进行分类，得到至少一种类别的试题分组；接下来，基于每个试题分组的答题结果在知识点标签中确定目标知识点标签所对应的目标知识点；最后，将视频片段中目标知识点所对应的视频片段作为难点片段。在本发明实施例中，通过上述方式，能够快速有效的在教学视频中识别难点片段，进而缓解了采用现有技术中的方法进行难点识别时识别精度较差，且识别过程较为缓慢的技术问题。

本发明的其他特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。

为使本发明的上述目的、特征和优点能更明显易懂，下文特举较佳实施例，并配合所附附图，作详细说明如下。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案，下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施方式，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是根据本发明实施例的一种视频片段的识别方法的流程图；

图2是根据本发明实施例的一种目标图像的示意图；

图3是根据本发明实施例的另一种视频片段的识别方法的流程图；

图4是根据本发明实施例的一种视频片段的识别装置的示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合附图对本发明的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例一：

根据本发明实施例，提供了一种视频片段的识别方法的实施例，需要说明的是，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

图1是根据本发明实施例的一种视频片段的识别方法的流程图，如图1所示，该方法包括如下步骤：

步骤S102，提取教学视频中包含的每个视频片段的知识点标签，得到至少一个知识点标签，其中，至少一个知识点标签用于指示至少一个知识点；

在本发明实施例中，可以通过服务器提取教学视频中包含的每个视频片段的知识点标签。

需要说明的是，一个完整的教学视频中包括多个视频片段，每个视频片段的时间不等，可以为5分钟，可以为10分钟，还可以为15分钟，具体以教学老师的录制时间为准。上述知识点标签可以术语名称，例如，拉格朗日中值定理，罗尔定理和柯西中值定理等专有名词。

如果一个完整的教学视频中包含多个视频片段，那么每个视频片段可以对应一个知识点标签，可以对应多个知识点标签。但是，在一般情况下，一个视频片段对应一个知识点标签。如果一个完整的教学视频中包括多个视频片段，那么任意两个视频片段所对应的知识点标签不相同。

步骤S104，基于视频片段的知识点标签和视频片段的字幕信息对目标试题按照知识点进行分类，得到至少一种类别的试题分组，其中，目标试题为所属于教学视频的试题，且不同类别的试题分组对应的知识点标签不同；

在本发明实施例中，服务器可以基于视频片段的知识点标签和视频片段的字幕信息对目标试题进行分类。

步骤S106，基于获取到的每个试题分组的答题结果在知识点标签中确定目标知识点标签所对应的目标知识点，其中，目标知识点为至少一个知识点中难度大于预设难度的知识点；

在本发明实施例中，服务器可以基于获取到的试题分组的答题结果在知识点标签中确定目标知识点标签所对应的目标知识点。

步骤S108，将视频片段中目标知识点所对应的视频片段作为难点片段。

在本发明实施例中，服务器可以将视频片段中目标知识点所对应的视频片段作为难点片段。

需要说明的是，服务器可以在该教学视频录制完成之后，就执行上述步骤S102和步骤S104。并在学生们对目标试题答题完成之后，执行步骤S106和步骤S108。

在本发明实施例的一个可选实施方式中，上述步骤S102，即，提取教学视频中包含的每个视频片段的知识点标签包括如下步骤：

步骤S1021，提取视频片段的字幕信息；

其中，提取视频片段的字幕信息包括：判断视频片段是否包含字幕信息；如果判断出视频片段包含字幕信息，则提取字幕信息；如果判断出视频片段不包含字幕信息，则提取视频片段的音频信息，并将音频信息转换为字幕信息。

步骤S1022，对字幕信息进行文本分割处理，处理得到至少一个文本分割片段；

步骤S1023，采用TextRank算法在每个文本分割片段中提取TopN关键词，并将提取到的TopN关键词作为视频片段的知识点标签。

在本发明实施例中，首先判断视频片段是否包含字幕信息，如果判断出包含字幕信息，则直接提取该视频片段的字幕信息；如果判断出视频片段不包含字幕信息，则提取该视频片段的音频信息，并对该音频信息进行识别，识别得到该视频片段的字幕信息。

需要说明的是，服务器在对音频信息进行识别之后，还可以将识别出的字幕信息发送给用户，以使用户对该字幕信息进行校正，并基于校正之后的字幕信息执行后续流程。

在提取得到视频片段的字幕信息之后，就可以对字幕信息进行文本分割处理，得到至少一个文本分割片段。由于每个视频片段的字幕信息都较长，因此，可以对字幕信息进行分割，分割成多个片段。

在一个可选实施方式中，对字幕信息进行文本分割处理，处理得到至少一个文本分割片段的具体过程描述如下：

首先，对字幕信息执行目标处理，得到处理之后的字幕信息，其中，目标处理包括：分词处理和去停用词处理；例如，可以先对字幕信息进行分词处理，得到至少一个分词，然后，将至少一个分词中的停用词删除，其中，停用词包括：吧，吗，啊，哎，哎呦等词汇。

然后，基于文本分割算法对处理之后的字幕信息进行文本分割，分割之后得到至少一个文本分割片段；具体地，可以采用TextTiling文本分割算法对分割算法处理之后的字幕信息进行文本分割处理，得到至少一个文本分割片段。也就是说，在每个文本分割片段中，包括至少一个分词。

在得到至少一个文本分割片段之后，就可以采用TextRank算法在每个文本分割片段中提取TopN关键词，并对至少一个文本分割片段均执行提取操作之后，将提取到的至少一个TopN关键词作为视频片段的知识点标签。

其中，TextRank算法为一种关键词提取算法，该计算基于PageRank，用于为文本生成关键字和摘要。

需要说明的是，也就是说，每个知识点标签对应一个或者多个TopN关键词，且任意两个知识点标签之间至少有一个关键词不相同。

在本发明实施例的另一个可选实施方式中，上述步骤S104，即，基于视频片段的知识点标签和视频片段的字幕信息对目标试题按照知识点进行分类，得到至少一种类别的试题分组包括如下步骤：

步骤S1041，构建训练语料，其中，训练语料中包括至少一个知识点标签和字幕碎片，其中，字幕碎片为通过对字幕信息进行处理得到的碎片；

步骤S1042，通过训练语料对分类模型进行训练；

步骤S1043，基于训练好的分类模型对目标试题进行分类，得到至少一种类别的试题分组。

在本发明实施例中，由于每个知识点标签所对应的字幕信息的文本片段较长，且目标试题的题目一般较短，因此，在构建训练语料时，将视频片段的字幕信息进行切分，得到字幕碎片，其中，字幕碎片中包括至少一个关键词。

在得到训练语料之后，就可以通过训练语料对分类模型进行训练。具体地，可以将字幕碎片和至少一个知识点标签作为分类模型的输入，将目标概率信息作为分类模型的输出，然后，对分类模型进行训练，其中，目标概率信息表示至少一个关键词中每个关键词为至少一个知识点标签中的知识点标签的概率。

在通过训练语料对分类模型进行训练之后，就可以基于训练好的分类模型对目标试题进行分类，得到至少一种类别的试题分组。其中，分类模型在对目标试题进行分类的过程中，是按照知识点标签对目标试题进行分类。也就是说，将知识点标签相同的目标试题作为相同的试题分组。

在基于视频片段的知识点标签和视频片段的字幕信息对目标试题按照知识点进行分类之后，就可以获取每个试题分组的答题结果，并基于获取到的每个试题分组的答题结果在知识点标签中确定目标知识点标签所对应的目标知识点。

其中，基于获取到的每个试题分组的答题结果在知识点标签中确定目标知识点标签所对应的目标知识点的过程描述如下：

首先，获取全部学习人员对试题分组中每个试题的答题结果；

然后，在答题结果中统计第一答题结果的数量和第二答题结果的数量，其中，第一答题结果为正确的答题结果，第二答题结果为错误的答题结果；

最后，基于第二答题结果的数量判断当前试题分组所对应的知识点标签是否为目标知识点标签；其中，如果判断出是，则将当前试题分组所对应的知识点标签作为目标知识点标签。

例如，至少一个试题分组包括试题分组1，试题分组2和试题分组3，其中，试题分组与知识点标签为一一对应的关系。试题分组1中包括试题Q1和试题Q2，参与试题Q1和试题Q2的学生人数均为10人，其中，试题Q1中第一答题结果的数量为6个，第二答题结果的数量为4个，试题Q2中第一答题结果的数量为1个，第二答题结果的数量为9个。此时，第一答题结果的数量总和为7个，第二答题结果的数量总和为13个，也就是说，针对试题分组1，答错的人次为13人，答错的人次与总人次的比例为65％。也就是说，针对试题分组1，答错率为65％。如果将阈值设置为40％，那么试题分组1所对应的知识点标签可以确定为目标知识点标签，目标知识点标签所对应的目标知识点为难度大于预设难度的知识点。预设难度可以通过阈值40％来确定。也就是说，比例大于40％的即为困难，比例小于40％的即为简单。

在本发明实施例中，在将教学视频中目标知识点所对应的视频片段作为难点片段之后，还可以生成目标图像，其中，目标图像中包括每个视频片段的难点视频的起始时间、每个视频片段的难点视频的结束时间和每个视频片段的难点视频的难易程度；接下来，就可以将目标图像推送至教师，以使教师根据目标图像确定难点视频，其中，教师为教学视频中的教师。

如图2所示的即为目标图像，从目标图像中可以看出，在一个完整的教学视频中包括视频片段1，视频片段2，视频片断3和视频片段4。图2中，圆形的符号用于表示难易程度，其中，该圆形的符号越大，则表示难度越大，该圆形的符号越小，则表示难度越小。例如，视频片段3的难度最大，其次是视频片段1，再次就是视频片段2。在图2中，还能够表示出每个视频片段中难点片段的起始时间和结束时间。图2中，b点所示的即为起始时间，图2中，a点所示的即为结束时间。从图2中可以看出，视频片段3中包含两个难点片段。

综上，在本发明实施例中，提出了一种视频片段的识别方法，该识别方法为在教学视频中识别难点片段的方法。通过该方法，能够自动利用机器处理视频的字幕信息，以及处理目标试题，从而进行知识点标签的提取。再结合学生的答题结果，自动识别难点片段，并以可视化的形式为教师展示视频中的难点片段，以及每个难点片段的难易程度。

综上各实施例提供的视频片段的识别方法，为了直观理解上述过程，以图3所示的视频片段的识别方法的示意图为例进行说明，该方法主要包括：知识点标签的提取，习题分类和难点片段的识别。

具体地，首先获取教学视频，然后，判断教学视频是否包含字幕信息，其中，如果判断出是，则直接提取字幕信息，如果判断出不是，则提取教学视频的音频信息，并对音频信息进行语音识别，从而得到字幕信息。其中，在进行语音识别得到识别结果之后，还可以进行人工校对，以校对识别结果是否准确。

在提取教学视频的字幕信息之后，就可以对字幕信息进行文本分割处理，从而，提取知识点标签。在提取知识点标签之后，就可以基于知识点标签对习题进行分类，得到至少一种类别的试题分组。在得到试题分组之后，就可以获取学生们的答题结果，并基于答题结果在教学视频中识别难点片段，具体实现过程如上，这里不再赘述。

实施例二：

本发明实施例还提供了一种视频片段的识别装置，该视频片段的识别装置主要用于执行本发明实施例上述内容所提供的视频片段的识别方法，以下对本发明实施例提供的视频片段的识别装置做具体介绍。

图4是根据本发明实施例的一种视频片段的识别装置的示意图，如图4所示，该视频片段的识别装置主要包括：提取单元41，分类单元42，第一确定单元43和第二确定单元44，其中：

提取单元41，用于提取教学视频中包含的每个视频片段的知识点标签，得到至少一个知识点标签，其中，至少一个知识点标签用于指示至少一个知识点；

分类单元42，用于基于视频片段的知识点标签和视频片段的字幕信息对目标试题按照知识点进行分类，得到至少一种类别的试题分组，其中，目标试题为所属于教学视频的试题，且不同类别的试题分组对应的知识点标签不同；

第一确定单元43，用于基于获取到的每个试题分组的答题结果在知识点标签中确定目标知识点标签所对应的目标知识点，其中，目标知识点为至少一个知识点中难度大于预设难度的知识点；

第二确定单元44，用于将视频片段中目标知识点所对应的视频片段作为难点片段。

可选地，提取单元包括：第一提取模块，用于提取视频片段的字幕信息；分割处理模块，用于对字幕信息进行文本分割处理，处理得到至少一个文本分割片段；第二提取模块，用于采用TextRank算法在每个文本分割片段中提取TopN关键词，并将提取到的TopN关键词作为视频片段的知识点标签。

可选地，分割处理模块用于：对字幕信息执行目标处理，得到处理之后的字幕信息，其中，目标处理包括：分词处理和去停用词处理；基于文本分割算法对处理之后的字幕信息进行文本分割，分割之后得到至少一个文本分割片段。

可选地，提取单元用于：判断视频片段是否包含字幕信息；如果判断出视频片段包含字幕信息，则提取字幕信息；如果判断出视频片段不包含字幕信息，则提取视频片段的音频信息，并将音频信息转换为字幕信息。

可选地，分类单元包括：构建模块，用于构建训练语料，其中，训练语料中包括至少一个知识点标签和字幕碎片，其中，字幕碎片为通过对字幕信息进行处理得到的碎片；训练模块，用于通过训练语料对分类模型进行训练；分类模块，用于基于训练好的分类模型对目标试题进行分类，得到至少一种类别的试题分组。

可选地，构建模块用于：将视频片段的字幕信息进行切分，得到字幕碎片，其中，字幕碎片中包括至少一个关键词；训练模块用于：将字幕碎片和至少一个知识点标签作为分类模型的输入，将目标概率信息作为分类模型的输出，对分类模型进行训练，其中，目标概率信息表示至少一个关键词中每个关键词为至少一个知识点标签中的知识点标签的概率。

可选地，第一确定单元用于：获取全部学习人员对试题分组中每个试题的答题结果；在答题结果中统计第一答题结果的数量和第二答题结果的数量，其中，第一答题结果为正确的答题结果，第二答题结果为错误的答题结果；基于第二答题结果的数量判断当前试题分组所对应的知识点标签是否为目标知识点标签；其中，如果判断出是，则将当前试题分组所对应的知识点标签作为目标知识点标签。

可选地，该装置还包括：生成单元，用于在将教学视频中目标知识点所对应的视频片段作为难点片段之后，生成目标图像，其中，目标图像中包括每个视频片段的难点视频的起始时间、每个所述视频片段的难点视频的结束时间和每个视频片段的难点视频的难易程度；推送单元，用于将目标图像推送至教师，以使教师根据目标图像确定难点视频，其中，教师为教学视频中的教师。

另外，在本发明实施例的描述中，除非另有明确的规定和限定，术语“安装”、“相连”、“连接”应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体地连接；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通。对于本领域的普通技术人员而言，可以具体情况理解上述术语在本发明中的具体含义。

在本发明的描述中，需要说明的是，术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。此外，术语“第一”、“第二”、“第三”仅用于描述目的，而不能理解为指示或暗示相对重要性。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，又例如，多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是：以上所述实施例，仅为本发明的具体实施方式，用以说明本发明的技术方案，而非对其限制，本发明的保护范围并不局限于此，尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化，或者对其中部分技术特征进行等同替换；而这些修改、变化或者替换，并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应所述以权利要求的保护范围为准。

Claims

1.一种视频片段的识别方法，其特征在于，包括：

提取教学视频中包含的每个视频片段的知识点标签，得到至少一个知识点标签，其中，所述至少一个知识点标签用于指示至少一个知识点；

基于所述视频片段的知识点标签和所述视频片段的字幕信息对目标试题按照知识点进行分类，得到至少一种类别的试题分组，其中，所述目标试题为所属于所述教学视频的试题，且不同类别的所述试题分组对应的知识点标签不同；

基于获取到的每个所述试题分组的答题结果在所述知识点标签中确定目标知识点标签所对应的目标知识点，其中，所述目标知识点为所述至少一个知识点中难度大于预设难度的知识点；

将所述视频片段中所述目标知识点所对应的视频片段作为难点片段。

2.根据权利要求1所述的方法，其特征在于，提取教学视频中包含的每个视频片段的知识点标签包括：

提取所述视频片段的字幕信息；

对所述字幕信息进行文本分割处理，处理得到至少一个文本分割片段；

采用TextRank算法在每个文本分割片段中提取TopN关键词，并将提取到的所述TopN关键词作为所述视频片段的知识点标签。

3.根据权利要求2所述的方法，其特征在于，对所述字幕信息进行文本分割处理，处理得到至少一个文本分割片段包括：

对所述字幕信息执行目标处理，得到处理之后的所述字幕信息，其中，所述目标处理包括：分词处理和去停用词处理；

基于文本分割算法对处理之后的所述字幕信息进行文本分割，分割之后得到所述至少一个文本分割片段。

4.根据权利要求2所述的方法，其特征在于，提取所述视频片段的字幕信息包括：

判断所述视频片段是否包含所述字幕信息；

如果判断出所述视频片段包含所述字幕信息，则提取所述字幕信息；

如果判断出所述视频片段不包含所述字幕信息，则提取所述视频片段的音频信息，并将所述音频信息转换为所述字幕信息。

5.根据权利要求2所述的方法，其特征在于，基于所述视频片段的知识点标签和所述视频片段的字幕信息对目标试题按照知识点进行分类，得到至少一种类别的试题分组包括：

构建训练语料，其中，所述训练语料中包括所述至少一个知识点标签和字幕碎片，其中，所述字幕碎片为通过对所述字幕信息进行处理得到的碎片；

通过所述训练语料对分类模型进行训练；

基于训练好的所述分类模型对所述目标试题进行分类，得到所述至少一种类别的试题分组。

6.根据权利要求5所述的方法，其特征在于，

构建训练语料包括：将所述视频片段的字幕信息进行切分，得到所述字幕碎片，其中，所述字幕碎片中包括至少一个关键词；

通过所述训练语料对分类模型进行训练包括：将所述字幕碎片和所述至少一个知识点标签作为所述分类模型的输入，将目标概率信息作为所述分类模型的输出，对所述分类模型进行训练，其中，所述目标概率信息表示所述至少一个关键词中每个关键词为所述至少一个知识点标签中的知识点标签的概率。

7.根据权利要求1所述的方法，其特征在于，基于获取到的每个所述试题分组的答题结果在所述知识点标签中确定目标知识点标签所对应的目标知识点包括：

获取全部学习人员对所述试题分组中每个试题的答题结果；

在所述答题结果中统计第一答题结果的数量和第二答题结果的数量，其中，所述第一答题结果为正确的答题结果，所述第二答题结果为错误的答题结果；

基于第二答题结果的数量判断当前所述试题分组所对应的知识点标签是否为所述目标知识点标签；

其中，如果判断出是，则将当前所述试题分组所对应的知识点标签作为所述目标知识点标签。

8.根据权利要求1所述的方法，其特征在于，在将所述教学视频中所述目标知识点所对应的视频片段作为难点片段之后，所述方法还包括：

生成目标图像，其中，所述目标图像中包括每个所述视频片段的难点视频的起始时间、每个所述视频片段的难点视频的结束时间和每个所述视频片段的难点视频的难易程度；

将所述目标图像推送至教师，以使教师根据所述目标图像确定难点视频，其中，所述教师为所述教学视频中的教师。

9.一种视频片段的识别装置，其特征在于，包括：

提取单元，用于提取教学视频中包含的每个视频片段的知识点标签，得到至少一个知识点标签，其中，所述至少一个知识点标签用于指示至少一个知识点；

分类单元，用于基于所述视频片段的知识点标签和所述视频片段的字幕信息对目标试题按照知识点进行分类，得到至少一种类别的试题分组，其中，所述目标试题为所属于所述教学视频的试题，且不同类别的所述试题分组对应的知识点标签不同；

第一确定单元，用于基于获取到的每个所述试题分组的答题结果在所述知识点标签中确定目标知识点标签所对应的目标知识点，其中，所述目标知识点为所述至少一个知识点中难度大于预设难度的知识点；

第二确定单元，用于将所述视频片段中所述目标知识点所对应的视频片段作为难点片段。

10.根据权利要求9所述的装置，其特征在于，所述提取单元包括：

第一提取模块，用于提取所述视频片段的字幕信息；

分割处理模块，用于对所述字幕信息进行文本分割处理，处理得到至少一个文本分割片段；

第二提取模块，用于采用TextRank算法在每个文本分割片段中提取TopN关键词，并将提取到的所述TopN关键词作为所述视频片段的知识点标签。