CN117253386A

CN117253386A - 确定课程视频的方法、装置、设备及存储介质

Info

Publication number: CN117253386A
Application number: CN202211287779.0A
Authority: CN
Inventors: 李超; 徐钊
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2022-10-20
Filing date: 2022-10-20
Publication date: 2023-12-19

Abstract

本申请公开了一种确定课程视频的方法、装置、设备及存储介质，属于计算机技术领域。该方法包括：对老师录制的初始课程视频按照知识点粒度进行切分，得到候选知识点视频；获取目标学生的知识点学习需求和属性特征；基于目标学生的知识点学习需求，确定与目标学生匹配的至少一个目标知识点；基于至少一个目标知识点和目标学生的属性信息，从候选知识点视频中确定与目标学生匹配的目标知识点视频集；对目标知识点视频集中的目标知识点视频进行拼接，得到至少一个候选课程视频；从至少一个候选课程视频中选取满足选取条件的目标课程视频。此种方式确定的目标课程视频有利于提高学生的学习兴趣以及学习效果，提高学生与教育平台的交互率。

Description

确定课程视频的方法、装置、设备及存储介质

技术领域

本申请实施例涉及计算机技术领域，特别涉及一种确定课程视频的方法、装置、设备及存储介质。

背景技术

随着计算机技术的发展，能够在线提供课程视频的教育平台越来越多，学生能够通过在教育平台学习课程视频来增长知识。教育平台能够为学生确定待学习的课程视频供学生选择。

相关技术中，直接从老师录制的多个课程视频中确定一个或多个课程视频作为学生待学习的课程视频。老师录制的课程视频通常是小时级别的较长视频，该较长视频中可能存在与学生匹配程度较低的部分视频，直接将老师录制的课程视频作为学生待学习的课程视频，容易降低学生的学习兴趣和学习效果，进而降低学生与教育平台的交互率。

发明内容

本申请实施例提供了一种确定课程视频的方法、装置、设备及存储介质，可用于提高学生的学习兴趣和学习效果。所述技术方案如下：

一方面，本申请实施例提供了一种确定课程视频的方法，所述方法包括：

获取老师录制的初始课程视频，对所述初始课程视频按照知识点粒度进行切分，得到候选知识点视频；

获取目标学生的知识点学习需求和属性特征，所述知识点学习需求用于指示所述目标学生期望学习的知识点，所述属性特征用于标识所述目标学生；

基于所述目标学生的知识点学习需求，确定与所述目标学生匹配的至少一个目标知识点；基于所述至少一个目标知识点和所述目标学生的属性信息，从所述候选知识点视频中确定与所述目标学生匹配的目标知识点视频集，所述目标知识点视频集包括各个目标知识点分别对应的至少一个目标知识点视频；

对所述目标知识点视频集中的目标知识点视频进行拼接，得到至少一个候选课程视频，任一候选课程视频由各个目标知识点分别对应的一个目标知识点视频拼接得到；

从所述至少一个候选课程视频中选取满足选取条件的目标课程视频，所述目标课程视频为所述目标学生待学习的课程视频。

另一方面，提供了一种确定课程视频的装置，所述装置包括：

第一获取模块，用于获取老师录制的初始课程视频，对所述初始课程视频按照知识点粒度进行切分，得到候选知识点视频；

第二获取模块，用于获取目标学生的知识点学习需求和属性特征，所述知识点学习需求用于指示所述目标学生期望学习的知识点，所述属性特征用于标识所述目标学生；

确定模块，用于基于所述目标学生的知识点学习需求，确定与所述目标学生匹配的至少一个目标知识点；基于所述至少一个目标知识点和所述目标学生的属性信息，从所述候选知识点视频中确定与所述目标学生匹配的目标知识点视频集，所述目标知识点视频集包括各个目标知识点分别对应的至少一个目标知识点视频；

拼接模块，用于对所述目标知识点视频集中的目标知识点视频进行拼接，得到至少一个候选课程视频，任一候选课程视频由各个目标知识点分别对应的一个目标知识点视频拼接得到；

选取模块，用于从所述至少一个候选课程视频中选取满足选取条件的目标课程视频，所述目标课程视频为所述目标学生待学习的课程视频。

在一种可能实现方式中，所述确定模块，用于从所述候选知识点视频中确定任一目标知识点对应的至少一个第一知识点视频，从所述任一目标知识点对应的至少一个第一知识点视频中确定满足筛选条件的至少一个第二知识点视频；基于所述目标学生的属性特征和所述至少一个第二知识点视频的视频特征，确定所述至少一个第二知识点视频分别与所述目标学生的匹配度；将匹配度满足匹配条件的至少一个第二知识点视频作为所述任一目标知识点对应的至少一个目标知识点视频；基于各个目标知识点分别对应的至少一个目标知识点视频，确定所述目标知识点视频集。

在一种可能实现方式中，所述选取模块，用于获取任一候选课程视频的第一评估指标、第二评估指标和第三评估指标中的至少一项，基于所述第一评估指标、第二评估指标和第三评估指标中的至少一项，确定所述任一候选课程视频的评估结果；将所述至少一个候选课程视频中的评估结果满足第一评估条件的候选课程视频作为所述满足选取条件的目标课程视频；其中，所述第一评估指标基于所述任一候选课程视频中的各个目标知识点视频对应的文本得到，所述第一评估指标用于评估所述任一候选课程视频的内容串讲的合理性；所述第二评估指标基于所述任一候选课程视频中的各个视频帧得到，所述第二评估指标用于评估所述任一候选课程视频的观看流畅度；所述第三评估指标基于所述任一候选课程视频中的各个目标知识点视频对应的文本和所述任一候选课程视频中的各个视频帧得到，所述第三评估指标用于评估所述任一候选课程视频的整体质量。

在一种可能实现方式中，所述确定模块，用于获取教育知识图谱，所述教育知识图谱包括知识点对应的节点以及知识点对应的节点之间的边；基于所述目标学生的知识点学习需求和所述教育知识图谱，确定与所述目标学生匹配的至少一个目标知识点。

在一种可能实现方式中，所述确定模块，用于获取初始知识图谱；剔除所述初始知识图谱中与教育场景的关联性不满足关联要求的节点和边，得到第一知识图谱；基于所述教育场景对应的书籍、所述教育场景对应的多媒体资源中的至少一项，在所述第一知识图谱中增加与所述教育场景的关联性满足关联要求且所述第一知识图谱中缺少的节点和边，得到第二知识图谱；对所述第二知识图谱进行修正，得到所述教育知识图谱。

在一种可能实现方式中，所述拼接模块，用于确定所述至少一个目标知识点的排列顺序；基于所述排列顺序对所述目标知识点视频集中的目标知识点视频进行拼接，得到至少一个候选课程视频，任一候选课程视频由各个目标知识点分别对应的一个目标知识点视频按照所述排列顺序拼接得到。

在一种可能实现方式中，所述第一获取模块，用于获取所述初始课程视频对应的语音数据，将所述语音数据转换为文本；抽取所述文本中的知识点；基于所述初始课程视频的视频帧和所述视频帧对应的文本，确定所述视频帧的分类结果，所述视频帧的分类结果用于指示所述视频帧在抽取的知识点中对应的知识点；基于所述初始课程视频中的各个视频帧的分类结果，对所述初始课程视频按照知识点粒度进行切分，得到切分视频；基于所述切分视频，获取所述候选知识点视频。

在一种可能实现方式中，所述第一获取模块，用于基于所述切分视频的视频特征，获取所述切分视频的评估结果；将所述切分视频中的评估结果不满足第二评估条件的视频剔除，得到所述候选知识点视频。

在一种可能实现方式中，所述切分视频的视频特征包括所述切分视频对应的初始课程视频的录制老师的特征、所述切分视频对应的初始课程视频的录制老师所属机构的特征、所述切分视频的内容的特征中的至少一项。

在一种可能实现方式中，所述装置还包括：

编辑模块，用于基于所述目标学生的属性特征，对所述目标课程视频中的各个目标知识点视频的原始播放速度进行编辑，得到所述目标课程视频中的各个目标知识点视频的目标播放速度；

播放模块，用于响应于所述目标学生对所述目标课程视频的学习指令，基于所述各个目标知识点视频的目标播放速度播放所述目标课程视频中的各个目标知识点视频。

在一种可能实现方式中，所述装置还包括：

更新模块，用于获取所述目标学生对所述目标课程视频的反馈信息，所述反馈信息用于指示所述目标课程视频的确定效果；基于所述反馈信息，更新所述目标学生待学习的课程视频。

另一方面，提供了一种计算机设备，所述计算机设备包括处理器和存储器，所述存储器中存储有至少一条计算机程序，所述至少一条计算机程序由所述处理器加载并执行，以使所述计算机设备实现上述任一所述的确定课程视频的方法。

另一方面，还提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有至少一条计算机程序，所述至少一条计算机程序由处理器加载并执行，以使计算机实现上述任一所述的确定课程视频的方法。

另一方面，还提供了一种计算机程序产品，所述计算机程序产品包括计算机程序或计算机指令，所述计算机程序或所述计算机指令由处理器加载并执行，以使计算机实现上述任一所述的确定课程视频的方法。

本申请实施例提供的技术方案至少带来如下有益效果：

本申请实施例提供的技术方案，根据目标学生的知识点学习需求和属性特征确定了目标学生待学习的目标课程视频，该目标课程视频中的每部分视频均是候选知识点视频中与目标学生匹配的目标知识点视频，基于此种方式确定的目标课程视频中的每部分视频均与学生有较高的匹配程度，将该目标课程视频作为学生待学习的课程视频，有利于提高学生的学习兴趣以及学习效果，进而提高学生与教育平台的交互率。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的一种确定课程视频的方法的实施环境的示意图；

图2是本申请实施例提供的一种确定课程视频的方法的流程图；

图3是本申请实施例提供的一种获取候选知识点视频的过程的示意图；

图4是本申请实施例提供的一种知识图谱的可视化结果的示意图；

图5是本申请实施例提供的一种根据双塔模型获取第一知识点视频的衡量指标的过程的示意图；

图6是本申请实施例提供的一种基于DeepFM模型获取匹配度的过程的示意图；

图7是本申请实施例提供的一种确定目标课程视频的过程的示意图；

图8是本申请实施例提供的一种确定目标课程视频的框架的示意图；

图9是本申请实施例提供的一种确定课程视频的装置的示意图；

图10是本申请实施例提供的一种服务器的结构示意图；

图11是本申请实施例提供的一种终端的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请实施方式作进一步地详细描述。

示例性地，本申请实施例提供的确定课程视频的方法可以应用于云教育场景。云教育(Cloud Computing Education，简称CCEDU)，是指基于云计算商业模式应用的教育平台服务。在云平台上，所有的教育机构，培训机构，招生服务机构，宣传机构，行业协会，管理机构，行业媒体，法律结构等都集中云整合成资源池，各个资源相互展示和互动，按需交流，达成意向，从而降低教育成本，提高效率。

本申请实施例提供了一种确定课程视频的方法，请参考图1，其示出了本申请实施例提供的确定课程视频的方法的实施环境的示意图。该实施环境可以包括：计算机设备11。

其中，计算机设备11可以为教育平台对应的计算机设备，该计算机设备11能够存储老师录制的初始课程视频，在需要为目标学生确定待学习的目标课程视频时，可在老师录制的初始课程视频的基础上，应用本申请实施例提供的方法进行确定。示例性地，目标学生可以登录教育平台，在教育平台的展示页面查看老师录制的初始视频以及计算机设备11确定出的待学习的目标课程视频，并且挑选感兴趣的课程视频进行学习。

可选地，计算机设备11可以为终端，也可以为服务器，本申请实施例对此不加以限定。终端可以是任何一种可与用户通过键盘、触摸板、触摸屏、遥控器、语音交互或手写设备等一种或多种方式进行人机交互的电子产品，例如PC(Personal Computer，个人计算机，如，笔记本电脑、台式计算机等)、手机、智能手机、PDA(Personal Digital Assistant，个人数字助手)、可穿戴设备、PPC(Pocket PC，掌上电脑)、平板电脑、智能车机、智能电视、智能音箱、智能手表、车载终端等，但并不局限于此。服务器可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云计算服务的云服务器。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接，本申请在此不做限制。

本领域技术人员应能理解上述计算机设备11仅为举例，其他现有的或今后可能出现的计算机设备如可适用于本申请，也应包含在本申请保护范围以内，并在此以引用方式包含于此。

本申请实施例提供一种确定课程视频的方法，该方法可应用于上述图1所示的实施环境。以该方法应用于计算机设备11为例。如图2所示，本申请实施例提供的确定课程视频的方法可以包括如下步骤201至步骤205。

在步骤201中，获取老师录制的初始课程视频，对初始课程视频按照知识点粒度进行切分，得到候选知识点视频。

初始课程视频是指老师录制供学生学习的原始视频，初始课程视频可以由老师通过其他平台录制并上传至教育平台，也可以由老师直接在教育平台上进行录制得到，教育平台对应的计算机设备能够获取老师录制的初始课程视频。示例性地，初始课程视频的数量可能为一个，也可能为多个，每个初始课程视频均是一个由多个细粒度的知识点视频构成的一节较长的课程视频。老师录制的初始课程视频的内容(如，涉及的知识点、每个知识点的讲解方式以及讲解时长等)可以由老师自行设置，本申请实施例对此不加以限定。

示例性地，该步骤201中获取的老师录制的初始课程视频的数量为多个，既可以包括同一个老师录制的多个初始课程视频，也可以包括多个老师分别录制的初始课程视频，从而为后续的课程视频过程提供丰富的课程视频资源，进而保证确定出的课程视频的可靠性。

示例性地，该步骤201中获取的老师录制的初始课程视频可以是指教育平台中存在的全部老师录制的初始课程视频，也可以是指教育平台中存在的录制时间在参考时间段内的老师录制的初始课程视频，本申请实施例对此不加以限定。参考时间段根据经验设置，或者根据应用场景灵活调整，例如，参考时间段可以是指从距离当前时间戳1个月的历史时间戳到当前时间戳之间的时间段，也可以是指从距离当前时间戳7天的历史时间戳到当前时间戳之间的时间段。

在线教育平台上，大量教育机构中的老师能够通过平台录播或直播形式，为能接触到互联网的广大学生提供上课服务，课程视频的多样性远远小于学生的需求多样性，教育平台的核心功能是将学生学习需求和老师提供的课程视频进行匹配，需求精细化匹配程度越高，用户体验越好。例如，教育平台上提供[java入门]技术系列课程，下配多节子课级别的课程视频(如，环境配置的课程视频、基础字符的课程视频、运算符的课程视频、类的课程视频等)，子课级别的课程视频是由多个细粒度的知识点视频构成的一节较长的课程视频，多为小时级别，且教育平台可能存在多个老师或机构教授[java入门]系列课程。其中，java是指一种计算机语言。上述子课级别的课程视频即为本申请实施例中涉及的初始课程视频，如何在初始课程视频的基础上，为学生确定出合适的待学习的课程视频，是提高学生的学习兴趣以及用户体验的关键。

本申请实施例中，由于初始课程视频是一个由多个细粒度的知识点视频构成的一节较长的课程视频，所以在获取初始课程视频后，对初始课程视频按照知识点粒度进行切分，在切分后得到候选知识点视频。候选知识点视频是确定课程视频所直接依据的素材，相比于初始课程视频，候选知识点视频的粒度更细，将候选知识点视频作为确定课程视频依据的素材，能够确定出与学生的知识点学习需求匹配的课程视频，提高确定出的课程视频的可靠性，进而提高学生对课程视频的学习兴趣以及学习效果。

需要说明的是，初始课程视频的数量可能为一个或多个，本申请实施例以一个初始课程视频为例，介绍对初始课程视频按照知识点粒度进行切分的实现过程，对于初始课程视频的数量为多个的情况，针对每个初始课程视频，均根据相同的原理实现按照知识点粒度进行切分的过程。

在一种可能实现方式中，对初始课程视频按照知识点粒度进行切分，得到候选知识点视频的过程包括以下步骤2011至步骤2014。

步骤2011：获取初始课程视频对应的语音数据，将语音数据转换为文本。

初始课程视频对应的语音数据是指老师在录制初始课程视频的过程中对初始课程视频的内容进行讲解的语音，在获取初始课程视频后，能够分离出初始课程视频中的语音数据。在获取初始课程视频对应的语音数据后，将语音数据转换为文本，以通过文本方便地提取初始课程视频中涉及的知识点。

本申请实施例对将语音数据转换为文本的实现方式不加以限定，示例性地，通过语音识别模型将语音数据转换为文本。本申请实施例对语音识别模型的类型不加以限定，只要能够将输入的语音数据转换为文本并输出即可。示例性地，语音识别模型可以为各技术平台提供的开箱即用的模型。例如，语音识别模型可以是指seq2seq(Sequence toSequence，序列到序列)模型。示例性地，语音识别模型可以通过样本语音数据和样本语音数据对应的文本标签，通过端到端的方式训练得到，其中，端到端的方式是一种有监督训练方式。

步骤2012：抽取文本中的知识点。

知识点是知识中的最小单位，通过抽取文本中的知识点，能够确定初始课程视频涉及的知识点，以便于对初始课程视频按照知识点粒度进行划分。在示例性实施例中，抽取文本中的知识点的实现方式包括：采用NER(Named Entity Recognition，命名实体识别)模型抽取文本中的知识点。NER模型旨在识别文本中感兴趣的实体，本申请实施例中将知识点作为感兴趣的实体，从而利用NER模型抽取文本中的知识点。

本申请实施例对NER模型的类型不加以限定，只要能够从输入的文本中抽取出知识点并输出即可。示例性地，NER模型可以是指BERT_CRF(Bidirectional EncoderRepresentations from Transformer_Conditional Random Fields，基于转换器的双向编码器表示_条件随机场)模型，也可以是指Lattice LSTM(有网格结构的LSTM(Long Short-Term Memory，长短期记忆))模型。

示例性地，NER模型可以基于样本文本和样本文本对应的知识点标签，利用端到端的有监督训练方法训练得到，其中，样本文本和样本文本对应的知识点标签为NER模型的训练数据，训练数据可以通过总结的知识点词典匹配语料，并通过人工检查校对得到。训练数据的数量可以根据实际的应用场景灵活设定，训练数据也可以称为监督数据。

示例性地，在抽取出文本中知识点后，可以将抽取的知识点时序化整理作为初始课程视频的一方面特征。示例性地，将抽取的知识点时序化整理可以是指将抽取的知识点按照知识点在文本中所处的位置的先后顺序排列。

步骤2013：基于初始课程视频的视频帧和视频帧对应的文本，确定视频帧的分类结果，视频帧的分类结果用于指示视频帧在抽取的知识点中对应的知识点。

初始课程视频由多个依次排列的视频帧组成，对初始课程视频进行视频帧划分所依据的频率可以根据经验设置，例如，该频率为1秒24帧。需要说明的是，由于初始课程视频是由多个依次排列的视频帧组成的，所以每个视频帧均对应有时序信息，根据不同视频帧对应的时序信息能够得知不同视频帧在时序上的先后顺序。例如，任一视频帧对应的时序信息可以是指该任一视频帧对应的播放时间；再例如，任一视频帧对应的时序信息可以是指该任一视频帧的序号，该序号是指从第一个视频帧开始顺序编号得到的序号。

示例性地，任一视频帧对应的文本可以包括老师在讲解该任一视频帧的语音所对应的文本，可以从步骤2011中转换得到的文本中提取得到。示例性地，任一视频帧对应的文本可以包括该任一视频帧的图像内容中涵盖的文本，可以通过对该任一视频帧进行文本识别(如，OCR(Optical Character Recognition，光学字符识别))得到。

每个视频帧是指图像模态的信息，每个视频帧对应的文本是指文本模态的信息，通过综合考虑视频帧和视频帧对应的文本来确定视频帧的分类结果，能够实现通过考虑多模态的信息来获取分类结果，有利于提高分类结果的可靠性。

初始课程视频中的视频帧的数量为多个，基于初始课程视频的视频帧和视频帧对应的文本，确定视频帧的分类结果是指根据每个视频帧和每个视频帧对应的文本，分别确定每个视频帧的分类结果。确定每个视频帧的分类结果的原理相同，以确定任一视频帧的分类结果的实现方式为例进行说明。

在示例性实施例中，基于任一视频帧和任一视频帧对应的文本，确定该任一视频帧的分类结果的实现方式包括：提取任一视频帧的视频特征；提取任一视频帧对应的文本的文本特征；基于视频特征和文本特征，确定该任一视频帧的分类结果。示例性地，调用视频特征提取模型提取任一视频帧的视频特征，该视频特征模型是指用于提取视频帧的特征的模型，例如，该视频特征模型还可以称为Vision Transformer(视觉转换)模型。示例性地，调用文本特征提取模型提取任一视频帧对应的文本的文本特征，文本特征提取模型是指用于提取文本的特征的的模型，例如，文本特征提取模型可以一种语言模型，如，BERT模型。

示例性地，基于视频特征和文本特征，确定该任一视频帧的分类结果的过程包括：对视频特征和文本特征进行融合，得到融合特征；对融合特征进行分类，得到该任一视频帧的分类结果。示例性地，该过程可以通过调用特征处理模型实现。例如，特征处理模型可以是指MLP(Multilayer Perceptron，多层感知机)。

示例性地，视频特征提取模型、文本特征提取模型和特征处理模型可以共同构成一个分类模型，该分类模型可以认为是一种图文多模态模型。分类模型可以根据训练数据进行监督得到，训练数据包括样本视频帧、样本视频帧对应的文本以及样本视频帧对应的类别标签，其中，样本视频帧对应的类别标签通过人工标注得到。

任一视频帧的分类结果用于指示任一视频帧在抽取的知识点中对应的知识点。本申请实施例对任一视频帧的分类结果的表示形式不加以限定，例如，任一视频帧的分类结果包括各个候选知识点类别分别对应的概率，候选知识点类别是预先设置的知识点类别，不同的知识点类别用于标识不同的知识点，候选知识点类别包括用于标识步骤2012中从文本中抽取的知识点的类别。根据各个候选知识点类别分别对应的概率，能够得知从文本中抽取的知识点对应的类别对应的概率，然后可以将从文本中抽取的知识点对应的类别对应的概率中的满足概率条件的概率对应的知识点作为该任一视频帧在抽取的知识点中对应的知识点。示例性地，满足概率条件的概率可以是指最大的概率，也可以是指不小于概率阈值的概率等，本申请实施例对此不加以限定。任一视频帧对应的知识点可能为一个，也可能为多个，这与任一视频帧的分类结果以及概率条件的设置有关。

示例性地，以上所述以将任一视频帧和任一视频帧对应的文本均作为分类模型的输入信息为例，介绍了获取任一视频帧的分类结果的过程。本申请实施例并不局限于此。在一些实施例中，还可以仅将任一视频帧作为分类模型的输入信息获取任一视频帧的分类结果，此种情况下，分类模型中可以仅包括视频特征提取模型和特征处理模型。在一些实施例中，还可以仅将任一视频帧对应的文本作为分类模型的输入信息获取任一视频帧的分类结果，此种情况下，分类模型中可以仅包括文本特征提取模型和特征处理模型。在一些实施例中，还可以任一将视频帧、任一视频帧对应的文本以及任一视频帧对应的其他模态的信息(如，语音模态的信息等)作为分类模型的输入信息获取任一视频帧的分类结果，此种情况下，分类模型中除包括视频特征提取模型、文本特征提取模型和特征处理模型，还可以包括用于提取其他模型的信息的特征的特征提取模型。

步骤2014：基于初始课程视频中的各个视频帧的分类结果，对初始课程视频按照知识点粒度进行切分，得到切分视频；基于切分视频，获取候选知识点视频。

根据任一视频帧的分类结果，能够得知任一视频帧在抽取的知识点中对应的知识点，然后可以根据各个视频帧对应的知识点，从初始课程视频中的第一个视频帧开始依次遍历，在遍历过程中，将对应的知识点相同的连续的视频帧作为一个切分视频，在遍历完全部的视频帧后得到的各个切分视频即为对初始课程视频按照知识点粒度进行切分得到的切分视频。需要说明的是，不同的切分视频可能由不同数量的视频帧构成，这与视频帧的实际分类结果有关，本申请实施例对此不加以限定。需要说明的是，任一视频帧对应的知识点的数量可能为一个或多个，对应的知识点相同可以是指对应的任一知识点相同，也可以是指对应的全部知识点相同，本申请实施例对此不加以限定。

示例性地，在获取切分视频后，可以根据每个切分视频中的视频帧对应的知识点为每个切分视频赋予知识点标签，以利用知识点标签直观描述该切分视频涉及的知识点。示例性地，任一切分视频涉及的知识点可能为一个，也可能为多个。本申请实施例对知识点标签的形式不加以限定，只要能够对知识点进行描述即可，例如，知识点标签可以包括知识点的名称、知识点在教学大纲中的标号等。

示例性地，以将任一视频帧和任一视频帧对应的文本均作为分类模型的输入信息获取任一视频帧的分类结果为例，在此种分类结果的基础上对初始课程视频进行切分可以是指基于多模态信息对初始课程视频进行切分，切分可靠性较高。

在一种可能实现方式中，基于切分视频获取候选知识点视频可以是指将切分视频作为候选知识点视频，此种方式获取候选知识点视频的效率较高。

在另一种可能实现方式中，基于切分视频，获取候选知识点视频的实现过程包括：从切分视频中选取满足可靠条件的视频作为候选知识点视频。此种方式可以保证获取的候选知识点视频的可靠性。

示例性地，可以将包括的视频帧的数量不少于第一阈值的切分视频作为满足可靠条件的视频，第一阈值根据经验设置，例如，第一阈值为2，或者第一阈值为3。

示例性地，从切分视频中选取满足可靠条件的视频的过程包括：基于切分视频的视频特征，获取切分视频的评估结果；将切分视频中的评估结果不满足第二评估条件的视频剔除，得到候选知识点视频。切分视频的视频特征用于对切分视频的特征进行描述。在示例性实施例中，切分视频的视频特征包括切分视频对应的初始课程视频的录制老师的特征、切分视频对应的初始课程视频的录制老师所属机构的特征、切分视频的内容的特征中的至少一项。

切分视频对应的初始课程视频的录制老师的特征可以通过对切分视频对应的初始课程视频的录制老师的历史录制课程视频、学生评价、老师介绍信息等提取得到，示例性地，切分视频对应的初始课程视频的录制老师的特征包括但不限于切分视频对应的初始课程视频的录制老师的性别、年龄、语速、普通话质量、亲和力、好评率、对知识点掌握情况、讲课风格、音色等。示例性地，性别、年龄、语速属于基础特征，普通话质量、亲和力、好评率、对知识点掌握情况属于业务规则特征，讲课风格、音色属于深度学习向量表征特征。

切分视频对应的初始课程视频的录制老师所属机构的特征可以通过对切分视频对应的初始课程视频的录制老师所属机构的评价信息、宣传信息等提取得到，示例性地，切分视频对应的初始课程视频的录制老师所属机构的特征包括机构等级(如，机构是否属于金牌机构，金牌机构是一种机构等级)、机构中的老师数量、机构的好评率等。

切分视频对应的初始课程视频的录制老师的特征和切分视频对应的初始课程视频的录制老师所属机构的特征可以利用平台创作者(机构、个人)特征(creator profile)维护模块进行维护。该模块可以将老师的特征和机构的特征与初始课程视频进行绑定，由于学生学习偏好会对此方面的特征进行考虑，所以在为学生确定个性化的课程视频的过程中需要考虑此类特征。

上述切分视频对应的初始课程视频的录制老师的特征和切分视频对应的初始课程视频的录制老师所属机构的特征可视为间接对切分视频进行描述的特征，切分视频的内容的特征可视为直接对切分视频进行描述的特征，能够直观地辅助个性化定制课程视频的算法。

切分视频的内容的特征的类型可以根据需求灵活设定，例如，根据用户的需求分析，指定一些业务规则，根据业务规则提取切分视频的内容的特征。示例性地，切分视频的内容的特征可以包括切分视频的内容涉及的知识点的难度、老师对切分视频的内容的讲解语速、切分视频的内容的讲解详细程度、切分视频包括的视频帧的数量等。示例性地，有些特征可以直接得到，如，切分视频包括的视频帧的数量；有些特征可以通过规则进行处理，如，老师对切分视频的内容的讲解语速、切分视频的内容的讲解详细程度；有些特征可以通过模型处理得到，如，切分视频的内容涉及的知识点的难度，可以用视频处理模型(如，LSTM模型或者BERT模型)对切分视频的内容涉及的知识点的难度进行分类，进而根据分类结果确定切分视频的内容涉及的知识点的难度。视频处理模型根据训练数据利用监督训练得到，训练数据包括样本视频和样本视频的内容涉及的知识点的难度标签，其中，样本视频的内容涉及的知识点的难度标签需人工结合规则进行总结得到。

以切分视频的视频特征包括切分视频对应的初始课程视频的录制老师的特征、切分视频对应的初始课程视频的录制老师所属机构的特征和切分视频的内容的特征为例，通过综合考虑多方面的特征，能够得到切分视频的多维度丰富特征，以对切分视频有更全面的描述。在一些实施例中，由于切分视频是从初始课程视频中切分得到的，切分视频的时长比初始课程视频的时长要短，所以，初始课程视频还可以称为长视频，切分视频还可以称为短视频。

在一种可能实现方式中，基于切分视频的视频特征，获取切分视频的评估结果的方式包括：调用短视频评估模型对切分视频的视频特征进行质量评估，得到切分视频的评估结果。切分视频的评估结果用于指示切分视频的可靠性，本申请实施例对切分视频的评估结果的表示形式不加以限定，例如，切分视频的评估结果的表示形式可以是分数，分数与可靠性呈正相关关系；再例如，切分视频的评估结果的表示形式还可以是指质量层级，质量层级可以包括优、良、差等。

示例性地，调用短视频评估模型对切分视频的视频特征进行质量评估可以是指仅将切分视频的视频特征输入短视频评估模型进行质量评估，也可以是指将切分视频的视频特征和辅助特征一同输入短视频评估模型进行质量评估。示例性地，辅助特征可以是人工总结的特征，例如，辅助特征可以是切分视频已经收集的反馈信息中的学生观看时长；示例性地，辅助特征还可以是切分视频中的各个视频帧的嵌入特征(如，利用视频特征提取模型提取的特征)等。

短视频评估模型的模型结构可以根据经验或者应用需求灵活设定，短视频评估模型可以根据训练数据通过监督训练进行训练得到，训练数据可以通过学生学习环节反馈积累的数据构建得到。示例性地，短视频评估模型可以是一种XGB(Extreme GradientBoosting，极端梯度增强)模型，或者DeepFM(Deep Factorization Machine，深度因子分解机)模型等。

在获取切分视频的评估结果后，将切分视频中的评估结果不满足第二评估条件的视频剔除，将保留的切分视频作为候选知识点视频。评估结果不满足第二评估条件根据经验设置，或者根据评估结果的表示形式灵活调整，本申请实施例对此不加以限定。示例性地，以切分视频的评估结果的表示形式是与可靠性呈正相关关系的分数为例，评估结果不满足第二评估条件可以是指评估结果小于分数阈值，分数阈值根据经验设置。示例性地，以切分视频的评估结果的表示形式是指质量层级，质量层级包括优、良、差为例，评估结果不满足第二评估条件可以是指评估结果为差。

由于候选知识点视频是从切分视频中选取的，切分视频具有知识点标签，所以候选知识点视频也具有知识点标签，根据候选知识点视频的知识点标签，能够得知候选知识点视频对应的知识点。需要说明的是，一个候选视频可能对应一个或多个知识点。在示例性实施例中，由于不同创作者存在局部同类竞品课程，所以知识点和候选知识点视频可能是一对多的关系，在获取候选知识点视频后，可以按照知识点将候选知识点视频进行分类存储，也即，将对应某一知识点的候选知识点视频与该知识点对应存储。

示例性地，获取候选知识点视频的过程可以如图3所示。获取老师录制的初始课程视频。例如，老师1录制的初始课程视频为系列课A的课程视频，包括第一节A1入门课程视频、第二节A2进阶课程视频等；老师2录制的初始课程视频为系列课A的课程视频，包括第一节A1入门课程视频、第二节A2进阶课程视频等；老师3录制的初始课程视频为系列课B的课程视频，包括第一节B1入门课程视频、第二节B2进阶课程视频等；老师4录制的初始课程视频为系列课C的课程视频，包括第一节C1入门课程视频、第二节C2进阶课程视频等。通过长视频处理，对初始课程视频进行知识点粒度的切分，得到候选知识点视频，在切分过程中，涉及语音转换文本、NER抽取知识点、多模态按照知识点切分为切分视频、切分视频特征抽取、老师特征与切分视频特征融合、切分视频质量评估以及其他处理逻辑等。切分过程可视为利用AI(Artificial Intelligence，人工智能)深度学习模型，对系列课程下的子课进行知识点粒度级别的预处理的过程。在获取候选知识点视频后，将候选知识点视频入库，为后续的课程视频的确定过程提供素材。例如，数据库中包括系列课程A的短视频库(包括a11、a12等候选知识点视频)、系列课程B的短视频库(包括b11、b12等候选知识点视频)、系列课程C的短视频库(包括c11、c12等候选知识点视频)和其他技能或学习需求知识库等。

在步骤202中，获取目标学生的知识点学习需求和属性特征，知识点学习需求用于指示目标学生期望学习的知识点，属性特征用于标识目标学生。

目标学生是指需要在教育平台学习知识的任一学生，例如，目标学生可以是指在教育平台注册登录过的学生，目标学生可能已经在教育平台学习过课程视频，也可能未在教育平台学习过课程视频，本申请实施例对此不加以限定。

目标学生的知识点学习需求用于指示目标学生期望学习的知识点，目标学生的知识点学习需求可以由目标学生自行填写得到，也可以通过对目标学生已经学习过的课程视频进行分析得到，还可以通过对目标学生填写的其他信息(如，知识点掌握情况、年级等)进行分析得到。当然，目标学生的知识点学习需求还可能通过其他方式得到，本申请实施例对此不加以限定。需要说明的是，不同的学生的知识点学习需求可能相同，也可能不同。

目标学生的属性特征用于标识目标学生，是目标学生的个性化信息。目标学生的属性特征的类型可以根据经验设置，或者根据实际的应用场景灵活调整。在示例性实施例中，目标学生的属性特征可以包括目标学生的基础信息低频特征和高频动态特征。基础信息低频特征为随着时间的变化有较小变化的特征，例如，基础信息低频特征可以包括目标学生的年龄、性别、兴趣、标签偏好等。高频动态特征是指随着时间的变化有较大变化的特征，例如，高频动态特征可以包括目标学生的历史检索请求(query)、报名课程、浏览记录、学生知识点掌握情况、测评结果等。目标学生的属性特征可以通过目标学生自行填写得到，也可以通过对目标学生在教育平台的行为进行分析得到，本申请实施例对此不加以限定。通过考虑目标学生的属性特征，可以使得确定课程视频的算法针对相同的知识点学习需求能给出不同的个性化课程视频结果。

在示例性实施例中，目标学生的知识点学习需求和属性特征都是在目标学生充分授权的情况下获取的。示例性地，在获取目标学生的知识点学习需求和属性特征之前，会显示提示弹窗，该提示弹窗供目标学生选择是否允许获取知识点学习需求和属性特征，在目标学生选择了允许选项时，得到目标学生对获取知识点学习需求和属性特征的授权，进而才可以获取目标学生的知识点学习需求和属性特征。

在步骤203中，基于目标学生的知识点学习需求，确定与目标学生匹配的至少一个目标知识点；基于至少一个目标知识点和目标学生的属性信息，从候选知识点视频中确定与目标学生匹配的目标知识点视频集，目标知识点视频集包括各个目标知识点分别对应的至少一个目标知识点视频。

与目标学生匹配的至少一个目标知识点是指适合目标学生学习的知识点。在示例性实施例中，基于目标学生的知识点学习需求，确定与目标学生匹配的至少一个目标知识点的实现方式为：将目标学生的知识点学习需求指示的目标学生期望学习的知识点作为目标知识点。

在示例性实施例中，基于目标学生的知识点学习需求，确定与目标学生匹配的至少一个目标知识点的实现方式为：获取教育知识图谱，教育知识图谱包括知识点对应的节点以及知识点对应的节点之间的边；基于目标学生的知识点学习需求和教育知识图谱，确定与目标学生匹配的至少一个目标知识点。此种实现方式下，与目标学生匹配的至少一个目标知识点包括目标学生的知识点学习需求指示的目标学生期望学习的知识点以及根据教育知识图谱确定的与目标学生期望学习的知识点存在目标关联关系的知识点。示例性地，目标学生期望学习的知识点存在目标关联关系的知识点可以是指学习目标学生期望学习的知识点需要储备的知识点。

教育知识图谱是指适用于教育场景的知识图谱，教育知识图谱包括知识点对应的节点以及知识点对应的节点之间的边，知识点对应的节点之间的边用于指示知识点之间的关联关系。在示例性实施例中，基于目标学生的知识点学习需求和教育知识图谱，确定与目标学生匹配的至少一个目标知识点的过程包括：基于目标学生的知识点学习需求，确定目标学生期望学习的知识点；在教育知识图谱中确定目标学生期望学习的知识点对应的节点；确定与目标学生期望学习的知识点对应的节点存在边且边指示的关联关系为目标关联关系的节点对应的知识点作为目标学生期望学习的知识点的关联知识点，将目标学生期望学习的知识点和目标学生期望学习的知识点的关联知识点作为与目标学生匹配的至少一个目标知识点。示例性地，目标关联关系可以根据经验设置，例如，目标关联关系可以是指归属关系。

在一种可能实现方式中，获取教育知识图谱的过程包括以下步骤(1)至步骤(3)。

步骤(1)：获取初始知识图谱；剔除初始知识图谱中与教育场景的关联性不满足关联要求的节点和边，得到第一知识图谱。

初始知识图谱可以是任一知识图谱，例如，可以是开源的通用知识图谱，在初始知识图谱的基础上，根据教育平台涉及的教育场景真实需求进行改动，升级为教育知识图谱。示例性地，教育知识图谱还可以称为教育行业知识图谱。

示例性地，目前存在多种前沿开源商业化通用知识图谱，例如，OpenKG，OpenKG是中国中文信息学会语言与知识计算专业委员会于2015年发起和倡导的开放知识图谱社区联盟项目。此外，一直致力于知识图谱研究的OwnThink平台(一种开放平台)开源了1.4亿中文知识图谱。可以将任一来源的知识图谱，或者多个开源的知识图谱的合并知识图谱作为初始知识图谱。知识图谱的数据结构的主要形式是点(Node)与边(Edge)构成有向和无向关系，其中点与边存在多种类型，且点与边各自可定义自己的属性，例如，一个知识图谱的可视化结果可以如图4所示，在图4中，存在多个节点以及多个节点之间的边，边上的文字表示节点之间的关联关系。

示例性地，知识图谱可以利用存储工具进行存储，示例性地，常用的知识图谱数据开源存储工具有Neo4j(一种知识图谱存储工具)和nubula(一种知识图谱存储工具)。可以根据自身条件选用适合的初始知识图谱数据以及存储技术，然后按照如下步骤对初始知识图谱进行编辑，获得教育知识图谱。

在获取初始知识图谱后，剔除初始知识图谱中与教育场景的关联性不满足关联要求的节点和边，得到第一知识图谱。与教育场景的关联性不满足关联条件是指与教育场景的关联性较弱，与教育场景的关联性不满足关联条件可以根据经验设置，或者根据实际情况灵活调整，本申请实施例对此不加以限定。需要说明的是，此处的教育场景可以是指通用的教育场景，也可以是指与某领域相关的教育场景等，本申请实施例对此不加以限定。

对与教育场景的关联性较弱的节点和边进行剔除处理，能够降低知识图谱的大小，减少性能瓶颈和硬件资源，同时能降低后面算法过程使用的噪声。示例性地，剔除与教育场景的关联性性较弱的节点和边的过程可以有人工经验参与。例如，假设教育场景是教授IT(Information Technology，信息技术)的场景，则可以剔除与IT的关联性较弱删除节点和这些节点连接的边。

步骤(2)：基于教育场景对应的书籍、教育场景对应的多媒体资源中的至少一项，在第一知识图谱中增加与教育场景的关联性满足关联要求且第一知识图谱中缺少的节点和边，得到第二知识图谱。

第一知识图谱中可能缺少部分与教育场景的关联性满足关联要求的节点和边，因此，在获取第一知识图谱后，需要在第一知识图谱中增加与教育场景的关联性满足关联要求且第一知识图谱中缺少的节点和边，得到第二知识图谱。在第一知识图谱中增加与教育场景的关联性满足关联要求且第一知识图谱中缺少的节点和边的过程中可以考虑教育场景对应的书籍、教育场景对应的多媒体资源中的至少一项。其中，教育场景对应的多媒体资源可以包括但不限于教育场景对应的视频、新闻、PPT(PowerPoint，演示文稿)、教学大纲等等。

示例性地，以基于教育场景对应的书籍在第一知识图谱中增加与教育场景的关联性满足关联要求且第一知识图谱中缺少的节点和边为例，可以通过教育场景对的书籍目录，以及目录对应的正文内容，通过信息抽取技术提取正文涉及的知识点。例如，在需要总结全面java相关学习技能的知识图谱时，也即教育场景为教授java的场景时，教育场景对应的书籍可以是指《java编程思想第4版》，获取书籍的目录，将目录对应的知识点设定为父节点，通过NER模型抽取每个章节涉及的知识点，作为父节点下面的子节点，子节点和父节点之间的边的关系定义为归属关系。将第一知识图谱中缺少的父节点、子节点及其之间的边添加到第一知识图谱中。

示例性地，以基于教育场景对应的多媒体资源，在第一知识图谱中增加与教育场景的关联性满足关联要求且第一知识图谱中缺少的节点和边，且教育场景对应的多媒体资源为教育场景对应的课程视频为例。老师在上传教育场景对应的课程视频时，需要课程纲要和介绍，并且可以将课程视频中的语音转换成文本，从老师上传的课程纲要和介绍中提取知识点作为父节点，通过NER模型在课程视频中的语音转换成的文本中抽取知识点，将抽取的知识点作为子节点，子节点和父节点之间的边的关系定义为归属关系。将第一知识图谱中缺少的父节点、子节点及其之间的边添加到第一知识图谱中。

当然，在一些实施例中，还可以基于教育场景对应的书籍和教育场景对应的多媒体资源，在第一知识图谱中增加与教育场景的关联性满足关联要求且第一知识图谱中缺少的节点和边。

步骤(3)：对第二知识图谱进行修正，得到教育知识图谱。

步骤(1)和步骤(2)中的剔除和增加操作可能存在一些准确性较低的操作，因此，在获取第二知识图谱后，对第二知识图谱进行修正，将修正后得到的知识图谱作为教育知识图谱。

通过增删办法获取到教育知识图谱，需要对节点和边的准确性进行确认；另外，由于基于教育场景对应的书籍以及教育场景对应的多媒体资源抽取可能存在较大局限性，所以需要对缺失的节点和边进行补充。以上对节点和边的准确性进行确认以及对缺失的节点和边进行补充的操作均属于对第二知识图谱进行修正的范畴。

在示例性实施例中，对第二知识图谱进行修正可以是指计算机设备自行对第二知识图谱进行修正。计算机设备中存储有对知识图谱进行修正的规则，从而能够根据该规则对第二知识图谱进行修正。

在示例性实施例中，对第二知识图谱进行修正还可以是指将第二知识图谱反馈给审核方，由审核方对第二知识图谱进行修正，然后将修正后得到的教育知识图谱反馈给计算机设备，计算机设备获取教育知识图谱。示例性地，审核方可以包括但不限于教育平台的运维人员、教育平台教授课程的老师和机构以及在教育平台学习知识的学生等。

每个目标知识点对应的至少一个目标知识点视频均是指与目标学生匹配的知识点视频。不同目标知识点对应的目标知识点视频的数量可能相同，也可能不同。在示例性实施例中，基于至少一个目标知识点和目标学生的属性特征，从候选知识点视频中确定与目标学生匹配的目标知识点视频集的实现过程包括以下步骤A至步骤C。

步骤A：从候选知识点视频中确定任一目标知识点对应的至少一个第一知识点视频，从任一目标知识点对应的至少一个第一知识点视频中确定满足筛选条件的至少一个第二知识点视频。

任一目标知识点对应的第一知识点视频是指知识点标签指示该任一目标知识点的候选知识点视频。示例性地，由于教育平台的数据量一般很大，所以按照知识点确定出的知识点视频的数量还是很大，因此，需要先对任一目标知识点对应的至少一个知识点视频进行初步筛选，以确定出满足筛选条件的至少一个第二知识点视频。第二知识点视频的数量比第一知识点视频的数量要少，以便于提高后续确定目标知识点视频的效率。

示例性地，从任一目标知识点对应的至少一个第一知识点视频中确定满足筛选条件的至少一个第二知识点视频的过程可以称为召回过程。

从任一目标知识点对应的至少一个第一知识点视频中确定满足筛选条件的至少一个第二知识点视频的实现方式可以根据经验设置，本申请实施例对此不加以限定。示例性地，将任一目标知识点对应的至少一个第一知识点视频中评估结果满足第一条件的第一知识点视频作为满足筛选条件的第二知识点视频。第一知识点视频满足第一条件可以是指第一知识点视频的评分排在前参考数量位，也可以是指第一知识点视频的质量等级为优等。

示例性地，从任一目标知识点对应的至少一个第一知识点视频中确定满足筛选条件的至少一个第二知识点视频的实现方式还可以为：将目标学生的属性特征输入双塔模型的第一处理分支，获取第一处理分支提取的第一表征向量；将任一第一知识点视频的视频特征输入双塔模型的第二处理分支，获取第二处理分支提取的第二表征向量；将第一表征向量和第二表征向量之间的相似度作为任一第一知识点视频的衡量指标；将各个第一知识点数视频中的衡量指标满足第二条件的第一知识点视频作为满足筛选条件的第二知识点视频。

示例性地，衡量指标满足第二条件可以是指衡量指标满足第二条件不小于衡量指标阈值，也可以是指衡量指标为各个第一知识点视频的衡量指标中的前T(T为不小于1的整数)大的衡量指标。

示例性地，双塔模型可以是指DSSM模型(一种双塔模型)。示例性地，根据双塔模型获取第一知识点视频的衡量指标的过程可以如图5所示。双塔模型的两个处理分支均包括一个DNN(Deep Neural Networks，深度神经网络)模型，DNN模型能够将输入的特征对应的嵌入特征转换为表征向量。将目标学生的属性特征输入双塔模型的一个处理分支，该处理分支先获取目标学生的属性特征的嵌入特征，然后将嵌入特征输入DNN模型进行处理，得到第一表征向量；将第一知识点视频的视频特征输入双塔模型的另一个处理分支，该处理分支先获取第一知识点视频的视频特征的嵌入特征，然后将嵌入特征输入DNN模型进行处理，得到第二表征向量，计算第一表征向量和第二表征向量之间的相似度，将计算得到的相似度作为第一知识点视频的衡量指标。

步骤B：基于目标学生的属性特征和至少一个第二知识点视频的视频特征，确定至少一个第二知识点视频分别与目标学生的匹配度；将匹配度满足匹配条件的至少一个第二知识点视频作为任一目标知识点对应的至少一个目标知识点视频。

步骤A可以理解为粗筛选，经过步骤A后，针对任一目标知识点初步筛选出了第二知识点视频，在初步筛选过程中，因为第一知识点视频的数量太大，所以难以采用深度学习模型来进行筛选，从而导致筛选过程的个性化拟合深度不够，因此，在该步骤B中，对筛选出的第二知识点视频进行进一步筛选，以确定出任一目标知识点对应的与目标学生匹配的目标知识点视频。

示例性地，第二知识点视频中可能还存在同类型知识点竞品视频，但是数量级比第一知识点视频已经少了很多，因此，可以采样深度模型来进行进一步筛选。在示例性实施例中，基于目标学生的属性特征和至少一个第二知识点视频的视频特征，确定至少一个第二知识点视频分别与目标学生的匹配度的实现过程包括：将目标学生的属性特征和任一第二知识点视频的视频特征输入深度模型，获取深度模型输出的匹配度，将深度模型输出的匹配度作为任一第二知识点视频与目标学生的匹配度。任一第二知识点视频与目标学生的匹配度越大，说明任一第二知识点视频与目标学生越匹配，也说明目标学生学习任一知识点视频的兴趣越大。通过综合考虑了目标学生的属性特征和知识点视频的视频特征来确定匹配度，有利于保证匹配度的可靠性。

本申请实施例对采用的深度模型的类型不加以限定，例如，深度模型可以是指DeepFM模型。在将目标学生的属性特征和任一第二知识点视频的视频特征输入DeepFM模型后，DeepFM模型可以对目标学生的属性特征和任一第二知识点视频的视频特征进行处理，得到浅层次交叉特征和深度特征，浅层次交叉特征(例如，难易程度、学生基础等)可以放在DeepFM模型中的FM层，深度特征(如，文本特征)可以放在DeepFM模型中的深度(deep)层，通过FM层和深度层的处理，输入匹配度。示例性地，深度模型的最后一层采用sigmoid函数，可以将输出值控制在0～1之间，数值越高代表匹配度越大。此种个性化匹配相比相似度计算更加精细化。

示例性地，基于DeepFM模型获取匹配度的过程可以如图6所示。将目标学生的属性特征和第二知识点视频的视频特征作为DeepFM模型的输入信息，目标学生的属性特征和第二知识点视频的视频特征为稀疏的特征，包括多个领域(如，领域i、领域j、领域m等)相关的特征，多个领域相关的特征也可以称为多个不同方面相关的特征。在DeepFM模型中，先将稀疏的特征转换为稠密的嵌入特征；然后获取浅层次交叉特征放在FM层，获取深度特征放在深度层；将经过FM层和深度层处理得到的结果均输入输出单元，由输出单元输出第二知识点视频与目标学生的匹配度。

示例性地，深度模型可以基于训练数据利用监督训练进行训练得到，训练数据可以由人工进行设置，也可以通过学生的学习反馈进行总结等。训练数据包括样本学生的属性特征、样本视频的视频特征以及样本视频与样本学生的匹配度标签。

在获取各个第二知识点视频分别与目标学生的匹配度后，将匹配度满足匹配条件的至少一个第二知识点视频作为任一目标知识点对应的至少一个目标知识点视频。匹配度满足匹配条件根据经验设置，或者根据应用场景灵活调整，例如，匹配度满足匹配条件可以是指匹配度为各个第二知识点视频分别与目标学生的匹配度中的前K(K为不小于1的整数)大的匹配度。再例如，匹配度满足匹配条件可以是指匹配度不小于匹配度阈值，匹配度阈值根据经验设置。

步骤C：基于各个目标知识点分别对应的至少一个目标知识点视频，确定目标知识点视频集。

根据步骤A和步骤B的方式，能够获取各个目标知识点分别对应的至少一个目标知识点视频，然后将各个目标知识点分别对应的至少一个目标知识点视频的集合作为目标知识点视频集。

在步骤204中，对目标知识点视频集中的目标知识点视频进行拼接，得到至少一个候选课程视频，任一候选课程视频由各个目标知识点分别对应的一个目标知识点视频拼接得到。

至少一个候选课程视频为目标学生对应的备选视频。每个候选课程视频均是由与目标学生匹配的目标知识点视频拼接得到的，在至少一个候选课程视频的基础上选取目标课程视频，能够保证目标课程视频与目标学生的匹配程度，保证目标课程视频的可靠性。

在一种可能实现方式中，对目标知识点视频集中的目标知识点视频进行拼接，得到至少一个候选课程视频的实现方式包括：确定至少一个目标知识点的排列顺序，基于排列顺序对目标知识点视频集中的目标知识点视频进行拼接，得到至少一个候选课程视频，任一候选课程视频由各个目标知识点分别对应的一个目标知识点视频按照排列顺序拼接得到。

示例性地，可以根据至少一个目标知识点在教育知识图谱中对应的节点，确定至少一个目标知识点的排列顺序。示例性地，每个目标知识点对应至少一个目标知识点视频，将每个目标知识点对应的节点以及节点涉及的边等单独拆分出子图；每个目标知识点对应的至少一个目标知识点视频的视频特征和将会和子图绑定，通过GAT(Graph AttentionNetworks，图注意力网络)模型将视频特征以及知识点之间的相互关系融合，然后对每个节点排序位置进行预测，即多分类模型，根据位置可以确定出至少一个目标知识点的排列顺序。示例性地，排列顺序预测(Order Predict Task)的过程利用教育知识图谱、图算法(如，GraphSAGE(一种图神经网络算法)、GAT等)，结合时序模型(如，LSTM、Transformer等)实现。

在确定排列顺序后，基于排列顺序对目标知识点视频集中的目标知识点视频进行拼接，得到至少一个候选课程视频，本申请实施例对具体的拼接方式不加以限定，只要保证任一候选课程视频由各个目标知识点分别对应的一个目标知识点视频按照排列顺序拼接得到即可。若至少存在一个目标知识点对应多个目标知识点视频，则会有多重组合结果，也即会有多个候选课程视频。

在步骤205中，从至少一个候选课程视频中选取满足选取条件的目标课程视频，目标课程视频为目标学生待学习的课程视频。

本申请实施例中，以候选知识点视频为素材，通过综合考虑目标学生的知识点学习需求和属性特征来确定目标学生待学习的目标课程视频，此种目标课程视频为适合目标学生的个性化的课程视频，目标课程视频中的每部分视频均与目标学生匹配，从而有利于提高目标学生对目标课程视频的学习兴趣和学习效果，进而提高目标学生在教育平台的学习次数以及学习时长，提高目标学生与教育平台的交互率。

在示例性实施例中，从至少一个候选课程视频中选取满足选取条件的目标课程视频的实现方式可以为：将至少一个候选课程视频中的各个目标知识点视频与目标学生的匹配度的平均值作为至少一个候选课程视频的衡量指标，将衡量指标最大的候选课程视频作为满足选取条件的目标课程视频。

在示例性实施例中，从至少一个候选课程视频中选取满足选取条件的目标课程视频的实现方式可以为：对至少一个候选课程视频进行评估，得到至少一个候选课程视频的评估结果；将至少一个候选课程视频中的评估结果满足第一评估条件的候选课程视频作为满足选取条件的目标课程视频。对至少一个候选课程视频进行评估，能够根据评估结果对候选课程视频进行筛选，以保证筛选出的目标课程视频是评估结果较好的课程视频，保证目标课程视频的可靠性。

对每个候选课程视频进行评估的原理相同，以任一候选课程视频为例，介绍对任一候选课程视频进行评估，得到任一候选课程视频的评估结果的过程。在示例性实施例中，对任一候选课程视频进行评估，得到任一候选课程视频的评估结果的实现过程包括：获取任一候选课程视频的第一评估指标、第二评估指标和第三评估指标中的至少一项，基于第一评估指标、第二评估指标和第三评估指标中的至少一项，确定任一候选课程视频的评估结果。

其中，第一评估指标基于任一候选课程视频中的各个目标知识点视频对应的文本得到，第一评估指标用于评估任一候选课程视频的内容串讲的合理性；第二评估指标基于任一候选课程视频中的各个视频帧得到，第二评估指标用于评估任一候选课程视频的观看流畅度；第三评估指标基于任一候选课程视频中的各个目标知识点视频对应的文本和任一候选课程视频中的各个视频帧得到，第三评估指标用于评估任一候选课程视频的整体质量。

示例性地，将任一候选课程视频中的每个目标知识点视频对应的文本分别输入语言模型(如，BERT模型)进行编码，得到每个目标知识点视频对应的文本的编码特征，将每个目标知识点视频对应的文本的编码特征按照时序顺序输入特征处理模型(如，LSTM模型)进行处理，得到文本表征特征，将文本表征特征输入评估任务层(如，softmax(一种函数)层)进行评估，得到第一评估指标。

示例性地，将任一候选课程视频中的各个视频帧按照时序顺序输入视频处理模型(如，Vision Transformer)，得到视频表征特征，将视频表征特征输入评估任务层进行评估，得到第二评估指标。

示例性地，基于任一候选课程视频中的各个目标知识点视频对应的文本，获取文本表征特征；基于任一候选课程视频中的各个视频帧，获取视频表征特征；将文本表示特征和视频表征特征进行融合，得到目标表征特征，将目标表征特征输入任务层进行评估，得到第三评估指标。

示例性地，对候选课程视频进行评估所利用的模型可以利用训练数据监督训练得到。训练数据可以包括正样本数据和负样本数据，正样本数据可以是指可靠性高的课程视频相关的数据，负样本数据可以是指可靠低的课程视频相关的数据。示例性地，对候选课程视频进行评估所利用的模型还可以通过反馈积累数据进行微调(finetune)。

示例性地，若基于第一评估指标、第二评估指标和第三评估指标中的任一项，确定任一候选课程视频的评估结果，则可以直接将第一评估指标、第二评估指标和第三评估指标中的任一项作为任一候选课程视频的评估结果。若基于第一评估指标、第二评估指标和第三评估指标中的任两项或者基于第一评估指标、第二评估指标和第三评估指标的这三项，确定任一候选课程视频的评估结果，则可以将该任两项或该三项进行加权求和，得到任一候选课程视频的评估结果。该任两项或该三项的权值根据经验设置。

示例性地，以基于第一评估指标、第二评估指标和第三评估指标，确定任一候选课程视频的评估结果为例，可以将第一评估指标、第二评估指标和第三评估指标进行加权，得到任一候选课程视频的评估结果。第一评估指标、第二评估指标和第三评估指标的权值可以根据经验设置。此种方式下，任一候选课程视频的评估结果通过综合考虑第一评估指标、第二评估指标和第三评估指标，能够采用视频和文本多模态模型对候选课程视频进行评估，根据课程视频的内容串讲的合理性、观看流畅度以及整体质量来对候选课程视频进行综合评估，有利于进一步保证候选课程视频的评估结果的可靠性。

任一候选课程视频的评估结果用于指示将任一候选课程视频作为目标学生待学习的课程视频的可靠程度，本申请实施例对任一候选课程视频的评估结果的表示形式不加以限定。示例性地，任一候选课程视频的评估结果的表示形式可以为分数，分数越大，说明任一候选课程视频的可靠性越高；示例性地，任一候选课程视频的评估结果的表示形式还可以为质量等级，质量等级越高，说明任一候选课程视频的可靠性越高。

评估结果满足第一评估条件的候选课程视频是指至少一个候选课程视频中最合适目标学生学习的候选课程视频，评估结果满足第一评估条件可以根据经验设置，也可以根据应用场景灵活调整，本申请实施例对此不加以限定。示例性地，以候选课程视频的评估结果的表示形式是与可靠性呈正相关关系的分数为例，评估结果满足第一评估条件可以是指评估结果最大，也可以是指评估结果大于分数阈值，分数阈值根据经验设置。示例性地，以候选课程视频的评估结果的表示形式是指质量层级，质量层级包括优、良、差为例，评估结果满足第一评估条件可以是指评估结果为优。

在示例性实施例中，在确定出目标课程视频后，还包括：响应于目标学生对目标课程视频的学习指令，播放目标课程视频。

在示例性实施例中，播放目标课程视频可以是指基于目标课程视频中的各个目标知识点视频的目标播放速度播放目标课程视频中的各个目标知识点视频。

在示例性实施例中，在播放目标课程视频之前，还可以基于目标学生的属性特征，对目标课程视频中的各个目标知识点视频的原始播放速度进行编辑，得到目标课程视频中的各个目标知识点视频的目标播放速度。此种情况下，播放目标课程视频是指基于各个目标知识点视频的目标播放速度播放目标课程视频中的各个目标知识点视频。此种播放方式与目标学生的匹配度高，更加有利于提高目标学生对目标课程视频的学习兴趣以及学习效果。

示例性地，基于目标学生的属性特征，对目标课程视频中的各个目标知识点视频的原始播放速度进行编辑的过程可以采用一定规则处理，例如，跳过熟练掌握的知识点短视频或加快熟练掌握的知识点视频的播放速度，加快基础相对较好的知识点视频的播放速度，减慢基础相对薄弱的知识点视频的播放速度等。

在示例性实施例中，在确定目标课程视频之后，还包括：获取目标学生对目标课程视频的反馈信息，反馈信息用于指示目标课程视频的确定效果；基于反馈信息，更新目标学生待学习的课程视频。

示例性地，获取目标学生对目标课程视频的反馈信息的方式可以是指通过问卷调查的方式统计目标学生对目标课程视频的反馈信息，也可以是指对目标学生的学习效果进行测评，根据测评结果获取反馈信息等。获取反馈信息是为了记录学生对目标课程视频的学习情况，例如观看时长、每个知识点反馈结果、整体课程体验反馈结果，还有简单测评了解课程视频的掌握程度等，通过获取反馈信息来积累相应的数据，以便于自主迭代AI课程创作算法，进而利用迭代后的课程创作算法更新目标学生待学习的课程视频。示例性地，基于反馈信息可以更新目标学生的属性特征、知识点学习需求等，然后可以根据新的属性特征以及新的知识点学习需求，为目标学生确定新的待学习的课程视频，以保证课程视频确定的实时性。

示例性地，确定目标课程视频的过程可以如图7所示。目标课程视频可以基于个性化定制课程系统确定，该系统包括如下几个部分：短视频素材库(包含特征)、学生动态特征数据库、教育知识图谱应用层、课程创作AI算法模块、学生上课反馈系统。其中，短视频素材库主要维护和更新课程视频知识点细粒度拆分系统；教育知识图谱独立维护与更新，此处属于应用层；学生动态特征库主要维护学生的属性特征以及知识点学习需求等；课程创作AI算法模块主要用于基于更加可控的pipeline(流水线)模式为目标学生创作个性化的课程视频；学生上课反馈系统主要用于收集学生对课程视频的反馈信息。

从数据库中提取候选知识点视频，如，大知识点A视频库中的a11、a22等候选知识点视频、大知识点B视频库中的b11、b22等候选知识点视频、大知识点C视频库中的c11、c22等候选知识点视频以及其他技能或学习需求知识库中的候选知识点视频。获取多个学生的属性特征和知识点学习需求，如，学生1的属性特征和知识点学习需求(java初级)、学生2的属性特征和知识点学习需求(PS(Photoshop，一种图像处理软件)设计高级)、学生3的属性特征和知识点学习需求(net(网络)中级)等。获取教育知识图谱。基于候选知识点视频、学生的属性特征和知识点学习需求、教育知识图谱，利用个性化课程定制算法为学生确定个性化的课程视频。

例如，个性化课程定制算法的流程包括：1.根据需求、知识点图谱进行召回；2.按照学生的档案和短视频知识点属性进行同质排序取top K(最匹配的K个)；3.根据知识点机构，对短视频进行时序排序重组，得到候选长视频课程；4.评估课程质量；5.每个组成短视频播放速度个性化定制。

在为学生确定出课程视频后，还包括学生学习、掌握情况自测或学生主动反馈、更新学生的属性特征和知识点学习需求、效果日志记录、整理数据以及迭代个性化课程定制算法等过程。

示例性地，确定目标课程视频的框架可以如图8所示。录播长视频课程上传入库，AI算法按照知识点粒度切分得到分钟级别短视频；依据学习需求、教育知识图谱数据和算法，对短视频素材进行召回；AI创作模型对按照知识点分类的素材进行排序并选择top K，重组素材输出多个候选创作课程；对其进行质量评估，获取最优定制课程给到学生学习；学习完成进入短视频反馈，整体质量反馈，学生对知识点掌握测评；更新学生profile(属性特征)，积累整个平台的反馈和测评数据，定时进行模型迭代；模型存在迭代或学生profile更新，需要同步更新学生定制化课程。

示例性地，上述步骤201至步骤205可视为通过一种流水线的方式获取目标课程视频的过程，本申请实施例并不局限于此。在另一种可能实现方式中，确定目标课程视频的过程还可以为：将候选知识点视频的视频特征、目标学生的知识点学习需求和属性特征输入课程视频确定模型，得到课程视频确定模型输出的由候选知识点视频中与目标学生匹配的至少一个目标知识点视频拼接得到的目标课程视频。其中，课程视频确定模型基于样本知识点视频的视频特征、样本学生的知识点学习需求、样本学生的属性特征以及样本学生对应的标准课程视频，利用端到端的训练方式训练得到，标准课程视频由至少一个样本知识点视频拼接得到。此种确定目标课程视频的方式是一种多任务联合建模方式，在数据积累丰富，业务理解透彻，算法技术比较成熟前提条件下具有比较好的效果。

学生精力有限、时间有限，学习前基础不一样，学习中对不同知识点掌握程度不同；老师对每个细分知识点理解不一致，老师讲解方式和难易程度不一致；学生在上面前提下，学习某一两个系列视频(现有大长视频课程)并不是最优学习方案；因为学习视频和课堂讲课一样是为大部分学生的一个常规方案；导致基础好的学生学习效率低，基础差点的学生理解不到位；且每个老师并不是对所有知识点理解都是一致，细化到知识点短视频质量(具有主观差异性)也是不一致的，且现有最细粒度是子课视频；但是学生无法在短视频粒度进行最优选择；本申请实施例能够解决上述问题，通过将在线课程和学习需求匹配精细化到细粒度知识点分钟短视频级别，另外考虑了用户的个性化需求，从而使得每个学生的需求都是最优的，提升了每个学生的学习效率和效果。

本申请实施例提出一种在线教育场景基于AI算法，对每个学生提供最优个性化定制课程方法或系统。将教学和学习需求匹配颗粒度从普通的大课级别，细化到了知识点短视频级别；打破教育资源限制，将一个老师为众多学生上大课模式，改为众多老师为一个学生上小课模式，提升个体学习效率和效果、教育资源也充分利用。示例性地，通过NLP(Natural Language Processing，自然语言处理)、CV(Computer Vision，计算机视觉)、多模态相关算法将课拆分为分钟级别短视频，同过搜索推荐召回排序相关技术对课程进行个性化的重组，得到最适合每个学习个体课程。

先采用语音识别技术和NER技术识别课程涉及的知识点，然后采用图文多模态技术(例如CLIP(Contrastive Language-Image Pre-training，对比文本-图像预训练模型)、DALL-E(一种基于文本到图像的生成模型)等)对视频切分到分钟级别短视频。然后利用GAT模型对知识点在教育知识图谱中结构进行表征，加入课程和学生特征，参考DSSM构建模型，利用历史数据训练模型，对候选创作素材进行召回；采用DeepFM模型对召回竞品短视频进行排序，选择top K入选后期重组创作素材，多模态模型进行短视频的排列顺序预测；重组后的课程同样采用多模态模型进行评估，评估视频质量，选择最优输出；最后根据学生知识点掌握情况，编辑视频，减少课程时间成本。最后将学生学习过程以和设定测评机制积累的数据归档整理，积累后定期优化前面涉及课程AI创作模型。反过来优化的模型会优化每个学生学习需求的定制课程。

本申请实施例能用于通过录制的视频资料学习知识的平台系统设备或程序，提升每个用户课程学习效率和体验，节省学习的时间成本。对于课程创作者使用工具设备，通过提供有效指导和归因评估，能有效提高创作效率以及作品的质量。

例如，在线教育平台上，大量教育机构和老师通过平台录播或直播形式，为能接触到互联网的广大学生提供上课服务，在线课程多样性远远小于学生的需求多样性；平台的核心功能是为将学生学习需求和老师提供的课程进行匹配，需求精细化匹配程度越高，用户体验越好。具体地，例如平台上提供[java入门]技术系列课程，下配多节子课(环境配置、基础字符、运算符、类……)，子课是由多个细粒度知识点构成的一节较长视频课程(多为小时级别)，且存在多个老师或机构教授[java入门]系列课程。平台获取录播课程视频再次创作的许可，将课程中涉及[java入门]按照知识点粒度(例如字符串、++、…)切分成短视频。存在学生A的档案有[java]入门学习需求，已掌握字符串知识点且喜欢名师课，根据学生基础和偏好信息，首先通过教育知识图谱和算法召回技术召回[java技术]相关知识点短视频，AI算法创作课程跳过已经掌握知识点，一个知识点存在多个可选短视频优先名师。完成一节课学习，进入简单课程体验反馈和相关知识点测评，评价课程质量和更新学生A的信息，下次学生A进入学习前，定时迭代创作算法并更新学生A的课程，动态保持最优。

创作者录制课程辅助系统或设备，制定一节新课，通过教育知识图谱能辅助快速确定知识点范围，参考范围制定计划；录制完视频切分后的每个知识点短视频进行AI打分，归因分析改进方向，指导创作者优化。

本申请实施例提供的确定课程视频的方法，根据目标学生的知识点学习需求和属性特征确定了目标学生待学习的目标课程视频，该目标课程视频中的每部分视频均是候选知识点视频中与目标学生匹配的目标知识点视频，基于此种方式确定的目标课程视频中的每部分视频均与学生有较高的匹配程度，将该目标课程视频作为学生待学习的课程视频，有利于提高学生的学习兴趣以及学习效果，进而提高学生与教育平台的交互率。

参见图9，本申请实施例提供了一种确定课程视频的装置，该装置包括：

第一获取模块901，用于获取老师录制的初始课程视频，对初始课程视频按照知识点粒度进行切分，得到候选知识点视频；

第二获取模块902，用于获取目标学生的知识点学习需求和属性特征，知识点学习需求用于指示目标学生期望学习的知识点，属性特征用于标识目标学生；

确定模块903，用于基于目标学生的知识点学习需求，确定与目标学生匹配的至少一个目标知识点；基于至少一个目标知识点和目标学生的属性信息，从候选知识点视频中确定与目标学生匹配的目标知识点视频集，目标知识点视频集包括各个目标知识点分别对应的至少一个目标知识点视频；

拼接模块904，用于对目标知识点视频集中的目标知识点视频进行拼接，得到至少一个候选课程视频，任一候选课程视频由各个目标知识点分别对应的一个目标知识点视频拼接得到；

选取模块905，用于从至少一个候选课程视频中选取满足选取条件的目标课程视频，目标课程视频为目标学生待学习的课程视频。

在一种可能实现方式中，确定模块903，用于从候选知识点视频中确定任一目标知识点对应的至少一个第一知识点视频，从任一目标知识点对应的至少一个第一知识点视频中确定满足筛选条件的至少一个第二知识点视频；基于目标学生的属性特征和至少一个第二知识点视频的视频特征，确定至少一个第二知识点视频分别与目标学生的匹配度；将匹配度满足匹配条件的至少一个第二知识点视频作为任一目标知识点对应的至少一个目标知识点视频；基于各个目标知识点分别对应的至少一个目标知识点视频，确定目标知识点视频集。

在一种可能实现方式中，选取模块905，用于获取任一候选课程视频的第一评估指标、第二评估指标和第三评估指标中的至少一项，基于第一评估指标、第二评估指标和第三评估指标中的至少一项，确定任一候选课程视频的评估结果；将至少一个候选课程视频中的评估结果满足第一评估条件的候选课程视频作为满足选取条件的目标课程视频；其中，第一评估指标基于任一候选课程视频中的各个目标知识点视频对应的文本得到，第一评估指标用于评估任一候选课程视频的内容串讲的合理性；第二评估指标基于任一候选课程视频中的各个视频帧得到，第二评估指标用于评估任一候选课程视频的观看流畅度；第三评估指标基于任一候选课程视频中的各个目标知识点视频对应的文本和任一候选课程视频中的各个视频帧得到，第三评估指标用于评估任一候选课程视频的整体质量。

在一种可能实现方式中，确定模块903，用于获取教育知识图谱，教育知识图谱包括知识点对应的节点以及知识点对应的节点之间的边；基于目标学生的知识点学习需求和教育知识图谱，确定与目标学生匹配的至少一个目标知识点。

在一种可能实现方式中，确定模块903，用于获取初始知识图谱；剔除初始知识图谱中与教育场景的关联性不满足关联要求的节点和边，得到第一知识图谱；基于教育场景对应的书籍、教育场景对应的多媒体资源中的至少一项，在第一知识图谱中增加与教育场景的关联性满足关联要求且第一知识图谱中缺少的节点和边，得到第二知识图谱；对第二知识图谱进行修正，得到教育知识图谱。

在一种可能实现方式中，拼接模块904，用于确定至少一个目标知识点的排列顺序；基于排列顺序对目标知识点视频集中的目标知识点视频进行拼接，得到至少一个候选课程视频，任一候选课程视频由各个目标知识点分别对应的一个目标知识点视频按照排列顺序拼接得到。

在一种可能实现方式中，第一获取模块901，用于获取初始课程视频对应的语音数据，将语音数据转换为文本；抽取文本中的知识点；基于初始课程视频的视频帧和视频帧对应的文本，确定视频帧的分类结果，视频帧的分类结果用于指示视频帧在抽取的知识点中对应的知识点；基于初始课程视频中的各个视频帧的分类结果，对初始课程视频按照知识点粒度进行切分，得到切分视频；基于切分视频，获取候选知识点视频。

在一种可能实现方式中，第一获取模块901，用于基于切分视频的视频特征，获取切分视频的评估结果；将切分视频中的评估结果不满足第二评估条件的视频剔除，得到候选知识点视频。

在一种可能实现方式中，切分视频的视频特征包括切分视频对应的初始课程视频的录制老师的特征、切分视频对应的初始课程视频的录制老师所属机构的特征、切分视频的内容的特征中的至少一项。

在一种可能实现方式中，该装置还包括：

编辑模块，用于基于目标学生的属性特征，对目标课程视频中的各个目标知识点视频的原始播放速度进行编辑，得到目标课程视频中的各个目标知识点视频的目标播放速度；

播放模块，用于响应于目标学生对目标课程视频的学习指令，基于各个目标知识点视频的目标播放速度播放目标课程视频中的各个目标知识点视频。

在一种可能实现方式中，该装置还包括：

更新模块，用于获取目标学生对目标课程视频的反馈信息，反馈信息用于指示目标课程视频的确定效果；基于反馈信息，更新目标学生待学习的课程视频。

本申请实施例提供的确定课程视频的装置，根据目标学生的知识点学习需求和属性特征确定了目标学生待学习的目标课程视频，该目标课程视频中的每部分视频均是候选知识点视频中与目标学生匹配的目标知识点视频，基于此种方式确定的目标课程视频中的每部分视频均与学生有较高的匹配程度，将该目标课程视频作为学生待学习的课程视频，有利于提高学生的学习兴趣以及学习效果，进而提高学生与教育平台的交互率。

需要说明的是，上述实施例提供的装置在实现其功能时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将设备的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的装置与方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

在示例性实施例中，还提供了一种计算机设备，该计算机设备包括处理器和存储器，该存储器中存储有至少一条计算机程序。该至少一条计算机程序由一个或者一个以上处理器加载并执行，以使该计算机设备实现上述任一种确定课程视频的方法。该计算机设备可以为服务器，也可以为终端。接下来，对服务器和终端的结构分别进行介绍。

图10是本申请实施例提供的一种服务器的结构示意图，该服务器可因配置或性能不同而产生比较大的差异，可以包括一个或多个处理器(Central Processing Units，CPU)1001和一个或多个存储器1002，其中，该一个或多个存储器1002中存储有至少一条计算机程序，该至少一条计算机程序由该一个或多个处理器1001加载并执行，以使该服务器实现上述各个方法实施例提供的确定课程视频的方法。当然，该服务器还可以具有有线或无线网络接口、键盘以及输入输出接口等部件，以便进行输入输出，该服务器还可以包括其他用于实现设备功能的部件，在此不做赘述。

图11是本申请实施例提供的一种终端的结构示意图。该终端可以是：PC(如，笔记本电脑、台式计算机等)、手机、智能手机、PDA、可穿戴设备、PPC、平板电脑、智能车机、智能电视、智能音箱、智能手表、车载终端等。终端还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。

通常，终端包括有：处理器1501和存储器1502。

处理器1501可以包括一个或多个处理核心，比如4核心处理器、8核心处理器等。处理器1501可以采用DSP(Digital Signal Processing，数字信号处理)、FPGA(Field-Programmable Gate Array，现场可编程门阵列)、PLA(Programmable Logic Array，可编程逻辑阵列)中的至少一种硬件形式来实现。处理器1501也可以包括主处理器和协处理器，主处理器是用于对在唤醒状态下的数据进行处理的处理器，也称CPU(Central ProcessingUnit，中央处理器)；协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中，处理器1501可以集成有GPU(Graphics Processing Unit，图像处理器)，GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中，处理器1501还可以包括AI处理器，该AI处理器用于处理有关机器学习的计算操作。

存储器1502可以包括一个或多个计算机可读存储介质，该计算机可读存储介质可以是非暂态的。存储器1502还可包括高速随机存取存储器，以及非易失性存储器，比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中，存储器1502中的非暂态的计算机可读存储介质用于存储至少一个指令，该至少一个指令用于被处理器1501所执行，以使该终端实现本申请中方法实施例提供的确定课程视频的方法。

在一些实施例中，终端还可选包括有：外围设备接口1503和至少一个外围设备。处理器1501、存储器1502和外围设备接口1503之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口1503相连。具体地，外围设备包括：射频电路1504、显示屏1505、摄像头组件1506、音频电路1507和电源1508中的至少一种。

外围设备接口1503可被用于将I/O(Input/Output，输入/输出)相关的至少一个外围设备连接到处理器1501和存储器1502。在一些实施例中，处理器1501、存储器1502和外围设备接口1503被集成在同一芯片或电路板上；在一些其他实施例中，处理器1501、存储器1502和外围设备接口1503中的任意一个或两个可以在单独的芯片或电路板上实现，本实施例对此不加以限定。

射频电路1504用于接收和发射RF(Radio Frequency，射频)信号，也称电磁信号。射频电路1504通过电磁信号与通信网络以及其他通信设备进行通信。射频电路1504将电信号转换为电磁信号进行发送，或者，将接收到的电磁信号转换为电信号。可选地，射频电路1504包括：天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路1504可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于：城域网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity，无线保真)网络。在一些实施例中，射频电路1504还可以包括NFC(Near Field Communication，近距离无线通信)有关的电路，本申请对此不加以限定。

显示屏1505用于显示UI(User Interface，用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏1505是触摸显示屏时，显示屏1505还具有采集在显示屏1505的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器1501进行处理。此时，显示屏1505还可以用于提供虚拟按钮和/或虚拟键盘，也称软按钮和/或软键盘。在一些实施例中，显示屏1505可以为一个，设置在终端的前面板；在另一些实施例中，显示屏1505可以为至少两个，分别设置在终端的不同表面或呈折叠设计；在另一些实施例中，显示屏1505可以是柔性显示屏，设置在终端的弯曲表面上或折叠面上。甚至，显示屏1505还可以设置成非矩形的不规则图形，也即异形屏。显示屏1505可以采用LCD(Liquid Crystal Display，液晶显示屏)、OLED(Organic Light-Emitting Diode，有机发光二极管)等材质制备。

摄像头组件1506用于采集图像或视频。可选地，摄像头组件1506包括前置摄像头和后置摄像头。通常，前置摄像头设置在终端的前面板，后置摄像头设置在终端的背面。在一些实施例中，后置摄像头为至少两个，分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种，以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality，虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中，摄像头组件1506还可以包括闪光灯。闪光灯可以是单色温闪光灯，也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合，可以用于不同色温下的光线补偿。

音频电路1507可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波，并将声波转换为电信号输入至处理器1501进行处理，或者输入至射频电路1504以实现语音通信。出于立体声采集或降噪的目的，麦克风可以为多个，分别设置在终端的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器1501或射频电路1504的电信号转换为声波。扬声器可以是传统的薄膜扬声器，也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时，不仅可以将电信号转换为人类可听见的声波，也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中，音频电路1507还可以包括耳机插孔。

电源1508用于为终端中的各个组件进行供电。电源1508可以是交流电、直流电、一次性电池或可充电电池。当电源1508包括可充电电池时，该可充电电池可以支持有线充电或无线充电。该可充电电池还可以用于支持快充技术。

在一些实施例中，终端还包括有一个或多个传感器1509。该一个或多个传感器1509包括但不限于：加速度传感器1510、陀螺仪传感器1511、压力传感器1512、光学传感器1513以及接近传感器1514。

加速度传感器1510可以检测以终端建立的坐标系的三个坐标轴上的加速度大小。比如，加速度传感器1510可以用于检测重力加速度在三个坐标轴上的分量。处理器1501可以根据加速度传感器1510采集的重力加速度信号，控制显示屏1505以横向视图或纵向视图进行用户界面的显示。加速度传感器1510还可以用于游戏或者用户的运动数据的采集。

陀螺仪传感器1511可以检测终端的机体方向及转动角度，陀螺仪传感器1511可以与加速度传感器1510协同采集用户对终端的3D动作。处理器1501根据陀螺仪传感器1511采集的数据，可以实现如下功能：动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。

压力传感器1512可以设置在终端的侧边框和/或显示屏1505的下层。当压力传感器1512设置在终端的侧边框时，可以检测用户对终端的握持信号，由处理器1501根据压力传感器1512采集的握持信号进行左右手识别或快捷操作。当压力传感器1512设置在显示屏1505的下层时，由处理器1501根据用户对显示屏1505的压力操作，实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。

光学传感器1513用于采集环境光强度。在一个实施例中，处理器1501可以根据光学传感器1513采集的环境光强度，控制显示屏1505的显示亮度。具体地，当环境光强度较高时，调高显示屏1505的显示亮度；当环境光强度较低时，调低显示屏1505的显示亮度。在另一个实施例中，处理器1501还可以根据光学传感器1513采集的环境光强度，动态调整摄像头组件1506的拍摄参数。

接近传感器1514，也称距离传感器，通常设置在终端的前面板。接近传感器1514用于采集用户与终端的正面之间的距离。在一个实施例中，当接近传感器1514检测到用户与终端的正面之间的距离逐渐变小时，由处理器1501控制显示屏1505从亮屏状态切换为息屏状态；当接近传感器1514检测到用户与终端的正面之间的距离逐渐变大时，由处理器1501控制显示屏1505从息屏状态切换为亮屏状态。

本领域技术人员可以理解，图11中示出的结构并不构成对终端的限定，可以包括比图示更多或更少的组件，或者组合某些组件，或者采用不同的组件布置。

在示例性实施例中，还提供了一种计算机可读存储介质，该计算机可读存储介质中存储有至少一条计算机程序，该至少一条计算机程序由计算机设备的处理器加载并执行，以使计算机实现上述任一种确定课程视频的方法。

在一种可能实现方式中，上述计算机可读存储介质可以是只读存储器(Read-OnlyMemory，ROM)、随机存取存储器(Random Access Memory，RAM)、只读光盘(Compact DiscRead-Only Memory，CD-ROM)、磁带、软盘和光数据存储设备等。

在示例性实施例中，还提供了一种计算机程序产品，该计算机程序产品包括计算机程序或计算机指令，该计算机程序或计算机指令由处理器加载并执行，以使计算机实现上述任一种确定课程视频的方法。

需要说明的是，本申请所涉及的信息(包括但不限于用户设备信息、用户个人信息等)、数据(包括但不限于用于分析的数据、存储的数据、展示的数据等)以及信号，均为经用户授权或者经过各方充分授权的，且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。例如，本申请中涉及到的知识点学习需求和属性特征都是在充分授权的情况下获取的。

本申请中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以上示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反，它们仅是与本申请的一些方面相一致的装置和方法的例子。

应当理解的是，在本文中提及的“多个”是指两个或两个以上。“和/或”，描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。

以上所述仅为本申请的示例性实施例，并不用以限制本申请，凡在本申请的原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

1.一种确定课程视频的方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述基于所述至少一个目标知识点和所述目标学生的属性特征，从所述候选知识点视频中确定与所述目标学生匹配的目标知识点视频集，包括：

从所述候选知识点视频中确定任一目标知识点对应的至少一个第一知识点视频，从所述任一目标知识点对应的至少一个第一知识点视频中确定满足筛选条件的至少一个第二知识点视频；

基于所述目标学生的属性特征和所述至少一个第二知识点视频的视频特征，确定所述至少一个第二知识点视频分别与所述目标学生的匹配度；将匹配度满足匹配条件的至少一个第二知识点视频作为所述任一目标知识点对应的至少一个目标知识点视频；

基于各个目标知识点分别对应的至少一个目标知识点视频，确定所述目标知识点视频集。

3.根据权利要求1所述的方法，其特征在于，所述从所述至少一个候选课程视频中选取满足选取条件的目标课程视频，包括：

获取任一候选课程视频的第一评估指标、第二评估指标和第三评估指标中的至少一项，基于所述第一评估指标、第二评估指标和第三评估指标中的至少一项，确定所述任一候选课程视频的评估结果；

将所述至少一个候选课程视频中的评估结果满足第一评估条件的候选课程视频作为所述满足选取条件的目标课程视频；

其中，所述第一评估指标基于所述任一候选课程视频中的各个目标知识点视频对应的文本得到，所述第一评估指标用于评估所述任一候选课程视频的内容串讲的合理性；所述第二评估指标基于所述任一候选课程视频中的各个视频帧得到，所述第二评估指标用于评估所述任一候选课程视频的观看流畅度；所述第三评估指标基于所述任一候选课程视频中的各个目标知识点视频对应的文本和所述任一候选课程视频中的各个视频帧得到，所述第三评估指标用于评估所述任一候选课程视频的整体质量。

4.根据权利要求1所述的方法，其特征在于，所述基于所述目标学生的知识点学习需求，确定与所述目标学生匹配的至少一个目标知识点，包括：

获取教育知识图谱，所述教育知识图谱包括知识点对应的节点以及知识点对应的节点之间的边；

基于所述目标学生的知识点学习需求和所述教育知识图谱，确定与所述目标学生匹配的至少一个目标知识点。

5.根据权利要求4所述的方法，其特征在于，所述获取教育知识图谱，包括：

获取初始知识图谱；剔除所述初始知识图谱中与教育场景的关联性不满足关联要求的节点和边，得到第一知识图谱；

基于所述教育场景对应的书籍、所述教育场景对应的多媒体资源中的至少一项，在所述第一知识图谱中增加与所述教育场景的关联性满足关联要求且所述第一知识图谱中缺少的节点和边，得到第二知识图谱；

对所述第二知识图谱进行修正，得到所述教育知识图谱。

6.根据权利要求1所述的方法，其特征在于，所述对所述目标知识点视频集中的目标知识点视频进行拼接，得到至少一个候选课程视频，包括：

确定所述至少一个目标知识点的排列顺序；

基于所述排列顺序对所述目标知识点视频集中的目标知识点视频进行拼接，得到至少一个候选课程视频，任一候选课程视频由各个目标知识点分别对应的一个目标知识点视频按照所述排列顺序拼接得到。

7.根据权利要求1-6任一所述的方法，其特征在于，所述对所述初始课程视频按照知识点粒度进行切分，得到候选知识点视频，包括：

获取所述初始课程视频对应的语音数据，将所述语音数据转换为文本；

抽取所述文本中的知识点；

基于所述初始课程视频的视频帧和所述视频帧对应的文本，确定所述视频帧的分类结果，所述视频帧的分类结果用于指示所述视频帧在抽取的知识点中对应的知识点；

基于所述初始课程视频中的各个视频帧的分类结果，对所述初始课程视频按照知识点粒度进行切分，得到切分视频；基于所述切分视频，获取所述候选知识点视频。

8.根据权利要求7所述的方法，其特征在于，所述基于所述切分视频，获取所述候选知识点视频，包括：

基于所述切分视频的视频特征，获取所述切分视频的评估结果；

将所述切分视频中的评估结果不满足第二评估条件的视频剔除，得到所述候选知识点视频。

9.根据权利要求8所述的方法，其特征在于，所述切分视频的视频特征包括所述切分视频对应的初始课程视频的录制老师的特征、所述切分视频对应的初始课程视频的录制老师所属机构的特征、所述切分视频的内容的特征中的至少一项。

10.根据权利要求1-6任一所述的方法，其特征在于，所述从所述至少一个候选课程视频中选取满足选取条件的目标课程视频之后，所述方法还包括：

基于所述目标学生的属性特征，对所述目标课程视频中的各个目标知识点视频的原始播放速度进行编辑，得到所述目标课程视频中的各个目标知识点视频的目标播放速度；

响应于所述目标学生对所述目标课程视频的学习指令，基于所述各个目标知识点视频的目标播放速度播放所述目标课程视频中的各个目标知识点视频。

11.根据权利要求1-6任一所述的方法，其特征在于，所述从所述至少一个候选课程视频中选取满足选取条件的目标课程视频之后，所述方法还包括：

获取所述目标学生对所述目标课程视频的反馈信息，所述反馈信息用于指示所述目标课程视频的确定效果；

基于所述反馈信息，更新所述目标学生待学习的课程视频。

12.一种确定课程视频的装置，其特征在于，所述装置包括：

13.一种计算机设备，其特征在于，所述计算机设备包括处理器和存储器，所述存储器中存储有至少一条计算机程序，所述至少一条计算机程序由所述处理器加载并执行，以使所述计算机设备实现如权利要求1至11任一所述的确定课程视频的方法。

14.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有至少一条计算机程序，所述至少一条计算机程序由处理器加载并执行，以使计算机实现如权利要求1至11任一所述的确定课程视频的方法。