WO2019214019A1

WO2019214019A1 - 基于卷积神经网络的网络教学方法以及装置

Info

Publication number: WO2019214019A1
Application number: PCT/CN2018/092784
Authority: WO
Inventors: 陈铿帆; 刘善果; 刘胜强
Original assignee: 深圳市鹰硕技术有限公司
Priority date: 2018-05-11
Filing date: 2018-06-26
Publication date: 2019-11-14
Also published as: CN108665769A; CN108665769B

Abstract

一种基于卷积神经网络的网络教学方法、装置、电子设备。其中，方法包括：分析网络教学视频信号，生成特征分帧图像（S110），通过卷积神经网络算法的多个卷积层对特征分帧图像进行高频内容检测，确定满足预设频次条件的多个候选高频内容区域（S120），通过卷积神经网络算法的池化层处理多个候选高频内容区域，得到重点内容区域及重点内容区域在特征分帧图像中的位置（S130），根据重点内容区域在图像中的位置，生成包含高频内容的重点网络教学视频信号并显示输出（S140）。可以对网络教学视频信号分析自动识别并生成包含重点内容的网络教学视频信号。

Description

基于卷积神经网络的网络教学方法以及装置

技术领域

本公开涉及计算机技术领域，具体而言，涉及一种基于卷积神经网络的网络教学方法、装置、电子设备以及计算机可读存储介质。

背景技术

网络教学是在一定教学理论和思想指导下，应用多媒体和网络技术，通过师、生、媒体等多边、多向互动和对多种媒体教学信息的收集、传输、处理、共享，来实现教学目标的一种教学模式。具有开放性、交互性、共享性等优点，打破了传统教学在时空上的局限，有利于推广研究性学习。

然而，由于网络教学内容只能在用户的显示设备上显示，使得教学场景无法完全重现，受特定显示设备的条件制约，用户无法选择观看想要学习的网络视频画面中的重点内容区域，或者只能收看视频源信号人为认定的重点内容扩展展示区域。

在现有技术中，CN201610235737公开了一种识别文字文档的方法及装置，通过根据提取的原文档内容确定复数个版面元素将版面元素一一映射到相对应的预设标签，根据预设标签将原文档内容进行展示，该方式是通过建立标签的方式来实现对文档中重点内容识别的，不是智能图像处理算法；CN201710250098公开了一种利用时空注意力模型的视频内容描述方法，通过时间注意力和空间注意力模型来实现对视频每帧图片中重点关注的关键区域进行识别，该方法是通过卷积神经网络对多个图片叠加的动态效果实现关键区域识别的，并不能只分析关键帧单一图片来实现对重点区域的识别。CN201711049706公开了一种基于卷积神经网络的块内容分类方法，通过训练样本转换灰度图的方式进而建立末位比特-卷积神经网络模型，来实现对图片内容的分类，并不能实现对重点内容的识别。

因此，需要提供一种或多种至少能够解决上述问题的技术方案。

需要说明的是，在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解，因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

发明内容

本公开的目的在于提供一种基于卷积神经网络的网络教学方法、装置、电子设备以及计算机可读存储介质，进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的一个或者多个问题。

根据本公开的一个方面，提供一种基于卷积神经网络的网络教学方法，包括：

分帧图像生成步骤，用于分析网络教学视频信号，生成特征分帧图像；

高频内容检测步骤，通过卷积神经网络算法的多个卷积层对所述特征分帧图像进行高频内容检测，确定满足预设频次条件的多个候选高频内容区域；

池化层处理步骤，通过卷积神经网络算法的池化层处理所述多个候选高频内容区域，得到重点内容区域及重点内容区域在特征分帧图像中的位置；

重点视频信号生成步骤，根据重点内容区域在图像中的位置，生成包含高频内容的重点网络教学视频信号，调用终端设备的显示接口显示输出所述重点网络教学视频信号。

在本公开的一种示例性实施例中，所述高频内容检测步骤，包括：

由特征分帧图像生成感受野，所述感受野为包含部分特征分帧图像区域的卷积层；

对所述感受野与所述特征分帧图像进行卷积运算，得到多个候选高频内容区域。

在本公开的一种示例性实施例中，所述方法包括：

所述感受野对应的卷积层的深度与特征分帧图像的深度相同。

在本公开的一种示例性实施例中，所述池化层处理步骤，包括：

将多个候选高频内容区域分成多个大小相同的子区域；

对每个子区域进行平均池化计算；

当根据平均池化计算结果确定所述候选高频内容区域包含高频内容时，将所述候选高频内容区域确定为重点内容区域，并确定所述重点内容区域在特征分帧图像中的位置。

在本公开的一种示例性实施例中，所述确定重点内容区域在特征分帧图像中的位置，包括：

分析重点内容图像灰度分布梯度，根据所述灰度分布梯度进行重点内容图像边际识别；

根据重点内容图像边际确定重点内容显示区域；

在所述特征分帧图像中查找确定所述重点内容显示区域。

在本公开的一种示例性实施例中，在得到重点内容区域及重点内容区域在特征分帧图像中的位置后，所述方法还包括：

当存在多个重点内容区域时，根据平均池化计算得出的主要特征值，对重点内容区域进行重要度排序。

在本公开的一种示例性实施例中，所述方法还包括：

在网络教学视频信号与重点网络教学视频信号的输出页面中设置切换按钮；

当接收到用户通过触发所述切换按钮发送的切换指令后，将终端设备当前显示输出的重点网络教学视频信号或显示网络教学视频信号切换为显示网络教学视频信号或重点网络教学视频信号。

在本公开的一种示例性实施例中，所述方法还包括：

当检测到所述终端设备具有关联设备时，获取终端设备以及关联设备的设备优先级；

按照所述设备优先级以及用户指令显示网络教学视频信号与重点网络教学视频信号。

在本公开的一种示例性实施例中，所述特征分帧图像为切换帧。

在本公开的一个方面，提供一种基于卷积神经网络的网络教学装置，包括：

分帧图像生成模块，用于分析网络教学视频信号，生成特征分帧图像；

高频内容检测模块，用于通过卷积神经网络算法的多个卷积层对所述特征分帧图像进行高频内容检测，确定满足预设频次条件的多个候选高频内容区域；

池化层处理模块，用于通过卷积神经网络算法的池化层处理所述多个候选高频内容区域，得到重点内容区域及重点内容区域在特征分帧图像中的位置；

重点视频信号生成模块，用于根据重点内容区域在图像中的位置，生成包含高频内容的重点网络教学视频信号，调用终端设备的显示接口显示输出所述重点网络教学视频信号。

在本公开的一个方面，提供一种电子设备，包括：

处理器；以及

存储器，所述存储器上存储有计算机可读指令，所述计算机可读指令被所述处理器执行时实现根据上述任意一项所述的方法。

在本公开的一个方面，提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现根据上述任意一项所述的方法。

本公开的示例性实施例中的基于卷积神经网络的网络教学方法，分析网络教学视频信号，生成特征分帧图像，通过卷积神经网络算法的多个卷积层对所述特征分帧图像进行高频内容检测，确定满足预设频次条件的多个候选高频内容区域，通过卷积神经网络算法的池化层处理所述多个候选高频内容区域，得到重点内容区域及重点内容区域在特征分帧图像中的位置，根据重点内容区域在图像中的位置，生成包含高频内容的重点网络教学视频信号，调用终端设备的显示接口显示输出所述重点网络教学视频信号。一方面，由于通过卷积神经网络对教学视频的重点内容实现了自动查找，减少了实际教学场景中人为查找和定位重点内容的操作，提高了教学质量的同时节省了人员成本；另一方面，对多个网络教学视频中的重点内容按照重要程度排序，在用户的显示设备中显示，使用户可以有选择的同时收看多个重点内容，提高了用户的体验。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

通过参照附图来详细描述其示例实施例，本公开的上述和其它特征及优点将变得更加明显。

图1示出了根据本公开一示例性实施例的基于卷积神经网络的网络教学方法的流程图；

图2A-2B示出了根据本公开一示例性实施例的基于卷积神经网络的网络教学方法应用场景的示意图；

图3A-3B示出了根据本公开一示例性实施例的基于卷积神经网络的网络教学方法应用场景的示意图；

图4示出了根据本公开一示例性实施例的基于卷积神经网络的网络教学装置的示意框图；

图5示意性示出了根据本公开一示例性实施例的电子设备的框图；以及

图6示意性示出了根据本公开一示例性实施例的计算机可读存储介质的示意图。

具体实施方式

现在将参考附图更全面地描述示例实施例。然而，示例实施例能够以多种形式实施，且不应被理解为限于在此阐述的实施例；相反，提供这些实施例使得本公开将全面和完整，并将示例实施例的构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的部分，因而将省略对它们的重复描述。

此外，所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中，提供许多具体细节从而给出对本公开的实施例的充分理解。然而，本领域技术人员将意识到，可以实践本公开的技术方案而没有所述特定细节中的一个或更多，或者可以采用其它的方法、组元、材料、装置、步骤等。在其它情况下，不详细示出或描述公知结构、方法、装置、实现、材料或者操作以避免模糊本公开的各方面。

附图中所示的方框图仅仅是功能实体，不一定必须与物理上独立的实体相对应。即，可以采用软件形式来实现这些功能实体，或在一个或多个软件硬化的模块中实现这些功能实体或功能实体的一部分，或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。

在本示例实施例中，首先提供了一种基于卷积神经网络的网络教学方法，可以应用于计算机等电子设备；参考图1中所示，该基于卷积神经网络的网络教学方法可以包括以下步骤：

分帧图像生成步骤S110，用于分析网络教学视频信号，生成特征分帧图像；

高频内容检测步骤S120，通过卷积神经网络算法的多个卷积层对所述特征分帧图像进行高频内容检测，确定满足预设频次条件的多个候选高频内容区域；

池化层处理步骤S130，通过卷积神经网络算法的池化层处理所述多个候选高频内容区域，得到重点内容区域及重点内容区域在特征分帧图像中的位置；

重点视频信号生成步骤S140，根据重点内容区域在图像中的位置，生成包含高频内容的重点网络教学视频信号，调用终端设备的显示接口显示输出所述重点网络教学视频信号。

根据本示例实施例中的基于卷积神经网络的网络教学方法，一方面，由于通过卷积神经网络对教学视频的重点内容实现了自动查找，减少了实际教学场景中人为查找和定位重点内容的操作，提高了教学质量的同时节省了人员成本；另一方面，对多个网络教学视频中的重点内容按照重要程度排序，在用户的显示设备中显示，使用户可以有选择的同时收看多个重点内容，提高了用户的体验。

下面，将对本示例实施例中的基于卷积神经网络的网络教学方法进行进一步的说明。

在分帧图像生成步骤S110中，可以用于分析网络教学视频信号，生成特征分帧图像。

本示例实施方式中，由于网络教学观看设备的局限性，常常需要将网络教学内容中的重点区域局部放大重点观看学习，在现有的操作中，往往是人为的选择认定重点区域并放大显示给用户的，这样的方式不能智能的实现重点教学内容的自动识别和显示。本方法中，首先分析网络教学视频信号，从所述信号中选取特征分帧图像作为选择重点内容的选取图片源，然后进一步使用卷积神经网络算法实现对重点内容的智能识别。

本示例实施方式中，所述特征分帧图像为切换帧。在实际的视频信号中，切换帧是视频信号的重要数据切换点，代表所述视频信号内容的变换时的初始画面，对所述网络教学视频信号的切换帧作为特征分帧图像可以在保证选取准确度的基础上减少运算量，提高选取速率。

在高频内容检测步骤S120中，可以通过卷积神经网络算法的多个卷积层对所述特征分帧图像进行高频内容检测，确定满足预设频次条件的多个候选高频内容区域。

本示例实施方式中，卷积神经网络与普通神经网络的区别在于，卷积神经网络包含了一个由卷积层和子采样层构成的特征抽取器。在卷积神经网络的卷积层中，一个神经元只与部分邻层神经元连接，通过卷积层与池化层来是实现图像识别，其中池化层可以看作一种特殊的卷积过程。卷积和池化层大大简化了模型复杂度，减少了模型的参数。对所述特征分帧图像通过卷积神经网络算法的多个卷积层进行高频内容检测，可以确定一个或过个候选高频内容区域。

本示例实施方式中，所述高频内容检测步骤，包括：由特征分帧图像生成感受野，所述感受野为包含部分特征分帧图像区域的卷积层，所述感受野可以认为是在神经网络中对所述图片的部分区域基于视觉感受的选取范围，对所述感受野与所述特征分帧图像进行卷积运算，得到多个候选高频内容区域。如图2A所示，为某网络教学视频中一幅特征分帧图像经过多个卷积层处理后得到的多个候选高频内容区域示意图。

本示例实施方式中，所述方法包括：所述感受野对应的卷积层的深度与特征分帧图像的深度相同。所述感受野的深度其实就是所述特征分帧图像的构成原色数，一般为红R、绿G、蓝B三原色，既感受野对应的卷积层的深度为3。

在池化层处理步骤S130中，可以通过卷积神经网络算法的池化层处理所述多个候选高频内容区域，得到重点内容区域及重点内容区域在特征分帧图像中的位置。

本示例实施方式中，池化层处理处理的过程其实就是通过卷积神经网络算法的池化层进行主要特征值求解的过程，一般池化层算法有均值池化计算和最大值池化计算两种形式。根据所述池化运算可以选取出所述多个候选高频内容区域中的高频内容区域。如图2B所示，为某网络教学视频中一幅特征分帧图像的多个候选高频内容区域经过池化计算后得到的高频内容区域的示意图。

本示例实施方式中，所述池化层处理步骤，包括：将多个候选高频内容区域分成多个大小相同的子区域；对每个子区域进行平均池化计算；当根据平均池化计算结果确定所述候选高频内容区域包含高频内容时，将所述候选高频内容区域确定为重点内容区域，并确定所述重点内容区域在特征分帧图像中的位置。将多个候选高频内容区域分成多个大小相同的子区域，所述子区域越小，对高频内容区域的识别越准确。平均池化计算与最大值池化计算相比，可以减少因邻域大小受限造成的估计值方差增大而带来的误差，提高识别的准确度。

本示例实施方式中，在得到重点内容区域及重点内容区域在特征分帧图像中的位置后，所述方法还包括：当存在多个重点内容区域时，根据平均池化计算得出的主要特征值，对重点内容区域进行重要度排序。根据所述主要特征值，可以快速的通过对主要特征值排序来确定所述重点内容区域的重要度排序。

本示例实施方式中，所述确定重点内容区域在特征分帧图像中的位置，包括：分析重点内容图像灰度分布梯度，根据所述灰度分布梯度进行重点内容图像边际识别；根据重点内容图像边际确定重点内容显示区域；在所述特征分帧图像中查找确定所述重点内容显示区域。根据重点内容图像灰度分布梯度的差异，可以实现对重点内容图像边际的确定，进而实现对所述重点内容图像在所述特征分帧图像中的位置快速定位。

在重点视频信号生成步骤S140中，可以根据重点内容区域在图像中的位置，生成包含高频内容的重点网络教学视频信号，调用终端设备的显示接口显示输出所述重点网络教学视频信号。

本示例实施方式中，在确定所述特征分帧图像中的重点内容区域并对所述重点内容区域定位后，剪切所述网络教学视频画面中重点内容区域，生成显示重点内容区域的网络教学视频信号并发送至用户端显示。如图3A为某网络教学视频信号的重点内容区域识别前的教学画面，通过所述卷积神经网络算法计算后，确定所述网络教学视频信号教学画面的特征分帧图像中的重点内容区域并对所述重点内容区域定位，生成对应的重点内容区域的教学信号，如图3B所示，为所述网络教学视频信号的重点内容区域识别后显示重点内容区域的教学画面。

本示例实施方式中，所述方法还包括：在网络教学视频信号与重点网络教学视频信号的输出页面中设置切换按钮；当接收到用户通过触发所述切换按钮发送的切换指令后，将终端设备当前显示输出的重点网络教学视频信号或显示网络教学视频信号切换为显示网络教学视频信号或重点网络教学视频信号。另外，所述教学画面中还可以设置切换按钮，当识别到重点教学内容区域时，显示所述切换按钮，用于提示用户有重点教学内容区域，供用户选择是否进行切换操作。

本示例实施方式中，所述方法还包括：当检测到所述终端设备具有关联设备时，获取终端设备以及关联设备的设备优先级；按照所述设备优先级以及用户指令显示网络教学视频信号与重点网络教学视频信号。当网络教学的用户有多个关联的教学视频设备时，可以根据重点网络教学视频信号的重要等级在对应优先级的终端设备上同时显示，试用户可以同时选择观看多个网络教学画面，提升了用户的教学体验。

需要说明的是，尽管在附图中以特定顺序描述了本公开中方法的各个步骤，但是，这并非要求或者暗示必须按照该特定顺序来执行这些步骤，或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的，可以省略某些步骤，将多个步骤合并为一个步骤执行，以及/或者将一个步骤分解为多个步骤执行等。

此外，在本示例实施例中，还提供了一种基于卷积神经网络的网络教学装置。参照图4所示，该基于卷积神经网络的网络教学装置400可以包括：分帧图像生成模块410、高频内容检测模块420、池化层处理模块430以及重点视频信号生成模块440。其中：

分帧图像生成模块410，用于分析网络教学视频信号，生成特征分帧图像；

高频内容检测模块420，用于通过卷积神经网络算法的多个卷积层对所述特征分帧图像进行高频内容检测，确定满足预设频次条件的多个候选高频内容区域；

池化层处理模块430，用于通过卷积神经网络算法的池化层处理所述多个候选高频内容区域，得到重点内容区域及重点内容区域在特征分帧图像中的位置；

重点视频信号生成模块440，用于根据重点内容区域在图像中的位置，生成包含高频内容的重点网络教学视频信号，调用终端设备的显示接口显示输出所述重点网络教学视频信号。

上述中各基于卷积神经网络的网络教学装置模块的具体细节已经在对应的音频段落识别方法中进行了详细的描述，因此此处不再赘述。

应当注意，尽管在上文详细描述中提及了基于卷积神经网络的网络教学装置400的若干模块或者单元，但是这种划分并非强制性的。实际上，根据本公开的实施方式，上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之，上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。

此外，在本公开的示例性实施例中，还提供了一种能够实现上述方法的电子设备。

所属技术领域的技术人员能够理解，本发明的各个方面可以实现为系统、方法或程序产品。因此，本发明的各个方面可以具体实现为以下形式，即：完全的硬件实施例、完全的软件实施例(包括固件、微代码等)，或硬件和软件方面结合的实施例，这里可以统称为“电路”、“模块”或“系统”。

下面参照图5来描述根据本发明的这种实施例的电子设备500。图5显示的电子设备500仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。

如图5所示，电子设备500以通用计算设备的形式表现。电子设备500的组件可以包括但不限于：上述至少一个处理单元510、上述至少一个存储单元520、连接不同系统组件(包括存储单元520和处理单元510)的总线530、显示单元540。

其中，所述存储单元存储有程序代码，所述程序代码可以被所述处理单元510执行，使得所述处理单元510执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施例的步骤。例如，所述处理单元510可以执行如图1中所示的步骤S110至步骤S140。

存储单元520可以包括易失性存储单元形式的可读介质，例如随机存取存储单元(RAM)5201和/或高速缓存存储单元5202，还可以进一步包括只读存储单元(ROM)5203。

存储单元520还可以包括具有一组(至少一个)程序模块5205的程序/实用工具5204，这样的程序模块5205包括但不限于：操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。

总线530可以为表示几类总线结构中的一种或多种，包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。

电子设备500也可以与一个或多个外部设备570(例如键盘、指向设备、蓝牙设备等)通信，还可与一个或者多个使得用户能与该电子设备500 交互的设备通信，和/或与使得该电子设备500能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口550进行。并且，电子设备500还可以通过网络适配器560与一个或者多个网络(例如局域网(LAN)，广域网(WAN)和/或公共网络，例如因特网)通信。如图所示，网络适配器560通过总线530与电子设备500的其它模块通信。应当明白，尽管图中未示出，可以结合电子设备500使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。

通过以上的实施例的描述，本领域的技术人员易于理解，这里描述的示例实施例可以通过软件实现，也可以通过软件结合必要的硬件的方式来实现。因此，根据本公开实施例的技术方案可以以软件产品的形式体现出来，该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM，U盘，移动硬盘等)中或网络上，包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开实施例的方法。

在本公开的示例性实施例中，还提供了一种计算机可读存储介质，其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施例中，本发明的各个方面还可以实现为一种程序产品的形式，其包括程序代码，当所述程序产品在终端设备上运行时，所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施例的步骤。

参考图6所示，描述了根据本发明的实施例的用于实现上述方法的程序产品600，其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码，并可以在终端设备，例如个人电脑上运行。然而，本发明的程序产品不限于此，在本文件中，可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了可读程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质，该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于无线、有线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中，远程计算设备可以通过任意种类的网络，包括局域网(LAN)或广域网(WAN)，连接到用户计算设备，或者，可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。

此外，上述附图仅是根据本发明示例性实施例的方法所包括的处理的示意性说明，而不是限制目的。易于理解，上述附图所示的处理并不表明或限制这些处理的时间顺序。另外，也易于理解，这些处理可以是例如在多个模块中同步或异步执行的。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其他实施例。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限。

工业实用性

一方面，由于通过卷积神经网络对教学视频的重点内容实现了自动查找，减少了实际教学场景中人为查找和定位重点内容的操作，提高了教学质量的同时节省了人员成本；另一方面，对多个网络教学视频中的重点内容按照重要程度排序，在用户的显示设备中显示，使用户可以有选择的同时收看多个重点内容，提高了用户的体验。

Claims

一种基于卷积神经网络的网络教学方法，其特征在于，包括：

分帧图像生成步骤，用于分析网络教学视频信号，生成特征分帧图像；

高频内容检测步骤，通过卷积神经网络算法的多个卷积层对所述特征分帧图像进行高频内容检测，确定满足预设频次条件的多个候选高频内容区域；

池化层处理步骤，通过卷积神经网络算法的池化层处理所述多个候选高频内容区域，得到重点内容区域及重点内容区域在特征分帧图像中的位置；

重点视频信号生成步骤，根据重点内容区域在图像中的位置，生成包含高频内容的重点网络教学视频信号，调用终端设备的显示接口显示输出所述重点网络教学视频信号。
如权利要求1所述的方法，其特征在于，所述高频内容检测步骤，包括：

由特征分帧图像生成感受野，所述感受野为包含部分特征分帧图像区域的卷积层；

对所述感受野与所述特征分帧图像进行卷积运算，得到多个候选高频内容区域。
如权利要求2所述的方法，其特征在于，所述方法包括：

所述感受野对应的卷积层的深度与特征分帧图像的深度相同。
如权利要求1所述的方法，其特征在于，所述池化层处理步骤，包括：

将多个候选高频内容区域分成多个大小相同的子区域；

对每个子区域进行平均池化计算；

当根据平均池化计算结果确定所述候选高频内容区域包含高频内容时，将所述候选高频内容区域确定为重点内容区域，并确定重点内容区域在特征分帧图像中的位置。
如权利要求4所述的方法，其特征在于，确定重点内容区域在特征分帧图像中的位置，包括：

分析重点内容图像灰度分布梯度，根据所述灰度分布梯度进行重点内容图像边际识别；

根据重点内容图像边际确定重点内容显示区域；

在所述特征分帧图像中查找确定所述重点内容显示区域。
如权利要求4所述的方法，其特征在于，在得到重点内容区域及重点内容区域在特征分帧图像中的位置后，所述方法还包括：

当存在多个重点内容区域时，根据平均池化计算得出的主要特征值，对重点内容区域进行重要度排序。
如权利要求1所述的方法，其特征在于，所述方法还包括：

在网络教学视频信号与重点网络教学视频信号的输出页面中设置切换按钮；

当接收到用户通过触发所述切换按钮发送的切换指令后，将终端设备当前显示输出的重点网络教学视频信号或显示网络教学视频信号切换为显示网络教学视频信号或重点网络教学视频信号。
如权利要求1所述的方法，其特征在于，所述方法还包括：

当检测到所述终端设备具有关联设备时，获取终端设备以及关联设备的设备优先级；

按照所述设备优先级以及用户指令显示网络教学视频信号与重点网络教学视频信号。
如权利要求1所述的方法，其特征在于，所述特征分帧图像为切换帧。
一种基于卷积神经网络的网络教学装置，其特征在于，所述装置包括：

分帧图像生成模块，用于分析网络教学视频信号，生成特征分帧图像；

高频内容检测模块，用于通过卷积神经网络算法的多个卷积层对所述特征分帧图像进行高频内容检测，确定满足预设频次条件的多个候选高频内容区域；

池化层处理模块，用于通过卷积神经网络算法的池化层处理所述多个候选高频内容区域，得到重点内容区域及重点内容区域在特征分帧图像中的位置；

重点视频信号生成模块，用于根据重点内容区域在图像中的位置，生成包含高频内容的重点网络教学视频信号，调用终端设备的显示接口显示输出所述重点网络教学视频信号。
一种电子设备，其特征在于，包括：

处理器；以及

存储器，所述存储器上存储有计算机可读指令，所述计算机可读指令被所述处理器执行时实现根据权利要求1至9中任一项所述的方法。
一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现根据权利要求1至9中任一项所述方法。