CN117033673A

CN117033673A - 一种基于人工智能的多媒体内容抽取系统

Info

Publication number: CN117033673A
Application number: CN202310555930.2A
Authority: CN
Inventors: 周志成; 林锦兴; 罗杰华; 黎世民
Original assignee: Guangzhou Bidi Data Technology Co ltd
Current assignee: Guangzhou Bidi Data Technology Co ltd
Priority date: 2023-05-16
Filing date: 2023-05-16
Publication date: 2023-11-10
Anticipated expiration: 2043-05-16
Also published as: CN117033673B

Abstract

本发明公开了一种基于人工智能的多媒体内容抽取系统，包括数据检索模块、抽取处理模块、推送解析模块和推送自选模块，本发明涉及内容抽取技术领域。该基于人工智能的多媒体内容抽取系统，通过将得到的字幕节点的时间差分别与预设的字幕间隔值进行比较，根据比较结果得到字幕间隔段，然后依据字幕间隔段得到抽取视频，避免了对整个视频的分析，不需要构建复杂的模型或特征向量，更不需要考虑复杂的语法规则，大大降低了抽取评价信息的复杂度，通过计算出每个字幕间隔段的难度系数，之后依据难度系数推送给目标学生，使得目标学生可以及时有效地获得想要的抽取视频，提高学生的复习效率，进一步提升用户的体验感。

Description

一种基于人工智能的多媒体内容抽取系统

技术领域

本发明涉及内容抽取技术领域，具体为一种基于人工智能的多媒体内容抽取系统。

背景技术

近年来随着互联网技术的发展，互联网在线教育也有了飞速的发展，通过智能互联实现教育资源共享、利用大数据分析推动教学效率提升。

在学生根据直播课程视频进行理论学习后，学生可能对直播课程内知识点的掌握程度还不够，需要对相关知识点进行复习，虽然目前的直播课程视频可以回放，但是学生不能准确的确定自己不掌握的知识点在直播回放视频中的位置，需要学生自行查找，但是在自行查找过程中，若是观看全部直播回放视频内容，学生不能针对自己的薄弱点进行针对性复习，而且浪费较多时间，若是通过调整直播回放视频的进度条，容易造成相关知识点的查询遗漏，不利于学生自身薄弱点的复习。

因而，如何结合人工智能技术进行多媒体内容抽取在互联网教育中属于重点研究内容，为此，我们提出一种基于人工智能的多媒体内容抽取系统，使得学生可以及时有效地获得想要的抽取视频，提高学生的复习效率，进一步提升用户的体验感。

发明内容

针对现有技术的不足，本发明提供了一种基于人工智能的多媒体内容抽取系统，解决了背景技术中所提出的问题。

为实现以上目的，本发明通过以下技术方案予以实现：一种基于人工智能的多媒体内容抽取系统，包括：

数据检索模块，用于在直播课程视频的所有弹幕和字幕中，根据目标学生输入关键词检索得到含有关键词的弹幕数据和字幕数据，之后获取含有关键词的弹幕数据和字幕数据在直播课程视频中的时间节点，并分别记作弹幕节点Di和字幕节点Zj，i＝1、2、...、n，表示含有关键词的弹幕数据有n个，j＝1、2、...、m，表示含有关键词的字幕数据有m个，随后将弹幕发布时间和字幕讲解时间发送至抽取处理模块；其中，关键词为直播课程中的知识点内容，弹幕数据表示在直播课程中，所有学生发出的提问内容，作为弹幕数据；弹幕数据在直播课程视频中的时间节点为学生发出提问内容的时间与自直播课程视频开始时间的时间差；字幕数据表示在直播课程中，通过语音转换文字技术将老师的讲解音频转为文字内容；字幕数据在直播课程视频中的时间节点为讲解音频转为文字内容后，该文字内容当前时间与自直播课程视频开始时间的时间差；

抽取处理模块，用于对所有字幕节点Zj进行从小到大排序，得到顺序单表，随后计算所有邻近的两组字幕节点Zj的时间差ZCj，并将所有时间差ZCj分别与预设的字幕间隔值ZC0进行比较，根据比较结果得到字幕间隔段，然后依据字幕间隔段得到抽取视频，同时将字幕间隔段和抽取视频发送至推送解析模块。

优选的，字幕间隔段的具体获取方式如下：

第一步、将所有字幕节点Zj按照从小到大的顺序进行排序，得到所有字幕节点Zj的顺序单表；

第二步、之后按照从前到后的顺序依次计算顺序单表内邻近的两组字幕节点Zj的差值，得到所有邻近的两组字幕节点Zj的时间差ZCj；

第三步、之后将所有时间差ZCj依次分别与预设的字幕间隔值ZC0进行比较，然后获取所有连续的ZCj≤ZC0的所有字幕节点Zj，并将一组连续的ZCj≤ZC0的所有字幕节点Zj划分为一个字幕间隔段，随后得到字幕节点Zj的若干个字幕间隔段。

优选的，抽取视频的具体获得方式为：在各个字幕间隔段中，获取Z_j，min和Z_j，max，之后根据Z_j，min和Z_j，max截取直播课程视频中对应时间节点的视频段，作为抽取视频；

其中，Z_j，min表示在一个连续的ZCj≤ZC0的所有字幕节点Zj中，值最小的Zj；Z_j，max表示在一个连续的ZCj≤ZC0的所有字幕节点Zj中，值最大的Zj。

优选的，一种基于人工智能的多媒体内容抽取系统还包括：

推送解析模块，用于在各个字幕间隔段中，获取Z_j，min和Z_j，max，并根据Z_j，min和Z_j，max计算各个字幕间隔段的时长，随后获取各个字幕间隔段内的弹幕数据的数量DSk与获取各个字幕间隔段内语句类型为问句的弹幕数据的数量WSk，并计算出其之间的比值Bk，随后通过计算DSk、WSk和Bk，得到每个字幕间隔段的难度系数Yk，并将难度系数传输至推送自选模块；

推送自选模块，用于目标学生自主选择抽取视频的推送方式，接着根据目标学生选择的推送方式依次将相应的抽取视频推送给目标学生，抽取视频的推送方式包括时间推送、正向难度推送和反向难度推送；

时间推送的具体方式为：

在各个字幕间隔段中，任意获取一个Zj，并将各个字幕间隔段中任意获取的Zj标记为Z_j，k，接着将所有字幕节点Zj_，k按照从小到大的顺序进行排序，得到时间推送表；

之后抽取处理模块获得的所有抽取视频，按照时间推送表内字幕间隔段从前到后的顺序依次将相应抽取视频推送给目标学生；

正向难度推送的具体方式为：

首先根据推送解析模块获取所有字幕间隔段的难度系数，并将其按照从小到大的顺序进行排序，得到正向难度推送表；

之后抽取处理模块获得的所有抽取视频，按照正向难度推送表内字幕间隔段从前到后的顺序依次将相应抽取视频推送给目标学生；

反向难度推送的具体方式为：

首先根据推送解析模块获取所有字幕间隔段的难度系数，并将其按照从大到小的顺序进行排序，得到正向难度推送表；

之后抽取处理模块获得的所有抽取视频，按照正向难度推送表内字幕间隔段从前到后的顺序依次将相应抽取视频推送给目标学生。

优选的，难度系数的具体计算方式如下：

步骤一、在各个连续的ZCj≤ZC0的所有字幕节点Zj中，获取Z_j，min和Z_j，max；

之后在各个字幕间隔段中，利用公式C＝Z_j，max-Z_j，min，得到各个字幕间隔段的时长Ck，k＝1、2、...、v，表示字幕间隔段的数量为v；

步骤二、在每个字幕间隔段中，获取弹幕节点Di位于相应字幕间隔段内的弹幕数据的数量DSk，接着对该字幕间隔段内的所有弹幕数据逐条导入预先训练的语句类型识别模型中，得到与每条弹幕数据对应的语句类型，随后获取语句类型为问句的弹幕数据的数量WSk；

之后通过Bk＝WSk/DSk，得到相应字幕间隔段中的问句弹幕数据数量与相应字幕间隔段中的所有弹幕数据数量的比值Bk；

步骤三、再通过Yk＝C1/Ck*Bk*β1+DSk/(DS1+DS1+...+DSv)*β2，得到每个字幕间隔段的难度系数Yk，其中β1和β2为预设比例系数。

有益效果

本发明提供了一种基于人工智能的多媒体内容抽取系统。与现有技术相比具备以下有益效果：

本发明通过数据检索模块获取含有关键词的弹幕数据和字幕数据，随后利用抽取处理模块计算顺序单表中邻近的两组字幕节点的时间差，并将所有字幕节点的时间差分别与预设的字幕间隔值进行比较，根据比较结果得到字幕间隔段，然后依据字幕间隔段得到抽取视频，避免了对整个视频的分析，不需要构建复杂的模型或特征向量，更不需要考虑复杂的语法规则，大大降低了抽取评价信息的复杂度；

本发明通过推送解析模块计算各个字幕间隔段的时长，并通过该字幕间隔段内的弹幕数据的数量与该字幕间隔段内语句类型为问句的弹幕数据的数量计算出其之间的比值，随后再计算出每个字幕间隔段的难度系数，之后依据难度系数推送给目标学生，使得目标学生可以及时有效地获得想要的抽取视频，提高学生的复习效率，进一步提升用户的体验感。

附图说明

图1为本发明的系统框图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参阅图1，本发明提供一种技术方案：一种基于人工智能的多媒体内容抽取系统，包括：

数据检索模块，用于在直播课程视频的所有弹幕和字幕中，根据目标学生输入关键词检索得到含有关键词的弹幕数据和字幕数据，之后获取含有关键词的弹幕数据和字幕数据在直播课程视频中的时间节点，并分别记作弹幕节点Di和字幕节点Zj，i＝1、2、...、n，表示含有关键词的弹幕数据有n个，j＝1、2、...、m，表示含有关键词的字幕数据有m个，随后将弹幕发布时间和字幕讲解时间发送至抽取处理模块；

其中，关键词为直播课程中的知识点内容，弹幕数据表示在直播课程中，所有学生发出的提问内容，作为弹幕数据；弹幕数据在直播课程视频中的时间节点为学生发出提问内容的时间与自直播课程视频开始时间的时间差；字幕数据表示在直播课程中，通过语音转换文字技术将老师的讲解音频转为文字内容；字幕数据在直播课程视频中的时间节点为讲解音频转为文字内容后，该文字内容当前时间与自直播课程视频开始时间的时间差；

抽取处理模块，用于对所有字幕节点Zj进行从小到大排序，得到顺序单表，随后计算所有邻近的两组字幕节点Zj的时间差ZCj，并将所有时间差ZCj分别与预设的字幕间隔值ZC0进行比较，根据比较结果得到字幕间隔段，然后依据字幕间隔段得到抽取视频，同时将字幕间隔段和抽取视频发送至推送解析模块；

字幕间隔段的具体获取方式如下：

第三步、之后将所有时间差ZCj依次分别与预设的字幕间隔值ZC0进行比较，然后获取所有连续的ZCj≤ZC0的所有字幕节点Zj，并将一组连续的ZCj≤ZC0的所有字幕节点Zj划分为一个字幕间隔段，随后得到字幕节点Zj的若干个字幕间隔段；

抽取视频的具体获得方式为：在各个字幕间隔段中，获取Z_j，min和Z_j，max，之后根据Z_j，min和Z_j，max截取直播课程视频中对应时间节点的视频段，作为抽取视频；

其中，Z_j，min表示在一个连续的ZCj≤ZC0的所有字幕节点Zj中，值最小的Zj；Z_j，max表示在一个连续的ZCj≤ZC0的所有字幕节点Zj中，值最大的Zj；

通过数据检索模块获取含有关键词的弹幕数据和字幕数据，随后利用抽取处理模块计算顺序单表中邻近的两组字幕节点的时间差，并将所有字幕节点的时间差分别与预设的字幕间隔值进行比较，根据比较结果得到字幕间隔段，然后依据字幕间隔段得到抽取视频，避免了对整个视频的分析，不需要构建复杂的模型或特征向量，更不需要考虑复杂的语法规则，大大降低了抽取评价信息的复杂度；

难度系数的具体计算方式如下：

通过自然语言处理技术提取出弹幕数据中的学生提问，方便弹幕数据的提取和定位；

步骤三、再通过Yk＝C1/Ck*Bk*β1+DSk/(DS1+DS1+...+DSv)*β2，得到每个字幕间隔段的难度系数Yk，其中β1和β2为预设比例系数；

通过推送解析模块计算各个字幕间隔段的时长，并通过该字幕间隔段内的弹幕数据的数量与该字幕间隔段内语句类型为问句的弹幕数据的数量计算出其之间的比值，随后再计算出每个字幕间隔段的难度系数，之后依据难度系数推送给目标学生，使得目标学生可以及时有效地获得想要的抽取视频，提高学生的复习效率，进一步提升用户的体验感；

时间推送的具体方式为：

该推送方式依据时间顺序对指定知识点内容的抽取视频进行推送，方便目标学生逐步学习相关知识点的内容，适用于对知识点内容不熟悉的学生选择使用，同时方便学生逐步复习；

正向难度推送的具体方式为：

该推送方式依据难度系数由低到高的顺序对指定知识点内容的抽取视频进行推送，方便目标学生巩固学习相关知识点中的简单内容，随后方便目标学生加强对相关知识点中复杂内容的学习；

反向难度推送的具体方式为：

该推送方式依据难度系数由高到低的顺序对指定知识点内容的抽取视频进行推送，方便目标学生在掌握相关知识点中简单内容的基础上，然后对相关知识点中的复杂内容进行反复加强学习。

同时本说明书中未作详细描述的内容均属于本领域技术人员公知的现有技术。

以上对本发明的一个实施例进行了详细说明，但内容仅为本发明的较佳实施例，不能被认为用于限定本发明的实施范围。凡依本发明申请范围所作的均等变化与改进等，均应仍归属于本发明的专利涵盖范围之内。

Claims

1.一种基于人工智能的多媒体内容抽取系统，其特征在于，包括：

2.根据权利要求1的一种基于人工智能的多媒体内容抽取系统，其特征在于，字幕间隔段的具体获取方式如下：

3.根据权利要求1的一种基于人工智能的多媒体内容抽取系统，其特征在于，抽取视频的具体获得方式为：在各个字幕间隔段中，获取Z_j，min和Z_j，max，之后根据Z_j，min和Z_j，max截取直播课程视频中对应时间节点的视频段，作为抽取视频；

4.根据权利要求3的一种基于人工智能的多媒体内容抽取系统，其特征在于，还包括：

推送自选模块，用于目标学生自主选择抽取视频的推送方式，接着根据目标学生选择的推送方式依次将相应的抽取视频推送给目标学生，抽取视频的推送方式如下：

时间推送方式：在各个字幕间隔段中，任意获取一个Zj，并将各个字幕间隔段中任意获取的Zj标记为Z_j，k，接着将所有字幕节点Zj_，k按照从小到大的顺序进行排序，得到时间推送表，之后抽取处理模块获得的所有抽取视频，按照时间推送表内字幕间隔段从前到后的顺序依次将相应抽取视频推送给目标学生；

正向难度推送方式：首先根据推送解析模块获取所有字幕间隔段的难度系数，并将其按照从小到大的顺序进行排序，得到正向难度推送表，之后抽取处理模块获得的所有抽取视频，按照正向难度推送表内字幕间隔段从前到后的顺序依次将相应抽取视频推送给目标学生；

反向难度推送方式：首先根据推送解析模块获取所有字幕间隔段的难度系数，并将其按照从大到小的顺序进行排序，得到正向难度推送表，之后抽取处理模块获得的所有抽取视频，按照正向难度推送表内字幕间隔段从前到后的顺序依次将相应抽取视频推送给目标学生。

5.根据权利要求4的一种基于人工智能的多媒体内容抽取系统，其特征在于，难度系数的具体计算方式如下：