CN109359201B - 多媒体教学资源的编码、存储方法及其设备 - Google Patents

多媒体教学资源的编码、存储方法及其设备 Download PDF

Info

Publication number
CN109359201B
CN109359201B CN201811196868.8A CN201811196868A CN109359201B CN 109359201 B CN109359201 B CN 109359201B CN 201811196868 A CN201811196868 A CN 201811196868A CN 109359201 B CN109359201 B CN 109359201B
Authority
CN
China
Prior art keywords
resource
coding
knowledge points
code
resources
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811196868.8A
Other languages
English (en)
Other versions
CN109359201A (zh
Inventor
张新华
颜懿
徐星
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Lancoo Technology Co ltd
Original Assignee
Zhejiang Lancoo Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Lancoo Technology Co ltd filed Critical Zhejiang Lancoo Technology Co ltd
Priority to CN201811196868.8A priority Critical patent/CN109359201B/zh
Publication of CN109359201A publication Critical patent/CN109359201A/zh
Application granted granted Critical
Publication of CN109359201B publication Critical patent/CN109359201B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及多媒体教学领域,公开了一种多媒体教学资源的编码、存储方法及其设备。本申请通过计算机对多媒体教学资源进行自动的内容识别,得到该资源包含的知识点,再根据这些知识点和资源本体的属性信息共同生成资源编码,可以自动为每一个多媒体教学资源设置一个能够体现其中内容类别的唯一性的编码,从而可以将海量的多媒体教学资源库统一分类,进而可以根据资源编码实现资源的不重复存储,以满足教学资源的管理与使用需求。

Description

多媒体教学资源的编码、存储方法及其设备
技术领域
本申请涉及多媒体教学领域,特别涉及多媒体教学资源的编码和存储技术。
背景技术
教学资源建设是教学信息化必不可少的主要部分,教学资源的共享、存储、调用等是最基本的功能。但是,在教学资源建设过程中,存在着诸多问题。如资源导入数据库时,计算机无法从内容上判断该资源是否已经存在,容易出现重复存储的现象。不同数据库之间的资源分类缺乏统一的标准和规划,资源分类混乱很难实现共享等等。因此如何将海量的多媒体教学资源库统一分类,实现不重复存储,以满足教学资源的管理与使用需求,成为当前亟待解决的问题。
发明内容
本申请的第一个目的在于能够自动为每一个多媒体教学资源设置一个能够体现其中内容类别的唯一性的编码,从而为进一步的应用打下基础。
本申请的第二个目的在于在内容的维度上实现多媒体教学资源的去重复,也就是能够以内容不重复的方式存储多媒体教学资源,从而节约存储空间,便于资源的管理。这里涉及到如何智能地识别出内容上的重复,而不仅仅是多媒体文件大小、格式等属性上的重复。
为了解决上述问题,本申请公开了一种多媒体教学资源的编码方法,包括:
获取一个多媒体教学资源;
对该资源的内容进行分析,得到该资源包含的知识点;
获取该资源本体的属性信息;
根据该知识点和该属性信息生成该唯一性的资源编码。
在一个优选例中,该资源编码包括本体编码和附属知识点编码;
该根据该知识点和该属性信息生成该唯一性的资源编码进一步包括:
获取该资源包含的知识点的知识点编码,将这些知识点编码的集合作为该附属知识点编码;
根据该资源包含的知识点确定该资源所属的类别,获取该类别的编码,结合根据该属性信息生成的编码,生成该本体编码。
在一个优选例中,该本体编码包括以下之一或其任意组合:
学科编码,学习阶段编码,水平级别编码,子学科编码,专题编码,资源类型编码,应用子库编码,资源格式编码,资源长度编码,序号编码。
在一个优选例中,该附属知识点编码包括一个或多个知识点编码,其中每个知识点编码包括以下之一或其任意组合:
学科编码,学习阶段编码,水平级别编码,子学科编码,专题编码,序号编码。
在一个优选例中,该本体编码包括学科编码,学习阶段编码,专题编码,子学科编码和水平级别编码;
该“根据该资源包含的知识点确定该资源所属的类别,获取该类别的编码”进一步包括:
对于有标题的资源,直接提取该标题中知识点作为主要知识点,将该主要知识点所属的专题的编码作为该资源的专题编码;对于无标题的资源,根据该资源中各知识点出现频率的高低、出现位置的前后、要求掌握的重要性确定一个或多个知识点作为主要知识点,根据主要知识点所属的专题获取专题编码;
根据该主要知识点所属的专题,根据预先设定的知识点分类标准中“学科->学习阶段->子学科->专题”的树形结构,获取该专题所属的子学科编码、学习阶段编码和学科编码;
根据该资源所属的大纲级别,分别统计该主要知识点在各水平级别中所占比例,取最高的比例作为该资源的水平级别。
在一个优选例中,该“对该资源进行分析,得到该资源包含的知识点”进一步包括:
提取该资源中包含的文本信息;
对该文本信息进行分句和分词,得到分割结果;
根据该分割结果与对应学科和学习阶段的知识点数据表中的知识点属性信息依次进行匹配,从而识别出该资源中属于该学科和学习阶段的所有知识点。
在一个优选例中,该识别出该资源中属于该学科和学习阶段的所有知识点之后,还包括:
根据不同学科的教学要求,结合知识点的难度级别、掌握要求和出现的频率,由难到易依次对所得到的知识点进行排序,保留排序在前的预定比例或预定数量的知识点作为该资源的主要知识点。
本申请还公开了一种多媒体教学资源的存储方法,包括:
根据该前文描述的多媒体教学资源的编码方法对多媒体教学资源进行编码;
根据该资源的编码确定该资源与已经被存储的多媒体教学资源是否有重复;
如果没有重复,保存该资源,否则不保存该资源。
在一个优选例中,该“根据该资源的编码确定该资源与已经被存储的多媒体教学资源是否有重复”进一步包括:
如果该资源作为第一资源与已经被存储的多媒体教学资源中的第二资源在本体编码上相同,则执行以下步骤:
计算该第一资源的主要知识点数量i和该第二资源的主要知识点数量j;
计算该第一和第二资源中相同的主要知识点数量z;
该第一和第二资源的内容相似度
Figure BDA0001828998520000041
如果该内容相似度大于预定门限,则判定资源重复;如果该内容显示度小于预定门限,则判定资源不重复;
其中,该本体编码是根据该资源包含的知识点所属类别和该资源本体的属性信息生成的;该主要知识点是根据预定的规则对一个资源中所有知识点进行排序后所保留的排序在前的部分知识点。
本申请还公开了一种设备,包括:
存储器,用于存储计算机可执行指令;以及,
处理器,用于在执行该计算机可执行指令时实现如前文描述的方法中的步骤。
本申请还公开了一种计算机可读存储介质,该计算机可读存储介质中存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现如前文描述的方法中的步骤。
本申请实施方式中,通过计算机对多媒体教学资源进行自动的内容识别,得到该资源包含的知识点,再根据这些知识点和资源本体的属性信息共同生成唯一性的资源编码,能够自动为每一个多媒体教学资源设置一个能够体现其中内容类别的唯一性的编码,从而可以将海量的多媒体教学资源库统一分类,为进一步的应用打下基础。
通过多媒体教学资源的编码确定资源是否有重复,如果两个资源的本体编码相同,就计算两个资源的主要知识点的相似度,以该相似度判断资源是否有重复,从而在内容的维度上实现多媒体教学资源的去重复,也就是能够以内容不重复的方式存储多媒体教学资源,从而节约存储空间,便于资源的管理。
本申请的说明书中记载了大量的技术特征,分布在各个技术方案中,如果要罗列出本申请所有可能的技术特征的组合(即技术方案)的话,会使得说明书过于冗长。为了避免这个问题,本申请上述发明内容中公开的各个技术特征、在下文各个实施方式和例子中公开的各技术特征、以及附图中公开的各个技术特征,都可以自由地互相组合,从而构成各种新的技术方案(这些技术方案均因视为在本说明书中已经记载),除非这种技术特征的组合在技术上是不可行的。例如,在一个例子中公开了特征A+B+C,在另一个例子中公开了特征A+B+D+E,而特征C和D是起到相同作用的等同技术手段,技术上只要择一使用即可,不可能同时采用,特征E技术上可以与特征C相组合,则,A+B+C+D的方案因技术不可行而应当不被视为已经记载,而A+B+C+E的方案应当视为已经被记载。
附图说明
图1是根据本申请第一实施方式的多媒体教学资源的编码方法流程示意图
图2是根据本申请第二实施方式的多媒体教学资源的存储方法流程示意图
图3是本申请一个实施例中资源编码特征示意图
图4是本申请一个实施例中资源去重流程示意图
图5是本申请一个实施例中通过分析资源本体的特征生成资源本体编码的示意图
具体实施方式
在以下的叙述中,为了使读者更好地理解本申请而提出了许多技术细节。但是,本领域的普通技术人员可以理解,即使没有这些技术细节和基于以下各实施方式的种种变化和修改,也可以实现本申请所要求保护的技术方案。
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请的实施方式作进一步地详细描述。
本申请的第一实施方式涉及一种多媒体教学资源的编码方法,其流程如图1所示,该方法包括以下步骤:
在步骤101中,获取一个多媒体教学资源。在一个实施例中,多媒体教学资源的形式可以是视频、音频、文本、网页、XML文件等形式。
此后进入步骤102,对资源的内容进行分析,得到该资源包含的知识点。
此后进入步骤103,获取资源本体的属性信息。在一个实施例中,属性信息包括文件的长度、格式、存储的位置、创建时间、最后修改时间、作者等等。
此后进入步骤104,根据知识点和属性信息生成唯一性的资源编码。在一个实施例中,资源编码包括本体编码和附属知识点编码,本步骤进一步包括:获取资源包含的知识点的知识点编码,将这些知识点编码的集合作为附属知识点编码;根据资源包含的知识点确定资源所属的类别,获取该类别的编码,结合根据属性信息生成的编码,生成本体编码。在一个实施例中,本体编码是根据资源本体的所有特征属性信息生成的。在另一个实施例中,本体编码是根据资源本体的部分特征属性信息生成的。
可选地,本体编码包括以下之一或其任意组合:学科编码,学习阶段编码,水平级别编码,子学科编码,专题编码,资源类型编码,应用子库编码,资源格式编码,资源长度编码,序号编码。
可选地,附属知识点编码包括一个或多个知识点编码(或者说,附属知识点编码是知识点编码的集合),其中每个知识点编码包括以下之一或其任意组合:学科编码,学习阶段编码,水平级别编码,子学科编码,专题编码,序号编码。
在一个实施例中,本体编码包括学科编码,学习阶段编码,专题编码,子学科编码和水平级别编码;本体编码通过以下方式生成:
对于有标题的资源,直接提取标题中知识点作为主要知识点,将该主要知识点所属的专题的编码作为该资源的专题编码;对于无标题的资源,根据该资源中各知识点出现频率的高低、出现位置的前后、要求掌握的重要性确定一个或多个知识点作为主要知识点,根据主要知识点所属的专题获取专题编码;
根据主要知识点所属的专题,根据预先设定的知识点分类标准中“学科->学习阶段->子学科->专题”的树形结构,获取该专题所属的子学科编码、学习阶段编码和学科编码;
根据资源所属的大纲级别,分别统计主要知识点在各水平级别中所占比例,取最高的比例作为资源的水平级别。
在一个实施例中,步骤102可以进一步包括:
提取资源中包含的文本信息;
对文本信息进行分句和分词,得到分割结果;
根据分割结果与对应学科和学习阶段的知识点数据表中的知识点属性信息依次进行匹配,从而识别出资源中属于该学科和学习阶段的所有知识点;
根据不同学科的教学要求,结合知识点的难度级别、掌握要求和出现的频率,由难到易依次对所得到的知识点进行排序,保留排序在前的预定比例或预定数量的知识点作为资源的主要知识点。
本申请的第二实施方式涉及一种多媒体教学资源的存储方法,包括:
步骤201中,根据第一实施方式所述的多媒体教学资源的编码方法对多媒体教学资源进行编码;
此后进入步骤202,根据资源的编码确定资源与资源库中已经被存储的多媒体教学资源是否有重复;如果没有重复则进入步骤203,将该资源保存到资源库中;如果有重复则进入步骤204,不保存该资源。
在一个实施例中,步骤204进一步包括以下步骤(其中,为叙述的方便,将打算加入资源库的资源称为第一资源,将资源库中已经有的资源称为第二资源):
判断第一资源的本体编码与第二资源的本体编码是否相同。
如果两者的本体编码不同,则认为第一资源和第二资源是不同的资源(即不重复)。
如果第一资源与第二资源在本体编码上相同,则计算第一资源的主要知识点数量i和第二资源的主要知识点数量j;计算第一和第二资源中相同的主要知识点数量z;第一和第二资源的内容相似度
Figure BDA0001828998520000081
如果内容相似度大于预定门限,则判定资源重复;如果内容相似度小于预定门限,则判定资源不重复;
其中,本体编码是根据资源包含的知识点所属类别和资源本体的属性信息生成的;主要知识点是根据预定的规则对一个资源中所有知识点进行排序后所保留的排序在前的部分知识点。
本申请的第三实施方式涉及一种多媒体教学资源的编码设备,包括:
资源获取模块,用于获取一个多媒体教学资源;
知识点分析模块,用于对所述资源的内容进行分析,得到该资源包含的知识点;
属性获取模块,用于获取所述资源本体的属性信息;
编码生成模块,用于根据所述知识点和所述属性信息生成所述唯一性的资源编码。
第三实施方式是与第一实施方式相对应的产品实施方式,这两个实施方式中的技术细节可以互用。
本申请的第四实施方式涉及一种多媒体教学资源的存储设备,包括:
根据第三实施方式所述的多媒体教学资源的编码设备,用于对多媒体教学资源进行编码;
重复检查的存储模块,用于根据所述资源的编码确定所述资源与已经被存储的多媒体教学资源是否有重复;如果没有重复,保存所述资源,否则不保存所述资源。
第四实施方式是与第二实施方式相对应的产品实施方式,这两个实施方式中的技术细节可以互用。
为了能够更好地理解本申请的技术方案,下面结合两个具体的例子来进行说明,这些例子中罗列的细节主要是为了便于理解,不作为对本申请保护范围的限制。
第一个实施例涉及多媒体教学资源编码方法,使计算机自动识别资源的内容特征信息,并根据信息特征统一规范性编码,自动生成资源编码。
资源编码特征如图3所示,由资源的本体编码A和附属知识点编码(B1、B2、B3……Bi)两部分编码组成。资源本体编码A是基本的编码,是根据资源本体的特征信息而编码,编码规则统一,长度固定。所述资源本体的特征信息包括资源存储的目录结构信息,以及资源的类型、格式、长度等资源本体的属性信息。该类信息可以实现资源在存储过程中自动匹配存储目录,方便用户根据不同应用场景获取不同类型的资源。一种资源本体编码规则如下:
资源本体编码A(17位)=学科(1)+学习阶段(1)+水平级别(1)+子学科(1)+专题(2)+资源类型(1)+应用子库(1)+资源格式(1)+资源长度(6)+序号编码(2)
Figure BDA0001828998520000101
Figure BDA0001828998520000111
所述附属知识点编码根据资源内容中的包含的知识点信息而编码,每个知识点用统一编码Bi表示(其中i是知识点的序号),多个知识点就有多个编码组(形成一个知识点编码的集合),因此,附属知识点的编码组成长度不固定。所述附属知识点,是指资源内容中包含的特定学科及学习阶段下的主要知识点信息。该类信息与用户所需要的信息有很强的关联性,例如教师针对具体某个科目、某个年级下具体的一个知识点制作课件,有利于对教学资源的语义查询和使用。一种知识点编码规则如下:
知识点编码Bi(8位)=学科(1位)+学习阶段(1位)+水平级别(1位)+子学科(1位)+专题(2位)+序号编码(2位)
Figure BDA0001828998520000112
资源编码过程中,各资源的信息通过计算机统一编码。由于不同的教学资源,相同的信息部分,生成的编码相同,不同的信息部分,生成的编码不同。同样不同资源所包含的知识点不同,因此附属知识点的编码也不同。总体而言,不同的资源,其整体的信息不同,因此,生成的资源编码也不同。
第二个实施例是将第一个实施例的资源编码技术应用到数字化教学资源库的构建,避免相同或高度相似资源的重复存储。该实施例由两部分组成,第一部分介绍本申请所设计的数字化教学资源库的存储结构,第二部分介绍导入资源后,计算机自动生成资源编码存入资源库的基本流程。
(一)构建教学资源库
数字化教学资源库主要由两部分内容组成:一、资源本体,指资源的具体内容信息,存储在对应类别的应用子库中,供用户直接调取使用;二、资源编码,是采用统一编码的方式存储资源的各类信息,资源编码存储在对应目录下的数据表中,方便资源的分类存储与语义检索。
1、构建资源本体的存储目录
分析各类教学资源的特征信息及应用用途,将多媒体教学资源分类建立多个应用子库,按不同学科(语文、数学等)、学习阶段(小学、初中等)的教学需求建立该学科及学习阶段下的应用子库,并在该应用子库下根据子学科(学科下的小类,如数学下的几何学、函数学等)的分类制定资源本体的存储目录。
资源存储目录如下:学科->学习阶段->应用子库->子学科
应用子库的详细分类如下:多媒体教材库、精品课件库、网络课程库、公共媒体库、应用案例库、知识点解析课件库、主题背景素材库、试题库。
2、构建资源编码存储数据表
在资源库中,根据资源的存储目录分类建表,即在某子学科下的每个专题建一个数据表,例如数学->高中->几何的存储目录下有2个专题,则对应2个专题建立2张数据表,用于存储属于该专题下的资源编码信息。资源编码数据表中存储信息如下:
数据表名称 数据表存储信息说明
资源编码表 存储资源本体编码、主要知识点编码、资源存储路径等信息
3、构建支持资源编码的基础数据表
整理各学科中的知识点信息以及教学资源的基础属性信息,统一编码规范,该类数据作为支持资源编码的底层数据存储在基础数据表中。
1)根据教学大纲要求,确定各学科的知识点范围及掌握要求,按照“学科->学习阶段->水平级别->子学科->专题”的树形目录结构整理知识点信息,按照知识点编码规则,统一对其编码,存入知识点数据表。
2)整理教学资源的基础属性信息,包括资源对应的应用子库、资源类型、资源格式等信息,统一对其编码,存入基础数据表。
将以上数据分别录入相应的基础信息数据表,数据表存储信息如下:
序号 基础数据表名称 基础数据表存储信息说明
1 知识点数据表 存储各学科知识点信息,包括各知识点编码,知识点名称等
2 学科数据表 存储学科信息,包括学科编码、学科名称等
3 学习阶段数据表 存储学习阶段信息,包括学习阶段编码、学习阶段名称等
4 水平级别数据表 存储水平级别信息,包括水平级别编码、水平级别名称等
5 子学科数据表 存储子学科信息,包括子学科编码、子学科名称等
6 专题数据表 存储专题信息,包括专题编码、专题名称等
7 资源类型数据表 存储资源类型信息,包括资源类型编码、资源类型名称等
8 应用子库数据表 存储应用子库信息,包括应用子库编码、应用子库名称等
9 资源格式数据表 存储资源格式信息,包括资源格式编码、资源格式名称等
本申请所设计的数字化教学资源库,对各类资源信息的存储结构进行标准化设计,既保证资源的去重存储,使数据存储空间达到最优,实现海量资源的有序管理,又能满足资源在应用过程中各类信息的快速读取。
(二)导入教学资源,计算机自动生成资源唯一性编码,存入教学资源库,具体实现步骤如下:
下面结合导入教学资源生成该资源唯一性编码的具体实施案例,详细说明计算机自动实现资源本体编码和附属知识点编码的方法,并根据编码对资源进行去重存储,保存该资源的唯一性编码。
首先,按不同的学科及学习阶段选择资料,由人工导入相应的应用子库,下面由计算机自动生成资源唯一性编码,生成资源编码的详细流程如图4所示。
在步骤401中,计算资源中包含的知识点信息。
根据教学大纲中规定的教学信息,自动识别出资源中包含该学科及学习阶段下的主要知识点信息;
1)计算机读取资源并提取其中包含的文本信息,文本先经过分句、分词,产生一系列分割后的字和词,将这些分割后的字、词与对应学科及学习阶段的知识点数据表中的知识点特征信息依次进行匹配,从而识别出资源中属于该学科及学习阶段的所有知识点信息。
2)根据不同学科的教学要求,结合知识点的难度级别->掌握要求->出现的频率,由难到易依次对以上知识点进行排序,保留一定比例的知识点作为该资源的主要知识点,保存为该资源的附属知识点编码(B1、B2、B3……Bi)。
在步骤402中,计算资源本体的特征信息。
根据资源中包含的主要知识点信息,分析其存储的目录信息,并计算资源本体的格式、长度等信息,获取资源本体的特征信息。通过分析资源本体的特征生成资源本体编码的一种方法如图5所示。
1)基于步骤401获取的主要知识点信息,分析该资源在教学应用中所属的专题、子学科、水平级别信息,详细流程如下:
Figure BDA0001828998520000151
专题:对于有标题的资源,直接提取标题中主要知识点所属的专题信息,判定为该资源的专题信息;对于无标题的资源,选择资源中出现频率高、位置靠前、要求重点掌握的主要知识点,提取知识点所属的专题信息,并判定为该资源的专题信息。
Figure BDA0001828998520000152
子学科,按照知识点分类标准中“学科->学习阶段->子学科->专题”的树形目录结构,已知专题信息可获取上一层级子学科的信息,即判定为该资源所属的子学科。
Figure BDA0001828998520000153
水平级别,即资源所属的大纲级别,分别统计主要知识点在各水平级别中所占比例,取最高比例为当前资源的水平级别。
2)获取资源本体的基本属性信息:
Figure BDA0001828998520000154
资源格式,根据资源实体文件的扩展名(例如:txt、lrc、doc、mp4……),确定该资源的格式类型。
Figure BDA0001828998520000155
资源类型,已知当前资源所属的应用子库,可通过应用子库获取该资源类型。
Figure BDA0001828998520000156
资源长度,包括资源中包含的主要知识点数量以及资源本体文件占用内存大小,可通过步骤401计算主要知识点数量,并将内存数据转换为固定长度的编码。
3)从数据表中获取学科、学习阶段、水平级别、专题、资源类型、应用子库资源格式、资源类型对应的编码,根据资源本体编码规则将以上信息按固定顺序组合,保存为资源本体编码A。
在步骤403中,根据资源中包含的知识点信息和资源属性信息生成资源编码。
将步骤401与步骤402中获取的资源本体编码A和附属知识点编码(B1、B2、B3……Bi)按顺序组合,保存为该资源编码。
将资源编码与数据库中的编码进行去重判定,保存资源的唯一性编码
在步骤404中,以资源本体信息去重为主,资源内容相似度去重为辅,判定该资源是否已在教学资源库中存在,通过比对去重,保存资源的唯一性编码,实现资源的去重存储,具体实现流程如下:
1)资源本体信息去重判定
将该资源本体编码与资源库中编码进行比对,判断数据库中是否存在相同的编码,若不存在,则通过去重处理,存储该资源至资源库,若存在,则进行下一步处理;
2)资源的内容相似度去重判定
对两个资源本体编码相同的资源,判定其资源内容是否相同,相似度计算方法如下:
计算资源1的主要知识点数量i,计算资源2的主要知识点数量j;
计算两个资源中相同的知识点数量z;
计算两个资源的内容相似度α=z/(i+j-z)。
若两个资源的内容相似度α≥85%,则判定资源重复,不对其存储;
若两个资源的内容相似度α<85%,则可判定该资源为非重复资源;
若两个资源本体编码相同但资源内容不同时,提取资源库中相同资源本体编码的序号位编码,对序号位编码递增处理,保存为待存入资源的序号位,更新资源编码。
3)将通过去重判定的资源存入数据库中,保存资源的唯一性编码,即该资源为在当前资源库中不存在相同的资源。
需要说明的是,本领域技术人员应当理解,上述设备的实施方式中所示的各模块的实现功能可参照前述多媒体教学资源的编码方法或存储方法的相关描述而理解。上述设备的实施方式中所示的各模块的功能可通过运行于处理器上的程序(可执行指令)而实现,也可通过具体的逻辑电路而实现。本申请实施例上述设备如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本申请各个实施例所述方法的全部或部分。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read OnlyMemory)、磁碟或者光盘等各种可以存储程序代码的介质。这样,本申请实施例不限制于任何特定的硬件和软件结合。
相应地,本申请实施例还提供了一种计算机存储介质,其中存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现本申请的各方法实施方式。
此外,本申请实施例还提供了一种设备,其中包括用于存储计算机可执行指令的存储器,以及,处理器;该处理器用于在执行该存储器中的计算机可执行指令时实现上述各方法实施方式中的步骤。
需要说明的是,在本专利的申请文件中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。本专利的申请文件中,如果提到根据某要素执行某行为,则是指至少根据该要素执行该行为的意思,其中包括了两种情况:仅根据该要素执行该行为、和根据该要素和其它要素执行该行为。多个、多次、多种等表达包括2个、2次、2种以及2个以上、2次以上、2种以上。
在本申请提及的所有文献都被认为是整体性地包括在本申请的公开内容中,以便在必要时可以作为修改的依据。此外应理解,在阅读了本申请的上述公开内容之后,本领域技术人员可以对本申请作各种改动或修改,这些等价形式同样落于本申请所要求保护的范围。

Claims (10)

1.一种多媒体教学资源的编码方法,其特征在于,包括:
获取一个多媒体教学资源;
对所述资源的内容进行分析,得到该资源包含的知识点;
获取所述资源本体的属性信息;
根据所述知识点和所述属性信息生成唯一性的资源编码,所述资源编码包括本体编码和附属知识点编码,其中,本步骤进一步包括以下子步骤:获取所述资源包含的知识点的知识点编码,将这些知识点编码的集合作为所述附属知识点编码;根据所述资源包含的知识点确定所述资源所属的类别,获取该类别的编码,结合根据所述属性信息生成的编码,生成所述本体编码。
2.如权利要求1所述的方法,其特征在于,所述本体编码包括以下之一或其任意组合:
学科编码,学习阶段编码,水平级别编码,子学科编码,专题编码,资源类型编码,应用子库编码,资源格式编码,资源长度编码,序号编码。
3.如权利要求1所述的方法,其特征在于,所述附属知识点编码包括一个或多个知识点编码,其中每个知识点编码包括以下之一或其任意组合:
学科编码,学习阶段编码,水平级别编码,子学科编码,专题编码,序号编码。
4.如权利要求2所述的方法,其特征在于,所述本体编码包括学科编码,学习阶段编码,专题编码,子学科编码和水平级别编码;
所述“根据所述资源包含的知识点确定所述资源所属的类别,获取该类别的编码”进一步包括:
对于有标题的资源,直接提取所述标题中知识点作为主要知识点,将该主要知识点所属的专题的编码作为该资源的专题编码;对于无标题的资源,根据该资源中各知识点出现频率的高低、出现位置的前后、要求掌握的重要性确定一个或多个知识点作为主要知识点,根据主要知识点所属的专题获取专题编码;
根据所述主要知识点所属的专题,根据预先设定的知识点分类标准中“学科->学习阶段->子学科->专题”的树形结构,获取该专题所属的子学科编码、学习阶段编码和学科编码;
根据所述资源所属的大纲级别,分别统计所述主要知识点在各水平级别中所占比例,取最高的比例作为所述资源的水平级别。
5.如权利要求1所述的方法,其特征在于,所述“对所述资源进行分析,得到该资源包含的知识点”进一步包括:
提取所述资源中包含的文本信息;
对所述文本信息进行分句和分词,得到分割结果;
根据所述分割结果与对应学科和学习阶段的知识点数据表中的知识点属性信息依次进行匹配,从而识别出所述资源中属于该学科和学习阶段的所有知识点。
6.如权利要求5所述的方法,其特征在于,所述识别出所述资源中属于该学科和学习阶段的所有知识点之后,还包括:
根据不同学科的教学要求,结合知识点的难度级别、掌握要求和出现的频率,由难到易依次对所得到的知识点进行排序,保留排序在前的预定比例或预定数量的知识点作为所述资源的主要知识点。
7.一种多媒体教学资源的存储方法,其特征在于,包括:
根据所述权利要求1至6中任意一项所述的多媒体教学资源的编码方法对多媒体教学资源进行编码;
根据所述资源的编码确定所述资源与已经被存储的多媒体教学资源是否有重复;
如果没有重复,保存所述资源,否则不保存所述资源。
8.如权利要求7所述的方法,其特征在于,所述“根据所述资源的编码确定所述资源与已经被存储的多媒体教学资源是否有重复”进一步包括:
如果所述资源作为第一资源与已经被存储的多媒体教学资源中的第二资源在本体编码上相同,则执行以下步骤:
计算所述第一资源的主要知识点数量i和所述第二资源的主要知识点数量j;
计算所述第一和第二资源中相同的主要知识点数量z;
计算所述第一和第二资源的内容相似度
Figure FDA0003054371230000031
如果所述内容相似度大于预定门限,则判定资源重复;如果所述内容显示度小于预定门限,则判定资源不重复;
其中,所述本体编码是根据所述资源包含的知识点所属类别和所述资源本体的属性信息生成的;所述主要知识点是根据预定的规则对一个资源中所有知识点进行排序后所保留的排序在前的部分知识点。
9.一种设备,其特征在于,包括:
存储器,用于存储计算机可执行指令;以及,
处理器,用于在执行所述计算机可执行指令时实现如权利要求1至8中任意一项所述的方法中的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机可执行指令,所述计算机可执行指令被处理器执行时实现如权利要求1至8中任意一项所述的方法中的步骤。
CN201811196868.8A 2018-10-15 2018-10-15 多媒体教学资源的编码、存储方法及其设备 Active CN109359201B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811196868.8A CN109359201B (zh) 2018-10-15 2018-10-15 多媒体教学资源的编码、存储方法及其设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811196868.8A CN109359201B (zh) 2018-10-15 2018-10-15 多媒体教学资源的编码、存储方法及其设备

Publications (2)

Publication Number Publication Date
CN109359201A CN109359201A (zh) 2019-02-19
CN109359201B true CN109359201B (zh) 2021-07-30

Family

ID=65349364

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811196868.8A Active CN109359201B (zh) 2018-10-15 2018-10-15 多媒体教学资源的编码、存储方法及其设备

Country Status (1)

Country Link
CN (1) CN109359201B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111054082B (zh) * 2019-11-29 2023-10-13 珠海金山数字网络科技有限公司 Unity资源数据集编码的方法
CN111209734A (zh) * 2020-01-13 2020-05-29 浙江蓝鸽科技有限公司 试题去重方法及其系统
CN111539383B (zh) * 2020-05-22 2023-05-05 浙江蓝鸽科技有限公司 公式知识点识别方法及装置
CN112820151A (zh) * 2021-01-13 2021-05-18 湖南汽车工程职业学院 思政教育用计算机多媒体教学系统、教学方法、终端、介质
CN112819669B (zh) * 2021-02-10 2024-05-28 联想(北京)有限公司 教学资源的处理方法及电子设备
CN113987083A (zh) * 2021-10-15 2022-01-28 中车青岛四方机车车辆股份有限公司 一种轨道车辆数据库系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102542859A (zh) * 2010-12-24 2012-07-04 沈阳博学教育课程编码学习法研发中心 课程编码学习方法、数字键盘输入设备及其学习系统
CN104063374A (zh) * 2013-03-18 2014-09-24 阿里巴巴集团控股有限公司 一种对数据进行去重的方法和设备
CN105184709A (zh) * 2015-08-20 2015-12-23 浙江通关教育科技有限公司 一种基于知识点体系的学科测评系统及方法
CN107832410A (zh) * 2017-11-03 2018-03-23 四川文轩教育科技有限公司 一种基于知识网络学习路径的推荐方法
CN108182177A (zh) * 2018-01-24 2018-06-19 谢德刚 一种数学试题知识点自动化标注方法和装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8165221B2 (en) * 2006-04-28 2012-04-24 Netapp, Inc. System and method for sampling based elimination of duplicate data
CN102135997A (zh) * 2011-03-23 2011-07-27 华中科技大学 一种基于本体的数字化学习资源的管理方法
CN202534180U (zh) * 2011-12-30 2012-11-14 安凯(广州)微电子技术有限公司 一种手持式自主学习机
CN103186643A (zh) * 2011-12-30 2013-07-03 安凯(广州)微电子技术有限公司 一种实现教学内容关联的自主学习方法、终端及系统
CN105279255A (zh) * 2015-10-13 2016-01-27 青岛英谷教育科技股份有限公司 一种知识技能依赖关系结构化教学资源的利用方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102542859A (zh) * 2010-12-24 2012-07-04 沈阳博学教育课程编码学习法研发中心 课程编码学习方法、数字键盘输入设备及其学习系统
CN104063374A (zh) * 2013-03-18 2014-09-24 阿里巴巴集团控股有限公司 一种对数据进行去重的方法和设备
CN105184709A (zh) * 2015-08-20 2015-12-23 浙江通关教育科技有限公司 一种基于知识点体系的学科测评系统及方法
CN107832410A (zh) * 2017-11-03 2018-03-23 四川文轩教育科技有限公司 一种基于知识网络学习路径的推荐方法
CN108182177A (zh) * 2018-01-24 2018-06-19 谢德刚 一种数学试题知识点自动化标注方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
信息论与编码课程教学中的新内容与新方法;赵晨;《电子技术》;20160630;第45卷(第6期);第35-37页 *

Also Published As

Publication number Publication date
CN109359201A (zh) 2019-02-19

Similar Documents

Publication Publication Date Title
CN109359201B (zh) 多媒体教学资源的编码、存储方法及其设备
US20170193393A1 (en) Automated Knowledge Graph Creation
KR101607468B1 (ko) 콘텐츠에 대한 키워드 태깅 방법 및 시스템
CN112434211B (zh) 一种数据处理方法、装置、存储介质及设备
CN111209734A (zh) 试题去重方法及其系统
Kim et al. A tweet summarization method based on a keyword graph
Neudecker et al. Large-scale refinement of digital historic newspapers with named entity recognition
CN114756733A (zh) 一种相似文档搜索方法、装置、电子设备及存储介质
KR102437201B1 (ko) 저작물 관리 방법 및 이러한 방법을 수행하는 장치
CN109815328B (zh) 一种摘要生成方法及装置
CN108345679B (zh) 一种音视频检索方法、装置、设备及可读存储介质
Soori et al. Text similarity based on data compression in Arabic
WO2013022384A1 (ru) Способ создания и использования рекурсивного индекса поисковых машин
CN109902148B (zh) 一种通讯录联系人的企业名称自动补全的方法
CN109803022B (zh) 一种数字化资源共享系统及其服务方法
Zeng et al. Using a semantic analysis tool to generate subject access points: A study using Panofsky’s theory and two research samples
CN111881695A (zh) 一种审计知识的检索方法及装置
CN111401047A (zh) 法律文书的争议焦点生成方法、装置及计算机设备
CN107943965B (zh) 相似文章检索方法及装置
JP2004240488A (ja) 文書管理装置
US20100211534A1 (en) Efficient computation of ontology affinity matrices
JPH0561910A (ja) 全文インデツクス検索方法
Mekhaldi Multimodal document alignment: towards a fully-indexed multimedia archive
JP2016035688A (ja) テキスト分析装置、テキスト分析方法、テキスト分析プログラムおよび記録媒体
Oard Known by the Company it Keeps: Proximity-Based Indexing for Physical Content in Archival Repositories

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant