CN112052304A - 课程标签确定方法、装置及电子设备 - Google Patents
课程标签确定方法、装置及电子设备 Download PDFInfo
- Publication number
- CN112052304A CN112052304A CN202010831770.6A CN202010831770A CN112052304A CN 112052304 A CN112052304 A CN 112052304A CN 202010831770 A CN202010831770 A CN 202010831770A CN 112052304 A CN112052304 A CN 112052304A
- Authority
- CN
- China
- Prior art keywords
- course
- target
- knowledge
- determining
- document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 238000003062 neural network model Methods 0.000 claims abstract description 22
- 238000012545 processing Methods 0.000 claims description 6
- 238000012216 screening Methods 0.000 claims description 6
- 238000005516 engineering process Methods 0.000 description 5
- 238000013473 artificial intelligence Methods 0.000 description 4
- 238000010276 construction Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 230000018109 developmental process Effects 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000005034 decoration Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000012800 visualization Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 238000010225 co-occurrence analysis Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 230000009849 deactivation Effects 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/313—Selection or weighting of terms for indexing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/38—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/383—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Library & Information Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请提供了一种课程标签确定方法、装置及电子设备,应用于知识图谱技术领域,其中该方法包括:获取目标课程文档;基于预训练的神经网络模型对目标课程文档进行识别,识别得到至少一个课程关键词;基于至少一个课程关键词与预构建的学科知识图谱确定目标课程文档的课程标签。即实现了课程标签的自动提取,此外,先通过预训练的神经网络模型识别得到目标课程文档中的课程关键词,然后通过预构建的学科知识图谱对该课程关键词进行扩展,得到目标课程文档的课程标签,从而该课程标签能全面的反映课程中包含的知识点,为后续的课程精准推荐提供了基础。
Description
技术领域
本申请涉及知识图谱技术领域,具体而言,本申请涉及一种课程标签确定方法、装置及电子设备。
背景技术
“智慧教育”是随着当今科学技术的不断发展,人工智能与教育领域相结合的一种新的教育形式。人工智能技术已经渗透到社会的各个方面。教育领域中,一场智能化的颠覆性变革正悄悄地发生着。人工智能将在教学方法、教学形式等方面全方位助力教育变革。方法上可以借助人机交互手段,使教学情景更生动鲜活;形式方面,教师不再面向所有学生开展“标准化教学”,而是根据人工智能和大数据系统提供的学生发展报告,对学生开展个性化指导,重点补足薄弱环节,发展自身优势。
现有的课程管理技术,依赖课程管理员人工的进行课程资料的上传与管理,课程管理员对课程资料做简单的分类,或打上有限的标签来描述课程的信息,粒度过粗,不能全面的反映课程中包含的知识点,并且由于这些工作大量依赖人工,时有打错标签或标注错课程分类的情况,这给后续的课程精准推荐造成了较大的障碍。
发明内容
本申请提供了一种课程标签确定方法、装置及电子设备,用于提升课程标签的准确性以及丰富性,进而为后续进行课程的推荐提供基础。本申请采用的技术方案如下:
第一方面,提供了一种课程标签确定方法,包括:
获取目标课程文档;
基于预训练的神经网络模型对目标课程文档进行识别,识别得到至少一个课程关键词;
基于至少一个课程关键词与预构建的学科知识图谱确定目标课程文档的课程标签。
可选地,课程标签包括课程所属领域、课程知识点。
可选地,基于所述至少一个课程关键词与预构建的学科知识图谱确定目标课程文档的课程标签,包括:
确定所述课程关键词与所述预构建的学科知识图谱中各实体的语义相似度;
基于语义相似度结果筛选得到至少一个实体,并基于各个实体的属性确定该实体为课程所属领域或者课程知识点。
可选地,该方法包括:
基于多个目标课程文档的课程标签构建目标知识图谱。
可选地,基于多个目标课程文档的课程标签构建目标知识图谱,包括:
基于所述多个目标课程文档的课程名称及课程标签确定实体及实体之间的关系;
基于实体及实体之间的关系构建目标知识图谱。
可选地,该方法还包括:
获取检索关键词,所述检索关键词包括课程名称、课程所属领域、课程知识点中的至少一种;
基于检索关键词通过构建的目标知识图谱确定至少一个目标课程;
将至少一个目标课程推荐给用户。
可选地,该方法还包括:
获取低级别学员已掌握知识点以及高级别学员所需掌握知识点;
基于低级别学员已掌握知识点以及高级别学员所需掌握知识点,确定所述低级别用户需要学习的知识点;
基于低级别用户需要学习的知识点通过所述构建的目标知识图谱确定至少一个目标课程;
将所述至少一个目标课程推荐给所述低级别学员。
可选地,该方法还包括:
获取目标课程视频或目标课程音频;
对目标课程视频或目标课程音频进行识别分析处理,得到目标课程文档。
第二方面,提供了一种课程标签确定装置,包括:
第一获取模块,用于获取目标课程文档;
识别模块,用于基于预训练的神经网络模型对目标课程文档进行识别,识别得到至少一个课程关键词;
第一确定模块,用于基于至少一个课程关键词与预构建的学科知识图谱确定目标课程文档的课程标签。
可选地,课程标签包括课程所属领域、课程知识点。
可选地,所述第一确定模块包括:
第一确定单元,用于确定所述课程关键词与所述预构建的学科知识图谱中各实体的语义相似度;
第二确定单元,用于基于语义相似度结果筛选得到至少一个实体,并基于各个实体的属性确定该实体为课程所属领域或者课程知识点。
可选地,该装置还包括:
构建模块,用于基于多个目标课程文档的课程标签构建目标知识图谱。
可选地,构建模块包括:
第三确定单元,用于基于所述多个目标课程文档的课程名称及课程标签确定实体及实体之间的关系;
构建单元,用于基于实体及实体之间的关系构建目标知识图谱。
可选地,该装置还包括:
第二获取模块,用于获取检索关键词,所述检索关键词包括课程名称、课程所属领域、课程知识点中的至少一种;
第二确定模块,用于基于检索关键词通过构建的目标知识图谱确定至少一个目标课程;
第一推荐模块,用于将至少一个目标课程推荐给用户。
可选地,该装置还包括:
第二获取模块,用于获取低级别学员已掌握知识点以及高级别学员所需掌握知识点;
第三确定模块,用于基于低级别学员已掌握知识点以及高级别学员所需掌握知识点,确定所述低级别用户需要学习的知识点;
第四确定模块,用于基于低级别用户需要学习的知识点通过所述构建的目标知识图谱确定至少一个目标课程;
第二推荐模块,用于将所述至少一个目标课程推荐给所述低级别学员。
可选地,该装置还包括:
第三获取模块,用于获取目标课程视频或目标课程音频;
识别模块,用于对目标课程视频或目标课程音频进行识别分析处理,得到目标课程文档。
第三方面,提供了一种电子设备,该电子设备包括:
一个或多个处理器;
存储器;
一个或多个应用程序,其中一个或多个应用程序被存储在存储器中并被配置为由一个或多个处理器执行,一个或多个程序配置用于:执行第一方面所示的课程标签确定方法。
第四方面,提供了一种计算机可读存储介质,计算机存储介质用于存储计算机指令,当其在计算机上运行时,使得计算机可以执行第一方面所示的课程标签确定方法。
本申请提供了一种课程标签确定方法、装置及电子设备,与现有技术人工确定课程的标签相比,本申请通过获取目标课程文档;基于预训练的神经网络模型对目标课程文档进行识别,识别得到至少一个课程关键词;基于至少一个课程关键词与预构建的学科知识图谱确定目标课程文档的课程标签。即实现了课程标签的自动提取,此外,先通过预训练的神经网络模型识别得到目标课程文档中的课程关键词,然后通过预构建的学科知识图谱对该课程关键词进行扩展,得到目标课程文档的课程标签,从而该课程标签能全面的反映课程中包含的知识点,为后续的课程精准推荐提供了基础。
本申请附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本申请实施例的一种课程标签确定方法的流程示意图;
图2为本申请实施例的另一种课程标签确定装置的结构示意图;
图3为本申请实施例的一种电子设备的结构示意图。
具体实施方式
下面详细描述本申请的实施例,各实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能解释为对本申请的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”和“该”也可包括复数形式。应该进一步理解的是,本申请的说明书中使用的措辞“包括”是指存在特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
实施例一
本申请实施例提供了一种课程标签确定方法,如图1所示,该方法可以包括以下步骤:
步骤S101,获取目标课程文档;
步骤S102,基于预训练的神经网络模型对目标课程文档进行识别,识别得到至少一个课程关键词;
步骤S103,基于至少一个课程关键词与预构建的学科知识图谱确定目标课程文档的课程标签。
具体地,可以获取目标课程文档,然后对目标课程文档进行分词、去停用词等处理,然后将处理后的文本输入至预训练的神经网络模型,进行识别分析,得到课程关键词。然后基于该课程关键词与预构建的学科知识图谱,得到目标课程文档的课程标签,其中课程标签包括课程的所属领域以及课程知识点,其中,课程所属领域可以为多个,课程知识点也可以包含多个。
其中,在预训练的神经网络模型的训练过程中,先准备领域业务词典,并利用智能算法在更大的空间进行相关性分析找到更多的相关词来扩展业务词典,增加预训练的神经网络模型在该领域的智慧能力,再使用自然语言处理算法,对课程文本做实体识别,抽取知识点类的实体。
其中,该训练可以是基于有监督的训练,通过多个文本及对应人工标注的关键词进行神经网络模型的训练。
示例性地,获取一个java基础学习课程文档,对该java课程文档进行识别得到课程关键词(java编程、面向对象),然后基于得到的课程关键词与预构建的学科知识图谱,得到课程标签,其中该课程标签为课程对应的知识点(JVM常识、java.sql、java.io等)。其中,学科知识图谱可以包含学科名称、学科知识点等实体,以及实体知识点之间的关系。
本申请实施例提供了一种课程标签确定方法,与现有技术人工确定课程的标签相比,本申请通过获取目标课程文档;基于预训练的神经网络模型对目标课程文档进行识别,识别得到至少一个课程关键词;基于至少一个课程关键词与预构建的学科知识图谱确定目标课程文档的课程标签。即实现了课程标签的自动提取,此外,先通过预训练的神经网络模型识别得到目标课程文档中的课程关键词,然后通过预构建的学科知识图谱对该课程关键词进行扩展,得到目标课程文档的课程标签,从而该课程标签能全面的反映课程中包含的知识点,为后续的课程精准推荐提供了基础。
本申请实施例提供了一种可能的实现方式,具体地,基于所述至少一个课程关键词与预构建的学科知识图谱确定目标课程文档的课程标签,包括:
确定所述课程关键词与所述预构建的学科知识图谱中各实体的语义相似度;
基于语义相似度结果筛选得到至少一个实体,并基于各个实体的属性确定该实体为课程所属领域或者课程知识点。
具体地,预构建的学科知识图谱包括学科所述领域、学科知识点等实体,以及实体之间的关系,通过课程关键词与预构建的学科知识图谱的各个实体的语义相似度,如果语义相似度在预定的阈值范围内,则将该相应实体作为扩展关键词,并基于该扩展关键词实体对应的属性确定该实体为课程所属领域、课程知识点。其中,课程所属领域、课程知识点分别可以为多个,即一个课程文档可以属于多个领域,包含多个知识点。
本申请实施例提供了一种可能的实现方式,进一步地,该方法包括:
基于多个目标课程文档的课程标签构建目标知识图谱。
其中,知识图谱(Knowledge Graph),在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。知识图谱是通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论。它能为学科研究提供切实的、有价值的参考。
具体地,基于多个目标课程文档的课程标签构建目标知识图谱,包括:
基于所述多个目标课程文档的课程名称及课程标签确定实体及实体之间的关系;其中,可以将课程名称、课程所属领域、课程知识点分别作为实体,然后基于实体及实体之间的关系构建目标知识图谱。
对于本申请实施例,将产生的知识点(课程及其课程标签)进行图谱化,为后续与学员的个性化学习诉求相结合提供基础,进而能精准的将学员与课程匹配起来。
本申请实施例,提供了一种可能的实现方式,进一步地,该方法还包括:
获取检索关键词,所述检索关键词包括课程名称、课程所属领域、课程知识点中的至少一种;
基于检索关键词通过构建的目标知识图谱确定至少一个目标课程;
将至少一个目标课程推荐给用户。
具体地,用户可以通过终端设备输入检索关键词,其中该检索关键词可以是输入的文本,也可以是语音,然后对该语音进行识别得到文本检索关键词;然后基于检索关键词通过构建的目标知识图谱确定目标课程,将至少一个目标课程推荐给用户。
本申请的又一个应用场景,获取用户的知识点掌握情况,然后基于用户的知识点掌握情况,进行课程与学员的精准匹配。具体地,获取低级别学员已掌握知识点以及高级别学员所需掌握知识点;
基于低级别学员已掌握知识点以及高级别学员所需掌握知识点,确定所述低级别用户需要学习的知识点;
基于低级别用户需要学习的知识点通过所述构建的目标知识图谱确定至少一个目标课程;
将所述至少一个目标课程推荐给所述低级别学员。
具体地,作为一种可能的实现方式,获取用户已掌握知识点,以及该用户的执业规划路线;基于该用户的执业规划路线,确定用户所需要掌握的知识点;然后基于用户已经掌握的知识点以及用户需要掌握的知识点确定用户需要学习的知识点,基于用户需要学习的知识点通过所述构建的目标知识图谱确定至少一个目标课程;将所述至少一个目标课程推荐给该用户。
本申请实施例提供了一种可能的实现方式,进一步地,该方法还包括:
获取目标课程视频或目标课程音频;
对目标课程视频或目标课程音频进行识别分析处理,得到目标课程文档。
具体地,获取目标课程视频或目标课程音频,其中,目标课程视频或目标课程音频为相关教学课程视频或音频;如果是音频可以通过语音识别技术,对相关音频进行语音识别得到该教学音频对应的课程文档;如果是视频,可以先对该视频进行处理,抽取得到相应的音频,然后对相关音频进行语音识别得到该音频对应的课程文档。
对于本申请实施例,解决了如何根据视频或音频得到课程文档的问题。
实施例二
图2为本申请实施例提供的课程标签确定装置,包括:
第一获取模块,用于获取目标课程文档;
识别模块,用于基于预训练的神经网络模型对目标课程文档进行识别,识别得到至少一个课程关键词;
第一确定模块,用于基于至少一个课程关键词与预构建的学科知识图谱确定目标课程文档的课程标签。
可选地,课程标签包括课程所属领域、课程知识点。
可选地,所述第一确定模块包括:
第一确定单元,用于确定所述课程关键词与所述预构建的学科知识图谱中各实体的语义相似度;
第二确定单元,用于基于语义相似度结果筛选得到至少一个实体,并基于各个实体的属性确定该实体为课程所属领域或者课程知识点。
可选地,该装置还包括:
构建模块,用于基于多个目标课程文档的课程标签构建目标知识图谱。
可选地,构建模块包括:
第三确定单元,用于基于所述多个目标课程文档的课程名称及课程标签确定实体及实体之间的关系;
构建单元,用于基于实体及实体之间的关系构建目标知识图谱。
可选地,该装置还包括:
第二获取模块,用于获取检索关键词,所述检索关键词包括课程名称、课程所属领域、课程知识点中的至少一种;
第二确定模块,用于基于检索关键词通过构建的目标知识图谱确定至少一个目标课程;
推荐模块,用于将至少一个目标课程推荐给用户。
可选地,该装置还包括:
第二获取模块,用于获取低级别学员已掌握知识点以及高级别学员所需掌握知识点;
第三确定模块,用于基于低级别学员已掌握知识点以及高级别学员所需掌握知识点,确定所述低级别用户需要学习的知识点;
第四确定模块,用于基于低级别用户需要学习的知识点通过所述构建的目标知识图谱确定至少一个目标课程;
第二推荐模块,用于将所述至少一个目标课程推荐给所述低级别学员。
可选地,该装置还包括:
第三获取模块,用于获取目标课程视频或目标课程音频;
识别模块,用于对目标课程视频或目标课程音频进行识别分析处理,得到目标课程文档。
本申请实施例,提供了一种课程标签确定装置,与现有技术人工确定课程的标签相比,本申请通过获取目标课程文档;基于预训练的神经网络模型对目标课程文档进行识别,识别得到至少一个课程关键词;基于至少一个课程关键词与预构建的学科知识图谱确定目标课程文档的课程标签。即实现了课程标签的自动提取,此外,先通过预训练的神经网络模型识别得到目标课程文档中的课程关键词,然后通过预构建的学科知识图谱对该课程关键词进行扩展,得到目标课程文档的课程标签,从而该课程标签能全面的反映课程中包含的知识点,为后续的课程精准推荐提供了基础。
本申请实施例的课程标签确定装置的有益效果与实施例一所示的课程标签确定方法相似,在此不再赘述。
实施例三
本申请实施例提供了一种电子设备,如图3所示,图3所示的电子设备30包括:处理器301和存储器303。其中,处理器301和存储器303相连,如通过总线302相连。进一步地,电子设备30还可以包括收发器304。需要说明的是,实际应用中收发器303不限于一个,该电子设备30的结构并不构成对本申请实施例的限定。其中,处理器301应用于本申请实施例中,用于实现图2所示模块的功能。收发器303包括接收机和发射机。
处理器301可以是CPU,通用处理器,DSP,ASIC,FPGA或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器301也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等。
总线302可包括一通路,在上述组件之间传送信息。总线302可以是PCI总线或EISA总线等。总线302可以分为地址总线、数据总线、控制总线等。为便于表示,图3中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
存储器303可以是ROM或可存储静态信息和指令的其他类型的静态存储设备,RAM或者可存储信息和指令的其他类型的动态存储设备,也可以是EEPROM、CD-ROM或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。
存储器303用于存储执行本申请方案的应用程序代码,并由处理器301来控制执行。处理器301用于执行存储器303中存储的应用程序代码,以实现图2所示实施例提供的课程标签确定装置的功能。
本申请实施例提供了一种电子设备,与现有技术人工确定课程的标签相比,本申请通过获取目标课程文档;基于预训练的神经网络模型对目标课程文档进行识别,识别得到至少一个课程关键词;基于至少一个课程关键词与预构建的学科知识图谱确定目标课程文档的课程标签。即实现了课程标签的自动提取,此外,先通过预训练的神经网络模型识别得到目标课程文档中的课程关键词,然后通过预构建的学科知识图谱对该课程关键词进行扩展,得到目标课程文档的课程标签,从而该课程标签能全面的反映课程中包含的知识点,为后续的课程精准推荐提供了基础。
本申请实施例提供了一种电子设备适用于上述方法实施例。在此不再赘述。
实施四
本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现上述实施例中所示的方法。
本申请实施例提供了一种计算机可读存储介质,与现有技术人工确定课程的标签相比,本申请通过获取目标课程文档;基于预训练的神经网络模型对目标课程文档进行识别,识别得到至少一个课程关键词;基于至少一个课程关键词与预构建的学科知识图谱确定目标课程文档的课程标签。即实现了课程标签的自动提取,此外,先通过预训练的神经网络模型识别得到目标课程文档中的课程关键词,然后通过预构建的学科知识图谱对该课程关键词进行扩展,得到目标课程文档的课程标签,从而该课程标签能全面的反映课程中包含的知识点,为后续的课程精准推荐提供了基础。
本申请实施例提供了一种计算机可读存储介质适用于上述方法实施例。在此不再赘述。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
以上仅是本申请的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
Claims (13)
1.一种课程标签确定方法,其特征在于,包括:
获取目标课程文档;
基于预训练的神经网络模型对所述目标课程文档进行识别,识别得到至少一个课程关键词;
基于所述至少一个课程关键词与预构建的学科知识图谱确定目标课程文档的课程标签。
2.根据权利要求1所述的方法,其特征在于,所述课程标签包括课程所属领域、课程知识点。
3.根据权利要求2所述的方法,其特征在于,基于所述至少一个课程关键词与预构建的学科知识图谱确定目标课程文档的课程标签,包括:
确定所述课程关键词与所述预构建的学科知识图谱中各实体的语义相似度;
基于语义相似度结果筛选得到至少一个实体,并基于各个实体的属性确定该实体为课程所属领域或者课程知识点。
4.根据权利要求2所述的方法,其特征在于,该方法包括:
基于多个目标课程文档的课程标签构建目标知识图谱。
5.根据权利要求4所述的方法,其特征在于,基于多个目标课程文档的课程标签构建目标知识图谱,包括:
基于所述多个目标课程文档的课程名称及课程标签确定实体及实体之间的关系;
基于实体及实体之间的关系构建目标知识图谱。
6.根据权利要求4所述的方法,其特征在于,该方法还包括:
获取检索关键词,所述检索关键词包括课程名称、课程所属领域、课程知识点中的至少一种;
基于所述检索关键词通过构建的目标知识图谱确定至少一个目标课程;
将所述至少一个目标课程推荐给用户。
7.根据权利要求4所述的方法,其特征在于,该方法还包括:
获取低级别学员已掌握知识点以及高级别学员所需掌握知识点;
基于低级别学员已掌握知识点以及高级别学员所需掌握知识点,确定所述低级别用户需要学习的知识点;
基于低级别用户需要学习的知识点通过所述构建的目标知识图谱确定至少一个目标课程;
将所述至少一个目标课程推荐给所述低级别学员。
8.根据权利要求1所述的方法,其特征在于,该方法还包括:
获取目标课程视频或目标课程音频;
对所述目标课程视频或目标课程音频进行识别分析处理,得到目标课程文档。
9.一种课程标签确定装置,其特征在于,包括:
第一获取模块,用于获取目标课程文档;
识别模块,用于基于预训练的神经网络模型对所述目标课程文档进行识别,识别得到至少一个课程关键词;
第一确定模块,用于基于所述至少一个课程关键词与预构建的学科知识图谱确定目标课程文档的课程标签。
10.根据权利要求9所述的装置,其特征在于,所述课程标签包括课程所属领域、知识点。
11.根据权利要求10所述的装置,其特征在于,所述第一确定模块包括:
第一确定单元,用于确定所述课程关键词与所述预构建的学科知识图谱中各实体的语义相似度;
第二确定单元,用于基于语义相似度结果筛选得到至少一个实体,并基于各个实体的属性确定该实体为课程所属领域或者课程知识点。
12.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储器;
一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于:执行根据权利要求1至8任一项所述的课程标签确定方法。
13.一种计算机可读存储介质,其特征在于,所述计算机存储介质用于存储计算机指令,当其在计算机上运行时,使得计算机可以执行上述权利要求1至8中任一项所述的课程标签确定方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010831770.6A CN112052304A (zh) | 2020-08-18 | 2020-08-18 | 课程标签确定方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010831770.6A CN112052304A (zh) | 2020-08-18 | 2020-08-18 | 课程标签确定方法、装置及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112052304A true CN112052304A (zh) | 2020-12-08 |
Family
ID=73600505
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010831770.6A Pending CN112052304A (zh) | 2020-08-18 | 2020-08-18 | 课程标签确定方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112052304A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112395432A (zh) * | 2021-01-19 | 2021-02-23 | 平安科技(深圳)有限公司 | 课程推送方法、装置、计算机设备及存储介质 |
CN112714271A (zh) * | 2021-03-24 | 2021-04-27 | 南京奥派信息产业股份公司 | 一种辅助教学视频处理技术系统及方法 |
CN113468339A (zh) * | 2021-06-24 | 2021-10-01 | 北京明略软件系统有限公司 | 基于知识图谱的标签提取方法、系统、电子设备及介质 |
CN113886606A (zh) * | 2021-12-08 | 2022-01-04 | 北京海致星图科技有限公司 | 一种基于知识图谱的数据标注方法、装置、介质及设备 |
CN116630543A (zh) * | 2023-05-25 | 2023-08-22 | 上海粟芯新能源科技有限公司 | 基于bs架构的三维实景一站式处理平台 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104090955A (zh) * | 2014-07-07 | 2014-10-08 | 科大讯飞股份有限公司 | 一种音视频标签自动标注方法及系统 |
US20180061256A1 (en) * | 2016-01-25 | 2018-03-01 | Wespeke, Inc. | Automated digital media content extraction for digital lesson generation |
CN110928986A (zh) * | 2019-10-18 | 2020-03-27 | 平安科技(深圳)有限公司 | 法律证据的排序和推荐方法、装置、设备及存储介质 |
CN111274411A (zh) * | 2020-01-22 | 2020-06-12 | 文思海辉智科科技有限公司 | 课程推荐方法、装置、电子设备及可读存储介质 |
-
2020
- 2020-08-18 CN CN202010831770.6A patent/CN112052304A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104090955A (zh) * | 2014-07-07 | 2014-10-08 | 科大讯飞股份有限公司 | 一种音视频标签自动标注方法及系统 |
US20180061256A1 (en) * | 2016-01-25 | 2018-03-01 | Wespeke, Inc. | Automated digital media content extraction for digital lesson generation |
CN110928986A (zh) * | 2019-10-18 | 2020-03-27 | 平安科技(深圳)有限公司 | 法律证据的排序和推荐方法、装置、设备及存储介质 |
CN111274411A (zh) * | 2020-01-22 | 2020-06-12 | 文思海辉智科科技有限公司 | 课程推荐方法、装置、电子设备及可读存储介质 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112395432A (zh) * | 2021-01-19 | 2021-02-23 | 平安科技(深圳)有限公司 | 课程推送方法、装置、计算机设备及存储介质 |
CN112714271A (zh) * | 2021-03-24 | 2021-04-27 | 南京奥派信息产业股份公司 | 一种辅助教学视频处理技术系统及方法 |
CN113468339A (zh) * | 2021-06-24 | 2021-10-01 | 北京明略软件系统有限公司 | 基于知识图谱的标签提取方法、系统、电子设备及介质 |
CN113886606A (zh) * | 2021-12-08 | 2022-01-04 | 北京海致星图科技有限公司 | 一种基于知识图谱的数据标注方法、装置、介质及设备 |
CN116630543A (zh) * | 2023-05-25 | 2023-08-22 | 上海粟芯新能源科技有限公司 | 基于bs架构的三维实景一站式处理平台 |
CN116630543B (zh) * | 2023-05-25 | 2024-03-08 | 上海粟芯新能源科技有限公司 | 基于bs架构的三维实景一站式处理平台 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107679039B (zh) | 用于确定语句意图的方法和装置 | |
CN112052304A (zh) | 课程标签确定方法、装置及电子设备 | |
US20170193393A1 (en) | Automated Knowledge Graph Creation | |
US20170329755A1 (en) | Method and apparatus and computer device for automatic semantic annotation for an image | |
CN111475629A (zh) | 一种面向数学辅导问答系统的知识图谱构建方法及其系统 | |
CN111263238B (zh) | 基于人工智能的生成视频评论的方法及设备 | |
CN113590776B (zh) | 基于知识图谱的文本处理方法、装置、电子设备及介质 | |
CN111539197A (zh) | 文本匹配方法和装置以及计算机系统和可读存储介质 | |
CN110096576B (zh) | 自动分割文本的方法、系统和存储介质 | |
CN113627797B (zh) | 入职员工画像生成方法、装置、计算机设备及存储介质 | |
CN111177399A (zh) | 一种知识图谱构建方法和装置 | |
CN112163097A (zh) | 一种军事知识图谱构建方法及系统 | |
EP3929800A1 (en) | Skill word evaluation method and device, electronic device, and computer readable medium | |
US20230008897A1 (en) | Information search method and device, electronic device, and storage medium | |
CN111143517B (zh) | 人选标签预测方法、装置、设备和存储介质 | |
CN110888989A (zh) | 一种智能学习平台及其构建方法 | |
Salahli et al. | Concept Based Approach for Adaptive Personalized Course Learning System. | |
CN116245097A (zh) | 训练实体识别模型的方法、实体识别方法及对应装置 | |
CN112052332A (zh) | 检索方法、装置、电子设备及可读存储介质 | |
CN115878818B (zh) | 一种地理知识图谱构建方法、装置、终端及存储介质 | |
CN116719915A (zh) | 智能问答方法、装置、设备及存储介质 | |
CN112347150B (zh) | 一种学者学术标签标注方法、装置和电子设备 | |
CN114862141A (zh) | 基于画像关联性的课程推荐方法、装置、设备及存储介质 | |
CN114896353A (zh) | 一种地理编码方法、存储介质及系统 | |
CN112818099B (zh) | 基于多粒度分词的应用题解答处理方法、系统和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20220926 Address after: 25 Financial Street, Xicheng District, Beijing 100033 Applicant after: CHINA CONSTRUCTION BANK Corp. Address before: 25 Financial Street, Xicheng District, Beijing 100033 Applicant before: CHINA CONSTRUCTION BANK Corp. Applicant before: Jianxin Financial Science and Technology Co.,Ltd. |