CN113220906A - 建立知识图谱的方法、装置、存储介质及电子设备 - Google Patents

建立知识图谱的方法、装置、存储介质及电子设备 Download PDF

Info

Publication number
CN113220906A
CN113220906A CN202110590701.5A CN202110590701A CN113220906A CN 113220906 A CN113220906 A CN 113220906A CN 202110590701 A CN202110590701 A CN 202110590701A CN 113220906 A CN113220906 A CN 113220906A
Authority
CN
China
Prior art keywords
data
knowledge point
point data
knowledge
types
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202110590701.5A
Other languages
English (en)
Inventor
母德宝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Dami Technology Co Ltd
Original Assignee
Beijing Dami Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Dami Technology Co Ltd filed Critical Beijing Dami Technology Co Ltd
Priority to CN202110590701.5A priority Critical patent/CN113220906A/zh
Publication of CN113220906A publication Critical patent/CN113220906A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • G06Q50/205Education administration or guidance
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B5/00Electrically-operated educational appliances
    • G09B5/08Electrically-operated educational appliances providing for individual presentation of information to a plurality of student stations

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Educational Technology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Educational Administration (AREA)
  • Tourism & Hospitality (AREA)
  • Artificial Intelligence (AREA)
  • Strategic Management (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例公开了一种建立知识图谱的方法、装置、存储介质及电子设备,涉及在线教育领域,方法包括:获取多个课程数据,基于多个预设的基础类型获取多个课程数据中的N个知识点数据;预设的基础类型至少包括下列类型中的一个:单词类型、短语类型、句型类型,N为大于1的整数;基于数据库检索N个知识点数据之间是否具有至少一种关联关系,在具有目标关联关系的知识点数据之间添加目标关联关系对应的目标关联;目标关联关系为至少一种关联关系中的任意一种;基于添加了目标关联的知识点数据建立针对多个课程数据的知识图谱。采用本申请实施例,可以基于多个课程数据构建知识图谱,进而更好地体现多个课程数据之间的关联关系。

Description

建立知识图谱的方法、装置、存储介质及电子设备
技术领域
本申请涉及在线教育领域,尤其涉及一种建立知识图谱的方法、装置、存储介质及电子设备。
背景技术
现有技术中,通常通过标签体系构建一个课程的知识体系。举例来说,将一本英语书的学习内容作为一个课程的学习内容,利用学术标签构建该课程知识体系的方法为:用户手动将英语书中的单词和短语等数据上传到电子设备,通过电子设备的输入设备为所有的单词数据选择“单词”标签,以及为所有的短语数据选择“短语”标签;进一步的,用户将单词数据划分为名词数据、动词数据、形容词数据等,并为名词数据选择“名词”标签,换而言之,此时名字数据包括“单词”和“名词”标签。因此,标签体系为树状结构,可以体现该课程中各基础数据之间的层级关系,通过标签体系可以构建课程的树状知识体系。
但现有技术需要用户手动为数据选择标签,以及需要无法体现各个标签对应的数据之间的关联关系。例如具有“名词”标签的名词数据“happy”与具有“形容词”标签的形容词数据“happily”之间具有关联关系,但现有技术中的标签体系无法体现上述关联关系。
发明内容
本申请实施例提供了一种建立知识图谱的方法、装置、存储介质及电子设备,可以基于多个课程数据构建知识图谱,进而更好地体现多个课程数据之间的关联关系。所述技术方案如下:
第一方面,本申请实施例提供了一种建立知识图谱的方法,所述方法包括:
获取多个课程数据,基于多个预设的基础类型获取所述多个课程数据中的N个知识点数据;所述预设的基础类型至少包括下列类型中的一个:单词类型、短语类型、句型类型,N为大于1的整数;
基于数据库检索所述N个知识点数据之间是否具有至少一种关联关系,在具有目标关联关系的知识点数据之间添加所述目标关联关系对应的目标关联;所述目标关联关系为所述至少一种关联关系中的任意一种;
基于添加了所述目标关联的知识点数据建立针对所述多个课程数据的知识图谱。
第二方面,本申请实施例提供了一种建立知识图谱的装置,所述装置包括:
获取数据模块,用于获取多个课程数据,基于多个预设的基础类型获取所述多个课程数据中的N个知识点数据;所述预设的基础类型至少包括下列类型中的一个:单词类型、短语类型、句型类型,N为大于1的整数;
关联关系模块,用于基于数据库检索所述N个知识点数据之间是否具有至少一种关联关系,在具有目标关联关系的知识点数据之间添加所述目标关联关系对应的目标关联;所述目标关联关系为所述至少一种关联关系中的任意一种;
建立图谱模块,用于基于添加了所述目标关联的知识点数据建立针对所述多个课程数据的知识图谱。
第三方面,本申请实施例提供一种计算机存储介质,所述计算机存储介质存储有多条指令,所述指令适于由处理器加载并执行上述的方法步骤。
第四方面,本申请实施例提供一种电子设备,可包括:处理器和存储器;其中,所述存储器存储有计算机程序,所述计算机程序适于由所述处理器加载并执行上述的方法步骤。
本申请一些实施例提供的技术方案带来的有益效果至少包括:
本申请通过获取多个课程数据中N个知识点数据,将具有目标关联关系的知识点数据之间添加目标关联关系对应的目标关联,进一步基于添加了目标关联的知识点数据建立针对知识图谱,该知识图谱可以将多个课程数据中的N个知识点数据的关联关系进行展示,不仅可以体现层级关系,还能展示诸如时态变化、词根词缀等复杂关系,有利于用户利用该知识图谱更好地掌握知识点。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种建立知识图谱的方法的流程示意图;
图2是本申请实施例提供的一种对多个课程数据进行处理的结构示意图;
图3是本申请实施例提供的一种知识图谱的结构示意图;
图4是本申请实施例提供的另一种建立知识图谱的方法的流程示意图;
图5是本申请实施例提供的一种用户获取知识图谱的界面示意图;
图6是本申请实施例提供的一种建立知识图谱的装置的结构示意图;
图7是本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
在本申请的描述中,需要理解的是,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。在本申请的描述中,需要说明的是,除非另有明确的规定和限定,“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本申请中的具体含义。此外,在本申请的描述中,除非另有说明,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
下面结合具体的实施例对本申请进行详细说明。
本申请的执行主体为电子设备。该电子设备包括但不限于移动台(MobileStation,MS)、移动终端设备(Mobile Terminal)、移动电话(Mobile Telephone)、手机(handset)及便携设备(portable equipment)等,该电子设备可以经无线接入网(RadioAccess Network,RAN)与一个或多个核心网进行通信,例如,电子设备可以是移动电话(或称为“蜂窝”电话)、具有无线通信功能的计算机等,电子设备还可以是便携式、袖珍式、手持式、计算机内置的或者车载的移动装置或设备。可以理解的是,本申请对电子设备的种类和数量不作限定。
在本申请中,电子设备上还可以安装有显示设备和摄像头,显示设备可以是各种能实现显示功能的设备,摄像头用于采集视频数据。例如:显示设备可以是阴极射线管显示器(Cathode raytubedisplay,简称CR)、发光二极管显示器(Light-emittingdiodedisplay,简称LED)、电子墨水屏、液晶显示屏(Liquid crystal display,简称LCD)、等离子显示面板(Plasma displaypanel,简称PDP)等。用户可以利用电子设备上的显示设备,来查看显示的文字、图片、视频等信息。电子设备上还安装有输入设备,输入设备可以是各种能实现输入信息的设备。例如:输入设备可以是上述显示设备、麦克风、鼠标、键盘等。用户利用电子设备的输入设备,来向电子设备输入各种指令,以利用电子设备实现各种指令对应的功能。
在本申请实施例中,用户通过电子设备的显示设备查看存储在电子设备的存储介质中的知识图谱,以及通过电子设备的输入设备输入多个课程数据或多个指令,以使电子设备获取多个课程数据,以及使电子设备基于多个指令执行每个指令对应的操作。例如,基于用户的展示指令,在显示设备上展示展示指令对应的知识图谱。
在一个实施例中,如图1所示,特提出了一种建立知识图谱的方法,该方法可依赖于计算机程序实现,可运行于基于冯诺依曼体系的建立知识图谱的装置上。该计算机程序可集成在应用中,也可作为独立的工具类应用运行。
具体的,该建立知识图谱的方法包括:
S101、获取多个课程数据,基于多个预设的基础类型获取多个课程数据中的N个知识点数据。
课程数据,可以理解为用于教学场景以承载教学内容的数据,例如:一些英语书,一节英语课,一些数学书或者物理课上使用的教学PPT。知识点数据,可以理解为包括在课程数据中基于预设的基础类型获取的单位数据。例如:单词apple、拉普拉斯双曲型方程、牛顿第一定理、牛顿第二定理等。
在一个实施例中,多个课程数据包括多个语言课程数据。预设的基础类型至少包括下列类型中的一个:单词类型、短语类型、句型类型等。在本申请实施例中,基于单词类型、短语类型和句型类型,获取多个语言课程数据中多个单词类型的知识点数据、多个短语类型的知识点数据和多个句型类型的知识点数据,换而言之,N个知识点数据包括多个单词类型的知识点数据、多个短语类型的知识点数据和多个句型类型的知识点数据。例如:单词类型的知识点数据包括单词apple,短语类型的知识点数据包括I have apple,句型类型的知识点数据包括特殊疑问句what is()。
如图2所示,为本申请实施例提供的一种对多个课程数据进行处理的结构示意图,包括:多个课程数据,以及基于多个预设的基础类型对多个课程数据进行处理后得到多个基础类型对应的N个知识点数据。其中,多个基础类型包括:单词类型vocabulary,句型类型sentence frame和短语类型short sentence等。单词类型vocabulary包括:单词happy、happily和what等,句形类型sentence frame包括:what are()doing、to be、what iswrong with()等,短语类型short sentence包括:I am happy、thank you、what’s wrongwith you等。
在本申请实施例中,对知识点数据设置了属性值property,属性值用于表征知识点数据对应于基础类型下的具体特征,例如happy的属性值为名词,happily的属性值为形容词,what的属性值为疑问代词。
在另一个实施例中,多个课程数据包括理工课程数据。预设的类型至少包括下列类型中的一个:公式类型和定理类型。在本申请实施例中,基于公式类型和定理类型,获取理工课程数据中多个公式类型的知识点数据和多个定理类型的知识点数据,换而言之,N个知识点数据包括多个公式类型的知识点数据和多个定理类型的知识点数据。例如,定理类型的知识点数据包括拉格朗日中值定理,公式类型的知识点数据包括F=ma。
在本申请实施例中,基于多个预设的基础类型获取多个课程数据中的N个知识点数据的方法可以是:通过语言处理模型对课程数据中的文本数据进行预处理,基于数据库和预设的基础类型对预处理后的文本数据提取出每个基础类型对应的多个知识点数据。上述语言处理模型可以是变压器的双向解码表示(Bidirectional Encoder Representationfrom Transformers,BERT)模型,BERT模型作为目前效果最好的深度语言模型,是未来自然语言处理(Natural Language Process,NLP)研究和工业应用最主流的语言模型之一。该模型用于使机器理解自然语言,进而对自然语言进行切割、翻译等处理。
在另一个实施例中,基于多个预设的基础类型获取多个课程数据中的N个知识点数据的方法可以是:通过用户的输入指令,获取多个课程数据中的N个知识点数据。例如,用户通过电子设备的输入设备在输入栏中手动输入知识点数据,以及为该知识点数据选择对应的基础类型。
S102、基于数据库检索N个知识点数据之间是否具有至少一种关联关系,在具有关联关系的知识点数据之间添加目标关联关系对应的目标关联。
在一个实施例中,关联关系包括:多个单词类型的知识点数据之间的词根关系、多个短语类型的知识点数据之间的句意相似性关系、短语类型的知识点数据与多个单词类型的知识点数据之间的包含关系、句型类型的知识点数据与多个单词类型的知识点数据之间的包含关系、多个句型类型的知识点数据之间的句意相似性关系。例如,单词类型的知识点数据happy与单词类型的知识点数据happliy具有词根关系,句型类型的知识点数据I amhappy与单词类型的知识点数据happy具有包含关系。
在另一个实施例中,关联关系包括:多个公式类型的知识点数据之间的转换关系、多个定理类型的知识点数据之间的转换关系、多个定理类型的知识点数据和多个公式类型的知识点数据之间的转换关系。例如,定理类型的知识点数据牛顿第二定理与公式类型的知识点数据F=ma之间的转换关系。
在具有关联关系的知识点数据之间添加目标关联关系对应的目标关联,可以理解为每个关联关系具有对应的关联标识,从而在知识图谱上具有不同关联关系的知识点数据之间显示不同的关联情况。采用本申请实施例,有利于在知识图谱上直观表现具有不同关联关系的知识点数据之间对应的关联,提高真实图片的观赏性和实用性。
在本申请实施例中,知识点数据之间的关联关系来自数据库和/或用户的输入指令。数据库包括本申请的电子设备的数据库或存储有关联关系以及电子设备可以访问的服务器的数据库。
S103、基于添加了目标关联的知识点数据建立针对多个课程数据的知识图谱。
知识图谱,可以理解为将知识点数据以及知识点数据之间的关联关系以图像形式展示的图谱。
如图3所示,为本申请实施例提供的一种知识图谱的结构示意图,包括多个基础类型对应的知识点数据以及知识点数据之间的关联关系。
具体而言,单词类型vocabulary包括:单词happy、happily和what等,句形类型sentence frame包括:I am happy、what are()doing、to be、what is wrong with()等,短语类型short sentence包括:I am happy、thank you、what’s wrong with you等。以及知识点数据之间的关联关系包括:单词happy与单词happily之间的词根关系,短语I amhappy与单词happy之间的包含关系等。
本申请通过获取多个课程数据中N个知识点数据,将具有目标关联关系的知识点数据之间添加目标关联关系对应的目标关联,进一步基于添加了目标关联的知识点数据建立针对知识图谱,该知识图谱可以将多个课程数据中的N个知识点数据的关联关系进行展示,不仅可以体现层级关系,还能展示诸如时态变化、词根词缀等复杂关系,有利于用户利用该知识图谱更好地掌握知识点。
在一个实施例中,如图4所示,特提出了一种建立知识图谱的方法,该方法可依赖于计算机程序实现,可运行于基于冯诺依曼体系的建立知识图谱的装置上。该计算机程序可集成在应用中,也可作为独立的工具类应用运行。
具体的,该建立知识图谱的方法包括:
S201、获取多个课程数据,基于多个预设的基础类型获取多个课程数据中的N个知识点数据。
在一个实施例中,获取多个课程数据的方法为:基于用户输入的待解析课程数据,获取待解析课程数据中的文本数据和视频数据;基于文本数据获取对应的第一课程数据;将视频数据转换为文本格式,以及基于转换为文本格式的视频数据获取第二课程数据,换而言之,多个课程数据包括第一课程数据和第二课程数据。待解析课程数据可以理解为需要处理以获取知识点数据的课程数据,例如:十几节录播英语课、英语听力录音等。其中,待解析视频由用户通过电子设备的输入数据输入至电子设备。
基于文本数据获取对应的第一课程数据的方法可以通过BERT模型训练后能够理解自然语言的电子设备对文本数据进行切割、去除重复内容等处理。将视频数据转换为文本格式,以及基于转换为文本格式的视频数据获取第二课程数据的方法,可以是利用现有的语音转文字的应用程序或规则对视频数据进行处理,将视频数据中语音格式的数据转录为文本格式的数据,例如,将mp3格式的数据转换为txt格式的数据。
步骤S201中基于多个预设的基础类型获取多个课程数据中的N个知识点数据的具体流程参见图1所示步骤S101,此次不再赘述。
S202、基于数据库检索N个知识点数据之间是否具有至少一种关联关系,在具有关联关系的知识点数据之间添加目标关联关系对应的目标关联。
基于数据库检索N个知识点数据之间是否具有至少一种关联关系,在具有关联关系的知识点数据之间添加目标关联关系对应的目标关联。步骤S202的具体流程参见图1所示的步骤S102,此处不再赘述。
S203、创建至少一个学习目标标签,获取学习目标标签与N个知识点数据之间的映射关系,在具有所述映射关系的学习目标标签与知识点数据之间添加映射关系对应的映射关联。
学习目标标签可以理解为基于用户的输入指令或预设科目等级标准建立的标签,例如,预设科目等级标准包括:CET4、CET6、A1、A2、B1、B2等,用户的输入指令可以为第一学习目标标签、第二学习目标标签等,以及基于用户的输入指令为该第一学习目标标签或第二学习目标标签设置名称,例如第一学习目标标签的名称为小学3年级的学习目标。
具体而言,创建所述至少一个学习目标标签;基于用户的输入指令和/或预设科目等级标准中的等级与等级对应的知识点数据,获取学习目标标签与N个知识点数据之间的映射关系;在具有映射关系的学习目标标签与知识点数据之间添加映射关系对应的映射关联。例如,获取CET4等级对应的学习目标标签“CET4”,基于预设科目等级标准中CET4等级与等级对应的知识点数据,在基于多个课程数据中获取的N个知识点数据中确定属于CET4等级的目标知识点数据,将学习目标标签“CET4”与目标知识点数据之间添加对应的映射关联。
映射关联可以理解为每个学习目标标签与对应的知识点数据之间的关联,与上述N个知识点数据之间的关联关系对应的关联不同。
S204、基于添加了目标关联的知识点数据以及添加了映射关系的学习目标标签与知识点数据建立针对多个课程数据的知识图谱。
基于添加了目标关联的知识点数据以及添加了映射关系的学习目标标签与知识点数据建立针对多个课程数据的知识图谱。
图5是本申请实施例提供的一种用户获取知识图谱的界面示意图。用户可以基于“选择科目”控件的触发条件来检索科目对应的知识图谱,例如,英语科目对应的多个英语课程数据,进一步对应多个英语课程数据对应的知识图谱。用户可以基于“选择类型”控件以及控件下对应多个基础类型的具体类型内容进行搜索。
在本申请实施例中,基于预设科目等级标准中CET4等级与等级对应的知识点数据,在基于多个课程数据中获取的N个知识点数据中确定属于CET4等级的目标知识点数据,将学习目标标签“CET4”与目标知识点数据之间添加对应的映射关联。如图5所示,当用户通过“选择学习目标”控件下的“CET4”控件的触发条件,则在电子设备上的显示图片展示与学习目标标签“CET4”具有映射关联的知识点数据的知识图谱。
在一个实施例中,本申请还用于获取针对知识图谱的更新请求,以及获取更新课程数据;基于多个预设的基础类型获取更新课程数据中的M个知识点数据;M为大于1的整数;通过M个知识点数据与知识图谱中的N个知识点数据之间的至少一种关联关系对知识图谱进行更新。
上述基于多个预设的基础类型可以理解为与建立该知识图谱时使用的基础类型相同的基础类型,例如,建立知识图谱时使用的基础类型为单词类型、短语类型和句型类型,则对更新课程数据也基于单词类型、短语类型和句型类型获取多个知识点数据。
检索更新课程数据中的多个知识点数据与知识图谱中的知识点数据之间的关联关系,例如,关联关系包括:多个单词类型的知识点数据之间的词根关系、多个短语类型的知识点数据之间的句意相似性关系、短语类型的知识点数据与多个单词类型的知识点数据之间的包含关系、句型类型的知识点数据与多个单词类型的知识点数据之间的包含关系、多个句型类型的知识点数据之间的句意相似性关系。为具有目标关联关系的更新课程数据中的多个知识点数据与知识图谱中的知识点数据之间添加目标关联关系对应的目标关联,从而基于更新课程数据对知识图谱进行更新。采用本申请实施例,可以对知识图谱进行有效更新,提高知识图谱的实用性和可靠性。
本申请通过获取多个课程数据中N个知识点数据,将具有目标关联关系的知识点数据之间添加目标关联关系对应的目标关联,进一步基于添加了目标关联的知识点数据建立针对知识图谱,该知识图谱可以将多个课程数据中的N个知识点数据的关联关系进行展示,不仅可以体现层级关系,还能展示诸如时态变化、词根词缀等复杂关系,有利于用户利用该知识图谱更好地掌握知识点。
下述为本申请装置实施例,可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节,请参照本申请方法实施例。
请参见图6,其示出了本申请一个示例性实施例提供的建立知识图谱的装置的结构示意图。该建立知识图谱的装置可以通过软件、硬件或者两者的结合实现成为装置的全部或一部分。该建立知识图谱的装置包括获取数据模块601、关联关系模块602和建立图谱模块603。
获取数据模块601,用于获取多个课程数据,基于多个预设的基础类型获取所述多个课程数据中的N个知识点数据;所述预设的基础类型至少包括下列类型中的一个:单词类型、短语类型、句型类型,N为大于1的整数;
关联关系模块602,用于基于数据库检索所述N个知识点数据之间是否具有至少一种关联关系,在具有目标关联关系的知识点数据之间添加所述目标关联关系对应的目标关联;所述目标关联关系为所述至少一种关联关系中的任意一种;
建立图谱模块603,用于基于添加了所述目标关联的知识点数据建立针对所述多个课程数据的知识图谱。
可选的,获取数据模块601还包括:
第一获取单元,用于获取所述多个语言课程数据;
第二获取单元,用于基于所述单词类型、短语类型和句型类型,获取所述课程数据中多个单词类型的知识点数据、多个短语类型的知识点数据和多个句型类型的知识点数据;所述N个知识点数据包括所述多个单词类型的知识点数据、所述多个短语类型的知识点数据和所述多个句型类型的知识点数据。
可选的,所述目标关联关系包括以下任意一种:所述多个单词类型的知识点数据之间的词根关系、所述多个短语类型的知识点数据之间的句意相似性关系、所述短语类型的知识点数据与所述多个单词类型的知识点数据之间的包含关系、句型类型的知识点数据与所述多个单词类型的知识点数据之间的包含关系、多个所述句型类型的知识点数据之间的句意相似性关系。
可选的,该建立知识图谱的装置还包括:
创建目标模块,用于创建至少一个学习目标标签,获取所述学习目标标签与所述N个知识点数据之间的映射关系,在具有所述映射关系的学习目标标签与知识点数据之间添加所述映射关系对应的映射关联;
建立图谱模块603还用于基于添加了所述目标关联的知识点数据以及添加了所述映射关联的学习目标标签与知识点数据建立针对所述多个课程数据的知识图谱。
可选的,创建目标模块包括:
创建目标单元,用于创建所述至少一个学习目标标签;
获取映射单元,用于基于用户的输入指令和/或预设科目等级标准中的等级与所述等级对应的知识点数据,获取所述学习目标标签与所述N个知识点数据之间的映射关系;
添加映射单元,用于在具有所述映射关系的学习目标标签与知识点数据之间添加所述映射关系对应的映射关联。
可选的,该建立知识图谱的装置还包括:
第一更新模块,用于获取针对所述知识图谱的更新请求,以及获取更新课程数据;
第二更新模块,用于基于所述多个预设的基础类型获取所述更新课程数据中的M个知识点数据;M为大于1的整数;
图谱更新模块,用于通过所述M个知识点数据与所述知识图谱中的N个知识点数据之间的至少一种关联关系对所述知识图谱进行更新。
可选的,获取数据模块601包括:
解析单元,用于基于用户输入的待解析课程数据,获取所述待解析课程数据中的文本数据和视频数据;
获取单元,用于基于所述文本数据获取对应的第一课程数据;
转换单元,用于将所述视频数据转换为文本格式,以及基于转换为文本格式的视频数据获取第二课程数据;其中,所述多个课程数据包括所述第一课程数据和所述第二课程数据;
处理单元,用于基于多个预设的基础类型获取所述第一课程数据和所述第二课程数据中的N个知识点数据。
需要说明的是,上述实施例提供的建立知识图谱的装置在执行建立知识图谱的方法时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的建立知识图谱的装置与建立知识图谱的方法实施例属于同一构思,其体现实现过程详见方法实施例,这里不再赘述。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
本申请通过获取多个课程数据中N个知识点数据,将具有目标关联关系的知识点数据之间添加目标关联关系对应的目标关联,进一步基于添加了目标关联的知识点数据建立针对知识图谱,该知识图谱可以将多个课程数据中的N个知识点数据的关联关系进行展示,不仅可以体现层级关系,还能展示诸如时态变化、词根词缀等复杂关系,有利于用户利用该知识图谱更好地掌握知识点。
本申请实施例还提供了一种计算机存储介质,所述计算机存储介质可以存储有多条指令,所述指令适于由处理器加载并执行如上述图1-图5所示实施例的所述建立知识图谱的方法,具体执行过程可以参见图1-图5所示实施例的具体说明,在此不进行赘述。
本申请还提供了一种计算机程序产品,该计算机程序产品存储有至少一条指令,所述至少一条指令由所述处理器加载并执行如上述图1-图5所示实施例的所述建立知识图谱的方法,具体执行过程可以参见图1-图5所示实施例的具体说明,在此不进行赘述。
请参见图7,为本申请实施例提供了一种电子设备的结构示意图。如图7所示,所述电子设备700可以包括:至少一个处理器701,至少一个网络接口704,用户接口703,存储器705,至少一个通信总线702。
其中,通信总线702用于实现这些组件之间的连接通信。
其中,用户接口703可以包括显示屏(Display)、摄像头(Camera),可选用户接口703还可以包括标准的有线接口、无线接口。
其中,网络接口704可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。
其中,处理器701可以包括一个或者多个处理核心。处理器701利用各种借口和线路连接整个服务器700内的各个部分,通过运行或执行存储在存储器705内的指令、程序、代码集或指令集,以及调用存储在存储器705内的数据,执行服务器700的各种功能和处理数据。可选的,处理器701可以采用数字信号处理(Digital Signal Processing,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(ProgrammableLogic Array,PLA)中的至少一种硬件形式来实现。处理器701可集成中央处理器(CentralProcessing Unit,CPU)、图像处理器(Graphics Processing Unit,GPU)和调制解调器等中的一种或几种的组合。其中,CPU主要处理操作系统、用户界面和应用程序等;GPU用于负责显示屏所需要显示的内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器701中,单独通过一块芯片进行实现。
其中,存储器705可以包括随机存储器(Random Access Memory,RAM),也可以包括只读存储器(Read-Only Memory)。可选的,该存储器705包括非瞬时性计算机可读介质(non-transitory computer-readable storage medium)。存储器705可用于存储指令、程序、代码、代码集或指令集。存储器705可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现上述各个方法实施例的指令等;存储数据区可存储上面各个方法实施例中涉及到的数据等。存储器705可选的还可以是至少一个位于远离前述处理器701的存储装置。如图7所示,作为一种计算机存储介质的存储器705中可以包括操作系统、网络通信模块、用户接口模块以及建立知识图谱应用程序。
在图7所示的电子设备700中,用户接口703主要用于为用户提供输入的接口,获取用户输入的数据;而处理器701可以用于调用存储器705中存储的建立知识图谱应用程序,并具体执行以下操作:
获取多个课程数据,基于多个预设的基础类型获取所述多个课程数据中的N个知识点数据;所述预设的基础类型至少包括下列类型中的一个:单词类型、短语类型、句型类型,N为大于1的整数;
基于数据库检索所述N个知识点数据之间是否具有至少一种关联关系,在具有目标关联关系的知识点数据之间添加所述目标关联关系对应的目标关联;所述目标关联关系为所述至少一种关联关系中的任意一种;
基于添加了所述目标关联的知识点数据建立针对所述多个课程数据的知识图谱。
在一个或多个实施例中,所述多个课程数据包括多个语言课程数据;
处理器701执行所述获取多个课程数据,基于多个预设的基础类型获取所述多个课程数据中的N个知识点数据,具体执行以下操作:
获取所述多个语言课程数据;
基于所述单词类型、短语类型和句型类型,获取所述课程数据中多个单词类型的知识点数据、多个短语类型的知识点数据和多个句型类型的知识点数据;所述N个知识点数据包括所述多个单词类型的知识点数据、所述多个短语类型的知识点数据和所述多个句型类型的知识点数据。
在一个或多个实施例中,处理器701执行所述目标关联关系包括以下任意一种:所述多个单词类型的知识点数据之间的词根关系、所述多个短语类型的知识点数据之间的句意相似性关系、所述短语类型的知识点数据与所述多个单词类型的知识点数据之间的包含关系、句型类型的知识点数据与所述多个单词类型的知识点数据之间的包含关系、多个所述句型类型的知识点数据之间的句意相似性关系。
在一个或多个实施例中,处理器701执行所述基于数据库检索所述N个知识点数据之间是否具有至少一种关联关系,在具有目标关联关系的知识点数据之间添加所述目标关联关系对应的目标关联之后,所述基于添加了所述目标关联的知识点数据建立针对所述多个课程数据的知识图谱之前,还执行以下操作:
创建至少一个学习目标标签,获取所述学习目标标签与所述N个知识点数据之间的映射关系,在具有所述映射关系的学习目标标签与知识点数据之间添加所述映射关系对应的映射关联;
在本申请实施例中,处理器701执行所述基于添加了所述目标关联的知识点数据建立针对所述多个课程数据的知识图谱,具体执行以下操作:
基于添加了所述目标关联的知识点数据以及添加了所述映射关联的学习目标标签与知识点数据建立针对所述多个课程数据的知识图谱。
在一个或多个实施例中,处理器701执行所述创建至少一个学习目标标签,获取所述学习目标标签与所述N个知识点数据之间的映射关系,在具有映射关系的学习目标标签与知识点数据之间添加所述映射关系对应的映射关联,具体执行以下操作;
创建所述至少一个学习目标标签;
基于用户的输入指令和/或预设科目等级标准中的等级与所述等级对应的知识点数据,获取所述学习目标标签与所述N个知识点数据之间的映射关系;
在具有所述映射关系的学习目标标签与知识点数据之间添加所述映射关系对应的映射关联。
在一个或多个实施例中,处理器701执行所述基于添加了所述目标关联的知识点数据建立针对所述多个课程数据的知识图谱之后,还执行以下操作:
获取针对所述知识图谱的更新请求,以及获取更新课程数据;
基于所述多个预设的基础类型获取所述更新课程数据中的M个知识点数据;M为大于1的整数;
通过所述M个知识点数据与所述知识图谱中的N个知识点数据之间的至少一种关联关系对所述知识图谱进行更新。
在一个或多个实施例中,处理器701执行所述获取多个课程数据,基于多个预设的基础类型获取所述多个课程数据中的N个知识点数据,具体执行以下操作:
基于用户输入的待解析课程数据,获取所述待解析课程数据中的文本数据和视频数据;
基于所述文本数据获取对应的第一课程数据;
将所述视频数据转换为文本格式,以及基于转换为文本格式的视频数据获取第二课程数据;其中,所述多个课程数据包括所述第一课程数据和所述第二课程数据;
基于多个预设的基础类型获取所述第一课程数据和所述第二课程数据中的N个知识点数据。
本申请通过获取多个课程数据中N个知识点数据,将具有目标关联关系的知识点数据之间添加目标关联关系对应的目标关联,进一步基于添加了目标关联的知识点数据建立针对知识图谱,该知识图谱可以将多个课程数据中的N个知识点数据的关联关系进行展示,不仅可以体现层级关系,还能展示诸如时态变化、词根词缀等复杂关系,有利于用户利用该知识图谱更好地掌握知识点。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体或随机存储记忆体等。
以上所揭露的仅为本申请较佳实施例而已,当然不能以此来限定本申请之权利范围,因此依本申请权利要求所作的等同变化,仍属本申请所涵盖的范围。

Claims (10)

1.一种建立知识图谱的方法,其特征在于,所述方法包括:
获取多个课程数据,基于多个预设的基础类型获取所述多个课程数据中的N个知识点数据;所述预设的基础类型至少包括下列类型中的一个:单词类型、短语类型、句型类型,N为大于1的整数;
基于数据库检索所述N个知识点数据之间是否具有至少一种关联关系,在具有目标关联关系的知识点数据之间添加所述目标关联关系对应的目标关联;所述目标关联关系为所述至少一种关联关系中的任意一种;
基于添加了所述目标关联的知识点数据建立针对所述多个课程数据的知识图谱。
2.根据权利要求1所述的方法,其特征在于,所述多个课程数据包括多个语言课程数据;
所述获取多个课程数据,基于多个预设的基础类型获取所述多个课程数据中的N个知识点数据,包括:
获取所述多个语言课程数据;
基于所述单词类型、短语类型和句型类型,获取所述课程数据中多个单词类型的知识点数据、多个短语类型的知识点数据和多个句型类型的知识点数据;所述N个知识点数据包括所述多个单词类型的知识点数据、所述多个短语类型的知识点数据和所述多个句型类型的知识点数据。
3.根据权利要求1所述的方法,其特征在于,所述目标关联关系包括以下任意一种:所述多个单词类型的知识点数据之间的词根关系、所述多个短语类型的知识点数据之间的句意相似性关系、所述短语类型的知识点数据与所述多个单词类型的知识点数据之间的包含关系、句型类型的知识点数据与所述多个单词类型的知识点数据之间的包含关系、多个所述句型类型的知识点数据之间的句意相似性关系。
4.根据权利要求1所述的方法,其特征在于,所述基于数据库检索所述N个知识点数据之间是否具有至少一种关联关系,在具有目标关联关系的知识点数据之间添加所述目标关联关系对应的目标关联之后,所述基于添加了所述目标关联的知识点数据建立针对所述多个课程数据的知识图谱之前,所述方法还包括:
创建至少一个学习目标标签,获取所述学习目标标签与所述N个知识点数据之间的映射关系,在具有所述映射关系的学习目标标签与知识点数据之间添加所述映射关系对应的映射关联;
所述基于添加了所述目标关联的知识点数据建立针对所述多个课程数据的知识图谱,包括:
基于添加了所述目标关联的知识点数据以及添加了所述映射关联的学习目标标签与知识点数据建立针对所述多个课程数据的知识图谱。
5.根据权利要求4所述的方法,其特征在于,所述创建至少一个学习目标标签,获取所述学习目标标签与所述N个知识点数据之间的映射关系,在具有映射关系的学习目标标签与知识点数据之间添加所述映射关系对应的映射关联,包括;
创建所述至少一个学习目标标签;
基于用户的输入指令和/或预设科目等级标准中的等级与所述等级对应的知识点数据,获取所述学习目标标签与所述N个知识点数据之间的映射关系;
在具有所述映射关系的学习目标标签与知识点数据之间添加所述映射关系对应的映射关联。
6.根据权利要求1所述的方法,其特征在于,所述基于添加了所述目标关联的知识点数据建立针对所述多个课程数据的知识图谱之后,所述方法还包括:
获取针对所述知识图谱的更新请求,以及获取更新课程数据;
基于所述多个预设的基础类型获取所述更新课程数据中的M个知识点数据;M为大于1的整数;
通过所述M个知识点数据与所述知识图谱中的N个知识点数据之间的至少一种关联关系对所述知识图谱进行更新。
7.根据权利要求1所述的方法,其特征在于,所述获取多个课程数据,基于多个预设的基础类型获取所述多个课程数据中的N个知识点数据,包括:
基于用户输入的待解析课程数据,获取所述待解析课程数据中的文本数据和视频数据;
基于所述文本数据获取对应的第一课程数据;
将所述视频数据转换为文本格式,以及基于转换为文本格式的视频数据获取第二课程数据;其中,所述多个课程数据包括所述第一课程数据和所述第二课程数据;
基于多个预设的基础类型获取所述第一课程数据和所述第二课程数据中的N个知识点数据。
8.一种建立知识图谱的装置,其特征在于,所述装置包括:
获取数据模块,用于获取多个课程数据,基于多个预设的基础类型获取所述多个课程数据中的N个知识点数据;所述预设的基础类型至少包括下列类型中的一个:单词类型、短语类型、句型类型,N为大于1的整数;
关联关系模块,用于基于数据库检索所述N个知识点数据之间是否具有至少一种关联关系,在具有目标关联关系的知识点数据之间添加所述目标关联关系对应的目标关联;所述目标关联关系为所述至少一种关联关系中的任意一种;
建立图谱模块,用于基于添加了所述目标关联的知识点数据建立针对所述多个课程数据的知识图谱。
9.一种计算机存储介质,其特征在于,所述计算机存储介质存储有多条指令,所述指令适于由处理器加载并执行如权利要求1~7任意一项的方法步骤。
10.一种电子设备,其特征在于,包括:处理器和存储器;其中,所述存储器存储有计算机程序,所述计算机程序适于由所述处理器加载并执行如权利要求1~7任意一项的方法步骤。
CN202110590701.5A 2021-05-28 2021-05-28 建立知识图谱的方法、装置、存储介质及电子设备 Withdrawn CN113220906A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110590701.5A CN113220906A (zh) 2021-05-28 2021-05-28 建立知识图谱的方法、装置、存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110590701.5A CN113220906A (zh) 2021-05-28 2021-05-28 建立知识图谱的方法、装置、存储介质及电子设备

Publications (1)

Publication Number Publication Date
CN113220906A true CN113220906A (zh) 2021-08-06

Family

ID=77099710

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110590701.5A Withdrawn CN113220906A (zh) 2021-05-28 2021-05-28 建立知识图谱的方法、装置、存储介质及电子设备

Country Status (1)

Country Link
CN (1) CN113220906A (zh)

Similar Documents

Publication Publication Date Title
CN111277706B (zh) 一种应用推荐方法、装置、存储介质及电子设备
CN110134931B (zh) 媒介标题生成方法、装置、电子设备及可读介质
CN109284399B (zh) 相似度预测模型训练方法、设备及计算机可读存储介质
CN111381909B (zh) 一种页面展示方法、装置、终端设备及存储介质
US20180130496A1 (en) Method and system for auto-generation of sketch notes-based visual summary of multimedia content
CN111930792B (zh) 数据资源的标注方法、装置、存储介质及电子设备
CN110569364A (zh) 在线教学方法、装置、服务器及存储介质
CN111651497B (zh) 用户标签挖掘方法、装置、存储介质及电子设备
US11651015B2 (en) Method and apparatus for presenting information
CN110880324A (zh) 语音数据的处理方法、装置、存储介质及电子设备
CN110532567A (zh) 短语的提取方法、装置、电子设备及存储介质
CN112183048A (zh) 一种自动解题方法、装置、计算机设备及存储介质
WO2023005968A1 (zh) 文本类别识别方法、装置、电子设备和存储介质
CN112232066A (zh) 一种教学纲要生成方法、装置、存储介质及电子设备
CN111401044A (zh) 一种标题生成方法、装置、终端设备及存储介质
CN114357278A (zh) 一种话题推荐方法、装置及设备
CN112115244A (zh) 对话交互方法、装置、存储介质及电子设备
US20110223567A1 (en) Language and communication system
CN110297965B (zh) 课件页面的显示及页面集的构造方法、装置、设备和介质
CN112100355A (zh) 一种智能交互方法、装置及设备
CN116881412A (zh) 汉字多维信息匹配训练方法、装置、电子设备和存储介质
CN110867187A (zh) 语音数据的处理方法、装置、存储介质及电子设备
CN113220906A (zh) 建立知识图谱的方法、装置、存储介质及电子设备
EP3896614A2 (en) Method and apparatus for labeling data
CN115440223A (zh) 智能交互方法、装置、机器人和计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20210806