WO2021208716A1 - 基于知识图谱的辅助教学方法、装置、设备及存储介质 - Google Patents
基于知识图谱的辅助教学方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- WO2021208716A1 WO2021208716A1 PCT/CN2021/083777 CN2021083777W WO2021208716A1 WO 2021208716 A1 WO2021208716 A1 WO 2021208716A1 CN 2021083777 W CN2021083777 W CN 2021083777W WO 2021208716 A1 WO2021208716 A1 WO 2021208716A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- knowledge
- keywords
- queried
- text
- keyword
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 53
- 238000010276 construction Methods 0.000 claims abstract description 6
- 230000011218 segmentation Effects 0.000 claims description 76
- 238000012545 processing Methods 0.000 claims description 37
- 238000004590 computer program Methods 0.000 claims description 21
- 239000000284 extract Substances 0.000 claims description 19
- 238000004422 calculation algorithm Methods 0.000 claims description 10
- 238000000605 extraction Methods 0.000 claims description 10
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 230000001737 promoting effect Effects 0.000 abstract 1
- 238000012887 quadratic function Methods 0.000 description 24
- 238000012360 testing method Methods 0.000 description 17
- 238000010586 diagram Methods 0.000 description 14
- 230000006870 function Effects 0.000 description 13
- 238000004364 calculation method Methods 0.000 description 9
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 230000001419 dependent effect Effects 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000003252 repetitive effect Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 235000019800 disodium phosphate Nutrition 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
- G06Q50/205—Education administration or guidance
Definitions
- Teachers are an important role in education. Teachers not only need to impart knowledge during class, but also clarify the students' mastery of the knowledge points in class, so as to provide targeted guidance when helping students find out and fill vacancies. Through the usual homework and exams, teachers can understand the degree to which students have mastered the knowledge points involved in the test paper from the wrong questions and scores.
- the first extraction unit is used to extract keywords and knowledge points from the pre-stored knowledge base
- FIG. 2 is a schematic flowchart of an auxiliary teaching method based on a knowledge graph provided by an embodiment of this application;
- FIG. 7 is a schematic flowchart of an auxiliary teaching method based on a knowledge graph provided by another embodiment of the application.
- FIG. 1 is a schematic diagram of an application scenario of an auxiliary teaching method based on a knowledge graph provided by an embodiment of the application.
- Fig. 2 is a schematic flowchart of an auxiliary teaching method based on a knowledge graph provided by an embodiment of the application. The auxiliary teaching method based on the knowledge graph is applied to the server 2.
- Server 2 extracts keywords and knowledge points from the pre-stored knowledge base;
- Server 2 constructs a knowledge graph based on the keywords and knowledge points extracted from the knowledge base.
- keywords and knowledge points are extracted from each knowledge text in the knowledge base to construct a knowledge graph.
- the knowledge base includes knowledge text
- the above step S1 specifically includes the following steps:
- the first candidate keyword includes (according to, certain, order, arrangement, a column, number, called, number sequence).
- the set of keywords is (quadratic function, trigonometric function, vertex, sequence of numbers). After judgment, it can be seen that only the “series” belongs to the keyword set. Therefore, it is determined that "number sequence” is a keyword, and “according to”, “certain”, “order”, “arrangement”, “a column”, “number”, and “called” are not keywords.
- step S1 further includes the following steps:
- Candidate sentence 3 x is the independent variable and y is the dependent variable.
- TextRank is an algorithm that uses the relationship between local words to sort and extract sentences.
- the weight of the sentence is obtained through multiple iterations of the similarity of the sentence.
- the basic idea comes from Google's PageRank algorithm. After dividing the text into several constituent units (sentences) and building a graph model, the voting mechanism is used to rank the important components in the text to obtain the weight of each sentence.
- S103 Select a preset number of candidate sentences to form the knowledge points of the knowledge text in the order of weight from high to low.
- the knowledge graph is a kind of graph.
- Graph is composed of a finite non-empty set of vertices and a set of edges between vertices, usually expressed as: G(V, E), where G represents a graph, V is the set of vertices in the graph G, E Is the set of edges in graph G.
- the graph is a many-to-many data structure. It contains two parts: a set of vertices and a set of edges, and the edges reflect the relationship between the vertices. If there is an association between two vertices of the graph, then there is an edge between the two vertices; if there is no association between the two vertices of the graph, there is no edge between the two vertices.
- the wrong question text refers to the text composed of the wrong question.
- the keywords to be queried are usually set by professionals in the field, and the term is usually some commonly used terms.
- the keywords are: quadratic function, vertex.
- word segmentation refers to dividing the input corpus into a sequence of multiple words.
- the second word segmentation set can be obtained by performing word segmentation processing on the wrong text by using a preset word segmentation tool (for example, jieba word segmentation tool).
- stop words are often prepositions, adverbs, or conjunctions.
- stop words are all stop words.
- the stop word itself has no actual meaning, so in the technical solution of this embodiment, the stop word in the second word segmentation set is deleted to reduce the amount of calculation.
- the keyword set is determined by a person skilled in the art, such as a teacher, based on experience, and the keywords in the keyword set are usually professional terms.
- the keywords in the keyword set are usually professional terms.
- its keywords include quadratic functions, trigonometric functions, vertices, and sequence of numbers.
- S43 Perform de-duplication processing on the knowledge points connected to each keyword to be queried by edges to obtain a set of knowledge points.
- the knowledge points connected to the keyword 1 by edges in the knowledge graph are knowledge point 1 and knowledge point 2.
- the knowledge points connected to the keyword 2 by edges are knowledge point 2 and knowledge point 3.
- Knowledge point 2 is repetitive, so just keep one. Therefore, the set of knowledge points obtained is (knowledge point 1, knowledge point 2, knowledge point 3)
- the knowledge points connected with keyword 1 by edges are knowledge point 1 and knowledge point 2.
- the knowledge points connected to the keyword 2 by edges are knowledge point 2 and knowledge point 3.
- the remaining keywords to be queried are the remaining keywords to be queried are Keyword 1 and Keyword 2.
- the second extracting unit 73 is configured to extract keywords to be queried from the wrong question text if the wrong question text sent by the terminal is received;
- the knowledge base includes knowledge text
- the extraction of keywords and knowledge points from a pre-stored knowledge base includes:
- said extracting keywords and knowledge points from a pre-stored knowledge base further includes:
- the keywords to be queried are the vertices of the knowledge graph, delete the keywords to be queried that are not the vertices of the knowledge graph, and obtain knowledge points connected to the remaining keywords to be queried by edges from the knowledge graph;
- De-duplication processing is performed on the knowledge points connected with the remaining keywords to be queried through edges to obtain the knowledge point set.
- the second sending unit 75 is configured to obtain a set of test questions related to the keywords to be queried and send the set of test questions to the terminal.
- a preset number of candidate sentences are selected in the order of weight from high to low to form the knowledge points of the knowledge text.
- the keywords and knowledge points of the knowledge text are used as the vertices of the knowledge graph, and an edge is established between the keywords and the knowledge points of the same knowledge text to obtain the knowledge graph.
- each of the keywords to be queried is the apex of the knowledge graph, acquiring knowledge points connected to each of the keywords to be queried by edges from the knowledge graph;
- the keywords to be queried are the vertices of the knowledge graph, delete the keywords to be queried that are not the vertices of the knowledge graph, and obtain knowledge points connected to the remaining keywords to be queried by edges from the knowledge graph;
- De-duplication processing is performed on the knowledge points connected with the remaining keywords to be queried through edges to obtain the knowledge point set.
- processor 502 after the processor 502 implements the step of extracting the keyword to be queried from the wrong question text, it further implements the following steps:
- the computer program can be stored in a storage medium, and the storage medium is a computer-readable storage medium.
- the computer program is executed by at least one processor in the computer system to implement the process steps of the foregoing method embodiment.
- the storage medium may be a computer-readable storage medium.
- the storage medium stores a computer program.
- the processor executes the following steps:
- the knowledge points associated with the keywords to be queried are obtained from the knowledge graph to form a knowledge point set, and the knowledge point set is sent to the terminal.
- the first candidate keyword belongs to a preset keyword set, it is determined that the first candidate keyword is a keyword of the knowledge text.
- the second candidate keyword belongs to a preset keyword set, it is determined that the second candidate keyword is a keyword to be queried of the wrong text.
- the number of the keywords to be queried is multiple
- the knowledge graph includes edges and vertices, wherein the vertices include the keywords and the knowledge points, and the edges include the key
- the connection relationship between words and the knowledge points, the obtaining knowledge points associated with the keywords to be queried from the knowledge graph to form a knowledge point set includes:
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Tourism & Hospitality (AREA)
- Educational Technology (AREA)
- Artificial Intelligence (AREA)
- Strategic Management (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Educational Administration (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Animal Behavior & Ethology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
一种基于知识图谱的辅助教学方法、装置、设备及存储介质,涉及人工智能领域,可应用于智慧教育场景中,从而推动智慧城市的建设。所述方法包括:从预存的知识库中提取关键词以及知识点(S1);据从所述知识库中提取到的关键词以及知识点构建知识图谱(S2);若接收到终端发送的错题文本,从所述错题文本中提取待查询关键词(S3);从所述知识图谱中获取与所述待查询关键词关联的知识点组成知识点集合,并将所述知识点集合发送给终端(S4)。
Description
本申请要求于2020年11月24日提交中国专利局,申请号202011328117.4,发明名称为“基于知识图谱的辅助教学方法、装置、设备及存储介质”的中国专利申请的优先权,其全部内容通过引用结合在本申请中。
本申请涉及人工智能技术领域,尤其涉及一种基于知识图谱的辅助教学方法、装置、设备及存储介质。
随着人们生活水平的不断提高,人们对教育的重视程度越来越高。教师是教育中的重要角色。教师不止要在上课时传授知识,还要明确学生对上课所讲的知识点的掌握情况,从而在帮助学生查漏补缺时进行针对性地辅导。通过平时的作业与考试,教师能够从错题以及分数上了解学生掌握试卷所涉及知识点的程度。
发明人发现,教师的时间精力有限,目前普遍的做法是根据自身的经验主观确定学生的知识薄弱点,无法做到精确的统计,因此不能精准地制定教学计划。
发明内容
本申请实施例提供了一种基于知识图谱的辅助教学方法、装置、设备及存储介质,旨在解决教师难以准确了解学生的知识薄弱点的问题。
第一方面,本申请实施例提供了一种基于知识图谱的辅助教学方法,其包括:
从预存的知识库中提取关键词以及知识点;
根据从所述知识库中提取到的关键词以及知识点构建知识图谱;
若接收到终端发送的错题文本,从所述错题文本中提取待查询关键词;
从所述知识图谱中获取与所述待查询关键词关联的知识点组成知识点集合,并将所述知识点集合发送给终端。
第二方面,本申请实施例还提供了一种基于知识图谱的辅助教学装置,其包括:
第一提取单元,用于从预存的知识库中提取关键词以及知识点;
构建单元,用于根据从所述知识库中提取到的关键词以及知识点构建知识图谱;
第二提取单元,用于若接收到终端发送的错题文本,从所述错题文本中提取待查询关键词;
第一发送单元,用于从所述知识图谱中获取与所述待查询关键词关联的知识点组成知识点集合,并将所述知识点集合发送给终端。
第三方面,本申请实施例还提供了一种计算机设备,其包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现上述方法。
第四方面,本申请实施例还提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序当被处理器执行时可实现上述方法。
本申请实施例提供了一种基于知识图谱的辅助教学方法、装置、设备及存储介质。通过构建知识图谱,在获取到从错题文本中提取的待查询关键词后,可从知识图谱中查找关联的知识点组成知识点集合,从而能够快速准确的为教师统计学生薄弱的知识点,使得教师能够快速了解学生的学习情况,进而更准确制定教学计划。
为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种基于知识图谱的辅助教学方法的应用场景示意图;
图2为本申请实施例提供的一种基于知识图谱的辅助教学方法的流程示意图;
图3为本申请实施例提供的一种基于知识图谱的辅助教学方法的子流程示意图;
图4为本申请实施例提供的一种基于知识图谱的辅助教学方法的子流程示意图;
图5为本申请实施例提供的一种基于知识图谱的辅助教学方法的子流程示意图;
图6为本申请实施例提供的一种基于知识图谱的辅助教学方法的子流程示意图;
图7为本申请另一实施例提供的一种基于知识图谱的辅助教学方法的流程示意图;
图8为本申请实施例提供的一种基于知识图谱的辅助教学装置的示意性框图;
图9为本申请另一实施例提供的一种基于知识图谱的辅助教学装置的示意性框图;
图10为本申请实施例提供的一种计算机设备的示意性框图。
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
请参阅图1和图2,图1为本申请实施例提供的基于知识图谱的辅助教学方法的应用场景示意图。图2为本申请实施例提供的基于知识图谱的辅助教学方法的示意性流程图。该基于知识图谱的辅助教学方法应用于服务器2中。服务器2从预存的知识库中提取关键词以及知识点;服务器2根据从知识库中提取到的关键词以及知识点构建知识图谱,知识图谱的顶点包括关键词以及知识点;若接收到终端1发送的错题文本,服务器2从错题文本中提取待查询关键词;服务器2从知识图谱中获取与待查询关键词关联的知识点组成知识点集合,并将知识点集合发送给终端1。
图2是本申请实施例提供的基于知识图谱的辅助教学方法的流程示意图。本申请可应用于智慧教育场景中,从而推动智慧城市的建设。如图所示,该方法包括以下步骤S1-S4。
S1,从预存的知识库中提取关键词以及知识点。
具体实施中,知识库是指某一教学阶段的某一学科的知识内容组成的集合。例如,初中数学知识库是指初中阶段的数学的知识内容组成的集合。
知识库由多个知识文本组成,知识文本是指介绍某一知识内容的文本。例如,在初中数学知识库中,关于二次函数的知识文本如下:形如y=ax
2+bx+c(其中a,b,c是常数,a≠0)的函数叫做二次函数。其中a称为二次项系数,b为一次项系数,c为常数项。x为自变量,y为因变量。等号右边自变量的最高次数是2。
关键词通常由本领域的专业技术人员设定,期通常为一些惯用的术语,例如对于上述关于二次函数的知识文本,其关键词为:二次函数。
知识点是指知识文本的摘要,通过从知识文本中摘取重要的语句得到,例如对于上述关于二次函数的知识文本,其知识点为:形如y=ax
2+bx+c(其中a,b,c是常数,a≠0)的函数叫做二次函数。
具体实施中,分别从知识库的各知识文本中提取关键词以及知识点,用以构建知识图谱。
参见图3,在一实施例中,知识库包括知识文本,以上步骤S1具体包括如下步骤:
S11,对知识文本进行分词处理以得到第一分词集合。
具体实施中,分词处理是指将输入语料划分为多个词语组成的序列。可具体通过预设的分词工具(例如,jieba分词工具)对知识文本进行分词处理得到第一分词集合。
例如,在一实施例中,知识文本为:按一定次序排列的一列数称为数列。
经过分词处理后得到的第一分词集合为(按,一定,次序,排列,的,一列,数,称为,数列)。
S12,将第一分词集合中的停止词删除,并将第一分词集合中剩余的词语作为第一候选关键词。
具体实施中,停止词(stop word),常为介词、副词或连词等。例如,"在"、"里面"、"也"、"的"、"它"、"为"等都为停止词。停止词本身没有实际含义,因此本实施例的技术方案中,将第一分词集合中的停止词删除,以减少计算量。
例如,在一实施例中,第一分词集合为(按,一定,次序,排列,的,一列,数,称为,数列)。其包括停止词“的”,将停止词删除后得到的第一候选关键词包括(按,一定,次序,排列,一列,数,称为,数列)。
S13,判断第一候选关键词是否属于预设的关键词集合。
具体实施中,关键词集合由本领域技术人员,例如教师,根据经验确定,关键词集合中的关键词通常为专业的术语。例如对于初中数学知识库,其关键词包括二次函数、三角函数、顶点以及数列等。
在得到第一候选关键词后,逐一判断各第一候选关键词是否属于预设的关键词集合。
S14,若第一候选关键词属于预设的关键词集合,判定第一候选关键词为知识文本的关键词。
进一步地,若第一候选关键词不属于预设的关键词集合,判定第一候选关键词不是知识文本的关键词。
例如,在一实施例中,第一候选关键词包括(按,一定,次序,排列,一列,数,称为,数列)。关键词集合为(二次函数,三角函数,顶点,数列)。经过判断可知,只有“数列”属于关键词集合。因此,判定“数列”为关键词,“按”、“一定”、“次序”、“排列”、“一列”、“数”以及“称为”均不是关键词。
参见图4,在本实施例中,以上步骤S1还包括如下步骤:
S101,将知识文本划分为多个候选句子。
具体实施中,根据标点符号将知识文本拆分成若干个候选句子,例如,根据句号、问号以及感叹号进行拆分。
在一实施例中,关于二次函数的知识文本如下:形如y=ax
2+bx+c(其中a,b,c是常数,a≠0)的函数叫做二次函数。其中a称为二次项系数,b为一次项系数,c为常数项。x为自变量,y为因变量。等号右边自变量的最高次数是2。
根据标点符号拆分后得到如下候选句子:
候选句子1:形如y=ax
2+bx+c(其中a,b,c是常数,a≠0)的函数叫做二次函数。
候选句子2:其中a称为二次项系数,b为一次项系数,c为常数项。
候选句子3:x为自变量,y为因变量。
候选句子4:等号右边自变量的最高次数是2。
S102,通过预设的TextRank算法分别计算各候选句子的权重。
具体实施中,TextRank是一种利用局部词汇之间关系对句子进行排序和抽取的算法,通过句子的相似度经过多次迭代传播从而得到句子的权重。其基本思想来源于谷歌的PageRank算法,在把文本分割成若干组成单元(句子)并建立图模型后,利用投票机制对文本中的重要成分进行排序,得到各句子的权重。
例如,在一实施例中,知识文本总共包括四个候选句子,则通过TextRank算法分别计 算这四个候选句子的权重。
S103,按照权重由高到低的顺序选取预设数量的候选句子组成知识文本的知识点。
具体实施中,预设数量可由本领域技术人员进行设定,对比本申请不作具体限定。权重越高,说明候选句子的重要程度越高,越适合作为知识点(摘要)。
例如,在一实施例中,预设数量设定为1。知识文本总共包括四个候选句子,具体如下:
候选句子1:形如y=ax
2+bx+c(其中a,b,c是常数,a≠0)的函数叫做二次函数。
候选句子2:其中a称为二次项系数,b为一次项系数,c为常数项。
候选句子3:x为自变量,y为因变量。
候选句子4:等号右边自变量的最高次数是2。
经过计算后得到,候选句子1的权重最高,则选择候选句子1作为知识文本的知识点。
可以理解地,以上步骤S11-S14与S101-S103之间是相互独立的,相互间没有执行的先后顺序,或者二者可并行执行。
S2,根据从知识库中提取到的关键词以及知识点构建知识图谱,知识图谱的顶点包括关键词以及知识点。
具体实施中,知识图谱是图的一种。图(Graph)是由顶点的有穷非空集合和顶点之间边的集合组成,通常表示为:G(V,E),其中,G表示一个图,V是图G中顶点的集合,E是图G中边的集合。
图是一种比线性表和树更复杂的数据结构。在图中,顶点之间的关系是任意的,任意两个顶点之间都可能相关。
图是一种多对多的数据结构。它包含顶点集合和边集合两部分,边反映了顶点之间的关系。若图的两个顶点之间存在关联,则该两个顶点之间存在边;若图的两个顶点之间不存在关联,则该两个顶点之间不存在边。
本实施例构建的知识图谱以从知识库中提取到的关键词以及知识点为顶点,并且在任意两个存在关联的关键词与知识点之间建立边。
在一实施例中,以知识文本的关键词以及知识点作为知识图谱的顶点,并且在同一个知识文本的关键词和知识点之间建立边得到知识图谱。
同一个知识文本的关键词和知识点之间必然存在关联,因此在二者之间建立边。
S3,若接收到终端发送的错题文本,从错题文本中提取待查询关键词。
具体实施中,错题文本是指错题组成的文本。例如,学生(一个或者多个)在某次考试中的错题组成的文本。错题文本的示例如下:1、计算二次函数y=3x
2+4x的顶点。
待查询关键词通常由本领域的专业技术人员设定,期通常为一些惯用的术语,例如对于上述错题文本,其关键词为:二次函数、顶点。
参见图5,在一实施例中,以上步骤S3具体包括:
S31,对错题文本进行分词处理以得到第二分词集合。
具体实施中,分词处理是指将输入语料划分为多个词语组成的序列。可具体通过预设的分词工具(例如,jieba分词工具)对错题文本进行分词处理得到第二分词集合。
例如,在一实施例中,错题文本为:计算二次函数y=3x
2+4x的顶点。
经过分词处理后得到的第二分词集合为(计算,二次函数,y=3x
2+4x,的,顶点)。
S32,将第二分词集合中的停止词删除,并将第二分词集合中剩余的词语作为第二候选关键词。
具体实施中,停止词(stop word),常为介词、副词或连词等。例如,"在"、"里面"、"也"、"的"、"它"、"为"等都为停止词。停止词本身没有实际含义,因此本实施例的技术方案中,将第二分词集合中的停止词删除,以减少计算量。
例如,在一实施例中,第二分词集合为(计算,二次函数,y=3x
2+4x,的,顶点)。其包括停止词“的”,将停止词删除后得到的第二候选关键词包括(计算,二次函数,y=3x
2+4x,顶点)。
S33,判断第二候选关键词是否属于预设的关键词集合。
具体实施中,关键词集合由本领域技术人员,例如教师,根据经验确定,关键词集合中的关键词通常为专业的术语。例如对于初中数学知识库,其关键词包括二次函数、三角函数、顶点以及数列等。
在得到第二候选关键词后,逐一判断各第二候选关键词是否属于预设的关键词集合。
S34,若第二候选关键词属于预设的关键词集合,判定第二候选关键词为错题文本的待查询关键词。
进一步地,若第二候选关键词不属于预设的关键词集合,判定第二候选关键词不是错题文本的关键词。
例如,在一实施例中,第二候选关键词包括(计算,二次函数,y=3x
2+4x,顶点)。关键词集合为(二次函数,三角函数,顶点,数列)。经过判断可知,只有“二次函数”以及“顶点”属于关键词集合。因此,判定“二次函数”以及“顶点”为待查询关键词,“计算”以及“y=3x
2+4x”不是待查询关键词。
S4,从知识图谱中获取与待查询关键词关联的知识点组成知识点集合,并将知识点集合发送给终端。
具体实施中,从知识图谱中获取与待查询关键词通过边相连的知识点组成知识点集合,并将得到的知识点集合发送给终端,从而便于教师了解学生薄弱的知识点在哪,进而更准确规划教学内容。
参见图6,在一实施例中,待查询关键词的数量为多个,知识图谱包括边和顶点,其中,顶点包括关键词以及知识点,边包括关键词以及知识点的连接关系,以上步骤S4具体包括如下步骤:
S41,判断各待查询关键词是否均为知识图谱的顶点。
具体实施中,逐一判断各待查询关键词是否为知识图谱的顶点。即判断各待查询关键词是否为知识图谱的顶点集合的元素。
S42,若各待查询关键词均是知识图谱的顶点,从知识图谱中获取与各待查询关键词通过边相连的知识点。
例如,在一实施例中,总共有两个待查询关键词,分别为关键词1与关键词2。关键词1与关键词2均为知识图谱的顶点。知识图谱中与关键词1通过边相连的知识点为知识点1以及知识点2。知识图谱中与关键词2通过边相连的知识点为知识点2以及知识点3。
S43,对与各待查询关键词通过边相连的知识点进行去重处理以得到知识点集合。
具体实施中,去重处理是指将相同的知识点只保留一个,从而能够有效避免重复。
例如,在一实施例中,知识图谱中与关键词1通过边相连的知识点为知识点1以及知识点2。知识图谱中与关键词2通过边相连的知识点为知识点2以及知识点3。知识点2是重复的,只保留一个即可。因此得到的知识点集合为(知识点1、知识点2、知识点3)
S44,若部分待查询关键词是知识图谱的顶点,将不是知识图谱的顶点的待查询关键词删除,从知识图谱中获取与剩余的待查询关键词通过边相连的知识点。
例如,在一实施例中,总共有两个待查询关键词,分别为关键词1、关键词2以及关键词3。其中,关键词1与关键词2是知识图谱的顶点。关键词3不是知识图谱的顶点。因此将关键词3删除,剩余的待查询关键词为关键词1与关键词2。
知识图谱中与关键词1通过边相连的知识点为知识点1以及知识点2。知识图谱中与关键词2通过边相连的知识点为知识点2以及知识点3。
S45,对与剩余的待查询关键词通过边相连的知识点进行去重处理以得到知识点集合。
具体实施中,去重处理是指将相同的知识点只保留一个,从而能够有效避免重复。
例如,在一实施例中,剩余的待查询关键词为剩余的待查询关键词为关键词1与关键词2。
知识图谱中与关键词1通过边相连的知识点为知识点1以及知识点2。知识图谱中与关 键词2通过边相连的知识点为知识点2以及知识点3。知识点2是重复的,只保留一个即可。因此得到的知识点集合为(知识点1、知识点2、知识点3)。
进一步地,若所有的待查询关键词都不是知识图谱的顶点,则向终端返回无查询结果提示消息,以提示用户未找到查询结果,并核对输入的错题文本是否正确。
本申请实施例的技术方案,从预存的知识库中提取关键词以及知识点;根据从知识库中提取到的关键词以及知识点构建知识图谱,知识图谱的顶点包括关键词以及知识点;若接收到终端发送的错题文本,从错题文本中提取待查询关键词;从知识图谱中获取与待查询关键词关联的知识点组成知识点集合,并将知识点集合发送给终端。通过构建知识图谱,在获取到从错题文本中提取的待查询关键词后,可从知识图谱中查找关联的知识点组成知识点集合,从而能够快速准确的为教师统计学生薄弱的知识点,使得教师能够快速了解学生的学习情况,进而更准确制定教学计划。
图7是本申请另一实施例提供的一种基于知识图谱的辅助教学方法的流程示意图。如图7所示,本实施例的基于知识图谱的辅助教学方法包括步骤S71-S75。其中步骤S71-S74与上述实施例中的步骤S1-S4类似,在此不再赘述。下面详细说明本实施例中所增加的步骤S75。
S75,获取与待查询关键词关联的试题组成试题集合,并将试题集合发送给终端。
具体实施中,关键词通常由本领域的专业技术人员设定,期通常为一些惯用的术语,例如:二次函数以及数列等。
预先为关键词配套准备试题,并储存到数据库中。在得到候选关键词后,从数据库中查询与待查询关键词关联的试题组成试题集合。通过将试题集合发送给终端,使得老师能够通过这些试题提高学生对相关知识点的掌握程度。
参见图8,图8是本申请实施例提供的一种基于知识图谱的辅助教学装置70的示意性框图。对应于以上基于知识图谱的辅助教学方法,本申请还提供一种基于知识图谱的辅助教学装置70。该基于知识图谱的辅助教学装置70包括用于执行上述基于知识图谱的辅助教学方法的单元,该基于知识图谱的辅助教学装置70可以被配置于服务器中。具体地,该基于知识图谱的辅助教学装置70包括第一提取单元71、构建单元72、第二提取单元73以及第一发送单元74。
第一提取单元71,用于从预存的知识库中提取关键词以及知识点;
构建单元72,用于根据从所述知识库中提取到的关键词以及知识点构建知识图谱;
第二提取单元73,用于若接收到终端发送的错题文本,从所述错题文本中提取待查询关键词;
第一发送单元74,用于从所述知识图谱中获取与所述待查询关键词关联的知识点组成知识点集合,并将所述知识点集合发送给终端。
在一实施例中,所述知识库包括知识文本,所述从预存的知识库中提取关键词以及知识点,包括:
对所述知识文本进行分词处理以得到第一分词集合;
将所述第一分词集合中的停止词删除,并将所述第一分词集合中剩余的词语作为第一候选关键词;
判断所述第一候选关键词是否属于预设的关键词集合;
若所述第一候选关键词属于预设的关键词集合,判定所述第一候选关键词为所述知识文本的关键词。
在一实施例中,所述从预存的知识库中提取关键词以及知识点,还包括:
将所述知识文本划分为多个候选句子;
通过预设的TextRank算法分别计算各所述候选句子的权重;
按照权重由高到低的顺序选取预设数量的候选句子组成所述知识文本的知识点。
在一实施例中,所述根据从所述知识库中提取到的关键词以及知识点构建知识图谱,包括:
以知识文本的关键词以及知识点作为知识图谱的顶点,并且在同一个知识文本的关键词和知识点之间建立边得到所述知识图谱。
在一实施例中,所述从所述错题文本中提取待查询关键词,包括
对所述错题文本进行分词处理以得到第二分词集合;
将所述第二分词集合中的停止词删除,并将所述第二分词集合中剩余的词语作为第二候选关键词;
判断所述第二候选关键词是否属于预设的关键词集合;
若所述第二候选关键词属于预设的关键词集合,判定所述第二候选关键词为所述错题文本的待查询关键词。
在一实施例中,所述待查询关键词的数量为多个,所述知识图谱包括边和顶点,其中,所述顶点包括所述关键词以及所述知识点,所述边包括所述关键词以及所述知识点的连接关系,所述从所述知识图谱中获取与所述待查询关键词关联的知识点组成知识点集合,包括:
判断各所述待查询关键词是否均为所述知识图谱的顶点;
若各所述待查询关键词均是所述知识图谱的顶点,从所述知识图谱中获取与各所述待查询关键词通过边相连的知识点;
对与各所述待查询关键词通过边相连的知识点进行去重处理以得到所述知识点集合;
若部分待查询关键词是所述知识图谱的顶点,将不是所述知识图谱的顶点的待查询关键词删除,从所述知识图谱中获取与剩余的待查询关键词通过边相连的知识点;
对与剩余的待查询关键词通过边相连的知识点进行去重处理以得到所述知识点集合。
图9是本申请另一实施例提供的一种基于知识图谱的辅助教学装置70的示意性框图。如图9所示,本实施例的基于知识图谱的辅助教学装置70是上述实施例的基础上增加了第二发送单元75。
第二发送单元75,用于获取与所述待查询关键词关联的试题组成试题集合,并将所述试题集合发送给终端。
需要说明的是,所属领域的技术人员可以清楚地了解到,上述基于知识图谱的辅助教学装置70和各单元的具体实现过程,可以参考前述方法实施例中的相应描述,为了描述的方便和简洁,在此不再赘述。
上述基于知识图谱的辅助教学装置70可以实现为一种计算机程序的形式,该计算机程序可以在如图10所示的计算机设备上运行。
请参阅图10,图10是本申请实施例提供的一种计算机设备的示意性框图。该计算机设备500是服务器。服务器可以是独立的服务器,也可以是多个服务器组成的服务器集群。
该计算机设备500包括通过系统总线501连接的处理器502、存储器和网络接口505,其中,存储器可以包括非易失性存储介质503和内存储器504。
该非易失性存储介质503可存储操作系统5031和计算机程序5032。该计算机程序5032被执行时,可使得处理器502执行一种基于知识图谱的辅助教学方法。
该处理器502用于提供计算和控制能力,以支撑整个计算机设备500的运行。
该内存储器504为非易失性存储介质503中的计算机程序5032的运行提供环境,该计算机程序5032被处理器502执行时,可使得处理器502执行一种基于知识图谱的辅助教学方法。
该网络接口505用于与其它设备进行网络通信。本领域技术人员可以理解,上述结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备500的限定,具体的计算机设备500可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
其中,所述处理器502用于运行存储在存储器中的计算机程序5032,以实现如下步骤:
从预存的知识库中提取关键词以及知识点;
根据从所述知识库中提取到的关键词以及知识点构建知识图谱;
若接收到终端发送的错题文本,从所述错题文本中提取待查询关键词;
从所述知识图谱中获取与所述待查询关键词关联的知识点组成知识点集合,并将所述知识点集合发送给终端。
在一实施例中,所述知识库包括知识文本,所述从预存的知识库中提取关键词以及知识点,包括:
对所述知识文本进行分词处理以得到第一分词集合;
将所述第一分词集合中的停止词删除,并将所述第一分词集合中剩余的词语作为第一候选关键词;
判断所述第一候选关键词是否属于预设的关键词集合;
若所述第一候选关键词属于预设的关键词集合,判定所述第一候选关键词为所述知识文本的关键词。
在一实施例中,所述从预存的知识库中提取关键词以及知识点,还包括:
将所述知识文本划分为多个候选句子;
通过预设的TextRank算法分别计算各所述候选句子的权重;
按照权重由高到低的顺序选取预设数量的候选句子组成所述知识文本的知识点。
在一实施例中,所述根据从所述知识库中提取到的关键词以及知识点构建知识图谱,包括:
以知识文本的关键词以及知识点作为知识图谱的顶点,并且在同一个知识文本的关键词和知识点之间建立边得到所述知识图谱。
在一实施例中,所述从所述错题文本中提取待查询关键词,包括
对所述错题文本进行分词处理以得到第二分词集合;
将所述第二分词集合中的停止词删除,并将所述第二分词集合中剩余的词语作为第二候选关键词;
判断所述第二候选关键词是否属于预设的关键词集合;
若所述第二候选关键词属于预设的关键词集合,判定所述第二候选关键词为所述错题文本的待查询关键词。
在一实施例中,所述待查询关键词的数量为多个,所述知识图谱包括边和顶点,其中,所述顶点包括所述关键词以及所述知识点,所述边包括所述关键词以及所述知识点的连接关系,所述从所述知识图谱中获取与所述待查询关键词关联的知识点组成知识点集合,包括:
判断各所述待查询关键词是否均为所述知识图谱的顶点;
若各所述待查询关键词均是所述知识图谱的顶点,从所述知识图谱中获取与各所述待查询关键词通过边相连的知识点;
对与各所述待查询关键词通过边相连的知识点进行去重处理以得到所述知识点集合;
若部分待查询关键词是所述知识图谱的顶点,将不是所述知识图谱的顶点的待查询关键词删除,从所述知识图谱中获取与剩余的待查询关键词通过边相连的知识点;
对与剩余的待查询关键词通过边相连的知识点进行去重处理以得到所述知识点集合。
在一实施例中,处理器502在实现所述从所述错题文本中提取待查询关键词步骤之后,还实现如下步骤:
获取与所述待查询关键词关联的试题组成试题集合,并将所述试题集合发送给终端。
应当理解,在本申请实施例中,处理器502可以是中央处理单元(Central Processing Unit,CPU),该处理器502还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
本领域普通技术人员可以理解的是实现上述实施例的方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成。该计算机程序可存储于一存储介质中,该存储介 质为计算机可读存储介质。该计算机程序被该计算机系统中的至少一个处理器执行,以实现上述方法的实施例的流程步骤。
因此,本申请还提供一种存储介质。该存储介质可以为计算机可读存储介质。该存储介质存储有计算机程序。该计算机程序被处理器执行时使处理器执行如下步骤:
从预存的知识库中提取关键词以及知识点;
根据从所述知识库中提取到的关键词以及知识点构建知识图谱;
若接收到终端发送的错题文本,从所述错题文本中提取待查询关键词;
从所述知识图谱中获取与所述待查询关键词关联的知识点组成知识点集合,并将所述知识点集合发送给终端。
在一实施例中,所述知识库包括知识文本,所述从预存的知识库中提取关键词以及知识点,包括:
对所述知识文本进行分词处理以得到第一分词集合;
将所述第一分词集合中的停止词删除,并将所述第一分词集合中剩余的词语作为第一候选关键词;
判断所述第一候选关键词是否属于预设的关键词集合;
若所述第一候选关键词属于预设的关键词集合,判定所述第一候选关键词为所述知识文本的关键词。
在一实施例中,所述从预存的知识库中提取关键词以及知识点,还包括:
将所述知识文本划分为多个候选句子;
通过预设的TextRank算法分别计算各所述候选句子的权重;
按照权重由高到低的顺序选取预设数量的候选句子组成所述知识文本的知识点。
在一实施例中,所述根据从所述知识库中提取到的关键词以及知识点构建知识图谱,包括:
以知识文本的关键词以及知识点作为知识图谱的顶点,并且在同一个知识文本的关键词和知识点之间建立边得到所述知识图谱。
在一实施例中,所述从所述错题文本中提取待查询关键词,包括
对所述错题文本进行分词处理以得到第二分词集合;
将所述第二分词集合中的停止词删除,并将所述第二分词集合中剩余的词语作为第二候选关键词;
判断所述第二候选关键词是否属于预设的关键词集合;
若所述第二候选关键词属于预设的关键词集合,判定所述第二候选关键词为所述错题文本的待查询关键词。
在一实施例中,所述待查询关键词的数量为多个,所述知识图谱包括边和顶点,其中,所述顶点包括所述关键词以及所述知识点,所述边包括所述关键词以及所述知识点的连接关系,所述从所述知识图谱中获取与所述待查询关键词关联的知识点组成知识点集合,包括:
判断各所述待查询关键词是否均为所述知识图谱的顶点;
若各所述待查询关键词均是所述知识图谱的顶点,从所述知识图谱中获取与各所述待查询关键词通过边相连的知识点;
对与各所述待查询关键词通过边相连的知识点进行去重处理以得到所述知识点集合;
若部分待查询关键词是所述知识图谱的顶点,将不是所述知识图谱的顶点的待查询关键词删除,从所述知识图谱中获取与剩余的待查询关键词通过边相连的知识点;
对与剩余的待查询关键词通过边相连的知识点进行去重处理以得到所述知识点集合。
在一实施例中,所述处理器在执行所述计算机程序而实现所述从所述错题文本中提取待查询关键词步骤之后,还实现如下步骤:
获取与所述待查询关键词关联的试题组成试题集合,并将所述试题集合发送给终端。
所述存储介质为实体的、非瞬时性的存储介质,例如可以是U盘、移动硬盘、只读存储 器(Read-Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的实体存储介质。所述计算机可读存储介质可以是非易失性,也可以是易失性。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的。例如,各个单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
本申请实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。本申请实施例装置中的单元可以根据实际需要进行合并、划分和删减。另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。
该集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,终端,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详细描述的部分,可以参见其他实施例的相关描述。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,尚且本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
Claims (20)
- 一种基于知识图谱的辅助教学方法,包括:从预存的知识库中提取关键词以及知识点;根据从所述知识库中提取到的关键词以及知识点构建知识图谱;若接收到终端发送的错题文本,从所述错题文本中提取待查询关键词;从所述知识图谱中获取与所述待查询关键词关联的知识点组成知识点集合,并将所述知识点集合发送给终端。
- 根据权利要求1所述的基于知识图谱的辅助教学方法,其中,所述知识库包括知识文本,从预存的知识库中提取所述关键词,包括:对所述知识文本进行分词处理以得到第一分词集合;将所述第一分词集合中的停止词删除,并将所述第一分词集合中剩余的词语作为第一候选关键词;判断所述第一候选关键词是否属于预设的关键词集合;若所述第一候选关键词属于所述预设的关键词集合,判定所述第一候选关键词为所述知识文本的关键词。
- 根据权利要求2所述的基于知识图谱的辅助教学方法,其中,从预存的知识库中提取所述知识点,还包括:将所述知识文本划分为多个候选句子;通过预设的TextRank算法分别计算各所述候选句子的权重;按照权重由高到低的顺序选取预设数量的候选句子组成所述知识文本的知识点。
- 根据权利要求3所述的基于知识图谱的辅助教学方法,其中,所述根据从所述知识库中提取到的关键词以及知识点构建知识图谱,包括:以所述知识文本的关键词以及所述知识文本的知识点作为知识图谱的顶点,并且在同一个知识文本的关键词和知识点之间建立边得到所述知识图谱。
- 根据权利要求4所述的基于知识图谱的辅助教学方法,其中,所述从所述错题文本中提取待查询关键词,包括对所述错题文本进行分词处理以得到第二分词集合;将所述第二分词集合中的停止词删除,并将所述第二分词集合中剩余的词语作为第二候选关键词;判断所述第二候选关键词是否属于预设的关键词集合;若所述第二候选关键词属于所述预设的关键词集合,判定所述第二候选关键词为所述错题文本的待查询关键词。
- 根据权利要求1所述的基于知识图谱的辅助教学方法,其中,所述待查询关键词的数量为多个,所述知识图谱包括边和顶点,其中,所述顶点包括所述关键词以及所述知识点,所述边包括所述关键词以及所述知识点的连接关系,所述从所述知识图谱中获取与所述待查询关键词关联的知识点组成知识点集合,包括:判断各所述待查询关键词是否均为所述知识图谱的顶点;若各所述待查询关键词均是所述知识图谱的顶点,从所述知识图谱中获取与各所述待查询关键词通过边相连的知识点;对与各所述待查询关键词通过边相连的知识点进行去重处理以得到所述知识点集合。
- 根据权利要求6所述的基于知识图谱的辅助教学方法,其中,所述从所述知识图谱中获取与所述待查询关键词关联的知识点组成知识点集合,还包括:若部分待查询关键词是所述知识图谱的顶点,将不是所述知识图谱的顶点的待查询关键词删除,从所述知识图谱中获取与剩余的待查询关键词通过边相连的知识点;对与剩余的待查询关键词通过边相连的知识点进行去重处理以得到所述知识点集合。
- 根据权利要求2所述的基于知识图谱的辅助教学方法,其中,所述将知识文本划分为 多个候选句子,包括:根据标点符号将知识文本拆分成多个候选句子。
- 根据权利要求5所述的基于知识图谱的辅助教学方法,其中,所述对所述错题文本进行分词处理以得到第二分词集合,包括:通过预设的分词工具对错题文本进行分词处理得到第二分词集合。
- 一种基于知识图谱的辅助教学装置,包括:第一提取单元,用于从预存的知识库中提取关键词以及知识点;构建单元,用于根据从所述知识库中提取到的关键词以及知识点构建知识图谱;第二提取单元,用于若接收到终端发送的错题文本,从所述错题文本中提取待查询关键词;第一发送单元,用于从所述知识图谱中获取与所述待查询关键词关联的知识点组成知识点集合,并将所述知识点集合发送给终端。
- 一种计算机设备,所述计算机设备包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器用于运行所述计算机程序,以执行如下步骤:从预存的知识库中提取关键词以及知识点;根据从所述知识库中提取到的关键词以及知识点构建知识图谱;若接收到终端发送的错题文本,从所述错题文本中提取待查询关键词;从所述知识图谱中获取与所述待查询关键词关联的知识点组成知识点集合,并将所述知识点集合发送给终端。
- 根据权利要求11所述的计算机设备,其中,所述知识库包括知识文本,从预存的知识库中提取所述关键词,包括:对所述知识文本进行分词处理以得到第一分词集合;将所述第一分词集合中的停止词删除,并将所述第一分词集合中剩余的词语作为第一候选关键词;判断所述第一候选关键词是否属于预设的关键词集合;若所述第一候选关键词属于所述预设的关键词集合,判定所述第一候选关键词为所述知识文本的关键词。
- 根据权利要求12所述的计算机设备,其中,从预存的知识库中提取所述知识点,还包括:将所述知识文本划分为多个候选句子;通过预设的TextRank算法分别计算各所述候选句子的权重;按照权重由高到低的顺序选取预设数量的候选句子组成所述知识文本的知识点。
- 根据权利要求13所述的计算机设备,其中,所述根据从所述知识库中提取到的关键词以及知识点构建知识图谱,包括:以所述知识文本的关键词以及所述知识文本的知识点作为知识图谱的顶点,并且在同一个知识文本的关键词和知识点之间建立边得到所述知识图谱。
- 根据权利要求14所述的计算机设备,其中,所述从所述错题文本中提取待查询关键词,包括:对所述错题文本进行分词处理以得到第二分词集合;将所述第二分词集合中的停止词删除,并将所述第二分词集合中剩余的词语作为第二候选关键词;判断所述第二候选关键词是否属于预设的关键词集合;若所述第二候选关键词属于所述预设的关键词集合,判定所述第二候选关键词为所述错题文本的待查询关键词。
- 根据权利要求11所述的计算机设备,其中,所述待查询关键词的数量为多个,所述知识图谱包括边和顶点,其中,所述顶点包括所述关键词以及所述知识点,所述边包括所述 关键词以及所述知识点的连接关系,所述从所述知识图谱中获取与所述待查询关键词关联的知识点组成知识点集合,包括:判断各所述待查询关键词是否均为所述知识图谱的顶点;若各所述待查询关键词均是所述知识图谱的顶点,从所述知识图谱中获取与各所述待查询关键词通过边相连的知识点;对与各所述待查询关键词通过边相连的知识点进行去重处理以得到所述知识点集合。
- 根据权利要求16所述的计算机设备,其中,所述从所述知识图谱中获取与所述待查询关键词关联的知识点组成知识点集合,还包括:若部分待查询关键词是所述知识图谱的顶点,将不是所述知识图谱的顶点的待查询关键词删除,从所述知识图谱中获取与剩余的待查询关键词通过边相连的知识点;对与剩余的待查询关键词通过边相连的知识点进行去重处理以得到所述知识点集合。
- 根据权利要求12所述的计算机设备,其中,所述将知识文本划分为多个候选句子,包括:根据标点符号将知识文本拆分成多个候选句子。
- 根据权利要求15所述的计算机设备,其中,所述对所述错题文本进行分词处理以得到第二分词集合,包括:通过预设的分词工具对错题文本进行分词处理得到第二分词集合。
- 一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其中,所述计算机程序被处理器执行时使所述处理器执行以下步骤:从预存的知识库中提取关键词以及知识点;根据从所述知识库中提取到的关键词以及知识点构建知识图谱;若接收到终端发送的错题文本,从所述错题文本中提取待查询关键词;从所述知识图谱中获取与所述待查询关键词关联的知识点组成知识点集合,并将所述知识点集合发送给终端。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011328117.4 | 2020-11-24 | ||
CN202011328117.4A CN112464659A (zh) | 2020-11-24 | 2020-11-24 | 基于知识图谱的辅助教学方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2021208716A1 true WO2021208716A1 (zh) | 2021-10-21 |
Family
ID=74799155
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/CN2021/083777 WO2021208716A1 (zh) | 2020-11-24 | 2021-03-30 | 基于知识图谱的辅助教学方法、装置、设备及存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN112464659A (zh) |
WO (1) | WO2021208716A1 (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114461813A (zh) * | 2022-01-17 | 2022-05-10 | 上海师范大学 | 一种基于知识图谱的数据推送方法、系统和存储介质 |
CN114491059A (zh) * | 2021-12-23 | 2022-05-13 | 北京科东电力控制系统有限责任公司 | 一种电网技能培训知识库构建方法及系统 |
CN114862372A (zh) * | 2022-07-06 | 2022-08-05 | 广东信聚丰科技股份有限公司 | 基于区块链的智慧教育数据防篡改处理方法及系统 |
CN116342340A (zh) * | 2023-03-31 | 2023-06-27 | 上海毅学堂智能科技有限公司 | 基于多版本教材知识图谱实现的个性化教育系统及方法 |
CN116910274A (zh) * | 2023-09-08 | 2023-10-20 | 广州市南方人力资源评价中心有限公司 | 基于知识图谱和预测模型的试题生成方法及系统 |
CN116933870A (zh) * | 2023-09-15 | 2023-10-24 | 浪潮软件股份有限公司 | 一种基于知识图谱布置弹性作业的方法、系统及装置 |
CN116955589A (zh) * | 2023-09-19 | 2023-10-27 | 山东山大鸥玛软件股份有限公司 | 一种基于教材知识图谱的智能命题方法、系统、命题终端及存储介质 |
CN116993549A (zh) * | 2023-09-18 | 2023-11-03 | 西北师范大学 | 一种用于在线学习系统的复习资源推荐方法 |
CN117390200A (zh) * | 2023-11-06 | 2024-01-12 | 南京题谱思信息科技有限公司 | 知识领域题目的解题思路识别方法 |
CN117672027A (zh) * | 2024-02-01 | 2024-03-08 | 青岛培诺教育科技股份有限公司 | 一种vr教学方法、装置、设备及介质 |
CN117892005A (zh) * | 2024-01-18 | 2024-04-16 | 广州市云蝶教育科技有限公司 | 一种基于个性知识图谱的知识盲点分类推荐方法 |
CN118377939A (zh) * | 2024-06-21 | 2024-07-23 | 杭州海亮铭优在线教育科技有限公司 | 教育数据的处理方法、设备及介质 |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112464659A (zh) * | 2020-11-24 | 2021-03-09 | 平安科技(深圳)有限公司 | 基于知识图谱的辅助教学方法、装置、设备及存储介质 |
CN113761030A (zh) * | 2021-09-07 | 2021-12-07 | 辽宁铂阳科技集团有限公司 | 一种错题统计分析系统 |
CN114020643B (zh) * | 2021-11-29 | 2023-01-20 | 中国银行股份有限公司 | 一种知识库测试方法及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140082003A1 (en) * | 2012-09-17 | 2014-03-20 | Digital Trowel (Israel) Ltd. | Document mining with relation extraction |
US20160012052A1 (en) * | 2014-07-08 | 2016-01-14 | Microsoft Corporation | Ranking tables for keyword search |
CN106355628A (zh) * | 2015-07-16 | 2017-01-25 | 中国石油化工股份有限公司 | 图文知识点标注方法和装置、图文标注的修正方法和系统 |
CN106503074A (zh) * | 2016-09-30 | 2017-03-15 | 上海高顿教育培训有限公司 | 一种题目细化分类方法 |
CN112464659A (zh) * | 2020-11-24 | 2021-03-09 | 平安科技(深圳)有限公司 | 基于知识图谱的辅助教学方法、装置、设备及存储介质 |
-
2020
- 2020-11-24 CN CN202011328117.4A patent/CN112464659A/zh active Pending
-
2021
- 2021-03-30 WO PCT/CN2021/083777 patent/WO2021208716A1/zh active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140082003A1 (en) * | 2012-09-17 | 2014-03-20 | Digital Trowel (Israel) Ltd. | Document mining with relation extraction |
US20160012052A1 (en) * | 2014-07-08 | 2016-01-14 | Microsoft Corporation | Ranking tables for keyword search |
CN106355628A (zh) * | 2015-07-16 | 2017-01-25 | 中国石油化工股份有限公司 | 图文知识点标注方法和装置、图文标注的修正方法和系统 |
CN106503074A (zh) * | 2016-09-30 | 2017-03-15 | 上海高顿教育培训有限公司 | 一种题目细化分类方法 |
CN112464659A (zh) * | 2020-11-24 | 2021-03-09 | 平安科技(深圳)有限公司 | 基于知识图谱的辅助教学方法、装置、设备及存储介质 |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114491059A (zh) * | 2021-12-23 | 2022-05-13 | 北京科东电力控制系统有限责任公司 | 一种电网技能培训知识库构建方法及系统 |
CN114461813A (zh) * | 2022-01-17 | 2022-05-10 | 上海师范大学 | 一种基于知识图谱的数据推送方法、系统和存储介质 |
CN114862372A (zh) * | 2022-07-06 | 2022-08-05 | 广东信聚丰科技股份有限公司 | 基于区块链的智慧教育数据防篡改处理方法及系统 |
CN114862372B (zh) * | 2022-07-06 | 2022-09-16 | 广东信聚丰科技股份有限公司 | 基于区块链的智慧教育数据防篡改处理方法及系统 |
CN116342340A (zh) * | 2023-03-31 | 2023-06-27 | 上海毅学堂智能科技有限公司 | 基于多版本教材知识图谱实现的个性化教育系统及方法 |
CN116342340B (zh) * | 2023-03-31 | 2023-10-17 | 上海毅学堂智能科技有限公司 | 基于多版本教材知识图谱实现的个性化教育系统及方法 |
CN116910274B (zh) * | 2023-09-08 | 2023-12-05 | 广州市南方人力资源评价中心有限公司 | 基于知识图谱和预测模型的试题生成方法及系统 |
CN116910274A (zh) * | 2023-09-08 | 2023-10-20 | 广州市南方人力资源评价中心有限公司 | 基于知识图谱和预测模型的试题生成方法及系统 |
CN116933870A (zh) * | 2023-09-15 | 2023-10-24 | 浪潮软件股份有限公司 | 一种基于知识图谱布置弹性作业的方法、系统及装置 |
CN116993549A (zh) * | 2023-09-18 | 2023-11-03 | 西北师范大学 | 一种用于在线学习系统的复习资源推荐方法 |
CN116955589A (zh) * | 2023-09-19 | 2023-10-27 | 山东山大鸥玛软件股份有限公司 | 一种基于教材知识图谱的智能命题方法、系统、命题终端及存储介质 |
CN116955589B (zh) * | 2023-09-19 | 2024-01-30 | 山东山大鸥玛软件股份有限公司 | 一种基于教材知识图谱的智能命题方法、系统、命题终端及存储介质 |
CN117390200A (zh) * | 2023-11-06 | 2024-01-12 | 南京题谱思信息科技有限公司 | 知识领域题目的解题思路识别方法 |
CN117892005A (zh) * | 2024-01-18 | 2024-04-16 | 广州市云蝶教育科技有限公司 | 一种基于个性知识图谱的知识盲点分类推荐方法 |
CN117672027A (zh) * | 2024-02-01 | 2024-03-08 | 青岛培诺教育科技股份有限公司 | 一种vr教学方法、装置、设备及介质 |
CN117672027B (zh) * | 2024-02-01 | 2024-04-30 | 青岛培诺教育科技股份有限公司 | 一种vr教学方法、装置、设备及介质 |
CN118377939A (zh) * | 2024-06-21 | 2024-07-23 | 杭州海亮铭优在线教育科技有限公司 | 教育数据的处理方法、设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112464659A (zh) | 2021-03-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2021208716A1 (zh) | 基于知识图谱的辅助教学方法、装置、设备及存储介质 | |
US11640515B2 (en) | Method and neural network system for human-computer interaction, and user equipment | |
WO2021017721A1 (zh) | 智能问答方法、装置、介质及电子设备 | |
CN106874441B (zh) | 智能问答方法和装置 | |
US9959776B1 (en) | System and method for automated scoring of texual responses to picture-based items | |
JP5043892B2 (ja) | エッセイ中の過度の反復語使用の自動評価 | |
BR122017002789A2 (pt) | sistemas e métodos para aprendizagem de idioma | |
US10372763B2 (en) | Generating probabilistic annotations for entities and relations using reasoning and corpus-level evidence | |
CN109816265B (zh) | 知识特征掌握度的评价方法、题目推荐方法及电子设备 | |
CN111382255A (zh) | 用于问答处理的方法、装置、设备和介质 | |
AU2015200401B2 (en) | Annotation-information adding program, information processing apparatus, and annotation-information adding method | |
CN109522397B (zh) | 信息处理方法及装置 | |
US11461613B2 (en) | Method and apparatus for multi-document question answering | |
US10795878B2 (en) | System and method for identifying answer key problems in a natural language question and answering system | |
CN112685550A (zh) | 智能问答方法、装置、服务器及计算机可读存储介质 | |
EP3992814A2 (en) | Method and apparatus for generating user interest profile, electronic device and storage medium | |
US20160179811A1 (en) | Scoring attributes in deep question answering systems based on algorithmic source code influences | |
CN111708870A (zh) | 基于深度神经网络的问答方法、装置及存储介质 | |
CN114896382A (zh) | 人工智能问答模型生成方法、问答方法、装置及存储介质 | |
CN114860870A (zh) | 一种文本的纠错方法及装置 | |
CN112529743B (zh) | 合同要素抽取方法、装置、电子设备及介质 | |
Tedjopranoto et al. | Correcting typographical error and understanding user intention in chatbot by combining n-gram and machine learning using schema matching technique | |
CN112069833B (zh) | 日志分析方法、日志分析装置及电子设备 | |
JP6942759B2 (ja) | 情報処理装置、プログラム及び情報処理方法 | |
CN106776533B (zh) | 用于分析一段文本的方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 21787713 Country of ref document: EP Kind code of ref document: A1 |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 21787713 Country of ref document: EP Kind code of ref document: A1 |