CN111737402A - 题库智能知识点标注系统 - Google Patents
题库智能知识点标注系统 Download PDFInfo
- Publication number
- CN111737402A CN111737402A CN202010578916.0A CN202010578916A CN111737402A CN 111737402 A CN111737402 A CN 111737402A CN 202010578916 A CN202010578916 A CN 202010578916A CN 111737402 A CN111737402 A CN 111737402A
- Authority
- CN
- China
- Prior art keywords
- question
- information
- knowledge point
- question bank
- questions
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000002372 labelling Methods 0.000 claims abstract description 75
- 239000013598 vector Substances 0.000 claims description 60
- 238000000605 extraction Methods 0.000 claims description 43
- 238000002347 injection Methods 0.000 claims description 15
- 239000007924 injection Substances 0.000 claims description 15
- 238000012163 sequencing technique Methods 0.000 claims description 15
- 239000000284 extract Substances 0.000 claims description 11
- 238000004891 communication Methods 0.000 claims description 8
- 230000009897 systematic effect Effects 0.000 claims 1
- 238000000034 method Methods 0.000 abstract description 12
- 230000006870 function Effects 0.000 description 14
- 238000010586 diagram Methods 0.000 description 11
- 238000004590 computer program Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 5
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3347—Query execution using vector based model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/338—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
- G06Q50/205—Education administration or guidance
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Tourism & Hospitality (AREA)
- Computational Linguistics (AREA)
- Educational Administration (AREA)
- Educational Technology (AREA)
- Strategic Management (AREA)
- General Health & Medical Sciences (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Primary Health Care (AREA)
- Marketing (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明题库智能知识点标注系统,利用各功能模块执行知识点标注操作:针对待标注知识点的题库,获取所述题库中所包含的所有题目以及各题目分别对应的答案;根据获取的所述题目和对应的答案,从所述题目和对应的答案中提取关键词和/或关键词组对应的关键信息,并根据所述关键信息进行信息扩大,完成对所述题库中知识点的标注操作;提高了知识点标注的效率和准确率,也使得知识点标注的整个过程更加智能。
Description
技术领域
本发明涉及数据处理技术领域,特别涉及一种题库智能知识点标注系统。
背景技术
现有技术中,针对题库中的相关知识点进行标注时,通常采用人工标注的方式进行。这种人工标注知识点的方式,基本上均需要有丰富教学研究经验的教师,对各科试题进行人工判断,从而进行具体知识点的标注,以期望达到较高的准确度。这种传统的采用人工标注的方式,费时费力,效率低且费用成本高。目前也有一部分是替代人工标注,采用相关的方式进行知识点的自动标注,但目前的这种自动标注方法仅通过题目进行标注,且准确率较低,需要大量的人工复核,不能满足目前的知识点标注需求。
发明内容
本发明提供一种题库智能知识点标注系统,旨在通过对题目和题目答案的分析进行知识点的自动标注,提高知识点标注的效率和准确率。
本发明提供了一种题库智能知识点标注系统,所述题库智能知识点标注系统包括题库信息获取模块、关键信息提取模块以及知识点标注模块;所述题库信息获取模块、关键信息提取模块以及知识点标注模块通信连接,互相配合,完成题库的智能知识点标注操作;
其中:
所述题库信息获取模块针对待标注知识点的题库,获取所述题库中所包含的所有题目以及各题目分别对应的答案,并将获取的所述题目和对应的答案发送至所述关键信息提取模块;
所述关键信息提取模块接收所述题库信息获取模块发送的所述题目和对应的答案,并根据获取的所述题目和对应的答案,从所述题目和对应的答案中提取关键词和/或关键词组对应的关键信息,并将所述关键信息发送至所述知识点标注模块;
所述知识点标注模块接收所述关键信息,并根据所述关键信息进行信息扩大,完成对所述题库中知识点的标注操作。
进一步地,所述关键信息提取模块根据获取的所述题目和对应的答案,从所述题目和对应的答案中提取关键词和/或关键词组对应的关键信息,包括:
所述关键信息提取模块对所述题目和对应的答案进行系统排序,利用系统排序,得到所述题目对应的题目信息以及每道题目分别对应的答案信息的排序值、和每道题目的题目信息中包含的题目词和/或词组的向量值、以及每道题目对应答案的答案信息中包含的答案词和/或词组的向量值;
根据所述排序值以及对应的所述向量值,确定所述题目对应的关键词和/或词组、以及每道题目对应答案的关键词和/或词组;
将确定的所述题目对应的关键词和/或词组、以及每道题目对应答案的关键词和/或词组,作为对应的所述关键信息。
进一步地,所述关键信息提取模块对所述题目和对应的答案进行系统排序,利用系统排序,得到所述题目对应的题目信息以及每道题目分别对应的答案信息的排序值以及对应的所述向量值,包括:
所述关键信息提取模块对所述题目和对应的答案利用预设排序模型进行系统排序,得到所述题目对应的题目信息以及所述答案信息的排序值Pi,j,t以及对应的向量值Xi,j和向量值Di,t;
其中,所述预设排序模型表示为公式(1):
所述公式(1)中,Pi,j,t表示第i道题目的第j个词和/或词组以及所述第i道题目对应答案的第t个词和/或词组的排序值;Xi,j表示第i道题目的第j个词和/或词组的向量值;Di,t表示第i道题目对应答案的第t个词和/或词组的向量值;其中,m表示:第i道题目中第j个词和/或词组中的j的最大取值;u表示:第i道题目对应答案的第t个词和/或词组中的t的最大取值。
进一步地,所述关键信息提取模块根据所述排序值以及对应的所述向量值,确定所述题目对应的关键词和/或词组、以及每道题目对应答案的关键词和/或词组,包括:
所述关键信息提取模块根据所述排序值的大小,将所述排序值在预设取值范围内的所述排序值对应的词和/或词组,确定为对应的所述关键词和/或词组,并将确定的所述关键词和/或词组,组成新的数组向量记做Pi,b;
其中,所述数组向量Pi,b表示:第i道题目的第b个关键词和/词组的向量值。
进一步地,所述知识点标注模块接收所述关键信息,并根据所述关键信息进行信息扩大,包括:
所述知识点标注模块基于预设信息扩大模型,利用所述题库对得到的所述关键信息进行信息扩大,得到信息扩大后题库对应的关键信息的向量值Pi,r;
其中,所述预设信息扩大模型表示为公式(2):
所述公式(2)中,Pi,r表示与第i道题目相近的题库中第r个关键词和/或词组的向量值;g表示:组成的新的数组向量Pi,b中第i道题目的关键词和/或词组的总个数;u()表示阶跃函数,当括号()内的值大于或者等于0时,所述u()对应的阶跃函数值为1,当括号()内的值小于0时,所述u()对应的阶跃函数值为0。
进一步地,所述知识点标注模块根据所述关键信息进行信息扩大,完成对所述题库中知识点的标注操作,包括:
利用信息扩大后的所述关键信息对应的向量值,基于预设标注模型,得到对应的知识点的标注值;
根据所述知识点的标注值的大小,对所述题库中知识点进行标注。
进一步地,所述知识点标注模块利用信息扩大后的所述关键信息对应的向量值,基于预设标注模型,得到对应的知识点的标注值,包括:
所述知识点标注模块利用信息扩大后的所述关键信息对应的向量值Pi,r,将所述向量值Pi,r代入所述预设标注模型中,得到对应的知识点的标注值Fi,r;
其中,所述预设标注模型表示为公式(3):
所述公式(3)中,Fi,r表示与第i道题目相近的所述题库中第r个关键词和/或词组的标注值。
进一步地,所述知识点标注模块根据所述知识点的标注值的大小,对所述题库中知识点进行标注,包括:
所述知识点标注模块将计算得到的所述标注值与预设标注阈值进行比较;
若所述标注值大于所述预设标注阈值,则表示与第i道题目相近的所述题库中第r个关键词和/或词组可以构成对应的知识点;
重复执行上述步骤,直至所述题库中每道题目与每个关键词和/或词组均筛选完成,即完成所述题库对应的知识点标注操作。
进一步地,所述题库智能知识点标注系统还包括题目更新模块,所述题目更新模块与所述题库信息获取模块、关键信息提取模块以及知识点标注模块通信连接;
所述题目更新模块接收更新的题目和/或每道题目对应答案的更新信息,并将所述更新信息发送至所述题库信息获取模块,以供所述题库智能知识点标注系统内的各功能模块互相配合,执行知识点标注的操作。
进一步地,所述题目更新模块接收到所述更新信息时,识别并获取所述更新信息所属的类别信息,并根据所述类别信息,将所述更新信息添加至与所述类别信息相匹配的题库中;其中,所述类别信息包括:年级信息和学科信息。
本发明题库智能知识点标注系统,包括互相通信连接的题库信息获取模块、关键信息提取模块以及知识点标注模块,利用上述功能模块执行对应的知识点标注操作;所述题库信息获取模块针对待标注知识点的题库,获取所述题库中所包含的所有题目以及各题目分别对应的答案,并将获取的所述题目和对应的答案发送至所述关键信息提取模块;所述关键信息提取模块接收所述题库信息获取模块发送的所述题目和对应的答案,并根据获取的所述题目和对应的答案,从所述题目和对应的答案中提取关键词和/或关键词组对应的关键信息,并将所述关键信息发送至所述知识点标注模块;所述知识点标注模块接收所述关键信息,并根据所述关键信息进行信息扩大,完成对所述题库中知识点的标注操作;提高了知识点标注的效率和准确率,也使得知识点标注的整个过程更加智能。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所指出的内容来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1是本发明题库智能知识点标注系统的一种实施方式的功能模块示意图;
图2是本发明题库智能知识点标注系统的一种实施方式的工作流程示意图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
本发明提供了一种题库智能知识点标注系统,通过对题目和题目答案的分析进而对题目和题目答案均进行知识点的自动标注,使得题库中整个知识点的标注的过程更加地智能,标注的知识点更加的准确,因此,提高了知识点标注的效率和准确率。
如图1所示,图1是本发明题库智能知识点标注系统的一种实施方式的功能模块示意图;图1所述实施例仅仅从功能上对所述智能知识点标注系统进行模块的划分。图1所述实施例中的智能知识点标注系统在功能上包括:
题库信息获取模块100、关键信息提取模块200以及知识点标注模块300;所述题库信息获取模块100、关键信息提取模块200以及知识点标注模块300通信连接,互相配合,完成题库的智能知识点标注操作。
如图2所示,图2是本发明题库智能知识点标注系统的一种实施方式的工作流程示意图;本发明题库智能知识点标注系统可以实施为图2描述的步骤S10-S30:
步骤S10、所述题库信息获取模块100针对待标注知识点的题库,获取所述题库中所包含的所有题目以及各题目分别对应的答案,并将获取的所述题目和对应的答案发送至所述关键信息提取模块200;
本发明实施例中,题库信息获取模块100根据触发的知识点标注指令,找到待标注知识点的题库,针对找到的上述待标注知识点的题库,所述题库信息获取模块100获取该题库中所包含的所有题目,同时获取每道题目各自分别对应的答案,并将获取的所述题目和每道题目对应的答案发送至对应的关键信息提取模块200。其中,在所述题库中,每道题目可能对应多个不同的答案,在获取该题目对应的答案时,若该道题目同时对应多个不同的答案,则一并获取该道题目中对应的所有答案。
步骤S20、所述关键信息提取模块200接收所述题库信息获取模块100发送的所述题目和对应的答案,并根据获取的所述题目和对应的答案,从所述题目和对应的答案中提取关键词和/或关键词组对应的关键信息,并将所述关键信息发送至所述知识点标注模块300;
所述关键信息提取模块200基于所述题库信息获取模块100发送的所述题目和对应的答案,从每道题目和每道题目各自分别对应的所有答案中进行关键信息的提取。在关键信息提取时,所述关键信息提取模块200从每道题目以及该题目对应的所有答案中提取出对应的关键词和/或关键词组,并将提取出的关键词和/或关键词组共同作为对应的关键信息。其中,若所述关键信息提取模块200提取出的题目中的关键词和/或词组,与从该题目对应的所有答案中提取的关键词和/或词组完全重叠,则针对上述完全相同的关键词和/或词组,基于该道题目以及该道题目对应的所有答案,从完全相同的几个关键词和/或词组中仅保留一个关键词和/或词组即可。
步骤S30、所述知识点标注模块300接收所述关键信息,并根据所述关键信息进行信息扩大,完成对所述题库中知识点的标注操作。
所述知识点标注模块300根据所述关键信息提取模块200提取出的包含关键词和/或词组的关键信息,对所述关键信息进行信息扩大,从而基于信息扩大后的关键信息,完成对所述题库中知识点的标注操作。
在一个实施例中,图2所述实施例的步骤S20中,所述关键信息提取模块200根据获取的所述题目和对应的答案,从所述题目和对应的答案中提取关键词和/或关键词组对应的关键信息,可以按照如下技术手段实施:
所述关键信息提取模块对所述题目和对应的答案进行系统排序,利用系统排序,得到所述题目对应的题目信息以及每道题目分别对应的答案信息的排序值、和每道题目的题目信息中包含的题目词和/或词组的向量值、以及每道题目对应答案的答案信息中包含的答案词和/或词组的向量值;根据所述排序值以及对应的所述向量值,确定所述题目对应的关键词和/或词组、以及每道题目对应答案的关键词和/或词组;将确定的所述题目对应的关键词和/或词组、以及每道题目对应答案的关键词和/或词组,作为对应的所述关键信息。
本发明实施例中,所述关键信息提取模块200对所述题目和对应的答案进行系统排序,利用系统排序,得到所述题目对应的题目信息以及每道题目分别对应的答案信息的排序值以及对应的所述向量值时,利用预设排序模型进行。
比如,所述关键信息提取模块200利用描述的所述预设排序模型对所述题目和对应的答案进行系统排序,得到所述题目对应的题目信息以及所述答案信息的排序值Pi,j,t和向量值以及对应的向量值Xi,j和向量值Di,t。
在一个具体的应用场景中,所述关键信息提取模块200采用的预设排序模型可以表示为公式(1):
所述公式(1)中,Pi,j,t表示第i道题目的第j个词和/或词组以及所述第i道题目对应答案的第t个词和/或词组的排序值;Xi,j表示第i道题目的第j个词和/或词组的向量值;Di,t表示第i道题目对应答案的第t个词和/或词组的向量值;其中,m表示:第i道题目中第j个词和/或词组中的j的最大取值;u表示:第i道题目对应答案的第t个词和/或词组中的t的最大取值。
进一步地,所述关键信息提取模块200根据计算得到的所述排序值Pi,j,t以及对应的向量值Xi,j和向量值Di,t,确定所述题目对应的关键词和/或词组、以及每道题目对应答案的关键词和/或词组,包括:
所述关键信息提取模块200根据所述排序值的大小,将所述排序值在预设取值范围内的所述排序值对应的词和/或词组,确定为对应的所述关键词和/或词组,并将确定的所述关键词和/或词组,组成新的数组向量记做Pi,b;其中,所述数组向量Pi,b表示:第i道题目的第b个关键词和/词组的向量值。
本发明实施例中,所述关键信息提取模块200根据所述排序值Pi,j,t的大小,挑选出在预设取值范围内的所述排序值,比如,在一个具体的应用场景中,若0.85<Pi,j,t<1.25,则表示第i道题目的第j个词和/或词组与对应答案的第t个词和/或词组为关键的词和/或词组;将所有满足上述条件的词和/或词组,组成新的数组向量Pi,b,所述新的数组向量Pi,b即为所述关键词和/或词组。
在一个实施例中,图2所述实施例的步骤S30中,所述知识点标注模块300接收所述关键信息,并根据所述关键信息进行信息扩大,可以按照如下技术手段实施:
所述知识点标注模块300基于预设信息扩大模型,利用所述题库对得到的所述关键信息进行信息扩大,得到信息扩大后题库对应的关键信息的向量值Pi,r;
其中,在一个具体的应用场景中,所述预设信息扩大模型可以表示为如下描述的公式(2):
所述公式(2)中,Pi,r表示与第i道题目相近的题库中第r个关键词和/或词组的向量值;g表示:组成的新的数组向量Pi,b中第i道题目的关键词和/或词组的总个数;u()表示阶跃函数,当括号()内的值大于或者等于0时,所述u()对应的阶跃函数值为1,当括号()内的值小于0时,所述u()对应的阶跃函数值为0。
进一步地,所述知识点标注模块300基于上述信息扩大后的所述关键信息,完成对所述题库中知识点的标注操作,可以按照如下技术手段实施:
利用信息扩大后的所述关键信息对应的向量值,基于预设标注模型,得到对应的知识点的标注值;根据所述知识点的标注值的大小,对所述题库中知识点进行标注。
进一步地,所述知识点标注模块300利用信息扩大后的所述关键信息对应的所述向量值Pi,r,将所述向量值Pi,r代入所述预设标注模型中,得到对应的知识点的标注值Fi,r;
其中,在一个具体的应用场景中,所述预设标注模型可以表示为如下描述的公式(3):
所述公式(3)中,Fi,r表示与第i道题目相近的所述题库中第r个关键词和/或词组的标注值。
进一步地,所述知识点标注模块300根据所述知识点的所述标注值Fi,r的大小,对所述题库中知识点进行标注,可以按照如下技术手段实施:
所述知识点标注模块将计算得到的所述标注值与预设标注阈值进行比较;
若所述标注值大于所述预设标注阈值,则表示与第i道题目相近的所述题库中第r个关键词和/或词组可以构成对应的知识点;
重复执行上述步骤,直至所述题库中每道题目与每个关键词和/或词组均筛选完成,即完成所述题库对应的知识点标注操作。
比如,在一个具体的应用场景中,假设所述预设标注阈值为0.98,则当所述标注值Fi,r>0.98时,则表示与第i道题目相近的所述题库中第r个关键词和/或词组可以构成对应的知识点,重复执行上述操作,直至每道题的每个关键词和/或词组都完成筛选,则如此便完成了针对该题库的智能知识点的标注操作。
基于上述实施例的描述,在一个实施例中,图1所示的题库智能知识点标注系统还包括题目更新模块400,所述题目更新模块400与所述题库信息获取模块100、关键信息提取模块200以及知识点标注模块300通信连接。
所述题目更新模块400接收更新的题目和/或每道题目对应答案的更新信息,并将所述更新信息发送至所述题库信息获取模块100,以供所述题库智能知识点标注系统内的各功能模块互相配合,执行知识点标注的操作。
进一步地,在一个实施例中,本发明实施例中的题库可以根据不同的科目、不同的年级以及不同的难度等级等分类标准,对题库的类别进行区分,以满足不同年级、不同学科、不同应用场景等的具体需求。
本发明实施例中,所述题目更新模块400接收到题库对应的所述更新信息时,识别并获取所述更新信息所属的类别信息,并根据所述类别信息,将所述更新信息添加至与所述类别信息相匹配的题库中;其中,所述类别信息包括但不限于:年级信息、学科信息以及难度等级信息。
本发明题库智能知识点标注系统,包括互相通信连接的题库信息获取模块、关键信息提取模块以及知识点标注模块,利用上述功能模块执行对应的知识点标注操作;所述题库信息获取模块针对待标注知识点的题库,获取所述题库中所包含的所有题目以及各题目分别对应的答案,并将获取的所述题目和对应的答案发送至所述关键信息提取模块;所述关键信息提取模块接收所述题库信息获取模块发送的所述题目和对应的答案,并根据获取的所述题目和对应的答案,从所述题目和对应的答案中提取关键词和/或关键词组对应的关键信息,并将所述关键信息发送至所述知识点标注模块;所述知识点标注模块接收所述关键信息,并根据所述关键信息进行信息扩大,完成对所述题库中知识点的标注操作;提高了知识点标注的效率和准确率,也使得知识点标注的整个过程更加智能。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (10)
1.一种题库智能知识点标注系统,其特征在于,所述题库智能知识点标注系统包括题库信息获取模块、关键信息提取模块以及知识点标注模块;所述题库信息获取模块、关键信息提取模块以及知识点标注模块通信连接,互相配合,完成题库的智能知识点标注操作;
其中:
所述题库信息获取模块针对待标注知识点的题库,获取所述题库中所包含的所有题目以及各题目分别对应的答案,并将获取的所述题目和对应的答案发送至所述关键信息提取模块;
所述关键信息提取模块接收所述题库信息获取模块发送的所述题目和对应的答案,并根据获取的所述题目和对应的答案,从所述题目和对应的答案中提取关键词和/或关键词组对应的关键信息,并将所述关键信息发送至所述知识点标注模块;
所述知识点标注模块接收所述关键信息,并根据所述关键信息进行信息扩大,完成对所述题库中知识点的标注操作。
2.如权利要求1所述的题库智能知识点标注系统,其特征在于,所述关键信息提取模块根据获取的所述题目和对应的答案,从所述题目和对应的答案中提取关键词和/或关键词组对应的关键信息,包括:
所述关键信息提取模块对所述题目和对应的答案进行系统排序,利用系统排序,得到所述题目对应的题目信息以及每道题目分别对应的答案信息的排序值、和每道题目的题目信息中包含的题目词和/或词组的向量值、以及每道题目对应答案的答案信息中包含的答案词和/或词组的向量值;
根据所述排序值以及对应的所述向量值,确定所述题目对应的关键词和/或词组、以及每道题目对应答案的关键词和/或词组;
将确定的所述题目对应的关键词和/或词组、以及每道题目对应答案的关键词和/或词组,作为对应的所述关键信息。
3.如权利要求2所述的题库智能知识点标注系统,其特征在于,所述关键信息提取模块对所述题目和对应的答案进行系统排序,利用系统排序,得到所述题目对应的题目信息以及每道题目分别对应的答案信息的排序值以及对应的所述向量值,包括:
所述关键信息提取模块对所述题目和对应的答案利用预设排序模型进行系统排序,得到所述题目对应的题目信息以及所述答案信息的排序值Pi,j,t以及对应的向量值Xi,j和向量值Di,t;
其中,所述预设排序模型表示为公式(1):
所述公式(1)中,Pi,j,t表示第i道题目的第j个词和/或词组以及所述第i道题目对应答案的第t个词和/或词组的排序值;Xi,j表示第i道题目的第j个词和/或词组的向量值;Di,t表示第i道题目对应答案的第t个词和/或词组的向量值;其中,m表示:第i道题目中第j个词和/或词组中的j的最大取值;u表示:第i道题目对应答案的第t个词和/或词组中的t的最大取值。
4.如权利要求3所述的题库智能知识点标注系统,其特征在于,所述关键信息提取模块根据所述排序值以及对应的所述向量值,确定所述题目对应的关键词和/或词组、以及每道题目对应答案的关键词和/或词组,包括:
所述关键信息提取模块根据所述排序值的大小,将所述排序值在预设取值范围内的所述排序值对应的词和/或词组,确定为对应的所述关键词和/或词组,并将确定的所述关键词和/或词组,组成新的数组向量记做Pi,b;
其中,所述数组向量Pi,b表示:第i道题目的第b个关键词和/词组的向量值。
5.如权利要求1至4任一项所述的题库智能知识点标注系统,其特征在于,所述知识点标注模块接收所述关键信息,并根据所述关键信息进行信息扩大,包括:
所述知识点标注模块基于预设信息扩大模型,利用所述题库对得到的所述关键信息进行信息扩大,得到信息扩大后题库对应的关键信息的向量值Pi,r;
其中,所述预设信息扩大模型表示为公式(2):
所述公式(2)中,Pi,r表示与第i道题目相近的题库中第r个关键词和/或词组的向量值;g表示:组成的新的数组向量Pi,b中第i道题目的关键词和/或词组的总个数;u()表示阶跃函数,当括号()内的值大于或者等于0时,所述u()对应的阶跃函数值为1,当括号()内的值小于0时,所述u()对应的阶跃函数值为0。
6.如权利要求5所述的题库智能知识点标注系统,其特征在于,所述知识点标注模块根据所述关键信息进行信息扩大,完成对所述题库中知识点的标注操作,包括:
利用信息扩大后的所述关键信息对应的向量值,基于预设标注模型,得到对应的知识点的标注值;
根据所述知识点的标注值的大小,对所述题库中知识点进行标注。
8.如权利要求7所述的题库智能知识点标注系统,其特征在于,所述知识点标注模块根据所述知识点的标注值的大小,对所述题库中知识点进行标注,包括:
所述知识点标注模块将计算得到的所述标注值与预设标注阈值进行比较;
若所述标注值大于所述预设标注阈值,则表示与第i道题目相近的所述题库中第r个关键词和/或词组可以构成对应的知识点;
重复执行上述步骤,直至所述题库中每道题目与每个关键词和/或词组均筛选完成,即完成所述题库对应的知识点标注操作。
9.如权利要求1至4任一项所述的题库智能知识点标注系统,其特征在于,所述题库智能知识点标注系统还包括题目更新模块,所述题目更新模块与所述题库信息获取模块、关键信息提取模块以及知识点标注模块通信连接;
所述题目更新模块接收更新的题目和/或每道题目对应答案的更新信息,并将所述更新信息发送至所述题库信息获取模块,以供所述题库智能知识点标注系统内的各功能模块互相配合,执行知识点标注的操作。
10.如权利要求9所述的题库智能知识点标注系统,其特征在于,所述题目更新模块接收到所述更新信息时,识别并获取所述更新信息所属的类别信息,并根据所述类别信息,将所述更新信息添加至与所述类别信息相匹配的题库中;其中,所述类别信息包括:年级信息和学科信息。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010578916.0A CN111737402A (zh) | 2020-06-23 | 2020-06-23 | 题库智能知识点标注系统 |
CN202110504665.6A CN113051363A (zh) | 2020-06-23 | 2021-05-10 | 题库智能知识点标注系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010578916.0A CN111737402A (zh) | 2020-06-23 | 2020-06-23 | 题库智能知识点标注系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111737402A true CN111737402A (zh) | 2020-10-02 |
Family
ID=72650576
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010578916.0A Withdrawn CN111737402A (zh) | 2020-06-23 | 2020-06-23 | 题库智能知识点标注系统 |
CN202110504665.6A Pending CN113051363A (zh) | 2020-06-23 | 2021-05-10 | 题库智能知识点标注系统 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110504665.6A Pending CN113051363A (zh) | 2020-06-23 | 2021-05-10 | 题库智能知识点标注系统 |
Country Status (1)
Country | Link |
---|---|
CN (2) | CN111737402A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112183112A (zh) * | 2020-10-09 | 2021-01-05 | 南京大学 | 一种软件工程教学平台 |
CN112395858A (zh) * | 2020-11-17 | 2021-02-23 | 华中师范大学 | 融合试题数据和解答数据的多知识点标注方法和系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2803928A1 (fr) * | 2000-01-18 | 2001-07-20 | Auralog | Systeme de traitement de donnees pour l'evaluation d'un texte |
CN105930319A (zh) * | 2016-05-09 | 2016-09-07 | 北京新唐思创教育科技有限公司 | 建立获取题目知识点模型、获取题目知识点的方法和装置 |
CN107590127A (zh) * | 2017-09-21 | 2018-01-16 | 北京师范大学 | 一种题库知识点自动标注方法及系统 |
CN108182177A (zh) * | 2018-01-24 | 2018-06-19 | 谢德刚 | 一种数学试题知识点自动化标注方法和装置 |
-
2020
- 2020-06-23 CN CN202010578916.0A patent/CN111737402A/zh not_active Withdrawn
-
2021
- 2021-05-10 CN CN202110504665.6A patent/CN113051363A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2803928A1 (fr) * | 2000-01-18 | 2001-07-20 | Auralog | Systeme de traitement de donnees pour l'evaluation d'un texte |
CN105930319A (zh) * | 2016-05-09 | 2016-09-07 | 北京新唐思创教育科技有限公司 | 建立获取题目知识点模型、获取题目知识点的方法和装置 |
CN107590127A (zh) * | 2017-09-21 | 2018-01-16 | 北京师范大学 | 一种题库知识点自动标注方法及系统 |
CN108182177A (zh) * | 2018-01-24 | 2018-06-19 | 谢德刚 | 一种数学试题知识点自动化标注方法和装置 |
Non-Patent Citations (1)
Title |
---|
吕征达: ""基于机器学习的试题多知识点和认知动词自动标注研究"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112183112A (zh) * | 2020-10-09 | 2021-01-05 | 南京大学 | 一种软件工程教学平台 |
CN112395858A (zh) * | 2020-11-17 | 2021-02-23 | 华中师范大学 | 融合试题数据和解答数据的多知识点标注方法和系统 |
CN112395858B (zh) * | 2020-11-17 | 2024-04-23 | 华中师范大学 | 融合试题数据和解答数据的多知识点标注方法和系统 |
Also Published As
Publication number | Publication date |
---|---|
CN113051363A (zh) | 2021-06-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102508859B (zh) | 一种基于网页特征的广告分类方法及装置 | |
CN109582793A (zh) | 模型训练方法、客服系统及数据标注系统、可读存储介质 | |
CN106339756A (zh) | 训练数据的生成方法、搜索方法以及装置 | |
CN108845988B (zh) | 一种实体识别方法、装置、设备及计算机可读存储介质 | |
CN109308321A (zh) | 一种知识问答方法、知识问答系统及计算机可读存储介质 | |
CN107527070B (zh) | 维度数据和指标数据的识别方法、存储介质及服务器 | |
CN104239359B (zh) | 基于多模态的图像标注装置以及方法 | |
CN104966105A (zh) | 一种鲁棒机器错误检索方法与系统 | |
CN113051363A (zh) | 题库智能知识点标注系统 | |
CN111858896B (zh) | 一种基于深度学习的知识库问答方法 | |
WO2022134586A1 (zh) | 基于元学习的目标分类方法、装置、设备和存储介质 | |
CN112328800A (zh) | 自动生成编程规范问题答案的系统及方法 | |
Robbes et al. | Leveraging small software engineering data sets with pre-trained neural networks | |
CN110968708A (zh) | 一种教育信息资源属性标注方法及系统 | |
CN112308129A (zh) | 一种基于深度学习的植物线虫数据自动标注和分类识别方法 | |
CN111930937A (zh) | 基于bert的智慧政务文本多分类方法及系统 | |
CN111783464A (zh) | 一种面向电力的领域实体识别方法、系统及存储介质 | |
CN113220854B (zh) | 机器阅读理解的智能对话方法及装置 | |
CN117093260B (zh) | 一种基于决策树分类算法的融合模型网站结构解析方法 | |
CN110362828B (zh) | 网络资讯风险识别方法及系统 | |
CN116228361A (zh) | 基于特征匹配的课程推荐方法、装置、设备和存储介质 | |
CN113886602A (zh) | 一种基于多粒度认知的领域知识库实体识别方法 | |
CN110727695B (zh) | 面向新型供电城轨列车数据运维的自然语言查询解析方法 | |
CN113836296A (zh) | 一种佛学问答摘要的生成方法、装置、设备及存储介质 | |
CN112579666A (zh) | 智能问答系统和方法及相关设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20201002 |