CN117421426B - 基于人工智能辅助的知识点标注方法及系统 - Google Patents
基于人工智能辅助的知识点标注方法及系统 Download PDFInfo
- Publication number
- CN117421426B CN117421426B CN202311736365.6A CN202311736365A CN117421426B CN 117421426 B CN117421426 B CN 117421426B CN 202311736365 A CN202311736365 A CN 202311736365A CN 117421426 B CN117421426 B CN 117421426B
- Authority
- CN
- China
- Prior art keywords
- text
- knowledge point
- offline learning
- learning training
- point labeling
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000002372 labelling Methods 0.000 title claims abstract description 436
- 238000013473 artificial intelligence Methods 0.000 title claims abstract description 12
- 238000012545 processing Methods 0.000 claims abstract description 135
- 238000000034 method Methods 0.000 claims abstract description 78
- 238000005065 mining Methods 0.000 claims abstract description 29
- 238000012549 training Methods 0.000 claims description 390
- 230000008859 change Effects 0.000 claims description 41
- 238000004590 computer program Methods 0.000 claims description 7
- 238000003860 storage Methods 0.000 claims description 4
- 230000008569 process Effects 0.000 abstract description 29
- 230000009286 beneficial effect Effects 0.000 abstract description 4
- 230000033001 locomotion Effects 0.000 description 11
- 238000010672 photosynthesis Methods 0.000 description 10
- 230000029553 photosynthesis Effects 0.000 description 10
- 230000000694 effects Effects 0.000 description 9
- 239000000284 extract Substances 0.000 description 9
- 230000005540 biological transmission Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 238000009826 distribution Methods 0.000 description 5
- 230000008451 emotion Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 230000014509 gene expression Effects 0.000 description 5
- 230000033764 rhythmic process Effects 0.000 description 5
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 4
- 241001465754 Metazoa Species 0.000 description 4
- 230000008439 repair process Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 239000012141 concentrate Substances 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 229910002092 carbon dioxide Inorganic materials 0.000 description 2
- 239000001569 carbon dioxide Substances 0.000 description 2
- 230000006378 damage Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 239000000049 pigment Substances 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 238000010792 warming Methods 0.000 description 2
- 241000554155 Andes Species 0.000 description 1
- 230000003796 beauty Effects 0.000 description 1
- 229930002875 chlorophyll Natural products 0.000 description 1
- 235000019804 chlorophyll Nutrition 0.000 description 1
- ATNHDLDRLWWWCB-AENOIHSZSA-M chlorophyll a Chemical compound C1([C@@H](C(=O)OC)C(=O)C2=C3C)=C2N2C3=CC(C(CC)=C3C)=[N+]4C3=CC3=C(C=C)C(C)=C5N3[Mg-2]42[N+]2=C1[C@@H](CCC(=O)OC\C=C(/C)CCC[C@H](C)CCC[C@H](C)CCCC(C)C)[C@H](C)C2=C5 ATNHDLDRLWWWCB-AENOIHSZSA-M 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000012850 discrimination method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- VUZPPFZMUPKLLV-UHFFFAOYSA-N methane;hydrate Chemical compound C.O VUZPPFZMUPKLLV-UHFFFAOYSA-N 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000000243 photosynthetic effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000009987 spinning Methods 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/26—Discovering frequent patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
- G06Q50/205—Education administration or guidance
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Educational Technology (AREA)
- Educational Administration (AREA)
- Tourism & Hospitality (AREA)
- Evolutionary Computation (AREA)
- Strategic Management (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Databases & Information Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Animal Behavior & Ethology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及人工智能技术领域,特别涉及一种基于人工智能辅助的知识点标注方法及系统。本发明通过使用文本知识点标注网络进行文本知识语义挖掘和判别,可以提高标注的精度,准确地识别和提取出与该学科相关的知识点,并生成相应的知识点标注建议;有助于确保对离线学习文本进行准确和一致的知识点标注,提高标注的质量和精度;使用文本知识点标注网络进行自动化的知识点标注处理可以大幅提高标注的时效性,利用网络模型可以快速且自动地处理大量文本数据,节省大量的时间和人力资源,加快了知识点标注的进程,通过提供知识点标注事项描述和建议,网络模型还可以指导标注人员进行有效的标注,进一步提高标注的时效性。
Description
技术领域
本发明涉及人工智能技术领域,特别涉及一种基于人工智能辅助的知识点标注方法及系统。
背景技术
对离线学习文本中的内容进行知识点标注处理是将文本中的关键信息和重要概念进行分类和标记的过程。这样做的目的是提取出文本中的核心知识点,方便后续的知识管理、检索和应用。在离线学习文本中,知识点标注处理可以有多种应用。例如,对于教育领域的学习材料,可以将每个段落或章节标注为相应的知识点,以便学生更好地理解和掌握知识。因此,知识点标注处理是一种将离线学习文本中的重要信息进行优化处理的方法之一,能够提高知识的组织性、可搜索性和应用性。
发明内容
为改善相关技术中存在的技术问题,本发明提供了一种基于人工智能辅助的知识点标注方法及系统。
第一方面,本发明实施例提供了一种基于人工智能辅助的知识点标注方法,应用于AI知识点标注分析系统,所述方法包括:
将待标注离线学习文本加载到文本知识点标注网络,利用所述文本知识点标注网络对所述待标注离线学习文本进行文本知识语义挖掘,生成所述待标注离线学习文本的学习文本知识语义;
利用所述文本知识点标注网络对所述待标注离线学习文本的学习文本知识语义进行处理,得到所述待标注离线学习文本的知识点标注事项描述,所述知识点标注事项描述用于表征所述待标注离线学习文本的知识点标注种类;
利用所述文本知识点标注网络,依据所述待标注离线学习文本的知识点标注事项描述进行判别,生成所述待标注离线学习文本的知识点标注建议。
在一些方案中,所述文本知识点标注网络的调试方法包括:
将多个离线学习训练文本的学习文本知识语义加载到文本知识点标注网络,利用所述文本知识点标注网络,基于局部特征聚焦规则对所述多个离线学习训练文本的学习文本知识语义进行特征处理,得到所述多个离线学习训练文本的第一置信系数;
利用所述文本知识点标注网络,依据所述多个离线学习训练文本的第一置信系数对所述多个离线学习训练文本的学习文本知识语义进行处理,得到所述多个离线学习训练文本的文本资源描述和知识点标注事项描述,所述文本资源描述用于表征离线学习训练文本所对应的科目特征,所述知识点标注事项描述用于表征离线学习训练文本的知识点标注种类;
依据所述多个离线学习训练文本的文本资源描述中每两个文本资源描述之间的第一比较结果以及所述多个离线学习训练文本的知识点标注事项描述中每两个知识点标注事项描述之间的第二比较结果,对所述文本知识点标注网络进行调试。
在一些方案中,所述利用所述文本知识点标注网络,依据所述多个离线学习训练文本的第一置信系数对所述多个离线学习训练文本的学习文本知识语义进行处理,得到所述多个离线学习训练文本的文本资源描述和知识点标注事项描述包括:
针对所述多个离线学习训练文本中的任一离线学习训练文本,利用所述文本知识点标注网络,将所述离线学习训练文本的第一置信系数与所述离线学习训练文本的学习文本知识语义进行特征乘法运算,得到所述离线学习训练文本的文本资源描述;
将所述离线学习训练文本的第二置信系数与所述离线学习训练文本的学习文本知识语义进行特征乘法运算,得到所述离线学习训练文本的知识点标注事项描述,所述第二置信系数与所述第一置信系数的和值为设定变量。
在一些方案中,所述依据所述多个离线学习训练文本的文本资源描述中每两个文本资源描述之间的第一比较结果以及所述多个离线学习训练文本的知识点标注事项描述中每两个知识点标注事项描述之间的第二比较结果,对所述文本知识点标注网络进行调试包括:
基于多个离线学习积极训练文本集中每两个离线学习积极训练文本的文本资源描述之间的第一比较结果,对所述文本知识点标注网络进行调试,各个所述离线学习积极训练文本集包括三个离线学习积极训练文本,所述离线学习积极训练文本为所述多个离线学习训练文本中目标知识点标注种类的离线学习训练文本;
基于多个离线学习训练文本集中每两个离线学习训练文本的知识点标注事项描述中每两个知识点标注事项描述之间的第二比较结果,对所述文本知识点标注网络进行调试,各个所述离线学习训练文本集包括所述多个离线学习训练文本中的三个离线学习训练文本。
在一些方案中,所述文本知识点标注网络包括第一文本知识点处理分支和第二文本知识点处理分支,所述基于多个离线学习积极训练文本集中每两个离线学习积极训练文本的文本资源描述之间的第一比较结果,对所述文本知识点标注网络进行调试包括:
针对所述多个离线学习积极训练文本集中的任一离线学习积极训练文本集,基于第一离线学习训练文本的文本资源描述与第二离线学习训练文本的文本资源描述之间的第一比较结果,以及所述第一离线学习训练文本的文本资源描述与第三离线学习训练文本的文本资源描述之间的第一比较结果,对所述第一文本知识点处理分支进行调试,所述第一离线学习训练文本、所述第二离线学习训练文本以及所述第三离线学习训练文本皆属于所述离线学习积极训练文本集;
所述基于多个离线学习训练文本集中每两个离线学习训练文本的知识点标注事项描述中每两个知识点标注事项描述之间的第二比较结果,对所述文本知识点标注网络进行调试包括:
针对所述多个离线学习训练文本集中的任一离线学习训练文本集,基于目标离线学习训练文本的知识点标注事项描述与关联离线学习训练文本的知识点标注事项描述中每两个知识点标注事项描述之间的第二比较结果、所述目标离线学习训练文本的知识点标注事项描述与互斥离线学习训练文本的知识点标注事项描述中每两个知识点标注事项描述之间的第二比较结果以及所述第一文本知识点处理分支的调试代价指标的变化指数,对所述第二文本知识点处理分支进行调试,所述关联离线学习训练文本与所述目标离线学习训练文本为相同知识点标注种类的离线学习训练文本,所述互斥离线学习训练文本与所述目标离线学习训练文本为不同知识点标注种类的离线学习训练文本,所述目标离线学习训练文本、所述关联离线学习训练文本以及所述互斥离线学习训练文本皆属于所述多个离线学习训练文本。
在一些方案中,所述基于第一离线学习训练文本的文本资源描述与第二离线学习训练文本的文本资源描述之间的第一比较结果,以及所述第一离线学习训练文本的文本资源描述与第三离线学习训练文本的文本资源描述之间的第一比较结果,对所述第一文本知识点处理分支进行调试包括:
依据所述第一离线学习训练文本的第一文本资源描述以及所述第二离线学习训练文本的第二文本资源描述之间的第一比较结果,确定第一调试变量,所述第一离线学习训练文本的第一文本资源描述为所述第一文本知识点处理分支挖掘的文本资源描述,所述第二离线学习训练文本的第二文本资源描述为所述第二文本知识点处理分支挖掘的文本资源描述;
依据所述第一离线学习训练文本的第一文本资源描述以及所述第三离线学习训练文本的第三文本资源描述之间的第一比较结果,确定第二调试变量,所述第三离线学习训练文本的第三文本资源描述为所述第二文本知识点处理分支挖掘的文本资源描述;
依据所述第一调试变量和所述第二调试变量,确定所述第一文本知识点处理分支的调试代价指标的变化指数;
依据所述第一文本知识点处理分支的调试代价指标的变化指数,对所述第一文本知识点处理分支进行调试。
在一些方案中,所述基于目标离线学习训练文本的知识点标注事项描述与关联离线学习训练文本的知识点标注事项描述中每两个知识点标注事项描述之间的第二比较结果、所述目标离线学习训练文本的知识点标注事项描述与互斥离线学习训练文本的知识点标注事项描述中每两个知识点标注事项描述之间的第二比较结果以及所述第一文本知识点处理分支的调试代价指标的变化指数,对所述第二文本知识点处理分支进行调试包括:
依据所述目标离线学习训练文本的知识点标注事项描述与所述关联离线学习训练文本的知识点标注事项描述中每两个知识点标注事项描述之间的第二比较结果,以及所述目标离线学习训练文本的知识点标注事项描述与所述互斥离线学习训练文本的知识点标注事项描述中每两个知识点标注事项描述之间的第二比较结果,确定所述第二文本知识点处理分支的调试代价指标的变化指数;
依据所述第一文本知识点处理分支的调试代价指标的变化指数以及所述第二文本知识点处理分支的调试代价指标的变化指数,对所述第二文本知识点处理分支进行调试。
在一些方案中,所述依据所述目标离线学习训练文本的知识点标注事项描述与所述关联离线学习训练文本的知识点标注事项描述中每两个知识点标注事项描述之间的第二比较结果,以及所述目标离线学习训练文本的知识点标注事项描述与所述互斥离线学习训练文本的知识点标注事项描述中每两个知识点标注事项描述之间的第二比较结果,确定所述第二文本知识点处理分支的调试代价指标的变化指数包括:
依据所述目标离线学习训练文本的第一知识点标注事项描述以及所述关联离线学习训练文本的第二知识点标注事项描述之间的第二比较结果,确定第三调试变量,所述目标离线学习训练文本的第一知识点标注事项描述为所述第一文本知识点处理分支挖掘的知识点标注事项描述,所述关联离线学习训练文本的第二知识点标注事项描述为所述第二文本知识点处理分支挖掘的知识点标注事项描述;
依据所述目标离线学习训练文本的第一知识点标注事项描述以及所述互斥离线学习训练文本的第三知识点标注事项描述之间的第二比较结果,确定第四调试变量,所述互斥离线学习训练文本的第三知识点标注事项描述为所述第二文本知识点处理分支挖掘的知识点标注事项描述;
依据所述第三调试变量和所述第四调试变量,确定所述第二文本知识点处理分支的调试代价指标的变化指数。
在一些方案中,所述依据所述多个离线学习训练文本的文本资源描述中每两个文本资源描述之间的第一比较结果以及所述多个离线学习训练文本的知识点标注事项描述中每两个知识点标注事项描述之间的第二比较结果,对所述文本知识点标注网络进行调试之前,所述方法还包括:
基于局部特征聚焦规则对所述多个离线学习训练文本的知识点标注事项描述进行特征处理,得到所述多个离线学习训练文本的目标知识点标注事项描述;
所述依据所述多个离线学习训练文本的文本资源描述中每两个文本资源描述之间的第一比较结果以及所述多个离线学习训练文本的知识点标注事项描述中每两个知识点标注事项描述之间的第二比较结果,对所述文本知识点标注网络进行调试包括:
所述依据所述多个离线学习训练文本的文本资源描述中每两个文本资源描述之间的第一比较结果以及所述多个离线学习训练文本的目标知识点标注事项描述之间的第二比较结果,对所述文本知识点标注网络进行调试。
在一些方案中,所述方法还包括:
基于多个离线学习训练文本的知识点标注事项描述以及所述多个离线学习训练文本的目标知识点标注建议,对所述文本知识点标注网络进行调试。
在一些方案中,所述基于多个离线学习训练文本的知识点标注事项描述以及所述多个离线学习训练文本的目标知识点标注建议,对所述文本知识点标注网络进行调试包括:
利用所述文本知识点标注网络,依据所述多个离线学习训练文本的知识点标注事项描述进行判别,生成所述多个离线学习训练文本的知识点标注预测建议;
依据所述多个离线学习训练文本的知识点标注预测建议和目标知识点标注建议之间的第三比较结果,对所述文本知识点标注网络进行调试。
第二方面,本发明还提供了一种AI知识点标注分析系统,包括处理器和存储器;所述处理器和所述存储器通信连接,所述处理器用于从所述存储器中读取计算机程序并执行,以实现上述的方法。
第三方面,本发明还提供了一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现上述的方法。
应用本发明实施例,通过使用文本知识点标注网络进行文本知识语义挖掘和判别,可以提高标注的精度。这是因为该网络经过训练,具备了对特定学科领域的理解和知识提取能力。它可以准确地识别和提取出与该学科相关的知识点,并生成相应的知识点标注建议。这有助于确保对离线学习文本进行准确和一致的知识点标注,提高标注的质量和精度。其次,使用文本知识点标注网络进行自动化的知识点标注处理可以大幅提高标注的时效性。相比人工逐篇阅读和标注离线学习文本,利用网络模型可以快速且自动地处理大量文本数据。这样可以节省大量的时间和人力资源,加快了知识点标注的进程。同时,通过提供知识点标注事项描述和建议,网络模型还可以指导标注人员进行有效的标注,进一步提高标注的时效性。
进一步地,在调试文本知识点标注网络时,基于局部特征聚焦规则对离线学习训练文本的学习文本知识语义进行了特征分析,以获得第一置信系数。通过第一置信系数对学习文本知识语义进行处理,得到离线学习训练文本的文本资源描述和知识点标注事项描述。基于文本资源描述之间的第一比较结果以及知识点标注事项描述之间的第二比较结果对文本知识点标注网络进行调试时,无需参考先验调试依据,这样能够提高文本知识点标注网络调试的灵活性,尽可能节约文本知识点标注网络调试所需的计算资源开销。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并于说明书一起用于解释本发明的原理。
图1是本发明实施例提供的一种基于人工智能辅助的知识点标注方法的流程示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与本发明的一些方面相一致的装置和方法的例子。
需要说明的是,本发明的说明书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
本发明实施例所提供的方法实施例可以在AI知识点标注分析系统、计算机设备或者类似的运算装置中执行。以运行在AI知识点标注分析系统上为例,AI知识点标注分析系统可以包括一个或多个处理器(处理器可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器,可选地,上述AI知识点标注分析系统还可以包括用于通信功能的传输装置。本领域普通技术人员可以理解,上述结构仅为示意,其并不对上述AI知识点标注分析系统的结构造成限定。例如,AI知识点标注分析系统还可包括比上述所示更多或者更少的组件,或者具有与上述所示不同的配置。
存储器可用于存储计算机程序,例如,应用软件的软件程序以及模块,如本发明实施例中的一种基于人工智能辅助的知识点标注方法对应的计算机程序,处理器通过运行存储在存储器内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至AI知识点标注分析系统。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置用于经由一个网络接收或者发送数据。上述的网络具体实例可包括AI知识点标注分析系统的通信供应商提供的无线网络。在一个实例中,传输装置包括一个网络适配器(Network Interface Controller,简称为NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置可以为射频(Radio Frequency,简称为RF)模块,其用于通过无线方式与互联网进行通讯。
基于此,请参阅图1,图1是本发明实施例所提供的一种基于人工智能辅助的知识点标注方法的流程示意图,该方法应用于AI知识点标注分析系统,进一步可以包括步骤101-步骤103。
步骤101、将待标注离线学习文本加载到文本知识点标注网络,利用所述文本知识点标注网络对所述待标注离线学习文本进行文本知识语义挖掘,生成所述待标注离线学习文本的学习文本知识语义。
其中,待标注离线学习文本为需进行知识点标注处理的原始离线学习文本。文本知识点标注网络可以是自然语言处理模型,比如可以根据实际需求进行模型类型的选择。进一步地,文本知识语义挖掘用于进行文本知识层面的特征提取,基于此,学习文本知识语义为相应离线学习文本的文本语义特征(侧重于知识语义层面)。
比如,在地理学科的应用场景下,可以使用一个文本知识点标注网络来处理待标注离线学习文本。这个网络可以是一个自然语言处理模型,专门训练用于处理地理文本。通过将待标注离线学习文本输入到该网络中,可以利用该网络对文本进行分析和挖掘地理学科相关的知识点。以一篇待标注的离线地理学习文本是关于气候变化的文章为例进行介绍,可以使用一个地理学科的文本知识点标注网络,比如一个基于深度学习的模型,来处理这篇文章。该模型经过训练,具备了识别地理学科相关概念和现象的能力。当将这篇待标注离线学习文本输入到该网络中时,它会分析文本并提取出与地理学科相关的知识点,比如全球气候变暖、温室效应、海洋循环等。通过文本知识语义挖掘,可以从这篇文章中获得学习文本的地理学科知识语义,即与气候变化相关的语义特征。步骤101的具体操作是将待标注离线学习文本输入到地理学科的文本知识点标注网络中,并利用该网络进行文本知识语义挖掘,从而生成待标注离线学习文本的学习文本知识语义。
步骤102、利用所述文本知识点标注网络对所述待标注离线学习文本的学习文本知识语义进行处理,得到所述待标注离线学习文本的知识点标注事项描述,所述知识点标注事项描述用于表征所述待标注离线学习文本的知识点标注种类。
其中,知识点标注事项描述可以是知识点标注事项的特征,也可以是知识点标注任务的特征。
在地理学科的应用场景下,可以利用文本知识点标注网络对待标注离线学习文本的学习文本知识语义进行处理,以获得有关知识点标注的信息。通过这一步骤,可以生成待标注离线学习文本的知识点标注事项描述,用于表征该文本的知识点标注种类。
以一篇待标注的离线地理学习文本是关于地球板块运动的文章为例。将该文本输入到文本知识点标注网络中,并进行处理。该网络经过训练,能够识别并提取出与地球板块运动相关的知识点。通过处理后,可以得到待标注离线学习文本的知识点标注事项描述,例如:“地球板块运动类型”、“造山带分布”、“板块边界特征”等。这些描述反映了待标注离线学习文本中与地球板块运动相关的知识点标注种类。步骤102的具体操作是利用文本知识点标注网络对待标注离线学习文本的学习文本知识语义进行处理,并生成描述该文本知识点标注种类的知识点标注事项描述。这些描述将有助于进一步理解待标注离线学习文本中应该如何进行知识点标注。
步骤103、利用所述文本知识点标注网络,依据所述待标注离线学习文本的知识点标注事项描述进行判别,生成所述待标注离线学习文本的知识点标注建议。
其中,可以结合文本知识点标注网络和待标注离线学习文本的知识点标注事项描述进行预测处理,从而得到待标注离线学习文本的知识点标注建议,该知识点标注建议用于指示对待标注离线学习文本进行相应的知识点标注(比如标注位置、标注方式、标注内容等)。
在地理学科的应用场景下,可以利用文本知识点标注网络和待标注离线学习文本的知识点标注事项描述进行判别,以生成知识点标注建议。这一步骤旨在指导对待标注离线学习文本进行相应的知识点标注,包括标注位置、标注方式和标注内容等方面。
例如,根据步骤102,得到了关于地球板块运动的知识点标注事项描述,其中包括“地球板块运动类型”、“造山带分布”、“板块边界特征”。现在,将利用文本知识点标注网络和这些知识点标注事项描述来预测对待标注离线学习文本的知识点标注建议。
通过文本知识点标注网络的判别过程,可以生成知识点标注建议,例如:对于“地球板块运动类型”,建议在具体描述板块运动类型时使用适当的术语,如“构造性边界”、“滑动边界”等;对于“造山带分布”,建议在文本中标注与造山带分布相关的地理区域,如喜马拉雅山脉、安第斯山脉等;对于“板块边界特征”,建议在文本中标注板块边界的地震活动、火山分布等特征。这样,可以根据文本知识点标注网络和待标注离线学习文本的知识点标注事项描述生成具体的知识点标注建议,以指导对该离线学习文本进行相应的知识点标注。步骤103的具体操作是结合文本知识点标注网络和待标注离线学习文本的知识点标注事项描述,利用判别方法生成知识点标注建议。这些建议将提供对待标注离线学习文本进行知识点标注的指示和引导。
应用步骤101-步骤103,首先,通过使用文本知识点标注网络进行文本知识语义挖掘和判别,可以提高标注的精度。这是因为该网络经过训练,具备了对特定学科领域的理解和知识提取能力。它可以准确地识别和提取出与该学科相关的知识点,并生成相应的知识点标注建议。这有助于确保对离线学习文本进行准确和一致的知识点标注,提高标注的质量和精度。其次,使用文本知识点标注网络进行自动化的知识点标注处理可以大幅提高标注的时效性。相比人工逐篇阅读和标注离线学习文本,利用网络模型可以快速且自动地处理大量文本数据。这样可以节省大量的时间和人力资源,加快了知识点标注的进程。同时,通过提供知识点标注事项描述和建议,网络模型还可以指导标注人员进行有效的标注,进一步提高标注的时效性。
综上所述,上述步骤101-步骤103能够提高标注的精度和时效性。详细地,结合了文本知识点标注网络的能力和自动化处理的优势,能够提供准确、一致和高效的知识点标注指导,从而优化了离线学习文本的知识点标注过程,这样可以改善传统技术难以准确高效实现知识点标注处理的问题。
在另外的设计思路下,以一篇待标注的离线语文学习文本是一篇短文《春天的美景》为例。通过自动化的方式对该文本进行知识点标注,以提取出其中与语文学科相关的信息。
首先,将《春天的美景》加载到文本知识点标注网络中。这个网络经过训练,具备了理解语言和提取语义信息的能力。它会分析短文中的文字、词句以及上下文等信息,并识别出与语文学科相关的知识点。接着,通过文本知识语义挖掘,得到了《春天的美景》的学习文本知识语义。这些语义信息可能包括描述春天景色的形容词,描写自然环境的词语,以及表达作者情感的句子等。例如,短文中可能出现了诸如“嫩绿的新叶”、“花开满山坡”、“阳光洒满大地”等描述春天美景的语句。随后,根据学习文本知识语义,可以得到知识点标注事项描述。在语文学科的情境下,这些描述可能涉及到文章中的主题、修辞手法、感受表达等。根据《春天的美景》的知识点标注事项描述,可以得到一些相应的知识点标注建议。例如,在“主题探究”方面,可以标注出文章中所表达的主题是春天美景的描绘,可以关注描述自然景色、季节变迁等方面。在“修辞手法分析”方面,可以标注使用到的修辞手法,如比喻、拟人等,并解释其作用和效果。在“情感表达解读”方面,可以标注出作者对春天美景的情感态度,如喜悦、赞美等。通过上述处理,成功地对《春天的美景》进行了自动化的知识点标注。这样的标注过程有助于深入理解短文和掌握其中的语文知识要点,提供了精确、一致且高效的知识点标注指导。
在又一些设计思路下,以一篇待标注的离线学习文本是关于光合作用的文章为例。通过自动化的方式对该文本进行知识点标注,以提取出其中与生物学科相关的信息。
首先,将这篇关于光合作用的文章加载到文本知识点标注网络中。这个经过训练的网络具备了理解语言和提取语义信息的能力,它会分析文本中的文字、词语、句子结构等信息,并识别出与生物学科相关的知识点。接下来,通过文本知识语义挖掘,得到了该文章的学习文本知识语义。这些语义信息可能包括描述光合作用的过程、相关概念的定义、影响因素及其作用等。例如,文章中可能包含“光合作用是植物利用阳光能量将二氧化碳和水转化为有机物质的过程”、“叶绿素是参与光合作用的关键色素”等描述光合作用的句子。随后,根据学习文本知识语义,可以得到知识点标注事项描述。在生物学科的情境下,这些描述可能涉及到光合作用的原理、反应方程式、影响因素、相关器官结构等。根据知识点标注事项描述,可以得到一些相应的知识点标注建议。例如,在“光合作用原理”方面,可以标注出文章中关于光能转化、化学反应过程、光合色素的表述,并解释其重要性和机制。在“影响因素”方面,可以标注出光照强度、二氧化碳浓度、温度等对光合作用的影响,并探讨其作用机制。通过上述处理,成功地对这篇关于光合作用的文本进行了自动化的知识点标注。这样的标注过程有助于深入理解文章内容,提取出生物学科相关的知识要点,为学习者提供准确、一致且高效的知识点标注指导。
在一些可选的实施例中,所述文本知识点标注网络的调试方法包括步骤201-步骤203。
步骤201、将多个离线学习训练文本的学习文本知识语义加载到文本知识点标注网络,利用所述文本知识点标注网络,基于局部特征聚焦规则对所述多个离线学习训练文本的学习文本知识语义进行特征处理,得到所述多个离线学习训练文本的第一置信系数。
其中,局部特征聚焦规则可以是注意力规则,特征处理包括但不限于编码处理,置信系数可以是权重指数。
步骤202、利用所述文本知识点标注网络,依据所述多个离线学习训练文本的第一置信系数对所述多个离线学习训练文本的学习文本知识语义进行处理,得到所述多个离线学习训练文本的文本资源描述和知识点标注事项描述,所述文本资源描述用于表征离线学习训练文本所对应的科目特征,所述知识点标注事项描述用于表征离线学习训练文本的知识点标注种类。
步骤203、依据所述多个离线学习训练文本的文本资源描述中每两个文本资源描述之间的第一比较结果以及所述多个离线学习训练文本的知识点标注事项描述中每两个知识点标注事项描述之间的第二比较结果,对所述文本知识点标注网络进行调试。
其中,比较结果可以是差异数据或者比对数据。
在步骤201中,加载多个离线学习训练文本的学习文本知识语义到文本知识点标注网络中。对于地理领域的文本,可以使用该网络进行特征处理和分析,例如地理概念、地区名称、地理现象等。通过局部特征聚焦规则(如注意力规则),可以根据重要的局部特征对地理文本进行处理。
在步骤202中,利用文本知识点标注网络根据第一置信系数对多个离线学习训练文本的学习文本知识语义进行处理。这样可以得到文本资源描述和知识点标注事项描述。在地理领域,文本资源描述可能包括地形特征、气候条件、人文地理等与地理学科相关的描述。而知识点标注事项描述可能涉及到地理概念、地理分类、地理现象等地理知识点的标注描述。
在步骤203中,可以比较不同文本之间的文本资源描述和知识点标注事项描述,以对文本知识点标注网络进行调试。例如,通过比较文本资源描述,可以发现不同离线学习训练文本所涉及的地理特征或地理区域之间的差异。而通过比较知识点标注事项描述,可以揭示不同文本中关注的地理知识点种类的差异。通过这些比较结果,可以对文本知识点标注网络进行优化和调整,以提高针对地理学科的标注性能。
可见,利用局部特征聚焦规则,网络可以集中于重要的地理特征,提高对地理文本的处理能力;通过第一置信系数,可以获得针对不同离线学习训练文本的科目特征描述和知识点标注事项描述,为后续的标注和理解提供基础;通过比较文本资源描述和知识点标注事项描述之间的差异数据或比对数据,可以对文本知识点标注网络进行灵活的调试和优化。这样的调试方法可以提高调试效率,并尽可能节约计算资源开销。通过步骤201-步骤203,可以帮助更准确、高效地处理和标注地理文本,优化文本知识点标注网络在地理领域的性能。类似地,也可以将这些步骤适用于其他学科领域,以实现相似的益处。
应用本发明实施例,在调试文本知识点标注网络时,基于局部特征聚焦规则对离线学习训练文本的学习文本知识语义进行了特征分析,以获得第一置信系数。通过第一置信系数对学习文本知识语义进行处理,得到离线学习训练文本的文本资源描述和知识点标注事项描述。基于文本资源描述之间的第一比较结果以及知识点标注事项描述之间的第二比较结果对文本知识点标注网络进行调试时,无需参考先验调试依据,这样能够提高文本知识点标注网络调试的灵活性,尽可能节约文本知识点标注网络调试所需的计算资源开销。
在地理学科中,注意力规则是步骤201中用于特征处理的一种方法。它可以帮助文本知识点标注网络集中关注地理学科文本中的重要信息。注意力规则基于局部特征聚焦的思想,通过计算每个特征在文本中的重要性权重,将网络的注意力集中在具有较高权重的局部特征上。在地理学科的文本处理中,可以将注意力规则应用于以下方面:
(1)地理概念:注意力规则可以帮助网络识别和聚焦于文本中描述的地理概念。例如,在一篇关于气候变化的文章中,网络可以通过注意力规则自动识别并聚焦于与气候变化相关的词语或短语,如温室效应、全球变暖等;
(2)地理位置:对于地理学科中的文本处理,地理位置信息通常是关键要素之一。通过注意力规则,网络可以识别出文本中提及的地理位置,并对其进行更加准确的处理。例如,在一篇关于世界地图的文章中,网络可以运用注意力规则来识别国家、城市或地理区域的名称,并在后续处理中更加关注这些位置相关的信息;
(3)地理现象:地理学科涉及许多地理现象,如自然灾害、地貌特征等。通过应用注意力规则,网络可以检测和聚焦于文本中描述的重要地理现象。例如,在一篇关于火山喷发的文章中,网络可以利用注意力规则识别与火山活动相关的词汇或短语,如岩浆、喷发口等。
可见,注意力规则在地理学科的文本处理中起着重要作用。它帮助网络将关注点集中在地理学科文本中最关键的局部特征上,提高对地理概念、地理位置和地理现象的识别和理解能力。通过这种方式,网络可以更好地处理地理学科领域的文本,并为后续的标注和分析提供更准确的信息基础。
在语文学科中,注意力规则是步骤201中用于特征处理的一种方法。它可以帮助文本知识点标注网络集中关注语文学科文本中的重要信息。注意力规则基于局部特征聚焦的思想,通过计算每个特征在文本中的重要性权重,将网络的注意力集中在具有较高权重的局部特征上。在语文学科的文本处理中,可以将注意力规则应用于以下方面:
(1)修辞手法:语文学科涉及各种修辞手法的运用,如比喻、拟人、夸张等。通过注意力规则,网络可以识别和聚焦于文本中使用的修辞手法,从而更好地理解作者的表达意图和情感色彩;
(2)文学作品元素:在文学作品中,有许多重要的元素需要被关注,如主题、人物形象、情节等。利用注意力规则,网络能够发现并聚焦于这些元素的描述,从而更深入地分析作品的内涵和结构;
(3)诗歌韵律:诗歌是语文学科中的重要内容之一,其韵律和节奏对于理解和欣赏诗歌具有重要意义。通过应用注意力规则,网络可以辨别和聚焦于诗歌中的韵律元素,如押韵、格律等,以更好地理解诗歌的表达方式和情感传达。
可见,注意力规则在语文学科的文本处理中起着重要作用。它帮助网络将关注点集中在语文学科文本中最关键的局部特征上,提高对修辞手法、文学作品元素和诗歌韵律的识别和理解能力。通过这种方式,网络可以更好地处理语文学科领域的文本,并为后续的标注和分析提供更准确的信息基础。
在一些示例性实施例中,步骤202中的所述利用所述文本知识点标注网络,依据所述多个离线学习训练文本的第一置信系数对所述多个离线学习训练文本的学习文本知识语义进行处理,得到所述多个离线学习训练文本的文本资源描述和知识点标注事项描述,包括步骤2021和步骤2022。
步骤2021、针对所述多个离线学习训练文本中的任一离线学习训练文本,利用所述文本知识点标注网络,将所述离线学习训练文本的第一置信系数与所述离线学习训练文本的学习文本知识语义进行特征乘法运算,得到所述离线学习训练文本的文本资源描述。
假设有两个离线学习训练文本,分别为文章A和文章B。利用文本知识点标注网络,计算出文章A的第一置信系数为0.8,将该置信系数与文章A的学习文本知识语义进行特征乘法运算,得到文章A的文本资源描述。
例如,如果文章A是一篇关于动植物生态的文章,它涉及到栖息地、食物链、生态平衡等内容。通过特征乘法运算,可以加权考虑这些内容在文章A中的重要性,并生成文章A的文本资源描述,如“动植物生态相关的栖息地、食物链和生态平衡”。
步骤2022、将所述离线学习训练文本的第二置信系数与所述离线学习训练文本的学习文本知识语义进行特征乘法运算,得到所述离线学习训练文本的知识点标注事项描述,所述第二置信系数与所述第一置信系数的和值为设定变量。
继续以上述文章A为例,假设计算出文章A的第二置信系数为0.7。将该置信系数与文章A的学习文本知识语义进行特征乘法运算,得到文章A的知识点标注事项描述。
在这个例子中,可以考虑文章A中关于动植物生态的具体知识点,如生态环境破坏、物种保护等。通过特征乘法运算,可以加权考虑这些知识点在文章A中的重要性,并生成文章A的知识点标注事项描述,如“生态环境破坏、物种保护等与动植物生态相关的知识点”。
通过步骤2021和2022,对多个离线学习训练文本进行处理,得到了它们的文本资源描述和知识点标注事项描述。这些描述提供了对文本内容和相关知识点的概括和归纳,有助于后续的标注、分析和理解。
总体而言,步骤2021-步骤2022的整体有益效果包括:通过特征乘法运算,可以根据置信系数加权考虑离线学习训练文本中不同特征的重要性,从而生成准确且具有代表性的文本资源描述;同样地,利用特征乘法运算,可以根据置信系数加权考虑离线学习训练文本中各个知识点的重要性,生成准确且全面的知识点标注事项描述;通过设定变量,将第一和第二置信系数相加,使网络在生成描述时综合考虑了不同置信度的信息。步骤2021-步骤2022的实施可以提供准确、全面的文本资源描述和知识点标注事项描述,为后续的学习、分析和理解提供有益支持。
在另一些可选的实施例中,步骤203中的所述依据所述多个离线学习训练文本的文本资源描述中每两个文本资源描述之间的第一比较结果以及所述多个离线学习训练文本的知识点标注事项描述中每两个知识点标注事项描述之间的第二比较结果,对所述文本知识点标注网络进行调试,包括步骤2031和步骤2032。
步骤2031、基于多个离线学习积极训练文本集中每两个离线学习积极训练文本的文本资源描述之间的第一比较结果,对所述文本知识点标注网络进行调试,各个所述离线学习积极训练文本集包括三个离线学习积极训练文本,所述离线学习积极训练文本为所述多个离线学习训练文本中目标知识点标注种类的离线学习训练文本。
其中,离线学习积极训练文本为正样本。
步骤2032、基于多个离线学习训练文本集中每两个离线学习训练文本的知识点标注事项描述中每两个知识点标注事项描述之间的第二比较结果,对所述文本知识点标注网络进行调试,各个所述离线学习训练文本集包括所述多个离线学习训练文本中的三个离线学习训练文本。
假设有三个离线学习积极训练文本,分别为文本X、文本Y和文本Z。这些文本都属于目标知识点标注种类的离线学习训练文本。首先计算它们之间的文本资源描述的第一比较结果。例如,在比较文本X和文本Y的文本资源描述时,可以检查它们之间的共同特征和关键词,并比较它们之间的相似度或相关性。根据比较结果,可以对文本知识点标注网络进行调试,通过调整网络参数、权重或结构等来提高其准确性和性能。类似地,还可以比较文本Y和文本Z,以及文本X和文本Z的文本资源描述,得到它们之间的第一比较结果。这些比较结果将有助于优化文本知识点标注网络,使其更好地适应目标知识点标注种类的离线学习训练文本。
继续以上述文本X、文本Y和文本Z为例,计算它们之间的知识点标注事项描述的第二比较结果。在比较文本X和文本Y的知识点标注事项描述时,可以检查它们之间的共同知识点、相关概念或关键词,并比较它们之间的相似度或差异性。根据比较结果,可以对文本知识点标注网络进行调试,进一步优化其标注知识点的准确性和全面性。类似地,还可以比较文本Y和文本Z,以及文本X和文本Z的知识点标注事项描述,得到它们之间的第二比较结果。这些比较结果有助于改进文本知识点标注网络,使其更好地适应多个离线学习训练文本中的不同知识点标注事项。
通过步骤2031和2032的比较调试,可以利用文本资源描述和知识点标注事项描述之间的比较结果,对文本知识点标注网络进行改进和优化。这有助于提高网络在目标知识点标注种类的离线学习训练文本中的性能和准确性。
应用步骤2031-步骤2032,通过比较文本资源描述和知识点标注事项描述之间的差异和相似性,可以发现网络在识别和理解不同文本和知识点方面可能存在的问题。这有助于调整网络参数,提高其对目标知识点标注种类的离线学习训练文本的适应能力;通过比较结果,可以发现网络可能存在的错误或遗漏,并采取相应的措施来优化其标注准确性和全面性。这有助于提高文本知识点标注网络的整体性能和效果。
在一些示例中,所述文本知识点标注网络包括第一文本知识点处理分支和第二文本知识点处理分支。基于此,步骤2031中的所述基于多个离线学习积极训练文本集中每两个离线学习积极训练文本的文本资源描述之间的第一比较结果,对所述文本知识点标注网络进行调试包括步骤20310。
步骤20310、针对所述多个离线学习积极训练文本集中的任一离线学习积极训练文本集,基于第一离线学习训练文本的文本资源描述与第二离线学习训练文本的文本资源描述之间的第一比较结果,以及所述第一离线学习训练文本的文本资源描述与第三离线学习训练文本的文本资源描述之间的第一比较结果,对所述第一文本知识点处理分支进行调试,所述第一离线学习训练文本、所述第二离线学习训练文本以及所述第三离线学习训练文本皆属于所述离线学习积极训练文本集。
假设有三个离线学习积极训练文本(X、Y和Z),它们属于所述离线学习积极训练文本集。在步骤20310中,针对任一离线学习积极训练文本集,比较第一离线学习训练文本(X)与第二离线学习训练文本(Y)以及第一离线学习训练文本(X)与第三离线学习训练文本(Z)的文本资源描述,得到它们之间的第一比较结果。例如,在对X和Y的文本资源描述进行比较时,可以检查它们之间的共同特征、关键词或相似性,并计算它们之间的相似度得分。同样地,也可以比较X和Z的文本资源描述。这些比较结果将用于调试第一文本知识点处理分支。通过比较结果,可以发现文本资源描述之间的差异,从而调整第一文本知识点处理分支的参数、权重或结构,以提高其对目标知识点标注种类的离线学习训练文本的适应能力。
进一步地,步骤2032中的所述基于多个离线学习训练文本集中每两个离线学习训练文本的知识点标注事项描述中每两个知识点标注事项描述之间的第二比较结果,对所述文本知识点标注网络进行调试包括步骤20320。
步骤20320、针对所述多个离线学习训练文本集中的任一离线学习训练文本集,基于目标离线学习训练文本的知识点标注事项描述与关联离线学习训练文本的知识点标注事项描述中每两个知识点标注事项描述之间的第二比较结果、所述目标离线学习训练文本的知识点标注事项描述与互斥离线学习训练文本的知识点标注事项描述中每两个知识点标注事项描述之间的第二比较结果以及所述第一文本知识点处理分支的调试代价指标的变化指数,对所述第二文本知识点处理分支进行调试,所述关联离线学习训练文本与所述目标离线学习训练文本为相同知识点标注种类的离线学习训练文本,所述互斥离线学习训练文本与所述目标离线学习训练文本为不同知识点标注种类的离线学习训练文本,所述目标离线学习训练文本、所述关联离线学习训练文本以及所述互斥离线学习训练文本皆属于所述多个离线学习训练文本。
继续以上述三个离线学习训练文本(X、Y和Z)为例,进行以下调试步骤。对于目标离线学习训练文本(X),比较它与关联离线学习训练文本(Y)的知识点标注事项描述,以及它与互斥离线学习训练文本(Z)的知识点标注事项描述,得到它们之间的第二比较结果。通过比较结果,可以发现目标离线学习训练文本与关联文本之间的共同知识点、相关概念或关键词,以及目标离线学习训练文本与互斥文本之间的差异性。此外,还考虑了第一文本知识点处理分支的调试代价指标的变化指数。根据这些比较结果和调试代价指标,可以优化第二文本知识点处理分支,使其更好地适应相同知识点标注种类的关联离线学习训练文本,并与不同知识点标注种类的互斥离线学习训练文本进行区分。
应用步骤20310和步骤20320,对于文本知识点标注网络的优化和调试具有以下有益效果:通过比较文本资源描述和知识点标注事项描述,可以发现网络在处理不同文本和知识点之间可能存在的问题。基于比较结果,可以对网络的参数进行调整,从而提高其对离线学习训练文本的处理能力;通过比较目标离线学习训练文本与关联离线学习训练文本以及互斥离线学习训练文本的知识点标注事项描述,可以更好地处理不同知识点标注种类之间的差异和相似性。这有助于提高网络在处理不同知识点时的准确性和鲁棒性;考虑第一文本知识点处理分支的调试代价指标的变化指数,可以更全面地评估网络的调试效果。这个指标的变化可以帮助判断每个步骤对网络性能的影响,并进一步改进和优化网络的配置。
通过上述步骤的实施和优化,文本知识点标注网络可以更准确地对文本进行理解和语义理解,从而提高对离线学习训练文本的处理能力,并增强网络在多样性任务和不同知识点标注种类之间的适应性。这些效果有助于提升文本知识点标注网络的整体性能和应用范围。
在一些示例中,步骤20310中的所述基于第一离线学习训练文本的文本资源描述与第二离线学习训练文本的文本资源描述之间的第一比较结果,以及所述第一离线学习训练文本的文本资源描述与第三离线学习训练文本的文本资源描述之间的第一比较结果,对所述第一文本知识点处理分支进行调试,包括步骤20311-步骤20314。
步骤20311、依据所述第一离线学习训练文本的第一文本资源描述以及所述第二离线学习训练文本的第二文本资源描述之间的第一比较结果,确定第一调试变量,所述第一离线学习训练文本的第一文本资源描述为所述第一文本知识点处理分支挖掘的文本资源描述,所述第二离线学习训练文本的第二文本资源描述为所述第二文本知识点处理分支挖掘的文本资源描述;
步骤20312、依据所述第一离线学习训练文本的第一文本资源描述以及所述第三离线学习训练文本的第三文本资源描述之间的第一比较结果,确定第二调试变量,所述第三离线学习训练文本的第三文本资源描述为所述第二文本知识点处理分支挖掘的文本资源描述。
步骤20313、依据所述第一调试变量和所述第二调试变量,确定所述第一文本知识点处理分支的调试代价指标的变化指数。
步骤20314、依据所述第一文本知识点处理分支的调试代价指标的变化指数,对所述第一文本知识点处理分支进行调试。
其中,调试变量可以包括训练参数等,调试代价指标可以是损失函数,变化指数用于表征调试代价指标的梯度数据。
以两个离线学习训练文本为例进行说明,一个描述了“中国的长江流域地区”,另一个描述了“巴西的亚马逊雨林地带”。首先,对这两个文本进行比较,观察它们之间的地理特征和重点关注的内容。通过比较,发现长江流域和亚马逊雨林地带具有不同的地理环境、生态系统等特征。基于这一发现,可以针对不同的地理知识点设计相应的处理分支。例如,可以创建一个专门处理长江流域相关信息的分支和一个专门处理亚马逊雨林地带相关信息的分支。接下来,可以对每个处理分支进行调试。可以首先关注长江流域分支,根据对长江流域的描述,调整网络参数、改进模型结构等,以提高对长江流域相关文本的准确性和理解能力。同样地,可以针对亚马逊雨林地带分支进行调试。通过对亚马逊雨林地带的描述,可以优化该分支的处理能力,从而更好地理解和标注与亚马逊雨林地带相关的文本。通过这样的优化和调试过程,可以提高地理学科文本知识点标注网络在不同地理知识点上的准确性和适应性。这有助于改进地理学科的文本处理和理解能力,并提升相关应用的效果和可靠性。
在另一些可能的实施例中,步骤20320中的所述基于目标离线学习训练文本的知识点标注事项描述与关联离线学习训练文本的知识点标注事项描述中每两个知识点标注事项描述之间的第二比较结果、所述目标离线学习训练文本的知识点标注事项描述与互斥离线学习训练文本的知识点标注事项描述中每两个知识点标注事项描述之间的第二比较结果以及所述第一文本知识点处理分支的调试代价指标的变化指数,对所述第二文本知识点处理分支进行调试,包括步骤20321和步骤20322。
步骤20321、依据所述目标离线学习训练文本的知识点标注事项描述与所述关联离线学习训练文本的知识点标注事项描述中每两个知识点标注事项描述之间的第二比较结果,以及所述目标离线学习训练文本的知识点标注事项描述与所述互斥离线学习训练文本的知识点标注事项描述中每两个知识点标注事项描述之间的第二比较结果,确定所述第二文本知识点处理分支的调试代价指标的变化指数。
在这一步骤中,根据目标离线学习训练文本的知识点标注事项描述与关联离线学习训练文本的知识点标注事项描述中每两个知识点标注事项描述之间的第二比较结果,以及目标离线学习训练文本的知识点标注事项描述与互斥离线学习训练文本的知识点标注事项描述中每两个知识点标注事项描述之间的第二比较结果,可以确定第二文本知识点处理分支的调试代价指标的变化指数。
比如,假设有一个目标离线学习训练文本,其中的知识点标注事项描述为“探索太阳系行星和卫星的特征”,而关联离线学习训练文本的知识点标注事项描述为“研究地球外行星的存在和特征”。通过比较这两个文本的知识点标注事项描述,可以评估它们之间的相似性和差异。
基于第二比较结果,可以得出结论:目标离线学习训练文本与关联离线学习训练文本之间的知识点标注事项描述较为相似。同时,目标离线学习训练文本与互斥离线学习训练文本之间的知识点标注事项描述存在较大的差异。通过这些比较结果,可以确定第二文本知识点处理分支的调试代价指标的变化指数。
步骤20322、依据所述第一文本知识点处理分支的调试代价指标的变化指数以及所述第二文本知识点处理分支的调试代价指标的变化指数,对所述第二文本知识点处理分支进行调试。
在这一步骤中,依据第一文本知识点处理分支的调试代价指标的变化指数以及第二文本知识点处理分支的调试代价指标的变化指数,对第二文本知识点处理分支进行调试。
比如,如果第一文本知识点处理分支的调试代价指标的变化指数表明该分支经过调试后性能显著提升,而第二文本知识点处理分支的调试代价指标的变化指数较低,则可以将调试的重点放在第二文本知识点处理分支上。调试过程可能包括优化模型参数、增加训练样本、调整网络结构等。通过这样的调试过程,可以提高第二文本知识点处理分支的准确性和性能。
综合而言,步骤20321和步骤20322描述了在离线学习训练文本中比较不同知识点描述的过程,并根据比较结果对知识点处理分支进行调试的方法。这些步骤有助于优化和改进文本处理模型,从而提升相关任务的效果和性能。
在一些可选的实施例中,步骤20321中的所述依据所述目标离线学习训练文本的知识点标注事项描述与所述关联离线学习训练文本的知识点标注事项描述中每两个知识点标注事项描述之间的第二比较结果,以及所述目标离线学习训练文本的知识点标注事项描述与所述互斥离线学习训练文本的知识点标注事项描述中每两个知识点标注事项描述之间的第二比较结果,确定所述第二文本知识点处理分支的调试代价指标的变化指数,包括步骤203211-步骤203213。
步骤203211、依据所述目标离线学习训练文本的第一知识点标注事项描述以及所述关联离线学习训练文本的第二知识点标注事项描述之间的第二比较结果,确定第三调试变量,所述目标离线学习训练文本的第一知识点标注事项描述为所述第一文本知识点处理分支挖掘的知识点标注事项描述,所述关联离线学习训练文本的第二知识点标注事项描述为所述第二文本知识点处理分支挖掘的知识点标注事项描述。
步骤203212、依据所述目标离线学习训练文本的第一知识点标注事项描述以及所述互斥离线学习训练文本的第三知识点标注事项描述之间的第二比较结果,确定第四调试变量,所述互斥离线学习训练文本的第三知识点标注事项描述为所述第二文本知识点处理分支挖掘的知识点标注事项描述。
步骤203213、依据所述第三调试变量和所述第四调试变量,确定所述第二文本知识点处理分支的调试代价指标的变化指数。
在一些可选的实施例中,在步骤203所描述的所述依据所述多个离线学习训练文本的文本资源描述中每两个文本资源描述之间的第一比较结果以及所述多个离线学习训练文本的知识点标注事项描述中每两个知识点标注事项描述之间的第二比较结果,对所述文本知识点标注网络进行调试之前,所述方法还包括:基于局部特征聚焦规则对所述多个离线学习训练文本的知识点标注事项描述进行特征处理,得到所述多个离线学习训练文本的目标知识点标注事项描述。基于此,步骤203所描述的所述依据所述多个离线学习训练文本的文本资源描述中每两个文本资源描述之间的第一比较结果以及所述多个离线学习训练文本的知识点标注事项描述中每两个知识点标注事项描述之间的第二比较结果,对所述文本知识点标注网络进行调试包括:所述依据所述多个离线学习训练文本的文本资源描述中每两个文本资源描述之间的第一比较结果以及所述多个离线学习训练文本的目标知识点标注事项描述之间的第二比较结果,对所述文本知识点标注网络进行调试。
在步骤203中,提到了局部特征聚焦规则。这个规则是在对多个离线学习训练文本的知识点标注事项描述进行特征处理时使用的。局部特征聚焦规则旨在通过关注每个文本资源的目标知识点标注事项描述,将注意力集中在与目标相关的特征上。具体而言,该规则对每个离线学习训练文本的知识点标注事项描述进行处理,从中提取与目标知识点最相关的特征。特征处理的目的是为了减少噪音和冗余信息,同时增强与目标知识点相关的特征的表达能力。这可以通过一系列技术来实现,例如特征选择、特征加权或特征降维等方法。通过应用局部特征聚焦规则,可以得到经过特征处理后的多个离线学习训练文本的目标知识点标注事项描述。这些描述更加准确地反映了文本中与目标知识点相关的特征,从而为后续的比较和调试提供了更有意义的信息。通过对多个离线学习训练文本的文本资源描述之间进行第一比较结果和目标知识点标注事项描述之间进行第二比较结果,可以在调试文本知识点标注网络之前更好地理解它们之间的关系。这些比较结果提供了关于文本之间的相似性和相关性的信息,有助于优化调试过程。
综上所述,基于局部特征聚焦规则对离线学习训练文本的知识点标注事项描述进行特征处理可以提升文本知识点标注网络的性能和调试效果。它能够削减噪音、增强关键特征,并提供更有意义的信息用于比较和调试,从而改善模型的准确性和鲁棒性。
在另一些可能的实施例中,所述方法还包括步骤301。
步骤301、基于多个离线学习训练文本的知识点标注事项描述以及所述多个离线学习训练文本的目标知识点标注建议,对所述文本知识点标注网络进行调试。
在地理学科的应用场景中,步骤301是指基于多个离线学习训练文本的知识点标注事项描述和目标知识点标注建议来对文本知识点标注网络进行调试。比如,假设正在构建一个地理知识点标注网络,并使用了多个离线学习训练文本。这些文本经过处理和标注,每个文本都具有知识点标注事项描述和目标知识点标注建议。知识点标注事项描述是对文本中涉及到的地理知识点的概括和描述,如“地球自转和公转”、“太阳系行星运动”等。目标知识点标注建议是对每个文本所关注的主要知识点的建议或重点,以指导网络的调试和训练。
在步骤301中,将利用这些知识点标注事项描述和目标知识点标注建议来对文本知识点标注网络进行调试。这包括以下操作:知识点匹配:通过比较每个文本的知识点标注事项描述和目标知识点标注建议,可以确定文本中涉及的地理知识点是否与目标知识点一致或相关。如果某个文本的知识点标注事项描述与目标知识点高度匹配,那么这个文本就是一个重要的参考,可以用于网络的调试和训练;关键知识点强化:根据目标知识点标注建议,可以确定每个文本中的关键知识点或重点。这些知识点是构建地理知识点标注网络时需要重点关注和强化的内容。通过对这些关键知识点进行分析和调试,可以优化网络的学习和推理能力;训练数据筛选:基于多个离线学习训练文本的知识点标注事项描述和目标知识点标注建议,可以选择合适的训练数据集。挑选与目标知识点相关性高、包含关键知识点的文本作为训练数据,可以提高网络的学习效果和准确性。
通过步骤301的操作,可以针对地理学科的知识点标注网络进行调试和优化。根据知识点标注事项描述和目标知识点标注建议,可以选择适当的训练数据、强化关键知识点,并提高网络对地理知识的理解和表达能力,从而提升网络在地理知识点标注任务中的性能。
在又一些可能的实施例中,步骤301中的所述基于多个离线学习训练文本的知识点标注事项描述以及所述多个离线学习训练文本的目标知识点标注建议,对所述文本知识点标注网络进行调试,包括步骤3011和步骤3012。
步骤3011、利用所述文本知识点标注网络,依据所述多个离线学习训练文本的知识点标注事项描述进行判别,生成所述多个离线学习训练文本的知识点标注预测建议。
基于已构建好的文本知识点标注网络,可以利用该网络对多个离线学习训练文本的知识点标注事项描述进行判别和预测。具体而言,对于每个离线学习训练文本,将其输入到文本知识点标注网络中,并获得网络对该文本的知识点标注预测。这些预测结果可以作为参考建议,指导了解文本中可能存在的知识点,并提供对应的标注建议。
举例来说,假设有一段关于地球自转和公转的文本。通过将该文本输入到文本知识点标注网络中,可以得到网络对该文本的知识点标注预测建议,如“地球自转”、“地球公转”等。这些预测建议反映了网络对文本中相关知识点的判断和预测。
步骤3012、依据所述多个离线学习训练文本的知识点标注预测建议和目标知识点标注建议之间的第三比较结果,对所述文本知识点标注网络进行调试。
在步骤3012中,将对知识点标注预测建议和目标知识点标注建议进行比较和分析,以进一步调试文本知识点标注网络。
通过对比知识点标注预测建议和目标知识点标注建议之间的差异或相似性,可以评估网络在知识点标注任务上的性能和准确度。如果预测建议与目标建议高度一致,说明网络的预测结果符合预期,并具备较好的准确性。而如果存在差异或不一致,就需要深入分析网络的误差原因,并可能进行调整或优化网络的结构和参数。
例如,在地理学科中,假设目标知识点标注建议为“地球自转”、“太阳系行星运动”。而文本知识点标注网络生成的知识点标注预测建议为“地球自传”、“行星运动”。通过比较预测建议和目标建议之间的差异,可以发现网络可能存在对于“自转”和“公转”概念的混淆或错误理解。这样的分析结果将指导对网络进行调试和改进,提升其对地理知识点的准确判断能力。
综上所述,步骤3011利用文本知识点标注网络生成知识点标注预测建议,而步骤3012则通过比较预测建议和目标知识点标注建议之间的差异来调试文本知识点标注网络,从而提升网络的准确性和性能。在地理学科中,这些步骤可以帮助对地理知识点进行更精准的标注和判断,并优化网络的学习和推理能力。
进一步地,还提供了一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现上述的方法。
在本发明实施例所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置和方法实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (9)
1.一种基于人工智能辅助的知识点标注方法,其特征在于,应用于AI知识点标注分析系统,所述方法包括:
将待标注离线学习文本加载到文本知识点标注网络,利用所述文本知识点标注网络对所述待标注离线学习文本进行文本知识语义挖掘,生成所述待标注离线学习文本的学习文本知识语义;
利用所述文本知识点标注网络对所述待标注离线学习文本的学习文本知识语义进行处理,得到所述待标注离线学习文本的知识点标注事项描述,所述知识点标注事项描述用于表征所述待标注离线学习文本的知识点标注种类;
利用所述文本知识点标注网络,依据所述待标注离线学习文本的知识点标注事项描述进行判别,生成所述待标注离线学习文本的知识点标注建议;
其中,所述文本知识点标注网络的调试方法包括:
将多个离线学习训练文本的学习文本知识语义加载到文本知识点标注网络,利用所述文本知识点标注网络,基于局部特征聚焦规则对所述多个离线学习训练文本的学习文本知识语义进行特征处理,得到所述多个离线学习训练文本的第一置信系数;
利用所述文本知识点标注网络,依据所述多个离线学习训练文本的第一置信系数对所述多个离线学习训练文本的学习文本知识语义进行处理,得到所述多个离线学习训练文本的文本资源描述和知识点标注事项描述,所述文本资源描述用于表征离线学习训练文本所对应的科目特征,所述知识点标注事项描述用于表征离线学习训练文本的知识点标注种类;
依据所述多个离线学习训练文本的文本资源描述中每两个文本资源描述之间的第一比较结果以及所述多个离线学习训练文本的知识点标注事项描述中每两个知识点标注事项描述之间的第二比较结果,对所述文本知识点标注网络进行调试。
2.如权利要求1所述的方法,其特征在于,所述利用所述文本知识点标注网络,依据所述多个离线学习训练文本的第一置信系数对所述多个离线学习训练文本的学习文本知识语义进行处理,得到所述多个离线学习训练文本的文本资源描述和知识点标注事项描述包括:
针对所述多个离线学习训练文本中的任一离线学习训练文本,利用所述文本知识点标注网络,将所述离线学习训练文本的第一置信系数与所述离线学习训练文本的学习文本知识语义进行特征乘法运算,得到所述离线学习训练文本的文本资源描述;
将所述离线学习训练文本的第二置信系数与所述离线学习训练文本的学习文本知识语义进行特征乘法运算,得到所述离线学习训练文本的知识点标注事项描述,所述第二置信系数与所述第一置信系数的和值为设定变量。
3.如权利要求1所述的方法,其特征在于,所述依据所述多个离线学习训练文本的文本资源描述中每两个文本资源描述之间的第一比较结果以及所述多个离线学习训练文本的知识点标注事项描述中每两个知识点标注事项描述之间的第二比较结果,对所述文本知识点标注网络进行调试包括:
基于多个离线学习积极训练文本集中每两个离线学习积极训练文本的文本资源描述之间的第一比较结果,对所述文本知识点标注网络进行调试,各个所述离线学习积极训练文本集包括三个离线学习积极训练文本,所述离线学习积极训练文本为所述多个离线学习训练文本中目标知识点标注种类的离线学习训练文本;
基于多个离线学习训练文本集中每两个离线学习训练文本的知识点标注事项描述中每两个知识点标注事项描述之间的第二比较结果,对所述文本知识点标注网络进行调试,各个所述离线学习训练文本集包括所述多个离线学习训练文本中的三个离线学习训练文本;
其中,所述文本知识点标注网络包括第一文本知识点处理分支和第二文本知识点处理分支,所述基于多个离线学习积极训练文本集中每两个离线学习积极训练文本的文本资源描述之间的第一比较结果,对所述文本知识点标注网络进行调试包括:
针对所述多个离线学习积极训练文本集中的任一离线学习积极训练文本集,基于第一离线学习训练文本的文本资源描述与第二离线学习训练文本的文本资源描述之间的第一比较结果,以及所述第一离线学习训练文本的文本资源描述与第三离线学习训练文本的文本资源描述之间的第一比较结果,对所述第一文本知识点处理分支进行调试,所述第一离线学习训练文本、所述第二离线学习训练文本以及所述第三离线学习训练文本皆属于所述离线学习积极训练文本集;
所述基于多个离线学习训练文本集中每两个离线学习训练文本的知识点标注事项描述中每两个知识点标注事项描述之间的第二比较结果,对所述文本知识点标注网络进行调试包括:
针对所述多个离线学习训练文本集中的任一离线学习训练文本集,基于目标离线学习训练文本的知识点标注事项描述与关联离线学习训练文本的知识点标注事项描述中每两个知识点标注事项描述之间的第二比较结果、所述目标离线学习训练文本的知识点标注事项描述与互斥离线学习训练文本的知识点标注事项描述中每两个知识点标注事项描述之间的第二比较结果以及所述第一文本知识点处理分支的调试代价指标的变化指数,对所述第二文本知识点处理分支进行调试,所述关联离线学习训练文本与所述目标离线学习训练文本为相同知识点标注种类的离线学习训练文本,所述互斥离线学习训练文本与所述目标离线学习训练文本为不同知识点标注种类的离线学习训练文本,所述目标离线学习训练文本、所述关联离线学习训练文本以及所述互斥离线学习训练文本皆属于所述多个离线学习训练文本。
4.如权利要求3所述的方法,其特征在于,所述基于第一离线学习训练文本的文本资源描述与第二离线学习训练文本的文本资源描述之间的第一比较结果,以及所述第一离线学习训练文本的文本资源描述与第三离线学习训练文本的文本资源描述之间的第一比较结果,对所述第一文本知识点处理分支进行调试包括:
依据所述第一离线学习训练文本的第一文本资源描述以及所述第二离线学习训练文本的第二文本资源描述之间的第一比较结果,确定第一调试变量,所述第一离线学习训练文本的第一文本资源描述为所述第一文本知识点处理分支挖掘的文本资源描述,所述第二离线学习训练文本的第二文本资源描述为所述第二文本知识点处理分支挖掘的文本资源描述;
依据所述第一离线学习训练文本的第一文本资源描述以及所述第三离线学习训练文本的第三文本资源描述之间的第一比较结果,确定第二调试变量,所述第三离线学习训练文本的第三文本资源描述为所述第二文本知识点处理分支挖掘的文本资源描述;
依据所述第一调试变量和所述第二调试变量,确定所述第一文本知识点处理分支的调试代价指标的变化指数;
依据所述第一文本知识点处理分支的调试代价指标的变化指数,对所述第一文本知识点处理分支进行调试。
5.如权利要求3所述的方法,其特征在于,所述基于目标离线学习训练文本的知识点标注事项描述与关联离线学习训练文本的知识点标注事项描述中每两个知识点标注事项描述之间的第二比较结果、所述目标离线学习训练文本的知识点标注事项描述与互斥离线学习训练文本的知识点标注事项描述中每两个知识点标注事项描述之间的第二比较结果以及所述第一文本知识点处理分支的调试代价指标的变化指数,对所述第二文本知识点处理分支进行调试包括:
依据所述目标离线学习训练文本的知识点标注事项描述与所述关联离线学习训练文本的知识点标注事项描述中每两个知识点标注事项描述之间的第二比较结果,以及所述目标离线学习训练文本的知识点标注事项描述与所述互斥离线学习训练文本的知识点标注事项描述中每两个知识点标注事项描述之间的第二比较结果,确定所述第二文本知识点处理分支的调试代价指标的变化指数;
依据所述第一文本知识点处理分支的调试代价指标的变化指数以及所述第二文本知识点处理分支的调试代价指标的变化指数,对所述第二文本知识点处理分支进行调试;
其中,所述依据所述目标离线学习训练文本的知识点标注事项描述与所述关联离线学习训练文本的知识点标注事项描述中每两个知识点标注事项描述之间的第二比较结果,以及所述目标离线学习训练文本的知识点标注事项描述与所述互斥离线学习训练文本的知识点标注事项描述中每两个知识点标注事项描述之间的第二比较结果,确定所述第二文本知识点处理分支的调试代价指标的变化指数包括:
依据所述目标离线学习训练文本的第一知识点标注事项描述以及所述关联离线学习训练文本的第二知识点标注事项描述之间的第二比较结果,确定第三调试变量,所述目标离线学习训练文本的第一知识点标注事项描述为所述第一文本知识点处理分支挖掘的知识点标注事项描述,所述关联离线学习训练文本的第二知识点标注事项描述为所述第二文本知识点处理分支挖掘的知识点标注事项描述;
依据所述目标离线学习训练文本的第一知识点标注事项描述以及所述互斥离线学习训练文本的第三知识点标注事项描述之间的第二比较结果,确定第四调试变量,所述互斥离线学习训练文本的第三知识点标注事项描述为所述第二文本知识点处理分支挖掘的知识点标注事项描述;
依据所述第三调试变量和所述第四调试变量,确定所述第二文本知识点处理分支的调试代价指标的变化指数。
6.如权利要求1所述的方法,其特征在于,所述依据所述多个离线学习训练文本的文本资源描述中每两个文本资源描述之间的第一比较结果以及所述多个离线学习训练文本的知识点标注事项描述中每两个知识点标注事项描述之间的第二比较结果,对所述文本知识点标注网络进行调试之前,所述方法还包括:
基于局部特征聚焦规则对所述多个离线学习训练文本的知识点标注事项描述进行特征处理,得到所述多个离线学习训练文本的目标知识点标注事项描述;
所述依据所述多个离线学习训练文本的文本资源描述中每两个文本资源描述之间的第一比较结果以及所述多个离线学习训练文本的知识点标注事项描述中每两个知识点标注事项描述之间的第二比较结果,对所述文本知识点标注网络进行调试包括:
所述依据所述多个离线学习训练文本的文本资源描述中每两个文本资源描述之间的第一比较结果以及所述多个离线学习训练文本的目标知识点标注事项描述之间的第二比较结果,对所述文本知识点标注网络进行调试。
7.如权利要求1所述的方法,其特征在于,所述方法还包括:
基于多个离线学习训练文本的知识点标注事项描述以及所述多个离线学习训练文本的目标知识点标注建议,对所述文本知识点标注网络进行调试;
其中,所述基于多个离线学习训练文本的知识点标注事项描述以及所述多个离线学习训练文本的目标知识点标注建议,对所述文本知识点标注网络进行调试包括:
利用所述文本知识点标注网络,依据所述多个离线学习训练文本的知识点标注事项描述进行判别,生成所述多个离线学习训练文本的知识点标注预测建议;
依据所述多个离线学习训练文本的知识点标注预测建议和目标知识点标注建议之间的第三比较结果,对所述文本知识点标注网络进行调试。
8.一种AI知识点标注分析系统,其特征在于,包括处理器和存储器;所述处理器和所述存储器通信连接,所述处理器用于从所述存储器中读取计算机程序并执行,以实现权利要求1-7任一项所述的方法。
9.一种计算机可读存储介质,其特征在于,其上存储有程序,该程序被处理器执行时实现权利要求1-7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311736365.6A CN117421426B (zh) | 2023-12-18 | 2023-12-18 | 基于人工智能辅助的知识点标注方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311736365.6A CN117421426B (zh) | 2023-12-18 | 2023-12-18 | 基于人工智能辅助的知识点标注方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117421426A CN117421426A (zh) | 2024-01-19 |
CN117421426B true CN117421426B (zh) | 2024-03-05 |
Family
ID=89528764
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311736365.6A Active CN117421426B (zh) | 2023-12-18 | 2023-12-18 | 基于人工智能辅助的知识点标注方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117421426B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114417785A (zh) * | 2021-12-27 | 2022-04-29 | 科大讯飞股份有限公司 | 知识点标注方法、模型的训练方法、计算机设备及存储介质 |
CN114610892A (zh) * | 2020-12-09 | 2022-06-10 | 深圳市企鹅网络科技有限公司 | 知识点标注方法、装置、电子设备和计算机存储介质 |
CN114661900A (zh) * | 2022-02-25 | 2022-06-24 | 安阳师范学院 | 一种文本标注推荐方法、装置、设备及存储介质 |
CN115186780A (zh) * | 2022-09-14 | 2022-10-14 | 江西风向标智能科技有限公司 | 学科知识点分类模型训练方法、系统、存储介质及设备 |
CN115688920A (zh) * | 2022-11-22 | 2023-02-03 | 百度国际科技(深圳)有限公司 | 知识抽取方法、模型的训练方法、装置、设备和介质 |
CN116151233A (zh) * | 2022-09-08 | 2023-05-23 | 马上消费金融股份有限公司 | 数据标注、生成方法、模型训练方法、设备和介质 |
CN117078927A (zh) * | 2023-08-04 | 2023-11-17 | 北京京深深向科技有限公司 | 一种联合目标标注方法、装置、设备及存储介质 |
-
2023
- 2023-12-18 CN CN202311736365.6A patent/CN117421426B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114610892A (zh) * | 2020-12-09 | 2022-06-10 | 深圳市企鹅网络科技有限公司 | 知识点标注方法、装置、电子设备和计算机存储介质 |
CN114417785A (zh) * | 2021-12-27 | 2022-04-29 | 科大讯飞股份有限公司 | 知识点标注方法、模型的训练方法、计算机设备及存储介质 |
CN114661900A (zh) * | 2022-02-25 | 2022-06-24 | 安阳师范学院 | 一种文本标注推荐方法、装置、设备及存储介质 |
CN116151233A (zh) * | 2022-09-08 | 2023-05-23 | 马上消费金融股份有限公司 | 数据标注、生成方法、模型训练方法、设备和介质 |
CN115186780A (zh) * | 2022-09-14 | 2022-10-14 | 江西风向标智能科技有限公司 | 学科知识点分类模型训练方法、系统、存储介质及设备 |
CN115688920A (zh) * | 2022-11-22 | 2023-02-03 | 百度国际科技(深圳)有限公司 | 知识抽取方法、模型的训练方法、装置、设备和介质 |
CN117078927A (zh) * | 2023-08-04 | 2023-11-17 | 北京京深深向科技有限公司 | 一种联合目标标注方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN117421426A (zh) | 2024-01-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Recker | Scientific research in information systems: a beginner's guide | |
CN110110054B (zh) | 一种基于深度学习的从非结构化文本中获取问答对的方法 | |
CN108804654A (zh) | 一种基于智能问答的虚拟学习环境构建方法 | |
CN111639171A (zh) | 一种知识图谱问答方法及装置 | |
CN112214610A (zh) | 一种基于跨度和知识增强的实体关系联合抽取方法 | |
CN106202543A (zh) | 基于机器学习的本体匹配方法和系统 | |
CN112328800A (zh) | 自动生成编程规范问题答案的系统及方法 | |
Agarwal et al. | Autoeval: A nlp approach for automatic test evaluation system | |
Cai et al. | Using topic modeling for code discovery in large scale text data | |
Owen et al. | Towards a scientific workflow featuring Natural Language Processing for the digitisation of natural history collections. | |
CN113220854B (zh) | 机器阅读理解的智能对话方法及装置 | |
Drouin et al. | Lexical profiling of environmental corpora | |
CN113378024B (zh) | 一种基于深度学习面向公检法领域的相关事件识别方法 | |
CN117421426B (zh) | 基于人工智能辅助的知识点标注方法及系统 | |
Rawat et al. | Comparative Analysis of Transformer based Models for Question Answering | |
Kim et al. | A Study of the Definition and Components of Data Literacy for K-12 AI Education | |
Ramos et al. | Where are Brazil's marine litter scientific data? | |
Esmaeilzadeh et al. | Providing insights for open-response surveys via end-to-end context-aware clustering | |
CN114491209A (zh) | 基于互联网信息抓取的企业业务标签挖掘的方法和系统 | |
Bhoir et al. | Resume Parser using hybrid approach to enhance the efficiency of Automated Recruitment Processes | |
Chriqui et al. | Legal hebert: A bert-based nlp model for hebrew legal, judicial and legislative texts | |
Crossley et al. | Using Large Language Models to Develop Readability Formulas for Educational Settings | |
Yilmazel et al. | Text categorization for aligning educational standards | |
Castelló-Sirvent et al. | AI IN HIGHER EDUCATION: NEW ETHICAL CHALLENGES FOR STUDENTS AND TEACHERS | |
Ghatge et al. | Nutritional and Natural Farming: Agriculturists’ Sentiment Analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |