CN117474014A - 基于大数据分析的知识点拆解方法及系统 - Google Patents
基于大数据分析的知识点拆解方法及系统 Download PDFInfo
- Publication number
- CN117474014A CN117474014A CN202311819593.XA CN202311819593A CN117474014A CN 117474014 A CN117474014 A CN 117474014A CN 202311819593 A CN202311819593 A CN 202311819593A CN 117474014 A CN117474014 A CN 117474014A
- Authority
- CN
- China
- Prior art keywords
- vector
- semantic
- text
- knowledge
- topic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 67
- 238000007405 data analysis Methods 0.000 title claims abstract description 10
- 238000012545 processing Methods 0.000 claims abstract description 107
- 238000005065 mining Methods 0.000 claims abstract description 103
- 238000005457 optimization Methods 0.000 claims abstract description 28
- 239000013598 vector Substances 0.000 claims description 616
- 238000013507 mapping Methods 0.000 claims description 220
- 230000002441 reversible effect Effects 0.000 claims description 83
- 230000009466 transformation Effects 0.000 claims description 27
- 230000008569 process Effects 0.000 claims description 19
- 238000013139 quantization Methods 0.000 claims description 16
- 230000004044 response Effects 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 7
- 230000009286 beneficial effect Effects 0.000 abstract description 4
- 230000006870 function Effects 0.000 description 18
- 230000008451 emotion Effects 0.000 description 9
- 239000011159 matrix material Substances 0.000 description 8
- 238000011144 upstream manufacturing Methods 0.000 description 6
- 230000004913 activation Effects 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 238000010606 normalization Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000011176 pooling Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 238000009499 grossing Methods 0.000 description 3
- 238000000513 principal component analysis Methods 0.000 description 3
- 230000002708 enhancing effect Effects 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000003340 mental effect Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000003205 fragrance Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000006386 memory function Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012916 structural analysis Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Databases & Information Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Machine Translation (AREA)
Abstract
本发明涉及大数据技术领域,特别涉及一种基于大数据分析的知识点拆解方法及系统。本发明在知识点拆解的精度和可解释性方面具有有益效果。它通过合理的知识块划分、语义挖掘、知识聚焦和联动系数优化等操作,提高了拆解结果的准确性和全局性。同时,在生成知识点拆解文本时,综合考虑了局部和全局的拆解预测结果,使得生成的文本更具完整性和解释性。这样的方案可以为教育领域和其他知识处理任务提供有力的支持和应用价值。
Description
技术领域
本发明涉及大数据技术领域,特别涉及一种基于大数据分析的知识点拆解方法及系统。
背景技术
离线教育APP是一种应用程序,旨在提供离线学习和教育体验。它可以被下载到移动设备(如智能手机、平板电脑)或计算机,并允许用户在没有互联网连接的情况下访问学习内容和功能。
离线教育APP通常包括以下特点和功能:离线访问:用户可以事先下载学习资源、课程内容、视频、文档等,以便在没有网络连接的情况下进行学习;自主学习:用户可以根据自己的进度和需求选择学习内容,自主安排学习时间和地点;互动学习:通过离线教育APP,用户可以参与各种学习活动,例如在线测验、练习题、讨论区等,与其他学习者交流和互动;学习管理:离线教育APP通常提供学习进度跟踪、成绩记录和学习目标设定等功能,帮助用户管理和评估自己的学习成果;多样化的学习内容:离线教育APP可以提供多种学科领域的学习资源,包括语言学习、编程、科学、历史等,以满足不同用户的学习需求。
离线教育APP的出现使得学习更加便捷和灵活,用户可以随时随地进行学习,无需依赖稳定的互联网连接。在离线教育APP的实际应用中,可能会涉及到用户对相关知识文本的知识点拆解需求,但是传统的知识点拆解技术存在精度低下,以及合理性和可解释性差的问题。
发明内容
为改善相关技术中存在的技术问题,本发明提供了一种基于大数据分析的知识点拆解方法及系统。
第一方面,本发明实施例提供了一种基于大数据分析的知识点拆解方法,应用于知识点拆解处理系统,所述方法包括:
获得待拆解知识点文本,对所述待拆解知识点文本进行文本语义挖掘得到第一题目知识块文本语义向量,对所述待拆解知识点文本进行语义描述聚焦操作得到第一题目知识语义聚焦向量;其中,所述第一题目知识语义聚焦向量用于反映所述待拆解知识点文本的整体知识网络之间的上下游关系;
将所述第一题目知识块文本语义向量调整成题目知识块映射向量,将所述第一题目知识语义聚焦向量调整成题目知识聚焦映射向量,获得所述题目知识块映射向量所对应的第一联动系数,以及获得所述题目知识聚焦映射向量所对应的第二联动系数;
基于所述第一联动系数对所述题目知识聚焦映射向量进行特征优化处理,得到已优化题目知识聚焦映射向量,基于所述第二联动系数对所述题目知识块映射向量进行特征优化处理,得到已优化题目知识块映射向量,将所述题目知识块映射向量和所述已优化题目知识块映射向量调整成第二题目知识块文本语义向量,将所述题目知识聚焦映射向量和所述已优化题目知识聚焦映射向量调整成第二题目知识语义聚焦向量;
将所述第一题目知识块文本语义向量和所述第二题目知识块文本语义向量拼接成题目知识块交叉语义向量,将所述第一题目知识语义聚焦向量、所述第二题目知识语义聚焦向量以及所述题目知识块交叉语义向量拼接成题目知识交叉聚焦向量;
获得所述题目知识块交叉语义向量对应的阶段知识点拆解建议,以及所述题目知识交叉聚焦向量对应的整体知识点拆解建议,基于所述阶段知识点拆解建议和所述整体知识点拆解建议的均值量化结果,生成所述待拆解知识点文本对应的知识点拆解文本。
在一些可能的实施例中,所述获得待拆解知识点文本,对所述待拆解知识点文本进行文本语义挖掘得到第一题目知识块文本语义向量,对所述待拆解知识点文本进行语义描述聚焦操作得到第一题目知识语义聚焦向量,包括:
获得待拆解知识点文本,将所述待拆解知识点文本加载到知识文本拆解算法中的文本语义挖掘分支,通过所述文本语义挖掘分支获得所述待拆解知识点文本对应的基础文本语义向量;
将所述基础文本语义向量加载到所述知识文本拆解算法中的知识块文本语义挖掘模块,通过所述知识块文本语义挖掘模块获得所述基础文本语义向量对应的第一题目知识块文本语义向量;所述知识块文本语义挖掘模块包括X个可逆单元,X为正整数;
将所述基础文本语义向量加载到所述知识文本拆解算法中的题目知识网文本语义挖掘模块,通过所述题目知识网文本语义挖掘模块获得所述基础文本语义向量对应的第一题目知识语义聚焦向量;所述题目知识网文本语义挖掘模块包括X个语义聚焦单元。
在一些可能的实施例中,所述通过所述文本语义挖掘分支获得所述待拆解知识点文本对应的基础文本语义向量,包括:
基于所述文本语义挖掘分支中的滑动平均子网对所述待拆解知识点文本进行滑动平均操作,得到所述待拆解知识点文本对应的文本滑动平均结果;
基于所述文本语义挖掘分支中的区间数组映射子网对所述文本滑动平均结果进行区间数组映射处理,得到文本区间数组映射向量,采用所述文本语义挖掘分支中的处理核对所述文本区间数组映射向量进行非线性变换,得到非线性文本语义向量;
基于所述文本语义挖掘分支中的语义下采样子网对所述非线性文本语义向量进行语义下采样操作,得到所述待拆解知识点文本对应的基础文本语义向量。
在一些可能的实施例中,所述知识文本拆解算法还包括语义特征混淆分支,所述语义特征混淆分支用作混淆所述知识块文本语义挖掘模块中的第u个可逆单元和所述题目知识网文本语义挖掘模块中的第u个语义聚焦单元之间的映射数据,u为小于或等于X的正整数;所述通过所述知识块文本语义挖掘模块获得所述基础文本语义向量对应的第一题目知识块文本语义向量,包括:
获得所述知识块文本语义挖掘模块中的第u个可逆单元的传入向量;当u=1时,第u个可逆单元的传入向量为所述基础文本语义向量;当u≠1时,第u个可逆单元的传入向量包括第u-1个可逆单元的生成向量,以及作用于第u-1个语义聚焦单元和第u-1个可逆单元的语义特征混淆分支所生成的题目知识块文本语义向量;
基于第u个可逆单元中的若干个滑动平均子网,对第u个可逆单元的传入向量进行滑动平均操作,得到阶段性滑动平均结果;
对所述阶段性滑动平均结果和第u个可逆单元的传入向量进行梯度优化,得到第u个可逆单元的生成向量,将所述知识块文本语义挖掘模块中的第X个可逆单元的生成向量确定为所述第一题目知识块文本语义向量。
在一些可能的实施例中,所述通过所述题目知识网文本语义挖掘模块获得所述基础文本语义向量对应的第一题目知识语义聚焦向量,包括:
获得所述题目知识网文本语义挖掘模块中的第u个语义聚焦单元的传入向量;当u=1时,第u个语义聚焦单元的传入向量为所述基础文本语义向量;当u≠1时,第u个语义聚焦单元的传入向量包括第u-1个语义聚焦单元的生成向量,第u-1个可逆单元的生成向量,以及作用于第u-1个语义聚焦单元和第u-1个可逆单元的语义特征混淆分支所生成的题目知识语义聚焦向量和题目知识块文本语义向量;
基于第u个语义聚焦单元对应的混淆因子关系网,将第u个语义聚焦单元的传入向量调整成连接特征关系网、请求特征关系网以及应答特征关系网,对所述连接特征关系网与所述请求特征关系网的映射关系网进行特征处理,得到待处理量化因子关系网;
获得所述连接特征关系网的尺寸指标,对所述待处理量化因子关系网与所述尺寸指标的设定运算结果之间的比例进行区间数组映射处理,得到语义聚焦因子关系网,将所述语义聚焦因子关系网与所述应答特征关系网之间的特征处理结果确定为语义聚焦线性向量;
将所述语义聚焦线性向量和第u个语义聚焦单元的传入向量拼接成语义聚焦线性可逆向量,基于第u个语义聚焦单元中的前馈节点对所述语义聚焦线性可逆向量进行向量更新,得到语义聚焦更新向量;
将所述语义聚焦线性可逆向量和所述语义聚焦更新向量拼接成第u个语义聚焦单元的生成向量,将所述题目知识网文本语义挖掘模块中的第X个语义聚焦单元的生成向量确定为所述第一题目知识语义聚焦向量。
在一些可能的实施例中,所述将所述第一题目知识块文本语义向量调整成题目知识块映射向量,包括:
将所述第一题目知识块文本语义向量加载到知识文本拆解算法中的语义特征混淆分支,通过所述语义特征混淆分支对所述第一题目知识块文本语义向量进行第一特征映射,得到所述第一题目知识块文本语义向量对应的语义映射结果;
依据所述第一题目知识块文本语义向量所对应的语义映射结果,确定所述第一题目知识块文本语义向量对应的题目知识块映射向量。
在一些可能的实施例中,所述获得所述题目知识块映射向量所对应的第一联动系数,包括:
基于所述语义特征混淆分支中的第一个滑动平均子网对所述题目知识块映射向量的目标向量元素进行滑动平均操作,得到第一卷积映射特征;
基于所述语义特征混淆分支中的区间数组映射子网对所述第一卷积映射特征进行区间数组映射处理,得到标准化语义映射特征,采用所述语义特征混淆分支中的第一个处理核对所述标准化语义映射特征进行非线性变换,得到非线性语义映射特征;
基于所述语义特征混淆分支中的第二个滑动平均子网对所述非线性语义映射特征进行滑动平均操作,得到第二卷积映射特征,采用所述语义特征混淆分支中的第二个处理核对所述第二卷积映射特征进行非线性变换,得到所述题目知识块映射向量所对应的第一联动系数。
在一些可能的实施例中,所述将所述题目知识块映射向量和所述已优化题目知识块映射向量调整成第二题目知识块文本语义向量,包括:
将所述题目知识块映射向量和所述已优化题目知识块映射向量拼接成可逆映射向量,通过所述语义特征混淆分支对所述可逆映射向量进行第二特征映射,得到所述可逆映射向量对应的文本语义译码向量;
获得所述语义特征混淆分支中的RNN节点对应的中间变量关系网和置信特征,基于所述置信特征以及所述中间变量关系网与所述文本语义译码向量之间的特征处理结果,确定所述待拆解知识点文本对应的第二题目知识块文本语义向量。
在一些可能的实施例中,所述获得所述题目知识块交叉语义向量对应的阶段知识点拆解建议,以及所述题目知识交叉聚焦向量对应的整体知识点拆解建议,包括:
将所述题目知识块交叉语义向量加载到知识文本拆解算法中的阶段知识点拆解分支,通过所述阶段知识点拆解分支对所述题目知识块交叉语义向量进行特征扩展处理,得到所述待拆解知识点文本对应的阶段知识点拆解建议;
将所述题目知识交叉聚焦向量加载到知识文本拆解算法中的整体知识点拆解分支,通过所述整体知识点拆解分支对所述题目知识交叉聚焦向量进行特征扩展处理,得到所述待拆解知识点文本对应的整体知识点拆解建议。
第二方面,本发明还提供了一种知识点拆解处理系统,包括处理器和存储器;所述处理器和所述存储器通信连接,所述处理器用于从所述存储器中读取计算机程序并执行,以实现上述的方法。
第三方面,本发明还提供了一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现上述的方法。
本发明实施例中,获得到待拆解知识点文本之后,可以提取该待拆解知识点文本中的第一题目知识块文本语义向量和第一题目知识语义聚焦向量,该第一题目知识语义聚焦向量用于反映待拆解知识点文本中的整体知识网络之间的上下游关系,换言之,不仅能够挖掘待拆解知识点文本中的个别知识块数据又能够挖掘该待拆解知识点文本中的整体知识网络,从而提升文本语义向量的特征表现性能。进一步地,可以在量化映射空间中获得第一题目知识块文本语义向量和第一题目知识语义聚焦向量分别所对应的联动系数,通过实现联动系数的混淆进行特征优化处理,得到知识块映射优化向量和知识聚焦映射优化向量,可以在量化映射空间中尽可能考虑待拆解知识点文本中的知识块和整体知识网络;这样在语义特征空间中,对部分-整体混淆后的第二题目知识块文本语义向量和第二题目知识语义聚焦向量进行梯度优化(比如残差处理),可以综合题目知识块文本语义向量和题目知识语义聚焦向量之间的优势,从而提高知识点拆解文本的生成精度,确保知识点拆解的合理性和可解释性。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并于说明书一起用于解释本发明的原理。
图1是本发明实施例提供的一种基于大数据分析的知识点拆解方法的流程示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与本发明的一些方面相一致的装置和方法的例子。
需要说明的是,本发明的说明书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
本发明实施例所提供的方法实施例可以在知识点拆解处理系统、计算机设备或者类似的运算装置中执行。以运行在知识点拆解处理系统上为例,知识点拆解处理系统可以包括一个或多个处理器(处理器可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器,可选地,上述知识点拆解处理系统还可以包括用于通信功能的传输装置。本领域普通技术人员可以理解,上述结构仅为示意,其并不对上述知识点拆解处理系统的结构造成限定。例如,知识点拆解处理系统还可包括比上述所示更多或者更少的组件,或者具有与上述所示不同的配置。
存储器可用于存储计算机程序,例如,应用软件的软件程序以及模块,如本发明实施例中的一种基于大数据分析的知识点拆解方法对应的计算机程序,处理器通过运行存储在存储器内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至知识点拆解处理系统。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置用于经由一个网络接收或者发送数据。上述的网络具体实例可包括知识点拆解处理系统的通信供应商提供的无线网络。在一个实例中,传输装置包括一个网络适配器(Network Interface Controller,简称为NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置可以为射频(Radio Frequency,简称为RF)模块,其用于通过无线方式与互联网进行通讯。
基于此,请参阅图1,图1是本发明实施例所提供的一种基于大数据分析的知识点拆解方法的流程示意图,该方法应用于知识点拆解处理系统,进一步可以包括步骤101-步骤105。
步骤101、获得待拆解知识点文本,对所述待拆解知识点文本进行文本语义挖掘得到第一题目知识块文本语义向量,对所述待拆解知识点文本进行语义描述聚焦操作得到第一题目知识语义聚焦向量。
其中,所述第一题目知识语义聚焦向量用于反映所述待拆解知识点文本的整体知识网络之间的上下游关系。进一步地,题目知识块文本语义向量可以理解为待拆解知识点文本对应的局部知识文本特征,题目知识语义聚焦向量可以理解为待拆解知识点文本对应的注意力文本特征,语义描述聚焦操作适应性可以理解为注意力编码操作。此外,整体知识网络可以理解为待拆解知识点文本的全局文本内容,上下游关系用于反映整体知识网络之间的特征传递情况。
步骤102、将所述第一题目知识块文本语义向量调整成题目知识块映射向量,将所述第一题目知识语义聚焦向量调整成题目知识聚焦映射向量,获得所述题目知识块映射向量所对应的第一联动系数,以及获得所述题目知识聚焦映射向量所对应的第二联动系数。
其中,题目知识块映射向量和题目知识聚焦映射向量可以是转换至量化映射空间中的语义向量,而联动系数可以理解为交互系数。
步骤103、基于所述第一联动系数对所述题目知识聚焦映射向量进行特征优化处理,得到已优化题目知识聚焦映射向量,基于所述第二联动系数对所述题目知识块映射向量进行特征优化处理,得到已优化题目知识块映射向量,将所述题目知识块映射向量和所述已优化题目知识块映射向量调整成第二题目知识块文本语义向量,将所述题目知识聚焦映射向量和所述已优化题目知识聚焦映射向量调整成第二题目知识语义聚焦向量。
其中,特征优化处理包括特征强化处理。
步骤104、将所述第一题目知识块文本语义向量和所述第二题目知识块文本语义向量拼接成题目知识块交叉语义向量,将所述第一题目知识语义聚焦向量、所述第二题目知识语义聚焦向量以及所述题目知识块交叉语义向量拼接成题目知识交叉聚焦向量。
其中,题目知识块交叉语义向量是第一题目知识块文本语义向量和第二题目知识块文本语义向量的特征融合结果,题目知识交叉聚焦向量是第一题目知识语义聚焦向量、第二题目知识语义聚焦向量以及题目知识块交叉语义向量的特征融合结果。
步骤105、获得所述题目知识块交叉语义向量对应的阶段知识点拆解建议,以及所述题目知识交叉聚焦向量对应的整体知识点拆解建议,基于所述阶段知识点拆解建议和所述整体知识点拆解建议的均值量化结果,生成所述待拆解知识点文本对应的知识点拆解文本。
其中,阶段知识点拆解建议可以理解为局部知识点的拆解预测结果,整体知识点拆解建议可以理解为全局知识的拆解预测结果,在此基础上,可以基于均值量化处理(也即平均化处理)来获得待拆解知识点文本对应的知识点拆解文本,以实现知识点的拆解。
下面分别对步骤101-步骤105进行介绍说明。
对于步骤101而言,首先获取待拆解的知识点文本。然后通过进行文本语义挖掘,可以得到第一题目知识块文本语义向量,它表示待拆解知识点文本的局部知识特征。接下来,对待拆解知识点文本进行语义描述聚焦操作,得到第一题目知识语义聚焦向量,它可以看作是待拆解知识点文本的注意力文本特征,用于反映整体知识网络之间的上下游关系。
例如,假设有一个待拆解的知识点文本:“计算机科学中的数据结构与算法“。通过文本语义挖掘,可以得到第一题目知识块文本语义向量,该向量表示该知识点文本的局部特征。然后,对待拆解知识点文本进行语义描述聚焦操作,得到第一题目知识语义聚焦向量,该向量反映了整体知识网络中的上下游关系。
以计算机科学中的数据结构与算法为例,下面将演示如何生成第一题目知识块文本语义向量和第一题目知识语义聚焦向量。
第一题目知识块文本语义向量:对于待拆解的知识点文本:“计算机科学中的数据结构与算法“,可以使用文本语义挖掘技术来生成第一题目知识块文本语义向量。这个向量表示该知识点文本的局部特征,即数据结构与算法方面的知识。示例结果可能是一个向量[0.2,0.8,0.5,-0.3],其中每个元素表示对应的特征值。
第一题目知识语义聚焦向量:在对待拆解知识点文本进行语义描述聚焦操作时,考虑整体知识网络中的上下游关系。通过注意力编码操作,可以生成第一题目知识语义聚焦向量,它反映了整体知识网络中的关注度或重要性。假设得到的第一题目知识语义聚焦向量是[0.6,0.4,0.7,0.9],其中每个元素表示对应的注意力权重。
这样,通过步骤101,获得了计算机科学中的数据结构与算法这个待拆解知识点文本的第一题目知识块文本语义向量和第一题目知识语义聚焦向量。接下来,根据后续步骤进行特征优化处理和其他操作,以生成最终的知识点拆解结果。
对于步骤102而言,以计算机科学中的数据结构与算法为例,将继续举例介绍步骤102的操作。
将第一题目知识块文本语义向量调整成题目知识块映射向量:题目知识块映射向量可以理解为将第一题目知识块文本语义向量转换到量化映射空间中的语义向量。这个转换可以通过某种映射函数或者规则来实现。假设对于第一题目知识块文本语义向量[0.2,0.8,0.5,-0.3],经过映射转换后得到题目知识块映射向量[0.6,0.7,-0.1,0.4]。
将第一题目知识语义聚焦向量调整成题目知识聚焦映射向量:类似地,第一题目知识语义聚焦向量也需要进行映射转换,得到题目知识聚焦映射向量。这个向量可以看作是注意力编码操作后的结果在量化映射空间中的向量表示。假设第一题目知识语义聚焦向量为[0.6,0.4,0.7,0.9],经过映射转换后得到题目知识聚焦映射向量[0.8,0.6,-0.2,0.3]。
通过上述操作,获得了计算机科学中的数据结构与算法这个待拆解知识点文本的题目知识块映射向量和题目知识聚焦映射向量。接下来,在步骤103中将对这些向量进行特征优化处理,以进一步改善它们的表达和性能。
当使用量化的映射函数时,在步骤102中可以对第一题目知识块文本语义向量和第一题目知识语义聚焦向量进行更具体的处理。以下是一个示例:题目知识块映射向量的生成:对于第一题目知识块文本语义向量[0.2,0.8,0.5,-0.3],可以应用量化的映射函数将其转换为一个离散的向量表示。例如,可以采用一种量化方案,将每个元素根据某个阈值划分为不同的离散取值。假设使用阈值0.5进行划分,那么原始向量可以被映射为[0,1,1,0]。题目知识聚焦映射向量的生成:类似地,对于第一题目知识语义聚焦向量[0.6,0.4,0.7,0.9],同样可以采用量化的映射函数进行转换。假设使用阈值0.6进行划分,那么原始向量可以被映射为[1,0,1,1]。通过这样的量化映射函数,将第一题目知识块文本语义向量和第一题目知识语义聚焦向量从连续值转换为离散的取值。这样的处理使得向量更易于处理和比较,可以在后续步骤中更好地进行特征优化和其他操作。需要注意的是,具体的映射函数和阈值选择可以根据具体任务和需求进行调整。
对于步骤103而言,对题目知识块映射向量和题目知识聚焦映射向量进行特征优化处理,以进一步改善它们的表达和性能。以下是一个示例:特征优化处理:可以使用各种特征优化技术来增强题目知识块映射向量和题目知识聚焦映射向量的表达能力。这些技术包括降维、归一化、特征选择等。例如,可以应用主成分分析(PCA)对映射向量进行降维,保留最重要的特征。假设经过PCA降维后,题目知识块映射向量变为[0.3,0.6],而题目知识聚焦映射向量变为[0.8,0.2]。
其他操作:此外,还可以进行其他操作来进一步改善向量的性能。例如,可以应用归一化技术,将向量的值缩放到一个固定范围内,以避免数值差异带来的影响。假设对题目知识块映射向量和题目知识聚焦映射向量进行归一化处理,分别得到[0.6,0.9]和[0.8,0.2]。
通过这样的特征优化处理和其他操作,改善了题目知识块映射向量和题目知识聚焦映射向量的表达能力,并使它们更适合后续的任务和应用。需要注意的是,具体的特征优化技术和操作方式可以根据具体需求和数据特点进行选择和调整。
对于步骤104而言,将以计算机科学中的数据结构与算法为例,进一步举例介绍题目知识块交叉语义向量和题目知识交叉聚焦向量的拼接过程。
假设有两个题目知识块文本语义向量:
第一题目知识块文本语义向量:[0.2,0.8,0.5,-0.3];
第二题目知识块文本语义向量:[0.6,-0.4,0.1,0.9]。
还有两个题目知识语义聚焦向量:
第一题目知识语义聚焦向量:[0.6,0.4,0.7,0.9];
第二题目知识语义聚焦向量:[0.3,0.7,-0.2,0.5]。
现在将这些向量进行拼接,生成题目知识块交叉语义向量和题目知识交叉聚焦向量:
题目知识块交叉语义向量拼接:将第一题目知识块文本语义向量和第二题目知识块文本语义向量按顺序拼接起来,得到题目知识块交叉语义向量。
拼接后的题目知识块交叉语义向量为:[0.2,0.8,0.5,-0.3,0.6,-0.4,0.1,0.9]。
题目知识交叉聚焦向量拼接:将第一题目知识语义聚焦向量、第二题目知识语义聚焦向量和题目知识块交叉语义向量按顺序拼接起来,得到题目知识交叉聚焦向量。
拼接后的题目知识交叉聚焦向量为:[0.6,0.4,0.7,0.9,0.3,0.7,-0.2,0.5,0.2,0.8,0.5,-0.3,0.6,-0.4,0.1,0.9]。
通过对题目知识块文本语义向量和题目知识语义聚焦向量的拼接操作,生成了题目知识块交叉语义向量和题目知识交叉聚焦向量。这些向量将更全面地包含两个题目知识块的信息,并可以在后续的任务中进行进一步处理和应用,例如相似性比较、特征提取等。
对于步骤105而言,根据局部和全局的拆解预测结果来从待拆解知识点文本中拆解出知识点拆解文本。以下是一个示例:
待拆解知识点文本:“实现一个二叉搜索树并进行查找、插入和删除操作。“
局部和全局的拆解预测结果:在步骤104中,已经生成了题目知识交叉聚焦向量。在步骤105中,使用训练好的模型对该向量进行预测,得到局部和全局的拆解预测结果。
局部拆解预测结果:例如,预测结果可以包括[“二叉搜索树”,“查找操作”,“插入操作”,“删除操作”]等。
全局拆解预测结果:例如,预测结果可以为[“数据结构”,“二叉搜索树”,“操作”,“查找”,“插入”,“删除”]等。
知识点拆解文本生成:使用局部和全局的拆解预测结果,可以根据它们提取关键词或短语,并结合原始知识点文本进行拆解。这样就可以生成知识点拆解文本。
基于上述示例,通过提取关键词和组合,可能得到以下知识点拆解文本:[“数据结构“,“二叉搜索树“,“查找操作“,“插入操作“,“删除操作“]。
通过步骤105,利用局部和全局的拆解预测结果,从待拆解的知识点文本中提取出与知识点相关的拆解文本,这有助于进一步分析、理解和应用知识点的细粒度信息。
综上,通过步骤101和步骤102,将待拆解知识点文本划分为多个知识块,并进行语义挖掘,能够提取到具有独立意义和特征的局部知识文本。这可以增强知识点拆解的准确性和可解释性,因为每个知识块都代表一个特定的概念或子知识点。通过步骤101中的语义描述聚焦操作和步骤103中的特征优化处理,对题目知识聚焦映射向量和题目知识块映射向量进行优化,使其更好地表达整体知识网络之间的上下游关系。这种优化可以提高拆解结果的精度和准确性,同时增强对知识内部和外部关联的解释能力。通过步骤104中的拼接操作得到题目知识交叉聚焦向量,该向量融合了第一题目知识块文本语义向量、第二题目知识块文本语义向量以及第一和第二题目知识语义聚焦向量的特征。这可以提供更全面的知识点特征表示,有助于捕捉知识点之间的交叉关系,从而提高拆解结果的精度和全局性。通过步骤105中的阶段知识点拆解建议和整体知识点拆解建议,基于均值量化结果生成待拆解知识点文本的知识点拆解文本。这样做可以进一步提升拆解的准确性和可解释性,因为它结合了局部和全局的拆解预测结果,并使用均值量化方法生成综合的拆解文本。
可见,上述方案在知识点拆解的精度和可解释性方面具有有益效果。它通过合理的知识块划分、语义挖掘、知识聚焦和联动系数优化等操作,提高了拆解结果的准确性和全局性。同时,在生成知识点拆解文本时,综合考虑了局部和全局的拆解预测结果,使得生成的文本更具完整性和解释性。这样的方案可以为教育领域和其他知识处理任务提供有力的支持和应用价值。
在一些可选的实施例中,步骤101所描述的获得待拆解知识点文本,对所述待拆解知识点文本进行文本语义挖掘得到第一题目知识块文本语义向量,对所述待拆解知识点文本进行语义描述聚焦操作得到第一题目知识语义聚焦向量,可以包括步骤1011-步骤1013所描述的技术方案。
步骤1011、获得待拆解知识点文本,将所述待拆解知识点文本加载到知识文本拆解算法中的文本语义挖掘分支,通过所述文本语义挖掘分支获得所述待拆解知识点文本对应的基础文本语义向量。其中,基础文本语义向量为初始的文本语义向量。
以计算机科学中的数据结构与算法为例,对步骤1011进行举例解释说明:假设有一个待拆解的知识点文本是关于二叉树的介绍。将这个待拆解知识点文本加载到知识文本拆解算法中的文本语义挖掘分支。在文本语义挖掘分支中,可以使用自然语言处理技术和深度学习方法来处理文本并提取语义信息。对于这个例子,算法可能会将待拆解知识点文本转换成基础文本语义向量,表示初始的文本语义特征。基础文本语义向量可以包含各种语义信息,如词汇、语法和上下文等。它代表了待拆解知识点文本的初始语义表示。通过步骤1011中的文本语义挖掘分支,可以获得待拆解知识点文本对应的基础文本语义向量。针对这个例子,基础文本语义向量可能包含表示二叉树、节点、遍历算法等相关概念的语义特征。这样,经过步骤1011,已经获得了待拆解知识点文本的基础文本语义向量,为后续的知识块文本语义挖掘和语义描述聚焦操作提供了基础。
步骤1012、将所述基础文本语义向量加载到所述知识文本拆解算法中的知识块文本语义挖掘模块,通过所述知识块文本语义挖掘模块获得所述基础文本语义向量对应的第一题目知识块文本语义向量;所述知识块文本语义挖掘模块包括X个可逆单元,X为正整数。
在步骤1011中,已经获得了待拆解知识点文本对应的基础文本语义向量,表示初始的文本语义特征。接下来,将这个基础文本语义向量加载到知识文本拆解算法的知识块文本语义挖掘模块中。知识块文本语义挖掘模块是一种能够进一步提取知识点中各个子知识块的语义特征的组件。它通常由多个可逆单元(卷积单元)组成,每个可逆单元可以处理一个特定的语义子任务。对于这个例子,假设在待拆解的知识点文本中,有关二叉树的内容包括二叉树的定义、遍历算法和平衡性等。通过知识块文本语义挖掘模块,可以针对这些子知识块分别提取出对应的语义特征,形成第一题目知识块文本语义向量。例如,对于二叉树的定义这个子知识块,知识块文本语义挖掘模块可以将其对应的基础文本语义向量经过处理,提取出表示二叉树定义的语义特征。同样地,对于遍历算法和平衡性这两个子知识块,知识块文本语义挖掘模块也可以针对每个子知识块提取出相应的语义特征。通过步骤1012,获得了待拆解知识点文本中第一题目知识块的文本语义向量,该向量封装了有关该特定子知识块的语义信息。这将为后续的拆解建议和生成知识点拆解文本提供基础和参考。
步骤1013、将所述基础文本语义向量加载到所述知识文本拆解算法中的题目知识网文本语义挖掘模块,通过所述题目知识网文本语义挖掘模块获得所述基础文本语义向量对应的第一题目知识语义聚焦向量;所述题目知识网文本语义挖掘模块包括X个语义聚焦单元。
在步骤1012中,已经获得了待拆解知识点文本中第一题目知识块的文本语义向量。接下来,将这个基础文本语义向量加载到知识文本拆解算法的题目知识网文本语义挖掘模块中。题目知识网文本语义挖掘模块是一种能够进一步聚焦于题目所涉及的相关知识点并提取其语义特征的组件。它通常由多个语义聚焦单元组成,每个语义聚焦单元可以处理一个特定的语义聚焦任务。对于这个例子,假设的题目涉及到二叉树的遍历算法和平衡性的问题。通过题目知识网文本语义挖掘模块,可以针对这两个知识点分别提取出相应的语义特征,并形成第一题目知识语义聚焦向量。例如,题目知识网文本语义挖掘模块可以将第一题目知识块文本语义向量与遍历算法和平衡性的语义聚焦单元进行交互。这样,可以将注意力集中在与遍历算法和平衡性相关的语义特征上,并提取出表示这两个知识点的语义信息。通过步骤1013,获得了待拆解知识点文本中第一题目知识块的语义聚焦向量。该向量封装了与题目所涉及的相关知识点(如遍历算法和平衡性)有关的语义信息。这将为后续的拆解建议和生成知识点拆解文本提供重要的参考和指导。
可见,在步骤1011中,通过文本语义挖掘分支,待拆解知识点文本被转换成基础文本语义向量。这个向量捕捉了知识点文本的初始语义特征,帮助更好地理解其含义和内容。通过文本语义挖掘,可以揭示知识点文本中的概念、关系和上下文信息,进一步丰富了对知识点的语义表达。接着,在步骤1012中,基础文本语义向量经过知识块文本语义挖掘模块的处理,得到第一题目知识块文本语义向量。此时,知识块文本语义挖掘模块根据知识点的结构和组织,能够针对不同子知识块提取相应的语义特征。这样,可以将知识点分解为更小的语义单元,并获得更精细的语义描述。这进一步帮助理解知识点的各个方面和组成部分,为知识点的拆解和处理奠定基础。最后,在步骤1013中,题目知识网文本语义挖掘模块利用基础文本语义向量聚焦于与题目相关的知识点。通过与题目的交互,这个模块可以提取出与题目所涉及的知识点相关的语义特征,形成第一题目知识语义聚焦向量。这有助于将注意力集中在与题目紧密相关的知识点上,提升了对题目要求的理解和应用能力。
综上所述,步骤1011-步骤1013的有益效果在于通过语义挖掘和聚焦操作,提取和丰富待拆解知识点文本的语义信息。这使得能够更深入地理解知识点的含义和组成部分,为后续的知识处理、拆解和生成知识点拆解文本提供准确、精细和针对性的基础,从而提升了知识处理和推广的效果。
在一些示例性实施例中,步骤1011中的通过所述文本语义挖掘分支获得所述待拆解知识点文本对应的基础文本语义向量,可以包括步骤10111-步骤10113。
步骤10111、基于所述文本语义挖掘分支中的滑动平均子网对所述待拆解知识点文本进行滑动平均操作,得到所述待拆解知识点文本对应的文本滑动平均结果。
其中,滑动平均操作可以理解为卷积处理。
在步骤10111中,通过文本语义挖掘分支中的滑动平均子网对待拆解知识点文本进行滑动平均操作,得到文本滑动平均结果。这一步骤可以理解为对文本进行卷积处理,从而获得一个平滑的表示。以计算机科学中的数据结构与算法为例,假设有一个待拆解的知识点文本:“二叉树是一种常见的数据结构之一”。在进行滑动平均操作时,可以将该文本视为一个序列,例如将每个字符编码为向量形式。然后,滑动平均子网将应用滑动窗口来计算输入序列的平均值,并生成表示滑动平均结果的向量。示例性的,对于上述示例文本,滑动平均子网在处理过程中,可以选择一个固定大小的窗口,例如3个字符。然后,从文本的开头开始,依次将窗口移动到序列的每个位置,并计算窗口中字符向量的平均值。这样,就可以得到关于滑动平均结果的向量表示。通过步骤10111,获得了待拆解知识点文本对应的文本滑动平均结果,该结果反映了文本序列的平滑特征。这有助于在后续的处理中更好地捕捉文本的整体语义信息,并为知识点的拆解和处理提供更准确和一致的基础。
步骤10112、基于所述文本语义挖掘分支中的区间数组映射子网对所述文本滑动平均结果进行区间数组映射处理,得到文本区间数组映射向量,采用所述文本语义挖掘分支中的处理核对所述文本区间数组映射向量进行非线性变换,得到非线性文本语义向量。
其中,区间数组映射可以理解为归一化/标准化,非线性变换可以理解为激活处理。
在步骤10112中,基于文本语义挖掘分支中的区间数组映射子网,对文本滑动平均结果进行区间数组映射处理,得到文本区间数组映射向量。然后,采用文本语义挖掘分支中的处理核对文本区间数组映射向量进行非线性变换,得到非线性文本语义向量。以计算机科学中的数据结构与算法为例,假设有一个文本滑动平均结果的向量表示:[0.2,0.8,0.5,0.3,0.6]。在进行区间数组映射时,可以将该向量视为一组数值,并进行归一化或标准化操作,将其映射到固定的区间范围内,例如[0,1]。接着,在非线性变换阶段,可以使用文本语义挖掘分支中的处理核(例如激活函数)对区间数组映射向量进行非线性变换。这个非线性变换能够增加向量中的非线性特征,使得文本语义向量更能凸显出重要的语义信息。例如,在上述示例中,可以选择采用ReLU(修正线性单元)作为处理核,将区间数组映射向量中的每个元素作为输入。ReLU函数将所有负值置零,并保持非负值不变,生成经过非线性变换后的非线性文本语义向量。通过步骤10112,获得了非线性文本语义向量,其中包含了经过区间数组映射和非线性变换处理后的文本语义特征。这个向量能够更好地表达知识点文本的非线性特征,提供了更丰富和准确的语义信息,为后续的知识处理和拆解提供了更有力的基础。
步骤10113、基于所述文本语义挖掘分支中的语义下采样子网对所述非线性文本语义向量进行语义下采样操作,得到所述待拆解知识点文本对应的基础文本语义向量。
其中,语义下采样操作可以理解为池化处理。
在步骤10113中,基于文本语义挖掘分支中的语义下采样子网,对非线性文本语义向量进行语义下采样操作,得到待拆解知识点文本对应的基础文本语义向量。以计算机科学中的数据结构与算法为例,假设有一个非线性文本语义向量表示:[0.7,0.2,0.9,0.4,0.6]。在进行语义下采样操作时,可以将该向量视为一组数值,并对其进行池化处理。常见的池化操作是最大池化(MaxPooling),它从输入向量中选择最大的数值作为下采样结果。例如,在上述示例中,通过最大池化操作,可以选择向量中的最大值0.9作为基础文本语义向量的元素。语义下采样操作可以帮助过滤和凸显出向量中的关键语义信息,同时降低向量的维度,使得后续处理更高效。通过步骤10113,获得了待拆解知识点文本对应的基础文本语义向量,其中包含了经过语义下采样处理后的关键语义特征。这个基础文本语义向量提供了知识点文本的精简表示,聚焦于最重要的语义信息。它为后续的知识处理和拆解提供了更紧凑、有针对性和高度概括的基础,有助于更好地理解和应用知识点中的关键概念和内容。
步骤10111至步骤10113是为了从待拆解的知识点文本中获得基础文本语义向量,并提供更准确、丰富和一致的语义信息。这些步骤通过一系列处理操作,对待拆解知识点文本进行平滑化、归一化、非线性变换和语义下采样,以获得更好的文本表示。首先,在步骤10111中,通过滑动平均操作(类似于卷积处理),将待拆解知识点文本转化为文本滑动平均结果。这种平滑化操作可以消除文本中的噪声和波动,使得文本表示更加稳定和平衡。这样做的好处是有效地捕捉到文本的整体趋势和特征,而不受个别字符或词语的影响。接下来,在步骤10112中,文本滑动平均结果经过区间数组映射和非线性变换的处理。区间数组映射将文本滑动平均结果进行归一化或标准化,使得数值范围在统一的区间内,有助于比较和理解不同文本之间的相对重要性。非线性变换通过使用激活函数等方法,增加了表示的非线性特征,使得文本语义向量更能凸显出重要的语义信息。这样做的好处是提升了文本表示的表达能力,更好地捕捉到文本中的非线性关系和语义含义。最后,在步骤10113中,通过语义下采样操作对非线性文本语义向量进行池化处理。这种操作有助于过滤和保留向量中的关键语义信息,同时降低向量的维度。通过选择最大值或其他策略,基础文本语义向量得以聚焦于最重要的语义特征,并去除不相关或次要的信息。这样做的好处是提高了文本表示的精炼度和概括能力,使得后续的知识处理和拆解更加高效和准确。
综上所述,步骤10111至步骤10113的有益效果体现在:平滑化文本、归一化处理、增加非线性特征和语义下采样操作,这些操作使得基础文本语义向量更具有稳定性、统一性、表达能力和概括能力。这样的文本表示有助于更好地理解、分析和应用待拆解知识点文本,为知识处理和拆解提供了更有力的基础。
在一些示例下,所述知识文本拆解算法还包括语义特征混淆分支,所述语义特征混淆分支用作混淆所述知识块文本语义挖掘模块中的第u个可逆单元和所述题目知识网文本语义挖掘模块中的第u个语义聚焦单元之间的映射数据,u为小于或等于X的正整数。基于此,步骤1012中的通过所述知识块文本语义挖掘模块获得所述基础文本语义向量对应的第一题目知识块文本语义向量,包括步骤10121-步骤10125。
步骤10121、获得所述知识块文本语义挖掘模块中的第u个可逆单元的传入向量。
步骤10122、当u=1时,第u个可逆单元的传入向量为所述基础文本语义向量。
步骤10123、当u≠1时,第u个可逆单元的传入向量包括第u-1个可逆单元的生成向量,以及作用于第u-1个语义聚焦单元和第u-1个可逆单元的语义特征混淆分支所生成的题目知识块文本语义向量。
步骤10124、基于第u个可逆单元中的若干个滑动平均子网,对第u个可逆单元的传入向量进行滑动平均操作,得到阶段性滑动平均结果。
步骤10125、对所述阶段性滑动平均结果和第u个可逆单元的传入向量进行梯度优化,得到第u个可逆单元的生成向量,将所述知识块文本语义挖掘模块中的第X个可逆单元的生成向量确定为所述第一题目知识块文本语义向量。
其中,梯度优化可以理解为残差处理。
在步骤10121至步骤10125中,根据所述知识文本拆解算法的描述,将以计算机科学中的数据结构与算法为例,对这些步骤进行解释说明。首先,在步骤10121中,获得知识块文本语义挖掘模块中的第u个可逆单元的传入向量。假设正在处理一个计算机科学中链表数据结构的知识点,那么第1个可逆单元的传入向量就是基础文本语义向量,即刚才提到的经过步骤10111至步骤10113处理得到的向量。接下来,在步骤10122中,当u=1时,第1个可逆单元的传入向量就是基础文本语义向量。这表示第1个可逆单元直接使用了基础文本语义向量作为输入,不需要其他的生成向量或混淆操作。然而,在步骤10123中,当u≠1时,第u个可逆单元的传入向量由第u-1个可逆单元的生成向量和语义特征混淆分支生成的题目知识块文本语义向量组成。这意味着在第u个可逆单元中,除了上一层的生成向量外,还会加入来自语义特征混淆分支的影响。进一步,在步骤10124中,基于第u个可逆单元中的若干个滑动平均子网,对第u个可逆单元的传入向量进行滑动平均操作,得到阶段性滑动平均结果。这一步骤类似于步骤10111中的滑动平均操作,但是针对的是当前可逆单元的传入向量而不是整个文本。最后,在步骤10125中,通过梯度优化(残差处理),对阶段性滑动平均结果和第u个可逆单元的传入向量进行调整,得到第u个可逆单元的生成向量。经过多次迭代后,将知识块文本语义挖掘模块中的第X个可逆单元的生成向量确定为第一题目知识块文本语义向量。这表示在经过多层可逆单元的处理后,得到了具有更高层次语义信息的第一题目知识块文本语义向量。
通过上述步骤10121至步骤10125,能够逐步构建起用于拆解知识点的题目知识块文本语义向量,并在每个可逆单元中引入滑动平均和梯度优化的操作,进一步提升语义表示的准确性和丰富性。这些步骤结合了语义特征混淆分支和残差处理,以逐步迭代的方式对文本语义进行挖掘和优化,从而获得更具有表达能力和解释性的题目知识块文本语义向量。
在一些可能的实施例中,步骤1013中的通过所述题目知识网文本语义挖掘模块获得所述基础文本语义向量对应的第一题目知识语义聚焦向量,包括步骤10131-步骤10137。
步骤10131、获得所述题目知识网文本语义挖掘模块中的第u个语义聚焦单元的传入向量。
步骤10132、u=1时,第u个语义聚焦单元的传入向量为所述基础文本语义向量。
步骤10133、u≠1时,第u个语义聚焦单元的传入向量包括第u-1个语义聚焦单元的生成向量,第u-1个可逆单元的生成向量,以及作用于第u-1个语义聚焦单元和第u-1个可逆单元的语义特征混淆分支所生成的题目知识语义聚焦向量和题目知识块文本语义向量。
步骤10134、基于第u个语义聚焦单元对应的混淆因子关系网,将第u个语义聚焦单元的传入向量调整成连接特征关系网、请求特征关系网以及应答特征关系网,对所述连接特征关系网与所述请求特征关系网的映射关系网进行特征处理,得到待处理量化因子关系网。
其中,混淆因子关系网可以理解为混淆因子矩阵,连接特征关系网、请求特征关系网以及应答特征关系网分别可以理解为查询特征矩阵、键特征矩阵以及值特征矩阵。
步骤10135、获得所述连接特征关系网的尺寸指标,对所述待处理量化因子关系网与所述尺寸指标的设定运算结果之间的比例进行区间数组映射处理,得到语义聚焦因子关系网,将所述语义聚焦因子关系网与所述应答特征关系网之间的特征处理结果确定为语义聚焦线性向量。
其中,尺寸指标可以是连接特征关系网的列数。特征处理结果可以是点乘处理结果。
步骤10136、将所述语义聚焦线性向量和第u个语义聚焦单元的传入向量拼接成语义聚焦线性可逆向量,基于第u个语义聚焦单元中的前馈节点对所述语义聚焦线性可逆向量进行向量更新,得到语义聚焦更新向量。
其中,向量更新可以是特征变换处理。
步骤10137、将所述语义聚焦线性可逆向量和所述语义聚焦更新向量拼接成第u个语义聚焦单元的生成向量,将所述题目知识网文本语义挖掘模块中的第X个语义聚焦单元的生成向量确定为所述第一题目知识语义聚焦向量。
首先,在步骤10131中,获得题目知识网文本语义挖掘模块中的第u个语义聚焦单元的传入向量。假设正在处理一个关于链表数据结构的问题,那么第1个语义聚焦单元的传入向量就是基础文本语义向量,即刚才提到的经过步骤10111至步骤10113处理得到的向量。接下来,在步骤10132中,当u=1时,第1个语义聚焦单元的传入向量就是基础文本语义向量。这表示第1个语义聚焦单元直接使用了基础文本语义向量作为输入,不需要其他的生成向量或混淆操作。然而,在步骤10133中,当u≠1时,第u个语义聚焦单元的传入向量由第u-1个语义聚焦单元的生成向量,第u-1个可逆单元的生成向量,以及作用于第u-1个语义聚焦单元和第u-1个可逆单元的语义特征混淆分支所生成的题目知识语义聚焦向量和题目知识块文本语义向量组成。这意味着在第u个语义聚焦单元中,除了来自前一层语义聚焦单元和可逆单元的生成向量外,还会加入来自语义特征混淆分支的影响。进一步,在步骤10134中,基于第u个语义聚焦单元对应的混淆因子关系网,将第u个语义聚焦单元的传入向量调整成连接特征关系网、请求特征关系网以及应答特征关系网,并对连接特征关系网与请求特征关系网的映射关系网进行特征处理得到待处理量化因子关系网。这里可以将混淆因子关系网理解为混淆因子矩阵,连接特征关系网、请求特征关系网以及应答特征关系网分别可以看作查询特征矩阵、键特征矩阵以及值特征矩阵。接下来,在步骤10135中,获得连接特征关系网的尺寸指标,例如连接特征关系网的列数作为尺寸指标。然后,将待处理量化因子关系网与尺寸指标的设定运算结果之间的比例进行区间数组映射处理,得到语义聚焦因子关系网。最后,将语义聚焦因子关系网与应答特征关系网之间的特征处理结果确定为语义聚焦线性向量。这里的特征处理结果可以是点乘处理结果。在步骤10136中,将语义聚焦线性向量和第u个语义聚焦单元的传入向量拼接成语义聚焦线性可逆向量。然后,基于第u个语义聚焦单元中的前馈节点对语义聚焦线性可逆向量进行向量更新,得到语义聚焦更新向量。这里的向量更新可以是通过应用特定的线性变换或其他操作来对向量进行调整。最后,在步骤10137中,将语义聚焦线性可逆向量和语义聚焦更新向量拼接成第u个语义聚焦单元的生成向量。经过多次迭代后,将题目知识网文本语义挖掘模块中的第X个语义聚焦单元的生成向量确定为第一题目知识语义聚焦向量。这意味着在经过多层语义聚焦单元的处理后,得到了具有更高层次语义聚焦信息的第一题目知识语义聚焦向量。
通过上述步骤10131至步骤10137,能够逐步构建起用于语义聚焦的题目知识语义聚焦向量,并在每个语义聚焦单元中引入混淆因子关系网、特征处理和向量更新的操作,以逐步提取和优化语义聚焦信息。这些步骤结合了连接特征关系网、请求特征关系网和应答特征关系网的处理以及基于前馈节点的向量更新,从而获得更准确和丰富的题目知识语义聚焦向量。
在一些可能的实施例中,步骤102中的将所述第一题目知识块文本语义向量调整成题目知识块映射向量,包括步骤1021和步骤1022。
步骤1021、将所述第一题目知识块文本语义向量加载到知识文本拆解算法中的语义特征混淆分支,通过所述语义特征混淆分支对所述第一题目知识块文本语义向量进行第一特征映射,得到所述第一题目知识块文本语义向量对应的语义映射结果。
其中,第一特征映射可以是离散傅里叶映射。
步骤1022、依据所述第一题目知识块文本语义向量所对应的语义映射结果,确定所述第一题目知识块文本语义向量对应的题目知识块映射向量。
首先,在步骤1021中,将第一题目知识块文本语义向量加载到知识文本拆解算法中的语义特征混淆分支。假设正在处理一个关于二叉树的问题,那么第一题目知识块文本语义向量可能包含有关二叉树的相关信息。通过语义特征混淆分支对第一题目知识块文本语义向量进行第一特征映射,可以得到该向量对应的语义映射结果。例如,可以使用离散傅里叶映射作为第一特征映射方法。通过对第一题目知识块文本语义向量进行离散傅里叶变换,可以将其转换为频域表示。这个频域表示就是所述第一题目知识块文本语义向量对应的语义映射结果。接下来,在步骤1022中,根据第一题目知识块文本语义向量所对应的语义映射结果,确定题目知识块映射向量。在的例子中,该语义映射结果就是经过离散傅里叶变换后的频域表示。题目知识块映射向量可以被看作是对第一题目知识块文本语义向量进行了特定映射的结果。这个映射可以捕捉到文本语义的重要特征,并将其转化为一个更具表达力和区分性的向量表示形式。这样,就得到了题目知识块映射向量,它能够更好地描述题目中的知识内容。
通过步骤1021和步骤1022,能够将第一题目知识块文本语义向量调整为题目知识块映射向量,从而提取并凸显出与问题相关的关键语义信息。这种映射操作有助于更好地理解和处理题目中的知识块,为进一步的语义聚焦和推理提供了有用的向量表示。
进一步地,步骤102中的获得所述题目知识块映射向量所对应的第一联动系数,包括:基于所述语义特征混淆分支中的第一个滑动平均子网对所述题目知识块映射向量的目标向量元素进行滑动平均操作,得到第一卷积映射特征;基于所述语义特征混淆分支中的区间数组映射子网对所述第一卷积映射特征进行区间数组映射处理,得到标准化语义映射特征,采用所述语义特征混淆分支中的第一个处理核对所述标准化语义映射特征进行非线性变换,得到非线性语义映射特征;基于所述语义特征混淆分支中的第二个滑动平均子网对所述非线性语义映射特征进行滑动平均操作,得到第二卷积映射特征,采用所述语义特征混淆分支中的第二个处理核对所述第二卷积映射特征进行非线性变换,得到所述题目知识块映射向量所对应的第一联动系数。
在步骤102中,将获得与题目知识块映射向量对应的第一联动系数。以下是针对计算机科学中的数据结构与算法的例子来解释这些步骤:基于语义特征混淆分支中的第一个滑动平均子网,对题目知识块映射向量的目标向量元素进行滑动平均操作,得到第一卷积映射特征。这个滑动平均操作可以帮助平滑向量中的噪声或突变部分,并提取出更加稳定和一致的特征表示;基于语义特征混淆分支中的区间数组映射子网,对第一卷积映射特征进行区间数组映射处理,得到标准化语义映射特征。这个区间数组映射处理可以将特征向量划分为多个区间,并计算每个区间内元素的统计信息,以获得一种更加紧凑和规范化的特征表示;使用语义特征混淆分支中的第一个处理核对标准化语义映射特征进行非线性变换,得到非线性语义映射特征。这个非线性变换可以通过应用某种激活函数(例如ReLU)将特征向量的非线性关系引入到映射结果中,以增强其表达能力;基于语义特征混淆分支中的第二个滑动平均子网,对非线性语义映射特征进行滑动平均操作,得到第二卷积映射特征。这个滑动平均操作再次帮助平滑特征向量,并进一步减少噪声的影响,从而提取出更加稳定和可靠的特征表示;最后,使用语义特征混淆分支中的第二个处理核对第二卷积映射特征进行非线性变换,得到题目知识块映射向量所对应的第一联动系数。这个非线性变换通过激活函数的作用,进一步增强了特征的非线性表达能力,使得第一联动系数能够更好地捕捉题目知识块映射向量中的相关信息。
通过上述步骤,可以从题目知识块映射向量中提取出与问题相关的第一联动系数。这些步骤结合了滑动平均、区间数组映射、非线性变换等操作,通过不同的处理方式和特征提取策略,实现了对题目知识块映射向量的进一步优化和转换,以获得更具信息丰富度和表达能力的联动系数。
在一些可能的示例中,步骤103中的将所述题目知识块映射向量和所述已优化题目知识块映射向量调整成第二题目知识块文本语义向量,包括步骤1031和步骤1032。
步骤1031、将所述题目知识块映射向量和所述已优化题目知识块映射向量拼接成可逆映射向量,通过所述语义特征混淆分支对所述可逆映射向量进行第二特征映射,得到所述可逆映射向量对应的文本语义译码向量。
步骤1032、获得所述语义特征混淆分支中的RNN节点对应的中间变量关系网和置信特征,基于所述置信特征以及所述中间变量关系网与所述文本语义译码向量之间的特征处理结果,确定所述待拆解知识点文本对应的第二题目知识块文本语义向量。
在步骤1031中,首先将题目知识块映射向量和已优化题目知识块映射向量进行拼接,形成一个可逆映射向量。假设有一个关于链表操作的问题,并且已经得到了题目知识块映射向量和已优化题目知识块映射向量,那么可以将它们连接起来以创建一个新的向量表示。接着,使用语义特征混淆分支对可逆映射向量进行第二特征映射,得到文本语义译码向量。这个第二特征映射过程可以采用不同的方法,例如使用线性变换或者通过神经网络模型进行特征提取。这样,就获得了一个与可逆映射向量相应的文本语义译码向量。在步骤1032中,得到语义特征混淆分支中的RNN节点对应的中间变量关系网和置信特征。RNN节点可以指代循环神经网络中的一个单元,它在处理序列数据时具有记忆功能。通过这些RNN节点,可以获得一系列中间变量以及相应的关系网。基于置信特征和中间变量关系网与文本语义译码向量之间的特征处理结果,确定待拆解知识点文本对应的第二题目知识块文本语义向量。具体而言,可以使用这些特征来进行匹配或比较,从而确定待拆解知识点文本所对应的第二题目知识块文本语义向量。这个过程可能涉及到计算相似度、关联性或其他相关度量,以便找到最合适的匹配或拆解结果。
通过上述步骤1031和步骤1032,将题目知识块映射向量和已优化题目知识块映射向量调整为第二题目知识块文本语义向量。这样,能够利用可逆映射向量和文本语义译码向量,结合RNN节点的中间变量关系网和置信特征,准确地确定待拆解知识点文本对应的第二题目知识块文本语义向量。这些步骤有助于将输入的题目信息与相关知识点进行匹配和解码,为进一步的处理和分析提供了有用的向量表示和特征信息。
在一些示例性实施例中,步骤105所描述的获得所述题目知识块交叉语义向量对应的阶段知识点拆解建议,以及所述题目知识交叉聚焦向量对应的整体知识点拆解建议,包括步骤1051和步骤1052。
步骤1051、将所述题目知识块交叉语义向量加载到知识文本拆解算法中的阶段知识点拆解分支,通过所述阶段知识点拆解分支对所述题目知识块交叉语义向量进行特征扩展处理,得到所述待拆解知识点文本对应的阶段知识点拆解建议。
步骤1052、将所述题目知识交叉聚焦向量加载到知识文本拆解算法中的整体知识点拆解分支,通过所述整体知识点拆解分支对所述题目知识交叉聚焦向量进行特征扩展处理,得到所述待拆解知识点文本对应的整体知识点拆解建议。
其中,特征扩展处理可以理解为上采样操作。
在步骤1051中,将题目知识块交叉语义向量加载到知识文本拆解算法的阶段知识点拆解分支中。假设有一个关于二叉树遍历的问题,并且已经得到了题目知识块交叉语义向量。通过将这些向量输入阶段知识点拆解分支,可以对其进行特征扩展处理。特征扩展处理可以理解为一种上采样操作,它可以增加特征表示的维度和丰富性。在的例子中,阶段知识点拆解分支会对题目知识块交叉语义向量进行特征扩展处理,以获取与待拆解知识点文本相对应的阶段知识点拆解建议。这个阶段知识点拆解建议可能包括关于二叉树遍历的不同方面、步骤或概念的建议或指导。在步骤1052中,将题目知识交叉聚焦向量加载到知识文本拆解算法的整体知识点拆解分支中。整体知识点拆解分支可以综合考虑题目知识块之间的关联性和交叉影响。通过对题目知识交叉聚焦向量进行特征扩展处理,可以得到针对待拆解知识点文本的整体知识点拆解建议。特征扩展处理在这里的目的是增加对整体知识点拆解建议的表达能力和完整性。通过整体知识点拆解分支,可以获得更全面、综合的知识点拆解建议,涵盖了与数据结构和算法相关的各个方面、主题或领域。
通过上述步骤1051和步骤1052,可以利用题目知识块交叉语义向量和题目知识交叉聚焦向量,通过阶段知识点拆解分支和整体知识点拆解分支,分别获得与待拆解知识点文本相对应的阶段知识点拆解建议和整体知识点拆解建议。这些建议将有助于将问题拆解成更具体、更全面的知识点,并提供相关指导和建议,帮助用户理解和解决与数据结构和算法相关的问题。
为便于进一步理解上述方案,下面以《如何作答语文科目的散文赏析》的课堂笔记为例,进行相应的知识点拆解,其中,《如何作答语文科目的散文赏析》的课堂笔记包括如下内容。
《语文课堂笔记:散文赏析》
1、概述
散文是一种以散发性为特点的文学形式,以自由的方式表达作者的思想和感情。
散文的特点包括自由度高、篇幅短、语言优美等。
2、阅读方法
理解主题:通过阅读散文的标题和开头,抓住散文的主题。主题可以直接表达,也可以透过细节暗示。
分析结构:散文的结构多样,有时呈现线性、递进的结构,有时则以意象或联想串联起各个段落。
品味语言:散文以其优美的语言令人着迷。注意作者使用的修辞手法、比喻和意象等,理解其在文章中的作用。
感受情感:散文往往通过言语传递作者的情感和内心世界。体验作者的情绪,思考作者想要传达给读者的信息。
总结主旨:通过理解主题、分析结构、品味语言和感受情感,概括出散文的主旨和作者的写作意图。
3、示例赏析:“归园田居”
主题
散文以田园生活为主题,表达作者对简朴自然生活的向往。
结构分析
第一部分:描绘故乡的美丽景色。
第二部分:回忆童年时光,描述自己在乡村成长的经历。
第三部分:反思都市生活的繁忙与压力,呼吁重拾田园生活的价值。
语言品味
修辞手法:
比喻:如“秋水共长天一色”、“人间四月芳菲尽”等,增加了文章的艺术性。
拟人:如“青山隐隐,翠薮翩翩”等,赋予自然景物人类化的特点。
意象:通过描绘大自然的景色和声音,让读者身临其境地感受乡村的宁静和美好。
情感体验
作者对故乡的深情厚意、对简单生活的向往之情。
文中所展示的平和、宁静和纯真的氛围,给人带来心灵上的安慰和愉悦。
主旨总结
通过对故乡的描绘和对都市生活的反思,作者表达了对自然、纯真和宁静生活的向往,并抒发了对现代社会忙碌和功利的思考。
4、总结
散文赏析需要理解主题、分析结构、品味语言和感受情感。
针对《归园田居》的赏析,我们明确了主题、分析了结构、品味了语言、体验了情感,并总结出主旨。
阅读散文可以帮助我们感受美好和思考人生,同时也提升语文素养和审美能力。
以上述《语文课堂笔记:散文赏析》为待拆解知识点文本,通过步骤101-步骤105进行知识点拆解,得到《语文课堂笔记:散文赏析》对应的知识点拆解文本可以为:散文是一种以自由表达思想和感情为特点的文学形式。阅读散文时,可以理解主题、分析结构、品味语言和感受情感。《归园田居》是以田园生活为主题的散文,表达对简朴自然生活的向往。散文赏析需理解主题、分析结构、品味语言和感受情感来概括主旨。
进一步地,还提供了一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现上述的方法。
在本发明实施例所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置和方法实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于大数据分析的知识点拆解方法,其特征在于,应用于知识点拆解处理系统,所述方法包括:
获得待拆解知识点文本,对所述待拆解知识点文本进行文本语义挖掘得到第一题目知识块文本语义向量,对所述待拆解知识点文本进行语义描述聚焦操作得到第一题目知识语义聚焦向量;其中,所述第一题目知识语义聚焦向量用于反映所述待拆解知识点文本的整体知识网络之间的上下游关系;
将所述第一题目知识块文本语义向量调整成题目知识块映射向量,将所述第一题目知识语义聚焦向量调整成题目知识聚焦映射向量,获得所述题目知识块映射向量所对应的第一联动系数,以及获得所述题目知识聚焦映射向量所对应的第二联动系数;
基于所述第一联动系数对所述题目知识聚焦映射向量进行特征优化处理,得到已优化题目知识聚焦映射向量,基于所述第二联动系数对所述题目知识块映射向量进行特征优化处理,得到已优化题目知识块映射向量,将所述题目知识块映射向量和所述已优化题目知识块映射向量调整成第二题目知识块文本语义向量,将所述题目知识聚焦映射向量和所述已优化题目知识聚焦映射向量调整成第二题目知识语义聚焦向量;
将所述第一题目知识块文本语义向量和所述第二题目知识块文本语义向量拼接成题目知识块交叉语义向量,将所述第一题目知识语义聚焦向量、所述第二题目知识语义聚焦向量以及所述题目知识块交叉语义向量拼接成题目知识交叉聚焦向量;
获得所述题目知识块交叉语义向量对应的阶段知识点拆解建议,以及所述题目知识交叉聚焦向量对应的整体知识点拆解建议,基于所述阶段知识点拆解建议和所述整体知识点拆解建议的均值量化结果,生成所述待拆解知识点文本对应的知识点拆解文本。
2.如权利要求1所述的方法,其特征在于,所述获得待拆解知识点文本,对所述待拆解知识点文本进行文本语义挖掘得到第一题目知识块文本语义向量,对所述待拆解知识点文本进行语义描述聚焦操作得到第一题目知识语义聚焦向量,包括:
获得待拆解知识点文本,将所述待拆解知识点文本加载到知识文本拆解算法中的文本语义挖掘分支,通过所述文本语义挖掘分支获得所述待拆解知识点文本对应的基础文本语义向量;
将所述基础文本语义向量加载到所述知识文本拆解算法中的知识块文本语义挖掘模块,通过所述知识块文本语义挖掘模块获得所述基础文本语义向量对应的第一题目知识块文本语义向量;所述知识块文本语义挖掘模块包括X个可逆单元,X为正整数;
将所述基础文本语义向量加载到所述知识文本拆解算法中的题目知识网文本语义挖掘模块,通过所述题目知识网文本语义挖掘模块获得所述基础文本语义向量对应的第一题目知识语义聚焦向量;所述题目知识网文本语义挖掘模块包括X个语义聚焦单元。
3.如权利要求2所述的方法,其特征在于,所述通过所述文本语义挖掘分支获得所述待拆解知识点文本对应的基础文本语义向量,包括:
基于所述文本语义挖掘分支中的滑动平均子网对所述待拆解知识点文本进行滑动平均操作,得到所述待拆解知识点文本对应的文本滑动平均结果;
基于所述文本语义挖掘分支中的区间数组映射子网对所述文本滑动平均结果进行区间数组映射处理,得到文本区间数组映射向量,采用所述文本语义挖掘分支中的处理核对所述文本区间数组映射向量进行非线性变换,得到非线性文本语义向量;
基于所述文本语义挖掘分支中的语义下采样子网对所述非线性文本语义向量进行语义下采样操作,得到所述待拆解知识点文本对应的基础文本语义向量。
4.如权利要求2所述的方法,其特征在于,所述知识文本拆解算法还包括语义特征混淆分支,所述语义特征混淆分支用作混淆所述知识块文本语义挖掘模块中的第u个可逆单元和所述题目知识网文本语义挖掘模块中的第u个语义聚焦单元之间的映射数据,u为小于或等于X的正整数;所述通过所述知识块文本语义挖掘模块获得所述基础文本语义向量对应的第一题目知识块文本语义向量,包括:
获得所述知识块文本语义挖掘模块中的第u个可逆单元的传入向量;当u=1时,第u个可逆单元的传入向量为所述基础文本语义向量;当u≠1时,第u个可逆单元的传入向量包括第u-1个可逆单元的生成向量,以及作用于第u-1个语义聚焦单元和第u-1个可逆单元的语义特征混淆分支所生成的题目知识块文本语义向量;
基于第u个可逆单元中的若干个滑动平均子网,对第u个可逆单元的传入向量进行滑动平均操作,得到阶段性滑动平均结果;
对所述阶段性滑动平均结果和第u个可逆单元的传入向量进行梯度优化,得到第u个可逆单元的生成向量,将所述知识块文本语义挖掘模块中的第X个可逆单元的生成向量确定为所述第一题目知识块文本语义向量。
5.如权利要求4所述的方法,其特征在于,所述通过所述题目知识网文本语义挖掘模块获得所述基础文本语义向量对应的第一题目知识语义聚焦向量,包括:
获得所述题目知识网文本语义挖掘模块中的第u个语义聚焦单元的传入向量;当u=1时,第u个语义聚焦单元的传入向量为所述基础文本语义向量;当u≠1时,第u个语义聚焦单元的传入向量包括第u-1个语义聚焦单元的生成向量,第u-1个可逆单元的生成向量,以及作用于第u-1个语义聚焦单元和第u-1个可逆单元的语义特征混淆分支所生成的题目知识语义聚焦向量和题目知识块文本语义向量;
基于第u个语义聚焦单元对应的混淆因子关系网,将第u个语义聚焦单元的传入向量调整成连接特征关系网、请求特征关系网以及应答特征关系网,对所述连接特征关系网与所述请求特征关系网的映射关系网进行特征处理,得到待处理量化因子关系网;
获得所述连接特征关系网的尺寸指标,对所述待处理量化因子关系网与所述尺寸指标的设定运算结果之间的比例进行区间数组映射处理,得到语义聚焦因子关系网,将所述语义聚焦因子关系网与所述应答特征关系网之间的特征处理结果确定为语义聚焦线性向量;
将所述语义聚焦线性向量和第u个语义聚焦单元的传入向量拼接成语义聚焦线性可逆向量,基于第u个语义聚焦单元中的前馈节点对所述语义聚焦线性可逆向量进行向量更新,得到语义聚焦更新向量;
将所述语义聚焦线性可逆向量和所述语义聚焦更新向量拼接成第u个语义聚焦单元的生成向量,将所述题目知识网文本语义挖掘模块中的第X个语义聚焦单元的生成向量确定为所述第一题目知识语义聚焦向量。
6.如权利要求1所述的方法,其特征在于,所述将所述第一题目知识块文本语义向量调整成题目知识块映射向量,包括:
将所述第一题目知识块文本语义向量加载到知识文本拆解算法中的语义特征混淆分支,通过所述语义特征混淆分支对所述第一题目知识块文本语义向量进行第一特征映射,得到所述第一题目知识块文本语义向量对应的语义映射结果;
依据所述第一题目知识块文本语义向量所对应的语义映射结果,确定所述第一题目知识块文本语义向量对应的题目知识块映射向量。
7.如权利要求6所述的方法,其特征在于,所述获得所述题目知识块映射向量所对应的第一联动系数,包括:
基于所述语义特征混淆分支中的第一个滑动平均子网对所述题目知识块映射向量的目标向量元素进行滑动平均操作,得到第一卷积映射特征;
基于所述语义特征混淆分支中的区间数组映射子网对所述第一卷积映射特征进行区间数组映射处理,得到标准化语义映射特征,采用所述语义特征混淆分支中的第一个处理核对所述标准化语义映射特征进行非线性变换,得到非线性语义映射特征;
基于所述语义特征混淆分支中的第二个滑动平均子网对所述非线性语义映射特征进行滑动平均操作,得到第二卷积映射特征,采用所述语义特征混淆分支中的第二个处理核对所述第二卷积映射特征进行非线性变换,得到所述题目知识块映射向量所对应的第一联动系数;
其中,所述将所述题目知识块映射向量和所述已优化题目知识块映射向量调整成第二题目知识块文本语义向量,包括:
将所述题目知识块映射向量和所述已优化题目知识块映射向量拼接成可逆映射向量,通过所述语义特征混淆分支对所述可逆映射向量进行第二特征映射,得到所述可逆映射向量对应的文本语义译码向量;
获得所述语义特征混淆分支中的RNN节点对应的中间变量关系网和置信特征,基于所述置信特征以及所述中间变量关系网与所述文本语义译码向量之间的特征处理结果,确定所述待拆解知识点文本对应的第二题目知识块文本语义向量。
8.如权利要求1所述的方法,其特征在于,所述获得所述题目知识块交叉语义向量对应的阶段知识点拆解建议,以及所述题目知识交叉聚焦向量对应的整体知识点拆解建议,包括:
将所述题目知识块交叉语义向量加载到知识文本拆解算法中的阶段知识点拆解分支,通过所述阶段知识点拆解分支对所述题目知识块交叉语义向量进行特征扩展处理,得到所述待拆解知识点文本对应的阶段知识点拆解建议;
将所述题目知识交叉聚焦向量加载到知识文本拆解算法中的整体知识点拆解分支,通过所述整体知识点拆解分支对所述题目知识交叉聚焦向量进行特征扩展处理,得到所述待拆解知识点文本对应的整体知识点拆解建议。
9.一种知识点拆解处理系统,其特征在于,包括处理器和存储器;所述处理器和所述存储器通信连接,所述处理器用于从所述存储器中读取计算机程序并执行,以实现权利要求1-8任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,其上存储有程序,该程序被处理器执行时实现权利要求1-8任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311819593.XA CN117474014B (zh) | 2023-12-27 | 2023-12-27 | 基于大数据分析的知识点拆解方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311819593.XA CN117474014B (zh) | 2023-12-27 | 2023-12-27 | 基于大数据分析的知识点拆解方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117474014A true CN117474014A (zh) | 2024-01-30 |
CN117474014B CN117474014B (zh) | 2024-03-08 |
Family
ID=89635113
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311819593.XA Active CN117474014B (zh) | 2023-12-27 | 2023-12-27 | 基于大数据分析的知识点拆解方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117474014B (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120324347A1 (en) * | 2011-06-15 | 2012-12-20 | Terrence Monroe | Method for parsing, searching and formatting of text input for visual mapping of knowledge information |
CN105184709A (zh) * | 2015-08-20 | 2015-12-23 | 浙江通关教育科技有限公司 | 一种基于知识点体系的学科测评系统及方法 |
CN105608075A (zh) * | 2014-09-26 | 2016-05-25 | 北大方正集团有限公司 | 一种相关知识点的获取方法及系统 |
CN106204379A (zh) * | 2016-08-23 | 2016-12-07 | 黄冈师范学院 | 一种课堂教学交互深度量化分析方法 |
CN106327933A (zh) * | 2015-07-01 | 2017-01-11 | 马正方 | 基于数字图书的学习装置 |
US20170011642A1 (en) * | 2015-07-10 | 2017-01-12 | Fujitsu Limited | Extraction of knowledge points and relations from learning materials |
CN112580361A (zh) * | 2020-12-18 | 2021-03-30 | 蓝舰信息科技南京有限公司 | 基于统一注意力机制的公式及文字识别模型方法 |
US10978077B1 (en) * | 2019-10-31 | 2021-04-13 | Wisdom Garden Hong Kong Limited | Knowledge point mark generation system and method thereof |
CN116401373A (zh) * | 2023-03-13 | 2023-07-07 | 中国科学院软件研究所 | 一种试题知识点的标注方法、存储介质及设备 |
CN116597461A (zh) * | 2023-07-14 | 2023-08-15 | 广东信聚丰科技股份有限公司 | 基于人工智能的题目知识点关联方法及系统 |
-
2023
- 2023-12-27 CN CN202311819593.XA patent/CN117474014B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120324347A1 (en) * | 2011-06-15 | 2012-12-20 | Terrence Monroe | Method for parsing, searching and formatting of text input for visual mapping of knowledge information |
CN105608075A (zh) * | 2014-09-26 | 2016-05-25 | 北大方正集团有限公司 | 一种相关知识点的获取方法及系统 |
CN106327933A (zh) * | 2015-07-01 | 2017-01-11 | 马正方 | 基于数字图书的学习装置 |
US20170011642A1 (en) * | 2015-07-10 | 2017-01-12 | Fujitsu Limited | Extraction of knowledge points and relations from learning materials |
CN105184709A (zh) * | 2015-08-20 | 2015-12-23 | 浙江通关教育科技有限公司 | 一种基于知识点体系的学科测评系统及方法 |
CN106204379A (zh) * | 2016-08-23 | 2016-12-07 | 黄冈师范学院 | 一种课堂教学交互深度量化分析方法 |
US10978077B1 (en) * | 2019-10-31 | 2021-04-13 | Wisdom Garden Hong Kong Limited | Knowledge point mark generation system and method thereof |
CN112580361A (zh) * | 2020-12-18 | 2021-03-30 | 蓝舰信息科技南京有限公司 | 基于统一注意力机制的公式及文字识别模型方法 |
CN116401373A (zh) * | 2023-03-13 | 2023-07-07 | 中国科学院软件研究所 | 一种试题知识点的标注方法、存储介质及设备 |
CN116597461A (zh) * | 2023-07-14 | 2023-08-15 | 广东信聚丰科技股份有限公司 | 基于人工智能的题目知识点关联方法及系统 |
Non-Patent Citations (2)
Title |
---|
王露莹等: "大数据时代图书馆馆藏资源的知识标注与知识挖掘研究", 农业图书情报学刊, no. 10, 18 October 2018 (2018-10-18), pages 72 - 75 * |
陈会娜 等: "浅谈基于知识点架构远程教育资源体系的构建", 科技资讯, 31 December 2011 (2011-12-31), pages 9 - 11 * |
Also Published As
Publication number | Publication date |
---|---|
CN117474014B (zh) | 2024-03-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110717017B (zh) | 一种处理语料的方法 | |
Kreyssig et al. | Neural user simulation for corpus-based policy optimisation for spoken dialogue systems | |
CN109086303B (zh) | 基于机器阅读理解的智能对话方法、装置、终端 | |
CN112487182B (zh) | 文本处理模型的训练方法、文本处理方法及装置 | |
CN108334891B (zh) | 一种任务型意图分类方法及装置 | |
CN110516253B (zh) | 中文口语语义理解方法及系统 | |
CN108962224B (zh) | 口语理解和语言模型联合建模方法、对话方法及系统 | |
CN111274362B (zh) | 一种基于transformer架构的对话生成方法 | |
CN109740158B (zh) | 一种文本语义解析方法及装置 | |
CN108536807B (zh) | 一种信息处理方法及装置 | |
CN113901191A (zh) | 问答模型的训练方法及装置 | |
CN116820429B (zh) | 代码处理模型的训练方法、装置、电子设备及存储介质 | |
WO2021082086A1 (zh) | 机器阅读方法、系统、装置及存储介质 | |
CN116881428B (zh) | 一种语言模型训练方法及装置 | |
CN113239169A (zh) | 基于人工智能的回答生成方法、装置、设备及存储介质 | |
JP2022549893A (ja) | 過去の入力に選択的に注意を向けるための注意ベースのニューラルネットワークの拡張 | |
CN111079418A (zh) | 命名体识别方法、装置、电子设备和存储介质 | |
CN117076693A (zh) | 一种数字人教师多模态大语言模型预训练学科语料库的构建方法 | |
CN110992943B (zh) | 基于词混淆网络的语义理解方法及系统 | |
CN115115984A (zh) | 视频数据处理方法、装置、程序产品、计算机设备和介质 | |
CN113343692A (zh) | 搜索意图的识别方法、模型训练方法、装置、介质及设备 | |
CN117474014B (zh) | 基于大数据分析的知识点拆解方法及系统 | |
CN114297353B (zh) | 数据处理方法、装置、存储介质及设备 | |
CN112818084B (zh) | 信息交互方法、相关装置、设备及计算机可读介质 | |
CN116150324A (zh) | 对话模型的训练方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |