CN112015921B - 一种基于学习辅助知识图谱的自然语言处理方法 - Google Patents
一种基于学习辅助知识图谱的自然语言处理方法 Download PDFInfo
- Publication number
- CN112015921B CN112015921B CN202010965571.4A CN202010965571A CN112015921B CN 112015921 B CN112015921 B CN 112015921B CN 202010965571 A CN202010965571 A CN 202010965571A CN 112015921 B CN112015921 B CN 112015921B
- Authority
- CN
- China
- Prior art keywords
- data
- knowledge
- network model
- knowledge graph
- neural network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 24
- 238000003058 natural language processing Methods 0.000 title claims abstract description 17
- 238000004364 calculation method Methods 0.000 claims abstract description 7
- 238000003062 neural network model Methods 0.000 claims description 24
- 239000013598 vector Substances 0.000 claims description 17
- 238000005457 optimization Methods 0.000 claims description 8
- 238000012545 processing Methods 0.000 claims description 6
- 238000012549 training Methods 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 5
- 230000004927 fusion Effects 0.000 claims description 5
- 230000006399 behavior Effects 0.000 claims description 3
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 238000013135 deep learning Methods 0.000 claims description 3
- 238000012163 sequencing technique Methods 0.000 claims description 3
- 238000013075 data extraction Methods 0.000 claims 1
- 230000008451 emotion Effects 0.000 claims 1
- 230000008901 benefit Effects 0.000 description 4
- 230000002996 emotional effect Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Abstract
本发明公开一种基于学习辅助知识图谱的自然语言处理方法,包括将学习者输入的课程问题文字与语音数据转变为机器的内部表示数据,得到输入数据,通过边缘计算访问服务器中教育领域知识图谱,在教育领域知识图谱的辅助下,解析输入数据,获取语言识别数据。本发明利用知识图谱作为对输入数据的解译基础,能够快速识别语义,提取出精确的课程问题表述意思。
Description
技术领域
本发明属于自然语言处理技术领域,特别是涉及一种基于学习辅助知识图谱的自然语言处理方法。
背景技术
自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。
目前自然语言处理的方法,语法都限于分析一个孤立的句子,上下文关系和说话语境对本句的约束和影响还缺乏系统的研究。并且对于课程问题回答还运用了大量的有关知识,对于这些知识目前的方法都无法进行精确识别。
发明内容
为了解决上述问题,本发明提出了一种基于学习辅助知识图谱的自然语言处理方法,利用知识图谱作为对输入数据的解译基础,能够快速识别语义,提取出精确的课程问题表述意思。
为达到上述目的,本发明采用的技术方案是:一种基于学习辅助知识图谱的自然语言处理方法,包括步骤:
S10,将学习者输入的课程问题文字与语音数据转变为机器的内部表示数据,得到输入数据;
S20,通过边缘计算访问服务器中教育领域知识图谱,在教育领域知识图谱的辅助下,解析输入数据,获取语言识别数据。
进一步的是,在所述步骤S10中,包括步骤:
将用户输入的语音数据进行语音识别转换,获得相应的语音文本数据;
将语音文本数据和录入的文字数据进行融合,获得输入数据。
进一步的是,在步骤S20中所述的教育领域知识图谱的辅助下,解析输入数据,获取语言识别数据,包括步骤:对输入数据在知识图谱模块进行实体识别、实体链接、指代消解和语义理解,得到最终解析的语言识别数据。
进一步的是,所述解析过程包括步骤:
S21,先对输入数据进行实体识别并识别出该输入数据文本数据;
S22,根据在文本数据中提取的特征值,通过实体链接在知识图谱中匹配提取相关联的知识信息和意图信息,构成关联数据集;
S23,将获得的关联数据根据神经网络模型进行深度学习优化处理提取出准确关联数据,完成指代消解;
S24,通过语音理解,结合意图信息,将准确关联数据进行精确提取和匹配,获得语言识别数据。
进一步的是,建立用于进行知识图谱进行关联数据提取的神经网络模型,所述神经网络模型包括源语言输入层、链接层和知识图谱层,通过链接层建立源语言输入层和知识图谱层的连接关系。
进一步的是,建立两个神经网络模型包括知识信息识别网络模型和意图信息识别网络模型;通过知识信息识别网络模型提取出准确知识信息数据;通过意图信息识别网络模型提取出准确意图信息数据;将上述两个模型的提取结果通过融合计算进行加权融合,归一化并排序得到语言识别数据。
进一步的是,在所述知识信息识别神经网络模型的训练中,将课程词转化为词向量,按照设定好的长度限制拼接成固定长度的序列,同时将每个课程对应的知识点根据字典转化为向量,训练一个并联不同卷积核尺寸的神经网络模型。
进一步的是,在所述意图信息识别神经网络模型的训练中,将意图词转化为词向量,按照设定好的长度限制拼接成固定长度的序列,同时将每个意图信息对应的词语根据字典转化为向量,训练一个并联不同卷积核尺寸的神经网络模型。
进一步的是,所述意图信息包括包括学习者的行为状态、情感状态和兴趣偏好。
采用本技术方案的有益效果:
本发明通过知识图谱技术,建立自然语言识别处理,利用知识图谱作为对输入数据的解译基础,能够快速识别语义,提取出精确的课程问题表述意思。能够规范教育领域学习辅助机的识别行为,提升学习辅助语言识别过程的效率和质量。
本发明通过将知识图谱的表示学习和自然语义的表示学习进行结合,以学习到质量更好的语义表示,实现提高文本处理准确性的目的;能够获得准确度较高和针对性较强的语义识别结果,从而提高辅助学习机的学习推送精准度。对于辅助学习机的发展具有长远的社会效益,具有高价值的经济效益。
本发明通过实体链接在知识图谱中匹配提取相关联的知识信息和意图信息,通过知识信息识别网络模型和意图信息识别网络模型进行双重优化提取,能够有效解决上下文关系和说话语境对本句的约束和影响,提高了识别的精确度。
附图说明
图1为本发明的一种基于学习辅助知识图谱的自然语言处理方法的流程示意图;
图2为本发明实施例中基于学习辅助知识图谱的自然语言处理方法的结构示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图对本发明作进一步阐述。
在本实施例中,参见图1和图2所示,本发明提出了一种基于学习辅助知识图谱的自然语言处理方法,包括步骤:
S10,将学习者输入的课程问题文字与语音数据转变为机器的内部表示数据,得到输入数据;
S20,通过边缘计算访问服务器中教育领域知识图谱,在教育领域知识图谱的辅助下,解析输入数据,获取语言识别数据。
作为上述实施例的优化方案1,在所述步骤S10中,包括步骤:
将用户输入的语音数据进行语音识别转换,获得相应的语音文本数据;
将语音文本数据和录入的文字数据进行融合,获得输入数据。
作为上述实施例的优化方案2,在步骤S20中所述的教育领域知识图谱的辅助下,解析输入数据,获取语言识别数据,包括步骤:对输入数据在知识图谱模块进行实体识别、实体链接、指代消解和语义理解,得到最终解析的语言识别数据。
所述解析过程包括步骤:
S21,先对输入数据进行实体识别并识别出该输入数据文本数据;
S22,根据在文本数据中提取的特征值,通过实体链接在知识图谱中匹配提取相关联的知识信息和意图信息,构成关联数据集;
S23,将获得的关联数据根据神经网络模型进行深度学习优化处理提取出准确关联数据,完成指代消解;
S24,通过语音理解,结合意图信息,将准确关联数据进行精确提取和匹配,获得语言识别数据。
作为上述实施例的优化方案3,建立用于进行知识图谱进行关联数据提取的神经网络模型,所述神经网络模型包括源语言输入层、链接层和知识图谱层,通过链接层建立源语言输入层和知识图谱层的连接关系。
作为上述实施例的优化方案4,建立两个神经网络模型包括知识信息识别网络模型和意图信息识别网络模型;通过知识信息识别网络模型提取出准确知识信息数据;通过意图信息识别网络模型提取出准确意图信息数据;将上述两个模型的提取结果通过融合计算进行加权融合,归一化并排序得到语言识别数据。
在所述知识信息识别神经网络模型的训练中,将课程词转化为词向量,按照设定好的长度限制拼接成固定长度的序列,同时将每个课程对应的知识点根据字典转化为向量,训练一个并联不同卷积核尺寸的神经网络模型。
在所述意图信息识别神经网络模型的训练中,将意图词转化为词向量,按照设定好的长度限制拼接成固定长度的序列,同时将每个意图信息对应的词语根据字典转化为向量,训练一个并联不同卷积核尺寸的神经网络模型。
其中,所述意图信息包括包括学习者的行为状态、情感状态和兴趣偏好。
以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。
Claims (6)
1.一种基于学习辅助知识图谱的自然语言处理方法,其特征在于,包括步骤:
S10,将学习者输入的课程问题文字与语音数据转变为机器的内部表示数据,得到输入数据;
S20,通过边缘计算访问服务器中教育领域知识图谱,在教育领域知识图谱的辅助下,解析输入数据,获取语言识别数据;
在步骤S20中所述的教育领域知识图谱的辅助下,解析输入数据,获取语言识别数据,包括步骤:对输入数据在知识图谱模块进行实体识别、实体链接、指代消解和语义理解,得到最终解析的语言识别数据;
所述解析过程包括步骤:
S21,先对输入数据进行实体识别并识别出该输入数据文本数据;
S22,根据在文本数据中提取的特征值,通过实体链接在知识图谱中匹配提取相关联的知识信息和意图信息,构成关联数据集;
S23,将获得的关联数据根据神经网络模型进行深度学习优化处理提取出准确关联数据,完成指代消解;
建立两个神经网络模型包括知识信息识别网络模型和意图信息识别网络模型;通过知识信息识别网络模型提取出准确知识信息数据;通过意图信息识别网络模型提取出准确意图信息数据;将上述两个模型的提取结果通过融合计算进行加权融合,归一化并排序得到语言识别数据;
S24,通过语义理解,结合意图信息,将准确关联数据进行精确提取和匹配,获得语言识别数据。
2.根据权利要求1所述的一种基于学习辅助知识图谱的自然语言处理方法,其特征在于,在所述步骤S10中,包括步骤:
将用户输入的语音数据进行语音识别转换,获得相应的语音文本数据;
将语音文本数据和录入的文字数据进行融合,获得输入数据。
3.根据权利要求1所述的一种基于学习辅助知识图谱的自然语言处理方法,其特征在于,建立用于进行知识图谱进行关联数据提取的神经网络模型,所述神经网络模型包括源语言输入层、链接层和知识图谱层,通过链接层建立源语言输入层和知识图谱层的连接关系。
4.根据权利要求1所述的一种基于学习辅助知识图谱的自然语言处理方法,其特征在于,在所述知识信息识别神经网络模型的训练中,将课程词转化为词向量,按照设定好的长度限制拼接成固定长度的序列,同时将每个课程对应的知识点根据字典转化为向量,训练一个并联不同卷积核尺寸的神经网络模型。
5.根据权利要求1所述的一种基于学习辅助知识图谱的自然语言处理方法,其特征在于,在所述意图信息识别神经网络模型的训练中,将意图词转化为词向量,按照设定好的长度限制拼接成固定长度的序列,同时将每个意图信息对应的词语根据字典转化为向量,训练一个并联不同卷积核尺寸的神经网络模型。
6.根据权利要求2-5中任一所述的一种基于学习辅助知识图谱的自然语言处理方法,其特征在于,所述意图信息包括包括学习者的行为状态、情感状态和兴趣偏好。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010965571.4A CN112015921B (zh) | 2020-09-15 | 2020-09-15 | 一种基于学习辅助知识图谱的自然语言处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010965571.4A CN112015921B (zh) | 2020-09-15 | 2020-09-15 | 一种基于学习辅助知识图谱的自然语言处理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112015921A CN112015921A (zh) | 2020-12-01 |
CN112015921B true CN112015921B (zh) | 2024-04-16 |
Family
ID=73521476
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010965571.4A Active CN112015921B (zh) | 2020-09-15 | 2020-09-15 | 一种基于学习辅助知识图谱的自然语言处理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112015921B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115409038A (zh) * | 2022-08-26 | 2022-11-29 | 湖北星纪时代科技有限公司 | 自然语言处理方法及装置、电子设备和存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019024704A1 (zh) * | 2017-08-03 | 2019-02-07 | 阿里巴巴集团控股有限公司 | 实体标注方法、意图识别方法及对应装置、计算机存储介质 |
CN109344300A (zh) * | 2018-08-31 | 2019-02-15 | 深圳壹账通智能科技有限公司 | 自然语言的数据查询意图确定方法、装置和计算机设备 |
CN109885660A (zh) * | 2019-02-22 | 2019-06-14 | 上海乐言信息科技有限公司 | 一种知识图谱赋能的基于信息检索的问答系统和方法 |
CN110442710A (zh) * | 2019-07-03 | 2019-11-12 | 广州探迹科技有限公司 | 一种基于知识图谱的短文本语义理解与精准匹配方法及装置 |
CN110717018A (zh) * | 2019-04-15 | 2020-01-21 | 中国石油大学(华东) | 一种基于知识图谱的工业设备故障维修问答系统 |
CN111026842A (zh) * | 2019-11-29 | 2020-04-17 | 微民保险代理有限公司 | 自然语言处理方法、自然语言处理装置及智能问答系统 |
WO2020155766A1 (zh) * | 2019-01-31 | 2020-08-06 | 平安科技(深圳)有限公司 | 意图识别中的拒识方法、装置、设备及存储介质 |
CN111553162A (zh) * | 2020-04-28 | 2020-08-18 | 腾讯科技(深圳)有限公司 | 一种意图识别的方法以及相关装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10776586B2 (en) * | 2018-01-10 | 2020-09-15 | International Business Machines Corporation | Machine learning to integrate knowledge and augment natural language processing |
-
2020
- 2020-09-15 CN CN202010965571.4A patent/CN112015921B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019024704A1 (zh) * | 2017-08-03 | 2019-02-07 | 阿里巴巴集团控股有限公司 | 实体标注方法、意图识别方法及对应装置、计算机存储介质 |
CN109344300A (zh) * | 2018-08-31 | 2019-02-15 | 深圳壹账通智能科技有限公司 | 自然语言的数据查询意图确定方法、装置和计算机设备 |
WO2020155766A1 (zh) * | 2019-01-31 | 2020-08-06 | 平安科技(深圳)有限公司 | 意图识别中的拒识方法、装置、设备及存储介质 |
CN109885660A (zh) * | 2019-02-22 | 2019-06-14 | 上海乐言信息科技有限公司 | 一种知识图谱赋能的基于信息检索的问答系统和方法 |
CN110717018A (zh) * | 2019-04-15 | 2020-01-21 | 中国石油大学(华东) | 一种基于知识图谱的工业设备故障维修问答系统 |
CN110442710A (zh) * | 2019-07-03 | 2019-11-12 | 广州探迹科技有限公司 | 一种基于知识图谱的短文本语义理解与精准匹配方法及装置 |
CN111026842A (zh) * | 2019-11-29 | 2020-04-17 | 微民保险代理有限公司 | 自然语言处理方法、自然语言处理装置及智能问答系统 |
CN111553162A (zh) * | 2020-04-28 | 2020-08-18 | 腾讯科技(深圳)有限公司 | 一种意图识别的方法以及相关装置 |
Non-Patent Citations (4)
Title |
---|
KBot: A Knowledge Graph Based ChatBot for Natural Language Understanding Over Linked Data;Addi Ait-Mlouk等;IEEE Access;第08卷;全文 * |
人工智能+"视域下的教育知识图谱:内涵、技术框架与应用研究;李振等;远程教育杂志;20190718;第37卷(第04期);全文 * |
基于成果导向的高职学生顶岗实习教学改革――以重庆工商职业学院为例;郭文剑;李晓辉;胡方霞;;中国多媒体与网络教学学报(中旬刊)(04);全文 * |
基于知识图谱的抑郁症自动问答系统研究;田迎;单娅辉;王时绘;;湖北大学学报(自然科学版)(05);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN112015921A (zh) | 2020-12-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2020206957A1 (zh) | 一种应用于智能客服机器人的意图识别方法及装置 | |
WO2021042904A1 (zh) | 会话意图识别方法、装置、计算机设备和存储介质 | |
CN111209401A (zh) | 网络舆情文本信息情感极性分类处理系统及方法 | |
CN108363743A (zh) | 一种智能问题生成方法、装置和计算机可读存储介质 | |
CN110717018A (zh) | 一种基于知识图谱的工业设备故障维修问答系统 | |
CN108710704B (zh) | 对话状态的确定方法、装置、电子设备及存储介质 | |
CN111708869B (zh) | 人机对话的处理方法及装置 | |
CN111933127A (zh) | 一种具备自学习能力的意图识别方法及意图识别系统 | |
US20230394247A1 (en) | Human-machine collaborative conversation interaction system and method | |
CN111177341B (zh) | 一种基于端到端的id+sf模型的用户对话需求提取方法及系统 | |
CN115858758A (zh) | 一种多非结构化数据识别的智慧客服知识图谱系统 | |
CN115618022B (zh) | 一种基于数据合成和两阶段自训练的低资源关系抽取方法 | |
CN113111152A (zh) | 一种基于知识蒸馏和情绪集成模型的抑郁症检测方法 | |
CN114492460B (zh) | 基于衍生提示学习的事件因果关系抽取方法 | |
CN112364125A (zh) | 一种联合阅读课程学习机制的文本信息抽取系统及方法 | |
CN111984780A (zh) | 多意图识别模型训练方法和多意图识别方法及相关装置 | |
CN115858750A (zh) | 基于自然语言处理的电网技术标准智能问答方法及系统 | |
CN112015921B (zh) | 一种基于学习辅助知识图谱的自然语言处理方法 | |
CN112966518B (zh) | 一种面向大规模在线学习平台的优质答案识别方法 | |
CN113326367A (zh) | 基于端到端文本生成的任务型对话方法和系统 | |
CN115345177A (zh) | 意图识别模型训练方法和对话方法及装置 | |
CN114942991B (zh) | 一种基于隐喻识别的情感分类模型构建方法 | |
CN110782221A (zh) | 一种面试智能评测系统及方法 | |
CN112015920A (zh) | 一种基于知识图谱和边缘计算智能辅助学习系统 | |
CN115048924B (zh) | 基于否定前后缀信息的否定句识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |