CN110414008A - 一种基于深度学习的关系抽取系统及其方法 - Google Patents
一种基于深度学习的关系抽取系统及其方法 Download PDFInfo
- Publication number
- CN110414008A CN110414008A CN201910732040.8A CN201910732040A CN110414008A CN 110414008 A CN110414008 A CN 110414008A CN 201910732040 A CN201910732040 A CN 201910732040A CN 110414008 A CN110414008 A CN 110414008A
- Authority
- CN
- China
- Prior art keywords
- relationship
- module
- relation extraction
- entity
- infomational message
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
一种基于深度学习的关系抽取系统及其方法,包括用于关系抽取的终端,所述用于关系抽取的终端中包括关系类别分类模块和关系角色组合判别模块;所述关系类别分类模块用于根据文本内容,由机器学习算法判断文本描述的关系的关系类别;所述关系角色组合判别模块用于判别在已经识别关系的句子中,判断句子中命名实体在关系中承担的角色。所述用于关系抽取的终端,还包括收集模块、嵌入模块、训练模块一、聚类模块和训练模块二;并结合其它的方法和模块有效避免了现有技术中关系抽取系统很难发现新的关系模式、导致系统召回率相对较低、所运用的模式匹配无法从隐式表达的句子或文章中抽取出关系的缺陷。
Description
技术领域
本发明涉及关系抽取技术领域,也属于深度学习技术领域,具体涉及一种基于深度学习的关系抽取系统及其方法。
背景技术
信息抽取旨在从大规模非结构或半结构的自然语言文本中抽取结构化信息。关系抽取是其中的重要子任务之一,主要目的是从文本中识别实体并抽取实体之间的语义关系。关系抽取能够自动识别实体之间具有的某种语义关系。根据参与实体的多少可以分为二元关系抽取(两个实体)和多元关系抽取(三个及以上实体)。
另外,随着大数据爆发,批量的数据超过了人工处理分析的能力范畴,日益发展的人工智能技术逐渐替代人力进行数据学习和分析。在自然语言处理的领域,对于自动处理并结构化新闻、社交媒体、乃至企业技术文档上有了日益增长的需求。其中非常关键的一个领域就是实体识别和结构化关系对的提取。其关键的含义为找出文档中的命名实体(如:人名、公司名、地点等),并分析出命名实体间的关系(如:公司收购、出任公司总裁等)。结构化关系抽取可应用于批量文本数据分析,并应用于衍生的人工智能情报分析和实时监测等。此外,抽取出的关系对还可以用来进行大型知识图谱的构建。
传统的关系抽取系统大多数基于模式匹配。该方法具有相对稳定的准确性,但是由于固定模版格式的限制,系统很难发现新的关系模式,导致系统召回率相对较低。模式匹配的另一个缺陷在于它无法从隐式表达的句子或文章中抽取出关系。
发明内容
为解决上述问题,本发明提供了一种基于深度学习的关系抽取系统及其方法,有效避免了现有技术中关系抽取系统很难发现新的关系模式、导致系统召回率相对较低、所运用的模式匹配无法从隐式表达的句子或文章中抽取出关系的缺陷。
为了克服现有技术中的不足,本发明提供了一种基于深度学习的关系抽取系统及其方法的解决方案,具体如下:
一种基于深度学习的关系抽取系统,包括:
用于关系抽取的终端,所述用于关系抽取的终端中包括关系类别分类模块和关系角色组合判别模块;
所述关系类别分类模块用于根据文本内容,由机器学习算法判断文本描述的关系的关系类别;
所述关系角色组合判别模块用于判别在已经识别关系的句子中,判断句子中命名实体在关系中承担的角色。
所述用于关系抽取的终端,还包括收集模块、嵌入模块、训练模块一、聚类模块和训练模块二;
所述收集模块用于收集人工标注或基于传统模式识别标注的数据做为训练数据;
所述嵌入模块用于将训练数据的实体部分替换成对应命名实体类别的标识,并对该标识进行词向量嵌入,生成句子向量化的矩阵;
所述训练模块一用于用生成的句子向量化的矩阵训练双向长短期记忆网络而得到模型一;
所述聚类模块用于按照关系类别对训练数据进行聚类,对每一类关系:穷举生成所有可能的实体关系角色变换的组合,并把该组合作为模型二的训练数据;
所述训练模块二用于对每一种关系类别,用生成其所有可能的实体关系角色变换的组合来训练基于转换器的双向编码器网络而得到模型二。
所述用于关系抽取的终端,还包括识别模块、替换模块、分类模块、生成模块、判别模块、输出模块一和输出模块二;
所述识别模块用于对实时传入基于深度学习的关系抽取系统的文本,进行命名实体识别;
所述替换模块用于将识别出来的实体部分替换成对应命名实体类别的标识,并对该标识进行词向量嵌入,生成句子向量化的矩阵;
所述分类模块用于利用作为关系类别分类器的所述模型一,对预处理完的文本进行分类,获得概率排名最高的三种备选关系类别;
所述生成模块用于根据三种备选关系类别中的每一种关系类别,生成其对应的穷举生成所有可能的实体关系角色变换组合;
所述判别模块用于用对应的作为关系实体角色组合分类器的所述模型二进行判别得到最佳角色组合概率;
所述输出模块一用于结合概率排名最高的三种备选关系类别和最佳角色组合概率,输出最终系统判别的关系类别;
所述输出模块二用于输出文本中最佳角色组合概率对应的关系角色组合,并和最终系统判别的关系类别一起作为知识图谱存储于基于深度学习的关系抽取系统的数据库中。
所述基于深度学习的关系抽取系统的方法,包括如下方式:
(1)开发训练,所述开发训练训练出对应的模型;
(2)生产应用,运用所述开发训练出的模型来得到关系类别和关系角色组合。
所述开发训练的具体方式,包括如下步骤:
步骤K-1:收集人工标注或基于传统模式识别标注的数据做为训练数据;
步骤K-2:将训练数据的实体部分替换成对应命名实体类别的标识,并对该标识进行词向量嵌入,生成句子向量化的矩阵;
步骤K-3:用生成的句子向量化的矩阵训练双向长短期记忆网络而得到模型一;
步骤K-4:按照关系类别对训练数据进行聚类,对每一类关系类别:穷举生成其所有可能的实体关系角色变换的组合,并把该组合作为模型二的训练数据;
步骤K-5:对每一种关系类别,用生成其所有可能的实体关系角色变换的组合来训练基于转换器的双向编码器网络而得到模型二。
所述生产应用的具体方式,包括如下步骤:
步骤L-1:对实时传入基于深度学习的关系抽取系统的文本,进行命名实体识别;
步骤L-2:将识别出来的实体部分替换成对应命名实体类别的标识,并对该标识进行词向量嵌入,生成作为预处理完的文本的句子向量化的矩阵;
步骤L-3:利用作为关系类别分类器的所述模型一,对预处理完的文本进行分类,获得概率排名最高的三种备选关系类别;
步骤L-4:根据三种备选关系类别中的每一种关系类别,生成其对应的穷举生成所有可能的实体关系角色变换组合;
步骤L-5:用对应的作为关系实体角色组合分类器的所述模型二进行判别得到最佳角色组合概率;
步骤L-6:结合概率排名最高的三种备选关系类别和最佳角色组合概率,输出最终系统判别的关系类别;
步骤L-7:输出文本中最佳角色组合概率对应的关系角色组合,并和最终系统判别的关系类别一起作为知识图谱存储于基于深度学习的关系抽取系统中。
本发明的有益效果为:
本发明在已有数据集上取得了很好的预测准确率和召回率,较同类型传统的模式匹配的系统有了很大的提升。实验数据证明,在训练样本充足的情况下,发明中的开发训练和生产应用两部分方法能够取得超过90%的准确性。在实际应用中,其能够发现并识别全新的关系表达方式,并准确定位文本中对应的关系角色实体。满足了文本关系抽取的要求,并可拓展至任何合理定义的关系类型。其实现严谨有效,结果准确,达到了应用的要求。有效避免了现有技术中关系抽取系统很难发现新的关系模式、导致系统召回率相对较低、所运用的模式匹配无法从隐式表达的句子或文章中抽取出关系的缺陷。
附图说明
图1为本发明的基于深度学习的关系抽取系统的方法的流程图。
具体实施方式
本发明的基于深度学习的关系抽取系统及其方法所要解决是传统方法召回率低,提取关系能力有限的问题。关系抽取要求系统能够尽可能完整并准确地抽取出系统输入文本中所有用户感兴趣的关系对。由于不同作者在使用文本描述一件关系时,描述方法一般都会有所差异,而且甚至会有隐性的描述。传统的模式匹配的方法将可用的关系描述成为“模式”。如果一个模式匹配系统记住部分最常用的“模式”,那么此系统就无法识别记录外的关系表达;如果一个模式匹配系统记住当前所有可能的“模式”,那么在模式匹配的过程中系统的效率就会大幅度降低,同时此系统仍无法发现新的“模式”表达。该发明的基于深度学习的技术方案正是要使系统智能的识别所有的“模式”,并具备发现新的文本中的关系表达的能力。
下面将结合附图和实施例对本发明做进一步地说明。
如图1所示,基于深度学习的关系抽取系统,包括:
用于关系抽取的终端,所述用于关系抽取的终端能够是PC机、笔记本电脑或者服务器;所述用于关系抽取的终端中包括关系类别分类模块和关系角色组合判别模块;所述关系类别分类模块和关系角色组合判别模块都根据深度学习网络实现,所述关系类别分类模块和关系角色组合判别模块运行后所输出的结果的组合达到文本的关系抽取的需求。
所述关系类别分类模块用于根据文本内容,由机器学习算法判断文本描述的关系的关系类别;该关系类别能够如:公司收购关系、区域地质灾害、人物婚姻关系这样的关系。
所述关系角色组合判别模块用于判别在已经识别关系的句子中,判断句子中命名实体在关系中承担的角色。如:“阎崇年讲解:康熙是雍正的父亲”这已经识别关系的句子的描述中,涉及到两个人名的命名实体;该部分系统需要识别出在这个描述父子关系的句子中,“康熙”、“雍正”两个人名与“父子”两个角色的对应关系。同时,此类问题存在一个句子描述中包含其他与关系无关的命名实体(如例子中的“阎崇年”),系统也需要识别出这些命名实体是与关系描述无关的。
所述用于关系抽取的终端,还包括收集模块、嵌入模块、训练模块一、聚类模块和训练模块二;
所述收集模块用于收集人工标注或基于传统模式识别标注的数据做为训练数据;所述基于传统模式识别标注的数据就是基于模式匹配下识别标注的数据,该收集手段可以是键盘录入所述用于关系抽取的终端中的方式。
所述嵌入模块用于将训练数据的实体部分替换成对应命名实体类别的标识,并对该标识进行词向量嵌入,生成句子向量化的矩阵;所述词向量能够是300维的向量并还具有12个辅助向量。
所述训练模块一用于用生成的句子向量化的矩阵训练双向长短期记忆网络而得到模型一;
所述聚类模块用于按照关系类别对训练数据进行聚类,对每一类关系:穷举生成所有可能的实体关系角色变换的组合,并把该组合作为模型二的训练数据;
所述训练模块二用于对每一种关系类别,用生成其所有可能的实体关系角色变换的组合来训练基于转换器的双向编码器网络而得到模型二。
所述用于关系抽取的终端,还包括识别模块、替换模块、分类模块、生成模块、判别模块、输出模块一和输出模块二;
所述识别模块用于对实时传入基于深度学习的关系抽取系统的用于关系抽取的终端中的文本,进行命名实体识别;
所述替换模块用于将识别出来的实体部分替换成对应命名实体类别的标识,并对该标识进行词向量嵌入,生成句子向量化的矩阵;所述词向量能够是300维的向量并还具有12个辅助向量。
所述分类模块用于利用作为关系类别分类器的所述模型一,对预处理完的文本进行分类,获得概率排名最高的三种备选关系类别;
所述生成模块用于根据三种备选关系类别中的每一种关系类别,生成其对应的穷举生成所有可能的实体关系角色变换组合;
所述判别模块用于用对应的作为关系实体角色组合分类器的所述模型二进行判别得到最佳角色组合概率;
所述输出模块一用于结合概率排名最高的三种备选关系类别和最佳角色组合概率,输出最终系统判别的关系类别;该最终系统判别的关系类别就是最佳角色组合概率所对应的备选关系类别。
所述输出模块二用于输出文本中最佳角色组合概率对应的关系角色组合,并和最终系统判别的关系类别一起作为知识图谱存储于基于深度学习的关系抽取系统的用于关系抽取的终端中的数据库中。
所述基于深度学习的关系抽取系统的方法,包括如下方式:
(1)开发训练,作为模型训练的所述开发训练训练出对应的模型;
(2)生产应用,运用所述开发训练出的模型来得到关系类别和关系角色组合。
作为模型训练的所述开发训练的具体方式,包括如下步骤:
步骤K-1:收集人工标注或基于传统模式识别标注的数据做为训练数据;所述基于传统模式识别标注的数据就是基于模式匹配下识别标注的数据,该收集手段可以是键盘录入所述用于关系抽取的终端中的方式。
步骤K-2:将训练数据的实体部分替换成对应命名实体类别的标识,并对该标识进行词向量嵌入,生成句子向量化的矩阵;所述词向量能够是300维的向量并还具有12个辅助向量。
步骤K-3:用生成的句子向量化的矩阵训练双向长短期记忆网络而得到模型一;
步骤K-4:按照关系类别对训练数据进行聚类,对每一类关系类别:穷举生成其所有可能的实体关系角色变换的组合,并把该组合作为模型二的训练数据;
步骤K-5:对每一种关系类别,用生成其所有可能的实体关系角色变换的组合来训练基于转换器的双向编码器网络而得到模型二。
所述生产应用的具体方式,包括如下步骤:
步骤L-1:对实时传入基于深度学习的关系抽取系统的用于关系抽取的终端中的文本,进行命名实体识别;
步骤L-2:将识别出来的实体部分替换成对应命名实体类别的标识,并对该标识进行词向量嵌入,生成作为预处理完的文本的句子向量化的矩阵;所述词向量能够是300维的向量并还具有12个辅助向量。
步骤L-3:利用作为关系类别分类器的所述模型一,对预处理完的文本进行分类,获得概率排名最高的三种备选关系类别;
步骤L-4:根据三种备选关系类别中的每一种关系类别,生成其对应的穷举生成所有可能的实体关系角色变换组合;
步骤L-5:用对应的作为关系实体角色组合分类器的所述模型二进行判别得到最佳角色组合概率;
步骤L-6:结合概率排名最高的三种备选关系类别和最佳角色组合概率,输出最终系统判别的关系类别;该最终系统判别的关系类别就是最佳角色组合概率所对应的备选关系类别。
步骤L-7:输出文本中最佳角色组合概率对应的关系角色组合,并和最终系统判别的关系类别一起作为知识图谱存储于基于深度学习的关系抽取系统的用于关系抽取的终端中的数据库中。
采用本发明所述的基于深度学习的关系提取的方法,在已有数据集(包含公司收购、公司易名、亲子人物关系等共25种关系类别)上取得了很好的预测准确率和召回率,较同类型传统的模式匹配的系统有了很大的提升。实验数据证明,在训练样本充足(每类关系超过500样本)的情况下,发明中的开发训练和生产应用两部分能够取得超过90%的准确性。在实际应用中,本发明能够发现并识别全新的关系表达方式,并准确定位文本中对应的关系角色实体。基本满足了文本关系抽取的要求,并可拓展至任何合理定义的关系类型。本发明实现严谨有效,结果准确,达到了应用的要求。
对于作为企业情报监控的基于深度学习的关系提取系统及其方法的应用实例。首先用户要定义所有关注的关系类别(如公司并购、公司任职、公司上市等),并收集相应的样本数据进行标注。利用收集到的数据,训练两段式的模型(如图1模型训练部分所示)。完成本发明系统中的模型训练,便可以部署运用到生产环境中。
在实际应用中,用户可将需要分析处理的文本数据(如:实时新闻流数据)输入至生产系统(如图1生产应用部分所示)。系统会自动分析输入文本中所有包含的定义中的关系对,并存入数据库中。这样,该系统便可以实现自动分析并监控(全网新闻或其他信息源),提取出结构化的关系数据,实时分析并提供给用户他们感兴趣的企业情报。
伴随着远程监控技术的发展,就能够对知识图谱进行远程监控,具体而言,就是所述用于关系抽取的终端与无线通信模块连接,所述无线通信模块与无线网中的监控平台连接,所述无线通信模块能够是3G模块或者4G模块,所述无线网能够是3G网或4G网,所述监控平台能够是PC机或者笔记本电脑,这样知识图谱信息传递到用于关系抽取的终端,再通过无线通信模块把知识图谱信息以信息报文的格式传递至监控平台,现有的如3G网或者4G网这样的无线网在传递知识图谱信息时,是经无线网里的主路由器对全部的所述信息报文执行统一的链路规划,接着经从路由器凭借主路由器规划的链路对所述信息报文执行中转直至信息报文被传递到监控平台,无线通信模块与监控平台间的传递期间为独个信息报文执行传递,若在传递期间所述信息报文遭到噪声扰动就常出现信息传递误码率高的问题,对信息报文的传递有负面影响。
所述用于关系抽取的终端与无线通信模块连接,所述无线通信模块与无线网中的监控平台连接,所述无线通信模块能够是3G模块或者4G模块,所述无线网能够是3G网或4G网,所述监控平台能够是PC机或者笔记本电脑。所述无线通信模块与无线网中的监控平台的连接结构包括:无线网中的主路由器、无线通信模块、无线网中的监控平台与多个无线网中的从路由器,所述从路由器的数量能够大于七个,所述主路由器与全部所述的从路由器连接,所述无线通信模块与无线网中的监控平台分别与一对从路由器连接。在所述无线通信模块朝无线网里的监控平台传递要求建立链路的指令之际,要求建立链路的指令先传至所述主路由器,主路由器辨认出此为要求建立用于传递所述信息报文的专用链路的指令,凭借所述要求建立链路的指令,建立起在所述无线通信模块与无线网中的监控平台间的分别为专用链路一和专用链路二的一对用于传递所述信息报文的专用链路,须进一步阐述的是所述要求建立链路的指令能够为无线通信模块传递至无线网中的监控平台的消息,该消息里有无线通信模块与无线网中的监控平台的标志码,主路由器收受到该消息后,经由辨别无线通信模块与无线网中的监控平台的标志码来建立专用链路。所述用于传递所述信息报文的专用链路的数量能够是多于一对的数量。须进一步阐述的为,所述专用链路一与所述专用链路二能够为主路由器朝无线通信模块传递的经无线通信模块到无线网中的监控平台的一对不一样的信息链路;亦能为主路由器朝无线网中的监控平台传递的经无线网中的监控平台到无线通信模块的一对不一样的信息链路;经无线通信模块到无线网中的监控平台的一对不一样的信息链路与经无线网中的监控平台到无线通信模块的一对不一样的信息链路能够相应的彼此带有相交的部分亦能够彼此独立而全不一样。所述主路由器在建立完毕分别为专用链路一和专用链路二的一对用于传递所述信息报文的专用链路后,所述主路由器朝无线通信模块与无线网中的监控平台传递所述分别为专用链路一和专用链路二的一对用于传递所述信息报文的专用链路的信息;所述无线通信模块收受到所述分别为专用链路一和专用链路二的一对用于传递所述信息报文的专用链路的信息后,如果无线通信模块须朝无线网中的监控平台传递信息报文之际,所述无线通信模块经由分别为专用链路一与专用链路二的一对用于传递所述信息报文的专用链路朝无线网中的监控平台传递一样的所述信息报文,无线网中的监控平台经由分别为专用链路一和专用链路二的一对用于传递所述信息报文的专用链路收受所述信息报文,由此纵然有一专用链路在传递期间遭到损害或者所述信息报文遗失,亦能经由另外的专用链路传递到的信息报文执行处置,不必要所述无线通信模块再次传递,由此确保了信息报文传递的安全性与及时性;另外,亦能够是,所述主路由器在建立完毕分别为专用链路一和专用链路二的一对用于传递所述信息报文的专用链路后,只朝所述无线通信模块与所述无线网中的监控平台里的一个传递所述分别为专用链路一和专用链路二的一对用于传递所述信息报文的专用链路的信息,在收受到所述分别为专用链路一和专用链路二的一对用于传递所述信息报文的专用链路的所述无线通信模块或者所述无线网中的监控平台经由分别为专用链路一和专用链路二的一对用于传递所述信息报文的专用链路朝无线网中的监控平台传递信息报文之际,所述无线网中的监控平台凭借信息报文里具有的分别是专用链路一与专用链路二的一对用于传递所述信息报文的专用链路响应信息报文。详细而言,所述无线网中的监控平台在分别从所述分别为专用链路一和专用链路二的一对用于传递所述信息报文的专用链路上收受信息报文一与信息报文二之际,起初是对所述信息报文一与所述信息报文二里最先传递到的信息报文执行判定,判定是不是为无误的信息报文,如果无误就对该信息报文执行处置,且还舍弃信息报文一与信息报文二里最后收受到的信息报文;若最先传递到的信息报文出错就舍弃该信息报文且朝所述主路由器与所述无线通信模块传递信息报文出错的消息,对信息报文一里信息报文二里最后收受的信息报文执行判定。经由对收受的信息报文执行判定,能让无线网中的监控平台防止再次处置,同步的对最先收受并无误的信息报文执行包括显示在所述无线网中的监控平台的显示屏上的这样的处置,确保了信息报文传递的及时性。经由建立分别为专用链路一和专用链路二的一对用于传递所述信息报文的专用链路,所述无线通信模块与无线网中的监控平台间执行信息报文传递之际,分别把所述分别为专用链路一与专用链路二的一对专用链路增设到具有一样的信息报文的信息报文一与信息报文二里,由此纵然有一专用链路在传递期间遭致损害或者传递的信息报文遗失,亦能经由另外的专用链路传递来的信息报文执行处置,不必用所述无线通信模块再次传递,由此确保了信息报文传递的无误和及时。
所述用于关系抽取的终端传递知识图谱信息到监控平台的方法,包括:
用于关系抽取的终端把知识图谱信息以信息报文的形式传递至所述监控平台,以便执行把信息报文显示在监控平台的显示屏上的处理;
所述信息报文的传递方法,运行在主路由器上,包括如下流程:
S1-1:收受要求建立链路的指令,这里,所述要求建立链路的指令具有所述无线通信模块与无线网中的监控平台的标志码;
所述无线通信模块与线网中的监控平台为执行所述信息报文传递的两头,所述无线通信模块的标志码为无线通信模块的记号,无线网中的监控平台的标志码是无线网中的监控平台的记号,另外所述无线通信模块与无线网中的监控平台的标志码都具有独一性;所述记号能够是事先设定的具有独一性的标记;
须进一步阐述的为,所述要求建立链路的指令能够为所述无线通信模块传递至无线网中的监控平台的消息,该消息里有无线通信模块与无线网中的监控平台的标志码,所述主路由器收受到该消息后,经由辨别无线通信模块与无线网中的监控平台的标志码来建立专用链路;
S1-2:凭借所述要求建立链路的指令,建立所述无线通信模块与无线网中的监控平台间分别为专用链路一和专用链路二的一对用于传递所述信息报文的专用链路;
在无线通信模块与无线网中的监控平台间有多个从路由器,所以,在一种方式下,点到点的信息链路是不单一的,在每个专用链路里在无线通信模块与无线网中的监控平台之外的另外的从路由器绝对不一样,自然,在另外的方式里,每个专用链路里在无线通信模块与无线网中的监控平台外的另外的从路由器为能够有一些一样的;由于主路由器中的统一的链路表登记了每个从路由器的链表信息,所以建立专用链路是凭借主路由器中的集中链路表建立,须进一步阐述的为:如果所述无线通信模块与无线网中的监控平台不在同一子网之际,在建立专用链路之际,是凭借无线通信模块与无线网中的监控平台所在子网的一对主路由器的一对统一的链路表建立的,这里建立的专用链路亦为多个且不一样的,在无线通信模块和无线网中的监控平台在同一子网之际,径直由该子网上的主路由器的统一的链路表建立的;
所述主路由器建立的专用链路是多个的,这里用专用链路一、专用链路二只为说明信息报文传递的达成方法,具体应用中所述专用链路能为三个以上,另外,所述专用链路一与专用链路二的信息能够为主路由器朝无线通信模块传递的经无线通信模块到无线网中的监控平台的一对不一样的信息链路的信息;亦能为主路由器朝无线网中的监控平台传递的经无线网中的监控平台到无线通信模块的一对不一样的信息链路;经无线通信模块到无线网中的监控平台的一对不一样的信息链路与经无线网中的监控平台到无线通信模块的一对不一样的信息链路能够相应的彼此交叉一致、亦能够彼此独立完全不一样。
S1-3:朝所述无线通信模块与无线网中的监控平台传递所述分别为专用链路一和专用链路二的一对用于传递所述信息报文的专用链路,来让所述无线通信模块与无线网中的监控平台间执行信息报文传递之际,分别把所述分别为专用链路一与专用链路二的一对专用链路增设到具有一样的信息报文的信息报文一与信息报文二里,且让4G网里的从路由器凭借信息报文一与信息报文二所具有的专用链路执行中转。
所述专用链路一与专用链路二能够是在所述无线通信模块与无线网中的监控平台之外的另外的不一样的链路,所以所述专用链路一与专用链路二为彼此独立的,所以,所述信息报文一与信息报文二彼此不会相互扰动。
经由建立分别为专用链路一与专用链路二的一对用于传递所述信息报文的专用链路,所述无线通信模块与无线网中的监控平台之间执行信息报文传递之际,分别把所述分别为专用链路一与专用链路二的一对专用链路增设到具有一样的信息报文的信息报文一与信息报文二里,由此纵然有一专用链路在传递期间遭致损害或者传递的信息报文遗失,亦能经由另外的专用链路传递至的信息报文执行处置,不用所述无线通信模块再次传递,于是就确保了信息报文传递的无误性。
所述信息报文的传递方法,运行在无线通信模块上,还能为如下顺序执行的流程:
S2-1:所述无线通信模块收受分别为专用链路一与专用链路二的一对用于传递所述信息报文的专用链路的信息,所述分别为专用链路一与专用链路二的一对用于传递所述信息报文的专用链路都是所述无线通信模块到无线网中的监控平台的链路;
S2-2:在所述无线通信模块朝无线网中的监控平台传递要传递的知识图谱信息之际,所述无线通信模块凭借要传递的知识图谱信息,构成所述信息报文一与信息报文二,这里,所述信息报文一与所述信息报文二都具有一样的要传递的知识图谱信息;
要让所述无线网中的监控平台得到所述信息报文一与信息报文二后不出现分辨不清的问题,能够对每个所述信息报文里要传递的知识图谱信息执行内嵌进序列码,利于收受到信息报文后执行甄别,就像:信息报文一里面要传递的知识图谱信息的序列码是K-1,若在所述信息报文二具有的要传递的知识图谱信息一致的条件下,所述信息报文二里面要传递的知识图谱信息复本的序列码是K-2;
S2-3:把所述专用链路一的信息增设到所述信息报文一里,还有,把所述专用链路二的信息增设到所述信息报文二;
所述无线通信模块与无线网中的监控平台间无线网里的从路由器凭借信息报文一与信息报文二内的专用链路执行中转;
S2-4:分别传递具有专用链路一的信息报文一还有具有专用链路二的信息报文二,来让无线网里的从路由器凭借专用链路一中转所述信息报文一,和凭借专用链路二中转所述信息报文二。
因为专用链路的数量为多个,另外传递一致的信息报文,无线网中的监控平台收受到信息报文之际,能够凭借最先传递到且为无误的信息报文执行处理,让在有一信息链路里传递信息报文发生问题之际,能够径直运用另一信息链路的传递信息报文执行处置,这样就很便利,详细而言,所述S2-2的流程包括:
S2-2-A:拷贝所述要传递的知识图谱信息,构成所述要传递的知识图谱信息的复本;
所述无线通信模块在传递所述信息报文前,先把信息报文拷贝多件,且能够对每一份信息报文执行添加序列码;以此来让无线网中的监控平台不至于分辨不清,就像:所述信息报文的序列码能是K-1,复本的序列码能够为K-2、K-3…,自然,上述序列码不会对信息报文内容构成不利的效果,只达到了辨别的效果。
S2-2-B:把所述要传递的知识图谱信息组装为信息报文一,把所述信息报文的复本组装为信息报文二;
凭借事先设定的组装方法,对信息报文一与信息报文二执行组装,组装算法仅对信息报文组装形式有所区别,不会不利于所述信息报文一与信息报文二所具有的信息。
还有就是,在传递期间,所述无线通信模块与无线网中的监控平台间的无线网里的从路由器能径直凭借信息报文里的专用链路执行中转,不必让无线网里的从路由器在中转所述信息报文之际都朝主路由器要求中转链路,降低了主路由器的软硬件的耗损,须进一步阐述的为:由于信息报文是拷贝多件的,专用链路亦能够建立的多条,于是组装的信息报文亦是多个的。
这样,所述无线通信模块把信息报文与信息报文复本经由分别为专用链路一和专用链路二的一对用于传递所述信息报文的专用链路执行传递,由此纵然有一信息报文在传递期间遭致损害,所述无线网中的监控平台亦能对另外的信息报文执行处置,确保了信息报文传递的无误。
所述信息报文的传递方法,运行在无线网中的监控平台上,还能为如下顺序执行的流程:
S3-1:所述无线网中的监控平台收受信息报文一与信息报文二里最先传递到的信息报文,这里,所述信息报文一是经由专用链路一传递,所述信息报文二是经由专用链路二传递,所述信息报文一与信息报文二具有一样的要传递的知识图谱信息;
所述无线通信模块朝所述无线网中的监控平台传递信息报文之际,分别经由分别为专用链路一和专用链路二的一对用于传递所述信息报文的专用链路传递码值一样的信息报文,即:一信息报文分别经由分别为专用链路一与专用链路二的一对用于传递所述信息报文的专用链路朝所述无线通信模块传递两次,然而所述无线网中的监控平台经分别为专用链路一与专用链路二的一对用于传递所述信息报文的专用链路收受信息报文能够有前到和后到的区别;
S3-2:所述无线网中的监控平台认定所述信息报文一与信息报文二来最先传递到的信息报文是不是为无误的信息报文;
认定所述信息报文一与信息报文二是不是无误的方式很多,就像:在所述信息报文一与信息报文二里嵌设检错码,经由检错码认定所述信息报文一与信息报文二是不是无误;
S3-3:如果无误,就对最先传递到的信息报文执行解码来得到信息报文里的知识图谱信息;
对最先传递到的信息报文执行运用,不必守候另外的信息报文复本,由此降低了不少的耗时,确保了信息报文传递的及时。
S3-4:舍弃所述信息报文一与信息报文二里最后收受到的信息报文。
如果S3-2中认定出最先收受的信息报文出错,就说明所述信息报文里具有遭到破坏的信息报文,所述信息报文的传递方法,运行在无线网中的监控平台上,还能包括如下顺序执行的流程:
S3-5:如果最先传递到的信息报文出错,就舍弃所述最先收受到的信息报文;
S3-6:认定所述信息报文一与信息报文二里最后收受的信息报文是不是为无误的信息报文;所述最先传递到的信息报文出错之际就收受所述信息报文一与信息报文二里最后收受到的信息报文;
S3-7:如果无误,就对所述最后收受的信息报文执行解码来得到信息报文里的知识图谱信息;
S3-8:如果出错,就舍弃所述最后收受的信息报文且对所述主路由器与所述无线网中的监控平台传递信息报文出错的消息;
如果最后收受的信息报文都出错,就表示在中转期间全部的专用链路均带有故障,朝所述主路由器与所述无线通信模块传递信息报文出错的消息后,所述主路由器就对从路由器执行监测,监测出有故障的从路由器后对专用链路执行再次建立,再次建立的专用链路里不会包括有故障的的用于中转的从路由器,建立完成后主路由器接着把再次建立的专用链路传递到无线网中的监控平台与无线通信模块。
所述无线通信模块收受到无线网中的监控平台经由分别为专用链路一和专用链路二的一对用于传递所述信息报文的专用链路传递过来的信息报文一和信息报文二,经由认定信息报文的无误性,对最先收受且无误的信息报文执行处置,由此确保了信息报文的无误与及时。
所述主路由器包括:收受单元、建立单元以及传递单元;所述收受单元,用来收受要求建立链路的指令,这里,所述要求建立链路的指令具有无线通信单元与无线网中的监控平台的标志码;所述建立单元,用来凭借所述要求建立链路的指令,建立所述无线通信单元与无线网中的监控平台间分别为专用链路一与专用链路二的一对用来传递所述信息报文的专用链路;所述传递单元,用来朝所述无线通信单元与无线网中的监控平台传递所述分别为专用链路一和专用链路二的一对用来传递所述信息报文的专用链路的信息,来让无线通信单元与无线网中的监控平台间执行信息报文传递之际,分别把所述分别为专用链路一与专用链路二的一对专用链路增设到具有一样的信息报文的信息报文一和信息报文二里,且让无线网里的从路由器凭借信息报文一与信息报文二所具有的专用链路执行中转。
经由建立少分别为专用链路一与专用链路二的一对用于传递所述信息报文的专用链路,无线通信模块与无线网中的监控平台间执行信息报文传递时,分别把所述分别为专用链路一与专用链路二的一对专用链路增设到具有一样的信息报文的信息报文一与信息报文二里,由此纵然有个专用链路在传递期间遭致损害或者传递的信息报文遗失,亦能经由另外的专用链路传递来的信息报文执行处理,不必让无线通信模块再次传递,由此确保了信息报文传递的无误与及时。
以上以用实施例说明的方式对本发明作了描述,本领域的技术人员应当理解,本公开不限于以上描述的实施例,在不偏离本发明的范围的情况下,可以做出各种变化、改变和替换。
Claims (6)
1.一种基于深度学习的关系抽取系统,包括用于关系抽取的终端,其特征在于,所述用于关系抽取的终端中包括关系类别分类模块和关系角色组合判别模块;
所述关系类别分类模块用于根据文本内容,由机器学习算法判断文本描述的关系的关系类别;
所述关系角色组合判别模块用于判别在已经识别关系的句子中,判断句子中命名实体在关系中承担的角色。
2.根据权利要求1所述的基于深度学习的关系抽取系统,其特征在于,所述用于关系抽取的终端,还包括收集模块、嵌入模块、训练模块一、聚类模块和训练模块二;
所述收集模块用于收集人工标注或基于传统模式识别标注的数据做为训练数据;
所述嵌入模块用于将训练数据的实体部分替换成对应命名实体类别的标识,并对该标识进行词向量嵌入,生成句子向量化的矩阵;
所述训练模块一用于用生成的句子向量化的矩阵训练双向长短期记忆网络而得到模型一;
所述聚类模块用于按照关系类别对训练数据进行聚类,对每一类关系:穷举生成所有可能的实体关系角色变换的组合,并把该组合作为模型二的训练数据;
所述训练模块二用于对每一种关系类别,用生成其所有可能的实体关系角色变换的组合来训练基于转换器的双向编码器网络而得到模型二。
3.根据权利要求1所述的基于深度学习的关系抽取系统,其特征在于,所述用于关系抽取的终端,还包括识别模块、替换模块、分类模块、生成模块、判别模块、输出模块一和输出模块二;
所述识别模块用于对实时传入基于深度学习的关系抽取系统的文本,进行命名实体识别;
所述替换模块用于将识别出来的实体部分替换成对应命名实体类别的标识,并对该标识进行词向量嵌入,生成句子向量化的矩阵;
所述分类模块用于利用作为关系类别分类器的所述模型一,对预处理完的文本进行分类,获得概率排名最高的三种备选关系类别;
所述生成模块用于根据三种备选关系类别中的每一种关系类别,生成其对应的穷举生成所有可能的实体关系角色变换组合;
所述判别模块用于用对应的作为关系实体角色组合分类器的所述模型二进行判别得到最佳角色组合概率;
所述输出模块一用于结合概率排名最高的三种备选关系类别和最佳角色组合概率,输出最终系统判别的关系类别;
所述输出模块二用于输出文本中最佳角色组合概率对应的关系角色组合,并和最终系统判别的关系类别一起作为知识图谱存储于基于深度学习的关系抽取系统的数据库中。
4.一种基于深度学习的关系抽取系统的方法,其特征在于,包括如下方式:
(1)开发训练,所述开发训练训练出对应的模型;
(2)生产应用,运用所述开发训练出的模型来得到关系类别和关系角色组合。
5.根据权利要求4所述的基于深度学习的关系抽取系统的方法,其特征在于,所述开发训练的具体方式,包括如下步骤:
步骤K-1:收集人工标注或基于传统模式识别标注的数据做为训练数据;
步骤K-2:将训练数据的实体部分替换成对应命名实体类别的标识,并对该标识进行词向量嵌入,生成句子向量化的矩阵;
步骤K-3:用生成的句子向量化的矩阵训练双向长短期记忆网络而得到模型一;
步骤K-4:按照关系类别对训练数据进行聚类,对每一类关系类别:穷举生成其所有可能的实体关系角色变换的组合,并把该组合作为模型二的训练数据;
步骤K-5:对每一种关系类别,用生成其所有可能的实体关系角色变换的组合来训练基于转换器的双向编码器网络而得到模型二。
6.根据权利要求4所述的基于深度学习的关系抽取系统的方法,其特征在于,所述生产应用的具体方式,包括如下步骤:
步骤L-1:对实时传入基于深度学习的关系抽取系统的文本,进行命名实体识别;
步骤L-2:将识别出来的实体部分替换成对应命名实体类别的标识,并对该标识进行词向量嵌入,生成作为预处理完的文本的句子向量化的矩阵;
步骤L-3:利用作为关系类别分类器的所述模型一,对预处理完的文本进行分类,获得概率排名最高的三种备选关系类别;
步骤L-4:根据三种备选关系类别中的每一种关系类别,生成其对应的穷举生成所有可能的实体关系角色变换组合;
步骤L-5:用对应的作为关系实体角色组合分类器的所述模型二进行判别得到最佳角色组合概率;
步骤L-6:结合概率排名最高的三种备选关系类别和最佳角色组合概率,输出最终系统判别的关系类别;
步骤L-7:输出文本中最佳角色组合概率对应的关系角色组合,并和最终系统判别的关系类别一起作为知识图谱存储于基于深度学习的关系抽取系统中。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910732040.8A CN110414008B (zh) | 2019-08-09 | 2019-08-09 | 一种基于深度学习的关系抽取系统及其方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910732040.8A CN110414008B (zh) | 2019-08-09 | 2019-08-09 | 一种基于深度学习的关系抽取系统及其方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110414008A true CN110414008A (zh) | 2019-11-05 |
CN110414008B CN110414008B (zh) | 2023-06-20 |
Family
ID=68366530
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910732040.8A Active CN110414008B (zh) | 2019-08-09 | 2019-08-09 | 一种基于深度学习的关系抽取系统及其方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110414008B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111126067A (zh) * | 2019-12-23 | 2020-05-08 | 北大方正集团有限公司 | 实体关系抽取方法及装置 |
CN113361280A (zh) * | 2021-06-30 | 2021-09-07 | 北京百度网讯科技有限公司 | 训练模型的方法、预测方法、装置、电子设备以及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130173524A1 (en) * | 2011-12-30 | 2013-07-04 | Certona Corporation | Extracting predictive segments from sampled data |
CN105138507A (zh) * | 2015-08-06 | 2015-12-09 | 电子科技大学 | 一种基于模式自学习的中文开放式关系抽取方法 |
CN107220237A (zh) * | 2017-05-24 | 2017-09-29 | 南京大学 | 一种基于卷积神经网络的企业实体关系抽取的方法 |
CN108304911A (zh) * | 2018-01-09 | 2018-07-20 | 中国科学院自动化研究所 | 基于记忆神经网络的知识抽取方法以及系统和设备 |
CN109871451A (zh) * | 2019-01-25 | 2019-06-11 | 中译语通科技股份有限公司 | 一种融入动态词向量的关系抽取方法和系统 |
-
2019
- 2019-08-09 CN CN201910732040.8A patent/CN110414008B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130173524A1 (en) * | 2011-12-30 | 2013-07-04 | Certona Corporation | Extracting predictive segments from sampled data |
CN105138507A (zh) * | 2015-08-06 | 2015-12-09 | 电子科技大学 | 一种基于模式自学习的中文开放式关系抽取方法 |
CN107220237A (zh) * | 2017-05-24 | 2017-09-29 | 南京大学 | 一种基于卷积神经网络的企业实体关系抽取的方法 |
CN108304911A (zh) * | 2018-01-09 | 2018-07-20 | 中国科学院自动化研究所 | 基于记忆神经网络的知识抽取方法以及系统和设备 |
CN109871451A (zh) * | 2019-01-25 | 2019-06-11 | 中译语通科技股份有限公司 | 一种融入动态词向量的关系抽取方法和系统 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111126067A (zh) * | 2019-12-23 | 2020-05-08 | 北大方正集团有限公司 | 实体关系抽取方法及装置 |
CN111126067B (zh) * | 2019-12-23 | 2022-02-18 | 北大方正集团有限公司 | 实体关系抽取方法及装置 |
CN113361280A (zh) * | 2021-06-30 | 2021-09-07 | 北京百度网讯科技有限公司 | 训练模型的方法、预测方法、装置、电子设备以及存储介质 |
CN113361280B (zh) * | 2021-06-30 | 2023-10-31 | 北京百度网讯科技有限公司 | 训练模型的方法、预测方法、装置、电子设备以及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN110414008B (zh) | 2023-06-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112949281B (zh) | 一种图神经网络的增量社交事件检测方法 | |
CN110414008A (zh) | 一种基于深度学习的关系抽取系统及其方法 | |
CN106294738B (zh) | 一种智能家居场景配置方法 | |
CN110909881B (zh) | 一种面向跨媒体知识推理任务的知识表示方法 | |
CN111064620A (zh) | 基于运维知识库的电网多媒体会议室设备维护方法和系统 | |
Xie et al. | Logm: Log analysis for multiple components of hadoop platform | |
Muppavarapu et al. | Knowledge extraction using semantic similarity of concepts from Web of Things knowledge bases | |
Luo | Cloud classroom design for English education based on internet of things and data mining | |
CN110399485A (zh) | 基于词向量和机器学习的数据溯源方法和系统 | |
Hamood et al. | Clustered and multi-tasked federated distillation for heterogeneous and resource constrained industrial IoT applications | |
Ruta et al. | Finding commonalities in RFID semantic streams | |
CN114139781A (zh) | 一种电力系统的运行趋势预测方法及系统 | |
CN113571159A (zh) | 一种基于人工智能的孤独症谱系障碍儿童康复护理系统 | |
Houzé et al. | A generic and modular reference architecture for self-explainable smart homes | |
CN117650969A (zh) | 一种多源数据融合的电力监控系统用户行为异常分析方法及装置 | |
CN115374765B (zh) | 一种基于自然语言处理的算力网络5g数据解析系统及方法 | |
Feng et al. | New media fine art education platform based on internet of things technology | |
Wang et al. | Real-time fault diagnosis method for low-voltage power line carrier communication network based on network topology | |
Song et al. | Research on the Evaluation Model for Wireless Sensor Network Performance Based on Mixed Multiattribute Decision‐Making | |
Zhang et al. | A real-time Information Exchange Strategy for Big Data Volume Systems Based on Internet of Things | |
Yu et al. | Construction of a Social Security Monitoring and Early Warning Platform Driven by Big Data | |
Li et al. | Protocol clustering of unknown traffic based on embedding of protocol specification | |
CN109740858A (zh) | 基于深度学习的自动化辅助决策系统及方法 | |
CN118337441B (zh) | 一种基于知识图谱的安全策略一致性检测方法 | |
Vargas et al. | Comparison of Machine Learning methods for Categorizing Objects in the Internet of Things |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |