CN111026941A - 一种面向装备体系论证评估的智能查询方法 - Google Patents

一种面向装备体系论证评估的智能查询方法 Download PDF

Info

Publication number
CN111026941A
CN111026941A CN201911032873.XA CN201911032873A CN111026941A CN 111026941 A CN111026941 A CN 111026941A CN 201911032873 A CN201911032873 A CN 201911032873A CN 111026941 A CN111026941 A CN 111026941A
Authority
CN
China
Prior art keywords
data
demonstration
attributes
evaluation
equipment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201911032873.XA
Other languages
English (en)
Inventor
罗巍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JIANGSU PUXU SOFTWARE INFORMATION TECHNOLOGY CO LTD
Original Assignee
JIANGSU PUXU SOFTWARE INFORMATION TECHNOLOGY CO LTD
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JIANGSU PUXU SOFTWARE INFORMATION TECHNOLOGY CO LTD filed Critical JIANGSU PUXU SOFTWARE INFORMATION TECHNOLOGY CO LTD
Priority to CN201911032873.XA priority Critical patent/CN111026941A/zh
Publication of CN111026941A publication Critical patent/CN111026941A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/288Entity relationship models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Machine Translation (AREA)

Abstract

一种面向装备体系论证评估的智能查询方法,首先构建装备体系论证评估知识图谱,前端界面中输入查询问题,语义解析模块利用神经网络模型抽取输入的查询问题中的实体和关系,进行查询问题的意图识别,转化为查询语句之后,搜索知识图谱并返回答案至前端界面以显示。本方法实现了装备体系论证评估的智能查询,减少人力搜索及分析文献的时间,提高效率,加快论证评估进程;智能处理非结构化及半结构化的军事文本数据,极大减少人工构建知识图谱的工作量;模型智能识别问题查询意图,提高提问方式的自由度高;支持模型离线化调用,可移植性高。

Description

一种面向装备体系论证评估的智能查询方法
技术领域
本发明涉及信息技术领域,具体涉及一种面向装备体系论证评估的智能查询方法。
背景技术
装备体系论证评估是指对武器装备的国内外现状、发展趋势、装备能力、作战运用模式等以数据为支撑的知识进行全面地、深入地、综合地分析,需要花费大量的精力,查找、翻阅不同文献来获取必要信息。
发明内容
针对上述问题,本发明提出一种面向装备体系论证评估的智能查询方法。
一种面向装备体系论证评估的智能查询方法,首先构建装备体系论证评估知识图谱,前端界面中输入查询问题,语义解析模块利用神经网络模型抽取输入的查询问题中的实体和关系,进行查询问题的意图识别,转化为查询语句之后,搜索知识图谱并返回答案至前端界面以显示。
进一步地,建立知识图谱包括如下步骤:
步骤1,数据抓取:导入军事文献资料,并进行数据清洗过滤;
步骤2,本体设计:利用Protege进行本体设计,本体是对装备体系论证评估领域的结构化描述,本体元素主要有类别、对象属性、数值属性等,其中类别主要为武器装备和其对应的信息等;
步骤3,数据结构化:对抓取得到的非结构化和半结构化数据进行处理,利用基于BiLSTM+CRF的命名实体识别模型,提取出军事装备中对应的实体,利用Seq2Seq的关系抽取模型抽取实体之间的关系,实现数据结构化;
步骤4,Rdf数据转换:将结构化处理之后的知识数据转为三元组形式的Rdf数据;
步骤5,Jena框架搭建:基于Jena框架构建装备评估论证知识图谱,转化之后的Rdf数据存放于Tdb数据库中,Fuseki作为Sparql服务器提供交互式查询接口,可通过Sparql进行知识库查询。
进一步地,步骤1中资料导入,具体为通过网络爬虫从军事网站抓取非结构化和半结构化的信息,信息主要包括装备的名称,类型,作战参数等,获取信息并导入之后,进行数据清洗,过滤数据中的图片及表格等非文本数据。
进一步地,步骤2中,利用Protege进行本体设计,具体为:
步骤2-1,定义类和类公理;
根据装备体系论证评估的相关概念,定义类的概念层次结构;
步骤2-2,定义属性及属性公理;
定义类的属性,对类表示的概念进行描述,属性主要包括对象属性和数据属性,对象属性连接了类中包含的个体,数据属性连接了个体及其具体的取值;
定义属性的性质,属性的性质决定了属性的类型,进一步描述了类中包含的个体之间,个体与其取值之间的关系,包括反转属性,函数属性,反函数属性,传递属性,对称属性;
定义域和值域,限定属性的使用范围。
进一步地,建立知识图谱的步骤3中,命名实体识别模型采用基于BiLSTM+CRF的神经网络模型,抽取军事装备中对应的命名实体,对应训练数据,采用BIOES的标签对数据集进行标注;
基于BiLSTM+CRF的神经网络模型的输入为每个字符经过embedding之后的词向量,词向量通过Word2vec训练得到,词向量输入双向LSTM层,该层自动提取句子特征,并输入CRF层;
通过下式计算CRF层输出的句子得分:
Figure BDA0002250645190000031
上式中,X为原始句子,n为句子中的字符长度,y为预测的序列结果,A为转移矩阵,Aij表示标签i转移直标签j的概率得分,P为发射矩阵,表示Pij表示第i个字符的标签为j的概率得分,S(X,y)表示句子X的序列标签为y的分值,通过softmax转化以后概率为:
Figure BDA0002250645190000032
上式中Yx表示所有可能的标签序列,需要寻找能使上式中概率P最大化的标签序列y,利用标签序列y所对应的BIOES标签,从字符序列中获得命名实体。
进一步地,建立知识图谱的步骤3中利用Seq2Seq的关系抽取模型抽取命名实体之间的关系,具体地,采用基于Seq2Seq结构的神经网络模型,从文本中抽取装备命名实体之间的关系;
基于Seq2Seq结构的神经网络模型由编码器和解码器组成,编码器由一个双向LSTM网络构成,字符序列的词向量作为编码器的输入,编码器输出中间语义向量C,并作为输入传入解码器,解码器由一个单向LSTM网络构成,输出序列以“Start”占位符开始,以“End”占位符结束,并输出关系类型;
在编码阶段,当前时间的隐藏状态由上一时间的状态和当前时间的输入决定,如以下公式所示:
ht=f(ht-1,xt)
上式中t表示在某一个时刻,t-1则是该时刻的上一个时刻;
获得了编码器在各个时间段的隐藏层以后,再将隐藏层的信息汇总,生成最后的语义向量,可直接将最后的隐藏层作为语义向量C,如以下公式所示:
C=hn
或者根据所有隐藏层的状态进行转换以后得到,如以下公式所示:
C=q(h1,h2,h3,...,hn)
在解码阶段,输出解码序列Y=(yStart,yr,yEnd),yr表示模型输出的关系类型,需要求得使的下式中概率P最大化的序列Y,并以序列Y中的yr作为最终的目标类型。
P(Y)=ΠP(y|{yStart,yr,yEnd,C})
进一步地,语义解析模块,解析输入问题的语义,利用基于attention机制的意图识别及槽值填充模型,填补问题中的空槽,取槽值作为问题中的命名实体,并识别问题意图,确认问题对应的命名实体关系类型。
进一步地,基于attention机制的意图识别及槽值填充模型进行语义解析,模型对槽值填充和意图识别过程进行联合建模,采用编码器-解码器结构,双向LSTM网络接收问题输入,对于每一个时间i,前向和后向网络的隐藏层状态合并后,作为编码器隐藏层状态hi
Figure BDA0002250645190000051
在解码器端输出状态的计算方式如下:
Si=f(si-1,yi-1,hi,ci)
在每个解码步骤i,Si为当前解码器状态,Si-1为前一时间解码器状态、yi为前一时间解码器输出标签,hi为该时间下编码器隐藏状态,ci为该时间下上下文向量;
上下文向量的计算公式如下:
Figure BDA0002250645190000052
通过编码器隐藏层状态h和注意力权重a加权求和得到;
注意力权重的计算公式如下:
Figure BDA0002250645190000053
ei,k=g(wh,e,si-1,hk)
对于槽值填充,利用softmax公式计算每一个标签y的概率:
Figure BDA0002250645190000054
上式中h为编码器的隐藏层状态,c为槽值上下文向量,w为对应权重;
对于意图识别,利用softmax公式计算每一个类别y的概率:
Figure BDA0002250645190000061
上式中h为编码器的隐藏层状态,c为意图上下文向量,w为对应权重。
本发明达到的有益效果为:实现装备体系论证评估的智能查询,减少人力搜索及分析文献的时间,提高效率,加快论证评估进程;智能处理非结构化及半结构化的军事文本数据,极大减少人工构建知识图谱的工作量;模型智能识别问题查询意图,提高提问方式的自由度高;支持模型离线化调用,可移植性高。
附图说明
图1为本发明实施例中智能查询方法的流程示意图。
图2为本发明实施例中命名实体识别模型的结构示意图。
图3为本发明实施例中关系抽取模型的结构示意图。
图4为本发明实施例中意图识别及槽值填充模型的结构示意图。
具体实施方式
下面结合说明书附图对本发明的技术方案做进一步的详细说明。
一种面向装备体系论证评估的智能查询方法,首先构建装备体系论证评估知识图谱,前端界面中输入查询问题,语义解析模块利用神经网络模型抽取输入的查询问题中的实体和关系,进行查询问题的意图识别,转化为查询语句之后,搜索知识图谱并返回答案至前端界面以显示。
建立知识图谱包括如下步骤:
步骤1,数据抓取:导入军事文献资料,并进行数据清洗过滤。资料导入具体为通过网络爬虫从军事网站抓取非结构化和半结构化的信息,信息主要包括装备的名称,类型,作战参数等,获取信息并导入之后,进行数据清洗,过滤数据中的图片及表格等非文本数据。
步骤2,本体设计:利用Protege进行本体设计,本体是对装备体系论证评估领域的结构化描述,本体元素主要有类别、对象属性、数值属性等,其中类别主要为武器装备和其对应的信息等。如:歼0,中国分别对应飞行器类别和国家类别,对象属性表示类别之间的关系,如:“歼10的生产国家是中国”表示飞行器类别和国家类别之间的关系,数值属性表示类别的具体参数,如:“歼10的最大飞行速度为2.2马赫”表示飞行器类别的最大飞行速度这一数值属性。
步骤3,数据结构化:对抓取得到的非结构化和半结构化数据进行处理,利用基于BiLSTM+CRF的命名实体识别模型,提取出军事装备中对应的实体,利用Seq2Seq的关系抽取模型抽取实体之间的关系,实现数据结构化。
步骤4,Rdf数据转换:将结构化处理之后的知识数据转为三元组形式的Rdf数据。如“歼10最大飞行速度为2.2马赫”表示为“<歼10><MaxSpeed><2.2马赫>”。
步骤5,Jena框架搭建:基于Jena框架构建装备评估论证知识图谱,转化之后的Rdf数据存放于Tdb数据库中,Fuseki作为Sparql服务器提供交互式查询接口,可通过Sparql进行知识库查询。
步骤2中,利用Protege进行本体设计,具体为:
步骤2-1,定义类和类公理。
根据装备体系论证评估的相关概念,定义类的概念层次结构,例如“飞行器”类,“火炮”类等,并确定类间的关系,包括超类,子类等,例如“飞行器”为超类,“战斗机”类为子类。
步骤2-2,定义属性及属性公理。
定义类的属性,对类表示的概念进行描述,属性主要包括对象属性和数据属性,对象属性连接了类中包含的个体,数据属性连接了个体及其具体的取值。
定义属性的性质,属性的性质决定了属性的类型,进一步描述了类中包含的个体之间,个体与其取值之间的关系,包括反转属性,函数属性,反函数属性,传递属性,对称属性。
定义域和值域,限定属性的使用范围,例如属性“制造国家是”可以规定其定义域为“国家”类中包含的所有个体,值域为“飞行器”类中包含的所有的个体。
建立知识图谱的步骤3中,命名实体识别模型采用基于BiLSTM+CRF的神经网络模型,抽取军事装备中对应的命名实体,例如“歼10的最大飞行速度是2.2马赫”中需要抽取的实体为“歼10”和“2.2马赫”。对应训练数据,采用BIOES的标签对数据集进行标注。例句中“歼10”被标注成“BIE”,其中“歼”对应“B”,表示实体的开始字符,“1”对应“I”,表示实体的中间字符,“0”对应“E”,表示实体的结束字符,问句中其他不需要抽取的字符标注为“O”。
模型的网络结构如图2所示,基于BiLSTM+CRF的神经网络模型的输入为每个字符经过embedding之后的词向量,词向量通过Word2vec训练得到,词向量输入双向LSTM层,该层自动提取句子特征,并输入CRF层。
通过下式计算CRF层输出的句子得分:
Figure BDA0002250645190000091
上式中,X为原始句子,n为句子中的字符长度,y为预测的序列结果,A为转移矩阵,Aij表示标签i转移直标签j的概率得分,P为发射矩阵,表示Pij表示第i个字符的标签为j的概率得分,S(X,y)表示句子X的序列标签为y的分值,通过softmax转化以后概率为:
Figure BDA0002250645190000092
上式中Yx表示所有可能的标签序列,需要寻找能使上式中概率P最大化的标签序列y,利用标签序列y所对应的BIOES标签,从字符序列中获得命名实体。
建立知识图谱的步骤3中利用Seq2Seq的关系抽取模型抽取命名实体之间的关系,具体地,采用基于Seq2Seq结构的神经网络模型,从文本中抽取装备命名实体之间的关系。并与rdf数据对应,例如“歼10的最大飞行速度是2.2马赫”中需要抽取的关系“最大飞行速度”,对应三元组“<歼10><MaxSpeed><2.2马赫>”中的MaxSpeed。
基于Seq2Seq结构的神经网络模型如图3所示,由编码器和解码器组成,编码器由一个双向LSTM网络构成,字符序列的词向量作为编码器的输入,编码器输出中间语义向量C,并作为输入传入解码器,解码器由一个单向LSTM网络构成,输出序列以“Start”占位符开始,以“End”占位符结束,并输出关系类型。例如图3中,字符序列“最大飞行速”的词向量作为编码器的输入,编码器输出中间语义向量C,并作为输入传入解码器,解码器由一个单向LSTM网络构成,输出序列以“Start”占位符开始,以“End”占位符结束,并输出关系类型“MaxSpeed”。
在编码阶段,当前时间的隐藏状态由上一时间的状态和当前时间的输入决定,如以下公式所示:
ht=f(ht-1,xt)
上式中t表示在某一个时刻,t-1则是该时刻的上一个时刻。
获得了编码器在各个时间段的隐藏层以后,再将隐藏层的信息汇总,生成最后的语义向量,可直接将最后的隐藏层作为语义向量C,如以下公式所示:
C=hn
或者根据所有隐藏层的状态进行转换以后得到,如以下公式所示:
C=q(h1,h2,h3,...,hn)
在解码阶段,输出解码序列Y=(yStart,yr,yEnd),yr表示模型输出的关系类型,需要求得使的下式中概率P最大化的序列Y,并以序列Y中的yr作为最终的目标类型。
P(Y)=ΠP(y|{yStart,yr,yEnd,C})
语义解析模块,解析输入问题的语义,利用基于attention机制的意图识别及槽值填充模型,填补问题中的空槽,取槽值作为问题中的命名实体,并识别问题意图,确认问题对应的命名实体关系类型。
基于attention机制的意图识别及槽值填充模型进行语义解析,模型网络结构如图4所示,模型对槽值填充和意图识别过程进行联合建模,采用编码器-解码器结构,双向LSTM网络接收问题输入,对于每一个时间i,前向和后向网络的隐藏层状态合并后,作为编码器隐藏层状态hi
Figure BDA0002250645190000111
在解码器端输出状态的计算方式如下:
Si=f(si-1,yi-1,hi,ci)
在每个解码步骤i,Si为当前解码器状态,Si-1为前一时间解码器状态、yi为前一时间解码器输出标签,hi为该时间下编码器隐藏状态,ci为该时间下上下文向量。
上下文向量的计算公式如下:
Figure BDA0002250645190000112
通过编码器隐藏层状态h和注意力权重a加权求和得到。
注意力权重的计算公式如下:
Figure BDA0002250645190000113
ei,k=g(wh,e,si-1,hk)
对于槽值填充,利用softmax公式计算每一个标签y的概率:
Figure BDA0002250645190000114
上式中h为编码器的隐藏层状态,c为槽值上下文向量,w为对应权重。
对于意图识别,利用softmax公式计算每一个类别y的概率:
Figure BDA0002250645190000121
上式中h为编码器的隐藏层状态,c为意图上下文向量,w为对应权重。
以上所述仅为本发明的较佳实施方式,本发明的保护范围并不以上述实施方式为限,但凡本领域普通技术人员根据本发明所揭示内容所作的等效修饰或变化,皆应纳入权利要求书中记载的保护范围内。

Claims (8)

1.一种面向装备体系论证评估的智能查询方法,其特征在于:
所述智能查询方法中,首先构建装备体系论证评估知识图谱,前端界面中输入查询问题,语义解析模块利用神经网络模型抽取输入的查询问题中的实体和关系,进行查询问题的意图识别,转化为查询语句之后,搜索知识图谱并返回答案至前端界面以显示。
2.根据权利要求1所述的一种面向装备体系论证评估的智能查询方法,其特征在于:所述建立知识图谱包括如下步骤:
步骤1,数据抓取:导入军事文献资料,并进行数据清洗过滤;
步骤2,本体设计:利用Protege进行本体设计,所述本体是对装备体系论证评估领域的结构化描述,本体元素主要有类别、对象属性、数值属性等,其中类别主要为武器装备和其对应的信息等;
步骤3,数据结构化:对抓取得到的非结构化和半结构化数据进行处理,利用基于BiLSTM+CRF的命名实体识别模型,提取出军事装备中对应的实体,利用Seq2Seq的关系抽取模型抽取实体之间的关系,实现数据结构化;
步骤4,Rdf数据转换:将结构化处理之后的知识数据转为三元组形式的Rdf数据;
步骤5,Jena框架搭建:基于Jena框架构建装备评估论证知识图谱,转化之后的Rdf数据存放于Tdb数据库中,Fuseki作为Sparql服务器提供交互式查询接口,可通过Sparql进行知识库查询。
3.根据权利要求2所述的一种面向装备体系论证评估的智能查询方法,其特征在于:所述步骤1中资料导入,具体为通过网络爬虫从军事网站抓取非结构化和半结构化的信息,信息主要包括装备的名称,类型,作战参数等,获取信息并导入之后,进行数据清洗,过滤数据中的图片及表格等非文本数据。
4.根据权利要求2所述的一种面向装备体系论证评估的智能查询方法,其特征在于:所述步骤2中,利用Protege进行本体设计,具体为:
步骤2-1,定义类和类公理;
根据装备体系论证评估的相关概念,定义类的概念层次结构;
步骤2-2,定义属性及属性公理;
定义类的属性,对类表示的概念进行描述,属性主要包括对象属性和数据属性,对象属性连接了类中包含的个体,数据属性连接了个体及其具体的取值;
定义属性的性质,属性的性质决定了属性的类型,进一步描述了类中包含的个体之间,个体与其取值之间的关系,包括反转属性,函数属性,反函数属性,传递属性,对称属性;
定义域和值域,限定属性的使用范围。
5.根据权利要求2所述的一种面向装备体系论证评估的智能查询方法,其特征在于:所述建立知识图谱的步骤3中,所述命名实体识别模型采用基于BiLSTM+CRF的神经网络模型,抽取军事装备中对应的命名实体,对应训练数据,采用BIOES的标签对数据集进行标注;
所述基于BiLSTM+CRF的神经网络模型的输入为每个字符经过embedding之后的词向量,词向量通过Word2vec训练得到,词向量输入双向LSTM层,该层自动提取句子特征,并输入CRF层;
通过下式计算CRF层输出的句子得分:
Figure FDA0002250645180000031
上式中,X为原始句子,n为句子中的字符长度,y为预测的序列结果,A为转移矩阵,Aij表示标签i转移直标签j的概率得分,P为发射矩阵,表示Pij表示第i个字符的标签为j的概率得分,S(X,y)表示句子X的序列标签为y的分值,通过softmax转化以后概率为:
Figure FDA0002250645180000032
上式中Yx表示所有可能的标签序列,需要寻找能使上式中概率P最大化的标签序列y,利用标签序列y所对应的BIOES标签,从字符序列中获得命名实体。
6.根据权利要求2所述的一种面向装备体系论证评估的智能查询方法,其特征在于:所述建立知识图谱的步骤3中利用Seq2Seq的关系抽取模型抽取命名实体之间的关系,具体地,采用基于Seq2Seq结构的神经网络模型,从文本中抽取装备命名实体之间的关系;
基于Seq2Seq结构的神经网络模型由编码器和解码器组成,编码器由一个双向LSTM网络构成,字符序列的词向量作为编码器的输入,编码器输出中间语义向量C,并作为输入传入解码器,解码器由一个单向LSTM网络构成,输出序列以“Start”占位符开始,以“End”占位符结束,并输出关系类型;
在编码阶段,当前时间的隐藏状态由上一时间的状态和当前时间的输入决定,如以下公式所示:
ht=f(ht-1,xt)
上式中t表示在某一个时刻,t-1则是该时刻的上一个时刻;
获得了编码器在各个时间段的隐藏层以后,再将隐藏层的信息汇总,生成最后的语义向量,可直接将最后的隐藏层作为语义向量C,如以下公式所示:
C=hn
或者根据所有隐藏层的状态进行转换以后得到,如以下公式所示:
C=q(h1,h2,h3,...,hn)
在解码阶段,输出解码序列Y=(yStart,yr,yEnd),yr表示模型输出的关系类型,需要求得使的下式中概率P最大化的序列Y,并以序列Y中的yr作为最终的目标类型。
P(Y)=ΠP(y|{yStart,yr,yEnd,C})。
7.根据权利要求1所述的一种面向装备体系论证评估的智能查询方法,其特征在于:所述语义解析模块,解析输入问题的语义,利用基于attention机制的意图识别及槽值填充模型,填补问题中的空槽,取槽值作为问题中的命名实体,并识别问题意图,确认问题对应的命名实体关系类型。
8.根据权利要求7所述的一种面向装备体系论证评估的智能查询方法,其特征在于:所述基于attention机制的意图识别及槽值填充模型进行语义解析,模型对槽值填充和意图识别过程进行联合建模,采用编码器-解码器结构,双向LSTM网络接收问题输入,对于每一个时间i,前向和后向网络的隐藏层状态合并后,作为编码器隐藏层状态hi
Figure FDA0002250645180000051
在解码器端输出状态的计算方式如下:
Si=f(si-1,yi-1,hi,ci)
在每个解码步骤i,Si为当前解码器状态,Si-1为前一时间解码器状态、yi为前一时间解码器输出标签,hi为该时间下编码器隐藏状态,ci为该时间下上下文向量;
上下文向量的计算公式如下:
Figure FDA0002250645180000052
通过编码器隐藏层状态h和注意力权重a加权求和得到;
注意力权重的计算公式如下:
Figure FDA0002250645180000053
ei,k=g(wh,e,si-1,hk)
对于槽值填充,利用softmax公式计算每一个标签y的概率:
Figure FDA0002250645180000054
上式中h为编码器的隐藏层状态,c为槽值上下文向量,w为对应权重;
对于意图识别,利用softmax公式计算每一个类别y的概率:
Figure FDA0002250645180000055
上式中h为编码器的隐藏层状态,c为意图上下文向量,w为对应权重。
CN201911032873.XA 2019-10-28 2019-10-28 一种面向装备体系论证评估的智能查询方法 Withdrawn CN111026941A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911032873.XA CN111026941A (zh) 2019-10-28 2019-10-28 一种面向装备体系论证评估的智能查询方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911032873.XA CN111026941A (zh) 2019-10-28 2019-10-28 一种面向装备体系论证评估的智能查询方法

Publications (1)

Publication Number Publication Date
CN111026941A true CN111026941A (zh) 2020-04-17

Family

ID=70200687

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911032873.XA Withdrawn CN111026941A (zh) 2019-10-28 2019-10-28 一种面向装备体系论证评估的智能查询方法

Country Status (1)

Country Link
CN (1) CN111026941A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111861185A (zh) * 2020-07-14 2020-10-30 中国人民解放军军事科学院战争研究院 一种基于任务树的任务智能推荐方法及装置
CN112231418A (zh) * 2020-10-15 2021-01-15 南方电网数字电网研究院有限公司 电力标准知识图谱构建方法、装置、计算机设备和介质
CN112270189A (zh) * 2020-11-12 2021-01-26 佰聆数据股份有限公司 一种提问式的分析节点生成方法、系统及存储介质
CN113590838A (zh) * 2021-07-30 2021-11-02 上海明略人工智能(集团)有限公司 基于知识图谱的客服赋能方法、系统及存储介质
CN113783874A (zh) * 2021-09-10 2021-12-10 国网电子商务有限公司 基于安全知识图谱的网络安全态势评估方法及系统
CN114186690A (zh) * 2022-02-16 2022-03-15 中国空气动力研究与发展中心计算空气动力研究所 飞行器知识图谱构建方法、装置、设备及存储介质
CN117034943A (zh) * 2023-10-09 2023-11-10 华南师范大学 论证提取以及关系识别方法、装置、设备以及存储介质
CN117972222A (zh) * 2024-04-02 2024-05-03 紫金诚征信有限公司 基于人工智能的企业信息检索方法及装置

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111861185A (zh) * 2020-07-14 2020-10-30 中国人民解放军军事科学院战争研究院 一种基于任务树的任务智能推荐方法及装置
CN112231418A (zh) * 2020-10-15 2021-01-15 南方电网数字电网研究院有限公司 电力标准知识图谱构建方法、装置、计算机设备和介质
CN112231418B (zh) * 2020-10-15 2024-06-28 南方电网人工智能科技有限公司 电力标准知识图谱构建方法、装置、计算机设备和介质
CN112270189A (zh) * 2020-11-12 2021-01-26 佰聆数据股份有限公司 一种提问式的分析节点生成方法、系统及存储介质
CN113590838A (zh) * 2021-07-30 2021-11-02 上海明略人工智能(集团)有限公司 基于知识图谱的客服赋能方法、系统及存储介质
CN113783874A (zh) * 2021-09-10 2021-12-10 国网电子商务有限公司 基于安全知识图谱的网络安全态势评估方法及系统
CN113783874B (zh) * 2021-09-10 2023-08-29 国网数字科技控股有限公司 基于安全知识图谱的网络安全态势评估方法及系统
CN114186690A (zh) * 2022-02-16 2022-03-15 中国空气动力研究与发展中心计算空气动力研究所 飞行器知识图谱构建方法、装置、设备及存储介质
CN114186690B (zh) * 2022-02-16 2022-04-19 中国空气动力研究与发展中心计算空气动力研究所 飞行器知识图谱构建方法、装置、设备及存储介质
CN117034943A (zh) * 2023-10-09 2023-11-10 华南师范大学 论证提取以及关系识别方法、装置、设备以及存储介质
CN117034943B (zh) * 2023-10-09 2024-02-06 华南师范大学 论证提取以及关系识别方法、装置、设备以及存储介质
CN117972222A (zh) * 2024-04-02 2024-05-03 紫金诚征信有限公司 基于人工智能的企业信息检索方法及装置

Similar Documents

Publication Publication Date Title
CN111026941A (zh) 一种面向装备体系论证评估的智能查询方法
WO2021114745A1 (zh) 一种基于词缀感知的社交媒体命名实体识别方法
CN114064918B (zh) 一种多模态事件知识图谱构建方法
CN110968684B (zh) 一种信息处理方法、装置、设备及存储介质
CN110134946B (zh) 一种针对复杂数据的机器阅读理解方法
CN110287323B (zh) 一种面向目标的情感分类方法
CN110162749A (zh) 信息提取方法、装置、计算机设备及计算机可读存储介质
CN111858932A (zh) 基于Transformer的多重特征中英文情感分类方法及系统
CN111143553B (zh) 一种实时文本数据流的特定信息识别方法及系统
CN110765277B (zh) 一种基于知识图谱的移动端的在线设备故障诊断方法
CN112100332A (zh) 词嵌入表示学习方法及装置、文本召回方法及装置
CN116204674B (zh) 一种基于视觉概念词关联结构化建模的图像描述方法
CN109741824A (zh) 一种基于机器学习的医疗问诊方法
CN109918477A (zh) 一种基于变分自编码器的分布式检索资源库选择方法
CN116680377B (zh) 基于日志反馈的中文医学术语自适应对齐方法
CN112100413A (zh) 一种跨模态的哈希检索方法
CN116010553A (zh) 一种基于双路编码和精确匹配信号的观点检索系统
CN114020871B (zh) 基于特征融合的多模态社交媒体情感分析方法
CN114356990A (zh) 基于迁移学习的基地命名实体识别系统及方法
CN116523041A (zh) 装备领域知识图谱构建方法、检索方法、系统及电子设备
CN117235261A (zh) 一种多模态方面级情感分析方法、装置、设备及存储介质
CN116522165A (zh) 一种基于孪生结构的舆情文本匹配系统及方法
CN114611529B (zh) 意图识别方法和装置、电子设备及存储介质
CN113468311B (zh) 一种基于知识图谱的复杂问句问答方法、装置及存储介质
CN113505207B (zh) 一种金融舆情研报的机器阅读理解方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20200417

WW01 Invention patent application withdrawn after publication