CN111985232B - 基于nlp的机载显控系统需求的领域模型提取方法 - Google Patents

基于nlp的机载显控系统需求的领域模型提取方法 Download PDF

Info

Publication number
CN111985232B
CN111985232B CN202010793887.XA CN202010793887A CN111985232B CN 111985232 B CN111985232 B CN 111985232B CN 202010793887 A CN202010793887 A CN 202010793887A CN 111985232 B CN111985232 B CN 111985232B
Authority
CN
China
Prior art keywords
dependency
requirement
control system
display control
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010793887.XA
Other languages
English (en)
Other versions
CN111985232A (zh
Inventor
王立松
于梦元
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Aeronautics and Astronautics
Original Assignee
Nanjing University of Aeronautics and Astronautics
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Aeronautics and Astronautics filed Critical Nanjing University of Aeronautics and Astronautics
Priority to CN202010793887.XA priority Critical patent/CN111985232B/zh
Publication of CN111985232A publication Critical patent/CN111985232A/zh
Application granted granted Critical
Publication of CN111985232B publication Critical patent/CN111985232B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/253Grammatical analysis; Style critique
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种基于NLP的机载显控系统需求的领域模型提取方法,包括:S1,对输入的需求文本进行预处理;S2,分析提取需求文本中的依赖关系以及共指解析关系;S3,结合动词短语和名词短语组成的集合、依赖项解析的结果和共指解析的结果,将单词的依赖关系提升至语义单元依赖,触发规则构建领域模型;S4,可视化步骤S3中构建的领域模型。本发明结合已有模型提取规则,对机载显控系统需求进行领域模型提取,并通过实验论证了这些规则在机载显控系统需求领域模型提取方面的有效性,具有相关性较高、应用前景好等优势。

Description

基于NLP的机载显控系统需求的领域模型提取方法
技术领域
本发明涉及机载显控系统需求处理技术领域,具体而言涉及一种基于NLP的机载显控系统需求的领域模型提取方法。
背景技术
随着航电系统的规模不断增大,复杂性也急剧增加,因此对整个航电系统的可靠性、实时性、交互性设计要求也越高。显示与控制系统(简称显控系统)作为现代飞机综合航空电子系统的核心部分,是所有电子装备的上层管理与处理软件。其中机载显控系统需求的复杂化也就意味着需求工程师将无法快速获取和准确表达这些需求,如果没有任何提示和指导,需求工程师不可能立即给出正确且完整的需求描述,所以建立领域用户与系统开发人员之间的桥梁就成为需求工程领域的一个研究重点。
而已有的软件工程的文献中多是通用的领域模型提取方法,缺乏对机载显控系统需求领域模型提取的实证研究。
发明内容
本发明针对现有技术中的不足,提供一种基于NLP的机载显控系统需求的领域模型提取方法,以单条带有“SHALL”声明、以英文句号结束的需求文本作为输入,以可视化领域模型图作为输出,其中领域模型图以实体关系表示。本发明通过结合已有模型提取规则,对机载显控系统需求进行领域模型提取,并通过实验论证了这些规则在机载显控系统需求领域模型提取方面的有效性,具有相关性较高、应用前景好等优势。
为实现上述目的,本发明采用以下技术方案:
一种基于NLP的机载显控系统需求的领域模型提取方法,所述领域模型提取方法包括以下步骤:
S1,对输入的需求文本进行预处理;
S2,分析提取需求文本中的依赖关系以及共指解析关系;
S3,结合动词短语和名词短语组成的集合、依赖项解析的结果和共指解析的结果,将单词的依赖关系提升至语义单元依赖,触发规则构建领域模型;
S4,可视化步骤S3中构建的领域模型。
为优化上述技术方案,采取的具体措施还包括:
进一步地,步骤S1中,所述需求文本是指以单条带有“SHALL”声明、以英文句号结束的输入文本。
进一步地,步骤S1中,所述对输入的需求文本进行预处理包括以下步骤:
S11,对需求所包含的和DOT脚本文件的语法产生冲突的符号进行处理;
S12,对需求中使用序号+AND/OR的方式来表示并列关系的语句进行处理。
进一步地,步骤S2中,所述分析提取需求文本中的依赖关系以及共指解析关系的过程包括以下步骤:
提取预处理后的需求文本中的自然语言需求,对其依次进行分词、分句、词性标注、命名实体识别、分析短语结构和依赖和共指解析处理,得到源词和目标词之间的依赖关系,所述依赖关系以三元组形式标识。
进一步地,所述依赖关系包括结构解析树和依赖类型。
进一步地,步骤S2中,采用二次开发的GATE工作台对自然语言需求进行处理:
依次引入ANNIE English Tokeniser组件进行分词、ANNIE Sentence Spliter组件进行分句、Stanford POS Tagger组件进行词性标注、Stanford NER组件进行命名实体识别、ANNIE VP Chunker组件进行动词组块分析、Noun Phrase Chunker组件进行名词组块分析、Stanford Parser组件进行句法分析。
进一步地,步骤S3中,所述结合动词短语和名词短语组成的集合、依赖项解析的结果和共指解析的结果,将单词的依赖关系提升至语义单元依赖的过程包括以下步骤:
S31,将需求语句S中的所有动词短语和名词短语组成集合P,需求语句S中的依存关系分析结果组成集合DWord,需求语句S中的共指解析结果组成集合R;用集合DSem表示输出需求语句S中的语义单元依赖;
S32,初始化集合DSem,将共指解析的结果集合R赋值给DSem,定义临时变量psource和ptarget用于存放可能是依赖项的源词或目标词;
S33,针对每个单词的依赖项,识别P中依赖项的源和目标所属的元素,如果源词或目标词落在P中元素的边界之外,则该单词被视为P的成员,以将动词短语链接到其状语从句修饰符,并且补偿部分短语结构解析器所犯的错误;
其中,除了形容词修饰符依赖关系外,相同名词短语组成词之间的依赖关系被忽略。
进一步地,步骤S33中,所述S33,针对每个单词的依赖项,识别P中依赖项的源和目标所属的元素,如果源词或目标词落在P中元素的边界之外,则该单词被视为P的成员的过程包括以下步骤:
S331,依次遍历集合DWord,设当前遍历到的元素为dep:
如果存在p∈P且p属于dep.source,则将p赋值给psource,否则将dep.source赋值给psource;
如果存在p∈P且p属于dep.target,则将p赋值给ptarget,否则将dep.target赋值给ptarget;
如果psource≠ptarget,则将(ptarget,dep.type,psource)作为一个新的依赖关系加入集合DSem中,否则如果dep.type是amod类型,则将该dep作为一个新的依赖关系加入集合DSem中;
S332,重复循环步骤S331,直至集合DWord的所有元素遍历完成。
进一步地,步骤S4中,采用GVEdit工具对提取出的领域模型做可视化处理,以DOT语言为结果输出形式。
本发明的有益效果是:
(1)本发明通过对输入的需求文本依次进行文本预处理和语义依赖关系提升,结合已有模型提取规则,对机载显控系统需求进行领域模型提取,并通过实验论证了这些规则在机载显控系统需求领域模型提取方面的有效性,具有相关性较高、应用前景好等优势。
(2)本发明能够直接以传统的单条带有“SHALL”声明、以英文句号结束的需求文本作为输入,以可视化领域模型图作为输出,其中领域模型图以实体关系表示,具有适用性强,输出结果直观等优点。
(3)结合领域模型提取需求和最终的可视化处理需求,对需求文本进行对应的文本预处理和语义依赖关系提升,提高领域模型提取成功率和最终的相关性。
附图说明
图1是本发明的基于NLP的机载显控系统需求的领域模型提取方法流程图。
图2为需求文本解析管道图。
图3为将依赖关系提升至语义单元示意图。
图4为已有模型提取方法的规则示意图。
图5为GATE工作台示意图。
图6为用于可视化文件以及可视化结果示意图。
图7为提取出的模型与领域相关以及不相关示意图。
具体实施方式
现在结合附图对本发明作进一步详细的说明。
需要注意的是,发明中所引用的如“上”、“下”、“左”、“右”、“前”、“后”等的用语,亦仅为便于叙述的明了,而非用以限定本发明可实施的范围,其相对关系的改变或调整,在无实质变更技术内容下,当亦视为本发明可实施的范畴。
结合图1,本发明提及一种基于NLP的机载显控系统需求的领域模型提取方法,所述领域模型提取方法包括以下步骤:
S1,对输入的需求文本进行预处理。
S2,分析提取需求文本中的依赖关系以及共指解析关系。
S3,结合动词短语和名词短语组成的集合、依赖项解析的结果和共指解析的结果,将单词的依赖关系提升至语义单元依赖,触发规则构建领域模型。
S4,可视化步骤S3中构建的领域模型。
本发明所涉及的领域模型提取方法主要包括对机载显控系统需求的数据预处理、领域模型提取和模型可视化处理等方面,是以单条带有“SHALL”声明、以英文句号结束的需求文本作为输入,以可视化领域模型图作为输出,其中领域模型图以实体关系表示。
步骤一、对输入的需求文本进行预处理
原始的机载显控系统需求中会有两种因素影响提取出的领域模型的相关性,一是需求中的一些符号例如“”、|、()等会和DOT脚本文件的语法冲突,导致可视化模型时软件报错;二是需求中使用序号+AND/OR的方式来表示并列关系的方式会导致提取的关系不准确。基于以上两个原因,我们需要对初始机载显控需求进行数据清洗,例如,对包括特殊符号的需求语句进行格式转换等操作,特殊符号包括但不限于“|”、“()”、“[]”等,如ipFDASAlertBuffer[cas_[L|R]EngLOTC]这些单词。
本发明可以直接采用机载显控系统的需求,后续的实验验证所需数据也可以来源于机载显控系统需求文档。需求文档是带有SHALL声明的不受需求模板限制的英文语句的集合,每条需求语句以英文句号“.”结束。
步骤二、分析提取需求文本中的依赖关系以及共指解析关系
结合图2,步骤S2中,所述分析提取需求文本中的依赖关系以及共指解析关系的过程包括以下步骤:
提取预处理后的需求文本中的自然语言需求,对其依次进行分词、分句、词性标注、命名实体识别、分析短语结构和依赖和共指解析处理,计算机程序提取出的是例如(source,type,target)的三元组形式来标识源词和目标词之间的依赖关系,此依赖关系将作为最终领域模型的候选关系。优选的,所述依赖关系包括结构解析树和依赖类型。
所述的分词、分句、命名实体识别、句法分析等过程可以基于GATE工作台进行分析,通过程序对GATE工作台进行二次开发,分析组件依次使用ANNIE English Tokeniser进行分词、ANNIE Sentence Spliter进行分句、Stanford POS Tagger进行词性标注、Stanford NER进行命名实体识别、ANNIE VP Chunker进行动词组块分析、Noun PhraseChunker进行名词组块分析、Stanford Parser进行句法分析。
如图5所示,本方法是基于GATE工作台的二次开发,需要通过在GATE中引用Stanford Parser等组件来达到图2中解析管道所提到的功能。
步骤三、将单词的依赖关系提升至语义单元依赖,触发规则构建领域模型
步骤三以一条需求语句的动名词短语、依存关系、共指解析结果组成的集合分别作为输入,以该需求语句的语义单元依赖组成的集合作为输出。例如,将由原子NP和VB组成的集合P、依赖项解析和共指解析的结果作为输入,将需求语句中的语义单元结果作为整个算法的输出(即语义单元相关性)。从而可以将VB链接到其状语从句修饰符;以及补偿部分短语结构解析器所犯的错误,避免因这些错误降低了词组检测中的准确率。
结合图3,步骤S3中,所述结合动词短语和名词短语组成的集合、依赖项解析的结果和共指解析的结果,将单词的依赖关系提升至语义单元依赖的过程包括以下步骤:
S31,将需求语句S中的所有动词短语和名词短语组成集合P,需求语句S中的依存关系分析结果组成集合DWord,需求语句S中的共指解析结果组成集合R;用集合DSem表示输出需求语句S中的语义单元依赖。
S32,初始化集合DSem,将共指解析的结果集合R赋值给DSem,定义临时变量psource和ptarget用于存放可能是依赖项的源词或目标词。
S33,针对每个单词的依赖项,识别P中依赖项的源和目标所属的元素,如果源词或目标词落在P中元素的边界之外,则该单词被视为P的成员,以将动词短语链接到其状语从句修饰符,并且补偿部分短语结构解析器所犯的错误。
其中,除了形容词修饰符依赖关系外,相同名词短语组成词之间的依赖关系被忽略。
开始将集合Dsem初始化,并且定义临时变量psource、ptarget用于存放可能是依赖项的源词或目标词。接下来,针对每个单词的依赖项,识别P中依赖项的源和目标所属的元素(L.3-8)。如果源词或目标词落在P中元素的边界之外,则这些词本身将被视为P的成员(L.5,8),此行为有两个目的:将VB链接到其状语从句修饰符;以及补偿部分短语结构解析器所犯的错误,因为这些错误降低了词组检测中的准确率。除了表1规则D3所使用的形容词修饰符(amod)依赖关系(L.11-12)外,相同NP组成词之间的依赖关系被忽略(L.9)。
本发明需要提取领域概念、关联、概括、基数和属性作为领域模型中的元素,在提取这些元素时会用到总结的已有软件工程文献中的领域模型提取规则。如图4所示,该图中列出了现有软件工程文献中的领域模型提取规则,包括对领域概念、基数、属性、关联的提取规则定义。
步骤四、可视化步骤S3中构建的领域模型
实验程序最终会提取关联、聚合、概括以及将属性链接到概念,经过这些步骤后程序会得出领域模型,领域模型是通过将结果输出为DOT语言并以GVEdit工具可视化。DOT语言是一种文本图形描述语言。它提供了一种简单的描述图形的方法,并且可以为人类和计算机程序所理解。同时,本发明使用GVEdit工具对提取出的领域模型做可视化。用于可视化的DOT文件是经过上述步骤处理后最终由程序生成的无语法错误且可执行的文件,这类文件方可被GVEdit工具正确可视化。
如图6所示,对需求经过上述处理之后,程序将结果以DOT文件语法输出,通过开源工具GVEdit工具进行可视化,可以得出图6右侧中以实体关系表示的领域模型。
实验验证
实验案例研究的是机载显控系统的需求,数据来源于机载显控系统需求文档。需求文档是带有SHALL声明的不受需求模板限制的英文语句的集合,每条需求语句以英文句号“.”结束。用于实验的需求语句有105条。本文的实验以分析得到的模型与领域相关、部分相关、不相关作为判断依据,实验最终得出部分相关的原因是提取N的关系或者概念有缺失即不完整,而与领域不相关的原因在于提取出的关系或概念是有错误的。
如图7所示,对提取出的模型结果图,我们将其分为相关和不相关(部分相关不做具体描述)。图中列出了与领域相关、不相关的两种情况。需求R4是提取出的模型与领域不相关的一个例子,通过下图可以发现需求R4中的“OR”所连接的两个条件只提取出了一个关系即“ipDMILLayoutNormal is Invalid”,而条件“ipDMILayoutNormal=FALSE”被丢失,这种情况将被认定为提取出的领域模型是不正确的;需求R5提取出的模型是与领域相关的,可以从提取出的UML类图中可以看出程序正确提取出了主语“Dispay”和宾语“gauge”的关系是“display”,“when”包含的两个条件被正确表示出来:ipFADECEngineThrust[L|R]的属性是valid,ipFDASAlertBuffer的属性是valid。
最终可以得出表1中关于领域模型提取是否相关的实验结果,用于实验的需求语句条数为105条,提取出模型与领域相关的有57条,占总数的54.29%;提取出模型与领域部分相关的有43条,占总数的40.95%;提取出模型与领域不相关的有5条,占总数的4.76%。
表1实验结果
以上仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,应视为本发明的保护范围。

Claims (7)

1.一种基于 NLP的机载显控系统需求的领域模型提取方法,其特征在于,所述领域模型提取方法包括以下步骤:
S1,对输入的需求文本进行预处理;
S2,分析提取需求文本中的依赖关系以及共指解析关系;
S3,结合动词短语和名词短语组成的集合、依赖项解析的结果和共指解析的结果,将单词的依赖关系提升至语义单元依赖,触发规则构建领域模型;
S31,将需求语句S中的所有动词短语和名词短语组成集合P,需求语句S中的依存关系分析结果组成集合DWord,需求语句S中的共指解析结果组成集合R;用集合DSem表示输出需求语句S中的语义单元依赖;
S32,初始化集合DSem,将共指解析的结果集合R赋值给DSem,定义临时变量psource和ptarget用于存放可能是依赖项的源词或目标词;
S33,针对每个单词的依赖项,识别P中依赖项的源和目标所属的元素,如果源词或目标词落在P中元素的边界之外,则该单词被视为P的成员,以将动词短语链接到其状语从句修饰符,并且补偿部分短语结构解析器所犯的错误;其中,除了形容词修饰符依赖关系外,相同名词短语组成词之间的依赖关系被忽略;
S331,依次遍历集合DWord,设当前遍历到的元素为dep:
如果存在p∈P且p属于dep.source,则将p赋值给psource,否则将dep.source赋值给psource;
如果存在p∈P且p属于dep.target,则将p赋值给ptarget,否则将dep.target赋值给ptarget;
如果psource≠ptarget,则将(ptarget,dep.type,psource)作为一个新的依赖关系加入集合DSem中,否则如果dep.type是amod类型,则将该dep作为一个新的依赖关系加入集合DSem中;
S332,重复循环步骤S331,直至集合DWord的所有元素遍历完成;
S4,可视化步骤S3中构建的领域模型。
2.根据权利要求1所述的基于 NLP的机载显控系统需求的领域模型提取方法,其特征在于,步骤S1中,所述需求文本是指以单条带有“SHALL”声明、以英文句号结束的输入文本。
3.根据权利要求1所述的基于 NLP的机载显控系统需求的领域模型提取方法,其特征在于,步骤S1中,所述对输入的需求文本进行预处理包括以下步骤:
S11,对需求所包含的和DOT脚本文件的语法产生冲突的符号进行处理;
S12,对需求中使用序号+AND/OR的方式来表示并列关系的语句进行处理。
4.根据权利要求1所述的基于 NLP的机载显控系统需求的领域模型提取方法,其特征在于,步骤S2中,所述分析提取需求文本中的依赖关系以及共指解析关系的过程包括以下步骤:
提取预处理后的需求文本中的自然语言需求,对其依次进行分词、分句、词性标注、命名实体识别、分析短语结构和依赖和共指解析处理,得到源词和目标词之间的依赖关系,所述依赖关系以三元组形式标识。
5.根据权利要求4所述的基于 NLP的机载显控系统需求的领域模型提取方法,其特征在于,所述依赖关系包括结构解析树和依赖类型。
6.根据权利要求4所述的基于 NLP的机载显控系统需求的领域模型提取方法,其特征在于,步骤S2中,采用二次开发的GATE工作台对自然语言需求进行处理:
依次引入ANNIE English Tokeniser组件进行分词、ANNIE Sentence Spliter组件进行分句、Stanford POS Tagger组件进行词性标注、Stanford NER组件进行命名实体识别、ANNIE VP Chunker组件进行动词组块分析、Noun Phrase Chunker组件进行名词组块分析、Stanford Parser组件进行句法分析。
7.根据权利要求1所述的基于 NLP的机载显控系统需求的领域模型提取方法,其特征在于,步骤S4中,采用GVEdit工具对提取出的领域模型做可视化处理,以DOT语言为结果输出形式。
CN202010793887.XA 2020-08-10 2020-08-10 基于nlp的机载显控系统需求的领域模型提取方法 Active CN111985232B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010793887.XA CN111985232B (zh) 2020-08-10 2020-08-10 基于nlp的机载显控系统需求的领域模型提取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010793887.XA CN111985232B (zh) 2020-08-10 2020-08-10 基于nlp的机载显控系统需求的领域模型提取方法

Publications (2)

Publication Number Publication Date
CN111985232A CN111985232A (zh) 2020-11-24
CN111985232B true CN111985232B (zh) 2024-04-19

Family

ID=73446159

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010793887.XA Active CN111985232B (zh) 2020-08-10 2020-08-10 基于nlp的机载显控系统需求的领域模型提取方法

Country Status (1)

Country Link
CN (1) CN111985232B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113946634B (zh) * 2021-12-20 2022-03-11 昆仑智汇数据科技(北京)有限公司 一种业务数据的领域模型的处理方法、装置及设备
CN115469860B (zh) * 2022-10-28 2023-02-17 山东大学 基于指令集的需求到软件领域模型的自动生成方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20130099327A (ko) * 2012-02-29 2013-09-06 한국전자통신연구원 오픈 도메인 정보 추출 장치 및 방법
CN107957991A (zh) * 2017-12-05 2018-04-24 湖南星汉数智科技有限公司 一种基于句法依赖的实体属性信息抽取方法及装置
WO2018227995A1 (zh) * 2017-06-16 2018-12-20 平安科技(深圳)有限公司 基于句法依存关系提取中心词的方法、终端、设备及存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20130099327A (ko) * 2012-02-29 2013-09-06 한국전자통신연구원 오픈 도메인 정보 추출 장치 및 방법
WO2018227995A1 (zh) * 2017-06-16 2018-12-20 平安科技(深圳)有限公司 基于句法依存关系提取中心词的方法、终端、设备及存储介质
CN107957991A (zh) * 2017-12-05 2018-04-24 湖南星汉数智科技有限公司 一种基于句法依赖的实体属性信息抽取方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
一种基于依存文法的需求文本策略依赖关系抽取方法;李天颍;刘;赵德旺;曹原;;计算机学报;20130115(01);全文 *

Also Published As

Publication number Publication date
CN111985232A (zh) 2020-11-24

Similar Documents

Publication Publication Date Title
Chen et al. Extracting noun phrases from large-scale texts: A hybrid approach and its automatic evaluation
CN103493041B (zh) 使用浅层句法分析器自动评估句子的自动句子评估装置及其错误检测设备和方法
CN107832229A (zh) 一种基于nlp的系统测试用例自动生成方法
CN111985232B (zh) 基于nlp的机载显控系统需求的领域模型提取方法
Kammoun et al. The MORPH2 new version: A robust morphological analyzer for Arabic texts
Umber et al. NL-based automated software requirements elicitation and specification
US20120078950A1 (en) Techniques for Extracting Unstructured Data
Glass et al. A naive salience-based method for speaker identification in fiction books
Keszocze et al. Chatbot-based assertion generation from natural language specifications
Xue et al. Improved correction detection in revised ESL sentences
CN117194258A (zh) 一种代码大模型的评测方法和装置
Naskar et al. A framework for diagnostic evaluation of mt based on linguistic checkpoints
CN116934278A (zh) 一种建筑施工方案审核方法与装置
Osman et al. Generate use case from the requirements written in a natural language using machine learning
Munk et al. Detecting errors in machine translation using residuals and metrics of automatic evaluation
Kothari Processing natural language requirement to extract basic elements of a class
Li et al. Chinese spelling check based on neural machine translation
Ochodek et al. Automatic transactions identification in use cases
Mengyuan et al. Automatic generation method of airborne display and control system requirement domain model based on NLP
CN116360794A (zh) 数据库语言解析方法、装置、计算机设备及存储介质
Al-Ghamdi et al. A dependency treebank for classical Arabic poetry
CN112099764B (zh) 基于形式化转换规则的航电领域需求的规范化方法
He et al. [Retracted] Application of Grammar Error Detection Method for English Composition Based on Machine Learning
Darģis et al. The use of text alignment in semi-automatic error analysis: use case in the development of the corpus of the Latvian language learners
CN102955842A (zh) 一种多特征融合识别中文机构名的控制方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant