CN112507083B - 一种基于调度防误领域语言的防误规则库构建方法 - Google Patents
一种基于调度防误领域语言的防误规则库构建方法 Download PDFInfo
- Publication number
- CN112507083B CN112507083B CN202011488136.3A CN202011488136A CN112507083B CN 112507083 B CN112507083 B CN 112507083B CN 202011488136 A CN202011488136 A CN 202011488136A CN 112507083 B CN112507083 B CN 112507083B
- Authority
- CN
- China
- Prior art keywords
- language
- error
- rule
- field
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 31
- 238000009411 base construction Methods 0.000 title abstract description 10
- 230000002265 prevention Effects 0.000 claims abstract description 12
- 230000011218 segmentation Effects 0.000 claims description 9
- 238000005516 engineering process Methods 0.000 claims description 7
- 238000003058 natural language processing Methods 0.000 claims description 4
- 238000012216 screening Methods 0.000 claims description 3
- 238000010276 construction Methods 0.000 claims 1
- 238000012423 maintenance Methods 0.000 abstract description 2
- 238000012795 verification Methods 0.000 abstract description 2
- 230000009286 beneficial effect Effects 0.000 description 3
- 210000001520 comb Anatomy 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/151—Transformation
- G06F40/154—Tree transformation for tree-structured or markup documents, e.g. XSLT, XSL-FO or stylesheets
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/253—Grammatical analysis; Style critique
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了一种基于调度防误领域语言的防误规则库构建方法,包括构建防误领域专业词典;基于所述防误领域专业词典中的不同对象,分别构建面向对象语义模型;创建领域专用语言;基于所述领域专用语言对自然语言所描述的规则进行语义识别,获得相应的领域语言;对领域语言所描述的规则进行解析,得到最终的规则库。本发明通过建立面向电网调度防误领域语言及规则库构建方法,可以由电网调度业务专家直接参与规则库构建,利于规则库的审核更新维护。
Description
技术领域
本发明具体涉及一种基于调度防误领域语言的防误规则库构建方法。
背景技术
电网调度是整个电网供电系统的重要组成部分,而电网调度的核心是调度防误,这是保障电网安全运行的基础。目前均是采用人工核对防误,并没有实现真正的智能防误。尤其是操作项比较多的时候核对工作量极大,这对调度员是极大的挑战,尤其是调度操作高峰期很容易导致工作积压,甚至由于核对错误引发电网安全事故。所以建立智能防误技术迫在眉睫,而防误规则库是防误技术手段的核心。
目前防误规则库构建一般采用以下方法:
1)采用基于硬编码方式构建,由编程人员基于业务专家梳理出业务规则后进行业务逻辑硬编码;
2)采用规则引擎方式,一般选用成熟规则引擎,由编程人员基于业务专家梳理出业务规则后基于规则引擎脚本进行业务逻辑编写;
以上方式均离不开编程人员与业务专家的紧密配合,其实现过程中间依赖编程人员了解业务并翻译成可执行规则程序,缺点在于1、编程人员需要理解规则增加了开发翻译调试环节,周期长;2、最终形成的规则与业务专家通过自然语言表达的业务规则表达方式不一致,对于没有编程基础的业务人员很难发现问题,存不利于阅读和审核的问题;3、利用规则引擎编写的业务规则需要一定的编程基础,不利于业务专家自行修改和增加规则。
由于业务专家不能容易看懂规则,对规则的正确性还需要不断通过实际案例进行功能测试,整个规则库构建过程费时费力。
发明内容
针对上述问题,本发明提出一种基于调度防误领域语言的防误规则库构建方法,通过建立面向电网调度防误领域语言及规则库构建方法,可以由电网调度业务专家直接参与规则库构建,利于规则库的审核更新维护。
为了实现上述技术目的,达到上述技术效果,本发明通过以下技术方案实现:
一种基于调度防误领域语言的防误规则库构建方法,包括:
构建防误领域专业词典;
基于所述防误领域专业词典中的不同对象,分别构建面向对象语义模型;
创建领域专用语言;
基于所述领域专用语言对自然语言所描述的规则进行语义识别,获得相应的领域语言;
对领域语言所描述的规则进行解析,得到最终的规则库。
可选地,所述防误领域专业词典通过以下子步骤构建:
采用Methontology方法,对电网调度规则自然语言文本进行分词分析,形成初始的词库;
基于所述初始的词库进行专用词归类,分为设备、属性、动作、状态,并对各专用词标识属性、动作、状态的上下位关系;
对表达多个表达同一意思的同义词进行筛选,保留最佳词,缩小初始的词库大小;
梳理词与词之间存在的继承关系;
梳理词与词之间存在的类与实例关系;
基于以上各个子步骤形成电力调度领域专用词库,包括防误规则中需要使用的每个单词标准词和同义词,建立对照表,形成防误领域专业词典。
可选地,所述面向对象语义模型的构建步骤包括:
以面向对象方法,基于梳理的电网防误业务模型建立对应的业务类,设计覆盖调度规则业务面向对象语言,形成面向对象语义模型。
可选地,所述领域专用语言的创建步骤包括:
提出面向调度防误领域的语言的结构,并定义语法规则,基于语法规则词法分析器和解析器用来将领域专用语言转换为抽象语法树/解析树的规则。
可选地,所述基于所述领域专用语言对自然语言所描述的规则进行语义识别,具体为:
通过自然语言处理技术,利用HANLP分词器对输入的自然语言所描述的规则进行分词,将分词结果中每个单词在所述防误领域专业词典中进行专用词查找,然后执行停用词去除、专用词替换,形成由专用词组成的语句,将结果语句保存形成相应的领域语言。
可选地,所述对领域语言所描述的规则进行解析,具体为:
利用ANTLR java语法解析器对所述领域语言进行解析,形成抽象语法树;将AST与对象语义模型进行连接,并对语义连接为条件判断的词进行组合,转换形成可执行的基于语义模型的程序脚本,通过java脚本执行器执行程序脚本,完成防误规则检查。
与现有技术相比,本发明的有益效果:
本发明利用自然语言处理技术和领域语言技术,可以直接根据用户输入的防误规则自然语言描述语句构建防误规则库,可以由领域专家直接以自然语言方式构建防误知识库,方便防误知识库的构建、修改,防误规则以自然语言呈现,方便防误规则的审核。
附图说明
为了使本发明的内容更容易被清楚地理解,下面根据具体实施例并结合附图,对本发明作进一步详细的说明,其中:
图1为本发明一种实施例的基于调度防误领域语言的防误规则库构建方法的流程示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明的保护范围。
下面结合附图对本发明的应用原理作详细的描述。
如图1所示,本发明中提供了一种基于调度防误领域语言的防误规则库构建方法,包括以下步骤:
(1)构建防误领域专业词典;
(2)基于所述防误领域专业词典中的不同对象,分别构建面向对象语义模型;
(3)创建领域专用语言;
(4)基于所述领域专用语言对自然语言所描述的规则进行语义识别,获得相应的领域语言;
(5)对领域语言所描述的规则进行解析,得到最终的规则库。
在本发明实施例的一种具体实施方式中,所述防误领域专业词典通过以下子步骤构建:
梳理电网调度规则所涉及的设备对象及属性,形成概念;
采用Methontology方法,对电网调度规则自然语言文本进行分词分析,形成初始的词库;
基于所述初始的词库进行专用词归类,分为设备、属性、动作、状态,并对各专用词标识属性、动作、状态的上下位关系;
对表达多个表达同一意思的同义词进行筛选,保留最佳词,缩小初始的词库大小;
梳理词与词之间存在的继承关系,如“设备”和“开关”,存在继承关系,“开关”继承自“设备”;梳理词之间存在的类与实例关系;
梳理词与词之间存在的类与实例关系;
基于以上各个子步骤形成电力调度领域专用词库,包括防误规则中需要使用的每个单词标准词和同义词,建立对照表,形成防误领域专业词典。
在本发明实施例的一种具体实施方式中,所述面向对象语义模型的构建步骤包括:
以面向对象方法,基于梳理的电网防误业务模型建立对应的业务类(包括对象、属性和方法),设计覆盖调度规则业务面向对象语言,形成面向对象语义模型,所述语义模型基于面向对象语言编写,其类名、方法名、属性名为英文,建立对应的中文注解,注解中文名为专用词库中的单词一致。
在本发明实施例的一种具体实施方式中,所述领域专用语言的创建步骤包括:
基于语义模型及业务表达简洁需要,提出面向调度防误领域的语言的结构,并定义该领域专用语言语法(包括该语言的词法记号和语法规则);然后利用ANTLR工具可以根据此语法生成该语言的语法解析器(Java程序,包括Lexer和侦听器,它们是Java类,用于扩展/实现ANTLR库中的某些类)。
在本发明实施例的一种具体实施方式中,所述基于所述领域专用语言对自然语言所描述的规则进行语义识别,具体为:
通过自然语言处理技术,利用HANLP分词器对输入的自然语言所描述的规则进行分词,将分词结果中每个单词在所述防误领域专业词典中进行专用词查找,然后执行停用词去除、专用词替换,形成由专用词组成的语句,将结果语句保存形成相应的领域语言。
在本发明实施例的一种具体实施方式中,所述对领域语言所描述的规则进行解析,具体为:
利用ANTLR java语法解析器对所述领域语言进行解析,形成抽象语法树(Abstract Syntax Tree,AST);将AST与对象语义模型进行连接,并对语义连接为条件判断的词进行组合,转换形成可执行的基于语义模型的程序脚本,通过java脚本执行器执行程序脚本,完成防误规则检查。
以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。
Claims (3)
1.一种基于调度防误领域语言的防误规则库构建方法,其特征在于,包括:
构建防误领域专业词典;
基于所述防误领域专业词典中的不同对象,分别构建面向对象语义模型;
创建领域专用语言;
基于所述领域专用语言对自然语言所描述的规则进行语义识别,获得相应的领域语言;
对领域语言所描述的规则进行解析,得到最终的规则库;
所述面向对象语义模型的构建步骤包括:
以面向对象方法,基于梳理的电网防误业务模型建立对应的业务类,设计覆盖调度规则业务面向对象语言,形成面向对象语义模型;
所述基于所述领域专用语言对自然语言所描述的规则进行语义识别,具体为:
通过自然语言处理技术,利用HANLP分词器对输入的自然语言所描述的规则进行分词,将分词结果中每个单词在所述防误领域专业词典中进行专用词查找,然后执行停用词去除、专用词替换,形成由专用词组成的语句,将结果语句保存形成相应的领域语言;
所述对领域语言所描述的规则进行解析,具体为:
利用ANTLR java语法解析器对所述领域语言进行解析,形成抽象语法树;将抽象语法树与对象语义模型进行连接,并对语义连接为条件判断的词进行组合,转换形成可执行的基于语义模型的程序脚本,通过java脚本执行器执行程序脚本,完成防误规则检查。
2.根据权利要求1所述的一种基于调度防误领域语言的防误规则库构建方法,其特征在于:所述防误领域专业词典通过以下子步骤构建:
采用Methontology方法,对电网调度规则自然语言文本进行分词分析,形成初始的词库;
基于所述初始的词库进行专用词归类,分为设备、属性、动作、状态,并对各专用词标识属性、动作、状态的上下位关系;
对表达多个表达同一意思的同义词进行筛选,保留最佳词,缩小初始的词库大小;
梳理词与词之间存在的继承关系;
梳理词与词之间存在的类与实例关系,形成电力调度领域专用词库,包括防误规则中需要使用的每个单词标准词和同义词,建立对照表,形成防误领域专业词典。
3.根据权利要求1所述的一种基于调度防误领域语言的防误规则库构建方法,其特征在于:所述领域专用语言的创建步骤包括:
提出面向调度防误领域的语言的结构,并定义语法规则,基于语法规则词法分析器和解析器将领域专用语言转换为抽象语法树的规则或解析树的规则。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011488136.3A CN112507083B (zh) | 2020-12-16 | 2020-12-16 | 一种基于调度防误领域语言的防误规则库构建方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011488136.3A CN112507083B (zh) | 2020-12-16 | 2020-12-16 | 一种基于调度防误领域语言的防误规则库构建方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112507083A CN112507083A (zh) | 2021-03-16 |
CN112507083B true CN112507083B (zh) | 2022-07-01 |
Family
ID=74972765
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011488136.3A Active CN112507083B (zh) | 2020-12-16 | 2020-12-16 | 一种基于调度防误领域语言的防误规则库构建方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112507083B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114090721B (zh) * | 2022-01-19 | 2022-04-22 | 支付宝(杭州)信息技术有限公司 | 基于自然语言数据进行查询、数据更新的方法及装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104462063A (zh) * | 2014-12-12 | 2015-03-25 | 武汉大学 | 基于语义位置模型的位置信息结构化提取方法及系统 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9928476B2 (en) * | 2011-08-29 | 2018-03-27 | Information Resources, Inc. | Product information management |
CN103793652A (zh) * | 2012-10-29 | 2014-05-14 | 广东电网公司信息中心 | 一种基于静态分析的应用系统代码安全扫描装置 |
CN103544345A (zh) * | 2013-10-16 | 2014-01-29 | 国家电网公司 | 操作票智能防误仿真系统 |
CN109189946B (zh) * | 2018-11-06 | 2021-11-26 | 湖南云智迅联科技发展有限公司 | 一种将设备故障语句描述转换为知识图谱表达的方法 |
CN109783802A (zh) * | 2018-12-13 | 2019-05-21 | 平安医疗健康管理股份有限公司 | 一种业务规则处理方法、服务器及计算机可读存储介质 |
CN110991188A (zh) * | 2019-09-17 | 2020-04-10 | 国网浙江省电力有限公司杭州供电公司 | 应用于配网调度智能成票系统的成票方法 |
CN111639501A (zh) * | 2020-05-04 | 2020-09-08 | 国网浙江省电力有限公司 | 基于amsl的电网业务微服务组合方法 |
-
2020
- 2020-12-16 CN CN202011488136.3A patent/CN112507083B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104462063A (zh) * | 2014-12-12 | 2015-03-25 | 武汉大学 | 基于语义位置模型的位置信息结构化提取方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN112507083A (zh) | 2021-03-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhai et al. | Automatic model generation from documentation for Java API functions | |
CN106843849B (zh) | 一种基于文档的库函数的代码模型的自动合成方法 | |
CN109753288A (zh) | 一种适用于形式化验证的智能合约编译方法 | |
Crane et al. | UML vs. classical vs. rhapsody statecharts: not all models are created equal | |
CN106951305B (zh) | 一种基于模型转换由QVT-R语言生成midCore脚本的方法 | |
CN110673854A (zh) | Sas语言编译方法、装置、设备及可读存储介质 | |
CN110991188A (zh) | 应用于配网调度智能成票系统的成票方法 | |
CN116450616A (zh) | 一种基于解析树的通用异构关系型数据库sql迁移方法 | |
Cleaveland et al. | A front-end generator for verification tools | |
CN113609838A (zh) | 文档信息抽取及图谱化方法和系统 | |
CN112507083B (zh) | 一种基于调度防误领域语言的防误规则库构建方法 | |
CN113655996A (zh) | 一种基于需求模型的企业级系统生成方法 | |
Fouque et al. | Compositional software reuse with case-based reasoning | |
CN116257245A (zh) | 一种基于flex与bison语法分析的多输出编译方法及系统 | |
CN115794119A (zh) | 一种案例自动解析方法及装置 | |
CN112905232B (zh) | 一种基于语法分析树的程序代码平行语料挖掘方法及系统 | |
CN115935943A (zh) | 一种支持自然语言结构计算的分析框架 | |
CN112445492A (zh) | 一种基于antlr4的源码翻译方法 | |
CN110928535A (zh) | 衍生变量部署方法、装置、设备及可读存储介质 | |
Grigorev et al. | String-embedded language support in integrated development environment | |
Verdejo | Building tools for LOTOS symbolic semantics in Maude | |
CN116719514B (zh) | 一种基于bert的rpa代码自动生成方法及装置 | |
CN113128202B (zh) | 一种面向物联网服务的智能编排方法和装置 | |
Wallis et al. | Syntactic parsing as a knowledge acquisition problem | |
Amarasingha et al. | PseudoJ: A Pseudo-code interpreter for transforming Pseudo-code into JAVA |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |