CN108416124A

CN108416124A - 一种基于谓词逻辑的规范重构表示方法

Info

Publication number: CN108416124A
Application number: CN201810149481.0A
Authority: CN
Inventors: 赵钦; 赵雅倩; 余梁蜀; 黑新宏; 朱磊; 杨明松; 刘尧尧; 李亚杰
Original assignee: Xian University of Technology
Current assignee: Xian University of Technology
Priority date: 2018-02-13
Filing date: 2018-02-13
Publication date: 2018-08-17
Anticipated expiration: 2038-02-13
Also published as: CN108416124B

Abstract

本发明公开了一种基于谓词逻辑的规范重构表示方法，具体包括如下步骤：步骤1，将规范条目分割为多个子句；步骤2，对步骤1得到的子句进行归一化处理；步骤3，对经步骤2处理后的子句成分进行符号化处理，并将处理后的结果存入计算机中。本发明能够将中文建筑规范条目进行数字化表达，解决了目前设计规范的计算机存储及识别问题。

Description

一种基于谓词逻辑的规范重构表示方法

技术领域

本发明属于建筑规范智能化处理技术领域，涉及一种基于谓词逻辑的规范重构表示方法。

背景技术

在信息技术的出现不断推动着行业信息化，随着计算机科学技术的不断发展，行业领域知识不能仅仅以文本的形式出现，将其处理成计算机可识别的形式是行业领域知识智能化发展的前提。而在地铁综合管线的设计上，规范条文是一项非常重要的约束，涉及到公共交通和人身的安全，稍有不慎，会酿成重大事故。设计人员在设计时除了会对地铁设计规范进行参考，也要对建筑方面的规范进行参考；地下管线图纸审查时，要通过规范条文核对管线设计。而一张地下管线的图纸涉及到的规范条文是很难全部审查到位的。而现行规范条文通常是以文本的形式流通，计算机很难识别。

国外对于规范的智能化处理已经相对成熟，已经将其应用于多方面领域，如设计审查、施工进度审查等，但其大部分方法都不能应用于中文的设计规范。在规范条文智能化处理的进程中，建立一套中文规范智能化处理的方法是当下研究的重点。中文规范中，尤其是地铁设计规范，由于编写者众多，具有非结构化、文本形式复杂和数量巨大等特点。计算机现阶段只能识别结构化文本和人工处理过的文本，对于规范的识别还需人工处理，且处理过的文本须形式统一，计算机可识别。

发明内容

本发明的目的是提供一种基于谓词逻辑的规范重构表示方法，能够将中文建筑规范条目进行数字化表达，解决了目前设计规范的计算机存储及识别问题。

本发明所采用的技术方案是，一种基于谓词逻辑的规范重构表示方法，具体包括如下步骤：

步骤1，将规范条目分割为多个子句；

步骤2，对步骤1得到的子句进行归一化处理；

步骤3，对经步骤2处理后的子句成分进行符号化处理，并将处理后的结果存入计算机中。

本发明的特点还在于，

步骤1的具体过程如下：

步骤1.1，取出一条规范，先根据句中的逗号、分号和句号将句子断句，将该条规范表示为包含多个短句的短句集，并对断句后缺失主语的短句进行主语补充，并对每个短句进行编号；

步骤1.2，对步骤1.1所得短句中个体词数大于1个的主语或宾语进行子句抽取和谓语补充；

步骤1.3，对经步骤1.2处理后的每个子句进行编号，并提取子句的主语和宾语作为前置个体集和后置个体集。

其中步骤1.2的具体过程为：

若主语或宾语由2个及2以上的个体词构成，判断各个体词之间是平行关系、从所属关系、属性关系或关联关系；

若各个体词之间为从所属关系、属性关系、关联关系，应将主语或宾语提取出来作为单独的子句，并根据其语义为其添加谓语。

步骤2的具体过程如下：

步骤2.1：对子句中的谓语进行抽取，其中有否定含义谓语的，将其转化为肯定含义，组成谓语集合；

步骤2.2，将步骤2.1所得的谓语集合中的词项通过语义判断进行分类排序，将表达一类意思的词组成类别谓语集合；

步骤2.3，对步骤2.2所得的类别谓语集合进行聚类，即将一类词用一个词语表达出来作为集合名。

步骤3的具体过程如下：

步骤3.1，将步骤2.2中的类别谓语集合的集合名称作为谓词，修饰性谓语化为一元谓词，表示为根据关系谓语性质，将关系谓语化为二元谓词和多元谓词，二元谓词表示为多元谓词表示为其中P是集合名称；x_i是谓词变元，i为正整数，x_i取值为前置个体集和后置个体集；n为类别谓语集合下标，下标数字对应集合中的同义谓语词；m为程度词集合下标，

步骤3.2，对步骤3.1中的谓词进行量化及符号表示，将短句中的全称量词存在量词和存在唯一量词提取出来并提前，表示为和

步骤3.3，使用联结词将步骤3.2量化后的谓词连接起来组成合式谓词公式，根据量词和句意使用联结词，其中全称量词后跟条件式，存在量词后跟合取式；

步骤3.4，根据谓词逻辑等价公式和量词否定等值式求步骤3.3所得的合式谓词公式的前束范式，使得规范条目逻辑表达格式统一；

步骤3.5，根据步骤3.4统一后的规范条目逻辑表达式，列出谓词变元的取值集合，以条目编号为标记，最终可以存入计算机中。

本发明的有益效果是，本发明提供的一种基于谓词逻辑的规范重构表示方法，通过将规范条目进行分割成多个子句，并对分割后的子句中有缺失成分的进行补充，再对子句进行归一化处理，再将子句经符号化处理后，最终输出由多个谓词逻辑组成的条目规范逻辑集合，最终可以存入计算机中，本发明能够将中文建筑规范条目进行数字化表达。解决了目前设计规范的计算机存储及识别问题。

具体实施方式

下面结合具体实施方式对本发明进行详细说明。

本发明一种基于谓词逻辑的规范重构表示方法，具体包括如下步骤：

步骤1，将规范条目分割为多个子句；最终分割为多个子句组成的形式，每个子句应由单个个体或平行关系个体组成的主语或宾语和一个谓语组成。

步骤1的具体过程如下：

其中步骤1.2的具体过程为：

若主语或宾语由2个及2以上的个体词构成，判断各个体词之间是平行关系(个体词之间无关联)、从所属关系、属性关系或关联关系；

若各个体词之间为从所属关系、属性关系、关联关系，应将主语或宾语提取出来作为单独的子句，并根据其语义为其添加谓语(如AttributeOf、SubClassOf、UserOf等)。

从子句中提取关键个体词作为父级短句的主语或宾语个体词，并列为子句。

步骤2，对步骤1得到的子句进行归一化处理；

步骤2的具体过程如下：

步骤2.1，对子句中的谓语进行抽取，其中有否定含义谓语的，将其转化为肯定含义，组成谓语集合；谓语通常与程度词(应、宜等)连接，将规范中的程度词提取出来组成程度词集合，集合内按程度从小到大排序。

步骤3的具体过程如下：

步骤3.4：根据谓词逻辑等价公式和量词否定等值式求步骤3.3所得的合式谓词公式的前束范式，使得规范条目逻辑表达格式统一；

以《GB 50157-2013地铁设计规范》第13章通风、空调与供暖中第13.2.47条规范为例。

13.2.47地下车站的出入口通道和长通道的连续长度大于60m时，应采取通风或其他降温措施。

步骤1，将13.2.47的规范条目分割成多个子句，具体步骤如下：

对该条目规范进行断句，以逗号为分割点，该条目被分为2个短句，对其进行编号，分别为13.2.47.1和13.2.47.2。对2个短句进行成分补充。短句13.2.47.1：地下车站的出入口通道和长通道的连续长度大于60m；短句13.2.47.2：地下车站的出入口通道和长通道应采取通风或其他降温措施；

对短句中的个体词进行判别，根据语义，短句集中存在从所属关系和属性关系，为短句集主语部分补充谓语SubClassOf、AttributeOf。以短句13.2.47.1为例，短句13.2.47.1中有两个子句，分别为13.2.47.1.1(出入口通道、长通道+SubClassOf+地下车站)；13.2.47.1.2(连续长度+AttributeOf+出入口通道、长通道)；13.2.47.1.3(连续长度+大于+60m)；

对子句进行编号，列出每个子句的前后置个体集，以短句13.2.47.2为例，其子句有两个，编号分别为13.2.47.2.1和13.2.47.2.2，其中子句13.2.47.2.2的后置个体集为：降温措施{1.通风；2.其他}；

步骤2，对步骤1得到的子句进行归一化处理；

抽取短句及其子句中的谓语“大于”、“采取”、SubClassOf、AttributeOf，置于谓语集中，程度词“应”为程度词集中下标为2的程度词；

针对本实施例中《GB 50157-2013地铁设计规范》的第13.2.47条规范，大于是谓语集合Exceed中的词项，下标为1；采取是谓语集合Use中的词项，下标为2；SubClassOf、AttributeOf同集合名，且集合中只有本身。

步骤3，将规范条目中的成分进行符号化处理，并将处理后的结果存入计算机中，步骤3的具体过程如下：

短句1中的子句1表示为：SubClassOf₁ ⁰(x，y)；子句2：AttributeOf₁ ⁰(x，y)；短句1：短句2：(谓词上标为0表示无程度词)。添加量词，以子句1为例：其中x为SubClassOf的前置个体集{出入口通道、长通道}，y为后置个体集{地下车站}。

合式谓词公式为：

统一规范条目逻辑表达式：

上述前束范式中，x是{1.出入口通道2.长通道}，y是{地下通道}，z是{连续长度}，n是{60m}，t是降温措施{1.通风2.其他}，以条目编号13.2.47为标记，存入Excel中。

Claims

1.一种基于谓词逻辑的规范重构表示方法，其特征在于：具体包括如下步骤：

步骤1，将规范条目分割为多个子句；

步骤2，对步骤1得到的子句进行归一化处理；

2.根据权利要求1所述的一种基于谓词逻辑的规范重构表示方法，其特征在于：所述步骤1的具体过程如下：

3.根据权利要求2所述的一种基于谓词逻辑的规范重构表示方法，其特征在于：所述步骤1.2的具体过程为：

4.根据权利要求2所述的一种基于谓词逻辑的规范重构表示方法，其特征在于：所述步骤2的具体过程如下：

步骤2.1，对子句中的谓语进行抽取，其中有否定含义谓语的，将其转化为肯定含义，组成谓语集合；

5.根据权利要求4所述的一种基于谓词逻辑的规范重构表示方法，其特征在于：所述步骤3的具体过程如下：