CN107545034A

CN107545034A - 一种地方志知识融合方法

Info

Publication number: CN107545034A
Application number: CN201710608341.0A
Authority: CN
Inventors: 黄涛; 张�浩; 杨华利; 张晨晨; 张慧芳; 熊慧敏
Original assignee: Huazhong Normal University
Current assignee: Huazhong Normal University
Priority date: 2017-07-24
Filing date: 2017-07-24
Publication date: 2018-01-05

Abstract

本发明属于地方志数字化技术领域，提供一种地方志知识融合方法,包括(1)建立地方志本体库。根据地方志特征进行分类，为每个类别建立本体库，包括地名本体库、人物本体库、事件本体库、景观本体库等。(2)知识模糊化，将输入的精确量转化成模糊量。(3)知识模糊推理，用模糊量去适配融合规则得到融合量。(4)知识清晰化，将融合量变换为实际用于相似度判断的清晰量。(5)知识可视化。运用可视化工具对融合结果进行布局、颜色调整、大小设定，为用户提供一个可视化知识界面。本发明方法融合效率较高，结果更可靠。

Description

一种地方志知识融合方法

技术领域

本发明属于地方志数字化技术领域，具体地说涉及一种地方志知识融合方法。

背景技术

地方志蕴含丰富的史料,且对科学研究和工农业生产具有极高的参证价值。然而,地方志中所含的史料又十分庞杂，传统的方志知识库内部各库之间没有建立起统一的关系，而是孤立地存在，知识结构都是杂乱无章的，可能存在冗余，不一致，重复和隐藏的知识，难以利用。由于该结构中,知识的表示方法、存储方式和管理模式都是相对固定的,所以知识本身的扩展性受到很大限制,不同知识库之间协同工作的可能性也相当低，不能很好的体现信息之间的交互。随着网络应用的增加和服务质量的提高,地方志知识融合越来越重要,有必要对这些信息进行提取，形成知识，再对知识进行转换和整合，形成新知识，实现知识的自主学习推理，从而在多个知识库之间可以通过某种方式进行协同工作和深层次的知识发现，在现有的知识基础上产生新的知识,实现知识的自动扩充和维护，使地方志知识库的管理变得高效便捷。

传统的知识融合主要基于D-S证据理论，通过提取不同观测结果决策的信任函数，并根据证据组合规则将不同观测的信任函数相融合，最后根据一定的规则对组合后的信任函数进行判断，实现知识融合。

该方法主要应用在工业控制领域，直接运用在地方志的知识融合上有很多问题。首先，由于地方志知识库庞杂，其运算量随知识源数的增加而呈指数增长趋势；其次，融合过程复杂，限制条件较多，在融合处理中往往给出过高估计，其判别决策含有更多的主观性。

发明内容

本发明的目的在于克服上述现有技术中的不足，提供一种地方志知识融合方法，该方法融合效率较高，结果更可靠。

本发明目的是通过如下技术方案实现的。

一种地方志知识融合方法，包括以下步骤：

(1)建立地方志本体库，根据地方志特征进行分类，为每个类别建立本体库，包括地名本体库、人物本体库、事件本体库、景观本体库；

(2)知识模糊化，调用知识模糊化接口，将输入的精确量转化成模糊量，即将知识元名称、属性、关系三个维度中对应相似元素的个数分别转化为对应模糊集合的隶属度；

(3)知识模糊推理，用模糊量去适配融合规则得到融合量，该推理过程是基于模糊逻辑中的蕴含关系及推理规则来进行的，规则库包括了用模糊语言变量表示的一系列融合规则，反映了领域专家的经验和知识；

(4)知识清晰化，将融合量变换为实际用于相似度判断的清晰量，把分布范围概括合并成单点的输出值,同时消除具有歧义的输出结果；

(5)知识可视化，运用可视化工具对融合结果进行布局、颜色调整、大小设定，为用户提供一个可视化知识界面。

在上述技术方案中，所述建立地方志本体库的具体过程如下：

第一步，针对实际的地方志资源，该资源是文本文档、或地方志图像、或地方志音视频片段，采用URI来进行定位处理，通过使用路径来进行表示；

第二步，建立地方志领域本体，运用本体构建工具，依据地名、人物、事件、景观地方志类别划分结构，从而形成本体类的树状结构，本体中的最小单元为知识元，通过名称、属性、关系三元组表示。

在上述技术方案中，所述知识模糊化的具体过程如下：

第一步，查找步骤(1)所得本体中两两知识元的名称、属性、关系三个维度中对应元素分别在地方志领域词汇表中出现的个数，分别记为x，y，z，作为知识模糊化接口输入量；

第二步，将输入量x，y，z通过各自的输入量隶属度函数进行模糊处理，将输入量分为若干个等级，使原先输入的精确量变成模糊量，从而构成相应的模糊集合，模糊化后的输出量记为fx，fy，fz。

在上述技术方案中，所述知识模糊推理的具体过程如下：

第一步，确立输出量隶属度函数，将输出量分为若干个等级；

第二步，建立地方志知识融合规则库，采用IF-THEN语句进行表示；

第三步，将步骤(2)所得模糊量fx，fy，fz映射到输出量隶属度函数模糊集合中的等级类别，去适配融合规则，为每一个融合规则确定其适配的程度，并且通过加权计算合并那些规则的输出，记S为规则合并后的集合，s为S中的成员，每条规则适配后得到的融合量为r(s)。

在上述技术方案中，所述知识清晰化的具体过程如下：

第一步，将步骤(3)所得一系列融合量r(s)经数学变换变成清晰量；

第二步，根据清晰量的取值大小判定两两知识元的取舍和合并关系，当值大于等于设定的阈值上限时舍弃后一个知识元；值小于等于设定的阈值下限时，保留两个知识元；值大于阈值下限而小于阈值上限时，进行相应的合并处理。

本发明所构思的以上技术方案与现有技术相比，具有以下优点：

1、本发明结合了模糊集理论，融合效率较高；

2、本发明添加了先验知识，结果更可靠。

附图说明

图1为本发明实施例的方法流程图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。此外，下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以组合调整。

如图1所示，本发明实施例提供一种地方志知识融合方法，包括以下步骤：

进一步的，步骤(1)中，所述建立地方志本体库的具体过程如下：

第一步，针对实际的地方志资源，该资源可以是文本文档，可以是地方志图像，也可以是地方志音视频片段，这些可以采用URI来进行定位处理，通过使用路径来进行表示。

第二步，建立地方志领域本体，运用本体构建工具，依据上述地方志类别划分结构，从而形成本体类的树状结构，本体中的最小单元为知识元，通过名称、属性、关系三元组表示。

进一步的，步骤(2)中，所述知识模糊化接口的作用是将输入的精确量转化成模糊量，即将知识元名称、属性、关系三个维度中对应相似元素的个数分别转化为对应模糊集合的隶属度。其具体过程如下：

第一步，查找步骤(1)所得本体中两两知识元的名称、属性、关系三个维度中对应元素分别在地方志领域词汇表中出现的个数，分别记为x，y，z，作为知识模糊化接口输入量。

第二步，将输入量x，y，z通过各自的输入量隶属度函数进行模糊处理，将输入量分为若干个等级，使原先输入的精确量变成模糊量，从而构成相应的模糊集合，模糊化后的输出量记为fx，fy，fz。本实施例中，在我们的模型中，可将输入量隶属度函数定义为三角形隶属函数，根据输入量的大小，将输入量分为A，B，C三个等级：

进一步的，步骤(3)中，所述知识模糊推理的目的是用模糊量去适配融合规则得到融合量，它具有模拟人的基于模糊概念的推理能力。该推理过程是基于模糊逻辑中的蕴含关系及推理规则来进行的，规则库包括了用模糊语言变量表示的一系列融合规则，反映了领域专家的经验和知识。其具体过程如下：

第一步，确立输出量隶属度函数，将输出量分为若干个等级。在本实施例中，在我们的模型中，和输入量隶属度函数类似，可将输出量隶属度函数定义为三角形隶属函数，根据输出量的大小，将输出量分为A，B，C、D、E、F、G七个等级。

第二步，建立地方志知识融合规则库，采用IF-THEN语句进行表示。例如：

规则1：如果名称类别为A，关系类别为B，则输出量类别为G；

规则2：如果名称属性为C，关系类别为D，则输出量类别为F；

以上规则可表示为：

Rule1：IF(concept is A)AND(relation is B)THEN(similarity is G)

Rule2：IF(property is C)AND(relation is D)THEN(similarity is G)

第三步，将步骤(2)所得模糊量fx，fy，fz映射到输出量隶属度函数模糊集合中的等级类别，去适配融合规则，为每一个融合规则确定其适配的程度，并且通过加权计算合并那些规则的输出，记S为规则合并后的集合，s为S中的成员，每条规则适配后得到的融合量为r(s)。例如，在我们的模型中，上述规则合并计算方法可设为Z＝max(min(A,B),min(C,D)，…)。

进一步的，步骤(4)中，所述知识清晰化的作用是将知识模糊推理得到的融合量变换为实际用于相似度判断的清晰量，其目的是把分布范围概括合并成单点的输出值,同时消除具有歧义的输出结果。其具体过程如下：

第一步，将步骤(3)所得一系列融合量r(s)经数学变换变成清晰量。在本实施例中，在我们的模型中，所求清晰量可表示为：

第二步，根据r₀值的取值大小判定两两知识元的取舍和合并关系。当值大于等于设定的阈值上限时舍弃后一个知识元；值小于等于设定的阈值下限时，保留两个知识元；值大于阈值下限而小于阈值上限时，进行相应的合并处理。

本说明书中未作详细描述的内容，属于本专业技术人员公知的现有技术。

Claims

1.一种地方志知识融合方法，其特征在于该方法包括以下步骤：

2.根据权利要求1所述的地方志知识融合方法，其特征在于步骤(1)中所述建立地方志本体库的具体过程如下：

3.根据权利要求1所述的地方志知识融合方法，其特征在于步骤(2)中所述知识模糊化的具体过程如下：

4.根据权利要求1所述的地方志知识融合方法，其特征在于步骤(3)中所述知识模糊推理的具体过程如下：

5.根据权利要求1所述的地方志知识融合方法，其特征在于：步骤(4)中所述知识清晰化的具体过程如下：