CN105843791B - 一种基于6w语义标识的语义网络模型构建方法 - Google Patents

一种基于6w语义标识的语义网络模型构建方法 Download PDF

Info

Publication number
CN105843791B
CN105843791B CN201510022110.2A CN201510022110A CN105843791B CN 105843791 B CN105843791 B CN 105843791B CN 201510022110 A CN201510022110 A CN 201510022110A CN 105843791 B CN105843791 B CN 105843791B
Authority
CN
China
Prior art keywords
concept
mark
class
scene
ontology
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510022110.2A
Other languages
English (en)
Other versions
CN105843791A (zh
Inventor
夏冬梅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HONGYOU SOFTWARE Co.,Ltd.
Original Assignee
KARAMAY HONGYOU SOFTWARE CO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KARAMAY HONGYOU SOFTWARE CO Ltd filed Critical KARAMAY HONGYOU SOFTWARE CO Ltd
Priority to CN201510022110.2A priority Critical patent/CN105843791B/zh
Publication of CN105843791A publication Critical patent/CN105843791A/zh
Application granted granted Critical
Publication of CN105843791B publication Critical patent/CN105843791B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种基于6W语义标识的语义网络模型构建方法,步骤为:定义概念模型中概念属性的符号表达形式;定义概念模型中概念名称的符号表达形式;定义数据元标识;定义概念本体结构;定义概念模型层次结构的符号表达形式;定义场景本体标识结构的符号表达形式;定义场景语义标识结构;构建语义网络模型。优点为:本发明提供的基于6W语义标识的语义网络模型构建方法,从原子模型开始,逐层向上分别定义了概念、数据元、概念本体结构、概念模型层次结构、场景本体标识结构和场景语义标识结构的符号表达形式;定义规则简单易懂,层次清晰;基于所定义的各种符号表达形式,可有效提高语义网络模型构建效率。

Description

一种基于6W语义标识的语义网络模型构建方法
技术领域
本发明涉及一种语义网络模型构建方法,具体涉及一种基于6W语义标识的语义网络模型构建方法。
背景技术
语义网络理论是一种用于表示词与词之间语义关系的网络理论,1973年由美国人工智能专家司马贺提出。其原理是:以句中词的概念为网络的结点,以沟通结点之间的有向弧来表示概念与概念之间的语义关系,构成一个彼此相连的网络,以理解自然语言句子的语义。
在语义网络理论的研究中,核心为构建语义网络模型,然而,现有的语义网络模型的构建具有构建过程复杂的不足,从而不利于语义网络的研究。
发明内容
针对现有技术存在的缺陷,本发明提供一种基于6W语义标识的语义网络模型构建方法,可有效解决上述问题。
本发明采用的技术方案如下:
本发明提供一种基于6W语义标识的语义网络模型构建方法,包括以下步骤:
S1,定义概念模型中概念属性的符号表达形式;具体包括:
S1.1,分别定义概念与概念之间的四种联系,即:条件、约束、关系和规则的符号表示形式;
S1.2,定义概念之间不同依赖程度的符号表示形式;其中,概念之间依赖程度包括必须、重要和可选;
还定义依赖程度与概念之间的位置关系;
S1.3,定义概念发生频率的符号表示形式;
还定义概念发生频率与概念之间的位置关系;
S2,定义概念模型中概念名称的符号表达形式,从而得到概念标识;
具体包括:
S2.1,分别定义概念模型的各个一级概念类的符号表达形式;其中,所述概念模型的一级概念类为八类,分别为:时间类、地点类、对象类、参与者类、资料类、活动类、特征类和参照类;
所述一级概念类的符号表达形式包括类别编码域和数据编码域;
S2.2,分别定义每个所述一级概念类细分后得到的二级概念类的符号表达形式;并且,所述二级概念类的符号表达形式包括类别编码域和数据编码域;
隶属于同一个一级概念类下面的各个二级概念类的类别编码域均与对应的一级概念类的类别编码域相同;隶属于同一个一级概念类下面的各个二级概念类的数据编码域各不相同,进而达到唯一标识概念名称的作用;
S3,定义数据元标识;
具体包括:
所述数据元是用于定义数据用的最小单元,由具有继承关系的概念构成;根据数据元所包含的概念的继承关系,将各个概念所对应的概念标识逻辑组合,即得到所述数据元标识;
其中,根据数据元的层次,所述数据元包括概念数据元、逻辑数据元和应用数据元;
S4,定义概念本体结构,并将所定义的概念本体结构中涉及到的概念属性用S1定义得到的符号表达;将所定义的概念本体结构中涉及到的概念名称,用S2定义得到的概念标识表达;将所定义的概念本体结构中涉及到的数据元用S3定义得到的数据元标识表达,从而得到概念本体结构标识;
S5,根据S4定义的概念本体结构标识,定义概念模型层次结构的符号表达形式;
S6,根据S5定义的概念模型层次结构,定义场景本体标识结构的符号表达形式;
S7,根据S6定义得到的场景本体标识结构,定义场景语义标识结构;
S8,构建语义网络模型;具体包括:
1)将概念模型中的特征类组成的通过符号表达的概念本体结构进行整理,作为矩阵中的纵向列;
2)以概念模型中的不重复的概念标识作为横向列;
3)通过横向列中的概念标识,遍历纵向列中的概念本体结构,生成相应语义原型矩阵;
4)通过概念标识,将语义原型矩阵的横向列的概念标识进行压缩,只保存最底层的节点,得到简化矩阵;
5)根据概念标识顺序,对步骤4)得到的简化矩阵中的概念标识进行排序,得到排序后矩阵;所述排序后矩阵的概念标识集中,可更方便的查看语义的联系;
6)对步骤5)得到的所述排序后矩阵的纵向列进行扩展,根据概念模型形成的概念本体结构,将纵向列中的每个所述特征类扩展出时间类、地点类、对象类、参与者类、资料类、活动类和参照类,从而得到扩展后的纵向列;进而得到扩展后的语义矩阵;
7)对步骤6)得到的所述语义矩阵中的横向列和纵向列中的概念之间的关系进行标识,即得到语义网络模型。
优选的,S1.1中,条件指事前应该具备的,导致事情是否发生;约束指事中应该满足的,导致事情是否正常;关系指满足了条件和约束事情应该产生的结果;规则指关系、条件和约束需要规则才能组织在一起。
优选的,S5具体为:
将概念模型依次划分为4个层次:系列、集合、实体、子集,上层作为下层的条件或者约束,下层又作为上层的解释,整个结构形成了概念模型层次结构;
将所形成的所述概念模型层次结构中的涉及到的概念属性用S1定义得到的符号表达;将所定义的概念本体结构中涉及到的概念名称,用S2定义得到的概念标识表达;将所定义的概念本体结构中涉及到的数据元用S3定义得到的数据元标识表达,从而得到概念模型层次结构的符号表达形式。
优选的,S6具体为:
S6.1,定义以下的四层结构:
第一层结构,系列:对象、活动;
第二层结构,集合:对象、活动、参与者、结果;
第三层结构,实体:参与者、活动、时间、地点、结果、对象、特征;
第四层结构,子集:时间、地点、对象、特征;
S6.2,将上述四层结构组合到一起,其中,结构与结构之间定义分割符号,每个结构又分为若干阶,定义相邻阶之间的分隔符;每阶中又有若干位,每个概念代表一位;由此组合得到场景本体标识结构的符号表达形式。
优选的,S6.1中,还包括:
当活动中包含子活动,对象中又包含子对象时,所述四层结构变为:
系列:对象、活动;
集合:对象、活动、参与者、结果;
实体:参与者、活动!子活动、时间、地点、结果、对象、特征;
子集:时间、地点、对象!子对象、特征。
优选的,还包括:
场景本体标识结构具体分为场景本体表示形式和场景本体标识形式,两者均适用于知识管理,具体如下:
场景本体表示形式的构建方法为:将结构中上层的尾接下层的头,层间采用分隔符分隔;
场景本体标识形式的构建方法为:将结构中上层的尾接下层的头,层间采用分隔符分隔,并将概念名称替换为概念标识。
优选的,S7具体为:
S7.1,定义以下的四层结构:
第一层结构,系列:对象、活动;
第二层结构,集合:对象、活动、参与者、结果;
第三层结构,实体:参与者、活动、时间、地点、结果、对象、特征;
第四层结构,子集:时间、地点、对象、特征;
S7.2,将上述四层结构组合到一起,其中,结构与结构之间定义分隔符号,每个结构又分为若干阶,定义相邻阶之间的分隔符;每阶中又有若干位,每个概念代表一位;如果某个结构中的某个概念具有附带特征或者属性的,则在该概念后首先增加分隔符,再在分隔符后面增加所述附带特征或者属性,由此组合得到场景语义标识结构的符号表达形式。
优选的,还包括:
场景语义标识结构具体分为场景语义表示形式和场景语义标识形式,两者均适用于语义识别,具体如下:
场景语义表示形式的构建方法为:
将四层结构中的联系符号以及依赖程度符号均去掉,结构与结构之间定义分隔符号,上层的尾接下层的头,并通过层间分隔符分隔;由此得到场景语义表示形式;
将场景语义表示形式中的概念名称替换为概念标识,即得到场景语义标识形式。
本发明的有益效果如下:
本发明提供一种基于6W语义标识的语义网络模型构建方法,本发明提供的基于6W语义标识的语义网络模型构建方法,从原子模型开始,逐层向上分别定义了概念、数据元、概念本体结构、概念模型层次结构、场景本体标识结构和场景语义标识结构的符号表达形式;定义规则简单易懂,层次清晰;基于所定义的各种符号表达形式,可有效提高语义网络模型构建效率。
附图说明
图1为本发明提供的基于6W语义标识的语义网络模型构建方法的流程示意图;
图2为原子模型概念关系图;
图3为一种具体的概念本体结构示例图;
图4为概念“井筒”的本体结构示意图;
图5为概念“分公司”的本体结构示意图;
图6所示,为概念模型层次结构图。
具体实施方式
以下结合附图对本发明进行详细说明:
如图1所示,本发明提供一种基于6W语义标识的语义网络模型构建方法,6W原则本来是指诺贝尔文学奖获得者英国作家吉卜林的思考问题、解决问题的“6W原则”,在此基础上明确了业务逻辑6W描述方法,即“Where(什么地方)、When(什么时间)、Who(什么人)、Which(针对啥)、What(做了什么,含如何做)、Why(为什么)”,具体来说,6W是指时间,活动,对象,地点,参与者,结果这六个场景信息。
包括以下步骤:
S1,定义概念模型中概念属性的符号表达形式;具体包括:
S1.1,分别定义概念与概念之间的四种联系,即:条件、约束、关系和规则的符号表示形式;如图2所示,为原子模型概念关系图;原子模型又称概念模型,因为概念是原子级概念,概念是用于描述数据的元素。
其中,条件指事前应该具备的,导致事情是否发生,可用符号“#”表示;
约束指事中应该满足的,导致事情是否正常;可用符号“()”表示;
关系指满足了条件和约束事情应该产生的结果;可用符号“!”表示;
规则指关系、条件和约束需要规则才能组织在一起。可用符号“[]”表示;
S1.2,定义概念之间不同依赖程度的符号表示形式;其中,概念之间依赖程度包括必须、重要和可选;可用符号M表示必须,C表示重要,O表示可选;
还定义依赖程度与概念之间的位置关系;例如,可定义:M、C和O在使用时放在概念前面,并以符号“/”作为分隔符;
S1.3,定义概念发生频率的符号表示形式;还定义概念发生频率与概念之间的位置关系;
例如,定义n和N为概念发生频率的符号表示形式,分别代表:
n代表重复次数大于等于1,使用时放在概念后面以符号“/”作为分隔符;
N代表发生频度大于1,使用时放在概念后面以符号“/”作为分隔符。
S2,定义概念模型中概念名称的符号表达形式,从而得到概念标识;
具体包括:
S2.1,分别定义概念模型的各个一级概念类的符号表达形式;其中,所述概念模型的一级概念类为八类,分别为:时间类、地点类、对象类、参与者类、资料类、活动类、特征类和参照类;
所述一级概念类的符号表达形式包括类别编码域和数据编码域;
S2.2,分别定义每个所述一级概念类细分后得到的二级概念类的符号表达形式;并且,所述二级概念类的符号表达形式包括类别编码域和数据编码域;
隶属于同一个一级概念类下面的各个二级概念类的类别编码域均与对应的一级概念类的类别编码域相同;隶属于同一个一级概念类下面的各个二级概念类的数据编码域各不相同,进而达到唯一标识概念名称的作用;
例如,如表1,为原子模型中一级概念类和二级概念类的定义结构表,需要强调的是,表1所定义的二级概念类仅为一种具体示例,实际应用中,可采用其他方式,对一级概念类进行细分。
表1
一级概念类 二级概念类
时间类 时间、次序、步长、速节
地点类 绝对、相对、参照、拓扑
对象类 设施、设备、零部件、材料
参与者类 作业者、执行者、操作者、参与者
活动类 领域、过程、活动、设计、规划、实施、审核、总结
资料类 矢量数据、报告、流[资料、附近]
特征类 值域、编码(符号)、描述、逻辑
参照类 范围、状态、性质、场景
进一步的,可定义概念标识由六位数字组成,首位数字代表概念所在的类别编码域,分别用1、2…8代表时间类、地点类、对象类、参与者类、资料类、活动类、特征类和参照类;后五位数字代表概念的数据编码域。如表2所示,为概念标识区域示意表;
表2
例如,对于概念标识103884,代表其属于时间类,序号为:03884。
S3,定义数据元标识;
具体包括:
所述数据元是用于定义数据用的最小单元,由具有继承关系的概念构成;根据数据元所包含的概念的继承关系,将各个概念所对应的概念标识逻辑组合,即得到所述数据元标识;
其中,根据数据元的层次,所述数据元包括概念数据元、逻辑数据元和应用数据元;
(1)概念数据元标识
概念数据元是描述数据的原子级概念,因此,概念数据元也是概念,概念数据元标识定义等同概念标识定义,如表3所示,为概念名称、概念标识和概念数据元标识的对应关系表。
表3
概念数据元标识(可变) 概念名称(不变) 概念标识(不变)
1 时间类 100000
1.1 日期 100010
1.2 序号 100020
2 地点类 200000
2.1 深度 201021
2.2 坐标 211322
3 对象类 300000
3.1 301235
3.2 井筒 301244
3.3 地质 313321
3.4 岩心 314587
4 参与者类 400000
4.1 公司 411697
5 活动类 500000
5.1 描述 545114
5.2 录井 515325
6 资料类 600000
6.1 记录 615618
7 特征类 700000
7.1 名称 719819
8 参照类 800000
8.1 时间范围 800115
(2)逻辑数据元标识
逻辑数据元是由概念组合而形成的、具有一定逻辑的描述数据的单元,逻辑数据元是由概念的不同类别组合而成,比如:对象+特征、活动+特征、对象+活动、活动+对象。
逻辑数据元不能完整的描述场景约束,只具备一定的逻辑描述能力,如表4所示,为逻辑数据元由概念组合形成的唯一标识。
表4
逻辑数据元名称 逻辑数据元标识
地质.录井 313321515325
岩心.录井 314587523354
岩心.描述 314587500365
泥岩.含量 324534752563
岩屑.最大.编号 325125800123100365
(3)应用数据元
应用数据元是由概念组合而形成的、具有明确逻辑含义的描述数据的单元,应用数据元是由概念的不同类别组合而成,比如:活动+对象+特征。
应用数据元能够完整的描述场景约束,具备明确描述逻辑含义能力,如表5所示,为应用数据元由概念组合形成的唯一标识。
表5
业务标识 概念名称 类型 类别
J 井筒工程 业务域
J.1 对象 设施
J.1.4 井筒 对象 设施
J.1.4.3 地质录井 业务 录井
J.1.4.3.11 岩心录井 流程
J.1.4.3.11.6 岩心统计 活动 实施
J.1.4.3.11.6.3 岩心 对象 材料
J.1.4.3.11.6.3.5 岩心长度 特征 数字
应用数据元名称:
井筒工程.井.井筒.地质录井.岩心录井.岩心统计.岩心.岩心长度
则:上述应用数据元的应用数据元标识表示如下:
301244501257.301235.301244.313321515325.314587515325.314587521456.314587.314587751123
其中,以“1.2”的格式书写时,1和2为模型中的自然顺序号,符号“.”代表上下级关系,这样的标识为模型标识,其主要出现在各种模型中。不同的模型中,模型标识代表的含义也各不相同,原子模型的模型标识表示了不同层级之间的继承关系,业务逻辑模型的模型标识表示了场景的多维度逻辑关系,元数据模型的标识表示了针对场景具体某一个维度的逻辑关系。
S4,定义概念本体结构,并将所定义的概念本体结构中涉及到的概念属性用S1定义得到的符号表达;将所定义的概念本体结构中涉及到的概念名称,用S2定义得到的概念标识表达;将所定义的概念本体结构中涉及到的数据元用S3定义得到的数据元标识表达,从而得到概念本体结构标识;
具体的,将概念与概念之间用明确的联系表达出来就是概念本体结构,如图3所示,为一种具体的概念本体结构示例。
分别举例不同类概念组成的概念本体结构表达形式:
井(M/井号)//概念井必须有一个M项约束才能明确表达井的概念
概念“井号”的本体结构:
井号[井] //如果井号为非M项概念
井:井号 //如果井号为M项概念
概念“井筒”的本体结构如图4所示,明确井筒必须要明确井的概念,得到井(M/井号)!井筒(/M井筒号);
概念“分公司”的本体结构如图5所示,明确分公司必须要明确公司的概念,得到的概念本体结构为:公司(C/专业,M/名称)!分公司(C/录井,M/名称)。
S5,根据S4定义的概念本体结构,定义概念模型层次结构的符号表达形式;
概念模型层次结构定义是指将概念模型依次划分为4个层次:系列、集合、实体、子集,上层作为下层的条件或者约束,下层又作为上层的解释,整个结构形成了概念模型层次结构,如图6所示,为概念模型层次结构图。
系列给出的是领域的概念,也就是最外延的或者是该领域最大的概念,包含:对象、活动,例如:城市领域在该层的对象是城市,活动是城市管理等。
集合给出的是领域中的流程或者过程,是活动的集合,但整个流程或者过程会产生一个结果,包含:对象、活动、参与者、结果。例如城市领域在该层的对象就应该是城市下面的子对象,像道路、房屋等,活动是道路铺设、房屋修建,参与者是筑路工程公司、地产公司等,结果是一种材料类型的对象,如道路铺设路线图、房屋规划设计图等。
实体给出的是流程中具体的活动,也就是具体做某一件事情,包括:参与者、活动、时间、地点、结果、对象、特征。例如,碾压沥青活动,参与者是压路工、铺路工、沥青等,对象是路段,结果就是路段铺设进度报告,特征就是路段的铺设的情况描述,如铺设长度,铺设厚度等。
子集给出的是业务对象的描述,主要用于描述对象和对象的特征,包括:时间、地点、对象、特征。例如路段对象,其特征包括:路段长度、路段厚度、路段宽度、路段载重量等。
S6,根据S5定义的概念模型层次结构,定义场景本体标识结构的符号表达形式;
场景本体标识结构定义与概念模型层次结构定义相同,将场景本体标识的结构依次划分为四层:
系列:对象、活动;
集合:对象、活动、参与者、结果;
实体:参与者、活动、时间、地点、结果、对象、特征;
子集:时间、地点、对象、特征;
如表6所示,为岩屑描述内容,它们都是作为约束限定岩屑描述内容。
表6
层次 场景本体标识结构的描述内容
系列 #M/井(M/单位).#C/井筒工程
集合 #M/井筒(M/井号).#C/地质录井.#C/录井公司.#C/地质总结报告
实体 #C/地质师.#C/岩屑录井...#M/井段(深度(顶界,底界))..
子集 .#M/深度.#M/岩屑(M/编号).描述内容
场景本体标识结构中的活动有子活动,对象中又有子对象时,场景本体标识结构为:
系列:对象、活动;
集合:对象、活动、参与者、结果;
实体:参与者、活动!子活动、时间、地点、结果、对象、特征;
子集:时间、地点、对象!子对象、特征。
场景本体标识结构共有四段,段与段之间用下划线“_”分割,每段中又分为若干阶,符号“.”后面到下一个符号“.”代表一阶,每阶中又有若干位,每个概念代表一位;
场景本体标识结构具体分为场景本体表示形式和场景本体标识形式,两者均适用于知识管理,主要用于存储,具体如下:
场景本体表示形式的构建方法为:将结构中上层的尾接下层的头,层间的分隔符为“_”,例如岩屑描述为:
“#M/井(M/单位).#C/井筒工程_#M/井筒(M/井号).#C/地质录井.#C/录井公司.#C/地质总结报告_#C/地质师.#C/岩屑录井...#M/井段(深度(顶界,底界)).._.#M/深度.#M/岩屑(M/编号).描述内容”,包含了概念之间完整的联系和联系类型。
场景本体标识形式的构建方法为:将结构中上层的尾接下层的头,层间的分隔符为“_”,将概念名称替换为概念标识,如表7所示,为场景本体标识形式的例子。
表7
层次 描述内容
系列 #M/301235(M/412358).#C/301244530121_
集合 #M/301244(M/701892).#C/313321515325.#C/515325411697.#C/313321625410_
实体 #C/420135.#C/351487515325...#M/353621(231101(231102,231103)).._
子集 .#M/231101.#M/351487(M/100201).755841
S7,根据S6定义得到的场景本体标识结构,定义场景语义标识结构;
场景语义标识结构定义与概念模型层次结构定义相同,场景语义标识结构依次分为四层:系列(对象、活动)、集合(对象、活动、参与者、结果)、实体(参与者、活动、时间、地点、结果、对象、特征)、子集(时间、地点、对象、特征);
场景语义标识结构弱化了本体标识中的联系关系,去掉不重要的约束;场景语义标识中,如果四层中有附带特征或者属性的,则需要在主体类后面添加特征,主体与特征之间以冒号“:”分割,,例如以“井:井号.井筒工程”的格式书写;
场景语义标识具体分为语义表示形式和语义标识形式,两者均适用于语义识别,主要用于问题识别,两者的构建方法是将四层结构中的联系符号以及依赖程度符号均去掉,彼此之间以逗点分隔,上层的尾接下层的头,层间的分隔符为“_”,后者将概念名称替换为概念标识。如表8,部分概念名称与概念唯一标识对应关系,而表9为描述内容、含油性、矿物成分的场景语义表示形式和场景语义标识形式的示例,这样就能更具体的理解语义标识的结构是如何定义了。
表8
数据元素 数据元素唯一标识 数据元素 数据元素唯一标识
301235 岩屑 351487
单位 412358 井段 353621
井筒 301244 深度 231101
工程 530121 顶界 231102
井号 701892 底界 231103
地质 313321 编号 100201
录井 515325 描述内容 755841
公司 411697 含油性 755843
总结报告 625410 矿物成分 755621
地质师 420135
表9
S8,构建语义网络模型;具体包括:
1)将概念模型中的特征类组成的通过符号表达的概念本体结构进行整理,作为矩阵中的纵向列;
此处的特征类即为:S2.1中一级概念类中的一类。
2)以概念模型中的不重复的概念标识作为横向列;
3)通过横向列中的概念标识,遍历纵向列中的概念本体结构,生成相应语义原型矩阵;
4)通过概念标识,将语义原型矩阵的横向列的概念标识进行压缩,只保存最底层的节点,得到简化矩阵;
5)根据概念标识顺序,对步骤4)得到的简化矩阵中的概念标识进行排序,得到排序后矩阵;所述排序后矩阵的概念标识集中,可更方便的查看语义的联系;
6)对步骤5)得到的所述排序后矩阵的纵向列进行扩展,根据概念模型形成的概念本体结构,将纵向列中的每个所述特征类扩展出时间类、地点类、对象类、参与者类、资料类、活动类和参照类,从而得到扩展后的纵向列;进而得到扩展后的语义矩阵;
7)对步骤6)得到的所述语义矩阵中的横向列和纵向列中的概念之间的关系进行标识,即得到语义网络模型。
本发明提供的基于6W语义标识的语义网络模型构建方法,从原子模型开始,逐层向上分别定义了概念、数据元、概念本体结构、概念模型层次结构、场景本体标识结构和场景语义标识结构的符号表达形式;定义规则简单易懂,层次清晰;基于所定义的各种符号表达形式,可有效提高语义网络模型构建效率。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视本发明的保护范围。

Claims (8)

1.一种基于6W语义标识的语义网络模型构建方法,其特征在于,包括以下步骤:
S1,定义概念模型中概念属性的符号表达形式;具体包括:
S1.1,分别定义概念与概念之间的四种联系的符号表示形式,即:条件、约束、关系和规则的符号表示形式;
S1.2,定义概念之间不同依赖程度的符号表示形式;其中,概念之间依赖程度包括必须、重要和可选;
还定义依赖程度与概念之间的位置关系;
S1.3,定义概念发生频率的符号表示形式;
还定义概念发生频率与概念之间的位置关系;
S2,定义概念模型中概念名称的符号表达形式,从而得到概念标识;
具体包括:
S2.1,分别定义概念模型的各个一级概念类的符号表达形式;其中,所述概念模型的一级概念类为八类,分别为:时间类、地点类、对象类、参与者类、资料类、活动类、特征类和参照类;
所述一级概念类的符号表达形式包括类别编码域和数据编码域;
S2.2,分别定义每个所述一级概念类细分后得到的二级概念类的符号表达形式;并且,所述二级概念类的符号表达形式包括类别编码域和数据编码域;
隶属于同一个一级概念类下面的各个二级概念类的类别编码域均与对应的一级概念类的类别编码域相同;隶属于同一个一级概念类下面的各个二级概念类的数据编码域各不相同,进而达到唯一标识概念名称的作用;
S3,定义数据元标识;
具体包括:
所述数据元是用于定义数据用的最小单元,由具有继承关系的概念构成;根据数据元所包含的概念的继承关系,将各个概念所对应的概念标识逻辑组合,即得到所述数据元标识;
其中,根据数据元的层次,所述数据元包括概念数据元、逻辑数据元和应用数据元;
S4,定义概念本体结构,并将所定义的概念本体结构中涉及到的概念属性用S1定义得到的符号表达;将所定义的概念本体结构中涉及到的概念名称,用S2定义得到的概念标识表达;将所定义的概念本体结构中涉及到的数据元用S3定义得到的数据元标识表达,从而得到概念本体结构标识;
S5,根据S4定义的概念本体结构标识,定义概念模型层次结构的符号表达形式;
S6,根据S5定义的概念模型层次结构,定义场景本体标识结构的符号表达形式;
S7,根据S6定义得到的场景本体标识结构,定义场景语义标识结构;
S8,构建语义网络模型;具体包括:
1)将概念模型中的特征类组成的通过符号表达的概念本体结构进行整理,作为矩阵中的纵向列;
2)以概念模型中的不重复的概念标识作为横向列;
3)通过横向列中的概念标识,遍历纵向列中的概念本体结构,生成相应语义原型矩阵;
4)通过概念标识,将语义原型矩阵的横向列的概念标识进行压缩,只保存最底层的节点,得到简化矩阵;
5)根据概念标识顺序,对步骤4)得到的简化矩阵中的概念标识进行排序,得到排序后矩阵;所述排序后矩阵的概念标识集中,可更方便的查看语义的联系;
6)对步骤5)得到的所述排序后矩阵的纵向列进行扩展,根据概念模型形成的概念本体结构,将纵向列中的每个所述特征类扩展出时间类、地点类、对象类、参与者类、资料类、活动类和参照类,从而得到扩展后的纵向列;进而得到扩展后的语义矩阵;
7)对步骤6)得到的所述语义矩阵中的横向列和纵向列中的概念之间的关系进行标识,即得到语义网络模型。
2.根据权利要求1所述的基于6W语义标识的语义网络模型构建方法,其特征在于,S1.1中,条件指事前应该具备的,导致事情是否发生;约束指事中应该满足的,导致事情是否正常;关系指满足了条件和约束事情应该产生的结果;规则指关系、条件和约束需要规则才能组织在一起。
3.根据权利要求1所述的基于6W语义标识的语义网络模型构建方法,其特征在于,S5具体为:
将概念模型依次划分为4个层次:系列、集合、实体、子集,上层作为下层的条件或者约束,下层又作为上层的解释,整个结构形成了概念模型层次结构;
将所形成的所述概念模型层次结构中的涉及到的概念属性用S1定义得到的符号表达;将所定义的概念本体结构中涉及到的概念名称,用S2定义得到的概念标识表达;将所定义的概念本体结构中涉及到的数据元用S3定义得到的数据元标识表达,从而得到概念模型层次结构的符号表达形式。
4.根据权利要求1所述的基于6W语义标识的语义网络模型构建方法,其特征在于,S6具体为:
S6.1,定义以下的四层结构:
第一层结构,系列:对象、活动;
第二层结构,集合:对象、活动、参与者、结果;
第三层结构,实体:参与者、活动、时间、地点、结果、对象、特征;
第四层结构,子集:时间、地点、对象、特征;
S6.2,将上述四层结构组合到一起,其中,结构与结构之间定义分割符号,每个结构又分为若干阶,定义相邻阶之间的分隔符;每阶中又有若干位,每个概念代表一位;由此组合得到场景本体标识结构的符号表达形式。
5.根据权利要求4所述的基于6W语义标识的语义网络模型构建方法,其特征在于,S6.1中,还包括:
当活动中包含子活动,对象中又包含子对象时,所述四层结构变为:
系列:对象、活动;
集合:对象、活动、参与者、结果;
实体:参与者、活动!子活动、时间、地点、结果、对象、特征;
子集:时间、地点、对象!子对象、特征。
6.根据权利要求4所述的基于6W语义标识的语义网络模型构建方法,其特征在于,还包括:
场景本体标识结构具体分为场景本体表示形式和场景本体标识形式,两者均适用于知识管理,具体如下:
场景本体表示形式的构建方法为:将结构中上层的尾接下层的头,层间采用分隔符分隔;
场景本体标识形式的构建方法为:将结构中上层的尾接下层的头,层间采用分隔符分隔,并将概念名称替换为概念标识。
7.根据权利要求1所述的基于6W语义标识的语义网络模型构建方法,其特征在于,S7具体为:
S7.1,定义以下的四层结构:
第一层结构,系列:对象、活动;
第二层结构,集合:对象、活动、参与者、结果;
第三层结构,实体:参与者、活动、时间、地点、结果、对象、特征;
第四层结构,子集:时间、地点、对象、特征;
S7.2,将上述四层结构组合到一起,其中,结构与结构之间定义分隔符号,每个结构又分为若干阶,定义相邻阶之间的分隔符;每阶中又有若干位,每个概念代表一位;如果某个结构中的某个概念具有附带特征或者属性的,则在该概念后首先增加分隔符,再在分隔符后面增加所述附带特征或者属性,由此组合得到场景语义标识结构的符号表达形式。
8.根据权利要求7所述的基于6W语义标识的语义网络模型构建方法,其特征在于,还包括:
场景语义标识结构具体分为场景语义表示形式和场景语义标识形式,两者均适用于语义识别,具体如下:
场景语义表示形式的构建方法为:
将四层结构中的联系符号以及依赖程度符号均去掉,结构与结构之间定义分隔符号,上层的尾接下层的头,并通过层间分隔符分隔;由此得到场景语义表示形式;
将场景语义表示形式中的概念名称替换为概念标识,即得到场景语义标识形式。
CN201510022110.2A 2015-01-15 2015-01-15 一种基于6w语义标识的语义网络模型构建方法 Active CN105843791B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510022110.2A CN105843791B (zh) 2015-01-15 2015-01-15 一种基于6w语义标识的语义网络模型构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510022110.2A CN105843791B (zh) 2015-01-15 2015-01-15 一种基于6w语义标识的语义网络模型构建方法

Publications (2)

Publication Number Publication Date
CN105843791A CN105843791A (zh) 2016-08-10
CN105843791B true CN105843791B (zh) 2018-08-03

Family

ID=56580188

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510022110.2A Active CN105843791B (zh) 2015-01-15 2015-01-15 一种基于6w语义标识的语义网络模型构建方法

Country Status (1)

Country Link
CN (1) CN105843791B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106446286B (zh) * 2016-10-26 2019-04-30 红有软件股份有限公司 基于6w场景的知识自学习方法
CN108073587B (zh) * 2016-11-09 2022-05-27 阿里巴巴集团控股有限公司 一种自动问答方法、装置及电子设备
CN108205526A (zh) * 2016-12-20 2018-06-26 百度在线网络技术(北京)有限公司 一种确定综合语义信息的方法与装置
CN108733725B (zh) * 2017-04-24 2022-03-25 西门子(中国)有限公司 目标系统的网络语义模型的建立方法及系统
CN108664943B (zh) * 2018-05-17 2020-06-05 北京科技大学 一种多居住者场景下的室内日常活动识别方法
CN110740196A (zh) * 2018-07-19 2020-01-31 中国移动通信有限公司研究院 一种物联网标识的处理方法、装置及终端设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103150382A (zh) * 2013-03-14 2013-06-12 中国科学院计算技术研究所 基于开放知识库的短文本语义概念自动化扩展方法及系统
CN103207856A (zh) * 2013-04-03 2013-07-17 同济大学 一种本体概念及层次关系生成方法
CN104281693A (zh) * 2014-10-13 2015-01-14 安徽华贞信息科技有限公司 一种语义搜索方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7337170B2 (en) * 2005-01-18 2008-02-26 International Business Machines Corporation System and method for planning and generating queries for multi-dimensional analysis using domain models and data federation

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103150382A (zh) * 2013-03-14 2013-06-12 中国科学院计算技术研究所 基于开放知识库的短文本语义概念自动化扩展方法及系统
CN103207856A (zh) * 2013-04-03 2013-07-17 同济大学 一种本体概念及层次关系生成方法
CN104281693A (zh) * 2014-10-13 2015-01-14 安徽华贞信息科技有限公司 一种语义搜索方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于语义网络的知识协作关键技术研究;代印唐;《中国博士学位论文全文数据库 信息科技辑》;20091215(第12期);341-346 *
智慧城市自然语言数据搜索命令提取模型;朱平;《第三届信息化创新克拉玛依国际学术论坛文集》;20140902;I140-7 *

Also Published As

Publication number Publication date
CN105843791A (zh) 2016-08-10

Similar Documents

Publication Publication Date Title
CN105843791B (zh) 一种基于6w语义标识的语义网络模型构建方法
Miller et al. Permian ammonoids of the Guadalupe Mountain region and adjacent areas
CN105844335B (zh) 一种基于6w知识表示的自学习方法
CN106104519B (zh) 短语对收集装置以及计算机可读取的存储介质
CN103955558B (zh) 一种采集并处理不同行业工勘数据的方法
CN106649464A (zh) 一种中文地址树的构建方法及装置
CN111143547B (zh) 一种基于知识图谱的大数据显示方法
Haavik New tools, old tasks: Safety implications of new technologies and work processes for integrated operations in the petroleum industry
CN106104524A (zh) 复杂谓语模板收集装置以及用于其的计算机程序
CN106326438A (zh) 一种人员信息的关联方法
CN109885797B (zh) 一种基于多身份空间映射的关系网络构建方法
CN103927296A (zh) 输变电工程word文档段落内容中工程特性指标的智能提取方法
CN104462103A (zh) 基于应急事件和应急预案的应急情景推荐方法
CN112148735A (zh) 一种用于结构化表格数据知识图谱的构建方法
CN106778054A (zh) 基于数据挖掘的在校学生成绩预警方法
CN116701648A (zh) 基于规范标准映射知识图谱及schema设计方法
Kravis et al. A case based system for oil and gas well design with risk assessment
Liu et al. Research and application of geological hazard domain ontology
CN114610870A (zh) 一种矿山通风系统数据可视化和存储的方法及系统
Cowling et al. Local endemism and plant conservation in the Cape Floristic Region
Wulandari et al. Planning comparison for the capital city relocation between Brazil and Indonesia
Kivilcim et al. Impact of rapid urbanization on the morphology of historical Istanbul: Uskudar district case study
Lopes et al. The application of a schema to Late Gothic heritage: creating a digital model for a spatio-temporal study in Andalusia
CN106708532A (zh) 基于tacm的多层次正则表达式匹配方法
Burleson et al. Extending metadata standards for historical GIS research: A case study of the Holocaust in Budapest and the Armenian genocide in Turkey

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address

Address after: No. 197-2, Jiyun Road, Karamay District, Karamay City, Xinjiang Uygur Autonomous Region 834000

Patentee after: HONGYOU SOFTWARE Co.,Ltd.

Address before: 22 Changzheng Road, Karamay, Xinjiang Uygur Autonomous Region 834000

Patentee before: KARAMAY HONGYOU SOFTWARE Co.,Ltd.

CP03 Change of name, title or address