CN108959610B - 一种分层次多语义网系统及方法 - Google Patents

一种分层次多语义网系统及方法 Download PDF

Info

Publication number
CN108959610B
CN108959610B CN201810777355.XA CN201810777355A CN108959610B CN 108959610 B CN108959610 B CN 108959610B CN 201810777355 A CN201810777355 A CN 201810777355A CN 108959610 B CN108959610 B CN 108959610B
Authority
CN
China
Prior art keywords
semantic
network
web
net
realizing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810777355.XA
Other languages
English (en)
Other versions
CN108959610A (zh
Inventor
胡炜梅
陈丽莎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Giantan Information Technology Co ltd
Original Assignee
Guangzhou Giantan Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Giantan Information Technology Co ltd filed Critical Guangzhou Giantan Information Technology Co ltd
Priority to CN201810777355.XA priority Critical patent/CN108959610B/zh
Publication of CN108959610A publication Critical patent/CN108959610A/zh
Application granted granted Critical
Publication of CN108959610B publication Critical patent/CN108959610B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种分层次多语义网系统及方法,系统包括:语义网管理模块,用于至少实现分层次多语义网的管理;其中,所述分层次多语义网至少包括位于不同层次的通用语义网和领域语义网;所述领域语义网能够挂接到所述通用语义网上,从而与所述通用语义网形成关联,并且所述领域语义网继承所挂接的通用语义网的分类及概念;语义网应用模块,用于实现基于所述分层次多语义网的应用功能;其中,所述应用功能至少包括语义识别。本发明实现通用语义网与领域语义网之间的有效连接,将领域语义网和通用语义网关联,使通用语义网和领域语义网融合一体化,把万事万物连接在了一起。

Description

一种分层次多语义网系统及方法
技术领域
本发明涉及计算机技术领域,尤其涉及一种分层次多语义网系统及方法。
背景技术
语义网(ontology),也称本体,其概念来源于哲学领域,在国内被译为本体论或存在论,本体论研究万事万物的存在及其本质特征。计算机科学从哲学中继承了ontology一词,并用于知识工程领域的研究。语义网是共享概念模型的、明确的形式化规范说明,定义了概念以及概念与概念之间的关系,使人与人之间、人与计算机之间能基于共享概念进行语言交流。它作为计算机理解人类语言的知识组织方式,可应用于知识表示、知识推理和知识共享等。
语义网包括五个建模元语(modeling primitive),分别是类(classes)或概念(concepts)、关系(relations)、函数(functions)、公理(axioms)和实例(instances)。类是对象的集合,包括概念的名称、概念与概念之间的关系的名称、自然语言对概念的描述的集合。关系指的是概念之间的交互作用,主要包括上下位关系(kind of)、整体与部分的关系(part of)、实例与类之间的关系(instance of)、属性关系(attribute of)。函数指的是一种特殊的关系。公理表示永真的断言。实例指的元素,即指语义网中不可再分的实体。
目前,国内外已有一些通用的语义网,如SUMO、HowNet(知网)等,或一些语义词典WordNet、同义词词林等。也有一些带有语义的知识库,如Wikidata、Freebase、YAGO、DBpedia、BableNet等。但除SUMO、HowNet外,这些语义词典或知识库还不是严格意义上的语义网,而SUMO、HowNet也存定义过于抽象和复杂的问题。因此,存在不同程度难复用、难扩展等诸多问题。
目前国内外还有各种小规模的领域语义网,如医疗、军事、地理信息等领域的语义网。但现有领域语义网多为单一领域语义网,且规模小,未与通用语义网形成有效连接,导致应用范围小,无法解决通用的问题。
发明内容
本发明实施例提出一种分层次多语义网系统及方法,实现通用语义网与领域语义网之间的有效连接,将领域语义网和通用语义网关联,使通用语义网和领域语义网融合一体化,把万事万物连接在了一起。
本发明实施例提供了一种分层次多语义网系统,包括语义网管理模块、语义网应用模块、通用语义网以及至少一个领域语义网;其中:
所述语义网管理模块,用于至少实现分层次多语义网的管理;其中,所述管理包括语义网的构建和编辑;所述分层次多语义网至少包括位于不同层次的通用语义网和领域语义网;所述领域语义网能够挂接到所述通用语义网上,从而与所述通用语义网形成关联,并且所述领域语义网继承所挂接的通用语义网的分类及概念;
语义网应用模块,用于实现基于所述分层次多语义网的应用功能;其中,所述应用功能至少包括语义识别。
优选地,所述通用语义网根据世界所有事物的概念分成十个一级大类;其中,所述的十个一级大类包括:人、生物、具体物、抽象物、时空、特征、生物活动、社会活动、运动与变化、辅助语。
优选地,所述的十个一级大类中:
人:描述人的相关概念,这里人指具有智慧、直立行走、能够进行劳动、并能运用语言进行交际的生物;
生物:描述指除了人以外的、有生命的个体的相关概念;
具体物:存在时空中具体位置的实体的相关概念;
抽象物:抽象存在的实体的相关概念;
时空:描述时间和空间的相关概念;
特征:用于描述事物及其发展的特性的相关概念;
生物活动、社会活动、运动与变化:描述事物状态或关系变化的过程的相关概念;
辅助语:描述语法意义的虚词及用语的相关概念。
优选地,所述领域语义网包括以下的一种或多种组合:电信领域语义网、经济领域语义网、法律服务领域语义网、医药卫生语义网、人力资源领域语义网、铸造领域语义网、石油化工语义网、交通运输语义网、旅游休闲语义网、军事领域语义网、社会民生领域语义网、教育领域语义网、地理领域语义网、政治领域语义网、历史领域语义网。
优选地,所述语义网管理模块提供有操作界面;所述操作界面包括语义网挂接入口;
则所述语义网管理模块还用于,接收用户基于所述语义网挂接入口输入的待挂接的领域语义网的信息、被挂接的通用语义网的挂接节点信息,以将所述待挂接的领域语义网挂接到所述通用语义网的与所述挂接节点信息对应的预定层次的节点上。
优选地,所述操作界面还包括语义网创建入口、语义网删除入口、语义网编辑入口、语义网导入入口、语义网发布入口、语义网查找入口以及语义网导出入口中的至少一个,以使得所述语义网管理模块能够实现对应的创建语义网、删除语义网、编辑语义网、导入语义网、发布语义网、查找语义网以及根据任一节点导出语义网的功能。
优选地,所述语义网应用模块具体包括用于实现语义识别的语义网识别单元,所述语义网识别单元包括:
分词子单元,用于对待分词的文本进行分词处理,获得至少一个分词;
语义网匹配子单元,用于将获得的至少一个分词与所述分层次多语义网的所有节点进行匹配;
词义消歧处理子单元,用于对成功匹配分层次多语义网节点的分词进行词义消歧处理,得到消歧后的分词的概念路径,保存于词语概念路径存储库内;
概念路径输出子单元,用于输出该待分词在所述词语概念路径存储库内的概念路径。
优选地,所述语义网应用模块还包括:
用于实现文本分词的分词单元,用于实现词性标注的词性标注单元,用于实现句法分析的句法分析单元,用于实现语义推理的语义推理单元,用于实现情感分析的情感分析单元,用于实现语义网标注的语义网标注单元,用于实现热词分析的热词分析单元,用于实现新词发现的新词发现单元,用于实现关键词提取的关键词提取单元,用于实现摘要提取的摘要提取单元,用于实现相似度计算的相似度计算单元,用于实现语义消歧的语义消歧单元,用于实现关联关系分析的关联关系分析单元,用于实现文本对比的文本对比单元,用于实现文本分类的文本分类单元。
优选地,所述领域语义网通过分领域进行构建,以在使用时能够进行分领域的加载和调用,并实现跨域分析。
本发明实施例还提供了一种分层次多语义网方法,包括:
通过语义网管理模块对分层次多语义网进行管理;其中,所述管理包括语义网的构建和编辑;所述分层次多语义网至少包括位于不同层次的通用语义网和领域语义网;所述领域语义网能够挂接到所述通用语义网上,从而与所述通用语义网形成关联,并且所述领域语义网继承所挂接的通用语义网的分类及概念;
通过语义网应用模块实现基于所述分层次多语义网的应用功能;其中,所述应用功能至少包括语义识别。
本发明实施例的分层次多语义网系统及方法,通过通用语义网与领域语义网之间的有效连接,将领域语义网和通用语义网关联,使通用语义网和领域语义网融合一体化,把万事万物连接在了一起。
附图说明
图1是本发明提供的分层次多语义网系统的一种实施例的结构示意图。
图2本发明提供的分层次多语义网方法的一种实施例的流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,本发明实施例提供了一种分层次多语义网系统,其包括语义网管理模块10、语义网应用模块20、通用语义网30以及至少一个领域语义网40;其中:
所述语义网管理模块10,用于至少实现分层次多语义网的管理;其中,所述管理包括语义网的构建和编辑;所述分层次多语义网至少包括位于不同层次的通用语义网30和领域语义网40;所述领域语义网40能够挂接到所述通用语义网30上,从而与所述通用语义网30形成关联,并且所述领域语义网40继承所挂接的通用语义网的分类及概念。
语义网应用模块20,用于实现基于所述分层次多语义网的应用功能;其中,所述应用功能至少包括语义识别。
在本实施例中,所述分层次多语义网包括通用语义网30和至少一个领域语义网40,其中,所述通用语义网30与所述领域语义网40位于不同的层次,例如,所述通用语义网30位于第一层次,所述领域语义网40位于第二层次。
需要说明的是,在本发明的其他实施例中,所述分层次多语义网还可包括更多的层次。例如还可包括第三层次的应用语义网或者与所述领域语义网同位于第二层次的任务语义网等,这些方案均在本发明的保护范围之内。
在本实施例中,所述通用语义网为定义万事万物概念及概念之间关系的语义网,其根据世界所有事物的概念分成十个一级大类;其中,所述的十个一级大类包括:人、生物、具体物、抽象物、时空、特征、生物活动、社会活动、运动与变化、辅助语,其中:
【人】描述人的相关概念,这里人指具有智慧、直立行走、能够进行劳动、并能运用语言进行交际的生物。其二级分类主要包括男女老少、个体状况、家庭角色、社会角色等。
【生物】描述指除了人以外的、有生命的个体的相关概念,包括所有的植物、动物、微生物及其身体物质、身体部分的相关概念。
【具体物】存在时空中某位置的实体的相关概念。主要包括自然物、器具、建筑物、用品、衣物、食品、药品等。
【抽象物】抽象存在的实体的相关概念。主要包括事态、特性、经济、人文、医疗等。
【时空】描述时间和空间的相关概念。
【特征】用于描述事物及其发展的特性的相关概念。主要包括外形、性状、德才、境况等。
【生物活动】【社会活动】【运动与变化】描述事物状态或关系变化的过程的相关概念;【生物活动】主要包括生物发出的相关动作、表情、生理现象、心理状态和活动等;【社会活动】主要包括政治活动、军事活动、经济活动、文教、卫生等。【运动与变化】主要包括自然现象、物态及事态变化等。
【辅助语】描述语法意义的虚词及用语的相关概念。主要包括情状、中介、联接等。
需要说明的是,在本实施例中,通用语义网还在一级大类下分别设置相应的二级类。各级类之下还可以根据需要设置更多子类,如三级类、四级类等。
需要说明的是,在本发明的其他实施例中,还可包含更多的分类,或者可对分类进行合并等,这些方案均在本发明的保护范围之内。
在本实施例中,所述领域语义网为定义了特定领域专业知识概念及概念之间关系的语义网,其可包括以下的一种或多种组合:电信领域语义网、经济领域语义网、法律服务领域语义网、医药卫生语义网、人力资源领域语义网、铸造领域语义网、石油化工语义网、交通运输语义网、旅游休闲语义网、军事领域语义网、社会民生领域语义网、教育领域语义网、地理领域语义网、政治领域语义网、历史领域语义网。
当然,需要说明的是,领域语义网可根据实际的需要进行不断的扩展,本发明不做具体限定。
在本实施例中,采用分层的多语义网的结构,将最基本的、普遍的概念及概念之间的关系放到通用语义网里面,而特定领域中的概念及概念之间的关系放在领域语义网里面。所述领域语义网可以根据特定领域进行增加,如此,庞大的语义网体系化整为零,使得语义网可增量补充,让语义网资源得以有序积累和管理。此外,领域语义网可以通过打上通用语义网的路径标签,从而将领域语义网挂接到通用语义网上,此时,所述领域语义网即与所述通用语义网形成关联,并且继承所挂接的通用语义网的分类及概念。例如,在挂接时,将领域语义网的顶层节点(也可以是非顶层节点,具体可根据实际情况进行配置)连接到通用语义网的节点上(例如可以是通用语义网的第四层或第五层的节点,当然具体可根据实际情况进行配置),从而为领域语义网打上通用语义网的路径标签,即可以理解为通用语义网就是一棵树,而领域语义网就是子树,通过这样的方法即可以起到扩展通用语义网的效果。
在本实施例中,所述语义网应用模块20用于实现基于所述分层次多语义网的应用功能。例如,可基于所述分层次多语义网来实现语义识别功能。
具体地,所述语义网应用模块20具体包括用于实现语义识别的语义网识别单元,所述语义网识别单元包括:
分词子单元,用于对待分词的文本进行分词处理,获得至少一个分词。
以待分词的文本为中文文本为例,假设输入中文文本“人才培养是本科教育的第一要务”作为待分词的文本,利用中文的语义网引擎对其进行分词,获得已分词字符串“人才/培养/是/本科/教育/的/第一/要务”,并将其保存到内部存储单元。
语义网匹配子单元,用于将获得的至少一个分词与所述分层次多语义网的所有节点进行匹配。
具体地,对于已分词字符串“人才/培养/是/本科/教育/的/第一/要务”,将其一一与分层次多语义网的所有节点进行匹配,假设“人才”、“培养”、“教育”这三个概念可以与语义网节点得以匹配,将成功与语义网节点匹配的字符串保存到内部存储,即将“人才”、“培养”、“教育”保存到内部存储。
词义消歧处理子单元,用于对成功匹配分层次多语义网节点的分词进行词义消歧处理,得到消歧后的分词的概念路径,保存于词语概念路径存储库内。
具体地说,如果成功与语义网节点匹配的字符串能与超过一个语义网节点匹配上,则对该字符串进行词义消歧,将消歧后的该字符串的概念路径R2保存到词语概念路径存储库内。
如果成功与语义网节点匹配的字符串只能与语义网中一个节点匹配,则该字符串不需要进行词义消歧,直接将该字符串的概念路径R1保存到词语概念路径存储库内。
以成功匹配语义网节点的字符串为“人才”、“培养”、“教育”为例,假设“培养”能与两个语义网节点进行匹配,“人才”、“教育”只能与语义网中一个节点匹配,“培养”在语义网中出现两条概念路径:1、THING/社会活动/文教/教学/培养;2、THING/社会活动/生产/畜牧/培养,则需对其进行词义消歧处理,最后将消歧后的概念路径1保存到词语概念路径存储库中,而对于“人才”、“教育”,则不需进行词义消歧处理,则将其概念路径“THING/人/个体状况/才识/人才”、“THING/社会活动/文教/教学/教育”保存到词语概念路径存储库中。
概念路径输出子单元,用于输出该待分词在所述词语概念路径存储库内的概念路径。
以待分词中文文本“人才培养是本科教育的第一要务”为例,则输出该中文文本的文字的概念路径分别为:THING/人/个体状况/才识/人才、THING/社会活动/文教/教学/培养、THING/社会活动/文教/教学/教育。
与针对单独的语义网(如单独的通用语义网或者单独的领域语义网)进行语义识别不同的是,通过分层次多语义网的语义识别,可以实现单语义网的单独识别或者多语义网的识别,从而实现跨域分析。
例1:在对某个文本进行语义识别时,当文本里面包含有王安石这个词语,如果政治领域语义网有王安石这个概念节点,那么可以直接识别出王安石是政治领域的,同样也能获取王安石在政治领域语义网里面的路径,甚至是获取到从通用语义网开始的整个路径。
进一步的,如果文本还包括秦始皇,且历史领域语义网有秦始皇这个概念节点,那么也是可以直接识别出秦始皇属于历史领域的,同样也能获取秦始皇在历史领域语义网里面的路径,甚至是获取到从通用语义网开始的整个路径。
即在同一个文本里,里面有秦始皇,也有王安石,通过加载通用语义网和政治、历史两个领域语义网,就可以分析出秦始皇是历史领域,王安石是政治领域。
进一步的,在获得秦始皇和王安石的路径后,如果需要求秦始皇和王安石的相似度的时候,就可以通过他们在整个通用领域网的路径来获得。例如,可以知道他们都从属于人/人物这个节点下。
再进一步的,如果在政治领域语义网里面,王安石放在人/宰相/宋朝宰相/王安石,经济领域语义网里面,王安石放在人/经济学家/王安石里,不同领域同一个词放不同地方,加载政治领域语义网和经济领域语义网的时候,文章中的王安石一个词,就可以识别出不同的两条路径(语义标签),在不同领域代表不同意思,在政治领域他是宰相,在经济领域他是经济学家。
即,通过本发明实施例提供的分层次多语义网,可以实现跨域分析。
需要说明的是,在本实施例中,所述语义网管理模块10提供有操作界面;所述操作界面包括语义网挂接入口;
则所述语义网管理模块10还用于,接收用户基于所述语义网挂接入口输入的待挂接的领域语义网的信息、被挂接的通用语义网的挂接节点信息,以将所述待挂接的领域语义网挂接到所述通用语义网的与所述挂接节点信息对应的预定层次的节点上。
在本实施例中,用户可以通过语义网挂接入口输入的待挂接的领域语义网的信息(如待挂接的领域语义网的名称以及挂接节点)以及被挂接的通用语义网的挂接节点信息,此时,所述语义网管理模块10即可将所述待挂接的领域语义网挂接到所述通用语义网的与所述挂接节点信息对应的预定层次的节点上,从而实现将领域语义网自动挂接到通用语义网上。
优选地,在本实施例中,所述操作界面还包括语义网创建入口、语义网删除入口、语义网编辑入口、语义网导入入口、语义网发布入口、语义网查找入口以及语义网导出入口中的至少一个,以使得所述语义网管理模块能够实现对应的创建语义网、删除语义网、编辑语义网、导入语义网、发布语义网、查找语义网以及根据任一节点导出语义网的功能。
其中,所述操作界面作为人机交互的入口,可提供各种链接、入口等供用户操作。这些入口可以以控件、按钮、输入框的形式进行展示,本发明不做具体限定。
优选地,所述语义网应用模块20还包括:
用于实现文本分词的分词单元,用于实现词性标注的词性标注单元,用于实现句法分析的句法分析单元,用于实现语义推理的语义推理单元,用于实现情感分析的情感分析单元,用于实现语义网标注的语义网标注单元,用于实现热词分析的热词分析单元,用于实现新词发现的新词发现单元,用于实现关键词提取的关键词提取单元,用于实现摘要提取的摘要提取单元,用于实现相似度计算的相似度计算单元,用于实现语义消歧的语义消歧单元,用于实现关联关系分析的关联关系分析单元,用于实现文本对比的文本对比单元,用于实现文本分类的文本分类单元。
优选地,所述领域语义网通过分领域进行构建,以在使用时能够进行分领域的加载和调用,并实现跨域分析。
优选地,本发明的多层次语义网系统支持多语言切换,用户可以通过选择需要切换的语言,则本系统根据用户选择的语言加载相应语言的语义网,从而实现多语言支持。此外,本系统也支持不同语言的混合使用,这些方案均在本发明的保护范围之内。
请参阅图2,本发明第二实施例还提供了一种分层次多语义网方法,包括:
S201,通过语义网管理模块对分层次多语义网进行管理;其中,所述管理包括语义网的构建和编辑;所述分层次多语义网至少包括位于不同层次的通用语义网和领域语义网;所述领域语义网能够挂接到所述通用语义网上,从而与所述通用语义网形成关联,并且所述领域语义网继承所挂接的通用语义网的分类及概念;
S202,通过语义网应用模块实现基于所述分层次多语义网的应用功能;其中,所述应用功能至少包括语义识别。
本发明实施例还提供了一种分层次多语义网设备。该实施例的分层次多语义网设备包括:处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序。所述处理器执行所述计算机程序时实现上述各个分层次多语义网方法实施例中的步骤或者,所述处理器执行所述计算机程序时实现上述各装置实施例中各模块/单元的功能。
示例性的,所述计算机程序可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器中,并由所述处理器执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在所述分层次多语义网设备中的执行过程。
所述分层次多语义网设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述分层次多语义网设备可包括,但不仅限于,处理器、存储器。本领域技术人员可以理解,上述部件仅仅是分层次多语义网设备的示例,并不构成对分层次多语义网设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述分层次多语义网设备还可以包括输入输出设备、网络接入设备、总线等。
所称处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述分层次多语义网设备的控制中心,利用各种接口和线路连接整个分层次多语义网设备的各个部分。
所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述分层次多语义网设备的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
其中,所述分层次多语义网设备集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
需说明的是,以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外,本发明提供的装置实施例附图中,模块之间的连接关系表示它们之间具有通信连接,具体可以实现为一条或多条通信总线或信号线。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。

Claims (10)

1.一种分层次多语义网系统,其特征在于,包括语义网管理模块、语义网应用模块、通用语义网以及至少一个领域语义网;其中:
所述语义网管理模块,用于至少实现分层次多语义网的管理;所述分层次多语义网至少包括位于不同层次的通用语义网和领域语义网;所述领域语义网能够挂接到所述通用语义网上,从而与所述通用语义网形成关联,并且所述领域语义网继承所挂接的通用语义网的分类及概念;
语义网应用模块,用于实现基于所述分层次多语义网的应用功能;其中,所述应用功能至少包括语义识别;通过分层次多语义网的语义识别,以在使用时进行单语义网的单独识别或者多语义网的识别,实现跨域分析。
2.根据权利要求1所述的分层次多语义网系统,其特征在于,所述通用语义网根据世界所有事物的概念分成十个一级大类;其中,所述的十个一级大类包括:人、生物、具体物、抽象物、时空、特征、生物活动、社会活动、运动与变化、辅助语。
3.根据权利要求2所述的分层次多语义网系统,其特征在于,所述的十个一级大类中:
人:描述人的相关概念,这里人指具有智慧、直立行走、能够进行劳动、并能运用语言进行交际的生物;
生物:描述指除了人以外的、有生命的个体的相关概念;
具体物:存在时空中具体位置的实体的相关概念;
抽象物:抽象存在的实体的相关概念;
时空:描述时间和空间的相关概念;
特征:用于描述事物及其发展的特性的相关概念;
生物活动、社会活动、运动与变化:描述事物状态或关系变化的过程的相关概念;
辅助语:描述语法意义的虚词及用语的相关概念。
4.根据权利要求1所述的分层次多语义网系统,其特征在于,所述领域语义网包括以下的一种或多种组合:电信领域语义网、经济领域语义网、法律服务领域语义网、医药卫生语义网、人力资源领域语义网、铸造领域语义网、石油化工语义网、交通运输语义网、旅游休闲语义网、军事领域语义网、社会民生领域语义网、教育领域语义网、地理领域语义网、政治领域语义网、历史领域语义网。
5.根据权利要求1所述的分层次多语义网系统,其特征在于,所述语义网管理模块提供有操作界面;所述操作界面包括语义网挂接入口;
则所述语义网管理模块还用于,接收用户基于所述语义网挂接入口输入的待挂接的领域语义网的信息、被挂接的通用语义网的挂接节点信息,以将所述待挂接的领域语义网挂接到所述通用语义网的与所述挂接节点信息对应的预定层次的节点上。
6.根据权利要求5所述的分层次多语义网系统,其特征在于,所述操作界面还包括语义网创建入口、语义网删除入口、语义网编辑入口、语义网导入入口、语义网发布入口、语义网查找入口以及语义网导出入口中的至少一个,以使得所述语义网管理模块能够实现对应的创建语义网、删除语义网、编辑语义网、导入语义网、发布语义网、查找语义网以及根据任一节点导出语义网的功能。
7.根据权利要求1所述的分层次多语义网系统,其特征在于,所述语义网应用模块具体包括用于实现语义识别的语义网识别单元,所述语义网识别单元包括:
分词子单元,用于对待分词的文本进行分词处理,获得至少一个分词;
语义网匹配子单元,用于将获得的至少一个分词与所述分层次多语义网的所有节点进行匹配;
词义消歧处理子单元,用于对成功匹配分层次多语义网节点的分词进行词义消歧处理,得到消歧后的分词的概念路径,保存于词语概念路径存储库内;
概念路径输出子单元,用于输出该待分词在所述词语概念路径存储库内的概念路径。
8.根据权利要求7所述的分层次多语义网系统,其特征在于,所述语义网应用模块还包括:
用于实现文本分词的分词单元,用于实现词性标注的词性标注单元,用于实现句法分析的句法分析单元,用于实现语义推理的语义推理单元,用于实现情感分析的情感分析单元,用于实现语义网标注的语义网标注单元,用于实现热词分析的热词分析单元,用于实现新词发现的新词发现单元,用于实现关键词提取的关键词提取单元,用于实现摘要提取的摘要提取单元,用于实现相似度计算的相似度计算单元,用于实现语义消歧的语义消歧单元,用于实现关联关系分析的关联关系分析单元,用于实现文本对比的文本对比单元,用于实现文本分类的文本分类单元。
9.根据权利要求1所述的分层次多语义网系统,其特征在于,所述领域语义网通过分领域进行构建,以在使用时能够进行分领域的加载和调用,并实现跨域分析。
10.一种分层次多语义网方法,其特征在于,包括:
通过语义网管理模块对分层次多语义网进行管理;所述分层次多语义网至少包括位于不同层次的通用语义网和领域语义网;所述领域语义网能够挂接到所述通用语义网上,从而与所述通用语义网形成关联,并且所述领域语义网继承所挂接的通用语义网的分类及概念;
通过语义网应用模块实现基于所述分层次多语义网的应用功能;其中,所述应用功能至少包括语义识别;通过分层次多语义网的语义识别,以在使用时进行单语义网的单独识别或者多语义网的识别,实现跨域分析。
CN201810777355.XA 2018-07-16 2018-07-16 一种分层次多语义网系统及方法 Active CN108959610B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810777355.XA CN108959610B (zh) 2018-07-16 2018-07-16 一种分层次多语义网系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810777355.XA CN108959610B (zh) 2018-07-16 2018-07-16 一种分层次多语义网系统及方法

Publications (2)

Publication Number Publication Date
CN108959610A CN108959610A (zh) 2018-12-07
CN108959610B true CN108959610B (zh) 2022-06-14

Family

ID=64481169

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810777355.XA Active CN108959610B (zh) 2018-07-16 2018-07-16 一种分层次多语义网系统及方法

Country Status (1)

Country Link
CN (1) CN108959610B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102799677A (zh) * 2012-07-20 2012-11-28 河海大学 一种基于语义的水利领域信息检索系统及方法
CN107870898A (zh) * 2017-10-11 2018-04-03 广州极天信息技术股份有限公司 一种面向工程应用的领域语义网建模方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102799677A (zh) * 2012-07-20 2012-11-28 河海大学 一种基于语义的水利领域信息检索系统及方法
CN107870898A (zh) * 2017-10-11 2018-04-03 广州极天信息技术股份有限公司 一种面向工程应用的领域语义网建模方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
基于分层次语义网的领域知识云服务平台;陈丽莎等;《科技成果》;20170701;第1-4页 *
基于框架的语义题库推荐系统的研究与应用;冯明杰;《中国优秀硕士学位论文全文数据库》;20160331;第9-53页 *
网络答疑本体的生成与匹配方法研究;孙霞等;《计算机应用研究》;20090630;第26卷(第6期);第2288-2290页 *

Also Published As

Publication number Publication date
CN108959610A (zh) 2018-12-07

Similar Documents

Publication Publication Date Title
JP6105692B2 (ja) 複雑な知識表現を分析および合成するシステムおよび方法
Ellen The cognitive geometry of nature: a contextual approach
Carboni et al. Towards a conceptual foundation for documenting tangible and intangible elements of a cultural object
Lenat et al. The evolution of CycL, the Cyc representation language
Bergman et al. Knowledge Representation Practionary
Pavlić et al. Nodes of knowledge method for knowledge representation
Kaur et al. Semantic-based integrated plagiarism detection approach for english documents
Sartini et al. Icon: An ontology for comprehensive artistic interpretations
Periñán-Pascual A knowledge-engineering approach to the cognitive categorization of lexical meaning.
Sheikha Text mining Twitter social media for Covid-19: Comparing latent semantic analysis and latent Dirichlet allocation
CN109101550B (zh) 语义网管理系统、方法、设备以及存储介质
Beneventano et al. Semantic annotation of the CEREALAB database by the AGROVOC linked dataset
CN108959610B (zh) 一种分层次多语义网系统及方法
CN112307772A (zh) 一种基于语义本体的广彩瓷知识库的构建方法
Bolognesi Flickr® distributional tagspace: Evaluating the semantic spaces emerging from Flickr® tag distributions
Riesen et al. A novel data set for information retrieval on the basis of subgraph matching
Tsvetovat et al. NetIntel: A database for manipulation of rich social network data
Fellbaum et al. When WordNet met ontology
AU2015268637B2 (en) Systems and methods for analyzing and synthesizing complex knowledge representations
Weigand et al. An ontology of IS design science research artefacts
Ruangrajitpakorn et al. Automatic ontology development from semi-structured data in web-portal: Towards ontology of thai rice knowledge
KR20210020337A (ko) 도식을 이용한 아이디에이션 플랫폼 장치 및 방법
Alberts et al. Several required OWL features for indigenous knowledge management systems
Allen et al. Coordinating and Integrating Faceted Classification with Rich Semantic Modeling
Saunders Surveillance Graphs: Vulgarity and Cloud Orthodoxy in Linked Data Infrastructures

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant