CN110633348A - 一种基于本体的高性能计算资源池化索引查询方法 - Google Patents

一种基于本体的高性能计算资源池化索引查询方法 Download PDF

Info

Publication number
CN110633348A
CN110633348A CN201910693793.2A CN201910693793A CN110633348A CN 110633348 A CN110633348 A CN 110633348A CN 201910693793 A CN201910693793 A CN 201910693793A CN 110633348 A CN110633348 A CN 110633348A
Authority
CN
China
Prior art keywords
ontology
resource
model
concept
wqril
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910693793.2A
Other languages
English (en)
Other versions
CN110633348B (zh
Inventor
任开军
周翱隆
李小勇
邓科峰
张文
任小丽
黄浩炜
曹书锦
杨云天
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National University of Defense Technology
Original Assignee
National University of Defense Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National University of Defense Technology filed Critical National University of Defense Technology
Priority to CN201910693793.2A priority Critical patent/CN110633348B/zh
Publication of CN110633348A publication Critical patent/CN110633348A/zh
Application granted granted Critical
Publication of CN110633348B publication Critical patent/CN110633348B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/316Indexing structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3338Query expansion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于本体的高性能计算资源池化索引查询方法,包括构建高性能计算资源的本体模型;建立基于WordNet的快速资源索引列表;获取输入的查询关键词;根据所述的快速资源索引列表返回查询结果。本发明构建出高性能计算资源本体模型,为跨域超算中心资源的一体化语义表示提供了支撑,有效消除了软硬件资源接口语义歧义,构建出统一透明的多域服务资源池;利用WordNet对快速服务查询列表QSQL进行扩展,支持基于语义模糊化匹配的资源发现;实现对资源或服务的高效语义发现,不仅能够保证传统语义发现的质量,而且实现了服务发现效率的较大提升。

Description

一种基于本体的高性能计算资源池化索引查询方法
技术领域
本发明属于计算资源综合利用领域,具体涉及一种基于本体的高性能计算资源池化索引查询方法。
背景技术
当前数据计算正在加速普及,高性能计算更是成为了支撑科学发现和技术创新的重要引擎,其为推动人类的科技发展和进步发挥了巨大作用。然而,随着E级计算机及其应用软件的研发和部署,高性能计算资源的规模与计算服务能力不匹配的问题日益突出。如何推进高性能计算环境运行和使用模式在当今网络条件下的转变,提升高性能计算基础设施服务能力,促进计算服务能力的普及,满足日益增长的新兴互联网人工智能等应用对高性能计算与海量数据处理能力的迫切需求,已成为高性能计算应用领域亟需解决的瓶颈问题。
广域网络环境下,多超算中心资源在硬件体系结构、系统软件、资源管理、应用软件、网络通信、I/O接口等方面呈现出复杂多样的特点。现有跨地域软硬件资源难以高效整合和统一利用,不利于高性能基础设施高效地为各应用领域提供透明计算支撑,降低了多域异构高性能计算中心软硬件资源的易用性和利用效率,因此亟需研究高性能资源统一建模与体系结构表示方法及检索方法。
尽管目前国内外团队在高性能计算服务能力研究方面做了许多尝试,但这些尝试依然存在不足:第一,已有解决方案大多采用了可能降低性能的云计算模式;第二,解决方案仅在不同资源管理接口上层进行简单集成。因此,亟需提出能够完全解决分布异构高性能资源统一描述,以及面向服务统一体系结构等本质性问题的方法。
发明内容
本发明的目的在于提供一种基于本体的高性能计算资源池化索引查询方法,用于对广域网络环境下高性能资源进行一体化语义表示方法,以便进一步对高性能资源进行池化索引。
本发明的目的是这样实现的,包括如下步骤:
步骤1,构建高性能计算资源的本体模型HPCRO;
步骤2,建立基于WordNet的快速资源索引列表WQRIL;
步骤3,获取输入的查询关键词;
步骤4,根据快速资源索引列表WQRIL返回查询结果。
进一步的,步骤1中所述的构建高性能计算资源的本体模型的过程包括以下步骤:
步骤101,从主流的IaaS平台,以及已发表的相关论文中提取高性能计算领域的相关概念,形成概念集合;
步骤102,将得到的概念集以树形层次结构进行整理,并定义概念之间的关系属性;
步骤103,验证本体模型的有效性和一致性。
进一步的,步骤2中所述的快速资源索引列表WQRIL包括链接域和数据域,所述的数据域用于根据概念与发布服务模型之间的语义关系,在相应的数据向量中记录服务信息,所述的链接域用于记录之间的关系,所述的快速资源索引列表是对QSQL的扩展,包括QSQL列表、一个标志字段flag和一个本体词指针ontology_word,所述的标志字段来区分本体概念和扩展概念,所述的本体词指针用于指向本体概念的WQRIL数据结构。
进一步的,步骤2中所述的基于WordNet的快速资源索引列表WQRIL的建立方法包括以下步骤:
步骤201,对每一个发布资源或服务模型参数Ik,首先将它映射到最佳本体概念Ak
步骤202,判断Ak是否已经在WQRIL中存在,如果不存在,则执行以下步骤:
步骤20201,建立本体概念Ak的WQRIL元素数据结构,并将该数据模型插入到资源索引模型中;
步骤20202,将标志字段flag置为0;
步骤20203,将本体词指针ontology_word置为空;
步骤20204,从WordNet中提取本体概念Ak的同义词集,并将这些同义词插入到索引模型中;
步骤20205,将同义词概念的标志字段flag置为1;
步骤20206,将同义词概念的本体词指针ontology_word指向本体概念Ak的WQRIL数据结构;
步骤20207,将链接域和数据域置为空。
步骤203,如果Ak已经存在于资源索引列表中,则对本体概念Ak对应的WQRIL数据结构进行更新即可。
所述的高性能计算资源包括硬件资源和软件资源,所述的硬件资源类包括计算资源类,网络资源类,存储资源类和加速器资源类;所述的软件资源类包括软件资源类,编译环境资源类,操作系统资源类和应用算法库类。
所述的关系属性包括等价关系,上下位关系和兄弟关系。
所述的验证本体模型的有效性和一致性采用本体推理的方法。
所述的主流的IaaS平台包括Amazon,Azure,阿里云或/和华为云。。
与现有技术相比,本发明具有以下技术效果:
1、实现了广域网络环境下高性能资源的一体化表示,本发明充分研究和收集了高性能计算领域的相关概念词汇,定义概念词汇之间的关系属性,构建出高性能计算资源本体模型(HPCRO),为跨域超算中心资源的一体化语义表示提供了支撑,有效消除了软硬件资源接口语义歧义,构建出统一透明的多域服务资源池。
2、支持模糊查询,本发明基于本体推理和图存储技术构建了高性能资源索引模型WQRIM,利用WordNet对快速服务查询列表QSQL进行扩展,支持基于语义模糊化匹配的资源发现。
3、实现高效查询,本发明构造的高性能资源池化索引模型,支持对资源或服务的高效语义发现,不仅能够保证传统语义发现的质量,而且实现了服务发现效率的较大提升。
附图说明
图1为本发明一种基于本体的高性能计算资源池化索引查询方法的流程示意图;
图2为本发明实施例中的本体模型示意图;
图3为本发明实施例中的本体模型的概念关系示意图;
图4为本发明实施例中硬件资源类的分类示意图;
图5为本发明实施例中软件资源类的分类示意图;
图6为本发明的QSQL基本数据模型结构示意图;
图7为本发明的WQRIL基本数据模型结构示意图;
图8为本发明实施例中四种不同方法的召回率和准确率对比图。
具体实施方式
下面结合附图对本发明作进一步的说明,但不以任何方式对本发明加以限制,基于本发明教导所作的任何变换或替换,均属于本发明的保护范围。
为提供广域网络环境下跨地域多超算中心统一、高效、便捷的高性能计算服务,解决多超算中心资源类型复杂、资源管理软件接口多样、软硬件协同效率不高等复杂问题,构建资源一体化表示模型是解决问题的基础,由此本发明提出以服务标准对计算资源、加速器资源、存储资源、I/O资源、网络资源、操作系统、编译环境和应用算法库等不同类型的高性能软硬件资源进行虚拟封装,建立包含资源类型、资源属性、逻辑关系和资源间数据传递等信息的语义模型。
在计算机科学和信息科学领域,本体是指对共享概念系统的正式,清晰和详细的解释。它提供了一个共享词汇表,包括对象的类型或概念及其在特定领域中存在的属性和关系。
作为本发明的实施例,参阅图1所示,为本发明实施例一种基于本体的高性能计算资源池化索引方法的流程示意图。所述的一种基于本体的高性能计算资源池化索引方法,包括
步骤1,构建高性能计算资源的本体模型HPCRO(High-Performance ComputingResource Ontology);
步骤2,建立基于WordNet的快速资源索引列表WQRIL(WordNet-based QuickResource Index List);
步骤3,获取输入的查询关键词;
步骤4,根据快速资源索引列表WQRIL返回查询结果。
基于本体的建模本质上是对某领域共享的概念定义一个公共的词汇表,为这些概念及其之间的关系提供形式化的、明确的说明。采用本体技术建模多域分布高性能软硬件资源能够实现领域知识在用户、设备和服务之间的共享、重用及互操作,并为领域知识提供形式化的分析和推理。
考虑用户在某个时间(isTime)位于某个地方(isLocatedIn)并存在于(existsIn)物理环境中的场景,当用户处于(isIn)某种情况时,他/她使用(使用)硬件设备所需的软件服务,需要在(runOn)相关硬件设备上运行软件服务,这些硬件设备可以携带或托管多个软件服务和调用附近设备的服务。
为了让机器更好地理解用户的需求,本发明构建域本体,其中包含概念和它们之间的关系。但是,跨区域分布式高性能计算环境涉及许多概念和复杂资源类型。旨在获得最根本的关键概念实体及其关系,利用5W1H可以原则有效地分类上下文,主要用于确定本体元素,如上下文,用户,服务,设备,环境,时间和位置。本体元素与5W1H原理的对应关系如下表所示。
属性 元素 描述
Why Scenario 描述用户的要求或目的
Who User 描述作为用户或智能代理的实体
How Service 描述有关为用户提供某些服务以帮助完成任务的运营商的信息
What Device 描述计算环境
What Environment 描述物理环境,例如物理条件和天气
Where Location 描述位置信息
When Time 描述时间信息
利用5W1H原理,本发明对一般场景进行建模,得到如图2所示的本体模型示意图,通过该模型,机器可以准确地理解实体之间的操作关系。
在本发明实施例中,高性能计算资源的本体模型为多域分布的高性能软硬件资源提供一体化描述方法,构建高性能计算资源的本体模型的过程包括:
步骤101,从主流的IaaS平台,以及已发表的相关论文中提取高性能计算领域的相关概念,形成概念集合;
步骤102,将得到的概念集以树形层次结构进行整理,并定义概念之间的关系属性;一个简单的示例图如图3所示;
步骤103,验证本体模型的有效性和一致性。
所述的主流的IaaS平台包括Amazon,Azure,阿里云或/和华为云。
所述的关系属性包括等价关系,上下位关系和兄弟关系。例如,“is-a”可以定义父类与子类之间的关系。
所述的高性能计算资源包括硬件资源和软件资源,其中,硬件资源是高性能计算中心提供的最基本服务,一方面,超算中心发布具有不同硬件资源组合的服务;另一方面,用户根据他们的需求进行个性化请求。提供硬件资源的最终目标是满足用户在软件操作中的需求,所以软件资源也已成为高性能计算中心提供的基本服务。
进一步地,在本发明实施例中,所述的硬件资源类包括计算资源类(Compute),网络资源类(Network),存储资源类(Storage)和加速器资源类(Accelerator),如图4所示,计算资源类:提供程序(高性能计算中心)提供计算功能,涉及CPU,GPU和内存信息。CPU还具有Core(s),Frequency和Architecture属性,GPU具有大小和模型属性,内存涉及到大小和模式属性。硬件资源类通过hasComputeResource属性与计算资源类建立关系,网络资源类涉及带宽,延迟和协议属性。当提供程序释放存储服务时,存储资源类需要描述大小,延迟,IOPS和吞吐量信息。加速器资源类包括GPUAccelerator和FPGAAccelerator子类。
在本发明实施例中,所述的软件资源类包括软件资源类(Software),编译环境资源类(Compiler),操作系统资源类(OS)和应用算法库类(ApplicationLibrary),如图5所示。高性能计算已广泛应用于生物医学,天文学,智能城市,新能源等领域,软件资源类可以根据不同的应用领域细分该类。编译环境资源类具有Environment属性。操作系统资源类具有OSType属性。应用算法库类具有支持软件操作和数据处理的属性。
本体推理是通过处理机制提取显示定义和声明中隐含的知识的过程。对于本体开发人员,它可用于检测本体定义中的冲突,消除不一致性,优化本体表达式以及实现本体融合。
所述的验证本体模型的有效性和一致性采用本体推理的方法。
本发明实施例中定义了isLocatedIn属性和hasResource属性作为相反的属性(owl:inverseOf),表示HPC资源实体和Location实体之间的关系。考虑以下因素,例如,资源R位于(isLocatedIn)超级计算中心A,用户的查询是超级计算中心A是否有资源(hasResource)R。如果没有本体推理原理(owl:inverseOf),用户无法获得,相反,HPCRO可以通过本体推理向用户呈现所需的搜索结果。此外,hasResource属性被定义为传递属性(owl:TransitiveProperty)。如果超级计算中心A具有(hasResource)计算节点N并且节点N具有(hasResource)GPU资源G,我们可以通过使用本体推理原理(owl:TransitiveProperty)知道超级计算中心A具有(hasResource)GPU资源G。
通过使用HPCRO模型,跨区域超级计算中心根据统一的本体概念描述和发布资源,可以解决异构高性能资源复杂,无法高效集成和利用的问题。此外,通过本体推理可以获得更多的语义信息。在资源发布和发现过程中,通过本体推理获得概念的超类,子类,等价类,兄弟类,祖父类和孙类。
基于构建的本体模型统一了异构计算资源,加速器资源,存储资源,网络资源,操作系统,编译环境和应用程序算法库的语义表示。在本体模型的基础上,封装各种硬件和软件资源,并以服务的形式构建资源池索引列表。
以OWL语言表示的域模型可以由相应的有向语义网络结构图表示,并且本体概念被映射到顶点图表。概念之间的关系映射到图的弧,并且弧的类型对应于概念。建立快速服务查询列表QSQL(Quick Service Query List)主要借鉴语义网络结构图的表示和存储方法。使用图的邻接表存储技术可以用来表示QSQL的基本数据模型元素。邻接列表是图的链存储结构。每个本体概念顶点对应于头节点,本体概念之间的不同语义关系由不同类型的弧节点表示。图6显示了QSQL元素的基本数据模型结构。这种方法基于本体概念建立数据模型。数据模型包括链接域和数据域。链接域可以记录本体概念之间的关系,当资源被释放时,通过语义推理进行本体概念,以避免在已发布的服务模型可能具有QSQL中已存在的相同映射本体概念时重复推理。数据域主要用于根据概念与发布服务模型之间的语义关系,在相应的数据向量中记录服务信息,如精确向量,插件向量,Sib向量,Grapar向量和Grachd向量。不同的数据向量表示不同的语义匹配度。基于QSQL,可以将语义服务发现阶段的计算推理推进到服务发布阶段,并根据设计的本体概念数据模型动态构建QSQL,以获得包含语义的资源索引列表关系。
本发明实施例采用QSQL模型扩展了语义,更具体地说,它通过本体获得超类,子类,等价类,祖父类和孙类的概念。为了简化复杂性,该方法基于两个假设。首先,必须关联在QSQL中发布的资源或服务具有特定的本体域;其次,用户的查询请求必须映射到本体中的语义概念。事实上,将具体领域本体映射到参数模型对于大多数服务提供商和服务请求者来说是一项具有挑战性的任务。一方面,虽然本体可以提供域规范,但它不包含一整套概念词。另一方面,服务提供商可以根据规范发布信息,但大多数情况下请求者没有本体知识。
显然,这些假设降低了问题的复杂性。同时,它们也降低了模型的实用性。对于一般用户,他们希望简化尽可能多地搜索过程,就像Google搜索引擎一样,用户只需输入关键字即可获得排名结果。在某些情况下,服务请求者可以无法准确描述所需信息。
因此,用户必须使用基于语义的模糊匹配功能。换句话说,即使是用户检索未参与本体模型的单词,系统应根据语义相似度给出推荐结果。为了支持基于语义的模糊匹配,本发明实施例使用一个名为WordNet的词法数据库来扩展QSQL结构。
WordNet表面上类似于词库,因为它将名词,动词,形容词和副词分组成一组认知同义词(同义词),每个都表达不同的概念。WordNet中单词之间的主要关系是同义词,如CPU和中央处理器之间。同义词集中的单词必须来自相同的词汇类别并具有相似的含义。到目前为止,WordNet包含超过100000个同义词。
在本发明的实施例中,提出了一个基于WordNet的快速资源索引列表,利用WordNet收集索引列表中发布的本体概念的相应同义词。一旦在索引列表中发布了一个概念,其同义概念也会在列表中发布。与QSQL相比,在数据模型中添加了一个标志字段(flag∈{0,1})和一个本体词指针来区分本体概念和扩展概念。如果一个概念是本体,则将flag的值设置为0,将本体词指针设置为NULL,否则,flag标志等于1,并且本体词指针指向本体概念的WQRIL数据结构,其通过扩展获得同义词。WQRIL元素的基本数据结构如下如图7所示。
所述的基于WordNet的快速资源索引列表WQRIL包括链接域和数据域,所述的数据域用于根据概念与发布服务模型之间的语义关系,在相应的数据向量中记录服务信息,所述的链接域用于记录之间的关系,所述的快速资源索引列表是对QSQL的扩展,包括QSQL列表以及一个标志字段和一个本体词指针,所述的标志字段来区分本体概念和扩展概念,所述的本体词指针用于指向本体概念的WQRIL数据结构。
WQRIL利用WordNet对HPCRO模型中的本体概念进行同义词扩展,以支持基于语义模糊化匹配的高效资源发现。步骤2所述的基于WordNet的快速资源索引列表WQRIL的建立方法的输入是高性能计算中心发布的资源或服务的输入参数Ik(1≤k≤n),n为所发布的资源或服务的输入参数的数目,输出是快速资源索引列表WQRIL,其具体构建步骤包括:
步骤201,对每一个发布资源或服务模型参数Ik,首先将它映射到最佳本体概念Ak
步骤202,判断Ak是否已经在WQRIL中存在,如果不存在,则执行以下步骤:
步骤20201,建立本体概念Ak的WQRIL元素数据结构,并将该数据模型插入到资源索引模型中;
步骤20202,将标志字段flag置为0;
步骤20203,将本体词指针ontology_word置为空;
步骤20204,从WordNet中提取本体概念Ak的同义词集,并将这些同义词插入到索引模型中;
步骤20205,将同义词概念的标志字段flag置为1;
步骤20206,将同义词概念的本体词指针ontology_word指向本体概念Ak的WQRIL数据结构;
步骤20207,将链接域和数据域置为空(NULL)。
步骤203,如果Ak已经存在于资源索引列表中,则对本体概念Ak对应的WQRIL数据结构进行更新即可。
通过上述方法,即可得到高性能计算资源或服务的高效索引模型。该模型支持基于语义模糊化匹配的高效资源或服务发现。通过该索引模型,不仅能够取得传统语义发现的质量,还实现了服务发现效率的巨大提升。
下面以发布CPU资源为例,说明本发明的具体实施方式。
首先将发布资源模型映射到HPCRO模型中的最佳本体概念CPU;
判断本体概念CPU是否已存在于WQRIL中,这里因为是首次发布,因此判定为假,按照构建资源索引模型方法的步骤202执行;
构建本体概念CPU的WQRIL元素数据结构,并将该元素插入到索引模型中;
分别将flag置为0,ontology_word指针置为空(NULL);
从WordNet中提取本体概念CPU的同义词集{central_processing_unit,central_processor,processor,mainframe},分别构建这些同义词概念的索引列表元素数据结构,并将这些元素插入到快速索引模型中;
分别将这些元素的flag字段置为1,ontology_word指针指向本体概念CPU对应的数据结构。
在本发明的实施例中采用定性分析和定量评估的方法来评估并说明了所提出模型的可行性。在实验中,基本操作系统是Ubuntu 16.04 LTS,Mysql 8.0.13用于构建WQRIL数据库,选择Racer 2.0作为推理器,它是一个免费的开源本体推理工具,WordNet 3.0用作词汇数据库。
在定性分析部分,实验中主要通过定性分析方法验证本体模型的一致性。检查本体的一致性是有必要的,因为它可以评估类层次结构,对象属性层次结构,数据属性层次结构,类断言,对象属性断言和相同的个体。在实验中,选择Racer推理器来验证本体模型。
在定量评估部分,为了验证本发明方法支持基于语义的模糊匹配的有效性,考虑到缺乏关于跨区域分布式高性能计算资源的实际资源模型,实验中使用我们提出的本体生成并发布了500个资源模型到索引列表。此外,实验还生成50个查询,这些查询涉及10个本体概念的模糊同义查询,验证了WQRIL支持基于语义的模糊匹配的有效性。
在实验中,主要对本发明方法,基于QSQL的方法,传统的基于直接推理的方法和基于关键词的方法在资源发现的响应时间,召回率和准确率上的比较。
(1)每个查询的平均响应时间:响应时间主要表示从服务查询开始到查询结果的最终返回的时间。在测试中,计算每个查询的平均响应时间,实验结果如下表所示。
索引模型 每个查询的平均反应时间
基于QSQL的方法 29ms
基于直接推理的方法 928ms
基于关键词的方法 27ms
本发明方法 29ms
由表可知,WQRIL主要用于快速资源发现,在资源发布阶段完成语义推理,从而确保每个查询的响应时间短。在WQRIL的帮助下,本发明方法实现了对查询的快速响应。虽然使用WordNet扩展了本体概念,但是本体的规模并不太大而不会影响性能。
(2)资源发现的质量:在实验中,使用召回率和准确率作为评估指标,召回率表示结果的完整性,准确率表示结果的准确性。
本发明方法不仅包括超类,子类,等价类,兄弟类,祖父类和孙子类等语义关系,还扩展了本体概念的同义词,在一定程度上提高了资源发现的质量。图8显示了四种不同方法的召回率(Recall)和准确率(Precision)。
由图可知,本发明方法的平均精确率为94.76%,优于其他方法。另外,由于查询请求包含10个其他方法无法处理的模糊同义词概念,因此本发明方法获得的回忆率最高,为92.34%,远远高于其他方法。
实验结果表明,WQRIL可以解决资源模糊匹配问题。一方面,本发明方法为跨区域硬件和软件资源的统一管理提供了解决方案。另一方面,本发明方法提高了资源发现的质量,减轻了普通用户掌握语义知识的负担。即使用户不具备本体知识,支持基于语义的模糊匹配的方法也确保用户可以准确地检索资源。
本发明实施例充分研究和收集了高性能计算领域的相关概念词汇,定义概念词汇之间的关系属性,构建出高性能计算资源本体模型(HPCRO),为跨域超算中心资源的一体化语义表示提供了支撑,有效消除了软硬件资源接口语义歧义,构建出统一透明的多域服务资源池,为广域网络环境下高性能资源的一体化表示提供了较好的方案;本发明实施例基于本体推理和图存储技术构建了高性能资源索引模型WQRIM,利用WordNet对快速服务查询列表QSQL进行扩展,支持基于语义模糊化匹配的资源发现,在用户并未掌握本体模型知识的情况下,系统也能基于语义相似性给出推荐结果;本发明实施例构造的高性能资源池化索引模型,支持对资源或服务的高效语义发现,不仅能够保证传统语义发现的质量,而且实现了服务发现效率的巨大提升。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本公开的范围被限于这些例子;在本发明的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以变换顺序实现,并存在如上所述的本发明的不同方面的许多其它变化,为了简明它们没有在细节中提供。本发明的实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此,凡在本发明的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种基于本体的高性能计算资源池化索引查询方法,其特征在于,包括如下步骤:
步骤1,构建高性能计算资源的本体模型HPCRO;
步骤2,建立基于WordNet的快速资源索引列表WQRIL;
步骤3,获取输入的查询关键词;
步骤4,根据快速资源索引列表WQRIL返回查询结果。
2.根据权利要求1所述的高性能计算资源池化索引查询方法,其特征在于,步骤1中所述的构建高性能计算资源的本体模型的过程包括以下步骤:
步骤101,从主流的IaaS平台,以及已发表的论文中提取高性能计算领域的相关概念,形成概念集合;
步骤102,将得到的概念集以树形层次结构进行整理,并定义概念之间的关系属性;
步骤103,验证本体模型的有效性和一致性。
3.根据权利要求1或2所述的高性能计算资源池化索引查询方法,其特征在于,步骤2中所述的快速资源索引列表WQRIL包括链接域和数据域,所述的数据域用于根据概念与发布服务模型之间的语义关系,在相应的数据向量中记录服务信息,所述的链接域用于记录本体概念之间的关系,所述的快速资源索引列表WQRIL是对QSQL的扩展,包括QSQL列表、一个标志字段flag和一个本体词指针ontology_word,所述的标志字段来区分本体概念和扩展概念,所述的本体词指针用于指向本体概念的WQRIL数据结构。
4.根据权利要求3所述的高性能计算资源池化索引查询方法,其特征在于,步骤2中所述的基于WordNet的快速资源索引列表WQRIL的建立过程包括以下步骤:
步骤201,对每一个发布资源或服务模型参数Ik,首先将它映射到最佳本体概念Ak
步骤202,判断Ak是否已经在WQRIL中存在,如果不存在,则执行以下步骤:
步骤20201,建立本体概念Ak的WQRIL元素数据结构,并将该数据模型插入到资源索引模型中;
步骤20202,将标志字段flag置为0;
步骤20203,将本体词指针ontology_word置为空;
步骤20204,从WordNet中提取本体概念Ak的同义词集,并将这些同义词插入到索引模型中;
步骤20205,将同义词概念的标志字段flag置为1;
步骤20206,将同义词概念的本体词指针ontology_word指向本体概念Ak的WQRIL数据结构;
步骤20207,将链接域和数据域置为空。
步骤203,如果Ak已经存在于资源索引列表中,则对本体概念Ak对应的WQRIL数据结构进行更新即可。
5.根据权利要求1或4所述的高性能计算资源池化索引查询方法,其特征在于,所述的高性能计算资源包括硬件资源和软件资源,所述的硬件资源类包括计算资源类,网络资源类,存储资源类和加速器资源类;所述的软件资源类包括软件资源类,编译环境资源类,操作系统资源类和应用算法库类。
6.根据权利要求2或5所述的高性能计算资源池化索引查询方法,其特征在于,所述的关系属性包括等价关系,上下位关系和兄弟关系。
7.根据权利要求6所述的高性能计算资源池化索引查询方法,其特征在于,所述的验证本体模型的有效性和一致性采用本体推理的方法。
8.根据权利要求2或7所述的高性能计算资源池化索引查询方法,其特征在于,所述的主流的IaaS平台包括Amazon,Azure,阿里云或/和华为云。
CN201910693793.2A 2019-07-30 2019-07-30 一种基于本体的高性能计算资源池化索引查询方法 Active CN110633348B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910693793.2A CN110633348B (zh) 2019-07-30 2019-07-30 一种基于本体的高性能计算资源池化索引查询方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910693793.2A CN110633348B (zh) 2019-07-30 2019-07-30 一种基于本体的高性能计算资源池化索引查询方法

Publications (2)

Publication Number Publication Date
CN110633348A true CN110633348A (zh) 2019-12-31
CN110633348B CN110633348B (zh) 2021-05-04

Family

ID=68969046

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910693793.2A Active CN110633348B (zh) 2019-07-30 2019-07-30 一种基于本体的高性能计算资源池化索引查询方法

Country Status (1)

Country Link
CN (1) CN110633348B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111581334A (zh) * 2020-05-12 2020-08-25 中国人民解放军国防科技大学 一种基于数据本体和列表的海洋数据服务发布方法
CN113297258A (zh) * 2021-04-25 2021-08-24 上海淇玥信息技术有限公司 一种基于目标人群数据提取的定制化信息推送方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101710318A (zh) * 2009-09-08 2010-05-19 中国农业大学 蔬菜供应链知识智能获取系统
CN103425646A (zh) * 2012-05-14 2013-12-04 阿里巴巴集团控股有限公司 一种web服务发现方法及其装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102810114A (zh) * 2012-06-13 2012-12-05 天津大学 基于本体的个人计算机资源管理系统
CN108595424A (zh) * 2018-04-19 2018-09-28 北京科技大学 一种智能家居中基于领域本体的设备搜索方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101710318A (zh) * 2009-09-08 2010-05-19 中国农业大学 蔬菜供应链知识智能获取系统
CN103425646A (zh) * 2012-05-14 2013-12-04 阿里巴巴集团控股有限公司 一种web服务发现方法及其装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111581334A (zh) * 2020-05-12 2020-08-25 中国人民解放军国防科技大学 一种基于数据本体和列表的海洋数据服务发布方法
CN113297258A (zh) * 2021-04-25 2021-08-24 上海淇玥信息技术有限公司 一种基于目标人群数据提取的定制化信息推送方法及装置

Also Published As

Publication number Publication date
CN110633348B (zh) 2021-05-04

Similar Documents

Publication Publication Date Title
Cifariello et al. Wiser: A semantic approach for expert finding in academia based on entity linking
Munir et al. The use of ontologies for effective knowledge modelling and information retrieval
Kang et al. Cloudle: an ontology-enhanced cloud service search engine
Kang et al. Ontology and search engine for cloud computing system
US20060242130A1 (en) Information retrieval using conjunctive search and link discovery
Dat et al. STING algorithm used English sentiment classification in a parallel environment
Toch et al. A semantic approach to approximate service retrieval
Della Valle et al. Order matters! harnessing a world of orderings for reasoning over massive data
Globa et al. Increasing web services discovery relevancy in the multi-ontological environment
Gao et al. Learning vertex representations for bipartite networks
Dosso et al. Search text to retrieve graphs: a scalable RDF keyword-based search system
CN110633348B (zh) 一种基于本体的高性能计算资源池化索引查询方法
Al-Sayed et al. An intelligent cloud service discovery framework
Bae et al. Semantic similarity method for keyword query system on RDF
Quintero et al. Dis-c: conceptual distance in ontologies, a graph-based approach
Li et al. Research on distributed search technology of multiple data sources intelligent information based on knowledge graph
Zhu et al. Matching sensor ontologies with simulated annealing particle swarm optimization
Bova et al. Simulation of the semantic network of knowledge representation in intelligent assistant systems based on ontological approach
Abad-Navarro et al. Semankey: a semantics-driven approach for querying RDF repositories using keywords
Antoniou et al. The Semantic Web: Research and Applications: 8th Extended Semantic Web Conference, ESWC 2011, Heraklion, Crete, Greece, May 29–June 2, 2011. Proceedings, Part II
Omar et al. A review on feature based approach in semantic similarity for multiple ontology
Wang et al. Technical survey graph databases and applications
Zhou et al. Building quick resource index list using wordnet and high-performance computing resource ontology towards efficient resource discovery
Salehpour et al. SymphonyDB: A Polyglot Model for Knowledge Graph Query Processing
Bragilovski et al. Searching for class models

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant