CN110764907A - 一种云计算资源图谱构建方法 - Google Patents

一种云计算资源图谱构建方法 Download PDF

Info

Publication number
CN110764907A
CN110764907A CN201910940929.5A CN201910940929A CN110764907A CN 110764907 A CN110764907 A CN 110764907A CN 201910940929 A CN201910940929 A CN 201910940929A CN 110764907 A CN110764907 A CN 110764907A
Authority
CN
China
Prior art keywords
resource
cloud
cloud computing
resources
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910940929.5A
Other languages
English (en)
Inventor
万玉晴
董晶
刘庚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Taiji Computer Corp Ltd
Original Assignee
Taiji Computer Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Taiji Computer Corp Ltd filed Critical Taiji Computer Corp Ltd
Priority to CN201910940929.5A priority Critical patent/CN110764907A/zh
Publication of CN110764907A publication Critical patent/CN110764907A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/288Entity relationship models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种云计算资源图谱构建方法,包括以下步骤:将云计算资源按照多个不同的类别进行分类;采用将不同的类别相组合的方式定义云计算资源的属性;根据属性对云计算资源进行层次组织形成云资源实体集,云资源实体集包括多个云资源实体;根据属性的类型采用对应的相似度计算方法度量多个云资源实体之间的相似度,生成相似度特征;通过分类器对相似度特征进行分类,得到分类结果;通过集成学习对分类结果进行综合形成云资源实体关系集;根据云资源实体集和云资源实体关系集构建出云资源图谱。在能很大程度上提高海量云计算资源的资源发现效率,能支持语义化的资源与需求动态匹配,提升资源利用率和需求满足度。

Description

一种云计算资源图谱构建方法
技术领域
本发明涉及云计算的技术领域,具体来说,涉及一种云计算资源图谱构建方法。
背景技术
在云计算资源管理领域,目前的云计算资源的组织模型普遍存在较少考虑资源结点之间的关系和需求场景的变化,云资源发现方法和分配方法普遍存在资源发现效率低、资源和业务场景的服务质量要求匹配度差等问题,一般很难适应场景复杂繁多且需求动态多变的云资源管理需求。
另外,云计算是一种可伸缩、弹性、共享的物理和虚拟资源池。相比于传统的计算机资源,云计算资源范围更广、类型更加多样,服务需求更加多元。一个大型云计算平台,资源数量十分庞大,往往支持成千上万种应用服务。如何描述和组织云资源,才能便于资源的发现和资源按需合理分配,满足服务需求场景复杂繁多且服务需求多变情况下的服务质量要求,一直是本领域亟需解决的问题。
针对相关技术中的问题,目前尚未提出有效的解决方案。
发明内容
针对相关技术中的上述技术问题,本发明提出一种云计算资源图谱构建方法,其便于资源的发现和资源按需合理分配,可满足服务需求场景复杂繁多且服务需求多变情况下的服务质量要求。
为实现上述技术目的,本发明的技术方案是这样实现的:
一种云计算资源图谱构建方法,包括以下步骤:
S1将云计算资源按照多个不同的类别进行分类;
S2采用将不同的所述类别相组合的方式定义所述云计算资源的属性;
S3根据所述属性对所述云计算资源进行层次组织形成云资源实体集,所述云资源实体集包括多个云资源实体;
S4根据所述属性的类型采用对应的相似度计算方法度量多个所述云资源实体之间的相似度,生成相似度特征;
S5通过分类器对所述相似度特征进行分类,得到分类结果;
S6通过集成学习对所述分类结果进行综合形成云资源实体关系集;
S7根据所述云资源实体集和所述云资源实体关系集构建出云资源图谱。
进一步地,在S1中,所述类别为技术属性、服务属性或资源形式。
进一步地,在S1中,按照所述技术属性,将所述云计算资源分类为计算资源、存储资源、网络资源、数据库资源、系统软件资源和应用软件资源;按照所述服务属性,将所述云计算资源分类为基础设施类资源、平台支撑类资源和应用服务类资源;按照所述资源形式,将所述云计算资源分类为虚拟化资源和物理资源。
进一步地,在S3中,采用两层次组织法对所述云计算资源进行层次组织,所述两层次组织法包括以下步骤:
S3.1在模式层上建立资源表示框架,所述资源表示框架包括R(资源名称,属性,属性值)三元组;
S3.2基于所述资源表示框架在数据层上存储所述云计算资源的具体数据。
进一步地,在S4中,所述类型为数值型、列表型或文本型。
可选地,在S4中,若所述类型为数值型,则采用距离计算方法度量多个所述云资源实体之间的相似度。
可选地,在S4中,若所述类型为列表型,则通过计算交集的个数或采用Jaccard 相似度计算方法度量多个所述云资源实体之间的相似度。
可选地,在S4中,若所述类型为文本型,则采用基于向量空间模型TF-IDF方法度量多个所述云资源实体之间的相似度。
进一步地,在S5中,所述分类器包括代价矩阵分类模型或损失函数分类模型。
本发明的有益效果:在能很大程度上提高海量云计算资源的资源发现效率,能支持语义化的资源与需求动态匹配,提升资源利用率和需求满足度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例所述的云计算资源图谱构建方法的原理框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,根据本发明实施例所述的一种云计算资源图谱构建方法,其特征在于,包括以下步骤:
S1将云计算资源按照多个不同的类别进行分类;
S2采用将不同的所述类别相组合的方式定义所述云计算资源的属性;
S3根据所述属性对所述云计算资源进行层次组织形成云资源实体集,所述云资源实体集包括多个云资源实体;
S4根据所述属性的类型采用对应的相似度计算方法度量多个所述云资源实体之间的相似度,生成相似度特征;
S5通过分类器对所述相似度特征进行分类,得到分类结果;
S6通过集成学习对所述分类结果进行综合形成云资源实体关系集;
S7根据所述云资源实体集和所述云资源实体关系集构建出云资源图谱。
在本发明的一个具体实施例中,在S1中,所述类别为技术属性、服务属性或资源形式。
在本发明的一个具体实施例中,在S1中,按照所述技术属性,将所述云计算资源分类为计算资源、存储资源、网络资源、数据库资源、系统软件资源和应用软件资源;按照所述服务属性,将所述云计算资源分类为基础设施类资源、平台支撑类资源和应用服务类资源;按照所述资源形式,将所述云计算资源分类为虚拟化资源和物理资源。
在本发明的一个具体实施例中,在S3中,采用两层次组织法对所述云计算资源进行层次组织,所述两层次组织法包括以下步骤:
S3.1在模式层上建立资源表示框架,所述资源表示框架包括R(资源名称,属性,属性值)三元组;
S3.2基于所述资源表示框架在数据层上存储所述云计算资源的具体数据。
在本发明的一个具体实施例中,在S4中,所述类型为数值型、列表型或文本型。
在本发明的一个具体实施例中,在S4中,若所述类型为数值型,则采用距离计算方法度量多个所述云资源实体之间的相似度。若所述类型为列表型,则通过计算交集的个数或采用Jaccard 相似度计算方法度量多个所述云资源实体之间的相似度。若所述类型为文本型,则采用基于向量空间模型TF-IDF方法度量多个所述云资源实体之间的相似度。
在本发明的一个具体实施例中,在S5中,所述分类器包括代价矩阵分类模型或损失函数分类模型。
为了方便理解本发明的上述技术方案,以下通过具体使用方式对本发明的上述技术方案进行详细说明。
本发明所述的云资源图谱构建方法包括云资源实体构建方法和云资源实体关系构建方法。
1)云资源实体构建方法包括资源分类、属性定义和层次组织。
从技术属性、服务属性、资源形式三个类别出发对云计算资源进行分类。按照技术属性这一类别,将云计算资源分类为计算资源、存储资源、网络资源、数据库资源、系统软件资源和应用软件资源。按照服务属性这一类别,根据服务要求,将云计算资源分类为基础设施类资源、平台支撑类资源和应用服务类资源。按照资源形式这一类别,将云计算资源分类为虚拟化资源和物理资源。
采用将不同的类别相组合方式定义云计算资源的属性。例如,物理资源分为服务器及网络设备两大类。将物理资源与技术属性组合后就变为物理计算资源、物理存储资源、物理网络资源等,采用物理计算资源定义的属性主要包括CPU个数、性能、内存总量、内存占用率等;采用物理存储资源定义的属性主要包括存储总量、读写速率等;采用物理网络资源定义的属性主要包括速率、带宽、吞吐量、时延等。虚拟化资源除了包含对应的物理资源的属性外,还包括该虚拟化资源所绑定的物理资源等描述属性。
根据云计算资源的属性,采用两层次组织法对云计算资源进行层次组织形成云资源实体。两层为模式层与数据层。模式层建立资源表示框架,数据层基于该资源表示框架存储云计算资源(即下文中的资源)的具体数据。在资源表示框架中,采用R(云计算资源名称,属性,属性值)三元组来表示云计算资源,具体的,采用一元组r(i)表示云计算资源名称,i表示资源序号;一元组a(i)表示资源属性,二元组RA(N,M) 用于对资源属性的关系表进行语义描述,其中N表示资源总数量,M表示资源属性的总数量,RA(i,j)表示第i个资源是否有第j个属性。RA(i,j)=0表示第i个资源没有第j个属性,RA(i,j)=1表示第i个资源有第j个属性。
2)云资源实体关系构建方法包括采用实体相似度计算来构建云资源实体关系。
对于不同类型的属性使用不同的相似度计算方法来度量云计算实体之间的相似性,生成相似度特征。
属性的类型为数值型时,属性的值用d表示,可使用距离计算的方式来计算两个云计算实体在该属性上的相似度。计算公式为:
Figure DEST_PATH_IMAGE002
其中,D的值域为[0,1],而且di 和dj 之间相差的越大,D 值就越大,D 值就越大表示两个云计算实体之间的相似度越小。
属性的类型为列表型时,属性的值是值域集合中的一个或多个元素。列表型的属性值可以作为集合进行处理。对于列表型的属性值,使用两种指标来衡量它们的相似性。一种是计算交集的个数,交集个数越多表示云计算实体之间越相似; 另外一种是采用Jaccard 相似度计算方法,计算公式如为:
其中,Jaccard 相似度值域是[0,1],当A= =B的时候,Jaccard 相似度值为1。Jaccard相似度值越大表示云计算实体之间的相似性越高。
属性的类型为文本型时,使用基于向量空间模型TF-IDF方法来确定云计算实体之间的相似度。TF-IDF为词频(TF)*逆文档频率(IDF)。使用中文分词工具对文本数据进行分词后可得到每个文本数据的TF-IDF向量,可使用余弦相似度来衡量TF-IDF向量之间的相似性。对A,B两个n维的TF-IDF向量而言,它们之间的余弦相似度计算公式为:
Figure DEST_PATH_IMAGE006
3)通过云资源实体集(即至少由多个云资源实体构成的集合)和云资源实体关系集构建云资源图谱。
通过代价矩阵或损失函数等分类模型获得各个分类器,在相似度特征生成之后,通过分类器对相似度特征进行分类,采用集成学习将多个分类器的分类结果进行综合,得到一个更好的关系分类结果,进而形成云资源实体关系集。最后可通过云资源实体集和云资源实体关系集构建出云资源图谱。
综上所述,借助于本发明的上述技术方案,在能很大程度上提高海量云计算资源的资源发现效率,能支持语义化的资源与需求动态匹配,提升资源利用率和需求满足度。
以上仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种云计算资源图谱构建方法,其特征在于,包括以下步骤:
S1将云计算资源按照多个不同的类别进行分类;
S2采用将不同的所述类别相组合的方式定义所述云计算资源的属性;
S3根据所述属性对所述云计算资源进行层次组织形成云资源实体集,所述云资源实体集包括多个云资源实体;
S4根据所述属性的类型采用对应的相似度计算方法度量多个所述云资源实体之间的相似度,生成相似度特征;
S5通过分类器对所述相似度特征进行分类,得到分类结果;
S6通过集成学习对所述分类结果进行综合形成云资源实体关系集;
S7根据所述云资源实体集和所述云资源实体关系集构建出云资源图谱。
2.根据权利要求1所述的云计算资源图谱构建方法,其特征在于,在S1中,所述类别为技术属性、服务属性或资源形式。
3.根据权利要求2所述的云计算资源图谱构建方法,其特征在于,在S1中,按照所述技术属性,将所述云计算资源分类为计算资源、存储资源、网络资源、数据库资源、系统软件资源和应用软件资源;按照所述服务属性,将所述云计算资源分类为基础设施类资源、平台支撑类资源和应用服务类资源;按照所述资源形式,将所述云计算资源分类为虚拟化资源和物理资源。
4.根据权利要求1所述的云计算资源图谱构建方法,其特征在于,在S3中,采用两层次组织法对所述云计算资源进行层次组织,所述两层次组织法包括以下步骤:
S3.1在模式层上建立资源表示框架,所述资源表示框架包括R(云计算资源名称,属性,属性值)三元组;
S3.2基于所述资源表示框架在数据层上存储所述云计算资源的具体数据。
5.根据权利要求1所述的云计算资源图谱构建方法,其特征在于,在S4中,所述类型为数值型、列表型或文本型。
6.根据权利要求5所述的云计算资源图谱构建方法,其特征在于,在S4中,若所述类型为数值型,则采用距离计算方法度量多个所述云资源实体之间的相似度。
7. 根据权利要求5所述的云计算资源图谱构建方法,其特征在于,在S4中,若所述类型为列表型,则通过计算交集的个数或采用Jaccard 相似度计算方法度量多个所述云资源实体之间的相似度。
8.根据权利要求5所述的云计算资源图谱构建方法,其特征在于,在S4中,若所述类型为文本型,则采用基于向量空间模型TF-IDF方法度量多个所述云资源实体之间的相似度。
9.根据权利要求1所述的云计算资源图谱构建方法,其特征在于,在S5中,所述分类器包括代价矩阵分类模型或损失函数分类模型。
CN201910940929.5A 2019-09-30 2019-09-30 一种云计算资源图谱构建方法 Pending CN110764907A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910940929.5A CN110764907A (zh) 2019-09-30 2019-09-30 一种云计算资源图谱构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910940929.5A CN110764907A (zh) 2019-09-30 2019-09-30 一种云计算资源图谱构建方法

Publications (1)

Publication Number Publication Date
CN110764907A true CN110764907A (zh) 2020-02-07

Family

ID=69329101

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910940929.5A Pending CN110764907A (zh) 2019-09-30 2019-09-30 一种云计算资源图谱构建方法

Country Status (1)

Country Link
CN (1) CN110764907A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112685661A (zh) * 2020-12-29 2021-04-20 太极计算机股份有限公司 基于信息粒空间的信息组织方法、装置和设备
CN113595827A (zh) * 2021-07-29 2021-11-02 北京百度网讯科技有限公司 云网络监控方法和装置、电子设备、计算机介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120198073A1 (en) * 2011-01-27 2012-08-02 Computenext Inc. Dynamically organizing cloud computing resources to facilitate discovery
CN105812175A (zh) * 2016-03-07 2016-07-27 联想(北京)有限公司 一种资源管理方法及资源管理设备
CN109726296A (zh) * 2018-12-27 2019-05-07 武汉理工数字传播工程有限公司 基于知识图谱的海量知识资源存储方法
CN109885699A (zh) * 2019-02-15 2019-06-14 中国人民解放军国防科技大学 基于知识图谱的云仿真模型资源描述信息存储方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120198073A1 (en) * 2011-01-27 2012-08-02 Computenext Inc. Dynamically organizing cloud computing resources to facilitate discovery
CN105812175A (zh) * 2016-03-07 2016-07-27 联想(北京)有限公司 一种资源管理方法及资源管理设备
CN109726296A (zh) * 2018-12-27 2019-05-07 武汉理工数字传播工程有限公司 基于知识图谱的海量知识资源存储方法
CN109885699A (zh) * 2019-02-15 2019-06-14 中国人民解放军国防科技大学 基于知识图谱的云仿真模型资源描述信息存储方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李阳: "知识图谱中实体相似度计算研究" *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112685661A (zh) * 2020-12-29 2021-04-20 太极计算机股份有限公司 基于信息粒空间的信息组织方法、装置和设备
CN113595827A (zh) * 2021-07-29 2021-11-02 北京百度网讯科技有限公司 云网络监控方法和装置、电子设备、计算机介质
CN113595827B (zh) * 2021-07-29 2023-02-21 北京百度网讯科技有限公司 云网络监控方法和装置、电子设备、计算机介质

Similar Documents

Publication Publication Date Title
Sreedhar et al. Clustering large datasets using K-means modified inter and intra clustering (KM-I2C) in Hadoop
US10210558B2 (en) Complex service network ranking and clustering
WO2022126971A1 (zh) 基于密度的文本聚类方法、装置、设备及存储介质
US10354201B1 (en) Scalable clustering for mixed machine learning data
CN106844407B (zh) 基于数据集相关性的标签网络产生方法和系统
CN102591917B (zh) 一种数据处理方法、系统及相关装置
US10268749B1 (en) Clustering sparse high dimensional data using sketches
CN109359115B (zh) 基于图数据库的分布式存储方法、装置及系统
US20190370599A1 (en) Bounded Error Matching for Large Scale Numeric Datasets
Nair et al. An introduction to clustering algorithms in big data
US20220277031A1 (en) Guided exploration for conversational business intelligence
CN110764907A (zh) 一种云计算资源图谱构建方法
US11372846B2 (en) Generating and utilizing pre-allocated storage space
CN116089367A (zh) 动态分桶方法、装置、电子设备和介质
CN110008597A (zh) 基于并行计算框架的建筑信息模型三角剖分方法及装置
CN115495478A (zh) 数据查询方法、装置、电子设备以及存储介质
CN113177613A (zh) 系统资源数据分配方法及装置
Lee et al. Design and implementation of a data-driven simulation service system
CN108090182B (zh) 一种大规模高维数据的分布式索引方法及系统
US9547711B1 (en) Shard data based on associated social relationship
CN113111133A (zh) 用户分类的方法和装置
Yang et al. Parallel clique-like subgraph counting and listing
Hashem et al. A review of modeling toolbox for BigData
CN113535673A (zh) 生成配置文件及数据处理的方法和装置
Liu et al. Social Network Community‐Discovery Algorithm Based on a Balance Factor

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200207

RJ01 Rejection of invention patent application after publication