CN110764907A

CN110764907A - 一种云计算资源图谱构建方法

Info

Publication number: CN110764907A
Application number: CN201910940929.5A
Authority: CN
Inventors: 万玉晴; 董晶; 刘庚
Original assignee: Taiji Computer Corp Ltd
Current assignee: Taiji Computer Corp Ltd
Priority date: 2019-09-30
Filing date: 2019-09-30
Publication date: 2020-02-07

Abstract

本发明公开了一种云计算资源图谱构建方法，包括以下步骤：将云计算资源按照多个不同的类别进行分类；采用将不同的类别相组合的方式定义云计算资源的属性；根据属性对云计算资源进行层次组织形成云资源实体集，云资源实体集包括多个云资源实体；根据属性的类型采用对应的相似度计算方法度量多个云资源实体之间的相似度，生成相似度特征；通过分类器对相似度特征进行分类，得到分类结果；通过集成学习对分类结果进行综合形成云资源实体关系集；根据云资源实体集和云资源实体关系集构建出云资源图谱。在能很大程度上提高海量云计算资源的资源发现效率，能支持语义化的资源与需求动态匹配，提升资源利用率和需求满足度。

Description

一种云计算资源图谱构建方法

技术领域

本发明涉及云计算的技术领域，具体来说，涉及一种云计算资源图谱构建方法。

背景技术

在云计算资源管理领域，目前的云计算资源的组织模型普遍存在较少考虑资源结点之间的关系和需求场景的变化，云资源发现方法和分配方法普遍存在资源发现效率低、资源和业务场景的服务质量要求匹配度差等问题，一般很难适应场景复杂繁多且需求动态多变的云资源管理需求。

另外，云计算是一种可伸缩、弹性、共享的物理和虚拟资源池。相比于传统的计算机资源，云计算资源范围更广、类型更加多样，服务需求更加多元。一个大型云计算平台，资源数量十分庞大，往往支持成千上万种应用服务。如何描述和组织云资源，才能便于资源的发现和资源按需合理分配，满足服务需求场景复杂繁多且服务需求多变情况下的服务质量要求，一直是本领域亟需解决的问题。

针对相关技术中的问题，目前尚未提出有效的解决方案。

发明内容

针对相关技术中的上述技术问题，本发明提出一种云计算资源图谱构建方法，其便于资源的发现和资源按需合理分配，可满足服务需求场景复杂繁多且服务需求多变情况下的服务质量要求。

为实现上述技术目的，本发明的技术方案是这样实现的：

一种云计算资源图谱构建方法，包括以下步骤：

S1将云计算资源按照多个不同的类别进行分类；

S2采用将不同的所述类别相组合的方式定义所述云计算资源的属性；

S3根据所述属性对所述云计算资源进行层次组织形成云资源实体集，所述云资源实体集包括多个云资源实体；

S4根据所述属性的类型采用对应的相似度计算方法度量多个所述云资源实体之间的相似度，生成相似度特征；

S5通过分类器对所述相似度特征进行分类，得到分类结果；

S6通过集成学习对所述分类结果进行综合形成云资源实体关系集；

S7根据所述云资源实体集和所述云资源实体关系集构建出云资源图谱。

进一步地，在S1中，所述类别为技术属性、服务属性或资源形式。

进一步地，在S1中，按照所述技术属性，将所述云计算资源分类为计算资源、存储资源、网络资源、数据库资源、系统软件资源和应用软件资源；按照所述服务属性，将所述云计算资源分类为基础设施类资源、平台支撑类资源和应用服务类资源；按照所述资源形式，将所述云计算资源分类为虚拟化资源和物理资源。

进一步地，在S3中，采用两层次组织法对所述云计算资源进行层次组织，所述两层次组织法包括以下步骤：

S3.1在模式层上建立资源表示框架，所述资源表示框架包括R（资源名称，属性，属性值）三元组；

S3.2基于所述资源表示框架在数据层上存储所述云计算资源的具体数据。

进一步地，在S4中，所述类型为数值型、列表型或文本型。

可选地，在S4中，若所述类型为数值型，则采用距离计算方法度量多个所述云资源实体之间的相似度。

可选地，在S4中，若所述类型为列表型，则通过计算交集的个数或采用Jaccard 相似度计算方法度量多个所述云资源实体之间的相似度。

可选地，在S4中，若所述类型为文本型，则采用基于向量空间模型TF-IDF方法度量多个所述云资源实体之间的相似度。

进一步地，在S5中，所述分类器包括代价矩阵分类模型或损失函数分类模型。

本发明的有益效果：在能很大程度上提高海量云计算资源的资源发现效率，能支持语义化的资源与需求动态匹配，提升资源利用率和需求满足度。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是根据本发明实施例所述的云计算资源图谱构建方法的原理框图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员所获得的所有其他实施例，都属于本发明保护的范围。

如图1所示，根据本发明实施例所述的一种云计算资源图谱构建方法，其特征在于，包括以下步骤：

S1将云计算资源按照多个不同的类别进行分类；

S5通过分类器对所述相似度特征进行分类，得到分类结果；

在本发明的一个具体实施例中，在S1中，所述类别为技术属性、服务属性或资源形式。

在本发明的一个具体实施例中，在S1中，按照所述技术属性，将所述云计算资源分类为计算资源、存储资源、网络资源、数据库资源、系统软件资源和应用软件资源；按照所述服务属性，将所述云计算资源分类为基础设施类资源、平台支撑类资源和应用服务类资源；按照所述资源形式，将所述云计算资源分类为虚拟化资源和物理资源。

在本发明的一个具体实施例中，在S3中，采用两层次组织法对所述云计算资源进行层次组织，所述两层次组织法包括以下步骤：

在本发明的一个具体实施例中，在S4中，所述类型为数值型、列表型或文本型。

在本发明的一个具体实施例中，在S4中，若所述类型为数值型，则采用距离计算方法度量多个所述云资源实体之间的相似度。若所述类型为列表型，则通过计算交集的个数或采用Jaccard 相似度计算方法度量多个所述云资源实体之间的相似度。若所述类型为文本型，则采用基于向量空间模型TF-IDF方法度量多个所述云资源实体之间的相似度。

在本发明的一个具体实施例中，在S5中，所述分类器包括代价矩阵分类模型或损失函数分类模型。

为了方便理解本发明的上述技术方案，以下通过具体使用方式对本发明的上述技术方案进行详细说明。

本发明所述的云资源图谱构建方法包括云资源实体构建方法和云资源实体关系构建方法。

1）云资源实体构建方法包括资源分类、属性定义和层次组织。

从技术属性、服务属性、资源形式三个类别出发对云计算资源进行分类。按照技术属性这一类别，将云计算资源分类为计算资源、存储资源、网络资源、数据库资源、系统软件资源和应用软件资源。按照服务属性这一类别，根据服务要求，将云计算资源分类为基础设施类资源、平台支撑类资源和应用服务类资源。按照资源形式这一类别，将云计算资源分类为虚拟化资源和物理资源。

采用将不同的类别相组合方式定义云计算资源的属性。例如，物理资源分为服务器及网络设备两大类。将物理资源与技术属性组合后就变为物理计算资源、物理存储资源、物理网络资源等，采用物理计算资源定义的属性主要包括CPU个数、性能、内存总量、内存占用率等；采用物理存储资源定义的属性主要包括存储总量、读写速率等；采用物理网络资源定义的属性主要包括速率、带宽、吞吐量、时延等。虚拟化资源除了包含对应的物理资源的属性外，还包括该虚拟化资源所绑定的物理资源等描述属性。

根据云计算资源的属性，采用两层次组织法对云计算资源进行层次组织形成云资源实体。两层为模式层与数据层。模式层建立资源表示框架，数据层基于该资源表示框架存储云计算资源（即下文中的资源）的具体数据。在资源表示框架中，采用R（云计算资源名称，属性，属性值）三元组来表示云计算资源，具体的，采用一元组r（i）表示云计算资源名称，i表示资源序号；一元组a（i）表示资源属性，二元组RA（N，M）用于对资源属性的关系表进行语义描述,其中N表示资源总数量，M表示资源属性的总数量，RA（i,j）表示第i个资源是否有第j个属性。RA（i,j）=0表示第i个资源没有第j个属性，RA（i,j）=1表示第i个资源有第j个属性。

2）云资源实体关系构建方法包括采用实体相似度计算来构建云资源实体关系。

对于不同类型的属性使用不同的相似度计算方法来度量云计算实体之间的相似性，生成相似度特征。

属性的类型为数值型时，属性的值用d表示，可使用距离计算的方式来计算两个云计算实体在该属性上的相似度。计算公式为：

其中，D的值域为[0，1]，而且di 和dj 之间相差的越大，D 值就越大，D 值就越大表示两个云计算实体之间的相似度越小。

属性的类型为列表型时，属性的值是值域集合中的一个或多个元素。列表型的属性值可以作为集合进行处理。对于列表型的属性值，使用两种指标来衡量它们的相似性。一种是计算交集的个数，交集个数越多表示云计算实体之间越相似; 另外一种是采用Jaccard 相似度计算方法，计算公式如为：

其中，Jaccard 相似度值域是[0,1]，当A= =B的时候，Jaccard 相似度值为1。Jaccard相似度值越大表示云计算实体之间的相似性越高。

属性的类型为文本型时，使用基于向量空间模型TF-IDF方法来确定云计算实体之间的相似度。TF-IDF为词频(TF)*逆文档频率(IDF)。使用中文分词工具对文本数据进行分词后可得到每个文本数据的TF-IDF向量，可使用余弦相似度来衡量TF-IDF向量之间的相似性。对A，B两个n维的TF-IDF向量而言，它们之间的余弦相似度计算公式为：

。

3）通过云资源实体集（即至少由多个云资源实体构成的集合）和云资源实体关系集构建云资源图谱。

通过代价矩阵或损失函数等分类模型获得各个分类器，在相似度特征生成之后，通过分类器对相似度特征进行分类，采用集成学习将多个分类器的分类结果进行综合，得到一个更好的关系分类结果，进而形成云资源实体关系集。最后可通过云资源实体集和云资源实体关系集构建出云资源图谱。

综上所述，借助于本发明的上述技术方案，在能很大程度上提高海量云计算资源的资源发现效率，能支持语义化的资源与需求动态匹配，提升资源利用率和需求满足度。

以上仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种云计算资源图谱构建方法，其特征在于，包括以下步骤：

S1将云计算资源按照多个不同的类别进行分类；

S5通过分类器对所述相似度特征进行分类，得到分类结果；

2.根据权利要求1所述的云计算资源图谱构建方法，其特征在于，在S1中，所述类别为技术属性、服务属性或资源形式。

3.根据权利要求2所述的云计算资源图谱构建方法，其特征在于，在S1中，按照所述技术属性，将所述云计算资源分类为计算资源、存储资源、网络资源、数据库资源、系统软件资源和应用软件资源；按照所述服务属性，将所述云计算资源分类为基础设施类资源、平台支撑类资源和应用服务类资源；按照所述资源形式，将所述云计算资源分类为虚拟化资源和物理资源。

4.根据权利要求1所述的云计算资源图谱构建方法，其特征在于，在S3中，采用两层次组织法对所述云计算资源进行层次组织，所述两层次组织法包括以下步骤：

S3.1在模式层上建立资源表示框架，所述资源表示框架包括R（云计算资源名称，属性，属性值）三元组；

5.根据权利要求1所述的云计算资源图谱构建方法，其特征在于，在S4中，所述类型为数值型、列表型或文本型。

6.根据权利要求5所述的云计算资源图谱构建方法，其特征在于，在S4中，若所述类型为数值型，则采用距离计算方法度量多个所述云资源实体之间的相似度。

7. 根据权利要求5所述的云计算资源图谱构建方法，其特征在于，在S4中，若所述类型为列表型，则通过计算交集的个数或采用Jaccard 相似度计算方法度量多个所述云资源实体之间的相似度。

8.根据权利要求5所述的云计算资源图谱构建方法，其特征在于，在S4中，若所述类型为文本型，则采用基于向量空间模型TF-IDF方法度量多个所述云资源实体之间的相似度。

9.根据权利要求1所述的云计算资源图谱构建方法，其特征在于，在S5中，所述分类器包括代价矩阵分类模型或损失函数分类模型。