CN104750877B - 一种用于云计算资源定价的统计分析方法 - Google Patents
一种用于云计算资源定价的统计分析方法 Download PDFInfo
- Publication number
- CN104750877B CN104750877B CN201510198430.3A CN201510198430A CN104750877B CN 104750877 B CN104750877 B CN 104750877B CN 201510198430 A CN201510198430 A CN 201510198430A CN 104750877 B CN104750877 B CN 104750877B
- Authority
- CN
- China
- Prior art keywords
- mrow
- instance
- similar
- msub
- msubsup
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 238000007619 statistical method Methods 0.000 title claims abstract description 10
- 238000009826 distribution Methods 0.000 claims abstract description 30
- 239000011159 matrix material Substances 0.000 claims abstract description 22
- 230000007704 transition Effects 0.000 claims abstract description 13
- 230000003993 interaction Effects 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 7
- 238000012545 processing Methods 0.000 claims description 7
- 238000012546 transfer Methods 0.000 claims description 4
- 238000011425 standardization method Methods 0.000 claims description 2
- 230000000694 effects Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000002860 competitive effect Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 239000002360 explosive Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000002759 z-score normalization Methods 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种用于云计算资源定价的统计分析方法,包括以下步骤:步骤1,给定一个新的云服务提供商的资源实例,并搜集现行市场的云计算实例;步骤2,统计所有现行实例在不同价格区间的概率分布;步骤3,将现行实例和新实例的数据进行标准化处理,并对现行实例和新实例进行分类,选择跟新实例在同一类的现行实例作为新实例的相似实例;步骤4,获取相似实例的初始市场份额,并建立用户转移概率矩阵,采用马尔科夫链方法计算出相似实例的短期市场份额和最终市场份额;步骤5,统计相似实例的价格、概率分布和市场份额,计算出新实例的价格。
Description
技术领域
本发明涉及互联网计算机软件技术领域,特别是一种用于云计算资源定价的统计分析方法。
背景技术
在信息、通信技术快速发展的互联网时代,计算模式从任务提交给大型处理机发展到基于网络的分布式任务处理,最终演变成按需处理的云计算模式。
云计算是一种新型的热门计算平台,采用按需请求资源、按实际用量付费的运行模式。关于云计算的定义很广泛,例如Foster在“Cloud computing and gridcomputing360-degree compared”中定义云计算为规模经济驱动的大规模分布式计算系统,通过虚拟化技术依靠互联网向消费者提供弹性的、可管理的计算资源、存储空间、应用平台及服务。
云计算的主要特点是弹性地提供IT架构和应用。云计算的发展得益于以下三个方面:(1)硬件费用的下降,计算能力和存储容量的增长,多核架构和超级计算机的流行;(2)数据规模的爆炸式增长;(3)服务计算和Web2.0应用的广泛使用。政府、研究机构和企业纷纷采用云计算来解决了他们日益增长的计算和存储需求。
云计算为全球的IT产业带来了深远的影响。International Data Corporation国际数据公司对云计算所做的一项调查中指出,2010年公有云的总利润超过21.5百万美元,且将在2015年达到72.9亿美元,其中年增长率达到了27.6%。云计算的利润增长率是全球IT业利润增长率(6.7%)的4倍。
现在有许多大型的公司都提供云计算服务,例如亚马逊(Amazon),IBM,谷歌(Google),微软(Microsoft)等。云计算的高速发展也吸引了越来越多的公司加入卖方市场。新的云服务提供商可以通过出售自己的计算资源给用户,从中获取利益。在云计算市场中,如何合理的为云计算资源定价,是新的云服务提供商亟待解决的问题。现有的定价机制通常采用纳什均衡、拍卖等方法进行理论分析。例如,Yuan Feng等人在“PriceCompetition in an Oligopoly Market with Multiple IaaS Cloud Providers”中提出了一种为多个云服务提供商定价的方法,该方法考虑垄断市场的竞争环境,使用纳什均衡计算出多个云服务提供商的最优价格。Zaman,S.等人在“A Combinatorial Auction-BasedMechanism for Dynamic VM Provisioning and Allocation in Clouds”中提出一种基于组合拍卖的虚拟机动态分配方法。
目前有许多针对不同领域的定价方法已经取得了一些成果。中国专利《一种基于Bertrand静态博弈的授权用户频谱定价方法》,申请号:201310084931.X,授权公告号103117824A公开了一种用于授权用户频谱定价的方法,该方法采用差异化寡头市场模型来描述认知系统,并利用经济学原理以及静态Bertrand博弈理论实现授权用户频谱定价。该方法的目的是获取所有授权用户稳定的均衡定价策略,如果有新授权用户加入市场,其他授权用户也会相应改变价格,而现实可能存在新授权用户的市场影响力并不足以影响其他授权用户改变价格。
然而上述定价方法并没有从当前云服务市场状况来考虑定价。现行市场的实例定价对新实例具有很好的参考价值,可以帮助新的云服务商选择如何切入市场。
发明内容
发明目的:本发明要解决的问题是对现行市场的云计算实例的价格、市场份额等属性进行统计分析,从而为新的云平台服务商提供合理定价。
本发明针对现有技术的不足,提供一种用于云计算资源定价的统计分析方法。
为了解决上述技术问题,本发明公开了一种用于云计算资源定价的统计分析方法,包括以下步骤:
步骤1:给定一个新的云服务提供商的资源实例作为新实例,并从互联网的云服务提供商中搜集虚拟机实例作为现行实例,实例具有统一的属性,分别包括虚拟核心、内存和硬盘;
步骤2:统计现行实例在不同价格区间的概率分布,作为新实例的价格参考范围;
步骤3:将现行实例和新实例的数据进行标准化处理,并对现行实例和新实例进行分类,通过计算新实例和现行实例的欧氏距离,选择欧氏距离最小的现行实例作为新实例的相似实例;
步骤4:采用乘法竞争互动公式计算出相似实例的初始市场份额,并且建立用户转移概率矩阵,然后通过马尔科夫链方法计算出相似实例的短期市场份额和最终市场份额;
步骤5:综合相似实例的价格、概率分布和最终市场份额,计算出新实例的价格。其中,把相似实例的市场份额作为相似实例价格的可信程度,并把相似实例价格的概率分布作为相似实例对新实例的价格影响度。
本发明中,从现行市场搜集到的实例集合为{s1,s2,…,si,…,sn},其中si表示第i个现行实例,1≤i≤n,n表示现行市场的实例的个数。si={si1,si2,si3},其中si1表示第i个现行实例的内存,si2表示第i个实例的硬盘,si3表示第i个实例的虚拟核心。
本发明中新实例的抽象描述为f={f1,f2,f3},其中f1表示新实例的内存,f2表示新实例的硬盘,f3表示新实例的虚拟核心。
本发明中,由于实例的不同属性具有不同的量纲和量纲单位,为了消除属性之间的量纲影响,需要对数据进行标准化处理。本发明中,步骤3中将现行实例和新实例的数据进行标准化处理所使用的Z-分数标准化法(Z-core)为:
其中,Cij表示第i个现行实例的第j个属性的标准化值,sij表示第i个现行实例的第j个属性值,j=1时sij表示现行实例的虚拟核心数量,j=2时sij表示现行实例的内存属性,j=3时sij表示现行实例的硬盘属性,表示现行实例集合中第j个属性的均值,m表示现行实例的数量,表示现行实例集合中第j个属性的标准差,Fj表示新实例的第j个属性的标准化值,fj表示新实例的第j个属性值,j=1时fj表示新实例的虚拟核心数量,j=2时fj表示新实例的内存属性,j=3时fj表示新实例的硬盘属性。
步骤3中对于现行实例和新实例采用K最近邻分类方法(KNN)进行分类。KNN是基于距离的分类方法,对于每个现行实例,计算其和新实例的欧氏距离。计算实例间的欧式距离公式如下所示:
其中,Ei表示第i个现行实例和新实例的欧式距离,E的大小反映了两个实例之间的相似程度;E越小,表示两个实例越相似;Cij表示第i个现行实例的第j个属性的标准化值;Fj表示新实例的第j个属性的标准化值。
计算完所有现行实例和新实例间的欧氏距离后,将Ei按从小到大的顺序进行排序,选择其中k个欧式距离最小的现行实例作为新实例的相似实例,k取值自然数,该发明的目的是用较少的相似实例计算新实例的价格,减少处理的时间,且相似的现行实例对新实例具有更高的参考价值。
本发明中,获取相似实例后,对于每个相似实例,计算它们在相似实例集合中的价格概率分布,公式如下:
其中,qi表示第i个相似实例在相似实例集合中的价格概率,Qi表示第i个相似实例在现行市场的价格概率,表示所有相似实例的现行市场价格概率之和。
本发明中,使用吸引力模型计算相似实例的初始市场份额。对于每一个相似实例,获取实例的吸引力属性,吸引力属性包括价格、CPU速率、内存速率和品牌吸引力。对于吸引力属性,从高德纳咨询公司Gartner的公有云调查报告http://www.gartner.com/technology/reprints.do?id=1-2453PUR&ct=141105&st=s中获取价格对吸引力的影响系数、CPU速率对吸引力的影响系数以及内存速率对吸引力的影响系数。实例的所有吸引力属性的综合作用反映了实例对用户的吸引程度,吸引程度越大则市场份额越高。本发明采用乘法竞争互动(Multiplicative Competitive Interaction,MCI)公式计算出相似实例的初始市场份额。
本发明步骤4中,计算初始市场份额的乘法竞争互动公式如下:
其中,表示第i个相似实例的初始市场份额,且 表示第i个实例对用户的吸引程度,表示所有实例对用户的总吸引程度,Li表示第i个实例的品牌吸引力,品牌吸引力值从高德纳咨询公司Gartner的公有云调查报告中获取,pi表示第i个实例的价格,表示第i个实例的CPU速率,表示第i个实例的内存读写速率,参数a表示价格pi对吸引力的影响系数,参数b表示CPU速率对吸引力的影响系数,参数c表示内存速率对吸引力的影响系数。
本发明中,根据用户购买实例的历史记录建立用户转移概率矩阵P。P=(P1,P2,…,Pk)表示用户转移概率矩阵;Pi=(Pi1,Pi2,…,Pik)中Pij表示第i个实例的用户转移到第j个实例的概率,其中,用户购买历史记录中总用户数量为U,Userij表示第一个月购买实例i,而第二个月改成购买实例j的用户数量。
本发明中,使用马尔科夫链方法计算出相似实例的短期市场份额和最终市场份额。马尔科夫链理论中,当前周期的状态是由前一个周期的状态转移得来的,则t个周期后的市场份额计算公式为:
MS(t)=MS(0)·Pt=MS(t-1)·P (6)
其中表示初始市场份额矩阵,P=(P1,P2,…,Pk)表示用户转移概率矩阵。
通过上述公式计算出相似实例的短期市场份额为MS(1)=MS(0)·P。
根据马尔科夫链理论,当周期t大到一定程度时,MS(t)将会近似不变,变成一个稳定的分布,即MS=MS·P。考虑到所有实例的市场份额之和为1,则相似实例的最终市场份额可由以下公式求出:
其中,MS=(MS1,MS2,…,MSk)表示最终市场份额矩阵,MSi表示第i个相似实例的最终市场份额,P表示用户转移概率矩阵。
本发明中,步骤5中,建立一个计算新实例价格的模型,其中把相似实例的市场份额作为相似实例价格的可信程度,即市场份额越高则价格越可信;并把相似实例价格的概率分布作为相似实例对新实例的价格影响度,即概率分布越高则影响度越低,以此选择竞争对手少的产品来切入市场。计算新实例的价格公式如下:
其中price表示新实例的价格,MSi表示第i个相似实例的市场份额,vi表示第i个相似实例的价格,qi表示第i个相似实例在相似实例集合的价格概率。
本发明中的思想为:首先统计现行实例在不同价格区间的概率分布;然后对每个现行实例,计算现行实例和新实例的欧式距离,选择k个距离最小的现行实例作为新实例的相似实例;再采用马尔科夫链方法计算这k个相似实例的市场份额;最后根据相似实例的价格、市场份额和概率分布计算出新实例的价格。
与现有技术相比,本发明的有益效果体现在:
(1)利用现行市场的实例价格做新实例的定价决策,更加合理,可信。
(2)相似实例的数目小于现行市场中所有实例的数目,加快了处理时间。
(3)使用马尔科夫链方法来分析相似实例在市场上的状态分布,符合市场份额随时间不断变化的特性,使得最终计算出的市场份额更加可信。
(4)利用相似实例的市场份额作为相似实例对新实例的可信度,使得新实例的价格更加接近高市场份额的现行实例的价格。
附图说明
下面结合附图和具体实施方式对本发明做更进一步的具体说明,本发明的上述和/或其他方面的优点将会变得更加清楚。
图1是本发明流程图。
具体实施方式
下面结合附图对本发明作具体说明。应该指出,所描述的实施例仅是为了说明的目的,而不是对本发明范围的限制。
本发明公开了一种用于云计算资源定价的统计分析方法,该方法流程图如图1所示,包括以下步骤:
步骤1:给定一个新的云服务提供商的资源实例作为新实例,并从互联网的云服务提供商中搜集虚拟机实例作为现行实例,实例具有统一的属性,分别包括虚拟核心、内存和硬盘;
从现行市场搜集到的实例集合为{s1,s2,…,si,…,sn},其中si表示第i个现行实例,1≤i≤n,n表示现行市场的实例的个数。si={si1,si2,si3},其中si1表示第i个现行实例的内存,si2表示第i个实例的硬盘,si3表示第i个实例的虚拟核心。
新实例的抽象描述为f={f1,f2,f3},其中f1表示新实例的内存,f2表示新实例的硬盘,f3表示新实例的虚拟核心。
步骤2:统计现行实例在不同价格区间的概率分布,作为新实例的价格参考范围;
步骤3:将现行实例和新实例的数据进行标准化处理,并对现行实例和新实例进行分类,通过计算新实例和现行实例的欧氏距离,选择欧氏距离最小的现行实例作为新实例的相似实例,新实例的所有相似实例构成相似实例集合;
步骤3中,由于实例的不同属性具有不同的量纲和量纲单位,为了消除属性之间的量纲影响,需要对数据进行标准化处理。本发明中,所使用的Z-分数标准化法(Z-core)为:
其中,Cij表示第i个现行实例的第j个属性的标准化值,sij表示第i个现行实例的第j个属性值,j=1时sij表示现行实例的虚拟核心数量,j=2时sij表示现行实例的内存属性,j=3时sij表示现行实例的硬盘属性,表示现行实例集合中第j个属性的均值,m表示现行实例的数量,表示现行实例集合中第j个属性的标准差,Fj表示新实例的第j个属性的标准化值,fj表示新实例的第j个属性值,j=1时fj表示新实例的虚拟核心数量,j=2时fj表示新实例的内存属性,j=3时fj表示新实例的硬盘属性。
本发明中,对于现行实例和新实例采用K最近邻分类方法(KNN)进行分类。KNN是基于距离的分类方法,对于每个现行实例,计算其和新实例的欧氏距离。计算实例间的欧式距离公式如下所示:
其中,Ei表示第i个现行实例和新实例的欧式距离,E的大小反映了两个实例之间的相似程度;E越小,表示两个实例越相似;Cij表示第i个现行实例的第j个属性的标准化值;Fj表示新实例的第j个属性的标准化值。
计算完所有现行实例和新实例间的欧氏距离后,将Ei按从小到大的顺序进行排序,选择其中k个欧式距离最小的现行实例作为新实例的相似实例。该发明的目的是用较少的相似实例计算新实例的价格,减少处理的时间,且相似的现行实例对新实例具有更高的参考价值。
本发明中,对于每个相似实例,计算它们在相似实例集合中的价格概率分布,公式如下:
其中,qi表示第i个相似实例在相似实例集合中的价格概率,Qi表示第i个相似实例在现行市场的价格概率,表示所有相似实例的现行市场价格概率之和。
步骤4:采用乘法竞争互动公式计算出相似实例的初始市场份额,并且建立用户转移概率矩阵,然后通过马尔科夫链方法计算出相似实例的短期市场份额和最终市场份额;
本发明中,使用吸引力模型计算相似实例的初始市场份额,实例的所有吸引力属性的综合作用反映了实例对用户的吸引程度,吸引程度越大则市场份额越高。对于每一个相似实例,获取实例的吸引力属性,吸引力属性包括价格、CPU速率、内存速率和其他影响因素的综合作用。对于吸引力属性,从高德纳咨询公司Gartner的公有云调查报告http://www.gartner.com/technology/reprints.do?id=1-2453PUR&ct=141105&st=s中获取价格对吸引力的影响系数、CPU速率对吸引力的影响系数以及内存速率对吸引力的影响系数。本发明采用乘法竞争互动(Multiplicative Competitive Interaction,MCI)公式计算出相似实例的初始市场份额。
本发明中,计算初始市场份额的乘法竞争互动公式如下:
其中,表示第i个相似实例的初始市场份额,且 表示第i个实例对用户的吸引程度,表示所有实例对用户的总吸引程度,Li表示第i个实例的品牌吸引力,品牌吸引力值从高德纳咨询公司Gartner的公有云调查报告中获取,pi表示第i个实例的价格,表示第i个实例的CPU速率,表示第i个实例的内存读写速率,参数a表示价格pi对吸引力的影响系数,参数b表示CPU速率对吸引力的影响系数,参数c表示内存速率对吸引力的影响系数。
本发明中,根据用户购买实例的历史记录建立用户转移概率矩阵P,P=(P1,P2,…,Pk)表示用户转移概率矩阵;Pi=(Pi1,Pi2,…,Pik)中Pij表示第i个实例的用户转移到第j个实例的概率。
本发明中,使用马尔科夫链方法计算出相似实例的短期市场份额和最终市场份额。马尔科夫链理论中,当前周期的状态是由前一个周期的状态转移得来的,则t个周期后的市场份额计算公式为:
MS(t)=MS(0)·Pt=MS(t-1)·P (6)
其中表示初始市场份额矩阵,P=(P1,P2,…,Pk)表示用户转移概率矩阵。
通过上述公式计算出相似实例的短期市场份额为MS(1)=MS(0)·P。
根据马尔科夫链理论,当周期t大到一定程度时,MS(t)将会近似不变,变成一个稳定的分布,即MS=MS·P。考虑到所有实例的市场份额之和为1,则相似实例的最终市场份额可由以下公式求出:
其中,MS=(MS1,MS2,…,MSk)表示最终市场份额矩阵,MSi表示第i个相似实例的最终市场份额,P表示用户转移概率矩阵。
步骤5:综合相似实例的价格、概率分布、最终市场份额,计算出新实例的价格。其中,把相似实例的市场份额作为相似实例价格的可信程度,并把相似实例价格的概率分布作为相似实例对新实例的价格影响度。
本发明中,建立了一个计算新实例价格的模型,其中把相似实例的市场份额作为相似实例价格的可信程度,即市场份额越高则价格越可信;并把相似实例价格的概率分布作为相似实例对新实例的价格影响度,即概率分布越高则影响度越低,以此选择竞争对手少的产品来切入市场。计算新实例的价格公式如下:
其中price表示新实例的价格,MSi表示第i个相似实例的市场份额,vi表示第i个相似实例的价格,qi第i个相似实例在相似实例集合中的价格概率。
实施例
本实施给定新的云服务提供商的一个实例,其中f={2,9,2.1},3个属性依次表示内存、硬盘和虚拟核心。同时搜集现行市场的实例,本实施例从http://www.cloudlook.com/获取不同云服务商的实例,包括Amazon EC2,Digital Ocean,Google,HP Cloud和Azure等云服务商。
表1现行市场的云服务实例集合
序号 | 内存 | 硬盘 | CPU | 价格 | 序号 | 内存 | 硬盘 | CPU | 价格 |
1 | 0.6 | 9 | 1 | 2.0 | 25 | 1 | 9 | 1 | 3.0 |
2 | 1.6 | 9 | 1 | 4.4 | 26 | 3.9 | 9 | 2 | 12.0 |
3 | 3.7 | 9 | 1 | 7.0 | 27 | 7.8 | 9 | 4 | 24.0 |
4 | 3.7 | 9 | 1 | 8.7 | 28 | 2.0 | 9 | 1 | 6.0 |
5 | 7.3 | 9 | 1.8 | 14.0 | 29 | 14.7 | 9 | 4 | 45.0 |
6 | 7.3 | 9 | 1.8 | 17.5 | 30 | 29.5 | 9 | 7.6 | 90.0 |
7 | 14.7 | 9 | 3.2 | 35.0 | 31 | 0.5 | 19 | 1 | 2.2 |
8 | 0.5 | 19 | 1 | 0.7 | 32 | 1 | 39 | 1 | 6.0 |
9 | 1 | 29 | 1 | 1.5 | 33 | 1.8 | 78 | 1.6 | 12.0 |
10 | 2 | 39 | 2 | 3.0 | 34 | 3.8 | 157 | 1.6 | 24.0 |
11 | 3.9 | 59 | 2 | 6.0 | 35 | 7.7 | 314 | 2.6 | 48.0 |
12 | 7.8 | 78 | 3.9 | 11.9 | 36 | 14.5 | 610 | 3.6 | 90.0 |
13 | 15.7 | 157 | 7.5 | 23.8 | 37 | 29.3 | 1181 | 4.8 | 120.0 |
14 | 31.5 | 314 | 10.4 | 47.6 | 38 | 1 | 19 | 1 | 4.0 |
15 | 0.5 | 23 | 1 | 3.0 | 39 | 1.8 | 39 | 1.8 | 8.0 |
16 | 1 | 46 | 1 | 6.0 | 40 | 3.8 | 39 | 3.2 | 16.0 |
17 | 1.8 | 94 | 1.8 | 12.0 | 41 | 7.7 | 39 | 1.97 | 32.0 |
18 | 3.8 | 192 | 3.1 | 24.0 | 42 | 14.5 | 39 | 3.2 | 68.0 |
19 | 7.7 | 389 | 5.2 | 48.0 | 43 | 29.3 | 39 | 5.7 | 136.0 |
20 | 15.5 | 783 | 9.2 | 96.0 | 44 | 0.5 | 28 | 1 | 2.0 |
21 | 23.4 | 1204 | 16.1 | 144.0 | 45 | 1.5 | 28 | 1 | 6.0 |
22 | 7.2 | 9 | 1.8 | 15.6 | 46 | 3.2 | 28 | 2 | 12.0 |
23 | 14.6 | 9 | 3.4 | 31.2 | 47 | 6.7 | 28 | 4.1 | 24.0 |
24 | 29.4 | 9 | 7 | 62.4 | 48 | 13.6 | 28 | 8.3 | 48.0 |
其中内存的单位为GB,硬盘的单位为GB,CPU的单位为虚拟CPU核数,价格的单位为¢/h。
首先统计现行实例在不同价格区间的概率分布。由下表可以看出价格为0~10美分的实例数量最多,且超过80%的实例价格低于50美分。现行市场没有50~60美分和70~80美分的实例。
表2现行实例的价格概率分布
价格 | 概率 | 价格 | 概率 |
0~10¢/h | 37.5% | 50~60 | 0 |
10~20¢/h | 18.75% | 60~70 | 4.2% |
20~30¢/h | 10.42% | 70~80 | 0 |
30~40¢/h | 6.25% | 80~90 | 4.2% |
40~50¢/h | 10.42% | >90 | 8.26% |
其次,将新实例和现行实例进行标准化处理,并根据标准化后的数据,计算新实例和现行实例的欧式距离,选择其中5个欧式距离最小的现行实例作为新实例的相似实例。计算得到的相似实例分别是s10={2,39,2},s39={1.8,39,1.8},s46={3.2,28,2},s26={3.9,9,2},s11={3.9,59,2}。其中相似实例的概率分布为
再次,对于每一个相似实例,获取实例的吸引力属性,吸引力属性包括价格、CPU速率、内存速率和品牌吸引力,以此计算它们的初始市场份额。
表3相似实例的吸引力属性
序号 | 价格 | CPU速率 | 内存速率 | 品牌吸引力 |
10 | 3 | 1.57 | 5.8 | 0.4 |
39 | 8 | 1.98 | 6.4 | 1.5 |
46 | 12 | 1.52 | 3.6 | 0.9 |
26 | 12 | 0.89 | 2.7 | 1.0 |
11 | 6 | 1.55 | 5.7 | 0.6 |
实例的所有吸引力属性的综合作用反映了实例对用户的吸引程度,吸引程度越大则市场份额越高。采用乘法竞争互动公式计算出相似实例的市场份额。
m1=0.4×3-0.8×1.571.2×5.81.6=4.7526,m2=12.5749,m3=1.5820,
m4=0.5836,m5=3.921。
接下来建立用户转移概率矩阵为P,其中Pij为第i个实例的用户转移到第j个实例的概率。
然后根据马尔科夫链方法计算出相似实例的短期市场份额和最终市场份额。其中,短期市场份额为MS(1)={0.173,0.421,0.088,0.131,0.187}。最终市场份额为MS={0.1232,0.2552,0.1062,0.3431,0.1723}。
最后综合相似实例的价格、概率分布和市场份额来计算新实例的价格,把相似实例的市场份额作为相似实例价格的可信程度,并把相似实例价格的概率分布作为对新实例的价格影响度。根据上述属性值计算出的新实例价格为:
本发明提供了一种用于云计算资源定价的统计分析方法,具体实现该技术方案的方法和途径很多,以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。本实施例中未明确的各组成部分均可用现有技术加以实现。
Claims (1)
1.一种用于云计算资源定价的统计分析方法,其特征在于,包括以下步骤:
步骤1,给定一个新的云服务提供商的资源实例作为新实例,并从互联网的云服务提供商中搜集虚拟机实例作为现行实例,实例具有统一的属性,分别包括虚拟核心、内存和硬盘;
步骤2,统计现行实例在不同价格区间的概率分布,作为新实例的价格参考范围;
步骤3,将现行实例和新实例的数据进行标准化处理,并对现行实例和新实例进行分类,通过计算新实例和现行实例的欧氏距离,选择欧氏距离最小的现行实例作为新实例的相似实例,新实例的所有相似实例构成相似实例集合;
步骤4,采用乘法竞争互动公式计算出相似实例的初始市场份额,并且建立用户转移概率矩阵,然后根据马尔科夫链方法计算出相似实例的短期市场份额和最终市场份额;
步骤5,综合相似实例的价格、概率分布和最终市场份额,计算出新实例的价格;
步骤3中对现行实例和新实例的数据分别采用Z-分数标准化法进行标准化处理,公式如下:
<mrow>
<msub>
<mi>C</mi>
<mrow>
<mi>i</mi>
<mi>j</mi>
</mrow>
</msub>
<mo>=</mo>
<mfrac>
<mrow>
<msub>
<mi>s</mi>
<mrow>
<mi>i</mi>
<mi>j</mi>
</mrow>
</msub>
<mo>-</mo>
<msub>
<mover>
<mi>s</mi>
<mo>&OverBar;</mo>
</mover>
<mi>j</mi>
</msub>
</mrow>
<msubsup>
<mi>s</mi>
<mi>j</mi>
<mi>&sigma;</mi>
</msubsup>
</mfrac>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>1</mn>
<mo>)</mo>
</mrow>
</mrow>
<mrow>
<msub>
<mi>F</mi>
<mi>j</mi>
</msub>
<mo>=</mo>
<mfrac>
<mrow>
<msub>
<mi>f</mi>
<mi>j</mi>
</msub>
<mo>-</mo>
<msub>
<mover>
<mi>s</mi>
<mo>&OverBar;</mo>
</mover>
<mi>j</mi>
</msub>
</mrow>
<msubsup>
<mi>s</mi>
<mi>j</mi>
<mi>&sigma;</mi>
</msubsup>
</mfrac>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>2</mn>
<mo>)</mo>
</mrow>
</mrow>
其中,Cij表示第i个现行实例的第j个属性的标准化值,sij表示第i个现行实例的第j个属性值,j=1时sij表示现行实例的虚拟核心数量,j=2时sij表示现行实例的内存属性,j=3时sij表示现行实例的硬盘属性,表示现行实例集合中第j个属性的均值,m表示现行实例的数量,表示现行实例集合中第j个属性的标准差,Fj表示新实例的第j个属性的标准化值,fj表示新实例的第j个属性值,j=1时fj表示新实例的虚拟核心数量,j=2时fj表示新实例的内存属性,j=3时fj表示新实例的硬盘属性;
步骤3中,采用K最近邻分类方法对现行实例和新实例进行分类,通过计算新实例和现行实例的欧氏距离,选择欧氏距离最小的前k个实例作为新实例的相似实例,k取值自然数,欧氏距离计算公式如下:
<mrow>
<msub>
<mi>E</mi>
<mi>i</mi>
</msub>
<mo>=</mo>
<msqrt>
<mrow>
<msubsup>
<mi>&Sigma;</mi>
<mrow>
<mi>j</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mn>3</mn>
</msubsup>
<msup>
<mrow>
<mo>(</mo>
<msub>
<mi>C</mi>
<mrow>
<mi>i</mi>
<mi>j</mi>
</mrow>
</msub>
<mo>-</mo>
<msub>
<mi>F</mi>
<mi>j</mi>
</msub>
<mo>)</mo>
</mrow>
<mn>2</mn>
</msup>
</mrow>
</msqrt>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>3</mn>
<mo>)</mo>
</mrow>
</mrow>
其中,Ei表示第i个现行实例和新实例的欧式距离,E的大小反映了两个实例之间的相似程度,E越小,表示两个实例越相似;Cij表示第i个现行实例的第j个属性的标准化值;Fj表示新实例的第j个属性的标准化值;
步骤3中,对于每个相似实例,计算它们在相似实例集合中的价格概率分布,公式如下:
<mrow>
<msub>
<mi>q</mi>
<mi>i</mi>
</msub>
<mo>=</mo>
<mfrac>
<msub>
<mi>Q</mi>
<mi>i</mi>
</msub>
<mrow>
<msubsup>
<mi>&Sigma;</mi>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>k</mi>
</msubsup>
<msub>
<mi>Q</mi>
<mi>i</mi>
</msub>
</mrow>
</mfrac>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>4</mn>
<mo>)</mo>
</mrow>
</mrow>
其中,qi表示第i个相似实例在相似实例集合中的价格概率,Qi表示第i个相似实例在现行市场的价格概率,表示所有相似实例的现行市场价格概率之和,k表示相似实例集合的实例总个数;
步骤4中,使用吸引力模型计算相似实例的初始市场份额,对于每一个相似实例,获取相似实例的吸引力属性,吸引力属性包括价格、CPU速率、内存速率和品牌吸引力,所述乘法竞争互动公式如下:
<mrow>
<msubsup>
<mi>MS</mi>
<mi>i</mi>
<mrow>
<mo>(</mo>
<mn>0</mn>
<mo>)</mo>
</mrow>
</msubsup>
<mo>=</mo>
<mfrac>
<mrow>
<msub>
<mi>L</mi>
<mi>i</mi>
</msub>
<msubsup>
<mi>p</mi>
<mi>i</mi>
<mi>a</mi>
</msubsup>
<mo>&part;</mo>
<msubsup>
<mi>cpu</mi>
<mi>i</mi>
<mi>b</mi>
</msubsup>
<mo>&part;</mo>
<msubsup>
<mi>mem</mi>
<mi>i</mi>
<mi>c</mi>
</msubsup>
</mrow>
<mrow>
<msubsup>
<mi>&Sigma;</mi>
<mrow>
<mi>j</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>k</mi>
</msubsup>
<msub>
<mi>L</mi>
<mi>j</mi>
</msub>
<msubsup>
<mi>p</mi>
<mi>j</mi>
<mi>a</mi>
</msubsup>
<mo>&part;</mo>
<msubsup>
<mi>cpu</mi>
<mi>j</mi>
<mi>b</mi>
</msubsup>
<mo>&part;</mo>
<msubsup>
<mi>mem</mi>
<mi>j</mi>
<mi>c</mi>
</msubsup>
</mrow>
</mfrac>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>5</mn>
<mo>)</mo>
</mrow>
</mrow>
其中,表示第i个相似实例在t周期时的市场份额,t≥0,表示第i个相似实例的初始市场份额,且k表示相似实例集合的实例总个数;表示第i个实例对用户的吸引程度,表示所有实例对用户的总吸引程度,Li表示第i个实例的品牌吸引力,pi表示第i个实例的价格,表示第i个实例的CPU速率,表示第i个实例的内存读写速率,参数a表示价格pi对吸引力的影响系数,参数b表示CPU速率对吸引力的影响系数,参数c表示内存速率对吸引力的影响系数;
步骤4中,根据用户购买实例的历史记录建立用户转移概率矩阵P;
步骤4中,所述根据马尔科夫链方法计算出相似实例的短期市场份额,公式如下:
MS(1)=MS(0)·P (6)
其中,表示短期市场份额矩阵,k表示相似实例集合的实例总个数,表示初始市场份额矩阵;
步骤4中,根据马尔科夫链方法计算出相似实例的最终市场份额,公式如下:
<mrow>
<mfenced open = "{" close = "">
<mtable>
<mtr>
<mtd>
<mrow>
<mi>M</mi>
<mi>S</mi>
<mo>=</mo>
<mi>M</mi>
<mi>S</mi>
<mo>&CenterDot;</mo>
<mi>P</mi>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<msubsup>
<mi>&Sigma;</mi>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>k</mi>
</msubsup>
<msub>
<mi>MS</mi>
<mi>i</mi>
</msub>
<mo>=</mo>
<mn>1</mn>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>7</mn>
<mo>)</mo>
</mrow>
</mrow>
其中,MS=(MS1,MS2,…,MSk)表示最终市场份额矩阵,k表示相似实例集合的实例总个数,MSi表示第i个相似实例的最终市场份额,P表示用户转移概率矩阵;
步骤5中,建立一个计算新实例价格的模型,其中把相似实例的市场份额作为相似实例价格的可信程度,即市场份额越高则价格越可信;并把相似实例价格的概率分布作为相似实例对新实例的价格影响度,即概率分布越高,则影响度越低,最后根据相似实例的价格、价格概率分布和最终市场份额计算出新实例的价格,计算公式如下:
<mrow>
<mi>p</mi>
<mi>r</mi>
<mi>i</mi>
<mi>c</mi>
<mi>e</mi>
<mo>=</mo>
<msubsup>
<mi>&Sigma;</mi>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>k</mi>
</msubsup>
<msub>
<mi>MS</mi>
<mi>i</mi>
</msub>
<mo>&CenterDot;</mo>
<msub>
<mi>v</mi>
<mi>i</mi>
</msub>
<mo>-</mo>
<mfrac>
<mn>1</mn>
<mi>k</mi>
</mfrac>
<msubsup>
<mi>&Sigma;</mi>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>k</mi>
</msubsup>
<msub>
<mi>q</mi>
<mi>i</mi>
</msub>
<mo>&CenterDot;</mo>
<msub>
<mi>v</mi>
<mi>i</mi>
</msub>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>8</mn>
<mo>)</mo>
</mrow>
</mrow>
其中price表示新实例的价格,k表示相似实例集合的实例总个数,MSi表示第i个相似实例的市场份额,vi表示第i个相似实例的价格,qi表示第i个相似实例在相似实例集合中的价格概率。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510198430.3A CN104750877B (zh) | 2015-04-23 | 2015-04-23 | 一种用于云计算资源定价的统计分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510198430.3A CN104750877B (zh) | 2015-04-23 | 2015-04-23 | 一种用于云计算资源定价的统计分析方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104750877A CN104750877A (zh) | 2015-07-01 |
CN104750877B true CN104750877B (zh) | 2017-09-05 |
Family
ID=53590561
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510198430.3A Expired - Fee Related CN104750877B (zh) | 2015-04-23 | 2015-04-23 | 一种用于云计算资源定价的统计分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104750877B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111652641B (zh) * | 2020-05-29 | 2023-07-25 | 泰康保险集团股份有限公司 | 数据处理方法、装置、设备及计算机可读存储介质 |
CN112950284B (zh) * | 2021-03-29 | 2024-06-18 | 湖南快乐阳光互动娱乐传媒有限公司 | 预留实例预估方法、系统、存储介质及电子设备 |
CN113487196A (zh) * | 2021-07-12 | 2021-10-08 | 中山大学 | 一种快速灵活全纯嵌入式经济策略调整方法及装置 |
CN117971512B (zh) * | 2024-04-02 | 2024-08-02 | 杭州骋风而来数字科技有限公司 | 一种算力智能调度系统和方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102185926A (zh) * | 2011-05-25 | 2011-09-14 | 盛大计算机(上海)有限公司 | 一种云计算资源管理系统及方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8769083B2 (en) * | 2009-08-31 | 2014-07-01 | Red Hat, Inc. | Metering software infrastructure in a cloud computing environment |
US9188109B2 (en) * | 2012-02-16 | 2015-11-17 | Spyros James Lazaris | Virtualization, optimization and adaptation of dynamic demand response in a renewable energy-based electricity grid infrastructure |
-
2015
- 2015-04-23 CN CN201510198430.3A patent/CN104750877B/zh not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102185926A (zh) * | 2011-05-25 | 2011-09-14 | 盛大计算机(上海)有限公司 | 一种云计算资源管理系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN104750877A (zh) | 2015-07-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101939554B1 (ko) | 일시적 거래 한도 결정 | |
Mohri et al. | Learning theory and algorithms for revenue optimization in second price auctions with reserve | |
Zhang et al. | Exploring latent features for memory-based QoS prediction in cloud computing | |
TWI546751B (zh) | Cross - site information display method and system | |
Shin et al. | Strategic management of cloud computing services: Focusing on consumer adoption behavior | |
CN107851106A (zh) | 用于关系数据库即服务的自动需求驱动的资源缩放 | |
CN104750877B (zh) | 一种用于云计算资源定价的统计分析方法 | |
CN104951460B (zh) | 基于关键词聚类的排名参量值确定方法及装置 | |
CN107615275A (zh) | 估计用于运行数据挖掘服务的计算资源 | |
Lu et al. | Show me the money: Dynamic recommendations for revenue maximization | |
CN103914468A (zh) | 一种投放信息搜索的方法和装置 | |
CN105590231A (zh) | 用户数据处理方法和装置 | |
US11200587B2 (en) | Facilitating use of select hyper-local data sets for improved modeling | |
CN111626767B (zh) | 资源数据的发放方法、装置及设备 | |
US11604994B2 (en) | Explainable machine learning based on heterogeneous data | |
Lu et al. | Reinforcement learning with sequential information clustering in real-time bidding | |
US11501239B2 (en) | Metric specific machine learning model improvement through metric specific outlier removal | |
CN111966886A (zh) | 对象推荐方法、对象推荐装置、电子设备及存储介质 | |
CN106354867A (zh) | 多媒体资源的推荐方法及装置 | |
CN112927050A (zh) | 待推荐金融产品确定方法、装置、电子设备及存储介质 | |
CN110866698A (zh) | 用于评定服务提供方的服务分值的装置 | |
Chauhan et al. | Redundant IAAS cloud selection with consideration of multi criteria decision analysis | |
US20210073830A1 (en) | Computerized competitiveness analysis | |
US11693579B2 (en) | Value-based replication of streaming data | |
KR102585895B1 (ko) | 오픈마켓에서의 키워드 마케팅 효율 증가를 위한 방법 및 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20170905 |