CN104750877B - 一种用于云计算资源定价的统计分析方法 - Google Patents

一种用于云计算资源定价的统计分析方法 Download PDF

Info

Publication number
CN104750877B
CN104750877B CN201510198430.3A CN201510198430A CN104750877B CN 104750877 B CN104750877 B CN 104750877B CN 201510198430 A CN201510198430 A CN 201510198430A CN 104750877 B CN104750877 B CN 104750877B
Authority
CN
China
Prior art keywords
mrow
instance
similar
msub
msubsup
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201510198430.3A
Other languages
English (en)
Other versions
CN104750877A (zh
Inventor
窦万春
吴诗颖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University
Original Assignee
Nanjing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University filed Critical Nanjing University
Priority to CN201510198430.3A priority Critical patent/CN104750877B/zh
Publication of CN104750877A publication Critical patent/CN104750877A/zh
Application granted granted Critical
Publication of CN104750877B publication Critical patent/CN104750877B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种用于云计算资源定价的统计分析方法,包括以下步骤:步骤1,给定一个新的云服务提供商的资源实例,并搜集现行市场的云计算实例;步骤2,统计所有现行实例在不同价格区间的概率分布;步骤3,将现行实例和新实例的数据进行标准化处理,并对现行实例和新实例进行分类,选择跟新实例在同一类的现行实例作为新实例的相似实例;步骤4,获取相似实例的初始市场份额,并建立用户转移概率矩阵,采用马尔科夫链方法计算出相似实例的短期市场份额和最终市场份额;步骤5,统计相似实例的价格、概率分布和市场份额,计算出新实例的价格。

Description

一种用于云计算资源定价的统计分析方法
技术领域
本发明涉及互联网计算机软件技术领域,特别是一种用于云计算资源定价的统计分析方法。
背景技术
在信息、通信技术快速发展的互联网时代,计算模式从任务提交给大型处理机发展到基于网络的分布式任务处理,最终演变成按需处理的云计算模式。
云计算是一种新型的热门计算平台,采用按需请求资源、按实际用量付费的运行模式。关于云计算的定义很广泛,例如Foster在“Cloud computing and gridcomputing360-degree compared”中定义云计算为规模经济驱动的大规模分布式计算系统,通过虚拟化技术依靠互联网向消费者提供弹性的、可管理的计算资源、存储空间、应用平台及服务。
云计算的主要特点是弹性地提供IT架构和应用。云计算的发展得益于以下三个方面:(1)硬件费用的下降,计算能力和存储容量的增长,多核架构和超级计算机的流行;(2)数据规模的爆炸式增长;(3)服务计算和Web2.0应用的广泛使用。政府、研究机构和企业纷纷采用云计算来解决了他们日益增长的计算和存储需求。
云计算为全球的IT产业带来了深远的影响。International Data Corporation国际数据公司对云计算所做的一项调查中指出,2010年公有云的总利润超过21.5百万美元,且将在2015年达到72.9亿美元,其中年增长率达到了27.6%。云计算的利润增长率是全球IT业利润增长率(6.7%)的4倍。
现在有许多大型的公司都提供云计算服务,例如亚马逊(Amazon),IBM,谷歌(Google),微软(Microsoft)等。云计算的高速发展也吸引了越来越多的公司加入卖方市场。新的云服务提供商可以通过出售自己的计算资源给用户,从中获取利益。在云计算市场中,如何合理的为云计算资源定价,是新的云服务提供商亟待解决的问题。现有的定价机制通常采用纳什均衡、拍卖等方法进行理论分析。例如,Yuan Feng等人在“PriceCompetition in an Oligopoly Market with Multiple IaaS Cloud Providers”中提出了一种为多个云服务提供商定价的方法,该方法考虑垄断市场的竞争环境,使用纳什均衡计算出多个云服务提供商的最优价格。Zaman,S.等人在“A Combinatorial Auction-BasedMechanism for Dynamic VM Provisioning and Allocation in Clouds”中提出一种基于组合拍卖的虚拟机动态分配方法。
目前有许多针对不同领域的定价方法已经取得了一些成果。中国专利《一种基于Bertrand静态博弈的授权用户频谱定价方法》,申请号:201310084931.X,授权公告号103117824A公开了一种用于授权用户频谱定价的方法,该方法采用差异化寡头市场模型来描述认知系统,并利用经济学原理以及静态Bertrand博弈理论实现授权用户频谱定价。该方法的目的是获取所有授权用户稳定的均衡定价策略,如果有新授权用户加入市场,其他授权用户也会相应改变价格,而现实可能存在新授权用户的市场影响力并不足以影响其他授权用户改变价格。
然而上述定价方法并没有从当前云服务市场状况来考虑定价。现行市场的实例定价对新实例具有很好的参考价值,可以帮助新的云服务商选择如何切入市场。
发明内容
发明目的:本发明要解决的问题是对现行市场的云计算实例的价格、市场份额等属性进行统计分析,从而为新的云平台服务商提供合理定价。
本发明针对现有技术的不足,提供一种用于云计算资源定价的统计分析方法。
为了解决上述技术问题,本发明公开了一种用于云计算资源定价的统计分析方法,包括以下步骤:
步骤1:给定一个新的云服务提供商的资源实例作为新实例,并从互联网的云服务提供商中搜集虚拟机实例作为现行实例,实例具有统一的属性,分别包括虚拟核心、内存和硬盘;
步骤2:统计现行实例在不同价格区间的概率分布,作为新实例的价格参考范围;
步骤3:将现行实例和新实例的数据进行标准化处理,并对现行实例和新实例进行分类,通过计算新实例和现行实例的欧氏距离,选择欧氏距离最小的现行实例作为新实例的相似实例;
步骤4:采用乘法竞争互动公式计算出相似实例的初始市场份额,并且建立用户转移概率矩阵,然后通过马尔科夫链方法计算出相似实例的短期市场份额和最终市场份额;
步骤5:综合相似实例的价格、概率分布和最终市场份额,计算出新实例的价格。其中,把相似实例的市场份额作为相似实例价格的可信程度,并把相似实例价格的概率分布作为相似实例对新实例的价格影响度。
本发明中,从现行市场搜集到的实例集合为{s1,s2,…,si,…,sn},其中si表示第i个现行实例,1≤i≤n,n表示现行市场的实例的个数。si={si1,si2,si3},其中si1表示第i个现行实例的内存,si2表示第i个实例的硬盘,si3表示第i个实例的虚拟核心。
本发明中新实例的抽象描述为f={f1,f2,f3},其中f1表示新实例的内存,f2表示新实例的硬盘,f3表示新实例的虚拟核心。
本发明中,由于实例的不同属性具有不同的量纲和量纲单位,为了消除属性之间的量纲影响,需要对数据进行标准化处理。本发明中,步骤3中将现行实例和新实例的数据进行标准化处理所使用的Z-分数标准化法(Z-core)为:
其中,Cij表示第i个现行实例的第j个属性的标准化值,sij表示第i个现行实例的第j个属性值,j=1时sij表示现行实例的虚拟核心数量,j=2时sij表示现行实例的内存属性,j=3时sij表示现行实例的硬盘属性,表示现行实例集合中第j个属性的均值,m表示现行实例的数量,表示现行实例集合中第j个属性的标准差,Fj表示新实例的第j个属性的标准化值,fj表示新实例的第j个属性值,j=1时fj表示新实例的虚拟核心数量,j=2时fj表示新实例的内存属性,j=3时fj表示新实例的硬盘属性。
步骤3中对于现行实例和新实例采用K最近邻分类方法(KNN)进行分类。KNN是基于距离的分类方法,对于每个现行实例,计算其和新实例的欧氏距离。计算实例间的欧式距离公式如下所示:
其中,Ei表示第i个现行实例和新实例的欧式距离,E的大小反映了两个实例之间的相似程度;E越小,表示两个实例越相似;Cij表示第i个现行实例的第j个属性的标准化值;Fj表示新实例的第j个属性的标准化值。
计算完所有现行实例和新实例间的欧氏距离后,将Ei按从小到大的顺序进行排序,选择其中k个欧式距离最小的现行实例作为新实例的相似实例,k取值自然数,该发明的目的是用较少的相似实例计算新实例的价格,减少处理的时间,且相似的现行实例对新实例具有更高的参考价值。
本发明中,获取相似实例后,对于每个相似实例,计算它们在相似实例集合中的价格概率分布,公式如下:
其中,qi表示第i个相似实例在相似实例集合中的价格概率,Qi表示第i个相似实例在现行市场的价格概率,表示所有相似实例的现行市场价格概率之和。
本发明中,使用吸引力模型计算相似实例的初始市场份额。对于每一个相似实例,获取实例的吸引力属性,吸引力属性包括价格、CPU速率、内存速率和品牌吸引力。对于吸引力属性,从高德纳咨询公司Gartner的公有云调查报告http://www.gartner.com/technology/reprints.do?id=1-2453PUR&ct=141105&st=s中获取价格对吸引力的影响系数、CPU速率对吸引力的影响系数以及内存速率对吸引力的影响系数。实例的所有吸引力属性的综合作用反映了实例对用户的吸引程度,吸引程度越大则市场份额越高。本发明采用乘法竞争互动(Multiplicative Competitive Interaction,MCI)公式计算出相似实例的初始市场份额。
本发明步骤4中,计算初始市场份额的乘法竞争互动公式如下:
其中,表示第i个相似实例的初始市场份额, 表示第i个实例对用户的吸引程度,表示所有实例对用户的总吸引程度,Li表示第i个实例的品牌吸引力,品牌吸引力值从高德纳咨询公司Gartner的公有云调查报告中获取,pi表示第i个实例的价格,表示第i个实例的CPU速率,表示第i个实例的内存读写速率,参数a表示价格pi对吸引力的影响系数,参数b表示CPU速率对吸引力的影响系数,参数c表示内存速率对吸引力的影响系数。
本发明中,根据用户购买实例的历史记录建立用户转移概率矩阵P。P=(P1,P2,…,Pk)表示用户转移概率矩阵;Pi=(Pi1,Pi2,…,Pik)中Pij表示第i个实例的用户转移到第j个实例的概率,其中,用户购买历史记录中总用户数量为U,Userij表示第一个月购买实例i,而第二个月改成购买实例j的用户数量。
本发明中,使用马尔科夫链方法计算出相似实例的短期市场份额和最终市场份额。马尔科夫链理论中,当前周期的状态是由前一个周期的状态转移得来的,则t个周期后的市场份额计算公式为:
MS(t)=MS(0)·Pt=MS(t-1)·P (6)
其中表示初始市场份额矩阵,P=(P1,P2,…,Pk)表示用户转移概率矩阵。
通过上述公式计算出相似实例的短期市场份额为MS(1)=MS(0)·P。
根据马尔科夫链理论,当周期t大到一定程度时,MS(t)将会近似不变,变成一个稳定的分布,即MS=MS·P。考虑到所有实例的市场份额之和为1,则相似实例的最终市场份额可由以下公式求出:
其中,MS=(MS1,MS2,…,MSk)表示最终市场份额矩阵,MSi表示第i个相似实例的最终市场份额,P表示用户转移概率矩阵。
本发明中,步骤5中,建立一个计算新实例价格的模型,其中把相似实例的市场份额作为相似实例价格的可信程度,即市场份额越高则价格越可信;并把相似实例价格的概率分布作为相似实例对新实例的价格影响度,即概率分布越高则影响度越低,以此选择竞争对手少的产品来切入市场。计算新实例的价格公式如下:
其中price表示新实例的价格,MSi表示第i个相似实例的市场份额,vi表示第i个相似实例的价格,qi表示第i个相似实例在相似实例集合的价格概率。
本发明中的思想为:首先统计现行实例在不同价格区间的概率分布;然后对每个现行实例,计算现行实例和新实例的欧式距离,选择k个距离最小的现行实例作为新实例的相似实例;再采用马尔科夫链方法计算这k个相似实例的市场份额;最后根据相似实例的价格、市场份额和概率分布计算出新实例的价格。
与现有技术相比,本发明的有益效果体现在:
(1)利用现行市场的实例价格做新实例的定价决策,更加合理,可信。
(2)相似实例的数目小于现行市场中所有实例的数目,加快了处理时间。
(3)使用马尔科夫链方法来分析相似实例在市场上的状态分布,符合市场份额随时间不断变化的特性,使得最终计算出的市场份额更加可信。
(4)利用相似实例的市场份额作为相似实例对新实例的可信度,使得新实例的价格更加接近高市场份额的现行实例的价格。
附图说明
下面结合附图和具体实施方式对本发明做更进一步的具体说明,本发明的上述和/或其他方面的优点将会变得更加清楚。
图1是本发明流程图。
具体实施方式
下面结合附图对本发明作具体说明。应该指出,所描述的实施例仅是为了说明的目的,而不是对本发明范围的限制。
本发明公开了一种用于云计算资源定价的统计分析方法,该方法流程图如图1所示,包括以下步骤:
步骤1:给定一个新的云服务提供商的资源实例作为新实例,并从互联网的云服务提供商中搜集虚拟机实例作为现行实例,实例具有统一的属性,分别包括虚拟核心、内存和硬盘;
从现行市场搜集到的实例集合为{s1,s2,…,si,…,sn},其中si表示第i个现行实例,1≤i≤n,n表示现行市场的实例的个数。si={si1,si2,si3},其中si1表示第i个现行实例的内存,si2表示第i个实例的硬盘,si3表示第i个实例的虚拟核心。
新实例的抽象描述为f={f1,f2,f3},其中f1表示新实例的内存,f2表示新实例的硬盘,f3表示新实例的虚拟核心。
步骤2:统计现行实例在不同价格区间的概率分布,作为新实例的价格参考范围;
步骤3:将现行实例和新实例的数据进行标准化处理,并对现行实例和新实例进行分类,通过计算新实例和现行实例的欧氏距离,选择欧氏距离最小的现行实例作为新实例的相似实例,新实例的所有相似实例构成相似实例集合;
步骤3中,由于实例的不同属性具有不同的量纲和量纲单位,为了消除属性之间的量纲影响,需要对数据进行标准化处理。本发明中,所使用的Z-分数标准化法(Z-core)为:
其中,Cij表示第i个现行实例的第j个属性的标准化值,sij表示第i个现行实例的第j个属性值,j=1时sij表示现行实例的虚拟核心数量,j=2时sij表示现行实例的内存属性,j=3时sij表示现行实例的硬盘属性,表示现行实例集合中第j个属性的均值,m表示现行实例的数量,表示现行实例集合中第j个属性的标准差,Fj表示新实例的第j个属性的标准化值,fj表示新实例的第j个属性值,j=1时fj表示新实例的虚拟核心数量,j=2时fj表示新实例的内存属性,j=3时fj表示新实例的硬盘属性。
本发明中,对于现行实例和新实例采用K最近邻分类方法(KNN)进行分类。KNN是基于距离的分类方法,对于每个现行实例,计算其和新实例的欧氏距离。计算实例间的欧式距离公式如下所示:
其中,Ei表示第i个现行实例和新实例的欧式距离,E的大小反映了两个实例之间的相似程度;E越小,表示两个实例越相似;Cij表示第i个现行实例的第j个属性的标准化值;Fj表示新实例的第j个属性的标准化值。
计算完所有现行实例和新实例间的欧氏距离后,将Ei按从小到大的顺序进行排序,选择其中k个欧式距离最小的现行实例作为新实例的相似实例。该发明的目的是用较少的相似实例计算新实例的价格,减少处理的时间,且相似的现行实例对新实例具有更高的参考价值。
本发明中,对于每个相似实例,计算它们在相似实例集合中的价格概率分布,公式如下:
其中,qi表示第i个相似实例在相似实例集合中的价格概率,Qi表示第i个相似实例在现行市场的价格概率,表示所有相似实例的现行市场价格概率之和。
步骤4:采用乘法竞争互动公式计算出相似实例的初始市场份额,并且建立用户转移概率矩阵,然后通过马尔科夫链方法计算出相似实例的短期市场份额和最终市场份额;
本发明中,使用吸引力模型计算相似实例的初始市场份额,实例的所有吸引力属性的综合作用反映了实例对用户的吸引程度,吸引程度越大则市场份额越高。对于每一个相似实例,获取实例的吸引力属性,吸引力属性包括价格、CPU速率、内存速率和其他影响因素的综合作用。对于吸引力属性,从高德纳咨询公司Gartner的公有云调查报告http://www.gartner.com/technology/reprints.do?id=1-2453PUR&ct=141105&st=s中获取价格对吸引力的影响系数、CPU速率对吸引力的影响系数以及内存速率对吸引力的影响系数。本发明采用乘法竞争互动(Multiplicative Competitive Interaction,MCI)公式计算出相似实例的初始市场份额。
本发明中,计算初始市场份额的乘法竞争互动公式如下:
其中,表示第i个相似实例的初始市场份额, 表示第i个实例对用户的吸引程度,表示所有实例对用户的总吸引程度,Li表示第i个实例的品牌吸引力,品牌吸引力值从高德纳咨询公司Gartner的公有云调查报告中获取,pi表示第i个实例的价格,表示第i个实例的CPU速率,表示第i个实例的内存读写速率,参数a表示价格pi对吸引力的影响系数,参数b表示CPU速率对吸引力的影响系数,参数c表示内存速率对吸引力的影响系数。
本发明中,根据用户购买实例的历史记录建立用户转移概率矩阵P,P=(P1,P2,…,Pk)表示用户转移概率矩阵;Pi=(Pi1,Pi2,…,Pik)中Pij表示第i个实例的用户转移到第j个实例的概率。
本发明中,使用马尔科夫链方法计算出相似实例的短期市场份额和最终市场份额。马尔科夫链理论中,当前周期的状态是由前一个周期的状态转移得来的,则t个周期后的市场份额计算公式为:
MS(t)=MS(0)·Pt=MS(t-1)·P (6)
其中表示初始市场份额矩阵,P=(P1,P2,…,Pk)表示用户转移概率矩阵。
通过上述公式计算出相似实例的短期市场份额为MS(1)=MS(0)·P。
根据马尔科夫链理论,当周期t大到一定程度时,MS(t)将会近似不变,变成一个稳定的分布,即MS=MS·P。考虑到所有实例的市场份额之和为1,则相似实例的最终市场份额可由以下公式求出:
其中,MS=(MS1,MS2,…,MSk)表示最终市场份额矩阵,MSi表示第i个相似实例的最终市场份额,P表示用户转移概率矩阵。
步骤5:综合相似实例的价格、概率分布、最终市场份额,计算出新实例的价格。其中,把相似实例的市场份额作为相似实例价格的可信程度,并把相似实例价格的概率分布作为相似实例对新实例的价格影响度。
本发明中,建立了一个计算新实例价格的模型,其中把相似实例的市场份额作为相似实例价格的可信程度,即市场份额越高则价格越可信;并把相似实例价格的概率分布作为相似实例对新实例的价格影响度,即概率分布越高则影响度越低,以此选择竞争对手少的产品来切入市场。计算新实例的价格公式如下:
其中price表示新实例的价格,MSi表示第i个相似实例的市场份额,vi表示第i个相似实例的价格,qi第i个相似实例在相似实例集合中的价格概率。
实施例
本实施给定新的云服务提供商的一个实例,其中f={2,9,2.1},3个属性依次表示内存、硬盘和虚拟核心。同时搜集现行市场的实例,本实施例从http://www.cloudlook.com/获取不同云服务商的实例,包括Amazon EC2,Digital Ocean,Google,HP Cloud和Azure等云服务商。
表1现行市场的云服务实例集合
序号 内存 硬盘 CPU 价格 序号 内存 硬盘 CPU 价格
1 0.6 9 1 2.0 25 1 9 1 3.0
2 1.6 9 1 4.4 26 3.9 9 2 12.0
3 3.7 9 1 7.0 27 7.8 9 4 24.0
4 3.7 9 1 8.7 28 2.0 9 1 6.0
5 7.3 9 1.8 14.0 29 14.7 9 4 45.0
6 7.3 9 1.8 17.5 30 29.5 9 7.6 90.0
7 14.7 9 3.2 35.0 31 0.5 19 1 2.2
8 0.5 19 1 0.7 32 1 39 1 6.0
9 1 29 1 1.5 33 1.8 78 1.6 12.0
10 2 39 2 3.0 34 3.8 157 1.6 24.0
11 3.9 59 2 6.0 35 7.7 314 2.6 48.0
12 7.8 78 3.9 11.9 36 14.5 610 3.6 90.0
13 15.7 157 7.5 23.8 37 29.3 1181 4.8 120.0
14 31.5 314 10.4 47.6 38 1 19 1 4.0
15 0.5 23 1 3.0 39 1.8 39 1.8 8.0
16 1 46 1 6.0 40 3.8 39 3.2 16.0
17 1.8 94 1.8 12.0 41 7.7 39 1.97 32.0
18 3.8 192 3.1 24.0 42 14.5 39 3.2 68.0
19 7.7 389 5.2 48.0 43 29.3 39 5.7 136.0
20 15.5 783 9.2 96.0 44 0.5 28 1 2.0
21 23.4 1204 16.1 144.0 45 1.5 28 1 6.0
22 7.2 9 1.8 15.6 46 3.2 28 2 12.0
23 14.6 9 3.4 31.2 47 6.7 28 4.1 24.0
24 29.4 9 7 62.4 48 13.6 28 8.3 48.0
其中内存的单位为GB,硬盘的单位为GB,CPU的单位为虚拟CPU核数,价格的单位为¢/h。
首先统计现行实例在不同价格区间的概率分布。由下表可以看出价格为0~10美分的实例数量最多,且超过80%的实例价格低于50美分。现行市场没有50~60美分和70~80美分的实例。
表2现行实例的价格概率分布
价格 概率 价格 概率
0~10¢/h 37.5% 50~60 0
10~20¢/h 18.75% 60~70 4.2%
20~30¢/h 10.42% 70~80 0
30~40¢/h 6.25% 80~90 4.2%
40~50¢/h 10.42% >90 8.26%
其次,将新实例和现行实例进行标准化处理,并根据标准化后的数据,计算新实例和现行实例的欧式距离,选择其中5个欧式距离最小的现行实例作为新实例的相似实例。计算得到的相似实例分别是s10={2,39,2},s39={1.8,39,1.8},s46={3.2,28,2},s26={3.9,9,2},s11={3.9,59,2}。其中相似实例的概率分布为
再次,对于每一个相似实例,获取实例的吸引力属性,吸引力属性包括价格、CPU速率、内存速率和品牌吸引力,以此计算它们的初始市场份额。
表3相似实例的吸引力属性
序号 价格 CPU速率 内存速率 品牌吸引力
10 3 1.57 5.8 0.4
39 8 1.98 6.4 1.5
46 12 1.52 3.6 0.9
26 12 0.89 2.7 1.0
11 6 1.55 5.7 0.6
实例的所有吸引力属性的综合作用反映了实例对用户的吸引程度,吸引程度越大则市场份额越高。采用乘法竞争互动公式计算出相似实例的市场份额。
m1=0.4×3-0.8×1.571.2×5.81.6=4.7526,m2=12.5749,m3=1.5820,
m4=0.5836,m5=3.921。
接下来建立用户转移概率矩阵为P,其中Pij为第i个实例的用户转移到第j个实例的概率。
然后根据马尔科夫链方法计算出相似实例的短期市场份额和最终市场份额。其中,短期市场份额为MS(1)={0.173,0.421,0.088,0.131,0.187}。最终市场份额为MS={0.1232,0.2552,0.1062,0.3431,0.1723}。
最后综合相似实例的价格、概率分布和市场份额来计算新实例的价格,把相似实例的市场份额作为相似实例价格的可信程度,并把相似实例价格的概率分布作为对新实例的价格影响度。根据上述属性值计算出的新实例价格为:
本发明提供了一种用于云计算资源定价的统计分析方法,具体实现该技术方案的方法和途径很多,以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。本实施例中未明确的各组成部分均可用现有技术加以实现。

Claims (1)

1.一种用于云计算资源定价的统计分析方法,其特征在于,包括以下步骤:
步骤1,给定一个新的云服务提供商的资源实例作为新实例,并从互联网的云服务提供商中搜集虚拟机实例作为现行实例,实例具有统一的属性,分别包括虚拟核心、内存和硬盘;
步骤2,统计现行实例在不同价格区间的概率分布,作为新实例的价格参考范围;
步骤3,将现行实例和新实例的数据进行标准化处理,并对现行实例和新实例进行分类,通过计算新实例和现行实例的欧氏距离,选择欧氏距离最小的现行实例作为新实例的相似实例,新实例的所有相似实例构成相似实例集合;
步骤4,采用乘法竞争互动公式计算出相似实例的初始市场份额,并且建立用户转移概率矩阵,然后根据马尔科夫链方法计算出相似实例的短期市场份额和最终市场份额;
步骤5,综合相似实例的价格、概率分布和最终市场份额,计算出新实例的价格;
步骤3中对现行实例和新实例的数据分别采用Z-分数标准化法进行标准化处理,公式如下:
<mrow> <msub> <mi>C</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>=</mo> <mfrac> <mrow> <msub> <mi>s</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>-</mo> <msub> <mover> <mi>s</mi> <mo>&amp;OverBar;</mo> </mover> <mi>j</mi> </msub> </mrow> <msubsup> <mi>s</mi> <mi>j</mi> <mi>&amp;sigma;</mi> </msubsup> </mfrac> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow>
<mrow> <msub> <mi>F</mi> <mi>j</mi> </msub> <mo>=</mo> <mfrac> <mrow> <msub> <mi>f</mi> <mi>j</mi> </msub> <mo>-</mo> <msub> <mover> <mi>s</mi> <mo>&amp;OverBar;</mo> </mover> <mi>j</mi> </msub> </mrow> <msubsup> <mi>s</mi> <mi>j</mi> <mi>&amp;sigma;</mi> </msubsup> </mfrac> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>2</mn> <mo>)</mo> </mrow> </mrow>
其中,Cij表示第i个现行实例的第j个属性的标准化值,sij表示第i个现行实例的第j个属性值,j=1时sij表示现行实例的虚拟核心数量,j=2时sij表示现行实例的内存属性,j=3时sij表示现行实例的硬盘属性,表示现行实例集合中第j个属性的均值,m表示现行实例的数量,表示现行实例集合中第j个属性的标准差,Fj表示新实例的第j个属性的标准化值,fj表示新实例的第j个属性值,j=1时fj表示新实例的虚拟核心数量,j=2时fj表示新实例的内存属性,j=3时fj表示新实例的硬盘属性;
步骤3中,采用K最近邻分类方法对现行实例和新实例进行分类,通过计算新实例和现行实例的欧氏距离,选择欧氏距离最小的前k个实例作为新实例的相似实例,k取值自然数,欧氏距离计算公式如下:
<mrow> <msub> <mi>E</mi> <mi>i</mi> </msub> <mo>=</mo> <msqrt> <mrow> <msubsup> <mi>&amp;Sigma;</mi> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mn>3</mn> </msubsup> <msup> <mrow> <mo>(</mo> <msub> <mi>C</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>-</mo> <msub> <mi>F</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> </mrow> </msqrt> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>3</mn> <mo>)</mo> </mrow> </mrow>
其中,Ei表示第i个现行实例和新实例的欧式距离,E的大小反映了两个实例之间的相似程度,E越小,表示两个实例越相似;Cij表示第i个现行实例的第j个属性的标准化值;Fj表示新实例的第j个属性的标准化值;
步骤3中,对于每个相似实例,计算它们在相似实例集合中的价格概率分布,公式如下:
<mrow> <msub> <mi>q</mi> <mi>i</mi> </msub> <mo>=</mo> <mfrac> <msub> <mi>Q</mi> <mi>i</mi> </msub> <mrow> <msubsup> <mi>&amp;Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>k</mi> </msubsup> <msub> <mi>Q</mi> <mi>i</mi> </msub> </mrow> </mfrac> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>4</mn> <mo>)</mo> </mrow> </mrow>
其中,qi表示第i个相似实例在相似实例集合中的价格概率,Qi表示第i个相似实例在现行市场的价格概率,表示所有相似实例的现行市场价格概率之和,k表示相似实例集合的实例总个数;
步骤4中,使用吸引力模型计算相似实例的初始市场份额,对于每一个相似实例,获取相似实例的吸引力属性,吸引力属性包括价格、CPU速率、内存速率和品牌吸引力,所述乘法竞争互动公式如下:
<mrow> <msubsup> <mi>MS</mi> <mi>i</mi> <mrow> <mo>(</mo> <mn>0</mn> <mo>)</mo> </mrow> </msubsup> <mo>=</mo> <mfrac> <mrow> <msub> <mi>L</mi> <mi>i</mi> </msub> <msubsup> <mi>p</mi> <mi>i</mi> <mi>a</mi> </msubsup> <mo>&amp;part;</mo> <msubsup> <mi>cpu</mi> <mi>i</mi> <mi>b</mi> </msubsup> <mo>&amp;part;</mo> <msubsup> <mi>mem</mi> <mi>i</mi> <mi>c</mi> </msubsup> </mrow> <mrow> <msubsup> <mi>&amp;Sigma;</mi> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>k</mi> </msubsup> <msub> <mi>L</mi> <mi>j</mi> </msub> <msubsup> <mi>p</mi> <mi>j</mi> <mi>a</mi> </msubsup> <mo>&amp;part;</mo> <msubsup> <mi>cpu</mi> <mi>j</mi> <mi>b</mi> </msubsup> <mo>&amp;part;</mo> <msubsup> <mi>mem</mi> <mi>j</mi> <mi>c</mi> </msubsup> </mrow> </mfrac> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>5</mn> <mo>)</mo> </mrow> </mrow>
其中,表示第i个相似实例在t周期时的市场份额,t≥0,表示第i个相似实例的初始市场份额,k表示相似实例集合的实例总个数;表示第i个实例对用户的吸引程度,表示所有实例对用户的总吸引程度,Li表示第i个实例的品牌吸引力,pi表示第i个实例的价格,表示第i个实例的CPU速率,表示第i个实例的内存读写速率,参数a表示价格pi对吸引力的影响系数,参数b表示CPU速率对吸引力的影响系数,参数c表示内存速率对吸引力的影响系数;
步骤4中,根据用户购买实例的历史记录建立用户转移概率矩阵P;
步骤4中,所述根据马尔科夫链方法计算出相似实例的短期市场份额,公式如下:
MS(1)=MS(0)·P (6)
其中,表示短期市场份额矩阵,k表示相似实例集合的实例总个数,表示初始市场份额矩阵;
步骤4中,根据马尔科夫链方法计算出相似实例的最终市场份额,公式如下:
<mrow> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <mi>M</mi> <mi>S</mi> <mo>=</mo> <mi>M</mi> <mi>S</mi> <mo>&amp;CenterDot;</mo> <mi>P</mi> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msubsup> <mi>&amp;Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>k</mi> </msubsup> <msub> <mi>MS</mi> <mi>i</mi> </msub> <mo>=</mo> <mn>1</mn> </mrow> </mtd> </mtr> </mtable> </mfenced> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>7</mn> <mo>)</mo> </mrow> </mrow>
其中,MS=(MS1,MS2,…,MSk)表示最终市场份额矩阵,k表示相似实例集合的实例总个数,MSi表示第i个相似实例的最终市场份额,P表示用户转移概率矩阵;
步骤5中,建立一个计算新实例价格的模型,其中把相似实例的市场份额作为相似实例价格的可信程度,即市场份额越高则价格越可信;并把相似实例价格的概率分布作为相似实例对新实例的价格影响度,即概率分布越高,则影响度越低,最后根据相似实例的价格、价格概率分布和最终市场份额计算出新实例的价格,计算公式如下:
<mrow> <mi>p</mi> <mi>r</mi> <mi>i</mi> <mi>c</mi> <mi>e</mi> <mo>=</mo> <msubsup> <mi>&amp;Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>k</mi> </msubsup> <msub> <mi>MS</mi> <mi>i</mi> </msub> <mo>&amp;CenterDot;</mo> <msub> <mi>v</mi> <mi>i</mi> </msub> <mo>-</mo> <mfrac> <mn>1</mn> <mi>k</mi> </mfrac> <msubsup> <mi>&amp;Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>k</mi> </msubsup> <msub> <mi>q</mi> <mi>i</mi> </msub> <mo>&amp;CenterDot;</mo> <msub> <mi>v</mi> <mi>i</mi> </msub> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>8</mn> <mo>)</mo> </mrow> </mrow>
其中price表示新实例的价格,k表示相似实例集合的实例总个数,MSi表示第i个相似实例的市场份额,vi表示第i个相似实例的价格,qi表示第i个相似实例在相似实例集合中的价格概率。
CN201510198430.3A 2015-04-23 2015-04-23 一种用于云计算资源定价的统计分析方法 Expired - Fee Related CN104750877B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510198430.3A CN104750877B (zh) 2015-04-23 2015-04-23 一种用于云计算资源定价的统计分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510198430.3A CN104750877B (zh) 2015-04-23 2015-04-23 一种用于云计算资源定价的统计分析方法

Publications (2)

Publication Number Publication Date
CN104750877A CN104750877A (zh) 2015-07-01
CN104750877B true CN104750877B (zh) 2017-09-05

Family

ID=53590561

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510198430.3A Expired - Fee Related CN104750877B (zh) 2015-04-23 2015-04-23 一种用于云计算资源定价的统计分析方法

Country Status (1)

Country Link
CN (1) CN104750877B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111652641B (zh) * 2020-05-29 2023-07-25 泰康保险集团股份有限公司 数据处理方法、装置、设备及计算机可读存储介质
CN112950284B (zh) * 2021-03-29 2024-06-18 湖南快乐阳光互动娱乐传媒有限公司 预留实例预估方法、系统、存储介质及电子设备
CN113487196A (zh) * 2021-07-12 2021-10-08 中山大学 一种快速灵活全纯嵌入式经济策略调整方法及装置
CN117971512B (zh) * 2024-04-02 2024-08-02 杭州骋风而来数字科技有限公司 一种算力智能调度系统和方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102185926A (zh) * 2011-05-25 2011-09-14 盛大计算机(上海)有限公司 一种云计算资源管理系统及方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8769083B2 (en) * 2009-08-31 2014-07-01 Red Hat, Inc. Metering software infrastructure in a cloud computing environment
US9188109B2 (en) * 2012-02-16 2015-11-17 Spyros James Lazaris Virtualization, optimization and adaptation of dynamic demand response in a renewable energy-based electricity grid infrastructure

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102185926A (zh) * 2011-05-25 2011-09-14 盛大计算机(上海)有限公司 一种云计算资源管理系统及方法

Also Published As

Publication number Publication date
CN104750877A (zh) 2015-07-01

Similar Documents

Publication Publication Date Title
KR101939554B1 (ko) 일시적 거래 한도 결정
Mohri et al. Learning theory and algorithms for revenue optimization in second price auctions with reserve
Zhang et al. Exploring latent features for memory-based QoS prediction in cloud computing
TWI546751B (zh) Cross - site information display method and system
Shin et al. Strategic management of cloud computing services: Focusing on consumer adoption behavior
CN107851106A (zh) 用于关系数据库即服务的自动需求驱动的资源缩放
CN104750877B (zh) 一种用于云计算资源定价的统计分析方法
CN104951460B (zh) 基于关键词聚类的排名参量值确定方法及装置
CN107615275A (zh) 估计用于运行数据挖掘服务的计算资源
Lu et al. Show me the money: Dynamic recommendations for revenue maximization
CN103914468A (zh) 一种投放信息搜索的方法和装置
CN105590231A (zh) 用户数据处理方法和装置
US11200587B2 (en) Facilitating use of select hyper-local data sets for improved modeling
CN111626767B (zh) 资源数据的发放方法、装置及设备
US11604994B2 (en) Explainable machine learning based on heterogeneous data
Lu et al. Reinforcement learning with sequential information clustering in real-time bidding
US11501239B2 (en) Metric specific machine learning model improvement through metric specific outlier removal
CN111966886A (zh) 对象推荐方法、对象推荐装置、电子设备及存储介质
CN106354867A (zh) 多媒体资源的推荐方法及装置
CN112927050A (zh) 待推荐金融产品确定方法、装置、电子设备及存储介质
CN110866698A (zh) 用于评定服务提供方的服务分值的装置
Chauhan et al. Redundant IAAS cloud selection with consideration of multi criteria decision analysis
US20210073830A1 (en) Computerized competitiveness analysis
US11693579B2 (en) Value-based replication of streaming data
KR102585895B1 (ko) 오픈마켓에서의 키워드 마케팅 효율 증가를 위한 방법 및 시스템

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170905