WO2016045329A1

WO2016045329A1 - 小基站开关的控制方法及装置

Info

Publication number: WO2016045329A1
Application number: PCT/CN2015/074911
Authority: WO
Inventors: 张冬英; 甘小莺; 王绍鹏; 李楠
Original assignee: 中兴通讯股份有限公司
Priority date: 2014-09-25
Filing date: 2015-03-23
Publication date: 2016-03-31
Also published as: CN105517120A

Abstract

本发明提供了一种小基站开关的控制方法及装置，其中所述控制方法包括：对预定时间段内的用户到达速率进行统计；根据统计结果估测当前的用户到达速率，得到预估速率；根据所述预估速率调整所述用户所归属的小基站的开关策略。采用本发明实施例提供的上述技术方案，解决了相关技术中在解决基站休眠的能效时，没有考虑用户到达速率变化的而导致的与实际情况有偏差的问题，既能得到系统的次优解决方案，又满足了用户的动态特性，更加符合实际。

Description

小基站开关的控制方法及装置

技术领域

本发明涉及通信领域，更具体地说，涉及一种小基站开关的控制方法及装置。

背景技术

随着无线通信业务量的不断增加，无线网络对系统通信容量的要求越来越高，传统的单层蜂窝网络已经难以满足日益增长的流量需求。在增加系统容量的方法中，铺设小基站是最有效的方法之一。小基站，又称为小小区(small cell基站)，可以通过减小小区半径来提高频谱利用率。但是铺设小基站无形之中增加了无线系统的能量消耗，所以如何提高无线系统的能量效率成为了该领域研究中的重要问题。

相关技术中，对无线通信网络基站休眠的能效问题进行了深入的研究，经过对现有的技术文献检索发现，Jian Wu，Sheng Zhou，Zhisheng Niu在发表在IEEE TRANSACTIONS ON WIRELESS COMMUNICATIONS上的“Traffic-Aware Base Station Sleeping Control and Power Matching for Energy-Delay Tradeoffs in Green Cellular Networks”将基站休眠问题与排队论相结合，提出了一种基于队列长度门限的开关方案。在该方案中，系统根据用户到达速率确定基站开关队列门限，控制基站开关，如图1所示。图中系统的状态由基站开关状态{0,1}和队列长度{0,1,...N...}来表示，根据用户到达速率λ求解出队列长度的最佳开关门限N。

但其没有考虑用户的动态性，一旦用户到达速率发生变化，需要重新计算门限。并且该方案下考虑用户的到达速率是已知的，即无线通信系统已知用户的变化情况，这也与实际情况不符。

针对相关技术中在解决基站休眠的能效问题时，没有考虑用户到达速率变化的而导致的与实际情况有偏差的问题，目前尚未提出有效的解决方案。

发明内容

本发明提供了一种小基站开关的控制方法及装置，以至少解决上述问题。

根据本发明的一个实施例，提供了一种小基站开关的控制方法，包括：对预定时间段内的用户到达速率进行统计；根据统计结果估测当前的用户到达速率，得到预估速率；根据所述预估速率调整所述用户所归属的小基站的开关策略。

优选地，根据统计结果估测当前的用户到达速率，得到预估速率包括：根据所述统计结果建立马尔可夫模型；根据马尔可夫模型获取所述预估速率。

优选地，根据所述统计结果建立马尔可夫模型，包括：对获取的所述用户到达速率建立第一状态集为{λ₁，λ₂，……，λ_n}，其中所述λ₁，λ₂，……，λ_n的取值分别表示所述用户在不同时刻用户到达速率的取值。

优选地，根据所述预估速率调整所述用户所归属的小基站的开关策略之前，包括：根据所述第一状态集确定所述用户到达速率的取值范围[λ_min，λ_max]，其中，所述λ_min为所述第一状态集中的最小值，所述λ_max为所述第一状态集的最大值；根据预设量化精度对所述取值范围量化为第二状态集{s₀，s₁，s₂……s_m}，其中，s₀＜s₁＜s₂＜……＜s_m，且，s₀＜λ_min＜λ_max＜s_m，所述m的取值由所述量化精度确定。

优选地，根据统计结果估测当前的用户到达速率，得到预估速率，包括：获取当前时刻到之前T_s时刻的所述小基站的当前用户数量

根据以下公式确定所述当前用户到达速率

其中，所述s_K取值自所述第二状态集，K＝0,1，……m。

优选地，根据所述预估速率调整所述用户所归属的小基站的开关策略，包括：根据预先确定的期望函数Q以及所述用户到达速率

确定a的取值，其中，所述a为当前时隙下开启的小基站的数量，a取值范围为[0,n]，其中，n为当前小基站的数量；根据以下公式依次计算出a取值为0,1,2,……n时，所述a对应的取值所被选择的概率

并根据所述

按照以下公式计算当前小基站的开启数量a_t：

优选地，在到达当前时隙t结束时间时，根据以下公式对所述期望函数Q进行更新：

其中，

表示所述当前时隙t下的期望函数值；s'为下一时隙t+1所对应的用户到达速率，

表示所述下一时隙t+1下的期望函数值，η表征算法的收敛速度，取值范围为0～1；γ为折扣因子，取值范围为0～1；R_t为所述当前时隙的系统收益。

优选地，所述小基站为多个，并且所述多个小基站与一个宏基站组成异构无线网络。

根据本发明的另一个实施例，还提供了一种小基站开关的控制装置，包括：统计模块，设置为对预定时间段内的用户到达速率进行统计；确定模块，设置为根据统计结果估测当前的用户到达速率，得到预估速率；调整模块，设置为根据所述预估速率调整所述用户所归属的小基站的开关策略。

优选地，所述确定模块包括：建立单元，设置为根据所述统计结果建立马尔可夫模型；获取单元，设置为根据马尔可夫模型获取所述预估速率。

通过本发明，采用根据用户在预定时间段内的用户速率进行统计，并根据统计结果能够估测到当前的用户到达速率进而能够调整小基站的开关策略的技术方案，解决了相关技术中在解决基站休眠的能效问题时，没有考虑用户到达速率变化的而导致的与实际情况有偏差的问题，既能得到系统的次优解决方案，又满足了用户的动态特性，更加符合实际。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1现有技术中基站开关的说明示意图；

图2为根据本发明实施例的小基站开关的控制方法的流程图；

图3为根据本发明实施例的组网示意图；

图4为根据本发明优选实施例的系统状态估测的流程图；

图5为根据本发明优选实施例的小基站开关的又一流程图

图6为根据本发明实施例的小基站开关的控制装置的结构框图；

图7为根据本发明实施例的小基站开关的控制装置的另一结构框图；

图8为根据本发明优选实施例的小基站开关的流程图；

图9为根据本发明优选实施例的马尔可夫泊松过程的模型示意图；

图10为根据本发明实施例的动态休眠算法与固定休眠策略的累计收益比较示意图；

图11为根据本发明实施例的算法的收敛过程示意图。

具体实施方式

下文中将参考附图并结合实施例来详细说明本发明。需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。

本发明的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分的实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。

为了解决上述技术问题，本发明实施例提供了一种小基站开关的控制方法，图2为根据本发明实施例的小基站开关的控制方法的流程图，如图2所示，该方法包括如下步骤：

步骤S202：对预定时间段内的用户到达速率进行统计；

步骤S204：根据统计结果估测当前的用户到达速率，得到预估速率；

步骤S206：根据上述预估速率调整上述用户所归属的小基站的开关策略。

通过上述各个步骤，采用根据用户在预定时间段内的用户速率进行统计，并根据统计结果能够估测到当前的用户到达速率进而能够调整小基站的开关策略的技术方案，解决了相关技术中在解决基站休眠的能效问题时，没有考虑用户到达速率变化的而导致的与实际情况有偏差的问题，既能得到系统的次优解决方案，又满足了用户的动态特性，更加符合实际。

步骤S204的实现方式有多种，在一个优选实施方式中可以采用以下方式实现，但不限于此：根据上述统计结果建立马尔可夫模型；根据马尔可夫模型获取上述预估速率。

在本发明实施例的一个可选实施例中，可以以下方式建立马尔可夫模型：对获取的上述用户到达速率建立第一状态集为{λ₁，λ₂，……，λ_n}，其中上述λ₁，λ₂，……，λ_n的取值分别表示上述用户的不同时刻用户到达速率的取值。

可选地，在步骤S206之前，即在根据上述预估速率调整上述用户所归属的小基站的开关策略之前，还可以执行以下处理过程：根据上述第一状态集确定上述用户到达速率的取值范围[λ_min，λ_max]，其中，上述λ_min为上述第一状态集中的最小值，上述λ_max为上述第二状态集的最大值；根据预设量化精度对上述取值范围量化为{s₀，s₁，s₂……s_m}，其中，s₀＜s₁＜s₂＜……＜s_m，且，s₀＜λ_min＜λ_max＜s_m，上述m的取值由上述量化精度确定。

在本发明实施例中，步骤S204还可通过以下过程实现，但不限于此：获取当前时刻到之前T_s时刻的上述小基站的当前用户数量

根据以下公式确定上述当前用户到达速率

其中，上述s_K取值自上述第二状态集，K＝0,1，……m。

在确定了当前用户到达速率

之后，根据上述预估速率调整上述用户所归属的小基站的开关策略，具体地：根据预先确定的期望函数Q以及上述用户到达速率

确定a的取值，其中，上述a为当前时隙下开启的小基站的数量，a取值范围为[0,n]，其中，n为当前小基站的数量；根据以下公式依次计算出a取值为0,1,2,……n时，上述a对应的取值所被选择的概率

并根据上述

按照以下公式计算当前小基站的开启数量a_t：

可选地，在到达当前时隙结束时间时，根据以下公式对上述期望函数Q进行更新：

其中，

需要说明的是，上述小基站为多个，并且上述多个小基站与一个宏基站组成异构无线网络，上述用户到达速率可以指的是数据包达到小基站的速率，简称为包到达速率，也可称为用户包到达速率。

综上所述，实际上本发明实施例针对上述现有技术不足，提出了一种基于强化学习的多基站休眠方案，该方案将用户动态性通过马尔可夫过程建模，同时通过统计方式估测当前用户到达速率，根据到达速率调整基站开关策略。

为了更好的理解上述小基站开关的控制过程，以下结合一个优选实施例进行说明，但不用于限定本发明实施例。

第一步，n个小基站和一个宏基站共同组成异构无线网络，如图3所示。用户以发送数据包的方式接受网络服务，规定无线网络服务协议。

本方案中用户以发送数据包的方式进行无线通信，宏基站覆盖范围内的用户可以接收到处于工作状态的小基站和宏基站的无线信号，处于休眠状态的小基站无法为用户提供服务。所有数据包的到达过程用泊松过程建模，其包到达率为λ。用户的动态性通过包到达率的变化表现，包到达率的变化可以用一个马尔可夫过程表示，该马尔可夫过程的状态集为{λ₁,λ₂,…λ_L}，其中的L个状态表示包到达率的L种取值。数据包的收发按照队列方式先到先服务，未服务的数据包排列在队列中。宏基站发送数据包的速率为μ_M，单个小基站发送数据包的速率为μ_S。单个宏基站和小基站发送数据包的速率是恒定不变的，系统动态开关基站调整发送速率，该过程可见图4。在每个时隙内，系统发送数据包的个数为N_s,p，时隙的长度为t_s，则有0≤N_s,p<t_slot(μ_M+nμ_S)。

在本发明实施例中，整个开关策略由宏基站的控制中心进行调度。宏基站一直处于工作状态，小基站则通过强化学习的方式进行动态的开关。开关策略以时隙的方式实现，时隙长度为t_s。在每个时隙开始时，小基站根据方案动态选择是否休眠。每个时隙内，宏基站的消耗的功率可以表示如下

P_M＝P_M,0+μ_MP_M,t；式一

其中P_M表示宏基站消耗的功率，P_M,0表示宏基站恒定开启功率，P_M,t表示宏基站每发送单位数据包消耗的功率，μ_M表示宏基站收发数据包的速率。

同样的，每个时隙内，小基站消耗的功率可以表示如下：

P_S＝P_S,0+μ_SP_S,t；式二

其中P_S表示小基站消耗的功率，P_S,0表示小基站恒定开启功率，P_S,t表示小基站每发送单位数据包消耗的功率，μ_S表示小基站收发数据包的速率。

每次开启关闭小基站一次会产生的损耗为β，将这些损耗做均分，所以小基站进行开启或关闭的损耗为β/2。

第二步，系统通过统计一定时间T_s内到达用户数，估计系统的当前状态。

系统需要估计的状态实际是用户的到达速率。系统首先需要知道用户包到达率的范围[λ_min,λ_max]，对其重新量化，根据量化精度要求确定状态集S＝{s₀,s₁,s₂,…s_m}(相当于上述实施例中的第二状态集{s₀，s₁，s₂……s_m})，其中s₀<s₁<s₂<…<s_m且s₀<λ_min<λ_max<s_m。然后统计从当前时间到之前T_s时刻系统到达的用户数

则估测的状态值可由下式得到：

0≤k≤m；式三

为了减少信令开销，如图5所示，还提供了一种小基站开关的又一流程图，其设计的具体的实现方式如下：

步骤S502，宏基站的控制中心确定状态集，并将状态集通知所有小基站；

步骤S504，在每个学习时隙开始时，每个小基站统计自己的系统到达用户数

由式三得出该小区的状态

步骤S506，将小区的状态

与之前的统计结果进行比较，如果不相同，则转步骤S508，如果相同，则转步骤S504，即不进行信令通信；

步骤S508，将新的统计结果通过信令报知给宏基站的控制中心；

步骤S510，在接收小基站告知的信息后，控制中心更新该基站数据，并综合所有信息给出系统当前状态，更新方式为：

0≤k≤m；式四

其中，θ＝1.5时

表示宏基站统计的状态值，1≤i≤n时

表示第i个小基站统计的状态值；

在控制中心通知各基站状态集S后，还可执行以下过程：

步骤S512，统计小基站未更新时间；

步骤S514，判断是否有小基站长时间未响应，如果是，则转到步骤S516，如果否，则转到步骤S512；

步骤S516，如果小基站长时间不进行汇报，则每过T_p个时隙，控制中心强制该小基站上报信息，避免信令通道阻塞导致信息不准确。

第三步，在每个时隙开始时，根据强化学习地方法，由系统收益得出Q值，根据Q值系统动态选择小基站开关策略，最后得出开启基站的数量。

首先，需要确定Q值。强化学习中，学习者需要为每一个状态和行为的组合设定一个Q值，表示获得收益的期望函数，为Q(s,a)，其中s表示系统状态，a表示系统行为。系统状态s由第二步估测得到，系统的行为a是指在该时隙中，小基站的开启数量，所以a的取值范围为

设定所有的Q值初始均为0。

在第t个时隙开始时，根据系统的状态

选择小基站的开启数量a。选择小基站开启数量a具体由如下方法确定：

小基站的开启数量的选择采取混合策略的方式，对于每一个

给出选择它的概率为：

式五

然后通过系统生成随机数，按照上面得到的概率选出该时隙下小基站的开启数量a_t为

式六

每个时隙根据得到的a_t随机地选择要开启和关闭的小基站。在每个时隙结束时，对Q值进行更新。此时再次根据第二步估测系统的状态为s'，更新方法如下：

式七

其中

表示更新后的对应于状态

和行为a_t的Q值，Q^t(s,a_t)表示更新前的对应于状态

和行为a_t的值；η为学习因子，主要决定算法的收敛速度，取值范围为0～1；γ为折扣因子，取值范围为0～1；R_t为该时隙的系统收益，具体形式如下：

式八

其中,N_s,p表示该时隙中系统收发数据包的数量，r_p表示系统服务单个用户得到的收益，E_c表示基站能量损耗，该值可由式一和式二得到，E_c＝(P_M+a_tP_S)t_slot；l_t表示队列长度，ω表示系统队列延迟对系统性能的影响因子，ω越大表示系统对延迟越敏感，用户对服务质量的要求越高。为了抑制基站频繁开关造成过大损耗，式中最后减去开关小基站带来的损耗，a_t和a_t-1分别表示该时隙和上一时隙开启小基站的数量。

第四步，重复第二步和第三步的步骤，最终系统会收敛到稳定状态，此时开关基站的策略基本保持不变。

本发明上述优选实施例提供的上述技术方案，将用户根据马尔可夫泊松过程对用户进行建模，通过运用强化学习的算法，提出了一种宏基站小基站协作传输休眠方案。在用户流量未知的情况下，能有效的满足用户需求，并减小能量损耗。本发明通过考虑开关损耗，有效抑制基站频繁开关，并得到次优解决方案。算法复杂度简单。

在本实施例中还提供了一种小基站开关的控制装置，用于实现上述实施例及优选实施方式，已经进行过说明的不再赘述，下面对该装置中涉及到的模块进行说明。如以下所使用的，术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现，但是硬件，或者软件和硬件的组合的实现也是可能并被构想的。图6为根据本发明实施例的小基站开关的控制装置的结构框图。如图6所示，该装置包括：

统计模块60，设置为对预定时间段内的用户到达速率进行统计；

确定模块62，与统计模块60连接，设置为根据统计结果估测当前的用户到达速率，得到预估速率；

调整模块64，与确定模块62连接，设置为根据上述预估速率调整上述用户所归属的小基站的开关策略。

通过上述各个模块的综合作用，采用根据用户在预定时间段内的用户速率进行统计，并根据统计结果能够估测到当前的用户到达速率进而能够调整小基站的开关策略的技术方案，解决了相关技术中在解决基站休眠的能效时，没有考虑用户到达速率变化的而导致的与实际情况有偏差的问题，既能得到系统的次优解决方案，又满足了用户的动态特性，更加符合实际。

可选地，如图7所示，确定模块62包括：建立单元620，设置为根据上述统计结果建立马尔可夫模型；获取单元622，与建立单元620连接，设置为根据马尔可夫模型获取上述预估速率。

为了更好的理解上述小基站开关的控制方法及装置的工作流程，以下再结合一个优选实施例进行说明：但本发明的保护范围不限于下述的实施例。

宏基站恒定开启功率P_M,0为30W，表示宏基站每发送单位数据包消耗的功率P_M,t为10W，表示宏基站收发数据包的速率μ_M为0.5。小基站恒定开启功率P_S,0为7.5W，表示小基站每发送单位数据包消耗的功率P_S,t为2.5W，小基站收发数据包的速率μ_S为 2。学习因子η取值按时隙t变化，

θ＝1.5。折扣因子γ为0.9，开关损耗β设为50J。单个时隙长度t_s为30s。

图8为根据本发明优选实施例的小基站开关的流程图，如图8所示：

步骤S802，2个小基站和一个宏基站共同组成异构无线网络。用户以发送数据包的方式接受网络服务，规定无线网络服务协议。

本发明优选实施例中用户以发送数据包的方式进行无线通信，宏基站覆盖范围内的用户可以接收到处于工作状态的小基站和宏基站的无线信号，处于休眠状态的小基站无法为用户提供服务。所有被数据包的到达过程用泊松过程建模，其包到达率为λ。用户的动态性通过包到达率的变化表现，包到达率的变化可以用一个马尔可夫过程表示，该马尔可夫过程的状态集为{λ₁,λ₂,λ₃}，其中的3个状态表示包到达率的3种取值。

步骤S804，系统通过统计一定时间T_s内到达用户数，估计系统的当前状态。

系统需要估计的状态实际是用户的到达速率。系统首先需要知道用户包到达率的范围[0,4]，确定状态集{s₀,s₁,s₂,…s₄}，其中s₀<s₁<s₂<…<s₄并取0到4的整数。具体操作方法可由上述小基站开关的控制过程优选实施例中的第二步得到。

步骤S806，每个时隙开始时，根据强化学习地方法，由系统收益得出Q值，根据Q值系统动态选择小基站开关策略，最后得出开启基站的数量。

首先，需要确定Q值。强化学习中，学习者需要为每一个状态和行为的组合设定一个Q值，表示为Q(s,a)，其中s表示系统状态，a表示系统行为。系统状态又第二步估测得到，系统的行为是指在该时隙中，小基站的开启数量，所以a的取值范围为

设定所有的Q值初始均为0。

在第t个时隙开始时，根据系统的状态s选择小基站的开启数量a。选择小基站开启数量a由式六决定。

步骤S808，更新系统状态S，并在每个时隙结束时，根据式七对Q值进行更新。

在实际应用中，在执行步骤S808之后可重复S804和S806的步骤，最终系统会收敛到稳定状态，此时开关基站的策略基本保持不变。

图9为根据本发明优选实施例的马尔可夫泊松过程的模型示意图，纵坐标表示的是数据包到达速率随时间的变化，在1,2,3之间不断转移。图10为根据本发明实施例的动态休眠算法与固定休眠策略的累计收益比较示意图，在固定休眠策略中，开启固定开启半数的小基站。比较看出，本申请提出的动态休眠方案得到的系统收益更大。图11为根据本发明实施例的算法的收敛过程示意图，图中看出取不同的θ值，算法均在50个时隙后收敛。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的对象在适当情况下可以互换，以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

综上所述，本发明实施例实现了以下有益效果：解决了相关技术中在解决基站休眠的能效时，没有考虑用户到达速率变化的而导致的与实际情况有偏差的问题，既能得到系统的次优解决方案，又满足了用户的动态特性，更加符合实际。

显然，本领域的技术人员应该明白，上述的本发明的各模块或各步骤可以用通用的计算装置来实现，它们可以集中在单个的计算装置上，或者分布在多个计算装置所组成的网络上，可选地，它们可以用计算装置可执行的程序代码来实现，从而，可以将它们存储在存储装置中由计算装置来执行，并且在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样，本发明不限制于任何特定的硬件和软件结合。

以上仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

工业实用性

基于本发明实施例提供的上述技术方案，采用根据用户在预定时间段内的用户速率进行统计，并根据统计结果能够估测到当前的用户到达速率进而能够调整小基站的开关策略的技术方案，解决了相关技术中在解决基站休眠的能效时，没有考虑用户到达速率变化的而导致的与实际情况有偏差的问题，既能得到系统的次优解决方案，又满足了用户的动态特性，更加符合实际。

Claims

一种小基站开关的控制方法，包括：

对预定时间段内的用户到达速率进行统计；

根据统计结果估测当前的用户到达速率，得到预估速率；

根据所述预估速率调整所述用户所归属的小基站的开关策略。
根据权利要求1所述的方法，其中，根据统计结果估测当前的用户到达速率，得到预估速率包括：

根据所述统计结果建立马尔可夫模型；

根据马尔可夫模型获取所述预估速率。
根据权利要求2所述的方法，其中，根据所述统计结果建立马尔可夫模型，包括：

对获取的所述用户到达速率建立第一状态集为{λ₁，λ₂，……，λ_n}，其中所述λ₁，λ₂，……，λ_n的取值分别表示所述用户在不同时刻用户到达速率的取值。
根据权利要求2所述的方法，其中，根据所述预估速率调整所述用户所归属的小基站的开关策略之前，包括：

根据所述第一状态集确定所述用户到达速率的取值范围[λ_min，λ_max]，其中，所述λ_min为所述第一状态集中的最小值，所述λ_max为所述第一状态集的最大值；

根据预设量化精度对所述取值范围量化为第二状态集{s₀，s₁，s₂……s_m}，其中，s₀＜s₁＜s₂＜……＜s_m，且，s₀＜λ_min＜λ_max＜s_m，所述m的取值由所述量化精度确定。
根据权利要求4所述的方法，其中，根据统计结果估测当前的用户到达速率，得到预估速率，包括：

获取当前时刻到之前T_s时刻的所述小基站的当前用户数量
根据以下公式确定所述当前用户到达速率

其中，所述s_K取值自所述第二状态集，K＝0,1，……m。
根据权利要求5所述的方法，其中，根据所述预估速率调整所述用户所归属的小基站的开关策略，包括：

根据预先确定的期望函数Q以及所述用户到达速率
确定a的取值，其中，所述a为当前时隙下开启的小基站的数量，a取值范围为[0,n]，其中，n为当前小基站的数量；

根据以下公式依次计算出a取值为0,1,2,……n时，所述a对应的取值所被选择的概率

并根据所述
按照以下公式计算当前小基站的开启数量a_t：
根据权利要求6所述的方法，其中，

在到达当前时隙t结束时间时，根据以下公式对所述期望函数Q进行更新：

其中，
表示所述当前时隙t下的期望函数值；s'为下一时隙t+1所对应的用户到达速率，
表示所述下一时隙t+1下的期望函数值，η表征算法的收敛速度，取值范围为0～1；γ为折扣因子，取值范围为0～1；R_t为所述当前时隙的系统收益。
根据权利要求1-7任一项所述的方法，其中，所述小基站为多个，并且所述多个小基站与一个宏基站组成异构无线网络。
一种小基站开关的控制装置，包括：

统计模块，设置为对预定时间段内的用户到达速率进行统计；

确定模块，设置为根据统计结果估测当前的用户到达速率，得到预估速率；

调整模块，设置为根据所述预估速率调整所述用户所归属的小基站的开关策略。
根据权利要求9所述的装置，其中，所述确定模块包括：

建立单元，设置为根据所述统计结果建立马尔可夫模型；

获取单元，设置为根据马尔可夫模型获取所述预估速率。