CN112243247A - 基站优化优先级确定方法、装置及计算设备 - Google Patents
基站优化优先级确定方法、装置及计算设备 Download PDFInfo
- Publication number
- CN112243247A CN112243247A CN201910644886.6A CN201910644886A CN112243247A CN 112243247 A CN112243247 A CN 112243247A CN 201910644886 A CN201910644886 A CN 201910644886A CN 112243247 A CN112243247 A CN 112243247A
- Authority
- CN
- China
- Prior art keywords
- base station
- sample data
- index
- support vector
- vector machine
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W24/00—Supervisory, monitoring or testing arrangements
- H04W24/02—Arrangements for optimising operational condition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
本发明实施例涉及通信技术领域,公开了一种基站优化优先级确定方法、装置及计算设备。该方法包括:获取若干基站指标特征样本数据;查找是否存在预设支持向量机模型;若不存在所述预设支持向量机模型,则计算各所述基站指标特征样本数据的信息增益;根据各所述基站指标特征样本数据的信息增益,确定各所述基站指标的重要程度;根据各所述基站指标的重要程度,选取预设数量的所述基站指标;根据选取的所述基站指标对应的基站指标特征样本数据,构建所述预设支持向量机模型。通过上述方式,本发明实施例能够确定基站容量优化优先级,并且,比人工确定参数更具有科学性和实用性,提高了精度。
Description
技术领域
本发明实施例涉及通信技术领域,具体涉及一种基站优化优先级确定方法、装置及计算设备。
背景技术
随着LTE网络的发展和4G用户的快速逐渐增长,热点区域小区负荷也逐渐升高,用户的不均匀分布导致部分小区出现高负荷情况,为了保持较高的通信指令,对基站容量进行优化十分重要。
在对基站容量进行优化之前,首先要确定基站容量优化的优先级,从而为基站容量优化提供有效参考。目前,在优先级的确定方法中,用于进行评估各项权重和分值往往是由人工凭经验确定的,精度较低。
发明内容
鉴于上述问题,本发明实施例提供了一种基站优化优先级确定方法、装置及计算设备,克服了上述问题或者至少部分地解决了上述问题。
根据本发明实施例的一个方面,提供了一种基站优化优先级确定方法,所述方法包括:获取若干基站指标特征样本数据;
查找是否存在预设支持向量机模型;
若不存在所述预设支持向量机模型,则计算各所述基站指标特征样本数据的信息增益;
根据各所述基站指标特征样本数据的信息增益,确定各所述基站指标的重要程度;
根据各所述基站指标的重要程度,选取预设数量的所述基站指标;
根据选取的所述基站指标对应的基站指标特征样本数据,构建所述预设支持向量机模型。
在一种可选的方式中,所述计算各所述基站指标特征样本数据的信息增益,进一步包括:
计算全部所述基站指标特征样本数据的经验熵;
计算各个所述基站指标特征样本数据对全部所述基站指标特征样本数据的经验条件熵;
将所述经验熵减去经验条件熵,得到各所述基站指标特征样本数据的信息增益。
在一种可选的方式中,,所述构建所述预设支持向量机模型,进一步包括:
构建基于有向无环图的一对一多分类支持向量机模型,其中,所述预设支持向量机模型由K(K-1)/2个标准支持向量机组成,K为对所述若干基站指标特征样本数据进行分类的类别数。
在一种可选的方式中,所述方法还包括:
若存在所述预设支持向量机模型,则根据所述预设支持向量机模型,对所述基站指标特征样本数据进行分类。
在一种可选的方式中,所述方法还包括:
重新获取若干基站指标特征样本数据;
根据重新获取的所述基站指标特征样本数据,更新所述预设支持向量机模型。
在一种可选的方式中,所述基站指标特征样本数据包括:用户数量、各类套餐用户占比、用户平均停留时间、基站流量以及基站区域属性特征样本数据。
在一种可选的方式中,所述方法还包括:
获取基站指标总数据,所述基站指标总数据包括用户数量;
所述获取若干基站指标特征样本数据,进一步包括:
根据以下公式计算各所述基站指标特征样本数据:
所述各类套餐用户占比为
所述用户平均停留时间为
所述基站流量为
f=log(F)
所述基站区域属性为
L={a,b,cΛ}
其中,u为用户数量,n为套餐数目,r1、r2、r3···rn分别为各类套餐的用户数量,m为统计天数,S1、S2、S3···Sm分别为某天某用户占用的总时长,F为天粒度的基站流量,a、b、c···分别为各个区域的数值,若基站属于该区域,则该区域的数值为1,否则,该区域的数值为0。
根据本发明实施例的另一方面,提供了一种基站优化优先级确定装置,所述装置包括:
特征获取模块,用于获取若干基站指标特征样本数据;
模型查找模块,用于查找是否存在预设支持向量机模型;
信息增益计算模块,用于若不存在所述预设支持向量机模型,则计算各所述基站指标特征样本数据的信息增益;
基站指标排序模块,用于根据各所述基站指标特征样本数据的信息增益,确定各所述基站指标的重要程度;
基站指标选取模块,用于根据各所述基站指标的重要程度,选取预设数量的所述基站指标;
模型构建模块,用于根据选取的所述基站指标对应的基站指标特征样本数据,构建所述预设支持向量机模型。
根据本发明实施例的又一方面,提供了一种计算设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如上所述的基站优化优先级确定方法的操作。
根据本发明实施例的另一方面,提供了一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如上所述的基站优化优先级确定方法。
本发明实施例通过获取若干基站指标特征样本数据,查找是否存在预设支持向量机模型,若不存在预设支持向量机模型,则计算各基站指标特征样本数据的信息增益,并根据各基站指标特征样本数据的信息增益,确定各基站指标的重要程度,根据各基站指标的重要程度,选取预设数量的基站指标,根据选取的基站指标对应的基站指标特征样本数据,构建预设支持向量机模型,能够通过计算确定各基站指标的重要程度,并选取最重要的基站指标,并采用支持向量机算法进行基站优化优先级判别,找到判别函数的最优解,以构建支持向量机模型,从而能够确定基站容量优化优先级,并且,比人工确定参数更具有科学性和实用性,提高了精度,并且适合输入高维度样本,能够有效地运行在大数据集上。
上述说明仅是本发明实施例技术方案的概述,为了能够更清楚了解本发明实施例的技术手段,而可依照说明书的内容予以实施,并且为了让本发明实施例的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本发明实施例提供的基站优化优先级确定方法的流程图;
图2示出了步骤130的流程图;
图3示出了本发明实施例提供的预设支持向量机模型的体系结构示意图;
图4示出了本发明实施例提供的基站优化优先级确定装置的结构示意图;
图5示出了本发明实施例提供的计算设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
图1示出了本发明实施例提供的基站优化优先级确定方法的流程图。该方法应用于计算设备中,例如通信网络中的服务器。如图1所示,该方法包括以下步骤:
步骤110、获取若干基站指标特征样本数据。
其中,基站指标特征样本数据是指在与基站容量优化优先级中需要考虑的指标相关的特征的样本数据。在本实施例中,基站指标特征样本数据包括:用户数量、各类套餐用户占比、用户平均停留时间、基站流量以及基站区域属性等这几个指标的特征样本数据。当然,在一些其他实施例中,基站指标还可以包括其他,可以根据实际使用情况进行确定。
其中,在步骤110之前,该方法还包括:获取基站指标总数据,所述基站指标总数据包括用户数量。基站指标总数据为与该基站指标相关的所有数据,根据基站指标总数据,能够计算得到各基站指标特征样本数据。
其中,步骤110进一步包括:
根据以下公式计算各基站指标特征样本数据:
各类套餐用户占比为
用户平均停留时间为
基站流量为
f=log(F)
基站区域属性为
L={a,b,cΛ}
其中,u为用户数量,n为套餐数目,r1、r2、r3···rn分别为各类套餐的用户数量,m为统计天数,S1、S2、S3···Sm分别为某天某用户占用的总时长,F为天粒度的基站流量,a、b、c···分别为各个区域的数值,若基站属于该区域,则该区域的数值为1,否则,该区域的数值为0。例如,基站区域分为写字楼、医院、居民区、交通要道四个区域,a、b、c、d分别为写字楼、医院、居民区、交通要道的数值,当基站属于写字楼时,则基站区域属性L={1000},当基站同时数据写字楼和居民区时,则基站区域属性L={1010}。
可选地,获取若干基站指标特征样本数据,还可以包括:对样本数据进预处理,以去除样本数据中的不良数据,并对去除不良数据后的样本数据进行归一化、标准化处理。
步骤120、查找是否存在预设支持向量机模型。
在获取到基站指标特征样本数据后,查找是否存在预设支持向量机模型,若存在,则直接使用该预设支持向量机模型对该基站指标特征样本数据进行分类,若不存在,则执行步骤130。
在一些实施例中,该方法还包括:若存在预设支持向量机模型,则根据预设支持向量机模型,对特征样本数据进行分类。
步骤130、若不存在预设支持向量机模型,则计算各基站指标特征样本数据的信息增益。
其中,在信息增益中,衡量标准是看特征能够为分类系统带来多少信息,带来的信息越多,则该特征越重要。对一个特征而言,系统有它和没它时信息量将发生变化,而前后信息量的差值就是这个特征给系统带来的信息量。
在步骤130中,如图2所示,步骤130进一步包括:
步骤131、计算全部基站指标特征样本数据的经验熵;
步骤132、计算各个基站指标特征样本数据对全部基站指标特征样本数据的经验条件熵;
步骤133、将经验熵减去经验条件熵,得到各基站指标特征样本数据的信息增益。
在步骤131中,根据以下公式计算基站指标特征样本数据的经验熵:
其中,D为训练数据集总个数,Ck为某个分类的个数,Ck之和等于D,k为大于0的整数。
在步骤132中,根据以下公式计算基站指标特征样本数据的经验条件熵:
其中,Di为选定特征的某个分类的样本个数,则为Di/D在选定某特征某个分类的概率,即训练集为Di,交集Dik为在Di条件下某个分类k的样本个数。
在步骤133中,根据以下公式计算基站指标特征样本数据的信息增益:
g(D,A)=H(D)-H(D|A)
步骤140、根据各基站指标特征样本数据的信息增益,确定各基站指标的重要程度。
其中,由于与基站容量优化优先级相关的指标有很多,凭借人工进行确定相关指标并不可靠,则需要通过计算先确定几个重要的相关基站指标,重要性强的给予优先关注。在本实施例中,信息增益越大,基站指标的选择性越好,即与基站容量优化优先级越相关。因此,在步骤140中,根据各基站指标特征样本数据的信息增益,确定各基站指标的重要程度,具体实施方式为:对各基站指标特征样本数据的信息增益进行排序,信息增益大的则重要程度高。例如,假设计算得到用户数量、各类套餐用户占比、用户平均停留时间、基站流量以及基站区域属性的信息增益分别为A1、A2、A3、A4、A5,并且有A1>A2>A3>A4>A5,则基站指标特征样本数据的重要程度排序为用户数量>各类套餐用户占比>用户平均停留时间>基站流量>基站区域属性。
步骤150、根据各基站指标的重要程度,选取预设数量的基站指标。
其中,预设数量为预先设定的基站指标数量。根据各基站指标的重要程度,选取预设数量的基站指标,具体实施方式为:选取重要程度最高的预设数据的基站指标。例如,假设预设数量为4个,则确定基站指标为4个,则选取重要程度最高的4个基站指标。又例如,假设预设数量为4个,基站指标特征样本数据的重要程度排序为用户数量>各类套餐用户占比>用户平均停留时间>基站流量>基站区域属性,则选取用户数量、各类套餐用户占比、用户平均停留时间、基站流量这4个基站指标。
步骤160、根据选取的基站指标对应的基站指标特征样本数据,构建预设支持向量机模型。
本步骤中,构建预设支持向量机模型,进一步包括:构建基于有向无环图的一对一多分类支持向量机模型,其中,预设支持向量机模型由K(K-1)/2个标准支持向量机组成,K为对若干基站指标特征样本数据进行分类的类别数。
其中,对若干基站指标特征样本数据进行分类的类别数即基站优化优先级的类别数,例如,类别数为4,则预设支持向量机模型由6个标准支持向量机组成,且可以分为4类不同优先级。其中,标准支持向量机为二分类支持向量机。在本实施例中,二分类支持向量机才采用的分类决策函数为:
其中,X为基站指标特征样本数据,f(X)为该基站指标特征样本数据是否为某个类别的可能性。当输入一个基站指标特征样本数据后,得到一个f(X),若f(X)为正值,则系统输出1,即属于该分类,否则,系统输出0,即不属于该分类。在构造i和j的支持向量机模型时,可以将类别i的训练样本置为1,j的训练样本置为-1来进行训练。
其中,如图3所示,该预设支持向量机模型为由6个标准支持向量机组成的有向无环图,其可以实现对4类基站指标进行分类。其中,用标号1表示用户数量,标号2表示各类套餐用户占比,标号3表示用户平均停留时间,标号4表示基站流量。若要对某个基站指标进行分类,则需要经过整个有向无环图到达叶子节点才能最终判断它的类别,中间节点只能给出该基站指标不属于哪个类别的判断,而不能给出它属于哪个类别的判断。例如,假设用户数量u的实际类别为1类,则其判别方法为:首先由SVM(1,2,3,4)进行判断,结果为+1,表示用户数量u不是类别4,可能是类别1、2、3;然后由SVM(1,2,3)判断,表示用户数量u不是类别3,可能是类别1、2;再由SVM(1,2)判断,表示用户数量u不是类别2,则用户数量u的类别为1类。通过采用基于有向无环图的一对一多分类支持向量机模型对基站指标特征样本数据进行分类,在通信大数据场景下,当基站承载用户量过大时,能够大大降低计算量,并且精度不受影响,从而对每个基站容量进行评估并输出基站优化优先级。
其中,若类别数越小的类别的优化优先级越高,则对优化优先级越高的基站首先进行基站容量优化。例如,假设用户数量、各类套餐用户占比、用户平均停留时间、基站流量的优先级分别为1、2、3、4,则首先对基站容量的优化顺序为用户数量>各类套餐用户占比>用户平均停留时间>基站流量。
在一些实施例中,预设支持向量机模型可以根据实际应用场景进行更新。该方法还包括:重新获取若干基站指标特征样本数据;根据重新获取的基站指标特征样本数据,更新预设支持向量机模型。
本发明实施例通过获取若干基站指标特征样本数据,查找是否存在预设支持向量机模型,若不存在预设支持向量机模型,则计算各基站指标特征样本数据的信息增益,并根据各基站指标特征样本数据的信息增益,确定各基站指标的重要程度,根据各基站指标的重要程度,选取预设数量的基站指标,根据选取的基站指标对应的基站指标特征样本数据,构建预设支持向量机模型,能够通过计算确定各基站指标的重要程度,并选取最重要的基站指标,并采用支持向量机算法进行基站优化优先级判别,找到判别函数的最优解,以构建支持向量机模型,从而能够确定基站容量优化优先级,并且,比人工确定参数更具有科学性和实用性,提高了精度,并且适合输入高维度样本,能够有效地运行在大数据集上。
图4示出了本发明实施例提供的基站优化优先级确定装置的结构示意图。如图4所示,该装置200包括:特征获取模块210、模型查找模块220、信息增益计算模块230、基站指标排序模块240、基站指标选取模块250和模型构建模块260。
特征获取模块210用于获取若干基站指标特征样本数据;模型查找模块220用于查找是否存在预设支持向量机模型;信息增益计算模块230用于若不存在所述预设支持向量机模型,则计算各所述基站指标特征样本数据的信息增益;基站指标排序模块240用于根据各所述基站指标特征样本数据的信息增益,确定各所述基站指标的重要程度;基站指标选取模块250用于根据各所述基站指标的重要程度,选取预设数量的所述基站指标;模型构建模块260用于根据选取的所述基站指标对应的基站指标特征样本数据,构建所述预设支持向量机模型。
在一种可选的方式中,信息增益计算模块230进一步用于:计算全部所述基站指标特征样本数据的经验熵;计算各个所述基站指标特征样本数据对全部所述基站指标特征样本数据的经验条件熵;将所述经验熵减去经验条件熵,得到各所述基站指标特征样本数据的信息增益。
在一种可选的方式中,模型构建模块260进一步用于:构建基于有向无环图的一对一多分类支持向量机模型,其中,所述预设支持向量机模型由K(K-1)/2个标准支持向量机组成,K为对所述若干基站指标特征样本数据进行分类的类别数。
在一种可选的方式中,该装置200还包括:分类模块。分类模块用于若存在所述预设支持向量机模型,则根据所述预设支持向量机模型,对所述基站指标特征样本数据进行分类。
在一种可选的方式中,该装置200还包括:更新模块。更新模块用于:重新获取若干基站指标特征样本数据;根据重新获取的所述基站指标特征样本数据,更新所述预设支持向量机模型。
在一种可选的方式中,基站指标特征样本数据包括:用户数量、各类套餐用户占比、用户平均停留时间、基站流量以及基站区域属性特征样本数据。
在一种可选的方式中,该装置200还包括:总数据获取模块。总数据获取模块用于获取基站指标总数据,所述基站指标总数据包括用户数量。特征获取模块210进一步用于:
根据以下公式计算各所述基站指标特征样本数据:
所述各类套餐用户占比为
所述用户平均停留时间为
所述基站流量为
f=log(F)
所述基站区域属性为
L={a,b,cΛ}
其中,u为用户数量,n为套餐数目,r1、r2、r3···rn分别为各类套餐的用户数量,m为统计天数,S1、S2、S3···Sm分别为某天某用户占用的总时长,F为天粒度的基站流量,a、b、c···分别为各个区域的数值,若基站属于该区域,则该区域的数值为1,否则,该区域的数值为0。
需要说明的是,本发明实施例提供的基站优化优先级确定装置是能够执行上述基站优化优先级确定方法的装置,则上述基站优化优先级确定方法的所有实施例均适用于该装置,且均能达到相同或相似的有益效果。
本发明实施例通过获取若干基站指标特征样本数据,查找是否存在预设支持向量机模型,若不存在预设支持向量机模型,则计算各基站指标特征样本数据的信息增益,并根据各基站指标特征样本数据的信息增益,确定各基站指标的重要程度,根据各基站指标的重要程度,选取预设数量的基站指标,根据选取的基站指标对应的基站指标特征样本数据,构建预设支持向量机模型,能够通过计算确定各基站指标的重要程度,并选取最重要的基站指标,并采用支持向量机算法进行基站优化优先级判别,找到判别函数的最优解,以构建支持向量机模型,从而能够确定基站容量优化优先级,并且,比人工确定参数更具有科学性和实用性,提高了精度,并且适合输入高维度样本,能够有效地运行在大数据集上。
本发明实施例提供了一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行上述任意方法实施例中的基站优化优先级确定方法。
本发明实施例通过获取若干基站指标特征样本数据,查找是否存在预设支持向量机模型,若不存在预设支持向量机模型,则计算各基站指标特征样本数据的信息增益,并根据各基站指标特征样本数据的信息增益,确定各基站指标的重要程度,根据各基站指标的重要程度,选取预设数量的基站指标,根据选取的基站指标对应的基站指标特征样本数据,构建预设支持向量机模型,能够通过计算确定各基站指标的重要程度,并选取最重要的基站指标,并采用支持向量机算法进行基站优化优先级判别,找到判别函数的最优解,以构建支持向量机模型,从而能够确定基站容量优化优先级,并且,比人工确定参数更具有科学性和实用性,提高了精度,并且适合输入高维度样本,能够有效地运行在大数据集上。
本发明实施例提供了一种计算机程序产品,所述计算机程序产品包括存储在计算机存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行上述任意方法实施例中的基站优化优先级确定方法。
本发明实施例通过获取若干基站指标特征样本数据,查找是否存在预设支持向量机模型,若不存在预设支持向量机模型,则计算各基站指标特征样本数据的信息增益,并根据各基站指标特征样本数据的信息增益,确定各基站指标的重要程度,根据各基站指标的重要程度,选取预设数量的基站指标,根据选取的基站指标对应的基站指标特征样本数据,构建预设支持向量机模型,能够通过计算确定各基站指标的重要程度,并选取最重要的基站指标,并采用支持向量机算法进行基站优化优先级判别,找到判别函数的最优解,以构建支持向量机模型,从而能够确定基站容量优化优先级,并且,比人工确定参数更具有科学性和实用性,提高了精度,并且适合输入高维度样本,能够有效地运行在大数据集上。
图5示出了本发明实施例提供的计算设备的结构示意图,本发明具体实施例并不对计算设备的具体实现做限定。
如图5所示,该计算设备可以包括:处理器(processor)302、通信接口(Communications Interface)304、存储器(memory)306、以及通信总线308。
其中:处理器302、通信接口304、以及存储器306通过通信总线308完成相互间的通信。通信接口304,用于与其它设备比如客户端或其它服务器等的网元通信。处理器302,用于执行程序310,具体可以执行上述任意方法实施例中的基站优化优先级确定方法。
具体地,程序310可以包括程序代码,该程序代码包括计算机操作指令。
处理器302可能是中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。计算设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器306,用于存放程序310。存储器306可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
本发明实施例通过获取若干基站指标特征样本数据,查找是否存在预设支持向量机模型,若不存在预设支持向量机模型,则计算各基站指标特征样本数据的信息增益,并根据各基站指标特征样本数据的信息增益,确定各基站指标的重要程度,根据各基站指标的重要程度,选取预设数量的基站指标,根据选取的基站指标对应的基站指标特征样本数据,构建预设支持向量机模型,能够通过计算确定各基站指标的重要程度,并选取最重要的基站指标,并采用支持向量机算法进行基站优化优先级判别,找到判别函数的最优解,以构建支持向量机模型,从而能够确定基站容量优化优先级,并且,比人工确定参数更具有科学性和实用性,提高了精度,并且适合输入高维度样本,能够有效地运行在大数据集上。
在此提供的算法或显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明实施例也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本发明并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明实施例的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。上述实施例中的步骤,除有特殊说明外,不应理解为对执行顺序的限定。
Claims (10)
1.一种基站优化优先级确定方法,其特征在于,所述方法包括:
获取若干基站指标特征样本数据;
查找是否存在预设支持向量机模型;
若不存在所述预设支持向量机模型,则计算各所述基站指标特征样本数据的信息增益;
根据各所述基站指标特征样本数据的信息增益,确定各所述基站指标的重要程度;
根据各所述基站指标的重要程度,选取预设数量的所述基站指标;
根据选取的所述基站指标对应的基站指标特征样本数据,构建所述预设支持向量机模型。
2.根据权利要求1所述的方法,其特征在于,所述计算各所述基站指标特征样本数据的信息增益,进一步包括:
计算全部所述基站指标特征样本数据的经验熵;
计算各个所述基站指标特征样本数据对全部所述基站指标特征样本数据的经验条件熵;
将所述经验熵减去经验条件熵,得到各所述基站指标特征样本数据的信息增益。
3.根据权利要求2所述的方法,其特征在于,所述构建所述预设支持向量机模型,进一步包括:
构建基于有向无环图的一对一多分类支持向量机模型,其中,所述预设支持向量机模型由K(K-1)/2个标准支持向量机组成,K为对所述若干基站指标特征样本数据进行分类的类别数。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
若存在所述预设支持向量机模型,则根据所述预设支持向量机模型,对所述基站指标特征样本数据进行分类。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
重新获取若干基站指标特征样本数据;
根据重新获取的所述基站指标特征样本数据,更新所述预设支持向量机模型。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述基站指标特征样本数据包括:用户数量、各类套餐用户占比、用户平均停留时间、基站流量以及基站区域属性特征样本数据。
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:
获取基站指标总数据,所述基站指标总数据包括用户数量;
所述获取若干基站指标特征样本数据,进一步包括:
根据以下公式计算各所述基站指标特征样本数据:
所述各类套餐用户占比为
所述用户平均停留时间为
所述基站流量为
f=log(F)
所述基站区域属性为
L={a,b,cΛ}
其中,u为用户数量,n为套餐数目,r1、r2、r3···rn分别为各类套餐的用户数量,m为统计天数,S1、S2、S3···Sm分别为某天某用户占用的总时长,F为天粒度的基站流量,a、b、c···分别为各个区域的数值,若基站属于该区域,则该区域的数值为1,否则,该区域的数值为0。
8.一种基站优化优先级确定装置,其特征在于,所述装置包括:
特征获取模块,用于获取若干基站指标特征样本数据;
模型查找模块,用于查找是否存在预设支持向量机模型;
信息增益计算模块,用于若不存在所述预设支持向量机模型,则计算各所述基站指标特征样本数据的信息增益;
基站指标排序模块,用于根据各所述基站指标特征样本数据的信息增益,确定各所述基站指标的重要程度;
基站指标选取模块,用于根据各所述基站指标的重要程度,选取预设数量的所述基站指标;
模型构建模块,用于根据选取的所述基站指标对应的基站指标特征样本数据,构建所述预设支持向量机模型。
9.一种计算设备,其特征在于,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如权利要求1-7中任意一项所述的基站优化优先级确定方法的操作。
10.一种计算机存储介质,其特征在于,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如权利要求1-7中任意一项所述的基站优化优先级确定方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910644886.6A CN112243247B (zh) | 2019-07-17 | 2019-07-17 | 基站优化优先级确定方法、装置及计算设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910644886.6A CN112243247B (zh) | 2019-07-17 | 2019-07-17 | 基站优化优先级确定方法、装置及计算设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112243247A true CN112243247A (zh) | 2021-01-19 |
CN112243247B CN112243247B (zh) | 2023-04-25 |
Family
ID=74167130
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910644886.6A Active CN112243247B (zh) | 2019-07-17 | 2019-07-17 | 基站优化优先级确定方法、装置及计算设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112243247B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114071525A (zh) * | 2021-11-10 | 2022-02-18 | 中国联合网络通信集团有限公司 | 基站优化次序确定方法、装置及存储介质 |
CN115412928A (zh) * | 2021-05-26 | 2022-11-29 | 中国移动通信集团浙江有限公司 | 一种基于空间技术的插花基站识别方法和装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102609714A (zh) * | 2011-12-31 | 2012-07-25 | 哈尔滨理工大学 | 基于信息增益和在线支持向量机的新型分类器及分类方法 |
CN103916820A (zh) * | 2014-03-31 | 2014-07-09 | 浙江大学 | 基于接入点稳定度的无线室内定位方法 |
CN105554798A (zh) * | 2015-12-07 | 2016-05-04 | 中国联合网络通信集团有限公司 | 一种基站优先级确定方法及优先级确定装置 |
CN105848158A (zh) * | 2016-04-29 | 2016-08-10 | 中国科学院信息工程研究所 | 伪基站的判别方法及装置 |
US20190102692A1 (en) * | 2017-09-29 | 2019-04-04 | Here Global B.V. | Method, apparatus, and system for quantifying a diversity in a machine learning training data set |
CN109905885A (zh) * | 2018-04-12 | 2019-06-18 | 华为技术有限公司 | 一种确定巡检基站列表的方法以及巡检装置 |
-
2019
- 2019-07-17 CN CN201910644886.6A patent/CN112243247B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102609714A (zh) * | 2011-12-31 | 2012-07-25 | 哈尔滨理工大学 | 基于信息增益和在线支持向量机的新型分类器及分类方法 |
CN103916820A (zh) * | 2014-03-31 | 2014-07-09 | 浙江大学 | 基于接入点稳定度的无线室内定位方法 |
CN105554798A (zh) * | 2015-12-07 | 2016-05-04 | 中国联合网络通信集团有限公司 | 一种基站优先级确定方法及优先级确定装置 |
CN105848158A (zh) * | 2016-04-29 | 2016-08-10 | 中国科学院信息工程研究所 | 伪基站的判别方法及装置 |
US20190102692A1 (en) * | 2017-09-29 | 2019-04-04 | Here Global B.V. | Method, apparatus, and system for quantifying a diversity in a machine learning training data set |
CN109905885A (zh) * | 2018-04-12 | 2019-06-18 | 华为技术有限公司 | 一种确定巡检基站列表的方法以及巡检装置 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115412928A (zh) * | 2021-05-26 | 2022-11-29 | 中国移动通信集团浙江有限公司 | 一种基于空间技术的插花基站识别方法和装置 |
CN115412928B (zh) * | 2021-05-26 | 2023-08-01 | 中国移动通信集团浙江有限公司 | 一种基于空间技术的插花基站识别方法和装置 |
CN114071525A (zh) * | 2021-11-10 | 2022-02-18 | 中国联合网络通信集团有限公司 | 基站优化次序确定方法、装置及存储介质 |
CN114071525B (zh) * | 2021-11-10 | 2023-07-18 | 中国联合网络通信集团有限公司 | 基站优化次序确定方法、装置及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112243247B (zh) | 2023-04-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106649401A (zh) | 分布式文件系统中的数据写入方法和装置 | |
CN112566196A (zh) | 一种基于智能电网的异构网络接入选择方法及相关设备 | |
CN116596095B (zh) | 基于机器学习的碳排放量预测模型的训练方法及装置 | |
US9690969B2 (en) | Information processing apparatus, non-transitory computer readable medium, and information processing method | |
US10810458B2 (en) | Incremental automatic update of ranked neighbor lists based on k-th nearest neighbors | |
CN112203324B (zh) | 一种基于位置指纹库的mr定位方法及装置 | |
US20230393813A1 (en) | Sorting apparatus and method | |
CN110929218A (zh) | 一种差异最小化随机分组方法及系统 | |
WO2017039684A1 (en) | Classifier | |
CN112581261A (zh) | 一种风控规则确定方法及装置 | |
CN112243247B (zh) | 基站优化优先级确定方法、装置及计算设备 | |
CN110992124A (zh) | 房源的推荐方法及房源的推荐系统 | |
CN110334104B (zh) | 一种榜单更新方法、装置、电子设备及存储介质 | |
CN112906865A (zh) | 神经网络架构搜索方法、装置、电子设备及存储介质 | |
CN107066328A (zh) | 大规模数据处理平台的构建方法 | |
CN111611228A (zh) | 一种基于分布式数据库的负载均衡调整方法及装置 | |
CN109245948B (zh) | 安全感知的虚拟网络映射方法及其装置 | |
CN112464970A (zh) | 区域价值评估模型处理方法、装置及计算设备 | |
CN115730152A (zh) | 基于用户画像分析的大数据处理方法及大数据处理系统 | |
CN113641823A (zh) | 文本分类模型训练、文本分类方法、装置、设备及介质 | |
CN113361853A (zh) | 新共识模型的卫星应急任务规划方案效能评估方法及系统 | |
CN112749839A (zh) | 一种模型确定方法、装置、设备和存储介质 | |
CN111191827A (zh) | 一种数据波动趋势的预测方法及装置 | |
CN116680367B (zh) | 数据匹配方法、数据匹配装置及计算机可读存储介质 | |
CN104363293A (zh) | 一种基于变异系数Web服务选择方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |