CN111314926B

CN111314926B - 覆盖关系确定方法、装置及计算机可读存储介质

Info

Publication number: CN111314926B
Application number: CN202010046004.9A
Authority: CN
Inventors: 徐康庭
Original assignee: Individual
Current assignee: Individual
Priority date: 2020-01-15
Filing date: 2020-01-15
Publication date: 2021-02-09
Anticipated expiration: 2040-01-15
Also published as: CN111314926A

Abstract

本发明公开了一种覆盖关系确定方法，所述覆盖关系确定方法包括以下步骤：获取两个目标小区的指标预测数据，以及获取小区对的模型训练数据，其中，所述模型训练数据包括合成后的第一指标数据和覆盖关系标签；基于所述模型训练数据，建立覆盖关系识别模型；基于所述指标预测数据以及所述覆盖关系识别模型，确定两个目标小区的目标覆盖关系。本发明还公开了一种覆盖关系确定装置及计算机可读存储介质。本发明采用机器学习随机森林算法构建小区覆盖关系识别模型进行判断小区之间的覆盖关系，从而确定任意两个小区即小区对的覆盖关系，可以准确得识别到任意两个小区的覆盖关系，解决小区覆盖关系识别准确性差的技术问题。

Description

覆盖关系确定方法、装置及计算机可读存储介质

技术领域

本发明涉及无线通信技术领域，尤其涉及一种覆盖关系确定方法、装置及计算机可读存储介质。

背景技术

随着移动网络数据业务的快速发展，无线网络在原有覆盖基础上加速向广深覆盖和厚度两方面发展。在多制式、多频段融合组网情况下，发挥各制式、各频段网络潜力，对提升网络覆盖和容量能力具有重要意义。

现网中多频段组网场景多、配置复杂，要发挥各频段网络潜力，需优先确定任意两小区的覆盖关系，通过合理设置参数，达到多频段多制式业务均衡，提升网络覆盖和容量的目标。

现有的小区覆盖关系主要依赖于规划站数据设计时的小区名称命名规则、地址及小区间是否共用RRU(Remote Radio Unit，射频拉远单元)，亦或是通过小区的经纬度与方向角的关系判别小区是否存在共覆盖关系。但现有的小区间覆盖关系识别方法采用人工方式对共覆盖小区进行维护，准确性无法保证，因此存在小区覆盖关系识别准确性差的问题。

上述内容仅用于辅助理解本发明的技术方案，并不代表承认上述内容是现有技术。

发明内容

本发明的主要目的在于提供一种覆盖关系确定方法、装置及计算机可读存储介质，旨在解决小区覆盖关系识别准确性差的技术问题。

为实现上述目的，本发明提供一种覆盖关系确定方法，所述覆盖关系确定方法包括以下步骤：

获取两个目标小区的指标预测数据，以及获取小区对的模型训练数据，其中，所述模型训练数据包括合成后的第一指标数据和覆盖关系标签；

基于所述模型训练数据，建立覆盖关系识别模型；

基于所述指标预测数据以及所述覆盖关系识别模型，确定两个目标小区的目标覆盖关系。

可选地，所述获取小区对的模型训练数据的步骤包括：

从模型训练数据库中获取所述小区对的模型训练数据。

可选地，所述从模型训练数据库中获取所述小区对的模型训练数据的步骤之前，还包括：

采集小区对中每个小区对应的测量数据；

基于所述测量数据，确定所述小区对的第一指标数据；

基于所述小区对的第一指标数据，确定所述模型训练数据。

可选地，所述基于所述测量数据，确定所述小区对的第一指标数据的步骤包括：

基于所述测量数据，确定所述小区对的第二指标数据；

清洗所述第二指标数据中的指标异常数据以及指标缺失数据，确定所述第一指标数据。

可选地，所述基于所述模型训练数据，建立覆盖关系识别模型的步骤包括：

获取候选指标特征；

基于所述候选指标特征，确定各候选指标特征中的最佳指标特征，并将所述最佳指标特征作为所述覆盖关系识别模型的决策树节点的节点分裂特征；

基于所述节点分裂特征，建立所述覆盖关系识别模型。

可选地，所述基于所述候选指标特征，确定各候选指标特征中的最佳指标特征的步骤包括：

基于所述候选指标特征，确定各候选指标特征的信息增益比；

基于所述信息增益比，确定各候选指标特征中的最佳指标特征。

可选地，所述获取候选指标特征的步骤包括：

获取预设指标特征；

随机选取所述预设指标特征中的部分特征作为候选指标特征。

可选地，所述基于所述指标预测数据以及所述覆盖关系识别模型，确定两个目标小区的目标覆盖关系的步骤包括：

基于所述指标预测数据以及所述覆盖关系识别模型，确定覆盖关系结果；

确定覆盖关系结果中大于预设比重的目标覆盖关系。

此外，为实现上述目的，本发明还提供一种覆盖关系确定装置，所述覆盖关系确定装置包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的覆盖关系确定程序，所述覆盖关系确定程序被所述处理器执行时实现如上述的覆盖关系确定方法的步骤。

此外，为实现上述目的，本发明还提供一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有覆盖关系确定程序，所述覆盖关系确定程序被处理器执行时实现如上述的覆盖关系确定方法的步骤。

本发明通过获取两个目标小区的指标预测数据，以及获取小区对的模型训练数据，其中，所述模型训练数据包括合成后的第一指标数据和覆盖关系标签；基于所述模型训练数据，建立覆盖关系识别模型；基于所述指标预测数据以及所述覆盖关系识别模型，确定两个目标小区的目标覆盖关系，采用机器学习随机森林算法构建小区覆盖关系识别模型进行判断小区之间的覆盖关系，从而确定任意两个小区即小区对的覆盖关系，可以准确得识别到任意两个小区的覆盖关系，解决小区覆盖关系识别准确性差的技术问题，并且本次方案建立了任意两小区覆盖不相关、共覆盖、覆盖相邻、A覆盖包含B、B覆盖包含A、覆盖方向相向、覆盖方向背向和覆盖方向同向八种覆盖关系标签，以反映任意两小区的覆盖关系特征，基于上述八种小区间不同覆盖关系，可以有针对性的对覆盖、容量问题小区进行优化调整，如利用小间区覆盖关系，当发现F频段覆盖不足、D频段过覆盖等问题时，可通过覆盖关系增强F频段的覆盖范围，D频过覆盖则需要控制覆盖来进行优化。利用覆盖方向背向、覆盖方向同向覆盖关系可以发现和纠正工参中的小区方向角错误问题。并且小区间覆盖关系在实际T+F精细化优化、容量均衡调整中极具指导意义，同时通过真实测量数据识别出来的小区间覆盖关系也可以同时反向对基础工参信息(如工参经纬度、方向角等)错误问题进行纠正，亦可以发现如天线接反等天馈异常问题等。

附图说明

图1是本发明实施例方案涉及的硬件运行环境的覆盖关系确定装置结构示意图；

图2为本发明覆盖关系确定方法第一实施例的流程示意图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

如图1所示，图1是本发明实施例方案涉及的硬件运行环境的覆盖关系确定装置结构示意图。

本发明实施例覆盖关系确定装置可以是PC，也可以是智能手机、平板电脑、便携计算机等具有显示功能的可移动式终端设备。

如图1所示，该覆盖关系确定装置可以包括：处理器1001，例如CPU，网络接口1004，用户接口1003，存储器1005，通信总线1002。其中，通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard)，可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器，也可以是稳定的存储器(non-volatile memory)，例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

本领域技术人员可以理解，图1中示出的覆盖关系确定装置结构并不构成对覆盖关系确定装置的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

如图1所示，作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及覆盖关系确定程序。

在图1所示的覆盖关系确定装置中，网络接口1004主要用于连接后台服务器，与后台服务器进行数据通信；用户接口1003主要用于连接客户端(用户端)，与客户端进行数据通信；而处理器1001可以用于调用存储器1005中存储的覆盖关系确定程序。

在本实施例中，覆盖关系确定装置包括：存储器1005、处理器1001及存储在所述存储器1005上并可在所述处理器1001上运行的覆盖关系确定程序，其中，处理器1001调用存储器1005中存储的覆盖关系确定程序时，并执行以下操作：

基于所述模型训练数据，建立覆盖关系识别模型；

进一步地，处理器1001可以调用存储器1005中存储的覆盖关系确定程序，还执行以下操作：

从模型训练数据库中获取所述小区对的模型训练数据。

采集小区对中每个小区对应的测量数据；

基于所述测量数据，确定所述小区对的第一指标数据；

基于所述小区对的第一指标数据，确定所述模型训练数据。

基于所述测量数据，确定所述小区对的第二指标数据；

获取候选指标特征；

基于所述节点分裂特征，建立所述覆盖关系识别模型。

获取预设指标特征；

确定覆盖关系结果中大于预设比重的目标覆盖关系。

本发明还提供一种覆盖关系确定方法，参照图2，图2为本发明覆盖关系确定方法第一实施例的流程示意图，在本实施例中，该覆盖关系确定方法包括以下步骤：

现有各频段能力如下：

E频段：频率较高，覆盖能力相对较弱。共50MHz带宽，频率资源丰富，干扰较小，根据政策只能用于室内，适合用于室分话务吸收；

D频段：频率高，覆盖能力弱。共60MHz带宽，频谱资源丰富，适合作为容量层，作为业务吸收的主力频段；

F频段：频段较低，覆盖能力较强；共30MHz，频谱资源较少，适合用于确保网络基础覆盖；

FDD1800：频段较低，覆盖能力较强；初期可用频率资源受限，通过频率重更可用频率资源能扩展到25MHz；终端渗透率较高，且上下行带宽一致，上行能力强，适合承载上行业务和VOLTE业务；

FDD900：位于低频段，覆盖能力强；目前可用频率5-10MHz，带宽容量较小，终端渗透率较低，适合用于广深度覆盖补充。

现有的小区间覆盖关系识别方法主要缺陷在于：1)采用人工方式对共覆盖小区进行维护，准确性无法保证。2)单纯以共覆盖关系标识任意两小区的覆盖关系，没有细致分类，在实际优化过程中指导意义有限。

本发明的技术方案通过提取任意两小区指标数据，采用机器学习随机森林算法构建小区覆盖关系识别模型进行小区覆盖关系分类。本次发明建立了任意两小区覆盖不相关、共覆盖、覆盖相邻、A覆盖包含B、B覆盖包含A、覆盖方向相向、覆盖方向背向和覆盖方向同向八种覆盖关系标签，以反映任意两小区的覆盖关系特征。

步骤S10，获取两个目标小区的指标预测数据，以及获取小区对的模型训练数据，其中，所述模型训练数据包括合成后的第一指标数据和覆盖关系标签；

一实施例中，确定两个目标小区的覆盖关系需要先获取指标预测数据，以及训练和构建覆盖关系识别模型需要先获取小区对的模型训练数据，模型训练数据包括合成后的第一指标数据和覆盖关系标签，其中，两个目标小区也为一个小区对。

其中，小区为天线所发射频段覆盖的区域，可以是E频段覆盖小区、D频段覆盖小区、F频段覆盖小区、FDD1800覆盖小区或FDD900覆盖小区等，并且小区对包括任意两个频段覆盖小区，其中，小区对的覆盖关系包括覆盖不相关、共覆盖、覆盖相邻、A覆盖包含B、B覆盖包含A、覆盖方向相向、覆盖方向背向以及覆盖方向同向。

指标预测数据为两个目标小区的MR相关统计数据，用于识别覆盖关系的小区对的指标数据，并且指标预测数据包括主小区唯一标识、邻小区唯一标识、主小区频点、邻小区频点、主邻小区场强相关系数(用来表征主邻两个小区的紧密程度关系)、主小区场强均值(用于表征主小区的覆盖情况)、邻小区场强均值(用于表征邻小区的覆盖情况)、主小区场强标准差(用于表征主小区覆盖场强分布情况)、邻小区场强标准差(用于表征邻小区覆盖场强分布情况)、主邻小区场强差值均值(用来表征主邻两个小区覆盖场强差异)、主邻小区场强差值标准差(用来表征主邻两个小区覆盖方向的差异)和主邻小区共同出现的采样点占比(用于表征主邻两个小区共同出现的采样样本的占比情况)、有效采样点占比(用于表征主邻两个小区有效覆盖采样样本的占比情况，其中有效覆盖采样样本是指主邻小区覆盖场强大于等于-110dBm的采样样本)等指标。

模型训练数据为用于训练以及构建覆盖关系识别模型的指标数据，模型训练数据即模型训练样本，并且模型训练数据包括合成后的第一指标数据和覆盖关系标签。其中，第一指标数据为用于训练以及构建覆盖关系识别模型的小区对的指标数据，覆盖关系标签为小区对的覆盖关系，并且覆盖关系标签包括覆盖不相关、共覆盖、覆盖相邻、A覆盖包含B、B覆盖包含A、覆盖方向相向、覆盖方向背向以及覆盖方向同向八种覆盖关系标签。

步骤S20，基于所述模型训练数据，建立覆盖关系识别模型；

一实施例中，将模型训练数据输入进随机森林模型中，构建预设数量的决策树，建立覆盖关系识别模型。可以理解的是，对于随机森林中的每一棵决策树的模型训练数据是通过有放回的随机抽样的方法进行选取，即原始的模型训练数据为N(可以是其中的75％作为模型训练数据，剩下25％数据作为模型测试数据)，对于每一棵决策树有放回的取出K个模型训练数据形成新的模型训练数据，每个新的模型训练数据作为每一棵决策树的训练数据。其中，随机森林是一种监督学习算法，通过随机重采样的方式构建多棵决策树，且通过所有决策树结果投票的方式决定最后的分类结果，每一棵决策树之间不存在关联。决策树是一个树形结构的预测模型，至上而下分别是根节点，分支，子节点和叶子节点。每个非叶子节点都对应一个指标特征(例如主邻小区场强相关系数)，每个分支对应此节点特征在分类时需要满足的条件，叶子节点是最后的分类结果。

例如，40多万条小区对的第一指标数据和其对应的覆盖关系标签数据，取其中75％的第一指标数据和对应的覆盖关系标签作为模型训练数据，25％的数据作为模型测试数据。其中在建立随机森林的每棵决策树时，均有放回的从这75％(即30多万条)数据中随机选取同样数量的小区对数据作为每棵决策树的模型训练数据。因此每棵决策树的模型训练数据是不同的，因此保证每棵决策树的独立性。

步骤S30，基于所述指标预测数据以及所述覆盖关系识别模型，确定两个目标小区的目标覆盖关系。

一实施例中，训练随机森林模型完成得到覆盖关系识别模型后，将指标预测数据输入至覆盖关系识别模型，从而通过覆盖关系识别模型确定目标覆盖关系。目标覆盖关系是由随机森林中所有决策树决策得到的所有覆盖关系中投票决定的，即每一棵决策树都有一个覆盖关系结果，最后选取最多决策树的覆盖关系结果作为最终确定的目标覆盖关系。进一步地，可以将模型训练数据其余的25％指标数据进行分类测试，并得到模型的准确率，精确率，召回率等评估指标。

进一步地，一实施例中，所述基于所述指标预测数据以及所述覆盖关系识别模型，确定两个目标小区的目标覆盖关系的步骤包括：

确定覆盖关系结果中大于预设比重的目标覆盖关系。

一实施例中，所述获取指标预测数据的步骤包括：获取预设天数的指标预测数据；获取指标预测数据以确定任意两个小区即小区对的覆盖关系时，一般获取一定数量的指标预测数据用以判断小区对的覆盖关系，即获取预设天数的指标预测数据，其中，预设天数可以是10天，预设天数还可以是其他的数值，预设天数在本实施例中不做限定。在已经得到的覆盖关系识别模型，之后可以将任意小区对的指标数据输入到覆盖关系识别模型中，便可以输出这个小区对的目标覆盖关系。并且在确定小区对的目标覆盖关系时，需要至少10天的数据去判断具体覆盖关系，若目标覆盖关系占总的指标预测数据对应的覆盖关系结果大于预设比重，则确定目标覆盖关系，并且只有当至少预设比重的天数的数据判断此小区对的覆盖关系为某一覆盖关系时，才可以确定小区A和小区B的覆盖关系为此覆盖关系。例如，只有当至少50％天数的数据判断此小区对的覆盖关系为某一覆盖关系时，才可以确定小区A和小区B的覆盖关系为此覆盖关系。

本实施例提出的覆盖关系确定方法，通过获取两个目标小区的指标预测数据，以及获取小区对的模型训练数据，其中，所述模型训练数据包括合成后的第一指标数据和覆盖关系标签，然后基于所述模型训练数据，建立覆盖关系识别模型，最后基于所述指标预测数据以及所述覆盖关系识别模型，确定两个目标小区的目标覆盖关系，通过提取任意两小区指标数据，采用机器学习随机森林算法构建小区覆盖关系识别模型进行判断小区之间的覆盖关系，从而确定任意两个小区即小区对的覆盖关系，并且本次方案建立了任意两小区覆盖不相关、共覆盖、覆盖相邻、A覆盖包含B、B覆盖包含A、覆盖方向相向、覆盖方向背向和覆盖方向同向八种覆盖关系标签，以反映任意两小区的覆盖关系特征，基于上述八种小区间不同覆盖关系，可以有针对性的对覆盖、容量问题小区进行优化调整，如利用小间区覆盖关系，当发现F频段覆盖不足、D频段过覆盖等问题时，可通过覆盖关系增强F频段的覆盖范围，D频过覆盖则需要控制覆盖来进行优化。利用覆盖方向背向、覆盖方向同向覆盖关系可以发现和纠正工参中的小区方向角错误问题。并且小区间覆盖关系在实际T+F精细化优化、容量均衡调整中极具指导意义，同时通过真实测量数据识别出来的小区间覆盖关系也可以同时反向对基础工参信息(如工参经纬度、方向角等)错误问题进行纠正，亦可以发现如天线接反等天馈异常问题等。

基于第一实施例，提出本发明覆盖关系确定方法的第二实施例，在本实施例中，步骤S10包括：

步骤a，从模型训练数据库中获取所述小区对的模型训练数据。

一实施例中，在建立覆盖关系识别模型之前首先构建一模型训练数据库，从而可以从模型训练数据库中获取模型训练数据，以供建立覆盖关系识别模型，其中，模型训练数据包括合成后的第一指标数据和覆盖关系标签，也就是说，模型数据库中包括合成后的第一指标数据和覆盖关系标签。可以理解的是，在建立覆盖关系识别模型之前首先构建一模型训练数据库，并且在构建模型训练数据库时才确定模型训练数据库中的覆盖关系标签和合成后的第一指标数据，将预设数量的合成后的第一指标数据和覆盖关系标签存储到模型训练数据库中，以构建模型训练数据库，以便后续进一步构建覆盖关系识别模型。可以理解的是，覆盖关系主要分为相关和不相关两大类，其中相关的小区对分为共基站小区对和不共基站小区对，共基站小区对的覆盖关系分为共覆盖和覆盖相邻两种覆盖关系。对于非共基站小区对的覆盖关系分为小区A覆盖包含小区B、小区B覆盖包含小区A、覆盖方向相向、覆盖方向背向和覆盖方向同向五种覆盖关系。因此覆盖关系标签为：不相关、共覆盖、覆盖相邻、A覆盖包含B、B覆盖包含A、覆盖方向相向、覆盖方向背向和覆盖方向同向八种标签。

进一步地，一实施例中，所述从模型训练数据库中获取所述小区对的模型训练数据的步骤之前，还包括：

步骤b，采集小区对中每个小区对应的测量数据；

一实施例中，小区对中每个小区的测量数据主要包含：样本时间(单个样本数据采集时间)、主小区唯一标识(唯一标识主小区的识别码)、邻小区唯一标识(唯一标识邻小区的识别码)、主小区频点、邻小区频点、主小区场强和邻小区场强。因而，采集小区对中每个小区的测量数据包含采集每个小区的样本时间、主小区唯一标识、邻小区唯一标识、主小区频点、邻小区频点、主小区场强和邻小区场强。例如，采集小区对的一组测量数据包括样本时间、主小区A唯一标识、邻B小区唯一标识、主小区A频点、邻B小区频点、主小区A场强和邻小区B场强，或者一组测量数据包括主小区B唯一标识、邻A小区唯一标识、主小区B频点、邻A小区频点、主小区B场强和邻小区A场强。

步骤c，基于所述测量数据，确定所述小区对的第一指标数据；

一实施例中，采集测量数据后，根据所采集的测量数据计算小区对的第一指标数据。具体地，根据测量数据中的主小区和邻小区的场强，分别计算主邻小区场强相关系数(用来表征主邻两个小区的紧密程度关系)、主小区场强均值(用于表征主小区的覆盖情况)、邻小区场强均值(用于表征邻小区的覆盖情况)、主小区场强标准差(用于表征主小区覆盖场强分布情况)、邻小区场强标准差(用于表征邻小区覆盖场强分布情况)、主邻小区场强差值均值(用来表征主邻两个小区覆盖场强差异)、主邻小区场强差值标准差(用来表征主邻两个小区覆盖方向的差异)和主邻小区共同出现的采样点占比(用于表征主邻两个小区共同出现的采样样本的占比情况)、有效采样点占比(用于表征主邻两个小区有效覆盖采样样本的占比情况，其中有效覆盖采样样本是指主邻小区覆盖场强大于等于-110dBm的采样样本)等指标。计算后的第一指标数据整理如下：

例如，小区对以A小区为主小区以及以B小区为邻小区一组第一指标数据可以是如下：

同样地，小区对以B小区为主小区以及以A小区为邻小区一组第一指标数据可以是如下：

步骤d，基于所述小区对的第一指标数据，确定所述模型训练数据。

一实施例中，将小区对以A小区为主小区以及以B小区为邻小区的一组第一指标数据以及与其相对应的以B小区为主小区以及以A小区为邻小区一组第一指标数据合并，得到模型训练数据中的合并后的第一指标数据。

进一步地，一实施例中，所述基于所述测量数据，确定所述小区对的第一指标数据的步骤包括：

步骤e，基于所述测量数据，确定所述小区对的第二指标数据；

一实施例中，采集测量数据后，根据所采集的测量数据计算小区对的第二指标数据。具体地，根据测量数据中的主小区和邻小区的场强，分别计算主邻小区场强相关系数(用来表征主邻两个小区的紧密程度关系)、主小区场强均值(用于表征主小区的覆盖情况)、邻小区场强均值(用于表征邻小区的覆盖情况)、主小区场强标准差(用于表征主小区覆盖场强分布情况)、邻小区场强标准差(用于表征邻小区覆盖场强分布情况)、主邻小区场强差值均值(用来表征主邻两个小区覆盖场强差异)、主邻小区场强差值标准差(用来表征主邻两个小区覆盖方向的差异)和主邻小区共同出现的采样点占比(用于表征主邻两个小区共同出现的采样样本的占比情况)、有效采样点占比(用于表征主邻两个小区有效覆盖采样样本的占比情况，其中有效覆盖采样样本是指主邻小区覆盖场强大于等于-110dBm的采样样本)等指标。计算后的第二指标数据包括如下：

步骤f，清洗所述第二指标数据中的指标异常数据以及指标缺失数据，确定所述第一指标数据。

一实施例中，基于测量数据求得第二指标数据后，对第二指标数据进行清洗第二指标数据中的指标异常数据以及指标缺失数据，对于指标异常数据(指标值在正常取值范围之外的数据记录)，以及指标缺失数据(例如小区对某一指标缺失)进行所求得的第二指标数据进行清洗剔除。其中，数据采集异常以及数据同步异常可能是导致数据异常和缺失的原因，因此需要对模型训练数据中的指标数据进行清洗，以得到标准的且无缺失的第一指标数据。

本实施例提出的覆盖关系确定方法，通过从模型训练数据库中获取所述小区对的模型训练数据，由于训练覆盖关系识别模型的训练数据的数据多而且数据量大，因此通过构建模型训练数据库以及从所构建的模型训练数据库中获取训练覆盖关系识别模型的模型训练数据，使得训练覆盖关系识别模型更高效更便捷。

基于第一实施例，提出本发明覆盖关系确定方法的第三实施例，在本实施例中，步骤S20包括：

步骤g，获取候选指标特征；

步骤h，基于所述候选指标特征，确定各候选指标特征中的最佳指标特征，并将所述最佳指标特征作为所述覆盖关系识别模型的决策树节点的节点分裂特征；

步骤i，基于所述节点分裂特征，建立所述覆盖关系识别模型。

一实施例中，在本方案的构建覆盖关系识别模型的过程中，覆盖关系识别模型中的每一棵决策树的每一个节点的节点分裂特征，要在小区A频点、小区B频点、主小区A邻小区B场强相关系数、主小区A场强均值、邻小区B场强均值、主小区A场强标准差、邻小区B场强标准差、主小区A邻小区B场强差值均值、主小区A邻小区B场强差值标准差、主小区A邻小区B共同出现的采样点占比、主小区A邻小区B有效采样点占比、主小区B邻小区A场强相关系数、主小区B场强均值、邻小区A场强均值、主小区B场强标准差、邻小区A场强标准差、主小区B邻小区A场强差值均值、主小区B邻小区A场强差值标准差、主小区B邻小区A共同出现的采样点占比、主小区B邻小区A有效采样点占比这些指标中随机选取80％的指标作为候选指标特征，然后基于节点分裂特征选取准则从候选指标特征中选取最佳的指标特征作为这一节点的节点分裂特征。

进一步地，一实施例中，所述基于所述候选指标特征，确定各候选指标特征中的最佳指标特征的步骤包括：

步骤j，基于所述候选指标特征，确定各候选指标特征的信息增益比；

步骤k，基于所述信息增益比，确定各候选指标特征中的最佳指标特征。

一实施例中，在本方案的构建覆盖关系识别模型的过程中，覆盖关系识别模型中的每一棵决策树的每一个节点的节点分裂特征，要在小区A频点、小区B频点、主小区A邻小区B场强相关系数、主小区A场强均值、邻小区B场强均值、主小区A场强标准差、邻小区B场强标准差、主小区A邻小区B场强差值均值、主小区A邻小区B场强差值标准差、主小区A邻小区B共同出现的采样点占比、主小区A邻小区B有效采样点占比、主小区B邻小区A场强相关系数、主小区B场强均值、邻小区A场强均值、主小区B场强标准差、邻小区A场强标准差、主小区B邻小区A场强差值均值、主小区B邻小区A场强差值标准差、主小区B邻小区A共同出现的采样点占比、主小区B邻小区A有效采样点占比这些指标中随机选取80％的指标作为候选指标特征，然后再计算以这些候选指标特征的信息增益比，选取信息增益比最大的指标作为分裂这一节点的最佳指标特征。其中，信息增益比作为决策树的特征选择准则，可以度量数据集划分前后的不确定性变化情况，信息增益率比越大代表这个特征划分后数据集的纯度越高，特征划分的越好。

信息增益比计算方式如下：

其中，Gain(D,A)为信息增益，计算方式如下：

Gain(D，A)＝H(D)-H(D|A)

其中样本D有n个类别，|C_k|表示类别k对应的样本个数，|D|代表样本集D的样本个数，

代表类别k的概率。以A特征分裂后共有l个分支，|D_i|表示以A特征分裂后，第i个分支的样本数，|C_ik|表示第i个分支类别为k的样本个数。

H(D)表示的是未经分类数据的信息熵，未经分类的数据是最无序的、不确定性最大的。条件熵H(D|A)表示在条件A下集合D的信息熵，即以特征A划分后的数据集的信息熵，所以当数据根据某个特征A进行分类后的条件熵H(D|A)要小于分类前的熵H(D)，因为其不确定性降低了。

进一步地，一实施例中，所述获取候选指标特征的步骤包括：

步骤m，获取预设指标特征；

步骤n，随机选取所述预设指标特征中的部分特征作为候选指标特征。

一实施例中，覆盖关系识别模型中决策树节点的分裂是由部分特征选取最佳特征决定的，即从候选指标特征中选取最佳指标特征。不计算所有特征的信息增益比，即不获取所有预设指标特征，而是从预设指标特征中随机的选取一些特征作为候选指标特征，以供后续计算候选指标特征的信息增益比来选取最佳指标特征。

本实施例提出的覆盖关系确定方法，通过获取候选指标特征，然后基于所述候选指标特征，确定各候选指标特征中的最佳指标特征，并将所述最佳指标特征作为所述覆盖关系识别模型的决策树节点的节点分裂特征，最后基于所述节点分裂特征，建立所述覆盖关系识别模型，通过机器学习随机森林算法构建任意两个小区覆盖关系识别模型，由于不同覆盖关系的小区对的测量数据指标特征存在差异，因此可以通过小区测量数据的指标特征来反向判断小区之间的覆盖关系，可以通过输入测量数据统计后小区对双向指标数据得到此小区对的具体覆盖关系。

此外，本发明实施例还提出一种计算机可读存储介质，所述计算机可读存储介质上存储有覆盖关系确定程序，所述覆盖关系确定程序被处理器执行时实现如上述中任一项所述的覆盖关系确定方法的步骤。

本发明计算机可读存储介质具体实施例与上述覆盖关系确定方法的各实施例基本相同，在此不再详细赘述。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种覆盖关系确定方法，其特征在于，所述覆盖关系确定方法包括以下步骤：

获取候选指标特征；

基于所述候选指标特征，确定各候选指标特征中的最佳指标特征，并将所述最佳指标特征作为覆盖关系识别模型的决策树节点的节点分裂特征；

将所述模型训练数据输入至随机森林模型，以基于所述节点分裂特征，建立所述覆盖关系识别模型；

2.如权利要求1所述的覆盖关系确定方法，其特征在于，所述获取小区对的模型训练数据的步骤包括：

从模型训练数据库中获取所述小区对的模型训练数据。

3.如权利要求2所述的覆盖关系确定方法，其特征在于，所述从模型训练数据库中获取所述小区对的模型训练数据的步骤之前，还包括：

采集小区对中每个小区对应的测量数据；

基于所述测量数据，确定所述小区对的第一指标数据；

基于所述小区对的第一指标数据，确定所述模型训练数据。

4.如权利要求3所述的覆盖关系确定方法，其特征在于，所述基于所述测量数据，确定所述小区对的第一指标数据的步骤包括：

基于所述测量数据，确定所述小区对的第二指标数据；

5.如权利要求1所述的覆盖关系确定方法，其特征在于，所述基于所述候选指标特征，确定各候选指标特征中的最佳指标特征的步骤包括：

6.如权利要求1所述的覆盖关系确定方法，其特征在于，所述获取候选指标特征的步骤包括：

获取预设指标特征；

7.如权利要求1至6任一项所述的覆盖关系确定方法，其特征在于，所述基于所述指标预测数据以及所述覆盖关系识别模型，确定两个目标小区的目标覆盖关系的步骤包括：

确定覆盖关系结果中大于预设比重的目标覆盖关系。

8.一种覆盖关系确定装置，其特征在于，所述覆盖关系确定装置包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的覆盖关系确定程序，所述覆盖关系确定程序被所述处理器执行时实现如权利要求1至7中任一项所述的覆盖关系确定方法的步骤。

9.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有覆盖关系确定程序，所述覆盖关系确定程序被处理器执行时实现如权利要求1至7中任一项所述的覆盖关系确定方法的步骤。