CN110909804A - 基站异常数据的检测方法、装置、服务器和存储介质 - Google Patents

基站异常数据的检测方法、装置、服务器和存储介质 Download PDF

Info

Publication number
CN110909804A
CN110909804A CN201911176078.8A CN201911176078A CN110909804A CN 110909804 A CN110909804 A CN 110909804A CN 201911176078 A CN201911176078 A CN 201911176078A CN 110909804 A CN110909804 A CN 110909804A
Authority
CN
China
Prior art keywords
communication data
base station
data
detecting
abnormal data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911176078.8A
Other languages
English (en)
Other versions
CN110909804B (zh
Inventor
张英乔
胡永禄
钟湘飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Hongshan Information Technology Research Institute Co Ltd
Original Assignee
Beijing Hongshan Information Technology Research Institute Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Hongshan Information Technology Research Institute Co Ltd filed Critical Beijing Hongshan Information Technology Research Institute Co Ltd
Priority to CN201911176078.8A priority Critical patent/CN110909804B/zh
Publication of CN110909804A publication Critical patent/CN110909804A/zh
Application granted granted Critical
Publication of CN110909804B publication Critical patent/CN110909804B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23211Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with adaptive number of clusters
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/245Classification techniques relating to the decision surface
    • G06F18/2451Classification techniques relating to the decision surface linear, e.g. hyperplane
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/02Arrangements for optimising operational condition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W64/00Locating users or terminals or network equipment for network management purposes, e.g. mobility management
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Probability & Statistics with Applications (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Position Fixing By Use Of Radio Waves (AREA)

Abstract

本发明实施例提供了一种基站异常数据的检测方法、装置、服务器和存储介质。该基站异常数据的检测方法包括:获取第一基站的覆盖区域的多个第一通讯数据;基于聚类模型对所述多个第一通讯数据进行检测,以得到第一异常数据;在所述多个第一通讯数据中剔除所述第一异常数据,得到至少一个第二通讯数据;基于所述至少一个第二通讯数据与所述第一基站的距离关系,对所述至少一个第二通讯数据进行检测,以得到第二异常数据。通过对异常数据的检测和剔除,达到提高定位的精度的效果。

Description

基站异常数据的检测方法、装置、服务器和存储介质
技术领域
本发明实施例涉及数据处理技术领域,尤其涉及一种基站异常数据的检测方法、装置、服务器和存储介质。
背景技术
随着科技的发展和社会的进步,人们的生产生活方式日益丰富,使用移动终端产生的通讯数据也越来越多。
目前,通过用户使用移动终端产生的通信数据,利用通讯数据来获取用户的定位、工参信息核查校准、邻区优化、关联S1MME对用户行为轨迹的分析等场景应用。尤其是利用通讯数据进行定位,是目前常用的定位方法。
然而,由于网络异常等原因,基站上报的通讯数据不准确,对通讯数据的质量产生了非常大的负面影响,从而导致定位精度下降。
发明内容
本发明实施例提供一种基站异常数据的检测方法、装置、服务器和存储介质,以实现提高定位的精度的效果。
第一方面,本发明实施例提供了一种基站异常数据的检测方法,包括:
获取第一基站的覆盖区域的多个第一通讯数据;
基于聚类模型对所述多个第一通讯数据进行检测,以得到第一异常数据;
在所述多个第一通讯数据中剔除所述第一异常数据,得到至少一个第二通讯数据;
基于所述至少一个第二通讯数据与所述第一基站的距离关系,对所述至少一个第二通讯数据进行检测,以得到第二异常数据。
可选的,所述聚类模型包括距离参数和数量参数,所述基于聚类模型对所述多个第一通讯数据进行检测,以得到第一异常数据,包括:
以每一个第一通讯数据为圆心,距离参数为半径画圆,获取在每一个圆中的第一通讯数据的第一总数量;
将所述第一总数量大于或等于所述数量参数的圆作为标志圆;
将不在所述标志圆的第一通讯数据作为所述第一异常数据。
可选的,所述聚类模型还包括数量阈值,在所述以每一个第一通讯数据为圆心,距离参数为半径画圆,获取在每一个圆中的第一通讯数据的第一总数量之前,包括:
计算第一基站的覆盖区域的多个第一通讯数据的第二总数量;
如果所述第二总数量大于或等于所述数量阈值,则执行下一步;
如果所述第二总数量小于所述数量阈值,则将所述第二总数量减去预设数量的值作为数量参数后,执行下一步。
可选的,所述第二通讯数据包括时间提前量和位置信息,所述时间提前量是指移动终端向第一基站发出信号到第一基站收到信号的时间差,所述基于所述至少一个第二通讯数据与所述第一基站的距离关系,对所述至少一个第二通讯数据进行检测,以得到第二异常数据,包括:
根据所述时间提前量和电磁波的传播速度确定传播距离;
根据所述位置信息确定第二通讯数据与所述第一基站的直线距离;
将所述直线距离大于所述传播距离的第二通讯数据作为所述第二异常数据。
可选的,所述传播距离根据预设公式计算得到。
可选的,所述第二通讯数据包括位置信息和第一基站类型,所述基于所述至少一个第二通讯数据与所述第一基站的距离关系,对所述至少一个第二通讯数据进行检测,以得到第二异常数据,包括:
根据所述第一基站类型确定所述第一基站的最大理论距离;
根据所述位置信息确定第二通讯数据与所述第一基站的直线距离;
将所述直线距离大于所述最大理论距离的第二通讯数据作为所述第二异常数据。
可选的,在所述基于所述至少一个第二通讯数据与所述第一基站的距离关系,对所述至少一个第二通讯数据进行检测,以得到第二异常数据之后,包括:
获取新的第三通讯数据;
根据建立好的预设分类模型检测所述第三通讯数据是否为异常数据。
第二方面,本发明实施例提供了一种基站异常数据的检测装置,包括:
获取模块,用于获取第一基站的覆盖区域的多个第一通讯数据;
第一检测模块,用于基于聚类模型对所述多个第一通讯数据进行检测,以得到第一异常数据;
剔除模块,用于在所述多个第一通讯数据中剔除所述第一异常数据,得到至少一个第二通讯数据;
第二检测模块,用于基于所述至少一个第二通讯数据与所述第一基站的距离关系,对所述至少一个第二通讯数据进行检测,以得到第二异常数据。
第三方面,本发明实施例提供了一种服务器,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明任意实施例所述的基站异常数据的检测方法。
第四方面,本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明任意实施例所述的基站异常数据的检测方法。
本发明实施例通过获取第一基站的覆盖区域的多个第一通讯数据;基于聚类模型对所述多个第一通讯数据进行检测,以得到第一异常数据;在所述多个第一通讯数据中剔除所述第一异常数据,得到至少一个第二通讯数据;基于所述至少一个第二通讯数据与所述第一基站的距离关系,对所述至少一个第二通讯数据进行检测,以得到第二异常数据,解决了由于网络异常等原因,基站上报的通讯数据不准确导致定位精度下降的问题,实现了提高定位的精度的效果。
附图说明
图1是本发明实施例一提供的一种基站异常数据的检测方法的流程示意图;
图2是本发明实施例二提供的一种基站异常数据的检测方法的流程示意图;
图3是本发明实施例三提供的一种基站异常数据的检测装置的结构示意图;
图4是本发明实施例四提供的一种服务器的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各步骤描述成顺序的处理,但是其中的许多步骤可以被并行地、并发地或者同时实施。此外,各步骤的顺序可以被重新安排。当其操作完成时处理可以被终止,但是还可以具有未包括在附图中的附加步骤。处理可以对应于方法、函数、规程、子例程、子程序等等。
此外,术语“第一”、“第二”等可在本文中用于描述各种方向、动作、步骤或元件等,但这些方向、动作、步骤或元件不受这些术语限制。这些术语仅用于将第一个方向、动作、步骤或元件与另一个方向、动作、步骤或元件区分。举例来说,在不脱离本申请的范围的情况下,可以将第一基站为第二基站,且类似地,可将第二基站称为第一基站。第一基站和第二基站两者都是基站,但其不是同一基站。术语“第一”、“第二”等而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
实施例一
图1为本发明实施例一提供的一种基站异常数据的检测方法的流程示意图,可适用于对基站异常数据进行检测的场景,该方法可以由基站异常数据的检测装置来执行,该装置可以采用软件和/或硬件的方式实现,并可集成在服务器上。
如图1所示,本发明实施例一提供的基站异常数据的检测方法包括:
S110、获取第一基站的覆盖区域的多个第一通讯数据。
其中,第一基站是指给移动终端提供通信功能的基站。移动终端包括但不限于使用SIM(用户身份识别,Subscriber Identification Module)卡的手机、IPAD、智能穿戴物品等,此处不作限制。第一通讯数据是指移动终端通过第一基站产生的通讯数据。在本实施例中,第一通讯数据为具有位置信息(例如经纬度)的数据。在通讯数据中,有一类数据被称作MR(measurement report,测量报告)数据,它是基站对用户通讯信息的记录。部分MR数据中包含了用户的经纬度信息,这部分MR数据为AGPS(Assisted Global PositioningSystem,辅助全球卫星定位系统)数据。优选的,第一通讯数据为AGPS数据。
S120、基于聚类模型对所述多个第一通讯数据进行检测,以得到第一异常数据。
其中,聚类模型是指通过聚类算法训练机器学习得到的模型。具体的,聚类算法是机器学习无监督学习中的重要方法,其目的是将数据按照特征聚成几个有意义的簇群,发现数据的内部规律和信息。因为同簇的数据具有相似性,被孤立在外的数据点与簇内数据有较大不同,该数据点则为异常值点。在本实施例中,可选的,聚类算法为基于密度的聚类算法DBSCAN(Density-Based Spatial Clustering of Applications with Noise)。第一异常数据是指在多个第一通讯数据的异常数据。具体的,经过聚类模型的检测,不在任一一个簇里的数据,就是第一异常数据。
S130、在所述多个第一通讯数据中剔除所述第一异常数据,得到至少一个第二通讯数据。
其中,第二通讯数据是指在第一通讯数据中剔除第一异常数据后得到的数据。具体的,所有第二通讯数据和第一异常数据构成的集合,为第一通讯数据的总数。示例性地,有A、B、C、D多个第一通讯数据,第一异常数据为B,则第二通讯数据为A、C、D。
S140、基于所述至少一个第二通讯数据与所述第一基站的距离关系,对所述至少一个第二通讯数据进行检测,以得到第二异常数据。
其中,距离关系是指第二通讯数据与第一基站之间的距离。具体的,在使用移动终端通讯产生通讯数据时,会得到该通讯数据的位置信息。根据第二通讯数据的位置信息与第一基站的位置得到距离关系。可选的,可以通过第一基站的ID(Identity document,身份标识)确定第一基站的位置。第二异常数据是指在第二通讯数据中,不满足该距离关系的数据。示例性地,第二通讯数据为A、C、D,其中D不满足该距离关系,则D为第二异常数据。可选的,根据通过确定第一基站的类型,进而得到第一基站的最大理论距离,当距离关系大于最大理论距离时,该数据为第二异常数据,此处不作限制。
本发明实施例的技术方案,通过获取第一基站的覆盖区域的多个第一通讯数据;基于聚类模型对所述多个第一通讯数据进行检测,以得到第一异常数据;在所述多个第一通讯数据中剔除所述第一异常数据,得到至少一个第二通讯数据;基于所述至少一个第二通讯数据与所述第一基站的距离关系,对所述至少一个第二通讯数据进行检测,以得到第二异常数据,在多个第一通讯数据检测第一异常数据后剔除,再对第二数据进行检测得到第二异常数据,在进行定位时可以不考虑异常数据,达到提高定位的精度的技术效果。此外,通过双重检测,使用该通讯数据进行定位的精度更高。
实施例二
图2是本发明实施例二提供的一种基站异常数据的检测方法的流程示意图。本实施例是在上述技术方案的进一步细化,适用于对基站异常数据进行检测的场景。该方法可以由基站异常数据的检测装置来执行,该装置可以采用软件和/或硬件的方式实现,并可集成在服务器上。
如图2所示,本发明实施例二提供的基站异常数据的检测方法包括:
S210、获取第一基站的覆盖区域的多个第一通讯数据。
其中,第一基站是指给移动终端提供通信功能的基站。移动终端包括但不限于使用SIM(用户身份识别,Subscriber Identification Module)卡的手机、IPAD、智能穿戴物品等,此处不作限制。第一通讯数据是指移动终端通过第一基站产生的通讯数据。在本实施例中,第一通讯数据为具有位置信息(例如经纬度)的数据。在通讯数据中,有一类数据被称作MR(measurement report,测量报告)数据,它是基站对用户通讯信息的记录。部分MR数据中包含了用户的经纬度信息,这部分MR数据为AGPS(Assisted Global PositioningSystem,辅助全球卫星定位系统)数据。优选的,第一通讯数据为AGPS数据。
S220、基于聚类模型对所述多个第一通讯数据进行检测,以得到第一异常数据。
其中,聚类模型是指通过聚类算法训练机器学习得到的模型。具体的,聚类算法是机器学习无监督学习中的重要方法,其目的是将数据按照特征聚成几个有意义的簇群,发现数据的内部规律和信息。因为同簇的数据具有相似性,被孤立在外的数据点与簇内数据有较大不同,该数据点则为异常值点。在本实施例中,可选的,聚类算法为基于密度的聚类算法DBSCAN(Density-Based Spatial Clustering of Applications with Noise)。第一异常数据是指在多个第一通讯数据的异常数据。具体的,经过聚类模型的检测,不在任一一个簇里的数据,就是第一异常数据。
在一个实施例中,可选的,聚类模型包括距离参数和数量参数,基于聚类模型对所述多个第一通讯数据进行检测,以得到第一异常数据可以包括:
以每一个第一通讯数据为圆心,距离参数为半径画圆,获取在每一个圆中的第一通讯数据的第一总数量;
将所述第一总数量大于或等于所述数量参数的圆作为标志圆;
将不在所述标志圆的第一通讯数据作为所述第一异常数据。
其中,距离参数是指与距离相关的参数。在本实施例中,距离参数为聚类模型进行分类的半径。数量参数是指与数量相关的参数。在本实施例中,数量参数是用来判断以第一通讯数据为圆心、距离参数为半径画的圆是否为标志圆的标准数值。具体的,标志圆代表一个簇,当第一通讯不在任一标志圆中,即不在任一个簇中,则此第一通讯数据为第一异常数据。距离参数和数量参数可以根据需要进行设置。可选的,距离参数为1-500米,数量参数为2-100,此处不作具体限制,距离参数和数量参数需要协调进行设置。优选的,距离参数为100米,数量参数为5,此处不作具体限制。
在另一个实施例中,可选的,聚类模型还包括数量阈值,在以每一个第一通讯数据为圆心,距离参数为半径画圆,获取在每一个圆中的第一通讯数据的第一总数量之前,还可以包括:
计算第一基站的覆盖区域的多个第一通讯数据的第二总数量;
如果所述第二总数量大于或等于所述数量阈值,则执行下一步;
如果所述第二总数量小于所述数量阈值,则将所述第二总数量减去预设数量的值作为数量参数后,执行下一步。
其中,第二总数量为第一基站的覆盖区域下,第一通讯数据的总数量。具体的,在通过聚类模型检测第一异常数据剔除时,是通过每一个服务小区,即第一基站的覆盖区域下的第一通讯数据进行检测。对于数据量少的小区,其第二总数据量小于数量参数时,不管怎么聚类,该小区下的所有的第一通讯数据都会被判定为第一异常数据。因此,在以聚类模型的距离参数和数量参数进行检测之前,需要判断第一通讯数据的第二总数量。当第二总数量大于等于数量阈值时,则执行下一步,即以每一个第一通讯数据为圆心,距离参数为半径画圆,获取在每一个圆中的第一通讯数据的第一总数量;当第二总数量小于数量阈值时,则将第二总数量减去预设数量的值作为数量参数后,才执行下一步。在本实施例中,可选的,数量阈值为1以上的数值,此处不作限制。优选的,数量阈值与数量参数的大小一致。可选的,预设数量可以是0以上的任一数值,此处不作限制。优选的,预设数量为1,即使有一些基站的小区数据量少,也能保证部分第一通讯数据能够聚类成功。
S230、在所述多个第一通讯数据中剔除所述第一异常数据,得到至少一个第二通讯数据。
其中,第二通讯数据是指在第一通讯数据中剔除第一异常数据后得到的数据。具体的,所有第二通讯数据和第一异常数据构成的集合,为第一通讯数据的总数。示例性地,有A、B、C、D多个第一通讯数据,第一异常数据为B,则第二通讯数据为A、C、D。
在一个实施例中,可选的,所述第二通讯数据包括时间提前量和位置信息,所述时间提前量是指移动终端向第一基站发出信号到第一基站收到信号的时间差,基于所述至少一个第二通讯数据与所述第一基站的距离关系,对所述至少一个第二通讯数据进行检测,以得到第二异常数据可以包括:
根据所述时间提前量和电磁波的传播速度确定传播距离;
根据所述位置信息确定第二通讯数据与所述第一基站的直线距离;
将所述直线距离大于所述传播距离的第二通讯数据作为所述第二异常数据。
其中,传播距离是指通过时间提前量和电磁波的传播速度计算得到。可选的,传播距离根据预设公式计算得到。具体的,预设公式为:时间提前量乘以预设系数,也可以是时间提前量加上预设数值后乘以预设系数,此处不作限制。预设系数可以是大于0以上的数值(例如70、80等数值),此处不作限制。优选的,预设系数为78.12。预设数值为大于0的数值(例如1、2等),此处不作限制。较佳地,预设公式为:(时间提前量+1)×78.12。时间提前量期间,由于电磁波在传播过程中,遇到障碍物会反射,因此移动终端与第一基站中的传输近似一条折线,折线即传播距离,因此传播距离必定会大于直线距离。通过时间提前量计算得到的传播距离,将直线距离大于传播距离的第二通讯数据作为第二异常数据。
在另一个实施例中,可选的,所述第二通讯数据包括位置信息和第一基站类型,所述基于所述至少一个第二通讯数据与所述第一基站的距离关系,对所述至少一个第二通讯数据进行检测,以得到第二异常数据,可以包括:
根据所述第一基站类型确定所述第一基站的最大理论距离;
根据所述位置信息确定第二通讯数据与所述第一基站的直线距离;
将所述直线距离大于所述最大理论距离的第二通讯数据作为所述第二异常数据。
其中,第一基站类型是指第一基站的基站类型。在本实施例中,可选的,第一基站类型可以包括城区基站、郊区基站、农村基站和未划分的基站等多个类型,此处不作限制。最大理论距离是指第一基站的可覆盖半径距离,与第一基站类型相关。示例性地,城区基站的最大理论距离为2000米,郊区基站为5000米,农村基站为8000米,未划分基站为10000米,此处不作限制。
在另一个实施例中,可选的,也可以先对有时间提前量的第二通讯数据,根据所述时间提前量和电磁波的传播速度确定传播距离进行检测后,对于没有时间提前量的第二通讯数据,采用基站类型的最大理论距离去检测,进一步提高检测的有效结果。
S240、基于所述至少一个第二通讯数据与所述第一基站的距离关系,对所述至少一个第二通讯数据进行检测,以得到第二异常数据。
其中,距离关系是指第二通讯数据与第一基站之间的距离。具体的,在使用移动终端通讯产生通讯数据时,会得到该通讯数据的位置信息。根据第二通讯数据的位置信息与第一基站的位置得到距离关系。可选的,可以通过第一基站的ID(Identity document,身份标识)确定第一基站的位置。第二异常数据是指在第二通讯数据中,不满足该距离关系的数据。示例性地,第二通讯数据为A、C、D,其中D不满足该距离关系,则D为第二异常数据。可选的,根据通过确定第一基站的类型,进而得到第一基站的最大理论距离,当距离关系大于最大理论距离时,该数据为第二异常数据,此处不作限制。
S250、获取新的第三通讯数据。
其中,第三通讯数据是指用户在使用移动终端时,产生的新的通讯数据。具体的,新的第三通讯数据在使用移动终端进行通讯时会产生,因此第三通讯数据会不断地产生。
S260、根据建立好的预设分类模型检测所述第三通讯数据是否为异常数据。
其中,预设分类模型是指用于对第三通讯数据进行检测,判断其是否为异常数据的模型。在本实施例中,预设分类模型通过之前的步骤,确定得到异常数据和正常通讯数据的检测结果,根据该检测结果建立。可选的,可以将一天的通讯数据的进行检测的结果作为检测结果,此处不作限制。具体的,本实施例中的预设分类模型为一类分类模型,通过判断第三通讯数据与正常通讯数据是否为一类数据,从而确定第三通讯数据是否为异常数据。在本实施例中,可选的,一类分类模型是一类支持向量机模型。支持向量机是机器学习中一种重要的分类模型,是使用一个超平面来将数据划分成不同的类,同时要保持支持向量到这个超平面的距离最大,以此让模型的稳定性最大化。同时要使用核函数支持向量机,因为传统的硬间隔支持向量机只能分类线性可分的数据,但在加入了核函数之后,可以将数据映射到一个高维空间中,在一个高维空间中,低维线性不可分的数据就有可能线性可分了,当然在高维使用线性方法也就等同于在低维使用非线性方法。因此最后构建出的支持向量机也将是一个非线性分类器,使用的核函数则是高斯核。需要注意的是,预设分类模型需要定期更新,以保持对新数据判断的准确率和稳定性,缩短了判断时间,在处理大数据集时非常重要。
可选的,在预设分类模型的准确度超过可接受阈值时,才进行使用。具体的,可以通过预设分类模型对数据的分类结果与实际的真实结果进行判断,此处不作限制。
由于新的第三通讯数据是在不断更新,如果基站的服务小区加入了一个新的第三通讯数据,需要重新通过聚类模型进行聚类,这在数据量大的情况下会给服务器带来巨大的运算负担,影响服务器的运行速度。通过已有的检测结果建立预设分类模型,根据预设分类模型判断新生成的通讯数据是否为异常数据,不需要服务器重新聚类,降低了运算负担,提高了服务器的运行速度。
本发明实施例的技术方案,通过获取第一基站的覆盖区域的多个第一通讯数据;基于聚类模型对所述多个第一通讯数据进行检测,以得到第一异常数据;在所述多个第一通讯数据中剔除所述第一异常数据,得到至少一个第二通讯数据;基于所述至少一个第二通讯数据与所述第一基站的距离关系,对所述至少一个第二通讯数据进行检测,以得到第二异常数据,在多个第一通讯数据检测第一异常数据后剔除,再对第二数据进行检测得到第二异常数据,在进行定位时可以不考虑异常数据,达到提高定位的精度的技术效果。此外,通过双重检测,使用该通讯数据进行定位的精度更高。
实施例三
图3是本发明实施例三提供的一种基站异常数据的检测装置的结构示意图,本实施例可适用于对基站异常数据进行检测的场景,该装置可以采用软件和/或硬件的方式实现,并可集成在服务器上。
如图3所示,本实施例提供的基站异常数据的检测装置可以包括获取模块310、第一检测模块320、剔除模块330、第二检测模块340,其中:
获取模块310,用于获取第一基站的覆盖区域的多个第一通讯数据;
第一检测模块320,用于基于聚类模型对所述多个第一通讯数据进行检测,以得到第一异常数据;
剔除模块330,用于在所述多个第一通讯数据中剔除所述第一异常数据,得到至少一个第二通讯数据;
第二检测模块340,用于基于所述至少一个第二通讯数据与所述第一基站的距离关系,对所述至少一个第二通讯数据进行检测,以得到第二异常数据。
可选的,所述聚类模型包括距离参数和数量参数,该第一检测模块320包括:
获取单元,用于以每一个第一通讯数据为圆心,距离参数为半径画圆,获取在每一个圆中的第一通讯数据的第一总数量;将所述第一总数量大于或等于所述数量参数的圆作为标志圆;
第一异常数据确定单元,将不在所述标志圆的第一通讯数据作为所述第一异常数据。
可选的,所述聚类模型还包括数量阈值,该装置还包括:
计算模块,用于计算第一基站的覆盖区域的多个第一通讯数据的第二总数量;
如果所述第二总数量大于或等于所述数量阈值,则执行下一步;
如果所述第二总数量小于所述数量阈值,则将所述第二总数量减去预设数量的值作为数量参数后,执行下一步。
可选的,所述第二通讯数据包括时间提前量和位置信息,所述时间提前量是指移动终端向第一基站发出信号到第一基站收到信号的时间差,第二检测模块340包括:
传播距离确定单元,用于根据所述时间提前量和电磁波的传播速度确定传播距离;
直线距离确定单元,用于根据所述位置信息确定第二通讯数据与所述第一基站的直线距离;
第二异常数据确定单元,用于将所述直线距离大于所述传播距离的第二通讯数据作为所述第二异常数据。
可选的,所述传播距离根据预设公式计算得到。
可选的,所述第二通讯数据包括位置信息和第一基站类型,该第二检测模块340还可以包括:
最大理论距离确定单元,用于根据所述第一基站类型确定所述第一基站的最大理论距离;
该直线距离确定单元还用于根据所述位置信息确定第二通讯数据与所述第一基站的直线距离;
该第二异常数据确定单元还用于将所述直线距离大于所述最大理论距离的第二通讯数据作为所述第二异常数据。
可选的,该装置的获取模块310还用于获取新的第三通讯数据;
该装置还包括:
预设分类模型检测模块,用于根据建立好的预设分类模型检测所述第三通讯数据是否为异常数据。
本发明实施例所提供的基站异常数据的检测装置可执行本发明任意实施例所提供的基站异常数据的检测方法,具备执行方法相应的功能模块和有益效果。本发明实施例中未详尽描述的内容可以参考本发明任意方法实施例中的描述。
实施例四
图4是本发明实施例四提供的一种服务器的结构示意图。图4示出了适于用来实现本发明实施方式的示例性服务器612的框图。图4显示的服务器612仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图4所示,服务器612以通用服务器的形式表现。服务器612的组件可以包括但不限于:一个或者多个处理器616,存储装置628,连接不同系统组件(包括存储装置628和处理器616)的总线618。
总线618表示几类总线结构中的一种或多种,包括存储装置总线或者存储装置控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(Industry SubversiveAlliance,ISA)总线,微通道体系结构(Micro Channel Architecture,MAC)总线,增强型ISA总线、视频电子标准协会(Video Electronics Standards Association,VESA)局域总线以及外围组件互连(Peripheral Component Interconnect,PCI)总线。
服务器612典型地包括多种计算机系统可读介质。这些介质可以是任何能够被服务器612访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储装置628可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(Random Access Memory,RAM)630和/或高速缓存存储器632。终端612可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统634可以用于读写不可移动的、非易失性磁介质(图4未显示,通常称为“硬盘驱动器”)。尽管图4中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘,例如只读光盘(Compact Disc Read-Only Memory,CD-ROM),数字视盘(Digital Video Disc-Read Only Memory,DVD-ROM)或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线618相连。存储装置628可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块642的程序/实用工具640,可以存储在例如存储装置628中,这样的程序模块642包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块642通常执行本发明所描述的实施例中的功能和/或方法。
服务器612也可以与一个或多个外部设备614(例如键盘、指向终端、显示器624等)通信,还可与一个或者多个使得用户能与该服务器612交互的终端通信,和/或与使得该服务器612能与一个或多个其它计算终端进行通信的任何终端(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口622进行。并且,服务器612还可以通过网络适配器620与一个或者多个网络(例如局域网(Local Area Network,LAN),广域网(Wide AreaNetwork,WAN)和/或公共网络,例如因特网)通信。如图4所示,网络适配器620通过总线618与服务器612的其它模块通信。应当明白,尽管图中未示出,可以结合服务器612使用其它硬件和/或软件模块,包括但不限于:微代码、终端驱动器、冗余处理器、外部磁盘驱动阵列、磁盘阵列(Redundant Arrays of Independent Disks,RAID)系统、磁带驱动器以及数据备份存储系统等。
处理器616通过运行存储在存储装置628中的程序,从而执行各种功能应用以及数据处理,例如实现本发明任意实施例所提供的一种基站异常数据的检测方法,该方法可以包括:
获取第一基站的覆盖区域的多个第一通讯数据;
基于聚类模型对所述多个第一通讯数据进行检测,以得到第一异常数据;
在所述多个第一通讯数据中剔除所述第一异常数据,得到至少一个第二通讯数据;
基于所述至少一个第二通讯数据与所述第一基站的距离关系,对所述至少一个第二通讯数据进行检测,以得到第二异常数据。
本发明实施例的技术方案,通过获取第一基站的覆盖区域的多个第一通讯数据;基于聚类模型对所述多个第一通讯数据进行检测,以得到第一异常数据;在所述多个第一通讯数据中剔除所述第一异常数据,得到至少一个第二通讯数据;基于所述至少一个第二通讯数据与所述第一基站的距离关系,对所述至少一个第二通讯数据进行检测,以得到第二异常数据,在多个第一通讯数据检测第一异常数据后剔除,再对第二数据进行检测得到第二异常数据,在进行定位时可以不考虑异常数据,达到提高定位的精度的技术效果。此外,通过双重检测,使用该通讯数据进行定位的精度更高。
实施例五
本发明实施例五还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明任意实施例所提供的一种基站异常数据的检测方法,该方法可以包括:
获取第一基站的覆盖区域的多个第一通讯数据;
基于聚类模型对所述多个第一通讯数据进行检测,以得到第一异常数据;
在所述多个第一通讯数据中剔除所述第一异常数据,得到至少一个第二通讯数据;
基于所述至少一个第二通讯数据与所述第一基站的距离关系,对所述至少一个第二通讯数据进行检测,以得到第二异常数据。
本发明实施例的计算机可读存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
存储介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或终端上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
本发明实施例的技术方案,通过获取第一基站的覆盖区域的多个第一通讯数据;基于聚类模型对所述多个第一通讯数据进行检测,以得到第一异常数据;在所述多个第一通讯数据中剔除所述第一异常数据,得到至少一个第二通讯数据;基于所述至少一个第二通讯数据与所述第一基站的距离关系,对所述至少一个第二通讯数据进行检测,以得到第二异常数据,在多个第一通讯数据检测第一异常数据后剔除,再对第二数据进行检测得到第二异常数据,在进行定位时可以不考虑异常数据,达到提高定位的精度的技术效果。此外,通过双重检测,使用该通讯数据进行定位的精度更高。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (10)

1.一种基站异常数据的检测方法,其特征在于,包括:
获取第一基站的覆盖区域的多个第一通讯数据;
基于聚类模型对所述多个第一通讯数据进行检测,以得到第一异常数据;
在所述多个第一通讯数据中剔除所述第一异常数据,得到至少一个第二通讯数据;
基于所述至少一个第二通讯数据与所述第一基站的距离关系,对所述至少一个第二通讯数据进行检测,以得到第二异常数据。
2.如权利要求1所述的基站异常数据的检测方法,其特征在于,所述聚类模型包括距离参数和数量参数,所述基于聚类模型对所述多个第一通讯数据进行检测,以得到第一异常数据,包括:
以每一个第一通讯数据为圆心,距离参数为半径画圆,获取在每一个圆中的第一通讯数据的第一总数量;
将所述第一总数量大于或等于所述数量参数的圆作为标志圆;
将不在所述标志圆的第一通讯数据作为所述第一异常数据。
3.如权利要求2所述的基站异常数据的检测方法,其特征在于,所述聚类模型还包括数量阈值,在所述以每一个第一通讯数据为圆心,距离参数为半径画圆,获取在每一个圆中的第一通讯数据的第一总数量之前,包括:
计算第一基站的覆盖区域的多个第一通讯数据的第二总数量;
如果所述第二总数量大于或等于所述数量阈值,则执行下一步;
如果所述第二总数量小于所述数量阈值,则将所述第二总数量减去预设数量的值作为数量参数后,执行下一步。
4.如权利要求1所述的基站异常数据的检测方法,其特征在于,所述第二通讯数据包括时间提前量和位置信息,所述时间提前量是指移动终端向第一基站发出信号到第一基站收到信号的时间差,所述基于所述至少一个第二通讯数据与所述第一基站的距离关系,对所述至少一个第二通讯数据进行检测,以得到第二异常数据,包括:
根据所述时间提前量和电磁波的传播速度确定传播距离;
根据所述位置信息确定第二通讯数据与所述第一基站的直线距离;
将所述直线距离大于所述传播距离的第二通讯数据作为所述第二异常数据。
5.如权利要求4所述的基站异常数据的检测方法,其特征在于,所述传播距离根据预设公式计算得到。
6.如权利要求1所述的基站异常数据的检测方法,其特征在于,所述第二通讯数据包括位置信息和第一基站类型,所述基于所述至少一个第二通讯数据与所述第一基站的距离关系,对所述至少一个第二通讯数据进行检测,以得到第二异常数据,包括:
根据所述第一基站类型确定所述第一基站的最大理论距离;
根据所述位置信息确定第二通讯数据与所述第一基站的直线距离;
将所述直线距离大于所述最大理论距离的第二通讯数据作为所述第二异常数据。
7.如权利要求1所述的基站异常数据的检测方法,其特征在于,在所述基于所述至少一个第二通讯数据与所述第一基站的距离关系,对所述至少一个第二通讯数据进行检测,以得到第二异常数据之后,包括:
获取新的第三通讯数据;
根据建立好的预设分类模型检测所述第三通讯数据是否为异常数据。
8.一种基站异常数据的检测装置,其特征在于,包括:
获取模块,用于获取第一基站的覆盖区域的多个第一通讯数据;
第一检测模块,用于基于聚类模型对所述多个第一通讯数据进行检测,以得到第一异常数据;
剔除模块,用于在所述多个第一通讯数据中剔除所述第一异常数据,得到至少一个第二通讯数据;
第二检测模块,用于基于所述至少一个第二通讯数据与所述第一基站的距离关系,对所述至少一个第二通讯数据进行检测,以得到第二异常数据。
9.一种服务器,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一项所述的基站异常数据的检测方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一项所述的基站异常数据的检测方法。
CN201911176078.8A 2019-11-26 2019-11-26 基站异常数据的检测方法、装置、服务器和存储介质 Active CN110909804B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911176078.8A CN110909804B (zh) 2019-11-26 2019-11-26 基站异常数据的检测方法、装置、服务器和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911176078.8A CN110909804B (zh) 2019-11-26 2019-11-26 基站异常数据的检测方法、装置、服务器和存储介质

Publications (2)

Publication Number Publication Date
CN110909804A true CN110909804A (zh) 2020-03-24
CN110909804B CN110909804B (zh) 2022-09-06

Family

ID=69819702

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911176078.8A Active CN110909804B (zh) 2019-11-26 2019-11-26 基站异常数据的检测方法、装置、服务器和存储介质

Country Status (1)

Country Link
CN (1) CN110909804B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112333819A (zh) * 2020-11-05 2021-02-05 京信通信系统(中国)有限公司 设备定位方法、装置、计算机设备和存储介质
CN114339608A (zh) * 2020-10-09 2022-04-12 广东博智林机器人有限公司 一种定位方法、装置、系统及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017185691A1 (zh) * 2016-04-28 2017-11-02 中兴通讯股份有限公司 天馈系统检测方法、装置及基站、存储介质
CN109978070A (zh) * 2019-04-03 2019-07-05 北京市天元网络技术股份有限公司 一种改进的K-means异常值检测方法以及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017185691A1 (zh) * 2016-04-28 2017-11-02 中兴通讯股份有限公司 天馈系统检测方法、装置及基站、存储介质
CN109978070A (zh) * 2019-04-03 2019-07-05 北京市天元网络技术股份有限公司 一种改进的K-means异常值检测方法以及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
潘渊洋: "环境监测无线传感器网络中的异常数据检测方法", 《中国优秀硕士学位论文全文数据库 工程科技Ⅰ辑》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114339608A (zh) * 2020-10-09 2022-04-12 广东博智林机器人有限公司 一种定位方法、装置、系统及存储介质
CN112333819A (zh) * 2020-11-05 2021-02-05 京信通信系统(中国)有限公司 设备定位方法、装置、计算机设备和存储介质

Also Published As

Publication number Publication date
CN110909804B (zh) 2022-09-06

Similar Documents

Publication Publication Date Title
CN108280477B (zh) 用于聚类图像的方法和装置
US10375171B2 (en) Iterative learning for reliable sensor sourcing systems
CN111028016A (zh) 销量数据预测方法、装置以及相关设备
CN111125658B (zh) 识别欺诈用户的方法、装置、服务器和存储介质
CN109710709A (zh) 兴趣点数据处理方法、装置、电子设备及存储介质
CN110909804B (zh) 基站异常数据的检测方法、装置、服务器和存储介质
CN110348471B (zh) 异常对象识别方法、装置、介质及电子设备
CN113379469A (zh) 一种异常流量检测方法、装置、设备及存储介质
CN111611390B (zh) 一种数据处理方法及装置
CN111738319B (zh) 一种基于大规模样本的聚类结果评价方法及装置
CN113723618A (zh) 一种shap的优化方法、设备及介质
CN109657148B (zh) 针对上报poi的异常操作识别方法、装置、服务器和介质
CN113140109B (zh) 一种路测数据处理方法、装置、计算机设备及存储介质
CN112748453B (zh) 道路侧定位方法、装置、设备及存储介质
CN113591884B (zh) 字符识别模型的确定方法、装置、设备及存储介质
CN108734393A (zh) 房源信息的匹配方法、用户设备、存储介质及装置
CN113761867A (zh) 地址识别方法、装置、计算机设备及存储介质
CN108133234B (zh) 基于稀疏子集选择算法的社区检测方法、装置及设备
CN115993488A (zh) 一种电磁环境的智能监测方法及系统
CN114821272A (zh) 图像识别方法、系统、介质、电子设备及目标检测模型
CN111988813B (zh) 移动通信网络中弱覆盖小区的确定方法、装置和计算机设备
CN113591787A (zh) 光纤链路部件的识别方法、装置、设备和存储介质
CN112785000A (zh) 面向大规模机器学习系统的机器学习模型训练方法及系统
CN112036516A (zh) 一种图像处理方法、装置、电子设备和存储介质
CN116541252B (zh) 一种机房故障日志数据处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant