CN107613463A - 一种基于用户话单数据中不同基站接入频次加权的基站位置估计方法 - Google Patents
一种基于用户话单数据中不同基站接入频次加权的基站位置估计方法 Download PDFInfo
- Publication number
- CN107613463A CN107613463A CN201710982621.8A CN201710982621A CN107613463A CN 107613463 A CN107613463 A CN 107613463A CN 201710982621 A CN201710982621 A CN 201710982621A CN 107613463 A CN107613463 A CN 107613463A
- Authority
- CN
- China
- Prior art keywords
- base station
- latitude
- warp
- question open
- leaving
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Mobile Radio Communication Systems (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明公开一种基于用户话单数据中不同基站接入频次加权的基站位置估计方法,括如下步骤:(1)对于经、纬度信息存疑的基站,在话单大数据中寻找与该基站进行连接了的全部电话号码;(2)对这些电话号码在连接该基站的一定时间范围内的话单数据进行分析,基于时空的连续性,对这些号码连接该存疑基站上、下文基站的信息进行统计;(3)针对上述基站,建立基站集合,根据集合中不同基站出现的频次,计算上述基站在基站估计中的权值,对存疑基站的经、纬度信息进行加权平均计算;(4)对上述目标多天数据进行采集,剔除干扰外点,并采用最小二乘估计算法计算平均值作为最终存疑基站的经、纬度估计值。
Description
技术领域
本发明涉及大数据分析与统计学习方法,特别是涉及一种基于用户话单数据中不同基站接入频次加权的基站位置估计方法。
背景技术
电信运营商话单大数据中包含有当前通话的接入基站信息,而这些基站信息是由基站建设、维护人员事先人为手动输入、制表存储于服务器端的。这些数据常常因为输入人员的疏忽而引起错误数据的输入,因此这其中常带不可避免的混入了错误信息。
这些错误信息的存在,常常给电信运营商的基站维护、布局,用户定位服务等带来很多问题,严重影响了最终用户的使用体验,为此有必要通过适当的技术手段,对上述基站的错误位置信息进行排查、更正。显然,因为巨大的数据量,人为地去修正上述错误信息是繁重的,笨拙的。
基于此,本发明提出一种基于用户话单数据中不同基站接入频次加权的基站位置估计方法与系统。对于海量的用户话单大数据信息中位置存疑的基站信息,根据对话单大数据的分析、挖掘,给出恰当、合理的存疑基站位置估算。
发明内容
针对基站数据手动输入中可能引入的错误信息,提出一种基于用户话单数据中不同基站接入频次加权的基站位置估计方法。
算法通过对用户话单中连接各基站的不同频率信息的挖掘、分析与计算,给出一定范围内不同基站在当前基站位置估计中的权重比例,作为加权计算的权值信息,从而给出当前存疑基站的经、纬度估计值。
一种基于用户话单数据中不同基站接入频次加权的基站位置估计方法,具体包括如下步骤:
(1)对于经、纬度信息存疑的基站,在话单大数据中寻找与该基站进行连接了的全部电话号码;
(2)对这些电话号码在连接该基站的一定时间范围内(例如,前后1小时内,根据经验给出)的话单数据进行分析,基于时空的连续性,对这些号码连接该存疑基站上、下文基站的信息进行统计;
(3)针对上述基站,建立基站集合,根据集合中不同基站出现的频次,计算上述基站在基站估计中的权值,对存疑基站的经、纬度信息进行加权平均计算;
(4)为提高估计的准确性,对上述目标多天数据进行采集,剔除干扰外点,并采用最小二乘估计算法计算平均值作为最终存疑基站的经、纬度估计值。
与现有技术相比,本发明具有以下明显的优势和有益效果:
(1)本发明基于一定时间内,用户终端连接存疑基站的上、下文连接基站在基站集合中出现的频次,提出一种基于用户话单数据中不同基站接入频次加权的基站位置估计方法与系统。通过对用户话单中连接存疑基站的基站上、下文信息的挖掘、分析与计算,给出不同基站经、纬度信息在当前基站位置估算中所占的权重比例,作为加权计算的权值信息(通常,基站更倾向于首先连接到与它最近的基站,因此出现频次最多基站意味着在地理位置上可能更靠近存疑基站的位置,在位置估计中,应该将其赋予较大权值,以使被估计基站具有更高精度),给出当前存疑基站的经、纬度估计值。
(2)本发明根据不同接入频次信息对集合中不同基站的经、纬度数据进行加权,克服了原有的为集合中不同基站经、纬度赋予相同权值进行存疑基站位置估计的传统方法的不足,位置估计精度更高。
本发明采用根据不同基站的不同接入频次加权为集合内基站的地理信息设置权值,自动的完成存疑基站的位置纠偏工作,确保了大量存疑数据的准确修复。
附图说明
图1为基于用户话单数据中不同基站接入频次加权的基站位置估计方法的流程图。
具体实施方式
下面结合附图和具体实施方式对本发明做进一步的描述。
如图1所示,本发明提供一种基于用户话单数据中不同基站接入频次加权的基站位置估计方法,包括以下步骤:
(1)一定时间T内,话单大数据中存疑基站连接电话号码查询、制表
对话单大数据中全部的已标出带有纠偏存疑的基站,建立存疑基站表单B1,在oracle数据库中选取其一定时间内(例如前、后60分钟)所连接的全部电话号码,使用select语句进行查询,给出这段时间与该基站相连全部电话的表单P1;
(2)一定时长内,电话号码连接基站信息提取
对于P1中每一个电话号码,以该存疑基站为参考基站,以连接该参考基站时间点to为参考时间,查找连接该参考基站上、下文信息,即连接到该参考基站之前和之后连接的时间相邻两基站(bi,bj),并建立基站集合B2,分别提取这些基站的经、纬度信息lo、la;
(3)基于不同基站可信度度量的基站经、纬度加权权值计算
针对上述基站上、下文,建立基站集合,根据集合中不同基站出现的频次,给上述基站赋予不同权值,设第i个基站bi出现频次为fi,基站集合中出现频次最高基站对应频次为fmax,则bi在存疑基站经、纬度估计中的权值wi定义为:
wi=fi/fmax
(4)基于不同基站可信度度量的基站经、纬度计算
根据上述权值,使用如下公式对存疑基站的经、纬度信息进行加权平均计算,则存疑基站经、纬度Lo、La分别为:
Lo=Σwi·loi/n
La=Σwi·lai/n
这里n为参与统计的基站总和。
(5)基于距离的外点去除算法剔除干扰外点
为提高估计的准确性,对上述存疑基站多天的地理位置估计数据进行统计,并使用基于距离的外点去除算法剔除干扰外点,该方法中最小距离阈值d和局部可达密度p通过经验确定,本发明中基站数据的最小距离阈值d设置为20m和局部可达密度p设置为3,如多天基站地理位置估计值中某一天基站估计位置20m半径内含有的基站数少于3个,则根据基于距离的外点去除算法原则从统计数据中去除该点。
(6)基于最小二乘法的存疑基站最佳经、纬度计算
设待求取存疑基站经纬度最佳估计为Lob和Lab,则采用最小二乘估计算法计算Lob和Lab作为最终存疑基站的经、纬度估计值,通过已获得的已知参与统计的基站经、纬度估计值与待求解存疑基站经、纬度估计值的差值平方和minΣ(Loi-Lob)2和minΣ(Lai-Lab)2最小值估计算法来求解存疑基站经、纬度的最佳估计Lob和Lab。
本发明的基于用户话单数据中不同基站接入频次加权的基站位置估计方法,涉及到以下几个步骤:1、对于经、纬度信息存疑的基站,在话单数据中寻找与该基站进行连接了的全部电话号码;2、对这些号码在连接该基站的一定时间范围内(例如,前后1小时内)的话单数据进行分析,给出这些号码连接该基站之前的上、下文基站信息,并对上述信息进行统计;3、针对上述基站,建立基站集合,根据集合中不同基站出现的频次,给上述基站赋予权值,对存疑基站的经、纬度信息进行加权平均计算;4、为提高估计的准确性,对上述目标多天数据进行采集,基于距离的外点去除算法剔除干扰外点,并采用最小二乘估计算法计算平均值作为最终存疑基站的经、纬度估计值。本发明基于用户终端连接存疑基站的上、下文基站信息出现的频次,提出一种基于用户话单数据中不同基站接入频次加权的基站位置估计方法与系统。通过对用户话单中连接存疑基站的上、下文基站信息的挖掘、分析与计算,给出不同基站经、纬度信息在当前基站位置估算中的权重比例,作为加权计算的权值信息,给出当前存疑基站的经、纬度估计值。最后,应用本发明方法对话单大数据进行了分析、挖掘,实验结果证明利用本文算法,可实现较高精确度的基站经、纬度估计。
Claims (2)
1.一种基于用户话单数据中不同基站接入频次加权的基站位置估计方法,其特征在于,括如下步骤:
(1)对于经、纬度信息存疑的基站,在话单大数据中寻找与该基站进行连接了的全部电话号码;
(2)对这些电话号码在连接该基站的一定时间范围内的话单数据进行分析,基于时空的连续性,对这些号码连接该存疑基站上、下文基站的信息进行统计;
(3)针对上述基站,建立基站集合,根据集合中不同基站出现的频次,计算上述基站在基站估计中的权值,对存疑基站的经、纬度信息进行加权平均计算;
(4)对上述目标多天数据进行采集,剔除干扰外点,并采用最小二乘估计算法计算平均值作为最终存疑基站的经、纬度估计值。
2.一种基于用户话单数据中不同基站接入频次加权的基站位置估计方法,其特征在于,包括以下步骤:
(1)一定时间T内,话单大数据中存疑基站连接电话号码查询、制表;
(2)一定时长内,电话号码连接基站信息提取
对于P1中每一个电话号码,以该存疑基站为参考基站,以连接该参考基站时间点to为参考时间,查找连接该参考基站上、下文信息,即连接到该参考基站之前和之后连接的时间相邻两基站(bi,bj),并建立基站集合B2,分别提取这些基站的经、纬度信息lo、la;
(3)基于不同基站可信度度量的基站经、纬度加权权值计算
针对上述基站上、下文,建立基站集合,根据集合中不同基站出现的频次,给上述基站赋予不同权值,设第i个基站bi出现频次为fi,基站集合中出现频次最高基站对应频次为fmax,则bi在存疑基站经、纬度估计中的权值wi定义为:
wi=fi/fmax;
(4)基于不同基站可信度度量的基站经、纬度计算
根据上述权值,使用如下公式对存疑基站的经、纬度信息进行加权平均计算,则存疑基站经、纬度Lo、La分别为:
Lo=Σwi·loi/n
La=Σwi·lai/n
这里n为参与统计的基站总和;
(5)基于距离的外点去除算法剔除干扰外点
对上述存疑基站多天的地理位置估计数据进行统计,并使用基于距离的外点去除算法剔除干扰外点,该方法中最小距离阈值d和局部可达密度p通过经验确定,所述基站数据的最小距离阈值d设置为20m和局部可达密度p设置为3,如多天基站地理位置估计值中某一天基站估计位置20m半径内含有的基站数少于3个,则根据基于距离的外点去除算法原则从统计数据中去除该点;
(6)基于最小二乘法的存疑基站最佳经、纬度计算
设待求取存疑基站经纬度最佳估计为Lob和Lab,则采用最小二乘估计算法计算Lob和Lab作为最终存疑基站的经、纬度估计值,通过已获得的已知参与统计的基站经、纬度估计值与待求解存疑基站经、纬度估计值的差值平方和minΣ(Loi-Lob)2和minΣ(Lai-Lab)2最小值估计算法来求解存疑基站经、纬度的最佳估计Lob和Lab。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710982621.8A CN107613463B (zh) | 2017-10-20 | 2017-10-20 | 一种基于用户话单数据中不同基站接入频次加权的基站位置估计方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710982621.8A CN107613463B (zh) | 2017-10-20 | 2017-10-20 | 一种基于用户话单数据中不同基站接入频次加权的基站位置估计方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107613463A true CN107613463A (zh) | 2018-01-19 |
CN107613463B CN107613463B (zh) | 2020-05-08 |
Family
ID=61078314
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710982621.8A Active CN107613463B (zh) | 2017-10-20 | 2017-10-20 | 一种基于用户话单数据中不同基站接入频次加权的基站位置估计方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107613463B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109561480A (zh) * | 2018-12-26 | 2019-04-02 | 中国联合网络通信集团有限公司 | 一种基站位置纠偏方法和系统 |
CN111246366A (zh) * | 2019-11-28 | 2020-06-05 | 杭州安恒信息技术股份有限公司 | 一种目标人群的定位方法、系统及相关设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102811419A (zh) * | 2012-07-04 | 2012-12-05 | 北京理工大学 | 一种基于迭代的最小二乘定位方法 |
CN104838706A (zh) * | 2012-11-16 | 2015-08-12 | 高通股份有限公司 | 用于在网络数据库之间进行确证且传送信任以获得增强的定位准确性的方法 |
US20150350851A1 (en) * | 2014-05-30 | 2015-12-03 | International Business Machines Corporation | Determining location of a user of a mobile device |
CN106131953A (zh) * | 2016-07-07 | 2016-11-16 | 上海奕行信息科技有限公司 | 一种基于时段内小区频次加权实现移动用户定位的方法 |
-
2017
- 2017-10-20 CN CN201710982621.8A patent/CN107613463B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102811419A (zh) * | 2012-07-04 | 2012-12-05 | 北京理工大学 | 一种基于迭代的最小二乘定位方法 |
CN104838706A (zh) * | 2012-11-16 | 2015-08-12 | 高通股份有限公司 | 用于在网络数据库之间进行确证且传送信任以获得增强的定位准确性的方法 |
US20150350851A1 (en) * | 2014-05-30 | 2015-12-03 | International Business Machines Corporation | Determining location of a user of a mobile device |
CN106131953A (zh) * | 2016-07-07 | 2016-11-16 | 上海奕行信息科技有限公司 | 一种基于时段内小区频次加权实现移动用户定位的方法 |
Non-Patent Citations (1)
Title |
---|
于瑞云、夏兴有、李婕、周岩、王兴伟: "参与式感知系统中基于社会关系的移动用户位置预测算法", 《计算机学报》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109561480A (zh) * | 2018-12-26 | 2019-04-02 | 中国联合网络通信集团有限公司 | 一种基站位置纠偏方法和系统 |
CN109561480B (zh) * | 2018-12-26 | 2021-03-19 | 中国联合网络通信集团有限公司 | 一种基站位置纠偏方法和系统 |
CN111246366A (zh) * | 2019-11-28 | 2020-06-05 | 杭州安恒信息技术股份有限公司 | 一种目标人群的定位方法、系统及相关设备 |
CN111246366B (zh) * | 2019-11-28 | 2021-05-07 | 杭州安恒信息技术股份有限公司 | 一种目标人群的定位方法、系统及相关设备 |
Also Published As
Publication number | Publication date |
---|---|
CN107613463B (zh) | 2020-05-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107333232A (zh) | 一种终端定位方法及网络设备 | |
EP2680633A1 (en) | Data processing method and device for essential factor lost score | |
CN109842896B (zh) | 一种栅格价值评估方法及装置 | |
CN101562832B (zh) | 一种用于通信测试的关键质量指标测算方法及系统 | |
US9374800B2 (en) | Determining location of a user of a mobile device | |
CN109699035B (zh) | 一种地铁网络场景小区识别方法及装置 | |
CN108495329A (zh) | 一种基站可靠性的评价方法和装置 | |
CN104244314B (zh) | 一种基于Mc接口信令的潜在集团客户识别方法 | |
CN107613463A (zh) | 一种基于用户话单数据中不同基站接入频次加权的基站位置估计方法 | |
CN108093417A (zh) | 一种基于基站分布密度自适应的基站位置纠偏方法 | |
CN111127062A (zh) | 一种基于空间搜索算法的群体欺诈识别方法及装置 | |
CN102802144A (zh) | 一种话单数据的分析方法及装置 | |
CN102387512A (zh) | 基于向量空间模型的重入网分析方法 | |
CN106897743A (zh) | 基于贝叶斯模型的移动考勤防作弊大数据检测方法 | |
CN109995549B (zh) | 一种评估流量价值的方法及装置 | |
CN107835485A (zh) | 一种基于用户话单数据中基站位置可信度的加权基站位置纠偏的方法 | |
CN114860788B (zh) | 一种技术推广信息服务系统及方法 | |
CN110839251B (zh) | 基于用户数据识别天线前后抑制比异常的方法 | |
CN107085757B (zh) | 一种确定风险类用户的方法及装置 | |
CN102026262A (zh) | 用户感受评估方法和服务器 | |
CN110366099A (zh) | 终端定位方法及终端定位装置 | |
CN106817710A (zh) | 一种网络问题的定位方法及装置 | |
CN115334528A (zh) | 基站入网质检方法、系统、设备及存储介质 | |
CN108271183B (zh) | 一种基于原始测量报告的邻区优化方法及装置 | |
CN113079521B (zh) | 一种通话质量优化方法、装置和设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |