CN107155214B - 一种号码确定方法和装置 - Google Patents
一种号码确定方法和装置 Download PDFInfo
- Publication number
- CN107155214B CN107155214B CN201610119760.3A CN201610119760A CN107155214B CN 107155214 B CN107155214 B CN 107155214B CN 201610119760 A CN201610119760 A CN 201610119760A CN 107155214 B CN107155214 B CN 107155214B
- Authority
- CN
- China
- Prior art keywords
- residential
- home
- call information
- numbers
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W64/00—Locating users or terminals or network equipment for network management purposes, e.g. mobility management
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
- H04W4/021—Services related to particular areas, e.g. point of interest [POI] services, venue services or geofences
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W8/00—Network data management
- H04W8/02—Processing of mobility data, e.g. registration information at HLR [Home Location Register] or VLR [Visitor Location Register]; Transfer of mobility data, e.g. between HLR, VLR or external networks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W8/00—Network data management
- H04W8/18—Processing of user or subscriber data, e.g. subscribed services, user preferences or user profiles; Transfer of user or subscriber data
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Databases & Information Systems (AREA)
- Mobile Radio Communication Systems (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明实施例公开了一种号码确定方法,包括:在预设的住宅小区的室分基站内,提取通话信息;根据所述通话信息,确定所述住宅小区的内部号码;获取所述住宅小区所在预设区域的通话信息;根据所述住宅小区的内部号码,从所述预设区域的通话信息中确定所述住宅小区的居民号码。本发明实施例同时还公开了一种号码确定装置。
Description
技术领域
本发明涉及通信行业的业务支撑领域,尤其涉及一种号码确定方法和装置。
背景技术
随着互联网+和通信技术的发展,加速了大数据时代的到来,客户的每一个数据维度都价值连城。在很多情况下,如果可以查询出某一住宅小区的用户明细,可以方便分析人员做很多事情。例如有针对性的网络优化、合理的调整基站覆盖、高效的电话或短信营销等等。
目前,很多企业都付出很大的成本挖空心思定位客户的住址,这也是互联网+时代大数据企业的基本诉求。在这方面,由于运营商可以知道客户的各种带有位置属性的通话行为,具有天然的优势。但是目前还没有一种行之有效的方法可以帮助运营商精准定位客户归属小区。
由于网络基站与住宅小区并非一一对应关系,基站一般会覆盖多个小区。所以,现有技术会把经常在该网络基站下面通话但是居住在该小区附近的用户也归为该小区用户,从而造成误差。
发明内容
为解决上述技术问题,本发明实施例期望提供一种号码确定方法和装置,通过分析用户的通话行为,能够精准的确定居民所居住的住宅小区,不会把经常在该网络基站下面通话但是居住在该小区附近的居民也归为该小区居民。
本发明的技术方案是这样实现的:
第一方面,提供一种号码确定方法,所述方法包括:
在预设的住宅小区的室分基站内,提取通话信息;
根据所述通话信息,确定所述住宅小区的内部号码;
获取所述住宅小区所在预设区域的通话信息;
根据所述住宅小区的内部号码,从所述预设区域的通话信息中确定所述住宅小区的居民号码。
可选的,所述通话信息包括本端号码和对端号码,所述根据所述住宅小区的内部号码,从所述预设区域的通话信息中确定所述住宅小区的居民号码包括:
根据预设置信距离和所述内部号码,从所述预设区域中确定所述住宅宏站,所述住宅宏站是覆盖所述住宅小区的网络宏站;
从所述预设区域的通话信息中获取所述住宅宏站的本端号码;
根据所述室分基站的本端号码、所述住宅宏站的本端号码和所述内部号码,确定所述住宅小区的居民号码。
可选的,所述根据预设置信距离和所述内部号码,从所述预设区域中确定所述住宅宏站包括:
获取所述预设区域的第一网络宏站;
确定所述第一网络宏站距所述住宅小区的距离;
从所述预设区域的通话信息中获取所述第一网络宏站的对端号码;
所述距离小于所述预设置信距离,且所述第一网络宏站的对端号码与所述内部号码有重叠时,确定所述第一网络宏站为所述住宅宏站。
可选的,所述从所述预设区域的通话信息中获取所述第一网络宏站的对端号码包括:
从所述预设区域的通话信息中获取所述第一网络宏站的通话信息;
统计所述第一网络宏站的每个对端号码所对应的本端号码的第一本端个数;
根据每个第一本端个数,在所述第一网络宏中确定第一本端个数最多的k个对端号码,所述k是正整数;
按照预设规则对所述k个对端号码打分,得到所述k个第一打分结果;
在除所述第一网络宏站之外的其他网络宏站的打分结果中,获取所述k个对端号码的其他打分结果;
将所述其他结果与对应的对端号码的第一打分结果累加,得到所述k个总得分;
所述k个总得分中n个总得分小于或者等于预设总得分时,则确定n个总得分所对应的对端号码是所述第一网络宏站的n个对端号码,所述n是小于或等于所述k的自然数。
可选的,所述根据所述通话信息,确定所述住宅小区的内部号码包括:
从所述通话信息,确定室分基站的通话信息,所述通话信息包括本端号码和对端号码;
获取所述室分基站的本端号码的第二本端个数;
从所述室分基站的本端号码中,确定第二本端个数最大的m个本端号码,所述m是正整数;
获取所述m个本端号码的室分基站的第一位置和所述m个本端号码对应的对端号码的室分基站的第二位置;
根据所述第一位置和所述第二位置,确定出m个基站距离;
计算所述m个基站距离的平均值和所述m个基站距离分布的偏差系数;
在所述m个本端号码中存在所述平均值与y倍所述偏差系数之和小于或等于所述预设置信距离的z个本端号码时,则所述z个本端号码是所述内部号码,所述y是自然数,所述z是正整数。
可选的,所述根据所述住宅小区的内部号码,从所述预设区域的通话信息中确定所述住宅小区的居民号码包括:
判断所述室分基站的通话信息和所述住宅宏站的通话信息中是否包括所述内部号码中的任意一个;
所述室分基站的通话信息和所述住宅宏站的通话信息中包括所述内部号码的任一个号码时,将包括所述内部号码的任一个号码的通话信息中的本端号码作为所述住宅小区的居民号码。
第二方面,提供一种号码确定装置,所述装置包括:
提取模块,用于在预设的住宅小区的室分基站内,提取通话信息;
确定模块,用于根据所述通话信息,确定所述住宅小区的内部号码;
获取模块,用于获取所述住宅小区所在预设区域的通话信息;
所述确定模块还用于根据所述住宅小区的内部号码,从所述预设区域的通话信息中确定所述住宅小区的居民号码。
可选的,所述通话信息包括本端号码和对端号码,所述确定模块包括:
确定单元,用于根据预设置信距离和所述内部号码,从所述预设区域中确定所述住宅宏站,所述住宅宏站是覆盖所述住宅小区的网络宏站;
获取单元,用于从所述预设区域的通话信息中获取所述住宅宏站的本端号码;
所述确定单元还用于根据所述室分基站的本端号码、所述住宅宏站的本端号码和所述内部号码,确定所述住宅小区的居民号码。
可选的,所述确定单元包括:
获取子单元,用于获取所述预设区域的第一网络宏站;
确定子单元,用于确定所述第一网络宏站距所述住宅小区的距离;
所述获取子单元还用于从所述预设区域的通话信息中获取所述第一网络宏站的对端号码;
所述确定子单元还用于所述距离小于所述预设置信距离,且所述第一网络宏站的对端号码与所述内部号码有重叠时,确定所述第一网络宏站为所述住宅宏站。
可选的,所述获取子单元具体用于:
从所述预设区域的通话信息中获取所述第一网络宏站的通话信息;
统计所述第一网络宏站的每个对端号码所对应的本端号码的第一本端个数;
根据每个第一本端个数,在所述第一网络宏中确定第一本端个数最多的k个对端号码,所述k是正整数;
按照预设规则对所述k个对端号码打分,得到所述k个第一打分结果;
在除所述第一网络宏站之外的其他网络宏站的打分结果中,获取所述k个对端号码的其他打分结果;
将所述其他结果与对应的对端号码的第一打分结果累加,得到所述k个总得分;
所述k个总得分中n个总得分小于或者等于预设总得分时,则确定n个总得分所对应的对端号码是所述第一网络宏站的n个对端号码,所述n是小于或等于所述k的自然数。
可选的,所述确定模块具体用于:
从所述通话信息,确定室分基站的通话信息,所述通话信息包括本端号码和对端号码;
获取所述室分基站的本端号码的第二本端个数;
从所述室分基站的本端号码中,确定第二本端个数最大的m个本端号码,所述m是正整数;
获取所述m个本端号码的室分基站的第一位置和所述m个本端号码对应的对端号码的室分基站的第二位置;
根据所述第一位置和所述第二位置,确定出m个基站距离;
计算所述m个基站距离的平均值和所述m个基站距离分布的偏差系数;
在所述m个本端号码中存在所述平均值与y倍所述偏差系数之和小于或等于所述预设置信距离的z个本端号码时,则所述z个本端号码是所述内部号码,所述y是自然数,所述z是正整数。
可选的,所述确定模块还具体用于:
判断所述室分基站的通话信息和所述住宅宏站的通话信息中是否包括所述内部号码中的任意一个;
所述室分基站的通话信息和所述住宅宏站的通话信息中包括所述内部号码的任一个号码时,将包括所述内部号码的任一个号码的通话信息中的本端号码作为所述住宅小区的居民号码。
本发明实施例提供了一种号码确定方法和装置,在预设的住宅小区的室分基站内,提取通话信息;再根据通话信息,确定住宅小区的内部号码;然后,获取住宅小区所在预设区域的通话信息;之后,根据住宅小区的内部号码,从预设区域的通话信息中确定住宅小区的居民号码。这样一来,根据用户的通话信息,就可以确定出住宅小区的居民号码,这样,可以精确确定居民所居住的住宅小区,避免将经常在该网络基站下面通话但是居住在该小区附近的居民也归为该小区居民,提高了定位精度,能够实现针对住宅小区居民的网络优化和精细化营销。
附图说明
图1为本发明实施例提供的一种号码确定方法的流程图;
图2为本发明实施例提供的另一种号码确定方法的流程图;
图3为本发明实施例提供的一种号码确定装置的结构示意图;
图4为本发明实施例提供的又一种号码确定装置的结构示意图;
图5为本发明实施例提供的再一种号码确定装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
实施例一
本发明实施例提供一种号码确定方法,应用于号码确定装置,该装置可以是服务器中的一部分,也可以是单独的设备,如图1所示,该方法包括:
步骤101、在预设的住宅小区的室分基站内,提取通话信息。
上述住宅小区的室分基站的通话信息可以从数据仓库中提取得到。该数据仓库中存储了预设区域的通话信息。预设区域是包括住宅小区的区域,例如,预设区域是北京市,住宅小区是北京市某一个住宅小区、社区、学校等。
数据仓库是决策支持系统(decision support system,DSS)和联机分析应用数据源的结构化数据环境。数据仓库研究和解决从数据库中获取信息的问题。数据仓库的特征在于面向主题、集成性、稳定性和时变性。主要功能仍是将组织透过资讯系统之联机事务处理经年累月所累积的大量资料,透过数据仓库理论所特有的资料储存架构,作一有系统的分析整理,以利各种分析方法如联机分析处理、数据挖掘之进行,并进而支持如DSS、主管资讯系统之创建,帮助决策者能快速有效的自大量资料中,分析出有价值的资讯,以利决策拟定及快速回应外在环境变动,帮助建构商业智能。
步骤102、根据通话信息,确定住宅小区的内部号码。
具体的,从通话信息,确定室分基站的通话信息,通话信息包括本端号码和对端号码;获取室分基站的本端号码的第二本端个数;从室分基站的本端号码中,确定第二本端个数最大的m个本端号码,m是正整数;优选的,本实施例中m取10。值得说明的是,本实施例还可以通过其他方法获取m个本端号码,示例的,获取室分基站的本端号码的第二本端个数和室分基站的所有通话信息的总个数,得到第二本端个数和总个数之比的比值,将所有比值按从小到大排序,选出前m个比值,确定出与m个比值依次对应的m个本端号码。
示例的,假设某室分基站有15个第二本端个数,分别为100、120、78、34、84、73、142、97、162、110、121、73、62、96、88,则最大的10个第二本端个数为162、142、121、120、110、100、97、96、88和84。先选中这10个第二本端个数对应的10个本端号码,然后再找出这10个本端号码对应的10个对端号码,并将这10个对端号码作为该住宅小区的内部号码。
获取m个本端号码的室分基站的第一位置和m个本端号码对应的对端号码的室分基站的第二位置;根据第一位置和第二位置,确定出m个基站距离;计算m个基站距离的平均值和m个基站距离分布的偏差系数;在m个本端号码中存在平均值与y倍偏差系数之和差小于或等于预设置信距离的z个本端号码时,则z个本端号码是内部号码,y是自然数,z是正整数。优选的,本实施例中y取3。这里,m个基站距离,是指在一个通话信息中本端号码和对端号码的分室基站之间的距离;偏差系数是均方差。
步骤103、获取住宅小区所在预设区域的通话信息。
同步骤101的方法相类似,住宅小区所在预设区域的通话信息也是从数据仓库中提取得到。
步骤104、根据住宅小区的内部号码,从预设区域的通话信息中确定住宅小区的居民号码。
这里,通话信息至少包括本端号码和对端号码。
具体的,根据预设置信距离和内部号码,从预设区域中确定住宅宏站,住宅宏站是覆盖住宅小区的网络宏站;从预设区域的通话信息中获取住宅宏站的本端号码;根据室分基站的本端号码、住宅宏站的本端号码和内部号码,确定住宅小区的居民号码。
对于第一宏站,所述根据预设置信距离和内部号码,从预设区域中确定住宅宏站包括:获取预设区域的第一网络宏站;确定第一网络宏站距住宅小区的距离;从预设区域的通话信息中获取第一网络宏站的对端号码;距离小于预设置信距离,且第一网络宏站的对端号码与内部号码有重叠时,确定第一网络宏站为住宅宏站。
示例的,假设第一网络宏站距住宅小区的距离为2.6km,预设置信距离为3km,第一网络宏站的对端号码包含号码H、I和J,内部号码包含号码J和K。通过上述方法:2.6小于3,且号码H、I、J与号码J、K有重叠号码J,故该第一网络宏站为所述住宅宏站。
进一步的,从预设区域的通话信息中获取第一网络宏站的对端号码包括:从预设区域的通话信息中获取第一网络宏站的通话信息;统计第一网络宏站的每个对端号码所对应的本端号码的第一本端个数;根据每个第一本端个数,在第一网络宏中确定第一本端个数最多的k个对端号码,k是正整数;按照预设规则对k个对端号码打分,得到k个第一打分结果;在除第一网络宏站之外的其他网络宏站的打分结果中,获取k个对端号码的其他打分结果;将其他结果与对应的对端号码的第一打分结果累加,得到k个总得分;k个总得分中n个总得分小于或者等于预设总得分时,则确定n个总得分所对应的对端号码是网络宏站的n个对端号码,n是小于或等于k的自然数。
示例的,假设在预设区域中,住宅小区最大的住宅宏站个数为M,最高打分为q,则预设总得分为q*M,本实施例中仅仅选取小k个总得分中于或者等于q*M所对应的n个对端号码。因为,若总得分大于q*M,则表明该总得分对应的对端号码是公共号码,故不予选取。
进一步的,所述根据室分基站的本端号码、住宅宏站的本端号码和内部号码,确定住宅小区的居民号码具体包括:
判断室分基站的通话信息和住宅宏站的通话信息中是否包括内部号码中的任意一个;室分基站的通话信息和住宅宏站的通话信息中包括内部号码的任一个号码时,将包括内部号码的任一个号码的通话信息中的本端号码作为住宅小区的居民号码。
这样一来,根据用户的通话信息,就可以确定出住宅小区的居民号码,这样,可以精确确定居民所居住的住宅小区,避免将经常在该网络基站下面通话但是居住在该小区附近的居民也归为该小区居民,提高了定位精度,能够实现针对住宅小区居民的网络优化和精细化营销。
实施例二
本发明实施例提供一种号码确定方法,应用于号码确定装置,如图2所示,假设R是上海市黄浦区的某一住宅小区,该小区内分布着A、B、C、D和E5个室分基站,现要确定该住宅小区R的居民,该方法包括:
步骤201、提取黄浦区数据仓库中所有归属用户的通话信息。
具体的,通话信息包括:本端号码、对端号码、通话时间和通话时本端号码使用的网络基站。这里,网络基站是指在一定的覆盖区中,通过移动通信交换中心,与移动电话终端之间进行信息传递的收发电台。
所需的黄浦区所有归属用户的通话信息可以通过后台操作从数据仓库中提取出来,这些通话信息是确定黄浦区R居民的基础数据。
步骤202、根据黄浦区数据仓库中所有归属用户的通话信息,确定黄浦区每个用户的归属基站。
这里,对步骤201中提取到的通话信息进行分析,确定黄浦区每个用户的归属基站。这里,归属基站是指:针对某一确定用户,该用户的归属基站就是该用户在进行通话时经常所使用的基站。
具体的分析方法是:获取黄浦区每一个用户最近一个月内每天晚上的最后一次通话所使用的基站,统计各个基站的使用次数,将使用次数最多的基站确定为该用户的归属基站。如果出现次数最多的基站为并列的多个,择其一;若客户没有晚上通话的记录,则统计其最近一个月内每天最后一次通话所使用的基站,将出现次数最多的基站确定为用户的归属基站,如果仍然没有通话信息,则认为此用户已停机。这样,便确定出黄浦区每个用户的归属基站。
步骤203、提取R中5个室分基站归属用户的通话信息。
这里,室分基站所在的住宅小区可以从网络部获得,归属用户是指:针对某一确定室分基站,该室分基站的归属用户就是经常在该室分基站下进行通话的用户。具体的,首先从网络部获得R中的所有室分基站(即A、B、C、D和E5个室分基站),然后再从步骤201所提取的通话信息中筛选出A、B、C、D和E5个室分基站归属用户的通话信息。值得说明的是,本实施例中之所以选择室分基站,是因为通过室分基站A、B、C、D和E完成通话的用户可确定为该住宅小区R的居民。
室分基站是覆盖范围很小的基站,通常的覆盖范围为一栋楼的大小。其中,基站即公用移动通信基站是无线电台站的一种形式,是指在一定的无线电覆盖区中,通过移动通信交换中心,与移动电话终端之间进行信息传递的无线电收发信电台。移动通信基站的建设是我国移动通信运营商投资的重要部分,移动通信基站的建设一般都是围绕覆盖面、通话质量、投资效益、建设难易、维护方便等要素进行。随着移动通信网络业务向数据化、分组化方向发展,移动通信基站的发展趋势也必然是宽带化、大覆盖面建设及网络之间互联的协议(Internet Protocol,IP)化。
步骤204、根据5个室分基站归属用户的通话信息,获取各个分室基站的对端号码。
其中,并不是所有对端号码都可以作为采集的对象,在所有的对端号码中需要剔除外地号码和公共号码。
以A室分基站为例,说明该剔除过程。首先,在最近k个月内,根据A室分基站归属用户的通话信息,获取到A室分基站的对端号码;接着,从获取到的对端号码中剔除外地号码(上海市市之外的地区)和10086、114等公用号码;优选的,k取3。
值得说明的是,剩余的B、C、D和E这4个室分基站的剔除过程和A室分基站的剔除过程相类似,此处就不再详述。
步骤205、根据5个室分基站的对端号码,确定本端号码的第二本端个数或第二本端个数比例。
这里可以分为两种情况:
情况1、以A室分基站的对端号码n为例。获取最近k个月与对端号码n所对应的第二本端个数Q(n);
情况2、获取最近k个月与对端号码n所对应的第二本端个数Q(n),根据第一公式,计算第二本端个数比例ξ(n),该第一公式为:其中T为最近k个月与A室分基站的所有对端号码所对应的第二本端总个数,优选的,k取3。
值得说明的是,A、B、C、D和E5个室分基站除对端号码n之外的所有对端号码所对应的第二本端个数和第二本端个数比例的获取方法和对端号码n所对应的第二本端个数和第二本端个数比例的获取方法相类似,此处就不再详述。这里,对端号码和本端号码的对应是多对多的对应。
步骤206、根据5个室分基站第二本端个数或第二本端个数比例,选取室分基站的对端号码。
首先,对步骤205确定的A、B、C、D和E5个室分基站的所有第二本端个数(或第二本端个数比例)进行排序;然后,从排序好的A、B、C、D和E5个室分基站的所有本端号码中选取前m个本端号码所对应的对端号码作为该室分基站的对端号码。
具体的,是按照第二本端个数(或第二本端个数比例)由大至小对A、B、C、D和E5个室分基站的所有本端号码进行排序,从排序好的本端号码中选取前m个本端号码所对应的对端号码。优选的,m取10。
步骤207、获取前m个对端号码的第一归属基站的第一位置;获取与前m个对端号码所对应的本端号码的第二归属基站的第二位置。
这里,归属基站是对端号码所归属的室分基站。
步骤208、根据上述第一位置和上述第二位置,计算前m个对端号码到所对应的本端号码的基站距离。
这里,基站距离是指第一位置到第二位置的距离。本实施例中仅计算与步骤206中选取出的m个对端号码基站位置距与其所对应的本端号码基站位置的基站距离。
示例的,以室分基站A(上述第一归属基站)的对端号码n为例,首先,提取出与该对端号码所对应的本端号码,统计其第二本端个数N;然后,关联上这N个本端号码的第二归属基站;由于第二归属基站和第一归属基站的经纬度信息都是已知的,所以可以计算出这些第二归属基站与室分基站A的基站距离,记为d(i),其中N为正整数,i=1,2,…N。
其他对端号码距与其所对应的本端号码的基站距离的计算方法和上述方法相类似,此处就不在详述。
值得说明的是,归属基站可在步骤202的通话信息中获取。
步骤209、根据基站距离,计算对端号码距与其所对应的本端号码的平均距离μ。
示例的,以室分基站A的对端号码n为例,假设与该对端号码所对应的第二本端个
数为N,每个本端号码的归属网络基站与室分基站A的基站距离记为d(i),则可根据第二公
式计算平均距离μ,该第二公式满足:
值得说明的是,其他对端号码距与其所对应的本端号码的平均距离的计算方法和上述方法相类似,此处就不再详述。
步骤210、根据平均距离μ,计算对端号码距与其所对应的本端号码的距离分布的偏差系数σ。
示例的,以室分基站A的对端号码n为例,假设与该对端号码所对应的第二本端个数为N,每个本端号码的归属网络基站与室分基站A的基站距离记为d(i),每个对端号码所对应的平均距离记为μ,则可根据第三公式计算距离分布的偏差系数σ,该第三公示满足:
值得说明的是,其他对端号码距与其所对应的本端号码的距离分布的偏差系数的计算方法和上述方法相类似,此处就不再详述。
步骤211、初步确定R的内部号码。
根据统计学原理,可验证,99%以上的用户分布在距离该室分基站[0,μ+3σ]的区间。所以我们统计出这m个对端号码中每一个对端号码的μ+3σ的值,该值的现实意义是与该对端号码通话的所有号码中99%的用户离该住宅小区R的最大距离。如果该值较大,则说明这个对端号码不是R的内部号码。
首先,建立小区之间的置信距离的映射f(x);然后判断m个对端号码中每个对端号码的μ+3σ和f(x)的大小关系;则若μ+3σ的值大于f(x),则删除该对端号码。本实施例中令R的置信距离f(R)=3km,则若某一对端号码μ+3σ的值大于3,则删除该对端号码。
通过上述方法便初步确定出R的内部号码。
步骤212、精确确定R的内部号码。
统计出黄浦区除R外所有住宅小区和它们所对应的在置信距离之内的对端号码,这里和统计R的方法相类似,此处就不再详述。若R的对端号码与其他住宅小区的对端号码有重叠,则说明该重叠的对端号码可能是附近几个住宅小区都经常拨打的号码,而不仅仅是该小区用户拨打,所以将该对端号码也删除。
步骤213、判断黄浦区中的网络宏站与R的距离是否小于置信距离。若是,则执行步骤214;若否,则执行步骤219。
初步判断出黄浦区中所有网络宏站是否有可能成为覆盖R的网络宏站,即是否为R的住宅宏站。进而,排除一些完全不可能为R的住宅宏站的黄浦区中网络宏站。
其中,网络宏站距R的距离和置信距离的大小关系是判断依据。
步骤214、提取网络宏站的对端号码。
具体的方法如下:
计算每个网络宏站与对端号码所对应的第一本端个数(或第一本端个数比例);将每个网络宏站所对应的对端号码按照其所对应的第一本端个数(或第一本端个数比例)由大至小进行排序;对前k个对应对端号码按照斐波那契数列进行打分,其中k为自然数。优选的,本实施例中k取10,即前十名得分分别为:89,55,34,21,13,8,5,3,2,1。这里,选取斐波那契数列是为了达到较佳的区分度;这里,第一本端个数(或第一本端个数比例)的获取方法和第二本端个数(或第二本端个数比例)的获取方法相类似,此处就不在详述。
对每个对端号码,将其在不同网络宏站的得分相加,所得的和为其所对应的总分数。
示例的,假设本市最大的住宅小区的住宅宏站数为M,所以任一住宅小区内部电话的总分数不超过89×M分,剔除总分数超过89×M分的对端号码(即排除公共号码)。直至剔除之后的每个对端号码所得的总分都不超过89×M。其中,M为正整数。
步骤215、判断网络宏站所对应的对端号码与R的内部号码是否有重叠。若是,则执行步骤216;若否,则执行步骤219。
这步是为了精确判断出某一网络宏站是否为R的住宅宏站。
步骤216、确定该网络宏站是R的住宅宏站。
步骤217、判断R中5个室分基站和R的住宅宏站的本端号码是否与R的内部号码有过通话。若是,则执行步骤218;若否,则执行步骤219。
步骤218、确定该本端号码是R居民的号码。
实际中,R的室分基站(A、B、C、D和E)和住宅宏站的本端号码中,与R的内部号码有过通话记录的可以确定为R居民的号码。
步骤219、确定该网络宏站的本端号码不是R居民的号码或该本端号码不是R居民的号码。
实施例三
本发明实施例提供一种号码确定装置30,如图3所示,该装置30包括:
提取模块301,用于在预设的住宅小区的室分基站内,提取通话信息;
确定模块302,用于根据所述通话信息,确定所述住宅小区的内部号码;
获取模块303,用于获取所述住宅小区所在预设区域的通话信息;
所述确定模块302还用于根据所述住宅小区的内部号码,从所述预设区域的通话信息中确定所述住宅小区的居民号码。
这样一来,根据用户的通话信息,就可以确定出住宅小区的居民号码,这样,可以精确确定居民所居住的住宅小区,避免将经常在该网络基站下面通话但是居住在该小区附近的居民也归为该小区居民,提高了定位精度,能够实现针对住宅小区居民的网络优化和精细化营销。
具体的,所述通话信息包括本端号码和对端号码,如图4所示,所述确定模块302包括:
确定单元3021,用于根据预设置信距离和所述内部号码,从所述预设区域中确定所述住宅宏站,所述住宅宏站是覆盖所述住宅小区的网络宏站;
获取单元3022,用于从所述预设区域的通话信息中获取所述住宅宏站的本端号码;
所述确定单元3021还用于根据所述室分基站的本端号码、所述住宅宏站的本端号码和所述内部号码,确定所述住宅小区的居民号码。
具体的,如图5所示,所述确定单元3021包括:
获取子单元30211,用于获取所述预设区域的第一网络宏站;
确定子单元30212,用于确定所述第一网络宏站距所述住宅小区的距离;
所述获取子单元30211还用于从所述预设区域的通话信息中获取所述第一网络宏站的对端号码;
所述确定子单元30212还用于所述距离小于所述预设置信距离,且所述第一网络宏站的对端号码与所述内部号码有重叠时,确定所述第一网络宏站为所述住宅宏站。
具体的,所述获取子单元30211具体用于:
从所述预设区域的通话信息中获取所述第一网络宏站的通话信息;
统计所述第一网络宏站的每个对端号码所对应的本端号码的第一本端个数;
根据每个第一本端个数,在所述第一网络宏中确定第一本端个数最多的k个对端号码,所述k是正整数;
按照预设规则对所述k个对端号码打分,得到所述k个第一打分结果;
在除所述第一网络宏站之外的其他网络宏站的打分结果中,获取所述k个对端号码的其他打分结果;
将所述其他结果与对应的对端号码的第一打分结果累加,得到所述k个总得分;
所述k个总得分中n个总得分小于或者等于预设总得分时,则确定n个总得分所对应的对端号码是所述第一网络宏站的n个对端号码,所述n是小于或等于所述k的自然数。
具体的,所述确定模块302具体用于:
从所述通话信息,确定室分基站的通话信息,所述通话信息包括本端号码和对端号码;
获取所述室分基站的本端号码的第二本端个数;
从所述室分基站的本端号码中,确定第二本端个数最大的m个本端号码,所述m是正整数;
获取所述m个本端号码的室分基站的第一位置和所述m个本端号码对应的对端号码的室分基站的第二位置;
根据所述第一位置和所述第二位置,确定出m个基站距离;
计算所述m个基站距离的平均值和所述m个基站距离分布的偏差系数;
在所述m个本端号码中存在所述平均值与y倍所述偏差系数之和小于或等于所述预设置信距离的z个本端号码时,则所述z个本端号码是所述内部号码,所述y是自然数,所述z是正整数。
具体的,所述确定模块302还具体用于:
判断所述室分基站的通话信息和所述住宅宏站的通话信息中是否包括所述内部号码中的任意一个;
所述室分基站的通话信息和所述住宅宏站的通话信息中包括所述内部号码的任一个号码时,将包括所述内部号码的任一个号码的通话信息中的本端号码作为所述住宅小区的居民号码。
在实际应用中,所述提取模块301、确定模块302、获取模块303、确定单元3021、获取单元3022、获取子单元30211和确定子单元30212均可由位于检测人群密度的装置30中的中央处理器(Central Processing Unit,CPU)、微处理器(Micro Processor Unit,MPU)、数字信号处理器(Digital Signal Processor,DSP)、或现场可编程门阵列(FieldProgrammable Gate Array,FPGA)等实现。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。
Claims (10)
1.一种号码确定方法,其特征在于,所述方法包括:
在预设的住宅小区的室分基站内,提取通话信息;
根据所述通话信息,确定所述住宅小区的内部号码;
获取所述住宅小区所在预设区域的通话信息;
根据所述住宅小区的内部号码,从所述预设区域的通话信息中确定所述住宅小区的居民号码;
其中,所述通话信息包括本端号码和对端号码,所述根据所述住宅小区的内部号码,从所述预设区域的通话信息中确定所述住宅小区的居民号码包括:
根据预设置信距离和所述内部号码,从所述预设区域中确定所述住宅宏站,所述住宅宏站是覆盖所述住宅小区的网络宏站;
从所述预设区域的通话信息中获取所述住宅宏站的本端号码;
根据所述室分基站的本端号码、所述住宅宏站的本端号码和所述内部号码,确定所述住宅小区的居民号码。
2.根据权利要求1所述的方法,其特征在于,所述根据预设置信距离和所述内部号码,从所述预设区域中确定所述住宅宏站包括:
获取所述预设区域的第一网络宏站;
确定所述第一网络宏站距所述住宅小区的距离;
从所述预设区域的通话信息中获取所述第一网络宏站的对端号码;
所述距离小于所述预设置信距离,且所述第一网络宏站的对端号码与所述内部号码有重叠时,确定所述第一网络宏站为所述住宅宏站。
3.根据权利要求2所述的方法,其特征在于,所述从所述预设区域的通话信息中获取所述第一网络宏站的对端号码包括:
从所述预设区域的通话信息中获取所述第一网络宏站的通话信息;
统计所述第一网络宏站的每个对端号码所对应的本端号码的第一本端个数;
根据每个第一本端个数,在所述第一网络宏中确定第一本端个数最多的k个对端号码,所述k是正整数;
按照预设规则对所述k个对端号码打分,得到所述k个第一打分结果;
在除所述第一网络宏站之外的其他网络宏站的打分结果中,获取所述k个对端号码的其他打分结果;
将所述其他结果与对应的对端号码的第一打分结果累加,得到所述k个总得分;
所述k个总得分中n个总得分小于或者等于预设总得分时,则确定n个总得分所对应的对端号码是所述第一网络宏站的n个对端号码,所述n是小于或等于所述k的自然数。
4.根据权利要求1所述的方法,其特征在于,所述根据所述通话信息,确定所述住宅小区的内部号码包括:
从所述通话信息,确定室分基站的通话信息,所述通话信息包括本端号码和对端号码;
获取所述室分基站的本端号码的第二本端个数;
从所述室分基站的本端号码中,确定第二本端个数最大的m个本端号码,所述m是正整数;
获取所述m个本端号码的室分基站的第一位置和所述m个本端号码对应的对端号码的室分基站的第二位置;
根据所述第一位置和所述第二位置,确定出m个基站距离;
计算所述m个基站距离的平均值和所述m个基站距离分布的偏差系数;
在所述m个本端号码中存在所述平均值与y倍所述偏差系数之和小于或等于所述预设置信距离的z个本端号码时,则所述z个本端号码是所述内部号码,所述y是自然数,所述z是正整数。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述根据所述室分基站的本端号码、所述住宅宏站的本端号码和所述内部号码,确定所述住宅小区的居民号码包括:
判断所述室分基站的通话信息和所述住宅宏站的通话信息中是否包括所述内部号码中的任意一个;
所述室分基站的通话信息和所述住宅宏站的通话信息中包括所述内部号码的任一个号码时,将包括所述内部号码的任一个号码的通话信息中的本端号码作为所述住宅小区的居民号码。
6.一种号码确定装置,其特征在于,所述装置包括:
提取模块,用于在预设的住宅小区的室分基站内,提取通话信息;
确定模块,用于根据所述通话信息,确定所述住宅小区的内部号码;
获取模块,用于获取所述住宅小区所在预设区域的通话信息;
所述确定模块还用于根据所述住宅小区的内部号码,从所述预设区域的通话信息中确定所述住宅小区的居民号码;
其中,所述通话信息包括本端号码和对端号码,所述确定模块包括:
确定单元,用于根据预设置信距离和所述内部号码,从所述预设区域中确定所述住宅宏站,所述住宅宏站是覆盖所述住宅小区的网络宏站;
获取单元,用于从所述预设区域的通话信息中获取所述住宅宏站的本端号码;
所述确定单元还用于根据所述室分基站的本端号码、所述住宅宏站的本端号码和所述内部号码,确定所述住宅小区的居民号码。
7.根据权利要求6所述的装置,其特征在于,所述确定单元包括:
获取子单元,用于获取所述预设区域的第一网络宏站;
确定子单元,用于确定所述第一网络宏站距所述住宅小区的距离;
所述获取子单元还用于从所述预设区域的通话信息中获取所述第一网络宏站的对端号码;
所述确定子单元还用于所述距离小于所述预设置信距离,且所述第一网络宏站的对端号码与所述内部号码有重叠时,确定所述第一网络宏站为所述住宅宏站。
8.根据权利要求7所述的装置,其特征在于,所述获取子单元具体用于:
从所述预设区域的通话信息中获取所述第一网络宏站的通话信息;
统计所述第一网络宏站的每个对端号码所对应的本端号码的第一本端个数;
根据每个第一本端个数,在所述第一网络宏中确定第一本端个数最多的k个对端号码,所述k是正整数;
按照预设规则对所述k个对端号码打分,得到所述k个第一打分结果;
在除所述第一网络宏站之外的其他网络宏站的打分结果中,获取所述k个对端号码的其他打分结果;
将所述其他结果与对应的对端号码的第一打分结果累加,得到所述k个总得分;
所述k个总得分中n个总得分小于或者等于预设总得分时,则确定n个总得分所对应的对端号码是所述第一网络宏站的n个对端号码,所述n是小于或等于所述k的自然数。
9.根据权利要求6所述的装置,其特征在于,所述确定模块具体用于:
从所述通话信息,确定室分基站的通话信息,所述通话信息包括本端号码和对端号码;
获取所述室分基站的本端号码的第二本端个数;
从所述室分基站的本端号码中,确定第二本端个数最大的m个本端号码,所述m是正整数;
获取所述m个本端号码的室分基站的第一位置和所述m个本端号码对应的对端号码的室分基站的第二位置;
根据所述第一位置和所述第二位置,确定出m个基站距离;
计算所述m个基站距离的平均值和所述m个基站距离分布的偏差系数;
在所述m个本端号码中存在所述平均值与y倍所述偏差系数之和小于或等于所述预设置信距离的z个本端号码时,则所述z个本端号码是所述内部号码,所述y是自然数,所述z是正整数。
10.根据权利要求6至9任一项所述的装置,其特征在于,所述确定模块还具体用于:
判断所述室分基站的通话信息和所述住宅宏站的通话信息中是否包括所述内部号码中的任意一个;
所述室分基站的通话信息和所述住宅宏站的通话信息中包括所述内部号码的任一个号码时,将包括所述内部号码的任一个号码的通话信息中的本端号码作为所述住宅小区的居民号码。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610119760.3A CN107155214B (zh) | 2016-03-02 | 2016-03-02 | 一种号码确定方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610119760.3A CN107155214B (zh) | 2016-03-02 | 2016-03-02 | 一种号码确定方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107155214A CN107155214A (zh) | 2017-09-12 |
CN107155214B true CN107155214B (zh) | 2019-12-10 |
Family
ID=59792009
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610119760.3A Active CN107155214B (zh) | 2016-03-02 | 2016-03-02 | 一种号码确定方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107155214B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112685654B (zh) * | 2019-10-17 | 2023-04-07 | 中国移动通信集团浙江有限公司 | 学生识别方法及装置、计算设备及可读计算机存储介质 |
CN115086488B (zh) * | 2022-07-27 | 2022-10-25 | 广东创新科技职业学院 | 一种号码分类方法和装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102665200A (zh) * | 2012-05-16 | 2012-09-12 | 山东大学 | 用于特殊区域语音、短信移动通信终端的工作方法 |
CN102724696A (zh) * | 2012-05-30 | 2012-10-10 | 华为技术有限公司 | 通话信息的获取方法及装置 |
CN103401668A (zh) * | 2007-12-17 | 2013-11-20 | 三菱电机株式会社 | 移动通信系统 |
-
2016
- 2016-03-02 CN CN201610119760.3A patent/CN107155214B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103401668A (zh) * | 2007-12-17 | 2013-11-20 | 三菱电机株式会社 | 移动通信系统 |
CN102665200A (zh) * | 2012-05-16 | 2012-09-12 | 山东大学 | 用于特殊区域语音、短信移动通信终端的工作方法 |
CN102724696A (zh) * | 2012-05-30 | 2012-10-10 | 华为技术有限公司 | 通话信息的获取方法及装置 |
Non-Patent Citations (1)
Title |
---|
电信行业基于大数据的同一住宅小区客户筛选;张竞贤;《中国信通信》;20150220;第89页 * |
Also Published As
Publication number | Publication date |
---|---|
CN107155214A (zh) | 2017-09-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110337059B (zh) | 一种用户家庭关系的分析算法、服务器及网络系统 | |
US9305110B2 (en) | Method and arrangement for supporting analysis of social networks in a communication network | |
CN105007171B (zh) | 基于通信领域大数据的用户数据分析系统及方法 | |
JP6689515B2 (ja) | ユーザ地理的ロケーションのタイプを識別するための方法および装置 | |
TWI543580B (zh) | 移動終端通訊錄的優先順序設置裝置及方法 | |
CN109768886B (zh) | 网络规划评价方法及装置 | |
CN105323322B (zh) | 一种信息推送方法及装置 | |
WO2015158399A1 (en) | Method and system for identifying significant locations through data obtainable from a telecommunication network | |
CN101692309A (zh) | 基于手机信息的交通出行计算方法 | |
CN109195219B (zh) | 服务器确定移动终端位置的方法 | |
CN109005514B (zh) | 用户位置信息的回填方法、装置、终端设备及存储介质 | |
CN104244314B (zh) | 一种基于Mc接口信令的潜在集团客户识别方法 | |
CN103189885A (zh) | 服务器、信息管理方法、信息管理程序以及记录该程序的计算机可读取的记录介质 | |
CN107155214B (zh) | 一种号码确定方法和装置 | |
CN110543538A (zh) | 基于地理信息系统(gis)网格定位分析投诉原因的方法 | |
CN104348941B (zh) | 一种利用手机通讯录查找期望用户的方法及装置 | |
TWI757638B (zh) | 使用者位置確定方法、裝置、設備及電腦可讀儲存媒體 | |
CN105045911A (zh) | 一种用于用户进行标记的标签生成方法及设备 | |
CN107231635B (zh) | 一种网络覆盖的分析方法及装置 | |
CN104506743A (zh) | 一种动态拦截电话的方法及装置 | |
CN103268584A (zh) | 流动人口的籍贯判别方法和装置 | |
CN107154875B (zh) | 一种电话通信网络中节点敏感性排序的方法 | |
CN115134809A (zh) | 一种信息识别方法、装置、设备及可读存储介质 | |
CN109769202B (zh) | 流量数据的定位方法及装置、存储介质、服务器 | |
CN112307075A (zh) | 用户关系识别方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |