CN107154875B - 一种电话通信网络中节点敏感性排序的方法 - Google Patents

一种电话通信网络中节点敏感性排序的方法 Download PDF

Info

Publication number
CN107154875B
CN107154875B CN201710343054.1A CN201710343054A CN107154875B CN 107154875 B CN107154875 B CN 107154875B CN 201710343054 A CN201710343054 A CN 201710343054A CN 107154875 B CN107154875 B CN 107154875B
Authority
CN
China
Prior art keywords
sensitivity
sensitivity index
attention
call
importance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710343054.1A
Other languages
English (en)
Other versions
CN107154875A (zh
Inventor
陈端兵
蔡俊卿
周俊临
傅彦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN201710343054.1A priority Critical patent/CN107154875B/zh
Publication of CN107154875A publication Critical patent/CN107154875A/zh
Application granted granted Critical
Publication of CN107154875B publication Critical patent/CN107154875B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/26Devices for calling a subscriber
    • H04M1/27Devices whereby a plurality of signals may be stored simultaneously
    • H04M1/274Devices whereby a plurality of signals may be stored simultaneously with provision for storing more than one subscriber number at a time, e.g. using toothed disc
    • H04M1/2745Devices whereby a plurality of signals may be stored simultaneously with provision for storing more than one subscriber number at a time, e.g. using toothed disc using static electronic memories, e.g. chips
    • H04M1/27453Directories allowing storage of additional subscriber data, e.g. metadata
    • H04M1/27457Management thereof, e.g. manual editing of data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/12Discovery or management of network topologies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Library & Information Science (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明提供一种电话通信网络中节点敏感性排序的方法,首先对通话详单进行统计,并尽可能补全缺少的字段值;其次,对每个号码统计其一阶、二阶通信邻居、通话时间序列、基站通话次数等属性,从结构和属性层面分析号码的敏感性;然后将已经发现的敏感号码设置为重点关注号码,并影响其邻居对应属性值,直至扩散到最大连通子图,同样可设置关注地理区域和关注时间;最后,对节点在多个维度上的敏感性进行建模,对每个号码每个维度的敏感值进行加权求和,得到这个号码的最终敏感值;通过这种从结构和属性上的多维度敏感值加权求和的方式,可以满足不同场景下的号码敏感性分析要求,有效地挖掘电话通信网络中的敏感节点。

Description

一种电话通信网络中节点敏感性排序的方法
技术领域
本发明涉及复杂网络技术领域,尤其涉及一种电话通信网络中节点敏感性排序的方法。
背景技术
随着移动终端设备的发展,手机已成为人们日常生活交流的重要通信设备,每天有大量的通信数据产生,包括短信和电话记录,如果把通信的双方看成节点,一次通信看作一条连边,那整个通信网络就是一个巨大且复杂的网络系统。如何定量分析通信网络中节点的重要程度仍然是一个待解决的问题。
网络节点重要性的评价主要有基于网络拓扑结构和基于节点属性两个方面。基于网络拓扑结构的方法有:局部网络结构、全局网络结构以及基于网络位置属性等指标。基于节点属性的重要性排序方法有基于个体行为特征,个体基本信息特征等。
局部网络结构主要从节点自身和其邻居属性如度来分析,分析局部结构属性计算复杂度较低,适用于大型网络。
基于个体基本信息特征的有如Facebook上用户的年龄、性别等属性,这些属性左右着用户的影响力。
在犯罪网络的研究方法中,有根据罪犯的通信行为建立社会网络,通过行为动力学分析来判断和挖掘罪犯;也有对已知罪犯进行标记,根据边权计算其余节点的相对重要性,来挖掘犯罪可疑分子。
通过以上研究分析发现,目前已经有很多关于网络节点重要性的研究,但是如何提取节点特征,如何准确而又高效地提升计算方法,还有待进一步研究。
发明内容
本发明的目的在于解决现有技术存在的缺陷,提供一种电话通信网络中节点敏感性排序的方法,有效挖掘敏感节点,大大提升了灵活性。
为实现上述发明目的,本发明采用如下方案:
一种电话通信网络中节点敏感性排序的方法,包括以下步骤:
(1)建立手机机身码与号码映射关系,同时统计每个机身码的通话总次数,用于后续基于结构的分析和号码间的相似度计算;
(2)构建重点关注手机号码、重点关注区域、重点关注时间的三张表,表名分别为FocusNumberList、FocusAreaList、FocusTimeList,为后续计算号码敏感指数做准备;
(3)基于结构的敏感性指数计算方法,分别计算一机多号敏感指数、一号多机敏感指数、重点关注号码敏感指数、重点关注时间敏感指数、重点关注区域敏感指数、本国通话强度敏感指数、主叫国外通话强度敏感指数、接听国外通话强度敏感指数和号码伴随敏感指数,具体计算方法如下:
①一机多号敏感指数计算
对一个手机使用多个号码的机身码进行建模,通过模型计算得到一机多号敏感指数,计算公式如下:
Figure BDA0001295718390000031
其中i为当前机身码对应的第i个号码,call_sumi为第i个号码的通话次数总和,mobilenum_sumi为第i个号码使用过的手机数量,k为该机身码使用过的号码总数,β为0到1的调节参数,取0.5;
②一号多机敏感指数计算
对多个手机使用同一号码的号码进行敏感指数分析建模,通过模型计算得到一号多机敏感指数,具体的计算公式如下:
Figure BDA0001295718390000032
其中imei_sum为使用过该号码的手机数量,call_sum为该号码的所有通话次数,β为0到1的调节参数,取0.5;
③重点关注区域敏感指数计算
首先添加区域以及关注指数,通过对通话详单进行分析,统计该区域内的通话记录,对出现在关注区域内的通话进行建模,通过模型计算得到重点关注区域敏感指数,计算公式如下:
Figure BDA0001295718390000041
其中contact_sumi为第i个区域内的通话次数,Importancei为该关注区域的重要性值,k为关注区域数。
对数值进行平滑处理,使ImportanceArea介于0至1之间,最终的计算公式如下:
Figure BDA0001295718390000042
其中ImportanceFocusArea为平滑处理后的重点关注区域敏感指数,α、β为一个小于1并且大于0的调节参数,α取0.2,β为10-5
④重点关注时间敏感指数计算
首先添加时间区间以及对应的敏感值,通过分析通话详单,统计该时间段内的通话记录,对出现在关注时间内的通话进行敏感指数分析建模,通过模型计算得到重点关注时间敏感指数,具体的计算公式如下:
Figure BDA0001295718390000043
其中contact_sumi为第i个时间区间内的通话次数,Importancei为该关注时间段的敏感值,k为关注时间区间个数;
对数值进行平滑处理,使ImportanceTime介于0至1之间,最终的计算公式如下,
Figure BDA0001295718390000044
其中ImportanceFocusTime平滑处理后的重点关注时间敏感指数,α、β为一个小于1并且大于0的小数,α取0.2,β为10-5
⑤重点关注号码敏感指数计算
在构建全局重点关注号码集后,使用相对重要性计算模型分析重点关注号码的敏感性对其他号码的影响;
⑥本国通话强度敏感指数计算;
通过对通话详单进行分析,统计每个号码的国内通话次数以及国内通话联系人数,进而利用国内通话强度敏感指数模型进行计算,得到这个号码的国内通话强度敏感指数;
具体的计算公式如下:
Figure BDA0001295718390000051
其中domesticcontact_sum为该号码的国内联系人数量,domesticcall_sum为该号码的所有通话次数,β为0到1的调节参数,这里取0.5;
⑦主叫国外通话强度敏感指数计算
通过对通话详单进行分析,统计每个号码的主叫国外通话次数以及主叫国外的通话联系人数,进而利用主叫国外通话强度敏感指数模型进行计算,得到这个号码的主叫国外通话强度敏感指数;
具体的计算公式如下:
Figure BDA0001295718390000061
其中callforeigncontact_sum为该号码主叫国外联系人数量,callforeign_sum为该号码的所有主叫国外的通话次数,β为0到1的调节参数,取0.5;
⑧接听国外通话强度敏感指数计算
通过对通话详单进行分析,统计每个号码的被叫国外通话次数以及被叫国外的通话联系人数,进而利用被叫国外通话强度敏感指数模型进行计算,得到这个号码的接听国外通话强度敏感指数;
具体的计算公式如下:
Figure BDA0001295718390000062
其中calledforeigncontact_sum为该号码被叫国外联系人数量,callforeign_sum为该号码的所有被叫国外的通话次数,β为0到1的调节参数,取0.5;
⑨号码伴随敏感指数计算
包括普通号码伴随和重点关注号码伴随,通过对通话详单进行分析,统计总是与当前号码在同一时间范围、同一地点范围出现的其他号码,利用伴随敏感指数模型进行计算,得到号码的伴随敏感指数;
具体的计算公式如下:
Figure BDA0001295718390000071
其中accompany_sumi为该号码与第i个号码伴随的次数,call_sum为该号码通话次数总和,β为0到1的调节参数,取0.5,k为伴随号码数量;
(4)设置权重,计算敏感值
根据需要设置不同权重系数,将步骤(3)中所求得的各项敏感指数值进行加权求和得到最终的敏感值,计算出各个号码的敏感值,并对各个号码的敏感值进行排序。由于敏感值与号码重要性呈正相关,所以敏感值越高,号码的重要性越高。
进一步,步骤(3)中重点关注号码敏感值计算过程中,重点关注号码集的敏感值计算方法如下:
首先,定义关注指数值大于0的号码为关注号码,初始关注号码具有两种来源:
1)手动配置参与计算的重点关注号码集,此类型号码敏感值在扩散过程中不会改变,可定义为ImportantSeedNumber;
2)通过关注区域和关注时间计算得到的重点关注号码集,此类型号码重要性在扩散过程中会受到其邻居节点的敏感值变化而改变,初始敏感值取关注区域和关注时间敏感值的算术平均数,计算公式如下:
ImportanceFocusNumber
=(ImportanceFocusArea+ImportanceFocusTime)/2
扩散过程中除种子号码外,其余号码的敏感值随着其邻居节点敏感值改变,直至扩散到一个极大连通子图,具体扩散过程如下:
(I)初始,除了标记的重点关注号码集ImportantSeedNumber,还有通过关注区域和关注时间计算得到的;
(II)由关注号码进行扩散,其邻居敏感值的计算公式为:
Figure BDA0001295718390000081
其中contact_sumi为与第i个关注号码的通话次数,Importancei为该号码的敏感值,k为与号码i通话的号码数;
对其进行平滑处理,得到如下公式:
Figure BDA0001295718390000082
受邻居节点重要性影响,平滑以后的重要性计算公式为:
Figure BDA0001295718390000083
公式(1)与(2)中α、β为一个小于1并且大于0的小数,而β通常接近于0;公式(2)中k为号码邻居中关注号码系数大于0.7的个数;
(III)更新重要性,取公式(1)、(2)中最大值为该号码新的敏感值;
ImportanceFocusNumber
=max(ImportanceFocusNumber_1,ImportanceFocusNumber_2)
若无增加新的关注号码,则退出,否则回到步骤(II)。
进一步,通过统计分析整个通话详单,建立机身码与号码映射关系。
进一步,步骤(3)中,在进行一机多号敏感指数计算前,通过对通话详单进行分析,统计分析每个号码的通话次数以及在此手机上使用过的号码个数,如果手机使用的号码个数超过1个,则认为此手机为一机多号,进而利用一机多号敏感指数模型进行计算。
进一步,步骤(3)中,在进行一号多机敏感指数计算前,通过对通话详单进行分析,统计分析每个号码的通话次数以及所持有的手机数量,进而利用一号多机敏感指数模型进行计算。
进一步,步骤(1)中,建立手机机身码与号码映射关系,包括一个机身码对应多个号码和一个号码对应多个机身码两种情况。
本发明的电话通信网络中节点敏感性排序的方法,通过对用户通信的详单、基站等数据,从结构和属性两方面进行建模,对每个号码统计其一阶、二阶邻居、通话时间序列、基站通话次数等属性,从结构和属性层面分析号码相应的敏感指数值;对已经标注的重点关注号码,将其敏感值扩散至其邻居节点中,直至影响到整个连通子图;对多个参数进行建模,对电话通信网络中节点的属性值进行加权求和,得到最终敏感指数值。这样不仅从结构上分析敏感节点的通信传播,还考虑了各个节点的通话属性。这样,能有效地挖掘敏感节点,大大提升了灵活性。
附图说明
图1是本发明计算节点敏感性的流程图。
图2是本发明计算重点号码敏感值流程图。
具体实施方式
下面结合附图对本发明的具体实施流程进行描述,特别注意的是,敏感数据将用变量名代替。
参考图1和图2,本发明电话通信网络中节点敏感性排序的方法,具体步骤如下:
(1)建立手机机身码与号码映射关系(机身码可能对应多个号码,号码也可能对应多个机身码),同时统计每个机身码的通话总次数,用于后续基于结构的分析和号码间的相似度计算;
(2)构建重点关注手机号码、重点关注区域、重点关注时间的三张表,表名分别为FocusNumberList、FocusAreaList、FocusTimeList,为后续计算号码敏感指数做准备;
(3)基于结构的敏感性指数计算方法,分别计算一机多号敏感指数、一号多机敏感指数、重点关注号码敏感指数、重点关注时间敏感指数、重点关注区域敏感指数、本国通话强度敏感指数、主叫国外通话强度敏感指数、接听国外通话强度敏感指数和号码伴随敏感指数,具体计算方法如下:
①一机多号敏感指数计算
对一个手机使用多个号码的机身码进行建模,通过模型计算得到一机多号敏感指数,计算公式如下:
Figure BDA0001295718390000111
其中i为当前机身码对应的第i个号码,call_sumi为第i个号码的通话次数总和,mobilenum_sumi为第i个号码使用过的手机数量,k为该机身码使用过的号码总数,β为0到1的调节参数,本发明中β取0.5;
②一号多机敏感指数计算
对多个手机使用同一号码的号码进行敏感指数分析建模,通过模型计算得到一号多机敏感指数,具体的计算公式如下:
Figure BDA0001295718390000112
其中imei_sum为使用过该号码的手机数量,call_sum为该号码的所有通话次数,β为0到1的调节参数,本发明中β取0.5;
③重点关注区域敏感指数计算
首先添加区域以及关注指数,通过对通话详单进行分析,统计该区域内的通话记录,对出现在关注区域内的通话进行建模,通过模型计算得到重点关注区域敏感指数,计算公式如下:
Figure BDA0001295718390000121
其中contact_sumi为第i个区域内的通话次数,Importancei为该关注区域的重要性值,k为关注区域数。
对数值进行平滑处理,使ImportanceArea介于0至1之间,最终的计算公式如下:
Figure BDA0001295718390000122
其中ImportanceFocusArea为平滑处理后的重点关注区域敏感指数,α、β为一个小于1并且大于0的调节参数,α取0.2,β为10-5
④重点关注时间敏感指数计算
首先添加时间区间以及对应的敏感值,通过分析通话详单,统计该时间段内的通话记录,对出现在关注时间内的通话进行敏感指数分析建模,通过模型计算得到重点关注时间敏感指数,具体的计算公式如下:
Figure BDA0001295718390000123
其中contact_sumi为第i个时间区间内的通话次数,Importancei为该关注时间段的敏感值,k为关注时间区间个数;
对数值进行平滑处理,使ImportanceTime介于0至1之间,最终的计算公式如下,
Figure BDA0001295718390000124
其中ImportanceFocusTime平滑处理后的重点关注时间敏感指数,α、β为一个小于1并且大于0的小数,α取0.2,β为10-5
⑤重点关注号码敏感指数计算
在构建全局重点关注号码集后,使用相对重要性计算模型分析重点关注号码的敏感性对其他号码的影响,具体计算方法见权利要求说明第2部分;
⑥本国通话强度敏感指数计算;
通过对通话详单进行分析,统计每个号码的国内通话次数以及国内通话联系人数,进而利用国内通话强度敏感指数模型进行计算,得到这个号码的国内通话强度敏感指数;
具体的计算公式如下:
Figure BDA0001295718390000131
其中domesticcontact_sum为该号码的国内联系人数量,domesticcall_sum为该号码的所有通话次数,β为0到1的调节参数,这里取0.5;
⑦主叫国外通话强度敏感指数计算
通过对通话详单进行分析,统计每个号码的主叫国外通话次数以及主叫国外的通话联系人数,进而利用主叫国外通话强度敏感指数模型进行计算,得到这个号码的主叫国外通话强度敏感指数;
具体的计算公式如下:
Figure BDA0001295718390000141
其中callforeigncontact_sum为该号码主叫国外联系人数量,callforeign_sum为该号码的所有主叫国外的通话次数,β的取值同上;
⑧接听国外通话强度敏感指数计算
通过对通话详单进行分析,统计每个号码的被叫国外通话次数以及被叫国外的通话联系人数,进而利用被叫国外通话强度敏感指数模型进行计算,得到这个号码的接听国外通话强度敏感指数;
具体的计算公式如下:
Figure BDA0001295718390000142
其中calledforeigncontact_sum为该号码被叫国外联系人数量,callforeign_sum为该号码的所有被叫国外的通话次数,β的取值同上;
⑨号码伴随敏感指数计算
包括普通号码伴随和重点关注号码伴随,通过对通话详单进行分析,统计总是与当前号码在同一时间范围、同一地点范围出现的其他号码,利用伴随敏感指数模型进行计算,得到号码的伴随敏感指数;
具体的计算公式如下:
Figure BDA0001295718390000151
其中accompany_sumi为该号码与第i个号码伴随的次数,call_sum为该号码通话次数总和,β的取值同上,k为伴随号码数量。
(4)设置权重,计算敏感值
根据需要设置不同权重系数,将步骤(3)中所求得的各项敏感指数值进行加权求和得到最终的敏感值,计算出各个号码的敏感值,并对各个号码的敏感值进行排序。由于敏感值与号码重要性呈正相关,所以敏感值越高,号码的重要性越高。
以下通过具体实施例说明本发明方法:本实施采用的通话记录数65788条,号码总数为7787个。
(1)统计机身码(IMEI)与号码映射关系,统计分析整个通话详单,建立机身码与号码映射关系。映射关系可表示为“imei—numberList”,“numberList”为号码数组。得到6组一机多号关系。
(2)配置重点关注号码、重点关注区域、重点关注时间三张表,分别为FocusNumberList、FocusAreaList、FocusTimeList。为后续计算号码的敏感值做准备。
(3)基于结构的敏感指数计算。主要包括一机多号敏感指数、一号多机敏感指数、伴随影响敏感指数、重点关注号码敏感指数、重点关注时间敏感指数、以及重点关注区域敏感指数等。特别需注意的是,此步骤完成后,根据重点关注区域敏感指数和重点关注时间敏感指数可算出一般号码(非步骤2中配置的重点关注号码)的重点关注号码敏感指数。数据样例如表1所示。
表1结构敏感值计算结果表
Figure BDA0001295718390000161
(4)权重配置。将步骤(3)中所求得的各项指标值进行加权求和得到最终敏感指数值。可根据需要为各指标配置不同权重,对各个号码计算出不同敏感值如表2所示,假设各项权重标注在表头中。
表2敏感性计算结果表
Figure BDA0001295718390000162
最后根据实际数据,得出的结果如表3(N1~N5为已知的敏感节点)所示。
表3计算结果表
Figure BDA0001295718390000163
Figure BDA0001295718390000171
最后应说明的是:以上实施例仅用于说明本发明的技术方案流程,并非限制此方案的使用范围;对于本技术内的相关技术人员可以对方案中的参数进行替换和对方法进行适当限制。当然,这些替换或者限制若为本发明的精神和范围内,任何发明都应被保护。

Claims (6)

1.一种电话通信网络中节点敏感性排序的方法,其特征在于,包括以下步骤:
(1)建立手机机身码与号码映射关系,同时统计每个机身码的通话总次数,用于后续基于结构的分析和号码间的相似度计算;
(2)构建重点关注手机号码、重点关注区域、重点关注时间的三张表,表名分别为FocusNumberList、FocusAreaList、FocusTimeList,为后续计算号码敏感指数做准备;
(3)基于结构的敏感性指数计算方法,分别计算一机多号敏感指数、一号多机敏感指数、重点关注号码敏感指数、重点关注时间敏感指数、重点关注区域敏感指数、本国通话强度敏感指数、主叫国外通话强度敏感指数、接听国外通话强度敏感指数和号码伴随敏感指数,具体计算方法如下:
①一机多号敏感指数计算
对一个手机使用多个号码的机身码进行建模,通过模型计算得到一机多号敏感指数,计算公式如下:
Figure FDA0002383637830000011
其中i为当前机身码对应的第i个号码,call_sumi为第i个号码的通话次数总和,mobilenum_sumi为第i个号码使用过的手机数量,k为该机身码使用过的号码总数,β为0到1的调节参数,取0.5;
②一号多机敏感指数计算
对多个手机使用同一号码的号码进行敏感指数分析建模,通过模型计算得到一号多机敏感指数,具体的计算公式如下:
Figure FDA0002383637830000012
其中imei_sum为使用过该号码的手机数量,call_sum为该号码的所有通话次数,β为0到1的调节参数,取0.5;
③重点关注区域敏感指数计算
首先添加区域以及关注指数值,通过对通话详单进行分析,统计该区域内的通话记录,对出现在关注区域内的通话进行建模,通过模型计算得到重点关注区域敏感指数,计算公式如下:
Figure FDA0002383637830000021
其中contact_sumi为第i个区域内的通话次数,Importancei为该关注区域的重要性值,该重要性值即为关注指数值,k为关注区域数;
对数值进行平滑处理,使ImportanceArea介于0至1之间,最终的计算公式如下:
Figure FDA0002383637830000022
其中ImportanceFocusArea为平滑处理后的重点关注区域敏感指数,α、β为一个小于1并且大于0的调节参数,α取0.2,β为10-5
④重点关注时间敏感指数计算
首先添加时间区间以及对应的敏感值,通过分析通话详单,统计该时间段内的通话记录,对出现在关注时间内的通话进行敏感指数分析建模,通过模型计算得到重点关注时间敏感指数,具体的计算公式如下:
Figure FDA0002383637830000023
其中contact_sumi为第i个时间区间内的通话次数,Importancei为该关注时间段的敏感值,k为关注时间区间个数;
对数值进行平滑处理,使ImportanceTime介于0至1之间,最终的计算公式如下,
Figure FDA0002383637830000024
其中ImportanceFocusTime平滑处理后的重点关注时间敏感指数,α、β为一个小于1并且大于0的小数,α取0.2,β为10-5
⑤重点关注号码敏感指数计算
在构建全局重点关注号码集后,使用相对重要性计算模型分析重点关注号码的敏感性对其他号码的影响;
⑥本国通话强度敏感指数计算;
通过对通话详单进行分析,统计每个号码的国内通话次数以及国内通话联系人数,进而利用国内通话强度敏感指数模型进行计算,得到这个号码的国内通话强度敏感指数;
具体的计算公式如下:
Figure FDA0002383637830000031
其中domesticcontact_sum为该号码的国内联系人数量,domesticcall_sum为该号码的所有通话次数,β为0到1的调节参数,这里取0.5;
⑦主叫国外通话强度敏感指数计算
通过对通话详单进行分析,统计每个号码的主叫国外通话次数以及主叫国外的通话联系人数,进而利用主叫国外通话强度敏感指数模型进行计算,得到这个号码的主叫国外通话强度敏感指数;
具体的计算公式如下:
Figure FDA0002383637830000032
其中callforeigncontact_sum为该号码主叫国外联系人数量,callforeign_sum为该号码的所有主叫国外的通话次数,β为0到1的调节参数,取0.5;
⑧接听国外通话强度敏感指数计算
通过对通话详单进行分析,统计每个号码的被叫国外通话次数以及被叫国外的通话联系人数,进而利用被叫国外通话强度敏感指数模型进行计算,得到这个号码的接听国外通话强度敏感指数;
具体的计算公式如下:
Figure FDA0002383637830000041
其中calledforeigncontact_sum为该号码被叫国外联系人数量,callforeign_sum为该号码的所有被叫国外的通话次数,β为0到1的调节参数,取0.5;
⑨号码伴随敏感指数计算
包括普通号码伴随和重点关注号码伴随,通过对通话详单进行分析,统计总是与当前号码在同一时间范围、同一地点范围出现的其他号码,利用伴随敏感指数模型进行计算,得到号码的伴随敏感指数;
具体的计算公式如下:
Figure FDA0002383637830000042
其中accompany_sumi为该号码与第i个号码伴随的次数,call_sum为该号码通话次数总和,β为0到1的调节参数,取0.5,k为伴随号码数量;
(4)设置权重,计算敏感值
根据需要设置不同权重系数,将步骤(3)中所求得的各项敏感指数值进行加权求和得到最终的敏感值,计算出各个号码的敏感值,并对各个号码的敏感值进行排序, 由于敏感值与号码重要性呈正相关,所以敏感值越高,号码的重要性越高。
2.根据权利要求1所述的电话通信网络中节点敏感性排序的方法,其特征在于,步骤(3)中重点关注号码敏感值计算过程中,重点关注号码集的敏感值计算方法如下:
首先,定义关注指数值,使用大于0的号码为关注号码,初始关注号码具有两种来源:
1)手动配置参与计算的重点关注号码集,此类型号码敏感值在扩散过程中不会改变,可定义为ImportantSeedNumber;
2)通过关注区域和关注时间计算得到的重点关注号码集,此类型号码重要性在扩散过程中会受到其邻居节点的敏感值变化而改变,初始敏感值取关注区域和关注时间敏感值的算术平均数,计算公式如下:
ImportanceFoiusNumber=(ImportanceFoiusApea+ImportanceFocusTime)/2
扩散过程中除种子号码外,其余号码的敏感值随着其邻居节点敏感值改变,直至扩散到一个极大连通子图,具体扩散过程如下:
(I)初始,除了标记的重点关注号码集ImportantSeedNumber,还有通过关注区域和关注时间计算得到的;
(II)由关注号码进行扩散,其邻居敏感值的计算公式为:
Figure FDA0002383637830000051
其中contact_sumi为与第i个关注号码的通话次数,Importancei为该号码的敏感值,k为与号码i通话的号码数;
对其进行平滑处理,得到如下公式:
Figure FDA0002383637830000052
受邻居节点重要性影响,平滑以后的重要性计算公式为:
Figure FDA0002383637830000053
公式(1)与(2)中α、β为一个小于1并且大于0的小数,而β通常接近于0;公式(2)中k为号码邻居中关注号码系数大于0.7的个数;
(III)更新重要性,取公式(1)、(2)中最大值为该号码新的敏感值;
ImportanceFocusNumber
=max(ImportanceFocusNumber_1,ImportanceFocusNumber_2)
若无增加新的关注号码,则退出,否则回到步骤(II)。
3.根据权利要求1所述的电话通信网络中节点敏感性排序的方法,其特征在于:通过统计分析整个通话详单,建立机身码与号码映射关系。
4.根据权利要求1所述的电话通信网络中节点敏感性排序的方法,其特征在于:步骤(3)中,在进行一机多号敏感指数计算前,通过对通话详单进行分析,统计分析每个号码的通话次数以及在此手机上使用过的号码个数,如果手机使用的号码个数超过1个,则认为此手机为一机多号,进而利用一机多号敏感指数模型进行计算。
5.根据权利要求1所述的电话通信网络中节点敏感性排序的方法,其特征在于:步骤(3)中,在进行一号多机敏感指数计算前,通过对通话详单进行分析,统计分析每个号码的通话次数以及所持有的手机数量,进而利用一号多机敏感指数模型进行计算。
6.根据权利要求1所述的电话通信网络中节点敏感性排序的方法,其特征在于:步骤(1)中,建立手机机身码与号码映射关系,包括一个机身码对应多个号码和一个号码对应多个机身码两种情况。
CN201710343054.1A 2017-05-16 2017-05-16 一种电话通信网络中节点敏感性排序的方法 Active CN107154875B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710343054.1A CN107154875B (zh) 2017-05-16 2017-05-16 一种电话通信网络中节点敏感性排序的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710343054.1A CN107154875B (zh) 2017-05-16 2017-05-16 一种电话通信网络中节点敏感性排序的方法

Publications (2)

Publication Number Publication Date
CN107154875A CN107154875A (zh) 2017-09-12
CN107154875B true CN107154875B (zh) 2020-05-19

Family

ID=59793480

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710343054.1A Active CN107154875B (zh) 2017-05-16 2017-05-16 一种电话通信网络中节点敏感性排序的方法

Country Status (1)

Country Link
CN (1) CN107154875B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108804662B (zh) * 2018-06-08 2021-01-29 中国联合网络通信集团有限公司 一种关联号码获取方法及装置
CN113780407B (zh) * 2021-09-09 2024-06-11 恒安嘉新(北京)科技股份公司 一种数据检测方法、装置、电子设备及存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105871594A (zh) * 2016-03-22 2016-08-17 华北电力大学(保定) 一种电力通信网节点重要度计算方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105871594A (zh) * 2016-03-22 2016-08-17 华北电力大学(保定) 一种电力通信网节点重要度计算方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
"Identifying influential spreaders in complex networks";Kitsak M, Gallos L K, Havlin S, et al;《Nature Physics》;20101231;888-893 *
"Vital nodes identification in complex networks";Lu L, Chen D, Ren X L, et al;《Physics Reports》;20161231;1-63 *
"基于链接挖掘的邮件网络中心性研究";周文彬;《中国优秀硕士学位论文全文数据库信息科技辑》;20160315;I139-647 *
"网络重要节点排序方法综述";任晓龙,吕琳媛;《科学通报》;20140531;第59卷(第13期);1175-1197 *

Also Published As

Publication number Publication date
CN107154875A (zh) 2017-09-12

Similar Documents

Publication Publication Date Title
US9305110B2 (en) Method and arrangement for supporting analysis of social networks in a communication network
CN103605791B (zh) 信息推送系统和信息推送方法
CN110337059B (zh) 一种用户家庭关系的分析算法、服务器及网络系统
CN102215504A (zh) 新入网用户的类别识别方法及系统
CN103854065A (zh) 一种用于客户流失预测的方法和装置
CN102083010B (zh) 一种用户信息筛选方法和设备
CN101821757A (zh) 广告方法、sns广告系统以及记录介质
CN105592405B (zh) 基于派系过滤和标签传播的移动通信用户群组构造方法
CN109842896B (zh) 一种栅格价值评估方法及装置
CN113412608B (zh) 内容推送方法、装置、服务端及存储介质
CN107154875B (zh) 一种电话通信网络中节点敏感性排序的方法
CN110298687A (zh) 一种区域吸引力评估方法及设备
CN111401478B (zh) 数据异常识别方法以及装置
CN112200375A (zh) 预测模型生成方法、预测模型生成装置和计算机可读介质
CN110677269B (zh) 通信用户关系的确定方法、装置和计算机可读存储介质
CN110992230A (zh) 基于终端信令数据的全量人口统计方法、装置及服务器
CN103051476B (zh) 基于拓扑分析的网络社区发现方法
CN104137581B (zh) 一种多次入网用户的判断方法及装置
CN107155214B (zh) 一种号码确定方法和装置
CN106875276A (zh) 一种通信用户社交圈生成方法及系统
Ma et al. Modelling social characteristics of mobile radio networks
CN112307075A (zh) 用户关系识别方法及装置
Jiang et al. Understanding Base Stations' Behaviors and Activities with Big Data Analysis
Badarch et al. Big data area: A novel network performance analysis technique based on bayesian traffic classification algorithm
JP2019046387A (ja) 所定行動に対するグループ内の同調圧力を推定するプログラム、装置及び方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant