CN114501420A - 一种利用手机信令数据识别家庭关系的方法 - Google Patents

一种利用手机信令数据识别家庭关系的方法 Download PDF

Info

Publication number
CN114501420A
CN114501420A CN202210217274.0A CN202210217274A CN114501420A CN 114501420 A CN114501420 A CN 114501420A CN 202210217274 A CN202210217274 A CN 202210217274A CN 114501420 A CN114501420 A CN 114501420A
Authority
CN
China
Prior art keywords
user
night
family
residence
users
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210217274.0A
Other languages
English (en)
Inventor
赖见辉
罗甜甜
黄利华
陈艳艳
王春松
齐悦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CAPITAL UNIVERSITY OF ECONOMICS AND BUSINESS
Beijing University of Technology
Original Assignee
CAPITAL UNIVERSITY OF ECONOMICS AND BUSINESS
Beijing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CAPITAL UNIVERSITY OF ECONOMICS AND BUSINESS, Beijing University of Technology filed Critical CAPITAL UNIVERSITY OF ECONOMICS AND BUSINESS
Priority to CN202210217274.0A priority Critical patent/CN114501420A/zh
Publication of CN114501420A publication Critical patent/CN114501420A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W8/00Network data management
    • H04W8/18Processing of user or subscriber data, e.g. subscribed services, user preferences or user profiles; Transfer of user or subscriber data
    • H04W8/183Processing at user equipment or user record carrier
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/021Services related to particular areas, e.g. point of interest [POI] services, venue services or geofences
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/023Services making use of location information using mutual or relative location information between multiple location based services [LBS] targets or of distance thresholds
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/025Services making use of location information using location based information parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W64/00Locating users or terminals or network equipment for network management purposes, e.g. mobility management
    • H04W64/003Locating users or terminals or network equipment for network management purposes, e.g. mobility management locating network equipment
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W8/00Network data management
    • H04W8/18Processing of user or subscriber data, e.g. subscribed services, user preferences or user profiles; Transfer of user or subscriber data
    • H04W8/186Processing of subscriber group data

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

一种利用手机信令数据识别家庭关系的方法属于交通运输领域。家庭数据往往通过人工手段获取,存在调查周期长、调查范围小和耗费巨大等缺点。本发明根据手机信令数据识别出用户的居住地,并计算用户间的居住地距离,当两用户居住地间距离满足阈值条件时,对用户间的通话特征进行提取,包括夜间居住地相同的天数、通话天数、夜间通话频率和晚高峰通话频率等;根据夜间居住地相同的天数和通话天数两个指标,利用决策树初步将用户间关系分为两个类别:非家庭关系和可能存在家庭关系两大类;基于可能存在家庭关系的群体和少量已知关系的用户间的通话特征,利用KNN方法进一步判断该群体中用户间的关系。本发明可准确推测手机用户间的家庭关系。

Description

一种利用手机信令数据识别家庭关系的方法
技术领域
本发明属于交通运输技术领域。利用手机信令数据准确推算手机用户之间的家庭关系,可进一步用于通勤空间特征、出行规律分析等。
背景技术
家庭是分析交通出行规律或通勤空间特征的重要单元结构,该数据往往通过人口普查或交通出行调查等人工手段获取,如居民出行调查。人工调查内容虽较为全面,但存在调查周期长、调查范围小和耗费巨大资源等缺点,尤其疫情期间,该方式存在重大安全风险。
手机信令数据是用户对外通信时,手机与附近的基站进行连接产生的数据,它具有时间上连续、空间上完整、覆盖范围广、细粒度高等优势,弥补了人工调查中周期长、调查范围小等缺陷,采用手机信令数据进行解析,获取信令数据中用户间家庭关系,为职住空间特征分析、城市规划方案的制定提供依据。手机信令数据包含用户唯一标识码、时间戳、基站编号、经度、纬度和通话对象等信息,如表1所示。
表1:手机信令数据信息
Figure BDA0003533591570000011
发明内容
本发明提出一种利用手机信令数据准确识别家庭关系的方法,家庭关系的识别可弥补人口普查以及交通调查方式中周期长的缺陷,同时该家庭关系可支持城市通勤空间特征分析等,为城市的发展规划提供依据。
具体实现方法如下:
定义待计算的全部手机信令数据集为U={U1,U2…Ui},Ui表示用户i的手机信令数据集,Ui={ui,1,ui,2…ui,j},ui,j表示用户i的第j条手机信令数据,ui,j={U_IDi,Ti,j,LONi,j,LATi,j,AREAi,j,CUi,j},其中,U_IDi、Ti,j、LONi,j、LATi,j、AREAi,j、CUi,j分别表示用户i第j条手机信令数据的用户唯一标识码、数据产生的时间戳、通讯基站经度、通讯基站纬度、基站所属交通小区和通讯对象编码。
具体步骤如下:
步骤1:数据预处理:定义夜间时段为当日20:00:00—23:59:59和次日00:00:00—7:00:00,对用户Ui的信令数据按事件发生时间先后排序,提取Ti,j在夜间范围内的数据记录,根据定义的夜间序列,根据用户信令数据的时间将数据与相应的夜间时段对应,构建夜间数据集合B={Bi,1,Bi,2…Bi,m},Bi,m表示在第m个夜间时段用户Ui的手机信令数据构成的集合;
步骤2:居住地位置识别:计算用户Ui的夜间居住地,以B为对象,第m个夜间内,用户连接基站所属交通小区AREAi,j的停留时长,一定周期内,通过对相同基站所属交通小区的夜间停留时间进行累加,选取停留时长最大的基站所属交通小区,作为用户Ui的居住地,记为
Figure BDA0003533591570000021
Figure BDA0003533591570000022
Figure BDA0003533591570000023
分别代表居住地的经度和纬度,即夜间停留时长最大的基站所属交通小区的质心坐标;
步骤3:居住地距离比较:分别对其余所有用户Q={Q1,Q2,...,Qn},i≠n,n为自然数,且n>0,进行居住地判断,即循环步骤1和步骤2中操作,并分别计算集合Q与用户Ui的居住地间直线距离
Figure BDA0003533591570000024
其中
Figure BDA0003533591570000025
为用户Qn的居住地位置信息,即用户Qn夜间停留时长最大的基站所属交通小区的质心坐标,取出D中元素小于1KM的用户,形成该用户的数据集Z,同时构建用户对集合
Figure BDA0003533591570000026
其中,v为自然数,且v>0,n为自然数,且n>0,
Figure BDA0003533591570000027
指用户Qv与用户Ui的唯一标识码连接起来的用户对;D中元素大于或等于1KM的用户则认为无家庭关系;
步骤4:通话特征指标提取,计算集合QUi中每一个元素的特征指标,即每一个用户对
Figure BDA0003533591570000031
的特征指标,包括以下四个指标:
1)夜间居住地相同的天数:夜间范围内,相较于非家庭成员,具有家庭关系的用户往往具有共同居住地点,因此提出“夜间居住地相同的天数”,记为
Figure BDA0003533591570000032
即在T周期内,用户对
Figure BDA0003533591570000033
的夜间居住地相同的天数;
2)通话的天数:相较于非家庭关系的用户,家庭成员间的通话行为更为稳定,提出指标“通话的天数”,记为
Figure BDA0003533591570000034
即用户对
Figure BDA0003533591570000035
在T周期内存在通话行为的天数;
3)夜间通话频率:由于家庭成员间的共同居住行为,夜间通话频率较少,与非家庭关系用户具有显著区别,提出“夜间通话频率”指标,即
Figure BDA0003533591570000036
计算公式如下:
Figure BDA0003533591570000037
其中,
Figure BDA0003533591570000038
指用户Qv与用户Ui在T周期内夜间时的通话总次数,
Figure BDA0003533591570000039
指QUi中每一个用户对
Figure BDA00035335915700000310
在T周期内夜间的通话次数的和;
4)晚高峰通话频率:定义晚高峰时段为17:00—19:00,并提出“晚高峰通话频率”指标,即
Figure BDA00035335915700000311
指用户对
Figure BDA00035335915700000312
在周期T内的晚高峰期间的通话频率:
Figure BDA00035335915700000313
其中,
Figure BDA00035335915700000314
指在T周期内,用户Ui与用户Qv在晚高峰时段内的通话总次数,
Figure BDA00035335915700000315
指用户对
Figure BDA00035335915700000316
在T周期内的通话总次数;
为QUi中每一个用户对
Figure BDA00035335915700000317
构建特征集
Figure BDA00035335915700000318
步骤5:利用决策树的分类规则,去除不可能具有家庭关系的用户,根据的特征集合P中的夜间居住地相同的天数
Figure BDA00035335915700000319
和通话天数
Figure BDA00035335915700000320
两个指标进行判断,当两用户的夜间居住地相同的天数为0时,两用户间不可能存在居住上的家庭关系,当夜间居住地相同的天数大于0时,若两用户间在一定周期内的通话天数大于0时,则认为两用户间“可能存在家庭关系”,否则为非家庭关系,基于此,提取出“可能存在家庭关系”的用户对的特征集合,
Figure BDA0003533591570000041
f为自然数,且f>0,v为自然数,且v>0,GfUi指用户对
Figure BDA0003533591570000042
步骤6:基于KNN算法的家庭关系分类:根据人工样本中已知的家庭用户对和非家庭用户对,利用同样的方法构建用户对特征集合W,同时标定用户对的关系,
Figure BDA0003533591570000043
n为自然数,且n>0,SaHa指用户对
Figure BDA0003533591570000044
Laa指用户对
Figure BDA0003533591570000045
之间的家庭关系标签,对“可能存在家庭关系”的用户对特征集合
Figure BDA0003533591570000046
f为自然数,且f>0,v为自然数,且v>0,进一步使用KNN算法进行分类,过程如下:
(1)首先,计算“可能存在家庭关系”的用户对特征集合
Figure BDA0003533591570000047
f为自然数,且f>0,v为自然数,且v>0,与已知标签的集合W中的
Figure BDA0003533591570000048
之间的欧氏距离,计算公式为
Figure BDA0003533591570000049
构建欧式距离集合E={E1,E2,...,Ea},Ea表示用户对
Figure BDA00035335915700000410
与用户对
Figure BDA00035335915700000411
之间的欧氏距离;
(2)将欧式距离集合E按照距离值的大小进行递增排序;
(3)选取前3个样本,确定前3个样本所在类别出现的频率并输出出现频率最高的类别;
步骤7:家庭关系判别,当前3个样本中频率最高的类别为家庭关系时,此时用户对
Figure BDA00035335915700000412
为家庭关系,当前3个样本中频率最高的类别为非家庭关系时,此时用户对
Figure BDA00035335915700000413
为非家庭关系。
本发明具有以下有益效果:
该发明的基础数据来源于手机信令数据,相对依靠传统的人工调查手段,该方法无须另外布置采集设备,具有覆盖人群范围大、时间上连续和空间上完整的特点,为挖掘家庭关系提供全方位支撑。
附图说明
图1.夜间范围示意图
图2.决策树过程示意图
图3.本方法流程示意图
具体实施方式
下面结合附图对本发明详细描述其具体实施过程。以某地区手机信令数据为例进行说明,如表2。
表2:手机信令数据
Figure BDA0003533591570000051
Figure BDA0003533591570000061
具体步骤如下:
步骤1:数据预处理:定义夜间时段为当日20:00:00—23:59:59和次日00:00:00—7:00:00,对用户Ui的信令数据按事件发生时间先后排序,提取Ti,j在夜间范围内的数据记录,根据定义的夜间序列(见附图1),根据用户信令数据的时间将数据与相应的夜间时段对应,构建夜间数据集合B={Bi,1,Bi,2…Bi,m},Bi,m表示在第m个夜间时段用户Ui的手机信令数据构成的集合,以用户U1=“3916”为例,表3展示了第一个夜间时段(B1,1)的手机信令数据集;
表3:夜间手机信令数据
Figure BDA0003533591570000071
步骤2:居住地位置识别:计算用户Ui的夜间居住地,以B为对
象,第m个夜间内,用户连接基站所属交通小区AREAi,j的停留时长,一定周期内,通过对相同基站所属交通小区的夜间停留时间进行累加,选取停留时长最大的基站所属交通小区,作为用户Ui的居住地,记为
Figure BDA0003533591570000072
Figure BDA0003533591570000073
Figure BDA0003533591570000074
分别代表居住地的经度和纬度,即夜间停留时长最大的基站所属交通小区的质心坐标,以用户U1=“3916”为例,经计算其停留时长最大的基站所属交通小区(AREA=“4177”)的质心坐标为(即居住地):
Figure BDA0003533591570000075
步骤3:居住地距离比较:分别对其余所有用户Q={Q1,Q2,...,Qn}i≠n,n为自然数,且n>0,进行居住地判断,即循环步骤1和步骤
2中操作,并分别计算集合Q与用户Ui的居住地间直线距离
Figure BDA0003533591570000076
其中
Figure BDA0003533591570000077
为用户Qn的居住地位置信息,即用户Qn夜间停留时长最大的基站所属交通小区的质心坐标,取出D中元素小于1KM的用户,形成该用户的数据集Z,同时构建用户对集合
Figure BDA0003533591570000078
其中,v为自然数,且v>0,n为自然数,且n>0,
Figure BDA0003533591570000079
指用户Qv与用户Ui的唯一标识码连接起来的用户对,对用户Q2、Q3、Q4,即对U_ID=“1333”、“2924”、“1005”进行居住地判断,经计算用户Q2、Q3、Q4的夜间停留时长最大的基站所属交通小区的质心坐标(即居住地)分别为
Figure BDA0003533591570000081
Figure BDA0003533591570000082
经计算Q2与U1之间的直线距离为0.8KM,Q3与U1之间的直线距离为0KM,Q4与U1之间的直线距离为1.9KM,D={0.8,0,1.9},用户对
Figure BDA0003533591570000083
之间的距离不满足条件,因此构建用户对
Figure BDA0003533591570000084
步骤4:通话特征指标提取,计算用户对
Figure BDA0003533591570000085
的特征指标,包括以下四个指标,本例中T=7,单位:天:
1)夜间居住地相同的天数:经计算,用户对
Figure BDA0003533591570000086
的夜间居住地相同的天数,
Figure BDA0003533591570000087
用户对
Figure BDA0003533591570000088
的夜间居住地相同的天数,
Figure BDA0003533591570000089
2)通话的天数:经计算
Figure BDA00035335915700000810
3)夜间通话频率:分别计算
Figure BDA00035335915700000811
Figure BDA00035335915700000812
的夜间通话频率指标:
Figure BDA00035335915700000813
Figure BDA00035335915700000814
4)晚高峰通话频率:通过计算,
Figure BDA00035335915700000815
Figure BDA00035335915700000816
的晚高峰时段的通话频率为:
Figure BDA00035335915700000817
Figure BDA00035335915700000818
为QU1中每一个用户对
Figure BDA00035335915700000819
Figure BDA00035335915700000820
构建特征集
Figure BDA00035335915700000821
步骤5:利用决策树的分类规则,去除不可能具有家庭关系的用户,
Figure BDA0003533591570000091
根据决策树规则,当夜间居住地相同的天数等于0时,两用户间为非家庭关系,因此,用户对
Figure BDA0003533591570000092
属于“非家庭关系”一类,同理,用户对
Figure BDA0003533591570000093
属于“可能存在家庭关系”一类,提取出用户对
Figure BDA0003533591570000094
的特征集合,即
Figure BDA0003533591570000095
步骤6:基于KNN算法的家庭关系分类:已知用户对关系的特征集合W见表4(仅列出部分),对特征集合
Figure BDA0003533591570000096
进一步使用KNN算法进行分类,过程如下:
(1)计算
Figure BDA0003533591570000097
与已知标签的集合W中的每一个用户对特征集之间的欧氏距离,E={3.6,1.4,3.2,3.6};
(2)将欧式距离集合E按照距离值的大小进行递增排序为E={1.4,3.2,3.6,3.6};
(3)在前3个样本的类别中,“家庭关系”类别出现的频率为
Figure BDA0003533591570000098
“非家庭关系”类别出现的频率为
Figure BDA0003533591570000099
步骤7:家庭关系判别,由于
Figure BDA00035335915700000910
因此,用户对
Figure BDA00035335915700000911
的关系为家庭关系。
表4特征集合W
Figure BDA00035335915700000912
最后应说明的是:以上示例仅用以说明本发明而并非限制本发明所描述的技术方案;因此,尽管本说明书参照上述的示例对本发明已进行了详细的说明,但是,本领域的普通技术人员应当理解,仍然可以对本发明进行修改或等同替换;而一切不脱离发明的精神和范围的技术方案及其改进,其均应涵盖在本发明的权利要求范围当中。

Claims (1)

1.一种利用手机信令数据识别家庭关系的方法,其特征在于包括以下步骤:
步骤1:数据预处理:定义夜间时段为当日20:00:00—23:59:59和次日00:00:00—7:00:00,对用户Ui的信令数据按事件发生时间先后排序,提取Ti,j在夜间范围内的数据记录,根据定义的夜间序列,根据用户信令数据的时间将数据与相应的夜间时段对应,构建夜间数据集合B={Bi,1,Bi,2...Bi,m},Bi,m表示在第m个夜间时段用户Ui的手机信令数据构成的集合;
步骤2:居住地位置识别:计算用户Ui的夜间居住地,以B为对象,第m个夜间内,用户连接基站所属交通小区AREAi,j的停留时长,一定周期内,通过对相同基站所属交通小区的夜间停留时间进行累加,选取停留时长最大的基站所属交通小区,作为用户Ui的居住地,记为
Figure FDA0003533591560000011
Figure FDA0003533591560000012
Figure FDA0003533591560000013
分别代表居住地的经度和纬度,即夜间停留时长最大的基站所属交通小区的质心坐标;
步骤3:居住地距离比较:分别对其余所有用户Q={Q1,Q2,...,Qn},i≠n,n为自然数,且n>0,进行居住地判断,即循环步骤1和步骤2中操作,并分别计算集合Q与用户Ui的居住地间直线距离
Figure FDA0003533591560000014
其中
Figure FDA0003533591560000015
为用户Qn的居住地位置信息,即用户Qn夜间停留时长最大的基站所属交通小区的质心坐标,取出D中元素小于1KM的用户,形成该用户的数据集Z,同时构建用户对集合
Figure FDA0003533591560000016
其中,v为自然数,且v>0,n为自然数,且n>0,
Figure FDA0003533591560000017
指用户Qv与用户Ui的唯一标识码连接起来的用户对;D中元素大于或等于1KM的用户则认为无家庭关系;
步骤4:通话特征指标提取,计算集合QUi中每一个元素的特征指标,即每一个用户对
Figure FDA0003533591560000018
的特征指标,包括以下四个指标:
1)夜间居住地相同的天数:夜间范围内,相较于非家庭成员,具有家庭关系的用户往往具有共同居住地点,因此提出“夜间居住地相同的天数”,记为
Figure FDA0003533591560000019
即在T周期内,用户对
Figure FDA00035335915600000110
的夜间居住地相同的天数;
2)通话的天数:相较于非家庭关系的用户,家庭成员间的通话行为更为稳定,提出指标“通话的天数”,记为
Figure FDA0003533591560000021
即用户对
Figure FDA0003533591560000022
在T周期内存在通话行为的天数;
3)夜间通话频率:由于家庭成员间的共同居住行为,夜间通话频率较少,与非家庭关系用户具有显著区别,提出“夜间通话频率”指标,即
Figure FDA0003533591560000023
计算公式如下:
Figure FDA0003533591560000024
其中,
Figure FDA0003533591560000025
指用户Qv与用户Ui在T周期内夜间时的通话总次数,
Figure FDA0003533591560000026
指QUi中每一个用户对
Figure FDA0003533591560000027
在T周期内夜间的通话次数的和;
4)晚高峰通话频率:定义晚高峰时段为17:00—19:00,并提出“晚高峰通话频率”指标,即
Figure FDA0003533591560000028
指用户对
Figure FDA0003533591560000029
在周期T内的晚高峰期间的通话频率:
Figure FDA00035335915600000210
其中,
Figure FDA00035335915600000211
指在T周期内,用户Ui与用户Qv在晚高峰时段内的通话总次数,
Figure FDA00035335915600000212
指用户对
Figure FDA00035335915600000213
在T周期内的通话总次数;
为QUi中每一个用户对
Figure FDA00035335915600000214
构建特征集
Figure FDA00035335915600000215
步骤5:利用决策树的分类规则,去除不可能具有家庭关系的用户,根据的特征集合P中的夜间居住地相同的天数
Figure FDA00035335915600000216
和通话天数
Figure FDA00035335915600000217
两个指标进行判断,当两用户的夜间居住地相同的天数为0时,两用户间不可能存在居住上的家庭关系,当夜间居住地相同的天数大于0时,若两用户间在一定周期内的通话天数大于0时,则认为两用户间“可能存在家庭关系”,否则为非家庭关系,基于此,提取出“可能存在家庭关系”的用户对的特征集合,
Figure FDA00035335915600000218
f为自然数,且f>0,v为自然数,且v>0,GfUi指用户对
Figure FDA00035335915600000219
步骤6:基于KNN算法的家庭关系分类:根据人工样本中已知的家庭用户对和非家庭用户对,利用同样的方法构建用户对特征集合W,同时标定用户对的关系,
Figure FDA0003533591560000031
n为自然数,且n>0,SaHa指用户对
Figure FDA0003533591560000032
Laa指用户对
Figure FDA0003533591560000033
之间的家庭关系标签,对“可能存在家庭关系”的用户对特征集合
Figure FDA0003533591560000034
f为自然数,且f>0,v为自然数,且v>0,进一步使用KNN算法进行分类,过程如下:
(1)首先,计算“可能存在家庭关系”的用户对特征集合
Figure FDA0003533591560000035
f为自然数,且f>0,v为自然数,且v>0,与已知标签的集合W中的
Figure FDA0003533591560000036
之间的欧氏距离,计算公式为
Figure FDA0003533591560000037
构建欧式距离集合E={E1,E2,...,Ea},Ea表示用户对
Figure FDA0003533591560000038
与用户对
Figure FDA0003533591560000039
之间的欧氏距离;
(2)将欧式距离集合E按照距离值的大小进行递增排序;
(3)选取前3个样本,确定前3个样本所在类别出现的频率并输出出现频率最高的类别;
步骤7:家庭关系判别,当前3个样本中频率最高的类别为家庭关系时,此时用户对
Figure FDA00035335915600000310
为家庭关系,当前3个样本中频率最高的类别为非家庭关系时,此时用户对
Figure FDA00035335915600000311
为非家庭关系。
CN202210217274.0A 2022-03-06 2022-03-06 一种利用手机信令数据识别家庭关系的方法 Pending CN114501420A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210217274.0A CN114501420A (zh) 2022-03-06 2022-03-06 一种利用手机信令数据识别家庭关系的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210217274.0A CN114501420A (zh) 2022-03-06 2022-03-06 一种利用手机信令数据识别家庭关系的方法

Publications (1)

Publication Number Publication Date
CN114501420A true CN114501420A (zh) 2022-05-13

Family

ID=81486818

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210217274.0A Pending CN114501420A (zh) 2022-03-06 2022-03-06 一种利用手机信令数据识别家庭关系的方法

Country Status (1)

Country Link
CN (1) CN114501420A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106570184A (zh) * 2016-11-11 2017-04-19 同济大学 从手机信令数据提取游憩‑居住联系数据集的方法
WO2018153292A1 (zh) * 2017-02-24 2018-08-30 腾讯科技(深圳)有限公司 社交圈子的生成方法、装置及存储介质
CN109829497A (zh) * 2019-01-31 2019-05-31 清华四川能源互联网研究院 一种基于监督学习的台区用户识别及判别方法
CN110337059A (zh) * 2018-03-30 2019-10-15 中国联合网络通信集团有限公司 一种用户家庭关系的分析算法、服务器及网络系统
CN114143207A (zh) * 2020-08-14 2022-03-04 中国移动通信集团广东有限公司 一种家庭用户识别方法和电子设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106570184A (zh) * 2016-11-11 2017-04-19 同济大学 从手机信令数据提取游憩‑居住联系数据集的方法
WO2018153292A1 (zh) * 2017-02-24 2018-08-30 腾讯科技(深圳)有限公司 社交圈子的生成方法、装置及存储介质
CN110337059A (zh) * 2018-03-30 2019-10-15 中国联合网络通信集团有限公司 一种用户家庭关系的分析算法、服务器及网络系统
CN109829497A (zh) * 2019-01-31 2019-05-31 清华四川能源互联网研究院 一种基于监督学习的台区用户识别及判别方法
CN114143207A (zh) * 2020-08-14 2022-03-04 中国移动通信集团广东有限公司 一种家庭用户识别方法和电子设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李飞成: "基于移动通信交往圈的家庭用户识别研究", 《中国优秀硕士学位论文数据库》 *

Similar Documents

Publication Publication Date Title
Xu et al. Another tale of two cities: Understanding human activity space using actively tracked cellphone location data
CN110245981B (zh) 一种基于手机信令数据的人群类型识别方法
CN107247938B (zh) 一种高分辨率遥感影像城市建筑物功能分类的方法
CN111582948B (zh) 一种基于手机信令数据与poi兴趣点的个体行为分析方法
CN107977673B (zh) 一种基于大数据的经济活动人口识别方法
CN109495856B (zh) 一种基于大数据的手机用户类型标记方法
CN111737605A (zh) 一种基于手机信令数据的出行目的识别方法及装置
CN109189917B (zh) 一种融合景观和社会特征的城市功能区划分方法及系统
CN105307121B (zh) 一种信息处理方法及装置
CN111950937A (zh) 一种基于融合时空轨迹的重点人员风险评估方法
CN112215666A (zh) 一种基于手机定位数据的不同出行活动目的特征识别方法
CN110351664B (zh) 基于手机信令的用户活动空间识别方法
CN111294742B (zh) 基于信令cdr数据识别伴随手机号码的方法与系统
CN106951828B (zh) 一种基于卫星影像和网络的城市区域功能属性的识别方法
CN111813835A (zh) 一种基于手机信令和poi数据的公共活动中心识别系统
CN114741612B (zh) 一种基于大数据的消费习惯分类方法、系统和存储介质
CN112738729B (zh) 一种用手机信令数据判别探亲返乡游客的方法及系统
CN112001829A (zh) 一种基于手机信令数据的人口分布判断方法
CN111125285A (zh) 一种基于物种空间分布关系的动物地理区划方法
CN110472775A (zh) 一种系列案件疑犯落脚点预测方法
CN113449111A (zh) 基于时空语义知识迁移的社会治理热点话题自动识别方法
CN112949784B (zh) 一种居民出行链模型构建方法及居民出行链获取方法
CN113256978A (zh) 一种城市拥堵地区的诊断方法、系统及储存介质
CN114501420A (zh) 一种利用手机信令数据识别家庭关系的方法
CN111970685B (zh) 一种大数据环境下一人多卡识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination