CN110955738B - 一种基于信令数据结合场景信息的人物画像刻画方法 - Google Patents

一种基于信令数据结合场景信息的人物画像刻画方法 Download PDF

Info

Publication number
CN110955738B
CN110955738B CN201811126281.XA CN201811126281A CN110955738B CN 110955738 B CN110955738 B CN 110955738B CN 201811126281 A CN201811126281 A CN 201811126281A CN 110955738 B CN110955738 B CN 110955738B
Authority
CN
China
Prior art keywords
users
user
base station
data
scene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811126281.XA
Other languages
English (en)
Other versions
CN110955738A (zh
Inventor
于笑博
成立立
朱明珠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beiling Rongxin Datalnfo Science and Technology Ltd
Original Assignee
Beiling Rongxin Datalnfo Science and Technology Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beiling Rongxin Datalnfo Science and Technology Ltd filed Critical Beiling Rongxin Datalnfo Science and Technology Ltd
Priority to CN201811126281.XA priority Critical patent/CN110955738B/zh
Publication of CN110955738A publication Critical patent/CN110955738A/zh
Application granted granted Critical
Publication of CN110955738B publication Critical patent/CN110955738B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/025Services making use of location information using location based information parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明提供一种基于信令数据结合场景信息的人物画像刻画方法,通过移动运营商信令数据,采集用户的移动轨迹数据,获取每个用户在一天内驻留过的基站;根据每个基站的经纬度,结合POI数据和GIS数据,将每个基站与该基站所在地的物理场景相对应,用场景信息对基站位置进行标注;将用户的移动轨迹中的每个基站与该基站的场景信息进行对应,可直观显示出每个用户的移动轨迹特征,从移动空间和时间角度对用户进行画像;进一步,将两个用户的场景信息按一定算法进行计算,可以判断一个用户与其他用户间的亲疏关系,从而对用户画像进行更加细致的描述。

Description

一种基于信令数据结合场景信息的人物画像刻画方法
技术领域
本发明涉及移动大数据统计分析应用技术领域,具体涉及一种基于信令数据结合场景信息的人物画像刻画方法。
背景技术
随着智能手机的普及,促进了移动大数据技术的发展。移动大数据中蕴含了丰富的信息,包括移动用户的出行活动信息。用户的出行活动信息具有重要的利用价值,如,通过发现并掌握移动用户的活动共性,可以服务于城市规划、旅游开发、交通建设等领域;通过用户的个性化活动信息,可用于商业领域的个性化服务、精准营销,以及安保、刑侦、反恐等领域。目前通过移动运营商的信令数据,可以较容易发现并掌握群体用户的活动共性。而对每个用户的活动特性,因其具有多样性、分散性,目前还没有有效的方法进行规模化挖掘。
发明内容
本发明的目的在于对移动大数据中蕴含的用户活动信息进一步挖掘,提供一种基于信令数据结合场景信息的人物画像刻画方法,从移动大数据中将用户的个性化活动信息挖掘并直观展现出来。
本发明的技术方案如下:
一种基于信令数据结合场景信息的人物画像刻画方法,其特征在于:
(1)通过移动运营商信令数据,采集用户的移动轨迹数据,获取每个用户在一天内驻留过的基站,及在每个基站驻留的时长,并对用户移动轨迹数据进行差补;
(2)根据每个基站的经纬度,结合POI数据和GIS数据,将每个基站与该基站所在地的物理场景相对应,用场景信息对基站位置进行标注;
(3)将用户的移动轨迹中的每个基站与该基站的场景信息进行对应,由此将一个用户每日所访问基站的记录转化为用户访问的场景记录,并记录该用户在每个场景的驻留时长,由此直观显示出每个用户的移动轨迹特征,从移动空间和时间角度对用户进行画像;
(4)对任意两个用户i和j,以每个用户在不同场景下的停留时间作为特征,将两个用户的移动特征通过以下公式进行余弦值计算:
其中,是指用户i在n个情景下停留时间所组成的向量,即/>xik是指用户i在第k个场景下停留的时间,由于所有的xik都是大于等于0的,所以计算所得的余弦值范围在0到1之间;
计算所得的值代表两个用户之间的社会关系紧密程度,值越大说明两个用户之间的关系越密切,完全无关的两两用户之间的相关系数为0,两个始终停留在完全相同的场景下的用户计算出的相关系数为1,从而描绘出每个用户的社会关系特征,从社会关系角度对用户进行画像。
本发明可通过用户的移动信息,从用户的活动场景和社会关系两方面刻画用户画像。通过活动场景可以对用户的活动特征进行直观展示,获得形象化的形象标签;进一步,还可利用场景分析的方法计算出用户间的亲疏关系,即可用来描述用户的交往圈,基于此能够对用户进行更加细致的描述,甚至对一些缺乏全局用户身份标识的用户来进行推测描述。
附图说明
图1是本发明用场景信息对用户画像的一个实施例示意图;
图2是本发明对用户亲疏关系进行识别的一个实施例示意图。
具体实施方式
本发明所采用的数据为移动运营商提供的信令数据(或称为轨迹数据),包括:加密的用户手机号码-IMSI;位置区识别码lac,用于标识不同的位置区、基站编号;ci,与位置区识别码(lac)结合,用于识别网络中覆盖的小区;time_in,表示进入基站的时间;time_out,表示离开基站的时间;
以下以一个城市的移动用户为例,采用本发明的方法对该城市的移动用户进行画像,具体实现方式如下:
(1)通过移动运营商信令数据,采集用户的移动轨迹数据,轨迹数据记录了一条IMSI进入某个基站和离开某个基站的时间,从而可获取每个用户在一天内驻留过的基站,及在每个基站驻留的时长;针对轨迹数据中会出现的信令缺失问题,要对用户移动轨迹数据进行差补;差补具体方法如下:
划出城市地域周边基站,设定为边缘基站缓冲区,根据用户移动行为,将当天移动行为出现在边界缓冲区内的用户标记为进/出城用户,其余未出现在边界缓冲区内的用户统计为未出城用户;对当日未出城用户进行驻留时长的双向差补,此类人群可视为当日在城驻留时长满24小时,对未出城用户每日的第一条信令和最后一条信令时间造成的驻留时长变短的情况,则将第一条信令的开始时间设置为每日开始时间(00:00:00),将最后一条信令的终止时间设置为每日的结束时间(23:59:59);对进/出城用户仍以实际驻留时长为准。
(2)根据每个基站的经纬度,结合POI数据和GIS数据,将每个基站与该基站所在地的物理场景相对应,用场景信息对基站位置进行标注。
所述的POI数据,主要是指城市中的信息点(Points of Information,POI)或兴趣点(Points of Interest),包括一些与人们日常生活密切相关的活动场所或地点,主要划分为商务办公、公寓住宅、综合娱乐、商业零售、酒店餐饮、医疗服务、公共设施、旅游景点8个大类,每个大类下面再划分为若干个小类,并用多个字段对每个小类进行描述,字段包括名称,地址,邮编,经纬度,电话,所属区县,所属分类,所属细分类别等信息。
以下为本实施例中对POI数据的分类表。
所述的GIS,即地理信息系统,是指建立的地理数据库所需的各种数据的来源,主要包括地图、遥感数据、文本资料、统计资料、实测数据、多媒体数据、已有系统的数据等。其中地图数据、遥感数据、统计数据、实测数据等是GIS最主要的数据源。GIS对地理空间实体通常从空间、属性、时间等方面进行描述。本发明采用GIS数据对在地图上对基站位置进行标注,从而直观显示基站的位置。
(3)将用户的移动轨迹中的每个基站与该基站的场景信息进行对应,由此将一个用户每日所访问基站的记录转化为用户访问的场景记录,并记录该用户在每个场景的驻留时长,由此直观显示出每个用户的移动轨迹特征,从移动空间和时间角度对用户进行画像。
如图1所示,任意抽取两个用户A和B。通过对两个用户的移动轨迹分别进行场景化描述,结果如下:
用户A活动区域主要在城区,居住区为高层住宅区,工作区在写字楼,经常去会展中心、机场、休闲娱乐场所;
用户B活动区域主要在城区,居住区为底层住宅区,工作区在写字楼,经常去星级酒店、企事业单位、党政军机关。
通过对比A和B两个用户,可以基本判断出:用户A极大可能性为商务人士,用户B可能企事业单位的财务部门人员或者其他较常与政府部门沟通的岗位。用户移动特征的标签化是对人口更加细致的刻画,用户标签管理系统搭建好后,意味着用户画像已经形成。配合用户信息,把具有同类标签的用户分为一组,可以对他们进行更灵活、更有针对性的活动分析。
(4)进一步,本发明还可从用户的社会关系角度对用户进行画像。
对任意两个用户i和j,以每个用户在不同场景下的停留时间作为特征,将两个用户的移动特征通过以下公式进行余弦值计算:
其中,是指用户i在n个情景下停留时间所组成的向量,即/>例如,i在商业区停留50分钟,在学校停留0分钟,在住宅区停留300分钟,则i可以表示为向量(50,0,300);xik是指用户i在第k个场景下停留的时间,由于所有的xik都是大于等于0的,所以计算所得的余弦值范围在0到1之间;
计算所得的值代表两个用户之间的社会关系紧密程度,值越大说明两个用户之间的关系越密切,完全无关的两两用户之间的相关系数为0,两个始终停留在完全相同的场景下的用户计算出的相关系数为1,从而描绘出每个用户的社会关系特征,从社会关系角度对用户进行画像。
图2是本实施例中选择已知用户信息的部分自愿者数据计算其两两之间的相关系数,得到的相关矩阵:
由图2可见,非0数据高度稀疏,符合实际情况;属于同一家庭的用户被准确识别(样本1与样本2);白天同事、晚上邻居,且节假日经常结伴活动的得分高(4与7);白天同事,非工作日一起在单位加班,得分较高(4与5)。
一般人口的描述是无法分析人与人之间的关联性,而如果利用上述方法计算出用户间的亲疏关系,即可用来描述用户的交往圈,基于此能够对用户进行更加细致的描述,甚至对一些缺乏全局用户身份标识的用户来进行推测描述。

Claims (3)

1.一种基于信令数据结合场景信息的人物画像刻画方法,其特征在于:
(1)通过移动运营商信令数据,采集用户的移动轨迹数据,获取每个用户在一天内驻留过的基站,及在每个基站驻留的时长,并对用户移动轨迹数据进行差补;
(2)根据每个基站的经纬度,结合POI数据和GIS数据,将每个基站与该基站所在地的物理场景相对应,用场景信息对基站位置进行标注;
(3)将用户的移动轨迹中的每个基站与该基站的场景信息进行对应,由此将一个用户每日所访问基站的记录转化为用户访问的场景记录,并记录该用户在每个场景的驻留时长,由此直观显示出每个用户的移动轨迹特征,从移动空间和时间角度对用户进行画像;
(4)对任意两个用户i和j,以每个用户在不同场景下的停留时间作为特征,将两个用户的移动特征通过以下公式进行余弦值计算:
其中,是指用户i在n个情景下停留时间所组成的向量,即/>xik是指用户i在第k个场景下停留的时间,由于所有的xik都是大于等于0的,所以计算所得的余弦值范围在0到1之间;
计算所得的值代表两个用户之间的社会关系紧密程度,值越大说明两个用户之间的关系越密切,完全无关的两两用户之间的相关系数为0,两个始终停留在完全相同的场景下的用户计算出的相关系数为1,从而描绘出每个用户的社会关系特征,从社会关系角度对用户进行画像。
2.根据权利要求1所述的基于信令数据结合场景信息的人物画像刻画方法,其特征在于,步骤(1)中所述的差补,具体方法如下:
划出城市地域周边基站,设定为边缘基站缓冲区,根据用户移动行为,将当天移动行为出现在边界缓冲区内的用户标记为进/出城用户,其余未出现在边界缓冲区内的用户统计为未出城用户;对当日未出城用户进行驻留时长的双向差补,此类人群视为当日在城驻留时长满24小时,对未出城用户每日的第一条信令和最后一条信令时间造成的驻留时长变短的情况,则将第一条信令的开始时间设置为每日开始时间,即每日00:00:00,将最后一条信令的终止时间设置为每日的结束时间,即每日23:59:59;对进/出城用户仍以实际驻留时长为准。
3.根据权利要求1所述的基于信令数据结合场景信息的人物画像刻画方法,其特征在于:步骤(2)中所述的POI数据,是指城市中的信息点或兴趣点,包括一些与人们日常生活相关的活动场所或地点,划分为商务办公、公寓住宅、综合娱乐、商业零售、酒店餐饮、医疗服务、公共设施、旅游景点8个大类,每个大类下面再划分为若干个小类,并用多个字段对每个小类进行描述,字段包括名称,地址,邮编,经纬度,电话,所属区县,所属分类,所属细分类别信息;步骤(2)中所述的GIS,即地理信息系统,用于对基站位置从空间、属性、时间方面进行描述。
CN201811126281.XA 2018-09-26 2018-09-26 一种基于信令数据结合场景信息的人物画像刻画方法 Active CN110955738B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811126281.XA CN110955738B (zh) 2018-09-26 2018-09-26 一种基于信令数据结合场景信息的人物画像刻画方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811126281.XA CN110955738B (zh) 2018-09-26 2018-09-26 一种基于信令数据结合场景信息的人物画像刻画方法

Publications (2)

Publication Number Publication Date
CN110955738A CN110955738A (zh) 2020-04-03
CN110955738B true CN110955738B (zh) 2023-10-20

Family

ID=69966117

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811126281.XA Active CN110955738B (zh) 2018-09-26 2018-09-26 一种基于信令数据结合场景信息的人物画像刻画方法

Country Status (1)

Country Link
CN (1) CN110955738B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112256747B (zh) * 2020-09-18 2024-06-14 珠海市新德汇信息技术有限公司 一种面向电子数据的人物刻画方法
CN114071366B (zh) * 2022-01-17 2022-05-24 北京融信数联科技有限公司 结合知识图谱的人物画像刻画方法、系统和可读存储介质
CN114741612B (zh) * 2022-06-13 2022-09-02 北京融信数联科技有限公司 一种基于大数据的消费习惯分类方法、系统和存储介质
CN116128128A (zh) * 2023-01-17 2023-05-16 北京融信数联科技有限公司 基于智能体图谱的城市职住平衡预测方法、系统和介质
CN117858132B (zh) * 2024-03-07 2024-05-24 济南光路科技有限公司 一种基于云计算设备管理系统及方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105634854A (zh) * 2014-11-07 2016-06-01 中兴通讯股份有限公司 用户属性分析方法及装置
CN105682025A (zh) * 2016-01-05 2016-06-15 重庆邮电大学 基于移动信令数据的用户驻留地识别方法
CN106778876A (zh) * 2016-12-21 2017-05-31 广州杰赛科技股份有限公司 基于移动用户轨迹相似性的用户分类方法和系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5523274B2 (ja) * 2010-10-12 2014-06-18 Kddi株式会社 携帯端末を所持したユーザの有意圏を推定する装置、プログラム及び方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105634854A (zh) * 2014-11-07 2016-06-01 中兴通讯股份有限公司 用户属性分析方法及装置
CN105682025A (zh) * 2016-01-05 2016-06-15 重庆邮电大学 基于移动信令数据的用户驻留地识别方法
CN106778876A (zh) * 2016-12-21 2017-05-31 广州杰赛科技股份有限公司 基于移动用户轨迹相似性的用户分类方法和系统

Also Published As

Publication number Publication date
CN110955738A (zh) 2020-04-03

Similar Documents

Publication Publication Date Title
CN110955738B (zh) 一种基于信令数据结合场景信息的人物画像刻画方法
Barros et al. Using geotagged photographs and GPS tracks from social networks to analyse visitor behaviour in national parks
Hardy et al. Tracking tourists’ travel with smartphone-based GPS technology: a methodological discussion
CN109362041B (zh) 一种基于大数据的人口时空分布分析方法
Haklay How good is volunteered geographical information? A comparative study of OpenStreetMap and Ordnance Survey datasets
Chung et al. A trip reconstruction tool for GPS-based personal travel surveys
Becker et al. Human mobility characterization from cellular network data
CN109583640A (zh) 一种基于多源定位数据的城市出行客流属性识别方法
US8185131B2 (en) Method of providing location-based information from portable devices
CN106096631A (zh) 一种基于手机大数据的流动人口分类识别分析方法
Zhou et al. A data-driven method for trip ends identification using large-scale smartphone-based GPS tracking data
Hong et al. Modeling and predicting evacuation flows during hurricane Irma
Cui et al. Social media and mobility landscape: Uncovering spatial patterns of urban human mobility with multi source data
Yuan et al. Recognition of functional areas based on call detail records and point of interest data
KR20230124952A (ko) 개별 미세 위치 식별자를 표시하고 사용하기 위한 시스템및 방법
CN107133689B (zh) 一种位置标记方法
US20220100796A1 (en) Method, apparatus, and system for mapping conversation and audio data to locations
Ellersiek et al. Using Bluetooth to track mobility patterns: depicting its potential based on various case studies
Chen et al. Harnessing social media to understand tourist travel patterns in muti-destinations
CN114071366B (zh) 结合知识图谱的人物画像刻画方法、系统和可读存储介质
Girardin et al. Uncovering the presence and movements of tourists from user-generated content
CN110019237A (zh) 一种基于地图分析罪犯行踪的系统及方法
Sparks et al. Modeling Building Use and Population Distribution Opportunity Using Open Geosocial Data in Urban Areas
Baučić et al. Telecom big data for urban transport analysis–a case study of Split-Dalmatia county in Croatia
CN117493981B (zh) 游客分类方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant