CN110956188A - 基于移动通信信令数据的人口行为轨迹数字化编码方法 - Google Patents
基于移动通信信令数据的人口行为轨迹数字化编码方法 Download PDFInfo
- Publication number
- CN110956188A CN110956188A CN201811126914.7A CN201811126914A CN110956188A CN 110956188 A CN110956188 A CN 110956188A CN 201811126914 A CN201811126914 A CN 201811126914A CN 110956188 A CN110956188 A CN 110956188A
- Authority
- CN
- China
- Prior art keywords
- data
- time
- behavior
- user
- demographic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 16
- 230000011664 signaling Effects 0.000 title claims abstract description 13
- 238000010295 mobile communication Methods 0.000 title claims abstract description 12
- 238000005065 mining Methods 0.000 claims abstract description 4
- 230000003068 static effect Effects 0.000 claims abstract description 4
- 238000007621 cluster analysis Methods 0.000 claims description 4
- 238000004891 communication Methods 0.000 claims description 4
- 230000004927 fusion Effects 0.000 claims description 4
- 238000007418 data mining Methods 0.000 claims description 3
- 238000002372 labelling Methods 0.000 claims description 2
- 230000009466 transformation Effects 0.000 claims description 2
- 230000001131 transforming effect Effects 0.000 claims 1
- 238000004458 analytical method Methods 0.000 description 2
- 230000019771 cognition Effects 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 230000006698 induction Effects 0.000 description 2
- 241000283707 Capra Species 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/251—Fusion techniques of input or preprocessed data
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种基于移动通信信令数据的人口行为轨迹数字化编码方法,立足于人口统计学数据、行为数据以及内容数据定向体系,利用多接口的静态及动态数据,对多源数据进行融合,并时间空间化数据;利用上述数据,对用户行为事实与习惯归纳分析,挖掘用户喜好、兴趣,抽象出特征标签,通过特征标签聚类细分用户群,抽取特征标签并进行标准化编码。
Description
技术领域
本发明涉及移动通信技术领域,尤其涉及一种利用移动通信信令数据进行人口行为轨迹数字化编码的方法。
背景技术
通信运营商拥有的大数据具有全面性、多维性、中立性、完整性,是其它企业很难比拟的,如果在确保客户信息安全的条件下,建立一种合法合理有效的共享数据,可以连接个人、企业和政府,则可让运营商的大数据真正服务于社会。但这需要一套标准的、可管理、且具备高效计算能力的编码体系,对用户进行全景认知,为各种大数据分析、服务、商业、复杂事件管理等提供数据基础
通信运营商数据虽然丰富巨量,存什么样的数据和怎么存,来自不同信息系统的人口数据,存在数据量巨大、格式、语义等不一致等问题,数据挖掘的准确性和速度成为难点问题。人口统计数据维度多,用户分类直接按统计数据的维度进行分类,存在分类数据难以收敛聚合的难题。
发明内容
本发明的目的在于以多源数据基于时空融合为基础,提出一种人口行为轨迹的数字化编码技术,解决传统统计数据不能直接作为用户个性化信息分类与编码的原型与依据。
本发明的技术方案如下:
一种基于移动通信信令数据的人口行为轨迹数字化编码方法,其特征在于:
(1)立足于人口统计学数据、行为数据以及内容数据定向体系,利用多接口的静态及动态数据,对多源数据进行融合,并时间空间化数据;
(2)利用上述数据,对用户行为事实与习惯归纳分析,挖掘用户喜好、兴趣,抽象出特征标签,通过特征标签聚类细分用户群,抽取特征标签并进行标准化编码。
上述步骤(1)中对多源数据进行融合,并时间空间化数据,具体方法是:
(11)梳理人、位置、时间、复杂事件各自的特征,建立人、位置、时间、复杂事件四个维度的基本特征数据库;
(12)建立人与人、人与位置、人与时间、人与事件、时间与位置、时间与时间、位置与位置间的相关性特征库数据库。
本发明提供了一套标准的、可管理、且具备高效计算能力的编码体系,可对用户进行全景认知,为各种大数据分析、服务、商业、复杂事件管理等提供数据基础。
具体实施方式
本发明包括以下步骤:
(1)立足于人口统计学数据、行为数据以及内容数据定向体系,利用多接口的静态数据(事件统计数据)及动态数据(路径跟踪),对多源数据进行融合,并时间空间化数据;
(2)通过用户行为事实与习惯归纳分析,挖掘用户喜好、兴趣,抽象出特征标签,通过特征标签聚类细分用户群,抽取特征标签并进行标准化编码。
具体实现方式如下:
(1)梳理人、位置、时间、复杂事件各自的特征,建立人、位置、时间、复杂事件四个维度的基本特征数据库(点);
(2)建立人与人、人与位置、人与时间、人与事件、时间与位置、时间与时间、位置与位置间的相关性特征库数据库(线);
(3)深度挖掘建立,人在时空中的事件全景信息的特征数据库(面);
(4)对上述所有特征数据进行标签化;
(5)对标签进行标准化编码。
上述方法中,所述多源数据,包括用户人口统计数据、通信信令数据、网络工程数据、无线信号覆盖数据、地图poi数据、室内定位数据、上网数据等以及航班数据、天气数据等等;
所述多源数据融合,是基于用户、时间、位置等基础数据及关联机制,时间空间化所有数据;
时间空间化所有数据,是基于地图,对数据的进行时空描像,空间时间化所有数据是把这些数据融合起来基础。
人口统计学数据,即去个人隐私化。
行为数据:包括用户的实际生活空间中的全量路径,其中分为“驻点”数据和“路径”边数据。
驻点是指:工作地、居住地、商业地等有效驻留了一段时间后(>=15分钟)的位置数据,一切行为轨迹基于空间和时间上的描像;
路径是指:按时序排列,两个驻点数据之间的联系,包含时段分布上、时间花费上、行进速度、路径上的场景(单独、多人)等信息;
动态数据:把驻点和路径链接起来,空间驻留特性,时空上的转移特性。
例如:夏季,某日下午,天气晴朗,青年女性、8:00上班,居住地-工作地,花费54分钟,其中在地点A堵了15分钟,中午12:10出现在商场A,逗留45分钟,13:05工作地,18:00离开工作地,19:30到居住地,地点c堵了20分钟…….
通过用户行为事实与习惯归纳分析,挖掘用户喜好、兴趣,抽象出特征标签,通过特征标签聚类细分用户群,抽取特征标签并进行标准化编码:
标签包括:
a、基础标签,男女、年龄等基础属性,标识用户的基本身份(去隐私化),便于对人群常规性聚类分析即人口统计学数据。
例如:某人0102202xxxx0101008600100001;
性别:01(编码格式xx,00,代表男性,01代表女性);
年龄:022 02xxxx(编码格式xxxxxxxxx,022-代表真实年龄,02-代表成年,XXXX,扩展字段,分析人员可自定义,或自动分类存入临时结果);
星座:01(编码格式xx,01,山羊…….);
生肖:01(编码格式xx,01,老鼠…….);
国籍:0086(编码格式xxxx,0086,中国);
居住城市:0010(编码格式xxxx,0010,北京);
居住区域:0001(编码格式xxxx,0001,某区);
…….
以此类推。
b、社会标签,如职业、收入水平、外地务工人员、来源地等等,标识用户的社会身份,便于对人群多维度聚类分析。
c、行为标签,行为事实及行为轨迹描述,标识用户的行为特征,因人而异,因群而分,通过数据挖掘算法,不受个人喜好属性所支配,受社会及周边环境所影响。
行为事实:居住地、工作地、商娱地、旅游地、医院等。
编码格式xxxx yyyy zzzz mmmm,
Xxxx地理位置编号(10*10米的栅格号),如:
Yyyy行为属性,如,0000居住地、0001工作地、0003商娱地;
Zzzz位置属性,如,0000写字楼、0001医院、0003景区;
Mmmm驻留属性,如,具体数值(分日、周、月、等)
行为轨迹描述:起点、终点、空间跨度(距离)、时间开销、发生的时间段、例如工作地-居住地:
编码格式xxxx yyyy zzzz;
Xxxx工作时长,如,0015;
Yyyy工作感知,如,0001差;
Zzzz工作规律,如,0000长期加班、0101不加班;
定性值是根据定量值按照一定的规则计算得到,一般分为2-5个等级;
例如,特定空间下,单位面积人数为0.2-0.3m2/人,平均用户间距0.6m或以下时,安检排队时长8分钟以上,用户体验差(0001);
d、喜好标签:能反映出主观个性特征,多维度提炼群体特征、社区、工作区等;
包括且不限于:路径偏好、工作习惯、生活起居习惯、出行时间方式、商业习惯,随行情况、交通工具、互联网习惯等等;
e、标签变化标签:历史溯源,能反映出用户社会背景、生活工作诉求以及行为习惯变化规律及转移等;
用户行为轨迹包括:
居住-工作时空分布特征;
居住-商娱时空间分布特征;
工作-商娱时空分布特征。
Claims (6)
1.一种基于移动通信信令数据的人口行为轨迹数字化编码方法,其特征在于:
(1)立足于人口统计学数据、行为数据以及内容数据定向体系,利用多接口的静态及动态数据,对多源数据进行融合,并时间空间化数据;
(2)利用上述数据,对用户行为事实与习惯归纳分析,挖掘用户喜好、兴趣,抽象出特征标签,通过特征标签聚类细分用户群,抽取特征标签并进行标准化编码。
2.根据权利要求1所述的基于移动通信信令数据的人口行为轨迹数字化编码方法,其特征在于:步骤(1)中对多源数据进行融合,并时间空间化数据,具体方法是:
(11)梳理人、位置、时间、复杂事件各自的特征,建立人、位置、时间、复杂事件四个维度的基本特征数据库;
(12)建立人与人、人与位置、人与时间、人与事件、时间与位置、时间与时间、位置与位置间的相关性特征库数据库。
3.根据权利要求1所述的基于移动通信信令数据的人口行为轨迹数字化编码方法,其特征在于:
所述多源数据,包括用户人口统计数据、通信信令数据、网络工程数据、无线信号覆盖数据、地图poi数据、室内定位数据、上网数据,以及航班数据、天气数据;
所述多源数据融合,包括基于用户、时间、位置等基础数据及关联机制,时间空间化所有数据;
所述时间空间化数据,是基于地图,对数据的进行时空描像。
4.根据权利要求1所述的基于移动通信信令数据的人口行为轨迹数字化编码方法,其特征在于:
所述人口统计学数据,是指去个人隐私化数据;
所述行为数据,包括用户的实际生活空间中的全量路径,其中分为“驻点”数据和“路径”边数据;所述驻点,包括在工作地、居住地、商业地有效驻留了一段时间后的位置数据;所述路径,是按时序排列,两个驻点数据之间的联系,包含时段分布上、时间花费上、行进速度、路径上的场景信息;
所述动态数据,是把驻点和路径链接起来,包括空间驻留特性、时空上的转移特性。
5.根据权利要求1所述的基于移动通信信令数据的人口行为轨迹数字化编码方法,其特征在于,所述标签包括:
a、基础标签:包括性别、年龄属性,标识用户的基本身份,便于对人群常规性聚类分析,即人口统计学数据;
b、社会标签:包括职业、收入水平、外地务工人员、来源地信息,标识用户的社会身份,便于对人群多维度聚类分析;
c、行为标签:行为事实及行为轨迹描述,标识用户的行为特征,因人而异,因群而分,通过数据挖掘算法,不受个人喜好属性所支配,受社会及周边环境所影响;其中行为事实包括居住地、工作地、商娱地、旅游地、医院;行为轨迹描述包括起点、终点、空间跨度、时间开销、发生的时间段;
d、喜好标签:能反映出主观个性特征,多维度提炼群体特征、社区、工作区,包括且不限于路径偏好、工作习惯、生活起居习惯、出行时间方式、商业习惯,随行情况、交通工具、互联网习惯;
e、标签变化标签:历史溯源,能反映出用户社会背景、生活工作诉求以及行为习惯变化规律及转移信息。
6.根据权利要求5所述的基于移动通信信令数据的人口行为轨迹数字化编码方法,其特征在于,所述用户行为轨迹描述包括:
a、居住-工作时空分布特征;
b、居住-商娱时空间分布特征;
c、工作-商娱时空分布特征。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811126914.7A CN110956188A (zh) | 2018-09-26 | 2018-09-26 | 基于移动通信信令数据的人口行为轨迹数字化编码方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811126914.7A CN110956188A (zh) | 2018-09-26 | 2018-09-26 | 基于移动通信信令数据的人口行为轨迹数字化编码方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110956188A true CN110956188A (zh) | 2020-04-03 |
Family
ID=69966244
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811126914.7A Pending CN110956188A (zh) | 2018-09-26 | 2018-09-26 | 基于移动通信信令数据的人口行为轨迹数字化编码方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110956188A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111582948A (zh) * | 2020-05-25 | 2020-08-25 | 北京航空航天大学 | 一种基于手机信令数据与poi兴趣点的个体行为分析方法 |
CN112241685A (zh) * | 2020-09-16 | 2021-01-19 | 四川天翼网络服务有限公司 | 一种基于社区活动轨迹的人员聚类方法及系统 |
CN112667760A (zh) * | 2020-12-24 | 2021-04-16 | 北京市安全生产科学技术研究院 | 一种用户出行活动轨迹编码方法 |
CN114254716A (zh) * | 2022-03-02 | 2022-03-29 | 浙江鹏信信息科技股份有限公司 | 一种基于用户行为分析的高危操作识别方法及系统 |
CN114741612A (zh) * | 2022-06-13 | 2022-07-12 | 北京融信数联科技有限公司 | 一种基于大数据的消费习惯分类方法、系统和存储介质 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101694706A (zh) * | 2009-09-28 | 2010-04-14 | 深圳先进技术研究院 | 基于多源数据融合的人口时空动态出行特征建模方法 |
US8295597B1 (en) * | 2007-03-14 | 2012-10-23 | Videomining Corporation | Method and system for segmenting people in a physical space based on automatic behavior analysis |
CN102867016A (zh) * | 2012-07-18 | 2013-01-09 | 北京开心人信息技术有限公司 | 一种基于标签的社交网络用户兴趣挖掘方法与装置 |
CN104732756A (zh) * | 2013-12-24 | 2015-06-24 | 中兴通讯股份有限公司 | 一种利用移动通信数据挖掘进行公交规划的方法 |
CN104834990A (zh) * | 2015-03-31 | 2015-08-12 | 北京首都国际机场股份有限公司 | 旅客信息化编码的方法及装置 |
WO2016130614A1 (en) * | 2015-02-12 | 2016-08-18 | Mogimo, Inc. | Method and system for analysis of user data based on social network connections |
CN106055617A (zh) * | 2016-05-26 | 2016-10-26 | 乐视控股(北京)有限公司 | 一种数据推送方法及装置 |
CN107025578A (zh) * | 2017-04-13 | 2017-08-08 | 上海艾德韦宣股份有限公司 | 一种大数据智能营销系统及营销方法 |
CN107423385A (zh) * | 2017-07-19 | 2017-12-01 | 安徽拓通信科技集团股份有限公司 | 基于大数据的用户深层标签挖掘方法 |
-
2018
- 2018-09-26 CN CN201811126914.7A patent/CN110956188A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8295597B1 (en) * | 2007-03-14 | 2012-10-23 | Videomining Corporation | Method and system for segmenting people in a physical space based on automatic behavior analysis |
CN101694706A (zh) * | 2009-09-28 | 2010-04-14 | 深圳先进技术研究院 | 基于多源数据融合的人口时空动态出行特征建模方法 |
CN102867016A (zh) * | 2012-07-18 | 2013-01-09 | 北京开心人信息技术有限公司 | 一种基于标签的社交网络用户兴趣挖掘方法与装置 |
CN104732756A (zh) * | 2013-12-24 | 2015-06-24 | 中兴通讯股份有限公司 | 一种利用移动通信数据挖掘进行公交规划的方法 |
WO2016130614A1 (en) * | 2015-02-12 | 2016-08-18 | Mogimo, Inc. | Method and system for analysis of user data based on social network connections |
CN104834990A (zh) * | 2015-03-31 | 2015-08-12 | 北京首都国际机场股份有限公司 | 旅客信息化编码的方法及装置 |
CN106055617A (zh) * | 2016-05-26 | 2016-10-26 | 乐视控股(北京)有限公司 | 一种数据推送方法及装置 |
CN107025578A (zh) * | 2017-04-13 | 2017-08-08 | 上海艾德韦宣股份有限公司 | 一种大数据智能营销系统及营销方法 |
CN107423385A (zh) * | 2017-07-19 | 2017-12-01 | 安徽拓通信科技集团股份有限公司 | 基于大数据的用户深层标签挖掘方法 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111582948A (zh) * | 2020-05-25 | 2020-08-25 | 北京航空航天大学 | 一种基于手机信令数据与poi兴趣点的个体行为分析方法 |
CN111582948B (zh) * | 2020-05-25 | 2023-04-18 | 北京航空航天大学 | 一种基于手机信令数据与poi兴趣点的个体行为分析方法 |
CN112241685A (zh) * | 2020-09-16 | 2021-01-19 | 四川天翼网络服务有限公司 | 一种基于社区活动轨迹的人员聚类方法及系统 |
CN112667760A (zh) * | 2020-12-24 | 2021-04-16 | 北京市安全生产科学技术研究院 | 一种用户出行活动轨迹编码方法 |
CN112667760B (zh) * | 2020-12-24 | 2022-03-29 | 北京市应急管理科学技术研究院 | 一种用户出行活动轨迹编码方法 |
CN114254716A (zh) * | 2022-03-02 | 2022-03-29 | 浙江鹏信信息科技股份有限公司 | 一种基于用户行为分析的高危操作识别方法及系统 |
CN114254716B (zh) * | 2022-03-02 | 2022-05-27 | 浙江鹏信信息科技股份有限公司 | 一种基于用户行为分析的高危操作识别方法及系统 |
CN114741612A (zh) * | 2022-06-13 | 2022-07-12 | 北京融信数联科技有限公司 | 一种基于大数据的消费习惯分类方法、系统和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110956188A (zh) | 基于移动通信信令数据的人口行为轨迹数字化编码方法 | |
Yin et al. | A generative model of urban activities from cellular data | |
Luo et al. | Explore spatiotemporal and demographic characteristics of human mobility via Twitter: A case study of Chicago | |
US11869110B2 (en) | Early warning method and system for regional public security management in smart city based on the internet of things | |
CN109362041B (zh) | 一种基于大数据的人口时空分布分析方法 | |
Wu et al. | Comparison of the spatiotemporal mobility patterns among typical subgroups of the actual population with mobile phone data: A case study of Beijing | |
CN115271635B (zh) | 智慧社区服务平台系统 | |
CN111950937A (zh) | 一种基于融合时空轨迹的重点人员风险评估方法 | |
CN104254865A (zh) | 凭经验的专家确定和问题路由系统和方法 | |
Liang et al. | Individual travel behavior modeling of public transport passenger based on graph construction | |
Chu et al. | Passenger demand prediction with cellular footprints | |
CN111813835A (zh) | 一种基于手机信令和poi数据的公共活动中心识别系统 | |
CN111353173B (zh) | 一种使用图差分隐私模型的敏感标签轨迹数据发布方法 | |
CN111049818B (zh) | 一种基于网络流量大数据的异常信息发现方法 | |
CN110503485B (zh) | 地理区域分类方法及装置、电子设备、存储介质 | |
Qin et al. | Spatio-temporal routine mining on mobile phone data | |
Yao et al. | Understanding human activity and urban mobility patterns from massive cellphone data: Platform design and applications | |
Guo et al. | Exploring potential travel demand of customized bus using smartcard data | |
CN111914780A (zh) | 一种智慧街道管理平台 | |
CN104834990A (zh) | 旅客信息化编码的方法及装置 | |
CN114511432A (zh) | 一种基于区块链的数字乡村管理服务系统 | |
Dai et al. | Postearthquake situational awareness based on mobile phone signaling data: An example from the 2017 Jiuzhaigou earthquake | |
Yang et al. | Clustering Daily Metro Origin-Destination Matrix in Shenzhen China | |
CN112308325B (zh) | 热力图生成方法和装置 | |
CN111311365A (zh) | 基于天气信息的着装推荐系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20200403 |
|
WD01 | Invention patent application deemed withdrawn after publication |