CN108235253A - 用户运动剖析 - Google Patents
用户运动剖析 Download PDFInfo
- Publication number
- CN108235253A CN108235253A CN201711404354.2A CN201711404354A CN108235253A CN 108235253 A CN108235253 A CN 108235253A CN 201711404354 A CN201711404354 A CN 201711404354A CN 108235253 A CN108235253 A CN 108235253A
- Authority
- CN
- China
- Prior art keywords
- user
- time
- time interval
- cell
- cluster
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 claims abstract description 62
- 238000013459 approach Methods 0.000 claims abstract description 6
- 238000004590 computer program Methods 0.000 claims description 27
- 238000007689 inspection Methods 0.000 claims description 8
- 238000004891 communication Methods 0.000 claims description 5
- 210000003484 anatomy Anatomy 0.000 abstract description 2
- 230000002354 daily effect Effects 0.000 description 11
- 230000006870 function Effects 0.000 description 10
- 238000004422 calculation algorithm Methods 0.000 description 7
- 239000004744 fabric Substances 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 241001269238 Data Species 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000010355 oscillation Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000000454 anti-cipatory effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000005469 granulation Methods 0.000 description 1
- 230000003179 granulation Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 210000003127 knee Anatomy 0.000 description 1
- 230000002045 lasting effect Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
- 230000003442 weekly effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
- H04W4/023—Services making use of location information using mutual or relative location information between multiple location based services [LBS] targets or of distance thresholds
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
- H04W4/029—Location-based management or tracking services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2477—Temporal data queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/231—Hierarchical techniques, i.e. dividing or merging pattern sets so as to obtain a dendrogram
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0242—Determining effectiveness of advertisements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0269—Targeted advertisements based on user profile or attribute
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/52—Network services specially adapted for the location of the user terminal
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W36/00—Hand-off or reselection arrangements
- H04W36/24—Reselection being triggered by specific parameters
- H04W36/32—Reselection being triggered by specific parameters by location or mobility data, e.g. speed data
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W36/00—Hand-off or reselection arrangements
- H04W36/24—Reselection being triggered by specific parameters
- H04W36/32—Reselection being triggered by specific parameters by location or mobility data, e.g. speed data
- H04W36/322—Reselection being triggered by specific parameters by location or mobility data, e.g. speed data by location data
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
- H04W4/025—Services making use of location information using location based information parameters
- H04W4/027—Services making use of location information using location based information parameters using movement velocity, acceleration information
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0255—Targeted advertisements based on user history
- G06Q30/0256—User search
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0267—Wireless devices
Abstract
本发明涉及用户运动剖析。提供了一种方法,包括:将多个用户的相应位置数据分布到用于每个用户的相应时间框中,其中每个位置数据指示相应用户的位置,每个时间框包括相应时间间隔,时间间隔覆盖时间段,并且针对每个时间间隔存在用于每个用户的时间框;针对每对用户以及针对每个时间间隔,基于位置数据来计算相应对的用户之间的相应子距离;针对每对用户,聚合在时间段之上的子距离以获得相应对的用户之间的距离;对彼此具有最接近距离的用户进行聚类。
Description
技术领域
本发明涉及与用户运动剖析相关的装置、方法和计算机程序产品。更具体地,本发明涉及与基于小区位置数据的用户运动剖析相关的装置、方法和计算机程序产品。
缩写词
3GPP 第三代合作伙伴计划
A-GPS 辅助GPS
DB 数据库
Gb/s 千兆位每秒
GPS 全球定位系统
GSM 全球移动通信系统
GUI 图形用户界面
MNO 移动网络运营商
PoC 概念证明
POI 兴趣点
SMS 短消息服务。
背景技术
仅从移动活动以精细粒度定位用户及其移动并不是微不足道的事情。大多数定位系统使用具有A-GPS支持(或类似的卫星系统)的GPS来主动监视设备的位置。然而对于移动运营商而言,由于以下若干个原因,主动监视每个用户算不上是选项:
• 在几乎所有情况下,GPS数据仅在用户的移动设备中可用,运营商无法简单地访问其;
• 强行向用户移动设备下推应用可能是很难销售的隐私交易;
• 即使用户同意,针对所有移动类型的开发和维护应用也是昂贵的;
• 更不用说,持续的主动定位是电池耗尽的,并且导致更差的用户体验。
本领域中的一些现有技术如下:
Identification via Location-Profiling in GSM Networks (2008)
Yoni De Mulder, George Danezis, Lejla Batina, Bart Preneel
在该文章中,作者使用简单的一阶马尔可夫链和层次聚类来从GSM位置数据剖析用户的移动。他们声称在随后的时段内从这些简档的用户标识的80%准确度,并且在一个月内收集的信息如此丰富以至于其可以在之后的很长时间内用于标识用户。
线上PDF版本在以下处可用:
http://www0.cs.ucl.ac.uk/staff/G.Danezis/papers/GSMLocation-profile.pdf
Mobility Profiler: A Framework for Discovering Mobile User Profiles
(2008)
Ali Murat, Demirbas Murat, Eagle Nathan
该文章介绍了完整的移动性剖析器框架,其也处理诸如小区塔振荡(即乒乓(ping-pong))之类的问题。他们通过标识反复振荡的小区对并将其转换为小区聚类来构建小区移动性路径并减少乒乓。之后,他们使用顺序先验算法来滤出并评估主导模式。这些模式将建立该用户的移动性简档。
线上PDF版本:http://www.cse.buffalo.edu/tech-reports/2008-17.pdf。
发明内容
本发明的目的是改进现有技术。
根据本发明的第一方面,提供了一种装置,包括至少一个处理器、包括计算机程序代码的至少一个存储器,并且所述至少一个处理器利用所述至少一个存储器和所述计算机程序代码被布置为使得所述装置至少执行至少:将多个用户的相应位置数据分布到用于每个用户的相应时间框(bucket)中,其中每个位置数据指示相应用户在预定时间段期间的时间处的位置,每个时间框包括时间段的相应时间间隔,时间间隔不重叠并且覆盖时间段,时间间隔针对所有用户相同,并且针对每个时间间隔存在用于每个用户的时间框;针对每对用户以及针对每个时间间隔,基于相应时间框中的位置数据来计算相应对的用户之间的相应子距离;针对每对用户,聚合在时间段之上的子距离以获得相应对的用户之间的距离;对彼此具有最接近距离的用户进行聚类,以便获得用户的相应聚类。
位置数据可以是从通信网络获得的切换数据和/或其中位置数据可以是从定位系统获得的数据。
在时间间隔i处用户中的用户1和用户2之间的子距离可以通过以下公式之一来计算:
和
其中,C1,i和C2,i分别表示用户1和用户2的时间间隔i的时间框中的位置数据的集合,表示交集运算符,表示并集运算符,并且表示相应集合的基数。
聚类可以通过凝聚层次聚类来进行。
所述至少一个处理器利用所述至少一个存储器和所述计算机程序代码可以被布置为使得所述装置进一步执行:检查相应聚类中的用户的数量是否大于预定数量;确定其中相应聚类中的用户的数量大于预定数量的第一小区;如果相应聚类中的用户的数量大于预定数量,则在第一小区中经由小区广播向用户提供信息;和如果相应聚类中的用户的数量不大于预定数量,则通过专用消息向用户提供信息。
所述至少一个处理器利用所述至少一个存储器和所述计算机程序代码可以被布置为使得所述装置进一步执行:检查相应聚类中的用户的数量是否大于预定数量;确定其中相应聚类中的用户的数量大于预定数量的第二小区;如果相应聚类中的用户的数量大于预定数量,则增加第二小区的容量。
根据本发明的第二方面,提供了一种装置,包括至少一个处理器、包括计算机程序代码的至少一个存储器,并且所述至少一个处理器利用所述至少一个存储器和所述计算机程序代码被布置为使得所述装置至少执行至少:将多个用户的小区数据分布到用于每个用户的相应时间框中,其中每个小区数据指示用户在预定时间段期间的时间处位于其中的小区,每个时间框包括时间段的相应时间间隔,时间间隔不重叠并且覆盖时间段,时间间隔针对所有用户相同,并且针对每个时间间隔存在用于每个用户的时间框;基于相应时间框中的小区数据来计算针对每个时间间隔的每个用户的平均位置;针对每个用户以及针对每个时间间隔,确定作为在相应时间间隔之后的时间间隔处的平均位置和相应时间间隔的平均位置的差异与时间间隔的持续时间之比的相应用户的速度;对在时间段的时间间隔之上具有接近另一个用户的相应速度的相应速度的用户进行聚类,以便获得用户的相应聚类。
平均位置中的至少一个可以被计算为用户在相应时间间隔期间位于其中的小区的地理位置的质心。
聚类可以通过k-均值非监督聚类进行。
根据本发明的第三方面,提供了一种装置,包括至少一个处理器、包括计算机程序代码的至少一个存储器,并且所述至少一个处理器利用所述至少一个存储器和所述计算机程序代码被布置为使得所述装置至少执行至少:针对一个或多个小区中的每个,确定在其期间用户在预定时间段期间位于相应小区中的相应持续时间;从用户在时间段期间位于其中的小区的地理位置的加权平均来计算用户的平均位置,其中每个位置的权重基于在其期间用户位于相应小区中的持续时间。
持续时间中的至少一个可以被确定为用户执行从相应小区的第二切换的第二时间与用户执行向相应小区的第一切换的第一时间之间的时间间隔。
权重中的至少一个可以另外基于相应小区的大小。
所述至少一个处理器利用所述至少一个存储器和所述计算机程序代码可以被布置为使得所述装置进一步执行:检查是第一广告牌接近平均位置;如果第一广告牌接近平均位置,则根据用户的兴趣适配第一广告牌上示出的内容。
所述至少一个处理器利用所述至少一个存储器和所述计算机程序代码可以被布置为使得所述装置进一步执行:检查是第二广告牌接近平均位置;如果第二广告牌不接近平均位置,则将第二广告牌放置得接近平均位置。
根据本发明的第四方面,提供了一种方法,包括:将多个用户的相应位置数据分布到用于每个用户的相应时间框中,其中每个位置数据指示相应用户在预定时间段期间的时间处的位置,每个时间框包括时间段的相应时间间隔,时间间隔不重叠并且覆盖时间段,时间间隔针对所有用户相同,并且针对每个时间间隔存在用于每个用户的时间框;针对每对用户以及针对每个时间间隔,基于相应时间框中的位置数据来计算相应对的用户之间的相应子距离;针对每对用户,聚合在时间段之上的子距离以获得相应对的用户之间的距离;对彼此具有最接近距离的用户进行聚类,以便获得用户的相应聚类。
位置数据可以是从通信网络获得的切换数据和/或其中位置数据可以是从定位系统获得的数据。
在时间间隔i处用户中的用户1和用户2之间的子距离可以通过以下公式之一来计算:
和
其中,C1,i和C2,i分别表示用户1和用户2的时间间隔i的时间框中的位置数据的集合,表示交集运算符,表示并集运算符,并且表示相应集合的基数。
聚类可以通过凝聚层次聚类来进行。
该方法还可以包括:检查相应聚类中的用户的数量是否大于预定数量;确定其中相应聚类中的用户的数量大于预定数量的第一小区;如果相应聚类中的用户的数量大于预定数量,则在第一小区中经由小区广播向用户提供信息;和如果相应聚类中的用户的数量不大于预定数量,则通过专用消息向用户提供信息。
该方法还可以包括:检查相应聚类中的用户的数量是否大于预定数量;确定其中相应聚类中的用户的数量大于预定数量的第二小区;如果相应聚类中的用户的数量大于预定数量,则增加第二小区的容量。
根据本发明的第五方面,提供了一种方法,包括:将多个用户的小区数据分布到用于每个用户的相应时间框中,其中每个小区数据指示用户在预定时间段期间的时间处位于其中的小区,每个时间框包括时间段的相应时间间隔,时间间隔不重叠并且覆盖时间段,时间间隔针对所有用户相同,并且针对每个时间间隔存在用于每个用户的时间框;基于相应时间框中的小区数据来计算针对每个时间间隔的每个用户的平均位置;针对每个用户以及针对每个时间间隔,确定作为在相应时间间隔之后的时间间隔处的平均位置和相应时间间隔的平均位置的差异与时间间隔的持续时间之比的相应用户的速度;对在时间段的时间间隔之上具有接近另一个用户的相应速度的相应速度的用户进行聚类,以便获得用户的相应聚类。
平均位置中的至少一个可以被计算为用户在相应时间间隔期间位于其中的小区的地理位置的质心。
聚类可以通过k-均值非监督聚类进行。
根据本发明的第六方面,提供了一种方法,包括:针对一个或多个小区中的每个,确定在其期间用户在预定时间段期间位于相应小区中的相应持续时间;从用户在时间段期间位于其中的小区的地理位置的加权平均来计算用户的平均位置,其中每个位置的权重基于在其期间用户位于相应小区中的持续时间。
持续时间中的至少一个可以被确定为用户执行从相应小区的第二切换的第二时间与用户执行向相应小区的第一切换的第一时间之间的时间间隔。
权重中的至少一个可以另外基于相应小区的大小。
该方法还可以包括:检查是第一广告牌接近平均位置;如果第一广告牌接近平均位置,则根据用户的兴趣适配第一广告牌上示出的内容。
该方法还可以包括:检查是第二广告牌接近平均位置;如果第二广告牌不接近平均位置,则将第二广告牌放置得接近平均位置。
根据第四至第六方面的每种方法可以是用户运动剖析的方法。
根据本发明的第七方面,提供了一种包括一组指令的计算机程序产品,所述指令当在装置上执行时被配置为使得所述装置执行根据第四至第六方面中任一个的方法。计算机程序产品可以体现为计算机可读介质或者可直接加载到计算机中。
根据本发明的一些示例实施例,可以提供以下技术效果中的至少一个:
• 确定哪些用户通常一起通勤;
• 确定大量用户通勤的一天中时间;
• 确定固定区域,诸如用户的家庭位置和/或工作位置。
附图说明
进一步的细节、特征、目的和优点从结合附图进行的本发明的示例实施例的以下详细描述中是显而易见的,其中
图1示出了根据本发明的一些实施例的“一起通勤”场景中的距离计算;
图2示出了一起通勤的用户的踪迹,其中用户群组通过线类型被区分;
图3示出了通过线类型区分的通勤模式;
图4示出了根据本发明的一些实施例的近似家庭位置的示例可视化;
图5示出了根据本发明的一些实施例的概念证明的架构;
图6示出了根据本发明的一些实施例的单个服务器架构的架构;
图7示出了根据本发明的一些实施例的概念证明的可扩展架构;
图8示出了根据本发明的示例实施例的装置;
图9示出了根据本发明的示例实施例的方法;
图10示出了根据本发明的示例实施例的装置;
图11示出了根据本发明的示例实施例的方法;
图12示出了根据本发明的示例实施例的装置;
图13示出了根据本发明的示例实施例的方法;和
图14示出了根据本发明的示例实施例的装置。
具体实施方式
在下文中,参考附图详细描述本发明的某些示例实施例,其中除非另外描述,否则示例实施例的特征可以彼此自由组合。然而,要明确理解的是,某些实施例的描述仅以示例的方式给出,并且绝不意图被理解为将本发明限制于所公开的细节。
此外,要理解的是,装置被配置为执行对应的方法,尽管在一些情况下仅描述了装置或者仅描述了方法。
通过机器学习和统计分析方法,本发明的一些实施例从小区切换数据进行对每日用户例程的剖析。该增加信息可以为运营商以及为诸如广告公司或广告经纪人之类的第三方两者提供有价值的信息,特别是在线上广告生态系统中。该知识的一些其他潜在使用可以包括城市规划或疫情情况下的应急响应预测。
本发明的一些实施例使用来自移动运营商侧的小区切换数据,因此不需要任何客户端侧应用。实施例中的一些可以给出以下问题中的至少一个的答案:
1. 哪些用户一起通勤去工作
2. 用户的每日移动模式(通勤/午饭/回家时间间隔)是什么
3. 用户的固定区域(例如,家庭和/或(多个)工作区域和/或POI)是什么
在下文中,针对这些问题中的每个描述了根据本发明的一些实施例如何回答它们。注意,本发明的单个实施例可以被配置为回答这些问题中的一个、两个或三个。
在工作期间使用了以下流水线:
1. 制定可能相关的问题,并且扩展我们关于移动网络用户的知识。例如:谁一起通勤
2. 清除数据以达到更好的质量。例如:从切换数据滤出作为诸如乒乓效应之类的噪声的项目。
3. 定义(多个)距离/相似性量度,其能够关于问题比较用户。例如:在某个时间段内的共同和不同小区之比。
4. 选择适合问题陈述和距离函数的聚类算法,例如:层次聚类。
5. 验证结果并改善参数或距离量度,例如:结果可视化。
本发明的特别焦点在于该流水线的前三项上。
一起通勤
该功能的输出是关于时间和地点具有共同每日移动模式的人群。这意味着每个群组将具有在类似时间处在类似位置中每一天一起移动的用户。这样的群组的示例可以是通勤者的列车的乘客。
为了创建这些群组,首先收集每个用户的每日小区/位置数据。假设每个用户具有(小区、时间戳)元组的列表。这可以通过探查MNO的流量而容易地访问。
表1:针对每个用户所收集的数据。
首先,我们将时间戳转换为一天中时间数据(基本上丢掉日期部分),并将整天切断成固定数量的窗口(时隙/时间框)。例如,我们使用10分钟长窗口,从而生成144个时间框(因为每天有1440分钟)。在这之后,我们组织用户的数据,使得我们根据它们的时间戳将它们的小区放入到每个时间框中。这部分是有用的,因为该平均不仅减少了我们的数据,而且其还消除了大多数小区塔振荡,亦称乒乓。
注意,在我们的实现中,我们使用了10分钟窗口,但其他长度也可以是适当的;但是我们必须考虑的是,太长的窗口将生成粗略的结果,而太短的窗口更容易产生噪声。
此外,在本实施例中,考虑每日移动模式,使得一天中时间是足够的信息。然而,如果要标识其他移动时段(例如每周、每月或每年),则时间信息应包括例如一天的信息。相反,如果要标识每小时移动时段,则可以省略关于小时的信息。
转换之后,我们具有以下表2:
表2:分布在时间框中的每个用户的小区信息。
我们现在可以定义距离函数,所述距离函数计算每个时间窗口中的两个用户之间的[0...1]值。假设我们具有两个用户:U1、U2其中和C1,i、C2,i集合,其中i = 1、2、……、144(时隙数),其包含小区集合。我们将使用公式1来计算特定时隙i中的两个用户之间的(子)距离。替代地,还可以作为代替而使用公式2,因为在一些情况下,它产生优越的结果。
公式1(按交叉比的距离):
公式2(按落合系数的距离):
本文,C1,i和C2,i分别表示用户1和用户2的时间间隔i的时间框中的位置数据的集合,表示交集运算符,表示并集运算符,并且表示相应集合的基数(cardinality)。
注意:在任何公式中分母是零的特殊情况下,我们使用d = 1。
这些之外的其他度量在标识一起行进的用户方面不成功。
最后,我们可以使用标准化欧几里得距离来聚合这些子距离,以便获得两个用户之间的距离:
图1图示了距离计算的思想(根据公式1):
虚线和点线表示两个用户移动,并且如果基站存在于两个用户的时间窗口中则基站被包围,并且如果仅存在于两个用户的时间窗口之一中则不被包围。通过字母“A”和“B”,针对每个基站指示它们针对哪个用户存在于相应时间窗口中。在图上我们可以看到,当用户共享共同的路线(即列车或地铁车辆)时共同小区的数量如何增加,以及如何计算子距离。
因此我们计算每个用户对之间的距离,以获得距离矩阵,如表3中所示:
表3:指示每对用户之间的距离的距离矩阵。
注意,这不是有效的欧几里得空间,因为不能应用三角不等式定理,因此我们不能在本文使用K-均值或类似的算法。作为代替,我们将使用凝聚层次聚类方法来联结彼此具有小距离的用户(层次聚类:参见https://en.wikipedia.org/wiki/Hierarchical_clustering)。
在第一阶段处,所有用户具有其自身的聚类,并且在每个步骤中,算法合并两个最接近的聚类,从而创建具有原始两个聚类的用户的并集的新聚类。重复该步骤直到达到给定的距离阈值。在层次聚类中深入研究适当的阈值水平的标识。为了实现,我们在“单个”凝聚例程模式下使用了Python实现:该聚类方法的scipy.cluster.hierarchy(http://docs.scipy.org/doc/scipy/reference/cluster.hierarchy.html)。
该聚类的输出是可以在基于实际数据的图2的城市地图中看到的群组。本文,用户群组通过不同的线类型来区分。每个群组的最小和最大用户数量取决于应用区域。
作为根据本发明的一些实施例的示例应用,如果某个用户属于通勤者群组,则系统针对他进行分析。如果否,则一些广告将通过专用消息(例如SMS或在专用应用中)发送给该用户。然而,如果用户属于足够大小(成员数量)的通勤者群组,则广告可以在其中通勤者一起通勤的小区中通过小区广播发送给这些通勤者。因此,减少网络负载。
根据本发明的一些实施例的一些其他示例应用是:
- 基于用户的每日行进例程向他/她提供广告(广告)或折扣优惠券。
- 改变网络行为
ο针对通勤者优化带宽,因为他们可能在该时间期间使用其电话
ο针对已知的用户轨迹优化网络(共同通勤路线)
- 疾病暴发预测(可能污染路线):一起通勤并且停留在一起的人可能被标记为潜在地彼此影响。该信息可以用于分离人们并救助他们。因此,可以防止或减缓疾病的传播。
每日移动模式
根据本发明的一些实施例,该功能在一天中时间之上分析用户移动强度。与功能“一起 通勤”不同,移动位置在此并不重要,只有一时的行进距离(速度)。这对于把握在一天中同一时间处通勤或去吃午饭或回家的人是有用的。幸运地,也可能的是,人们将在行进期间通过他们的电话阅读新闻或在互联网上冲浪。
图3图示了通勤模式:对于一天中每个时间(以10分钟的步长,x轴),示出了以大于预定义的最小值的速度行进的用户的数量。
除了一些模糊的模式之外,我们已经可以看到一些人如何将以不同的运动模式在上午5、6、7、8、9或10点去工作。回家的模式在此不可见,可能是因为即使在同一上午通勤群组中的用户的情况下,回家的模式也更会因人而异。尽管如此,对午饭和回家模式的检测也可以使用时间过滤来解决。
基本的算法类似于上文讨论的功能“一起通勤”。我们针对每个用户使用布置为10分钟长的时隙的一天中时间转换的切换:
表4:分布在时间框中的用户小区。
然后,我们使用以下方式将小区转换为每个窗口中的地理位置:我们将每个小区的地理位置(例如,基站的位置或小区的覆盖区域的中心)当作地图上的点,并使用这些点计算质心。最后,我们将具有质心。该方法对于减少乒乓切换现象是有用的,在该乒乓切换现象中,小区的快速改变可能会生成噪声,这是由于环境情况造成的(即,移动的巴士阻塞当前小区站,并且移动装备切换到另一个,直到巴士让开)。
表5:每个时间框的近似用户位置。
从该信息,我们可以在每对相邻窗口(时间框)之间的时间之上从质心之间的距离内插移动速度。假设每个质心包括纬度(lat)和经度(lon)坐标,我们可以使用以下公式使用两个时间窗口之间计算以m/s的近似速度:
本文,分母600是选择的,因为每个时间框包括10分钟=600秒的数据。当然,时间框可以具有不同的持续时间,并且分母然后将相应地调整。
现在我们有下表,我们可以将它用作针对k-均值非监督聚类的输入(因为这些值对于144维欧几里得空间是有效的):
表6:每个时间框的用户速度。
k-均值是非监督学习中公知的基本聚类方法。关于k-均值聚类的更多信息可以在https://en.wikipedia.org/wiki/K-means_clustering处找到。在PoC中,我们使用scipy.cluster.vq.kmeans(http://docs.scipy.org/doc/scipy/reference/generated/scipy.cluster.vq.kmeans.html)类来进行计算。我们创建了10个聚类,其中3个如图3所示。聚类的输出可以用于将每个用户分类到最接近的匹配模式。
固定区域(例如家庭/工作区域和POI)
根据本发明的一些实施例,该功能检测诸如特定用户的POI和/或家庭/工作区域的固定区域。输入数据再次从小区切换提取。以家庭/工作区域为例,我们定义了两个固定的间隔:分别是下午9点-上午5点和上午10点-下午4点,在该时间,具有规则每日模式的人通常将在家或在工作(或对于学生而言,在学校/大学)。对于这样的人,这在大多数平日内都是如此,并且因此我们可以使用该假设来预测他们通常的家庭/工作位置(这可以基于当地习惯而适应于不同的国家,或者也可以适时取决于用户的预期行为而适应于不同的POI)。
首先我们获取这些时间间隔内的所有切换目标小区并分配权重。例如,权重可以是在下一次切换之前经过的时间(实际上,移动装置在该特定小区中所花费的时间)。如果我们计算关于这些切换小区的地理位置的加权平均,则我们得到用于每个时间间隔的最相关的位置,并且因此我们将得到家庭/工作位置近似。
详细地,在本发明的一些实施例中,设h是切换,w(h)是切换的权重,ts(h)是切换的时间戳属性。我们计算权重w(h)使得:
其中next是给定用户即将得到的下一个已知切换。设geo(h)是切换中的目标小区的二维地理位置,并且Hhome是根据假设的家庭时间间隔(下午9点-上午5点)的过滤的用户切换集合。现在我们经由以下来计算家庭位置:
工作位置或POI可以类似地计算。
权重不仅可以基于用户在特定小区中的持续时间,而且还可以涉及其他参数。例如,具有小面积的小区可能比具有大面积的小区具有更高的权重。这可以表达为例如与小区的面积成反比的附加加权因子。因此,可以反映,用户可能仅在小小区中很短时间,但是用户的位置在该时间期间以高准确度确定。
小区的地理位置可以以与针对场景“每日移动模式”所描述的相同的方式确定。
图4示出了近似家庭位置的示例可视化。在基站处指示的时间指示用户何时执行到相应小区的切换。星号指示从这些小区的加权地理位置计算的位置。如可以看到的,所计算的位置相当接近实际的位置(由大房子指示,而其他位置被指示为小房子)。
因此,每日移动模式的结果用于单独地检测固定时间段,以适合具有不规则工作时间的人。我们可以在这些固定时段中使用加权平均来检测其中用户在较长时间内停留的位置——通常这是工作场所或家庭位置。
作为应用示例,人们可以根据穿过的人在某个位置(即POI、家庭位置、工作位置等)处在某个时间内停留的简档来在现实的数字广告牌(billboard)上放动态内容。如果用户的兴趣是已知的,则人们可以使内容(例如广告、公共交通时间表、新闻、或关于交通拥堵的信息)适应于这些兴趣。更多地,人们可以基于用户的固定区域的知识来放置广告牌。
对应的应用示例可以使用上文描述的“一起通勤”场景的位置信息,以便沿着通勤者的路线放置或控制数字广告牌。
概念证明
上面描述的算法实际上可以用任何语言来实现,尽管与可以创造性地使用的语言(诸如Python)相比,对于已经具有机器学习相关库的语言而言更可行。我们的概念证明主要使用Python、Wireshark(网络封包分析软件)和PostgreSQL来完成。架构可以在图5中看到:
我们的测试数据包括来自S5/S11/S1U接口的原始分组捕获文件,包含网关切换和用户平面相关数据。从控制平面数据,用户及其切换被提取、相关并写入到数据库。小区地理位置的列表也被上传到数据库中,我们可以从其估计用户位置。还存在被实现以可视化分析的结果的GUI,包括上文针对本发明的一些实施例所描述的算法。该PoC有益于特征演示,并且使用Python对于实现快速开发是很大的帮助。
对于实际的产品,大数据就绪的语言和框架的使用是值得推荐的。单个服务器部署架构可以在图6中看到。
该解决方案旨在实现来自S5/S11/S1U接口的40 Gb/s分组数据的处理。相关引擎进行控制平面和用户平面匹配,并将用户切换转发到使用Spark Streaming编写的分类和模型构建器引擎。Spark Streaming是在Apache Spark上运行的流行成批流处理引擎。根据我们目前的估计,可以通过使用单个服务器实例来实现40 Gb/s电信网络数据的处理。
然而,多亏了Spark,该解决方案应当可容易扩展。针对>40 Gb/s PoC的未来规划可以在图7中看到。
图8示出了根据本发明的示例实施例的装置。装置可以是计算机或其元件。图9示出了根据本发明的示例实施例的方法。根据图8的装置可以执行图9的方法,但不限于该方法。图9的方法可以由图8的装置执行,但不限于由该装置执行。
装置包括分布部件10、计算部件20、聚合部件30和聚类部件40。分布部件10、计算部件20、聚合部件30和聚类部件40可以分别是分布电路、计算电路、聚合电路和聚类电路。
分布部件10将多个用户的相应位置数据分布到用于每个用户的相应时间框中(S10)。每个位置数据指示相应用户在时间处的位置。时间在诸如一天之类的预定时间段期间。每个时间框包括时间段的相应时间间隔(例如,10分钟)。时间间隔不重叠并且覆盖时间段。时间间隔针对所有用户相同,并且针对每个时间间隔存在用于每个用户的时间框。
计算部件20针对每对用户以及针对每个时间间隔,基于相应时间框中的位置数据来计算相应对的用户之间的相应子距离(S20)。
聚合部件30针对每对用户聚合在时间段(例如,一天)之上的子距离(S30)。因此,获得相应对的用户之间的距离。
聚类部件40对彼此具有最接近距离的用户进行聚类,以便获得用户的相应聚类(S40)。
图10示出了根据本发明的示例实施例的装置。装置可以是计算机或其元件。图11示出了根据本发明的示例实施例的方法。根据图10的装置可以执行图11的方法,但不限于该方法。图11的方法可以由图10的装置执行,但不限于由该装置执行。
装置包括分布部件110、计算部件120、确定部件130和聚类部件140。分布部件110、计算部件120、确定部件130和聚类部件140可以分别是分布电路、计算电路、确定电路和聚类电路。
分布部件110将多个用户的小区数据分布到用于每个用户的相应时间框中(S110)。每个小区数据指示用户在预定时间段(例如一天)期间的时间处位于其中的小区。每个时间框包括时间段的相应时间间隔(例如,10分钟)。时间间隔不重叠并且覆盖时间段。时间间隔针对所有用户相同,并且针对每个时间间隔存在用于每个用户的时间框。
计算部件120基于相应时间框中的小区数据来计算针对每个时间间隔的每个用户的平均位置(S120)。
确定部件130针对每个用户以及针对每个时间间隔,确定相应用户的速度(S130)。该速度被计算为在相应时间间隔之后的时间间隔处的平均位置与相应时间间隔的平均位置的差异与时间间隔的持续时间之比。
聚类部件140对在时间段的时间间隔之上具有接近另一个用户的相应速度的相应速度的用户进行聚类,以便获得用户的相应聚类(S140)。
图12示出了根据本发明的示例实施例的装置。装置可以是计算机或其元件。图13示出了根据本发明的示例实施例的方法。根据图12的装置可以执行图13的方法,但不限于该方法。图13的方法可以由图12的装置执行,但不限于由该装置执行。
装置包括确定部件210和计算部件220。确定部件210和计算部件220可以分别是确定电路和计算电路。
确定部件210针对一个或多个小区中的每个,确定在其期间用户在预定时间段期间位于相应小区中的相应持续时间(S210)。
计算部件220从用户在时间段期间位于其中的小区的地理位置的加权平均来计算用户的平均位置(S220)。每个位置的权重基于在其期间用户位于相应小区中的持续时间。
图14示出了根据本发明的实施例的装置。装置包括至少一个处理器610、包括计算机程序代码的至少一个存储器620,并且至少一个处理器610利用至少一个存储器620和计算机程序代码被布置为使得该装置至少执行根据图9、11和13以及相关描述的方法中的至少一个。
与de Mulder等人相比,本发明的实施例使用不同的方法和距离函数,而所描述的基本聚类算法(层次聚类)与本发明的“一起通勤”特征类似。de Mulder等人的文章也不包括用于类似通勤习惯的用户聚类方法。
由Murat等人公开的概念也与本发明的实施例非常不同。由Murat等人介绍的小区聚类中的缺点在于,当组合许多小区时,其在位置方面失去太多精度。Murat等人的文章也未介绍用于类似通勤习惯的用户聚类方法的方法。
本发明的实施例不仅可以在3GPP网络(诸如LTE、LTE-A)中采用,而且可以在其中用户的切换数据在网络中(例如在GSM网络中)可用的其他网络中采用。
一个信息片可以在一个或多个消息中从一个实体传送到另一个实体。这些消息中的每个可以包括另外的(不同的)信息片。
网络元件、协议和方法的名称基于当前的标准。在其他版本或其他技术中,这些网络元件和/或协议和/或方法的名称可以是不同的,只要它们提供对应的功能。
终端可以是可以连接到相应网络的任何设备。例如,终端可以是UE、移动电话、膝上型电脑、智能电话、机器型通信设备等。
如果没有另外陈述或从上下文中另外表明,两个实体不同的陈述意味着它们执行不同的功能。这并不一定意味着它们基于不同的硬件。也就是说,本说明书中描述的每个实体可以基于不同的硬件,或者一些或全部实体可以基于相同的硬件。其并不一定意味着它们基于不同的软件。也就是说,本说明书中描述的实体中的每个可以基于不同的软件,或者一些或全部实体可以基于相同的软件。本发明的实施例可以完全地或部分地在云中采用,其中用于相应任务的资源(例如,处理器、软件、存储器、网络)可以与其他应用共享。
根据上面的描述,因此应显而易见的是,本发明的示例实施例提供了例如计算机或其组件、体现其的装置、用于控制和/或操作其的方法、以及控制和/或操作其的(多个)计算机程序以及携带这样的(多个)计算机程序并形成(多个)计算机程序产品的介质。
作为非限制性示例,上述块、装置、系统、技术、部件、实体、单元、设备或方法中的任何一个的实现包括硬件、软件、固件、专用电路或逻辑、通用硬件或控制器或其他计算设备、虚拟机或其某种组合。
应当注意的是,实施例的描述仅以示例的方式给出,并且可以在不脱离如由所附权利要求所限定的本发明的范围的情况下进行各种修改。
Claims (30)
1.一种装置,包括至少一个处理器、包括计算机程序代码的至少一个存储器,并且所述至少一个处理器利用所述至少一个存储器和所述计算机程序代码被布置为使得所述装置至少执行至少:
将多个用户的相应位置数据分布到用于每个用户的相应时间框中,其中每个位置数据指示相应用户在预定时间段期间的时间处的位置,每个时间框包括时间段的相应时间间隔,时间间隔不重叠并且覆盖时间段,时间间隔针对所有用户相同,并且针对每个时间间隔存在用于每个用户的时间框;
针对每对用户以及针对每个时间间隔,基于相应时间框中的位置数据来计算相应对的用户之间的相应子距离;
针对每对用户,聚合在时间段之上的子距离以获得相应对的用户之间的距离;
对彼此具有最接近距离的用户进行聚类,以便获得用户的相应聚类。
2.根据权利要求1所述的装置,其中所述位置数据是从通信网络获得的切换数据,和/或其中所述位置数据是从定位系统获得的数据。
3.根据权利要求1和2中任一项所述的装置,其中在时间间隔i处所述用户中的用户1和用户2之间的子距离通过以下公式之一来计算:
和
其中,C1,i和C2,i分别表示用户1和用户2的时间间隔i的时间框中的位置数据的集合,表示交集运算符,表示并集运算符,并且表示相应集合的基数。
4.根据权利要求1至3中任一项所述的装置,其中所述聚类通过凝聚层次聚类来进行。
5.根据权利要求1至4中任一项所述的装置,其中所述至少一个处理器利用所述至少一个存储器和所述计算机程序代码被布置为使得所述装置进一步执行:
检查相应聚类中的用户的数量是否大于预定数量;
确定其中相应聚类中的用户的数量大于预定数量的第一小区;
如果相应聚类中的用户的数量大于预定数量,则在第一小区中经由小区广播向用户提供信息;和
如果相应聚类中的用户的数量不大于预定数量,则通过专用消息向用户提供信息。
6.根据权利要求1至5中任一项所述的装置,其中所述至少一个处理器利用所述至少一个存储器和所述计算机程序代码被布置为使得所述装置进一步执行:
检查相应聚类中的用户的数量是否大于预定数量;
确定其中相应聚类中的用户的数量大于预定数量的第二小区;
如果相应聚类中的用户的数量大于预定数量,则增加第二小区的容量。
7.一种装置,包括至少一个处理器、包括计算机程序代码的至少一个存储器,并且所述至少一个处理器利用所述至少一个存储器和所述计算机程序代码被布置为使得所述装置至少执行至少:
将多个用户的小区数据分布到用于每个用户的相应时间框中,其中每个小区数据指示用户在预定时间段期间的时间处位于其中的小区,每个时间框包括时间段的相应时间间隔,时间间隔不重叠并且覆盖时间段,时间间隔针对所有用户相同,并且针对每个时间间隔存在用于每个用户的时间框;
基于相应时间框中的小区数据来计算针对每个时间间隔的每个用户的平均位置;
针对每个用户以及针对每个时间间隔,确定作为在相应时间间隔之后的时间间隔处的平均位置和相应时间间隔的平均位置的差异与时间间隔的持续时间之比的相应用户的速度;
对在时间段的时间间隔之上具有接近另一个用户的相应速度的相应速度的用户进行聚类,以便获得用户的相应聚类。
8.根据权利要求7所述的装置,其中平均位置中的至少一个被计算为用户在相应时间间隔期间位于其中的小区的地理位置的质心。
9.根据权利要求7和8中任一项所述的装置,其中所述聚类通过k-均值非监督聚类进行。
10.一种装置,包括至少一个处理器、包括计算机程序代码的至少一个存储器,并且所述至少一个处理器利用所述至少一个存储器和所述计算机程序代码被布置为使得所述装置至少执行至少:
针对一个或多个小区中的每个,确定在其期间用户在预定时间段期间位于相应小区中的相应持续时间;
从用户在时间段期间位于其中的小区的地理位置的加权平均来计算用户的平均位置,其中每个位置的权重基于在其期间用户位于相应小区中的持续时间。
11.根据权利要求10所述的装置,其中持续时间中的至少一个被确定为用户执行从相应小区的第二切换的第二时间与用户执行向相应小区的第一切换的第一时间之间的时间间隔。
12.根据权利要求10至11中任一项所述的装置,其中权重中的至少一个另外基于相应小区的大小。
13.根据权利要求10至12中任一项所述的装置,其中所述至少一个处理器利用所述至少一个存储器和所述计算机程序代码被布置为使得所述装置进一步执行:
检查是第一广告牌接近平均位置;
如果第一广告牌接近平均位置,则根据用户的兴趣适配第一广告牌上示出的内容。
14.根据权利要求10至13中任一项所述的装置,其中所述至少一个处理器利用所述至少一个存储器和所述计算机程序代码被布置为使得所述装置进一步执行:
检查是第二广告牌接近平均位置;
如果第二广告牌不接近平均位置,则将第二广告牌放置得接近平均位置。
15.一种方法,包括:
将多个用户的相应位置数据分布到用于每个用户的相应时间框中,其中每个位置数据指示相应用户在预定时间段期间的时间处的位置,每个时间框包括时间段的相应时间间隔,时间间隔不重叠并且覆盖时间段,时间间隔针对所有用户相同,并且针对每个时间间隔存在用于每个用户的时间框;
针对每对用户以及针对每个时间间隔,基于相应时间框中的位置数据来计算相应对的用户之间的相应子距离;
针对每对用户,聚合在时间段之上的子距离以获得相应对的用户之间的距离;
对彼此具有最接近距离的用户进行聚类,以便获得用户的相应聚类。
16.根据权利要求15所述的方法,其中所述位置数据是从通信网络获得的切换数据,和/或其中所述位置数据是从定位系统获得的数据。
17.根据权利要求15和16中任一项所述的方法,其中在时间间隔i处所述用户中的用户1和用户2之间的子距离通过以下公式之一来计算:
和
其中,C1,i和C2,i分别表示用户1和用户2的时间间隔i的时间框中的位置数据的集合,表示交集运算符,表示并集运算符,并且表示相应集合的基数。
18.根据权利要求15至17中任一项所述的方法,其中所述聚类通过凝聚层次聚类来进行。
19.根据权利要求15至18中任一项所述的方法,还包括:
检查相应聚类中的用户的数量是否大于预定数量;
确定其中相应聚类中的用户的数量大于预定数量的第一小区;
如果相应聚类中的用户的数量大于预定数量,则在第一小区中经由小区广播向用户提供信息;和
如果相应聚类中的用户的数量不大于预定数量,则通过专用消息向用户提供信息。
20.根据权利要求15至19中任一项所述的方法,还包括:
检查相应聚类中的用户的数量是否大于预定数量;
确定其中相应聚类中的用户的数量大于预定数量的第二小区;
如果相应聚类中的用户的数量大于预定数量,则增加第二小区的容量。
21.一种方法,包括:
将多个用户的小区数据分布到用于每个用户的相应时间框中,其中每个小区数据指示用户在预定时间段期间的时间处位于其中的小区,每个时间框包括时间段的相应时间间隔,时间间隔不重叠并且覆盖时间段,时间间隔针对所有用户相同,并且针对每个时间间隔存在用于每个用户的时间框;
基于相应时间框中的小区数据来计算针对每个时间间隔的每个用户的平均位置;
针对每个用户以及针对每个时间间隔,确定作为在相应时间间隔之后的时间间隔处的平均位置和相应时间间隔的平均位置的差异与时间间隔的持续时间之比的相应用户的速度;
对在时间段的时间间隔之上具有接近另一个用户的相应速度的相应速度的用户进行聚类,以便获得用户的相应聚类。
22.根据权利要求21所述的方法,其中平均位置中的至少一个被计算用户在相应时间间隔期间位于其中的小区的地理位置的质心。
23.根据权利要求21和22中任一项所述的方法,其中所述聚类通过k-均值非监督聚类进行。
24.一种方法,包括:
针对一个或多个小区中的每个,确定在其期间用户在预定时间段期间位于相应小区中的相应持续时间;
从用户在时间段期间位于其中的小区的地理位置的加权平均来计算用户的平均位置,其中每个位置的权重基于在其期间用户位于相应小区中的持续时间。
25.根据权利要求24所述的方法,其中持续时间中的至少一个被确定为用户执行从相应小区的第二切换的第二时间与用户执行向相应小区的第一切换的第一时间之间的时间间隔。
26.根据权利要求24至25中任一项所述的方法,其中权重中的至少一个另外基于相应小区的大小。
27.根据权利要求24至26中任一项所述的方法,还包括:
检查是第一广告牌接近平均位置;
如果第一广告牌接近平均位置,则根据用户的兴趣适配第一广告牌上示出的内容。
28.根据权利要求24至27中任一项所述的方法,还包括:
检查是第二广告牌接近平均位置;
如果第二广告牌不接近平均位置,则将第二广告牌放置得接近平均位置。
29.一种包括一组指令的计算机程序产品,所述指令当在装置上执行时被配置为使得所述装置执行根据权利要求15至28中任一项的方法。
30.根据权利要求29所述的计算机程序产品,被体现为计算机可读介质或可直接加载到计算机中。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FI20166016 | 2016-12-22 | ||
FI20166016 | 2016-12-22 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108235253A true CN108235253A (zh) | 2018-06-29 |
CN108235253B CN108235253B (zh) | 2020-11-10 |
Family
ID=60781499
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711404354.2A Expired - Fee Related CN108235253B (zh) | 2016-12-22 | 2017-12-22 | 用户运动剖析 |
Country Status (4)
Country | Link |
---|---|
US (1) | US10506380B2 (zh) |
EP (1) | EP3340577B1 (zh) |
JP (1) | JP6618981B2 (zh) |
CN (1) | CN108235253B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111447552A (zh) * | 2020-03-26 | 2020-07-24 | 深圳中兴网信科技有限公司 | 人群轨迹交叉识别方法、系统和装置和可读存储介质 |
WO2022021078A1 (en) * | 2020-07-28 | 2022-02-03 | Telefonaktiebolaget Lm Ericsson (Publ) | Method and base station for cell handover |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3563592B1 (en) * | 2016-12-27 | 2020-11-25 | Telecom Italia S.p.A. | Method for determining the mobility status of a user of a wireless communication network |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120064919A1 (en) * | 2009-08-24 | 2012-03-15 | Waldeck Technology, Llc | Crowd creation system for an aggregate profiling service |
US8412234B1 (en) * | 2011-12-07 | 2013-04-02 | Sprint Communications Company L.P. | Clustering location and time for location prediction |
US8830909B1 (en) * | 2012-02-22 | 2014-09-09 | Google Inc. | Methods and systems to determine user relationships, events and spaces using wireless fingerprints |
CN104735169A (zh) * | 2015-04-17 | 2015-06-24 | 天天艾米(北京)网络科技有限公司 | 一种居住社区群发现方法 |
CN105956042A (zh) * | 2016-04-26 | 2016-09-21 | 广东小天才科技有限公司 | 一种应用程序商店的应用程序推送方法及系统 |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050008097A1 (en) * | 2001-08-17 | 2005-01-13 | Tjhung Tjeng Thiang | Coded modulation scheme for a wirelesss communication system and methods thereof |
KR100842654B1 (ko) * | 2002-09-19 | 2008-06-30 | 삼성전자주식회사 | 이동 통신 시스템에서 멀티캐스트 멀티미디어 방송서비스를 송신하는 송신 방식 결정 방법 |
JP2010197677A (ja) * | 2009-02-25 | 2010-09-09 | Nomura Research Institute Ltd | 広告コンテンツ表示装置の選択装置及び方法 |
CN102262819B (zh) | 2009-10-30 | 2014-10-15 | 国际商业机器公司 | 基于移动通信网络确定道路的实时通行时间的方法和装置 |
CN102907140B (zh) | 2010-04-01 | 2016-07-06 | 瑞典爱立信有限公司 | 用于确定移动性触发的用户设备、无线电基站及其中的方法 |
JP5523274B2 (ja) * | 2010-10-12 | 2014-06-18 | Kddi株式会社 | 携帯端末を所持したユーザの有意圏を推定する装置、プログラム及び方法 |
JP6169826B2 (ja) * | 2012-06-27 | 2017-07-26 | ソニー株式会社 | 情報処理装置、情報処理方法、プログラム及び情報処理システム |
US20140172576A1 (en) * | 2012-12-14 | 2014-06-19 | Visa International Service Association | Systems and methods to select locations of interest |
US9501507B1 (en) | 2012-12-27 | 2016-11-22 | Palantir Technologies Inc. | Geo-temporal indexing and searching |
US10417653B2 (en) | 2013-01-04 | 2019-09-17 | PlaceIQ, Inc. | Inferring consumer affinities based on shopping behaviors with unsupervised machine learning models |
US8983494B1 (en) * | 2013-02-08 | 2015-03-17 | Urban Airship, Inc. | Processing location information |
US20150193724A1 (en) * | 2014-01-06 | 2015-07-09 | International Business Machines Corporation | Providing optimized delivery locations for an order |
US9910479B2 (en) | 2014-04-16 | 2018-03-06 | Facebook, Inc. | Location based content promotion on online social networks |
US9464909B2 (en) * | 2014-09-10 | 2016-10-11 | Volkswagen Ag | Apparatus, system and method for clustering points of interest in a navigation system |
CN105430032A (zh) * | 2014-09-17 | 2016-03-23 | 阿里巴巴集团控股有限公司 | 结合终端地理位置推送信息的方法及服务器 |
US20160117732A1 (en) | 2014-10-23 | 2016-04-28 | Jian Zou | User Need Estimation On Mobile Device And Its Applications |
US11144959B2 (en) | 2014-12-18 | 2021-10-12 | Google Llc | Methods, systems, and media for presenting advertisements relevant to nearby users on a public display device |
US10049129B2 (en) * | 2014-12-22 | 2018-08-14 | Here Global B.V. | Method and apparatus for providing map updates from distance based bucket processing |
JP6468876B2 (ja) | 2015-02-18 | 2019-02-13 | Kddi株式会社 | 移動分析装置、移動分析方法および移動分析プログラム |
EP3157264B1 (en) * | 2015-10-17 | 2019-02-20 | Tata Consultancy Services Limited | Multi-sensor data summarization |
US10417648B2 (en) * | 2015-11-09 | 2019-09-17 | Industrial Technology Research Institute | System and computer readable medium for finding crowd movements |
US10437863B2 (en) * | 2016-10-21 | 2019-10-08 | Here Global B.V. | Method and apparatus for hierarchical clustering of geographical data |
-
2017
- 2017-11-29 US US15/825,670 patent/US10506380B2/en not_active Expired - Fee Related
- 2017-12-11 JP JP2017236734A patent/JP6618981B2/ja not_active Expired - Fee Related
- 2017-12-13 EP EP17206880.1A patent/EP3340577B1/en active Active
- 2017-12-22 CN CN201711404354.2A patent/CN108235253B/zh not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120064919A1 (en) * | 2009-08-24 | 2012-03-15 | Waldeck Technology, Llc | Crowd creation system for an aggregate profiling service |
US8412234B1 (en) * | 2011-12-07 | 2013-04-02 | Sprint Communications Company L.P. | Clustering location and time for location prediction |
US8830909B1 (en) * | 2012-02-22 | 2014-09-09 | Google Inc. | Methods and systems to determine user relationships, events and spaces using wireless fingerprints |
CN104735169A (zh) * | 2015-04-17 | 2015-06-24 | 天天艾米(北京)网络科技有限公司 | 一种居住社区群发现方法 |
CN105956042A (zh) * | 2016-04-26 | 2016-09-21 | 广东小天才科技有限公司 | 一种应用程序商店的应用程序推送方法及系统 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111447552A (zh) * | 2020-03-26 | 2020-07-24 | 深圳中兴网信科技有限公司 | 人群轨迹交叉识别方法、系统和装置和可读存储介质 |
WO2022021078A1 (en) * | 2020-07-28 | 2022-02-03 | Telefonaktiebolaget Lm Ericsson (Publ) | Method and base station for cell handover |
Also Published As
Publication number | Publication date |
---|---|
CN108235253B (zh) | 2020-11-10 |
JP6618981B2 (ja) | 2019-12-11 |
JP2018106704A (ja) | 2018-07-05 |
US10506380B2 (en) | 2019-12-10 |
US20180184254A1 (en) | 2018-06-28 |
EP3340577A1 (en) | 2018-06-27 |
EP3340577B1 (en) | 2020-08-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ghahramani et al. | Urban sensing based on mobile phone data: Approaches, applications, and challenges | |
Kim et al. | Extracting a mobility model from real user traces | |
Widhalm et al. | Discovering urban activity patterns in cell phone data | |
Asgari et al. | A survey on human mobility and its applications | |
Helgason et al. | Opportunistic communication and human mobility | |
Jahromi et al. | Simulating human mobility patterns in urban areas | |
US8559976B2 (en) | System and method for population tracking, counting, and movement estimation using mobile operational data and/or geographic information in mobile network | |
Fiadino et al. | Steps towards the extraction of vehicular mobility patterns from 3G signaling data | |
Holleczek et al. | Detecting weak public transport connections from cellphone and public transport data | |
Ever et al. | Performance evaluation of hybrid disaster recovery framework with D2D communications | |
Cacciapuoti et al. | Human-mobility enabled networks in urban environments: Is there any (mobile wireless) small world out there? | |
Ma et al. | Deriving operational origin-destination matrices from large scale mobile phone data | |
CN108235253A (zh) | 用户运动剖析 | |
Horn et al. | QZTool—automatically generated origin-destination matrices from cell phone trajectories | |
Pajevic et al. | Characterizing opportunistic communication with churn for crowd-counting | |
Li et al. | Potential predictability of vehicular staying time for large-scale urban environment | |
Kanjo et al. | CrowdTracing: overcrowding clustering and detection system for social distancing | |
Huang et al. | State of the art on road traffic sensing and learning based on mobile user network log data | |
Danafar et al. | Bayesian framework for mobility pattern discovery using mobile network events | |
Chen et al. | Geo-conquesting based on graph analysis for crowdsourced metatrails from mobile sensing | |
Ruiz-Pérez et al. | Integrating high-frequency data in a GIS environment for pedestrian congestion monitoring | |
Jahromi et al. | Predicting encounter and colocation events | |
Costa et al. | Towards human-aware d2d communication | |
Platos et al. | Population data mobility retrieval at territory of Czechia in pandemic COVID‐19 period | |
Mizuno et al. | Optimizing intra-facility crowding in Wi-Fi environments using continuous-time Markov chains |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20201110 Termination date: 20211222 |