CN107818116B - 用于确定用户行为区域位置信息的方法与设备 - Google Patents

用于确定用户行为区域位置信息的方法与设备 Download PDF

Info

Publication number
CN107818116B
CN107818116B CN201610825988.4A CN201610825988A CN107818116B CN 107818116 B CN107818116 B CN 107818116B CN 201610825988 A CN201610825988 A CN 201610825988A CN 107818116 B CN107818116 B CN 107818116B
Authority
CN
China
Prior art keywords
behavior
wireless access
cluster
information
connection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610825988.4A
Other languages
English (en)
Other versions
CN107818116A (zh
Inventor
忽美珊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Zhangmen Science and Technology Co Ltd
Original Assignee
Shanghai Zhangmen Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Zhangmen Science and Technology Co Ltd filed Critical Shanghai Zhangmen Science and Technology Co Ltd
Priority to CN201610825988.4A priority Critical patent/CN107818116B/zh
Publication of CN107818116A publication Critical patent/CN107818116A/zh
Application granted granted Critical
Publication of CN107818116B publication Critical patent/CN107818116B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0261Targeted advertisements based on user location
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0267Wireless devices
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W48/00Access restriction; Network selection; Access point selection
    • H04W48/16Discovering, processing access restriction or access information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W64/00Locating users or terminals or network equipment for network management purposes, e.g. mobility management

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Signal Processing (AREA)
  • General Engineering & Computer Science (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Computer Security & Cryptography (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本申请的目的是提供一种用于确定用户行为区域位置信息的方法与设备。与现有技术相比,本申请通过获取用户设备连接无线接入点的连接信息,其中,所述连接信息包括所述用户设备连接无线接入点的连接时间及所述无线接入点的位置信息,然后基于所述连接时间对所述无线接入点进行聚类处理,确定行为聚类簇,其中,所述行为聚类簇与用户的行为区域对应,进一步地,根据所述行为聚类簇中无线接入点的位置信息确定与所述行为聚类簇对应的行为区域的位置信息。这种方式能够更加准确的确定用户行为区域的位置信息,从而能够为后续应用提供更好的数据基础。

Description

用于确定用户行为区域位置信息的方法与设备
技术领域
本申请涉及计算机领域,尤其涉及一种用于确定用户行为区域位置信息的技术。
背景技术
用户通过用户设备就近连接无线接入点,即使在同一地点所连接到的无线接入点并非每次相同,而且用户并未告知其连接无线接入点的行为区域,例如住宅区域、办公区域或者午餐区域等等,用户设备所获取到移动操作系统中记录的全球定位系统的地理坐标可能并非用户的实时坐标,因此,在现有技术中简单的统计用户积累的地理坐标有可能错误地标记其行为区域的位置信息。再者,不同用户的连网习惯各不相同,并没有一个既定的模型作为依据来预测每个用户的行为区域的位置信息,因此,如何更准确有效地估计用户的行为区域的位置信息成为一个亟待解决的问题。
发明内容
本申请的目的是提供一种用于确定用户行为区域位置信息的方法与设备。
根据本申请的一个方面,提供了一种用于确定用户行为区域位置信息的方法,其中,该方法包括:
获取用户设备连接无线接入点的连接信息,其中,所述连接信息包括所述用户设备连接无线接入点的连接时间及所述无线接入点的位置信息;
基于所述连接时间对所述无线接入点进行聚类处理,确定行为聚类簇,其中,所述行为聚类簇与用户的行为区域对应;
根据所述行为聚类簇中无线接入点的位置信息确定与所述行为聚类簇对应的行为区域的位置信息。
根据本申请的另一方面,还提供了一种用于确定用户行为区域位置信息的设备,其中,该设备包括:
第一装置,用于获取用户设备连接无线接入点的连接信息,其中,所述连接信息包括所述用户设备连接无线接入点的连接时间及所述无线接入点的位置信息;
第二装置,用于基于所述连接时间对所述无线接入点进行聚类处理,确定行为聚类簇,其中,所述行为聚类簇与用户的行为区域对应;
第三装置,用于根据所述行为聚类簇中无线接入点的位置信息确定与所述行为聚类簇对应的行为区域的位置信息。
与现有技术相比,本申请通过获取用户设备连接无线接入点的连接信息,其中,所述连接信息包括所述用户设备连接无线接入点的连接时间及所述无线接入点的位置信息,然后基于所述连接时间对所述无线接入点进行聚类处理,确定行为聚类簇,其中,所述行为聚类簇与用户的行为区域对应,进一步地,根据所述行为聚类簇中无线接入点的位置信息确定与所述行为聚类簇对应的行为区域的位置信息。这种方式能够更加准确的确定用户行为区域的位置信息,从而能够为后续应用提供更好的数据基础。
而且,本申请还可以将所述包含最多无线接入点的位置聚类簇中的无线接入点的位置所围成的区域的位置信息,确定为所述位置聚类簇所属的行为聚类簇对应的行为区域的位置信息。这种根据包含最多无线接入点的位置聚类簇确定对应的行为区域的位置信息的方式,能够更好的减小误差,从而使位置信息更加准确。
此外,本申请还可以确定与所述行为聚类簇对应的行为区域的位置信息相匹配的推荐信息,并且当所述用户设备位于所述行为区域内时,将所述推荐信息发送至所述用户设备。这种方式,可以根据用户对应的行为区域的位置信息,向用户发送对应的推荐信息,例如,广告,促销信息或者商务相关信息等等,能够为用户的生活提供很大的方便。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1示出根据本申请一个方面的一种用于确定用户行为区域位置信息的方法流程图;
图2示出根据本申请一个优选实施例的一种用于确定用户行为区域位置信息的方法流程图;
图3示出根据本申请另一个方面的一种用于确定用户行为区域位置信息的设备示意图;
图4示出根据本申请另一个优选实施例的一种用于确定用户行为区域位置信息的设备示意图。
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
下面结合附图对本发明作进一步详细描述。
在本申请一个典型的配置中,终端、服务网络的设备和可信方均包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
为更进一步阐述本申请所采取的技术手段及取得的效果,下面结合附图及较佳实施例,对本申请的技术方案,进行清楚和完整的描述。
图1示出本申请一个方面提供的一种用于确定用户行为区域位置信息的方法,其中,该方法包括:
S1获取用户设备连接无线接入点的连接信息,其中,所述连接信息包括所述用户设备连接无线接入点的连接时间及所述无线接入点的位置信息;
S2基于所述连接时间对所述无线接入点进行聚类处理,确定行为聚类簇,其中,所述行为聚类簇与用户的行为区域对应;
S3根据所述行为聚类簇中无线接入点的位置信息确定与所述行为聚类簇对应的行为区域的位置信息。
在该实施例中,在所述步骤S1中,设备1获取用户设备连接无线接入点的连接信息,其中,所述连接信息包括所述用户设备连接无线接入点的连接时间及所述无线接入点的位置信息;在此,所述设备1包括但不限于计算机、网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云;其中,云由基于云计算(Cloud Computing)的大量计算机或网络服务器构成,进一步地,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个虚拟超级计算机;所述设备1还可以包括但不限于任何一种可与用户通过触摸板进行人机交互的移动电子产品,例如智能手机、平板电脑等,所述移动电子产品可以采用任意操作系统,如android操作系统、iOS操作系统等。本领域技术人员应能理解上述设备1仅为举例,其他现有的或今后可能出现的用户设备如可适用于本申请,也应包含在本申请保护范围以内,并在此以引用方式包含于此。具体地,设备1获取用户设备连接无线接入点的连接信息的方式可以在相应的记录该连接信息的存储设备获取。
继续在该实施例中,在所述步骤S2中,设备1基于所述连接时间对所述无线接入点进行聚类处理,确定行为聚类簇,其中,所述行为聚类簇与用户的行为区域对应。在此,其中,所述行为区域包括用户日常活动的不同区域,例如,住宅区域、办公区域、午餐区域、商业区域、休闲区域或者周末的其他活动区域等等。由于大多数用户的行为活动具有规律性,例如,白天为上班时间,晚上在住宅区域等等,因此,可以基于用户连接无线接入点的连接时间对所述无线接入点进行聚类处理,确定行为聚类簇,其中,所述行为聚类簇包括在用户的行为区域内的一个或多个无线接入点,例如,可以根据用户连接无线接入点的连接时间确定出用户的住宅区域或者办公室等等对应的行为聚类簇。在此,可以通过丛集聚合(Hierarchical Agglomerative Clustering)算法做聚类运算。
优选地,其中,所述步骤S1包括:设备1获取所述用户在至少一个行为周期内连接无线接入点的连接信息。具体地,由于大多数用户的行为活动具有规律性,因此,可以选取用户在一个或多个行为周期内连接无线接入点的连接信息,例如,对于大多数用户来说,可以选取一周作为一个行为周期,如周一至周五是工作日,周末是休息日,因此,设备1可以获取所述用户在一周或几周内连接无线接入点的连接信息以能够更准确的确定用户的行为区域。更优选地,其中,所述步骤S2包括:S21(未示出)设备1基于所述连接时间统计所述用户设备在行为周期的每个单位时间内连接无线接入点的连接次数;S22(未示出)设备1根据所述用户设备在行为周期的每个单位时间内连接无线接入点的连接次数,对所述无线接入点进行聚类处理,确定行为聚类簇,其中,所述行为聚类簇与用户的行为区域对应。具体地,在所述步骤S21中,其中,所述单位时间是预设好的,例如,可以选取一小时作为一个单位时间,而且,当行为周期为一周时,可以统计一周内每天的每个小时内连接无线接入点的连接次数,当有多个行为周期时,可以将多个行为周期内对应单位时间内连接无线接入点的连接次数进行累加,例如,设备1获取了四周内的每天每小时内连接无线接入点的连接次数,可以将4个周一、周二直到周日对应小时内的连接次数进行累加以归入到一个行为周期内,如将4个周一九点到十点的连接次数进行累加,以获得周一九点到十点的连接次数。在此,所述连接次数的统计是基于用户的一次活动或操作,例如,浏览一次新闻算作一次连接等。进一步地,在所述步骤S22中,本领域的技术人员应能理解,由于大多数用户的行为活动具有规律性,因此,用户连接无线接入点的连接次数相似的无线接入点可以归入一个行为聚类簇,所以可以根据所述用户设备在行为周期的每个单位时间内连接无线接入点的连接次数,对所述无线接入点进行聚类处理,确定行为聚类簇。
更优选地,其中,所述步骤S22包括:设备1根据所述用户设备在行为周期的每个单位时间内连接无线接入点的连接次数,获取所述用户设备在行为周期内连接每个无线接入点的连接频率分布向量;进一步地,设备1根据所述连接频率分布向量计算所述每个无线接入点之间的连接频率分布距离;更进一步地,设备1将所述连接频率分布距离小于等于连接频率分布距离阈值的无线接入点归入同一行为聚类簇。具体地,例如,取一周作为一个行为周期,假设某用户在过去28天(即四周)内,连接无线接入点包括热点1、热点2和热点3,对于该用户我们取在过去连续28天里面每个热点在每个小时上的连接次数,为每个热点生成一个维度为24(小时)*7(天)*4(周)=672的连接频率分布向量,为了研究用户一个行为周期的数据,我们将这个维度为672的连接频率分布向量对折叠加两次,生成一个维度为24*7=168的连接频率分布向量,即每个热点对应一个维度为24*7=168的连接频率分布向量,进一步地,设备1根据所述连接频率分布向量计算所述每个无线接入点之间的连接频率分布距离,在此,采用的计算方法可以通过KL(Kullback-Leibler Divergence)散度公式进行计算,得到所述每个无线接入点之间的连接频率分布距离,在此,为了简便起见,不取维度为168的连接频率分布向量,取一个维度为7的连接频率分布向量为例,例如,热点1、热点2和热点3对应的连接频率分布向量分别为热点1:(23 67 57 86 76 72 18)、热点2:(15 69 97102 89 92 14)、热点3:(25 0 0 12 9 2 34),然后通过KL散度公式进行计算,在计算之前由于所述无线接入点的连接频率分布向量中可能会出现0,因此,计算连接频率分布距离之前需要通过拉普拉斯平滑对每个连接频率分布向量做平滑处理。例如,以上三个热点的向量做平滑之后结果如下:
热点1:(0.05911330 0.16748768 0.14285714 0.21428571 0.189655170.17980296 0.04679803);
热点2:(0.03298969 0.14432990 0.20206186 0.21237113 0.185567010.19175258 0.03092784);
热点3:(0.29213483 0.01123596 0.01123596 0.14606742 0.112359550.03370787 0.39325843),由于KL散度本身是非对称的,我们取其对称形式JS散度(Jensen-Shannon Divergence),它们之间的对称连接频率分布距离矩阵计算结果如下:
Figure BDA0001115042950000071
由表可以看出,每个热点与其本身的距离为0,热点1跟热点2之间的连接频率分布距离较小,而热点3与热点1和热点2之间的连接频率分布距离都较大。因此,最有可能将热点1和热点2归入同一行为聚类簇。
继续在该实施例中,在所述步骤S3中,设备1根据所述行为聚类簇中无线接入点的位置信息确定与所述行为聚类簇对应的行为区域的位置信息。具体地,所述行为聚类簇所述行为聚类簇与用户的行为区域对应,因此,可以根据每个行为聚类簇中无线接入点的位置信息确定对应的行为区域的位置信息,具体地,可以根据每个行为聚类簇中所有无线接入点的位置信息确定该行为聚类簇对应的行为区域的位置信息,例如,可以将该行为聚类簇中所有无线接入点的位置信息取均值,并确定以该均值为圆心及一定预设半径范围内的区域为对应的行为区域的位置信息。
在一个优选的实施例中,参图2所示,其中,图2中的步骤S1'、S2'与图1实施例中的步骤S1、S2相同或基本相同,故在此不再赘述,仅以引用的方式包含于此。其中,所述步骤S3'包括:S31'设备1在所述行为聚类簇中,基于无线接入点的位置信息,对所述无线接入点进行聚类处理,获取位置聚类簇;S32'设备1根据包含最多无线接入点的位置聚类簇,确定其所属的行为聚类簇对应的行为区域的位置信息。具体地,在所述步骤S31'中,所述行为聚类簇包含一个或多个无线接入点,设备1可以通过计算该一个或多个无线接入点的位置距离来对所述一个或多个无线接入点进行聚类处理,其中,将位置距离小于等于位置距离阈值的无线接入点归入同一位置聚类簇;进一步地,在所述步骤S32'中,具体地,在一个行为聚类簇中可能会出现多个位置聚类簇,每个位置聚类簇包含的无线接入点的数量不一样,因此,设备1可以根据包含最多无线接入点的位置聚类簇,确定其所属的行为聚类簇对应的行为区域的位置信息。优选地,其中,所述步骤S32'包括:设备1根据包含最多无线接入点的位置聚类簇中每个无线接入点的位置信息,获取所述位置聚类簇的质心和半径;进一步地,设备1将根据所述质心和半径所确定的区域的位置信息,确定为所述位置聚类簇所属的行为聚类簇对应的行为区域的位置信息。更优选地,其中,所述步骤S32'包括:设备1将所述包含最多无线接入点的位置聚类簇中的无线接入点的位置所围成的区域的位置信息,确定为所述位置聚类簇所属的行为聚类簇对应的行为区域的位置信息。具体地,每个位置聚类簇会由其包含的一个或多个无线接入点组成,该一个或多个无线接入点会围成一个位置区域,例如,可以将位置聚类簇中多个无线接入点的位置用直线或者平滑的曲线连接起来,则可将所围成的区域的位置信息,确定为所述位置聚类簇所属的行为聚类簇对应的行为区域的位置信息。
优选地,其中,所述方法还包括:S4(未示出)设备1确定与所述行为聚类簇对应的行为区域的位置信息相匹配的推荐信息;S5(未示出)当所述用户设备位于所述行为区域内时,设备1将所述推荐信息发送至所述用户设备。具体地,在所述步骤S4中,其中,所述推荐信息包括但不限于生活相关信息;工作相关信息;休闲相关信息。其中,所述生活相关信息包括与用户生活相关的信息,例如,用户生活息息相关的水、电、煤等信息或者超市的促销信息等等;其中,所述工作相关信息包括与用户工作有关的信息,例如,商务信息、理财信息等等;其中,所述休闲相关信息包括与用户的休闲有关的信息,例如,旅游信息、娱乐活动信息、美食信息、广告信息、服饰促销信息等等。在此,所述推荐信息仅为举例,其他现有的或者今后可能出现的推荐信息如适用于本申请,也应包含在本申请的保护范围内,在此,以引用的方式包含于此。其中,在步骤S4中,设备1确定与所述行为聚类簇对应的行为区域的位置信息相匹配的推荐信息,例如,当用户的行为区域对应午餐区域时,可以确定与该午餐区域匹配的美食信息;又例如,当用户在公司时,可以确定与公司匹配的商务信息等等;又例如,当用户在住宅区域时,可以确定与住宅区域对应的生活相关信息;再例如,当用户在商业区时,可以确定与商业区对应的促销信息、商业信息等等。在此,所述行为区域及与其对应的推荐信息仅为举例,其他现有的或者今后可能出现的行为区域及与其对应的推荐信息,如适用于本申请,也应包含在本申请的保护范围内,并在此以引用的方式包含于此。进一步地,在所述步骤S5中,当所述用户设备位于所述行为区域内时,设备1将所述推荐信息发送至所述用户设备。
与现有技术相比,本申请通过获取用户设备连接无线接入点的连接信息,其中,所述连接信息包括所述用户设备连接无线接入点的连接时间及所述无线接入点的位置信息,然后基于所述连接时间对所述无线接入点进行聚类处理,确定行为聚类簇,其中,所述行为聚类簇与用户的行为区域对应,进一步地,根据所述行为聚类簇中无线接入点的位置信息确定与所述行为聚类簇对应的行为区域的位置信息。这种方式能够更加准确的确定用户行为区域的位置信息,从而能够为后续应用提供更好的数据基础。
而且,本申请还可以将所述包含最多无线接入点的位置聚类簇中的无线接入点的位置所围成的区域的位置信息,确定为所述位置聚类簇所属的行为聚类簇对应的行为区域的位置信息。这种根据包含最多无线接入点的位置聚类簇确定对应的行为区域的位置信息的方式,能够更好的减小误差,从而使位置信息更加准确。
此外,本申请还可以确定与所述行为聚类簇对应的行为区域的位置信息相匹配的推荐信息,并且当所述用户设备位于所述行为区域内时,将所述推荐信息发送至所述用户设备。这种方式,可以根据用户对应的行为区域的位置信息,向用户发送对应的推荐信息,例如,广告,促销信息或者商务相关信息等等,能够为用户的生活提供很大的方便。
图3示出本申请另一个方面提供的一种用于确定用户行为区域位置信息的设备,其中,该设备包括:
第一装置,用于获取用户设备连接无线接入点的连接信息,其中,所述连接信息包括所述用户设备连接无线接入点的连接时间及所述无线接入点的位置信息;
第二装置,用于基于所述连接时间对所述无线接入点进行聚类处理,确定行为聚类簇,其中,所述行为聚类簇与用户的行为区域对应;
第三装置,用于根据所述行为聚类簇中无线接入点的位置信息确定与所述行为聚类簇对应的行为区域的位置信息。
在该实施例中,所述设备1的第一装置获取用户设备连接无线接入点的连接信息,其中,所述连接信息包括所述用户设备连接无线接入点的连接时间及所述无线接入点的位置信息;在此,所述设备1包括但不限于计算机、网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云;其中,云由基于云计算(Cloud Computing)的大量计算机或网络服务器构成,进一步地,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个虚拟超级计算机;所述设备1还可以包括但不限于任何一种可与用户通过触摸板进行人机交互的移动电子产品,例如智能手机、平板电脑等,所述移动电子产品可以采用任意操作系统,如android操作系统、iOS操作系统等。本领域技术人员应能理解上述设备1仅为举例,其他现有的或今后可能出现的用户设备如可适用于本申请,也应包含在本申请保护范围以内,并在此以引用方式包含于此。具体地,设备1获取用户设备连接无线接入点的连接信息的方式可以在相应的记录该连接信息的存储设备获取。
继续在该实施例中,所述设备1的第二装置基于所述连接时间对所述无线接入点进行聚类处理,确定行为聚类簇,其中,所述行为聚类簇与用户的行为区域对应。在此,其中,所述行为区域包括用户日常活动的不同区域,例如,住宅区域、办公区域、午餐区域、商业区域、休闲区域或者周末的其他活动区域等等。由于大多数用户的行为活动具有规律性,例如,白天为上班时间,晚上在住宅区域等等,因此,可以基于用户连接无线接入点的连接时间对所述无线接入点进行聚类处理,确定行为聚类簇,其中,所述行为聚类簇包括在用户的行为区域内的一个或多个无线接入点,例如,可以根据用户连接无线接入点的连接时间确定出用户的住宅区域或者办公室等等对应的行为聚类簇。在此,可以通过丛集聚合(Hierarchical Agglomerative Clustering)算法做聚类运算。
优选地,其中,所述设备1的第一装置用于获取所述用户在至少一个行为周期内连接无线接入点的连接信息。具体地,由于大多数用户的行为活动具有规律性,因此,可以选取用户在一个或多个行为周期内连接无线接入点的连接信息,例如,对于大多数用户来说,可以选取一周作为一个行为周期,如周一至周五是工作日,周末是休息日,因此,设备1可以获取所述用户在一周或几周内连接无线接入点的连接信息以能够更准确的确定用户的行为区域。更优选地,其中,所述第二装置包括:第一单元(未示出)设备1基于所述连接时间统计所述用户设备在行为周期的每个单位时间内连接无线接入点的连接次数;第二单元(未示出)设备1根据所述用户设备在行为周期的每个单位时间内连接无线接入点的连接次数,对所述无线接入点进行聚类处理,确定行为聚类簇,其中,所述行为聚类簇与用户的行为区域对应。具体地,其中,所述单位时间是预设好的,例如,可以选取一小时作为一个单位时间,而且,当行为周期为一周时,可以统计一周内每天的每个小时内连接无线接入点的连接次数,当有多个行为周期时,可以将多个行为周期内对应单位时间内连接无线接入点的连接次数进行累加,例如,设备1获取了四周内的每天每小时内连接无线接入点的连接次数,可以将4个周一、周二直到周日对应小时内的连接次数进行累加以归入到一个行为周期内,如将4个周一九点到十点的连接次数进行累加,以获得周一九点到十点的连接次数。在此,所述连接次数的统计是基于用户的一次活动或操作,例如,浏览一次新闻算作一次连接等。进一步地,本领域的技术人员应能理解,由于大多数用户的行为活动具有规律性,因此,用户连接无线接入点的连接次数相似的无线接入点可以归入一个行为聚类簇,所以所述设备1的第二单元可以根据所述用户设备在行为周期的每个单位时间内连接无线接入点的连接次数,对所述无线接入点进行聚类处理,确定行为聚类簇。
更优选地,其中,所述设备1的第二单元用于:根据所述用户设备在行为周期的每个单位时间内连接无线接入点的连接次数,获取所述用户设备在行为周期内连接每个无线接入点的连接频率分布向量;进一步地,设备1的第二单元根据所述连接频率分布向量计算所述每个无线接入点之间的连接频率分布距离;更进一步地,设备1的第二单元将所述连接频率分布距离小于等于连接频率分布距离阈值的无线接入点归入同一行为聚类簇。具体地,例如,取一周作为一个行为周期,假设某用户在过去28天(即四周)内,连接无线接入点包括热点1、热点2和热点3,对于该用户我们取在过去连续28天里面每个热点在每个小时上的连接次数,为每个热点生成一个维度为24(小时)*7(天)*4(周)=672的连接频率分布向量,为了研究用户一个行为周期的数据,我们将这个维度为672的连接频率分布向量对折叠加两次,生成一个维度为24*7=168的连接频率分布向量,即每个热点对应一个维度为24*7=168的连接频率分布向量,进一步地,设备1根据所述连接频率分布向量计算所述每个无线接入点之间的连接频率分布距离,在此,采用的计算方法可以通过KL(Kullback-LeiblerDivergence)散度公式进行计算,得到所述每个无线接入点之间的连接频率分布距离,在此,为了简便起见,不取维度为168的连接频率分布向量,取一个维度为7的连接频率分布向量为例,例如,热点1、热点2和热点3对应的连接频率分布向量分别为热点1:(23 67 57 8676 72 18)、热点2:(15 69 97 102 89 92 14)、热点3:(25 0 0 12 9 2 34),然后通过KL散度公式进行计算,在计算之前由于所述无线接入点的连接频率分布向量中可能会出现0,因此,计算连接频率分布距离之前需要通过拉普拉斯平滑对每个连接频率分布向量做平滑处理。例如,以上三个热点的向量做平滑之后结果如下:
热点1:(0.05911330 0.16748768 0.14285714 0.21428571 0.189655170.17980296 0.04679803);
热点2:(0.03298969 0.14432990 0.20206186 0.21237113 0.185567010.19175258 0.03092784);
热点3:(0.29213483 0.01123596 0.01123596 0.14606742 0.112359550.03370787 0.39325843),由于KL散度本身是非对称的,我们取其对称形式JS散度(Jensen-Shannon Divergence),它们之间的对称连接频率分布距离矩阵计算结果如下:
Figure BDA0001115042950000121
Figure BDA0001115042950000131
由表可以看出,每个热点与其本身的距离为0,热点1跟热点2之间的连接频率分布距离较小,而热点3与热点1和热点2之间的连接频率分布距离都较大。因此,最有可能将热点1和热点2归入同一行为聚类簇。
继续在该实施例中,所述设备1的第三装置根据所述行为聚类簇中无线接入点的位置信息确定与所述行为聚类簇对应的行为区域的位置信息。具体地,所述行为聚类簇所述行为聚类簇与用户的行为区域对应,因此,第三装置可以根据每个行为聚类簇中无线接入点的位置信息确定对应的行为区域的位置信息,具体地,可以根据每个行为聚类簇中所有无线接入点的位置信息确定该行为聚类簇对应的行为区域的位置信息,例如,可以将该行为聚类簇中所有无线接入点的位置信息取均值,并确定以该均值为圆心及一定预设半径范围内的区域为对应的行为区域的位置信息。
在一个优选的实施例中,参图4所示,其中,图4中的第一装置、第二装置与图3实施例中的第一装置、第二装置相同或基本相同,故在此不再赘述,仅以引用的方式包含于此。其中,所述设备1的第三装置包括:第三单元,用于在所述行为聚类簇中,基于无线接入点的位置信息,对所述无线接入点进行聚类处理,获取位置聚类簇;第四单元,用于根据包含最多无线接入点的位置聚类簇,确定其所属的行为聚类簇对应的行为区域的位置信息。具体地,所述行为聚类簇包含一个或多个无线接入点,设备1的第三单元可以通过计算该一个或多个无线接入点的位置距离来对所述一个或多个无线接入点进行聚类处理,其中,将位置距离小于等于位置距离阈值的无线接入点归入同一位置聚类簇;进一步地,具体地,在一个行为聚类簇中可能会出现多个位置聚类簇,每个位置聚类簇包含的无线接入点的数量不一样,因此,设备1的第四单元可以根据包含最多无线接入点的位置聚类簇,确定其所属的行为聚类簇对应的行为区域的位置信息。优选地,其中,所述第四单元用于:根据包含最多无线接入点的位置聚类簇中每个无线接入点的位置信息,获取所述位置聚类簇的质心和半径;进一步地,设备1将根据所述质心和半径所确定的区域的位置信息,确定为所述位置聚类簇所属的行为聚类簇对应的行为区域的位置信息。更优选地,其中,所述第四单元用于将所述包含最多无线接入点的位置聚类簇中的无线接入点的位置所围成的区域的位置信息,确定为所述位置聚类簇所属的行为聚类簇对应的行为区域的位置信息。具体地,每个位置聚类簇会由其包含的一个或多个无线接入点组成,该一个或多个无线接入点会围成一个位置区域,例如,可以将位置聚类簇中多个无线接入点的位置用直线或者平滑的曲线连接起来,则可将所围成的区域的位置信息,确定为所述位置聚类簇所属的行为聚类簇对应的行为区域的位置信息。
优选地,其中,所述设备还包括:第四装置(未示出)确定与所述行为聚类簇对应的行为区域的位置信息相匹配的推荐信息;第五装置(未示出)当所述用户设备位于所述行为区域内时,设备1的第五装置将所述推荐信息发送至所述用户设备。具体地,其中,所述推荐信息包括但不限于生活相关信息;工作相关信息;休闲相关信息。其中,所述生活相关信息包括与用户生活相关的信息,例如,用户生活息息相关的水、电、煤等信息或者超市的促销信息等等;其中,所述工作相关信息包括与用户工作有关的信息,例如,商务信息、理财信息等等;其中,所述休闲相关信息包括与用户的休闲有关的信息,例如,旅游信息、娱乐活动信息、美食信息、广告信息、服饰促销信息等等。在此,所述推荐信息仅为举例,其他现有的或者今后可能出现的推荐信息如适用于本申请,也应包含在本申请的保护范围内,在此,以引用的方式包含于此。其中,所述第四装置确定与所述行为聚类簇对应的行为区域的位置信息相匹配的推荐信息,例如,当用户的行为区域对应午餐区域时,所述第四装置可以确定与该午餐区域匹配的美食信息,又例如,当用户在公司时,所述第四装置可以确定与公司匹配的商务信息等等;又例如,当用户在住宅区域时,所述第四装置可以确定与住宅区域对应的生活相关信息;再例如,当用户在商业区时,所述第四装置可以确定与商业区对应的促销信息等等。在此,所述行为区域及与其对应的推荐信息仅为举例,其他现有的或者今后可能出现的行为区域及与其对应的推荐信息,如适用于本申请,也应包含在本申请的保护范围内,并在此以引用的方式包含于此。进一步地,当所述用户设备位于所述行为区域内时,设备1的第五装置将所述推荐信息发送至所述用户设备。
与现有技术相比,本申请通过获取用户设备连接无线接入点的连接信息,其中,所述连接信息包括所述用户设备连接无线接入点的连接时间及所述无线接入点的位置信息,然后基于所述连接时间对所述无线接入点进行聚类处理,确定行为聚类簇,其中,所述行为聚类簇与用户的行为区域对应,进一步地,根据所述行为聚类簇中无线接入点的位置信息确定与所述行为聚类簇对应的行为区域的位置信息。这种方式能够更加准确的确定用户行为区域的位置信息,从而能够为后续应用提供更好的数据基础。
而且,本申请还可以将所述包含最多无线接入点的位置聚类簇中的无线接入点的位置所围成的区域的位置信息,确定为所述位置聚类簇所属的行为聚类簇对应的行为区域的位置信息。这种根据包含最多无线接入点的位置聚类簇确定对应的行为区域的位置信息的方式,能够更好的减小误差,从而使位置信息更加准确。
此外,本申请还可以确定与所述行为聚类簇对应的行为区域的位置信息相匹配的推荐信息,并且当所述用户设备位于所述行为区域内时,将所述推荐信息发送至所述用户设备。这种方式,可以根据用户对应的行为区域的位置信息,向用户发送对应的推荐信息,例如,广告,促销信息或者商务相关信息等等,能够为用户的生活提供很大的方便。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。

Claims (16)

1.一种用于确定用户行为区域位置信息的方法,其中,该方法包括:
获取用户设备连接无线接入点的连接信息,其中,所述连接信息包括所述用户设备连接无线接入点的连接时间及所述无线接入点的位置信息;
基于所述连接时间对所述无线接入点进行聚类处理,确定行为聚类簇,其中,所述行为聚类簇与用户的行为区域对应;
根据所述行为聚类簇中无线接入点的位置信息确定与所述行为聚类簇对应的行为区域的位置信息;
其中,所述获取用户设备连接无线接入点的连接信息包括:
获取所述用户在至少一个行为周期内连接无线接入点的连接信息;
其中,所述基于所述连接时间对所述无线接入点进行聚类处理,确定行为聚类簇包括:
基于所述连接时间统计所述用户设备在行为周期的每个单位时间内连接无线接入点的连接次数,其中,所述连接次数的统计是基于用户的一次活动或操作;
根据所述用户设备在行为周期的每个单位时间内连接无线接入点的连接次数,对所述无线接入点进行聚类处理,确定行为聚类簇,其中,所述行为聚类簇与用户的行为区域对应,其中,用户连接无线接入点的连接次数相似的无线接入点可归入一个行为聚类簇。
2.根据权利要求1所述的方法,其中,所述根据所述用户设备在行为周期的每个单位时间内连接无线接入点的连接次数,对所述无线接入点进行聚类处理,确定行为聚类簇包括:
根据所述用户设备在行为周期的每个单位时间内连接无线接入点的连接次数,获取所述用户设备在行为周期内连接每个无线接入点的连接频率分布向量;
根据所述连接频率分布向量计算所述每个无线接入点之间的连接频率分布距离;
将所述连接频率分布距离小于等于连接频率分布距离阈值的无线接入点归入同一行为聚类簇。
3.根据权利要求1所述的方法,其中,所述根据所述行为聚类簇中无线接入点的位置信息确定与所述行为聚类簇对应的行为区域的位置信息包括:
在所述行为聚类簇中,基于无线接入点的位置信息,对所述无线接入点进行聚类处理,获取位置聚类簇;
根据包含最多无线接入点的位置聚类簇,确定其所属的行为聚类簇对应的行为区域的位置信息。
4.根据权利要求3所述的方法,其中,所述根据包含最多无线接入点的位置聚类簇,确定其所属的行为聚类簇对应的行为区域的位置信息包括:
根据包含最多无线接入点的位置聚类簇中每个无线接入点的位置信息,获取所述位置聚类簇的质心和半径;
将根据所述质心和半径所确定的区域的位置信息,确定为所述位置聚类簇所属的行为聚类簇对应的行为区域的位置信息。
5.根据权利要求3所述的方法,其中,所述根据包含最多无线接入点的位置聚类簇,确定其所属的行为聚类簇对应的行为区域的位置信息包括:
将所述包含最多无线接入点的位置聚类簇中的无线接入点的位置所围成的区域的位置信息,确定为所述位置聚类簇所属的行为聚类簇对应的行为区域的位置信息。
6.根据权利要求1所述的方法,其中,所述方法还包括:
确定与所述行为聚类簇对应的行为区域的位置信息相匹配的推荐信息;
当所述用户设备位于所述行为区域内时,将所述推荐信息发送至所述用户设备。
7.根据权利要求6所述的方法,其中,所述推荐信息包括以下至少任一项:
生活相关信息;
工作相关信息;
休闲相关信息。
8.根据权利要求1至7中任一项所述的方法,其中,所述行为区域包括以下至少任一项:
住宅区域;
办公区域;
午餐区域;
商业区域;
休闲区域。
9.一种用于确定用户行为区域位置信息的设备,其中,该设备包括:
第一装置,用于获取用户设备连接无线接入点的连接信息,其中,所述连接信息包括所述用户设备连接无线接入点的连接时间及所述无线接入点的位置信息;
第二装置,用于基于所述连接时间对所述无线接入点进行聚类处理,确定行为聚类簇,其中,所述行为聚类簇与用户的行为区域对应;
第三装置,用于根据所述行为聚类簇中无线接入点的位置信息确定与所述行为聚类簇对应的行为区域的位置信息;
其中,所述第一装置用于:
获取所述用户在至少一个行为周期内连接无线接入点的连接信息;
其中,所述第二装置包括:
第一单元,用于基于所述连接时间统计所述用户设备在行为周期的每个单位时间内连接无线接入点的连接次数,其中,所述连接次数的统计是基于用户的一次活动或操作;
第二单元,用于根据所述用户设备在行为周期的每个单位时间内连接无线接入点的连接次数,对所述无线接入点进行聚类处理,确定行为聚类簇,其中,所述行为聚类簇与用户的行为区域对应,其中,用户连接无线接入点的连接次数相似的无线接入点可归入一个行为聚类簇。
10.根据权利要求9所述的设备,其中,所述第二单元用于:
根据所述用户设备在行为周期的每个单位时间内连接无线接入点的连接次数,获取所述用户设备在行为周期内连接每个无线接入点的连接频率分布向量;
根据所述连接频率分布向量计算所述每个无线接入点之间的连接频率分布距离;
将所述连接频率分布距离小于等于连接频率分布距离阈值的无线接入点归入同一行为聚类簇。
11.根据权利要求9所述的设备,其中,所述第三装置包括:
第三单元,用于在所述行为聚类簇中,基于无线接入点的位置信息,对所述无线接入点进行聚类处理,获取位置聚类簇;
第四单元,用于根据包含最多无线接入点的位置聚类簇,确定其所属的行为聚类簇对应的行为区域的位置信息。
12.根据权利要求11所述的设备,其中,所述第四单元用于:
根据包含最多无线接入点的位置聚类簇中每个无线接入点的位置信息,获取所述位置聚类簇的质心和半径;
将根据所述质心和半径所确定的区域的位置信息,确定为所述位置聚类簇所属的行为聚类簇对应的行为区域的位置信息。
13.根据权利要求11所述的设备,其中,所述第四单元用于:
将所述包含最多无线接入点的位置聚类簇中的无线接入点的位置所围成的区域的位置信息,确定为所述位置聚类簇所属的行为聚类簇对应的行为区域的位置信息。
14.根据权利要求9所述的设备,其中,所述设备还包括:
第四装置,用于确定与所述行为聚类簇对应的行为区域的位置信息相匹配的推荐信息;
第五装置,用于当所述用户设备位于所述行为区域内时,将所述推荐信息发送至所述用户设备。
15.根据权利要求14所述的设备,其中,所述推荐信息包括以下至少任一项:
生活相关信息;
工作相关信息;
休闲相关信息。
16.根据权利要求9至15中任一项所述的设备,其中,所述行为区域包括以下至少任一项:
住宅区域;
办公区域;
午餐区域;
商业区域;
休闲区域。
CN201610825988.4A 2016-09-14 2016-09-14 用于确定用户行为区域位置信息的方法与设备 Active CN107818116B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610825988.4A CN107818116B (zh) 2016-09-14 2016-09-14 用于确定用户行为区域位置信息的方法与设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610825988.4A CN107818116B (zh) 2016-09-14 2016-09-14 用于确定用户行为区域位置信息的方法与设备

Publications (2)

Publication Number Publication Date
CN107818116A CN107818116A (zh) 2018-03-20
CN107818116B true CN107818116B (zh) 2021-07-02

Family

ID=61600798

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610825988.4A Active CN107818116B (zh) 2016-09-14 2016-09-14 用于确定用户行为区域位置信息的方法与设备

Country Status (1)

Country Link
CN (1) CN107818116B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108520455A (zh) * 2018-04-10 2018-09-11 上海连尚网络科技有限公司 一种推荐信息的方法及设备
CN108985827B (zh) * 2018-07-04 2020-11-27 北京三快在线科技有限公司 信息投放数据的分析方法、装置、介质及电子设备
CN109348541A (zh) * 2018-11-27 2019-02-15 浙江每日互动网络科技股份有限公司 一种处理移动终端连接的wifi信息的方法
CN109547931B (zh) * 2019-01-14 2020-11-24 每日互动股份有限公司 确定移动终端所在地的服务器
CN111178932A (zh) * 2019-11-26 2020-05-19 深圳壹账通智能科技有限公司 用户地理画像生成方法、装置、计算机设备和存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101404664A (zh) * 2008-11-05 2009-04-08 湖南大学 一种基于节点聚类的网络定位优化算法
US9037147B2 (en) * 2012-09-14 2015-05-19 Fujitsu Limited Network controlled tethering of wireless devices
CN103945326B (zh) * 2013-01-23 2019-04-26 百度在线网络技术(北京)有限公司 一种精确的信息推送的方法及装置
CN105472730A (zh) * 2014-09-25 2016-04-06 阿里巴巴集团控股有限公司 一种网络定位方法及装置
CN105243396A (zh) * 2015-11-06 2016-01-13 百度在线网络技术(北京)有限公司 用户位置信息生成方法和装置

Also Published As

Publication number Publication date
CN107818116A (zh) 2018-03-20

Similar Documents

Publication Publication Date Title
CN107818116B (zh) 用于确定用户行为区域位置信息的方法与设备
EP3195231B1 (en) Method and server for delivering information to user terminal
US10848903B2 (en) Determining timing for determination of applicable geo-fences
US9730028B2 (en) Systems and methods to identify home addresses of mobile devices
US9854450B2 (en) Enhanced data collection, processing, and analysis facilities
CN107026881B (zh) 业务数据的处理方法、装置及系统
US10959043B2 (en) Determining hardware requirements for a wireless network event using crowdsourcing
CN112311612B (zh) 一种信息构建方法、装置及存储介质
US9635507B2 (en) Mobile device analytics
CN106210163B (zh) 基于ip地址的定位方法及装置
CN108696597B (zh) 推送营销信息的方法和装置
CN104239453B (zh) 数据处理方法及装置
US10178498B2 (en) Method and device for signal processing
JP7285521B2 (ja) 類似のモバイル装置を予測するためのシステムと方法
US20140129334A1 (en) Method and system for modeling consumer activity areas based on social media and mobile data
CN107567071B (zh) 一种用于查询无线热点的方法与设备
US20180070329A1 (en) Systems and methods to measure the population of mobile devices in a predefined geographical region
CN113468226A (zh) 一种业务处理方法、装置、电子设备和存储介质
CN108076439B (zh) 用于基于无线接入点推送消息的方法与设备
CN104111981A (zh) 一种用于提供发布信息的方法与设备
CN113706222B (zh) 一种门店选址的方法、装置
US20160110728A1 (en) Enhanced data collection, processing, and analysis
CN106570029B (zh) 分布式关系型数据库的数据处理方法及系统
CN109271438A (zh) 一种数据库访问方法及其系统
US11625729B2 (en) Data processing method, apparatus, and system

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant