CN110020221B - 职住分布确认方法、装置、服务器及计算机可读存储介质 - Google Patents

职住分布确认方法、装置、服务器及计算机可读存储介质 Download PDF

Info

Publication number
CN110020221B
CN110020221B CN201711310208.3A CN201711310208A CN110020221B CN 110020221 B CN110020221 B CN 110020221B CN 201711310208 A CN201711310208 A CN 201711310208A CN 110020221 B CN110020221 B CN 110020221B
Authority
CN
China
Prior art keywords
user
place
preset
data
positioning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711310208.3A
Other languages
English (en)
Other versions
CN110020221A (zh
Inventor
王芃森
曹睿
李欣
刘畅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201711310208.3A priority Critical patent/CN110020221B/zh
Publication of CN110020221A publication Critical patent/CN110020221A/zh
Application granted granted Critical
Publication of CN110020221B publication Critical patent/CN110020221B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2255Hash tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Telephonic Communication Services (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Position Fixing By Use Of Radio Waves (AREA)

Abstract

本发明公开了一种职住分布确认方法,该方法包括:根据用户的智能设备上报的定位数据,识别用户的职住地,在与职住地的无线网络连接过的智能设备中,识别出属于用户的多个手持智能设备,并根据多个手持智能设备的定位数据,得到用户的轨迹点,对轨迹点和职住地建立索引,并将建立索引后的轨迹点和职住地的数据存入数据库。本发明还公开了一种职住分布确认装置、服务器和计算机可读存储介质,可提高用户的确认职住分布的精准度和便捷性。

Description

职住分布确认方法、装置、服务器及计算机可读存储介质
技术领域
本发明属于计算机技术领域,尤其涉及一种职住分布确认方法、装置、服务器及计算机可读存储介质。
背景技术
随着智能设备的普及与移动互联网时代的到来,智能设备覆盖的用户量越来越多,用户使用智能设备的应用程序也产生了海量的定位数据,利用这些定位数据分析用户的职住地与职住平衡等问题,对商业选址,城市规划等行业都有重要的意义。
现有方案多是以运营商信令数据计算用户的职住地,定位精度往往是几百米到上千米,很难支持过细粒度职住分布确认。并且用户有多个持有设备时,确认结果也容易存在偏差。
发明内容
本发明实施例提供一种职住分布确认方法、装置、服务器及计算机可读存储介质,用于解决由于统计数据不精确,造成的对职住分布数据确认不准确的问题。
本发明实施例第一方面提供了一种职住分布确认方法,包括:
根据用户的智能设备上报的定位数据,识别所述用户的职住地;
在与所述职住地的无线网络连接过的智能设备中,识别出属于所述用户的多个手持智能设备,并根据所述多个手持智能设备的定位数据,得到所述用户的轨迹点;
对所述轨迹点和所述职住地建立索引,并将建立索引后的所述轨迹点和所述职住地的数据存入数据库。
本发明实施例第二方面提供了一种职住分布确认装置,包括:
第一识别模块,用于根据用户的智能设备上报的定位数据,识别所述用户的职住地;
第二识别模块,用于在与所述职住地的无线网络连接过的智能设备中,识别出属于所述用户的多个手持智能设备;
处理模块,用于根据所述多个手持智能设备的定位数据,得到所述用户的轨迹点;
存储模块,用于对所述轨迹点和所述职住地建立索引,并将建立索引后的所述轨迹点和所述职住地的数据存入数据库。
本发明实施例第三方面提供了一种服务器,包括存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如前述第一方面提供的职住分布确认方法。
本发明实施例第四方面提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现如前述第一方面提供的所述的职住分布确认方法。
从上述本发明实施例可知,本发明提供的职住分布确认方法、装置、服务器及计算机可读存储介质,根据用户的智能设备上报的定位数据,识别用户的职住地,在与职住地的无线网络连接过的智能设备中,识别出属于用户的多个手持智能设备,并根据多个手持智能设备的定位数据,得到用户的轨迹点,对轨迹点和职住地建立索引,并将建立索引后的轨迹点和职住地的数据存入数据库,结合智能设备的定位数据和接入的无线网络,更精确地确认职住地,提高确认精度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的职住分布确认方法的应用环境示意图;
图2为本发明一实施例提供的职住分布确认方法的流程示意图;
图3为本发明又一实施例提供的职住分布确认方法的流程示意图;
图4为图3所示实施例中步骤S201的细化流程示意图;
图5为图3所示实施例中步骤S202的细化流程示意图;
图6为本发明另一实施例提供的职住分布确认方法的流程示意图;
图7为本发明一实施例提供的职住分布确认装置的结构示意图;
图8为本发明另一实施例提供的职住分布确认装置的结构示意图;
图9为本发明实施例提供的服务器的硬件结构示意图。
具体实施方式
为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而非全部实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1,图1为本发明实施例提供的职住分布确认方法的应用环境示意图,服务器10与智能设备20通过网络连接,智能设备20可以是1个也可以是多个,该智能设备可包括手机、平板电脑、个人电脑等。服务器10可根据用户的智能设备20在预置周期内的定位数据,该定位数据具体为智能设备的定位点的数据。该预置周期以天为单位,例如一个月的定位数据。对获取的定位点的数据,经过滤抽稀后,进行基于预设的工作时间段、居住时间段和该预置周期定位天数的带权重的聚类,并选取工作时间段中权重最高的聚类中心点作为工作地,选取居住地时间段权重最高的聚类中心点作为居住地,工作地和居住地合称职住地。进一步地,利用智能设备连接WiFi(Wireless Fidelity)后的定位数据,识别职住地WiFi,在职住地WiFi连接的设备中筛选识别出属于同一用户的多个手持智能设备。将该多个手持智能设备的信息合并,得到用户的轨迹点的数据,并将轨迹点的数据与职住地的数据以用户为Key值存入分布式数据库。进一步地,对轨迹点与职住地建立地理空间哈希(GeoHash)索引,以GeoHash值为Key,职住地的坐标点、轨迹点的坐标点和时间为值存入分布式数据库,支持用户查询以及基于任意区域的职住查询。
具体技术方案的描述参见下述各实施例。
请参见图2,图2为本发明实施例提供的职住分布确认方法的流程示意图,该方法可应用在服务器中。该方法包括:
S101、根据用户的智能设备上报的定位数据,识别用户的职住地;
用户的智能设备会持续向服务器上报基于设备信息和时间信息,其中,设备信息包括:设备编码、设备基于无线网络定位的地理位置(即定位点的数据)、连接到的无线网络路由的编号信息,例如BSSID(Basic Service Set Identifier),又如SSID(Service SetIdentifier)。
服务器获取用户的智能设备在预置周期内生成的定位点的数据,本发明各实施例中的定位点是指智能设备在连接到无线网络后产生的定位地点。该定位点的数据,也即定位数据,包括定位点的位置、定位点的名称及定位点的周边信息等。
根据用户的智能设备上报的定位数据,识别用户的职住地,职住地包括工作地和居住地。
S102、在与职住地的无线网络连接过的智能设备中,识别出属于用户的多个手持智能设备,并根据多个手持智能设备的定位数据,得到用户的轨迹点;
智能设备在接入无线网络后,向服务器上报定位数据,服务器根据定位数据确认智能设备的定位点。该职住地与定位点的位置相差在预置距离范围内,则确认智能设备接入的无线网络为职住地无线网络。
在与职住地无线网络连接过的智能设备中识别出属于用户的多个手持智能设备,防止将一个用户的多个智能设备产生的定位数据,统计为不同用户的职住数据和定位数据而产生的误差。
轨迹点根据用户的定位点和定位时间得到的实时位置构成的集合;轨迹点的数据包括定位点数据和定位时间数据的对应关系。
S103、对轨迹点和职住地建立索引,并将建立索引后的轨迹点和职住地的数据存入数据库;
具体地,以该用户的标识为键,将该轨迹点和该职住地的数据存入分布式数据库,以及,对该轨迹点和该职住地建立GeoHash索引,并以GeoHash值为键,该轨迹点和该职住地的数据存入该分布式数据库。
GeoHash索引的是一个空间区域,GeoHash索引是将经纬度二分划分后,用二进制编码表示划分的地理空间索引。任何一个经纬度能通过计算得到其GeoHash值。
本发明实施例中,根据用户的智能设备上报的定位数据,识别用户的职住地,在与职住地的无线网络连接过的智能设备中,识别出属于用户的多个手持智能设备,并根据多个手持智能设备的定位数据,得到用户的轨迹点,对轨迹点和职住地建立索引,并将建立索引后的轨迹点和职住地的数据存入数据库,结合智能设备的定位数据和接入的无线网络,更精确地确认职住地,提高确认精度。
请参见图3,图3为本发明又一实施例提供的职住分布确认方法,该方法包括:
S201、获取用户的智能设备在预置周期内上报的定位点的数据,按照预置处理规则对该定位点进行过滤及抽稀处理,并将处理后得到的定位点进行基于预设的工作时间段、居住时间段和预置周期的带权重的聚类,得到用户的职住地的数据;
智能设备会持续上报基于设备信息和时间信息,其中,设备信息包括:设备编码、设备基于无线网络定位的地理位置(即定位点的数据)、连接到的无线网络路由的编号信息。
获取用户的智能设备在预置周期内生成的定位点的数据,本发明各实施例中的定位点是指智能设备在连接到无线网络后产生的定位地点。该定位点的数据,也即定位数据,包括定位点的位置、定位点的名称及定位点的周边信息等。
按照预置处理规则对该定位点进行过滤及抽稀处理,并将处理后得到的定位点进行基于预设的工作时间段、居住时间段和预置周期的带权重的聚类,得到用户的职住地的数据。职住地的数据包括工作地和居住地的数据,工作时间段内权重最高的聚类中心点作为工作地,居住地时间段内权重最高的聚类中心点作为居住地。
S202、根据职住地的位置信息和智能设备接入无线网络后的定位点的数据,确认职住地无线网络,并在与职住地无线网络连接过的智能设备中识别出属于用户的多个手持智能设备;
该职住地和该定位点的位置相差在预置距离范围内,例如100米之内,则确认智能设备接入的无线网络为职住地无线网络。
在与职住地无线网络连接过的智能设备中识别出属于用户的多个手持智能设备,防止将一个用户的多个智能设备产生的定位数据,统计为不同用户的职住数据和定位数据而产生的误差。
S203、将多个手持智能设备的定位点的数据合并,得到用户的轨迹点的数据,轨迹点的数据为定位点与定位时间的对应关系;
将该多个手持智能设备的定位点的数据合并统计在为同一个用户的数据。
轨迹点的数据包括定位点与定位时的定位时间,体现了定位点和定位时间的对应关系。
S204、以用户的标识为键,将轨迹点和职住地的数据存入分布式数据库,以及,对轨迹点和职住地建立GeoHash索引,并以GeoHash值为键,将轨迹点和职住地的数据存入分布式数据库;
以用户的标识为键,将轨迹点和职住地的数据存入分布式数据库后,通过查询该用户的标识可以查询到该用户的轨迹点和职住地的数据。
对轨迹点和职住地建立GeoHash索引,并以GeoHash值为键,轨迹点和职住地的数据存入分布式数据库后,通过查询GeoHash值,确定查询区域,可查询在该区域中的轨迹点和职住地的数据。
S205、将存入分布式数据库的轨迹点和职住地的数据,以预置形式输出,或者,接收输入的查询指令,在该分布式数据库中进行关于用户及职住分布的查询。
将存入分布式数据库的轨迹点和职住地的数据,以表格或分布图的形式输出,让用户可以直观的了解职住地的分布情况。
或者,接收输入的查询指令,在该分布式数据库中进行关于用户及职住分布的查询。具体地,查询指令可以是查询用户群,也可以是查询用户的职住分布,根据用户的标识可查询轨迹点和职住地的数据,根据GeoHash值可确定查询区域,再查询在该区域中的轨迹点和职住地的数据。
进一步地,可直接输出查询结果供用户查看,分析查询结果;也可将查询结果输入到分析工具中,由分析工具提供给用户更直观的分析结果。
通过对上述用户轨迹点和职住地的数据提取与存储,可以支持商业选址项目,城市规划项目以及区域广告投放的项目,比如:
商业选址类:去过某连锁商城的用户居住地分布和工作地分布,进而可以选址在用户覆盖度低的地方新建商城。
城市规划类:多城市的跨城职住情况与城市圈的分析。
广告投放类:可以得到经常去某些场所的人群居住的小区,在小区内定向进行线下广告投放。
本发明实施例中,获取智能设备在预置周期的定位点的数据,对定位点进行过滤及抽稀处理后,进行基于预设的工作时间段、居住时间段和所述预置周期的带权重的聚类,得到职住地数据,识别出属于同一个用户的多个手持智能设备,将所述多个手持智能设备的定位点的数据合并,得到所述用户的轨迹点的数据,以用户的标识为键,将轨迹点的数据和职住地的数据存入分布式数据库,对轨迹点和职住地建立GeoHash索引,并以GeoHash值为键,轨迹点和职住地的数据存入分布式数据库,从而更精确地确认职住地和轨迹点,并根据分布式数据库中存入的轨迹点和职住地的数据,进行职住分布的查询,可支持基于用户、基于区域的任意查询,极大的扩大了查询范围,提高了查询的精确度。对商业选址项目,城市规划项目以及区域广告投放的项目具有高度的参考价值。
请参见图4,图4为前述图3中步骤S201的流程细化示意图,图4所示的步骤与图3所示的步骤S202、S203、S204、S205构成另一实施例。
步骤S201“获取用户的智能设备在预置周期内上报的定位点的数据,按照预置处理规则对该定位点进行过滤及抽稀处理”,具体包括:
S301、过滤掉非职住定位点,并对过滤后的定位点按照预置时长抽稀处理得到处理后的定位点;
过滤掉定位点中的非职住定位点,即,过滤掉非职住场景的定位点以及异常定位点,非职住场景的定位点例如户外GPS(Global Positioning System)运动的定位点,异常定位点为定位可信度过低的点,例如多个定位点显示用户当天在A地,那么定位点显示在遥远的B地即为异常定位点。
进一步地,对过滤后的定位点按照预置时长抽稀处理得到处理后的定位点,抽稀处理是指对定位点在时间上的抽稀,例如,每十分钟只保留一个定位点。目的是为了防止用户在某一个非职住地点的多次定位对职住结果的影响。由于用户每天的职住点是相对稳定的,因此短时长的定位点抽稀不会影响正常职住情况的判断和分析。
S302、将预置周期的每一天划分为多个权重时间段,并为每个权重时间段设置不同的工作属性权重和居住属性权重;
其中,若权重时间段对应预设的工作时间段,则该权重时间段的工作属性权重大于居住属性权重,若权重时间段对应预设的居住时间段,则该权重时间段的居住属性权重大于工作属性权重。
更具体地,可以将工作时间段内或居住时间段内的权重时间段的工作属性权重设置为同一个值,居住属性权重设置为同一个值,例如,工作时间段是上午9点至下午5点,其余时间段为居住时间段,A权重时间段为上午9点到10点,在工作时间段内,B权重时间段为下午1点到2点,也在工作时间段内,A权重时间段和B权重时间段的工作属性权重相同,居住属性权重也相同。工作属性权重大于居住属性权重。
也可以将工作时间段内或居住时间段内的权重时间段的工作属性权重设置为不同的值,居住属性权重设置为不同的值。还依照上述实例,工作时间段是上午9点至下午5点,其余时间段为居住时间段,A权重时间段为上午9点到10点,在工作时间段内,B权重时间段为下午1点到2点,也在工作时间段内,但是下午1点到2点可能是午休时间,有可能用户会在B权重时间段回居住地休息,因此B权重时间段的工作属性权重就可设置为小于A权重时间段的工作属性权重,而B权重时间段的居住属性权重大于A权重时间段的居住属性权重。
预置周期即为前述图1所示实施例中步骤S101中的预置周期。
一个实例中,以该预置周期中的一个周二为例,将该周二一天的24小时按小时为单位划分为24个权重时间段,预设的工作时间段是上午9点至下午5点,其余时间段为居住时间段。为24个权重时间段设置不同的工作属性权重和居住属性权重。
S303、按照预置算法,对定位点基于预设的工作时间段和居住时间段分别进行聚类,得到工作地聚类集合和居住地聚类集合;
将工作时间段的定位点按照预置算法聚类得到工作地聚类集合,将居住时间段的定位点按照预置算法聚类得到居住地聚类集合。
该预置算法例如DBSCAN(Density-Based Spatial Clustering of Applicationswith Noise)算法。
S304、根据工作地聚类集合中的各工作地的定位时间对应的工作属性权重和居住属性权重,计算各工作地聚类的聚类权重得分,以及根据居住地聚类集合中的各居住地的定位时间对应的工作属性权重和居住属性权重,计算居住地聚类集合中各居住地聚类的聚类权重得分;
聚类排序根据的是聚类权重得分,以工作地聚类为例:
聚类权重得分=定位点天数权重*定位点时间段权重
Figure BDA0001502828990000101
(定位点数*对应的工作时间段权重)
其中定位点天数权重表示聚类中定位点覆盖的天数的权重,定位点时段权重表示聚类中定位点覆盖的工作时段的小时数的权重,预先在系统中设定覆盖的不同天数对应的不同权重,覆盖不同小时数对应的不同权重。
定位点数是指定位点的数量,对应的工作时间段权重是指各定位点对应工作时间段的权重。其中,n为自然数。
S305、将工作地聚类集合与居住地聚类集合按照各自的聚类权重得分各自分别排序,选取聚类权重得分最高的工作地聚类的中心点作为工作地,选取聚类权重得分最高的居住地聚类的中心点作为居住地。
最后选取得分最高的工作地聚类的中心点作为工作地。中心点的算法为聚类中到所有其他点距离的平方和最小的点。
确定职住地的同理与上述确定工作的方法相同,将计算公式中的对应的工作时间段权重替换为对应的居住时间段权重即可,对应的居住时间段是指各定位点对应居住时间段的权重。
需要说明的是,图4所示各步骤与前述图3中的步骤S202、S203、S204和S205可以组合为不同于图3的另一实施例。
本发明实施例中,获取智能设备在预置周期的定位点的数据,对定位点进行过滤及抽稀处理后,进行基于预设的工作时间段、居住时间段和所述预置周期的带权重的聚类,得到职住地数据,识别出属于同一个用户的多个手持智能设备,将所述多个手持智能设备的定位点的数据合并,得到所述用户的轨迹点的数据,以用户的标识为键,将轨迹点的数据和职住地的数据存入分布式数据库,对轨迹点和职住地建立GeoHash索引,并以GeoHash值为键,轨迹点和职住地的数据存入分布式数据库,从而更精确地确认职住地和轨迹点,并根据分布式数据库中存入的轨迹点和职住地的数据,进行职住分布的查询,可支持基于用户、基于区域的任意查询,极大的扩大了查询范围,提高了查询的精确度。对商业选址项目,城市规划项目以及区域广告投放的项目具有高度的参考价值。
请参见5,图5为前述图3中步骤S202的流程细化示意图,在第三实施例中,无线网络以WiFi为例,根据该职住地的位置信息和智能设备接入无线网络后的定位点的数据,确认职住地无线网络,并在与该职住地无线网络连接过的智能设备中识别出属于该用户的多个手持智能设备,具体包括:
S401、根据职住地的位置信息和智能设备接入无线网络后的定位点的数据,确认职住地无线网络;
职住地包括居住地和工作地。
根据确认的职住地的位置信息与用户通过智能设备连接WiFi的定位点的数据,确认该用户的职住地无线网络。该用户在职住地周围较小范围内,例如100米内,连接的WiFi即为该用户的职住地WiFi。
S402、确认连接过该职住地无线网络的设备信息,并将预置统计周期内连接该职住地无线网络的天数大于等于预置天数的设备作为候选设备集合;
将基于WiFi的定位点的数据按照不同的WiFi进行归类,统计连接过此该职住地WiFi的设备信息,将预置统计周期内,例如14天内,连接该职住地WiFi的天数大于等于预置天数,的设备集合作为候选设备集合,该预置天数例如4天。
S403、将该候选设备集合中,所连接的无线网络均为该职住地无线网络,并且定位点的位置位于该职住地无线网络的预置距离内的智能设备确认为职住地智能设备;
即,若在该候选设备集合中,有一个设备所连接的WiFi都连接的是该职住地WiFi,并且该设备产生的定位点均位于该职住地WiFi周围100米的距离内,则可将该设备确认为用户的职住地智能设备。
S404、统计该候选设备集合中除去该职住地智能设备之外的其他候选设备,在该预置统计周期内的相近得分和相异得分;
职住地智能设备的定位点固定在用户的居住地或工作地,它的定位点的数据若作为大数据分析用户的职住分布确认,会造成一定的误差,因此在确定了职住地智能设备后,在后一步的数据统计中将只统计不属于职住地智能设备之外的其他智能设备,从而提高职住分布确认的准确度。
该相近得分为按照预置统计规则统计的该其他候选设备之间,关于无线网络的相近分和关于位置相近分之和,该相异得分为按照预置统计规则统计的该其他候选设备之间,关于无线网络的相异分和关于位置相异分之和。其中的位置为定位点所在的位置。
具体地,在系统中设置设备关于WiFi的相近、关于WiFi的相异、关于位置相近和关于位置相异的定义。
设备关于WiFi相异:如果两个智能设备在1小时内连接不同的非职住地WiFi并产生定位数据,则该两个智能设备关于WiFi相异。
设备关于WiFi相近:如果两个智能设备在1小时内连接同一非职住地WiFi并产生定位数据,则该两个智能设备关于WiFi相似。
设备关于位置相异:如果在30分钟内,两个智能设备之间存在定位点直线距离大于5公里,或者沿直线距离的移动速度大于18m/s,或者在10分钟内距离大于2公里,则该两个智能设备关于距离相异。
设备关于位置相近:如果在一天内,两个智能设备不存在关于位置相异并且存在30分钟内,距离小于200m的定位点,则该两个智能设备关于距离相近。
同时为设备关于WiFi的相近和关于WiFi的相异分别设置相近分,为关于位置相近和关于位置相异分别设置相异分。
例如:如果两个智能设备在一天内只发生过1次关于WiFi相近,记相近分0.5;
如果两个智能设备一天内发生过2次及以上关于WiFi相近,记相近分1;
如果两个智能设备在一天内没有关于WiFi相近但是存在关于位置相近,记相近分0.5;
如果两个智能设备在一天内发生过1次关于位置相异,记相异分0.5;
如果两个智能设备在一天内发生过2次及以上关于WiFi相异,记相异分1。
可以理解的,上述数值只是举例,还可以设置为其他数值。
在该预置统计周期内,各类相近分统计的总分为该相近得分,各类相异分统计的总分为该相异得分。
统计该候选设备集合中除去该职住地智能设备之外的其他候选设备,统计得到的相近得分和相异得分。
S405、若多个设备的相近得分大于等于第一预置数值并且相异得分小于等于第二预置数值,则确认该设备为该用户的多个智能手持设备。
例如,在除去职住地智能设备的设备候选集合中,在该预置统计周期内按照上述规则计算的两个智能设备的相近得分大于等于5并且相异得分小于等于2,则确认该两个智能设备为同一用户的手持智能设备。
若多个设备的相近得分和相异得分不满足:相近得分大于等于第一预置数值并且相异得分小于等于第二预置数值,则确认该两个智能设备为不同用户持有的智能设备。
通过对各智能设备之间的关于无线网络相异或相近、关于位置相异或相近的详细划分和设置,使得对确认不同的智能设备确认为同一用户的手持智能设备更加准确。
需要说明的是,图5所示各步骤与前述图3中的步骤S201、S203、S204和S205可以组合为不同于图3的另一实施例。
本发明实施例中,获取智能设备在预置周期的定位点的数据,对定位点进行过滤及抽稀处理后,进行基于预设的工作时间段、居住时间段和所述预置周期的带权重的聚类,得到职住地数据,识别出属于同一个用户的多个手持智能设备,将所述多个手持智能设备的定位点的数据合并,得到所述用户的轨迹点的数据,以用户的标识为键,将轨迹点的数据和职住地的数据存入分布式数据库,对轨迹点和职住地建立GeoHash索引,并以GeoHash值为键,轨迹点和职住地的数据存入分布式数据库,从而更精确地确认职住地和轨迹点,并根据分布式数据库中存入的轨迹点和职住地的数据,进行职住分布的查询,可支持基于用户、基于区域的任意查询,极大的扩大了查询范围,提高了查询的精确度。对商业选址项目,城市规划项目以及区域广告投放的项目具有高度的参考价值。
请参见图6,在本发明另一个实施例提供的职住分布确认方法中,包括:
S501、获取用户的智能设备在预置周期内上报的定位点的数据,按照预置处理规则对该定位点进行过滤及抽稀处理,并将处理后得到的定位点进行基于预设的工作时间段、居住时间段和预置周期的带权重的聚类,得到用户的职住地的数据;
S502、根据职住地的位置信息和智能设备接入无线网络后的定位点的数据,确认职住地无线网络,并在与职住地无线网络连接过的智能设备中识别出属于用户的多个手持智能设备;
S503、将多个手持智能设备的定位点的数据合并,得到用户的轨迹点的数据,轨迹点的数据为定位点与定位时间的对应关系;
将一个用户的多个手持智能设备的定位点合并为该用户的定位数据,根据恐惧各定位点与定位时的定位时间的对应关系,得到该用户的轨迹点的数据。
轨迹点的数据包含定位点和定位时间的数据,体现了定位点与定位时间的对应关系。
S504、通过存储用户轨迹表、GeoHash索引的用户定位点表、用户职住表和GeoHash索引的用户职住点表,将该轨迹点和该职住地的数据存入该分布式数据库;
以用户的标识为键,将轨迹点和职住地的数据存入分布式数据库,以及,对轨迹点和职住地建立GeoHash索引,并以GeoHash值为键,轨迹点和职住地的数据存入分布式数据库,具体是通过存储用户轨迹表、GeoHash索引的用户定位点表、用户职住表和GeoHash索引的用户职住点表,将该轨迹点和该职住地的数据存入该分布式数据库。
更具体地,对于用户的轨迹点的数据,通过存储如下两张表来实现:用户轨迹表和GeoHash索引的用户定位点表。此两张表的数据按天存储。
其中,该用户轨迹表以用户的标识为键,存储该用户的轨迹点,该GeoHash索引的用户定位点表以GeoHash值为键,存储该GeoHash值对应区域的所有用户的定位点以及定位时间。具体是存储定位点的经纬度。
对于用户的职住地的数据,通过存储如下两张表来实现:用户职住表和GeoHash索引的用户职住点表。
其中,用户职住表以用户为键,存储该用户的职住地,GeoHash索引的用户职住表以GeoHash值为键,存储该GeoHash值对应区域的所有用户的职住地的经纬度,该职住地的经纬度包括:工作地的经纬度和职住地的经纬度。
进一步地,在分布式数据库中,可通过查询该用户的标识查询到该用户的轨迹点和职住地的数据。通过查询GeoHash值,确定查询区域,可查询在该区域中的轨迹点和职住地的数据。
通过存储上述四张表便可实现对存储的数据范围内任意用户、任意区域的任意查询,极大提高了操作的便捷性和查询的准确性。
S505、接收输入的查询指令,在该分布式数据库中进行关于用户及职住分布的查询。
本发明各实施例中的职住分析查询方法,可支持如下5类查询:
第一类:基于用户群的职住地分布查询;
第二类:基于区域的到访用户群查询;
第三类:基于区域的工作用户群或者居住用户群查询;
第四类:基于区域的到访用户的职住地分布查询;
第五类:基于区域内工作人群的职住地分布查询或者区域内居住人员的工作地查询。
具体地,上述第一类查询,查询指令为查询用户群的职住地分布,可通过直接查询该分布式数据库中存储的该用户职住表,通过查询用户群的各个用户的用户标识,得到各个用户的职住地,从而得到该用户群的职住地分布。
上述第二类查询,查询指令为查询区域内的到访用户群,先计算要查询的区域的所有GeoHash值,然后查询该分布式数据库中存储的GeoHash索引的用户定位点表,找到所有GeoHash值对应的用户以及用户的定位点,再用定位点精确判断用户是否真正到访,最终得到要查询的区域到访用户的集合。
上述第三类查询,查询指令为查询区域内的职住用户群,先计算要查询的区域的所有GeoHash值,然后查询该分布式数据库中存储的该GeoHash索引的用户职住表,找到所有GeoHash值对应的用户以及用户的所有职住经纬度,确认该职住经纬度是否在该要查询的区域内,若在,则确认是在该区域内工作或者居住的用户,从而精确得到该区域的工作用户群或者居住用户群。
上述第四类查询,查询指令是查询区域的到访用户的职住地分布,首先查询该区域的到访用户,查询方法与上述第二类查询相同,得到到访用户集合后,采用与上述第一类查询相同的方式得到目标用户集合的职住分布。
上述第五类查询,查询指令是区域内工作人群的职住地分布查询或者区域内居住人员的工作地查询,首先查询该区域内工作或者居住的用户集合,查询方法与上述第三类查询相同,得到区域内工作或者居住的用户集合后,采用与上述第一类查询相同的方式得到目标用户集合的职住分布。
本发明实施例中未描述的技术细节与前述图2~图6所示实施例相同,此处不再赘述。
本发明实施例中,获取智能设备在预置周期的定位点的数据,对定位点进行过滤及抽稀处理后,进行基于预设的工作时间段、居住时间段和所述预置周期的带权重的聚类,得到职住地数据,识别出属于同一个用户的多个手持智能设备,将所述多个手持智能设备的定位点的数据合并,得到所述用户的轨迹点的数据,以用户的标识为键,将轨迹点的数据和职住地的数据存入分布式数据库,对轨迹点和职住地建立GeoHash索引,并以GeoHash值为键,轨迹点和职住地的数据存入分布式数据库,从而更精确地确认职住地和轨迹点,并根据分布式数据库中存入的轨迹点和职住地的数据,进行职住分布的查询,可支持基于用户、基于区域的任意查询,极大的扩大了查询范围,提高了查询的精确度。对商业选址项目,城市规划项目以及区域广告投放的项目具有高度的参考价值。
请参见图7,图7为本发明一实施例提供的职住分布确认装置,为了便于说明,仅示出了与本发明实施例相关的部分。该装置可内置于服务器中,该装置包括:
第一识别模块601、第二识别模块602、处理模块603和存储模块604。
第一识别模块601,用于根据用户的智能设备上报的定位数据,识别该用户的职住地;
第二识别模块602,用于在与该职住地的无线网络连接过的智能设备中,识别出属于该用户的多个手持智能设备;
处理模块603,用于根据该多个手持智能设备的定位数据,得到该用户的轨迹点;
存储模块604,用于对该轨迹点和该职住地建立索引,并将建立索引后的该轨迹点和该职住地的数据存入数据库。
本发明实施例中的装置用于执行前述图2所述实施例的方法,未描述的技术细节与前述图2所示实施例相同,此处不再赘述。
本发明实施例中,第一识别模块根据用户的智能设备上报的定位数据,识别用户的职住地,第二识别模块在与职住地的无线网络连接过的智能设备中,识别出属于用户的多个手持智能设备,处理模块根据多个手持智能设备的定位数据,得到用户的轨迹点,存储模块对轨迹点和职住地建立索引,并将建立索引后的轨迹点和职住地的数据存入数据库,结合智能设备的定位数据和接入的无线网络,更精确地确认职住地和轨迹点。
请参见图8,图8为本发明另一实施例提供的职住分布确认装置,为了便于说明,仅示出了与本发明实施例相关的部分。该装置可内置于服务器中,本实施例所示的装置与图7所示的装置不同之处在于:
第一识别模块601可以进一步包括:
获取子模块6011,用于获取该智能设备在预置周期内上报的定位点的数据;
处理子模块6012,用于按照预置处理规则对该定位点进行过滤及抽稀处理;
处理子模块6012,具体用于过滤掉非职住定位点,并对过滤后的定位点按照预置时长抽稀处理得到处理后的定位点;
聚类子模块6013,用于将处理后得到的定位点进行基于预设的工作时间段、居住时间段和该预置周期的带权重的聚类,得到该用户的职住地的数据,该职住地的数据包括工作地和居住地的数据,该工作时间段内权重最高的聚类中心点作为工作地,该居住地时间段内权重最高的聚类中心点作为居住地;
聚类子模块6013,具体用于该预置周期的每一天划分为多个权重时间段,并为每个权重时间段设置不同的工作属性权重和居住属性权重,其中,若权重时间段对应该预设的工作时间段,则该权重时间段的工作属性权重大于居住属性权重,若权重时间段对应该预设的居住时间段,则该权重时间段的居住属性权重大于工作属性权重;
按照预置算法,对该处理后的定位点基于该预设的工作时间段和居住时间段分别进行聚类,得到工作地聚类集合和居住地聚类集合;
根据该工作地聚类集合中的各工作地的定位时间对应的该工作属性权重和居住属性权重,计算该各工作地聚类的聚类权重得分,以及根据该居住地聚类集合中的各居住地的定位时间对应的该工作属性权重和居住属性权重,计算该各居住地聚类的聚类权重得分,并将工作地聚类集合与居住地聚类集合按照各自的聚类权重得分分别排序;
选取聚类权重得分最高的工作地聚类的中心点作为工作地,选取聚类权重得分最高的居住地聚类的中心点作为居住地。
进一步地,第二识别模块602包括:
确认子模块6021,用于根据该职住地的位置信息和智能设备接入无线网络后的定位点的数据,确认职住地无线网络;
识别子模块6022,用于在与该职住地无线网络连接过的智能设备中识别出属于该用户的多个手持智能设备;
识别子模块6022,用于确认连接过该职住地无线网络的设备信息,并将预置统计周期内连接该职住地无线网络的天数大于等于预置天数的设备作为候选设备集合;
将该候选设备集合中,所连接的无线网络均为该职住地无线网络,并且定位点的位置位于该职住地无线网络的预置距离内的智能设备确认为职住地智能设备;
统计该候选设备集合中除去该职住地智能设备之外的其他候选设备,在该预置统计周期内的相近得分和相异得分,该相近得分为按照预置统计规则统计的该其他候选设备之间,关于无线网络的相近分和关于位置相近分之和,该相异得分为按照预置统计规则统计的该其他候选设备之间,关于无线网络的相异分和关于位置相异分之和;
若多个设备的相近得分大于等于第一预置数值并且相异得分小于等于第二预置数值,则确认该设备为该用户的多个智能手持设备。
处理模块603,具体用于将该多个手持智能设备的定位点的数据合并,得到该用户的轨迹点的数据,该轨迹点的数据为定位点与定位时间的对应关系;
存储模块604,具体用于以该用户的标识为键,将该轨迹点和该职住地的数据存入分布式数据库,以及,对该轨迹点和该职住地建立GeoHash索引,并以GeoHash值为键,将该轨迹点和该职住地的数据存入该分布式数据库;
存储模块604,还用于存储用户轨迹表和GeoHash索引的用户定位点表,其中,该用户轨迹表以用户的标识为键,存储该用户的轨迹点,该GeoHash索引的用户定位点表以GeoHash值为键,存储该GeoHash值对应区域的所有用户的定位点以及定位时间;
以及,存储用户职住表和GeoHash索引的用户职住点表,其中,该用户职住表以用户为键,存储该用户的职住地,该GeoHash索引的用户职住表以GeoHash值为键,存储该GeoHash值对应区域的所有用户的职住地的经纬度。
进一步地,该装置还包括:
查询模块605,用于若查询用户群的职住地分布的查询指令,则根据分布式数据库中存储的用户职住表查询得到用户群中各用户的职住地分布;
查询模块605,还用于若查询区域内的到访用户群的查询指令,则计算得到区域所有地理空间哈希值,并根据分布式数据库中存储的地理空间哈希索引的用户定位点表,查询到所有地理空间哈希值对应的用户及用户的定位点,以及,通过查询到的定位点确认到访区域的用户,到访用户群包括确认的所有到访区域的用户;
查询模块605,还用于若查询区域内的职住用户群的查询指令,则计算得到区域所有地理空间哈希值,并根据分布式数据库中存储的地理空间哈希索引的用户职住表,查询到所有地理空间哈希值对应的用户及用户的职住经纬度,以及,通过查询到的职住经纬度确认在区域内职住的用户,职住用户群包括所有确认的在区域内职住的用户。
本发明实施例中的装置用于执行前述图2~图6所述实施例的方法,未描述的技术细节与前述图2~图6所示实施例相同,此处不再赘述。
本发明实施例中,获取子模块获取智能设备在预置周期的定位点的数据,处理子模块对定位点进行过滤及抽稀处理后,聚类子模块进行基于预设的工作时间段、居住时间段和所述预置周期的带权重的聚类,得到职住地数据,识别子模块识别出属于同一个用户的多个手持智能设备,处理模块将所述多个手持智能设备的定位点的数据合并,得到所述用户的轨迹点的数据,存储模块以用户的标识为键,将轨迹点的数据和职住地的数据存入分布式数据库,对轨迹点和职住地建立GeoHash索引,并以GeoHash值为键,轨迹点和职住地的数据存入分布式数据库,从而更精确地确认职住地和轨迹点,查询模块根据分布式数据库中存入的轨迹点和职住地的数据,进行职住分布的查询,可支持基于用户、基于区域的任意查询,极大的扩大了查询范围,提高了查询的精确度。对商业选址项目,城市规划项目以及区域广告投放的项目具有高度的参考价值。
请参阅图9,本发明实施例还提供了一种服务器。包括:
至少一个输入设备71;至少一个输出设备72;至少一个处理器73,例如中央处理器;以及,存储器74。
上述输入设备71、输出设备72、处理器73和存储器74通过总线75连接。
其中,输入设备71具体可为摄像头、触控面板、物理按键或者鼠标等等。输出设备72具体可为显示屏。
存储器74可以是高速随机存取记忆体(RAM,Random Access Memory)存储器,也可为非不稳定的存储器(non-volatile memory),例如磁盘存储器。存储器74用于存储一组可执行程序代码,处理器73与存储器74耦合,上述输入设备71、输出设备72和处理器73用于通过存储器74中存储的可执行程序代码,执行如下操作:
通过处理器73执行该代码,执行如前述图2~图6所示实施例中描述的职住分布确认方法。
进一步的,本发明实施例还提供了一种计算机可读存储介质,该计算机可读存储介质可以是设置于上述各实施例中的服务器中,该计算机可读存储介质可以是前述图9所示实施例中的存储器。该计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现前述图2至图6所示实施例中描述的职住分布确认方法。进一步的,该计算机可存储介质还可以是U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
在本申请所提供的多个实施例中,应该理解到,所揭露的方法、装置和服务器,可以通过其它的方式实现。例如,以上所描述的装置的实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信链接可以是通过一些接口,装置或模块的间接耦合或通信链接,可以是电性,机械或其它的形式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本发明所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
以上为对本发明所提供的职住分布确认方法、职住分布确认装置、服务器和计算机可读存储介质的描述,对于本领域的技术人员,依据本发明实施例的思想,在具体实施方式及应用范围上均会有改变之处,综上,本说明书内容不应理解为对本发明的限制。

Claims (12)

1.一种职住分布确认方法,其特征在于,包括:
获取用户的智能设备在预置周期内上报的定位数据;
过滤掉非职住定位点,并对过滤后的定位点按照预置时长抽稀处理得到处理后的定位点;
将所述预置周期的每一天划分为多个权重时间段,并为每个权重时间段设置不同的工作属性权重和居住属性权重,其中,若权重时间段对应预设的工作时间段,则所述权重时间段的工作属性权重大于居住属性权重,若权重时间段对应预设的居住时间段,则所述权重时间段的居住属性权重大于工作属性权重;
按照预置算法,对所述处理后的定位点基于所述预设的工作时间段和居住时间段分别进行聚类,得到工作地聚类集合和居住地聚类集合;
根据所述工作地聚类集合中的各工作地的定位时间对应的所述工作属性权重和居住属性权重,计算所述各工作地聚类的聚类权重得分,以及根据所述居住地聚类集合中的各居住地的定位时间对应的所述工作属性权重和居住属性权重,计算所述各居住地聚类的聚类权重得分,并将工作地聚类集合与居住地聚类集合按照各自的聚类权重得分分别排序,选取聚类权重得分最高的工作地聚类的中心点作为工作地,选取聚类权重得分最高的居住地聚类的中心点作为居住地;
将所述工作地和所述居住地确定为所述用户的职住地;
在与所述职住地的无线网络连接过的智能设备中,识别出属于所述用户的多个手持智能设备,并根据所述多个手持智能设备的定位数据,得到所述用户的轨迹点;
对所述轨迹点和所述职住地建立索引,并将建立索引后的所述轨迹点和所述职住地的数据存入数据库。
2.根据权利要求1所述的方法,其特征在于,在与所述职住地的无线网络连接过的智能设备中,识别出属于所述用户的多个手持智能设备包括:
根据所述职住地的位置信息和智能设备接入无线网络后的定位点的数据,确认职住地无线网络;
在与所述职住地无线网络连接过的智能设备中,识别出属于所述用户的多个手持智能设备。
3.根据权利要求2所述的方法,其特征在于,所述在与所述职住地无线网络连接过的智能设备中识别出属于所述用户的多个手持智能设备包括:
确认连接过所述职住地无线网络的设备信息,并将预置统计周期内连接所述职住地无线网络的天数大于等于预置天数的设备作为候选设备集合;
将所述候选设备集合中,所连接的无线网络均为所述职住地无线网络,并且定位点的位置位于所述职住地无线网络的预置距离内的智能设备确认为职住地智能设备;
统计所述候选设备集合中除去所述职住地智能设备之外的其他候选设备,在所述预置统计周期内的相近得分和相异得分,所述相近得分为按照预置统计规则统计的所述其他候选设备之间,关于无线网络的相近分和关于位置相近分之和,所述相异得分为按照预置统计规则统计的所述其他候选设备之间,关于无线网络的相异分和关于位置相异分之和;
若多个设备的相近得分大于等于第一预置数值并且相异得分小于等于第二预置数值,则确认所述设备为所述用户的多个智能手持设备。
4.根据权利要求3所述的方法,其特征在于,所述根据所述多个手持智能设备的定位数据,得到所述用户的轨迹点,包括:
将所述多个手持智能设备的定位点的数据合并,得到所述用户的轨迹点的数据,所述轨迹点的数据为定位点与定位时间的对应关系。
5.根据权利要求1所述的方法,其特征在于,所述对所述轨迹点和所述职住地建立索引,并将建立索引后的所述轨迹点和所述职住地的数据存入数据库包括:
以所述用户的标识为键,将所述轨迹点和所述职住地的数据存入分布式数据库,以及,对所述轨迹点和所述职住地建立地理空间哈希索引,并以地理空间哈希值为键,将所述轨迹点和所述职住地的数据存入所述分布式数据库。
6.根据权利要求5所述的方法,其特征在于,所述以所述用户的标识为键,将所述轨迹点和所述职住地的数据存入分布式数据库,以及,对所述轨迹点和所述职住地建立地理空间哈希索引,并以地理空间哈希值为键,将所述轨迹点和所述职住地的数据存入所述分布式数据库包括:
存储用户轨迹表和地理空间哈希索引的用户定位点表,其中,所述用户轨迹表以用户的标识为键,存储所述用户的轨迹点,所述地理空间哈希索引的用户定位点表以地理空间哈希值为键,存储所述地理空间哈希值对应区域的所有用户的定位点以及定位时间;
以及,存储用户职住表和地理空间哈希索引的用户职住点表,其中,所述用户职住表以用户为键,存储所述用户的职住地,所述地理空间哈希索引的用户职住表以地理空间哈希值为键,存储所述地理空间哈希值对应区域的所有用户的职住地的经纬度。
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:
若接收到查询用户群的职住地分布的查询指令,则根据所述分布式数据库中存储的所述用户职住表查询得到所述用户群中各用户的职住地分布;
或者,
若接收到查询区域内的到访用户群的查询指令,则计算得到所述区域所有地理空间哈希值,并根据所述分布式数据库中存储的所述地理空间哈希索引的用户定位点表,查询到所有地理空间哈希值对应的用户及所述用户的定位点,以及,通过查询到的定位点确认到访所述区域的用户,所述到访用户群包括确认的所有到访所述区域的用户;
或者,
若接收到查询区域内的职住用户群的查询指令,则计算得到所述区域所有地理空间哈希值,并根据所述分布式数据库中存储的所述地理空间哈希索引的用户职住表,查询到所有地理空间哈希值对应的用户及所述用户的职住经纬度,以及,通过查询到的职住经纬度确认在所述区域内职住的用户,所述职住用户群包括所有确认的在所述区域内职住的用户。
8.一种职住分布确认装置,其特征在于,所述装置包括:
获取子模块,用于获取用户的智能设备在预置周期内上报的定位数据;
处理子模块,用于过滤掉非职住定位点,并对过滤后的定位点按照预置时长抽稀处理得到处理后的定位点;
聚类子模块,用于将所述预置周期的每一天划分为多个权重时间段,并为每个权重时间段设置不同的工作属性权重和居住属性权重,其中,若权重时间段对应预设的工作时间段,则所述权重时间段的工作属性权重大于居住属性权重,若权重时间段对应预设的居住时间段,则所述权重时间段的居住属性权重大于工作属性权重;
按照预置算法,对所述处理后的定位点基于所述预设的工作时间段和居住时间段分别进行聚类,得到工作地聚类集合和居住地聚类集合;
根据所述工作地聚类集合中的各工作地的定位时间对应的所述工作属性权重和居住属性权重,计算所述各工作地聚类的聚类权重得分,以及根据所述居住地聚类集合中的各居住地的定位时间对应的所述工作属性权重和居住属性权重,计算所述各居住地聚类的聚类权重得分,并将工作地聚类集合与居住地聚类集合按照各自的聚类权重得分分别排序,选取聚类权重得分最高的工作地聚类的中心点作为工作地,选取聚类权重得分最高的居住地聚类的中心点作为居住地;
职住地确定模块,用于将所述工作地和所述居住地确定为所述用户的职住地;
第二识别模块,用于在与所述职住地的无线网络连接过的智能设备中,识别出属于所述用户的多个手持智能设备;
处理模块,用于根据所述多个手持智能设备的定位数据,得到所述用户的轨迹点;
存储模块,用于对所述轨迹点和所述职住地建立索引,并将建立索引后的所述轨迹点和所述职住地的数据存入数据库。
9.根据权利要求8所述的装置,其特征在于,所述第二识别模块包括:
确认子模块,用于根据所述职住地的位置信息和智能设备接入无线网络后的定位点的数据,确认职住地无线网络;
识别子模块,用于在与所述职住地无线网络连接过的智能设备中识别出属于所述用户的多个手持智能设备;
所述识别子模块,具体用于确认连接过所述职住地无线网络的设备信息,并将预置统计周期内连接所述职住地无线网络的天数大于等于预置天数的设备作为候选设备集合;
将所述候选设备集合中,所连接的无线网络均为所述职住地无线网络,并且定位点的位置位于所述职住地无线网络的预置距离内的智能设备确认为职住地智能设备;
统计所述候选设备集合中除去所述职住地智能设备之外的其他候选设备,在所述预置统计周期内的相近得分和相异得分,所述相近得分为按照预置统计规则统计的所述其他候选设备之间,关于无线网络的相近分和关于位置相近分之和,所述相异得分为按照预置统计规则统计的所述其他候选设备之间,关于无线网络的相异分和关于位置相异分之和;
若多个设备的相近得分大于等于第一预置数值并且相异得分小于等于第二预置数值,则确认所述设备为所述用户的多个智能手持设备。
10.根据权利要求8所述的装置,其特征在于,所述处理模块,具体用于将所述多个手持智能设备的定位点的数据合并,得到所述用户的轨迹点的数据,所述轨迹点的数据为定位点与定位时间的对应关系;
所述存储模块,具体用于以所述用户的标识为键,将所述轨迹点和所述职住地的数据存入分布式数据库,以及,对所述轨迹点和所述职住地建立地理空间哈希索引,并以地理空间哈希值为键,将所述轨迹点和所述职住地的数据存入所述分布式数据库;
所述存储模块,还用于存储用户轨迹表和地理空间哈希索引的用户定位点表,其中,所述用户轨迹表以用户的标识为键,存储所述用户的轨迹点,所述地理空间哈希索引的用户定位点表以地理空间哈希值为键,存储所述地理空间哈希值对应区域的所有用户的定位点以及定位时间;
所述存储模块,还用于存储用户职住表和地理空间哈希索引的用户职住点表,其中,所述用户职住表以用户为键,存储所述用户的职住地,所述地理空间哈希索引的用户职住表以地理空间哈希值为键,存储所述地理空间哈希值对应区域的所有用户的职住地的经纬度;
所述装置还包括:
查询模块,用于若接收到查询用户群的职住地分布的查询指令,则根据所述分布式数据库中存储的所述用户职住表查询得到所述用户群中各用户的职住地分布;
所述查询模块,还用于若接收到查询区域内的到访用户群的查询指令,则计算得到所述区域所有地理空间哈希值,并根据所述分布式数据库中存储的所述地理空间哈希索引的用户定位点表,查询到所有地理空间哈希值对应的用户及所述用户的定位点,以及,通过查询到的定位点确认到访所述区域的用户,所述到访用户群包括确认的所有到访所述区域的用户;
所述查询模块,还用于若接收到查询区域内的职住用户群的查询指令,则计算得到所述区域所有地理空间哈希值,并根据所述分布式数据库中存储的所述地理空间哈希索引的用户职住表,查询到所有地理空间哈希值对应的用户及所述用户的职住经纬度,以及,通过查询到的职住经纬度确认在所述区域内职住的用户,所述职住用户群包括所有确认的在所述区域内职住的用户。
11.一种服务器,包括存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述的职住分布确认方法。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现如权利要求1至7中的任一项所述的职住分布确认方法。
CN201711310208.3A 2017-12-11 2017-12-11 职住分布确认方法、装置、服务器及计算机可读存储介质 Active CN110020221B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711310208.3A CN110020221B (zh) 2017-12-11 2017-12-11 职住分布确认方法、装置、服务器及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711310208.3A CN110020221B (zh) 2017-12-11 2017-12-11 职住分布确认方法、装置、服务器及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN110020221A CN110020221A (zh) 2019-07-16
CN110020221B true CN110020221B (zh) 2022-02-18

Family

ID=67186844

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711310208.3A Active CN110020221B (zh) 2017-12-11 2017-12-11 职住分布确认方法、装置、服务器及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN110020221B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110618997B (zh) * 2019-08-13 2022-07-26 深圳市天彦通信股份有限公司 身份数据统一方法和相关装置
CN110850955B (zh) * 2019-10-30 2023-06-02 腾讯科技(深圳)有限公司 终端的位置信息处理方法、装置及计算设备、存储介质
CN111190984B (zh) * 2019-12-30 2024-03-08 北京世纪高通科技有限公司 职住地提取方法、装置及计算机可读存储介质
CN111198972B (zh) * 2019-12-30 2023-05-09 中国联合网络通信集团有限公司 用户职住地识别方法、装置、控制设备及存储介质
CN111428197B (zh) * 2020-03-18 2024-02-09 北京城市象限科技有限公司 数据处理方法、装置及设备
CN111737600B (zh) * 2020-05-18 2021-07-09 浙江口碑网络技术有限公司 信息提供方法、装置和设备以及展示顾客信息的系统
CN111797181B (zh) * 2020-05-26 2023-09-05 北京城市象限科技有限公司 用户职住地的定位方法、装置、控制设备及存储介质
CN114339606B (zh) * 2020-09-27 2023-10-27 北京三快在线科技有限公司 确定用户位置的方法、装置、存储介质和电子设备
CN112685659B (zh) * 2021-03-19 2021-06-18 上海钐昆网络科技有限公司 目标地点确定方法、装置、电子设备及计算机存储介质
CN112699206B (zh) * 2021-03-23 2021-07-13 上海迹寻科技有限公司 一种用户职、住地分析方法及装置
CN113283542B (zh) * 2021-06-17 2024-03-05 北京红山信息科技研究院有限公司 职住信息确定方法、装置、设备及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102333274A (zh) * 2010-07-12 2012-01-25 同济大学 一种基于手机信号数据处理通勤信息的方法及装置
CN104159189A (zh) * 2013-05-15 2014-11-19 同济大学 基于智能手机的居民出行信息获取方法
US8996033B1 (en) * 2013-12-04 2015-03-31 4Info, Inc. Systems and methods for statistically associating mobile devices to households
CN105307112A (zh) * 2014-08-01 2016-02-03 中国电信股份有限公司 分析获取用户移动轨迹的方法和系统
CN105630951A (zh) * 2015-12-23 2016-06-01 北京奇虎科技有限公司 判断聚类的用户职业分布方法和装置
CN106792514A (zh) * 2016-11-30 2017-05-31 南京华苏科技有限公司 基于信令数据的用户职住地分析方法
CN106931974A (zh) * 2017-03-29 2017-07-07 清华大学 基于移动终端gps定位数据记录计算个人通勤距离的方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102333274A (zh) * 2010-07-12 2012-01-25 同济大学 一种基于手机信号数据处理通勤信息的方法及装置
CN104159189A (zh) * 2013-05-15 2014-11-19 同济大学 基于智能手机的居民出行信息获取方法
US8996033B1 (en) * 2013-12-04 2015-03-31 4Info, Inc. Systems and methods for statistically associating mobile devices to households
CN105307112A (zh) * 2014-08-01 2016-02-03 中国电信股份有限公司 分析获取用户移动轨迹的方法和系统
CN105630951A (zh) * 2015-12-23 2016-06-01 北京奇虎科技有限公司 判断聚类的用户职业分布方法和装置
CN106792514A (zh) * 2016-11-30 2017-05-31 南京华苏科技有限公司 基于信令数据的用户职住地分析方法
CN106931974A (zh) * 2017-03-29 2017-07-07 清华大学 基于移动终端gps定位数据记录计算个人通勤距离的方法

Also Published As

Publication number Publication date
CN110020221A (zh) 2019-07-16

Similar Documents

Publication Publication Date Title
CN110020221B (zh) 职住分布确认方法、装置、服务器及计算机可读存储介质
US10474727B2 (en) App recommendation using crowd-sourced localized app usage data
Ahas et al. Using mobile positioning data to model locations meaningful to users of mobile phones
KR102121361B1 (ko) 사용자가 위치되는 지리적 위치의 유형을 식별하기 위한 방법 및 디바이스
EP3605365A1 (en) Site selection method and device
CA2854874C (en) Method and server for searching for nearby user in social networking services
US9846736B2 (en) Data processing method, data processing device, data collecting method and information providing method
US8830909B1 (en) Methods and systems to determine user relationships, events and spaces using wireless fingerprints
CN109672715A (zh) 用户常驻地判断方法、装置、设备及计算机可读存储介质
CN105989087B (zh) 一种确定热点区域的方法和装置
WO2019153889A1 (zh) 地理位置服务的实现
CN103929719B (zh) 定位信息的优化方法和优化装置
CN107430631B (zh) 从位置报告确定语义地点名称
CN104239453B (zh) 数据处理方法及装置
CN109195219B (zh) 服务器确定移动终端位置的方法
JP2012123542A (ja) サーバ、情報管理方法、情報管理プログラム、及びそのプログラムを記録するコンピュータ読み取り可能な記録媒体
CN111209487B (zh) 用户数据分析方法、服务器及计算机可读存储介质
CN112100303A (zh) 建筑实体位置确定方法、装置、计算机设备及可读存储介质
CN112819544A (zh) 基于大数据的广告投放方法、装置、设备及存储介质
CN106487825B (zh) 信息关联方法及装置
CN104581633B (zh) 支持隐私保护的障碍空间内的区域最近邻查询系统及方法
CN111611337B (zh) 终端数据处理系统
CN114357102A (zh) 一种路网数据生成方法和装置
CN111242723A (zh) 用户子女情况判断方法、服务器及计算机可读存储介质
EP3719735A1 (en) Electronic map based charging request initiating time prediction method and device

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant