CN108804507B - 用户的住址位置确定方法及系统 - Google Patents

用户的住址位置确定方法及系统 Download PDF

Info

Publication number
CN108804507B
CN108804507B CN201810340070.XA CN201810340070A CN108804507B CN 108804507 B CN108804507 B CN 108804507B CN 201810340070 A CN201810340070 A CN 201810340070A CN 108804507 B CN108804507 B CN 108804507B
Authority
CN
China
Prior art keywords
user
time
address
location sets
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810340070.XA
Other languages
English (en)
Other versions
CN108804507A (zh
Inventor
熊新
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Didi Infinity Technology and Development Co Ltd
Original Assignee
Beijing Didi Infinity Technology and Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Didi Infinity Technology and Development Co Ltd filed Critical Beijing Didi Infinity Technology and Development Co Ltd
Priority to CN201810340070.XA priority Critical patent/CN108804507B/zh
Publication of CN108804507A publication Critical patent/CN108804507A/zh
Application granted granted Critical
Publication of CN108804507B publication Critical patent/CN108804507B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Navigation (AREA)

Abstract

本发明提供了一种用户的住址位置确定方法及系统,方法包括:获取用户的用户账号切换至离线状态时的第一时间和与所述第一时间对应的第一位置;获取所述用户的用户账号切换至登录状态时的第二时间和与所述第二时间对应的第二位置,所述第二时间晚于所述第一时间;若所述第二时间和所述第一时间之间的时间间隔大于第一阈值,且所述第二位置和所述第一位置之间的距离小于第二阈值,则将所述第一位置记录为所述用户的候选住址;将其对应的时间在预设时间范围内的所有候选住址添加至位置集合;对所述位置集合进行聚类分析,获得所述用户的住址位置。本方案能够精确的定位用户的住址位置。

Description

用户的住址位置确定方法及系统
技术领域
本发明涉及互联网技术领域,尤其涉及一种用户的住址位置确定方法及系统。
背景技术
随着互联网技术的不断发展,数据的采集、分析及应用也不断加强。以用户数据举例来说,基于用户数据可以用于进行用户行为,信息推送,用户画像等多个领域的数据分析。而这些领域对用户数据本身的准确性也存在一定的要求。
实际应用中,用户数据中的用户住址作为用户的基本信息,往往会在很大程度上影响用户数据分析结果的准确性,因此用户住址信息的准确性需要得到保证。目前,获取用户住址的方法主要是直接提取用户注册信息中的住址。然而在很多场景下,通过这种方案获得的用户住址通常不准确,例如,实际应用中用户的住址可能发生变化,而注册信息中的住址可能未进行及时更新,这就会影响后续基于用户数据进行的数据分析的准确性。
发明内容
本发明提供一种用户的住址位置确定方法及系统,用于解决现有方案获得的用户住址位置不准确的问题。
本发明的第一个方面是提供一种用户的住址位置确定方法,包括:
获取用户的用户账号切换至离线状态时的第一时间和与所述第一时间对应的第一位置;
获取所述用户的用户账号切换至登录状态时的第二时间和与所述第二时间对应的第二位置,所述第二时间晚于所述第一时间;
若所述第二时间和所述第一时间之间的时间间隔大于第一阈值,且所述第二位置和所述第一位置之间的距离小于第二阈值,则将所述第一位置记录为所述用户的候选住址;
将其对应的时间在预设时间范围内的所有候选住址添加至位置集合;
对所述位置集合进行聚类分析,获得所述用户的住址位置。
本发明的第二个方面是提供一种用户的住址位置确定系统,包括:
获取模块,用于获取用户的用户账号切换至离线状态时的第一时间和与所述第一时间对应的第一位置;
所述获取模块,还用于获取所述用户的用户账号切换至登录状态时的第二时间和与所述第二时间对应的第二位置,所述第二时间晚于所述第一时间;
统计模块,用于若所述第二时间和所述第一时间之间的时间间隔大于第一阈值,且所述第二位置和所述第一位置之间的距离小于第二阈值,则将所述第一位置记录为所述用户的候选住址;
分析模块,用于将其对应的时间在预设时间范围内的所有候选住址添加至位置集合;
所述分析模块,还用于对所述位置集合进行聚类分析,获得所述用户的住址位置。
本发明提供的用户的住址位置确定方法及系统,获取用户账号离线时的第一时间和第一位置以及该用户账号再次上线时的第二时间和第二位置,基于用户行为习惯,设定当第二时间和第一时间之间的时间间隔以及所述第二位置和所述第一位置之间的距离满足一定条件时,将所述第一位置记录为所述用户的候选住址,后续基于包括这些候选地址的位置集合通过进行聚类分析,获得所述用户的住址位置。本方案结合用户的行为习惯,筛选出可能为用户住址的位置集合,通过进行聚类分析能够精确的定位用户的住址,从而提高获取用户住址的准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍。
图1为本发明实施例一提供的一种用户的住址位置确定方法的流程示意图;
图2为本发明实施例一提供的另一种用户的住址位置确定方法的流程示意图;
图3为本发明实施例二提供的一种用户的住址位置确定方法的流程示意图;
图4为本发明实施例四提供一种用户的住址位置确定系统的结构示意图;
图5为本发明实施例五提供一种用户的住址位置确定系统的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部实施例。
需要说明的是,在本发明的描述中,术语“第一”、“第二”仅用于方便描述不同的部件或特征,而不能理解为指示或暗示顺序关系、相对重要性或者隐含指明所指示的技术特征的数量。
图1为本发明实施例一提供的一种用户的住址位置确定方法的流程示意图。如图1所示,该方法包括:
101、获取用户的用户账号切换至离线状态时的第一时间和与所述第一时间对应的第一位置。
其中,本实施例的执行主体可以为用户的住址位置确定系统。实际应用中,该系统的实现形式有多种,例如,用户的住址位置确定系统可以通过计算机程序、应用软件等实现。或者,用户的住址位置确定系统还可以通过存储有相关计算机程序的存储介质实现,例如U盘等。再或者,用户的住址位置确定系统还可以通过存储有相关计算机程序的实体装置实现,例如,手机、电脑、服务器等。
结合某用户在某应用软件(例如,出行软件)下的用户账号来对本实施例的方案进行举例说明,所述应用软件可以安装在终端中,所述终端包括但不限于移动电话或平板计算机之类的其他便携式通信设备,或者台式计算机等非便携式通信设备。可以理解,本实施例的方法也可以应用于除出行软件以外的应用软件,本实施例不对此进行限制。
具体的,所述用户账号切换至离线状态是指用户账号从应用软件中退出登录。进一步的,用户账号退出登录的方式可以是用户账号与服务器的连接断开,例如,所述应用软件停止运行,或者从应用软件中注销账号,或者其他退出登录的方式,本实施例不对此进行限制。
其中,所述位置可以指本实施例中步骤的执行主体所在的位置,例如,假设执行主体为终端,则获取的位置为终端的位置。具体的,获取位置的方法可有多种,比如通过GPS定位,在终端允许获取设备位置信息并给予授权的前提下,可以通过GPS全球定位系统获取终端的地理位置信息;还可以通过IP地址定位,通过解析终端发送的连接请求的IP地址,利用IP地址获取终端的地理位置信息。还可以采用其他方式获取位置,本实施例不对此进行限制。
102、获取所述用户的用户账号切换至登录状态时的第二时间和与所述第二时间对应的第二位置,所述第二时间晚于所述第一时间。
具体的,所述用户账号切换至登录状态是指用户账号再次登录所述应用软件。用户账号在所述第一时间离线后,再次登录所述出行软件时,获取此刻的时间和地理位置。
103、若所述第二时间和所述第一时间之间的时间间隔大于第一阈值,且所述第二位置和所述第一位置之间的距离小于第二阈值,则将所述第一位置记录为所述用户的候选住址。
具体的,该步骤中设定的条件能表征用户的行为习惯。其中,本实施例中的用户账号所属的应用软件可以为能够反映用户是否位于住址位置的应用软件,例如,可以为出行软件。结合实际场景举例来说,当用户抵达住址后,则不需再使用出行软件,即用户账号切换至离线状态,当用户准备离开住址出行时,则会登录出行软件来实现出行。
另外,结合用户的作息习惯,可以理解,用户账号离线和用户账号再次登录之间的时间间隔可以根据用户通常的休息时间设定一个阈值,如果时间间隔超过该阈值,则说明用户账号离线和用户账号再次登录时的位置可能为用户的住址。此外,还要求用户账号离线和用户账号再次登录的位置之间的距离应小于一定的距离,也就是说需要限定用户用户账号离线和用户账号再次登录期间处于相同的位置,以体现用户住址的特征,从而筛选出候选住址。
本实施方式中,当用户的用户账号从应用软件中退出登录,然后再次登录所述应用软件后,计算再次登录的时间与退出登录的时间之间的时间间隔,以及再次登录时的地理位置与退出登录时的地理位置之间的距离。获得上述时间间隔和距离之后,判断所述时间间隔是否大于预设的第一阈值,以及所述距离是否小于预设的第二阈值,若所述时间间隔大于第一阈值,且所述位置距离小于第二阈值,则将所述退出登录时的位置记录为所述用户的候选住址。
以实际场景举例来说,假设用户在2017年5月4日下午7点通过移动终端退出登录出行软件下的用户账号,退出登录时移动终端的地理位置为A,则获取并记录用户账号切换至离线状态的第一时间为2017年5月4日下午7点,第一位置为A。假设用户在2017年5月5日上午7点通过移动终端再次登录所述出行软件下的所述用户账号,再次登录时移动终端的地理位置为B,则获取并记录用户账号切换至登录状态的第二时间为2017年5月5日上午7点,第二位置为B。假设位置B与位置A之间的地理位置距离为1公里,计算获得的第二时间和第一时间之间的时间间隔为12小时,并假设第一阈值是5小时,第二阈值是2公里,则所述时间间隔大于5小时,所述位置距离小于2公里,因此,认为用户账号切换至离线状态时的位置A可能为用户的住址,将位置A记录为用户的候选住址。
104、将其对应的时间在预设时间范围内的所有候选住址添加至位置集合,并对所述位置集合进行聚类分析,获得所述用户的住址位置。
统计所述出行软件在预设的时间范围内记录的所述用户的所有的候选住址,形成位置集合。具体的,所述预设的时间范围可以是1个月、6个月或者一年,也可以是根据经验或者实际需求设定的时间,本实施例不对此进行限制。
实际应用中,在预设时间范围内,某次记录的用户的候选住址可能在该次记录之前已经被记录过,即所述位置集合中可能存在相同的位置元素。举例来说,假设预设的时间范围为5月4日至5月7日这4天,第一阈值为5小时,第二阈值为2公里,在这4天内,获得了这样一系列数据,即表1,为用户账号在这4天内离线和再次登录的时间和位置。
表1
如表1所示,用户账号于5月4日下午7点在位置A切换至离线状态,5月5日上午7点在位置B再次登录,其切换至离线和再次登录的时间间隔为12小时,大于5小时,且切换至离线时的位置A和再次登录时的位置B之间的距离为1公里,小于2公里,因此,记录位置A为用户的候选住址;同样的,用户账号于5月5日下午7点在位置A切换至离线状态,5月6日上午7点在位置C再次登录,其切换至离线和再次登录的时间间隔为13小时,大于5小时,且切换至离线时的位置A和再次登录时的位置C之间的距离为1.5公里,小于2公里,因此,再次记录位置A为用户的候选住址;同样的,用户账号于5月6日下午4点在位置D切换至离线状态,5月7日上午6点在位置E再次登录,其切换至离线和再次登录的时间间隔为14小时,大于5小时,且切换至离线时的位置A和再次登录时的位置C之间的距离为1.2公里,小于2公里,因此,记录位置D为用户的候选住址。统计用户在这4天内的所有候选住址,形成的位置集合为{A,A,D}。后续对所述位置集合进行聚类分析,获得所述用户的住址位置。
实际应用中,聚类分析的方法有多种。举例来说,可以采用网格聚类或者密度峰聚类对所述位置集合进行聚类分析,以获得所述用户的住址位置。作为本实施例一种可选的实施方式,如图2所示,图2为本发明实施例一提供的另一种用户的住址位置确定方法的流程示意图,在图1所示实施方式的基础上,步骤104可以包括:
1041、将其对应的时间在预设时间范围内的所有候选住址添加至位置集合;
1042、对所述位置集合中所有候选住址覆盖的地理区域进行网格划分,获得至少两个网格;
1043、获取每个网格的位置密度,并确定出位置密度最大的目标网格,所述网格的位置密度为所述网格内所有候选住址的记录次数之和;
1044、根据所述目标网格,获得所述用户的住址位置,所述住址位置的经度为所述目标网格内所有候选住址的经度的平均值,所述住址位置的纬度为所述目标网格内所有候选住址的纬度的平均值。
进一步的,可以将目标网格的中心点对应的位置作为用户的住址位置。
进一步的,若目标网格中存在不同的候选住址,还可以将目标网格中的记录次数最多的候选住址作为用户的住址位置。
以实际场景举例来说,假设统计获得的位置集合为{A、D、A、F、H},通过对A、D、F和H覆盖的地理位置区域进行网格划分,将位置A、D和F覆盖的地理位置区域划分为两个网格,位置A和F在一个网格中,位置D和H在另一个网格中,计算确定位置A和F所在的网格的位置密度为3,位置D和H所在的网格的位置密度为2,即位置A和F所在的网格的位置密度最大,因此,确定位置A和F所在的网格为目标网格。确定目标网格之后,可以将位置A和位置F的经度取平均值,获得平均经度,将位置A和位置F的纬度取平均值,获得平均纬度,将该平均经度和平均纬度对应的位置作为用户的住址位置;或者可以将目标网格的中心点对应的位置作为自己的住址位置;或者还可以将目标网格中的记录次数最多的位置A作为用户的住址位置。
本实施方式通过将位置集合中所有的候选住址覆盖区域量化为有限数目的网格单元,形成一个网格结构,可以快速准确的确定出位置密度最大的目标网格,从而快速准确的确定出用户的住址位置。
进一步的,在对所述位置集合进行聚类分析,获得所述用户的住址位置之前,所述方法还可以包括:从所述位置集合中,滤除其对应的时间不在预设时段内的候选住址。
实际应用中,除了抵达住址后的用户账号离线之外,还存在其它场景下可能导致用户账号离线,举例来说,用户除了抵达住址后从出行软件退出登录之外,还可能由于其他原因退出登录,比如可能由于突发情况或者个人的时间安排,在未抵达住址的位置即切换至离线,转而处理其它事项。例如,用户在上班时间的上午8点,因安排有客户访问而退出登录出行软件从公司出发外出,并在下午5点返回公司(位置X),则在该情形下记录的用户账号切换至离线状态的位置实际并非用户的住址。当在位置X处退出登录和再次登录的时间间隔大于第一阈值时,位置X也会被记录为用户的候选住址,即位置集合中包括位置X。因此,为了避免上述误判,通过判断位置集合中的候选住址对应的时间是否在预设的时段内,该预设的时段可以能够反映用户通常位于用户住址的时段,例如,下班后的时段,夜间休息的时段等,通过设定该时段对位置集合进行过滤,能够有效滤除位置集合中类似位置X这种干扰位置,从而更精确的定位用户的住址位置。
以实际应用举例来说,假设所述时段为下午6:30至第二天上午6:30点之间,预设的时间范围为5月4日至5月7日这4天,第一阈值为5小时,第二阈值为2公里,在这4天内,获得了如上表1所示的一系列数据,因此,统计表1中用户在这4天内的所有候选住址,形成的位置集合为{A,A,D}。由于用户5月6日在位置D下线的时间为下午4点,不在预设的时段内,因此从当前的位置集合{A,A,D}中,滤除位置D,最终形成的位置集合为{A,A,}。
本实施方式通过滤除位置集合中其对应的用户下线位置不在预设时段内候选住址,可以提高位置集合中候选住址的有效性,实现更精确的定位用户的住址位置。
本实施例提供的用户的住址位置确定方法,获取用户账号离线时的第一时间和第一位置以及该用户账号再次上线时的第二时间和第二位置,基于用户行为习惯,设定当第二时间和第一时间之间的时间间隔以及所述第二位置和所述第一位置之间的距离满足一定条件时,将所述第一位置记录为所述用户的候选住址,后续基于包括这些候选地址的位置集合通过进行聚类分析,获得所述用户的住址位置。本方案结合用户的行为习惯,筛选出可能为用户住址的位置集合,通过进行聚类分析能够精确的定位用户的住址,从而提高获取用户住址的准确性。
图3为本发明实施例二提供的一种用户的住址位置确定方法的流程示意图,如图3所示,在实施例一的基础上,在步骤104中所述对所述位置集合进行聚类分析,获得所述用户的住址位置之前,还可以包括:
301、根据所述目标用户的历史出行订单,获取其订单时间在所述预设时间范围内的所有出行订单;
具体的,所述出行订单可以包括用户在出行软件中以乘客身份主动发起的叫车订单。举例来说,在所述时间范围内的某一天,用户想从位置A乘车去位置B,并通过出行软件发起了叫车订单,则该出行订单为用户在所述时间范围内发起的出行订单。
302、提取每个出行订单中的出发位置和目的位置,将所述出发位置和目的位置添加至所述位置集合。
可以获取用户在所述时间范围内发起的所有的出行订单,并提取每一个出行订单中的出发位置和目的位置,并将每一个出行订单的出发位置和目的位置均记录为候选住址。
以实际应用举例来说,在预设的时间范围内,当用户不上班时,用户可能会选择不开车而通过出行软件叫车出行,因此,将用户的出行订单的出发位置和目的位置也作为用户的候选住址,可以增加用户实际住址位置附近的区域内的候选住址的密度,从而使聚类分析获得的住址位置更接近用户的实际住址位置。
本实施例提供的用户的住址位置确定方法,通过将用户的出行订单的出发位置和目的位置也作为住址候选位置进行聚类,可以提高聚类分析的结果的精确度,使得最终获得的用户的住址位置更接近用户的实际住址位置。
本发明实施例三提供一种用户的住址位置确定方法,本实施例仍以该方法应用于出行软件中来举例说明,在实施例一或实施例二的基础上,在对所述位置集合进行聚类分析,获得所述用户的住址位置之前,还可以包括:
获取所述位置集合中每个位置对应的兴趣点的类别(Point of Interest,简称POI)类别;
从所述位置集合中滤除其对应的兴趣点的类别不属于住宅的位置。
具体的,所述兴趣点(Point of Interest,简称POI)包含四方面信息:名称、类别、经度、纬度。POI类别包括商场、风景区、政府机构、住宅区等。
在本实施例中,获取位置集合中每个位置的POI类别,当某一位置的POI类别不是住宅区时,从位置集合中滤除该位置,可以提高位置集合中每一位置的有效性,从而提高聚类分析的结果的精确度,使得最终获得的用户的住址位置更接近用户的实际住址位置。
图4为本发明实施例四提供一种用户的住址位置确定系统的结构示意图,如图4所示,该系统包括:
获取模块41,用于获取用户的用户账号切换至离线状态时的第一时间和与所述第一时间对应的第一位置;
获取模块41,还用于获取所述用户的用户账号切换至登录状态时的第二时间和与所述第二时间对应的第二位置,所述第二时间晚于所述第一时间;
统计模块42,用于若所述第二时间和所述第一时间之间的时间间隔大于第一阈值,且所述第二位置和所述第一位置之间的距离小于第二阈值,则将所述第一位置记录为所述用户的候选住址;
分析模块43,用于将其对应的时间在预设时间范围内的所有候选住址添加至位置集合;
分析模块43,还用于对所述位置集合进行聚类分析,获得所述用户的住址位置。
具体的,当用户从打车软件出行软件中退出登录时,获取模块41获取用户退出登录,即下线时的第一时间和第一位置;当用户再次登录打车软件出行软件时,获取模块41上线模块42获取用户再次登录,即再次上线时的第二时间和第二位置;统计模块42记录模块43计算第二时间与第一时间之间的时间间隔,以及第二位置与第一位置之间的位置距离;若所述时间间隔大于第一阈值,所述位置距离小于第二阈值,则将第一位置记录为用户的候选住址;分析模块43分析模块44统计统计模块42记录模块43在预设的时间范围内记录的所有的用户候选住址,形成位置集合,并对位置集合进行聚类分析,获得用户的住址位置。
本实施方式提供的用户的住址位置确定系统可以执行图1所示的方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
进一步的,作为一种可选的实施方式,分析模块43可以包括:
划分单元,用于对所述位置集合中所有候选住址覆盖的地理区域进行网格划分,获得至少两个网格;
聚类单元,用于获取每个网格的位置密度,并确定出位置密度最大的目标网格,所述网格的位置密度为所述网格内所有候选住址的记录次数之和;
位置单元,用于根据所述目标网格,获得所述用户的住址位置,所述住址位置的经度为所述目标网格内所有候选住址的经度的平均值,所述住址位置的纬度为所述目标网格内所有候选住址的纬度的平均值。
具体的,当分析模块44获得预设时间范围内用户所有的候选住址并形成位置集合后,分析模块44中的划分单元将所述位置集合中所有候选住址覆盖的地理位置区域进行网格划分,将地理位置区域划分为至少两个网格;聚类单元获取每个网格中的候选住址的位置密度,并确定出位置密度最大的目标网格;位置单元计算获取目标网格内所有候选住址的经度的平均值,以及目标网格内所有候选住址的纬度的平均值,并将所述经度平均值和纬度平均值对应的位置作为用户的候选住址。
进一步的,位置单元还可以将目标网格的中心点对应的位置作为用户的住址位置。
进一步的,若目标网格中存在不同的候选住址,位置单元还可以将目标网格中的记录次数最多的候选住址作为用户的住址位置。
本实施方式提供的用户的住址位置确定系统可以执行图2所示的方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
本实施方式通过将位置集合中所有的候选住址覆盖区域量化为有限数目的网格单元,形成一个网格结构,可以快速准确的确定出位置密度最大的目标网格,从而快速准确的确定出用户的住址位置。
进一步的,作为一种可选的实施方式,所述系统还可以包括:第一滤除模块,用于从所述位置集合中,滤除其对应的时间不在预设时段内的候选住址。
本实施方式通过滤除位置集合中退出登录的时间不在预设时段内的位置,可以提高位置集合中候选住址的有效性,实现更精确的定位用户的住址位置。
本实施例提供的用户的住址位置确定系统,获取用户账号离线时的第一时间和第一位置以及该用户账号再次上线时的第二时间和第二位置,基于用户行为习惯,设定当第二时间和第一时间之间的时间间隔以及所述第二位置和所述第一位置之间的距离满足一定条件时,将所述第一位置记录为所述用户的候选住址,后续基于包括这些候选地址的位置集合通过进行聚类分析,获得所述用户的住址位置。本方案结合用户的行为习惯,筛选出可能为用户住址的位置集合,通过进行聚类分析能够精确的定位用户的住址,从而提高获取用户住址的准确性。
图5为本发明实施例五提供的一种用户的住址位置确定系统的结构示意图,如图5所示,在实施例四的基础上,所述系统还可以包括:
订单模块51,用于根据所述目标用户的历史出行订单,获取其订单时间在所述预设时间范围内的所有出行订单;
提取模块52,用于提取每个出行订单中的出发位置和目的位置,将所述出发位置和目的位置添加至所述位置集合。
本实施方式提供的用户的住址位置确定系统可以执行图3所示的方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
本实施例提供的用户的住址位置确定系统,通过将用户的出行订单的出发位置和目的位置也加入位置集合进行聚类,可以提高聚类分析的结果的精确度,使得最终获得的用户的住址位置更接近用户的实际住址位置。
本发明实施例六提供一种用户的住址位置确定系统,在实施例四或实施例五的基础上,所述系统还可以包括:
第二滤除模块,用于获取所述位置集合中每个位置对应的兴趣点的类别;
所述第二滤除模块,还用于从所述位置集合中滤除其对应的兴趣点的类别不属于住宅的位置。
在本实施例中,形成位置集合以后,获取位置集合中每个位置的POI类别,当某一位置的POI类别不是住宅区时,从位置集合中滤除该位置,可以提高位置集合中每一位置的有效性,从而提高聚类分析的结果的精确度,使得最终获得的用户的住址位置更接近用户的实际住址位置。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (10)

1.一种用户的住址位置确定方法,其特征在于,包括:
获取用户的用户账号切换至离线状态时的第一时间和与所述第一时间对应的第一位置;
获取所述用户的用户账号切换至登录状态时的第二时间和与所述第二时间对应的第二位置,所述第二时间晚于所述第一时间;
若所述第二时间和所述第一时间之间的时间间隔大于第一阈值,且所述第二位置和所述第一位置之间的距离小于第二阈值,则将所述第一位置记录为所述用户的候选住址;
将其对应的时间在预设时间范围内的所有候选住址添加至位置集合;
对所述位置集合进行聚类分析,获得所述用户的住址位置。
2.根据权利要求1所述的方法,其特征在于,所述对所述位置集合进行聚类分析,获得所述用户的住址位置,包括:
对所述位置集合中所有候选住址覆盖的地理区域进行网格划分,获得至少两个网格;
获取每个网格的位置密度,并确定出位置密度最大的目标网格,所述网格的位置密度为所述网格内所有候选住址的记录次数之和;
根据所述目标网格,获得所述用户的住址位置,所述住址位置的经度为所述目标网格内所有候选住址的经度的平均值,所述住址位置的纬度为所述目标网格内所有候选住址的纬度的平均值。
3.根据权利要求1所述的方法,其特征在于,所述对所述位置集合进行聚类分析,获得所述用户的住址位置之前,还包括:
从所述位置集合中,滤除其对应的时间不在预设时段内的候选住址。
4.根据权利要求1所述的方法,其特征在于,所述对所述位置集合进行聚类分析,获得所述用户的住址位置之前,还包括:
根据所述用户的历史出行订单,获取其订单时间在所述预设时间范围内的所有出行订单;
提取每个出行订单中的出发位置和目的位置,将所述出发位置和目的位置添加至所述位置集合。
5.根据权利要求1-2中任一项所述的方法,其特征在于,所述对所述位置集合进行聚类分析,获得所述用户的住址位置之前,还包括:
获取所述位置集合中每个位置对应的兴趣点的类别;
从所述位置集合中滤除其对应的兴趣点的类别不属于住宅的位置。
6.一种用户的住址位置确定系统,其特征在于,包括:
获取模块,用于获取用户的用户账号切换至离线状态时的第一时间和与所述第一时间对应的第一位置;
所述获取模块,还用于获取所述用户的用户账号切换至登录状态时的第二时间和与所述第二时间对应的第二位置,所述第二时间晚于所述第一时间;
统计模块,用于若所述第二时间和所述第一时间之间的时间间隔大于第一阈值,且所述第二位置和所述第一位置之间的距离小于第二阈值,则将所述第一位置记录为所述用户的候选住址;
分析模块,用于将其对应的时间在预设时间范围内的所有候选住址添加至位置集合;
所述分析模块,还用于对所述位置集合进行聚类分析,获得所述用户的住址位置。
7.根据权利要求6所述的系统,其特征在于,所述分析模块包括:
划分单元,用于对所述位置集合中所有候选住址覆盖的地理区域进行网格划分,获得至少两个网格;
聚类单元,用于获取每个网格的位置密度,并确定出位置密度最大的目标网格,所述网格的位置密度为所述网格内所有候选住址的记录次数之和;
位置单元,用于根据所述目标网格,获得所述用户的住址位置,所述住址位置的经度为所述目标网格内所有候选住址的经度的平均值,所述住址位置的纬度为所述目标网格内所有候选住址的纬度的平均值。
8.根据权利要求6所述的系统,其特征在于,所述系统还包括:
第一滤除模块,用于从所述位置集合中,滤除其对应的时间不在预设时段内的候选住址。
9.根据权利要求6所述的系统,其特征在于,所述系统还包括:
订单模块,用于根据所述用户的历史出行订单,获取其订单时间在所述预设时间范围内的所有出行订单;
提取模块,用于提取每个出行订单中的出发位置和目的位置,将所述出发位置和目的位置添加至所述位置集合。
10.根据权利要求6-7中任一项所述的系统,其特征在于,所述系统还包括:
第二滤除模块,用于获取所述位置集合中每个位置对应的兴趣点的类别;
所述第二滤除模块,还用于从所述位置集合中滤除其对应的兴趣点的类别不属于住宅的位置。
CN201810340070.XA 2018-04-16 2018-04-16 用户的住址位置确定方法及系统 Active CN108804507B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810340070.XA CN108804507B (zh) 2018-04-16 2018-04-16 用户的住址位置确定方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810340070.XA CN108804507B (zh) 2018-04-16 2018-04-16 用户的住址位置确定方法及系统

Publications (2)

Publication Number Publication Date
CN108804507A CN108804507A (zh) 2018-11-13
CN108804507B true CN108804507B (zh) 2019-07-30

Family

ID=64094293

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810340070.XA Active CN108804507B (zh) 2018-04-16 2018-04-16 用户的住址位置确定方法及系统

Country Status (1)

Country Link
CN (1) CN108804507B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111351499B (zh) * 2018-12-24 2022-04-12 北京嘀嘀无限科技发展有限公司 路径识别方法、装置、计算机设备和计算机可读存储介质
CN110519686B (zh) * 2019-08-28 2021-03-30 中国联合网络通信集团有限公司 预设地点识别方法、装置、设备及计算机可读存储介质
CN110544132B (zh) * 2019-09-06 2023-04-07 上海喜马拉雅科技有限公司 用户常活动位置的确定方法、装置、设备和存储介质
CN111611573B (zh) * 2020-05-20 2023-10-03 深圳市镜玩科技有限公司 实现终端设备切换的数据处理方法、相关设备及介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015077829A1 (en) * 2013-11-29 2015-06-04 Ranasinghe Damith Chinthana System for monitoring subject movement
CN107040886B (zh) * 2017-01-03 2020-04-24 阿里巴巴集团控股有限公司 一种信息确定的方法及装置
CN107517307A (zh) * 2017-08-03 2017-12-26 深圳市金立通信设备有限公司 一种设置闹钟的方法及其终端
CN107580069A (zh) * 2017-09-22 2018-01-12 挖财网络技术有限公司 用户地址的确定方法及装置
CN107704586B (zh) * 2017-10-09 2020-02-07 陈包容 一种基于用户活动地址的用户画像的方法、装置和系统

Also Published As

Publication number Publication date
CN108804507A (zh) 2018-11-13

Similar Documents

Publication Publication Date Title
CN108804507B (zh) 用户的住址位置确定方法及系统
CN108446281B (zh) 确定用户亲密度的方法、装置及存储介质
CN103227821B (zh) 一种目标用户位置数据的处理方法及装置
US9179435B2 (en) Filtering and clustering crowd-sourced data for determining beacon positions
US10467199B2 (en) Definition method for urban dynamic spatial structure circle
CN111212383B (zh) 区域常住人口数量的确定方法、装置、服务器和介质
CN109916413B (zh) 基于网格划分的道路匹配方法、系统、装置和存储介质
CN104008212A (zh) 一种地理位置信息相关联的物联网时间序列数据存取方法
CN111078818B (zh) 地址分析方法、装置、电子设备及存储介质
CN111680102A (zh) 基于人工智能的定位数据处理方法及相关设备
CN106210163B (zh) 基于ip地址的定位方法及装置
CN108205562B (zh) 地理信息系统的定位数据存储、检索方法及其装置
CN111479321B (zh) 一种网格构建方法、装置、电子设备和存储介质
CN112738729A (zh) 一种用手机信令数据判别探亲返乡游客的方法及系统
Sinnott et al. Accident black spot identification and verification through social media
CN111380530A (zh) 导航方法及相关产品
CN108345662A (zh) 一种考虑用户分布区域差异的签到微博数据加权统计方法
Sun et al. Big data mobile services for New York City taxi riders and drivers
CN116703132A (zh) 共享车辆动态调度的管理方法、装置及计算机设备
CN107801418B (zh) 利用地图检索记录的流动人口推算装置及方法
Girardin et al. Uncovering the presence and movements of tourists from user-generated content
CN114007186B (zh) 定位方法及相关产品
CN110188954A (zh) 基于pop网络的地标可靠性评估方法及装置
CN115759660A (zh) 一种无人驾驶车辆的调度方法、装置、设备和介质
Dash et al. CDR-To-MoVis: Developing a mobility visualization system from CDR data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant