CN108337644B - 一种数据处理方法及装置 - Google Patents

一种数据处理方法及装置 Download PDF

Info

Publication number
CN108337644B
CN108337644B CN201710034783.9A CN201710034783A CN108337644B CN 108337644 B CN108337644 B CN 108337644B CN 201710034783 A CN201710034783 A CN 201710034783A CN 108337644 B CN108337644 B CN 108337644B
Authority
CN
China
Prior art keywords
traffic
area
point array
stop point
starting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710034783.9A
Other languages
English (en)
Other versions
CN108337644A (zh
Inventor
孙福宁
孟凡超
纪丽平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201710034783.9A priority Critical patent/CN108337644B/zh
Publication of CN108337644A publication Critical patent/CN108337644A/zh
Application granted granted Critical
Publication of CN108337644B publication Critical patent/CN108337644B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/03Data mining

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Navigation (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明实施例公开了一种数据处理方法及装置,所述方法包括:获取用户的历史轨迹信息,并基于历史轨迹信息确定交通起止点数组,交通起止点数组包括起始区域标识和终点区域标识;获取起始区域标识所对应起始区域的当前用户流通量,终点区域标识所对应终点区域的历史用户流通量,以及交通起止点数组的边权重;基于起始区域的当前用户流通量、终点区域的历史用户流通量以及交通起止点数组的边权重,得到终点区域的当前用户流通量。采用本发明实施例,可提高终点区域的当前用户流通量的准确度。

Description

一种数据处理方法及装置
技术领域
本发明涉及互联网技术领域,尤其涉及一种数据处理方法及装置。
背景技术
服务器可以将地球坐标系转换为摩卡托坐标系,按照预设阈值对地图板块进行区域划分,得到多个区域。服务器可以通过以下方式确定各个区域的用户流通量:通过全球定位系统(Global Positioning System,GPS)或者基站定位系统等获取位于指定区域所对应区域的用户数量,基于该用户数量得到指定区域的用户流通量。但是对于居住属性的区域,常住人口的因素导致该区域的用户流通量不真实。另外,对于交通枢纽属性的区域,用户在该区域所对应区域短暂停留的可能性较大,导致基于用户数量确定的该区域的用户流通量的准确度较低。
发明内容
本发明实施例所要解决的技术问题在于,提供一种数据处理方法及装置,可提高终点区域的当前用户流通量的准确度。
为了解决上述技术问题,本发明实施例提供了一种数据处理方法,所述方法包括:
获取用户的历史轨迹信息,并基于所述历史轨迹信息确定交通起止点数组,所述交通起止点数组包括起始区域标识和终点区域标识;
获取所述起始区域标识所对应起始区域的当前用户流通量,所述终点区域标识所对应终点区域的历史用户流通量,以及所述交通起止点数组的边权重;
基于所述起始区域的当前用户流通量、所述终点区域的历史用户流通量以及所述交通起止点数组的边权重,得到所述终点区域的当前用户流通量。
相应地,本发明实施例还提供了一种数据处理装置,所述装置包括:
数组确定单元,用于获取用户的历史轨迹信息,并基于所述历史轨迹信息确定交通起止点数组,所述交通起止点数组包括起始区域标识和终点区域标识;
历史流通量获取单元,用于获取所述起始区域标识所对应起始区域的当前用户流通量,所述终点区域标识所对应终点区域的历史用户流通量,以及所述交通起止点数组的边权重;
当前流通量获取单元,用于基于所述起始区域的当前用户流通量、所述终点区域的历史用户流通量以及所述交通起止点数组的边权重,得到所述终点区域的当前用户流通量。
实施本发明实施例,通过获取用户的历史轨迹信息,并基于该历史轨迹信息确定交通起止点数组,获取起始区域标识所对应起始区域的当前用户流通量,终点区域标识所对应终点区域的历史用户流通量,以及该交通起止点数组的边权重,基于起始区域的当前用户流通量、终点区域的历史用户流通量以及该交通起止点数组的边权重,得到该终点区域的当前用户流通量,可提高终点区域的当前用户流通量的准确度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图;
图1是本发明实施例中提供的一种数据处理方法的流程示意图;
图2是本发明实施例中提供的一种界面示意图;
图3是本发明实施例中提供的一种数据处理装置的结构示意图;
图4是本发明实施例中提供的一种服务器的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供了一种数据处理方法,获取用户的历史轨迹信息,并基于该历史轨迹信息确定交通起止点数组,获取起始区域标识所对应起始区域的当前用户流通量,终点区域标识所对应终点区域的历史用户流通量,以及该交通起止点数组的边权重,基于起始区域的当前用户流通量、终点区域的历史用户流通量以及该交通起止点数组的边权重,得到该终点区域的当前用户流通量。相对传统的数据处理方法中基于位于指定区域的用户数量确定该区域的用户流通量,本发明实施例基于用户的历史轨迹信息确定各个区域的当前用户流通量,可提高终点区域的当前用户流通量的准确度。
上述数据处理方法可以运行在个人电脑、智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑、移动互联网设备(MID,Mobile Internet Devices)或穿戴式智能设备等终端运行的服务器中。服务器可以是互联网中的一个独立服务设备,或者是由互联网中的多个独立服务设备共同构成的集群服务设备,服务器可以包括即时通信服务器或者SNS(Social Networking Services,社会性网络服务)服务器等,例如数字地图服务器或者导航服务器等。
请参见图1,图1是本发明实施例公开的一种数据处理方法的流程示意图。如图1所示,该数据处理方法至少可以包括以下步骤:
S101,获取用户的历史轨迹信息,并基于历史轨迹信息确定交通起止点数组,交通起止点数组包括起始区域标识和终点区域标识。
服务器可以获取用户的历史轨迹信息,并基于历史轨迹信息确定交通起止点数组。其中,用户的历史轨迹信息可以包括定位得到的位置信息(例如经纬度)以及定位时间。交通起止点数组可以包括起始区域标识和终点区域标识。
举例来说,服务器可以向至少一个客户端发送轨迹信息获取请求,客户端可以运行在智能手机或者可穿戴设备等移动终端中,客户端可以通过GPS或者基站定位系统等获取用户的位置信息,以及获取位置信息的定位时间,客户端可以响应该轨迹信息获取请求将包含位置信息和定位时间的历史轨迹信息发送给服务器。可选的,客户端通过GPS或者基站定位系统等获取用户的位置信息,以及获取位置信息的定位时间之后,可以将每经过预设时间间隔获取到的位置信息和定位时间作为历史轨迹信息,并将该历史轨迹信息发送给服务器。需要说明的是,服务器可以获取至少一个用户的历史轨迹信息,一个用户的历史轨迹信息可以包括至少一个位置信息以及各个位置信息的定位时间,服务器基于一个用户的历史轨迹信息可以确定至少一个交通起止点数组。
可选的,服务器基于历史轨迹信息确定交通起止点数组的方式具体可以为:获取历史轨迹信息所包含的至少一个位置信息以及各个位置信息的定位时间,确定位置信息所属区域的区域标识,基于定位时间对各个区域标识进行排序,在经过排序的区域标识中将两两相邻的区域标识作为一个交通起止点数组,其中两两相邻的区域标识中定位时间较早的区域标识为起始区域标识,两两相邻的区域标识中定位时间较晚的区域标识为终点区域标识。
举例来说,服务器可以根据客户端标识获取同一个用户的历史轨迹信息,即同一个用户的历史轨迹信息的用户ID相同(例如客户端标识)。具体的,服务器可以将用户ID相同的历史轨迹信息进行数据聚合,归并到一个数据分组中,一个数据分组可以包括多条用户的定位记录,例如定位时间为2016年12月1日13:00时的经度为150°,纬度为120°,即位置信息为(150°,120°);定位时间为2016年12月1日14:00时的经度为145°,纬度为100°,即位置信息为(145°,100°);定位时间为2016年12月1日15:00时的经度为140°,纬度为130°,即位置信息为(140°,130°)。服务器可以按照定位时间从早到晚(或者从晚到早)的顺序对各个位置信息进行排序,例如经过排序的位置信息为(150°,120°)、(145°,100°)以及(140°,130°)。针对每一个位置信息,服务器可以将该位置信息中的经纬度坐标转化成摩卡托坐标,将经度对应的摩卡托坐标的数值除以200并向下取整得到的数值为该经度在摩卡托坐标系上的经度标识,将纬度对应的摩卡托坐标的数值除以200并向下取整得到的数值为该纬度在摩卡托坐标系上的纬度标识,将得到的经度标识和纬度标识作为该位置信息所属区域的区域标识,例如位置信息的经度标识为lngid,该位置信息的纬度标识为latid,则该位置信息所属区域的区域标识为(lngid,latid)。以图2所示的界面示意图为例,不同方格表示不同区域,不同区域的区域标识各不相同。
进一步的,服务器可以将经过排序的位置信息中的第一个位置信息所属区域的区域标识作为交通起止点数组的起始区域标识,遍历经过排序的位置信息中的其他位置信息所属区域的区域标识,将与第一个位置信息所属区域的区域标识不相同的区域标识作为该交通起止点数组的终点区域标识。服务器还可以将该交通起止点数组的终点区域标识作为下一个交通起止点数组的起始区域标识,遍历经过排序的位置信息中的其他位置信息所属区域的区域标识,将与下一个交通起止点数组的起始区域标识不相同的区域标识作为下一个交通起止点数组的终点区域标识,直至得到该用户的所有交通起止点数组。需要说明的是,服务器可以通过上述方法对各个用户的历史轨迹信息进行处理得到各个用户的交通起止点数组。
示例性的,同一个用户的历史轨迹信息包括第一位置信息、第二位置信息、第三位置信息以及第四位置信息,服务器按照定位时间的从早到晚的顺序对各个位置信息进行排序得到第一位置信息、第二位置信息、第三位置信息以及第四位置信息,其中第三位置信息所属区域的区域标识与第四位置信息所属区域的区域标识相同,第一位置信息所属区域的区域标识、第二位置信息所属区域的区域标识以及第三位置信息所属区域的区域标识各不相同。服务器可以将第一位置信息所属区域的区域标识作为第一交通起止点数组的起始区域标识,将第二位置信息所属区域的区域标识作为第一交通起止点数组的终点区域标识。服务器还可以将第二位置信息所属区域的区域标识作为第二交通起止点数组的起始区域标识,将第三位置信息所属区域的区域标识作为第二交通起止点数组的终点区域标识。
S102,获取起始区域标识所对应起始区域的当前用户流通量,终点区域标识所对应终点区域的历史用户流通量,以及交通起止点数组的边权重。
服务器基于历史轨迹信息确定交通起止点数组之后,可以获取该交通起止点数组的起始区域标识所对应起始区域的当前用户流通量,终点区域标识所对应终点区域的历史用户流通量,以及该交通起止点数组的边权重。
可选的,服务器获取起始区域标识所对应起始区域的当前用户流通量的方式具体可以为:确定包含各个交通起止点数组的交通起止点数组集,获取交通起止点数组集所包含的起始区域标识的出现次数,以及交通起止点数组集所包含的所有起始区域标识和所有终点区域标识的出现次数总和,将起始区域标识的出现次数除以出现次数总和,得到起始区域的当前用户流通量。
具体实现中,服务器可以获取起始区域的初始化用户流通量,将初始化用户流通量作为该起始区域的当前用户流通量。例如,当服务器的存储器中不存在该起始区域的用户流通量时,服务器可以获取关于所有用户的历史轨迹信息,基于各个历史轨迹信息得到各个用户的交通起止点数组,将包含所有用户的交通起止点数组作为交通起止点数组集。例如交通起止点数组集包括关于第一用户的第一交通起止点数组、第二交通起止点数组以及第三交通起止点数组,交通起止点数组集还包括关于第二用户的第一交通起止点数组以及第四交通起止点数组,其中第一交通起止点数组的起始区域标识为(A1,B1),其终点区域标识为(A2,B2);第二交通起止点数组的起始区域标识为(A2,B2),其终点区域标识为(A3,B3);第三交通起止点数组的起始区域标识为(A3,B3),其终点区域标识为(A4,B4);第四交通起止点数组的起始区域标识为(A2,B2),其终点区域标识为(A4,B4)。服务器的存储器中不存在起始区域标识为(A1,B1)的区域的用户流通量时,服务器可以获取区域标识(A1,B1)的出现次数为2,区域标识(A2,B2)的出现次数为4,区域标识(A3,B3)的出现次数为2,区域标识(A4,B4)的出现次数为2,则交通起止点数组集所包含的所有起始区域标识和所有终点区域标识的出现次数总和为2+4+2+2=10,服务器可以确定区域标识为(A1,B1)的区域的当前用户流通量为2/10=0.2。
可选的,服务器获取起始区域标识所对应起始区域的当前用户流通量的方式具体可以为:将关于目标交通起止点数组的终点区域的当前用户流通量作为关于交通起止点数组的起始区域的当前用户流通量,关于目标交通起止点数组的终点区域标识与关于交通起止点数组的起始区域标识相同。例如,服务器基于区域标识为(A1,B1)的区域的当前用户流通量、区域标识为(A2,B2)的区域的历史用户流通量以及第一交通起止点数组的边权重,得到区域标识为(A2,B2)的区域的当前用户流通量之后,服务器需要获取区域标识为(A3,B3)的区域的当前用户流通量时,可以基于区域标识为(A2,B2)的区域的当前用户流通量、区域标识为(A3,B3)的区域的历史用户流通量以及第二交通起止点数组的边权重,得到区域标识为(A3,B3)的区域的当前用户流通量。
可选的,服务器获取交通起止点数组的边权重的方式具体可以为:获取起始区域标识为同一区域标识的交通起止点数组的数量总和,在起始区域标识为同一区域标识的交通起止点数组中分别统计各个交通起止点数组的数量,将各个交通起止点数组的数量除以起始区域标识为同一区域标识的交通起止点数组的数量总和,得到交通起止点数组的边权重。
举例来说,服务器可以确定起始区域标识为(A1,B1)的交通起止点数组包括关于第一用户的第一交通起止点数组和关于第二用户的第一交通起止点数组,起始区域标识为(A1,B1)的交通起止点数组的数量总和为2,在起始区域标识为(A1,B1)的交通起止点数组中统计到第一交通起止点数组的数量为2,则服务器可以确定第一交通起止点数组的边权重为2/2=1。
举例来说,服务器可以确定起始区域标识为(A2,B2)的交通起止点数组包括关于第一用户的第二交通起止点数组和关于第二用户的第四交通起止点数组,起始区域标识为(A2,B2)的交通起止点数组的数量总和为2,在起始区域标识为(A2,B2)的交通起止点数组中统计到第二交通起止点数组的数量为1,第四交通起止点数组的数量为1,则服务器可以确定第二交通起止点数组的边权重为1/2=0.5,第四交通起止点数组的边权重为1/2=0.5。
S103,基于起始区域的当前用户流通量、终点区域的历史用户流通量以及交通起止点数组的边权重,得到终点区域的当前用户流通量。
服务器获取到起始区域的当前用户流通量、终点区域的历史用户流通量以及交通起止点数组的边权重之后,可以基于起始区域的当前用户流通量、终点区域的历史用户流通量以及交通起止点数组的边权重,得到终点区域的当前用户流通量。
可选的,服务器可以将起始区域的当前用户流通量乘以交通起止点数组的边权重,得到关于交通起止点数组的终点区域的流通量变量,将流通量变量与终点区域的历史用户流通量相加,得到终点区域的当前用户流通量。
例如,服务器获取到区域标识为(A1,B1)的区域的初始化流通量为0.2,第一交通起止点数组的边权重为1,当服务器的存储器中不存在区域标识为(A2,B2)的区域的用户流通量时,服务器可以将区域标识为(A2,B2)的区域的初始化流通量配置为0,则区域标识为(A2,B2)的区域的当前用户流通量可以为0.2*1+0=0.2。
又如,服务器可以获取区域标识为(A2,B2)的区域的当前用户流通量为0.2,第二交通起止点数组的边权重为0.5,当服务器的存储器中不存在区域标识为(A3,B3)的区域的用户流通量时,服务器可以将区域标识为(A3,B3)的区域的初始化流通量配置为0,则区域标识为(A3,B3)的区域的当前用户流通量可以为0.2*0.5+0=0.1。
可选的,当获取到关于所有交通起止点数组的起始区域或者终点区域的当前用户流通量时,服务器可以迭代执行获取用户的历史轨迹信息,并基于历史轨迹信息确定交通起止点数组,交通起止点数组包括起始区域标识和终点区域标识,获取起始区域标识所对应起始区域的当前用户流通量,终点区域标识所对应终点区域的历史用户流通量,以及交通起止点数组的边权重,基于起始区域的当前用户流通量、终点区域的历史用户流通量以及所述交通起止点数组的边权重,得到终点区域的当前用户流通量。
具体实现中,当交通起止点数组集包括第一交通起止点数组、第二交通起止点数组、第三交通起止点数组以及第四交通起止点数组时,服务器可以通过上述方法分别获取区域标识为(A1,B1)的区域的当前用户流通量、区域标识为(A2,B2)的区域的当前用户流通量、区域标识为(A3,B3)的区域的当前用户流通量以及区域标识为(A4,B4)的区域的当前用户流通量。进一步的,服务器可以再次获取各个客户端最新获取到的历史轨迹信息,基于最新获取到的历史轨迹信息确定交通起止点数组,交通起止点数组包括起始区域标识和终点区域标识,获取起始区域标识所对应起始区域的当前用户流通量,终点区域标识所对应终点区域的历史用户流通量,以及交通起止点数组的边权重,基于起始区域的当前用户流通量、终点区域的历史用户流通量以及所述交通起止点数组的边权重,得到终点区域的当前用户流通量,以实现对各个区域的当前用户流通量的更新,提高各个区域的当前用户流通量的准确度。
可选的,服务器获取到关于所有交通起止点数组的起始区域或者终点区域的当前用户流通量之后,可以获取各个区域在本次迭代中的当前用户流通量与该区域在上一次迭代中的当前用户流通量之间的差值,将关于各个区域的差值进行相加,得到流通量误差,将流通量误差除以各个区域的数量总和,得到平均误差,当平均误差大于预设阈值时,触发获取用户的历史轨迹信息。其中,该区域包括起始区域或者终点区域;当平均误差小于或者等于预设阈值时,服务器可以终止本次流程,即停止获取用户的历史轨迹信息。
示例性的,在上一次迭代中,区域标识为(A1,B1)的区域的当前用户流通量为0.2,区域标识为(A2,B2)的区域的当前用户流通量为0.1,区域标识为(A3,B3)的区域的当前用户流通量为0.1,区域标识为(A4,B4)的区域的当前用户流通量为0.1;在本次迭代中,区域标识为(A1,B1)的区域的当前用户流通量为0.3,区域标识为(A2,B2)的区域的当前用户流通量为0.15,区域标识为(A3,B3)的区域的当前用户流通量为0.1,区域标识为(A4,B4)的区域的当前用户流通量为0.05,则服务器可以获取到区域标识为(A1,B1)的区域在本次迭代中的当前用户流通量与该区域在上一次迭代中的当前用户流通量之间的差值为0.3-0.2=0.1;区域标识为(A2,B2)的区域在本次迭代中的当前用户流通量与该区域在上一次迭代中的当前用户流通量之间的差值为0.15-0.1=0.05;区域标识为(A3,B3)的区域在本次迭代中的当前用户流通量与该区域在上一次迭代中的当前用户流通量之间的差值为0.1-0.1=0;区域标识为(A4,B4)的区域在本次迭代中的当前用户流通量与该区域在上一次迭代中的当前用户流通量之间的差值为|0.05-0.1|=0.05,流通量误差为0.1+0.05+0+0.05=0.2,各个区域的数量总和为4,则平均误差为0.2/4=0.05,当预设阈值为0.05时,服务器可以确定平均误差等于预设阈值,则服务器可以停止迭代。
以图2所示的界面示意图为例,服务器获取到各个区域的当前用户流通量之后,可以基于各个区域的当前用户流通量确定该区域的流通等级,例如当前用户流通量位于[0.7,1)的范围内时,该区域的流通等级为第一流通等级;当前用户流通量位[0.3,0.7)的范围内时,该区域的流通等级为第二流通等级;当前用户流通量位(0,0.3)的范围内时,该区域的流通等级为第三流通等级。服务器还可以通过不同颜色标注不同区域的流通等级,例如颜色较深的区域的流通等级较高,颜色较浅的区域的流通等级较低。
本发明实施例中,获取用户的历史轨迹信息,并基于该历史轨迹信息确定交通起止点数组,获取起始区域标识所对应起始区域的历史用户流通量,终点区域标识所对应终点区域的历史用户流通量,以及该交通起止点数组的边权重,基于起始区域的历史用户流通量、终点区域的历史用户流通量以及该交通起止点数组的边权重,得到该终点区域的当前用户流通量,可提高终点区域的当前用户流通量的准确度。
请参见图3,图3是本发明实施例中提供的一种数据处理装置的结构示意图,如图所示本实施例中的数据处理装置至少可以包括数组确定单元301、历史流通量获取单元302以及当前流通量获取单元303,其中:
数组确定单元301,用于获取用户的历史轨迹信息,并基于历史轨迹信息确定交通起止点数组,所述交通起止点数组包括起始区域标识和终点区域标识。
历史流通量获取单元302,用于获取所述起始区域标识所对应起始区域的当前用户流通量,所述终点区域标识所对应终点区域的历史用户流通量,以及所述交通起止点数组的边权重。
当前流通量获取单元303,用于基于所述起始区域的当前用户流通量、所述终点区域的历史用户流通量以及所述交通起止点数组的边权重,得到所述终点区域的当前用户流通量。
可选的,所述数组确定单元301基于所述历史轨迹信息确定交通起止点数组,具体用于:
获取所述历史轨迹信息所包含的至少一个位置信息以及各个所述位置信息的定位时间。
确定所述位置信息所属区域的区域标识。
基于所述定位时间对各个所述区域标识进行排序。
在经过排序的区域标识中将两两相邻的区域标识作为一个交通起止点数组,所述两两相邻的区域标识中定位时间较早的区域标识为所述起始区域标识,所述两两相邻的区域标识中定位时间较晚的区域标识为所述终点区域标识。
可选的,所述当前流通量获取单元303,具体用于:
将所述起始区域的当前用户流通量乘以所述交通起止点数组的边权重,得到关于所述交通起止点数组的终点区域的流通量变量。
将所述流通量变量与所述终点区域的历史用户流通量相加,得到所述终点区域的当前用户流通量。
可选的,所述数组确定单元301,还用于当获取到关于所有交通起止点数组的起始区域或者终点区域的当前用户流通量时,迭代执行获取用户的历史轨迹信息,并基于所述历史轨迹信息确定交通起止点数组,所述交通起止点数组包括起始区域标识和终点区域标识。
所述历史流通量获取单元302,还用于获取所述起始区域标识所对应起始区域的当前用户流通量,所述终点区域标识所对应终点区域的历史用户流通量,以及所述交通起止点数组的边权重。
所述当前流通量获取单元303,还用于基于所述起始区域的当前用户流通量、所述终点区域的历史用户流通量以及所述交通起止点数组的边权重,得到所述终点区域的当前用户流通量。
可选的,本发明实施例中的数据处理装置还可以包括:
差值获取单元304,用于所述当前流通量获取单元303获取到关于所有交通起止点数组的起始区域或者终点区域的当前用户流通量之后,获取各个区域在本次迭代中的当前用户流通量与所述区域在上一次迭代中的当前用户流通量之间的差值,所述区域包括起始区域或者终点区域。
流通量误差获取单元305,用于将关于各个所述区域的差值进行相加,得到流通量误差。
平均误差获取单元306,用于将所述流通量误差除以各个所述区域的数量总和,得到平均误差,当所述平均误差大于预设阈值时,触发所述数组确定单元获取用户的历史轨迹信息。
可选的,所述历史流通量获取单元302获取所述起始区域标识所对应起始区域的当前用户流通量,具体用于:
确定包含各个所述交通起止点数组的交通起止点数组集。
获取所述交通起止点数组集所包含的所述起始区域标识的出现次数,以及所述交通起止点数组集所包含的所有起始区域标识和所有终点区域标识的出现次数总和。
将所述起始区域标识的出现次数除以所述出现次数总和,得到所述起始区域的当前用户流通量。
可选的,所述历史流通量获取单元302获取所述起始区域标识所对应起始区域的当前用户流通量,具体用于:
将关于目标交通起止点数组的终点区域的当前用户流通量作为关于所述交通起止点数组的起始区域的当前用户流通量,关于所述目标交通起止点数组的终点区域标识与关于所述交通起止点数组的起始区域标识相同。
可选的,所述历史流通量获取单元302获取所述交通起止点数组的边权重,具体用于:
获取起始区域标识为同一区域标识的交通起止点数组的数量总和。
在所述起始区域标识为同一区域标识的交通起止点数组中分别统计各个所述交通起止点数组的数量。
将各个所述交通起止点数组的数量除以所述起始区域标识为同一区域标识的交通起止点数组的数量总和,得到所述交通起止点数组的边权重。
本发明实施例中,数组确定单元301获取用户的历史轨迹信息,并基于历史轨迹信息确定交通起止点数组,历史流通量获取单元302获取起始区域标识所对应起始区域的当前用户流通量,终点区域标识所对应终点区域的历史用户流通量,以及交通起止点数组的边权重,当前流通量获取单元303基于起始区域的当前用户流通量、终点区域的历史用户流通量以及交通起止点数组的边权重,得到终点区域的当前用户流通量,可提高终点区域的当前用户流通量的准确度。
请参见图4,图4为本发明实施例提供的一种服务器的结构示意图,本发明实施例提供的服务器可以用于实施上述图1所示的本发明实施例实现的方法,为了便于说明,仅示出了与本发明实施例相关的部分,具体技术细节未揭示的,请参照图1所示的本发明实施例。
如图4所示,该服务器包括:至少一个处理器401,例如CPU,至少一个输入装置403,至少一个输出装置404,存储器405,至少一个通信总线402。其中,通信总线402用于实现这些组件之间的连接通信。其中,输入装置403具体可以为网络接口等,用于获取用户的历史轨迹信息。其中,输出装置404具体可以为网络接口等,用于输出终点区域的当前用户流通量。其中,存储器405可能包含高速RAM存储器,也可能还包括非不稳定的存储器,例如至少一个磁盘存储器,具体用于存储起始区域的当前用户流通量、终点区域的历史用户流通量以及交通起止点数组的边权重等。存储器405可选的可以包含至少一个位于远离前述处理器401的存储装置。处理器401可以结合图3所示的数据处理装置。存储器405中存储一组程序代码,且处理器401、输入装置403以及输出装置404调用存储器405中存储的程序代码,用于执行以下操作:
输入装置403获取用户的历史轨迹信息,处理器401基于所述历史轨迹信息确定交通起止点数组,所述交通起止点数组包括起始区域标识和终点区域标识。
处理器401获取所述起始区域标识所对应起始区域的当前用户流通量,所述终点区域标识所对应终点区域的历史用户流通量,以及所述交通起止点数组的边权重。
处理器401基于所述起始区域的当前用户流通量、所述终点区域的历史用户流通量以及所述交通起止点数组的边权重,得到所述终点区域的当前用户流通量。
可选的,处理器401基于所述历史轨迹信息确定交通起止点数组,具体可以为:
获取所述历史轨迹信息所包含的至少一个位置信息以及各个所述位置信息的定位时间。
确定所述位置信息所属区域的区域标识。
基于所述定位时间对各个所述区域标识进行排序。
在经过排序的区域标识中将两两相邻的区域标识作为一个交通起止点数组,所述两两相邻的区域标识中定位时间较早的区域标识为所述起始区域标识,所述两两相邻的区域标识中定位时间较晚的区域标识为所述终点区域标识。
可选的,处理器401基于所述起始区域的当前用户流通量、所述终点区域的历史用户流通量以及所述交通起止点数组的边权重,得到所述终点区域的当前用户流通量,具体可以为:
将所述起始区域的当前用户流通量乘以所述交通起止点数组的边权重,得到关于所述交通起止点数组的终点区域的流通量变量。
将所述流通量变量与所述终点区域的历史用户流通量相加,得到所述终点区域的当前用户流通量。
可选的,输入装置403还可以执行以下操作:
当获取到关于所有交通起止点数组的起始区域或者终点区域的当前用户流通量时,迭代执行获取用户的历史轨迹信息。
进一步的,处理器401基于所述历史轨迹信息确定交通起止点数组,所述交通起止点数组包括起始区域标识和终点区域标识,获取所述起始区域标识所对应起始区域的当前用户流通量,所述终点区域标识所对应终点区域的历史用户流通量,以及所述交通起止点数组的边权重,基于所述起始区域的当前用户流通量、所述终点区域的历史用户流通量以及所述交通起止点数组的边权重,得到所述终点区域的当前用户流通量。
可选的,处理器401获取到关于所有交通起止点数组的起始区域或者终点区域的当前用户流通量之后,还可以执行以下操作:
获取各个区域在本次迭代中的当前用户流通量与所述区域在上一次迭代中的当前用户流通量之间的差值,所述区域包括起始区域或者终点区域。
将关于各个所述区域的差值进行相加,得到流通量误差。
将所述流通量误差除以各个所述区域的数量总和,得到平均误差。
当所述平均误差大于预设阈值时,触发获取用户的历史轨迹信息。
可选的,处理器401获取所述起始区域标识所对应起始区域的当前用户流通量,具体可以为:
确定包含各个所述交通起止点数组的交通起止点数组集。
获取所述交通起止点数组集所包含的所述起始区域标识的出现次数,以及所述交通起止点数组集所包含的所有起始区域标识和所有终点区域标识的出现次数总和。
将所述起始区域标识的出现次数除以所述出现次数总和,得到所述起始区域的当前用户流通量。
可选的,处理器401获取所述起始区域标识所对应起始区域的当前用户流通量,具体可以为:
将关于目标交通起止点数组的终点区域的当前用户流通量作为关于所述交通起止点数组的起始区域的当前用户流通量,关于所述目标交通起止点数组的终点区域标识与关于所述交通起止点数组的起始区域标识相同。
可选的,处理器401获取所述交通起止点数组的边权重,具体可以为:
获取起始区域标识为同一区域标识的交通起止点数组的数量总和。
在所述起始区域标识为同一区域标识的交通起止点数组中分别统计各个所述交通起止点数组的数量。
将各个所述交通起止点数组的数量除以所述起始区域标识为同一区域标识的交通起止点数组的数量总和,得到所述交通起止点数组的边权重。
具体的,本发明实施例中介绍的终端可以用以实施本发明结合图1介绍的方法实施例中的部分或全部流程。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。

Claims (16)

1.一种数据处理方法,其特征在于,所述方法包括:
获取用户的历史轨迹信息,并基于所述历史轨迹信息确定至少一个交通起止点数组,各个所述交通起止点数组包括起始区域标识和终点区域标识;
针对任一交通起止点数组,获取所述任一交通起止点数组所包含的起始区域标识所对应起始区域的当前用户流通量,所述任一交通起止点数组所包含的终点区域标识所对应终点区域的历史用户流通量,以及所述任一交通起止点数组的边权重;
基于所述起始区域的当前用户流通量、所述终点区域的历史用户流通量以及所述任一交通起止点数组的边权重,得到所述终点区域的当前用户流通量,其中,所述任一交通起止点数组的边权重是所述任一交通起止点数组在所述起始区域标识所属交通起止点数组中的数量与所述起始区域标识所属交通起止点数组的数量总和的比值。
2.如权利要求1所述的方法,其特征在于,所述基于所述历史轨迹信息确定至少一个交通起止点数组,包括:
获取所述历史轨迹信息所包含的至少一个位置信息以及各个所述位置信息的定位时间;
确定所述位置信息所属区域的区域标识;
基于所述定位时间对各个所述区域标识进行排序;
在经过排序的区域标识中将两两相邻的区域标识作为一个交通起止点数组,所述两两相邻的区域标识中定位时间较早的区域标识为所述起始区域标识,所述两两相邻的区域标识中定位时间较晚的区域标识为所述终点区域标识。
3.如权利要求1所述的方法,其特征在于,所述基于所述起始区域的当前用户流通量、所述终点区域的历史用户流通量以及所述任一交通起止点数组的边权重,得到所述终点区域的当前用户流通量,包括:
将所述起始区域的当前用户流通量乘以所述任一交通起止点数组的边权重,得到关于所述任一交通起止点数组的终点区域的流通量变量;
将所述流通量变量与所述终点区域的历史用户流通量相加,得到所述终点区域的当前用户流通量。
4.如权利要求1所述的方法,其特征在于,所述方法还包括:
当获取到关于所有交通起止点数组的起始区域或者终点区域的当前用户流通量时,迭代执行获取用户的历史轨迹信息,并基于所述历史轨迹信息确定至少一个交通起止点数组,各个所述交通起止点数组包括起始区域标识和终点区域标识,针对任一交通起止点数组,获取所述任一交通起止点数组所包含的起始区域标识所对应起始区域的当前用户流通量,所述任一交通起止点数组所包含的终点区域标识所对应终点区域的历史用户流通量,以及所述任一交通起止点数组的边权重,基于所述起始区域的当前用户流通量、所述终点区域的历史用户流通量以及所述任一交通起止点数组的边权重,得到所述终点区域的当前用户流通量。
5.如权利要求4所述的方法,其特征在于,所述获取到关于所有交通起止点数组的起始区域或者终点区域的当前用户流通量之后,还包括:
获取各个区域在本次迭代中的当前用户流通量与所述区域在上一次迭代中的当前用户流通量之间的差值,所述区域包括起始区域或者终点区域;
将关于各个所述区域的差值进行相加,得到流通量误差;
将所述流通量误差除以各个所述区域的数量总和,得到平均误差;
当所述平均误差大于预设阈值时,触发获取用户的历史轨迹信息。
6.如权利要求1所述的方法,其特征在于,所述获取所述任一交通起止点数组所包含的起始区域标识所对应起始区域的当前用户流通量,包括:
确定包含各个所述交通起止点数组的交通起止点数组集;
获取所述交通起止点数组集所包含的所述起始区域标识的出现次数,以及所述交通起止点数组集所包含的所有起始区域标识和所有终点区域标识的出现次数总和;
将所述起始区域标识的出现次数除以所述出现次数总和,得到所述起始区域的当前用户流通量。
7.如权利要求1所述的方法,其特征在于,所述获取所述任一交通起止点数组所包含的起始区域标识所对应起始区域的当前用户流通量,包括:
将关于目标交通起止点数组的终点区域的当前用户流通量作为关于所述任一交通起止点数组的起始区域的当前用户流通量,关于所述目标交通起止点数组的终点区域标识与关于所述任一交通起止点数组的起始区域标识相同。
8.如权利要求1所述的方法,其特征在于,所述获取所述任一交通起止点数组的边权重,包括:
获取所述起始区域标识所属交通起止点数组的数量总和;
在所述起始区域标识所属交通起止点数组中统计所述任一交通起止点数组的数量;
将所述任一交通起止点数组的数量除以所述起始区域标识所属交通起止点数组的数量总和,得到所述任一交通起止点数组的边权重。
9.一种数据处理装置,其特征在于,所述装置包括:
数组确定单元,用于获取用户的历史轨迹信息,并基于所述历史轨迹信息确定至少一个交通起止点数组,各个所述交通起止点数组包括起始区域标识和终点区域标识;
历史流通量获取单元,用于针对任一交通起止点数组,获取所述任一交通起止点数组所包含的起始区域标识所对应起始区域的当前用户流通量,所述任一交通起止点数组所包含的终点区域标识所对应终点区域的历史用户流通量,以及所述任一交通起止点数组的边权重;
当前流通量获取单元,用于基于所述起始区域的当前用户流通量、所述终点区域的历史用户流通量以及所述任一交通起止点数组的边权重,得到所述终点区域的当前用户流通量,其中,所述交通起止点数组的边权重是所述交通起止点数组在所述起始区域标识所属交通起止点数组中的数量与所述起始区域标识所属交通起止点数组的数量总和的比值。
10.如权利要求9所述的装置,其特征在于,所述数组确定单元基于所述历史轨迹信息确定至少一个交通起止点数组,具体用于:
获取所述历史轨迹信息所包含的至少一个位置信息以及各个所述位置信息的定位时间;
确定所述位置信息所属区域的区域标识;
基于所述定位时间对各个所述区域标识进行排序;
在经过排序的区域标识中将两两相邻的区域标识作为一个交通起止点数组,所述两两相邻的区域标识中定位时间较早的区域标识为所述起始区域标识,所述两两相邻的区域标识中定位时间较晚的区域标识为所述终点区域标识。
11.如权利要求9所述的装置,其特征在于,所述当前流通量获取单元,具体用于:
将所述起始区域的当前用户流通量乘以所述任一交通起止点数组的边权重,得到关于所述任一交通起止点数组的终点区域的流通量变量;
将所述流通量变量与所述终点区域的历史用户流通量相加,得到所述终点区域的当前用户流通量。
12.如权利要求9所述的装置,其特征在于,
所述数组确定单元,还用于当获取到关于所有交通起止点数组的起始区域或者终点区域的当前用户流通量时,迭代执行获取用户的历史轨迹信息,并基于所述历史轨迹信息确定至少一个交通起止点数组,各个所述交通起止点数组包括起始区域标识和终点区域标识;
所述历史流通量获取单元,还用于针对任一交通起止点数组,获取所述任一交通起止点数组所包含的起始区域标识所对应起始区域的当前用户流通量,所述任一交通起止点数组所包含的终点区域标识所对应终点区域的历史用户流通量,以及所述任一交通起止点数组的边权重;
所述当前流通量获取单元,还用于基于所述起始区域的当前用户流通量、所述终点区域的历史用户流通量以及所述任一交通起止点数组的边权重,得到所述终点区域的当前用户流通量。
13.如权利要求12所述的装置,其特征在于,所述装置还包括:
差值获取单元,用于所述当前流通量获取单元获取到关于所有交通起止点数组的起始区域或者终点区域的当前用户流通量之后,获取各个区域在本次迭代中的当前用户流通量与所述区域在上一次迭代中的当前用户流通量之间的差值,所述区域包括起始区域或者终点区域;
流通量误差获取单元,用于将关于各个所述区域的差值进行相加,得到流通量误差;
平均误差获取单元,用于将所述流通量误差除以各个所述区域的数量总和,得到平均误差,当所述平均误差大于预设阈值时,触发所述数组确定单元获取用户的历史轨迹信息。
14.如权利要求9所述的装置,其特征在于,所述历史流通量获取单元获取所述任一交通起止点数组所包含的起始区域标识所对应起始区域的当前用户流通量,具体用于:
确定包含各个所述交通起止点数组的交通起止点数组集;
获取所述交通起止点数组集所包含的所述起始区域标识的出现次数,以及所述交通起止点数组集所包含的所有起始区域标识和所有终点区域标识的出现次数总和;
将所述起始区域标识的出现次数除以所述出现次数总和,得到所述起始区域的当前用户流通量。
15.如权利要求9所述的装置,其特征在于,所述历史流通量获取单元获取所述任一交通起止点数组所包含的起始区域标识所对应起始区域的当前用户流通量,具体用于:
将关于目标交通起止点数组的终点区域的当前用户流通量作为关于所述任一交通起止点数组的起始区域的当前用户流通量,关于所述目标交通起止点数组的终点区域标识与关于所述任一交通起止点数组的起始区域标识相同。
16.如权利要求9所述的装置,其特征在于,所述历史流通量获取单元获取所述任一交通起止点数组的边权重,具体用于:
获取所述起始区域标识所属交通起止点数组的数量总和;
在所述起始区域标识所属交通起止点数组中统计所述任一交通起止点数组的数量;
将所述任一交通起止点数组的数量除以所述起始区域标识所属交通起止点数组的数量总和,得到所述任一交通起止点数组的边权重。
CN201710034783.9A 2017-01-18 2017-01-18 一种数据处理方法及装置 Active CN108337644B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710034783.9A CN108337644B (zh) 2017-01-18 2017-01-18 一种数据处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710034783.9A CN108337644B (zh) 2017-01-18 2017-01-18 一种数据处理方法及装置

Publications (2)

Publication Number Publication Date
CN108337644A CN108337644A (zh) 2018-07-27
CN108337644B true CN108337644B (zh) 2020-11-27

Family

ID=62921574

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710034783.9A Active CN108337644B (zh) 2017-01-18 2017-01-18 一种数据处理方法及装置

Country Status (1)

Country Link
CN (1) CN108337644B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112991804B (zh) * 2019-12-18 2022-06-07 浙江大华技术股份有限公司 停留区域确定方法以及相关装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101217758A (zh) * 2007-12-26 2008-07-09 中国移动通信集团北京有限公司 生成蜂窝网络的用户移动性模型的方法及装置
CN101807224A (zh) * 2010-03-24 2010-08-18 上海交通大学 中微观一体化交通仿真车流加载方法
CN102542793A (zh) * 2012-01-11 2012-07-04 东南大学 一种交叉口群过饱和交通态势主动控制方法
CN102735252A (zh) * 2011-03-29 2012-10-17 电装It研究所 路径引导生成装置、方法以及系统
CN103679286A (zh) * 2013-11-29 2014-03-26 华为技术有限公司 路径优化方法及装置
CN105243441A (zh) * 2015-09-29 2016-01-13 联想(北京)有限公司 一种处理方法和装置、控制方法和装置及电子设备
CN106295787A (zh) * 2015-05-29 2017-01-04 中国移动通信集团浙江有限公司 一种基于移动信令的客流统计方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9390621B2 (en) * 2014-06-04 2016-07-12 Cuende Infometrics, S.A. System and method for measuring the real traffic flow of an area

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101217758A (zh) * 2007-12-26 2008-07-09 中国移动通信集团北京有限公司 生成蜂窝网络的用户移动性模型的方法及装置
CN101807224A (zh) * 2010-03-24 2010-08-18 上海交通大学 中微观一体化交通仿真车流加载方法
CN102735252A (zh) * 2011-03-29 2012-10-17 电装It研究所 路径引导生成装置、方法以及系统
CN102542793A (zh) * 2012-01-11 2012-07-04 东南大学 一种交叉口群过饱和交通态势主动控制方法
CN103679286A (zh) * 2013-11-29 2014-03-26 华为技术有限公司 路径优化方法及装置
CN106295787A (zh) * 2015-05-29 2017-01-04 中国移动通信集团浙江有限公司 一种基于移动信令的客流统计方法及装置
CN105243441A (zh) * 2015-09-29 2016-01-13 联想(北京)有限公司 一种处理方法和装置、控制方法和装置及电子设备

Also Published As

Publication number Publication date
CN108337644A (zh) 2018-07-27

Similar Documents

Publication Publication Date Title
US10009731B2 (en) Information sharing method, device and storage medium
US9712970B2 (en) Systems and methods for deploying dynamic geo-fences based on content consumption levels in a geographic location
CN109672980B (zh) 确定兴趣点对应的无线局域网热点的方法、装置及存储介质
WO2019091367A1 (zh) App的推送方法、装置、电子设备及计算机可读存储介质
CN103841550A (zh) 一种识别一人多卡用户的方法及装置
US10038973B2 (en) Method and system for determining a positioning interval of a mobile terminal
CN112352256B (zh) 优化地理区域选择
CN113412608B (zh) 内容推送方法、装置、服务端及存储介质
EP3425876A1 (en) Location-based service implementing method and apparatus
CN106055630A (zh) 日志存储的方法及装置
CN104239327A (zh) 一种基于位置信息的移动互联网用户行为分析方法及装置
CN112055958A (zh) 基于无线接入点属性启用无线安全措施
JP6945780B2 (ja) インターネットリソース配信方法及び装置並びにネットワークレッドエンベロープ配信方法
CN108337644B (zh) 一种数据处理方法及装置
CN106487825B (zh) 信息关联方法及装置
CN111400520A (zh) 人脸识别库的构建方法、人脸支付方法、装置和系统
US10306053B1 (en) Restricting computing devices used by vehicle operators
CN108234471B (zh) 入群验证方法、装置、计算机装置及计算机可读存储介质
US8626933B2 (en) Optimizing buddy finder telecommunication service
CN105025436A (zh) 一种信息获取方法及移动终端
CN107026885B (zh) 信息推送方法及装置
CN109769202B (zh) 流量数据的定位方法及装置、存储介质、服务器
CN110070371B (zh) 一种数据预测模型建立方法及其设备、存储介质、服务器
CN107342882B (zh) 一种终端的分类方法、分类装置及计算机可读存储介质
CN105246064B (zh) 识别通信号码归属的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant