CN111194009A - Gps信息提取方法、装置、设备及存储介质 - Google Patents

Gps信息提取方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN111194009A
CN111194009A CN201911350975.6A CN201911350975A CN111194009A CN 111194009 A CN111194009 A CN 111194009A CN 201911350975 A CN201911350975 A CN 201911350975A CN 111194009 A CN111194009 A CN 111194009A
Authority
CN
China
Prior art keywords
information
daily
preset
position information
interest point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911350975.6A
Other languages
English (en)
Other versions
CN111194009B (zh
Inventor
袁琴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Property and Casualty Insurance Company of China Ltd
Original Assignee
Ping An Property and Casualty Insurance Company of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Property and Casualty Insurance Company of China Ltd filed Critical Ping An Property and Casualty Insurance Company of China Ltd
Priority to CN201911350975.6A priority Critical patent/CN111194009B/zh
Publication of CN111194009A publication Critical patent/CN111194009A/zh
Application granted granted Critical
Publication of CN111194009B publication Critical patent/CN111194009B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/029Location-based management or tracking services
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S19/00Satellite radio beacon positioning systems; Determining position, velocity or attitude using signals transmitted by such systems
    • G01S19/01Satellite radio beacon positioning systems transmitting time-stamped messages, e.g. GPS [Global Positioning System], GLONASS [Global Orbiting Navigation Satellite System] or GALILEO
    • G01S19/13Receivers
    • G01S19/35Constructional details or hardware or software details of the signal processing chain
    • G01S19/37Hardware or software details of the signal processing chain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/52Network services specially adapted for the location of the user terminal

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及数据处理领域,公开了一种GPS信息提取方法、装置、设备及存储介质,所述方法包括:获取实时位置信息和历史兴趣点信息表,所述历史兴趣点信息表中包括历史兴趣点的位置信息;基于所述历史兴趣点的位置信息对所述实时位置信息进行筛选,以得到每日位置信息;将所述每日位置信息转换为预设坐标信息,并创建多个线程以通过创建的每个线程并发的从预设数据库中调用与所述预设坐标信息对应的每日兴趣点信息;按照第一预设格式将所述每日兴趣点信息按照日期以文本形式分别进行保存。对GPS信息进行提取,以区分每日新增的GPS信息和对应的POI信息。

Description

GPS信息提取方法、装置、设备及存储介质
技术领域
本申请涉及信息提取领域,尤其涉及一种GPS信息提取方法、装置、设备及存储介质。
背景技术
目前,对于GPS信息处理的方式大多是将获取到的前端的日增量GPS信息推送至数据处理平台,例如kafka,再利用数据处理系统(例如,storm或spark streaming)读取数据处理平台中的GPS经纬度信息,然后通过API接口构建调用接口,获取POI(兴趣点)信息,最后将获取到的POI信息存入数据库的数据表中。
但是当日增量GPS信息的数量为万或十万级别时,容易出现数据处理平台消息阻塞的情况,需要手动进行处理。并且在进行数据处理时,每日的新增数据都存储在同一个数据表中,无法明确哪些是新增的GPS信息,也无法对每日新增的POI信息进行判断。
因此,如何对GPS信息进行提取,以区分每日新增的GPS信息和对应的POI信息成为亟待解决的问题。
发明内容
本申请提供了一种GPS信息提取方法、装置、设备及存储介质,以对GPS信息进行提取,以区分每日新增的GPS信息和对应的POI信息。
第一方面,本申请提供了一种GPS信息提取方法,所述方法包括:
获取实时位置信息和历史兴趣点信息表,所述历史兴趣点信息表中包括历史兴趣点的位置信息;
基于所述历史兴趣点的位置信息对所述实时位置信息进行筛选,以得到每日位置信息;
将所述每日位置信息转换为预设坐标信息,并创建多个线程以通过创建的每个线程并发的从预设数据库中调用与所述预设坐标信息对应的每日兴趣点信息;
按照第一预设格式将所述每日兴趣点信息按照日期以文本形式分别进行保存。
第二方面,本申请还提供了一种GPS信息提取装置,所述装置包括:
信息获取模块,用于获取实时位置信息和历史兴趣点信息表,所述历史兴趣点信息表中包括历史兴趣点的位置信息;
信息筛选模块,用于基于所述历史兴趣点的位置信息对所述实时位置信息进行筛选,以得到每日位置信息;
信息调用模块,用于将所述每日位置信息转换为预设坐标信息,并创建多个线程以通过创建的每个线程并发的从预设数据库中调用与所述预设坐标信息对应的每日兴趣点信息;
信息保存模块,用于按照第一预设格式将所述每日兴趣点信息按照日期以文本形式分别进行保存。
第三方面,本申请还提供了一种计算机设备,所述计算机设备包括存储器和处理器;所述存储器用于存储计算机程序;所述处理器,用于执行所述计算机程序并在执行所述计算机程序时实现如上述的GPS信息提取方法。
第四方面,本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器实现如上述的GPS信息提取方法。
本申请公开了一种GPS信息提取方法、装置、设备及存储介质,通过获取实时位置信息和历史兴趣点的位置信息,然后根据历史兴趣点的位置信息对实时位置信息进行筛选,从而得到每日位置信息,再将每日位置信息转换为预设坐标信息,并创建多线程从预设数据库中调用对应的每日兴趣点信息,最终将每日兴趣点信息按照第一预设格式进行以文本形式进行保存。通过基于历史兴趣点的位置信息对实时位置信息进行筛选,从获取的实时位置信息中区分出新增的位置信息,也即每日位置信息,并且基于该每日位置信息多线程的调用与其对应的每日兴趣点信息,实现了每日位置信息和每日兴趣点信息的区分,多线程也提高了数据调用的速度和效率。
附图说明
为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种GPS信息提取方法的示意流程图;
图2是本申请实施例提供的对实时位置信息进行筛选的步骤示意流程图;
图3是本申请实施例提供的将每日位置信息转换为预设坐标信息的步骤示意流程图;
图4是本申请实施例提供的一种GPS信息提取方法的示意流程图;
图5是图4提供的一种GPS信息提取方法的子步骤示意流程图;
图6为本申请实施例提供的一种GPS信息提取装置的示意性框图;
图7是本申请的实施例还提供一种GPS信息提取装置的示意性框图
图8为本申请一实施例提供的一种计算机设备的结构示意性框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
附图中所示的流程图仅是示例说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解、组合或部分合并,因此实际执行的顺序有可能根据实际情况改变。
应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
本申请的实施例提供了一种GPS信息提取方法、装置、计算机设备及存储介质。GPS信息提取方法可用于对GPS信息进行提取,以区分每日新增的GPS信息和对应的POI信息。
下面结合附图,对本申请的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
请参阅图1,图1是本申请实施例提供的一种GPS信息提取方法的示意流程图。该GPS信息提取方法通过对实时位置信息进行筛选,实现区分每日新增的GPS信息和对应的POI信息。
如图1所示,该GPS信息提取方法,具体包括:步骤S101至步骤S104。
S101、获取实时位置信息和历史兴趣点信息表。
具体地,所述历史兴趣点(Point of Interest,POI)信息表中包括历史兴趣点的位置信息。
其中,实时位置信息为前端GPS定位系统实时采集的位置信息,比如通过手机的GPS定位系统,或者车载GPS定位系统等采集的位置信息。历史兴趣点信息是指基于历史位置信息获取的历史兴趣点的位置信息,其中,历史位置信息是指相对于实时位置信息的位置信息。
S102、基于所述历史兴趣点的位置信息对所述实时位置信息进行筛选,以得到每日位置信息。
具体地,基于历史兴趣点的位置信息对实时位置信息进行筛选,从而得到每日新增的位置信息。
在一些实施例中,为了提高对实时位置信息进行筛选的速度和准确度,请参考图2,对实时位置信息进行筛选具体可以包括以下步骤:
S1021、将所述实时位置信息与历史兴趣点的位置信息进行左连接。S1022、根据为空值的所述历史兴趣点的位置信息对所述实时位置信息进行筛选。
其中,左连接是指将左表(也即实时位置信息)的记录全部显示,而右表(也即历史兴趣点的位置信息)中只显示与左表内容相符合的记录。右表记录不足,也即与坐标匹配不成功的地方均显示为NULL。
例如,获取到的实时位置信息如表1所示,历史兴趣点的位置信息如表2所示。
表1
Figure BDA0002334658880000051
表2
Figure BDA0002334658880000052
将实时位置信息与历史兴趣点的位置信息进行左连接操作得到的结果如表3所示:
表3
Figure BDA0002334658880000053
将实时位置信息中在历史兴趣点的位置信息中的经纬度为空的位置信息作为每日位置信息,如表4所示:
表4
Figure BDA0002334658880000054
Figure BDA0002334658880000061
S103、将所述每日位置信息转换为预设坐标信息,并创建多个线程以通过创建的每个线程并发的从预设数据库中调用与所述预设坐标信息对应的每日兴趣点信息。
其中,每日兴趣点信息包括每日位置信息中的经纬度对应的省、市、区、道路、详细地址、兴趣点百度坐标、兴趣点凯立德坐标、兴趣点类型、兴趣点名称、兴趣点周边信息等信息。
将每日位置信息转换为预设坐标信息,以便于调用与预设坐标信息对应的兴趣点信息。其中,预设数据库是指开放的凯立德数据库平台,可以通过构建API调用接口,编写调取凯立德接口,以从凯立德数据库中调用兴趣点信息。由于凯立德接口可以调用两台服务器进行连接,因此,可以使用轮询算法以保证两个服务器之间的负载均衡。在调用兴趣点信息时,创建多个线程以并发调用,充分利用网络资源和物理资源,提高调用速度。
在一些实施例中,使用轮询算法保证两个服务器之间的负载均衡具体可以是:
获取第一服务器和第二服务器上连接的正在调用兴趣点信息的工作线程的数量;分别计算所述第一服务器和第二服务器的线程占用率;根据所述占用率为所述第一服务器和第二服务器分配待工作线程。
具体地,由于创建的多个用于兴趣点调用的工作线程分别与第一服务器和第二服务器连接,因此,分别获取第一服务器和第二服务器上连接的工作线程的数量,其中,所述工作线程是指正在调用兴趣点信息的工作线程。
分别计算所述第一服务器和第二服务器的线程占用率,其中,计算公式可以如下所示:
Figure BDA0002334658880000062
其中P为线程占用率,mn为第n个服务器上连接的工作线程的数量,M为工作线程的总数量。
在分别计算出第一服务器和第二服务器的线程占用率后,线程占用率越小,说明此时对应的该服务器上连接的工作线程越少,因此,在进行待工作线程分配时,可以优先向线程占用率小的服务器进行分配。
在一次待工作线程的分配完成后,可以循环执行上述步骤,以保证两个服务器之间的负载均衡。
在一些实施例中,为了便于坐标转换,请参考图3,将每日位置信息转换为预设坐标信息,具体地包括以下步骤:
S1031、将所述每日位置信息中的经纬度信息以数组进行保存。S1032、通过读取所述数组中的元素将所述每日位置信息转换为预设坐标信息。
具体地,获取到每日位置信息后,通过逗号分隔符将每日位置信息中的经纬度信息分隔开,再以数组的形式存储。通过读取数组的第一个和第二个元素,对每日位置信息进行坐标转换,以得到预设坐标信息。
在具体实施过程中,由于不同的GPS定位系统所使用的坐标系统可能有所不同,例如,百度地图使用的是百度坐标(BD-09坐标系),腾讯地图使用的是火星坐标(火星坐标系),凯立德地图使用的为凯立德K码(火星坐标系转为K码),美国GPS使用的是地图坐标(WGS84坐标系)。导致不同GPS坐标系下的经纬度信息略有差异,为了避免GPS坐标系带来的位置偏移影响,提高调用的兴趣点信息的准确度,因此需要将获得的每日位置信息进行归一化处理,也即坐标转换,得到预设坐标信息,以便于调用对应的兴趣点信息。
在本实施例中,可以将获得的其他坐标系下的每日位置信息转换为BD-09系下的百度坐标,再将百度坐标转换为凯立德K码,以便于凯立德接口识别其经纬度信息,并调用对应的POI信息。
S104、按照第一预设格式将所述每日兴趣点信息按照日期以文本形式分别进行保存。
具体地,将得到的每日兴趣点信息中的信息以txt文本的形式进行存储,存储时命名格式为每日位置信息的当日日期。例如,每日兴趣点信息为2019年7月20日获取到的,则在存储该每日兴趣点信息时,存储文本的命名为:20190720.txt。
由于每日兴趣点信息中包括了省、市、区、道路、详细地址、兴趣点百度坐标、兴趣点凯立德坐标、兴趣点类型、兴趣点名称、兴趣点周边信息等信息,为了便于信息的调用和存储,在存储每日兴趣点信息时可以按照第一预设格式进行存储。例如,第一预设格式可以是将每日兴趣点信息中的信息按照“名称、百度坐标经度、百度坐标纬度、省市区道路详细地址、类别”的顺序依次排列的格式。在有多条每日兴趣点信息时,在每条每日兴趣点信息后以“\t”为分隔符作为一行。
例如:
“中国工商银行(深圳红宝支行)、22.55、114.11、广东省深圳市罗湖区红岭中路1008号荔景大厦一楼、金融银行\t
中国工商银行(深圳深港支行)、22.56、114.11、广东省生真是罗湖区宝安北路2039深圳国际商品交易大厦一层、金融银行\t”。
需要说明的是,上述第一预设格式所指出的排列格式仅是为了便于理解本方案所列举的示例,在具体实施过程中,可以将每日兴趣点信息中的其他信息,例如兴趣点凯立德坐标、兴趣点周边信息等也按照第一预设格式一同进行保存。
上述实施例提供的GPS信息提取方法,通过获取实时位置信息和历史兴趣点的位置信息,然后基于历史兴趣点的位置信息对实时位置信息进行筛选,得到每日位置信息,对每日位置信息进行坐标转换,得到预设坐标信息,并且根据预设坐标信息多线程的从预设数据库中调用对应的每日兴趣点信息,最终将得到的每日兴趣点信息按照日期进行保存。利用历史兴趣点的位置信息对实时位置信息进行筛选,得到每日位置信息,从而实现每日新增的GPS位置信息的区分,然后基于得到的每日新增的GPS信息从预设数据库中调用对应的每日兴趣点信息,实现对每日新增的兴趣点信息的区分,多线程也提高了数据调用的速度和效率。
请参阅图4,图4是本申请实施例提供的一种GPS信息提取方法的示意流程图。该GPS信息提取方法通过对实时位置信息进行筛选,实现区分每日新增的GPS信息和对应的POI信息。
如图4所示,该GPS信息提取方法,具体包括:步骤S201至步骤S206。
S201、获取实时位置信息和历史兴趣点信息表。
具体地,所述历史兴趣点(Point of Interest,POI)信息表中包括历史兴趣点的位置信息。
其中,实时位置信息为前端GPS定位系统实时采集的位置信息,比如通过手机的GPS定位系统,或者车载GPS定位系统等采集的位置信息。历史兴趣点信息是指基于历史位置信息获取的历史兴趣点的位置信息,其中,历史位置信息是指相对于实时位置信息的位置信息。
S202、基于所述历史兴趣点的位置信息对所述实时位置信息进行筛选,以得到每日位置信息。
具体地,基于历史兴趣点的位置信息对实时位置信息进行筛选,从而得到每日新增的位置信息。
在一些实施例中,基于历史兴趣点的位置信息对实时位置信息进行筛选,可以是通过将实时位置信息与历史兴趣点的位置信息进行匹配,具体地,在匹配时,以实时位置信息和历史兴趣点信息中的经纬度信息为依据进行匹配。当实时位置信息与历史兴趣点的位置信息匹配不成功时,则将匹配不成功的实时位置信息作为每日位置信息。
例如,获取到的实时位置信息如表5所示,历史兴趣点的位置信息如表6所示。
表5
Figure BDA0002334658880000091
表6
Figure BDA0002334658880000092
将实时位置信息与历史兴趣点的位置信息进行匹配,匹配后仅历史兴趣点的位置信息中的序号1的经纬度与实时位置信息中的序号4的经纬度匹配成功,则将匹配不成功的实时位置信息中的其他经纬度位置信息作为每日位置信息。得出每日位置信息如表7所示。
表7
Figure BDA0002334658880000093
Figure BDA0002334658880000101
S203、将所述每日位置信息以文本形式按照日期分别进行保存。
具体地,将得到的每日位置信息中的经纬度信息以txt文本的形式进行存储,存储时命名格式为每日位置信息的当日日期。例如,每日位置信息为2019年7月20日获取到的,则在存储该每日位置信息时,存储文本的命名为:20190720.txt。
S204、将所述每日位置信息转换为预设坐标信息,并创建多个线程以通过创建的每个线程并发的从预设数据库中调用与所述预设坐标信息对应的每日兴趣点信息。
具体地,将每日位置信息转换为预设坐标信息,以便于调用与预设坐标信息对应的兴趣点信息。其中,预设数据库是指开放的凯立德数据库平台,可以通过构建API调用接口,编写调取凯立德接口,以从凯立德数据库中调用兴趣点信息。由于凯立德接口可以调用两台服务器进行连接,因此,可以使用轮询算法以保证两个服务器之间的负载均衡。在调用兴趣点信息时,创建多个线程以并发调用,充分利用网络资源和物理资源,提高调用速度。
在一些实施例中,为了增加处理线程的灵活性,使处理线程能够根据实际调用数据量的大小灵活调整,请参考图5,步骤S204具体的包括:步骤S2041至步骤S2045。
S2041、获取第一缓冲区和第二缓冲区内预设坐标信息的数量。
具体地,所述第一缓冲区用于保存正在调用的每日兴趣点信息的预设坐标信息,所述第二缓冲区用于保存待调用的每日兴趣点信息的预设坐标信息。
将需要从预设数据库中调用每日兴趣点信息的预设坐标信息分别保存在第一缓冲区和第二缓冲区内。其中,第一缓冲区内保存的是多个工作线程正在从预设数据库中调用对应的每日兴趣点信息的预设坐标信息;第二缓冲区内保存的是等待工作线程从预设数据库中调用对应的每日兴趣点信息的预设坐标信息。
S2042、计算所述第一缓冲区内的预设坐标信息的数量与工作线程数量的比值。
具体地,计算第一缓冲区内预设坐标信息的数量与当前工作线程的数量的比值,例如,第一缓冲区内预设坐标信息的数量为1000,当前工作线程的数量为10,则第一缓冲区内预设坐标信息的数量与当前工作线程的数量的比值为1000/10=100。
S2043、若所述第一缓冲区内的预设坐标信息的数量与工作线程数量的比值大于预设阈值,则按照预设规则增加所述工作线程数量。
具体地,预设阈值可以是用户预先设置的,当比值大于预设阈值时,则说明此时,每个工作线程的工作负载量较大,因此可以按照预设规则增加工作线程的数量,以降低每个线程的工作负载量,并提高信息调用的速度。
其中,预设规则可以是用户预先配置的增加幅度,或者使得增加工作线程的数量后,第一缓冲区内预设坐标信息的数量与当前工作线程的数量的比值与预设阈值相等。
例如,预设阈值为50,第一缓冲区内预设坐标信息的数量为1000,当前工作线程的数量为10,则当第一缓冲区内预设坐标信息的数量与当前工作线程的数量的比值为100时,可以增加工作线程的数量至20,使得第一缓冲区内预设坐标信息的数量与当前工作线程的数量的比值与预设阈值相等。
S2044、若所述第一缓冲区内的预设坐标信息的数量与工作线程数量的比值小于预设阈值,则周期性的检查所述第二缓冲区内预设坐标信息的数量。
具体地,如果比值小于预设阈值,则说明此时,每个工作线程的工作负载量较小,因此周期性的检查第二缓冲区内预设坐标信息的数量,其中,检查周期可以由用户自定义配置,例如可以为1小时。
S2045、当检查得到所述第二缓冲区内预设坐标信息的数量为空的次数大于预设次数时,则按照所述预设规则减少所述工作线程数量。
具体地,当检查得到第二缓冲区内预设坐标信息的数量为空的次数大于预设次数时,说明此时需要由工作线程调用每日兴趣点信息的预设坐标信息的数量较少,因此,可以按照预设规则减少工作线程的数量,以减少资源浪费。
其中,预设次数可以由用户自定义配置,预设规则可以是用户预先配置的减小幅度。例如,预设次数为3次,用户配置的减小幅度为20%。
上述根据各个现有的工作线程的负载状态调整工作线程的总数量的方案,当工作线程的负载量较大时,增加新的工作线程,以降低各工作线程的负载量,并且提高信息调用的效率和速度;当工作线程的负载量较小时,减少已有的工作线程,减少了资源浪费。
S205、按照第一预设格式将所述每日兴趣点信息按照日期以文本形式分别进行保存。
具体地,将得到的每日兴趣点信息中的信息以txt文本的形式进行存储,存储时命名格式为每日位置信息的当日日期。
S206、复制以文本形式保存的所述每日兴趣点信息并将复制的所述每日兴趣点信息保存至所述历史兴趣点信息表中。
具体地,在Hive表中创建兴趣点信息表,并将每日兴趣点信息保存至该兴趣点信息表中,将该兴趣点信息表作为历史兴趣点信息表,以便于判断新增的实时位置信息。
在一些实施例中,可以按照预设周期将每日兴趣点信息保存至历史兴趣点信息表中。在具体实施过程中,预设周期可以为一天。将预设周期设为一天,则可以筛选出当日的实时位置信息和对应的每日兴趣点信息。
在一些实施例中,将复制的每日兴趣点信息保存至所述历史兴趣点信息表中时,具体地可以是,将复制的每日兴趣点信息按照第二预设格式保存至所述历史兴趣点信息表中,其中,第二预设格式与第一预设格式的格式可以相同,也可以不同。
在具体实施过程中,可以通过HDFS(Hadoop分布式文件系统)将以文本形式保存的每日兴趣点信息保存至历史兴趣点信息表中,第二预设格式可以是将每日兴趣点信息中的信息按照“名称、百度坐标经度、百度坐标纬度、省市区道路详细地址、类别”顺序排列的格式。在一些实施例中,第一预设格式与第二预设格式相同,则在将以文本格式存储的每日兴趣点信息复制在历史兴趣点信息表中进行保存时,数据的对照性较强,数据在复制时不易发生丢失和乱码等情况,缺失数据的体现也比较直观。
上述实施例提供的GPS信息提取方法,通过获取实时位置信息和历史兴趣点的位置信息,然后根据历史兴趣点的位置信息对实时位置信息进行筛选,从而得到每日位置信息,再将每日位置信息转换为预设坐标信息,并创建多线程从预设数据库中调用对应的每日兴趣点信息,最终将每日兴趣点信息按照第一预设格式进行以文本形式进行保存,再对保存的每日兴趣点信息进行复制并将复制的内容保存在历史兴趣点信息表中。通过基于历史兴趣点的位置信息对实时位置信息进行筛选,从获取的实时位置信息中区分出新增的位置信息,也即每日位置信息,并且基于该每日位置信息多线程的调用与其对应的每日兴趣点信息,实现了每日位置信息和每日兴趣点信息的区分,多线程也提高了数据调用的速度和效率,通过循环将保存的每日兴趣点信息进行复制并将复制的内容保存在历史兴趣点信息表中,使该历史兴趣点信息表能够进行自更新。
请参阅图6,图6是本申请的实施例还提供一种GPS信息提取装置的示意性框图,该GPS信息提取装置用于执行前述的GPS信息提取方法。其中,该GPS信息提取装置可以配置于服务器或终端中。
其中,服务器可以为独立的服务器,也可以为服务器集群。该终端可以是手机、平板电脑、笔记本电脑、台式电脑、个人数字助理和穿戴式设备等电子设备。
如图6所示,GPS信息提取装置300包括:信息获取模块301、信息筛选模块302、信息调用模块303和信息保存模块304。
信息获取模块301,用于获取实时位置信息和历史兴趣点信息表。
信息筛选模块302,用于基于所述历史兴趣点的位置信息对所述实时位置信息进行筛选,以得到每日位置信息。
其中,信息筛选模块302包括左连接子模块3021和空值筛选子模块3022。
具体地,左连接子模块3021,用于将所述实时位置信息与历史兴趣点的位置信息进行左连接。空值筛选子模块3022,用于根据为空值的所述历史兴趣点的位置信息对所述实时位置信息进行筛选。
信息调用模块303,用于将所述每日位置信息转换为预设坐标信息,并创建多个线程以通过创建的每个线程并发的从预设数据库中调用与所述预设坐标信息对应的每日兴趣点信息。
其中,信息调用模块303包括数组保存子模块3031和数组转换子模块3032。
具体地,数组保存子模块3031,用于将所述每日位置信息中的经纬度信息以数组进行保存。数组转换子模块3032,用于通过读取所述数组中的元素将所述每日位置信息转换为预设坐标信息。
信息保存模块304,用于按照第一预设格式将所述每日兴趣点信息按照日期以文本形式分别进行保存。
请参阅图7,图7是本申请的实施例还提供一种GPS信息提取装置的示意性框图,该GPS信息提取装置用于执行前述的GPS信息提取方法。其中,该GPS信息提取装置可以配置于服务器或终端中。
如图7所示,GPS信息提取装置400包括:信息获取模块401、信息筛选模块402、位置保存模块403、信息调用模块404、信息保存模块405和信息复制模块406。
信息获取模块401,用于获取实时位置信息和历史兴趣点信息表。
信息筛选模块402,用于基于所述历史兴趣点的位置信息对所述实时位置信息进行筛选,以得到每日位置信息。
位置保存模块403,用于将所述每日位置信息以文本形式按照日期分别进行保存。
信息调用模块404,用于将所述每日位置信息转换为预设坐标信息,并创建多个线程以通过创建的每个线程并发的从预设数据库中调用与所述预设坐标信息对应的每日兴趣点信息。
其中,信息调用模块404包括缓冲数量子模块4041、第一比值子模块4042、数量增加子模块4043、数量检查子模块4044和数量减少子模块4045。
具体地,缓冲数量子模块4041,用于获取第一缓冲区和第二缓冲区内预设坐标信息的数量。第一比值子模块4042,用于计算所述第一缓冲区内的预设坐标信息的数量与工作线程数量的比值。数量增加子模块4043,用于若所述第一缓冲区内的预设坐标信息的数量与工作线程数量的比值大于预设阈值,则按照预设规则增加所述工作线程数量。数量检查子模块4044,用于若所述第一缓冲区内的预设坐标信息的数量与工作线程数量的比值小于预设阈值,则周期性的检查所述第二缓冲区内预设坐标信息的数量。数量减少子模块4045,用于当检查得到所述第二缓冲区内预设坐标信息的数量为空的次数大于预设次数时,则按照所述预设规则减少所述工作线程数量。
信息保存模块405,用于按照第一预设格式将所述每日兴趣点信息按照日期以文本形式分别进行保存。
信息复制模块406,用于复制以文本形式保存的所述每日兴趣点信息并将复制的所述每日兴趣点信息保存至所述历史兴趣点信息表中。
需要说明的是,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的GPS信息提取装置和各模块的具体工作过程,可以参考前述GPS信息提取方法实施例中的对应过程,在此不再赘述。
上述的GPS信息提取装置可以实现为一种计算机程序的形式,该计算机程序可以在如图8所示的计算机设备上运行。
请参阅图8,图8是本申请实施例提供的一种计算机设备的结构示意性框图。该计算机设备可以是服务器或终端。
参阅图8,该计算机设备包括通过系统总线连接的处理器、存储器和网络接口,其中,存储器可以包括非易失性存储介质和内存储器。
非易失性存储介质可存储操作系统和计算机程序。该计算机程序包括程序指令,该程序指令被执行时,可使得处理器执行任意一种GPS信息提取方法。
处理器用于提供计算和控制能力,支撑整个计算机设备的运行。
内存储器为非易失性存储介质中的计算机程序的运行提供环境,该计算机程序被处理器执行时,可使得处理器执行任意一种GPS信息提取方法。
该网络接口用于进行网络通信,如发送分配的任务等。本领域技术人员可以理解,图8中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
应当理解的是,处理器可以是中央处理单元(Central Processing Unit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
其中,在一个实施例中,所述处理器用于运行存储在存储器中的计算机程序,以实现如下步骤:
获取实时位置信息和历史兴趣点信息表,所述历史兴趣点信息表中包括历史兴趣点的位置信息;基于所述历史兴趣点的位置信息对所述实时位置信息进行筛选,以得到每日位置信息;将所述每日位置信息转换为预设坐标信息,并创建多个线程以通过创建的每个线程并发的从预设数据库中调用与所述预设坐标信息对应的每日兴趣点信息;按照第一预设格式将所述每日兴趣点信息按照日期以文本形式分别进行保存。
在一个实施例中,所述处理器在实现所述创建多个线程以通过创建的每个线程并发的从预设数据库中调用与所述预设坐标信息对应的每日兴趣点信息时,用于实现:
获取第一缓冲区和第二缓冲区内预设坐标信息的数量,所述第一缓冲区用于保存正在调用的每日兴趣点信息的预设坐标信息,所述第二缓冲区用于保存待调用的每日兴趣点信息的预设坐标信息;计算所述第一缓冲区内的预设坐标信息的数量与工作线程数量的比值;若所述第一缓冲区内的预设坐标信息的数量与工作线程数量的比值大于预设阈值,则按照预设规则增加所述工作线程数量;若所述第一缓冲区内的预设坐标信息的数量与工作线程数量的比值小于预设阈值,则周期性的检查所述第二缓冲区内预设坐标信息的数量;当检查得到所述第二缓冲区内预设坐标信息的数量为空的次数大于预设次数时,则按照所述预设规则减少所述工作线程数量。
在一个实施例中,所述处理器在实现所述基于所述历史兴趣点的位置信息对所述实时位置信息进行筛选时,用于实现:
将所述实时位置信息与历史兴趣点的位置信息进行左连接;根据为空值的所述历史兴趣点的位置信息对所述实时位置信息进行筛选。
在一个实施例中,所述处理器在实现所述基于所述历史兴趣点的位置信息对所述实时位置信息进行筛选,以得到每日位置信息之后,还用于实现:
将所述每日位置信息以文本形式按照日期分别进行保存。
在一个实施例中,所述处理器在实现所述将所述每日位置信息转换为预设坐标信息时,用于实现:
将所述每日位置信息中的经纬度信息以数组进行保存;通过读取所述数组中的元素将所述每日位置信息转换为预设坐标信息。
在一个实施例中,所述处理器还用于实现:
复制以文本形式保存的所述每日兴趣点信息并将复制的所述每日兴趣点信息保存至所述历史兴趣点信息表中。
在一个实施例中,所述处理器在实现所述将复制的所述每日兴趣点信息保存至所述历史兴趣点信息表中时,用于实现:
将复制的每日兴趣点信息按照第二预设格式保存至所述历史兴趣点信息表中。
本申请的实施例中还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序中包括程序指令,所述处理器执行所述程序指令,实现本申请实施例提供的任一项GPS信息提取方法。
其中,所述计算机可读存储介质可以是前述实施例所述的计算机设备的内部存储单元,例如所述计算机设备的硬盘或内存。所述计算机可读存储介质也可以是所述计算机设备的外部存储设备,例如所述计算机设备上配备的插接式硬盘,智能存储卡(SmartMedia Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种GPS信息提取方法,其特征在于,包括:
获取实时位置信息和历史兴趣点信息表,所述历史兴趣点信息表中包括历史兴趣点的位置信息;
基于所述历史兴趣点的位置信息对所述实时位置信息进行筛选,以得到每日位置信息;
将所述每日位置信息转换为预设坐标信息,并创建多个线程以通过创建的每个线程并发的从预设数据库中调用与所述预设坐标信息对应的每日兴趣点信息;
按照第一预设格式将所述每日兴趣点信息按照日期以文本形式分别进行保存。
2.根据权利要求1所述的GPS信息提取方法,其特征在于,所述创建多个线程以通过创建的每个线程并发的从预设数据库中调用与所述预设坐标信息对应的每日兴趣点信息,包括:
获取第一缓冲区和第二缓冲区内预设坐标信息的数量,所述第一缓冲区用于保存正在调用的每日兴趣点信息的预设坐标信息,所述第二缓冲区用于保存待调用的每日兴趣点信息的预设坐标信息;
计算所述第一缓冲区内的预设坐标信息的数量与工作线程数量的比值;
若所述第一缓冲区内的预设坐标信息的数量与工作线程数量的比值大于预设阈值,则按照预设规则增加所述工作线程数量;
若所述第一缓冲区内的预设坐标信息的数量与工作线程数量的比值小于预设阈值,则周期性的检查所述第二缓冲区内预设坐标信息的数量;
当检查得到所述第二缓冲区内预设坐标信息的数量为空的次数大于预设次数时,则按照所述预设规则减少所述工作线程数量。
3.根据权利要求1所述的GPS信息提取方法,其特征在于,所述基于所述历史兴趣点的位置信息对所述实时位置信息进行筛选,包括:
将所述实时位置信息与历史兴趣点的位置信息进行左连接;
根据为空值的所述历史兴趣点的位置信息对所述实时位置信息进行筛选。
4.根据权利要求1所述的GPS信息提取方法,其特征在于,在所述基于所述历史兴趣点的位置信息对所述实时位置信息进行筛选,以得到每日位置信息之后,还包括:
将所述每日位置信息以文本形式按照日期分别进行保存。
5.根据权利要求1所述的GPS信息提取方法,其特征在于,所述将所述每日位置信息转换为预设坐标信息,包括:
将所述每日位置信息中的经纬度信息以数组进行保存;
通过读取所述数组中的元素将所述每日位置信息转换为预设坐标信息。
6.根据权利要求1所述的GPS信息提取方法,其特征在于,还包括:复制以文本形式保存的所述每日兴趣点信息并将复制的所述每日兴趣点信息保存至所述历史兴趣点信息表中。
7.根据权利要求6所述的GPS信息提取方法,其特征在于,所述将复制的所述每日兴趣点信息保存至所述历史兴趣点信息表中,包括:
将复制的每日兴趣点信息按照第二预设格式保存至所述历史兴趣点信息表中。
8.一种GPS信息提取装置,其特征在于,包括:
信息获取模块,用于获取实时位置信息和历史兴趣点信息表,所述历史兴趣点信息表中包括历史兴趣点的位置信息;
信息筛选模块,用于基于所述历史兴趣点的位置信息对所述实时位置信息进行筛选,以得到每日位置信息;
信息调用模块,用于将所述每日位置信息转换为预设坐标信息,并创建多个线程以通过创建的每个线程并发的从预设数据库中调用与所述预设坐标信息对应的每日兴趣点信息;
信息保存模块,用于按照第一预设格式将所述每日兴趣点信息按照日期以文本形式分别进行保存。
9.一种计算机设备,其特征在于,所述计算机设备包括存储器和处理器;
所述存储器用于存储计算机程序;
所述处理器,用于执行所述计算机程序并在执行所述计算机程序时实现如权利要求1至7中任一项所述的GPS信息提取方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器实现如权利要求1至7中任一项所述的GPS信息提取方法。
CN201911350975.6A 2019-12-24 2019-12-24 Gps信息提取方法、装置、设备及存储介质 Active CN111194009B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911350975.6A CN111194009B (zh) 2019-12-24 2019-12-24 Gps信息提取方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911350975.6A CN111194009B (zh) 2019-12-24 2019-12-24 Gps信息提取方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN111194009A true CN111194009A (zh) 2020-05-22
CN111194009B CN111194009B (zh) 2022-09-30

Family

ID=70709411

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911350975.6A Active CN111194009B (zh) 2019-12-24 2019-12-24 Gps信息提取方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN111194009B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080007399A1 (en) * 2006-07-05 2008-01-10 Hart Matt E Method and apparatus for providing location-specific information through a mobile device
CN105740252A (zh) * 2014-12-09 2016-07-06 北京四维图新科技股份有限公司 一种兴趣点poi数据的处理方法及装置
JP2016180618A (ja) * 2015-03-23 2016-10-13 パイオニア株式会社 情報処理装置、情報処理方法、情報処理プログラム及び情報処理プログラムを記録したコンピュータ読み取り可能な記録媒体
CN109948068A (zh) * 2017-09-30 2019-06-28 阿里巴巴集团控股有限公司 一种兴趣点信息的推荐方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080007399A1 (en) * 2006-07-05 2008-01-10 Hart Matt E Method and apparatus for providing location-specific information through a mobile device
CN105740252A (zh) * 2014-12-09 2016-07-06 北京四维图新科技股份有限公司 一种兴趣点poi数据的处理方法及装置
JP2016180618A (ja) * 2015-03-23 2016-10-13 パイオニア株式会社 情報処理装置、情報処理方法、情報処理プログラム及び情報処理プログラムを記録したコンピュータ読み取り可能な記録媒体
CN109948068A (zh) * 2017-09-30 2019-06-28 阿里巴巴集团控股有限公司 一种兴趣点信息的推荐方法和装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
张帅帅: "GPS数据的采集提取和显示", 《科技创新导报》 *
曹劲舟等: "基于微博位置签到数据的POI更新方法", 《地理空间信息》 *

Also Published As

Publication number Publication date
CN111194009B (zh) 2022-09-30

Similar Documents

Publication Publication Date Title
CN106802826B (zh) 一种基于线程池的业务处理方法及装置
CN108776934B (zh) 分布式数据计算方法、装置、计算机设备及可读存储介质
CN110633135A (zh) 异步任务分配方法、装置、计算机设备及存储介质
CN111899011A (zh) 一种医务账单对账系统、计算机设备和存储介质
US10331484B2 (en) Distributed data platform resource allocator
CN113867957A (zh) 一种跨集群容器数量弹性伸缩实现方法及装置
CN110221914B (zh) 文件处理方法及装置
CN109919357B (zh) 一种数据确定方法、装置、设备及介质
CN111680104A (zh) 数据同步方法、装置、计算机设备及可读存储介质
CN110727700A (zh) 多源流式数据整合成事务型流数据的方法及系统
CN112860412B (zh) 业务数据处理方法、装置、电子设备及存储介质
CN112099937A (zh) 一种资源治理方法和装置
CN113779949A (zh) 一种报告生成方法、装置、电子设备、存储介质及系统
CN108733536B (zh) 监控管理系统及方法
CN111194009B (zh) Gps信息提取方法、装置、设备及存储介质
CN110764705B (zh) 一种数据的读写方法、装置、设备和存储介质
CN110569114B (zh) 一种业务处理方法、装置、设备及存储介质
CN111858542B (zh) 数据处理方法、装置、设备及计算机可读存储介质
CN115016890A (zh) 虚拟机资源分配方法、装置、电子设备及存储介质
CN112540843B (zh) 资源的分配方法、装置、存储设备及存储介质
CN112395081B (zh) 一种资源在线自动回收方法、系统、服务器以及存储介质
CN113342502A (zh) 数据湖的性能诊断方法、装置、计算机设备及存储介质
CN112256418A (zh) 一种大数据任务调度方法
CN107329825B (zh) Gnss算法验证的方法及系统、定位终端、存储器
CN117435367B (zh) 用户行为处理方法、装置、设备、存储介质和程序产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant