CN109947819B - 疑似作弊区域的挖掘方法、装置、计算机设备和存储介质 - Google Patents

疑似作弊区域的挖掘方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN109947819B
CN109947819B CN201910184433.XA CN201910184433A CN109947819B CN 109947819 B CN109947819 B CN 109947819B CN 201910184433 A CN201910184433 A CN 201910184433A CN 109947819 B CN109947819 B CN 109947819B
Authority
CN
China
Prior art keywords
cheating
geographic
block
user
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910184433.XA
Other languages
English (en)
Other versions
CN109947819A (zh
Inventor
吕辛未
魏承东
曾新东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201910184433.XA priority Critical patent/CN109947819B/zh
Publication of CN109947819A publication Critical patent/CN109947819A/zh
Application granted granted Critical
Publication of CN109947819B publication Critical patent/CN109947819B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种疑似作弊区域的挖掘方法、装置、计算机设备和存储介质。其中,该方法包括:获取多个第一用户的上报坐标;将多个第一用户的上报坐标进行聚类,得到多个热点区域,每个热点区域组成一个地理块;确定每个地理块内所有兴趣点的浏览量信息,并确定每个地理块内每个第一用户的上报情况信息;根据每个地理块内所有兴趣点的浏览量信息和每个地理块内每个第一用户的上报情况信息,从多个地理块中确定出疑似作弊区域。该方法可以避免单用户作弊以及团伙作案上报错误信息,从源头杜绝风险的发生,从而可以拦截作弊用户,降低地图数据风险以及舆论风险,并降低审核工作量节约开支。

Description

疑似作弊区域的挖掘方法、装置、计算机设备和存储介质
技术领域
本发明涉及地图信息处理技术领域,尤其涉及一种疑似作弊区域的挖掘方法、装置、计算机设备和存储介质。
背景技术
随着互联网信息需求的不断发展,POI-PV(兴趣点-浏览量)作为地图POI数据免费标注的重要通道,一直面临着很严峻的作弊问题,业务上主要存在恶意竞争、收费代理等作弊场景,例如,在POI上报时,会遇到大量的代理商和作弊用户。相关技术中,主要集中在单用户作弊分析中,主要分析每个用户的上报历史、行为特征、审核情况等,通过这些特征判断是否存在作弊可能性。但是,单用户作弊分析仅局限在单个个体身上,当在遇到团伙作弊时往往无能为力,难以发现问题,从而损坏地图的名声也造成了舆论风险。
发明内容
本发明的目的旨在至少在一定程度上解决上述的技术问题之一。
为此,本发明的第一个目的在于提出一种疑似作弊区域的挖掘方法,该方法可以避免单用户作弊以及团伙作案上报错误信息,从源头杜绝风险的发生,从而可以拦截作弊用户,降低地图数据风险以及舆论风险,并降低审核工作量节约开支。
本发明的第二个目的在于提出一种疑似作弊区域的挖掘装置。
本发明的第三个目的在于提出一种计算机设备。
本发明的第四个目的在于提出一种计算机可读存储介质。
为达到上述目的,本发明第一方面实施例提出的一种疑似作弊区域的挖掘方法,包括:获取多个第一用户的上报坐标;将所述多个第一用户的上报坐标进行聚类,得到多个热点区域,每个热点区域组成一个地理块;确定每个地理块内所有兴趣点的浏览量信息,并确定所述每个地理块内每个第一用户的上报情况信息;根据所述每个地理块内所有兴趣点的浏览量信息和所述每个地理块内每个第一用户的上报情况信息,从多个地理块中确定出疑似作弊区域。
根据本发明实施例的疑似作弊区域的挖掘方法,可获取多个第一用户的上报坐标,然后将所述多个第一用户的上报坐标进行聚类,得到多个热点区域,每个热点区域组成一个地理块,之后确定每个地理块内所有兴趣点的浏览量信息,并确定所述每个地理块内每个第一用户的上报情况信息,最后根据所述每个地理块内所有兴趣点的浏览量信息和所述每个地理块内每个第一用户的上报情况信息,从多个地理块中确定出疑似作弊区域,即根据用户的上报情况和兴趣点的浏览量来确定出疑似作弊区域,进而可以重点审核疑似作弊区域内的上报坐标,这样可以避免单用户作弊以及团伙作案上报错误信息,从源头杜绝风险的发生,从而可以拦截作弊用户,降低地图数据风险以及舆论风险,并降低审核工作量节约开支。
为达到上述目的,本发明第二方面实施例提出的一种疑似作弊区域的挖掘装置,包括:上报坐标获取模块,用于获取多个第一用户的上报坐标;聚类模块,用于将所述多个第一用户的上报坐标进行聚类,得到多个热点区域,每个热点区域组成一个地理块;信息确定模块,用于确定每个地理块内所有兴趣点的浏览量信息,并确定所述每个地理块内每个第一用户的上报情况信息;疑似作弊区域确定模块,用于根据所述每个地理块内所有兴趣点的浏览量信息和所述每个地理块内每个第一用户的上报情况信息,从多个地理块中确定出疑似作弊区域。
根据本发明实施例的疑似作弊区域的挖掘装置,可获取多个第一用户的上报坐标,然后将所述多个第一用户的上报坐标进行聚类,得到多个热点区域,每个热点区域组成一个地理块,之后确定每个地理块内所有兴趣点的浏览量信息,并确定所述每个地理块内每个第一用户的上报情况信息,最后根据所述每个地理块内所有兴趣点的浏览量信息和所述每个地理块内每个第一用户的上报情况信息,从多个地理块中确定出疑似作弊区域,即根据用户的上报情况和兴趣点的浏览量来确定出疑似作弊区域,进而可以重点审核疑似作弊区域内的上报坐标,这样可以避免单用户作弊以及团伙作案上报错误信息,从源头杜绝风险的发生,从而可以拦截作弊用户,降低地图数据风险以及舆论风险,并降低审核工作量节约开支。
为达到上述目的,本发明第三方面实施例提出的计算机设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现本发明第一方面实施例所述的疑似作弊区域的挖掘方法。
为达到上述目的,本发明第四方面实施例提出的计算机可读存储介质,所述计算机程序被处理器执行时实现本发明第一方面实施例所述的疑似作弊区域的挖掘方法。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1是根据本发明一个实施例的疑似作弊区域的挖掘方法的流程图。
图2是根据本发明实施例的从多个地理块中确定出疑似作弊区域的流程图。
图3是根据本发明一个实施例的用于标定车载雷达安装角度的装置的结构示意图。
图4是根据本发明一个实施例的疑似作弊区域的挖掘装置的结构示意图。
图5是根据本发明一个实施例的疑似作弊区域的挖掘装置的结构示意图。
图6是根据本发明一个实施例的计算机设备的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
下面参考附图描述本发明实施例的疑似作弊区域的挖掘方法、装置、计算机设备和计算机可读存储介质。
在POI上报时,会遇到大量的代理商和作弊用户,相关技术中,主要集中在单用户作弊分析中,主要分析每个用户的上报历史、行为特征、审核情况等,通过这些特征判断是否存在作弊可能性。但是,单用户作弊分析仅局限在单个个体身上,当在遇到团伙作弊时往往无能为力,难以发现问题,从而损坏地图的名声也造成了舆论风险。
为此,本发明提出了一种疑似作弊区域的挖掘方法、装置、计算机设备和存储介质,本发明通过根据用户的上报情况和兴趣点的浏览量来确定出疑似作弊区域,进而可以重点审核疑似作弊区域内的上报坐标,这样可以避免单用户作弊以及团伙作案上报错误信息,从源头杜绝风险的发生,从而可以拦截作弊用户,降低地图数据风险以及舆论风险,并降低审核工作量节约开支。具体地,下面参考附图描述本发明实施例的疑似作弊区域的挖掘方法、装置、计算机设备和计算机可读存储介质。
图1是根据本发明一个实施例的疑似作弊区域的挖掘方法的流程图。需要说明的是,本发明实施例的疑似作弊区域的挖掘方法可应用于本发明实施例的疑似作弊区域的挖掘装置,该装置可被配置于计算机设备上。
如图1所示,该疑似作弊区域的挖掘方法可以包括:
S110,获取多个第一用户的上报坐标。
需要说明的是,本发明实施例的疑似作弊区域的挖掘方法适用于地图兴趣点坐标上报场景。举例而言,用户在使用具有定位功能的设备进行地图兴趣点的坐标上报时,该设备可对用户的位置进行定位,并将定位到的坐标作为地图兴趣点的上传坐标进行上传,从而可以使得所述挖掘装置获得用户发送的地图兴趣点的上报坐标。其中,所述挖掘装置可记录每个用户的上报坐标和上报时间,将坐标标记在空间数据库中,并带上上报时间标记。
需要说明的是,该具有定位功能的设备可以是地图数据采集装置,例如,GPS(Global Positioning System,全球定位系统)定位器,移动终端等。
S120,将多个第一用户的上报坐标进行聚类,得到多个热点区域,每个热点区域组成一个地理块。
也就是说,将多个第一用户的上报坐标通过聚类算法进行聚类以得到多个热点区域,其中,每个热点区域组成一个地理块。需要说明的是,所述聚类算法有很多种,下面将给出两个示例来描述通过两种不同聚类算法以实现对上报坐标的聚类:
作为一种可能实现方式的示例,可通过K-均值聚类算法对多个第一用户的上报坐标进行计算,找到多个热点区域,每个区域组成一个地理块。例如,先随机选取2个第一用户的上报坐标作为初始的聚类中心,然后计算每个第一用户的上报坐标与各个聚类中心之间的距离,将每个第一用户的上报坐标分配给距离它最近的聚类中心,并划分新的聚类中心,之后通过用误差平方和准则函数判断聚类是否合理,不合理则修改分类,循环进行判断、修改直至达到算法终止条件,最后找到多个热点区域,每个区域组成一个地理块。
作为另一种可能实现方式的示例,可通过K-中心点聚类算法对多个第一用户的上报坐标进行计算,找到多个热点区域,每个区域组成一个地理块。例如,随机选取2个代表第一用户的上报坐标作为初始的聚类中心点,之后计算其余所有第一用户的上报坐标到该2个聚类中心点的距离,并将每个第一用户的上报坐标到2个聚类中心点距离最短的聚簇作为自己所属的聚簇,然后在每个聚簇中按照顺序依次选取第一用户的上报坐标,计算该第一用户的上报坐标到当前聚簇中所有第一用户的上报坐标距离之和,最终距离之后最小的第一用户的上报坐标,则视为新的聚类中心点,然后重复计算直到各个聚簇的中心点不再改变,最后找到多个热点区域,每个区域组成一个地理块。
需要说明的是,上述给出的两个聚类算法仅是方便本领域技术人员对本发明实施例的了解,并不能作为对本发明的具体限定,也就是说,除了上述给出的两种聚类算法,本发明还可以通过其他聚类算法(如均值漂移聚类、基于密度的聚类方法等)来实现对上报坐标的聚类,从而得到多个热点区域。
S130,确定每个地理块内所有兴趣点的浏览量信息,并确定每个地理块内每个第一用户的上报情况信息。
可选地,根据每个地理块内所有兴趣点的访问量信息可确定每个地理块内所有兴趣点的浏览量信息,并确定每个地理块内第一用户的上报情况信息。比如,在一个地理块中一个第一用户对一个兴趣点访问了一次,该兴趣点的浏览量则加一次,进而根据该地理块中每个第一用户对所有兴趣点的访问次数即可确定该地理块中所有兴趣点的浏览量信息,并确定该地理块内每个第一用户的上报情况信息。其中,该上报情况信息即可理解为上报的坐标的个数,例如,可确定该地理块中第一用户上传的坐标总个数,该上传的坐标总个数即可作为所述上报情况信息。
S140,根据每个地理块内所有兴趣点的浏览量信息和每个地理块内每个第一用户的上报情况信息,从多个地理块中确定出疑似作弊区域。
可选地,根据每个地理块内所有兴趣点的浏览量信息和每个地理块内每个第一用户的上报情况信息,计算出每个地理块的作弊嫌疑度,进而根据该作弊嫌疑度即可确定每个地理块是否为疑似作弊区域。作为一种示例,图2是根据本发明实施例的从多个地理块中确定出疑似作弊区域的流程图,如图2所示,具体步骤如下:
S210,根据每个地理块内所有兴趣点的浏览量信息,计算每个地理块的第一热度。需要说明的是,每个地理块的计算方法相同。
在本发明的实施例中,以其中一个地理块的算法为例,根据该地理块内所有兴趣点的浏览量信息计算出该地理块的自然热度,也就是说,统计该地理块中所有兴趣点的浏览量信息,根据该浏览量信息得到该地理块的自然热度,该自然热度即为所述第一热度。比如,该地理块内的某个兴趣点被用户访问了一次,该兴趣点的浏览量则加一次,该地理块的自然热度比之前则会高一些。
S220,根据每个地理块内每个第一用户的上报情况信息,计算出每个地理块的第二热度。
在本发明的实施例中,可统计每个地理块内每个第一用户的上报坐标的个数,并根据所述每个地理块内上报坐标的总个数计算出所述每个地理模块的上报热度,该地理块的上报热度即为该地理块的第二热度。比如,以其中一个地理块的算法为例,统计该地理块内共有10个第一用户上传了坐标,每个第一用户各上报了10个坐标,则该地理块内的上报坐标的总个数为100,则该地理块的上报热度(即所述第二热度)为100。
S230,根据第一热度和第二热度,计算每个地理块的作弊嫌疑度。
可选地,根据每个地理块的第一热度和第二热度的比值,计算每个地理块的作弊嫌疑度。也就是说,可计算每个地理块的第二热度和第一热度的比值,并将该比值作为每个地理块的作弊嫌疑度。
S240,根据每个地理块的作弊嫌疑度,从多个地理块中确定出疑似作弊区域。
可选地,将多个地理块中的每个地理块的作弊嫌疑度与目标阈值进行大小比较,然后从所述多个地理块中,获取大于目标阈值的作弊嫌疑度对应的地理块,之后将所述大于目标阈值的作弊嫌疑度对应的地理块确定为疑似作弊区域。
具体地,将多个地理块中的每个地理块的第二热度和第一热度两者的比值与目标阈值进行大小比较,然后从多个地理块中,获取大于目标阈值的作弊嫌疑度对应的地理块,然后将大于目标阈值的作弊嫌疑度对应的地理块确定为疑似作弊区域。也就是说,将多个地理块中的每个地理块的第二热度和第一热度两者的比值与目标阈值进行大小比较,如果某个或某些地理块的比值大于目标阈值,则可判定该某个或某些地理块为作弊可疑区域。
需要说明的是,所述目标阈值可以是通过训练模型得出的。其中,可根据用户的上报情况、用户对兴趣点的访问情况,并结合用户行为信息,进行模型训练而得到的阈值。
为了提高兴趣点坐标的准确性,降低地图数据风险,可选地,在本发明的一个实施例中,在监测到有第二用户上报新的上报坐标时,确定新的上报坐标所属的地理块,然后判断所属的地理块是否为疑似作弊区域,若是,则判定第二用户为疑似作弊用户,并采用预设的检测方式对第二用户的上报坐标进行检测,以及采用预设的校验方式对检测后得到的结果进行二次校验。也就是说,当监控到有第二用户上报新的上报坐标时,根据新的上报坐标确定对应的地理块,并根据对应的地理块及其作弊嫌疑度判断第二用户是否为疑似作弊用户,若是,则对该用户进行重点审核,否则进行正常审核。
在本发明的实施例中,所述根据该对应的地理块及其作弊嫌疑度判断该用户是否为疑似作弊用户的具体实现过程可如下:判断对应的地理块的作弊嫌疑度是否大于目标阈值,若是,则判断该用户为疑似作弊用户,否则判定该用户为正常用户。
在本发明的实施例中,在判断第二用户为疑似作弊用户时,可对该第二用户进行重点审核,例如,可采用预设的检测方式对所述第二用户的上报坐标进行检测,比如,可通过人工检测方式或机器检测方式来检测该第二用户上报的新上报坐标是否在该目标地址的预定区域内,并采用预设的校验方式(如人工电话确认方式)对检测后得到的结果进行二次校验,即通过重点审核疑似作弊区域内用户上报的坐标是否正确,从而可以提高疑似作弊区域内兴趣点坐标的准确性,降低地图数据风险。
在本发明的实施例中,在判断第二用户为非疑似作弊用户,即为正常用户时,可对该第二用户进行正常审核。其中,所述正常审核的流程与所述重点审核的流程缺少校验过程,即缺少所述采用预设的校验方式对检测后得到的结果进行二次校验的步骤。例如,在判断第二用户为正常用户时,可通过人工检测方式或机器检测方式来检测该第二用户上报的新上报坐标是否在该目标地址的预定区域内即可。
在本发明的实施例中,作弊嫌疑度可根据时间进行更新,可使用热度衰减算法,对每个地理块的作弊嫌疑度进行更新,例如,随着时间的增加,作弊嫌疑度会衰减。可选地,当监测到每个地理块中的兴趣点有新坐标被上传,且上传新坐标的用户为作弊用户时,可增大每个地理块的作弊嫌疑度。也就是说,当有新的用户命中疑似作弊区域时且是作弊用户时,该疑似作弊区域的作弊嫌疑度会增加。由此,通过对作弊嫌疑度进行更新,可以提高判断地理块是否为疑似作弊区域的准确性。
根据本发明实施例的疑似作弊区域的挖掘方法,可获取多个第一用户的上报坐标,之后将多个第一用户的上报坐标进行聚类,得到多个热点区域,每个热点区域组成一个地理块,然后确定每个地理块内所有兴趣点的浏览量信息,并确定每个地理块内每个第一用户的上报情况信息,之后根据每个地理块内所有兴趣点的浏览量信息和每个地理块内每个第一用户的上报情况信息,从多个地理块中确定出疑似作弊区域。即根据用户的上报情况和兴趣点的浏览量来确定出疑似作弊区域,进而可以重点审核疑似作弊区域内的上报坐标,这样可以避免单用户作弊以及团伙作案上报错误信息,从源头杜绝风险的发生,从而可以拦截作弊用户,降低地图数据风险以及舆论风险,并降低审核工作量节约开支。
与上述几种实施例提供的疑似作弊区域的挖掘方法相对应,本发明的一种实施例还提供一种疑似作弊区域的挖掘装置,由于本发明实施例提供的疑似作弊区域的挖掘装置与上述几种实施例提供的疑似作弊区域的挖掘方法相对应,因此在疑似作弊区域的挖掘方法的实施方式也适用于本实施例提供的疑似作弊区域的挖掘装置,在本实施例中不再详细描述。图3是根据本发明一个实施例的疑似作弊区域的挖掘装置的结构示意图。需要说明的是,本发明实施例的疑似作弊区域的挖掘装置可应用于地图兴趣点坐标上报场景。
如图3所示,该疑似作弊区域的挖掘装置300包括:上报坐标获取模块310、聚类模块320、信息确定模块330和疑似作弊区域确定模块340,其中:
上报坐标获取模块310用于获取多个第一用户的上报坐标。
聚类模块320用于将所述多个第一用户的上报坐标进行聚类,得到多个热点区域,每个热点区域组成一个地理块。
信息确定模块330用于确定每个地理块内所有兴趣点的浏览量信息,并确定所述每个地理块内每个第一用户的上报情况信息。
疑似作弊区域确定模块340用于根据所述每个地理块内所有兴趣点的浏览量信息和所述每个地理块内每个第一用户的上报情况信息,从多个地理块中确定出疑似作弊区域。
根据本发明实施例的疑似作弊区域的挖掘装置,可获取多个第一用户的上报坐标,之后将多个第一用户的上报坐标进行聚类,得到多个热点区域,每个热点区域组成一个地理块,然后确定每个地理块内所有兴趣点的浏览量信息,并确定每个地理块内每个第一用户的上报情况信息,之后根据每个地理块内所有兴趣点的浏览量信息和每个地理块内每个第一用户的上报情况信息,从多个地理块中确定出疑似作弊区域。即根据用户的上报情况和兴趣点的浏览量来确定出疑似作弊区域,进而可以重点审核疑似作弊区域内的上报坐标,这样可以避免单用户作弊以及团伙作案上报错误信息,从源头杜绝风险的发生,从而可以拦截作弊用户,降低地图数据风险以及舆论风险,并降低审核工作量节约开支。
在本发明的一个实施例中,疑似作弊区域确定模块340包括:第一计算单元、第二计算单元、第三计算单元和确定单元。其中,在本发明的实施例中,第一计算单元,用于根据所述每个地理块内所有兴趣点的浏览量信息,计算所述每个地理块的第一热度;第二计算单元,用于根据所述每个地理块内每个第一用户的上报情况信息,计算出所述每个地理块的第二热度;第三计算单元,用于根据所述第一热度和第二热度,计算所述每个地理块的作弊嫌疑度;确定单元,用于根据所述每个地理块的作弊嫌疑度,从所述多个地理块中确定出疑似作弊区域。
其中,在本发明的实施例中,所述确定单元具体用于:将所述多个地理块中的每个地理块的作弊嫌疑度与目标阈值进行大小比较;从所述多个地理块中,获取大于所述目标阈值的作弊嫌疑度对应的地理块;将大于所述目标阈值的作弊嫌疑度对应的地理块确定为所述疑似作弊区域。
可选地,在本发明的一个实施例中,如图4所示,疑似作弊区域的挖掘装置300还包括:地理块确定模块350、判断模块360、坐标审核模块370。其中,地理块确定模块350用于在监测到有第二用户上报新的上报坐标时,确定所述新的上报坐标所属的地理块;判断模块360用于判断所述所属的地理块是否为疑似作弊区域;坐标审核模块370用于在判断所述所属的地理块为疑似作弊区域时,判定所述第二用户为疑似作弊用户,并采用预设的检测方式对所述第二用户的上报坐标进行检测,以及采用预设的校验方式对检测后得到的结果进行二次校验。
在本发明的一个实施例中,如图5所示,疑似作弊区域的挖掘装置300还包括:更新模块380。其中,更新模块380用于根据热度衰减算法,对所述每个地理块的作弊嫌疑度进行更新。
在本发明的实施例中,更新模块还用于380在监测到所述每个地理块中的兴趣点有新坐标被上传,且上传所述新坐标的用户为作弊用户时,增大所述每个地理块的作弊嫌疑度。由此,通过对作弊嫌疑度进行更新,可以提高判断地理块是否为疑似作弊区域的准确性。
为了实现上述实施例,本发明还提出了一种计算机设备。
图6是根据本发明一个实施例的计算机设备的结构示意图。如图6所示,该服务器600可以包括:存储器610、处理器620及存储在存储器610上并可在处理器620上运行的计算机程序630,处理器620执行程序时,实现本发明上述任一项所述的疑似作弊区域的挖掘方法。
为了实现上述实施例,本发明还提出了一种计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的疑似作弊区域的挖掘方法。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (14)

1.一种疑似作弊区域的挖掘方法,应用于地图兴趣点坐标上报场景,其特征在于,所述方法包括:
获取多个第一用户的上报坐标;
将所述多个第一用户的上报坐标进行聚类,得到多个热点区域,每个热点区域组成一个地理块;
确定每个地理块内所有兴趣点的浏览量信息,并确定所述每个地理块内每个第一用户的上报情况信息,其中,将所述每个地理块内每个第一用户上传的坐标总个数作为所述上报情况信息;
根据所述每个地理块内所有兴趣点的浏览量信息和所述每个地理块内每个第一用户的上报情况信息,从多个地理块中确定出疑似作弊区域。
2.根据权利要求1所述的方法,其特征在于,所述根据所述每个地理块内所有兴趣点的浏览量信息和所述每个地理块内每个第一用户的上报情况信息,从多个地理块中确定出疑似作弊区域,包括:
根据所述每个地理块内所有兴趣点的浏览量信息,计算所述每个地理块的第一热度;
根据所述每个地理块内每个第一用户的上报情况信息,计算出所述每个地理块的第二热度;
根据所述第一热度和第二热度,计算所述每个地理块的作弊嫌疑度;
根据所述每个地理块的作弊嫌疑度,从所述多个地理块中确定出疑似作弊区域。
3.根据权利要求2所述的方法,其特征在于,所述根据所述每个地理块的作弊嫌疑度,从所述多个地理块中确定出疑似作弊区域,包括:
将所述多个地理块中的每个地理块的作弊嫌疑度与目标阈值进行大小比较;
从所述多个地理块中,获取大于所述目标阈值的作弊嫌疑度对应的地理块;
将大于所述目标阈值的作弊嫌疑度对应的地理块确定为所述疑似作弊区域。
4.根据权利要求1所述的方法,其特征在于,还包括:
在监测到有第二用户上报新的上报坐标时,确定所述新的上报坐标所属的地理块;
判断所述所属的地理块是否为疑似作弊区域;
若是,则判定所述第二用户为疑似作弊用户,并采用预设的检测方式对所述第二用户的上报坐标进行检测,以及采用预设的校验方式对检测后得到的结果进行二次校验。
5.根据权利要求2至4中任一项所述的方法,其特征在于,还包括:
根据热度衰减算法,对所述每个地理块的作弊嫌疑度进行更新。
6.根据权利要求5中任一项所述的方法,其特征在于,还包括:
当监测到所述每个地理块中的兴趣点有新坐标被上传,且上传所述新坐标的用户为作弊用户时,增大所述每个地理块的作弊嫌疑度。
7.一种疑似作弊区域的挖掘装置,应用于地图兴趣点坐标上报场景,其特征在于,所述装置包括:
上报坐标获取模块,用于获取多个第一用户的上报坐标;
聚类模块,用于将所述多个第一用户的上报坐标进行聚类,得到多个热点区域,每个热点区域组成一个地理块;
信息确定模块,用于确定每个地理块内所有兴趣点的浏览量信息,并确定所述每个地理块内每个第一用户的上报情况信息,其中,将所述每个地理块内每个第一用户上传的坐标总个数作为所述上报情况信息;
疑似作弊区域确定模块,用于根据所述每个地理块内所有兴趣点的浏览量信息和所述每个地理块内每个第一用户的上报情况信息,从多个地理块中确定出疑似作弊区域。
8.根据权利要求7所述的装置,其特征在于,所述疑似作弊区域确定模块包括:
第一计算单元,用于根据所述每个地理块内所有兴趣点的浏览量信息,计算所述每个地理块的第一热度;
第二计算单元,用于根据所述每个地理块内每个第一用户的上报情况信息,计算出所述每个地理块的第二热度;
第三计算单元,用于根据所述第一热度和第二热度,计算所述每个地理块的作弊嫌疑度;
确定单元,用于根据所述每个地理块的作弊嫌疑度,从所述多个地理块中确定出疑似作弊区域。
9.根据权利要求8所述的装置,其特征在于,所述确定单元具体用于:
将所述多个地理块中的每个地理块的作弊嫌疑度与目标阈值进行大小比较;
从所述多个地理块中,获取大于所述目标阈值的作弊嫌疑度对应的地理块;
将大于所述目标阈值的作弊嫌疑度对应的地理块确定为所述疑似作弊区域。
10.根据权利要求7所述的装置,其特征在于,还包括:
地理块确定模块,用于在监测到有第二用户上报新的上报坐标时,确定所述新的上报坐标所属的地理块;
判断模块,用于判断所述所属的地理块是否为疑似作弊区域;
坐标审核模块,用于在判断所述所属的地理块为疑似作弊区域时,判定所述第二用户为疑似作弊用户,并采用预设的检测方式对所述第二用户的上报坐标进行检测,以及采用预设的校验方式对检测后得到的结果进行二次校验。
11.根据权利要求8至10中任一项所述的装置,其特征在于,还包括:
更新模块,用于根据热度衰减算法,对所述每个地理块的作弊嫌疑度进行更新。
12.根据权利要求11中任一项所述的装置,其特征在于,所述更新模块还用于:在监测到所述每个地理块中的兴趣点有新坐标被上传,且上传所述新坐标的用户为作弊用户时,增大所述每个地理块的作弊嫌疑度。
13.一种计算机设备,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如权利要求1至6中任一项所述的疑似作弊区域的挖掘方法。
14.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述的疑似作弊区域的挖掘方法。
CN201910184433.XA 2019-03-12 2019-03-12 疑似作弊区域的挖掘方法、装置、计算机设备和存储介质 Active CN109947819B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910184433.XA CN109947819B (zh) 2019-03-12 2019-03-12 疑似作弊区域的挖掘方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910184433.XA CN109947819B (zh) 2019-03-12 2019-03-12 疑似作弊区域的挖掘方法、装置、计算机设备和存储介质

Publications (2)

Publication Number Publication Date
CN109947819A CN109947819A (zh) 2019-06-28
CN109947819B true CN109947819B (zh) 2021-05-28

Family

ID=67009589

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910184433.XA Active CN109947819B (zh) 2019-03-12 2019-03-12 疑似作弊区域的挖掘方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN109947819B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110726418B (zh) 2019-10-10 2021-08-03 北京百度网讯科技有限公司 兴趣点区域确定方法、装置、设备及存储介质
CN111553279B (zh) * 2020-04-28 2023-05-05 北京百度网讯科技有限公司 兴趣点的表征学习、识别方法、装置、设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107729368A (zh) * 2017-09-08 2018-02-23 百度在线网络技术(北京)有限公司 一种用于poi数据校验的方法和装置
CN107832325A (zh) * 2017-09-15 2018-03-23 百度在线网络技术(北京)有限公司 一种poi数据校验方法与设备
CN108173847A (zh) * 2017-12-27 2018-06-15 百度在线网络技术(北京)有限公司 多账号用户追踪方法、装置、设备及计算机可读介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9843893B2 (en) * 2014-09-09 2017-12-12 Here Global B.V. Method and apparatus for providing point-of-interest detection via feature analysis and mobile device position information

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107729368A (zh) * 2017-09-08 2018-02-23 百度在线网络技术(北京)有限公司 一种用于poi数据校验的方法和装置
CN107832325A (zh) * 2017-09-15 2018-03-23 百度在线网络技术(北京)有限公司 一种poi数据校验方法与设备
CN108173847A (zh) * 2017-12-27 2018-06-15 百度在线网络技术(北京)有限公司 多账号用户追踪方法、装置、设备及计算机可读介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
公众参与的兴趣点数据有效性效验方法;李霖,杨蕾;《测绘科学》;20150731;第40卷(第7期);全文 *
城市公众地图服务系统兴趣点数据采集与处理;於新国,苏博文;《测绘与空间地理信息》;20130331;第36卷(第3期);全文 *
基于天地图的POI数据采集系统设计与实现;曾李阳,齐华,等;《测绘与空间地理信息》;20160331;第39卷(第3期);全文 *

Also Published As

Publication number Publication date
CN109947819A (zh) 2019-06-28

Similar Documents

Publication Publication Date Title
CN109996186B (zh) 一种网络覆盖问题识别方法及装置、可读取存储介质
US8542637B2 (en) Clustering crowd-sourced data for determining beacon positions
CN109522895B (zh) 兴趣点位置校验方法、装置、服务器和计算机可读介质
US20200351678A1 (en) Method for implementing antenna azimuth correction based on user data
US20120185458A1 (en) Clustering crowd-sourced data to identify event beacons
CN113672938B (zh) 一种区块链节点可信状态确定方法
CN109947819B (zh) 疑似作弊区域的挖掘方法、装置、计算机设备和存储介质
CN112506972B (zh) 用户常驻区域定位方法、装置、电子设备以及存储介质
CN106650973A (zh) 一种选座方法及装置
US20040210938A1 (en) Method and system for automatically analyzing and modifying cable television signal leak information
CN111935820A (zh) 基于无线网络的定位实现方法及相关设备
US20050144537A1 (en) Method to use a receiver operator characteristics curve for model comparison in machine condition monitoring
CN105791496A (zh) 一种移动终端状态检测方法及装置
CN113486134B (zh) 降雨量异常检测方法、装置、计算机设备及存储介质
CN111615047B (zh) 一种实时客流统计的方法、装置、存储介质及电子设备
RU2659486C1 (ru) Способ обработки результатов радиомониторинга
CN113392903A (zh) 一种工地区域的识别方法、系统及装置
CN108712317B (zh) 一种基于移动社交网络的城市人群时空动态感知方法和系统
CN112749894A (zh) 一种缺陷检测模型评价方法以及装置
CN107315826A (zh) 一种定位系统盲区动态检测方法
CN116630031A (zh) 一种车辆防拆解预警方法、装置、设备和可读存储介质
CN111309977A (zh) 一种id时空轨迹匹配方法及装置
CN112150851A (zh) 地磁检测器的测试方法和装置
CN113873431B (zh) 楼宇网络质量呈现方法和装置
CN110717179A (zh) 一种ip地址的风险评估方法及相关装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant