CN115186724A - 用户识别的方法、装置、设备及计算机存储介质 - Google Patents
用户识别的方法、装置、设备及计算机存储介质 Download PDFInfo
- Publication number
- CN115186724A CN115186724A CN202110366029.1A CN202110366029A CN115186724A CN 115186724 A CN115186724 A CN 115186724A CN 202110366029 A CN202110366029 A CN 202110366029A CN 115186724 A CN115186724 A CN 115186724A
- Authority
- CN
- China
- Prior art keywords
- user
- longitude
- latitude
- preset
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 59
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 49
- 238000010845 search algorithm Methods 0.000 claims abstract description 20
- 238000012360 testing method Methods 0.000 claims abstract description 6
- 238000004590 computer program Methods 0.000 claims description 14
- 238000012545 processing Methods 0.000 claims description 6
- 125000004122 cyclic group Chemical group 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 14
- 238000004891 communication Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 5
- 230000032823 cell division Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000009191 jumping Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
- G06F16/24575—Query processing with adaptation to user needs using context
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种用户识别的方法、装置、设备及计算机存储介质。具体方案包括:获取预设时间段内待识别的目标区域的用户测试报告MR数据,用户MR数据包括用户的经纬度数据;利用预设的聚类算法和用户的经纬度数据,确定目标区域的第一用户,第一用户为目标区域中的常驻用户;根据第一用户的经纬度数据和预设延伸参数,确定目标区域中的第一区域;根据第一区域中的用户的经纬度数据和预设距离阈值,利用预设查找算法,确定第一区域中的第二用户;将第一用户和第二用户作为目标区域的目标用户。根据本申请实施例,能够提升目标区域的用户识别的准确性。
Description
技术领域
本申请属于通信技术领域,尤其涉及一种户识别的方法、装置、设备及计算机存储介质。
背景技术
通常,通过对移动用户数据挖掘分析,可以有助于运营商的业务管理和用户维护等工作。
相关技术中,在定位各个小区或者单位的用户时,仍存在一定问题,如小区边界划分不准确或者用户位置信息不准确等问题,导致无法准确的匹配和识别小区内的用户。
发明内容
本申请实施例提供一种用户识别的方法、装置、设备及计算机存储介质,能够提升目标区域的用户识别的准确性。
第一方面,本申请实施例提供一种用户识别的方法,方法包括:
获取预设时间段内待识别的目标区域的用户测试报告(Measurement Report,MR)数据,所述用户MR数据包括用户的经纬度数据;
利用预设的聚类算法和所述用户的经纬度数据,确定所述目标区域的第一用户,所述第一用户为所述目标区域中的常驻用户;
根据所述第一用户的经纬度数据和预设延伸参数,确定所述目标区域中的第一区域;
根据所述第一区域中的用户的经纬度数据和预设距离阈值,利用预设查找算法,确定所述第一区域中的第二用户;
将所述第一用户和第二用户作为所述目标区域的目标用户。
可选的,所述利用预设的聚类算法和所述用户的经纬度数据,确定所述目标区域的第一用户,包括:
利用预设的聚类算法对所述用户的经纬度数据聚类,得到所述经纬度数据对应的聚类经纬度簇;
将所述聚类经纬度簇对应的用户作为所述目标区域的第一用户。
可选的,所述利用预设的聚类算法对所述用户的经纬度数据聚类,得到所述经纬度数据对应的聚类经纬度簇,包括:
基于所述用户的经纬度数据和预设的密度参数,利用预设的密度聚类算法,进行循环迭代聚类;
当聚类结果为一个聚类经纬度簇时,将所述一个聚类经纬度簇作为所述经纬度数据对应的聚类经纬度簇。
可选的,所述预设的密度参数包括领域半径参数和领域密度阈值参数。
可选的,所述根据所述第一用户的经纬度数据和预设延伸参数,确定所述目标区域中的第一区域,包括:
根据所述第一用户的经纬度数据,计算得到所述目标区域的中心位置经纬度数据;
根据所述中心位置经纬度数据,以中心位置经纬度数据对应的位置为中心,分别在经度方向和纬度方向上延伸所述预设延伸参数长度确定的区域为所述第一区域。
可选的,所述根据所述第一区域中的用户的经纬度数据和预设距离阈值,利用预设查找算法,确定所述第一区域中的第二用户,包括:
获取所述第一区域中的第三用户的经纬度数据,所述第三用户为所述第一区域中的第一用户以外的待识别用户;
根据所述第三用户的经纬度数据与所述第一用户的经纬度数据和预设距离阈值,利用二分查找算法,确定所述第一区域中的第二用户。
可选的,根据所述第三用户的经纬度数据与所述第一用户的经纬度数据和预设距离阈值,利用二分查找算法,确定所述第一区域中的第二用户,包括:
根据所述第三用户的经纬度数据与所述第一用户的经纬度数据,利用二分查找算法,计算得到所述第三用户分别与每个所述第一用户的距离;
当所述第三用户与任一所述第一用户的距离小于预设距离阈值时,确定所述第三用户为第二用户。
可选的,其特征在于,所述预设的聚类算法为DBSCAN密度聚类算法。
第二方面,本申请实施例提供了一种用户识别的装置,装置包括:
获取模块,用于获取预设时间段内待识别的目标区域的用户测试报告MR数据,所述用户MR数据包括用户的经纬度数据;
第一确定模块,用于利用预设的聚类算法和所述用户的经纬度数据,确定所述目标区域的第一用户,所述第一用户为所述目标区域中的常驻用户;
第二确定模块,用于根据所述第一用户的经纬度数据和预设延伸参数,确定所述目标区域中的第一区域;
第三确定模块,用于根据所述第一区域中的用户的经纬度数据和预设距离阈值,利用预设查找算法,确定所述第一区域中的第二用户;
设置模块,用于将所述第一用户和第二用户作为所述目标区域的目标用户。
第三方面,本申请实施例提供了一种用户识别的设备,设备包括:
处理器以及存储有计算机程序指令的存储器;
所述处理器执行所述计算机程序指令时实现如第一方面和第一方面可选的所述的用户识别的方法。
第四方面,本申请实施例提供了一种计算机存储介质,计算机存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如第一方面和第一方面可选的所述的用户识别的方法。
本申请实施例的用户识别的方法、装置、设备及计算机存储介质,能够利用预设的聚类算法,对目标区域的预定时间段内的用户MR数据进行聚类,确定作为目标区域中的常驻用户的第一用户,目标区域可以是如居民小区等区域。基于确定的第一用户,在目标区域中查找可以作为目标用户的其他用户,以得到目标区域中对应的目标用户。由此,通过对目标区域内的用户进行聚类分析,以识别出目标区域内常驻的实际用户,可以避免由于用户定位或小区划定不准确,而导致的用户和所在小区识别匹配不准确等问题,可以提升目标区域的用户识别的准确性。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单的介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一些实施例提供的用户识别的方法的流程示意图;
图2是本申请一些实施例提供的用户识别的方法的流程示意图;
图3是本申请一些实施例提供的应用场景中的用户识别的示意图;
图4是本申请一些实施例提供的用户识别的装置的结构示意图;
图5是本申请一些实施例提供的用户识别的设备的硬件结构示意图。
具体实施方式
下面将详细描述本申请的各个方面的特征和示例性实施例,为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及具体实施例,对本申请进行进一步详细描述。应理解,此处所描述的具体实施例仅被配置为解释本申请,并不被配置为限定本申请。对于本领域技术人员来说,本申请可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本申请的示例来提供对本申请更好的理解。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
通常,已有的空间层面的识别目标用户的技术,通过仪器测量各用户居住小区或者常驻单位的边界坐标,然后在测量的边界范围内寻找覆盖目标用户,以便于开展定向服务。用户常驻小区物理覆盖范围,采用人工测定若干个小区边界顶点的坐标来表征。用户居住地坐标采用驻留通信基站的经纬度坐标来表征。通过寻找该基站经纬度坐标距离最近的小区顶点,将基站下所有用户归入该顶点所在小区,由此,识别出该小区内常驻的目标用户。
但是,相关技术仍存在一下问题,例如,小区或单位的边界坐标为手工上传,人为因素会导致大量的假数据和误差数据;小区住户经纬度坐标存在误差,可能导致住户无法归入实际常驻的小区等等。
为了解决现有技术问题,本申请实施例提供了一种用户识别的方法、装置、设备及计算机存储介质,能够提升目标区域的用户识别的准确性。
下面结合附图,描述根据本申请实施例提供的用户识别的方法、装置、设备及计算机存储介质。应注意,这些实施例并不是用来限制本申请公开的范围。
下面首先对本申请实施例所提供的用户识别的方法进行介绍。
图1是本申请一些实施例提供的用户识别的方法的流程示意图。如图1所示,在本申请实施例中,该用户识别的方法可以包括如下步骤:
S101:获取预设时间段内待识别的目标区域的用户MR数据。
目标区域可以包括用户居住地的小区,工作单位,或者其他用户常驻的区域。预设时间段可以是包括白天工作时间段(9时至18时),夜间时间段(0时至6时)等时间段。用户MR数据可以包括用户的经纬度数据。
示例性的,待识别的目标区域为某一地址的小区,用户为注册业务时登记的居住地址为该小区的用户,预设时间段为夜间时段。获取登记的居住地址为该小区的用户的夜间时段的MR数据。
根据获取用户MR数据,可以确定用户的经纬度数据。具体地,在已建立的特征指纹库中,对获取到的MR数据进行指纹特征匹配,得到用户的经纬度坐标,即为匹配用户的经纬度数据。该用户MR数据的生成时刻,可以用于标识用户经纬度数据所属时间段。
S102:利用预设的聚类算法和用户的经纬度数据,确定目标区域的第一用户。
第一用户可以为目标区域中的常驻用户。通过对获取的用户经纬度数据聚类,得到目标区域的常驻用户。由此,可以剔除登记居住地址为目标区域,并非实际常驻在目标区域的用户。
在本申请一些实施例中,预设的聚类算法可以包括密度聚类算法,示例性的,预设的聚类算法可以为DBSCAN密度聚类算法。可以理解的是,该预设的聚类算法可以包括其他聚类算法,可以根据实际应用需求,选择对应聚类算法。
S103:根据第一用户的经纬度数据和预设延伸参数,确定目标区域中的第一区域。
S104:根据第一区域中的用户的经纬度数据和预设距离阈值,利用预设查找算法,确定第一区域中的第二用户。
S105:将第一用户和第二用户作为目标区域的目标用户。
第一用户可以是目标区域的常驻用户,可以在目标区域中圈定与第一用户相关的第一区域。然后,在第一区域中,利用预设查找算法,筛选出第二用户。第二用户可以包括第一区域中与第一用户的满足预设距离条件的用户。第二用户可以为目标区域内,除第一用户以外的常驻用户。最终,可以将第一用户和第二用户确定为目标区域的目标用户,以便于后续可以针对目标用户提供相关业务服务。示例性的,目标区域的目标用户可以为小区内的全量住户。
综上,本申请实施例的用户识别的方法,能够利用预设的聚类算法,对目标区域的预定时间段内的用户MR数据进行聚类,确定作为目标区域中的常驻用户的第一用户,目标区域可以是如居民小区等区域。然后,基于确定的第一用户,在目标区域中查找可以作为目标用户的其他用户,以得到目标区域中对应的目标用户。由此,通过对目标区域内的用户进行聚类分析,以识别出目标区域内常驻的实际用户,可以避免由于用户定位或小区划定不准确,而导致的用户和所在小区识别匹配不准确等问题,可以提升目标区域的用户识别的准确性。
为了更清楚的说明本申请的用户识别的方法,在本申请一些实施例中,如图2所示,图2是本申请一些实施例提供的用户识别的方法的流程示意图。该用户识别的方法还可以具体实施为如下步骤:
S201:获取预设时间段内待识别的目标区域的用户MR数据。
该步骤的具体的实施过程与S101相同,这里不再赘述。
S202:利用预设的聚类算法对用户的经纬度数据聚类,得到经纬度数据对应的聚类经纬度簇。
首先,基于用户的经纬度数据和预设的密度参数,利用预设的密度聚类算法,进行循环迭代聚类。然后,当聚类结果为一个聚类经纬度簇时,将所述一个聚类经纬度簇作为所述经纬度数据对应的聚类经纬度簇。
S203:将聚类经纬度簇对应的用户作为所述目标区域的第一用户。
在本申请一些实施例中,预设的密度参数可以包括领域半径参数和领域密度阈值参数。领域密度阈值参数可以为领域半径参数内用户经纬度个数的最小值。
示例性的,预设的密度聚类算法可以为DBSCAN密度聚类算法。基于DBSCAN密度聚类算法,对目标区域的用户的经纬度数据进行聚类分析计算,输出代表目标区域范围内的常驻用户的经纬度,确定该目标区域中的第一用户。具体算法过程可以包括:
输入数据:归属于目标区域的用户MR经纬度数据。
算法输入参数:领域半径参数(eps)、领域密度阈值参数(min_samples)。
输出:目标区域的第一用户MR经纬度、识别的目标区域的常驻用户。
示例性的,首先,设置领域半径参数eps和领域密度阈值参数min_samples初始值。依据精度要求eps取值范围可以从0.0001到0.01;依据实际小区的办理业务的住户数,min_samples首轮取值范围为500到2。固定eps=0.0001(折算约100米)不变,将min_samples从200开始进行模型聚类,如果该目标区域的用户经纬度数据聚类结果为多个簇,则将min_samples加1,如果该目标区域的用户经纬度数据聚类结果为空,则将min_samples减1,再次重新聚类,如此循环,直到聚类结果为一个簇,跳出循环。此时,输出的聚类结果即为居住在该目标区域的核心用户的经纬度,其邻域半径的圆的集合代表该目标区域的实际地理范围。
这里,DBSCAN密度聚类算法是基于密度的噪声适应空间聚类算法,是比较有代表性的基于密度的聚类算法。DBSCAN密度聚类算法可以将足够高密度的核心点划分成簇,并能在具有噪声的空间数据库中发现任意形状的簇。该算法核心思想包括:从某个核心点出发,不断向密度可达的区域扩张,从而得到一个包含核心点和边界点的最大化区域,区域中任意两点密度相连。该算法可以发现任意形状的簇,聚类结果几乎不依赖于结点遍历顺序,能够有效剔除噪声点。
S204:根据第一用户的经纬度数据,计算得到目标区域的中心位置经纬度数据。
S205:根据中心位置经纬度数据,以中心位置经纬度数据对应的位置为中心,分别在经度方向和纬度方向上延伸预设延伸参数长度确定的区域为第一区域。
S206:获取第一区域中的第三用户的经纬度数据。
第三用户可以为第一区域中的第一用户以外的待识别用户。
S207:根据第三用户的经纬度数据与第一用户的经纬度数据和预设距离阈值,利用二分查找算法,确定第一区域中的第二用户。
在本申请一些实施例中,首先,根据第三用户的经纬度数据与第一用户的经纬度数据,利用二分查找算法,计算得到第三用户分别与每个第一用户的距离。然后,将计算得到的每个距离与预设距离阈值进行比较判断。当第三用户与任一第一用户的距离小于预设距离阈值时,确定第三用户为第二用户。
在本申请一些实施例中,预设延伸参数可以根据实际需求设置,示例性的,预设延伸参数可以取值为0.015。预设距离阈值可以为领域半径参数值。
在本申请一些实施例中,针对每个目标区域,在已经计算出的该目标区域的第一用户中,基于第一用户的MR数据的经度和纬度计算出中心位置点的经纬度数据。再基于该中心位置点在经度和纬度方向上往外延伸经纬度0.015,划定第一区域。获取该范围内中的第一用户以外的用户,作为待识别用户,即第三用户。
利用二分查找算法,依次计算各第三用户的经纬度数据与每个第一用户的经纬度数据的距离。当第三用户与任一第一用户的距离小于预设距离阈值,即小于邻域半径参数eps时,将该第三用户标注为居住在目标区域的其他住户,即第二用户。第二用户与第一用户共同构成目标区域的全量住户。如图3所示,图3是本申请一些实施例提供的应用场景中的用户识别的示意图。浅色点可以表示第一用户,圆圈可以表示目标区域,圆圈内的深色点可以表示第二用户。
S208:将第一用户和第二用户作为目标区域的目标用户。
综上,本申请实施例的用户识别的方法,能够利用预设的聚类算法,如DBSCAN密度聚类算法,对目标区域的预定时间段内的用户经纬度数据进行聚类,确定作为目标区域中的常驻用户的第一用户。再基于确定的第一用户,在目标区域中查找可以作为目标用户的其他用户,以得到目标区域中对应的目标用户。由此,通过对目标区域内的用户进行聚类分析,以识别出目标区域内常驻的实际用户,可以避免由于用户定位或小区划定不准确,而导致的用户和所在小区识别匹配不准确等问题,可以提升目标区域的用户识别的准确性。
本申请实施例的用户识别的方法,可以避免传统人工方法给定小区边界产生的误差和脏数据等问题,基于用户的高精度MR坐标表征目标区域物理覆盖范围。比较其他用户预设时间段的坐标和已知用户预设时间段的坐标的距离,来判定其他用户是否为目标区域实际住户,而非将其他用户预设时间段的坐标和目标区域边界进行比较来判断是否居住在该目标区域,可以避免用户自身坐标不准或小区边界不准导致的二者匹配不准问题。
基于上述实施例提供的用户识别的方法,相应地,本申请还提供了用户识别的装置的具体实现方式。请参见以下实施例。
图4是本申请一些实施例提供的用户识别的装置的结构示意图。如图4所示,该用户识别的装置可以包括:
获取模块401,用于获取预设时间段内待识别的目标区域的用户测试报告MR数据,用户MR数据包括用户的经纬度数据;
第一确定模块402,用于利用预设的聚类算法和用户的经纬度数据,确定目标区域的第一用户,第一用户为目标区域中的常驻用户;
第二确定模块403,用于根据第一用户的经纬度数据和预设延伸参数,确定目标区域中的第一区域;
第三确定模块404,用于根据第一区域中的用户的经纬度数据和预设距离阈值,利用预设查找算法,确定第一区域中的第二用户;
设置模块405,用于将第一用户和第二用户作为目标区域的目标用户。
综上,本申请实施例的用户识别的装置可以用于执行上述实施例中的用户识别的方法,能够利用预设的聚类算法,对目标区域的预定时间段内的用户经纬度数据进行聚类,确定作为目标区域中的常驻用户的第一用户。再基于确定的第一用户,在目标区域中查找可以作为目标用户的其他用户,以得到目标区域中对应的目标用户。由此,通过对目标区域内的用户进行聚类分析,以识别出目标区域内常驻的实际用户,可以避免由于用户定位或小区划定不准确,而导致的用户和所在小区识别匹配不准确等问题,可以提升目标区域的用户识别的准确性。
第一确定模块402,还用于利用预设的聚类算法对用户的经纬度数据聚类,得到经纬度数据对应的聚类经纬度簇;将聚类经纬度簇对应的用户作为目标区域的第一用户。
第一确定模块402,还用于基于用户的经纬度数据和预设的密度参数,利用预设的密度聚类算法,进行循环迭代聚类;当聚类结果为一个聚类经纬度簇时,将一个聚类经纬度簇作为经纬度数据对应的聚类经纬度簇。
在本申请一些实施例中,预设的密度参数包括领域半径参数和领域密度阈值参数。
第二确定模块403,还用于根据第一用户的经纬度数据,计算得到目标区域的中心位置经纬度数据;根据中心位置经纬度数据,以中心位置经纬度数据对应的位置为中心,分别在经度方向和纬度方向上延伸预设延伸参数长度确定的区域为第一区域。
第三确定模块404,还用于获取第一区域中的第三用户的经纬度数据,第三用户为第一区域中的第一用户以外的待识别用户;
根据第三用户的经纬度数据与第一用户的经纬度数据和预设距离阈值,利用二分查找算法,确定第一区域中的第二用户。
第三确定模块404,还用于根据第三用户的经纬度数据与第一用户的经纬度数据,利用二分查找算法,计算得到第三用户分别与每个第一用户的距离;当第三用户与任一第一用户的距离小于预设距离阈值时,确定第三用户为第二用户。
在本申请一些实施例中,预设的聚类算法为DBSCAN密度聚类算法。
图4所示装置中的各个模块/单元具有实现图1和图2中各个步骤的功能,并能达到其相应的技术效果,为简洁描述,在此不再赘述。
基于上述实施例提供的用户识别的方法,相应地,本申请还提供了用户识别的设备的具体实现方式。请参见以下实施例。
图5示出了本申请实施例提供的用户识别的设备的硬件结构示意图。
用户识别的设备可以包括处理器501以及存储有计算机程序指令的存储器502。
具体地,上述处理器301可以包括中央处理器(CPU),或者特定集成电路(Application Specific Integrated Circuit,ASIC),或者可以被配置成实施本申请实施例的一个或多个集成电路。
存储器502可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器502可包括硬盘驱动器(Hard Disk Drive,HDD)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(Universal Serial Bus,USB)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器502可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器502可在综合网关容灾设备的内部或外部。在特定实施例中,存储器502是非易失性固态存储器。在特定实施例中,存储器502包括只读存储器(ROM)。在合适的情况下,该ROM可以是掩模编程的ROM、可编程ROM(PROM)、可擦除PROM(EPROM)、电可擦除PROM(EEPROM)、电可改写ROM(EAROM)或闪存或者两个或更多个以上这些的组合。
处理器501通过读取并执行存储器502中存储的计算机程序指令,以实现上述实施例中的任意一种用户识别的方法。
在一个示例中,用户识别的设备还可包括通信接口503和总线510。其中,如图5所示,处理器501、存储器502、通信接口503通过总线510连接并完成相互间的通信。
通信接口503,主要用于实现本申请实施例中各模块、装置、单元和/或设备之间的通信。
总线510包括硬件、软件或两者,将用户识别的设备的部件彼此耦接在一起。举例来说而非限制,总线可包括加速图形端口(AGP)或其他图形总线、增强工业标准架构(EISA)总线、前端总线(FSB)、超传输(HT)互连、工业标准架构(ISA)总线、无限带宽互连、低引脚数(LPC)总线、存储器总线、微信道架构(MCA)总线、外围组件互连(PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(SATA)总线、视频电子标准协会局部(VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线510可包括一个或多个总线。尽管本申请实施例描述和示出了特定的总线,但本申请考虑任何合适的总线或互连。
该用户识别的设备可以执行本申请实施例中的用户识别的方法,从而实现结合图1和图2描述的用户识别的方法。
另外,结合上述实施例中的用户识别的方法,本申请实施例可提供一种计算机存储介质来实现。该计算机存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例中的任意一种用户识别的方法。
需要明确的是,本申请并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实施例中,描述和示出了若干具体的步骤作为示例。但是,本申请的方法过程并不限于所描述和示出的具体步骤,本领域的技术人员可以在领会本申请的精神后,作出各种改变、修改和添加,或者改变步骤之间的顺序。
以上所述的结构框图中所示的功能块可以实现为硬件、软件、固件或者它们的组合。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(ASIC)、适当的固件、插件、功能卡等等。当以软件方式实现时,本申请的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、ROM、闪存、可擦除ROM(EROM)、软盘、CD-ROM、光盘、硬盘、光纤介质、射频(RF)链路,等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。
还需要说明的是,本申请中提及的示例性实施例,基于一系列的步骤或者装置描述一些方法或系统。但是,本申请不局限于上述步骤的顺序,也就是说,可以按照实施例中提及的顺序执行步骤,也可以不同于实施例中的顺序,或者若干步骤同时执行。
上面参考根据本公开的实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各方面。应当理解,流程图和/或框图中的每个方框以及流程图和/或框图中各方框的组合可以由计算机程序指令实现。这些计算机程序指令可被提供给通用计算机、专用计算机、或其它可编程数据处理装置的处理器,以产生一种机器,使得经由计算机或其它可编程数据处理装置的处理器执行的这些指令使能对流程图和/或框图的一个或多个方框中指定的功能/动作的实现。这种处理器可以是但不限于是通用处理器、专用处理器、特殊应用处理器或者现场可编程逻辑电路。还可理解,框图和/或流程图中的每个方框以及框图和/或流程图中的方框的组合,也可以由执行指定的功能或动作的专用硬件来实现,或可由专用硬件和计算机指令的组合来实现。
以上所述,仅为本申请的具体实施方式,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。应理解,本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。
Claims (11)
1.一种用户识别的方法,其特征在于,包括:
获取预设时间段内待识别的目标区域的用户测试报告MR数据,所述用户MR数据包括用户的经纬度数据;
利用预设的聚类算法和所述用户的经纬度数据,确定所述目标区域的第一用户,所述第一用户为所述目标区域中的常驻用户;
根据所述第一用户的经纬度数据和预设延伸参数,确定所述目标区域中的第一区域;
根据所述第一区域中的用户的经纬度数据和预设距离阈值,利用预设查找算法,确定所述第一区域中的第二用户;
将所述第一用户和第二用户作为所述目标区域的目标用户。
2.根据权利要求1所述的方法,其特征在于,所述利用预设的聚类算法和所述用户的经纬度数据,确定所述目标区域的第一用户,包括:
利用预设的聚类算法对所述用户的经纬度数据聚类,得到所述经纬度数据对应的聚类经纬度簇;
将所述聚类经纬度簇对应的用户作为所述目标区域的第一用户。
3.根据权利要求2所述的方法,其特征在于,所述利用预设的聚类算法对所述用户的经纬度数据聚类,得到所述经纬度数据对应的聚类经纬度簇,包括:
基于所述用户的经纬度数据和预设的密度参数,利用预设的密度聚类算法,进行循环迭代聚类;
当聚类结果为一个聚类经纬度簇时,将所述一个聚类经纬度簇作为所述经纬度数据对应的聚类经纬度簇。
4.根据权利要求3所述的方法,其特征在于,所述预设的密度参数包括领域半径参数和领域密度阈值参数。
5.根据权利要求1所述的方法,其特征在于,所述根据所述第一用户的经纬度数据和预设延伸参数,确定所述目标区域中的第一区域,包括:
根据所述第一用户的经纬度数据,计算得到所述目标区域的中心位置经纬度数据;
根据所述中心位置经纬度数据,以中心位置经纬度数据对应的位置为中心,分别在经度方向和纬度方向上延伸所述预设延伸参数长度确定的区域为所述第一区域。
6.根据权利要求1所述的方法,其特征在于,所述根据所述第一区域中的用户的经纬度数据和预设距离阈值,利用预设查找算法,确定所述第一区域中的第二用户,包括:
获取所述第一区域中的第三用户的经纬度数据,所述第三用户为所述第一区域中的第一用户以外的待识别用户;
根据所述第三用户的经纬度数据与所述第一用户的经纬度数据和预设距离阈值,利用二分查找算法,确定所述第一区域中的第二用户。
7.根据权利要求6所述的方法,其特征在于,根据所述第三用户的经纬度数据与所述第一用户的经纬度数据和预设距离阈值,利用二分查找算法,确定所述第一区域中的第二用户,包括:
根据所述第三用户的经纬度数据与所述第一用户的经纬度数据,利用二分查找算法,计算得到所述第三用户分别与每个所述第一用户的距离;
当所述第三用户与任一所述第一用户的距离小于预设距离阈值时,确定所述第三用户为第二用户。
8.根据权利要求1至7任一项所述的方法,其特征在于,所述预设的聚类算法为DBSCAN密度聚类算法。
9.一种用户识别的装置,其特征在于,所述装置包括:
获取模块,用于获取预设时间段内待识别的目标区域的用户测试报告MR数据,所述用户MR数据包括用户的经纬度数据;
第一确定模块,用于利用预设的聚类算法和所述用户的经纬度数据,确定所述目标区域的第一用户,所述第一用户为所述目标区域中的常驻用户;
第二确定模块,用于根据所述第一用户的经纬度数据和预设延伸参数,确定所述目标区域中的第一区域;
第三确定模块,用于根据所述第一区域中的用户的经纬度数据和预设距离阈值,利用预设查找算法,确定所述第一区域中的第二用户;
设置模块,用于将所述第一用户和第二用户作为所述目标区域的目标用户。
10.一种用户识别的设备,其特征在于,所述设备包括:处理器以及存储有计算机程序指令的存储器;
所述处理器执行所述计算机程序指令时实现如权利要求1至8任意一项所述的用户识别的方法。
11.一种计算机存储介质,其特征在于,所述计算机存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如权利要求1至8任意一项所述的用户识别的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110366029.1A CN115186724A (zh) | 2021-04-06 | 2021-04-06 | 用户识别的方法、装置、设备及计算机存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110366029.1A CN115186724A (zh) | 2021-04-06 | 2021-04-06 | 用户识别的方法、装置、设备及计算机存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115186724A true CN115186724A (zh) | 2022-10-14 |
Family
ID=83511535
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110366029.1A Pending CN115186724A (zh) | 2021-04-06 | 2021-04-06 | 用户识别的方法、装置、设备及计算机存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115186724A (zh) |
-
2021
- 2021-04-06 CN CN202110366029.1A patent/CN115186724A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110020224B (zh) | 地图兴趣点数据的关联方法、装置、设备及介质 | |
CN109874104B (zh) | 用户位置定位方法、装置、设备及介质 | |
CN109996279A (zh) | 过覆盖小区定位方法、装置、设备及介质 | |
CN109996280B (zh) | 基站经纬度核查方法、装置、设备及介质 | |
CN112685659B (zh) | 目标地点确定方法、装置、电子设备及计算机存储介质 | |
CN111931077B (zh) | 数据处理方法、装置、电子设备及存储介质 | |
CN109429330B (zh) | 室内定位方法、装置、设备和介质 | |
CN113079466B (zh) | 指纹数据库的构建方法、装置、设备及计算机存储介质 | |
CN111382138A (zh) | Poi数据处理方法、装置、设备及介质 | |
CN108574927B (zh) | 一种移动终端定位方法及装置 | |
CN110972258B (zh) | 一种位置指纹库的建立方法及装置 | |
CN115186724A (zh) | 用户识别的方法、装置、设备及计算机存储介质 | |
CN112566013B (zh) | 目标设备的定位方法、装置、设备及计算机存储介质 | |
CN108540926B (zh) | 一种无线信号指纹的构建方法及装置 | |
CN114664104B (zh) | 一种路网匹配方法和装置 | |
CN111741526B (zh) | 定位方法、装置、电子设备以及计算机存储介质 | |
CN109874170B (zh) | 地理坐标系盲检测方法、装置、设备及介质 | |
CN115310735A (zh) | 商圈边界识别的方法、装置、设备及存储介质 | |
CN111372309B (zh) | 一种基于lte信号的定位方法、装置及可读存储介质 | |
US11432111B2 (en) | Information processing device | |
CN111356152B (zh) | 基站位置矫正方法、装置、设备及介质 | |
CN112990779A (zh) | 一种对候选地址评分的方法、装置、设备及存储介质 | |
CN111222056A (zh) | 相关用户的匹配方法、装置、设备和介质 | |
CN112637768B (zh) | 基于蜂窝网络的移动终端定位方法及装置 | |
CN117370680A (zh) | 信息确定方法、装置、设备及计算机存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |