CN111008675B - 召回区域的抽样处理方法及装置 - Google Patents
召回区域的抽样处理方法及装置 Download PDFInfo
- Publication number
- CN111008675B CN111008675B CN201911368199.2A CN201911368199A CN111008675B CN 111008675 B CN111008675 B CN 111008675B CN 201911368199 A CN201911368199 A CN 201911368199A CN 111008675 B CN111008675 B CN 111008675B
- Authority
- CN
- China
- Prior art keywords
- recall
- recalled
- sampling
- area
- coverage
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000005070 sampling Methods 0.000 title claims abstract description 254
- 238000000034 method Methods 0.000 title claims abstract description 58
- 238000012545 processing Methods 0.000 title claims abstract description 19
- 238000003672 processing method Methods 0.000 claims abstract description 9
- 238000007689 inspection Methods 0.000 claims description 55
- 238000004891 communication Methods 0.000 claims description 30
- 238000011156 evaluation Methods 0.000 claims description 22
- 230000002159 abnormal effect Effects 0.000 claims description 7
- 238000000638 solvent extraction Methods 0.000 claims description 4
- 238000001514 detection method Methods 0.000 claims description 3
- 238000005192 partition Methods 0.000 claims description 3
- 230000002349 favourable effect Effects 0.000 abstract description 2
- 238000004422 calculation algorithm Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 8
- 238000004590 computer program Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000011022 operating instruction Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Tourism & Hospitality (AREA)
- Databases & Information Systems (AREA)
- Bioinformatics & Computational Biology (AREA)
- Educational Administration (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Remote Sensing (AREA)
- Life Sciences & Earth Sciences (AREA)
- Development Economics (AREA)
- Evolutionary Computation (AREA)
- Probability & Statistics with Applications (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Complex Calculations (AREA)
Abstract
本发明公开了一种召回区域的抽样处理方法及装置,该方法包括:获取任一召回区域内待召回对象的位置数据;设置该召回区域对应的多个抽样数;针对任一抽样数n,根据该召回区域内待召回对象的位置数据进行聚类处理,得到n个聚类中心的位置数据;查询属于各个聚类中心的召回子区域内的待召回对象,根据查询结果统计该召回区域内的待召回对象的覆盖率数据;根据多个抽样数对应的覆盖率数据,从多个抽样数中确定目标抽样数,将该目标抽样数对应的聚类中心的位置数据输出为该召回区域的抽样位置。本发明方案,根据待召回对象的分布情况确定抽样点,使得选取的抽样点更具有代表性,有利于用于对召回接口的准确巡检。
Description
技术领域
本发明涉及互联网技术领域,具体涉及一种召回区域的抽样处理方法及装置。
背景技术
对象召回接口可以根据用户的当前经纬度召回一定范围内满足条件的对象,当页面接收到召回请求后,通过调用该对象召回接口则可获取到数个对象并展示在页面上,例如,用户打开美食页面则会发起美食召回请求,该美食页面通过调用美食召回接口可查找到用户附近且满足条件的美食,然后该美食召回接口返回查找到的美食返回给美食页面并展现在页面中。与此同时,为了确保对象召回接口在被调用后可获取到准确的返回值,即确保对象召回接口的功能正常,需要定期对对象召回接口进行巡检,首先确定巡检的抽样点,然后模拟在抽样点主动发起对对象召回接口的调用,并确认返回值是否正确。
在现有技术中,在对对象召回接口进行巡检之前,通常通过如下方式来确定巡检的抽样点:方式一,以预设范围对全国或城镇进行划分并依次进行巡检,以覆盖到全国范围内大部分的待召回对象;方式二,以城市中心为抽样点;方式三,根据用户访问的经纬度进行抽样,包括随机抽样或者选取访问频度高的区域中心进行抽样。
然而,发明人在实施本发明实施例的过程中发现,现有技术中的几种确定巡检抽样点的方式至少存在如下问题:方式一,抽样次数多,例如,按照国土面积每3公里进行抽样,则需100多万次巡检,进而严重影响巡检的效率;方式二,仅以城市中心为抽样点往往无法覆盖周边存在待召回对象的区域,进而无法完成对对象召回接口在这些区域的巡检,影响巡检结果的准确性;方式三,用户访问的区域并不能与待召回对象的分布完全吻合,基于此确定抽样点则可能在根本不存在待召回对象的区域内进行巡检,则无法根据接口的返回值确定接口是否正常。
发明内容
鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的召回区域的抽样处理方法及装置。
根据本发明实施例的一个方面,提供了一种召回区域的抽样处理方法,包括:
获取任一召回区域内待召回对象的位置数据;
设置所述召回区域对应的多个抽样数;
针对任一抽样数n,根据所述召回区域内待召回对象的位置数据进行聚类处理,得到n个聚类中心的位置数据,其中,n为大于0的自然数;
查询属于各个聚类中心的召回子区域内的待召回对象,根据查询结果统计所述召回区域内的待召回对象的覆盖率数据;
根据覆盖率数据从多个抽样数中确定目标抽样数,将所述目标抽样数对应的聚类中心的位置数据输出为所述召回区域的抽样位置。
可选的,所述根据查询结果统计所述召回区域内的待召回对象的覆盖率数据进一步包括:
根据查询结果统计所述召回区域内的待召回对象的覆盖率;其中,所述覆盖率根据所述召回区域中n个聚类中心的召回子区域内被召回的待召回对象的非重复数量,与所述召回区域内待召回对象的总数量的比值计算得到。
可选的,所述根据覆盖率数据从多个抽样数中确定目标抽样数进一步包括:
根据所述覆盖率随抽样数的变化趋势,从多个抽样数中确定目标抽样数n。
可选的,所述根据查询结果统计所述召回区域内的待召回对象的覆盖率数据进一步包括:
根据查询结果统计所述召回区域内的待召回对象的覆盖效率;其中,所述覆盖效率根据所述召回区域中n个聚类中心的召回子区域内被召回的待召回对象的非重复数量,与所述召回区域内n个聚类中心的召回子区域内被召回的待召回对象的数量之和的比值计算得到。
可选的,所述根据覆盖率数据,从多个抽样数中确定目标抽样数进一步包括:
根据覆盖率以及覆盖效率,从多个抽样数中确定目标抽样数。
可选的,通过如下公式计算各个抽样数对应的综合评估值E:
式中,b为覆盖率和覆盖效率的重要程度比值,ce为覆盖率,re为覆盖效率;
所述根据覆盖率以及覆盖效率,从多个抽样数中确定目标抽样数具体为:根据覆盖率和覆盖效率,计算多个抽样数分别对应的综合评估值;从多个抽样数中选择出使综合评估值位于0至1之间,且综合评估值最小的抽样数并确定为目标抽样数。
可选的,在所述获取任一召回区域内待召回对象的位置数据之前,所述方法还包括:
根据召回维度对多个待召回对象进行分区处理,得到至少一个召回区域内包含的待召回对象。
根据本发明实施例的另一方面,提供了一种召回接口的巡检方法,包括:
根据上述任一项所述的召回区域的抽样处理方法,获取各个召回区域的抽样位置;
向召回接口发送携带所述抽样位置的巡检请求,获取召回接口返回的巡检结果;
根据所述巡检结果检测召回接口的工作状态是否异常。
根据本发明实施例的又一方面,提供了一种召回区域的抽样处理装置,包括:
获取模块,适于获取任一召回区域内待召回对象的位置数据;
设置模块,适于设置所述召回区域对应的多个抽样数;
聚类模块,适于针对任一抽样数n,根据所述召回区域内待召回对象的位置数据进行聚类处理,得到n个聚类中心的位置数据;其中,n为大于0的自然数;
统计模块,适于查询属于各个聚类中心的召回子区域内的待召回对象,根据查询结果统计所述召回区域内的待召回对象的覆盖率数据;
确定模块,适于根据覆盖率数据从多个抽样数中确定目标抽样数,将所述目标抽样数对应的聚类中心的位置数据输出为所述召回区域的抽样位置。
可选的,所述统计模块进一步适于:
根据查询结果统计所述召回区域内的待召回对象的覆盖率;其中,所述覆盖率根据所述召回区域中n个聚类中心的召回子区域内被召回的待召回对象的非重复数量,与所述召回区域内待召回对象的总数量的比值计算得到。
可选的,所述确定模块进一步适于:
根据所述覆盖率随抽样数的变化趋势,从多个抽样数中确定目标抽样数。
可选的,所述统计模块进一步适于:
根据查询结果统计所述召回区域内的待召回对象的覆盖效率;其中,所述覆盖效率根据所述召回区域中n个聚类中心的召回子区域内被召回的待召回对象的非重复数量,与所述召回区域内n个聚类中心的召回子区域内被召回的待召回对象的数量之和的比值计算得到。
可选的,所述确定模块进一步适于:
根据覆盖率以及覆盖效率,从多个抽样数中确定目标抽样数。
可选的,通过如下公式计算各个抽样数对应的综合评估值E:
式中,b为覆盖率和覆盖效率的重要程度比值,ce为覆盖率,re为覆盖效率;
所述确定模块进一步适于:根据覆盖率和覆盖效率,计算多个抽样数分别对应的综合评估值;从多个抽样数中选择出使综合评估值位于0至1之间,且综合评估值最小的抽样数并确定为目标抽样数。
可选的,所述装置还包括:
划分模块,适于根据召回维度对多个待召回对象进行分区处理,得到至少一个召回区域内包含的待召回对象。
根据本发明实施例的一个方面,提供了一种召回接口的巡检装置,包括:
获取模块,适于获取各个召回区域的抽样位置;
发送模块,适于向召回接口发送携带所述抽样位置的巡检请求;
接收模块,适于接收召回接口返回的巡检结果;
检测模块,适于根据所述巡检结果检测召回接口的工作状态是否异常。
根据本发明实施例的又一方面,提供了一种计算设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行上述召回区域的抽样处理方法对应的操作。
根据本发明实施例的又一方面,提供了一种计算设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行上述召回接口的巡检方法对应的操作。
根据本发明实施例的再一方面,提供了一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如上述召回区域的抽样处理对应的操作。
根据本发明实施例的再一方面,提供了一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如上述召回接口的巡检方法对应的操作。
根据本发明实施例的召回区域的抽样处理方法及装置,通过设置任一召回区域的多个抽样数,并针对任一抽样数对该召回区域内待召回对象的位置数据进行聚类处理,得到n个聚类中心的位置数据,进而可以确保聚类中心的分布与待召回对象的分布是吻合的,而避免在不存在待召回对象的范围内确定出抽样点,有利于准确的进行巡检;以及,在得到n个聚类中心的位置数据后,查询属于各个聚类中心的召回子区域内的待召回对象,并统计得到待召回对象的覆盖率数据,以用于确定该抽样数n是否合理,进而可以基于此从多个抽样数中选择出目标抽样数;并且,将目标抽样数的聚类中心输出为巡检时的抽样点,进而可以使得确定的抽样点的数量更为合理。由此可见,本实施例方案,通过对待召回对象的位置数据进行聚类处理来确定抽样点,则该抽样点与待召回对象的分布吻合,则利用该抽样点可准确的进行巡检;以及,根据覆盖率数据选择目标抽样数,可以提高抽样点数量确定的合理性,避免过多和/或过少的确定抽样点而影响巡检的效率和准确度。
上述说明仅是本发明实施例技术方案的概述,为了能够更清楚了解本发明实施例的技术手段,而可依照说明书的内容予以实施,并且为了让本发明实施例的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明实施例的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明实施例的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本发明实施例提供的召回区域的抽样处理方法的流程图;
图2示出了本发明另一个实施例提供的召回区域的抽样处理方法的流程图;
图3示出了本发明又一个实施例提供的召回区域的抽样处理方法的流程图;
图4示出了本发明一个实施例提供的召回接口的巡检方法的流程图;
图5示出了本发明实施例提供的召回区域的抽样处理装置的结构示意图;
图6示出了本发明实施例提供的召回接口的巡检装置的结构示意图;
图7示出了本发明实施例提供的计算设备的结构示意图;
图8示出了本发明实施例提供的计算设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
图1示出了本发明实施例提供的召回区域的抽样处理方法的流程图。如图1所示,该方法包括以下步骤:
步骤S110:获取任一召回区域内待召回对象的位置数据。
实际中,任一线上活动,都有参与该活动的对象,这些对象可通过对象召回接口进行召回并推送给用户,即:这些对象为被推送给用户的候选对象,在本发明实施例中记为待召回对象。
具体地,获取任一召回区域内待召回对象的位置数据,其中,一个召回区域是指页面展示时的一个地理位置范围,通常情况下,页面是按城市展示的,则一个召回区域为一个城市,例如,北京和天津分别为不同的召回区域;一起,待召回对象的位置数据是指待召回对象所在位置的经纬度信息。
步骤S120:设置该召回区域对应的多个抽样数。
其中,抽样数是指指定的聚类数量,例如,指定聚为8类,则设置抽样数为8。
具体地,可根据该召回区域的大小和/或该召回区域内待召回对象的分布情况设置多个抽样数。例如,根据城市的大小设置初始抽样数为8,然后按照预设步长累加,设置抽样数为8,10,12,14以及16。
需要在此说明的是,具体实施时,并不限定需要一次性完成上述多个抽样数的设置,可选的,也可以根据设置的抽样数得到的覆盖率数据来新增设置抽样数,例如,当设置抽样数为8,10,12分别得到覆盖率数据后,仍无法确定出目标抽样数,则可进一步新增抽样数14,16等等。
步骤S130:针对任一抽样数n,根据该召回区域内待召回对象的位置数据进行聚类处理,得到n个聚类中心的位置数据,其中,n为大于0的自然数;查询属于各个聚类中心的召回子区域内的待召回对象,根据查询结果统计该召回区域内的待召回对象的覆盖率数据。
具体地,对于任一抽样数n,通过聚类算法对该召回区域内待召回对象的位置数据进行聚类处理,可以将该召回区域内的待召回对象聚类为n类,每一类中有一个聚类中心(一个聚类中心为一个抽样点),并且每一类包含至少一个待召回对象,进而确保聚类中心的分布与待召回对象的分布是吻合的,而避免在不存在待召回对象的范围内确定出抽样点。
以及,在确定了该召回区域内的n个聚类中心后,根据召回区域内待召回对象的位置数据确定在各个聚类中心周边的召回范围内(即召回子区域内,下同)的待召回对象,其中,召回范围是指对象召回接口的查找匹配范围,例如,对象召回接口以用户访问的经纬度位置周边的3公里为查找匹配范围,则召回范围为聚类中心周边3公里的范围。通过上述查询,可得到落入各个聚类中心的召回范围内的待召回对象,进而可统计得到该召回区域内的待召回对象的覆盖率数据。其中,覆盖率数据是指反映召回区域内待召回对象落入n个聚类中心的召回子区域内的召回对象的数量情况的数据。
步骤S140:根据覆盖率数据从多个抽样数中确定目标抽样数,将该目标抽样数对应的聚类中心的位置数据输出为该召回区域的抽样位置。
其中,覆盖率数据可以体现出聚类中心的分布合理性,若聚类中心过少,则无法覆盖足够多的待召回对象,进而不利于全面巡检;若聚类中心过多,则相邻的聚类中心的召回子区域会覆盖大量重复的待召回对象,因抽样点过多会造成巡检效率低。基于此,根据该召回区域内多个抽样数对应的覆盖率数据选择出目标抽样数n0,使得尽量少的抽样点的召回子区域内可以覆盖尽可能多的待召回对象。
根据本实施例提供的召回区域的抽样处理方法,通过设置任一召回区域的多个抽样数,并针对任一抽样数对该召回区域内待召回对象的位置数据进行聚类处理,得到n个聚类中心的位置数据,进而可以确保聚类中心的分布与待召回对象的分布是吻合的,而避免在不存在待召回对象的范围内确定出抽样点,有利于准确的进行巡检;以及,在得到n个聚类中心的位置数据后,查询属于各个聚类中心的召回子区域内的待召回对象,并统计得到待召回对象的覆盖率数据,以用于确定该抽样数n是否合理,进而可以基于此从多个抽样数中选择出目标抽样数;并且,将目标抽样数对应的聚类中心输出为巡检时的抽样点,进而可以使得确定的抽样点的数量更为合理。由此可见,本实施例方案,通过对待召回对象的位置数据进行聚类处理来确定抽样点,则该抽样点与待召回对象的分布吻合,则利用该抽样点可准确的进行巡检;以及,根据覆盖率数据选择目标抽样数,可以提高抽样点数量确定的合理性,避免过多和/或过少的确定抽样点而影响巡检的效率和准确度。
图2示出了本发明另一个实施例提供的召回区域的抽样处理方法的流程图。在本实施例中,覆盖率数据为待召回对象的覆盖率。如图2所示,该方法包括以下步骤:
步骤S210:获取任一召回区域内待召回对象的位置数据。
具体地,首先确定参与活动的待召回对象,然后获取待召回对象的位置数据,例如,参与活动的待召回对象为多个店铺,则获取该多个店铺的店铺位置坐标为待召回对象的位置数据。
在本发明实施例中,以召回区域为单位确定抽样点,其中,可根据召回维度对多个待召回对象进行分区处理,得到至少一个召回区域内包含的待召回对象,通常情况下对象召回是以城市维度进行的,则将待召回对象按照城市进行划分,对划分得到的每个召回区域来确定抽样点。但是,需要在此说明的是,本发明并不以此为限,在一些其它实施例中,召回维度也可以为区、县等更小的地理单位。
步骤S220:设置该召回区域对应的多个抽样数。
具体地,可将该召回区域的面积大小除以预设单位分类面积,得到该召回区域的初始抽样数,然后在初始抽样数的基础上依次累加,得到多个抽样数,其中,该多个抽样数的数量可以是固定不变的,这种设置方式可便于快速确定出抽样点,或者,也可以是根据已经设置的抽样数对应的覆盖率数据不断新增而确定的,这种方式则更有利于发现更合理的抽样数。
举例来说,召回区域的面积a除以预设单位分类面积b得到的初始抽样数为8,则可以以步长为2,固定设置5个抽样数,分别为8,10,12,14以及16,然后仅需针对该5个抽样数,分别进行聚类并统计得到覆盖率数据即可;或者,可以以步长为2新增抽样数,并在每次新增后统计得到覆盖率数据,然后根据覆盖率数据确定是否找到了符合条件的抽样数,若未找到,则继续新增。
步骤S230:针对任一抽样数n,根据该召回区域内待召回对象的位置数据进行聚类处理,得到n个聚类中心的位置数据;查询属于各个聚类中心的召回子区域内的待召回对象,根据查询结果统计该召回区域内的待召回对象的覆盖率。
具体地,针对任一抽样数n,向聚类算法中输入该抽样数n,以及算法结束条件,其中,该算法结束条件包括最大迭代次数以及收敛步长,然后运行聚类算法可得到n个类的聚类中心的位置数据,并且每一类包含至少一个待召回对象,进而确保聚类中心的分布与待召回对象的分布是吻合的,而避免在不存在待召回对象的范围内确定出抽样点。在本实施例中,不限定聚类算法的具体类型,可选的,该聚类算法可以为k-means算法。
进一步的,在确定了该召回区域的n个聚类中心后,根据召回区域内待召回对象的位置数据确定在各个聚类中心周边的召回范围内(即召回子区域内,下同)的待召回对象,其中,召回范围是指对象召回接口的查找匹配范围,并统计召回区域内的待召回对象的覆盖率,其中,该覆盖率根据该召回区域中n个聚类中心的召回子区域内被召回的待召回对象的非重复数量,与该召回区域内待召回对象的总数量的比值计算得到。其中,非重复数量是指n个聚类中心的召回子区域内被召回的待召回对象均被计一次数而得到的数量之和,即需要减去同时落入至少两个聚类中心的召回子区域内的待召回对象的重复次数。其中,可通过如下公式计算覆盖率:
式中,ce为覆盖率,Ni为被召回的待召回对象的非重复数量,N为召回区域内被召回对象的总数量。
举例来说,召回区域内共有9个待召回对象,抽样数为3,聚类得到3个聚类中心分别为聚类中心a、聚类中心b以及聚类中心c,其中属于聚类中心a的召回子区域内的待召回对象为待召回对象1,2以及3,属于聚类中心b的召回子区域的待召回对象为待召回对象2,3以及4,属于聚类中心c的召回子区域的待召回对象为待召回对象为5,6,7以及8,则非重复数量为3+3+4-2,其中,-2是指减去聚类中a和聚类中心b的召回子区域中重复的待召回对象的数量,则覆盖率为(3+3+4-2)/9=8/9。
步骤S240:根据该覆盖率随抽样数的变化趋势,从多个抽样数中确定目标抽样数,将该目标抽样数对应的聚类中心的位置数据输出为该召回区域的抽样位置。
具体的,基于上述覆盖率的计算公式,可以发现,抽样数n由小增大的过程的初期,n个聚类中心的召回子区域覆盖的待召回对象Ni会以较快的速度增加,此时覆盖率ce随之较快速增加,此后抽样数n再增加,n个聚类中心的召回子区域覆盖的待召回对象Ni会缓慢接近于N,此时覆盖率ce缓慢增大并趋于稳定,直至最终等于1。基于此,可以绘制覆盖率ce随抽样数n的变化曲线,并将覆盖率ce趋于稳定时对应的首个抽样数确定为目标抽样数n0,并将该目标抽样数n0对应聚类得到的n0个聚类中心的位置数据输出为召回区域的n0个目标抽样点的抽样位置,进而使得尽量少的抽样点覆盖该召回区域内尽可能多的待召回对象。
举例来说,覆盖率ce从抽样数为12开始则处于趋于稳定的状态,则将抽样数12确定为目标抽样数。需要在此说明的是,在本发明实施例中,并不限定从变化曲线中确定覆盖率ce趋于稳定时对应的首个抽样数的具体算法,应该认为,所有可以从变化曲线中确定目标抽样数的方式均包含在本发明实施例的范围内。
根据本实施例提供的召回区域的抽样处理方法,通过设置任一召回区域的多个抽样数,并针对任一抽样数对该召回区域内待召回对象的位置数据进行聚类处理,得到n个聚类中心的位置数据,进而可以确保聚类中心的分布与待召回对象的分布是吻合的,而避免在不存在待召回对象的范围内确定出抽样点,有利于准确的进行巡检;以及,在得到n个聚类中心的位置数据后,查询属于各个聚类中心的召回子区域内的待召回对象,并统计得到待召回对象的覆盖率,以用于确定该抽样数n是否合理;将使覆盖率趋于稳定时的首个抽样数确定为目标抽样数n0,以及将目标抽样数的n0个聚类中心输出为巡检时的n0个抽样点,使得n0个抽样点满足抽样点数少且覆盖的召回区域的待召回对象多,进而可以使得确定的抽样点的数量更为合理。由此可见,本实施例方案,通过对待召回对象的位置数据进行聚类处理来确定抽样点,则该抽样点与待召回对象的分布吻合,则利用该抽样点可准确的进行巡检;以及,根据覆盖率数据选择目标抽样数,可以提高抽样点数量确定的合理性,避免过多和/或过少的确定抽样点而影响巡检的效率和准确度。
图3示出了本发明又一个实施例提供的召回区域的抽样处理方法的流程图。在本实施例中,覆盖率数据为待召回对象的覆盖率和覆盖效率。如图3所示,该方法包括以下步骤:
步骤S310:获取任一召回区域内待召回对象的位置数据。
其中,根据召回维度对多个待召回对象进行分区处理,得到至少一个召回区域内包含的待召回对象。
步骤S320:设置该召回区域对应的多个抽样数。
步骤S330:针对任一抽样数n,根据该召回区域内待召回对象的位置数据进行聚类处理,得到n个聚类中心的位置数据;查询属于各个聚类中心的召回子区域内的待召回对象,根据查询结果统计该召回区域内的待召回对象的覆盖率以及覆盖效率。
本实施例与图2对应的实施例的不同之处在于,本实施例中的覆盖率数据在包含待召回对象的覆盖率基础上,进一步包含待召回对象的覆盖效率。
其中,同图2对应的实施例中相同,该覆盖率根据该召回区域中n个聚类中心的召回子区域内被召回的待召回对象的非重复数量,与该召回区域内待召回对象的总数量的比值计算得到。
以及,该覆盖效率根据该召回区域中n个聚类中心的召回子区域内被召回的待召回对象的非重复数量,与该召回区域内n个聚类中心的召回子区域内被召回的待召回对象的数量之和的比值计算得到。其中,该召回区域内n个聚类中心的召回子区域内被召回的待召回对象的数量之和是指,将n个聚类中心的召回子区域内被召回的待召回对象的数量相加得到的数量值,该数量之和与非重复数量的不同之处在于,数量之和无需减去同时落入至少两个聚类中心的召回子区域内的待召回对象的重复次数。其中,可通过如下公式计算覆盖效率:
式中,re为覆盖效率,Ni为被召回的待召回对象的非重复数量,An为属于第n个聚类中心的召回子区域的待召回对象的数量。
仍以图2中步骤S230的举例来说,非重复数量为3+3+4-2,数量之和为3+3+4,则覆盖效率为(3+3+4-2)/(3+3+4)=4/5。
步骤S340:根据覆盖率以及覆盖效率从多个抽样数中确定目标抽样数,将该目标抽样数对应的聚类中心输出为该召回区域的抽样位置。
诚如图2中步骤S240的说明,覆盖率ce随抽样数n的增加的变化趋势为先迅速增加后趋于稳定最终达到1。
以及,随抽样数n的减少,n个聚类中心的召回子区域的重叠部分减少,则重复召回的待召回对象的数量减少,非重复数量Ni与A1+A2+A3+……+An之间的差值逐渐减小,并在差值为0时,覆盖效率re为1。
具体地,抽样数n越大,覆盖率越高,则抽样点的召回子区域可以覆盖更多的待召回对象,可以提高巡检的广泛性,进而提高巡检结果的准确性;抽样数n越小,覆盖效率越高,则相邻抽样点的召回子区域中重复召回的待召回对象少,可以减少抽样点的数量,进而提高巡检的效率。基于此,在本实施例中,通过覆盖率和覆盖效率该两个覆盖率数据来确定目标抽样数n0,以满足尽量少的抽样点n覆盖尽量多的待召回对象。在本实施例中,并不限定根据覆盖率和覆盖效率综合确定目标抽样数的具体方式,本领域技术人员应该理解的是,凡是可以满足上述“尽量少的抽样点n覆盖尽量多的待召回对象”的确定方式均包含在本实施例范围之内。
进一步,在本发明的一些可选的实施例中,通过如下公式计算各个抽样数对应的综合评估值:
式中,b为覆盖率和覆盖效率的重要程度比值(b>0),ce为覆盖率,re为覆盖效率,其中,b=1时,覆盖率和覆盖效率的重要程度相同,b>1时,覆盖率的重要程度大于覆盖效率的重要程度,b<1时,覆盖率的重要程度等于覆盖效率的重要程度;
在这些可选的实施例中,根据覆盖率和覆盖效率,计算多个抽样数分别对应的综合评估值,从多个抽样数中选择出使综合评估值位于0至1之间,且综合评估值最小的抽样数并确定为目标抽样数,使得在满足抽样点少且覆盖的待召回对象多的情况下,进一步满足对覆盖率和覆盖效率的重要程度的要求。
另外,在本发明的另一些可选的实施例中,计算综合评估值的公式也可以如下:
式中,ce为覆盖率,re为覆盖效率,其余确定目标抽样数的原理同上。
需要在此说明的是,上述图3的实施例仅对与图2的实施例的不同之处进行了详细说明,而其余未详细说明的部分,与图2的实施例中相应部分的实施原理及过程相同,具体可参见图2中相应部分的说明,此处不再赘述。
根据本实施例提供的召回区域的抽样处理方法,通过设置任一召回区域的多个抽样数,并针对任一抽样数对该召回区域内待召回对象的位置数据进行聚类处理,得到n个聚类中心的位置数据,进而可以确保聚类中心的分布与待召回对象的分布是吻合的,而避免在不存在待召回对象的范围内确定出抽样点,有利于准确的进行巡检;以及,在得到n个聚类中心的位置数据后,查询属于各个聚类中心的召回子区域内的待召回对象,并统计得到待召回对象的覆盖率和覆盖效率,以用于确定该抽样数n是否合理;将使综合指标值最小的抽样数确定为目标抽样数n0,以及将目标抽样数对应聚类得到的n0个聚类中心输出为巡检时的n0个抽样点,使得n0个抽样点满足抽样点数少且覆盖的召回区域的待召回对象多,进而可以使得确定的抽样点的数量更为合理。由此可见,本实施例方案,通过对待召回对象的位置数据进行聚类处理来确定抽样点,则该抽样点与待召回对象的分布吻合,则利用该抽样点可准确的进行巡检;以及,根据覆盖率数据选择目标抽样数,可以提高抽样点数量确定的合理性,避免过多和/或过少的确定抽样点而影响巡检的效率和准确度。
需要在此说明的是,上述图2的实施例以覆盖率来确定目标抽样数,图3的实施例以覆盖率和覆盖效率的综合指标来确定目标抽样数,但是,本发明并不以此为限,在一些其它可选的实施例中,也可以单独使用覆盖效率来确定目标抽样数。
图4示出了本发明一个实施例提供的召回接口的巡检方法的流程图。如图4所示,该方法包括以下步骤:
步骤S410:获取各个召回区域的抽样位置。
其中,抽样位置可通过前文中图1至图3中任一实施例的召回区域的抽样处理方法来得到,此处不再赘述。
步骤S420:向召回接口发送携带该抽样位置的巡检请求,接收召回接口返回的巡检结果。
其中,巡检结果是指召回的待召回对象的返回值。
步骤S430:根据该巡检结果检测召回接口的工作状态是否异常。
根据本实施例提供的召回接口的巡检方法,利用前文召回区域的抽样处理方法得到召回区域的抽样位置,并从这些抽样位置发起调用召回接口的巡检请求,根据召回接口返回的巡检结果检测召回结果的正常与否。其中,n0个抽样点的附近均存在待召回对象,且该n0个抽样点满足尽量少的抽样点覆盖尽量多的待召回对象的要求,则可以提高巡检的效率和准确性。
图5示出了本发明实施例提供的召回区域的抽样处理装置的结构示意图。
如图5所示,该装置包括:
获取模块510,适于获取任一召回区域内待召回对象的位置数据;
设置模块520,适于设置所述召回区域对应的多个抽样数;
聚类模块530,适于针对任一抽样数n,根据所述召回区域内待召回对象的位置数据进行聚类处理,得到n个聚类中心的位置数据;其中,n为大于0的自然数;
统计模块540,适于查询属于各个聚类中心的召回子区域内的待召回对象,根据查询结果统计所述召回区域内的待召回对象的覆盖率数据;
确定模块550,适于根据覆盖率数据从多个抽样数中确定目标抽样数,将所述目标抽样数对应的聚类中心的位置数据输出为所述召回区域的抽样位置。
在一种可选的实施方式中,所述统计模块进一步适于:
根据查询结果统计所述召回区域内的待召回对象的覆盖率;其中,所述覆盖率根据所述召回区域中n个聚类中心的召回子区域内被召回的待召回对象的非重复数量,与所述召回区域内待召回对象的总数量的比值计算得到。
在一种可选的实施方式中,所述确定模块进一步适于:
根据所述覆盖率随抽样数的变化趋势,从多个抽样数中确定目标抽样数n。
在一种可选的实施方式中,所述统计模块进一步适于:
根据查询结果统计所述召回区域内的待召回对象的覆盖效率;其中,所述覆盖效率根据所述召回区域中n个聚类中心的召回子区域内被召回的待召回对象的非重复数量,与所述召回区域内n个聚类中心的召回子区域内被召回的待召回对象的数量之和的比值计算得到。
在一种可选的实施方式中,所述确定模块进一步适于:
根据覆盖率以及覆盖效率,从多个抽样数中确定目标抽样数。
在一种可选的实施方式中,通过如下公式计算各个抽样数对应的综合评估值E:
式中,b为覆盖率和覆盖效率的重要程度比值,ce为覆盖率,re为覆盖效率;
所述去确定模块进一步适于:根据覆盖率和覆盖效率,计算多个抽样数分别对应的综合评估值;从多个抽样数中选择出使综合评估值位于0至1之间,且综合评估值最小的抽样数并确定为目标抽样数。
在一种可选的实施方式中,所述装置还包括:
划分模块,适于根据召回维度对多个待召回对象进行分区处理,得到至少一个召回区域内包含的待召回对象。
图6示出了本发明实施例提供的召回接口的巡检装置的结构示意图。如图6所示,该装置包括:
获取模块610,适于获取各个召回区域的抽样位置;
发送模块620,适于向召回接口发送携带所述抽样位置的巡检请求;
接收模块630,适于接收召回接口返回的巡检结果;
检测模块640,适于根据所述巡检结果检测召回接口的工作状态是否异常。
本发明实施例提供了一种非易失性计算机存储介质,所述计算机存储介质存储有至少一可执行指令,该计算机可执行指令可执行上述任意方法实施例中的召回区域的抽样处理方法。
本发明实施例提供了一种非易失性计算机存储介质,所述计算机存储介质存储有至少一可执行指令,该计算机可执行指令可执行上述任意方法实施例中的召回接口的巡检方法。
图7示出了本发明实施例提供的计算设备的结构示意图,本发明具体实施例并不对计算设备的具体实现做限定。
如图7所示,该计算设备可以包括:处理器(processor)702、通信接口(Communications Interface)704、存储器(memory)706、以及通信总线708。
其中:处理器702、通信接口704、以及存储器706通过通信总线708完成相互间的通信。通信接口704,用于与其它设备比如客户端或其它服务器等的网元通信。处理器702,用于执行程序710,具体可以执行上述用于计算设备的召回区域的抽样处理方法实施例中的相关步骤。
具体地,程序710可以包括程序代码,该程序代码包括计算机操作指令。
处理器702可能是中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。计算设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器706,用于存放程序710。存储器706可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序710具体可以用于使得处理器702执行以下操作:
获取任一召回区域内待召回对象的位置数据;
设置所述召回区域对应的多个抽样数;
针对任一抽样数n,根据所述召回区域内待召回对象的位置数据进行聚类处理,得到n个聚类中心的位置数据,其中,n为大于0的自然数;
查询属于各个聚类中心的召回子区域内的待召回对象,根据查询结果统计所述召回区域内的待召回对象的覆盖率数据;
根据覆盖率数据从多个抽样数中确定目标抽样数,将所述目标抽样数对应的聚类中心的位置数据输出为所述召回区域的抽样位置。
在一种可选的方式中,所述程序710使所述处理器执行以下操作:
根据查询结果统计所述召回区域内的待召回对象的覆盖率;其中,所述覆盖率根据所述召回区域中n个聚类中心的召回子区域内被召回的待召回对象的非重复数量,与所述召回区域内待召回对象的总数量的比值计算得到。
在一种可选的方式中,所述程序710使所述处理器执行以下操作:
根据所述覆盖率随抽样数的变化趋势,从多个抽样数中确定目标抽样数n。
在一种可选的方式中,所述程序710使所述处理器执行以下操作:
根据查询结果统计所述召回区域内的待召回对象的覆盖效率;其中,所述覆盖效率根据所述召回区域中n个聚类中心的召回子区域内被召回的待召回对象的非重复数量,与所述召回区域内n个聚类中心的召回子区域内被召回的待召回对象的数量之和的比值计算得到。
在一种可选的方式中,所述程序710使所述处理器执行以下操作:
根据覆盖率以及覆盖效率,从多个抽样数中确定目标抽样数。
在一种可选的方式中,通过如下公式计算各个抽样数对应的综合评估值E:
式中,b为覆盖率和覆盖效率的重要程度比值,ce为覆盖率,re为覆盖效率;
所述程序710使所述处理器执行以下操作:根据覆盖率和覆盖效率,计算多个抽样数分别对应的综合评估值;从多个抽样数中选择出使综合评估值位于0至1之间,且综合评估值最小的抽样数并确定为目标抽样数。
在一种可选的方式中,所述程序710使所述处理器执行以下操作:
根据召回维度对多个待召回对象进行分区处理,得到至少一个召回区域内包含的待召回对象。
图8示出了本发明实施例提供的计算设备的结构示意图,本发明具体实施例并不对计算设备的具体实现做限定。
如图8所示,该计算设备可以包括:处理器(processor)802、通信接口(Communications Interface)804、存储器(memory)806、以及通信总线808。
其中:处理器802、通信接口804、以及存储器806通过通信总线808完成相互间的通信。通信接口804,用于与其它设备比如客户端或其它服务器等的网元通信。处理器802,用于执行程序810,具体可以执行上述用于计算设备的召回接口的巡检方法实施例中的相关步骤。
具体地,程序810可以包括程序代码,该程序代码包括计算机操作指令。
处理器802可能是中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。计算设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器806,用于存放程序810。存储器806可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序810具体可以用于使得处理器802执行以下操作:
根据上述任一项所述的召回区域的抽样处理方法,获取各个召回区域的抽样位置;
向召回接口发送携带所述抽样位置的巡检请求,获取召回接口返回的巡检结果;
根据所述巡检结果检测召回接口的工作状态是否异常。
在此提供的算法或显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明实施例也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明实施例的内容,并且上面对特定语言所做的描述是为了披露本发明实施例的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本发明实施例并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明实施例的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明实施例要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的一些或者全部部件的一些或者全部功能。本发明实施例还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明实施例的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明实施例进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明实施例可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。上述实施例中的步骤,除有特殊说明外,不应理解为对执行顺序的限定。
Claims (20)
1.一种召回区域的抽样处理方法,包括:
获取任一召回区域内待召回对象的位置数据;
设置所述召回区域对应的多个抽样数;
针对任一抽样数n,根据所述召回区域内待召回对象的位置数据进行聚类处理,得到n个聚类中心的位置数据,其中,n为大于0的自然数;
查询属于各个聚类中心的召回子区域内的待召回对象,根据查询结果统计所述召回区域内的待召回对象的覆盖率数据;其中,所述召回子区域为对象召回接口的查找匹配范围;
根据覆盖率数据从多个抽样数中确定目标抽样数,将所述目标抽样数对应的聚类中心的位置数据输出为在所述召回区域对对象召回接口进行巡检的抽样位置。
2.根据权利要求1所述的方法,其中,所述根据查询结果统计所述召回区域内的待召回对象的覆盖率数据进一步包括:
根据查询结果统计所述召回区域内的待召回对象的覆盖率;其中,所述覆盖率根据所述召回区域中n个聚类中心的召回子区域内被召回的待召回对象的非重复数量,与所述召回区域内待召回对象的总数量的比值计算得到。
3.根据权利要求2所述的方法,其中,所述根据覆盖率数据从多个抽样数中确定目标抽样数进一步包括:
根据所述覆盖率随抽样数的变化趋势,从多个抽样数中确定目标抽样数。
4.根据权利要求2所述的方法,其中,所述根据查询结果统计所述召回区域内的待召回对象的覆盖率数据进一步包括:
根据查询结果统计所述召回区域内的待召回对象的覆盖效率;其中,所述覆盖效率根据所述召回区域中n个聚类中心的召回子区域内被召回的待召回对象的非重复数量,与所述召回区域内n个聚类中心的召回子区域内被召回的待召回对象的数量之和的比值计算得到。
5.根据权利要求4所述的方法,其中,所述根据覆盖率数据从多个抽样数中确定目标抽样数进一步包括:
根据覆盖率以及覆盖效率,从多个抽样数中确定目标抽样数。
7.根据权利要求1-6任一项所述的方法,其中,在所述获取任一召回区域内待召回对象的位置数据之前,所述方法还包括:
根据召回维度对多个待召回对象进行分区处理,得到至少一个召回区域内包含的待召回对象。
8.一种召回接口的巡检方法,包括:
根据权利要求1-7任一项所述的方法,获取各个召回区域的抽样位置;
向召回接口发送携带所述抽样位置的巡检请求,获取召回接口返回的巡检结果;
根据所述巡检结果检测召回接口的工作状态是否异常。
9.一种召回区域的抽样处理装置,包括:
获取模块,适于获取任一召回区域内待召回对象的位置数据;
设置模块,适于设置所述召回区域对应的多个抽样数;
聚类模块,适于针对任一抽样数n,根据所述召回区域内待召回对象的位置数据进行聚类处理,得到n个聚类中心的位置数据;其中,n为大于0的自然数;
统计模块,适于查询属于各个聚类中心的召回子区域内的待召回对象,根据查询结果统计所述召回区域内的待召回对象的覆盖率数据;其中,所述召回子区域为对象召回接口的查找匹配范围;
确定模块,适于根据覆盖率数据从多个抽样数中确定目标抽样数,将所述目标抽样数对应的聚类中心的位置数据输出为在所述召回区域对对象召回接口进行巡检的抽样位置。
10.根据权利要求9所述的装置,其中,所述统计模块进一步适于:
根据查询结果统计所述召回区域内的待召回对象的覆盖率;其中,所述覆盖率根据所述召回区域中n个聚类中心的召回子区域内被召回的待召回对象的非重复数量,与所述召回区域内待召回对象的总数量的比值计算得到。
11.根据权利要求10所述的装置,其中,所述确定模块进一步适于:
根据所述覆盖率随抽样数的变化趋势,从多个抽样数中确定目标抽样数。
12.根据权利要求10所述的装置,其中,所述统计模块进一步适于:
根据查询结果统计所述召回区域内的待召回对象的覆盖效率;其中,所述覆盖效率根据所述召回区域中n个聚类中心的召回子区域内被召回的待召回对象的非重复数量,与所述召回区域内n个聚类中心的召回子区域内被召回的待召回对象的数量之和的比值计算得到。
13.根据权利要求12所述的装置,其中,所述确定模块进一步适于:
根据覆盖率以及覆盖效率,从多个抽样数中确定目标抽样数。
15.根据权利要求9-14任一项所述的装置,其中,所述装置还包括:
划分模块,适于根据召回维度对多个待召回对象进行分区处理,得到至少一个召回区域内包含的待召回对象。
16.一种召回接口的巡检装置,包括:
获取模块,适于利用权利要求9-15任一项所述的装置获取各个召回区域的抽样位置;
发送模块,适于向召回接口发送携带所述抽样位置的巡检请求;
接收模块,适于接收召回接口返回的巡检结果;
检测模块,适于根据所述巡检结果检测召回接口的工作状态是否异常。
17.一种计算设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如权利要求1-7中任一项所述的召回区域的抽样处理方法对应的操作。
18.一种计算设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如权利要求8所述的召回接口的巡检方法对应的操作。
19.一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如权利要求1-7中任一项所述的召回区域的抽样处理方法对应的操作。
20.一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如权利要求8所述的召回接口的巡检方法对应的操作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911368199.2A CN111008675B (zh) | 2019-12-26 | 2019-12-26 | 召回区域的抽样处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911368199.2A CN111008675B (zh) | 2019-12-26 | 2019-12-26 | 召回区域的抽样处理方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111008675A CN111008675A (zh) | 2020-04-14 |
CN111008675B true CN111008675B (zh) | 2020-11-24 |
Family
ID=70118503
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911368199.2A Active CN111008675B (zh) | 2019-12-26 | 2019-12-26 | 召回区域的抽样处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111008675B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113822098A (zh) * | 2020-06-18 | 2021-12-21 | 口碑(上海)信息技术有限公司 | 区域巡检方法和装置、电子设备 |
CN113689232B (zh) * | 2021-07-27 | 2023-07-28 | 阿里巴巴华北技术有限公司 | 对人群召回服务进行检测的方法、装置及电子设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1731403A (zh) * | 2005-08-31 | 2006-02-08 | 中国科学院东北地理与农业生态研究所 | 基于垄向平行的作物种植成数gps样带地面采集方法 |
CN101547450A (zh) * | 2009-05-08 | 2009-09-30 | 广东省电信规划设计院有限公司 | 移动通信网络的位置区划分方法及装置 |
CN104581743A (zh) * | 2015-01-04 | 2015-04-29 | 中国联合网络通信集团有限公司 | 一种实现wlan部署的方法及装置 |
CN106570053A (zh) * | 2016-09-22 | 2017-04-19 | 山东浪潮云服务信息科技有限公司 | 一种网络数据采集验证方法 |
CN107491895A (zh) * | 2017-08-30 | 2017-12-19 | 国信优易数据有限公司 | 一种共享单车停放点的确定方法及装置 |
CN107609687A (zh) * | 2017-08-25 | 2018-01-19 | 中国农业大学 | 一种农作物品种测试站点布局方法及装置 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102063374A (zh) * | 2011-01-07 | 2011-05-18 | 南京大学 | 一种使用半监督信息进行聚类的回归测试用例选择方法 |
CN102831431A (zh) * | 2012-02-05 | 2012-12-19 | 四川大学 | 一种基于层次聚类的检测器训练方法 |
CN104167092B (zh) * | 2014-07-30 | 2016-09-21 | 北京市交通信息中心 | 一种确定出租车上下客热点区域中心的方法以及装置 |
CN109117895A (zh) * | 2018-09-05 | 2019-01-01 | 奇瑞汽车股份有限公司 | 数据聚类方法、装置及存储介质 |
CN110430020A (zh) * | 2019-08-07 | 2019-11-08 | 北京运安智维科技有限公司 | 基于cqi统计信息的自适应计算集群调度mcs的方法 |
-
2019
- 2019-12-26 CN CN201911368199.2A patent/CN111008675B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1731403A (zh) * | 2005-08-31 | 2006-02-08 | 中国科学院东北地理与农业生态研究所 | 基于垄向平行的作物种植成数gps样带地面采集方法 |
CN101547450A (zh) * | 2009-05-08 | 2009-09-30 | 广东省电信规划设计院有限公司 | 移动通信网络的位置区划分方法及装置 |
CN104581743A (zh) * | 2015-01-04 | 2015-04-29 | 中国联合网络通信集团有限公司 | 一种实现wlan部署的方法及装置 |
CN106570053A (zh) * | 2016-09-22 | 2017-04-19 | 山东浪潮云服务信息科技有限公司 | 一种网络数据采集验证方法 |
CN107609687A (zh) * | 2017-08-25 | 2018-01-19 | 中国农业大学 | 一种农作物品种测试站点布局方法及装置 |
CN107491895A (zh) * | 2017-08-30 | 2017-12-19 | 国信优易数据有限公司 | 一种共享单车停放点的确定方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN111008675A (zh) | 2020-04-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10405033B2 (en) | Method for controlling network media information publication, apparatus, and server | |
JP2016503937A (ja) | 活動領域の検索および決定 | |
CN111008675B (zh) | 召回区域的抽样处理方法及装置 | |
CN111163072B (zh) | 机器学习模型中特征值的确定方法、装置及电子设备 | |
CN110188862B (zh) | 用于数据处理的模型超参数的搜索方法、装置、系统 | |
CN108764348B (zh) | 基于多个数据源的数据采集方法及系统 | |
CN110990584A (zh) | 知识图谱的生成方法及装置 | |
CN110515631B (zh) | 应用安装数据包的生成方法、服务器及计算机存储介质 | |
CN112203324B (zh) | 一种基于位置指纹库的mr定位方法及装置 | |
CN110334104B (zh) | 一种榜单更新方法、装置、电子设备及存储介质 | |
CN110427574B (zh) | 路线相似度确定方法、装置、设备和介质 | |
CN113132891A (zh) | 一种基于移动信令的客流统计方法和系统 | |
CN113032514B (zh) | 兴趣点数据处理方法及装置 | |
CN113822098A (zh) | 区域巡检方法和装置、电子设备 | |
CN110909072B (zh) | 一种数据表建立方法、装置及设备 | |
CN113689526B (zh) | 地图中无效区域的划分方法及装置、电子设备 | |
CN113132762B (zh) | 留存行为因素分析方法、装置、电子设备和可读存储介质 | |
CN114577988A (zh) | 一种纯蒸汽取样方法及系统 | |
CN111581245B (zh) | 一种数据搜索方法以及装置 | |
CN111695044A (zh) | 用户排名的数据处理方法、装置及电子设备 | |
CN110852807A (zh) | 用户确定方法、装置、计算机设备及存储介质 | |
CN113360356B (zh) | 阅读作弊行为的识别方法、计算设备及计算机存储介质 | |
CN111104528A (zh) | 图片获取方法、装置及客户端 | |
CN113722631B (zh) | 页面合成方法及装置 | |
CN111831760B (zh) | 处理位置数据的方法及相应的装置、计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |