CN111881240B - 兴趣点采全率预测方法、装置、设备和可读存储介质 - Google Patents
兴趣点采全率预测方法、装置、设备和可读存储介质 Download PDFInfo
- Publication number
- CN111881240B CN111881240B CN202010699993.1A CN202010699993A CN111881240B CN 111881240 B CN111881240 B CN 111881240B CN 202010699993 A CN202010699993 A CN 202010699993A CN 111881240 B CN111881240 B CN 111881240B
- Authority
- CN
- China
- Prior art keywords
- interest
- points
- user
- acquisition
- acquired
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 86
- 238000003860 storage Methods 0.000 title claims abstract description 16
- 230000008569 process Effects 0.000 claims abstract description 38
- 230000006399 behavior Effects 0.000 claims abstract description 29
- 238000012549 training Methods 0.000 claims description 20
- 230000015654 memory Effects 0.000 claims description 19
- 238000009826 distribution Methods 0.000 claims description 18
- 238000012550 audit Methods 0.000 claims description 11
- 238000005070 sampling Methods 0.000 claims description 11
- 238000010801 machine learning Methods 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 8
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 238000004590 computer program Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000004091 panning Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 208000008918 voyeurism Diseases 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Remote Sensing (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请实施例公开了一种兴趣点采全率预测方法、装置、设备和可读存储介质,涉及机器学习和电子地图技术领域。具体实现方案为:获取用户采集兴趣点过程中的特征集合,所述特征集合包括用户采集行为特征和已采集兴趣点的特征中的至少一项;将所述特征集合输入至采全率预测模型,得到所述用户的兴趣点采全率。本申请实施例可以提高兴趣点采全率的预测准确率。
Description
技术领域
本申请涉及机器学习和电子地图技术领域,尤其涉及兴趣点采全率预测方法、装置、设备和可读存储介质。
背景技术
坐标作为POI(Point of Information,兴趣点)最关键的属性之一,其准确度直接影响地图用户的使用体验,同时POI坐标的准确度也是衡量一个地图产品好坏的直观判断因素。当前地图POI数据大规模更新主要依赖于实采手段,包括全景、行车记录仪、路淘等车行采集,以及淘金、等人行采集。
现有技术中,执行兴趣点采集任务的用户为广大互联网用户,其作业能力、作业意愿难以把控,需要一种手段去衡量采集任务的完成程度是多少,是否有遗漏的兴趣点,来决定采集是否达标,同时也决定对用户进行何种程度的奖惩。
发明内容
本申请实施例提供了一种兴趣点采全率预测方法、装置、设备和可读存储介质。
第一方面,本申请实施例提供了一种兴趣点采全率预测方法,包括:
获取用户采集兴趣点过程中的特征集合,所述特征集合包括用户采集行为特征和已采集兴趣点的特征中的至少一项;
将所述特征集合输入至采全率预测模型,得到所述用户的兴趣点采全率;
其中,所述采全率预测模型通过指定用户采集兴趣点过程中的特征集合和所述指定用户的兴趣点采全率进行训练得到。
第二方面,本申请实施例还提供了一种兴趣点采全率预测装置,包括:
获取模块,用于获取用户采集兴趣点过程中的特征集合,所述特征集合包括用户采集行为特征和已采集兴趣点的特征中的至少一项;
输入模块,用于将所述特征集合输入至采全率预测模型,得到所述用户的兴趣点采全率;
其中,所述采全率预测模型通过指定用户采集兴趣点过程中的特征集合和所述指定用户的兴趣点采全率进行训练得到。
第三方面,本申请实施例提供了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行任一实施例所提供的一种兴趣点采全率预测方法。
第四方面,本申请实施例提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行任一实施例所提供的一种兴趣点采全率预测方法。
根据本申请的技术可以提高兴趣点采全率的预测准确率。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1是本申请实施例中的第一种兴趣点采全率预测方法的流程图;
图2是本申请实施例中的第二种兴趣点采全率预测方法的流程图;
图3a是本申请实施例中的第三种兴趣点采全率预测方法的流程图;
图3b是本申请实施例中采集区域中用户采集轨迹与覆盖网格的示意图;
图4a是本申请实施例中的第四种兴趣点采全率预测方法的流程图;
图4b是本申请实施例中的指定用户A和指定用户B采集的兴趣点总数的示意图;
图5是本申请实施例中的兴趣点采全率预测装置的结构图;
图6是本申请实施例中的电子设备的结构示意图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
根据本申请的实施例,图1是本申请实施例中的第一种兴趣点采全率预测方法的流程图,本申请实施例适用于在实采场景中对用户采集兴趣点的采全率进行预测的情况。该方法通过兴趣点采全率预测装置执行,该装置采用软件和/或硬件实现,并具体配置于具备一定数据运算能力的电子设备中。
如图1所示的兴趣点采全率预测方法,包括:
S110、获取用户采集兴趣点过程中的特征集合,特征集合包括用户采集行为特征和已采集兴趣点的特征中的至少一项。
本实施例中,用户通过配置有摄像头的终端设备对现实场景中的地物进行拍摄,得到图像,并将图像发送至电子设备(如服务器),通过电子设备识别到图像中的兴趣点,如某个商店的招牌,则认为用户采集到该兴趣点。
由于用户的作业能力和作业意愿难以把控,在一次采集过程中,用户可能采集到所有的兴趣点,或者采集到90%的兴趣点,或者仅采集到一半的兴趣点,然而兴趣点的总数和分布情况也是未知的,这导致难以评估用户对兴趣点的采全率,即已采集兴趣点的数量占兴趣点总数的比率。
在研究过程中,发明人创造性地发现了影响采全率的特征集合,进而通过模型预测的方法预测采全率。具体的,特征集合包括用户采集行为特征和已采集兴趣点的特征中的至少一项。其中,用户采集行为特征指用户采集兴趣点过程中有关用户行为方式的特征。用户采集行为特征能够反映用户的作业态度和作业能力,这关乎用户是否能够或愿意采集到尽量多的兴趣点,是否有能力采集到隐蔽的兴趣点,从而直接影响最终兴趣点的采全率。已采集兴趣点的特征指用户已经采集到的兴趣点的相关特征。已采集到的兴趣点是全部兴趣点的子集,则由点窥面,已采集到的兴趣点的特征可以扩大到全部兴趣点的特征,从而直接影响最终兴趣点的采全率。
考虑到不同用户的作业能力和作业意愿不同,且同一用户在多次采集同一区域内的兴趣点时,会多少受到前次采集情况的影响。基于此,为了提高采全率预测的准确性,排除其他因素的干扰,获取单用户在采集区域内单次采集过程中的特征集合。其中,采集区域可以预先划定,例如一条街或一个社区。
S120、将特征集合输入至采全率预测模型,得到用户的兴趣点采全率。
采全率预测模型通过指定用户采集兴趣点过程中的特征集合和指定用户的兴趣点采全率进行训练得到。其中,指定用户为指定的参与模型训练的用户,为提高模型的泛化能力,指定用户来自于各行业、地区,接受的教育程度不同,使得指定用户的作业能力和作业意愿不同。指定用户的数量较多,以期得到高精度的采全率预测模型。
指定用户采集兴趣点过程中的特征集合为指定用户在指定采集区域内单次采集过程中的特征集合,其中,指定采集区域可以是一条街或一个社区。需要说明的是,经过试验,用户在不同尺寸的采集区域内的采全率差别较小,可见,区域尺寸对采全率的影响不大,因此,前述采集区域与模型训练时的指定采集区域的尺寸可以相同也可以不同。
需要说明的是,不同指定用户可以在同一指定采集区域内采集兴趣点,并互不干扰;也可以在不同指定采集区域内采集兴趣点。不同指定采集区域的面积可以相同也可以不同。
模型训练时的特征集合包括指定用户采集行为特征和指定用户已采集兴趣点的特征中的至少一项。具体描述详细上述用户采集兴趣点过程中的特征集合,此处不再赘述。
指定用户的兴趣点采全率作为模型训练时的标签,为指定用户已采集兴趣点的数量占指定采集区域内兴趣点总数的比率。其中,指定采集区域内兴趣点总数是预先获知的已知量。
可选的,利用机器学习算法构建采全率预测模型,通过机器学习回归算法,例如XGBoost(eXtreme Gradient Boosting,极端梯度提升)回归算法,训练该模型。
训练完成后的采全率预测模型用于对新的用户采集兴趣点过程中的特征集合进行预测,得到用户的兴趣点采全率。
本实施例创造性地发现影响采全率的用户采集行为特征和已采集兴趣点的特征,则通过模型预测的方法,结合上述特征集合能够准确预测新用户的采全率;在实际应用场景中,能够有效节省采集评估的成本。
根据本申请的实施例,图2是本申请实施例中的第二种兴趣点采全率预测方法的流程图,本申请实施例在上述各实施例的技术方案的基础上对已采集兴趣点的特征进行优化。
图2所示的兴趣点采全率预测方法,具体包括以下操作:
S210、获取用户采集兴趣点过程中的特征集合,特征集合包括用户采集行为特征和已采集兴趣点的特征中的至少一项;已采集兴趣点的特征包括已采集兴趣点的数量特征、已采集兴趣点的分布特征和已采集兴趣点的质量特征中的至少一项。
其中,已采集兴趣点的数量特征反映了已采集兴趣点的多少,已采集兴趣点的数量越多,采全率也就越高。可选的,已采集兴趣点的数量特征包括:已采集兴趣点中的指定兴趣点个数占指定兴趣点总数的比率,和/或已采集兴趣点中除历史兴趣点之外的新增兴趣点个数占已采集兴趣点总数的比率。
其中,采集区域内预先指定多个近期被其他来源(如人工、其他用户或快递)验真的兴趣点,称为指定兴趣点,又称为暗桩。统计用户采集到的暗桩个数,并计算暗桩个数与暗桩总数的比率,作为暗桩回收率,即本实施例中的指定兴趣点个数占指定兴趣点总数的比率。本实施例通过预先指定兴趣点,并计算预先指定兴趣点的回收率,反映出用户对指定兴趣点的采全率,进而间接反映出用户对所有兴趣点的采全率。
历史兴趣点为在历史时刻存在于采集区域内的兴趣点,当前时刻可能有些新的兴趣点加入。显然,采集到这些新的兴趣点的数量影响了兴趣点的采全率。具体的,将用户采集到的兴趣点与采集区域内历史兴趣点进行对比,找到历史未覆盖的兴趣点(也就是新增兴趣点),统计采集区域内新增兴趣点个数,并计算新增兴趣点个数占已采集兴趣点总数的比率。值得说明的是,此处已采集兴趣点可以是审核通过的兴趣点。对兴趣点的审核过程将在下述段落中记载。
已采集兴趣点的分布特征指在采集区域内的分布情况,分布特征表明了用户在哪些地方采集到较多的兴趣点,在哪些地方采集到较少的兴趣点,甚至没有采集到兴趣点。按照现实场景中的采集区域中兴趣点一般是接近均匀分布的,则已采集兴趣点分布越均匀,采全率也会越高。可选的,已采集兴趣点的分布特征包括:已采集兴趣点的凸包面积占采集区域总面积的比率,和/或在采集区域中指定区域采集到的兴趣点数量占已采集兴趣点总数的比率。
其中,用户在采集区域内采集到的所有兴趣点的定位可以组成多个点的集合,求出点集合的凸包。计算凸包的面积占采集区域总面积的比率。
指定区域可以是采集区域内的任一区域,指定区域采集到的兴趣点数量占已采集兴趣点总数的比率反映了兴趣点的局部区域分布,进而由局部到整体,能够反映已采集兴趣点在整个采集区域内的分布。可选的,指定区域为采集区域中除设定区域外的剩余区域,设定区域可以为具有兴趣点承载能力的区域,如建筑物区域。相反,剩余区域为不具有兴趣点承载能力的区域,如路网、水系或者裸露土地上。一般不会在剩余区域采集到兴趣点;但是,如果已采集兴趣点中包含大量的剩余区域内的兴趣点,则说明了用户在可能不存在兴趣点的区域采集到兴趣点,体现了该用户较强的作业能力和良好的作业意愿,则该用户的兴趣点采全率应较高。
在一具体应用场景中,用户在上传图像时还上传该图像拍摄时的定位,作为图像内兴趣点的定位。基于兴趣点的定位可以计算兴趣点的凸包,以及通过比较兴趣点的定位和指定区域的定位,统计指定区域内兴趣点的数量。
已采集兴趣点的质量特征指从图像中识别到的兴趣点的质量特征,例如兴趣点是否完整,语法上是否合规。影响已采集兴趣点的质量特征的主要因素是图像质量,如图像拍摄模糊,图像拍摄不完整,这与用户的作业意愿或作业态度息息相关。基于此,已采集兴趣点的质量特征反映了用户的作业意愿或作业态度,进而影响兴趣点采全率。可选的,已采集兴趣点的质量特征包括:已采集兴趣点中质量审核通过的兴趣点占已采集兴趣点总数的比率。其中,对已采集兴趣点的质量审核包括清晰度审核,以及完整性和合规性审核。
在一具体应用场景中,获取用户上传的图像的清晰度和兴趣点是否具有完整性和合规性,清晰度可以用分辨率表征。例如“省第一医院”是完整的,“省第一医”是不完整的。“省第医院”在语法上不合规,“省第一医院”在语法上合规。如果清晰度大于设定阈值,且兴趣点具有完整性和合规性,则该兴趣点是质量审核通过的兴趣点。反之,若清晰度不大于设定阈值,或者兴趣点不具有完整性和合规性,则该兴趣点是质量审核不通过的兴趣点。
S220、将特征集合输入至采全率预测模型,得到用户的兴趣点采全率。
此处的特征集合详见S210中的记载。相应的,采全率预测模型在训练的时候所使用的特征集合也如S210中的记载,包括用户采集行为特征和已采集兴趣点的特征中的至少一项;已采集兴趣点的特征包括已采集兴趣点的数量特征、已采集兴趣点的分布特征和已采集兴趣点的质量特征中的至少一项。
本实施例将已采集兴趣点的特征细化到数量、分布和质量维度,挖掘出的数量、分布和质量维度的特征与兴趣点采全率的关系更为密切,更有利于得到更准确的采全率。
根据本申请的实施例,图3a是本申请实施例中的第三种兴趣点采全率预测方法的流程图,本实施例在上述实施例的基础上,对用户采集行为特征进行优化。
如图3a所示的兴趣点采全率预测方法,包括:
S310、获取用户采集兴趣点过程中的特征集合,特征集合包括用户采集行为特征和已采集兴趣点的特征中的至少一项;用户采集行为特征,包括用户采集轨迹特征、用户采集任务完成度特征和用户采集时长特征中的至少一项。
用户采集轨迹特征反映了用户采集兴趣点的位置特征,即拍摄图像的位置特征。如果用户采集轨迹遍布整个采集区域,则采全率比较高。可选的,用户采集轨迹特征包括:1)用户采集轨迹覆盖的区域面积占采集区域总面积的比率,或者2)用户采集轨迹覆盖的网格数量占采集区域中网格总数的比率;其中,采集区域包括多个网格。
可选的,将用户拍摄时的多个定位进行曲线拟合,得到用户采集轨迹,沿垂直于采集轨迹的方向延伸设定长度,如5米,构成以用户采集轨迹为中心的用户采集区域,并计算该用户采集区域的面积。计算用户采集区域的面积与采集区域总面积的比率。可选的,将采集区域平均划分为多个网格。图3b是本申请实施例中采集区域中用户采集轨迹与覆盖网格的示意图。计算用户采集轨迹所覆盖的网格数量,图3b中,用户拍摄时的多个定位用深色圆圈表示,黑色圆圈之间的连线表示采集轨迹。采集轨迹所覆盖的网格用深色填充,为6个,采集区域中网格总数为12个,则采全率为50%。
本实施例中,预先在采集区域投放多个采集任务,多个采集任务可以分布在不同的子区域(如具有兴趣点承载能力的区域),可以是对采集行为轨迹的规定任务,如环绕子区域一周为完成该子区域的采集任务,有利于采全兴趣点。基于此,用户采集任务完成度特征为用户对采集区域内投放的采集任务的完成程度,能够影响兴趣点的采全率。可选的,用户采集任务完成度特征包括:用户完成采集任务的数量占采集任务总数的比率。
用户采集时长特征反映了用户在采集区域内的总时长,也就是用户从进入采集区域内上传第一张图像开始,到上传最后一张图像所花费的总时长。总时长越长,即用户在采集区域内逗留的时长越长,越有利于采集到更多的兴趣点,进而提高采全率。
S320、将特征集合输入至采全率预测模型,得到用户的兴趣点采全率。
此处的特征集合详见S310中的记载。相应的,采全率预测模型在训练的时候所使用的特征集合也如S310中的记载,包括用户采集行为特征和已采集兴趣点的特征中的至少一项;用户采集行为特征,包括用户采集轨迹特征、用户采集任务完成度特征和用户采集时长特征中的至少一项。
本实施例将用户采集行为特征细化到采集轨迹、采集任务完成度和采集时长维度,挖掘出的采集轨迹、采集任务完成度和采集时长维度的特征与兴趣点采全率的关系更为密切,更有利于得到更准确的采全率。
根据本申请的实施例,图4a是本申请实施例中的第四种兴趣点采全率预测方法的流程图,本实施例在上述实施例的基础上,对采全率预测模型的预测过程进行优化。
如图4a所示的兴趣点采全率预测方法,包括:
S410、获取多个指定用户采集兴趣点过程中的特征集合和多个指定用户采集的兴趣点总数。
对于指定用户的描述详见上述实施例的记载,此处不再赘述。指定用户采集兴趣点过程中的特征集合包括用户采集行为特征和已采集兴趣点的特征中的至少一项。其中,用户采集行为特征包括用户采集轨迹特征、用户采集任务完成度特征和用户采集时长特征中的至少一项;已采集兴趣点的特征,包括:已采集兴趣点的数量特征、已采集兴趣点的分布特征和已采集兴趣点的质量特征中的至少一项。具体详见上述实施例的描述,此处不再赘述。
训练模型需要指定用户的兴趣点采全率作为标签,而兴趣点采全率的计算除了已采集兴趣点的数量外,还需要兴趣点的总数。在现实场景中,一个采集区域内的兴趣点常常处于动态变化中,存在历史兴趣点不再存在或者新的兴趣点加入的情况,因此,采集区域内实际的兴趣点总数是动态变化的量,且是未知的。为了获取到尽量接近实际的兴趣点总数的值,采用多个指定用户采集的兴趣点总数代替。
具体的,由于指定用户的作业能力参差不齐,往往只能采集到采集区域的部分兴趣点,但是通过不同用户对同一采集区域的多轮采集(一般2~3次),往往能得到一个采集区域内接近100%兴趣点全集,利用这个全集可以直接计算出单次的采全率,这里称这种计算方法为merge(归并)采全。
图4b是本申请实施例中的指定用户A和指定用户B采集的兴趣点总数的示意图。图4b中,指定用户A在一采集区域内采集到A个兴趣点,指定用户B在同一采集区域内采集到B个兴趣点,A个兴趣点和B个兴趣点之间具有交集A∩B。认为该采集区域内兴趣点总数为指定用户A与指定用户B采集的兴趣点总数A∪B。基于此,指定用户A的采全率R(A)如式(1)所示,指定用户B的采全率R(B)如式(2)所示。
S420、计算每个指定用户占兴趣点总数的比率,作为每个指定用户的兴趣点采全率。
S430、基于多个指定用户采集兴趣点过程中的特征集合和兴趣点采全率,训练采全率预测模型。
S440、获取用户采集兴趣点过程中的特征集合,特征集合包括用户采集行为特征和已采集兴趣点的特征中的至少一项。
S450、将特征集合输入至采全率预测模型,得到用户的兴趣点采全率。
本实施例中,利用不同指定用户对同一采集区域的多轮采集(一般2~3次),往往能得到一个采集区域内接近100%兴趣点全集的规律,采用merge采全算法,将多个指定用户采集到的兴趣点总数近似为实际的兴趣点总数,方法简单高效且精度高,有利于得到高精度的采全率预测模型,进而提高采全率预测的准确性。
根据本申请的实施例,图5是本申请实施例中的兴趣点采全率预测装置的结构图,本申请实施例适用于在实采场景中对用户采集兴趣点的采全率进行预测的情况,该装置采用软件和/或硬件实现,并具体配置于具备一定数据运算能力的电子设备中。
如图5所示的一种兴趣点采全率预测装置500,包括:获取模块501和输入模块502;其中,
获取模块501,用于获取用户采集兴趣点过程中的特征集合,特征集合包括用户采集行为特征和已采集兴趣点的特征中的至少一项;
输入模块502,用于将特征集合输入至采全率预测模型,得到用户的兴趣点采全率;其中,采全率预测模型通过指定用户采集兴趣点过程中的特征集合和指定用户的兴趣点采全率进行训练得到。
本实施例创造性地发现影响采全率的用户采集行为特征和已采集兴趣点的特征,则通过模型预测的方法,结合上述特征集合能够准确预测新用户的采全率;在实际应用场景中,能够有效节省采集评估的成本。
进一步的,已采集兴趣点的特征,包括:已采集兴趣点的数量特征、已采集兴趣点的分布特征和已采集兴趣点的质量特征中的至少一项。
进一步的,已采集兴趣点的数量特征包括:已采集兴趣点中的指定兴趣点个数占指定兴趣点总数的比率,和/或已采集兴趣点中除历史兴趣点之外的新增兴趣点个数占已采集兴趣点总数的比率;已采集兴趣点的分布特征包括:已采集兴趣点的凸包面积占采集区域总面积的比率,和/或在采集区域中指定区域采集到的兴趣点数量占已采集兴趣点总数的比率;已采集兴趣点的质量特征包括:已采集兴趣点中质量审核通过的兴趣点占已采集兴趣点总数的比率。
进一步的,用户采集行为特征,包括:用户采集轨迹特征、用户采集任务完成度特征和用户采集时长特征中的至少一项。
进一步的,用户采集轨迹特征包括:用户采集轨迹覆盖的区域面积占采集区域总面积的比率,或者用户采集轨迹覆盖的网格数量占采集区域中网格总数的比率;其中,采集区域包括多个网格;用户采集任务完成度特征包括:用户完成采集任务的数量占采集任务总数的比率。
进一步的,装置500还包括训练模块,用于:在获取用户采集兴趣点过程中的特征集合之前,获取多个指定用户采集兴趣点过程中的特征集合和多个指定用户采集的兴趣点总数;计算每个指定用户占兴趣点总数的比率,作为每个指定用户的兴趣点采全率;基于多个指定用户采集兴趣点过程中的特征集合和兴趣点采全率,训练采全率预测模型。
上述兴趣点采全率预测装置可执行本申请任意实施例所提供的兴趣点采全率预测方法,具备执行兴趣点采全率预测方法相应的功能模块和有益效果。
根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。
如图6所示,是实现本申请实施例的兴趣点采全率预测方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图6所示,该电子设备包括:一个或多个处理器601、存储器602,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个终端提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图6中以一个处理器601为例。
存储器602即为本申请所提供的非瞬时计算机可读存储介质。其中,存储器存储有可由至少一个处理器执行的指令,以使至少一个处理器执行本申请所提供的兴趣点采全率预测方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的兴趣点采全率预测方法。
存储器602作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的兴趣点采全率预测方法对应的程序指令/模块(例如,附图5所示的包括获取模块501和输入模块502)。处理器601通过运行存储在存储器602中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的兴趣点采全率预测方法。
存储器602可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储实现兴趣点采全率预测方法的电子设备的使用所创建的数据等。此外,存储器602可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器602可选包括相对于处理器601远程设置的存储器,这些远程存储器可以通过网络连接至执行兴趣点采全率预测方法的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
执行兴趣点采全率预测方法的电子设备还可以包括:输入装置603和输出装置604。处理器601、存储器602、输入装置603和输出装置604可以通过总线或者其他方式连接,图6中以通过总线连接为例。
输入装置603可接收输入的数字或字符信息,以及产生与执行兴趣点采全率预测方法的电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置604可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、互联网和区块链网络。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务中,存在的管理难度大,业务扩展性弱的缺陷。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。
Claims (6)
1.一种兴趣点采全率预测方法,包括:
获取用户采集兴趣点过程中的特征集合,所述特征集合包括用户采集行为特征和已采集兴趣点的特征中的至少一项;其中,所述已采集兴趣点的特征,包括,已采集兴趣点的数量特征、已采集兴趣点的分布特征和已采集兴趣点的质量特征中的至少一项;所述用户采集行为特征,包括,用户采集轨迹特征、用户采集任务完成度特征和用户采集时长特征中的至少一项;
将所述特征集合输入至采全率预测模型,得到所述用户的兴趣点采全率;
其中,所述采全率预测模型通过指定用户采集兴趣点过程中的特征集合和所述指定用户的兴趣点采全率进行训练得到;所述已采集兴趣点的数量特征包括:所述已采集兴趣点中的指定兴趣点个数占指定兴趣点总数的比率,和/或所述已采集兴趣点中除历史兴趣点之外的新增兴趣点个数占所述已采集兴趣点总数的比率;所述已采集兴趣点的分布特征包括:所述已采集兴趣点的凸包面积占采集区域总面积的比率,和/或在所述采集区域中指定区域采集到的兴趣点数量占所述已采集兴趣点总数的比率;所述已采集兴趣点的质量特征包括:已采集兴趣点中质量审核通过的兴趣点占已采集兴趣点总数的比率所述用户采集轨迹特征包括:用户采集轨迹覆盖的区域面积占采集区域总面积的比率,或者用户采集轨迹覆盖的网格数量占所述采集区域中网格总数的比率;其中,所述采集区域包括多个网格;所述用户采集任务完成度特征包括:所述用户完成采集任务的数量占采集任务总数的比率。
2.根据权利要求1任一项所述的方法,在所述获取用户采集兴趣点过程中的特征集合之前,还包括:
获取多个所述指定用户采集兴趣点过程中的特征集合和多个所述指定用户采集的兴趣点总数;
计算每个所述指定用户占所述兴趣点总数的比率,作为每个所述指定用户的兴趣点采全率;
基于多个所述指定用户采集兴趣点过程中的特征集合和兴趣点采全率,训练所述采全率预测模型。
3.一种兴趣点采全率预测装置,包括:
获取模块,用于获取用户采集兴趣点过程中的特征集合,所述特征集合包括用户采集行为特征和已采集兴趣点的特征中的至少一项;其中,所述已采集兴趣点的特征,包括,已采集兴趣点的数量特征、已采集兴趣点的分布特征和已采集兴趣点的质量特征中的至少一项;所述用户采集行为特征,包括,用户采集轨迹特征、用户采集任务完成度特征和用户采集时长特征中的至少一项;
输入模块,用于将所述特征集合输入至采全率预测模型,得到所述用户的兴趣点采全率;
其中,所述采全率预测模型通过指定用户采集兴趣点过程中的特征集合和所述指定用户的兴趣点采全率进行训练得到;所述已采集兴趣点的数量特征包括:所述已采集兴趣点中的指定兴趣点个数占指定兴趣点总数的比率,和/或所述已采集兴趣点中除历史兴趣点之外的新增兴趣点个数占所述已采集兴趣点总数的比率;所述已采集兴趣点的分布特征包括:所述已采集兴趣点的凸包面积占采集区域总面积的比率,和/或在所述采集区域中指定区域采集到的兴趣点数量占所述已采集兴趣点总数的比率;所述已采集兴趣点的质量特征包括:已采集兴趣点中质量审核通过的兴趣点占已采集兴趣点总数的比率所述用户采集轨迹特征包括:用户采集轨迹覆盖的区域面积占采集区域总面积的比率,或者用户采集轨迹覆盖的网格数量占所述采集区域中网格总数的比率;其中,所述采集区域包括多个网格;所述用户采集任务完成度特征包括:所述用户完成采集任务的数量占采集任务总数的比率。
4.根据权利要求3任一项所述的装置,所述装置还包括训练模块,用于:
在所述获取用户采集兴趣点过程中的特征集合之前,获取多个所述指定用户采集兴趣点过程中的特征集合和多个所述指定用户采集的兴趣点总数;
计算每个所述指定用户占所述兴趣点总数的比率,作为每个所述指定用户的兴趣点采全率;
基于多个所述指定用户采集兴趣点过程中的特征集合和兴趣点采全率,训练所述采全率预测模型。
5. 一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-2中任一项所述的一种兴趣点采全率预测方法。
6.一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行权利要求1-2中任一项所述的一种兴趣点采全率预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010699993.1A CN111881240B (zh) | 2020-07-20 | 2020-07-20 | 兴趣点采全率预测方法、装置、设备和可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010699993.1A CN111881240B (zh) | 2020-07-20 | 2020-07-20 | 兴趣点采全率预测方法、装置、设备和可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111881240A CN111881240A (zh) | 2020-11-03 |
CN111881240B true CN111881240B (zh) | 2023-08-11 |
Family
ID=73156168
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010699993.1A Active CN111881240B (zh) | 2020-07-20 | 2020-07-20 | 兴趣点采全率预测方法、装置、设备和可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111881240B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8645366B1 (en) * | 2011-12-30 | 2014-02-04 | Google Inc. | Generating recommendations of points of interest |
US8782034B1 (en) * | 2011-08-17 | 2014-07-15 | Google Inc. | Utilizing information about user-visited places to recommend novel spaces to explore |
CN108255980A (zh) * | 2017-12-28 | 2018-07-06 | 百度在线网络技术(北京)有限公司 | 兴趣点采全率评估方法、装置、计算机设备及存储介质 |
CN110163209A (zh) * | 2019-05-24 | 2019-08-23 | 北京百度网讯科技有限公司 | 失效poi数据挖掘方法、装置、服务器及存储介质 |
CN110851726A (zh) * | 2019-11-18 | 2020-02-28 | 百度在线网络技术(北京)有限公司 | 兴趣点选择方法、装置以及电子设备 |
-
2020
- 2020-07-20 CN CN202010699993.1A patent/CN111881240B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8782034B1 (en) * | 2011-08-17 | 2014-07-15 | Google Inc. | Utilizing information about user-visited places to recommend novel spaces to explore |
US8645366B1 (en) * | 2011-12-30 | 2014-02-04 | Google Inc. | Generating recommendations of points of interest |
CN108255980A (zh) * | 2017-12-28 | 2018-07-06 | 百度在线网络技术(北京)有限公司 | 兴趣点采全率评估方法、装置、计算机设备及存储介质 |
CN110163209A (zh) * | 2019-05-24 | 2019-08-23 | 北京百度网讯科技有限公司 | 失效poi数据挖掘方法、装置、服务器及存储介质 |
CN110851726A (zh) * | 2019-11-18 | 2020-02-28 | 百度在线网络技术(北京)有限公司 | 兴趣点选择方法、装置以及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN111881240A (zh) | 2020-11-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111695488B (zh) | 兴趣面识别方法、装置、设备以及存储介质 | |
CN111753961B (zh) | 模型训练方法和装置、预测方法和装置 | |
CN109740499A (zh) | 视频分割方法、视频动作识别方法、装置、设备及介质 | |
CN111721308A (zh) | 三维路网地图绘制方法、装置、设备和介质 | |
CN110163889A (zh) | 目标跟踪方法、目标跟踪装置、目标跟踪设备 | |
CN112581463A (zh) | 图像缺陷的检测方法、装置、电子设备、存储介质及产品 | |
CN113408662B (zh) | 图像识别、图像识别模型的训练方法和装置 | |
CN111860319A (zh) | 车道线的确定方法、定位精度的评测方法、装置、设备 | |
CN111539347B (zh) | 用于检测目标的方法和装置 | |
CN111324616B (zh) | 车道线变化信息的检测方法、装置及设备 | |
CN111507204A (zh) | 倒计时信号灯的检测方法、装置、电子设备及存储介质 | |
CN111291681B (zh) | 车道线变化信息的检测方法、装置及设备 | |
CN111488821B (zh) | 用于识别交通信号灯倒计时信息的方法及装置 | |
US11423650B2 (en) | Visual positioning method and apparatus, and computer-readable storage medium | |
CN112115224B (zh) | 地图数据的辅助质检方法、装置、电子设备及存储介质 | |
CN112668428A (zh) | 车辆变道的检测方法、路侧设备、云控平台和程序产品 | |
CN111966925B (zh) | 楼栋兴趣点判重方法、装置、电子设备和存储介质 | |
CN111597986B (zh) | 用于生成信息的方法、装置、设备和存储介质 | |
CN111832658B (zh) | 兴趣点信息处理方法、装置、电子设备和存储介质 | |
CN114332977A (zh) | 关键点检测方法、装置、电子设备及存储介质 | |
CN114282752A (zh) | 流程任务的生成方法、装置、电子设备及存储介质 | |
CN111597987A (zh) | 用于生成信息的方法、装置、设备和存储介质 | |
CN113516697B (zh) | 图像配准的方法、装置、电子设备及计算机可读存储介质 | |
CN110659427A (zh) | 基于多源数据的城市功能划分方法、装置和电子设备 | |
KR20220027000A (ko) | 지리적 위치점들의 공간 관계를 추출하는 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |