CN113051490A - 新增兴趣点预测模型训练、新增兴趣点预测方法及装置 - Google Patents

新增兴趣点预测模型训练、新增兴趣点预测方法及装置 Download PDF

Info

Publication number
CN113051490A
CN113051490A CN202110419156.3A CN202110419156A CN113051490A CN 113051490 A CN113051490 A CN 113051490A CN 202110419156 A CN202110419156 A CN 202110419156A CN 113051490 A CN113051490 A CN 113051490A
Authority
CN
China
Prior art keywords
interest point
newly added
target road
road section
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110419156.3A
Other languages
English (en)
Inventor
吴箫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202110419156.3A priority Critical patent/CN113051490A/zh
Publication of CN113051490A publication Critical patent/CN113051490A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Traffic Control Systems (AREA)

Abstract

本公开提供了新增兴趣点预测模型训练、新增兴趣点预测方法及装置,涉及人工智能技术领域,尤其涉及大数据等技术领域。具体实现方案为:获取目标路段对应的情报信息;将所述情报信息输入待训练的新增兴趣点预测模型中与所述情报信息对应的决策树,获得所述决策树的输出结果;根据所述决策树的输出结果,获得所述目标路段的新增兴趣点预测数据;根据所述新增兴趣点预测数据和所述目标路段的新增兴趣点实际数据,对所述待训练新增兴趣点预测模型进行训练,获得训练后的新增兴趣点预测模型。本公开实施例能够提高模型预测新增兴趣点数据的准确性。

Description

新增兴趣点预测模型训练、新增兴趣点预测方法及装置
技术领域
本公开涉及人工智能技术领域,尤其涉及大数据等技术领域。
背景技术
兴趣点,即POI,是“Point of Interest”的缩写。在地理信息系统中,一个POI可以是一栋房子、一个商铺、一个邮筒、一个公交站等。
随着计算机技术的发展,人们生活的方方面面也处于迅速发展和变化的过程中。在现实道路中存在的兴趣点也可能不定期地发生变化。为了能够给用户提供更好的导航、地图应用相关服务,需要对道路中的兴趣点变化状况进行掌握,以便及时根据实际兴趣点的变化,更新导航、地图等相关产品的兴趣点信息。
发明内容
本公开提供了一种用于新增兴趣点预测模型训练、新增兴趣点预测方法及装置。
根据本公开的一方面,提供了一种新增兴趣点预测模型训练方法,包括:
获取目标路段对应的情报信息;
将情报信息输入待训练的新增兴趣点预测模型中与情报信息对应的决策树,获得决策树的输出结果;
根据决策树的输出结果,获得目标路段的新增兴趣点预测数据;
根据新增兴趣点预测数据和目标路段的新增兴趣点实际数据,对待训练新增兴趣点预测模型进行训练,获得训练后的新增兴趣点预测模型。
根据本公开的另一方面,提供了一种新增兴趣点预测方法,包括:
将目标路段对应的情报信息输入新增兴趣点预测模型,得到目标路段的新增兴趣点预测数据,新增兴趣点预测模型为如本公开任意一项实施例所提供的训练后的新增兴趣点预测模型。
根据本公开的另一方面,提供了一种新增兴趣点预测模型训练装置,包括:
情报信息获取模块,用于获取目标路段对应的情报信息;
待训练输入模块,用于将情报信息输入待训练的新增兴趣点预测模型中与情报信息对应的决策树,获得决策树的输出结果;
输出模块,用于根据决策树的输出结果,获得目标路段的新增兴趣点预测数据;
训练模块,用于根据新增兴趣点预测数据和目标路段的新增兴趣点实际数据,对待训练新增兴趣点预测模型进行训练,获得训练后的新增兴趣点预测模型。
根据本公开的另一方面,公开了一种新增兴趣点预测装置,包括:
预测模块,用于将目标路段对应的情报信息输入新增兴趣点预测模型,得到目标路段的新增兴趣点预测数据,新增兴趣点预测模型为本公开任意一项实施例所提供的训练后的新增兴趣点预测模型。
根据本公开的另一方面,提供了一种电子设备,包括:
至少一个处理器;以及
与该至少一个处理器通信连接的存储器;其中,
该存储器存储有可被该至少一个处理器执行的指令,该指令被该至少一个处理器执行,以使该至少一个处理器能够执行本公开任一实施例中的方法。
根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,该计算机指令用于使计算机执行本公开任一实施例中的方法。
根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现本公开任一实施例中的方法。
根据本公开的技术,能够根据目标路段的情报信息,对新增兴趣点预测模型进行训练,从而新增兴趣点预测模型能够根据目标路段的情报信息对目标路段的新增兴趣点相关数据进行预测,从而能够判断道路的兴趣点新增的可能性并进行新增具体数据的预测,有助于掌握道路的兴趣点变化情况。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1是根据本公开一实施例的新增兴趣点预测模型训练方法示意图;
图2是根据本公开另一实施例的新增兴趣点预测模型训练方法示意图;
图3是根据本公开又一实施例的新增兴趣点预测方法示意图;
图4是根据本公开一示例的新增兴趣点预测模型训练方法示意图;
图5是根据本公开一实施例的新增兴趣点预测模型训练装置示意图;
图6是根据本公开另一实施例的新增兴趣点预测模型训练装置示意图;
图7是根据本公开又一实施例的新增兴趣点预测装置示意图;
图8是根据本公开又一实施例的新增兴趣点预测装置示意图;
图9是用来实现本公开实施例的新增兴趣点预测模型训练方法的电子设备的框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
本公开实施例首先提供一种新增兴趣点预测模型训练方法,如图1所示,包括:
步骤S11:获取目标路段对应的情报信息;
步骤S12:将情报信息输入待训练的新增兴趣点预测模型中与情报信息对应的决策树,获得决策树的输出结果;
步骤S13:根据决策树的输出结果,获得目标路段的新增兴趣点预测数据;
步骤S14:根据新增兴趣点预测数据和目标路段的新增兴趣点实际数据,对待训练的新增兴趣点预测模型进行训练,获得训练后的新增兴趣点预测模型。
在具体实现方式中,可将一定范围内(比如城市、区域、国家等)的所有道路进行汇集,对每个道路进行路段划分,形成每个道路的至少一个路段。目标路段可以是任意一个道路的任意一个路段。
目标路段对应的情报信息,可以是与目标路段的兴趣点相关的任意信息。比如可能出现兴趣点的位置、已有兴趣点等。
待训练的新增兴趣点预测模型,可以是用于预测目标路段的兴趣点新增信息的模型,可以对输入的目标路段对应的情报信息进行计算,获得目标路段对应的新增兴趣点预测数据。
新增兴趣点预测模型可以是树集成模型,比如以树为基本决策器的模型,可以包括多个决策树。
在本实施例中,将情报信息输入待训练的新增兴趣点预测模型中与情报信息对应的决策树,获得决策树的输出结果,可以是将情报信息输入情报信息输入待训练的新增兴趣点预测模型所包含的决策树,获得待训练的新增兴趣点预测模型所包含的决策树的输出结果。
在待训练的新增兴趣点预测模型中,情报信息对应的决策树可以是待训练的决策树。决策树的结构可以与情报信息的种类对应。比如,A类情报信息对应第一种结构的决策树;B类情报信息对应第二种结构的决策树。
在情报信息包括多种的情况下,将情报信息输入待训练的新增兴趣点预测模型中与情报信息对应的决策树,获得决策树的输出结果,包括将各不同种类的情报信息输入待训练的新增兴趣点预测模型对应的各决策树,获得各决策树的输出结果。
在一种具体实现方式中,根据决策树的输出结果,获得目标路段的新增兴趣点预测数据,可以是根据新增兴趣点预测模型所包括的决策树的至少一个所输出的数据,获得目标路段的新增兴趣点预测数据。
在一种可能的实时方式中,根据新增兴趣点预测数据和目标路段的新增兴趣点实际数据,对待训练新增兴趣点预测模型进行训练,可以是根据新增兴趣点预测数据和目标路段的新增兴趣点实际数据,计算待训练的新增兴趣点预测模型的损失值(包括至少一个决策树的损失值),根据损失值优化待训练的新增兴趣点预测模型(包括优化至少一个决策树)。
在具体实施方式中,可根据情报信息的具体种类,对新增兴趣点预测模型所包括的至少一个决策树进行优化和训练,也可对新增兴趣点预测模型所包括的全部决策树进行优化和训练。
本实施例中,能够根据目标路段的情报信息,对新增兴趣点预测模型进行训练,从而新增兴趣点预测模型能够根据目标路段的情报信息对目标路段的新增兴趣点相关数据进行预测,从而能够判断道路的兴趣点新增的可能性并进行新增具体数据的预测,有助于掌握道路的兴趣点变化情况。
在一种实施方式中,目标路段对应的情报信息包括下述至少一种:
目标路段设定范围内经过验真确认的兴趣点的数量;
目标路段设定范围内经导航数据确认的兴趣点的数量;
目标路段设定范围内的模糊兴趣点的数量;
目标路段设定范围内点击率超过设定点击率阈值的兴趣点的数量;
目标路段的兴趣点密度;
目标路段的通过车辆数。
在具体实现方式中,目标路段设定范围内经过验真确认的兴趣点的数量,可以是目标路段设定范围内经过邮寄地址验真确认的兴趣点的数量,或者可以是外卖地址等物品接收地址。
目标路段设定范围内经过验真确认的兴趣点的数量,也可以是通过其它方式验真确认的兴趣点的数量。
目标路段设定范围内经导航数据确认的兴趣点的数量,可以是根据地图导航或者含有导航功能的其它应用确认的兴趣点的数量。比如,若一个兴趣点为导航线路起点或导航线路终点,说明该兴趣点为真实存在的兴趣点。
目标路段设定范围内的模糊兴趣点的数量,可以是无法确认是否真实的兴趣点的数量。
点击率超过设定点击率阈值的兴趣点的数量,可以是在提供兴趣点信息或者使用兴趣点信息为用户提供服务的相关产品中的点击率,可以包括目标路段设定范围内的任意地址的点击率。
目标路段的通过车辆数也可以是目标路段设定范围内的通过车辆数(PV)。
本实施例中,可采用多种情报信息中的至少一种作为预测模型的输入参数,从而能够从多方面进行目标路段的新增兴趣点预测,提高预测的准确性。
在一种实施方式中,情报信息包括多种;如图2所示,将情报信息输入待训练的新增兴趣点预测模型中与情报信息对应的决策树,获得决策树的输出结果,包括:
步骤S21:将目标路段的路段信息以及对应的每一种情报信息输入与情报信息对应的决策树,得到与情报信息对应的决策树的输出结果;
步骤S22:根据所有决策树的输出结果,获得目标路段的新增兴趣点预测数据。
在具体实施方式中,新增兴趣点预测模型中的各个决策树可以全部为待训练决策树,也可以仅其中一个决策树为待训练决策树。
将路段信息以及对应的每一种情报信息输入与情报信息对应的决策树,得到与情报信息对应的决策树的输出结果,具体可以是,将路段信息中每一种情报信息输入该种类的情报信息所对应的决策树中,决策树的结构与情报信息的种类对应,获得该种类的情报信息对应的决策树的输出结果。
在一种可能的实现方式中,决策树的叶子节点对应情报信息的取值范围,可以根据情报信息在多段取值范围内的取值,计算出决策树叶子节点对应的数值。
在一种可能的实现方式中,决策树的输出结果可以为决策树的叶子节点之和。
在一种可能的实现方式中,新增兴趣点预测模型的输出结果可以为所有决策树的输出结果之和。
本实施例中,采用决策树处理情报信息,获得关于情报信息的预测数据,从而能够提高预测数据的准确性。
在一些可能的实现方式中,根据所有决策树的输出结果,获得目标路段的新增兴趣点预测数据,包括:
将所有决策树的输出结果之和,作为目标路段的新增兴趣点预测数据。
本实施例中,将所有决策树的输出结果之和,作为目标路段的新增兴趣点预测数据,每个决策树的结构与情报信息的种类对应,从而在预测新增兴趣点数据时可以考虑多种情报信息,提高预测准确性。
在一种实施方式中,每个决策树的节点为:关于情报信息的权重函数。
在采用新增兴趣点预测模型预测兴趣点新增数据时,不同的情报信息与兴趣点新增状况的相关性不同,通过权重函数,能够提高预测准确性。
本公开实施例还提供一种新增兴趣点预测方法,如图3所示,包括:
步骤S31:将目标路段对应的情报信息输入新增兴趣点预测模型,得到目标路段的新增兴趣点预测数据,本实施例中的新增兴趣点预测模型可以为本公开任意一项实施例所提供的训练后的新增兴趣点预测模型。
本实施例中,通过训练后的新增兴趣点预测模型,能够获得目标路段的新增兴趣点预测数据,从而能够利用新增兴趣点预测数据进行产品的更新等相关操作。
在一种实施方式中,新增兴趣点预测模型还包括:
根据新增兴趣点预测数据,生成目标路段的兴趣点采集任务;目标路段的兴趣点采集任务包括执行优先级信息。
在一种可能的实现方式中,目标路段的兴趣点采集任务的执行优先级,与目标路段的新增兴趣点预测数据相关,预测兴趣点新增数量较高的目标路段,兴趣点采集任务所包括的执行优先级越高。从而,对于新增兴趣点数量可能较多的目标路段,进行兴趣点采集任务优先执行,使得在面对大范围内、大量目标路段的数据的情况下,兴趣点采集任务能够在有限的执行条件下高效采集,实现利用较少的资源获得更多实际价值和效益。
本实施例中,根据新增兴趣点预测数据,生成目标路段的兴趣点采集任务,从而使得在一定范围(如城市、国家)内的目标路段的兴趣点采集任务的优先级根据目标路段的新增状况预测信息进行排序,进而使得在大范围内大量的目标路段的兴趣点采集任务按照优先级执行,提高兴趣点采集任务的执行效率。
在具体示例中,对于车采影像数据加工生产POI场景下,需要调度全景采集车或其它相关车辆采集POI素材。在采集POI素材之前,需要发布道路任务,道路任务以道路的Link为最小单位。而在全国范围内,道路数量非常大,道路所包括的路段数量也相当庞大,因此,需要能够对全国所有的道路Link给出新增价值排序,从而决定道路的兴趣点采集任务发布的优先级。在本申请示例中,可将道路在上一次被采集POI素材之后上线的POI中新增POI的比例成为道路任务的新增价值。道路任务新增价值高的,可优先进行POI素材的采集。
一般情况下,道路任务新增价值还可以通过城市维度新增价值来判断。可构建模型预测各个城市POI新增规模的大小,然后通过模型预测的城市新增率打分对城市进行排序,构建POI加工的城市优先级,按照城市优先级从高到低决定道路任务发布的优先级。
但是,如果仅按照城市维度,对大于城市的范围(省份、国家)的兴趣点采集任务进行优先级排序,那么由于基于城市整体维度进行优先级排序,粒度相对较粗,无法对城市的不同区域进行区分对待。现实中可能只有一个城市的部分地区新增率较高,而其他地区新增率较低。所以这种方案无法实现在单位采集成本条件下的收益最大化。而本公开实施例通过利用道路相关情报,构建道路Link维度的新增价值排序,从更细粒度判断POI新增价值,有助于在有限的采集成本条件下的收益提升。
在本公开一种示例中,可针对于车采图像(如全景、行车记录仪等)中的POI采集任务发布,判定道路任务的新增价值。道路以为道路节点(道路之间交汇点)划分为一段一段的道路的Link,长度一般在10米到500米之间。对于每一条道路的Link,通过构建该道路(或Link)附近的情报信息与道路本身的属性特征,构建起车采道路的Link情报库,以该道路附近近期的POI新增率为训练集,构建道路新增价值打分模型,从而对道路的Link进行价值排序。
在具体示例中,新增兴趣点预测方法具体步骤如图4所示,包括如下步骤。
步骤S41:道路的Link的筛选。
在具体示例中,对于车采POI的道路任务,需要过滤高速路、人行路与内部道路中的至少一种。
对于高速路而言,由于车在高速路上的行驶速度较快,拍摄图片会出现模糊的情况,无法提取模糊招牌中的POI名称,因此需要过滤高速路。
对于人行路与内部道路而言,这样的道路一般情况下,采集车辆无法进入,因此需要过滤。
步骤S42:道路情报库的构建。
构建道路情报信息的请报库或Link信息的情报库。道路情报库实际上是道路附近的POI情报与道路自身属性特征的情报库。目前情报主要是点维度的,需要知道道路附近包含的POI情报数量。情报点可以为道路上的一点,在具体实现方式中,需要计算情报点与道路Link的距离,道路的Link数据为一串坐标点组成的多段线段,求情报点到每一段线段的距离,取这些距离的最小值作为情报点到道路的Link的距离。
在具体示例中可取距离道路100米范围内的情报作为该道路link的特征。构建特性情报库包含以下情报特征:
该道路的Link附近100米的快递验真POI数量。快递验真指的是该POI在30天内有过快递运单送达的记录;
该道路的Link附近100米的模糊POI数量。模糊POI指的是现实世界可能存在但是存在概率不高的POI;
该道路的Link附近100米的高热POI数量,高热POI指的是最近30天点击热度高于一个预设值的POI;
导航终点在该道路的link附近100米的情报数量;
该道路的Link近一个月的PV,即近一个月经过该道路Link的车行轨迹数量;
该道路的Link附近100米的POI密度,统计该道路的Link附近100米的POI数量,用该数量除以道路的Link的长度即得到POI密度。
通过较为简单的网络信息搜集方式,即可得出每一条道路link的相关情报数量。无需发布POI采集任务,且执行难度远低于POI采集任务的难度。
步骤S43:道路新增价值打分模型的构建。具体方案如下:详细训练过程如下:
构建训练数据Label(参考数据),即为每一条道路的Link的新增兴趣点实际数据。取最近半年的所有上线POI数据,确定其中新增POI量。统计距离每一条道路的Link距离100米范围内的最近半年的所有上线POI数据与其中新增POI量;用新增POI数量除以上线POI总量即可以得出道路的Link附近近半年的新增率;
构建特征数据。根据步骤S42中构建的道路情报库找出每条道路的Link附近100米内的快递信息验真出的POI数量,附近100米内根据导航情报数据确定出的POI数量,附近100米内的模糊的POI数量,附近100米内的预设点击热度范围内的POI数量,附近100米内的POI密度以及该道路的Link的PV。
将所有有效的(即存在Label的)道路link随机划分成两份,其中一份数据用作训练集,另一部分用作测试集。进行XGBT(eXtreme Gradient Boosting,极限梯度提升)模型训练。
XGBT实际上是一个树集成模型,将K个决策树的结果进行求和,作为最终预测值,即:
Figure BDA0003027205730000101
其中,yi表示模型预测的新增率最终预测值,xi表示第i个路段Link样本的情报特征,
Figure BDA0003027205730000102
即表示yi关于xi的函数,fk(xi)表示第k棵树模型求得的结果,F表示K棵树构成的决策树空间,即K个决策树的数据范围。
对于本公开示例中采用的XGBT模型,假设有n个道路的Link样本,m个POI情报特征(包含组合特征),则有:
D={(xi,yi1)}(|D|=n,xi∈Rm,yi∈R);
其中xi表示第i个道路link样本,yi1表示第i个道路的Link样本新增率的label,也就是第i个道路的Link样本的实际新增率,D表示由(xi,yi1)构成的集合,|D|表示集合中元素的个数,即为n,回归树(CART树)的空间F(即所有回归树构成的集合)为:
F={f(x)=wq(x)}(q:Rm→T,ω∈RT);
箭头含义可以为:q表示对应叶子节点为T的树结构;q代表每棵树的结构,他将样本映射到对应的叶节点;T是对应树的叶节点个数;f(x)对应树的结构q和叶节点权重wq(x)。所以XGBT的预测值是每棵树对应的叶节点的值的和。
通过学习待训练的新增兴趣点预测模型所包括的K个树,在具体实现方式中,最小化如下带正则项的目标函数:
Figure BDA0003027205730000111
其中,
Figure BDA0003027205730000112
表示每棵树的叶子节点组成的集合,γ和入表示正则项的系数,正则项用来控制树的复杂度,防止过拟合;l(yi,yi1)为均方误差(MeanSquare Error,MSE);在每一轮训练中,最小化目标函数,直到目标函数值小于预设值或者到达指定的轮次数,结束模型训练,此时得到训练好的XGBT模型。
步骤S44:道路新增价值排序。使用天级别情报库数据,通过道路新增价值打分模型预测每天的道路link价值打分,即可以得到当天的道路新增价值排序。车采POI任务即以每天最新的道路新增价值打分排序为优先级发布道路任务。
通过本公开实施例提供的新增兴趣点预测方法,提升在车采场景的单位采集成本下POI的新增率。在目前的车采场景中,可以将原来的单位采集成本的新增率提升10%~20%.
本公开实施例还提供一种新增兴趣点预测模型训练装置,如图5所示,包括:
情报信息获取模块51,用于获取目标路段对应的情报信息;
待训练输入模块52,用于将情报信息输入待训练的新增兴趣点预测模型中与情报信息对应的决策树,获得决策树的输出结果;
输出模块53,用于根据决策树的输出结果,获得目标路段的新增兴趣点预测数据;
训练模块54,用于根据新增兴趣点预测数据和目标路段的新增兴趣点实际数据,对待训练新增兴趣点预测模型进行训练,获得训练后的新增兴趣点预测模型。
在一种实施方式中,目标路段对应的情报信息包括下述至少一种:
目标路段设定范围内经过验真确认的兴趣点的数量;
目标路段设定范围内经导航数据确认的兴趣点的数量;
目标路段设定范围内的模糊兴趣点的数量;
目标路段设定范围内点击率超过设定点击率阈值的兴趣点的数量;
目标路段的兴趣点密度;
目标路段的通过车辆数。
在一种实施方式中,情报信息包括多种;进一步,如图6所示,待训练模块包括:
决策树输入单元61,用于将目标路段的路段信息以及对应的每一种情报信息输入与情报信息对应的决策树,得到与情报信息对应的决策树的输出结果;
决策树输出单元62,用于根据所有决策树的输出结果,获得目标路段的新增兴趣点预测数据。
在一种实施方式中,决策树输出单元还用于:
将所有决策树的输出结果之和,作为目标路段的新增兴趣点预测数据。
在一种实施方式中,每个决策树的节点为:关于情报信息的权重函数。
本公开实施例还提供一种新增兴趣点预测装置,如图7所示,包括:
预测模块71,用于将目标路段对应的情报信息输入新增兴趣点预测模型,得到目标路段的新增兴趣点预测数据,新增兴趣点预测模型为如本公开任意一项实施例所提供的训练后的新增兴趣点预测模型。
在一种实施方式中,如图8所示,新增兴趣点预测装置还包括:
任务模块81,用于根据新增兴趣点预测数据,生成目标路段的兴趣点采集任务;目标路段的兴趣点采集任务包括执行优先级信息。
本公开实施例各装置中的各单元、模块或子模块的功能可以参见上述方法实施例中的对应描述,在此不再赘述。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
图9示出了可以用来实施本公开的实施例的示例电子设备900的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或要求的本公开的实现。
如图9所示,电子设备900包括计算单元901,其可以根据存储在只读存储器(ROM)902中的计算机程序或者从存储单元908加载到随机访问存储器(RAM)903中的计算机程序来执行各种适当的动作和处理。在RAM 903中,还可存储电子设备900操作所需的各种程序和数据。计算单元901、ROM 902以及RAM 903通过总线904彼此相连。输入输出(I/O)接口905也连接至总线904。
电子设备900中的多个部件连接至I/O接口905,包括:输入单元906,例如键盘、鼠标等;输出单元907,例如各种类型的显示器、扬声器等;存储单元908,例如磁盘、光盘等;以及通信单元909,例如网卡、调制解调器、无线通信收发机等。通信单元909允许电子设备900通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元901可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元901的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元901执行上文所描述的各个方法和处理,例如新增兴趣点预测模型训练方法。例如,在一些实施例中,新增兴趣点预测模型训练方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元908。在一些实施例中,计算机程序的部分或者全部可以经由ROM 902和/或通信单元909而被载入和/或安装到电子设备900上。当计算机程序加载到RAM 903并由计算单元901执行时,可以执行上文描述的新增兴趣点预测模型训练方法的一个或多个步骤。备选地,在其他实施例中,计算单元901可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行新增兴趣点预测模型训练方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入、或者触觉输入来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

Claims (17)

1.一种新增兴趣点预测模型训练方法,包括:
获取目标路段对应的情报信息;
将所述情报信息输入待训练的新增兴趣点预测模型中与所述情报信息对应的决策树,获得所述决策树的输出结果;
根据所述决策树的输出结果,获得所述目标路段的新增兴趣点预测数据;
根据所述新增兴趣点预测数据和所述目标路段的新增兴趣点实际数据,对所述待训练的新增兴趣点预测模型进行训练,获得训练后的新增兴趣点预测模型。
2.根据权利要求1所述的方法,其中,所述目标路段对应的情报信息包括下述至少一种:
所述目标路段设定范围内经过验真确认的兴趣点的数量;
所述目标路段设定范围内经导航数据确认的兴趣点的数量;
所述目标路段设定范围内的模糊兴趣点的数量;
所述目标路段设定范围内点击率超过设定点击率阈值的兴趣点的数量;
所述目标路段的兴趣点密度;
所述目标路段的通过车辆数。
3.根据权利要求1所述的方法,其中,所述情报信息包括多种;所述将所述情报信息输入待训练的新增兴趣点预测模型中与所述情报信息对应的决策树,获得所述决策树的输出结果,包括:
将所述目标路段的路段信息以及对应的每一种情报信息输入与情报信息对应的决策树,得到所述与情报信息对应的决策树的输出结果;
根据所有决策树的输出结果,获得所述目标路段的新增兴趣点预测数据。
4.根据权利要求3所述的方法,其中,所述根据所有所述决策树的输出结果,获得所述目标路段的新增兴趣点预测数据,包括:
将所有所述决策树的输出结果之和,作为所述目标路段的新增兴趣点预测数据。
5.根据权利要求3或4所述的方法,其中,每个所述决策树的节点为:关于所述情报信息的权重函数。
6.一种新增兴趣点预测方法,包括:
将目标路段对应的情报信息输入新增兴趣点预测模型,得到所述目标路段的新增兴趣点预测数据,所述新增兴趣点预测模型为如权利要求1-5中任意一项所述的训练后的新增兴趣点预测模型。
7.根据权利要求6所述的方法,其中,还包括:
根据所述新增兴趣点预测数据,生成所述目标路段的兴趣点采集任务;所述目标路段的兴趣点采集任务包括执行优先级信息。
8.一种新增兴趣点预测模型训练装置,包括:
情报信息获取模块,用于获取目标路段对应的情报信息;
待训练输入模块,用于将所述情报信息输入待训练的新增兴趣点预测模型中与所述情报信息对应的决策树,获得所述决策树的输出结果;
输出模块,用于根据所述决策树的输出结果,获得所述目标路段的新增兴趣点预测数据;
训练模块,用于根据所述新增兴趣点预测数据和所述目标路段的新增兴趣点实际数据,对所述待训练的新增兴趣点预测模型进行训练,获得训练后的新增兴趣点预测模型。
9.根据权利要求8所述的装置,其中,所述目标路段对应的情报信息包括下述至少一种:
所述目标路段设定范围内经过验真确认的兴趣点的数量;
所述目标路段设定范围内经导航数据确认的兴趣点的数量;
所述目标路段设定范围内的模糊兴趣点的数量;
所述目标路段设定范围内点击率超过设定点击率阈值的兴趣点的数量;
所述目标路段的兴趣点密度;
所述目标路段的通过车辆数。
10.根据权利要求8所述的装置,其中,所述情报信息包括多种;所待训练模块包括:
决策树输入单元,用于将所述目标路段的路段信息以及对应的每一种情报信息输入与情报信息对应的决策树,得到所述与情报信息对应的决策树的输出结果;
决策树输出单元,用于根据所有决策树的输出结果,获得所述目标路段的新增兴趣点预测数据。
11.根据权利要求10所述的装置,其中,所述决策树输出单元还用于:
将所有所述决策树的输出结果之和,作为所述目标路段的新增兴趣点预测数据。
12.根据权利要求10或11所述的装置,其中,每个所述决策树的节点为:关于所述情报信息的权重函数。
13.一种新增兴趣点预测装置,包括:
预测模块,用于将目标路段对应的情报信息输入新增兴趣点预测模型,得到所述目标路段的新增兴趣点预测数据,所述新增兴趣点预测模型为如权利要求8-12中任意一项所述的训练后的新增兴趣点预测模型。
14.根据权利要求13所述的装置,其中,还包括:
任务模块,用于根据所述新增兴趣点预测数据,生成所述目标路段的兴趣点采集任务;所述目标路段的兴趣点采集任务包括执行优先级信息。
15.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7中任一项所述的方法。
16.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使计算机执行权利要求1-7中任一项所述的方法。
17.一种计算机程序产品,包括计算机程序,该计算机程序在被处理器执行时实现根据权利要求1-7中任一项所述的方法。
CN202110419156.3A 2021-04-19 2021-04-19 新增兴趣点预测模型训练、新增兴趣点预测方法及装置 Pending CN113051490A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110419156.3A CN113051490A (zh) 2021-04-19 2021-04-19 新增兴趣点预测模型训练、新增兴趣点预测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110419156.3A CN113051490A (zh) 2021-04-19 2021-04-19 新增兴趣点预测模型训练、新增兴趣点预测方法及装置

Publications (1)

Publication Number Publication Date
CN113051490A true CN113051490A (zh) 2021-06-29

Family

ID=76520669

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110419156.3A Pending CN113051490A (zh) 2021-04-19 2021-04-19 新增兴趣点预测模型训练、新增兴趣点预测方法及装置

Country Status (1)

Country Link
CN (1) CN113051490A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113792904A (zh) * 2021-07-19 2021-12-14 陈启达 一种基于决策树的博物馆游客感兴趣点预测方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180340787A1 (en) * 2017-05-26 2018-11-29 Uber Technologies, Inc. Vehicle routing guidance to an authoritative location for a point of interest
CN111210269A (zh) * 2020-01-02 2020-05-29 平安科技(深圳)有限公司 基于大数据的对象识别方法、电子装置及存储介质
CN111782978A (zh) * 2020-06-30 2020-10-16 北京百度网讯科技有限公司 兴趣点数据的处理方法及装置、电子设备、可读介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180340787A1 (en) * 2017-05-26 2018-11-29 Uber Technologies, Inc. Vehicle routing guidance to an authoritative location for a point of interest
CN111210269A (zh) * 2020-01-02 2020-05-29 平安科技(深圳)有限公司 基于大数据的对象识别方法、电子装置及存储介质
CN111782978A (zh) * 2020-06-30 2020-10-16 北京百度网讯科技有限公司 兴趣点数据的处理方法及装置、电子设备、可读介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
舒振宇;杨思鹏;辛士庆;刘予琪;龚梦航;庞超逸;胡超;: "基于分层学习的三维模型兴趣点提取算法", 计算机辅助设计与图形学学报, no. 02 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113792904A (zh) * 2021-07-19 2021-12-14 陈启达 一种基于决策树的博物馆游客感兴趣点预测方法

Similar Documents

Publication Publication Date Title
CN112148987B (zh) 基于目标对象活跃度的消息推送方法及相关设备
CN110798805B (zh) 基于gps轨迹的数据处理方法、装置及存储介质
JP7334205B2 (ja) 目的地の予測方法、装置、電子機器、コンピュータ可読記憶媒体及びコンピュータプログラム
CN104599002B (zh) 预测订单价值的方法及设备
CN114428828A (zh) 基于行驶轨迹挖掘新增道路方法、装置及电子设备
CN105894028A (zh) 用户识别方法和装置
CN108182240B (zh) 兴趣点新增率预测模型训练及预测方法、装置及存储介质
CN114090601B (zh) 一种数据筛选方法、装置、设备以及存储介质
CN110674208B (zh) 用于确定用户的职住地信息的方法和装置
CN113051490A (zh) 新增兴趣点预测模型训练、新增兴趣点预测方法及装置
CN116030617A (zh) 一种基于公路od数据进行车流量预测的方法及装置
CN112883236A (zh) 一种地图更新方法、装置、电子设备及存储介质
CN111694914A (zh) 用户常驻区域确定方法及装置
CN115330067B (zh) 一种交通拥堵预测方法、装置、电子设备及存储介质
CN112380443B (zh) 导乘推荐方法、装置、计算机设备和存储介质
CN112906478B (zh) 目标对象的识别方法、装置、设备和存储介质
CN112685531B (zh) 车辆匹配方法和装置、计算设备以及计算机可读存储介质
CN113326885A (zh) 训练分类模型和数据分类的方法及装置
CN112381305A (zh) 打车时长预估方法、装置、电子设备及存储介质
CN112084408A (zh) 名单数据筛选方法、装置、计算机设备及存储介质
CN112966192A (zh) 区域地址命名方法、装置、电子设备及可读存储介质
CN116321007B (zh) 出行目的预测方法、装置、设备及存储介质
CN114185908B (zh) 一种地图数据处理方法、装置、电子设备及存储介质
CN111782978B (zh) 兴趣点数据的处理方法及装置、电子设备、可读介质
CN114036414A (zh) 兴趣点的处理方法、装置、电子设备、介质及程序产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination