CN111666462A - 地理位置的推荐方法、装置、设备和计算机存储介质 - Google Patents
地理位置的推荐方法、装置、设备和计算机存储介质 Download PDFInfo
- Publication number
- CN111666462A CN111666462A CN202010351784.8A CN202010351784A CN111666462A CN 111666462 A CN111666462 A CN 111666462A CN 202010351784 A CN202010351784 A CN 202010351784A CN 111666462 A CN111666462 A CN 111666462A
- Authority
- CN
- China
- Prior art keywords
- user
- vector representation
- geographic
- time
- geographic position
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 72
- 239000013598 vector Substances 0.000 claims abstract description 300
- 230000004927 fusion Effects 0.000 claims abstract description 55
- 238000012545 processing Methods 0.000 claims abstract description 25
- 238000012549 training Methods 0.000 claims description 95
- 230000007774 longterm Effects 0.000 claims description 51
- 230000015654 memory Effects 0.000 claims description 22
- 238000013528 artificial neural network Methods 0.000 claims description 16
- 238000013507 mapping Methods 0.000 claims description 16
- 230000007246 mechanism Effects 0.000 claims description 12
- 238000013527 convolutional neural network Methods 0.000 claims description 10
- 230000006870 function Effects 0.000 description 12
- 230000008569 process Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 6
- 238000001914 filtration Methods 0.000 description 6
- 238000004590 computer program Methods 0.000 description 4
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000009901 attention process Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000007499 fusion processing Methods 0.000 description 2
- 238000012905 input function Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000004883 computer application Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000001151 other effect Effects 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/907—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/909—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种地理位置的推荐方法、装置、设备和计算机存储介质,涉及智能搜索技术领域。具体实现方案为:获取向用户推荐地理位置的触发事件;针对各候选地理位置分别执行:将所述用户的查询历史的向量表示与候选地理位置的向量表示进行融合,得到候选地理位置的融合向量表示;至少将所述候选地理位置的融合向量表示与所述用户的画像向量表示进行拼接,将拼接后得到的向量表示经过全连接层的处理,得到该候选地理位置的推荐评分;依据各候选地理位置的推荐评分,确定向所述用户推荐的地理位置。本申请能够提高推荐的地理位置满足用户查询需求的准确性。
Description
技术领域
本申请涉及计算机应用技术领域,特别涉及智能搜索技术领域。
背景技术
当用户打算在地图类应用中查询地理位置时,通常会在地图类应用的检索框输入要查询的地理位置。为了方便用户操作,当用户的光标定位于检索框时,在用户输入要查询的地理位置之前,地图类应用会向用户进行地理位置推荐,希望能够猜出用户想要查询的地理位置,从而使得用户仅需要点击推荐的地理位置即可实现一次点击实现检索,显然能够极大地方便用户的使用,提高用户体验。
然而,现有的地理位置推荐方案均是基于各候选地理位置的查询热度进行排序,并不能够很好地符合用户的个性化需求,使得推荐的地理位置“猜出”用户的查询需求的准确率很低。
发明内容
有鉴于此,本申请提供了一种地理位置的推荐方法、装置、设备和计算机存储介质,以便于提高推荐的地理位置符合用户查询需求的准确率。
第一方面,本申请提供了一种地理位置的推荐方法,该方法包括:
获取向用户推荐地理位置的触发事件;
针对各候选地理位置分别执行:将所述用户的查询历史的向量表示与候选地理位置的向量表示进行融合,得到候选地理位置的融合向量表示;至少将所述候选地理位置的融合向量表示与所述用户的画像向量表示进行拼接,将拼接后得到的向量表示经过全连接层的处理,得到该候选地理位置的推荐评分;
依据各候选地理位置的推荐评分,确定向所述用户推荐的地理位置。
第二方面,本申请提供了一种训练地理位置推荐模型的方法,该方法包括:
从历史查询日志中获取训练数据,各训练数据包括:用户的查询历史、向所述用户推荐的地理位置样本,所述样本包括正样本和负样本;
利用各训练数据训练地理位置推荐模型,所述地理位置推荐模型至少包括:地理位置融合层和全连接层;
其中所述地理位置融合层将训练数据中用户的查询历史的向量表示与其中一个地理位置样本的向量表示进行融合,得到该地理位置样本的融合向量表示;至少将该地理位置样本的融合向量表示与对应用户的画像向量表示进行拼接,将拼接后得到的向量表示经过全连接层的处理,得到该地理位置样本的推荐评分;
训练目标为:最大化同一训练数据中正样本的推荐评分与负样本的推荐评分的差值。
第三方面,本申请还提供了一种地理位置的推荐装置,该装置包括:
触发单元,用于获取向用户推荐地理位置的触发事件;
评分单元,用于针对各候选地理位置分别执行:将所述用户的查询历史的向量表示与候选地理位置的向量表示进行融合,得到候选地理位置的融合向量表示;至少将所述候选地理位置的融合向量表示与所述用户的画像向量表示进行拼接,将拼接后得到的向量表示经过全连接层的处理,得到该候选地理位置的推荐评分;
推荐单元,用于依据各候选地理位置的推荐评分,确定向所述用户推荐的地理位置。
第四方面,本申请提供了一种训练地理位置推荐模型的装置,该装置包括:
训练数据获取单元,用于从历史查询日志中获取训练数据,各训练数据包括:用户的查询历史、向所述用户推荐的地理位置样本,所述样本包括正样本和负样本;
推荐模型训练单元,用于利用各训练数据训练地理位置推荐模型,所述地理位置推荐模型至少包括:地理位置融合层和全连接层;
其中所述地理位置融合层将训练数据中用户的查询历史的向量表示与其中一个地理位置样本的向量表示进行融合,得到该地理位置样本的融合向量表示;至少将该地理位置样本的融合向量表示与对应用户的画像向量表示进行拼接,将拼接后得到的向量表示经过全连接层的处理,得到该地理位置样本的推荐评分;
训练目标为:最大化同一训练数据中正样本的推荐评分与负样本的推荐评分的差值。
第五方面,本申请还提供了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上任一项所述的方法。
第六方面,本申请提供一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行如上任一项所述的方法。
由以上技术方案可以看出,本申请中将用户的查询历史的向量表示与候选地理位置的向量表示进行融合,并进一步拼接用户的画像向量表示,以作为候选地理位置的推荐评分基础,使得各候选地理位置的推荐评分能够体现用户的查询偏好,使得推荐的地理位置能够更准确地“猜出”用户的查询需求。
上述可选方式所具有的其他效果将在下文中结合具体实施例加以说明。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1示出了可以应用本发明实施例的示例性系统架构;
图2为本申请实施例一提供的地理位置推荐的主要方法流程图;
图3为本申请实施例二提供的地理位置推荐模型的原理示意图;
图4为本申请实施例三提供的训练地理位置推荐模型的方法流程图;
图5为本申请实施例四提供的地理位置的推荐装置的结构图;
图6为本申请实施例五提供的训练地理位置推荐模型的装置的结构图;
图7是用来实现本申请实施例的电子设备的框图;
图8为本申请实施例提供的一个推荐POI的应用场景的界面示意图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
图1示出了可以应用本发明实施例的示例性系统架构。如图1所示,该系统架构可以包括终端设备101和102,网络103和服务器104。网络103用以在终端设备101、102和服务器104之间提供通信链路的介质。网络103可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101和102通过网络103与服务器104交互。终端设备101和102上可以安装有各种应用,例如地图类应用、语音交互类应用、网页浏览器应用、通信类应用等。
终端设备101和102可以是能够支持并展现地图类应用的各种电子设备,包括但不限于智能手机、平板电脑、智能穿戴式设备等等。本发明所提供的装置可以设置并运行于上述服务器104中。其可以实现成多个软件或软件模块(例如用来提供分布式服务),也可以实现成单个软件或软件模块,在此不做具体限定。
例如,地理位置的推荐装置设置并运行于上述服务器104中,服务器104可以接收来自终端设备101或102的触发事件,该触发事件包含用户相关信息。地理位置的推荐装置使用本发明实施例提供的方式进行地理位置的推荐,并将推荐结果返回终端设备101或102。在服务器104端维护有地图数据库,该地图数据库可以存储于服务器104本地,也可以存储于其他服务器中由服务器104进行调用。服务器104也能够获取并记录用户使用地图类应用的相关行为,从而形成诸如历史查询日志等。
再例如,训练地理位置推荐模型的装置设置并运行于上述服务器104中,服务器104利用历史查询日志训练地理位置推荐模型,以用于向用户进行地理位置推荐。
服务器104可以是单一服务器,也可以是多个服务器构成的服务器群组。应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
下面结合实施例对本申请提供的方法和装置进行详细描述。
实施例一、
图2为本申请实施例一提供的地理位置推荐的主要方法流程图,如图2中所示,该方法可以包括以下步骤:
在201中,获取向用户推荐地理位置的触发事件。
本申请中可以应用于多种应用场景下的触发事件,可以包括但不限于以下几种:
1)获取用户将焦点定位于检索框的事件。例如用户打开地图类应用的界面,在界面上的检索框中定位焦点,那么在用户输入要查询的地理位置之前,可以获取到该事件并向用户进行地理位置推荐。
2)获取用户点击触发地理位置推荐的功能组件的事件。例如地图类应用的界面上设置有专用于触发地理位置推荐的功能组件,例如可以触发地理位置推荐的按钮,当用户点击该组件时,获取到该事件并向用户进行地理位置推荐。
3)获取用户输入的地理位置推荐的语音指令。例如当用户打开地图类应用的界面并触发语音输入功能,若用户输入诸如“请推荐地理位置”的语音指令,则获取到该事件并向用户进行地理位置推荐。
在202中,针对各候选地理位置分别执行:将所述用户的查询历史的向量表示与候选地理位置的向量表示进行融合,得到候选地理位置的融合向量表示;至少将所述候选地理位置的融合向量表示与所述用户的画像向量表示进行拼接,将拼接后得到的向量表示经过全连接层的处理,得到该候选地理位置的推荐评分。
本步骤实际上是利用预先建立的地理位置推荐模型分别确定各候选地理位置的推荐评分。在此之前可以首先确定候选地理位置。可以将地图数据库中所有的地理位置作为候选地理位置。但为了减小计算量,优选地,可以对地图数据库中的地理位置执行以下至少一种过滤处理后,剩余的地理位置作为所述候选地理位置:
依据所述用户所在的当前地点,过滤掉距离当前地点超过预设距离阈值的地理位置。即将距离用户明显过远的地理位置过滤掉。
依据用户的查询历史,过滤掉与用户的查询历史之间的相关度低于预设相关度阈值的地理位置。例如用户从来没查询过的地理位置可以直接过滤掉,再例如用户从来没查询过的地理位置类型可以直接过滤掉,等等。
经过本申请发明人的长期研究发现,大约有20%的用户喜欢在短期内(例如7天内)重复查询相同或相似的地理位置,有超过60%的用户最新查询的地理位置可以在该用户的查询历史中找到相同或相似的地理位置。因此如果可以通过学习用户的历史兴趣来捕捉用户对地理位置的偏好,那么就可以向用户实时地推荐符合用户偏好的地理位置。因此,本申请的核心思想是将用户的查询历史的向量表示与候选地理位置的向量表示进行融合,并进一步拼接用户的画像向量表示,以作为候选地理位置的推荐评分基础,使得各候选地理位置的推荐评分能够体现用户的查询偏好,使得推荐的地理位置能够更准确地“猜出”用户的查询需求。
地理位置推荐模型的具体工作原理将在实施例二中进行详细描述。
在203中,依据各候选地理位置的推荐评分,确定向用户推荐的地理位置。
例如,可以将推荐评分排在前M个的候选地理位置作为向用户推荐的地理位置,M为预设的正整数。再例如,可以将推荐评分超过预设评分阈值的候选地理位置作为向用户推荐的地理位置。
在向用户推荐地理位置时,可以采用诸如下拉列表、浮窗、对话框等等形式,本申请对此并不加以限制。
另外,本申请中涉及的地理位置,包括地图数据库中的地理位置,指的是地图类应用中的地理位置点,该地理位置点可以供用户检索、浏览,向用户推荐等。这些地理位置点具有经纬度、名称、行政地址、类型等基本属性。其中地理位置点可以包括但不限于POI(Point Of Interest,兴趣点)、AOI(Area of Interest,兴趣面)、ROI(Regin ofInterest,兴趣区域)等。在后续实施例中均以POI为例进行描述。
实施例二、
下面结合图3对本申请中地理位置推荐模型对各候选POI进行推荐分的原理进行详细描述。
在本实施例中,候选POI进行推荐评分时,可以考虑四方面的向量表示:候选POI的融合向量表示、时间的融合向量表示、地点的融合向量表示以及用户画像的向量表示。其中,候选POI的融合向量表示体现的是候选POI对用户历史查询偏好的匹配状况,用户画像的向量表示体现的是候选POI与用户画像的匹配状况,这两种向量表示是本申请的核心,主要体现了用户的个性化偏好。时间的融合向量表示体现的是当前时间场景与用户历史查询偏好的匹配状况,地点的融合向量表示体现的是当前地点场景与用户历史查询偏好的匹配状况。
下面逐一对上述四种融合向量表示进行描述:
1)候选POI的融合向量表示。
如图3中所示,候选POI的融合向量表示是由地理位置融合层将候选POI的向量表示、用户短期兴趣POI的向量表示以及用户长期兴趣POI的向量表示进行融合后得到的,从而使得最终候选POI的推荐评分体现出候选POI与用户长、短期兴趣的匹配情况。此处的融合可以采用Attention(注意力)的机制,在此可以称为POI Attention。其中用户短期兴趣POI的向量表示和用户长期兴趣POI的向量表示体现的是用户的查询历史的向量表示。在本实施例中采用的优选实施方式中,将用户短期兴趣POI的向量表示和用户长期兴趣的POI向量表示都进行融合,也可以仅融合其中一种。
其中用户长期兴趣POI的向量表示是由长期兴趣编码层得到的。具体地,长期兴趣编码层从历史查询序列中,获取用户在第一时长内访问过的POI,利用用户在第一时长内访问过的POI的向量表示获取用户的短期兴趣POI的向量表示。
用户短期兴趣POI的向量表示是由短期兴趣编码层得到的。具体地,短期兴趣编码层从历史查询序列中,获取用户在第二时长内访问过的POI,利用用户在第二时长内访问过的POI的向量表示获取用户的长期兴趣POI的向量表示。
其中,上述第一时长大于第二时长。
具体地,用户访问过的各POI构成历史查询序列,例如用户查询或点击过的POI,其中除了POI的信息之外,还包括访问各POI时对应的时间信息和地点信息(本申请中的地点信息指的是用户所在的地点,例如用户查询某个POI时所在的地点)。
其中,用户在第一时长内查询或点击过的POI可以看作是用户的长期查询历史。例如用户在3个月内查询或点击过的POI,反映了用户长期的内在的兴趣偏好。
用户在第二时长内查询或点击过的POI可以看作是用户的短期查询历史。例如用户在7天内查询或点击过的POI,反映了用户的短期即时兴趣。
作为一种优选的实施方式,长期兴趣编码层可以预先按照时间(例如按照小时,或者按照上午、中午、下午、晚上等时间划分方式)对该用户在第一时长内访问过的POI进行统计,确定出各时间段下该用户访问各类或各种地理位置的概率分布数据。然后可以以先验知识的方式存储于记忆网络以备后续使用。
举个例子,每4个小时划分为一个时间段,可以统计出用户在各个时间段对各种POI的访问概率。在早上6点到10点时间段,用户访问办公楼类POI的概率为90%,用户访问火车站类POI的概率为2%,等等;在下午6点到晚上10点的时间段,用户访问餐馆类POI的概率为30%,访问商场类POI的概率为30%,访问住宅类POI的概率为35%,等等。
长期兴趣编码层还可以预先按照空间(例如可以将地球平面划分为栅格,栅格的大小可以灵活设置;也可以依据行政区域进行空间划分)对用户在第一时长内访问过的POI进行统计,确定出各空间格内用户访问各类或各种POI的概率分布数据。同样可以以先验知识的方式存储于记忆网络以备后续使用。
举个例子,用户在栅格b访问办公类POI的概率为60%,访问景区类POI的概率为10%,等等。用户在栅格a访问住宅类POI的概率为50%,访问教育类POI的概率为30%,等等。
然后当获取到图2所示实施例中201所述的触发事件时,将该触发事件的时间称为当前时间,用户所在的地点称为当前地点。长期兴趣编码层利用当前时间和当前地点查询上述记忆网络,具体地,可以查询当前时间所属时间段对应的各类或各种POI的概率分布数据,查询当前地点所述空间格对应的各类或各种POI的概率分布数据。利用查询到的各类或各种POI的概率分布数据,得到用户的长期兴趣POI的向量表示。例如,可以将依据当前时间查询到的各类或各种POI的概率分布数据与依据当前地点查询到的各类或各种POI的概率分布数据进行求平均等处理后,经过归一化得到用户的长期兴趣POI的向量表示。在该向量表示中,各元素可以代表各类或各种POI,各元素的取值可以代表访问该类过该种POI的概率。
上述预先统计后实时查询统计结果的方式能够加快确定用户长期兴趣POI的向量表示的效率。但除了这种方式之外,也可以采用其他方式,例如将用户在第一时长内访问过的各POI的向量表示进行融合后得到。
作为一种优选的实施方式,短期兴趣编码层可以将用户在第二时长内访问过的各POI的向量表示进行Multi-head Attention(多头注意力)机制的处理,得到所述用户的短期兴趣POI的向量表示。这种方式采用Multi-head Attention建立用户查询POI序列中的关联关系,相比较常用的LSTM和CNN编码POI序列上下文关联的方式,具有简单、高效和容易并行的优点,适合在大规模数据场景下使用。其中,各POI的向量表示由POI编码层得到。
候选POI的向量表示由POI编码层得到。
对于POI编码层而言,可以各POI的属性信息进行编码得到各POI的向量表示。对各POI的属性信息进行编码时,其中涉及的属性信息可以包括但不限于POI的标识、名称、类别、地址、标签等信息。可以将POI的名称和地址信息等文本类属性信息采用卷积神经网络进行编码,将POI的其他属性信息采用前馈神经网络进行编码。然后,将同一POI的编码结果进行拼接后得到的向量经过全连接层的映射,得到该POI的向量表示。这种POI向量表示的编码方式能够有效融合多种POI属性,从而使得POI作为一种多类型属性信息的聚合体,能够在向量表示中得到充分体现。
2)用户的画像向量表示。
用户画像编码层将用户的画像信息分别采用神经网络(例如卷积神经网络)进行编码,将编码得到的向量表示进行拼接后,经过全连接层的映射得到用户的画像向量表示。通过对用户画像的编码使得模型对POI的推荐评分能够体现用户的个性化属性特征。
其中用户的画像信息可以包括诸如用户ID(标识)、性别、年龄、消费水平、职业等。
3)时间的融合向量表示。
时间编码层将当前时间的向量表示与第二时长内访问POI的时间向量表示进行融合,得到时间的融合向量表示。其中,用户在短期(即第二时长内)访问POI时的一系列时间序列可以量化为一个向量表示,将该向量表示与当前时间的向量表示进行Attention处理,在此可以称为Temporal Attention,得到时间的融合向量表示。
4)地点的融合向量表示。
地点编码层将当前地点(用户触发事件发生的地点)的向量表示与第二时长内访问POI的地点向量表示进行融合,得到地点的融合向量表示。其中,用户在短期(即第二时长内)访问POI时所在的一系列地点序列可以量化为一个向量表示,将该向量表示与当前地点的向量表示进行Attention处理,在此可以称为Spatial Attention,得到地点的融合向量表示。
获得了上述四种融合向量表示后,将候选POI的融合向量表示、时间的融合向量表示、地点的融合向量表示以及用户的画像向量表示进行拼接后,经过全连接层的处理,得到候选POI的推荐评分。
以上是对POI推荐的过程进行的详细描述。但上述实现基于地理位置推荐模型的预先训练。下面结合实施例三对地理位置推荐模型的训练过程进行详细描述。
实施例三、
图4为本申请实施例三提供的训练地理位置推荐模型的方法流程图,如图4中所示,该方法包括以下步骤:
在401中,从历史查询日志中获取训练数据,各训练数据包括:用户的查询历史、向该用户推荐的POI样本,其中样本包括正样本和负样本。
在本申请中,一种获取训练数据的方式可以为:若之前向用户进行过POI推荐,那么推荐的POI中用户选择的POI可以作为正样本,未被选择的POI作为负样本,在向用户推荐之前用户的查询历史也作为训练数据的内容。
但若之前未向用户推荐过POI,或者数据很稀疏,则上述训练数据的获取方式就不合适进行地理位置推荐模型的训练。在此提供一种优选的训练数据获取方式:获取用户的历史查询序列,将历史查询序列中前N-1个POI作为训练数据中用户的查询历史,由于在前N-1个POI之后,用户又查询了第N个POI,则说明若在前N-1个POI之后向用户推荐该第N个POI的准确度是最高的。因此可以将第N个POI作为正样本,选择用户未查询过的POI作为负样本。通过这种方式可以构建很多训练样本来进行模型训练;所述N为预设的正整数。
在402中,利用各训练数据训练地理位置推荐模型,地理位置推荐模型至少包括地理位置融合层和全连接层,训练目标为最大化同一训练数据中正样本的推荐评分与负样本的推荐评分的差值。
地理位置推荐模型的工作原理仍和实施例二中类似,此时训练数据中的正样本和负样本相当于各自作为候选POI,通过地理位置推荐模型后分别得到正样本的推荐评分和负样本的推荐评分。在训练模型过程中构建损失函数,每一轮根据损失函数的取值,对地理位置推荐模型的模型参数进行优化,目标最大化同一训练数据中正样本的推荐评分和负样本的推荐评分的差值。进行迭代优化直至损失函数小于预设损失阈值,或者迭代次数达到预设的次数阈值等,训练结束后得到地理位置推荐模型。
具体地,对于一个训练数据而言,假设其表示为(H,p+,p-),其中,H表示查询历史,p+表示正样本的POI,p-表示负样本的POI。
地理位置融合层将训练数据中用户的H的向量表示与其中一个POI样本(p+或p1)的向量表示进行融合,得到该POI样本的融合向量表示;至少将该POI样本的融合向量表示与对应用户的画像向量表示进行拼接,将拼接后得到的向量表示经过全连接层的处理,得到该POI样本的推荐评分。
地理位置推荐模型还包括长期兴趣编码层和/或短期兴趣编码层。其中长期兴趣编码层获取用户在正样本p+之前第一时长内访问过的POI,利用用户在第一时长内访问过的各POI的向量表示获取用户的长期兴趣POI的向量表示。短期兴趣编码层获取用户在正样本p+之前第二时长内访问过的POI,利用用户在第二时长内访问过的各POI的向量表示获取用户的短期兴趣POI的向量表示;第一时长大于所述第二时长,其中上述访问包括查询或点击。
具体地,长期兴趣编码层可以预先按照时间对用户在p+之前第一时长内访问过的POI进行统计,确定出各时间段下用户访问各类或各种POI的概率分布数据;预先按照空间对用户在第一时长内访问过的POI进行统计,确定出各空间格内用户访问各类或各种地理位置的概率分布数据;利用查询p+的当前时间和当前地点,查询当前时间所属时间段对应的各类或各种POI的概率分布数据,以及当前地点所属空间格对应的各类或各种POI的概率分布数据;利用查询到的各类或各种POI的概率分布数据,得到用户的长期兴趣地理位置的向量表示。
短期兴趣编码层可以将用户在p+之前第二时长内访问过的各地理位置的向量表示进行Multi-head Attention机制的处理,得到用户的短期兴趣POI的向量表示。
用户画像编码层将将用户的画像信息分别采用神经网络进行编码;将编码得到的向量表示进行拼接后,经过全连接层的映射得到用户的画像向量表示。
地理位置编码层将POI的文本类属性信息采用卷积神经网络进行编码;将地理位置的其他属性信息采用前馈神经网络进行编码;将同一地理位置的编码结果进行拼接后,经过全连接层的映射,得到该地理位置的向量表示。
其中,地理位置编码层可以采用上述方式得到POI样本的向量表示,也可以得到短期兴趣编码层、长期兴趣编码层在处理过程中使用到的各POI的向量表示,以供短期兴趣编码层、长期兴趣编码层使用。
时间编码层将正样本p+对应的访问时间的向量表示与上述第二时长内访问POI的时间向量表示进行融合,得到时间的融合向量表示。
地点编码层将访问正样本p+时所在的地点的向量表示与上述第二时长内访问POI的地点表示进行融合,得到地点的融合向量表示。
地理位置融合层在进行拼接时,可以将POI样本的融合向量表示、对应用户的画像向量表示、时间的融合向量表示以及地点的融合向量表示进行拼接。
上述长期兴趣编码层、短期兴趣编码层、用户画像编码层、地理位置编码层、时间编码层、地点编码层、地点位置融合层以及全连接层的工作原理可以参见实施例二中的相关记载,在此不做进一步详述。上述“用户”指的是训练数据所对应的用户,即训练数据所来源的用户。训练数据是从哪个用户的历史查询序列获取的,就对应哪个用户。
经过上述过程,对于同一训练数据中的p+和p-,能够分别计算出p+的推荐评分和p-的推荐评分。训练目标为最大化p+的推荐评分和p-的推荐评分之间的差值。若p+的推荐评分和p-的推荐评分分别表示为D(p+)和D(p-),那么损失函数Loss可以采用诸如:
Loss=max[0,γ+D(p+)-D(p-)]
其中,γ为超参数。
在模型训练过程中,不断优化上述长期兴趣编码层、短期兴趣编码层、用户画像编码层、时间编码层、地点编码层、地点位置融合层以及全连接层的模型参数。POI编码层可以预先训练得到,也可以在上述模型训练过程中不断优化参数。
以上是对本申请所提供的方法进行的详细描述,下面结合实施例四和实施例五对本申请提供装置进行详细描述。
实施例四、
图5为本申请实施例四提供的地理位置的推荐装置的结构图,该装置是可以位于服务器端的应用程序,或者还可以为位于服务器端应用程序的插件或软件开发工具包(Software Development Kit,SDK)等功能单元,本发明实施例对此不进行特别限定。如图5中所示,该装置可以包括:触发单元00、评分单元10和推荐单元20。其中,各组成单元的主要功能如下:
触发单元00,用于获取向用户推荐地理位置的触发事件。
本申请中可以应用于多种应用场景下的触发事件,可以包括但不限于以下几种:
1)获取用户将焦点定位于检索框的事件。例如用户打开地图类应用的界面,在界面上的检索框中定位焦点,那么在用户输入要查询的地理位置之前,可以获取到该事件并向用户进行地理位置推荐。
2)获取用户点击触发地理位置推荐的功能组件的事件。例如地图类应用的界面上设置有专用于触发地理位置推荐的功能组件,例如可以触发地理位置推荐的按钮,当用户点击该组件时,获取到该事件并向用户进行地理位置推荐。
3)获取用户输入的地理位置推荐的语音指令。例如当用户打开地图类应用的界面并触发语音输入功能,若用户输入诸如“请推荐地理位置”的语音指令,则获取到该事件并向用户进行地理位置推荐。
本申请实施例中还可以进一步包括一个用于确定候选地理位置的单元(图中未示出)。该单元也可以是一个已有单元,本申请直接利用该已有单元。该单元可以将地图数据库中所有的地理位置作为候选地理位置。但为了减小计算量,优选地,可以对地图数据库中的地理位置执行以下至少一种过滤处理后,剩余的地理位置作为所述候选地理位置:
依据所述用户所在的当前地点,过滤掉距离当前地点超过预设距离阈值的地理位置。即将距离用户明显过远的地理位置过滤掉。
依据用户的查询历史,过滤掉与用户的查询历史之间的相关度低于预设相关度阈值的地理位置。例如用户从来没查询过的地理位置可以直接过滤掉,再例如用户从来没查询过的地理位置类型可以直接过滤掉,等等。
评分单元10,用于针对各候选地理位置分别执行:将用户的查询历史的向量表示与候选地理位置的向量表示进行融合,得到候选地理位置的融合向量表示;至少将候选地理位置的融合向量表示与用户的画像向量表示进行拼接,将拼接后得到的向量表示经过全连接层的处理,得到该候选地理位置的推荐评分。
推荐单元20,用于依据各候选地理位置的推荐评分,确定向用户推荐的地理位置。
例如,可以将推荐评分排在前M个的候选地理位置作为向用户推荐的地理位置,M为预设的正整数。再例如,可以将推荐评分超过预设评分阈值的候选地理位置作为向用户推荐的地理位置。
在向用户推荐地理位置时,可以采用诸如下拉列表、浮窗、对话框等等形式,本申请对此并不加以限制。
其中评分单元10可以具体包括:
地理位置融合单元11,用于将用户的查询历史的向量表示与候选地理位置的向量表示进行融合,得到候选地理位置的融合向量表示。
拼接单元12,用于至少将候选地理位置的融合向量表示与用户的画像向量表示进行拼接,将拼接后得到的向量表示经过全连接层13的处理,得到该候选地理位置的推荐评分。
更进一步地,评分单元10还包括:长期兴趣编码单元14和/或短期兴趣编码单元15。图中示出的是同时包含两个单元的情况。
长期兴趣编码单元14,用于获取用户在第一时长内访问过的地理位置,利用用户在第一时长内访问过的各地理位置的向量表示获取用户的长期兴趣地理位置的向量表示。
短期兴趣编码单元15,用于获取用户在第二时长内访问过的地理位置,利用用户在第二时长内访问过的各地理位置的向量表示获取用户的短期兴趣地理位置的向量表示;第一时长大于所述第二时长,所述访问包括查询或点击。
具体地,长期兴趣编码单元14预先按照时间对用户在第一时长内访问过的地理位置进行统计,确定出各时间段下用户访问各类或各种地理位置的概率分布数据;预先按照空间对用户在第一时长内访问过的地理位置进行统计,确定出各空间格内用户访问各类或各种地理位置的概率分布数据;利用获取触发事件的当前时间和当前地点,查询当前时间所属时间段对应的各类或各种地理位置的概率分布数据,以及当前地点所属空间格对应的各类或各种地理位置的概率分布数据;利用查询到的各类或各种地理位置的概率分布数据,得到用户的长期兴趣地理位置的向量表示。
短期兴趣编码单元15将用户在第二时长内访问过的各地理位置的向量表示进行Multi-head Attention机制的处理,得到用户的短期兴趣地理位置的向量表示。
更进一步地,评分单元10还包括:
用户画像编码单元16,用于将用户的画像信息分别采用神经网络进行编码;将编码得到的向量表示进行拼接后,经过全连接层的映射得到用户的画像向量表示。
地理位置编码单元17,用于将地理位置的文本类属性信息采用卷积神经网络进行编码;将地理位置的其他属性信息采用前馈神经网络进行编码;将同一地理位置的编码结果进行拼接后,经过全连接层的映射,得到该地理位置的向量表示。
时间编码单元18,用于将获取触发事件的当前时间的向量表示与第二时长内访问地理位置的时间向量表示进行融合,得到时间的融合向量表示。
地点编码单元19,用于将获取触发事件的当前地点的向量表示与第二时长内访问地理位置的地点向量表示进行融合,得到地点的融合向量表示。
这种情况下,拼接单元12可以将候选地理位置的融合向量表示、用户的画像向量表示、时间的融合向量表示以及地点的融合向量表示进行拼接后提供给全连接层。
上述装置中涉及的各种融合处理可以采用注意力机制。
实施例五、
图6为本申请实施例五提供的训练地理位置推荐模型的装置的结构图,该装置是可以位于服务器端的应用程序,或者还可以为位于服务器端应用程序的插件或软件开发工具包(Software Development Kit,SDK)等功能单元,本发明实施例对此不进行特别限定。如图6中所示,该装置可以包括:训练数据获取单元30和推荐模型训练单元40。其中各组成单元的主要功能如下:
训练数据获取单元30,用于从历史查询日志中获取训练数据,各训练数据包括:用户的查询历史、向用户推荐的地理位置样本,样本包括正样本和负样本。
具体地,训练数据获取单元30可以获取用户的历史查询序列;将历史查询序列中前N-1个地理位置作为训练数据中用户的查询历史,将第N个地理位置作为训练数据中正样本,选择用户未查询过的地理位置作为训练数据中负样本,N为预设的正整数。
推荐模型训练单元40,用于利用各训练数据训练地理位置推荐模型,地理位置推荐模型至少包括:地理位置融合层和全连接层;
其中地理位置融合层将训练数据中用户的查询历史的向量表示与其中一个地理位置样本的向量表示进行融合,得到该地理位置样本的融合向量表示;至少将该地理位置样本的融合向量表示与对应用户的画像向量表示进行拼接,将拼接后得到的向量表示经过全连接层的处理,得到该地理位置样本的推荐评分。
训练目标为:最大化同一训练数据中正样本的推荐评分与负样本的推荐评分的差值。
其中,地理位置推荐模型还包括:长期兴趣编码层和/或短期兴趣编码层;
长期兴趣编码层获取用户在正样本之前第一时长内访问过的地理位置,利用用户在第一时长内访问过的各地理位置的向量表示获取用户的长期兴趣地理位置的向量表示。
短期兴趣编码层获取用户在正样本之前第二时长内访问过的地理位置,利用用户在第二时长内访问过的各地理位置的向量表示获取用户的短期兴趣地理位置的向量表示。所述第一时长大于所述第二时长,所述访问包括查询或点击。
长期兴趣编码层,用于预先按照时间对用户在正样本之前第一时长内访问过的地理位置进行统计,确定出各时间段下用户访问各类或各种地理位置的概率分布数据;预先按照空间对用户在第一时长内访问过的地理位置进行统计,确定出各空间格内用户访问各类或各种地理位置的概率分布数据;利用查询正样本的当前时间和当前地点,查询当前时间所属时间段对应的各类或各种地理位置的概率分布数据,以及当前地点所属空间格对应的各类或各种地理位置的概率分布数据;利用查询到的各类或各种地理位置的概率分布数据,得到用户的长期兴趣地理位置的向量表示。
短期兴趣编码层,用于将用户在正样本之前第二时长内访问过的各地理位置的向量表示进行Multi-head Attention机制的处理,得到用户的短期兴趣地理位置的向量表示。
更进一步地,地理位置推荐模型还可以包括:用户画像编码层。用户画像编码层,用于将用户的画像信息分别采用神经网络进行编码;将编码得到的向量表示进行拼接后,经过全连接层的映射得到用户的画像向量表示。
此处之外,地理位置推荐模型还可以包括:地理位置编码层,用于将地理位置的文本类属性信息采用卷积神经网络进行编码;将地理位置的其他属性信息采用前馈神经网络进行编码;将同一地理位置的编码结果进行拼接后,经过全连接层的映射,得到该地理位置的向量表示。
更进一步地,地理位置推荐模型还可以包括:时间编码层和地点编码层。
时间编码层,用于将正样本对应的访问时间的向量表示与第二时长内访问地理位置的时间向量表示进行融合,得到时间的融合向量表示。
地点编码层,用于将访问正样本时所在的地点的向量表示与第二时长内访问地理位置的地点表示进行融合,得到地点的融合向量表示。
地理位置融合层在进行拼接时,具体将地理位置样本的融合向量表示、对应用户的画像向量表示、时间的融合向量表示以及地点的融合向量表示进行拼接。
同样,上述各单元涉及的融合处理可以采用注意力机制。
根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。
如图7所示,是根据本申请实施例的地理位置的推荐方法或训练地理位置推荐模型的方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图7所示,该电子设备包括:一个或多个处理器701、存储器702,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图7中以一个处理器701为例。
存储器702即为本申请所提供的非瞬时计算机可读存储介质。其中,所述存储器存储有可由至少一个处理器执行的指令,以使所述至少一个处理器执行本申请所提供的地理位置的推荐方法或训练地理位置推荐模型的方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的地理位置的推荐方法或训练地理位置推荐模型的方法。
存储器702作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的地理位置的推荐方法或训练地理位置推荐模型的方法对应的程序指令/模块。处理器701通过运行存储在存储器702中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的地理位置的推荐方法或训练地理位置推荐模型的方法。
存储器702可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据该电子设备的使用所创建的数据等。此外,存储器702可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器702可选包括相对于处理器701远程设置的存储器,这些远程存储器可以通过网络连接至电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
该电子设备还可以包括:输入装置703和输出装置704。处理器701、存储器702、输入装置703和输出装置704可以通过总线或者其他方式连接,图7中以通过总线连接为例。
输入装置703可接收输入的数字或字符信息,以及产生与该电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置704可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
通过上述实施例所提供的技术内容,可以实现如下技术场景:
当用户打开地图类应用准备查询一个POI并进行前往,当用户的光标焦点定位于检索框时,获取到向用户推荐地理位置的触发事件。根据用户长期和近期的查询偏好,以及可以进一步依据用户的当前时间和当前地点,“猜出”用户要查询的POI,并向用户推荐。如图8中所示,可以通过列表的行驶向用户推荐POI,并且可以在列表中嵌入导航功能组件等。用户能够从推荐的POI中直接选择一个,从而完成基于该POI的查询或导航等功能。节省了用户输入POI名称需要花费的时间和精力,大大提升了用户体验。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。
Claims (29)
1.一种地理位置的推荐方法,其特征在于,该方法包括:
获取向用户推荐地理位置的触发事件;
针对各候选地理位置分别执行:将所述用户的查询历史的向量表示与候选地理位置的向量表示进行融合,得到候选地理位置的融合向量表示;至少将所述候选地理位置的融合向量表示与所述用户的画像向量表示进行拼接,将拼接后得到的向量表示经过全连接层的处理,得到该候选地理位置的推荐评分;
依据各候选地理位置的推荐评分,确定向所述用户推荐的地理位置。
2.根据权利要求1所述的方法,其特征在于,所述用户的查询历史的向量表示采用以下方式获取:
获取所述用户在第一时长内访问过的地理位置,利用所述用户在第一时长内访问过的各地理位置的向量表示获取所述用户的长期兴趣地理位置的向量表示;和/或,
获取所述用户在第二时长内访问过的地理位置,利用所述用户在第二时长内访问过的各地理位置的向量表示获取所述用户的短期兴趣地理位置的向量表示;
所述第一时长大于所述第二时长,所述访问包括查询或点击。
3.根据权利要求2所述的方法,其特征在于,利用所述用户在第一时长内查询或点击过的各地理位置的向量表示获取所述用户的长期兴趣地理位置的向量表示,包括:
预先按照时间对所述用户在所述第一时长内访问过的地理位置进行统计,确定出各时间段下所述用户访问各类或各种地理位置的概率分布数据;
预先按照空间对所述用户在所述第一时长内访问过的地理位置进行统计,确定出各空间格内所述用户访问各类或各种地理位置的概率分布数据;
利用获取所述触发事件的当前时间和当前地点,查询所述当前时间所属时间段对应的各类或各种地理位置的概率分布数据,以及所述当前地点所属空间格对应的各类或各种地理位置的概率分布数据;
利用查询到的各类或各种地理位置的概率分布数据,得到所述用户的长期兴趣地理位置的向量表示。
4.根据权利要求2所述的方法,其特征在于,利用所述用户在第二时长内查询或点击过的各地理位置的向量表示获取所述用户的短期兴趣地理位置的向量表示,包括:
将所述用户在第二时长内访问过的各地理位置的向量表示进行多头注意力Multi-head Attention机制的处理,得到所述用户的短期兴趣地理位置的向量表示。
5.根据权利要求1所述的方法,其特征在于,所述用户的画像向量表示采用如下方式获取:
将所述用户的画像信息分别采用神经网络进行编码;
将编码得到的向量表示进行拼接后,经过全连接层的映射得到所述用户的画像向量表示。
6.根据权利要求1、2、3或4所述的方法,其特征在于,地理位置的向量表示采用如下方式获取:
将地理位置的文本类属性信息采用卷积神经网络进行编码;
将地理位置的其他属性信息采用前馈神经网络进行编码;
将同一地理位置的编码结果进行拼接后,经过全连接层的映射,得到该地理位置的向量表示。
7.根据权利要求2所述的方法,其特征在于,至少将所述候选地理位置的融合向量表示与所述用户的画像向量表示进行拼接包括:
将获取所述触发事件的当前时间的向量表示与所述第二时长内访问地理位置的时间向量表示进行融合,得到时间的融合向量表示;
将获取所述触发事件的当前地点的向量表示与所述第二时长内访问地理位置的地点向量表示进行融合,得到地点的融合向量表示;
将所述候选地理位置的融合向量表示、所述用户的画像向量表示、所述时间的融合向量表示以及所述地点的融合向量表示进行拼接。
8.根据权利要求1或7所述的方法,其特征在于,所述进行融合包括:进行注意力机制的处理。
9.一种训练地理位置推荐模型的方法,其特征在于,该方法包括:
从历史查询日志中获取训练数据,各训练数据包括:用户的查询历史、向所述用户推荐的地理位置样本,所述样本包括正样本和负样本;
利用各训练数据训练地理位置推荐模型,所述地理位置推荐模型至少包括:地理位置融合层和全连接层;
其中所述地理位置融合层将训练数据中用户的查询历史的向量表示与其中一个地理位置样本的向量表示进行融合,得到该地理位置样本的融合向量表示;至少将该地理位置样本的融合向量表示与对应用户的画像向量表示进行拼接,将拼接后得到的向量表示经过全连接层的处理,得到该地理位置样本的推荐评分;
训练目标为:最大化同一训练数据中正样本的推荐评分与负样本的推荐评分的差值。
10.根据权利要求9所述的方法,其特征在于,所述从历史查询日志中获取训练数据包括:
获取用户的历史查询序列;
将所述历史查询序列中前N-1个地理位置作为训练数据中所述用户的查询历史,将第N个地理位置作为训练数据中所述正样本,选择所述用户未查询过的地理位置作为训练数据中所述负样本,所述N为预设的正整数。
11.根据权利要求10所述的方法,其特征在于,所述地理位置推荐模型还包括:长期兴趣编码层和/或短期兴趣编码层;
所述长期兴趣编码层获取用户在所述正样本之前第一时长内访问过的地理位置,利用用户在所述第一时长内访问过的各地理位置的向量表示获取用户的长期兴趣地理位置的向量表示;
所述短期兴趣编码层获取用户在所述正样本之前第二时长内访问过的地理位置,利用用户在第二时长内访问过的各地理位置的向量表示获取用户的短期兴趣地理位置的向量表示;
所述第一时长大于所述第二时长,所述访问包括查询或点击。
12.根据权利要求11所述的方法,其特征在于,所述利用用户在所述第一时长内访问过的各地理位置的向量表示获取用户的长期兴趣地理位置的向量表示,包括:
所述长期兴趣编码层预先按照时间对所述用户在所述正样本之前第一时长内访问过的地理位置进行统计,确定出各时间段下所述用户访问各类或各种地理位置的概率分布数据;预先按照空间对所述用户在所述第一时长内访问过的地理位置进行统计,确定出各空间格内所述用户访问各类或各种地理位置的概率分布数据;利用查询所述正样本的当前时间和当前地点,查询所述当前时间所属时间段对应的各类或各种地理位置的概率分布数据,以及所述当前地点所属空间格对应的各类或各种地理位置的概率分布数据;利用查询到的各类或各种地理位置的概率分布数据,得到所述用户的长期兴趣地理位置的向量表示。
13.根据权利要求11所述的方法,其特征在于,所述利用用户在第二时长内访问过的各地理位置的向量表示获取用户的短期兴趣地理位置的向量表示,包括:
所述短期兴趣编码层将所述用户在所述正样本之前第二时长内访问过的各地理位置的向量表示进行Multi-head Attention机制的处理,得到所述用户的短期兴趣地理位置的向量表示。
14.根据权利要求11所述的方法,其特征在于,所述地理位置推荐模型还包括:用户画像编码层;
所述用户画像编码层将用户的画像信息分别采用神经网络进行编码;将编码得到的向量表示进行拼接后,经过全连接层的映射得到用户的画像向量表示。
15.根据权利要求9、11、12或13所述的方法,其特征在于,所述地理位置推荐模型还包括:地理位置编码层;
所述地理位置编码层将地理位置的文本类属性信息采用卷积神经网络进行编码;将地理位置的其他属性信息采用前馈神经网络进行编码;将同一地理位置的编码结果进行拼接后,经过全连接层的映射,得到该地理位置的向量表示。
16.根据权利要求13所述的方法,其特征在于,所述地理位置推荐模型还包括:时间编码层和地点编码层;
所述时间编码层将所述正样本对应的访问时间的向量表示与所述第二时长内访问地理位置的时间向量表示进行融合,得到时间的融合向量表示;
所述地点编码层将访问所述正样本时所在的地点的向量表示与所述第二时长内访问地理位置的地点表示进行融合,得到地点的融合向量表示;
所述地理位置融合层在进行所述拼接时,具体将所述地理位置样本的融合向量表示、对应用户的画像向量表示、所述时间的融合向量表示以及所述地点的融合向量表示进行拼接。
17.一种地理位置的推荐装置,其特征在于,该装置包括:
触发单元,用于获取向用户推荐地理位置的触发事件;
评分单元,用于针对各候选地理位置分别执行:将所述用户的查询历史的向量表示与候选地理位置的向量表示进行融合,得到候选地理位置的融合向量表示;至少将所述候选地理位置的融合向量表示与所述用户的画像向量表示进行拼接,将拼接后得到的向量表示经过全连接层的处理,得到该候选地理位置的推荐评分;
推荐单元,用于依据各候选地理位置的推荐评分,确定向所述用户推荐的地理位置。
18.根据权利要求17所述的装置,其特征在于,所述评分单元包括:长期兴趣编码单元和/或短期兴趣编码单元,
所述长期兴趣编码单元,用于预先按照时间对所述用户在第一时长内访问过的地理位置进行统计,确定出各时间段下所述用户访问各类或各种地理位置的概率分布数据;预先按照空间对所述用户在所述第一时长内访问过的地理位置进行统计,确定出各空间格内所述用户访问各类或各种地理位置的概率分布数据;利用获取所述触发事件的当前时间和当前地点,查询所述当前时间所属时间段对应的各类或各种地理位置的概率分布数据,以及所述当前地点所属空间格对应的各类或各种地理位置的概率分布数据;利用查询到的各类或各种地理位置的概率分布数据,得到所述用户的长期兴趣地理位置的向量表示;
所述短期兴趣编码单元,用于将所述用户在第二时长内访问过的各地理位置的向量表示进行Multi-head Attention机制的处理,得到所述用户的短期兴趣地理位置的向量表示;
所述第一时长大于所述第二时长,所述访问包括查询或点击。
19.根据权利要求17所述的装置,其特征在于,所述评分单元包括:
用户画像编码单元,用于将所述用户的画像信息分别采用神经网络进行编码;将编码得到的向量表示进行拼接后,经过全连接层的映射得到所述用户的画像向量表示。
20.根据权利要求17、18或19所述的装置,其特征在于,所述评分单元包括:
地理位置编码单元,用于将地理位置的文本类属性信息采用卷积神经网络进行编码;将地理位置的其他属性信息采用前馈神经网络进行编码;将同一地理位置的编码结果进行拼接后,经过全连接层的映射,得到该地理位置的向量表示。
21.根据权利要求17所述的装置,其特征在于,所述评分单元包括:
时间编码单元,用于将获取所述触发事件的当前时间的向量表示与所述第二时长内访问地理位置的时间向量表示进行融合,得到时间的融合向量表示;
地点编码单元,用于将获取所述触发事件的当前地点的向量表示与所述第二时长内访问地理位置的地点向量表示进行融合,得到地点的融合向量表示;
拼接单元,用于将所述候选地理位置的融合向量表示、所述用户的画像向量表示、所述时间的融合向量表示以及所述地点的融合向量表示进行拼接后提供给所述全连接层。
22.一种训练地理位置推荐模型的装置,其特征在于,该装置包括:
训练数据获取单元,用于从历史查询日志中获取训练数据,各训练数据包括:用户的查询历史、向所述用户推荐的地理位置样本,所述样本包括正样本和负样本;
推荐模型训练单元,用于利用各训练数据训练地理位置推荐模型,所述地理位置推荐模型至少包括:地理位置融合层和全连接层;
其中所述地理位置融合层将训练数据中用户的查询历史的向量表示与其中一个地理位置样本的向量表示进行融合,得到该地理位置样本的融合向量表示;至少将该地理位置样本的融合向量表示与对应用户的画像向量表示进行拼接,将拼接后得到的向量表示经过全连接层的处理,得到该地理位置样本的推荐评分;
训练目标为:最大化同一训练数据中正样本的推荐评分与负样本的推荐评分的差值。
23.根据权利要求22所述的装置,其特征在于,所述训练数据获取单元,具体用于获取用户的历史查询序列;将所述历史查询序列中前N-1个地理位置作为训练数据中所述用户的查询历史,将第N个地理位置作为训练数据中所述正样本,选择所述用户未查询过的地理位置作为训练数据中所述负样本,所述N为预设的正整数。
24.根据权利要求23所述的装置,其特征在于,所述地理位置推荐模型还包括:长期兴趣编码层和/或短期兴趣编码层;
所述长期兴趣编码层,用于预先按照时间对所述用户在所述正样本之前第一时长内访问过的地理位置进行统计,确定出各时间段下所述用户访问各类或各种地理位置的概率分布数据;预先按照空间对所述用户在所述第一时长内访问过的地理位置进行统计,确定出各空间格内所述用户访问各类或各种地理位置的概率分布数据;利用查询所述正样本的当前时间和当前地点,查询所述当前时间所属时间段对应的各类或各种地理位置的概率分布数据,以及所述当前地点所属空间格对应的各类或各种地理位置的概率分布数据;利用查询到的各类或各种地理位置的概率分布数据,得到所述用户的长期兴趣地理位置的向量表示;
所述短期兴趣编码层,用于将所述用户在所述正样本之前第二时长内访问过的各地理位置的向量表示进行Multi-head Attention机制的处理,得到所述用户的短期兴趣地理位置的向量表示;
所述第一时长大于所述第二时长,所述访问包括查询或点击。
25.根据权利要求22所述的装置,其特征在于,所述地理位置推荐模型还包括:用户画像编码层;
所述用户画像编码层,用于将用户的画像信息分别采用神经网络进行编码;将编码得到的向量表示进行拼接后,经过全连接层的映射得到用户的画像向量表示。
26.根据权利要求22或24所述的装置,其特征在于,所述地理位置推荐模型还包括:地理位置编码层;
所述地理位置编码层,用于将地理位置的文本类属性信息采用卷积神经网络进行编码;将地理位置的其他属性信息采用前馈神经网络进行编码;将同一地理位置的编码结果进行拼接后,经过全连接层的映射,得到该地理位置的向量表示。
27.根据权利要求22所述的装置,其特征在于,所述地理位置推荐模型还包括:时间编码层和地点编码层;
所述时间编码层,用于将所述正样本对应的访问时间的向量表示与所述第二时长内访问地理位置的时间向量表示进行融合,得到时间的融合向量表示;
所述地点编码层,用于将访问所述正样本时所在的地点的向量表示与所述第二时长内访问地理位置的地点表示进行融合,得到地点的融合向量表示;
所述地理位置融合层在进行所述拼接时,具体将所述地理位置样本的融合向量表示、对应用户的画像向量表示、所述时间的融合向量表示以及所述地点的融合向量表示进行拼接。
28.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-16中任一项所述的方法。
29.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行权利要求1-16中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010351784.8A CN111666462B (zh) | 2020-04-28 | 2020-04-28 | 地理位置的推荐方法、装置、设备和计算机存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010351784.8A CN111666462B (zh) | 2020-04-28 | 2020-04-28 | 地理位置的推荐方法、装置、设备和计算机存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111666462A true CN111666462A (zh) | 2020-09-15 |
CN111666462B CN111666462B (zh) | 2021-09-21 |
Family
ID=72383000
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010351784.8A Active CN111666462B (zh) | 2020-04-28 | 2020-04-28 | 地理位置的推荐方法、装置、设备和计算机存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111666462B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112541123A (zh) * | 2020-12-24 | 2021-03-23 | 北京百度网讯科技有限公司 | 地图图区推荐方法、装置、设备及存储介质 |
CN113268669A (zh) * | 2021-06-01 | 2021-08-17 | 重庆大学 | 基于联合神经网络的面向关系挖掘的兴趣点推荐方法 |
CN113342912A (zh) * | 2021-05-24 | 2021-09-03 | 北京百度网讯科技有限公司 | 地理位置区域的编码方法、建立编码模型的方法及装置 |
CN113556484A (zh) * | 2021-07-16 | 2021-10-26 | 北京达佳互联信息技术有限公司 | 视频处理方法、装置、电子设备及计算机可读存储介质 |
CN113590674A (zh) * | 2021-06-29 | 2021-11-02 | 北京百度网讯科技有限公司 | 出行目的识别方法、装置、设备及存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170053034A1 (en) * | 2014-06-11 | 2017-02-23 | Sony Corporation | Display control device, display control method, and program |
CN107071578A (zh) * | 2017-05-24 | 2017-08-18 | 中国科学技术大学 | Iptv节目推荐方法 |
CN110020144A (zh) * | 2017-11-21 | 2019-07-16 | 腾讯科技(深圳)有限公司 | 一种推荐模型建立方法及其设备、存储介质、服务器 |
CN110825956A (zh) * | 2019-09-17 | 2020-02-21 | 中国平安人寿保险股份有限公司 | 一种信息流推荐方法、装置、计算机设备及存储介质 |
CN110929164A (zh) * | 2019-12-09 | 2020-03-27 | 北京交通大学 | 一种基于用户动态偏好与注意力机制的兴趣点推荐方法 |
CN110990717A (zh) * | 2019-11-22 | 2020-04-10 | 广西师范大学 | 一种基于跨域关联的兴趣点推荐方法 |
CN111061945A (zh) * | 2019-11-11 | 2020-04-24 | 汉海信息技术(上海)有限公司 | 推荐方法、装置、电子设备,存储介质 |
CN111061961A (zh) * | 2019-11-19 | 2020-04-24 | 江西财经大学 | 一种融合多特征的矩阵分解兴趣点推荐方法及其实现系统 |
-
2020
- 2020-04-28 CN CN202010351784.8A patent/CN111666462B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170053034A1 (en) * | 2014-06-11 | 2017-02-23 | Sony Corporation | Display control device, display control method, and program |
CN107071578A (zh) * | 2017-05-24 | 2017-08-18 | 中国科学技术大学 | Iptv节目推荐方法 |
CN110020144A (zh) * | 2017-11-21 | 2019-07-16 | 腾讯科技(深圳)有限公司 | 一种推荐模型建立方法及其设备、存储介质、服务器 |
CN110825956A (zh) * | 2019-09-17 | 2020-02-21 | 中国平安人寿保险股份有限公司 | 一种信息流推荐方法、装置、计算机设备及存储介质 |
CN111061945A (zh) * | 2019-11-11 | 2020-04-24 | 汉海信息技术(上海)有限公司 | 推荐方法、装置、电子设备,存储介质 |
CN111061961A (zh) * | 2019-11-19 | 2020-04-24 | 江西财经大学 | 一种融合多特征的矩阵分解兴趣点推荐方法及其实现系统 |
CN110990717A (zh) * | 2019-11-22 | 2020-04-10 | 广西师范大学 | 一种基于跨域关联的兴趣点推荐方法 |
CN110929164A (zh) * | 2019-12-09 | 2020-03-27 | 北京交通大学 | 一种基于用户动态偏好与注意力机制的兴趣点推荐方法 |
Non-Patent Citations (1)
Title |
---|
杜小倩: ""基于用户画像的推荐系统简述"", 《HTTPS://WENKU.BAIDU.COM/VIEW/C3781E52BC64783E0912A21614791711CD797904》 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112541123A (zh) * | 2020-12-24 | 2021-03-23 | 北京百度网讯科技有限公司 | 地图图区推荐方法、装置、设备及存储介质 |
CN113342912A (zh) * | 2021-05-24 | 2021-09-03 | 北京百度网讯科技有限公司 | 地理位置区域的编码方法、建立编码模型的方法及装置 |
WO2022247165A1 (zh) * | 2021-05-24 | 2022-12-01 | 北京百度网讯科技有限公司 | 地理位置区域的编码方法、建立编码模型的方法及装置 |
JP2023530795A (ja) * | 2021-05-24 | 2023-07-20 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | 地理的位置区域の符号化方法、符号化モデルを確立する方法、及び装置 |
CN113268669A (zh) * | 2021-06-01 | 2021-08-17 | 重庆大学 | 基于联合神经网络的面向关系挖掘的兴趣点推荐方法 |
CN113268669B (zh) * | 2021-06-01 | 2022-09-23 | 重庆大学 | 基于联合神经网络的面向关系挖掘的兴趣点推荐方法 |
CN113590674A (zh) * | 2021-06-29 | 2021-11-02 | 北京百度网讯科技有限公司 | 出行目的识别方法、装置、设备及存储介质 |
CN113556484A (zh) * | 2021-07-16 | 2021-10-26 | 北京达佳互联信息技术有限公司 | 视频处理方法、装置、电子设备及计算机可读存储介质 |
CN113556484B (zh) * | 2021-07-16 | 2024-02-06 | 北京达佳互联信息技术有限公司 | 视频处理方法、装置、电子设备及计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111666462B (zh) | 2021-09-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111666462B (zh) | 地理位置的推荐方法、装置、设备和计算机存储介质 | |
CN111222058B (zh) | 查询自动补全的方法、装置、设备和计算机存储介质 | |
CN111241427B (zh) | 查询自动补全的方法、装置、设备和计算机存储介质 | |
US11630560B2 (en) | Map information display method and apparatus, electronic device, and computer storage medium | |
CN111708876A (zh) | 生成信息的方法和装置 | |
CN111666292B (zh) | 用于检索地理位置的相似度模型建立方法和装置 | |
CN111506803B (zh) | 内容推荐方法、装置、电子设备及存储介质 | |
CN111666461B (zh) | 检索地理位置的方法、装置、设备和计算机存储介质 | |
CN112069275A (zh) | 一种目的地预测方法、装置、电子设备及存储介质 | |
JP7206514B2 (ja) | 地理位置点のソート方法、ソートモデルの訓練方法及び対応装置 | |
CN112001265A (zh) | 视频事件识别方法、装置、电子设备及存储介质 | |
CN111767477B (zh) | 一种检索方法、装置、电子设备和存储介质 | |
CN111523007A (zh) | 用户感兴趣信息确定方法、装置、设备以及存储介质 | |
CN112016326A (zh) | 一种地图区域词识别方法、装置、电子设备和存储介质 | |
CN111522888A (zh) | 挖掘兴趣点之间的竞争关系的方法和装置 | |
CN112232089B (zh) | 语义表示模型的预训练方法、设备和存储介质 | |
CN112100480B (zh) | 搜索方法、装置、设备及存储介质 | |
CN113902005A (zh) | 语言模型的预训练方法、装置、设备和存储介质 | |
CN112825256B (zh) | 录制语音包功能的引导方法、装置、设备和计算机存储介质 | |
CN113407586A (zh) | 数据检索方法、装置、办公系统、存储介质及电子设备 | |
CN111694914A (zh) | 用户常驻区域确定方法及装置 | |
CN111782748B (zh) | 地图检索方法、信息点poi语义向量的计算方法和装置 | |
CN113595770A (zh) | 群组点击率预估方法、装置、电子设备和存储介质 | |
CN111782794A (zh) | 问答响应方法和装置 | |
CN112052402A (zh) | 信息推荐方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |