CN113656698A - 兴趣特征提取模型的训练方法、装置和电子设备 - Google Patents

兴趣特征提取模型的训练方法、装置和电子设备 Download PDF

Info

Publication number
CN113656698A
CN113656698A CN202110977129.8A CN202110977129A CN113656698A CN 113656698 A CN113656698 A CN 113656698A CN 202110977129 A CN202110977129 A CN 202110977129A CN 113656698 A CN113656698 A CN 113656698A
Authority
CN
China
Prior art keywords
interest
points
user
point
initial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110977129.8A
Other languages
English (en)
Other versions
CN113656698B (zh
Inventor
张澍
陈浩
黄际洲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202110977129.8A priority Critical patent/CN113656698B/zh
Publication of CN113656698A publication Critical patent/CN113656698A/zh
Application granted granted Critical
Publication of CN113656698B publication Critical patent/CN113656698B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开公开了一种兴趣特征提取模型的训练方法、装置和电子设备,涉及智能推荐中的排序技术领域。具体实现方案为:在获取用户兴趣偏好特征时,可以先获取多个训练样本对;并将各训练样本对和全量用户与兴趣点之间的访问关系,输入至初始兴趣特征提取模型,得到各训练样本对对应的兴趣特征向量;再根据各训练样本对对应的兴趣特征向量,更新初始兴趣特征提取模型的网络参数。鉴于全量用户与兴趣点之间的访问关系可以在一定程度上较好地体现用户对兴趣点的兴趣偏好,使得结合全量用户与兴趣点之间的访问关系训练得到的兴趣特征提取模型,可以准确地提取用于描述用户兴趣偏好的兴趣特征向量,从而提高了获取到的用户兴趣偏好特征的准确度。

Description

兴趣特征提取模型的训练方法、装置和电子设备
技术领域
本公开涉及数据处理技术领域,尤其涉及一种兴趣特征提取模型的训练方法、装置和电子设备,具体涉及智能推荐中的排序技术。
背景技术
在兴趣点(point of interest,poi)推荐场景中,为用户准确推荐兴趣点,是有效提升用户体验的重要操作。
相关技术中,考虑到用户在选择兴趣点时,通常是基于其兴趣偏好,选择兴趣点。因此,为了提高推荐结果的准确度,可以考虑结合用户的兴趣偏好进行兴趣点推荐。
在该种场景下,如何获取用户的兴趣偏好,是本领域技术人员亟待解决的问题。
发明内容
本公开提供了一种兴趣特征提取模型的训练方法、装置和电子设备。
根据本公开的第一方面,提供了一种兴趣特征提取模型的训练方法,该兴趣特征提取模型的训练方法可以包括:
获取多个训练样本对;其中,各训练样本对包括用户的特征、所述用户对应的正样本兴趣点的特征和负样本兴趣点的特征;其中,所述正样本兴趣点为用户访问过的兴趣点,所述负样本兴趣点为所述用户未访问过的兴趣点。
将所述各训练样本对和全量用户与兴趣点之间的访问关系,输入至初始兴趣特征提取模型,得到所述各训练样本对对应的兴趣特征向量。
根据所述各训练样本对对应的兴趣特征向量,更新所述初始兴趣特征提取模型的网络参数。
根据本公开的第二方面,提供了一种兴趣点的推送方法,该兴趣点的推送方法可以包括:
获取目标用户预设范围内的多个兴趣点。
将所述目标用户的特征、各兴趣点的特征以及全量用户与兴趣点之间的访问关系,输入至兴趣特征提取模型,得到所述目标用户对应的兴趣特征向量和所述各兴趣点对应的兴趣特征向量。
根据所述目标用户对应的兴趣特征向量和所述各兴趣点对应的兴趣特征向量,从所述多个兴趣点中确定目标兴趣点,并进行推送。
根据本公开的第三方面,提供了一种兴趣特征提取模型的训练装置,该兴趣特征提取模型的训练装置可以包括:
获取单元,用于获取多个训练样本对;其中,各训练样本对包括用户的特征、所述用户对应的正样本兴趣点的特征和负样本兴趣点的特征;其中,所述正样本兴趣点为用户访问过的兴趣点,所述负样本兴趣点为所述用户未访问过的兴趣点。
处理单元,用于将所述各训练样本对和全量用户与兴趣点之间的访问关系,输入至初始兴趣特征提取模型,得到所述各训练样本对对应的兴趣特征向量。
更新单元,用于根据所述各训练样本对对应的兴趣特征向量,更新所述初始兴趣特征提取模型的网络参数。
根据本公开的第四方面,提供了一种兴趣点的推送装置,该兴趣点的推送装置可以包括:
获取单元,用于获取目标用户预设范围内的多个兴趣点。
确定单元,用于将所述目标用户的特征、各兴趣点的特征以及全量用户与兴趣点之间的访问关系,输入至兴趣特征提取模型,得到所述目标用户对应的兴趣特征向量和所述各兴趣点对应的兴趣特征向量。
处理单元,用于根据所述目标用户对应的兴趣特征向量和所述各兴趣点对应的兴趣特征向量,从所述多个兴趣点中确定目标兴趣点。
推送单元,用于对所述目标兴趣点进行推送。
根据本公开的第五方面,提供了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述第一方面所述的兴趣特征提取模型的训练方法,或者,以使所述至少一个处理器能够执行上述第二方面所述的兴趣点的推送方法。
根据本公开的第六方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行上述第一方面所述的兴趣特征提取模型的训练方法,或者,使所述计算机执行上述第二方面所述的兴趣点的推送方法。
根据本公开的第七方面,提供了一种计算机程序产品,所述计算机程序产品包括:计算机程序,所述计算机程序存储在可读存储介质中,电子设备的至少一个处理器可以从所述可读存储介质读取所述计算机程序,所述至少一个处理器执行所述计算机程序使得电子设备执行第一方面所述的方法。
根据本公开的技术方案,可以准确地提取用于描述用户兴趣偏好的兴趣特征向量,从而提高了获取到的用户兴趣偏好特征的准确度。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1是根据本公开第一实施例提供的兴趣特征提取模型的训练方法的流程示意图;
图2是本公开实施例提供的一种二部图的示意图;
图3是根据本公开第二实施例提供的兴趣特征提取模型的训练方法的流程示意图;
图4是本公开实施例提供的一种提取兴趣点对应的初始特征向量的网络结构的示意图;
图5是根据本公开第三实施例提供的兴趣特征提取模型的训练方法的流程示意图;
图6是根据本公开第四实施例提供的兴趣点的推送方法的流程示意图;
图7是根据本公开第五实施例提供的兴趣点的推送方法的流程示意图;
图8是根据本公开第六实施例提供的兴趣特征提取模型的训练装置的结构示意图;
图9是根据本公开第七实施例提供的兴趣点的推送装置的结构示意图;
图10是本公开实施例提供的一种电子设备的示意性框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
在本公开的实施例中,“至少一个”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,描述关联对象的访问关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况,其中A,B可以是单数或者复数。在本公开的文字描述中,字符“/”一般表示前后关联对象是一种“或”的关系。此外,在本公开实施例中,“第一”、“第二”、“第三”、“第四”、“第五”以及“第六”只是为了区分不同对象的内容而已,并无其它特殊含义。
本公开实施例提供的技术方案可以应用于智能推荐场景。例如,在兴趣点(pointof interest,poi)推荐场景中,为用户准确推荐兴趣点,是有效提升用户体验的重要操作。其中,兴趣点也成为信息点,在电子地图上一般用特定图标表示。示例的,兴趣点可以为电子地图上的景点、政府机构、公司、商场、饭店等,具体可以根据实际需要进行设置。
以向用户推荐饮食餐厅为例,现有技术中,在向用户推荐饮食餐厅时,通常是通过排序模型,向用户推送排序比较靠前的餐厅,例如按照距离原则,向用户推送与用户位置比较近的餐厅,或者,按照好评优先的原则,向用户推送好评度比较高的餐厅。
但是,对于用户而言,在选择目标餐厅时,通常是基于其兴趣偏好,例如,喜欢的菜系、和/或,餐厅品牌等兴趣偏好,选择兴趣点。因此,为了提高推荐结果的准确度,可以考虑基于用户的兴趣偏好进行兴趣点推荐。在该种场景下,如何获取用户的兴趣偏好,是本领域技术人员亟待解决的技术问题。
为了获取用户的兴趣偏好特征,可以考虑根据长期在地图中的操作行为,确定用户对兴趣点的访问情况,鉴于用户对兴趣点的访问情况可以从一定程度上反映用户的长期兴趣偏好特征。因此,可以结合用户对兴趣点的访问情况,建立用于提取描述用户兴趣偏好的兴趣特征向量的兴趣特征提取模型,且训练到的兴趣特征提取模型,可以准确地提取用于描述用户兴趣偏好的兴趣特征向量,从而提高了获取到的用户兴趣偏好特征的准确度。
基于上述技术构思,本公开实施例提供一种兴趣特征提取模型的训练方法,下面,将通过具体的实施例对本公开提供的兴趣特征提取模型的训练方法进行详细地说明。可以理解的是,下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
实施例一
图1是根据本公开第一实施例提供的兴趣特征提取模型的训练方法的流程示意图,该兴趣特征提取模型的训练方法可以由软件和/或硬件装置执行,例如,该硬件装置可以为终端或者服务器。示例的,请参见图1所示,该兴趣特征提取模型的训练方法可以包括:
S101、获取多个训练样本对;其中,各训练样本对包括用户的特征、用户对应的正样本兴趣点和负样本兴趣点;其中,正样本兴趣点为用户访问过的兴趣点,负样本兴趣点为用户未访问过的兴趣点。
示例的,用户的特征主要包括用户的画像信息,例如年龄,性别,人生阶段,收入水平等。不同行业的兴趣点的特征不同,主要包括兴趣点的类别,品牌,价格区间,评分,热度,图片等。以美食类兴趣点为例,兴趣点的主要特征可以包括类别,品牌,价格区间,评分,热度,推荐菜,菜品图片等。需要说明的是,为了使得后续获取到的用户的兴趣偏好特征能迁移到不同的空间位置,因此,本公开实施例中,暂未引入兴趣点的空间位置特征。
示例的,在获取多个训练样本对时,可以从数据库中直接获取预存的多个训练样本对;也可以从第三方训练系统中获取多个训练样本对;也可以通过其他方式获取多个训练样本对,具体可以根据实际需要进行设置,在此,对于多个训练样本对的获取方式,本公开实施例不做具体地限制。
可以理解的是,在获取多个训练样本对时,鉴于各训练样本中包括用户的特征、该用户访问过的正样本兴趣点的特征、以及该用户未访问过的负样本兴趣点的特征,因此,可以先获取历史时间段内用户在地图的操作行为,并根据历史时间段内用户在地图的操作行为,确定出该用户访问过的兴趣点,并从该用户访问过的兴趣点中任意选择一个兴趣点作为训练样本中,该用户访问过的正样本兴趣点,并随机采样一个该用户未访问过的兴趣点,作为该用户未访问过的负样本兴趣点;在选择出正样本兴趣点和负样本兴趣点后,就可以基于用户的特征、正样本兴趣点的特征、以及负样本兴趣点的特征构建训练样本对,从而获取到多个训练样本对。
需要说明的是,为了可以准确地确定出用户对应的正样本兴趣点和负样本兴趣点,在根据历史时间段内用户在地图的操作行为,确定用户对应的正样本兴趣点和负样本兴趣点时,可以选择近期历史事件段内,用户在地图的操作行为,这样可以避免因用户兴趣偏好发生变化,影响训练得到的兴趣特征提取模型的准确度。
S102、将各训练样本对和全量用户与兴趣点之间的访问关系,输入至初始兴趣特征提取模型,得到各训练样本对对应的兴趣特征向量。
鉴于训练样本对中包括用户的特征、正样本兴趣点的特征以及负样本兴趣点的特征,因此,训练样本对对应的兴趣特征向量中包括该用户对应的兴趣特征向量、正样本兴趣点对应的兴趣特征向量以及负样本兴趣点对应的兴趣特征向量。其中,用户对应的兴趣特征向量,可以理解为用于表示用户兴趣偏好的特征向量。
示例的,全量用户与兴趣点之间的访问关系可以包括:全量用户中各用户对应的所有正样本兴趣点,及各用户与对应的各正样本兴趣点之间的指示值,指示值用于表征用户访问正样本兴趣点的次数。可以理解的是,鉴于全量用户与兴趣点之间的访问关系包括了:全量用户中各用户对应的所有正样本兴趣点,因此,上述S101中获取到的多个训练样本对中,各训练样本对包括的用户、正样本兴趣点以及负样本兴趣点,均为全量用户与兴趣点之间的访问关系中的用户和兴趣点。
需要说明的是,之所以称之为:全量用户与兴趣点之间的访问关系,是因为在构建该访问关系时,为了使得该访问关系覆盖更加全面,因此,是尽可能基于所有用户与兴趣点一起构造的访问关系,并且,该访问关系一般是定期更新的,这样可以提高全量用户与兴趣点之间的访问关系的准确度,使得更有助于准确地确定用户的兴趣偏好。
示例的,在本公开实施例中,全量用户与兴趣点之间的访问关系,可以通过二部图的形式进行描述,也可以通过其它形式,例如表格的形式进行描述,具体可以根据实际需要进行设置。
以全量用户与兴趣点之间的访问关系通过二部图的形式描述为例,其中,二部图由用户节点和兴趣点节点构成。示例的,在构建二部图时,可以先根据全量用户中,各用户在地图中的操作行为,确定各用户访问过的所有正样本兴趣点、以用户访问过的各正样本兴趣点的访问次数;并根据各用户访问过的所有正样本兴趣点,在用户节点与访问过的正样本兴趣点节点之间建立一条边,以通过边将具有访问关系的用户节点和访问过的正样本兴趣点节点关联起来;例如,若用户1访问过兴趣点1,则构建的二部图中,用户1节点与兴趣点1节点之间就存在一条边。针对每一条边,可以根据该边对应的用户节点的用户访问过的各正样本兴趣点的访问次数,确定该条边对应的指示值,示例的,该指示值可以为边的权重,从而构建得到用于描述全量用户与兴趣点之间的访问关系的二部图。
示例的,在根据边对应的用户节点的用户访问过的各正样本兴趣点的访问次数,确定该条边对应的指示值时,可以先根据该用户在地图中的操作行为,确定该用户访问该正样本兴趣点的访问次数、以及该用户访问过所有正样本兴趣点的次数和,再根据该用户访问该正样本兴趣点的访问次数,与次数和的比值,确定该条边对应的指示值,这样可以对用户访问正样本兴趣点的访问次数进行归一化处理,更有助准确地确定用户的兴趣偏好。例如,若用户1节点与兴趣点1节点之间就存在一条边,该边对应的指示值为N(user1,poi1)/N(user1)。其中,N(user1,poi1)表示用户1访问兴趣点1的次数,N(user1)表示用户1访问过所有正样本兴趣点的次数和。
示例的,假设根据全量用户中,各用户在地图中的操作行为,确定用户1对访问过兴趣点1、兴趣点3及兴趣点4,且用户1与兴趣点1之间的指示值为0.7、用户1与兴趣点3之间的指示值为0.1、用户1与兴趣点4之间的指示值为0.2;用户2访问过兴趣点2、兴趣3及兴趣点5;且用户2与兴趣点2之间的指示值为0.2、用户2与兴趣点3之间的指示值为0.3、用户2与兴趣点5之间的指示值为0.5,则可以构建其对应的二部分,示例的,可参见图2所示,图2是本公开实施例提供的一种二部图的示意图,假设构建的二部图中包括两个用户节点和五个兴趣点节点;其中,两个用户节点分别为用户1节点和用户2节点,五个兴趣点节点分别为兴趣点1节点、兴趣点2节点、兴趣点3节点、兴趣点4节点以及兴趣点5节点。其中,用户1节点分别与兴趣点1节点、兴趣点3节点及兴趣点4节点之间均存在一条边,其每一条边均对应一个归一化后的权重;同理,用户2节点分别与兴趣点2节点、兴趣点3节点及兴趣点5节点之间均存在一条边,其每一条边均对应一个归一化后的权重。
在将各训练样本对和全量用户与兴趣点之间的访问关系,输入至初始兴趣特征提取模型中,通过初始兴趣特征提取模型提取出各训练样本对对应的兴趣特征向量后,就可以根据各训练样本对对应的兴趣特征向量,更新初始兴趣特征提取模型的网络参数,即执行下述S103:
S103、根据各训练样本对对应的兴趣特征向量,更新初始兴趣特征提取模型的网络参数。
示例的,初始兴趣特征提取模型可以为前馈神经网络(feedforward neuralnetwork,DNN)模型。
可以理解的是,上述S101-S103只是对初始兴趣特征提取模型执行的一次训练操作。在通过S103根据各训练样本对对应的兴趣特征向量,更新初始兴趣特征提取模型的网络参数后,若更新后的兴趣特征提取模型收敛,则直接将更新后的兴趣特征提取模型确定为最终训练好的兴趣特征提取模型;若更新后的兴趣特征提取模型未收敛,则再次执行S101-S103,直至更新后的兴趣特征提取模型收敛,并将收敛时的兴趣特征提取模型确定为最终训练好的兴趣特征提取模型,从而获取到最终的兴趣特征提取模型。
可以看出,在获取用户兴趣偏好特征时,可以先获取多个训练样本对;其中,各训练样本对包括用户的特征、用户对应的正样本兴趣点的特征和负样本兴趣点的特征;将各训练样本对和全量用户与兴趣点之间的访问关系,输入至初始兴趣特征提取模型,得到各训练样本对对应的兴趣特征向量;再根据各训练样本对对应的兴趣特征向量,更新初始兴趣特征提取模型的网络参数。鉴于全量用户与兴趣点之间的访问关系可以在一定程度上较好地体现用户对兴趣点的兴趣偏好,使得结合全量用户与兴趣点之间的访问关系训练得到的兴趣特征提取模型,可以准确地提取用于描述用户兴趣偏好的兴趣特征向量,从而提高了获取到的用户兴趣偏好特征的准确度。
基于上述图1所示的实施例,为了便于理解在上述S102中,如何将多个训练样本对中各训练样本对和全量用户与兴趣点之间的访问关系,输入至初始兴趣特征提取模型,得到各训练样本对对应的兴趣特征向量,下面,将通过下述图3所示的实施例二进行详细描述。需要说明的是,下述图3所示的实施例二中,将以迭代深度为2的graph sage图神经网络算法为例进行描述。
实施例二
图3是根据本公开第二实施例提供的兴趣特征提取模型的训练方法的流程示意图,该兴趣特征提取模型的训练方法同样可以由软件和/或硬件装置执行,例如,该硬件装置可以为终端或者服务器。示例的,请参见图3所示,该兴趣特征提取模型的训练方法可以包括:
S301、将各训练样本对和全量用户与兴趣点之间的访问关系,输入至初始兴趣特征提取模型,基于初始兴趣特征提取模型中的第一迭代网络,得到全量用户与兴趣点之间的访问关系中所有用户和所有兴趣点各自对应的初始特征向量。
示例的,在基于第一迭代网络中,获取全量用户与兴趣点之间的访问关系中所有用户和所有兴趣点各自对应的初始特征向量时,以获取某一兴趣点对应的初始特征向量为例,示例的,可参见图4所示,图4是本公开实施例提供的一种提取兴趣点对应的初始特征向量的网络结构的示意图,假设该兴趣点的特征包括菜品图像,则第一迭代网络可以通过vgg16等预训练模型,对菜品图像进行转化处理,得到菜品图像对应的特征向量。可以理解的是,鉴于该采用图像通常为兴趣点的众多特征中的一个特征,因此,得到的菜品图像对应的特征向量为兴趣点对应的初始特征向量中的部分特征向量。
示例的,假设全量用户与兴趣点之间的访问关系可参见图2所示的二部图,实际在应用过程中,其包括的用户与兴趣点的数量远大于图2所示的访问关系,在此,本公开实施例只是以全量用户与兴趣点之间的访问关系为图2所示的二部图为例进行说明,但并不代表本公开实施例仅局限于此。结合图2可以看出,图2中的二部图包括两个用户节点和五个兴趣点节点;其中,两个用户节点分别为用户1和用户2,五个兴趣点节点分别为兴趣点1、兴趣点2、兴趣点3、兴趣点4以及兴趣点5;则基于第一迭代网络可以得到该两个用户节点和五个兴趣点节点各自对应的初始特征向量。示例的,可以将用户1对应的初始特征向量记为:
Figure BDA0003227748290000101
用户2对应的初始特征向量记为:
Figure BDA0003227748290000102
兴趣点1对应的初始特征向量记为:
Figure BDA0003227748290000103
兴趣点2对应的初始特征向量记为:
Figure BDA0003227748290000104
兴趣点3对应的初始特征向量记为:
Figure BDA0003227748290000105
兴趣点4对应的初始特征向量记为:
Figure BDA0003227748290000106
用户5对应的初始特征向量记为:
Figure BDA0003227748290000107
在基于初始兴趣特征提取模型中的第一迭代网络,得到全量用户与兴趣点之间的访问关系中所有用户和所有兴趣点各自对应的初始特征向量后,就可以初始兴趣特征提取模型中的第二迭代网络,执行下述S302:
S302、基于初始兴趣特征提取模型中的第二迭代网络,根据各训练样本对、全量用户与兴趣点之间的访问关系、及所有用户和所有兴趣点各自对应的初始特征向量,确定各训练样本对对应的兴趣特征向量。
示例的,访问关系包括全量用户中各用户对应的所有正样本兴趣点,及各用户与对应的各正样本兴趣点之间的指示值,指示值用于表征用户访问正样本兴趣点的次数。
示例的,在确定用户与正样本兴趣点之间的指示值时,可以先确定用户访问正样本兴趣点的次数,以及用户访问过的所有正样本兴趣点的次数和;根据用户访问正样本兴趣点的次数,与次数和的比值,确定用户与正样本兴趣点之间的指示值。
可以理解的是,在确定各训练样本对对应的兴趣特征向量时,鉴于多个训练样本对中各训练样本对对应的兴趣特征向量的确定方式类似,因此,为了避免赘述,将以确定多个训练样本对中,任一个训练样本对对应的兴趣特征向量为例,对如确定取多个训练样本对中各训练样本对对应的兴趣特征向量进行描述。
鉴于训练样本对中包括用户的特征、正样本兴趣点的特征以及负样本兴趣点的特征,因此,需要确定的训练样本对对应的兴趣特征向量中包括该用户对应的兴趣特征向量、正样本兴趣点对应的兴趣特征向量以及负样本兴趣点对应的兴趣特征向量。
示例的,在基于第二迭代网络确定用户对应的兴趣特征向量时,可以先基于第二迭代网络,从所有用户和所有兴趣点各自对应的初始特征向量中,分别确定训练样本对中用户对应的初始特征向量、和用户对应的各正样本兴趣点各对应的初始特征向量;并根据用户对应的初始特征向量、各正样本兴趣点各对应的初始特征向量、以及用户与各正样本兴趣点之间的指示值,确定用户对应的兴趣特征向量。
示例的,假设某一训练样本对中包括用户1的特征、用户1访问过的正样本兴趣点3的特征、以及用户1未访问过的负样本兴趣点5的特征,结合上述图2所示的二部图,则在确定用户对应的兴趣特征向量时,可以先从图2所示的两个用户节点和五个兴趣点节点各自对应的初始特征向量中,分别确定用户1对应的初始特性向量
Figure BDA0003227748290000111
用户1访问过的所有正样本兴趣点中各正样本兴趣点各对应的初始特征向量,即包括兴趣点1对应的初始特征向量
Figure BDA0003227748290000112
兴趣点3对应的初始特征向量
Figure BDA0003227748290000113
以及兴趣点4对应的初始特征向量
Figure BDA0003227748290000114
再根据用户1对应的初始特性向量
Figure BDA0003227748290000115
兴趣点1对应的初始特征向量
Figure BDA0003227748290000116
兴趣点3对应的初始特征向量
Figure BDA0003227748290000117
以及兴趣点4对应的初始特征向量
Figure BDA0003227748290000118
以及用户1与各正样本兴趣点之间的权重,确定用户1对应的兴趣特征向量,可参见下述公式:
Figure BDA0003227748290000119
其中,
Figure BDA00032277482900001110
表示用户1对应的兴趣特征向量,w11表示用户1与正样本兴趣点1之间的权重,w13表示用户1与正样本兴趣点3之间的权重,w1表示用户1与正样本兴趣点4之间的权重。
示例的,在基于第二迭代网络确定正样本兴趣点对应的兴趣特征向量时,可以基于第二迭代网络,从所有用户和所有兴趣点各自对应的初始特征向量中,分别确定训练样本对中正样本兴趣点对应的初始特征向量、和访问过正样本兴趣点的各用户对应的初始特征向量;并根据正样本兴趣点对应的初始特征向量、访问过正样本兴趣点的各用户对应的初始特征向量、以及各用户与正样本兴趣点之间的指示值,确定正样本兴趣点对应的兴趣特征向量。
继续以训练样本对中包括用户1的特征、用户1访问过的正样本兴趣点3的特征、以及用户1未访问过的负样本兴趣点5的特征,结合上述图2所示的二部图,则在确定正样本兴趣点3对应的兴趣特征向量时,可以先从图2所示的两个用户节点和五个兴趣点节点各自对应的初始特征向量中,分别确定正样本兴趣点3对应的初始特性向量
Figure BDA0003227748290000121
访问过正样本兴趣点3的各用户对应的初始特征向量,即包括用户1对应的初始特征向量
Figure BDA0003227748290000122
和用户2对应的初始特征向量
Figure BDA0003227748290000123
再根据正样本兴趣点3对应的初始特性向量
Figure BDA0003227748290000124
用户1对应的初始特征向量
Figure BDA0003227748290000125
和用户2对应的初始特征向量
Figure BDA0003227748290000126
用户1与正样本兴趣点3之间的权重、以及用户2与正样本兴趣点3之间的权重,确定正样本兴趣点3对应的兴趣特征向量,可参见下述公式:
Figure BDA0003227748290000127
其中,
Figure BDA0003227748290000128
表示正样本兴趣点3对应的兴趣特征向量,w13表示用户1与正样本兴趣点3之间的权重,w23表示用户2与正样本兴趣点3之间的权重。
示例的,在基于第二迭代网络确定负样本兴趣点对应的兴趣特征向量时,可以基于第二迭代网络,从所有用户和所有兴趣点各自对应的初始特征向量中,分别确定训练样本对中负样本兴趣点对应的初始特征向量、和访问过负样本兴趣点的各用户对应的初始特征向量;并根据负样本兴趣点对应的初始特征向量、访问过负样本兴趣点的各用户对应的初始特征向量、以及各用户与负样本兴趣点之间的指示值,确定负样本兴趣点对应的兴趣特征向量。
继续以训练样本对中包括用户1的特征、用户1访问过的正样本兴趣点3的特征、以及用户1未访问过的负样本兴趣点5的特征,结合上述图2所示的二部图,则在确定负样本兴趣点5对应的兴趣特征向量时,可以先从图2所示的两个用户节点和五个兴趣点节点各自对应的初始特征向量中,分别确定负样本兴趣点5对应的初始特性向量
Figure BDA0003227748290000129
访问过负样本兴趣点5的各用户对应的初始特征向量,即仅包括用户2对应的初始特征向量
Figure BDA00032277482900001210
再根据负样本兴趣点5对应的初始特性向量
Figure BDA00032277482900001211
用户2对应的初始特征向量
Figure BDA00032277482900001212
以及用户2与负样本兴趣点5之间的权重,确定负样本兴趣点5对应的兴趣特征向量,可参见下述公式:
Figure BDA00032277482900001213
其中,
Figure BDA00032277482900001214
表示负样本兴趣点5对应的兴趣特征向量,w25表示用户2与正样本兴趣点5之间的权重。
结合上述描述,就可以基于初始兴趣特征提取模型,得到各训练样本对对应的兴趣特征向量,这样后续就可以根据各训练样本对对应的兴趣特征向量,更新初始兴趣特征提取模型的网络参数。鉴于全量用户与兴趣点之间的访问关系可以在一定程度上较好地体现用户对兴趣点的兴趣偏好,使得结合全量用户与兴趣点之间的访问关系训练得到的兴趣特征提取模型,可以准确地提取用于描述用户兴趣偏好的兴趣特征向量,从而提高了获取到的用户兴趣偏好特征的准确度。
基于上述图1或图3所示的实施例,在确定多个训练样本对中各训练样本对对应的兴趣特征向量后,就可以根据各训练样本对对应的兴趣特征向量,更新初始兴趣特征提取模型的网络参数,下面,将通过下述图5所示的实施例三,对如何根据各训练样本对对应的兴趣特征向量,更新初始兴趣特征提取模型的网络参数进行详细描述。
实施例三
图5是根据本公开第三实施例提供的兴趣特征提取模型的训练方法的流程示意图,该兴趣特征提取模型的训练方法同样可以由软件和/或硬件装置执行,例如,该硬件装置可以为终端或者服务器。示例的,请参见图5所示,该兴趣特征提取模型的训练方法可以包括:
S501、根据多个训练样本对中各训练样本对对应的兴趣特征向量,构造各训练样本对对应的损失函数。
示例的,在根据多个训练样本对中各训练样本对对应的兴趣特征向量,构造各训练样本对对应的损失函数时,鉴于每一个训练样本对对应的损失函数的构造方式类似,因此,为了避免赘述,在本公开实施例中,将以根据多个训练样本对中任意一个训练样本对对应的兴趣特征向量,构造该训练样本对对应的损失函数为例,对如何根据多个训练样本对中各训练样本对对应的兴趣特征向量,构造各训练样本对对应的损失函数进行描述。
示例的,在根据训练样本对对应的兴趣特征向量,构造训练样本对对应的损失函数时,通过监督学习的方式进行,以用户访问过的兴趣点为正样本兴趣点,以随机采样的用户未访问过的兴趣点为负样本兴趣点,因此,可以根据用户对应的兴趣特征向量,和正样本兴趣点对应的兴趣特征向量,确定第一余弦相似度;示例的,该第一余弦相似度可记为cos(Hkuser,Hk正样本);并根据训练样本对中,用户对应的兴趣特征向量,和负样本兴趣点对应的兴趣特征向量,确定第二余弦相似度;示例的,该第二余弦相似度可记为cos(Hkuser,Hk负样本),再根据第一余弦相似度和第二余弦相似度的差值,构造各训练样本对对应的损失函数,例如hinge loss,k代表在graph sage图神经网络算法训练时选用的迭代深度。为了使得后续基于训练函数训练得到的兴趣特征提取模型的准确度较高,因此,需要用户对应的兴趣特征向量和正样本兴趣点对应的兴趣特征向量之间的第一余弦相似度尽可能地大,而用户对应的兴趣特征向量和负样本兴趣点对应的兴趣特征向量之间的第二余弦相似度尽可能地小,因此,第一余弦相似度和第二余弦相似度的差值尽可能地大。
这样分别构造得到各训练样本对对应的损失函数后,就可以执行下述S502:
S502、根据各训练样本对对应的损失函数,更新初始兴趣特征提取模型的网络参数。
示例的,在根据各训练样本对对应的损失函数,更新初始兴趣特征提取模型的网络参数时,可以先根据各训练样本对对应的损失函数,确定多个训练样本对对应的平均损失函数;根据平均损失函数,更新初始兴趣特征提取模型的网络参数。
示例的,鉴于该多个人脸样本图像为执行一次训练过程所用到的一批图像样本,因此,可以先根据各训练样本对对应的损失函数,确定多个训练样本对对应的平均损失函数,并根据平均损失函数,更新初始兴趣特征提取模型的网络参数,以对该初始兴趣特征提取模型进行训练,并将收敛时的兴趣特征提取模型确定为最终训练好的兴趣特征提取模型,从而训练得到最终的兴趣特征提取模型。
可以看出,本公开实施例中,在训练兴趣特征提取模型时,可以先根据多个训练样本对中各训练样本对对应的兴趣特征向量,构造各训练样本对对应的损失函数;根据各训练样本对对应的损失函数,更新初始兴趣特征提取模型的网络参数,以得到最终的兴趣特征提取模型,这样后续就可以通过该兴趣特征提取模型,准确地提取用于描述用户兴趣偏好的兴趣特征向量,从而提高了获取到的用户兴趣偏好特征的准确度。
需要说明的是,本实施例中的兴趣特征提取模型并不是针对某一特定用户的兴趣特征提取模型,并不能反映出某一特定用户的个人信息。需要说明的是,本实施例中的训练样本对均来自于公开数据集。
本公开的技术方案中,所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。
基于上述实施例,在训练得到兴趣特征提取模型之后,就可以将该兴趣特征提取模型应用于兴趣点推荐的场景下,具体可参见下述图6所示的实施例四。
实施例四
图6是根据本公开第四实施例提供的兴趣点的推送方法的流程示意图,该兴趣点的推送方法可以由软件和/或硬件装置执行,例如,该硬件装置可以为终端或者服务器。示例的,请参见图6所示,该兴趣点的推送方法可以包括:
S601、获取目标用户预设范围内的多个兴趣点。
其中,预设范围的取值可以根据实际需要进行设置,在此,对于预设范围的具体取值,本公开实施例不做进一步地限制。
示例的,在接收到推荐触发时,例如,接收到推荐请求,或者检测到用户进入兴趣点区域时,可以获取目标用户预设范围内的多个兴趣点,以从多个兴趣点中选择目标兴趣点进行推送。
示例的,在获取目标用户预设范围内的多个兴趣点时,可以采用四叉树、kd树等数据结构的方法,获取目标用户预设范围内的多个兴趣点;也可以采用redis工具提供的空间索引能力,获取目标用户预设范围内的多个兴趣点,具体可以根据实际需要进行设置,在此,本公开实施例只是以这几种获取方式为例进行说明,但并不代表本公开实施例仅局限于此。
在获取到目标用户预设范围内的多个兴趣点后,可以执行下述S602:
S602、将目标用户的特征、各兴趣点的特征以及全量用户与兴趣点之间的访问关系,输入至兴趣特征提取模型,得到目标用户对应的兴趣特征向量和各兴趣点对应的兴趣特征向量。
其中,兴趣特征提取模型的作用是用于提取用户对应的兴趣特征向量和各兴趣点对应的兴趣特征向量。其中,用户对应的兴趣特征向量,可以理解为用于表示用户兴趣偏好的特征向量。
可以理解的是,本公开实施例中,通过兴趣特征提取模型,卷积得到目标用户对应的兴趣特征向量和各兴趣点对应的兴趣特征向量的方法,与上述S302中通过初始兴趣特征提取模型,得到训练样本对中用户、正样本兴趣点以及负样本兴趣点各自对应的兴趣特征向量的方法类似,可参见上述S302中,通过初始兴趣特征提取模型,得到训练样本对中用户、正样本兴趣点以及负样本兴趣点各自对应的兴趣特征向量的相关描述,在此,本公开实施例不再进行赘述。
在得到目标用户对应的兴趣特征向量和各兴趣点对应的兴趣特征向量后,就可以根据目标用户对应的兴趣特征向量和各兴趣点对应的兴趣特征向量,从多个兴趣点中确定目标兴趣点,并进行推送,即执行下述S603:
S603、根据目标用户对应的兴趣特征向量和各兴趣点对应的兴趣特征向量,从多个兴趣点中确定目标兴趣点,并进行推送。
可以看出,本公开实施例中,在向用户推送兴趣点时,可以先获取目标用户预设范围内的多个兴趣点;并将目标用户的特征、各兴趣点的特征以及全量用户与兴趣点之间的访问关系,输入至兴趣特征提取模型,得到目标用户对应的兴趣特征向量和各兴趣点对应的兴趣特征向量;再根据目标用户对应的兴趣特征向量和各兴趣点对应的兴趣特征向量,从多个兴趣点中确定目标兴趣点进行推送。这样根据用于表示用户兴趣偏好的兴趣特征向量,从多个兴趣点中确定待推送的目标兴趣点,提高了确定出的目标兴趣点的准确度,从而提高了兴趣点推送的准确度。
基于上述图6所示的实施例,为了便于理解在上述S603中,如何根据目标用户对应的兴趣特征向量和各兴趣点对应的兴趣特征向量,从多个兴趣点中确定目标兴趣点,下面,将通过下述图7所示的实施例五,如何根据目标用户对应的兴趣特征向量和各兴趣点对应的兴趣特征向量,从多个兴趣点中确定目标兴趣点进行详细描述。
实施例五
图7是根据本公开第五实施例提供的兴趣点的推送方法的流程示意图,该兴趣点的推送方法可以由软件和/或硬件装置执行,例如,该硬件装置可以为终端或者服务器。示例的,请参见图7所示,该兴趣点的推送方法可以包括:
S701、分别确定目标用户对应的兴趣特征向量,与各兴趣点对应的兴趣特征向量之间的兴趣度。
示例的,在分别确定目标用户对应的兴趣特征向量,与各兴趣点对应的兴趣特征向量之间的兴趣度时,可以先分别计算目标用户对应的兴趣特征向量,与各兴趣点对应的兴趣特征向量之间的余弦相似度,并根据目标用户对应的兴趣特征向量,与各兴趣点对应的兴趣特征向量之间的余弦相似度,确定目标用户对应的兴趣特征向量,与各兴趣点对应的兴趣特征向量之间的兴趣度。
通常情况下,用户对应的兴趣特征向量和兴趣点对应的兴趣特征向量之间的余弦相似度越大,说明用户对应的兴趣特征向量和兴趣点对应的兴趣特征向量之间的兴趣度越大;相反的,用户对应的兴趣特征向量和兴趣点对应的兴趣特征向量之间的余弦相似度越小,说明用户对应的兴趣特征向量和兴趣点对应的兴趣特征向量之间的兴趣度越小。
在分别确定出目标用户对应的兴趣特征向量,与各兴趣点对应的兴趣特征向量之间的兴趣度后,就可以据各兴趣度从多个兴趣点中,确定兴趣度最大的M个兴趣点,即执行下述S702:
S702、根据各兴趣度多个兴趣点中,确定兴趣度最大的M个兴趣点,M为正整数。
其中,该M个兴趣点可以理解为根据用户的兴趣偏好,从多个兴趣点中选择出的兴趣点。
通常情况下,兴趣度越大,说明该兴趣度对应的兴趣点越符合用户的兴趣偏好;相反的,兴趣度越小,说明该兴趣度对应的兴趣点越不符合用户的兴趣偏好,因此,为了提高兴趣点推送的准确度,对于不符合用户的兴趣偏好的兴趣点,可以不进行推送;只推送符合用户的兴趣偏好的兴趣点,这样可以提高兴趣点推送的准确度。
示例的,在根据各兴趣度多个兴趣点中,确定兴趣度最大的M个兴趣点时,直接根据各兴趣度多个兴趣点中,确定兴趣度最大的M个兴趣点;也可以先按照兴趣度由大到小的顺序,从多个兴趣点中选择前M个兴趣点;也可以按照兴趣度由小到大的顺序,从多个兴趣点中选择后M个兴趣点,具体可以根据实际需要进行设置,在此,本公开实施例只是以这三种方式为例,对确定兴趣度最大的M个兴趣点进行描述,但并不代表本公开实施例仅局限于此。
在确定兴趣度最大的M个兴趣点后,就可以根据该兴趣度最大的M个兴趣点,确定目标兴趣点,即执行下述S703:
S703、根据兴趣度最大的M个兴趣点,确定目标兴趣点。
示例的,本公开实施例中,在根据兴趣度最大的M个兴趣点确定目标兴趣点时,可以包括下述至少两种可能的实现方式:
在一种可能的实现方式中,当仅根据兴趣偏好维度进行兴趣点推送时,鉴于M个兴趣点为根据用户的兴趣偏好,从多个兴趣点中选择出的符合用户兴趣偏好的兴趣点,因此,可以直接将该兴趣度最大的M个兴趣点确定为目标兴趣点,这样后续可以将该M个兴趣点推送给用户,由于该M个兴趣点符合用户的兴趣偏好,这样可以提高兴趣点推送的准确度。
此外,除了根据兴趣偏好维度进行兴趣点推送之外,还可以在兴趣偏好维度的基础上,结合更多的推荐参数维度,例如好评度维度、空间距离维度、或者时间维度等,共同确定目标兴趣点进行兴趣点推送。可以理解的是,在结合其它推荐参数共同进行兴趣点推荐时,通常情况下,考虑到的其它推荐参数越多,最终结合该其它推荐参数确定出的目标兴趣点的准确度越高,具体可参见下述另一种可能的实现方式:
在另一种可能的实现方式中,在结合其它推荐参数共同进行兴趣点推荐时,可以先获取按照其它推荐参数的参数值,从多个兴趣点中确定N个兴趣点;从M个兴趣点和N个兴趣点中选择目标兴趣点。其中,N为正整数。
示例的,其它推荐参数可以为好评度、空间距离、热度、展现次数或者时间中的至少一个,具体可以根据实际需要进行设置,在此,本公开实施例只是以其它推荐参数可以为好评度、空间距离、或者时间中的至少一个为例进行说明,但并不代表本公开实施例仅局限于此。
示例的,在获取按照其它推荐参数的参数值,从多个兴趣点中确定N个兴趣点时,若其它推荐参数为好评度,则可以根据多个兴趣点各自对应的好评度,从多个兴趣点中,确定好评度最大的N个兴趣点,其确定方法与上述根据各兴趣度多个兴趣点中,确定兴趣度最大的M个兴趣点的方法类似,可参见上述根据各兴趣度多个兴趣点中,确定兴趣度最大的M个兴趣点的相关描述,在此,本公开实施例不再进行赘述。若其它推荐参数为距离空间,则可以根据多个兴趣点各自对应的距离空间,从多个兴趣点中,确定距离空间最小的N个兴趣点,其确定方法与上述根据各兴趣度多个兴趣点中,确定兴趣度最大的M个兴趣点的方法类似,可参见上述根据各兴趣度多个兴趣点中,确定兴趣度最大的M个兴趣点的相关描述,在此,本公开实施例不再进行赘述。
示例的,从M个兴趣点和N个兴趣点中选择目标兴趣点时,可以先确定M个兴趣点和N个兴趣点的并集;将并集中各兴趣点对应的兴趣度和其它推荐参数的参数值,输入至排序模型中,得到并集中各兴趣点对应的得分;再根据并集中各兴趣点对应的得分,从并集中确定目标兴趣点。
通常情况下,得分值越大,说明该得分值对应的兴趣点越符合用户的推送需求;相反的,得分值越大,说明该得分值对应的兴趣点越不符合用户的推送需求。
假设获取到目标用户预设范围内的100个兴趣点,该100个兴趣点分别为:兴趣点1、兴趣点2、…、兴趣点100;根据该100个兴趣点各自对应的兴趣点,从100个兴趣点中确定出符合目标用户的兴趣偏好的兴趣点包括:兴趣点1、兴趣点2、…、兴趣点10,该10个兴趣点;按照其它推荐参数的参数值,例如空间距离维度的参数值,从100个兴趣点中确定出符合目标用户的空间距离维度的兴趣点包括:兴趣点5、兴趣点6、…、兴趣点15,该10个兴趣点;鉴于确定出符合目标用户的兴趣偏好的兴趣点和确定出符合目标用户的空间距离维度的兴趣点中存在相同的兴趣点,在计算得分时,无需将相同的兴趣点重复输入至排序模型,因此,可以确定符合目标用户的兴趣偏好的兴趣点和符合目标用户的空间距离维度的兴趣点的并集,该并集包括兴趣点1、兴趣点2、…、兴趣点15,该15个兴趣点,并将该15个兴趣点各自对应的兴趣度和空间距离输入至排序模型中,得到该15个兴趣点各自对应的得分。
可以理解的是,本公开实施例中的排序模型不同于现有技术的排序模型,而是在现有的排序模型中增加了兴趣偏好维度的特征,以通过兴趣偏好维度的特征将用户的兴趣偏好体现在排序模型输出结果中。可以理解的是,在现有的排序模型中增加了兴趣偏好维度的特征时,可以在排序模型的训练阶段,在训练样本中增加兴趣偏好维度的特征,这样基于训练样本训练得到的排序模型中增加了兴趣偏好维度的特征。示例的,现有的排序模型可以为标准的点击率预估模型,该点击率预估模型可以为例如DCN、DeepFM等具有显示的特征交叉的排序模型。
示例的,在根据并集中各兴趣点对应的得分,从并集中确定目标兴趣点时,可以按照得分由大到小的顺序,取前预设数量个兴趣点作为目标兴趣点;也可以根据并集中各兴趣点对应的得分,从并集中确定得分值大于预设阈值的兴趣点作为目标兴趣点,具体可以根据实际需要进行设置,在此,本公开实施例只是以通过这两种方式从并集中确定目标兴趣点为例进行说明,但并不代表本公开实施例仅局限于此。
需要说明的是,本公开实施例中,为了提高兴趣点推送的准确度,因此,可以从多个兴趣点中选择符合用户需求的部分兴趣点,输入至排序模型进行打分,这样可以降低排序模型的数据处理量;若不考虑降低排序模型的数据处理量,也可以将多个兴趣点中的每一个兴趣点输入至排序模型进行打分,只要取满足得分值的部分兴趣点作为目标兴趣点即可,同样可以实现兴趣点的准确推送,在此,本公开实施例只是以从多个兴趣点中选择符合用户需求的部分兴趣点,输入至排序模型进行打分为例进行描述,但并不代表本公开实施例仅局限于此。
可以看出,本公开实施例中,在从多个兴趣点中确定待推送的目标兴趣点时,可以先分别确定目标用户对应的兴趣特征向量,与各兴趣点对应的兴趣特征向量之间的兴趣度;并根据各兴趣度多个兴趣点中,确定兴趣度最大的M个兴趣点;再根据兴趣度最大的M个兴趣点,确定目标兴趣点,这样根据用户兴趣偏好,从多个兴趣点中确定待推送的目标兴趣点,提高了确定出的目标兴趣点的准确度,从而提高了兴趣点推送的准确度。
实施例六
图8是根据本公开第六实施例提供的兴趣特征提取模型的训练装置80的结构示意图,示例的,请参见图8所示,该兴趣特征提取模型的训练装置80可以包括:
获取单元801,用于获取多个训练样本对;其中,各训练样本对包括用户的特征、用户对应的正样本兴趣点的特征和负样本兴趣点的特征;其中,正样本兴趣点为用户访问过的兴趣点,负样本兴趣点为用户未访问过的兴趣点。
处理单元802,用于将各训练样本对和全量用户与兴趣点之间的访问关系,输入至初始兴趣特征提取模型,得到各训练样本对对应的兴趣特征向量。
更新单元803,用于根据各训练样本对对应的兴趣特征向量,更新初始兴趣特征提取模型的网络参数。
可选的,处理单元802包括第一处理模块和第二处理模块。
第一处理模块,用于将各训练样本对和全量用户与兴趣点之间的访问关系,输入至初始兴趣特征提取模型,基于初始兴趣特征提取模型中的第一迭代网络,得到全量用户与兴趣点之间的访问关系中所有用户和所有兴趣点各自对应的初始特征向量。
第二处理模块,用于基于初始兴趣特征提取模型中的第二迭代网络,根据各训练样本对、全量用户与兴趣点之间的访问关系、及所有用户和所有兴趣点各自对应的初始特征向量,确定各训练样本对对应的兴趣特征向量。
可选的,访问关系包括全量用户中各用户对应的所有正样本兴趣点,及各用户与对应的各正样本兴趣点之间的指示值,指示值用于表征用户访问正样本兴趣点的次数。
其中,第二处理模块包括第一处理子模块、第二处理子模块、以及第三处理子模块。
第一处理子模块,用于针对各训练样本对,基于第二迭代网络,从所有用户和所有兴趣点各自对应的初始特征向量中,分别确定训练样本对中用户对应的初始特征向量、和用户对应的各正样本兴趣点各对应的初始特征向量;并根据用户对应的初始特征向量、各正样本兴趣点各对应的初始特征向量、以及用户与各正样本兴趣点之间的指示值,确定用户对应的兴趣特征向量。
第二处理子模块,用于基于第二迭代网络,从所有用户和所有兴趣点各自对应的初始特征向量中,分别确定训练样本对中正样本兴趣点对应的初始特征向量、和访问过正样本兴趣点的各用户对应的初始特征向量;并根据正样本兴趣点对应的初始特征向量、访问过正样本兴趣点的各用户对应的初始特征向量、以及各用户与正样本兴趣点之间的指示值,确定正样本兴趣点对应的兴趣特征向量。
第三处理子模块,用于基于第二迭代网络,从所有用户和所有兴趣点各自对应的初始特征向量中,分别确定训练样本对中负样本兴趣点对应的初始特征向量、和访问过负样本兴趣点的各用户对应的初始特征向量;并根据负样本兴趣点对应的初始特征向量、访问过负样本兴趣点的各用户对应的初始特征向量、以及各用户与负样本兴趣点之间的指示值,确定负样本兴趣点对应的兴趣特征向量。
可选的,兴趣特征提取模型的训练装置80还包括第一确定单元和第二确定单元。
第一确定单元,用于确定用户访问正样本兴趣点的次数,以及用户访问过的所有正样本兴趣点的次数和。
第二确定单元,用于根据用户访问正样本兴趣点的次数,与次数和的比值,确定用户与正样本兴趣点之间的指示值。
可选的,更新单元803包括第一更新模块和第二更新模块。
第一更新模块,用于根据各训练样本对对应的兴趣特征向量,构造各训练样本对对应的损失函数。
第二更新模块,用于根据各训练样本对对应的损失函数,更新初始兴趣特征提取模型的网络参数。
可选的,第一更新模块包括第一更新子模块、第二更新子模块以及第三更新子模块。
第一更新子模块,用于针对各训练样本对,根据训练样本对中,用户对应的兴趣特征向量,和正样本兴趣点对应的兴趣特征向量,确定第一余弦相似度。
第二更新子模块,用于根据训练样本对中,用户对应的兴趣特征向量,和负样本兴趣点对应的兴趣特征向量,确定第二余弦相似度。
第三更新子模块,用于根据第一余弦相似度和第二余弦相似度的差值,构造各训练样本对对应的损失函数。
可选的,第二更新模块包括第四更新子模块和第五更新子模块。
第四更新子模块,用于根据各训练样本对对应的损失函数,确定多个训练样本对对应的平均损失函数。
第五更新子模块,用于根据平均损失函数,更新初始兴趣特征提取模型的网络参数。
本公开实施例提供的兴趣特征提取模型的训练装置80,可以执行上述任一实施例所示的兴趣特征提取模型的训练方法的技术方案,其实现原理以及有益效果与兴趣特征提取模型的训练方法的实现原理及有益效果类似,可参见兴趣特征提取模型的训练方法的实现原理及有益效果,此处不再进行赘述。
实施例七
图9是根据本公开第七实施例提供的兴趣点的推送装置90的结构示意图,示例的,请参见图9所示,该兴趣点的推送装置90可以包括:
获取单元901,用于获取目标用户预设范围内的多个兴趣点。
确定单元902,用于将目标用户的特征、各兴趣点的特征以及全量用户与兴趣点之间的访问关系,输入至兴趣特征提取模型,得到目标用户对应的兴趣特征向量和各兴趣点对应的兴趣特征向量。
处理单元903,用于根据目标用户对应的兴趣特征向量和各兴趣点对应的兴趣特征向量,从多个兴趣点中确定目标兴趣点。
推送单元904,用于对目标兴趣点进行推送。
可选的,处理单元903包括第一处理模块、第二处理模块以及第三处理模块。
第一处理模块,用于分别确定目标用户对应的兴趣特征向量,与各兴趣点对应的兴趣特征向量之间的兴趣度。
第二处理模块,用于根据各兴趣度从多个兴趣点中,确定兴趣度最大的M个兴趣点,M为正整数。
第三处理模块,用于根据M个兴趣点,确定目标兴趣点。
可选的,第三处理模块包括第一处理子模块和第二处理子模块。
第一处理子模块,用于获取按照其它推荐参数的参数值,从多个兴趣点中确定N个兴趣点,N为正整数。
第二处理子模块,用于从M个兴趣点和N个兴趣点中选择目标兴趣点。
可选的,第二处理子模块,具体用于确定M个兴趣点和N个兴趣点的并集;将并集中各兴趣点对应的兴趣度和其它推荐参数的参数值,输入至排序模型中,得到并集中各兴趣点对应的得分;根据并集中各兴趣点对应的得分,从并集中确定目标兴趣点。
本公开实施例提供的兴趣点的推送装置90,可以执行上述任一实施例所示的兴趣点的推送方法的技术方案,其实现原理以及有益效果与兴趣点的推送方法的实现原理及有益效果类似,可参见兴趣点的推送方法的实现原理及有益效果,此处不再进行赘述。
根据本公开的实施例,本公开还提供了一种电子设备和一种可读存储介质。
根据本公开的实施例,本公开还提供了一种计算机程序产品,计算机程序产品包括:计算机程序,计算机程序存储在可读存储介质中,电子设备的至少一个处理器可以从可读存储介质读取计算机程序,至少一个处理器执行计算机程序使得电子设备执行上述任一实施例提供的方案。
图10是本公开实施例提供的一种电子设备100的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图10所示,电子设备100包括计算单元1001,其可以根据存储在只读存储器(ROM)1002中的计算机程序或者从存储单元1008加载到随机访问存储器(RAM)1003中的计算机程序,来执行各种适当的动作和处理。在RAM 1003中,还可存储设备100操作所需的各种程序和数据。计算单元1001、ROM 1002以及RAM 1003通过总线1004彼此相连。输入/输出(I/O)接口1005也连接至总线1004。
设备100中的多个部件连接至I/O接口1005,包括:输入单元1006,例如键盘、鼠标等;输出单元1007,例如各种类型的显示器、扬声器等;存储单元1008,例如磁盘、光盘等;以及通信单元1009,例如网卡、调制解调器、无线通信收发机等。通信单元1009允许设备100通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元1001可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元1001的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元1001执行上文所描述的各个方法和处理,例如兴趣特征提取模型的训练方法,或者兴趣点的推送方法。例如,在一些实施例中,兴趣特征提取模型的训练方法,或者兴趣点的推送方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元1008。在一些实施例中,计算机程序的部分或者全部可以经由ROM 1002和/或通信单元1009而被载入和/或安装到设备100上。当计算机程序加载到RAM 1003并由计算单元1001执行时,可以执行上文描述的兴趣特征提取模型的训练方法,或者兴趣点的推送方法的一个或多个步骤。备选地,在其他实施例中,计算单元1001可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行兴趣特征提取模型的训练方法,或者兴趣点的推送方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务("Virtual Private Server",或简称"VPS")中,存在的管理难度大,业务扩展性弱的缺陷。服务器也可以为分布式系统的服务器,或者是结合了区块链的服务器。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

Claims (25)

1.一种兴趣特征提取模型的训练方法,包括:
获取多个训练样本对;其中,各训练样本对包括用户的特征、所述用户对应的正样本兴趣点的特征和负样本兴趣点的特征;其中,所述正样本兴趣点为用户访问过的兴趣点,所述负样本兴趣点为所述用户未访问过的兴趣点;
将所述各训练样本对和全量用户与兴趣点之间的访问关系,输入至初始兴趣特征提取模型,得到所述各训练样本对对应的兴趣特征向量;
根据所述各训练样本对对应的兴趣特征向量,更新所述初始兴趣特征提取模型的网络参数。
2.根据权利要求1所述的方法,其中,所述将所述各训练样本对和全量用户与兴趣点之间的访问关系,输入至初始兴趣特征提取模型,得到所述各训练样本对对应的兴趣特征向量,包括:
将所述各训练样本对和全量用户与兴趣点之间的访问关系,输入至初始兴趣特征提取模型,基于所述初始兴趣特征提取模型中的第一迭代网络,得到所述全量用户与兴趣点之间的访问关系中所有用户和所有兴趣点各自对应的初始特征向量;
基于所述初始兴趣特征提取模型中的第二迭代网络,根据所述各训练样本对、所述全量用户与兴趣点之间的访问关系、及所述所有用户和所有兴趣点各自对应的初始特征向量,确定所述各训练样本对对应的兴趣特征向量。
3.根据权利要求2所述的方法,所述访问关系包括所述全量用户中各用户对应的所有正样本兴趣点,及所述各用户与对应的各正样本兴趣点之间的指示值,所述指示值用于表征用户访问所述正样本兴趣点的次数;
其中,所述基于所述初始兴趣特征提取模型中的第二迭代网络,根据所述各训练样本对、所述全量用户与兴趣点之间的访问关系、及所述所有用户和所有兴趣点各自对应的初始特征向量,确定所述各训练样本对对应的兴趣特征向量,包括:
针对所述各训练样本对,基于所述第二迭代网络,从所述所有用户和所有兴趣点各自对应的初始特征向量中,分别确定所述训练样本对中所述用户对应的初始特征向量、和所述用户对应的各正样本兴趣点各对应的初始特征向量;并根据所述用户对应的初始特征向量、所述各正样本兴趣点各对应的初始特征向量、以及所述用户与所述各正样本兴趣点之间的指示值,确定所述用户对应的兴趣特征向量;
基于所述第二迭代网络,从所述所有用户和所有兴趣点各自对应的初始特征向量中,分别确定所述训练样本对中所述正样本兴趣点对应的初始特征向量、和访问过所述正样本兴趣点的各用户对应的初始特征向量;并根据所述正样本兴趣点对应的初始特征向量、所述访问过所述正样本兴趣点的各用户对应的初始特征向量、以及所述各用户与所述正样本兴趣点之间的指示值,确定所述正样本兴趣点对应的兴趣特征向量;
基于所述第二迭代网络,从所述所有用户和所有兴趣点各自对应的初始特征向量中,分别确定所述训练样本对中所述负样本兴趣点对应的初始特征向量、和访问过所述负样本兴趣点的各用户对应的初始特征向量;并根据所述负样本兴趣点对应的初始特征向量、所述访问过所述负样本兴趣点的各用户对应的初始特征向量、以及所述各用户与所述负样本兴趣点之间的指示值,确定所述负样本兴趣点对应的兴趣特征向量。
4.根据权利要求3所述的方法,其中,所述方法还包括:
确定用户访问所述正样本兴趣点的次数,以及所述用户访问过的所有正样本兴趣点的次数和;
根据所述用户访问所述正样本兴趣点的次数,与所述次数和的比值,确定所述用户与所述正样本兴趣点之间的指示值。
5.根据权利要求1-4任一项所述的方法,其中,所述根据所述各训练样本对对应的兴趣特征向量,更新所述初始兴趣特征提取模型的网络参数,包括:
根据所述各训练样本对对应的兴趣特征向量,构造所述各训练样本对对应的损失函数;
根据所述各训练样本对对应的损失函数,更新所述初始兴趣特征提取模型的网络参数。
6.根据权利要求5所述的方法,其中,所述根据所述各训练样本对对应的兴趣特征向量,构造所述各训练样本对对应的损失函数,包括:
针对所述各训练样本对,根据所述训练样本对中,所述用户对应的兴趣特征向量,和所述正样本兴趣点对应的兴趣特征向量,确定第一余弦相似度;
根据所述训练样本对中,所述用户对应的兴趣特征向量,和所述负样本兴趣点对应的兴趣特征向量,确定第二余弦相似度;
根据所述第一余弦相似度和所述第二余弦相似度的差值,构造所述各训练样本对对应的损失函数。
7.根据权利要求5或6所述的方法,其中,所述根据所述各训练样本对对应的损失函数,更新所述初始兴趣特征提取模型的网络参数,包括:
根据所述各训练样本对对应的损失函数,确定所述多个训练样本对对应的平均损失函数;
根据所述平均损失函数,更新所述初始兴趣特征提取模型的网络参数。
8.一种兴趣点的推送方法,包括:
获取目标用户预设范围内的多个兴趣点;
将所述目标用户的特征、各兴趣点的特征以及全量用户与兴趣点之间的访问关系,输入至兴趣特征提取模型,得到所述目标用户对应的兴趣特征向量和所述各兴趣点对应的兴趣特征向量;
根据所述目标用户对应的兴趣特征向量和所述各兴趣点对应的兴趣特征向量,从所述多个兴趣点中确定目标兴趣点,并进行推送。
9.根据权利要求8所述的方法,其中,所述根据所述目标用户对应的兴趣特征向量和所述各兴趣点对应的兴趣特征向量,从所述多个兴趣点中确定目标兴趣点,包括:
分别确定所述目标用户对应的兴趣特征向量,与所述各兴趣点对应的兴趣特征向量之间的兴趣度;
根据各兴趣度从所述多个兴趣点中,确定兴趣度最大的M个兴趣点,M为正整数;
根据所述M个兴趣点,确定所述目标兴趣点。
10.根据权利要求9所述的方法,其中,所述根据所述M个兴趣点,确定所述目标兴趣点,包括:
获取按照其它推荐参数的参数值,从所述多个兴趣点中确定N个兴趣点,N为正整数;
从所述M个兴趣点和所述N个兴趣点中选择目标兴趣点。
11.根据权利要求10所述的方法,其中,所述从所述M个兴趣点和所述N个兴趣点中选择目标兴趣点,包括:
确定所述M个兴趣点和所述N个兴趣点的并集;
将所述并集中各兴趣点对应的兴趣度和所述其它推荐参数的参数值,输入至排序模型中,得到所述并集中各兴趣点对应的得分;
根据所述并集中各兴趣点对应的得分,从所述并集中确定所述目标兴趣点。
12.一种兴趣特征提取模型的训练装置,包括:
获取单元,用于获取多个训练样本对;其中,各训练样本对包括用户的特征、所述用户对应的正样本兴趣点的特征和负样本兴趣点的特征;其中,所述正样本兴趣点为用户访问过的兴趣点,所述负样本兴趣点为所述用户未访问过的兴趣点;
处理单元,用于将所述各训练样本对和全量用户与兴趣点之间的访问关系,输入至初始兴趣特征提取模型,得到所述各训练样本对对应的兴趣特征向量;
更新单元,用于根据所述各训练样本对对应的兴趣特征向量,更新所述初始兴趣特征提取模型的网络参数。
13.根据权利要求12所述的装置,其中,所述处理单元包括第一处理模块和第二处理模块;
所述第一处理模块,用于将所述各训练样本对和全量用户与兴趣点之间的访问关系,输入至初始兴趣特征提取模型,基于所述初始兴趣特征提取模型中的第一迭代网络,得到所述全量用户与兴趣点之间的访问关系中所有用户和所有兴趣点各自对应的初始特征向量;
所述第二处理模块,用于基于所述初始兴趣特征提取模型中的第二迭代网络,根据所述各训练样本对、所述全量用户与兴趣点之间的访问关系、及所述所有用户和所有兴趣点各自对应的初始特征向量,确定所述各训练样本对对应的兴趣特征向量。
14.根据权利要求13所述的装置,所述访问关系包括所述全量用户中各用户对应的所有正样本兴趣点,及所述各用户与对应的各正样本兴趣点之间的指示值,所述指示值用于表征用户访问所述正样本兴趣点的次数;
其中,所述第二处理模块包括第一处理子模块、第二处理子模块、以及第三处理子模块;
所述第一处理子模块,用于针对所述各训练样本对,基于所述第二迭代网络,从所述所有用户和所有兴趣点各自对应的初始特征向量中,分别确定所述训练样本对中所述用户对应的初始特征向量、和所述用户对应的各正样本兴趣点各对应的初始特征向量;并根据所述用户对应的初始特征向量、所述各正样本兴趣点各对应的初始特征向量、以及所述用户与所述各正样本兴趣点之间的指示值,确定所述用户对应的兴趣特征向量;
所述第二处理子模块,用于基于所述第二迭代网络,从所述所有用户和所有兴趣点各自对应的初始特征向量中,分别确定所述训练样本对中所述正样本兴趣点对应的初始特征向量、和访问过所述正样本兴趣点的各用户对应的初始特征向量;并根据所述正样本兴趣点对应的初始特征向量、所述访问过所述正样本兴趣点的各用户对应的初始特征向量、以及所述各用户与所述正样本兴趣点之间的指示值,确定所述正样本兴趣点对应的兴趣特征向量;
所述第三处理子模块,用于基于所述第二迭代网络,从所述所有用户和所有兴趣点各自对应的初始特征向量中,分别确定所述训练样本对中所述负样本兴趣点对应的初始特征向量、和访问过所述负样本兴趣点的各用户对应的初始特征向量;并根据所述负样本兴趣点对应的初始特征向量、所述访问过所述负样本兴趣点的各用户对应的初始特征向量、以及所述各用户与所述负样本兴趣点之间的指示值,确定所述负样本兴趣点对应的兴趣特征向量。
15.根据权利要求14所述的装置,其中,所述装置还包括第一确定单元和第二确定单元;
所述第一确定单元,用于确定用户访问所述正样本兴趣点的次数,以及所述用户访问过的所有正样本兴趣点的次数和;
所述第二确定单元,用于根据所述用户访问所述正样本兴趣点的次数,与所述次数和的比值,确定所述用户与所述正样本兴趣点之间的指示值。
16.根据权利要求12-15任一项所述的装置,其中,所述更新单元包括第一更新模块和第二更新模块;
所述第一更新模块,用于根据所述各训练样本对对应的兴趣特征向量,构造所述各训练样本对对应的损失函数;
所述第二更新模块,用于根据所述各训练样本对对应的损失函数,更新所述初始兴趣特征提取模型的网络参数。
17.根据权利要求16所述的装置,其中,所述第一更新模块包括第一更新子模块、第二更新子模块以及第三更新子模块;
所述第一更新子模块,用于针对所述各训练样本对,根据所述训练样本对中,所述用户对应的兴趣特征向量,和所述正样本兴趣点对应的兴趣特征向量,确定第一余弦相似度;
所述第二更新子模块,用于根据所述训练样本对中,所述用户对应的兴趣特征向量,和所述负样本兴趣点对应的兴趣特征向量,确定第二余弦相似度;
所述第三更新子模块,用于根据所述第一余弦相似度和所述第二余弦相似度的差值,构造所述各训练样本对对应的损失函数。
18.根据权利要求16或17所述的装置,其中,所述第二更新模块包括第四更新子模块和第五更新子模块;
所述第四更新子模块,用于根据所述各训练样本对对应的损失函数,确定所述多个训练样本对对应的平均损失函数;
所述第五更新子模块,用于根据所述平均损失函数,更新所述初始兴趣特征提取模型的网络参数。
19.一种兴趣点的推送装置,包括:
获取单元,用于获取目标用户预设范围内的多个兴趣点;
确定单元,用于将所述目标用户的特征、各兴趣点的特征以及全量用户与兴趣点之间的访问关系,输入至兴趣特征提取模型,得到所述目标用户对应的兴趣特征向量和所述各兴趣点对应的兴趣特征向量;
处理单元,用于根据所述目标用户对应的兴趣特征向量和所述各兴趣点对应的兴趣特征向量,从所述多个兴趣点中确定目标兴趣点;
推送单元,用于对所述目标兴趣点进行推送。
20.根据权利要求19所述的装置,其中,所述处理单元包括第一处理模块、第二处理模块以及第三处理模块;
所述第一处理模块,用于分别确定所述目标用户对应的兴趣特征向量,与所述各兴趣点对应的兴趣特征向量之间的兴趣度;
所述第二处理模块,用于根据各兴趣度从所述多个兴趣点中,确定兴趣度最大的M个兴趣点,M为正整数;
所述第三处理模块,用于根据所述M个兴趣点,确定所述目标兴趣点。
21.根据权利要求20所述的装置,其中,所述第三处理模块包括第一处理子模块和第二处理子模块;
所述第一处理子模块,用于获取按照其它推荐参数的参数值,从所述多个兴趣点中确定N个兴趣点,N为正整数;
所述第二处理子模块,用于从所述M个兴趣点和所述N个兴趣点中选择目标兴趣点。
22.根据权利要求21所述的装置,其中,
所述第二处理子模块,具体用于确定所述M个兴趣点和所述N个兴趣点的并集;将所述并集中各兴趣点对应的兴趣度和所述其它推荐参数的参数值,输入至排序模型中,得到所述并集中各兴趣点对应的得分;根据所述并集中各兴趣点对应的得分,从所述并集中确定所述目标兴趣点。
23.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7中任一项所述的兴趣特征提取模型的训练方法,或者,以使所述至少一个处理器能够执行权利要求8-11中任一项所述的兴趣点的推送方法。
24.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行权利要求1-7中任一项所述的兴趣特征提取模型的训练方法,或者,使所述计算机执行权利要求8-11中任一项所述的兴趣点的推送方法。
25.一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现权利要求1-7中任一项所述的兴趣特征提取模型的训练方法的步骤;或者,该计算机程序被处理器执行时实现权利要求8-11中任一项所述的兴趣点的推送方法的步骤。
CN202110977129.8A 2021-08-24 2021-08-24 兴趣特征提取模型的训练方法、装置和电子设备 Active CN113656698B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110977129.8A CN113656698B (zh) 2021-08-24 2021-08-24 兴趣特征提取模型的训练方法、装置和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110977129.8A CN113656698B (zh) 2021-08-24 2021-08-24 兴趣特征提取模型的训练方法、装置和电子设备

Publications (2)

Publication Number Publication Date
CN113656698A true CN113656698A (zh) 2021-11-16
CN113656698B CN113656698B (zh) 2024-04-09

Family

ID=78492756

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110977129.8A Active CN113656698B (zh) 2021-08-24 2021-08-24 兴趣特征提取模型的训练方法、装置和电子设备

Country Status (1)

Country Link
CN (1) CN113656698B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114969577A (zh) * 2022-07-18 2022-08-30 百度在线网络技术(北京)有限公司 兴趣点推荐方法和兴趣点推荐模型的训练方法、装置
CN115114997A (zh) * 2022-07-18 2022-09-27 百度在线网络技术(北京)有限公司 确定空间约束特征的方法和条件随机场模型的训练方法
CN116881483A (zh) * 2023-09-06 2023-10-13 腾讯科技(深圳)有限公司 多媒体资源推荐方法、装置及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130304469A1 (en) * 2012-05-10 2013-11-14 Mynd Inc. Information processing method and apparatus, computer program and recording medium
CN111612075A (zh) * 2020-05-22 2020-09-01 中国科学院自动化研究所 基于联合特征重组和特征混合的兴趣点、描述符提取方法
US20200320646A1 (en) * 2018-04-26 2020-10-08 Tencent Technology (Shenzhen) Company Limited Interest recommendation method, computer device, and storage medium
CN112328911A (zh) * 2020-10-30 2021-02-05 腾讯科技(深圳)有限公司 地点推荐方法、装置、设备及存储介质
CN112559879A (zh) * 2020-12-24 2021-03-26 北京百度网讯科技有限公司 兴趣模型训练方法、兴趣点推荐方法、装置和设备
CN112633380A (zh) * 2020-12-24 2021-04-09 北京百度网讯科技有限公司 兴趣点特征提取方法、装置、电子设备及存储介质
CN113268669A (zh) * 2021-06-01 2021-08-17 重庆大学 基于联合神经网络的面向关系挖掘的兴趣点推荐方法
US20210256767A1 (en) * 2020-02-13 2021-08-19 Magic Leap, Inc. Cross reality system with accurate shared maps

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130304469A1 (en) * 2012-05-10 2013-11-14 Mynd Inc. Information processing method and apparatus, computer program and recording medium
US20200320646A1 (en) * 2018-04-26 2020-10-08 Tencent Technology (Shenzhen) Company Limited Interest recommendation method, computer device, and storage medium
US20210256767A1 (en) * 2020-02-13 2021-08-19 Magic Leap, Inc. Cross reality system with accurate shared maps
CN111612075A (zh) * 2020-05-22 2020-09-01 中国科学院自动化研究所 基于联合特征重组和特征混合的兴趣点、描述符提取方法
CN112328911A (zh) * 2020-10-30 2021-02-05 腾讯科技(深圳)有限公司 地点推荐方法、装置、设备及存储介质
CN112559879A (zh) * 2020-12-24 2021-03-26 北京百度网讯科技有限公司 兴趣模型训练方法、兴趣点推荐方法、装置和设备
CN112633380A (zh) * 2020-12-24 2021-04-09 北京百度网讯科技有限公司 兴趣点特征提取方法、装置、电子设备及存储介质
CN113268669A (zh) * 2021-06-01 2021-08-17 重庆大学 基于联合神经网络的面向关系挖掘的兴趣点推荐方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
YIBO SUN等: "GEDIT: Geographic-Enhanced and Dependency-Guided Tagging for Joint POI and Accessibility Extraction at Baidu Maps", 《ARXIV》, 20 August 2021 (2021-08-20) *
刘枚莲;刘同存;李小龙;: "基于用户兴趣特征提取的推荐算法研究", 计算机应用研究, no. 05, 15 May 2011 (2011-05-15) *
吕学强;王腾;李雪伟;董志安;: "基于内容和兴趣漂移模型的电影推荐算法研究", 计算机应用研究, no. 03, 21 March 2017 (2017-03-21) *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114969577A (zh) * 2022-07-18 2022-08-30 百度在线网络技术(北京)有限公司 兴趣点推荐方法和兴趣点推荐模型的训练方法、装置
CN115114997A (zh) * 2022-07-18 2022-09-27 百度在线网络技术(北京)有限公司 确定空间约束特征的方法和条件随机场模型的训练方法
CN116881483A (zh) * 2023-09-06 2023-10-13 腾讯科技(深圳)有限公司 多媒体资源推荐方法、装置及存储介质
CN116881483B (zh) * 2023-09-06 2023-12-01 腾讯科技(深圳)有限公司 多媒体资源推荐方法、装置及存储介质

Also Published As

Publication number Publication date
CN113656698B (zh) 2024-04-09

Similar Documents

Publication Publication Date Title
CN113656698A (zh) 兴趣特征提取模型的训练方法、装置和电子设备
CN114549874B (zh) 多目标图文匹配模型的训练方法、图文检索方法及装置
CN112612957A (zh) 兴趣点的推荐方法、兴趣点推荐模型的训练方法、装置
CN114357105B (zh) 地理预训练模型的预训练方法及模型微调方法
CN113657289A (zh) 阈值估计模型的训练方法、装置和电子设备
CN114187459A (zh) 目标检测模型的训练方法、装置、电子设备以及存储介质
CN111553279A (zh) 兴趣点的表征学习、识别方法、装置、设备及存储介质
CN113326450B (zh) 一种兴趣点召回方法、装置、电子设备和存储介质
CN113360683A (zh) 训练跨模态检索模型的方法以及跨模态检索方法和装置
CN114756774A (zh) 出行方案推荐、模型训练方法、装置、设备以及存储介质
CN114817476A (zh) 语言模型的训练方法、装置、电子设备和存储介质
CN114707638A (zh) 模型训练、对象识别方法及装置、设备、介质和产品
CN114281990A (zh) 文档分类方法及装置、电子设备和介质
CN114661904A (zh) 文档处理模型的训练方法、装置、设备、存储介质及程序
CN114490965A (zh) 问题处理方法、装置、电子设备和存储介质
CN114428917A (zh) 基于地图的信息共享方法、装置、电子设备和介质
CN113761379A (zh) 商品推荐方法及装置、电子设备和介质
CN112541123A (zh) 地图图区推荐方法、装置、设备及存储介质
CN113868532B (zh) 一种地点推荐方法、装置、电子设备及存储介质
CN114066278B (zh) 物品召回的评估方法、装置、介质及程序产品
CN116383491B (zh) 信息推荐方法、装置、设备、存储介质和程序产品
CN115829653A (zh) 广告文本的相关度确定方法及装置、设备和介质
CN114328855A (zh) 文档查询方法、装置、电子设备和可读存储介质
CN115809364A (zh) 对象推荐方法和模型训练方法
CN114547340A (zh) 热点事件挖掘方法及装置、设备和介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant