CN108604315A - 使用深度学习模型识别实体 - Google Patents
使用深度学习模型识别实体 Download PDFInfo
- Publication number
- CN108604315A CN108604315A CN201680079586.2A CN201680079586A CN108604315A CN 108604315 A CN108604315 A CN 108604315A CN 201680079586 A CN201680079586 A CN 201680079586A CN 108604315 A CN108604315 A CN 108604315A
- Authority
- CN
- China
- Prior art keywords
- entity
- user
- vector representation
- group object
- group
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/52—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail for supporting social networking services
Abstract
在一个实施方式中,一种方法包括访问在社交网络系统中的用户已经交互的第一组实体、以及第二组实体。使用深度学习模型确定第一组实体的第一组矢量表示。从第一组实体中选择目标实体,并且从第一组中移除目标实体的矢量表示。将第一组中的其余矢量表示结合以确定用户的矢量表示。使用深度学习模型确定第二组实体的第二组矢量表示。计算在用户与目标实体和第二组实体中的实体的每一个之间的相似性评分。使用深度学习模型基于相似性评分更新第二组实体中的实体的矢量表示。
Description
技术领域
本公开总体上涉及训练深度学习模型。
背景技术
深度学习是一种机器学习,可以涉及在受监督或无监督的环境中训练模型。可以对深度学习模型进行训练以学习数据表示。作为实例而并非以限制的方式,深度学习模型可以将数据表示为强度值的矢量。可以在数据分类中使用深度学习模型。分类可以涉及通过训练深度学习模型来确定数据点属于一组类别中的哪一种。
发明内容
在具体实施方式中,社交网络系统可以使用深度学习模型来预测用户的相关实体。深度学习模型可以被训练成将实体映射为矢量表示。可以基于用户在社交网络系统中已经交互的一组实体来确定该用户的矢量表示。在具体实施方式中,目标实体可以从用户已经交互的该组实体中被选择并移除。在该组实体中的其余实体的矢量表示可以结合来得到该用户的矢量表示。可以使用目标实体作为监督信号来训练深度学习模型。可以使用深度学习模型来确定该用户尚未交互的实体的矢量表示。实体或该用户的嵌入可以基于相应的矢量表示来确定,其可以对应于多维嵌入空间中的点的坐标。该嵌入可以是实体或用户在嵌入空间中的表示。嵌入空间可以包括一个或多个用户嵌入以及多个实体嵌入。这些用户和实体的嵌入可以用于完成任何数量的合适任务。作为实例而并非以限制的方式,社交网络系统可以使用搜索算法来识别用户尚未交互的、所具有的嵌入在嵌入空间中接近用户嵌入的一个或多个实体。社交网络系统可以确定所识别的实体与用户相关。
在具体实施方式中,所识别的实体可以作为推荐发送至用户的客户端系统。所识别的实体可以在客户端系统上运行的应用界面上作为建议显示给用户(例如,与该社交网络系统关联的消息发送平台或应用)。用户可以从所识别的实体的组中选择一个或多个实体,并且作为实例而并非以限制的方式,所选择的实体可以将用户链接至由该社交网络系统承载的应用中的另一个页面。
在具体实施方式中,实体可以被识别(例如,响应于包括用户的搜索查询)并且可以具有在嵌入空间中接近用户嵌入的嵌入(例如,所识别的实体可以与用户相关)。可以将具有靠近用户的嵌入的对应嵌入的并且用户尚未交互的实体缓存或预缓存。作为实例而并非以限制的方式,所识别的实体可以对于相应的一个或多个用户进行缓存或预缓存(例如,该一个或多个用户具有的嵌入靠近所识别的实体的嵌入并且尚未与所识别的实体交互)。作为实例而并非以限制的方式,缓存或预缓存可以是在服务器侧处或在客户端侧处对于一个或多个特定用户或对于每个用户实现或执行的。缓存或预缓存可以允许实体被更快地访问。作为实例而并非以限制的方式,如果相应的用户请求实体(例如,被确定与用户相关的所识别的实体)、或者如果服务器向用户(例如,向用户的客户端系统)推送推荐(例如,所识别的实体),则这些实体可以被快速访问。通过使用所提出的方法,能够识别与特定用户相关的实体(例如,存储在计算系统(作为实例而并非以限制的方式,社交网络系统)的一个或多个数据库内的数据对象)。所识别的实体可以各自与被相应的用户(即,所识别的实体已经确定与之相关的用户)访问的概率相关联。在具体实施方式中,实体可以基于被特定用户访问的可能性超过一定的最小概率来进行选择。缓存或预缓存这样的实体有效地避免无用的缓存和/或减少数据流量和/或改善访问相应实体的速度或存取时间。在所有可能的实体(例如,数以亿计的实体)之中,这些实体只有一个子集在每次搜索中可以被发现是相关的。通过使用所提出的方法,相关实体的该子集可以被发送至客户端系统或者由客户端系统缓存或预缓存。如本文中所描述的,训练可以得到嵌入空间,与可在没有执行所提出的训练方法的情况下访问的数据相比,该嵌入空间可以被服务器、客户端系统、或任何其他合适的计算设备或平台更快地访问。相关实体(作为实例而并非以限制的方式包括被确定与用户相关(例如,与嵌入空间中接近用户嵌入的嵌入相关联)的实体)可以通过在嵌入空间中执行搜索(例如,距离搜索)来被快速地获得和/或识别。在具体实施方式中,实体的集群可以是基于所使用的相应数据库。换言之,集群可以是特定于数据库的。相关实体的集群可以是基于所提出的方法(作为实例而并非以限制的方式)对于社交网络系统的一个或多个用户来执行的。
在具体实施方式中,实体、与实体相关联的信息、或两者可以作为数据对象(作为实例而并非以限制的方式)存储在一个或多个数据库或数据存储装置中。这些数据库或数据存储装置可以(作为实例而并非以限制的方式)位于一个或多个数据中心,该一个或多个数据中心可以是地理位置不同地(例如,在不同的位置、城市、国家和/或洲中)分布的。在具体实施方式中,嵌入空间可以用于预测一个或多个实体相对于社交网络系统的一个或多个特定用户、每个用户、一个或多个用户、或其任何组合的相关性,并且这些用户可以各自位于相应的地理位置内。被预测具有相关性的实体以及对应的信息可以基于所确定的相关性来存储在距离上更靠近该一个或多个用户定位的数据库中。被确定为相关的实体以及相关联的信息也可以被预缓存或缓存(作为实例而并非以限制的方式)在定位成距离上靠近该一个或多个用户或者客户端系统的地理位置的一个或多个客户端系统、一个或多个服务器、或其任何组合上。这样的实施方式有效地减少了在远程数据库和/或数据中心之间的负载和/或数据流量。这些实施方式还可以改善(例如,减少)存取时间(例如,用于访问特定实体)。
在具体实施方式中,这些实体可以进一步被聚集或重新聚集。聚集可以导致更快的搜索结果(即,减少搜索时间并由此减少搜索引擎的负载)和/或跨对应的数据网络有更少的数据流量。集群可以基于其在嵌入空间中的位置或地点来跨数据存储装置存储。这种存储方案可以改善数据存取时间和/或搜索时间。作为实例而并非以限制的方式,基于其在嵌入空间中的相应位置跨数据存储装置存储实体的集群可以造成搜索引擎能够访问更少的数据存储装置,以便检索相关的结果。此外,通过聚集嵌入,从嵌入空间检索的搜索结果与从没有执行聚集的嵌入空间检索搜索结果的应用相比可以更加精确/确切,因为搜索结果可以额外地基于实体的属性并且不仅基于整体的高级别分类。客户端系统可以不必继续提交越来越细化的搜索以便为用户得到足够的搜索结果,这意味着在客户端系统与服务器之间的交互的数量和强度可以减小。此外,聚集可以提供更加多样化的搜索结果,因为来自不同集群的搜索结果可以被有意拖入搜索结果中。即便描述了特定实施方式(其中嵌入的确定是由服务器执行的),但这是通过举例的方式而非限制性地,并且客户端系统可以确定嵌入空间中的实体的嵌入的一些或全部。作为实例而并非以限制的方式,实体可以是视觉内容项,并且对视觉内容项的预处理(例如,确定视觉内容项的一个或多个属性)可以是在客户端系统上或由客户端系统执行的。用户然后可以(例如,在客户端系统的界面处)被呈现对应于视觉内容的一个或多个搜索项(例如,每个搜索项是基于视觉内容的一个或多个属性)。用户然后可以被提示来确认搜索项(例如,由客户端系统或服务器发出相应的提示)。
本文中公开的实施方式仅是实例,并且本公开的范围不限于此。具体实施方式可以包括本文中公开的实施方式的部件、元件、特征、功能、操作或者步骤的全部、一些、或全无。根据本发明的实施方式具体地在涉及方法、存储介质、系统、和计算机程序产品的所附权利要求中公开,其中,在一种权利要求类别(例如方法)中提及的任意特征也可在另一权利要求类别(例如系统)中被声明。所附权利要求中的从属或引用关系仅出于形式原因而被选择。然而,也可以要求保护通过特意引用任何先前的权利要求(特别是多个从属)而得的任何主题,因此公开了并且可以要求保护权利要求及其特征的任何组合,而不管所附权利要求中选择的从属。可被要求保护的主题不仅包括所附权利要求中设立的特征的组合,而且包括权利要求中的特征的任意其他组合,其中,权利要求中提及的每个特征可与权利要求中的任意其他特征或者其他特征的组合进行组合。此外,本文中描述或描绘的任何实施方式和特征可以在单独的权利要求中被要求保护和/或与本文中描述或描绘的任何实施方式或特征或者与所附权利要求的任何特征的任何组合中要求保护。
在根据本发明的实施方式中,一种计算机实现的方法包括:
通过一个或多个计算设备访问:
社交网络系统的用户已经交互的该社交网络系统中的第一组实体,例如,存储在一个或多个数据存储装置中的第一组数据对象,以及
在该社交网络系统中的第二组实体,例如,存储在一个或多个数据存储装置中的第二组数据对象;
通过一个或多个计算设备使用深度学习模型来确定第一组实体的第一组矢量表示;
通过一个或多个计算设备从第一组实体中选择目标实体;
通过一个或多个计算设备从第一组矢量表示中移除目标实体的矢量表示;
通过一个或多个计算设备将第一组矢量表示中的其余矢量表示进行组合以确定用户的矢量表示;
通过一个或多个计算设备使用深度学习模型来确定第二组实体的第二组矢量表示;
通过一个或多个计算设备:
通过将用户的矢量表示与目标实体的矢量表示进行对比,计算目标实体与用户之间的相似性评分,以及
通过将用户的矢量表示与第二组实体中的实体的矢量表示进行对比,计算用户与第二组实体中的实体之间的相似性评分;并且
通过一个或多个计算设备使用深度学习模型基于相似性评分来更新第二组实体中的一个或多个实体的矢量表示。
如以上所表明的,对矢量表示的更新可以用于或应用于改善或优化数据存取时间和/或用于减少在远程设备之间的数据流量。对于进一步有利的效果,参照以上和以下例如关于嵌入的讨论。
深度学习模型例如可以是机器学习模型、神经网络、潜在神经网络、任何其他合适的深度学习模型、或其任何组合,参照以上和以下的讨论。
例如在本文中描述的实施方式中的深度学习模型的可用性是所提出的方法的发现之一,其中使用与用户和/或实体的矢量表示相关的深度学习模型已经揭示为对改善数据存取和/或对减少数据流量特别有效,特别是在例如由社交网络数据库使用或在社交网络数据库中使用的大规模数据库中。
相似性评分可以是表示在多个实体和/或一个实体与用户表示之间的相似性的参数。
在根据本发明的实施方式中,该方法可以进一步包括:
通过一个或多个计算设备确定针对用户、第一组实体中的每个实体、以及第二组实体中的每个实体的嵌入,其中:
每个嵌入对应于在多维嵌入空间中的一个点,
嵌入空间包括对应于多个实体的多个点;并且
每个嵌入是基于使用深度学习模型确定的相应矢量表示的。
嵌入空间例如可以是多维空间,例如d维空间,其中d是控制容量的超参数(例如,自然数)并且可以包括对应于实体的嵌入的多个点。如本文中所使用的,实体的嵌入可以指的是实体在嵌入空间中的表示。
在多个实施方式中,深度学习模型(例如,神经网络)可以包括一个或多个索引,该一个或多个索引配置成用于将实体映射为中的矢量,其中表示实数集,并且d是控制容量的超参数(例如,自然数)。这些矢量可以是d维的强度矢量。如本文中所使用的,强度值可以是在-1至1的范围内的任何合适的值。实体的矢量表示中的每一个可以提供对于嵌入空间中的相应点的坐标。
在具体实施方式中,深度学习模型可以包括被训练成将实体映射为矢量表示的一个或多个索引。
在具体实施方式中,例如选定数量的实体中的一个或多个实体和/或一组实体和/或每个实体、或者相应的矢量表示(例如,一对一映射)可以例如由社交网络系统使用(作为实例而并非以限制的方式)字典来映射,该字典是使用深度学习模型生成的。
在根据本发明的实施方式中,该方法可以进一步包括通过一个或多个计算设备基于相似性评分将相应排名分配给目标实体和第二组实体中的每个实体,并且其中,更新第二组实体中的该一个或多个实体的矢量表示可以进一步基于排名。
第二组实体中的矢量表示被更新的该一个或多个实体中的每一个实体可选地可以具有比目标实体的相似性评分更大的相似性评分。在如本文中所使用的模型中,相似性评分越高,所对比的实体和/或用户表示就越相似。例如,具有高于第二实体的相似性评分的第一实体可以比第二实体更加类似于用户表示。
在根据本发明的实施方式中,该方法可以进一步包括通过对嵌入空间应用搜索算法来将多个实体中的一个或多个实体识别为与用户相关,其中,对应于所识别的实体的一个或多个嵌入的点可以是在与用户在嵌入空间中的嵌入对应的该点的阈值距离内。
在根据本发明的实施方式中,该方法可以进一步包括将该一个或多个所识别的实体发送给用户的客户端系统以用于显示给用户。
目标实体可以是随机选择的。
用户在社交网络系统中可能尚未与第二组实体交互。
社交网络系统可以包括社交图谱,该社交图谱包括多个节点和连接这些节点的多个边线,这些节点中的两个节点之间的每一条边线表示在这两个节点之间的单个分离度,这些节点包括:
对应于用户的第一节点;以及
各自对应于相应实体的多个第二节点。
社交网络系统的社交图谱数据库的节点和/或边线可以用作为本文中提及的实体。
用户可以已经通过用户的社交网络动作与第一组实体交互,其中,社交网络动作是相对于第一节点和对应于第一组实体的相应实体的相应第二节点来采取的。
社交网络动作可以表示对于实体的亲密度表达。
这些实体中的至少一个实体可以包括由社交网络系统承载的页面。
这些矢量表示可以包括d维的强度矢量。
在根据本发明的实施方式中,一种或多种计算机可读非暂时性存储介质可以体现软件,该软件在被执行时可操作为:
访问:
社交网络系统的用户已经交互的该社交网络系统中的第一组实体,以及
社交网络系统中的第二组实体;
使用深度学习模型确定第一组实体的第一组矢量表示;
从第一组实体中选择目标实体;
从第一组矢量表示中移除目标实体的矢量表示;
将第一组矢量表示中的其余矢量表示结合以确定用户的矢量表示;
使用深度学习模型确定第二组实体的第二组矢量表示;
通过将用户的矢量表示与目标实体的矢量表示进行对比,计算目标实体与用户之间的相似性评分,以及
通过将用户的矢量表示与第二组实体中的实体的矢量表示进行对比,计算用户与第二组实体中的实体之间的相似性评分;并且
使用深度学习模型基于相似性评分更新第二组实体中的一个或多个实体的矢量表示。
对于优点和有利的效果和/或对于另外的实施方式,参照以上关于该方法的讨论,其可作必要的修正。
该软件在被执行时可以进一步可操作为:
确定针对用户、第一组实体中的每个实体、以及第二组实体中的每个实体的嵌入,其中:
每个嵌入对应于在多维嵌入空间中的一个点,
嵌入空间包括对应于多个实体的多个点;并且
每个嵌入是基于使用深度学习模型确定的相应矢量表示的。
该软件在被执行时可以进一步可操作为基于相似性评分将相应排名分配给目标实体和第二组实体中的每个实体,并且其中,更新第二组实体中的该一个或多个实体的矢量表示可以进一步基于排名。
在根据本发明的实施方式中,一种系统可以包括:一个或多个处理器;以及耦接至这些处理器的存储装置,该存储装置包括可由这些处理器执行的指令,这些处理器在执行这些指令时可操作为:
访问:
社交网络系统的用户已经交互的该社交网络系统中的第一组实体,以及
社交网络系统中的第二组实体;
使用深度学习模型确定第一组实体的第一组矢量表示;
从第一组实体中选择目标实体;
从第一组矢量表示中移除目标实体的矢量表示;
将第一组矢量表示中的其余矢量表示进行组合以确定用户的矢量表示;
使用深度学习模型确定第二组实体的第二组矢量表示;
通过将用户的矢量表示与目标实体的矢量表示进行对比,计算目标实体与用户之间的相似性评分,以及
通过将用户的矢量表示与第二组实体中的实体的矢量表示进行对比,计算用户与第二组实体中的实体之间的相似性评分;并且
使用深度学习模型基于相似性评分更新第二组实体中的一个或多个实体的矢量表示。
对于优点和有利的效果和/或对于另外的实施方式,参照以上关于该方法的讨论,其可作必要的修正。
这些处理器在执行指令时可以进一步可操作为:
确定针对用户、第一组实体中的每个实体、以及第二组实体中的每个实体的嵌入,其中:
每个嵌入对应于多维嵌入空间中的一个点,
嵌入空间包括对应于多个实体的多个点;并且
每个嵌入是基于使用深度学习模型确定的相应矢量表示的。
这些处理器在执行指令时可以进一步可操作为基于相似性评分将相应排名分配给目标实体和第二组实体中的每个实体,并且其中,更新第二组实体中的该一个或多个实体的矢量表示可以进一步基于排名。
在根据本发明的另一个实施方式中,一种或多种计算机可读非暂时性存储介质,其承载软件,该软件在被执行时可操作为执行根据本发明或以上提及的任何实施方式的方法。
在根据本发明的另一个实施方式中,一种系统包括:一个或多个处理器;以及至少一个存储装置,该至少一个存储装置耦接至这些处理器并且包括可由这些处理器执行的指令,这些处理器在执行这些指令时可操作为执行根据本发明或以上提及的任何实施方式的方法。
在根据本发明的另一个实施方式中,优选地包括计算机可读非暂时性存储介质的一种计算机程序产品,当在数据处理系统上被执行时可操作为执行根据本发明或以上提及的任何实施方式的方法。
附图说明
图1示出了与社交网络系统相关联的示例网络环境。
图2示出了示例社交图谱。
图3示出了示例深度学习模型。
图4示出了将实体映射为矢量表示的示例字典。
图5示出了用于使用深度学习模型确定用户的嵌入的示例方法。
图6示出了用于训练深度学习模型的示例方法。
图7示出了嵌入空间的示例视图。
图8示出了用于使用深度学习模型更新实体的矢量表示的示例方法。
图9示出了示例计算机系统。
具体实施方式
系统概述
图1示出了与社交网络系统相关联的示例网络环境100。网络环境100包括通过网络110彼此连接的客户端系统130、社交网络系统160、以及第三方系统170。尽管图1示出了客户端系统130、社交网络系统160、第三方系统170以及网络110的特定布置,然而本公开考虑了客户端系统130、社交网络系统160、第三方系统170以及网络110的任何合适的布置。作为实例而并非以限制的方式,客户端系统130、社交网络系统160、以及第三方系统170中的两种或更多种可以绕过网络110直接彼此连接。作为另一个实例,客户端系统130、社交网络系统160、以及第三方系统170中的两种或更多种可以作为整体或者部分地通过物理方式或者逻辑方式彼此共置。此外,尽管图1示出了特定数量的客户端系统130、社交网络系统160、第三方系统170以及网络110,然而本公开考虑了任何合适的数量的客户端系统130、社交网络系统160、第三方系统170以及网络110。作为实例而并非以限制的方式,网络环境100可以包括多个客户端系统130、多个社交网络系统160、多个第三方系统170、以及多个网络110。
本公开考虑了任何合适的网络110。作为实例而并非以限制的方式,网络110的一个或多个部分可以包括自组网、内联网、外联网、虚拟专用网络(VPN)、局域网(LAN)、无线LAN(WLAN)、广域网(WAN)、无线WAN(WWAN)、城域网(MAN)、互联网的一部分、公共交换电话网(PSTN)的一部分、蜂窝电话网、或者这些中两种或更多种的组合。网络110可以包括一个或多个网络110。
链路150可以将客户端系统130、社交网络系统160以及第三方系统170连接至通信网络110或者将其彼此连接。本公开考虑了任何合适的链路150。在具体实施方式中,一条或多条链路150包括一条或多条有线链路(诸如,数字用户线路(DSL)或有线电缆数据服务接口规范(DOCSIS))、无线链路(诸如,Wi-Fi或全球互通微波存取(WiMAX))、或者光学链路(诸如,同步光学网络(SONET)或同步数字体系(SDH))。在具体实施方式中,一条或多条链路150各自包括自组网、内联网、外联网、VPN、LAN、WLAN、WAN、WWAN、MAN、互联网的一部分、PSTN的一部分、基于蜂窝技术的网络、基于卫星通信技术的网络、另一条链路150、或者两条或更多条此类链路150的组合。网络环境100中的链路150不一定必须相同。就一个或多个方面而言,一条或多条第一链路150可以与一条或多条第二链路150不同。
在具体实施方式中,客户端系统130可以是包括硬件、软件、或者嵌入式逻辑部件、或者两个或更多个这种部件的组合的并且能够实施通过客户端系统130实现或支持的适当功能的电子设备。作为实例而并非以限制的方式,客户端系统130可以包括计算机系统,诸如,桌面计算机、笔记本或膝上型计算机、上网本、平板计算机、电子书阅读器、GPS设备、相机、个人数字助理(PDA)、手持式电子设备、蜂窝电话、智能电话、增强/虚拟现实设备、其他合适的电子设备、或者其任何合适的组合。本公开考虑了任何合适的客户端系统130。客户端系统130可以使客户端系统130处的网络用户能够访问网络110。客户端系统130可以使其用户能够与在其他客户端系统130处的其他用户通信。
在具体实施方式中,客户端系统130可以包括网络浏览器132(诸如,微软互联网浏览器(MICROSOFT INTERNET EXPLORER)、谷歌浏览器(GOOGLE CHROME)或火狐浏览器(MOZILLA FIREFOX))并且可以具有一个或多个附件、插件或其他扩展(诸如,工具栏或雅虎工具栏(YAHOO TOOLBAR))。在客户端系统130处的用户可以输入将网络浏览器132引导至特定服务器(诸如服务器162或与第三方系统170相关联的服务器)的统一资源定位符(URL)或其他地址,并且网络浏览器132可以生成超文本传输协议(HTTP)请求并且将HTTP请求传送至服务器。服务器可以接受HTTP请求并且响应于HTTP请求将一个或多个超文本标记语言(HTML)文件传送至客户端系统130。客户端系统130可以基于来自服务器的HTML文件渲染网页以用于呈现给用户。本公开考虑了任何合适的网页文件。作为实例而并非以限制的方式,网页可以根据具体需要从HTML文件、可扩展的超文本标记语言(XHTML)文件、或者可扩展标记语言(XML)文件进行渲染。这些网页还可以执行脚本,诸如,例如但不限于以JAVASCRIPT、JAVA、MICROSOFT SILVERLIGHT、诸如AJAX(异步JAVASCRIPT和XML)等标记语言与脚本的组合编写的那些脚本。本文中,在适当的情况下,参考网页包括一个或多个对应的网页文件(浏览器可以用其渲染网页),并且反之亦然。
在具体实施方式中,社交网络系统160可以是可以承载在线社交网络的网络可寻址的计算机系统。社交网络系统160可以生成、存储、接收并且发送社交网络数据,诸如,用户资料数据、概念资料数据、社交图谱信息或者与在线社交网络相关的其他合适的数据。通过网络环境100中的其他部件可以直接访问或者经由网络110访问社交网络系统160。在具体实施方式中,社交网络系统160可以包括一个或多个服务器162。每个服务器162可以是整体式服务器、或者跨多个计算机或多个数据中心的分布式服务器。服务器162可以具有各种类型,例如但不限于,网络服务器、新闻服务器、邮件服务器、消息服务器、广告服务器、文件服务器、应用服务器、交换服务器、数据库服务器、代理服务器、适用于执行本文中所描述的功能或者过程的另一服务器、或者其任何组合。在具体实施方式中,每个服务器162可以包括用于执行通过服务器162实现或者支持的适当功能的硬件、软件、或者嵌入式逻辑部件、或者两种或更多种这种部件的组合。在具体实施方式中,社交网络系统160可以包括一个或多个数据存储装置164。数据存储装置164可以用于存储各种类型的信息。在具体实施方式中,可以根据特定的数据结构组织存储在数据存储装置164中的信息。在具体实施方式中,每个数据存储装置164可以是关系数据库、对列式数据库、相关性数据库、或者其他合适的数据库。虽然本公开描述或者示出了特定类型的数据库,然而本公开考虑了任何合适类型的数据库。具体实施方式可以提供使客户端系统130、社交网络系统160、或者第三方系统170能够管理、检索、修改、添加、或者删除存储在数据存储装置164中的信息的接口。
在具体实施方式中,社交网络系统160可以将一个或多个社交图谱存储在一个或多个数据存储装置164中。在具体实施方式中,社交图谱可以包括多个节点和连接这些节点的多条边线,这些节点可以包括多个用户节点(各自对应于一个特定用户)或者多个概念节点(各自对应于一个特定概念)。社交网络系统160可以向在线社交网络的用户提供与其他用户通信和交互的能力。在具体实施方式中,用户可以经由社交网络系统160加入在线社交网络,并且然后添加连接(例如关系)至其想要连接的社交网络系统160的一定数量的其他用户。本文中,术语“好友”可以指用户经由社交网络系统160与其形成连接、关联或者关系的社交网络系统160的任何其他用户。
在具体实施方式中,社交网络系统160可以为用户提供对由社交网络系统160支持的各种类型的项或对象采取动作的能力。作为实例而并非以限制的方式,项和对象可以包括社交网络系统160的用户可能属于的群组或社交网络、用户可能感兴趣的事件或日历条目、用户可以使用的基于计算机的应用、允许用户经由服务购买或出售项的交易、用户可以进行的与广告的交互、或者其他适当的项或对象。用户可以与能够在社交网络系统160中呈现的或者由第三方系统170的外部系统呈现的任意事物交互,该外部系统与社交网络系统160分离并且经由网络110耦接至社交网络系统160。
在具体实施方式中,社交网络系统160可以能够链接各种实体。作为实例而并非以限制的方式,社交网络系统160可以使用户能够彼此交互以及从第三方系统170或其他实体接收内容、或者允许用户通过应用程序编程接口(API)或者其他通信信道与这些实体交互。
在具体实施方式中,第三方系统170可以包括一种或多种类型的服务器、一个或多个数据存储装置、一个或多个接口(包括但不限于API)、一个或多个网络服务、一个或多个内容源、一个或多个网络、或者例如服务器可与其通信的任何其他合适的部件。第三方系统170可以由不同于操作社交网络系统160的实体的实体来操作。然而,在具体实施方式中,社交网络系统160和第三方系统170可以彼此联合操作以向社交网络系统160的用户或者第三方系统170的用户提供社交网络服务。在这种意义上,社交网络系统160可以提供平台或骨干链路,其他系统(诸如第三方系统170)可以使用该平台或骨干链路来通过互联网将社交网络服务和功能提供给用户。
在具体实施方式中,第三方系统170可以包括第三方内容对象提供商。第三方内容对象提供商可以包括内容对象的一个或多个源,其可以被传送至客户端系统130。作为实例而并非以限制的方式,内容对象可以包括有关用户感兴趣的事物或活动的信息,诸如,电影放映次数、电影评论、餐馆评论、餐馆菜单、产品信息和评论、或者其他合适的信息。作为另一个实例而非限制的方式,内容对象可以包括激励性内容对象,诸如,优惠券、打折票、礼品券、或者其他合适的激励对象。
在具体实施方式中,社交网络系统160还包括可以增强用户与社交网络系统160的交互的用户生成的内容对象。用户生成的内容可以包括用户可以添加、上传、发送、或者“发布”到社交网络系统160的任意事物。作为实例而并非以限制的方式,用户从客户端系统130将帖子传送至社交网络系统160。帖子可以包括诸如状态更新或者其他文本数据、位置信息、照片、视频、链接、音乐、或者其他相似的数据或媒体等数据。也可以由第三方通过诸如新闻递送或流的“通信渠道”将内容添加至社交网络系统160。
在具体实施方式中,社交网络系统160可以包括各种服务器、子系统、程序、模块、日志、以及数据存储装置。在具体实施方式中,社交网络系统160可以包括以下各项中的一者或多者:网络服务器、动作记录器、API请求服务器、相关性和排名引擎、内容对象分类器、通知控制器、动作日志、第三方内容对象曝光日志、推理模块、授权/私人性服务器、搜索模块、广告目标模块、用户界面模块、用户资料存储装置、连接存储装置、第三方内容存储装置、或者位置存储装置。社交网络系统160还可以包括诸如网络接口、安全机构、负载平衡器、故障转移服务器、管理和网络操作平台、其他合适的部件、或者其任何合适的组合等合适的部件。在具体实施方式中,社交网络系统160可以包括用于存储用户资料的一个或多个用户资料存储装置。例如,用户资料可以包括传记信息、人口统计信息、行为信息、社交信息、或其他类型的描述性信息,诸如,工作经历、教育背景、爱好或偏好、兴趣、亲密度、或位置。兴趣信息可以包括与一种或多种类别有关的兴趣。类别可以是总体的或者具体的。作为实例而并非以限制的方式,如果用户“喜欢”与一个鞋子品牌有关的物品,则该类别可以是该品牌、或者“鞋子”或“衣物”的总体类别。连接存储装置可以用于存储关于用户的连接信息。连接信息可以表明具有相似或共同的工作经历、群体成员关系、爱好、教育背景、或者以任何方式与共同属性有关或者享有共同属性的用户。连接信息还可以包括在不同的用户和内容(内部和外部两者)之间由用户定义的连接。网络服务器可以用于经由网络110将社交网络系统160链接至一个或多个客户端系统130或者一个或多个第三方系统170。网络服务器可以包括用于在社交网络系统160与一个或多个客户端系统130之间接收并路由消息的邮件服务器或其他消息发送功能。API请求服务器可以允许第三方系统170通过调用一个或多个API访问来自社交网络系统160的信息。动作记录器可以用于从网络服务器接收关于用户在社交网络系统160上或离线社交网络系统的动作的通信。结合动作日志,可以保持第三方内容对象日志向第三方内容对象的用户曝光。通知控制器可以将关于内容对象的信息提供至客户端系统130。信息可以作为通知推送给客户端系统130,或者可以响应于从客户端系统130接收的请求从客户端系统130拖出信息。授权服务器可以用于实施社交网络系统160的用户的一个或多个隐私设置。用户的隐私设置确定可以分享与用户相关的特定信息的方式。授权服务器可以允许用户决定是否允许由社交网络系统160记录其动作、或者诸如通过设置适当的隐私设置来与其他系统(例如,第三方系统170)共享其动作。第三方内容对象存储装置可以用于存储从第三方(诸如第三方系统170)接收的内容对象。位置存储装置可以用于存储从与用户相关联的客户端系统130接收的位置信息。广告定价模块可以将社交信息、当前时间、位置信息、或其他合适的信息组合,从而以通知的形式将相关广告提供给用户。
社交图谱
图2示出了示例社交图谱200。在具体实施方式中,社交网络系统160可以在一个或多个数据存储装置中存储一个或多个社交图谱200。在具体实施方式中,社交图谱200可以包括多个节点和连接这些节点的多条边线206,这些节点可以包括多个用户节点202或者多个概念节点204。为了教导的目的,以二维视觉映射表示法示出了在图2中示出的示例社交图谱200。在具体实施方式中,社交网络系统160、客户端系统130、或第三方系统170可以访问社交图谱200和用于合适应用的相关社交图谱信息。例如,社交图谱200的节点和边线可以作为数据对象存储在数据存储装置(诸如,社交图谱数据库)中。这种数据存储装置可以包括社交图谱200的节点或边线的一个或多个可搜索或可查询的索引。
在具体实施方式中,用户节点202可以对应于社交网络系统160的用户。作为实例而并非以限制的方式,用户可以是与社交网络系统160或者通过社交网络系统进行交互或通信的个体(个人用户)、实体(例如,企业、商家、或第三方应用)、或者(例如,个人或者实体的)群体。在具体实施方式中,当用户注册社交网络系统160的账户时,社交网络系统160可以创建对应于该用户的用户节点202并且将用户节点202存储在一个或多个数据存储装置中。在适当情况下,本文中所描述的用户和用户节点202可以指的是注册用户以及与注册用户相关的用户节点202。此外或者作为替代,本文中描述的用户和用户节点202在适当情况下可以指尚未注册社交网络系统160的用户。在具体实施方式中,用户节点202可以与由用户提供的信息或者由包括社交网络系统160的各种系统收集的信息相关联。作为实例而并非以限制的方式,用户可以提供他或她的姓名、资料图片、联系信息、出生日期、性别、婚姻状况、家庭状况、职业、教育背景、偏好、兴趣、或其他人口统计信息。在具体实施方式中,用户节点202可以与对应于与用户相关联的信息的一个或多个数据对象相关联。在具体实施方式中,用户节点202可以对应于一个或多个网页。
在具体实施方式中,概念节点204可以对应于一个概念。作为实例而并非以限制的方式,一个概念可以对应于:地点(诸如,电影院、餐馆、地标或城市);网站(例如,与社交网络系统160相关联的网站或者与网络应用服务器相关联的第三方网站);实体(例如,个人、商家、群体、运动队或者名人);可以位于社交网络系统160内或在外部服务器(诸如,网络应用服务器)上的资源(例如,音频文件、视频文件、数字照片、文本文件、结构文档、或应用);不动产或知识产权(例如,雕塑、绘画、电影、游戏、歌曲、创意、照片、或书面作品);游戏;活动;创意或理论;增强/虚拟现实环境中的对象;另外的合适的概念;或者两个或更多个这样的概念。概念节点204可以与由用户提供的概念的信息或者由包括社交网络系统160的各种系统收集的信息相关联。作为实例而并非以限制的方式,概念的信息可以包括:名称或标题;一个或多个图像(例如,书籍封面页上的图像);位置(例如,地址或地理位置);网站(其可以与URL相关联);联系信息(例如,电话号码或电子邮件地址);其他合适的概念信息;或者此类信息的任何合适的组合。在具体实施方式中,概念节点204可以与对应于与概念节点204相关联的信息的一个或多个数据对象相关联。在具体实施方式中,概念节点204可以对应于一个或多个网页。
在具体实施方式中,社交图谱200中的节点可以表示网页(其可被称为“资料页面”)或者由网页表示。资料页面可以被社交网络系统160承载或者可访问社交网络系统。资料页面还可以由与第三方服务器170相关联的第三方网站承载。作为实例而并非以限制的方式,对应于特定外部网页的资料页面可以是该特定外部网页,并且资料页面可以对应于特定概念节点204。资料页面可以是所有其他用户或者其他用户的选择子集可见的。作为实例而并非以限制的方式,用户节点202可以具有对应的用户资料页面,其中,对应的用户可以添加内容、做出声明、或者以其他方式表达他或她自己。作为另一个实例而并非以限制的方式,概念节点204可以具有对应的概念资料页面(尤其与对应于概念节点204的概念有关),其中,一个或多个用户可以添加内容、发布声明、或者表达自身。
在具体实施方式中,概念节点204可以表示由第三方系统170承载的第三方网页或资源。除其他元素之外,第三方网页或资源可以包括内容、可选择的或者其他图标、或者表示动作或活动的其他相互作用对象(例如,其可以以JavaScript、AJAX、或PHP代码实现)。作为实例而并非以限制的方式,第三方网页可以包括诸如“喜欢”、“签到”、“吃”、“推荐”、或者其他合适的动作或活动的可选择图标。浏览第三方网页的用户可以通过选择这些图标之一(例如“签到”)来执行动作,致使客户端系统130将表明用户动作的消息发送给社交网络系统160。响应于该消息,社交网络系统160可以在对应于该用户的用户节点202与对应于该第三方网页或资源的概念节点204之间创建边线(例如,签到类型边线)并且将边线206存储在一个或多个数据存储装置中。
在具体实施方式中,社交图谱200中的一对节点可以通过一条或多条边线206彼此连接。连接一对节点的边线206可以表示该对节点之间的关系。在具体实施方式中,边线206可以包括或表示对应于一对节点之间的关系的一个或多个数据对象或者属性。作为实例而并非以限制的方式,第一用户可以表明第二用户是第一用户的“好友”。响应于这种表明,社交网络系统160可以将“好友请求”发送给第二用户。如果第二用户确认“好友请求”,则社交网络系统160可以在社交图谱200中创建将第一用户的用户节点202连接至第二用户的用户节点202的边线206、并且将边线206作为社交图谱信息存储在一个或多个数据存储装置164中。在图2的实例中,社交图谱200包括表明用户“A”与用户“B”的用户节点202之间的好友关系的边线206、以及表明用户“C”与用户“B”的用户节点202之间的好友关系的边线。虽然本公开描述或者示出了连接特定用户节点202的具有特定属性的特定边线206,然而本公开考虑了连接用户节点202的具有任何合适属性的任何合适的边线206。作为实例而并非以限制的方式,边线206可以表示朋友关系、家庭关系、公司或工作关系、爱好者关系(包括例如喜爱等)、粉丝关系、访客关系(包括例如访问、查看、登陆、分享等)、客户关系、上级/下属关系、相互关系、非相互关系、另一个类型合适的关系或者两个以上此类关系。此外,尽管本公开总体上描述了处于连接的节点,然而本公开也描述了处于连接的用户或概念。在本文中,在适当情况下,对于连接的用户或概念的引用可以指的是对应于通过一个或多个边线206在社交图谱200中被连接的这些用户或概念的节点。
在具体实施方式中,在用户节点202与概念节点204之间的边线206可以表示由与用户节点202相关联的用户向与概念节点204相关联的概念执行的特定动作或活动。作为实例而并非以限制的方式,如图2所示出的,用户可以“喜欢”、“参与”、“播放”、“收听”、“烹饪”、“任职于”、或“观看”概念,其中的每个可以对应于边线类型或边线子类型。例如,对应于概念节点204的概念资料页面可以包括可选择的“签到”图标(诸如,例如可点击的“签到”图标)或可选择的“添加到收藏夹”图标。类似地,在用户点击这些图标之后,社交网络系统160可以响应用户的对应于相应动作的动作来创建“收藏”边线或者“签到”边线。作为另一个实例而并非以限制的方式,用户(用户“C”)可以使用特定的应用(SPOTIFY,其是在线音乐应用)收听特定的歌曲(“想象(Imagine)”)。在该情况下,社交网络系统160可以在对应于用户的用户节点202与对应于歌曲和应用的概念节点204之间创建“收听”边线206和“使用”边线(如图2中所示出的),以表明用户听过该歌曲并且使用过该应用。此外,社交网络系统160可以在对应于歌曲和应用的概念节点204之间创建“播放”边线206(如图2中所示出的),以表明通过特定应用播放了特定歌曲。在这种情况下,“播放”边线206对应于通过外部应用(SPOTIFY)对外部音频文件(歌曲“想象(Imagine)”)执行的动作。虽然本公开描述了连接用户节点202和概念节点204的具有特定属性的特定边线206,然而本公开考虑了连接用户节点202和概念节点204的具有任何合适属性的任何合适的边线206。此外,虽然本公开描述了表示单一关系的用户节点202与概念节点204之间的边线,然而本公开考虑了表示一个或多个关系的用户节点202与概念节点204之间的边线。作为实例而并非以限制的方式,边线206可以表示用户喜欢并已经使用特定概念这两者。可替换地,另一边线206可以表示在用户节点202与概念节点204之间(如图2中示出的在用户“E”的用户节点202与“SPOTIFY”的概念节点204之间)的每个类型的关系(或者多个单一关系)。
在具体实施方式中,社交网络系统160可以在社交图谱200中创建在用户节点202与概念节点204之间的边线206。作为实例而并非以限制的方式,查看概念资料页面的用户(诸如,通过使用由用户的客户端系统130承载的网络浏览器或特殊用途应用)可以通过点击或选择“喜欢”图标来表明他或她喜欢由概念节点204表示的概念,这可以致使用户的客户端系统130向社交网络系统160发送以下消息,该消息表明用户喜欢与该概念资料页面相关联的概念。响应于该消息,社交网络系统160可以在与用户相关联的用户节点202与概念节点204之间创建边线206,如由在用户与概念节点204之间的“喜欢”边线206所示出的。在具体实施方式中,社交网络系统160可以将边线206存储在一个或多个数据存储装置中。在具体实施方式中,边线206可以通过社交网络系统160响应于特定的用户动作而自动形成。作为实例而并非以限制的方式,如果第一用户上传图片、观看电影、或收听歌曲,则边线206可以在对应于第一用户的用户节点202与对应于这些概念的概念节点204之间形成。虽然本公开描述了以特定方式形成特定的边线206,然而本公开考虑了以任何合适的方式形成任何合适的边线206。
训练深度学习模型
具体实施方式使用深度学习模型来将一个或多个实体识别为与用户相关。在具体实施方式中,实体可以是可以由社交图谱200中的概念节点204或用户节点202表示的任何合适的实体(例如,个人、商家、群体、运动队、或名人)。在具体实施方式中,实体可以是(作为实例而并非以限制的方式)由社交网络系统160承载的页面(例如,资料页面、位置页面、商务页面)、文本内容(例如,一个或多个n元语法)、视觉内容(例如,一个或多个图像)、音频内容(例如,一个或多个录音)、视频内容(例如,一个或多个视频短片)、标注(例如,便签或标签)、任何其他合适类型的内容、任何其他合适的实体、或其任何组合。如在本文中使用的,标注可以是标签、表情符号、便签、表意符号、任何其他合适的文本注释、任何其他合适的字符、符号、或图像(其各自可以表示使用或未使用字母或单词的概念或事物)、或其任何组合。如在本文中使用的,标签可以是由前缀有字符“#”的自然语言n元语法或缩略语构成的单个符记(例如,#祝福)。如在本文中使用的,n元语法可以是单词或单词组、任何词类、标点符号(例如,“!”)、俗语(例如,“疯了吧”)、首字母缩写词(例如,“BRB”)、缩略语(例如,“mgmt.”)、感叹词(“啊”)、字母数字字符、符号、书写字符、重音符号、或其任何组合。
图3示出了示例深度学习模型310。深度学习模型310可以是机器学习模型、神经网络、潜在神经网络、任何其他合适的深度学习模型、或其任何组合。在具体实施方式中,深度学习模型310可以具有多个抽象层。输入302、304、306、和308可以是任何合适数量的实体。输出312可以是实体的一个或多个嵌入。嵌入空间可以是多维空间(例如,d维,其中d是控制容量的超参数)并且可以包括对应于实体的嵌入的多个点。如本文中所使用的,实体的嵌入指的是实体在嵌入空间中的表示。虽然在图3中示出了特定数量的输入实体302、304、306、和308,然而深度学习模型310可以对于任何合适数量的输入实体302、304、306、和308生成实体的嵌入。
在具体实施方式中,深度学习模型310(例如,神经网络)可以包括一个或多个索引,该一个或多个索引可以将实体映射为中的矢量,其中表示实数集,并且d是控制容量的超参数。这些矢量可以是d维的强度矢量。如本文中所使用的,强度值可以是在-1至1的范围内的任何合适的值。实体的矢量表示中的每一个可以提供对于嵌入空间中的相应点的坐标。虽然在图3中示出了特定数量的输入实体302、304、306、和308,然而深度学习模型310可以提供在任何合适数量的实体302、304、306、和308与矢量表示之间的映射。
深度学习模型310可以被训练为生成优化的实体嵌入。深度学习模型310可以包括一个或多个索引(即,字典),该一个或多个索引可以是随着深度学习模型310被训练而动态更新的。该一个或多个索引可以是在深度学习模型310的训练阶段过程中生成的。在具体实施方式中,深度学习模型可以包括被训练成将实体映射为矢量表示的一个或多个索引。深度学习模型310可以例如是神经网络或潜在神经网络。深度学习模型310可以是使用随机分布来初始化的。也就是说,深度学习模型310可以初始地具有随机分配的映射(即,在实体302、304、306、和308与矢量表示之间,实体302、304、306、和308的嵌入可以是基于其来生成的)。作为实例而并非以限制的方式,该随机分布可以是高斯分布。训练可以造成深度学习模型310的该一个或多个索引生成比初始映射更优化的映射。
在具体实施方式中,深度学习模型310可以具有在共同未决的于2015年11月23日提交的美国专利申请号14/949436以及于2015年11月5日提交的美国专利申请号62/251352中描述的深度学习模型的一个或多个特征,这些申请通过引用并入本文。
虽然本公开将图3的具体实施方式描述并示出为是通过社交网络系统160实现的,然而本公开考虑了图3的任何合适的实施方式是通过任何合适的平台或系统实现的。作为实例而并非以限制的方式,图3的具体实施方式可以是由客户端系统130、第三方系统170、或任何其他合适的系统实现的。此外,虽然本公开描述并且示出了进行图3的方法的特定步骤的特定部件、设备或系统,然而本公开考虑了进行图3的方法的任何合适步骤的任何合适的部件、设备或系统的任何合适的组合。
图4示出了将实体402、404、406和408映射为矢量表示412、414、416和418的示例字典400。实体402、404、406和408可以是(作为实例而并非以限制的方式)由社交网络系统160承载的页面。在具体实施方式中,字典400可以是由社交网络系统160生成的。在具体实施方式中,字典400可以将实体映射为中的矢量,其中R表示实数集,并且d是控制容量的超参数。矢量表示412、414、416和418可以是d维的强度矢量。如本文中所使用的,强度值可以是在-1至1的范围内的任何合适的值。出于说明性目的而并非以限制的方式,在示例矢量表示412、414、416和418中的强度值被描绘为图4中的图案。例如,字典400将实体402映射为矢量表示412,该矢量表示被示出为顶排的各种图案的单元,在字典400中邻近页面402。虽然字典400被描绘为具有特定尺寸(即,维度),但这仅是说明性而并非限制性的。字典400可以具有任何合适的尺寸。字典400可以提供在任何合适数量的实体与矢量表示之间的映射。
使用字典400确定的实体的矢量表示中的每一个矢量表示可以为嵌入空间中的相应点提供坐标。嵌入空间可以是多维空间(例如,d维)并且可以包括对应于实体嵌入的多个点。如在本文中使用,实体嵌入指的是实体在嵌入空间中的基于该实体的矢量表示的表示(例如,使用字典400确定的)。每个实体嵌入可以对应于嵌入空间中的相应点。在具体实施方式中,每个实体可以表示为一组实体(例如,页面可以表示为出现在该页面上的一组文本项),并且实体嵌入可以是基于该组实体的矢量表示(例如,在该页面上的文本项的矢量表示的非线性组合)来确定的。作为另一个实例而并非以限制的方式,用户可以表示为一组实体(例如,表示为用户在社交网络系统160中已经“喜欢”的一组页面),并且用户的嵌入可以是基于该组中的实体的矢量表示来确定的。如以上所描述的,该组中的每个实体可以进而表示为一组实体(例如,每个实体的矢量表示可以基于一组实体的矢量表示)。用于将实体分层地表示为多组实体的这种技术可以在适当情况下多级地继续。也就是说,作为实例而并非以限制的方式,每个实体可以表示为一组实体,该组实体可以各自表示为一组实体,诸如此类。
字典400可以是深度学习模型的一部分。为了生成优化的嵌入,深度学习模型可以被训练。字典400可以是在深度学习模型的训练阶段阶段生成的。深度学习模型可以例如是卷积神经网络。字典400可以是使用随机分布来初始化的。也就是说,字典400可以初始地具有随机分配的映射。作为实例而并非以限制的方式,该随机分布可以是高斯分布。训练可以造成字典400生成比初始映射更优化的映射。
虽然本公开将图4的具体实施方式描述并示出为是通过社交网络系统160实现的,然而本公开考虑了图4的任何合适的实施方式是通过任何合适的平台或系统实现的。作为实例而并非以限制的方式,图4的具体实施方式可以是由客户端系统130或第三方系统170实现的。此外,虽然本公开描述并且示出了进行图4的方法的特定步骤的特定部件、设备或系统,然而本公开考虑了进行图4的方法的任何合适步骤的任何合适的部件、设备或系统的任何合适的组合。
图5示出了用于使用深度学习模型确定用户的嵌入的示例方法。在具体实施方式中,用户可以表示为用户在社交网络系统160中已经交互的一组实体。换言之,嵌入可以是对于用户基于一组实体的矢量表示来确定的。该组实体可以是无序的组。在步骤510处,社交网络系统160可以访问社交网络系统160中的用户已经交互的第一组实体。用户可以使用任何合适的社交网络动作来与社交网络系统160中的第一组实体交互。作为实例而并非以限制的方式,交互可以是对于实体的亲密度表达。作为另一个实例而并非以限制的方式,用户可以通过“喜欢”实体、分享实体、发布包括对实体的引用的帖子、编排提及实体的消息并将之发送给另一个用户、执行任何其他合适的社交网络动作、或其任何组合来与实体交互。在具体实施方式中,在关于图2描述的社交图谱200中的第一节点可以对应于用户,并且在社交图谱200中的多个第二节点可以各自对应于一个实体。用户可以通过用户的社交网络动作来与第一组实体交互,并且社交网络动作可以是相对于第一节点和对应于第一组实体的相应实体的相应第二节点来采取的。例如,社交网络动作可以造成在社交图谱200中在对应于用户的第一节点与对应于实体的第二节点之间的边线的创建。第一组实体可以包括任何合适数量的实体。在图5所示出的实例中,第一组实体被示出为包括实体502、504、506和508:对应于“冰上曲棍球”、“布鲁克林”、“咖啡”、和“苹果派”的页面。作为实例而并非以限制的方式,第一组实体中的实体502、504、506和508可以是由社交网络系统160承载的用户在社交网络系统160中已经“喜欢”或以其他方式对其表达了亲密度的页面。
在步骤520处,社交网络系统160可以确定第一组实体的第一组矢量表示。在具体实施方式中,社交网络系统160可以使用(作为实例而并非以限制的方式)字典400将每个实体502、504、506和508映射为相应的矢量表示(例如,一对一映射),该字典是使用深度学习模型生成的。每个实体502、504、506和508可以使用以上关于图4描述的任何技术或任何其他合适的技术来映射为相应的矢量表示522、524、526和528。
在步骤530处,社交网络系统160可以从第一组实体中选择目标实体。在图5所示出的实例中,社交网络系统160将实体508选择为目标实体。在具体实施方式中,目标实体可以是随机选择的。在具体实施方式中,目标实体可以是由深度学习模型选择的。在具体实施方式中,目标实体可以是使用启发式方法来选择的,以用于找到实体中的难例。例如,实体可以是(例如,使用深度学习模型)聚集或散列在嵌入空间中的,而难例可以是在嵌入空间中的同一集群或散列中的实体。在图5所示出的实例中,目标实体被描绘为实体508,该实体对应于由社交网络系统160承载的对应“苹果派”的页面。
在步骤540处,社交网络系统160可以从第一组矢量表示中移除在步骤530处选择的目标实体的矢量表示。在图5所示出的实例中,已经从第一组矢量表示中移除了目标实体508的矢量表示528。所得到的第一组矢量表示被示出为包括矢量表示522、524和526,这些矢量表示相应地对应于实体502、504和506。
在步骤550处,社交网络系统160可以将其余的矢量表示522、524和526进行结合。任何合适的技术可以用于将矢量表示522、524和526结合为单个矢量表示560,作为实例而并非以限制的方式包括卷积、求平均值、任何其他合适的非线性结合技术、任何其他合适的技术、或其任何组合。在图5所示出的实例中,社交网络系统160结合这三个矢量522、524和526(例如,3抽头卷积)并然后执行最大池化操作以得到用户的一个矢量表示560。
用户嵌入可以是基于矢量表示的结合来确定的。在具体实施方式中,社交网络系统160可以基于矢量表示560来确定用户嵌入。如在本文中使用的,用户嵌入可以指的是基于用户的结合而得的矢量表示560的在嵌入空间中的用户的表示。对于嵌入空间中的点的坐标可以是基于用户的矢量表示560来确定的。在具体实施方式中,深度学习模型可以用于生成多个用户嵌入。这些用户嵌入中的每个用户嵌入可以基于对应于嵌入空间中的特定点的相应矢量表示。在具体实施方式中,深度学习模型可以用于生成多个实体嵌入。这些实体嵌入中的每个实体嵌入可以基于对应于嵌入空间中的特定点的相应矢量表示。在具体实施方式中,在嵌入空间中对应于用户的点可以接近嵌入空间中对应于第一组实体(即,社交网络系统160中用户已经交互的实体)中的实体的点。
虽然本公开将图5的具体实施方式描述并示出为是通过社交网络系统160实现的,然而本公开考虑了图5的任何合适的实施方式出现在任何合适的界面上并且是通过任何合适的平台或系统实现的。作为实例而并非以限制的方式,图5的具体实施方式可以是由客户端系统130或第三方系统170实现的。此外,虽然本公开描述并且示出了进行图5的方法的特定步骤的特定部件、设备或系统,然而本公开考虑了进行图5的方法的任何合适步骤的任何合适的部件、设备或系统的任何合适的组合。
图6示出了用于训练深度学习模型的示例方法。深度学习模型可以被训练成使用户的矢量表示与关于用户的实体的矢量表示之间的误差最小化或使之减小。在具体实施方式中,训练深度学习模型的目标可以是对相关实体生成实体嵌入,这些相关实体对应于嵌入空间中的多个点,这些点接近对应于用户嵌入的点。在用户与实体之间的相关性可以是基于任何合适的因素确定的,例如而并非以限制的方式包括用户与社交网络系统160中的实体的先前交互、用户的任何其他合适的社交网络信息、或两者(例如,有关用户的社交网络连接的信息)。在具体实施方式中,深度学习模型可以是使用在图5的步骤530处选择的目标实体508(例如,对应于“苹果派”的页面)作为监督信号来训练的。作为实例而并非以限制的方式,深度学习模型可以被训练成使得在嵌入空间中目标实体508的嵌入比用户尚未交互的实体的嵌入更加接近用户嵌入。
在步骤610处,社交网络系统160可以使用深度学习模型确定对于第二组实体的矢量表示。作为实例而并非以限制的方式,在第二组实体中的实体的矢量表示可以使用字典400来确定。在具体实施方式中,第二组实体可以是从多个实体中随机选择的。在具体实施方式中,第二组实体可以包括用户在社交网络系统160中尚未交互的一个或多个实体。出于训练深度学习模型的目的,第二组实体可以被认为是负实例(即,未知与用户相关的实体),而第一组实体可以是正实例(即,已知与用户相关的实体)。第二组实体可以包括任何合适数量的实体。在实例中而并非以限制的方式,第二组实体可以包括由社交网络系统160随机选择的五十个实体。在具体实施方式中,在第二组实体中的实体的数量可以基于深度学习模型的损失函数。作为实例而并非以限制的方式,在第二组实体中的实体的数量可以是基于可用计算预算的固定超参数。在具体实施方式中,损失函数可以用于训练深度学习模型。为了学习深度学习模型的优化权重(即,参数),社交网络系统160可以使损失函数最小化(即,使误差最小化)。在具体实施方式中,社交网络系统160可以成批次地更新第二组实体的矢量表示。作为实例而并非以限制的方式,实体的一组负实例(例如,未知与用户相关的实体)可以被选定为一个任意固定大小的批次。作为实例而并非以限制的方式,批次的大小(即,第二组实体中的实体的数量)可以是在深度学习模型的全部训练中提前固定的一个参数。作为另一个实例而并非以限制的方式,批次的大小还可以在深度学习模型的训练的过程中随时间改变。作为另一个实例而并非以限制的方式,批次的大小是深度学习模型的函数。社交网络系统160然后可以在此第二组实体(即,负实例的批次)上执行批次梯度更新。
在步骤620处,社交网络系统160可以通过将用户的矢量表示560与在步骤610处确定的第二组实体中的每个实体的矢量表示进行对比来确定相似性评分。因此,社交网络系统160可以针对第二组实体中的每个实体来确定与用户的相似性的测量。虽然图6被描绘为将用户的矢量表示560与第二组实体中的实体的单个矢量表示612进行对比,然而将理解的是这仅是出于说明性目的而并非是限制的方式。而是,用户的矢量表示560可以与第二组实体中的每个实体的矢量表示进行对比,因此可以针对第二组实体中的每个实体计算相似性评分。在具体实施方式中,在用户与第二组实体中的实体之间的相似性评分可以基于在用户的矢量表示560与实体的矢量表示之间的角度来确定。在具体实施方式中,在用户与第二组实体中的实体之间的相似性评分可以通过计算用户的矢量表示560与实体的矢量表示的点积来确定。在具体实施方式中,相似性评分可以基于欧几里得距离、余弦相似性、或用于计算嵌入空间中的点的两两相关性的测量的任何其他合适的技术来确定的。
在步骤630处,社交网络系统160可以通过将用户的矢量表示560与在图5的步骤520处确定的目标实体508的矢量表示528进行对比来确定相似性评分。因此,社交网络系统160可以为目标实体确定与用户的相似性的测量。在用户与目标实体508之间的相似性评分可以是使用与步骤620关联描述的任何技术或使用任何其他合适的技术来确定的。
在具体实施方式中,社交网络系统160可以基于各自在步骤620和630处确定的相似性评分将目标实体和第二组实体中的实体针对彼此进行排名。排名可以是通过给每个实体分配一个数值排名、在单列表格中给每个实体分配一个位置、或者使用用于使这些实体基于各自的相似性评分针对彼此进行排名的任何其他合适的技术来完成的。作为实例而并非以限制的方式,社交网络系统160可以给每个实体分配一个数值排名,并且较高的数值排名可以对应于较高的相似性评分。
在步骤640处,社交网络系统160可以基于在步骤620和630处确定的相似性评分来更新在第二组实体中的一个或多个实体的矢量表示。在具体实施方式中,矢量表示可以基于在步骤620处确定的相似性评分与在步骤630处确定的相似性评分的每一者的对比来更新。在具体实施方式中,社交网络系统160可以给目标实体和第二组实体中的每一个实体分配排名,并且深度学习模型的一个或多个权重可以基于排名来进一步更新。如以上所描述的,深度学习模型可以被训练成使得在嵌入空间中目标实体508的嵌入比用户尚未交互的实体的嵌入更加接近用户嵌入。因此,深度学习模型可以被训练成使得第二组实体中的每一个实体(即,负样本)具有比目标实体(即,正样本)更低的相似性评分。换言之,深度学习模型可以被训练成使得第二组实体中的每一个实体排名低于目标实体。社交网络系统160可以确定第二组实体中的一个或多个实体排名高于目标实体或具有比目标实体更高的相似性评分(即,具有的对应嵌入在嵌入空间中更接近用户嵌入),并且社交网络系统160可以更新第二组实体中的一个或多个实体的矢量表示。作为实例而并非以限制的方式,在第二组实体中的实体可以是由社交网络系统160承载的对应于“运行中”的页面。在同一实例中,社交网络系统160可以确定“运行中”的实体具有比目标实体(即,在用户的矢量表示560与目标实体508的矢量表示528之间计算的)更高的相似性评分(即,在用户的矢量表示560与“运行中”的实体的矢量表示之间计算的)。社交网络系统160可以更新“运行中”的实体的矢量表示,使得针对“运行中”的实体的经更新相似性评分(即,在用户的矢量表示560与“运行中”的实体的经更新矢量表示之间计算的)小于针对目标实体508的相似性评分。
在具体实施方式中,社交网络系统160可以通过更新深度学习模型的一个或多个权重来更新第二组矢量中的该一个或多个矢量的矢量表示。深度学习模型的该一个或多个权重的初始值可以是(例如使用高斯分布)随机确定的。在具体实施方式中,可以使用在步骤620处确定的在用户与第二组实体中的实体之间的相似性评分和在步骤630处确定的在用户与目标实体508之间的相似性评分来更新深度学习模型的一个或多个权重,从而使误差最小化。在具体实施方式中,深度学习模型的一个或多个权重可以被更新成使由等式1给出的误差最小化。深度学习模型的权重可以是被更新成对于第二组实体得到更好的矢量表示。在步骤610-640中描述的这种方法可以被重复,并且可以使用随机梯度下降函数来逐步地细化这些权重。通过更新权重来训练深度学习模型可以改善字典400的映射。
虽然本公开将图6的具体实施方式描述并示出为是通过社交网络系统160实现的,然而本公开考虑了图6的任何合适的实施方式出现在任何合适的界面上并且是通过任何合适的平台或系统实现的。作为实例而并非以限制的方式,图6的具体实施方式可以是由客户端系统130或第三方系统170实现的。此外,虽然本公开描述并且示出了进行图6的方法的特定步骤的特定部件、设备或系统,然而本公开考虑了进行图6的方法的任何合适步骤的任何合适的部件、设备或系统的任何合适的组合。
图7示出了嵌入空间700的示例视图。嵌入空间700包括对应于用户的嵌入710的点710以及对应于多个实体嵌入的多个点730。该多个实体嵌入可以是基于使用深度学习模型确定的实体的矢量表示来确定的(例如,在该深度学习模型已经如关于图5至图6所描述地被训练后),并且这些实体嵌入可以在嵌入空间700中表示为点730。用户实体嵌入可以是基于使用深度学习模型确定的用户的矢量表示560来确定的(如关于图5所描述的),并且用户嵌入可以在嵌入空间700中表示为点710。虽然嵌入空间700被示出为三维空间,将理解的是,这仅是出于说明性的目的而并非限制的方式,并且嵌入空间700可以具有任何合适的维度。作为实例而并非以限制的方式,嵌入空间700可以是d维的,并且这些嵌入(例如,用户嵌入和实体嵌入)所基于的矢量表示可以是d维的强度矢量,其中d表示任何合适数量的维度。虽然嵌入空间700被描绘为仅具有一个用户嵌入710,将理解的是,这仅是出于说明性的目的而并非限制的方式,并且嵌入空间700可以包括对应于社交网络系统160的多个其他用户的多个点。作为实例而并非以限制的方式,图5和图6的这些步骤可以对其他用户进行重复,以生成对应其他用户的嵌入。在同一实例中,深度学习模型可以被训练成使得这些实体嵌入额外地基于来自表示其他用户的实体组中的目标实体。
在具体实施方式中,嵌入空间700可以用于预测与用户相关的实体(例如,在第二组实体中的实体)。在具体实施方式中,社交网络系统160可以使用搜索算法识别对应于与用户相关的实体嵌入的一个或多个点。在具体实施方式中,如果存在用户将与实体交互的预测出的可能性,则该实体可以与用户相关。搜索算法可以应用于嵌入空间700以识别在对应于用户嵌入的点710的阈值距离内的对应于实体嵌入的点。这些实体嵌入中的每个实体嵌入可以与一个相应实体相关联,该相应实体可以被识别为与用户相关。在图7所示出的实例中,阈值距离被描绘为嵌入空间700中的区域720。作为实例而并非以限制的方式,点710可以是对应于用户嵌入的点,并且被识别为处于点710的区域720内的点可以包括对应于实体的嵌入的点,这些实体包括由社交网络系统160承载的对应于“韦恩·格雷茨基”和“波士顿奶油派”的页面。在具体实施方式中,社交网络系统160可以使用任何合适的技术来用于识别与用户相关的一个或多个实体。作为实例而并非以限制的方式,社交网络系统160可以使用本地敏感散列、分层聚类技术、球树技术、二叉搜索树技术、用于将点组织在k维空间中的空间划分数据结构(例如,k维树)、量化、任何其他合适的搜索算法或技术、或其任何组合。作为另一个实例而并非以限制的方式,社交网络系统160可以基于分配给实体的排名来识别与用户相关的预先确定数量的实体,该分配是基于所计算的相似性评分(如关于图6所描述的)。作为实例而并非以限制的方式,在深度学习模型已经完成训练之后,社交网络系统160可以基于实体的排名来选择与用户相关的前十个实体(不包括已知用户已经交互过的目标实体508)。
在具体实施方式中,社交网络系统160可以将被识别为与用户相关的该一个或多个实体发送至用户的客户端系统130以用于显示给用户。在具体实施方式中,该一个或多个经识别的实体可以在用户的客户端系统上运行的应用(例如,与社交网络系统160相关联的应用或网络浏览器)界面处显示给该用户。作为实例而并非以限制的方式,用户可以经由在用户的客户端系统130上运行的应用(例如,与社交网络系统160相关联的应用)界面输入搜索查询,并且社交网络系统160可以基于响应于搜索查询的实体的排名在应用中将搜索结果作为建议提供给用户(例如,所识别的实体可以在搜索结果中出现得更高)。作为另一个实例而并非以限制的方式,该一个或多个经识别的实体可以作为通知被递送给用户(例如,你喜欢“冰球”,那么你可能也喜欢“韦恩·格雷茨基”)。
在具体实施方式中,被识别为与用户相关的实体可以是由社交网络系统160预测的用户将交互的实体。在具体实施方式中,社交网络系统160可以使用嵌入空间700来预测用户将主动交互的实体。作为实例而并非以限制的方式,社交网络系统160可以应用搜索算法来识别(用户尚未交互的)在用户嵌入(例如,点710)的预先确定的距离720内的一个或多个实体嵌入。社交网络系统160然后可以识别与这些经识别的实体嵌入相关联的实体(例如,由社交网络系统160承载的页面),从而预测用户可能会主动交互的实体(例如,“喜欢”、点击、或以其他方式在社交网络系统160上交互)。
虽然本公开将图7的具体实施方式描述并示出为是通过社交网络系统160实现的,然而本公开考虑了图7的任何合适的实施方式出现在任何合适的界面上并且是通过任何合适的平台或系统实现的。作为实例而并非以限制的方式,图7的具体实施方式可以是由客户端系统130或第三方系统170实现的。此外,虽然本公开描述并且示出了进行图7的方法的特定步骤的特定部件、设备或系统,然而本公开考虑了进行图7的方法的任何合适步骤的任何合适的部件、设备或系统的任何合适的组合。
图8示出了用于使用深度学习模型更新实体的矢量表示的示例方法800。该方法可以开始于步骤810,其中社交网络系统160可以访问社交网络系统的用户在该社交网络系统中已经交互的第一组实体以及在该社交网络系统中的第二组实体。在步骤820处,社交网络系统160可以使用深度学习模型确定第一组实体的第一组矢量表示。在步骤830处,社交网络系统160可以从第一组实体中选择目标实体。在步骤840处,社交网络系统160可以从第一组矢量表示中移除目标实体的矢量表示。在步骤850处,社交网络系统160可以将第一组矢量表示中的其余矢量表示结合以确定用户的矢量表示。在步骤860处,社交网络系统160可以使用深度学习模型确定第二组实体的第二组矢量表示。在步骤870处,社交网络系统160可以通过将用户的矢量表示与目标实体的矢量表示进行对比来计算在目标实体与用户之间的相似性评分。在步骤880处,社交网络系统160可以通过将用户的矢量表示与第二组实体中的实体的矢量表示进行对比来计算用户与第二组实体中的实体之间的相似性评分。在步骤820处,社交网络系统160可以使用深度学习模型基于相似性评分来更新在第二组实体中的一个或多个实体的矢量表示。
在适当情况下,具体实施方式可以重复图8的方法的一个或多个步骤。虽然本公开描述并且示出了图8的方法以特定顺序发生的特定步骤,然而本公开考虑了图8的方法以任何合适顺序发生的任何合适的步骤。此外,虽然本公开描述并且示出了包括图8的方法的特定步骤的用于使用深度学习模型更新实体的矢量表示的示例方法,然而本公开考虑了包括任何合适的步骤的用于使用深度学习模型更新实体的矢量表示的任何合适的方法,在适当的情况下,其可以包括图8的方法的步骤的全部、一些、或全无。此外,虽然本公开描述并且示出了进行图8的方法的特定步骤的特定部件、设备或系统,然而本公开考虑了进行图8的方法的任何合适步骤的任何合适的部件、设备或系统的任何合适的组合。
社交图谱亲密度和系数
在具体实施方式中,社交网络系统160可以确定各种社交图谱实体对于彼此的社交图谱亲密度(其在本文中可以称为“亲密度”)。亲密度可以表示在与在线社交网络相关联的特定对象(诸如,用户、概念、内容、动作、广告、与在线社交网络相关联的其他对象、或其任何合适的组合)之间的关系强度或者兴趣水平。还可以确定与第三方系统170或其他合适的系统相关联的对象的亲密度。可以建立社交图谱实体对各个用户、主题、或内容类型的整体亲密度。整体亲密度可以基于与社交图谱实体相关联的动作或关系的持续监测而改变。虽然本公开描述了以特定方式确定特定亲密度,然而本公开考虑了以任何合适的方式确定任何合适的亲密度。
在具体实施方式中,社交网络系统160可以使用亲密度系数(其在本文中可以称为“系数”)测量或量化社交图谱亲密度。系数可以表示或量化与在线社交网络相关联的特定对象之间的关系强度。系数还可以表示基于用户感兴趣的动作测量用户将执行特定动作的预测概率的概率或函数。以此方式,基于用户的之前动作可以预测用户的未来动作,其中,可以至少部分地基于用户的动作历史来计算系数。系数可以用于预测任何数量的动作,其可以在在线社交网络内、或在在线社交网络外部。作为实例而并非以限制的方式,这些动作可以包括:各种类型的通信,诸如,发送消息、发布内容、或评论内容;各种类型的观察动作,诸如,访问或查看资料页面、媒体、或其他合适的内容;各种类型的关于两个或更多个社交图谱实体的一致信息,诸如,在同一群体中、在同一张照片中加标签、在同一位置处签到、或者参与同一事件;或者其他合适的动作。虽然本公开描述了以特定方式测量亲密度,然而本公开考虑了以任何合适的方式测量亲密度。
在具体实施方式中,社交网络系统160可以使用各种因素来计算系数。例如,这些因素可以包括用户动作、对象之间的关系的类型、位置信息、其他合适的因素、或其任何组合。在具体实施方式中,在计算系数时,可以对不同的因素不同地加权。每个因素的权重可以是静态的,或者权重可以根据例如用户、关系类型、动作类型、用户位置等改变。对于因素的评级可以根据它们的权重进行结合以确定对于用户的整体系数。作为实例而并非以限制的方式,特定用户动作可以分配有评级和权重这两者,而与该特定用户动作相关联的关系被分配有评级和相关的权重(例如,因此总权重为100%)。为了计算用户对特定对象的系数,被分配给用户的动作的评级可以包括例如整体系数的60%,而用户与对象之间的关系可以包括整体系数的40%。在具体实施方式中,社交网络系统160可以在确定用于计算系数的各种因素的权重时考虑各种变量,诸如,自访问之后的时间信息、衰减因素、访问频率、与信息之间的关系或与信息访问有关对象之间的关系、与连接至对象的社交图谱实体之间的关系、用户动作的短期平均值或长期平均值、用户反馈、其他合适的变量、或其任何组合。作为实例而并非以限制的方式,系数可以包括致使由特定动作提供的信号的强度随时间衰减的衰减因素,使得在计算系数时越近期的动作越相关。基于以系数为基础连续跟踪动作可以连续地更新评级和权重。可以采用任何类型的处理或算法用于对每一个因素的评级以及分配到该因素的权重进行分配、组合、平均等。在具体实施方式中,社交网络系统160可以使用基于历史动作和过去的用户响应训练的机器学习算法、或者通过将用户暴露于各种选项并且测量响应而从用户获取的数据确定系数。虽然本公开描述了以特定方式计算系数,然而本公开考虑了以任何合适的方式计算系数。
在具体实施方式中,社交网络系统160可以基于用户的动作计算系数。社交网络系统160可以监测在线社交网络、第三方系统170、其他合适系统、或者其任何组合上的动作。可以跟踪或监测任何合适类型的用户动作。典型的用户动作可以包括查看资料页面、创建内容或发布内容、与内容交互、加签于图像或在图像中加标签、加入群体、列出并确认参与事件、在位置处签到、喜欢特定页面、创建页面、以及执行便于社交动作的其他任务。在具体实施方式中,社交网络系统160可基于用户对具体类型内容的动作计算系数。该内容可以与在线社交网络、第三方系统170或另一个合适的系统相关联。内容可包括用户、资料页面、帖子、新闻报道、大字标题、即时消息、聊天室对话、电子邮件、广告、图片、视频、音乐、其他合适的对象、或者其任意组合。社交网络系统160可对用户动作进行分析,以确定该一个或者多个动作是否表示对主题、内容、其他用户等的亲密度。作为实例而并非以限制的方式,如果用户可频繁地发布与“咖啡”或者其变形有关的内容,则社交网络系统160可确定用户对概念“咖啡”具有较高的系数。具体动作或者具体的动作类型可比其他动作分配更高的权重和/或等级,从而可影响整体计算系数。作为实例而并非以限制的方式,如果第一用户向第二用户发送电子邮件,则该动作的权重或者等级比如果第一用户仅查看第二用户的用户资料页面更高。
在具体实施方式中,社交网络系统160可以基于特定对象之间的关系的类型来计算系数。参考社交网络图谱200,当计算系数时,社交网络系统160可分析连接具体用户节点202与概念节点204之间的边线206的数目和/或类型。作为实例而并非以限制的方式,通过配偶类型(表示两个用户结婚)边线连接的用户节点202可比通过朋友类型边线连接的用户节点202分配更高的系数。换言之,根据分配给具体用户的动作和关系的权重,可以确定关于用户配偶的内容比关于用户朋友的内容具有更高的整体亲密度。在具体实施方式中,当计算对该对象的系数时,用户与另一对象的关系可影响用户的动作的权重和/或等级。作为实例而并非以限制的方式,如果用户将第一张照片加标签,但仅是喜欢第二张照片,则社交网络系统160可以确定相比于第二张照片用户关于第一张照片具有更高的系数,因为与内容具有喜欢类型的关系相比,与内容具有加标签类型的关系可以分配有更高的权重和/评级。在具体实施方式中,社交网络系统160可以基于一个或多个第二用户与特定对象的关系来计算对第一用户的系数。换言之,其他用户与对象的连接和系数可以影响第一用户对该对象的系数。作为实例而并非以限制的方式,如果第一用户连接至一个或多个第二用户或者第一用户对一个或多个第二用户具有较高系数,并且这些第二用户连接至特定对象或者这些第二用户对特定对象具有高系数,则社交网络系统160可以确定第一用户还应对该特定对象具有相对较高的系数。在具体实施方式中,系数可以基于特定对象之间的分离度。较低系数可以表示第一用户将分享在与社交图谱200中的第一用户间接连接的用户的内容对象方面感兴趣的减少可能性。作为实例而并非以限制的方式,在社交图谱200中更靠近(即,更少分离度)的社交图谱实体与社交图谱200中距离较远的实体相比可具有更高的系数。
在具体实施方式中,社交网络系统160可以基于位置信息计算系数。在地理上更靠近彼此的对象可被视为比彼此更远距离的对象更为相关或者更为感兴趣。在具体实施方式中,用户对特定对象的系数可以基于对象的位置距离与用户相关联的当前位置(或者用户的客户端系统130的位置)的接近度。第一用户可能对更靠近第一用户的其他用户或概念更为感兴趣。作为实例而并非以限制的方式,如果用户距离机场一英里并且距离加油站两英里,则社交网络系统160可以基于机场距离用户的接近度确定用户对机场比加油站具有更高的系数。
在具体实施方式中,社交网络系统160可以基于系数信息相对于用户执行特定动作。基于用户对动作的兴趣,可以使用系数来预测用户是否将执行特定动作。当生成任何类型的对象并且将任何类型的对象呈现给用户时,诸如,广告、搜索结果、新闻报道、媒体、消息、通知、或者其他合适的对象等可以使用系数。在适当情况下,还可以使用系数将对象排名和排序。以此方式,社交网络系统160可以提供与用户的兴趣和当前情况相关的信息,从而增加了用户找出此类感兴趣的信息的可能性。在具体实施方式中,社交网络系统160可以基于系数信息生成内容。可以基于用户专用的系数提供或者选择内容对象。作为实例而并非以限制的方式,系数可以用于为用户生成媒体,其中可以向用户呈现用户关于媒体对象具有高整体系数的媒体。作为另一个实例而非以限制的方式,该系数可以用于为用户生成广告,其中,可以向用户呈现用户关于广告对象具有高整体系数的广告。在具体实施方式中,社交网络系统160可以基于系数信息生成搜索结果。可以基于与查询用户有关的搜索结果相关联的系数将对特定用户的搜索结果评分或排名。作为实例而并非以限制的方式,在搜索结果页面上,对应于具有更高系数的对象的搜索结果比对应于具有更低系数的对象的结果排名更高。
在具体实施方式中,社交网络系统160可以响应于对来自特定系统或特定过程的系数的请求来计算系数。在给定情形中,为了预测用户可能采取(或遵循)的动作,任何过程可以请求对用户的计算系数。该请求还可以包括用于计算系数的各个因素使用的一组权重。该请求可以来自在在线社交网络、第三方系统170(例如,经由API或其他通信渠道)、或者另一合适系统上运行的过程。响应于该请求,社交网络系统160可以计算该系数(如果该系数之前已经被计算和存储,则访问该系数的信息)。在具体实施方式中,社交网络系统160可以测量关于特定过程的亲密度。(在线社交网络的内部和外部的)不同过程可以请求特定对象或者一组对象的系数。社交网络系统160可以提供与请求亲密度测量的特定过程相关的亲密度测量。以此方式,每个过程均接收对于不同上下文定制的亲密度测量,其中该过程将使用该亲密度测量。
关于社交图谱亲密度和亲密度系数,具体实施方式可以利用于2006年8月11日提交的美国专利申请号11/503093、于2010年12月22日提交的美国专利申请号12/977027、于2010年12月23日提交的美国专利申请号12/978265、和于2012年10月01日提交的美国专利申请号13/632869中公开的一种或多种系统、部件、元件、功能、方法、操作、或步骤,这些申请各自通过引用结合于此。
系统和方法
图9示出了示例计算机系统900。在具体实施方式中,一个或多个计算机系统900执行本文中描述或示出的一个或多个方法中的一个或多个步骤。在具体实施方式中,一个或多个计算机系统900提供本文中描述或示出的功能。在具体实施方式中,在一个或多个计算机系统900上运行的软件执行本文中描述或示出的一个或多个方法中的一个或多个步骤或者提供本文中描述或示出的功能。具体实施方式包括一个或多个计算机系统900的一个或多个部分。本文中,在适当情况下,对计算机系统的引用可以包含计算设备,并且反之亦然。而且,在适当情况下,对计算机系统的引用可以包含一个或多个计算设备,并且反之亦然。
本公开考虑了任何合适数量的计算机系统900。本公开考虑了采取任何合适物理形式的计算机系统900。作为实例而并非以限制的方式,计算机系统900可以是嵌入式计算机系统、片上系统(SOC)、单板计算机系统(SBC)(诸如,模块计算机(COM)或模块系统(SOM))、桌面计算机系统、膝上型或笔记本计算机系统、交互式自助服务机、大型机、计算机系统网络、移动电话、个人数字助理(PDA)、服务器、平板计算机系统、或者这些中两种或更多种的组合。在适当情况下,计算机系统900可以包括单一式或者分布式的跨多个位置、跨多台机器、跨多个数据中心、或者驻留在云中的一个或者多个计算机系统900,该云可以包括一个或多个网络中的一个或多个云部件。在适当情况下,一个或多个计算机系统900可以在无大致空间或时间限制的情况下执行本文中描述或示出的一个或多个方法的一个或多个步骤。作为实例而并非以限制的方式,一个或多个计算机系统900可以实时地或以批处理的模式执行本文中描述或示出的一个或多个方法的一个或多个步骤。在适当情况下,一个或多个计算机系统900可以在不同时间或在不同位置处执行本文中描述或示出的一个或多个方法的一个或多个步骤。
在具体实施方式中,计算机系统900包括处理器902、存储器904、存储装置906、输入/输出(I/O)接口908、通信接口910以及总线912。虽然本公开描述并且示出了具有按照特定布置的特定数量的特定部件的特定计算机系统,然而本公开考虑了具有按照任何合适布置的任何合适数量的任何合适部件的任何合适的计算机系统。
在具体实施方式中,处理器902包括用于执行指令的硬件(诸如那些组成计算机程序的硬件)。作为实例而并非以限制的方式,为了执行指令,处理器902可以从内部寄存器、内部缓存、存储器904或者存储装置906检索(或者获取)指令;对其进行解码并且执行指令;然后将一个或多个结果写入内部寄存器、内部缓存、存储器904或者存储装置906。在具体实施方式中,处理器902可以包括用于数据、指令或地址的一个或多个内部缓存。在适当情况下,本公开考虑了包括任何合适数量的任何合适的内部缓存的处理器902。作为实例而并非以限制的方式,处理器902可以包括一个或多个指令缓存、一个或多个数据缓存、以及一个或多个转译后备缓冲器(TLB)。在指令缓存中的指令可以是在存储器904或存储装置906中的指令的副本,并且指令缓存可以加速处理器902对那些指令的检索。在数据缓存中的数据可以是在用于在处理器902中执行指令操作的存储器904或存储装置906中数据的副本;用于由在处理器902中执行的后续指令访问或用于写入存储器904或存储装置906的在处理器902中执行的后续指令的结果;或者其他合适的数据。数据缓存可以加速处理器902的读取或写入操作。TLB可以加速处理器902的虚拟地址转译。在具体实施方式中,处理器902可以包括用于数据、指令或地址的一个或多个内部寄存器。在适当情况下,本公开考虑了包括任何合适数量的任何合适内部寄存器的处理器902。在适当情况下,处理器902可以包括一个或多个算术逻辑单元(ALU);可以是多核处理器;或者包括一个或多个处理器902。虽然本公开描述并且示出了特定的处理器,然而本公开考虑了任何合适的处理器。
在具体实施方式中,存储器904包括用于存储处理器902执行的指令或者处理器902运行的数据的主存储器。作为实例而并非以限制的方式,计算机系统900可以将指令从存储装置906或者另一来源(诸如,另一个计算机系统900)加载至存储器904。然后处理器902可以将指令从存储器904加载至内部寄存器或内部缓存。为了执行指令,处理器902可以从内部寄存器或内部缓存检索指令并且对其解码。在执行指令的过程中或在执行指令之后,处理器902可以将一个或多个结果(其可以是中间结果或最终结果)写入内部寄存器或内部缓存。然后,处理器902可以将这些结果中的一个或多个写入存储器904。在具体实施方式中,处理器902仅执行一个或多个内部寄存器或内部缓存或存储器904(相对于存储装置906或者其他地点)中的指令,并且仅运行一个或多个内部寄存器或内部缓存或存储器904(相对于存储装置906或者其他地点)中的数据。一个或多个存储器总线(其可以各自包括地址总线和数据总线)可以将处理器902耦接至存储器904。如以下所描述的,总线912可以包括一个或多个存储器总线。在具体实施方式中,一个或多个存储器管理单元(MMU)驻留在处理器902与存储器904之间,并且便于由处理器902请求的对存储器904的访问。在具体实施方式中,存储器904包括随机存取存储装置(RAM)。在适当情况下,该RAM可以是易失性存储装置。在适当情况下,该RAM可以是动态RAM(DRAM)或静态RAM(SRAM)。而且,在适当情况下,该RAM可以是单端口RAM或多端口RAM。本公开考虑了任何合适的RAM。在适当情况下,存储器904可以包括一个或多个存储器904。虽然本公开描述并且示出了特定的存储器,然而本公开考虑了任何合适的存储器。
在具体实施方式中,存储装置906包括用于数据或指令的大容量存储装置。作为实例而并非以限制的方式,存储装置906可以包括硬盘驱动器(HDD)、软盘驱动器、闪存、光盘、磁光盘、磁带、或通用串行总线(USB)驱动器、或者这些中两种或更多种的组合。在适当情况下,存储装置906可以包括可移除或不可移除的(或固定的)介质。在适当情况下,存储装置906对于计算机系统900可以是内部的或外部的。在具体实施方式中,存储装置906是非易失性的、固态的存储装置。在具体实施方式中,存储装置906包括只读存储装置(ROM)。在适当情况下,该ROM可以是掩模编程的ROM、可编程ROM(PROM)、可擦除PROM(EPROM)、电可擦除PROM(EEPROM)、电可改变ROM(EAROM)或闪存、或者这些中两种或更多种的组合。本公开考虑了采用任何合适物理形式的大容量存储装置906。在适当情况下,存储装置906可以包括便于处理器902与存储装置906之间通信的一个或多个存储控制单元。在适当情况下,存储装置906可以包括一个或多个存储装置906。虽然本公开描述并且示出了特定的存储装置,然而本公开考虑了任何合适的存储装置。
在具体实施方式中,I/O接口908包括为在计算机系统900与一个或多个I/O设备之间的通信提供一个或多个接口的硬件、软件或两者。在适当情况下,计算机系统900可以包括这些I/O设备中的一个或多个。这些I/O设备中的一个或多个可以使人与计算机系统900之间能够通信。作为实例而并非以限制的方式,I/O设备可以包括键盘、按键、麦克风、监控器、鼠标、打印机、扫描仪、扬声器、静物相机、触控笔、平板、触摸屏、追踪球、摄相机、其他合适的I/O设备、或者这些中两种或更多种的组合。I/O设备可以包括一个或多个传感器。本公开对于I/O设备和I/O接口考虑了任何合适的I/O设备以及任何合适的I/O接口908。在适当情况下,I/O接口908可以包括使处理器902能够驱动一个或多个这些I/O设备的一个或多个设备或软件驱动器。在适当情况下,I/O接口908可以包括一个或多个I/O接口908。虽然本公开描述并且示出了特定I/O接口,然而本公开考虑了任何合适的I/O接口。
在具体实施方式中,通信接口910包括提供一个或多个接口用于在计算机系统900与一个或多个其他计算机系统900或一个或多个网络之间通信(诸如,基于数据包的通信)的硬件、软件或两者。作为实例而并非以限制的方式,通信接口910可以包括用于与以太网或其他基于有线的网络通信的网络接口控制器(NIC)或网络适配器,或用于与无线网络(诸如WI-FI网络)通信的无线NIC(WNIC)或无线适配器。本公开考虑了任何合适的网络以及用于该网络的任何合适的通信接口910。作为实例而并非以限制的方式,计算机系统900可以与自组网、个人区域网(PAN)、局域网(LAN)、广域网(WAN)、城域网(MAN)、或互联网的一个或多个部分、或者这些中两种或更多种的组合通信。这些网络中的一个或多个网络的一个或多个部分可以是有线或者无线的。作为实例,计算机系统900可以与无线PAN(WPAN)(诸如,BLUETOOTH WPAN)、WI-FI网络、WI-MAX网络、蜂窝电话网络(诸如,全球移动通信系统(GSM)网络)或其他合适的无线网络、或者这些中两种或更多种的组合通信。在适当情况下,计算机系统900可以包括用于任何这些网络的任何合适的通信接口910。在适当情况下,通信接口910可以包括一个或多个通信接口910。虽然本公开描述并且示出了特定的通信接口,然而本公开考虑了任何合适的通信接口。
在具体实施方式中,总线912包括将计算机系统900的部件彼此耦接的硬件、软件或两者。作为实例而并非以限制的方式,总线912可以包括加速图形端口(AGP)或其他图像总线、增强型工业标准架构(EISA)总线、前端总线(FSB)、超传输(HT)互连、工业标准架构(ISA)总线、无限带宽互连、低引脚数(LPC)总线、存储总线、微通道架构(MCA)总线、外围部件互连(PCI)总线、PCI-Express(PCIe)总线、串行高级技术附件(SATA)总线、视频电子标准关联局部(VLB)总线、或另外的合适总线、或者这些中两种或更多种的组合在适当情况下,总线912可以包括一个或多个总线912。虽然本公开描述并且示出了特定的总线,然而本公开考虑了任何合适的总线或互连。
本文中,在适当情况下,计算机可读非易失性存储介质或媒介可以包括一个或多个基于半导体或其他的集成电路(IC)(诸如,现场可编程门阵列(FPGA)或专用IC(ASIC))、硬盘驱动器(HDD)、混合硬盘驱动器(HHD)、光盘、光盘驱动器(ODD)、磁光盘、磁光驱动器、软盘、软盘驱动器(FDD)、磁带、固态驱动器(SSD)、RAM驱动器、安全数字卡或驱动器、任何其他合适的计算机可读非暂时存储介质、或者这些中两种或更多种的组合在适当情况下,计算机可读非暂时存储介质可以是易失性、非易失性、或者易失性与非易性的组合。
杂项
本文中,除非另外明确指出或通过上下文另外指出,否则“或”是包含的并且非排除的。因此,本文中,除非另外明确指出或通过上下文另外指出,“A或B”指“A、B、或者A和B”。而且,除非另外明确指出或通过上下文另外指出,“和”既是共同也是各自。因此,本文中,除非另外明确指出或通过上下文另外指出,否则“A和B”指“A和B共同或各自”。
本公开的范围包括本领域内普通技术人员能理解的对于本文中描述或示出的示例实施方式的所有变化、替换、改变、变更和修改。本公开的范围并不局限于本文中描述或者示出的示例实施方式。而且,虽然本公开将本文中各个实施方式描述并且示出为包括特定的部件、元件、特征、功能、操作或步骤,但是任何这些实施方式可以包括本领域普通技术人员能理解的本文中任何地方描述或示出的任何部件、元件、特征、功能、操作或步骤的任何组合或置换。此外,所附权利要求中对被适配成、安排成、能够、配置成、使得能够、可操作成、或操作成执行特定功能的装置或系统或者装置或系统的部件的引用涵盖该装置、系统、部件,无论它或该特定功能是否被激活、开启、或解锁,只要该装置、系统、或部件被如此适配、安排、能够、配置、使得能够、可操作、或操作。
Claims (35)
1.一种方法,包括:
通过一个或多个计算设备访问:
社交网络系统的用户已经交互的在所述社交网络系统中的第一组实体,以及
在所述社交网络系统中的第二组实体;
通过一个或多个计算设备使用深度学习模型来确定所述第一组实体的第一组矢量表示;
通过一个或多个计算设备从所述第一组实体中选择目标实体;
通过一个或多个计算设备从所述第一组矢量表示中移除所述目标实体的矢量表示;
通过一个或多个计算设备将所述第一组矢量表示中的其余矢量表示结合以确定所述用户的矢量表示;
通过一个或多个计算设备使用所述深度学习模型来确定所述第二组实体的第二组矢量表示;
通过一个或多个计算设备:
通过将所述用户的矢量表示与所述目标实体的矢量表示进行对比,计算所述目标实体与所述用户之间的相似性评分,以及
通过将所述用户的矢量表示与所述第二组实体中的实体的矢量表示进行对比,计算所述用户与所述第二组实体中的实体之间的相似性评分;并且
通过一个或多个计算设备使用所述深度学习模型基于相似性评分来更新所述第二组实体中的一个或多个实体的矢量表示。
2.根据权利要求1所述的方法,进一步包括:
通过一个或多个计算设备确定所述用户、所述第一组实体中的每个实体以及所述第二组实体中的每个实体的嵌入,其中:
每个嵌入对应于多维嵌入空间中的一个点,
所述嵌入空间包括对应于多个实体的多个点;并且
每个嵌入是基于使用所述深度学习模型确定的相应矢量表示的。
3.根据权利要求1所述的方法,进一步包括通过一个或多个计算设备基于相似性评分将相应排名分配给所述目标实体和所述第二组实体中的每个实体,并且其中,进一步基于所述排名更新所述第二组实体中的所述一个或多个实体的矢量表示。
4.根据权利要求3所述的方法,其中,所述第二组实体中的矢量表示被更新的所述一个或多个实体中的每一个实体具有比所述目标实体的相似性评分更大的相似性评分。
5.根据权利要求1所述的方法,进一步包括通过对嵌入空间应用搜索算法来将多个实体中的一个或多个实体识别为与所述用户相关,其中,与所识别的实体的一个或多个嵌入对应的点在所述嵌入空间中的与所述用户的嵌入对应的点的阈值距离内。
6.根据权利要求5所述的方法,进一步包括将一个或多个所识别的实体发送给所述用户的客户端系统以用于显示给所述用户。
7.根据权利要求1所述的方法,其中目标实体是随机选择的。
8.根据权利要求1所述的方法,其中,所述用户未与所述社交网络系统中的所述第二组实体交互。
9.根据权利要求1所述的方法,其中,所述社交网络系统包括社交图谱,所述社交图谱包括多个节点和连接所述节点的多个边线,在所述节点中的两个节点之间的每一条边线表示所述两个节点之间的单个分离度,所述节点包括:
对应于所述用户的第一节点;以及
各自对应于相应实体的多个第二节点。
10.根据权利要求9所述的方法,其中,所述用户已经通过所述用户的社交网络动作与所述第一组实体交互,其中,所述社交网络动作是关于所述第一节点和与所述第一组实体的相应实体对应的相应第二节点来采取的。
11.根据权利要求10所述的方法,其中,所述社交网络动作表示对于实体的亲密度表达。
12.根据权利要求1所述的方法,其中,所述实体中的至少一个实体包括由所述社交网络系统承载的页面。
13.根据权利要求1所述的方法,其中,所述矢量表示包括d维强度矢量。
14.一种或多种计算机可读非暂时性存储介质,承载有软件,所述软件在被执行时能操作为:
访问:
社交网络系统的用户已经交互的在所述社交网络系统中的第一组实体,以及
在所述社交网络系统中的第二组实体;
使用深度学习模型确定所述第一组实体的第一组矢量表示;
从所述第一组实体中选择目标实体;
从所述第一组矢量表示中移除所述目标实体的矢量表示;
将所述第一组矢量表示中的其余矢量表示结合以确定所述用户的矢量表示;
使用所述深度学习模型确定所述第二组实体的第二组矢量表示;
通过将所述用户的矢量表示与所述目标实体的矢量表示进行对比,计算所述目标实体与所述用户之间的相似性评分,以及
通过将所述用户的矢量表示与所述第二组实体中的实体的矢量表示进行对比,计算所述用户与所述第二组实体中的实体之间的相似性评分;并且
使用所述深度学习模型基于相似性评分更新所述第二组实体中的一个或多个实体的矢量表示。
15.根据权利要求14所述的介质,其中,所述软件在被执行时进一步能操作为:
确定所述用户、所述第一组实体中的每个实体以及所述第二组实体中的每个实体的嵌入,其中:
每个嵌入对应于多维嵌入空间中的一个点,
所述嵌入空间包括对应于多个实体的多个点;并且
每个嵌入是基于使用所述深度学习模型确定的相应矢量表示的。
16.根据权利要求14所述的介质,其中,所述软件在被执行时进一步能操作为:基于相似性评分将相应排名分配给所述目标实体和所述第二组实体中的每个实体,并且其中,进一步基于所述排名更新所述第二组实体中的所述一个或多个实体的矢量表示。
17.一种系统,包括:一个或多个处理器;以及耦接至所述处理器的存储器,所述存储器包括能由所述处理器执行的指令,所述处理器在执行所述指令时能操作为:
访问:
社交网络系统的用户已经交互的在所述社交网络系统中的第一组实体,以及
在所述社交网络系统中的第二组实体;
使用深度学习模型确定所述第一组实体的第一组矢量表示;
从所述第一组实体中选择目标实体;
从所述第一组矢量表示中移除所述目标实体的矢量表示;
将所述第一组矢量表示中的其余矢量表示结合以确定所述用户的矢量表示;
使用所述深度学习模型确定所述第二组实体的第二组矢量表示;
通过将所述用户的矢量表示与所述目标实体的矢量表示进行对比,计算所述目标实体与所述用户之间的相似性评分,以及
通过将所述用户的矢量表示与所述第二组实体中的实体的矢量表示进行对比,计算所述用户与所述第二组实体中的实体之间的相似性评分;并且
使用所述深度学习模型基于相似性评分更新所述第二组实体中的一个或多个实体的矢量表示。
18.根据权利要求17所述的系统,其中,所述处理器在执行所述指令时进一步能操作为:
确定所述用户、所述第一组实体中的每个实体以及所述第二组实体中的每个实体的嵌入,其中:
每个嵌入对应于多维嵌入空间中的一个点,
所述嵌入空间包括对应于多个实体的多个点;并且
每个嵌入是基于使用所述深度学习模型确定的相应矢量表示的。
19.根据权利要求17所述的系统,其中,所述处理器在执行所述指令时进一步能操作为:基于相似性评分将相应排名分配给所述目标实体和所述第二组实体中的每个实体,并且其中,进一步基于所述排名更新所述第二组实体中的所述一个或多个实体的矢量表示。
20.一种计算机实现的方法,包括:
通过一个或多个计算设备访问:
社交网络系统的用户已经交互的在所述社交网络系统中的第一组实体,例如,存储在一个或多个数据存储装置中的第一组数据对象,以及
在所述社交网络系统中的第二组实体,例如,存储在一个或多个数据存储装置中的第二组数据对象;
通过一个或多个计算设备使用深度学习模型来确定所述第一组实体的第一组矢量表示;
通过一个或多个计算设备从所述第一组实体中选择目标实体;
通过一个或多个计算设备从所述第一组矢量表示中移除所述目标实体的矢量表示;
通过一个或多个计算设备将所述第一组矢量表示中的其余矢量表示结合以确定所述用户的矢量表示;
通过一个或多个计算设备使用所述深度学习模型来确定所述第二组实体的第二组矢量表示;
通过一个或多个计算设备:
通过将所述用户的矢量表示与所述目标实体的矢量表示进行对比,计算所述目标实体与所述用户之间的相似性评分,以及
通过将所述用户的矢量表示与所述第二组实体中的实体的矢量表示进行对比,计算所述用户与所述第二组实体中的实体之间的相似性评分;并且
通过一个或多个计算设备使用所述深度学习模型基于相似性评分来更新所述第二组实体中的一个或多个实体的矢量表示。
21.根据权利要求20所述的方法,进一步包括:
通过一个或多个计算设备确定所述用户、所述第一组实体中的每个实体以及所述第二组实体中的每个实体的嵌入,其中:
每个嵌入对应于在维嵌入空间中的一个点,
所述嵌入空间包括对应于多个实体的多个点;并且
每个嵌入是基于使用所述深度学习模型确定的相应矢量表示的。
22.根据权利要求20或21所述的方法,进一步包括:
通过一个或多个计算设备基于相似性评分将相应排名分配给所述目标实体和所述第二组实体中的每个实体,并且其中,进一步基于所述排名更新所述第二组实体中的所述一个或多个实体的矢量表示;
所述第二组实体中的矢量表示被更新的所述一个或多个实体中的每一个实体可选地具有比所述目标实体的相似性评分更大的相似性评分。
23.根据权利要求20至22中任一项所述的方法,进一步包括:
通过对所述嵌入空间应用搜索算法来将多个实体中的一个或多个实体识别为与所述用户相关,其中,与所识别的实体的一个或多个嵌入对应的点在所述嵌入空间中的与所述用户的嵌入对应的点的阈值距离内;
可选地包括:将一个或多个所识别的实体发送给所述用户的客户端系统以用于显示给所述用户,和/或
可选地包括:将一个或多个所识别的实体缓存或预缓存在与用户关联的客户端设备上和/或缓存在服务器上,其中,缓存或预缓存优选地是对一个或多个用户或者对选定的一组用户中的每个用户执行的;和/或
可选地包括:将从所识别的实体中选择的实体聚集,并且可选地基于实体的集群在所述嵌入空间中的位置来将实体的集群存储在数据存储装置上。
24.根据权利要求20至23中任一项所述的方法,其中,所述目标实体是随机选择的。
25.根据权利要求20至24中任一项所述的方法,其中,所述用户未与所述社交网络系统中的所述第二组实体交互。
26.根据权利要求20至25中任一项所述的方法,其中,所述社交网络系统包括社交图谱,所述社交图谱包括多个节点和连接所述节点的多个边线,在所述节点中的两个节点之间的每一条边线表示所述两个节点之间的单个分离度,所述节点包括:
对应于所述用户的第一节点;以及
各自对应于相应实体的多个第二节点。
27.根据权利要求26所述的方法,其中,所述用户已经通过所述用户的社交网络动作与所述第一组实体交互,其中,所述社交网络动作是关于所述第一节点和与所述第一组实体的相应实体对应的相应第二节点来采取的;
优选地,其中,所述社交网络动作表示对于实体的亲密度表达。
28.根据权利要求20至27中任一项所述的方法,其中,所述实体中的至少一个实体包括由所述社交网络系统承载的页面。
29.根据权利要求20至28中任一项所述的方法,其中,所述矢量表示包括d维强度矢量。
30.一种或多种计算机可读非暂时性存储介质,承载有软件,所述软件在被执行以实施根据权利要求20至29中至少一项所述的方法时尤其能操作为:
访问:
社交网络系统的用户已经交互的在所述社交网络系统中的第一组实体,以及
在所述社交网络系统中的第二组实体;
使用深度学习模型确定所述第一组实体的第一组矢量表示;
从所述第一组实体中选择目标实体;
从所述第一组矢量表示中移除所述目标实体的矢量表示;
将所述第一组矢量表示中的其余矢量表示结合以确定所述用户的矢量表示;
使用所述深度学习模型确定所述第二组实体的第二组矢量表示;
通过将所述用户的矢量表示与所述目标实体的矢量表示进行对比,计算所述目标实体与所述用户之间的相似性评分,以及
通过将所述用户的矢量表示与所述第二组实体中的实体的矢量表示进行对比,计算所述用户与所述第二组实体中的实体之间的相似性评分;并且
使用所述深度学习模型基于相似性评分更新所述第二组实体中的一个或多个实体的矢量表示。
31.根据权利要求30所述的介质,其中,所述软件在被执行时进一步能操作为:
确定针对所述用户、所述第一组实体中的每个实体以及所述第二组实体中的每个实体的嵌入,其中:
每个嵌入对应于多维嵌入空间中的一个点,
所述嵌入空间包括对应于多个实体的多个点;并且
每个嵌入是基于使用所述深度学习模型确定的相应矢量表示的。
32.根据权利要求30或31所述的介质,其中,所述软件在被执行时进一步能操作为基于相似性评分将相应排名分配给所述目标实体和所述第二组实体中的每个实体,并且其中,进一步基于所述排名更新所述第二组实体中的所述一个或多个实体的矢量表示。
33.一种系统,包括:一个或多个处理器;以及耦接至所述处理器的存储装置,所述存储装置包括能由所述处理器执行的指令,所述处理器在执行所述指令以实施根据权利要求20至29中至少一项所述的方法时尤其能操作为:
访问:
社交网络系统的用户已经交互的在所述社交网络系统中的第一组实体,以及
在所述社交网络系统中的第二组实体;
使用深度学习模型确定所述第一组实体的第一组矢量表示;
从所述第一组实体中选择目标实体;
从所述第一组矢量表示中移除所述目标实体的矢量表示;
将所述第一组矢量表示中的其余矢量表示结合以确定所述用户的矢量表示;
使用所述深度学习模型确定所述第二组实体的第二组矢量表示;
通过将所述用户的矢量表示与所述目标实体的矢量表示进行对比,计算所述目标实体与所述用户之间的相似性评分,以及
通过将所述用户的矢量表示与所述第二组实体中的实体的矢量表示进行对比,计算所述用户与所述第二组实体中的实体之间的相似性评分;并且
使用所述深度学习模型基于相似性评分更新所述第二组实体中的一个或多个实体的矢量表示。
34.根据权利要求33所述的系统,其中,所述处理器在执行所述指令时进一步能操作为:
确定所述用户、所述第一组实体中的每个实体、以及所述第二组实体中的每个实体的嵌入,其中:
每个嵌入对应于多维嵌入空间中的一个点,
所述嵌入空间包括对应于多个实体的多个点;并且
每个嵌入是基于使用所述深度学习模型确定的相应矢量表示的。
35.根据权利要求33或32所述的系统,其中,所述处理器在执行所述指令时进一步能操作为:基于相似性评分将相应排名分配给所述目标实体和所述第二组实体中的每个实体,并且其中,进一步基于所述排名更新所述第二组实体中的所述一个或多个实体的矢量表示。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US14/984,956 | 2015-12-30 | ||
US14/984,956 US10402750B2 (en) | 2015-12-30 | 2015-12-30 | Identifying entities using a deep-learning model |
PCT/US2016/018367 WO2017116488A1 (en) | 2015-12-30 | 2016-02-18 | Identifying entities using a deep-learning model |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108604315A true CN108604315A (zh) | 2018-09-28 |
CN108604315B CN108604315B (zh) | 2022-01-11 |
Family
ID=59225437
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201680079586.2A Active CN108604315B (zh) | 2015-12-30 | 2016-02-18 | 使用深度学习模型识别实体 |
Country Status (10)
Country | Link |
---|---|
US (2) | US10402750B2 (zh) |
JP (1) | JP6689389B2 (zh) |
KR (1) | KR20180099812A (zh) |
CN (1) | CN108604315B (zh) |
AU (1) | AU2016380683A1 (zh) |
BR (1) | BR112018013550A2 (zh) |
CA (1) | CA3009157A1 (zh) |
IL (1) | IL260165A (zh) |
MX (1) | MX2018008104A (zh) |
WO (1) | WO2017116488A1 (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109543046A (zh) * | 2018-11-16 | 2019-03-29 | 重庆邮电大学 | 一种基于深度学习的机器人数据互操作领域本体构建方法 |
CN109582802A (zh) * | 2018-11-30 | 2019-04-05 | 国信优易数据有限公司 | 一种实体嵌入方法、装置、介质及设备 |
CN110245980A (zh) * | 2019-05-29 | 2019-09-17 | 阿里巴巴集团控股有限公司 | 基于神经网络模型确定目标用户激励形式的方法和设备 |
CN110689166A (zh) * | 2019-09-02 | 2020-01-14 | 中国平安人寿保险股份有限公司 | 一种基于随机梯度下降算法的用户行为分析方法及装置 |
CN111698327A (zh) * | 2020-06-12 | 2020-09-22 | 中国人民解放军国防科技大学 | 基于聊天室架构的分布并行强化学习模型训练方法及系统 |
CN112507312A (zh) * | 2020-12-08 | 2021-03-16 | 电子科技大学 | 在深度学习系统中基于数字指纹的验证与追踪方法 |
CN112580817A (zh) * | 2019-09-30 | 2021-03-30 | 脸谱公司 | 管理机器学习特征 |
US20220309093A1 (en) * | 2019-09-09 | 2022-09-29 | Adobe Inc. | Identifying digital attributes from multiple attribute groups utilizing a deep cognitive attribution neural network |
Families Citing this family (65)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10387464B2 (en) * | 2015-08-25 | 2019-08-20 | Facebook, Inc. | Predicting labels using a deep-learning model |
US11019177B2 (en) * | 2016-07-21 | 2021-05-25 | Facebook, Inc. | Selecting assets |
US20180060747A1 (en) * | 2016-08-23 | 2018-03-01 | Linkedln Corporation | Intelligent candidate generation for large-scale link recommendation |
US10026021B2 (en) * | 2016-09-27 | 2018-07-17 | Facebook, Inc. | Training image-recognition systems using a joint embedding model on online social networks |
US10223359B2 (en) * | 2016-10-10 | 2019-03-05 | The Directv Group, Inc. | Determining recommended media programming from sparse consumption data |
US10586157B2 (en) * | 2016-11-23 | 2020-03-10 | Microsoft Technology Licensing, Llc | Skill-based title prediction model |
US10810492B2 (en) * | 2017-01-27 | 2020-10-20 | Hewlett Packard Enterprise Development Lp | Memory side acceleration for deep learning parameter updates |
US11669220B2 (en) * | 2017-03-20 | 2023-06-06 | Autodesk, Inc. | Example-based ranking techniques for exploring design spaces |
US11488028B2 (en) * | 2017-03-31 | 2022-11-01 | Yahoo Assets Llc | Collaborative personalization via simultaneous embedding of users and their preferences |
KR101975750B1 (ko) * | 2017-09-27 | 2019-05-07 | 주식회사 종달랩 | 사용자 맞춤형 의류 부자재 추천 및 주문 시스템 |
US20190130444A1 (en) * | 2017-11-02 | 2019-05-02 | Facebook, Inc. | Modeling content item quality using weighted rankings |
KR20190054454A (ko) | 2017-11-13 | 2019-05-22 | 삼성전자주식회사 | 인공 신경망의 양자화 방법 및 장치 |
US11475351B2 (en) * | 2017-11-15 | 2022-10-18 | Uatc, Llc | Systems and methods for object detection, tracking, and motion prediction |
US10699398B2 (en) * | 2017-12-13 | 2020-06-30 | Uber Technologies, Inc. | Deep learning coordinate prediction using satellite and service data |
US10809083B1 (en) | 2017-12-30 | 2020-10-20 | Uber Technologies, Inc. | Using sensor data for coordinate prediction |
US11455663B2 (en) * | 2018-01-30 | 2022-09-27 | Walmart Apollo, Llc | System and method for rendering advertisements using lookalike model |
CN110232393B (zh) * | 2018-03-05 | 2022-11-04 | 腾讯科技(深圳)有限公司 | 数据的处理方法、装置、存储介质和电子装置 |
US11500910B2 (en) * | 2018-03-21 | 2022-11-15 | International Business Machines Corporation | Similarity based negative sampling analysis |
US11307880B2 (en) | 2018-04-20 | 2022-04-19 | Meta Platforms, Inc. | Assisting users with personalized and contextual communication content |
EP3557498A1 (en) * | 2018-04-20 | 2019-10-23 | Facebook, Inc. | Processing multimodal user input for assistant systems |
US11115410B1 (en) | 2018-04-20 | 2021-09-07 | Facebook, Inc. | Secure authentication for assistant systems |
US10978056B1 (en) | 2018-04-20 | 2021-04-13 | Facebook, Inc. | Grammaticality classification for natural language generation in assistant systems |
US11676220B2 (en) | 2018-04-20 | 2023-06-13 | Meta Platforms, Inc. | Processing multimodal user input for assistant systems |
US11715042B1 (en) | 2018-04-20 | 2023-08-01 | Meta Platforms Technologies, Llc | Interpretability of deep reinforcement learning models in assistant systems |
US11886473B2 (en) | 2018-04-20 | 2024-01-30 | Meta Platforms, Inc. | Intent identification for agent matching by assistant systems |
US20190327330A1 (en) | 2018-04-20 | 2019-10-24 | Facebook, Inc. | Building Customized User Profiles Based on Conversational Data |
KR102495793B1 (ko) | 2018-05-01 | 2023-02-06 | 구글 엘엘씨 | 가속화된 대규모 유사성 계산 |
US11106859B1 (en) * | 2018-06-26 | 2021-08-31 | Facebook, Inc. | Systems and methods for page embedding generation |
US10896295B1 (en) | 2018-08-21 | 2021-01-19 | Facebook, Inc. | Providing additional information for identified named-entities for assistant systems |
US10949616B1 (en) | 2018-08-21 | 2021-03-16 | Facebook, Inc. | Automatically detecting and storing entity information for assistant systems |
US11151175B2 (en) | 2018-09-24 | 2021-10-19 | International Business Machines Corporation | On-demand relation extraction from text |
KR102093233B1 (ko) * | 2018-09-27 | 2020-03-26 | 동국대학교 산학협력단 | 신경망 기반의 음악 자동 생성 장치 및 그 방법 |
EP3629520B1 (en) * | 2018-09-28 | 2023-08-23 | Permutive Limited | Fast and efficient classification system |
US11615302B2 (en) | 2019-03-06 | 2023-03-28 | Samsung Electronics Co., Ltd. | Effective user modeling with time-aware based binary hashing |
US11483370B2 (en) | 2019-03-14 | 2022-10-25 | Hewlett-Packard Development Company, L.P. | Preprocessing sensor data for machine learning |
US11080477B2 (en) | 2019-03-19 | 2021-08-03 | Microsoft Technology Licensing, Llc | Form-based formula editing in spreadsheets |
US11636393B2 (en) | 2019-05-07 | 2023-04-25 | Cerebri AI Inc. | Predictive, machine-learning, time-series computer models suitable for sparse training sets |
US11042706B2 (en) * | 2019-05-20 | 2021-06-22 | Sap Se | Natural language skill generation for digital assistants |
US11205048B2 (en) * | 2019-06-18 | 2021-12-21 | International Business Machines Corporation | Contextual disambiguation of an entity in a conversation management system |
US11442992B1 (en) | 2019-06-28 | 2022-09-13 | Meta Platforms Technologies, Llc | Conversational reasoning with knowledge graph paths for assistant systems |
US11657094B2 (en) | 2019-06-28 | 2023-05-23 | Meta Platforms Technologies, Llc | Memory grounded conversational reasoning and question answering for assistant systems |
US10915578B1 (en) | 2019-09-06 | 2021-02-09 | Digital Asset Capital, Inc. | Graph outcome determination in domain-specific execution environment |
US11132403B2 (en) * | 2019-09-06 | 2021-09-28 | Digital Asset Capital, Inc. | Graph-manipulation based domain-specific execution environment |
US11861674B1 (en) | 2019-10-18 | 2024-01-02 | Meta Platforms Technologies, Llc | Method, one or more computer-readable non-transitory storage media, and a system for generating comprehensive information for products of interest by assistant systems |
US11567788B1 (en) | 2019-10-18 | 2023-01-31 | Meta Platforms, Inc. | Generating proactive reminders for assistant systems |
CN111160564B (zh) * | 2019-12-17 | 2023-05-19 | 电子科技大学 | 一种基于特征张量的中文知识图谱表示学习方法 |
CN111177581A (zh) * | 2019-12-25 | 2020-05-19 | 清华大学 | 一种基于多平台的社交电商网站商品推荐方法及装置 |
US11941506B2 (en) * | 2020-02-04 | 2024-03-26 | Hubbell Incorporated | System and method for monitoring via smart devices |
US11562744B1 (en) | 2020-02-13 | 2023-01-24 | Meta Platforms Technologies, Llc | Stylizing text-to-speech (TTS) voice response for assistant systems |
US11238113B2 (en) * | 2020-04-01 | 2022-02-01 | Grand Rounds Inc. | Systems and methods for machine learning models for search engine performance optimization |
US11159767B1 (en) | 2020-04-07 | 2021-10-26 | Facebook Technologies, Llc | Proactive in-call content recommendations for assistant systems |
US11657304B2 (en) * | 2020-05-01 | 2023-05-23 | Microsoft Technology Licensing, Llc | Assessing similarity between items using embeddings produced using a distributed training framework |
US11222358B2 (en) | 2020-05-29 | 2022-01-11 | At&T Intellectual Property I, L.P. | Facilitation of artificial intelligence predictions of telecommunications customers |
US11658835B2 (en) | 2020-06-29 | 2023-05-23 | Meta Platforms, Inc. | Using a single request for multi-person calling in assistant systems |
US20220027373A1 (en) * | 2020-07-21 | 2022-01-27 | Tubi, Inc. | Intuitive content search results suggestion system |
US20220027409A1 (en) * | 2020-07-23 | 2022-01-27 | Vmware, Inc. | Entity to vector representation from graphs in a computing system |
CN116249987A (zh) * | 2020-09-22 | 2023-06-09 | 维萨国际服务协会 | 具有更新向量的基于图学习的系统 |
US11563706B2 (en) | 2020-12-29 | 2023-01-24 | Meta Platforms, Inc. | Generating context-aware rendering of media contents for assistant systems |
US11809480B1 (en) | 2020-12-31 | 2023-11-07 | Meta Platforms, Inc. | Generating dynamic knowledge graph of media contents for assistant systems |
US11899766B2 (en) | 2021-03-15 | 2024-02-13 | International Business Machines Corporation | User authentication using original and modified images |
US20220327637A1 (en) * | 2021-04-12 | 2022-10-13 | Microsoft Technology Licensing, Llc | Interaction based social distance quantification |
US11861315B2 (en) | 2021-04-21 | 2024-01-02 | Meta Platforms, Inc. | Continuous learning for natural-language understanding models for assistant systems |
CN113626462B (zh) * | 2021-07-15 | 2022-11-15 | 北京百度网讯科技有限公司 | 即时通讯对象的搜索方法、装置、电子设备和存储介质 |
KR102615014B1 (ko) * | 2022-12-15 | 2023-12-19 | 한국과학기술원 | 인터넷 포럼들 간의 사회적 영향력 분석 방법 및 그 장치 |
KR102649675B1 (ko) * | 2023-12-20 | 2024-03-20 | 주식회사 인텔렉투스 | 그래프 자료 구조 및 벡터 데이터가 통합된 풀 텍스트 인덱스를 이용한 정보 제공 방법 및 시스템 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090132213A1 (en) * | 2007-11-16 | 2009-05-21 | Microsoft Corporation | Method for modeling data structures using local contexts |
US20130073568A1 (en) * | 2011-09-21 | 2013-03-21 | Vladimir Federov | Ranking structured objects and actions on a social networking system |
CN103886090A (zh) * | 2014-03-31 | 2014-06-25 | 北京搜狗科技发展有限公司 | 基于用户喜好的内容推荐方法及装置 |
US20140279774A1 (en) * | 2013-03-13 | 2014-09-18 | Google Inc. | Classifying Resources Using a Deep Network |
CN104199875A (zh) * | 2014-08-20 | 2014-12-10 | 百度在线网络技术(北京)有限公司 | 一种搜索推荐方法及装置 |
US20150019640A1 (en) * | 2013-07-15 | 2015-01-15 | Facebook, Inc. | Large Scale Page Recommendations on Online Social Networks |
US20150293976A1 (en) * | 2014-04-14 | 2015-10-15 | Microsoft Corporation | Context-Sensitive Search Using a Deep Learning Model |
US20150310862A1 (en) * | 2014-04-24 | 2015-10-29 | Microsoft Corporation | Deep learning for semantic parsing including semantic utterance classification |
US20150331908A1 (en) * | 2014-05-15 | 2015-11-19 | Genetic Finance (Barbados) Limited | Visual interactive search |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060294101A1 (en) | 2005-06-24 | 2006-12-28 | Content Analyst Company, Llc | Multi-strategy document classification system and method |
US8086605B2 (en) | 2005-06-28 | 2011-12-27 | Yahoo! Inc. | Search engine with augmented relevance ranking by community participation |
CN103380591B (zh) * | 2011-02-22 | 2016-03-30 | 三菱电机株式会社 | 类似度计算系统、类似度计算装置以及类似度计算方法 |
EP2570970A1 (en) | 2011-09-16 | 2013-03-20 | Technische Universität Berlin | Method and system for the automatic analysis of an image of a biological sample |
US9699485B2 (en) * | 2012-08-31 | 2017-07-04 | Facebook, Inc. | Sharing television and video programming through social networking |
US9348886B2 (en) | 2012-12-19 | 2016-05-24 | Facebook, Inc. | Formation and description of user subgroups |
US9141906B2 (en) | 2013-03-13 | 2015-09-22 | Google Inc. | Scoring concept terms using a deep network |
US9367629B2 (en) | 2013-12-19 | 2016-06-14 | Facebook, Inc. | Grouping recommended search queries on online social networks |
JP6369053B2 (ja) * | 2014-02-28 | 2018-08-08 | 日本電気株式会社 | マッチング装置、マッチング方法及びプログラム |
US9484022B2 (en) | 2014-05-23 | 2016-11-01 | Google Inc. | Training multiple neural networks with different accuracy |
US10699198B2 (en) * | 2014-10-21 | 2020-06-30 | Oath Inc. | Method and system for cold-start item recommendation |
US9589237B1 (en) * | 2015-11-17 | 2017-03-07 | Spotify Ab | Systems, methods and computer products for recommending media suitable for a designated activity |
-
2015
- 2015-12-30 US US14/984,956 patent/US10402750B2/en active Active
-
2016
- 2016-02-18 BR BR112018013550A patent/BR112018013550A2/pt not_active Application Discontinuation
- 2016-02-18 MX MX2018008104A patent/MX2018008104A/es unknown
- 2016-02-18 AU AU2016380683A patent/AU2016380683A1/en not_active Abandoned
- 2016-02-18 CA CA3009157A patent/CA3009157A1/en not_active Abandoned
- 2016-02-18 WO PCT/US2016/018367 patent/WO2017116488A1/en active Application Filing
- 2016-02-18 KR KR1020187021851A patent/KR20180099812A/ko not_active Application Discontinuation
- 2016-02-18 JP JP2018534041A patent/JP6689389B2/ja active Active
- 2016-02-18 CN CN201680079586.2A patent/CN108604315B/zh active Active
-
2018
- 2018-06-20 IL IL260165A patent/IL260165A/en unknown
-
2019
- 2019-07-15 US US16/512,128 patent/US20190340538A1/en active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090132213A1 (en) * | 2007-11-16 | 2009-05-21 | Microsoft Corporation | Method for modeling data structures using local contexts |
US20130073568A1 (en) * | 2011-09-21 | 2013-03-21 | Vladimir Federov | Ranking structured objects and actions on a social networking system |
US20140279774A1 (en) * | 2013-03-13 | 2014-09-18 | Google Inc. | Classifying Resources Using a Deep Network |
US20150019640A1 (en) * | 2013-07-15 | 2015-01-15 | Facebook, Inc. | Large Scale Page Recommendations on Online Social Networks |
CN103886090A (zh) * | 2014-03-31 | 2014-06-25 | 北京搜狗科技发展有限公司 | 基于用户喜好的内容推荐方法及装置 |
US20150293976A1 (en) * | 2014-04-14 | 2015-10-15 | Microsoft Corporation | Context-Sensitive Search Using a Deep Learning Model |
US20150310862A1 (en) * | 2014-04-24 | 2015-10-29 | Microsoft Corporation | Deep learning for semantic parsing including semantic utterance classification |
US20150331908A1 (en) * | 2014-05-15 | 2015-11-19 | Genetic Finance (Barbados) Limited | Visual interactive search |
CN104199875A (zh) * | 2014-08-20 | 2014-12-10 | 百度在线网络技术(北京)有限公司 | 一种搜索推荐方法及装置 |
Non-Patent Citations (1)
Title |
---|
BRYAN PEROZZI: "DeepWalk: online learning of social representations", 《PROCEEDINGS OF THE 20TH ACM SIGKDD INTERNATIONAL CONFERENCE ON KNOWLEDGE DISCOVERY AND DATA MINING》 * |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109543046A (zh) * | 2018-11-16 | 2019-03-29 | 重庆邮电大学 | 一种基于深度学习的机器人数据互操作领域本体构建方法 |
CN109582802A (zh) * | 2018-11-30 | 2019-04-05 | 国信优易数据有限公司 | 一种实体嵌入方法、装置、介质及设备 |
CN109582802B (zh) * | 2018-11-30 | 2020-11-03 | 国信优易数据股份有限公司 | 一种实体嵌入方法、装置、介质及设备 |
CN110245980A (zh) * | 2019-05-29 | 2019-09-17 | 阿里巴巴集团控股有限公司 | 基于神经网络模型确定目标用户激励形式的方法和设备 |
CN110245980B (zh) * | 2019-05-29 | 2023-06-30 | 创新先进技术有限公司 | 基于神经网络模型确定目标用户激励形式的方法和设备 |
CN110689166A (zh) * | 2019-09-02 | 2020-01-14 | 中国平安人寿保险股份有限公司 | 一种基于随机梯度下降算法的用户行为分析方法及装置 |
CN110689166B (zh) * | 2019-09-02 | 2024-04-05 | 中国平安人寿保险股份有限公司 | 一种基于随机梯度下降算法的用户行为分析方法及装置 |
US20220309093A1 (en) * | 2019-09-09 | 2022-09-29 | Adobe Inc. | Identifying digital attributes from multiple attribute groups utilizing a deep cognitive attribution neural network |
US11734337B2 (en) * | 2019-09-09 | 2023-08-22 | Adobe Inc. | Identifying digital attributes from multiple attribute groups utilizing a deep cognitive attribution neural network |
CN112580817A (zh) * | 2019-09-30 | 2021-03-30 | 脸谱公司 | 管理机器学习特征 |
CN111698327B (zh) * | 2020-06-12 | 2022-07-01 | 中国人民解放军国防科技大学 | 基于聊天室架构的分布并行强化学习模型训练方法及系统 |
CN111698327A (zh) * | 2020-06-12 | 2020-09-22 | 中国人民解放军国防科技大学 | 基于聊天室架构的分布并行强化学习模型训练方法及系统 |
CN112507312A (zh) * | 2020-12-08 | 2021-03-16 | 电子科技大学 | 在深度学习系统中基于数字指纹的验证与追踪方法 |
Also Published As
Publication number | Publication date |
---|---|
BR112018013550A2 (pt) | 2018-12-04 |
CA3009157A1 (en) | 2017-07-06 |
KR20180099812A (ko) | 2018-09-05 |
JP2019506664A (ja) | 2019-03-07 |
US20190340538A1 (en) | 2019-11-07 |
MX2018008104A (es) | 2018-08-23 |
US10402750B2 (en) | 2019-09-03 |
JP6689389B2 (ja) | 2020-04-28 |
WO2017116488A1 (en) | 2017-07-06 |
CN108604315B (zh) | 2022-01-11 |
US20170193390A1 (en) | 2017-07-06 |
IL260165A (en) | 2018-07-31 |
AU2016380683A1 (en) | 2018-08-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108604315A (zh) | 使用深度学习模型识别实体 | |
US20230017819A1 (en) | Iterative Classifier Training on Online Social Networks | |
US11599566B2 (en) | Predicting labels using a deep-learning model | |
CN107403388B (zh) | 用于结构化搜索查询的语法模型 | |
US9992290B2 (en) | Recommendations based on geolocation | |
US10210261B2 (en) | Ranking and filtering groups recommendations | |
CN107004245B (zh) | 使用在线社交网络上的信标生成用户通知 | |
JP6744993B2 (ja) | ディープラーニングモデルを使用した推奨の生成 | |
CN111602152A (zh) | 用于对不同内容进行排名的机器学习模型 | |
CN105917330A (zh) | 用于在线社交网络的客户端搜索模板 | |
CN108292309A (zh) | 使用深度学习模型识别内容项 | |
US10699320B2 (en) | Marketplace feed ranking on online social networks | |
CN110476435A (zh) | 实况视频的商业广告时段 | |
JP2018501584A (ja) | オンライン・ソーシャル・ネットワーク上でニュース関連のコンテンツを検索するための提案キーワード | |
US20160373397A1 (en) | Live social modules on online social networks | |
CN105283841B (zh) | 应用定制的对象再利用和再循环 | |
EP3188086B1 (en) | Identifying entities using a deep-learning model | |
JP6457641B2 (ja) | オンライン・ソーシャル・ネットワーク上でのオファーおよび広告の検索 | |
CN105210049A (zh) | 在社交网络内的联系聚合 | |
EP3166025A1 (en) | Identifying content items using a deep-learning model | |
US10339125B2 (en) | Indexing user-defined minutiae | |
CN116467586A (zh) | 一种模型训练方法、装置、设备、介质及程序产品 | |
CN117076148A (zh) | 生成和呈现特定于消息传递线程且基于内容的效果 | |
Giurca et al. | What Is in a Like? Preference Aggregation on the Social Web |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CP01 | Change in the name or title of a patent holder | ||
CP01 | Change in the name or title of a patent holder |
Address after: California, USA Patentee after: Yuan platform Co. Address before: California, USA Patentee before: Facebook, Inc. |