CN110020188A - 基于隐式交互和简档数据的全局向量推荐 - Google Patents
基于隐式交互和简档数据的全局向量推荐 Download PDFInfo
- Publication number
- CN110020188A CN110020188A CN201810621817.9A CN201810621817A CN110020188A CN 110020188 A CN110020188 A CN 110020188A CN 201810621817 A CN201810621817 A CN 201810621817A CN 110020188 A CN110020188 A CN 110020188A
- Authority
- CN
- China
- Prior art keywords
- project
- user profiles
- data
- interaction
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000003993 interaction Effects 0.000 title claims abstract description 128
- 239000013598 vector Substances 0.000 title claims abstract description 72
- 238000010348 incorporation Methods 0.000 claims abstract description 32
- 238000003780 insertion Methods 0.000 claims abstract description 9
- 230000037431 insertion Effects 0.000 claims abstract description 9
- 238000003058 natural language processing Methods 0.000 claims abstract description 5
- 230000001737 promoting effect Effects 0.000 claims abstract 2
- 238000000034 method Methods 0.000 claims description 48
- 239000011159 matrix material Substances 0.000 claims description 44
- 230000006870 function Effects 0.000 claims description 32
- 230000002452 interceptive effect Effects 0.000 claims description 15
- 238000003860 storage Methods 0.000 description 31
- 239000002609 medium Substances 0.000 description 27
- 230000015654 memory Effects 0.000 description 15
- 238000004891 communication Methods 0.000 description 14
- 238000005516 engineering process Methods 0.000 description 14
- 238000012545 processing Methods 0.000 description 12
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000004044 response Effects 0.000 description 5
- 238000000429 assembly Methods 0.000 description 3
- 230000000712 assembly Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000013178 mathematical model Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 239000003990 capacitor Substances 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000000151 deposition Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 230000002045 lasting effect Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 239000012120 mounting media Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
- 229910052710 silicon Inorganic materials 0.000 description 1
- 239000010703 silicon Substances 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0276—Advertisement creation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0282—Rating or review of business operators or products
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Theoretical Computer Science (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Databases & Information Systems (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Information Transfer Between Computers (AREA)
Abstract
描述用于基于使用特征词语嵌入生成的向量促进推荐的数字媒体环境。推荐系统接收数据,数据描述用户简档的至少一个属性、至少一个项目、以及用户简档和至少一个项目之间的交互。推荐系统使用自然语言处理来将每个用户简档属性、每个项目、以及用户简档和项目之间的每个交互关联为词语,并将词语组合成句子。将这些句子输入到词语嵌入模型中以确定特征向量表示,特征向量表示描述用户简档属性、项目、以及显式交互和隐式交互之间的关系。从特征向量表示中,推荐系统确定不同特征之间的相似性。因此,即使对于不与任意历史交互数据相关联的用户简档,推荐系统也可以基于隐式交互来提供定制推荐。
Description
背景技术
计算设备输出用于暴露用户可能感兴趣的项目的推荐,即使用户不知道项目的存在。例如,视频流服务可输出电影或电视节目推荐,在线商店输出产品推荐等等。许多服务已经用自动推荐替代了传统搜索引擎作为用于发现内容项目的主要手段。因此,系统努力向个体最终用户裁剪推荐,使得推荐的项目实际上是感兴趣的。
传统推荐系统利用描述用户简档和项目之间的显式交互的历史数据。显式交互包括项目查看-查看关系,其描述在单个浏览会话中一起查看的项目。其他显式的交互包括查看-购买关系,其描述了被查看后购买的至少一个项目。备选地或附加地,显式交互包括项目购买-购买关系,其描述在单个浏览会话中一起购买的项目。传统方案从这些显式交互数据中建立模型,并使用这些模型来确定用户简档的推荐。
然而,传统推荐系统不能针对不具有历史显式交互数据的用户简档来生成推荐。类似地,传统推荐系统不能考虑用户简档和项目之间的隐式交互。隐式交互是指不显式指示某些项目的关联性的交互。例如,隐式交互可以包括项目被查看的次数、阅读新闻文章所花费的时间量、观看的视频的百分比等等。因此,数字推荐的传统方案无法考虑将以其他方式影响推荐决定的重要交互数据。因此,用于自动项目推荐的传统方案限于仅考虑某些类型的交互数据,这经常导致输出不相关的推荐。
发明内容
描述了数字媒体环境以基于使用特征词语嵌入生成的向量来促进推荐。在一个示例中,实现推荐系统的计算设备接收描述用户简档、至少一个项目和用户简档与至少一个项目之间的交互的至少一个属性的数据。继续该示例,推荐系统接收不同的会话数据集合,该会话数据集合描述用户简档属性、项目以及在某个时间段(例如,在单个浏览会话上)用户简档与项目之间的交互。在接收到数据之后,推荐系统使用自然语言处理将每个用户简档属性、每个项目以及用户简档和项目之间的每个交互相关联为词语。
从这些词语中,推荐系统将与会话相关联的词语编译成句子,使得句子包括描述用户简档、项目以及在会话过程期间用户简档和项目之间的交互的信息。因此,推荐系统生成代表个体会话的句子。此外,推荐系统通过生成描述单个会话的显式交互和隐式交互的分离句子来区分用户简档和项目之间的显式交互和隐式交互。例如,显式交互是指用户简档和项目之间的显式相关性,例如用户简档分配给项目的评级、用户简档购买项目的指示等等。相反,隐式交互是指与用户简档和项目之间的显式相关性不直接相关的交互,诸如项目被查看的次数、与项目交互所花费的时间量、被用户简档消耗的项目的百分比等等。
由推荐系统生成的每个句子随后被输入到词语嵌入模型中以确定特征向量表示,特征向量表示描述在所接收的数据中描述的用户简档属性、项目,显式交互和隐式交互之间的相似性。在一些实现中,词语嵌入模型利用目标函数,该目标函数包括被设计用于考虑项目与用户简档之间的隐式交互的数据字段。因此,推荐系统生成特征向量表示,特征向量表示包括描述共同框架中的用户简档、项目和交互的信息。从特征向量表示中,推荐系统可以确定不同特征之间的相似性。例如,推荐系统可以基于用户简档属性和项目相应的特征向量表示来确定用户简档属性和项目之间的相似性。在一些实现中,特征相似性是基于相应特征向量的点积确定的。
推荐系统使用特征向量表示来生成特征相似性矩阵,并存储特征相似性矩阵和特征向量表示两者用于生成推荐。以这种方式,当推荐系统从用户简档接收到用于访问项目的请求时,描述用户简档的信息可以与特征向量表示和特征相似性矩阵一起使用以推荐对用户简档具有相关性的项目。因此,推荐系统甚至可以为不与任意历史交互数据相关联的冷用户简档提供定制推荐。此外,由于包括隐式交互数据,推荐系统可以以比传统技术更高的精度来标识在特征相似性矩阵中描述的各种特征之间的相关性。
本发明内容以简化形式引入了概念的选择,这些概念在下面的具体实施方式中进一步描述。这样,本发明内容不旨在标识所要求保护的主题的必要特征,也不旨在用作辅助确定所要求保护的主题的范围。
附图说明
参照附图描述具体实施方式。附图中表示的实体可以指示一个或多个实体,因此可以在讨论中对单个或复数形式的实体可互换地进行参考。
图1是可操作以使用本文描述的技术来采用全局向量推荐的示例实现中的环境的图示。
图2更详细地描绘了示出图1的推荐系统的操作的示例实现中的系统。
图3描绘了示出使用词语嵌入的特征向量生成的示例实现。
图4描绘了示出使用词语嵌入的特征向量生成的示例实现。
图5是描绘根据一个或多个实施例的示例过程的流程图。
图6是描绘根据一个或多个实施例的示例过程的流程图。
图7示出了包括示例设备的各种组件的示例系统,该示例设备可以被实现为如参考图1-6所描述和/或利用的、用于实现本文描述的技术的实施例的任意类型的计算设备。
具体实施方式
概览
本文描述了通过至少一个计算设备来实现词语嵌入模型,以确定各种特征(诸如用户简档标识符、用户简档属性、项目标识符以及用户简档和项目之间的交互)的向量表示的技术和系统。通过生成包括描述公共框架中的这些不同特征信息的向量表示,本文描述的技术精确地将不同特征之间的相似性标识为相应向量表示的函数。
本文描述的技术相对于传统方案来生成推荐是有利的,因为它们考虑描述用户简档的信息以及用户简档和项目之间的隐式和显式交互。相反,传统技术仅基于项目共现模型来生成推荐,并且不能考虑各种用户简档属性或交互数据来定制推荐。因此,即使针对不与任意交互数据相关联的冷用户简档,本文描述的技术甚至也可以提供定制推荐。
为了确保针对特定特征适当地定制推荐,推荐系统使用自然语言处理技术将跨网站的用户简档行为建模为正在进行的对话。因此,推荐系统将描述用户简档、项目以及用户简档和项目之间的交互的数据分类为词语。然后将这些词语组合成句子,每个句子代表个体会话,诸如浏览会话。然后将多个句子组合成用于用户简档交互的统一行为语料库,其用于针对包括用户简档、项目、用户简档属性、和交互数据的各种特征生成向量表示。
然后,推荐系统使用特征向量表示来生成可用于定义特征之间的关系的特征相似性矩阵。例如,推荐系统可以基于相应特征向量表示的点积来生成特征相似性矩阵。在这个示例中,来自点积的高结果值对应于特征之间的高相关性,反之亦然。因此,本文描述的技术被配置为利用特征相似性矩阵来生成特征推荐,诸如对用户简档属性具有高相关性的项目的推荐。
在以下讨论中,描述了可采用本文描述的技术的示例环境。然后描述可以在示例环境以及其他环境中执行的示例过程。因此,示例过程的执行不限于示例环境,并且示例环境不限于示例过程的执行。
术语
术语“会话”是指用户简档与一个或多个项目交互期间的离散时间段。例如,会话可以指网站的浏览会话,该浏览会话当用户简档访问网站时开始并在用户简档导航离开网站时结束。备选地或附加地,会话可以是在购物环境中没有30分钟不活动的时间段、针对流传输环境没有12小时不活动的时间段等等。
术语“显式交互”是指用户简档和项目之间的显式相关性。例如,显式交互可以描述由用户简档分配给项目的评级、用户简档购买项目的指示等等。
术语“隐式交互”是指与用户简档和项目之间的显示相关性不直接相关的交互。例如,隐式交互可以描述项目被查看的次数、与项目交互所花费的时间量、用户简档消耗的项目的百分比等等。
术语“词语嵌入模型”是指可由计算设备使用的数学模型,数学模型用于基于包括描述在会话期间发生的活动的信息的输入句子来确定特征的向量表示。如本文所描述的,词语嵌入模型包括目标函数,该目标函数包括用于考虑用户简档和项目之间的隐式交互的数据字段。
术语“特征向量表示”或“特征向量”是指向量空间中的表示,该表示包括描述用户简档标识符、用户简档属性、项目标识符、描述用户简档和项目之间的显式交互的数据、描述用户简档和项目之间的隐式交互的数据或其组合中的一个或多个的信息。如本文所述的特征向量表示描述了通用框架中的这些各种特征,从而能够实现基于相应特征向量的函数的特征关系的比较。
术语“特征相似性矩阵”是指数学上地描述不同特征之间的关系的数据库结构。特征相似性矩阵有利地描述了通用框架中的不同特征以捕捉不同特征之间的相似性。
术语“冷用户简档”是指推荐系统不知道描述用户简档的先前交互的任意数据的用户简档。例如,冷用户简档与暖用户简档形成对比,针对暖用户简档推荐系统知道描述暖用户简档和项目之间的历史交互的数据。
示例环境
图1是在示例实现中的环境100的图示,该环境可操作以使用本文描述的技术来采用针对全局向量推荐的特征词语嵌入。所图示的环境100包括服务管理器系统102、推荐系统104和与相应的计算设备的用户交互106(本文也称为用户),作为通过通信系统110传送的会话数据108的来源。如本文所述的每个个体计算设备106可以与多个用户简档相关联。例如,计算设备可以由家庭共享,其中每个家庭成员具有相应的用户简档。此外,针对工作相关和个人计算设备交互,个体可以使用不同的用户简档。因此,如本文所描述的用户是指个体用户或个体用户的简档。
服务管理器系统102、推荐系统104和通信系统110至少部分地以一个或多个计算设备的硬件来实现。例如,每个系统102、104和110可以在要由计算设备的处理系统执行的计算机可读存储介质中实现。处理系统和计算机可读存储介质的示例在下面参照图7进一步详细描述。在一些实现中,服务管理器系统102、推荐系统104和通信系统110被实现在单个计算设备处。备选地或附加地,服务管理器系统102、推荐系统104和通信系统110在经由网络112彼此通信地连接的多个计算设备之间被实现。
例如,实现本文描述的系统中的一个或多个的计算设备可以被配置为台式计算机、膝上型计算机、移动设备(例如,假定如所示的诸如平板电脑或移动电话的手持配置)等等。因此,本文提及的计算设备可以从具有大量存储器和处理器资源的全资源设备(例如,个人计算机、游戏控制台)到具有有限存储器和/或处理资源的低资源设备(例如,移动设备)。备选地或附加地,计算设备可以指多个不同的设备,诸如由企业利用的用于执行“在云上”的操作的多个服务器,如关于图7进一步描述的。
服务管理器系统102代表至少部分地以计算设备的硬件实现的、用于提供经由网络112由用户106经由相应的计算设备可访问的服务的功能。例如,服务管理器系统102可以公开网站114或经由网络112可访问的其他功能来公开项目116。因此,服务管理器系统102被配置为公开用于用户交互的项目116。
通信系统110表示至少部分地以计算设备的硬件实现的、用于能够实现对由服务管理器系统102公开的项目116的访问的功能。例如,通信系统110能够实现通过网络浏览器、应用等对服务管理器系统102的访问。以这种方式,通信系统110使得计算设备能够经由网络112从服务管理器系统102获得数据。在一些实现中,通信系统110采用推荐系统104以向用户106提供从服务管理器系统102获得的数据。替代地或附加地,服务管理器系统102采用推荐系统104来经由通信系统110向用户106提供数据。
推荐系统104代表至少部分地以计算设备的硬件实现的、用于经由通信系统110为用户106生成推荐的功能。为了生成推荐,推荐系统104使用特征相似性矩阵118,其可以被存储在计算设备的存储装置120处,例如,如关于图7进一步描述的计算机可读存储介质。特征相似性矩阵118是可由推荐系统104使用以生成推荐的数据结构,这在下面进一步详细描述。
因此,服务管理器系统102、推荐系统104和通信系统110、与相应计算设备的用户简档交互106和存储装置120至少部分地以一个或多个计算设备的硬件来实现,并且可以驻留在计算机可读存储介质上以由相应的处理系统执行。处理系统和计算机可读介质的示例可以在图7的示例计算系统的讨论中找到。
图2更详细地描绘了示出图1的推荐系统104的操作的示例实现中的系统200。如图所示,推荐系统104基于会话数据108生成特征相似性矩阵118。使用特征相似性矩阵118,推荐系统104然后向用户106提供特征推荐232。推荐系统104从实现用户106的用户简档的相应计算设备接收会话数据108。如本文所述的,会话数据108表示描述用户简档标识符、用户简档属性、项目标识符、或用户简档与项目之间的交互中的至少一个的数据。在一些实现中,使用本文描述的技术,由会话数据108描述的交互可以是显式交互、隐式交互或其组合。
在所图示的示例中,会话数据108从针对用户简档206的会话204以及从针对用户简档218的会话216接收。在一些实现中,用户简档206标识与用户简档218不同的个体用户。备选地,用户简档206和218可以标识共同的个体用户。例如,用户简档206可以对应于用于在个体移动设备上使用的简档,而用户简档218可以对应于用于在个体膝上型计算机上使用的简档。因此,推荐系统104被配置为接收描述针对一个或多个用户简档的多个会话的会话数据108。所接收的会话数据108可以由推荐系统104存储在诸如如图1所示的存储装置120中以供进一步使用。
对于每个会话,会话数据108包括描述用户简档标识符、简档属性和对应属性值、针对项目的显式交互数据、针对项目的隐式交互数据或其组合中的至少一个的信息。例如,会话204包括描述针对用户简档206的用户标识符208的信息。用户标识符208可以是用于唯一地标识用户简档的任意合适形式的信息,诸如用户名、雇员标识号等等。
会话204附加地包括描述针对用户简档206的至少一个简档属性210和对应属性值212的信息。例如,示例简档属性210是“城市”,其中对应属性值212可以指定“纽约”。备选地或附加地,简档属性210可以是“性别”,其中对应的属性值212指定“女性”。因此,在会话数据108中包括的简档属性210和属性值212包括适合于标识用户简档206的各种描述性特征的信息。使用本文描述的技术,简档属性210可以包括适合于描述用户简档206的任何信息,诸如职业、学科、行业、国家、地区、经验、教育程度等。
会话204还包括至少一个项目标识符214,其描述用户简档206已与其交互的项目。如关于图3和4进一步详细描述的,项目标识符214附加地包括描述针对所标识项目的显式交互数据、隐式交互数据或其组合的信息。例如,项目标识符214可以包括项目描述、项目标题、项目元数据标签、与项目相关联的搜索术语等等。
附加地,项目标识符214可以包括描述用户简档206和相应项目之间的显式和隐式交互的信息。例如,项目标识符214可以包括描述交互类型的信息,诸如查看、购买、用于交互的时间戳、被访问的项目的百分比、与项目交互所花费的时间量等等。因此,项目标识符214不仅标识用户简档206与其交互的特定项目,而且还包括具体描述用户简档206如何与特定项目交互的信息。
类似地,会话216包括描述用户简档218的用户标识符220的信息。用户标识符220可以是用于唯一标识用户简档的任意合适形式的信息,诸如用户名、雇员标识号等等。会话216附加地包括描述针对用户简档218的至少一个简档属性222和对应属性值224的信息。例如,示例简档属性222是“国家”,其中相应属性值224指定“印度”。
备选地或附加地,简档属性222可以指定“性别”,其中对应的属性值224指定“男性”。因此,在会话数据108中包括的简档属性222和属性值224描述可用于标识用户简档218的各种特征的信息。使用本文描述的技术,简档属性222可以包括适合于描述用户简档224的任意信息,诸如职业、学科、行业、国家、地区、经验、教育程度等。
会话216附加地包括至少一个项目标识符226,该至少一个项目标识符226描述用户简档218已与其交互的项目。如关于图3和图4进一步详细描述的,项目标识符226附加地包括描述针对所标识项目的显式交互数据、隐式交互数据或其组合的信息。例如,项目标识符226可以包括项目描述、项目标题、项目元数据标签、与项目相关联的搜索术语等等。
附加地,项目标识符226可以包括描述用户简档218和对应项目之间的显式交互和隐式交互的信息。例如,项目标识符226可以包括描述交互类型(诸如查看、购买、用于交互的时间戳、被访问的项目的百分比、与项目交互所花费的时间量等等)的信息。因此,项目标识符226不仅标识用户简档218与其交互的特定项目,而且还包括具体描述用户简档218如何与特定项目交互的信息。
虽然项目标识符214和226被图示为被包括在会话数据108中,但是在一些实现中,推荐系统104不知道给定用户简档的任意项目标识符或项目交互数据。例如,在用户简档206是冷用户简档的示例中,会话204的会话数据108可能仅包括用户标识符、简档属性210和属性值212或其组合。然而,即使没有接收到与项目标识符214相对应的信息,推荐系统仍然可以使用特征相似性矩阵118来为用户简档206生成特征推荐232。
为了生成特征相似性矩阵118,推荐系统104将词语嵌入模型228应用于会话数据108。词语嵌入模型228被配置为实现自然语言处理以产生针对会话数据108中包括的各种信息的特征向量表示。可以以各种方式来配置词语嵌入模型228,诸如针对词语表示模型的修改的全局向量,其在下面关于图3和4进一步详细讨论。从特征向量表示,推荐系统生成特征相似性矩阵118。在实现中,特征相似性矩阵118的生成是使用特征向量表示点积比较、特征向量表示算术等而被执行的。
推荐系统104被配置为基于新的会话数据230来提供特征推荐232。新的会话数据230表示描述针对用户简档的会话的信息,该会话先前未在用于生成特征相似性矩阵118的会话数据108中描述。例如,新会话数据230可以包括描述用户简档的用户标识符的信息。备选地或附加地,新会话数据230可以包括描述用户简档的简档属性和简档属性的对应属性值的信息。备选地或附加地,新会话数据230可以包括描述项目以及会话期间项目与用户简档之间的交互的信息。
例如,如果新会话数据230描述用户简档当前正在查看项目“A”,则推荐系统104被配置为采用特征相似性矩阵118来基于项目的特征来标识相似项目以输出针对相似项目的特征推荐232。类似地,推荐系统104被配置为采用特征相似性矩阵118以基于用户简档标识符或用户简档属性值来标识具有与用户简档的相关性的项目。
因为特征相似性矩阵118包括描述用户简档标识符、用户简档属性值、项目标识符和项目交互数据的信息,所以可以使用任意合适的特征来确定用户简档项目相关性以生成特征推荐232。这使得推荐系统104能够即使针对冷用户简档也能够定制特征推荐232,冷用户简档不与描述冷用户简档的先前会话的任意项目交互信息相关联。例如,推荐系统104可以标识用户简档对应于拉斯维加斯并且使用特征相似性矩阵118来标识具有与拉斯维加斯附属用户简档的相关性的项目以包括在特征推荐232中。
在特征相似性矩阵118针对新会话数据230没有标识相似项目包括在特征推荐232中的实现中,推荐系统104可以提供通用特征推荐232或者放弃提供特征推荐232。
相反,在推荐系统104标识多个相似项目的场景中,推荐系统104应用加权函数以标识来自特征相似性矩阵118的、与新会话数据230最相似的项目以用于包括在特征推荐232中。诸如项目评级、项目标签等的附加因素可以被推荐系统104附加地用于确定用于传递到用户简档的特征推荐232的顺序。
图3描绘示出了由推荐系统104基于将图2的词语嵌入模型228应用于会话数据来生成的特征向量314的示例实现300。在所图示的示例中,会话数据被表示为描述会话204和216,如图2所示。在本示例中,会话204包括描述用户简档标识符208的信息,该用户简档标识符208指定会话204对应于“用户1”。类似地,会话204包括描述性别简档属性210的信息,性别简档属性210指定针对会话204的用户简档对应于“男性”性别。会话204附加地包括城市简档属性302,城市简档属性302指定针对会话204的用户简档对应于“纽约”城市。最后,会话204包括项目标识符214,项目标识符214指示用户简档在会话期间与项目“I1、I3、I5和I7”交互。
尽管未图示,但是项目标识符214可以附加地包括描述用户简档和针对会话204的项目I1、I3、I5和I7中的个体项目之间的交互信息的信息。例如,由项目标识符214指定的信息可以指示项目I3被多次查看、项目I5被购买、项目I7的仅15%被计算设备显示用于用户简档等等。因此,由项目标识符214指定的信息可以具体地描述用户简档在会话204期间如何与各种项目交互,显式地和显式地两者。以下关于图4包括由会话数据指定的交互信息的附加讨论。
在所图示的示例中,会话216包括描述用户简档标识符220的信息,用户简档标识符220指定会话216对应于“用户2”。类似地,会话216包括描述性别简档属性222的信息,性别简档属性222指定针对会话216的用户简档对应于“女性”性别。会话216附加地包括城市简档属性306,城市简档属性306指定针对会话216的用户简档对应于“纽约”城市。最后,会话216包括项目标识符226,项目标识符226指示会话期间用户简档与项目“I1、I2,I3、I5、I7和I8”交互。
虽然未示出,但是项目标识符226可以附加地包括描述用户简档和针对会话216的项目I1、I2,I3、I5、I7和I8中的个体项目之间的交互信息的信息。例如,由项目标识符226指定的信息可以指示项目I2被多次查看、项目I1被购买、项目I7的100%被计算设备显示用于用户简档等等。因此,由项目标识符226指定的信息可以具体地描述用户简档在会话216期间如何与各种项目交互,显式地和显式地两者。
然后将来自会话204和216的会话数据馈送到词语嵌入模型228以生成特征向量314。如本文所述的词语嵌入模型228将会话数据的个体方面表征为词语并且组合各种词语以形成描述相应会话204和216的句子。例如,词语嵌入模型228从会话204生成句子310。在所图示的示例中,句子310包括个体词语“I1”、“I3”、“I5”,“I7”、“性别-男性”、“城市-纽约”和“用户1”,其简洁地描述会话204的会话数据。类似地,句子312包括个体词语“I1”、“I2”、“I3”、“I7”、“I8”、“性别-女性”、“城市-纽约”和“用户2”,其简洁地描述会话216的会话数据。
从这些句子中,特征向量314可以是针对由词语嵌入模型228生成的句子中包括的每个不同词语而被生成的。例如,可以生成“城市-纽约”的特征向量以描述具有对与纽约市相关联的用户简档的相关性的项目。以这种方式,特征向量314可以用于标识用户简档的项目相关性,其与任意先前的显式或隐式交互数据不相关联。为了考虑隐式交互数据,推荐系统104被配置为针对单个会话生成多个句子。
图4描绘了示出由推荐系统基于将图2的词语嵌入模型228应用于会话数据来生成的特征向量422的示例实现400。在所示的示例中,会话数据被表示为描述会话402。会话402包括描述用户简档标识符404的信息,用户简档标识符404指定会话402对应于“用户3”。类似地,会话402包括描述性别简档属性406的信息,性别简档属性406指定针对会话402的用户简档对应于“女性”性别。会话402附加地包括城市简档属性410,城市简档属性410指定针对会话402的用户简档对应于“拉斯维加斯”城市。最后,会话402包括项目标识符414,项目标识符414指示用户简档与项目“I1、I4、I7和I3”交互。
由项目标识符414指定的信息被图示为包括交互信息,交互信息描述相应项目与针对会话402的用户简档之间的交互。例如,项目标识符包括项目“I4”的三个分离列表。在一些实现中,这可以指示用户简档在会话402期间的三个分离的时间查看了项目I4,而项目I1、I3和I7每个在会话402期间仅被查看一次。尽管本文根据多个视图来描述,在项目标识符414中包括的交互信息可以包括描述用户简档和项目之间的显式或隐式交互的任意类型的信息。例如,项目标识符414可以指定计算设备消耗的项目段的数目、与特定项目进行交互所花费的时间量等等。因此,项目标识符414中包括的信息具体描述了用户简档在会话404期间如何与各种项目交互。
推荐系统104然后将词语嵌入模型228应用于来自会话402的会话数据以便生成特征向量422。如本文所述,词语嵌入模型228将会话数据的个体方面表征为词语并且将各种词语进行组合以形成描述会话402的句子。例如,推荐系统104可以针对显式交互数据和隐式交互数据生成分离的句子。在所示示例中,句子416,418和420从单个会话生成,以考虑与项目I4有关的隐式交互数据。句子416包括个体词语“I1”、“I4”、“I7”、“I3”、“性别-女性”、“城市-拉斯维加斯”和“用户3”,其描述项目和对应于用户3的用户简档之间的显式交互。相反,句子418和420包括个体词语“I4”、“性别-女性”、“城市-拉斯维加斯”和“用户3”。
因此,句子418和420表示隐式交互数据,诸如在会话402期间比项目I1、I3和I7更频繁地查看项目I4。以这种方式,推荐系统104被配置为考虑隐式交互数据,隐式交互数据将不会通过针对会话生成单个句子来以其他方式传送。从推荐系统104生成的句子,诸如项目和用户简档属性的各种特征之间的相关性可以被确定为它们相应的特征向量422的函数。为了考虑这种隐式交互数据,词语嵌入模型228实现了修改的目标函数。
词语嵌入模型228表示经修改的全局向量(GloVe)模型,其是全局对数-双线性回归模型,其被配置为使用词语-词语共现矩阵连同本地上下文窗口来生成低维空间中的词语嵌入。这些词语嵌入然后可由实现推荐系统104的计算设备使用以产生关联项目、简档属性值、交互数据等等的特征向量表示。尽管本文根据使用其中会话数据被表示为词语或句子的词语到词语共现矩阵来描述,但是也可以使用项目-项目共现矩阵来直接生成低维空间中的项目嵌入。
词语嵌入模型228因此被配置为实现修改的GloVe模型并且通过仅训练词语到词语共现矩阵的非零元素来利用统计信息。通过仅对非零元素进行训练,而不是对大型语料库上的个体上下文窗口的整个稀疏矩阵进行训练,词语嵌入模型228被配置为快速生成特征向量314以用于为用户简档的当前状态实时地提供推荐。词语嵌入模型228采用的表示推理处理将词语之间的距离看做相似性或词语之间的相关力的表示。例如,在单个会话中连续交互的项目可能比与通过不同的、非连续会话交互的项目更相似。除了捕获该项目会话相似性之外,词语嵌入模型228被配置为使用由等式1表示的GloVe模型的修改的目标函数来考虑项目与用户简档之间的隐式交互:
在等式1中,Cij表示特征相似性矩阵118,其包含会话数据108,其中每行可以对应于用户简档属性,并且每列对应于项目。备选地或附加地,行可以对应于项目,并且列可以对应于用户简档或其组合。以这种方式,等式1的修改的目标函数能够考虑描述项目与用户简档之间的隐式相关性的隐式交互数据。等式1附加地包括置信度因子α,其表示隐式用户简档和项目相关性的值的置信度。例如,α值越高,更大的权重量将被给予隐式用户简档相关性。在一些实现中,α表示值为0.1。然而,等式1中可以使用0和1之间的任意合适的值。
因此,推荐系统104生成特征向量314,特征向量314包括描述用户简档标识符、用户简档属性值、项目标识符、用户简档和项目之间的显式交互、用户简档和项目之间的隐式交互、或其组合的信息。以这种方式,即使没有为该用户简档存储的先前交互数据,特征向量314也可用于标识与用户简档相似的项目,使得推荐系统104即使对于冷用户也能够生成定制特征推荐。尽管被描述为标识对用户简档可能感兴趣的项目,但是本文描述的技术类似地可用于基于描述特定项目的信息来标识可能对某个项目具有相关性的用户简档。此外,因为推荐系统104将用户简档、项目和用户简档属性嵌入到单个向量空间中,所以其可以跨不同的域来用于实时地提供定制的推荐。
示例程序
以下讨论描述了可以利用先前描述的系统和设备来实现的技术。每个过程的各方面可以用硬件、固件、软件或其组合来实现。这些过程被显示为框集合,框集合指定由一个或多个设备执行的操作,并且不一定限于所示的用于执行相应框的操作的顺序。在以下讨论的部分中,将参考图1-4。
图5描绘了用于全局向量推荐的特征词语嵌入的示例实现中的过程500。接收描述用户简档、用户简档的属性、项目、以及用户简档和项目之间的交互的数据(框502)。例如,实现推荐系统104的计算设备从通信系统110接收会话数据108。如本文所述和图2-4中所示,通过推荐系统将接收到的数据被组织为针对相应用户简档的个体会话。在一些实现中,会话数据可以包括描述用户简档、用户简档属性、项目、或用户简档与项目之间的交互、或其组合的信息。例如,所接收的会话数据可以描述用户简档对应于“用户3”、针对用户简档的性别属性是“女性”、针对用户简档的城市属性是“拉斯维加斯”、并且用户简档与项目“I1、I4、I7和I3”交互。
响应于接收会话数据,生成至少一个句子,至少一个句子包括标识用户简档、用户简档属性、项目、以及用户简档和项目之间的交互的词语(框504)。例如,第一句可从示例性接收到的会话数据生成,其读作“I1、I4、I7、I3、性别-女性,城市-拉斯维加斯、用户3”。在一些实现中,该句子表示特定会话的显式交互数据的词语嵌入描述。附加地,可以从示例接收到的会话数据生成第二句子和第三句子以读作“I4、性别-女性、城市-拉斯维加斯、用户3”。在该示例中,第二句子和第三句子表示隐式交互数据,其将不会以其他方式通过简单描述项目-项目会话对应的传统技术来量化。附加地,每个生成的句子包括描述用户简档以及单个句子的项目和相应的交互的特征。因此,由推荐系统104生成的句子可用于标识跨异同特征类别的特征相似性。
随后,基于至少一个生成的句子来确定至少一个特征向量表示(框506)。在实现中,通过诸如推荐系统104的词语嵌入模型228的词语嵌入模型来生成特征向量表示。例如,词语嵌入模型228可以实现具有修改后的目标函数的GloVe模型,如上关于等式1所述。以这种方式,特征向量表示包括描述用户简档、项目以及用户简档和项目之间的对应的显式和隐式交互的信息。
最后,基于至少一个特征向量表示输出特征相似性矩阵(框508)。在实现中,特征相似性矩阵118由推荐系统104基于所确定的特征向量表示的函数来输出,诸如特征向量314和422,如图3和图4所示。例如,特征向量的点积可以被计算以确定在特征相似性矩阵118中描述的各种特征之间的特征相似性。以这种方式,具有来自它们相应特征向量的较高点积值的特征与具有较低点积值的特征相比与较高的相似性程度相关联。
因此,特征相似性矩阵和对应的特征向量表示可以被存储诸如在图1的存储装置120的查找表中用于随后的访问。备选地或附加地,即使对于冷用户简档,特征向量表示和特征相似性矩阵也可以被索引到搜索引擎中,用于在分布式计算环境中定制推荐的实时传递。
图6描绘了用于全局向量推荐的特征词语嵌入的示例实现中的过程600。描述用户简档的数据被接收(框602)。例如,实现推荐系统104的计算设备经由网络112接收针对会话的描述用户简档的新的会话数据230。例如,所接收的数据可以描述用户简档的标识符或至少一个用户简档属性值或其组合。在一些实现中,如图1所示,描述用户简档的数据作为对网站114或项目116的查询的一部分由推荐系统104经由网络112从服务管理器系统102接收。
描述用户简档和项目之间的交互的数据也被接收(框604)。描述用户简档和项目之间的交互的这个数据可选地被接收,如箭头规避框604所指示的。例如,在冷用户简档的情况下,没有描述冷用户简档和项目之间的交互的数据是可用的,并且因此不被推荐系统104接收。例如,描述交互的数据可以作为新的会话数据230的一部分由推荐系统104经由网络112接收。
备选地或附加地,可以从存储120接收描述交互的数据,如图1所示。在实现中,描述用户简档和项目之间的交互的数据可以指代来自用户简档和项目之间的先前会话的历史交互。附加地或备选地,描述用户简档和项目之间的交互的数据可以指正在进行的会话期间由用户简档访问的项目。因此,推荐系统104被配置为实时提供反映用户简档的当前状态的推荐。
响应于接收描述用户简档的数据并且可选地接收描述用户简档和项目之间的交互的数据,基于特征相似性矩阵来确定用户简档的至少一个项目推荐(框606)。例如,推荐系统104可以采用特征相似性矩阵118来基于新的会话数据230为用户简档生成特征推荐232。特征相似性矩阵118可以由推荐系统104使用本文关于图1-5描述的技术来生成。
响应于基于特征相似性矩阵来确定针对用户简档的多个项目推荐,对项目推荐进行排名(框608)。推荐系统104可以使用任意合适的度量来确定多个推荐的排名。例如,可基于与用户简档和项目之间的交互相对应的时间戳、基于诸如项目排名的显式交互数据、或基于诸如与项目交互所花费的时间的量的隐式交互数据等等来对多个特征推荐232进行排名。在一些实现中,推荐系统104通过调整关于等式1描述的修改后的目标函数中使用的阿尔法值来执行该排名。在推荐系统104仅生成单个项目推荐的情况下,单个项目推荐被视为排名最高的推荐。
响应于对推荐进行排名,基于排名来输出项目推荐(框610)。例如,推荐系统104可以经由网络112向通信系统110传送一个或多个特征推荐232,以在与用户简档106中的一个相对应的计算设备处输出。以这种方式,推荐系统104被配置为基于向量表示来实时的生成推荐,向量表示描述通用框架中的用户简档、用户简档属性、项目,显式交互、以及隐式交互。
因此,推荐系统104被配置为基于描述表示用户简档、项目和对应交互的特征的向量表示的函数来输出推荐。通过描述公共框架中的显式交互、隐式交互和用户简档属性,推荐系统104可以输出先前未与推荐系统104接口的冷用户简档的定制推荐,使得不同的冷用户简档接收不同的推荐。此外,推荐系统104考虑了被传统推荐技术忽略的附加特征,从而为给定的用户简档提供具有高度相关性程度的推荐。
示例系统和设备
图7示出了总体上在700处的示例系统,其包括示例性计算设备702,该示例性计算设备702代表可以实现本文描述的各种技术的一个或多个计算系统和/或设备。这通过包括推荐系统104来说明。计算设备702可以是例如服务提供商的服务器、与客户端(例如客户端设备)相关联的设备、片上系统、和/或任意其他合适的计算设备或计算系统。
如图所示的示例性计算设备702包括处理系统704、一个或多个计算机可读介质706、以及彼此通信地耦合的一个或多个I/O接口708。尽管未示出,但是计算设备702还可以包括系统总线或将各种组件彼此耦合的其他数据和命令传输系统。系统总线可以包括不同总线结构中的任意一个或组合,诸如存储器总线或存储器控制器、外围总线、通用串行总线和/或利用各种总线体系结构中的任一种的处理器或本地总线。还想到了各种其他示例,诸如控制和数据线路。
处理系统704表示使用硬件来执行一个或多个操作的功能。因此,处理系统704被图示为包括硬件元件710,硬件元件710可以被配置为处理器、功能块等等。这可以包括以作为专用集成电路或使用一个或多个半导体形成的其他逻辑器件的硬件的实现。硬件元件710不受其形成的材料或其中采用的处理机构的限制。例如,处理器可以包括半导体和/或晶体管(例如,电子集成电路(IC))。在这种情况下,处理器可执行指令可以是电子可执行指令。
计算机可读存储介质706被图示为包括存储器/存储装置712。存储器/存储装置712表示与一个或多个计算机可读介质相关联的存储器/存储容量。存储器/存储装置712可以包括易失性介质(诸如随机存取存储器(RAM))和/或非易失性介质(诸如只读存储器(ROM)、闪存、光盘、磁盘等)。存储器/存储装置712可以包括固定介质(例如,RAM、ROM、固定硬盘驱动器等)以及可移除介质(例如,闪存、可移动硬盘驱动器、光盘等等)。计算机可读介质706可以以如下面进一步描述的各种其他方式来配置。
输入/输出接口708表示以下功能:允许用户向计算设备702输入命令和信息,并且还允许使用各种输入/输出设备将信息呈现给用户和/或其他组件或设备。输入设备的示例包括键盘、光标控制设备(例如鼠标)、麦克风、扫描仪、触摸功能(例如,被配置为检测物理触摸的电容或其他传感器)、相机(例如,采用可见或诸如红外频率的不可见的波长来将运动识别为不涉及触摸的手势)等等。输出设备的示例包括显示设备(例如,监视器或投影仪)、扬声器、打印机、网卡、触觉响应设备等等。因此,计算设备702可以以如下面进一步描述用于支持用户交互的各种方式配置。
本文的各种技术可以在软件、硬件元件或程序模块的通用上下文中描述。通常,这些模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、元素、组件、数据结构等等。本文使用的术语“模块”、“功能”和“组件”通常表示软件、固件、硬件或其组合。本文描述的技术的特征是平台无关的,这意味着可以在具有各种处理器的各种商业计算平台上实现这些技术。
所描述的系统、模块和技术的实现可以存储在某种形式的计算机可读介质上或者通过某种形式的计算机可读介质来传输。计算机可读介质可以包括可以由计算设备702访问的各种介质。作为示例而非限制,计算机可读介质可以包括“计算机可读存储介质”和“计算机可读信号介质”。
与单纯的信号传输、载波或信号本身相反,“计算机可读存储介质”可以指能够实现信息的持久和/或非暂时性存储的介质和/或设备。因此,计算机可读存储介质是指非信号承载介质。计算机可读存储介质包括诸如易失性和非易失性、可移动和不可移动介质和/或存储设备的硬件,其在适于诸如计算机可读指令、数据结构、程序模块、逻辑元件/电路、或其他数据的信息的存储的方法或技术中实现。计算机可读存储介质的示例可以包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光存储器、硬盘、磁带盒、磁带、磁盘存储或其他磁性存储设备或适于存储所需信息并可由计算机访问的其他存储设备、有形介质或制品。
“计算机可读信号介质”可以指信号承载介质,信号承载介质被配置为诸如经由网络向计算设备802的硬件发送指令。信号介质通常可以体现计算机可读指令、数据结构、程序模块或调制数据信号中的其他数据,例如载波、数据信号或其他传输机制。信号介质还包括任意信息传递介质。术语“已调制数据信号”是指具有以对信号中的信息进行编码的方式来设置或改变其特性中的一个或多个的信号。作为示例而非限制,通信介质包括:有线介质,诸如有线网络或直接有线连接;以及无线介质,诸如声学、RF、红外线和其他无线介质。
如前所述,硬件元件810和计算机可读介质806代表以硬件形式实现的模块、可编程设备逻辑和/或固定设备逻辑,其可以在一些实施例中被采用以实现本文描述的技术的至少一些方面,诸如用于执行一个或多个指令。硬件可以包括集成电路或片上系统的组件、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、复杂可编程逻辑器件(CPLD)以及硅或其他硬件的其他实现。在这种上下文中,硬件可以作为以下各项来操作:执行指令和/或由硬件体现的逻辑所定义的程序任务的处理设备;以及用于存储用于执行的指令的硬件,例如,先前描述的计算机可读存储介质。
前述的组合也可以用于实现本文所述的各种技术。因此,可以将软件、硬件或可执行模块实现为在某种形式的计算机可读存储介质上和/或通过一个或多个硬件元件710实施的一个或多个指令和/或逻辑。计算设备702可以被配置为实现对应于软件和/或硬件模块的特定指令和/或功能。因此,可由计算设备702执行作为软件的模块的实现可以至少部分地例如通过计算机可读存储介质和/或处理系统704的硬件元件710的使用以硬件来实现。指令和/或功能可以由一个或多个制品(例如,一个或多个计算设备702和/或处理系统704)执行/操作以实现本文描述的技术、模块和示例。
本文描述的技术可以由计算设备702的各种配置来支持,并且不限于本文描述的技术的具体示例。该功能还可以全部或部分地通过分布式系统的使用来实现,诸如经由平台716在“云”714上,如下所述。
云714包括和/或代表资源718的平台716。平台716抽象云714的硬件(例如服务器)和软件资源的底层功能。资源718可以包括应用和/或数据,应用和/或数据可以在计算机处理在远离计算设备702的服务器上执行时被利用。资源718还可以包括在因特网上和/或通过诸如蜂窝或Wi-Fi网络的订户网络提供的服务。
平台716可以抽象资源和功能以将计算设备702与其他计算设备连接。平台716还可以用于抽象资源的缩放,以提供与遇到的针对经由平台716实现的资源718的需求相对应的缩放水平。因此,在互连的设备实施例中,本文描述的功能的实现可以分布在整个系统700。例如,功能可部分地在计算设备702上以及经由抽象云714的功能的平台716来实现。
结论
虽然已经用结构特征和/或方法动作特定的语言描述了本发明,但是应当理解,在所附权利要求中限定的本发明不一定限于所描述的具体特征或动作。相反,具体特征和行为作为实现要求保护的发明的示例形式被公开。
Claims (20)
1.一种在用于基于特征向量表示提供推荐的数字媒体环境中由至少一个计算设备实现的方法,所述方法包括:
接收针对多个会话的会话数据,所述多个会话中的每个会话包括描述针对用户简档的至少一个属性、至少一个项目、以及在所述会话期间所述用户简档和所述至少一个项目之间的交互的数据;
将针对所述用户简档的所述至少一个属性、所述至少一个项目、以及所述用户简档和所述至少一个项目之间的所述交互关联为词语;
将所述词语的串关联为多个句子,所述多个句子中的每个句子对应于所述多个会话中的相应的一个会话;
接收描述请求对项目的访问的冷用户简档的数据;
基于所述句子和描述所述冷用户简档的所述数据来生成针对所述冷用户简档的至少一个项目推荐;以及
输出所述至少一个项目推荐。
2.根据权利要求1所述的方法,还包括:基于所述句子来确定针对所述用户简档的所述至少一个属性、所述至少一个项目、以及所述用户简档和所述至少一个项目之间的所述交互的特征向量表示,其中所述至少一个项目推荐还基于所述特征向量表示。
3.根据权利要求2所述的方法,还包括:基于所述特征向量表示来生成特征相似性矩阵,其中所述至少一个项目推荐还基于所述特征相似性矩阵。
4.根据权利要求2所述的方法,其中所述特征向量表示是基于词语嵌入模型而被确定的,所述词语嵌入模型包括全局对数双线性回归模型,所述全局对数双线性回归模型被配置为使用词语到词语共现矩阵和局部上下文窗口来生成词语嵌入。
5.根据权利要求4所述的方法,其中所述词语嵌入模型包括目标函数,所述目标函数包括针对用于描述项目与用户简档之间的隐式交互的数据的字段。
6.根据权利要求3所述的方法,其中生成所述特征相似性矩阵包括:计算可用于确定不同特征之间的相似性的所述特征向量表示的点积。
7.根据权利要求6所述的方法,其中所述不同特征包括描述用户简档属性的特征和描述项目的特征。
8.根据权利要求1所述的方法,其中针对所述用户简档的所述至少一个属性描述针对所述用户简档的标识符、与所述用户简档相关联的城市、与所述用户简档相关联的性别、与所述用户简档相关联的职业、与所述用户简档相关联的行业、与所述用户简档相关联的国家、或与所述用户简档相关联的教育程度。
9.根据权利要求1所述的方法,其中针对所述用户简档的所述至少一个属性、所述至少一个项目、以及所述用户简档与所述至少一个项目之间的所述交互使用自然语言处理而被关联为词语。
10.根据权利要求1所述的方法,还包括:接收描述所述冷用户简档和项目之间的后续交互的数据,并且基于所述句子、描述所述冷用户简档的所述数据、以及描述所述冷用户简档和所述项目之间的所述后续交互的所述数据,来生成附加项目推荐。
11.一种在用于基于特征向量表示接收推荐的数字媒体环境中由至少一个计算设备实现的方法,所述方法包括:
发送描述至少一个用户简档属性的数据连同针对将被递送到所述计算设备的至少一个项目的请求;
接收至少一个项目,所述至少一个项目基于以下项确定:所述至少一个用户简档属性、与用户简档标识符相对应的词语、用户简档属性、项目、以及用户简档与所述项目中的至少一个项目之间的交互、以及包括与单个会话相对应的所述词语的子集的至少一个句子;以及
在所述计算设备处输出所述至少一个推荐项目。
12.根据权利要求11所述的方法,其中用于确定所述至少一个项目的所述至少一个句子包括第一句子和第二句子,所述第一句子描述用户简档与所述项目中的所述至少一个项目之间的显式交互,所述第二句子描述所述用户简档和所述项目中的所述至少一个项目之间的隐式交互。
13.根据权利要求12所述的方法,其中所述用户简档和所述项目中的所述至少一个项目之间的所述显式交互描述以下项中的一项或多项:所述项目中的所述至少一个项目的购买、或被分配给所述项目中的所述至少一个项目的评级。
14.根据权利要求12所述的方法,其中所述用户简档和所述项目中的所述至少一个项目之间的所述隐式交互描述以下项中的一项或多项:在所述单个会话期间针对所述项目中的所述至少一个项目的查看的次数、所述用户简档与所述项目中的所述至少一个项目之间的交互时间量、或者由所述用户简档访问的所述项目中的所述至少一个项目的百分比。
15.根据权利要求11所述的方法,其中所述至少一个推荐项目还基于特征相似性矩阵而被确定,所述特征相似性矩阵包括特征向量表示,所述特征向量表示描述公共框架中的所述用户简档标识符、所述用户简档属性、所述项目、以及所述用户简档和所述项目中的所述至少一个项目之间的所述交互,所述特征向量表示基于将词语嵌入模型应用于所述句子而被确定。
16.根据权利要求15所述的方法,其中所述词语嵌入模型包括目标函数,所述目标函数包括针对描述项目与用户简档之间的隐式交互的数据的字段。
17.一种在用于基于特征向量表示促进推荐的数字媒体环境中的系统,包括:
至少一个处理器;以及
至少一个模块,至少部分地以计算设备的硬件实现,并且可操作用于通过执行操作来提供推荐,所述操作包括:
接收描述针对多个用户简档的属性、多个项目、以及不同用户简档与所述多个项目之间的交互的数据;
通过将词语嵌入模型应用于所接收的所述数据,来确定所述
多个用户简档属性、所述多个项目、以及所述不同用户简档与所述多个项目之间的所述交互之间的相似性;
接收描述不同于所述多个用户简档的冷用户简档的数据;
基于所述多个用户简档属性、所述多个项目、所述不同用户简档与所述多个项目之间的所述交互之间的相似性和描述所述冷用户简档的所述数据,来确定针对所述冷用户简档的至少一个项目推荐;以及
向所述冷用户简档输出所述至少一个项目推荐。
18.根据权利要求17所述的系统,其中描述所述冷用户简档的数据包括:针对所述冷用户简档的标识符或描述所述冷用户简档的特性的属性中的至少一个。
19.根据权利要求17所述的系统,其中描述所述冷用户简档的所述数据是独立于描述所述冷用户简档和项目之间的交互的信息而被接收的。
20.根据权利要求17所述的系统,其中确定所述相似性包括:确定针对多个用户简档的所述属性、所述多个项目、以及所述不同用户简档和所述多个项目之间的交互的特征向量表示,以及将所述特征向量表示嵌入共同框架中。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US15/785,934 | 2017-10-17 | ||
US15/785,934 US10699321B2 (en) | 2017-10-17 | 2017-10-17 | Global vector recommendations based on implicit interaction and profile data |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110020188A true CN110020188A (zh) | 2019-07-16 |
Family
ID=63143451
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810621817.9A Pending CN110020188A (zh) | 2017-10-17 | 2018-06-15 | 基于隐式交互和简档数据的全局向量推荐 |
Country Status (5)
Country | Link |
---|---|
US (1) | US10699321B2 (zh) |
CN (1) | CN110020188A (zh) |
AU (1) | AU2018204372A1 (zh) |
DE (1) | DE102018004974A1 (zh) |
GB (1) | GB2567712A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112101436A (zh) * | 2020-09-07 | 2020-12-18 | 北京字节跳动网络技术有限公司 | 实体聚类的方法、装置、设备和存储介质 |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10515400B2 (en) | 2016-09-08 | 2019-12-24 | Adobe Inc. | Learning vector-space representations of items for recommendations using word embedding models |
CA2982930A1 (en) | 2017-10-18 | 2019-04-18 | Kari Saarenvirta | System and method for selecting promotional products for retail |
US10621533B2 (en) | 2018-01-16 | 2020-04-14 | Daisy Intelligence Corporation | System and method for operating an enterprise on an autonomous basis |
US10789460B1 (en) * | 2018-01-24 | 2020-09-29 | The Boston Consulting Group, Inc. | Methods and systems for screening documents |
US11244326B2 (en) * | 2018-03-06 | 2022-02-08 | Verizon Media Inc. | Analytical precursor mining for personalized recommendation |
US11669759B2 (en) * | 2018-11-14 | 2023-06-06 | Bank Of America Corporation | Entity resource recommendation system based on interaction vectorization |
US11568289B2 (en) | 2018-11-14 | 2023-01-31 | Bank Of America Corporation | Entity recognition system based on interaction vectorization |
CN110046965A (zh) * | 2019-04-18 | 2019-07-23 | 北京百度网讯科技有限公司 | 信息推荐方法、装置、设备和介质 |
CN110175283B (zh) * | 2019-05-10 | 2021-04-13 | 深圳前海微众银行股份有限公司 | 一种推荐模型的生成方法及装置 |
US11049136B1 (en) * | 2019-05-22 | 2021-06-29 | Facebook, Inc. | Inferring attributes associated with a non-merchant user of a classified advertising service based on user interactions with an item for sale posted by the non-merchant user |
CN110866181B (zh) * | 2019-10-12 | 2022-04-22 | 平安国际智慧城市科技股份有限公司 | 资源推荐的方法、装置及存储介质 |
US11468489B2 (en) * | 2019-10-31 | 2022-10-11 | Walmart Apollo, Llc | System, non-transitory computer readable medium, and method for self-attention with functional time representation learning |
CN111078997B (zh) * | 2019-11-18 | 2023-08-22 | 中国银行股份有限公司 | 一种资讯推荐方法及装置 |
US11620595B2 (en) * | 2020-01-15 | 2023-04-04 | Microsoft Technology Licensing, Llc | Deep reinforcement learning for long term rewards in an online connection network |
US11782968B2 (en) * | 2020-02-12 | 2023-10-10 | Spotify Ab | Systems and methods for providing media recommendations using contextual and sequential user embeddings |
US11887138B2 (en) | 2020-03-03 | 2024-01-30 | Daisy Intelligence Corporation | System and method for retail price optimization |
US11797598B2 (en) * | 2020-10-30 | 2023-10-24 | Sitecore Corporation A/S | System and method to automatically create, assemble and optimize content into personalized experiences |
US11783338B2 (en) | 2021-01-22 | 2023-10-10 | Daisy Intelligence Corporation | Systems and methods for outlier detection of transactions |
US11540017B1 (en) | 2021-05-19 | 2022-12-27 | Spotify Ab | System and method for generating models representing users of a media providing service |
CN113326431B (zh) * | 2021-06-01 | 2022-09-27 | 安徽理工大学 | 一种基于微信小程序的智能推荐储物柜 |
US20230049808A1 (en) * | 2021-08-10 | 2023-02-16 | At&T Intellectual Property I, L.P. | Method and apparatus for purchasing fulfillment via a virtual assistant |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1611067A (zh) * | 2001-12-31 | 2005-04-27 | 皇家飞利浦电子股份有限公司 | 增加对相关应用的显式简档交叉引证的方法 |
CN102208086A (zh) * | 2010-03-31 | 2011-10-05 | 北京邮电大学 | 面向领域的个性化智能推荐系统及实现方法 |
CN102265273A (zh) * | 2008-12-23 | 2011-11-30 | 阿克塞尔斯普林格数字电视指导有限责任公司 | 用于推荐器系统的自适应隐式学习 |
CN105308587A (zh) * | 2013-06-14 | 2016-02-03 | 微软技术许可有限责任公司 | 将可消费内容的用户使用结合于推荐中 |
CN105989047A (zh) * | 2015-02-05 | 2016-10-05 | 富士通株式会社 | 获取装置、获取方法、训练装置以及检测装置 |
CN106203761A (zh) * | 2015-04-30 | 2016-12-07 | 微软技术许可有限责任公司 | 提取并显现来自数据源的用户工作属性 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070226207A1 (en) | 2006-03-27 | 2007-09-27 | Yahoo! Inc. | System and method for clustering content items from content feeds |
US9159091B2 (en) | 2008-02-08 | 2015-10-13 | Joey Horvitz | Method and apparatus for personalized content-sharing and gifting via a communication medium |
US9179171B2 (en) | 2011-11-30 | 2015-11-03 | Verizon Patent And Licensing Inc. | Content recommendation for a unified catalog |
US8983888B2 (en) * | 2012-11-07 | 2015-03-17 | Microsoft Technology Licensing, Llc | Efficient modeling system for user recommendation using matrix factorization |
US9535897B2 (en) | 2013-12-20 | 2017-01-03 | Google Inc. | Content recommendation system using a neural network language model |
US9691035B1 (en) * | 2014-04-14 | 2017-06-27 | Amazon Technologies, Inc. | Real-time updates to item recommendation models based on matrix factorization |
US11113598B2 (en) | 2015-06-01 | 2021-09-07 | Salesforce.Com, Inc. | Dynamic memory network |
US10109051B1 (en) * | 2016-06-29 | 2018-10-23 | A9.Com, Inc. | Item recommendation based on feature match |
US10515400B2 (en) | 2016-09-08 | 2019-12-24 | Adobe Inc. | Learning vector-space representations of items for recommendations using word embedding models |
-
2017
- 2017-10-17 US US15/785,934 patent/US10699321B2/en active Active
-
2018
- 2018-06-15 CN CN201810621817.9A patent/CN110020188A/zh active Pending
- 2018-06-19 AU AU2018204372A patent/AU2018204372A1/en not_active Abandoned
- 2018-06-21 DE DE102018004974.5A patent/DE102018004974A1/de active Pending
- 2018-06-28 GB GB1810574.2A patent/GB2567712A/en not_active Withdrawn
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1611067A (zh) * | 2001-12-31 | 2005-04-27 | 皇家飞利浦电子股份有限公司 | 增加对相关应用的显式简档交叉引证的方法 |
CN102265273A (zh) * | 2008-12-23 | 2011-11-30 | 阿克塞尔斯普林格数字电视指导有限责任公司 | 用于推荐器系统的自适应隐式学习 |
CN102208086A (zh) * | 2010-03-31 | 2011-10-05 | 北京邮电大学 | 面向领域的个性化智能推荐系统及实现方法 |
CN105308587A (zh) * | 2013-06-14 | 2016-02-03 | 微软技术许可有限责任公司 | 将可消费内容的用户使用结合于推荐中 |
CN105989047A (zh) * | 2015-02-05 | 2016-10-05 | 富士通株式会社 | 获取装置、获取方法、训练装置以及检测装置 |
CN106203761A (zh) * | 2015-04-30 | 2016-12-07 | 微软技术许可有限责任公司 | 提取并显现来自数据源的用户工作属性 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112101436A (zh) * | 2020-09-07 | 2020-12-18 | 北京字节跳动网络技术有限公司 | 实体聚类的方法、装置、设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
GB201810574D0 (en) | 2018-08-15 |
US10699321B2 (en) | 2020-06-30 |
US20190114687A1 (en) | 2019-04-18 |
DE102018004974A1 (de) | 2019-04-18 |
GB2567712A (en) | 2019-04-24 |
AU2018204372A1 (en) | 2019-05-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110020188A (zh) | 基于隐式交互和简档数据的全局向量推荐 | |
JP6615362B2 (ja) | ユーザー似顔絵を取得する方法及び装置 | |
US10861077B1 (en) | Machine, process, and manufacture for machine learning based cross category item recommendations | |
US20190392330A1 (en) | System and method for generating aspect-enhanced explainable description-based recommendations | |
US8924314B2 (en) | Search result ranking using machine learning | |
US9607010B1 (en) | Techniques for shape-based search of content | |
US8725559B1 (en) | Attribute based advertisement categorization | |
US10290040B1 (en) | Discovering cross-category latent features | |
WO2020238502A1 (zh) | 物品推荐方法及装置、电子设备及存储介质 | |
CN110688476A (zh) | 一种基于人工智能的文本推荐方法及装置 | |
JP2019113943A (ja) | 情報提供装置、情報提供方法、およびプログラム | |
JP2017054214A (ja) | 判定装置、学習装置、情報配信装置、判定方法及び判定プログラム | |
WO2021155691A1 (zh) | 用户画像生成方法、装置、存储介质及设备 | |
JP2009193098A (ja) | 情報処理装置、情報処理方法、およびプログラム | |
CN111159578B (zh) | 一种推荐对象的方法和系统 | |
Ding et al. | Computational Technologies for Fashion Recommendation: A Survey | |
US20220171818A1 (en) | Information retrieval system, method and computer program product | |
US20170032109A1 (en) | Digital Rights Management and Behavioral Traits | |
CN112650942A (zh) | 产品推荐方法、装置、计算机系统和计算机可读存储介质 | |
CN111967924A (zh) | 商品推荐方法、商品推荐装置、计算机设备和介质 | |
US20150269177A1 (en) | Method and system for determining user interest in a file | |
CN113792952A (zh) | 用于生成模型的方法和装置 | |
CN112862538A (zh) | 预测用户偏好的方法、装置、电子设备和介质 | |
CN110162714A (zh) | 内容推送方法、装置、计算设备和计算机可读存储介质 | |
Ziegler et al. | Interactive Recommendation Systems |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |