CN109285023A

CN109285023A - 用于剖析用户意图的方法及其装置

Info

Publication number: CN109285023A
Application number: CN201810796436.4A
Authority: CN
Inventors: 黄永淑; 李春旿; 张祐赫; 张允硕
Original assignee: SK Telecom Co Ltd
Current assignee: 11th Street Co., Ltd.
Priority date: 2017-07-21
Filing date: 2018-07-19
Publication date: 2019-01-29
Also published as: US20190026760A1; KR20190010173A; KR102472572B1

Abstract

本文公开了一种用于用户意图剖析的方法及其装置。可以基于关于访问在线站点的用户的在线行为实时收集的日志来创建行为数据，可以基于行为数据来检测用户的购买意图和感兴趣物品，可以考虑对应于感兴趣物品的关键词矢量与基于在线站点中登记的多个物品而创建的物品模型之间的相似度来提取与用户有关的关键词排名信息，以及可以基于感兴趣物品、关键词排名信息以及购买意图中包括的购买概率中的至少之一来创建针对该用户的用户意图简档。

Description

用于剖析用户意图的方法及其装置

相关申请的交叉引用

本申请要求于2017年7月21日提交的韩国专利申请第10-2017-0092567号的权益，该韩国专利申请的全部内容通过引用并入本申请。

技术领域

本发明总体上涉及用于用户意图剖析(profiling)以用于理解用户意图的方法，更具体地涉及在用户正在使用电子商务时实时分析用户的行为以及将与该行为有关的用户意图表示并提供为数据的方法。

背景技术

随着通过因特网服务提供的物品和产品的数量呈指数增长，用户需要花费大量的时间和精力来探索、搜索和比较信息。也就是说，考虑到信息过多并且产品数量庞大，为了做出正确的选择和明智的决定，用户必须投入更多时间。

为了解决该问题，需要一种用于通过分析顾客的在线行为的特点并且剖析顾客的购买模式来基于变化的购物模式向顾客提供最佳购物信息的方法。

此外，用于提供产品和关于产品的信息的供应商还需要理解顾客的意图和目的，以便在适当的时间有效地提供更接近顾客意图的产品和信息。因此，服务供应商有必要构建一种系统，该系统能够基于用户在特定时间点的购物模式和趋势来在适当的时间组织并提供可承受价格的产品组。

在传统方法中，分析并以简档的形式提供与特定物品或URL相关的顾客行为。通过分析来对用于搜索物品的搜索词、列出的物品中被点击的物品以及在所选物品的页面上的行为(添加到列表、检查评论、检查Q&A、添加到购物车等)进行评级，然后对高评级的物品或类别进行剖析并提供为数据。此外，可以结合并提供基于顾客过去购买的历史而计算的数据。因为这种方法被配置成使得在物品或类别层面或者在用于检索物品的搜索词的层面分析和提供顾客搜索物品的意图，所以顾客的购物模式限于由顾客检索的类别或物品。

在另一传统方法中，从用户在线购物的网页提取关于物品的文本，并且使用通过分析所提取的文本的语素而提取的关键词来创建用户信息，由此执行顾客剖析。此外，已经提出了一种基于本体来规范化关键词的方法。

然而，由于用于语素分析和通过本体映射的规范化所需的耗时操作，该方法不足以实时剖析用户的搜索意图。此外，可能存在与确保本体适用于用户剖析、本体的应用范围、本体应用的适合性的确定等有关的问题。[相关技术的文献]

(专利文献1)2016年11月18日公布的题为“Profiling system and method forcollecting and utilizing profile of keyword(用于收集和利用关键词简档的剖析系统和方法)”的韩国专利第10-1679328号。

发明内容

本发明的目的是实时分析使用电子商务的用户的意图并且将意图表示并提供为数据。

本发明的另一个目的是分析用户使用电子商务服务时生成的行为日志，并且使用明确的关键词和数字来剖析用户搜索物品的意图，以便用于提高个性化推荐、广告、搜索和营销的有效性。

本发明的又一目的是提供一种用于在存在大量用户和大量物品时实时有效地处理与购买有关的用户搜索意图的方法。

本发明的又一目的是有效地结构化和表示用户正在搜索的物品或产品的特征信息。

本发明的又一目的是自动执行对具有相似含义的关键词的聚类、对代表性的关键词的选择等，由此实现成本效率。

本发明的又一目的是有效地搜索相似产品、相似用户、产品与用户之间的关系、与由某一关键词表示的特征相关联的产品或用户等。

本发明的又一目的是改进对用户剖析的实时支持以及在并行分布式环境中对其结果的使用。

为了实现上述目的，根据本发明的用于用户意图剖析的方法可以包括：基于关于访问在线站点的用户的在线行为实时收集的日志来创建与连续行为相对应的行为数据，基于行为数据来检测用户的购买意图和感兴趣物品，考虑对应于感兴趣物品的关键词矢量与基于在线站点中登记的多个物品而创建的物品模型之间的相似度来提取与用户有关的关键词排名信息，以及基于感兴趣物品、关键词排名信息以及购买意图中包括的购买概率中的至少之一来创建针对用户的用户意图简档。

在此，物品模型可以是基于被创建成对应于相应多个物品的物品矢量而学习的。

在此，该方法还可以包括：通过基于语素对关键词进行分析来创建用于相应多个物品的关键词集合；针对关键词集合中的每个关键词集合所包含的多个关键词创建多个关键词矢量；以及将用于每个关键词的权重应用于多个关键词矢量，并且计算应用了用于每个关键词的权重的多个关键词矢量的标量积之和，由此创建物品矢量。

在此，创建多个关键词矢量可以被配置成考虑多个关键词中的每个关键词的上下文来提取多个上下文关键词以将多个上下文关键词至多个关键词的关系表示为矢量值，并且基于矢量值执行学习使得平均对数概率达到最大，由此创建多个关键词矢量。

在此，创建关键词集合可以被配置成使得当多个关键词中存在点间互信息(PMI)具有预设参考PMI值的关键词对时，将该对中的关键词组合成复合关键词，以便将其视为单个关键词。

在此，方法还包括考虑物品信息中关键词的频率、关键词出现的物品的比例以及关键词出现的位置中的至少之一来计算每个关键词的权重。

在此，行为数据可以包括行为发生的时间、用户id、终端id、统一资源标识符(URI)、搜索词以及与物品有关的信息中的至少之一。

在此，用户意图简档可以包括关于用户感兴趣的物品集群的信息，该物品集群是通过将与连续行为相对应的行为模式的购买概率作为权重应用于与感兴趣物品相对应的物品矢量而创建的。

在此，方法还包括通过将行为模式与针对在线站点创建的购买概率模型进行比较来计算购买概率。

此外，根据本发明的一种服务器包括：存储器，其用于存储关于访问在线站点的用户的在线行为实时收集的日志以及基于在线站点中登记的多个物品创建的物品模型；以及处理器，其用于使用基于日志而创建成对应于基于日志的连续行为的行为数据来检测用户的购买意图和感兴趣物品，考虑对应于感兴趣物品的关键词矢量与物品模型之间的相似度来提取与用户有关的关键词排名信息，以及基于感兴趣物品、关键词排名信息以及购买意图中包括的购买概率中的至少之一来创建与用户相对应的用户意图简档。

在此，物品模型可以是基于被创建成与相应多个物品相对应的物品矢量而学习的。

在此，处理器可以通过基于语素对关键词进行分析来创建用于相应多个物品的关键词集合，针对关键词集合中的每个关键词集合所包含的多个关键词创建多个关键词矢量，以及将用于每个关键词的权重应用于多个关键词矢量，并且计算应用了用于每个关键词的权重的多个关键词矢量的标量积之和，由此创建物品矢量。

在此，处理器可以考虑多个关键词中的每个关键词的上下文来提取多个上下文关键词以将多个上下文关键词至多个关键词的关系表示为矢量值，并且基于矢量值执行学习使得平均对数概率达到最大，由此创建多个关键词矢量。

在此，当多个关键词中存在点间互信息(PMI)具有预设参考PMI值的关键词对时，处理器可以将该对中的关键词组合成复合关键词，以便将其视为单个关键词。

在此，处理器可以考虑物品信息中关键词的频率、关键词出现的物品的比例以及关键词出现的位置中的至少之一来计算用于每个关键词的权重。

在此，处理器可以通过将行为模式与针对在线站点创建的购买概率模型进行比较来计算购买概率。

附图说明

根据以下结合附图的详细描述，将更清楚地理解本发明的上述和其他目的、特征和优点，在附图中：

图1是示出根据本发明实施方式的用于用户意图剖析的系统的视图；

图2是示出根据本发明实施方式的用于用户意图剖析的方法的流程图；

图3是示出根据本发明的用户意图剖析方法中的创建关键词矢量的过程的示例的流程图；

图4是示出根据本发明的用户意图剖析方法中的创建和学习物品模型的示例的流程图；

图5是示出根据本发明的用户意图剖析的过程的示例的视图；

图6至图7是示出根据本发明的基于词嵌入(word-embedding)的关键词矢量的创建的示例的视图；

图8至图9是示出根据本发明的创建用户意图简档的过程的示例的示图；以及

图10是示出根据本发明的实施方式的用于执行用户意图剖析的服务器的框图。

具体实施方式

本说明书中使用的技术术语仅用于描述特定实施方式，并且应注意，这些术语不旨在限制本发明。此外，除非在本说明书中特别定义，否则本说明书中使用的技术术语应被解释为具有本发明所属领域的普通技术人员通常理解的含义，并且不应被解释为具有过于全面的含义或过于狭窄的含义。此外，如果本说明书中使用的技术术语是不能准确地表示本发明的精神的错误技术术语，则应该用本领域普通技术人员可以正确理解的技术术语来替换它们。此外，本发明中使用的常用术语应该根据词典的定义或根据上下文来解释，而不应该被解释为具有过于狭窄的含义。

此外，除非上下文另外明确定义，否则本说明书中使用的单数的表达包括复数的表达。在本申请中，诸如“包括”和“包含”的术语不应被解释为本质上包括说明书中描述的若干个元素或若干个步骤中的全部，而应被宽泛地解释为可能不包括一些元素或步骤或者包括另外的元素或步骤。

此外，包括序数例如本说明书中的“第一”和“第二”的术语可用于描述各种元素，但是元素不应受限于这些术语。这些术语仅用于将一个元素与另一个元素区分开。例如，在不脱离本发明的范围的情况下，第一元素可以被命名为第二元素，并且同样地，第二元素可以被命名为第一元素。

在下文中，参照附图详细描述根据本发明的优选实施方式。不管附图标记如何，相同或相似的元素被分配相同的附图标记，并且省略其冗余描述。

在本发明的以下描述中，将省略对被认为使本发明的主旨模糊的已知功能和配置的详细描述。本发明的附图旨在便于理解本发明，而不应被解释为限于附图。

图1是示出根据本发明的实施方式的用于用户意图剖析的系统的视图。

参照图1，根据本发明的实施方式的用于用户意图剖析的系统包括：服务器110、在线站点120、物品数据库121、用户130和网络140。

根据本发明的实施方式的服务器110可以是用于通过在用户130访问在线站点120时实时考虑用户130的在线行为来基于网络140执行用户意图剖析的设备。

在此，服务器110可以分析用户130的连续行为以及与在线站点120中提供的多个物品有关的行为。也就是说，服务器110可以分析从用户130访问电子商务站点例如在线站点120到购买物品的连续行为的模式，并且可以考虑从分析结果中提取的购买意图或感兴趣物品来创建用户意图简档。

在此，用户的在线行为可以是用户对服务的连续使用，例如探索由在线站点120提供的各个页面、点击按钮等，并且与在线行为有关的物品或类别的特征可以被提取。

此外，根据本发明的服务器110涉及大数据的实时分析和估计。服务器110可以将剖析结果与基于对与在电子商务服务中检索物品信息或购买物品有关的服务的使用的行为日志的分析结果进行结合，并且可以由此将用户搜索物品的意图剖析为明确的关键词和数字。因此，本发明可以对应于用于增强个性化推荐、广告、搜索和营销的有效性的数据平台或数据科学。

具体地，在无缝流方法中，服务器110可以处理连续的过程，例如从在线站点120获取基于用户130的在线行为的实时日志，分析日志，预测搜索物品的意图，用户意图剖析等。此外，服务器110可以使用API实现对从用户意图简档产生的统计分析结果的立即传输。

在此，图1将服务器110和在线站点120示出为彼此分离，但是根据情况，服务器110和用于运行在线站点120的操作服务器可以是同一服务器。也就是说，用于提供营销管理数据的服务器110可以被包括在用于提供电子商务服务的在线站点120的操作服务器中。替选地，用于提供电子商务服务的在线站点120的操作服务器可以被包括在用于提供营销管理数据的服务器110中。

服务器110基于关于访问在线站点120的用户130的在线行为实时收集的日志来创建与连续行为相对应的行为数据。

这里，行为数据可以包括行为发生的时间、用户id、终端id、统一资源标识符(URI)、搜索词以及与物品有关的信息中的至少之一。

此外，服务器110基于行为数据来检测用户130的购买意图和感兴趣物品。

此外，服务器110考虑对应于感兴趣物品的关键词矢量与基于在线站点120中登记的多个物品而创建的物品模型之间的相似度来提取与用户有关的关键词排名信息。

在此，物品模型可以是基于针对多个物品中的相应物品创建的物品矢量而学习的。

此外，服务器110通过基于语素对关键词的分析来创建用于在线站点120中登记的各个物品的关键词集合，并且针对每个关键词集合中包括的多个关键词中的相应关键词创建多个关键词矢量。

在此，考虑多个关键词中的每个关键词的上下文来提取多个上下文关键词，将多个上下文关键词至多个关键词的关系表示为矢量值，并且基于矢量值执行学习使得平均对数概率达到最大，由此可以创建多个关键词矢量。

在此，当多个关键词中存在点间互信息(PMI)具有预设参考PMI值的关键词对时，将该对中的关键词组合成复合关键词，以便将其视为单个关键词。

此外，服务器110将用于每个关键词的权重应用于多个关键词矢量，并且计算应用了用于每个关键词的权重的多个关键词矢量的标量积之和，由此创建物品矢量。

在此，服务器110可以考虑物品信息中关键词的频率、关键词出现的物品的比例以及关键词出现的位置中的至少之一来计算用于每个关键词的权重。

此外，服务器110基于感兴趣物品、关键词排名信息以及购买意图中包括的购买概率中的至少之一来创建针对用户的用户意图简档。

在此，用户意图简档可以包括关于用户感兴趣的物品集群的信息，该物品集群是通过将对应于连续行为的行为模式的购买概率作为权重应用于感兴趣物品的物品矢量而创建的。

在此，服务器110可以通过将行为模式与针对在线站点120创建的购买概率模型进行比较来计算购买概率。

在线站点120可以是用户130访问以便使用电子商务服务的因特网站点。在此，用于运行在线站点120的操作服务器可以被包括在服务器110中，或者可以与服务器110分离。

物品数据库121可以是用于存储和管理关于在线站点120中登记的多个物品的信息的存储模块。

在此，物品数据库121可以基于网络140向服务器110提供关于多个物品的物品信息。

用户130可以是访问在线站点120并在使用电子商务服务期间执行各种动作的人。例如，用户130可以访问在线站点120并表现出各种在线行为，诸如搜索物品、查看物品的详细描述、将物品添加到购物车、为物品付款等。

在此，用户130可以通过使用用户终端例如移动终端、计算机等访问在线站点120来使用电子商务服务。

例如，用户终端是能够通过与通信网络的连接来运行根据本发明的应用的设备，并且可以是包括所有类型的信息通信设备、多媒体终端、内部协议(IP)终端等的各种类型的终端中的任意一种，而不限于移动通信终端。此外，用户终端可以是具有各种移动通信规范的移动终端，例如移动电话、便携式多媒体播放器(PMP)、移动互联网设备(MID)、智能电话、平板PC、膝上型计算机、上网本、个人数字助理(PDA)、信息通信设备等。

此外，用户终端可以接收各种类型的信息例如数字、字母等，并且可以经由输入单元向控制单元传送被输入以用于设置各种功能和控制用户终端的功能的信号。此外，用户终端的输入单元可以被配置成包括响应于用户的触摸或操纵来生成输入信号的键盘和触摸板中的至少之一。在此，用户终端的输入单元及其显示单元可以形成单个触摸面板(或触摸屏)，由此执行输入功能和显示功能两者。此外，用户终端的输入单元可以使用将来可能开发的所有类型的输入装置以及当前存在的输入装置例如键盘、小键盘、鼠标、操纵杆等。

此外，用户终端的显示单元可以显示关于在执行用户终端的功能时产生的一系列操作状态和操作结果的信息。此外，用户终端的显示单元可以显示用户终端的菜单和由用户输入的用户数据。在此，用户终端的显示单元可以被配置为液晶显示器(LCD)、薄膜晶体管LCD(TFT-LCD)、发光二极管(LED)、有机LED(OLED)、有源矩阵OLED(AMOLED)、视网膜显示器、柔性显示器、三维显示器等。在此，当用户终端的显示单元被配置为触摸屏形式时，用户终端的显示单元可以执行用户终端的输入单元的一些或全部功能。

此外，用户终端的存储单元可以包括主存储设备和辅助存储设备作为用于存储数据的设备，并且可以存储用于用户终端的操作所必需的应用。用户终端的存储单元可以包括程序区域和数据区域。在此，当用户终端响应于来自用户的请求而激活每个功能时，用户终端通过在控制单元的控制下运行相应的应用来提供该功能。具体地，根据本发明的用户终端的存储单元可以存储用于引导启动用户终端的操作系统(OS)、用于发送和接收被输入以用于使用电子商务服务的信息的应用等。此外，用户终端的存储单元可以存储关于用户终端的信息以及用于存储多条内容的内容数据库。在此，内容数据库可以包括用于执行内容的执行数据以及关于内容的属性信息，并且可以响应于内容的执行来存储内容使用信息。此外，关于用户终端的信息可以包括用户终端的规格。

此外，用户终端的通信单元可以用于通过网络140向在线站点120发送数据和从在线站点120接收数据。在此，用户终端的通信单元可以包括用于发送信号的频率的上变频和放大的RF发送介质以及用于接收信号的低噪声放大和接收信号的频率的下变频的RF接收介质。用户终端的这种通信单元可以包括无线通信模块。此外，无线通信模块是用于基于无线通信方法来发送或接收数据的部件，并且在用户终端使用无线通信的情况下可以使用无线网络通信模块、无线LAN通信模块以及无线PAN通信模块中的任意一个来向在线站点120发送数据和从在线站点120接收数据。也就是说，用户终端可以使用无线通信模块来访问网络140，并且可以通过网络140向在线站点120发送数据和从在线站点120接收数据。

此外，用户终端的控制单元可以是用于运行操作系统(OS)和各个部件的处理设备。例如，控制单元可以控制访问在线站点120的整个过程。当通过应用或因特网访问在线站点120时，控制单元可以响应于用户的请求来控制运行应用的整个过程，并且可以执行控制以便在应用执行时向在线站点120发送使用电子商务服务的请求。在此，控制单元可以执行控制，使得用于用户认证所需的关于用户终端的信息与请求一起被发送。

网络140可以提供信道，服务器110、在线站点120和用户130经由该信道在其间交换数据，并且网络140可以在概念上被理解为包括当前正在使用的网络和尚未开发的网络。例如，网络可以是以下中的任意一个或者从以下中选择的两个或更多个的组合：用于提供有限区域中的各种数据设备之间的通信的有线和无线局域网络、用于提供移动设备之间或移动设备与其外部之间的通信的移动通信网络；用于使用卫星提供地面站之间的通信的卫星网络；以及有线和无线通信网络。同时，用于网络的传输协议标准不限于现有的传输协议标准，而且可以包括将来开发的所有传输协议标准。

图2是示出根据本发明的实施方式的用于用户意图剖析的方法的流程图。

参照图2，在根据本发明的实施方式的用户意图剖析的方法中，在步骤S210处基于关于访问在线站点的用户的在线行为实时收集的日志来创建对应于连续行为的行为数据。

本发明用于针对访问在线站点的用户执行用户意图剖析。为此，本发明可以分析用户的连续行为以及与特定物品或类别有关的行为。也就是说，可以分析从用户初始访问在线站点到购买物品的连续在线行为。

在此，使用品牌、期望价格水平、表示物品特征的关键词等来剖析在搜索物品的连续行为中观察到的用户的购买意图以及关于感兴趣物品的信息。在此，与仅使用物品名称或物品的详细描述来检测搜索感兴趣物品的意图的传统方法不同，可以使用通过对物品名称、品牌名称、关于产品的详细信息、评论、Q&A、搜索关键词等执行语言处理和统计分析而提取的有意义的关键词来创建针对用户的用户意图简档。

在此，日志可以涉及正在访问在线站点的用户的在线行为。例如，日志可以表示明确的行为，例如点击物品；检查评论；添加到购物车或从购物车删除；进行支付；输入搜索词；点击广告、社交媒体活动例如喜欢或分享等。此外，日志可以包括可以推断出感兴趣物品的任何隐式行为，例如，与用户体验(UX)有关的行为，诸如滚动鼠标滚轮、滑出屏幕等；在某个页面上长时间停留；重新访问相同或类似物品或类别的页面等。在此，在线行为不限于这些示例。

在此，可以基于包括在日志中的URI信息来提取用户想要的搜索词、价格、可选信息等，并且针对每个用户对所提取的信息进行分类，由此可以创建具有标准化格式的行为数据。

在此，可以响应于从用户访问在线站点的时刻起用户的行为来立即实时收集日志。此外，日志可以以数据流的形式被收集，并且可以被预处理，以便被处理成适合于在创建用户意图简档时使用的数据格式。

在此，根据本发明的实施方式的用于用户意图剖析的方法可以如上所述地使用用户的实时在线行为。也就是说，与使用关于用户过去购买的记录或简档信息来确定预期要被用户购买的物品或购买概率的传统方法不同，本发明可以基于行为模式例如在用户正在访问的电子商务站点中用户正在访问的页面来推断在不久的将来很可能被购买的物品或包括这样的物品的类别。因为使用该方法来执行针对正在访问在线站点的用户的用户意图剖析，所以与使用传统方法时相比可以更准确地检测用户意图。

在此，用于收集日志的通道不限于特定通道。例如，可以通过各种通道例如移动网站、移动应用和桌面网站中的任意一个来实时收集与用户的在线行为相对应的日志。

此外，根据本发明的实施方式的服务器可以接收通过将所有日志聚合而统一的日志。替选地，服务器可以接收通过将在一些终端中生成的日志聚合而简化的日志。也就是说，收集日志的方法不限于特定方法。

在此，行为数据可以包括行为发生的时间、用户id、终端id、统一资源标识符(URI)、搜索词以及与物品有关的信息中的至少之一。在此，与物品有关的信息可以包括用于识别相应物品的物品编号或类别编号。此外，与物品有关的信息可以包括基于其可以确定在线行为的重要性的元数据，例如物品的价格、与物品有关的选项等。

在此，可以基于用户访问在线站点的时间来针对每个会话创建行为数据。

例如，将从用户登录到在线站点的时刻到用户从在线站点退出的时刻的时间段设置成单个会话，收集在单个会话期间观察到的在线行为的日志，并且可以由此创建行为数据。

在另一示例中，将从用户访问在线站点的时刻到用户离开在线站点的时刻的时间段设置成单个会话，并且可以创建针对该会话的行为数据。

在此，单个会话的开始和终止可以以不同的方式设置，并且不限于特定时间。

此外，在根据本发明的实施方式的用于用户意图剖析的方法中，在步骤S220处基于行为数据来检测用户的购买意图和感兴趣物品。

在此，购买意图可以包括与用户有关的购买概率。

在此，当确定用户的连续在线行为有意义时，购买概率可以增加。

此外，尽管未在图2中示出，但是还可以通过将行为模式与针对在线站点创建的购买概率模型进行比较来计算购买概率。

在此，购买概率模型可以是针对在线站点的购买概率模型。也就是说，从自相应在线站点收集的行为数据提取行为模式，分析在提取的行为模式下进行购买或不进行购买的频率，并且可以基于分析结果来创建购买概率模型。

例如，可以通过基于以下提取购买模式和非购买模式来创建购买概率模型：基于与在使用相应在线站点的多个用户进行购买时频繁观察到的连续行为有关的行为模式以及基于与在当多个用户不进行购买时频繁观察到的连续行为有关的行为模式。在此，当进行购买或不进行购买的次数小于某一数量时，该行为模式不被考虑，由此可以更快地处理用于创建购买概率模型的操作。

因此，将从被创建成对应于用户的行为数据提取的行为模式与购买概率模型中包括的购买模式或非购买模式进行比较，由此可以将用户是否将购买物品计算为概率。

此外，在根据本发明的实施方式的用于用户意图剖析的方法中，在步骤S230处考虑感兴趣物品的关键词矢量与基于在线站点中登记的多个物品而创建的物品模型之间的相似度来提取与用户相关的关键词排名信息。

在此，可以基于预先已经针对多个物品创建的多个关键词矢量来获取与感兴趣物品相对应的关键词矢量。

例如，根据本发明的实施方式的服务器可以通过获取关于在线站点中登记的多个物品的物品信息来创建多个关键词矢量，然后将所述多个关键词矢量存储在单独的数据库中。当检测到用户感兴趣的物品时，在多个物品中检索与用户感兴趣的物品相对应的物品，由此可以获取相应物品的关键词矢量。

下面将简要描述创建多个关键词矢量的过程。

首先，可以通过基于语素对关键词进行分析来创建用于相应多个商品的关键词集合。

例如，可以通过从物品数据库获取物品信息来分析语素，所述物品数据库存储与在线站点中登记的多个物品有关的物品信息。然后，可以基于对语素的分析结果的复合关键词处理和命名实体识别来提取较好地表示物品的关键词。

在此，可以基于与物品的唯一品牌名称、其型号名称、其大小、其颜色、其预期用途、其目的等相对应的各种信息来提取关键词。

这里，如果多个关键词中存在点间互信息(PMI)具有预设PMI值的关键词对，则将该对中的关键词组合成复合关键词，以便将其视为单个关键词。

例如，可以假设从关于物品A的物品信息中的语素的分析结果中提取到作为物品A的品牌名称的关键词B。然后，当使用词共现提取到关于关键词B具有统计意义的关键词C时，可以将组合了关键词B与关键词C的复合关键词视为关于物品A的单个关键词。

在此，通过对所有多个物品的物品信息中的语素的分析结果重复执行复合关键词处理，复合关键词可以被提取并且被包括在每个关键词集合中，其中每个复合关键词被配置成具有两个或更多个词。

然后，可以针对每个关键词集合中包括的相应多个关键词创建多个关键词矢量。

在此，关键词矢量可以是通过将基于上下文的词嵌入模型应用于特定关键词来表示的某一大小的语义矢量。也就是说，语义矢量是从用于表示物品的特性的多个关键词和所述关键词的上下文学习的特定大小的矢量，并且在矢量空间中可以是用关键词表示的物品的特性的数值表达式。

在此，考虑多个关键词中的每个关键词的上下文来提取多个上下文关键词，并且可以将多个上下文关键词至多个关键词的关系表示为矢量值。

例如，可以假设“OH自由基”、“空气净化器”、“细尘”、“消毒”等被提取为关键词是“空气净化器”的物品A的上下文关键词。类似地，可以假设“阴离子”、“空气净化器”、“三重过滤器”、“低功率”、“细尘”等被提取为关键词是“空气净化器”的物品B的上下文关键词。在此，可以通过在矢量空间中对从物品A和物品B提取的上下文关键词进行数值学习来将关键词“空气净化器”表示为特定矢量值，根据该特定矢量值得出空气净化器的含义。

在此，基于矢量值执行学习使得平均对数概率达到最大，由此可以创建多个关键词矢量。

例如，用于关键词K的关键词矢量可以是被执行使得关键词K对于其所有上下文关键词的平均对数概率最大化的学习的结果，并且可以使用下式(1)来计算：

在此，物品模型可以是基于被创建成对应于多个物品的物品矢量而学习的。

在此，物品矢量可以是使用与物品相对应的关键词集合以及基于该关键词集合中包括的多个关键词而创建的关键词矢量表示的物品的唯一特征矢量。

在此，将用于每个关键词的权重应用于多个关键词矢量，并且计算应用了用于每个关键词的权重的多个关键词矢量的标量积之和，由此可以创建物品矢量。

例如，可以如式(2)所示地将物品矢量Pi计算为用于物品的权重λ_ij与关键词矢量K_ij的标量积之和，其中所述权重λ_ij被分配给从物品信息提取的m个关键词中的每个关键词。

在此，物品矢量的维度可以与关键词矢量的维度相同。

在此，可以考虑物品信息中关键词的频率、关键词出现的物品的比例以及关键词出现的位置中的至少之一来计算用于每个关键词的权重。

例如，当物品信息中关键词的频率是tf，关键词出现的物品的比例是idf，取决于关键词出现的位置的权重是α以及登记在物品数据库中的多个物品的数量是|P|时，可以如式(3)所示地计算用于每个关键词的权重λ_ij。

其中P_j表示多个物品中的包括第j个关键词的物品的数量。

在此，根据物品矢量的质量，可以调整式(3)的权重模型。

在此，物品模型可以是以规则的间隔针对物品数据库中登记的多个物品的物品矢量学习的。

在此，物品矢量的大小可以与关键词矢量的大小相同。当实时执行用户意图剖析时，可以考虑可用存储器以及并行分布式处理的效率来设置关键词矢量和物品矢量的大小。

此外，在根据本发明的实施方式的用于用户意图剖析的方法中，在步骤S240处基于感兴趣物品、关键词排名信息以及购买意图中包括的购买概率中的至少之一来创建针对用户的用户意图简档。

也就是说，用户意图简档可以包括用户感兴趣的物品的简档和用户感兴趣的关键词的简档。

在此，还可以通过将行为模式的购买概率应用为权重来计算用户期望的价格范围和首选品牌的简档。

例如，可以通过在基于行为数据而检测到的当前期望价格范围与基于最低价格、平均价格和最高价格中的至少之一而初始化的价格范围值之间的线性插值来重新调整价格范围。

在另一示例中，将从其中检测到用户感兴趣的每个物品的行为模式的购买概率作为权重应用于相应物品的价格信息，由此可以估算价格范围。

此外，在首选品牌的情况下，将从其中检测到感兴趣物品的行为模式的购买概率作为权重应用于相应物品的品牌，由此可以计算对该品牌感兴趣的程度。

也就是说，在根据本发明的实施方式的用于用户意图剖析的方法中，计算物品模型与通过将购买概率作为权重应用于感兴趣物品的物品矢量而获得的矢量值之间的相似度，并且将具有高相似度的关键词根据其排名包括在用户意图简档中，由此可以提供关于用户感兴趣的关键词的信息。

替选地，在根据本发明的实施方式的用于用户意图剖析的方法中，针对在线站点中登记的多个物品中的每个物品提取N个关键词，并且将购买物品的概率作为权重应用于相应应物品的提取的关键词，由此可以创建针对每个物品的关键词排名信息。然后，通过将基于用户的行为数据提取的购买感兴趣物品的概率与感兴趣物品的关键词的相似度相乘来计算对每个关键词的感兴趣程度，并且对所计算的感兴趣程度进行排序，由此可以创建关键词排名信息。

在此，对物品的感兴趣程度即用户的购买意图可能随着时间而减小。此外，当已经购买了感兴趣物品时，可以确定失去了对相应物品的兴趣。

因此，在实时执行用户意图剖析时，在特定会话期间未针对其进行与购买有关的搜索活动的物品服从具有某一时间常数的指数衰减函数的应用，由此可以逐渐减小作为要应用于物品矢量的权重的购买概率。

此外，当已经购买了特定物品时，可以在将最终应用于该物品的购买概率设置为零之后执行用户意图剖析。

如上所述，用户意图剖析用于结构化和表示与用户正在在线站点中搜索的物品的特征有关的信息，并且关键特征信息可以在物品的类别、其品牌、其价格、其型号名称、与物品的主要属性和功能有关的关键词以及表示关于物品的附加信息的关键词中示出。在此，类别、品牌和价格可以使用预定义的关键词或代码，并且物品的主要属性或功能可以以不同的类型来表示，即使它们具有相同的含义也是如此。

此外，本发明将在物品搜索意图中观察到的用户首选的物品特性表示为关键词。在此，不是使用用于描述物品信息的词，即不是使用关键词本身，而是可以基于统计的词共现来提取一起使用的连续词作为单个复合关键词。此外，可以将在提取的关键词周围出现的各种上下文关键词编码到固定维度的矢量空间中，并且可以使用编码结果来执行用户意图剖析。

此外，根据本发明的实施方式创建的关键词矢量可以有效地表示用户的物品搜索意图，这是因为该关键词矢量全面地反映了与物品有关的关键词的语义特征，并且因为该关键词矢量善于将具有相似含义但以不同类型表示的关键词进行组合。

特别地，在使用本体对关键词进行规范化的传统方法中，可能存在诸如由于本体构造产生的开销、取决于本体的规模的表达程度等问题。然而，当使用根据本发明的关键词嵌入时，因为可以自动执行对具有相似含义的关键词的聚类、对有代表性的关键词的选择等，所以成本效率可以预期。此外，因为通过矢量运算来执行相似度的测量以及关键词排名，所以当针对大量物品和用户提供实时服务时，可以有效地使用并行与分布式处理环境。

此外，因为物品模型和用户的物品搜索意图使用关键词嵌入矢量作为其间介质来表示，所以可以使用矢量运算来执行提取用于表示物品的特征的关键词、对用户感兴趣的关键词进行排名等，并且可以使用矢量相似度操作来有效地检索相似物品、相似用户、物品和用户之间的关系、与由某一关键词表示的特征相关联的物品或用户等。

此外，虽然在图2中未示出，但是在根据本发明的实施方式的用于用户意图剖析的方法中，可以通过通信网络来发送和接收用于用户意图剖析所需的信息。特别地，可以从用于运行在线站点的特殊操作服务器接收关于用户的在线行为的数据或者关于在线站点中登记的多个物品的物品信息。

此外，虽然在图2中未示出，但是在根据本发明的实施方式的用于用户意图剖析的方法中，可以将在上述用户意图剖析过程期间生成的各种信息存储在单独的存储模块中。

通过上述用户意图剖析方法，可以实时分析使用电子商务的用户的意图，并且可以将分析结果提供为数据。

此外，可以使用明确的关键词和数字剖析对用户使用电子商务服务时生成的行为日志和用户的物品搜索意图的分析，以便用于增强个性化推荐、广告、搜索和营销的有效性。

此外，可以提供一种用于在存在大量用户和大量物品时实时有效地处理与购买有关的用户搜索意图的方法。

此外，可以有效地结构化和表示与用户正在搜索的物品或产品的特征有关的信息。

此外，自动执行对具有相似含义的关键词的聚类、对代表性的关键词的选择等，由此可以实现成本效率。

此外，可以有效地检索相似产品、相似用户、产品与用户之间的关系、与由某一关键词表示的特征相关联的产品或用户等。

此外，可以改进对用户剖析的实时支持以及在并行分布式环境中对其结果的使用。

图3是示出根据本发明的用户意图剖析方法中的创建关键词矢量的过程的示例的流程图。

参照图3，在根据本发明的用户意图剖析方法中的创建关键词矢量的过程中，首先，在步骤S310处通过基于语素对关键词进行分析来创建用于相应多个物品的关键词集合。

在此，如果多个关键词中存在点间互信息(PMI)具有预设PMI值的关键词对，则将该对中的关键词组合成复合关键词，以便将其视为单个关键词。

然后，在步骤S320处可以考虑包括在关键词集合中的多个关键词中的每个关键词的上下文来提取多个上下文关键词，并且在步骤S330处，可以将多个上下文关键词与多个关键词的关系表示为矢量值。

然后，在步骤S340处基于矢量值执行学习使得平均对数概率达到最大，由此可以创建多个关键词矢量。

图4是示出根据本发明的用户意图剖析方法中的创建和学习物品模型的过程的示例的流程图。

参照图4，在根据本发明的用户意图剖析方法中的创建和学习物品模型的过程中，首先，在步骤S410处，可以将用于每个关键词的权重应用于多个关键词矢量中的每个关键词矢量。

例如，可以如式(2)所示地将物品矢量P_i计算为用于物品的权重λ_ij与关键词矢量K_ij的标量积之和，其中所述权重λ_ij被分配给从物品信息提取的m个关键词中的每个关键词。

在此，物品矢量的维度可以与关键词矢量的维度相同。

然后，在步骤S420处计算应用了用于每个关键词的权重的多个关键词矢量的标量积之和，由此可以创建针对相应多个物品的物品矢量。

在此，可以鉴于物品信息中关键词的频率、出现关键词的物品的比例以及关键词出现的位置中的至少之一来计算用于每个关键词的权重。

例如，当物品信息中的关键词的频率是tf，出现关键词的物品的比例是idf，取决于关键词出现的位置的权重是α以及登记在物品数据库中的多个物品的数量是|P|时，可以如式(3)所示的计算用于每个关键词的权重λ_ij。

其中P_j表示多个物品中的包括第j个关键词的物品的数量。

然后，在步骤S430处可以通过基于用于相应多个物品的物品矢量执行学习来创建物品模型。

图5是示出根据本发明的用户意图剖析过程的示例的视图。

参照图5，在根据本发明的用户意图剖析过程中，首先，在步骤S502处可以基于与存储在物品数据库500中的多个物品有关的物品信息来分析关键词。

在此，可以通过基于语素对关键词进行分析来创建用于相应多个物品的关键词集合。

然后，在步骤S504处可以基于关键词集合来创建关键词矢量，其中每个关键字集合是通过关键词分析针对多个物品中的每个物品创建的。

在此，考虑每个关键词集合中包括的多个关键词中的每个关键词的上下文来提取多个上下文关键词，将多个上下文关键词至多个关键词的关系表示为矢量值，并且基于所述矢量值执行学习使得平均对数概率达到最大，由此可以创建多个关键词矢量。

然后，在步骤S505处基于关键词矢量来针对相应多个物品创建物品矢量，并且在步骤S506处可以通过基于物品矢量执行学习来创建物品模型。

然后，当在步骤S508处基于服务通道511、512和513收集了关于用户的在线行为的日志时，在步骤S510和S514处可以使用基于日志而创建的行为数据来检测用户的购买意图和感兴趣物品。

在此，在步骤S512处可以基于用户的购买意图来计算购买概率，并且在步骤S516处可以获取感兴趣物品的关键词矢量。

在此，可以通过基于与在使用相应在线站点的多个用户进行购买时频繁观察到的连续行为有关的行为模式并且基于与在所述多个用户不进行购买时频繁观察到的连续行为有关的行为模式提取购买模式和非购买模式来创建购买概率模型。

然后，基于感兴趣物品的关键词矢量与物品模型中的每个物品模型之间的相似度来创建与用户有关的关键词排名信息，并且在步骤S518处可以鉴于关键词排名信息、感兴趣物品、购买概率等来创建用户意图简档。

图6和图7是示出根据本发明的基于词嵌入的关键词矢量的创建的示例的视图；

参照图6和图7，为了创建根据本发明的关键词矢量，可以如图6所示地首先提取多个关键词的多个上下文关键词。

例如，如图6所示，可以从以“空气净化器”作为其关键词的物品A提取“OH自由基”、“空气净化器”、“细尘”、“消毒”等作为上下文关键词。类似地，可以从以“空气净化器”作为其关键词的物品B提取“阴离子”、“空气净化器”、“三重过滤器”、“低功率”、“细尘”等作为上下文关键词。

在此，如图7所示，可以通过在矢量空间中对从物品A和物品B提取的上下文关键词进行数值学习将关键词“空气净化器”表示为关键词矢量700，根据该关键词矢量700得出空气净化器的含义。

图8和图9是示出根据本发明的创建用户意图简档的过程的视图；

参照图8和图9，为了创建根据本发明的用户意图简档，首先可以通过图8所示的过程来创建物品模型。

例如，创建物品模型的过程如下。

首先，可以从图8所示的物品数据库获取关于在线站点中登记的多个物品的物品信息。然后，使用关键词分析器分析关键词，由此可以创建用于相应多个物品的关键词集合。

然后，可以通过基于关键词集合中包括的多个关键词执行基于上下文的词嵌入来针对各个关键词创建图8所示的关键词矢量810。也就是说，考虑多个关键词中的每个关键词的上下文来提取多个上下文关键词，将多个上下文关键词至多个关键词的关系表示为矢量值，并且基于该矢量值执行学习使得平均对数概率达到最大，由此可以创建多个关键词矢量。

然后，将用于每个关键词的权重应用于多个关键词矢量，并且计算应用了用于每个关键词的权重的多个关键词矢量的标量积之和，由此可以创建图8中所示的物品矢量820。

然后，计算关键词矢量与物品矢量之间的相似度，并且将具有高相似度的关键词排名在前K，由此可以如图8所示地创建物品模型830。

然后，如图9所示，可以使用物品模型830创建用户意图简档。

例如，创建用户意图简档的过程如下。

首先，使用根据本发明的实施方式的用户意图剖析器930，可以基于关于用户的在线行为而收集的日志910来计算基于用户的购买意图的购买概率。

在此，可以根据提取的行为模式来计算购买概率，所述行为模式对应于基于日志而创建的行为数据中的URI模式。

然后，基于URI模式中的每个URI模式即行为模式来检测用户感兴趣的物品，并且基于感兴趣物品的品牌、价格、关键词等来对关于感兴趣物品的信息进行剖析，由此可以创建如图9所示的感兴趣物品的简档940。

在此，感兴趣物品的简档940可以包括对每个感兴趣物品的感兴趣程度。

此外，使用根据本发明的实施方式的用户意图剖析器930，可以基于物品模型830和感兴趣物品的关键词矢量来创建与用户有关的关键词排名信息950。

在此，可以通过将感兴趣物品的购买概率和物品模型830与感兴趣物品的关键词矢量之间的相似度来计算对每个关键词的感兴趣程度。然后，对感兴趣程度进行排序，由此可以创建关键词排名信息950。

参照图10，根据本发明实施方式的用于执行用户意图剖析的服务器包括通信单元1010、存储器1020、处理器1030以及存储单元1040。

通信单元1010用于使用通信网络发送和接收用于用户意图剖析所需的信息。特别地，根据本发明的通信单元1010可以从用于运行在线站点的单独的操作服务器接收关于用户的在线行为的数据以及关于在线站点中登记的多个物品的物品信息。

存储器1020存储关于访问在线站点的用户的在线行为实时收集的日志以及基于在线站点中登记的多个物品而创建的物品模型。

处理器1030基于关于访问在线站点的用户的在线行为实时收集的日志来创建与连续行为相对应的行为数据。

本发明用于针对访问在线站点的用户执行用户意图剖析。为此，本发明可以分析用户的连续行为以及与某一物品或类别有关的行为。也就是说，可以分析从用户访问在线站点到购买物品的连续在线行为。

在此，日志可以涉及正在访问在线站点的用户的在线行为。例如，日志可以表示明确的行为，例如点击物品；检查评论；添加到购物车或从购物车中删除；进行支付；输入搜索词；点击广告、社交媒体活动例如喜欢或分享等。此外，日志可以包括可以推断出感兴趣物品的任何隐式行为，例如，与用户体验(UX)有关的行为，诸如滚动鼠标滚轮、滑出屏幕等；在某个页面上长时间停留；重新访问相同或类似物品或类别的页面等。在此，在线行为不限于这些示例。

在此，可以基于包括在日志中的URI信息来提取包括用户的意图的搜索词、价格、可选信息等，并且针对每个用户对所提取的信息进行分类，由此可以创建具有标准化格式的行为数据。

在此，可以响应于从用户访问在线站点的时刻起用户的行为来立即实时收集日志。此外，日志可以以数据流的形式被收集，并且可以被预处理，以便被处理成适合于创建用户意图简档时使用的数据格式。

在此，根据本发明的实施方式的用户意图剖析方法可以如上所述地使用用户的实时在线行为。也就是说，与使用关于用户过去购买的记录或简档信息来确定预期要被用户购买的物品或购买概率的传统方法不同，本发明可以基于行为模式例如在用户正在访问的电子商务站点中用户正在访问的页面来推断在不久的将来很可能被购买的物品或包括这样的物品的类别。因为使用该方法来执行用于正在访问在线站点的用户的用户意图剖析，所以与使用传统方法时相比可以更准确地检测用户意图。

此外，根据本发明的实施方式的服务器可以接收通过将所有日志聚合而统一的日志或者通过将在一些终端中生成的日志聚合而简化的日志。也就是说，收集日志的方法不限于任何特定方法。

在此，行为数据可以包括行为发生的时间、用户id、终端id、URI、搜索词以及与物品有关的信息中的至少之一。在此，与物品有关的信息可以包括用于识别相应物品的物品编号或类别编号。此外，与物品有关的信息可以包括基于其可以确定在线行为的重要性的元数据，例如物品的价格、与物品有关的选项等。

例如，将从用户登录到在线站点的时刻到用户从在线站点退出的时刻的时间段被设置成单个会话，收集在单个会话期间观察到的在线行为的日志，并且可以由此创建行为数据。

此外，处理器1030基于行为数据来检测用户的购买意图和感兴趣物品。

在此，购买意图可以包括与用户有关的购买概率。

此外，还可以通过将行为模式与针对在线站点创建的购买概率模型进行比较来计算购买概率。

例如，可以通过基于以下提取购买模式和非购买模式来创建购买概率模型：基于与在使用相应在线站点的多个用户进行购买时频繁观察到的连续行为有关的行为模式以及基于于在多个用户不进行购买时与频繁观察到的连续行为有关的行为模式。在此，当进行购买或不进行购买的次数小于某一数量时，该行为模式不被考虑，由此可以更快地处理用于创建购买概率模型的操作。

此外，处理器1030考虑感兴趣物品的关键词矢量与基于在线站点中登记的多个物品而创建的物品模型中的每个物品模型之间的相似度来提取与用户有关的关键词排名信息。

例如，根据本发明的实施方式的服务器可以通过获取关于在线站点中登记的多个物品的物品信息来创建多个关键词矢量，然后将所述多个关键词矢量存储在单独的数据库中。当检测到用户感兴趣的物品时，在多个物品中检索相应的物品，由此可以获取相应物品的关键词矢量。

下面将简要描述创建多个关键词矢量的过程。

首先，可以通过基于语素对关键词进行分析来创建用于相应多个物品的关键词集合。

在此，如果多个关键词中存在PMI具有预设PMI值的关键词对，则将该对中的关键词组合成复合关键词，以便将其视为单个关键词。

在此，通过对所有多个物品的物品信息中的语素的分析结果重复执行复合关键词处理，有意义的复合关键词可以被提取并且被包括在每个关键词集合中，其中每个复合关键词被配置成具有两个或更多个单词。

然后，可以针对每个关键词集合中包括的各个关键词创建多个关键词矢量。

例如，可以假设“OH自由基”、“空气净化器”、“细尘”、“消毒”等被提取为关键词是“空气净化器”的物品A的上下文关键词。类似地，可以假设“阴离子”、“空气净化器”、“三重过滤器”、“低功率”、“细尘”等被提取为关键词是“空气净化器”的物品B的上下文关键词。在此，通过在矢量空间中对从物品A和物品B提取的上下文关键词进行数值学习，可以将关键词“空气净化器”表示为特定矢量值，根据该特定矢量值得出空气净化器的含义。

在此，物品模型可以是基于被创建成对应于多个产品的产品矢量而学习的。

在此，物品矢量的维度可以与关键词矢量的维度相同。

其中P_j表示多个物品中的包括第j个关键词的物品的数量。

在此，根据物品矢量的质量，可以调整式(3)的权重模型。

此外，处理器1030基于感兴趣物品、关键词排名信息以及购买意图中包括的购买概率中的至少之一来创建针对用户的用户意图简档。

也就是说，用户意图简档可以包括用户感兴趣的物品的简档以及用户感兴趣的关键词的简档。

也就是说，根据本发明的实施方式的服务器计算物品模型与通过将购买概率作为权重应用于感兴趣物品的物品矢量而获得的矢量值之间的相似度，并且将具有高相似度的关键词根据其排名包括在用户意图简档中，由此提供关于用户感兴趣的关键词的信息。

替选地，根据本发明的实施方式的服务器针对在线站点中登记的多个物品中的每个物品提取N个关键词，并且将购买物品的概率作为权重应用于针对相应物品提取的关键词，由此创建针对每个物品的关键词排名信息。然后，通过将基于用户的行为数据提取的购买感兴趣物品的概率与感兴趣物品的关键词的相似度相乘来计算对每个关键词的感兴趣程度，并且对所计算的感兴趣程度进行排序，由此可以创建关键词排名信息。

此外，当已经购买了特定物品时，可以在将最终应用于物品的购买概率设置为零之后执行用户意图剖析。

此外，本发明将在物品搜索意图中观察到的用户首选的物品特性表示为关键词。在此，不是使用用于描述物品信息的词，即不是使用关键词本身，而是可以基于统计的词共现来提取与其一起使用的连续词并将其用作单个复合关键词。此外，在提取的关键词周围出现的各种上下文关键词被编码到固定维度的矢量空间中，并且可以使用编码结果来执行用户意图剖析。

特别地，在使用本体对关键词进行规范化的传统方法中，可能存在诸如由于本体构造产生的开销、取决于本体的规模的表达程度等问题。然而，当使用根据本发明的关键词嵌入时，因为可以自动执行对具有相似含义的关键词的聚类、对代表性的关键词的选择等，所以成本效率可以预期。此外，因为通过矢量运算来执行相似度的测量以及关键词排名，所以当针对大量物品和用户提供实时服务时，可以有效地使用并行与分布式处理环境。

此外，因为物品模型和用户的物品搜索意图使用关键词嵌入矢量作为其间介质来表示，所以可以使用矢量运算来执行提取用于表示物品的特征的关键词、对用户感兴趣的关键词进行排名等，并且可以使用矢量相似度操作有效地检索相似物品、相似用户、物品与用户之间的关系、与由某一关键词表示的特征相关联的物品或用户等。

存储单元1040可以支持如上所述的根据本发明实施方式的用于用户意图剖析的功能。在此，存储单元1040可以作为单独的大容量存储器操作，并且可以包括用于执行操作的控制功能。

同时，服务器可以将信息存储在服务器中安装的存储器中。在一个实施方式中，存储器是计算机可读记录介质。在一个实施方式中，存储器可以是易失性存储器单元，并且在另一个实施方式中，存储器可以是非易失性存储器单元。在一个实施方式中，存储设备是计算机可读记录介质。在不同的实施方式中，存储设备可以包括例如硬盘设备、光盘设备或任何其他种类的大容量存储器。

使用上述服务器，可以实时分析使用电子商务的用户的意图并且可以将分析结果提供为数据。

此外，可以使用明确的关键词和数字剖析对用户使用电子商务服务时生成的行为日志以及用户的物品搜索意图的分析，以便用于增强个性化推荐、广告、搜索和营销的有效性。

此外，可以提供用于在存在大量用户和大量物品时实时有效地处理与购买有关的用户搜索意图的方法。

本文描述的主题的功能操作和实现可以被实现为数字电子电路，或者可以以计算机软件、固件、硬件来实现，包括本文公开的结构及其结构等同物或其一个或更多个组合。本文描述的主题的实现可以以一个或更多个计算机程序产品来实现，换言之，以在有形程序存储介质上编码的计算机程序指令的一个或更多个模块中来实现，以便控制处理系统的操作或要由处理系统执行。

计算机可读介质可以是机器可读存储设备、机器可读存储基板、存储器设备、影响机器可读无线电波类型信号的材料合成物或者其一个或更多个组合。

如本文所使用的，术语“系统”或“设备”包括用于处理数据的所有种类的装置、设备和机器，包括例如可编程处理器、计算机或者多个处理器和计算机。除了硬件之外，处理系统还可以包括例如配置处理器固件的代码以及响应于来自协议栈、数据库管理系统、操作系统或者其一个或更多个组合的请求而配置计算机程序的执行环境的代码。

计算机程序(也称为程序、软件、软件应用、脚本或代码)可以以包括编译或解释语言或者先验或过程语言的任何形式的编程语言来编写，并且可以以任何形式来部署，包括独立的程序或模块、部件、子例程或适合于在计算机环境中使用的其他单元。计算机程序不一定对应于文件系统中的文件。程序可以存储在向所请求的程序提供的单个文件中，在多个交互式文件(例如，存储有一个或更多个模块、子程序或部分代码的文件)中、或者在包含其他程序或数据的文件的一部分(例如，在标记语言文档中存储的一个或更多个脚本)中。计算机程序可以位于单个站点上或分布在多个站点上，使得计算机程序被部署为在通过通信网络互连的多个计算机上或在单个计算机上运行。

适于存储计算机程序指令和数据的计算机可读介质可以包括例如半导体存储器设备例如EPROM、EEPROM和闪存设备；所有类型的非易失性存储器，包括磁盘例如内部硬盘或外部磁盘、磁光盘、CD-ROM和DVD-ROM、介质和存储设备。处理器和存储器可以由专用逻辑电路补充，或者可以与其集成。

本文所述的主题的实现可以在运算系统上实现，所述运算系统例如包括：后端部件，如数据服务器、中间件部件如应用服务器；前端部件，如客户端计算机，该客户端计算机具有用户通过其可以与本文所述的主题的实现进行交互的图形用户界面或网站浏览器；或者后端部件、中间件部件和前端部件中的一个或更多个组合。系统的部件可以使用任何形式或介质的数字数据通信例如通信网络进行互连。

虽然本发明包括许多具体的实现细节，但是它们不应该被解释为限制本发明的范围或权利要求的范围，而应该被理解为对可以特定于本发明的特定实施方式的特征的描述。类似地，本文在各个实施方式的上下文中所描述的具体特征可以通过组合在单个实施方式中实现。替选地，在单个实施方式的上下文中所描述的各种特征也可以单独地或以任何组合的子组合在多个实施方式中实现。此外，尽管这些特征可以被描述为以特定组合操作并且最初如此声明，但是在某些情况下可以从组合中排除来自所要求保护的组合的一个或更多个特征，或者可以将所要求保护的组合改变为子组合或其变型。

此外，尽管本说明书在附图中以特定顺序示出了操作，但是不应该理解为：为了获得期望的结果，这些操作必须以附图中所示的特定顺序或序列顺序执行，或者全部所示的操作都应该被执行。在某些情况下，多任务和并行处理可能是有利的。此外，上述实施方式的各种系统部件的分离不应被理解为在所有实施方式中都需要这样的分离，并且应当理解，上述程序部件和系统通常可以被集成到单个软件产品中或打包到多个软件产品中。

根据本发明，基于关于访问在线站点的用户的在线行为实时收集的日志来创建与连续行为相对应的行为数据，基于行为数据来检测用户的购买意图和感兴趣物品，考虑感兴趣物品的关键词矢量与基于在线站点中登记的多个物品而创建的物品模型之间的相似度来提取与用户有关的关键词排名信息，以及可以基于感兴趣物品、关键词排名信息和购买意图中包括的购买概率中的至少之一来创建与用户相对应的用户意图简档。此外，根据本发明，顾客的搜索意图被有效地实时处理，由此卖方或供应商有效地提供针对个人顾客的个性化的广告、促销、优惠券等，并且可以增加电子商务中的交易量。

根据本发明，使用电子商务的用户的意图可以被实时分析并且被提供为数据。

此外，本发明可以分析用户使用电子商务服务时生成的行为日志，并且可以使用明确的关键词和数字来剖析用户搜索物品的意图，以便用于提高个性化推荐、广告、搜索和营销的有效性。

此外，本发明可以提供用于在存在大量用户和大量物品时实时有效地处理与购买有关的用户搜索意图的方法。

此外，本发明可以有效地结构化和表示用户正在搜索的物品或产品的特征信息。

此外，本发明可以自动执行对具有相似含义的关键词的聚类、对代表性的关键词的选择等，由此实现成本效率。

此外，本发明可以有效地搜索相似产品、相似用户、产品与用户之间的关系、与由某一关键词表示的特征相关联的产品或用户等。

此外，本发明可以改进对用户剖析的实时支持以及在并行分布式环境中对其结果的使用。

本说明书不旨在将本发明限制于本文公开的具体术语。因此，尽管已经参照上述示例详细描述了本发明，但是本领域技术人员可以在不脱离本发明的范围的情况下构想这些示例的替换、修改和变型。本发明的范围由所附权利要求书限定而不是由说明书限定，并且应当理解，从所附权利要求书及其等同物的含义和范围导出的所有替换和修改都包括在本发明的范围内。

Claims

1.一种用于用户意图剖析的方法，所述方法包括：

基于关于访问在线站点的用户的在线行为实时收集的日志来创建与连续行为相对应的行为数据；

基于所述行为数据来检测所述用户的购买意图和感兴趣物品；

获取与所述感兴趣物品相对应的关键词矢量，并且考虑所述关键词矢量与基于所述在线站点中登记的多个物品而创建的物品模型之间的相似度来提取与所述用户有关的关键词排名信息；以及

基于所述感兴趣物品、所述关键词排名信息以及所述购买意图中包括的购买概率中的至少之一来创建针对所述用户的用户意图简档。

2.根据权利要求1所述的方法，其中，所述物品模型是基于被创建成与相应多个物品相对应的物品矢量而学习的。

3.根据权利要求2所述的方法，还包括：

通过基于语素对关键词进行分析来创建用于所述相应多个物品的关键词集合；

针对所述关键词集合中的每个关键词集合所包含的多个关键词创建多个关键词矢量；以及

将用于每个关键词的权重应用于所述多个关键词矢量，并且计算应用了所述用于每个关键词的权重的所述多个关键词矢量的标量积之和，由此创建所述物品矢量。

4.根据权利要求3所述的方法，其中，创建所述多个关键词矢量被配置成考虑所述多个关键词中的每个关键词的上下文来提取多个上下文关键词以将所述多个上下文关键词至所述多个关键词的关系表示为矢量值，并且基于所述矢量值执行学习使得平均对数概率达到最大，由此创建所述多个关键词矢量。

5.根据权利要求3所述的方法，其中，创建所述关键词集合被配置成使得当所述多个关键词中存在具有预设参考点间互信息(PMI)值的关键词对时，将与所述关键词对相对应的关键词组合成单个复合关键词，以便将其视为单个关键词。

6.根据权利要求3所述的方法，还包括：

考虑物品信息中所述关键词的频率、所述关键词出现的物品的比例以及所述关键词出现的位置中的至少之一来计算所述用于每个关键词的权重。

7.根据权利要求1所述的方法，其中，所述行为数据包括行为发生的时间、用户id、终端id、统一资源标识符(URI)、搜索词以及与物品有关的信息中的至少之一。

8.根据权利要求2所述的方法，其中，所述用户意图简档包括关于所述用户感兴趣的物品集群的信息，所述物品集群是通过将对应于所述连续行为的行为模式的购买概率作为权重应用于与所述感兴趣物品相对应的所述物品矢量而创建的。

9.根据权利要求8所述的方法，还包括：

通过将所述行为模式与针对所述在线站点创建的购买概率模型进行比较来计算所述购买概率。

10.一种服务器，所述服务器包括：

存储器，用于存储关于访问在线站点的用户的在线行为实时收集的日志以及基于所述在线站点中登记的多个物品而创建的物品模型；以及

处理器，用于使用基于所述日志而被创建成与连续行为相对应的行为数据来检测所述用户的购买意图和感兴趣物品，考虑对应于所述感兴趣物品的关键词矢量与所述物品模型之间的相似度来提取与所述用户有关的关键词排名信息，以及基于所述感兴趣物品、所述关键词排名信息以及所述购买意图中包括的购买概率中的至少之一来创建与所述用户相对应的用户意图简档。