CN102262652A - 定义用户意图 - Google Patents

定义用户意图 Download PDF

Info

Publication number
CN102262652A
CN102262652A CN2011101522081A CN201110152208A CN102262652A CN 102262652 A CN102262652 A CN 102262652A CN 2011101522081 A CN2011101522081 A CN 2011101522081A CN 201110152208 A CN201110152208 A CN 201110152208A CN 102262652 A CN102262652 A CN 102262652A
Authority
CN
China
Prior art keywords
user
theme
expression
computer
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2011101522081A
Other languages
English (en)
Other versions
CN102262652B (zh
Inventor
D·沈
M·叶里扎罗夫
Y·李
V·利博斯基
T·B·马
I·帕尔萨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Technology Licensing LLC
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of CN102262652A publication Critical patent/CN102262652A/zh
Application granted granted Critical
Publication of CN102262652B publication Critical patent/CN102262652B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0255Targeted advertisements based on user history
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0255Targeted advertisements based on user history
    • G06Q30/0256User search

Landscapes

  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

揭示了定义用户意图。提供了用于定义用户意图使得能够确定用户意图并基于该用户的意图向用户提供广告和其他信息的方法和计算机可读介质。标识主题表达并将该主题表达与属性和动作相关联。动作指示能被执行以完成与主题表达相关联的任务的步骤。接着生成意图结构。意图结构指示被标识的主题表达与其他主题表达之间的关系。接着接收用户数据并将该用户数据映射到意图结构以确定当前和将来的用户意图。

Description

定义用户意图
技术领域
本申请涉及定义用户意图。
背景技术
传统地,广告和其它信息源基于用户的当前行为被标识为与用户相关(用户的当前行为包括搜索查询以及页视图),而不考虑用户在更丰富的上下文中的意图。该方法很少为用户提供相关信息,因为该方法无法考虑除了用户的当前行为之外的用户信息的其它源。例如,当用户在搜索页上提交一查询时,在大多数情况下,很难根据单个查询来确定用户的真实需求或意图。例如,对“芝加哥”的查询具有多个意思,包括城市、乐队和电影。即使知道用户指的是城市,用户的真实意图仍然未知。例如,用户可能想要去芝加哥旅行、搬到芝加哥、寻找有关芝加哥的当前天气情况,可能仅仅需要芝加哥的总体信息,等等。
进一步,用户将来的意图通常不能仅通过分析用户的当前行为来确定。作为一个附加示例,对“相机”的搜索查询可代表用户具有的与相机有关的多种意图,诸如购买、销售、阅读评论、维修、等等。仅根据对“相机”的搜索查询来提供搜索结果会带来令人沮丧的用户体验,因为在不多知道一点用户意图的情况下,用户时常没有被导向相关信息。
发明内容
提供本发明内容是为了以简化的形式介绍将在以下具体实施方式中进一步描述的一些概念。本发明内容不旨在标识所要求保护的主题的关键特征或本质特征,也不旨在用于帮助确定所要求保护的主题的范围。
本发明的实施例涉及用于基于从各种源接收到的用户信息来定义和确定用户意图的方法。在线服务的因素正在理解用户意图。在没有理解用户的真实需求的情况下,无法向在线用户提供相关服务。因此,本发明的实施例提供代表用户意图的科学方法的定义。用户意图可以从三方面定义:语义、偏好和语用,基于这些方面,用户随后可用更及时且更高效的方式来完成其目标。意图的语义部分指示意图在例如主题意义层面上实际是关于什么的。由此,主题表达表示意图的语义。意图的偏好部分(例如:属性)指示针对特定主题表达的用户偏好。最后,意图的语用部分指示关于该主题表达的用户心中的任务或动作。换言之,意图定义的语用部分定义了可被执行以完成任务的步骤和活动。主题表达以及相关联的属性和动作用意图结构来表示,该意图结构示出了各个主题表达之间的关系。然后使用一算法来将关键词从用户数据映射到意图结构来推断当前和将来的用户意图。各种类型的信息,例如广告和搜索结果,可基于推断的用户意图被提供给用户。
附图说明
下面参考附图详细描述本发明,附图中:
图1是适用于实现本发明的各实施例的示例性计算环境的框图;
图2是配置成用于实现本发明的各实施例的示例性计算系统体系结构的框图;
图3是示出根据本发明的实施例的用于根据定义的用户意图来进行广告的示例性系统的框图;
图4是示出根据本发明的一实施例的用于定义用户意图的三方面的图示;
图5是根据本发明的一实施例的用于定义意图分类的分层树;
图6是根据本发明的一实施例的示出主题的分层结构的表;
图7是根据本发明的一实施例的列出与特定主题相关联的示例性动作的表;
图8是根据本发明的一实施例的列出与特定主题相关联的示例性属性的表;
图9是根据本发明的一实施例的用于定义用户意图的方法的流程图;以及
图10是根据本发明的一实施例的用于表示用户意图的方法的流程图。
详细描述
此处用细节来描述本发明的主题以满足法定要求。然而,该描述本身并非旨在限制本专利的范围。相反,发明人设想所要求保护的主题还可结合其他当前或未来技术按照其他方式来具体化,以包括不同的步骤或类似于本文中所描述的步骤的步骤组合。此外,尽管术语“步骤”和/或“框”可在此处用于指示所采用的方法的不同元素,但除非而且仅当明确描述了各个步骤的顺序,否则该术语不应被解释为意味着此处公开的各个步骤之中或之间的任何特定顺序。
本发明的实施例提供用于定义用户意图的方法,以便可推断和使用当前和将来的用户意图以向用户选择并提供相关的广告和其它这样的信息。首先,用户意图由三方面定义,包括语义、偏好、和语用。因此,生成包括特定语义(例如:主题表达)、一个或多个语用(例如:动作)、以及(可选的)一个或多个偏好(例如:属性)的三向图。因此,在一个实施例中,属性并不与特定主题表达相关联。从这些三向图中,生成了展现又在此处被称为主题表达的各主题之间的关系的分层的树结构。例如,第一主题表达“车辆”可包括诸如“摩托车”、“SUV”和“小型房车”的多个子主题表达。“车辆”的示例动作包括“服务”、“汽车”和“代理商”。“车辆”的示例属性包括“燃料类型”和“花费”。一旦生成分层结构,可通过算法来推断用户意图,该算法将在用户数据(例如,日志数据、用户简档、社交网站)中找到的关键词与分层结构中的术语相匹配。从那里,可基于用户意图向用户提供广告和诸如搜索结果、用于执行任务的一系列步骤、网站个性化等其它信息源。
因此,在一个方面中,本发明涉及存储计算机可使用指令的一个或多个计算机可读介质,当这些指令由一个或多个计算设备使用时,使该一个或多个计算设备执行一种方法。该方法包括标识主题表达,并将至少一个动作与主题表达相关联,其中至少一个动作指示要被执行以完成对应于主题表达的任务的步骤。该方法还包括生成指示主题表达和一个或多个其它主题表达之间的关系的意图结构。
在另一方面中,本发明涉及存储计算机可使用指令的一个或多个计算机可读介质,当这些指令由一个或多个计算设备使用时,使该一个或多个计算设备执行一种方法。该方法包括搜索结果修改系统。该系统包括与一个或多个处理器相关联的计算设备、一个或多个计算机可读存储介质、以及与计算设备相耦合的数据存储。进一步,系统包括意图确定引擎,该意图确定引擎通过将动作和属性与主题表达相关联来定义用户意图、组织主题表达来表示主题表达之间的关系以及使用组织过的主题表达和从一个或多个源接收的用户数据为特定用户确定用户意图。
又一方面涉及存储计算机可使用指令的一个或多个计算机可读介质,当这些指令由一个或多个计算设备使用时,使该一个或多个计算设备执行一种方法。该方法包括将多个主题表达中的每一个与至少一个属性和至少一个动作相关联。该方法进一步包括生成表示多个主题表达之间的关系的分层结构,以及从一个或多个源接收用户数据。另外,该方法包括通过标识用户数据中对应于分层结构中的多个主题表达、至少一个属性和至少一个动作的关键词来通过算法确定用户意图。
在简要描述了本发明各实施例的概览之后,以下描述可实现本发明的各实施方式的示例性操作环境,以便为本发明各方面提供通用上下文。首先具体参考图1,示出了用于实现本发明的各实施方式的示例性操作环境,并将其概括地指定为计算设备100。计算设备100只是合适的计算环境的一个示例,并且不旨在对本发明的使用范围或功能提出任何限制。也不应该将计算设备100解释为对所示出的任一组件或其组合有任何依赖性或要求。
本发明可以在由计算机或诸如个人数据助理或其他手持式设备之类的其他机器执行的计算机代码或机器可使用指令(包括诸如程序模块之类的计算机可执行指令)的一般上下文中描述。一般而言,包括例程、程序、对象、组件、数据结构等的程序模块指的是执行特定任务或实现特定抽象数据类型的代码。本发明可以在各种系统配置中实施,这些系统配置包括手持式设备、消费电子产品、通用计算机、更专用计算设备等等。本发明也可以在其中任务由通过通信网络链接的远程处理设备执行的分布式计算环境中实施。
参考图1,计算设备100包括直接或间接耦合以下设备的总线110:存储器112、一个或多个处理器114、一个或多个呈现组件116、输入/输出端口118、输入/输出组件120、和说明性电源122。总线110表示一个或多个总线可以为何物(诸如地址总线、数据总线或其组合)。虽然为了清楚起见利用线条示出了图1的各个框,但实际上,这些框表示逻辑组件而不一定是实际组件。例如,可以认为诸如显示设备的呈现组件是I/O组件。而且,处理器具有存储器。可以认识到,这是本领域的特性,并且重申,图1的图示只是例示可结合本发明的一个或多个实施例来使用的示例性计算设备。诸如“工作站”、“服务器”、“膝上型计算机”、“手持式设备”等分类之间没有区别,它们全部都被认为是在图1的范围之内的并且被称为“计算设备”。
计算设备100通常包括各种计算机可读介质。计算机可读介质可以是可由计算机设备100访问的任何可用介质,且包括用任何方法和技术实现以存储诸如计算机可读指令、数据结构、程序模块或其它数据等信息的易失性和非易失性介质、可移动和不可移动介质。计算机可读介质包括但不限于,RAM、ROM、EEPROM、闪存或其它存储器技术、CD-ROM、数字多功能盘(DVD)或其它光存储、盒式磁带、磁带、磁盘存储或其它磁存储设备,或者可用于存储所需信息并且可由计算设备100访问的任何其它介质。上面各项中的任何项的组合也包括在计算机可读介质的范围内。
存储器112包括易失性和/或非易失性存储器形式的计算机存储介质。存储器可以是可移动的、不可移动的、或其组合。示例性硬件设备包括固态存储器、硬盘驱动器、光盘驱动器等。计算设备100包括从诸如存储器112或I/0组件120等各种实体读取数据的一个或多个处理器。呈现组件116向用户或其他设备呈现数据指示。示例性呈现组件包括显示设备、扬声器、打印组件、振动组件等等。
I/O端口118允许计算设备100逻辑上耦合至包括I/O组件120的其它设备,其中某些可以是内置的。说明性组件包括话筒、操纵杆、游戏手柄、圆盘式卫星天线、扫描仪、无线设备等等。
现参考图2,提供了示出在其中可以采用本发明的各实施例的示例性系统200的框图。应当理解,此处所描述的这一和其它安排仅作为示例来阐明。附加于或替代于所示的安排和元素,可使用其他安排和元素(例如机器、接口、功能、次序、以及功能聚集等),并且可完全省略某些元素。此外,此处所描述的许多元素是可以实现为分立或分布式组件或结合其他组件来实现的、以及以任何合适的组合和在任何合适的位置的功能实体。此处被描述为由一个或多个实体执行的各种功能可由硬件、固件和/或软件来执行。例如,各种功能可由执行存储在存储器中的指令的处理器来执行。
除了未示出的其它组件之外,系统200包括用户设备202、服务器204、第三方数据源206、广告存储208、以及意图确定引擎210。图2所示的组件中的每一个都可以是任何类型的计算设备,诸如例如参考图1描述的计算设备100。各组件可以经由网络220彼此通信,网络220包括但不限于一个或多个局域网(LAN)和/或广域网(WAN)。这样的联网环境常见于办公室、企业范围计算机网络、内联网和因特网中。应理解,可在本发明范围内的系统200内采用任何数量的用户设备、服务器、第三方数据源、广告存储、以及意图确定引擎。它们各自可包括单个设备或在分布式环境中协作的多个设备。例如,多个用户设备通常在任意时刻通过网络进行通信。进一步,本发明的各实施例中可采用一个或多个第三方数据源。另外,在系统200内还可包括其他未示出的组件。
用户可通过诸如用户设备202等用户设备与网络220通信。用户设备202可以是图1中描述的有关计算设备100的任何类型的设备。在一个实施例中,用户设备202允许用户通过网络220在搜索网站上提交一搜索查询。或者,用户可与诸如社交网站等各网站交互。可通过网络220从用户设备202捕捉来自这些网站的数据,这些数据可包括被用户访问过的网页的日志。
第三方数据源206包括与用户相关联的各种类型的数据,仅作为示例,这些数据包括日志数据(例如:查询日志、网页视图日志、web日志、工具栏日志)、用户简档信息(例如:年龄、性别、位置、兴趣)以及现场数据,在一个例子中,该现场数据包括来自诸如社交网站等各网站的数据。来自第三方数据源的这些用户数据可以被用来推断或确定用户的意图。例如,用户数据可包括可以被提取并映射到先前生成的意图结构的各种关键词,该先前生成的意图结构可以是例如表示各主题表达之间的关系的分层树。在一个实例中,用户数据中的关键词包括主题表达的子集、动作的子集、以及属性的子集。如此处所使用的,主题表达是表示主题或语义的一个或多个字母数字串。例如,一个示例性主题表达是“芝加哥”。主题表达与动作、以及在某些实施例中将在此进一步详述的属性相关联,以更彻底地定义主题表达。“芝加哥”可表示城市、乐队或电影。为了更彻底地理解用户的意图,需要关于主题表达的更多信息。广告存储208是包括了能根据用户意图被取出用来呈现给用户的广告的数据存储。
意图确定引擎210一般执行各种功能,包括通过将动作和(可选的)属性与主题表达相关联来定义用户意图、组织主题表达来表示主题表达之间的关系以及采用组织过的主题表达和从一个或多个源接收的用户数据为特定用户确定用户意图。意图确定引擎210包括若干独立的组件或模块。除了那些在图2中显示的之外,这些模块包括意图定义模块212、意图分类模块214、意图推断模块216、以及广告模块218。该意图定义模块212负责定义用户意图,该模块可以采用多种方式实现。在本发明的一实施例中,用户意图由三方面定义,包括语义、偏好、和语用。语义表示意图是关于什么的,诸如与意图相关联的主题(例如:主题表达)使用上述示例,“芝加哥”是一个示例性主题,但可表示城市、乐队、电影等,为了更彻底地理解用户的意图,理解用户真正想知道什么是很有用的。第二方面是偏好,例如用户对于某个主题的偏好是什么。例如,对于“相机”的主题表达,偏好可包括颜色、品牌、型号等。偏好在此处一般被称为属性。最后,语用包括用户心中的任务,例如可被执行以实现这些任务的步骤或活动。语用在此处一般被称为动作。通过绘图来表示,用户意图可采用诸如图3中所示的示图来阐述,下文将作更全面地描述。
一旦用户意图被意图定义模块212所定义,意图分类模块214组织意图使得它们可以被方便地管理,并且使得用户行为可以被映射到意图。由此,生成了示出各意图或主题表达之间的关系的意图结构,使得意图链变得清晰。在一个实施例中,建立分类,其将主题表达组织成分层树。示例性关系包括“是一”、“部分”以及“特殊/一般”。主题或主题表达是意图的载体。因此,可采用现有的主题分类并将适当的动作和属性添加至分类或分层树的每个注释中,以将主题分类扩展为意图分类。仅作为示例,“汽车”可以是分层树中的第一层主题表达。在第二层处,示例性主题表达是“SUV”和“轿车”。在第三层处,示例性主题表达是“丰田”和“本田”。图5示出意图分类的示例性分层树,以下将详述。进一步,主题、属性和动作的示例在图6、7、8中的表中示出。
意图推断模块216负责确定特定用户的实际意图。从一个或多个源接收用户数据,用户数据包括例如展示了用户之前的行为的日志数据(例如:查询日志、网页视图日志、web日志、工具栏日志)、用户简档信息(例如:年龄、性别、位置、兴趣)以及现场数据,在一个例子中,该现场数据包括来自诸如社交网站等各网站的数据。例如,对应于用户与其它网站的交互的数据可为用户意图提供极有价值的信息。在一个实施例中,意图推断模块216被给予来自由用户提交的搜索查询的初始意图。为了寻找相关联的动作以及(在某些实施例中)属性,采用上述来自一个或多个源的用户数据,并将该用户数据映射到由意图分类模块214生成的意图结构中的主题表达、相关联的属性和动作。可采用一个或多个算法,诸如条件随机场之类的为序列数据建模的算法。此处并没有描述特定算法,因为各种算法都能够执行此处描述的本发明的各实施例。
以下阐述示例性数据结构,该数据结构可以被用来对用户意图进行分类。在此,输出是用户意图向量(列表<CIntent>,其中CIntent在以下被定义)。除了主题和动作标识外,属性和值也配对(例如:型号/本田,式样/卡罗拉)。Prob是用户将具有所定义的意图的可能性,TimeStamp是用户具有该意图的时刻。
Figure BSA00000515440800081
广告模块218负责根据所确定的或所推断的用户意图选择和向用户提供广告。广告模块218只是根据所确定的或所推断的用户意图提供信息的模块的一个示例。存在基于意图进行广告的各种方式。在一个实施例中,广告客户按意图投标。在用户意图被推断出后(例如:当前意图或计划中的将来的意图),广告客户可直接按意图投标,这可以解决语义方面(semantic-wise)的不匹配。在替换实施例中,根据意图建立用户段。例如,当用户开始发放关于车子的查询时,意图推断模块216根据接收到的用户数据确定用户正在寻找的车子的类型。例如,如果用户将拥有一个新生儿,(例如:查询可包括“宝宝名字”和“配方”),则用户会对SUV比小型房车更感兴趣。然后,广告客户可用他们的SUV广告给这些类型的用户留下印象。与此同时,用户被提供更多提高他们的整体用户体验的相关广告。广告客户可浏览意图分类来选择他们将为其提供广告的意图,或者可提出他们希望涵盖的某些意图,这些意图可以被添加至意图分类。
如所述的,未在图2中示出的其它模块可以被用来根据用户意图向用户提供其它信息。例如,可在搜索和新闻网站上提供个性化服务。例如,如果用户采用上述描述的其它模块在查询中键入“购买汽车”,主题可以被确定为“汽车”并且动作被确定为“购买”。用户的偏好(例如:属性),如果被包括的话,可以从其它源中被确定。例如,用户可在留言板上写道他准备购买宝马(BMW)。搜索结果接着可偏向于为用户提供更多有关宝马汽车交易的信息。类似地,了解用户意图可帮助为在可以被定制的新闻或其它信息网站上的用户提供更好的网页建议。例如,除了无关的新闻文章之外或代替无关的新闻文章,可提供与经确定的用户意图有关的新闻文章。
被用来根据用户意图向用户提供信息的另一模块可提供,除了搜索结果之外或代替搜索结果,用户可遵循以完成与用户意图有关的任务的一系列步骤。例如,如果确定用户打算在纽约购买房子,各步骤可包括至房地产网站的链接、至家庭保险网站的链接等。这些步骤可以按以下方式排列,即引导用户经历可以按顺序跟从的多个步骤。
图3是示出根据本发明的实施例的用于根据定义的用户意图来进行广告的示例性系统300的框图。首先,尽管图3中的许多组件已经在此处被描述,它们让然在此处被示出以说明数据如何流入并流出各组件。意图表示方法310参照上述的图2的意图定义模块212来定义用户意图。为了定义用户意图,语义、偏好和语用被标识并互相关联。语义是指示用户感兴趣的主题的主题表达。偏好是与主题表达相关联的属性。语用是诸如对应于主题表达的可被采用的步骤等动作。生成例如图4所示的图示并将这些图示传递给意图基础模块312以用于进一步处理。
意图基础模块312包括接收来自人类316或数据挖掘318的数据的意图分类数据库314。该意图基础模块312作为一个整体生成意图结构,诸如示出各主题表达之间的关系的分类(例如:分层结构)。诸如来自人类316或数据挖掘318的数据被用来创建这些意图结构。例如,除了与主题表达相关联的动作以及(可选的)属性,一人316可输入主题表达。或者,可以从数据挖掘318中提取关键词并将关键词归类为主题表达、属性或动作。这些关键词随后被互相关联以形成诸如图4所示的图示,并最终形成诸如将在以下详细描述的图5所示的意图结构。
数据320可作为来自各个源的信号被接收。仅作为示例,数据类型包括诸如日志数据324(例如:查询日志、网页视图日志、web日志、工具栏日志)等第三方数据322、用户简档信息326(例如:年龄、性别、位置、兴趣)以及现场数据,在一个例子中,该现场数据包括来自诸如社交网站等各网站的数据。如所示的,数据被馈至包括将模型存储于模型数据库334的算法训练组件332的学习工具330。如前所述,可采用各种算法通过使用由意图分类314生成的意图结构以及所接收的用户数据332来确定用户意图。例如,从用户数据中提取的关键词可被映射至从意图分类数据库314中接收到的分类。针对当从用户数据中提取关键词时该寻找什么,用户数据有效地训练算法。对于特定用户的具体分类被存储在模型数据库334中。
打分模块336通过批处理模式意图打分模块338以批处理模式为意图提供分数,或通过实时意图打分模块340实时地提供分数。批处理模式打分可以在请求诸如广告、个性化、搜索结果等信息之前执行。相反,可在请求该类型信息之后进行打分。所以,用户可以将查询输入到搜索页面中,此时可以为用于选择信息以将信息呈现给用户的意图进行打分以使得最相关广告或其它类似信息可被提供给用户。
一旦确定特定用户的用户意图,可基于用户意图来向该用户提供信息。如上所述,广告只是可被提供给用户的信息的一种形式。可存储包括广告模块344的应用程序342。还可在此存储其它应用程序346。广告模块344负责标识哪些广告用来提供给用户。在一个实施例中,这可以涉及请求广告客户使用意图结构按意图进行投标。或者,可针对某个意图通知广告客户,该意图与广告客户提供的广告相关联,并且,该广告客户可继续提交与该用户意图相关的广告。尽管在此处没有显示,可采用其它应用程序346来提供搜索结果、与用户意图相关的动作组、或网页上的个性化,所有这些均基于经确定的用户意图。
以下是示出如何采用图3所示的每个组件与步骤来确定用户意图的示例。如所述的,用户意图表示方法采用三维或三方面,包括主题、动作和(在某些实施例中)属性。该表示方法定义意图分类以定义所涉及的意图空间。具体地,例如,对于意图分类中的一个节点,主题可以是“小型房车”。动作可包括“购买”、“出售”、“修理”和“查阅”。属性可以包括“型号”、“颜色”、“燃料类型”等等。在一个示例中,用户在过去向特定搜索引擎提交了诸如“汽车价格”和“汽车交易”等查询并访问了有关汽车的各种网页,并在社交网站上写了诸如“m3看起来很棒”和“我的下一辆车应该是宝马M3”等信息。意图推断算法可确定用户的意图是要购买一辆小型房车,其型号是M3。这是通过采用意图分类来分析接收到的所有用户信息来做到的。然后,该用户意图可用来改进广告和搜索结果。对于登广告,可联系例如宝马的广告代理商并告诉广告代理商那些正在特别寻找某个宝马汽车的特定用户,并将针对宝马的广告提供给该用户。对于搜索,当用户下次键入“汽车交易”时,搜索结果可偏向于显示更多有关“M”3的交易,使得用户有更高的几率找到正确的和相关的信息。
现在转向图4,示出图示400,图示400示出根据本发明的一实施例的用于定义用户意图的三方面。此处描述的三方面,即语义、偏好和语用,是互不相干的,当它们放在一起时定义了一个有关用户想干什么以及如何去干的完整图片。这在图4中示出。图示中的语义部分410是列出了主题表达的部分。例如,主题表达可以是“芝加哥”、“汽车”、“相机”等。图示的语用部分412列出与主题表达相关联的一个或多个动作。例如,如果主题表达是“汽车”,则示例性动作是“购买”、“出售”、“修理”、“查阅”等。图示的偏好部分414列出与主题表达相关联的一个或多个属性。例如,以上述示例的主题表达为“汽车”为例,示例性属性包括“厂商”、“型号”、“花费等级”等。如前所述,在某些实施例中,属性与主题表达相关联,但在其它实施例中,属性并不与主题表达相关联。
参考图5,示出了根据本发明的一实施例的用于定义意图分类的分层树500。每个主题表达被分配一个节点,包括节点510、512、514、516、和518。内部节点510、512和514或无枝叶的节点包括主题表达和相关联的动作,这对于更一般的主题来说很具体。然而,对于有枝叶的节点,诸如节点516和518,也要列出属性。其它实施例可包括每个节点上的主题表达、动作和属性的全部。如所述的,意图结构示出主题表达之间的关系。例如,“汽车”可以是位于分层结构的顶部(例如节点510)的主题表达。节点512和514可包括诸如“SUV”和“轿车”等主题表达,而节点516和518可包括诸如“丰田”和“本田”等主题表达。在一个实施例中,更接近分层结构的顶部的主题表达通常比更接近底部的主题表达更广泛。
图6是根据本发明的一实施例的示出主题的分层结构的表600。图6所示的主题表达表示主题的分层结构的具体示例,图6绝不表示对本发明的范围的限制。作为本发明的一实施例,各主题表达在分层结构中被阐述,其中“交通工具”是可见的主题表达的最高端。直接在“交通工具”之下的是比交通工具的主题含义略窄的若干主题表达。这些包括“交通工具服务”、“交通工具零件、工具和配件”、“交通工具代理商”、“新闻(交通工具)”以及“汽车和娱乐交通工具”。由位于“交通工具服务”和“交通工具零件、工具和配件”左侧的加号符所示,这些主题表达可以被扩展并包含位于它们之下的多个较窄的主题表达。“汽车和娱乐交通工具”的左侧示有减号符,指示主题表达在下面示出。此处,“汽车”、“摩托车”和“娱乐交通工具”是位于“汽车和娱乐交通工具”之下的三个主题表达。通常,这指示这三个较低层级的主题表达比较高层级的主题表达范围窄,并且还指示较低层级的主题表达中的每一个以某种方式单独地与较高层级的主题表达有关。图6还示出较低层级的主题表达的进一步示例。
图7是根据本发明的一实施例的列出与特定主题相关联的示例性动作的表700。图6中列出了仅作为示例性的主题表达,而图7列出了示例性动作。具体地,这些动作与图6中以粗体所示的“小型房车”有关。示例性动作包括处置、买和研究。由此,用户会希望处理掉这辆车,无论是否通过捐献、抵押、出售、拍卖出售、通过分类广告出售、丢弃等。进一步,用户会希望购买一辆小型房车。买可包括购买、通过拍卖购买、通过通过分类广告购买、从代理商处购买、以另一辆车对换来购买该小型房车、租用,等。另外,用户会希望对小型房车进行研究。研究可包括,例如,对汽车进行评估、权威性的浏览、非正式的浏览、查看对该车的评价、权威性的搜索、非正式的搜索,等。
转到图8,示出了根据本发明的一实施例的列出与特定主题相关联的示例性属性的表800。与图7所示的表700相似,图8所示的表800列出与诸如“小型房车”等特定主题表达相关联的各种词。此处,这些词是属性。示例性类别包括“花费等级”、“燃料类型”、“厂商”以及“排档和驱动(transmission and drivetrain)”。对于这些类别中的每一个,还列出一个或多个值,使得当用户意图被推断出时,属性/值对(attribute/value pairs)可被相关联。图8列出了这些值。再次,以上所列以及图8所示的分类中的每一个可以某种方式与示例性主题表达“小型房车”相关联。
图9是根据本发明的一实施例的用于定义用户意图的方法900的流程图。首先,在步骤910处,标识主题表达。如前所述,主题表达是指示用户感兴趣的主题或主旨的一个或多个字母数字串。在一个实施例中,从用户提交的搜索查询中标识主题表达。在其它实施例中,从诸如数据日志、用户简档、网站(例如:社交网站)等其它数据源标识主题表达。在步骤912处,至少一个动作与主题表达相关联。该动作指示要被执行以完成对应于该主题表达的任务的步骤。在步骤914处,至少一个属性与主题表达相关联。在步骤916处生成意图结构。该意图结构指示主题表达与一个或多个其它主题表达之间的关系。示例性意图结构在图5中示出。这种类型的意图结构是分层树,但这仅仅是可生成的意图结构的一种类型。
进一步,可从包括社交网站、日志数据或用户简档等一个或多个源接收用户数据。例如,用户简档可指示特定用户的年龄、性别以及兴趣。使用该用户数据,推断或确定特定用户的用户意图。在一实施例中,该确定由一算法作出。一旦确定了用户意图,可基于该用户意图向用户提供诸如广告等信息。基于用户意图提供的其它类型的信息可包括显示在诸如新闻网页等网页上的个性化信息。进一步,可根据确定的用户意图将搜索结构返回至用户。又进一步,可向用户提供一个或多个步骤,该一个或多个步骤被推荐给用户用来完成对应于主题表达的任务。
参考图10,示出根据本发明的一实施例的用于表示用户意图的方法1000的流程图。在步骤1010处,多个主题表达中的每一个与属性和动作相关联。在步骤1012处,生成表示多个主题表达之间的关系的分层结构。在步骤1014处,接收用户数据。可接收来自一个或多个源的用户数据。进一步,在步骤1016处,用户意图可通过算法被确定。例如,可通过标识用户数据中对应于分层结构中的主题表达、属性和动作的关键词来确定用户意图。一旦确定了用户意图,可基于该用户意图向用户呈现广告或其它信息。或者,用户可输入搜索查询,可基于搜索查询输入和用户数据选择搜索结果并将该搜索结果在搜索结果页面上呈现给用户。
如可理解的,本发明的各实施例提供用于定义用户意图。参考各具体实施方式描述了本发明,各具体实施方式在所有方面都旨在是说明性的而非限制性的。在不偏离本发明范围的情况下,各替换实施方式对于本发明所属领域的技术人员将变得显而易见。
从前面的描述可以看出,本发明很好地适用于实现上文所阐述的所有目的和目标,并且具有对于该系统和方法是显而易见且固有的其他优点。可理解的是,某些特征和子组合是有用的,并且可以加以利用而无需参考其它特征和子组合。这由权利要求所构想的,并在权利要求的范围内。

Claims (15)

1.一个或多个存储计算机可使用指令的计算机可读介质,所述指令在由一个或多个计算设备使用时使得所述一个或多个计算设备执行一种方法,所述方法包括:
标识(910)主题表达;
将至少一个动作与所述主题表达相关联(912),其中所述至少一个动作指示要被执行以完成对应于所述主题表达的任务的步骤;以及
生成(916)意图结构,所述意图结构指示所述主题表达与一个或多个其它主题表达之间的关系。
2.如权利要求1所述的一个或多个计算机可读介质,其特征在于,还包括将至少一个属性与所述主题表达相关联。
3.如权利要求2所述的一个或多个计算机可读介质,其特征在于,还包括从一个或多个源接收用户数据,其中所述用户数据从社交网站、日志数据或用户简档中的至少一个被接收。
4.如权利要求2所述的一个或多个计算机可读介质,其特征在于,还包括使用所述用户数据,确定对应于特定用户的用户意图。
5.如权利要求4所述的一个或多个计算机可读介质,其特征在于,还包括基于经确定的用户意图向所述用户提供一个或多个广告。
6.如权利要求4所述的一个或多个计算机可读介质,其特征在于,还包括基于所述用户意图个性化网页。
7.如权利要求4所述的一个或多个计算机可读介质,其特征在于,还包括基于所述用户意图在搜索结果网页上提供一个或多个搜索结果。
8.如权利要求4所述的一个或多个计算机可读介质,其特征在于,还包括提供被推荐给所述用户以完成对应于所述主题表达的所述任务的一个或多个步骤。
9.一种搜索结果修改系统,包括:
计算设备(202),所述计算设备与一个或多个处理器和一个或多个计算机可读存储介质相关联;
数据存储(206),所述数据存储与所述计算设备耦合;以及
意图确定引擎(210),所述意图确定引擎通过将动作和属性与主题表达相关联来定义用户意图、组织所述主题表达以表示所述主题表达之间的关系以及采用经组织的主题表达和从一个或多个源接收的用户数据为特定用户确定所述用户意图。
10.如权利要求9所述的系统,其特征在于,所述意图确定引擎通过标识所述用户数据中对应于所述分层结构中的所述主题表达、所述动作和所述属性的关键词来通过算法确定所述特定用户的所述用户意图。
11.如权利要求10所述的系统,其特征在于,在所述用户数据中的关键词包括所述主题表达的子集、所述动作的子集、以及所述属性的子集。
12.如权利要求11所述的系统,其特征在于,所述属性的子集指示对应于特定主题表达的用户偏好。
13.一个或多个存储计算机可使用指令的计算机可读介质,所述指令在由一个或多个计算设备使用时使得所述一个或多个计算设备执行一种方法,所述方法包括:
将多个主题表达中的每一个与至少一个属性和至少一个动作相关联(1010);
生成(1012)表示所述多个主题表达之间的关系的分层结构;
从一个或多个源接收(1014)用户数据;以及
通过标识所述用户数据中对应于所述分层结构中的所述多个主题表达、所述至少一个属性和所述至少一个动作的关键词来通过算法确定(1016)用户意图。
14.如权利要求13所述的一个或多个计算机可读介质,其特征在于,还包括基于经确定的用户意图向用户呈现一个或多个广告。
15.如权利要求13所述的一种或多种计算机可读介质,其特征在于,还包括:
接收来自用户的搜索查询输入;以及
基于所述搜索查询输入和所述用户数据,将搜索结果在搜索结果页面上呈现给用户。
CN201110152208.1A 2010-05-28 2011-05-27 定义用户意图 Active CN102262652B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US12/790,523 2010-05-28
US12/790,523 US20110295688A1 (en) 2010-05-28 2010-05-28 Defining user intent

Publications (2)

Publication Number Publication Date
CN102262652A true CN102262652A (zh) 2011-11-30
CN102262652B CN102262652B (zh) 2016-12-14

Family

ID=

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104834698A (zh) * 2015-04-27 2015-08-12 百度在线网络技术(北京)有限公司 信息推送方法和装置
CN106919648A (zh) * 2017-01-19 2017-07-04 北京光年无限科技有限公司 一种用于机器人的交互输出方法及机器人
CN107527005A (zh) * 2016-06-21 2017-12-29 通用汽车环球科技运作有限责任公司 基于注视信息用于确定用户意图的装置和方法
CN108475506A (zh) * 2015-12-21 2018-08-31 谷歌有限责任公司 动态意图注册
CN108885646A (zh) * 2016-03-25 2018-11-23 微软技术许可有限责任公司 使用推断的用户意图来增强对象表示
CN109154935A (zh) * 2016-05-26 2019-01-04 微软技术许可有限责任公司 对用于任务完成的信息的智能捕获、存储和取回
CN111344695A (zh) * 2017-12-20 2020-06-26 国际商业机器公司 促进特定于域和客户端的应用程序接口推荐

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030105589A1 (en) * 2001-11-30 2003-06-05 Wen-Yin Liu Media agent
US20050102202A1 (en) * 1998-09-18 2005-05-12 Linden Gregory D. Content personalization based on actions performed during browsing sessions
US20080114607A1 (en) * 2006-11-09 2008-05-15 Sihem Amer-Yahia System for generating advertisements based on search intent
CN101331475A (zh) * 2005-12-14 2008-12-24 微软公司 在线商业意图的自动检测

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050102202A1 (en) * 1998-09-18 2005-05-12 Linden Gregory D. Content personalization based on actions performed during browsing sessions
US20030105589A1 (en) * 2001-11-30 2003-06-05 Wen-Yin Liu Media agent
CN101331475A (zh) * 2005-12-14 2008-12-24 微软公司 在线商业意图的自动检测
US20080114607A1 (en) * 2006-11-09 2008-05-15 Sihem Amer-Yahia System for generating advertisements based on search intent

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104834698A (zh) * 2015-04-27 2015-08-12 百度在线网络技术(北京)有限公司 信息推送方法和装置
CN108475506A (zh) * 2015-12-21 2018-08-31 谷歌有限责任公司 动态意图注册
CN108475506B (zh) * 2015-12-21 2022-10-04 谷歌有限责任公司 动态意图注册
CN108885646A (zh) * 2016-03-25 2018-11-23 微软技术许可有限责任公司 使用推断的用户意图来增强对象表示
CN109154935A (zh) * 2016-05-26 2019-01-04 微软技术许可有限责任公司 对用于任务完成的信息的智能捕获、存储和取回
CN109154935B (zh) * 2016-05-26 2021-12-17 微软技术许可有限责任公司 一种用于分析用于任务完成的捕获的信息的方法、系统及可读存储设备
CN107527005A (zh) * 2016-06-21 2017-12-29 通用汽车环球科技运作有限责任公司 基于注视信息用于确定用户意图的装置和方法
CN107527005B (zh) * 2016-06-21 2020-10-30 通用汽车环球科技运作有限责任公司 基于注视信息用于确定用户意图的装置和方法
CN106919648A (zh) * 2017-01-19 2017-07-04 北京光年无限科技有限公司 一种用于机器人的交互输出方法及机器人
CN106919648B (zh) * 2017-01-19 2020-08-18 北京光年无限科技有限公司 一种用于机器人的交互输出方法及机器人
CN111344695A (zh) * 2017-12-20 2020-06-26 国际商业机器公司 促进特定于域和客户端的应用程序接口推荐
CN111344695B (zh) * 2017-12-20 2024-01-23 国际商业机器公司 促进特定于域和客户端的应用程序接口推荐

Also Published As

Publication number Publication date
US20110295688A1 (en) 2011-12-01

Similar Documents

Publication Publication Date Title
Vargiu et al. Exploiting web scraping in a collaborative filtering-based approach to web advertising.
US20110295688A1 (en) Defining user intent
US11755676B2 (en) Systems and methods for generating real-time recommendations
US11176142B2 (en) Method of data query based on evaluation and device
US20110225152A1 (en) Constructing a search-result caption
US20170103441A1 (en) Comparing Business Documents to Recommend Organizations
Casillo et al. Context-aware recommender systems and cultural heritage: a survey
WO2010000065A1 (en) Facilitating collaborative searching using semantic contexts associated with information
US11599927B1 (en) Artificial intelligence system using deep neural networks for pairwise character-level text analysis and recommendations
EP2307983A1 (en) Information processing with integrated semantic contexts
US11682060B2 (en) Methods and apparatuses for providing search results using embedding-based retrieval
An et al. Approaching fashion design trend applications using text mining and semantic network analysis
US10726449B2 (en) System and method for extracting and publishing information captured by point of sale, point of service, and other order management and sales transactions recording systems for positively influencing internet search engine results
Badriyah et al. Recommendation system for property search using content based filtering method
Blanco-Moreno et al. Big data in tourism marketing: past research and future opportunities
Choi et al. Developing an AI-based automated fashion design system: reflecting the work process of fashion designers
CN113744019A (zh) 一种商品推荐方法、装置、设备及存储介质
Haines et al. Social media fashion influencer eWOM communications: understanding the trajectory of sustainable fashion conversations on YouTube fashion haul videos
Xu et al. Potential buyer identification and purchase likelihood quantification by mining user-generated content on social media
US20210117825A1 (en) Method and system for processing a search result of a search engine system
Abou-Nasr et al. Real world data mining applications
CN102262652B (zh) 定义用户意图
Hwang et al. How COVID-19 Has Shaped Gen Z’s Fashion Consumption Values?
Anastasiei et al. Overlaps Between Business Intelligence and Customer Relationship Management–Is There a Place for E-Commerce?
Liu et al. Which used product is more sellable? A time-aware approach

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: MICROSOFT TECHNOLOGY LICENSING LLC

Free format text: FORMER OWNER: MICROSOFT CORP.

Effective date: 20150728

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20150728

Address after: Washington State

Applicant after: Micro soft technique license Co., Ltd

Address before: Washington State

Applicant before: Microsoft Corp.

C14 Grant of patent or utility model
GR01 Patent grant