CN102799591A - 一种提供推荐词的方法及装置 - Google Patents

一种提供推荐词的方法及装置 Download PDF

Info

Publication number
CN102799591A
CN102799591A CN201110138955XA CN201110138955A CN102799591A CN 102799591 A CN102799591 A CN 102799591A CN 201110138955X A CN201110138955X A CN 201110138955XA CN 201110138955 A CN201110138955 A CN 201110138955A CN 102799591 A CN102799591 A CN 102799591A
Authority
CN
China
Prior art keywords
classification
click
key word
query key
recommendation query
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201110138955XA
Other languages
English (en)
Other versions
CN102799591B (zh
Inventor
黄鹏
林锋
张寿松
郑伟
冯炯
张勤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201110138955.XA priority Critical patent/CN102799591B/zh
Priority to TW100128685A priority patent/TWI582619B/zh
Priority to US13/522,142 priority patent/US20120330962A1/en
Priority to PCT/US2012/039426 priority patent/WO2012162541A1/en
Priority to JP2014512114A priority patent/JP5984917B2/ja
Priority to EP12789336.0A priority patent/EP2715574A4/en
Publication of CN102799591A publication Critical patent/CN102799591A/zh
Priority to HK13100396.5A priority patent/HK1173244A1/zh
Application granted granted Critical
Publication of CN102799591B publication Critical patent/CN102799591B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3322Query formulation using system suggestions

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本申请公开了一种提供推荐词的方法,该方法为:接收用户输入的初始query,并基于该初始query获得相应的推荐query,以及确定推荐query对应的至少两种类目,和用于查询推荐query的至少两种点击区域,再分别确定获得的每一种类目针对推荐query在每一种点击区域下的类目权重,以及每一种点击区域的点击特征权重,并计算获得每一种类目针对推荐query的置信度,接着,分别根据每一种类目针对推荐query的置信度,确定该推荐query的目标类目,这样,可以令用户根据各推荐query对应的目标类目,迅速确定自身的搜索意图,从而有效地提高了信息搜索速度。

Description

一种提供推荐词的方法及装置
技术领域
本申请涉及搜索技术,特别涉及一种提供推荐词的方法及装置。
背景技术
随着互联网的迅速发展,电子商务已经广泛的融入到人们的日常生活中。
在这些电子商务的应用中,输入搜索关键字进行查询是用户查找和定位其感兴趣商品的主要方法和途径,也是用户使用的最为频繁的一个基本功能。为了能够快速查找和定位所需要的商品,用户需要选择恰当的搜索关键字来描述自身的搜索需求。
通常情况下,用户的搜索习惯是由抽象到特殊,即首先输入较宽泛的搜索关键字,然后再通过特殊化搜索关键字,逐步缩小搜索范围,最终定位到具体商品。
实际应用中,许多特殊商品的拼写比较复杂生僻,用户有可能只记忆住搜索关键字的开头部分,而遗忘后续的内容,从而导致用户需要通过多次查询才能定位到其所需要的商品,而重复或多次输入搜索关键字是一个繁琐的过程,降低了搜索效率,并且容易发生输入错误。
为了有效提高用户的搜索效率,参阅图1所示,现有技术下,电子商务网站通常会对用户输入的搜索关键字进行自动补齐,即提供一系列的推荐词。一个高效的提供推荐词的方法,可以节省用户的输入成本,缓解用户构造完整搜索关键字的需求负担,同时,高质量的推荐词可以帮助用户更好的查找和定位其感兴趣的商品。
随着电子商务网站中各类商品的数目日益增多,用户从输入搜索关键词到搜索到所需商品的过程也越来越长,因此,需要重新设计一种提供推荐词的方法,在现有技术的基础上进一步提高电子商务网站的搜索效率,提升系统的服务性能。
发明内容
本申请实施例提供一种提供推荐词的方法及装置,用以解决现有技术中存在的推荐词概念模糊,从而降低搜索装置的搜索效率的问题。
本申请实施例提供的具体技术方案如下:
一种提供推荐词的方法,包括:
接收用户输入的初始查询关键字,并基于该初始查询关键字获得相应的推荐查询关键字;
确定获得的推荐查询关键字对应的至少两种类目,以及用于查询推荐查询关键字的至少两种点击区域;
分别确定获得的每一种类目针对所述推荐查询关键字在每一种点击区域下的类目权重,以及每一种点击区域的点击特征权重;
分别根据获得的每一种类目对应的类目权重,以及每一种点击区域对应的点击特征权重,计算获得每一种类目针对所述推荐查询关键字的置信度;
分别根据每一种类目针对所述推荐查询关键字的置信度,确定所述推荐查询关键字的目标类目,并对所述推荐查询关键字及相应的目标类目进行呈现。
一种提供推荐词的装置,包括:
获取单元,用于接收用户输入的初始查询关键字查询关键字,并基于该初始查询关键字获得相应的推荐查询关键字;
第一确定单元,用于确定所述推荐查询关键字对应的至少两种类目,以及用于查询推荐查询关键字的至少两种点击区域;
第二确定单元,用于分别确定获得的每一种类目针对所述推荐查询关键字在每一种点击区域下的类目权重,以及每一种点击区域的点击特征权重;
计算单元,用于分别根据获得的每一种类目对应的类目权重,以及每一种点击区域对应的点击特征权重,计算获得每一种类目针对所述推荐查询关键字的置信度;
呈现单元,用于分别根据每一种类目针对所述推荐查询关键字的置信度,确定所述推荐查询关键字的目标类目,并对所述推荐查询关键字及相应的目标类目进行呈现。
本申请实施例中,使用用户查询日志建立推荐词典,并根据用户点击日志建立类目推荐方式,这样,系统根据用户输入的初始query(查询关键字)得到相应的推荐query时,可以根据用户已有的点击行为确定各推荐query对应的目标类目,并在呈现各推荐query的同时也呈现相应的目标类目,这样,通过目标类目向用户提示各推荐query的引导意图,令用户可以根据各推荐query对应的目标类目,迅速确定自身的搜索意图,避免无关的推荐query所造成的干扰,从而有效地提高了信息搜索速度;同时,系统利用用户选取的推荐query进行搜索时只在相应目标类目下进行搜索,而不是在所有的类目下搜索,从而大量减少了搜索信息的数量,进一步提高信息搜索速度,降低了服务器的处理压力。本申请可用于计算机、无线通讯设备等电子产品。
附图说明
图1为现有技术下提供推荐词示意图;
图2为本申请实施例中提供推荐词装置原理示意图;
图3为本申请实施例中第一种权重设置示意图;
图4为本申请实施例中第二种权重设置示意图;
图5为本申请实施例中提供推荐词流程图;
图6为本申请实施例中搜索装置功能结构示意图。
具体实施方式
下面结合附图对本申请优选的实施方式进行详细说明。
字典在查询输入补齐中起着重要的作用,所有的推荐词都是基于字典产生的。例如,用户输入“pho”,通过字典查询可以得到“phone”、“photo”、“photo frame”、“photo album”等具有“pho”前缀的推荐词。
建立字典的详细流程如下:
1、输入用户的查询日志;
2、对用户的查询日志进行预处理操作,包括消除乱码、规范标点符号书写、拼写纠错(用户可能由于手误输入错误的搜索关键字)、复数转换成单数表示等,这些经过预处理之后的搜索关键字成为候选词集合;
3、从步骤2生成的候选词集合中选取一个候选词;
4、从候选词中提取并移除最左边的字母元素,例如,候选词“phone”,提取字母元素“p”,移除首字母后候选词为“hone”;
5、将候选词“phone”加入首字母“p”对应的推荐词集合中;
6、重复步骤0,直到候选词中所有的字母元素被提取;
7、将候选词“phone”加入“phone”对应的推荐词集合;
8、重复步骤0,直到候选词集合为空;
9、完成推荐词字典的建立
电子商务网站上,用于展示推荐词的空间都存在限制,仅仅能展示有限的推荐词,但是与用户输入的搜索关键字匹配的推荐词的数量通常情况下远远大于这个限制,因此,需要从推荐词中选取“质量”最好的若干个推荐词进行呈现。
本申请实施例中,采用优先级来衡量推荐词的质量,优先级越高,质量越好,具体为:首先使用推荐词与搜索关键字之间的匹配度进行排序,如果推荐词与搜索关键字的匹配属于推荐词的第一个单词,则其匹配位置为“0”,如果属于第二个单词,则匹配位置为“1”,以此类推;匹配位置越靠前,则优先级越高,例如输入“phone”,推荐词“phone case”比“mobile phone”要好,因为第一个匹配位置为0,第二个匹配位置为1;
在电子商务领域中,每个电子商品都会被归入某个类目(或同时归于多个类目),所谓类目即是指在电子商务领域中,一个商品对应的产品类别,例如,手机对应的类目为通讯器材,而相机对应的类目为数码产品等等。用户的查询行为通常是和某一个类目相关联,因此,本申请实施例中,将推荐词和类目关联在一起推荐给用户,令用户可以通过类目筛选过滤掉部分干扰因素,所谓的干扰因素即是与用户搜索目的无关的推荐词,从而提高系统的搜索效率。具体为:
通常情况下,用户在电子商务网站上输入搜索关键字后,会点击和浏览网页中非导航区内的某些商品,或者点击网页中导航区内的类目,因此,可以从用户的查询日志中学习搜索关键字(即推荐词)与类目之间的关联性。本申请实施例中,使用Offer点击行为(即网页中非导航区展示的商品信息的点击行为)、电子商务导航区点击行为作为特征,使用线性模型进行融合,它们分别对应:Offer点击模型、导航区点击模型,其融合框架如图2所示:
首先,定义两个函数:分别为:
click1(offer,query)=cat′,其中,query表示用户输入的某个搜索关键字,Offer表示用户点击了某个产品的网页,cat′表示上述Offer的类目;click1(offer,query)=cat′的含义即表示当用户输入query后,在offer网页中是否点击了类目cat′,取值为1表示点击,取值为0表示未点击。
click2(query)=cat″,其中,query表示用户输入的某个搜索关键字,表示用户点击了导航区的某个类目,click2(query)=cat″的含义即表示当用户输入query后,在导航区是否点击了类目cat″,取值为1表示点击,取值为0表示未点击。
基于上述定义的函数,Offer网页的点击特征模型可以采用公式一表示为:
Figure BDA0000063993540000061
公式一
公式“f”表示一个针对Offer抽取特征的特征函数,针对一个offer,给定query(查询词,函数中用x表示)和cat′(类目)的条件下,这个函数取值有两个:1或者0(这就是一个特征的取值),其中,特征函数中y定义为click1函数;给定一个query,并且这个query的click1(offer,query)=cat′的时候,取值为1;否则,数取值为0。通过这个函数,可以把一个Offer转换成一个特征空间,该特征空间表示用户输入query(可以是多个)后,在offer网页中分别点击了哪些类目下的商品信息。
基于上述定义的函数,导航区点击特征模型可以采用公式二表示为:
公式二
公式“f”表示一个针对导航区抽取特征的特征函数,给定一个query(查询词,函数中用x表示)和类目的条件下,这个函数取值有两个:1或者0(这就是一个特征值的取值范围);其中,特征函数中的y定义为click2函数。给定一个query,可以计算导航区类的类目的特征值,如果click2(query)=cat″,取值为1;否则,取值为0。通过这个函数,可以基于query和导航区的类目生成一个特征空间,该特征空间表示用户输入query(可以是多个)后,在导航区中分别点击了哪些类目。。
以Offer点击数据和导航区点击数据为训练数据进行训练,分别得出Offer点击特征和导航区点击特征下每一种类目的类目权重,也可以称为Offer点击区域和导航区点击区域下每一种类目的类目权重,可以理解为针对某个特定的query,用户在Offer点击区域内点击每一个类目的概率,以及用户在导航区点击区域内点击每一个类目的概率;权重的具体定义方式为:
1)Offer点击区域下的类目权重如公式三所示:
g 1 ( x , y ) = p ( y = cat ′ | x = query ) = offer _ cnt ( cat ′ , query ) Σ i offer _ cnt ( cat j , query )
公式三
其中,Offer_cnt表示在offer点击数据中,特定query下,其关联的类目是cat′的所有Offer的点击数累加;catj表示某一个预设的类目,实际应用中,电子商务网站有很多产品被归类于某一类,如,水果,“j”用来标识不同的类目。
例如,假设给定query“苹果”,在“水果”类目下用户点击了75个offer,“电子”类目下用户点击了25个offer,则g1(“苹果”,”水果”)=0.75,g1(“苹果”,”电子”)=0.25;
2)导航区点击区域下的权重如公式四所示:
g 2 ( x , y ) = p ( y = cat ′ ′ | x = query ) = sn _ cnt ( cat ′ ′ , query ) Σ i sn _ cnt ( cat j , query )
公式四
其中,sn_cnt表示在导航区点击数据中,特定query下,类目cat″的点击数累加,“j”用来标识不同的类目。假设有类目1,类目2,类目3,......,类目n,使j=1,2,...,n,可以统计所有类目下某一个query的点击数累计
例如,假设给定query“苹果”,并且导航区展示了2个类目,分别是“类目1:水果”和“类目2:电子”,在“苹果”这一query下,导航区类目1的点击数累加是75,类目2的点击数累加是25,则g2(“苹果”,“水果”)=0.75,g2(“苹果”,“电子”)=0.25。
较佳的,参阅图3所示,本实施例中,对于单个点击特征fi,需要进一步乘以其对应的权重gi,这样,可以使各个单个点击特征之间有较好的区分度,因为gi是一种最大使然比,反映了结果在训练数据中的经验分布,即是指,fi表示提取的一个点击特征,通过这个点击特征fi与其对应的gi的乘积,可以看出在这个点击特征fi下query偏向于哪一个类目,例如,仍采用上述实施例,其中,g1和g2都偏向于“水果”类目(都是0.75),那么,此时,这个点击特征fi倾向于类目1“水果”。
基于上述实施例,最后的判别操作综合了所有点击区域对应的点击特征,即各个点击区域对应的各点击特征之间也需要点击特征权重w来进行区分;因此,引入选通流程来评估特征的重要程度,即计算w,具体如图4所示,各种点击特征对应的w由管理人员根据试验结果进行预先设置。
从上述函数设置方式可以看出,g表示某一点击特征相对于输出类目的重要程度;w表示各点击特征之间的相对重要程度。
实际应用中,在训练数据进行了标注的情况下,w可以使用最大使然估计(MLE)训练得到,事实上,这种情况下可以不需要g参数(但g参数可以作为点击特征值,而不再是0,1值,直接训练特征参数即可;而在训练数据未进行标注的情况下,可以采用点击区域对应的点击特征的置信度(也可以称为该点击区域的置信度)来设置w,例如,Offer点击区域内,Offer点击特征对应的W1设置为:ω1=1-perror,其中,perror表示使用Offer点击特征进行判断的错误率;中心NP的ω值可以设定为它与原始query的相似度分值。
基于上述定义的各种函数,参阅图5所示,本申请实施例中,基于用户输入的初始query,搜索装置向用户提供相关推荐词的详细流程如下:
步骤500:接收用户输入的初始query,并基于该初始query获得相应的推荐query。
本实施例中,搜索装置接收用户输入的初始query后,由于初始query可能是不完整的,因此搜索装置需要根据预设的字典对初始query进行补充,以获得相应的推荐query,即根据初始query获得相应的推荐词。
例如,假设用户输入“pho”,则搜索装置通过字典查询可以得到“phone”、“photo”、“photo frame”、“photo album”等具有“pho”前缀的推荐词,即推荐query。
又例如,假设用户输入“苹”,则搜索装置通过字典查询可以得到“苹果”这一推荐query。
又例如,假设用户输入“苹果”,则搜索装置通过字典查询可以得到“苹果手机”、“苹果MP3”......推荐query。
后续实施例中,以用户输入的初始query为“苹”,而搜索装置根据字典对其进行补充,获得推荐query“苹果”为例进行介绍。
步骤510:确定获得的推荐query对应的至少两种类目,以及用于查询推荐query的至少两种点击区域。
本实施例中,假设“苹果”对应两种类目,分别为“水果”和“电子”,而用于查询推荐query的点击区域也有两种,一种为Offer网页,一种为导航区。
步骤520:分别确定获得的每一种类目在每一种点击区域下的类目权重g,以及每一种点击区域的点击特征权重w。
本实施例中,在确定任意一个类目(称为类目x)在任意一个点击区域(称为区域x)下的类目权重g时,采用以下方式进行计算:根据推荐query在区域x内类目x下对应的点击总数目,以及推荐query在区域x内所有类目下对应的点击数总数目的比值,确定相应的类目权重g,即类目x在区域x内的类目权重g,具体计算公式参考公式三和公式四,在此不再赘述。
同时,任意一点击区域的点击特征权重w的确定方式如下:
在训练数据进行了标注的情况下,w使用极大似然估计方式获得;
在训练数据未进行标注的情况下,采用上述任意一点击区域对应的置信度来设置w。具体设置方式在之前实施例中已介绍,在此亦不再赘述。
上述参数g和参数w的取值可以预先由管理人员配置好进行保存,并根据用户数据的变更而进行实时更新,也可以在获取推荐query后,根据当前的用户数据进行实时计算。
例如,假设针对推荐query“苹果”,系统统计用户点击行为,在offer网页的区域内,在“水果”类目下,用户点击次数总共为75次,在“电子”类目下用户点击次数总共为75次,则g1(“苹果”,“水果”)=0.75,g1(“苹果”,“电子”)=0.25;而在导航区域内,在“水果”类目下,用户点击次数总共为80次,在“电子”类目下,用户点击次数总共为20次,则g2(“苹果”,“水果”)=0.8,g2(“苹果”,“电子”)=0.2;
同时,假设使用offer点击模型预测query类目的精确度为80%,则设置Offer网页的点击特征权重为w1=0.8;使用导航区点击模型预测query类目的精确度为60%,则设置导航区的点击特征权重为w2=0.6。
步骤530:分别根据每一种类目在每一种点击区域下针对上述推荐query的类目权重g,以及每一种点击区域的点击特征权重w,计算获得每一种类目针对上述推荐query的置信度h。
本实施例中,计算任意一种类目针对上述推荐query的置信度h时,采用公式五进行计算:
h ( x , y ) = 1 | Z | Σ i = 1 k ω i g i ( x , y ) f i ( x , y ) 公式五
其中,使用h(x,y)作为x对y的置信度;
X表示推荐query;
Y表示类目对应的特征函数,如,click1(offer,query)或,click2(query),针对某一类目,若存在推荐query,则Y取值为1,若不存在推荐query,则Y取值为0,而由于本实施例中是针对存在的类目计算h(x,y)的,因此,Y就可以看作是作为计算对象的任意一种类目;
Wi表示点击区域i的点击特征权重;
K表示点击区域的数目;
gi表示类目Y在点击区域i内针对推荐query的类目权重;
fi(x,y)表示点击区域i对应的点击特征,参考公式一和公式二可以获知,若类目y下确实存在推荐query,则fi(x,y)取值为1,而公式五是针对推荐query与Y之间的对应关系存在的情况而计算的,因此,fi(x,y)取值为1,显然,可以将fi(x,y)的计算融入gi(x,y)的计算中;
Z表示归一化因子, Z = Σ y Σ i = 1 k ω i g i ( x , y ) f i ( x , y )
本实施例中,K=2,则i取值范围是1和2。
例如,结合步骤520中的举例,可以计算获得,Z==(0.8×0.75+0.6×0.8)+(0.8×0.25+0.6×0.2)=1.4;那么,
h(“苹果”,“水果”)/Z=(0.8×0.75+0.6×0.8)/1.4=77.14%;
h(“苹果”,“电子”)/Z=(0.8×0.25+0.6×0.2)/1.4=22.86%。
步骤540:分别根据每一种类目针对上述推荐query的置信度h,确定该推荐query的目标类目,并对所述推荐查询关键字及相应的目标类目进行呈现。
本实施例中,步骤540的执行方式包含但不限于以下几种:
1、将置信度超过设定阈值的类目确定为推荐query的目标类目,并按照目标类目的置信度从高到低的顺序对推荐query进行呈现;
例如,推荐query“苹果”对应两种目标类目,分别为置信度77.14%的“水果”,和置信度22.86%的“电子”类目,均超过设定门限值20%,因此,在呈现“苹果”这一推荐词,先呈现“水果”类目,再呈现“电子”类目;具体为:
初始query:苹
推荐query:苹果    水果类
推荐query:苹果    电子类
2、将置信度超过设定阈值的类目确定为推荐query的目标类目,并按照目标类目的种类对推荐query进行分组呈现。
例如,基于初始query“苹果”,其相应的推荐queryE  “苹果手机”、“苹果MP3”和“苹果耳机”,分别对应置信度56%的“手机”类目,和置信度44%的“数码影音”类目,均超过设定门限值20%,因此,在呈现上述各推荐query时,按照不同的目标类目进行分组呈现,具体为:
初始query:苹果
           手机类              数码影音类
推荐query:苹果手机            苹果MP3
                               苹果耳机
......
实际应用中还会随着业务的增加而出现多种灵活的呈现方法,上述两种方式仅为举例。
进一步地,当系统根据用户选择的推荐query作进一步搜索时,可以只在相应的目标类目下进行搜索,而不是在所有类目下进行搜索,从而有效减少了搜索信息量,进一步提高了搜索效率。
基于上述实施例,参阅图6所示,本实施例中,搜索装置包括获取单元60、第一确定单元61、第二确定单元62、
获取单元60,用于接收用户输入的推荐query,并基于该初始query获得相应的推荐query;
第一确定单元61,用于确定推荐query对应的至少两种类目,以及用于查询推荐query的至少两种点击区域;
第二确定单元62,用于分别确定获得的每一种类目针对推荐query在每一种点击区域下的类目权重,以及每一种点击区域的点击特征权重;
计算单元63,用于分别根据获得的每一种类目对应的类目权重,以及每一种点击区域对应的点击特征权重,计算获得每一种类目针对推荐query的置信度;
呈现单元64,用于分别根据每一种类目针对推荐query的置信度,确定该推荐query的目标类目,并对所述推荐查询关键字及相应的目标类目进行呈现。
综上所述,本申请实施例中,使用用户查询日志建立推荐词典,并根据用户点击日志建立类目推荐方式,这样,系统根据用户输入的初始query得到相应的推荐query时,可以根据用户已有的点击行为确定各推荐query对应的目标类目,并在呈现各推荐query的同时也呈现相应的目标类目,这样,通过目标类目向用户提示各推荐query的引导意图,令用户可以根据各推荐query对应的目标类目,迅速确定自身的搜索意图,避免无关的推荐query所造成的干扰,从而有效地提高了信息搜索速度;同时,系统利用用户选取的推荐query进行搜索时只在相应目标类目下进行搜索,而不是在所有的类目下搜索,从而大量减少了搜索信息的数量,进一步提高信息检索速度,降低了服务器的处理压力。本申请可用于计算机、无线通讯设备等电子产品。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (10)

1.一种提供推荐词的方法,其特征在于,包括:
接收用户输入的初始查询关键字,并基于该初始查询关键字获得相应的推荐查询关键字;
确定获得的推荐查询关键字对应的至少两种类目,以及用于查询推荐查询关键字的至少两种点击区域;
分别确定获得的每一种类目针对所述推荐查询关键字在每一种点击区域下的类目权重,以及每一种点击区域的点击特征权重;
分别根据获得的每一种类目对应的类目权重,以及每一种点击区域对应的点击特征权重,计算获得每一种类目针对所述推荐查询关键字的置信度;
分别根据每一种类目针对所述推荐查询关键字的置信度,确定所述推荐查询关键字的目标类目,并对所述推荐查询关键字及相应的目标类目进行呈现。
2.如权利要求1所述的方法,其特征在于,确定获得的任意一种类目针对所述推荐查询关键字在任意一点击区域下的类目权重,包括:
根据所述推荐查询关键字在所述任意一点击区域内所述任意一种类目下对应的点击总数目,以及所述推荐查询关键字在所述任意一点击区域内的所有类目下对应的点击总数目的比值,确定所述类目权重。
3.如权利要求1所述的方法,其特征在于,确定任意一点击区域的点击特征权重时,包括:
采用极大似然估计方式设置所述点击特征权重;或者,采用所述任意一点击区域对应的置信度设置所述点击特征权重。
4.如权利要求1、2或3所述的方法,其特征在于,根据获得的每一种类目对应的类目权重,以及每一种点击区域对应的点击特征权重,计算获得任意一种类目针对所述推荐查询关键字的置信度,包括:
采用公式
Figure FDA0000063993530000011
计算所述置信度;
其中,
h(x,y)表示x对y的置信度;
X表示推荐查询关键字;
Y表示所述任意一种类目;
Wi表示点击区域i的点击特征权重;
K表示点击区域的数目;
gi表示类目Y在点击区域i内针对推荐查询关键字的类目权重;
fi(x,y)表示点击区域i对应的点击特征,取值为1;
Z表示归一化因子,
5.如权利要求4所述的方法,其特征在于,分别根据每一种类目针对所述推荐查询关键字的置信度,确定所述推荐查询关键字的目标类目,并对所述推荐查询关键字及相应的目标类目进行呈现,包括:
将置信度超过设定阈值的类目确定为所述推荐查询关键字的目标类目,并按照目标类目的置信度从高到低的顺序对所述推荐查询关键字进行呈现;
或者,
将置信度超过设定阈值的类目确定为所述推荐查询关键字的目标类目,并按照目标类目的种类对所述推荐查询关键字进行分组呈现。
6.一种提供推荐词的装置,其特征在于,包括:
获取单元,用于接收用户输入的初始查询关键字查询关键字,并基于该初始查询关键字获得相应的推荐查询关键字;
第一确定单元,用于确定所述推荐查询关键字对应的至少两种类目,以及用于查询推荐查询关键字的至少两种点击区域;
第二确定单元,用于分别确定获得的每一种类目针对所述推荐查询关键字在每一种点击区域下的类目权重,以及每一种点击区域的点击特征权重;
计算单元,用于分别根据获得的每一种类目对应的类目权重,以及每一种点击区域对应的点击特征权重,计算获得每一种类目针对所述推荐查询关键字的置信度;
呈现单元,用于分别根据每一种类目针对所述推荐查询关键字的置信度,确定所述推荐查询关键字的目标类目,并对所述推荐查询关键字及相应的目标类目进行呈现。
7.如权利要求6所述的装置,其特征在于,所述第一确定单元确定获得的任意一种类目针对所述推荐查询关键字在任意一点击区域下的类目权重时,根据所述推荐查询关键字在所述任意一点击区域内所述任意一种类目下对应的点击总数目,以及所述推荐查询关键字在所述任意一点击区域内的所有类目下对应的点击总数目的比值,确定所述类目权重。
8.如权利要求6所述的装置,其特征在于,所述第一确定单元确定任意一点击区域的点击特征权重时,采用极大似然估计方式设置所述点击特征权重;或者,采用所述任意一点击区域对应的置信度设置所述点击特征权重。
9.如权利要求6、7或8所述的装置,其特征在于,所述第二确定单元根据获得的每一种类目对应的类目权重,以及每一种点击区域对应的点击特征权重,计算获得任意一种类目针对所述推荐查询关键字的置信度时,采用公式
Figure FDA0000063993530000031
计算所述置信度;其中,
h(x,y)表示x对y的置信度;
X表示推荐查询关键字;
Y表示所述任意一种类目;
Wi表示点击区域i的点击特征权重;
K表示点击区域的数目;
gi表示类目Y在点击区域i内针对推荐查询关键字的类目权重;
fi(x,y)表示点击区域i对应的点击特征,取值为1;
Z表示归一化因子,
10.如权利要求9所述的装置,其特征在于,所述呈现单元分别根据每一种类目针对所述推荐查询关键字的置信度,确定所述推荐查询关键字的目标类目,并对所述推荐查询关键字及相应的目标类目进行呈现时,将置信度超过设定阈值的类目确定为所述推荐查询关键字的目标类目,并按照目标类目的置信度从高到低的顺序对所述推荐查询关键字进行呈现;或者,将置信度超过设定阈值的类目确定为所述推荐查询关键字的目标类目,并按照目标类目的种类对所述推荐查询关键字进行分组呈现。
CN201110138955.XA 2011-05-26 2011-05-26 一种提供推荐词的方法及装置 Active CN102799591B (zh)

Priority Applications (7)

Application Number Priority Date Filing Date Title
CN201110138955.XA CN102799591B (zh) 2011-05-26 2011-05-26 一种提供推荐词的方法及装置
TW100128685A TWI582619B (zh) 2011-05-26 2011-08-11 Method and apparatus for providing referral words
PCT/US2012/039426 WO2012162541A1 (en) 2011-05-26 2012-05-24 Method and apparatus of providing suggested terms
JP2014512114A JP5984917B2 (ja) 2011-05-26 2012-05-24 提案される語を提供するための方法および装置
US13/522,142 US20120330962A1 (en) 2011-05-26 2012-05-24 Method and Apparatus of Providing Suggested Terms
EP12789336.0A EP2715574A4 (en) 2011-05-26 2012-05-24 METHOD AND APPARATUS FOR PROVIDING SUGGESTED TERMS
HK13100396.5A HK1173244A1 (zh) 2011-05-26 2013-01-10 種提供推薦詞的方法及裝置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110138955.XA CN102799591B (zh) 2011-05-26 2011-05-26 一种提供推荐词的方法及装置

Publications (2)

Publication Number Publication Date
CN102799591A true CN102799591A (zh) 2012-11-28
CN102799591B CN102799591B (zh) 2015-03-04

Family

ID=47198703

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110138955.XA Active CN102799591B (zh) 2011-05-26 2011-05-26 一种提供推荐词的方法及装置

Country Status (7)

Country Link
US (1) US20120330962A1 (zh)
EP (1) EP2715574A4 (zh)
JP (1) JP5984917B2 (zh)
CN (1) CN102799591B (zh)
HK (1) HK1173244A1 (zh)
TW (1) TWI582619B (zh)
WO (1) WO2012162541A1 (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103942198A (zh) * 2013-01-18 2014-07-23 佳能株式会社 用于挖掘意图的方法和设备
CN104281896A (zh) * 2013-07-01 2015-01-14 富士通株式会社 信息整合系统和信息整合方法
CN105183733A (zh) * 2014-06-05 2015-12-23 阿里巴巴集团控股有限公司 一种文本信息的匹配、业务对象的推送方法和装置
CN105426535A (zh) * 2015-12-18 2016-03-23 北京奇虎科技有限公司 基于搜索提示的搜索方法及装置
CN106257452A (zh) * 2015-06-19 2016-12-28 联想(新加坡)私人有限公司 基于上下文特征修改搜索结果
CN106663100A (zh) * 2014-05-30 2017-05-10 苹果公司 多域查询补全
CN108319585A (zh) * 2018-01-29 2018-07-24 北京三快在线科技有限公司 数据处理方法及装置、电子设备、计算机可读介质
CN110515929A (zh) * 2019-08-29 2019-11-29 掌阅科技股份有限公司 书籍展示方法、计算设备及存储介质
CN111552867A (zh) * 2020-03-31 2020-08-18 北京城市网邻信息技术有限公司 一种业务信息的推荐方法和装置
CN112256960A (zh) * 2020-10-10 2021-01-22 成都一课量子科技有限公司 一种商场、社区、写字楼用户推荐服务的算法方法
CN114238705A (zh) * 2020-09-09 2022-03-25 北京搜狗科技发展有限公司 一种相关搜索推荐方法、装置及电子设备

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103902535B (zh) * 2012-12-24 2019-02-22 腾讯科技(深圳)有限公司 获取联想词的方法、装置及系统
CN103914492B (zh) * 2013-01-09 2018-02-27 阿里巴巴集团控股有限公司 查询词融合方法、商品信息发布方法和搜索方法及系统
US10255363B2 (en) * 2013-08-12 2019-04-09 Td Ameritrade Ip Company, Inc. Refining search query results
US9881010B1 (en) * 2014-05-12 2018-01-30 Google Inc. Suggestions based on document topics
US9811559B2 (en) * 2014-09-01 2017-11-07 Mapquest, Inc. Computerized systems and methods for identifying points-of-interest using customized query prediction
RU2632140C2 (ru) * 2015-09-29 2017-10-02 Общество С Ограниченной Ответственностью "Яндекс" Способ и сервер для кластеризации предложений для поисковых запросов
US10515402B2 (en) * 2016-01-30 2019-12-24 Walmart Apollo, Llc Systems and methods for search result display
CN113326420B (zh) * 2021-06-15 2023-10-27 北京百度网讯科技有限公司 问题检索方法、装置、电子设备和介质
CN115618100B (zh) * 2022-09-15 2024-02-06 中航信移动科技有限公司 用于关联事件推荐的数据处理方法、存储介质及电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060122979A1 (en) * 2004-12-06 2006-06-08 Shyam Kapur Search processing with automatic categorization of queries
US20100114908A1 (en) * 2008-11-04 2010-05-06 Microsoft Corporation Relevant navigation with deep links into query
US7836391B2 (en) * 2003-06-10 2010-11-16 Google Inc. Document search engine including highlighting of confident results

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6772150B1 (en) * 1999-12-10 2004-08-03 Amazon.Com, Inc. Search query refinement using related search phrases
WO2004090754A1 (en) * 2003-04-04 2004-10-21 Yahoo! Inc. A system for generating search results including searching by subdomain hints and providing sponsored results by subdomain
TWI227417B (en) * 2003-12-02 2005-02-01 Inst Information Industry Digital resource recommendation system, method and machine-readable medium using semantic comparison of query sentence
US20050222987A1 (en) * 2004-04-02 2005-10-06 Vadon Eric R Automated detection of associations between search criteria and item categories based on collective analysis of user activity data
US7519581B2 (en) * 2004-04-30 2009-04-14 Yahoo! Inc. Method and apparatus for performing a search
US7747639B2 (en) * 2005-08-24 2010-06-29 Yahoo! Inc. Alternative search query prediction
KR100643801B1 (ko) * 2005-10-26 2006-11-10 엔에이치엔(주) 복수의 언어를 연동하는 자동완성 추천어 제공 시스템 및방법
US20080294624A1 (en) * 2007-05-25 2008-11-27 Ontogenix, Inc. Recommendation systems and methods using interest correlation
US20090171929A1 (en) * 2007-12-26 2009-07-02 Microsoft Corporation Toward optimized query suggeston: user interfaces and algorithms
US8694526B2 (en) * 2008-03-18 2014-04-08 Google Inc. Apparatus and method for displaying search results using tabs
CN101887437B (zh) * 2009-05-12 2016-03-30 阿里巴巴集团控股有限公司 一种搜索结果生成方法及信息搜索系统
CN102033877A (zh) * 2009-09-27 2011-04-27 阿里巴巴集团控股有限公司 检索方法和装置
US9405841B2 (en) * 2009-10-15 2016-08-02 A9.Com, Inc. Dynamic search suggestion and category specific completion
US8954422B2 (en) * 2010-07-30 2015-02-10 Ebay Inc. Query suggestion for E-commerce sites
US20120072281A1 (en) * 2010-09-21 2012-03-22 Yahool Inc. Method and system to monetize domain queries in sponsored search
US8972895B2 (en) * 2010-12-20 2015-03-03 Target Brands Inc. Actively and passively customizable navigation bars
US8756121B2 (en) * 2011-01-21 2014-06-17 Target Brands, Inc. Retail website user interface
US8983995B2 (en) * 2011-04-15 2015-03-17 Microsoft Corporation Interactive semantic query suggestion for content search

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7836391B2 (en) * 2003-06-10 2010-11-16 Google Inc. Document search engine including highlighting of confident results
US20060122979A1 (en) * 2004-12-06 2006-06-08 Shyam Kapur Search processing with automatic categorization of queries
US20100114908A1 (en) * 2008-11-04 2010-05-06 Microsoft Corporation Relevant navigation with deep links into query

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103942198A (zh) * 2013-01-18 2014-07-23 佳能株式会社 用于挖掘意图的方法和设备
CN103942198B (zh) * 2013-01-18 2017-07-28 佳能株式会社 用于挖掘意图的方法和设备
CN104281896A (zh) * 2013-07-01 2015-01-14 富士通株式会社 信息整合系统和信息整合方法
CN106663100B (zh) * 2014-05-30 2021-01-12 苹果公司 多域查询补全
CN106663100A (zh) * 2014-05-30 2017-05-10 苹果公司 多域查询补全
CN105183733A (zh) * 2014-06-05 2015-12-23 阿里巴巴集团控股有限公司 一种文本信息的匹配、业务对象的推送方法和装置
CN106257452A (zh) * 2015-06-19 2016-12-28 联想(新加坡)私人有限公司 基于上下文特征修改搜索结果
CN105426535A (zh) * 2015-12-18 2016-03-23 北京奇虎科技有限公司 基于搜索提示的搜索方法及装置
CN108319585A (zh) * 2018-01-29 2018-07-24 北京三快在线科技有限公司 数据处理方法及装置、电子设备、计算机可读介质
CN110515929A (zh) * 2019-08-29 2019-11-29 掌阅科技股份有限公司 书籍展示方法、计算设备及存储介质
CN111552867A (zh) * 2020-03-31 2020-08-18 北京城市网邻信息技术有限公司 一种业务信息的推荐方法和装置
CN111552867B (zh) * 2020-03-31 2021-09-28 北京城市网邻信息技术有限公司 一种业务信息的推荐方法和装置
CN114238705A (zh) * 2020-09-09 2022-03-25 北京搜狗科技发展有限公司 一种相关搜索推荐方法、装置及电子设备
CN112256960A (zh) * 2020-10-10 2021-01-22 成都一课量子科技有限公司 一种商场、社区、写字楼用户推荐服务的算法方法
CN112256960B (zh) * 2020-10-10 2024-04-16 成都一课量子科技有限公司 一种商场、社区、写字楼用户推荐服务的算法方法

Also Published As

Publication number Publication date
CN102799591B (zh) 2015-03-04
TWI582619B (zh) 2017-05-11
EP2715574A1 (en) 2014-04-09
WO2012162541A1 (en) 2012-11-29
HK1173244A1 (zh) 2013-05-10
EP2715574A4 (en) 2015-04-01
US20120330962A1 (en) 2012-12-27
JP2014515514A (ja) 2014-06-30
TW201248435A (en) 2012-12-01
JP5984917B2 (ja) 2016-09-06

Similar Documents

Publication Publication Date Title
CN102799591B (zh) 一种提供推荐词的方法及装置
US9846748B2 (en) Searching for information based on generic attributes of the query
CN101241512B (zh) 一种重新定义查询词的搜索方法及装置
US8380697B2 (en) Search and retrieval methods and systems of short messages utilizing messaging context and keyword frequency
US9116990B2 (en) Enhancing freshness of search results
US20160189047A1 (en) Method and System for Entity Linking
CN108763321B (zh) 一种基于大规模相关实体网络的相关实体推荐方法
US20170154116A1 (en) Method and system for recommending contents based on social network
CN104008186B (zh) 从目标文本中确定关键词的方法和装置
US8478704B2 (en) Decomposable ranking for efficient precomputing that selects preliminary ranking features comprising static ranking features and dynamic atom-isolated components
CN104123332A (zh) 搜索结果的显示方法及装置
CN104866572A (zh) 一种网络短文本聚类方法
CN103186574A (zh) 一种搜索结果的生成方法和装置
CN104933100A (zh) 关键词推荐方法和装置
CN105159930A (zh) 搜索关键词的推送方法和装置
CN104391999A (zh) 信息推荐方法和装置
US20110208715A1 (en) Automatically mining intents of a group of queries
EP3699780A1 (en) Method and apparatus for recommending entity, electronic device and computer readable medium
CN103136213A (zh) 一种提供相关词的方法及装置
US10698888B1 (en) Answer facts from structured content
EP3485394A1 (en) Contextual based image search results
CN104156492A (zh) 搜索内容的提示方法和装置
CN107451141B (zh) 一种数据推荐的处理交互方法、装置及系统
CN104166642A (zh) 映射表的创建方法和装置,业务对象的推荐方法和装置
CN117853200A (zh) 一种商务礼品推荐方法、装置、电子设备和介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1173244

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1173244

Country of ref document: HK