CN103123632A - 搜索中心词确定方法及装置、搜索方法及搜索设备 - Google Patents

搜索中心词确定方法及装置、搜索方法及搜索设备 Download PDF

Info

Publication number
CN103123632A
CN103123632A CN2011103718284A CN201110371828A CN103123632A CN 103123632 A CN103123632 A CN 103123632A CN 2011103718284 A CN2011103718284 A CN 2011103718284A CN 201110371828 A CN201110371828 A CN 201110371828A CN 103123632 A CN103123632 A CN 103123632A
Authority
CN
China
Prior art keywords
word
search
user
information
attribute
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2011103718284A
Other languages
English (en)
Other versions
CN103123632B (zh
Inventor
钟灵
谈云兵
王正红
金凯民
申月
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201110371828.4A priority Critical patent/CN103123632B/zh
Publication of CN103123632A publication Critical patent/CN103123632A/zh
Priority to HK13108415.5A priority patent/HK1181159A1/zh
Application granted granted Critical
Publication of CN103123632B publication Critical patent/CN103123632B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本申请公开了一种搜索中心词确定方法及装置,搜索方法及搜索设备,该方法包括:获取用户提供的搜索信息,所述搜索信息中包括用户输入的关键词、用户选择的类目信息和属性信息;将用户选择的所述类目信息转化为类目词,以及将用户选择的所述属性信息转化为属性词;将用户输入的关键词、转化得到的类目词和属性词进行组合,确定搜索中心词。通过确定的广义的搜索中心词可以获取到更多、更准确的搜索结果。

Description

搜索中心词确定方法及装置、搜索方法及搜索设备
技术领域
本申请涉及信息处理技术领域,尤指一种搜索匹配过程中的搜索中心词确定方法及装置、搜索方法及搜索设备。
背景技术
目前用户使用电子商务网站搜索展示信息时,需要首先输入搜索词(Query),例如当用户输入的搜索词为:“正品专柜”关键词+“连衣裙”类目+“雪纺”属性的时候,根据这个搜索词提取出来的搜索中心词为“正品专柜”,系统会根据这个搜索中心词搜索匹配购买了该搜索中心词作为竞价词的商品展示信息或商品广告信息,
上述搜索匹配过程中确定搜索中心词的方法,仅根据用户输入的搜索词中的关键词确定搜索中心词,而购买了这个搜索中心词作为竞价词的展示信息或广告信息可能很少,不能匹配到最佳的展示信息或广告信息,导致搜索匹配结果少,搜索匹配结果匹配准确率低,不能获取的较佳的搜索匹配信息,这时候反馈给用户的搜索结果将不能很好的满足用户的搜索需求,这将导致用户需要重新进行搜索,这不但增加了访问服务器的负担,而且增加了网络带宽的占用。
发明内容
本申请实施例提供一种搜索中心词确定方法及装置,搜索方法及搜索设备,用以解决现有技术中存在根据用户输入的搜索词中的关键词确定中心词时存在的搜索匹配准确率低,匹配结果少,不能满足用户搜索需求的问题,减轻访问服务器的负担,而且减少网络带宽的占用。
一种搜索中心词确定方法,包括:
获取用户提供的搜索信息,所述搜索信息中包括用户输入的关键词、用户选择的类目信息和属性信息;
将用户选择的所述类目信息转化为类目词,以及将用户选择的所述属性信息转化为属性词;
将用户输入的关键词、转化得到的类目词和属性词进行组合,确定搜索中心词。
一种搜索方法,包括:
接收用户的搜索请求,所述搜索请求中携带有搜索信息;
采用上述的搜索中心词确定方法确定搜索中心词;
根据所述确定搜索中心词,执行搜索,并返回搜索结果。
一种搜索中心词确定装置,包括:
获取模块,用于获取用户提供的搜索信息,所述搜索信息中包括用户输入的关键词、用户选择的类目信息和属性信息;
转化模块,用于将用户选择的所述类目信息转化为类目词,以及将用户选择的所述属性信息转化为属性词;
确定模块,用于将用户输入的关键词、转化得到的类目词和属性词进行组合,确定搜索中心词。
一种搜索设备,包括:
接收模块,用于接收用户的搜索请求,所述搜索请求中携带有搜索信息;
上述搜索中心词确定装置,用于根据搜索信息,确定搜索中心词;
搜索模块,根据所述确定搜索中心词,执行搜索,并返回搜索结果。
本申请有益效果如下:
本申请实施例提供的搜索中心词确定方法、装置及网络设备,综合考虑用户提供的搜索信息中包括用户输入的关键词、用户选择的类目信息和属性信息等各种因素,将用户选择的类目信息转化为类目词,以及将用户选择的属性信息转化为属性词,根据用户输入的关键词、转化得到的类目词和属性词的组合,确定搜索中心词。这样确定的中心词用于搜索匹配时,能够获取到范围宽泛的搜索结果,在用户输入的搜索信息不合适时,可以根据搜索信息自动匹配相关的更合适的搜索中心词,以获取最佳的搜索结果回馈给用户,通过确定更合理的、广义的搜索中心词使搜索匹配获得更多的匹配结果,提高搜索匹配的准确率,满足用户搜索需求,这减轻了访问服务器的负担,而且减少了网络带宽的占用。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本申请实施例一中搜索中心词确定方法的流程图;
图2为本申请实施例二中搜索中心词确定方法的流程图;
图3为本申请实施例中搜索中心词确定装置的结构示意图。
具体实施方式
为了使本申请所要解决的技术问题、技术方案及有益效果更加清楚、明白,以下结合附图和实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
现有技术中仅根据用户输入的搜索词中的关键词确定搜索中心词时,可能存在搜索匹配结果少,搜索匹配结果匹配准确率低,不能获取的较佳的搜索匹配结果的问题,但事实上,在用户输入搜索词后,在用户选择的类目和属性下,虽然购买了用户输入的搜索词中的关键词作为竞价词的广告信息和展示信息比较少,但是在其他关联的类目和属性下可能会有大量相关的搜索结果,而且购买了用户输入的搜索词中的关键词的相关词作为竞价词的广告信息和展示信息可能也很多,但由于用户输入的搜索词不合适,导致确定的搜索中心词不合适,进而导致匹配结果不佳。例如:购买“正品专柜”这个词的广告信息和展示信息可能只有很少一部分是“连衣裙”类目的,但又很大一部分在其关联的类目“裙子”这个类目下。此外,包含“正品专柜”这个中心词的相关词“真品”的广告信息和展示信息可能也很多,因此,为了获取到更好的搜索匹配结果,本申请提供一种搜索中心词确定方法,综合考虑与用户输入的搜索词中的类目相关的类目,以及尽可能的挖掘与中心词相关的相关词,以提高搜索匹配的准确度,获取更多更好的搜索匹配结果,使搜索匹配结果更能反映用户的搜索意图,从而提供更符合用户搜索意图的广告和商品等地展示信息。下面通过具体的实施例进行说明:
实施例一:
本申请实施例一提供的搜索中心词确定方法,其流程如图1所示,包括如下步骤:
S11:获取用户提供的搜索信息。
用户提供的搜索信息中包括用户输入的关键词、用户选择的类目信息和属性信息。通常用户需要搜索自己需要的展示信息时,以淘宝网上搜索商品信息为例,通常需要输入的搜索信息即搜索词(Query)包括输入关键字,选择类目和属性,属性可以包括品牌、价格、颜色、归属地、型号、材质、大小、款式等各种因素。
例如:用户要搜索正品白色连衣裙,输入关键字“正品”,选择类目“连衣裙”,选择属性“白色”等。
S12:将用户选择的类目信息转化为类目词,以及将用户选择的属性信息转化为属性词。
可以将用户选择的归属的类目转化为词,以及将用户选择的品牌、价格、颜色、归属地、型号、材质等重要属性转化为词,例如:针对上面的例子,根据转化规则,将类目“连衣裙”转化为词“连衣裙”或“裙子”;以及根据转化规则,将属性颜色转化为“白色”。
上述步骤S12中将用户选择的类目信息转化为类目词,可以根据预先统计的每个类目下被点击的展示信息中出现的类目相关的描述词,将每个类目下出现最多的描述词作为这个类目转化为词时,可选的类目词,具体可以选用下列方式之一实现转化:
(1)根据用户选择类目信息,确定该类目信息对应的可选类目词作为转化得到的类目词。
例如将类目“连衣裙”转化为词“连衣裙”或“裙子”,这两个词都是可选类目词,将可选类目词“连衣裙”或“裙子”均作为类目词。
(2)根据用户选择类目信息,确定该类目信息对应的可选类目词,从确定的可选类目词中选择与关键词相关性大于设定阈值的可选类目词作为转化得到的类目词。
例如将类目“连衣裙”转化为词“连衣裙”或“裙子”,这两个词都是可选类目词,分别确定可选类目词“连衣裙”、“裙子”与关键词“正品”的相关性,当相关性大于设定的相关性阈值时,才将其作为类目词。
上述步骤S12中将用户选择的所述属性信息转化为属性词,可以根据预先统计的每个属性下被点击的展示信息中出现的属性相关的描述词,将每个属性下出现最多的描述词作为这个属性转化为词时,可选的属性词。具体可以选用下列方式之一实现转化:
(1)根据用户选择属性信息,确定该属性信息对应的可选属性词作为转化得到的属性词。
例如,将属性颜色转化为词“白色”,这个词是可选属性词,将可选属性词“白色”均作为属性词。
(2)根据用户选择属性信息,确定该属性信息对应的可选属性词,从确定的可选属性词中选择与关键词相关性大于设定阈值的可选属性词作为转化得到的属性词。
例如,将属性颜色转化为词“白色”或“红色”等,这些词都是可选属性词,分别确定可选属性词“白色”、“红色”与关键词“正品”的相关性,当相关性大于设定的相关性阈值时,才将其作为属性词。
在确定需要对哪些属性进行化为词的处理时,可以统计用户点击次数,按点击次数对属性槽排序,得到点击最多的属性槽,如得到品牌、型号、款式、大小等属性,将这些属性槽下的属性值转化为词。其中,属性槽是指品牌、型号、款式、大小等属性;而属性值是值具体的属性,如品牌下的三星、诺基亚等。同一个属性值可能有多个中文或者英文的名称;如:nokia和诺基亚指的是同样的东西,则选择最可能的一个作为代表这个属性的属性词。
上述可选类目词与关键词的相关性,或可选属性词与关键词的相关性通过下列公式计算得到:
H=P(x,y)/(P(x)*p(y))
其中,H为可选类目词与关键词的相关性,或可选属性词与关键词的相关性;
P(x)表示可选类目词或可选属性词出现的概率,例如“裙子”出现的概率;
P(y)表示关键词出现的概率,例如“正品”出现的概率;
P(x,y)表示可选类目词与关键词共同出现的概率,或可选属性词与关键词共同出现的概率,例如“裙子”和“正品”同时出现的概率。
S13:将用户输入的关键词、转化得到的类目词和属性词进行组合,确定搜索中心词。
将用户输入的关键词、转化得到的类目词和属性词进行组合,对组合后的词进行筛选和去重处理后,得到至少一个候选中心词,可以将得到的候选中心词直接作为搜索中心词,也可以判断确定的候选中心词是否是可提供的展示信息中包含的展示关键词,当判断为是时,再确定候选中心词为搜索中心词。
其中,可提供的展示信息中包含的展示关键词一般是指信息提供者购买的竞价词,例如卖家为了展示和推广自己的商品,在淘宝上购买“nokia n73”或“白色+连衣裙”等竞价词,则用户输入搜索信息后,可以通过搜索中心词搜索到卖家展示的“nokia n73”手机或“白色连衣裙”。
在对用户输入的关键词、转化得到的类目词和属性词进行组合时,会简化用户输入的搜索信息,取出关键词中一些多余或不重要的或重复的词,添加一些相关的词,最终确定搜索中心词。
例如:将关键词“正品”、转化词“连衣裙”或“裙子”、转化词“白色”进行组合,组合成“正品+连衣裙+白色”和“正品+裙子+白色”,将这两个组合都作为搜索中心词或选择其中之一作为搜索中心词。或者,判断这两个组合是不是可提供的展示信息中包含的展示关键词——展示信息提供者购买的竞价词,当判断为是时,再确定为搜索中心词,以避免将不是竞价词的组合作为搜索中心词,搜索不到展示信息而浪费搜索资源的问题。
实施例二:
本申请实施例二提供的搜索中心词确定方法,其流程如图2所示,包括如下步骤:
S21:获取用户提供的搜索信息。
参照步骤S11。
S22:根据设置的搜索中心词确定规则,判断是否是根据搜索信息中的关键词获取搜索中心词。
该步骤实现获取用户提供的搜索信息之后,选择确定搜索中心词的方式,是根据搜索信息中的关键词确定,还是根据搜索信息中的关键词、类目信息、属性信息确定。
若是,执行步骤S23;否则,执行步骤S24。
S23:根据搜索信息中包含的关键词确定搜索中心词。
仅根据搜索关键词确定的方式可以采用下述例举的方式,或现有技术中的其他方式:
预处理过程:获取三个词表:一是品牌名词表,如三星、诺基亚、only,google等;二是型号名称词表,如n73,e72等;三是产品名词表,如手机、电池、上衣、T恤、皮鞋等。从用户输入的搜索信息中挖掘“产品、品牌、型号”的组合情况和从信息提供者提供的展示信息中挖掘“产品、品牌、型号”的组合情况,并记录每种组合出现的次数;
当用户输入搜索信息后,提取“产品、品牌、型号”的组合,并根据每种组合在上述统计的各组合的出现次数中的来排序,最终得到一个或者多个中心词。
当然还可以获取更多的词表,如颜色、款式等词表,进一步的挖掘中心词。
S24:将用户选择的类目信息转化为类目词,以及将用户选择的属性信息转化为属性词。
参照步骤S12。
S25:将用户输入的关键词、转化得到的类目词和属性词进行组合,确定搜索中心词。
参照步骤S13。
S26:查询预先建立的词关联关系,确定搜索中心词的相关词,将查询到的相关词作为搜索中心词。
该步骤在确定搜索中心词的基础上进一步挖掘相关词,以扩大可搜索匹配的范围,获取更多的搜索结果,弥补搜索信息输入不恰当导致的搜索结果不准确的问题。匹配相关词的前提条件是建立词关联关系,可以预先建立一个关联词库,存储有关联关系的词,实现建立词关联关系,该关联词库可以人工确定相关词后建立,也可以按照一定的规则挖掘相关词后建立。
挖掘相关词建立词关联关系的方法很多,下面列举其中两种:
方式一:通过点击共现的方式挖掘相关词。
获取用户根据输入的搜索信息中包含的关键词点击各展示信息的次数,组成次数向量,计算两个关键词对应的次数向量的相关度,当所述相关度大于设定的相关度阈值,确定两个关键词为相关词,并建立确定的两个相关词的词关联关系。
例如:用户输入包含关键词q1的搜索信息时,在搜索结果中浏览并点击的各展示信息,如商品的统一资源定位符(Uniform/Universal Resource Locator,URL),其点击次数组成次数向量v1;用户输入包含关键词q2的搜索信息时,在搜索结果中浏览并点击的各展示信息(如商品的URL),其点击次数组成次数向量v2;通过计算v1和v2的余弦值cos(v1,v2)来计算相关性。把与q1相关性最高的q2作为q1的相关词。
方式二:通过用户输入共现挖掘相关词。
获取用户输入的搜索信息中一个关键词与其他关键词共同出现的次数,得到所述一个关键词与其他关键词共同出现的概率;确定与一个关键词共同出现的概率超过设定的阈值的其他关键词为一个关键词的相关词,并建立确定的两个相关词的词关联关系。
例如:用户1输入关键词a、b;用户2输入关键词a、b、c;用户3输入关键词a、c、d;据此和关键词a共现频率较高的关键词是b、c,因此,词b、c可以确定为a的相关词。
可以采用这两种方式之一或组合来挖掘相关词,确定词关联关系。
基于同一申请构思,本申请实施例还提供一种搜索方法,包括:
接收用户的搜索请求,所述搜索请求中携带有搜索信息;
采用上述任一搜索中心词确定方法实施例确定搜索中心词;
根据所述确定搜索中心词,执行搜索,并返回搜索结果。
基于同一申请构思,本申请实施例还提供的搜索中心词确定装置,该装置可以设置网络设备中,实现搜索中心词的确定以便根据确定的搜索中心词为用户提供搜索匹配结果。该装置的结构如图3所示,包括:获取模块10、转化模块20和确定模块30。
获取模块10,用于获取用户提供的搜索信息,其中,搜索信息中包括用户输入的关键词、用户选择的类目信息和属性信息。
转化模块20,用于将用户选择的类目信息转化为类目词,以及将用户选择的属性信息转化为属性词。
确定模块30,用于将用户输入的关键词、转化得到的类目词和属性词进行组合,确定搜索中心词。
优选的,上述转化模块20,具体用于根据用户选择类目信息,确定该类目信息对应的可选类目词作为转化得到的类目词;或根据用户选择类目信息,确定该类目信息对应的可选类目词,从确定的可选类目词中选择与关键词相关性大于设定阈值的可选类目词作为转化得到的类目词。
优选的,上述转化模块20,具体用于根据用户选择属性信息,确定该属性信息对应的可选属性词作为转化得到的属性词;或根据用户选择属性信息,确定该属性信息对应的可选属性词,从确定的可选属性词中选择与关键词相关性大于设定阈值的可选属性词作为转化得到的属性词。
优选的,上述确定模块30,具体用于将用户输入的关键词、转化得到的类目词和属性词进行组合,对组合后的词进行筛选和去重处理后,得到至少一个候选中心词;判断确定的候选中心词是否是可提供的展示信息中包含的展示关键词,当判断为是时,确定该候选中心词为搜索中心词。
优选的,上述确定模块30,还用于查询预先建立的词关联关系,确定搜索中心词的相关词,将查询到的相关词作为搜索中心词。
优选的,上述搜索中心词确定装置,还包括:
关联模块40,用于获取用户根据输入的搜索信息中包含的关键词点击各展示信息的次数,组成次数向量,计算两个关键词对应的次数向量的相关度,当相关度大于设定的相关度阈值,确定两个关键词为相关词,并建立确定的两个相关词的词关联关系;和/或获取用户输入的搜索信息中一个关键词与其他关键词共同出现的次数,得到一个关键词与其他关键词共同出现的概率;确定与一个关键词共同出现的概率超过设定的阈值的其他关键词为一个关键词的相关词,并建立确定的两个相关词的词关联关系。
优选的,上述搜索中心词确定装置,还包括:
控制模块50,用于获取模块10获取用户提供的搜索信息之后,根据设置搜索中心词确定规则,判断是否是根据搜索信息中的关键词获取搜索中心词;若判断为是,则通知确定模块30根据搜索信息中包含的关键词确定搜索中心词;当判断为否时,再通知转化模块20执行将用户选择的类目信息转化为类目词,将用户选择的属性信息转化为属性词的步骤。
一种搜索设备,包括:
接收模块,用于接收用户的搜索请求,所述搜索请求中携带有搜索信息;
上述任一搜索中心词确定装置实施例,用于根据搜索信息,确定搜索中心词;
搜索模块,根据所述确定搜索中心词,执行搜索,并返回搜索结果。
上述方法及装置可以在淘宝网的p4p广告系统中应用,在用户搜索信息时,尽量考虑用户提供的搜索信息中包括的关键词、类目、属性等各种因素,共同获取中心词,从而可以从用户提供的信息中,获取更加准确的中心词,使确定的中心词更合适、更广泛,通过广义的中心词可以获取到更多更好地匹配结果。避免现有技术中仅根据关键词确定中心词时,搜索匹配结果少的问题,尤其是在用户输入的关键词不合适、不恰当时,也能够获取到满意的搜索结果。上述方法充分利用类目和属性信息,提高查询结果的准确性,提高查询结果匹配度,以满足用户的查询需求。
上述方法,还可以进一步匹配确定的搜索中心词的相关词,从而进一步获取相关结果,这样可以获取到更多更好地展示信息,提高搜索到的匹配结果的数量,也提高用户搜索的体验效果。
本领域的技术人员应明白,本申请的实施例可提供为方法、装置(设备)、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。例如:可以通过Linux,C或者C++语言等编程语言编辑计算机程序功能模块实现。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、装置(设备)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
上述说明示出并描述了本申请的优选实施例,但如前所述,应当理解本申请并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述申请构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本申请的精神和范围,则都应在本申请所附权利要求的保护范围内。

Claims (10)

1.一种搜索中心词确定方法,其特征在于,包括:
获取用户提供的搜索信息,所述搜索信息中包括用户输入的关键词、用户选择的类目信息和属性信息;
将用户选择的所述类目信息转化为类目词,以及将用户选择的所述属性信息转化为属性词;
将用户输入的关键词、转化得到的类目词和属性词进行组合,确定搜索中心词。
2.如权利要求1所述的方法,其特征在于,所述将用户选择的所述类目信息转化为类目词,包括:
根据用户选择类目信息,确定该类目信息对应的可选类目词作为转化得到的类目词;或
根据用户选择类目信息,确定该类目信息对应的可选类目词,从确定的可选类目词中选择与所述关键词相关性大于设定阈值的可选类目词作为转化得到的类目词。
3.如权利要求1所述的方法,其特征在于,所述将用户选择的所述属性信息转化为属性词,包括:
根据用户选择属性信息,确定该属性信息对应的可选属性词作为转化得到的属性词;或
根据用户选择属性信息,确定该属性信息对应的可选属性词,从确定的可选属性词中选择与所述关键词相关性大于设定阈值的可选属性词作为转化得到的属性词。
4.如权利要求2或3所述的方法,其特征在于,所述可选类目词或可选属性词与所述关键词的相关性通过下列公式计算得到:
H=P(x,y)/(P(x)*p(y))
其中,H为可选类目词与所述关键词的相关性,或可选属性词与所述关键词的相关性;
P(x)表示可选类目词或可选属性词出现的概率;
P(y)表示所述关键词出现的概率;
P(x,y)表示可选类目词与关键词共同出现的概率,或可选属性词与所述关键词共同出现的概率。
5.如权利要求1所述的方法,其特征在于,所述将用户输入的关键词、转化得到的类目词和属性词进行组合,确定搜索中心词,具体包括:
将用户输入的关键词、转化得到的类目词和属性词进行组合,对组合后的词进行筛选和去重处理后,得到至少一个候选中心词;
判断确定的候选中心词是否是可提供的展示信息中包含的展示关键词,当判断为是时,确定所述候选中心词为所述搜索中心词。
6.如权利要求1所述的方法,其特征在于,所述确定搜索中心词之后,还包括:
查询预先建立的词关联关系,确定所述搜索中心词的相关词,将查询到的相关词作为搜索中心词,其中,建立词关联关系的过程具体包括:
获取用户根据输入的搜索信息中包含的关键词点击各展示信息的次数,组成次数向量,计算两个关键词对应的次数向量的相关度,当所述相关度大于设定的相关度阈值,确定两个关键词为相关词,并建立确定的两个相关词的词关联关系;和/或
获取用户输入的搜索信息中一个关键词与其他关键词共同出现的次数,得到所述一个关键词与其他关键词共同出现的概率;确定与所述一个关键词共同出现的概率超过设定的阈值的所述其他关键词为所述一个关键词的相关词,并建立确定的两个相关词的词关联关系。
7.如权利要求1所述的方法,其特征在于,获取用户提供的搜索信息之后,还包括:
根据设置搜索中心词确定规则,判断是否是根据所述搜索信息中的关键词获取搜索中心词;
若判断为是,则根据所述搜索信息中包含的关键词确定搜索中心词;当判断为否时,再执行将用户选择的所述类目信息转化为类目词,将用户选择的所述属性信息转化为属性词的步骤。
8.一种搜索方法,其特征在于,包括:
接收用户的搜索请求,所述搜索请求中携带有搜索信息;
采用权1至8中任一权项所述的搜索中心词确定方法确定搜索中心词;
根据所述确定搜索中心词,执行搜索,并返回搜索结果。
9.一种搜索中心词确定装置,其特征在于,包括:
获取模块,用于获取用户提供的搜索信息,所述搜索信息中包括用户输入的关键词、用户选择的类目信息和属性信息;
转化模块,用于将用户选择的所述类目信息转化为类目词,以及将用户选择的所述属性信息转化为属性词;
确定模块,用于将用户输入的关键词、转化得到的类目词和属性词进行组合,确定搜索中心词。
10.一种搜索设备,其特征在于,包括:
接收模块,用于接收用户的搜索请求,所述搜索请求中携带有搜索信息;
权9所述的搜索中心词确定装置,用于根据搜索信息,确定搜索中心词;
搜索模块,根据所述确定搜索中心词,执行搜索,并返回搜索结果。
CN201110371828.4A 2011-11-21 2011-11-21 搜索中心词确定方法及装置、搜索方法及搜索设备 Active CN103123632B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201110371828.4A CN103123632B (zh) 2011-11-21 2011-11-21 搜索中心词确定方法及装置、搜索方法及搜索设备
HK13108415.5A HK1181159A1 (zh) 2011-11-21 2013-07-18 搜索中心詞確定方法及裝置、搜索方法及搜索設備

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110371828.4A CN103123632B (zh) 2011-11-21 2011-11-21 搜索中心词确定方法及装置、搜索方法及搜索设备

Publications (2)

Publication Number Publication Date
CN103123632A true CN103123632A (zh) 2013-05-29
CN103123632B CN103123632B (zh) 2016-02-24

Family

ID=48454611

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110371828.4A Active CN103123632B (zh) 2011-11-21 2011-11-21 搜索中心词确定方法及装置、搜索方法及搜索设备

Country Status (2)

Country Link
CN (1) CN103123632B (zh)
HK (1) HK1181159A1 (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105488121A (zh) * 2015-11-24 2016-04-13 魏强 精确检索系统
CN105589954A (zh) * 2015-12-21 2016-05-18 北京奇虎科技有限公司 基于中心词确定搜索建议的方法及装置
CN107229659A (zh) * 2016-03-25 2017-10-03 华为软件技术有限公司 一种信息搜索方法及装置
CN108153792A (zh) * 2016-12-02 2018-06-12 阿里巴巴集团控股有限公司 一种数据处理方法和相关装置
CN108470289A (zh) * 2018-03-15 2018-08-31 苏宁易购集团股份有限公司 基于电商购物平台的虚拟物品发放方法及设备
CN108664513A (zh) * 2017-03-31 2018-10-16 北京京东尚科信息技术有限公司 用于推送关键词的方法、装置以及设备
CN108897734A (zh) * 2018-06-13 2018-11-27 康键信息技术(深圳)有限公司 用户画像生成方法、装置、计算机设备和存储介质
CN111582901A (zh) * 2019-02-19 2020-08-25 北京沃东天骏信息技术有限公司 一种展示链接效果的量化方法、装置、系统及存储介质
CN113034197A (zh) * 2021-04-08 2021-06-25 安徽斯百德信息技术有限公司 一种电商营销推广系统、方法、计算机设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102033877A (zh) * 2009-09-27 2011-04-27 阿里巴巴集团控股有限公司 检索方法和装置
US20110099183A1 (en) * 2007-06-28 2011-04-28 Microsoft Corporation Search-based filtering for property grids

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110099183A1 (en) * 2007-06-28 2011-04-28 Microsoft Corporation Search-based filtering for property grids
CN102033877A (zh) * 2009-09-27 2011-04-27 阿里巴巴集团控股有限公司 检索方法和装置

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105488121A (zh) * 2015-11-24 2016-04-13 魏强 精确检索系统
CN105589954A (zh) * 2015-12-21 2016-05-18 北京奇虎科技有限公司 基于中心词确定搜索建议的方法及装置
CN107229659A (zh) * 2016-03-25 2017-10-03 华为软件技术有限公司 一种信息搜索方法及装置
CN107229659B (zh) * 2016-03-25 2021-06-22 华为技术有限公司 一种信息搜索方法及装置
CN108153792A (zh) * 2016-12-02 2018-06-12 阿里巴巴集团控股有限公司 一种数据处理方法和相关装置
CN108153792B (zh) * 2016-12-02 2023-04-18 阿里巴巴集团控股有限公司 一种数据处理方法和相关装置
CN108664513A (zh) * 2017-03-31 2018-10-16 北京京东尚科信息技术有限公司 用于推送关键词的方法、装置以及设备
CN108470289A (zh) * 2018-03-15 2018-08-31 苏宁易购集团股份有限公司 基于电商购物平台的虚拟物品发放方法及设备
CN108897734A (zh) * 2018-06-13 2018-11-27 康键信息技术(深圳)有限公司 用户画像生成方法、装置、计算机设备和存储介质
CN108897734B (zh) * 2018-06-13 2023-08-22 康键信息技术(深圳)有限公司 用户画像生成方法、装置、计算机设备和存储介质
CN111582901A (zh) * 2019-02-19 2020-08-25 北京沃东天骏信息技术有限公司 一种展示链接效果的量化方法、装置、系统及存储介质
CN113034197A (zh) * 2021-04-08 2021-06-25 安徽斯百德信息技术有限公司 一种电商营销推广系统、方法、计算机设备及存储介质

Also Published As

Publication number Publication date
HK1181159A1 (zh) 2013-11-01
CN103123632B (zh) 2016-02-24

Similar Documents

Publication Publication Date Title
CN103123632B (zh) 搜索中心词确定方法及装置、搜索方法及搜索设备
US8661027B2 (en) Vertical search-based query method, system and apparatus
TWI614702B (zh) 電子商務網站導航方法及系統
CN102402619B (zh) 一种搜索方法和装置
CN102096717B (zh) 搜索方法及搜索引擎
CN102053983B (zh) 一种垂直搜索的查询方法、系统和装置
TWI640878B (zh) Query word fusion method, product information publishing method, search method and system
CN103577432B (zh) 一种商品信息搜索方法和系统
US9727906B1 (en) Generating item clusters based on aggregated search history data
TWI615723B (zh) 網路搜尋方法及設備
CN102043833A (zh) 一种基于查询词进行搜索的方法和搜索装置
CN103136257B (zh) 信息提供方法及其装置
CN105677767A (zh) 一种设备配置推荐方法和装置
CN104077286A (zh) 商品信息的搜索方法及系统
CN109241403A (zh) 项目推荐方法、装置、机器设备和计算机可读存储介质
CN103946842A (zh) 检索装置、检索方法、检索程序和记录介质
CN103778553A (zh) 一种商品属性推荐方法及系统
CN106326318B (zh) 搜索方法及装置
CN104142945A (zh) 一种基于查询词的检索方法及装置
CN103257962A (zh) 信息提供方法以及装置
CN104123285A (zh) 搜索结果的导航方法及装置
CN102831526A (zh) 一种针对在线交易应用的商品搜索排序的方法和系统
CN103020083A (zh) 需求识别模板的自动挖掘方法、需求识别方法及对应装置
CN102737038B (zh) 关联度确定方法及装置、信息提供方法及装置
EP3062240A1 (en) Search system, search criteria setting device, control method for search criteria setting device, program, and information storage medium

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1181159

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant