CN106326318A - 搜索方法及装置 - Google Patents

搜索方法及装置 Download PDF

Info

Publication number
CN106326318A
CN106326318A CN201510401478.XA CN201510401478A CN106326318A CN 106326318 A CN106326318 A CN 106326318A CN 201510401478 A CN201510401478 A CN 201510401478A CN 106326318 A CN106326318 A CN 106326318A
Authority
CN
China
Prior art keywords
query
target resource
attribute
resource
cluster
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510401478.XA
Other languages
English (en)
Other versions
CN106326318B (zh
Inventor
王瑶
吴振元
郑伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Singapore Holdings Pte Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201510401478.XA priority Critical patent/CN106326318B/zh
Publication of CN106326318A publication Critical patent/CN106326318A/zh
Application granted granted Critical
Publication of CN106326318B publication Critical patent/CN106326318B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Abstract

本申请提供一种搜索方法及装置。搜索方法包括:接收用户输入的当前query;确定当前query对应的目标资源类目及目标资源类目下对应于当前query的目标资源聚类属性,目标资源聚类属性是根据目标资源类目下与当前query有关的历史资源数据聚类出的网络资源共有的属性;获取目标资源类目下符合目标资源聚类属性的网络资源;将目标资源类目下符合目标资源聚类属性的网络资源展现给用户。本申请可以缩短搜索路径,提高搜索效率。

Description

搜索方法及装置
【技术领域】
本申请涉及互联网技术领域,尤其涉及一种搜索方法及装置。
【背景技术】
随着互联网技术的发展,互联网上的资源(简称网络资源)越来越丰富。用户通过搜索引擎可以搜索所需的网络资源。
目前,较为常用的搜索方式为:用户输入搜索词条(query),搜索引擎根据用户输入的query进行搜索并输出搜索结果。一般来说,用户输入的query都比较模糊,导致搜索结果的数量较多,此时用户需要细化query,搜索引擎根据用户细化后的query对搜索结果进行筛选,以缩小搜索结果的数量,便于用户从中发现所需的信息。以网络购物中的网络商品搜索为例,买家在网站提供的输入框中输入网络商品名称,搜索引擎给出大量网络商品信息,接着用户输入供应商名称,搜索引擎从中筛选出由供应商名称所标识的供应商提供的网络商品。这种搜索方式的搜索路径比较长,搜索效率低。
【发明内容】
本申请的多个方面提供一种搜索方法及装置,用以缩短搜索路径,提高搜索效率。
本申请的一方面,提供一种搜索方法,包括:
接收用户输入的当前搜索词条query;
确定当前query对应的目标资源类目及所述目标资源类目下对应于所述当前query的目标资源聚类属性,所述目标资源聚类属性是根据所述目标资源类目下与所述当前query有关的历史资源数据聚类出的网络资源共有的属性;
获取所述目标资源类目下符合所述目标资源聚类属性的网络资源;
将所述目标资源类目下符合所述目标资源聚类属性的网络资源展现给所述用户。
本申请的另一方面,提供一种搜索装置,包括:
接收模块,用于接收用户输入的当前搜索词条query;
确定模块,用于确定当前query对应的目标资源类目及所述目标资源类目下对应于所述当前query的目标资源聚类属性,所述目标资源聚类属性是根据所述目标资源类目下与所述当前query有关的历史资源数据聚类出的网络资源共有的属性;
第一获取模块,用于获取所述目标资源类目下符合所述目标资源聚类属性的网络资源;
展现模块,用于将所述目标资源类目下符合所述目标资源聚类属性的网络资源展现给所述用户。
由上述技术方案可知,本申请基于当前query对应的目标资源类目及目标资源类目下对应于当前query的目标资源聚类属性进行搜索,展现给用户的是目标资源类目下符合该目标资源聚类属性的网络资源,由于目标资源属性是根据当前query对应的资源类目下与当前query有关的历史资源数据聚类出的网络资源共有的属性,因此与直接根据当前query获取的网络资源相比,本申请展现给用户的网络资源更加符合用户的需求,并且经过资源类目与资源聚类属性两个标准筛选出的网络资源的数量相对较少,用户从中获取所需资源的概率较高,有利于缩短搜索路径,提高搜索效率。
【附图说明】
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请一实施例提供的搜索方法的流程示意图;
图2为本申请一实施例提供的推荐系统的结构示意图;
图3为本申请一实施例提供的推荐装置的结构示意图;
图4为本申请另一实施例提供的搜索装置的结构示意图;
图5为本申请又一实施例提供的搜索装置的结构示意图。
【具体实施方式】
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
图1为本申请一实施例提供的搜索方法的流程示意图。如图1所示,该方法包括:
101、接收用户输入的当前query。
102、确定当前query对应的目标资源类目及目标资源类目下对应于当前query的目标资源聚类属性,该目标资源聚类属性是根据目标资源类目下与当前query有关的历史资源数据聚类出的网络资源共有的属性。
103、获取目标资源类目下符合目标资源聚类属性的网络资源。
104、将目标资源类目下符合目标资源聚类属性的网络资源展现给用户。
针对现有技术存在的搜索路径较长,搜索效率较低的问题,本实施例提供一种搜索方法,具体可由搜索装置来执行。搜索装置可以是各种搜索引擎。
具体的,当用户需要搜索网络资源时,输入query,以供搜索装置进行搜索。为便于与历史搜索过程中使用的query(简称为历史query)进行区分,将用户在本次搜索过程中输入的query称为当前query。搜索装置接收用户输入的当前query。与现有技术不同,搜索装置在接收到当前query后,并不直接采用当前query进行搜索,而是确定当前query对应的资源类目以及在当前query对应的资源类目下对应于当前query的资源聚类属性,之后基于所确定的资源类目及资源聚类属性进行搜索,获取符合所确定的资源类目及资源聚类属性的网络资源并展现给用户。其中,为了便于描述,将当前query对应的资源类目记为目标资源类目,将目标资源类目下对应于当前query的资源聚类属性记为目标资源聚类属性。
在本实施例中,资源类目是指对网络资源的分类。不同类型的网络资源,对应的资源类目有所不同。本实施例对资源类目的实现不做具体限定。举例说明,以各电商网站提供的网络商品为例,常见的类目包括:服装类、家用电器类、个护类、运动户外、母婴类等等。
在本实施例中,资源聚类属性是指根据某类网络资源对应的历史资源数据聚类出的该类网络资源共有的属性。一般来说,一个query可能对应多个资源类目;在某个资源类目下,一个query一般对应一类网络资源。基于此,在某个资源类目下对应于某个query的资源聚类属性是指根据该资源类目下与所对应的query有关的历史资源数据聚类出的网络资源共有的属性。相应的,目标资源聚类属性是指根据目标资源类目下与当前query有关的历史资源数据聚类出的网络资源共有的属性。其中,与当前query有关的历史资源数据是指在使用当前query作为query的历史搜索过程中产生的与网络资源有关的数据。
值得说明的是,根据网络资源类型的不同,历史资源数据也会有所不同。举例说明,以网络资源为网络商品为例,历史资源数据包括网络资源的名称、价格、产地、材料、供应商名称、点击数、询盘数、报价数、成交数及询盘反馈数等等。
由于目标资源聚类属性是根据目标资源类目下与当前query有关的历史资源数据聚类出的网络资源共有的属性,所以基于目标资源类目及目标资源聚类属性搜索到的网络资源是目标类目下符合上述共有属性的网络资源,其更加符合用户的需求,且数量相对较少,用户从中获取所需资源的概率较高,所以有利于缩短搜索路径,提高搜索效率。
在一可选实施方式中,为了便于用户更加充分的了解所展现的网络资源,搜索装置还可以将目标资源聚类属性展现给用户,这样用户在了解网络资源的同时,可以进一步了解与该网络资源相类似的网络资源所具有的共性,以向用户提供更加丰富的网络资源信息。另外,在现有技术中,网络资源的一些属性信息等一般会在网络资源的详情页面上进行展现,因此用户需要点击进入网络资源对应的详情页面进行了解,在本实施方式中,用户不需要像现有技术那样点击进入详情页面,直接在搜索结果页面既可了解网络资源的一些共有属性,有利于提高用户了解有关信息的效率。另外,采用该方式还可以节约资源详情页面,相当于进行了页面之间的聚合,有利于节约网络资源。
进一步,为了便于用户快捷方便的获取相似网络资源的信息,搜索装置还可以根据符合目标资源聚类属性的网络资源生成聚类资源页面,并生成目标资源聚类属性对应的标签,该标签指向该聚类资源页面;将该标签展现给用户,以供用户通过该标签访问聚类资源页面。聚类资源页面上展现有符合目标资源聚类属性的网络资源。值得说明的是,符合目标资源聚类属性的网络资源可能属于同一资源类目,也可能属于不同资源类目。
在商品实现上,上述目标资源类目下符合目标资源聚类属性的网络资源、目标资源聚类属性以及目标资源聚类属性对应的标签可以展现在同一结果页面上相对应的位置。
基于上述标签,用户若希望了解具有某个属性的类似网络资源,可以直接点击上述标签,进入聚类资源页面,即可对相似网络资源进行比较、筛选等。
在一可选实施方式中,搜索装置在获取目标资源类目下符合目标资源聚类属性的网络资源之后,可以直接在结果页面上进行展现。
在另一可选实施方式中,考虑到用户更加适应现有搜索方式,于是搜索装置还可以直接根据用户输入的当前query进行搜索,并在第一结果页面上展现直接根据当前query搜索到的网络资源,同时在第一结果页面上设置一入口,用于供用户发出展现指令,该展现指令用于指示搜索装置将目标资源类目下符合目标资源聚类属性的网络资源展现给用户。
在该实施方式中,搜索装置展现给用户的是直接根据当前query搜索到的网络资源。当用户需要展现目标资源类目下符合目标资源聚类属性的网络资源时,用户通过第一结果页面上的入口发出展现指令;搜索装置接收用户通过第一结果页面上的入口发出的展现指令;根据展现指令,将目标资源类目下符合目标资源聚类属性的网络资源展现给用户。
其中,搜索装置根据展现指令,将目标资源类目下符合目标资源聚类属性的网络资源展现给用户可以采用但不限于以下两种方式:
在一种方式中,搜索装置可以根据展现指令,将目标资源类目下符合目标资源聚类属性的网络资源展现在第二结果页面上。在该实施方式中,搜索装置通过不同的结果页面分别展现直接根据当前query搜索到的网络资源和目标资源类目下符合目标资源聚类属性的网络资源。
在另一种方式中,搜索装置根据展现指令,将第一结果页面上展现的直接根据当前query搜索到的网络资源,替换为目标资源类目下符合目标资源聚类属性的网络资源。在该实施方式中,搜索装置通过同一结果页面展现直接根据当前query搜索到的网络资源和目标资源类目下符合目标资源聚类属性的网络资源。
在一可选实施方式中,可以预先生成资源类目属性表,该资源类目属性表包括历史query、资源类目及资源聚类属性之间的对应关系。基于此,一种确定当前query对应的目标资源类目及目标资源类目下对应于当前query的目标资源聚类属性的实施方式,包括:
根据当前query在资源类目属性表中进行匹配;
从资源类目属性表中,获取当前query匹配中的历史query对应的资源类目作为目标资源类目属性,获取当前query匹配中的历史query对应的资源类目下对应于当前query匹配中的历史query的资源聚类属性作为目标资源聚类属性。
可选的,在使用资源类目属性表之前,包括生成资源类目属性表的过程。生成资源类目属性表的过程如下:
对历史query进行聚类,以确定历史query对应的资源类目;
对资源类目下与历史query有关的历史资源数据进行聚类,以获得资源类目下对应于历史query的资源聚类属性;
根据历史query、资源类目及资源聚类属性之间的对应关系生成资源类目属性表。
进一步,在对历史query进行聚类,以确定历史query对应的资源类目之前,可以确定历史query。这里的历史query是指历史搜索过程中使用的query及相关query。
确定历史query的方式包括:
从query日志中获取种子query;例如,可以从query日志中,选择在指定时间范围内出现的且PV最高的前N个query作为种子query;
对种子query进行扩展,以获得扩展query;例如,可以对种子query进行以下扩展方式中的至少一个,以获得扩展query:语义扩展、同义词扩展、包含关系扩展和关键词扩展;
将种子query和扩展query作为历史query。
可选的,本申请技术方案可用于电子商务领域,具体用于网络购物场景中。即用户可以采用本申请技术方案搜索需要购买的网络商品。网络商品是买家和卖家在电商平台上发起业务的载体,网络商品一方面具有本身既定的自然属性,例如标题、属性、规格、计量单位等,另一方面还具有一些附加属性,例如与交易、物流等相关的信息。
本申请技术方案可在各种类型的电商平台上实施,例如B2B、B2C甚至是O2O电商平台。下面内容将以B2B电商平台作为实施背景,详细说明本申请技术方案。
现有基于B2B电商平台的贸易搜索主要有如下缺点:买家在网站的搜索路径上进行需求查找时,主要是通过输入query->查找商品->筛选供应商->发送询盘的线性路径进行,如果找不到合适的供应商需要更换query,重新进行一轮查找。这种查找方式的路径较长、效率低。针对该问题,可以采用本申请技术方案来解决。具体的,可以采用图2所示推荐系统来实施本申请技术方案。如图2所示,该推荐系统包括:用户界面、日志系统、用户行为数据库及搜索装置。
用户界面有两个作用,一方面给用户展现搜索结果,另一方面收集用户对搜索结果的反馈信息。用户界面收集到的用户对搜索结果的反馈信息以及用户进行搜索产生的资源数据等将通过日志系统写入用户行为数据库中。最后,搜索装置通过分析用户当前采购行为意图(即用户当前输入的query),基于线下挖掘用户行为数据库中的历史资源数据形成的用户采购兴趣模型进行搜索,向用户输出搜索结果并展现在用户界面上。其中,搜索装置是一个不断收集用户采购意图,不断更新用户采购兴趣模型,从而不断改善用户搜索结果的闭环反馈系统。
下面讨论搜索装置的实现。如图3所示,一种搜索装置的实现包括:展现交互模块、调度应用模块、算法聚合模块、引擎搜索模块以及基础设施模块。
展现交互模块:与用户界面相互配合,与采购用户进行丰富的交互,方便采购用户快速沟通和对比,批量询盘,提升转化。
调度应用模块:是依赖Spring框架的Java分布式的服务化应用,主要完成的任务是请求解析、调用聚合算法、检索网络商品或供应商的信息以及提供开放API接口。另外,调度应用模块还有监控和安全等配套功能。
算法聚合模块:承担采购意图识别和共性化推荐。其中,在线部分负责实时响应采购用户的采购请求,基于离线部分提供的资源类目属性表搜索匹配当前采购用户的采购意图(即采购用户输入的当前query),并生成最终搜索结果;离线部分主要负责完成各种历史数据的聚类运算,并生成最后可供在线部分快速匹配使用的资源类目属性表,供在线部分实时查询和调用。该算法聚合模块的原理将在后续部分进行阐述。
引擎搜索模块:在搜索装置中的作用可以理解为数据检索中心,快速检索网络商品的相关信息。引擎搜索模块会建立众多的离线数据索引,包括商品信息,供应商信息,交易数据,询盘/RFQ信息等,向外提供快速检索的接口,供上层应用快速整合出页面信息。
基础设施模块:辅助搜索装置的良好运作,例如监控和日志,前者确保整个搜索装置的可用性监控,后者是数据采集的一个重要途径。基础设施模块是一般装置都具有的,本实施例不做详细描述。
下面对算法聚合模块的原理进行详细描述:
针对B2B电子商务平台特点,立足历史搜索产生的历史行为数据,例如涉及的query、网络商品、询盘、RFQ数据等,可以依托大数据的形式挖掘出历史query、资源类目及资源聚类属性之间的对应关系,进而根据当前query匹配出满足用户当前搜索意图的网络商品。
基于历史搜索产生的历史行为数据挖掘历史query、资源类目及资源聚类属性之间的对应关系主要涉及三方面,采购用户的历史采购需求(主要是指采购用户在历史采购过程中使用的query)预处理、资源类目的聚合和资源聚类属性(如商品自身的自然属性、供应商关系等)的聚合。这三方面主要是线下处理。
采购用户的历史采购需求预处理,即对历史采购中使用的query进行预处理:
基于历史采购使用的query,确定建立上述对应关系所使用的历史query。确定历史query包括种子query的选择和query的扩展。
种子query的选择:例如,可以选一段时间窗口T(例如:30天)内的PV排名最前的N个query,作为种子query。
query的扩展:以种子query为基准,扩展种子query,获得扩展query。扩展方式包括:语义扩展、同义词扩展、包含关系扩展、相关关键词扩展。
资源类目的聚合:
资源类目是基于用户采购意图进行商品推荐的重要组成部分,在当前用户个性化数据体系中,其可用性的价值与重要性远超过价格偏好、地域偏好等。所以对用户输入的当前query进行映射,推荐可用性较高的资源类目是重要的一步。除了资源类目级别的聚合之外,还可以将资源类目下的商品进一步按照3/6/9等细分。资源类目的聚合相当于对历史query的聚类,将历史query对应到某个或某些资源类目下。
在将历史query映射到资源类目后,可以从大量历史资源数据中,获取资源类目下对应于该历史query的历史资源数据。
例如,根据商品点击表和搜索曝光表关联对应的点击商品和反馈行为产生的数据,得到该历史query关联的搜索点击行为数据,可以包含商品id、提供该商品的供应商id以及当时点击对该商品发生的询盘(Inquiry)数量等。这部分数据是由搜索点击产生的。
另外,在RFQ数据中,可以从RFQ基本信息表以及报价基本信息表中获取与历史query有关的RFQ数据,例如报价数,买家与卖家之间的反馈行为数据等。这部分数据是RFQ报价数据。
最后得到历史query与资源类目的对应关系以及在资源类目下与历史query有关的历史资源数据。表1描述了历史query-资源类目对应关系下对应于历史query的历史资源数据,但不限于此。
表1
资源聚类属性的聚合:
通用的搜索算法往往是基于用户的行为去计算用户与发布类目之间的偏好关系以及用户与商品之间的偏好关系。在某些情况下,这套算法会遇到各种业务问题,首先,发布资源类目在业务环境里是用来做商家后台商品管理,而不是用来做营销的,所以“用户与发布类目”之间的偏好关系很多情况下不能直接应用到导购场景;其次,“用户与商品之间(U2I)的偏好关系”可以解决这个问题,但“用户与商品之间的偏好关系”的缺陷在于数据粒度太细,针对不同场景的共性化推荐需求,可能需要做不同的算法,也就是N个推荐场景可能需要N份U2I数据,这样开发代价大、周期长。
本申请给出一种解决方案,即用展示资源聚类属性及标签的方式去构建用户偏好的粒度。所谓“标签”其实是介于资源类目与商品之间的粒度,且它是扁平化的,直接面对业务需求的。
资源聚类属性本质上是一种商品信息的元数据,是对商品的标题、属性等非结构化信息的抽象。具体是指,对每个历史query,从该历史query对应的资源类目下对应于该历史query的历史资源数据进行聚类,获得与该历史query有关的商品的共有属性。下面以两种资源聚类属性为例,即商品自身的热门属性和供应商信息。
商品自身的热门属性是和历史query相关的热门属性:这里“相关”的意思是,在该历史query下点击过的商品、询盘过的商品、报价过的RFQ中体现出来的热门属性,这里“热门”的意思是,历史query下关联的商品下用户关注的重要属性,指具备信息量,同时买家在其需求中关注的较多的属性。
资源聚类属性的聚合过程:确定基于发布类目聚合商品的关键属性;确定基于历史query的历史点击行为聚合最小订单量/供应商类型/出口市场/供应商所在地等其余交易/供应商关键属性;统计以上各关键属性的属性值分布,计算密度最集中的属性值集合。
值得说明的是,历史query的历史点击行为如果产生了询盘或RFQ行为,可以进行一定程度的加权,以提升历史点击行为的权重。
上述确定热门属性的过程为:在资源类目属性规范化之后,即可从两个方面度量属性的重要度,一个是卖家维度,如填写商品比率、填写卖家比率;另外一个是买家维度,如买家搜索比率、买家搜索转化比率,以上将会构造若干特征。通过人工标记一部分训练数据,使用ranksvm等学习排序(learning to rank)方法即可学习出这些特征对应的权重,由此可计算类目下属性的得分,按照得分排序。之后,可以从资源类目下对应于历史query的历史资源数据中挑选热门属性,其属性值也按照类似方式筛选,最终得到资源类目下的热门属性和属性值数据。
例如:{(Memory,4GB)(Memory,8GB)…(Color,Black)(Color,Pink)},序列化表达式为:
{(A1,V11)(A1,V12)...(Ak,Vk1)(Ak,Vkm)}
在识别用户输入的当前Query所表达的采购意图,并依据真实有效的询盘、RFQ数据,挖掘出匹配采购意图的高品质供应商,供买家评估用户一旦触发了显式或隐式的采购需求之后,最常关心的就是优质热门卖家相关数据。
其中,供应商信息可以提取三个维度:
访问数:提取过去时间窗口T以内的访问数,基于query/扩展query的搜索路径下,有过详情页或搜索页面直接产生询盘的供应商的汇总;
询盘数:提取过去时间窗口T以内的询盘,基于query/扩展query的搜索路径下,有过询盘的供应商的汇总;
报价数:提取过去时间窗口T以内的报价,基于query/扩展query的搜索路径下,以及相关的RFQ中,有过供应商一次回复,或者报价的供应商的汇总;
其中,上述三方面的信息可以配置权重,权重大小关系及为:报价>询盘>访问。
在供应商信息中,可以根据历史资源数据关联的公司id(company_id),关联出其对应的服务类型(service type)、主要市场(main markets)等字段,可以排序推荐出各类资源聚类属性:对应的热门供应商及服务类型数据。
最后,将上述信息进行综合,可以得到表2所示的一种历史query-资源类目-资源聚类属性之间的映射关系,简称为资源类目属性表。
表2
基于上述资源类目属性表,用户需要采购商品时,可以输入query,搜索装置接收用户输入的query;根据query检索出商品列表,按传统展示逻辑显示,并在结果页面上预留异步加载布点,以供用户发出展示指令。另外,搜索引擎根据线下聚合整理出的资源类目属性表,对用户输入的query进行实时匹配,如果匹配中资源类目及资源类目下对应于该query的资源聚类属性,则获取该资源类目下符合该资源聚类属性的商品并输出,没有则不输出。
进一步,搜索装置按照一定逻辑封装出前端页面呈现效果的结构化数据,例如商品名称、图片、供应商类型、出口市场、浏览数、询盘数和报价数以及对应的标签等等。
如果买家继续点击了上述某个标签,则可以跳转到该标签对应的聚类资源页面,比如买家偏好旅游器材标签,苹果商品周边设备标签或怀旧CD标签等,在当前的标签搜索导购页,会推荐相似商品或同款商品等,丰富用户的交互体验。对用户来说,如果点击进入某个标签对应的聚类资源页面,可以对商品质量、价格、商家资质等进行对比,并且可以直观了解该商品的最低价、利润空间等,最终做出自己的采购批发决策。
由上述可见,本申请可以直接快速比较商品与供应商,达到快速沟通或RFQ,极大缩短买家采购沟通的操作路径,有利于提高询盘转化,促进交易。另外,搜索装置可以记录所有的用户操作,反馈聚合算法,提升共性化推荐的准确度,增强用户对网站的粘性,最大化提升L-C的转化。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
图4为本申请另一实施例提供的搜索装置的结构示意图。如图4所示,该搜索装置包括:接收模块41、确定模块42、第一获取模块43和展现模块44。
接收模块41,用于接收用户输入的当前query。
确定模块42,用于确定接收模块41接收的当前query对应的目标资源类目及目标资源类目下对应于当前query的目标资源聚类属性,目标资源聚类属性是根据目标资源类目下与当前query有关的历史资源数据聚类出的网络资源共有的属性。
第一获取模块43,用于获取确定模块42所确定的目标资源类目下符合确定模块42所确定的目标资源聚类属性的网络资源。
展现模块44,用于将第一获取模块43获取的目标资源类目下符合目标资源聚类属性的网络资源展现给用户。
在一可选实施方式中,展现模块44还用于:
将目标资源聚类属性展现给用户。
在一可选实施方式中,展现模块44还用于:
根据符合目标资源聚类属性的网络资源生成聚类资源页面,并生成目标资源聚类属性对应的标签;标签指向聚类资源页面;
将标签展现给用户,以供用户通过标签访问聚类资源页面。
在一可选实施方式中,展现模块44在将第一获取模块43获取的目标资源类目下符合目标资源聚类属性的网络资源展现给用户时,具体用于:
接收用户通过第一结果页面上的入口发出的展现指令;第一结果页面展现有直接根据当前query搜索到的网络资源;
根据展现指令,将目标资源类目下符合目标资源聚类属性的网络资源展现给用户。
进一步,展现模块44在根据展现指令,将目标资源类目下符合目标资源聚类属性的网络资源展现给用户时,具体用于:
根据展现指令,将目标资源类目下符合目标资源聚类属性的网络资源展现在第二结果页面上;或者
根据展现指令,将第一结果页面上展现的直接根据当前query搜索到的网络资源,替换为目标资源类目下符合目标资源聚类属性的网络资源。
在一可选实施方式中,确定模块42具体用于:
根据当前query在资源类目属性表中进行匹配,资源类目属性表包括历史query、资源类目及资源聚类属性之间的对应关系;
从资源类目属性表中,获取当前query匹配中的历史query对应的资源类目作为目标资源类目属性,获取当前query匹配中的历史query对应的资源类目下对应于当前query匹配中的历史query的资源聚类属性作为目标资源聚类属性。
在一可选实施方式中,如图5所示,该搜索装置还包括:第一聚类模块51、第二聚类模块52和生成模块53。第一聚类模块51、第二聚类模块52和生成模块53相互配合,用于在确定模块42根据当前query在资源类目属性表中进行匹配之前,生成资源类目属性表。
第一聚类模块51,用于对历史query进行聚类,以确定历史query对应的资源类目。
第二聚类模块52,用于对第一聚类模块51确定的历史query对应的资源类目下与历史query有关的历史资源数据进行聚类,以获得资源类目下对应于历史query的资源聚类属性。
生成模块53,用于根据第一聚类模块51和第二聚类模块52确定的历史query、资源类目及资源聚类属性之间的对应关系生成资源类目属性表。
在一可选实施方式中,如图5所示,该搜索装置还包括:第二获取模块54。
第二获取模块54,用于在意第一聚类模块51对历史query进行聚类之前,从query日志中获取种子query,对种子query进行扩展,以获得扩展query,以将种子query和扩展query作为历史query。
进一步,第二获取模块54在从query日志中获取种子query时,具体用于:
从query日志中,选择在指定时间范围内出现的且PV最高的前N个query作为种子query。
进一步,第二获取模块54在对种子query进行扩展,以获得扩展query时,具体用于:
对种子query进行以下扩展方式中的至少一个,以获得扩展query;
语义扩展、同义词扩展、包含关系扩展和关键词扩展。
在一可选实施方式中,第一获取模块43具体用于:获取目标资源类目下符合目标资源聚类属性的网络商品。相应的,展现模块44具体用于:将目标资源类目下符合目标资源聚类属性的网络商品展现给用户。
基于上述,目标资源聚类属性包括以下至少一个:
网络商品自身的属性、供应商标识、访问数、报价数、询盘数、RFQ数、
本实施例提供的搜索装置,可基于当前query对应的目标资源类目及目标资源类目下对应于当前query的目标资源聚类属性进行搜索,展现给用户的是目标资源类目下符合该目标资源聚类属性的网络资源,由于目标资源属性是根据当前query对应的资源类目下与当前query有关的历史资源数据聚类出的网络资源共有的属性,因此与直接根据当前query获取的网络资源相比,本实施例搜索装置展现给用户的网络资源更加符合用户的需求,并且经过资源类目与资源聚类属性两个标准筛选出的网络资源的数量相对较少,用户从中获取所需资源的概率较高,有利于缩短搜索路径,提高搜索效率。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本申请各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (24)

1.一种搜索方法,其特征在于,包括:
接收用户输入的当前搜索词条query;
确定当前query对应的目标资源类目及所述目标资源类目下对应于所述当前query的目标资源聚类属性,所述目标资源聚类属性是根据所述目标资源类目下与所述当前query有关的历史资源数据聚类出的网络资源共有的属性;
获取所述目标资源类目下符合所述目标资源聚类属性的网络资源;
将所述目标资源类目下符合所述目标资源聚类属性的网络资源展现给所述用户。
2.根据权利要求1所述的方法,其特征在于,还包括:
将所述目标资源聚类属性展现给所述用户。
3.根据权利要求1所述的方法,其特征在于,还包括:
根据符合所述目标资源聚类属性的网络资源生成聚类资源页面,并生成所述目标资源聚类属性对应的标签;所述标签指向所述聚类资源页面;
将所述标签展现给所述用户,以供所述用户通过所述标签访问所述聚类资源页面。
4.根据权利要求1所述的方法,其特征在于,所述将所述目标资源类目下符合所述目标资源聚类属性的网络资源展现给所述用户,包括:
接收所述用户通过第一结果页面上的入口发出的展现指令;所述第一结果页面展现有直接根据所述当前query搜索到的网络资源;
根据所述展现指令,将所述目标资源类目下符合所述目标资源聚类属性的网络资源展现给所述用户。
5.根据权利要求4所述的方法,其特征在于,所述根据所述展现指令,将所述目标资源类目下符合所述目标资源聚类属性的网络资源展现给所述用户,包括:
根据所述展现指令,将所述目标资源类目下符合所述目标资源聚类属性的网络资源展现在第二结果页面上;或者
根据所述展现指令,将所述第一结果页面上展现的直接根据所述当前query搜索到的网络资源,替换为所述目标资源类目下符合所述目标资源聚类属性的网络资源。
6.根据权利要求1所述的方法,其特征在于,所述确定当前query对应的目标资源类目及所述目标资源类目下对应于所述当前query的目标资源聚类属性,包括:
根据所述当前query在资源类目属性表中进行匹配,所述资源类目属性表包括历史query、资源类目及资源聚类属性之间的对应关系;
从所述资源类目属性表中,获取所述当前query匹配中的历史query对应的资源类目作为所述目标资源类目属性,获取所述当前query匹配中的历史query对应的资源类目下对应于所述当前query匹配中的历史query的资源聚类属性作为所述目标资源聚类属性。
7.根据权利要求6所述的方法,其特征在于,所述根据所述当前query在资源类目属性表中进行匹配之前,包括:
对所述历史query进行聚类,以确定所述历史query对应的资源类目;
对所述资源类目下与所述历史query有关的历史资源数据进行聚类,以获得所述资源类目下对应于所述历史query的资源聚类属性;
根据所述历史query、所述资源类目及所述资源聚类属性之间的对应关系生成所述资源类目属性表。
8.根据权利要求7所述的方法,其特征在于,所述对所述历史query进行聚类,以确定所述历史query对应的资源类目之前,还包括:
从query日志中获取种子query;
对所述种子query进行扩展,以获得扩展query;
将所述种子query和所述扩展query作为所述历史query。
9.根据权利要求8所述的方法,其特征在于,所述从query日志中获取种子query,包括:
从所述query日志中,选择在指定时间范围内出现的且PV最高的前N个query作为所述种子query。
10.根据权利要求8所述的方法,其特征在于,所述对所述种子query进行扩展,以获得扩展query,包括:
对所述种子query进行以下扩展方式中的至少一个,以获得所述扩展query;
语义扩展、同义词扩展、包含关系扩展和关键词扩展。
11.根据权利要求1-10任一项所述的方法,其特征在于,所述获取所述资源类目下符合所述资源聚类属性的网络资源,包括:
获取所述目标资源类目下符合所述目标资源聚类属性的网络商品;
将所述目标资源类目下符合所述目标资源聚类属性的网络资源展现给所述用户,包括:
将所述目标资源类目下符合所述目标资源聚类属性的网络商品展现给所述用户。
12.根据权利要求11所述的方法,其特征在于,所述目标资源聚类属性包括以下至少一个:
网络商品自身的属性、供应商标识、访问数、报价数、询盘数、RFQ数、询盘反馈数。
13.一种搜索装置,其特征在于,包括:
接收模块,用于接收用户输入的当前搜索词条query;
确定模块,用于确定当前query对应的目标资源类目及所述目标资源类目下对应于所述当前query的目标资源聚类属性,所述目标资源聚类属性是根据所述目标资源类目下与所述当前query有关的历史资源数据聚类出的网络资源共有的属性;
第一获取模块,用于获取所述目标资源类目下符合所述目标资源聚类属性的网络资源;
展现模块,用于将所述目标资源类目下符合所述目标资源聚类属性的网络资源展现给所述用户。
14.根据权利要求13所述的装置,其特征在于,所述展现模块还用于:
将所述目标资源聚类属性展现给所述用户。
15.根据权利要求13所述的装置,其特征在于,所述展现模块还用于:
根据符合所述目标资源聚类属性的网络资源生成聚类资源页面,并生成所述目标资源聚类属性对应的标签;所述标签指向所述聚类资源页面;
将所述标签展现给所述用户,以供所述用户通过所述标签访问所述聚类资源页面。
16.根据权利要求13所述的装置,其特征在于,所述展现模块具体用于:
接收所述用户通过第一结果页面上的入口发出的展现指令;所述第一结果页面展现有直接根据所述当前query搜索到的网络资源;
根据所述展现指令,将所述目标资源类目下符合所述目标资源聚类属性的网络资源展现给所述用户。
17.根据权利要求16所述的装置,其特征在于,所述展现模块具体用于:
根据所述展现指令,将所述目标资源类目下符合所述目标资源聚类属性的网络资源展现在第二结果页面上;或者
根据所述展现指令,将所述第一结果页面上展现的直接根据所述当前query搜索到的网络资源,替换为所述目标资源类目下符合所述目标资源聚类属性的网络资源。
18.根据权利要求13所述的装置,其特征在于,所述确定模块具体用于:
根据所述当前query在资源类目属性表中进行匹配,所述资源类目属性表包括历史query、资源类目及资源聚类属性之间的对应关系;
从所述资源类目属性表中,获取所述当前query匹配中的历史query对应的资源类目作为所述目标资源类目属性,获取所述当前query匹配中的历史query对应的资源类目下对应于所述当前query匹配中的历史query的资源聚类属性作为所述目标资源聚类属性。
19.根据权利要求18所述的装置,其特征在于,还包括:
第一聚类模块,用于对所述历史query进行聚类,以确定所述历史query对应的资源类目;
第二聚类模块,用于对所述资源类目下与所述历史query有关的历史资源数据进行聚类,以获得所述资源类目下对应于所述历史query的资源聚类属性;
生成模块,用于根据所述历史query、所述资源类目及所述资源聚类属性之间的对应关系生成所述资源类目属性表。
20.根据权利要求19所述的装置,其特征在于,还包括:
第二获取模块,用于从query日志中获取种子query,对所述种子query进行扩展,以获得扩展query,以将所述种子query和所述扩展query作为所述历史query。
21.根据权利要求20所述的装置,其特征在于,所述第二获取模块具体用于:
从所述query日志中,选择在指定时间范围内出现的且PV最高的前N个query作为所述种子query。
22.根据权利要求21所述的装置,其特征在于,所述第二获取模块具体用于:
对所述种子query进行以下扩展方式中的至少一个,以获得所述扩展query;
语义扩展、同义词扩展、包含关系扩展和关键词扩展。
23.根据权利要求13-22任一项所述的装置,其特征在于,
所述第一获取模块具体用于:获取所述目标资源类目下符合所述目标资源聚类属性的网络商品;
所述展现模块具体用于:将所述目标资源类目下符合所述目标资源聚类属性的网络商品展现给所述用户。
24.根据权利要求23所述的装置,其特征在于,所述目标资源聚类属性包括以下至少一个:
网络商品自身的属性、供应商标识、访问数、报价数、询盘数、RFQ数、询盘反馈数。
CN201510401478.XA 2015-07-10 2015-07-10 搜索方法及装置 Active CN106326318B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510401478.XA CN106326318B (zh) 2015-07-10 2015-07-10 搜索方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510401478.XA CN106326318B (zh) 2015-07-10 2015-07-10 搜索方法及装置

Publications (2)

Publication Number Publication Date
CN106326318A true CN106326318A (zh) 2017-01-11
CN106326318B CN106326318B (zh) 2019-07-09

Family

ID=57724885

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510401478.XA Active CN106326318B (zh) 2015-07-10 2015-07-10 搜索方法及装置

Country Status (1)

Country Link
CN (1) CN106326318B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107194757A (zh) * 2017-04-18 2017-09-22 广州智造家网络科技有限公司 询盘方法和装置
CN107545069A (zh) * 2017-09-20 2018-01-05 广州炫锐信息科技有限公司 一种查询多种资源的方法及装置
CN107633073A (zh) * 2017-09-22 2018-01-26 广州阿里巴巴文学信息技术有限公司 资源确定方法、装置及系统
CN109191012A (zh) * 2018-10-12 2019-01-11 平安科技(深圳)有限公司 人力费用搜索方法、装置、计算机装置及存储介质
CN109471886A (zh) * 2018-10-12 2019-03-15 平安科技(深圳)有限公司 计算机资源的费用搜索方法、装置、计算机装置及存储介质
CN109508376A (zh) * 2018-11-23 2019-03-22 四川长虹电器股份有限公司 可在线纠错更新的意图识别方法及装置
CN109697621A (zh) * 2017-10-23 2019-04-30 阿里巴巴集团控股有限公司 热点属性的确定方法及装置、数据处理方法、装置及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102207962A (zh) * 2011-05-25 2011-10-05 盛乐信息技术(上海)有限公司 一种动态搜索引擎及方法
CN102419778A (zh) * 2012-01-09 2012-04-18 中国科学院软件研究所 一种挖掘查询语句子话题并聚类的信息搜索方法
CN102722503A (zh) * 2011-03-31 2012-10-10 北京百度网讯科技有限公司 一种对检索结果进行排序的方法及装置
CN103020141A (zh) * 2012-11-21 2013-04-03 北京百度网讯科技有限公司 一种用于提供搜索结果的方法和设备
CN104077337A (zh) * 2013-05-20 2014-10-01 腾讯科技(深圳)有限公司 搜索方法及装置
CN104462156A (zh) * 2013-09-25 2015-03-25 阿里巴巴集团控股有限公司 一种基于用户行为的特征提取、个性化推荐方法和系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102722503A (zh) * 2011-03-31 2012-10-10 北京百度网讯科技有限公司 一种对检索结果进行排序的方法及装置
CN102207962A (zh) * 2011-05-25 2011-10-05 盛乐信息技术(上海)有限公司 一种动态搜索引擎及方法
CN102419778A (zh) * 2012-01-09 2012-04-18 中国科学院软件研究所 一种挖掘查询语句子话题并聚类的信息搜索方法
CN103020141A (zh) * 2012-11-21 2013-04-03 北京百度网讯科技有限公司 一种用于提供搜索结果的方法和设备
CN104077337A (zh) * 2013-05-20 2014-10-01 腾讯科技(深圳)有限公司 搜索方法及装置
CN104462156A (zh) * 2013-09-25 2015-03-25 阿里巴巴集团控股有限公司 一种基于用户行为的特征提取、个性化推荐方法和系统

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107194757A (zh) * 2017-04-18 2017-09-22 广州智造家网络科技有限公司 询盘方法和装置
CN107545069A (zh) * 2017-09-20 2018-01-05 广州炫锐信息科技有限公司 一种查询多种资源的方法及装置
CN107545069B (zh) * 2017-09-20 2021-07-20 广州炫锐信息科技有限公司 一种查询多种资源的方法及装置
CN107633073A (zh) * 2017-09-22 2018-01-26 广州阿里巴巴文学信息技术有限公司 资源确定方法、装置及系统
CN109697621A (zh) * 2017-10-23 2019-04-30 阿里巴巴集团控股有限公司 热点属性的确定方法及装置、数据处理方法、装置及系统
CN109697621B (zh) * 2017-10-23 2023-04-07 阿里巴巴集团控股有限公司 热点属性的确定方法及装置、数据处理方法、装置及系统
CN109191012A (zh) * 2018-10-12 2019-01-11 平安科技(深圳)有限公司 人力费用搜索方法、装置、计算机装置及存储介质
CN109471886A (zh) * 2018-10-12 2019-03-15 平安科技(深圳)有限公司 计算机资源的费用搜索方法、装置、计算机装置及存储介质
CN109508376A (zh) * 2018-11-23 2019-03-22 四川长虹电器股份有限公司 可在线纠错更新的意图识别方法及装置

Also Published As

Publication number Publication date
CN106326318B (zh) 2019-07-09

Similar Documents

Publication Publication Date Title
CN106326318A (zh) 搜索方法及装置
JP6356744B2 (ja) ウェブサイト横断情報を表示する方法およびシステム
JP5620933B2 (ja) エンタープライズウェブマイニングシステム及び方法
TWI512653B (zh) Information providing method and apparatus, method and apparatus for determining the degree of comprehensive relevance
CN103902538B (zh) 基于决策树的信息推荐装置及方法
CN106327227A (zh) 一种信息推荐系统及信息推荐方法
CN103914492A (zh) 查询词融合方法、商品信息发布方法和搜索方法及系统
CN106708821A (zh) 基于用户个性化购物行为进行商品推荐的方法
CN109934721A (zh) 理财产品推荐方法、装置、设备及存储介质
CN105718184A (zh) 一种数据处理方法和装置
CN106600302A (zh) 基于Hadoop的商品推荐系统
US20100274753A1 (en) Methods for filtering data and filling in missing data using nonlinear inference
CN108205768A (zh) 数据库建立方法和数据推荐方法及装置、设备和存储介质
CN109447713A (zh) 一种基于知识图谱的推荐方法及装置
CN104391883B (zh) 一种基于迁移学习的在线广告受众排序方法
CN1985255A (zh) 使用与第一因特网搜索关键词相关的次级关键词的目标广告方法和系统、以及用于提供次级关键词列表的方法和系统
Kang et al. Using the fuzzy weighted association rule mining approach to develop a customer satisfaction product form
CN105447186A (zh) 一种基于大数据平台的用户行为分析系统
CN103377249A (zh) 关键词投放方法及系统
CN107563867A (zh) 一种基于多臂赌博机置信上限的推荐系统冷启动方法
US11321724B1 (en) Product evaluation system and method of use
Wu et al. Discovery of associated consumer demands: Construction of a co-demanded product network with community detection
Jiao et al. Research on personalized recommendation optimization of E-commerce system based on customer trade behaviour data
CN107093122B (zh) 对象分类方法及装置
CN108537635A (zh) 一种产品的推荐方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20240329

Address after: Singapore

Patentee after: Alibaba Singapore Holdings Ltd.

Country or region after: Singapore

Address before: A four-storey 847 mailbox in Grand Cayman Capital Building, British Cayman Islands

Patentee before: ALIBABA GROUP HOLDING Ltd.

Country or region before: Cayman Islands

TR01 Transfer of patent right