CN103729365A - 一种搜索方法和系统 - Google Patents

一种搜索方法和系统 Download PDF

Info

Publication number
CN103729365A
CN103729365A CN201210387891.1A CN201210387891A CN103729365A CN 103729365 A CN103729365 A CN 103729365A CN 201210387891 A CN201210387891 A CN 201210387891A CN 103729365 A CN103729365 A CN 103729365A
Authority
CN
China
Prior art keywords
product information
product
confidence
degree
provider
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201210387891.1A
Other languages
English (en)
Inventor
宋超
陈超
冯景华
郭宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201210387891.1A priority Critical patent/CN103729365A/zh
Publication of CN103729365A publication Critical patent/CN103729365A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce

Abstract

本发明提供了一种搜索方法和系统,涉及计算机技术领域。所述方法包括:接收用户端的查询词串;根据所述查询词串检索与查询词串相关的各产品信息;查找各产品信息所属的产品提供方,或者查找各产品信息所属的产品提供方和各产品信息所属领域;提取各产品信息对应的第一置信度,所述第一置信度为所述产品信息在所属产品提供方的置信度,或提取各产品信息对应的第二置信度,所述第二置信度为所述产品信息在所属产品提供方中,所述产品信息的所属领域的置信度;将所述第一置信度或第二置信度加入排序权重,并将各产品信息进行排序;将排序后的产品信息输出给用户端。本申请使得搜索得到的产品结果排序更接近实际需求,减少了冗余数据处理过程。

Description

一种搜索方法和系统
技术领域
本申请涉及计算机技术领域,特别是涉及一种搜索方法和系统。
背景技术
搜索引擎技术的发展是随着电子技术不断进步而形成的信息数字化和数据网络化的必然产物。一个出色的搜索引擎能够及时准确的向用户提供所需要的信息。Google搜索引擎依靠其Page Rank机制及收敛算法一直处在该领域的领先地位,其体系结构代表了该搜索领域的传统搜索引擎。
但随着互联网快速、细分的发展,需要对于各方向的网络信息的搜索具有更加精确、更加专业、更具深度的搜索,而传统搜索引擎的排名技术显然不适用于专业垂直搜索的需求,比如在B2B电子商务垂直搜索等产品垂直搜索领域,基于互联网的产品搜索服务器需要将散布于互联网的各产品与相关数据搜集起来,提供统一的检索服务,因此产品数据的检索功能对于整体业务而言是非常重要的,产品数据的检索方法既要满足产品数据的检索这样一个特定的要求,又要具有很高的性能。
以电子商务为例,用户希望通过搜索获得所需产品的相关信息并较好的完成交易。从计算机数据处理的过程来看,具体包括以下过程:计算机针对用户搜索需求给出产品反馈信息,用户查看产品相关信息并确定交易,计算机依据用户指示完成交易(当采用电子货币购买电子商品或者虚拟物品时,则全部过程为互联网上的数据处理过程;当购买实物时,则上述过程可能会涉及到一些线下过程)。
上述数据处理过程中,当搜索的产品信息的结果排序不符合实际需求时,则用户为了完成交易(完成整个数据处理过程),则可能需要点击很多搜索结果,从而可能导致信息处理过程的冗余、服务器浪费和效率降低。
即迫切需要本领域技术人员解决的技术问题是:如何才能减少或者避免由于搜索结果排序不优化,而导致的信息处理过程的冗余、服务器浪费和效率降低。
发明内容
本申请所要解决的技术问题是提供一种搜索方法和系统,解决现有技术中由于产品信息置信度导致的信息不够精确,从而导致服务器负载压力大,用户搜索成本高的缺点;能精确返回用户需求的产品信息,从而降低服务器负载压力,降低用户的搜索成本。
为了解决上述问题,本申请公开了一种搜索方法,包括:
接收用户端的查询词串;
根据所述查询词串检索与查询词串相关的各产品信息;
查找各产品信息所属的产品提供方,或者查找各产品信息所属的产品提供方和各产品信息所属领域;
提取各产品信息对应的第一置信度,所述第一置信度为所述产品信息在所属产品提供方的置信度,或提取各产品信息对应的第二置信度,所述第二置信度为所述产品信息在所属产品提供方中,所述产品信息的所属领域的置信度;其中,所述每个产品信息的第一置信度通过分析所属产品提供方的该产品信息对应的行为记录表获得,所述每个产品信息对应的第二置信度通过分析所述产品提供方在该产品信息所属领域内的各产品信息的行为记录表获得;
将所述第一置信度或第二置信度加入排序权重,并将各产品信息进行排序;
将排序后的产品信息输出给用户端。
优选的,所述每个产品信息的第一置信度通过分析所属产品提供方的该产品信息对应的行为记录表获得包括:
针对每一产品提供方,提取所述产品提供方各产品信息对应的各种行为记录表;所述各种行为记录表包括所述各产品信息的对应的交易行为记录表、评价行为记录表、和/或收藏行为记录表;
针对每一所述产品信息,分析统计所述产品信息对应的各种行为记录表,获得各种特征维度下的特征值;
将所述各种特征值向量化为一个特征向量,将所述各种特征值相应的权重对应向量化为一个权重向量,并利用所述特征向量和权重向量计算所述产品信息的第一置信度。
优选的,所述每个产品信息对应的第二置信度通过分析所述产品提供方在该产品信息所属领域内的各产品信息的行为记录表获得包括:
针对每一产品提供方,提取所述产品提供方的各产品信息的核心产品词,并提取所述产品提供方各产品信息对应的各种行为记录表;所述各种日志记录表包括所述各产品信息的对应的各交易行为记录表、各评价行为记录表、和/或各收藏行为记录表;
根据所述核心产品词,确定属于同一领域的各条产品信息;
针对每一领域,分析统计所述领域内各产品信息对应的各种行为记录表,获得各种特征维度下的特征值;
将所述各种特征值向量化为一个特征向量,将所述各种特征值相应的权重对应向量化为一个权重向量,并利用所述特征向量和权重向量计算所述产品信息对应的第二置信度。
优选的,分析统计所述产品信息对应的各种行为记录表,获得各种特征维度下的特征值包括:
通过分析交易行为记录表,获得包括交易次数对应特征维度下的特征值;
通过分析评价行为记录表,获得包括好评率对应特征维度下的特征值;
通过分析收藏行为记录表,获得包括收藏次数对应特征维度下的特征值。
优选的,所述各种特征值相应的权重获得步骤包括:
对于每一个特征维度,选择所述特征维度下的原始样本使用极大似然估计构造出目标函数F(X);
选择所述特征维度下的初始权重W0,并结合目标函数F(X)构造搜索方向Pt和步长因子St
根据Wt+1=Wt+stPt迭代求出下一个迭代点Wt+1,当基于Wt+1的F(X)值与基于Wt的F(X)值之间的差值的绝对值小于阈值,则将Wt+1作为所述特征维度下的权重。
优选的,提取所述产品提供方的各产品信息的核心产品词包括:
提取所述产品信息的标题信息;
对标题信息进行切词和词性标注;
依据各词的词性及修饰关系确认所述产品信息的核心产品词。
优选的,根据所述查询词串检索与查询词串相关的各产品信息包括:
将所述查询词串进行分词操作;
基于得到的各分词进行扩展,得到扩展词;
通过各分词和扩展词在索引中检索获得各产品信息。
优选的,将所述第一置信度或第二置信度加入排序权重,将各产品信息进行排序包括:
计算所述各产品信息与所述查询词串的文本相关性值;
计算所述各产品信息的所属领域与所述查询词串的领域相关性值;
利用各产品信息的第一置信度或第二置信度、相应的文本相关性值、领域相关性值计算总相关性值;
基于所述总相关性值对各产品信息进行排序。
相应的,本申请还公开了一种搜索系统,包括:
查询接收模块,用于接收用户端的查询词串;
检索模块,用于根据所述查询词串检索与查询词串相关的各产品信息;
查找模块,用于查找各产品信息所属的产品提供方,或者查找各产品信息所属的产品提供方和各产品信息所属领域;
置信度提取模块,用于提取各产品信息第一置信度,所述第一置信度为所述产品信息在所属产品提供方的置信度、或提取各产品信息的第二置信度,所述第二置信度为所述产品信息在所属产品提供方中,所述产品信息的所属领域的置信度;其中,所述每个产品信息的第一置信度通过分析所属产品提供方的该产品信息对应的行为记录表获得,所述每个产品信息对应的第二置信度通过分析所述产品提供方在该产品信息所属领域内的各产品信息的行为记录表获得;
排序模块,用于将所述第一置信度或第二置信度加入排序权重,并将各产品信息进行排序;
输出模块,用于将排序后的产品信息输出给用户端。
优选的,所述置信度提取模块包括:
第一提取模块,用于针对每一产品提供方,提取所述产品提供方各产品信息对应的各种行为记录表;所述各种行为记录表包括所述各产品信息的对应的交易行为记录表、评价行为记录表、和/或收藏行为记录表;
第一特征值获取模块,针对每一所述产品信息,分析统计所述产品信息对应的各种行为记录表,获得各种特征维度下的特征值;
第一置信度计算模块,用于将所述各种特征值向量化为一个特征向量,将所述各种特征值相应的权重对应向量化为一个权重向量,并利用所述特征向量和权重向量计算所述产品信息的第一置信度。
优选的,所述置信度提取模块包括:
第二提取模块,用于针对每一产品提供方,提取所述产品提供方的各产品信息的核心产品词,并提取所述产品提供方各产品信息对应的各种行为记录表;所述各种日志记录表包括所述各产品信息的对应的各交易行为记录表、各评价行为记录表、和/或各收藏行为记录表;
领域确认模块,用于根据所述核心产品词,确定属于同一领域的各条产品信息;
第二特征值获取模块,用于针对每一领域,分析统计所述领域内各产品信息对应的各种行为记录表,获得各种特征维度下的特征值;
第二置信度计算模块,用于将所述各种特征值向量化为一个特征向量,将所述各种特征值相应的权重对应向量化为一个权重向量,并利用所述特征向量和权重向量计算所述产品信息的第一置信度。
与现有技术相比,本申请包括以下优点:
本申请在搜索得到的产品结果排序时,引入了对该产品提供方的在当前产品上的订单转化率的置信度参数,从而使得搜索得到的产品结果排序更接近实际需求,使用户能更便捷的获取产品信息,不用再进行大量的点击请求,降低了服务器负载压力,减少了冗余数据处理过程,提高了电子商务这一互联网数据处理过程的运行效率。
具体的,为了保证排序的客观性和科学性,本申请针对该产品提供方的在当前产品上的订单转化率的置信度参数,即通过该用户对该产品或者该领域的产品历史行为记录进行分析得到的订单转化率的置信度参数将搜索结果中的产品信息进行排序,从而使得搜索得到的产品结果排序更接近实际需求,使用户能更便捷的获取产品信息,不用再进行大量的点击请求,降低了服务器负载压力,减少了冗余数据处理过程。
附图说明
图1是本申请一种搜索方法的流程示意图;
图2是本申请一种搜索系统的结构示意图。
具体实施方式
为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明。
本申请的核心思想之一在于,在需要更加精确、更加专业、更具深度的对于产品信息的垂直搜索领域,本申请对于网络中每个产品提供方提供的每个产品信息,在该产品提供方的每个产品粒度中,分析并预置针对该产品提供方的每个产品信息的第一置信度;或者在该产品提供方每个产品所属领域
(比如类目)的粒度中,分析并预置各产品信息在所属产品提供方(卖家)中,各产品信息所属领域的第二置信度;当用户搜索产品信息时,将所述第一置信度,或者第二置信度加入搜索引擎对产品信息进行排序的排序权重中,调整产品信息的排序,然后将更准确,更符合用户需求的产品信息有效展示给用户,避免由于信息不精确导致的用户多次点击服务器,导致服务器负载过大的情况。
参照图1,示出了本申请一种搜索方法的流程示意图。
在本申请系统接收用户查询词串之前,还包括:
步骤100,通过分析所属产品提供方的该产品信息对应的行为记录表获得所述每个产品信息的第一置信度,或通过分析所述产品提供方该产品信息所属领域内的各产品信息的行为记录表获得所述每个产品的第二置信度。
也即,可以理解为:所述第一置信度为各产品信息在所属产品提供方的置信度,所述第二置信度为所述产品信息在所属产品提供方中,所述产品信息所属领域的置信度。对于第二置信度,例如卖家A经营了领域a,b两个领域,a领域内有a1,a2产品,b领域内有b1,b2产品,那么以a1+a2的产品信息行为记录表进行分析获得领域a的第二置信度,那么以b1+b2的产品信息行为记录表进行分析获得领域b的第二置信度;那么对于产品信息a1来说,其对应的第二置信度为:a1在卖家A中,a1所属领域a的置信度。
实际中,所述第一置信度对应的为产品提供方具体产品粒度,所述第二置信度对应产品提供方每个领域的粒度。其中,所述领域可以理解为类目,比如手机,电脑,服装产品类目等。
所述置信度更广泛的可以理解为某个产品提供方的某一产品或者产品提供方某一产品在某一领域的置信度,也即产品提供方(卖家)对一产品或者一领域内产品的权威性。
比如针对网络平台中的买家与卖家的情况,买家一般需要根据买家与卖家的互动信息(交易、评价、收藏等),识别出卖家的权威经营产品或者权威经营领域,所述权威经营产品可为交易量大、和/或评价好、和/或收藏量高的产品或者领域。当买家在网站搜索时,把买家关注的产品的置信度高的产品信息排在搜索list的前面,相应对该产品的权威性高的卖家也在list前面,以减少买家搜索次数,降低服务器的压力,为卖家提供更可信的产品信息,减少买家对卖家的鉴别成本。进一步的讲,可给予买家更好的搜索体验,同时激励卖家积极做好自身的诚信、权威性建设,从而更好的服务买家,形成良性循环。更进一步的说,所述的置信度或者权威性可以理解为某个卖家的订单转化率,订单转化率高的说明该卖家的产品信息更真实可靠。
优选的,在细化到产品提供方的具体单个产品信息粒度的情况下,所述每个产品信息的第一置信度通过分析所述产品提供方的该产品信息对应的行为记录表获得,包括:
步骤S71,针对每一产品提供方,提取所述产品提供方各产品信息对应的各种行为记录表;所述各种行为记录表包括所述各产品信息的对应的交易行为记录表、评价行为记录表、和/或收藏行为记录表;
实际中,比如在网络交易平台中,卖家提供产品,买家在网络中购买产品,那么买家和卖家在产品信息的交易过程中,或者买家对产品信息的操作过程中均会存在记录,比如交易行为记录表,记录了各产品信息的交易次数、客户数等特征;比如评价行为记录表,记录各产品信息获得的用户星级评价次数、好评率等特征;比如收藏行为记录表,记录了各产品信息获得的收藏次数、收藏客户数等特征。
对于交易相关特征:该产品的交易次数、客户数等特征。买家购买了卖家某个产品,在一定程度上说明了买家对卖家该产品的认可,如果该产品获得的买家认可越多,说明卖家是该产品的优质卖家。
对于评价相关特征:该产品获得的用户星级评价次数、好评率等特征。买家对卖家某个产品的好评越多,代表了买家对卖家该产品的认可,好评率越高,说明卖家是该产品的优质卖家。
对于收藏相关特征:该产品获得的收藏次数、收藏客户数等特征。买家对卖家某个产品的收藏同样代表了买家对卖家该产品的认可,收藏越多,说明卖家是该产品的卖家。
本步骤可从卖家的交易数据库和产品信息数据库中提取卖家每个产品信息的产品词、交易、评价、收藏行为。
步骤S72,针对每一所述产品信息,分析统计所述产品信息对应的各种行为记录表,获得各种特征维度下的特征值;
因为各种行为记录表记录了相关的各种特征,比如前述交易行为记录表,记录了各产品信息的交易次数、客户数等特征;比如评价行为记录表,记录各产品信息获得的用户星级评价次数、好评率等特征;比如收藏行为记录表,记录了各产品信息获得的收藏次数、收藏客户数等特征。
优选的,分析统计所述产品信息对应的各种行为记录表,获得各种特征维度下的特征值包括:
步骤A71,通过分析交易行为记录表,获得包括交易次数对应特征维度下的特征值;
比如如前所述,交易行为记录表可能还包括了其他相关特征维度,比如客户数等特征,那么还可统计客户数特征维度下的特征值等。
步骤A72,通过分析评价行为记录表,获得包括好评率对应特征维度下的特征值;
当然,本步骤也还可统计其他相关的特征维度的特征值,比如用户星级评价次数特征维度下的特征值。
步骤A73,通过分析收藏行为记录表,获得包括收藏次数对应特征维度下的特征值。
当然,本步骤也还可统计其他相关的特征维度的特征值,比如收藏客户数特征维度下的特征值。
比如,对于每个产品信息,可提取该产品信息交易次数、客户数、用户星级评价次数、好评率、收藏次数、收藏客户数等特征维度下的特征值,所述特征值即相应维度下实际数值,比如交易次数、客户数、用户星级评价次数、好评率、收藏次数、收藏客户数对应的特征值分别为100、80、55、0.90、150、88。
步骤S73,将所述各种特征值向量化为一个特征向量,将所述各种特征值相应的权重对应向量化为一个权重向量,并利用所述特征向量和权重向量计算所述产品信息的第一置信度。
所述第一置信度为前述对于具体产品信息的粒度,比如卖家X提供的产品信息包括offer1,offer2,offer3,offer4,那么通过前述步骤获得每一个产品信息的第一置信度。
对于第i个特征维度下的特征值Xi,可将其向量化为一个特征向量X=
(X1,X2,......Xn),比如对于前述例子中各特征值100、80、55、0.90、150、88,可将其向量化为X=(100、80、55、0.90、150、88)。
实际中,各特征维度对应相应的权重,也即第i个特征值对应一个权重wi。也可将相应权重向量化为一个权重向量w=(w1,w2,......,wn)。
然后利用上述得到的向量X,和w采用逻辑回归模型:
P ( Y = 1 | X , w ) = 1 1 + e - w T · X
计算得到各产品信息的第一置信度。或者说前述提到的权威性或者订单转化率。
其中,每个特征维度对应的权重可采用LBFGS(最大熵模型算法)训练得到。
优选的,所述各种特征值相应的权重获得步骤包括:
步骤B71,对于每一个特征维度,选择所述特征维度下的原始样本使用极大似然估计训练出目标函数F(X);
在本申请计算权重过程中,优选的采用极大似然估计的目标函数:
F ( X ) = Π i = 1 m t ( X i ) + C Σ i = 1 n | w i | = Π i = 1 m 1 1 + e - w T · X i + C Σ i = 1 n | w i | ,
其中,m为产品信息样本数量,n为每个产品信息的特征维度数量,t(Xi)为前述公式wi是每个特征维度的权重。利用样本训练目标函数值以及梯度F(x)及G(W),所述G(W)用于计算下降方向。
步骤B72,选择所述特征维度下的初始权重W0,并结合目标函数F(X)构造搜索方向Pt和步长因子St
在设置好目标函数后,LBFGS算法是一种迭代算法,迭代法的思路是从已知点wk出发,按照某种规则求出后续点wk+1,直到满足收敛条件后,便得到了最终的w。
其可通过以下步骤进行迭代的前3步:
(1)、选取初始点W0
其中W0一般设置为0,还可设置为1。在本步骤中,还会S={},Y={}初始化为空,t=0,设置保存参数m=10(使用过去10步的信息计算下降方向)。其中S和Y都是临时变量,用于计算下降方向。
(2)、构造搜索方向pt
比如,利用Two-Loop方法,计算搜索方向pt,其示例如下:
q = ▿ f ( w t )
for(i=m,...,1)
αi=ρisi T q
q=q-αiyi
end for
p=γtq
for(i=1,...,m)
β i = ρ i y i T p
p=p+siii)
end for
return p ( = B t ▿ f ( x t ) )
其中:
ρ t = 1 y t T s t , γ t = s t - 1 T y t - 1 y t - 1 T y t - 1 , st=wt+1-wt y t = ▿ f ( w t + 1 ) - ▿ f ( w t )
(3)、确定步长因子st
步骤B73,根据wt+1=wt+stPt迭代求出下一个迭代点wt+1,当基于wt+1的F(X)值与基于wt的F(X)值之间的差值的绝对值小于阈值,则将wt+1作为所述特征维度下的权重。
然后在前述迭代前3步的基础上进行第4步:
(4)、求出下一个迭代点wt+1=w+stpt。若Wt+1满足事先约定的收敛条件,则迭代结束,否则t=t+1,然后转前述第(2)步。
比如对于前述设置保存参数m=10(使用过去10步的信息计算下降方向),如果符合收敛条件,则停止迭代返回w,否则转第2步更新S、Y。S、Y中最多只存储m步的历史信息,如果超出m,则丢弃最老的信息。t=t+1转第(2)步。
当然,本申请计算各特征维度的权重的方法也可为其他方法,本申请不对其加以限制。
优选的,对于产品提供方提供的各领域产品的粒度上,所述每个产品信息对应的第二置信度通过分析所述产品提供方在该产品信息所属领域内的各产品信息的行为记录表获得,包括:
步骤S81,针对每一产品提供方,提取所述产品提供方的各产品信息的核心产品词,并提取所述产品提供方各产品信息对应的各种行为记录表;所述各种日志记录表包括所述各产品信息对应的各交易行为记录表、各评价行为记录表、和/或各收藏行为记录表。
本步骤可从卖家的交易数据库和产品信息数据库中提取卖家每个产品信息的产品词、交易、评价、收藏行为,提取完成后,根据产品信息ID将上述各表格中的信息提取出来内容合并至一个大表中。
在产品信息搜索领域,每一个产品信息客观上均对应一个实际的产品,即每个产品词均存在一个核心产品词,表明其对应产品的身份。比如,“气质淑女修身连衣裙”,那么其中“连衣裙”即为其对应的核心产品词。那么对于每个卖家的每个产品信息,均可提取其核心产品词。并提取前述步骤S71中描述的类似的所述产品提供方各产品信息对应的各种行为记录表;所述各种日志记录表包括所述各产品信息对应的各交易行为记录表、各评价行为记录表、和/或各收藏行为记录表。
优选的,提取所述产品提供方的各产品信息的核心产品词包括:
步骤S811,提取所述产品信息的标题信息;
比如,卖家X的某条产品信息的标题为“气质淑女修身连衣裙”,则提取“气质淑女修身连衣裙”。
步骤S812,对标题信息进行切词和词性标注;
分词后的结果为“气质淑女修身连衣裙”,其中“气质”“淑女”“修身”均为修饰性词,“连衣裙”为产品词。
步骤S813,依据各词的词性及修饰关系确认所述产品信息的核心产品词。
根据前述显然“连衣裙”是该产品信息的核心产品词。
进一步的,可通过以下方式获取核心产品词:
步骤U1,对查询词串或者产品信息文本进行分词,得到各分词,并标注各分词的词性;
实际中,对于一个产品信息,其分词的词性可包括:CP_CORE(产品核心词)、CP_XIUSHI(产品修饰词)、XS(一般性修饰词)、PP(品牌词)、XH(型号词)、QH(区划词)、BL(并列词)、以及PT(普通词)。
那么对于各产品信息或查询产品信息的查询词串,可进行分词,然后基于上述词性对每个分词进行标注。步骤U2,查找上下文无关词性运维词表,识别出其中的并列词,并基于所述并列词对查询词串或者产品信息文本进行分段;
对于分词之后的每一个分词,查找上下文无关词性运维词表,识别出其中的并列词,后续会基于并列词,对短串进行分段,每段内进行上下文相关词性计算。比如前述“供应mp3\mp4车载发射器”,可以分段为“供应mp3车载发射器”和“供应mp4车载发射器”。其中MP3、MP4和发射器为产品词。
步骤U3,对于每一段词,如果段内有至少两个分词具有产品词词性,则将其中最后一个分词的词性置为核心产品词。
根据BL词性,对短串进行分段,每段的分词词性和重要性计算独立进行。对于每一段,如果段内有多个分词具有CP(产品词)词性,则将其中最后一个分词的词性置为CP_CORE,其余分词的词性置为CP_XIUSHI。分词重要性打分依据词性进行,具体方法是:
1)从IDF(独立)词典中获取该词的独立分,没有则为0分;
2)如果是最后一个词,加上10分,算出当前得分;
3)如果是产品核心词,为+100分;
4)如果是品牌词,为+80分;
5)如果是型号词,为+60分;
6)如果是产品修饰词,为+40分;
7)如果是区划词,为+20分;
8)如果是并列符合,左括号右括号,直接设置为0分;
9)如果是普通词,则为+5分。
另外,如果提供了包含产品信息对应的类目id和供应商id,通过多维度特征联合(供应商级别、类目级别、买家级别、怀疑规则)判断来优化效果,得到最终的分词词性和重要性结果。
对于短串中每一个CP_CORE和CP_XIUSHI分词,提取4个特征,分词对应的类目点击,产品信息r所处类目下的产品词分布,供应商主营行业,供应商主营产品,验证每一个候选分词在这4个特征下的表现。如表一:
Figure BDA00002250592000141
Figure BDA00002250592000151
表一
在特征拟合部分,如果特征1)到特征4)均相关,则把CP_XIUSHI提升为CP_CORE;如果特征1)到特征4)均不相关,则把CP_CORE降为CP_XIUSHI。如果特征1)到特征4)均相关,则把该分词设为受信任词,并且把该词对应的怀疑规则词,全部将为CP_XIUSHI。并且修改分词对应的重要性打分,从而得到最后结果。
步骤S82,根据所述核心产品词,确定属于同一领域的各条产品信息;
对于一个卖家来说,其可能在同一领域卖多件产品,即可能提供同一领域内的多件产品信息。在实际中,该领域可以是各种类目。比如说“连衣裙”类目。比如对于卖家X来说,其有3条产品信息的核心产品词是“连衣裙”,那么分别为offer1、offer2、offer3。
比如前述卖家X在“连衣裙”领域提供offer1、offer2、offer3三个产品信息,经过归一化得到如下表二的数据:
0fferID 订单数 买家ID 评价 收藏
0ffer1 2 买家A、买家B 2次好评 3
0ffer2 1 买家A 1次好评 6
0ffer3 3 买家A、买家B、买家C 2次好评,1次差评 1
表二
步骤S83,针对每一领域,分析统计所述领域内各产品信息对应的各种行为记录表,获得各种特征维度下的特征值;
那么卖家X在“连衣裙”领域共产生6次交易、拥有3个买家。卖家X售卖的“连衣裙”相关的产品信息的被买家收藏的次数分别为3、6、1次,那么,我们认为卖家X在“连衣裙”这个产品上共有10次收藏。卖家X售卖的“连衣裙”相关的所有产品信息,共获得了9次好评和1次差评,那么好评率即为90%。
步骤S84,将所述各种特征值向量化为一个特征向量,将所述各种特征值相应的权重对应向量化为一个权重向量,并利用所述特征向量和权重向量计算所述产品信息对应的第二置信度。
如果以前述交易次数、收藏次数、和好评率三个维度进行计算,那么得到特征向量为X=(6,10,0.90),相应每个维度的权重也向量化为一个权重向量w。
那么可通过前述步骤S73的公式计算得到第二置信度。
其中,第二置信度为卖家的各领域产品信息的粒度,比如卖家X在领域A,提供了产品信息offer1,offer2,offer3;在领域B提供了产品信息offer4,offer5;那么可通过前述步骤计算卖家X在领域A的第二置信度,offer1,offer2,offer3的第二置信度对应于领域A的置信度,比如卖家X在手机领域的第一置信度为0.95;通过前述步骤计算卖家X在领域B的第二置信度,offer4,offer5的第二置信度对应于领域B的置信度,比如卖家X在手机配件领域的置信度为0.05。
具体计算方法和各特征维度权重的计算方法与步骤S73类似,本步骤不再详述。
基于上述第一置信度,和/或第二置信度,本申请的一种搜索方法包括:
步骤110,接收用户端的查询词串;
比如用户输入“春季连衣裙”,那么搜索引擎即接收用户输入的“春季连衣裙”为查询词。
步骤120,根据所述查询词串检索与查询词串相关的各产品信息;
搜索引擎首先根据所述“春季连衣裙”通过索引检索各相关的产品信息。一般情况下,搜索引擎会首先保留文本相关性大于阈值的产品信息。
优选的,根据所述查询词串检索与查询词串相关的各产品信息包括:
步骤S121,将所述查询词串进行分词操作;
比如前述“春季连衣裙”,那么通过分词得到“春季”、和“连衣裙”两个关键词。
步骤S122,基于得到的各分词进行扩展,得到扩展词;
一般情况下,对于产品信息的展示,为了保证产品信息展示的充分性,一般会对其进行扩展,即将与查询词串相关的词也作为检索的词。比如“春季”可扩展成“春天”,“3-5月”等,“连衣裙”可扩展成“连衣长裙”“连衣短裙”等。
步骤S123,通过各分词和扩展词在索引中检索获得各产品信息。
然后基于扩展得到的各词和原分词在索引中进行检索,得到各产品信息。
步骤130,查找各产品信息所属的产品提供方,或者查找各产品信息所属的产品提供方和各产品信息所属领域;
在步骤120得到各产品信息后,需要对产品信息进行排序权重调整。由于前述预置的第一置信度、或第二置信度与卖家相关,也可与产品所属领域相关。那么对于检索得到的各产品信息,则查找各产品信息所属的产品提供方,或各产品信息所属领域。实际中,可通过产品信息数据库直接得到。
对于粒度为领域层次时,比如如果存在offer4,而如前所述offer4属于卖家X的B领域,那么查找offer4所属卖家和offer4所属领域。
步骤140,提取各产品信息对应的第一置信度,所述第一置信度为所述产品信息在所属产品提供方的置信度,或提取各产品信息对应的第二置信度,所述第二置信度为所述产品信息在所属产品提供方中,所述产品信息的所属领域的置信度;其中,所述每个产品信息的第一置信度通过分析所属产品提供方的该产品信息对应的行为记录表获得,所述每个产品信息对应的第二置信度通过分析所述产品提供方在该产品信息所属领域内的各产品信息的行为记录表获得;
如果本申请预置的为具体产品信息粒度的第一置信度,那么针对每一产品信息,提取其第一置信度。所述第一置信度为所述产品信息在所属产品提供方的置信度。比如前述所述第一置信度为前述对于具体产品信息的粒度,比如卖家X提供的产品信息包括offer1,offer2,offer3,offer4,那么通过前述步骤获得每一个产品信息的第一置信度。那么当搜索结果中存在offer1时,则提取卖家offer1的第一置信度。
如果本申请预置的为卖家领域层次的粒度,比如前述卖家X在领域A,提供了产品信息offer1,offer2,offer3;在领域B提供了产品信息offer4,offer5;那么可通过前述步骤计算卖家X在领域A的第二置信度,offer1,offer2,offer3的第二置信度对应于领域A的置信度;通过前述步骤计算卖家X在领域B的第二置信度,offer4,offer5的第二置信度对应于领域B的置信度。那么当搜索结果中出现offer4时,则在前述查找到offer4属于卖家X且属于B领域时,提取B的第二置信度作为offer4的置信度。
其中,所述每个产品信息的第一置信度通过分析所属产品提供方的该产品信息对应的行为记录表获得,所述每个产品信息对应的第二置信度通过分析所述产品提供方在该产品信息所属领域内的各产品信息的行为记录表获得。具体获得方式如前所述,在此不再加以详述。
步骤150,将所述第一置信度或第二置信度加入排序权重,并将各产品信息进行排序;
一般搜索引擎是基于文本相关性对搜索结果进行排序,但在这种情况下对于产品信息的置信度或者说权威性可能存在问题,比如卖家X在领域C的产品基本上没有,其只是将该领域的产品信息挂载在其账户对应的页面中,那么就需要将这类似情况的产品信息进行降权操作。即对于第一置信度或第二置信度高的产品信息排序靠前,第一置信度或第二置信度低的产品信息排序靠后。实际中,也可以计算卖家的置信度,将其加入排序权重,但该种方式没有区分卖家经营的权威(置信度)产品领域。例如:某卖家是“手机配件”产品的权威卖家,在这个产品上有较多的交易、评价和收藏等行为,同时,该卖家也经营“手机”产品,但“手机”不是其主要经营产品。根据现有的模型,该卖家的权威性比较高。当买家搜索“手机”时,由于没有区分经营产品,该卖家也会排在搜索结果页的前面,显然搜索结果不精确。
在实际中,对于产品信息的排序可能结合文本相关性维度,商业因素维度,市场机制维度,和第一置信度或第二置信度对搜索得到的各产品信息进行排序,以保障搜索结果的精确性。
步骤160,将排序后的产品信息输出给用户端。
在步骤150对各产品信息排完序后,生成结果页返回给用户端。
参照图2,其示出了本申请一种搜索系统的结构示意图,包括:
查询接收模块210,用于接收用户端的查询词串;
检索模块220,用于根据所述查询词串检索与查询词串相关的各产品信息;
查找模块230,用于查找各产品信息所属的产品提供方,或者查找各产品信息所属的产品提供方和各产品信息所属领域;
置信度提取模块240,用于提取各产品信息对应的第一置信度,所述第一置信度为所述产品信息在所属产品提供方的置信度,或提取各产品信息对应的第二置信度,所述第二置信度为所述产品信息在所属产品提供方中,所述产品信息的所属领域的置信度;其中,所述每个产品信息的第一置信度通过分析所属产品提供方的该产品信息对应的行为记录表获得,所述每个产品信息对应的第二置信度通过分析所述产品提供方在该产品信息所属领域内的各产品信息的行为记录表获得;
排序模块250,用于将所述第一置信度或第二置信度加入排序权重,并将各产品信息进行排序;
输出模块260,用于将排序后的产品信息输出给用户端。
还包括置信度预置模块200,用于通过分析所属产品提供方的该产品信息对应的行为记录表获得所述每个产品信息的第一置信度,或通过分析所述产品提供方在该产品信息所属领域内的各产品信息的行为记录表获得所述每个产品的第二置信度。
优选的,所述置信度提取模块包括:
第一提取模块,用于针对每一产品提供方,提取所述产品提供方各产品信息对应的各种行为记录表;所述各种行为记录表包括所述各产品信息的对应的交易行为记录表、评价行为记录表、和收藏行为记录表;
第一特征值获取模块,针对每一所述产品信息,分析统计所述产品信息对应的各种行为记录表,获得各种特征维度下的特征值;
第一置信度计算模块,用于将所述各种特征值向量化为一个特征向量,将所述各种特征值相应的权重对应向量化为一个权重向量,并利用所述特征向量和权重向量计算所述产品信息的第一置信度。
优选的,所述置信度提取模块包括:
第二提取模块,用于针对每一产品提供方,提取所述产品提供方的各产品信息的核心产品词,并提取所述产品提供方各产品信息对应的各种行为记录表;所述各种日志记录表包括所述各产品信息的对应的各交易行为记录表、各评价行为记录表、和各收藏行为记录表;
领域确认模块,用于根据所述核心产品词,确定属于同一领域的各条产品信息;
第二特征值获取模块,用于针对每一领域,分析统计所述领域内各产品信息对应的各种行为记录表,获得各种特征维度下的特征值;
第二置信度计算模块,用于将所述各种特征值向量化为一个特征向量,将所述各种特征值相应的权重对应向量化为一个权重向量,并利用所述特征向量和权重向量计算所述产品信息的第一置信度。
对于系统实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本申请可用于众多通用或专用的计算系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。

Claims (11)

1.一种搜索方法,其特征在于,包括:
接收用户端的查询词串;
根据所述查询词串检索与查询词串相关的各产品信息;
查找各产品信息所属的产品提供方,或者查找各产品信息所属的产品提供方和各产品信息所属领域;
提取各产品信息对应的第一置信度,所述第一置信度为所述产品信息在所属产品提供方的置信度,或提取各产品信息对应的第二置信度,所述第二置信度为所述产品信息在所属产品提供方中,所述产品信息的所属领域的置信度;其中,所述每个产品信息的第一置信度通过分析所属产品提供方的该产品信息对应的行为记录表获得,所述每个产品信息对应的第二置信度通过分析所述产品提供方在该产品信息所属领域内的各产品信息的行为记录表获得;
将所述第一置信度或第二置信度加入排序权重,并将各产品信息进行排序;
将排序后的产品信息输出给用户端。
2.根据权利要求1所述的方法,其特征在于,所述每个产品信息的第一置信度通过分析所属产品提供方的该产品信息对应的行为记录表获得包括:
针对每一产品提供方,提取所述产品提供方各产品信息对应的各种行为记录表;所述各种行为记录表包括所述各产品信息的对应的交易行为记录表、评价行为记录表、和/或收藏行为记录表;
针对每一所述产品信息,分析统计所述产品信息对应的各种行为记录表,获得各种特征维度下的特征值;
将所述各种特征值向量化为一个特征向量,将所述各种特征值相应的权重对应向量化为一个权重向量,并利用所述特征向量和权重向量计算所述产品信息的第一置信度。
3.根据权利要求1所述的方法,其特征在于,所述每个产品信息对应的第二置信度通过分析所述产品提供方在该产品信息所属领域内的各产品信息的行为记录表获得包括:
针对每一产品提供方,提取所述产品提供方的各产品信息的核心产品词,并提取所述产品提供方各产品信息对应的各种行为记录表;所述各种日志记录表包括所述各产品信息的对应的各交易行为记录表、各评价行为记录表、和/或各收藏行为记录表;
根据所述核心产品词,确定属于同一领域的各条产品信息;
针对每一领域,分析统计所述领域内各产品信息对应的各种行为记录表,获得各种特征维度下的特征值;
将所述各种特征值向量化为一个特征向量,将所述各种特征值相应的权重对应向量化为一个权重向量,并利用所述特征向量和权重向量计算所述产品信息对应的第二置信度。
4.根据权利要求2或3所述的方法,其特征在于,分析统计所述产品信息对应的各种行为记录表,获得各种特征维度下的特征值包括:
通过分析交易行为记录表,获得包括交易次数对应特征维度下的特征值;
通过分析评价行为记录表,获得包括好评率对应特征维度下的特征值;
通过分析收藏行为记录表,获得包括收藏次数对应特征维度下的特征值。
5.根据权利要求2或3所述的方法,其特征在于,所述各种特征值相应的权重获得步骤包括:
对于每一个特征维度,选择所述特征维度下的原始样本使用极大似然估计构造出目标函数F(X);
选择所述特征维度下的初始权重W0,并结合目标函数F(X)构造搜索方向Pt和步长因子St
根据Wt+1=Wt+stPt迭代求出下一个迭代点Wt+1,当基于Wt+1的F(X)值与基于Wt的F(X)值之间的差值的绝对值小于阈值,则将Wt+1作为所述特征维度下的权重。
6.根据权利要求3所述的方法,其特征在于,提取所述产品提供方的各产品信息的核心产品词包括:
提取所述产品信息的标题信息;
对标题信息进行切词和词性标注;
依据各词的词性及修饰关系确认所述产品信息的核心产品词。
7.根据权利要求1所述的方法,其特征在于,根据所述查询词串检索与查询词串相关的各产品信息包括:
将所述查询词串进行分词操作;
基于得到的各分词进行扩展,得到扩展词;
通过各分词和扩展词在索引中检索获得各产品信息。
8.根据权利要求1所述的方法,其特征在于,将所述第一置信度或第二置信度加入排序权重,将各产品信息进行排序包括:
计算所述各产品信息与所述查询词串的文本相关性值;
计算所述各产品信息的所属领域与所述查询词串的领域相关性值;
利用各产品信息的第一置信度或第二置信度、相应的文本相关性值、领域相关性值计算总相关性值;
基于所述总相关性值对各产品信息进行排序。
9.一种搜索系统,其特征在于,包括:
查询接收模块,用于接收用户端的查询词串;
检索模块,用于根据所述查询词串检索与查询词串相关的各产品信息;
查找模块,用于查找各产品信息所属的产品提供方,或者查找各产品信息所属的产品提供方和各产品信息所属领域;
置信度提取模块,用于提取各产品信息第一置信度,所述第一置信度为所述产品信息在所属产品提供方的置信度、或提取各产品信息的第二置信度,所述第二置信度为所述产品信息在所属产品提供方中,所述产品信息的所属领域的置信度;其中,所述每个产品信息的第一置信度通过分析所属产品提供方的该产品信息对应的行为记录表获得,所述每个产品信息对应的第二置信度通过分析所述产品提供方在该产品信息所属领域内的各产品信息的行为记录表获得;
排序模块,用于将所述第一置信度或第二置信度加入排序权重,并将各产品信息进行排序;
输出模块,用于将排序后的产品信息输出给用户端。
10.根据权利要求9所述的系统,其特征在于,所述置信度提取模块包括:
第一提取模块,用于针对每一产品提供方,提取所述产品提供方各产品信息对应的各种行为记录表;所述各种行为记录表包括所述各产品信息的对应的交易行为记录表、评价行为记录表、和/或收藏行为记录表;
第一特征值获取模块,针对每一所述产品信息,分析统计所述产品信息对应的各种行为记录表,获得各种特征维度下的特征值;
第一置信度计算模块,用于将所述各种特征值向量化为一个特征向量,将所述各种特征值相应的权重对应向量化为一个权重向量,并利用所述特征向量和权重向量计算所述产品信息的第一置信度。
11.根据权利要求9所述的系统,其特征在于,所述置信度提取模块包括:
第二提取模块,用于针对每一产品提供方,提取所述产品提供方的各产品信息的核心产品词,并提取所述产品提供方各产品信息对应的各种行为记录表;所述各种日志记录表包括所述各产品信息的对应的各交易行为记录表、各评价行为记录表、和/或各收藏行为记录表;
领域确认模块,用于根据所述核心产品词,确定属于同一领域的各条产品信息;
第二特征值获取模块,用于针对每一领域,分析统计所述领域内各产品信息对应的各种行为记录表,获得各种特征维度下的特征值;
第二置信度计算模块,用于将所述各种特征值向量化为一个特征向量,将所述各种特征值相应的权重对应向量化为一个权重向量,并利用所述特征向量和权重向量计算所述产品信息的第一置信度。
CN201210387891.1A 2012-10-12 2012-10-12 一种搜索方法和系统 Pending CN103729365A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210387891.1A CN103729365A (zh) 2012-10-12 2012-10-12 一种搜索方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210387891.1A CN103729365A (zh) 2012-10-12 2012-10-12 一种搜索方法和系统

Publications (1)

Publication Number Publication Date
CN103729365A true CN103729365A (zh) 2014-04-16

Family

ID=50453443

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210387891.1A Pending CN103729365A (zh) 2012-10-12 2012-10-12 一种搜索方法和系统

Country Status (1)

Country Link
CN (1) CN103729365A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016107455A1 (zh) * 2014-12-29 2016-07-07 阿里巴巴集团控股有限公司 一种信息匹配处理方法和装置
CN105808671A (zh) * 2016-03-01 2016-07-27 王博 一种产品信息获取方法及终端
CN106326338A (zh) * 2016-08-03 2017-01-11 北京百度网讯科技有限公司 基于搜索引擎的服务提供方法和装置
WO2017028735A1 (zh) * 2015-08-20 2017-02-23 阿里巴巴集团控股有限公司 选择及推荐展示对象的方法及装置
CN106777405A (zh) * 2017-04-05 2017-05-31 安徽机器猫电子商务股份有限公司 基于SaaS服务促进低频类交易的电子商业方法
CN106997390A (zh) * 2017-04-05 2017-08-01 安徽机器猫电子商务股份有限公司 一种设备配件或零部件商品交易信息搜索方法
CN107093094A (zh) * 2016-11-25 2017-08-25 口碑控股有限公司 一种评价信息的发布方法及装置
CN107239455A (zh) * 2016-03-28 2017-10-10 阿里巴巴集团控股有限公司 核心词识别方法及装置
CN107729453A (zh) * 2017-10-09 2018-02-23 北京京东尚科信息技术有限公司 一种提取中心产品词的方法和装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101075328A (zh) * 2006-08-23 2007-11-21 腾讯科技(深圳)有限公司 一种物品排序方法及其实现系统
US7539632B1 (en) * 2007-09-26 2009-05-26 Amazon Technologies, Inc. Method, medium, and system for providing activity interest information
CN101887437A (zh) * 2009-05-12 2010-11-17 阿里巴巴集团控股有限公司 一种搜索结果生成方法及信息搜索系统
CN102193936A (zh) * 2010-03-09 2011-09-21 阿里巴巴集团控股有限公司 一种数据分类的方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101075328A (zh) * 2006-08-23 2007-11-21 腾讯科技(深圳)有限公司 一种物品排序方法及其实现系统
US7539632B1 (en) * 2007-09-26 2009-05-26 Amazon Technologies, Inc. Method, medium, and system for providing activity interest information
CN101887437A (zh) * 2009-05-12 2010-11-17 阿里巴巴集团控股有限公司 一种搜索结果生成方法及信息搜索系统
CN102193936A (zh) * 2010-03-09 2011-09-21 阿里巴巴集团控股有限公司 一种数据分类的方法及装置

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016107455A1 (zh) * 2014-12-29 2016-07-07 阿里巴巴集团控股有限公司 一种信息匹配处理方法和装置
WO2017028735A1 (zh) * 2015-08-20 2017-02-23 阿里巴巴集团控股有限公司 选择及推荐展示对象的方法及装置
CN105808671A (zh) * 2016-03-01 2016-07-27 王博 一种产品信息获取方法及终端
CN107239455A (zh) * 2016-03-28 2017-10-10 阿里巴巴集团控股有限公司 核心词识别方法及装置
CN107239455B (zh) * 2016-03-28 2021-06-11 阿里巴巴集团控股有限公司 核心词识别方法及装置
CN106326338B (zh) * 2016-08-03 2020-02-04 北京百度网讯科技有限公司 基于搜索引擎的服务提供方法和装置
CN106326338A (zh) * 2016-08-03 2017-01-11 北京百度网讯科技有限公司 基于搜索引擎的服务提供方法和装置
CN107093094A (zh) * 2016-11-25 2017-08-25 口碑控股有限公司 一种评价信息的发布方法及装置
CN106997390A (zh) * 2017-04-05 2017-08-01 安徽机器猫电子商务股份有限公司 一种设备配件或零部件商品交易信息搜索方法
CN106777405A (zh) * 2017-04-05 2017-05-31 安徽机器猫电子商务股份有限公司 基于SaaS服务促进低频类交易的电子商业方法
CN106777405B (zh) * 2017-04-05 2020-04-28 安徽机器猫电子商务股份有限公司 基于SaaS服务促进低频类商品交易的方法
CN106997390B (zh) * 2017-04-05 2020-07-07 安徽机器猫电子商务股份有限公司 一种设备配件或零部件商品交易信息搜索方法
CN107729453A (zh) * 2017-10-09 2018-02-23 北京京东尚科信息技术有限公司 一种提取中心产品词的方法和装置

Similar Documents

Publication Publication Date Title
CN103729365A (zh) 一种搜索方法和系统
CN103593425B (zh) 基于偏好的智能检索方法及系统
WO2019214245A1 (zh) 一种信息推送方法、装置、终端设备及存储介质
US9230025B2 (en) Searching for information based on generic attributes of the query
CN102982153B (zh) 一种信息检索方法及其装置
US9589277B2 (en) Search service advertisement selection
CN103309886A (zh) 一种基于交易平台的结构化信息搜索方法和装置
CN105488697A (zh) 一种基于客户行为特征的潜在客户挖掘方法
CN101206674A (zh) 以商品为媒介的增强型相关搜索系统及其方法
CN103425691A (zh) 一种搜索方法和系统
CN102254039A (zh) 一种基于搜索引擎的网络搜索方法
CN102902806A (zh) 一种利用搜索引擎进行查询扩展的方法及系统
CN102129431B (zh) 应用于网上交易平台的检索方法和系统
CN103425687A (zh) 一种基于关键词的检索方法和系统
CN103310003A (zh) 一种基于点击日志的新广告点击率预测方法及系统
CN102509233A (zh) 一种基于用户网上动作信息的推荐方法
CN102841946A (zh) 商品数据检索排序及商品推荐方法和系统
CN102160066A (zh) 特别适用于专利文献的搜索引擎和方法
CN105302810A (zh) 一种信息搜索方法和装置
CN107122467A (zh) 一种搜索引擎的检索结果评价方法及装置、计算机可读介质
CN104484380A (zh) 个性化搜索方法及装置
CN103123653A (zh) 基于贝叶斯分类学习的搜索引擎检索排序方法
CN104252456A (zh) 一种权重估计方法、装置及系统
CN105653562A (zh) 一种文本内容与查询请求之间相关性的计算方法及装置
US20190080352A1 (en) Segment Extension Based on Lookalike Selection

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1194174

Country of ref document: HK

RJ01 Rejection of invention patent application after publication

Application publication date: 20140416

RJ01 Rejection of invention patent application after publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: WD

Ref document number: 1194174

Country of ref document: HK