CN103729351B - 查询词推荐方法及装置 - Google Patents

查询词推荐方法及装置 Download PDF

Info

Publication number
CN103729351B
CN103729351B CN201210380800.1A CN201210380800A CN103729351B CN 103729351 B CN103729351 B CN 103729351B CN 201210380800 A CN201210380800 A CN 201210380800A CN 103729351 B CN103729351 B CN 103729351B
Authority
CN
China
Prior art keywords
query word
candidate query
evaluation
estimate
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210380800.1A
Other languages
English (en)
Other versions
CN103729351A (zh
Inventor
王�义
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201210380800.1A priority Critical patent/CN103729351B/zh
Publication of CN103729351A publication Critical patent/CN103729351A/zh
Application granted granted Critical
Publication of CN103729351B publication Critical patent/CN103729351B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及一种查询词推荐方法及装置,包括:根据用户输入词确定候选查询词;根据用户历史搜索行为数据,建立搜索行为使用的查询词的第一评价值的预测模型,所述第一评价值表征该查询词引导的商品在设定时间内的交易信息;根据预测模型及候选查询词对应的用户历史搜索行为数据预测该候选查询词的第一评价值;根据该第一评价值,滤除候选查询词或对该候选查询词进行排序,并将进行滤除或排序后的候选查询词推荐给用户。因此,本申请实现了推荐的查询词所对应的商品易于成交,并增加了作弊成本能。

Description

查询词推荐方法及装置
技术领域
本申请涉及电子商务领域,尤其涉及一种查询词推荐方法及装置。
背景技术
为了减少电子商务网站中用户的搜索路径,在用户进行查询词的输入过程中以及搜索结束后,为用户推荐可能的候选查询词(Query),帮助用户明确搜索意图,并实现购买行为。其中,用户输入查询词的过程中为用户推荐候选查询词的功能称为搜索下拉提示,搜索结束后为用户推荐候选查询词的功能称为相关搜索。
搜索下拉提示作为用户登陆搜索页面接触到的第一个服务,它可以在用户输入搜索关键词的过程中为用户推荐相关的查询词。常见的搜索下拉提示服务,首先会收集与用户当前输入的查询词具有相同前缀的查询词集合,这个查询词集合中的查询词按照前一天各查询词的搜索结果页面的浏览次数(Page View,PV)进行排序,并根据所述排序进行查询词的推荐。采用这种方法推荐出的查询词未反应商品成交量、同时容易被外部发现漏洞,导致作弊现象的发生。
相关搜索功能是在用户完成一个关键词的搜索后,为用户推荐的一组查询词,如果用户对当前搜索结果不满意,可以选择相关搜索推荐的查询词来明确自己的搜索意图。一般的,相关搜索功能中获取查询词的方法包括以下几步:
(1)在用户历史使用的查询词中召回与用户当前使用的查询词相关的词的集合;
(2)按照用户当前输入的查询词与召回的查询词的文本分以及召回查询词的自身页面浏览次数信息,为召回查询词设定推荐度分值,其中,文本分即文本相似度,用于表征两个给定文本之间的相似性,数值越大表示两个文本相似度越高;
(3)按照召回查询词的推荐度分值进行排序获得相关搜索推荐结果。
这种方法的缺点是:过分关注用户输入的查询词与召回的查询词的相似度,导致召回的结果与当前用户输入的查询词过分相似;同时召回词的PV特征比较明显,可以通过人为增加某些召回查询词的搜索结果页的点击量来提升召回查询词的排序,作弊成本比较低,使得推荐结果准确度较低。
发明内容
本申请的目的是,提供一种查询词推荐方法及装置,将历史搜索行为数据、点击反馈信息用以获取查询词,以实现了推荐的查询词尽可能多的反映用户的意图,并且其所对应的商品易于成交,并增加了作弊成本能。
为实现上述目的,本申请提供了一种查询词推荐方法,所述方法包括:
根据用户输入词确定候选查询词;
根据用户历史搜索行为数据,建立搜索行为使用的查询词的第一评价值的预测模型,所述第一评价值表征该查询词引导的商品在设定时间内的交易信息;
根据预测模型及候选查询词对应的用户历史搜索行为数据预测该候选查询词的第一评价值;
根据该第一评价值,滤除候选查询词或对该候选查询词进行排序,并将进行滤除或排序后的候选查询词推荐给用户。
本申请还提供了一种查询词推荐装置,所述装置包括:
确定单元,用于根据用户输入词确定候选查询词;
建立单元,用于根据用户历史搜索行为数据,建立搜索行为使用的查询词的第一评价值的预测模型,所述第一评价值以该查询词引导的商品在设定时间内的交易信息表征;
预测单元,用于根据预测模型及候选查询词对应的用户历史搜索行为数据预测该候选查询词的第一评价值;
推荐单元,用于根据该第一评价值,滤除候选查询词或对该候选查询词进行排序,并将进行滤除或排序后的候选查询词推荐给用户。
本申请实施例通过根据用户历史搜索行为数据,建立搜索行为使用的查询词的第一评价值的预测模型,所述第一评价值以该查询词引导的商品在设定时间内的交易信息表征;根据预测模型及候选查询词对应的用户历史搜索行为数据预测该候选查询词的第一评价值;根据该第一评价值,滤除候选查询词或对该候选查询词进行排序,并将进行滤除或排序后的候选查询词推荐给用户。实现了推荐的查询词所对应的商品易于成交,并增加了作弊成本能。
附图说明
图1为本申请实施例提供的查询词推荐方法的流程图;
图2为本申请实施例提供的第一评价值的预测模型建立方法流程图;
图3为本申请实施例提供的又一查询词推荐方法流程图;
图4为本申请实施例提供的根据用户的点击反馈数据对所述候选查询词的第一评价值进行修正的方法流程图;
图5为本申请实施例提供的文本相似度计算方法流程图;
图6为本申请实施例提供的类目点击分布比例计算方法流程图;
图7为本申请实施例提供的搜索词、查询词及其它信息对应关系图;
图8为本申请实施例提供的查询词获取过程示意图;
图9为本申请实施例提供的查询词推荐装置的示意图;
图10为本申请实施例提供的又一查询词推荐装置的示意图。
具体实施方式
下面通过附图和实施例,对本申请的技术方案做进一步的详细描述。
本申请实施例通过将历史搜索行为数据和/或历史点击数据用于选择查询词,从而可以使获取的查询词对应的商品易于成交并且尽可能多的反映用户的意图,增加了作弊成本,同时可以增加查询词的文本丰富度。
图1为本申请实施例查询词推荐方法的示意图。如图1所示,本申请实施例提供的查询词推荐方法具体包括以下步骤:
步骤101,根据用户输入词确定候选查询词。
根据用户输入词向用户推送一组候选的查询词以现有方法即可实现,如根据用户输入词召回与用户当前输入词具有相同前缀的词集合或用户历史搜索记录中找出与当前输入词文意相关或相似的词的集合。
对于一个用户输入词,该输入词都对应有由候选查询词形成的集合,该集合记为其中,Content表示用户输入词,Query表示候选推荐词,l表示搜索词对应的查询词个数。
步骤102,根据用户历史搜索行为数据,建立搜索行为使用的查询词引导的商品在设定时间内的第一评价值的预测模型,所述第一评价值表征该查询词引导的商品在设定时间内的交易信息。
在对用户进行查询词推荐过程中,为了获得查询词引导的商品(即根据该查询词获得的搜索结果中包含的商品)的交易信息,使推荐结果更加符合用户的意图,可以根据用户的历史搜索行为数据建立任一查询词的搜索结果包含的商品在预定时间内(当日或未来某一天)的交易信息的预测模型。所述的交易信息可以包括商品成交金额和/或商品成交数量。本实施例中第一评价值使用所述成交金额来表征,该第一评价值用于根据查询词引导的商品在设定时间内的成交金额评价该查询词的推荐度或符合用户意图的程度。所述第一评价值可以是对所述成交金额进行预定的数据处理(如归一化处理)后获得的。因此,所述成交金额的预测模型即为第一评价值的预测模型,记为Y=H(X),其中,Y表示根据某一查询词的搜索结果包含的商品在预定时间内的成交金额得到的第一评价值,X表示由该查询词对应的历史搜索行为数据组成的向量。
可以理解的,建立搜索行为使用的查询词引导的商品在设定时间内的第一评价值的预测模型可以在步骤101前实施也可以在步骤102后实施,本申请实施例在此对这些步骤的实施顺序不做限制。
步骤103,根据预测模型及候选查询词对应的用户历史搜索行为数据预测该候选查询词的第一评价值。
获得该预测模型后,可以根据该预测模型和候选查询词在预定时间对应的历史搜索行为数据预测出该候选查询词的第一评价值,也可以理解为通过该预测模型来预测该候选查询词引导的商品在设定时间内的成交金额,进而获得该候选查询词的第一评价值。第一评价值越高,表示该查询词对应的商品的成交金额越高,也更符合用户的意图。
步骤104,根据该第一评价值,滤除候选查询词或对该候选查询词进行排序,并将进行滤除或排序后的候选查询词推荐给用户。
由于第一评价值越高,符合用户意图的可能性越大,因此,可以将该候选查询词按照第一评价值从大到小依序排列,将评价值高的该候选查询词优先推荐给用户。也可以预先设定阈值,将滤除掉评价值低于该设定阈值的候选查询词,从而将评价值高于该设定阈值的候选查询词推荐给用户。
本申请该实施例通过根据历史搜索行为数据计算查询词的第一评价值,根据该第一评价值,滤除候选查询词或对该候选查询词进行排序,并将进行滤除或排序后的候选查询词推荐给用户。实现了推荐的查询词所对应的商品易于成交,并增加了作弊成本能。
具体地,图2为本申请实施例提供的第一评价值的预测模型建立方法流程图。如图2所示,该预测模型建立方法包括以下步骤:
步骤201,统计历史搜索行为数据,并对历史搜索行为数据处理形成训练样本。
从搜索日志中统计查询词引导的商品在设定时间内的历史成交金额y及查询词对应的在该设定时间以前的历史搜索行为数据X,根据设定时间内的历史成交金额及该设定时间以前的历史搜索行为数据构建第一评价值预测模型的训练样本。所述查询词可以为用户在历史搜索中使用的任意关键词。所述历史搜索行为数据包括一个或多个维度的历史搜索行为数据,记为f1,......,fn,(n为大于1的自然数)。所述历史搜索行为数据作为向量记作X=[f1,...fi,...f7]。所述历史搜索行为数据包括页面浏览数、搜索引擎引导的页面展现次数(Induct Page View,IPV)、商品成交笔数、发生交易的人数(User View,UV)、成交件数、搜索页面使用人数(User View,UV)、及通过引擎引导的使用人数(Induct Page ViewUser View,IPVUV)中的一项或多项的组合。其中,通常情况下,当天以前某一查询词对应的历史搜索行为数据可以根据用户的历史日志统计获得,是已知的,该查询词对应的商品在当天的成交金额需要在第二天进行统计才会知道,因此,作为训练样本的搜索行为数据和成交金额对应的时间点之间有一个时间差。本申请实施例选取某一设定日(比如当天)以前的7天内的历史搜索行为数据的加和作为训练样本,即将7天内同一维度的历史搜索行为数据分别相加作为所述历史搜索行为数向量X中的一个特征值fi(1≤i≤7,i为自然数),例如,假设第一天查询词对应的历史搜索行为数据为:第i天查询词对应的历史搜索行为数据为:第7天查询词对应的历史搜索行为数据为: 然后,对每个特征值fi取Logefi,以使特征值比较平滑。同样将每个查询词引导的商品在该设定日(比如当天)的成交额金额y也取Logey,同时对Logey做基于密度的归一化得到训练样本中的Y,从而保证目标值Y∈[0,1],并且在[0,1]这个区间内Y值是分布均匀的。从而获得训练样本Train_Sample(X,Y)。其中,Y即为第一评价值的样本数据。
需要说明的是,本申请实例取7天的历史数据进行处理形成训练样本,本领域技术人员可以根据实际情况取其它不同天数的数据进行处理形成训练样本。另外,本申请实施例中选取了7种历史搜索行为数据建立所述预测模型,本领域技术人员可以根据实际情况选取其它历史搜索行为数据或历史搜索行为数据的组合建立所述预测模型。
步骤202,进行模型训练获得预测模型。
取100万样本作为训练集合(也可以采用其它数量的样本作为训练集合),选择算法模型进行模型训练,获得预测模型H(X)。本申请实施例采用最小二乘法(generalizedleast squares,简称GLS)进行模型训练。
最小二乘法,又称最小平方法(least square method)是一种数学优化技术。它通过最小化误差的平方和寻找数据X和Y的最佳函数匹配Y=F(X)。并利用最佳匹配函数和已知数据X简便地求得未知的数据Y,这里的X和Y可以是一维数据也可以是多维数据。
本申请实施例中,利用GLS算法训练得到的预测模型为其中,j表示X中特征个数,wj表示第j个特征的权重,fj表示X中第j个特征值,b表示一个常量。
在另一个例子中,可以采用基于集成算法的决策树森林算法(Gradient boostingDecision tree简称GBDT)进行模型训练。基于GBDT的算法是对一组样本集合进行切割,然后在每组样本集上构建一个决策树,使用决策树森林来对既有的样本集合进行分类。
利用GBDT算法训练得到的预测模型为其中,m表示基分类器个数,h(x;am)表示基分类器模型,x表示模型泛化的样本空间,am表示模型参数,βm表示第m个分类器在集成分类中的权重。
需要说明的是,除上述两种算法外,本领域技术人员也可以采取其它算法建立所述预测模型。
建立所述预测模型后,可以根据该预测模型和候选查询词的历史搜索行为数据预测该候选查询词第一评价值。具体为:从搜索日志中获得各个查询词的历史搜索行为数据集合{Xnext,1,...,Xnext,i,...},并通过第一评价值预测模型获得各个查询词的第一评价值{Y'next,1,...,Y'next,i,...},其中,搜索行为数据包括页面浏览数、引擎引导的页面展现次数(Induct Page View,IPV)、商品成交笔数、发生交易的人数(UserView,UV)、成交件数、搜索页面使用人数(User View,UV)、及通过引擎引导的使用人数(Induct Page View User View,IPVUV)中的一项或多项的组合。
优选地,为了使预测结果更准确,可以根据设定的时间间隔重新进行第一评价值预测模型的模型训练,得到新的第一评价值预测模型,根据新的第一评价值预测模型预测第一评价值。例如,采用第一天的历史搜索行为数据和第二天获得的该历史搜索行为数据对应的商品的实际成交金额进行模型训练,获得第一评价值预测模型后,可以采用该预测模型以及第二的历史搜索行为数据预测其对应的成交金额(实际成交金额可以在第三天获得);当第二天的历史搜索行为数据对应的商品实际成交金额在第三天获得后,可以根据第二天的历史搜索行为数据及在第三天获得的该实际成交金额重新进行模型训练,获得新的第一评价值预测模型,然后根据该新的第一评价值预测模型及第三天的历史搜索行为数据预测其对应的成交金额(应该在第四天获得),后面的预测以此类推。
优选的,在本申请另一实施例中,如图3所示,图3为本申请实施例提供的又一查询词推荐方法流程图,所述方法包括步骤301-304,其中,步骤301-303与步骤101-103一样,在此不复赘述。
步骤304,根据用户的点击反馈数据对所述候选查询词的第一评价值进行修正,根据修正后的第一评价值滤除候选查询词或对该候选查询词进行排序,并将进行滤除或排序后的候选查询词推荐给用户。
用户的点击反馈信息可以进一步帮助我们确认哪些推荐结果才是用户希望获得的。因此,对用户的点击反馈信息加以利用,可以使推荐结果更加符合用户的意图。
具体地,所述点击反馈数据是指候选查询词的点击分布比例和位置的点击分布比例。表1是搜索词和查询词对应关系的举例,根据表1可以清楚的看出点击分布比例和位置点击分布比例的意义。
表1输入词和查询词对应关系
对于一个用户输入词Content,该输入词都对应有由候选查询词形成的集合l表示输入词Content对应的查询词个数。集合中的任意一个候选查询词的历史点击次数ni可以从点击日志中获得,同样可以获得集合中所有候选查询词的点击次数之和则任意一个候选查询词的点击分布比例为ni/N,即候选查询词的点击比例可以为该候选查询词的用户点击次数与该候选查询词所在的、用户输入词所对应的候选查询词集合的总点击次数的比率。将所有候选查询词的点击分布比例写成集合的形式为为便于理解,下面以表1为例对上述过程做具体解释:以上述表1中的用户输入词Content1为例,其对应有5个候选查询词每个输入词对应的历史点击次数分别为并且假设之和为则N,则候选词的点击比例依次为
所述位置可以包括在进行查询词推荐时被推荐查询词在排序中的位置。对于用户输入词集合{Contentk|k=1,...,x},x表示用户输入词个数,每个输入词都对应有由候选查询词形成的集合每个输入词对应的候选查询词集合中的每一个位置的历史点击次数nki(也即候选查询词对应的历史点击次数)可以从点击日志中获得,则不同输入词对应的各候选查询词集合在第i个位置上的历史点击次数总和为统计各位置的历史点击次数也可以计算得到所有位置的总点击次数则第i个位置对应的点击分布比例Click_Dis_Posi为Ni/N,将所有位置的点击分布比例写成集合的形式为{Click_Dis_Posi|i=1,...,l}。为便于理解,下面以表1为例对上述过程做具体解释:以上述表1为例,候选查询词位置“1”上的历史点击次数N1查询词位置“2”上的历史点击次数N2以此类推可以计算出其它为位置的历史点击次数,所有位置的点击次数N为每个位置的历史点击次数的加和,那么,查询词位置“1”的位置的点击分布比例为N1/N,查询词位置“2”的位置的点击分布比例为N2/N,以此类推其它位置的位置点击分布比例。
具体地,图4为本申请实施例提供的根据用户的点击反馈数据对所述候选查询词的第一评价值进行修正的方法流程图。如图4所示,根据用户的点击反馈数据对所述候选查询词的第一评价值进行修正的方法包括:
步骤401,计算候选查询词的点击分布比例。
对于一个用户输入词Content,从点击日志中获得该输入词所对应的候选查询词集合中的每个候选查询词的点击次数,并计算出候选查询词的点击分布比例集合
步骤402,计算位置点击分布比例。
对于所有的用户输入词,计算出位置点击分布比例集合{Click_Dis_Posi|i=1,...,l}。
优选地,可以先将候选查询词按照第一评价值从高到低排序,再根据排序后的候选查询词的用户点击反馈数据统计获得位置的点击分布比例。
步骤403,计算候选查询词的第一评价值的修正值。
候选查询词的第一评价值的修正值记作第二评价值,根据上述候选查询词的点击分布比例、位置点击分布比例和第一评价值计算出第二评价值,计算公式如下:
Score_Qi=[Old_Score_Qi*(1+(Click_Dis_Qi-Click_Dis_Posi))],其中,Score_Qi表示第i个查询词的第二评价值,Old_Score_Q表示第i个查询词的第一评价值。
需要说明的是,本申请实施例提供的查询词推荐方法既可以用于相关搜索功能,又可以用于搜索下拉提示功能。
本申请该实施例通过根据历史搜索行为数据计算候选查询词的第一评价值,根据所述第一评价值和点击反馈信息计算第二评价值,根据所述候选查询词的第二评价值,对所述候选查询词进行过滤或排序;将过滤或排序后的查询词推荐给用户,实现了推荐的查询词尽可能多的反映用户的意图。进一步地,所述候选查询词的推荐方式考虑了商品成交金额,增加了作弊成本。
在进行候选查询词推荐时,为了保证推荐结果在文本上的丰富性,可以剔除在文本上比较相似的查询词,从而增加推荐给用户的候选查询词的文本丰富度。
因此,在本申请实施例还可以将所述候选查询词进行比较,获得文本相似度;在所述文本相似度超过设定阈值时滤除进行比较的候选查询词中第一评价值低的候选查询词。所述候选查询词的比较包括:比较根据所述候选查询词获得的搜索结果页;所述文本相似度包括所述搜索结果页的商品信息的相似度。
根据候选查询词的文本相似度比较滤除进行比较的候选查询词中第一评价值低的候选查询词的步骤,可以在根据第一评价值滤除候选查询词或对该候选查询词进行排序之前或之后实施,本申请对上述步骤的实施顺序不做限制。也即,根据第一评价值对候选查询词进行滤除或排序可以是对根据文本相似度比较而进行滤除后的候选查询词;也可以是,根据第一评价值对候选查询词进行滤除或排序后进一步根据文本相似度比较将第一评价值低的候选查询词滤除,并将剩下的候选查询词推荐给用户。
可以理解的,在本申请另一些实施例可以在所述文本相似度超过设定阈值时滤除进行比较的候选查询词中第二评价值低的候选查询词。根据候选查询词的文本相似度比较滤除进行比较的候选查询词中第二评价值低的候选查询词的步骤,可以在根据第二评价值滤除候选查询词或对该候选查询词进行排序之前实施,也可以是在根据第二评价值滤除候选查询词或对该候选查询词进行排序之后实施。本申请对上述步骤的实施顺序不做限制。
图5为本申请实施例提供的文本相似度计算方法流程图。如图5所示,文本相似度计算步骤如下:
步骤501,统计集合中每个候选查询词在搜索结果页的商品信息。
对于用户输入词Content对应的候选查询词集合统计集合中每个候选查询词在搜索结果页的商品信息,并记为
其中,AuctionIDSi=(AuctionID1,AuctionID2,...AuctionIDk...AuctionIDn),AuctionIDSi为第i个候选查询词搜索出的商品集合,AuctionIDk为AuctionIDSi中用于区分不同商品的标识,n为通过候选查询词搜索出的商品数量。
步骤502,根据候选查询词对应的搜索结果页包含的商品信息的相似性计算不同查询词间的文本相似度。计算公式如下:
其中:
AuctionIDSi∩AuctionIDSj表示在AuctionIDSi和AuctionIDSj间取交集,也即表示两个集合中相同的商品的数量。
AuctionIDSi∪AuctionIDSj表示在AuctionIDSi和Auction IDSj间取并集,也即表示两个集合中商品的数量之和,两个集合中相同商品不重复计算。
也就是说,不同候选查询词的文本相似度可以用一个候选查询词对应的搜索结果页包含的与另一候选查询词对应的搜索结果页的商品相同的商品数量相对于这两个候选查询词的搜索结果页所包含的不同的商品数量的总和的比值来表示。
在进行查询词推荐时,为了保证推荐结果在类目上的丰富性,可以根据候选查询词引导的商品的点击量计算出输入词对应的候选查询词集合引导的商品在商品类目的点击分布比例,并根据类目点击分布比例推荐候选查询词。
具体地,图6为本申请实施例提供的类目点击分布比例计算方法流程图。如图6所示,类目点击分布比例计算方法包括以下步骤:
步骤601,统计用户输入词对应的每个候选查询词引导的商品的点击信息。
对于用户输入词Content,将其对应的候选查询词集合记为其中,l表示输入词对应的查询词个数,该集合中每个候选查询词在搜索结果页的商品信息记为其中,AuctionIDSi为候选查询词搜索出的商品集合,为AuctionIDSi中用于区分不同商品的标识,ni搜索出的商品数量。图7为本申请实施例提供的输入词、候选查询词及其它信息对应关系图,从图7中可以很清楚的看出输入词、候选查询词和候选查询词引导的商品之间的关系。
步骤602,计算每个候选查询词对应的商品类目点击量。
通过引导的每个商品的统计获得其对应的后台商品类目First_level_CatIDk。根据从点击日志中获取的每个商品的点击量,可以计算出该商品所对应的商品类目First_level_CatIDk的点击量Count_First_level_CatIDk,通过统计每个商品的点击量可以获得每个候选查询词引导的在商品类目上的点击量。计算方法为:如图7所示,假设商品的点击量为c1,商品的点击量为c2,如果商品对应同一个商品类目First_level_CatIDc,则商品类目First_level_CatIDc的点击量为c1+c2,如果还有其它商品对应的商品类目也为First_level_CatIDc,则商品类目First_level_CatIDc的点击量为在c1+c2基础上继续加上该其它商品的点击量。则对应的所有商品的商品类目的点击量可以写成集合的形式其中,mi表示所对应的商品类目总数,由于不同的商品可能从属于同一个商品类目,因此,中的所有商品所对应的商品类目总数必然小于等于商品数量,即mi≤ni
步骤603,计算候选查询词集合中每一候选查询词对应的商品类目点击分布比例。
根据上述步骤获得的查询词集合中每个所对应的商品类目点击量集合可以计算出商品类目总数,和每个商品类目对应的点击量,并将其写成集合形式{Count_First_level_CatIDi Content|i=1,...,t},其中,Count_First_level_CatIDi Content表示第i个商品类目的点击量,t表示输入词Content对应的商品类目总数,由此,可以计算出每个商品类目的点击量占所有商品类目点击量Nc的比值Pro_CatIDi Content,即商品类目的点击分布比例,可以写成集合形式其中,
可以通过上述步骤计算出的类目点击分布比例推荐查询词。具体地,根据每个商品类目的点击分布比例Pro_CatIDi Content和预设的为用户输入词推荐的候选查询词个数N,计算出对应所述商品类目的查询词个数然后统计候选查询词集合中对应所述商品类目的候选查询词,并将其按照第一评价值或第二评价值从高到低排序,选择前N‵个候选查询词进行推荐。为便于理解,下面以图8为例做详细阐述,图8为本申请实施例提供的查询词获取过程示意图,假设,按照第一评价值或第二评价值高到低排序的查询词为Querya~Querye,按点击分布比例从高到低排序的一级类目为A~F,各个一级类目的点击分布比例依次为如图8中所示的40%、20%、18%、10%、9%和3%。候选查询词Querya对应的一级类目为A、B,查询词Queryb对应的一级类目为C、E、F,其它候选查询词与所述以及类目的对应关系如图8所示,并且假设需要获取4个查询词,那么,根据上述信息,可以计算得到每个商品类目需要对应的候选查询词的个数,例如,对应商品类目A的候选查询词个数为4*40%=2个,因此,从候选查询词中选取第一评价值或第二评价值高的对应商品类目A的两个候选查询词Querya和Queryc,对应商品类目B的候选查询词个数为4*20%=1个,因此,从候选查询词中选取第一评价值或第二评价值高的对应商品类目B的候选查询词Queryd,对应商品类目C的候选查询词个数为4*18%=1个,因此,从候选查询词中选取第一评价值或第二评价值高的对应商品类目C的查询词Queryb,其它依次类推。
需要说明的是,本申请实施例提供的方法既可以用于相关搜索功能,又可以用于搜索下拉提示功能。
本申请该实施例根据选择的所述候选查询词对应的商品类目的点击比例和所述第一评价值或第二评价值,推荐候选查询词,实现了推荐的候选查询词在商品类目上的丰富度。
相应地,本申请提供一种查询词推荐装置。如图9所示,图9为本申请实施例提供的查询词推荐装置的示意图。该装置包括:
确定单元901,用于根据用户输入词确定候选查询词。
建立单元902,用于根据用户历史搜索行为数据,建立搜索行为使用的查询词的第一评价值的预测模型,所述第一评价值表征该查询词引导的商品在设定时间内的交易信息。
预测单元903,用于根据预测模型及候选查询词对应的用户历史搜索行为数据预测该候选查询词的第一评价值。
推荐单元904,用于根据该第一评价值,滤除候选查询词或对该候选查询词进行排序,并将进行滤除或排序后的候选查询词推荐给用户。
本申请实施例提供的装置中植入了本申请第一个实施例提供的方法,因此,本申请实施例提供的装置的各个单元的具体功能在此不复赘述。
需要说明的是,本申请实施例提供的装置既可以用于相关搜索功能,又可以用于搜索下拉提示功能。
本申请该实施例通过根据历史搜索行为数据计算查询词的第一评价值,根据该第一评价值,滤除候选查询词或对该候选查询词进行排序,并将进行滤除或排序后的候选查询词推荐给用户。实现了推荐的查询词所对应的商品易于成交,并增加了作弊成本能。
本申请的一个优选实施例为:如图10所示,图10为本申请实施例提供的又一查询词推荐装置的示意图。该装置包括:确定单元1001、建立单元1002、预测单元1003和推荐单元1004。其中,确定单元1001、建立单元1002、预测单元1003的工作过程分别与上述实施例中的确定单元901、建立单元902和预测单元903的工作过程一样,在此不复赘述。
推荐单元1004包括修正子单元1010和推荐子单元1020。
修正子单元1010,用于根据用户的点击反馈数据对所述候选查询词的所述第一评价值进行修正获得所述候选查询词的第二评价值。
推荐子单元1020,用于根据所述第二评价值滤除候选查询词或对该候选查询词进行排序,并将进行滤除或排序后的候选查询词推荐给用户。
本申请实施例提供的装置中植入了本申请第二个实施例提供的方法,因此,本申请实施例提供的装置的各个单元的具体功能在此不复赘述。
需要说明的是,本申请实施例提供的装置既可以用于相关搜索功能,又可以用于搜索下拉提示功能。
本申请该实施例通过根据历史搜索行为数据计算候选查询词的第一评价值,根据用户的点击反馈数据对所述候选查询词的第一评价值进行修正获得第二评价值,根据所述候选查询词的第二评价值,对所述候选查询词进行过滤或排序;将过滤或排序后的查询词推荐给用户,实现了推荐的查询词尽可能多的反映用户的意图。进一步地,所述候选查询词的推荐方式考虑了商品成交金额,增加了作弊成本。
本领域普通技术人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上所述的具体实施方式,对本申请的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本申请的具体实施方式而已,并不用于限定本申请的保护范围,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (20)

1.一种查询词推荐方法,其特征在于,包括:
根据用户输入词确定候选查询词;
根据用户历史搜索行为数据,建立搜索行为使用的查询词的第一评价值的预测模型,所述第一评价值表征该查询词引导的商品在设定时间内的交易信息;
根据预测模型及候选查询词对应的用户历史搜索行为数据预测该候选查询词的第一评价值;
根据该第一评价值,滤除候选查询词或对该候选查询词进行排序,并将进行滤除或排序后的候选查询词推荐给用户。
2.根据权利要求1所述的查询词推荐方法,其特征在于,所述交易信息包括商品成交金额和/或商品成交数量。
3.根据权利要求1所述的查询词推荐方法,其特征在于,所述历史搜索行为数据为设定时间内以前的用户历史搜索行为数据;
预测该候选查询词的第一评价值的方法包括使用当日以前的所述历史搜索行为数据预测该候选查询词引导的商品在当日的交易信息。
4.根据权利要求1所述的查询词推荐方法,其特征在于,该预测模型的建立方法包括:
使用最小二乘法或基于集成算法的决策树森林算法进行模型训练获得预测模型。
5.根据权利要求1所述的查询词推荐方法,其特征在于,所述根据该第一评价值,滤除候选查询词或对该候选查询词进行排序,并将进行滤除或排序后的候选查询词推荐给用户的方法包括:
根据用户的点击反馈数据对所述候选查询词的所述第一评价值进行修正,获得所述候选查询词的第二评价值;
根据所述第二评价值滤除候选查询词或对该候选查询词进行排序,并将进行滤除或排序后的候选查询词推荐给用户。
6.根据权利要求5所述的查询词推荐方法,其特征在于,所述点击反馈数据包括候选查询词的点击分布比例及位置点击分布比例;
所述根据用户的点击反馈数据对所述候选查询词的第一评价值进行修正,获得所述候选查询词的第二评价值的方法包括:
计算候选查询词的点击分布比例;
计算位置点击分布比例;及
根据候选查询词的点击分布比例、位置点击分布比例和第一评价值计算出第二评价值,以所述第二评价值作为第一评价值的修正值,计算公式如下:
Score_Qi=[Old_Score_Qi*(1+(Click_Dis_Qi-Click_Dis_Posi))],
其中,Score_Qi表示第i个候选查询词的第二评价值,Old_Score_Qi表示第i个候选查询词的第一评价值,Click_Dis_Qi表示i个候选查询词的点击比例,Click_Dis_Posi表示第i个位置的点击分布比例,i为自然数。
7.根据权利要求5所述的查询词推荐方法,其特征在于,所述根据所述第二评价值滤除候选查询词或对该候选查询词进行排序,并将进行滤除或排序后的候选查询词推荐给用户的方法包括:
根据所述第二评价值滤除候选查询词或对该候选查询词进行排序,并将进行滤除或排序后的候选查询词的搜索结果页进行比较,获得所述搜索结果页的商品信息的相似度;
在所述相似度超过设定阈值时滤除进行比较的候选查询词中所述第二评价值低的候选查询词,将滤除后的候选查询词推荐给用户。
8.根据权利要求7所述的查询词推荐方法,其特征在于,所述候选查询词的相似度是通过以下公式计算的:
Simi(Queryi,Queryj)=(AuctionIDSi∩AuctionIDSj)/(AuctionIDSi∪AuctionIDSj),
其中,Queryi表示第i个候选查询词,Queryj表示第j个查询词,Simi(Queryi,Queryi)表示所述候选查询词的相似度,AuctionIDSi表示第i个候选查询词搜索出的商品集合,AuctionIDSj表示第j个候选查询词搜索出的商品集合,AuctionIDSi∩AuctionIDSj表示两个商品集合中相同商品的数量;AuctionIDSi∪AuctionIDSj表示两个商品集合中商品数量之和。
9.根据权利要求7所述的查询词推荐方法,其特征在于,所述在所述相似度超过设定阈值时滤除进行比较的候选查询词中所述第二评价值低的候选查询词,将滤除后的候选查询词推荐给用户的方法包括:在所述相似度超过设定阈值时滤除进行比较的候选查询词中所述第二评价值低的候选查询词;
根据滤除后的候选查询词所引导的商品的点击量,计算出所述滤除后的候选查询词所引导的商品对应的商品类目的点击分布比例,并根据所述商品类目的点击分布比例和所述第二评价值对所述滤除后的候选查询进行滤除或排序,将进行滤除或排序后的候选查询词推荐给用户。
10.根据权利要求9所述的查询词推荐方法,其特征在于,所述根据滤除后的候选查询词所引导的商品的点击量,计算出所述滤除后的候选查询词所引导的商品对应的商品类目的点击分布比例的方法包括:
统计所述滤除后的候选查询词引导的商品的点击信息;
计算每个候选查询词对应的商品类目点击量;及
统计每个商品类目的点击量,获得候选查询词集合对应的商品类目点击分布比例。
11.一种查询词推荐装置,其特征在于,包括:
确定单元,用于根据用户输入词确定候选查询词;
建立单元,用于根据用户历史搜索行为数据,建立搜索行为使用的查询词的第一评价值的预测模型,所述第一评价值以该查询词引导的商品在设定时间内的交易信息表征;
预测单元,用于根据预测模型及候选查询词对应的用户历史搜索行为数据预测该候选查询词的第一评价值;
推荐单元,用于根据该第一评价值,滤除候选查询词或对该候选查询词进行排序,并将进行滤除或排序后的候选查询词推荐给用户。
12.根据权利要求11所述的查询词推荐装置,其特征在于,所述建立单元中的所述交易信息包括商品成交金额和/或商品成交数量。
13.根据权利要求11所述的查询词推荐装置,其特征在于,所述建立单元中的所述历史搜索行为数据为设定时间内以前的用户历史搜索行为数据;
所述建立单元使用当日以前的所述历史搜索行为数据预测该候选查询词引导的商品在当日的交易信息。
14.根据权利要求11所述的查询词推荐装置,其特征在于,所述建立单元使用最小二乘法或基于集成算法的决策树森林算法进行模型训练获得预测模型。
15.根据权利要求11所述的查询词推荐装置,其特征在于,所述推荐单元具体包括:
修正子单元,用于根据用户的点击反馈数据对所述候选查询词的所述第一评价值进行修正获得所述候选查询词的第二评价值;
推荐子单元,用于根据所述第二评价值滤除候选查询词或对该候选查询词进行排序,并将进行滤除或排序后的候选查询词推荐给用户。
16.根据权利要求15所述的查询词推荐装置,其特征在于,所述修正子单元中的点击反馈数据包括候选查询词的点击分布比例及位置点击分布比例;
所述修正子单元具体用于,
计算候选查询词的点击分布比例;
计算位置点击分布比例;及
根据候选查询词的点击分布比例、位置点击分布比例和第一评价值计算出第二评价值,以所述第二评价值作为第一评价值的修正值,计算公式如下:
Score_Qi=[Old_Score_Qi*(1+(Click_Dis_Qi-Click_Dis_Posi))],
其中,Score_Qi表示第i个候选查询词的第二评价值,Old_Score_Qi表示第i个候选查询词的第一评价值,Click_Dis_Qi表示i个候选查询词的点击比例,Click_Dis_Posi表示第i个位置的点击分布比例,i为自然数。
17.根据权利要求15所述的查询词推荐装置,其特征在于,所述推荐子单元具体用于,
根据所述第二评价值滤除候选查询词或对该候选查询词进行排序,并将进行滤除或排序后的候选查询词的搜索结果页进行比较,获得所述搜索结果页的商品信息的相似度;
在所述相似度超过设定阈值时滤除进行比较的候选查询词中所述第二评价值低的候选查询词,将滤除后的候选查询词推荐给用户。
18.根据权利要求17所述的查询词推荐装置,其特征在于,所述推荐子单元中的所述候选查询词的相似度是通过以下公式计算的:
Simi(Queryi,Queryj)=(AuctionIDSi∩AuctionIDSj)/(AuctionIDSi∪AuctionIDSj),
其中,Queryi表示第i个候选查询词,Queryj表示第j个查询词,Simi(Queryi,Queryi)表示所述候选查询词的相似度,AuctionIDSi表示第i个候选查询词搜索出的商品集合,AuctionIDSj表示第j个候选查询词搜索出的商品集合,AuctionIDSi∩AuctionIDSj表示两个商品集合中相同商品的数量;AuctionIDSi∪AuctionIDSj表示两个商品集合中商品数量之和。
19.根据权利要求17所述的查询词推荐装置,其特征在于,所述推荐子单元还用于,
根据所述滤除后的候选查询词所引导的商品的点击量,计算出所述滤除后的候选查询词所引导的商品对应的商品类目的点击分布比例,并根据所述商品类目的点击分布比例和所述第二评价值对所述滤除后的候选查询进行滤除或排序,将进行滤除或排序后的候选查询词推荐给用户。
20.根据权利要求19所述的查询词推荐装置,其特征在于,所述推荐子单元具体通过统计所述滤除后的候选查询词引导的商品的点击信息,计算每个候选查询词对应的商品类目点击量,及统计每个商品类目的点击量,获得候选查询词集合对应的商品类目点击分布比例。
CN201210380800.1A 2012-10-10 2012-10-10 查询词推荐方法及装置 Active CN103729351B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210380800.1A CN103729351B (zh) 2012-10-10 2012-10-10 查询词推荐方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210380800.1A CN103729351B (zh) 2012-10-10 2012-10-10 查询词推荐方法及装置

Publications (2)

Publication Number Publication Date
CN103729351A CN103729351A (zh) 2014-04-16
CN103729351B true CN103729351B (zh) 2017-10-03

Family

ID=50453429

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210380800.1A Active CN103729351B (zh) 2012-10-10 2012-10-10 查询词推荐方法及装置

Country Status (1)

Country Link
CN (1) CN103729351B (zh)

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103971170B (zh) * 2014-04-17 2017-09-29 北京百度网讯科技有限公司 一种用于对特征信息的变化进行预测的方法和装置
EP3158474A1 (en) 2014-06-18 2017-04-26 Google, Inc. Methods, systems, and media for searching for video content
CN105335391B (zh) * 2014-07-09 2019-02-15 阿里巴巴集团控股有限公司 基于搜索引擎的搜索请求的处理方法和装置
CN104298703A (zh) * 2014-07-25 2015-01-21 深圳市英威诺科技有限公司 一种根据用户行为提炼关键字并智能分发的方法
US10936632B2 (en) 2014-09-11 2021-03-02 Ebay Inc. Enhanced search query suggestions
CN105574015A (zh) * 2014-10-13 2016-05-11 阿里巴巴集团控股有限公司 搜索推荐方法和装置
CN105045901B (zh) * 2015-08-05 2019-04-30 百度在线网络技术(北京)有限公司 搜索关键词的推送方法和装置
CN105069168A (zh) * 2015-08-28 2015-11-18 百度在线网络技术(北京)有限公司 搜索词推荐方法和装置
CN106126698B (zh) * 2016-06-29 2020-01-03 武汉斗鱼网络科技有限公司 一种基于Lucence的检索推送方法及系统
CN108319603A (zh) * 2017-01-17 2018-07-24 腾讯科技(深圳)有限公司 对象推荐方法和装置
CN107066558A (zh) * 2017-03-28 2017-08-18 北京百度网讯科技有限公司 基于人工智能的引导项推荐方法及装置、设备与可读介质
CN110069753A (zh) * 2018-01-24 2019-07-30 北京京东尚科信息技术有限公司 一种生成相似度信息的方法和装置
CN108765055A (zh) * 2018-04-25 2018-11-06 太平洋电信股份有限公司 一种人工智能自学习的订单操作导引方法
CN108665007B (zh) * 2018-05-22 2020-03-17 阿里巴巴集团控股有限公司 一种基于多分类器的推荐方法、装置及电子设备
CN109255645B (zh) * 2018-07-20 2021-09-14 创新先进技术有限公司 一种消费预测方法、装置及电子设备
CN109145213B (zh) * 2018-08-22 2020-07-28 清华大学 基于历史信息的查询推荐方法及装置
CN110928537B (zh) * 2018-09-19 2023-08-11 百度在线网络技术(北京)有限公司 模型评测方法、装置、设备及计算机可读介质
CN109492082A (zh) * 2018-11-02 2019-03-19 北京字节跳动网络技术有限公司 下拉词推荐方法、装置、电子设备及存储介质
CN110046298B (zh) * 2019-04-24 2021-04-13 中国人民解放军国防科技大学 一种查询词推荐方法、装置、终端设备及计算机可读介质
CN110188262B (zh) * 2019-07-23 2019-10-29 武汉斗鱼网络科技有限公司 一种异常目标确定方法、装置、设备及介质
CN111177357B (zh) * 2019-12-31 2023-05-23 中国人民大学 一个基于记忆神经网络的对话式信息检索的方法
CN111311104B (zh) * 2020-02-27 2023-08-25 第四范式(北京)技术有限公司 一种配置文件的推荐方法、装置及系统
CN111488426B (zh) * 2020-04-17 2024-02-02 支付宝(杭州)信息技术有限公司 一种查询意图确定方法、装置及处理设备
CN113704387A (zh) * 2020-05-21 2021-11-26 北京沃东天骏信息技术有限公司 一种提供搜索联想词的方法和装置
CN114238705A (zh) * 2020-09-09 2022-03-25 北京搜狗科技发展有限公司 一种相关搜索推荐方法、装置及电子设备
JP2022059868A (ja) * 2020-10-02 2022-04-14 シャープ株式会社 画像処理システム
CN112784178A (zh) * 2021-01-18 2021-05-11 仙境文化传媒(武汉)有限公司 一种基于推荐系统的兴趣探索装置及方法
CN115858568A (zh) * 2022-07-21 2023-03-28 北京百度网讯科技有限公司 基于上下文的模型训练方法、装置、电子设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102609433A (zh) * 2011-12-16 2012-07-25 北京大学 基于用户日志进行查询推荐的方法及系统
CN102682001A (zh) * 2011-03-09 2012-09-19 阿里巴巴集团控股有限公司 一种确定推荐词的方法及设备

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7805441B2 (en) * 2006-03-06 2010-09-28 Yahoo! Inc. Vertical search expansion, disambiguation, and optimization of search queries
CN100530183C (zh) * 2006-05-19 2009-08-19 华为技术有限公司 一种收集用户数据的系统及方法
CN101650731A (zh) * 2009-08-31 2010-02-17 浙江大学 基于用户反馈的赞助搜索广告的建议关键词生成方法
CN102279851B (zh) * 2010-06-12 2017-05-03 阿里巴巴集团控股有限公司 一种智能导航方法、装置和系统
CN102542474B (zh) * 2010-12-07 2015-10-21 阿里巴巴集团控股有限公司 查询结果排序方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102682001A (zh) * 2011-03-09 2012-09-19 阿里巴巴集团控股有限公司 一种确定推荐词的方法及设备
CN102609433A (zh) * 2011-12-16 2012-07-25 北京大学 基于用户日志进行查询推荐的方法及系统

Also Published As

Publication number Publication date
CN103729351A (zh) 2014-04-16

Similar Documents

Publication Publication Date Title
CN103729351B (zh) 查询词推荐方法及装置
US10515374B2 (en) Keyword generation method and apparatus
CN103309886B (zh) 一种基于交易平台的结构化信息搜索方法和装置
CN102841946B (zh) 商品数据检索排序及商品推荐方法和系统
US20060206479A1 (en) Keyword effectiveness prediction method and apparatus
CN108920556B (zh) 基于学科知识图谱的推荐专家方法
CN103902597B (zh) 确定目标关键词所对应的搜索相关性类别的方法和设备
CN106960063A (zh) 一种针对招商引资领域的互联网情报抓取和推荐系统
US20140108190A1 (en) Recommending product information
CN113342976B (zh) 一种自动采集处理数据的方法、装置、存储介质及设备
CN106598949B (zh) 一种词语对文本贡献度的确定方法及装置
EP2465054A1 (en) Method for scoring items using one or more ontologies
WO2020233344A1 (zh) 一种搜索方法、装置及存储介质
CN111506727B (zh) 文本内容类别获取方法、装置、计算机设备和存储介质
CN107193883B (zh) 一种数据处理方法和系统
KR20210047229A (ko) 구매 우선순위와 상품 리뷰 감성분석을 반영한 상품 추천 시스템 및 방법
WO2015190485A1 (ja) 知的財産権の評価の方法、システム、および、プログラム
CN106547864A (zh) 一种基于查询扩展的个性化信息检索方法
CN108027814A (zh) 停用词识别方法与装置
CN109559029A (zh) 一种海关商品智能归类方法和装置
CN109255012A (zh) 一种机器阅读理解的实现方法以及装置
Yu et al. Tracing the main path of interdisciplinary research considering citation preference: A case from blockchain domain
CN105786810B (zh) 类目映射关系的建立方法与装置
EP1861820A2 (en) Keyword effectiveness prediction and/or keyword generation method and apparatus
CN107515904A (zh) 一种职位搜索方法和计算设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant