CN111444304A - 搜索排序的方法和装置 - Google Patents

搜索排序的方法和装置 Download PDF

Info

Publication number
CN111444304A
CN111444304A CN201910044298.9A CN201910044298A CN111444304A CN 111444304 A CN111444304 A CN 111444304A CN 201910044298 A CN201910044298 A CN 201910044298A CN 111444304 A CN111444304 A CN 111444304A
Authority
CN
China
Prior art keywords
search
product
weight value
score
products
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910044298.9A
Other languages
English (en)
Inventor
朱正义
鲍宁天
马俊
何小锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Original Assignee
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Century Trading Co Ltd, Beijing Jingdong Shangke Information Technology Co Ltd filed Critical Beijing Jingdong Century Trading Co Ltd
Priority to CN201910044298.9A priority Critical patent/CN111444304A/zh
Publication of CN111444304A publication Critical patent/CN111444304A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0623Item investigation
    • G06Q30/0625Directed, with specific intent or strategy

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种搜索排序的方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:对历史搜索词对应的产品信息进行分词处理,得到搜索关键词和索引分词,并建立搜索关键词的倒排索引表;对搜索关键词对应的产品信息进行语义分析,得到产品的类目权重值和至少一个特征权重值;基于倒排索引表获取当前搜索词对应的待选产品;根据类目权重值和特征权重值计算待选产品的排序得分,以对待选产品进行搜索排序。该实施方式能够根据语义优化搜索排序,实现热门产品的优先排序,从而提高了用户体验,进而提高了用户选购产品的选购率。

Description

搜索排序的方法和装置
技术领域
本发明涉及计算机技术领域,尤其涉及一种搜索排序的方法和装置。
背景技术
随着计算机技术的发展,电子商务已深入人们的生活,每天都会有大量的产品信息在线,所以哪些产品排在前面是一个很关键的问题。
现有的搜索排序方法:
1)将所有产品名称、类目、品牌等信息录入数据库,并将这些信息进行分词,统计分词的频次,按词频通过TF/IDF计算进行排序;
2)按运营人员的要求,对预售或者下架的产品,制定相应的排序规则,对排序结果进行干涉。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:
1.无法实现搜索词的语义识别;
2.无法按搜索词的语义识别结果对搜索结果进行排序;
3.无法做到热门产品的优先排序。
发明内容
有鉴于此,本发明实施例提供一种搜索排序的方法和装置,能够根据语义优化搜索排序,实现热门产品的优先排序,从而提高了用户体验,进而提高了用户选购产品的选购率。
为实现上述目的,根据本发明实施例的一个方面,提供了一种搜索排序的方法。
本发明实施例的一种搜索排序的方法包括:对历史搜索词对应的产品信息进行分词处理,得到搜索关键词和索引分词,并建立所述搜索关键词的倒排索引表;对所述搜索关键词对应的产品信息进行语义分析,得到产品的类目权重值和至少一个特征权重值;基于所述倒排索引表获取当前搜索词对应的待选产品;根据所述类目权重值和所述特征权重值计算所述待选产品的排序得分,以对所述待选产品进行搜索排序。
可选地,所述产品信息包括产品标题;以及对历史搜索词对应的产品信息进行分词处理,得到搜索关键词和索引分词,并建立搜索关键词的倒排索引表包括:对所述历史搜索词进行分词处理,得到搜索关键词;获取所述搜索关键词对应的产品信息;对所述搜索关键词对应的产品标题进行分词处理,得到索引分词;建立搜索关键词的倒排索引表;其中,所述倒排索引表记录有所述搜索关键词与索引记录的映射,所述索引记录是所述索引分词与产品的对应关系。
可选地,所述产品信息还包括产品类目和产品特征;以及对搜索关键词对应的产品信息进行语义分析,得到产品的类目权重值和至少一个特征权重值包括:从所述搜索关键词对应的产品信息中提取简化词;其中,简化词是描述产品特征的词语;根据所述简化词对所述搜索关键词对应的产品进行分类统计;基于以下公式计算产品的类目权重值:C=N*L*Ki/K,其中,N是类目基值,L是类目级别,Ki是该类目级别中产品的数量,K是所述搜索关键词对应的产品的数量;选取至少一个产品特征,并基于以下公式计算产品的特征权重值:Fi=F*Ki/K,其中,F是产品特征基值,Ki是该类目级别中产品的数量,K是所述搜索关键词对应的产品的数量。
可选地,基于所述倒排索引表获取当前搜索词对应的待选产品包括:对当前搜索词进行分词处理,得到至少一个当前关键词;在所述倒排索引表中检索所述当前关键词,以获取所述当前搜索词对应的待选产品。
可选地,根据所述类目权重值和所述特征权重值计算所述待选产品的排序得分包括:在所述倒排索引表中检索所述当前关键词,得到所述待选产品对应的索引分词;根据所述待选产品对应的索引分词的数量确定所述待选产品的标题索引得分;根据所述待选产品对应的当前关键词的数量确定所述待选产品的标题搜索得分;计算所述当前搜索词的词频统计得分和逆向文档频率得分;利用排序得分计算公式计算所述待选产品的排序得分;其中,所述排序得分计算公式是:
Figure BDA0001948635890000031
WI是所述标题索引得分,WS是所述标题搜索得分,C是所述类目权重值,Fi是所述特征权重值,Stf是所述词频统计得分,Sidf是所述逆向文档频率得分。
为实现上述目的,根据本发明实施例的另一方面,提供了一种搜索排序的装置。
本发明实施例的一种搜索排序的装置包括:分词模块,用于对历史搜索词对应的产品信息进行分词处理,得到搜索关键词和索引分词,并建立所述搜索关键词的倒排索引表;分析模块,用于对所述搜索关键词对应的产品信息进行语义分析,得到产品的类目权重值和至少一个特征权重值;获取模块,用于基于所述倒排索引表获取当前搜索词对应的待选产品;计算模块,用于根据所述类目权重值和所述特征权重值计算所述待选产品的排序得分,以对所述待选产品进行搜索排序。
可选地,所述产品信息包括产品标题;以及所述分词模块还用于:对所述历史搜索词进行分词处理,得到搜索关键词;获取所述搜索关键词对应的产品信息;对所述搜索关键词对应的产品标题进行分词处理,得到索引分词;建立搜索关键词的倒排索引表;其中,所述倒排索引表记录有所述搜索关键词与索引记录的映射,所述索引记录是所述索引分词与产品的对应关系。
可选地,所述产品信息还包括产品类目和产品特征;以及所述分析模块还用于:从所述搜索关键词对应的产品信息中提取简化词;其中,简化词是描述产品特征的词语;根据所述简化词对所述搜索关键词对应的产品进行分类统计;基于以下公式计算产品的类目权重值:C=N*L*Ki/K,其中,N是类目基值,L是类目级别,Ki是该类目级别中产品的数量,K是所述搜索关键词对应的产品的数量;选取至少一个产品特征,并基于以下公式计算产品的特征权重值:Fi=F*Ki/K,其中,F是产品特征基值,Ki是该类目级别中产品的数量,K是所述搜索关键词对应的产品的数量。
可选地,所述获取模块还用于:对当前搜索词进行分词处理,得到至少一个当前关键词;在所述倒排索引表中检索所述当前关键词,以获取所述当前搜索词对应的待选产品。
可选地,所述计算模块还用于:在所述倒排索引表中检索所述当前关键词,得到所述待选产品对应的索引分词;根据所述待选产品对应的索引分词的数量确定所述待选产品的标题索引得分;根据所述待选产品对应的当前关键词的数量确定所述待选产品的标题搜索得分;计算所述当前搜索词的词频统计得分和逆向文档频率得分;利用排序得分计算公式计算所述待选产品的排序得分;其中,所述排序得分计算公式是:
Figure BDA0001948635890000041
WI是所述标题索引得分,WS是所述标题搜索得分,C是所述类目权重值,Fi是所述特征权重值,Stf是所述词频统计得分,Sidf是所述逆向文档频率得分。
为实现上述目的,根据本发明实施例的又一方面,提供了一种搜索排序的电子设备。
本发明实施例的一种搜索排序的电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明实施例的一种搜索排序的方法。
为实现上述目的,根据本发明实施例的再一方面,提供了一种计算机可读存储介质。
本发明实施例的一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现本发明实施例的一种搜索排序的方法。
上述发明中的一个实施例具有如下优点或有益效果:因为采用对历史搜索词对应的产品信息进行分词处理,得到搜索关键词和索引分词,并建立搜索关键词的倒排索引表;对搜索关键词对应的产品信息进行语义分析,得到产品的类目权重值和至少一个特征权重值;基于倒排索引表获取当前搜索词对应的待选产品;根据类目权重值和特征权重值计算待选产品的排序得分,以对待选产品进行搜索排序的技术手段,所以克服了无法实现搜索词的语义识别;无法按搜索词的语义识别结果对搜索结果进行排序;以及无法做到热门产品的优先排序的技术问题,进而达到根据语义优化搜索排序,实现热门产品的优先排序,从而提高用户体验,进而提高用户选购产品的选购率的技术效果。
上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
图1是根据本发明实施例的搜索排序的方法的主要步骤的示意图;
图2是根据本发明一个可参考实施例的搜索排序的方法的实现框架的示意图;
图3是根据本发明一个可参考实施例的搜索排序的方法的主要流程的示意图;
图4是根据本发明实施例的搜索排序的方法的语义分析的示意图;
图5是根据本发明实施例的搜索排序的方法的应用示意图;
图6是根据本发明实施例的搜索排序的装置的主要模块的示意图;
图7是本发明实施例可以应用于其中的示例性系统架构图;
图8是适于用来实现本发明实施例的终端设备或服务器的计算机系统的结构示意图。
具体实施方式
以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
需要指出的是,在不冲突的情况下,本发明的实施例以及实施例中的技术特征可以相互结合。
目前,现有搜索排序方法可以按照搜索关键词相关性和频次进行实时排序,通常对于不同产品的用户的兴趣度也不同,仅按关键词的词频进行排序,无法将用户感兴趣的产品排在前面,也无法实现搜索结果的定制。为此,本发明实施例提出一种搜索排序的方法,基于对产品信息的语义分析,得到产品的类目权重值和特征权重值,根据类目权重值和特征权重值对搜索结果进行排序,实现了根据语义优化搜索排序,从而提高了用户体验,进而提高了用户选购产品的选购率。
图1是根据本发明实施例的搜索排序的方法的主要步骤的示意图。
如图1所示,本发明实施例的搜索排序的方法主要包括以下步骤:
步骤S101:对历史搜索词对应的产品信息进行分词处理,得到搜索关键词和索引分词,并建立搜索关键词的倒排索引表。
对产品信息进行分词处理,并建立倒排索引表,以便用于产品信息的索引和搜索。
需要说明的是,产品可以是实体商品、服务或论文等等。产品信息可以是产品标题、产品类目、产品特征或产品说明书等数据。
在本发明实施例中,步骤S101可以通过以下方式实现:对历史搜索词进行分词处理,得到搜索关键词;获取搜索关键词对应的产品信息;对搜索关键词对应的产品标题进行分词处理,得到索引分词;建立搜索关键词的倒排索引表。
从产品标题中得到索引分词,可以为产品信息建立准确且全面的索引数据。对历史搜索词进行分词处理是对用户曾使用过的搜索词进行切分,得到搜索关键词的组合。用搜索关键词在倒排索引表中作为键值进行查找,能够快速准确地找到对应的产品和产品信息。倒排索引是一个搜索中的术语,表示一条倒排索引记录,用来描述搜索词和索引记录之间的关系;倒排是搜索中的一种基础数据结构。本发明实施例的倒排索引表记录有搜索关键词与索引记录的映射,索引记录是索引分词与产品的对应关系。
步骤S102:对搜索关键词对应的产品信息进行语义分析,得到产品的类目权重值和至少一个特征权重值。
语义分析能够为优化搜索排序提供语义依据。类目权重值用于体现产品自身在用户选购过程中所占权重,特征权重值用于体现每个产品特征在用户选购过程中所占权重。通过类目权重值和特征权重值能够用户对某个产品自身或某个产品特征的感兴趣程度,即分析用户为何选购某个产品。产品特征可以是名称、品牌、销量、颜色、材质或口味等。
在本发明实施例中,步骤S102可以通过以下方式实现:从搜索关键词对应的产品信息中提取简化词;根据简化词对搜索关键词对应的产品进行分类统计;基于以下公式计算产品的类目权重值:C=N*L*Ki/K,其中,N是类目级别的基值,L是类目级别,Ki是该类目级别中产品的数量,K是搜索关键词对应的产品的数量;选取至少一个产品特征,并基于以下公式计算产品的特征权重值:Fi=F*Ki/K,其中,F是该产品特征的基值,Ki是该类目级别中产品的数量,K是搜索关键词对应的产品的数量。
需要说明的是,简化词是描述产品特征的词语,通过对产品信息的提炼而产生的词语,一般是由业务人员标注得到的,也可以使用算法生成,在实际应用中简化词可以细分为一级简化词和二级简化词等多个级别。此外,一个产品可以同时具的多个产品特征,可以分别计算每个产品特征对应的特征权重值。类目基值和每个产品特征基值是根据测试来估计得来的,且每个类目级别的类目基值都是相同的,而每个产品特征的产品特征基值则可以不同。
步骤S103:基于倒排索引表获取当前搜索词对应的待选产品。
通常用户搜索产品时,使用搜索词进行搜索,可以基于倒排索引表查找用户输入的搜索词(即当前搜索词)对应的待选产品。
在本发明实施例中,步骤S103可以通过以下方式实现:对当前搜索词进行分词处理,得到至少一个当前关键词;在倒排索引表中检索当前关键词,以获取当前搜索词对应的待选产品。
查找当前搜索词对应的待选产品时,可以先对当前搜索词进行分词,得到当前关键词的组合,再从倒排索引表中分别检索当前关键词对应的待选产品,从而获取到当前搜索词对应的所有待选产品。
步骤S104:根据类目权重值和特征权重值计算待选产品的排序得分,以对待选产品进行搜索排序。
由于类目权重值和特征权重值能够用户对某个产品自身或某个产品特征的感兴趣程度,因此,根据类目权重值和特征权重值计算出的待选产品的排序得分,充分考虑到了用户的喜好。
对于待选产品的排序得分的计算,可以考虑各方面的因素,例如产品标题、词频和逆向文档频率等。
在本发明实施例中,步骤S104可以通过以下方式实现:在倒排索引表中检索当前关键词,得到待选产品对应的索引分词;根据待选产品对应的索引分词的数量确定待选产品的标题索引得分;根据待选产品对应的当前关键词的数量确定待选产品的标题搜索得分;计算当前搜索词的词频统计得分和逆向文档频率得分;利用排序得分计算公式计算待选产品的排序得分。
需要说明的是,排序得分是以产品信息语义模型作为基础,综合考虑名称、标题、类目、品牌、词频等因素,计算各种因素所占的权重,并利用排序打分计算公式得到待选产品的排序得分。其中,排序得分计算公式是:
Figure BDA0001948635890000091
WI是标题索引得分,WS是标题搜索得分,C是类目权重值,Fi是特征权重值,Stf是词频统计得分,Sidf是逆向文档频率得分。对于产品标题的权重由标题索引得分和标题搜索得分组成,可兼顾产品标题由当前关键词组成和完全不包含当前关键词两种极端的情况。词频用于表示当前搜索词在产品信息中出现的频度,频度越高,该产品信息对应的待选产品的词频统计得分越高,词频统计得分可以用当前搜索词在一个产品信息中出现的次数除以该产品信息中所有词的数量得到。逆向文档频率用于表示当前搜索词在所有产品信息中出现的频率,频率越高,该索引分词对应的待选产品的逆向文档频率得分越低,逆向文档频率得分可以用以下公式得到:
Figure BDA0001948635890000101
numdocs是所有产品信息的数量,docfreq是包含当前搜索词的产品信息的数量。需要注意的是,词频统计得分和逆向文档频率得分的计算还可以采用其它方式,词频统计得分和逆向文档频率得分的计算方式属于基本算法,此处不予赘述。
根据本发明实施例的搜索排序的方法可以看出,因为采用对历史搜索词对应的产品信息进行分词处理,得到搜索关键词和索引分词,并建立搜索关键词的倒排索引表;对搜索关键词对应的产品信息进行语义分析,得到产品的类目权重值和至少一个特征权重值;基于倒排索引表获取当前搜索词对应的待选产品;根据类目权重值和特征权重值计算待选产品的排序得分,以对待选产品进行搜索排序的技术手段,所以克服了无法实现搜索词的语义识别;无法按搜索词的语义识别结果对搜索结果进行排序;以及无法做到热门产品的优先排序的技术问题,进而达到根据语义优化搜索排序,实现热门产品的优先排序,从而提高用户体验,进而提高用户选购产品的选购率的技术效果。
图2是根据本发明一个可参考实施例的搜索排序的方法的实现框架的示意图。
如图2所示,本发明实施例的搜索排序的方法主要基于以下几部分实现:
一、产品信息库:是存储所有产品的产品信息的数据库,可以由运营人员将产品信息录入和更新操作。产品信息的录入和更新被实时同步到产品信息语义分析器和分词模块,分别进行产品信息的语义模型构建和产品信息ES集群的写入,产品信息ES集群是用来存储产品搜索信息的索引数据库。
二、产品信息语义分析器:其主要通过输入产品信息和对应的搜索关键词来训练生成搜索关键词的产品信息语义模型,为搜索排序优化算法提供语义依据。
三、搜索关键词语义模型:产品信息语义分析器所分析的数据经过汇总,可以生成搜索关键词的产品信息语义模型。
四、产品信息分词器:产品信息分词器主要用于对产品信息和历史搜索词进行分词处理,以便用于产品信息的索引和搜索;主要包含索引分词器和搜索分词器两种:
1、索引分词器(INDEX)
在将产品信息同步到ES集群数据库中时,要对产品信息中的产品标题进行分词处理,并建立搜索关键词的倒排索引表,倒排索引表能够描述搜索关键词与索引分词和产品之间的关系。索引分词的词典文件由通用词典、普通物品词典、简化词词典、产品品牌词典、口味词典综合而成。索引分词是将这些词典的分词所有结果的并集,其分词词元同时包含叠加词元。这样可为产品信息建立起准确、全面的索引数据。词典文件具体表示的是搜索词的不同类别,用以将搜索语句切分成有意义的搜索词。例如,“鲜活波士顿龙虾”,可以得到以下索引分词:鲜、鲜活、波士、波士顿、士、龙、龙虾、虾、波士顿龙虾;其中,鲜,可能在口味词典中,就能被识别成一个口味词;龙虾,可能会在简化词词典中,就会将龙虾识别出来为一个简化词,波士顿在产品品牌词典中,就会被识别为一个产品品牌词;
2、搜索分词器(SEARCH)
搜索分词用于对用户输入的搜索词进行分词处理,将搜索词切分为搜索关键词的组合。若用搜索关键词作为键值在搜索数据库的倒排索引中进行查找,则可以得到搜索关键词对应的待选产品。搜索分词的词典文件和索引分词词典文件一样,但其分词词元只取最大的词元,返回分词最匹配的词典的分词结果,各词元之间没有交集。搜索分词可以得到搜索词的精确的词元信息,从而准确的反应用户的真实搜索意图。
搜索分词的词典文件和索引分词的词典文件一样,只是搜索分词是在搜索是对输入的词句进行分词,索引分词是在对被搜索的资料进入索引数据库建立索引时用的。搜索分词的粒度比索引分词要粗,分词不要重叠,主要用于反应用户的搜索意图。例如,鲜活波士顿龙虾”,可以得到以下搜索分词:鲜活、波士顿龙虾。
五、产品信息ES集群:产品信息ES集群是用来存储产品搜索信息的索引数据库。产品信息的索引字段主要由产品标题、产品类目、产品品牌或产品口味等多个字段联合组成。索引字段是搜索引擎数据库的存储单元,搜索引擎会使用索引分词的词典文件对索引字段进行分词,从而生成倒排索引,即对索引字段使用索引分词器进行切分并生成倒排索引进行存储。
六、搜索排序:在用户使用关键词进行搜索时,使用搜索分词器对用户输入的当前搜索词进行分词,得到当前关键词的组合,再通过当前关键词在倒排索引表中进行检索,得到检索结果(即每个当前关键词对应的待选产品),从而获取到当前搜索词对应的所有待选产品,并对每个检索结果进行排序打分(即计算每个待选产品的排序得分以及每个搜索关键词对应的待选产品的排序),最后综合各个检索结果的排序打分对当前搜索词对应的所有待选产品进行排序,输出搜索结果。
可以采用以下公式计算每个待选产品的排序得分:
Figure BDA0001948635890000121
WI是标题索引得分,WS是标题搜索得分,C是类目权重值,Fi是特征权重值,Stf是词频统计得分,Sidf是逆向文档频率得分。其中,产品标题的权重通过标题索引得分和标题搜索得分共同体现,标题索引得分可以基于INDEX确定,即根据对产品标题进行分词处理后得到索引分词的数量确定,标题搜索得分可以基于SEARCH确定,即根据产品标题包含当前关键词的数量确定。
以用户输入的某个当前搜索词包括五个当前关键词(关键词A、关键词B、关键词C、关键词D、关键词E)为例,假设基于倒排索引表检索到关键词A、关键词B、关键词C、关键词D、关键词E分别对应10、50、40、50、10个产品,其中100个产品的产品信息中出现了当前搜索词;某一个待选产品的产品标题中同时包括了二个索引分词和三个当前关键词(关键词B、关键词C、关键词D);且待选产品的产品信息总计有100个词,当前搜索词在该待选产品的产品信息中分别出现了5次。在计算该待选产品的排序得分时,先计算该当前搜索词的词频统计得分为5/100=0.05、逆向文档频率得分为
Figure BDA0001948635890000131
同时根据检索结果确定该待选产品的标题索引得分为2、标题搜索得分为3;以及分别根据关键词B、关键词C、关键词D的检索结果,计算三次该待选产品的类目权重值(假设分别为0.2、0.2、0.1)、特征权重值(假设选取两个特征,分别为0.1和0.2、0.2和0.2、0.3和0.1);再基于以上信息计算该待选产品的排序得分:
Figure BDA0001948635890000132
需要说明的是,标题索引得分和标题搜索得分反应了产品标题在搜索结果中的权重,二者的值越大,则搜索结果中标题匹配度越高的结果的排名越靠前。而通过标题索引得分和标题搜索得分共同计算产品标题的权重,可兼顾产品标题由当前关键词组成和完全不包含当前关键词两种极端的情况,平衡不同关键词对产品标题权重的影响。此外,在实际应用和实验调试中,当标题索引得分取4和标题搜索得分取5时,用户体验最好。
图3是根据本发明另一个可参考实施例的搜索排序的方法的主要流程的示意图。
如图3所示,可以采用以下流程实施本发明实施例的搜索排序的方法:
步骤S301:对历史数据进行处理分析,即对历史搜索词进行分词处理,得到搜索关键词;
步骤S302:获取搜索关键词对应的产品信息;
步骤S303:对搜索关键词对应的产品标题进行分词处理,得到索引分词,并建立搜索关键词的倒排索引表;
步骤S304:对搜索关键词对应的产品信息进行语义分析,得到产品的类目权重值和至少一个特征权重值;
步骤S305:对当前搜索词进行分词处理,得到至少一个当前关键词;
步骤S306:在倒排索引表中检索当前关键词,以获取当前搜索词对应的待选产品;
步骤S307:在倒排索引表中检索当前关键词,得到当前搜索词对应的待选产品以及待选产品对应的索引分词;
步骤S308:根据待选产品对应的索引分词的数量确定待选产品的标题索引得分、根据待选产品对应的当前关键词的数量确定待选产品的标题搜索得分、以及计算当前搜索词的词频统计得分和逆向文档频率得分;
步骤S309:利用排序得分计算公式计算待选产品的排序得分;
步骤S310:基于待选产品的排序得分确定待选产品的排序,以输出搜索结果。
其中,步骤S301-步骤S303的实现过程与步骤S101相同,步骤S304的实现过程与步骤S102相同,步骤S304-步骤S306的实现过程与步骤S103相同,以及步骤S307-步骤S310的实现过程与步骤S104相同,此处不予赘述。
图4是根据本发明实施例的搜索排序的方法的语义分析的示意图。
如图4所示,产品信息语义分析器由类目分析器和其他特征分析器等几个子的分析器构成。以类目分析器、品牌分析器和口味分析器构成产品信息语义分析器为例,几个子的分析器的训练过程如下:
一、类目分析器
类目分析器是语义分析器的最主要分析器,其主要是通过对产品信息经过分析统计得到搜索关键词的产品多级分类模型,其主要步骤如下:
扩展、统计所有产品的一级简化词、二级简化词属性,得到所有产品的简化词表;简化词是通过对产品信息的提炼而产生的特征词语,一般是由业务人员标注得到的,也可以使用算法生成;
依次遍历简化词,可以按产品类目级别从低到高对产品进行分组计数统计;类目划分可以按照业务的要求来定义的;
将每个类目的分组计数进行排序,可以记录最高或前M高的简化词类目;
按类目级别设置该类目的打分系数,类目级别越低的打分系数越高,类目级别越高的打分系数越低,则类目权重值的计算公式为:C=N*L*Ki/K(N:类目基值,L:类目级别,Ki:该类目产品计数,K:总产品计数);基值是根据测试来估计得来的;类目产品计数是该简化词所在类目的产品总数;总产品计数是所有产品的总数量;本方案的数据是来自所有产品的数据,和用户没有直接的关系。
假设某个产品所属类目可以划分为四级,其中,一级类目最高、四级最低,产品的类目级别是二级,类目基值取1.1,该类目产品计数为52,总产品计数600,则该产品的类目权重值为:1.1*2*52/600=0.190666666≈0.191。
二、品牌分析器
品牌分析器用于统计产品的品牌信息,从而建立搜索关键词的产品品牌列表模型。其主要构建步骤如下:
遍历产品信息库,将产品品牌属性加入到产品品牌列表集合中,得到产品品牌数据列表;
遍历产品信息库,按品牌对简化词进行分组统计,可以记录最高或前M高的品牌信息,每个品牌的排序分打分系数为B*Ki/K(B:品牌排序打分基数,Ki:该品牌产品计数,K:总产品计数)。
假设选取品牌来计算某个产品的特征权重值,品牌基值取1.2,该品牌产品计数为12,总产品计数100,则该产品的类目权重值为:1.2*12/100=0.144。
三、口味分析器
口味分析器用于统计产品的口味信息,从而建立搜索关键词的口味数据模型。构建步骤如下:
遍历产品信息库,将口味属性加入到一个口味列表集合中,得到产品口味数据列表;
遍历产品信息库,按口味对简化词进行分组统计,可以记录最高或前M高的口味信息,每个口味的排序分打分系数为E*Ki/K(E:口味排序打分基数,Ki:该口味产品计数,K:总产品计数)。
假设选取口味来计算某个产品的特征权重值,口味基值取11.11,该口味产品计数为618,总产品计数1000,则该产品的类目权重值为:11.11*618/1000=6.86598≈6.866。
此外,产品信息语义分析器分析的数据经过汇总,可以生成搜索关键词的产品信息语义模型。产品信息语义模型可以采用Json格式文件存储,该产品信息语义模型的结构示例如下:
Figure BDA0001948635890000161
Figure BDA0001948635890000171
为了进一步阐述本发明的技术思想,现结合具体的应用场景,对本发明实施例的技术方案进行说明。
如图5所示,以商品为例,可以预先利用索引分词器对商品信息数据(即产品信息)进行分词处理,得到搜索关键词和索引分词,并建立搜索关键词的倒排索引表。在用户利用搜索词进行搜索时,利用搜索分词器对当前搜索词进行分词处理,得到当前关键词组,在倒排索引表中检索当前关键词,获取各个当前关键词的搜索结果,并对每个当前关键词的搜索结果进行排序打分,输出排序结果。
图6是根据本发明实施例的搜索排序的装置的主要模块的示意图。
如图6所示,本发明实施例的搜索排序的装置600包括:分词模块601、分析模块602、获取模块603和计算模块604。
其中,
分词模块601,用于对历史搜索词对应的产品信息进行分词处理,得到搜索关键词和索引分词,并建立所述搜索关键词的倒排索引表;
分析模块602,用于对所述搜索关键词对应的产品信息进行语义分析,得到产品的类目权重值和至少一个特征权重值;
获取模块603,用于基于所述倒排索引表获取当前搜索词对应的待选产品;
计算模块604,用于根据所述类目权重值和所述特征权重值计算所述待选产品的排序得分,以对所述待选产品进行搜索排序。
在本发明实施例中,所述分词模块601还用于:对所述历史搜索词进行分词处理,得到搜索关键词;获取所述搜索关键词对应的产品信息;其中,所述产品信息包括产品标题;对所述搜索关键词对应的产品标题进行分词处理,得到索引分词;建立搜索关键词的倒排索引表;其中,所述倒排索引表记录有所述搜索关键词与索引记录的映射,所述索引记录是所述索引分词与产品的对应关系。
此外,所述产品信息还包括产品类目和产品特征;以及所述分析模块602还用于:从所述搜索关键词对应的产品信息中提取简化词;其中,简化词是描述产品特征的词语;根据所述简化词对所述搜索关键词对应的产品进行分类统计;基于以下公式计算产品的类目权重值:C=N*L*Ki/K,其中,N是类目基值,L是类目级别,Ki是该类目级别中产品的数量,K是所述搜索关键词对应的产品的数量;选取至少一个产品特征,并基于以下公式计算产品的特征权重值:Fi=F*Ki/K,其中,F是产品特征基值,Ki是该类目级别中产品的数量,K是所述搜索关键词对应的产品的数量。
在本发明实施例中,所述获取模块603还用于:对当前搜索词进行分词处理,得到至少一个当前关键词;在所述倒排索引表中检索所述当前关键词,以获取所述当前搜索词对应的待选产品。
在本发明实施例中,所述计算模块604还用于:在所述倒排索引表中检索所述当前关键词,得到所述待选产品对应的索引分词;根据所述待选产品对应的索引分词的数量确定所述待选产品的标题索引得分;根据所述待选产品对应的当前关键词的数量确定所述待选产品的标题搜索得分;计算所述当前关键词的词频统计得分和逆向文档频率得分;利用排序得分计算公式计算所述待选产品的排序得分;其中,所述排序得分计算公式是:
Figure BDA0001948635890000191
WI是所述标题索引得分,WS是所述标题搜索得分,C是所述类目权重值,Fi是所述特征权重值,Stf是所述词频统计得分,Sidf是所述逆向文档频率得分。
根据本发明实施例的搜索排序的装置可以看出,因为采用对历史搜索词对应的产品信息进行分词处理,得到搜索关键词和索引分词,并建立搜索关键词的倒排索引表;对搜索关键词对应的产品信息进行语义分析,得到产品的类目权重值和至少一个特征权重值;基于倒排索引表获取当前搜索词对应的待选产品;根据类目权重值和特征权重值计算待选产品的排序得分,以对待选产品进行搜索排序的技术手段,所以克服了无法实现搜索词的语义识别;无法按搜索词的语义识别结果对搜索结果进行排序;以及无法做到热门产品的优先排序的技术问题,进而达到根据语义优化搜索排序,实现热门产品的优先排序,从而提高用户体验,进而提高用户选购产品的选购率的技术效果。
图7示出了可以应用本发明实施例的搜索排序的方法或搜索排序的装置的示例性系统架构700。
如图7所示,系统架构700可以包括终端设备701、702、703,网络704和服务器705。网络704用以在终端设备701、702、703和服务器705之间提供通信链路的介质。网络704可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备701、702、703通过网络704与服务器705交互,以接收或发送消息等。终端设备701、702、703上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
终端设备701、702、703可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器705可以是提供各种服务的服务器,例如对用户利用终端设备701、702、703所浏览的购物类网站提供支持的后台管理服务器。后台管理服务器可以对接收到的产品信息查询请求等数据进行分析等处理,并将处理结果(例如目标推送信息、产品信息)反馈给终端设备。
需要说明的是,本发明实施例所提供的搜索排序的方法一般由服务器705执行,相应地,搜索排序的装置一般设置于服务器705中。
应该理解,图7中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
下面参考图8,其示出了适于用来实现本发明实施例的终端设备的计算机系统800的结构示意图。图8示出的终端设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图8所示,计算机系统800包括中央处理单元(CPU)801,其可以根据存储在只读存储器(ROM)802中的程序或者从存储部分808加载到随机访问存储器(RAM)803中的程序而执行各种适当的动作和处理。在RAM 803中,还存储有系统800操作所需的各种程序和数据。CPU 801、ROM 802以及RAM 803通过总线804彼此相连。输入/输出(I/O)接口805也连接至总线804。
以下部件连接至I/O接口805:包括键盘、鼠标等的输入部分806;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分807;包括硬盘等的存储部分808;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分809。通信部分809经由诸如因特网的网络执行通信处理。驱动器810也根据需要连接至I/O接口805。可拆卸介质811,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器810上,以便于从其上读出的计算机程序根据需要被安装入存储部分808。
特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分809从网络上被下载和安装,和/或从可拆卸介质811被安装。在该计算机程序被中央处理单元(CPU)801执行时,执行本发明的系统中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括分词模块、分析模块、获取模块和计算模块。其中,这些模块的名称在某种情况下并不构成对该模块本身的限定,例如,获取模块还可以被描述为“基于所述倒排索引表获取当前搜索词对应的待选产品的模块”。
作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括:步骤S101:对历史搜索词对应的产品信息进行分词处理,得到搜索关键词和索引分词,并建立搜索关键词的倒排索引表;步骤S102:对搜索关键词对应的产品信息进行语义分析,得到产品的类目权重值和至少一个特征权重值;步骤S103:基于倒排索引表获取当前搜索词对应的待选产品;步骤S104:根据类目权重值和特征权重值计算待选产品的排序得分,以对待选产品进行搜索排序。
根据本发明实施例的技术方案,因为采用对历史搜索词对应的产品信息进行分词处理,得到搜索关键词和索引分词,并建立搜索关键词的倒排索引表;对搜索关键词对应的产品信息进行语义分析,得到产品的类目权重值和至少一个特征权重值;基于倒排索引表获取当前搜索词对应的待选产品;根据类目权重值和特征权重值计算待选产品的排序得分,以对待选产品进行搜索排序的技术手段,所以克服了无法实现搜索词的语义识别;无法按搜索词的语义识别结果对搜索结果进行排序;以及无法做到热门产品的优先排序的技术问题,进而达到根据语义优化搜索排序,实现热门产品的优先排序,从而提高用户体验,进而提高用户选购产品的选购率的技术效果。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

Claims (12)

1.一种搜索排序的方法,其特征在于,包括:
对历史搜索词对应的产品信息进行分词处理,得到搜索关键词和索引分词,并建立所述搜索关键词的倒排索引表;
对所述搜索关键词对应的产品信息进行语义分析,得到产品的类目权重值和至少一个特征权重值;
基于所述倒排索引表获取当前搜索词对应的待选产品;
根据所述类目权重值和所述特征权重值计算所述待选产品的排序得分,以对所述待选产品进行搜索排序。
2.根据权利要求1所述的方法,其特征在于,所述产品信息包括产品标题;以及
对历史搜索词对应的产品信息进行分词处理,得到搜索关键词和索引分词,并建立搜索关键词的倒排索引表包括:
对所述历史搜索词进行分词处理,得到搜索关键词;
获取所述搜索关键词对应的产品信息;
对所述搜索关键词对应的产品标题进行分词处理,得到索引分词;
建立搜索关键词的倒排索引表;其中,所述倒排索引表记录有所述搜索关键词与索引记录的映射,所述索引记录是所述索引分词与产品的对应关系。
3.根据权利要求2所述的方法,其特征在于,所述产品信息还包括产品类目和产品特征;以及
对搜索关键词对应的产品信息进行语义分析,得到产品的类目权重值和至少一个特征权重值包括:
从所述搜索关键词对应的产品信息中提取简化词;其中,简化词是描述产品特征的词语;
根据所述简化词对所述搜索关键词对应的产品进行分类统计;
基于以下公式计算产品的类目权重值:
C=N*L*Ki/K,其中,N是类目基值,L是类目级别,Ki是该类目级别中产品的数量,K是所述搜索关键词对应的产品的数量;
选取至少一个产品特征,并基于以下公式计算产品的特征权重值:
Fi=F*Ki/K,其中,F是产品特征基值,Ki是该类目级别中产品的数量,K是所述搜索关键词对应的产品的数量。
4.根据权利要求2所述的方法,其特征在于,基于所述倒排索引表获取当前搜索词对应的待选产品包括:
对当前搜索词进行分词处理,得到至少一个当前关键词;
在所述倒排索引表中检索所述当前关键词,以获取所述当前搜索词对应的待选产品。
5.根据权利要求4所述的方法,其特征在于,根据所述类目权重值和所述特征权重值计算所述待选产品的排序得分包括:
在所述倒排索引表中检索所述当前关键词,得到所述待选产品对应的索引分词;
根据所述待选产品对应的索引分词的数量确定所述待选产品的标题索引得分;
根据所述待选产品对应的当前关键词的数量确定所述待选产品的标题搜索得分;
计算所述当前搜索词的词频统计得分和逆向文档频率得分;
利用排序得分计算公式计算所述待选产品的排序得分;其中,所述排序得分计算公式是:
Figure FDA0001948635880000021
WI是所述标题索引得分,WS是所述标题搜索得分,C是所述类目权重值,Fi是所述特征权重值,Stf是所述词频统计得分,Sidf是所述逆向文档频率得分。
6.一种搜索排序的装置,其特征在于,包括:
分词模块,用于对历史搜索词对应的产品信息进行分词处理,得到搜索关键词和索引分词,并建立所述搜索关键词的倒排索引表;
分析模块,用于对所述搜索关键词对应的产品信息进行语义分析,得到产品的类目权重值和至少一个特征权重值;
获取模块,用于基于所述倒排索引表获取当前搜索词对应的待选产品;
计算模块,用于根据所述类目权重值和所述特征权重值计算所述待选产品的排序得分,以对所述待选产品进行搜索排序。
7.根据权利要求6所述的装置,其特征在于,所述产品信息包括产品标题;以及
所述分词模块还用于:
对所述历史搜索词进行分词处理,得到搜索关键词;
获取所述搜索关键词对应的产品信息;
对所述搜索关键词对应的产品标题进行分词处理,得到索引分词;
建立搜索关键词的倒排索引表;其中,所述倒排索引表记录有所述搜索关键词与索引记录的映射,所述索引记录是所述索引分词与产品的对应关系。
8.根据权利要求7所述的装置,其特征在于,所述产品信息还包括产品类目和产品特征;以及
所述分析模块还用于:
从所述搜索关键词对应的产品信息中提取简化词;其中,简化词是描述产品特征的词语;
根据所述简化词对所述搜索关键词对应的产品进行分类统计;
基于以下公式计算产品的类目权重值:
C=N*L*Ki/K,其中,N是类目基值,L是类目级别,Ki是该类目级别中产品的数量,K是所述搜索关键词对应的产品的数量;
选取至少一个产品特征,并基于以下公式计算产品的特征权重值:
Fi=F*Ki/K,其中,F是产品特征基值,Ki是该类目级别中产品的数量,K是所述搜索关键词对应的产品的数量。
9.根据权利要求7所述的装置,其特征在于,所述获取模块还用于:
对当前搜索词进行分词处理,得到至少一个当前关键词;
在所述倒排索引表中检索所述当前关键词,以获取所述当前搜索词对应的待选产品。
10.根据权利要求9所述的装置,其特征在于,所述计算模块还用于:
在所述倒排索引表中检索所述当前关键词,得到所述待选产品对应的索引分词;
根据所述待选产品对应的索引分词的数量确定所述待选产品的标题索引得分;
根据所述待选产品对应的当前关键词的数量确定所述待选产品的标题搜索得分;
计算所述当前搜索词的词频统计得分和逆向文档频率得分;
利用排序得分计算公式计算所述待选产品的排序得分;其中,所述排序得分计算公式是:
Figure FDA0001948635880000041
WI是所述标题索引得分,WS是所述标题搜索得分,C是所述类目权重值,Fi是所述特征权重值,Stf是所述词频统计得分,Sidf是所述逆向文档频率得分。
11.一种搜索排序的电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-5中任一所述的方法。
12.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-5中任一所述的方法。
CN201910044298.9A 2019-01-17 2019-01-17 搜索排序的方法和装置 Pending CN111444304A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910044298.9A CN111444304A (zh) 2019-01-17 2019-01-17 搜索排序的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910044298.9A CN111444304A (zh) 2019-01-17 2019-01-17 搜索排序的方法和装置

Publications (1)

Publication Number Publication Date
CN111444304A true CN111444304A (zh) 2020-07-24

Family

ID=71652300

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910044298.9A Pending CN111444304A (zh) 2019-01-17 2019-01-17 搜索排序的方法和装置

Country Status (1)

Country Link
CN (1) CN111444304A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112989190A (zh) * 2021-03-09 2021-06-18 北京百度网讯科技有限公司 一种商品挂载方法、装置、电子设备和存储介质
CN113076322A (zh) * 2021-04-20 2021-07-06 深圳华南城网科技有限公司 一种商品搜索处理方法及装置
CN113127662A (zh) * 2021-04-13 2021-07-16 广联达科技股份有限公司 构件搜索方法、装置、电子设备及可读存储介质
CN113139849A (zh) * 2021-04-26 2021-07-20 北京沃东天骏信息技术有限公司 一种商品搜索方法和装置
CN113468393A (zh) * 2021-06-09 2021-10-01 北京达佳互联信息技术有限公司 索引生成方法、装置、电子设备及存储介质
CN113536118A (zh) * 2021-06-29 2021-10-22 未鲲(上海)科技服务有限公司 搜索默认词的配置方法、装置、计算机设备及存储介质
CN114154046A (zh) * 2022-02-07 2022-03-08 深圳华强电子交易网络有限公司 一种网站搜索排名方法及系统
CN116738035A (zh) * 2023-02-02 2023-09-12 量子数科科技有限公司 一种基于窗口滑动的推荐重排方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102982153A (zh) * 2012-11-29 2013-03-20 北京亿赞普网络技术有限公司 一种信息检索方法及其装置
US20130282703A1 (en) * 2012-04-19 2013-10-24 Sap Ag Semantically Enriched Search of Services
CN105653737A (zh) * 2016-03-01 2016-06-08 广州神马移动信息科技有限公司 用于内容文档排序的方法、设备和电子设备
CN107870984A (zh) * 2017-10-11 2018-04-03 北京京东尚科信息技术有限公司 识别搜索词的意图的方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130282703A1 (en) * 2012-04-19 2013-10-24 Sap Ag Semantically Enriched Search of Services
CN102982153A (zh) * 2012-11-29 2013-03-20 北京亿赞普网络技术有限公司 一种信息检索方法及其装置
CN105653737A (zh) * 2016-03-01 2016-06-08 广州神马移动信息科技有限公司 用于内容文档排序的方法、设备和电子设备
CN107870984A (zh) * 2017-10-11 2018-04-03 北京京东尚科信息技术有限公司 识别搜索词的意图的方法和装置

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112989190A (zh) * 2021-03-09 2021-06-18 北京百度网讯科技有限公司 一种商品挂载方法、装置、电子设备和存储介质
CN112989190B (zh) * 2021-03-09 2024-03-01 北京百度网讯科技有限公司 一种商品挂载方法、装置、电子设备和存储介质
CN113127662A (zh) * 2021-04-13 2021-07-16 广联达科技股份有限公司 构件搜索方法、装置、电子设备及可读存储介质
CN113076322A (zh) * 2021-04-20 2021-07-06 深圳华南城网科技有限公司 一种商品搜索处理方法及装置
CN113139849A (zh) * 2021-04-26 2021-07-20 北京沃东天骏信息技术有限公司 一种商品搜索方法和装置
CN113468393A (zh) * 2021-06-09 2021-10-01 北京达佳互联信息技术有限公司 索引生成方法、装置、电子设备及存储介质
CN113536118A (zh) * 2021-06-29 2021-10-22 未鲲(上海)科技服务有限公司 搜索默认词的配置方法、装置、计算机设备及存储介质
CN114154046A (zh) * 2022-02-07 2022-03-08 深圳华强电子交易网络有限公司 一种网站搜索排名方法及系统
CN114154046B (zh) * 2022-02-07 2022-08-12 深圳华强电子交易网络有限公司 一种网站搜索排名方法及系统
CN116738035A (zh) * 2023-02-02 2023-09-12 量子数科科技有限公司 一种基于窗口滑动的推荐重排方法
CN116738035B (zh) * 2023-02-02 2024-05-28 量子数科科技有限公司 一种基于窗口滑动的推荐重排方法

Similar Documents

Publication Publication Date Title
CN111444304A (zh) 搜索排序的方法和装置
CN105224699B (zh) 一种新闻推荐方法及装置
US9418144B2 (en) Similar document detection and electronic discovery
CN110569496B (zh) 实体链接方法、装置及存储介质
CN108885624B (zh) 信息推荐系统及方法
WO2017097231A1 (zh) 话题处理方法及装置
US20130060769A1 (en) System and method for identifying social media interactions
CN107832338B (zh) 一种识别核心产品词的方法和系统
US20230147941A1 (en) Method, apparatus and device used to search for content
CN110347908B (zh) 语音购物方法、装置、介质及电子设备
CN110766486A (zh) 确定物品类目的方法和装置
US20180089193A1 (en) Category-based data analysis system for processing stored data-units and calculating their relevance to a subject domain with exemplary precision, and a computer-implemented method for identifying from a broad range of data sources, social entities that perform the function of Social Influencers
CN111538903B (zh) 搜索推荐词确定方法、装置、电子设备及计算机可读介质
CN116109373A (zh) 金融产品的推荐方法、装置、电子设备和介质
CN110795613A (zh) 商品搜索方法、装置、系统及电子设备
CN116010552A (zh) 一种基于关键词词库的工程造价数据解析系统及其方法
Wei et al. Online education recommendation model based on user behavior data analysis
CN113821718A (zh) 一种物品信息推送方法和装置
CN111625619B (zh) 查询省略方法、装置、计算机可读介质及电子设备
CN111144122A (zh) 评价处理方法、装置和计算机系统及介质
CN111368036B (zh) 用于搜索信息的方法和装置
Dave et al. Identifying big data dimensions and structure
CN114511382A (zh) 推荐信息的方法、装置、设备和计算机可读介质
CN114491232A (zh) 信息查询方法、装置、电子设备和存储介质
CN113763084A (zh) 产品推荐的处理方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination