CN110807138B - 一种搜索对象类别的确定方法及装置 - Google Patents

一种搜索对象类别的确定方法及装置 Download PDF

Info

Publication number
CN110807138B
CN110807138B CN201910854133.8A CN201910854133A CN110807138B CN 110807138 B CN110807138 B CN 110807138B CN 201910854133 A CN201910854133 A CN 201910854133A CN 110807138 B CN110807138 B CN 110807138B
Authority
CN
China
Prior art keywords
search
candidate object
category
search keyword
categories
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910854133.8A
Other languages
English (en)
Other versions
CN110807138A (zh
Inventor
张宾
武斌
周晶
尹硕
李慧超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Digital Technology Holdings Co ltd
State Grid E Commerce Technology Co Ltd
Original Assignee
Yingda Business Services Ltd
State Grid E Commerce Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yingda Business Services Ltd, State Grid E Commerce Co Ltd filed Critical Yingda Business Services Ltd
Priority to CN201910854133.8A priority Critical patent/CN110807138B/zh
Publication of CN110807138A publication Critical patent/CN110807138A/zh
Application granted granted Critical
Publication of CN110807138B publication Critical patent/CN110807138B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results

Abstract

本申请提供一种搜索对象类别的确定方法及装置,涉及电子商务技术领域,可以从与搜索关键词关联的多个候选对象类别中确定至少一个搜索对象类别。该方法包括:根据搜索关键词确定与所述搜索关键词关联的多个候选对象类别;通过关联度计算模型分别确定所述搜索关键词与所述多个候选对象类别中每个候选对象类别的关联度;根据所述每个候选对象类别的关联度,对所述多个候选对象类别进行排序;根据所述多个候选对象类别的排列顺序确定至少一个搜索对象类别,至少一个搜索对象类别为所述多个候选对象类别中排列顺序满足预设条件的搜索对象类别。

Description

一种搜索对象类别的确定方法及装置
技术领域
本申请涉及电子商务技术领域,尤其涉及一种搜索对象类别的确定方法及装置。
背景技术
随着电子商务的蓬勃发展。电商平台中商品的数据量越来越庞大,商品类别的覆盖范围也越来越广泛。为提升用户体验,在商品搜索场景下,需要识别用户搜索意图、确定用户所搜索商品的类别,从而对不同用户作出针对性的商品推荐、有效促进商品成交额的提升。
现有技术中,一种搜索对象类别的确定方法为:根据历史数据中记录的用户对搜索关键词索引的所有搜索对象类别的选择概率确定所述搜索关键词对应的目标搜索对象类别,其中,搜索对象类别的选择概率是指历史数据中该目标搜索对象类别的历史点击次数在与该搜索关键词相关的总点击次数中所占的比例。
由于上述方法只考虑到了每个搜索对象类别点击次数的累加,因此,会造成选择概率大的搜索对象类别被选择的概率越来越高,而选择概率小的搜索对象类别被选择的概率越来越低。
发明内容
本申请提供一种搜索对象类别的确定方法及装置,可以从与搜索关键词关联的多个候选对象类别中确定至少一个搜索对象类别。
为达到上述目的,本申请采用如下技术方案:
第一方面,本申请提供一种搜索对象类别的确定方法,包括:根据搜索关键词确定与所述搜索关键词关联的多个候选对象类别;通过关联度计算模型分别确定所述搜索关键词与所述多个候选对象类别中每个候选对象类别的关联度;根据所述每个候选对象类别的关联度,对所述多个候选对象类别进行排序;根据所述多个候选对象类别的排列顺序确定至少一个搜索对象类别,所述至少一个搜索对象类别为所述多个候选对象类别中排列顺序满足预设条件的搜索对象类别。
第二方面,本申请提供一种搜索对象类别的确定装置,所述装置包括:处理单元,用于根据搜索关键词确定与所述搜索关键词关联的多个候选对象类别;所述处理单元,还用于分别确定所述搜索关键词与所述多个候选对象类别中每个候选对象类别的关联度;所述处理单元,还用于根据所述每个候选对象类别的关联度,对所述多个候选对象类别进行排序;所述处理单元,还用于根据所述多个候选对象类别的排列顺序确定至少一个搜索对象类别,所述至少一个搜索对象类别为所述多个候选对象类别中排列顺序满足预设条件的搜索对象类别。
第三方面,本申请提供一种计算机可读存储介质,计算机可读存储介质中存储有指令,当计算机执行该指令时,该计算机执行上述第一方面的方法。
第四方面,本申请提供一种包含指令的计算机程序产品,当该计算机程序产品在计算机上运行时,使得该计算机执行上述第一方面的方法。
第五方面,提供一种芯片,包括:处理器和通信接口,该通信接口和该处理器耦合,该处理器用于运行计算机程序或指令,以执行上述第一方面的方法。
本申请提供了一种搜索对象类别的确定方法及装置,先通过搜索关键词确定多个候选对象类别,再通过关联度计算模型分别确定搜索关键词与多个候选对象类别中每个候选对象类别的关联度,根据每个候选对象类别的关联度,对多个候选对象类别进行排序后,从多个候选对象类别中确定至少一个搜索对象类别。通过搜索关键词确定多个候选对象类别可以缩小候选对象类别的范围,降低后续操作的数据处理量;通过关联度计算模型确定关联度可以将选择标准数字化,便于选择符合条件的搜索对象类别;通过对多个候选对象类别进行排序便于从多个候选对象类别中确定至少一个搜索对象类别。从而实现搜索关键词与至少一个搜索对象类别的匹配。
附图说明
图1为本申请实施例提供的搜索对象类别的确定方法的流程示意图一;
图2为本申请实施例提供的搜索对象类别的确定方法的流程示意图二;
图3为本申请实施例提供的搜索对象类别的确定方法的应用场景示意图一;
图4为本申请实施例提供的搜索对象类别的确定方法的应用场景示意图二;
图5为使用本申请实施例提供的搜索对象类别的确定方法之前的搜索对象列表示意图;
图6为使用本申请实施例提供的搜索对象类别的确定方法之后的搜索对象列表示意图;
图7为本申请实施例提供的搜索对象类别的确定装置的结构示意图一;
图8为本申请实施例提供的搜索对象类别的确定装置的结构示意图二。
具体实施方式
下面结合附图对本申请实施例提供的搜索对象类别的确定方法及装置进行详细地描述。
在本申请的描述中,除非另有说明,“/”表示“或”的意思,例如,A/B可以表示A或B。本文中的“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。此外,“至少一个”是指一个或多个,“多个”是指两个或两个以上。
此外,本申请的描述中所提到的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括其他没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
需要说明的是,本申请实施例中,“示例性的”或者“例如”等词用于表示作例子、例证或说明。本申请实施例中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言,使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。
为了便于理解本申请的技术方案,下面对一些技术术语进行介绍。
1、马太效应
马太效应:是指强者愈强、弱者愈弱的现象。在本申请实施例中,马太效应表现为热门商品类别的关注度越来越高,而冷门商品类别逐渐被系统遗忘。
2、长尾效应
长尾效应:正态曲线中间的突起部分叫“头”;两边相对平缓的部分叫“尾”。长尾效应是指大多数的需求会集中在头部,而分布在尾部的需求是个性化的,零散的小量的需求。而这部分差异化的、少量的需求会在需求曲线上面形成一条长长的“尾巴”。
当用户在搜索平台的搜索引擎上输入搜索对象名称时,返回结果可能包含多种类别的搜索对象,为了提高用户的搜索效率,可以根据通过搜索对象名称得到的搜索关键词计算用户想要查询的搜索对象对应的类别的可能性。
现有技术中,可以基于类别点击词典实现对搜索对象类别的预测,类别点击词典是根据用户的历史搜索词以及该历史搜索关键词对应的候选对象类别的点击情况,统计得到的各个搜索关键词的搜索对象类别点击分布记录。
以搜索对象为商品为例,当需要对用户输入的搜索关键词进行类别预测时:首先确定商品类别候选集。示例性的,当搜索关键词为“笔记本”,则商品类别候选集中包括电子产品类商品和办公用品类商品。然后,根据类别点击词典统计商品类别候选集中搜索关键词对应商品类别的点击分布记录,从搜索关键词对应的商品别目中选取商品类别相关性最高的商品类别作为该搜索关键词的商品类别。
例如,当用户输入的搜索关键词为“笔记本”时,类别点击词典中记录了搜索关键词“笔记本”对应电子产品的点击次数是300次,对应办公用品的点击次数是700次,因此,搜索关键词“笔记本”对应的搜索对象类别的计算结果可以是:商品类别为电子产品的可能性为30%,商品类别为办公用品的可能性70%,由于该搜索关键词对应办公用品的可能性大,因此,可以根据该计算结果向用户推荐办公用品类别下的笔记本商品。
通过类别点击词典实现对搜索对象类别的确定主要是基于用户的点击行为,因此用户对于搜索产生的商品列表的点击行为,很大程度上反应出搜索关键词与商品类别的相关程度,用户输入搜索关键词后对某个商品类别的点击次数越频繁,该搜索关键词与该商品类别的相关程度越高。
由于是基于用户点击商品的行为积累,因此可能会导致马太效应和长尾效应,一方面,使点击次数多的热门商品类别关注度越来越高,而点击次数少的冷门商品类别关注度越来越低。另一方面,使头部积累了足够多数据的搜索关键词的商品类别预测结果比较准确。但是尾部搜索关键词由于积累数据不够,无法准确识别商品类别。除此之外,当电商平台增加新的商品类别时,需要对新增商品类别对应的搜索关键词进行“冷启动”,这种情况下长尾问题会尤为突出。
除用户正常操作造成的影响外,如果存在用户为了提高相应商品的点击率而频繁刷某些搜索关键词的情况,也会导致点击数据不准确,从而严重影响使用这些数据得到的商品类别的准确性。
参考图1,图1示出了本申请实施例提供的一种搜索对象类别的确定方法的流程示意图,执行主体为后台服务器,该方法包括:
S101、根据搜索关键词确定与搜索关键词关联的多个候选对象类别。
搜索关键词是指可以与多个候选对象类别关联的词。以搜索对象为商品为例,当用户在电商平台的搜索引擎上输入的搜索关键词为一个商品名称时,返回结果可能包含多种类别的商品,例如,用户输入的搜索关键词为“A4打印纸”时,返回结果中可能包含的候选对象类别为打印纸类商品以及商品名称中包含“A4打印纸”的硒鼓类商品;用户输入的搜索关键词为“笔记本”时,返回结果中可能包含的候选对象类别为电子产品类商品和办公用品类商品。
S102、通过关联度计算模型分别确定搜索关键词与多个候选对象类别中每个候选对象类别的关联度。
关联度计算模型用于计算搜索关键词与每个候选对象类别的关联度,关联度是用于表示搜索关键词与候选对象类别之间的关联程度,是衡量候选对象类别与搜索关键词匹配程度的重要指标。
S103、根据每个候选对象类别的关联度,对多个候选对象类别进行排序。
关联度可以用数值或百分比表征,多个候选对象类别的排序方式可以是按照关联度大小从大到小依次排列,也可以是按照关联度大小从小到大依次排列。
S104、根据多个候选对象类别的排列顺序确定至少一个搜索对象类别。
至少一个搜索对象类别为多个候选对象类别中排列顺序满足预设条件的搜索对象类别。例如该预设条件可以是多个候选对象类别中相似度最高或最低的搜索对象类别,也可以是多个候选对象类别中相似度高于第一预设阈值或不高于第二预设阈值的候选对象类别。该第一预设阈值大于或等于第二预设阈值。
需要说明的,多个候选对象类别的排序方式可根据预设条件进行设定,例如,当预设条件为多个候选对象类别中相似度最高或相似度高于第一预设阈值,则多个候选对象类别的排序方式为按照关联度大小从大到小依次排列。当预设条件为多个候选对象类别中相似度最低或相似度不高于第二预设阈值的候选对象类别,则多个候选对象类别的排序方式为按照关联度大小从小到大依次排列。
本申请实施例提供了一种搜索对象类别的确定方法,先通过搜索关键词确定多个候选对象类别,再通过关联度计算模型分别确定搜索关键词与多个候选对象类别中每个候选对象类别的关联度,根据每个候选对象类别的关联度,对多个候选对象类别进行排序后,从多个候选对象类别中确定至少一个搜索对象类别。通过搜索关键词确定多个候选对象类别可以缩小候选对象类别的范围,降低后续操作的数据处理量;通过关联度计算模型确定关联度可以将选择标准数字化,便于选择符合条件的搜索对象类别;通过对多个候选对象类别进行排序便于从多个候选对象类别中确定至少一个搜索对象类别。从而实现搜索关键词与至少一个搜索对象类别的匹配。
参考图2,作为一种可能的实施例,在S101之前,本申请实施例提供的方法还包括:
S105、获取用户输入的搜索词条。
搜索词条是指用户输入的未经处理的文本信息。
S106、通过分词器从搜索词条中确定搜索关键词。
用户输入的搜索词条中可能包括无法用于确定候选对象类别的词语或字。因此,需要通过分词器将搜索词条进行拆分,然后选择可以确定搜索对象类别的词语作为搜索关键词。确定搜索关键词后可以将该搜索关键词分发给多个用于离线计算的服务器。
例如,当搜索词条为“白色笔记本”,由于白色属于描述笔记本属性的词,对于确定笔记本属于电子产品或办公用品没有帮助,因此,通过分词器可以将搜索词条“白色笔记本”拆分为“白色”和“笔记本”,并确定“笔记本”为搜索关键词。
继续参考图2,作为一种可能的实施例,本申请实施例提供的方法还包括:
S107、确定搜索关键词是否为敏感词。
该敏感词包括涉黑、涉黄或政治敏感的词汇,可基于预设规则以及政策对搜索关键词进行判断,若搜索关键词是敏感词,则向用户发送输入非法的提示信息,并重新获取新的搜索关键词,若否,则执行S101。
继续参考图2,作为一种可能的实施例,S101的具体实现方式包括:
S1011、根据搜索关键词从多个召回器中确定目标召回器。
目标召回器用于根据搜索关键词确定多个候选对象类别,该搜索关键词的文本信息与目标召回器的筛选机制对应,不同的召回器可以对应不同的筛选机制。例如,当搜索关键词的文本信息指示商品品牌,则该目标召回器的筛选机制为品牌筛选机制。
召回引擎可以根据预设筛选条件对多个召回器进行筛选,该预设筛选条件可以包括搜索关键词的文本信息,也可以包括用户行为信息和配置信息,其中,用户行为信息是指用户历史行为数据中用户输入该搜索关键词后使用的召回器信息,配置信息是指运维人员通过人工干预设置的欲推广商品类别对应的召回器信息。
需要说明的,用户历史行为数据包括用户信息、搜索对象信息和搜索信息,用户信息用于记录用户的个性化信息,例如,商品类别偏好、店铺偏好等;搜索对象信息用于记录搜索对象类别,搜索信息用于记录用户在滑窗期内的点击行为、点击通过率以及点击行为的上下文特征,点击行为的上下文特征是指用户点击行为前后的场景,例如,用户点击某个搜索对象类别可能是有意识的点击,也可能是误操作。
需要说明的,以一个月为计算周期为例,滑窗期可以是用户前1、3、5、7、15、30天的点击行为。
S1012、通过将搜索关键词输入目标召回器确定多个候选对象类别。
继续参考图2,作为一种可能的实施例,S101的具体实现方式还包括:
S1013、根据搜索关键词确定多个搜索对象类别。
可以通过接收目标召回器的输出信息确定多个搜索对象类别,也可以直接通过搜索关键词确定多个候选对象类别,例如,通过查询人工预定义候选对象类别列表的方式确定搜索关键词可能关联的所有候选对象类别。
S1014、过滤掉多个搜索对象类别中包括敏感词的搜索对象类别,得到多个候选对象类别。
根据多个搜索对象类别的文本信息确定多个搜索对象类别中是否包含包括敏感词的搜索对象类别,若是。则过滤包括敏感词的搜索对象类别,若否,则该多个搜索对象类别为多个候选对象类别。
鉴于本申请实施例中计算搜索关键词与每个候选对象类别的第一关联值的方式和原理相同,因此本申请实施例以第一候选对象类别为例,详细介绍计算搜索关键词与第一候选对象类别的第一关联值的过程,搜索关键词与其余候选对象类别的第一关联值的计算方式可以参考搜索关键词与第一候选对象类别的第一关联值的过程,后续不再赘述。该第一候选对象类别为多个候选对象类别中的任一个,并不具有指示性含义。
继续参考图2,作为一种可能的实施例,S102的具体实现方式包括:
S1021、计算搜索关键词与第一候选对象类别的第一关联值。
多个候选对象类别包括第一候选对象类别,可以根据用户历史行为数据中与该搜索关键词对应的第一候选对象类别的点击次数、用户历史行为数据中与该搜索关键词对应的多个候选对象类别中所有候选对象类别的点击次数之和、用户历史行为数据中第一候选对象类别的总点击次数计算该搜索关键词与该第一候选对象类别的第一关联值。
示例性的,计算搜索关键词与第一候选对象类别的第一关联值F可以通过以下方式实现:
关联度计算模型的算法可以包括
Figure BDA0002197803670000081
根据公式
Figure BDA0002197803670000082
分别计算搜索关键词与第一候选对象类别的第一关联值F。其中,Xab表示用户历史行为数据中与所述搜索关键词对应的所述第一候选对象类别的点击次数,q表示幂运算系数,Xa表示用户历史行为数据中与所述搜索关键词对应的所述多个候选对象类别中所有候选对象类别的点击次数之和,Xb表示所述用户历史行为数据中所述第一候选对象类别的总点击次数,F表示搜索关键词与第一候选对象类别的第一关联值。
参考表1,表1为用户历史行为数据中搜索关键词对应的第一候选对象类别的用户点击次数记录表。该第一候选对象类别可以为水果,也可以为手机。当搜索关键词为苹果时,用户点击的搜索对象类别为水果的次数为518,点击的搜索对象类别为手机的次数为430。当搜索关键词为梨时,用户点击的搜索对象类别为水果的次数为389,点击的搜索对象类别为手机的次数为0;当搜索关键词为华为P30时,用户点击的搜索对象类别为水果的次数为0,点击的搜索对象类别为手机的次数为488。
表1
Figure BDA0002197803670000083
分别计算搜索关键词“苹果”与第一候选对象类别“水果”的第一关联值F(水果)以及搜索关键词“苹果”与第一候选对象类别“手机”的第一关联值F(手机)。
根据表1可知:
Xab(苹果,水果)=518;Xab(苹果,手机)=430;Xab(梨,水果)=389;Xab(梨,手机)=0;Xab(华为P30,水果)=0;Xab(华为P30,手机)=488。
Xa(苹果)=518+430=948;Xa(梨)=389+0=389;Xa(华为P30)=0+488=488。
Xb(水果)=518+389+0=907;Xb(手机)=430+0+488=918。
其中,幂运算系数q为预设值,可以根据结果的准确度进行不断调整优化。以q为0.3为例,根据公式
Figure BDA0002197803670000091
搜索关键词“苹果”与第一候选对象类别“水果”的第一关联值F(水果)=(518^0.3×518)÷(948×907)=0.0039;搜索关键词“苹果”与第一候选对象类别“手机”的第一关联值F(手机)=(430^0.3×430)÷(948×918)=0.0030。
相比现有技术,第一关联值F(水果)=518/948=0.5468,第一关联值F(手机)=430/948=0.4536,本申请实施例计算第一关联值的方法可以防止马太效应,降低高频点击类别的影响,使结果更加准确。
S1022、根据第一候选对象类别的第一关联值权重确定搜索关键词与第一候选对象类别的第二关联值。
由于当搜索关键词与第一候选对象类别的文本中有重叠部分或具有包含关系时,该第一候选对象类别与该搜索关键词之间相关性的程度更高,因此,可以根据第一候选对象类别的第一关联值权重确定搜索关键词与第一候选对象类别的第二关联值。该第一关联值权重可以由搜索关键词与第一候选对象类别之间的文本相似性确定,例如相同前缀、相同后缀、具有包含与被包含关系。
例如,当搜索关键词与第一候选对象类别之间具有相同前缀或相同后缀时,文本相似性为1,当搜索关键词与第一候选对象类别之间具有相同前缀且具有包含或被包含关系时,文本相似性为2。
可选的,该第一关联值权重还可以根据可变参数p确定,其中,p的取值范围为(0,1)。可变参数p可以根据结果的准确度进行不断调整优化。
示例性的,第二关联值可以为第一关联值与第一关联值权重的乘积。第一关联值权重为搜索关键词与第一候选对象类别之间的文本相似性以及可变参数p的和。
以可变参数p为0.3为例,当搜索关键词为“华为手机”时,设搜索关键词“华为手机”与第一候选对象类别“手机”的第一关联值F(手机)=0.0038。由于“华为手机”与第一候选对象类别“手机”具有相同后缀且具有被包含关系,因此,搜索关键词“华为手机”与第一候选对象类别“手机”之间的文本相似性为2。搜索关键词“华为手机”与第一候选对象类别“手机”的第二关联值(华为手机,手机)=0.0038*(0.3+2)=0.00874。
同理,当搜索关键词为“华为P30”时,设搜索关键词“华为P30”与第一候选对象类别“手机”的第一关联值F(手机)=0.0042。“华为P30”与第一候选对象类别“手机”的文本相似性为0,因此,搜索关键词“华为P30”与第一候选对象类别“手机”的第二关联值(华为P30,手机)=0.0042*(0.3+0)=0.00126。
文本解析是电商搜索相关性中的重要组成部分。一方面,可以保证商品的排序效率,使得商品排序在与文本相关的商品集合上进行;另一方面,可以从最上层保证商品类别的相关性。
S1023、对搜索关键词与第一候选对象类别的第二关联值进行归一化处理确定搜索关键词与第一候选对象类别的关联度。
以搜索关键词“苹果”与第一候选对象类别“水果”的第二关联值(苹果,水果)=0.0039,搜索关键词“苹果”与第一候选对象类别“手机”的第二关联值(苹果,手机)=0.0030为例,通过归一化处理可使上述两个值位于预设数值范围内,例如预设数值范围可以为(0,1)。
示例性的,以第二关联值最大的第一候选对象类别的第二关联值为1,其他第一候选对象类别的第二关联值同比例增大,则归一化后,搜索关键词“苹果”与第一候选对象类别“水果”的关联度为1,搜索关键词“苹果”与第一候选对象类别“手机”的关联度为0.0030/0.0039=0.77。
应理解,当搜索关键词与所有候选对象类别的文本相似性都为0时,第二关联值可以为第一关联值,即不再通过S1022对第一关联值进行处理。
需要说明的,为提高计算速度,本申请实施例也可以根据搜索关键词与每个候选对象类别第一关联值对多个候选对象类别进行排序。
作为一种可能的实施例,为了提高反馈速度,本申请实施例支持离线计算,离线计算的实现是基于对用户历史行为数据的总结,通过S101-S102实现对用户历史行为数据中所有搜索关键词中每个搜索关键词与对应的各个搜索对象类别的关联度计算,然后通过S103对多个候选对象类别进行排序,根据多个候选对象类别的排列顺序确定至少一个搜索对象类别。
示例性的,参考表2,可以根据至少一个搜索对象类别确定离线索引表。
表2
Figure BDA0002197803670000111
由于不同业务线商品数据格式不一致、类别字段也不统一,因此需要区分不同业务线对应的搜索关键词与至少一个搜索对象类别之间的对应关系。
需要说明的,表2中业务线标识用于区分各个业务线,类别字段用于表示不同业务库表中类别编号的字段名称,搜索对象类别索引中每个小括号表示一种类别,小括号中的第一个值表示候选对象类别编号,第二个值表示该候选对象类别与搜索关键词的相关度。
示例性的,如表2所示,以搜索关键词为“苹果”为例,对于业务线1,类别字段为catsmallId,其中“苹果”对应的候选对象类别包括“水果”和“手机”,其中,“水果”的catsmallId是2101011,“手机”的catsmallId是2101211,搜索关键词“苹果”与“水果”的关联度为1,与“手机”的关联度为0.77。
作为一种可能的实施例,该方法还包括:
S108、向用户展示所述至少一个搜索对象类别对应的搜索对象列表。
该搜索对象列表中的搜索对象按照搜索对象对应的候选对象类别的排列顺序排序。例如,至少一个搜索对象类别中包括搜索对象类别1、搜索对象类别2以及搜索对象类别3,其中,搜索对象类别1对应搜索对象1,搜索对象类别2对应搜索对象2,搜索对象类别3对应搜索对象3,若至少一个搜索对象类别的排列顺序为搜索对象类别1、搜索对象类别2、搜索对象类别3,则该搜索对象列表中的搜索对象的排列顺序为:搜索对象1、搜索对象2、搜索对象3。
作为一种可能的实施例,为了使关联的结果更加准确,本申请实施例支持人工干预。例如,搜索关键词为“鼠标”时,返回结果中存在大量“鼠标垫”类别的商品。这是因为计算搜索关键词“鼠标”与候选对象类别之间关联度时出现了误差。因此可以通过人工干预的方式(如人工干预模型)调整计算结果。运维人员可新增或编辑人工干预模型中的干预词条、调整关联度计算模型的计算结果以及补充未计算出相关度的候选对象类别。
参考图3,本申请实施例提供的一种搜索对象类别的确定方法可应用于图3所示的场景中,后台服务器从前台业务系统获取新的数据源,该数据源可以包括搜索关键词,也可以包括用户信息、商品信息和用户行为信息。后台服务器可以在线计算各个搜索对象类别与该搜索关键词的关联度,并通过检索服务向用户返回该搜索关键词对应的关联度满足预设条件的搜索对象类别,也可以先将该数据源存储,当业务负载较少的时候后台服务器再根据用户历史行为数据进行该关联度的离线计算。当用户通过检索服务输入数据源,该数据源仍包括该搜索关键词时,可以无需计算直接通过检索服务向用户返回该搜索关键词对应的关联度满足预设条件的搜索对象类别。
需要说明的,在线计算关联度与离线计算关联度的过程可参考上述S1021-S1023,此处不再赘述。
参考图4,后台服务器可以通过RabbitMQ的通信方法读取出入队列消息获得数据源,若该数据源只包括搜索关键词,则直接通过搜索引擎例如Phoenix建立离线索引表并将该数据源的全量数据存储在数据库中的用户历史行为数据中,该数据库可以为HBase。若该数据源除搜索关键词外还包括其他搜索字段,则将数据源输入分词器,例如IK分词器,以获取搜索关键词。当用户检索该数据源中的搜索关键词时,若结果缓存命中,则直接向用户返回命中的候选对象类别,若未命中,则通过分词器和搜索引擎,例如,ElasticSearch,从数据库的离线索引表中确定候选对象类别,再通过用户设定的二次筛选操作筛选确定的候选对象类别,最终将筛选过的候选对象类别返回至用户。
参考图5,图5为使用现有技术的方法的搜索对象类别的确定方法,例如,输入搜索关键词“A4打印纸”时得到的搜索对象列表,该搜索对象列表中不仅包含多种A4打印纸,还包含商品介绍中包括“打印”、“纸”等词语的碎纸机和打印机,参考图6,图6为使用本申请实施例之后输入搜索关键词“A4打印纸”时得到的搜索对象列表,该搜索对象列表中可以包括A4打印纸。由于A4打印纸是用户的意图,因此通过本申请实施例提供的方法可以优先将用户的需求展现在前排。
参考图7,本申请实施例还提供一种搜索对象类别的确定装置,该装置300包括:
处理单元301,用于根据搜索关键词确定与所述搜索关键词关联的多个候选对象类别;分别确定所述搜索关键词与所述多个候选对象类别中每个候选对象类别的关联度;根据所述每个候选对象类别的关联度,对所述多个候选对象类别进行排序;根据所述多个候选对象类别的排列顺序确定至少一个搜索对象类别。
可选的,该装置300还包括:通信单元302,用于获取用户输入的搜索词条;接收分词器从所述搜索词条中确定的所述搜索关键词。
可选的,该处理单元301具体用于:根据所述搜索关键词从多个召回器中确定目标召回器,所述目标召回器用于根据所述搜索关键词确定所述多个候选对象类别,所述搜索关键词的文本信息与所述目标召回器的筛选机制对应;将所述搜索关键词输入所述目标召回器确定所述多个候选对象类别。
可选的,处理单元301具体用于:根据搜索关键词确定多个搜索对象类别;过滤掉所述多个搜索对象类别中包括敏感词的搜索对象类别,得到所述多个候选对象类别。
可选的,对于第一候选对象类别,所述第一候选对象类别为所述多个候选对象类别中的任一个,处理单元301具体用于:根据公式
Figure BDA0002197803670000131
分别计算所述搜索关键词与所述第一候选对象类别的第一关联值F,其中,Xab表示用户历史行为数据中与所述搜索关键词对应的所述第一候选对象类别的点击次数,q表示幂运算系数,Xa表示用户历史行为数据中与所述搜索关键词对应的所述多个候选对象类别中所有候选对象类别的点击次数之和,Xb表示所述用户历史行为数据中所述第一候选对象类别的总点击次数,F表示所述搜索关键词与所述第一候选对象类别的第一关联值;根据第一候选对象类别的第一关联值权重确定所述搜索关键词与所述第一候选对象类别的第二关联值,所述第一关联值权重由所述搜索关键词与所述第一候选对象类别之间的文本相似性确定;对所述搜索关键词与第一候选对象类别的第二关联值进行归一化处理确定搜索关键词与第一候选对象类别的关联度。
可选的,用户历史行为数据包括用户信息、搜索对象信息和搜索信息,所述用户信息用于记录用户的个性化信息,所述搜索对象信息用于记录搜索对象类别,所述搜索信息用于记录用户的点击行为和所述点击行为的上下文特征。
可选的,至少一个搜索对象类别为所述多个候选对象类别中排列顺序满足预设条件的搜索对象类别。
可选的,通信单元302还用于:向用户展示所述至少一个搜索对象类别对应的搜索对象列表,所述搜索对象列表中的搜索对象按照所述搜索对象对应的候选对象类别的排列顺序排序。
图8示出了上述实施例中所涉及的一种搜索对象类别的确定装置的一种可能的结构示意图。包括:处理器402。处理器402用于对该装置300的动作进行控制管理,例如,执行上述处理单元301执行的步骤,和/或用于执行本文所描述的技术的其它过程。
上述处理器402可以是实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。该处理器可以是中央处理器,通用处理器,数字信号处理器,专用集成电路,现场可编程门阵列或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。该处理器也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等。
可选的,该装置300还可以包括通信接口403、存储器401和总线404,通信接口403用于支持装置300与其他网络实体的通信。例如,执行上述通信单元302执行的步骤,和/或用于执行本文所描述的技术的其它过程。存储器401用于存储该装置300的程序代码和数据。
其中,存储器401可以是装置300中的存储器,该存储器可以包括易失性存储器,例如随机存取存储器;该存储器也可以包括非易失性存储器,例如只读存储器,快闪存储器,硬盘或固态硬盘;该存储器还可以包括上述种类的存储器的组合。
总线404可以是扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。总线404可以分为地址总线、数据总线、控制总线等。为便于表示,图8中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本申请实施例提供一种芯片,该芯片包括至少一个处理器和通信接口,通信接口和至少一个处理器耦合,处理器用于运行指令,以执行上述方法实施例所述的搜索对象类别的确定方法。
本申请实施例提供一种包含指令的计算机程序产品,当该计算机程序产品在计算机上运行时,使得所述计算机执行上述方法实施例所述的搜索对象类别的确定方法。
本申请实施例还提供一种计算机可读存储介质,计算机可读存储介质中存储有指令,当装置300执行该指令时,该装置300执行上述方法实施例所述的方法的各个步骤。
其中,计算机可读存储介质,例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(Random Access Memory,RAM)、只读存储器(Read-Only Memory,ROM)、可擦式可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、寄存器、硬盘、光纤、便携式紧凑磁盘只读存储器(Compact Disc Read-Only Memory,CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合、或者本领域熟知的任何其它形式的计算机可读存储介质。一种示例性的存储介质耦合至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于特定用途集成电路(Application Specific Integrated Circuit,ASIC)中。在本申请实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何在本申请揭露的技术范围内的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应该以权利要求的保护范围为准。

Claims (15)

1.一种搜索对象类别的确定方法,其特征在于,所述方法包括:
根据搜索关键词确定与所述搜索关键词关联的多个候选对象类别;
通过关联度计算模型分别确定所述搜索关键词与所述多个候选对象类别中每个候选对象类别的关联度;
根据所述每个候选对象类别的关联度,对所述多个候选对象类别进行排序;
根据所述多个候选对象类别的排列顺序确定至少一个搜索对象类别,所述至少一个搜索对象类别为所述多个候选对象类别中排列顺序满足预设条件的搜索对象类别;
对于第一候选对象类别,所述第一候选对象类别为所述多个候选对象类别中的任一个,
所述通过关联度计算模型确定所述搜索关键词与所述第一候选对象类别的关联度,包括:
根据公式
Figure FDA0003539455210000011
计算所述搜索关键词与所述第一候选对象类别的第一关联值,其中,Xab表示用户历史行为数据中与所述搜索关键词对应的所述第一候选对象类别的点击次数,q表示幂运算系数,Xa表示用户历史行为数据中与所述搜索关键词对应的所述多个候选对象类别的点击次数之和,Xb表示所述用户历史行为数据中所述第一候选对象类别的总点击次数;F表示所述搜索关键词与所述第一候选对象类别的第一关联值;
根据所述第一候选对象类别的第一关联值权重确定所述搜索关键词与所述第一候选对象类别的第二关联值,第一关联值权重由所述搜索关键词与所述第一候选对象类别之间的文本相似性确定;
对所述搜索关键词与所述第一候选对象类别的第二关联值进行归一化处理确定所述搜索关键词与所述第一候选对象类别的关联度。
2.根据权利要求1所述的方法,其特征在于,所述根据搜索关键词确定与所述搜索关键词关联的多个候选对象类别之前,所述方法还包括:
获取用户输入的搜索词条;
通过分词器从所述搜索词条中确定所述搜索关键词。
3.根据权利要求2所述的方法,其特征在于,所述根据搜索关键词确定与所述搜索关键词关联的多个候选对象类别,包括:
根据所述搜索关键词从多个召回器中确定目标召回器,所述目标召回器用于根据所述搜索关键词确定所述多个候选对象类别,所述搜索关键词的文本信息与所述目标召回器的筛选机制对应;
通过将所述搜索关键词输入所述目标召回器确定所述多个候选对象类别。
4.根据权利要求1-3中任一项所述的方法,其特征在于,所述根据搜索关键词确定与所述搜索关键词关联的多个候选对象类别,包括:
根据搜索关键词确定多个搜索对象类别;
过滤掉所述多个搜索对象类别中包括敏感词的搜索对象类别,得到所述多个候选对象类别。
5.根据权利要求1所述的方法,其特征在于,所述用户历史行为数据包括用户信息、搜索对象信息和搜索信息,所述用户信息用于记录用户的个性化信息,所述搜索对象信息用于记录搜索对象类别,所述搜索信息用于记录用户的点击行为和所述点击行为的上下文特征。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
向用户展示所述至少一个搜索对象类别对应的搜索对象列表,所述搜索对象列表中的搜索对象按照所述搜索对象对应的候选对象类别的排列顺序排序。
7.一种搜索对象类别的确定装置,其特征在于,所述装置包括:
处理单元,用于根据搜索关键词确定与所述搜索关键词关联的多个候选对象类别;
所述处理单元,还用于分别确定所述搜索关键词与所述多个候选对象类别中每个候选对象类别的关联度;
所述处理单元,还用于根据所述每个候选对象类别的关联度,对所述多个候选对象类别进行排序;
所述处理单元,还用于根据所述多个候选对象类别的排列顺序确定至少一个搜索对象类别,所述至少一个搜索对象类别为所述多个候选对象类别中排列顺序满足预设条件的搜索对象类别;
对于第一候选对象类别,所述第一候选对象类别为所述多个候选对象类别中的任一个,所述处理单元具体用于:
根据公式
Figure FDA0003539455210000021
分别计算所述搜索关键词与所述第一候选对象类别的第一关联值F,其中,Xab表示用户历史行为数据中与所述搜索关键词对应的所述第一候选对象类别的点击次数,q表示幂运算系数,Xa表示用户历史行为数据中与所述搜索关键词对应的所述多个候选对象类别中所有候选对象类别的点击次数之和,Xb表示所述用户历史行为数据中所述第一候选对象类别的总点击次数,F表示所述搜索关键词与所述第一候选对象类别的第一关联值;
根据所述第一候选对象类别的第一关联值权重确定所述搜索关键词与所述第一候选对象类别的第二关联值,所述第一关联值权重由所述搜索关键词与所述第一候选对象类别之间的文本相似性确定;
对所述搜索关键词与所述第一候选对象类别的第二关联值进行归一化处理确定所述搜索关键词与所述第一候选对象类别的关联度。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
通信单元,用于获取用户输入的搜索词条;
所述通信单元,还用于接收分词器从所述搜索词条中确定的所述搜索关键词。
9.根据权利要求8所述的装置,其特征在于,所述处理单元具体用于:
根据所述搜索关键词从多个召回器中确定目标召回器,所述目标召回器用于根据所述搜索关键词确定所述多个候选对象类别,所述搜索关键词的文本信息与所述目标召回器的筛选机制对应;
将所述搜索关键词输入所述目标召回器确定所述多个候选对象类别。
10.根据权利要求7-9中任一项所述的装置,其特征在于,所述处理单元具体用于:
根据搜索关键词确定多个搜索对象类别;
过滤掉所述多个搜索对象类别中包括敏感词的搜索对象类别,得到所述多个候选对象类别。
11.根据权利要求7所述的装置,其特征在于,所述用户历史行为数据包括用户信息、搜索对象信息和搜索信息,所述用户信息用于记录用户的个性化信息,所述搜索对象信息用于记录搜索对象类别,所述搜索信息用于记录用户的点击行为和所述点击行为的上下文特征。
12.根据权利要求8所述的装置,其特征在于,所述通信单元还用于:
向用户展示所述至少一个搜索对象类别对应的搜索对象列表,所述搜索对象列表中的搜索对象按照所述搜索对象对应的候选对象类别的排列顺序排序。
13.一种芯片,其特征在于,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行计算机程序或指令,以实现如权利要求1-6中任一项所述的方法,所述通信接口用于与所述芯片之外的其它模块进行通信。
14.一种通信装置,其特征在于,包括:处理器,所述处理器与存储器耦合,所述存储器用于存储计算机程序或指令,所述处理器用于执行存储器中的该计算机程序或指令,使得该通信装置执行权利要求1-6中任一项所述的方法。
15.一种计算机可读存储介质,其特征在于,所述存储介质用于存储计算机程序或指令,所述计算机程序或指令被执行时,使得所述计算机执行权利要求1-6中任一项所述的方法。
CN201910854133.8A 2019-09-10 2019-09-10 一种搜索对象类别的确定方法及装置 Active CN110807138B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910854133.8A CN110807138B (zh) 2019-09-10 2019-09-10 一种搜索对象类别的确定方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910854133.8A CN110807138B (zh) 2019-09-10 2019-09-10 一种搜索对象类别的确定方法及装置

Publications (2)

Publication Number Publication Date
CN110807138A CN110807138A (zh) 2020-02-18
CN110807138B true CN110807138B (zh) 2022-07-05

Family

ID=69487564

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910854133.8A Active CN110807138B (zh) 2019-09-10 2019-09-10 一种搜索对象类别的确定方法及装置

Country Status (1)

Country Link
CN (1) CN110807138B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111400436A (zh) * 2020-02-19 2020-07-10 北京值得买科技股份有限公司 一种基于用户意图识别的搜索方法以及装置
CN111400362A (zh) * 2020-02-19 2020-07-10 北京值得买科技股份有限公司 一种基于Elasticsearch的分布式搜索系统搭建方法以及装置
CN112269816B (zh) * 2020-11-10 2023-04-21 浪潮云信息技术股份公司 一种政务预约事项相关性检索方法
CN112528144A (zh) * 2020-12-08 2021-03-19 北京百度网讯科技有限公司 搜索推荐方法、装置、智能设备、电子设备及存储介质
CN113343101B (zh) * 2021-06-28 2023-08-04 支付宝(杭州)信息技术有限公司 一种对象排序方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101246502A (zh) * 2008-03-27 2008-08-20 腾讯科技(深圳)有限公司 一种在网络上搜索图片的方法及系统
CN102043833A (zh) * 2010-11-25 2011-05-04 北京搜狗科技发展有限公司 一种基于查询词进行搜索的方法和搜索装置
CN102637179A (zh) * 2011-02-14 2012-08-15 阿里巴巴集团控股有限公司 词项加权函数确定及基于该函数进行搜索的方法及装置
CN103092856A (zh) * 2011-10-31 2013-05-08 阿里巴巴集团控股有限公司 搜索结果排序方法及设备、搜索方法及设备
CN103412881A (zh) * 2013-07-17 2013-11-27 北京奇虎科技有限公司 提供搜索结果的方法及系统
CN109408710A (zh) * 2018-09-26 2019-03-01 斑马网络技术有限公司 搜索结果优化方法、装置、系统及存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8615719B2 (en) * 2005-09-14 2013-12-24 Jumptap, Inc. Managing sponsored content for delivery to mobile communication facilities
AU2011202182B1 (en) * 2011-05-11 2011-10-13 Frequency Ip Holdings, Llc Creation and presentation of selective digital content feeds
CN109857952A (zh) * 2019-01-18 2019-06-07 紫格网络科技(上海)有限公司 一种具有分类显示的搜索引擎及快速检索方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101246502A (zh) * 2008-03-27 2008-08-20 腾讯科技(深圳)有限公司 一种在网络上搜索图片的方法及系统
CN102043833A (zh) * 2010-11-25 2011-05-04 北京搜狗科技发展有限公司 一种基于查询词进行搜索的方法和搜索装置
CN102637179A (zh) * 2011-02-14 2012-08-15 阿里巴巴集团控股有限公司 词项加权函数确定及基于该函数进行搜索的方法及装置
CN103092856A (zh) * 2011-10-31 2013-05-08 阿里巴巴集团控股有限公司 搜索结果排序方法及设备、搜索方法及设备
CN103412881A (zh) * 2013-07-17 2013-11-27 北京奇虎科技有限公司 提供搜索结果的方法及系统
CN109408710A (zh) * 2018-09-26 2019-03-01 斑马网络技术有限公司 搜索结果优化方法、装置、系统及存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Keyword-driven SPARQL Query Generation Leveraging Background Knowledge;Saeedeh Shekarpour et al.;《2011 IEEE/WIC/ACM International Conferences on Web Intelligence and Intelligent Agent Technology》;20111010;203-210 *
基于GBDT的社区问题标签推荐技术研究;孙万龙;《中国优秀硕士学位论文全文数据库 信息科技辑》;20160215(第2期);I138-2100 *
基于排序学习的推荐算法研究综述;黄震华 等;《软件学报》;20151230;第27卷(第3期);691-713 *

Also Published As

Publication number Publication date
CN110807138A (zh) 2020-02-18

Similar Documents

Publication Publication Date Title
CN110807138B (zh) 一种搜索对象类别的确定方法及装置
US10565273B2 (en) Tenantization of search result ranking
JP5661200B2 (ja) 検索情報の提供
EP2160677B1 (en) System and method for measuring the quality of document sets
AU2022201654A1 (en) System and engine for seeded clustering of news events
KR101016683B1 (ko) 검색 결과를 제공하기 위한 시스템 및 방법
US10354308B2 (en) Distinguishing accessories from products for ranking search results
US20130060769A1 (en) System and method for identifying social media interactions
US20100042610A1 (en) Rank documents based on popularity of key metadata
US20230147941A1 (en) Method, apparatus and device used to search for content
CN104050183A (zh) 浏览器输入框的内容匹配结果提示方法及装置
CN104615723B (zh) 查询词权重值的确定方法和装置
CN116610853A (zh) 搜索推荐方法、搜索推荐系统、计算机设备及存储介质
CN112015853A (zh) 图书搜索方法、图书搜索系统、电子装置及介质
Na et al. Effectiveness of web search results for genre and sentiment classification
Selvan et al. ASE: Automatic search engine for dynamic information retrieval
AU2021289542B2 (en) Refining a search request to a content provider
KR20110127052A (ko) 웹 페이지 검색에서 개인화된 태그 추천 모델 활용 시스템 및 방법
CN115630144A (zh) 一种文档搜索方法、装置及相关设备
CN103853742A (zh) 检索装置、终端和检索方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address

Address after: 100032 room 8018, 8 / F, building 7, Guangyi street, Xicheng District, Beijing

Patentee after: State Grid Digital Technology Holdings Co.,Ltd.

Patentee after: State Grid E-Commerce Technology Co.,Ltd.

Address before: 100053 8th floor, building 1, NO.311, guanganmennei street, Xicheng District, Beijing

Patentee before: STATE GRID ELECTRONIC COMMERCE Co.,Ltd.

Patentee before: YINGDA BUSINESS SERVICES Ltd.

CP03 Change of name, title or address