CN112115340A - 搜索策略的选择方法、移动终端以及可读存储介质 - Google Patents
搜索策略的选择方法、移动终端以及可读存储介质 Download PDFInfo
- Publication number
- CN112115340A CN112115340A CN202010963295.8A CN202010963295A CN112115340A CN 112115340 A CN112115340 A CN 112115340A CN 202010963295 A CN202010963295 A CN 202010963295A CN 112115340 A CN112115340 A CN 112115340A
- Authority
- CN
- China
- Prior art keywords
- strategy
- sorting
- search
- difference
- test
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000010187 selection method Methods 0.000 title claims abstract description 17
- 238000012360 testing method Methods 0.000 claims abstract description 76
- 238000012163 sequencing technique Methods 0.000 claims abstract description 38
- 238000000034 method Methods 0.000 claims abstract description 36
- 238000004590 computer program Methods 0.000 claims description 10
- 238000002474 experimental method Methods 0.000 description 47
- 238000010586 diagram Methods 0.000 description 13
- 230000004044 response Effects 0.000 description 7
- 230000035945 sensitivity Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 230000003321 amplification Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9532—Query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
本申请公开了一种搜索策略的选择方法、移动终端以及可读存储介质。该选择方法包括:获取用户输入的检索语句;利用基础策略和测试策略对检索语句进行差异性判断,得到有差异的排序结果,基础策略为当前服务器原有的搜索排序策略,测试策略为新增的搜索排序策略;通过排序结果选择需要的搜索策略。通过上述方式,本申请能够有效地捕捉排序影响覆盖面较小的搜索策略,灵活支持不同影响面的搜索策略。
Description
技术领域
本申请涉及搜索技术领域,特别是涉及一种搜索策略的选择方法、移动终端以及可读存储介质。
背景技术
随着网络技术的发展,人们对于网络搜索的应用越来越多,每种应用的搜索策略也不尽相同,往往不同的搜索策略对查询语句的召回是不同的,也就意味着在现实的产品设计场景中,人们经常会遇到多个设计方案的选择。
通常会为同一个产品目标制定两个方案,可以通过让一部分用户使用第一方案,另一部分用户使用第二方案,然后通过日志记录用户的使用情况,比如结构化的日志数据分析相关指标,如点击率(click through rate,CTR)、转化率(click value rate,CVR)等,从而得出那个方案更符合预期设计目标,并最终将全部流量切换至符合目标的方案。
通过这种方法,在全搜业务中往往对评估新版排序策略非常有效,然而,当存在影响面比较小的搜索策略时,若原有的搜索策略作为分母,整体曝光数较大时,这容易导致灵敏感知度较差,从而使得差异覆盖面较小的策略被忽略,进而影响后续迭代推全的决策。
发明内容
本申请实施例的第一方面提供了一种搜索策略的选择方法,该选择方法包括:获取用户输入的检索语句;利用基础策略和测试策略对检索语句进行差异性判断,得到有差异的排序结果,基础策略为当前服务器原有的搜索排序策略,测试策略为新增的搜索排序策略;通过排序结果选择需要的搜索策略。
本申请实施例的第二方面提供了一种移动终端,该移动终端包括:获取模块,用于获取用户输入的检索语句;判断模块,连接获取模块,用于利用基础策略和测试策略对检索语句进行差异性判断,得到有差异的排序结果,基础策略为当前服务器原有的搜索排序策略,测试策略为新增的搜索排序策略;选择模块,连接判断模块,用于通过排序结果选择需要的搜索策略。
本申请实施例的第三方面提供了一种移动终端,该移动终端包括:处理器和存储器,存储器中存储有计算机程序,处理器用于执行计算机程序以实现如上述的选择方法。
本申请实施例的第四方面提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,计算机程序能够被处理器执行时实现如上述的选择方法。
本申请的有益效果是:区别于现有技术的情况,本申请针对目前搜索策略覆盖面相对较大的问题,通过利用基础策略和测试策略对检索语句进行差异性判断,将覆盖面影响较小的查询语句进行提取以灵敏捕捉查询语句细小的差别,将有差异的排序结果进行排序以实现选择需要的搜索策略。因此通过上述方式,能够有效地捕捉排序影响覆盖面较小的搜索策略,灵活支持不同影响面的搜索策略。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请搜索策略的选择方法第一实施例的流程示意图;
图2是图1中步骤S12一具体实施方式的流程示意图;
图3是图1中步骤S12之前一具体实施方式的流程示意图;
图4是图1中步骤S13之前一具体实施方式的流程示意图;
图5是本申请的移动终端一实施例的整体方案的流程图;
图6是本申请搜索策略的选择方法的系统构架图;
图7是步骤S55一具体实施例的流程示意图;
图8是本申请的移动终端一实施例的示意框图;
图9是本申请的移动终端另一实施例的示意框图;
图10是本申请的计算机存储介质一实施例的示意框图;
图11是本申请移动终端的硬件架构的示意框图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
为了说明本申请所述的技术方案,下面通过具体实施例来进行说明。
请参阅图1,图1是本申请搜索策略的选择方法第一实施例的流程示意图。本实施例提供的选择方法具体包括以下步骤:
S11:获取用户输入的检索语句;
一般来说,移动终端都设置有搜索框,当用户输入搜索词时,移动终端可以通过获取搜索命令所承载的关键字以及本身所附带的搜索策略等进行相对应的数据召回。以结合当前全搜背景为例,通过后台服务的入库,用户输入的检索语句的流量可以从集团实验平台进行获取,也即接收用户请求入口,然后调用其子模块处理用户的需求,最终将待返回的结果统一合并发送至前端展示。
此外,当移动终端设置有排序服务的搜索桶时,还可以通过排序服务的自检测对用户输入搜索词进行检测来判断用户输入搜索词对应的流量是否命中排序服务的搜索桶,以获取用户输入的检索语句。当然,领域技术人员可以通过本领域公知的其他方式来获取用户输入的检索语句。
S12:利用基础策略和测试策略对检索语句进行差异性判断,得到有差异的排序结果;
移动终端设有基础策略以及测试策略,用于对检索语句的差异性判断,因为基础策略与测试策略有所不同,所以对检索语句进行召回的排序结果也有一定的差异,其具体的差异将在下文进行详细描述。当然,本领域技术人员在本申请的技术启示下完全可以想到根据实际需要设置其他的基础策略以及测试策略。
其中,基础策略为当前服务器原有的搜索排序策略,测试策略为新增的搜索排序策略;当移动终端利用基础策略和测试策略对检索语句进行差异性判断,得到有差异的排序结果后,则可以通知移动终端指向相应的操作。进一步地,在返回有差异的排序结果后,移动终端还可以产生相应的中断信号。
S13:通过排序结果选择需要的搜索策略。
因为从步骤S12中得到的排序结果是有差异性的,其差异性强弱是基于基础策略与测试策略之间的差异大小,但实际上,在本实施中,测试策略的覆盖面影响力相比于基础策略的覆盖面影响力非常小,所以通过步骤S12得到有差异的排序结果,可以更为快速和灵敏地将需要的搜索策略进行选择,比如,当用户通过排序结果更中意基础策略,则基础策略可以被选中;当用户通过排序结果更中意测试策略,则测试策略可以被选中,并且即便是测试策略的覆盖面影响力非常小,比如测试策略的影响面占比小于或等于5%。也可以灵敏地进行选择,而没有差异的排序结果则直接过滤掉,留下有差异的排序结果,从而可以更遵从用户的个性化差异。
因此,通过上述方式,本申请针对目前搜索策略覆盖面相对较大的问题,通过利用基础策略和测试策略对检索语句进行差异性判断,将覆盖面影响较小的查询语句进行提取以灵敏捕捉查询语句细小的差别,将有差异的排序结果进行排序以实现选择需要的搜索策略。因此通过上述方式,能够有效地捕捉排序影响覆盖面较小的搜索策略,灵活支持不同影响面的搜索策略。
请参阅图2,图2是图1中步骤S12一具体实施方式的流程示意图,具体包括以下步骤:
S21:利用基础策略对检索语句进行召回,得到第一排序结果,以及利用测试策略对检索语句进行召回,得到第二排序结果;
在本步骤中,移动终端进一步对基础策略以及测试策略所召回的排序结果进行拆解,并使用第一排序结果表示利用基础策略对检索语句进行召回的有差异的排序结果,使用第二排序结果表示利用测试策略对检索语句进行召回得到有差异的排序结果,从而对两种策略进行区分。
具体地,利用基础策略对检索语句进行召回,得到第一排序结果,包括:请求配置基础策略;利用基础策略对检索语句进行召回,得到第一排序结果。而利用测试策略对检索语句进行召回,得到第二排序结果,包括:请求配置测试策略;利用测试略对检索语句进行召回,得到第二排序结果。
当然,第一排序结果可以与第二排序结果相类似,但高度相类似的有差异的排序结果可以通过过滤的方式进行排除。
S22:判断第一排序结果和第二排序结果是否有差异;
基于利用基础策略对检索语句进行召回得到的第一排序结果,以及利用测试策略对检索语句进行召回得到的第二排序结果,可以通过判断的方式,对第一排序结果和第二排序结果进行差异评判。
具体地,这种差异是通过第一排序结果的排序以及第二排序结果的排序进行判断,若排序不一致,则进入步骤S23:判定第一排序结果和第二排序结果有差异;若排序一致,则进入步骤S24:判定第一排序结果和第二排序结果没有差异。
S23:对检索语句打上差异标签,以得到有差异的排序结果;
对于有差异的第一排序结果以及第二排序结果,通过对检索语句的流量标记打上差异标签进行区别;并且保存差异标签,返回基础策略对应的排序结果作为有差异的排序结果,也即若适用基础策略则对应返回基础策略里的排序结果,若适用测试策略则对应返回测试策略里的排序结果。
S24:排除检索语句对应的流量数据。
其中,在步骤S22中,还可以通过其他的判别标准对判断第一排序结果和第二排序结果是否有差异进行判别,比如用户通过结构化的日志数据分析相关指标,如点击率、转化率等,也可以用来对第一排序结果和第二排序结果是否有差异进行判别。
请参阅图3,图3是图1中步骤S12之前一具体实施方式的流程示意图,包括以下步骤:
S31:对平台流量进行分发或设置,得到至少一个搜索排序桶;
在利用基础策略和测试策略对检索语句进行差异性判断,得到有差异的排序结果之前可知,移动终端可以通过对平台流量进行分发或设置,得到至少一个搜索排序桶作为实验桶。
具体地,后台服务的入库(ms)通过实验平台可以获取命中的实验集合,如果单卡则不把集合下发给排序服务器,否则将实验集合下发给排序服务器,排序服务器根据实验标识(Identity Document,ID)来决定是否进行实验,通常,实验平台传给ms可以以层ID(layerId)、实验组ID(expItemId)以及实验ID(expId)的形式。
其中,每个搜索排序桶均有唯一识别码,也即排序策略名不同,那么排序策略逻辑也有所不同。
S32:对检索语句的流量进行标记,得到标记流量;
移动终端设置有多个检索桶,对于检索语句,都对应有流量进行数据转换,因此为了对检索语句进行统计,可以对检索语句的流量进行标记,得到标记流量。
S33:判断标记流量是否为搜索排序桶中的流量;
移动终端的搜索排序桶中设置有流量,而一般移动终端至少有一个排序桶,当用户的检索语句转换为标记流量时,需要对标记流量进行判断,判断标记流量是否为搜索排序桶中的流量。
通常可以通过layerId、expItemId或者expId与标记流量的标识进行匹配来进行判断,若匹配,则表示是搜索排序桶中的流量,则进入步骤S34,也即进入排序服务;若不匹配,则表示不是搜索排序桶中的流量,则进入步骤S35,也即进入默认排序服务。
当然,本领域技术人员可以通过本领域公知的其他方式对标记流量进行判断,具体此处不做限定。
请参阅图4,图4是图1中步骤S13之前一具体实施方式的流程示意图,具体包括如下步骤:
S41:获取点击指令选择排序结果中的搜索排序桶;
当标记流量进入到搜索排序桶中,则表示点击指令是选择了该搜索排序桶,而搜索排序桶与选择排序结果之间具备一定的索引关系,所以搜索排序桶可以是选择排序结果中的一个。也就意味着,该搜索排序桶可以通过点击指令进行关联。
S42:基于搜索排序桶,获取检索语句的流量标记对应的差异标签;
对于命中的搜索排序桶,移动终端可以执行基础策略以及测试策略,对于有差异的流量,会打上专属的标记,得到差异标签。并且获取检索语句的流量标记对应的差异标签。
S43:拼接差异标签至搜索排序桶的唯一识别码中。
通过一段时间的搜索,可以基于差异标签的数据进行计算,计算出响应的业务指标,从而得出哪个搜索策略更优秀。并且拼接差异标签至搜索排序桶的唯一识别码中,以便当信息进行盘点时,用于汇聚对比。
下文将结合具体的应用场景对本申请的触控检测方法进行详细描述。
目前,移动终端界面上设置有搜索框,当用户输入搜索词时,移动终端可以通过获取搜索命令所承载的关键字以及本身所附带的搜索策略等进行相对应的排序结果召回,也即从海量数据中筛选符合条件的条目的过程。
请参阅图5以及图6,图5是本申请的移动终端一实施例的整体方案的流程图,图6是本申请搜索策略的选择方法的系统构架图。结合当前全搜背景,ms_server(merger角色)从集团实验平台61获取到流量实验id信息后,会将待排序的卡片发送到排序服务(附带着流量标记)。排序服务会自检该流量标记是否命中了专属排序服务的实验桶62,如果命中,分别执行该排序服务实验桶62配置的基础策略,测试策略,如果两种策略间有差异,则打上一差异标签,随着基础策略的排序结果一块回传至ms_server,ms_server收集到差异标签的信息后会随着后端服务结果一并回传至前端65,前端在进行埋点落盘时会将tag信息一并落入。实验一段时间后统计实验指标时,需要过滤出带有差异标签的信息来进行汇聚对比。具体地,包括以下步骤:
S51:设置实验平台流量;
通常,通过在实验平台61中设置流量分桶,可以将流量分给不同的实验桶62中。假设分桶流量名为rank_base_1(20%)桶621、rank_test_1(20%)桶622、rank_base_2(20%)桶623以及rank_test_2(20%)桶624,其中实验平台可以通过layerId,expId,expItemId的形式传给后台服务的入库(ms)63。
S52:进入后台服务的入库合并;
ms通过实验平台61可以获取命中的实验集合,如果单卡则不把集合下发给排序服务器64,否则将实验集合下发给排序服务器64,排序服务器64根据实验ID来决定是否进行实验,实现实验流量分桶。
S53:卡片召回,搜索语句排序;
因为每个流量桶里均base策略以及test策略,所以当流量通里只有一种策略时,则不需要将集合下发给排序服务器64,而只有在流量桶里有两种策略时,才能在排序服务器中进行卡片召回,并对搜索语句排序,也即因为每一次搜索会被移动终端记录,当输入搜索语句时,可以进行搜索语句的排序,以供用户的选择。
S54:是否为实验流量且待排序卡片大于1;
排序服务根据当前流量的分桶id信息(即排序策略名),走不同的排序策略逻辑,因此需要对实验流量进行检测,看是否是属于流量桶中的流量,并且判断排序卡片大于1,若为实验流量且待排序卡片大于1,则进入步骤S55,也即进入排序服务;若不是实验流和/或待排序卡片小于或等于1,则进入步骤S57,也即发送前端。
S55:进入排序服务;
在进入排序服务的过程中,基于基础策略与测试策略之间的差异,每个实验桶对于检索语句的召回所得到的排序结果不一样,通常会有差异,若有差异,则可以对检索语句对应的流量进行标记。
如图6所示,值得注意的是,流量桶至少分为基础排序实验桶以及测试排序实验桶,且基础排序实验桶包括base策略以及test策略,测试排序实验桶也包括base策略以及test策略,只是每个实验桶中的base策略与其他实验桶中的base策略不同,同样每个实验桶中的test策略与其他实验桶中的test策略也不同,因此,当有排序有差时,对检索语句对应的流量打上配置的实验桶标记或唯一识别码,是非常有必要的,并且每个实验桶中返回base排序实际上是与实验桶本身的标记或唯一识别码相对应的,而不是与其他的实验桶的base排序相同。
比如base桶的base策略为A,test策略为B,而Test桶base策略为B,test策略为A,为了工程上实现方便,统一返回各个桶流量的base策略,即base桶返回策略A结果,test桶返回策略B结果。
具体地,请参阅图7,图7是步骤S55一具体实施例的流程示意图,具体包含以下步骤:
S551:排序服务器初始化;
排序服务器64中可能有多种排序策略,为避免其他可能存在的排序策略对现有的base策略以及test策略的影响,可以初始化排序服务器64。
S552:判断实验流量标记是否在当前策略中;
初始化后排序服务器64,将实验平台分好流量的实验桶62通过后台服务的入库存放在排序服务器64中,对于检索语句对应的实验流量进行标记,并判断实验流量的标记是否在当前策略中,若在,则进入步骤S553,也即获取当前实验流量对应的基础策略以及测试策略,以用于对检索语句进行召回,得到差异性的排序结果;若不在,则进入步骤S557,也即召回检索语句磨默认的排序结果。
S554:基础策略以及测试策略对应的排序是否有差异;
因为基础,测试排序有差异的会打上存在差异对应的流量标记,随着埋点日志一起落盘,定期统计指标时,值得注意的是,仅仅需要统计打上流量标记的那些流量。即只统计差异的那些数据,而常规的ABTest是统计所有的数据,故本申请实施例的选择方法具备高度的灵敏性。
S555:响应于排序对实验流量打上标签;
S556:召回需要的策略排序结果。
具体地,如示例1:
i.假设流量落进layerId_expId_expItemId_1,这个桶会发起两次请求(配置),假设使用的策略分别为基础(base),测试(test),如果这两个策略返回的排序结果有差异(diff),则打上layerId_expId_expItemId_1的前端埋点的差异标签(diffTag),如果排序结果无diff则不打标记,最后返回base策略的结果。
ii.假设流量落进layerId_expId_expItemId_2,这个桶会发起两次请求(配置),假设使用的策略分别为base,test,如果这两个策略返回的排序结果有diff,则打上layerId_expId_expItemId_2的前端埋点的diffTag,如果排序结果无diff则不打标记,返回基础策略的结果。
下面通过具体的返回策略进行举例示明:
比如说在搜索场景中,用户输入“打火机”,会召回非常多的结果,不同的排序策略(比如按照销量排,价格排,人气排等等)。而在当前的场景中,对于用户流量,首先我会将流量打散分桶(这个是流量分发平台的作用)。
比如base_bucket[0-20%]、test_bucket[20-40%]流量分配,每个桶各占20%,剩余为base流量。
在base_bucket中,base策略为价格排序,而test策略为人气排序;
在test_bucket中,base策略为人气排序,而test策略为价格排序。
假设输入“打火机”召回的商品按照价格排序的策略结果为A B C D E F G,而按照人气排序的策略结果为G F E D C B A,则落入base_bucket的流量,因为两个排序策略不一致,故打上diff_tag,也即对“打火机”这个用户请求,可以理解为该搜索query的流量打上差异标签,比如说“502”,然后返回base策略排序结果,其中,“502”是业务内部统一分配的标记,还比如说“503”,只要不和其他标记重复即可。
而落入test_bucket的流量,因为两个排序策略不一致,故打上diff_tag,比如说“503”,然后返回base策略排序结果,该tag会随着用户的点击商品等行为进入离线数据中。
在一段时间内比如以天为单位,搜索出打上diff_tag的数据,可以计算出响应的业务指标进行统计,进而得出哪个策略更优秀。比如说某一天diff_tag_502:搜索1w次,点击1k次,转化100次;diff_tag_503:搜索1w次,点击2k次,转化500次。
再比如:对于ABCDEFG顺序,用户点击了5次商品D,10次商品G,而对于GFEDCBA顺序,用户点击了50次D,80次G。该点击行为是根据排序差异的,假设手机位一屏幕只能展示7个商品ABCDEFG,将质量好且用户更加喜欢的商品排在前面,就更加容易触发用户点击,购买等行为,当然移动终端屏幕也可展示8个商品、9个商品,具体此处不做限定。
而在用户层面对排序差异并没有特别的体感,举个例子1000个用户同时搜“打火机”,根据流量分配比20%,会有200个用户进入base桶,200个用户进入test桶,对于base桶的用户来说,该用户看到的永远是ABCDEFG,对于test桶用户来说,该用户看到的永远是GFEDCBA。用户根本不用判断哪种策略,这种判断是在服务端,数据端进行的,用户并没有体感。
相较于传统ab实验,本申请方案是只统计有策略diff的流量,而传统的ab只是在流量分配层面,粒度比较粗。因为只统计有策略diff的流量,所以即使测试策略影响面为1%,或者0.1%,也会捕获到,具备高度的灵敏性。而传统的ab因为统计的力度过大,自身的波动就会把测试策略的影响面给覆盖掉。
S56:获取排序返回差异标签并拼接至实验桶标识中;
ms获取排序服务回传的diffTag字段(如果流量桶base,test无diff或者命中default,该字段是空值),统一回传给前端65。
S57:发送前端。
然后ms将排序服务器64返回的差异标签(差异标签可为空)回传到前端65埋点落日志。
因此只针对那些算法策略覆盖到的且产生diff的流量来做abTest,更加精准的缩小了实验流量的范围。因为只针对有diff的流量做实验,所以非常的高灵敏,假设该策略的影响面为整体流量的千分之一或者万分之一,也能够精准的捕获与效果的放大。
请参阅图8,图8是本申请的移动终端一实施例的示意框图。本申请实施例提供了一种移动终端7,包括:
获取模块71,用于获取用户输入的检索语句;
判断模块72,连接获取模块71,用于利用基础策略和测试策略对检索语句进行差异性判断,得到有差异的排序结果,基础策略为当前服务器原有的搜索排序策略,测试策略为新增的搜索排序策略;
选择模块73,连接判断模块72,用于通过排序结果选择需要的搜索策略。
因此,本申请针对目前搜索策略覆盖面相对较大的问题,通过利用基础策略和测试策略对检索语句进行差异性判断,将覆盖面影响较小的查询语句进行提取以灵敏捕捉查询语句细小的差别,将有差异的排序结果进行排序以实现选择需要的搜索策略。因此通过上述方式,能够有效地捕捉排序影响覆盖面较小的搜索策略,灵活支持不同影响面的搜索策略。
进一步地,请参见图9,图9是本申请移动终端另一实施例的示意图。本申请实施例提供一种移动终端8,包括:处理器81、存储器82以及存储在存储器中并在处理器上运行的计算机程序821,处理器81用于执行计算机程序821以实现本申请实施例第一方面提供的方法的步骤,在此不再赘述。
请参阅图10,图10是本申请的计算机可读存储介质一实施例的示意框图。如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在计算机可读存储介质200中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储装置中,包括若干指令(计算机程序201)用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本申请各个实施方式方法的全部或部分步骤。而前述的存储装置包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种介质以及具有上述存储介质的电脑、手机、笔记本电脑、平板电脑、相机等电子设备。
关于计算机可读存储介质中的计算机程序的执行过程的阐述可以参照上述本申请移动终端8的控制方法实施例中阐述,在此不再赘述。
请参阅图11,图11是本申请移动终端的硬件架构的示意框图,该移动终端900可以为手机、平板电脑以及笔记本电脑以及头戴式设备等,本实施例图示以手机为例。该移动终端900的结构可以包括射频(radio frequency,RF)电路910、存储器920、输入单元930、显示单元940、传感器950、音频电路960、WiFi(wireless fidelity)模块970、处理器980以及电源990等。其中,RF电路910、存储器920、输入单元930、显示单元940、传感器950、音频电路960以及WiFi模块970分别与处理器980连接;电源990用于为整个可穿戴设备900提供电能。
具体而言,RF电路910用于接发信号;存储器920用于存储数据指令信息;输入单元930用于输入信息,具体可以包括触控面板931以及操作按键等其他输入设备932;显示单元940则可以包括显示面板等;传感器950包括红外传感器、激光传感器等,用于检测用户接近信号、距离信号等;扬声器961以及传声器(或者麦克风)962通过音频电路960与处理器980连接,用于接发声音信号;WiFi模块970则用于接收和发射WiFi信号,处理器980用于处理移动终端的数据信息。
以上所述仅为本申请的部分实施例,并非因此限制本申请的保护范围,凡是利用本申请说明书及附图内容所作的等效装置或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。
Claims (10)
1.一种搜索策略的选择方法,其特征在于,所述选择方法包括:
获取用户输入的检索语句;
利用基础策略和测试策略对所述检索语句进行差异性判断,得到有差异的排序结果,所述基础策略为当前服务器原有的搜索排序策略,所述测试策略为新增的搜索排序策略;
通过所述排序结果选择需要的搜索策略。
2.根据权利要求1所述的选择方法,其特征在于,所述利用基础策略和测试策略对所述检索语句进行差异性判断,得到有差异的排序结果,包括:
利用所述基础策略对所述检索语句进行召回,得到第一排序结果,以及利用所述测试策略对所述检索语句进行召回,得到第二排序结果;
判断所述第一排序结果和所述第二排序结果是否有差异;
若有差异,则对所述检索语句打上差异标签,以得到有差异的排序结果;
若无差异,则排除所述检索语句对应的流量数据。
3.根据权利要求2所述的选择方法,其特征在于,所述利用所述基础策略对所述检索语句进行召回,得到第一排序结果,包括:
请求配置所述基础策略;
利用所述基础策略对所述检索语句进行召回,得到所述第一排序结果;
所述利用所述测试策略对所述检索语句进行召回,得到第二排序结果,包括:
请求配置所述测试策略;
利用所述测试略对所述检索语句进行召回,得到所述第二排序结果。
4.根据权利要求2所述的选择方法,其特征在于,所述对所述检索语句打上差异标签,以得到有差异的排序结果,包括:
对所述检索语句的流量标记打上差异标签;
返回所述基础策略对应的排序结果作为所述有差异的排序结果。
5.根据权利要求1所述的选择方法,其特征在于,所述利用基础策略和测试策略对所述检索语句进行差异性判断之前,还包括:
对平台流量进行分发或设置,得到至少一个搜索排序桶,其中,每个所述搜索排序桶均有唯一识别码;
对所述检索语句的流量进行标记,得到标记流量;
判断所述标记的流量是否为所述搜索排序桶中的流量;
若是,则进入排序服务。
6.根据权利要求5所述的选择方法,其特征在于,所述通过所述排序结果选择用户中意的搜索策略之前,还包括:
获取点击指令选择所述排序结果中的所述搜索排序桶;
基于所述搜索排序桶,获取所述检索语句的流量标记对应的所述差异标签;
拼接所述差异标签至所述搜索排序桶的所述唯一识别码中。
7.根据权利要求1~6任一项所述的选择方法,其特征在于,
所述测试策略的影响面占比小于或等于5%。
8.一种移动终端,其特征在于,包括:
获取模块,用于获取用户输入的检索语句;
判断模块,连接所述获取模块,用于利用基础策略和测试策略对所述检索语句进行差异性判断,得到有差异的排序结果,所述基础策略为当前服务器原有的搜索排序策略,所述测试策略为新增的搜索排序策略;
选择模块,连接所述判断模块,用于通过所述排序结果选择需要的搜索策略。
9.一种移动终端,其特征在于,包括:处理器和存储器,所述存储器中存储有计算机程序,所述处理器用于执行所述计算机程序以实现权利要求1-7中任一项所述的选择方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序能够被处理器执行时实现如权利要求1-7中任一项所述的选择方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010963295.8A CN112115340A (zh) | 2020-09-14 | 2020-09-14 | 搜索策略的选择方法、移动终端以及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010963295.8A CN112115340A (zh) | 2020-09-14 | 2020-09-14 | 搜索策略的选择方法、移动终端以及可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112115340A true CN112115340A (zh) | 2020-12-22 |
Family
ID=73803049
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010963295.8A Withdrawn CN112115340A (zh) | 2020-09-14 | 2020-09-14 | 搜索策略的选择方法、移动终端以及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112115340A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115049327A (zh) * | 2022-08-17 | 2022-09-13 | 阿里巴巴(中国)有限公司 | 数据处理方法、装置、电子设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107704467A (zh) * | 2016-08-09 | 2018-02-16 | 百度在线网络技术(北京)有限公司 | 搜索质量评估方法及装置 |
CN109614515A (zh) * | 2018-10-30 | 2019-04-12 | 北京奇艺世纪科技有限公司 | 视频搜索评价方法和系统 |
CN109857856A (zh) * | 2019-01-28 | 2019-06-07 | 北京合享智慧科技有限公司 | 一种文本的检索排序确定方法及系统 |
CN110727865A (zh) * | 2019-10-09 | 2020-01-24 | 北京百度网讯科技有限公司 | 检索策略的问题定位方法、装置、电子设备及存储介质 |
-
2020
- 2020-09-14 CN CN202010963295.8A patent/CN112115340A/zh not_active Withdrawn
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107704467A (zh) * | 2016-08-09 | 2018-02-16 | 百度在线网络技术(北京)有限公司 | 搜索质量评估方法及装置 |
CN109614515A (zh) * | 2018-10-30 | 2019-04-12 | 北京奇艺世纪科技有限公司 | 视频搜索评价方法和系统 |
CN109857856A (zh) * | 2019-01-28 | 2019-06-07 | 北京合享智慧科技有限公司 | 一种文本的检索排序确定方法及系统 |
CN110727865A (zh) * | 2019-10-09 | 2020-01-24 | 北京百度网讯科技有限公司 | 检索策略的问题定位方法、装置、电子设备及存储介质 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115049327A (zh) * | 2022-08-17 | 2022-09-13 | 阿里巴巴(中国)有限公司 | 数据处理方法、装置、电子设备及存储介质 |
CN115049327B (zh) * | 2022-08-17 | 2022-11-15 | 阿里巴巴(中国)有限公司 | 数据处理方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9665596B2 (en) | Data access based on content of image recorded by a mobile device | |
Guo et al. | FlierMeet: a mobile crowdsensing system for cross-space public information reposting, tagging, and sharing | |
CN101563691B (zh) | 用于在搜索结果中包括集合项目的技术 | |
CN100517311C (zh) | 用于对多意义查询的相关术语提议的方法、系统及计算装置 | |
CN110956547A (zh) | 一种基于搜索引擎的实时识别欺诈团伙的方法及系统 | |
CN109165975B (zh) | 标签推荐方法、装置、计算机设备及存储介质 | |
KR101452082B1 (ko) | 리서치 미션 식별 | |
CN101479728A (zh) | 视觉以及多维搜索 | |
CN108701155A (zh) | 社交网络中的专家检测 | |
CN102143220A (zh) | 通过关联服务器信息来发现物理服务器位置的方法和系统 | |
CN110245293B (zh) | 一种网络内容召回方法和装置 | |
CN101542466A (zh) | 用于提供图像处理以追踪数字信息的方法和系统 | |
CN109165292A (zh) | 数据处理方法、装置以及移动终端 | |
CN105706081A (zh) | 结构化信息链接注释 | |
CN112115340A (zh) | 搜索策略的选择方法、移动终端以及可读存储介质 | |
CN108197105A (zh) | 自然语言处理方法、装置、存储介质及电子设备 | |
CN110019813A (zh) | 寿险案例检索方法、检索装置、服务器及可读存储介质 | |
CN113763057A (zh) | 用户身份画像的数据处理方法和装置 | |
CN111046082A (zh) | 数据源的确定方法、装置、服务器和存储介质 | |
CN116450384A (zh) | 一种信息处理方法和相关装置 | |
CN109408713B (zh) | 一种基于用户反馈信息的软件需求检索系统 | |
CN111476028A (zh) | 一种汉语短语识别方法、系统、存储介质及电子设备 | |
CN111859240A (zh) | 一种图片导出的方法、相关装置及存储介质 | |
CN112312590A (zh) | 一种设备通信协议识别方法和装置 | |
KR102213191B1 (ko) | 행동 데이터 기반 정보 제공 장치 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20201222 |
|
WW01 | Invention patent application withdrawn after publication |