CN113886685B - 一种搜索方法、装置、存储介质及电子设备 - Google Patents
一种搜索方法、装置、存储介质及电子设备 Download PDFInfo
- Publication number
- CN113886685B CN113886685B CN202111113411.8A CN202111113411A CN113886685B CN 113886685 B CN113886685 B CN 113886685B CN 202111113411 A CN202111113411 A CN 202111113411A CN 113886685 B CN113886685 B CN 113886685B
- Authority
- CN
- China
- Prior art keywords
- search
- feature
- determining
- weight
- search result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9538—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本说明书公开了一种搜索方法、装置、存储介质及电子设备。在本说明书提供的搜索方法中,获取每个搜索结果与搜索内容原始的匹配度。确定了与搜索内容对应的预设的搜索特征,并根据搜索特征与搜索结果的热度得确定了每个搜索特征对每个搜索结果的调整权重。根据调整权重对每个搜索结果与搜索内容的匹配度进行调整,并使用调整后的匹配度得到更加合理的排序结果。从上述方法中可以看出,在确定了各搜索结果与搜索内容的匹配度之外,本方法还在对搜索结果排序的过程中加入搜索特征,并根据搜索特征对匹配度进行优化调整,最终得到一个更加合理,更能满足用户需求的搜索结果排序。
Description
技术领域
本说明书涉及互联网应用技术领域,尤其涉及一种搜索方法、装置、存储介质及电子设备。
背景技术
如今,生活中各方面的数据都随着互联网的发展而膨胀,这使每天出现在互联网上的信息量变得巨大。目前,使用搜索引擎已成为人们最常用的获取信息的手段,但人们在使用搜索引擎时,往往只会关注搜索结果的前几条,而过于庞大的信息量经常会导致搜索引擎将用户真正想要的信息排在很靠后的位置,用户可能会花费大量的时间来寻找自己想要的信息。
在现有技术中,搜索引擎采用的最佳匹配25(Best Match 25,BM25)算法是一种只根据搜索文本相似度对搜索结果进行排序的算法,这种算法排序后得到的结果往往并不是用户真正需要的结果。如果出现了多个关键词相同的词条,BM25算法也只会根据关键词在词条文档内容中的词频对搜索结果进行排序。
在实际搜索时,搜索引擎根据BM25算法返回的结果很可能会将用户真正想要的信息排在很靠后的位置。也就是说,目前的搜索引擎采用的算法不能对搜索结果进行智能排序,将用户想要的结果呈现在靠前的位置。
发明内容
本说明书提供一种搜索方法、装置及计算机存储介质和无人设备,用于解决现有技术存在的上述问题。
本说明书采用下述技术方案:
本说明书提供了一种搜索方法,包括:
获取用户输入的搜索内容;
根据所述搜索内容查询搜索结果,并确定每个搜索结果与所述搜索内容的匹配度;
确定当前的环境信息,根据所述搜索内容以及所述环境信息,确定与所述搜索内容和所述环境信息相关的搜索特征;
针对每个搜索结果,根据所述搜索特征,确定该搜索结果相对于所述搜索特征的调整权重;
采用所述调整权重调整该搜索结果与所述搜索内容的匹配度;
根据调整后的各搜索结果与所述搜索内容的匹配度,对各搜索结果进行排序,并向用户返回排序后的各搜索结果。
可选的,所述搜索内容包括:文本;
所述当前的环境信息包括:用户输入所述搜索内容时的时间和/或地理位置;
根据所述搜索内容以及所述环境信息,确定与所述搜索内容和所述环境信息相关的搜索特征,具体包括:
对所述搜索内容进行分词,得到所述搜索内容中包含的各关键词;
根据预设的各搜索特征与关键词的对应关系、各搜索特征与环境信息的对应关系,在预设的各搜索特征中,确定与所述用户输入的搜索内容中包含的关键词以及所述当前的环境信息对应的搜索特征。
可选的,根据所述搜索特征,确定该搜索结果相对于所述搜索特征的调整权重,具体包括:
针对每个搜索特征,确定当前该搜索特征的特征权重;
根据该搜索特征的特征权重,确定该搜索特征与该搜索结果的相关性表征值;
根据当前每个搜索特征的特征权重以及每个搜索特征与该搜索结果的相关性表征值,确定该搜索结果相对于各搜索特征的调整权重。
可选的,该搜索特征的特征权重是按照指定周期确定的;
确定当前该搜索特征的特征权重,具体包括:
查找最近确定出的该搜索特征的特征权重,作为当前该搜索特征的特征权重。
可选的,根据该搜索特征的特征权重,确定该搜索特征与该搜索结果的相关性表征值,具体包括:
确定从预设历史时刻到当前时刻的时间段;
获取该时间段中每个指定时刻的该搜索特征的特征权重,确定由每个指定时刻的该搜索特征的特征权重构成的特征权重向量;并,获取该时间段中每个指定时刻的该搜索结果的热度,确定由每个指定时刻的该搜索结果的热度构成的热度向量;
根据所述特征权重向量和所述热度向量,确定该搜索特征与该搜索结果的相关性表征值。
可选的,根据当前每个搜索特征的特征权重以及每个搜索特征与该搜索结果的相关性表征值,确定该搜索结果相对于各搜索特征的调整权重,具体包括:
针对每个搜索特征,根据当前该搜索特征的特征权重以及该搜索特征与该搜索结果的相关性表征值,确定该搜索结果相对于该搜索特征的调整权重;
确定该搜索结果相对于每个搜索特征的调整权重之和,作为该搜索结果相对于各搜索特征的调整权重。
可选的,确定该搜索结果相对于每个搜索特征的调整权重之和,作为该搜索结果相对于各搜索特征的调整权重,具体包括:
在各搜索特征中,确定与该搜索结果的相关性表征值大于设定阈值的搜索特征,作为指定搜索特征;
确定该搜索结果相对于每个指定搜索特征的调整权重之和,作为该搜索结果相对于各搜索特征的调整权重。
本说明书提供的一种搜索的装置,所述装置包括:
获取模块,获取用户输入的搜索内容;
查询模块,根据所述搜索内容查询搜索结果,并确定每个搜索结果与所述搜索内容的匹配度;
搜索特征确定模块,确定当前的环境信息,根据所述搜索内容以及所述环境信息,确定与所述搜索内容和所述环境信息相关的搜索特征;
调整权重确定模块,针对每个搜索结果,根据所述搜索特征,确定该搜索结果相对于所述搜索特征的调整权重;
调整模块,采用所述调整权重调整该搜索结果与所述搜索内容的匹配度;
排序模块,根据调整后的各搜索结果与所述搜索内容的匹配度,对各搜索结果进行排序,并向用户返回排序后的各搜索结果。
本说明书提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述搜索方法。
本说明书提供了一种无人设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述搜索方法。
本说明书采用的上述至少一个技术方案能够达到以下有益效果:
在本说明书提供的搜索方法中,获取每个搜索结果与搜索内容原始的匹配度。确定了与搜索内容对应的预设的搜索特征,并根据搜索特征与搜索结果的热度得确定了每个搜索特征对每个搜索结果的调整权重。根据调整权重对每个搜索结果与搜索内容的匹配度进行调整,并使用调整后的匹配度得到更加合理的排序结果。从上述方法中可以看出,在确定了各搜索结果与搜索内容的匹配度之外,本方法还在对搜索结果排序的过程中加入搜索特征,并根据搜索特征对匹配度进行优化调整,最终得到一个更加合理,更能满足用户需求的搜索结果排序。
附图说明
此处所说明的附图用来提供对本说明书的进一步理解,构成本说明书的一部分,本说明书的示意性实施例及其说明用于解释本说明书,并不构成对本说明书的不当限定。在附图中:
图1为本说明书提供的一种搜索方法的流程示意图;
图2为本说明书提供的一种搜索装置的结构示意图;
图3为本说明书提供的对应于图1的电子设备示意图。
具体实施方式
在现有技术中,服务器在获取用户的搜索内容后,会将搜索内容拆分为多个关键词,并为每个关键词分配权重,以此基础进行索引与排序。目前,搜索引擎采用的BM25算法有三个主要参数:包含关键词的搜索结果数、关键词在用户搜索内容中的词频以及关键词在每个搜索结果中的词频。BM25算法会依据上述参数对搜索出的每一个搜索结果进行打分,该分数称为文本相似度。其中,包含某个关键词的搜索结果数越少,就表明该关键词的区分度越高,该关键词所占的权重就越高;关键词在用户搜索内容中的词频越高,就表明该关键词在本次搜索中的重要程度越高,该关键词所占的权重也就越高;关键词在一个搜索结果中的词频越高,就表明该搜索结果与关键词的相关度越高,对该搜索结果针对该关键词的打分也会越高。最后根据每个搜索结果的分数对各搜索结果进行排序,分数越高排序越靠前,并将结果返回给用户。
从上述打分方法中可以看出,BM25算法打分所依据的三个参数都是基于用户搜索内容的文本得到的。换句话说,BM25算法是一种不会考虑任何其他因素,只单纯依靠文本进行排序的算法。用户在搜索时通常只会关注搜索结果的前几个内容,上述排序方法往往满足不了用户的需求。在大多数情况下,用户在搜索时还会受到很多其他因素的影响。在不同环境、不同背景下,用户输入相同的搜索内容想要获得的搜索结果往往是不同的。这时,BM25算法排序得到的搜索结果是无法令人满意的。
而本说明书实施例提供的搜索方法额外考虑了环境因素对搜索的影响,这种方法能够根据用户搜索时所处的具体背景与环境对索结果的排序进行优化,大大提高了将用户真正想要的搜索结果排在前面的概率。
为使本说明书的目的、技术方案和优点更加清楚,下面将结合本说明书具体实施例及相应的附图对本说明书技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
以下结合附图,详细说明本说明书各实施例提供的技术方案。
图1为本说明书中一种搜索方法的流程示意图,具体包括以下步骤:
S100:获取用户输入的搜索内容。
在实际应用中,用户使用搜索引擎时,会根据自身的需求向搜索引擎输入一段内容,也就是搜索内容。具体的,用户可在终端上输入搜索内容,终端则将该搜索内容发送给提供搜索服务的服务器,服务器可获取该搜索内容,并基于该搜索内容进行后续的搜索。
本说明书中提到的搜索内容可以包括文本、音频以及图像。
S102:根据所述搜索内容查询搜索结果,并确定每个搜索结果与所述搜索内容的匹配度。
服务器在获取到搜索内容后,首先要以搜索内容为依据进行查询,找到所有与该搜索内容有关的搜索结果。同时,服务器会获取每个搜索结果与获取到的搜索内容的匹配度。具体的,服务器根据搜索内容查询搜索结果,以及确定每个搜索结果与搜索内容的匹配度的方法可以与现有技术相同,例如,在确定一个搜索结果与搜索内容的匹配度时,可用BM25算法得到该搜索结果与搜索内容的文本相似度,并采用上述文本相似度作为该搜索结果与搜索内容的匹配度。本说明书对服务器查询搜索结果以及确定每个搜索结果与搜索内容的匹配度的方法不做限制。
S104:确定当前的环境信息,根据所述搜索内容以及所述环境信息,确定与所述搜索内容和所述环境信息相关的搜索特征。
在实际搜索时,除了搜索内容以外,还会有很多其他因素会影响用户的搜索意图,进而成为影响搜索结果排序的潜在因素。因此,为了得到更加合理、更能满足用户需求的排序,需要将这些因素也考虑进排序的过程中,使其影响搜索结果最终的排序。为了给出更清楚、简洁的说明,本说明书将影响搜索结果排序的因素定义为搜索特征。
在一实施例中,搜索特征可以是预先设定的,并且还可以预先设定每个搜索特征与每个搜索结果的对应关系,一个搜索结果可对应于一个或两个以上的搜索特征,一个搜索特征也可对应于一个或两个以上的搜索结果。
在实际应用中,用户的搜索意图很有可能会被环境所影响。因此,搜索特征可以从搜索内容和/或各种环境因素中提取出来。处于不同时间、地点的用户,往往也会出于不同的目的进行搜索,而这些时间及地点的信息,就是提取搜索特征的关键。
具体的,搜索特征可以分为由搜索内容决定的搜索特征和由当前环境信息决定的搜索特征。其中,当前环境信息包括但不限于用户输入搜索内容时的时间和/或地理位置。
当用户输入的搜索内容为文本时,根据搜索内容以及当前环境信息,确定与所述搜索内容和所述环境信息相关的搜索特征,具体为,对搜索内容进行分词,得到搜索内容中包含的各关键词,根据预设的各搜索特征与关键词的对应关系、各搜索特征与环境信息的对应关系,在预设的各搜索特征中,确定与用户输入的搜索内容中包含的关键词以及所述当前的环境信息对应的搜索特征。
在一实施例中,与关键词对应的搜索特征可以是与关键词相同的搜索特征,即关键词本身;也可以是服务器结合历史数据信息与至少一个关键词后确定出的相关搜索特征。
例如,如果用户向搜索引擎中输入“中国的首都”,那么服务器会直接从用户输入的文本中拆词获取“中国”和“首都”两个关键词,如果预设的搜索特征中同样包括“中国”和“首都”,预设的对应关系为上述两个搜索特征与服务器分词获取的关键词相同,则可将这两个关键词本身直接当作本次搜索的两个搜索特征。同时,结合用户输入的该搜索内容以及历史数据信息,服务器可能检索到,“中国”和/或“首都”经常和“旅游”同时出现。由此,服务器可能会推测出用户想要去旅游,因此也会得到“旅游”这一搜索特征。
在一实施例中,与时间对应的搜索特征可以是具体的一个时刻和/或一个特定的时间段。需要说明的是,特定的时间段可包括具体的一天。其中,一天既可以指代节日,例如“国庆节”、“元旦”等;也可以指代具有特殊意义的日期,例如“双十一”等。
例如,如果用户在2021年8月14日16点30分使用搜索引擎进行搜索,那么服务器可以得到与时间对应的搜索特征可以是“16点30分”这一具体时刻,也可以是“16点-17点”这一时间段,还可以是“2021年8月14日”这一天。同时,服务器还可以从日期判断出当天是七夕,在预设对应关系中,与时间对应的搜索特征可以是指代节日的一天,因此服务器可以通过当天是七夕来得到“七夕”这一搜索特征。
在一实施例中,与地理位置对应的搜索特征可以是国家、城市、地标以及具体的经纬度。
例如,如果用户在北京朝阳大悦城内打开搜索引擎进行搜索,那么服务器可以得到与地理位置对应的搜索特征可以是“中国”,可以是“北京”,可以是“朝阳大悦城”,也可以是“东经116°52′,北纬39°22′”。
需要说明的是,上述所有实施例中,根据用户输入的搜索内容以及当前的环境信息,可获得一个或两个以上的搜索特征。进一步的,上述所有实施例可以结合使用。
S106:针对每个搜索结果,根据所述搜索特征,确定该搜索结果相对于所述搜索特征的调整权重。
对于一次搜索来说,服务器通过上述步骤S104可得到若干搜索特征。一般情况下,每个搜索特征对同一个搜索结果的影响都是不一样的,不同搜索特征需要分别考虑。因此,本说明书将一个搜索特征对一个搜索结果排序的具体影响程度定义为该搜索特征对该搜索结果的调整权重。需要说明的是,得到调整权重的方法并不唯一,只要能合理反映出搜索特征与搜索结果之间的关系即可。
本说明书中,调整权重主要受到两个因素影响:特征权重与相关性表征值。
对于特征权重来说,具体的,针对每个搜索特征,确定当前该搜索特征的特征权重。其中,该搜索特征的特征权重是按照指定周期确定的;则确定当前该搜索特征的特征权重时,可查找最近确定出的该搜索特征的特征权重,作为当前该搜索特征的特征权重。
其中,上述的特征权重指一个搜索特征当前对搜索结果受关注度的影响程度。同一个搜索特征,在不同环境下,对搜索结果的影响往往并不相同。举例来说,在七夕前后,“七夕”这一搜索特征就会有比较大的特征权重,并且越靠近七夕,特征权重越大,在七夕当天达到最大,对搜索结果的影响也就越大。在其他时间里,“七夕”这一搜索特征就不会对搜索结果产生太大影响,特征权重就会很低。也正因如此,每个搜索特征的特征权重都需要根据其特性周期性的重新确定。
对于相关性表征值来说,一个搜索特征的影响范围是有限的,不可能会影响到所有搜索结果。因此,本说明书将一个搜索特征与一个搜索结果之间相关程度的大小定义为相关性表征值。一个搜索特征与一个搜索结果之间的相关性表征值越大,表明二者之间的相关程度越高,该搜索结果也就更倾向于被该搜索特征所影响;反之,则该搜索结果就更倾向于不被该搜索特征所影响。在确定该搜索特征与该搜索结果的相关性表征值时,可根据该搜索特征的特征权重,确定该搜索特征与该搜索结果的相关性表征值。
具体的,可确定从预设历史时刻到当前时刻的时间段,获取该时间段中每个指定时刻的该搜索特征的特征权重,确定由每个指定时刻的该搜索特征的特征权重构成的特征权重向量,并获取该时间段中每个指定时刻的该搜索结果的热度,确定由每个指定时刻的该搜索结果的热度构成的热度向量。其中,该搜索结果的热度可通过统计一个指定时间段内该搜索结果的点击量来确定。根据所述特征权重向量和所述热度向量,确定该搜索特征与该搜索结果的相关性表征值。
例如,可以通过过去14天内搜索特征“七夕”的特征权重和搜索结果“鲜花”的热度来确定当前时刻该搜索特征与该搜索结果的相关性表征值。获取过去14天内每天0点时“七夕”的特征权重,得到14个特征权重值,按时间先后顺序,对应时刻早的特征权重排在前,对应时刻晚的特征权重排在后,组成一个特征权重向量。同样的,获取过去14天内每天0点时“鲜花”的热度,得到14个热度值,按时间先后顺序,对应时刻早的热度排在前,对应时刻晚的数热度在后,组成一个热度向量。其中,搜索结果“鲜花”的热度可以通过统计一天内该搜索结果的点击量来确定。用皮尔逊积矩相关系数公式计算上述两向量之间的相关系数,作为“七夕”与“鲜花”的相关性表征值,具体公式如下:
其中,n为向量的维度,在本例中为14;
ai为搜索特征“七夕”的特征权重向量中的第i个元素,bi为搜索结果“鲜花”的热度向量中的第i个元素;
由上式可以算出搜索特征“七夕”的特征权重和搜索结果“鲜花”的热度在过去14天内的皮尔逊积矩相关系数,即相关性表征值。该相关性表征值越大,表明过去14天内搜索特征“七夕”对搜索结果“鲜花”的影响力越强,则可认为当前时刻下搜索特征“七夕”与搜索结果“鲜花”之间的相关性越高。
同样的,在不同环境下,同一搜索特征与同一搜索结果之间的相关程度也有可能不同。因此,相关性表征值也可周期性的更新。
采用上述方法确定出当前每个搜索特征的特征权重以及每个搜索特征与每个搜索结果之间的相关性表征值后,则可根据当前每个搜索特征的特征权重以及每个搜索特征与该搜索结果的相关性表征值,确定每个搜索结果相对于各搜索特征的调整权重。
S108:采用所述调整权重调整该搜索结果与所述搜索内容的匹配度。
根据得到的每个搜索结果的调整权重,对每个搜索结果的匹配度进行调整,得到优化后每个搜索结果与搜索内容的匹配度。此时的匹配度是结合了搜索特征以及搜索结果热度后得到的,能够更好的反映出除开文本相似度以外的其他因素对搜索结果的影响程度。
具体的,采用调整权重调整该搜索结果与搜索内容的匹配度时,可采用如下公式:
newscore=oldscore×ln(e+0.1×调整权重)
调整权重=特征权重×相关性表征值
其中,oldscore表示步骤S102中得到的匹配度,newscore表示步骤S108中根据调整权重调整后的匹配度。
S110:根据调整后的各搜索结果与所述搜索内容的匹配度,对各搜索结果进行排序,并向用户返回排序后的各搜索结果。
此时,服务器端不再仅根据文本相似度对搜索结果进行排序,而是使用调整后的搜索结果与搜索内容的匹配度对搜索结果进行排序。具体的,可按照匹配度从高到底的顺序对搜索结果进行排序,搜索结果与搜索内容的匹配度越高,则该搜索结果最终的排序越靠前。将排序后的搜索结果返回到用户终端上后,用户可得到经过综合考虑了各方面因素对用户搜索意图的影响后得出的更加合理的排序,能够更好的满足用户的需求。
现有的BM25算法只能根据搜索结果与搜索内容的文本相似度对搜索结果进行排序。大多数情况下,用户的搜索意图往往不只在搜索内容层面。可以看出,现有技术完全没有考虑到除搜索内容外的其他任何可能会影响到用户搜索意图的因素。因此,现有技术给出的搜索结果排序往往有些不尽人意,用户需要花费大量时间在找到自己想要的搜索结果上。而本说明书中的方法提出了搜索特征的概念,将所有可能会影响到用户搜索意图的因素转化为可能会影响到排序的因素,并采用合理的方法将它们加入到排序的过程中。由此,本说明书中的方法可以得到更加符合用户需求的搜索结果排序,为用户省去大量寻找目标搜索结果的时间。
另外,在上述步骤S106中,确定出当前每个搜索特征的特征权重以及每个搜索特征与每个搜索结果之间的相关性表征值后,在确定每个搜索结果相对于各个搜索特征的调整权重时,具体可针对每个搜索特征,根据当前该搜索特征的特征权重以及该搜索特征与该搜索结果的相关性表征值,确定该搜索结果相对于该搜索特征的调整权重;确定该搜索结果相对于每个搜索特征的调整权重之和,作为该搜索结果相对于各搜索特征的调整权重。
其中,在各搜索特征中,确定与该搜索结果的相关性表征值大于设定阈值的搜索特征,作为指定搜索特征;确定该搜索结果相对于每个指定搜索特征的调整权重之和,作为该搜索结果相对于各搜索特征的调整权重。
如果在获取调整权重时把所有搜索特征对于所有搜索结果的调整结果都获取一次,那么数据量将会非常巨大,同时也会获取到许多无意义的数据。当一个搜索特征和一个搜索结果相关性表征值很低时,完全可以将其忽略,不纳入考虑。因此,在计算相关性表征值前,可以根据需求人为设定一个阈值,如设定该阈值为0.8。如果一个搜索特征与一个搜索结果的相关性表征值大于该阈值,则可认为在当前时刻下,该搜索特征与该搜索结果是相关的。将与一个搜索结果相关的所有搜索特征作为该搜索结果的指定搜索特征。
大多数情况下,一个搜索结果会被多个搜索特征所影响。此时,每一个影响该搜索结果的搜索特征都会有一个针对该搜索结果的调整权重。当一个搜索结果被越多的搜索特征所影响时,其被调整到更靠前的排序的可能性自然会越大。因此,针对一个搜索结果,本说明书将所有该搜索结果的指定搜索特征对该搜索结果的调整权重之和,作为该搜索结果的调整权重。
例如,搜索结果X经过上述方法确定出4个指定搜索特征A、B、C、D。4个指定搜索特征A、B、C、D对于搜索结果X的调整权重分别为a、b、c、d。则搜索结果X的总调整权重可以确定为a+b+c+d。
以上是以用户输入的搜索内容为文本为例进行说明的,当用户输入的搜索内容为音频时,如果该音频为语音,则服务器可将该语音转换为文字,并执行与上述文本搜索内容相同的后续步骤;如果该音频为非语音,则服务器可以通过提取其频域信息等方法来处理该音频,并根据提取的频域信息与搜索特征的对应关系来确定搜索特征。具体的,可以预先设置标准频域信息,以及各标准频域信息与搜索特征的对应关系,在获取到从音频中提取的频域信息后,可通过模糊匹配等方法,找到标准频域信息中与该音频中提取的频域信息相似度较高的一个或两个以上的标准频域信息,并获取找到的标准频域信息所对应的搜索特征作为本次搜索的搜索特征。
当用户输入的搜索内容为图像时,服务器可以识别图像上的目标物,并根据每个目标物与搜索特征的对应关系来确定搜索特征。具体的,可以针对每个目标物预设对应的搜索特征,当服务器识别出一个或两个以上目标物时,则可将识别到的目标物对应的搜索特征作为本次搜索的搜索特征。例如,用户输入的图像上包含“猫”、“汽车”,在预设搜索特征时,目标物“猫”的搜索特征有“猫”和“宠物”,目标物“汽车”的搜索特征有“汽车”和“交通工具”则服务器从图像中识别出上述目标物后,即可根据上述对应关系获得“猫”、“宠物”、“汽车”、“交通工具”这些搜索特征。如果图像中包含文字信息,则服务器还可提取该图像中的文字信息,并执行与上述文本搜索内容相同的后续步骤。
以上是本说明书提供的搜索方法,基于同样的思路,本说明书还提供了相应的搜索装置,如图2所示。
图2为本说明书提供的一种搜索装置示意图,具体包括:
获取模块200,获取用户输入的搜索内容;
查询模块202,根据所述搜索内容查询搜索结果,并确定每个搜索结果与所述搜索内容的匹配度;
搜索特征确定模块204,确定当前的环境信息,根据所述搜索内容以及所述环境信息,确定与所述搜索内容和所述环境信息相关的搜索特征;
调整权重确定模块206,针对每个搜索结果,根据所述搜索特征,确定该搜索结果相对于所述搜索特征的调整权重;
调整模块208,采用所述调整权重调整该搜索结果与所述搜索内容的匹配度;
排序模块210,根据调整后的各搜索结果与所述搜索内容的匹配度,对各搜索结果进行排序,并向用户返回排序后的各搜索结果。
在一可选的实施例:
所述搜索内容包括:文本;
所述当前的环境信息包括:用户输入所述搜索内容时的时间和/或地理位置;
所述搜索特征确定模块204,具体用于对所述搜索内容进行分词,得到所述搜索内容中包含的各关键词;根据预设的各搜索特征与关键词的对应关系、各搜索特征与环境信息的对应关系,在预设的各搜索特征中,确定与所述用户输入的搜索内容中包含的关键词以及所述当前的环境信息对应的搜索特征。
在一可选的实施例:
所述搜索特征确定模块204,具体用于:针对每个搜索特征,确定当前该搜索特征的特征权重;根据该搜索特征的特征权重,确定该搜索特征与该搜索结果的相关性表征值;根据当前每个搜索特征的特征权重以及每个搜索特征与该搜索结果的相关性表征值,确定该搜索结果相对于各搜索特征的调整权重。
在一可选的实施例:
所述搜索特征的特征权重是按照指定周期确定的;
所述调整权重确定模块206,具体用于:查找最近确定出的该搜索特征的特征权重,作为当前该搜索特征的特征权重。
在一可选的实施例:
所述调整权重确定模块206,具体用于确定从预设历史时刻到当前时刻的时间段;获取该时间段中每个指定时刻的该搜索特征的特征权重,确定由每个指定时刻的该搜索特征的特征权重构成的特征权重向量;并,获取该时间段中每个指定时刻的该搜索结果的热度,确定由每个指定时刻的该搜索结果的热度构成的热度向量;根据所述特征权重向量和所述热度向量,确定该搜索特征与该搜索结果的相关性表征值。
在一可选的实施例:
所述调整权重确定模块206,具体用于针对每个搜索特征,根据当前该搜索特征的特征权重以及该搜索特征与该搜索结果的相关性表征值,确定该搜索结果相对于该搜索特征的调整权重;确定该搜索结果相对于每个搜索特征的调整权重之和,作为该搜索结果相对于各搜索特征的调整权重。
在一可选的实施例:
所述调整权重确定模块206,具体用于在各搜索特征中,确定与该搜索结果的相关性表征值大于设定阈值的搜索特征,作为指定搜索特征;确定该搜索结果相对于每个指定搜索特征的调整权重之和,作为该搜索结果相对于各搜索特征的调整权重。
本说明书还提供了一种计算机可读存储介质,该存储介质存储有计算机程序,计算机程序可用于执行上述图1提供的搜索方法。
本说明书还提供了图3所示的电子设备的示意结构图。如图3所述,在硬件层面,该无人驾驶设备包括处理器、内部总线、网络接口、内存以及非易失性存储器,当然还可能包括其他业务所需要的硬件。处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,以实现上述图1所述的搜索方法。当然,除了软件实现方式之外,本说明书并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本说明书的实施例可提供为方法、系统或计算机程序产品。因此,本说明书可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本说明书的实施例而已,并不用于限制本说明书。对于本领域技术人员来说,本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (10)
1.一种搜索方法,其特征在于,包括:
获取用户输入的搜索内容;
根据所述搜索内容查询搜索结果,并确定每个搜索结果与所述搜索内容的匹配度;
确定当前的环境信息,根据预设的搜索内容与搜索特征的对应关系、预设的环境信息与搜索特征的对应关系,确定与所述搜索内容和所述环境信息相关的搜索特征;
针对每个搜索结果,根据所述搜索特征的特征权重及所述搜索特征与该搜索结果的相关表征值,确定该搜索结果相对于所述搜索特征的调整权重,其中,相关性表征值是指一个搜索特征与一个搜索结果之间相关程度的大小;
采用所述调整权重调整该搜索结果与所述搜索内容的匹配度;
根据调整后的各搜索结果与所述搜索内容的匹配度,对各搜索结果进行排序,并向用户返回排序后的各搜索结果。
2.如权利要求1所述的方法,其特征在于,所述搜索内容包括:文本;
所述当前的环境信息包括:用户输入所述搜索内容时的时间和/或地理位置;
根据所述搜索内容以及所述环境信息,确定与所述搜索内容和所述环境信息相关的搜索特征,具体包括:
对所述搜索内容进行分词,得到所述搜索内容中包含的各关键词;
根据预设的各搜索特征与关键词的对应关系、各搜索特征与环境信息的对应关系,在预设的各搜索特征中,确定与所述用户输入的搜索内容中包含的关键词以及所述当前的环境信息对应的搜索特征。
3.如权利要求1所述的方法,其特征在于,根据所述搜索特征,确定该搜索结果相对于所述搜索特征的调整权重,具体包括:
针对每个搜索特征,确定当前该搜索特征的特征权重;
根据该搜索特征的特征权重,确定该搜索特征与该搜索结果的相关性表征值;
根据当前每个搜索特征的特征权重以及每个搜索特征与该搜索结果的相关性表征值,确定该搜索结果相对于各搜索特征的调整权重。
4.如权利要求3所述的方法,其特征在于,该搜索特征的特征权重是按照指定周期确定的;
确定当前该搜索特征的特征权重,具体包括:
查找最近确定出的该搜索特征的特征权重,作为当前该搜索特征的特征权重。
5.如权利要求4所述的方法,其特征在于,根据该搜索特征的特征权重,确定该搜索特征与该搜索结果的相关性表征值,具体包括:
确定从预设历史时刻到当前时刻的时间段;
获取该时间段中每个指定时刻的该搜索特征的特征权重,确定由每个指定时刻的该搜索特征的特征权重构成的特征权重向量;并,获取该时间段中每个指定时刻的该搜索结果的热度,确定由每个指定时刻的该搜索结果的热度构成的热度向量;
根据所述特征权重向量和所述热度向量,确定该搜索特征与该搜索结果的相关性表征值。
6.如权利要求3所述的方法,其特征在于,根据当前每个搜索特征的特征权重以及每个搜索特征与该搜索结果的相关性表征值,确定该搜索结果相对于各搜索特征的调整权重,具体包括:
针对每个搜索特征,根据当前该搜索特征的特征权重以及该搜索特征与该搜索结果的相关性表征值,确定该搜索结果相对于该搜索特征的调整权重;
确定该搜索结果相对于每个搜索特征的调整权重之和,作为该搜索结果相对于各搜索特征的调整权重。
7.如权利要求6所述的方法,其特征在于,确定该搜索结果相对于每个搜索特征的调整权重之和,作为该搜索结果相对于各搜索特征的调整权重,具体包括:
在各搜索特征中,确定与该搜索结果的相关性表征值大于设定阈值的搜索特征,作为指定搜索特征;
确定该搜索结果相对于每个指定搜索特征的调整权重之和,作为该搜索结果相对于各搜索特征的调整权重。
8.一种搜索装置,其特征在于,包括:
获取模块,获取用户输入的搜索内容;
查询模块,根据所述搜索内容查询搜索结果,并确定每个搜索结果与所述搜索内容的匹配度;
搜索特征确定模块,确定当前的环境信息,根据预设的搜索内容与搜索特征的对应关系、预设的环境信息与搜索特征的对应关系,确定与所述搜索内容和所述环境信息相关的搜索特征;
调整权重确定模块,针对每个搜索结果,根据所述搜索特征的特征权重及所述搜索特征与该搜索结果的相关表征值,确定该搜索结果相对于所述搜索特征的调整权重,其中,相关性表征值是指一个搜索特征与一个搜索结果之间相关程度的大小;
调整模块,采用所述调整权重调整该搜索结果与所述搜索内容的匹配度;
排序模块,根据调整后的各搜索结果与所述搜索内容的匹配度,对各搜索结果进行排序,并向用户返回排序后的各搜索结果。
9.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述权利要求1~7任一项所述的方法。
10.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现上述权利要求1~7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111113411.8A CN113886685B (zh) | 2021-09-23 | 2021-09-23 | 一种搜索方法、装置、存储介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111113411.8A CN113886685B (zh) | 2021-09-23 | 2021-09-23 | 一种搜索方法、装置、存储介质及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113886685A CN113886685A (zh) | 2022-01-04 |
CN113886685B true CN113886685B (zh) | 2023-01-06 |
Family
ID=79010193
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111113411.8A Active CN113886685B (zh) | 2021-09-23 | 2021-09-23 | 一种搜索方法、装置、存储介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113886685B (zh) |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104008170A (zh) * | 2014-05-30 | 2014-08-27 | 广州金山网络科技有限公司 | 搜索结果的提供方法和装置 |
CN107239497A (zh) * | 2017-05-02 | 2017-10-10 | 广东万丈金数信息技术股份有限公司 | 热门内容搜索方法和系统 |
CN107832432A (zh) * | 2017-11-15 | 2018-03-23 | 北京百度网讯科技有限公司 | 一种搜索结果排序方法、装置、服务器和存储介质 |
CN108304421A (zh) * | 2017-02-24 | 2018-07-20 | 腾讯科技(深圳)有限公司 | 一种信息搜索方法及装置 |
CN108416649A (zh) * | 2018-02-05 | 2018-08-17 | 北京三快在线科技有限公司 | 搜索结果排序方法、装置、电子设备及存储介质 |
CN109033386A (zh) * | 2018-07-27 | 2018-12-18 | 天津字节跳动科技有限公司 | 搜索排序方法、装置、计算机设备和存储介质 |
CN109492088A (zh) * | 2018-09-19 | 2019-03-19 | 平安科技(深圳)有限公司 | 搜索结果优化排序方法、装置及计算机可读存储介质 |
CN110399568A (zh) * | 2019-07-04 | 2019-11-01 | Oppo广东移动通信有限公司 | 信息搜索方法、装置、终端及存储介质 |
CN111581544A (zh) * | 2019-04-08 | 2020-08-25 | 众巢医学科技(上海)股份有限公司 | 搜索结果优化方法、装置、计算机设备及存储介质 |
CN111611372A (zh) * | 2019-02-25 | 2020-09-01 | 北京嘀嘀无限科技发展有限公司 | 搜索结果的排序方法及装置、音乐搜索方法及装置 |
CN111949898A (zh) * | 2020-08-28 | 2020-11-17 | 平安国际智慧城市科技股份有限公司 | 搜索结果排序方法、装置、设备及计算机可读存储介质 |
CN112597396A (zh) * | 2020-12-29 | 2021-04-02 | 深圳Tcl新技术有限公司 | 搜索召回排序方法、系统及计算机可读存储介质 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104239463B (zh) * | 2014-09-02 | 2017-10-31 | 百度在线网络技术(北京)有限公司 | 搜索方法和搜索引擎 |
US20160239498A1 (en) * | 2015-02-17 | 2016-08-18 | Shocase, Inc. | Personal user focused intelligent responsive search system |
CN104881497A (zh) * | 2015-06-17 | 2015-09-02 | 郑州悉知信息技术有限公司 | 一种搜索方法及客户端 |
CN107368510B (zh) * | 2017-04-10 | 2018-08-31 | 口碑(上海)信息技术有限公司 | 一种店铺搜索排序方法及装置 |
CN109948039A (zh) * | 2017-11-30 | 2019-06-28 | 北京搜狗科技发展有限公司 | 一种优化搜索结果的方法、装置及电子设备 |
CN111310017B (zh) * | 2018-12-11 | 2023-05-12 | 阿里巴巴集团控股有限公司 | 一种时效性场景内容的生成方法及装置 |
CN110334271B (zh) * | 2019-05-21 | 2022-01-11 | 北京奇艺世纪科技有限公司 | 一种搜索结果优化方法、系统、电子设备及存储介质 |
CN111125408B (zh) * | 2019-10-11 | 2023-08-29 | 平安科技(深圳)有限公司 | 基于特征提取的搜索方法、装置、计算机设备和存储介质 |
CN111488426B (zh) * | 2020-04-17 | 2024-02-02 | 支付宝(杭州)信息技术有限公司 | 一种查询意图确定方法、装置及处理设备 |
CN112100480A (zh) * | 2020-09-15 | 2020-12-18 | 北京百度网讯科技有限公司 | 搜索方法、装置、设备及存储介质 |
-
2021
- 2021-09-23 CN CN202111113411.8A patent/CN113886685B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104008170A (zh) * | 2014-05-30 | 2014-08-27 | 广州金山网络科技有限公司 | 搜索结果的提供方法和装置 |
CN108304421A (zh) * | 2017-02-24 | 2018-07-20 | 腾讯科技(深圳)有限公司 | 一种信息搜索方法及装置 |
CN107239497A (zh) * | 2017-05-02 | 2017-10-10 | 广东万丈金数信息技术股份有限公司 | 热门内容搜索方法和系统 |
CN107832432A (zh) * | 2017-11-15 | 2018-03-23 | 北京百度网讯科技有限公司 | 一种搜索结果排序方法、装置、服务器和存储介质 |
CN108416649A (zh) * | 2018-02-05 | 2018-08-17 | 北京三快在线科技有限公司 | 搜索结果排序方法、装置、电子设备及存储介质 |
CN109033386A (zh) * | 2018-07-27 | 2018-12-18 | 天津字节跳动科技有限公司 | 搜索排序方法、装置、计算机设备和存储介质 |
CN109492088A (zh) * | 2018-09-19 | 2019-03-19 | 平安科技(深圳)有限公司 | 搜索结果优化排序方法、装置及计算机可读存储介质 |
CN111611372A (zh) * | 2019-02-25 | 2020-09-01 | 北京嘀嘀无限科技发展有限公司 | 搜索结果的排序方法及装置、音乐搜索方法及装置 |
CN111581544A (zh) * | 2019-04-08 | 2020-08-25 | 众巢医学科技(上海)股份有限公司 | 搜索结果优化方法、装置、计算机设备及存储介质 |
CN110399568A (zh) * | 2019-07-04 | 2019-11-01 | Oppo广东移动通信有限公司 | 信息搜索方法、装置、终端及存储介质 |
CN111949898A (zh) * | 2020-08-28 | 2020-11-17 | 平安国际智慧城市科技股份有限公司 | 搜索结果排序方法、装置、设备及计算机可读存储介质 |
CN112597396A (zh) * | 2020-12-29 | 2021-04-02 | 深圳Tcl新技术有限公司 | 搜索召回排序方法、系统及计算机可读存储介质 |
Non-Patent Citations (1)
Title |
---|
基于热度联合排序的微博热点话题发现;刘培玉等;《计算机科学与探索》;20161031;573-581 * |
Also Published As
Publication number | Publication date |
---|---|
CN113886685A (zh) | 2022-01-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106599278B (zh) | 应用搜索意图的识别方法及装置 | |
AU2015259118B2 (en) | Natural language image search | |
US8554854B2 (en) | Systems and methods for identifying terms relevant to web pages using social network messages | |
US7249121B1 (en) | Identification of semantic units from within a search query | |
CN108268617B (zh) | 用户意图确定方法及装置 | |
CN110457504B (zh) | 数字资产搜索技术 | |
US20110145234A1 (en) | Search method and system | |
US20110029510A1 (en) | Method and apparatus for searching a plurality of stored digital images | |
CN117235226A (zh) | 一种基于大语言模型的问题应答方法及装置 | |
US20210358570A1 (en) | Method and system for claim scope labeling, retrieval and information labeling of gene sequence | |
JP6185379B2 (ja) | レコメンド装置およびレコメンド方法 | |
CN112035688A (zh) | 资源搜索方法及装置、搜索设备及存储介质 | |
CN116303989A (zh) | 一种面向多种检索场景的专利检索方法、装置、设备 | |
KR101508583B1 (ko) | 스마트 기기 내 시맨틱 검색 시스템 및 검색방법 | |
CN113343095A (zh) | 一种模型训练以及信息推荐方法及装置 | |
CN113886685B (zh) | 一种搜索方法、装置、存储介质及电子设备 | |
CN117113174A (zh) | 一种模型训练的方法、装置、存储介质及电子设备 | |
CN116662657A (zh) | 一种模型训练和信息推荐的方法、装置、存储介质及设备 | |
Hattori et al. | Activity-based query refinement for context-aware information retrieval | |
CN111177585A (zh) | 地图poi反馈方法及装置 | |
CN108830298A (zh) | 一种确定用户特征标签的方法及装置 | |
CN111797620B (zh) | 识别专有名词的系统和方法 | |
Gomez et al. | Location sensitive image retrieval and tagging | |
US11500937B1 (en) | Data retrieval system | |
CN113343132A (zh) | 一种模型训练的方法、信息展示的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |