CN105760381B - 搜索结果处理方法及装置 - Google Patents

搜索结果处理方法及装置 Download PDF

Info

Publication number
CN105760381B
CN105760381B CN201410782649.3A CN201410782649A CN105760381B CN 105760381 B CN105760381 B CN 105760381B CN 201410782649 A CN201410782649 A CN 201410782649A CN 105760381 B CN105760381 B CN 105760381B
Authority
CN
China
Prior art keywords
search
queue
ingredient
result
search result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410782649.3A
Other languages
English (en)
Other versions
CN105760381A (zh
Inventor
连凤宗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Tencent Computer Systems Co Ltd
Original Assignee
Shenzhen Tencent Computer Systems Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Tencent Computer Systems Co Ltd filed Critical Shenzhen Tencent Computer Systems Co Ltd
Priority to CN201410782649.3A priority Critical patent/CN105760381B/zh
Publication of CN105760381A publication Critical patent/CN105760381A/zh
Application granted granted Critical
Publication of CN105760381B publication Critical patent/CN105760381B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明实施例公开了一种可以满足用户多种需求的搜索结果处理方法及装置。其中,方法包括:服务器接收客户端发送的搜索请求,所述搜索请求中包括用户通过所述客户端输入的搜索词;根据所述搜索词进行搜索得到搜索结果列表;将所述搜索结果列表中的搜索结果分别按照各成分进行排序形成多个成分队列;根据各成分队列中每个搜索结果的相关性因子,设置各成分队列的搜索意图强度值、计算各成分队列的第一权重值,根据各成分队列的搜索意图强度值以及第一权重值对所述多个成分队列进行排序以形成结果队列;以及将所述结果队列发送给所述用户终端进行展示。

Description

搜索结果处理方法及装置
技术领域
本发明涉及一种互联网技术领域,尤其涉及一种信息处理技术领域,具体涉及一种搜索结果处理方法及装置。
背景技术
随着移动终端技术及网络技术的飞速发展,网页搜索、新闻搜索、多媒体文件搜索等搜索应用也在飞速地发展当中,被越来越多的用户所依赖,例如,越来越多的用户选择在手机或平板电脑等电子终端上进行听音乐、看影片、或阅读电子图书等活动。
在各种搜索应用中通过浏览器、客户端的图形界面为用户提供方便的搜索入口,用户可以通过它提交包含搜索词(query,即用户进行搜索时,输入的文本内容)的搜索请求,搜索应用在找到与搜索词相匹配的搜索结果,并对搜索结果进行排序,再将这些排序后的搜索结果返回给用户。
以多媒体文件搜索应用为例,多媒体文件搜索一般包括音乐文档搜索、视频文件搜索和图片文件搜索等。视频文件搜索应用以搜索技术为基础,检索和提供各种格式的视频文件的信息和下载统一资源定位符(URL);图片文件搜索应用以搜索技术为基础,检索和提供各种格式图像文件的信息和下载URL;音乐文档搜索应用以搜索技术为基础,检索和提供各种格式的音乐文档的信息和下载URL。用户可以通过搜索入口检索到自己想要的多媒体文件源记录。例如,用户根据自己想要检索的歌曲,构造一个到多个搜索词,然后向音乐搜索应用的搜索入口提交包含搜索词的检索请求,音乐搜索应用根据用户输入的搜索词进行搜索,找到匹配搜索词的音乐URL源记录,并对搜索结果进行排序,再将这些URL源记录分页返回给用户。
在进行搜索时,用户的需求可能是多样的。例如,在进行音乐搜索时,同一个搜索词,可能用户想要搜索的是歌曲名,也可能用户想要搜索的是专辑名,甚至有可能用户想要搜索的是歌手名,这就要求搜索系统能够在首页尽可能有序地满足多种需求。
目前普遍的做法是,优先排列搜索词命中歌曲的搜索结果,再排列搜索词命中歌手、专辑的结果。也就是固定按照搜索词命中“歌曲”→“歌手”→“专辑”的模式来决定搜索结果的先后。
使用这种方法,虽然在搜索词命中歌曲的搜索结果很少的时候,搜索词命中歌手或专辑的结果也能够进入首页展示,但是,很多情况下搜索词命中歌手或专辑的结果很难排进首页,因为一个页面的展示数量是有限的。以搜索词为“江南”为例,“江南”既可以是歌曲,也可以是歌手。按照现有的排列方法,如图1所示,第一页面展示的都是搜索词命中歌曲,也就是歌曲名为“江南”的搜索结果,如果用户想搜索歌手为“江南”的搜索结果,只有翻页才能看到,如图2所示。因此,现有的排序方法往往并不符合用户的搜索意图,给用户带来了极大的不变,用户体验差。另外,由于这种方式模式固定,产品展示上单调、多样性也不足。
发明内容
本发明实施例提供一种搜索结果处理方法及装置,可以使推荐结果更符合用户的搜索意图。
本发明一实施例提供一种搜索结果处理方法,包括:服务器接收客户端发送的搜索请求,所述搜索请求中包括用户通过所述客户端输入的搜索词以及类型标识;根据所述类型标识获取对应的成分列表以及根据所述搜索词进行搜索得到搜索结果列表,所述成分列表中包括与所述类型标识对应的多个成分,所述搜索结果列表中包括多个中的搜索结果对应于多个成分;将所述搜索结果列表中的搜索结果分别按照各成分进行排序形成多个成分队列,每个成分队列中包括被列入该成分队列的多个搜索结果,每个所述搜索结果包括所述搜索结果的文件源记录、文本信息以及相关性因子,所述文本信息包括至少一个文本字段,所述相关性因子至少包括所述搜索词命中所述文本字段的命中概率;根据各成分队列中每个搜索结果的相关性因子,设置各成分队列的搜索意图强度值、计算各成分队列的第一权重值,根据各成分队列的搜索意图强度值以及第一权重值对所述多个成分队列进行混排进行排序以形成混排结果队列结果队列;以及将所述混排结果队列结果队列发送给所述用户终端进行展示。
相应的,本发明一实施例提供一种搜索结果处理装置,运行于服务器,包括:接收模块,用于接收客户端发送的搜索请求,所述搜索请求中包括用户通过所述客户端输入的搜索词;搜索结果获取模块,用于根据所述搜索词进行搜索得到搜索结果列表,所述搜索结果列表中的搜索结果对应于多个成分;成分队列形成模块,用于将所述搜索结果列表中的搜索结果分别按照各成分进行排序形成多个成分队列,每个成分队列中包括被列入该成分队列的多个搜索结果,每个所述搜索结果包括所述搜索结果的相关性因子;成分队列混排模块,用于根据各成分队列中每个搜索结果的相关性因子,设置各成分队列的搜索意图强度值、计算各成分队列的第一权重值,根据各成分队列的搜索意图强度值以及第一权重值对所述多个成分队列进行排序以形成结果队列;以及发送模块,用于将所述结果队列发送给所述用户终端进行展示。
本发明另一实施例提供一种搜索结果处理方法,包括:用户终端通过客户端接收用户输入的搜索词;向服务器发送搜索请求,所述搜索请求中包括所述搜索词,以使所述服务器根据所述搜索词进行搜索得到搜索结果列表,将所述搜索结果列表中的搜索结果分别按照各成分进行排序形成多个成分队列,每个成分队列中包括被列入该成分队列的多个搜索结果,每个所述搜索结果包括所述搜索结果的相关性因子,根据各成分队列中每个搜索结果的相关性因子,设置各成分队列的搜索意图强度值、计算各成分队列的第一权重值,根据各成分队列的搜索意图强度值以及第一权重值对所述多个成分队列进行排序以形成结果队列;以及接收并展示所述服务器返回的所述结果队列。
相应的,本发明另一实施例提供一种搜索结果处理装置,运行于用户终端,包括:接收模块,用于接收用户输入的搜索词;发送模块,用于向服务器发送搜索请求,所述搜索请求中包括所述搜索词,以使所述服务器根据所述搜索词进行搜索得到搜索结果列表,将所述搜索结果列表中的搜索结果分别按照各成分进行排序形成多个成分队列,每个成分队列中包括被列入该成分队列的多个搜索结果,每个所述搜索结果包括所述搜索结果的相关性因子,根据各成分队列中每个搜索结果的相关性因子,设置各成分队列的搜索意图强度值、计算各成分队列的第一权重值,根据各成分队列的搜索意图强度值以及第一权重值对所述多个成分队列进行排序以形成结果队列;以及展示模块,用于接收并展示所述服务器返回的所述结果队列。
本发明实施例,具有如下有益效果:
本发明实施例提供的搜索结果处理方法及装置,将搜索结果列表中的搜索结果分别按照各成分进行排序形成多个成分队列,然后根据各成分队列的搜索意图强度值对所述多个成分队列进行排序以形成结果队列,在排序时,考虑到不同成分的搜索意图强度,可以满足用户的多种需求,扩展性也很好。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为现有技术中的一种音乐搜索平台的搜索结果展示页面首页的示意图。
图2为图1中搜索结果展示页面第2页的示意图。
图3所示为本发明实施例提供的搜索结果处理方法的应用环境示意图。
图4是一种可应用于本发明实施例的服务器的结构框图。
图5为本发明第一实施例提供的搜索结果处理方法的流程图。
图6为本发明第一实施例中搜索结果的排序框架图。
图7为第一实施例中将所述搜索结果列表中的搜索结果分别按照各成分进行排序形成多个成分队列的具体流程图。
图8为第一实施例中对搜索意图强度值进行调整的具体流程图。
图9为第一实施例中根据各成分队列的搜索意图强度值对所述多个成分队列进行排序以形成结果队列的具体流程图。
图10为第一实施例中各成分队列的混排过程示意图。
图11为本发明第二实施例提供的搜索结果处理方法的流程图。
图12为本发明第三实施例提供的搜索结果处理方法的流程图。
图13为本发明第三实施例中搜索结果的排序框架图。
图14为本发明第三实施例中的搜索结果展示页面首页的示意图。
图15为采用现有技术搜索“香奈儿”后生成的搜索结果首页的示意图。
图16为采用第二实施例的技术方案搜索“香奈儿”后生成的搜索结果首页的示意图。
图17为采用现有技术搜索“做自己”后生成的搜索结果首页的示意图。
图18为采用第二实施例的技术方案搜索“做自己”后生成的搜索结果首页的示意图。
图19为本发明第四实施例提供的搜索结果处理装置的结构示意图。
图20为图19中模块的具体结构示意图。
图21为本发明第五实施例提供的搜索结果处理装置的结构示意图。
具体实施方式
在搜索应用中,输入同一个搜索词,不同用户的搜索意图可能是不一样的,或是找歌曲、或是找歌手、或是找专辑;也有些用户有通过搜索歌词找歌曲的需求;也有相当一部分用户想通过搜索影视剧名找歌曲;更专业的用户可能还需要更高级的语义化搜索的需求。因此,为了满足用户不同的搜索意图,同时为了减少各搜索意图的干扰,专注并行满足多种意图,需要形成多个成分队列,实施更细化的排序优化,最后将多个成分队列融合以满足各种搜索意图。
本发明实施例提供的搜索结果处理方法及装置中采用量化的搜索意图强度值来决定多个成分队列混排的结果,使得最终结果更能满足用户的多种需求。
图3所示为本发明实施例提供的搜索结果处理方法的应用环境图。如图3所示,用户终端100以及服务器200位于无线或有线网络300中,通过该无线或有线网络300,用户终端100以及服务器200相互通信。
用户终端100具体可以包括智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture Experts Group Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机、车载终端、可穿戴设备等等。用户终端100中可以安装浏览器或各种应用(包括系统应用以及第三方应用)的客户端。
图4示出了一种服务器的结构框图。如图4所示,服务器200包括:存储器201、处理器202以及网络模块203。
可以理解,图4所示的结构仅为示意,服务器200还可包括比图4中所示更多或者更少的组件,或者具有与图4所示不同的配置。图4中所示的各组件可以采用硬件、软件或其组合实现。另外,本发明实施例中的服务器还可以包括多个具体不同功能的服务器。
存储器201可用于存储软件程序以及模块,如本发明实施例中的搜索结果处理方法及装置对应的程序指令/模块,处理器202通过运行存储在存储器201内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现本发明实施例中的搜索结果处理方法。存储器201可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器201可进一步包括相对于处理器202远程设置的存储器,这些远程存储器可以通过网络连接至服务器200。进一步地,上述软件程序以及模块还可包括:服务模块221以及操作系统222。其中操作系统222,例如可为LINUX、UNIX、WINDOWS,其可包括各种用于管理系统任务(例如内存管理、存储设备控制、电源管理等)的软件组件和/或驱动,并可与各种硬件或软件组件相互通讯,从而提供其他软件组件的运行环境。服务模块221运行在操作系统222的基础上,并通过操作系统222的网络服务监听来自网络的请求,根据请求完成相应的数据处理,并返回处理结果给客户端。也就是说,服务模块221用于向客户端提供网络服务。
网络模块203用于接收以及发送网络信号。上述网络信号可包括无线信号或者有线信号。
于本发明实施例中,用户终端100中安装有客户端,该客户端可以是浏览器也可以是第三方应用软件,与服务器(Server)端相对应,为用户提供服务,例如音乐搜索服务,用于搜索音乐。在本发明实施例中,客户端还可以可管理用户终端100的资源,例如下载音乐、图书等,同时也可以具有进程管理等其他功能,以保持用户终端100的良好状态。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
第一实施例
请参见图5,为本发明实施例提供的一种搜索结果处理方法的流程图,图6为本实施例中搜索结果的排序框架图。请参照图5及图6,本实施例描述的是服务器的处理流程,该方法可包括以下步骤:
步骤S11,服务器接收客户端发送的搜索请求,所述搜索请求中包括用户通过所述客户端输入的搜索词。
搜索词可以由用户通过键盘输入,也可以由用户通过语音、手写等方式输入,本发明的具体实施方式并不以此为限。
所述搜索请求还可以包括类型标识,用于标识该搜索请求对应的搜索应用的类型,例如音乐搜索、视频搜索、图片搜索等。
步骤S12,根据所述搜索词进行搜索得到搜索结果列表,所述搜索结果列表中的搜索结果对应于多个成分。
服务器可以根据所述类型标识获取对应的成分列表,不同类型标识对应的成分列表的内容可以不同,例如,如果类型标识对应的是音乐搜索,其对应的成分列表中的成分可以包括歌曲、歌手、专辑、音乐影集、歌词等多个成分,如果类型标识对应的是电子图书搜索,其对应的成分列表中的成分可以包括书名、作者、出版社等多个成分。
服务器根据搜索词在相关的数据库或互联网获取与搜索词相关的搜索结果,对搜索结果的信息进行整理后,形成搜索结果列表。
搜索结果列表中包括多个搜索结果,每个搜索结果包括文件源记录(例如下载文件的统一资源定位符URL等)、与该源记录相关的文本信息以及数值属性。
所述文本信息包括至少一个文本字段,还可以包括文件大小、时长、品质等信息。如果一个记录的文本信息中包括用户提交的搜索词,那么此记录符合用户的搜索需求,可能作为搜索结果中的一条记录返回。
所述搜索结果的数值属性包括所述搜索词命中所述文本字段的命中概率、所述搜索词与文本字段的文本相关性、所述搜索结果的被搜索的次数、被点击次数以及被下载次数等信息。
其中,搜索词命中所述文本字段的命中概率具体来说是指经查询分析后得到的成分概率。例如:搜索词“江南”,既命中歌手名又命中歌曲名,这两种成分用一个比例来表示其可信度。比如库内歌曲名为“江南”的搜索结果有8条,歌手名命中“江南”的搜索结果有2条,则会统计出,歌曲的成分概率为8/(8+2)=0.8,歌手的成分概率为2/(8+2)=0.2。
文本相关性可以通过现有的计算文本间语义相关性的各种算法来获得,这里不再赘述。相关性越高,对应的搜索结果与搜索词的匹配度也越高。
搜索结果列表中的所有搜索结果可以按照预定的排序算法进行排序,预定的排序算法例如包括文本相关性排序法、人工干预法、用户行为分析法等。
其中,文本相关性排序法,是指按照搜索词与搜索结果的文本相关性由高到低进行排序。文本相关性在搜索结果列表的索引建立时就已经计算好。
人工干预法,是指由系统预先定义每个搜索词对应的排序结果。具体的,可以列举所有预定义的搜索词,然后对于其中每个搜索词,设定一个结果排序,例如,搜索词为“大长今”,按照命中影视剧、歌曲、歌手、歌词进行排序。
用户行为分析法,是指当用户在输入搜索词得到搜索结果页后,统计其点击某项搜索结果的次数,按照点击次数对搜索结果进行排序,以此可以反映用户对该搜索结果的兴趣。
本实施例中,优选的,所述搜索结果列表中的多个搜索结果按照所述搜索词与所述搜索结果的文本相关性由高到低排列。
优选的,所述成分列表中的多个成分中至少包括与所述文本字段对应的成分。例如,如果所述文本字段包括歌手名、歌曲名、专辑名、歌词等,那么成分列表中的多个成分也可以相应的包括歌手、歌曲、专辑、歌词等成分。当然,成分列表还可以包括其他与文本字段没有直接关系的成分,例如,纠错、文本相关性等成分。
进一步的,得到搜索结果列表后,还可以先对搜索结果列表中的搜索结果进行去重(dedup)、重排(reranker)等处理。在重排时还可以进一步的参考每个搜索结果的权威性、时新性等指标。其中,权威性是对搜索结果的来源站点的评价,从该站点的规模、访问量等角度综合考虑,例如网站规模大、日访问量多的网站具有较高的站点权威性。时新性则代表了其所含咨询内容的新鲜程度。去重和重排可以采用现有的技术进行处理,这里不再赘述。
步骤S13,将所述搜索结果列表中的搜索结果分别按照各成分进行排序形成多个成分队列。
请参照图7,步骤S13进一步的可以包括:
步骤S131,在所述搜索结果列表中分别查找命中各文本字段的搜索结果;
步骤S132,将查找到的搜索结果分别放入与各文本字段对应成分的成分队列中。
每个成分队列中的搜索结果可以按照搜索结果列表的排序方法进行排序,例如按照文本相关性由高到低进行排序。
每个成分队列中包括被列入该成分队列的多个搜索结果,每个所述搜索结果包括所述搜索结果的文件源记录、文本信息以及相关性因子。
下面给出目前考虑的各种相关性因子以及其含义等。本领域的技术人员可以理解,虽然下面列出了一些具体的相关性因子,但是这并不构成对本发明保护范围的限定。实质上,对这些具体的相关性因子的描述仅为示例性描述,并不是穷举性描述。
所述相关性因子可以包括:所述搜索词命中所述文本字段的命中概率、所述搜索结果的搜索热度(hotness)、第二次搜索比例(secondratio)、队列命中比例(docratio)、文件来源比例、库内(indoor)搜索比例、以及库外(outdoor)搜索比例中的一种或几种的组合。这些相关性因子在各成分队列的索引建立时就已经计算好并记录下来。
搜索热度(hotness)指的是在预定时长内(例如10天、一周等)该搜索结果被搜索的次数。
第二次搜索比例(secondratio)指的是将搜索词进行分词后去掉部分字段再次进行搜索后得到的结果占总搜索结果的比例。例如将“江南a”按照语义分为“江南”和“a”两个词,将“a”去掉后,对“江南”进行搜索即称为二次检索。假设一个队列中有8个搜索结果,其中有两个搜索结果是进行了二次搜索后得到的,那么该成分队列的第二次搜索比例就等于2/8。
队列命中比例(docratio)指的是该成分队列中搜索结果的条数占所有队列中的搜索结果的总数的百分比。
文件来源比例指的是该成分队列中来自某数据来源的搜索结果的条数占该成分队列中搜索结果的总数的百分比。
库内搜索比例指的是该成分队列中来自相关数据库的搜索结果的条数占该成分队列中搜索结果的总数的百分比。
库外搜索比例指的是该成分队列中来自互联网的搜索结果的条数占该成分队列中搜索结果的总数的百分比。
步骤S14,根据各成分队列中每个搜索结果的相关性因子,设置各成分队列的搜索意图强度值、计算各成分队列的第一权重值,根据各成分队列的搜索意图强度值以及第一权重值对所述多个成分队列进行排序以形成结果队列。
具体的,所述根据各成分队列中每个搜索结果的相关性因子,设置各成分队列的搜索意图强度值的步骤,可以包括:
根据所述成分队列中每个搜索结果对应的命中概率设置所述成分队列的搜索意图强度,命中概率越高的搜索结果所对应的搜索意图强度值越大;
或者,根据所述搜索词命中所述成分队列中每个搜索结果对应的命中概率以及第二次搜索比例设置所述成分队列的搜索意图强度,命中概率越高的搜索结果对应的搜索意图强度值越大,在所述命中概率相同的条件下,如果所述第二次搜索比例大于预定值,则通过检验值对所述搜索意图强度进行校验;
或者,根据所述搜索词命中所述成分队列中每个搜索结果对应的命中概率以及对列命中比例设置所述成分队列的搜索意图强度,命中概率越高的搜索结果对应的搜索意图强度值越大,在所述命中概率相同的条件下,队列命中比例越高的搜索结果对应的搜索意图强度值越大;
或者,根据搜索结果的搜索热度设置所述成分队列的搜索意图强度,搜索热度越高的搜索结果对应的搜索意图强度值越大。
需要说明的是,搜索意图强度值的设置规则可以根据实际需求进行调整,以上描述的只是几种具体实施方式,并不构成对本发明保护范围的限定。
于本发明实施例中,可以根据公式(1)计算各成分队列的第一权重值。
其中,W为第一权重值,findoor为第一次库内搜索比例,foutdoor为第一次库内搜索比例,Sindoor为第二次库内搜索比例,Soutdoor为第二次库内搜索比例,dis_num为各成分队列中搜索结果的数量,例如歌曲队列中搜索结果的个数为9,那么歌曲队列的dis_num就为9。第一权重值W通过库内搜索比例和库外搜索比例,来确定用户想要这个成分的倾向性。库内搜索比例和库外搜索比例能反映出数据库中该成分的丰富程度,也能反映出用户的意图来,所以用这两个指标来计算权重。第一次搜索为原始搜索词搜索,第二次搜索为将搜索词去掉部分字段(或称为丢词)之后再次进行搜索。由于用户的搜索词是随意的,有些需要丢掉不关键的词才能召回较为正确的搜索结果,因此,第一次搜索比例和第二次搜索比例都需要考虑。
进一步的,由于各个成分队列的搜索意图强度值是根据各个成分队列的自身情况来确定的,因此会造成各个成分队列的搜索意图强度值在全局上不合理的问题,进行全局调整可以避免这种不合理。因此,请参照图8,所述根据各成分队列的搜索意图强度值以及第一权重值对所述多个成分队列进行排序以形成结果队列的步骤之前,还可以包括:
步骤S140a,根据第一次库内搜索比例、第一次库外搜索比例、第二次库内搜索比例、第二次库外搜索的比例的线性加权值,对所述成分队列的搜索意图强度值进行初始化。
具体的,当成分队列的第一次库内搜索比例、第一次库外搜索比例、第二次库内搜索比例、第二次库外搜索的比例的线性加权值满足条件时,将该成分队列的搜索意图强度值初始化为一个预定值,否则,保持原搜索意图强度值不变。其中,discount为一个校正值。
步骤S140b,根据初始化后的成分队列的搜索意图强度值以及所述成分队列的第一权重值与其他成分队列的第一权重值的差值,对所述成分队列的搜索意图强度值进行调整。
具体的,如果所述成分队列的第一权重值与其他成分队列的第一权重值的差值大于零,所述成分队列调整后的搜索意图强度值大于调整前的搜索意图强度值,如果所述成分队列的第一权重值与其他成分队列的第一权重值的差值小于零,所述成分队列调整后的搜索意图强度值小于调整前的搜索意图强度值,如果所述成分队列的第一权重值与其他成分队列的第一权重值的差值是等于零,所述成分队列调整后的搜索意图强度值等于调整前的搜索意图强度值。
进一步的,请参照图9,所述根据各成分队列的搜索意图强度值对所述多个成分队列进行排序以形成结果队列的步骤,包括:
步骤S141,设置所述结果队列的总条数以及与不同搜索意图强度值对应的预定条数piece_num。
这里的条数指的是搜索结果文件源记录的条数,也就是搜索结果的个数。与不同搜索意图强度值对应的预定条数piece_num的设定可以根据实际的需要以及经验数据进行设定,例如可以参考首页展示量、产品特性等因素来设定。
步骤S142,根据各成分队列的文本匹配度以及所述搜索词命中所述文本字段的命中概率计算并记录各成分队列中排在首位的搜索结果的第二权重值。
具体的,可以根据公式(2)计算搜索结果的第二权重值。
公式(2)中,score表示第二权重值,当指定队列的成分匹配得分l4_score小于预定值score0时,score=strengthα*(1/(qpos+1))β。α和β都是固定系数。qpos表示的是搜索结果在该队列中排在第几位置,如果排在第一位qpos就是1,以此类推。
其他情况下,第二权重值就是该成分队列对应的非成分匹配得分l4_non_comp_score,l4_non_comp_score=Wcover*cover+Wprox*max_prox。其中,cover和max_prox都表示文本匹配度,cover是指文本信息中的字段命中搜索词的词数占所述搜索词总词数的比例,也就是搜索词命中覆盖率。prox表示命中紧密度,max_prox表示在歌曲或者歌手或者专辑命中紧密度值,三者中取最大值。Wcover和Wprox表示这两个文本匹配度融合时分配的权重值。l4_non_comp_score由命中覆盖率和命中紧密度加权融合得到,其中,命中覆盖率和命中紧密度,都可以根据现有的算法计算获得。
命中覆盖率计算举例:假设搜索词是“冰雨刘德华”,搜索词可以被分为“冰雨”、“刘”、“德华”3个term,假设有一个文档的文本信息中的字段包括“冰雨陈奕迅”,只命中了一个term,那么命中覆盖率cover=1/3。
命中紧密度计算举例:假设搜索词是“忘情水”,有一个文档的歌曲名叫做“忘掉情是一杯苦水”,由于这个文件的名称相对于“忘情水”很松散,因此计算出的紧密度很低,prox=0.1。
l4_score=l4_non_comp_score+Wcomp*comp_score,Wcomp为成分融合权重值,comp_score为成分得分,等于搜索词命中各字段的命中概率的累加。
comp_score计算举例:假设搜索词为“冰雨刘德华”,某文档doc1的歌曲名为“冰雨”、歌手名为“刘德华”,该文档的comp_score就是:0.98(冰雨命中歌曲名的概率为0.98)+0.99(刘德华命中歌手的概率为0.99)=1.97。假设另一个文档doc2的歌曲名为“刘德华”、歌手名为“陈奕迅”,doc2的comp_score就是:0.01(刘德华命中歌曲名的概率为0.01)+0=0.01。
步骤S143,将第二权重值排在首位的成分队列中排序在预定条数piece_num内的搜索结果依次选出插入至所述结果队列中;
步骤S144,当选出的搜索结果的第二权重值小于已插入结果队列中的搜索结果的第二权重值的平均值时,重新计算该成分队列中剩余搜索结果的第二权重值;
返回步骤S143,直到插入所述结果队列的搜索结果的数量达到所述总条数或者所述各成分队列已为空。
进一步的,在根据各成分队列的搜索意图强度值对所述多个成分队列进行排序以形成结果队列之后,还可以根据纠错队列对结果队列进行纠错。
纠错队列是指经过qrw纠错后得到的搜索结果队列。例如,用户搜索“liudehua”,qrw会根据拼音和歌曲名词典,发现应该纠错为“刘德华”,于是就下发一次搜索“刘德华”的请求,将所得到的搜索结果排序后形成纠错队列。进行排序时,也可以同时考虑纠错队列。
步骤S15,将所述结果队列发送给所述用户终端进行展示。
本发明实施例提供的搜索结果处理方法,将搜索结果列表中的搜索结果分别按照各成分进行排序形成多个成分队列,然后根据各成分队列的搜索意图强度值对所述多个成分队列进行排序以形成结果队列,在混排时,考虑到不同成分的搜索意图强度,各个成分队列都展示一部分,可以满足多种需求。另外,还可以根据实际情况对成分进行扩展,比如用户如果想要某种具体的版本,则可以建立版本队列,最后参与队列融合,例如演唱会版本、dj版本、铃声版本等。如果用户要想某种类型的歌曲,则可以建立类型队列,最后参与融合,例如伤感的歌、适合开车听的歌等,因此扩展性也很好。
第二实施例
请参见图10,图10为本实施例提供的一种搜索结果处理方法的流程图,本实施例描述的是用户终端的流程,该方法可包括以下步骤:
步骤S21,用户终端通过客户端接收用户输入的搜索词;
步骤S22,向服务器发送搜索请求,所述搜索请求中包括所述搜索词,以使所述服务器根据所述搜索词进行搜索得到搜索结果列表,将所述搜索结果列表中的搜索结果分别按照各成分进行排序形成多个成分队列,每个成分队列中包括被列入该成分队列的多个搜索结果,每个所述搜索结果包括所述搜索结果的相关性因子,根据各成分队列中每个搜索结果的相关性因子,设置各成分队列的搜索意图强度值、计算各成分队列的第一权重值,根据各成分队列的搜索意图强度值以及第一权重值对所述多个成分队列进行排序以形成结果队列。
具体的,可以参照第一实施例中的相应步骤,这里不再赘述。
步骤S23,向所述用户展示所述结果队列。
为了达到产品的不同搜索意图的块状展示,可以确定一个块内展示多少条搜索结果,也就是第一实施例中与不同搜索意图强度值对应的预定条数piece_num,这个预定条数piece_num除了考虑搜索意图强度外,还可以根据首页展示量、产品特性等因素来确定。
本发明实施例提供的搜索结果处理方法,将搜索结果列表中的搜索结果分别按照各成分进行排序形成多个成分队列,然后根据各成分队列的搜索意图强度值对所述多个成分队列进行排序以形成结果队列,在排序时,考虑到不同成分的搜索意图强度,各个成分队列都展示一部分,可以满足多种需求,扩展性也很好。
第三实施例
图11为本实施例提供的一种搜索结果处理方法的流程图,请参照图11,图12为本实施例中搜索结果的排序框架图。本实施例以音乐搜索为例,描述的是用户终端与服务器之间的交互流程,本实施例中的排序方法可包括以下步骤:
步骤S301,装载在用户终端的音乐搜索客户端接收用户输入的搜索词。
音乐搜索客户端例如可以是QQ音乐客户端,用户可以直接在QQ音乐首页的搜索框中输入搜索词,进行搜索。
步骤S302,音乐搜索客户端向服务器发送搜索请求,所述搜索请求中包括所述搜索词以及类型标识。
步骤S303,服务器根据所述类型标识获取对应的成分列表以及根据所述搜索词进行搜索得到搜索结果列表。
于本实施例中,类型标识对应的是音乐搜索,因此,对应的成分列表中的成分包括歌曲(song)、歌手(singer)、专辑(albumn)、音乐影集(music vidio)、影视剧、歌词、名歌手、文本相关性、纠错等多个成分。
搜索结果列表中包括多个搜索结果,每个搜索结果包括音乐文档源记录(例如音乐文档的URL记录)、与该音乐文档相关的文本信息以及数值属性。
每个音乐文档的文本信息包括多个文本字段,例如歌手名、歌曲名、歌词、专辑名、影视剧名、歌曲描述等,还可以包括该音乐文档的大小、时长、品质等信息。如果一个音乐文档的文本信息中包括用户提交的搜索词,那么此音乐文档符合用户的搜索需求,可能作为搜索结果中的一条记录返回。
服务器根据搜索词在相关的数据库或互联网音乐文档的文本字段中的命中情况,计算该音乐文档针对该搜索词的文本相关性,根据文本相关性获取搜索结果,并整理排序形成搜索结果列表。
于本实施例中,搜索结果列表中的搜索结果按照文本相关性由高到低进行排序。
所述搜索结果的数值属性包括所述搜索词命中所述文本字段的命中概率(例如Query Rewrite概率)、所述搜索词与文本字段的文本相关性、所述搜索结果的被搜索的次数、被点击次数以及被下载次数等信息。
步骤S304,所述服务器将所述搜索结果列表中的搜索结果分别按照各成分进行排序形成多个成分队列。
于本实施例中,与成分列表中各成分对应的成分队列例如可以包括:歌曲队列、歌手队列、专辑队列、音乐影集队列、影视剧队列、歌词队列、名歌手队列、文本相关性队列、纠错队列等多个成分队列。
服务器在所述搜索结果列表中分别查找命中各文本字段的搜索结果,然后将查找到的搜索结果分别放入与各文本字段对应成分的成分队列中。
于本实施例中,优选的,每个成分队列中的搜索结果按照文本相关性由高到低进行排序。
每个成分队列中包括被列入该成分队列的多个搜索结果,每个所述搜索结果包括所述搜索结果的文件源记录、文本信息以及相关性因子。所述相关性因子可以包括:所述搜索词命中所述文本字段的命中概率、所述搜索结果的搜索热度(hotness)、第二次搜索比例(secondratio)、队列命中比例(docratio)、文件来源比例、库内(indoor)搜索比例、以及库外(outdoor)搜索比例中的一种或几种的组合。这些相关性因子在各成分队列的索引建立时就已经计算好并记录下来。具体的含义可以参考第一实施例中的描述,这里不再赘述。
步骤S305,所述服务器根据各成分队列中每个搜索结果的相关性因子,设置各成分队列的搜索意图强度值。
具体的,于本实施例中,歌曲队列(SongQueue)的搜索意图强度值可以根据搜索词命中歌曲的概率(songprob)结合第二次搜索比例(secondratio)进行设置。其中,搜索词命中歌曲的概率指的是搜索词命中音乐文档文本信息中的歌曲名字段的概率。
例如,参照公式(3),当搜索词命中歌曲的概率(songprob)小于0.1时,歌曲队列的搜索意图强度值(SongQueue strength)设置为0.1;当搜索词命中歌曲的概率小于0.5且大于0.1、并且二次搜索的比例(secondratio)小于0.99时,歌曲队列的搜索意图强度值设置为0.3;当搜索词命中歌曲的概率小于0.5且大于0.1、并且二次搜索的比例大于等于0.99时,歌曲队列的搜索意图强度值设置为0.3*max{1.0,(4/termnum)};当搜索词命中歌曲的概率大于等于0.5时,歌曲队列的搜索意图强度值设置为0.8;当搜素词只命中歌手时(对应于公式(3)中的query is pure singer),歌曲队列的搜索意图强度值可以设置为0.0001。其中,max{1.0,(4/termnum)是一个校验值,如果第二次搜索比例太高,例如超过0.99,就可以利用这个校验值进行调整,termnum为词数,是指搜索词被分词后得到的词(term)的个数,如“刘德华”切词为“刘”“德华”,这样的termnum=2。
可以理解的是,公式(3)只是一种具体实施方式,歌曲队列(SongQueue)的搜索意图强度值的设置规则可以根据实际需求进行调整,总体来讲,搜索词命中歌曲的概率越高、搜索意图强度值也就越高。
于本实施例中,歌手队列(SingerQueue)的搜索意图强度值可以根据搜索词命中歌手的概率(singerprob)结合第二次搜索比例(secondratio)以及队列命中比例(docratio)进行设置。其中,搜索词命中歌手的概率指的是搜索词命中音乐文档文本信息中的歌手名字段的概率。
请参照公式(4),当搜索词命中歌手的概率小于0.1且队列命中比例(docratio)小于或等于0.5时,歌手队列的搜索意图强度值(SingerQueue strength)设置为0.1;当搜索词命中歌手的概率小于0.1且队列命中比例大于0.5时,歌手队列的搜索意图强度值设置为0.4;当搜索词命中歌手的概率大于0.1且小于0.5、并且二次搜索的比例小于0.99时,歌手队列的搜索意图强度值设置为0.4;当搜索词命中歌手的概率大于0.1且小于0.5、并且二次搜索的比例大于或等于0.99时,歌手队列的搜索意图强度值设置为0.4*max{1.0,(4/termnum)};当搜索词命中歌手的概率大于或等于0.5时,歌手队列的搜索意图强度值设置为0.8。其中,队列命中比例(docratio)指的是该队列中搜索结果的条数占所有队列中的搜索结果的条数总数的百分比。
可以理解的是,公式(4)只是一种具体实施方式,歌手队列(SingerQueue)的搜索意图强度值的设置规则可以根据实际需求进行调整,总体来讲,搜索词命中歌手的概率越高、搜索意图强度值也就越高;在搜索词命中歌手的概率相同的情况下,队列命中比例(docratio)越高、搜索意图强度值也越高。
于本实施例中,影视剧队列(AlbumnQueue)的搜索意图强度值可以根据搜索词命中影视剧的概率(albumnprob)进行设置。其中,搜索词命中影视剧的概率指的是搜索词命中音乐文档文本信息中的影视剧名字段的概率。
请参照公式(5),当搜索词命中影视剧的概率小于0.1时,影视剧队列的搜索意图强度值(AlbumnQueue strength)设置为0.1;当搜索词命中影视剧的概率大于0.1且小于0.5时,影视剧队列的搜索意图强度值设置为0.4;当搜索词命中影视剧的概率大于或等于0.5时,影视剧队列的搜索意图强度值设置为0.7;当搜素词只命中歌手时(query is puresinger),影视剧队列的搜索意图强度值设置为0.0。
可以理解的是,公式(5)只是一种具体实施方式,影视剧队列(AlbumnQueue)的搜索意图强度值的设置规则可以根据实际需求进行调整,总体来讲,搜索词命中影视剧的概率越高、搜索意图强度值也就越高。
于本实施例中,歌词队列(LyricsQueue)的搜索意图强度值可以根据是否完全命中歌曲名、歌手名、专辑名进行设置。请参照公式(6),如果完全命中歌曲名、歌手名和专辑名,则调低歌词队列的搜索意图强度值。
其中,ta是指歌曲名、tb是指歌手名、tc是指专辑名,has_exaxt_ta_tb_tc表示歌曲名和歌手名和专辑名是否完全命中。
如果歌曲名、歌手名和专辑名完全命中,则调低歌词队列的搜索意图强度值。可以理解的是,公式(6)只是一种具体实施方式,歌词队列(LyricsQueue)的搜索意图强度值的设置规则可以根据实际需求进行调整。
于本实施例中,音乐影集队列(music video queue)的搜索意图强度值可以根据搜索热度(hotness)进行设置。其中,搜索热度指的是在预定时长内(例如30天)该搜索结果被搜索的次数。
请参照公式(7),当搜索热度(hotness)大于或等于9000时,音乐影集队列(musicvideo queue)的搜索意图强度值设置为1.0;当搜索热度大于或等于5000且小于9000时,音乐影集队列的搜索意图强度值设置为0.8;当搜索热度大于或等于2000且小于5000时,音乐影集队列的搜索意图强度值设置为0.5;当搜索热度大于或等于5000且小于9000时,音乐影集队列的搜索意图强度值设置为0.8;当搜索热度小于2000时,音乐影集队列的搜索意图强度值设置为0.1;当搜索词命中歌手的概率(singer prob)大于0.8且搜索词命中影视剧名字段的命中概率加搜索词命中歌曲描述字段的命中概率小于0.01时,音乐影集队列的搜索意图强度值设置为0.0。
其中,tdratio是指搜索词命中影视剧名字段的命中概率、teratio是指搜索词命中歌曲描述字段的命中概率。例如“凤凰于飞”这首歌是电视剧《甄嬛传》的片尾曲,那td字段可以为“甄嬛传”,te字段可以为“电视剧《甄嬛传》的片尾曲”。
可以理解的是,公式(7)只是一种具体实施方式,音乐影集队列(music videoqueue)的搜索意图强度值的设置规则可以根据实际需求进行调整,总体来讲,搜索热度越高、搜索意图强度值也就越高。
步骤S306,所述服务器根据各成分队列中每个搜索结果的相关性因子,计算各成分队列的第一权重值。
具体的,请参照第一实施例,可以根据公式(1)计算各成分队列的第一权重值,这里不再赘述。
步骤S307,所述服务器根据各成分队列中每个搜索结果的相关性因子,对成分队列的搜索意图强度值进行全局调整。
在对成分队列进行排序前,先对各成分队列的搜索意图强度值进行全局调整进行。在本实施例中,对各成分队列的搜索意图强度值进行全局调整,可以包括对歌曲队列、歌手队列、专辑队列的搜索意图强度值进行全局调整以及对文本相关性队列的搜索意图强度进行全局调整两个部分。
对歌曲队列、歌手队列、专辑队列的搜索意图强度值进行全局调整时首先可以根据公式(8)对歌曲队列、歌手队列、专辑队列的搜索意图强度值进行初始化。
例如,当歌曲队列、歌手队列或专辑队列的第一次库内搜索比例、第一次库外搜索比例、第二次库内搜索比例、第二次库外搜索的比例的线性加权值满足条件时,将该队列的搜索意图强度值初始化为0.8,否则,保持原搜索意图强度值不变。其中,discount为一个校正值,例如可以为4.5。
然后,根据初始化后的成分队列的搜索意图强度值以及所述成分队列的第一权重值与其他成分队列的第一权重值的差值,对所述成分队列的搜索意图强度值进行调整。
如果所述成分队列的第一权重值与其他成分队列的第一权重值的差值大于零,所述成分队列调整后的搜索意图强度值大于调整前的搜索意图强度值,如果所述成分队列的第一权重值与其他成分队列的第一权重值的差值小于零,所述成分队列调整后的搜索意图强度值小于调整前的搜索意图强度值,如果所述成分队列的第一权重值与其他成分队列的第一权重值的差值是等于零,所述成分队列调整后的搜索意图强度值等于调整前的搜索意图强度值。
以歌曲队列为例,假设歌曲队列经初始化后的搜索意图强度值为old_strengthsong,歌曲队列的W值为Wsong,歌手队列的W值为Wsinger,专辑队列的W值为Walbumn,歌曲队列的搜索意图强度值可以根据公式(9)调整为new_strengthsong
new_strengthsong=old_strengthsong+0.5*sign(Wsong-Wsinger)+0.5*sign(Wsong-Walbumn) (9)
进一步的,还可以根据补充规则进行进一步的调整,补充规则例如可以包括:
A1、如果搜索词只命中歌手(query is pure singer),并且(歌曲队列的搜索结果数)/(歌曲队列的搜索结果数+歌手队列的搜索结果数+专辑队列的搜索队列数)小于或等于预定值(例如0.02)0.02,将歌曲队列的搜索意图强度值调整为0.0001,也就是new_strengthsong=0.0001,这样可以解决“周杰伦”、“李克勤”等歌曲排到首页问题。也就是说如果搜索词只命中歌手名字段,而且歌曲队列的搜索结果很少的情况下,可以将歌曲队列的搜索意图强度值设置的很低,当然,0.0001只是一个具体示例,也可以根据实际情况进行调整。
B1、当第二次搜索比例>0.98或者队列内的搜索结果数为0,将对应成分队列的搜索意图强度调整为原来的1/4,也就是new_strength=old_strength/4.0,解决部分匹配的歌曲、歌手、专辑排得过高的问题。
C1、如果歌手队列的库外搜索比例=100%,将歌手队列的搜索意图强度值调整为原来的1/3,也就是new_strengthsinger=old_strengthsinger/3.0,解决“神”等库外乱取名的翻唱歌曲排得过高的问题。
对文本相关性队列的搜索意图强度进行全局调整可以包括:
A2、如果音乐影集队列中的搜索结果数大于5并且音乐影集队列的搜索意图强度值大于0.9,文本相关性队列的搜索意图强度可以调整为原来的1/2,也就是new_strengthtext=old_strengthtext/2,解决视频需求排得过低的情况,例如“电视剧爱闪亮主题曲”等。
B2、如果歌词队列的搜索意图强度strength>0.64、翻唱比例>0.79、第二次搜索比例>0.99、库内检索比例<0.01、并且termnum>5,文本相关性队列的搜索意图强度可以调整为原来的1/2,也就是new_strengthtext=old_strengthtext/2,解决翻唱歌曲排得过高歌词排得过低的情况,例如“你存在我深深的脑海里我的心里”等。其中,音乐文档的文本字段中可以有一个字段表示这首歌曲是否是翻唱歌曲,统计搜索词命中该字段的比例就可以得到翻唱比例。
步骤S308,设置所述结果队列的总条数以及与不同搜索意图强度值对应的预定条数piece_num。
总条数以及预定条数piece_num的设定可以根据实际的需要以及经验数据进行设定。例如,可以按照表一进行设定。表一中,假设总条数为100条。
表一
搜索意图强度范围 总条数 piece_num
1 [0.0,0.3999] 100 1
2 (0.3999,0.6999] 100 2
3 (0.6999,0.8999] 100 3
4 (0.8999,0.9999] 100 4
5 (0.9999,1.0] 100 4
进一步的,可以对各队列的piece_num进行进一步的调整。例如可以设定文本相关性队列的piece_num=1。如果一页展示n条时,piece_num可以扩展为piece_num=piece_num*max(1,n/10),等等。当然,也可以不考虑文本相关性队列,先将各个成分队列融合后,再与原始的搜索结果列表进行融合。可以理解的是,piece_num的设定可以根据实际的需要以及经验数据进行设定,例如可以参考首页展示量、产品特性等因素进行调整,以便体验上达到最优。
步骤S309,根据各成分队列的文本匹配度以及所述搜索词命中所述文本字段的命中概率计算并记录各成分队列中排在首位的搜索结果的第二权重值;
具体的,可以根据公式(10)进行计算。
公式(10)中,score表示第二权重值,于本实施例中,当视频队列或者歌词队列或者两个队列的成分匹配得分l4_score小于0.1时,score=strengthα*(1/(qpos+1))β
其他情况下,第二权重值就是非成分匹配得分l4_non_comp_score,l4_non_comp_score=Wcover*cover+Wprox*max_prox。具体可以参考第一实施例中的相关描述,这里不再赘述。
步骤S310,将第二权重值排在首位的成分队列中排序在预定条数piece_num内的搜索结果依次选出插入至所述结果队列中;
步骤S311,当选出的搜索结果的第二权重值小于已插入结果队列中的搜索结果的第二权重值的平均值时,重新计算该成分队列中剩余搜索结果的第二权重值。
返回步骤S310,直到插入所述结果队列的搜索结果的数量达到所述总条数或者所述各成分队列已为空,得到结果队列(步骤S312)。
步骤S313,服务器将所述结果队列发送给所述音乐搜索客户端。
步骤S314,音乐搜索客户端通过所述用户终端将所述结果队列中的结果展示给用户。
图14为采用本实施例的技术方案搜索“江南”后生成的搜索结果首页的示意图。与图1及图2相比,很清楚的可以看到,采用本实施例中的技术方案后,搜索结果首页所展示的结果,多种成分都会混排进来,首页可以直接满足用户多样性的需求。
另外,下面将以搜索指标和搜索结果页面对比等方式来说明本方案的效果。其中,搜索指标包括系统指标、用户反馈搜索不满意比、整体满意度评测等几个方面。其中,系统指标是客观指标,包括点击率、播放率、零结果率、数据覆盖率等。用户反馈搜索不满意比是主观指标。
通过测试,采用本实施例提供的排序方法后,搜索结果点击率由现有技术的77%提高到110%,播放率由现有技术的63%提高到73%,零结果率由现有技术的2.4%降低到0.9%,数据覆盖率由现有技术的85.9%提高到89.6%。用户反馈搜索不满意比(千份比)由现有技术的1.2‰降低至0.5‰。
图15显示的是采用现有技术搜索“香奈儿”后生成的搜索结果首页,图16显示的是采用本实施例的技术方案搜索“香奈儿”后生成的搜索结果首页;图17显示的是采用现有技术搜索“做自己”后生成的搜索结果首页,图18显示的是采用本实施例的技术方案搜索“做自己”后生成的搜索结果首页。通过对比图15和图16以及图17和图18可以看出,采用本实施例中的技术方案后,搜索结果首页所展示的结果,多种成分都会混排进来,扩展性也好,首页直接满足了用户多样性的需求。
综上所述,本发明实施例提供的搜索结果处理方法,将搜索结果列表中的搜索结果分别按照各成分进行排序形成多个成分队列,然后根据各成分队列的搜索意图强度值对所述多个成分队列进行排序以形成结果队列,在混排时,考虑到不同成分的搜索意图强度,各个成分队列都展示一部分,可以满足多种需求,扩展性也很好。
第四实施例
图19为本发明第四实施例提供的一种搜索结果处理装置的结构示意图。请参照图19,本实施例提出的装置可运行于服务器,用于实现第一实施例提出的搜索结果处理方法,本实施例中的装置40可以包括:
接收模块41,用于接收客户端发送的搜索请求,所述搜索请求中包括用户通过所述客户端输入的搜索词;
搜索结果获取模块42,用于根据所述搜索词进行搜索得到搜索结果列表,所述搜索结果列表中的搜索结果对应于多个成分;
成分队列形成模块43,用于将所述搜索结果列表中的搜索结果分别按照各成分进行排序形成多个成分队列,每个成分队列中包括被列入该成分队列的多个搜索结果,每个所述搜索结果包括所述搜索结果的相关性因子;
成分队列混排模块44,用于根据各成分队列中每个搜索结果的相关性因子,设置各成分队列的搜索意图强度值、计算各成分队列的第一权重值,根据各成分队列的搜索意图强度值以及第一权重值对所述多个成分队列进行排序以形成结果队列;以及
发送模块45,用于将所述结果队列发送给所述用户终端进行展示。
优选的,所述搜索结果列表中的多个搜索结果以及所述各成分队列中的搜索结果均按照所述搜索词与所述搜索结果的文本相关性由高到低排列。
进一步的,所述成分列表中的多个成分中至少包括与所述文本字段对应的成分,所述成分队列形成模块43还用于:在所述搜索结果列表中分别查找命中各文本字段的搜索结果;将查找到的搜索结果分别放入与各文本字段对应成分的成分队列中,所述各成分队列中的搜索结果按照所述搜索结果在所述搜索结果列表中的顺序排列。
所述相关性因子还可以包括:所述搜索结果的搜索热度、第二次搜索比例、队列命中比例、文件来源比例、库内搜索比例、以及库外搜索比例中的一种或几种的组合。
进一步的,请参照图17,所述成分队列混排模块44可以包括搜索意图强度值设置单元441,用于:
根据所述成分队列中每个搜索结果对应的命中概率设置所述成分队列的搜索意图强度,命中概率越高的搜索结果所对应的搜索意图强度值越大;或者
根据所述搜索词命中所述成分队列中每个搜索结果对应的命中概率以及第二次搜索比例设置所述成分队列的搜索意图强度,命中概率越高的搜索结果对应的搜索意图强度值越大,在所述命中概率相同的条件下,如果所述第二次搜索比例大于预定值,则通过检验值对所述搜索意图强度进行校验;或者
根据所述搜索词命中所述成分队列中每个搜索结果对应的命中概率以及对列命中比例设置所述成分队列的搜索意图强度,命中概率越高的搜索结果对应的搜索意图强度值越大,在所述命中概率相同的条件下,队列命中比例越高的搜索结果对应的搜索意图强度值越大;或者
根据搜索结果的搜索热度设置所述成分队列的搜索意图强度,搜索热度越高的搜索结果对应的搜索意图强度值越大。
所述成分队列混排模块44还可以包括第一权重值计算单元442,用于:
根据公式 计算各成分队列的第一权重值,其中W为第一权重值,findoor为第一次库内搜索比例,foutdoor 为第一次库内搜索比例,Sindoor为第二次库内搜索比例,Soutdoor为第二次库内搜索比例, dis_num为各成分队列中搜索结果的数量。
进一步的,所述成分队列混排模块44还包括全局调整单元443,用于:
根据第一次库内搜索比例、第一次库外搜索比例、第二次库内搜索比例、第二次库外搜索的比例的线性加权值,对所述成分队列的搜索意图强度值进行初始化;
根据初始化后的成分队列的搜索意图强度值以及所述成分队列的第一权重值与其他成分队列的第一权重值的差值,对所述成分队列的搜索意图强度值进行调整,如果所述成分队列的第一权重值与其他成分队列的第一权重值的差值大于零,所述成分队列调整后的搜索意图强度值大于调整前的搜索意图强度值,如果所述成分队列的第一权重值与其他成分队列的第一权重值的差值小于零,所述成分队列调整后的搜索意图强度值小于调整前的搜索意图强度值,如果所述成分队列的第一权重值与其他成分队列的第一权重值的差值是等于零,所述成分队列调整后的搜索意图强度值等于调整前的搜索意图强度值。
进一步的,所述成分队列混排模块44还包括混排单元444,用于:
设置所述结果队列的总条数以及与不同搜索意图强度值对应的预定条数;
根据各成分队列的文本匹配度以及所述搜索词命中所述文本字段的命中概率计算并记录各成分队列中排在首位的搜索结果的第二权重值;
将第二权重值排在首位的成分队列中排序在预定条数内的搜索结果依次选出插入至所述结果队列中;
当选出的搜索结果的第二权重值小于已插入结果队列中的搜索结果的第二权重值的平均值时,重新计算该成分队列中剩余搜索结果的第二权重值;
返回所述将第二权重值排在首位的成分队列中排序在预定条数内的搜索结果依次选出插入至所述结果队列中的步骤,直到插入所述结果队列的搜索结果的数量达到所述总条数或者所述各成分队列已为空。
进一步的,所述文本字段可以包括歌曲名字段、歌手名字段、专辑名字段以及歌词字段中的一种或多种的组合。
本发明实施例提供的搜索结果处理装置,将搜索结果列表中的搜索结果分别按照各成分进行排序形成多个成分队列,然后根据各成分队列的搜索意图强度值对所述多个成分队列进行排序以形成结果队列,在混排时,考虑到不同成分的搜索意图强度,各个成分队列都展示一部分,可以满足多种需求,扩展性也很好。
以上各模块可以是由软件代码实现,此时,上述的各模块可存储于服务器200的存储器201内。以上各模块同样可以由硬件例如集成电路芯片实现。
需要说明的是,本发明实施例的服务器的各功能模块的功能可根据上述方法实施例中的方法具体实现,其具体实现过程可以参照上述方法实施例的相关描述,在此不赘述。
需要说明的是,上述实施例中的模块可以运行于一个总的服务器也可以运行于多个服务器,例如web服务器、搜索服务器等,服务器的数量以及功能的设置可以根据具体的实施场景以及实施条件进行变化,这样的变化并不影响本发明的保护范围。
本实施例提供的搜索结果处理装置,将搜索结果列表中的搜索结果分别按照各成分进行排序形成多个成分队列,然后根据各成分队列的搜索意图强度值对所述多个成分队列进行排序以形成结果队列,在混排时,考虑到不同成分的搜索意图强度,各个成分队列都展示一部分,可以满足多种需求,扩展性也很好。
第五实施例
图21为本发明第四实施例提供的一种搜索结果处理装置的结构示意图。请参照图21,本实施例提出的装置可运行于用户终端,用于实现第二实施例提出的搜索结果处理方法,本实施例中的装置50可以包括:
接收模块51,用于接收用户输入的搜索词;
发送模块52,用于向服务器发送搜索请求,所述搜索请求中包括所述搜索词,以使所述服务器根据所述搜索词进行搜索得到搜索结果列表,将所述搜索结果列表中的搜索结果分别按照各成分进行排序形成多个成分队列,每个成分队列中包括被列入该成分队列的多个搜索结果,每个所述搜索结果包括所述搜索结果的相关性因子,根据各成分队列中每个搜索结果的相关性因子,设置各成分队列的搜索意图强度值、计算各成分队列的第一权重值,根据各成分队列的搜索意图强度值以及第一权重值对所述多个成分队列进行排序以形成结果队列;以及
展示模块53,用于接收并展示所述服务器返回的所述结果队列。
以上各模块可以是由软件代码实现,此时,上述的各模块可存储于用户终端100的存储器内。以上各模块同样可以由硬件例如集成电路芯片实现。
需要说明的是,本发明实施例的各功能模块的功能可根据上述方法实施例中的方法具体实现,其具体实现过程可以参照上述方法实施例的相关描述,在此不赘述。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,该的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,虽然本发明已以较佳实施例揭露如上,然而并非用以限定本发明,任何熟悉本专业的技术人员,在不脱离本发明技术方案范围内,当可利用上述揭示的技术内容做出些许更动或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本发明技术方案的范围内。

Claims (16)

1.一种搜索结果处理方法,其特征在于,所述方法包括:
服务器接收客户端发送的搜索请求,所述搜索请求中包括用户通过所述客户端输入的搜索词;
根据所述搜索词进行搜索得到搜索结果列表所述搜索结果列表中的搜索结果对应于多个成分;
将所述搜索结果列表中的搜索结果分别按照各成分进行排序形成多个成分队列,每个成分队列中包括被列入该成分队列的多个搜索结果,每个所述搜索结果包括所述搜索结果的相关性因子;
根据各成分队列中每个搜索结果的相关性因子,设置各成分队列的搜索意图强度值、计算各成分队列的第一权重值,根据各成分队列的搜索意图强度值以及第一权重值对所述多个成分队列进行排序以形成结果队列;以及
将所述结果队列发送给用户终端进行展示;
其中,所述搜索结果列表中的多个搜索结果以及所述各成分队列中的搜索结果均按照所述搜索词与所述搜索结果的文本相关性由高到低排列。
2.如权利要求1所述的搜索结果处理方法,其特征在于,所述搜索请求中包括类型标识,每个所述搜索结果包括所述搜索结果的文本信息,所述文本信息包括至少一个文本字段,所述类型标识对应的成分列表中的多个成分中至少包括与所述文本字段对应的成分,所述将所述搜索结果列表中的搜索结果分别按照各成分进行排序形成多个成分队列的步骤包括:
在所述搜索结果列表中分别查找命中各文本字段的搜索结果;
将查找到的搜索结果分别放入与各文本字段对应成分的成分队列中,所述各成分队列中的搜索结果按照所述搜索结果在所述搜索结果列表中的顺序排列。
3.如权利要求1所述的搜索结果处理方法,其特征在于,所述相关性因子还包括:所述搜索结果的搜索热度、第二次搜索比例、队列命中比例、文件来源比例、库内搜索比例、以及库外搜索比例中的一种或几种的组合。
4.如权利要求3所述的搜索结果处理方法,其特征在于,所述根据各成分队列中每个搜索结果的相关性因子,设置各成分队列的搜索意图强度值的步骤,包括:
根据所述成分队列中每个搜索结果对应的命中概率设置所述成分队列的搜索意图强度,命中概率越高的搜索结果所对应的搜索意图强度值越大;或者
根据所述搜索词命中所述成分队列中每个搜索结果对应的命中概率以及第二次搜索比例设置所述成分队列的搜索意图强度,命中概率越高的搜索结果对应的搜索意图强度值越大,在所述命中概率相同的条件下,如果所述第二次搜索比例大于预定值,则通过检验值对所述搜索意图强度进行校验;或者
根据所述搜索词命中所述成分队列中每个搜索结果对应的命中概率以及对列命中比例设置所述成分队列的搜索意图强度,命中概率越高的搜索结果对应的搜索意图强度值越大,在所述命中概率相同的条件下,队列命中比例越高的搜索结果对应的搜索意图强度值越大;或者
根据搜索结果的搜索热度设置所述成分队列的搜索意图强度,搜索热度越高的搜索结果对应的搜索意图强度值越大。
5.如权利要求3所述的搜索结果处理方法,其特征在于,所述根据各成分队列中每个搜索结果的相关性因子,计算各成分队列的第一权重值的步骤,包括:
根据公式计算各成分队列的第一权重值,其中W为第一权重值,findoor为第一次库内搜索比例,foutdoor为第一次库外搜索比例,Sindoor为第二次库内搜索比例,Soutdoor为第二次库外搜索比例,dist_num为各成分队列中搜索结果的数量,discount为校正值。
6.如权利要求3所述的搜索结果处理方法,其特征在于,所述根据各成分队列的搜索意图强度值以及第一权重值对所述多个成分队列进行排序以形成结果队列的步骤之前,还包括:
根据第一次库内搜索比例、第一次库外搜索比例、第二次库内搜索比例、第二次库外搜索的比例的线性加权值,对所述成分队列的搜索意图强度值进行初始化;
根据初始化后的成分队列的搜索意图强度值以及所述成分队列的第一权重值与其他成分队列的第一权重值的差值,对所述成分队列的搜索意图强度值进行调整。
7.如权利要求1所述的搜索结果处理方法,其特征在于,每个所述搜索结果包括所述搜索结果的文本信息,所述文本信息包括至少一个文本字段,所述根据各成分队列的搜索意图强度值以及第一权重值对所述多个成分队列进行排序以形成结果队列的步骤,包括:
根据各成分队列的文本匹配度以及所述搜索词命中所述文本字段的命中概率计算并记录各成分队列中排在首位的搜索结果的第二权重值;
将第二权重值排在首位的成分队列中排序在预定条数内的搜索结果依次选出插入至所述结果队列中;
当选出的搜索结果的第二权重值小于已插入结果队列中的搜索结果的第二权重值的平均值时,重新计算该成分队列中剩余搜索结果的第二权重值;
返回所述将第二权重值排在首位的成分队列中排序在预定条数内的搜索结果依次选出插入至所述结果队列中的步骤,直到插入所述结果队列的搜索结果的数量达到总条数。
8.一种搜索结果处理方法,其特征在于,所述方法包括:
用户终端通过客户端接收用户输入的搜索词;
向服务器发送搜索请求,所述搜索请求中包括所述搜索词,以使所述服务器根据所述搜索词进行搜索得到搜索结果列表,将所述搜索结果列表中的搜索结果分别按照各成分进行排序形成多个成分队列,每个成分队列中包括被列入该成分队列的多个搜索结果,每个所述搜索结果包括所述搜索结果的相关性因子,根据各成分队列中每个搜索结果的相关性因子,设置各成分队列的搜索意图强度值、计算各成分队列的第一权重值,根据各成分队列的搜索意图强度值以及第一权重值对所述多个成分队列进行排序以形成结果队列;以及
接收并展示所述服务器返回的所述结果队列;
其中,所述搜索结果列表中的多个搜索结果以及所述各成分队列中的搜索结果均按照所述搜索词与所述搜索结果的文本相关性由高到低排列。
9.一种搜索结果处理装置,其特征在于,所述装置包括:
接收模块,用于接收客户端发送的搜索请求,所述搜索请求中包括用户通过所述客户端输入的搜索词;
搜索结果获取模块,用于根据所述搜索词进行搜索得到搜索结果列表,所述搜索结果列表中的搜索结果对应于多个成分;
成分队列形成模块,用于将所述搜索结果列表中的搜索结果分别按照各成分进行排序形成多个成分队列,每个成分队列中包括被列入该成分队列的多个搜索结果,每个所述搜索结果包括所述搜索结果的相关性因子;
成分队列混排模块,用于根据各成分队列中每个搜索结果的相关性因子,设置各成分队列的搜索意图强度值、计算各成分队列的第一权重值,根据各成分队列的搜索意图强度值以及第一权重值对所述多个成分队列进行排序以形成结果队列;以及
发送模块,用于将所述结果队列发送给用户终端进行展示;
其中,所述搜索结果列表中的多个搜索结果以及所述各成分队列中的搜索结果均按照所述搜索词与所述搜索结果的文本相关性由高到低排列。
10.如权利要求9所述的搜索结果处理装置,其特征在于,所述搜索请求中包括类型标识,每个所述搜索结果包括所述搜索结果的文本信息,所述文本信息包括至少一个文本字段,所述类型标识对应的成分列表中的多个成分中至少包括与所述文本字段对应的成分,所述成分队列形成模块还用于:
在所述搜索结果列表中分别查找命中各文本字段的搜索结果;
将查找到的搜索结果分别放入与各文本字段对应成分的成分队列中,所述各成分队列中的搜索结果按照所述搜索结果在所述搜索结果列表中的顺序排列。
11.如权利要求9所述的搜索结果处理装置,其特征在于,所述相关性因子还包括:所述搜索结果的搜索热度、第二次搜索比例、队列命中比例、文件来源比例、库内搜索比例、以及库外搜索比例中的一种或几种的组合。
12.如权利要求11所述的搜索结果处理装置,其特征在于,所述成分队列混排模块包括搜索意图强度值设置单元,用于:
根据所述成分队列中每个搜索结果对应的命中概率设置所述成分队列的搜索意图强度,命中概率越高的搜索结果所对应的搜索意图强度值越大;或者
根据所述搜索词命中所述成分队列中每个搜索结果对应的命中概率以及第二次搜索比例设置所述成分队列的搜索意图强度,命中概率越高的搜索结果对应的搜索意图强度值越大,在所述命中概率相同的条件下,如果所述第二次搜索比例大于预定值,则通过检验值对所述搜索意图强度进行校验;或者
根据所述搜索词命中所述成分队列中每个搜索结果对应的命中概率以及对列命中比例设置所述成分队列的搜索意图强度,命中概率越高的搜索结果对应的搜索意图强度值越大,在所述命中概率相同的条件下,队列命中比例越高的搜索结果对应的搜索意图强度值越大;或者
根据搜索结果的搜索热度设置所述成分队列的搜索意图强度,搜索热度越高的搜索结果对应的搜索意图强度值越大。
13.如权利要求11所述的搜索结果处理装置,其特征在于:所述成分队列混排模块包括第一权重值计算单元,用于根据公式计算各成分队列的第一权重值,其中W为第一权重值,findoor为第一次库内搜索比例,foutdoor为第一次库外搜索比例,Sindoor为第二次库内搜索比例,Soutdoor为第二次库外搜索比例,dist_num为各成分队列中搜索结果的数量,discount为校正值。
14.如权利要求11所述的搜索结果处理装置,其特征在于:所述成分队列混排模块包括全局调整单元,用于:
根据第一次库内搜索比例、第一次库外搜索比例、第二次库内搜索比例、第二次库外搜索的比例的线性加权值,对所述成分队列的搜索意图强度值进行初始化;
根据初始化后的成分队列的搜索意图强度值以及所述成分队列的第一权重值与其他成分队列的第一权重值的差值,对所述成分队列的搜索意图强度值进行调整。
15.如权利要求9所述的搜索结果处理装置,其特征在于,每个所述搜索结果包括所述搜索结果的文本信息,所述文本信息包括至少一个文本字段,所述成分队列混排模块包括混排单元,用于:
根据各成分队列的文本匹配度以及所述搜索词命中所述文本字段的命中概率计算并记录各成分队列中排在首位的搜索结果的第二权重值;
将第二权重值排在首位的成分队列中排序在预定条数内的搜索结果依次选出插入至所述结果队列中;
当选出的搜索结果的第二权重值小于已插入结果队列中的搜索结果的第二权重值的平均值时,重新计算该成分队列中剩余搜索结果的第二权重值;
返回所述将第二权重值排在首位的成分队列中排序在预定条数内的搜索结果依次选出插入至所述结果队列中的步骤,直到插入所述结果队列的搜索结果的数量达到总条数。
16.一种搜索结果处理装置,运行于用户终端,其特征在于,所述装置包括:
接收模块,用于接收用户输入的搜索词;
发送模块,用于向服务器发送搜索请求,所述搜索请求中包括所述搜索词,以使所述服务器根据所述搜索词进行搜索得到搜索结果列表,将所述搜索结果列表中的搜索结果分别按照各成分进行排序形成多个成分队列,每个成分队列中包括被列入该成分队列的多个搜索结果,每个所述搜索结果包括所述搜索结果的相关性因子,根据各成分队列中每个搜索结果的相关性因子,设置各成分队列的搜索意图强度值、计算各成分队列的第一权重值,根据各成分队列的搜索意图强度值以及第一权重值对所述多个成分队列进行排序以形成结果队列;以及
展示模块,用于接收并展示所述服务器返回的所述结果队列;
其中,所述搜索结果列表中的多个搜索结果以及所述各成分队列中的搜索结果均按照所述搜索词与所述搜索结果的文本相关性由高到低排列。
CN201410782649.3A 2014-12-16 2014-12-16 搜索结果处理方法及装置 Active CN105760381B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410782649.3A CN105760381B (zh) 2014-12-16 2014-12-16 搜索结果处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410782649.3A CN105760381B (zh) 2014-12-16 2014-12-16 搜索结果处理方法及装置

Publications (2)

Publication Number Publication Date
CN105760381A CN105760381A (zh) 2016-07-13
CN105760381B true CN105760381B (zh) 2019-08-13

Family

ID=56337091

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410782649.3A Active CN105760381B (zh) 2014-12-16 2014-12-16 搜索结果处理方法及装置

Country Status (1)

Country Link
CN (1) CN105760381B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106503066B (zh) * 2016-09-29 2019-10-15 北京百度网讯科技有限公司 基于人工智能的处理搜索结果方法和装置
CN106776763B (zh) * 2016-11-22 2019-12-06 北京云知声信息技术有限公司 目的地搜索方法及装置
WO2019090779A1 (zh) * 2017-11-13 2019-05-16 深圳市华阅文化传媒有限公司 阅读app对源网站进行排序的方法及装置
CN109815004B (zh) * 2017-11-21 2022-11-04 腾讯科技(深圳)有限公司 请求负载控制方法、装置、存储介质和计算机设备
CN110390574A (zh) * 2018-04-20 2019-10-29 阿里巴巴集团控股有限公司 业务对象的确定方法和装置
US11106722B2 (en) * 2018-05-07 2021-08-31 Apple Inc. Lyric search service
CN108803970B (zh) * 2018-05-08 2021-06-04 平安科技(深圳)有限公司 场景匹配展示方法及终端设备
CN109063108B (zh) * 2018-07-27 2020-03-03 北京字节跳动网络技术有限公司 搜索排序方法、装置、计算机设备和存储介质
CN109408710A (zh) * 2018-09-26 2019-03-01 斑马网络技术有限公司 搜索结果优化方法、装置、系统及存储介质
CN109284416A (zh) * 2018-11-02 2019-01-29 山东省通信管理局 一种基于内容的海量音频快速检索方法
CN111241400B (zh) * 2020-01-14 2023-04-25 北京字节跳动网络技术有限公司 一种信息搜索方法及装置
CN113704363A (zh) * 2020-05-22 2021-11-26 百度在线网络技术(北京)有限公司 一种权重确定方法、装置、设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101079048A (zh) * 2006-05-24 2007-11-28 上海万纬信息技术有限公司 基于软件机器人排除标准的互联网信息搜索引擎及方法
CN101398836A (zh) * 2008-11-11 2009-04-01 丘雷 基于主客观指标及权重分配的搜索排序方法
CN103186671A (zh) * 2013-03-28 2013-07-03 百度在线网络技术(北京)有限公司 用于移动终端的搜索方法、搜索系统及移动终端
CN104077407A (zh) * 2014-07-10 2014-10-01 中国工商银行股份有限公司 一种智能数据搜索系统及方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101079048A (zh) * 2006-05-24 2007-11-28 上海万纬信息技术有限公司 基于软件机器人排除标准的互联网信息搜索引擎及方法
CN101398836A (zh) * 2008-11-11 2009-04-01 丘雷 基于主客观指标及权重分配的搜索排序方法
CN103186671A (zh) * 2013-03-28 2013-07-03 百度在线网络技术(北京)有限公司 用于移动终端的搜索方法、搜索系统及移动终端
CN104077407A (zh) * 2014-07-10 2014-10-01 中国工商银行股份有限公司 一种智能数据搜索系统及方法

Also Published As

Publication number Publication date
CN105760381A (zh) 2016-07-13

Similar Documents

Publication Publication Date Title
CN105760381B (zh) 搜索结果处理方法及装置
US11151145B2 (en) Tag selection and recommendation to a user of a content hosting service
US10853415B2 (en) Systems and methods of classifying content items
US11281620B2 (en) Method of and system for enhanced local-device content discovery
US8117256B2 (en) Methods and systems for exploring a corpus of content
US9552428B2 (en) System for generating media recommendations in a distributed environment based on seed information
US9076148B2 (en) Dynamic pricing models for digital content
US8285735B2 (en) System and method for creating metadata
US8117193B2 (en) Tunersphere
KR101994987B1 (ko) 관련 엔티티들
US8108378B2 (en) Podcast search engine
KR101175858B1 (ko) 검색 결과 페이지에 인터랙티브 요소를 포함하는 시스템 및 그 방법
US9369514B2 (en) Systems and methods of selecting content items
US20070067429A1 (en) Delivery method for digital content based on stored, preferential, contextual, and/or situational data
US20070078832A1 (en) Method and system for using smart tags and a recommendation engine using smart tags
US20100198818A1 (en) Dynamic identification of a new set of media items responsive to an input mediaset
US20110246485A1 (en) Systems and methods for grouping users based on metadata tag relevance ratings
US20090094190A1 (en) Methods, systems, and computer program products for displaying tag words for selection by users engaged in social tagging of content
CN106708817B (zh) 信息搜索方法及装置
US20150235236A1 (en) Media dissemination system
US20120078909A1 (en) Information select apparatus and information select method

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant