CN104951484A - 搜索结果的处理方法和装置 - Google Patents
搜索结果的处理方法和装置 Download PDFInfo
- Publication number
- CN104951484A CN104951484A CN201410432832.0A CN201410432832A CN104951484A CN 104951484 A CN104951484 A CN 104951484A CN 201410432832 A CN201410432832 A CN 201410432832A CN 104951484 A CN104951484 A CN 104951484A
- Authority
- CN
- China
- Prior art keywords
- search results
- cluster
- results
- audio
- fingerprint information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种搜索结果的处理方法和装置。其中,该方法包括:获取多个搜索结果,检索结果由检索系统依据检索式检索得出;对每个搜索结果进行聚合校验处理,得到每个搜索结果的聚类校验结果;比较每个搜索结果的聚类校验结果,若聚类校验结果之间的区别小于预定阈值,则将聚类校验结果之间的区别小于预定阈值的任意至少两个搜索结果进行聚类,得到聚类结果集合,聚类结果集合与检索式对应;将聚类结果集合中的至少一个搜索结果输出至前端进行显示。本发明解决了现有技术提供的搜索方法获取到的搜索结果重复率高,导致搜索结果不准确的技术问题。
Description
技术领域
本发明涉及计算机互联网领域,具体而言,涉及一种搜索结果的处理方法和装置。
背景技术
随着大数据时代的来临,如何在海量数据中获取用户需要的信息已经成为热门的研究课题,现有技术的搜索引擎可以为用户提供搜索功能,使得用户在前端客户端输入搜索式之后,就可以从大量数据中筛选得到满足用户搜索需求的数据,即用户在搜索输入框中输入搜索式之后,搜索引擎就可以根据该搜索式查询得到对应的搜索结果给前段客户端,并显示在前段客户端中。
上述搜索引擎提供的功能满足了为用户过滤无效信息的需求,但由于现有互联网中存在的数据量过大,数据来源也较多,因此搜索结果中存在大量实际内容重复的资源,导致用户查阅搜索结果效率低的问题。
例如,以互联网提供的音乐资源为例,随着互联网音乐产业的飞速发展,用户通过互联网来搜索及点播音乐的需求越来越大,因此互联网上提供的音乐资源也是海量的。需要说明的是,针对音乐制作的现况,经常出现同一首歌收录在唱片公司发行多张的专辑中,因此,互联网可以针对一首音乐提供至少两个搜索结果,当用户进行歌曲搜索的时候,就出现了重复的歌曲内容,而且会同时全部展现。
这种现有的展现全部歌曲的方式导致了用户仍旧面对的是大量数据,仍旧无法快速高效的获取最优的搜索结果给用户,对用户并非最佳体验。
针对上述现有技术提供的搜索方法获取到的搜索结果重复率高,导致搜索结果不准确的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种搜索结果的处理方法和装置,以至少解决现有技术提供的搜索方法获取到的搜索结果重复率高,导致搜索结果不准确的技术问题。
根据本发明实施例的一个方面,提供了一种搜索结果的处理方法,该方法包括:获取多个搜索结果,检索结果由检索系统依据检索式检索得出;对每个多个搜索结果进行聚合校验处理,得到每个搜索结果的聚类校验结果;比较每个搜索结果的聚类校验结果,若聚类校验结果之间的区别小于预定阈值,则将聚类校验结果之间的区别小于预定阈值的任意至少两个搜索结果进行聚类,得到聚类结果集合,聚类结果集合与检索式对应;将聚类结果集合中的至少一个搜索结果输出至前端进行显示。
根据本发明实施例的另一方面,还提供了一种搜索结果的处理装置,该装置包括:获取模块,用于获取多个搜索结果,检索结果由检索系统依据检索式检索得出;聚合校验模块,用于对每个多个搜索结果进行聚合校验处理,得到每个搜索结果的聚类校验结果;聚类处理模块,用于比较每个搜索结果的聚类校验结果,若聚类校验结果之间的区别小于预定阈值,则将聚类校验结果之间的区别小于预定阈值的任意至少两个搜索结果进行聚类,得到聚类结果集合,聚类结果集合与检索式对应;输出模块,用于将聚类结果集合中的至少一个搜索结果输出至前端进行显示。
在本发明实施例中,采用获取多个搜索结果,检索结果由检索系统依据检索式检索得出;对每个多个搜索结果进行聚合校验处理,得到每个搜索结果的聚类校验结果;比较每个搜索结果的聚类校验结果,若聚类校验结果之间的区别小于预定阈值,则将聚类校验结果之间的区别小于预定阈值的任意至少两个搜索结果进行聚类,得到聚类结果集合,聚类结果集合与检索式对应;将聚类结果集合中的至少一个搜索结果输出至前端进行显示的方式,通过对搜索式对应的多个搜索结果进行统一的聚合校验处理,使得每个搜索结果具备进行聚类的基础,聚合校验处理得到的聚类校验结果可以表征每个搜索结果进行后续聚类的聚类对象,在将聚类校验结果相同的搜索结果进行聚类之后,就可以得到聚类结果集合,由于该聚类结果集合将所有的搜索结果进行了归类划分,因此,在提取搜索式对应的聚类结果集合中的一个搜索结果进行显示之后,提供给前端客户端显示的搜索结果就不是所有搜索结果,而是去除了具备重复属性的搜索结果,从而解决了现有技术提供的搜索方法获取到的搜索结果重复率高,导致搜索结果不准确的技术问题,提升了用户获取信息的效率。为用户提供了优化后的搜索体验。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是本发明实施例的一种运行搜索结果的处理方法的计算机终端的硬件结构框图;
图2是根据本发明实施例一的搜索结果的处理方法的流程图;
图3是根据本发明实施例一的以互联网提供的音乐资源为例的搜索结果的处理方法的详细流程图;
图4是根据本发明实施例二的搜索结果的处理装置的结构示意图;
图5是根据本发明实施例二的一种可选的搜索结果的处理装置的结构示意图;
图6是根据本发明实施例二的一种可选的搜索结果的处理装置的结构示意图;
图7是根据本发明实施例二的一种可选的搜索结果的处理装置的结构示意图;
图8是根据本发明实施例二的一种可选的搜索结果的处理装置的结构示意图;
图9是根据本发明实施例二的一种可选的搜索结果的处理装置的结构示意图;
图10是根据本发明实施例二的一种可选的搜索结果的处理装置的结构示意图;
图11是根据本发明实施例二的一种可选的搜索结果的处理装置的结构示意图;以及
图12是根据本发明实施例的一种移动终端的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
下面对本申请涉及到的名词进行解释:
歌曲元数据:指歌曲名、歌手名、专辑名等歌曲描述信息。
md5算法:Message Digest Algorithm MD5(中文名为消息摘要算法第五版)为计算机安全领域广泛使用的一种散列函数,用以提供消息的完整性保护。该算法的文件号为RFC 1321(R.Rivest,MIT Laboratory forComputer Science and RSA Data Security Inc.April 1992)。
音频指纹技术:音频指纹技术(Audio fingerprinting technology)是一种通用音频处理技术。它能根据旋律准确识别歌名、歌手、专辑名等信息。识别后的歌曲无论在音乐播放软件中,还是在MP3播放器中都会显示正确信息。应用这项技术可以为每一首歌曲编制音频特征码,从而实现歌曲的精确匹配和识别。
搜索功能:通过关键字查询信息的技术。
实施例1
本申请实施例一所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。以运行在计算机终端上为例,图1是本发明实施例的一种运行搜索结果的处理方法的计算机终端的硬件结构框图。如图1所示,计算机终端10可以包括一个或多个(图中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器104、以及用于通信功能的传输装置106。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算机终端10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
存储器104可用于存储应用软件的软件程序以及模块,如本发明实施例中的搜索结果的处理方法对应的程序指令/模块,处理器102通过运行存储在存储器104内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的搜索结果的处理方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至移动终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括移动终端10的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(Network Interface Controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
在上述运行环境下,本申请提供了如图2所示的搜索结果的处理方法。图2是根据本发明实施例一的搜索结果的处理方法的流程图。
如图2所示,该搜索结果的处理方法可以包括如下步骤:
步骤S20,可以通过图1所示的计算机终端10获取多个搜索结果,所述检索结果由检索系统依据检索式检索得出。
本申请上述步骤S20可以由与上述计算机终端10具有通信关系的前端客户端提供的检索系统的搜索输入框来接收检索式,检索式可以包括至少一个搜索词,搜索词可以是用户输入的搜索项,也可以是系统默认提供的搜索项,前端客户端会将查询得到的搜索结果发送给上述计算机终端10。
以互联网提供的音乐资源为例,上述检索系统可以为音乐检索系统,该音乐检索系统对应一个音乐数据库,搜索式可以是用于从音乐数据库中搜索音乐资源的搜索词的组合,例如:歌手姓名、歌曲名词、专辑名词,以及上述词语的组合。
在上述获取搜索式对应的多个搜索结果的过程中,具体的,可以通过检索系统提供的搜索引擎来执行搜索功能,对当前接收到的搜索式进行查询,得到该搜索式在数据库中存储的所有搜索结果。
仍旧以互联网提供的音乐资源为例,上述搜索结果可以是互联网音乐数据库提供的音乐资源,音乐资源可以由歌曲元数据构成,歌曲元数据可以包括歌曲下载地址、歌曲播放地址、歌曲名称、歌手名成、专辑名等歌曲描述信息。
步骤S22,可以通过图1所示的计算机终端10对每个搜索结果进行聚合校验处理,得到每个搜索结果的聚类校验结果。
本申请上述步骤S22中的聚合校验处理功能可以实现,针对当前搜索词对应的每个搜索结果都采用相同的聚合校验处理的算法进行计算,聚合校验处理的算法是指对每个搜索结果采用相同的归一化的处理方法进行计算,使得每个搜索结果具备了相互对比的基础。
步骤S24,可以通过图1所示的计算机终端10来实现比较每个搜索结果的聚类校验结果,若聚类校验结果之间的区别小于预定阈值,则将聚类校验结果之间的区别小于预定阈值的任意至少两个搜索结果进行聚类,得到聚类结果集合,聚类结果集合与检索式对应。
由于搜索结果进行聚合校验处理之后得到的聚类校验结果之间存在一定的差异,本申请可以提供一种聚类方案,对差异值小于等于一定预定阈值范围之内的搜索结果进行聚类。
以互联网提供的音乐资源为例,一种可选实施例中,在上述搜索结果为音频的情况下,可以采用音频指纹技术作为聚合校验处理的算法对每个搜索结果进行计算,生成每个搜索结果的音频指纹信息作为聚类校验结果,音频指纹信息可以是包含了音频的一组旋律特征码的音频特征码。此时,可以利用两个音频的旋律特征码的相似度比对来确定两个搜索结果是否进行聚类,如果两个音频的两组旋律特征码比对之后,区别小于预定阈值10%,即两个音频的旋律特征码的相似度超过90%,则认为两个音频是可以进行后续的聚类处理。
例如,一个搜索结果为刘德华演唱的忘情水的原声大碟版本,是一个原声音频文件,另一个搜索结果为刘德华演唱的忘情水的演唱会版本,是一个演唱会音频文件,由于演唱会版本比较原声大碟版本包含了较多杂音,显然两个文件不同,且原声音频文件的文件大小会小于演唱会音频文件的文件大小。利用上述音频指纹技术对两个文件分别进行指纹识别,生成原声大碟版本的音频指纹信息和演唱会版本的音频指纹信息,此时,可以将两个版本的音频指纹信息中的两组旋律特征码进行比对,如果两组旋律特征码中不同的旋律特征码小于10%,即相似度超过了90%,则可以确认原声大碟版本和演唱会版本的音频可以进行后续的聚类处理。
此处需要说明的是,采用音频指纹技术对每个搜索结果进行计算,生成的聚类校验结果是一个文件,文件大小一般为10k至20k之件,小于音频本身的文件大小。
另一种可选实施例中,在采用标签标识提取所述每个搜索结果的标签信息的聚合校验处理的方案中,如果两个搜索结果的标签信息中包含的不相同的标签的数量小于等于一个标签(即预定阈值为1),则仍旧认为这两个搜索结果是相似或相同的对象进行后续的聚类处理。
例如,一个搜索结果为刘德华演唱的忘情水的原声大碟版本,其标签信息可以包括:刘德华、滚石唱片、忘情水、抒情歌曲、好听;另一个搜索结果为刘德华演唱的忘情水的演唱会版本,其标签可以包括:刘德华、演唱会版本、忘情水、抒情歌曲、好听,此时,判断可知这两个搜索结果的标签信息中仅包含一个不同的标签,则可以确定这两个搜索结果可以作为相似的对象进行后续的聚类处理,如果演唱会版本中的标签“刘德华”为“梅艳芳”或其他标签,则可以确定此时的两个搜索结果的区别大于预定阈值,无法进行后续的聚类处理。
此处仅为举例说明,本申请不限于此。
本申请提供的一种优选方案中,可以采用将聚类校验结果相同的搜索结果进行聚类的方案,来得到搜索式对应的聚类结果集合。
此处需要说明的是,本申请上述步骤S24中的聚类可以是合并处理,此处的合并处理可以是指将所有聚类校验结果进行归类,作为一个集合进行保存。保存的方式可以采用所有的搜索结果不进行删减全部保存,也可以根据搜索结果的近似度进行删减,例如,将两个各个属性完全相同的搜索结果进行整合,即只保留一个搜索结果在聚类结果集合中。
仍旧以互联网提供的音乐资源为例,如果两条音乐资源的各项歌曲元数据都相同,则可以删除其中一个音乐资源,只保留一个音乐资源在聚类结果集合中,如果两条音乐资源的歌曲元数据重合度大于一定阈值,但没有完全相同,例如,两个音乐资源中歌手名称、歌曲名称都相同,只有专辑名称不同,则这两个音乐资源不仅可以进行聚类,而且都保存在聚类结果集合中。
步骤S26,可以通过图1所示的计算机终端10将所述聚类结果集合中的至少一个搜索结果输出至前端的客户端进行显示。
本申请上述步骤S26实现了,在前端客户端显示当前搜索式对应的搜索结果时,对于聚合后的搜索结果,仅显示一个搜索结果的信息,后台自动帮助客户过滤掉了重复的搜索结果,大大提高了用户的搜索效率。
仍旧以互联网提供的音乐资源为例,上述方案应用在音乐软件中之后,可以将相同的歌曲进行聚类,将聚类后的结果显示给用户,为用户提供了优化后的搜索结果。
由此可知,本申请上述实施例一提供方案,通过对搜索式对应的多个搜索结果进行统一的聚合校验处理,使得每个搜索结果具备进行聚类的基础,聚合校验处理得到的聚类校验结果可以表征每个搜索结果进行后续聚类的聚类对象,在将聚类校验结果相同的搜索结果进行聚类之后,就可以得到聚类结果集合,由于该聚类结果集合将所有的搜索结果进行了归类划分,因此,在提取搜索式对应的聚类结果集合中的一个搜索结果进行显示之后,提供给前端客户端显示的搜索结果就不是所有搜索结果,而是去除了具备重复属性的搜索结果,从而解决了现有技术提供的搜索方法获取到的搜索结果重复率高,导致搜索结果不准确的技术问题,提升了用户获取信息的效率。为用户提供了优化后的搜索体验。
本申请上述实施例提供的方案中,步骤S22执行的对每个搜索结果进行聚合校验处理,得到每个搜索结果的聚类校验结果的步骤可以通过以下任意一种或多种方式实现:
方式一:通过MD5算法对搜索结果中的每个属性参数进行计算,生成搜索结果的聚类校验结果,其中,聚类校验结果为搜索结果对应的MD5值。
上述方式一提供了一种利用MD5算法进行聚合校验处理的计算方式。仍旧以互联网提供的音乐资源为例,搜索引擎获取到当前输入的搜索式获取到音乐资源之后,通过对音乐资源中的每个歌曲的歌曲名称、歌手名称、专辑名称、播放链接进行md5计算,记录每个歌曲的md5值,md5值即为每个歌曲的聚类校验结果。
此处需要说明的是,在计算搜索结果对应的MD5值的过程中,计算歌曲元数据摘要信息也可以采用CRC8、CRC16、CRC32、SHA1、SHA256、SHA384、SHA512、RIPEMD、PANAMA、TIGER、ADLER32等摘要算法。另外,在歌曲元数据信息选取方面,也可以采用isrc、所属专辑upc等作为歌曲元数据信息。
方式二:使用标签标识提取每个搜索结果的标签信息,其中,搜索结果的聚类校验结果为标签信息。
上述方式二提供了一种较为简洁的聚合校验处理方法,通过提取每个搜索结果的标签信息来确定聚类校验结果。此处需要说明的是,上述标签信息可以为预先设置的具有相同属性的参数,此时,每个标签信息即为每个歌曲的聚类校验结果。
仍旧以互联网提供的音乐资源为例,系统可以提供一个标签数据库,该标签数据库保存了多个音乐资源属性与标签信息的对应关系表,在获取到搜索结果之后,可以将搜索结果的属性与标签数据库中的音乐资源属性进行比对,查找得到对应的标签信息作为当前搜索结果的标签信息,该过程为系统自动学习过程,标签数据库可以是定时维护或更新的。
此处的标签信息还可以为用户反馈标签,搜索引擎获取到当前输入的搜索式获取到音乐资源之后,可以通过大数据挖掘等手段,依次读取音乐资源中的每个歌曲的可信的用户反馈标签。搜索引擎可以提供标签入口(一般情况下是一种开放式的输入框,待用户输入标签信息之后进行保存)来记录歌曲的用户反馈标签,用户反馈标签的内容可以是歌曲信息、喜好程度等多类信息,或者搜索引擎可以提供选择菜单给用户,用户通过选择的方式来确定歌曲的用户反馈标签。这种方式可以按照用户的偏好来对歌曲进行划分。
方式三:在搜索结果为音频的情况下,通过音频指纹技术对搜索结果进行计算,生成搜索结果的聚类校验结果,其中,聚类校验结果为搜索结果对应的音频指纹信息。
上述方式三提供了一种利用音频指纹技术进行聚合校验处理的计算方式。仍旧以互联网提供的音乐资源为例,搜索引擎获取到当前输入的搜索式获取到音乐资源之后,采用音频指纹技术对音乐资源中的每个歌曲的音频文件进行音频指纹计算,记录每个歌曲的音频指纹信息,音频指纹信息即为每个歌曲的聚类校验结果。
由此可知,本申请提供音乐资源可以是在互联网音乐平台PC、移动终端、WEB网页等平台中搜索到的歌曲,搜索引擎可以根据歌曲元数据的md5值、用户反馈标签、音频音频指纹信息实现歌曲聚合的功能,进而将具有相同聚类校验结果的歌曲聚合在一起,并返回给用户。
此处需要说明的是,本申请提供的上述三种计算聚类校验结果的方式,每种方式得到的聚类校验结果都可以作为独立的结果作为后续的聚类对象,即本申请可以利用搜索引擎将搜索结果的MD5值,或者搜索结果的标签信息,或者搜索结果的音频指纹信息分别进行后续聚类处理。
以互联网提供的音乐资源为例,本申请可以分别利用搜索到的音乐资源中每个歌曲的md5值、用户反馈标签、音频指纹信息进行合并,具有相同md5值的歌曲可以进行合并,或者具有相同的用户反馈标签的歌曲可以进行合并,或者具有相同的音频指纹信息的歌曲进行合并。
此处还需要说明的是,除了上述利用三种聚类校验结果各自独立作为聚类对象进行后续的聚类处理,本申请还提供了将上述三种聚类校验结果进行组合,来进行后续的聚类处理的方法,下面就对组合式的聚类方法进行详细说明。
在本申请提供的第一种可选方案中,步骤S24实现的比较每个搜索结果的聚类校验结果,若聚类校验结果之间的区别小于预定阈值,则将聚类校验结果之间的区别小于预定阈值的任意至少两个搜索结果进行聚类的步骤,可以通过执行如下步骤实现:
步骤S241a,判断每个搜索结果对应的MD5值是否相同,在搜索结果对应的MD5值相同的情况下,执行步骤S243a,在搜索结果对应的MD5值不相同的情况下,执行步骤S245a。
步骤S243a,执行将MD5值相同的搜索结果进行聚类的步骤。
步骤S245a,提取MD5值不相同的搜索结果所对应的音频指纹信息,并将MD5值不相同的搜索结果中具有相同的音频指纹信息的搜索结果进行聚类。
本申请上述步骤S241a至步骤S245a提供的方案实现了,在将每个搜索结果按照计算得到的MD5值进行聚类之后,进一步对MD5值不相同的搜索结果按照音频指纹信息进行聚类,实现了后台进一步滤掉了重复的搜索结果,使得聚类结果更加准确,用户在前端浏览的搜索结果更加简洁,大大提高了用户的搜索效率,提升了用户获取信息的效率。
在本申请提供的第二种可选方案中,步骤S24实现的比较每个搜索结果的聚类校验结果,若聚类校验结果之间的区别小于预定阈值,则将聚类校验结果之间的区别小于预定阈值的任意至少两个搜索结果进行聚类的步骤,可以通过执行如下步骤实现:
步骤S241b,判断每个搜索结果的标签信息是否相同,在搜索结果对应的标签信息相同的情况下,执行步骤S253b,在搜索结果对应的标签信息不相同的情况下,执行步骤S255b。
步骤S243b,执行将标签信息相同的搜索结果进行聚类的步骤。
步骤S245b,提取标签信息不相同的搜索结果所对应的音频指纹信息,并将标签信息不相同的搜索结果中具有相同的音频指纹信息的搜索结果进行聚类。
本申请上述步骤S241b至步骤S245b提供的方案实现了,在将每个搜索结果按照得到的标签信息进行聚类之后,进一步对标签信息不相同的搜索结果按照音频指纹信息进行聚类,实现了后台进一步滤掉了重复的搜索结果,使得聚类结果更加准确,用户在前端浏览的搜索结果更加简洁,大大提高了用户的搜索效率,提升了用户获取信息的效率。
在本申请提供的第三种可选方案中,步骤S24实现的比较每个搜索结果的聚类校验结果,若聚类校验结果之间的区别小于预定阈值,则将聚类校验结果之间的区别小于预定阈值的任意至少两个搜索结果进行聚类的步骤,可以通过执行如下步骤实现:
步骤S241c,判断每个搜索结果对应的音频指纹信息是否相同,在搜索结果对应的音频指纹信息相同的情况下,执行步骤S243c,在搜索结果对应的音频指纹信息不相同的情况下,执行步骤S245c。
步骤S243c,执行将音频指纹信息相同的搜索结果进行聚类的步骤。
步骤S245c,提取音频指纹信息不相同的搜索结果所对应的MD5值,并将音频指纹信息不相同的搜索结果中具有相同的MD5值的搜索结果进行聚类。
本申请上述步骤S241c至步骤S245c提供的方案实现了,在将每个搜索结果按照计算得到的音频指纹信息进行聚类之后,进一步对音频指纹信息不相同的搜索结果按照计算得到的MD5值进行聚类,实现了后台进一步滤掉了重复的搜索结果,使得聚类结果更加准确,用户在前端浏览的搜索结果更加简洁,大大提高了用户的搜索效率,提升了用户获取信息的效率。
在本申请提供的第四种可选方案中,步骤S24实现的比较每个搜索结果的聚类校验结果,若聚类校验结果之间的区别小于预定阈值,则将聚类校验结果之间的区别小于预定阈值的任意至少两个搜索结果进行聚类的步骤,可以通过执行如下步骤实现:
步骤S241d,判断每个搜索结果对应的音频指纹信息是否相同,在搜索结果对应的音频指纹信息相同的情况下,执行步骤S243d,在搜索结果对应的音频指纹信息不相同的情况下,执行步骤S245d。
步骤S243d,执行将音频指纹信息相同的搜索结果进行聚类的步骤。
步骤S245d,,提取音频指纹信息不相同的搜索结果所对应的标签信息,并将音频指纹信息不相同的搜索结果中具有相同的标签信息的搜索结果进行聚类。
本申请上述步骤S241d至步骤S245d提供的方案实现了,在将每个搜索结果按照计算得到的音频指纹信息进行聚类之后,进一步对音频指纹信息不相同的搜索结果按照提取到的标签信息进行聚类,实现了后台进一步滤掉了重复的搜索结果,使得聚类结果更加准确,用户在前端浏览的搜索结果更加简洁,大大提高了用户的搜索效率,提升了用户获取信息的效率。
优选地,在本申请上述实施例提供的各个可选的或优选的实施例中,在步骤S26执行输出搜索式对应的聚类结果集合中的一个搜索结果至前端进行显示的方案之前,还可以执行如下步骤:
步骤S251,读取聚类结果集合中每个搜索结果的一个或多个属性数据,属性数据为:搜索结果的访问次数、搜索结果的文件大小值或搜索结果的标题名称。
步骤S253,根据属性数据获取搜索结果对应的排序值,将排序值最大的搜索结果设置为前端显示的搜索结果,将其他搜索结果隐藏,其中,在触发调用上述排序值最大的搜索结果对应的下拉框时,将上述隐藏的搜索结果显示在对应的下拉框中。
本申请上述步骤S251和步骤S253实现了一种聚类结果集合在前端的显示方法,在上述优选的显示方法中,可以先按照每个搜索结果的属性数据进行排序,然后选择排序最高的搜索结果作为代表显示在前端。
仍旧以互联网提供的音乐资源为例,搜索结果的访问次数可以为歌曲的点播次数或者下载次数,搜索结果的文件大小可以是歌曲的文件大小(歌曲的文件大小可以表征该歌曲的音质高低或者该歌曲是否是无损的),搜索结果的标题名称可以是歌曲的名称或者歌曲的歌手名称或歌曲的专辑名词等。
例如,按照歌曲的文件大小对搜索结果进行排序的方案中,可以将歌曲文件大小值最大的歌曲作为最优的搜索结果进行显示,而其他搜索结果作为被聚合内容进行隐藏处理,只有在点击打开最优搜索结果对应的下拉框时,上述隐藏的搜索结果将在下拉框中显示。由于歌曲文件大时可以表征该歌曲的音质较好且是无损的,因此,显示音质最好的歌曲给用户,使得用户的搜索结果更准确。
优选地,在执行步骤S251来读取聚类结果集合中每个搜索结果的属性数据之后,还可以获取搜索结果所包含的每个属性数据的权重值。
由此,可以通过如下方式来实现根据属性数据获取搜索结果对应的排序值:根据权重值最大的属性数据来确定搜索结果的排序值;或者,累加搜索结果的所有属性数据的权重值来确定搜索结果的排序值。
此处需要说明的是,由于每个搜索结果的每个属性数据都可以影响搜索结果的显示,因此,上述方案提供了一种综合考虑搜索结果的所有属性数据,来确定搜索结果的显示结果。预先对每个属性数据设定对应的权重值,然后利用权重最大的属性数据作为排列依据对搜索结果进行排序,或者将搜索结果的每个属性数据的权重值乘以每个属性数据的基础值,得到该搜索结果的一个排序值,将排序值最大的搜索结果作为最优搜索结果进行显示。
下面就结合图3,以互联网提供的音乐资源为例,将上述实施例一提供的方案应用在音乐软件中进行音乐的歌曲聚合功能进行详细描述,使得在用户使用音乐软件搜索得到歌曲结果时,同样类型的歌曲会聚合在一起,仅显示最优的音乐搜索结果。
步骤A,在具有搜索功能的客户端或web站点中,用户在搜索功能提供的搜索框中输入搜索式,此时,前端把用户输入的搜索式发送到后台,通过搜索引擎来实现根据用户的搜索式查询得到满足该搜索式的所有搜索结果,搜索结果此时可以为音乐资源。上述搜索式由至少一个搜索关键词构成。
步骤B,对当前搜索式的每个搜索结果进行计算,得到搜索结果的以下任意一个或多个聚类校验结果:音乐资源的MD5值、音乐资源的标签信息和音乐资源的音频指纹信息。
步骤C,根据音乐资源中的歌曲元数据MD5值,或者音乐资源中歌曲对应的标签信息(该标签信息可以是用户预先提交的标签)来判断搜索结果是否可以聚合,即确定音乐资源是否可以合并。在搜索结果可以合并的情况下,进入步骤E,否则,进入步骤D。
步骤D,进一步对没有进行聚合的音乐资源进一步根据音频指纹判断对应的搜索结果是否可以聚合,如果可以聚合,则执行步骤E,否则,执行步骤I。
本申请上述步骤C和D可以采用如下任意一种方案进行替换。例如,一种该可选的方案是,搜索引擎可以将搜索结果中歌曲的md5值信息相同的歌曲进行聚合,或者将搜索结果中用户反馈标签相同的歌曲进行聚合,或者将搜索结果中音频指纹信息相同的搜索结果进行聚合。
此处需要说明的是,本申请上述实施例中,搜索引擎可以通过歌曲的歌曲名程、歌手名称、专辑名称、播放链接来计算歌曲的md5值;可以通过大数据挖掘等手段,提取并记录歌曲可信的用户反馈标签;搜索引擎还可以通过音频指纹技术计算歌曲音频文件的音频指纹,得到并记录歌曲的音频指纹信息。
步骤E,将聚合后的搜索结果返回给前端客户端。
步骤F,前端对聚合的搜索结果默认只展示最优的一条搜索结果,并将其他搜索结果作为被聚合内容进行隐藏。该步骤实现了搜索引擎可以返回给前端用户最优的搜索结果及该最优的搜索结果对应的被聚合内容。
此处需要说明的是,该步骤中最优的搜索结果可以通过上述步骤S281和步骤S283提供的方案来获取。
步骤G,用户通过点击最优搜索结果来获取对应的下拉框,将上述由于聚合而被隐藏的搜索结果加载至下拉框中。
步骤H,在该下拉框中展开显示上述由于聚合而被隐藏的搜索结果。由此可知,本申请提供的方案实现了用户默认看到最优的搜索结果,只有点击提示下拉信息才可以看到被聚合的其他搜索结果的内容。
步骤I,将有聚合的搜索结果的信息返回给前端,此时标识当前搜索式对应的搜索结果中没有可以聚合的内容。
步骤J,在前端展示搜索结果。
由此可知,本申请提供的上述方案基于音乐元数据信息、用户反馈标签、音频音频指纹信息对歌曲进行聚类的方案,可以实现互联网音乐产品将同一类歌曲聚合展现的产品交互方式。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
实施例2
根据本发明实施例,还提供了一种用于实施上述方法实施例的装置实施例,本申请上述实施例所提供的装置可以在计算机终端上运行。
图4是根据本发明实施例二的搜索结果的处理装置的结构示意图。
如图4所示,该搜索结果的处理装置可以包括:获取模块40、聚合校验模块42、聚类处理模块44和输出模块46。
其中,获取模块40,用于获取多个搜索结果,检索结果由检索系统依据检索式检索得出;聚合校验模块42,用于对每个搜索结果进行聚合校验处理,得到每个搜索结果的聚类校验结果;聚类处理模块44,用于比较每个搜索结果的聚类校验结果,若聚类校验结果之间的区别小于预定阈值,则将聚类校验结果之间的区别小于预定阈值的任意至少两个搜索结果进行聚类,得到聚类结果集合,聚类结果集合与检索式对应;输出模块46,用于将聚类结果集合中的至少一个搜索结果输出至前端进行显示。
本申请上述实施例二提供方案,通过对搜索式对应的多个搜索结果进行统一的聚合校验处理,使得每个搜索结果具备进行聚类的基础,聚合校验处理得到的聚类校验结果可以表征每个搜索结果进行后续聚类的聚类对象,在将聚类校验结果相同的搜索结果进行聚类之后,就可以得到聚类结果集合,由于该聚类结果集合将所有的搜索结果进行了归类划分,因此,在提取搜索式对应的聚类结果集合中的一个搜索结果进行显示之后,提供给前端客户端显示的搜索结果就不是所有搜索结果,而是去除了具备重复属性的搜索结果,从而解决了现有技术提供的搜索方法获取到的搜索结果重复率高,导致搜索结果不准确的技术问题,提升了用户获取信息的效率。为用户提供了优化后的搜索体验。
本申请上述方案可以通过前端客户端提供的检索系统的搜索输入框来接收检索式,检索式可以包括至少一个搜索式,搜索式可以是用户输入的搜索项,也可以是系统默认提供的搜索项。
以互联网提供的音乐资源为例,上述检索系统可以为音乐检索系统,该音乐检索系统对应一个音乐数据库,搜索式可以是用于从音乐数据库中搜索音乐资源的搜索词的组合,例如:歌手姓名、歌曲名词、专辑名词,以及上述词语的组合。
在上述获取搜索式对应的多个搜索结果的过程中,具体的,可以通过检索系统提供的搜索引擎来执行搜索功能,对当前接收到的搜索式进行查询,得到该搜索式在数据库中存储的所有搜索结果。
仍旧以互联网提供的音乐资源为例,上述搜索结果可以是互联网音乐数据库提供的音乐资源,音乐资源可以由歌曲元数据构成,歌曲元数据可以包括歌曲下载地址、歌曲播放地址、歌曲名称、歌手名成、专辑名等歌曲描述信息。
此处需要说明的是,本申请上述方案中的聚合校验处理功能可以实现,针对当前搜索词对应的每个搜索结果都采用相同的聚合校验处理的算法进行计算,这种对每个搜索结果采用相同的归一化的处理方法进行计算,使得每个搜索结果具备了相互对比的基础。
由于搜索结果进行聚合校验处理之后得到的聚类校验结果之间存在一定的差异,本申请可以提供一种聚类方案,对差异值小于等于一定预定阈值范围之内的搜索结果进行聚类,例如,在采用标签标识提取所述每个搜索结果的标签信息的聚合校验处理的方案中,如果两个搜索结果的标签信息中包含的不相同的标签的数量小于等于一个标签,则仍旧认为这两个搜索结果是相似或相同的对象进行后续的聚类处理。此处仅为举例说明,本申请不限于此。
本申请提供的一种优选方案中,可以采用将聚类校验结果相同的搜索结果进行聚类的方案,来得到搜索式对应的聚类结果集合。
优选地,本申请上述方案中采用的聚类可以是合并处理,此处的合并处理可以是指将所有聚类校验结果进行归类,作为一个集合进行保存。保存的方式可以采用所有的搜索结果不进行删减全部保存,也可以根据搜索结果的近似度进行删减,例如,将两个各个属性完全相同的搜索结果进行整合,即只保留一个搜索结果在聚类结果集合中。
仍旧以互联网提供的音乐资源为例,如果两条音乐资源的各项歌曲元数据都相同,则可以删除其中一个音乐资源,只保留一个音乐资源在聚类结果集合中,如果两条音乐资源的歌曲元数据重合度大于一定阈值,但没有完全相同,例如,两个音乐资源中歌手名称、歌曲名称都相同,只有专辑名称不同,则这两个音乐资源也可以进行聚类,都保存在聚类结果集合中。
由此可知,在前端客户端显示当前搜索式对应的搜索结果时,对于聚合后的搜索结果,仅显示一个搜索结果的信息,后台自动帮助客户过滤掉了重复的搜索结果,大大提高了用户的搜索效率。
仍旧以互联网提供的音乐资源为例,上述方案应用在音乐软件中之后,可以将相同的歌曲进行聚类,将聚类后的结果显示给用户,为用户提供了优化后的搜索结果。
此处还需要说明的是,上述获取模块40、聚合校验模块42、聚类处理模块44和输出模块46对应于实施例一中的步骤S20至步骤S26,四个模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例一所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例一提供的计算机终端10中。
优选地,如图5所示,本申请上述实施例中的聚合校验模块42可以包括以下任意一种或多种功能模块:第一子处理模块421、第二子处理模块423和第三子处理模块425。
其中,第一子处理模块421,用于通过MD5算法对搜索结果中的每个属性参数进行计算,生成搜索结果的聚类校验结果,其中,聚类校验结果为搜索结果对应的MD5值;第二子处理模块423,用于使用标签标识提取每个搜索结果的标签信息,其中,搜索结果的聚类校验结果为标签信息;第三子处理模块425,用于在搜索结果为音频的情况下,通过音频指纹技术对搜索结果进行计算,生成搜索结果的聚类校验结果,其中,聚类校验结果为搜索结果对应的音频指纹信息。
此处需要说明的是,上述第一子处理模块421、第二子处理模块423和第三子处理模块425对应于实施例一中用于实现步骤S22的三种实施方式,三个模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例一所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例一提供的计算机终端10中。
优选地,如图6所示的一种可选方案中,聚类处理模块44可以包括如下功能模块:第一判断模块441a和第一子聚类模块443a。
其中,第一判断模块441a,用于判断每个搜索结果对应的MD5值是否相同;第一子聚类模块443a,用于在搜索结果对应的MD5值相同的情况下,执行将MD5值相同的搜索结果进行聚类的步骤,在搜索结果对应的MD5值不相同的情况下,提取MD5值不相同的搜索结果所对应的音频指纹信息,并将MD5值不相同的搜索结果中具有相同的音频指纹信息的搜索结果进行聚类。
此处需要说明的是,上述第一判断模块441a和第一子聚类模块443a对应于实施例一中的步骤S241a至步骤S245a,二个模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例一所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例一提供的计算机终端10中。
优选地,如图7所示的一种可选方案中,聚类处理模块44可以包括如下功能模块:第二判断模块441b和第二子聚类模块443b。
其中,第二判断模块441b,用于判断每个搜索结果的标签信息是否相同;第二子聚类模块443b,用于在搜索结果对应的标签信息相同的情况下,执行将标签信息相同的搜索结果进行聚类的步骤,在搜索结果对应的标签信息不相同的情况下,提取标签信息不相同的搜索结果所对应的音频指纹信息,并将标签信息不相同的搜索结果中具有相同的音频指纹信息的搜索结果进行聚类。
此处需要说明的是,上述第二判断模块441b和第二子聚类模块443b对应于实施例一中的步骤S241b至步骤S245b,二个模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例一所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例一提供的计算机终端10中。
优选地,如图8所示的一种可选方案中,聚类处理模块44可以包括如下功能模块:第三判断模块441c和第三子聚类模块443c。
其中,第三判断模块441c,用于判断每个搜索结果对应的音频指纹信息是否相同;第三子聚类模块443c,用于在搜索结果对应的音频指纹信息相同的情况下,执行将音频指纹信息相同的搜索结果进行聚类的步骤,在搜索结果对应的音频指纹信息不相同的情况下,提取音频指纹信息不相同的搜索结果所对应的MD5值,并将音频指纹信息不相同的搜索结果中具有相同的MD5值的搜索结果进行聚类。
此处需要说明的是,上述第三判断模块441c和第三子聚类模块443c对应于实施例一中的步骤S241c至步骤S245c,二个模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例一所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例一提供的计算机终端10中。
优选地,如图9所示的一种可选方案中,聚类处理模块44可以包括如下功能模块:第四判断模块441d和第四子聚类模块443d。
其中,第四判断模块441d,用于判断每个搜索结果对应的音频指纹信息是否相同;第四子聚类模块443d,用于在搜索结果对应的音频指纹信息相同的情况下,执行将音频指纹信息相同的搜索结果进行聚类的步骤,在搜索结果对应的音频指纹信息不相同的情况下,提取音频指纹信息不相同的搜索结果所对应的标签信息,并将音频指纹信息不相同的搜索结果中具有相同的标签信息的搜索结果进行聚类。
此处需要说明的是,上述第四判断模块441d和第四子聚类模块443d对应于实施例一中的步骤S241d至步骤S245d,二个模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例一所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例一提供的计算机终端10中。
优选地,如图10所示,本申请上述实施例中,在执行输出模块46之前,装置还可以包括如下功能模块:读取模块451和排序模块453。
其中,读取模块451,用于读取聚类结果集合中每个搜索结果的一个或多个属性数据,属性数据为:搜索结果的访问次数、搜索结果的文件大小值或搜索结果的标题名称;排序模块453,用于根据属性数据获取搜索结果对应的排序值,将排序值最大的搜索结果设置为前端显示的搜索结果,将其他搜索结果隐藏,其中,在触发调用排序值最大的搜索结果对应的下拉框时,将隐藏的搜索结果显示在下拉框中。
此处需要说明的是,上述读取模块451和排序模块453对应于实施例一中的步骤S251和步骤S253,二个模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例一所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例一提供的计算机终端10中。
优选地,如图11所示,本申请上述实施例中,在执行读取模块451之后,装置还可以包括如下功能模块:子获取模块452,用于获取搜索结果所包含的每个属性数据的权重值;其中,上述排序模块453可以包括:第一确定模块4531,用于根据权重值最大的属性数据来确定搜索结果的排序值;或者,第二确定模块4533,用于累加搜索结果的所有属性数据的权重值来确定搜索结果的排序值。
此处需要说明的是,上述子获取模块452,以及排序模块453包含的第一确定模块4531,或者,第二确定模块4533对应于实施例一中用于确定搜索结果的排序值的相关步骤,几个模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例一所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例一提供的计算机终端10中。
实施例3
本发明的实施例可以提供一种移动终端。可选地,在本实施例中,上述移动终端也可以替换为掌上电脑等终端设备。
可选地,在本实施例中,上述移动终端可以位于互联网络的多个网络设备中的至少一个网络设备。
在本实施例中,上述移动终端可以执行搜索结果的处理方法中以下步骤的程序代码:获取多个搜索结果,检索结果由检索系统依据检索式检索得出;对每个搜索结果进行聚合校验处理,得到每个搜索结果的聚类校验结果;比较每个搜索结果的聚类校验结果,若聚类校验结果之间的区别小于预定阈值,则将聚类校验结果之间的区别小于预定阈值的任意至少两个搜索结果进行聚类,得到聚类结果集合,聚类结果集合与检索式对应;将聚类结果集合中的至少一个搜索结果输出至前端进行显示。
可选地,图12是根据本发明实施例的一种移动终端的结构框图。如图12所示,该移动终端可以包括:一个或多个(图中仅示出一个)处理器51、存储器53、用户接口55、显示器57、网络接口59、话筒61、扬声器63、耦合器65以及天线67。
其中,存储器53可用于存储软件程序以及模块,如本发明实施例中的搜索结果的处理方法和装置对应的程序指令/模块,处理器51通过运行存储在存储器53内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的搜索结果的处理方法。存储器53可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器53可进一步包括相对于处理器51远程设置的存储器,这些远程存储器可以通过网络连接至移动终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
上述的网络接口59用于经由一个网络接收或者发送数据。上述的网络具体实例可包括有线网络及无线网络。在一个实例中,网络接口59可以是IEEE 802.11网络接口、IEEE 802.16网络接口或3GPP接口,另外,还可以包括一个网络适配器(Network Interface Controller,NIC),其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中,网络接口59还可以为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
其中,具体地,存储器53用于存储预设动作条件和预设权限用户的信息、以及应用程序。
处理器51可以通过传输装置调用存储器53存储的信息及应用程序,以执行下述步骤:获取多个搜索结果,检索结果由检索系统依据检索式检索得出;对每个搜索结果进行聚合校验处理,得到每个搜索结果的聚类校验结果;比较每个搜索结果的聚类校验结果,若聚类校验结果之间的区别小于预定阈值,则将聚类校验结果之间的区别小于预定阈值的任意至少两个搜索结果进行聚类,得到聚类结果集合,聚类结果集合与检索式对应;将聚类结果集合中的至少一个搜索结果输出至前端进行显示。
可选的,上述处理器51还可以执行如下步骤的程序代码:通过MD5算法对搜索结果中的每个属性参数进行计算,生成搜索结果的聚类校验结果,其中,聚类校验结果为搜索结果对应的MD5值。
可选的,上述处理器51还可以执行如下步骤的程序代码:方式一:使用标签标识提取每个搜索结果的标签信息,其中,搜索结果的聚类校验结果为标签信息;方式二:在搜索结果为音频的情况下,通过音频指纹技术对搜索结果进行计算,生成搜索结果的聚类校验结果,其中,聚类校验结果为搜索结果对应的音频指纹信息。
可选的,上述处理器51还可以执行如下步骤的程序代码:判断每个搜索结果对应的MD5值是否相同;在搜索结果对应的MD5值相同的情况下,执行将MD5值相同的搜索结果进行聚类的步骤;在搜索结果对应的MD5值不相同的情况下,提取MD5值不相同的搜索结果所对应的音频指纹信息,并将MD5值不相同的搜索结果中具有相同的音频指纹信息的搜索结果进行聚类。
可选的,上述处理器51还可以执行如下步骤的程序代码:判断每个搜索结果的标签信息是否相同;在搜索结果对应的标签信息相同的情况下,执行将标签信息相同的搜索结果进行聚类的步骤;在搜索结果对应的标签信息不相同的情况下,提取标签信息不相同的搜索结果所对应的音频指纹信息,并将标签信息不相同的搜索结果中具有相同的音频指纹信息的搜索结果进行聚类。
可选的,上述处理器51还可以执行如下步骤的程序代码:判断每个搜索结果对应的音频指纹信息是否相同;在搜索结果对应的音频指纹信息相同的情况下,执行将音频指纹信息相同的搜索结果进行聚类的步骤;在搜索结果对应的音频指纹信息不相同的情况下,提取音频指纹信息不相同的搜索结果所对应的MD5值,并将音频指纹信息不相同的搜索结果中具有相同的MD5值的搜索结果进行聚类。
可选的,上述处理器51还可以执行如下步骤的程序代码:判断每个搜索结果对应的音频指纹信息是否相同;在搜索结果对应的音频指纹信息相同的情况下,执行将音频指纹信息相同的搜索结果进行聚类的步骤;在搜索结果对应的音频指纹信息不相同的情况下,提取音频指纹信息不相同的搜索结果所对应的标签信息,并将音频指纹信息不相同的搜索结果中具有相同的标签信息的搜索结果进行聚类。
可选的,上述处理器51还可以执行如下步骤的程序代码:读取聚类结果集合中每个搜索结果的一个或多个属性数据,属性数据为:搜索结果的访问次数、搜索结果的文件大小值或搜索结果的标题名称;根据属性数据获取搜索结果对应的排序值,将排序值最大的搜索结果设置为前端显示的搜索结果,将其他搜索结果隐藏,其中,在触发调用排序值最大的搜索结果对应的下拉框时,将隐藏的搜索结果显示在下拉框中。
可选的,上述处理器51还可以执行如下步骤的程序代码:获取搜索结果所包含的每个属性数据的权重值;其中,根据属性数据获取搜索结果对应的排序值的步骤包括:根据权重值最大的属性数据来确定搜索结果的排序值;或者,累加搜索结果的所有属性数据的权重值来确定搜索结果的排序值。
采用本发明实施例,提供了一种优化搜索结果的方案。通过对搜索式对应的多个搜索结果进行统一的聚合校验处理,使得每个搜索结果具备进行聚类的基础,聚合校验处理得到的聚类校验结果可以表征每个搜索结果进行后续聚类的聚类对象,在将聚类校验结果相同的搜索结果进行聚类之后,就可以得到聚类结果集合,由于该聚类结果集合将所有的搜索结果进行了归类划分,因此,在提取搜索式对应的聚类结果集合中的一个搜索结果进行显示之后,提供给前端客户端显示的搜索结果就不是所有搜索结果,而是去除了具备重复属性的搜索结果,从而解决了现有技术提供的搜索方法获取到的搜索结果重复率高,导致搜索结果不准确的技术问题,提升了用户获取信息的效率。为用户提供了优化后的搜索体验。
本领域普通技术人员可以理解,图5所示的结构仅为示意,移动终端也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌声电脑以及移动互联网设备(Mobile Internet Devices,MID)、PAD等终端设备。
图12其并不对上述电子装置的结构造成限定。例如,移动终端5还可包括比图12中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图12所示不同的配置。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(Random Access Memory,RAM)、磁盘或光盘等。
实施例4
本发明的实施例还提供了一种存储介质。可选地,在本实施例中,上述存储介质可以用于保存上述实施例一所提供的搜索结果的处理方法所执行的程序代码。
可选地,在本实施例中,上述存储介质可以位于计算机网络中计算机终端群中的任意一个计算机终端中,或者位于移动终端群中的任意一个移动终端中。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:获取多个搜索结果,检索结果由检索系统依据检索式检索得出;对每个搜索结果进行聚合校验处理,得到每个搜索结果的聚类校验结果;比较每个搜索结果的聚类校验结果,若聚类校验结果之间的区别小于预定阈值,则将聚类校验结果之间的区别小于预定阈值的任意至少两个搜索结果进行聚类,得到聚类结果集合,聚类结果集合与检索式对应;将聚类结果集合中的至少一个搜索结果输出至前端进行显示。
可选地,存储介质还被设置为存储用于执行以下步骤的程序代码:对每个搜索结果进行聚合校验处理,得到每个搜索结果的聚类校验结果的步骤包括以下任意一种或多种方式:方式一:通过MD5算法对搜索结果中的每个属性参数进行计算,生成搜索结果的聚类校验结果,其中,聚类校验结果为搜索结果对应的MD5值;方式二:使用标签标识提取每个搜索结果的标签信息,其中,搜索结果的聚类校验结果为标签信息;方式三:在搜索结果为音频的情况下,通过音频指纹技术对搜索结果进行计算,生成搜索结果的聚类校验结果,其中,聚类校验结果为搜索结果对应的音频指纹信息。
可选的,存储介质还被设置为存储用于执行以下步骤的程序代码:判断每个搜索结果对应的MD5值是否相同;在搜索结果对应的MD5值相同的情况下,执行将MD5值相同的搜索结果进行聚类的步骤;在搜索结果对应的MD5值不相同的情况下,提取MD5值不相同的搜索结果所对应的音频指纹信息,并将MD5值不相同的搜索结果中具有相同的音频指纹信息的搜索结果进行聚类。
可选的,存储介质还被设置为存储用于执行以下步骤的程序代码:判断每个搜索结果的标签信息是否相同;在搜索结果对应的标签信息相同的情况下,执行将标签信息相同的搜索结果进行聚类的步骤;在搜索结果对应的标签信息不相同的情况下,提取标签信息不相同的搜索结果所对应的音频指纹信息,并将标签信息不相同的搜索结果中具有相同的音频指纹信息的搜索结果进行聚类。
可选的,存储介质还被设置为存储用于执行以下步骤的程序代码:判断每个搜索结果对应的音频指纹信息是否相同;在搜索结果对应的音频指纹信息相同的情况下,执行将音频指纹信息相同的搜索结果进行聚类的步骤;在搜索结果对应的音频指纹信息不相同的情况下,提取音频指纹信息不相同的搜索结果所对应的MD5值,并将音频指纹信息不相同的搜索结果中具有相同的MD5值的搜索结果进行聚类。
可选的,存储介质还被设置为存储用于执行以下步骤的程序代码:判断每个搜索结果对应的音频指纹信息是否相同;在搜索结果对应的音频指纹信息相同的情况下,执行将音频指纹信息相同的搜索结果进行聚类的步骤;在搜索结果对应的音频指纹信息不相同的情况下,提取音频指纹信息不相同的搜索结果所对应的标签信息,并将音频指纹信息不相同的搜索结果中具有相同的标签信息的搜索结果进行聚类。
可选的,存储介质还被设置为存储用于执行以下步骤的程序代码:读取聚类结果集合中每个搜索结果的一个或多个属性数据,属性数据为:搜索结果的访问次数、搜索结果的文件大小值或搜索结果的标题名称;根据属性数据获取搜索结果对应的排序值,将排序值最大的搜索结果设置为前端显示的搜索结果,将其他搜索结果隐藏,其中,在触发调用排序值最大的搜索结果对应的下拉框时,将隐藏的搜索结果显示在下拉框中。
可选的,存储介质还被设置为存储用于执行以下步骤的程序代码:获取搜索结果所包含的每个属性数据的权重值;其中,根据属性数据获取搜索结果对应的排序值的步骤包括:根据权重值最大的属性数据来确定搜索结果的排序值;或者,累加搜索结果的所有属性数据的权重值来确定搜索结果的排序值。
可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
可选地,本实施例中的具体示例可以参考上述实施例1和实施例2中所描述的示例,本实施例在此不再赘述。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (18)
1.一种搜索结果的处理方法,其特征在于,包括:
获取多个搜索结果,所述检索结果由检索系统依据检索式检索得出;
对每个搜索结果进行聚合校验处理,得到每个搜索结果的聚类校验结果;
比较所述每个搜索结果的聚类校验结果,若所述聚类校验结果之间的区别小于预定阈值,则将所述聚类校验结果之间的区别小于预定阈值的任意至少两个搜索结果进行聚类,得到聚类结果集合,所述聚类结果集合与所述检索式对应;
将所述聚类结果集合中的至少一个搜索结果输出至前端进行显示。
2.根据权利要求1所述的方法,其特征在于,对每个所述多个搜索结果进行聚合校验处理,得到每个搜索结果的聚类校验结果的步骤包括:
通过MD5算法对所述搜索结果中的每个属性参数进行计算,生成所述搜索结果的所述聚类校验结果,其中,所述聚类校验结果为所述搜索结果对应的MD5值。
3.根据权利要求2所述的方法,其特征在于,对每个所述多个搜索结果进行聚合校验处理,得到每个搜索结果的聚类校验结果的步骤包括以下任意一种或多种方式:
方式一:使用标签标识提取所述每个搜索结果的标签信息,其中,所述搜索结果的所述聚类校验结果为所述标签信息;
方式二:在所述搜索结果为音频的情况下,通过音频指纹技术对所述搜索结果进行计算,生成所述搜索结果的所述聚类校验结果,其中,所述聚类校验结果为所述搜索结果对应的音频指纹信息。
4.根据权利要求3所述的方法,其特征在于,比较所述每个搜索结果的聚类校验结果,若所述聚类校验结果之间的区别小于预定阈值,则将所述聚类校验结果之间的区别小于预定阈值的任意至少两个搜索结果进行聚类的步骤包括:
判断所述每个搜索结果对应的MD5值是否相同;
在所述搜索结果对应的MD5值相同的情况下,执行将MD5值相同的搜索结果进行聚类的步骤;
在所述搜索结果对应的MD5值不相同的情况下,提取所述MD5值不相同的搜索结果所对应的音频指纹信息,并将所述MD5值不相同的搜索结果中具有相同的音频指纹信息的搜索结果进行聚类。
5.根据权利要求3所述的方法,其特征在于,比较所述每个搜索结果的聚类校验结果,若所述聚类校验结果之间的区别小于预定阈值,则将所述聚类校验结果之间的区别小于预定阈值的任意至少两个搜索结果进行聚类的步骤包括:
判断所述每个搜索结果的标签信息是否相同;
在所述搜索结果对应的所述标签信息相同的情况下,执行将所述标签信息相同的搜索结果进行聚类的步骤;
在所述搜索结果对应的所述标签信息不相同的情况下,提取所述标签信息不相同的搜索结果所对应的音频指纹信息,并将所述标签信息不相同的搜索结果中具有相同的音频指纹信息的搜索结果进行聚类。
6.根据权利要求3所述的方法,其特征在于,比较所述每个搜索结果的聚类校验结果,若所述聚类校验结果之间的区别小于预定阈值,则将所述聚类校验结果之间的区别小于预定阈值的任意至少两个搜索结果进行聚类的步骤包括:
判断所述每个搜索结果对应的音频指纹信息是否相同;
在所述搜索结果对应的所述音频指纹信息相同的情况下,执行将所述音频指纹信息相同的搜索结果进行聚类的步骤;
在所述搜索结果对应的所述音频指纹信息不相同的情况下,提取所述音频指纹信息不相同的搜索结果所对应的MD5值,并将所述音频指纹信息不相同的搜索结果中具有相同的MD5值的搜索结果进行聚类。
7.根据权利要求3所述的方法,其特征在于,比较所述每个搜索结果的聚类校验结果,若所述聚类校验结果之间的区别小于预定阈值,则将所述聚类校验结果之间的区别小于预定阈值的任意至少两个搜索结果进行聚类的步骤包括:
判断所述每个搜索结果对应的音频指纹信息是否相同;
在所述搜索结果对应的所述音频指纹信息相同的情况下,执行将所述音频指纹信息相同的搜索结果进行聚类的步骤;
在所述搜索结果对应的所述音频指纹信息不相同的情况下,提取所述音频指纹信息不相同的搜索结果所对应的标签信息,并将所述音频指纹信息不相同的搜索结果中具有相同的标签信息的搜索结果进行聚类。
8.根据权利要求1至7中任意一项所述的方法,其特征在于,在将所述聚类结果集合中的至少一个搜索结果输出至前端进行显示之前,所述方法还包括:
读取所述聚类结果集合中每个搜索结果的一个或多个属性数据,所述属性数据为:所述搜索结果的访问次数、所述搜索结果的文件大小值或所述搜索结果的标题名称;
根据所述属性数据获取所述搜索结果对应的排序值,将所述排序值最大的搜索结果设置为前端显示的搜索结果,将其他搜索结果隐藏,其中,在触发调用所述排序值最大的搜索结果对应的下拉框时,将所述隐藏的搜索结果显示在所述下拉框中。
9.根据权利要求8所述的方法,其特征在于,在读取所述聚类结果集合中每个搜索结果的属性数据之后,所述方法还包括:
获取搜索结果所包含的每个所述属性数据的权重值;
其中,根据所述属性数据获取所述搜索结果对应的排序值的步骤包括:根据权重值最大的属性数据来确定所述搜索结果的排序值;或者,累加所述搜索结果的所有属性数据的权重值来确定所述搜索结果的排序值。
10.一种搜索结果的处理装置,其特征在于,包括:
获取模块,用于获取多个搜索结果,所述检索结果由检索系统依据检索式检索得出;
聚合校验模块,用于对每个搜索结果进行聚合校验处理,得到每个搜索结果的聚类校验结果;
聚类处理模块,用于比较所述每个搜索结果的聚类校验结果,若所述聚类校验结果之间的区别小于预定阈值,则将所述聚类校验结果之间的区别小于预定阈值的任意至少两个搜索结果进行聚类,得到聚类结果集合,所述聚类结果集合与所述检索式对应;
输出模块,用于将所述聚类结果集合中的至少一个搜索结果输出至前端进行显示。
11.根据权利要求10所述的装置,其特征在于,所述聚合校验模块包括:
第一子处理模块,用于通过MD5算法对所述搜索结果中的每个属性参数进行计算,生成所述搜索结果的所述聚类校验结果,其中,所述聚类校验结果为所述搜索结果对应的MD5值。
12.根据权利要求11所述的装置,其特征在于,所述聚合校验模块还包括以下任意一种或多种功能模块:
第二子处理模块,用于使用标签标识提取所述每个搜索结果的标签信息,其中,所述搜索结果的所述聚类校验结果为所述标签信息;
第三子处理模块,用于在所述搜索结果为音频的情况下,通过音频指纹技术对所述搜索结果进行计算,生成所述搜索结果的所述聚类校验结果,其中,所述聚类校验结果为所述搜索结果对应的音频指纹信息。
13.根据权利要求12所述的装置,其特征在于,所述聚类处理模块包括:
第一判断模块,用于判断所述每个搜索结果对应的MD5值是否相同;
第一子聚类模块,用于在所述搜索结果对应的MD5值相同的情况下,执行将MD5值相同的搜索结果进行聚类的步骤,在所述搜索结果对应的MD5值不相同的情况下,提取所述MD5值不相同的搜索结果所对应的音频指纹信息,并将所述MD5值不相同的搜索结果中具有相同的音频指纹信息的搜索结果进行聚类。
14.根据权利要求12所述的装置,其特征在于,所述聚类处理模块包括:
第二判断模块,用于判断所述每个搜索结果的标签信息是否相同;
第二子聚类模块,用于在所述搜索结果对应的所述标签信息相同的情况下,执行将所述标签信息相同的搜索结果进行聚类的步骤,在所述搜索结果对应的所述标签信息不相同的情况下,提取所述标签信息不相同的搜索结果所对应的音频指纹信息,并将所述标签信息不相同的搜索结果中具有相同的音频指纹信息的搜索结果进行聚类。
15.根据权利要求12所述的装置,其特征在于,所述聚类处理模块包括:
第三判断模块,用于判断所述每个搜索结果对应的音频指纹信息是否相同;
第三子聚类模块,用于在所述搜索结果对应的所述音频指纹信息相同的情况下,执行将所述音频指纹信息相同的搜索结果进行聚类的步骤,在所述搜索结果对应的所述音频指纹信息不相同的情况下,提取所述音频指纹信息不相同的搜索结果所对应的MD5值,并将所述音频指纹信息不相同的搜索结果中具有相同的MD5值的搜索结果进行聚类。
16.根据权利要求12所述的装置,其特征在于,所述聚类处理模块包括:
第四判断模块,用于判断所述每个搜索结果对应的音频指纹信息是否相同;
第四子聚类模块,用于在所述搜索结果对应的所述音频指纹信息相同的情况下,执行将所述音频指纹信息相同的搜索结果进行聚类的步骤,在所述搜索结果对应的所述音频指纹信息不相同的情况下,提取所述音频指纹信息不相同的搜索结果所对应的标签信息,并将所述音频指纹信息不相同的搜索结果中具有相同的标签信息的搜索结果进行聚类。
17.根据权利要求10至16中任意一项所述的装置,其特征在于,所述装置还包括:
读取模块,用于读取所述聚类结果集合中每个搜索结果的一个或多个属性数据,所述属性数据为:所述搜索结果的访问次数、所述搜索结果的文件大小值或所述搜索结果的标题名称;
排序模块,用于根据所述属性数据获取所述搜索结果对应的排序值,将所述排序值最大的搜索结果设置为前端显示的搜索结果,将其他搜索结果隐藏,其中,在触发调用所述排序值最大的搜索结果对应的下拉框时,将所述隐藏的搜索结果显示在所述下拉框中。
18.根据权利要求17所述的装置,其特征在于,所述装置还包括:
子获取模块,用于获取搜索结果所包含的每个所述属性数据的权重值;
其中,所述排序模块包括:第一确定模块,用于根据权重值最大的属性数据来确定所述搜索结果的排序值;或者,第二确定模块,用于累加所述搜索结果的所有属性数据的权重值来确定所述搜索结果的排序值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410432832.0A CN104951484A (zh) | 2014-08-28 | 2014-08-28 | 搜索结果的处理方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410432832.0A CN104951484A (zh) | 2014-08-28 | 2014-08-28 | 搜索结果的处理方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104951484A true CN104951484A (zh) | 2015-09-30 |
Family
ID=54166147
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410432832.0A Pending CN104951484A (zh) | 2014-08-28 | 2014-08-28 | 搜索结果的处理方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104951484A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105955991A (zh) * | 2016-04-19 | 2016-09-21 | 乐视控股(北京)有限公司 | 一种搜索结果聚合及定位的方法和装置 |
CN106776601A (zh) * | 2015-11-19 | 2017-05-31 | 北京国双科技有限公司 | 搜索条件的配置方法及装置 |
CN107872685A (zh) * | 2017-11-20 | 2018-04-03 | 珠海市魅族科技有限公司 | 一种多媒体数据的播放方法、装置和计算机装置 |
CN108062334A (zh) * | 2016-11-08 | 2018-05-22 | 百度在线网络技术(北京)有限公司 | 搜索结果处理方法和装置 |
CN108780558A (zh) * | 2016-03-11 | 2018-11-09 | 电子湾有限公司 | 基于相似性移除列表 |
CN110162605A (zh) * | 2018-02-15 | 2019-08-23 | 阿尔派株式会社 | 检索结果提供装置及检索结果提供方法 |
WO2023051062A1 (zh) * | 2021-09-28 | 2023-04-06 | 北京字节跳动网络技术有限公司 | 一种信息展示方法、装置以及计算机存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1609859A (zh) * | 2004-11-26 | 2005-04-27 | 孙斌 | 搜索结果聚类的方法 |
CN102622396A (zh) * | 2011-11-30 | 2012-08-01 | 浙江大学 | 一种基于标签的web服务聚类方法 |
CN102654859A (zh) * | 2011-03-01 | 2012-09-05 | 北京彩云在线技术开发有限公司 | 一种歌曲推荐方法及系统 |
CN103870476A (zh) * | 2012-12-12 | 2014-06-18 | 百度在线网络技术(北京)有限公司 | 检索方法及设备 |
-
2014
- 2014-08-28 CN CN201410432832.0A patent/CN104951484A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1609859A (zh) * | 2004-11-26 | 2005-04-27 | 孙斌 | 搜索结果聚类的方法 |
CN102654859A (zh) * | 2011-03-01 | 2012-09-05 | 北京彩云在线技术开发有限公司 | 一种歌曲推荐方法及系统 |
CN102622396A (zh) * | 2011-11-30 | 2012-08-01 | 浙江大学 | 一种基于标签的web服务聚类方法 |
CN103870476A (zh) * | 2012-12-12 | 2014-06-18 | 百度在线网络技术(北京)有限公司 | 检索方法及设备 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106776601A (zh) * | 2015-11-19 | 2017-05-31 | 北京国双科技有限公司 | 搜索条件的配置方法及装置 |
CN106776601B (zh) * | 2015-11-19 | 2021-01-29 | 北京国双科技有限公司 | 搜索条件的配置方法及装置 |
CN108780558A (zh) * | 2016-03-11 | 2018-11-09 | 电子湾有限公司 | 基于相似性移除列表 |
CN108780558B (zh) * | 2016-03-11 | 2023-05-30 | 电子湾有限公司 | 基于相似性移除列表 |
CN105955991A (zh) * | 2016-04-19 | 2016-09-21 | 乐视控股(北京)有限公司 | 一种搜索结果聚合及定位的方法和装置 |
CN108062334A (zh) * | 2016-11-08 | 2018-05-22 | 百度在线网络技术(北京)有限公司 | 搜索结果处理方法和装置 |
CN107872685A (zh) * | 2017-11-20 | 2018-04-03 | 珠海市魅族科技有限公司 | 一种多媒体数据的播放方法、装置和计算机装置 |
CN110162605A (zh) * | 2018-02-15 | 2019-08-23 | 阿尔派株式会社 | 检索结果提供装置及检索结果提供方法 |
WO2023051062A1 (zh) * | 2021-09-28 | 2023-04-06 | 北京字节跳动网络技术有限公司 | 一种信息展示方法、装置以及计算机存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104951484A (zh) | 搜索结果的处理方法和装置 | |
CN103518187B (zh) | 用于信息建模的方法和系统及其应用 | |
CN106776503B (zh) | 文本语义相似度的确定方法及装置 | |
CN103971689B (zh) | 一种音频识别方法及装置 | |
CN102298614B (zh) | 一种确定网页收藏信息的收藏分类的方法、装置和设备 | |
CN110825957A (zh) | 基于深度学习的信息推荐方法、装置、设备及存储介质 | |
CN111831911B (zh) | 查询信息的处理方法、装置、存储介质和电子装置 | |
CN111161758B (zh) | 一种基于音频指纹的听歌识曲方法、系统及音频设备 | |
CN102402589A (zh) | 一种提供与搜索请求相关的参考搜索信息的方法与设备 | |
KR20190022431A (ko) | 랜덤 포레스트 모델의 훈련 방법, 전자장치 및 저장매체 | |
CN106096028A (zh) | 基于图像识别的文物索引方法及装置 | |
CN105210064A (zh) | 使用深度网络将资源分类 | |
Poisel et al. | A comprehensive literature review of file carving | |
CN111209477B (zh) | 一种信息推荐的方法及装置、电子设备、存储介质 | |
CN101158981A (zh) | 一种对下载资源进行分类的方法、系统和装置 | |
CN105574089A (zh) | 知识图谱的生成方法及装置、对象对比方法及装置 | |
CN103548016A (zh) | 用于消息分类的动态规则重新排序 | |
CN107609047A (zh) | 应用推荐方法、装置、移动设备及存储介质 | |
CN104361092A (zh) | 搜索方法及装置 | |
CN103077254A (zh) | 网页获取方法和装置 | |
CN104462396A (zh) | 字符串处理方法和装置 | |
CN115830649A (zh) | 一种网络资产指纹特征的识别方法、装置及电子设备 | |
CN102932421A (zh) | 云备份方法及装置 | |
CN104580109A (zh) | 生成点选验证码的方法及装置 | |
CN111078646B (zh) | 基于互联网设备的运行数据对软件进行分组的方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
EE01 | Entry into force of recordation of patent licensing contract |
Application publication date: 20150930 Assignee: Ocean interactive (Beijing) Information Technology Co., Ltd. Assignor: Tencent Technology (Shenzhen) Co., Ltd. Contract record no.: 2016990000422 Denomination of invention: Search result processing method and device License type: Common License Record date: 20161009 |
|
LICC | Enforcement, change and cancellation of record of contracts on the licence for exploitation of a patent or utility model | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20150930 |