CN101853308A - 一种个性化元搜索的方法及其应用终端 - Google Patents
一种个性化元搜索的方法及其应用终端 Download PDFInfo
- Publication number
- CN101853308A CN101853308A CN201010200736A CN201010200736A CN101853308A CN 101853308 A CN101853308 A CN 101853308A CN 201010200736 A CN201010200736 A CN 201010200736A CN 201010200736 A CN201010200736 A CN 201010200736A CN 101853308 A CN101853308 A CN 101853308A
- Authority
- CN
- China
- Prior art keywords
- interest
- url
- keyword
- user
- search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/248—Presentation of query results
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种个性化元搜索的方法,所述方法包括:预先建立兴趣库;根据确定被搜索的关键词,从兴趣库中提取使用日志,并对搜索引擎返回的搜索结果进行预处理;利用使用日志,对与处理后的搜索结果和兴趣库中对应所述被搜索的关键词的资源定位符(URL)的兴趣度进行计算,根据计算结果排序并显示;对兴趣库进行更新,本发明还公开了一种个性化元搜索的应用终端,通过上述方法和应用终端,能够使得用户得到更具有针对性,更满意的搜索结果,提高了用户体验。
Description
技术领域
本发明涉及搜索引擎优化领域,特别是指一种个性化元搜索的方法及其应用终端。
背景技术
随着互联网技术的不断发展,搜索引擎主要向个性化和智能化方向发展,个性化搜索主要是通过跟踪分析用户的搜索行为,来提高用户的搜索效率;而智能化搜索主要是由搜索引擎对搜索需求信息进行理解分析,利用搜索引擎自身的自适应和自调节能力为用户提供更满意的搜索结果。而目前的搜索引擎主要采用以关键字作为检索基础,对网页索引库进行检索并返回结果的方式完成检索过程。这种方式的局限性非常明显,关键字技术很难清楚的表达用户的检索意图,而且搜索引擎也不能较好的理解自然语言的输入信息,例如:用户想学习Android框架结构的组成,那么如果用户输入“Android框架”或者是“框架结构的组成”等都不能清楚表达自己的意思,如果用户输入“Android框架结构的组成”,虽然是表达了自己的意思,但是搜索引擎返回的仍然只是包含“Android”或者“框架结构”或者“组成”等关键字组成的相关网站;另一方面,对于一个或几个简单的关键字查询,典型的情况是返回数百万文档,这种情况下,用户很难找到自己需要的并且是自己感兴趣的信息。针对这些局限性,目前已经有了大量的研究,元搜索引擎就是其中的一种,它就像是一个过滤通道,以独立搜索引擎的输出结果作为输入,经过整合、调用、控制和优化等元搜索技术,重排结果,然后将最终结果呈现给用户,为用户提供一个实时的响应。
目前,针对用户的兴趣,实现个性化的搜索服务,在移动终端领域还没有出现。其中,以Google发布的开源手机操作系统Android平台为例,基本上都是在浏览器中直接调用搜索引擎来实现搜索,为了使搜索方便,基本上使用的都是Google的搜索建议技术,主要是提供关联的并且最流行的搜索建议;也有提供你以前查询过的历史搜索建议等,并没有针对一般的移动终端都是为一个特定的用户使用,每一台移动终端中都包含了该用户大量的兴趣数据这一特点,实现个性化的搜索方案。
发明内容
有鉴于此,本发明的主要目的在于提供一种个性化元搜索的方法及其应用终端,能够使得排列搜索获得的结果,更加具有针对性,更能符合用户的需要。
为达到上述目的,本发明的技术方案是这样实现的:
本发明提供了一种个性化元搜索的方法,包括:
预先建立兴趣库;
根据确定被搜索的关键词,从兴趣库中提取使用日志,并对搜索引擎返回的搜索结果进行预处理;
利用使用日志,对预处理后的搜索结果和兴趣库中对应所述被搜索的关键词的资源定位符(URL)的兴趣度进行计算,根据计算结果排序并显示;
更新所述兴趣库。
其中,所述执行搜索之前,还包括:
用户输入关键词时,利用兴趣库数据,经过排序得到搜索建议列表,并显示给用户。
其中,所述预先建立兴趣库,包括:根据用户输入的兴趣信息,结合搜索到的相关的URL建立兴趣库。
其中,所述兴趣库包括:兴趣列表和使用日志列表,其中,
兴趣列表中包括:关键词、与关键词相关的URL以及URL对应的兴趣度;
使用日志列表中包括:用户身份、关键词、与关键词相关的URL、所述URL的使用日期、所述URL打开的起始时间和终止时间。
其中,所述兴趣度的计算的参数,包括:
根据所述URL相关的关键词中包含被搜索的关键词的情况;和/或
根据被搜索的关键词在所述URL链接中出现的位置;和/或
用户以前点击所述URL的次数;用户以前浏览URL的时间长度;和/或
用户以前点击URL的顺序。
其中,所述对兴趣库进行更新,包括:根据计算出的兴趣度排序,取至少一个相似度最高的相对应的关键词、URL和兴趣度存入兴趣库中,和/或根据用户的操作对使用日志的数据进行更新。
本发明还提供了一种个性化元搜索的应用终端,所述终端中包括:搜索处理单元、兴趣库单元、接口单元和兴趣库初始设置单元,其中,
所述搜索处理单元,用于从兴趣库单元中提取使用日志,通过接口单元获取搜索结果并进行预处理,利用使用日志,对预处理后的搜索结果和提取出的兴趣库单元中对应所述被搜索的关键词的URL的兴趣度进行计算,根据计算结果排序并显示;
所述兴趣库单元,用于存储用户的使用日志和个人兴趣信息及其映射的URL和兴趣度,并接受搜索处理单元的更新;
所述接口单元,用于为搜索处理单元提供连接搜索引擎获取搜索结果的接口;
所述兴趣库初始设置单元,用于将兴趣库信息存储到所述兴趣库单元。
其中,所述搜索处理单元,还用于用户输入关键词时,利用兴趣库数据,经过排序得到搜索建议列表,并显示给用户。
其中,所述兴趣库单元中还包括:兴趣列表子单元和使用日志子单元,其中,
所述兴趣列表子单元,用于储存个人兴趣信息及其映射的URL和兴趣度,并接受所述搜索处理单元的更新;
所述使用日志子单元,用于储存用户身份、关键词、与关键词相关的URL、所述URL的使用日期、所述URL打开的起始时间和终止时间。
本发明所提供的个性化元搜索的方法及其应用终端,根据确定被搜索的关键词,从兴趣库中提取使用日志,并对搜索引擎返回的搜索结果进行预处理;利用使用日志,对与处理后的搜索结果和兴趣库中对应所述被搜索的关键词的资源定位符(Universal Resource Locator,URL)的兴趣度进行计算,根据计算结果排序并显示;对兴趣库进行更新。能够使得用户得到更具有针对性,更满意的搜索结果,提高了用户体验。
对于Android平台,由于其提供了使用方便的应用程序接口,为第三方软件开发者整合自己的个性化搜索到其他应用程序提供便利,为本发明方案实现个性化的建议服务和个性化的输出搜索结果提供了最大的便利。
附图说明
图1为本发明应用在移动终端中个性化的元搜索的方法流程示意图;
图2为本发明个性化的元搜索的应用终端结构示意图。
具体实施方式
本发明的基本思想是:根据确定被搜索的关键词,从兴趣库中提取使用日志,并对搜索引擎返回的搜索结果进行预处理;利用使用日志,对与处理后的搜索结果和兴趣库中对应所述被搜索的关键词的URL的兴趣度进行计算,根据计算结果排序并显示;对兴趣库进行更新。
下面结合附图和具体实施例对本发明的技术方案进一步详细阐述。
图1为本发明应用在移动终端中个性化的元搜索的方法流程示意图,如图1所示,所述个性化的元搜索的方法,具体包括以下步骤:
步骤101,在移动终端中初始建立兴趣库;
具体的,由于针对一台移动终端通常都是由某一个特定的用户使用,因此,用户可以在移动终端中建立一个兴趣库。兴趣库的建立具体包括以下步骤:
步骤101a,用户输入个人的兴趣信息;
具体的,用户通过人机界面输入个人的兴趣信息。所述个人的兴趣信息包括:用户的职位、工作性质、兴趣、爱好等用户感兴趣的信息。
步骤101b,根据用户每次输入,通过搜索引擎返回相关URL;
具体的,用户每次输入的个人的兴趣信息,都通过移动终端的操作系统提供的搜索接口在互联网的搜索引擎上进行关键词(keywords)的搜索。例如:通过Android系统提供的接口,从Google搜索上获取带有关键词的URL。
步骤101c,将一个或多个搜索到的URL和兴趣信息及其映射的关系储存到兴趣库中。
具体的,可以按照搜索引擎返回的顺序选取一定数量的URL,作为与输入的关键词相关联的内容进行储存。优选情况下也可以由用户选定自己感兴趣的一个或多个URL作为与关键词相关联的内容进行储存。所述储存到兴趣库中是以IDB(Integrated Data Base,综合资料库)的结构采用映射表的方式存储在兴趣列表中。例如:IDB(keywords,URLs)。在兴趣列表中,关键词和URL的对应关系可以是:单对单、单对多、多对单、或多对多。同时,对于每个关键词映射的每个URL还存储有兴趣度参数。初始情况下,默认的兴趣度都为0。根据用户以后的搜索习惯可以对兴趣度进行更新。
进一步的,在兴趣库中还包括使用日志列表,其中存储了用户的使用日志数据,具体包括:用户针对每个关键词映射的URL的点击日期(date)、打开链接的起始时间(start-time)、关闭链接的终止时间(end-time)以及兴趣度。
进一步的,由用户初始建立的兴趣库中的兴趣列表在本发明所述的搜索方法中具备最高等级的优先级,并且一直储存在兴趣库中,除非用户主动进行修改。
步骤102,用户输入关键词时,移动终端通过操作系统提供的接口,从兴趣库中获取兴趣列表数据,经过排序得到搜索建议列表,并显示给用户以便参考;
具体的,用户通过人机界面输入需要搜索的关键词时,移动终端根据兴趣库中兴趣列表储存的信息匹配所述输入的关键词,获得最相关的一个或多个关键字或关键词。每个关键字或关键词对应的多个URL的兴趣度的总和,值越高,在搜索建议列表中推荐的序列越高。表1为本发明兴趣库中储存的关键词与URL相对应的兴趣度列表,如表1所示,keyword1的兴趣度总和为10;keyword2的兴趣度总和为9;keyword3的兴趣度总和为7;keyword4的兴趣度总和为9。此时,搜索建议列表中的排序为:keyword1,keyword2,keyword4,keyword3。需要说明的是表1中的兴趣度数值是用户使用一段时间后累积取得的,具体的兴趣度计算方法在后续步骤中有详细描述。
keyword1 | keyword2 | keyword3 | keyword4 | |
URL 1 | 4 | 2 | 1 | 1 |
URL 2 | 1 | 2 | 4 | 4 |
URL 3 | 4 | 1 | 1 | 3 |
URL 4 | 1 | 4 | 1 | 1 |
表1
进一步的,由于输入的关键词可能会匹配到多个关键字或关键词,因此搜索建议列表中显示的推荐的keyword的条目数量可以根据移动终端的显示性能或用户的习惯灵活进行设置。
步骤103,搜索开始后,移动终端根据确定被搜索的关键词,提取所述关键词的使用日志;
具体的,用户输入完需要搜索的关键词后,执行搜索的同时,移动终端根据关键词,提取兴趣库中储存的所述关键词的使用日志。提取的内容为:用户身份、URL、date、start-time、end-time、keywords和兴趣度。
步骤104,移动终端执行搜索后,得到搜索引擎返回的结果,对返回的结果进行预处理;
具体的,所述搜索引擎返回的结果包括:用户、keyword、标题(title)、URL和摘要(snippet)。其中,title指的是搜索返回的URL链接内容的标题;snippet指的是搜索返回的URL连接内容的简短摘要。所述进行预处理包括:切词、分词、去掉停用词,从而将title和snippet表示成单词的集合。
步骤105,移动终端利用使用日志,针对预处理的返回的搜索结果和兴趣列表中对应所述被搜索关键词的URL进行计算,得到针对每个URL分别针对多个相关的keyword的兴趣度I(URLi,keywordj);
具体的,所述计算的过程包括以下步骤:
步骤105a,根据URLi映射的关键词中是否带有被搜索的关键词进行计算;
具体的,本发明选用参数δ来衡量。对于URLi,如果keywordj包含了所述被搜索的关键词,那么I1(URLi,keywordj)=δ;否则I1(URLi,keywordj)=0。
步骤105b,根据URLi的标题、和/或摘要是否带有被搜索的关键词进行计算;
具体的,本发明分别用ζ和η来衡量他们的重要性。对于URLi,如果title(或snippet)集合带有被搜索的关键词,那么I2(URLi,keywordj)=ζ(或η);否则I2(URLi,keywordj)=0。
步骤105c,根据用户以前对所述URL的点击次数进行计算;
具体的,用户点击URL的次数越多,兴趣排序越高。所述点击次数根据使用日志中的起始时间得到。本发明使用参数α来衡量一次点击。例如:一个用户点击URL1的次数是5,那么兴趣值为5α。对于keywordj,如果点击urli的次数为n,n为整数那么I3(URLi,keywordj)=nα;否则I3(URLi,keywordj)=0。
步骤105d,根据用户以前浏览URL的时间长度进行计算;
具体的,本发明同样设定一个参数β来衡量时间。用户浏览URL的时间越长,兴趣排序值越高。所述时间通过使用日志中的起始时间和终止时间得到。对于keywordj,如果用户浏览URLi的时间为m sec,那么I4(URLi,keywordj)=mβ;否则I4(URLi,keywordj)=0。
步骤105e,根据用户点击顺序进行计算;
具体的,对于相同的关键字,用户首先对网页a感兴趣,然后是网页b,最后才是网页c。网页a的兴趣排序应该比网页b高,网页b的兴趣排序应该比网页c高。本发明给出一个衰减因子γ。对于keywordj,存在URLa→URLb→URLc,那么I(URLb,keywordj)=γI(URLa,keywordj);I(URLc,keywordj)=γI(URLb,keywordj)。
进一步需要说明的是,兴趣度I(URLi,keywordj)的值为步骤105a至步骤105d的四个项的叠加。即:I(URLi,keywordj)=I1+I2+I3+I4.第5项为可选的被用来改进兴趣度。其中,各参数的值为不具体限定,且都属于[0,1]的范围内,重要的是δ>ζ>η,由此可见本发明中URLi映射的关键词中是否带有被搜索的关键词的权重最大,其次是URLi的标题是否带有被搜索的关键词,最后是URLi的摘要是否带有被搜索的关键词。
步骤106,计算出针对每个URL相对于最相关多个关键词的兴趣度的总和,对URL进行排序并显示;
步骤107,对兴趣库进行更新。
具体的,由于兴趣列表的结构也是由关键词、URL和兴趣度组成的集合,因此可以直接更新。具体方式为:根据兴趣度排序,取至少一个相似度最高的相对应的关键词、URL和兴趣度存入兴趣列表中。所述选取相似度最高的关键词的个数可以由用户根据个人使用习惯结合移动终端的性能进行设置。当用户进行点击等操作后,根据用户的本次操作对使用日志列表中的数据进行更新。通过每次使用后对兴趣库进行更新,能够不断的更新并增加兴趣库中的数据量,使以后的搜索结果更加准确,并且推荐的排序能更符合用户的兴趣。
进一步的,对应步骤105至步骤106的计算过程,下面结合表2至表6所示的具体的实例进行描述。
首先,用户在人机界面输入“mp3”进行搜索,而兴趣库的兴趣列表中与mp3相关的关键词组合包括:(张学友mp3,URL1);(王菲mp3,URL2),再加上从搜索接口中返回的结果,如:(百度mp3,URL3);(搜狗音乐,URL4)。假设,取关键字序列为(张学友mp3,王菲mp3,百度mp3,搜狗音乐)。
对应步骤105a,取δ=0.9,由于前三个关键词中包含了“mp3”,因此,计算结果如表2所示:
张学友mp3 | 王菲mp3 | 百度mp3 | 搜狗音乐 | |
URL1 | 0.9 | 0 | 0 | 0 |
URL2 | 0 | 0.9 | 0 | 0 |
URL3 | 0 | 0 | 0.9 | 0 |
URL4 | 0 | 0 | 0 | 0 |
表2
对应步骤105b,假设URL2中title包含关键字“王菲mp3”,而URL3中snippet中包含关键字“百度mp3”和“王菲mp3”,取ζ=0.6,η=0.4,计算结果如表3所示:
张学友mp3 | 王菲mp3 | 百度mp3 | 搜狗音乐 | |
URL1 | 0.9 | 0 | 0 | 0 |
URL2 | 0 | 0.9+0.6 | 0 | 0 |
URL3 | 0 | 0.4 | 0.9+0.4 | 0 |
URL4 | 0 | 0 | 0 | 0 |
表3
对应步骤105c,假设用户点击URL1的次数为2,点击URL2的次数为3次,点击URL3的次数为1次,点击URL4为1次.取α=0.2,计算结果如表4所示:
张学友mp3 | 王菲mp3 | 百度mp3 | 搜狗音乐 | |
URL1 | 0.9+2*0.2 | 2*0.2 | 2*0.2 | 2*0.2 |
URL2 | 3*0.2 | 0.9+0.6+3*0.2 | 3*0.2 | 3*0.2 |
URL3 | 0.2 | 0.4+0.2 | 0.9+0.4+0.2 | 0.2 |
张学友mp3 | 王菲mp3 | 百度mp3 | 搜狗音乐 | |
URL4 | 0.2 | 0.2 | 0.2 | 0.2 |
表4
对应步骤105d,假设用户浏览URL1为10秒,URL2为5秒,URL3为3秒,URL4为1秒,取β=0.02,计算结果如表5所示:
张学友mp3 | 王菲mp3 | 百度mp3 | 搜狗音乐 | |
URL1 | 0.9+2*0.2+10*0.02 | 2*0.2+10*0.02 | 2*0.2+10*0.02 | 2*0.2+10*0.02 |
URL2 | 3*0.2+5*0.02 | 0.9+0.6+3*0.2+5*0.02 | 3*0.2+5*0.02 | 3*0.2+5*0.02 |
URL3 | 0.2+3*0.02 | 0.4+0.2+3*0.02 | 0.9+0.4+0.2+3*0.02 | 0.2+3*0.02 |
URL4 | 0.2+0.02 | 0.2+0.02 | 0.2+0.02 | 0.2+0.02 |
表5
最后针对每个URL的相关关键词的计算结果如表6所示:
张学友mp3 | 王菲mp3 | 百度mp3 | 搜狗音乐 | |
URL1 | 1.5 | 0.6 | 0.6 | 0.6 |
URL2 | 0.7 | 2.2 | 0.7 | 0.7 |
URL3 | 0.26 | 0.66 | 1.56 | 0.26 |
URL4 | 0.22 | 0.22 | 0.22 | 0.22 |
表6
需要说明的是,本实例中没有对应步骤105e中根据用户点击顺序进行计算。在实际运用中,也可以按照实际情况和用户的需要采用步骤105a至105e中的任意一种或几种计算方法的组合计算兴趣度。
对应步骤106,针对URL1的相应关键字的兴趣度值为3.3;URL2为4.3;URL3为2.74;URL4为0.88,因此,对其进行排序的结果为:URL2,URL1,URL3,URL4。
图2为本发明个性化的元搜索的应用终端结构示意图,如图2所示,所述应用终端通常是指个人移动终端,所述应用终端包括:搜索处理单元21、兴趣库单元22和接口单元23,其中,
所述搜索处理单元21,用于从兴趣库单元22中提取使用日志,通过接口单元23获取搜索结果并进行预处理,利用使用日志,对预处理后的搜索结果和提取出的兴趣库单元22中对应所述被搜索的关键词的URL的兴趣度进行计算,根据计算结果排序并显示,并对兴趣库单元22进行更新;
具体的,用户输入完需要搜索的关键词后,执行搜索的同时,移动终端中的搜索处理单元21根据关键词,提取兴趣库单元22中储存的所述关键词的使用日志。提取的内容为:用户身份、URL、date、start-time、end-time、keywords和兴趣度。所述搜索结果包括:用户、keyword、标题(title)、URL和摘要(snippet)。其中,title指的是搜索返回的URL链接内容的标题;snippet指的是搜索返回的URL连接内容的简短摘要。所述进行预处理包括:切词、分词、去掉停用词,从而将title和snippet表示成单词的集合。所述对兴趣度的计算方法如前述步骤105a至步骤105e所述的,先针对下列情况进行计算:根据所述URL相关的关键词中包含被搜索的关键词的情况;和/或根据被搜索的关键词在所述URL链接中出现的位置;和/或用户以前点击所述URL的次数;用户以前浏览URL的时间长度;和/或用户以前点击URL的顺序。然后计算出针对每个URL相对于最相关多个关键词的兴趣度的总和,然后对URL进行排序并显示。
所述兴趣库单元22,用于存储用户的使用日志和个人兴趣信息及其映射的URL和兴趣度,并接受搜索处理单元21的更新;
所述接口单元23,用于为搜索处理单元21提供连接搜索引擎获取搜索结果的接口。
具体的,所述接口单元23为搜索处理单元21提供了连接互联网上搜索引擎的接口,使得搜索处理单元21能够获得搜索的结果进而计算兴趣度,并排序。例如:移动终端中的Android系统提供的Google搜索的接口。本发明中并不限定使用Android系统,凡是能够提供搜索引擎接口的系统平台都属于本发明应用的范围。
进一步的,所述应用终端中还包括:兴趣库初始设置单元24,其中,
所述兴趣库初始设置单元24,用于接收用户输入的兴趣信息并通过接口单元23搜索相关的URL,将相关联的信息存储到兴趣库单元22中;
具体的,用户通过人机界面输入个人的兴趣信息。所述个人的兴趣信息包括:用户的职位、工作性质、兴趣、爱好等用户感兴趣的信息。用户每次输入的个人的兴趣信息,都通过接口单元23在互联网的搜索引擎上进行关键词的搜索。所述存储到兴趣库单元22中的数据可以按照搜索引擎返回的顺序选取一定数量的URL,作为与输入的关键词相关联的内容进行储存。优选情况下也可以由用户选定自己感兴趣的一个或多个URL作为与关键词相关联的内容进行储存。
进一步的,所述搜索处理单元21,还用于用户输入关键词时,利用兴趣库数据,经过排序得到搜索建议列表,并显示给用户。
具体的,用户通过人机界面输入需要搜索的关键词时,移动终端中的所述搜索处理单元21根据兴趣库单元22中的信息匹配所述输入的关键词,获得最相关的一个或多个关键字或关键词。每个关键字或关键词对应的多个URL的兴趣度的总和,值越高,在搜索建议列表中推荐的序列越高。由于输入的关键词可能会匹配到多个关键字或关键词,因此搜索建议列表中显示的推荐的keyword的条目数量可以根据移动终端的显示性能或用户的习惯灵活进行设置。
进一步的,所述兴趣库单元22中还包括:兴趣列表子单元221和使用日志子单元222,其中,
所述兴趣列表子单元221,用于储存个人兴趣信息及其映射的URL和兴趣度,并接受所述搜索处理单元21的更新;
具体的,由于兴趣列表的结构也是由关键词、URL和兴趣度组成的集合,因此可以在计算完兴趣度后直接更新。具体方式为:根据兴趣度排序,取至少一个相似度最高的相对应的关键词、URL和兴趣度存入兴趣列表中。所述选取相似度最高的关键词的个数可以由用户根据个人使用习惯结合移动终端的性能进行设置。
所述使用日志子单元222,用于储存用户身份、关键词、与关键词相关的URL、所述URL的使用日期、所述URL打开的起始时间和终止时间。
具体的,当用户进行点击等操作后,根据用户的本次操作对使用日志列表中的数据进行更新。通过每次使用后对兴趣库进行更新,能够不断的更新并增加兴趣库中的数据量,使以后的搜索结果更加准确,并且推荐的排序能更符合用户的兴趣。
综上所述,本发明适用于具有较强用户针对性的移动终端,同时移动终端的操作系统能够提供对外的连接互联网搜索引擎的接口就可以实现本发明。优选的方案为使用Android系统的移动终端。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种个性化元搜索的方法,其特征在于,包括:
预先建立兴趣库;
根据确定被搜索的关键词,从兴趣库中提取使用日志,并对搜索引擎返回的搜索结果进行预处理;
利用使用日志,对预处理后的搜索结果和兴趣库中对应所述被搜索的关键词的资源定位符(URL)的兴趣度进行计算,根据计算结果排序并显示;
更新所述兴趣库。
2.根据权利要求1所述的方法,其特征在于,所述执行搜索之前,还包括:
用户输入关键词时,利用兴趣库数据,经过排序得到搜索建议列表,并显示给用户。
3.根据权利要求1或2所述的方法,其特征在于,所述预先建立兴趣库,包括:根据用户输入的兴趣信息,结合搜索到的相关的URL建立兴趣库。
4.根据权利要求1或2所述的方法,其特征在于,所述兴趣库包括:兴趣列表和使用日志列表,其中,
兴趣列表中包括:关键词、与关键词相关的URL以及URL对应的兴趣度;
使用日志列表中包括:用户身份、关键词、与关键词相关的URL、所述URL的使用日期、所述URL打开的起始时间和终止时间。
5.根据权利要求1或2所述的方法,其特征在于,所述兴趣度的计算的参数,包括:
根据所述URL相关的关键词中包含被搜索的关键词的情况;和/或
根据被搜索的关键词在所述URL链接中出现的位置;和/或
用户以前点击所述URL的次数;用户以前浏览URL的时间长度;和/或
用户以前点击URL的顺序。
6.根据权利要求1或2所述的方法,其特征在于,所述对兴趣库进行更新,包括:根据计算出的兴趣度排序,取至少一个相似度最高的相对应的关键词、URL和兴趣度存入兴趣库中,和/或根据用户的操作对使用日志的数据进行更新。
7.一种个性化元搜索的应用终端,其特征在于,所述终端中包括:搜索处理单元、兴趣库单元、接口单元和兴趣库初始设置单元,其中,
所述搜索处理单元,用于从兴趣库单元中提取使用日志,通过接口单元获取搜索结果并进行预处理,利用使用日志,对预处理后的搜索结果和提取出的兴趣库单元中对应所述被搜索的关键词的URL的兴趣度进行计算,根据计算结果排序并显示;
所述兴趣库单元,用于存储用户的使用日志和个人兴趣信息及其映射的URL和兴趣度,并接受搜索处理单元的更新;
所述接口单元,用于为搜索处理单元提供连接搜索引擎获取搜索结果的接口;
所述兴趣库初始设置单元,用于将兴趣库信息存储到所述兴趣库单元。
8.根据权利要求7所述的应用终端,其特征在于,所述搜索处理单元,还用于用户输入关键词时,利用兴趣库数据,经过排序得到搜索建议列表,并显示给用户。
9.根据权利要求7或8所述的应用终端,其特征在于,所述兴趣库单元中还包括:兴趣列表子单元和使用日志子单元,其中,
所述兴趣列表子单元,用于储存个人兴趣信息及其映射的URL和兴趣度,并接受所述搜索处理单元的更新;
所述使用日志子单元,用于储存用户身份、关键词、与关键词相关的URL、所述URL的使用日期、所述URL打开的起始时间和终止时间。
10.根据权利要求7或8所述的应用终端,其特征在于,所述搜索处理单元对兴趣度进行计算的参数,包括:
根据所述URL相关的关键词中包含被搜索的关键词的情况;和/或
根据被搜索的关键词在所述URL链接中出现的位置;和/或
用户以前点击所述URL的次数;用户以前浏览URL的时间长度;和/或
用户以前点击URL的顺序。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201010200736A CN101853308A (zh) | 2010-06-11 | 2010-06-11 | 一种个性化元搜索的方法及其应用终端 |
EP10852797.9A EP2570935B1 (en) | 2010-06-11 | 2010-12-24 | Method for personalized meta-search and application terminal thereof |
PCT/CN2010/080235 WO2011153807A1 (zh) | 2010-06-11 | 2010-12-24 | 一种个性化元搜索的方法及其应用终端 |
US13/702,740 US8898155B2 (en) | 2010-06-11 | 2010-12-24 | Personalized meta-search method and application terminal thereof |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201010200736A CN101853308A (zh) | 2010-06-11 | 2010-06-11 | 一种个性化元搜索的方法及其应用终端 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101853308A true CN101853308A (zh) | 2010-10-06 |
Family
ID=42804799
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201010200736A Pending CN101853308A (zh) | 2010-06-11 | 2010-06-11 | 一种个性化元搜索的方法及其应用终端 |
Country Status (4)
Country | Link |
---|---|
US (1) | US8898155B2 (zh) |
EP (1) | EP2570935B1 (zh) |
CN (1) | CN101853308A (zh) |
WO (1) | WO2011153807A1 (zh) |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011153807A1 (zh) * | 2010-06-11 | 2011-12-15 | 中兴通讯股份有限公司 | 一种个性化元搜索的方法及其应用终端 |
CN102298629A (zh) * | 2011-08-29 | 2011-12-28 | 上海量明科技发展有限公司 | 调整网页排序的搜索结果提供方法及系统 |
CN102799587A (zh) * | 2011-05-25 | 2012-11-28 | 腾讯科技(深圳)有限公司 | 一种论坛搜索方法和装置 |
CN102880660A (zh) * | 2012-09-03 | 2013-01-16 | 常州嘴馋了信息科技有限公司 | 网站热点信息排序系统 |
CN102982023A (zh) * | 2011-09-02 | 2013-03-20 | 北京百度网讯科技有限公司 | 一种提供搜索建议的方法及装置 |
CN102999496A (zh) * | 2011-09-09 | 2013-03-27 | 北京百度网讯科技有限公司 | 建立需求分析模板的方法、搜索需求识别的方法及装置 |
CN103324645A (zh) * | 2012-03-23 | 2013-09-25 | 腾讯科技(深圳)有限公司 | 一种网页推荐方法和装置 |
CN103377201A (zh) * | 2012-04-17 | 2013-10-30 | 腾讯科技(深圳)有限公司 | 信息搜索方法及装置 |
CN103620604A (zh) * | 2011-06-28 | 2014-03-05 | 微软公司 | 按类别暴露搜索历史 |
CN103955480A (zh) * | 2014-04-02 | 2014-07-30 | 百度在线网络技术(北京)有限公司 | 一种用于确定用户所对应的目标对象信息的方法与设备 |
WO2014114137A1 (en) * | 2013-01-25 | 2014-07-31 | Tencent Technology (Shenzhen) Company Limited | Method and apparatus for recommending keywords |
CN105975508A (zh) * | 2016-04-28 | 2016-09-28 | 西安电子科技大学 | 个性化元搜索引擎检索结果合成排序方法 |
CN106021423A (zh) * | 2016-05-16 | 2016-10-12 | 西安电子科技大学 | 基于群组划分的元搜索引擎个性化结果推荐方法 |
CN106202313A (zh) * | 2016-07-01 | 2016-12-07 | 西安电子科技大学 | 面向学术元搜索的检索结果合成排序方法 |
CN103714120B (zh) * | 2013-12-03 | 2017-06-23 | 上海河广信息科技有限公司 | 一种从用户url访问记录中提取用户兴趣话题的系统 |
CN107193818A (zh) * | 2016-03-14 | 2017-09-22 | 百度在线网络技术(北京)有限公司 | 一种搜索方法、装置和终端设备 |
CN107357891A (zh) * | 2017-07-12 | 2017-11-17 | 中云开源数据技术(上海)有限公司 | 一种主页链接推荐方法 |
CN111930899A (zh) * | 2020-09-25 | 2020-11-13 | 成都数联铭品科技有限公司 | 一种关键词处理方法及系统、关键词搜索方法 |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102402538A (zh) * | 2010-09-13 | 2012-04-04 | 腾讯科技(深圳)有限公司 | 一种自动更新搜索网页的方法和装置 |
CN102033914A (zh) * | 2010-11-29 | 2011-04-27 | 百度在线网络技术(北京)有限公司 | 基于权威度确定链接资源的可靠描述信息的方法与设备 |
CN104636398B (zh) * | 2013-11-15 | 2021-09-17 | 腾讯科技(北京)有限公司 | 搜索用户生成内容的方法、装置、服务器和系统 |
WO2016023512A1 (zh) * | 2014-08-15 | 2016-02-18 | 北京奇虎科技有限公司 | 提供内容提供方的定制结果的搜索方法、客户端和系统 |
US10503741B2 (en) * | 2014-08-20 | 2019-12-10 | Samsung Electronics Co., Ltd. | Electronic system with search mechanism and method of operation thereof |
US11144555B2 (en) * | 2015-05-06 | 2021-10-12 | App Annie Inc. | Keyword reporting for mobile applications |
CN105138579A (zh) * | 2015-07-31 | 2015-12-09 | 北京金山安全软件有限公司 | 获取关键词和基于该关键词进行信息推荐的方法及装置 |
CN105550317B (zh) * | 2015-12-15 | 2021-03-12 | 腾讯科技(深圳)有限公司 | 一种通过新闻列表展示新闻的方法和装置 |
US10521509B2 (en) * | 2016-08-15 | 2019-12-31 | Ebay Inc. | Snippet generation and item description summarizer |
US11693910B2 (en) | 2018-12-13 | 2023-07-04 | Microsoft Technology Licensing, Llc | Personalized search result rankings |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101080709A (zh) * | 2004-03-29 | 2007-11-28 | 咕果公司 | 在搜索引擎中对搜索结果的可变个性化 |
CN101477554A (zh) * | 2009-01-16 | 2009-07-08 | 西安电子科技大学 | 基于用户兴趣的个性化元搜索引擎及搜索结果处理方法 |
CN101661474A (zh) * | 2008-08-26 | 2010-03-03 | 华为技术有限公司 | 一种搜索方法和系统 |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6799298B2 (en) * | 1998-03-11 | 2004-09-28 | Overture Services, Inc. | Technique for locating an item of interest within a stored representation of data |
US6725227B1 (en) * | 1998-10-02 | 2004-04-20 | Nec Corporation | Advanced web bookmark database system |
JP2002041537A (ja) * | 2000-07-31 | 2002-02-08 | Nec Corp | 広告提示システム |
US6647383B1 (en) * | 2000-09-01 | 2003-11-11 | Lucent Technologies Inc. | System and method for providing interactive dialogue and iterative search functions to find information |
US20020062223A1 (en) * | 2000-11-21 | 2002-05-23 | Netiq Corporation | System and method for adding network traffic data to a database of network traffic data |
US7685224B2 (en) * | 2001-01-11 | 2010-03-23 | Truelocal Inc. | Method for providing an attribute bounded network of computers |
CN1389811A (zh) | 2002-02-06 | 2003-01-08 | 北京造极人工智能技术有限公司 | 搜索引擎的智能化搜索方法 |
US9117220B2 (en) * | 2003-06-16 | 2015-08-25 | Meetup, Inc. | Web-based interactive meeting facility with revenue generation through sponsorship |
US20060041615A1 (en) * | 2004-08-05 | 2006-02-23 | Remy Blank | Wireless delegate information and communication device, method and system |
US20070083428A1 (en) * | 2005-10-12 | 2007-04-12 | Susanne Goldstein | System and method for navigation by advertising landmark |
US20070250500A1 (en) * | 2005-12-05 | 2007-10-25 | Collarity, Inc. | Multi-directional and auto-adaptive relevance and search system and methods thereof |
US20070143260A1 (en) | 2005-12-19 | 2007-06-21 | Microsoft Corporation | Delivery of personalized keyword-based information using client-side re-ranking |
US20070281690A1 (en) * | 2006-06-01 | 2007-12-06 | Flipt, Inc | Displaying and tagging places of interest on location-aware mobile communication devices in a local area network |
US9519715B2 (en) * | 2006-11-02 | 2016-12-13 | Excalibur Ip, Llc | Personalized search |
US20080221987A1 (en) * | 2007-03-07 | 2008-09-11 | Ebay Inc. | System and method for contextual advertisement and merchandizing based on an automatically generated user demographic profile |
US20080281687A1 (en) * | 2007-05-08 | 2008-11-13 | Motorola, Inc. | Method for determining user interest in products and services for targeted advertising |
US20090299853A1 (en) * | 2008-05-27 | 2009-12-03 | Chacha Search, Inc. | Method and system of improving selection of search results |
US20100306249A1 (en) * | 2009-05-27 | 2010-12-02 | James Hill | Social network systems and methods |
CN101853308A (zh) * | 2010-06-11 | 2010-10-06 | 中兴通讯股份有限公司 | 一种个性化元搜索的方法及其应用终端 |
US9703873B2 (en) * | 2012-04-27 | 2017-07-11 | Adnan Fakeih | Locating human resources via a computer network |
-
2010
- 2010-06-11 CN CN201010200736A patent/CN101853308A/zh active Pending
- 2010-12-24 WO PCT/CN2010/080235 patent/WO2011153807A1/zh active Application Filing
- 2010-12-24 EP EP10852797.9A patent/EP2570935B1/en active Active
- 2010-12-24 US US13/702,740 patent/US8898155B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101080709A (zh) * | 2004-03-29 | 2007-11-28 | 咕果公司 | 在搜索引擎中对搜索结果的可变个性化 |
CN101661474A (zh) * | 2008-08-26 | 2010-03-03 | 华为技术有限公司 | 一种搜索方法和系统 |
CN101477554A (zh) * | 2009-01-16 | 2009-07-08 | 西安电子科技大学 | 基于用户兴趣的个性化元搜索引擎及搜索结果处理方法 |
Cited By (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8898155B2 (en) | 2010-06-11 | 2014-11-25 | Zte Corporation | Personalized meta-search method and application terminal thereof |
WO2011153807A1 (zh) * | 2010-06-11 | 2011-12-15 | 中兴通讯股份有限公司 | 一种个性化元搜索的方法及其应用终端 |
CN102799587A (zh) * | 2011-05-25 | 2012-11-28 | 腾讯科技(深圳)有限公司 | 一种论坛搜索方法和装置 |
CN103620604A (zh) * | 2011-06-28 | 2014-03-05 | 微软公司 | 按类别暴露搜索历史 |
CN102298629B (zh) * | 2011-08-29 | 2017-06-20 | 上海量明科技发展有限公司 | 调整网页排序的搜索结果提供方法及系统 |
CN102298629A (zh) * | 2011-08-29 | 2011-12-28 | 上海量明科技发展有限公司 | 调整网页排序的搜索结果提供方法及系统 |
CN102982023A (zh) * | 2011-09-02 | 2013-03-20 | 北京百度网讯科技有限公司 | 一种提供搜索建议的方法及装置 |
CN102999496A (zh) * | 2011-09-09 | 2013-03-27 | 北京百度网讯科技有限公司 | 建立需求分析模板的方法、搜索需求识别的方法及装置 |
CN103324645B (zh) * | 2012-03-23 | 2018-10-09 | 深圳市世纪光速信息技术有限公司 | 一种网页推荐方法和装置 |
CN103324645A (zh) * | 2012-03-23 | 2013-09-25 | 腾讯科技(深圳)有限公司 | 一种网页推荐方法和装置 |
CN103377201A (zh) * | 2012-04-17 | 2013-10-30 | 腾讯科技(深圳)有限公司 | 信息搜索方法及装置 |
CN103377201B (zh) * | 2012-04-17 | 2017-11-03 | 腾讯科技(深圳)有限公司 | 信息搜索方法及装置 |
CN102880660A (zh) * | 2012-09-03 | 2013-01-16 | 常州嘴馋了信息科技有限公司 | 网站热点信息排序系统 |
WO2014114137A1 (en) * | 2013-01-25 | 2014-07-31 | Tencent Technology (Shenzhen) Company Limited | Method and apparatus for recommending keywords |
CN103970748B (zh) * | 2013-01-25 | 2019-01-29 | 腾讯科技(深圳)有限公司 | 一种相关关键词推荐方法和装置 |
CN103970748A (zh) * | 2013-01-25 | 2014-08-06 | 腾讯科技(深圳)有限公司 | 一种相关关键词推荐方法和装置 |
US10452728B2 (en) | 2013-01-25 | 2019-10-22 | Tencent Technology (Shenzhen) Company Limited | Method and apparatus for recommending keywords |
CN103714120B (zh) * | 2013-12-03 | 2017-06-23 | 上海河广信息科技有限公司 | 一种从用户url访问记录中提取用户兴趣话题的系统 |
CN103955480B (zh) * | 2014-04-02 | 2018-08-10 | 百度在线网络技术(北京)有限公司 | 一种用于确定用户所对应的目标对象信息的方法与设备 |
CN103955480A (zh) * | 2014-04-02 | 2014-07-30 | 百度在线网络技术(北京)有限公司 | 一种用于确定用户所对应的目标对象信息的方法与设备 |
CN107193818A (zh) * | 2016-03-14 | 2017-09-22 | 百度在线网络技术(北京)有限公司 | 一种搜索方法、装置和终端设备 |
CN105975508A (zh) * | 2016-04-28 | 2016-09-28 | 西安电子科技大学 | 个性化元搜索引擎检索结果合成排序方法 |
CN105975508B (zh) * | 2016-04-28 | 2019-02-15 | 西安电子科技大学 | 个性化元搜索引擎检索结果合成排序方法 |
CN106021423A (zh) * | 2016-05-16 | 2016-10-12 | 西安电子科技大学 | 基于群组划分的元搜索引擎个性化结果推荐方法 |
CN106021423B (zh) * | 2016-05-16 | 2019-05-21 | 西安电子科技大学 | 基于群组划分的元搜索引擎个性化结果推荐方法 |
CN106202313A (zh) * | 2016-07-01 | 2016-12-07 | 西安电子科技大学 | 面向学术元搜索的检索结果合成排序方法 |
CN106202313B (zh) * | 2016-07-01 | 2019-06-21 | 西安电子科技大学 | 面向学术元搜索的检索结果合成排序方法 |
CN107357891A (zh) * | 2017-07-12 | 2017-11-17 | 中云开源数据技术(上海)有限公司 | 一种主页链接推荐方法 |
CN111930899A (zh) * | 2020-09-25 | 2020-11-13 | 成都数联铭品科技有限公司 | 一种关键词处理方法及系统、关键词搜索方法 |
Also Published As
Publication number | Publication date |
---|---|
EP2570935A4 (en) | 2017-03-15 |
US20130086053A1 (en) | 2013-04-04 |
US8898155B2 (en) | 2014-11-25 |
WO2011153807A1 (zh) | 2011-12-15 |
EP2570935B1 (en) | 2019-02-27 |
EP2570935A1 (en) | 2013-03-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101853308A (zh) | 一种个性化元搜索的方法及其应用终端 | |
CN100440224C (zh) | 一种搜索引擎性能评价的自动化处理方法 | |
CN102340514B (zh) | 网络信息推送方法及系统 | |
CN101256596B (zh) | 一种站内导航的方法及系统 | |
CN101464897A (zh) | 一种词匹配及信息查询方法及装置 | |
CN101655862A (zh) | 信息对象搜索的方法和装置 | |
CN102446225A (zh) | 一种实时搜索的方法、装置和系统 | |
CN101329674A (zh) | 一种提供个性化搜索的系统和方法 | |
CN102982042A (zh) | 一种个性化内容推荐方法、平台以及系统 | |
CN101441636A (zh) | 一种基于知识库的医院信息搜索引擎及系统 | |
CN102314443B (zh) | 搜索引擎的修正方法和系统 | |
CN102708174A (zh) | 一种浏览器中的富媒体信息的展示方法和装置 | |
CN102831199A (zh) | 建立兴趣模型的方法及装置 | |
CN103186574A (zh) | 一种搜索结果的生成方法和装置 | |
CN102117317A (zh) | 一种基于语音技术的盲人互联网系统 | |
CN102799587A (zh) | 一种论坛搜索方法和装置 | |
CN102063488A (zh) | 一种基于语义的代码搜索方法 | |
CN101382954A (zh) | 提供网址收藏名称的方法及系统 | |
CN102236719A (zh) | 基于网页分类的网页搜索引擎及快速查找方法 | |
CN102063453A (zh) | 一种用于基于用户的需求进行搜索的方法和设备 | |
CN103294681A (zh) | 一种搜索结果的生成方法和装置 | |
CN102270331A (zh) | 基于可视化搜索的网络购物导航方法 | |
CN103744954B (zh) | 一种词关联网模型的构建方法及其构建器 | |
CN100446003C (zh) | 意向驱动的博客搜索以及浏览系统 | |
KR100671077B1 (ko) | 페이지 묶음을 이용한 정보 검색 서비스 제공 서버, 방법및 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20101006 |