CN103970748B - 一种相关关键词推荐方法和装置 - Google Patents

一种相关关键词推荐方法和装置 Download PDF

Info

Publication number
CN103970748B
CN103970748B CN201310029622.2A CN201310029622A CN103970748B CN 103970748 B CN103970748 B CN 103970748B CN 201310029622 A CN201310029622 A CN 201310029622A CN 103970748 B CN103970748 B CN 103970748B
Authority
CN
China
Prior art keywords
query word
keyword
word
query
similar library
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310029622.2A
Other languages
English (en)
Other versions
CN103970748A (zh
Inventor
鲁四喜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Tencent Cloud Computing Beijing Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201310029622.2A priority Critical patent/CN103970748B/zh
Priority to PCT/CN2013/088175 priority patent/WO2014114137A1/en
Publication of CN103970748A publication Critical patent/CN103970748A/zh
Priority to US14/752,076 priority patent/US10452728B2/en
Application granted granted Critical
Publication of CN103970748B publication Critical patent/CN103970748B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3322Query formulation using system suggestions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • G06F16/90324Query formulation using system suggestions
    • G06F16/90328Query formulation using system suggestions using search space presentation or visualization, e.g. category or range presentation and selection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • G06F16/9574Browsing optimisation, e.g. caching or content distillation of access to content, e.g. by caching

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例公开了一种相关关键词推荐方法,包括:接收输入的第一查询词;检索关键词相似库,并根据所述关键词相似库中各相关关键词与所述第一查询词的相似度值,返回预定数量的相关关键词;接收输入的第二查询词;判断访问过的所述第一查询词的搜索结果中是否包括所述第二查询词,若为是,则增加所述第二关键词与第一关键词之间的相似度值;更新所述关键词相似库,保存所述第二查询词与所述第一查询词的关联关系。采用本发明,解决现有技术中搜索引擎无法推荐与查询词语义不相关内容却相关的相关关键词。

Description

一种相关关键词推荐方法和装置
技术领域
本发明涉及互联网领域,尤其涉及一种相关关键词推荐方法和装置。
背景技术
当前搜索引擎的相关关键词推荐是推荐和用户输入的关键词在单词表意上或语义上相似的关键词,如用户输入搜索“蘑菇”,百度返回的相关搜索为“香菇的做法大全”,“香菇油菜”,“香菇炖鸡”等,google返回的相关搜索为“蘑菇街”,“蘑菇网”,“蘑菇汤”等。这些相似关键词都是基于词法或语义相似度。
当前搜索引擎的相关关键词推荐是建立在用户明确知道要搜索的内容、指定关键词的前提上,故其推荐的相关关键词都是单词表意或语义上有一定的相似度的单词。当用户在无法准确表述要搜索的内容,无法明确指定其想搜索的关键词时,当前传统的推荐算法仅能根据输入关键词提供给用户信息时,用户会人为的查看搜索结果,进行判断、筛选,逐步修改其要搜索的关键词。举例来说,用户想搜索如何评估代码变更影响范围的文章,当他输入“代码变更影响范围”,返回的搜索及相关推荐里中都是包含这些“代码变更”或“影响范围”的结果。让我们考虑一下用户的行为,用户依次查看传统搜索引擎的搜索结果,当用户查看到一篇介绍代码变更测试相关的搜索结果时,意识到这个领域的专业术语“change centric testing”,所以他将搜索关键词改为“change centric testing”。如果从单词词法、语义上来讲“代码变更影响范围”和“change centric testing”相差甚远,用传统的推荐算法是无法推荐到的。
发明内容
本发明实施例所要解决的技术问题在于,提供一种相关关键词推荐方法。可解决现有技术中搜索引擎无法推荐与查询词语义不相关内容却相关的相关关键词。
为了解决上述技术问题,本发明实施例提供了一种相关关键词推荐方法,包括:
接收输入的第一查询词;
检索关键词相似库,并根据所述关键词相似库中各相关关键词与所述第一查询词的相似度值,返回预定数量的相关关键词;
接收输入的第二查询词;
判断访问过的所述第一查询词的搜索结果中是否包括所述第二查询词,若为是,则增加所述第二关键词与第一关键词之间的相似度值;
更新所述关键词相似库,保存所述第二查询词与所述第一查询词的关联关系。
相应地,本发明实施例还提供了一种相关关键词推荐装置,包括:
第一接收模块,用于接收输入的第一查询词;
关键词检索模块,用于检索关键词相似库,并根据所述关键词相似库中各相关关键词与所述第一查询词的相似度值,返回预定数量的相关关键词;
第二接收模块,用于接收输入的第二查询词;
相似度计算模块,判断访问过的所述第一查询词的搜索结果中是否包括所述第二查询词,若为是,则增加所述第二关键词与第一关键词之间的相似度值;相似库更新模块,用于更新所述关键词相似库,保存所述第二查询词与所述第一查询词的关联关系。
实施本发明实施例,具有如下有益效果:
实施本发明的实施例,通过记录输入的第一查询词和访问过的第一查询词匹配的搜索结果,当用户输入第二查询词时,解析访问过的第一查询词匹配的搜索结果中是否包括第二查询词,若存在第二查询词则表明第二查询词语第一查询词的内容存在关联,即使二者的语义不相关,将第二查询词更新至关键词相似库中,克服了传统搜索引擎仅能推荐词法/语义相关关键词问题,本发明能够推荐词法/语义无关但内容相关的关键词。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例的一种关键词推荐方法的流程示意图;
图2是本发明实施例的一种关键词推荐方法的另一流程示意图;
图3是本发明实施例的一种关键词推荐装置的结构示意图;
图4是本发明实施例的一种关键词推荐装置的另一结构示意图;
图5是图4中相似度计算模块的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1,为本发明的一种相关关键词推荐方法的流程示意图,该方法包括:
步骤101、接收输入的第一查询词。
步骤102、检索关键词相似库,并根据所述关键词相似库中各相关关键词与所述第一查询词的相似度值,返回预定数量的相关关键词。
具体的,用户通过搜索引擎的输入框输入第一查询词,搜索引擎接收到该第一查询词,搜索引擎的数据库中预置有关键词相似库,该关键词相似库中包括若干个相关关键词,搜索引擎根据获取到第一查询词计算关键词相似库中每一个相关关键词的相似度值,将计算得到的相似度值进行排序,返回预定数量的相关关键词,同时,搜索引擎根据预置的搜索算法返回与第一查询词相关的搜索结果,该搜索结果一般为网页的链接集合;搜索引擎对用户访问过的网页进行记录并保存至日志中。例如,假设用户输入的第一查询词为A0,预置的关键词相似库中的相关关键词为{A10,A8,A6,A1,A5,A2,A1,A3,A4,A7,A9},搜索引擎根据获取到的第一查询词A0分别计算关键词相似库中每个相关关键词的相似度值,相似度值越大表示该相关关键词与第一查询词越相似。假设计算出来的相关关键词降序排序为{A10,A9,A8,A7,A6,A5,A4,A3,A2,A1},假如需要显示5个相关关键词,则搜索引擎将{A10,A9,A8,A7,A6}5个相关关键词返回至搜索页面。
步骤103、接收输入的第二查询词。
具体的,搜索引擎接收到输入的与第一查询词不同的第二查询词,假设输入的第二查询词为B0。
步骤104、判断访问所述第一查询词的搜索结果中是否包括所述第二查询词。
具体的,从步骤102中保存的日志中获取访问过的第一查询词的搜索结果,判断该搜索结果中是否包括所述第二查询词。假设用户访问过的网址为“www.sample1.com”,该网址指向的页面中包括第二查询词B0,则表明第二查询词B0和第一查询词A0存在一定的相似度,执行步骤105,若不包括,则该流程结束。
步骤105、增加所述第二查询词语所述第一查询词之间的相似度值。
具体的,采用第二查询与第一查询词的关联次数来计算二者之间的相似度值,用户使用第一查询词返回的搜索结果中包括输入的第二查询词,计为关联次数加1,关联次数每增加1次则二者的相似度值加1,关联次数越多则表明第二查询词语第一查询词之间的相似度越大。也可以采用其他的算法来增加第二查询词和第一查询词之间的相似度值,本发明不作限制。
步骤106、更新所述关键词相似库,保存所述第二查询词与所述第一查询词的关联关系。
具体的,由于第二查询词与第一查询词存在相似度,搜索引擎将第二查询词更新至第二查询词的关键词相似库中,当用户下次再次输入第一查询词时,搜索引擎返回相关关键词时就会计算关键词相似库中的第二查询词的相似度值。假设按照步骤104的预置的算法,当第二查询词语第一查询词的关联次数较多时,根据相似度值排名第二查询词就会排在前面,搜索引擎会将相似度值较高的第二查询词推荐给用户。
实施本发明的实施例,通过记录输入的第一查询词和访问过的第一查询词匹配的搜索结果,当用户输入第二查询词时,解析访问过的第一查询词匹配的搜索结果中是否包括第二查询词,若存在第二查询词则表明第二查询词语第一查询词的内容存在关联,即使二者的语义不相关,将第二查询词更新至关键词相似库中,克服了传统搜索引擎仅能推荐词法/语义相关关键词问题,本发明能够推荐词法/语义无关但内容相关的关键词。
参见图2,为本发明的一种相关关键词推荐方法的另一流程示意图,该方法包括:
步骤201、接收输入的第一查询词。
步骤202、检索关键词相似库,并根据所述关键词相似库中各相关关键词与所述第一查询词的相似度值,返回预定数量的相关关键词。
具体的,用户通过搜索引擎的输入框输入第一查询词,搜索引擎接收到该第一查询词,搜索引擎的数据库中预置有关键词相似库,该关键词相似库中包括若干个相关关键词,搜索引擎根据获取到第一查询词计算关键词相似库中每一个相关关键词的相似度值,将计算得到的相似度值进行排序,返回预定数量的相关关键词,同时,搜索引擎根据预置的搜索算法返回与第一查询词相关的搜索结果,该搜索结果一般为网页的链接集合;搜索引擎对用户访问过的网页进行记录并保存至日志中。例如,假设用户输入的第一查询词为A0,预置的关键词相似库中的相关关键词为{A10,A8,A6,A1,A5,A2,A1,A3,A4,A7,A9},搜索引擎根据获取到的第一查询词A0分别计算关键词相似库中每个相关关键词的相似度值,相似度值越大表示该相关关键词与第一查询词越相似。假设计算出来的相关关键词降序排序为{A10,A9,A8,A7,A6,A5,A4,A3,A2,A1},假如需要显示5个相关关键词,则搜索引擎将{A10,A9,A8,A7,A6}5个相关关键词返回至搜索页面。
步骤203、接收输入的第二查询词。
步骤104、判断访问所述第一查询词的搜索结果中是否包括所述第二查询词。
具体的,从步骤102中保存的日志中获取访问过的第一查询词的搜索结果,判断该搜索结果中是否包括所述第二查询词。假设用户访问过的网址为“www.sample1.com”,该网址指向的页面中包括第二查询词B0,则表明第二查询词B0和第一查询词A0存在一定的相似度,执行步骤205,若不包括,则该流程结束。
步骤205、获取所述第二查询词与所述第一查询词的关联次数,根据所述关联次数确定所述第二查询词与所述第一查询词增加的相似度值。
具体的,由于第二查询词语第一查询词在语义上关联很小,二者之间相似度值可能会很小,无法达到搜索引擎的推荐阈值,但是二者的内容上是相关的,需要采用一定的算法来增加二者之间的相似度值以达到推荐语第一查询词语义不相关内容却相关的关键词。具体做法为,用户使用第一查询词返回的搜索结果中包括输入的第二查询词,计为关联次数加1,关联次数每增加1次则二者的相似度值加1,关联次数越多则表明第二查询词语第一查询词之间的相似度越大。
步骤206、判断根据所述第二查询词执行的当前搜索操作是否结束。
具体的,若在预定的时长内未返回与所述第二查询词相关的搜索结果,则确定根据所述第二查询词执行的当前搜索操作结束,执行步骤207,否则,继续判断。
步骤207、若所述关键词相似库中是否存在所述第二查询词,若不存在,则创建所述第一查询词语所述第二查询词的关联关系,并保存所述第二查询词值所述第一查询词相似库中。
具体的,第一查询词和相关关键词以表格的形式保存至关键词相似库中,判断关键词相似库中是否存在第二查询词,如果该行不存在,则创建该行。如果第一查询词的行已经存在,但关联的第二查询词的列不存在,只需增加一列,然后将该列的相似度值设为1。那么在下次查询第一查询词时,会优先显示相似度值较高的关键词。
实施本发明的实施例,通过记录输入的第一查询词和访问过的第一查询词匹配的搜索结果,当用户输入第二查询词时,解析访问过的第一查询词匹配的搜索结果中是否包括第二查询词,若存在第二查询词则表明第二查询词语第一查询词的内容存在关联,即使二者的语义不相关,将第二查询词更新至关键词相似库中,克服了传统搜索引擎仅能推荐词法/语义相关关键词问题,本发明能够推荐词法/语义无关但内容相关的关键词。
参见图3,为本发明的一种关键词推荐装置的结构示意图(以下简称推荐装置),包括:
第一接收模块11,用于接收输入的第一查询词。
关键词检索模块12,用于检索关键词相似库,并根据所述关键词相似库中各相关关键词与所述第一查询词的相似度值,返回预定数量的相关关键词。
具体的,搜索引擎的数据库中预置有关键词相似库,该关键词相似库中包括若干个相关关键词,关键词检索模块12根据获取到第一查询词计算关键词相似库中每一个相关关键词的相似度值,将计算得到的相似度值进行排序,返回预定数量的相关关键词,同时,关键词检索模块12根据预置的搜索算法返回与第一查询词相关的搜索结果,该搜索结果一般为网页的链接集合;关键词检索模块12对用户访问过的网页进行记录并保存至日志中。例如,假设用户输入的第一查询词为A0,预置的关键词相似库中的相关关键词为{A10,A8,A6,A1,A5,A2,A1,A3,A4,A7,A9},关键词检索模块12根据获取到的第一查询词A0分别计算关键词相似库中每个相关关键词的相似度值,相似度值越大表示该相关关键词与第一查询词越相似。假设计算出来的相关关键词降序排序为{A10,A9,A8,A7,A6,A5,A4,A3,A2,A1},假如需要显示5个相关关键词,则搜索引擎将{A10,A9,A8,A7,A6}5个相关关键词返回至搜索页面。
第二接收模块13,用于接收输入的第二查询词。
具体的,第二接收模块13接收到输入的与第一查询词不同的第二查询词,假设输入的第二查询词为B0。
相似度计算模块14,判断访问过的所述第一查询词的搜索结果中是否包括所述第二查询词,若为是,则增加所述第二关键词与第一关键词之间的相似度值。
具体的,从关键词检索模块12中保存的日志中获取访问过的第一查询词的搜索结果,相似度计算模块14判断该搜索结果中是否包括所述第二查询词。假设用户访问过的网址为“www.sample1.com”,该网址指向的页面中包括第二查询词B0,则表明第二查询词B0和第一查询词A0存在一定的相似度,执行步骤105,若不包括,则该流程结束。
相似度计算模块14采用第二查询与第一查询词的关联次数来计算二者之间的相似度值,用户使用第一查询词返回的搜索结果中包括输入的第二查询词,计为关联次数加1,关联次数每增加1次则二者的相似度值加1,关联次数越多则表明第二查询词语第一查询词之间的相似度越大。也可以采用其他的算法来增加第二查询词和第一查询词之间的相似度值,本发明不作限制。
相似库更新模块15,用于更新所述关键词相似库,保存所述第二查询词与所述第一查询词的关联关系。
实施本发明的实施例,通过记录输入的第一查询词和访问过的第一查询词匹配的搜索结果,当用户输入第二查询词时,解析访问过的第一查询词匹配的搜索结果中是否包括第二查询词,若存在第二查询词则表明第二查询词语第一查询词的内容存在关联,即使二者的语义不相关,将第二查询词更新至关键词相似库中,克服了传统搜索引擎仅能推荐词法/语义相关关键词问题,本发明能够推荐词法/语义无关但内容相关的关键词。
进一步的,参见图4和图5,为本发明的一种关键词推荐装置的另一种结构示意图,该推荐装置1除包括第一接收模块11、关键词检索模块12、第二接收模块13、相似度计算模块和相似库更新模块15外,还包括操作检测模块14。
操作检测模块16,用于判断根据所述第二查询词执行的当前搜索操作是否结束,若判断为是,则指示所述相似库更新模块进行操作。
进一步的,操作检测模块16用于若在预定的时长内未返回与所述第二查询词相关的搜索结果,则确定根据所述第二查询词执行的当前搜索操作结束。
其中,相似度计算模块14包括:
获取单元141,用于获取所述第二查询词与所述第一查询词的关联次数;
计算单元142,用于根据所述关联次数确定所述二查询词与所述第一查询词增加的相似度值。
进一步的,相似库更新模块15用于判断所述关键词相似库中是否存在所述第二查询词,若不存在,则创建所述第一查询词与所述第二查询词的关联关系。
实施本发明的实施例,通过记录输入的第一查询词和访问过的第一查询词匹配的搜索结果,当用户输入第二查询词时,解析访问过的第一查询词匹配的搜索结果中是否包括第二查询词,若存在第二查询词则表明第二查询词语第一查询词的内容存在关联,即使二者的语义不相关,将第二查询词更新至关键词相似库中,克服了传统搜索引擎仅能推荐词法/语义相关关键词问题,本发明能够推荐词法/语义无关但内容相关的关键词。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
以上所揭露的仅为本发明一种较佳实施例而已,当然不能以此来限定本发明之权利范围,本领域普通技术人员可以理解实现上述实施例的全部或部分流程,并依本发明权利要求所作的等同变化,仍属于发明所涵盖的范围。

Claims (10)

1.一种相关关键词推荐方法,其特征在于,包括:
接收输入的第一查询词;
检索关键词相似库,并根据所述关键词相似库中各相关关键词与所述第一查询词的相似度值,返回预定数量的相关关键词,以及返回与所述第一查询词相关的搜索结果;
接收输入的第二查询词;其中,所述第二查询词和所述第一查询词为相邻两次输入的;
判断访问过的所述第一查询词的搜索结果中是否包括所述第二查询词,若为是,则增加所述第二查询词与第一查询词之间的相似度值;
更新所述关键词相似库,保存所述第二查询词与所述第一查询词的关联关系。
2.如权利要求1所述的方法,其特征在于,所述更新所述关键词相似库,保存所述第二查询词与所述第一查询词的关联关系的步骤之前,该方法还包括:
判断根据所述第二查询词执行的当前搜索操作是否结束,若判断为是,则执行更新所述关键词相似库,保存所述第二查询词与所述第一查询词的关联关系。
3.如权利 要求2所述的方法,其特征在于,所述判断根据所述第二查询词执行的当前搜索操作是否结束的方法包括:
若在预定的时长内未返回与所述第二查询词相关的搜索结果,则确定根据所述第二查询词执行的当前搜索操作结束。
4.如权利要求3所述的方法,其特征在于,所述更新所述关键词相似库,保存所述第二查询词与所述第一查询词的关联关系包括:
判断所述关键词相似库中是否存在所述第二查询词,若不存在,则创建所述第一查询词与所述第二查询词的关联关系。
5.如权利要求1-4任一项所述的方法,其特征在于,所述增加所述第二查询词与第一查询词之间的相似度值包括:
获取所述第二查询词与所述第一查询词的关联次数;
根据所述关联次数确定所述二查询词与所述第一查询词增加的相似度值。
6.一种相关关键词推荐装置,其特征在于,包括:
第一接收模块,用于接收输入的第一查询词;
关键词检索模块,用于检索关键词相似库,并根据所述关键词相似库中各相关关键词与所述第一查询词的相似度值,返回预定数量的相关关键词,以及返回与所述第一查询词相关的搜索结果;
第二接收模块,用于接收输入的第二查询词;其中,所述第二查询词和所述第一查询词为相邻两次输入的;
相似度计算模块,判断访问过的所述第一查询词的搜索结果中是否包括所述第二查询词,若为是,则增加所述第二查询词与第一查询词之间的相似度值;
相似库更新模块,用于更新所述关键词相似库,保存所述第二查询词与所述第一查询词的关联关系。
7.如权利要求6所述的装置,其特征在于,还包括;
操作检测模块,用于判断根据所述第二查询词执行的当前搜索操作是否结束,若判断为是,则指示所述相似库更新模块进行操作。
8.如权利要求7所述的装置,其特征在于,所述操作检测模块用于若在预定的时长内未返回与所述第二查询词相关的搜索结果,则确定根据所述第二查询词执行的当前搜索操作结束。
9.如权利要求8所述的装置,其特征在于,所述相似库更新模块用于判断所述关键词相似库中是否存在所述第二查询词,若不存在,则创建所述第一查询词与所述第二查询词的关联关系。
10.如权利要求6-9任一项所述的装置,其特征在于,所述相似度计算模块包括:
获取单元,用于获取所述第二查询词与所述第一查询词的关联次数;
计算单元,用于根据所述关联次数确定所述二查询词与所述第一查询词增加的相似度值。
CN201310029622.2A 2013-01-25 2013-01-25 一种相关关键词推荐方法和装置 Active CN103970748B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201310029622.2A CN103970748B (zh) 2013-01-25 2013-01-25 一种相关关键词推荐方法和装置
PCT/CN2013/088175 WO2014114137A1 (en) 2013-01-25 2013-11-29 Method and apparatus for recommending keywords
US14/752,076 US10452728B2 (en) 2013-01-25 2015-06-26 Method and apparatus for recommending keywords

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310029622.2A CN103970748B (zh) 2013-01-25 2013-01-25 一种相关关键词推荐方法和装置

Publications (2)

Publication Number Publication Date
CN103970748A CN103970748A (zh) 2014-08-06
CN103970748B true CN103970748B (zh) 2019-01-29

Family

ID=51226901

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310029622.2A Active CN103970748B (zh) 2013-01-25 2013-01-25 一种相关关键词推荐方法和装置

Country Status (3)

Country Link
US (1) US10452728B2 (zh)
CN (1) CN103970748B (zh)
WO (1) WO2014114137A1 (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105447004B (zh) * 2014-08-08 2019-12-03 北京小度互娱科技有限公司 查询推荐词的挖掘、相关查询方法及装置
CN105389314B (zh) * 2014-09-04 2019-07-23 中芯国际集成电路制造(上海)有限公司 一种日志文件查询系统及查询方法
CN104331449B (zh) * 2014-10-29 2017-10-27 百度在线网络技术(北京)有限公司 查询语句与网页相似度的确定方法、装置、终端及服务器
CN105138512A (zh) * 2015-08-12 2015-12-09 小米科技有限责任公司 词组推荐方法及装置
CN105260419A (zh) * 2015-09-25 2016-01-20 广州亿码科技有限公司 一种相关关键词推荐方法及装置
CN107544982B (zh) * 2016-06-24 2022-12-02 中兴通讯股份有限公司 文本信息处理方法、装置及终端
CN106934007B (zh) * 2017-02-14 2021-02-12 北京时间股份有限公司 关联信息的推送方法及装置
CN108664508B (zh) * 2017-03-31 2021-12-24 百度在线网络技术(北京)有限公司 信息推送方法和装置
CN107122469B (zh) * 2017-04-28 2019-12-17 中国人民解放军国防科学技术大学 基于语义相似度与时效性频率的查询推荐排序方法与装置
US11256764B2 (en) * 2018-05-03 2022-02-22 EMC IP Holding Company LLC Managing content searches in computing environments
CN109190050A (zh) * 2018-11-02 2019-01-11 北京字节跳动网络技术有限公司 基于文章配图提供推荐词的方法、装置及电子设备
CN111611471B (zh) * 2019-02-25 2023-12-26 阿里巴巴集团控股有限公司 一种搜索方法、装置及电子设备
CN112307281A (zh) * 2019-07-25 2021-02-02 北京搜狗科技发展有限公司 一种实体推荐方法及装置
US11550777B2 (en) * 2020-07-29 2023-01-10 International Business Machines Corporation Determining metadata of a dataset

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101281523A (zh) * 2007-04-25 2008-10-08 北大方正集团有限公司 查询扩展方法和装置以及相关检索词库
CN101685448A (zh) * 2008-09-28 2010-03-31 国际商业机器公司 在用户的查询操作与搜索结果之间建立关联的方法和设备
CN101853308A (zh) * 2010-06-11 2010-10-06 中兴通讯股份有限公司 一种个性化元搜索的方法及其应用终端
CN102254039A (zh) * 2011-08-11 2011-11-23 武汉安问科技发展有限责任公司 一种基于搜索引擎的网络搜索方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020120712A1 (en) * 2001-02-27 2002-08-29 Seth Maislin Providing information to a user based on the user's search patterns
WO2002091154A2 (en) * 2001-05-10 2002-11-14 Changingworlds Limited Intelligent internet website with hierarchical menu
US6938031B1 (en) * 2001-10-19 2005-08-30 Data Return Llc System and method for accessing information in a replicated database
CN101515360A (zh) * 2009-04-13 2009-08-26 阿里巴巴集团控股有限公司 向用户推荐网络目标信息的方法和服务器
US9177058B2 (en) * 2010-11-18 2015-11-03 Google Inc. Multi-step search result retrieval
US20120158837A1 (en) * 2010-12-15 2012-06-21 Research In Motion Limited Method and system for establishing a notification service for a device
CN102654868B (zh) * 2011-03-02 2015-11-25 联想(北京)有限公司 一种基于关键字的搜索方法、搜索装置及服务器
US9824138B2 (en) * 2011-03-25 2017-11-21 Orbis Technologies, Inc. Systems and methods for three-term semantic search
US9256595B2 (en) * 2011-10-28 2016-02-09 Sap Se Calculating term similarity using a meta-model semantic network
CN103152707A (zh) * 2011-12-06 2013-06-12 富泰华工业(深圳)有限公司 手机及其处理短信的方法
CN103164713B (zh) * 2011-12-12 2016-04-06 阿里巴巴集团控股有限公司 图像分类方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101281523A (zh) * 2007-04-25 2008-10-08 北大方正集团有限公司 查询扩展方法和装置以及相关检索词库
CN101685448A (zh) * 2008-09-28 2010-03-31 国际商业机器公司 在用户的查询操作与搜索结果之间建立关联的方法和设备
CN101853308A (zh) * 2010-06-11 2010-10-06 中兴通讯股份有限公司 一种个性化元搜索的方法及其应用终端
CN102254039A (zh) * 2011-08-11 2011-11-23 武汉安问科技发展有限责任公司 一种基于搜索引擎的网络搜索方法

Also Published As

Publication number Publication date
US10452728B2 (en) 2019-10-22
CN103970748A (zh) 2014-08-06
US20150294018A1 (en) 2015-10-15
WO2014114137A1 (en) 2014-07-31

Similar Documents

Publication Publication Date Title
CN103970748B (zh) 一种相关关键词推荐方法和装置
US10180967B2 (en) Performing application searches
US8316007B2 (en) Automatically finding acronyms and synonyms in a corpus
TWI525458B (zh) Recommended methods and devices for searching for keywords
CN109522465A (zh) 基于知识图谱的语义搜索方法及装置
Fujiwara et al. Efficient ad-hoc search for personalized pagerank
US20100131563A1 (en) System and methods for automatic clustering of ranked and categorized search objects
US10984056B2 (en) Systems and methods for evaluating search query terms for improving search results
JP5923510B2 (ja) オンライン取引プラットフォームのための検索方法、装置およびサーバ
WO2018113468A1 (zh) 搜索词推荐方法、装置、程序及介质
Li et al. Context-based diversification for keyword queries over XML data
Dali et al. Query-independent learning to rank for rdf entity search
Rawat et al. Efficient focused crawling based on best first search
CN111159361B (zh) 获取文章的方法和装置及电子设备
US20050114317A1 (en) Ordering of web search results
CN108536665A (zh) 一种确定语句一致性的方法及装置
CN109815388A (zh) 一种基于遗传算法的智能聚焦爬虫系统
CN106339399B (zh) 关键词推荐方法及装置
CN106934007B (zh) 关联信息的推送方法及装置
JP2016038667A (ja) 情報提供装置、情報提供方法、および情報提供プログラム
Thenmalar et al. The modified concept based focused crawling using ontology
Torres-Tramón et al. A diffusion-based method for entity search
Ullah et al. Query subtopic mining for search result diversification
Hao et al. Towards a query-less news search framework on twitter
Sheokand et al. Best effort query answering in dataspaces on unstructured data

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20190731

Address after: Shenzhen Futian District City, Guangdong province 518057 Zhenxing Road, SEG Science Park 2 East Room 403

Co-patentee after: Tencent cloud computing (Beijing) limited liability company

Patentee after: Tencent Technology (Shenzhen) Co., Ltd.

Address before: Shenzhen Futian District City, Guangdong province 518057 Zhenxing Road, SEG Science Park 2 East Room 403

Patentee before: Tencent Technology (Shenzhen) Co., Ltd.