CN107590214A - 搜索关键词的推荐方法、装置及电子设备 - Google Patents

搜索关键词的推荐方法、装置及电子设备 Download PDF

Info

Publication number
CN107590214A
CN107590214A CN201710762230.5A CN201710762230A CN107590214A CN 107590214 A CN107590214 A CN 107590214A CN 201710762230 A CN201710762230 A CN 201710762230A CN 107590214 A CN107590214 A CN 107590214A
Authority
CN
China
Prior art keywords
search key
word frequency
character
keyword
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710762230.5A
Other languages
English (en)
Other versions
CN107590214B (zh
Inventor
梁宇轩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201710762230.5A priority Critical patent/CN107590214B/zh
Publication of CN107590214A publication Critical patent/CN107590214A/zh
Application granted granted Critical
Publication of CN107590214B publication Critical patent/CN107590214B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开涉及了一种搜索关键词的推荐方法及装置。其中,一种搜索关键词的推荐方法应用于服务器,所述方法包括:接收客户端发送的搜索关键词推荐请求,所述搜索关键词推荐请求是所述客户端根据用户输入的检索词信息发送的;在预先构建的关键词查找树所包含的若干分支中,将所述检索词信息与若干所述分支中节点上的字符进行匹配,得到节点上的字符与所述检索词信息相匹配的分支;基于匹配得到的分支,对其所包含的节点进行字符串提取,根据提取得到的字符串生成候选关键词结果;向所述客户端发送所述候选关键词结果。采用本公开所提供的搜索关键词的推荐方法及装置能够有效地提高搜索关键词的准确性,进而有利于提高搜索查找的准确性。

Description

搜索关键词的推荐方法、装置及电子设备
技术领域
本公开涉及计算机应用技术领域,尤其涉及一种搜索关键词的推荐方法、装置及电子设备。
背景技术
随着互联网技术的迅猛发展,各类型网站系统中都存储了数以百万计的信息和资料,越来越多的用户习惯通过输入搜索关键词来搜索查找相关链接。
应当理解,如果用户输入的搜索关键词不够准确甚至于错误,都将导致搜索查找到的相关链接并非用户实际所需要的。
由此,如何获取准确的搜索关键词以提高搜索查找的准确性仍亟待解决。
发明内容
为了解决上述技术问题,本公开的一个目的在于提供一种搜索关键词的推荐方法、装置及电子设备。
其中,本公开所采用的技术方案为:
一种搜索关键词的推荐方法,应用于服务器,包括:接收客户端发送的搜索关键词推荐请求,所述搜索关键词推荐请求是所述客户端根据用户输入的检索词信息发送的;在预先构建的关键词查找树所包含的若干分支中,将所述检索词信息与若干所述分支中节点上的字符进行匹配,得到节点上的字符与所述检索词信息相匹配的分支;基于匹配得到的分支,对其所包含的节点进行字符串提取,根据提取得到的字符串生成候选关键词结果;向所述客户端发送所述候选关键词结果。
一种搜索关键词的推荐装置,应用于服务器,包括:请求接收模块,用于接收客户端发送的搜索关键词推荐请求,所述搜索关键词推荐请求是所述客户端根据用户输入的检索词信息发送的;分支匹配模块,用于在预先构建的关键词查找树所包含的若干分支中,将所述检索词信息与若干所述分支中节点上的字符进行匹配,得到节点上的字符与所述检索词信息相匹配的分支;结果生成模块,用于基于匹配得到的分支,对其所包含的节点进行字符串提取,根据提取得到的字符串生成候选关键词结果;结果发送模块,用于向所述客户端发送所述候选关键词结果。
一种电子设备,包括处理器及存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时实现如上所述的搜索关键词的推荐方法。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的搜索关键词的推荐方法。
在本公开示例性实施例中,通过预先构建的关键词查找树,针对用户输入的检索词信息进行关键词查找树中若干分支的匹配查找,得到节点上字符与检索词信息相匹配的分支,进而通过对匹配得到的分支所包含节点进行字符串提取生成候选关键词结果,以此实现搜索关键词的推荐。
由于可通过关键词查找树进行搜索关键词的推荐,用户将被引导选择由关键词查找树所推荐的搜索关键词进行相关链接的搜索查找,避免用户输入不够准确甚至于错误的搜索关键词,以此有效地提高了搜索关键词的准确性,进而有利于提高搜索查找的准确性。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并于说明书一起用于解释本公开的原理。
图1是根据本公开所涉及的实施环境的示意图;
图2是根据一示例性实施例示出的一种服务器的硬件结构框图;
图3是根据一示例性实施例示出的一种搜索关键词的推荐方法的流程图;
图4是图3对应实施例中关键查找树的结构示意图;
图5是根据一示例性实施例示出的另一种搜索关键词的推荐方法的流程图;
图6是图5对应实施例中步骤430在一个实施例的流程图;
图7是图5对应实施例中步骤470在一个实施例的流程图;
图8是图7对应实施例中关键查找树的结构示意图;
图9是根据一示例性实施例示出的另一种搜索关键词的推荐方法的流程图;
图10是根据一示例性实施例示出的一种搜索关键词的推荐装置的框图;
图11是根据一示例性实施例示出的另一种搜索关键词的推荐装置的框图;
图12是图11对应实施例中词频获取模块830在一个实施例的框图;
图13是图11对应实施例中词频获取模块830在另一个实施例的框图;
图14是图11对应实施例中关键词添加模块850在一个实施例的框图。
通过上述附图,已示出本公开明确的实施例,后文中将有更详细的描述,这些附图和文字描述并不是为了通过任何方式限制本公开构思的范围,而是通过参考特定实施例为本领域技术人员说明本公开的概念。
具体实施方式
这里将详细地对示例性实施例执行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
图1为一种搜索关键词的推荐方法所涉及的实施环境的示意图。该实施环境包括用户设备100和服务器200。
其中,用户设备100可以是智能手机、平板电脑、计算机、笔记本电脑或者其它可供用户根据搜索关键词搜索查找相关链接的电子设备等等。
服务器200则被用于向用户设备100中运行的客户端推送可供选择的搜索关键词。
图2是根据一示例性实施例示出的一种服务器200的硬件结构框图。需要说明的是,该服务器200只是一个适配于本公开的示例,不能认为是提供了对本公开的使用范围的任何限制。该服务器200也不能解释为需要依赖于或者必须具有图2中示出的示例性的服务器200中的一个或者多个组件。
该服务器200的硬件结构可因配置或者性能的不同而产生较大的差异,如图2所示,服务器200包括:电源210、接口230、至少一存储介质250、以及至少一中央处理器(CPU,Central Processing Units)270。
其中,电源210用于为服务器200上的各硬件设备提供工作电压。
接口230包括至少一有线或无线网络接口231、至少一串并转换接口233、至少一输入输出接口235以及至少一USB接口237等,用于与外部设备通信。
存储介质250作为资源存储的载体,可以是随机存储介质、磁盘或者光盘等,其上所存储的资源包括操作系统251、应用程序253及数据255等,存储方式可以是短暂存储或者永久存储。其中,操作系统251用于管理与控制服务器200上的各硬件设备以及应用程序253,以实现中央处理器270对海量数据255的计算与处理,其可以是Windows ServerTM、MacOS XTM、UnixTM、LinuxTM、FreeBSDTM等。应用程序253是基于操作系统251之上完成至少一项特定工作的计算机程序,其可以包括至少一模块(图2中未示出),每个模块都可以分别包含有对服务器200的一系列操作指令。数据255可以是存储于磁盘中的照片、图片等等。
中央处理器270可以包括一个或多个以上的处理器,并设置为通过总线与存储介质250通信,用于运算与处理存储介质250中的海量数据255。
如上面所详细描述的,适用本公开的服务器200将通过中央处理器270读取存储介质250中存储的一系列操作指令的形式来进行搜索关键词的推荐,以使用户设备100中运行的客户端得到搜索关键词的推送,进而使得用户根据推送的搜索关键词完成相关链接的搜索查找。
此外,通过硬件电路或者硬件电路结合软件指令也能同样实现本公开,因此,实现本公开并不限于任何特定硬件电路、软件以及两者的组合。
请参阅图3,在一示例性实施例中,一种搜索关键词的推荐方法适用于图1所示实施环境的服务器200,该种搜索关键词的推荐方法可以由服务器200执行,可以包括以下步骤:
步骤310,接收客户端发送的搜索关键词推荐请求。
其中,搜索关键词推荐请求是客户端根据用户输入的检索词信息发送的。
检索词信息用于指示用户实际需要搜索查找的相关链接,通过检索词信息的指示即可为用户推荐搜索关键词,进而使得用户根据推荐的搜索关键词搜索查找到相关链接。
检索词信息可以是汉字、拼音音节、英文字母、数字、特殊字符或者上述类型的任意组合。例如,检索词信息可以包括若干个检索词,还可以包括某个检索词的前缀。
对于客户端而言,客户端将为用户提供一个搜索查找入口,例如,搜索查找入口为一输入对话框,用户可以根据实际需要搜索查找的相关链接在该输入对话框进行检索词的输入,进而触发客户端获取相应的检索词信息,并根据该检索词信息生成搜索关键词推荐请求,再将搜索关键词推荐请求发送至服务器。
对于服务器而言,服务器接收到客户端发送的搜索关键词推荐请求之后,便可由该搜索关键词推荐请求中提取出检索词信息,进而根据提取得到的检索词信息触发进行后续搜索关键词的推荐。
步骤330,在预先构建的关键词查找树所包含的若干分支中,将检索词信息与若干分支中节点上的字符进行匹配,得到节点上的字符与检索词信息相匹配的分支。
本实施例中,关键词查找树是根据若干热搜关键词预先构建的。其中,热搜关键词可以根据某个网站的热搜排名得到,也可以依照用户输入统计分析得到,在此并未加以限定。
关键词查找树包含若干条分支,每一条分支由若干个节点以及若干条连接在相邻节点之间的路径构成。
具体地,每个节点上存储了至少一字符,相邻节点之间的路径表示一个字符。进一步地,路径所连接的节点与路径所指向的节点为相邻节点。相应地,路径所连接的节点上字符作为路径所指向的节点上字符的前缀。
举例来说,如图4所示,节点501上的字符为i,路径502表示字符n,路径502所指向的节点即为与节点501相邻的节点503,该节点503上的字符则为i+n=in。其中,i即为in的前缀。
又例如,节点503与节点506、节点507互为相邻节点,相邻节点503、506之间的路径504表示字符n,相邻节点503、507之间的路径505表示字符t,则节点506上的字符为in+n=inn,节点507上的字符为in+t=int,此时,in作为inn和int的前缀。
由此可知,每个节点表示一个热搜关键词,不同分支之间的共享节点则表示不同热搜关键词之间的共享前缀。
基于上述,在由搜索关键词推荐请求中提取得到检索词信息之后,便可针对关键词查找树所包含的若干分支,匹配查找节点上字符与检索词信息相匹配的分支。
具体地,通过将检索词信息与若干分支中节点上的字符进行匹配实现分支的匹配查找。
例如,如图4所示,若检索词信息为in,通过匹配查找,节点503上的字符in与该检索词信息in匹配,则由节点503、路径504和节点506构成的分支、以及由节点503、路径505和节点507构成的分支均为节点上字符与检索词信息相匹配的分支。
通过上述步骤,有利于后续根据匹配得到的分支中包含的若干节点所表示的热搜关键词进行的搜索关键词推荐,即被推荐的搜索关键词均为热搜关键词,以此保证了被推荐的搜索关键词均是当前较为热门的,从而有利于提高搜索关键词的准确性,以利于提高搜索查找的准确性。
步骤350,基于匹配得到的分支,对其所包含的节点进行字符串提取,根据提取得到的字符串生成候选关键词结果。
如上述例子中,匹配得到的分支包括由节点503、路径504和节点506构成的分支、以及由节点503、路径505和节点507构成的分支。
相应地,匹配得到的分支所包含的节点包括节点503、节点506和节点507,通过字符串提取,提取得到的字符串包括in、inn、int。
可以理解,节点503上的字符是与检索词信息相匹配的,则被推荐的搜索关键词应该避免与节点503上的字符重复,以此避免被推荐的搜索关键词与检索词信息重复,进而保证搜索关键词的推荐有效性。
为此,由提取得到的字符串生成的候选关键词结果为{inn、int},即候选关键词结果中的候选关键词inn和int是以检索词信息所匹配节点503上的字符in作为前缀的。
通过上述步骤,即使得在客户端中获取用户输入的检索词信息时,可以不必等待用户输入完整的检索词(例如inn或者int),而仅需要获取到检索词的前缀(例如in)便可快速地触发服务器获取到相应的候选关键词(例如inn和int),进而有利于提高搜索查找的效率。
步骤370,向客户端发送候选关键词结果。
对于客户端而言,在服务器进行候选关键词结果的推送之后,便可接收到该候选关键词结果。
进一步地,客户端中,将根据候选关键词结果中的若干候选关键词进行检索词的联想展现。
举例来说,用户在输入对话框中输入检索词时,输入对话框的下拉列表中将依次展示出候选关键词结果中的若干候选关键词,以便于用户由检索词联想展现出的若干候选关键词中选择得到搜索关键词。
其中,候选关键词的展示顺序可以根据候选关键词的热搜频次,也可以按照候选关键词的拼读规则,在此并未加以限定。
通过如上所述的过程,实现了向用户推荐关键词查找树中存储的热搜关键词,以此保证了被推荐的搜索关键词均是当前较为热门的,避免用户输入不够准确甚至于错误的搜索关键词进行相关链接的搜索查找,从而有利于提高搜索关键词的准确性,有利于提高搜索查找的准确性。
此外,能够根据检索词信息中检索词的前缀触发服务器进行搜索关键词的推荐,即不必等待用户输入完整的检索词,有利于提高搜索查找的效率。
请参阅图5,在一示例性实施例中,步骤370之后,如上所述的方法还可以包括以下步骤:
步骤410,接收客户端反馈的关键词选择结果。
其中,关键词选择结果是客户端响应用户根据候选关键词结果触发进行的选择操作生成的。
对于用户而言,在客户端得到服务器推送的候选关键词结果之后,便可由候选关键词结果中的若干候选关键词中选取其中一个候选关键词,进而使得客户端以用户选取的候选关键词作为搜索关键词,触发进行相关链接的搜索查找。
对于客户端而言,客户端将为用户提供一个选择入口,使得用户通过该选择入口进行候选关键词的选择。例如,选择入口是以列表的形式向用户展示候选关键词结果中的若干候选关键词,用户通过点击列表中展示的候选关键词选取相应的候选关键词,该点击操作即为用户根据候选关键词结果触发进行的选择操作。
进一步地,客户端通过响应该选择操作生成关键词选择结果,并将该关键词选择结果发送至服务器。其中,关键词选择结果包含了用户选取的候选关键词,即搜索关键词。
相应地,服务器便可接收到客户端发送的关键词选择结果,并由关键词选择结果中获取到搜索关键词。
步骤430,对关键词选择结果中的搜索关键词进行词频预处理,得到搜索关键词的词频。
本实施例中,热搜关键词是针对海量用户所在客户端反馈的搜索关键词进行统计排序得到的。也就是说,客户端反馈同一搜索关键词的次数越多,该搜索关键词就越热门,即作为热搜关键词的几率就越高。相应地,搜索关键词的词频即反映了搜索关键词被客户端反馈的次数,亦即用户在客户端输入该搜索关键词的次数。
因此,在由关键词选择结果中得到搜索关键词之后,将通过词频预处理来获取该搜索关键词的词频,进而根据该搜索关键词的词频获知用户输入该搜索关键词的次数,以便于后续根据该搜索关键词的次数进行关键词查找树的构建。
步骤450,判断搜索关键词的词频是否达到预设阈值。
预设阈值用于表示能够成为热搜关键词所需要达到的热搜频次。
若搜索关键词的词频未达到预设阈值,表示搜索关键词的词频未达到成为热搜关键词的热搜频次,则不添加该搜索关键词。
若搜索关键词的词频已达到预设阈值,表示搜索关键词的词频已达到热搜关键词的热搜频次,则跳转进入步骤470,将搜索关键词添加至关键词查找树,使该搜索关键词成为关键词查找树中的热搜关键词。
步骤470,将搜索关键词添加至关键词查找树。
在完成搜索关键词的添加之后,关键词查找树中即增加了一个新的热搜关键词。
在上述实施例的作用下,实现了基于用户行为实时更新关键词查找树,即根据用户选择的候选关键词进行搜索关键词的添加,以此保证了关键词查找树中存储的热搜关键词是当前较为热门的,进一步有利于提高搜索关键词的准确性。
请参阅图6,在一示例性实施例中,步骤430可以包括以下步骤:
步骤431,判断预先设置的词频集合中是否存在搜索关键词的词频。
其中,词频集合是针对海量用户所在客户端反馈的搜索关键词预先设置的。
具体地,当客户端第一次反馈搜索关键词,则对该搜索关键词进行初始化处理,即为该搜索关键词配置一词频,并将该搜索关键词的词频置为一,同时,将该搜索关键词及其词频关联存储至词频集合。
当客户端第二次反馈该搜索关键词,则更新词频集合中该搜索关键词的词频,即将该搜索关键词的词频加一。
以此类推,若该搜索关键词被客户端反馈的次数越多,则该搜索关键词的词频越高。
基于此,对搜索关键词的词频预处理是基于词频集合实现的,即判断搜索关键词的词频是否存在于词频集合中。
如果词频集合中存在搜索关键词的词频,则跳转进入步骤433,由词频集合中读取搜索关键词的词频,并更新该搜索关键词的词频。
反之,如果词频集合中不存在搜索关键词的词频,则跳转进入步骤437,对搜索关键词进行初始化处理。
步骤433,由词频集合中获取搜索关键词的词频。
步骤435,将词频集合中搜索关键词的词频加一。
在由词频集合中获取到搜索关键词的词频之后,即表示客户端再次反馈了该搜索关键词,相应地,需要更新词频集合中该搜索关键词的词频,即执行步骤435。
进一步地,如图6所示,在另一示例性实施例中,步骤430还可以包括以下步骤:
步骤437,为搜索关键词配置一词频,并将搜索关键词的词频置为一。
步骤439,将搜索关键词及其词频关联存储至词频集合。
当词频集合中不存在搜索关键词的词频,即表示该搜索关键词是第一次被客户端反馈的,相应地,需要对该搜索关键词进行初始化处理,即执行步骤437至步骤439。
请参阅图7,在一示例性实施例中,步骤470可以包括以下步骤:
步骤471,获取搜索关键词对应的字符串。
如前所述,关键词查找树是根据若干热搜关键词预先构建的。关键词查找树包含若干条分支,每一条分支由若干个节点以及若干条连接在相邻节点之间的路径构成。其中,每个节点上存储了至少一字符,相邻节点之间的路径表示一个字符。
换而言之,关键词查找树中均是以字符形式进行热搜关键词的存储。
由此,为了将搜索关键词添加至关键词查找树中,首先需要获取搜索关键词对应的字符串。例如,搜索关键词“inn”对应的字符串即“inn”。
步骤473,遍历关键词查找树中的各节点,得到节点上字符与搜索关键词对应字符串匹配度最高的节点。
在确定搜索关键词对应的字符串之后,还需要获知搜索关键词应该被添加在关键词查找树中哪条分支的哪个节点位置。
由于关键词查找树的构建方式是按照热搜关键词的前缀进行的,即不同分支之间的共享节点表示不同热搜关键词之间的共享前缀,而相邻节点中,路径所连接节点表示的热搜关键词作为路径所指向节点表示的热搜关键词的前缀。
基于此,欲获知搜索关键词被添加在哪条分支的哪个节点位置,首先需要确定可作为搜索关键词前缀的节点,即节点上字符与搜索关键词对应字符串匹配度最高的节点。
其中,匹配度是指节点上的字符不超过搜索关键词对应字符串的字符个数。可以理解,相差的字符个数越少,则匹配度越高。例如,如图8所示,假设搜索关键词为“ins”,则通过遍历关键词查找树中的各节点,得到匹配度最高的节点为节点503,其上字符为“in”,二者之间仅相差一个字符“s”。
步骤475,针对匹配度最高的节点,以其所包含的字符作为搜索关键词的前缀,并按照预设构建规则将搜索关键词对应字符串中区别于前缀的其余字符存储至关键词查找树。
在一具体实施例中,预设构建规则包括:由其余字符中提取出一个字符;为提取得到的字符构建一条路径,并将路径与所包含字符被作为前缀的节点相连,路径表示提取得到的字符;构建一个由路径指向的新增节点,将路径相连节点上的字符和路径表示的字符共同添加至新增节点;跳转至由其余字符中提取出一个字符步骤,直至其余字符中的全部字符完成提取。
举例来说,如图8所示,假设搜索关键词为“ins”,则确定节点503上的字符“in”为搜索关键词的前缀。
首先,由搜索关键词对应字符串中区别于该前缀的其余字符“s”中提取出一个字符“s”。
为字符“s”构建一条路径508,路径508与节点503相连,路径508表示字符“s”。
构建一个由路径508指向的新增节点509,将节点503上的字符“in”和路径508表示的字符“s”共同添加至新增节点509,则该新增节点509上的字符为“ins”,即该新增节点509表示搜索关键词“ins”。
至此,其余字符中的全部字符“s”完成提取,即,搜索关键词“ins”作为新的热搜关键词被添加至关键词查找树。
进一步地,在一示例性实施例中,搜索关键词包含汉字。
相应地,步骤471可以包括以下步骤:
对搜索关键词中的汉字进行拼音预处理,得到搜索关键词对应的字符串。
由于关键词查找树中均是以字符串的形式进行热搜关键词的存储,因此,当搜索关键词包含汉字,则需要对汉字进行拼音预处理,以得到可存储的字符串形式的搜索关键词。
具体地,拼音预处理包括汉字转换为拼音,例如,通过汉字转换拼音工具实现,将搜索关键词“拼音”转换为对应的字符串“pinyin”。
进一步地,拼音预处理还可以包括拼音缩写提取,例如,经过拼音缩写提取,搜索关键词“拼音”对应的字符串为“py”,以此有利于简化用户输入检索词的输入操作,加快用户的输入速度,进一步有利于提高搜索查找的效率。
更进一步地,拼音预处理还可以包括多音字全排序,进而通过多音字全排序在进行检索词的联想展现时实现多音字提示,避免用户因多音字而输入错误的检索词,进一步有利于提高搜索关键词的准确性,进而有利于提高搜索查找的准确性。
通过上述各实施例的相互配合,为当前较为热门的热搜关键词建立一个具有前缀索引功能的关键词查找树,使得用户仅需要输入检索词的前缀便可通过该关键词查找树快速地获取到若干个被推荐的搜索关键词,不仅提高了搜索查找的效率,而且保证被推荐的搜索关键词均是热搜关键词,有效地提高了搜索关键词的准确性,使得用户根据准确性高的搜索关键词快速搜索查找到相关链接,进而有利于提高用户的搜索查找体验。
请参阅图9,在一示例性实施例中,适用于图1所示实施环境的服务器200,该种搜索关键词的推荐方法可以由服务器200执行,可以包括以下步骤:
步骤610,通过侦听用户输入的检索词信息触发进行搜索关键词的推荐。
步骤630,在触发进行的搜索关键词推荐中,判断本地历史搜索记录中是否包含与检索词信息相关联的搜索关键词。
其中,本地历史搜索记录中存储了用户每次进行相关链接的搜索查找时所使用的搜索关键词。
步骤650,如果本地历史搜索记录中未包含与检索词信息相关联的搜索关键词,则根据检索词信息向服务器发送搜索关键词推荐请求。
步骤670,接收服务器响应搜索关键词推荐请求返回的候选关键词结果,并展示候选关键词结果中的候选关键词。候选关键词结果是所述服务器通过预先构建的关键词查找树生成的。
通过上述实施例,实现了本地存储搜索关键词联合服务器推荐搜索关键词的方案。
即,在本地历史搜索记录中存储了与检索词信息相匹配的搜索关键词时,直接推荐匹配得到的搜索关键词,有效地提高了搜索查找的效率,还有利于减轻服务器的处理压力。
当本地历史搜索记录中未存储与检索词信息相匹配的搜索关键词时,通过服务器中的关键词查找树实施搜索关键词的推荐,以此保证搜索关键词的准确性,有利于提高搜索查找的准确性,进而有利于提升用户的搜索查找体验。
下述为本公开装置实施例,可以用于执行本公开所涉及的搜索关键词的推荐方法。对于本公开装置实施例中未披露的细节,请参照本公开所涉及的搜索关键词的推荐方法实施例。
请参阅图10,在一示例性实施例中,一种搜索关键词的推荐装置700包括但不限于:请求接收模块710、分支匹配模块730、结果生成模块750和结果发送模块770。
其中,请求接收模块710用于接收客户端发送的搜索关键词推荐请求,搜索关键词推荐请求是客户端根据用户输入的检索词信息发送的。
分支匹配模块730用于在预先构建的关键词查找树所包含的若干分支中,将检索词信息与若干分支中节点上的字符进行匹配,得到节点上的字符与检索词信息相匹配的分支。
结果生成模块750用于基于匹配得到的分支,对其所包含的节点进行字符串提取,根据提取得到的字符串生成候选关键词结果。
结果发送模块770用于向客户端发送候选关键词结果。
请参阅图11,在一示例性实施例中,如上所述的装置700还包括但不限于:结果接收模块810、词频获取模块830和关键词添加模块850。
其中,结果接收模块810用于接收客户端反馈的关键词选择结果,关键词选择结果是客户端响应用户根据候选关键词结果触发进行的选择操作生成的。
词频获取模块830用于对关键词选择结果中的搜索关键词进行词频预处理,得到搜索关键词的词频。
关键词添加模块850用于当搜索关键词的词频达到预设阈值,时,将搜索关键词添加至关键词查找树。
请参阅图12,在一示例性实施例中,词频获取模块830包括但不限于:词频判断单元831、词频读取单元833和词频更新单元835。
其中,词频判断单元831用于判断预先设置的词频集合中是否存在搜索关键词的词频。
词频读取单元833用于当词频集合中存在搜索关键词的词频时,由词频集合中获取搜索关键词的词频。
词频更新单元835用于将词频集合中搜索关键词的词频加一。
进一步地,请参阅图13,在一示例性实施例中,词频获取模块830还包括但不限于:词频配置单元837和词频存储单元839。
其中,词频配置单元837用于当词频集合中不存在搜索关键词的词频时,为搜索关键词配置一词频,并将搜索关键词的词频置为一。
词频存储单元839用于将搜索关键词及其词频关联存储至词频集合。
请参阅图14,在一示例性实施例中,关键词添加模块850包括但不限于:字符串获取单元851、节点遍历单元853和构建单元855。
其中,字符串获取单元851用于获取搜索关键词对应的字符串。
节点遍历单元853用于遍历关键词查找树中的各节点,得到节点上字符与搜索关键词对应字符串匹配度最高的节点。
构建单元855用于针对匹配度最高的节点,以其所包含的字符作为前缀,并按照预设构建规则将搜索关键词对应字符串中区别于前缀的其余字符存储至关键词查找树。
进一步地,在一示例性实施例中,搜索关键词包含汉字。
相应地,字符串获取单元851包括但不限于:拼音预处理单元。
其中,拼音预处理单元用于对搜索关键词中的汉字进行拼音预处理,得到搜索关键词对应的字符串。
需要说明的是,上述实施例所提供的搜索关键词的推荐装置在进行搜索关键词的推荐处理时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即搜索关键词的推荐装置的内部结构将划分为不同的功能模块,以完成以上描述的全部或者部分功能。
另外,上述实施例所提供的搜索关键词的推荐装置与搜索关键词的推荐方法的实施例属于同一构思,其中各个模块执行操作的具体方式已经在方法实施例中进行了详细描述,此处不再赘述。
在一示例性实施例中,一种电子设备,包括处理器及存储器。
其中,存储器上存储有计算机可读指令,该计算机可读指令被处理器执行时实现如上的各实施例中的搜索关键词的推荐方法。
在一示例性实施例中,一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上的各实施例中的搜索关键词的推荐方法。
上述内容,仅为本公开的较佳示例性实施例,并非用于限制本公开的实施方案,本领域普通技术人员根据本公开的主要构思和精神,可以十分方便地进行相应的变通或修改,故本公开的保护范围应以权利要求书所要求的保护范围为准。

Claims (15)

1.一种搜索关键词的推荐方法,应用于服务器,其特征在于,包括:
接收客户端发送的搜索关键词推荐请求,所述搜索关键词推荐请求是所述客户端根据用户输入的检索词信息发送的;
在预先构建的关键词查找树所包含的若干分支中,将所述检索词信息与若干所述分支中节点上的字符进行匹配,得到节点上的字符与所述检索词信息相匹配的分支;
基于匹配得到的分支,对其所包含的节点进行字符串提取,根据提取得到的字符串生成候选关键词结果;
向所述客户端发送所述候选关键词结果。
2.如权利要求1所述的方法,其特征在于,所述向所述客户端发送所述候选关键词结果之后,所述方法还包括:
接收所述客户端反馈的关键词选择结果,所述关键词选择结果是所述客户端响应用户根据所述候选关键词结果触发进行的选择操作生成的;
对所述关键词选择结果中的搜索关键词进行词频预处理,得到所述搜索关键词的词频;
当所述搜索关键词的词频达到预设阈值时,将所述搜索关键词添加至所述关键词查找树。
3.如权利要求2所述的方法,其特征在于,所述对所述关键词选择结果中的搜索关键词进行词频预处理,得到所述搜索关键词的词频,包括:
当所述词频集合中存在所述搜索关键词的词频时,由所述词频集合中获取所述搜索关键词的词频;
将所述词频集合中所述搜索关键词的词频加一。
4.如权利要求3所述的方法,其特征在于,所述对所述关键词选择结果中的搜索关键词进行词频预处理,得到所述搜索关键词的词频,还包括:
当所述词频集合中不存在所述搜索关键词的词频时,为所述搜索关键词配置一词频,并将所述搜索关键词的词频置为一;
将所述搜索关键词及其词频关联存储至所述词频集合。
5.如权利要求2所述的方法,其特征在于,所述将所述搜索关键词添加至所述关键词查找树,包括:
获取所述搜索关键词对应的字符串;
遍历所述关键词查找树中的各节点,得到节点上字符与所述搜索关键词对应字符串匹配度最高的节点;
针对匹配度最高的节点,以其所包含的字符作为所述搜索关键词的前缀,并按照预设构建规则将所述搜索关键词对应字符串中区别于所述前缀的其余字符存储至所述关键词查找树。
6.如权利要求5所述的方法,其特征在于,所述搜索关键词包含汉字,所述获取所述搜索关键词对应的字符串,包括:
对所述搜索关键词中的汉字进行拼音预处理,得到所述搜索关键词对应的字符串。
7.如权利要求5所述的方法,其特征在于,所述按照预设构建规则将所述搜索关键词对应字符串中区别于所述前缀的其余字符存储至所述关键词查找树,包括:
由所述其余字符中提取出一个字符;
为提取得到的字符构建一条路径,并将所述路径与所包含字符被作为所述前缀的节点相连,所述路径表示提取得到的字符;
构建一个由所述路径指向的新增节点,将所述路径相连节点上的字符和所述路径表示的字符共同添加至所述新增节点;
跳转至由所述其余字符中提取出一个字符步骤,直至所述其余字符中的全部字符完成提取。
8.一种搜索关键词的推荐装置,应用于服务器,其特征在于,包括:
请求接收模块,用于接收客户端发送的搜索关键词推荐请求,所述搜索关键词推荐请求是所述客户端根据用户输入的检索词信息发送的;
分支匹配模块,用于在预先构建的关键词查找树所包含的若干分支中,将所述检索词信息与若干所述分支中节点上的字符进行匹配,得到节点上的字符与所述检索词信息相匹配的分支;
结果生成模块,用于基于匹配得到的分支,对其所包含的节点进行字符串提取,根据提取得到的字符串生成候选关键词结果;
结果发送模块,用于向所述客户端发送所述候选关键词结果。
9.如权利要求8所述的方法,其特征在于,所述装置还包括:
结果接收模块,用于接收所述客户端反馈的关键词选择结果,所述关键词选择结果是所述客户端响应用户根据所述候选关键词结果触发进行的选择操作生成的;
词频获取模块,用于对所述关键词选择结果中的搜索关键词进行词频预处理,得到所述搜索关键词的词频;
关键词添加模块,用于当所述搜索关键词的词频达到预设阈值时,将所述搜索关键词添加至所述关键词查找树。
10.如权利要求8所述的方法,其特征在于,所述词频获取模块包括:
词频判断单元,用于判断预先设置的词频集合中是否存在所述搜索关键词的词频;
词频读取单元,用于当所述词频集合中存在所述搜索关键词的词频时,由所述词频集合中获取所述搜索关键词的词频;
词频更新单元,用于将所述词频集合中所述搜索关键词的词频加一。
11.如权利要求10所述的方法,其特征在于,所述词频获取模块还包括:
词频配置单元,用于当所述词频集合中不存在所述搜索关键词的词频时,为所述搜索关键词配置一词频,并将所述搜索关键词的词频置为一;
词频存储单元,用于将所述搜索关键词及其词频关联存储至所述词频集合。
12.如权利要求9所述的方法,其特征在于,所述关键词添加模块包括:
字符串获取单元,用于获取所述搜索关键词对应的字符串;
节点遍历单元,用于遍历所述关键词查找树中的各节点,得到节点上字符与所述搜索关键词对应字符串匹配度最高的节点;
构建单元,用于针对匹配度最高的节点,以其所包含的字符作为前缀,并按照预设构建规则将所述搜索关键词对应字符串中区别于所述前缀的其余字符存储至所述关键词查找树。
13.如权利要求12所述的方法,其特征在于,所述搜索关键词包含汉字,所述字符串获取单元包括:
拼音预处理单元,用于对所述搜索关键词中的汉字进行拼音预处理,得到所述搜索关键词对应的字符串。
14.一种电子设备,其特征在于,包括:
处理器;及
存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时实现如权利要求1至7中任一项所述的搜索关键词的推荐方法。
15.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的搜索关键词的推荐方法。
CN201710762230.5A 2017-08-30 2017-08-30 搜索关键词的推荐方法、装置及电子设备 Active CN107590214B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710762230.5A CN107590214B (zh) 2017-08-30 2017-08-30 搜索关键词的推荐方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710762230.5A CN107590214B (zh) 2017-08-30 2017-08-30 搜索关键词的推荐方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN107590214A true CN107590214A (zh) 2018-01-16
CN107590214B CN107590214B (zh) 2021-05-25

Family

ID=61050550

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710762230.5A Active CN107590214B (zh) 2017-08-30 2017-08-30 搜索关键词的推荐方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN107590214B (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108509555A (zh) * 2018-03-22 2018-09-07 武汉斗鱼网络科技有限公司 搜索词确定方法、装置、设备及存储介质
CN108549681A (zh) * 2018-04-03 2018-09-18 Oppo广东移动通信有限公司 数据处理方法和装置、电子设备、计算机可读存储介质
CN109033326A (zh) * 2018-07-17 2018-12-18 深圳市嘀哒知经科技有限责任公司 一种知识技能的拆分重组方法及装置
CN109063200A (zh) * 2018-09-11 2018-12-21 广州神马移动信息科技有限公司 资源搜索方法及其装置、电子设备、计算机可读介质
CN110147431A (zh) * 2019-05-05 2019-08-20 中国银行股份有限公司 关键词匹配方法、装置、计算机设备和存储介质
CN110674362A (zh) * 2019-08-22 2020-01-10 视联动力信息技术股份有限公司 搜索推荐方法、装置、电子设备及可读存储介质
CN111026281A (zh) * 2019-10-31 2020-04-17 重庆小雨点小额贷款有限公司 一种客户端的词组推荐方法、客户端及存储介质
CN111222918A (zh) * 2020-01-04 2020-06-02 厦门二五八网络科技集团股份有限公司 关键词挖掘方法、装置、电子设备及存储介质
CN111324804A (zh) * 2020-02-21 2020-06-23 北京字节跳动网络技术有限公司 搜索关键词推荐模型生成方法、关键词推荐方法与装置
CN111835585A (zh) * 2020-06-19 2020-10-27 深圳奇迹智慧网络有限公司 物联网设备的巡检方法、装置、计算机设备和存储介质
CN111859091A (zh) * 2020-07-21 2020-10-30 山东省科院易达科技咨询有限公司 一种基于人工智能的搜索结果的聚合方法及装置
CN112905871A (zh) * 2021-03-29 2021-06-04 中国平安人寿保险股份有限公司 热点关键词推荐方法、装置、终端及存储介质
WO2021227059A1 (zh) * 2020-05-15 2021-11-18 深圳市世强元件网络有限公司 一种基于多叉树的搜索词推荐方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012008610A (ja) * 2010-06-22 2012-01-12 Yahoo Japan Corp 検索装置、方法及びプログラム
CN104331434A (zh) * 2014-10-22 2015-02-04 乐视网信息技术(北京)股份有限公司 一种生成搜索提示词服务的方法及其装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012008610A (ja) * 2010-06-22 2012-01-12 Yahoo Japan Corp 検索装置、方法及びプログラム
CN104331434A (zh) * 2014-10-22 2015-02-04 乐视网信息技术(北京)股份有限公司 一种生成搜索提示词服务的方法及其装置

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108509555A (zh) * 2018-03-22 2018-09-07 武汉斗鱼网络科技有限公司 搜索词确定方法、装置、设备及存储介质
CN108549681A (zh) * 2018-04-03 2018-09-18 Oppo广东移动通信有限公司 数据处理方法和装置、电子设备、计算机可读存储介质
CN108549681B (zh) * 2018-04-03 2023-09-01 Oppo广东移动通信有限公司 数据处理方法和装置、电子设备、计算机可读存储介质
WO2020015217A1 (zh) * 2018-07-17 2020-01-23 深圳市嘀哒知经科技有限责任公司 一种知识技能的拆分重组方法及装置
CN109033326A (zh) * 2018-07-17 2018-12-18 深圳市嘀哒知经科技有限责任公司 一种知识技能的拆分重组方法及装置
CN109033326B (zh) * 2018-07-17 2020-05-05 深圳市嘀哒知经科技有限责任公司 一种知识技能的拆分重组方法及装置
CN109063200A (zh) * 2018-09-11 2018-12-21 广州神马移动信息科技有限公司 资源搜索方法及其装置、电子设备、计算机可读介质
CN109063200B (zh) * 2018-09-11 2022-10-14 优视科技(中国)有限公司 资源搜索方法及其装置、电子设备、计算机可读介质
CN110147431A (zh) * 2019-05-05 2019-08-20 中国银行股份有限公司 关键词匹配方法、装置、计算机设备和存储介质
CN110674362A (zh) * 2019-08-22 2020-01-10 视联动力信息技术股份有限公司 搜索推荐方法、装置、电子设备及可读存储介质
CN111026281A (zh) * 2019-10-31 2020-04-17 重庆小雨点小额贷款有限公司 一种客户端的词组推荐方法、客户端及存储介质
CN111026281B (zh) * 2019-10-31 2023-09-12 重庆小雨点小额贷款有限公司 一种客户端的词组推荐方法、客户端及存储介质
CN111222918A (zh) * 2020-01-04 2020-06-02 厦门二五八网络科技集团股份有限公司 关键词挖掘方法、装置、电子设备及存储介质
CN111222918B (zh) * 2020-01-04 2023-06-30 厦门二五八网络科技集团股份有限公司 关键词挖掘方法、装置、电子设备及存储介质
CN111324804A (zh) * 2020-02-21 2020-06-23 北京字节跳动网络技术有限公司 搜索关键词推荐模型生成方法、关键词推荐方法与装置
WO2021227059A1 (zh) * 2020-05-15 2021-11-18 深圳市世强元件网络有限公司 一种基于多叉树的搜索词推荐方法及系统
CN111835585B (zh) * 2020-06-19 2022-04-15 深圳奇迹智慧网络有限公司 物联网设备的巡检方法、装置、计算机设备和存储介质
CN111835585A (zh) * 2020-06-19 2020-10-27 深圳奇迹智慧网络有限公司 物联网设备的巡检方法、装置、计算机设备和存储介质
CN111859091B (zh) * 2020-07-21 2021-06-04 山东省科院易达科技咨询有限公司 一种基于人工智能的搜索结果的聚合方法及装置
CN111859091A (zh) * 2020-07-21 2020-10-30 山东省科院易达科技咨询有限公司 一种基于人工智能的搜索结果的聚合方法及装置
CN112905871A (zh) * 2021-03-29 2021-06-04 中国平安人寿保险股份有限公司 热点关键词推荐方法、装置、终端及存储介质
CN112905871B (zh) * 2021-03-29 2023-05-30 中国平安人寿保险股份有限公司 热点关键词推荐方法、装置、终端及存储介质

Also Published As

Publication number Publication date
CN107590214B (zh) 2021-05-25

Similar Documents

Publication Publication Date Title
CN107590214A (zh) 搜索关键词的推荐方法、装置及电子设备
US11023505B2 (en) Method and apparatus for pushing information
CN108804450B (zh) 信息推送的方法和装置
CN102368262B (zh) 一种提供与查询序列相对应的搜索建议的方法与设备
US20180203928A1 (en) Systems and methods for document analytics
US20100005086A1 (en) Resource locator suggestions from input character sequence
KR102517843B1 (ko) Aiml 기반의 챗봇 시스템 및 챗봇 서비스 제공 방법
CN104915413A (zh) 一种健康检测方法及系统
CN109948122B (zh) 输入文本的纠错方法、装置及电子设备
US11836174B2 (en) Method and apparatus of establishing similarity model for retrieving geographic location
US10803257B2 (en) Machine translation locking using sequence-based lock/unlock classification
CN106796608A (zh) 上下文搜索字符串同义词的自动生成
CN111382341B (zh) 一种基于大数据的科技信息资源检索查询系统及方法
CN103812906B (zh) 一种网址推荐方法、装置和通信系统
CN112925898B (zh) 基于人工智能的问答方法、装置、服务器及存储介质
KR20210145811A (ko) 지리적 위치를 검색하는 방법, 장치, 기기 및 컴퓨터 기록 매체
US10303747B2 (en) Method, apparatus and system for controlling address input
CN112417874A (zh) 命名实体的识别方法和装置、存储介质、电子装置
US20180129731A1 (en) Top-k query processing with conditional skips
CN106844553A (zh) 基于样本数据的数据探测和扩充方法及装置
CN116346777A (zh) 一种字典树域名匹配方法、装置、设备及存储介质
CN114398973B (zh) 一种媒体内容标签识别方法、装置、设备及存储介质
CN112308016B (zh) 表情图像获取方法、装置、电子设备及存储介质
CN108460116A (zh) 搜索方法、装置、计算机设备、存储介质及搜索系统
KR20110017797A (ko) 검색쿼리 및 사용이력을 이용한 웹 페이지 검색 서비스 제공 시스템, 서버 및 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant