CN104408131B - 直达号关键词的推荐方法和装置 - Google Patents
直达号关键词的推荐方法和装置 Download PDFInfo
- Publication number
- CN104408131B CN104408131B CN201410705616.9A CN201410705616A CN104408131B CN 104408131 B CN104408131 B CN 104408131B CN 201410705616 A CN201410705616 A CN 201410705616A CN 104408131 B CN104408131 B CN 104408131B
- Authority
- CN
- China
- Prior art keywords
- candidate keywords
- count value
- keyword
- search key
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提出一种直达号关键词的推荐方法和装置,其中,该直达号关键词的推荐方法,包括以下步骤:获取多个搜索日志;提取多个搜索日志中的多个候选关键词;根据已有的直达号对多个候选关键词进行筛选,并获取筛选之后的每个候选关键词对应的计数值;以及根据筛选之后的候选关键词和候选关键词对应的计数值进行推荐。本发明的直达号关键词的推荐方法,便于直达号开通者选择一个具有大量潜在用户的直达号关键词进行注册开通,并为用户提供相应的服务,既满足了直达号开通者的选择需求,也满足了直达号使用者的使用需求,提升了用户体验。
Description
技术领域
本发明涉及互联网技术领域,特别涉及一种直达号关键词的推荐方法和装置。
背景技术
直达号是一些组织、机构、商户等团体或个人在直达服务平台上唯一的官方账号,通过搜索直达号可直接得到直达号对应的结果,例如,可直接进入直达号对应的商户或机构的页面,并使用页面中的功能和服务。
随着直达号的不断发展壮大,越来越多的用户有意愿通过服务平台注册直达号以通过直达号为其他用户提供更便捷高效的服务。用户在注册直达号时,有不同的需求,例如,为了能够为更多的用户提供服务,满足更多用户的需求,用户在申请注册直达号时更希望待注册的直达号具有足够多的潜在用户。但是,目前,直达号服务平台仅是根据用户的注册请求为注册相应的直达号,而不能根据用户的需求推荐可注册的直达号关键词,使用不便,用户体验差。
发明内容
本发明旨在至少在一定程度上解决上述技术问题。
为此,本发明的第一个目的在于提出一种直达号关键词的推荐方法,便于直达号开通者选择一个具有大量潜在用户的直达号关键词进行注册开通,并为用户提供相应的服务,提升了用户体验。
本发明的第二个目的在于提出一种直达号关键词的推荐装置。
为达上述目的,根据本发明第一方面实施例提出了一种直达号关键词的推荐方法,包括以下步骤:获取多个搜索日志;提取所述多个搜索日志中的多个候选关键词;根据已有的直达号对所述多个候选关键词进行筛选,并获取筛选之后的每个所述候选关键词对应的计数值;以及根据筛选之后的所述候选关键词和所述候选关键词对应的计数值进行推荐。
本发明实施例的直达号关键词的推荐方法,通过从获取的多个搜索日志中提取多个候选关键词,并根据已有的直达号对提取的候选关键词进行筛选后,获取筛选后的每个候选关键词对应的计数值,以根据计数值进行直达号关键词的推荐,候选关键词的计数值可反映候选关键词的搜索次数,表明用户对该关键词的潜在需求的强度,因此,本发明实施例的推荐方法,不但可为直达号开通者推荐可注册开通的直达号关键词,并且推荐的直达号关键词是大多数用户所关注或感兴趣的,便于直达号开通者选择一个具有大量潜在用户的直达号关键词进行注册开通,并为用户提供相应的服务,既满足了直达号开通者的选择需求,也满足了直达号使用者的使用需求,提升了用户体验。此外,且保证了每个已注册开通的直达号都能够满足大量使用者的需求,不会产生无用的直达号,提高了直达号功能利用率。
本发明第二方面实施例提供了一种直达号关键词的推荐装置,包括:第一获取模块,用于获取多个搜索日志;提取模块,用于提取所述多个搜索日志中的多个候选关键词;筛选模块,用于根据已有的直达号对所述多个候选关键词进行筛选;第二获取模块,用于获取筛选之后的每个所述候选关键词对应的计数值;以及推荐模块,用于根据筛选之后的所述候选关键词和所述候选关键词对应的计数值进行推荐。
本发明实施例的直达号关键词的推荐装置,通过从获取的多个搜索日志中提取多个候选关键词,并根据已有的直达号对提取的候选关键词进行筛选后,获取筛选后的每个候选关键词对应的计数值,以根据计数值进行直达号关键词的推荐,候选关键词的计数值可反映候选关键词的搜索次数,表明用户对该关键词的潜在需求的强度,因此,本发明实施例的推荐方法,不但可为直达号开通者推荐可注册开通的直达号关键词,并且推荐的直达号关键词是大多数用户所关注或感兴趣的,便于直达号开通者选择一个具有大量潜在用户的直达号关键词进行注册开通,并为用户提供相应的服务,既满足了直达号开通者的选择需求,也满足了直达号使用者的使用需求,提升了用户体验。此外,且保证了每个已注册开通的直达号都能够满足大量使用者的需求,不会产生无用的直达号,提高了直达号功能利用率。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1为根据本发明一个实施例的直达号关键词的推荐方法的流程图;
图2为根据本发明一个实施例的提取多个搜索日志中的多个候选关键词的具体流程图;
图3为根据本发明一个实施例的直达号关键词的推荐装置的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
在本发明的描述中,需要理解的是,术语“多个”指两个或两个以上;术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性。
下面参考附图描述根据本发明实施例的直达号关键词的推荐方法和装置。
为了满足用户的使用需求,便于用户注册使用直达号服务,本发明提出了一种直达号关键词的推荐方法,包括以下步骤:获取多个搜索日志;提取多个搜索日志中的多个候选关键词;根据已有的直达号对多个候选关键词进行筛选,并获取筛选之后的每个候选关键词对应的计数值;以及根据筛选之后的候选关键词和候选关键词对应的计数值进行推荐。
图1为根据本发明一个实施例的直达号关键词的推荐方法的流程图。如图1所示,根据本发明实施例的直达号关键词的推荐方法,包括:
S101,获取多个搜索日志。
在本发明的示例中,可按照预设时间或预设周期(如每周、每天或每小时等)获取这段时间内的搜索日志。具体地,可在预设时间或者预设周期内,记录并收集大量用户在这段时间内的搜索日志,以获取多个搜索日志。
S102,提取多个搜索日志中的多个候选关键词。
在本发明的一个实施例中,图2为根据本发明一个实施例的提取多个搜索日志中的多个候选关键词的具体流程图。如图2所示,提取多个搜索日志中的多个候选关键词具体包括:
S201,提取每个搜索日志中的搜索关键词。
具体地,可对获取到的多个搜索日志分别进行句法分析、分词等,并提取出每个搜索日志中的搜索关键词。
S202,如果搜索关键词符合直达号定义的语法规则,则将搜索关键词作为候选关键词。
其中,直达号定义的语法规则为用于标识搜索词是用于执行直达号功能的规则。举例来说,直达号定义的语法规则可以是特殊标识与词语的组合,本发明对特殊标识与词语之间的组合方式不做限定,例如,可以是词语以特殊标识为前缀或者后缀等。
举例来说,特殊标识可以是特殊符号,例如,“@”、“#!”等。
如果搜索关键词符合直达号定义的语法规则,例如,搜索关键词为“@海底捞”,则可将该搜索关键词作为候选关键词。
S203,如果搜索关键词不符合直达号定义的语法规则,则进一步获取搜索关键词的词性。
具体地,在本发明的一个实施例中,如果搜索关键词不符合直达号定义的语法规则,则可通过现有的一些词性分析算法对搜索关键词进行词性分析,以确定搜索关键词的词性。
由于词性分析算法的计算量比较大,占用CPU、内存等系统资源较多,且耗时较长,因此,为了减少对系统资源的消耗,节约时间,在每次确定了一个搜索关键词的词性后,可将搜索关键词与其确定的词性之间的对应关系作为缓存数据存储在本地内存或磁盘上。
因此,在本发明的另一个实施例中,在进一步获取搜索关键词的词性之前,还可包括:根据搜索关键词查询缓存数据,以从缓存数据中查询搜索关键词对应的词性。如果缓存数据中没有存储该搜索关键词对应的词性,在通过词性分析算法来分析搜索关键词的词性,从而实现了对提取候选关键词的过程的优化,大大降低了这个过程对系统资源的消耗,并显著地降低了提取候选关键词的时间。
S204,如果搜索关键词的词性为名词,则将搜索关键词作为候选关键词。
S103,根据已有的直达号对多个候选关键词进行筛选,并获取筛选之后的每个候选关键词对应的计数值。
在本发明的一个实施例中,根据已有的直达号对多个候选关键词进行筛选具体包括:判断提取的候选关键词是否属于直达号资源库;如果属于直达号资源库,则将候选关键词丢弃。
其中,直达号资源库中记录了所有已开通的直达号的相关信息,包括已开通的直达号的关键词(即已注册的直达号关键词),已开通的直达号的关键词是这个直达号独占的,其他直达号不能再申请以该关键词作为直达号名称来开通另一个直达号。
可通过将提取的候选关键词与直达号资源库中的直达号的关键词进行匹配,如果直达号资源库中存在与候选关键词相匹配的直达号的关键词,则该候选关键词属于直达号资源库,否则,该候选关键词不属于直达号资源库。
如果提取的候选关键词属于直达号资源库,则表明该候选关键词已经被已开通的直达号占用,不能再作为其他直达号的关键词,因此,需要将其丢弃。由此,可筛选出可作为其他直达号的关键词的候选关键词。
在本发明的实施例中,在对候选关键词进行筛选之后,可获取筛选之后的每个候选关键词对应的计数值,具体包括:分别判断每个候选关键词是否已经具有对应的计数值;如果具有对应的计数值,则将候选关键词对应的计数值增加预设分值(例如,预设分值可为1、2等);如果不具有对应的计数值,则将候选关键词的计数值记录为预设的初始分值(例如,可为1)。
在本发明的一个实施例中,可预先建立一个候选词资源库,用于存储候选关键词及其对应的计数值。候选词资源库最初建立时为空的,随着候选关键词的不断的提取和筛选,可将筛选后的候选关键词及其计数值存储至候选词资源库。其中,候选词资源库中以候选关键词为索引,其对应的计数值为索引值。候选关键词的计数值为累计计数值,即该候选关键词在多个搜索日志中的累计出现次数,表示用户对该候选关键词的搜索次数。
因而,当执行候选关键词筛选后,对于每个候选关键词,可通过查询候选词资源库中是否已经存储了该候选关键词及其对应的计数值来判断其是否已经具有对应的计数值。如果该候选关键词具有对应的计数值,则将该计数值加一,得到该候选关键词的新的计数值,并更新候选词资源库中的记录。如果该候选关键词不具有对应的计数值,则将该候选关键词的计数值记录为1,并在候选词资源库中添加该候选词及其对应的计数值的记录,以供后续使用。
应当理解,候选词资源库可以存储在内存中,也可以存储在磁盘中,可以存储在提取候选关键词的终端本地,也可以存储在其他独立的终端中或者服务器端,本发明对此不做限定。
S104,根据筛选之后的候选关键词和候选关键词对应的计数值进行推荐。
在本发明的实施例中,由于候选词资源库中存储的候选关键词都是经过上述筛选的,也就是尚未被已经开通的直达号所占用的关键词,因此,可将这些候选关键词推荐给用户,以供用户选择并进行注册。
在本发明的一个实施例中,筛选后的候选关键词的计数值表示该候选关键词的搜索次数,也就是说可以反映该候选关键词所具有的潜在用户的数量,即计数值越大,就表明越多的用户对该候选关键词所对应的服务具有潜在需求,因此,可根据筛选后的候选关键词的计数值对候选关键词进行推荐,如可将计数值较大的预设数量的候选关键词推荐给用户。
在本发明的另一个实施例中,为了使候选关键词的推荐结果更加精准、直观地满足用户的注册使用需求,根据筛选之后的候选关键词和候选关键词对应的计数值进行推荐具体包括:根据候选关键词对应的计数值和预设的模型生成候选关键词对应的评分;以及根据候选关键词对应的评分对候选关键词进行推荐。
其中,预设模型可以是将候选关键词对应的计数值转换为评分的数值转换模型;
另外,预设模型还可以是针对候选关键词对应的计数值以及商业价值评分、服务评分等其他方面的评分综合评价模型,例如,可以是对多个方面的加权模型。其中,商业价值评分、服务评分等其他方面的评分可通过一些商业系统(如百度的凤巢系统)、服务系统或者第三方评分系统等获取。从而,可综合多方面的评价标准对候选关键词进行更精准的评价。
在本发明的实施例中,在得到候选关键词的评分后,可根据该评分对候选关键词进行推荐,如可将评分较高的预设数量的候选关键词推荐给用户
在本发明的一个优选的实施例中,在将候选关键词提供给用户时,可按照计数值从大到小或评分从高到低的顺序将候选关键词进行排列显示。
本发明实施例的直达号关键词的推荐方法,通过从获取的多个搜索日志中提取多个候选关键词,并根据已有的直达号对提取的候选关键词进行筛选后,获取筛选后的每个候选关键词对应的计数值,以根据计数值进行直达号关键词的推荐,候选关键词的计数值可反映候选关键词的搜索次数,表明用户对该关键词的潜在需求的强度,因此,本发明实施例的推荐方法,不但可为直达号开通者推荐可注册开通的直达号关键词,并且推荐的直达号关键词是大多数用户所关注或感兴趣的,便于直达号开通者选择一个具有大量潜在用户的直达号关键词进行注册开通,并为用户提供相应的服务,既满足了直达号开通者的选择需求,也满足了直达号使用者的使用需求,提升了用户体验。此外,且保证了每个已注册开通的直达号都能够满足大量使用者的需求,不会产生无用的直达号,提高了直达号功能利用率。
尤其是对于一些创业者来说,本发明的实施例,通过推荐直达号关键词,能够为用户提供一些创业、服务、消费等方面的建议,便于其选择潜在客户足够多,潜在价值足够高,更具有发展前景的方向,并申请开通该方向上的直达号,为其他用户提供服务。
为了实现上述实施例,本发明还提出一种直达号关键词的推荐装置。
一种直达号关键词的推荐装置,包括:第一获取模块,用于获取多个搜索日志;提取模块,用于提取多个搜索日志中的多个候选关键词;筛选模块,用于根据已有的直达号对多个候选关键词进行筛选;第二获取模块,用于获取筛选之后的每个候选关键词对应的计数值;以及推荐模块,用于根据筛选之后的候选关键词和候选关键词对应的计数值进行推荐。
图3为根据本发明一个实施例的直达号关键词的推荐装置的结构示意图。
如图3所示,根据本发明实施例的直达号关键词的推荐装置,包括:第一获取模块10、提取模块20、筛选模块30、第二获取模块40和推荐模块50。
具体地,第一获取模块10用于获取多个搜索日志。
在本发明的示例中,第一获取模块10可按照预设时间或预设周期(如每周、每天或每小时等)获取这段时间内的搜索日志。更具体地,第一获取模块10可在预设时间或者预设周期内,记录并收集大量用户在这段时间内的搜索日志,以获取多个搜索日志。
提取模块20用于提取多个搜索日志中的多个候选关键词。
在本发明的一个实施例中,提取模块20具体用于执行:
S201,提取每个搜索日志中的搜索关键词。更具体地,提取模块20可对获取到的多个搜索日志分别进行句法分析、分词等,并提取出每个搜索日志中的搜索关键词。
S202,如果搜索关键词符合直达号定义的语法规则,则将搜索关键词作为候选关键词。其中,直达号定义的语法规则为用于标识搜索词是用于执行直达号功能的规则。举例来说,直达号定义的语法规则可以是特殊标识与词语的组合,本发明对特殊标识与词语之间的组合方式不做限定,例如,可以是词语以特殊标识为前缀或者后缀等。
举例来说,特殊标识可以是特殊符号,例如,“@”、“#!”等。
S203,如果搜索关键词不符合直达号定义的语法规则,则进一步获取搜索关键词的词性。更具体地,在本发明的一个实施例中,如果搜索关键词不符合直达号定义的语法规则,则提取模块20可通过现有的一些词性分析算法对搜索关键词进行词性分析,以确定搜索关键词的词性。
S204,如果搜索关键词的词性为名词,则将搜索关键词作为候选关键词。
由于词性分析算法的计算量比较大,占用CPU、内存等系统资源较多,且耗时较长,因此,为了减少对系统资源的消耗,节约时间,在每次确定了一个搜索关键词的词性后,可将搜索关键词与其确定的词性之间的对应关系作为缓存数据存储在本地内存或磁盘上。
因此,在本发明的另一个实施例中,提取模块20还用于:在进一步获取搜索关键词的词性之前,根据搜索关键词查询缓存数据,以从缓存数据中查询搜索关键词对应的词性。如果缓存数据中没有存储该搜索关键词对应的词性,在通过词性分析算法来分析搜索关键词的词性,从而实现了对提取候选关键词的过程的优化,大大降低了这个过程对系统资源的消耗,并显著地降低了提取候选关键词的时间。
筛选模块30用于根据已有的直达号对多个候选关键词进行筛选.
在本发明的一个实施例中,筛选模块30具体用于:判断提取的候选关键词是否属于直达号资源库;如果属于直达号资源库,则将候选关键词丢弃。
其中,直达号资源库中记录了所有已开通的直达号的相关信息,包括已开通的直达号的关键词(即已注册的直达号关键词),已开通的直达号的关键词是这个直达号独占的,其他直达号不能再申请以该关键词作为直达号名称来开通另一个直达号。
可通过将提取的候选关键词与直达号资源库中的直达号的关键词进行匹配,如果直达号资源库中存在与候选关键词相匹配的直达号的关键词,则该候选关键词属于直达号资源库,否则,该候选关键词不属于直达号资源库。
如果提取的候选关键词属于直达号资源库,则表明该候选关键词已经被已开通的直达号占用,不能再作为其他直达号的关键词,因此,需要将其丢弃。由此,可筛选出可作为其他直达号的关键词的候选关键词。
第二获取模块40用于获取筛选之后的每个候选关键词对应的计数值。
在本发明的实施例中,在筛选模块30对候选关键词进行筛选之后,第二获取模块40可获取筛选之后的每个候选关键词对应的计数值,具体用于:分别判断每个候选关键词是否已经具有对应的计数值;如果具有对应的计数值,则将候选关键词对应的计数值加一;如果不具有对应的计数值,则将候选关键词的计数值记录为1。
在本发明的一个实施例中,可预先建立一个候选词资源库,用于存储候选关键词及其对应的计数值。候选词资源库最初建立时为空的,随着候选关键词的不断的提取和筛选,可将筛选后的候选关键词及其计数值存储至候选词资源库。其中,候选词资源库中以候选关键词为索引,其对应的计数值为索引值。候选关键词的计数值为累计计数值,即该候选关键词在多个搜索日志中的累计出现次数,表示用户对该候选关键词的搜索次数。
因而,当执行候选关键词筛选后,对于每个候选关键词,第二获取模块40可通过查询候选词资源库中是否已经存储了该候选关键词及其对应的计数值来判断其是否已经具有对应的计数值。如果该候选关键词具有对应的计数值,则将候选关键词对应的计数值增加预设分值(例如,预设分值可为1、2等);如果不具有对应的计数值,则将候选关键词的计数值记录为预设的初始分值(例如,可为1),并在候选词资源库中添加该候选词及其对应的计数值的记录,以供后续使用。
应当理解,候选词资源库可以存储在内存中,也可以存储在磁盘中,可以存储在提取候选关键词的终端本地,也可以存储在其他独立的终端中或者服务器端,本发明对此不做限定。
推荐模块50用于根据筛选之后的候选关键词和候选关键词对应的计数值进行推荐。
在本发明的实施例中,由于候选词资源库中存储的候选关键词都是经过上述筛选的,也就是尚未被已经开通的直达号所占用的关键词,因此,可将这些候选关键词推荐给用户,以供用户选择并进行注册。
在本发明的一个实施例中,筛选后的候选关键词的计数值表示该候选关键词的搜索次数,也就是说可以反映该候选关键词所具有的潜在用户的数量,即计数值越大,就表明越多的用户对该候选关键词所对应的服务具有潜在需求,因此,推荐模块50可根据筛选后的候选关键词的计数值对候选关键词进行推荐,如可将计数值较大的预设数量的候选关键词推荐给用户。
在本发明的另一个实施例中,为了使候选关键词的推荐结果更加精准、直观地满足用户的注册使用需求,推荐模块50还可具体用于:根据候选关键词对应的计数值和预设的模型生成候选关键词对应的评分;以及根据候选关键词对应的评分对候选关键词进行推荐。
其中,预设模型可以是将候选关键词对应的计数值转换为评分的数值转换模型;
另外,预设模型还可以是针对候选关键词对应的计数值以及商业价值评分、服务评分等其他方面的评分综合评价模型,例如,可以是对多个方面的加权模型。其中,商业价值评分、服务评分等其他方面的评分可通过一些商业系统(如百度的凤巢系统)、服务系统或者第三方评分系统等获取。从而,可综合多方面的评价标准对候选关键词进行更精准的评价。
在本发明的实施例中,在得到候选关键词的评分后,推荐模块50可根据该评分对候选关键词进行推荐,如可将评分较高的预设数量的候选关键词推荐给用户
在本发明的一个优选的实施例中,推荐模块50在将候选关键词提供给用户时,可按照计数值从大到小或评分从高到低的顺序将候选关键词进行排列显示。
本发明实施例的直达号关键词的推荐装置,通过从获取的多个搜索日志中提取多个候选关键词,并根据已有的直达号对提取的候选关键词进行筛选后,获取筛选后的每个候选关键词对应的计数值,以根据计数值进行直达号关键词的推荐,候选关键词的计数值可反映候选关键词的搜索次数,表明用户对该关键词的潜在需求的强度,因此,本发明实施例的推荐方法,不但可为直达号开通者推荐可注册开通的直达号关键词,并且推荐的直达号关键词是大多数用户所关注或感兴趣的,便于直达号开通者选择一个具有大量潜在用户的直达号关键词进行注册开通,并为用户提供相应的服务,既满足了直达号开通者的选择需求,也满足了直达号使用者的使用需求,提升了用户体验。此外,且保证了每个已注册开通的直达号都能够满足大量使用者的需求,不会产生无用的直达号,提高了直达号功能利用率。
尤其是对于一些创业者来说,本发明的实施例,通过推荐直达号关键词,能够为用户提供一些创业、服务、消费等方面的建议,便于其选择潜在客户足够多,潜在价值足够高,更具有发展前景的方向,并申请开通该方向上的直达号,为其他用户提供服务。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同限定。
Claims (12)
1.一种直达号关键词的推荐方法,其特征在于,包括以下步骤:
获取多个搜索日志;
提取所述多个搜索日志中的多个候选关键词;
根据已有的直达号对所述多个候选关键词进行筛选,并获取筛选之后的每个所述候选关键词对应的计数值;以及
根据筛选之后的所述候选关键词和所述候选关键词对应的计数值进行推荐;
其中,所述提取所述多个搜索日志中的多个候选关键词,包括:
提取每个所述搜索日志中的搜索关键词;
判断所述搜索关键词是否符合直达号定义的语法规则,并根据判断结果确定所述候选关键词。
2.如权利要求1所述的直达号关键词的推荐方法,其特征在于,所述根据已有的直达号对所述多个候选关键词进行筛选具体包括:
判断提取的所述候选关键词是否属于直达号资源库;
如果属于所述直达号资源库,则将所述候选关键词丢弃。
3.如权利要求2所述的直达号关键词的推荐方法,其特征在于,所述获取筛选之后的每个所述候选关键词对应的计数值,具体包括:
分别判断每个所述候选关键词是否已经具有对应的计数值;
如果具有对应的计数值,则将所述候选关键词对应的计数值增加预设分值;
如果不具有对应的计数值,则将所述候选关键词的计数值记录为预设的初始分值。
4.如权利要求1所述的直达号关键词的推荐方法,其特征在于,所述判断所述搜索关键词是否符合直达号定义的语法规则,并根据判断结果确定所述候选关键词具体包括:
如果所述搜索关键词符合直达号定义的语法规则,则将所述搜索关键词作为所述候选关键词;
如果所述搜索关键词不符合直达号定义的语法规则,则进一步获取所述搜索关键词的词性;以及
如果所述搜索关键词的词性为名词,则将所述搜索关键词作为所述候选关键词。
5.如权利要求4所述的直达号关键词的推荐方法,其特征在于,在所述进一步获取所述搜索关键词的词性之前,还包括:
根据所述搜索关键词查询缓存数据,以从所述缓存数据中查询所述搜索关键词对应的词性。
6.如权利要求1所述的直达号关键词的推荐方法,其特征在于,所述根据筛选之后的所述候选关键词和所述候选关键词对应的计数值进行推荐具体包括:
根据所述候选关键词对应的计数值和预设的模型生成所述候选关键词对应的评分;以及
根据所述候选关键词对应的评分对所述候选关键词进行推荐。
7.一种直达号关键词的推荐装置,其特征在于,包括:
第一获取模块,用于获取多个搜索日志;
提取模块,用于提取所述多个搜索日志中的多个候选关键词;
筛选模块,用于根据已有的直达号对所述多个候选关键词进行筛选;
第二获取模块,用于获取筛选之后的每个所述候选关键词对应的计数值;以及
推荐模块,用于根据筛选之后的所述候选关键词和所述候选关键词对应的计数值进行推荐
其中,所述提取模块,具体用于:
提取每个所述搜索日志中的搜索关键词;
判断所述搜索关键词是否符合直达号定义的语法规则,并根据判断结果确定所述候选关键词。
8.如权利要求7所述的直达号关键词的推荐装置,其特征在于,所述筛选模块具体用于:
判断提取的所述候选关键词是否属于直达号资源库;
如果所述候选关键词属于所述直达号资源库,则将所述候选关键词丢弃。
9.如权利要求8所述的直达号关键词的推荐装置,其特征在于,所述第二获取模块具体用于:
分别判断每个所述候选关键词是否已经具有对应的计数值;
如果具有对应的计数值,则将所述候选关键词对应的计数值增加预设分值;
如果不具有对应的计数值,则将所述候选关键词的计数值记录为预设的初始分值。
10.如权利要求7所述的直达号关键词的推荐装置,其特征在于,所述提取模块具体用于:
如果所述搜索关键词符合直达号定义的语法规则,则将所述搜索关键词作为所述候选关键词;
如果所述搜索关键词不符合直达号定义的语法规则,则进一步获取所述搜索关键词的词性;以及
如果所述搜索关键词的词性为名词,则将所述搜索关键词作为所述候选关键词。
11.如权利要求10所述的直达号关键词的推荐装置,其特征在于,所述提取模块还用于:
在进一步获取所述搜索关键词的词性之前,根据所述搜索关键词查询缓存数据,以从所述缓存数据中查询所述搜索关键词对应的词性。
12.如权利要求7所述的直达号关键词的推荐装置,其特征在于,所述推荐模块具体用于:
根据所述候选关键词对应的计数值和预设的模型生成所述候选关键词对应的评分;以及
根据所述候选关键词对应的评分对所述候选关键词进行推荐。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410705616.9A CN104408131B (zh) | 2014-11-27 | 2014-11-27 | 直达号关键词的推荐方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410705616.9A CN104408131B (zh) | 2014-11-27 | 2014-11-27 | 直达号关键词的推荐方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104408131A CN104408131A (zh) | 2015-03-11 |
CN104408131B true CN104408131B (zh) | 2018-03-06 |
Family
ID=52645762
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410705616.9A Active CN104408131B (zh) | 2014-11-27 | 2014-11-27 | 直达号关键词的推荐方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104408131B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109829115B (zh) * | 2019-02-14 | 2020-02-04 | 上海晓材科技有限公司 | 搜索引擎关键词优化方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103064853A (zh) * | 2011-10-20 | 2013-04-24 | 北京百度网讯科技有限公司 | 一种搜索建议生成方法、装置及系统 |
CN104143001A (zh) * | 2014-08-01 | 2014-11-12 | 百度在线网络技术(北京)有限公司 | 搜索词推荐方法及装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8200687B2 (en) * | 2005-06-20 | 2012-06-12 | Ebay Inc. | System to generate related search queries |
-
2014
- 2014-11-27 CN CN201410705616.9A patent/CN104408131B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103064853A (zh) * | 2011-10-20 | 2013-04-24 | 北京百度网讯科技有限公司 | 一种搜索建议生成方法、装置及系统 |
CN104143001A (zh) * | 2014-08-01 | 2014-11-12 | 百度在线网络技术(北京)有限公司 | 搜索词推荐方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN104408131A (zh) | 2015-03-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110020422B (zh) | 特征词的确定方法、装置和服务器 | |
CN108446813A (zh) | 一种电商服务质量综合评价的方法 | |
CN102866989B (zh) | 基于词语依存关系的观点抽取方法 | |
CN103544188B (zh) | 移动互联网内容的用户偏好推送方法与装置 | |
CN103902674B (zh) | 特定主题的评论数据的采集方法和装置 | |
JP4637969B1 (ja) | ウェブページの主意,およびユーザの嗜好を適切に把握して,最善の情報をリアルタイムに推奨する方法 | |
CN107609960A (zh) | 推荐理由生成方法及装置 | |
CN106649760A (zh) | 基于深度问答的提问型搜索词搜索方法及装置 | |
CN107077486A (zh) | 情感评价系统和方法 | |
CN109710841A (zh) | 评论推荐方法和装置 | |
CN103309862B (zh) | 一种网页类型识别方法和系统 | |
CN108984675A (zh) | 基于评价的数据查询方法和装置 | |
CN106294425A (zh) | 商品相关网络文章之自动图文摘要方法及系统 | |
CN110134845A (zh) | 项目舆情监控方法、装置、计算机设备及存储介质 | |
KR102361597B1 (ko) | 빅데이터를 활용하여 뉴스 기사의 감성 정보를 레이블링하는 프로그램이 기록된 기록매체 | |
CN110334356A (zh) | 文章质量的确定方法、文章筛选方法、以及相应的装置 | |
CN101833560A (zh) | 基于互联网的厂商口碑自动排序系统 | |
CN109325146A (zh) | 一种视频推荐方法、装置、存储介质和服务器 | |
CN102402717A (zh) | 数据分析设备和方法 | |
Rathan et al. | Every post matters: a survey on applications of sentiment analysis in social media | |
KR102361596B1 (ko) | 빅데이터를 활용하여 뉴스 기사의 감성 정보를 레이블링하는 방법 | |
KR101074820B1 (ko) | 인터넷을 활용한 추천 검색 시스템 및 그 방법 | |
CN105117482A (zh) | 一种实现网站导航的方法和装置 | |
KR101542417B1 (ko) | 사용자 선호도 학습 방법 및 장치 | |
CN104408131B (zh) | 直达号关键词的推荐方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |