CN104462289A - 直达号关键词的推荐方法和装置 - Google Patents

直达号关键词的推荐方法和装置 Download PDF

Info

Publication number
CN104462289A
CN104462289A CN201410705960.8A CN201410705960A CN104462289A CN 104462289 A CN104462289 A CN 104462289A CN 201410705960 A CN201410705960 A CN 201410705960A CN 104462289 A CN104462289 A CN 104462289A
Authority
CN
China
Prior art keywords
candidate keywords
keyword
keywords
resources bank
examination
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410705960.8A
Other languages
English (en)
Other versions
CN104462289B (zh
Inventor
朱建庭
侯震宇
王继平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201410705960.8A priority Critical patent/CN104462289B/zh
Publication of CN104462289A publication Critical patent/CN104462289A/zh
Application granted granted Critical
Publication of CN104462289B publication Critical patent/CN104462289B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9566URL specific, e.g. using aliases, detecting broken or misspelled links

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提出一种直达号关键词的推荐方法和装置,其中,该直达号关键词的推荐方法,包括以下步骤:建立候选关键词资源库;提供直达号注册界面,并接收用户在直达号注册界面中输入的待查验直达号关键词;判断待查验直达号关键词是否已被直达号占用;如果判断待查验直达号关键词未被直达号占用,则向用户反馈查验通过结果;以及如果判断待查验直达号关键词被直达号占用,则根据待查验直达号关键词和候选关键词资源库生成候选关键词列表,并将候选关键词列表提供至用户。本发明的直达号关键词的推荐方法,能够显著降低了用户在申请注册直达号时的时间成本,减少用户的时间和精力的消耗,提升了用户体验。

Description

直达号关键词的推荐方法和装置
技术领域
本发明涉及互联网技术领域,特别涉及一种直达号关键词的推荐方法和装置。
背景技术
直达号是一些组织、机构、商户等团体或个人在直达服务平台上唯一的官方账号,通过搜索直达号可直接得到直达号对应的结果,例如,可直接进入直达号对应的商户或机构的页面,并使用页面中的功能和服务。
随着直达号的不断发展壮大,越来越多的用户会通过服务平台申请注册直达号。由于每个直达号唯一对应一个团体或个人,因此随着注册的直达号越来越多,可用的直达号关键词资源会越来越少。后续用户在申请注册直达号时,就会出现其希望申请的直达号关键词已经被其他用户注册的情况,此时,用户需要更换直达号关键词,指导找到一个与希望申请的直达号相近且未被其他用户注册的直达号关键词进行注册,才能完成直达号的申请。
随着已注册的直达号越来越多,后续用户在申请注册直达号时,遇到已经被注册的直达号的可能也会越来越大,并日益严重,这会造成用户在申请注册直达号时,需要多次查找更换直达号关键词,耗费用户大量的时间和精力,用户体验差。
发明内容
本发明旨在至少在一定程度上解决上述技术问题。
为此,本发明的第一个目的在于提出一种直达号关键词的推荐方法,显著降低了用户在申请注册直达号时的时间成本,减少用户的时间和精力的消耗,提升了用户体验。
本发明的第二个目的在于提出一种直达号关键词的推荐装置。
为达上述目的,根据本发明第一方面实施例提出了一种直达号关键词的推荐方法,包括以下步骤:建立候选关键词资源库;提供直达号注册界面,并接收用户在所述直达号注册界面中输入的待查验直达号关键词;判断所述待查验直达号关键词是否已被直达号占用;如果判断所述待查验直达号关键词未被直达号占用,则向所述用户反馈查验通过结果;以及如果判断所述待查验直达号关键词被直达号占用,则根据所述待查验直达号关键词和所述候选关键词资源库生成候选关键词列表,并将所述候选关键词列表提供至所述用户。
本发明实施例的直达号关键词的推荐方法,通过建立候选关键词资源库,并在用户输入的待查验直达号关键词已经被直达号占用时,根据待查验直达号关键词和建立的候选关键词资源库为用户提供候选关键词列表,从而在待查验直达号关键词已经被直达号占用时,用户无需多次查找更换可用的、未被占用的直达号关键词,能够显著降低了用户在申请注册直达号时的时间成本,减少用户的时间和精力的消耗,提升了用户体验。
本发明第二方面实施例提供了一种直达号关键词的推荐装置,包括:建立模块,用于建立候选关键词资源库;第一接收模块,用于提供直达号注册界面,并接收用户在所述直达号注册界面中输入的待查验直达号关键词;判断模块,用于判断所述待查验直达号关键词是否已被直达号占用;反馈模块,用于在所述判断模块判断所述待查验直达号关键词未被直达号占用时,向所述用户反馈查验通过结果;以及提供模块,用于在所述判断模块判断所述待查验直达号关键词被直达号占用时,根据所述待查验直达号关键词和所述候选关键词资源库生成候选关键词列表,并将所述候选关键词列表提供至所述用户。
本发明实施例的直达号关键词的推荐装置,通过建立候选关键词资源库,并在用户输入的待查验直达号关键词已经被直达号占用时,根据待查验直达号关键词和建立的候选关键词资源库为用户提供候选关键词列表,从而在待查验直达号关键词已经被直达号占用时,用户无需多次查找更换可用的、未被占用的直达号关键词,能够显著降低了用户在申请注册直达号时的时间成本,减少用户的时间和精力的消耗,提升了用户体验。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1为根据本发明一个实施例的直达号关键词的推荐方法的流程图;
图2为根据本发明一个实施例的建立候选关键词资源库的流程图;
图3为根据本发明一个实施例的提取多个搜索日志中的多个候选关键词的具体流程图;
图4为根据本发明一个实施例的直达号关键词的推荐装置的结构示意图;
图5为根据本发明一个具体实施例的直达号关键词的推荐装置的结构示意图;
图6为根据本发明另一个实施例的直达号关键词的推荐装置的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
在本发明的描述中,需要理解的是,术语“多个”指两个或两个以上;术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性。
下面参考附图描述根据本发明实施例的直达号关键词的推荐方法和装置。
为了降低用户在申请注册直达号时的时间成本,本发明提出了一种直达号关键词的推荐方法,包括以下步骤:建立候选关键词资源库;提供直达号注册界面,并接收用户在直达号注册界面中输入的待查验直达号关键词;判断待查验直达号关键词是否已被直达号占用;如果判断待查验直达号关键词未被直达号占用,则向用户反馈查验通过结果;以及如果判断待查验直达号关键词被直达号占用,则根据待查验直达号关键词和候选关键词资源库生成候选关键词列表,并将候选关键词列表提供至用户。
图1为根据本发明一个实施例的直达号关键词的推荐方法的流程图。如图1所示,根据本发明实施例的直达号关键词的推荐方法,包括:
S101,建立候选关键词资源库。
具体地,图2为根据本发明一个实施例的建立候选关键词资源库的流程图。如图2所示,建立候选关键词资源库具体包括:
S201,获取多个搜索日志。
在本发明的示例中,可按照预设时间或预设周期(如每周、每天或每小时等)获取这段时间内的搜索日志。具体地,可在预设时间或者预设周期内,记录并收集大量用户在这段时间内的搜索日志,以获取多个搜索日志。
S202,提取多个搜索日志中的多个候选关键词。
在本发明的一个实施例中,图3为根据本发明一个实施例的提取多个搜索日志中的多个候选关键词的具体流程图。如图3所示,提取多个搜索日志中的多个候选关键词具体包括:提取多个搜索日志中的多个候选关键词具体包括:
S301,提取每个搜索日志中的搜索关键词。
具体地,可对获取到的多个搜索日志分别进行句法分析、分词等,并提取出每个搜索日志中的搜索关键词。
S302,如果搜索关键词符合直达号定义的语法规则,则将搜索关键词作为候选关键词。
其中,直达号定义的语法规则为用于标识搜索词是用于执行直达号功能的规则。举例来说,直达号定义的语法规则可以是特殊标识与词语的组合,本发明对特殊标识与词语之间的组合方式不做限定,例如,可以是词语以特殊标识为前缀或者后缀等。
举例来说,特殊标识可以是特殊符号,例如,“”、“#!”等。
如果搜索关键词符合直达号定义的语法规则,例如,搜索关键词为“海底捞”,则可将该搜索关键词作为候选关键词。
S303,如果搜索关键词不符合直达号定义的语法规则,则进一步获取搜索关键词的词性。
具体地,在本发明的一个实施例中,如果搜索关键词不符合直达号定义的语法规则,则可通过现有的一些词性分析算法对搜索关键词进行词性分析,以确定搜索关键词的词性。
由于词性分析算法的计算量比较大,占用CPU、内存等系统资源较多,且耗时较长,因此,为了减少对系统资源的消耗,节约时间,在每次确定了一个搜索关键词的词性后,可将搜索关键词与其确定的词性之间的对应关系作为缓存数据存储在本地内存或磁盘上。
因此,在本发明的另一个实施例中,在进一步获取搜索关键词的词性之前,还可包括:根据搜索关键词查询缓存数据,以从缓存数据中查询搜索关键词对应的词性。如果缓存数据中没有存储该搜索关键词对应的词性,在通过词性分析算法来分析搜索关键词的词性,从而实现了对提取候选关键词的过程的优化,大大降低了这个过程对系统资源的消耗,并显著地降低了提取候选关键词的时间。
S304,如果搜索关键词的词性为名词,则将搜索关键词作为候选关键词。
S203,根据已有的直达号对多个候选关键词进行筛选,并获取筛选之后的每个候选关键词对应的计数值。
在本发明的一个实施例中,根据已有的直达号对多个候选关键词进行筛选具体包括:判断提取的候选关键词是否属于直达号资源库;如果属于直达号资源库,则将候选关键词丢弃。
其中,直达号资源库中记录了所有已开通的直达号的相关信息,包括已开通的直达号的关键词(即已注册的直达号关键词),已开通的直达号的关键词是这个直达号独占的,其他直达号不能再申请以该关键词作为直达号名称来开通另一个直达号。
可通过将提取的候选关键词与直达号资源库中的直达号的关键词进行匹配,如果直达号资源库中存在与候选关键词相匹配的直达号的关键词,则该候选关键词属于直达号资源库,否则,该候选关键词不属于直达号资源库。
如果提取的候选关键词属于直达号资源库,则表明该候选关键词已经被已开通的直达号占用,不能再作为其他直达号的关键词,因此,需要将其丢弃。由此,可筛选出可作为其他直达号的关键词的候选关键词。
在对候选关键词进行筛选后,可获取每个候选关键词的计数值。其中,候选关键词的计数值是在对每个搜索日志进行候选关键词提取和筛选的过程中动态更新的。具体地,当从一个搜索日志中提取的搜索关键词被确定为候选关键词,且该候选关键词不属于直达号资源库时,如果该候选关键词尚未有对应的计数值,则表明这个搜索词第一次被作为搜索关键词,将该候选关键词的计数值记录为预设的初始分值(例如,可为1);如果该候选关键词已经有对应的计数值,则将该候选关键词的计数值增加预设分值(例如,预设分值可为1、2等)。由此,在对候选关键词筛选之后可直接获取每个筛选后的候选关键词的计数值。
S204,根据筛选之后的候选关键词和候选关键词对应的计数值建立候选关键词资源库。
其中,候选关键词资源库是用于存储候选关键词及其对应的计数值或者其他相关信息的数据库。
具体地,在本发明的一个实施例中,首先可建立一个空的候选资源库,然后在对每个搜索日志进行分析以提取出其中的候选关键词并进行筛选的过程中,可在筛选出候选关键词时,查询候选关键词资源库,如果候选关键词资源库中已经存在该候选关键词对应的记录,则更新候选关键词资源库中该候选关键词对应的计数值;如果候选关键词资源库中尚未有该候选关键词对应的记录,则将该候选关键词的计数值记录为预设的初始分值,并作为一条新的记录插入到候选关键词资源库中。由此,通过对多个搜索日志进行分析,就可实现候选关键词资源库的建立。
应当理解,候选关键词资源库可以存储在内存中,也可以存储在磁盘中,可以存储在提取候选关键词的终端本地,也可以存储在其他独立的终端中或者服务器端,本发明对此不做限定。
在本发明的一个实施例中,在获取筛选之后的每个候选关键词对应的计数值之后,该推荐方法还可包括根据候选关键词对应的计数值和预设的模型生成候选关键词对应的评分的步骤。进一步地,可将每个候选关键词的评分也分别存储在候选关键词资源库中。
其中,预设模型可以是将候选关键词对应的计数值转换为评分的数值转换模型;
另外,预设模型还可以是针对候选关键词对应的计数值以及商业价值评分、服务评分等其他方面的评分综合评价模型,例如,可以是对多个方面的加权模型。其中,商业价值评分、服务评分等其他方面的评分可通过一些商业系统(如百度的凤巢系统)、服务系统或者第三方评分系统等获取。从而,可综合多方面的评价标准对候选关键词进行更精准的评价。
S102,提供直达号注册界面,并接收用户在直达号注册界面中输入的待查验直达号关键词。
在本发明的一个实施例中,直达号服务平台可在网页或者客户端界面中提供直达号注册入口,当用户触发直达号注册入口时,可为用户提供直达号注册界面。注册界面中具有多个输入框,以供注册用户输入用户的注册信息以及待查验直达号关键词等。
在本发明的一个实施例中,在注册用户输入待查验直达号关键词的过程中,直达号注册界面中的JS(JavaScript)代码以异步传输的方式实时将注册用户输入的内容发送给直达号服务平台。
S103,判断待查验直达号关键词是否已被直达号占用。
在本发明的实施例中,可根据待查验直达号关键词查询直达号资源库,如果待查验直达号关键词输入直达号资源库,则判断待查验直达号关键词已被直达号占用,否则判断待查验直达号关键词未被直达号占用。
S104,如果判断待查验直达号关键词未被直达号占用,则向用户反馈查验通过结果。
具体地,如果判断待查验直达号关键词未被直达号占用,可向用户反馈查验通过结果,并提示用户可用该待查验直达号关键词作为直达号名称进行申请注册。
S105,如果判断待查验直达号关键词被直达号占用,则根据待查验直达号关键词和候选关键词资源库生成候选关键词列表,并将候选关键词列表提供至用户。
在本发明的一个实施例中,根据待查验直达号关键词和候选关键词资源库生成候选关键词列表可具体包括:
首先,根据待查验直达号关键词查询候选关键词资源库以生成第一候选关键词列表。具体地,可遍历候选关键词资源库中的所有候选关键词,并按照预设的匹配策略从候选关键词资源库中选出与待查验直达号关键词相匹配的候选关键词,生成第一候选关键词列表。举例来说,匹配策略可以是:以待查验直达号关键词为前缀,或以待查验直达号关键词为后缀,或包含待查验直达号关键词,或以与待查验直达号关键词存在超过预设长度的公共子串等。
然后,根据第一候选关键词列表中每个候选关键词对应的评分生成第二候选关键词列表,并将第二候选关键词列表作为候选关键词列表。由于候选关键词对应的评分是候选关键词的商业价值、服务价值、用户关注度、以及用户需求度等多方面的综合反映,因此,可根据候选关键词对应的评分从第一候选关键词列表中进一步筛选出评分较大的预设数量的候选关键词,生成第二候选关键词列表。
在生产第二候选关键词列表后,可将第二候选关键词列表提供给用户。
在本发明的一个可选的实施例中,在向用户提供第二候选关键词列表时,还可以根据每个候选关键词所对应的评分给每个候选关键词确定一种展现样式,以向用户传递每个候选关键词的不同商业价值、关注度、服务价值等。例如,评分越高的候选关键词,其展现的字体就越大,和/或其字体加粗程度也越大,或者根据评分由高到低,将展现的颜色分别设定为红、橙、黄、蓝等。不但能够更直观的明了地为用户提供候选关键词,并且增强了展示的多样性和趣味性。
在本发明的一个可选实施例中,在向用户提供第二候选关键词列表时,还可将第二候选关键词列表中每个候选关键词对应的评分也提供给用户,以使用户对推荐的候选关键词有一个更加直观的认知,便于用户根据需要进行选择。
本发明实施例的直达号关键词的推荐方法,通过建立候选关键词资源库,并在用户输入的待查验直达号关键词已经被直达号占用时,根据待查验直达号关键词和建立的候选关键词资源库为用户提供候选关键词列表,从而在待查验直达号关键词已经被直达号占用时,用户无需多次查找更换可用的、未被占用的直达号关键词,能够显著降低了用户在申请注册直达号时的时间成本,减少用户的时间和精力的消耗,提升了用户体验。
在本发明的一个实施例中,该直达号关键词的推荐方法,还可包括:接收用户在候选关键词列表中选择的候选关键词;以及根据用户选择的候选关键词更新候选关键词资源库。具体地,当用户从候选关键词列表中选择候选关键词进行注册后,可在候选关键词资源库中将用户选择的候选关键词对应的记录删除。从而保证该候选关键词不会再次推荐给其他用户。
同理,保证用户已申请注册或准备申请注册的关键词不会推荐给其他用户在本发明的实施例中,在待查验直达号关键词查验通过后,如果用户根据该待查验直达号关键词进行了申请注册,则根据待查验直达号关键词查询候选关键词资源库,如果候选关键词资源库中有该待查验直达号关键词对应的记录,则删除该记录。从而,保证候选关键词资源库中的候选关键词是未被直达号占用的关键词,并且避免出现一个直达号被多个用户注册的情况。
为了实现上述实施例,本发明还提出一种直达号关键词的推荐装置。
一种直达号关键词的推荐装置,包括:建立模块,用于建立候选关键词资源库;第一接收模块,用于提供直达号注册界面,并接收用户在直达号注册界面中输入的待查验直达号关键词;判断模块,用于判断待查验直达号关键词是否已被直达号占用;反馈模块,用于在判断模块判断待查验直达号关键词未被直达号占用时,向用户反馈查验通过结果;以及提供模块,用于在判断模块判断待查验直达号关键词被直达号占用时,根据待查验直达号关键词和候选关键词资源库生成候选关键词列表,并将候选关键词列表提供至用户。
图4为根据本发明一个实施例的直达号关键词的推荐装置的结构示意图。
如图4所示,根据本发明实施例的直达号关键词的推荐装置,包括:建立模块10、第一接收模块20、判断模块30、反馈模块40和提供模块50。
具体地,建立模块10用于建立候选关键词资源库。
更具体地,如图5所示,建立模块10具体包括:获取单元11、提取单元12、获取单元13和建立单元14,其中:
获取单元11用于获取多个搜索日志。在本发明的示例中,可按照预设时间或预设周期(如每周、每天或每小时等)获取这段时间内的搜索日志。具体地,可在预设时间或者预设周期内,记录并收集大量用户在这段时间内的搜索日志,以获取多个搜索日志。
提取单元12用于提取多个搜索日志中的多个候选关键词。
在本发明的一个实施例中,提取单元12具体用于:提取每个搜索日志中的搜索关键词;如果搜索关键词符合直达号定义的语法规则,则将搜索关键词作为候选关键词;如果搜索关键词不符合直达号定义的语法规则,则进一步获取搜索关键词的词性;以及如果搜索关键词的词性为名词,则将搜索关键词作为候选关键词。
更具体地,提取单元12可对获取到的多个搜索日志分别进行句法分析、分词等,并提取出每个搜索日志中的搜索关键词。
其中,直达号定义的语法规则为用于标识搜索词是用于执行直达号功能的规则。举例来说,直达号定义的语法规则可以是特殊标识与词语的组合,本发明对特殊标识与词语之间的组合方式不做限定,例如,可以是词语以特殊标识为前缀或者后缀等。举例来说,特殊标识可以是特殊符号,例如,“”、“#!”等。
如果搜索关键词符合直达号定义的语法规则,例如,搜索关键词为“海底捞”,则提取单元12可将该搜索关键词作为候选关键词。如果搜索关键词不符合直达号定义的语法规则,则提取单元12可通过现有的一些词性分析算法对搜索关键词进行词性分析,以确定搜索关键词的词性。
由于词性分析算法的计算量比较大,占用CPU、内存等系统资源较多,且耗时较长,因此,为了减少对系统资源的消耗,节约时间,在每次确定了一个搜索关键词的词性后,可将搜索关键词与其确定的词性之间的对应关系作为缓存数据存储在本地内存或磁盘上。
因此,在本发明的另一个实施例中,提取单元12还用于:在进一步获取搜索关键词的词性之前,根据搜索关键词查询缓存数据,以从缓存数据中查询搜索关键词对应的词性。如果缓存数据中没有存储该搜索关键词对应的词性,在通过词性分析算法来分析搜索关键词的词性,从而实现了对提取候选关键词的过程的优化,大大降低了这个过程对系统资源的消耗,并显著地降低了提取候选关键词的时间。
获取单元13用于根据已有的直达号对多个候选关键词进行筛选,并获取筛选之后的每个候选关键词对应的计数值。
在本发明的一个实施例中,获取单元13具体用于:判断提取的候选关键词是否属于直达号资源库;如果属于直达号资源库,则将候选关键词丢弃。
其中,直达号资源库中记录了所有已开通的直达号的相关信息,包括已开通的直达号的关键词(即已注册的直达号关键词),已开通的直达号的关键词是这个直达号独占的,其他直达号不能再申请以该关键词作为直达号名称来开通另一个直达号。
获取单元13可通过将提取的候选关键词与直达号资源库中的直达号的关键词进行匹配,如果直达号资源库中存在与候选关键词相匹配的直达号的关键词,则该候选关键词属于直达号资源库,否则,该候选关键词不属于直达号资源库。
如果提取的候选关键词属于直达号资源库,则表明该候选关键词已经被已开通的直达号占用,不能再作为其他直达号的关键词,因此,需要将其丢弃。由此,可筛选出可作为其他直达号的关键词的候选关键词。
在对候选关键词进行筛选后,获取单元13可获取每个候选关键词的计数值。其中,候选关键词的计数值是在对每个搜索日志进行候选关键词提取和筛选的过程中动态更新的。更具体地,当从一个搜索日志中提取的搜索关键词被确定为候选关键词,且该候选关键词不属于直达号资源库时,如果该候选关键词尚未有对应的计数值,则表明这个搜索词第一次被作为搜索关键词,将该候选关键词的计数值记录为预设的初始分值(例如,可为1);如果该候选关键词已经有对应的计数值,则将该候选关键词的计数值增加预设分值(例如,预设分值可为1、2等)。由此,在对候选关键词筛选之后可直接获取每个筛选后的候选关键词的计数值。
建立单元14用于根据筛选之后的候选关键词和候选关键词对应的计数值建立候选关键词资源库。其中,候选关键词资源库是用于存储候选关键词及其对应的计数值或者其他相关信息的数据库。
更具体地,在本发明的一个实施例中,首先建立单元14可建立一个空的候选资源库,然后在对每个搜索日志进行分析以提取出其中的候选关键词并进行筛选的过程中,可在筛选出候选关键词时,查询候选关键词资源库,如果候选关键词资源库中已经存在该候选关键词对应的记录,则更新候选关键词资源库中该候选关键词对应的计数值;如果候选关键词资源库中尚未有该候选关键词对应的记录,则将该候选关键词的计数值记录为预设的初始分值,并作为一条新的记录插入到候选关键词资源库中。由此,通过对多个搜索日志进行分析,就可实现候选关键词资源库的建立。
应当理解,候选关键词资源库可以存储在内存中,也可以存储在磁盘中,可以存储在提取候选关键词的终端本地,也可以存储在其他独立的终端中或者服务器端,本发明对此不做限定。
在本发明的一个实施例中,可选地,建立模块10还可包括生成单元15,用于在获取筛选之后的每个候选关键词对应的计数值之后,根据候选关键词对应的计数值和预设的模型生成候选关键词对应的评分。进一步地,可将每个候选关键词的评分也分别存储在候选关键词资源库中。
其中,预设模型可以是将候选关键词对应的计数值转换为评分的数值转换模型;
另外,预设模型还可以是针对候选关键词对应的计数值以及商业价值评分、服务评分等其他方面的评分综合评价模型,例如,可以是对多个方面的加权模型。其中,商业价值评分、服务评分等其他方面的评分可通过一些商业系统(如百度的凤巢系统)、服务系统或者第三方评分系统等获取。从而,可综合多方面的评价标准对候选关键词进行更精准的评价。
第一接收模块20用于提供直达号注册界面,并接收用户在直达号注册界面中输入的待查验直达号关键词。
在本发明的一个实施例中,直达号服务平台可在网页或者客户端界面中提供直达号注册入口,当用户触发直达号注册入口时,可为用户提供直达号注册界面。注册界面中具有多个输入框,以供注册用户输入用户的注册信息以及待查验直达号关键词等。
在本发明的一个实施例中,在注册用户输入待查验直达号关键词的过程中,第一接收模块20通过直达号注册界面中的JS(JavaScript)代码以异步传输的方式实时接收注册用户输入的内容。
判断模块30用于判断待查验直达号关键词是否已被直达号占用。
在本发明的实施例中,判断模块30可根据待查验直达号关键词查询直达号资源库,如果待查验直达号关键词输入直达号资源库,则判断待查验直达号关键词已被直达号占用,否则判断待查验直达号关键词未被直达号占用。
反馈模块40用于在判断模块判断待查验直达号关键词未被直达号占用时,向用户反馈查验通过结果。
更具体地,如果判断待查验直达号关键词未被直达号占用,反馈模块40可向用户反馈查验通过结果,并提示用户可用该待查验直达号关键词作为直达号名称进行申请注册。
提供模块50用于在判断模块判断待查验直达号关键词被直达号占用时,根据待查验直达号关键词和候选关键词资源库生成候选关键词列表,并将候选关键词列表提供至用户。
在本发明的一个实施例中,提供模块50具体用于:
首先,根据待查验直达号关键词查询候选关键词资源库以生成第一候选关键词列表。更具体地,提供模块50可遍历候选关键词资源库中的所有候选关键词,并按照预设的匹配策略从候选关键词资源库中选出与待查验直达号关键词相匹配的候选关键词,生成第一候选关键词列表。举例来说,匹配策略可以是:以待查验直达号关键词为前缀,或以待查验直达号关键词为后缀,或包含待查验直达号关键词,或以与待查验直达号关键词存在超过预设长度的公共子串等。
然后,根据第一候选关键词列表中每个候选关键词对应的评分生成第二候选关键词列表,并将第二候选关键词列表作为候选关键词列表。由于候选关键词对应的评分是候选关键词的商业价值、服务价值、用户关注度、以及用户需求度等多方面的综合反映,因此,提供模块50可根据候选关键词对应的评分从第一候选关键词列表中进一步筛选出评分较大的预设数量的候选关键词,生成第二候选关键词列表。
在生产第二候选关键词列表后,提供模块50可将第二候选关键词列表提供给用户。
在本发明的一个可选的实施例中,在向用户提供第二候选关键词列表时,提供模块50还可以根据每个候选关键词所对应的评分给每个候选关键词确定一种展现样式,以向用户传递每个候选关键词的不同商业价值、关注度、服务价值等。例如,评分越高的候选关键词,其展现的字体就越大,和/或其字体加粗程度也越大,或者根据评分由高到低,将展现的颜色分别设定为红、橙、黄、蓝等。不但能够更直观的明了地为用户提供候选关键词,并且增强了展示的多样性和趣味性。
在本发明的一个可选实施例中,在向用户提供第二候选关键词列表时,提供模块50还可将第二候选关键词列表中每个候选关键词对应的评分也提供给用户,以使用户对推荐的候选关键词有一个更加直观的认知,便于用户根据需要进行选择。
本发明实施例的直达号关键词的推荐装置,通过建立候选关键词资源库,并在用户输入的待查验直达号关键词已经被直达号占用时,根据待查验直达号关键词和建立的候选关键词资源库为用户提供候选关键词列表,从而在待查验直达号关键词已经被直达号占用时,用户无需多次查找更换可用的、未被占用的直达号关键词,能够显著降低了用户在申请注册直达号时的时间成本,减少用户的时间和精力的消耗,提升了用户体验。
图6为根据本发明另一个实施例的直达号关键词的推荐装置的结构示意图。
如图6所示,该直达号关键词的推荐装置,包括:建立模块10、第一接收模块20、判断模块30、反馈模块40、提供模块50、第二接收模块60和更新模块70。
具体地,建立模块10、第一接收模块20、判断模块30、反馈模块40和提供模块50可参照图4所示实施例,在此不再赘述。
第二接收模块60用于接收用户在候选关键词列表中选择的候选关键词。
更新模块70用于根据用户选择的候选关键词更新候选关键词资源库。
更具体地,当用户从候选关键词列表中选择候选关键词进行注册后,可在候选关键词资源库中将用户选择的候选关键词对应的记录删除。从而保证该候选关键词不会再次推荐给其他用户。
同理,保证用户已申请注册或准备申请注册的关键词不会推荐给其他用户在本发明的实施例中,在待查验直达号关键词查验通过后,如果用户根据该待查验直达号关键词进行了申请注册,则根据待查验直达号关键词查询候选关键词资源库,如果候选关键词资源库中有该待查验直达号关键词对应的记录,则删除该记录。从而,保证候选关键词资源库中的候选关键词是未被直达号占用的关键词,并且避免出现一个直达号被多个用户注册的情况。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同限定。

Claims (16)

1.一种直达号关键词的推荐方法,其特征在于,包括以下步骤:
建立候选关键词资源库;
提供直达号注册界面,并接收用户在所述直达号注册界面中输入的待查验直达号关键词;
判断所述待查验直达号关键词是否已被直达号占用;
如果判断所述待查验直达号关键词未被直达号占用,则向所述用户反馈查验通过结果;以及
如果判断所述待查验直达号关键词被直达号占用,则根据所述待查验直达号关键词和所述候选关键词资源库生成候选关键词列表,并将所述候选关键词列表提供至所述用户。
2.如权利要求1所述的直达号关键词的推荐方法,其特征在于,所述建立候选关键词资源库具体包括:
获取多个搜索日志;
提取所述多个搜索日志中的多个候选关键词;
根据已有的直达号对所述多个候选关键词进行筛选,并获取筛选之后的每个所述候选关键词对应的计数值;
根据筛选之后的所述候选关键词和所述候选关键词对应的计数值建立所述候选关键词资源库。
3.如权利要求2所述的直达号关键词的推荐方法,其特征在于,所述根据已有的直达号对所述多个候选关键词进行筛选具体包括:
判断提取的所述候选关键词是否属于直达号资源库;
如果属于所述直达号资源库,则将所述候选关键词丢弃。
4.如权利要求2所述的直达号关键词的推荐方法,其特征在于,所述提取所述多个搜索日志中的多个候选关键词具体包括:
提取每个所述搜索日志中的搜索关键词;
如果所述搜索关键词符合直达号定义的语法规则,则将所述搜索关键词作为所述候选关键词;
如果所述搜索关键词不符合直达号定义的语法规则,则进一步获取所述搜索关键词的词性;以及
如果所述搜索关键词的词性为名词,则将所述搜索关键词作为所述候选关键词。
5.如权利要求4所述的直达号关键词的推荐方法,其特征在于,在所述进一步获取所述搜索关键词的词性之前,还包括:
根据所述搜索关键词查询缓存数据,以从所述缓存数据中查询所述搜索关键词对应的词性。
6.如权利要求2所述的直达号关键词的推荐方法,其特征在于,还包括:
根据所述候选关键词对应的计数值和预设的模型生成所述候选关键词对应的评分。
7.如权利要求6所述的直达号关键词的推荐方法,其特征在于,所述根据所述待查验直达号关键词和所述候选关键词资源库生成候选关键词列表具体包括:
根据所述待查验直达号关键词查询所述候选关键词资源库以生成第一候选关键词列表;
根据所述第一候选关键词列表中每个候选关键词对应的评分生成第二候选关键词列表,并将所述第二候选关键词列表作为所述候选关键词列表。
8.如权利要求1所述的直达号关键词的推荐方法,其特征在于,还包括:
接收所述用户在所述候选关键词列表中选择的候选关键词;以及
根据所述用户选择的所述候选关键词更新所述候选关键词资源库。
9.一种直达号关键词的推荐装置,其特征在于,包括:
建立模块,用于建立候选关键词资源库;
第一接收模块,用于提供直达号注册界面,并接收用户在所述直达号注册界面中输入的待查验直达号关键词;
判断模块,用于判断所述待查验直达号关键词是否已被直达号占用;
反馈模块,用于在所述判断模块判断所述待查验直达号关键词未被直达号占用时,向所述用户反馈查验通过结果;以及
提供模块,用于在所述判断模块判断所述待查验直达号关键词被直达号占用时,根据所述待查验直达号关键词和所述候选关键词资源库生成候选关键词列表,并将所述候选关键词列表提供至所述用户。
10.如权利要求9所述的直达号关键词的推荐装置,其特征在于,所述建立模块具体包括:
获取单元,用于获取多个搜索日志;
提取单元,用于提取所述多个搜索日志中的多个候选关键词;
获取单元,用于根据已有的直达号对所述多个候选关键词进行筛选,并获取筛选之后的每个所述候选关键词对应的计数值;
建立单元,用于根据筛选之后的所述候选关键词和所述候选关键词对应的计数值建立所述候选关键词资源库。
11.如权利要求10所述的直达号关键词的推荐装置,其特征在于,所述获取单元具体用于:
判断提取的所述候选关键词是否属于直达号资源库;
如果属于所述直达号资源库,则将所述候选关键词丢弃。
12.如权利要求10所述的直达号关键词的推荐装置,其特征在于,所述提取单元具体用于:
提取每个所述搜索日志中的搜索关键词;
如果所述搜索关键词符合直达号定义的语法规则,则将所述搜索关键词作为所述候选关键词;
如果所述搜索关键词不符合直达号定义的语法规则,则进一步获取所述搜索关键词的词性;以及
如果所述搜索关键词的词性为名词,则将所述搜索关键词作为所述候选关键词。
13.如权利要求12所述的直达号关键词的推荐装置,其特征在于,所述提取单元还用于:
在所述进一步获取所述搜索关键词的词性之前,根据所述搜索关键词查询缓存数据,以从所述缓存数据中查询所述搜索关键词对应的词性。
14.如权利要求10所述的直达号关键词的推荐装置,其特征在于,所述建立模块还包括:
生成单元,用于根据所述候选关键词对应的计数值和预设的模型生成所述候选关键词对应的评分。
15.如权利要求14所述的直达号关键词的推荐装置,其特征在于,所述提供模块具体用于:
根据所述待查验直达号关键词查询所述候选关键词资源库以生成第一候选关键词列表;
根据所述第一候选关键词列表中每个候选关键词对应的评分生成第二候选关键词列表,并将所述第二候选关键词列表作为所述候选关键词列表。
16.如权利要求9所述的直达号关键词的推荐装置,其特征在于,还包括:
第二接收模块,用于接收所述用户在所述候选关键词列表中选择的候选关键词;以及
更新模块,用于根据所述用户选择的所述候选关键词更新所述候选关键词资源库。
CN201410705960.8A 2014-11-27 2014-11-27 直达号关键词的推荐方法和装置 Active CN104462289B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410705960.8A CN104462289B (zh) 2014-11-27 2014-11-27 直达号关键词的推荐方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410705960.8A CN104462289B (zh) 2014-11-27 2014-11-27 直达号关键词的推荐方法和装置

Publications (2)

Publication Number Publication Date
CN104462289A true CN104462289A (zh) 2015-03-25
CN104462289B CN104462289B (zh) 2018-11-20

Family

ID=52908325

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410705960.8A Active CN104462289B (zh) 2014-11-27 2014-11-27 直达号关键词的推荐方法和装置

Country Status (1)

Country Link
CN (1) CN104462289B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107818139A (zh) * 2017-09-28 2018-03-20 链家网(北京)科技有限公司 内容平台的内容处理方法及装置
CN109189990A (zh) * 2018-07-25 2019-01-11 北京奇艺世纪科技有限公司 一种搜索词的生成方法、装置及电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101047537A (zh) * 2006-03-30 2007-10-03 盛趣信息技术(上海)有限公司 网络通行证注册方法
US20110320462A1 (en) * 2010-06-29 2011-12-29 International Business Machines Corporation Method and apparatus for recommending information to users within a social network
CN102859532A (zh) * 2010-04-29 2013-01-02 诺基亚公司 跨多个服务节点协调服务信息的方法和装置
CN103577442A (zh) * 2012-07-30 2014-02-12 腾讯科技(深圳)有限公司 一种地图数据重要度计算方法及装置
CN104143001A (zh) * 2014-08-01 2014-11-12 百度在线网络技术(北京)有限公司 搜索词推荐方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101047537A (zh) * 2006-03-30 2007-10-03 盛趣信息技术(上海)有限公司 网络通行证注册方法
CN102859532A (zh) * 2010-04-29 2013-01-02 诺基亚公司 跨多个服务节点协调服务信息的方法和装置
US20110320462A1 (en) * 2010-06-29 2011-12-29 International Business Machines Corporation Method and apparatus for recommending information to users within a social network
CN103577442A (zh) * 2012-07-30 2014-02-12 腾讯科技(深圳)有限公司 一种地图数据重要度计算方法及装置
CN104143001A (zh) * 2014-08-01 2014-11-12 百度在线网络技术(北京)有限公司 搜索词推荐方法及装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107818139A (zh) * 2017-09-28 2018-03-20 链家网(北京)科技有限公司 内容平台的内容处理方法及装置
CN109189990A (zh) * 2018-07-25 2019-01-11 北京奇艺世纪科技有限公司 一种搜索词的生成方法、装置及电子设备
CN109189990B (zh) * 2018-07-25 2021-03-26 北京奇艺世纪科技有限公司 一种搜索词的生成方法、装置及电子设备

Also Published As

Publication number Publication date
CN104462289B (zh) 2018-11-20

Similar Documents

Publication Publication Date Title
Marrone et al. Smart cities: A review and analysis of stakeholders’ literature
CN110168535B (zh) 一种信息处理方法及终端、计算机存储介质
CN109710841B (zh) 评论推荐方法和装置
US20110231353A1 (en) Artificial intelligence application in human machine interface for advanced information processing and task managing
CN103927354A (zh) 交互式搜索及推荐方法和装置
CN106096037A (zh) 基于人工智能的搜索结果聚合方法、装置以及搜索引擎
CN106844685B (zh) 用于识别网站的方法、装置及服务器
CN103995885B (zh) 实体名的识别方法和装置
CN105183850A (zh) 基于人工智能的信息查询方法及装置
CN103927299A (zh) 输入法中候选语句的提供方法、输入内容推荐方法和装置
CN110598070B (zh) 应用类型识别方法及装置、服务器及存储介质
Villata et al. Thirty years of artificial intelligence and law: the third decade
CN106326386B (zh) 搜索结果的展示方法和装置
CN104731873A (zh) 一种评价信息生成方法和装置
CN105677927A (zh) 用于提供搜索结果的方法和装置
CN107977678A (zh) 用于输出信息的方法和装置
CN112597775A (zh) 信贷风险预测方法及装置
CN110516162A (zh) 一种信息推荐方法、装置、设备及存储介质
CN105955961A (zh) 预约信息处理方法和装置
CN113626624A (zh) 一种资源识别方法和相关装置
CN116756576B (zh) 数据处理方法、模型训练方法、电子设备及存储介质
CN104462289A (zh) 直达号关键词的推荐方法和装置
Kühne et al. How could smart cities use data?–Towards a taxonomy of data-driven smart city projects
CN113157871A (zh) 应用人工智能的新闻舆情文本处理方法、服务器及介质
CN110852064B (zh) 关键句提取方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant