CN103530414B - 网页关键词的拓词方法和装置 - Google Patents

网页关键词的拓词方法和装置 Download PDF

Info

Publication number
CN103530414B
CN103530414B CN201310518201.6A CN201310518201A CN103530414B CN 103530414 B CN103530414 B CN 103530414B CN 201310518201 A CN201310518201 A CN 201310518201A CN 103530414 B CN103530414 B CN 103530414B
Authority
CN
China
Prior art keywords
search
word
related term
relevant
relevant search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310518201.6A
Other languages
English (en)
Other versions
CN103530414A (zh
Inventor
陈改静
黄勇坚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Gridsum Technology Co Ltd
Original Assignee
Beijing Gridsum Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Gridsum Technology Co Ltd filed Critical Beijing Gridsum Technology Co Ltd
Priority to CN201310518201.6A priority Critical patent/CN103530414B/zh
Publication of CN103530414A publication Critical patent/CN103530414A/zh
Application granted granted Critical
Publication of CN103530414B publication Critical patent/CN103530414B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Abstract

本发明公开了一种网页关键词的拓词方法和装置,其中,网页关键词的拓词方法包括:读取输入的当前关键词;通过搜索引擎对当前关键词进行搜索,得到当前关键词对应的相关搜索词,相关搜索词为搜索引擎中相关搜索提供的词;以及将相关搜索词作为新增关键词。通过本发明,达到了获取大量的效果好的关键词的问题。

Description

网页关键词的拓词方法和装置
技术领域
本发明涉及互联网领域,具体而言,涉及一种网页关键词的拓词方法和装置。
背景技术
一般搜索引擎都会提供这样一种服务:用户可以通过输入一个关键词来检索自己需要的信息,搜索引擎根据这个关键词展示给用户一些网站,用户可以通过访问这些网站来获取自己需要的信息。基于这种服务,搜索引擎可以将一些企业或个人的网站展示给用户,使得用户可以看到这些企业或个人的网站内容。如果某些企业或个人希望推广自己的业务,那么可以在自己的网站上放入广告,并提供给搜索引擎一批关键词,搜索引擎基于这些关键词来展示和推广这些企业或者个人的网站上的广告。这种由搜索引擎提供的推广服务一般是要收费的。当有多个企业或者个人作为推广者,需要针对相同或者相似的一批关键词进行推广时,搜索引擎需要决定以何种顺序在搜索结果页面上显示这些推广者的广告,因此搜索引擎服务提供商提出了关键词出价的概念,而关键词出价最终成为影响广告展示顺序的重要决定因素。一般将上述这种服务称为关键词竞价排名服务。现有的搜索引擎营销方式中,关键词竞价排名是最主要的一种方式。
当一个推广者需要使用搜索引擎提供的营销推广服务的时候,就需要提供一批关键词给搜索引擎营销服务提供商。由于关键词的数量越多,越有可能触发广告,因此推广者都会不断发掘新的关键词,这种行为称为拓词。对于推广者而言,选择一批合适的关键词是非常重要的。如果选择的关键词不合适,可能导致广告展现量过低,或者广告展示的对象不是目标客户,这些情况都可能导致推广效果不好,浪费推广费用。因此在既需要增加关键词数量又需要保证关键词质量的情况下,对关键词进行拓词就显得尤为重要。
现有技术中,一般采用如下拓词方式:
基于推广网站的拓词方式:根据推广网站的内容,获取和此网站相关的大量关键词列表用于网站的推广。此方式的缺点是获取到的关键词列表可能针对性较差,在推广过程中难以达到很好的效果。
基于业务的拓词方式:根据推广者的业务和行业,挑选业务相关的词语作为关键词。此方式的缺点是与业务相关的词汇难以重复挖掘,多次拓词后可能难以获取到新的关键词列表。
基于已有关键词的拓词方式:根据已有的关键词,使用组合、近义词等方式获取新的关键词。此方式的缺点是这些关键词的在推广中的效果难以得到保证。
针对现有技术中难以得到大量的效果好的关键词的问题,目前尚未提出有效的解决方案。
发明内容
本发明的主要目的在于提供一种网页关键词的拓词方法和装置,以解决了现有技术中难以得到大量的效果好的关键词的问题。
为了实现上述目的,根据本发明的一个方面,提供了一种网页关键词的拓词方法。根据本发明的网页关键词的拓词方法包括:读取输入的当前关键词;通过搜索引擎对当前关键词进行搜索,得到当前关键词对应的相关搜索词,相关搜索词为搜索引擎中相关搜索提供的词;以及将相关搜索词作为新增关键词。
进一步地,通过搜索引擎对当前关键词进行搜索,得到当前关键词对应的相关搜索词包括:通过搜索引擎对当前关键词进行第一搜索,得到第一搜索的相关搜索词;通过搜索引擎对第一搜索的相关搜索词进行第二搜索,得到第二搜索的相关搜索词;将相关搜索词作为新增关键词包括:对第一搜索的相关搜索词和第二搜索的相关搜索词中重复出现的词进行去重;将去重后的第一搜索的相关搜索词和第二搜索的相关搜索词作为新增关键词。
进一步地,通过搜索引擎对当前关键词进行搜索,得到与当前关键词对应的相关搜索词包括:步骤S1,将当前关键词作为种子词,种子词为通过搜索引擎进行搜索的搜索词;步骤S2,通过搜索引擎对种子词进行搜索,得到相关词;步骤S3,将相关词作为种子词;以及判断步骤S2的执行次数是否达到预定次数;如果步骤S2执行次数达到预定次数,则将搜索到的相关词作为相关搜索词。
进一步地,通过搜索引擎对种子词进行搜索,得到相关词之后,网页关键词的拓词方法还包括:存储相关词和相关词对应的来源路径,其中,将搜索到的相关词作为相关搜索词包括:对搜索到的相关词进行去重;将去重后的相关词作为相关搜索词。
进一步地,对搜索到的相关词进行去重包括:获取存储后的相关词和相关词对应的来源路径;获取相关词中重复出现的相关词和重复出现的相关词对应的来源路径;从重复出现的相关词对应的来源路径中获取最短来源路径;以及去除重复出现的相关词中最短来源路径之外的相关词。
为了实现上述目的,根据本发明的另一方面,提供了一种网页关键词的拓词装置。根据本发明的网页关键词的拓词装置包括:读取单元,用于读取用户输入的当前关键词;搜索单元,用于通过搜索引擎对当前关键词进行搜索,得到当前关键词对应的相关搜索词,相关搜索词为搜索引擎中相关搜索提供的词;以及生成单元,用于将相关搜索词作为新增关键词。
进一步地,搜索单元包括:第一搜索模块,用于通过搜索引擎对当前关键词进行第一搜索,得到第一搜索的相关搜索词;第二搜索模块,用于通过搜索引擎对第一搜索的相关搜索词进行第二搜索,得到第二搜索的相关搜索词;生成单元包括:第一去重模块,用于对第一搜索的相关搜索词和第二搜索的相关搜索词中重复出现的词进行去重;第一生成模块,用于将去重后的第一搜索的相关搜索词和第二搜索的相关搜索词作为新增关键词。
进一步地,搜索单元包括:确认模块,用于将当前关键词作为种子词,种子词为通过搜索引擎进行搜索的搜索词;第三搜索模块,用于通过搜索引擎对种子词进行搜索,得到相关词;第二生成模块,用于将相关词作为种子词;以及判断模块,用于判断种子词通过搜索引擎的搜索次数是否达到预定次数;第三生成模块,用于如果搜索次数达到预定次数,则将搜索到的相关词作为相关搜索词。
进一步地,搜索单元还包括存储模块,存储模块用于通过搜索引擎对种子词进行搜索,得到相关词之后,存储相关词和相关词对应的来源路径,其中,生成单元包括第二去重模块,用于对搜索到的相关词进行去重;第四生成模块,用于将去重后的相关词作为相关搜索词。
进一步地,第二去重模块包括:第一获取子模块,用于获取存储后的相关词和相关词对应的来源路径;第二获取子模块,用于获取相关词中重复出现的相关词和重复出现的相关词对应的来源路径;第三获取子模块,用于从重复出现的相关词对应的来源路径中获取最短来源路径;以及去除子模块,用于去除重复出现的相关词中最短来源路径之外的相关词。
通过本发明,采用网页关键词的拓词方法包括:读取输入的当前关键词;通过搜索引擎对所述当前关键词进行搜索,得到所述当前关键词对应的相关搜索词,所述相关搜索词为所述搜索引擎中相关搜索提供的词;以及将所述相关搜索词作为新增关键词,通过读取输入的当前关键词,再通过搜索引擎对该当前关键词进行搜索,将搜索得到的大量的相关搜索词作为新增关键词,由于搜索引擎搜索得到的大量的相关搜索词都具有表现性好,针对性强的特点,且是搜索引擎认为热门的、相关性好的关键词,将该相关搜索词作为新增关键词,使得拓词后的关键词在搜索引擎营销服务中有较好的推广效果,解决了现有技术中难以得到大量的效果好的关键词的问题,达到了获取大量的效果好的关键词的问题。
附图说明
构成本申请的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明第一实施例网页关键词的拓词装置的结构示意图;
图2是根据本发明第二实施例网页关键词的拓词装置的结构示意图;
图3是根据本发明第三实施例网页关键词的拓词装置的结构示意图
图4是根据本发明第一实施例的网页关键词的拓词方法的流程图;
图5是根据本发明第二实施例的网页关键词的拓词方法的流程图;以及
图6是根据本发明第三实施例的网页关键词的拓词方法的流程图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
本发明实施例提供了一种网页关键词的拓词装置,该网页关键词的拓词装置可以通过计算机设备实现其功能。
图1是根据本发明第一实施例网页关键词的拓词装置的结构示意图。如图1所示,该网页关键词的拓词装置包括:读取单元10、搜索单元20和生成单元30。
读取单元10用于读取输入的当前关键词。当前关键词可以是网页已有的关键词,或者表现较好的关键词或者是与网页中推广的业务相关的关键词。通过提供一些与网页内容相关的当前关键词,并输入到网页关键词的拓词装置中,通过读取单元10读取该当前关键词,将该关键词作为搜索词,通过搜索引擎进行搜索。其中,搜索词是指触发网页或者广告时,用户在搜索引擎输入的关键词。用户通过在搜索引擎中输入这些搜索词来查找相关网页,进而得到自己需要的资料或者信息。
搜索单元20用于通过搜索引擎对当前关键词进行搜索,得到当前关键词对应的相关搜索词,相关搜索词为搜索引擎中相关搜索提供的词。通过读取单元10读取输入的当前关键词之后,通过搜索引擎对该输入后的当前关键词进行搜索,得到当前关键词对应的相关搜索词。在搜索引擎(比如百度、谷歌等)中,通过输入搜索词进行搜索之后,都提供一些相关搜索词,相关搜索词即搜索引擎提供的和搜索词相似的一些关键词,在搜索引擎的搜索页面上,这些相关搜索词的标题通常为相关搜索或者含有相关搜索,和搜索结果部分区分开。百度、谷歌等搜索引擎中的相关搜索展示在搜索结果下方。搜索引擎提供的相关搜索词都是搜索引擎认为热门、相关性好的关键词,因此将这些相关搜索词作为新增关键词以对网页的关键词进行拓词,能够使得拓词后的关键词针对性好,保证了拓词后的关键词的在搜索引擎营销服务中有较好的推广效果。
由于在对当前关键词进行搜索之后,得到大量的当前关键词对应的相关搜索词,同时还可以通过搜索引擎对搜索到的相关搜索词进行搜索,以得到当前关键词对应的相关搜索词的相关搜索词,将搜索到的所有相关搜索词作为拓词后的网页的关键词,以获取大量的关键词。
生成单元30用于将相关搜索词作为新增关键词。由于通过搜索引擎搜索得到的当前关键词对应的相关搜索词为搜索引擎提供的热门的、相关性好的关键词,因此,将该相关搜索词作新增关键词以实现对网页关键词的拓词。
根据本发明实施例,通过读取单元10读取输入的当前关键词,再通过搜索引擎对该当前关键词进行搜索,将搜索得到的大量的相关搜索词作为新增关键词,由于搜索引擎搜索得到的大量的相关搜索词都具有表现性好,针对性强的特点,且是搜索引擎认为热门的、相关性好的关键词,将该相关搜索词作为新增关键词,使得拓词后的关键词在搜索引擎营销服务中有较好的推广效果,解决了现有技术中难以得到大量的效果好的关键词的问题,达到了获取大量的效果好的关键词的问题。
图2是根据本发明第二实施例网页关键词的拓词装置的结构示意图。该实施例的网页关键词的拓词装置可以作为上述实施例中的网页关键词的拓词装置的一种优选实施方式。如图2所示,该网页关键词的拓词装置包括:读取单元10、搜索单元20和生成单元30,其中,搜索单元20包括第一搜索模块201和第二搜索模块202,生成单元30包括第一去重模块301和第一生成模块302。读取单元10与图1所示的读取单元10功能相同,这里不做赘述。
第一搜索模块201用于通过搜索引擎对当前关键词进行第一搜索,得到第一搜索的相关搜索词。第一搜索的相关搜索词为当前关键词对应的相关搜索词。这里的“第一搜索”是指搜索引擎执行的一次搜索操作,是为了区分搜索引擎在该次搜索之后执行的搜索。
第二搜索模块202用于通过搜索引擎对第一搜索的相关搜索词进行第二搜索,得到第二搜索的相关搜索词。第二搜索的相关搜索词为上述中第一次搜索的相关搜索词对应的相关搜索词。这里的“第二搜索”是指搜索引擎相对于“第一搜索”之后进行的搜索,而不是指对第一搜索的相关搜索词执行两次搜索。在对当前关键词执行一次搜索之后,在对搜索结果中的相关搜索词进行一次搜索,得到第二次搜索的相关搜索词。例如,搜索引擎对当前关键词A执行一次搜索,得到相关搜索词B和C,再将相关搜索词B和C作为搜索词分别进行一次搜索,得到相关搜索词D、E、F和G,最终得到的相关搜索词包括B、C、D、E、F和G,其中B和C为第一搜索的相关搜索词,D、E、F和G为第二搜索的相关搜索词。执行两次搜索之后,由当前搜索词A获得相关搜索词B、C、D、E、F和G,以获得大量的关键词。
需要说明的是,这里的“第一搜索”和“第二搜索”指示限定这两次搜索的执行顺序,表明“第二搜索”是在“第一搜索”之后,搜索引擎执行的一次搜索,并不对本发明有不当限定。
第一去重模块301用于对第一搜索的相关搜索词和第二搜索的相关搜索词中重复出现的词进行去重。由于搜索引擎在执行两次搜索之后,两次搜索得到的相关搜索词中会出现重复的相关搜索词,如上述中由在对当前关键词A执行搜索得到的相关搜索词B和C,再将相关搜索词B和C作为搜索词分别进行一次搜索,得到D、E、F和G,其中,对相关搜索词B进行搜索之后得到的相关搜索词中可能会出现相关搜索词C,或者对相关搜索词B进行搜索之后得到的相关搜索词与相关搜索词C进行搜索之后的相关搜索词相同,例如,在相关搜索词D与相关搜索词C相同,相关搜索词E与相关搜索词G相同,那么,需要将所有的相关搜索词进行对比,找出出现重复的相关搜索词,将相同的相关搜索词去重,只出现重复的相关搜索词中的一个,最终得到的相关搜索词为B、C、E和F,将相关搜索词D和G剔除。
第一生成模块302用于将去重后的第一搜索的相关搜索词和第二搜索的相关搜索词作为新增关键词。将两次搜索得到的相关搜索词去重之后的相关搜索词作为新增关键词,保证了拓词之后的关键词的质量。
根据本发明实施例,通过搜索引擎对当前搜索词进行搜索,并将得到的搜索结果中的相关搜索词作为搜索词再次进行搜索,得到再次搜索之后的相关搜索词,经过两次搜索之后获得大量的相关搜索词,并对获得的相关搜索词进行去重,将去重后的相关搜索词作为新增关键词,从而获得大量质量较好,表现较好,具有针对性的关键词。
图3是根据本发明第三实施例网页关键词的拓词装置的结构示意图。该实施例的网页关键词的拓词装置可以作为上述实施例中的网页关键词的拓词装置的一种优选实施方式。如图3所示,该网页关键词的拓词装置包括:读取单元10、搜索单元20和生成单元30,其中,搜索单元20包括确认模块203、第三搜索模块204、第二生成模块205、判断模块206和第三生成模块207。读取单元10和生成单元30与图1所示的读取单元10和生成单元30功能相同,这里不做赘述。
确认模块203用于将当前关键词作为种子词,种子词为通过搜索引擎进行搜索的搜索词。种子词也可以称为种子关键词,通过搜索引擎对种子词进行搜索,以得到相关搜索词。
第三搜索模块204用于通过搜索引擎对种子词进行搜索,得到相关词。当读取到当前关键词之后,将当前关键词作为种子词,在通过搜索引擎对种子词进行搜索,得到相关词,其中相关词,也即是种子词对应的相关搜索词。
第二生成模块205用于将相关词作为种子词。当对种子词搜索之后,得到种子词对应的相关搜索词作为种子词,再对该种子词进行搜索,得到搜索后的相关词,也即是相关搜索词。通过这样不断的循环搜索,得到大量的相关搜索词。当获得的相关词中包括该次搜索的种子词,则将该相关词中重复的词去重之后作为新的种子词。
判断模块206用于判断搜索次数是否达到预定次数。预定次数即循环搜索的次数。该预定次数可以根据需要进行设定,例如,如果用户进行两次搜索即可得到足够的关键词,那就将预定次数设定为2,如果用户进行五次搜索才能得到足够的关键词,那就将预定次数设定为5。当搜索引擎执行搜索的次数达到预定次数,则将所有搜索得到的相关词(即相关搜索词)作为新增关键词。如果搜索次数未达到预定次数,则再进行搜索。
第三生成模块207用于如果搜索次数达到预定次数,则将搜索到的相关词作为相关搜索词。由于通过搜索引擎搜索得到的当前关键词对应的相关搜索词为搜索引擎提供的热门的、相关性好的关键词,因此,将该相关搜索词作新增关键词以实现对网页关键词的拓词。
优选地,搜索单元20还包括存储模块,该存储模块用于通过搜索引擎对种子词进行搜索,得到相关词之后,存储相关词和相关词对应的来源路径。其中相关词的来源路径为相关词通过搜索引擎搜索的路径。例如,相关词Y由种子词X搜索得到,则相关词Y的来源路径为X-Y,当相关词Z为相关词Y作为种子词之后进行搜索得到的相关词,则相关词Z对应的来源路径为X-Y-Z。在搜索引擎每一次搜索之后,将相关词及其来源路径进行存储,可以了解相关词的来源,方便对相关词进行分类、筛选和分析等操作。
生成单元30还包括第二去重模块和第四生成模块。
第二去重模块用于对搜索到的相关词进行去重。如上述实施例中步骤S204中所述,由于本实施例中,搜索引擎对搜索后的相关词执行多次循环搜索,在搜索得到的相关词中,会存在很多重复出现的相关词,通过对相关词进行去重,能够保证得到的相关搜索词的质量,避免出现冗余的相关搜索词。
第四生成模块用于将去重后的相关词作为相关搜索词。通过第二去重模块去重,将相关词中,多余重复的相关词剔除,将最终获得的相关词作为相关搜索词,再将该相关搜索词作为新增关键词,以实现对网页的关键词的拓词。
优选地,第二去重模块包括:第一获取子模块、第二获取子模块、第三获取子模块和去除子模块。
第一获取子模块用于获取存储后的相关词和相关词对应的来源路径。由于在搜索引擎进行搜索之后,已经对相关词和相关词对应的来源路径进行存储,通过获取存储后的相关词和相关词对应的来源路径,可以根据相关词对应的来源路径对该相关词进行分类或者筛选。
第二获取子模块用于获取相关词中重复出现的相关词和重复出现的相关词对应的来源路径。由于在相关词中会出项重复的相关词,每个重复出现的相关词都会对应有其来源路径,例如,相关词C,其对应的来源路径为A-C,表示相关词C是由A进行搜索得到的,同时相关词D,其对应的来源路径为A-B-D,其中,相关词C与相关词D为相同的词。获取该重复出项的相关词的来源路径,可以根据其来源路径对重复出现的相关词进行去重。
第三获取子模块用于从重复出现的相关词对应的来源路径中获取最短来源路径。获取到相关词中重复出现的相关词和重复出现的相关词对应的来源路径之后,通过将重复的相关词的来源路径的长度进行对比,如上述中的相关词C和D,对应的来源路径分别为A-C和A-B-D,通过对比之后,可以得出相关词C的来源路径较短。由于最短的来源路径越短表明该相关词与当前关键词相关程度较大,将所有出现重复的相关词的来源路径进行对比,获取其中最短的来源路径,以保存该来源路径。
去除子模块,用于去除重复出现的相关词中最短来源路径之外的相关词。将最短来源路径的相关词保留,去除重复出现的相关词中最短来源路径之外的相关词,以达到对相关词去重的目的。
根据本发明实施例,将重复出现的相关词中最短来源路径之外的相关词去除,使得在获得相关词之后,将去重后的相关词作为新增关键词,可以根据各相关词的来源路径判断与当前关键词最相关的关键词,避免了由于重复出现的相关词的来源路径不同,而无法进行分析的问题。
本发明实施例还提供了一种网页关键词的拓词方法。该网页关键词的拓词方法可以运行在计算机设备上。需要说明的是,本发明实施例的网页关键词的拓词方法可以通过本发明实施例所提供的网页关键词的拓词装置来执行,本发明实施例的网页关键词的拓词装置也可以用于执行本发明实施例所提供的网页关键词的拓词方法。
图4是根据本发明第一实施例的网页关键词的拓词方法的流程图。如图4所示,该网页关键词的拓词方法包括步骤如下:
步骤S101,读取用户输入的当前关键词。当前关键词可以是网页已有的关键词,或者表现较好的关键词或者是与网页中推广的业务相关的关键词。通过提供一些与网页内容相关的当前关键词,并输入到网页关键词的拓词装置中,通过读取单元10读取该当前关键词,将该关键词作为搜索词,通过搜索引擎进行搜索。其中,搜索词是指触发网页或者广告时,用户在搜索引擎输入的关键词。用户通过在搜索引擎中输入这些搜索词来查找相关网页,进而得到自己需要的资料或者信息。
步骤S102,通过搜索引擎对当前关键词进行搜索,得到当前关键词对应的相关搜索词,相关搜索词为搜索引擎中相关搜索提供的词。在读取输入的当前关键词之后,通过搜索引擎对该输入后的当前关键词进行搜索,得到当前关键词对应的相关搜索词。在搜索引擎(比如百度、谷歌等)中,在输入搜索词进行搜索之后,都提供一些相关搜索词,相关搜索词即搜索引擎提供的和搜索词相似的一些关键词,在搜索引擎的搜索页面上,这些相关搜索词的标题通常为相关搜索或者含有相关搜索,和搜索结果部分区分开。百度、谷歌等搜索引擎中的相关搜索展示在搜索结果下方。搜索引擎提供的相关搜索词都是搜索引擎认为热门、相关性好的关键词,因此将这些相关搜索词作为新增关键词以对网页的关键词进行拓词,能够使得拓词后的关键词针对性好,保证了拓词后的关键词的在搜索引擎营销服务中有较好的推广效果。
由于在对当前关键词进行搜索之后,得到大量的当前关键词对应的相关搜索词,同时还可以通过搜索引擎对搜索到的相关搜索词进行搜索,以得到当前关键词对应的相关搜索词的相关搜索词,将搜索到的所有相关搜索词作为拓词后的网页的关键词,以获取大量的关键词。
步骤S103,将相关搜索词作为新增关键词。由于通过搜索引擎搜索得到的当前关键词对应的相关搜索词为搜索引擎提供的热门的、相关性好的关键词,因此,将该相关搜索词作新增关键词以实现对网页关键词的拓词。
根据本发明实施例,通过读取输入的当前关键词,再通过搜索引擎对该当前关键词进行搜索,将搜索得到的大量的相关搜索词作为新增关键词,由于搜索引擎搜索得到的大量的相关搜索词都具有表现性好,针对性强的特点,且是搜索引擎认为热门的、相关性好的关键词,将该相关搜索词作为新增关键词,使得拓词后的关键词在搜索引擎营销服务中有较好的推广效果,解决了现有技术中难以得到大量的效果好的关键词的问题,达到了获取大量的效果好的关键词的问题。
图5是根据本发明第二实施例的网页关键词的拓词方法的流程图。该实施例的网页关键词的拓词方法可以作为上述实施例的网页关键词的拓词方法的一种优选实施方式。如图5所示,该网页关键词的拓词方法包括步骤如下:
步骤S201,读取用户输入的当前关键词。当前关键词可以是网页已有的关键词,或者表现较好的关键词或者是与网页中推广的业务相关的关键词。通过提供一些与网页内容相关的当前关键词,并输入到网页关键词的拓词装置中,通过读取单元10读取该当前关键词,将该关键词作为搜索词,通过搜索引擎进行搜索。其中,搜索词是指触发网页或者广告时,用户在搜索引擎输入的关键词。用户通过在搜索引擎中输入这些搜索词来查找相关网页,进而得到自己需要的资料或者信息。
步骤S202,通过搜索引擎对当前关键词进行第一搜索,得到第一搜索的相关搜索词。第一搜索的相关搜索词为当前关键词对应的相关搜索词。这里的“第一搜索”是指搜索引擎执行的一次搜索操作,是为了区分搜索引擎在该次搜索之后执行的搜索。
步骤S203,通过搜索引擎对第一搜索的相关搜索词进行第二搜索,得到第二搜索的相关搜索词。第二搜索的相关搜索词为上述中第一次搜索的相关搜索词对应的相关搜索词。这里的“第二搜索”是指搜索引擎相对于“第一搜索”之后进行的搜索,而不是指对第一搜索的相关搜索词执行两次搜索。在对当前关键词执行一次搜索之后,在对搜索结果中的相关搜索词进行一次搜索,得到第二次搜索的相关搜索词。例如,搜索引擎对当前关键词A执行一次搜索,得到相关搜索词B和C,再将相关搜索词B和C作为搜索词分别进行一次搜索,得到相关搜索词D、E、F和G,最终得到的相关搜索词包括B、C、D、E、F和G,其中B和C为第一搜索的相关搜索词,D、E、F和G为第二搜索的相关搜索词。执行两次搜索之后,由当前搜索词A获得相关搜索词B、C、D、E、F和G,以获得大量的关键词。
需要说明的是,这里的“第一搜索”和“第二搜索”指示限定这两次搜索的执行顺序,表明“第二搜索”是在“第一搜索”之后,搜索引擎执行的一次搜索,并不对本发明有不当限定。
步骤S204,对第一搜索的相关搜索词和第二搜索的相关搜索词中重复出现的词进行去重。由于搜索引擎在执行两次搜索之后,两次搜索得到的相关搜索词中会出现重复的相关搜索词,如上述中由在对当前关键词A执行搜索得到的相关搜索词B和C,再将相关搜索词B和C作为搜索词分别进行一次搜索,得到D、E、F和G,其中,对相关搜索词B进行搜索之后得到的相关搜索词中可能会出现相关搜索词C,或者对相关搜索词B进行搜索之后得到的相关搜索词与相关搜索词C进行搜索之后的相关搜索词相同,例如,在相关搜索词D与相关搜索词C相同,相关搜索词E与相关搜索词G相同,那么,需要将所有的相关搜索词进行对比,找出出现重复的相关搜索词,将相同的相关搜索词去重,只出现重复的相关搜索词中的一个,最终得到的相关搜索词为B、C、E和F,将相关搜索词D和G剔除。
步骤S205,将去重后的第一搜索的相关搜索词和第二搜索的相关搜索词作为新增关键词。将两次搜索得到的相关搜索词去重之后的相关搜索词作为新增关键词,保证了拓词之后的关键词的质量。
根据本发明实施例,通过搜索引擎对当前搜索词进行搜索,并将得到的搜索结果中的相关搜索词作为搜索词再次进行搜索,得到再次搜索之后的相关搜索词,经过两次搜索之后获得大量的相关搜索词,并对获得的相关搜索词进行去重,将去重后的相关搜索词作为新增关键词,从而获得大量质量较好,表现较好,具有针对性的关键词。
图6是根据本发明第三实施例的网页关键词的拓词方法的流程图。该实施例的网页关键词的拓词方法可以作为上述实施例的网页关键词的拓词方法的一种优选实施方式。如图6所示,该网页关键词的拓词方法包括步骤如下:
步骤S301,读取用户输入的当前关键词。当前关键词可以是网页已有的关键词,或者表现较好的关键词或者是与网页中推广的业务相关的关键词。通过提供一些与网页内容相关的当前关键词,并输入到网页关键词的拓词装置中,通过读取单元10读取该当前关键词,将该关键词作为搜索词,通过搜索引擎进行搜索。其中,搜索词是指触发网页或者广告时,用户在搜索引擎输入的关键词。用户通过在搜索引擎中输入这些搜索词来查找相关网页,进而得到自己需要的资料或者信息。
步骤S302,将当前关键词作为种子词,种子词为通过搜索引擎进行搜索的搜索词。种子词也可以称为种子关键词,通过搜索引擎对种子词进行搜索,以得到相关搜索词。
步骤S303,通过搜索引擎对种子词进行搜索,得到相关词。当读取到当前关键词之后,将当前关键词作为种子词,在通过搜索引擎对种子词进行搜索,得到相关词,其中相关词,也即是种子词对应的相关搜索词。
步骤S304,将相关词作为种子词。当对种子词搜索之后,得到种子词对应的相关搜索词作为种子词,再对该种子词进行搜索,得到搜索后的相关词,也即是相关搜索词。通过这样不断的循环搜索,得到大量的相关搜索词。当获得的相关词中包括该次搜索的种子词,则将该相关词中重复的词去重之后作为新的种子词。
步骤S305,判断步骤303的执行次数是否达到预定次数。预定次数即循环搜索的次数。该预定次数可以根据需要进行设定,例如,如果用户进行两次搜索即可得到足够的关键词,那就将预定次数设定为2,如果用户进行五次搜索才能得到足够的关键词,那就将预定次数设定为5。
步骤S306,如果步骤303执行次数达到预定次数,则将搜索到的相关词作为相关搜索词。当搜索引擎执行搜索的次数达到预定次数,则将所有搜索得到的相关词(即相关搜索词)作为新增关键词。如果步骤303执行次数未达到预定次数,则继续执行步骤S303。
步骤S307,将相关搜索词作为新增关键词。由于通过搜索引擎搜索得到的当前关键词对应的相关搜索词为搜索引擎提供的热门的、相关性好的关键词,因此,将该相关搜索词作新增关键词以实现对网页关键词的拓词。
优选地,在步骤S303之后,网页关键词的拓词方法还包括:
步骤S4,存储相关词和相关词对应的来源路径。其中相关词的来源路径为相关词通过搜索引擎搜索的路径。例如,相关词Y由种子词X搜索得到,则相关词Y的来源路径为X-Y,当相关词Z为相关词Y作为种子词之后进行搜索得到的相关词,则相关词Z对应的来源路径为X-Y-Z。在搜索引擎每一次搜索之后,将相关词及其来源路径进行存储,可以了解相关词的来源,方便对相关词进行分类、筛选和分析等操作。
步骤S306包括S3061和S3062:
S3061,对搜索到的相关词进行去重。如上述实施例中步骤S204中所述,由于本实施例中,搜索引擎对搜索后的相关词执行多次循环搜索,在搜索得到的相关词中,会存在很多重复出现的相关词,通过对相关词进行去重,能够保证得到的相关搜索词的质量,避免出现冗余的相关搜索词。
S3062,将去重后的相关词作为相关搜索词。通过去重,将相关词中,多余重复的相关词剔除,将最终获得的相关词作为相关搜索词,再将该相关搜索词作为新增关键词,以实现对网页的关键词的拓词。
优选地,步骤S3061包括步骤S30611、S30612、S30613和S30614:
S30611,获取存储后的相关词和相关词对应的来源路径。由于在搜索引擎进行搜索之后,已经对相关词和相关词对应的来源路径进行存储,通过获取存储后的相关词和相关词对应的来源路径,可以根据相关词对应的来源路径对该相关词进行分类或者筛选。
S30612,获取相关词中重复出现的相关词和重复出现的相关词对应的来源路径。由于在相关词中会出项重复的相关词,每个重复出现的相关词都会对应有其来源路径,例如,相关词C,其对应的来源路径为A-C,表示相关词C是由A进行搜索得到的,同时相关词D,其对应的来源路径为A-B-D,其中,相关词C与相关词D为相同的词。获取该重复出项的相关词的来源路径,可以根据其来源路径对重复出现的相关词进行去重。
S30613,从重复出现的相关词对应的来源路径中获取最短来源路径。获取到相关词中重复出现的相关词和重复出现的相关词对应的来源路径之后,通过将重复的相关词的来源路径的长度进行对比,如上述中的相关词C和D,对应的来源路径分别为A-C和A-B-D,通过对比之后,可以得出相关词C的来源路径较短。由于最短的来源路径越短表明该相关词与当前关键词相关程度较大,将所有出现重复的相关词的来源路径进行对比,获取其中最短的来源路径,以保存该来源路径。
S30614,去除重复出现的相关词中最短来源路径之外的相关词。将最短来源路径的相关词保留,去除重复出现的相关词中最短来源路径之外的相关词,以达到对相关词去重的目的。
根据本发明实施例,将重复出现的相关词中最短来源路径之外的相关词去除,使得在获得相关词之后,将去重后的相关词作为新增关键词,可以根据各相关词的来源路径判断与当前关键词最相关的关键词,避免了由于重复出现的相关词的来源路径不同,进行重复分析的问题的问题。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种网页关键词的拓词方法,其特征在于,包括:
读取输入的当前关键词;
通过搜索引擎对所述当前关键词进行搜索,得到所述当前关键词对应的相关搜索词,所述相关搜索词为所述搜索引擎中相关搜索提供的词,并且所述相关搜索词由所述搜索引擎显示在所述当前关键词的搜索页面上,所述相关搜索词是所述搜索引擎提供的和搜索词相似的关键词;以及
将所述相关搜索词作为新增关键词,
其中,通过搜索引擎对所述当前关键词进行搜索,得到与所述当前关键词对应的相关搜索词包括:
步骤S1,将所述当前关键词作为种子词,所述种子词为通过所述搜索引擎进行搜索的搜索词;
步骤S2,通过所述搜索引擎对所述种子词进行搜索,得到相关词;
步骤S3,将所述相关词作为所述种子词;以及
判断所述步骤S2的执行次数是否达到预定次数;
如果所述步骤S2执行次数达到所述预定次数,则将搜索到的所述相关词作为所述相关搜索词,
其中,将搜索到的所述相关词作为所述相关搜索词包括:
获取存储后的所述相关词和所述相关词对应的来源路径;
获取所述相关词中重复出现的相关词和所述重复出现的相关词对应的来源路径;
从所述重复出现的相关词对应的来源路径中获取最短来源路径;以及
去除所述重复出现的相关词中最短来源路径之外的相关词;
将去重后的所述相关词作为所述相关搜索词。
2.根据权利要求1所述的网页关键词的拓词方法,其特征在于,
通过搜索引擎对所述当前关键词进行搜索,得到所述当前关键词对应的相关搜索词包括:通过所述搜索引擎对所述当前关键词进行第一搜索,得到所述第一搜索的相关搜索词;通过所述搜索引擎对所述第一搜索的相关搜索词进行第二搜索,得到所述第二搜索的相关搜索词;
将所述相关搜索词作为新增关键词包括:对所述第一搜索的相关搜索词和所述第二搜索的相关搜索词中重复出现的词进行去重;将去重后的所述第一搜索的相关搜索词和所述第二搜索的相关搜索词作为所述新增关键词。
3.根据权利要求1所述的网页关键词的拓词方法,其特征在于,通过所述搜索引擎对所述种子词进行搜索,得到相关词之后,所述网页关键词的拓词方法还包括:存储所述相关词和所述相关词对应的来源路径,其中,
将搜索到的所述相关词作为所述相关搜索词包括:对搜索到的所述相关词进行去重。
4.一种网页关键词的拓词装置,其特征在于,包括:
读取单元,用于读取用户输入的当前关键词;
搜索单元,用于通过搜索引擎对所述当前关键词进行搜索,得到所述当前关键词对应的相关搜索词,所述相关搜索词为所述搜索引擎中相关搜索提供的词,并且所述相关搜索词由所述搜索引擎显示在所述当前关键词的搜索页面上,所述相关搜索词是所述搜索引擎提供的和搜索词相似的关键词;以及
生成单元,用于将所述相关搜索词作为新增关键词,
其中,所述搜索单元包括:
确认模块,用于将所述当前关键词作为种子词,所述种子词为通过所述搜索引擎进行搜索的搜索词;
第三搜索模块,用于通过所述搜索引擎对所述种子词进行搜索,得到相关词;
第二生成模块,用于将所述相关词作为所述种子词;以及
判断模块,用于判断所述种子词通过所述搜索引擎的搜索次数是否达到预定次数;
第三生成模块,用于如果所述搜索次数达到所述预定次数,则将搜索到的所述相关词作为所述相关搜索词,
所述生成单元包括:
第一获取子模块,用于获取存储后的所述相关词和所述相关词对应的来源路径;
第二获取子模块,用于获取所述相关词中重复出现的相关词和所述重复出现的相关词对应的来源路径;
第三获取子模块,用于从所述重复出现的相关词对应的来源路径中获取最短来源路径;以及
去除子模块,用于去除所述重复出现的相关词中最短来源路径之外的相关词;
第四生成模块,用于将去重后的所述相关词作为所述相关搜索词。
5.根据权利要求4所述的网页关键词的拓词装置,其特征在于,
所述搜索单元包括:第一搜索模块,用于通过所述搜索引擎对所述当前关键词进行第一搜索,得到所述第一搜索的相关搜索词;第二搜索模块,用于通过所述搜索引擎对所述第一搜索的相关搜索词进行第二搜索,得到所述第二搜索的相关搜索词;
所述生成单元包括:第一去重模块,用于对所述第一搜索的相关搜索词和所述第二搜索的相关搜索词中重复出现的词进行去重;第一生成模块,用于将去重后的所述第一搜索的相关搜索词和所述第二搜索的相关搜索词作为所述新增关键词。
6.根据权利要求4所述的网页关键词的拓词装置,其特征在于,所述搜索单元还包括存储模块,所述存储模块用于通过所述搜索引擎对所述种子词进行搜索,得到相关词之后,存储所述相关词和所述相关词对应的来源路径,其中,所述生成单元包括
第二去重模块,用于对搜索到的所述相关词进行去重。
CN201310518201.6A 2013-10-28 2013-10-28 网页关键词的拓词方法和装置 Active CN103530414B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310518201.6A CN103530414B (zh) 2013-10-28 2013-10-28 网页关键词的拓词方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310518201.6A CN103530414B (zh) 2013-10-28 2013-10-28 网页关键词的拓词方法和装置

Publications (2)

Publication Number Publication Date
CN103530414A CN103530414A (zh) 2014-01-22
CN103530414B true CN103530414B (zh) 2017-10-03

Family

ID=49932423

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310518201.6A Active CN103530414B (zh) 2013-10-28 2013-10-28 网页关键词的拓词方法和装置

Country Status (1)

Country Link
CN (1) CN103530414B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105302810B (zh) * 2014-06-12 2019-07-09 北京搜狗科技发展有限公司 一种信息搜索方法和装置
CN105824971A (zh) * 2016-04-14 2016-08-03 四川神琥科技有限公司 一种社工信息综合搜索方法
CN106250531A (zh) * 2016-08-06 2016-12-21 马岩 同义词在大数据搜索中的应用方法及系统
WO2018027342A1 (zh) * 2016-08-06 2018-02-15 马岩 同义词在大数据搜索中的应用方法及系统
CN107704463A (zh) * 2016-08-08 2018-02-16 上海颐为网络科技有限公司 一种基于信息点结构的上溯方法和系统
CN106547732A (zh) * 2016-10-14 2017-03-29 深圳中兴网信科技有限公司 近义词识别方法和近义词识别系统
CN106844472A (zh) * 2016-12-22 2017-06-13 北京搜狗科技发展有限公司 一种搜索方法和装置、一种用于搜索的装置
CN110287440B (zh) * 2019-06-27 2021-08-24 北京金山安全软件有限公司 搜索引擎优化方法、装置、计算机设备及计算机可读存储介质
CN111859111B (zh) * 2020-06-15 2024-04-05 广州坤川网络科技有限公司 搜索广告账户结构的搭建方法、系统、装置及介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101331487A (zh) * 2005-12-15 2008-12-24 微软公司 广告关键词交叉销售

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101331487A (zh) * 2005-12-15 2008-12-24 微软公司 广告关键词交叉销售

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
一种面向主题的关键词查询扩展方法;王力 等;《计算机应用与软件》;20111231;第28卷(第12期);第30页右栏第45-48行、第31页左栏第1-12行 *
如何选择和设置SEO关键词;cherLee;《http://www.chinaz.com/web/2013/0401/298044.shtml》;20130401;第3页第(2)部分 *

Also Published As

Publication number Publication date
CN103530414A (zh) 2014-01-22

Similar Documents

Publication Publication Date Title
CN103530414B (zh) 网页关键词的拓词方法和装置
Coscia et al. Demon: a local-first discovery method for overlapping communities
Michlmayr et al. Learning user profiles from tagging data and leveraging them for personal (ized) information access
CN105518661B (zh) 经由挖掘的超链接文本的片段来浏览图像
CN103365904B (zh) 一种广告信息搜索方法和系统
US20120054143A1 (en) Systems and methods for rule based inclusion of pixel retargeting in campaign management
CN104077415B (zh) 搜索方法及装置
US9922129B2 (en) Systems and methods for cluster augmentation of search results
EP2062169A2 (en) Search document generation and use to provide recommendations
CN101283353A (zh) 通过分析标签找到相关文档的系统和方法
KR20120087881A (ko) 웹 페이지에 키워드를 할당하기 위한 방법 및 장치
CN108197244A (zh) 一种搜索推荐词的推送方法和装置
US11269970B2 (en) System and method of creating and processing semantic URL
CN107491465A (zh) 用于搜索内容的方法和装置以及数据处理系统
Danisch et al. Towards multi-ego-centred communities: a node similarity approach
CN108256084A (zh) 搜索方法及装置、计算机装置及存储介质
CN107273393A (zh) 用于移动设备的图像搜索方法、装置及数据处理系统
Niranjika et al. Exploring the effectiveness of search engine optimization tactics for dynamic websites in Sri Lanka
JP5423470B2 (ja) 名寄せチェック支援装置、名寄せチェック支援プログラム及び名寄せチェック支援方法
CN106528861A (zh) 一种添加内链的方法及装置
Kitsuregawa et al. Socio-Sense: A system for analysing the societal behavior from long term Web archive
Zhang et al. Solution and reference recommendation system using knowledge fusion and ranking
Liao et al. An intelligent recommendation model with a case study on u-tour taiwan of historical momuments and cultural heritage
CN103699602B (zh) 一种建立范文网页数据库的方法和装置
Aul et al. Towards experience management for search engine optimisation

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Word extension method and device for webpage keywords

Effective date of registration: 20190531

Granted publication date: 20171003

Pledgee: Shenzhen Black Horse World Investment Consulting Co., Ltd.

Pledgor: Beijing Guoshuang Technology Co.,Ltd.

Registration number: 2019990000503

PE01 Entry into force of the registration of the contract for pledge of patent right
CP02 Change in the address of a patent holder

Address after: 100083 No. 401, 4th Floor, Haitai Building, 229 North Fourth Ring Road, Haidian District, Beijing

Patentee after: Beijing Guoshuang Technology Co.,Ltd.

Address before: 100086 Beijing city Haidian District Shuangyushu Area No. 76 Zhichun Road cuigongfandian 8 layer A

Patentee before: Beijing Guoshuang Technology Co.,Ltd.

CP02 Change in the address of a patent holder