CN103530291A - 适用于搜索引擎的关键词投放拓词方法及其装置 - Google Patents

适用于搜索引擎的关键词投放拓词方法及其装置 Download PDF

Info

Publication number
CN103530291A
CN103530291A CN201210226340.7A CN201210226340A CN103530291A CN 103530291 A CN103530291 A CN 103530291A CN 201210226340 A CN201210226340 A CN 201210226340A CN 103530291 A CN103530291 A CN 103530291A
Authority
CN
China
Prior art keywords
keyword
search engine
word
applicable
thrown
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201210226340.7A
Other languages
English (en)
Inventor
王专
吴志祥
张海龙
马和平
吴剑
郭凤林
王晓钟
庞绍进
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tongcheng Network Technology Co Ltd
Original Assignee
Tongcheng Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tongcheng Network Technology Co Ltd filed Critical Tongcheng Network Technology Co Ltd
Priority to CN201210226340.7A priority Critical patent/CN103530291A/zh
Publication of CN103530291A publication Critical patent/CN103530291A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种适用于搜索引擎的关键词投放拓词方法及其装置,其特点是:通过搜索引擎收录网站上的网页,令用户搜索某个关键词时,通过搜索引擎访问网页,采用页面浏览数据库,记录页面被访问的信息,设置关键词数据库,记录网页被访问时,来自搜索引擎搜索的关键词。其装置通过多个服务器组件满足实施的需要。这样,能够从核心关键词中关联到具有相同属性的关键词,不局限于文字本身。同时,有潜在关联的关键词可以通过网页URL这个维度被互相查找到,能够配合用户访问产生的,进行不断扩展。再者,本发明在实施时可以同时查询多个关键词。

Description

适用于搜索引擎的关键词投放拓词方法及其装置
技术领域
本发明涉及一种放拓词方法及其装置,尤其涉及一种适用于搜索引擎的关键词投放拓词方法及其装置。
背景技术
在搜索引擎推广中,当网站确定了目标关键词之后,一般还需要运营人员进行关键词扩展,因为网站需要足够多的流量,如果单单依靠核心的几个关键词是远远不够的。还需要找到一些有搜索量,但是竞争程度不大,同时和主关键词有相关性的更多词,通过合理的安排穿插到网站中,来增加推广效果,此时就需要进行关键词拓展工作。
现有的关键词拓展主要有人工联想,工具拓词等几种方式。现有的工具拓词技术都是基于给出的关键词模糊匹配以及查询近义词库的方式去进行。这么做有3个弊端:
1、每个关键词所拓展出的词语是基本类似的,都包含了核心关键词或者这个词组的分词结果。例如核心关键词是“读书”,拓展关键词基本上都会包含这2个字,或者包含“读”和“书”中的某个,而“开卷有益”这类具有读书属性的关键词就不会被拓展出来。
2、拓展词结果是静止的,由于匹配规则的单一性,拓展出的词语不会有太大变化,而实际上我们知道当前社会上的信息繁多,各类热点话题层出不穷,在各个时段上每个关键词所对应的概念和语义都会产生很大的变化。
3、对于多个关键词的情况,返回的结果是多次进行针对单一关键词的拓词后的结果,不能返回同时满足多个词语的拓展结果。
发明内容
本发明的目的就是为了解决现有技术中存在的上述问题,提供一种适用于搜索引擎的关键词投放拓词方法。
本发明的目的通过以下技术方案来实现:
适用于搜索引擎的关键词投放拓词方法,其中:通过搜索引擎收录网站上的网页,令用户搜索某个关键词时,通过搜索引擎访问网页,采用页面浏览数据库,记录页面被访问的信息,设置关键词数据库,记录网页被访问时,来自搜索引擎搜索的关键词;投放拓词流程包括以下步骤,步骤①,用户在拓词系统的使用界面上,输入一个或是若干个种子词,步骤②,将种子词在关键词数据库中模糊匹配(包含任意一个即匹配成功),返回匹配结果和对应的URL,步骤③,根据URL,重新在关键词数据库中查询这些页面对应的关键词,汇总查询结果,步骤④,返回查询结果给用户。
上述的适用于搜索引擎的关键词投放拓词方法,其中:所述的页面被访问的信息包含,页面URL、搜索词、被搜索次数、日期。
进一步地,上述的适用于搜索引擎的关键词投放拓词方法,其中:所述的关键词数据库储存关键词时,进行关键词分词操作。同时,可以进一步优化关键词库的架构。
更进一步地,上述的适用于搜索引擎的关键词投放拓词方法,其中:所述的步骤②返回匹配结果和对应URL后,将结果去重。
适用于搜索引擎的关键词投放拓词的装置,包括有装置壳体,其中:所述的装置壳体内设置有网站输入接口组件,所述网站输入接口组件的通讯端连入搜索引擎组件的主通讯端,所述搜索引擎组件的副通讯端连接有页面浏览数据库服务器组件,所述页面浏览数据库服务器组件的主数据通讯端连接有关键词数据库服务器组件的主数据通讯端,所述页面浏览数据库服务器组件的副数据通讯端与关键词数据库服务器组件的副数据通讯端共同连接拓词系统服务器组件。
上述的适用于搜索引擎的关键词投放拓词的装置,其中:所述的页面浏览数据库服务器组件设置有扩展通讯端口。
进一步地,上述的适用于搜索引擎的关键词投放拓词的装置,其中:所述的关键词数据库服务器组件设置有扩展通讯端口。
更进一步地,上述的适用于搜索引擎的关键词投放拓词的装置,其中:所述的拓词系统服务器组件设置有扩展通讯端口。
更进一步地,上述的适用于搜索引擎的关键词投放拓词的装置,其中:所述的装置壳体上设置有通风孔。
再进一步地,上述的适用于搜索引擎的关键词投放拓词的装置,其中:所述的装置壳体内设置有散热装置,所述的散热装置包括有散热片,所述的散热片上设置有风扇。
本发明技术方案的优点主要体现在:能够从核心关键词中关联到具有相同属性的关键词,不局限于文字本生。同时,有潜在关联的关键词可以通过网页URL这个维度被互相查找到,能够配合用户访问产生的,进行不断扩展。再者,本发明在实施时可以同时查询多个关键词。
附图说明
本发明的目的、优点和特点,将通过下面优选实施例的非限制性说明进行图示和解释。这些实施例仅是应用本发明技术方案的典型范例,凡采取等同替换或者等效变换而形成的技术方案,均落在本发明要求保护的范围之内。这些附图当中,
图1是适用于搜索引擎的关键词投放拓词的装置的构造示意图。
具体实施方式
适用于搜索引擎的关键词投放拓词方法,其特别之处在于:通过搜索引擎收录网站上的网页,令用户搜索某个关键词时,通过搜索引擎访问网页。同时,采用页面浏览数据库,记录页面被访问的信息。并且,设置关键词数据库,记录网页被访问时,来自搜索引擎搜索的关键词。
结合本发明的实际应用来看,采用的投放拓词流程包括以下步骤:首先,用户在拓词系统的使用界面上,输入一个或是若干个种子词。接着,将种子词在关键词数据库中模糊匹配,在此期间包含任意一个即匹配成功。之后,返回匹配结果和对应的URL。为了提高精确程度,返回匹配结果和对应URL后,将结果去重。随后,根据URL,重新在关键词数据库中查询这些页面对应的关键词,汇总查询结果。最后,返回查询结果给用户。
就本发明一较佳的实施方式来看,为了便于核心关键词的拓词,涉及的页面被访问的信息包含,页面URL、搜索词、被搜索次数、日期。并且,所述的关键词数据库储存关键词时,进行关键词分词操作。以此,提高匹配的精确程度,进一步优化关键词库的架构。
如图1所示,为了更好的实施本发明,将上述的方法结合到装置中,提供一种适用于搜索引擎的关键词投放拓词的装置,包括有装置壳体1,其与众不同之处在于:为了便于网站服务器进行结合,装置壳体1内设置有网站输入接口组件2。同时,网站输入接口组件2的通讯端连入搜索引擎组件3的主通讯端,搜索引擎组件3的副通讯端连接有页面浏览数据库服务器组件4。并且,页面浏览数据库服务器组件4的主数据通讯端连接有关键词数据库服务器组件5的主数据通讯端。同时,为了便于进行拓词处理,页面浏览数据库服务器组件4的副数据通讯端与关键词数据库服务器组件5的副数据通讯端共同连接拓词系统服务器组件6。
进一步来看,考虑到日后的数据维护便利以及升级需要,能够对各个组件进行单独的数据通讯,满足功能扩展的需要,页面浏览数据库服务器组件4设置有扩展通讯端口7。同样的,关键词数据库服务器组件5亦设置有扩展通讯端口7。拓词系统服务器组件也可以设置有扩展通讯端口7。
再进一步来看,考虑到整个装置配合网站服务器进行运算处理时容易产生大量热量,为了提高使用寿命,不至于影响设备运转,在装置壳体1上设置有通风孔10。同时,为了巩固散热的效果,采用的装置壳体1内设置有散热装置。具体来说,该散热装置包括有散热片8,所述的散热片8上设置有风扇9。
结合本发明的实际实施来看,能够改善现有技术的三个弊端:1、每个关键词所拓展出的词语是基本类似的,都包含了核心关键词或者这个词组的分词结果。例如核心关键词是“读书”,拓展关键词基本上都会包含这2个字,或者包含“读”和“书”中的某个,同时还能够将具有读书属性的关键词比如“开卷有益”这类就拓展出来。2、先前拓展词结果是静止的,由于匹配规则的单一性,拓展出的词语不会有太大变化,而实际上我们知道当前社会上的信息繁多,各类热点话题层出不穷,在各个时段上每个关键词所对应的概念和语义都会产生很大的变化。本发明中关联是用户访问产生的,随着时间动态变化,且这些用户都是自己网站的浏览者,针对性更强。3. 现有的对于多个关键词的情况,返回的结果是多次进行针对单一关键词的拓词后的结果,不能返回同时满足多个词语的拓展结果,本发明可以实现多个关键词的同时查询。
通过上述的文字表述可以看出,采用本发明后,能够从核心关键词中关联到具有相同属性的关键词,不局限于文字本生。同时,有潜在关联的关键词可以通过网页URL这个维度被互相查找到,能够配合用户访问产生的,进行不断扩展。再者,本发明在实施时可以同时查询多个关键词。

Claims (10)

1.适用于搜索引擎的关键词投放拓词方法,其特征在于:通过搜索引擎收录网站上的网页,令用户搜索某个关键词时,通过搜索引擎访问网页,采用页面浏览数据库,记录页面被访问的信息,设置关键词数据库,记录网页被访问时,来自搜索引擎搜索的关键词;投放拓词流程包括以下步骤,步骤①,用户在拓词系统的使用界面上,输入一个或是若干个种子词,步骤②,将种子词在关键词数据库中模糊匹配,返回匹配结果和对应的URL,步骤③,根据URL,重新在关键词数据库中查询这些页面对应的关键词,汇总查询结果,步骤④,返回查询结果给用户。
2.根据权利要求1所述的适用于搜索引擎的关键词投放拓词方法,其特征在于:所述的页面被访问的信息包含,页面URL、搜索词、被搜索次数、日期。
3.根据权利要求1所述的适用于搜索引擎的关键词投放拓词方法,其特征在于:所述的关键词数据库储存关键词时,进行关键词分词操作。
4.根据权利要求1所述的适用于搜索引擎的关键词投放拓词方法,其特征在于:所述的步骤②返回匹配结果和对应URL后,将结果去重。
5.适用于搜索引擎的关键词投放拓词的装置,包括有装置壳体,其特征在于:所述的装置壳体内设置有网站输入接口组件,所述网站输入接口组件的通讯端连入搜索引擎组件的主通讯端,所述搜索引擎组件的副通讯端连接有页面浏览数据库服务器组件,所述页面浏览数据库服务器组件的主数据通讯端连接有关键词数据库服务器组件的主数据通讯端,所述页面浏览数据库服务器组件的副数据通讯端与关键词数据库服务器组件的副数据通讯端共同连接拓词系统服务器组件。
6.根据权利要求5所述的适用于搜索引擎的关键词投放拓词的装置,其特征在于:所述的页面浏览数据库服务器组件设置有扩展通讯端口。
7.根据权利要求5所述的适用于搜索引擎的关键词投放拓词的装置,其特征在于:所述的关键词数据库服务器组件设置有扩展通讯端口。
8.根据权利要求5所述的适用于搜索引擎的关键词投放拓词的装置,其特征在于:所述的拓词系统服务器组件设置有扩展通讯端口。
9.根据权利要求5所述的适用于搜索引擎的关键词投放拓词的装置,其特征在于:所述的装置壳体上设置有通风孔。
10.根据权利要求5所述的适用于搜索引擎的关键词投放拓词的装置,其特征在于:所述的装置壳体内设置有散热装置,所述的散热装置包括有散热片,所述的散热片上设置有风扇。
CN201210226340.7A 2012-07-03 2012-07-03 适用于搜索引擎的关键词投放拓词方法及其装置 Pending CN103530291A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210226340.7A CN103530291A (zh) 2012-07-03 2012-07-03 适用于搜索引擎的关键词投放拓词方法及其装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210226340.7A CN103530291A (zh) 2012-07-03 2012-07-03 适用于搜索引擎的关键词投放拓词方法及其装置

Publications (1)

Publication Number Publication Date
CN103530291A true CN103530291A (zh) 2014-01-22

Family

ID=49932313

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210226340.7A Pending CN103530291A (zh) 2012-07-03 2012-07-03 适用于搜索引擎的关键词投放拓词方法及其装置

Country Status (1)

Country Link
CN (1) CN103530291A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105956013A (zh) * 2016-04-21 2016-09-21 世纪禾光科技发展(北京)有限公司 网站关键词提取方法、装置和系统
CN106227714A (zh) * 2016-07-14 2016-12-14 北京百度网讯科技有限公司 一种基于人工智能的获取生成诗词的关键词的方法和装置
CN111368171A (zh) * 2020-02-27 2020-07-03 腾讯科技(深圳)有限公司 一种关键词推荐的方法、相关装置以及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100185661A1 (en) * 2008-12-30 2010-07-22 Yield Software, Inc. Method and System for Negative Keyword Recommendations
CN102411589A (zh) * 2010-09-26 2012-04-11 百度在线网络技术(北京)有限公司 一种监控和管理关键词的方法和设备
CN202736045U (zh) * 2012-07-03 2013-02-13 同程网络科技股份有限公司 关键词投放拓词装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100185661A1 (en) * 2008-12-30 2010-07-22 Yield Software, Inc. Method and System for Negative Keyword Recommendations
CN102411589A (zh) * 2010-09-26 2012-04-11 百度在线网络技术(北京)有限公司 一种监控和管理关键词的方法和设备
CN202736045U (zh) * 2012-07-03 2013-02-13 同程网络科技股份有限公司 关键词投放拓词装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
YIFAN CHEN等: "Advertising keyword suggestion based on concept hierarchy", 《WSDM "08 PROCEEDINGS OF THE 2008 INTERNATIONAL CONFERENCE ON WEB SEARCH AND DATA MINING》 *
谢同: "基于文本的Web图片搜索引擎的研究与实现", 《中国优秀硕士学位论文全文数据库信息科技辑》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105956013A (zh) * 2016-04-21 2016-09-21 世纪禾光科技发展(北京)有限公司 网站关键词提取方法、装置和系统
CN106227714A (zh) * 2016-07-14 2016-12-14 北京百度网讯科技有限公司 一种基于人工智能的获取生成诗词的关键词的方法和装置
CN111368171A (zh) * 2020-02-27 2020-07-03 腾讯科技(深圳)有限公司 一种关键词推荐的方法、相关装置以及存储介质
CN111368171B (zh) * 2020-02-27 2023-07-14 腾讯科技(深圳)有限公司 一种关键词推荐的方法、相关装置以及存储介质

Similar Documents

Publication Publication Date Title
Singh et al. Relevance feedback based query expansion model using Borda count and semantic similarity approach
Liu et al. Full‐text citation analysis: A new method to enhance scholarly networks
US9424351B2 (en) Hybrid-distribution model for search engine indexes
CN102110174B (zh) 一种基于关键词的web服务器扩展检索方法
CN100580666C (zh) 使用消除歧义的查询搜索消除歧义信息的方法和系统
US20160275148A1 (en) Database query method and device
US20120130995A1 (en) Efficient forward ranking in a search engine
US20140149401A1 (en) Per-document index for semantic searching
CN105706078A (zh) 实体集合的自动定义
CN102087669A (zh) 基于语义关联的智能搜索引擎系统
CN105550189A (zh) 基于本体的信息安全事件智能检索系统
CN102915381B (zh) 基于多维语义的可视化网络检索呈现系统及呈现控制方法
KR20100068532A (ko) 문서 데이터의 키워드 추출 및 연관어 네트워크 구성 장치 및 방법
CN103886099A (zh) 一种模糊概念的语义检索系统及方法
CN101650729B (zh) 一种Web服务构件库动态构造方法及其服务检索方法
CN103838798A (zh) 页面分类系统及页面分类方法
CN115563313A (zh) 基于知识图谱的文献书籍语义检索系统
CN104346331A (zh) Xml数据库的检索方法及系统
CN104636386A (zh) 信息监控方法及装置
CN108241709B (zh) 一种数据集成方法、装置和系统
CN103064907A (zh) 基于无监督的实体关系抽取的主题元搜索系统及方法
Tymoshenko et al. Encoding semantic resources in syntactic structures for passage reranking
CN103530291A (zh) 适用于搜索引擎的关键词投放拓词方法及其装置
CN102117285A (zh) 一种基于语义索引的检索方法
CN105824956A (zh) 一种基于链表结构的倒排索引模型及其构建方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20140122

RJ01 Rejection of invention patent application after publication