CN106649537A - 基于改进的群智能算法实现搜索引擎关键词优化技术 - Google Patents

基于改进的群智能算法实现搜索引擎关键词优化技术 Download PDF

Info

Publication number
CN106649537A
CN106649537A CN201610939944.4A CN201610939944A CN106649537A CN 106649537 A CN106649537 A CN 106649537A CN 201610939944 A CN201610939944 A CN 201610939944A CN 106649537 A CN106649537 A CN 106649537A
Authority
CN
China
Prior art keywords
keyword
solution
search engine
search
follows
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610939944.4A
Other languages
English (en)
Inventor
金平艳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan Yonglian Information Technology Co Ltd
Original Assignee
Sichuan Yonglian Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan Yonglian Information Technology Co Ltd filed Critical Sichuan Yonglian Information Technology Co Ltd
Priority to CN201610939944.4A priority Critical patent/CN106649537A/zh
Publication of CN106649537A publication Critical patent/CN106649537A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

基于改进的群智能算法实现搜索引擎关键词优化技术,根据企业业务确定核心关键词,搜索关键词对应的数据项,如本国每月搜索量、竞争程度和估算每次点击费用等,对上述关键词集合进行再降维处理,每个关键词用一五维向量表示,即增加首页网页数和总搜索页面数,利用改进的蚁群算法聚类得到初始解,再根据改进的模拟退火迭代找到全局最优解,最后根据企业情况,选择合适的关键词优化策略达到网站优化目标,本发明克服了蚁群算法容易陷入局部最优解的缺点,具有收敛速度快的优点,能帮助网站在短时间内快速提升其关键词的排名,为企业网站带来一定的流量和询盘,从而达到理想的网站优化目标。

Description

基于改进的群智能算法实现搜索引擎关键词优化技术
技术领域
本发明涉及语义网络技术领域,具体涉及基于改进的群智能算法实现搜索引擎关键词优化技术。
背景技术
人们在互联网上获取信息很大程度上依赖着搜索引擎,网站能被其收录并排名相对靠前,能获得更多用户访问,随着百度、谷歌的著名搜索引擎的迅速发展,它们各自形成了比较成熟的排序算法。搜索引擎优化(SEO)是指在搜索引擎许可的优化原则下,通过对网站中代码链接和文字描述的重组优化,以及后期对网站进行合理的反向链接操作,最终实现被优化的网站在搜索引擎的检索结果中得到排名提升。而搜索引擎优化中,关键词优化策略尤为重要,关键词始终贯穿于搜索引擎优化的整个过程。关键词优化策略一般包括关键词的选择、关键词的分布及密度控制等等,关键词的使用是否得当,直接关系到网站在搜索引擎的搜索结果中的位置。在研究网络搜索关键词搜索量数据与相关问题的关系时,选择哪些关键词是首先要解决的关键问题,阅读文献,笔者发现,对于关键词的选取大多凭借经验和主观因素,缺少系统的方法和总结。为使关键词的选取更具科学性和客观性,基于上述需求,本发明提供了基于改进的群智能算法实现搜索引擎关键词优化技术。
发明内容
针对于关键词优化实现搜索引擎优化的技术问题以及具备系统的方法不足,本发明提供了基于改进的群智能算法实现搜索引擎关键词优化技术。
为了解决上述问题,本发明是通过以下技术方案实现的:
步骤1:根据企业业务确定核心关键词,利用搜索引擎搜集相关关键字,这些关键字在搜索引擎中有相应数据项,如本国每月搜索量、竞争程度和估算每次点击费用(CPC)等
步骤2:结合企业产品和市场分析,筛选降维上述搜索到的相关关键字集合;
步骤3:针对筛选降维后的关键词集合,通过搜索引擎搜索关键词对应的页面,这里记录首页网页数和总搜索页面数,即每个关键词就是一个五维向量;
步骤4:利用改进的蚁群算法,对上述关键词进行聚类处理,其具体子步骤如下:
步骤4.1:初始化迭代次数nc=0,根据k-means中心聚类算法初始化各个关键词信息量Iij
步骤4.2:对每个关键词i(i∈(1,2,…,m)),按目标函数f(i)选择聚类中心j,并记录当前最好的解;
步骤4.3:按下列更新方程更新各个关键词的信息量,nc=nc+1;
步骤5:聚类结果为下式,即为当前最优解,再采用改进的模拟退火算法找到全局最优解,其具体子步骤如下:
步骤5.1:设定初始温度T,最低温度T0,使得当前最优解作为初始解;
步骤5.2:检查是否到达最低温度,如果达到,则转向步骤4,否则转向下一步;
步骤5.3:检查是否达到平衡,如果达到,则转向步骤5.6,否则转向下一步;
步骤5.4:对当前解进行随机扰动,产生变异解;
步骤5.5:以下式判定函数接受新解为当前最优解,转向步骤5.3;
步骤5.6:按照降温公式计算下次迭代温度,转向步骤4;
步骤6:结束搜索过程,输出最终聚类结果;
步骤7:根据企业具体情况,综合关键词效能优化和价值率优化,选择合适的关键词优化策略达到网站优化目标。
本发明有益效果是:
1、此算法克服了蚁群算法容易陷入局部最优解导致算法停滞的不足。
2、蚁群算法具有收敛速度快的优点,这也提高了模拟退火的速度。
3、此算法具有更大的利用价值。
4、能帮助网站在短时间内快速提升其关键词的排名。
5、为企业网站带来一定的流量和询盘,从而达到理想的网站优化目标。
附图说明
图1基于改进的群智能算法实现搜索引擎关键词优化技术结构流程图
具体实施方式
为了解决关键词优化实现搜索引擎优化的技术问题和实现系统的方法,结合图1对本发明进行了详细说明,其具体实施步骤如下:
步骤1:根据企业业务确定核心关键词,利用搜索引擎搜集相关关键字,这些关键字在搜索引擎中有相应数据项,如本国每月搜索量、竞争程度和估算每次点击费用(CPC)等。
步骤2:结合企业产品和市场分析,筛选降维上述搜索到的相关关键字集合;
步骤3:针对筛选降维后的关键词集合,通过搜索引擎搜索关键词对应的页面,这里记录首页网页数和总搜索页面数,即每个关键词由五维向量再降维为四维的,其具体描述如下:
这里相关关键词个数为m,既有下列m×5矩阵:
Ni、Ldi、CPCi、NiS、NiY依次为第i个关键词对应的本国每月搜索量、竞争程度、估算每次点击费用(CPC)、首页网页数、总搜索页面数。
再降维为四维,即
Xi∈(1,2,…,m)为搜索效能,Zi∈(1,2,…,m)为价值率,即为下式:
步骤4:利用改进的蚁群算法,对上述关键词进行分类处理,其具体子步骤如下:
步骤4.1:初始化迭代次数nc=0,根据k-means中心聚类算法初始化各个关键词信息量为Iij
步骤4.2:对每个关键词i(i∈(1,2,…,m)),按目标函数f(i)选择聚类中心j,并记录当前最好的解,其具体计算过程如下:
目标函数
上式Iij NEW为聚类为j类的信息量,k为聚类种类的个数,α、β为权重系数,一般关键词的搜索效能与价值率的影响比首页页面数和总页面数的影响要大,即α>β,这个可以根据经验数据测试得出。
选择使f(i)值最大的聚类中心j,同时记录当前最好的解。
步骤4.3:按下列更新方程更新各个关键词的信息量,nc=nc+1,其具体计算过程如下:
Iij NEW′=ρIij old+Iij NEW
上式ρ为每次迭代,路径信息挥发的系数,这个可以根据蚁群实验,测试得出。
步骤5:聚类结果为下式,即为当前最优解,再采用改进的模拟退火算法找到全局最优解,其具体子步骤如下:
步骤5.1:设定初始温度T,最低温度T0,使得当前最优解Iij NEW′作为初始解
步骤5.2:检查是否到达最低温度T0,如果达到,则转向步骤4,否则转向下一步;
步骤5.3:检查是否达到平衡,如果达到,则转向步骤5.6,否则转向下一步;
步骤5.4:对当前解进行随机扰动,产生变异解其具体过程如下:
变异解:
上式ΔE(ΔT)为温度的变化引起能量变化,ΔE(ΔT)与温度变化成正比,根据热运动很容易得到此函数,T′为温度迭代一次后的值。
步骤5.5:以下式判定函数接受新解为当前最优解,转向步骤5.3,其具体计算过程如下:
判定函数为:
满足上式,则接受新解
步骤5.6:按照降温公式计算下次迭代温度,转向步骤4,其具体计算过程如下:
降温公式:T′=T+LΔT
上式L为模拟退火的迭代次数,当迭代次数为L时,找到全局最优解,ΔT为每次迭代温度的变化。
步骤6:结束搜索过程,输出最终聚类结果;
步骤7:根据企业具体情况,综合关键词效能优化和价值率优化,选择合适的关键词优化策略达到网站优化目标。
基于改进的群智能算法实现搜索引擎关键词优化技术,其伪代码过程
输入:网站提取的核心关键词
输出:一系列优化后的高质量关键词。

Claims (2)

1.基于改进的群智能算法实现搜索引擎关键词优化技术,本发明涉及语义网络技术领域,具体涉及基于改进的群智能算法实现搜索引擎关键词优化技术,其特征是,包括如下步骤:
步骤1:根据企业业务确定核心关键词,利用搜索引擎搜集相关关键字,这些关键字在搜索引擎中有相应数据项,如本国每月搜索量、竞争程度和估算每次点击费用
步骤2:结合企业产品和市场分析,筛选降维上述搜索到的相关关键字集合;
步骤3:针对筛选降维后的关键词集合,通过搜索引擎搜索关键词对应的页面,这里记录首页网页数和总搜索页面数,即每个关键词就是一个五维向量,其具体描述如下:
这里相关关键词个数为m,既有下列矩阵:
依次为第i个关键词对应的本国每月搜索量、竞争程度、估算每次点击费用(CPC)、首页网页数、总搜索页面数
再降维为四维,即
为搜索效能,为价值率,即为下式:
步骤4:利用改进的蚁群算法,对上述关键词进行聚类处理,其具体子步骤如下:
步骤4.1:初始化迭代次数,根据k-means中心聚类算法初始化各个关键词信息量
步骤4.2:对每个关键词,按目标函数选择聚类中心j,并记录当前最好的解,其具体计算过程如下:
目标函数
上式为聚类为j类的信息量,k为聚类种类的个数,为权重系数,一般关键词的搜索效能与价值率的影响比首页页面数和总页面数的影响要大,即,这个可以根据经验数据测试得出
选择使值最大的聚类中心j,同时记录当前最好的解
步骤4.3:按下列更新方程更新各个关键词的信息量,,其具体计算过程如下:
上式为每次迭代,路径信息挥发的系数,这个可以根据蚁群实验,测试得出
步骤5:聚类结果为下式,即为当前最优解,再采用改进的模拟退火算法找到全局最优解,其具体子步骤如下:
步骤5.1:设定初始温度T,最低温度,使得当前最优解作为初始解;
步骤5.2:检查是否到达最低温度,如果达到,则转向步骤4,否则转向下一步;
步骤5.3:检查是否达到平衡,如果达到,则转向步骤5.6,否则转向下一步;
步骤5.4:对当前解进行随机扰动,产生变异解;
步骤5.5:以下式判定函数接受新解为当前最优解,转向步骤5.3;
步骤5.6:按照降温公式计算下次迭代温度,转向步骤4;
步骤6:结束搜索过程,输出最终聚类结果;
步骤7:根据企业具体情况,综合关键词效能优化和价值率优化,选择合适的关键词优化策略达到网站优化目标。
2.根据权利要求1中所述的基于改进的群智能算法实现搜索引擎关键词优化技术,其特征是,以上所述步骤5中的具体计算过程如下:
步骤5:聚类结果为下式,即为当前最优解,再采用改进的模拟退火算法找到全局最优解,其具体子步骤如下:
步骤5.1:设定初始温度T,最低温度,使得当前最优解作为初始解,即
步骤5.2:检查是否到达最低温度,如果达到,则转向步骤4,否则转向下一步;
步骤5.3:检查是否达到平衡,如果达到,则转向步骤5.6,否则转向下一步;
步骤5.4:对当前解进行随机扰动,产生变异解,其具体过程如下:
变异解:
上式为温度的变化引起能量变化,与温度变化成正比,根据热运动很容易得到此函数,为温度迭代一次后的值
步骤5.5:以下式判定函数接受新解为当前最优解,转向步骤5.3,其具体计算过程如下:
判定函数为:
满足上式,则接受新解
步骤5.6:按照降温公式计算下次迭代温度,转向步骤4,其具体计算过程如下:
降温公式:
上式L为模拟退火的迭代次数,当迭代次数为L时,找到全局最优解,为每次迭代温度的变化。
CN201610939944.4A 2016-11-01 2016-11-01 基于改进的群智能算法实现搜索引擎关键词优化技术 Pending CN106649537A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610939944.4A CN106649537A (zh) 2016-11-01 2016-11-01 基于改进的群智能算法实现搜索引擎关键词优化技术

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610939944.4A CN106649537A (zh) 2016-11-01 2016-11-01 基于改进的群智能算法实现搜索引擎关键词优化技术

Publications (1)

Publication Number Publication Date
CN106649537A true CN106649537A (zh) 2017-05-10

Family

ID=58821267

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610939944.4A Pending CN106649537A (zh) 2016-11-01 2016-11-01 基于改进的群智能算法实现搜索引擎关键词优化技术

Country Status (1)

Country Link
CN (1) CN106649537A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107464018A (zh) * 2017-08-01 2017-12-12 北京同城必应科技有限公司 一种配送路径优化方法和装置、计算机设备、存储介质
CN109903176A (zh) * 2019-02-03 2019-06-18 内蒙古工业大学 一种基于流式云平台的实时舆情分析方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103258000A (zh) * 2013-03-29 2013-08-21 北界创想(北京)软件有限公司 对网页中高频关键词进行聚类的方法及装置
CN103927347A (zh) * 2014-04-01 2014-07-16 复旦大学 一种基于用户行为模型和蚁群聚类的协同过滤推荐算法
CN105956013A (zh) * 2016-04-21 2016-09-21 世纪禾光科技发展(北京)有限公司 网站关键词提取方法、装置和系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103258000A (zh) * 2013-03-29 2013-08-21 北界创想(北京)软件有限公司 对网页中高频关键词进行聚类的方法及装置
CN103927347A (zh) * 2014-04-01 2014-07-16 复旦大学 一种基于用户行为模型和蚁群聚类的协同过滤推荐算法
CN105956013A (zh) * 2016-04-21 2016-09-21 世纪禾光科技发展(北京)有限公司 网站关键词提取方法、装置和系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
朱刚等: "多目标函数优化的元胞蚂蚁算法", 《控制与决策》 *
林元国等: "K-means算法在关键词优化中的应用", 《计算机系统应用》 *
蒋龙聪等: "模拟退火算法及其改进", 《工程地球物理学报》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107464018A (zh) * 2017-08-01 2017-12-12 北京同城必应科技有限公司 一种配送路径优化方法和装置、计算机设备、存储介质
CN109903176A (zh) * 2019-02-03 2019-06-18 内蒙古工业大学 一种基于流式云平台的实时舆情分析方法

Similar Documents

Publication Publication Date Title
US10909427B2 (en) Method and device for classifying webpages
CN101493819B (zh) 一种搜索引擎作弊检测的优化方法
CN105893609A (zh) 一种基于加权混合的移动app推荐方法
CN109918563B (zh) 一种基于公开数据的图书推荐的方法
CN108197144B (zh) 一种基于BTM和Single-pass的热点话题发现方法
CN109492776B (zh) 基于主动学习的微博流行度预测方法
CN104834693A (zh) 基于深度搜索的视觉图像检索方法及系统
CN110222260A (zh) 一种搜索方法、装置及存储介质
Liu et al. Learning to rank complex network node based on the self-supervised graph convolution model
CN110046713A (zh) 基于多目标粒子群优化的鲁棒性排序学习方法及其应用
CN106649616A (zh) 一种聚类算法实现搜索引擎关键词优化
Han Personalized news recommendation and simulation based on improved collaborative filtering algorithm
CN106933954A (zh) 基于决策树分类算法实现搜索引擎优化技术
Hu et al. Actnet: Active learning for networked texts in microblogging
Song et al. An effective query recommendation approach using semantic strategies for intelligent information retrieval
CN101814085A (zh) 基于wdb特征和用户查询请求的web数据库选择方法
CN106909626A (zh) 改进的决策树分类算法实现搜索引擎优化技术
CN106649537A (zh) 基于改进的群智能算法实现搜索引擎关键词优化技术
CN111753151B (zh) 一种基于互联网用户行为的服务推荐方法
TW201243627A (en) Multi-label text categorization based on fuzzy similarity and k nearest neighbors
CN106874376A (zh) 一种验证搜索引擎关键词优化技术的方法
Saha et al. A large scale study of SVM based methods for abstract screening in systematic reviews
Wang et al. SOTagRec: A combined tag recommendation approach for stack overflow
CN106897376A (zh) 基于蚁群的模糊c均值算法实现关键词优化
CN103955460B (zh) 基于膜计算的搜索方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170510

WD01 Invention patent application deemed withdrawn after publication