CN106874376A - 一种验证搜索引擎关键词优化技术的方法 - Google Patents

一种验证搜索引擎关键词优化技术的方法 Download PDF

Info

Publication number
CN106874376A
CN106874376A CN201710005813.3A CN201710005813A CN106874376A CN 106874376 A CN106874376 A CN 106874376A CN 201710005813 A CN201710005813 A CN 201710005813A CN 106874376 A CN106874376 A CN 106874376A
Authority
CN
China
Prior art keywords
keyword
cluster
follows
degree
search engine
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710005813.3A
Other languages
English (en)
Inventor
金平艳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan Yonglian Information Technology Co Ltd
Original Assignee
Sichuan Yonglian Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan Yonglian Information Technology Co Ltd filed Critical Sichuan Yonglian Information Technology Co Ltd
Priority to CN201710005813.3A priority Critical patent/CN106874376A/zh
Publication of CN106874376A publication Critical patent/CN106874376A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种验证搜索引擎关键词优化技术的方法,根据企业业务确定核心关键词,搜索关键词对应的数据项,如本国每月搜索量、竞争程度和估算每次点击费用等,对上述关键词集合进行再降维处理,每个关键词用一五维向量表示,即增加首页网页数和总搜索页面数,进而由五维再降为四维,利用一种改进的密度聚类算法,初始化为k类,根据每个领域影响函数,挑选出符合条件的k个类,对上述k类再进行k‑means聚类处理,即可得到最佳分类,最后用模糊c均值聚类算法验证上述聚类结果的准确度,即为初始化隶属矩阵J,构建隶属约束条件,综合k类总目标函数,构建带有m个拉格朗日乘子的方程组,求出满足总目标函数最大的,根据判定条件可以得出最佳聚类结果。

Description

一种验证搜索引擎关键词优化技术的方法
技术领域
本发明涉及语义网络技术领域,具体涉及一种验证搜索引擎关键词优化技术的方法。
背景技术
搜索引擎是人们获取网络资源的主要工具,随着Yahoo、Google等著名搜索引擎的出现,搜索引擎已经成为了网民获知网站的第一大入口,搜索引擎优化技术(SearchEngineOptimization,SEO)也逐渐发展起来,可以利用搜索引擎的优势在最短的时间内找到企业网站或者网页。搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。搜索引擎优化策略主要有域名策略、网页设计规划策略、关键词策略以及链接策略。核心策略是关键词优化策略。目前,对于关键词的选取大多凭借经验和主观因素,也没有一个完善的机制来管理关键词优化策略和进度。为使关键词的选取更具科学性和客观性,基于上述需求,本发明提供了一种验证搜索引擎关键词优化技术的方法。
发明内容
针对于关键词优化实现搜索引擎优化的技术问题,本发明提供了一种验证搜索引擎关键词优化技术的方法。
为了解决上述问题,本发明是通过以下技术方案实现的:
步骤1:根据企业业务确定核心关键词,利用搜索引擎搜集相关关键字,这些关键字在搜索引擎中有相应数据项,如本国每月搜索量、竞争程度和估算每次点击费用(CPC)等
步骤2:结合企业产品和市场分析,筛选降维上述搜索到的相关关键字集合;
步骤3:针对筛选降维后的关键词集合,通过搜索引擎搜索关键词对应的页面,这里记录首页网页数和总搜索页面数,即每个关键词由五维向量再降维为四维的。
步骤4:利用一种改进的密度聚类算法,对上述关键词进行聚类处理,其具体子步骤如下:
步骤4.1:利用基于ε领域的k-means算法初始化簇。
步骤4.2:初始化每一个ε领域的影响函数f(i,j)start,从数据对象集合D中按下述判定条件选择k个初始簇中心。
步骤4.3:对每类关键词i(i∈(1,2,…,m))进行重新分配,按概率函数p(i)选择聚类中心j′;
步骤4.4:根据判定函数Δ(f)的结果,重新计算各簇中心;
步骤4.5:如果簇中心发生变化,则转到步骤(2),否则迭代结束,输出聚类结果。
步骤5:利用模糊c均值聚类算法验证上述聚类结果的准确度,其具体的子步骤如下:
步骤5.1:用值[0,1]间的数初始化隶属矩阵J,使其满足隶属的整个约束条件
步骤5.2:根据影响函数f(i,j)构建k类总目标函数,再综合隶属的整个约束条件构建新的k类总目标函数,最后得出最佳k类中心
步骤5.3:得到的聚类中心与上述步骤4得到的聚类中心相比较,既可以验证改进的密度聚类算法结果的准确度
步骤6:根据企业具体情况,综合关键词效能优化和价值率优化,选择合适的关键词优化策略达到网站优化目标。
本发明有益效果是:
1,此算法可以精简关键词分析流程,进而减少整个网站优化工作量。
2,此算法的运行时间复杂度低,处理速度更快。
3、此算法具有更大的利用价值。
4、能帮助网站在短时间内快速提升其关键词的排名。
5、为企业网站带来一定的流量和询盘,从而达到理想的网站优化目标。
6、此算法分类结果的准确度更符合经验值。
7、此算法更简便有效。
8、数据处理的效果更好。
9、提供了一种验证聚类算法结果准确性的思想方法。
附图说明
图1一种验证搜索引擎关键词优化技术的方法结构流程图
图2一种改进的密度聚类算法在聚类分析中的应用流程图
图3模糊c均值聚类算法在验证结果准确度的结构流程图
具体实施方式
为了解决关键词优化实现搜索引擎优化的技术问题,结合图1-图3对本发明进行了详细说明,其具体实施步骤如下:
步骤1:根据企业业务确定核心关键词,利用搜索引擎搜集相关关键字,这些关键字在搜索引擎中有相应数据项,如本国每月搜索量、竞争程度和估算每次点击费用(CPC)等。
步骤2:结合企业产品和市场分析,筛选降维上述搜索到的相关关键字集合;
步骤3:针对筛选降维后的关键词集合,通过搜索引擎搜索关键词对应的页面,这里记录首页网页数和总搜索页面数,即每个关键词由五维向量再降维为四维的,其具体计算过程如下:
这里相关关键词个数为m,既有下列m×5矩阵:
Ni、Ldi、CPCi、NiS、NiY依次为第i个关键词对应的本国每月搜索量、竞争程度、估算每次点击费用(CPC)、首页网页数、总搜索页面数。
再降维为四维,即
Xi∈(1,2,…,m)为搜索效能,Zi∈(1,2,…,m)为价值率,即为下式:
步骤4:利用一种改进的密度聚类算法,对上述关键词进行聚类处理,其具体子步骤如下:
步骤4.1:利用基于ε领域的k-means算法初始化簇。
步骤4.2:初始化每一个ε领域的影响函数f(i,j)start,从数据对象集合D中按下述判定条件选择k个初始簇中心,其具体计算过程如下:
上式Nε为j类ε领域内数据对象的个数,d(i,j)为关键词i到对应ε领域内簇中心的距离,σ为簇中心的期望值。
上式xih为ε领域内第i个关键词对应的向量,yjh为ε领域中的簇中心数据对象的向量。
判定条件如下:
f(i,j)start>γ
γ为设定好的阈值,只有满足上式条件则归为一簇。
步骤4.3:对每类关键词i(i∈(1,2,…,m)进行重新分配,按概率函数p(i)选择聚类中心j′,其具体计算过程如下:
按p(i)值最大选择对应的聚类中心j′。
步骤4.4:根据判定函数Δ(f)的结果,重新计算各簇中心,其具体计算过程如下:
Δ(f)=f(i,j)new-f(i,j)old>0
满足上式,则重新计算各簇中心。
步骤4.5:如果簇中心发生变化,则转到步骤(2),否则迭代结束,输出聚类结果。
步骤5:利用模糊c均值聚类算法验证上述聚类结果的准确度,其具体的子步骤如下:
步骤5.1:用值[0,1]间的数初始化隶属矩阵J,使其满足隶属的整个约束条件,其具体计算过程如下:
上式wij为关键词i属于j类的程度系数,即j∈(1,2,…,k)、i∈(1,2,…,m)。
初始化隶属矩阵J为m×k:
隶属的整个约束条件为:
步骤5.2:根据影响函数f(i,j)构建k类总目标函数,再综合隶属的整个约束条件构建新的k类总目标函数,最后得出最佳k类中心,其具体计算过程如下:
k类总目标函数f(i,j)∑j∈k
新的k类总目标函数f(i,j1,j2,…,jk,λ1,…,λm)∑j∈k
上式λi(i=1,2,…,m)是隶属的整个约束条件的拉格朗日乘子。对所有参量求导,使式f(i,j)∑j∈k达到最大的必要条件为:
上式为关键词i所对应的向量;
步骤5.3:得到的聚类中心与上述步骤4得到的聚类中心相比较,既可以验证改进的密度聚类算法结果的准确度,其具体计算过程如下:
准确度公式为
上式为应用步骤4得出的k个簇,为应用步骤5得出的k个簇,γ为阈值,满足条件则验证上述结果正确,否则错误。
步骤6:根据企业具体情况,综合关键词效能优化和价值率优化,选择合适的关键词优化策略达到网站优化目标。
一种验证搜索引擎关键词优化技术的方法,其伪代码过程
输入:网站提取的核心关键词,基于ε领域初始化簇
输出:网站最优关键词。

Claims (2)

1.一种验证搜索引擎关键词优化技术的方法,本发明涉及语义网络技术领域,具体涉及一种验证搜索引擎关键词优化技术的方法,其特征是,包括如下步骤:
步骤1:根据企业业务确定核心关键词,利用搜索引擎搜集相关关键字,这些关键字在搜索引擎中有相应数据项,如本国每月搜索量、竞争程度和估算每次点击费用(CPC)等
步骤2:结合企业产品和市场分析,筛选降维上述搜索到的相关关键字集合;
步骤3:针对筛选降维后的关键词集合,通过搜索引擎搜索关键词对应的页面,这里记录首页网页数和总搜索页面数,即每个关键词由五维向量再降维为四维的,其具体计算过程如下:
这里相关关键词个数为m,既有下列矩阵:
依次为第i个关键词对应的本国每月搜索量、竞争程度、估算每次点击费用(CPC)、首页网页数、总搜索页面数再降维
为四维,即
为搜索效能,为价值率,即为下式:
步骤4:利用一种改进的密度聚类算法,对上述关键词进行聚类处理,其具体子步骤如下:
步骤4.1:利用基于领域的k-means算法初始化簇
步骤4.2:初始化每一个领域的影响函数,从数据对象集合D中按下述判定条件选择k个初始簇中心,其具体计算过程如下:
上式为j类领域内数据对象的个数,为关键词i到对应领域内簇中心的距离,为簇中心的期望值
上式领域内第i个关键词对应的向量,领域中的簇中心数据对象的向量
判定条件如下:
为设定好的阈值,只有满足上式条件则归为一簇
步骤4.3:对每类关键词进行重新分配,按概率函数p(i)选择聚类中心,其具体计算过程如下:
值最大选择对应的聚类中心
步骤4.4:根据判定函数的结果,重新计算各簇中心,其具体计算过程如下:
满足上式,则重新计算各簇中心
步骤4.5:如果簇中心发生变化,则转到步骤(2),否则迭代结束,输出聚类结果
步骤5:利用模糊c均值聚类算法验证上述聚类结果的准确度,其具体的子步骤如下:
步骤5.1:用值[0,1]间的数初始化隶属矩阵J,使其满足隶属的整个约束条件
步骤5.2:根据影响函数构建k类总目标函数,再综合隶属的整个约束条件构建新的k类总目标函数,最后得出最佳k类中心
步骤5.3:得到的聚类中心与上述步骤4得到的聚类中心相比较,既可以验证改进的密度聚类算法结果的准确度
步骤6:根据企业具体情况,综合关键词效能优化和价值率优化,选择合适的关键词优化策略达到网站优化目标。
2.根据权利要求1中所述的一种验证搜索引擎关键词优化技术的方法,其特征是,以上所述步骤5中的具体计算过程如下:
步骤5:利用模糊c均值聚类算法验证上述聚类结果的准确度,其具体的子步骤如下:
步骤5.1:用值[0,1]间的数初始化隶属矩阵J,使其满足隶属的整个约束条件,其具体计算过程如下:
上式为关键词i属于j类的程度系数,即
初始化隶属矩阵J为
隶属的整个约束条件为:
步骤5.2:根据影响函数构建k类总目标函数,再综合隶属的整个约束条件构建新的k类总目标函数,最后得出最佳k类中心,其具体计算过程如下:
k类总目标函数
新的k类总目标函数
上式是隶属的整个约束条件的拉格朗日乘子,对所有参量求导,使式达到最大的必要条件为:
上式为关键词i所对应的向量;
步骤5.3:得到的聚类中心与上述步骤4得到的聚类中心相比较,既可以验证改进的密度聚类算法结果的准确度,其具体计算过程如下:
准确度公式为
上式为应用步骤4得出的k个簇,为应用步骤5得出的k个簇,为阈值,满足条件则验证上述结果正确,否则错误。
CN201710005813.3A 2017-01-04 2017-01-04 一种验证搜索引擎关键词优化技术的方法 Pending CN106874376A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710005813.3A CN106874376A (zh) 2017-01-04 2017-01-04 一种验证搜索引擎关键词优化技术的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710005813.3A CN106874376A (zh) 2017-01-04 2017-01-04 一种验证搜索引擎关键词优化技术的方法

Publications (1)

Publication Number Publication Date
CN106874376A true CN106874376A (zh) 2017-06-20

Family

ID=59165594

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710005813.3A Pending CN106874376A (zh) 2017-01-04 2017-01-04 一种验证搜索引擎关键词优化技术的方法

Country Status (1)

Country Link
CN (1) CN106874376A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109800296A (zh) * 2019-01-21 2019-05-24 四川长虹电器股份有限公司 一种基于用户真实意图的语意模糊识别方法
CN110287440A (zh) * 2019-06-27 2019-09-27 北京金山安全软件有限公司 搜索引擎优化方法、装置、计算机设备及计算机可读存储介质
CN110659930A (zh) * 2019-08-27 2020-01-07 深圳大学 基于用户行为的消费提质方法、装置、存储介质及设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103218435A (zh) * 2013-04-15 2013-07-24 上海嘉之道企业管理咨询有限公司 一种中文文本数据聚类方法及系统
CN103258000A (zh) * 2013-03-29 2013-08-21 北界创想(北京)软件有限公司 对网页中高频关键词进行聚类的方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103258000A (zh) * 2013-03-29 2013-08-21 北界创想(北京)软件有限公司 对网页中高频关键词进行聚类的方法及装置
CN103218435A (zh) * 2013-04-15 2013-07-24 上海嘉之道企业管理咨询有限公司 一种中文文本数据聚类方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
林元国 等: "K-means算法在关键词优化中的应用", 《计算机系统应用》 *
邓健爽 等: "基于搜索引擎的关键词自动聚类法", 《计算机科学》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109800296A (zh) * 2019-01-21 2019-05-24 四川长虹电器股份有限公司 一种基于用户真实意图的语意模糊识别方法
CN109800296B (zh) * 2019-01-21 2022-03-01 四川长虹电器股份有限公司 一种基于用户真实意图的语意模糊识别方法
CN110287440A (zh) * 2019-06-27 2019-09-27 北京金山安全软件有限公司 搜索引擎优化方法、装置、计算机设备及计算机可读存储介质
CN110287440B (zh) * 2019-06-27 2021-08-24 北京金山安全软件有限公司 搜索引擎优化方法、装置、计算机设备及计算机可读存储介质
CN110659930A (zh) * 2019-08-27 2020-01-07 深圳大学 基于用户行为的消费提质方法、装置、存储介质及设备

Similar Documents

Publication Publication Date Title
CN110222160A (zh) 智能语义文档推荐方法、装置及计算机可读存储介质
CN106874376A (zh) 一种验证搜索引擎关键词优化技术的方法
CN106649616A (zh) 一种聚类算法实现搜索引擎关键词优化
CN106933954A (zh) 基于决策树分类算法实现搜索引擎优化技术
CN112055038B (zh) 生成点击率预估模型的方法及预测点击概率的方法
CN106933953A (zh) 一种模糊k均值聚类算法实现搜索引擎优化技术
Li et al. From edge data to recommendation: A double attention-based deformable convolutional network
CN112287674B (zh) 企业间同名大节点识别方法、系统、电子设备及存储介质
Zhang et al. Image annotation of ancient Chinese architecture based on visual attention mechanism and GCN
CN106909626A (zh) 改进的决策树分类算法实现搜索引擎优化技术
CN111753151B (zh) 一种基于互联网用户行为的服务推荐方法
Saravanan et al. Enhanced text mining approach based on ontology for clustering research project selection
Zhang et al. Bilinear graph neural network-enhanced Web services classification
Kim et al. A deep bidirectional similarity learning model using dimensional reduction for multivariate time series clustering
CN106897376A (zh) 基于蚁群的模糊c均值算法实现关键词优化
CN106897356A (zh) 改进的模糊c‑均值算法实现搜索引擎关键词优化
CN106649537A (zh) 基于改进的群智能算法实现搜索引擎关键词优化技术
CN111061939B (zh) 基于深度学习的科研学术新闻关键字匹配推荐方法
CN106802945A (zh) 基于VSM的模糊c均值聚类算法实现搜索引擎关键词优化
CN106874377A (zh) 改进的基于约束条件的聚类算法实现搜索引擎关键词优化
CN113688421A (zh) 基于隐私保护的预测模型更新方法及装置
CN113256024A (zh) 一种融合群体行为的用户行为预测方法
Liu et al. A community detection algorithm for heterogeneous information networks
Rahangdale et al. Clustering-based transductive semi-supervised learning for learning-to-rank
CN106599118A (zh) 一种改进的密度聚类算法实现搜索引擎关键词优化

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170620

WD01 Invention patent application deemed withdrawn after publication