CN106874376A

CN106874376A - 一种验证搜索引擎关键词优化技术的方法

Info

Publication number: CN106874376A
Application number: CN201710005813.3A
Authority: CN
Inventors: 金平艳
Original assignee: Sichuan Yonglian Information Technology Co Ltd
Current assignee: Sichuan Yonglian Information Technology Co Ltd
Priority date: 2017-01-04
Filing date: 2017-01-04
Publication date: 2017-06-20

Abstract

一种验证搜索引擎关键词优化技术的方法，根据企业业务确定核心关键词，搜索关键词对应的数据项，如本国每月搜索量、竞争程度和估算每次点击费用等，对上述关键词集合进行再降维处理，每个关键词用一五维向量表示，即增加首页网页数和总搜索页面数，进而由五维再降为四维，利用一种改进的密度聚类算法，初始化为k类，根据每个领域影响函数，挑选出符合条件的k个类，对上述k类再进行k‑means聚类处理，即可得到最佳分类，最后用模糊c均值聚类算法验证上述聚类结果的准确度，即为初始化隶属矩阵J，构建隶属约束条件，综合k类总目标函数，构建带有m个拉格朗日乘子的方程组，求出满足总目标函数最大的，根据判定条件可以得出最佳聚类结果。

Description

一种验证搜索引擎关键词优化技术的方法

技术领域

本发明涉及语义网络技术领域，具体涉及一种验证搜索引擎关键词优化技术的方法。

背景技术

搜索引擎是人们获取网络资源的主要工具,随着Yahoo、Google等著名搜索引擎的出现，搜索引擎已经成为了网民获知网站的第一大入口，搜索引擎优化技术(SearchEngineOptimization,SEO)也逐渐发展起来，可以利用搜索引擎的优势在最短的时间内找到企业网站或者网页。搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息，在对信息进行组织和处理后，为用户提供检索服务，将用户检索相关的信息展示给用户的系统。搜索引擎优化策略主要有域名策略、网页设计规划策略、关键词策略以及链接策略。核心策略是关键词优化策略。目前，对于关键词的选取大多凭借经验和主观因素，也没有一个完善的机制来管理关键词优化策略和进度。为使关键词的选取更具科学性和客观性，基于上述需求，本发明提供了一种验证搜索引擎关键词优化技术的方法。

发明内容

针对于关键词优化实现搜索引擎优化的技术问题，本发明提供了一种验证搜索引擎关键词优化技术的方法。

为了解决上述问题，本发明是通过以下技术方案实现的：

步骤1：根据企业业务确定核心关键词，利用搜索引擎搜集相关关键字，这些关键字在搜索引擎中有相应数据项，如本国每月搜索量、竞争程度和估算每次点击费用(CPC)等

步骤2：结合企业产品和市场分析，筛选降维上述搜索到的相关关键字集合；

步骤3：针对筛选降维后的关键词集合，通过搜索引擎搜索关键词对应的页面，这里记录首页网页数和总搜索页面数，即每个关键词由五维向量再降维为四维的。

步骤4：利用一种改进的密度聚类算法，对上述关键词进行聚类处理，其具体子步骤如下：

步骤4.1：利用基于ε领域的k-means算法初始化簇。

步骤4.2：初始化每一个ε领域的影响函数f(i，j)^start，从数据对象集合D中按下述判定条件选择k个初始簇中心。

步骤4.3：对每类关键词i(i∈(1，2，…，m))进行重新分配，按概率函数p(i)选择聚类中心j′；

步骤4.4：根据判定函数Δ(f)的结果，重新计算各簇中心；

步骤4.5：如果簇中心发生变化，则转到步骤(2)，否则迭代结束，输出聚类结果。

步骤5：利用模糊c均值聚类算法验证上述聚类结果的准确度，其具体的子步骤如下：

步骤5.1：用值[0,1]间的数初始化隶属矩阵J，使其满足隶属的整个约束条件

步骤5.2：根据影响函数f(i，j)构建k类总目标函数，再综合隶属的整个约束条件构建新的k类总目标函数，最后得出最佳k类中心

步骤5.3：得到的聚类中心与上述步骤4得到的聚类中心相比较，既可以验证改进的密度聚类算法结果的准确度

步骤6：根据企业具体情况，综合关键词效能优化和价值率优化，选择合适的关键词优化策略达到网站优化目标。

本发明有益效果是：

1，此算法可以精简关键词分析流程，进而减少整个网站优化工作量。

2，此算法的运行时间复杂度低，处理速度更快。

3、此算法具有更大的利用价值。

4、能帮助网站在短时间内快速提升其关键词的排名。

5、为企业网站带来一定的流量和询盘，从而达到理想的网站优化目标。

6、此算法分类结果的准确度更符合经验值。

7、此算法更简便有效。

8、数据处理的效果更好。

9、提供了一种验证聚类算法结果准确性的思想方法。

附图说明

图1一种验证搜索引擎关键词优化技术的方法结构流程图

图2一种改进的密度聚类算法在聚类分析中的应用流程图

图3模糊c均值聚类算法在验证结果准确度的结构流程图

具体实施方式

为了解决关键词优化实现搜索引擎优化的技术问题，结合图1-图3对本发明进行了详细说明，其具体实施步骤如下：

步骤1：根据企业业务确定核心关键词，利用搜索引擎搜集相关关键字，这些关键字在搜索引擎中有相应数据项，如本国每月搜索量、竞争程度和估算每次点击费用(CPC)等。

步骤3：针对筛选降维后的关键词集合，通过搜索引擎搜索关键词对应的页面，这里记录首页网页数和总搜索页面数，即每个关键词由五维向量再降维为四维的，其具体计算过程如下：

这里相关关键词个数为m,既有下列m×5矩阵：

N_i、Ld_i、CPC_i、N_iS、N_iY依次为第i个关键词对应的本国每月搜索量、竞争程度、估算每次点击费用(CPC)、首页网页数、总搜索页面数。

再降维为四维，即

X_{i∈(1，2，…，m)}为搜索效能，Z_{i∈(1，2，…，m)}为价值率，即为下式：

步骤4.1：利用基于ε领域的k-means算法初始化簇。

步骤4.2：初始化每一个ε领域的影响函数f(i，j)^start，从数据对象集合D中按下述判定条件选择k个初始簇中心，其具体计算过程如下：

上式N_ε为j类ε领域内数据对象的个数，d(i，j)为关键词i到对应ε领域内簇中心的距离，σ为簇中心的期望值。

上式x_ih为ε领域内第i个关键词对应的向量，y_jh为ε领域中的簇中心数据对象的向量。

判定条件如下：

f(i，j)^start＞γ

γ为设定好的阈值，只有满足上式条件则归为一簇。

步骤4.3：对每类关键词i(i∈(1，2，…，m)进行重新分配，按概率函数p(i)选择聚类中心j′，其具体计算过程如下：

按p(i)值最大选择对应的聚类中心j′。

步骤4.4：根据判定函数Δ(f)的结果，重新计算各簇中心，其具体计算过程如下：

Δ(f)＝f(i，j)^new-f(i，j)^old＞0

满足上式，则重新计算各簇中心。

步骤5.1：用值[0,1]间的数初始化隶属矩阵J，使其满足隶属的整个约束条件，其具体计算过程如下：

上式w_ij为关键词i属于j类的程度系数，即j∈(1，2，…，k)、i∈(1，2，…，m)。

初始化隶属矩阵J为m×k：

隶属的整个约束条件为：

步骤5.2：根据影响函数f(i，j)构建k类总目标函数，再综合隶属的整个约束条件构建新的k类总目标函数，最后得出最佳k类中心，其具体计算过程如下：

k类总目标函数f(i，j)^∑j∈k：

新的k类总目标函数f(i，j₁，j₂，…，j_k，λ₁，…，λ_m)^∑j∈k：

上式λ_i(i＝1，2，…，m)是隶属的整个约束条件的拉格朗日乘子。对所有参量求导，使式f(i，j)^∑j∈k达到最大的必要条件为：

上式为关键词i所对应的向量；

步骤5.3：得到的聚类中心与上述步骤4得到的聚类中心相比较，既可以验证改进的密度聚类算法结果的准确度，其具体计算过程如下：

准确度公式为

上式为应用步骤4得出的k个簇，为应用步骤5得出的k个簇，γ为阈值，满足条件则验证上述结果正确，否则错误。

一种验证搜索引擎关键词优化技术的方法，其伪代码过程

输入：网站提取的核心关键词，基于ε领域初始化簇

输出：网站最优关键词。

Claims

1.一种验证搜索引擎关键词优化技术的方法，本发明涉及语义网络技术领域，具体涉及一种验证搜索引擎关键词优化技术的方法，其特征是，包括如下步骤：

步骤1：根据企业业务确定核心关键词，利用搜索引擎搜集相关关键字，这些关键字在搜索引擎中有相应数据项，如本国每月搜索量、竞争程度和估算每次点击费用（CPC）等

这里相关关键词个数为m,既有下列矩阵：

、、、、依次为第i个关键词对应的本国每月搜索量、竞争程度、估算每次点击费用（CPC）、首页网页数、总搜索页面数再降维

为四维，即

为搜索效能，为价值率，即为下式：

步骤4.1：利用基于领域的k-means算法初始化簇

步骤4.2：初始化每一个领域的影响函数，从数据对象集合D中按下述判定条件选择k个初始簇中心，其具体计算过程如下：

上式为j类领域内数据对象的个数，为关键词i到对应领域内簇中心的距离，为簇中心的期望值

上式为领域内第i个关键词对应的向量，为领域中的簇中心数据对象的向量

判定条件如下：

为设定好的阈值，只有满足上式条件则归为一簇

步骤4.3：对每类关键词进行重新分配，按概率函数p(i)选择聚类中心，其具体计算过程如下：

按值最大选择对应的聚类中心

步骤4.4：根据判定函数的结果，重新计算各簇中心，其具体计算过程如下：

满足上式，则重新计算各簇中心

步骤4.5：如果簇中心发生变化，则转到步骤（2），否则迭代结束，输出聚类结果

步骤5.2：根据影响函数构建k类总目标函数，再综合隶属的整个约束条件构建新的k类总目标函数，最后得出最佳k类中心

2.根据权利要求1中所述的一种验证搜索引擎关键词优化技术的方法，其特征是，以上所述步骤5中的具体计算过程如下：

上式为关键词i属于j类的程度系数，即、

初始化隶属矩阵J为：

隶属的整个约束条件为：

步骤5.2：根据影响函数构建k类总目标函数，再综合隶属的整个约束条件构建新的k类总目标函数，最后得出最佳k类中心，其具体计算过程如下：

k类总目标函数：

新的k类总目标函数：

上式是隶属的整个约束条件的拉格朗日乘子，对所有参量求导，使式达到最大的必要条件为：

上式为关键词i所对应的向量；

准确度公式为：

上式为应用步骤4得出的k个簇，为应用步骤5得出的k个簇，为阈值，满足条件则验证上述结果正确，否则错误。