CN106933950A

CN106933950A - 新的模型聚类算法实现搜索引擎优化技术

Info

Publication number: CN106933950A
Application number: CN201710046017.4A
Authority: CN
Inventors: 金平艳
Original assignee: Sichuan Yonglian Information Technology Co Ltd
Current assignee: Sichuan Yonglian Information Technology Co Ltd
Priority date: 2017-01-22
Filing date: 2017-01-22
Publication date: 2017-07-07

Abstract

新的模型聚类算法实现搜索引擎优化技术，根据企业业务确定核心关键词，搜索关键词对应的数据项，如本国每月搜索量、竞争程度和估算每次点击费用等，对上述关键词集合进行再降维处理，每个关键词用一五维向量表示，即增加首页网页数和总搜索页面数，进而由五维再降为四维，利用新的模型聚类算法，再计算满足紧凑度函数J最大的必要条件、的基础上，再加些模型约束参数，根据模型约束参数的收敛性，判定最佳聚类结果，本发明综合了模型概率分布函数，使聚类结果的精确度更高、避免了聚类结果过早收敛问题、运行时间复杂度低、处理速度更快、聚类结果准确、可以快速提升关键词排名、为企业网站带来一定的流量、从而达到理想的网站优化目标。

Description

新的模型聚类算法实现搜索引擎优化技术

技术领域

本发明涉及语义网络技术领域，具体涉及新的模型聚类算法实现搜索引擎优化技术。

背景技术

众多网络信息丰富了人们的信息来源，也给人们快速获取信息造成了困扰。搜索引擎精准化、人性化的信息检索服务被广大使用者认可。目前不少研究发现，搜索引擎用户一般只会关注搜索结果页面中排名靠前的网站，这些网站的点击率也相对高些。搜索引擎优化,简称通俗的讲是通过对网站整体架构，网页内容、关键词以及网页内的链接进行相关的优化工作，提高其在特定搜索引擎上搜索结果中的排名，从而提高网站访问量,最终提升网站的销售能力或宣传能力的技术。目前关于搜索引擎优化方法的理论研究已较为丰富，如黑帽技术和白帽技术，搜索引擎优化策略,分别是域名策略、网页设计规划策略、关键词策略以及链接策略。企业可以根据自己的搜索引擎优化目的，有针对性的采取相应的优化方法。通过不断尝试，定期更新查看，发现属于企业自身的优化方法，使企业提高自然排名，更好地应对互联网大潮的冲击，从而提高竞争优势。SEO归根结底是关键词的优化策略，现今国内外对关键词优化的理论研究和技术应用比较多，但暂未提出一个有效的方法来简化关键词分析流程，也没有一个完善的机制来管理关键词优化策略和进度。基于上述需求，本发明提供了一种新的模型聚类算法实现搜索引擎优化技术。

发明内容

针对于关键词优化实现搜索引擎优化的技术问题，本发明提供了一种新的模型聚类算法实现搜索引擎优化技术。

为了解决上述问题，本发明是通过以下技术方案实现的：

步骤1：根据企业业务确定核心关键词，利用搜索引擎搜集相关关键字，这些关键字在搜索引擎中有相应数据项，如本国每月搜索量、竞争程度和估算每次点击费用(CPC)等

步骤2：结合企业产品和市场分析，筛选降维上述搜索到的相关关键字集合；

步骤3：针对筛选降维后的关键词集合，通过搜索引擎搜索关键词对应的页面，这里记录首页网页数和总搜索页面数，即每个关键词由五维向量再降维为四维的。

步骤4：利用新的模型聚类算法，对上述关键词进行聚类处理，其具体子步骤如下：

步骤4.1：利用基于ε领域的k-means算法初始化簇，分为k簇；

步骤4.2:用值[0,1]间的随机数初始化隶属矩阵J，使其满足隶属的整个约束条件；

步骤4.3：构建k类紧凑度函数J，综合隶属约束条件，构建m个方程组，对其进行求解，即可求出使紧凑度函数J最大的必要条件c_j、w_ij；

步骤4.4：根据判定函数w_ij、c_j、Δ(J)的大小来确定迭代的结束；

步骤4.5：根据概率函数P_i∈j重新归类；

步骤4.6：根据步骤4.2得到的分类结果，得到这几个参数模型；

步骤4.7：重复执行步骤4.2、步骤4.3两步，直到算法收敛为止；

步骤5：根据企业具体情况，综合关键词效能优化和价值率优化，选择合适的关键词优化策略达到网站优化目标。

本发明有益效果是：

1，此算法可以精简关键词分析流程，进而减少整个网站优化工作量。

2，此算法的运行时间复杂度低，处理速度更快。

3、此算法具有更大的利用价值。

4、能帮助网站在短时间内快速提升其关键词的排名。

5、为企业网站带来一定的流量和询盘，从而达到理想的网站优化目标。

6、此算法分类结果的准确度更符合经验值；

7、此算法综合了模型概率分布函数对关键词进一步聚类，得到的结果更加精确。

8、避免了聚类结果过早收敛问题，同时进一步验证了聚类结果的准确性。

附图说明

图1新的模型聚类算法实现搜索引擎优化技术结构流程图

图2新的模型聚类算法在聚类分析中的应用流程图

具体实施方式

为了解决关键词优化实现搜索引擎优化的技术问题，结合图1-图2对本发明进行了详细说明，其具体实施步骤如下：

步骤3：针对筛选降维后的关键词集合，通过搜索引擎搜索关键词对应的页面，这里记录首页网页数和总搜索页面数，即每个关键词由五维向量再降维为四维的，其具体计算过程如下：

这里相关关键词个数为m，既有下列m×5矩阵：

N_i、Ld_i、CPC_i、N_iS、N_iY依次为第i个关键词对应的本国每月搜索量、竞争程度、估算每次点击费用(CPC)、首页网页数、总搜索页面数。

再降维为四维，即

X_{i∈(1，2，…，m)}为搜索效能，Z_{i∈(1，2，…，m)}为价值率，即为下式：

步骤4.1：利用基于ε领域的k-means算法初始化簇，筛选出k簇；

构建随机隶属矩阵J为m×k：

w_ij为关键词i属于j类的程度系数，即j∈(1，2，…，k)、i∈(1，2，…，m)。

隶属的整个约束条件为：

根据ε领域数据对象紧凑度函数，构建带有m个约束式的拉格朗日算子方程组，即有下式：

上式n_εj为j类数据对象个数，x_ih为第i关键词所对应的向量，y_jh为j类簇中心向量，为关键词i属性的平均值，为j类簇中心属性的平均值，h为关键词属性的个数，h＝4；λ_i(i＝1，…，m)是m个约束式的拉格朗日算子，对上述式子进行求导，对所有输入参量求导，即可求得使J达到最大的必要条件c_j、w_ij：

步骤4.4：根据判定函数w_ij、c_j、Δ(J)的大小来确定迭代的结束，其具体计算过程如下：

Δ(J)＝J^new-J^old＜θ

Δw_ij＜μ

Δc_j＜γ

上式J^new为当前迭代的紧凑度函数值，J^old为上一次紧凑度函数的值，Δw_ij为前后迭代的隶属变化值，Δc_j为前后迭代的类中心变化值，θ、μ、γ为足够小的阈值。只有满足上述三个条件，则迭代结束，输出最佳聚类结果。

步骤4.5：根据概率函数P_i∈j重新归类，其具体计算过程如下：

概率函数：

上式p(i/j)服从(μ_j，σ_j ²)的正态分布，且μ_j、σ_j是随簇中心变化，n_j为类j数据对象的个数，x_i为关键词i；

步骤4.6：根据步骤4.5得到的分类结果，得到这几个参数模型，其具体计算结果如下：

步骤4.7：重复执行步骤4.5、步骤4.6两步，直到算法收敛为止，其具体计算过程如下：

根据初始的(μ_j，σ_j ²)计算出P(i∈j)，再更新正态分布参数μ_j、σ_j，根据下列判别式进一步刷选最佳分类；

Δ(μ_j)＜α

Δσ_j＜β

Δp(j)＜δ

Δ(μ_j)、Δσ_j、Δp(j)分别为概率分布的期望变化量、标准差变化量、类j变化量，α、β、δ为足够小的数，当迭代结果满足以上三个约束条件，则进一步找到最佳聚类结果。

Claims

1.新的模型聚类算法实现搜索引擎优化技术，本发明涉及语义网络技术领域，具体涉及新的模型聚类算法实现搜索引擎优化技术，其特征是，包括如下步骤：

步骤1：根据企业业务确定核心关键词，利用搜索引擎搜集相关关键字，这些关键字在搜索引擎中有相应数据项，如本国每月搜索量、竞争程度和估算每次点击费用等

这里相关关键词个数为m,既有下列矩阵：

、、、、依次为第i个关键词对应的本国每月搜索量、竞争程度、估算每次点击费用（CPC）、首页网页数、总搜索页面数再降维

为四维，即

为搜索效能，为价值率，即为下式：

步骤4.1：利用基于领域的k-means算法初始化簇，分为k簇；

步骤4.3：构建k类紧凑度函数J，综合隶属约束条件，构建m个方程组，对其进行求解，即可求出使紧凑度函数J最大的必要条件、；

步骤4.4：根据判定函数、、的大小来确定迭代的结束；

步骤4.5：根据概率函数重新归类；

2.根据权利要求1中所述的新的模型聚类算法实现搜索引擎优化技术，其特征是，以上所述步骤4中的具体计算过程如下：

步骤4.1：利用基于领域的k-means算法初始化簇，筛选出k簇；

构建随机隶属矩阵J为：

为关键词i属于j类的程度系数，即

隶属的整个约束条件为：

根据领域数据对象紧凑度函数，构建带有m个约束式的拉格朗日算子方程组，即有下式：

上式为j类数据对象个数，为第i关键词所对应的向量，为j类簇中心向量，为关键词i属性的平均值，为j类簇中心属性的平均值，为关键词属性的个数，h=4；是m个约束式的拉格朗日算子，对上述式子进行求导，对所有输入参量求导，即可求得使J达到最大的必要条件、：

步骤4.4：根据判定函数、、的大小来确定迭代的结束，其具体计算过程如下：

上式为当前迭代的紧凑度函数值，为上一次紧凑度函数的值，为前后迭代的隶属变化值，为前后迭代的类中心变化值，、、为足够小的阈值，只有满足上述三个条件，则迭代结束，输出最佳聚类结果

步骤4.5：根据概率函数重新归类，其具体计算过程如下：

概率函数：

上式服从的正态分布，且、是随簇中心变化，为类j数据对象的个数，为关键词i；

根据初始的计算出，再更新正态分布参数、，根据下列判别式进一步刷选最佳分类；

、、分别为概率分布的期望变化量、标准差变化量、类j变化量，、、为足够小的数，当迭代结果满足以上三个约束条件，则进一步找到最佳聚类结果。