CN106933950A - 新的模型聚类算法实现搜索引擎优化技术 - Google Patents

新的模型聚类算法实现搜索引擎优化技术 Download PDF

Info

Publication number
CN106933950A
CN106933950A CN201710046017.4A CN201710046017A CN106933950A CN 106933950 A CN106933950 A CN 106933950A CN 201710046017 A CN201710046017 A CN 201710046017A CN 106933950 A CN106933950 A CN 106933950A
Authority
CN
China
Prior art keywords
keyword
search engine
algorithm
function
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710046017.4A
Other languages
English (en)
Inventor
金平艳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan Yonglian Information Technology Co Ltd
Original Assignee
Sichuan Yonglian Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan Yonglian Information Technology Co Ltd filed Critical Sichuan Yonglian Information Technology Co Ltd
Priority to CN201710046017.4A priority Critical patent/CN106933950A/zh
Publication of CN106933950A publication Critical patent/CN106933950A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Probability & Statistics with Applications (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

新的模型聚类算法实现搜索引擎优化技术,根据企业业务确定核心关键词,搜索关键词对应的数据项,如本国每月搜索量、竞争程度和估算每次点击费用等,对上述关键词集合进行再降维处理,每个关键词用一五维向量表示,即增加首页网页数和总搜索页面数,进而由五维再降为四维,利用新的模型聚类算法,再计算满足紧凑度函数J最大的必要条件的基础上,再加些模型约束参数,根据模型约束参数的收敛性,判定最佳聚类结果,本发明综合了模型概率分布函数,使聚类结果的精确度更高、避免了聚类结果过早收敛问题、运行时间复杂度低、处理速度更快、聚类结果准确、可以快速提升关键词排名、为企业网站带来一定的流量、从而达到理想的网站优化目标。

Description

新的模型聚类算法实现搜索引擎优化技术
技术领域
本发明涉及语义网络技术领域,具体涉及新的模型聚类算法实现搜索引擎优化技术。
背景技术
众多网络信息丰富了人们的信息来源,也给人们快速获取信息造成了困扰。搜索引擎精准化、人性化的信息检索服务被广大使用者认可。目前不少研究发现,搜索引擎用户一般只会关注搜索结果页面中排名靠前的网站,这些网站的点击率也相对高些。搜索引擎优化,简称通俗的讲是通过对网站整体架构,网页内容、关键词以及网页内的链接进行相关的优化工作,提高其在特定搜索引擎上搜索结果中的排名,从而提高网站访问量,最终提升网站的销售能力或宣传能力的技术。目前关于搜索引擎优化方法的理论研究已较为丰富,如黑帽技术和白帽技术,搜索引擎优化策略,分别是域名策略、网页设计规划策略、关键词策略以及链接策略。企业可以根据自己的搜索引擎优化目的,有针对性的采取相应的优化方法。通过不断尝试,定期更新查看,发现属于企业自身的优化方法,使企业提高自然排名,更好地应对互联网大潮的冲击,从而提高竞争优势。SEO归根结底是关键词的优化策略,现今国内外对关键词优化的理论研究和技术应用比较多,但暂未提出一个有效的方法来简化关键词分析流程,也没有一个完善的机制来管理关键词优化策略和进度。基于上述需求,本发明提供了一种新的模型聚类算法实现搜索引擎优化技术。
发明内容
针对于关键词优化实现搜索引擎优化的技术问题,本发明提供了一种新的模型聚类算法实现搜索引擎优化技术。
为了解决上述问题,本发明是通过以下技术方案实现的:
步骤1:根据企业业务确定核心关键词,利用搜索引擎搜集相关关键字,这些关键字在搜索引擎中有相应数据项,如本国每月搜索量、竞争程度和估算每次点击费用(CPC)等
步骤2:结合企业产品和市场分析,筛选降维上述搜索到的相关关键字集合;
步骤3:针对筛选降维后的关键词集合,通过搜索引擎搜索关键词对应的页面,这里记录首页网页数和总搜索页面数,即每个关键词由五维向量再降维为四维的。
步骤4:利用新的模型聚类算法,对上述关键词进行聚类处理,其具体子步骤如下:
步骤4.1:利用基于ε领域的k-means算法初始化簇,分为k簇;
步骤4.2:用值[0,1]间的随机数初始化隶属矩阵J,使其满足隶属的整个约束条件;
步骤4.3:构建k类紧凑度函数J,综合隶属约束条件,构建m个方程组,对其进行求解,即可求出使紧凑度函数J最大的必要条件cj、wij
步骤4.4:根据判定函数wij、cj、Δ(J)的大小来确定迭代的结束;
步骤4.5:根据概率函数Pi∈j重新归类;
步骤4.6:根据步骤4.2得到的分类结果,得到这几个参数模型;
步骤4.7:重复执行步骤4.2、步骤4.3两步,直到算法收敛为止;
步骤5:根据企业具体情况,综合关键词效能优化和价值率优化,选择合适的关键词优化策略达到网站优化目标。
本发明有益效果是:
1,此算法可以精简关键词分析流程,进而减少整个网站优化工作量。
2,此算法的运行时间复杂度低,处理速度更快。
3、此算法具有更大的利用价值。
4、能帮助网站在短时间内快速提升其关键词的排名。
5、为企业网站带来一定的流量和询盘,从而达到理想的网站优化目标。
6、此算法分类结果的准确度更符合经验值;
7、此算法综合了模型概率分布函数对关键词进一步聚类,得到的结果更加精确。
8、避免了聚类结果过早收敛问题,同时进一步验证了聚类结果的准确性。
附图说明
图1新的模型聚类算法实现搜索引擎优化技术结构流程图
图2新的模型聚类算法在聚类分析中的应用流程图
具体实施方式
为了解决关键词优化实现搜索引擎优化的技术问题,结合图1-图2对本发明进行了详细说明,其具体实施步骤如下:
步骤1:根据企业业务确定核心关键词,利用搜索引擎搜集相关关键字,这些关键字在搜索引擎中有相应数据项,如本国每月搜索量、竞争程度和估算每次点击费用(CPC)等
步骤2:结合企业产品和市场分析,筛选降维上述搜索到的相关关键字集合;
步骤3:针对筛选降维后的关键词集合,通过搜索引擎搜索关键词对应的页面,这里记录首页网页数和总搜索页面数,即每个关键词由五维向量再降维为四维的,其具体计算过程如下:
这里相关关键词个数为m,既有下列m×5矩阵:
Ni、Ldi、CPCi、NiS、NiY依次为第i个关键词对应的本国每月搜索量、竞争程度、估算每次点击费用(CPC)、首页网页数、总搜索页面数。
再降维为四维,即
Xi∈(1,2,…,m)为搜索效能,Zi∈(1,2,…,m)为价值率,即为下式:
步骤4:利用新的模型聚类算法,对上述关键词进行聚类处理,其具体子步骤如下:
步骤4.1:利用基于ε领域的k-means算法初始化簇,筛选出k簇;
步骤4.2:用值[0,1]间的随机数初始化隶属矩阵J,使其满足隶属的整个约束条件;
构建随机隶属矩阵J为m×k:
wij为关键词i属于j类的程度系数,即j∈(1,2,…,k)、i∈(1,2,…,m)。
隶属的整个约束条件为:
步骤4.3:构建k类紧凑度函数J,综合隶属约束条件,构建m个方程组,对其进行求解,即可求出使紧凑度函数J最大的必要条件cj、wij
根据ε领域数据对象紧凑度函数,构建带有m个约束式的拉格朗日算子方程组,即有下式:
上式nεj为j类数据对象个数,xih为第i关键词所对应的向量,yjh为j类簇中心向量,为关键词i属性的平均值,为j类簇中心属性的平均值,h为关键词属性的个数,h=4;λi(i=1,…,m)是m个约束式的拉格朗日算子,对上述式子进行求导,对所有输入参量求导,即可求得使J达到最大的必要条件cj、wij
步骤4.4:根据判定函数wij、cj、Δ(J)的大小来确定迭代的结束,其具体计算过程如下:
Δ(J)=Jnew-Jold<θ
Δwij<μ
Δcj<γ
上式Jnew为当前迭代的紧凑度函数值,Jold为上一次紧凑度函数的值,Δwij为前后迭代的隶属变化值,Δcj为前后迭代的类中心变化值,θ、μ、γ为足够小的阈值。只有满足上述三个条件,则迭代结束,输出最佳聚类结果。
步骤4.5:根据概率函数Pi∈j重新归类,其具体计算过程如下:
概率函数:
上式p(i/j)服从(μj,σj 2)的正态分布,且μj、σj是随簇中心变化,nj为类j数据对象的个数,xi为关键词i;
步骤4.6:根据步骤4.5得到的分类结果,得到这几个参数模型,其具体计算结果如下:
步骤4.7:重复执行步骤4.5、步骤4.6两步,直到算法收敛为止,其具体计算过程如下:
根据初始的(μj,σj 2)计算出P(i∈j),再更新正态分布参数μj、σj,根据下列判别式进一步刷选最佳分类;
Δ(μj)<α
Δσj<β
Δp(j)<δ
Δ(μj)、Δσj、Δp(j)分别为概率分布的期望变化量、标准差变化量、类j变化量,α、β、δ为足够小的数,当迭代结果满足以上三个约束条件,则进一步找到最佳聚类结果。
步骤5:根据企业具体情况,综合关键词效能优化和价值率优化,选择合适的关键词优化策略达到网站优化目标。

Claims (2)

1.新的模型聚类算法实现搜索引擎优化技术,本发明涉及语义网络技术领域,具体涉及新的模型聚类算法实现搜索引擎优化技术,其特征是,包括如下步骤:
步骤1:根据企业业务确定核心关键词,利用搜索引擎搜集相关关键字,这些关键字在搜索引擎中有相应数据项,如本国每月搜索量、竞争程度和估算每次点击费用
步骤2:结合企业产品和市场分析,筛选降维上述搜索到的相关关键字集合;
步骤3:针对筛选降维后的关键词集合,通过搜索引擎搜索关键词对应的页面,这里记录首页网页数和总搜索页面数,即每个关键词由五维向量再降维为四维的,其具体计算过程如下:
这里相关关键词个数为m,既有下列矩阵:
依次为第i个关键词对应的本国每月搜索量、竞争程度、估算每次点击费用(CPC)、首页网页数、总搜索页面数再降维
为四维,即
为搜索效能,为价值率,即为下式:
步骤4:利用新的模型聚类算法,对上述关键词进行聚类处理,其具体子步骤如下:
步骤4.1:利用基于领域的k-means算法初始化簇,分为k簇;
步骤4.2:用值[0,1]间的随机数初始化隶属矩阵J,使其满足隶属的整个约束条件 ;
步骤4.3:构建k类紧凑度函数J,综合隶属约束条件,构建m个方程组,对其进行求解,即可求出使紧凑度函数J最大的必要条件
步骤4.4:根据判定函数的大小来确定迭代的结束;
步骤4.5:根据概率函数重新归类;
步骤4.6:根据步骤4.2得到的分类结果,得到这几个参数模型;
步骤4.7:重复执行步骤4.2、步骤4.3两步,直到算法收敛为止;
步骤5:根据企业具体情况,综合关键词效能优化和价值率优化,选择合适的关键词优化策略达到网站优化目标。
2.根据权利要求1中所述的新的模型聚类算法实现搜索引擎优化技术,其特征是,以上所述步骤4中的具体计算过程如下:
步骤4:利用新的模型聚类算法,对上述关键词进行聚类处理,其具体子步骤如下:
步骤4.1:利用基于领域的k-means算法初始化簇,筛选出k簇;
步骤4.2:用值[0,1]间的随机数初始化隶属矩阵J,使其满足隶属的整个约束条件 ;
构建随机隶属矩阵J为
为关键词i属于j类的程度系数,即
隶属的整个约束条件为:
步骤4.3:构建k类紧凑度函数J,综合隶属约束条件,构建m个方程组,对其进行求解,即可求出使紧凑度函数J最大的必要条件
根据领域数据对象紧凑度函数,构建带有m个约束式的拉格朗日算子方程组,即有下式:
上式为j类数据对象个数,为第i关键词所对应的向量,为j类簇中心向量,为关键词i属性的平均值,为j类簇中心属性的平均值, 为关键词属性的个数,h=4;是m个约束式的拉格朗日算子,对上述式子进行求导,对所有输入参量求导,即可求得使J达到最大的必要条件
步骤4.4:根据判定函数的大小来确定迭代的结束,其具体计算过程如下:
上式为当前迭代的紧凑度函数值,为上一次紧凑度函数的值, 为前后迭代的隶属变化值,为前后迭代的类中心变化值,为足够小的阈值,只有满足上述三个条件,则迭代结束,输出最佳聚类结果
步骤4.5:根据概率函数重新归类,其具体计算过程如下:
概率函数:
上式服从 的正态分布,且是随簇中心变化,为类j数据对象的个数,为关键词i;
步骤4.6:根据步骤4.5得到的分类结果,得到这几个参数模型,其具体计算结果如下:
步骤4.7:重复执行步骤4.5、步骤4.6两步,直到算法收敛为止,其具体计算过程如下:
根据初始的计算出,再更新正态分布参数,根据下列判别式进一步刷选最佳分类;
分别为概率分布的期望变化量、标准差变化量、类j变化量,为足够小的数,当迭代结果满足以上三个约束条件,则进一步找到最佳聚类结果。
CN201710046017.4A 2017-01-22 2017-01-22 新的模型聚类算法实现搜索引擎优化技术 Pending CN106933950A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710046017.4A CN106933950A (zh) 2017-01-22 2017-01-22 新的模型聚类算法实现搜索引擎优化技术

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710046017.4A CN106933950A (zh) 2017-01-22 2017-01-22 新的模型聚类算法实现搜索引擎优化技术

Publications (1)

Publication Number Publication Date
CN106933950A true CN106933950A (zh) 2017-07-07

Family

ID=59423989

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710046017.4A Pending CN106933950A (zh) 2017-01-22 2017-01-22 新的模型聚类算法实现搜索引擎优化技术

Country Status (1)

Country Link
CN (1) CN106933950A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108509426A (zh) * 2018-04-11 2018-09-07 焦点科技股份有限公司 一种深度多维度流量语义分析方法
CN115170818A (zh) * 2022-07-27 2022-10-11 北京拙河科技有限公司 一种动态帧画面特征提取方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103218435A (zh) * 2013-04-15 2013-07-24 上海嘉之道企业管理咨询有限公司 一种中文文本数据聚类方法及系统
CN103258000A (zh) * 2013-03-29 2013-08-21 北界创想(北京)软件有限公司 对网页中高频关键词进行聚类的方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103258000A (zh) * 2013-03-29 2013-08-21 北界创想(北京)软件有限公司 对网页中高频关键词进行聚类的方法及装置
CN103218435A (zh) * 2013-04-15 2013-07-24 上海嘉之道企业管理咨询有限公司 一种中文文本数据聚类方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
林元国 等: "K-means算法在关键词优化中的应用", 《计算机系统应用》 *
邓健爽 等: "基于搜索引擎的关键词自动聚类法", 《计算机科学》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108509426A (zh) * 2018-04-11 2018-09-07 焦点科技股份有限公司 一种深度多维度流量语义分析方法
CN115170818A (zh) * 2022-07-27 2022-10-11 北京拙河科技有限公司 一种动态帧画面特征提取方法及装置

Similar Documents

Publication Publication Date Title
CN110674407B (zh) 基于图卷积神经网络的混合推荐方法
WO2021109464A1 (zh) 一种面向大规模用户的个性化教学资源推荐方法
CN104239496B (zh) 一种结合模糊权重相似性度量和聚类协同过滤的方法
CN110020128A (zh) 一种搜索结果排序方法及装置
CN106933954A (zh) 基于决策树分类算法实现搜索引擎优化技术
CN108563690A (zh) 一种基于面向对象聚类的协同过滤推荐方法
CN107833142A (zh) 学术社交网络科研合作者推荐方法
Yu et al. Graph neural network based model for multi-behavior session-based recommendation
WO2023179689A1 (zh) 一种面向物联网的基于知识图谱的推荐方法
CN103761286B (zh) 一种基于用户兴趣的服务资源检索方法
Liu et al. Learning to rank complex network node based on the self-supervised graph convolution model
CN106649616A (zh) 一种聚类算法实现搜索引擎关键词优化
CN106933953A (zh) 一种模糊k均值聚类算法实现搜索引擎优化技术
CN106909626A (zh) 改进的决策树分类算法实现搜索引擎优化技术
CN106933950A (zh) 新的模型聚类算法实现搜索引擎优化技术
CN106874376A (zh) 一种验证搜索引擎关键词优化技术的方法
Gu et al. Combining user-end and item-end knowledge graph learning for personalized recommendation
CN106897376A (zh) 基于蚁群的模糊c均值算法实现关键词优化
Meng et al. A diverse and personalized poi recommendation approach by integrating geo-social embedding relations
CN106897356A (zh) 改进的模糊c‑均值算法实现搜索引擎关键词优化
CN106933951A (zh) 改进的模型聚类算法实现搜索引擎优化技术
CN106874377A (zh) 改进的基于约束条件的聚类算法实现搜索引擎关键词优化
CN106649537A (zh) 基于改进的群智能算法实现搜索引擎关键词优化技术
CN106802945A (zh) 基于VSM的模糊c均值聚类算法实现搜索引擎关键词优化
Liu et al. Research on post-match score mechanism of players based on artificial intelligence and clustering regression model

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170707

WD01 Invention patent application deemed withdrawn after publication