CN106933950A - 新的模型聚类算法实现搜索引擎优化技术 - Google Patents
新的模型聚类算法实现搜索引擎优化技术 Download PDFInfo
- Publication number
- CN106933950A CN106933950A CN201710046017.4A CN201710046017A CN106933950A CN 106933950 A CN106933950 A CN 106933950A CN 201710046017 A CN201710046017 A CN 201710046017A CN 106933950 A CN106933950 A CN 106933950A
- Authority
- CN
- China
- Prior art keywords
- keyword
- search engine
- algorithm
- function
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/955—Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Probability & Statistics with Applications (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
新的模型聚类算法实现搜索引擎优化技术,根据企业业务确定核心关键词,搜索关键词对应的数据项,如本国每月搜索量、竞争程度和估算每次点击费用等,对上述关键词集合进行再降维处理,每个关键词用一五维向量表示,即增加首页网页数和总搜索页面数,进而由五维再降为四维,利用新的模型聚类算法,再计算满足紧凑度函数J最大的必要条件、的基础上,再加些模型约束参数,根据模型约束参数的收敛性,判定最佳聚类结果,本发明综合了模型概率分布函数,使聚类结果的精确度更高、避免了聚类结果过早收敛问题、运行时间复杂度低、处理速度更快、聚类结果准确、可以快速提升关键词排名、为企业网站带来一定的流量、从而达到理想的网站优化目标。
Description
技术领域
本发明涉及语义网络技术领域,具体涉及新的模型聚类算法实现搜索引擎优化技术。
背景技术
众多网络信息丰富了人们的信息来源,也给人们快速获取信息造成了困扰。搜索引擎精准化、人性化的信息检索服务被广大使用者认可。目前不少研究发现,搜索引擎用户一般只会关注搜索结果页面中排名靠前的网站,这些网站的点击率也相对高些。搜索引擎优化,简称通俗的讲是通过对网站整体架构,网页内容、关键词以及网页内的链接进行相关的优化工作,提高其在特定搜索引擎上搜索结果中的排名,从而提高网站访问量,最终提升网站的销售能力或宣传能力的技术。目前关于搜索引擎优化方法的理论研究已较为丰富,如黑帽技术和白帽技术,搜索引擎优化策略,分别是域名策略、网页设计规划策略、关键词策略以及链接策略。企业可以根据自己的搜索引擎优化目的,有针对性的采取相应的优化方法。通过不断尝试,定期更新查看,发现属于企业自身的优化方法,使企业提高自然排名,更好地应对互联网大潮的冲击,从而提高竞争优势。SEO归根结底是关键词的优化策略,现今国内外对关键词优化的理论研究和技术应用比较多,但暂未提出一个有效的方法来简化关键词分析流程,也没有一个完善的机制来管理关键词优化策略和进度。基于上述需求,本发明提供了一种新的模型聚类算法实现搜索引擎优化技术。
发明内容
针对于关键词优化实现搜索引擎优化的技术问题,本发明提供了一种新的模型聚类算法实现搜索引擎优化技术。
为了解决上述问题,本发明是通过以下技术方案实现的:
步骤1:根据企业业务确定核心关键词,利用搜索引擎搜集相关关键字,这些关键字在搜索引擎中有相应数据项,如本国每月搜索量、竞争程度和估算每次点击费用(CPC)等
步骤2:结合企业产品和市场分析,筛选降维上述搜索到的相关关键字集合;
步骤3:针对筛选降维后的关键词集合,通过搜索引擎搜索关键词对应的页面,这里记录首页网页数和总搜索页面数,即每个关键词由五维向量再降维为四维的。
步骤4:利用新的模型聚类算法,对上述关键词进行聚类处理,其具体子步骤如下:
步骤4.1:利用基于ε领域的k-means算法初始化簇,分为k簇;
步骤4.2:用值[0,1]间的随机数初始化隶属矩阵J,使其满足隶属的整个约束条件;
步骤4.3:构建k类紧凑度函数J,综合隶属约束条件,构建m个方程组,对其进行求解,即可求出使紧凑度函数J最大的必要条件cj、wij;
步骤4.4:根据判定函数wij、cj、Δ(J)的大小来确定迭代的结束;
步骤4.5:根据概率函数Pi∈j重新归类;
步骤4.6:根据步骤4.2得到的分类结果,得到这几个参数模型;
步骤4.7:重复执行步骤4.2、步骤4.3两步,直到算法收敛为止;
步骤5:根据企业具体情况,综合关键词效能优化和价值率优化,选择合适的关键词优化策略达到网站优化目标。
本发明有益效果是:
1,此算法可以精简关键词分析流程,进而减少整个网站优化工作量。
2,此算法的运行时间复杂度低,处理速度更快。
3、此算法具有更大的利用价值。
4、能帮助网站在短时间内快速提升其关键词的排名。
5、为企业网站带来一定的流量和询盘,从而达到理想的网站优化目标。
6、此算法分类结果的准确度更符合经验值;
7、此算法综合了模型概率分布函数对关键词进一步聚类,得到的结果更加精确。
8、避免了聚类结果过早收敛问题,同时进一步验证了聚类结果的准确性。
附图说明
图1新的模型聚类算法实现搜索引擎优化技术结构流程图
图2新的模型聚类算法在聚类分析中的应用流程图
具体实施方式
为了解决关键词优化实现搜索引擎优化的技术问题,结合图1-图2对本发明进行了详细说明,其具体实施步骤如下:
步骤1:根据企业业务确定核心关键词,利用搜索引擎搜集相关关键字,这些关键字在搜索引擎中有相应数据项,如本国每月搜索量、竞争程度和估算每次点击费用(CPC)等
步骤2:结合企业产品和市场分析,筛选降维上述搜索到的相关关键字集合;
步骤3:针对筛选降维后的关键词集合,通过搜索引擎搜索关键词对应的页面,这里记录首页网页数和总搜索页面数,即每个关键词由五维向量再降维为四维的,其具体计算过程如下:
这里相关关键词个数为m,既有下列m×5矩阵:
Ni、Ldi、CPCi、NiS、NiY依次为第i个关键词对应的本国每月搜索量、竞争程度、估算每次点击费用(CPC)、首页网页数、总搜索页面数。
再降维为四维,即
Xi∈(1,2,…,m)为搜索效能,Zi∈(1,2,…,m)为价值率,即为下式:
步骤4:利用新的模型聚类算法,对上述关键词进行聚类处理,其具体子步骤如下:
步骤4.1:利用基于ε领域的k-means算法初始化簇,筛选出k簇;
步骤4.2:用值[0,1]间的随机数初始化隶属矩阵J,使其满足隶属的整个约束条件;
构建随机隶属矩阵J为m×k:
wij为关键词i属于j类的程度系数,即j∈(1,2,…,k)、i∈(1,2,…,m)。
隶属的整个约束条件为:
步骤4.3:构建k类紧凑度函数J,综合隶属约束条件,构建m个方程组,对其进行求解,即可求出使紧凑度函数J最大的必要条件cj、wij;
根据ε领域数据对象紧凑度函数,构建带有m个约束式的拉格朗日算子方程组,即有下式:
上式nεj为j类数据对象个数,xih为第i关键词所对应的向量,yjh为j类簇中心向量,为关键词i属性的平均值,为j类簇中心属性的平均值,h为关键词属性的个数,h=4;λi(i=1,…,m)是m个约束式的拉格朗日算子,对上述式子进行求导,对所有输入参量求导,即可求得使J达到最大的必要条件cj、wij:
步骤4.4:根据判定函数wij、cj、Δ(J)的大小来确定迭代的结束,其具体计算过程如下:
Δ(J)=Jnew-Jold<θ
Δwij<μ
Δcj<γ
上式Jnew为当前迭代的紧凑度函数值,Jold为上一次紧凑度函数的值,Δwij为前后迭代的隶属变化值,Δcj为前后迭代的类中心变化值,θ、μ、γ为足够小的阈值。只有满足上述三个条件,则迭代结束,输出最佳聚类结果。
步骤4.5:根据概率函数Pi∈j重新归类,其具体计算过程如下:
概率函数:
上式p(i/j)服从(μj,σj 2)的正态分布,且μj、σj是随簇中心变化,nj为类j数据对象的个数,xi为关键词i;
步骤4.6:根据步骤4.5得到的分类结果,得到这几个参数模型,其具体计算结果如下:
步骤4.7:重复执行步骤4.5、步骤4.6两步,直到算法收敛为止,其具体计算过程如下:
根据初始的(μj,σj 2)计算出P(i∈j),再更新正态分布参数μj、σj,根据下列判别式进一步刷选最佳分类;
Δ(μj)<α
Δσj<β
Δp(j)<δ
Δ(μj)、Δσj、Δp(j)分别为概率分布的期望变化量、标准差变化量、类j变化量,α、β、δ为足够小的数,当迭代结果满足以上三个约束条件,则进一步找到最佳聚类结果。
步骤5:根据企业具体情况,综合关键词效能优化和价值率优化,选择合适的关键词优化策略达到网站优化目标。
Claims (2)
1.新的模型聚类算法实现搜索引擎优化技术,本发明涉及语义网络技术领域,具体涉及新的模型聚类算法实现搜索引擎优化技术,其特征是,包括如下步骤:
步骤1:根据企业业务确定核心关键词,利用搜索引擎搜集相关关键字,这些关键字在搜索引擎中有相应数据项,如本国每月搜索量、竞争程度和估算每次点击费用等
步骤2:结合企业产品和市场分析,筛选降维上述搜索到的相关关键字集合;
步骤3:针对筛选降维后的关键词集合,通过搜索引擎搜索关键词对应的页面,这里记录首页网页数和总搜索页面数,即每个关键词由五维向量再降维为四维的,其具体计算过程如下:
这里相关关键词个数为m,既有下列矩阵:
、、、、依次为第i个关键词对应的本国每月搜索量、竞争程度、估算每次点击费用(CPC)、首页网页数、总搜索页面数再降维
为四维,即
为搜索效能,为价值率,即为下式:
步骤4:利用新的模型聚类算法,对上述关键词进行聚类处理,其具体子步骤如下:
步骤4.1:利用基于领域的k-means算法初始化簇,分为k簇;
步骤4.2:用值[0,1]间的随机数初始化隶属矩阵J,使其满足隶属的整个约束条件 ;
步骤4.3:构建k类紧凑度函数J,综合隶属约束条件,构建m个方程组,对其进行求解,即可求出使紧凑度函数J最大的必要条件、;
步骤4.4:根据判定函数、、的大小来确定迭代的结束;
步骤4.5:根据概率函数重新归类;
步骤4.6:根据步骤4.2得到的分类结果,得到这几个参数模型;
步骤4.7:重复执行步骤4.2、步骤4.3两步,直到算法收敛为止;
步骤5:根据企业具体情况,综合关键词效能优化和价值率优化,选择合适的关键词优化策略达到网站优化目标。
2.根据权利要求1中所述的新的模型聚类算法实现搜索引擎优化技术,其特征是,以上所述步骤4中的具体计算过程如下:
步骤4:利用新的模型聚类算法,对上述关键词进行聚类处理,其具体子步骤如下:
步骤4.1:利用基于领域的k-means算法初始化簇,筛选出k簇;
步骤4.2:用值[0,1]间的随机数初始化隶属矩阵J,使其满足隶属的整个约束条件 ;
构建随机隶属矩阵J为:
为关键词i属于j类的程度系数,即
隶属的整个约束条件为:
步骤4.3:构建k类紧凑度函数J,综合隶属约束条件,构建m个方程组,对其进行求解,即可求出使紧凑度函数J最大的必要条件、;
根据领域数据对象紧凑度函数,构建带有m个约束式的拉格朗日算子方程组,即有下式:
上式为j类数据对象个数,为第i关键词所对应的向量,为j类簇中心向量,为关键词i属性的平均值,为j类簇中心属性的平均值, 为关键词属性的个数,h=4;是m个约束式的拉格朗日算子,对上述式子进行求导,对所有输入参量求导,即可求得使J达到最大的必要条件、:
步骤4.4:根据判定函数、、的大小来确定迭代的结束,其具体计算过程如下:
上式为当前迭代的紧凑度函数值,为上一次紧凑度函数的值, 为前后迭代的隶属变化值,为前后迭代的类中心变化值,、、为足够小的阈值,只有满足上述三个条件,则迭代结束,输出最佳聚类结果
步骤4.5:根据概率函数重新归类,其具体计算过程如下:
概率函数:
上式服从 的正态分布,且、是随簇中心变化,为类j数据对象的个数,为关键词i;
步骤4.6:根据步骤4.5得到的分类结果,得到这几个参数模型,其具体计算结果如下:
步骤4.7:重复执行步骤4.5、步骤4.6两步,直到算法收敛为止,其具体计算过程如下:
根据初始的计算出,再更新正态分布参数、,根据下列判别式进一步刷选最佳分类;
、、分别为概率分布的期望变化量、标准差变化量、类j变化量,、、为足够小的数,当迭代结果满足以上三个约束条件,则进一步找到最佳聚类结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710046017.4A CN106933950A (zh) | 2017-01-22 | 2017-01-22 | 新的模型聚类算法实现搜索引擎优化技术 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710046017.4A CN106933950A (zh) | 2017-01-22 | 2017-01-22 | 新的模型聚类算法实现搜索引擎优化技术 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106933950A true CN106933950A (zh) | 2017-07-07 |
Family
ID=59423989
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710046017.4A Pending CN106933950A (zh) | 2017-01-22 | 2017-01-22 | 新的模型聚类算法实现搜索引擎优化技术 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106933950A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108509426A (zh) * | 2018-04-11 | 2018-09-07 | 焦点科技股份有限公司 | 一种深度多维度流量语义分析方法 |
CN115170818A (zh) * | 2022-07-27 | 2022-10-11 | 北京拙河科技有限公司 | 一种动态帧画面特征提取方法及装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103218435A (zh) * | 2013-04-15 | 2013-07-24 | 上海嘉之道企业管理咨询有限公司 | 一种中文文本数据聚类方法及系统 |
CN103258000A (zh) * | 2013-03-29 | 2013-08-21 | 北界创想(北京)软件有限公司 | 对网页中高频关键词进行聚类的方法及装置 |
-
2017
- 2017-01-22 CN CN201710046017.4A patent/CN106933950A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103258000A (zh) * | 2013-03-29 | 2013-08-21 | 北界创想(北京)软件有限公司 | 对网页中高频关键词进行聚类的方法及装置 |
CN103218435A (zh) * | 2013-04-15 | 2013-07-24 | 上海嘉之道企业管理咨询有限公司 | 一种中文文本数据聚类方法及系统 |
Non-Patent Citations (2)
Title |
---|
林元国 等: "K-means算法在关键词优化中的应用", 《计算机系统应用》 * |
邓健爽 等: "基于搜索引擎的关键词自动聚类法", 《计算机科学》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108509426A (zh) * | 2018-04-11 | 2018-09-07 | 焦点科技股份有限公司 | 一种深度多维度流量语义分析方法 |
CN115170818A (zh) * | 2022-07-27 | 2022-10-11 | 北京拙河科技有限公司 | 一种动态帧画面特征提取方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110674407B (zh) | 基于图卷积神经网络的混合推荐方法 | |
WO2021109464A1 (zh) | 一种面向大规模用户的个性化教学资源推荐方法 | |
CN104239496B (zh) | 一种结合模糊权重相似性度量和聚类协同过滤的方法 | |
CN110020128A (zh) | 一种搜索结果排序方法及装置 | |
CN106933954A (zh) | 基于决策树分类算法实现搜索引擎优化技术 | |
CN108563690A (zh) | 一种基于面向对象聚类的协同过滤推荐方法 | |
CN107833142A (zh) | 学术社交网络科研合作者推荐方法 | |
Yu et al. | Graph neural network based model for multi-behavior session-based recommendation | |
WO2023179689A1 (zh) | 一种面向物联网的基于知识图谱的推荐方法 | |
CN103761286B (zh) | 一种基于用户兴趣的服务资源检索方法 | |
Liu et al. | Learning to rank complex network node based on the self-supervised graph convolution model | |
CN106649616A (zh) | 一种聚类算法实现搜索引擎关键词优化 | |
CN106933953A (zh) | 一种模糊k均值聚类算法实现搜索引擎优化技术 | |
CN106909626A (zh) | 改进的决策树分类算法实现搜索引擎优化技术 | |
CN106933950A (zh) | 新的模型聚类算法实现搜索引擎优化技术 | |
CN106874376A (zh) | 一种验证搜索引擎关键词优化技术的方法 | |
Gu et al. | Combining user-end and item-end knowledge graph learning for personalized recommendation | |
CN106897376A (zh) | 基于蚁群的模糊c均值算法实现关键词优化 | |
Meng et al. | A diverse and personalized poi recommendation approach by integrating geo-social embedding relations | |
CN106897356A (zh) | 改进的模糊c‑均值算法实现搜索引擎关键词优化 | |
CN106933951A (zh) | 改进的模型聚类算法实现搜索引擎优化技术 | |
CN106874377A (zh) | 改进的基于约束条件的聚类算法实现搜索引擎关键词优化 | |
CN106649537A (zh) | 基于改进的群智能算法实现搜索引擎关键词优化技术 | |
CN106802945A (zh) | 基于VSM的模糊c均值聚类算法实现搜索引擎关键词优化 | |
Liu et al. | Research on post-match score mechanism of players based on artificial intelligence and clustering regression model |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20170707 |
|
WD01 | Invention patent application deemed withdrawn after publication |