CN106933951A - 改进的模型聚类算法实现搜索引擎优化技术 - Google Patents

改进的模型聚类算法实现搜索引擎优化技术 Download PDF

Info

Publication number
CN106933951A
CN106933951A CN201710046154.8A CN201710046154A CN106933951A CN 106933951 A CN106933951 A CN 106933951A CN 201710046154 A CN201710046154 A CN 201710046154A CN 106933951 A CN106933951 A CN 106933951A
Authority
CN
China
Prior art keywords
keyword
search engine
algorithm
value
improved model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710046154.8A
Other languages
English (en)
Inventor
金平艳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan Yonglian Information Technology Co Ltd
Original Assignee
Sichuan Yonglian Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan Yonglian Information Technology Co Ltd filed Critical Sichuan Yonglian Information Technology Co Ltd
Priority to CN201710046154.8A priority Critical patent/CN106933951A/zh
Publication of CN106933951A publication Critical patent/CN106933951A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

改进的模型聚类算法实现搜索引擎优化技术,根据企业业务确定核心关键词,搜索关键词对应的数据项,如本国每月搜索量、竞争程度和估算每次点击费用等,对上述关键词集合进行再降维处理,每个关键词用一五维向量表示,即增加首页网页数和总搜索页面数,进而由五维再降为四维,利用改进的模型聚类算法,构建k类紧凑度函数J,求出满足紧凑度函数J最大的必要条件,本发明运行时间复杂度低、处理速度更快、聚类结果准确、可以快速提升关键词排名、为企业网站带来一定的流量、从而达到理想的网站优化目标。

Description

改进的模型聚类算法实现搜索引擎优化技术
技术领域
本发明涉及语义网络技术领域,具体涉及改进的模型聚类算法实现搜索引擎优化技术。
背景技术
随着互联网技术不断发展,网络信息量迅速增长,搜索引擎逐渐成为用户快速准确查找信息的主要工具。搜索引擎用户一般只会关注搜索结果页面中排名靠前的网站,这些网站的点击率也相对高些。搜索引擎优化(Search Engine Optimization,简称SEO)是企业根据搜索引擎的工作原理,在符合用户友好的基础上,对网站内外部进行相关优化,使搜索引擎收录更多的网页,提高网站在搜索引擎中的自然排名,从而增加网站访问量,最终实现网站的销售或提升网络品牌。目前关于搜索引擎优化方法的理论研究已较为丰富,如黑帽技术和白帽技术,搜索引擎优化策略,分别是域名策略、网页设计规划策略、关键词策略以及链接策略。SEO归根结底是关键词的优化策略,现今国内外对关键词优化的理论研究和技术应用比较多,但暂未提出一个有效的方法来简化关键词分析流程,也没有一个完善的机制来管理关键词优化策略和进度。基于上述需求,本发明提供了一种改进的模型聚类算法实现搜索引擎优化技术。
发明内容
针对于关键词优化实现搜索引擎优化的技术问题,本发明提供了一种改进的模型聚类算法实现搜索引擎优化技术。
为了解决上述问题,本发明是通过以下技术方案实现的:
步骤1:根据企业业务确定核心关键词,利用搜索引擎搜集相关关键字,这些关键字在搜索引擎中有相应数据项,如本国每月搜索量、竞争程度和估算每次点击费用(CPC)等
步骤2:结合企业产品和市场分析,筛选降维上述搜索到的相关关键字集合;
步骤3:针对筛选降维后的关键词集合,通过搜索引擎搜索关键词对应的页面,这里记录首页网页数和总搜索页面数,即每个关键词由五维向量再降维为四维的。
步骤4:利用改进的模型聚类算法,对上述关键词进行聚类处理,其具体子步骤如下:
步骤4.1:利用基于ε领域的k-means算法初始化簇,分为k簇;
步骤4.2:用值[0,1]间的随机数初始化隶属矩阵J,使其满足隶属的整个约束条件;
步骤4.3:构建k类紧凑度函数J,综合隶属约束条件,构建m个方程组,对其进行求解,即可求出使紧凑度函数J最大的必要条件cj、wij
步骤4.4:根据判定函数wij、cj、Δ(J)的大小来确定迭代的结束;
步骤5:根据企业具体情况,综合关键词效能优化和价值率优化,选择合适的关键词优化策略达到网站优化目标。
本发明有益效果是:
1,此算法可以精简关键词分析流程,进而减少整个网站优化工作量。
2,此算法的运行时间复杂度低,处理速度更快。
3、此算法具有更大的利用价值。
4、能帮助网站在短时间内快速提升其关键词的排名。
5、为企业网站带来一定的流量和询盘,从而达到理想的网站优化目标。
6、此算法分类结果的准确度更符合经验值;
附图说明
图1改进的模型聚类算法实现搜索引擎优化技术结构流程图
图2改进的模型聚类算法在聚类分析中的应用流程图
具体实施方式
为了解决关键词优化实现搜索引擎优化的技术问题,结合图1-图2对本发明进行了详细说明,其具体实施步骤如下:
步骤1:根据企业业务确定核心关键词,利用搜索引擎搜集相关关键字,这些关键字在搜索引擎中有相应数据项,如本国每月搜索量、竞争程度和估算每次点击费用(CPC)等
步骤2:结合企业产品和市场分析,筛选降维上述搜索到的相关关键字集合;
步骤3:针对筛选降维后的关键词集合,通过搜索引擎搜索关键词对应的页面,这里记录首页网页数和总搜索页面数,即每个关键词由五维向量再降维为四维的,其具体计算过程如下:
这里相关关键词个数为m,既有下列m×5矩阵:
Ni、Ldi、CPCi、NiS、NiY依次为第i个关键词对应的本国每月搜索量、竞争程度、估算每次点击费用(CPC)、首页网页数、总搜索页面数。
再降维为四维,即
Xi∈(1,2,…,m)为搜索效能,Zi∈(1,2,…,m)为价值率,即为下式:
步骤4:利用改进的模型聚类算法,对上述关键词进行聚类处理,其具体子步骤如下:
步骤4.1:利用基于ε领域的k-means算法初始化簇,筛选出k簇;
步骤4.2:用值[0,1]间的随机数初始化隶属矩阵J,使其满足隶属的整个约束条件;
构建随机隶属矩阵J为m×k:
wij为关键词i属于j类的程度系数,即j∈(1,2,…,k)、i∈(1,2,…,m)。
隶属的整个约束条件为:
步骤4.3:构建k类紧凑度函数J,综合隶属约束条件,构建m个方程组,对其进行求解,即可求出使紧凑度函数J最大的必要条件cj、wij
根据ε领域数据对象紧凑度函数,构建带有m个约束式的拉格朗日算子方程组,即有下式:
上式nεj为j类数据对象个数,xih为第i关键词所对应的向量,yjh为j类簇中心向量,为关键词i属性的平均值,为j类簇中心属性的平均值,h为关键词属性的个数,h=4;λi(i=1,…,m)是m个约束式的拉格朗日算子,对上述式子进行求导,对所有输入参量求导,即可求得使J达到最大的必要条件cj、wij
步骤4.4:根据判定函数wij、cj、Δ(J)的大小来确定迭代的结束,其具体计算过程如下:
Δ(J)=Jnew-Jold<θ
Δwij<μ
Δcj<γ
上式Jnew为当前迭代的紧凑度函数值,Jold为上一次紧凑度函数的值,Δwij为前后迭代的隶属变化值,Δcj为前后迭代的类中心变化值,θ、μ、γ为足够小的阈值。只有满足上述三个条件,则迭代结束,输出最佳聚类结果。
步骤5:根据企业具体情况,综合关键词效能优化和价值率优化,选择合适的关键词优化策略达到网站优化目标。

Claims (2)

1.改进的模型聚类算法实现搜索引擎优化技术,本发明涉及语义网络技术领域,具体涉及改进的模型聚类算法实现搜索引擎优化技术,其特征是,包括如下步骤:
步骤1:根据企业业务确定核心关键词,利用搜索引擎搜集相关关键字,这些关键字在搜索引擎中有相应数据项,如本国每月搜索量、竞争程度和估算每次点击费用
步骤2:结合企业产品和市场分析,筛选降维上述搜索到的相关关键字集合;
步骤3:针对筛选降维后的关键词集合,通过搜索引擎搜索关键词对应的页面,这里记录首页网页数和总搜索页面数,即每个关键词由五维向量再降维为四维的,其具体计算过程如下:
这里相关关键词个数为m,既有下列矩阵:
依次为第i个关键词对应的本国每月搜索量、竞争程度、估算每次点击费用(CPC)、首页网页数、总搜索页面数再降维
为四维,即
为搜索效能,为价值率,即为下式:
步骤4:利用改进的模型聚类算法,对上述关键词进行聚类处理,其具体子步骤如下:
步骤4.1:利用基于领域的k-means算法初始化簇,分为k簇;
步骤4.2:用值[0,1]间的随机数初始化隶属矩阵J,使其满足隶属的整个约束条件 ;
步骤4.3:构建k类紧凑度函数J,综合隶属约束条件,构建m个方程组,对其进行求解,即可求出使紧凑度函数J最大的必要条件
步骤4.4:根据判定函数的大小来确定迭代的结束;
步骤5:根据企业具体情况,综合关键词效能优化和价值率优化,选择合适的关键词优化策略达到网站优化目标。
2.根据权利要求1中所述的改进的模型聚类算法实现搜索引擎优化技术,其特征是,以上所述步骤4中的具体计算过程如下:
步骤4:利用改进的模型聚类算法,对上述关键词进行聚类处理,其具体子步骤如下:
步骤4.1:利用基于领域的k-means算法初始化簇,筛选出k簇;
步骤4.2:用值[0,1]间的随机数初始化隶属矩阵J,使其满足隶属的整个约束条件 ;
构建随机隶属矩阵J为
为关键词i属于j类的程度系数,即
隶属的整个约束条件为:
步骤4.3:构建k类紧凑度函数J,综合隶属约束条件,构建m个方程组,对其进行求解,即可求出使紧凑度函数J最大的必要条件
根据领域数据对象紧凑度函数,构建带有m个约束式的拉格朗日算子方程组,即有下式:
上式为j类数据对象个数,为第i关键词所对应的向量,为j类簇中心向量,为关键词i属性的平均值,为j类簇中心属性的平均值,为关键词属性的个数,h=4;是m个约束式的拉格朗日算子,对上述式子进行求导,对所有输入参量求导,即可求得使J达到最大的必要条件
步骤4.4:根据判定函数的大小来确定迭代的结束,其具体计算过程如下:
上式为当前迭代的紧凑度函数值,为上一次紧凑度函数的值, 为前后迭代的隶属变化值,为前后迭代的类中心变化值,为足够小的阈值,只有满足上述三个条件,则迭代结束,输出最佳聚类结果。
CN201710046154.8A 2017-01-22 2017-01-22 改进的模型聚类算法实现搜索引擎优化技术 Pending CN106933951A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710046154.8A CN106933951A (zh) 2017-01-22 2017-01-22 改进的模型聚类算法实现搜索引擎优化技术

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710046154.8A CN106933951A (zh) 2017-01-22 2017-01-22 改进的模型聚类算法实现搜索引擎优化技术

Publications (1)

Publication Number Publication Date
CN106933951A true CN106933951A (zh) 2017-07-07

Family

ID=59423841

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710046154.8A Pending CN106933951A (zh) 2017-01-22 2017-01-22 改进的模型聚类算法实现搜索引擎优化技术

Country Status (1)

Country Link
CN (1) CN106933951A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110069691A (zh) * 2019-04-29 2019-07-30 百度在线网络技术(北京)有限公司 用于处理点击行为数据的方法和装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103218435A (zh) * 2013-04-15 2013-07-24 上海嘉之道企业管理咨询有限公司 一种中文文本数据聚类方法及系统
CN103258000A (zh) * 2013-03-29 2013-08-21 北界创想(北京)软件有限公司 对网页中高频关键词进行聚类的方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103258000A (zh) * 2013-03-29 2013-08-21 北界创想(北京)软件有限公司 对网页中高频关键词进行聚类的方法及装置
CN103218435A (zh) * 2013-04-15 2013-07-24 上海嘉之道企业管理咨询有限公司 一种中文文本数据聚类方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
林元国 等: "K-means算法在关键词优化中的应用", 《计算机系统应用》 *
邓健爽 等: "基于搜索引擎的关键词自动聚类法", 《计算机科学》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110069691A (zh) * 2019-04-29 2019-07-30 百度在线网络技术(北京)有限公司 用于处理点击行为数据的方法和装置

Similar Documents

Publication Publication Date Title
CN103345645B (zh) 面向网购平台的商品图像类别预测方法
WO2021109464A1 (zh) 一种面向大规模用户的个性化教学资源推荐方法
CN108491431B (zh) 一种基于自编码机和聚类的混合推荐方法
CN106933954A (zh) 基于决策树分类算法实现搜索引擎优化技术
Yu et al. Graph neural network based model for multi-behavior session-based recommendation
CN106933953A (zh) 一种模糊k均值聚类算法实现搜索引擎优化技术
Liao et al. Deep linear graph attention model for attributed graph clustering
Lu et al. Grouped multi-attention network for hyperspectral image spectral-spatial classification
Yan et al. Modeling low-and high-order feature interactions with FM and self-attention network
CN106649616A (zh) 一种聚类算法实现搜索引擎关键词优化
Hu et al. EGC: A novel event-oriented graph clustering framework for social media text
CN107622071A (zh) 通过间接相关反馈在无查源下的衣服图像检索系统及方法
CN106909626A (zh) 改进的决策树分类算法实现搜索引擎优化技术
CN104598474A (zh) 云环境下基于数据语义的信息推荐方法
CN106874376A (zh) 一种验证搜索引擎关键词优化技术的方法
CN106933950A (zh) 新的模型聚类算法实现搜索引擎优化技术
CN106933951A (zh) 改进的模型聚类算法实现搜索引擎优化技术
CN106897356A (zh) 改进的模糊c‑均值算法实现搜索引擎关键词优化
CN106874377A (zh) 改进的基于约束条件的聚类算法实现搜索引擎关键词优化
Xu et al. Graph attention networks for new product sales forecasting in e-commerce
CN106897376A (zh) 基于蚁群的模糊c均值算法实现关键词优化
CN113095088B (zh) 一种基于文本的消费意图分析方法
CN106802945A (zh) 基于VSM的模糊c均值聚类算法实现搜索引擎关键词优化
Wu et al. MDAL: Multi-task dual attention LSTM model for semi-supervised network embedding
Li et al. Instance-prototype similarity consistency for unsupervised 2D image-based 3D model retrieval

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170707

WD01 Invention patent application deemed withdrawn after publication