CN106933951A - 改进的模型聚类算法实现搜索引擎优化技术 - Google Patents
改进的模型聚类算法实现搜索引擎优化技术 Download PDFInfo
- Publication number
- CN106933951A CN106933951A CN201710046154.8A CN201710046154A CN106933951A CN 106933951 A CN106933951 A CN 106933951A CN 201710046154 A CN201710046154 A CN 201710046154A CN 106933951 A CN106933951 A CN 106933951A
- Authority
- CN
- China
- Prior art keywords
- keyword
- search engine
- algorithm
- value
- improved model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
改进的模型聚类算法实现搜索引擎优化技术,根据企业业务确定核心关键词,搜索关键词对应的数据项,如本国每月搜索量、竞争程度和估算每次点击费用等,对上述关键词集合进行再降维处理,每个关键词用一五维向量表示,即增加首页网页数和总搜索页面数,进而由五维再降为四维,利用改进的模型聚类算法,构建k类紧凑度函数J,求出满足紧凑度函数J最大的必要条件、,本发明运行时间复杂度低、处理速度更快、聚类结果准确、可以快速提升关键词排名、为企业网站带来一定的流量、从而达到理想的网站优化目标。
Description
技术领域
本发明涉及语义网络技术领域,具体涉及改进的模型聚类算法实现搜索引擎优化技术。
背景技术
随着互联网技术不断发展,网络信息量迅速增长,搜索引擎逐渐成为用户快速准确查找信息的主要工具。搜索引擎用户一般只会关注搜索结果页面中排名靠前的网站,这些网站的点击率也相对高些。搜索引擎优化(Search Engine Optimization,简称SEO)是企业根据搜索引擎的工作原理,在符合用户友好的基础上,对网站内外部进行相关优化,使搜索引擎收录更多的网页,提高网站在搜索引擎中的自然排名,从而增加网站访问量,最终实现网站的销售或提升网络品牌。目前关于搜索引擎优化方法的理论研究已较为丰富,如黑帽技术和白帽技术,搜索引擎优化策略,分别是域名策略、网页设计规划策略、关键词策略以及链接策略。SEO归根结底是关键词的优化策略,现今国内外对关键词优化的理论研究和技术应用比较多,但暂未提出一个有效的方法来简化关键词分析流程,也没有一个完善的机制来管理关键词优化策略和进度。基于上述需求,本发明提供了一种改进的模型聚类算法实现搜索引擎优化技术。
发明内容
针对于关键词优化实现搜索引擎优化的技术问题,本发明提供了一种改进的模型聚类算法实现搜索引擎优化技术。
为了解决上述问题,本发明是通过以下技术方案实现的:
步骤1:根据企业业务确定核心关键词,利用搜索引擎搜集相关关键字,这些关键字在搜索引擎中有相应数据项,如本国每月搜索量、竞争程度和估算每次点击费用(CPC)等
步骤2:结合企业产品和市场分析,筛选降维上述搜索到的相关关键字集合;
步骤3:针对筛选降维后的关键词集合,通过搜索引擎搜索关键词对应的页面,这里记录首页网页数和总搜索页面数,即每个关键词由五维向量再降维为四维的。
步骤4:利用改进的模型聚类算法,对上述关键词进行聚类处理,其具体子步骤如下:
步骤4.1:利用基于ε领域的k-means算法初始化簇,分为k簇;
步骤4.2:用值[0,1]间的随机数初始化隶属矩阵J,使其满足隶属的整个约束条件;
步骤4.3:构建k类紧凑度函数J,综合隶属约束条件,构建m个方程组,对其进行求解,即可求出使紧凑度函数J最大的必要条件cj、wij;
步骤4.4:根据判定函数wij、cj、Δ(J)的大小来确定迭代的结束;
步骤5:根据企业具体情况,综合关键词效能优化和价值率优化,选择合适的关键词优化策略达到网站优化目标。
本发明有益效果是:
1,此算法可以精简关键词分析流程,进而减少整个网站优化工作量。
2,此算法的运行时间复杂度低,处理速度更快。
3、此算法具有更大的利用价值。
4、能帮助网站在短时间内快速提升其关键词的排名。
5、为企业网站带来一定的流量和询盘,从而达到理想的网站优化目标。
6、此算法分类结果的准确度更符合经验值;
附图说明
图1改进的模型聚类算法实现搜索引擎优化技术结构流程图
图2改进的模型聚类算法在聚类分析中的应用流程图
具体实施方式
为了解决关键词优化实现搜索引擎优化的技术问题,结合图1-图2对本发明进行了详细说明,其具体实施步骤如下:
步骤1:根据企业业务确定核心关键词,利用搜索引擎搜集相关关键字,这些关键字在搜索引擎中有相应数据项,如本国每月搜索量、竞争程度和估算每次点击费用(CPC)等
步骤2:结合企业产品和市场分析,筛选降维上述搜索到的相关关键字集合;
步骤3:针对筛选降维后的关键词集合,通过搜索引擎搜索关键词对应的页面,这里记录首页网页数和总搜索页面数,即每个关键词由五维向量再降维为四维的,其具体计算过程如下:
这里相关关键词个数为m,既有下列m×5矩阵:
Ni、Ldi、CPCi、NiS、NiY依次为第i个关键词对应的本国每月搜索量、竞争程度、估算每次点击费用(CPC)、首页网页数、总搜索页面数。
再降维为四维,即
Xi∈(1,2,…,m)为搜索效能,Zi∈(1,2,…,m)为价值率,即为下式:
步骤4:利用改进的模型聚类算法,对上述关键词进行聚类处理,其具体子步骤如下:
步骤4.1:利用基于ε领域的k-means算法初始化簇,筛选出k簇;
步骤4.2:用值[0,1]间的随机数初始化隶属矩阵J,使其满足隶属的整个约束条件;
构建随机隶属矩阵J为m×k:
wij为关键词i属于j类的程度系数,即j∈(1,2,…,k)、i∈(1,2,…,m)。
隶属的整个约束条件为:
步骤4.3:构建k类紧凑度函数J,综合隶属约束条件,构建m个方程组,对其进行求解,即可求出使紧凑度函数J最大的必要条件cj、wij;
根据ε领域数据对象紧凑度函数,构建带有m个约束式的拉格朗日算子方程组,即有下式:
上式nεj为j类数据对象个数,xih为第i关键词所对应的向量,yjh为j类簇中心向量,为关键词i属性的平均值,为j类簇中心属性的平均值,h为关键词属性的个数,h=4;λi(i=1,…,m)是m个约束式的拉格朗日算子,对上述式子进行求导,对所有输入参量求导,即可求得使J达到最大的必要条件cj、wij:
步骤4.4:根据判定函数wij、cj、Δ(J)的大小来确定迭代的结束,其具体计算过程如下:
Δ(J)=Jnew-Jold<θ
Δwij<μ
Δcj<γ
上式Jnew为当前迭代的紧凑度函数值,Jold为上一次紧凑度函数的值,Δwij为前后迭代的隶属变化值,Δcj为前后迭代的类中心变化值,θ、μ、γ为足够小的阈值。只有满足上述三个条件,则迭代结束,输出最佳聚类结果。
步骤5:根据企业具体情况,综合关键词效能优化和价值率优化,选择合适的关键词优化策略达到网站优化目标。
Claims (2)
1.改进的模型聚类算法实现搜索引擎优化技术,本发明涉及语义网络技术领域,具体涉及改进的模型聚类算法实现搜索引擎优化技术,其特征是,包括如下步骤:
步骤1:根据企业业务确定核心关键词,利用搜索引擎搜集相关关键字,这些关键字在搜索引擎中有相应数据项,如本国每月搜索量、竞争程度和估算每次点击费用等
步骤2:结合企业产品和市场分析,筛选降维上述搜索到的相关关键字集合;
步骤3:针对筛选降维后的关键词集合,通过搜索引擎搜索关键词对应的页面,这里记录首页网页数和总搜索页面数,即每个关键词由五维向量再降维为四维的,其具体计算过程如下:
这里相关关键词个数为m,既有下列矩阵:
、、、、依次为第i个关键词对应的本国每月搜索量、竞争程度、估算每次点击费用(CPC)、首页网页数、总搜索页面数再降维
为四维,即
为搜索效能,为价值率,即为下式:
步骤4:利用改进的模型聚类算法,对上述关键词进行聚类处理,其具体子步骤如下:
步骤4.1:利用基于领域的k-means算法初始化簇,分为k簇;
步骤4.2:用值[0,1]间的随机数初始化隶属矩阵J,使其满足隶属的整个约束条件 ;
步骤4.3:构建k类紧凑度函数J,综合隶属约束条件,构建m个方程组,对其进行求解,即可求出使紧凑度函数J最大的必要条件、;
步骤4.4:根据判定函数、、的大小来确定迭代的结束;
步骤5:根据企业具体情况,综合关键词效能优化和价值率优化,选择合适的关键词优化策略达到网站优化目标。
2.根据权利要求1中所述的改进的模型聚类算法实现搜索引擎优化技术,其特征是,以上所述步骤4中的具体计算过程如下:
步骤4:利用改进的模型聚类算法,对上述关键词进行聚类处理,其具体子步骤如下:
步骤4.1:利用基于领域的k-means算法初始化簇,筛选出k簇;
步骤4.2:用值[0,1]间的随机数初始化隶属矩阵J,使其满足隶属的整个约束条件 ;
构建随机隶属矩阵J为:
为关键词i属于j类的程度系数,即
隶属的整个约束条件为:
步骤4.3:构建k类紧凑度函数J,综合隶属约束条件,构建m个方程组,对其进行求解,即可求出使紧凑度函数J最大的必要条件、;
根据领域数据对象紧凑度函数,构建带有m个约束式的拉格朗日算子方程组,即有下式:
上式为j类数据对象个数,为第i关键词所对应的向量,为j类簇中心向量,为关键词i属性的平均值,为j类簇中心属性的平均值,为关键词属性的个数,h=4;是m个约束式的拉格朗日算子,对上述式子进行求导,对所有输入参量求导,即可求得使J达到最大的必要条件、:
步骤4.4:根据判定函数、、的大小来确定迭代的结束,其具体计算过程如下:
上式为当前迭代的紧凑度函数值,为上一次紧凑度函数的值, 为前后迭代的隶属变化值,为前后迭代的类中心变化值,、、为足够小的阈值,只有满足上述三个条件,则迭代结束,输出最佳聚类结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710046154.8A CN106933951A (zh) | 2017-01-22 | 2017-01-22 | 改进的模型聚类算法实现搜索引擎优化技术 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710046154.8A CN106933951A (zh) | 2017-01-22 | 2017-01-22 | 改进的模型聚类算法实现搜索引擎优化技术 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106933951A true CN106933951A (zh) | 2017-07-07 |
Family
ID=59423841
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710046154.8A Pending CN106933951A (zh) | 2017-01-22 | 2017-01-22 | 改进的模型聚类算法实现搜索引擎优化技术 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106933951A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110069691A (zh) * | 2019-04-29 | 2019-07-30 | 百度在线网络技术(北京)有限公司 | 用于处理点击行为数据的方法和装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103218435A (zh) * | 2013-04-15 | 2013-07-24 | 上海嘉之道企业管理咨询有限公司 | 一种中文文本数据聚类方法及系统 |
CN103258000A (zh) * | 2013-03-29 | 2013-08-21 | 北界创想(北京)软件有限公司 | 对网页中高频关键词进行聚类的方法及装置 |
-
2017
- 2017-01-22 CN CN201710046154.8A patent/CN106933951A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103258000A (zh) * | 2013-03-29 | 2013-08-21 | 北界创想(北京)软件有限公司 | 对网页中高频关键词进行聚类的方法及装置 |
CN103218435A (zh) * | 2013-04-15 | 2013-07-24 | 上海嘉之道企业管理咨询有限公司 | 一种中文文本数据聚类方法及系统 |
Non-Patent Citations (2)
Title |
---|
林元国 等: "K-means算法在关键词优化中的应用", 《计算机系统应用》 * |
邓健爽 等: "基于搜索引擎的关键词自动聚类法", 《计算机科学》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110069691A (zh) * | 2019-04-29 | 2019-07-30 | 百度在线网络技术(北京)有限公司 | 用于处理点击行为数据的方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103345645B (zh) | 面向网购平台的商品图像类别预测方法 | |
WO2021109464A1 (zh) | 一种面向大规模用户的个性化教学资源推荐方法 | |
CN108491431B (zh) | 一种基于自编码机和聚类的混合推荐方法 | |
CN106933954A (zh) | 基于决策树分类算法实现搜索引擎优化技术 | |
Yu et al. | Graph neural network based model for multi-behavior session-based recommendation | |
CN106933953A (zh) | 一种模糊k均值聚类算法实现搜索引擎优化技术 | |
Liao et al. | Deep linear graph attention model for attributed graph clustering | |
Lu et al. | Grouped multi-attention network for hyperspectral image spectral-spatial classification | |
Yan et al. | Modeling low-and high-order feature interactions with FM and self-attention network | |
CN106649616A (zh) | 一种聚类算法实现搜索引擎关键词优化 | |
Hu et al. | EGC: A novel event-oriented graph clustering framework for social media text | |
CN107622071A (zh) | 通过间接相关反馈在无查源下的衣服图像检索系统及方法 | |
CN106909626A (zh) | 改进的决策树分类算法实现搜索引擎优化技术 | |
CN104598474A (zh) | 云环境下基于数据语义的信息推荐方法 | |
CN106874376A (zh) | 一种验证搜索引擎关键词优化技术的方法 | |
CN106933950A (zh) | 新的模型聚类算法实现搜索引擎优化技术 | |
CN106933951A (zh) | 改进的模型聚类算法实现搜索引擎优化技术 | |
CN106897356A (zh) | 改进的模糊c‑均值算法实现搜索引擎关键词优化 | |
CN106874377A (zh) | 改进的基于约束条件的聚类算法实现搜索引擎关键词优化 | |
Xu et al. | Graph attention networks for new product sales forecasting in e-commerce | |
CN106897376A (zh) | 基于蚁群的模糊c均值算法实现关键词优化 | |
CN113095088B (zh) | 一种基于文本的消费意图分析方法 | |
CN106802945A (zh) | 基于VSM的模糊c均值聚类算法实现搜索引擎关键词优化 | |
Wu et al. | MDAL: Multi-task dual attention LSTM model for semi-supervised network embedding | |
Li et al. | Instance-prototype similarity consistency for unsupervised 2D image-based 3D model retrieval |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20170707 |
|
WD01 | Invention patent application deemed withdrawn after publication |