CN106874377A - 改进的基于约束条件的聚类算法实现搜索引擎关键词优化 - Google Patents

改进的基于约束条件的聚类算法实现搜索引擎关键词优化 Download PDF

Info

Publication number
CN106874377A
CN106874377A CN201710005930.XA CN201710005930A CN106874377A CN 106874377 A CN106874377 A CN 106874377A CN 201710005930 A CN201710005930 A CN 201710005930A CN 106874377 A CN106874377 A CN 106874377A
Authority
CN
China
Prior art keywords
keyword
constraints
search engine
algorithm based
clustering algorithm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710005930.XA
Other languages
English (en)
Inventor
金平艳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan Yonglian Information Technology Co Ltd
Original Assignee
Sichuan Yonglian Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan Yonglian Information Technology Co Ltd filed Critical Sichuan Yonglian Information Technology Co Ltd
Priority to CN201710005930.XA priority Critical patent/CN106874377A/zh
Publication of CN106874377A publication Critical patent/CN106874377A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

改进的基于约束条件的聚类算法实现搜索引擎关键词优化,根据企业业务确定核心关键词,搜索关键词对应的数据项,如本国每月搜索量、竞争程度和估算每次点击费用等,对上述关键词集合进行再降维处理,每个关键词用一五维向量表示,即增加首页网页数和总搜索页面数,进而由五维再降为四维,改进的基于约束条件的聚类算法对上述关键词聚类,本发明通过精准的分配每个领域占比与局部领域内相关度的权重系数,可以更加精准地得到聚类结果,也减小了孤立点对聚类结果的影响,同时运行时间复杂度低,处理速度更快,数据光滑度处理的更好,可以快速提升关键词排名,为企业网站带来一定的流量,从而达到理想的网站优化目标。

Description

改进的基于约束条件的聚类算法实现搜索引擎关键词优化
技术领域
本发明涉及语义网络技术领域,具体涉及改进的基于约束条件的聚类算法实现搜索引擎关键词优化。
背景技术
搜索引擎对提高网站访问量起着至关重要的作用,由于用户在互联网检索信息,通常的手段是使用搜索引擎进行搜索。因此,在网络推广领域,SEO(Search EngineOptimization,搜索引擎优化)就具有了举足轻重的作用,从而备受广大网站的重视。搜索引擎优化技术包括黑帽技术和白帽技术,其中黑帽技术表示违反搜索引擎优化规则的恶意优化技术,在关键词优化技术中表现为在页面中堆砌关键词或放置无关关键词以提高在搜索引擎中的排名,目前各搜索引擎已经引入相关技术和规则对使用黑帽技术的网站进行惩罚;白帽技术则表示被搜索引擎认可的优化技术。真正的SEO是通过采用易于搜索引擎索引的合理手段,使网站对用户和搜索引擎更友好(Search Engine Friendly),从而更容易被搜索引擎收录及优先排序。
目前国外的搜索引擎优化理论已经非常成熟,国内的理论也已形成。但是就国内企业应用搜索引擎优化来看还不是很理想,还正处于一种正在兴起的状态,针对企业网站的实际情况所建立起来的优化策略理论还没有形成,还只是一些零零散散的研究成果和理论,并且发展也极为不成熟,导致了一些企业滥用优化理论,追求眼前暂时的利益而进行作弊。这对于企业网站的信息化推广来说极为不利,必须对这些“散落”的企业级优化策略理论进行有效的整合,使之成为一整套企业级的优化策略理论来指导企业网站进行相关的优化。基于上述需求,本发明提供了改进的基于约束条件的聚类算法实现搜索引擎关键词优化。
发明内容
针对于关键词优化实现搜索引擎优化的技术问题,本发明提供了改进的基于约束条件的聚类算法实现搜索引擎关键词优化。
为了解决上述问题,本发明是通过以下技术方案实现的:
步骤1:根据企业业务确定核心关键词,利用搜索引擎搜集相关关键字,这些关键字在搜索引擎中有相应数据项,如本国每月搜索量、竞争程度和估算每次点击费用(CPC)等
步骤2:结合企业产品和市场分析,筛选降维上述搜索到的相关关键字集合;
步骤3:针对筛选降维后的关键词集合,通过搜索引擎搜索关键词对应的页面,这里记录首页网页数和总搜索页面数,即每个关键词由五维向量再降维为四维的。
步骤4:改进的基于约束条件的聚类算法,对上述关键词进行聚类处理,其具体子步骤如下:
步骤4.1:利用基于ε领域的k-means算法初始化为c类。
步骤4.2:用值[0,1]间的随机数初始化隶属矩阵J,使其满足隶属的整个约束条件。
步骤4.3:初始化每一个领域目标函数构建c类总目标函数,综合隶属约束条件,构建m个方程组,对其进行求解,即可得聚类结果
步骤4.4:利用下式判定函数Δ(g)的结果,重新计算各簇中心;
步骤4.5:如果簇中心发生变化,则转到步骤4.2,重新计算隶属矩阵J,否则迭代结束,输出聚类结果。
步骤5:根据企业具体情况,综合关键词效能优化和价值率优化,选择合适的关键词优化策略达到网站优化目标。
本发明有益效果是:
1,此算法可以精简关键词分析流程,进而减少整个网站优化工作量。
2,此算法的运行时间复杂度低,处理速度更快。
3、此算法具有更大的利用价值。
4、能帮助网站在短时间内快速提升其关键词的排名。
5、为企业网站带来一定的流量和询盘,从而达到理想的网站优化目标。
6、此算法精准的分配每个领域占比与局部领域内相关度的权重系数使得分类结果更加符合经验值。
7、减小了孤立点对聚类结果的影响。
8、数据光滑度处理的更好,降低了人为误差。
附图说明
图1改进的基于约束条件的聚类算法实现搜索引擎关键词优化结构流程图
图2改进的基于约束条件的聚类算法在聚类分析中的应用流程图
具体实施方式
为了解决关键词优化实现搜索引擎优化的技术问题,结合图1-图2对本发明进行了详细说明,其具体实施步骤如下:
步骤1:根据企业业务确定核心关键词,利用搜索引擎搜集相关关键字,这些关键字在搜索引擎中有相应数据项,如本国每月搜索量、竞争程度和估算每次点击费用(CPC)等。
步骤2:结合企业产品和市场分析,筛选降维上述搜索到的相关关键字集合;
步骤3:针对筛选降维后的关键词集合,通过搜索引擎搜索关键词对应的页面,这里记录首页网页数和总搜索页面数,即每个关键词由五维向量再降维为四维的,其具体计算过程如下:
这里相关关键词个数为m,既有下列m×5矩阵:
Ni、Ldi、CPCi、NiS、NiY依次为第i个关键词对应的本国每月搜索量、竞争程度、估算每次点击费用(CPC)、首页网页数、总搜索页面数。
再降维为四维,即
Xi∈(1,2,…,m)为搜索效能,Zi∈(1,2,…,m)为价值率,即为下式:
步骤4:改进的基于约束条件的聚类算法,对上述关键词进行聚类处理,其具体子步骤如下:
步骤4.1:利用基于ε领域的k-means算法初始化为c类。
步骤4.2:用值[0,1]间的随机数初始化隶属矩阵J,使其满足隶属的整个约束条件,其具体计算过程如下:
根据ε领域初始化数据对象集合D划分为C类;
初始化隶属矩阵J为m×C:
wij为关键词i属于j类的程度系数,即j∈(1,2,…,C)、i∈(1,2,…,m)。
隶属的整个约束条件为:
步骤4.3:初始化每一个领域目标函数构建c类总目标函数,综合隶属约束条件,构建m个方程组,对其进行求解,即可得聚类结果,其具体计算过程如下:
上式nεj为j类ε领域内数据对象的个数,为j类ε领域内总的紧凑度,α、β分别为数量nεj、紧凑度的影响系数,且α+β=1,其值可以根据实验迭代出合适的值。
构建c类总目标函数
a为一个处理常数,a>1;
上式
为空间中的第i个关键词向量与其簇中心向量的内积。
综合隶属约束条件,构建m个方程组:
λi(i=1,…,m)是m个约束式的拉格朗日算子,对上述式子进行求导,对所有输入参量求导,即可求得使达到最大的必要条件ci、wij
上式为关键词i所对应的向量;
步骤4.4:利用下式判定函数Δ(g)的结果,重新计算各簇中心,其具体计算过程如下:
为新的总目标函数,为上一次迭代得出的总目标函数,θ为一个足够小的数,只有满足上述条件,则找到了最佳分类。
步骤4.5:如果簇中心发生变化,则转到步骤4.2,重新计算隶属矩阵J,否则迭代结束,输出聚类结果。
改进的基于约束条件的聚类算法的具体结构流程如图2。
步骤5:根据企业具体情况,综合关键词效能优化和价值率优化,选择合适的关键词优化策略达到网站优化目标。
改进的基于约束条件的聚类算法实现搜索引擎关键词优化,其伪代码过程
输入:网站提取的核心关键词,基于ε领域初始化为c簇。
输出:总目标函数最大的c个簇。

Claims (2)

1.改进的基于约束条件的聚类算法实现搜索引擎关键词优化,本发明涉及语义网络技术领域,具体涉及改进的基于约束条件的聚类算法实现搜索引擎关键词优化,其特征是,包括如下步骤:
步骤1:根据企业业务确定核心关键词,利用搜索引擎搜集相关关键字,这些关键字在搜索引擎中有相应数据项,如本国每月搜索量、竞争程度和估算每次点击费用(CPC)等
步骤2:结合企业产品和市场分析,筛选降维上述搜索到的相关关键字集合;
步骤3:针对筛选降维后的关键词集合,通过搜索引擎搜索关键词对应的页面,这里记录首页网页数和总搜索页面数,即每个关键词由五维向量再降维为四维的,其具体计算过程如下:
这里相关关键词个数为m,既有下列矩阵:
依次为第i个关键词对应的本国每月搜索量、竞争程度、估算每次点击费用(CPC)、首页网页数、总搜索页面数再降维
为四维,即
为搜索效能,为价值率,即为下式:
步骤4:改进的基于约束条件的聚类算法,对上述关键词进行聚类处理,其具体子步骤如下:
步骤4.1:利用基于领域的k-means算法初始化为c类
步骤4.2:用值[0,1]间的随机数初始化隶属矩阵J,使其满足隶属的整个约束条件
步骤4.3:初始化每一个领域目标函数,构建c类总目标函数,综合隶属约束条件,构建m个方程组,对其进行求解,即可得聚类结果
步骤4.4:利用下式判定函数的结果,重新计算各簇中心;
步骤4.5:如果簇中心发生变化,则转到步骤4.2,重新计算隶属矩阵J,否则迭代结束,输出聚类结果
步骤5:根据企业具体情况,综合关键词效能优化和价值率优化,选择合适的关键词优化策略达到网站优化目标。
2.根据权利要求1中所述的改进的基于约束条件的聚类算法实现搜索引擎关键词优化,其特征是,以上所述步骤4中具体计算过程如下:
步骤4:改进的基于约束条件的聚类算法,对上述关键词进行聚类处理,其具体子步骤如下:
步骤4.1:利用基于领域的k-means算法初始化为c类
步骤4.2:用值[0,1]间的随机数初始化隶属矩阵J,使其满足隶属的整个约束条件,其具体计算过程如下:
根据领域初始化数据对象集合D划分为C类;
初始化隶属矩阵J为
为关键词i属于j类的程度系数,即
隶属的整个约束条件为:
步骤4.3:初始化每一个领域目标函数,构建c类总目标函数,综合隶属约束条件,构建m个方程组,对其进行求解,即可得聚类结果,其具体计算过程如下:
上式为j类领域内数据对象的个数,为j类领域内总的紧凑度,分别为数量、紧凑度的影响系数,且,其值可以根据实验迭代出合适的值
构建c类总目标函数
a为一个处理常数,a>1;
上式
为空间中的第i个关键词向量与其簇中心向量的内积
综合隶属约束条件,构建m个方程组:
是m个约束式的拉格朗日算子,对上述式子进行求导,对所有输入参量求导,即可求得使达到最大的必要条件
上式为关键词i所对应的向量;
步骤4.4:利用下式判定函数的结果,重新计算各簇中心,其具体计算过程如下:
为新的总目标函数,为上一次迭代得出的总目标函数,为一个足够小的数,只有满足上述条件,则找到了最佳分类
步骤4.5:如果簇中心发生变化,则转到步骤4.2,重新计算隶属矩阵J,否则迭代结束,输出聚类结果
改进的基于约束条件的聚类算法的具体结构流程如图2。
CN201710005930.XA 2017-01-04 2017-01-04 改进的基于约束条件的聚类算法实现搜索引擎关键词优化 Pending CN106874377A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710005930.XA CN106874377A (zh) 2017-01-04 2017-01-04 改进的基于约束条件的聚类算法实现搜索引擎关键词优化

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710005930.XA CN106874377A (zh) 2017-01-04 2017-01-04 改进的基于约束条件的聚类算法实现搜索引擎关键词优化

Publications (1)

Publication Number Publication Date
CN106874377A true CN106874377A (zh) 2017-06-20

Family

ID=59165419

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710005930.XA Pending CN106874377A (zh) 2017-01-04 2017-01-04 改进的基于约束条件的聚类算法实现搜索引擎关键词优化

Country Status (1)

Country Link
CN (1) CN106874377A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107330037A (zh) * 2017-06-27 2017-11-07 北京金山安全软件有限公司 用于关键词优化的方法、装置以及终端设备
CN111428007A (zh) * 2020-06-08 2020-07-17 北京每日优鲜电子商务有限公司 基于跨平台的同步推送反馈方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103218435A (zh) * 2013-04-15 2013-07-24 上海嘉之道企业管理咨询有限公司 一种中文文本数据聚类方法及系统
CN103258000A (zh) * 2013-03-29 2013-08-21 北界创想(北京)软件有限公司 对网页中高频关键词进行聚类的方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103258000A (zh) * 2013-03-29 2013-08-21 北界创想(北京)软件有限公司 对网页中高频关键词进行聚类的方法及装置
CN103218435A (zh) * 2013-04-15 2013-07-24 上海嘉之道企业管理咨询有限公司 一种中文文本数据聚类方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
林元国 等: "K-means算法在关键词优化中的应用", 《计算机系统应用》 *
邓健爽 等: "基于搜索引擎的关键词自动聚类法", 《计算机科学》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107330037A (zh) * 2017-06-27 2017-11-07 北京金山安全软件有限公司 用于关键词优化的方法、装置以及终端设备
CN107330037B (zh) * 2017-06-27 2020-03-27 北京金山安全软件有限公司 用于关键词优化的方法、装置以及终端设备
CN111428007A (zh) * 2020-06-08 2020-07-17 北京每日优鲜电子商务有限公司 基于跨平台的同步推送反馈方法
CN111428007B (zh) * 2020-06-08 2020-09-15 北京每日优鲜电子商务有限公司 基于跨平台的同步推送反馈方法

Similar Documents

Publication Publication Date Title
CN103345645B (zh) 面向网购平台的商品图像类别预测方法
WO2021109464A1 (zh) 一种面向大规模用户的个性化教学资源推荐方法
CN107291847A (zh) 一种基于MapReduce的大规模数据分布式聚类处理方法
CN104834693A (zh) 基于深度搜索的视觉图像检索方法及系统
CN106649616A (zh) 一种聚类算法实现搜索引擎关键词优化
CN106933954A (zh) 基于决策树分类算法实现搜索引擎优化技术
CN103761286B (zh) 一种基于用户兴趣的服务资源检索方法
CN106933953A (zh) 一种模糊k均值聚类算法实现搜索引擎优化技术
CN106874377A (zh) 改进的基于约束条件的聚类算法实现搜索引擎关键词优化
Pilani et al. Contextual bandit approach-based recommendation system for personalized web-based services
CN106909626A (zh) 改进的决策树分类算法实现搜索引擎优化技术
CN106874376A (zh) 一种验证搜索引擎关键词优化技术的方法
CN106802945A (zh) 基于VSM的模糊c均值聚类算法实现搜索引擎关键词优化
CN106897356A (zh) 改进的模糊c‑均值算法实现搜索引擎关键词优化
Satuluri Scalable clustering of modern networks
Nakis et al. Hm-ldm: A hybrid-membership latent distance model
Chen et al. Overlapping community detection of complex network: A survey
CN106933950A (zh) 新的模型聚类算法实现搜索引擎优化技术
CN106776923A (zh) 改进的聚类算法实现搜索引擎关键词优化
Sun et al. A comparative analysis of PSO, HPSO, and HPSO-TVAC for data clustering
CN106897376A (zh) 基于蚁群的模糊c均值算法实现关键词优化
CN106933951A (zh) 改进的模型聚类算法实现搜索引擎优化技术
CN106776915A (zh) 一种新的聚类算法实现搜索引擎关键词优化
Wu et al. Enhancing sequential recommendation via decoupled knowledge graphs
CN106649537A (zh) 基于改进的群智能算法实现搜索引擎关键词优化技术

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170620

WD01 Invention patent application deemed withdrawn after publication