CN106649616A - 一种聚类算法实现搜索引擎关键词优化 - Google Patents
一种聚类算法实现搜索引擎关键词优化 Download PDFInfo
- Publication number
- CN106649616A CN106649616A CN201611089249.XA CN201611089249A CN106649616A CN 106649616 A CN106649616 A CN 106649616A CN 201611089249 A CN201611089249 A CN 201611089249A CN 106649616 A CN106649616 A CN 106649616A
- Authority
- CN
- China
- Prior art keywords
- keyword
- search engine
- keywords
- clustering algorithm
- follows
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
一种聚类算法实现搜索引擎关键词优化,根据企业业务确定核心关键词,搜索关键词对应的数据项,如本国每月搜索量、竞争程度和估算每次点击费用等,对上述关键词集合进行再降维处理,每个关键词用一五维向量表示,即增加首页网页数和总搜索页面数,进而由五维再降为四维,最后采用一种聚类算法对关键词聚类,每个领域密度与相似度函数确定,全局相似度函数为,根据值确定簇中心的变化,本发明算法更简便有效,运行时间复杂度低,处理速度更快,分类结果更符合经验值,具有更好的数据处理效果,能帮助网站在短时间内快速提升其关键词的排名,为企业网站带来一定的流量和询盘,从而达到理想的网站优化目标。
Description
技术领域
本发明涉及语义网络技术领域,具体涉及一种聚类算法实现搜索引擎关键词优化。
背景技术
由于用户在互联网检索信息时,通常的手段是使用搜索引擎进行搜索。因此,在网络推广领域,SEO(Search Engine Optimization,搜索引擎优化)就具有了举足轻重的作用,搜索引擎优化技术包括黑帽技术和白帽技术,目前各搜索引擎已经引入相关技术和规则对使用黑帽技术的网站进行惩罚;白帽技术则表示被搜索引擎认可的优化技术。一个商业网站以其核心关键字在主流搜索引擎中获得自然排名优先,在今天的商业社会,有着非比寻常的价值。因此关键字也常被称为是整个搜索应用的基石。关键词优化策略一般包括关键词的选择、关键词的分布及密度控制等等,关键词的使用是否得当,直接关系到网站在搜索引擎的搜索结果中的位置,现今,暂未提出一个有效的方法来简化关键词分析流程,也没有一个完善的机制来管理关键词优化策略和进度,基于上述需求,本发明提供了一种聚类算法实现搜索引擎关键词优化。
发明内容
针对于关键词优化实现搜索引擎优化的技术问题,本发明提供了一种聚类算法实现搜索引擎关键词优化。
为了解决上述问题,本发明是通过以下技术方案实现的:
步骤1:根据企业业务确定核心关键词,利用搜索引擎搜集相关关键字,这些关键字在搜索引擎中有相应数据项,如本国每月搜索量、竞争程度和估算每次点击费用(CPC)等
步骤2:结合企业产品和市场分析,筛选降维上述搜索到的相关关键字集合;
步骤3:针对筛选降维后的关键词集合,通过搜索引擎搜索关键词对应的页面,这里记录首页网页数和总搜索页面数,即每个关键词由五维向量再降维为四维的。
步骤4:一种聚类算法,对上述关键词进行聚类处理,其具体子步骤如下:
步骤4.1:利用基于ε领域的k-means算法初始化簇;
步骤4.2:初始化每一个ε领域的相似度函数从数据对象集合D中按下述判定条件选择k个初始簇中心;
步骤4.3:对每类关键词i(i∈(1,2,…,m))进行重新分配,按相似度函数f(i)选择聚类中心j′;
步骤4.4:根据判定函数Δ(S)的结果,重新计算各簇中心;
步骤4.5:如果簇中心发生变化,则转到步骤4.2,否则迭代结束,输出聚类结果。
步骤5:根据企业具体情况,综合关键词效能优化和价值率优化,选择合适的关键词优化策略达到网站优化目标。
本发明有益效果是:
1,此算法可以精简关键词分析流程,进而减少整个网站优化工作量。
2,此算法的运行时间复杂度低,处理速度更快。
3、此算法具有更大的利用价值。
4、能帮助网站在短时间内快速提升其关键词的排名。
5、为企业网站带来一定的流量和询盘,从而达到理想的网站优化目标。
6、此算法分类结果的准确度更符合经验值。
7、此算法更简便有效。
8、数据处理的效果更好。
附图说明
图1一种聚类算法实现搜索引擎关键词优化结构流程图
图2一种聚类算法在聚类分析中的应用流程图
具体实施方式
为了解决关键词优化实现搜索引擎优化的技术问题,结合图1-图2对本发明进行了详细说明,其具体实施步骤如下:
步骤1:根据企业业务确定核心关键词,利用搜索引擎搜集相关关键字,这些关键字在搜索引擎中有相应数据项,如本国每月搜索量、竞争程度和估算每次点击费用(CPC)等。
步骤2:结合企业产品和市场分析,筛选降维上述搜索到的相关关键字集合;
步骤3:针对筛选降维后的关键词集合,通过搜索引擎搜索关键词对应的页面,这里记录首页网页数和总搜索页面数,即每个关键词由五维向量再降维为四维的,其具体计算过程如下:
这里相关关键词个数为m,既有下列m×5矩阵:
Ni、Ldi、CPCi、NiS、NiY依次为第i个关键词对应的本国每月搜索量、竞争程度、估算每次点击费用(CPC)、首页网页数、总搜索页面数。
再降维为四维,即
Xi∈(1,2,…,m)为搜索效能,Zi∈(1,2,…,m)为价值率,即为下式:
步骤4:利用一种聚类算法,对上述关键词进行聚类处理,其具体子步骤如下:
步骤4.1:利用基于ε领域的k-means算法初始化簇。
步骤4.2:初始化每一个ε领域的相似度函数从数据对象集合D中按下述判定条件选择k个初始簇中心,其具体计算过程如下:
上式nε为每一个ε领域内数据对象的个数,为每一个ε领域内第i个关键词向量与其中心点向量的相似度,α、β分别为数量nε、相似度函数的影响系数,且α+β=1,α<β,其值可以根据实验迭代出合适的值。
为属于j类的第i个关键词的空间向量,为j类簇中心向量,h为向量对应元素的个数。
判定条件如下:
γ为设定好的阈值,只有满足上式条件则归为一簇,则筛选k类出来。
步骤4.3:对每类关键词i(i∈(1,2,…,m))进行重新分配,按相似度函数f(i)选择聚类中心j′,其具体计算过程如下:
按f(i)值最大选择对应的聚类中心j′。
步骤4.4:根据判定函数Δ(S)的结果,重新计算各簇中心,其具体计算过程如下:
为第N次迭代得到的全局相似度函数,为第N次迭代第j类簇的相似度函数。
满足上式,则重新计算各簇中心。
步骤4.5:如果簇中心发生变化,则转到步骤4.2,否则迭代结束,输出聚类结果。
步骤5:根据企业具体情况,综合关键词效能优化和价值率优化,选择合适的关键词优化策略达到网站优化目标。
一种聚类算法实现搜索引擎关键词优化,其伪代码过程
输入:网站提取的核心关键词,基于ε领域初始化簇,初始化每一个ε领域的相似度函数
输出:全局相似度函数的总和最大的k个簇。
Claims (2)
1.一种聚类算法实现搜索引擎关键词优化,本发明涉及语义网络技术领域,具体涉及一种聚类算法实现搜索引擎关键词优化,其特征是,包括如下步骤:
步骤1:根据企业业务确定核心关键词,利用搜索引擎搜集相关关键字,这些关键字在搜索引擎中有相应数据项,如本国每月搜索量、竞争程度和估算每次点击费用等
步骤2:结合企业产品和市场分析,筛选降维上述搜索到的相关关键字集合;
步骤3:针对筛选降维后的关键词集合,通过搜索引擎搜索关键词对应的页面,这里记录首页网页数和总搜索页面数,即每个关键词由五维向量再降维为四维的,其具体计算过程如下:
这里相关关键词个数为m,既有下列矩阵:
、、、、依次为第i个关键词对应的本国每月搜索量、竞争程度、估算每次点击费用、首页网页数、总搜索页面数
再降维为四维,即
为搜索效能,为价值率,即为下式:
步骤4:一种聚类算法,对上述关键词进行聚类处理,其具体子步骤如下:
步骤4.1:利用基于领域的k-means算法初始化簇;
步骤4.2:初始化每一个领域的相似度函数,从数据对象集合D中按下述判定条件选择k个初始簇中心;
步骤4.3:对每类关键词进行重新分配,按相似度函数选择聚类中心;
步骤4.4:根据判定函数的结果,重新计算各簇中心;
步骤4.5:如果簇中心发生变化,则转到步骤4.2,否则迭代结束,输出聚类结果
步骤5:根据企业具体情况,综合关键词效能优化和价值率优化,选择合适的关键词优化策略达到网站优化目标。
2.根据权利要求1中所述的一种聚类算法实现搜索引擎关键词优化,其特征是,以上所述步骤4中的具体计算过程如下:
步骤4:利用一种聚类算法,对上述关键词进行聚类处理,其具体子步骤如下:
步骤4.1:利用基于领域的k-means算法初始化簇
步骤4.2:初始化每一个领域的相似度函数,从数据对象集合D中按下述判定条件选择k个初始簇中心,其具体计算过程如下:
上式为每一个领域内数据对象的个数,为每一个领域内第i个关键词向量与其中心点向量的相似度,、分别为数量、相似度函数的影响系数,且,,其值可以根据实验迭代出合适的值
为属于j类的第i个关键词的空间向量,为j类簇中心向量,h为向量对应元素的个数
判定条件如下:
为设定好的阈值,只有满足上式条件则归为一簇,则筛选k类出来
步骤4.3:对每类关键词进行重新分配,按相似度函数选择聚类中心,其具体计算过程如下:
按值最大选择对应的聚类中心
步骤4.4:根据判定函数的结果,重新计算各簇中心,其具体计算过程如下:
为第N次迭代得到的全局相似度函数,为第N次迭代第j类簇的相似度函数
满足上式,则重新计算各簇中心
步骤4.5:如果簇中心发生变化,则转到步骤4.2,否则迭代结束,输出聚类结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611089249.XA CN106649616A (zh) | 2016-11-30 | 2016-11-30 | 一种聚类算法实现搜索引擎关键词优化 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611089249.XA CN106649616A (zh) | 2016-11-30 | 2016-11-30 | 一种聚类算法实现搜索引擎关键词优化 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106649616A true CN106649616A (zh) | 2017-05-10 |
Family
ID=58813807
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611089249.XA Pending CN106649616A (zh) | 2016-11-30 | 2016-11-30 | 一种聚类算法实现搜索引擎关键词优化 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106649616A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108509426A (zh) * | 2018-04-11 | 2018-09-07 | 焦点科技股份有限公司 | 一种深度多维度流量语义分析方法 |
CN109101620A (zh) * | 2018-08-08 | 2018-12-28 | 广州神马移动信息科技有限公司 | 相似度计算方法、聚类方法、装置、存储介质及电子设备 |
CN110990711A (zh) * | 2019-05-13 | 2020-04-10 | 国家计算机网络与信息安全管理中心 | 基于机器学习的微信公众号推荐算法及系统 |
CN111581494A (zh) * | 2020-04-08 | 2020-08-25 | 西窗科技(苏州)有限公司 | 一种互联网广告投放平台的关键词分类方法及分类系统 |
CN113297438A (zh) * | 2021-05-21 | 2021-08-24 | 深圳市智尊宝数据开发有限公司 | 信息检索方法、电子设备及相关产品 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103218435A (zh) * | 2013-04-15 | 2013-07-24 | 上海嘉之道企业管理咨询有限公司 | 一种中文文本数据聚类方法及系统 |
CN103258000A (zh) * | 2013-03-29 | 2013-08-21 | 北界创想(北京)软件有限公司 | 对网页中高频关键词进行聚类的方法及装置 |
-
2016
- 2016-11-30 CN CN201611089249.XA patent/CN106649616A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103258000A (zh) * | 2013-03-29 | 2013-08-21 | 北界创想(北京)软件有限公司 | 对网页中高频关键词进行聚类的方法及装置 |
CN103218435A (zh) * | 2013-04-15 | 2013-07-24 | 上海嘉之道企业管理咨询有限公司 | 一种中文文本数据聚类方法及系统 |
Non-Patent Citations (2)
Title |
---|
林元国 等: "K-means算法在关键词优化中的应用", 《计算机系统应用》 * |
邓健爽 等: "基于搜索引擎的关键词自动聚类法", 《计算机科学》 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108509426A (zh) * | 2018-04-11 | 2018-09-07 | 焦点科技股份有限公司 | 一种深度多维度流量语义分析方法 |
CN109101620A (zh) * | 2018-08-08 | 2018-12-28 | 广州神马移动信息科技有限公司 | 相似度计算方法、聚类方法、装置、存储介质及电子设备 |
CN109101620B (zh) * | 2018-08-08 | 2022-07-05 | 阿里巴巴(中国)有限公司 | 相似度计算方法、聚类方法、装置、存储介质及电子设备 |
CN110990711A (zh) * | 2019-05-13 | 2020-04-10 | 国家计算机网络与信息安全管理中心 | 基于机器学习的微信公众号推荐算法及系统 |
CN110990711B (zh) * | 2019-05-13 | 2023-05-12 | 国家计算机网络与信息安全管理中心 | 基于机器学习的微信公众号推荐方法及系统 |
CN111581494A (zh) * | 2020-04-08 | 2020-08-25 | 西窗科技(苏州)有限公司 | 一种互联网广告投放平台的关键词分类方法及分类系统 |
CN113297438A (zh) * | 2021-05-21 | 2021-08-24 | 深圳市智尊宝数据开发有限公司 | 信息检索方法、电子设备及相关产品 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106649616A (zh) | 一种聚类算法实现搜索引擎关键词优化 | |
CN100465954C (zh) | 用于搜索术语建议的多种类型数据的加强群集 | |
CN111061939B (zh) | 基于深度学习的科研学术新闻关键字匹配推荐方法 | |
CN103838756A (zh) | 一种确定推送信息的方法及装置 | |
CN112307182B (zh) | 一种基于问答系统的伪相关反馈的扩展查询方法 | |
US20100131496A1 (en) | Predictive indexing for fast search | |
CN105426529A (zh) | 基于用户搜索意图定位的图像检索方法及系统 | |
CN106933954A (zh) | 基于决策树分类算法实现搜索引擎优化技术 | |
Song et al. | An effective query recommendation approach using semantic strategies for intelligent information retrieval | |
CN103761286B (zh) | 一种基于用户兴趣的服务资源检索方法 | |
CN106909626A (zh) | 改进的决策树分类算法实现搜索引擎优化技术 | |
Yang et al. | FINN: Feedback Interactive Neural Network for Intent Recommendation | |
CN106933953A (zh) | 一种模糊k均值聚类算法实现搜索引擎优化技术 | |
Li et al. | Self-supervised learning-based weight adaptive hashing for fast cross-modal retrieval | |
CN106874376A (zh) | 一种验证搜索引擎关键词优化技术的方法 | |
CN106897356A (zh) | 改进的模糊c‑均值算法实现搜索引擎关键词优化 | |
CN106802945A (zh) | 基于VSM的模糊c均值聚类算法实现搜索引擎关键词优化 | |
CN115203514A (zh) | 商品查询重定向方法及其装置、设备、介质、产品 | |
CN106649537A (zh) | 基于改进的群智能算法实现搜索引擎关键词优化技术 | |
CN116662525A (zh) | 一种基于异构图神经网络的金融司法知识关联方法及系统 | |
CN106874377A (zh) | 改进的基于约束条件的聚类算法实现搜索引擎关键词优化 | |
CN106897376A (zh) | 基于蚁群的模糊c均值算法实现关键词优化 | |
Zhu et al. | Chinese texts classification system | |
CN106776915A (zh) | 一种新的聚类算法实现搜索引擎关键词优化 | |
Li et al. | Instance image retrieval with generative adversarial training |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20170510 |
|
WD01 | Invention patent application deemed withdrawn after publication |