CN106874376A - 一种验证搜索引擎关键词优化技术的方法 - Google Patents
一种验证搜索引擎关键词优化技术的方法 Download PDFInfo
- Publication number
- CN106874376A CN106874376A CN201710005813.3A CN201710005813A CN106874376A CN 106874376 A CN106874376 A CN 106874376A CN 201710005813 A CN201710005813 A CN 201710005813A CN 106874376 A CN106874376 A CN 106874376A
- Authority
- CN
- China
- Prior art keywords
- keyword
- cluster
- follows
- degree
- search engine
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
一种验证搜索引擎关键词优化技术的方法,根据企业业务确定核心关键词,搜索关键词对应的数据项,如本国每月搜索量、竞争程度和估算每次点击费用等,对上述关键词集合进行再降维处理,每个关键词用一五维向量表示,即增加首页网页数和总搜索页面数,进而由五维再降为四维,利用一种改进的密度聚类算法,初始化为k类,根据每个领域影响函数,挑选出符合条件的k个类,对上述k类再进行k‑means聚类处理,即可得到最佳分类,最后用模糊c均值聚类算法验证上述聚类结果的准确度,即为初始化隶属矩阵J,构建隶属约束条件,综合k类总目标函数,构建带有m个拉格朗日乘子的方程组,求出满足总目标函数最大的,根据判定条件可以得出最佳聚类结果。
Description
技术领域
本发明涉及语义网络技术领域,具体涉及一种验证搜索引擎关键词优化技术的方法。
背景技术
搜索引擎是人们获取网络资源的主要工具,随着Yahoo、Google等著名搜索引擎的出现,搜索引擎已经成为了网民获知网站的第一大入口,搜索引擎优化技术(SearchEngineOptimization,SEO)也逐渐发展起来,可以利用搜索引擎的优势在最短的时间内找到企业网站或者网页。搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。搜索引擎优化策略主要有域名策略、网页设计规划策略、关键词策略以及链接策略。核心策略是关键词优化策略。目前,对于关键词的选取大多凭借经验和主观因素,也没有一个完善的机制来管理关键词优化策略和进度。为使关键词的选取更具科学性和客观性,基于上述需求,本发明提供了一种验证搜索引擎关键词优化技术的方法。
发明内容
针对于关键词优化实现搜索引擎优化的技术问题,本发明提供了一种验证搜索引擎关键词优化技术的方法。
为了解决上述问题,本发明是通过以下技术方案实现的:
步骤1:根据企业业务确定核心关键词,利用搜索引擎搜集相关关键字,这些关键字在搜索引擎中有相应数据项,如本国每月搜索量、竞争程度和估算每次点击费用(CPC)等
步骤2:结合企业产品和市场分析,筛选降维上述搜索到的相关关键字集合;
步骤3:针对筛选降维后的关键词集合,通过搜索引擎搜索关键词对应的页面,这里记录首页网页数和总搜索页面数,即每个关键词由五维向量再降维为四维的。
步骤4:利用一种改进的密度聚类算法,对上述关键词进行聚类处理,其具体子步骤如下:
步骤4.1:利用基于ε领域的k-means算法初始化簇。
步骤4.2:初始化每一个ε领域的影响函数f(i,j)start,从数据对象集合D中按下述判定条件选择k个初始簇中心。
步骤4.3:对每类关键词i(i∈(1,2,…,m))进行重新分配,按概率函数p(i)选择聚类中心j′;
步骤4.4:根据判定函数Δ(f)的结果,重新计算各簇中心;
步骤4.5:如果簇中心发生变化,则转到步骤(2),否则迭代结束,输出聚类结果。
步骤5:利用模糊c均值聚类算法验证上述聚类结果的准确度,其具体的子步骤如下:
步骤5.1:用值[0,1]间的数初始化隶属矩阵J,使其满足隶属的整个约束条件
步骤5.2:根据影响函数f(i,j)构建k类总目标函数,再综合隶属的整个约束条件构建新的k类总目标函数,最后得出最佳k类中心
步骤5.3:得到的聚类中心与上述步骤4得到的聚类中心相比较,既可以验证改进的密度聚类算法结果的准确度
步骤6:根据企业具体情况,综合关键词效能优化和价值率优化,选择合适的关键词优化策略达到网站优化目标。
本发明有益效果是:
1,此算法可以精简关键词分析流程,进而减少整个网站优化工作量。
2,此算法的运行时间复杂度低,处理速度更快。
3、此算法具有更大的利用价值。
4、能帮助网站在短时间内快速提升其关键词的排名。
5、为企业网站带来一定的流量和询盘,从而达到理想的网站优化目标。
6、此算法分类结果的准确度更符合经验值。
7、此算法更简便有效。
8、数据处理的效果更好。
9、提供了一种验证聚类算法结果准确性的思想方法。
附图说明
图1一种验证搜索引擎关键词优化技术的方法结构流程图
图2一种改进的密度聚类算法在聚类分析中的应用流程图
图3模糊c均值聚类算法在验证结果准确度的结构流程图
具体实施方式
为了解决关键词优化实现搜索引擎优化的技术问题,结合图1-图3对本发明进行了详细说明,其具体实施步骤如下:
步骤1:根据企业业务确定核心关键词,利用搜索引擎搜集相关关键字,这些关键字在搜索引擎中有相应数据项,如本国每月搜索量、竞争程度和估算每次点击费用(CPC)等。
步骤2:结合企业产品和市场分析,筛选降维上述搜索到的相关关键字集合;
步骤3:针对筛选降维后的关键词集合,通过搜索引擎搜索关键词对应的页面,这里记录首页网页数和总搜索页面数,即每个关键词由五维向量再降维为四维的,其具体计算过程如下:
这里相关关键词个数为m,既有下列m×5矩阵:
Ni、Ldi、CPCi、NiS、NiY依次为第i个关键词对应的本国每月搜索量、竞争程度、估算每次点击费用(CPC)、首页网页数、总搜索页面数。
再降维为四维,即
Xi∈(1,2,…,m)为搜索效能,Zi∈(1,2,…,m)为价值率,即为下式:
步骤4:利用一种改进的密度聚类算法,对上述关键词进行聚类处理,其具体子步骤如下:
步骤4.1:利用基于ε领域的k-means算法初始化簇。
步骤4.2:初始化每一个ε领域的影响函数f(i,j)start,从数据对象集合D中按下述判定条件选择k个初始簇中心,其具体计算过程如下:
上式Nε为j类ε领域内数据对象的个数,d(i,j)为关键词i到对应ε领域内簇中心的距离,σ为簇中心的期望值。
上式xih为ε领域内第i个关键词对应的向量,yjh为ε领域中的簇中心数据对象的向量。
判定条件如下:
f(i,j)start>γ
γ为设定好的阈值,只有满足上式条件则归为一簇。
步骤4.3:对每类关键词i(i∈(1,2,…,m)进行重新分配,按概率函数p(i)选择聚类中心j′,其具体计算过程如下:
按p(i)值最大选择对应的聚类中心j′。
步骤4.4:根据判定函数Δ(f)的结果,重新计算各簇中心,其具体计算过程如下:
Δ(f)=f(i,j)new-f(i,j)old>0
满足上式,则重新计算各簇中心。
步骤4.5:如果簇中心发生变化,则转到步骤(2),否则迭代结束,输出聚类结果。
步骤5:利用模糊c均值聚类算法验证上述聚类结果的准确度,其具体的子步骤如下:
步骤5.1:用值[0,1]间的数初始化隶属矩阵J,使其满足隶属的整个约束条件,其具体计算过程如下:
上式wij为关键词i属于j类的程度系数,即j∈(1,2,…,k)、i∈(1,2,…,m)。
初始化隶属矩阵J为m×k:
隶属的整个约束条件为:
步骤5.2:根据影响函数f(i,j)构建k类总目标函数,再综合隶属的整个约束条件构建新的k类总目标函数,最后得出最佳k类中心,其具体计算过程如下:
k类总目标函数f(i,j)∑j∈k:
新的k类总目标函数f(i,j1,j2,…,jk,λ1,…,λm)∑j∈k:
上式λi(i=1,2,…,m)是隶属的整个约束条件的拉格朗日乘子。对所有参量求导,使式f(i,j)∑j∈k达到最大的必要条件为:
上式为关键词i所对应的向量;
步骤5.3:得到的聚类中心与上述步骤4得到的聚类中心相比较,既可以验证改进的密度聚类算法结果的准确度,其具体计算过程如下:
准确度公式为
上式为应用步骤4得出的k个簇,为应用步骤5得出的k个簇,γ为阈值,满足条件则验证上述结果正确,否则错误。
步骤6:根据企业具体情况,综合关键词效能优化和价值率优化,选择合适的关键词优化策略达到网站优化目标。
一种验证搜索引擎关键词优化技术的方法,其伪代码过程
输入:网站提取的核心关键词,基于ε领域初始化簇
输出:网站最优关键词。
Claims (2)
1.一种验证搜索引擎关键词优化技术的方法,本发明涉及语义网络技术领域,具体涉及一种验证搜索引擎关键词优化技术的方法,其特征是,包括如下步骤:
步骤1:根据企业业务确定核心关键词,利用搜索引擎搜集相关关键字,这些关键字在搜索引擎中有相应数据项,如本国每月搜索量、竞争程度和估算每次点击费用(CPC)等
步骤2:结合企业产品和市场分析,筛选降维上述搜索到的相关关键字集合;
步骤3:针对筛选降维后的关键词集合,通过搜索引擎搜索关键词对应的页面,这里记录首页网页数和总搜索页面数,即每个关键词由五维向量再降维为四维的,其具体计算过程如下:
这里相关关键词个数为m,既有下列矩阵:
、、、、依次为第i个关键词对应的本国每月搜索量、竞争程度、估算每次点击费用(CPC)、首页网页数、总搜索页面数再降维
为四维,即
为搜索效能,为价值率,即为下式:
步骤4:利用一种改进的密度聚类算法,对上述关键词进行聚类处理,其具体子步骤如下:
步骤4.1:利用基于领域的k-means算法初始化簇
步骤4.2:初始化每一个领域的影响函数,从数据对象集合D中按下述判定条件选择k个初始簇中心,其具体计算过程如下:
上式为j类领域内数据对象的个数,为关键词i到对应领域内簇中心的距离,为簇中心的期望值
上式为领域内第i个关键词对应的向量,为领域中的簇中心数据对象的向量
判定条件如下:
为设定好的阈值,只有满足上式条件则归为一簇
步骤4.3:对每类关键词进行重新分配,按概率函数p(i)选择聚类中心,其具体计算过程如下:
按值最大选择对应的聚类中心
步骤4.4:根据判定函数的结果,重新计算各簇中心,其具体计算过程如下:
满足上式,则重新计算各簇中心
步骤4.5:如果簇中心发生变化,则转到步骤(2),否则迭代结束,输出聚类结果
步骤5:利用模糊c均值聚类算法验证上述聚类结果的准确度,其具体的子步骤如下:
步骤5.1:用值[0,1]间的数初始化隶属矩阵J,使其满足隶属的整个约束条件
步骤5.2:根据影响函数构建k类总目标函数,再综合隶属的整个约束条件构建新的k类总目标函数,最后得出最佳k类中心
步骤5.3:得到的聚类中心与上述步骤4得到的聚类中心相比较,既可以验证改进的密度聚类算法结果的准确度
步骤6:根据企业具体情况,综合关键词效能优化和价值率优化,选择合适的关键词优化策略达到网站优化目标。
2.根据权利要求1中所述的一种验证搜索引擎关键词优化技术的方法,其特征是,以上所述步骤5中的具体计算过程如下:
步骤5:利用模糊c均值聚类算法验证上述聚类结果的准确度,其具体的子步骤如下:
步骤5.1:用值[0,1]间的数初始化隶属矩阵J,使其满足隶属的整个约束条件,其具体计算过程如下:
上式为关键词i属于j类的程度系数,即、
初始化隶属矩阵J为:
隶属的整个约束条件为:
步骤5.2:根据影响函数构建k类总目标函数,再综合隶属的整个约束条件构建新的k类总目标函数,最后得出最佳k类中心,其具体计算过程如下:
k类总目标函数:
新的k类总目标函数:
上式是隶属的整个约束条件的拉格朗日乘子,对所有参量求导,使式达到最大的必要条件为:
上式为关键词i所对应的向量;
步骤5.3:得到的聚类中心与上述步骤4得到的聚类中心相比较,既可以验证改进的密度聚类算法结果的准确度,其具体计算过程如下:
准确度公式为:
上式为应用步骤4得出的k个簇,为应用步骤5得出的k个簇,为阈值,满足条件则验证上述结果正确,否则错误。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710005813.3A CN106874376A (zh) | 2017-01-04 | 2017-01-04 | 一种验证搜索引擎关键词优化技术的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710005813.3A CN106874376A (zh) | 2017-01-04 | 2017-01-04 | 一种验证搜索引擎关键词优化技术的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106874376A true CN106874376A (zh) | 2017-06-20 |
Family
ID=59165594
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710005813.3A Pending CN106874376A (zh) | 2017-01-04 | 2017-01-04 | 一种验证搜索引擎关键词优化技术的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106874376A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109800296A (zh) * | 2019-01-21 | 2019-05-24 | 四川长虹电器股份有限公司 | 一种基于用户真实意图的语意模糊识别方法 |
CN110287440A (zh) * | 2019-06-27 | 2019-09-27 | 北京金山安全软件有限公司 | 搜索引擎优化方法、装置、计算机设备及计算机可读存储介质 |
CN110659930A (zh) * | 2019-08-27 | 2020-01-07 | 深圳大学 | 基于用户行为的消费提质方法、装置、存储介质及设备 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103218435A (zh) * | 2013-04-15 | 2013-07-24 | 上海嘉之道企业管理咨询有限公司 | 一种中文文本数据聚类方法及系统 |
CN103258000A (zh) * | 2013-03-29 | 2013-08-21 | 北界创想(北京)软件有限公司 | 对网页中高频关键词进行聚类的方法及装置 |
-
2017
- 2017-01-04 CN CN201710005813.3A patent/CN106874376A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103258000A (zh) * | 2013-03-29 | 2013-08-21 | 北界创想(北京)软件有限公司 | 对网页中高频关键词进行聚类的方法及装置 |
CN103218435A (zh) * | 2013-04-15 | 2013-07-24 | 上海嘉之道企业管理咨询有限公司 | 一种中文文本数据聚类方法及系统 |
Non-Patent Citations (2)
Title |
---|
林元国 等: "K-means算法在关键词优化中的应用", 《计算机系统应用》 * |
邓健爽 等: "基于搜索引擎的关键词自动聚类法", 《计算机科学》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109800296A (zh) * | 2019-01-21 | 2019-05-24 | 四川长虹电器股份有限公司 | 一种基于用户真实意图的语意模糊识别方法 |
CN109800296B (zh) * | 2019-01-21 | 2022-03-01 | 四川长虹电器股份有限公司 | 一种基于用户真实意图的语意模糊识别方法 |
CN110287440A (zh) * | 2019-06-27 | 2019-09-27 | 北京金山安全软件有限公司 | 搜索引擎优化方法、装置、计算机设备及计算机可读存储介质 |
CN110287440B (zh) * | 2019-06-27 | 2021-08-24 | 北京金山安全软件有限公司 | 搜索引擎优化方法、装置、计算机设备及计算机可读存储介质 |
CN110659930A (zh) * | 2019-08-27 | 2020-01-07 | 深圳大学 | 基于用户行为的消费提质方法、装置、存储介质及设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110222160A (zh) | 智能语义文档推荐方法、装置及计算机可读存储介质 | |
CN106874376A (zh) | 一种验证搜索引擎关键词优化技术的方法 | |
CN106649616A (zh) | 一种聚类算法实现搜索引擎关键词优化 | |
CN106933954A (zh) | 基于决策树分类算法实现搜索引擎优化技术 | |
CN112055038B (zh) | 生成点击率预估模型的方法及预测点击概率的方法 | |
CN106933953A (zh) | 一种模糊k均值聚类算法实现搜索引擎优化技术 | |
Li et al. | From edge data to recommendation: A double attention-based deformable convolutional network | |
CN112287674B (zh) | 企业间同名大节点识别方法、系统、电子设备及存储介质 | |
Zhang et al. | Image annotation of ancient Chinese architecture based on visual attention mechanism and GCN | |
CN106909626A (zh) | 改进的决策树分类算法实现搜索引擎优化技术 | |
CN111753151B (zh) | 一种基于互联网用户行为的服务推荐方法 | |
Saravanan et al. | Enhanced text mining approach based on ontology for clustering research project selection | |
Zhang et al. | Bilinear graph neural network-enhanced Web services classification | |
Kim et al. | A deep bidirectional similarity learning model using dimensional reduction for multivariate time series clustering | |
CN106897376A (zh) | 基于蚁群的模糊c均值算法实现关键词优化 | |
CN106897356A (zh) | 改进的模糊c‑均值算法实现搜索引擎关键词优化 | |
CN106649537A (zh) | 基于改进的群智能算法实现搜索引擎关键词优化技术 | |
CN111061939B (zh) | 基于深度学习的科研学术新闻关键字匹配推荐方法 | |
CN106802945A (zh) | 基于VSM的模糊c均值聚类算法实现搜索引擎关键词优化 | |
CN106874377A (zh) | 改进的基于约束条件的聚类算法实现搜索引擎关键词优化 | |
CN113688421A (zh) | 基于隐私保护的预测模型更新方法及装置 | |
CN113256024A (zh) | 一种融合群体行为的用户行为预测方法 | |
Liu et al. | A community detection algorithm for heterogeneous information networks | |
Rahangdale et al. | Clustering-based transductive semi-supervised learning for learning-to-rank | |
CN106599118A (zh) | 一种改进的密度聚类算法实现搜索引擎关键词优化 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20170620 |
|
WD01 | Invention patent application deemed withdrawn after publication |