CN106776937B - 一种确定内链关键词的方法和装置 - Google Patents

一种确定内链关键词的方法和装置 Download PDF

Info

Publication number
CN106776937B
CN106776937B CN201611094197.5A CN201611094197A CN106776937B CN 106776937 B CN106776937 B CN 106776937B CN 201611094197 A CN201611094197 A CN 201611094197A CN 106776937 B CN106776937 B CN 106776937B
Authority
CN
China
Prior art keywords
keywords
core
keyword
search
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201611094197.5A
Other languages
English (en)
Other versions
CN106776937A (zh
Inventor
梁宇轩
吴康瑞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201611094197.5A priority Critical patent/CN106776937B/zh
Publication of CN106776937A publication Critical patent/CN106776937A/zh
Application granted granted Critical
Publication of CN106776937B publication Critical patent/CN106776937B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3334Selection or weighting of terms from queries, including natural language queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种确定内链关键词的方法及装置,在对预处理文本设置内链关键词时,会对预处理文本的核心关键词进行扩展,得到核心关键词的相关关键词,然后将相关关键词和预处理文本的内容进行匹配,得到预处理文本的待处理关键词,通过将各待处理关键词替换成相匹配的关联有链接相关关键词,实现对关键词内链的自动添加。由于本发明中预处理文本的关键词是通过与核心关键词的相关关键词匹配得到,因此相比人工设置关键词而言,大大提高了内链关键词的提取精度。

Description

一种确定内链关键词的方法和装置
技术领域
本发明涉及网络通信技术领域,更具体的说,涉及一种确定内链关键词的方法及装置。
背景技术
网站内链指的是在同一网站域名下的内容页面之间的相互链接,合理的网站内链构造,能提高搜索引擎的收录与网站权重,同时还有助于提高搜索引擎对网站的爬行索引效率,网站的搜录等。网站内链的优化主要是通过内链关键词(页面中关联有链接的关键词)实现,因此内链关键词的合理与否,不仅影响内容页面之间的转化率,还会影响网站发展和网站后期排名。
传统方案中,在对需设置内链的页面等预处理文本,设置内链关键词时,一般是人工从页面等预处理文本中设置关键词,并手动添加关键词关联的链接,实现页面等预处理文本中内链关键词的确定;这种方式存在内链关键词的确定精度较低的问题。
发明内容
有鉴于此,本发明公开一种确定内链关键词的方法及装置,以解决传统方案中内链关键词的提取精度较低的问题。
一种确定内链关键词的方法,包括:
获取预处理文本的核心关键词;
对所述核心关键词进行扩展,得到所述核心关键词的相关关键词;其中,所述相关关键词关联有链接,且所述相关关键词至少根据所述核心关键词的搜索结果确定;
将所述预处理文本的内容与所述相关关键词进行匹配,确定所述预处理文本中的待处理关键词;
将所述预处理文本中的各待处理关键词,替换成相匹配的关联有链接的相关关键词。
一种确定内链关键词的装置,包括:
获取单元,用于获取预处理文本的核心关键词;
扩展单元,用于对所述核心关键词进行扩展,得到所述核心关键词的相关关键词;其中,所述相关关键词关联有链接,且所述相关关键词至少根据所述核心关键词的搜索结果确定;
匹配单元,用于将所述预处理文本的内容与所述相关关键词进行匹配,确定所述预处理文本中的待处理关键词;
替换单元,用于将所述预处理文本中的各待处理关键词,替换成相匹配的关联有链接的相关关键词。
从上述的技术方案可知,本发明在对预处理文本设置内链关键词时,会对预处理文本的核心关键词进行扩展,得到核心关键词的相关关键词,然后将相关关键词和预处理文本的内容进行匹配,得到预处理文本的待处理关键词,通过将各待处理关键词替换成相匹配的关联有链接相关关键词,实现对关键词内链的自动添加。由于本发明中预处理文本的关键词是通过与核心关键词的相关关键词匹配得到,因此相比人工设置关键词而言,大大提高了内链关键词的提取精度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据公开的附图获得其他的附图。
图1为本发明实施例公开的一种确定内链关键词的方法流程图;
图2为本发明实施例公开的一种对核心关键词进行扩展,得到核心关键词的相关关键词的方法流程图;
图3为本发明实施例公开的一种相关关键词的筛选方法流程图;
图4为本发明实施例公开的一种确定内链关键词的方法流程图;
图5为本发明实施例公开的一种对核心关键词进行扩展,得到核心关键词的相关关键词的方法流程图;
图6为本发明实施例公开的另一种对核心关键词进行扩展,得到核心关键词的相关关键词的方法流程图;
图7为本发明实施例公开的一种客户端与网络数据库交互的信令图;
图8为本发明实施例公开的另一种客户端与网络数据库交互的信令图
图9为本发明实施例公开的一种获取相关关键词关联的链接的信令图;
图10为本发明实施例公开的一种确定内链关键词的装置结构示意图;
图11为本发明实施例公开的一种扩展单元的组成结构示意图;
图12为本发明实施例公开的一种第一确定子单元的组成结构示意图;
图13为本发明实施例公开的另一种确定内链关键词的装置结构示意图;
图14为本发明实施例公开的一种扩展单元的组成结构示意图;
图15为本发明实施例公开的另一种扩展单元的组成结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为方便对本申请文件的理解,现对一些词语解释如下:
关键词排名:关键词排名是一种在搜索引擎搜索结果中以字、词、词组的相关性体现网页排名的方式。可以分为关键词自然排名以及各搜索引擎提供的关键词竞价排名服务两种。关键词自然排名一般是搜索引擎对所有相关网页抓取结果自动分析、自动排名的体现,一般可以通过SEO(Search Engine Optimization,搜索引擎优化)优化技术来达到关键词排名提升。关键词竞价排名服务是由搜索引擎提供的一种有偿排名服务。
关键词排名优化是指:通过各种搜索引擎优化(SEO)方式,使网站的关键词在搜索引擎自然排名中靠前。如用户通过搜索引擎搜索关键词“电动车”,在搜索界面左侧会显示多个包含有“电动车”的网站,这些网站的排序是根据网站相关性和重要性等参数确定的,排名越靠前,表明该网站在行业的影响力越大。
一个网站若想快速提高栏目和文章的排名,其内链结构的合理布局必不可少。并且合理的网站内链构造,还能提高搜索引擎的收录与网站权重,同时还有助于提高搜索引擎对网站的爬行索引效率,网站的搜录等。网站内链的优化主要是通过内链关键词实现,而内链关键词排名的优化取决于内链关键词的精度,因此,如何提高内链关键词的精度是本领域技术人员亟需解决的问题。
本发明实施例公开了一种确定内链关键词的方法及装置,以解决传统方案中内链关键词的提取精度较低的问题。
如图1所示,本发明实施例公开的一种确定内链关键词的方法流程图,该方法包括步骤:
步骤S101、获取预处理文本的核心关键词;
具体的,预处理文本包括:已编辑完成但未设置内链关键词的文本,以及已经确定编辑主题但未编辑的文本。
核心关键词可以根据官网内容进行定义,一般为产品名,如推广“使命召唤”游戏,则核心关键词可选用“使命召唤”。
步骤S102、对所述核心关键词进行扩展,得到所述核心关键词的相关关键词;
其中,所述相关关键词关联有链接,且所述相关关键词至少根据所述核心关键词的搜索结果确定。
具体的,对核心关键词进行扩展可以通过将核心关键词输入到搜索引擎(如百度引擎、谷歌引擎),然后从关于核心关键词的搜索结果中确定核心关键词的相关关键词实现。如核心关键词为“使命召唤”,将“使命召唤”输入到搜索引擎,得到关于“使命召唤”的搜索结果,然后从该搜索结果中确定“使命召唤”的相关关键词,如韩寒(韩寒代言了使命召唤)、1246战队(使命召唤游戏比赛战队)、AN94地狱行者(使命召唤游戏中的枪)、赏金猎人(使命召唤里的游戏角色)等,其中,确定这些相关关键词都关联有链接。
对核心关键词进行扩展还可以通过在数据库中查找与该核心关键词匹配的核心关键词对应的相关关键词实现,其中数据库中记录有很多个核心关键词以及每个核心关键词对应的相关关键词。如核心关键词为“使命召唤”,将“使命召唤”与数据库中记录的各核心关键词匹配,如数据库中与“使命召唤”匹配到的核心关键词为“使命召唤游戏”,则数据库中记录的“使命召唤游戏”对应相关关键词即是“使命召唤”的相关关键词。
步骤S103、将所述预处理文本的内容与所述相关关键词进行匹配,确定所述预处理文本中的待处理关键词;
具体的,当预处理文本已编辑完成时,可以将预处理文本的内容直接与各相关关键词进行匹配,确定预处理文本中的待处理关键词;当预处理文本已经确定编辑主题但未编辑时,可以首先查找一些与预处理文本编辑主题相近的文本,然后将这些主题相近的文本作为预处理文本与各相关关键词进行匹配,以确定预处理文本中的待处理关键词。
当预处理文本中记录有与相关关键词完全相同的文字内容时,则将该相同的文字内容作为预处理文本中的待处理关键词;当预处理文本中记录的是与相关关键词相近的文字内容时,则将该相近的文字内容作为预处理文本中的待处理关键词,如预处理文本中记录的是“使命召唤”,相关关键词为“使命召唤游戏”,则将“使命召唤”作为预处理文本中的待处理关键词。
在一实施例中,可以采用正则表达式索引出预处理文本中的备用待处理关键词,然后将备用待处理关键词与各相关关键词进行匹配,确定预处理文本中的待处理关键词。
正则表达式(英文名称:Regular Expression,在代码中常简写为regex、regexp或RE),又称规则表达式,是对字符串操作的一种逻辑公式,即用事先定义好的一些特定字符以及这些特定字符的组合,组成一个“规则字符串”,利用该“规则字符串”来表达对字符串的一种过滤逻辑。“规则字符串”由普通字符(例如字符a到z)以及特殊字符(称为“元字符”)组成。具体的,首先给定一个正则表达式和所要搜索的字符串(如上述的预处理文本),然后将正则表达式作为一个模板,将某个字符模式与所要搜索的字符串进行匹配,可以达到如下目的:
(1)判定给定的字符串是否符合正则表达式的过滤逻辑(称作“匹配”);
(2)可通过正则表达式,从字符串中获取需要的特定部分(如预处理文本中的备用待处理关键词)。
因此,步骤S103中,可以采用正则表达式索引出预处理文本中的备用待处理关键词。本实施例中,正则表达式具有的过滤逻辑可以包括:①过滤掉“停用词”,如“的”、“是”、“在”等等;②过滤掉文本中出现频率较小的词;③过滤掉一些常用词语,如“中国”。其中,本实施例中,正则表达式具有的过滤逻辑包括但不局限于上述三种情况。
步骤S104、将所述预处理文本中的各待处理关键词,替换成相匹配的关联有链接的相关关键词。
具体的,当预处理文本已编辑完成时,可以利用查找替换工具,直接将预处理文本中的各待处理关键词,替换成相匹配的关联有链接的相关关键词。
当预处理文本未编辑完成时,可以在文本编辑过程中,将各待处理关键词,替换成相匹配的关联有链接的相关关键词。
需要说明的是,文本中的内链关键词并不是越多越好,若一个文本中内链关键词添加过多,就容易使搜索引擎对文本产生作弊的嫌疑,这样不仅不会提高搜索引擎的收录与网站权重,反而会降低搜索引擎的收录与网站权重。因此,在编辑文本中添加内链关键词时,可采用如下几点建议:①文本标题部分可添加内链关键词,但该内链关键词是未关联链接的关键词,在实际应用中,网站技术人员可以手动去掉内链关键词相关联的链接;②可以在文章的首段、中间和结尾,添加内链关键词;③整个文本中的内链关键词的个数最好为7个或8个。
综上可知,本发明在对预处理文本设置内链关键词时,会对预处理文本的核心关键词进行扩展,得到核心关键词的相关关键词,然后将相关关键词和预处理文本的内容进行匹配,得到预处理文本的待处理关键词,通过将各待处理关键词替换成相匹配的关联有链接相关关键词,实现对关键词内链的自动添加。由于本发明中预处理文本的关键词是通过与核心关键词的相关关键词匹配得到,因此相比人工设置关键词而言,大大提高了内链关键词的提取精度。
另外,本发明还实现了对预处理文本中内链关键词的自动添加,相比传统手动添加内链关键词的链接而言,本发明大大提高了内链关键词的链接的添加效率。
在一实施例中,如图2所示,对核心关键词进行扩展,得到核心关键词的相关关键词的过程包括步骤:
步骤S201、模拟对核心关键词的搜索行为;
具体的,可以基于Node.js,使用PhantomJs模拟用户在搜索引擎对核心关键词的搜索行为。
Node.js是一个基于Chrome V8引擎的JavaScript运行环境。Node.js对一些特殊用例进行了优化,提供了替代的API(Application Programming Interface,应用程序编程接口),使Chrome V8在非浏览器环境下运行得更好。
PhantomJs是一个基于WebKit的服务器端JavaScript API。PhantomJs能够全面支持web而不需浏览器支持,可以用于页面自动化、网络监测、页面解屏以及无界面测试等。
步骤S202、发出对所述核心关键词的搜索请求;
具体的,在对核心关键词进行搜索前,会在基于Node.js的运行环境显示搜索引擎,该搜索引擎可以是预先配置的;然后向搜索引擎发出对核心关键词的搜索请求,模拟用户在搜索引擎对核心关键词的搜索行为。
步骤S203、接收所述核心关键词的搜索结果;
具体的,搜索引擎对核心关键词进行搜索,查找到核心关键词的相关关键词,并输出查找到的相关关键词,如核心关键词为“使命召唤”,查找到的“使命召唤”的相关关键词可以包括:韩寒(韩寒代言了使命召唤)、1246战队(使命召唤游戏比赛战队)、AN94地狱行者(使命召唤游戏中的枪)、赏金猎人(使命召唤里的游戏角色)。
步骤S204、至少根据所述搜索结果确定所述核心关键词的相关关键词。
可以理解的是,根据核心关键词会搜索到的很多相关关键词,为提高相关关键词的精度,在实际中可以将与核心关键词关联度较高的关键词确定为核心关键词的相关关键词。
具体的,可以从搜索结果中,提取与核心关键词的关联度,满足预设关联度要求(具体数值可依据实际需要而定)的相关关键词。如相关关键词“使命召唤游戏”与核心关键词“使用召唤”的关联度为80%,80%超过预设关联度65%,因此将“使命召唤游戏”确定为“使用召唤”的相关关键词。
综上可知,本发明基于Node.js,使用PhantomJs模拟用户在搜索引擎对核心关键词的搜索行为,能够实现对内链关键词的自动抓取,并且能够实现内链关键词在预处理文本中的自动添加。因此,相关传统方案而言,本发明实现了在网站建设过程中,对网站内链SEO的自动优化。
可以理解的是,仅通过搜索核心关键词得到的相关关键词,不一定是核心关键词的优选相关关键词,如通过搜索核心关键词“使命召唤”得到相关关键词“韩寒(韩寒代言了使命召唤)”。当预处理文本的编辑主题为游戏中各武器的使用方法时,很显然,预处理文本中不会多次提及“韩寒”这一相关关键词,这样,对于该预处理文本而言,“韩寒”就可以认为是“使命召唤”的非优选相关关键词。
因此,本发明为提高相关关键词的精度,在另一实施例中,如图3所示,提供了一种相关关键词的筛选方法,即步骤S204具体可以包括步骤:
步骤S301、根据搜索结果执行至少两次模拟搜索;
其中,下一次模拟搜索的搜索关键词,根据上一次的搜索结果确定。如核心关键词为“使命召唤”,第一次搜索时,将“使命召唤”作为搜索关键词,搜索得到“使命召唤”的一个相关关键词“使命召唤游戏”;第二次搜索时,将“使命召唤游戏”作为第二次搜索的搜索关键词,搜索得到“使命召唤游戏”的相关关键词,如“使命召唤游戏大全”。
需要说明的是,本步骤中下一次模拟搜索的搜索关键词,都是根据上一次的搜索结果确定,因此,本步骤执行的搜索过程可以认为是一种迭代搜索。可以理解的是,当对每一个相关关键词进行迭代搜索时,并不是迭代搜索的次数越多越好,很多情况下,迭代搜索的次数越多,搜索得到的搜索关键词与核心关键词的关联度越小。所以为避免因迭代搜索带来的无用功,本申请中对每个相关关键词的迭代搜索的次数优选为2次,最多不超过3次。
步骤S302、确定每次模拟搜索的搜索结果,与所述核心关键词的关联度;
如“使命召唤游戏”与“使命召唤”的关联度为80%,“使命召唤游戏大全”与“使命召唤”的关联度为70%。
步骤S303、将关联度满足预设关联度要求的搜索结果,对应的搜索关键词作为相关关键词。
如预设关联度要求为75%,则将“使命召唤游戏”确定为“使命召唤”的相关关键词。
当多次搜索结果与核心关键词的关联度均满足预设关联度要求时,可以将关联度值相对较大的搜索结果,对应的搜索关键词作为相关关键词;或是将所有关联度满足预设关联度要求的搜索结果,对应的搜索关键词均作为相关关键词。
综上可知,本发明首先对核心关键词进行模拟搜索得到相关关键词,然后采用依次对各相关关键词循环搜索的方式,查找到与核心关键词的关联度相对高的相关关键词,并将关联度高的相关关键词确认为核心关键词的相关关键词。本发明通过对各相关关键词循环搜索提高了对相关关键词的提取精度,从而提高了内链关键词的精度。
可以理解的是,当通过对某个核心关键词进行扩展,得到该核心关键词的相关关键词后,可以将核心关键词和相对应的相关关键词以对应关系的形式写入数据库,以便后续在数据库中查找确定内链关键词。
因此,为进一步优化上述实施例,如图4所示,本发明另一实施例公开的一种确定内链关键词的方法流程图,在步骤S102之后,还可以包括步骤:
步骤S401、在数据库创建云端数据库表;
其中,本步骤中的数据库指的是网络数据库。
具体的,云端数据库表的表名可以命名为:关键词(keywords),云端数据库表的字段名包括:数据库索引(可用ID表示)、核心关键词、核心关键词对应的相关关键词(可用keywords)、每个相关关键词的链接(可用URL表示)。
需要说明的是,数据库索引是对数据库表中一列或多列的值进行排序的一种结果,使用数据库索引可快速访问数据库表中的特定信息。
从上述论述可知,一个核心关键词同时与多个相关关键词相对应,当云端数据库表中有多个核心关键词时,数据库列表中会相应有很多个相关关键词。这样,当将预处理文本的内容与云端数据库表中的相关关联词进行匹配时,必然会耗费很长时间。因此,本发明为提高预处理文本与云端数据库列表中各相关关键词的匹配速度,在云端数据库表中增加了数据库索引,以便快速查找到与预处理文本的内容匹配的相关关键词。
本领域技术人员可以理解的是,对企业、商家而言,核心关键词就是他们的经营范围,如产品/服务名称、行业定位,以及企业名称或品牌名称等。因此,避免不了某些核心关键词的字数较多,如“租房和买卖房”,因此,为减少核心关键词在数据库中的占用空间,可以对各个核心关键词设置一个业务名(Service),如核心关键词为“租房和买卖房”时,相对应的业务名可以选用“房屋中介”。
步骤S402、将所述核心关键词,所述核心关键词相对应的相关关键词写入云端数据库表,其中,所述相关关键词关联有链接。
具体的,当将核心关键词写入云端数据库表时,为保证写入的核心关键词和云端数据库列表中记录的核心关键词不重复,还需对核心关键词的有效性进行验证,将有效的核心关键词及相对应的相关关键词写入所述云端数据库表。
其中,有效的核心关键词指的是:云端数据库表中不存在与该核心关键词的关联度满足预设关联要求的核心关键词。
在一实施例中,如图5所示,对核心关键词进行扩展,得到核心关键词的相关关键词的过程包括步骤:
步骤S501、从数据库中查找与核心关键词匹配的核心关键词,所述数据库中记录有:数据库索引、核心关键词、核心关键词对应的相关关键词以及每个相关关键词的链接;
具体的,当数据库中的核心关键词以业务名进行存储时,从数据库中查找与核心关键词匹配的核心关键词具体为:从数据库中查找业务名与核心关键词的业务名匹配的核心关键词。
步骤S502、将查找到的核心关键词对应的相关关键词,确定为核心关键词的相关关键词。
在一实施例中,如图6所示,对核心关键词进行扩展,得到核心关键词的相关关键词的过程包括步骤:
步骤S601、将核心关键词与数据库存储的各核心关键词进行匹配,判断所述数据库中是否存储有与所述核心关键词匹配的核心关键词,如果是,则执行步骤S602,否则,执行步骤S603;
其中,本步骤中的数据库指的是网络数据库。
步骤S602、从所述数据库中查找与核心关键词对应的相关关键词;
步骤S603、模拟用户在搜索引擎上对所述核心关键词的搜索行为,至少根据所述核心关键词的搜索结果确定所述核心关键词的相关关键词。
其中,模拟用于在搜索引擎上对核心关键词的搜索行为的具体过程请参见上述实施例,此次不再赘述。
在一实施例中,如图7和图8所示,提供了一种客户端与网络数据库交互的信令图,交互过程包括步骤:
步骤S701、客户端向网络数据库发送查找与核心关键词匹配的核心关键词的查找请求;
步骤S702、网络数据库将核心关键词与预存储的各核心关键词进行匹配,当查找到与核心关键词匹配的核心关键词时,执行步骤S703;当未查找到与核心关键词匹配的核心关键词时,执行步骤S705;
步骤S703、将核心关键词对应的相关关键词发送给客户端;
步骤S704、客户端输出核心关键词的相关关键词;
步骤S705、向客户端发送未查找到匹配的核心关键词的响应;
步骤S706、模拟用户在搜索引擎上对核心关键词的搜索行为,至少根据核心关键词的搜索结果确定核心关键词的相关关键词。
本领域技术人员可以理解的是,一个内链关键词的链接可以有1个或多个,因此,相应的本发明中相关关键词关联的链接也可以有1个或多个。当内链关键词关联的链接有多个时,若编辑者没有对内链关键词的链接进行筛选或排序,则当该内链关键词在文本中显示时,点击该内链关关键词显示的链接会是多个链接中随机选取的一个链接。
为实现对内链关键词的优化,除对内链关键词的关键词进行筛选优化外,还可以对内链关键词关联的链接进行筛选优化,在实际中,在对内链关键词关联的链接进行筛选优化时,可以用户在官网的购买(点击内链关键词后,页面跳转至用户在官网的购买界面,如京东)、品牌展示效果(点击内链关键词后,页面跳转至品牌展示效果界面,手机官网界面)和游戏内容展示效果(点击内链关键词后,页面跳转至游戏内容展示效果界面,如“使命召唤”游戏界面)作为筛选依据。其中,内链关键词的链接优选为三个。
在一实施例中,如图9所示,在模拟用户对核心关键词的搜索行为时,获取相关关键词关联的链接的过程包括步骤:
步骤S801、客户端向服务器发送查找相关关键词关联的链接的查找请求;
步骤S802、服务器响应客户端发送的查找请求,并向桥接器发起查找相关关键词关联的链接的工作请求;
桥接器是一种用于在两个或多个网段或子网间提供通信路径的互联设备,其可以连接两个相似或不相似的LAN网段。桥接器可以看作是一个邮件分类装置,其通过查看数据分组的地址,可以将数据发送到合适的网段。
步骤S803、桥接器根据接收到的工作请求,向搜索引擎服务器发送执行获取相关关键词关联的链接的工作指令;
步骤S804、搜索引擎服务器根据工作指令,从之前存储的相关关键词的链接数据中,获取相关关键词关联的链接数据,并将链接数据发送给桥接器;
需要说明的是,搜索引擎服务器用于为访客保存之前的网页快照内容,以在访客在无法打开某个搜索结果,或者打开速度特别慢的情况下,为访客提供之前保存的网页内容的纯文本。其中,搜索引擎服务器保存的网页快照内容一般只包括文本数据,而图片及其他多媒体等非文本数据并不会保存。
本实施例中,当搜索引擎服务器接收到桥接器发送的工作指令后,会从之前保存的网页快照内容中,查找相关关键词的链接数据。
步骤S805、桥接器将链接数据转发给服务器;
步骤S806、服务器将链接数据在转发给客户端。
与上述方法实施例相对应,本发明还公开了一种确定内链关键词的装置。
如图10所示,本发明实施例公开的一种确定内链关键词的装置结构示意图,该装置包括:
获取单元901,用于获取预处理文本的核心关键词;
具体的,预处理文本包括:已编辑完成但未设置内链关键词的文本,以及已经确定编辑主题但未编辑的文本。
核心关键词可以根据官网内容进行定义,一般为产品名,如推广“使命召唤”游戏,则核心关键词可选用“使命召唤”。
扩展单元902,用于对所述核心关键词进行扩展,得到所述核心关键词的相关关键词;其中,所述相关关键词关联有链接,且所述相关关键词至少根据所述核心关键词的搜索结果确定;
具体的,对核心关键词进行扩展可以通过将核心关键词输入到搜索引擎(如百度引擎、谷歌引擎),然后从关于核心关键词的搜索结果中确定核心关键词的相关关键词实现。如核心关键词为“使命召唤”,将“使命召唤”输入到搜索引擎,得到关于“使命召唤”的搜索结果,然后从该搜索结果中确定“使命召唤”的相关关键词,如韩寒(韩寒代言了使命召唤)、1246战队(使命召唤游戏比赛战队)、AN94地狱行者(使命召唤游戏中的枪)、赏金猎人(使命召唤里的游戏角色)等,其中,确定这些相关关键词都关联有链接。
对核心关键词进行扩展还可以通过在数据库中查找与该核心关键词匹配的核心关键词对应的相关关键词实现,其中数据库中记录有很多个核心关键词以及每个核心关键词对应的相关关键词。如核心关键词为“使命召唤”,将“使命召唤”与数据库中记录的各核心关键词匹配,如数据库中与“使命召唤”匹配到的核心关键词为“使命召唤游戏”,则数据库中记录的“使命召唤游戏”对应相关关键词即是“使命召唤”的相关关键词。
匹配单元903,用于将所述预处理文本的内容与所述相关关键词进行匹配,确定所述预处理文本中的待处理关键词;
具体的,当预处理文本已编辑完成时,可以将预处理文本的内容直接与各相关关键词进行匹配,确定预处理文本中的待处理关键词;当预处理文本已经确定编辑主题但未编辑时,可以首先查找一些与预处理文本编辑主题相近的文本,然后将这些主题相近的文本作为预处理文本与各相关关键词进行匹配,以确定预处理文本中的待处理关键词。
当预处理文本中记录有与相关关键词完全相同的文字内容时,则将该相同的文字内容作为预处理文本中的待处理关键词;当预处理文本中记录的是与相关关键词相近的文字内容时,则将该相近的文字内容作为预处理文本中的待处理关键词,如预处理文本中记录的是“使命召唤”,相关关键词为“使命召唤游戏”,则将“使命召唤”作为预处理文本中的待处理关键词。
在一实施例中,可以采用正则表达式索引出预处理文本中的备用待处理关键词,然后将备用待处理关键词与各相关关键词进行匹配,确定预处理文本中的待处理关键词,具体可参见方法实施例对应部分,此次不再赘述。
替换单元904,用于将所述预处理文本中的各待处理关键词,替换成相匹配的关联有链接的相关关键词。
具体的,当预处理文本已编辑完成时,可以利用查找替换工具,直接将预处理文本中的各待处理关键词,替换成相匹配的关联有链接的相关关键词。
当预处理文本未编辑完成时,可以在文本编辑过程中,将各待处理关键词,替换成相匹配的关联有链接的相关关键词。
需要说明的是,文本中的内链关键词并不是越多越好,若一个文本中内链关键词添加过多,就容易使搜索引擎对文本产生作弊的嫌疑,这样不仅不会提高搜索引擎的收录与网站权重,反而会降低搜索引擎的收录与网站权重。因此,在编辑文本中添加内链关键词时,可采用如下几点建议:①文本标题部分可添加内链关键词,但该内链关键词是未关联链接的关键词,在实际应用中,网站技术人员可以手动去掉内链关键词相关联的链接;②可以在文章的首段、中间和结尾,添加内链关键词;③整个文本中的内链关键词的个数最好为7个或8个。
综上可知,本发明在对预处理文本设置内链关键词时,会对预处理文本的核心关键词进行扩展,得到核心关键词的相关关键词,然后将相关关键词和预处理文本的内容进行匹配,得到预处理文本的待处理关键词,通过将各待处理关键词替换成相匹配的关联有链接相关关键词,实现对关键词内链的自动添加。由于本发明中预处理文本的关键词是通过与核心关键词的相关关键词匹配得到,因此相比人工设置关键词而言,大大提高了内链关键词的提取精度。
另外,本发明还实现了对预处理文本中内链关键词的自动添加,相比传统手动添加内链关键词的链接而言,本发明大大提高了内链关键词的链接的添加效率。
在一实施例中,如图11所示,扩展单元902可以包括:
模拟子单元1001,用于模拟对所述核心关键词的搜索行为;
具体的,可以基于Node.js,使用PhantomJs模拟用户在搜索引擎对核心关键词的搜索行为。
请求发出子单元1002,用于发出对所述核心关键词的搜索请求;
具体的,在对核心关键词进行搜索前,会在基于Node.js的运行环境显示搜索引擎,该搜索引擎可以是预先配置的;然后向搜索引擎发出对核心关键词的搜索请求,模拟用户在搜索引擎对核心关键词的搜索行为。
接收子单元1003,用于接收所述核心关键词的搜索结果;
具体的,搜索引擎对核心关键词进行搜索,查找到核心关键词的相关关键词,并输出查找到的相关关键词,如核心关键词为“使命召唤”,查找到的“使命召唤”的相关关键词可以包括:韩寒(韩寒代言了使命召唤)、1246战队(使命召唤游戏比赛战队)、AN94地狱行者(使命召唤游戏中的枪)、赏金猎人(使命召唤里的游戏角色)。
第一确定子单元1004,用于至少根据所述搜索结果确定所述核心关键词的相关关键词。
可以理解的是,根据核心关键词会搜索到的很多相关关键词,为提高相关关键词的精度,在实际中可以将与核心关键词关联度较高的关键词确定为核心关键词的相关关键词。
因此,第一确定子单元1004还用于:从所述搜索结果中,提取与所述核心关键词的关联度,满足预设关联度要求的相关关键词。
具体的,可以从搜索结果中,提取与核心关键词的关联度,满足预设关联度要求(具体数值可依据实际需要而定)的相关关键词。如相关关键词“使命召唤游戏”与核心关键词“使用召唤”的关联度为80%,80%超过预设关联度65%,因此将“使命召唤游戏”确定为“使用召唤”的相关关键词。
综上可知,本发明基于Node.js,使用PhantomJs模拟用户在搜索引擎对核心关键词的搜索行为,能够实现对内链关键词的自动抓取,并且能够实现内链关键词在预处理文本中的自动添加。因此,相关传统方案而言,本发明实现了在网站建设过程中,对网站内链SEO的自动优化。
可以理解的是,仅通过搜索核心关键词得到的相关关键词,不一定是核心关键词的优选相关关键词,如通过搜索核心关键词“使命召唤”得到相关关键词“韩寒(韩寒代言了使命召唤)”。当预处理文本的编辑主题为游戏中各武器的使用方法时,很显然,预处理文本中不会多次提及“韩寒”这一相关关键词,这样,对于该预处理文本而言,“韩寒”就可以认为是“使命召唤”的非优选相关关键词。
因此,本发明为提高相关关键词的精度,在另一实施例中,如图12所示,第一确定子单元1004包括:
第一搜索子单1101元,用于根据所述搜索结果执行至少两次模拟搜索,其中,下一次模拟搜索的搜索关键词,根据上一次的搜索结果确定;
举例说明,核心关键词为“使命召唤”,第一次搜索时,将“使命召唤”作为搜索关键词,搜索得到“使命召唤”的一个相关关键词“使命召唤游戏”;第二次搜索时,将“使命召唤游戏”作为第二次搜索的搜索关键词,搜索得到“使命召唤游戏”的相关关键词,如“使命召唤游戏大全”。
关联度确定子单元1102,用于确定每次模拟搜索的搜索结果,与所述核心关键词的关联度;
如“使命召唤游戏”与“使命召唤”的关联度为80%,“使命召唤游戏大全”与“使命召唤”的关联度为70%。
筛选子单元1103,用于将关联度满足预设关联度要求的搜索结果,对应的搜索关键词作为相关关键词。
如预设关联度要求为75%,则将“使命召唤游戏”确定为“使命召唤”的相关关键词。
当多次搜索结果与核心关键词的关联度均满足预设关联度要求时,可以将关联度值相对较大的搜索结果,对应的搜索关键词作为相关关键词;或是将所有关联度满足预设关联度要求的搜索结果,对应的搜索关键词均作为相关关键词。
综上可知,本发明首先对核心关键词进行模拟搜索得到相关关键词,然后采用依次对各相关关键词循环搜索的方式,查找到与核心关键词的关联度相对高的相关关键词,并将关联度高的相关关键词确认为核心关键词的相关关键词。本发明通过对各相关关键词循环搜索提高了对相关关键词的提取精度,从而提高了内链关键词的精度。
可以理解的是,当通过对某个核心关键词进行扩展,得到该核心关键词的相关关键词后,可以将核心关键词和相对应的相关关键词以对应关系的形式写入数据库,以便后续在数据库中查找确定内链关键词。
因此,为进一步优化上述实施例,如图13所示,在图10所示实施例的基础上,确定内链关键词的装置还包括:
创建单元1201,用于在扩展单元902对所述核心关键词进行扩展,得到所述核心关键词的相关关键词之后,在数据库创建云端数据库表,所述云端数据库表包括:数据库索引、核心关键词的业务名、核心关键词对应的相关关键词以及每个相关关键词的链接;
需要说明的是,数据库索引是对数据库表中一列或多列的值进行排序的一种结果,使用数据库索引可快速访问数据库表中的特定信息。
从上述论述可知,一个核心关键词同时与多个相关关键词相对应,当云端数据库表中有多个核心关键词时,数据库列表中会相应有很多个相关关键词。这样,当将预处理文本的内容与云端数据库表中的相关关联词进行匹配时,必然会耗费很长时间。因此,本发明为提高预处理文本与云端数据库列表中各相关关键词的匹配速度,在云端数据库表中增加了数据库索引,以便快速查找到与预处理文本的内容匹配的相关关键词。
本领域技术人员可以理解的是,对企业、商家而言,核心关键词就是他们的经营范围,如产品/服务名称、行业定位,以及企业名称或品牌名称等。因此,避免不了某些核心关键词的字数较多,如“租房和买卖房”,因此,为减少核心关键词在数据库中的占用空间,可以对各个核心关键词设置一个业务名(Service),如核心关键词为“租房和买卖房”时,相对应的业务名可以选用“房屋中介”。
写入单元1202,用于将所述核心关键词,所述核心关键词相对应的相关关键词写入所述云端数据库表,其中,所述相关关键词关联有链接。
具体的,当将核心关键词写入云端数据库表时,为保证写入的核心关键词和云端数据库列表中记录的核心关键词不重复,还需对核心关键词的有效性进行验证,将有效的核心关键词及相对应的相关关键词写入所述云端数据库表。
其中,有效的核心关键词指的是:云端数据库表中不存在与该核心关键词的关联度满足预设关联要求的核心关键词。
因此,写入单元1202可以包括:
验证子单元,用于验证所述核心关键词的有效性;
写入子单元,用于将有效的核心关键词及相对应的相关关键词写入所述云端数据库表。
在一实施例中,如图14所示,扩展单元802可以包括:
第一查找子单元1301,用于从数据库中查找与所述核心关键词匹配的核心关键词,所述数据库中记录有:数据库索引、核心关键词、核心关键词对应的相关关键词以及每个相关关键词的链接;
具体的,当数据库中的核心关键词以业务名进行存储时,从数据库中查找与核心关键词匹配的核心关键词具体为:从数据库中查找业务名与核心关键词的业务名匹配的核心关键词。
第二确定子单元1302,用于将查找到的核心关键词对应的相关关键词,确定为所述核心关键词的相关关键词。
在一实施例中,如图15所示,扩展单元902可以包括:
判断子单元1401,用于将所述核心关键词与数据库存储的各核心关键词进行匹配,判断所述数据库中是否存储有与所述核心关键词匹配的核心关键词;
第二查找子单元1402,用于在判断子单元1401判断为是的情况下,从所述数据库中查找与核心关键词对应的相关关键词;
第二搜索子单元1403,用于在判断子单元1401判断为否的情况下,模拟用户在搜索引擎上对所述核心关键词的搜索行为,至少根据所述核心关键词的搜索结果确定所述核心关键词的相关关键词。
其中,模拟用于在搜索引擎上对核心关键词的搜索行为的具体过程请参见上述实施例,此次不再赘述。
本领域技术人员可以理解的是,一个内链关键词的链接可以有1个或多个,因此,相应的本发明中相关关键词关联的链接也可以有1个或多个。当内链关键词关联的链接有多个时,若编辑者没有对内链关键词的链接进行筛选或排序,则当该内链关键词在文本中显示时,点击该内链关关键词显示的链接会是多个链接中随机选取的一个链接。
为实现对内链关键词的优化,除对内链关键词的关键词进行筛选优化外,还可以对内链关键词关联的链接进行筛选优化,在实际中,在对内链关键词关联的链接进行筛选优化时,可以用户在官网的购买(点击内链关键词后,页面跳转至用户在官网的购买界面,如京东)、品牌展示效果(点击内链关键词后,页面跳转至品牌展示效果界面,手机官网界面)和游戏内容展示效果(点击内链关键词后,页面跳转至游戏内容展示效果界面,如“使命召唤”游戏界面)作为筛选依据。其中,内链关键词的链接优选为三个。
需要说明的是,装置实施例中,各组成部分的具体工作原理,请参见方法实施例对应部分,此次不再赘述。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (16)

1.一种确定内链关键词的方法,其特征在于,包括:
获取预处理文本的核心关键词;
对所述核心关键词进行扩展,得到所述核心关键词的相关关键词;其中,所述相关关键词关联有链接,且所述相关关键词至少通过将所述核心关键词输入到搜索引擎,根据所述核心关键词的搜索结果确定;
将所述预处理文本的内容与所述相关关键词进行匹配,确定所述预处理文本中的待处理关键词,当预处理文本中记录有与相关关键词完全相同的文字内容时,将该相同的文字内容作为预处理文本中的待处理关键词;当预处理文本中记录的是与相关关键词相近的文字内容时,将该相近的文字内容作为预处理文本中的待处理关键词;
将所述预处理文本中的各待处理关键词,替换成相匹配的关联有链接的相关关键词。
2.根据权利要求1所述的方法,其特征在于,所述对所述核心关键词进行扩展,得到所述核心关键词的相关关键词包括:
模拟对所述核心关键词的搜索行为;
发出对所述核心关键词的搜索请求;
接收所述核心关键词的搜索结果;
至少根据所述搜索结果确定所述核心关键词的相关关键词。
3.根据权利要求2所述的方法,其特征在于,所述至少根据所述搜索结果确定所述核心关键词的相关关键词包括:
从所述搜索结果中,提取与所述核心关键词的关联度,满足预设关联度要求的相关关键词。
4.根据权利要求2所述的方法,其特征在于,所述至少根据所述搜索结果确定所述核心关键词的相关关键词包括:
根据所述搜索结果执行至少两次模拟搜索,其中,下一次模拟搜索的搜索关键词,根据上一次的搜索结果确定;
确定每次模拟搜索的搜索结果,与所述核心关键词的关联度;
将关联度满足预设关联度要求的搜索结果,对应的搜索关键词作为相关关键词。
5.根据权利要求1所述的方法,其特征在于,所述对所述核心关键词进行扩展,得到所述核心关键词的相关关键词包括:
从数据库中查找与所述核心关键词匹配的核心关键词,所述数据库中记录有:数据库索引、核心关键词、核心关键词对应的相关关键词以及每个相关关键词的链接;
将查找到的核心关键词对应的相关关键词,确定为所述核心关键词的相关关键词。
6.根据权利要求1所述的方法,其特征在于,所述对所述核心关键词进行扩展,得到所述核心关键词的相关关键词包括:
将所述核心关键词与数据库存储的各核心关键词进行匹配,判断所述数据库中是否存储有与所述核心关键词匹配的核心关键词;
如果所述数据库中存储有与所述核心关键词匹配的核心关键词,则从所述数据库中查找与核心关键词对应的相关关键词;
如果所述数据库中未存储有与所述核心关键词匹配的核心关键词,则模拟用户在搜索引擎上对所述核心关键词的搜索行为,至少根据所述核心关键词的搜索结果确定所述核心关键词的相关关键词。
7.根据权利要求1所述的方法,其特征在于,在所述对所述核心关键词进行扩展,得到所述核心关键词的相关关键词之后,还包括:
在数据库创建云端数据库表,所述云端数据库表包括:数据库索引、核心关键词的业务名、核心关键词对应的相关关键词以及每个相关关键词的链接;
将所述核心关键词,所述核心关键词相对应的相关关键词写入所述云端数据库表,其中,所述相关关键词关联有链接。
8.根据权利要求7所述的方法,其特征在于,所述将所述核心关键词,所述核心关键词相对应的相关关键词写入所述云端数据库表包括:
验证所述核心关键词的有效性;
将有效的核心关键词及相对应的相关关键词写入所述云端数据库表。
9.一种确定内链关键词的装置,其特征在于,包括:
获取单元,用于获取预处理文本的核心关键词;
扩展单元,用于对所述核心关键词进行扩展,得到所述核心关键词的相关关键词;其中,所述相关关键词关联有链接,且所述相关关键词至少通过将所述核心关键词输入到搜索引擎,根据所述核心关键词的搜索结果确定;
匹配单元,用于将所述预处理文本的内容与所述相关关键词进行匹配,确定所述预处理文本中的待处理关键词,当预处理文本中记录有与相关关键词完全相同的文字内容时,将该相同的文字内容作为预处理文本中的待处理关键词;当预处理文本中记录的是与相关关键词相近的文字内容时,将该相近的文字内容作为预处理文本中的待处理关键词;
替换单元,用于将所述预处理文本中的各待处理关键词,替换成相匹配的关联有链接的相关关键词。
10.根据权利要求9所述的装置,其特征在于,所述扩展单元包括:
模拟子单元,用于模拟对所述核心关键词的搜索行为;
请求发出子单元,用于发出对所述核心关键词的搜索请求;
接收子单元,用于接收所述核心关键词的搜索结果;
第一确定子单元,用于至少根据所述搜索结果确定所述核心关键词的相关关键词。
11.根据权利要求10所述的装置,其特征在于,所述第一确定子单元还用于:
从所述搜索结果中,提取与所述核心关键词的关联度,满足预设关联度要求的相关关键词。
12.根据权利要求10所述的装置,其特征在于,所述第一确定子单元包括:
第一搜索子单元,用于根据所述搜索结果执行至少两次模拟搜索,其中,下一次模拟搜索的搜索关键词,根据上一次的搜索结果确定;
关联度确定子单元,用于确定每次模拟搜索的搜索结果,与所述核心关键词的关联度;
筛选子单元,用于将关联度满足预设关联度要求的搜索结果,对应的搜索关键词作为相关关键词。
13.根据权利要求9所述的装置,其特征在于,所述扩展单元包括:
第一查找子单元,用于从数据库中查找与所述核心关键词匹配的核心关键词,所述数据库中记录有:数据库索引、核心关键词、核心关键词对应的相关关键词以及每个相关关键词的链接;
第二确定子单元,用于将查找到的核心关键词对应的相关关键词,确定为所述核心关键词的相关关键词。
14.根据权利要求9所述的装置,其特征在于,所述扩展单元包括:
判断子单元,用于将所述核心关键词与数据库存储的各核心关键词进行匹配,判断所述数据库中是否存储有与所述核心关键词匹配的核心关键词;
第二查找子单元,用于在所述判断子单元判断为是的情况下,从所述数据库中查找与核心关键词对应的相关关键词;
第二搜索子单元,用于在所述判断子单元判断为否的情况下,模拟用户在搜索引擎上对所述核心关键词的搜索行为,至少根据所述核心关键词的搜索结果确定所述核心关键词的相关关键词。
15.根据权利要求9所述的装置,其特征在于,还包括:
创建单元,用于在所述扩展单元对所述核心关键词进行扩展,得到所述核心关键词的相关关键词之后,在数据库创建云端数据库表,所述云端数据库表包括:数据库索引、核心关键词的业务名、核心关键词对应的相关关键词以及每个相关关键词的链接;
写入单元,用于将所述核心关键词,所述核心关键词相对应的相关关键词写入所述云端数据库表,其中,所述相关关键词关联有链接。
16.根据权利要求15所述的装置,其特征在于,所述写入单元包括:
验证子单元,用于验证所述核心关键词的有效性;
写入子单元,用于将有效的核心关键词及相对应的相关关键词写入所述云端数据库表。
CN201611094197.5A 2016-12-01 2016-12-01 一种确定内链关键词的方法和装置 Active CN106776937B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611094197.5A CN106776937B (zh) 2016-12-01 2016-12-01 一种确定内链关键词的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611094197.5A CN106776937B (zh) 2016-12-01 2016-12-01 一种确定内链关键词的方法和装置

Publications (2)

Publication Number Publication Date
CN106776937A CN106776937A (zh) 2017-05-31
CN106776937B true CN106776937B (zh) 2020-09-29

Family

ID=58882777

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611094197.5A Active CN106776937B (zh) 2016-12-01 2016-12-01 一种确定内链关键词的方法和装置

Country Status (1)

Country Link
CN (1) CN106776937B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109582968A (zh) * 2018-12-04 2019-04-05 北京容联易通信息技术有限公司 一种语料中的关键信息的提取方法及装置
CN110287287B (zh) * 2019-06-18 2021-11-23 北京百度网讯科技有限公司 案由的预测方法、装置及服务器
CN110738553A (zh) * 2019-10-18 2020-01-31 深圳市比量科技传媒有限公司 一种将不同商城的商品链接进行相互映射的方法及系统
CN113919347B (zh) * 2021-12-14 2022-04-05 山东捷瑞数字科技股份有限公司 一种文本数据的内链词提取匹配方法及装置
CN115438145B (zh) * 2022-04-13 2024-05-14 盐城天眼察微科技有限公司 企业详情内链的添加方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102314454A (zh) * 2010-06-30 2012-01-11 百度在线网络技术(北京)有限公司 自动添加内链的方法及系统
CN104516903A (zh) * 2013-09-29 2015-04-15 北大方正集团有限公司 关键词扩展方法及系统、及分类语料标注方法及系统
CN105706081A (zh) * 2013-09-04 2016-06-22 谷歌公司 结构化信息链接注释

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101807183A (zh) * 2009-02-18 2010-08-18 财团法人资讯工业策进会 关键词汇实时扩展方法、系统及其计算机可擦写记录媒体
US8996561B2 (en) * 2009-08-04 2015-03-31 International Business Machines Corporation Using historical information to improve search across heterogeneous indices

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102314454A (zh) * 2010-06-30 2012-01-11 百度在线网络技术(北京)有限公司 自动添加内链的方法及系统
CN105706081A (zh) * 2013-09-04 2016-06-22 谷歌公司 结构化信息链接注释
CN104516903A (zh) * 2013-09-29 2015-04-15 北大方正集团有限公司 关键词扩展方法及系统、及分类语料标注方法及系统

Also Published As

Publication number Publication date
CN106776937A (zh) 2017-05-31

Similar Documents

Publication Publication Date Title
CN106776937B (zh) 一种确定内链关键词的方法和装置
US9152614B2 (en) System and method for bulk web domain generation and management
JP5552426B2 (ja) 自動拡張言語サーチ
US8255386B1 (en) Selection of documents to place in search index
CN102693271B (zh) 一种网络信息推荐方法及系统
CN106844640B (zh) 一种网页数据分析处理方法
WO2018028099A1 (zh) 搜索质量评估方法及装置
US9984166B2 (en) Systems and methods of de-duplicating similar news feed items
CN104715064A (zh) 一种实现在网页上标注关键词的方法和服务器
US10394939B2 (en) Resolving outdated items within curated content
KR20080044915A (ko) 블로그 문서의 순위 부여
CN102722498A (zh) 搜索引擎及其实现方法
CN102737021B (zh) 搜索引擎及其实现方法
JP2013545189A (ja) マルチステージを使用したカテゴリ情報の決定
JP2014505945A (ja) 検索情報の提供
CN107463592B (zh) 用于将内容项目与图像匹配的方法、设备和数据处理系统
CN102722501A (zh) 搜索引擎及其实现方法
CN104133877A (zh) 软件标签的生成方法和装置
CN102722499A (zh) 搜索引擎及其实现方法
KR20120087058A (ko) 연관 콘텐츠 제공 장치, 방법 및 컴퓨터 판독 가능한 기록 매체
CN107491465A (zh) 用于搜索内容的方法和装置以及数据处理系统
CN106611029B (zh) 提高网站站内搜索效率的方法和装置
KR100913733B1 (ko) 템플릿을 이용한 검색결과 제공방법
US8949254B1 (en) Enhancing the content and structure of a corpus of content
CN105389328A (zh) 一种大规模开源软件搜索排序优化方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant