CN106202314A - 一种用于网页内查找关键词的方法及装置 - Google Patents
一种用于网页内查找关键词的方法及装置 Download PDFInfo
- Publication number
- CN106202314A CN106202314A CN201610513142.7A CN201610513142A CN106202314A CN 106202314 A CN106202314 A CN 106202314A CN 201610513142 A CN201610513142 A CN 201610513142A CN 106202314 A CN106202314 A CN 106202314A
- Authority
- CN
- China
- Prior art keywords
- key word
- current page
- level
- subpage frame
- hyperlink
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 239000000284 extract Substances 0.000 claims description 5
- 239000012634 fragment Substances 0.000 description 10
- 238000000605 extraction Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000004590 computer program Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000001035 drying Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/955—Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
- G06F16/9558—Details of hyperlinks; Management of linked annotations
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明涉及互联网技术领域,尤其涉及一种用于网页内查找关键词的方法及装置,包括:获取用户在当前页面下输入的关键词;获得在当前页面的一级子页面的页面内容中查找关键词得到的第一查找结果,一级子页面为当前页面中超链接对应的页面;根据第一查找结果,对包含关键词的一级子页面所对应的超链接进行标识。根据本发明的用于网页内查找关键词的方法及装置,在用户浏览当前页面时,通过在当前页面的一级子页面的页面内容中对关键词进行查找,并对包含关键词的一级子页面所对应的超链接进行标识,实现了在网页内对关键词的深度查找,提高了查找关键词的效率,并且保证了查找结果的准确性和完整性,更贴近用户的需求。
Description
技术领域
本发明涉及互联网技术领域,尤其涉及一种用于网页内查找关键词的方法及装置。
背景技术
越来越多的用户通过使用互联网浏览网页来获取信息,用户在浏览网页内容时,可能会对某个关键词感兴趣,现有的浏览器提供关键词查找功能,通过该功能能够实现在当前页面的页面内容中对关键词的搜索查找,查找结果以高亮显示的方式呈现给用户。
但是,按照现有的关键词查找方式,常常在当前页面中查找不到用户想要的内容,从而导致对关键词的查找效率低,难以满足用户的需求。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的用于网页内查找关键词的方法及装置。
依据本发明的一个方面,提供了一种用于网页内查找关键词的方法,包括:
获取用户在当前页面下输入的关键词;
获得在所述当前页面的一级子页面的页面内容中查找所述关键词得到的第一查找结果,所述一级子页面为当前页面中超链接对应的页面;
根据所述第一查找结果,对包含所述关键词的一级子页面所对应的超链接进行标识。
可选的,还包括:
在所述当前页面的页面内容中查找所述关键词;
如果所述当前页面的页面内容中包含所述关键词,则对所述当前页面中的所述关键词进行标识。
可选的,还包括:
获得在所述当前页面的二级以上预设级数子页面的页面内容中查找所述关键词得到的第二查找结果;
根据所述第二查找结果,在当前页面中对包含所述关键词的二级以上预设级数子页面所隶属的一级子页面所对应的超链接进行标识。
可选的,还包括:
当用户打开所述一级子页面所对应的超链接时,在所述一级子页面中对包含所述关键词的下一级子页面所对应的超链接进行标识。
可选的,所述获得在所述当前页面的一级子页面的页面内容中查找所述关键词得到的第一查找结果,包括:
加载所述当前页面的一级子页面;
在所述当前页面的一级子页面的页面内容中对所述关键词进行查找,获得所述第一查找结果。
可选的,在所述获得在所述当前页面的一级子页面的页面内容中查找所述关键词得到的第一查找结果之前,还包括:
提取所述当前页面的超链接元素信息;
发送包含所述超链接元素信息和所述关键词的关键词查找请求至服务器侧,以使所述服务器侧在接收到所述关键词查找请求之后,根据所述超链接元素信息加载所述当前页面的一级子页面,在所述当前页面的一级子页面的页面内容中对所述关键词进行查找,得到所述第一查找结果,并将包含所述第一查找结果的反馈信息发送至客户端侧。
可选的,所述获得在所述当前页面的一级子页面的页面内容中查找所述关键词得到的第一查找结果,包括:
接收所述服务器侧发送的所述反馈信息;
解析所述反馈信息,获得所述第一查找结果。
依据本发明的另一个方面,提供了一种用于网页内查找关键词的方法,包括:
接收客户端侧发送的关键词查询请求,所述关键词查询请求包含用户在所述浏览器的当前页面下输入的关键词和所述当前页面的超链接元素信息;
根据所述超链接元素信息加载所述当前页面的一级子页面;
在所述当前页面的一级子页面的页面内容中对所述关键词进行查找,获得第一查找结果;
发送包含所述第一查找结果的反馈信息至所述客户端侧。
依据本发明的另一个方面,提供了一种用于网页内查找关键词的装置,包括:
获取模块,用于获取用户在当前页面下输入的关键词;
第一获得模块,用于获得在所述当前页面的一级子页面的页面内容中查找所述关键词得到的第一查找结果,所述一级子页面为当前页面中超链接对应的页面;
第一超链接标识模块,用于根据所述第一查找结果,对包含所述关键词的一级子页面所对应的超链接进行标识。
可选的,还包括:
第一查找模块,用于在所述当前页面的页面内容中查找所述关键词;
第一关键词标识模块,用于如果所述当前页面的页面内容中包含所述关键词,则对所述当前页面中的所述关键词进行标识。
可选的,还包括:
第二获得模块,用于获得在所述当前页面的二级以上预设级数子页面的页面内容中查找所述关键词得到的第二查找结果;
第二超链接标识模块,用于根据所述第二查找结果,在当前页面中对包含所述关键词的二级以上预设级数子页面所隶属的一级子页面所对应的超链接进行标识。
可选的,还包括:
第三超链接标识模块,用于当用户打开所述一级子页面所对应的超链接时,在所述一级子页面中对包含所述关键词的下一级子页面所对应的超链接进行标识。
可选的,所述第一获得模块包括:
加载单元,用于加载所述当前页面的一级子页面;
获得单元,用于在所述当前页面的一级子页面的页面内容中对所述关键词进行查找,获得所述第一查找结果。
可选的,还包括:
提取模块,用于提取所述当前页面的超链接元素信息;
查找请求发送模块,用于发送包含所述超链接元素信息和所述关键词的关键词查找请求至服务器侧,以使所述服务器侧在接收到所述关键词查找请求之后,根据所述超链接元素信息加载所述当前页面的一级子页面,在所述当前页面的一级子页面的页面内容中对所述关键词进行查找,得到所述第一查找结果,并将包含所述第一查找结果的反馈信息发送至客户端侧。
可选的,所述第一获得模块,包括:
信息接收单元,用于接收所述服务器侧发送的所述反馈信息;
信息解析单元,用于解析所述反馈信息,获得所述第一查找结果。
依据本发明的另一个方面,提供了一种用于网页内查找关键词的装置,包括:
查询请求接收模块,用于接收客户端侧发送的关键词查询请求,所述关键词查询请求包含用户在所述浏览器的当前页面下输入的关键词和所述当前页面的超链接元素信息;
加载模块,用于根据所述超链接元素信息加载所述当前页面的一级子页面;
第二查找模块,用于在所述当前页面的一级子页面的页面内容中对所述关键词进行查找,获得第一查找结果;
信息反馈模块,用于发送包含所述第一查找结果的反馈信息至所述客户端侧。
根据本发明的用于网页内查找关键词的方法及装置,在用户浏览当前页面时,通过在当前页面的一级子页面的页面内容中对关键词进行查找,并对包含关键词的一级子页面所对应的超链接进行标识,实现了在网页内对关键词的深度查找,提高了查找关键词的效率,并且保证了查找结果的准确性和完整性,更贴近用户的需求。
而且,由于本发明实施例通过提取当前页面的超链接元素信息,并将包含超链接元素信息和关键词的关键词查找请求发送至服务器,由服务器完成对子页面的加载和对关键词的查找,不仅能够减少客户端侧加载子页面的流量消耗,还减轻了对客户端侧资源的占用。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考图形表示相同的部件。在附图中:
图1示出了本发明实施例的位于客户端侧的用于网页内查找关键词的方法的流程图;
图2示出了本发明实施例的位于客户端侧的用于网页内查找关键词的装置的结构示意图;
图3示出了本发明实施例的位于服务器侧的用于网页内查找关键词的方法的流程图;
图4示出了本发明实施例的位于服务器侧的用于网页内查找关键词的装置的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
图1是本发明实施例中一种用于网页内查找关键词的方法的流程图,该方法应用于客户端侧。一方面,该方法可以应用在客户端设备的浏览器中,另一方面,该方法也可以应用在客户端设备安装的具有文字阅览功能的任一应用程序中。具体地,该方法可以包括以下步骤:
步骤101:获取用户在当前页面下输入的关键词。
用户利用客户端设备浏览网页时,在用户浏览的当前页面中提供有关键词查找入口,关键词查找入口可以在当前页面加载完成后被调出,用户通过关键词查找入口可以输入待查找的关键词,客户端设备根据用户的输入操作,获取关键词。
步骤102:获得在当前页面的一级子页面的页面内容中查找关键词得到的第一查找结果。
在本发明实施例中,一级子页面为当前页面中超链接对应的页面,通常,当前页面中包含有多个超链接,每个超链接对应一个一级子页面。对于一级子页面的加载以及在一级子页面的页面内容中对关键词的查找,一方面,可以在客户端侧进行实现,另一方面,也可以在服务器侧进行实现。
当在客户端侧实现时,首先,客户端设备加载当前页面的一级子页面,若当前页面包含多个一级子页面时,分别对各个一级子页面进行加载,在页面加载完成后,客户端设备分别在各个一级子页面的页面内容中对关键词进行查找,从而获得第一查找结果。
具体来讲,在加载当前页面的一级子页面时,可以先解析当前页面中的网页元素,再从当前页面中的网页元素中提取出超链接元素信息,超链接元素信息中包含有当前页面中的所有超链接元素,每个超链接元素对应一个一级子页面的网络地址。客户端设备的后台根据超链接元素信息能够实现对当前页面的所有一级子页面的加载。在解析当前页面中的网页元素时,可以在当前页面中加载JavasCript文件,利用JavasCript文件遍历当前页面中的所有网页元素,从中提取出超链接元素信息。
当在服务器侧实现时,首先,客户端设备提取当前页面的超链接元素信息,接着,客户端设备发送包含超链接元素信息和关键词的关键词查找请求至服务器,服务器接收关键词查找请求,根据超链接元素信息加载当前页面的一级子页面,同样,若当前页面包含多个一级子页面时,服务器分别对各个一级子页面进行加载,在页面加载完成后,服务器分别在各个一级子页面的页面内容中对关键词进行查找,获得第一查找结果,最后,服务器发送反馈信息至客户端设备,反馈信息中包含有第一查找结果。客户端设备接收服务器发送的反馈信息,并通过解析反馈信息,获得第一查找结果。
客户端设备在提取出当前页面的超链接元素信息之后,利用服务器加载超链接元素信息对应的一级子页面,并利用服务器实现在一级子页面中查找关键词,有效地减少了客户端设备加载一级子页面的流量消耗,为客户端侧节省了流量,同时,也避免了占用客户端设备过多的资源。
步骤103:根据第一查找结果,对包含关键词的一级子页面所对应的超链接进行标识。
无论是由客户端设备实现对一级子页面的加载以及在一级子页面的页面内容中查找关键词,还是由服务器实现对一级子页面的加载以及在一级子页面的页面内容中查找关键词,客户端设备在获得第一查找结果之后,根据第一查找结果在当前页面中进行超链接标识,将包含关键词的一级子页面所对应的超链接进行标识。例如,可以将一级子页面所对应的超链接高亮显示;再例如,还可以按照预设颜色对一级子页面所对应的超链接进行显示,使得一级子页面所对应的超链接的显示颜色区别于当前页面中的其他超链接;还例如,还可以增大一级子页面所对应的超链接的字号。以上仅是示意性举例,无法穷尽,只要提前预设好一种标识方式,然后按照预设方式标识,即这种标识方式能够将这些超链接与页面中的其他超链接区分开即可。
另外,在对包含关键词的一级子页面所对应的超链接进行标识时,还可以在该超链接所在区域提供预览图层,将一级子页面中包含关键词的内容片段显示在预览图层上,从而,根据超链接所在区域的预览图层可以预览一级子页面中包含关键词的内容片段,方便用户根据需要进行下一步的点击浏览。其中,预览图层可以包含一个或多个内容片段,另外,也可以将一级子页面中包含关键词的所有内容片段均在预览图层中进行显示。在节选内容片段时,可以节选关键词所在的一句话作为内容片段,也可以通过识别自然段的段首和段尾,节选关键词所在的一个自然段作为内容片段。
除此之外,在对包含关键词的一级子页面所对应的超链接进行标识之后,当用户的操作焦点悬浮于具有标识的超链接的显示位置处时,将该超链接所对应的一级子页面中包含关键词的内容片段进行展现,方便用户在需要时预览一级子页面中包含关键词的内容。同样,在展现时,可以将一级子页面中包含关键词的一个或多个内容片段进行展现,也可以将一级子页面中包含关键词的所有内容片段进行展现。
在本发明实施例中,在根据第一查找结果对包含关键词的一级子页面所对应的超链接进行标识的同时,还可以在当前页面的页面内容中查找关键词,如果当前页面的页面内容中包含关键词,则对当前页面中的关键词进行标识。具体来讲,由客户端设备实现在当前页面的页面内容中查找关键词。一方面,可以在当前页面的页面内容中对关键词高亮显示,另一方面,可以按照预设颜色对当前页面的页面内容中的关键词进行显示,使得关键词的显示颜色区别于其他内容的显示颜色,还可以增大关键词的字号。
此外,在本发明实施例中,所述方法还包括:获得在当前页面的二级以上预设级数子页面的页面内容中查找关键词得到的第二查找结果,根据第二查找结果,在当前页面中对包含关键词的二级以上预设级数子页面所隶属的一级子页面所对应的超链接进行标识。当用户打开一级子页面所对应的超链接时,在一级子页面中对包含关键词的下一级子页面所对应的超链接进行标识。
具体来讲,当前页面可能对应着多级子页面,例如,若当前页面包含超链接,则当前页面中的超链接所对应的页面为一级子页面,若一级子页面中没有超链接,则当前页面仅包含一级子页面,若一级子页面中包含有超链接,则一级子页面中的超链接所对应的页面为当前页面的二级子页面,若二级子页面中包含有超链接,则二级子页面中的超链接所对应的页面为当前页面的三级子页面,依次类推。在查找关键词时,可以对当前页面的子页面进行逐级查找,直至子页面中不再包含超链接或在子页面的页面内容中查找到关键词为止。
例如,当前页面中包含三个超链接,三个超链接分别对应一级子页面A1、一级子页面A2和一级子页面A3,分别在上述三个一级子页面的页面内容中查找关键词,若在上述三个一级子页面中均未查找到关键词,且上述三个一级子页面中均包含有超链接,则,根据超链接分别加载上述三个一级子页面的下一级子页面,即,加载与一级子页面A1对应的所有二级子页面B1,加载与一级子页面A2对应的所有二级子页面B2,加载与一级子页面A3对应的所有二级子页面B3,并在所有二级子页面的页面内容中查找关键词。
若在一个二级子页面B1中查找到关键词,而在其他二级子页面B1中均未查找到关键词且其他二级子页面B1不包含超链接,则对二级子页面B1的查找结束,并在当前页面中对包含关键词的二级子页面B1所隶属一级子页面A1所对应的超链接进行标识。若在所有二级子页面B2中均未查找到关键词,但是一个二级子页面B2中包含有超链接,按照上述方法在与包含超链接的二级子页面B2对应的所有三级子页面C1中进行关键词查找,若在一个三级子页面C1中查找到关键词,则在当前页面中对包含关键词的三级子页面C1所隶属的一级子页面A2所对应的超链接进行标识。若在所有二级子页面B3中均未查找到关键词且所有二级子页面B3均不包含超链接,则对二级子页面B3的查找结束。
另外,在当前页面中对包含所述关键词的二级以上预设级数子页面所隶属的一级子页面所对应的超链接进行标识时,可以将关键词所在的子页面的级数标识到对应的超链接处,并且,在用户打开一级子页面所对应的超链接时,可以将包含关键词的子页面与一级子页面之间的相对深度关系标识到一级子页面中该子页面所对应的超链接所在位置,其中,相对深度关系可以利用数字方式进行表示。例如,关键词位于二级子页面中,则在该二级子页面所隶属的一级子页面所对应的超链接所在位置处标识数字2,在用户打开该二级子页面所对应的一级子页面后,在一级子页面中该二级子页面所对应的超链接所在位置标识数字1。
进一步,对于在当前页面的子页面的页面内容中对关键词的查找,可以预先为查找设置查找深度,查找深度与当前页面的子页面的级数对应,查找深度越深,则对应的当前页面的子页面的级数越高,查找深度越浅,则对应的当前页面的子页面的级数越低,例如,可以将查找深度设置为在当前页面的二级子页面以内的子页面中查找关键词,则,在查找时,仅会在当前页面的一级子页面和二级子页面的页面内容中对关键词进行查找。查找深度可以根据实际情况设置,不仅可以静态固定的查找深度,甚至可以是动态的查找深度。比如可以设置为先查找一级子页面(也可以是二级以上,根据实际情况设置即可),如果查找到,就不再继续查找;如果没查找到,就继续查找二级子页面,以此类推,直到查找到含有该关键词的某个超链接页面为止,当然,最终查找到几级也可以设置个底线,比如最多查找到四级,如果四级子页面中都找不到有关键词的页面,就结束。
需要说明的是,对于当前页面的二级以上预设级数子页面的加载以及在当前页面的二级以上预设级数子页面的页面内容中对关键词的查找,同样,既可以在客户端侧进行实现,又可以在服务器词进行实现,具体实现方法可参照对于一级子页面的加载以及在一级子页面的页面内容中对关键词的查找过程,在此不再赘述。
与本发明实施例提供的客户端侧的用于网页内查找关键词的方法相对应,本发明实施例还提供了一种用于网页内查找关键词的装置,参见图2,所述装置包括:
获取模块201,用于获取用户在当前页面下输入的关键词;
第一获得模块202,用于获得在所述当前页面的一级子页面的页面内容中查找所述关键词得到的第一查找结果,所述一级子页面为当前页面中超链接对应的页面;
第一超链接标识模块203,用于根据所述第一查找结果,对包含所述关键词的一级子页面所对应的超链接进行标识。
所述装置还包括:
第一查找模块,用于在所述当前页面的页面内容中查找所述关键词;
第一关键词标识模块,用于如果所述当前页面的页面内容中包含所述关键词,则对所述当前页面中的所述关键词进行标识。
所述装置还包括:
第二获得模块,用于获得在所述当前页面的二级以上预设级数子页面的页面内容中查找所述关键词得到的第二查找结果;
第二超链接标识模块,用于根据所述第二查找结果,在当前页面中对包含所述关键词的二级以上预设级数子页面所隶属的一级子页面所对应的超链接进行标识。
所述装置还包括:
第三超链接标识模块,用于当用户打开所述一级子页面所对应的超链接时,在所述一级子页面中对包含所述关键词的下一级子页面所对应的超链接进行标识。
第一获得模块202包括:
加载单元,用于加载所述当前页面的一级子页面;
获得单元,用于在所述当前页面的一级子页面的页面内容中对所述关键词进行查找,获得所述第一查找结果。
所述装置还包括:
提取模块,用于提取所述当前页面的超链接元素信息;
查找请求发送模块,用于发送包含所述超链接元素信息和所述关键词的关键词查找请求至服务器侧,以使所述服务器侧在接收到所述关键词查找请求之后,根据所述超链接元素信息加载所述当前页面的一级子页面,在所述当前页面的一级子页面的页面内容中对所述关键词进行查找,得到所述第一查找结果,并将包含所述第一查找结果的反馈信息发送至客户端侧。
第一获得模块202,包括:
信息接收单元,用于接收所述服务器侧发送的所述反馈信息;
信息解析单元,用于解析所述反馈信息,获得所述第一查找结果。
图3是本发明实施例中一种用于网页内查找关键词的方法,该方法应用于服务器侧,该方法可以包括以下步骤:
步骤301:接收客户端侧发送的关键词查询请求,关键词查询请求包含用户在浏览器的当前页面下输入的关键词和当前页面的超链接元素信息;
步骤302:根据超链接元素信息加载当前页面的一级子页面;
步骤303:在当前页面的一级子页面的页面内容中对关键词进行查找,获得第一查找结果;
步骤304:发送包含第一查找结果的反馈信息至客户端侧。
当在服务器侧实现时,首先,客户端设备提取当前页面的超链接元素信息,接着,客户端设备发送包含超链接元素信息和关键词的关键词查找请求至服务器,服务器接收关键词查找请求,根据超链接元素信息加载当前页面的一级子页面,同样,若当前页面包含多个一级子页面时,服务器分别对各个一级子页面进行加载,在页面加载完成后,服务器分别在各个一级子页面的页面内容中对关键词进行查找,获得第一查找结果,最后,服务器发送反馈信息至客户端设备,反馈信息中包含有第一查找结果。客户端设备接收服务器发送的反馈信息,并通过解析反馈信息,获得第一查找结果。
客户端设备在提取出当前页面的超链接元素信息之后,利用服务器加载超链接元素信息对应的一级子页面,并利用服务器实现在一级子页面中查找关键词,有效地减少了客户端设备加载一级子页面的流量消耗,为客户端侧节省了流量,同时,也避免了占用客户端设备过多的资源。
与本发明实施例提供的服务器侧的用于网页内查找关键词的方法相对应,本发明实施例还提供了一种用于网页内查找关键词的装置,参见图4,所述装置包括:
查询请求接收模块401,用于接收客户端侧发送的关键词查询请求,所述关键词查询请求包含用户在所述浏览器的当前页面下输入的关键词和所述当前页面的超链接元素信息;
加载模块402,用于根据所述超链接元素信息加载所述当前页面的一级子页面;
第二查找模块403,用于在所述当前页面的一级子页面的页面内容中对所述关键词进行查找,获得第一查找结果;
信息反馈模块404,用于发送包含所述第一查找结果的反馈信息至所述客户端侧。
总之,根据本发明的用于网页内查找关键词的方法及装置,在用户浏览当前页面时,通过在当前页面的一级子页面的页面内容中对关键词进行查找,并对包含关键词的一级子页面所对应的超链接进行标识,实现了在网页内对关键词的深度查找,提高了查找关键词的效率,并且保证了查找结果的准确性和完整性,更贴近用户的需求。
而且,由于本发明实施例通过提取当前页面的超链接元素信息,并将包含超链接元素信息和关键词的关键词查找请求发送至服务器,由服务器完成对子页面的加载和对关键词的查找,不仅能够减少客户端侧加载子页面的流量消耗,还减轻了对客户端侧资源的占用。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的用于网页内查找关键词的装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
本发明公开了,A1、一种用于网页内查找关键词的方法,包括:
获取用户在当前页面下输入的关键词;
获得在所述当前页面的一级子页面的页面内容中查找所述关键词得到的第一查找结果,所述一级子页面为当前页面中超链接对应的页面;
根据所述第一查找结果,对包含所述关键词的一级子页面所对应的超链接进行标识。
A2、根据A1所述的方法,其特征在于,还包括:
在所述当前页面的页面内容中查找所述关键词;
如果所述当前页面的页面内容中包含所述关键词,则对所述当前页面中的所述关键词进行标识。
A3、根据A1或A2所述的方法,其特征在于,还包括:
获得在所述当前页面的二级以上预设级数子页面的页面内容中查找所述关键词得到的第二查找结果;
根据所述第二查找结果,在当前页面中对包含所述关键词的二级以上预设级数子页面所隶属的一级子页面所对应的超链接进行标识。
A4、根据A3所述的方法,其特征在于,还包括:
当用户打开所述一级子页面所对应的超链接时,在所述一级子页面中对包含所述关键词的下一级子页面所对应的超链接进行标识。
A5、根据A1或A2所述的方法,其特征在于,所述获得在所述当前页面的一级子页面的页面内容中查找所述关键词得到的第一查找结果,包括:
加载所述当前页面的一级子页面;
在所述当前页面的一级子页面的页面内容中对所述关键词进行查找,获得所述第一查找结果。
A6、根据A1或A2所述的方法,其特征在于,在所述获得在所述当前页面的一级子页面的页面内容中查找所述关键词得到的第一查找结果之前,还包括:
提取所述当前页面的超链接元素信息;
发送包含所述超链接元素信息和所述关键词的关键词查找请求至服务器侧,以使所述服务器侧在接收到所述关键词查找请求之后,根据所述超链接元素信息加载所述当前页面的一级子页面,在所述当前页面的一级子页面的页面内容中对所述关键词进行查找,得到所述第一查找结果,并将包含所述第一查找结果的反馈信息发送至客户端侧。
A7、根据A6所述的方法,其特征在于,所述获得在所述当前页面的一级子页面的页面内容中查找所述关键词得到的第一查找结果,包括:
接收所述服务器侧发送的所述反馈信息;
解析所述反馈信息,获得所述第一查找结果。
B8、一种用于网页内查找关键词的方法,包括:
接收客户端侧发送的关键词查询请求,所述关键词查询请求包含用户在所述浏览器的当前页面下输入的关键词和所述当前页面的超链接元素信息;
根据所述超链接元素信息加载所述当前页面的一级子页面;
在所述当前页面的一级子页面的页面内容中对所述关键词进行查找,获得第一查找结果;
发送包含所述第一查找结果的反馈信息至所述客户端侧。
C9、一种用于网页内查找关键词的装置,包括:
获取模块,用于获取用户在当前页面下输入的关键词;
第一获得模块,用于获得在所述当前页面的一级子页面的页面内容中查找所述关键词得到的第一查找结果,所述一级子页面为当前页面中超链接对应的页面;
第一超链接标识模块,用于根据所述第一查找结果,对包含所述关键词的一级子页面所对应的超链接进行标识。
C10、根据C9所述的装置,其特征在于,还包括:
第一查找模块,用于在所述当前页面的页面内容中查找所述关键词;
第一关键词标识模块,用于如果所述当前页面的页面内容中包含所述关键词,则对所述当前页面中的所述关键词进行标识。
C11、根据C9或C10所述的装置,其特征在于,还包括:
第二获得模块,用于获得在所述当前页面的二级以上预设级数子页面的页面内容中查找所述关键词得到的第二查找结果;
第二超链接标识模块,用于根据所述第二查找结果,在当前页面中对包含所述关键词的二级以上预设级数子页面所隶属的一级子页面所对应的超链接进行标识。
C12、根据C11所述的装置,其特征在于,还包括:
第三超链接标识模块,用于当用户打开所述一级子页面所对应的超链接时,在所述一级子页面中对包含所述关键词的下一级子页面所对应的超链接进行标识。
C13、根据C9或C10所述的装置,其特征在于,所述第一获得模块包括:
加载单元,用于加载所述当前页面的一级子页面;
获得单元,用于在所述当前页面的一级子页面的页面内容中对所述关键词进行查找,获得所述第一查找结果。
C14、根据C9或C10所述的装置,其特征在于,还包括:
提取模块,用于提取所述当前页面的超链接元素信息;
查找请求发送模块,用于发送包含所述超链接元素信息和所述关键词的关键词查找请求至服务器侧,以使所述服务器侧在接收到所述关键词查找请求之后,根据所述超链接元素信息加载所述当前页面的一级子页面,在所述当前页面的一级子页面的页面内容中对所述关键词进行查找,得到所述第一查找结果,并将包含所述第一查找结果的反馈信息发送至客户端侧。
C15、根据C14所述的装置,其特征在于,所述第一获得模块,包括:
信息接收单元,用于接收所述服务器侧发送的所述反馈信息;
信息解析单元,用于解析所述反馈信息,获得所述第一查找结果。
D16、一种用于网页内查找关键词的装置,其特征在于,包括:
查询请求接收模块,用于接收客户端侧发送的关键词查询请求,所述关键词查询请求包含用户在所述浏览器的当前页面下输入的关键词和所述当前页面的超链接元素信息;
加载模块,用于根据所述超链接元素信息加载所述当前页面的一级子页面;
第二查找模块,用于在所述当前页面的一级子页面的页面内容中对所述关键词进行查找,获得第一查找结果;
信息反馈模块,用于发送包含所述第一查找结果的反馈信息至所述客户端侧。
Claims (10)
1.一种用于网页内查找关键词的方法,其特征在于,包括:
获取用户在当前页面下输入的关键词;
获得在所述当前页面的一级子页面的页面内容中查找所述关键词得到的第一查找结果,所述一级子页面为当前页面中超链接对应的页面;
根据所述第一查找结果,对包含所述关键词的一级子页面所对应的超链接进行标识。
2.如权利要求1所述的方法,其特征在于,还包括:
在所述当前页面的页面内容中查找所述关键词;
如果所述当前页面的页面内容中包含所述关键词,则对所述当前页面中的所述关键词进行标识。
3.如权利要求1或2所述的方法,其特征在于,还包括:
获得在所述当前页面的二级以上预设级数子页面的页面内容中查找所述关键词得到的第二查找结果;
根据所述第二查找结果,在当前页面中对包含所述关键词的二级以上预设级数子页面所隶属的一级子页面所对应的超链接进行标识。
4.如权利要求3所述的方法,其特征在于,还包括:
当用户打开所述一级子页面所对应的超链接时,在所述一级子页面中对包含所述关键词的下一级子页面所对应的超链接进行标识。
5.如权利要求1或2所述的方法,其特征在于,所述获得在所述当前页面的一级子页面的页面内容中查找所述关键词得到的第一查找结果,包括:
加载所述当前页面的一级子页面;
在所述当前页面的一级子页面的页面内容中对所述关键词进行查找,获得所述第一查找结果。
6.如权利要求1或2所述的方法,其特征在于,在所述获得在所述当前页面的一级子页面的页面内容中查找所述关键词得到的第一查找结果之前,还包括:
提取所述当前页面的超链接元素信息;
发送包含所述超链接元素信息和所述关键词的关键词查找请求至服务器侧,以使所述服务器侧在接收到所述关键词查找请求之后,根据所述超链接元素信息加载所述当前页面的一级子页面,在所述当前页面的一级子页面的页面内容中对所述关键词进行查找,得到所述第一查找结果,并将包含所述第一查找结果的反馈信息发送至客户端侧。
7.如权利要求6所述的方法,其特征在于,所述获得在所述当前页面的一级子页面的页面内容中查找所述关键词得到的第一查找结果,包括:
接收所述服务器侧发送的所述反馈信息;
解析所述反馈信息,获得所述第一查找结果。
8.一种用于网页内查找关键词的方法,其特征在于,包括:
接收客户端侧发送的关键词查询请求,所述关键词查询请求包含用户在所述浏览器的当前页面下输入的关键词和所述当前页面的超链接元素信息;
根据所述超链接元素信息加载所述当前页面的一级子页面;
在所述当前页面的一级子页面的页面内容中对所述关键词进行查找,获得第一查找结果;
发送包含所述第一查找结果的反馈信息至所述客户端侧。
9.一种用于网页内查找关键词的装置,其特征在于,包括:
获取模块,用于获取用户在当前页面下输入的关键词;
第一获得模块,用于获得在所述当前页面的一级子页面的页面内容中查找所述关键词得到的第一查找结果,所述一级子页面为当前页面中超链接对应的页面;
第一超链接标识模块,用于根据所述第一查找结果,对包含所述关键词的一级子页面所对应的超链接进行标识。
10.一种用于网页内查找关键词的装置,其特征在于,包括:
查询请求接收模块,用于接收客户端侧发送的关键词查询请求,所述关键词查询请求包含用户在所述浏览器的当前页面下输入的关键词和所述当前页面的超链接元素信息;
加载模块,用于根据所述超链接元素信息加载所述当前页面的一级子页面;
第二查找模块,用于在所述当前页面的一级子页面的页面内容中对所述关键词进行查找,获得第一查找结果;
信息反馈模块,用于发送包含所述第一查找结果的反馈信息至所述客户端侧。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610513142.7A CN106202314B (zh) | 2016-06-30 | 2016-06-30 | 一种用于网页内查找关键词的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610513142.7A CN106202314B (zh) | 2016-06-30 | 2016-06-30 | 一种用于网页内查找关键词的方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106202314A true CN106202314A (zh) | 2016-12-07 |
CN106202314B CN106202314B (zh) | 2020-02-14 |
Family
ID=57463277
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610513142.7A Active CN106202314B (zh) | 2016-06-30 | 2016-06-30 | 一种用于网页内查找关键词的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106202314B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108664303A (zh) * | 2018-04-28 | 2018-10-16 | 北京小米移动软件有限公司 | 网页内容的显示方法及装置 |
CN112329409A (zh) * | 2019-07-30 | 2021-02-05 | 珠海金山办公软件有限公司 | 一种单元格颜色转换方法、装置及电子设备 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7124127B2 (en) * | 2002-03-20 | 2006-10-17 | Fujitsu Limited | Search server and method for providing search results |
US20080133460A1 (en) * | 2006-12-05 | 2008-06-05 | Timothy Pressler Clark | Searching descendant pages of a root page for keywords |
US20090063264A1 (en) * | 2007-09-04 | 2009-03-05 | Patronsoft Limited | Method for transmitting online advertisements to users |
CN103577392A (zh) * | 2013-11-15 | 2014-02-12 | 北京奇虎科技有限公司 | 基于当前浏览页面的关键词推送方法及装置 |
CN103577597A (zh) * | 2013-11-15 | 2014-02-12 | 北京奇虎科技有限公司 | 基于当前浏览页面的关键词搜索系统 |
CN104809125A (zh) * | 2014-01-24 | 2015-07-29 | 腾讯科技(深圳)有限公司 | 一种网页类别的识别方法和装置 |
CN105095441A (zh) * | 2015-07-23 | 2015-11-25 | 百度在线网络技术(北京)有限公司 | 一种信息获取方法及装置 |
CN104715064B (zh) * | 2015-03-31 | 2018-11-02 | 北京奇虎科技有限公司 | 一种实现在网页上标注关键词的方法和服务器 |
-
2016
- 2016-06-30 CN CN201610513142.7A patent/CN106202314B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7124127B2 (en) * | 2002-03-20 | 2006-10-17 | Fujitsu Limited | Search server and method for providing search results |
US20080133460A1 (en) * | 2006-12-05 | 2008-06-05 | Timothy Pressler Clark | Searching descendant pages of a root page for keywords |
US20090063264A1 (en) * | 2007-09-04 | 2009-03-05 | Patronsoft Limited | Method for transmitting online advertisements to users |
CN103577392A (zh) * | 2013-11-15 | 2014-02-12 | 北京奇虎科技有限公司 | 基于当前浏览页面的关键词推送方法及装置 |
CN103577597A (zh) * | 2013-11-15 | 2014-02-12 | 北京奇虎科技有限公司 | 基于当前浏览页面的关键词搜索系统 |
CN104809125A (zh) * | 2014-01-24 | 2015-07-29 | 腾讯科技(深圳)有限公司 | 一种网页类别的识别方法和装置 |
CN104715064B (zh) * | 2015-03-31 | 2018-11-02 | 北京奇虎科技有限公司 | 一种实现在网页上标注关键词的方法和服务器 |
CN105095441A (zh) * | 2015-07-23 | 2015-11-25 | 百度在线网络技术(北京)有限公司 | 一种信息获取方法及装置 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108664303A (zh) * | 2018-04-28 | 2018-10-16 | 北京小米移动软件有限公司 | 网页内容的显示方法及装置 |
CN108664303B (zh) * | 2018-04-28 | 2023-06-30 | 北京小米移动软件有限公司 | 网页内容的显示方法及装置 |
CN112329409A (zh) * | 2019-07-30 | 2021-02-05 | 珠海金山办公软件有限公司 | 一种单元格颜色转换方法、装置及电子设备 |
CN112329409B (zh) * | 2019-07-30 | 2024-03-22 | 珠海金山办公软件有限公司 | 一种单元格颜色转换方法、装置及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN106202314B (zh) | 2020-02-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10667101B2 (en) | Contextual deep linking of applications | |
CN105335404B (zh) | 页面信息加载方法和装置 | |
CN105095440B (zh) | 一种搜索推荐方法及装置 | |
US8195634B2 (en) | Domain-aware snippets for search results | |
US20180091546A1 (en) | Browser Extension for Contemporaneous in-Browser Tagging and Harvesting of Internet Content | |
JP2022184964A (ja) | インターネットコンテンツ内の要素の直接的なブラウザ内のマークアップのためのシステムおよび方法 | |
US9785710B2 (en) | Automatic crawling of encoded dynamic URLs | |
CN104462508A (zh) | 基于知识图谱的人物关系搜索方法和装置 | |
CN104036003B (zh) | 搜索结果整合方法和装置 | |
CN104021154B (zh) | 一种在浏览器中进行搜索的方法和装置 | |
CN105095441A (zh) | 一种信息获取方法及装置 | |
CN103366011B (zh) | 通过浏览器地址栏访问认证网址的方法、及装置 | |
CN110619103A (zh) | 网页图文检测方法、装置及存储介质 | |
CN105260421A (zh) | 网页加载方法及装置 | |
US20150161279A1 (en) | Displaying Local Site Name Information with Search Results | |
EP2711852A1 (en) | Methods and systems for providing content provider-specified URL keyword navigation | |
CN106202314A (zh) | 一种用于网页内查找关键词的方法及装置 | |
US20210334318A1 (en) | Mechanism for Web Crawling E-Commerce Resource Pages | |
CN104317929A (zh) | 搜索结果呈现优化方法和装置 | |
CN105630868A (zh) | 一种向用户推荐内容的方法及系统 | |
CN105138912A (zh) | 钓鱼网站检测规则的自动生成方法及装置 | |
US20090228438A1 (en) | Method and Apparatus for Identifying if Two Websites are Co-Owned | |
CN106126517A (zh) | 将pc端应用页面转换为移动端应用页面的方法及装置 | |
US20090248673A1 (en) | Method of sorting web pages, search terminal and client terminal | |
CN104331458A (zh) | 以锚文本作为网页标题的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20240104 Address after: 100088 room 112, block D, 28 new street, new street, Xicheng District, Beijing (Desheng Park) Patentee after: BEIJING QIHOO TECHNOLOGY Co.,Ltd. Address before: 100088 room 112, block D, 28 new street, new street, Xicheng District, Beijing (Desheng Park) Patentee before: BEIJING QIHOO TECHNOLOGY Co.,Ltd. Patentee before: Qizhi software (Beijing) Co.,Ltd. |