CN104881453A - 一种识别网页类型的方法和装置 - Google Patents

一种识别网页类型的方法和装置 Download PDF

Info

Publication number
CN104881453A
CN104881453A CN201510254472.4A CN201510254472A CN104881453A CN 104881453 A CN104881453 A CN 104881453A CN 201510254472 A CN201510254472 A CN 201510254472A CN 104881453 A CN104881453 A CN 104881453A
Authority
CN
China
Prior art keywords
webpage
applicable
mobile device
transcoding
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510254472.4A
Other languages
English (en)
Other versions
CN104881453B (zh
Inventor
程刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201510254472.4A priority Critical patent/CN104881453B/zh
Publication of CN104881453A publication Critical patent/CN104881453A/zh
Application granted granted Critical
Publication of CN104881453B publication Critical patent/CN104881453B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明提供了一种识别网页类型的方法和装置,其中方法包括:解析网页的元信息(meta)标签,得到所述网页的类型信息,其中所述网页的类型包括:适合PC浏览的类型、适合移动设备浏览的类型或者兼容PC和移动设备浏览的类型。本发明通过网页的meta标签携带网页类型信息,在对网页类型进行识别时,仅需要解析网页的meta标签即可,无需对网页内容进行复杂的分析,大大降低了对时间、设备性能和资源的消耗。

Description

一种识别网页类型的方法和装置
【技术领域】
本发明涉及计算机应用技术领域,特别涉及一种识别网页类型的方法和装置。
【背景技术】
随着智能手机、平板电脑等智能移动设备的飞速发展,越来越多的用户选择在移动设备中浏览网页。相应地,针对移动设备的web网页设计技术也得到了快速的发展。许多站长开始设计适合移动设备浏览的网页,或者设计能够同时兼容PC和移动设备浏览的网页。然而,在有些场景下需要对网页类型进行识别,确定该网页是适合PC浏览的还是适合移动设备浏览的。例如移动设备端的浏览器在加载网页时,需要识别网页类型,如果是适合PC浏览的网页则可以将该网页转码成适合移动设备浏览的网页。然而,现有技术中对网页类型的识别通常需要对网页内容进行分析,算法往往比较复杂,一方面比较耗时,另一方面对设备性能和资源的消耗也比较大。
【发明内容】
有鉴于此,本发明提供了一种识别网页类型的方法和装置,以便于降低时间、设备性能和资源的消耗。
具体技术方案如下:
本发明提供了一种识别网页类型的方法,该方法包括:
解析网页的元信息meta标签,得到所述网页的类型信息,其中所述网页的类型包括:适合PC浏览的类型、适合移动设备浏览的类型或者兼容PC和移动设备浏览的类型。
根据本发明一优选实施方式,移动设备端的浏览器执行所述解析的步骤后,如果得到适合PC浏览的类型,则将所述网页转码为适合移动设备浏览或兼容PC和移动设备浏览的网页。
根据本发明一优选实施方式,搜索引擎执行所述解析的步骤后,利用得到的所述网页的类型信息设置所述网页在搜索结果中的展现。
根据本发明一优选实施方式,所述搜索引擎执行所述解析的步骤包括:
所述搜索引擎对抓取到的网页执行所述解析的步骤,将抓取到的网页的地址和得到的网页的类型信息对应记录在词典中,以便在搜索关键词命中某网页时在所述词典中查询所述某网页的类型信息。
根据本发明一可选实施方式,如果所述搜索引擎向移动设备发送搜索结果,则所述利用得到的所述网页的类型信息设置所述网页在搜索结果中的展现包括:
提高搜索结果中网页类型为适合移动设备浏览或者兼容PC和移动设备浏览的网页的排序权重;或者,
在搜索结果中对网页类型为适合移动设备浏览或者兼容PC和移动设备浏览的网页进行突出标注;或者,
在搜索结果中针对网页类型为适合PC浏览的网页提供转码后网页对应的地址链接,所述转码包括:将适合PC浏览的网页转码为适合移动设备浏览或者兼容PC和移动设备浏览的网页;或者,
在搜索结果中针对网页类型为适合PC浏览的网页提供指向转码服务的地址链接;或者,
在搜索结果中针对网页类型为适合PC浏览的网页同时提供该网页的地址链接和转码后网页对应的地址链接,所述转码包括:将适合PC浏览的网页转码为适合移动设备浏览或者兼容PC和移动设备浏览的网页。
根据本发明一优选实施方式,所述在搜索结果中针对网页类型为适合PC浏览的网页提供转码后网页对应的地址链接包括:
根据移动设备所处的网络环境和/或移动设备的型号,确定是否在搜索结果中针对网页类型为适合PC浏览的网页提供转码后网页对应的地址链接。
根据本发明一优选实施方式,当所述指向转码服务的地址链接被点击时,将所述适合PC浏览的网页地址作为参数传递给所述转码服务,由所述转码服务对所述适合PC浏览的网页进行转码后进行展现。
本发明还提供了一种识别网页类型的装置,该装置包括:
解析单元,用于解析网页的meta标签,得到所述网页的类型信息,其中所述网页的类型包括:适合PC浏览的类型、适合移动设备浏览的类型或者兼容PC和移动设备浏览的类型。
根据本发明一优选实施方式,该装置设置于移动设备端的浏览器,所述浏览器还包括转码单元;
所述转码单元,用于在所述解析单元得到适合PC浏览的类型时,将所述网页转码为适合移动设备浏览或兼容PC和移动设备浏览的网页。
根据本发明一优选实施方式,该装置设置于搜索引擎,所述搜索引擎还包括:
搜索处理单元,用于利用所述解析单元得到的所述网页的类型信息设置所述网页在搜索结果中的展现。
根据本发明一优选实施方式,所述搜索引擎还包括:记录单元;
所述解析单元对搜索引擎抓取到的网页执行所述解析的操作;
所述记录单元,用于将搜索引擎抓取到的网页的地址和网页的类型信息对应记录在词典中;
所述搜索处理单元,用于在搜索关键词命中某网页时在所述词典中查询所述某网页的类型信息。
根据本发明一可选实施方式,如果所述搜索引擎向移动设备发送搜索结果,则所述搜索处理单元执行:
提高搜索结果中网页类型为适合移动设备浏览或者兼容PC和移动设备浏览的网页的排序权重;或者,
在搜索结果中对网页类型为适合移动设备浏览或者兼容PC和移动设备浏览的网页进行突出标注;或者,
在搜索结果中针对网页类型为适合PC浏览的网页提供转码后网页对应的地址链接,所述转码包括:将适合PC浏览的网页转码为适合移动设备浏览或者兼容PC和移动设备浏览的网页;或者,
在搜索结果中针对网页类型为适合PC浏览的网页提供指向转码服务的地址链接;或者,
在搜索结果中针对网页类型为适合PC浏览的网页同时提供该网页的地址链接和转码后网页对应的地址链接,所述转码包括:将适合PC浏览的网页转码为适合移动设备浏览或者兼容PC和移动设备浏览的网页。
根据本发明一优选实施方式,所述搜索处理单元在搜索结果中针对网页类型为适合PC浏览的网页提供转码后网页对应的地址链接时,具体执行:根据移动设备所处的网络环境和/或移动设备的型号,确定是否在搜索结果中针对网页类型为适合PC浏览的网页提供转码后网页对应的地址链接。
根据本发明一优选实施方式,所述搜索处理单元在所述指向转码服务的地址链接被点击时,将所述适合PC浏览的网页地址作为参数传递给所述转码服务,由所述转码服务对所述适合PC浏览的网页进行转码后进行展现。
由以上技术方案可以看出,本发明通过网页的meta标签携带网页类型信息,在对网页类型进行识别时,仅需要解析网页的meta标签即可,无需对网页内容进行复杂的分析,大大降低了对时间、设备性能和资源的消耗。
【附图说明】
图1为本发明实施例提供的一个搜索结果的展现效果图;
图2为本发明实施例提供的另一个搜索结果的展现效果图;
图3为本发明实施例提供的一种浏览器结构图;
图4为本发明实施例提供的一种搜索引擎的结构图。
【具体实施方式】
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。
本发明的核心思想在于,在网页中通过一个扩展的meta(元信息)标签标注网页类型信息,该网页类型信息包括适合浏览该网页的设备信息,包括但不限于适合PC浏览的类型、适合移动设备浏览的类型或者兼容PC和移动设备浏览的类型。
meta标签是页面HTML(HyperText Markup language,超文本标记语言)源代码中HEAD(头部)区的一个关键标签,meta标签用来描述一个HTML网页文档的属性,提供的信息虽然用户不可见,但却是文档最基本的元信息。meta标签提供文档字符集、使用语言、作者等基本信息。在本发明实施例中对meta标签进行扩展,使其携带网页的类型信息,该网页的类型信息用于表征该网页适合哪些设备浏览。
在本发明实施例中可以增加一行meta标注,该meta标注可以声明三种网页的类型:PC网页(即适合PC浏览的网页)、移动网页(即适合移动设备浏览的网页)、响应式网页(即兼容PC和移动设备浏览的网页)。
例如,如果某网页只适合在PC上进行浏览,则可以在网页HTML源码中增加如下meta标签:
<meta name="applicable-device"  content="pc">
如果某网页只适合在移动设备上进行浏览,则可以在网页HTML源码中增加如下meta标签:
<meta name="applicable-device"  content="mobile">
如果某网页采用了响应式网页设计,即该网页可以根据浏览器的屏幕大小自适应的展现合适的效果,同时兼容PC和移动设备的浏览,则可以在网页HTML源码中增加如下meta标签:
<meta name="applicable-device"  content="pc,mobile">
相应地,对于需要识别网页类型的装置,可以解析网页的meta标签,得到该网页的类型信息,即适合浏览该网页的设备信息。对于得到该网页的类型信息之后的应用场景可以包括但不限于以下两种:
第一种应用场景:浏览器对要加载的网页解析其meta标签,得到该网页的类型信息。
如果是移动设备端的浏览器,对要加载的网页进行解析后,如果得到该网页类型为适合PC浏览的类型,由于适合PC浏览的网页通常其宽度和布局并不适合移动设备的屏幕,且流量消耗很大,因此可以将该网页转码为适合移动设备端浏览的网页,也可以转码为兼容PC和移动设备浏览的网页。
如果是PC端浏览器,由于其浏览网页通常无压力,因此对于任何网页都可以不进行处理直接浏览。但为了更好的浏览效果,PC端浏览器如果解析得到网页是适合移动设备端浏览的类型,则也可以进行转码处理将其转码为适合PC浏览的网页,或者转码为兼容PC和移动设备浏览的网页。
其中对网页进行的转码处理可以采用现有的实现方式,在此不再详述。
第二种应用场景:搜索引擎对网页进行解析,得到该网页的类型信息,并利用该网页的类型信息设置该网页在搜索结果中的展现。
具体地,搜索引擎中的Spider抓取到网页后,对抓取的网页解析meta标签,得到网页的类型信息,搜索引擎可以将网页的URL(Uniform ResoureLocator,统一资源定位符)地址和网页的类型信息对应记录在一个词典中,实际上在该词典中就保存了URL以及适合浏览该网页的设备信息。
当用户在移动设备上使用搜索引擎进行搜索时,搜索引擎首先对搜索关键词执行检索,然后对搜索关键词命中的网页(即搜索结果)在词典中查询网页的类型信息。然后利用网页的类型信息设置该网页在搜索结果中的展现,具体的设置方式可以采用但不限于以下几种:
第一种方式:对于网页类型为适合移动设备浏览或者兼容PC和移动设备浏览的网页,可以提高其在搜索结果中的排序权重。这样,适合移动设备浏览或者兼容PC和移动设备浏览的网页的排序就会适当的提前,使得兼顾网页与搜索关键词相关性前提下,用户能够优先看到适合移动设备浏览或者兼容PC和移动设备浏览的网页。
例如,对于http://www.sina.com.cn和http://3g.sina.com.cn的两个网页,两者与搜索关键词的相关性相同,后者为适合移动设备端浏览的网页,那么在用户使用移动设备进行搜索时,搜索引擎就可以提高后者网页在搜索结果中的权重,用户就能够在搜索结果中优先看到后者网页而非前者网页,显然能够给用户带来更好的体验,更节省用户时间和操作。用户在打开后者网页时,浏览器也无需进行转码处理。
第二种方式:在搜索结果中对网页类型为适合移动设备浏览或者兼容PC和移动设备浏览的网页进行突出标注。
为了方便用户在搜索结果中能够快速找到适合移动设备浏览或者兼容PC和移动设备浏览的网页,在搜索结果中可以对这些网页进行突出的标注,突出标注的方式可以包括但不限于:特殊标识、特殊颜色、特殊字体等等。
举个例子:假设用户在移动设备端的搜索引擎搜索“鲜花”,得到如图1中所示的搜索结果,在该搜索结果中对于适合移动设备或兼容PC和移动设备浏览的网页进行了突出标注,即在这些网页的标题附近增加了一个黑框,里面用文字注明“移动页”。
第三种方式:对于网页类型为适合PC浏览的网页,在搜索结果中提供该网页进行转码后的网页对应的地址链接,该转码可以包括:将适合PC浏览的网页转码为适合移动设备浏览或兼容PC和移动设备浏览的网页。
这种方式是在提供搜索结果之前,先对搜索结果中适合PC浏览的网页进行一个转码的处理,然后在搜索结果中提供转码后网页对应的地址链接。这样,当用户点击该地址链接时,能够跳转到转码后的网页,该网页是适合PC浏览或者兼容PC和移动设备浏览的网页。也就是说,通过这种处理方式,用户在搜索结果中点击链接发生的跳转会更加适合移动设备端浏览,一方面适合移动设备端展现,另一方面节省流量。
另外,在这种方式下可以综合考虑移动设备所处的网络环境、移动设备的型号等因素,来确定是否在搜索结果中针对网页类型为适合PC浏览的网页提供转码后网页对应的地址链接。例如,如果移动设备处于GPS网络或者型号显示性能较弱,则可以在搜索结果中针对该网页类型为适合PC浏览的网页提供转码后网页对应的地址链接。如果移动设备处于wifi网络且型号显示性能较强,则可以不必对适合PC浏览的网页提供转码后网页对应的地址链接,而是直接提供该适合PC浏览的网页对应的地址链接。
在这种方式中,对适合PC浏览的网页进行的转码可以由搜索引擎的搜索服务器直接执行,也可以由搜索引擎将该适合PC浏览的网页提供给转码服务器,由转码服务器进行转码后,将转码后网页的地址链接或者将转码后的网页返回给搜索引擎。
举一个例子,同样,用户在移动设备端的搜索引擎输入搜索关键词“鲜花”,返回的搜索结果原本即包含有适合PC显示的页面,又包含有适合移动设备显示的页面,采用该方式对适合PC显示的页面进行转码后,在搜索结果中提供转码后页面对应的地址链接。这样,搜索结果中的地址链接均指向适合移动设备浏览的页面,如图2中所示。
第四种方式:在搜索结果中针对网页类型为适合PC浏览的网页提供指向转码服务的地址链接。
这种情况搜索引擎并不预先对适合PC浏览的网页进行转码处理,而是在搜索结果中将适合PC浏览的网页提供指向转码服务的地址链接。当用户点击某适合PC浏览的网页时,实际上是点击该指向转码服务的地址链接,在发送该地址链接的请求时,该适合PC浏览的网页地址作为参数传递给该转码服务。该地址链接对应的转码服务会对该适合PC浏览的网页进行转码,在发生网页跳转时,就能够展现转码后的网页。
这种方式实际上是搜索结果中的所有适合PC浏览的网页都指向统一的转码服务,无论是其中哪个网页被点击,均由该统一的转码服务完成网页的转码。对于用户而言,并不会感知到该转码服务的中间处理,当用户点击地址链接后,跳转到转码后的网页。
本发明提供的识别网页类型的装置包括解析单元,负责解析网页的meta标签,得到网页的类型信息,其中网页的类型信息可以包括但不限于:适合PC浏览的类型、适合移动设备浏览的类型或者兼容PC和移动设备浏览的类型。
根据上述方法实施例中的描述,该识别网页类型的装置可以设置于浏览器中,也可以设置于搜索引擎中。图3为本发明实施例提供的一种浏览器结构图,如图3所示,该浏览器可以包括:解析单元01和转码单元02。
解析单元01负责解析网页的meta标签,即解析浏览器要加载的网页的meta标签,得到网页的类型信息。如果该浏览器为移动设备端的浏览器,则在解析单元01得到适合PC浏览的类型时,由于适合PC浏览的网页通常其宽度和布局并不适合移动设备的屏幕,且流量消耗很大,转码单元02可以将该网页转码为适合移动设备浏览或兼容PC和移动设备浏览的网页。
如果该浏览器为PC端的浏览器,由于其浏览网页通常无压力,因此对于任何网页都可以不进行处理直接浏览。但为了更好的浏览效果,在解析单元01得到适合移动设备浏览的类型时,也可以进行转码处理将其转码为适合PC浏览的网页,或者转码为兼容PC和移动设备浏览的网页。
图4为本发明实施例提供的一种搜索引擎结构图,如图4所示,该搜索引擎包括:解析单元11、搜索处理单元12和记录单元13。
解析单元11负责解析网页的meta标签,得到网页的类型信息。搜索处理单元12负责利用解析单元11得到的网页的类型信息设置该网页在搜索结果中的展现。
具体地,解析单元11可以对搜索引擎的Spider抓取到的网页进行解析,记录单元13将Spider抓取到的网页的URL地址和网页的类型信息对应记录在词典中,实际上在该词典中就保存了URL以及适合浏览该网页的设备信息。当用户在移动设备上使用搜索引擎进行搜索时,搜索处理单元12可以首先对搜索关键词执行检索,然后搜索处理单元12在搜索关键词命中某网页时在词典中查询该网页的类型信息,最后再利用网页的类型信息设置该网页在搜索结果中的展现。
搜索引擎向移动设备发送搜索结果时,搜索处理单元12可以采用以下方式对搜索结果进行设置:
第一种方式:对于网页类型为适合移动设备浏览或者兼容PC和移动设备浏览的网页,可以提高其在搜索结果中的排序权重。这样,适合移动设备浏览或者兼容PC和移动设备浏览的网页的排序就会适当的提前,使得兼顾网页与搜索关键词相关性前提下,用户能够优先看到适合移动设备浏览或者兼容PC和移动设备浏览的网页。
第二种方式:在搜索结果中对网页类型为适合移动设备浏览或者兼容PC和移动设备浏览的网页进行突出标注。
为了方便用户在搜索结果中能够快速找到适合移动设备浏览或者兼容PC和移动设备浏览的网页,在搜索结果中可以对这些网页进行突出的标注,突出标注的方式可以包括但不限于:特殊标识、特殊颜色、特殊字体等等。
第三种方式:对于网页类型为适合PC浏览的网页,在搜索结果中提供该网页进行转码后的网页对应的地址链接,该转码可以包括:将适合PC浏览的网页转码为适合移动设备浏览或兼容PC和移动设备浏览的网页。
这种方式是在提供搜索结果之前,先对搜索结果中适合PC浏览的网页进行一个转码的处理,然后在搜索结果中提供转码后网页对应的地址链接。这样,当用户点击该地址链接时,能够跳转到转码后的网页,该网页是适合PC浏览或者兼容PC和移动设备浏览的网页。也就是说,通过这种处理方式,用户在搜索结果中点击链接发生的跳转会更加适合移动设备端浏览,一方面适合移动设备端展现,另一方面节省流量。
另外,在这种方式下可以综合考虑移动设备所处的网络环境、移动设备的型号等因素,来确定是否在搜索结果中针对网页类型为适合PC浏览的网页提供转码后网页对应的地址链接。例如,如果移动设备处于GPS网络或者型号显示性能较弱,则可以在搜索结果中针对该网页类型为适合PC浏览的网页提供转码后网页对应的地址链接。如果移动设备处于wifi网络且型号显示性能较强,则可以不必对适合PC浏览的网页提供转码后网页对应的地址链接,而是直接提供该适合PC浏览的网页对应的地址链接。
第四种方式:在搜索结果中针对网页类型为适合PC浏览的网页提供指向转码服务的地址链接。
这种情况搜索引擎并不预先对适合PC浏览的网页进行转码处理,而是在搜索结果中将适合PC浏览的网页提供指向转码服务的地址链接。当用户点击某适合PC浏览的网页时,实际上是点击该指向转码服务的地址链接,在发送该地址链接的请求时,该适合PC浏览的网页地址作为参数传递给该转码服务。该地址链接对应的转码服务会对该适合PC浏览的网页进行转码,在发生网页跳转时,就能够展现转码后的网页。
本发明实施例中涉及的移动设备可以包括但不限于:智能手机、平板电脑、PDA(个人数字助理)等。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (14)

1.一种识别网页类型的方法,其特征在于,该方法包括:
解析网页的元信息meta标签,得到所述网页的类型信息,其中所述网页的类型包括:适合PC浏览的类型、适合移动设备浏览的类型或者兼容PC和移动设备浏览的类型。
2.根据权利要求1所述的方法,其特征在于,移动设备端的浏览器执行所述解析的步骤后,如果得到适合PC浏览的类型,则将所述网页转码为适合移动设备浏览或兼容PC和移动设备浏览的网页。
3.根据权利要求1所述的方法,其特征在于,搜索引擎执行所述解析的步骤后,利用得到的所述网页的类型信息设置所述网页在搜索结果中的展现。
4.根据权利要求3所述的方法,其特征在于,所述搜索引擎执行所述解析的步骤包括:
所述搜索引擎对抓取到的网页执行所述解析的步骤,将抓取到的网页的地址和得到的网页的类型信息对应记录在词典中,以便在搜索关键词命中某网页时在所述词典中查询所述某网页的类型信息。
5.根据权利要求3或4所述的方法,其特征在于,如果所述搜索引擎向移动设备发送搜索结果,则所述利用得到的所述网页的类型信息设置所述网页在搜索结果中的展现包括:
提高搜索结果中网页类型为适合移动设备浏览或者兼容PC和移动设备浏览的网页的排序权重;或者,
在搜索结果中对网页类型为适合移动设备浏览或者兼容PC和移动设备浏览的网页进行突出标注;或者,
在搜索结果中针对网页类型为适合PC浏览的网页提供转码后网页对应的地址链接,所述转码包括:将适合PC浏览的网页转码为适合移动设备浏览或者兼容PC和移动设备浏览的网页;或者,
在搜索结果中针对网页类型为适合PC浏览的网页提供指向转码服务的地址链接;或者,
在搜索结果中针对网页类型为适合PC浏览的网页同时提供该网页的地址链接和转码后网页对应的地址链接,所述转码包括:将适合PC浏览的网页转码为适合移动设备浏览或者兼容PC和移动设备浏览的网页。
6.根据权利要求5所述的方法,其特征在于,所述在搜索结果中针对网页类型为适合PC浏览的网页提供转码后网页对应的地址链接包括:
根据移动设备所处的网络环境和/或移动设备的型号,确定是否在搜索结果中针对网页类型为适合PC浏览的网页提供转码后网页对应的地址链接。
7.根据权利要求5所述的方法,其特征在于,当所述指向转码服务的地址链接被点击时,将所述适合PC浏览的网页地址作为参数传递给所述转码服务,由所述转码服务对所述适合PC浏览的网页进行转码后进行展现。
8.一种识别网页类型的装置,其特征在于,该装置包括:
解析单元,用于解析网页的meta标签,得到所述网页的类型信息,其中所述网页的类型包括:适合PC浏览的类型、适合移动设备浏览的类型或者兼容PC和移动设备浏览的类型。
9.根据权利要求8所述的装置,其特征在于,该装置设置于移动设备端的浏览器,所述浏览器还包括转码单元;
所述转码单元,用于在所述解析单元得到适合PC浏览的类型时,将所述网页转码为适合移动设备浏览或兼容PC和移动设备浏览的网页。
10.根据权利要求8所述的装置,其特征在于,该装置设置于搜索引擎,所述搜索引擎还包括:
搜索处理单元,用于利用所述解析单元得到的所述网页的类型信息设置所述网页在搜索结果中的展现。
11.根据权利要求10所述的装置,其特征在于,所述搜索引擎还包括:记录单元;
所述解析单元对搜索引擎抓取到的网页执行所述解析的操作;
所述记录单元,用于将搜索引擎抓取到的网页的地址和网页的类型信息对应记录在词典中;
所述搜索处理单元,用于在搜索关键词命中某网页时在所述词典中查询所述某网页的类型信息。
12.根据权利要求9或10所述的装置,其特征在于,如果所述搜索引擎向移动设备发送搜索结果,则所述搜索处理单元执行:
提高搜索结果中网页类型为适合移动设备浏览或者兼容PC和移动设备浏览的网页的排序权重;或者,
在搜索结果中对网页类型为适合移动设备浏览或者兼容PC和移动设备浏览的网页进行突出标注;或者,
在搜索结果中针对网页类型为适合PC浏览的网页提供转码后网页对应的地址链接,所述转码包括:将适合PC浏览的网页转码为适合移动设备浏览或者兼容PC和移动设备浏览的网页;或者,
在搜索结果中针对网页类型为适合PC浏览的网页提供指向转码服务的地址链接;或者,
在搜索结果中针对网页类型为适合PC浏览的网页同时提供该网页的地址链接和转码后网页对应的地址链接,所述转码包括:将适合PC浏览的网页转码为适合移动设备浏览或者兼容PC和移动设备浏览的网页。
13.根据权利要求12所述的装置,其特征在于,所述搜索处理单元在搜索结果中针对网页类型为适合PC浏览的网页提供转码后网页对应的地址链接时,具体执行:根据移动设备所处的网络环境和/或移动设备的型号,确定是否在搜索结果中针对网页类型为适合PC浏览的网页提供转码后网页对应的地址链接。
14.根据权利要求12所述的装置,其特征在于,所述搜索处理单元在所述指向转码服务的地址链接被点击时,将所述适合PC浏览的网页地址作为参数传递给所述转码服务,由所述转码服务对所述适合PC浏览的网页进行转码后进行展现。
CN201510254472.4A 2015-05-18 2015-05-18 一种识别网页类型的方法和装置 Active CN104881453B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510254472.4A CN104881453B (zh) 2015-05-18 2015-05-18 一种识别网页类型的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510254472.4A CN104881453B (zh) 2015-05-18 2015-05-18 一种识别网页类型的方法和装置

Publications (2)

Publication Number Publication Date
CN104881453A true CN104881453A (zh) 2015-09-02
CN104881453B CN104881453B (zh) 2019-06-28

Family

ID=53948946

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510254472.4A Active CN104881453B (zh) 2015-05-18 2015-05-18 一种识别网页类型的方法和装置

Country Status (1)

Country Link
CN (1) CN104881453B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105630987A (zh) * 2015-12-25 2016-06-01 北京搜狗科技发展有限公司 自适应用户代理的统一资源定位符前缀挖掘方法和装置
CN106126198A (zh) * 2016-05-31 2016-11-16 美通云动(北京)科技有限公司 在移动端加载pc端应用页面的方法及装置
CN106469189A (zh) * 2016-08-30 2017-03-01 北京奇虎科技有限公司 一种前端辅助转码的浏览方法和装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100095024A1 (en) * 2008-09-25 2010-04-15 Infogin Ltd. Mobile sites detection and handling
CN103166981A (zh) * 2011-12-08 2013-06-19 腾讯科技(深圳)有限公司 一种无线网页转码方法及装置
CN103347056A (zh) * 2013-06-19 2013-10-09 百度在线网络技术(北京)有限公司 移动终端的网页访问方法、系统以及服务器
CN103631795A (zh) * 2012-08-22 2014-03-12 百度在线网络技术(北京)有限公司 一种在网络设备中对网页进行转换的方法、装置和设备
CN103631793A (zh) * 2012-08-22 2014-03-12 百度在线网络技术(北京)有限公司 一种用于对搜索结果进行排序的方法、装置与设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100095024A1 (en) * 2008-09-25 2010-04-15 Infogin Ltd. Mobile sites detection and handling
CN103166981A (zh) * 2011-12-08 2013-06-19 腾讯科技(深圳)有限公司 一种无线网页转码方法及装置
CN103631795A (zh) * 2012-08-22 2014-03-12 百度在线网络技术(北京)有限公司 一种在网络设备中对网页进行转换的方法、装置和设备
CN103631793A (zh) * 2012-08-22 2014-03-12 百度在线网络技术(北京)有限公司 一种用于对搜索结果进行排序的方法、装置与设备
CN103347056A (zh) * 2013-06-19 2013-10-09 百度在线网络技术(北京)有限公司 移动终端的网页访问方法、系统以及服务器

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
SHUIZHEQI1989: "百度移动搜索优化指南 2.0——百度移动搜索官方团队", 《豆丁网》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105630987A (zh) * 2015-12-25 2016-06-01 北京搜狗科技发展有限公司 自适应用户代理的统一资源定位符前缀挖掘方法和装置
WO2017107708A1 (zh) * 2015-12-25 2017-06-29 北京搜狗科技发展有限公司 自适应用户代理的统一资源定位符前缀挖掘方法和装置
CN105630987B (zh) * 2015-12-25 2019-06-21 北京搜狗科技发展有限公司 自适应用户代理的统一资源定位符前缀挖掘方法和装置
CN106126198A (zh) * 2016-05-31 2016-11-16 美通云动(北京)科技有限公司 在移动端加载pc端应用页面的方法及装置
CN106126198B (zh) * 2016-05-31 2019-07-30 红芯时代(北京)科技有限公司 在移动端加载pc端应用页面的方法及装置
CN106469189A (zh) * 2016-08-30 2017-03-01 北京奇虎科技有限公司 一种前端辅助转码的浏览方法和装置

Also Published As

Publication number Publication date
CN104881453B (zh) 2019-06-28

Similar Documents

Publication Publication Date Title
CN100476830C (zh) 一种网络资源检索方法及系统
CN102819555B (zh) 一种在网页的阅读模式中进行推荐信息加载的方法和装置
CN102930059B (zh) 一种聚焦爬虫的设计方法
CN104239298B (zh) 文本信息推荐方法、服务器、浏览器及系统
US20060155728A1 (en) Browser application and search engine integration
US9311303B2 (en) Interpreted language translation system and method
WO2010114913A1 (en) Method and system of retrieving ajax web page content
KR20110085995A (ko) 검색 결과들의 제공
CN101676907A (zh) 一种互联网资源定向获取方法及系统
US20130339840A1 (en) System and method for logical chunking and restructuring websites
CN104715064A (zh) 一种实现在网页上标注关键词的方法和服务器
CN101082917A (zh) 一种快速预览网页内容摘要的方法和装置
US20160306887A1 (en) Methods, apparatuses and systems for linked and personalized extended search
CN103970800B (zh) 网页相关关键词的抽取处理方法和系统
CN104809173A (zh) 一种搜索结果的处理方法和装置
US8595619B1 (en) In response to a search result query providing a snippet of a document including an element previously highlighted by a user
CN103729178A (zh) 一种浏览器多标签页的处理方法及系统
US11720407B2 (en) Resource pre-fetch using age threshold
CN104881453A (zh) 一种识别网页类型的方法和装置
EP3238105B1 (en) Application partial deep link to a corresponding resource
CN102955852A (zh) 一种网页资源处理方法、装置及设备
CN110297994A (zh) 网页数据的采集方法、装置、计算机设备和存储介质
WO2015074455A1 (zh) 一种计算关联网页URL模式pattern的方法和装置
CN103150355A (zh) 一种网页内容预览的方法、装置及设备
CN104778232A (zh) 一种基于长查询的搜索结果的优化方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant