CN105373565A - 网页处理方法及装置 - Google Patents

网页处理方法及装置 Download PDF

Info

Publication number
CN105373565A
CN105373565A CN201410438540.8A CN201410438540A CN105373565A CN 105373565 A CN105373565 A CN 105373565A CN 201410438540 A CN201410438540 A CN 201410438540A CN 105373565 A CN105373565 A CN 105373565A
Authority
CN
China
Prior art keywords
web pages
page
pages component
identification information
webpage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410438540.8A
Other languages
English (en)
Other versions
CN105373565B (zh
Inventor
梁捷
刘欣
蔺文龙
董洲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba China Co Ltd
Original Assignee
Ucweb Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ucweb Inc filed Critical Ucweb Inc
Priority to CN201410438540.8A priority Critical patent/CN105373565B/zh
Publication of CN105373565A publication Critical patent/CN105373565A/zh
Application granted granted Critical
Publication of CN105373565B publication Critical patent/CN105373565B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Transfer Between Computers (AREA)

Abstract

本发明提供一种网页处理方法及装置,其中,该网页处理方法包括:接收用户访问一站点页面的请求;响应所述请求获取并加载相应的网页;分析所述网页的页面结构以获得网页组件;分析所述网页组件以得到每个网页组件的辨识性信息的属性值,该辨识性信息用于网页转码处理。利用本发明,通过对原网页的页面结构进行分析可以得到原网页的辨识性信息(如配色方案),并在转码页中载入原网页的辨识性信息,从而实现转码页的页面风格更加符合原网页的页面风格,保留用户对原网页的品牌认知。

Description

网页处理方法及装置
技术领域
本发明涉及网页处理技术领域,尤其涉及一种网页处理方法及装置。
背景技术
在当前品牌意识逐渐加强的互联网时代,数目繁多的各类网站通过各种方式提升用户对网站的品牌认知,而网站配色方案是形成品牌意识的重要方式之一,例如,人们提及淘宝,会习惯性地联想到橙白风格,提及百度,会习惯性地联想到蓝白风格。
由于当前各类网页转码技术中,展现层主要采用的是固定的HTML+CSS模板,因而转码页的网页风格(如:配色方案)是统一而且固定的,无法支持智能适配原网页的页面风格,即,自识别原始网页的风格(如:配色方案)后通过智能修改CSS等样式,并应用于转码中间页。
发明内容
本发明要解决的技术问题是提供一种网页处理方法及装置,在转码页上使用原网页的页面风格(如:配色方案),保留用户对原网页的品牌认知。
为解决上述问题,本发明提供一种网页处理方法,所述方法包括:接收用户访问一站点页面的请求;响应所述请求获取并加载相应的网页;分析所述网页的页面结构以获得所述网页中所包含的网页组件;分析所述网页组件以得到每个网页组件的辨识性信息的属性值,所述辨识性信息用于网页转码处理。
优选地,所述分析所述网页的页面结构以获得所述网页中所包含的网页组件的步骤包括:在所述网页的代码中插入相应的网页分析程序语言,以预先定义网页组件及所述网页组件的接口;利用所述网页分析程序语言执行网页结构识别逻辑,以根据所述预先定义的网页组件的接口识别出所述网页的页面中所包含的网页组件。
优选地,所述分析所述网页组件以得到每个网页组件的辨识性信息的属性值的步骤之后,还包括:根据所述网页组件的辨识性信息的属性值以及所述预先定义的网页组件的接口为所述预先定义的网页组件的辨识性信息的属性值进行赋值。
优选地,所述根据所述网页组件的辨识性信息的属性值以及所述预先定义的网页组件的接口为所述预先定义的网页组件的辨识性信息的属性值进行赋值的步骤之后,还包括:遍历已赋值的所述预先定义的网页组件以拼装成级联样式文本,并将所述级联样式文本通过内联方式形成所述转码页面。
优选地,所述网页的网页组件均具有对应的文档网页组件模型数组,多个网页组件模型数组形成网页组件模型数组树;所述将所述级联样式文本通过内联方式形成所述转码页面的步骤具体为:将内联的级联样式文本插入所述网页组件模型数组树中,由已经赋值的所述预先定义的网页组件按照所述级联样式形成所述转码页面。
优选地,所述分析所述网页组件以得到每个网页组件的辨识性信息的属性值的步骤之后,还包括:将所述网页组件的辨识性信息的属性值按照权重排列,并选择权重值最大的辨识性信息的属性值;以及
根据所述权重值最大的辨识性信息的属性值为所述转码页面对应的网页组件的辨识性信息的属性值进行赋值。
优选地,所述网页组件的辨识性信息为网页组件的配色属性,和/或字体大小。
为解决上述问题,本发明还提供一种网页处理装置,所述装置包括:网页访问单元,用于接收用户访问一站点页面的请求;页面加载单元,用于响应所述请求获取并加载对应的网页;页面分析单元,用于分析所述网页的页面结构以获得所述网页中所包含的网页组件;以及辨识性信息属性确定单元,用于分析所述网页组件以得到每个网页组件的辨识性信息的属性值,所述辨识性信息用于网页转码处理。
优选地,所述页面分析单元还用于在所述网页的代码中插入相应的网页分析程序语言,以预先定义网页组件及所述网页组件的接口,以及利用所述网页分析程序语言执行网页结构识别逻辑,以根据所述预先定义的网页组件的接口识别出所述网页的页面中所包含的网页组件。
优选地,所述装置还包括:辨识性信息应用单元,用于根据所述网页组件的辨识性信息的属性值以及所述预先定义的网页组件的接口为所述预先定义的网页组件的辨识性信息的属性值进行赋值,以及遍历已赋值的所述预先定义的网页组件以拼装成级联样式文本,并将所述级联样式文本通过内联方式形成所述转码页面。
本发明提供的一种网页处理方法及装置,预先对原网页的页面结构进行分析以得到原网页的辨识性信息(即页面风格,如:配色方案),在转码页码载入原网页的辨识性信息,以设置转码后的页面中的页面风格(如:字体颜色、标题栏颜色、链接颜色等等),使得转码页面更加个性化,转码不同的页面呈现的是不同的网页风格,从而实现在转码页的网页风格更加符合原网页的网页风格,保留用户对原网页色彩风格的品牌认知。
附图说明
图1为本发明第一实施方式中的网页处理方法的流程示意图;
图2为本发明第二实施方式中的网页处理方法的流程示意图;
图3为本发明第二实施方式中的网页处理方法中获得网页组件方法的流程示意图;
图4为本发明第三实施方式中的网页处理方法的流程示意图;
图5为本发明第三实施方式中的网页处理方法中获得网页组件方法的流程示意图;
图6为本发明一实施方式中的网页处理装置的功能模块示意图;
图7为本发明另一实施方式中的网页处理装置的功能模块示意图。
元件标号:
装置40、50
网页访问单元41、51
页面加载单元42、52
页面分析单元43、53
辨识性信息属性确定单元44、54
辨识性信息应用单元55
具体实施方式
为详细说明本发明的技术内容、构造特征、所实现目的及效果,以下结合附图和实施例对本发明进行详细说明。
请参阅图1,为本发明第一实施方式中的网页处理方法的流程示意图。
步骤S10,接收用户访问一站点页面的请求。
例如,用户在用户终端上输入一个网页地址,请求访问该网页,该用户终端接收到请求后将其发送至服务器。在本实施方式中,该用户终端可以是手机、平板电脑、个人数字助理、电子书、计算机等具有各种操作系统的硬件设备。在该硬件设备可以采用任何的操作系统,例如,Android、iPhoneOS系统等。
步骤S11,响应该请求获取并加载相应的网页。
具体地,用户终端根据请求访问服务器以抓取网页,并在该用户终端上加载该网页。
步骤S12,分析该网页的页面结构以获得该网页中所包含的网页组件。
步骤S13,分析该网页组件以得到每个网页组件的辨识性信息的属性值,该辨识性信息用于网页转码处理。
在本实施方式中,该网页组件的辨识性信息可以为网页组件的配色属性和/或字体大小。辨识性信息还可以是其他的网页配置信息。
请参阅图2,为本发明第二实施方式中的网页处理方法的流程示意图。该实施例示出的网页处理方法的流程包括步骤:
步骤S20,接收用户访问一站点页面的请求。
步骤S21,响应该请求获取并加载相应的网页。
具体地,用户终端根据请求访问服务器以抓取网页,并在该用户终端上加载该网页。
步骤S22,分析该网页的页面结构以获得该网页中所包含的网页组件。
请同时参阅图3,具体地,该步骤S12可以根据如下子步骤实现:
步骤S221,在该网页的页面代码中插入相应的网页分析程序语言,以预先定义网页组件及该网页组件的接口,例如,该网页分析程序语言为直译式脚本语言JavaScript,预先定义网页组件的接口的格式如下:
导航栏——Nav;
标题栏——Title1、Title2、Title3等;
主要按钮——Btn;
列表区块——List;其中,包括文本(链接)列表——TxtList;
图文列表——ImgTxtList;图片列表——ImgList,等等。
文本框——Input
友情链接——FriendLink;
分页——Page;
在本实施方式中,每个网页组件的接口格式均被定义为JSON(JavascriptObjectNotation,轻量级数据交换语言)。
进一步地,该网页分析程序语言还对该预先定义的网页组件的接口设置默认值,下面以利用直译式脚本语言JavaScript分别设置导航栏、标题栏以及文本列表的接口的默认值为例进行说明,设置预先定义的网页组件的接口默认值格式如下:
子步骤S222,利用该网页分析程序语言执行网页的页面结构识别逻辑,并根据该预先定义的网页组件的接口识别出该网页的页面中所包含的网页组件,每个网页组件均具有对应的DOM(DocumentObjectModel,文档网页组件模型)数组。
步骤S23,分析该网页组件以得到每个网页组件的辨识性信息的属性值,该辨识性信息用于网页转码处理。
在本实施方式中,该网页组件的辨识性信息可以为网页组件的配色属性和/或字体大小。辨识性信息还可以是其他的网页配置信息。
下面以网页组件为导航栏、辨识性信息为网页组件的配色属性为例进行详细说明。
(1)当导航栏的背景色是颜色属性时:
获取导航栏对应的DOM数组,即NavObject(以下简称NavObj),并通过调用相应的获取组件对象颜色属性的指令,例如,window.getCompurtedStyle,获取该NavObject对应的样式组件对象,即,NavObjectStyle,然后利用NavObjectStyle取得形成该NavObj样式所需的各种颜色属性及其属性值,从而确定该NavObj的配色。
(2)当导航栏的背景颜色是图片时:
获取导航栏的背景图片,创建canvas并将该背景图片载入到该canvas中,调用相应的获取图片颜色的指令,例如,getImageData,从canvas读取该背景图片的imageDate,并将获取的imageDate按像素点高度逐像素点地生成一个像素点-色值的二维数组。选择两个二维数组[0]-[0]和[0]-[x](x为像素点高度值,例如),当判断两个二维数组中的色值相等时则认为该图片是纯色背景,并使用二维数组[0]-[0]的色值作为背景色。否则,认为该图片是渐变色背景,使用两个二维数组的色值设置渐变色以作为背景色。
进一步地,该步骤23还包括分析该网页的CSS(CascadingStyleSheet,级联样式表)中针对BODY、HTML等根节点标签出现的文字的字体大小与字体颜色。
步骤S24,将分析得到的每个网页组件的辨识性信息的属性值按照权重排列,并选择权重值最大的辨识性信息的属性值用于网页转码处理。
优选地,将每个网页组件的辨识性信息的属性值按照权重值从大到小的顺序进行排列,并选择权重值最大的辨识性信息的属性值,将其设置为应用在转码页面的属性。
请参阅图4,为本发明第三实施方式中的网页处理方法的流程示意图。本实施例公开的网页处理方法的流程包括步骤:
步骤S30,接收用户访问一站点页面的请求。
步骤S31,响应该请求获取并加载相应的网页。
步骤S32,分析该网页的页面结构以获得该网页中所包含的网页组件。
请同时参阅图5,具体地,该步骤S32可以根据如下子步骤实现:
步骤S321,在该网页的页面代码中插入相应的网页分析程序语言,以预先定义网页组件及该网页组件的接口。
例如,该网页分析程序语言为直译式脚本语言JavaScript。在本实施方式中,每个网页组件的接口格式均被定义为JSON。
进一步地,该网页分析程序语言还对该预先定义的网页组件的接口设置默认值。
子步骤S322,利用该网页分析程序语言执行网页的页面结构识别逻辑,并根据该预先定义的网页组件的接口识别出该网页的页面中所包含的网页组件,每个网页组件均具有对应的DOM数组。
步骤S33,分析该网页组件以得到每个网页组件的辨识性信息的属性值,该辨识性信息用于网页转码处理。
在本实施方式中,该网页组件的辨识性信息可以为网页组件的配色属性和/或字体大小。辨识性信息还可以是其他的网页配置信息。
下面以网页组件为导航栏、辨识性信息为网页组件配色属性为例进行详细说明。
(1)当导航栏的背景色是颜色属性时:
获取导航栏对应的DOM数组,即NavObject(以下简称NavObj),并通过调用相应的获取组件对象颜色属性的指令,例如,window.getCompurtedStyle,获取该NavObject对应的样式组件对象,即,NavObjectStyle,然后利用NavObjectStyle取得形成该NavObj样式所需的各种颜色属性及其属性值,从而确定该NavObj的配色。
(2)当导航栏的背景颜色是图片时:
获取导航栏的背景图片,创建canvas并将该背景图片载入到该canvas中,调用相应的获取图片颜色的指令,例如,getImageData,从canvas读取该背景图片的imageDate,并将获取的imageDate按像素点高度逐个像素点地生成一个‘像素点-色值’的二维数组。选择两个二维数组[0]-[0]和[0]-[x](x为像素点高度值),当判断两个二维数组中的色值相等时则认为该图片是纯色背景,并使用二维数组[0]-[0]的色值作为背景色。否则,认为该图片是渐变色背景,使用两个二维数组的色值设置渐变色以作为背景色。
进一步地,该步骤33还包括分析该网页的CSS(CascadingStyleSheet,级联样式表)中针对BODY、HTML等根节点标签出现的文字的字体大小与字体颜色。
步骤S34,根据网页组件的辨识性信息的属性值以及所述预先定义的网页组件的接口为预先定义的网页组件的辨识性信息的属性值进行赋值。
其中,遍历该网页组件对应的DOM数组以获得该网页的网页组件的辨识性信息的属性值,并利用该网页的网页组件的辨识性信息的属性值覆盖该预先定义的网页组件的辨识性信息的属性值的原始值以实现赋值操作。该预先定义的网页组件的辨识性信息的属性值的原始值为其默认值。
步骤S35,遍历所有已赋值的预先定义的网页组件以拼装成CSS(CascadingStyleSheet,级联样式表)文本,并将该CSS文本通过内联方式形成所述转码页面。
进一步地,由于内联的CSS文本的优先级比外联的CSS文本的优先级高,将CSS文本插入由DOM数组形成的DOM树中,由已经赋值的所述预先定义的网页组件按照所述级联样式形成所述转码页面,从而实现该转码页面与原网页相同的网页风格。
以设置文本字体样式为例,其具体格式如下:
本发明提供一种网页处理方法并不仅限于将网页配色方案载入到转码页面上,以使用网页配色方案设置转码页面中的组件对象,还适用于包括网页组件的排列方式、字体大小等辨识性信息,网页由多个关键组件对象的辨识性信息形成网页设计方案。
请参阅图6,为本发明一实施方式中的网页处理装置的功能模块示意图。该装置40包括网页访问单元41、页面加载单元42、页面分析单元43以及辨识性信息属性确定单元44。该网页访问单元41用于接收用户访问一站点页面的请求,该页面加载单元42用于响应该请求访问服务器以抓取网页,并加载该网页内容。
例如,该装置40应用于一用户终端,用户在用户终端上输入一个网页地址,请求访问该网页,该用户终端接收到请求后将其发送至服务器。在本实施方式中,该用户终端可以是手机、平板电脑、个人数字助理、电子书、计算机等具有各种操作系统的硬件设备。在该硬件设备可以采用任何的操作系统,例如,Android、iPhoneOS系统等。
该页面分析单元43用于分析该网页的页面结构以获得网页组件。其中,该网页组件为导航栏、标题栏、文本框、列表区块、链接等。在本实施方式中,分析该网页的页面结构以获得关键的网页组件,该关键的网页组件为能够代表网页风格的网页组件,例如,大面积显示在网页上的标题栏。进一步地,该页面分析单元43在该网页的页面代码中插入相应的网页分析程序语言,以预先定义网页组件及该网页组件的接口。该页面分析单元43利用该网页分析程序语言执行网页的页面结构识别逻辑,根据该预先定义的网页组件的接口识别出该网页的页面中所包含的网页组件。每个网页组件均具有对应的DOM数组。
在本实施方式中,该网页分析程序语言为直译式脚本语言JavaScript,设置预先定义的网页组件的接口如下:
导航栏——Nav;
标题栏——Title1、Title2、Title3等;
主要按钮——Btn;
列表区块——List;其中,包括文本(链接)列表——TxtList;
图文列表——ImgTxtList;图片列表——ImgList,等等。
文本框——Input
友情链接——FriendLink;
分页——Page;
在本实施方式中,每个网页组件的接口的格式均被定义为JSON。
该页面分析单元43利用该网页分析程序语言对该预先定义的网页组件的接口设置默认值,下面以利用直译式脚本语言JavaScript分别设置导航栏、标题栏以及文本列表的接口的默认值为例进行说明,设置预先定义的网页组件的接口默认值格式如下:
该辨识性信息属性确定单元44用于分析该网页组件以得到对应的辨识性信息的属性值,该辨识性信息的属性用于网页转码处理。
在本实施方式中,该网页组件的辨识性信息可以为网页组件的配色属性和/或字体大小。辨识性信息还可以是其他的网页配置信息。
该辨识性信息属性确定单元44还用于将网页组件的辨识性信息的属性值按照权重排列,并选择权重值最大的辨识性信息的属性值用于网页转码处理。优选地,该辨识性信息属性确定单元44将每个网页组件的辨识性信息的属性值按照权重值从大到小的顺序进行排列,并选择权重值最大的辨识性信息的属性值,将其列为应用在转码页面的属性。
例如,当网页组件为导航栏且辨识性信息为网页组件的配色属性时:
(1)当导航栏的背景色是颜色属性时:
该辨识性信息属性确定单元44获取导航栏对应的DOM数组,即NavObj,并通过调用相应的获取组件对象颜色属性的指令,例如,window.getCompurtedStyle,获取该NavObj对应的样式组件对象,即,NavObjectStyle,然后利用NavObjectStyle取得形成该NavObj样式所需的各种颜色属性及其属性值,从而确定该NavObj的配色。
(2)当导航栏的背景颜色是图片时:
该辨识性信息属性确定单元44获取导航栏的背景图片,创建canvas并将该背景图片载入到该canvas中,调用相应的获取图片颜色的指令,例如,getImageData,从canvas读取该背景图片的imageDate,并将获取的imageDate按像素点高度逐像素点地生成一个像素点-色值的二维数组。选择两个二维数组[0]-[0]和[0]-[x](x为像素点高度值),当判断两个二维数组中的色值相等时则认为该图片是纯色背景,并使用二维数组[0]-[0]的色值作为背景色。否则,认为该图片是渐变色背景,使用两个二维数组的色值设置渐变色以作为背景色。
进一步地,该辨识性信息属性确定单元44还分析页面CSS中针对BODY、HTML等根节点标签出现的文字的字体大小与字体颜色。
请参阅图7,为本发明另一实施方式中的网页处理装置的功能模块示意图。该装置50包括网页访问单元51、页面加载单元52、页面分析单元53、辨识性信息属性确定单元54以及辨识性信息应用单元55。例如,该装置50应用于一用户终端,用户在用户终端上输入一个网页地址,请求访问该网页,该用户终端接收到请求后将其发送至服务器。在本实施方式中,该用户终端可以是手机、平板电脑、个人数字助理、电子书、计算机等具有各种操作系统的硬件设备。在该硬件设备可以采用任何的操作系统,例如,Android、iPhoneOS系统等。
该网页访问单元51用于接收用户访问一站点页面的请求,该页面加载单元52用于响应该请求访问服务器以抓取网页,并加载该网页内容。
该页面分析单元53用于分析该网页的页面结构以获得网页组件。其中,该网页组件为导航栏、标题栏、文本框、列表区块、链接等。在本实施方式中,分析该网页的页面结构以获得关键的网页组件,该关键的网页组件为能够代表网页风格的网页组件,例如,大面积显示在网页上的标题栏。进一步地,该页面分析单元53在该网页的页面代码中插入相应的网页分析程序语言,以预先定义网页组件及该网页组件的接口。该页面分析单元53利用该网页分析程序语言执行网页的页面结构识别逻辑,根据该预先定义的网页组件的接口识别出该网页的页面中所包含的网页组件。每个网页组件均具有对应的DOM数组。
在本实施方式中,该网页分析程序语言为直译式脚本语言JavaScript,每个网页组件的接口的格式均被定义为JSON。
该页面分析单元53利用该网页分析程序语言对该预先定义的网页组件的接口设置默认值。
该辨识性信息属性确定单元54用于分析该网页组件以得到对应的辨识性信息的属性值,该辨识性信息的属性用于网页转码处理。
在本实施方式中,该网页组件的辨识性信息可以为网页组件的配色属性和/或字体大小。辨识性信息还可以是其他的网页配置信息。
该辨识性信息属性确定单元54还用于将网页组件的辨识性信息的属性值按照权重排列,并选择权重值最大的辨识性信息的属性值用于网页转码处理。优选地,该辨识性信息属性确定单元54将每个网页组件的辨识性信息的属性值按照权重值从大到小的顺序进行排列,并选择权重值最大的辨识性信息的属性值,将其列为应用在转码页面的属性。
例如,当网页组件为导航栏且辨识性信息为网页组件的配色属性时:
(1)当导航栏的背景色是颜色属性时:
该辨识性信息属性确定单元54获取导航栏对应的DOM数组,即NavObj,并通过调用相应的获取组件对象颜色属性的指令,例如,window.getCompurtedStyle,获取该NavObj对应的样式组件对象,即,NavObjectStyle,然后利用NavObjectStyle取得形成该NavObj样式所需的各种颜色属性及其属性值,从而确定该NavObj的配色。
(2)当导航栏的背景颜色是图片时:
该辨识性信息属性确定单元54获取导航栏的背景图片,创建canvas并将该背景图片载入到该canvas中,调用相应的获取图片颜色的指令,例如,getImageData,从canvas读取该背景图片的imageDate,并将获取的imageDate按像素点高度逐像素点地生成一个像素点-色值的二维数组。选择两个二维数组[0]-[0]和[0]-[x](x为像素点高度值,例如),当判断两个二维数组中的色值相等时则认为该图片是纯色背景,并使用二维数组[0]-[0]的色值作为背景色。否则,认为该图片是渐变色背景,使用两个二维数组的色值设置渐变色以作为背景色。
进一步地,该辨识性信息属性确定单元54还分析页面CSS中针对BODY、HTML等根节点标签出现的文字的字体大小与字体颜色。
该辨识性信息应用单元55用于根据所述网页组件的辨识性信息的属性值以及所述预先定义的网页组件的接口为所述预先定义的网页组件的辨识性信息的属性值进行赋值。
其中,该辨识性信息应用单元55遍历该网页组件对应的DOM数组以获得该网页的网页组件的辨识性信息的属性值,并利用该网页的网页组件的辨识性信息的属性值覆盖该预先定义的网页组件的辨识性信息的属性值的原始值以实现赋值操作。该预先定义的网页组件的辨识性信息的属性值的原始值为其默认值。该辨识性信息应用单元55还遍历所有已赋值的预先定义的网页组件以拼装成CSS文本,并将该CSS文本通过内联方式形成所述转码页面。进一步地,由于内联的CSS文本的优先级比外联的CSS文本的优先级高,该辨识性信息应用单元55将CSS文本插入由DOM数组形成的DOM树中,由已经赋值的所述预先定义的网页组件按照所述级联样式形成所述转码页面,从而实现该转码页面与原网页相同的网页风格。
下面以导航栏为例对预先定义的网页组件的配色属性进行赋值进行详细说明,网页组件赋值的格式如下:
本发明提供的网页处理装置,并不仅限于将网页配色方案载入到转码页面上,以使用网页配色方案设置转码页面中的组件对象,还适用于包括网页组件的排列方式等辨识性信息,网页由多个关键组件对象的辨识性信息形成网页设计方案。
本发明提供的一种网页处理方法及装置,预先对原网页的页面结构进行分析以得到原网页的标识性信息(即页面风格,如:配色方案),在转码页码载入原网页的标识性信息,以设置转码后的页面中的页面风格(如:字体颜色、标题栏颜色、链接颜色等等),使得转码页面更加个性化,转码不同的页面呈现的是不同的网页风格,从而实现在转码页的网页风格更加符合原网页的网页风格,保留用户对原网页色彩风格的品牌认知。
在上述实施例中,仅对本发明进行了示范性描述,但是本领域技术人员在阅读本专利申请后可以在不脱离本发明的精神和范围的情况下对本发明进行各种修改。

Claims (10)

1.一种网页处理方法,其特征在于,所述方法包括:
接收用户访问一站点页面的请求;
响应所述请求获取并加载相应的网页;
分析所述网页的页面结构以获得所述网页中所包含的网页组件;
分析所述网页组件以得到每个网页组件的辨识性信息的属性值,所述辨识性信息用于网页转码处理。
2.如权利要求1所述的网页处理方法,其特征在于,所述分析所述网页的页面结构以获得所述网页中所包含的网页组件的步骤包括:
在所述网页的代码中插入相应的网页分析程序语言,以预先定义网页组件及所述网页组件的接口;
利用所述网页分析程序语言执行网页结构识别逻辑,以根据所述预先定义的网页组件的接口识别出所述网页的页面中所包含的网页组件。
3.如权利要求2所述的网页处理方法,其特征在于,所述分析所述网页组件以得到每个网页组件的辨识性信息的属性值的步骤之后,还包括:
根据所述网页组件的辨识性信息的属性值以及所述预先定义的网页组件的接口为所述预先定义的网页组件的辨识性信息的属性值进行赋值。
4.如权利要求3所述的网页处理方法,其特征在于,所述根据所述网页组件的辨识性信息的属性值以及所述预先定义的网页组件的接口为所述预先定义的网页组件的辨识性信息的属性值进行赋值的步骤之后,还包括:
遍历已赋值的所述预先定义的网页组件以拼装成级联样式文本,并将所述级联样式文本通过内联方式形成所述转码页面。
5.如权利要求4所述的网页处理方法,其特征在于,所述网页的网页组件均具有对应的文档网页组件模型数组,多个网页组件模型数组形成网页组件模型数组树;
所述将所述级联样式文本通过内联方式形成所述转码页面的步骤具体为:将内联的级联样式文本插入所述网页组件模型数组树中,由已经赋值的所述预先定义的网页组件按照所述级联样式形成所述转码页面。
6.如权利要求1所述的网页处理方法,其特征在于,所述分析所述网页组件以得到每个网页组件的辨识性信息的属性值的步骤之后,还包括:
将所述网页组件的辨识性信息的属性值按照权重排列,并选择权重值最大的辨识性信息的属性值;以及
根据所述权重值最大的辨识性信息的属性值为所述转码页面对应的网页组件的辨识性信息的属性值进行赋值。
7.如权利要求1至6任意一项所述的网页处理方法,其特征在于,所述网页组件的辨识性信息为网页组件的配色属性,和/或字体大小。
8.一种网页处理装置,其特征在于,所述装置包括:
网页访问单元,用于接收用户访问一站点页面的请求;
页面加载单元,用于响应所述请求获取并加载对应的网页;
页面分析单元,用于分析所述网页的页面结构以获得所述网页中所包含的网页组件;
辨识性信息属性确定单元,用于分析所述网页组件以得到每个网页组件的辨识性信息的属性值,所述辨识性信息用于网页转码处理。
9.如权利要求8所述的网页处理装置,其特征在于,所述页面分析单元还用于在所述网页的代码中插入相应的网页分析程序语言,以预先定义网页组件及所述网页组件的接口,以及利用所述网页分析程序语言执行网页结构识别逻辑,以根据所述预先定义的网页组件的接口识别出所述网页的页面中所包含的网页组件。
10.如权利要求9所述的网页处理装置,其特征在于,所述网页处理装置还包括:
辨识性信息应用单元,用于根据所述网页组件的辨识性信息的属性值以及所述预先定义的网页组件的接口为所述预先定义的网页组件的辨识性信息的属性值进行赋值,以及遍历已赋值的所述预先定义的网页组件以拼装成级联样式文本,并将所述级联样式文本通过内联方式形成所述转码页面。
CN201410438540.8A 2014-08-29 2014-08-29 网页处理方法及装置 Active CN105373565B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410438540.8A CN105373565B (zh) 2014-08-29 2014-08-29 网页处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410438540.8A CN105373565B (zh) 2014-08-29 2014-08-29 网页处理方法及装置

Publications (2)

Publication Number Publication Date
CN105373565A true CN105373565A (zh) 2016-03-02
CN105373565B CN105373565B (zh) 2017-06-30

Family

ID=55375773

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410438540.8A Active CN105373565B (zh) 2014-08-29 2014-08-29 网页处理方法及装置

Country Status (1)

Country Link
CN (1) CN105373565B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106503111A (zh) * 2016-10-18 2017-03-15 广州市动景计算机科技有限公司 网页转码方法、装置及客户终端
CN107273127A (zh) * 2017-06-15 2017-10-20 浪潮软件集团有限公司 一种在web应用中实现页面插件化的方法及装置
CN108614886A (zh) * 2018-05-03 2018-10-02 北京搜狐互联网信息服务有限公司 一种网站主题的生成方法及装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1310415A (zh) * 2000-02-24 2001-08-29 国际商业机器公司 基于风格表和一个目标设备的服务器端的html定制
US20030137538A1 (en) * 2002-01-23 2003-07-24 International Business Machines Corporation Dynamic setting of navigation order in aggregated content
CN1841370A (zh) * 2005-03-29 2006-10-04 腾讯科技(深圳)有限公司 一种用户界面的显示方法
US20110258250A1 (en) * 2010-04-19 2011-10-20 Mtld Top Level Domain Limited Transcoder hinting
CN102663126A (zh) * 2012-04-23 2012-09-12 奇智软件(北京)有限公司 一种在移动终端中显示网页的方法及装置
CN103399764A (zh) * 2013-07-24 2013-11-20 北京小米科技有限责任公司 界面色彩设置方法、装置和终端
WO2014055890A2 (en) * 2012-10-05 2014-04-10 Google Inc. Transcoding and serving resources

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1310415A (zh) * 2000-02-24 2001-08-29 国际商业机器公司 基于风格表和一个目标设备的服务器端的html定制
US20030137538A1 (en) * 2002-01-23 2003-07-24 International Business Machines Corporation Dynamic setting of navigation order in aggregated content
CN1841370A (zh) * 2005-03-29 2006-10-04 腾讯科技(深圳)有限公司 一种用户界面的显示方法
US20110258250A1 (en) * 2010-04-19 2011-10-20 Mtld Top Level Domain Limited Transcoder hinting
CN102663126A (zh) * 2012-04-23 2012-09-12 奇智软件(北京)有限公司 一种在移动终端中显示网页的方法及装置
WO2014055890A2 (en) * 2012-10-05 2014-04-10 Google Inc. Transcoding and serving resources
CN103399764A (zh) * 2013-07-24 2013-11-20 北京小米科技有限责任公司 界面色彩设置方法、装置和终端

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106503111A (zh) * 2016-10-18 2017-03-15 广州市动景计算机科技有限公司 网页转码方法、装置及客户终端
CN106503111B (zh) * 2016-10-18 2017-12-26 广州市动景计算机科技有限公司 网页转码方法、装置及客户终端
CN107273127A (zh) * 2017-06-15 2017-10-20 浪潮软件集团有限公司 一种在web应用中实现页面插件化的方法及装置
CN108614886A (zh) * 2018-05-03 2018-10-02 北京搜狐互联网信息服务有限公司 一种网站主题的生成方法及装置
CN108614886B (zh) * 2018-05-03 2021-10-15 北京云站科技有限公司 一种网站主题的生成方法及装置

Also Published As

Publication number Publication date
CN105373565B (zh) 2017-06-30

Similar Documents

Publication Publication Date Title
US20200242186A1 (en) Method and Terminal Device for Extracting Web Page Content
US20170357913A1 (en) Automated customized web portal template generation systems and methods
CN103365862B (zh) 一种用于生成与页面对应的图片的方法与设备
CN104025068B (zh) 来自多个来源的css定义的冲突解决
US9152619B2 (en) System and method for constructing markup language templates and input data structure specifications
CN105740402A (zh) 数字图像的语义标签的获取方法及装置
CN102982129B (zh) 对网页中内容进行标记提醒的方法、系统及装置
CN107239491A (zh) 用于实现用户行为追踪的方法、设备、浏览器及电子设备
CN102831190B (zh) 一种在低端设备上浏览cml文件的方法
CN105677654B (zh) 广告过滤方法及装置
CN103345493B (zh) 用于移动终端上的文本内容显示的方法、装置及系统
CN103593196A (zh) 页面布局自适应方法及装置
CN103605502B (zh) 表单页面显示方法及服务器
CN105677931A (zh) 信息搜索方法和装置
CN104731815B (zh) 一种网页元素的绘制方法及装置
CN109033282A (zh) 一种基于抽取模板的网页正文抽取方法及装置
WO2014154033A1 (en) Method and apparatus for extracting web page content
CN105701165A (zh) 浏览器模式切换方法及切换装置
CN111880813B (zh) 实现安卓卡片ui的方法、存储介质
CN113655999A (zh) 一种页面控件的渲染方法、装置、设备及存储介质
WO2017096967A1 (zh) 自适应显示网页的方法及装置
CN103942231A (zh) 一种网页的显示方法及电子设备
CN105373565A (zh) 网页处理方法及装置
CN111159597A (zh) 骨架屏的生成方法、系统、计算机设备及存储介质
CN103488735B (zh) 终端浏览器页面刷新显示的方法及终端

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20200415

Address after: 310052 room 508, floor 5, building 4, No. 699, Wangshang Road, Changhe street, Binjiang District, Hangzhou City, Zhejiang Province

Patentee after: Alibaba (China) Co.,Ltd.

Address before: 100080, No. 28, Fu Cheng Road, 12, Beijing, Haidian District

Patentee before: UC MOBILE Ltd.

TR01 Transfer of patent right