CN102314436A - 网页自动调整方法和系统 - Google Patents

网页自动调整方法和系统 Download PDF

Info

Publication number
CN102314436A
CN102314436A CN201010216083XA CN201010216083A CN102314436A CN 102314436 A CN102314436 A CN 102314436A CN 201010216083X A CN201010216083X A CN 201010216083XA CN 201010216083 A CN201010216083 A CN 201010216083A CN 102314436 A CN102314436 A CN 102314436A
Authority
CN
China
Prior art keywords
zone
browsing page
target web
webpage
focal spot
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201010216083XA
Other languages
English (en)
Inventor
包胜华
陈健
王栋
苏中
田春华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to CN201010216083XA priority Critical patent/CN102314436A/zh
Priority to US13/170,778 priority patent/US8489985B2/en
Publication of CN102314436A publication Critical patent/CN102314436A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • G06F16/9577Optimising the visualization of content, e.g. distillation of HTML documents

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明提出了一种自动的对网页进行调整的方案。在本发明的方案中,用户无需对感兴趣的区域进行手动选择,本发明可以自动学习用户历史浏览行为从而预测出用户待浏览的网页中哪个区域可能是用户比较关注的区域,并且对这一区域的显示进行调整。应用本发明,在用户浏览网页时,有限的屏幕资源可以被更加有效的用来显示用户所关心的内容。

Description

网页自动调整方法和系统
技术领域
本发明总体上涉及对网页进行处理的方法和系统,特别的本发明涉及对网页页面进行自动调整的方法和系统。
背景技术
浏览网页中的字体大小以及图片的大小是由字体缺省尺寸决定的。字体的缺省尺寸在一定范围内是用户可调的。但是用户只能整体放大或者缩小网页中的字体大小,而无法针对网页中的某个特定区域进行调整。图1A中示出了维基百科(Wikipedia)网站中一个有关现实增强技术(Augmented reality)的网页截屏,在这个网页中整体字体较小。当用户希望获得更好的视觉效果时,可以通过调整字体大小而放大网页中的内容。图1B中示出了对图1A中的网页进行放大后的网页截屏。从图1B中可以看出,网页整体被进行了放大,包括左边的面板框架(panelframe)、中间的内容框架(content frame)以及上面的头框架(head frame),并且内容框架中的文字和图片被同时放大了。
发明内容
实际应用中,用户由于视力问题或显示屏幕尺寸受限,可能经常需要对网页进行调整。而用户对于网页内容的关注往往集中在部分区域(block)而不是全部区域,比如对于图1A中的网页而言,有些用户可能更关心内容框架中的文字部分,有些用户可能更关心内容框架中的图片部分。如果对网页的内容进行整体放大,可能将用户根本不关心的内容也放大了,从而浪费了屏幕资源,影响了用户的视觉体验。这一问题对于显示屏目较小的显示器(比如尺寸较小的笔记本或者手机)而言尤为突出。对于这类显示器,如果以同样比例的尺寸显示网页中的所有内容,可能使得有限的屏幕资源无法得到真正有效的利用,并且用户需要不断的拖动屏幕右边的滚动条才能全面浏览其需要看到的所有内容。
现有技术中存在一些对网页中的部分内容进行操纵的方法。例如公开号为US2007/0130525A1的美国专利申请。在这一专利申请中,首先分析和分割网页中的区域,区域被划分之后,再由用户手动选取感兴趣的区域,而后浏览器重新绘制用户感兴趣的区域使其适合屏幕尺寸(比如放大、形变、卷动和漂浮等)。然而该方案给用户对网页的访问带来额外的操作流程,用户需要手动的选取感兴趣的区域,这使得用户的浏览方式受到干扰,必然会给用户体验带来负面影响。
本发明提出了一种自动的对网页进行调整的方案。在本发明的方案中,用户无需对感兴趣的区域进行手动选择,本发明可以自动学习用户历史浏览行为从而预测出用户待浏览的网页中哪个区域可能是用户比较关注的区域,并且对这一区域的显示进行调整(比如进行字体放大)。应用本发明,在用户浏览网页时,有限的屏幕资源可以被更加有效的用来显示用户所关心的内容。
具体而言,本发明提供一种网页自动调整方法,包括:获得已浏览网页,对所述已浏览网页进行分析以识别所述已浏览网页中的实际焦点区域,记录所述已浏览网页的实际焦点区域的焦点特征,获得目标网页,按照所述焦点特征预测所述目标网页的潜在焦点区域,以及调整所述目标网页的显示。
本发明还提供一种网页自动调整系统,包括:已浏览网页获得装置,用于获得已浏览网页,分析装置,用于对所述已浏览网页进行分析以识别所述已浏览网页中的实际焦点区域,记录装置,用于记录所述已浏览网页的实际焦点区域的焦点特征,目标网页获得装置,用于获得目标网页,预测装置,用于按照所述焦点特征预测所述目标网页的潜在焦点区域,以及调整装置,用于调整所述目标网页的显示。
附图说明
本说明中所参考的附图只用于示例本发明的典型实施例,不应该认为是对本发明范围的限制。
图1A示出了维基百科网站中一个有关现实增强技术的网页截屏。
图1B示出了对图1A中的网页进行放大后的网页截屏。
图2示出了网页自动调整方法的流程图。
图3示出了按照本发明的一个实施例的经分割的已浏览网页示意图。
图4A示出了按照本发明的一个实施例的经分割的目标网页示意图。
图4B示出了按照本发明的一个实施例的对焦点区域进行放大的目标网页示意图。
图4C示出了按照本发明的一个实施例的对焦点区域进行放大而对非焦点区域进行缩小的目标网页示意图。
图4D示出了按照本发明的一个实施例的对焦点区域进行放大并且对网页布局进行重排的目标网页示意图。
图5示出了网页自动调整系统的框图。
具体实施方式
下列讨论中,提供大量具体的细节以帮助彻底了解本发明。然而,很显然对于本领域技术人员来说,即使没有这些具体细节,并不影响对本发明的理解。并且应该认识到,使用如下的任何具体术语仅仅是为了方便描述,因此,本发明不应当局限于只用在这样的术语所表示和/或暗示的任何特定应用中。
本发明提出了一种自动的对网页进行调整的方案。在本发明的方案中,用户无需对感兴趣的区域进行手动选择,本发明可以自动学习用户历史浏览行为从而预测出用户待浏览的网页中哪个区域可能是用户比较关注的区域,并且对这一区域的显示进行调整(比如进行字体放大)。应用本发明,在用户浏览网页时,有限的屏幕资源可以被更加有效的用来显示用户所关心的内容。
图2示出了网页自动调整方法的流程图。在步骤201中获得已浏览网页。本发明根据用户浏览历史进行学习自动获得用户关注的区域,因此需要首先获得用户已浏览的网页。
按照本发明的一种实施例,可以将已浏览网页分割成多个区域。对网页进行分区可以借助网页的源代码进行。网页的源代码可以是HTML代码、XML代码或者其它结构化或半结构化语言。图3示出了按照本发明的一个实施例的经分割的已浏览网页示意图。从图中可以看出该网页被分割为7个区域(Block)。HTML代码中存在很多标记符,这些标记符号控制显示的效果。同时网页中的每块内容在HTML代码中都是以层级的方式展现出来的。比如在图3所示的网页中,该网页被分割为头元素<head></head>和体元素<body></body>。在体元素中又包含很多其它元素,比如标记符为<div id=″mw-head-base″>的DIV元素对应于图3中3B2,标记符为<div id=″mw-panel″>的DIV元素对应于图中的3B1,标记符为<div id=″bodyContent″>的DIV元素对应于图中的虚线框中的内容。进一步,标记符为<div id=″bodyContent″>的DIV元素中,标记符为<h1id=″firstHeading″>的元素对应于图中的3B3,标记符为<h3 id=″siteSub″>的元素对应于图中的3B4,标记符为<table class=″metadata plainlinks ambox ambox-style″>的元素对应于图中的3B5,标记符为<p>Edge detection is a...</p>的元素对应于图中的3B6,标记符为<table class=″infobox″>的元素对应于图中的3B7。
本发明对网页进行分割的粒度没有特别的限定。图3仅仅是示例性的展示网页的一种分割方案。实际上本发明还可以采用更加细粒度或更加粗粒度的分割方案。HTML代码可以被视为一种树状结构。该树状结构中的每个元素可以被视为一个节点。本发明中网页被分割的区域即可以是树状结构中的叶子节点也可以是树状结构中的非叶子节点,即可以仅代表树状结构中的一个节点也可以代表树状结构中的多个节点的组合。
回到图2,在步骤203中对所述已浏览网页进行分析以识别所述已浏览网页中的实际焦点区域。通过识别实际焦点区域可以确定用户通常情况下在类似版面中关注的区域的位置。比如如果用户通常情况下比较关注内容中的文字部分,则图3中的区域3B6可能是用户的实际焦点区域;如果用户通常情况下比较关注内容中的图片部分,则图3中的3B7可能是用户的实际焦点区域。在一些相对简单的网页中,比如类似于图3这样的网页中,用户关注的焦点区域可能比较集中,即可能大部分用户会比较关注文字部分。但是在一些复杂的网页当中,用户关注的焦点区域可能就相对分散。也就是说各个用户可能关注不同的区域。比如网站http://asia.wsj.com/home-page的结构就相对复杂,不同用户关注的区域可能有所不同,有的用户可能更加关注右边股市的消息,有的用户可能更加关注左边的头条新闻,有的用户可能比较关注中间的新闻列表。
识别实际焦点区域可以通过区域位置、区域大小、鼠标状态以及浏览记录中的一项或多项进行判断。按照本发明的一个实施例,对所述已浏览网页进行分析以识别所述已浏览网页中的实际焦点区域包括:至少基于下列各项中的一项或多项对所述已浏览网页中的区域进行打分:区域位置分数S1、区域大小分数S2、鼠标状态分数S3、以及浏览记录分数S4
其中所述区域位置是指某一区域在网页中的绝对位置。也就是说,无论该区域是否被用户所浏览其位置是不变的。比如就图3中的网页而言,可以将网页划分为横(X)竖(Y)坐标系,坐标系的原点是整个网页的左上角,将某个区域的左上角的位置视为该区域的位置,即用该区域的左上角在横坐标中和纵坐标中的象素数来表示该区域的位置,比如区域3B6的位置为X=30,Y=50。假设当前处理的焦点区域为targetObj,在Javascript语言中,可以通过函数targetObj.x获得该区域左上角的横坐标X,并且通过targetObj.y获得该区域左上角的纵坐标Y。
区域位置分数S1可以基于区域的位置进行设定。在一个实施例中可以先分别根据一个区域的左上角的横坐标和纵坐标计算横坐标分数S1x和纵坐标分数S1y。如果假设一个网页的上半部分将会受到比下半部分更多的关注,并且一个网页的右半部份将会受到比左半部分更多的关注,更具体而言假设经验值表明网页的Y=100象素,及X=60象素的位置往往是最受关注的位置。那么可以利用各种数学函数(比如高斯函数)设计一些位置分数模型,使得某区域的Y值坐标离100越近,S1y分数越高,离100越远,S1y分数越低;X值坐标离60越近,S1x分数越高,离60越远,S1x分数越低。然后对这S1x和S1y进行如公式1中的加权求和,最后再对加权求和后的分数进行归一化处理使其限定为0到1间的一个数作为区域位置分数S1
公式1:S1=Wx×S1x+Wy×S1y
在其它实施例中,也可以以一个区域的右上角、左下角、右下角、中心位置等的横竖坐标来表示该区域的位置。
区域的大小指某一区域在网页中的绝对大小。也就是说,无论该区域是否被用户所浏览,也无论用户浏览时使用的浏览窗口大小,区域的大小是不变的。在Javascript语言中,可以通过targetObj.width函数获得一个区域的宽度,并且可以通过targetObj.height函数获得一个区域的高度。在本发明的一个实施例中,假设区域越大,被关注的可能性就越大,区域大小分数S2也就越大。同样,也可以对S2进行归一化处理使其限定为0到1间的一个数作为区域大小分数S2
鼠标的状态是指鼠标在某一区域上发生的动作,其可以是鼠标点击、鼠标停留、鼠标选中中的一个或多个。其中鼠标点击的动作可以通过document.onclick函数获得、鼠标停留的时间可以通过event.clientX和event.clientY来计算、鼠标选中的动作可以通过document.selection.createRange().text函数结合document.onMouseUp函数获得。假设认为对于一个区域而言,如果鼠标点击的次数越多,该区域就越受关注;鼠标在该区域的停留时间越长,该区域就越受关注;或者鼠标在该区域中进行选中动作的时间越长或次数越多,该区域就越受关注。按照本发明的一个实施例,鼠标的状态分数S3是对鼠标点击分数S3c、鼠标停留分数S3p、鼠标选中分数S3s的加权求和(如下面公式2所示)。同样,也可以对S3进行归一化处理使其限定为0到1间的一个数作为鼠标状态分数S3
公式2:S3=Wc×S3c+Wp×S3p+Ws×S3s
有时候在某些区域上虽然没有发生鼠标点击、鼠标停留或者鼠标选中的动作,但是该区域也出现在用户的浏览窗口内,则可以认为这样的区域也是用户所关注的区域。浏览记录表示某一区域是否出现在用户的浏览窗口内,以及如果出现在浏览窗口内,那么出现的位置是否是受用户所关注的位置。要想获得某一区域的浏览记录,首先要获得浏览窗口的位置。可以通过document.body.scrollTop函数以及document.body.scrollLeft函数计算浏览窗口的左上角相对网页的位置,再通过window.width函数和window.height函数获得浏览窗口的大小,从而计算出浏览窗口相对于整个网页所处的位置以及所占的面积。按照本发明中的一种实施例,可以假设如果某一区域中有越多的面积出现在浏览窗口内,该区域被关注的可能性就越大;并且如果某一区域的位置越靠近浏览窗口的右下角,该区域被关注的可能性就越大。该区域被关注的可能性越大,浏览记录分数S4就越高。同样,也可以对S4进行归一化处理使其限定为0到1间的一个数作为浏览记录分数S4
本发明仅以区域位置分数S1、区域大小分数S2、鼠标状态分数S3、以及浏览记录分数S4为例进行说明,但是除了S1、S2、S3、以及S4以外,本发明还可以在其它实施例中根据实际需要应用更多的分数。并且本发明也不仅限于上述提到的计算S1、S2、S3、以及S4的建模方式,在实际应用中可以根据实际需要采用各种模型以确定S1、S2、S3、以及S4的值。
得到S1、S2、S3、以及S4的值后可以通过下述公式3计算一个区域的总焦点分数:
公式3: TS ( B k ) = &Sigma; i = 1 N ( w i * S i )
其中,Bk指第k个区域,TS(Bk)指第k个区域的总焦点分数,Si指第k个区域的第i项焦点分数,Wi指第k个区域的第i项焦点分数的权重,N指计算所述总焦点分数所依赖的各项焦点分数的项数。TS(Bk)的值越高说明区域Bk越受用户的关注。以图3为例,假设区域3B6是用户所关注的实际焦点区域。
继续图2中的流程,在步骤205中记录所述已浏览网页的实际焦点区域的焦点特征。按照本发明的一种实施例,所述已浏览网页的实际焦点区域的焦点特征包括所述实际焦点区域在所述已浏览网页中的位置和所述实际焦点区域的大小。在某些情况下,用户往往关心类似网站处于同一位置的区域,比如很多人在使用Wikipedia的网站时都会比较关心3B6这个区域中的文字内容,所以虽然用户每次在Wikipedia中检索不同的关键词,但是用户关注的区域的位置和大小在一定程度上是相似的。在这种情况下,所述实际焦点区域在所述已浏览网页中的位置和所述实际焦点区域的大小就是很有借鉴意义的焦点特征。
按照本发明的另一种实施例,所述已浏览网页的实际焦点区域的焦点特征包括所述实际焦点区域的主题(topic)。在某些情况下,用户访问不同网站时焦点区域的位置和大小可能发生明显变化,比如某一用户比较关注股票信息,网站A中把股票信息列于网页的左边,而网站B中把股票信息列于网页的右边,因此很难根据区域的位置和大小来进行焦点区域的预测。在这种情况下,可以将实际焦点区域的主题作为焦点特征加以记录。所述主题并非一定是一段文字的标题,而可以是利用文本分析技术提炼出来的文字、图片或视频的主题。
按照本发明的又一种实施例,所述已浏览网页的实际焦点区域的焦点特征包括所述实际焦点区域在所述已浏览网页中的位置和所述实际焦点区域的大小,以及所述实际焦点区域的内容。将三者结合起来在某些情况下可以更全面的记录焦点特征。
所述焦点特征可以基于一个网页的实际焦点区域提取,也可以基于对若干网页的实际焦点区域的焦点特征进行统计而提取。
接下来,在步骤207中获得目标网页。按照本发明的一个实施例所述目标网页为被请求的网页。也就是说无论被用户所请求的网页与用户已浏览的网页是否是相似的网页,都将执行后续的预测目标网页的潜在焦点区域的步骤。
按照本发明的另一个实施例,所述目标网页为被请求的网页中与所述已浏览网页近似度超过一定阈值的网页,并且所述方法进一步包括:从下述各项中的至少一项判断所述被请求的网页是否与所述已浏览网页近似度超过一定阈值:网页布局、网页主题、网页类型、网页URL。网页布局指两个网页的布局结构;网页主题指某一网页讨论的主要话题内容;网页类型指网页的一些分类(比如新闻类、博客类等);网页URL指网页的统一资源定位符,通过URL可以认定目标网页和已浏览网页是否来自相同的网站。也就是说,只对与已浏览网页相似的被请求的网页进行焦点区域的预测。这样做的好处是可以提高潜在焦点区域的预测效率,然而在这一实施例中,需要额外的计算成本来判断所述目标网页是否与所述已浏览网页近似度超过一定阈值。
图4A示出了按照本发明的一个实施例的经分割的目标网页示意图。按照本发明的一个实施例,与对图3中的网页的处理类似,对于图4A中的目标网页,也将目标网页分割成多个区域。分割的方法与图3中描述的内容相似,在此不再赘述。在图4A的例子中,目标网页与已浏览网页来自同一网站。然而正如前文所述,本发明并不限于此,也就是说目标网页与已浏览网页可以来自不同的网站。
继续图2中的流程,在步骤209中按照所述焦点特征预测所述目标网页的潜在焦点区域。按照本发明的一种实施例,如果焦点特征包括所述实际焦点区域在所述已浏览网页中的位置和所述实际焦点区域的大小,则在步骤209中可以进一步识别所述目标网页中与所述实际焦点区域在所述已浏览网页中的位置及大小的相似度大于预定阈值的区域作为潜在焦点区域。进一步,步骤209中可以分别判断目标网页中的区域与实际焦点区域的位置的相似度是否大于特定阈值,以及大小的相似度是否也大于预定阈值;或者步骤209中也可以判断目标网页中的区域与实际焦点区域的位置的相似度和大小的相似度在加权求和之后大于预定阈值。如图3中的区域3B6与图4A中的区域4B6在位置和大小上比较相似,因此可以识别图4A中的区域4B6作为潜在焦点区域。
按照本发明的另一种实施例,如果所述已浏览网页的实际焦点区域的焦点特征包括所述实际焦点区域的主题,则在步骤209中可以进一步识别所述目标网页中与所述实际焦点区域的主题的相似度大于预定阈值的区域作为潜在焦点区域。
按照本发明的再一种实施例,如果焦点特征包括所述实际焦点区域在所述已浏览网页中的位置、所述实际焦点区域的大小,和所述实际焦点区域的主题,则在步骤209中可以进一步识别所述目标网页中与所述实际焦点区域的位置、大小以及主题的相似度都大于预定阈值的区域作为潜在焦点区域。
继续图2中的流程,在步骤211中调整所述目标网页的显示。按照本发明的一种实施例,在步骤211中进一步放大所述目标网页的焦点区域的内容。图4B示出了按照本发明的一个实施例的对焦点区域进行放大的目标网页示意图。可以看出图4B中区域4B6中的字体与图4A中区域4B6的字体相比被放大了,而网页中的其它区域没有变化。
按照本发明的另一种实施例,所述网页自动调整方法还包括预测所述目标网页的潜在非焦点区域。在目标网页中,除潜在焦点区域以外的区域可以被视为潜在非焦点区域。可以根据潜在非焦点区域的位置、大小、主题、类型(比如图片或文字)或其它因素来调整所述目标网页的显示,包括放大所述潜在焦点区域的内容,并且缩小潜在非焦点区域的内容。比如,如果潜在非焦点区域的内容是图片,则缩小潜在非焦点区域的大小,或者如果潜在非焦点区域的文字大小还有缩小的空间,则缩小潜在非焦点区域的文字大小等。图4C示出了按照本发明的一个实施例的对焦点区域进行放大而对非焦点区域进行缩小的目标网页示意图。从图4C中可以明显看出,区域4B6的字体被明显放大了,并且区域4B7的尺寸被明显缩小了。在对潜在焦点区域进行预测的准确率较高的情况下,利用本实施例中的方法,可以进一步放大潜在焦点区域的内容,更有效的利用屏幕资源。
根据本发明的再一种实施例,图2中的步骤211还可以包括对所述目标网页的布局(layout)进行重排(re-organization)。对布局进行重排可以使屏幕资源能够被更紧凑的利用,也就是说在一定程度上减少不必要的空白处。图4D示出了按照本发明的一个实施例的对焦点区域进行放大并且对网页布局进行重排的目标网页示意图。从图4D中可以看出区域4B5的位置被重排了,这样减少了屏幕中的空白处,从而使屏幕中显示的内容更加紧凑。
此外,按照本发明的一个实施例,所述网页自动调整方法中的已浏览网页与目标网页是由同一用户所请求的。这样预测出来的潜在焦点区域更具个性化特征。
按照本发明的另一个实施例,所述已浏览网页与所述目标网页是由不同用户所请求。这样可以根据大众的浏览习惯预测某个用户的潜在焦点区域。
图5示出了网页自动调整系统的框图。图5中网页自动调整系统501包括:已浏览网页获得装置503,用于获得已浏览网页;分析装置505,用于对所述已浏览网页进行分析以识别所述已浏览网页中的实际焦点区域;记录装置507,用于记录所述已浏览网页的实际焦点区域的焦点特征;目标网页获得装置509,用于获得目标网页;预测装置511,用于按照所述焦点特征预测所述目标网页的潜在焦点区域;以及调整装置513,用于调整所述目标网页的显示。
根据本发明的一种实施例,所述网页自动调整系统501还包括已浏览网页分割装置(图中未示出),以及目标网页分割装置(图中未示出)。所述已浏览网页分割装置用于将已浏览网页分割成多个区域。所述目标网页分割装置,用于将目标网页分割成多个区域。
根据本发明的一种实施例,所述分析装置505进一步用于:至少基于下列各项中的一项或多项对所述已浏览网页中的区域进行打分:区域位置分数S1、区域大小分数S2、鼠标状态分数S3、以及浏览记录分数S4
根据本发明的一种实施例,所述已浏览网页的实际焦点区域的焦点特征包括所述实际焦点区域在所述已浏览网页中的位置和所述实际焦点区域的大小,并且其中所述预测装置511进一步用于识别所述目标网页中与所述实际焦点区域在所述已浏览网页中的位置和大小的相似度大于预定阈值的区域作为潜在焦点区域。
根据本发明的一种实施例,所述已浏览网页的实际焦点区域的焦点特征包括所述实际焦点区域的主题,并且其中所述预测装置511进一步用于识别所述目标网页中与所述实际焦点区域的主题的相似度大于预定阈值的区域作为潜在焦点区域。
根据本发明的一种实施例,所述目标网页为被请求的网页。
根据本发明的一种实施例,所述目标网页为被请求的网页中与所述已浏览网页近似度超过一定阈值的网页,并且所述网页自动调整系统501进一步包括:判断装置(图中未示出),用于从下述各项中的至少一项判断所述被请求的网页是否与所述已浏览网页近似度超过一定阈值:网页布局、网页主题、网页类型、网页URL。
根据本发明的一种实施例,所述调整装置513进一步用于放大所述目标网页的潜在焦点区域的内容。
图5中的网页自动调整系统501所能完成的其它功能与对图2中网页自动调整方法的描述类似,在此不再赘述。
本发明即可以在客户端Client实现也可以在服务器端Server实现。所述服务器端可以是网关服务器、门户网站的服务器、执行特殊功能的服务器、或者任何其它能够实现本发明的服务器。
所属技术领域的技术人员知道,本发明可以体现为系统、方法或计算机程序产品。因此,本发明可以具体实现为以下形式,即,可以是完全的硬件、完全的软件(包括固件、驻留软件、微代码等)、或者本文一般称为“电路”、“模块”或“系统”的软件部分与硬件部分的组合。此外,本发明还可以采取体现在任何有形的表达介质(medium ofexpression)中的计算机程序产品的形式,该介质中包含计算机可用的程序码。
可以使用一个或多个计算机可用的或计算机可读的介质的任何组合。计算机可用的或计算机可读的介质例如可以是——但不限于——电的、磁的、光的、电磁的、红外线的、或半导体的系统、装置、器件或传播介质。计算机可读介质的更具体的例子(非穷举的列表)包括以下:有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、诸如支持因特网或内部网的传输介质、或者磁存储器件。注意计算机可用的或计算机可读的介质甚至可以是上面印有程序的纸张或者其它合适的介质,这是因为,例如可以通过电扫描这种纸张或其它介质,以电子方式获得程序,然后以适当的方式加以编译、解释或处理,并且必要的话在计算机存储器中存储。在本文件的语境中,计算机可用的或计算机可读的介质可以是任何含有、存储、传达、传播、或传输供指令执行系统、装置或器件使用的或与指令执行系统、装置或器件相联系的程序的介质。计算机可用的介质可包括在基带中或者作为载波一部分传播的、由其体现计算机可用的程序码的数据信号。计算机可用的程序码可以用任何适当的介质传输,包括-但不限于-无线、电线、光缆、RF等等。
用于执行本发明的操作的计算机程序码,可以以一种或多种程序设计语言的任何组合来编写,所述程序设计语言包括面向对象的程序设计语言-诸如Java、Smalltalk、C++之类,还包括常规的过程式程序设计语言-诸如”C”程序设计语言或类似的程序设计语言。程序码可以完全地在用户的计算上执行、部分地在用户的计算机上执行、作为一个独立的软件包执行、部分在用户的计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在后一种情形中,远程计算机可以通过任何种类的网络——包括局域网(LAN)或广域网(WAN)-连接到用户的计算机,或者,可以(例如利用因特网服务提供商来通过因特网)连接到外部计算机。
以下参照按照本发明实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述本发明。要明白的是,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机程序指令实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得通过计算机或其它可编程数据处理装置执行的这些指令,产生实现流程图和/或框图中的方框中规定的功能/操作的装置。
也可以把这些计算机程序指令存储在能指令计算机或其它可编程数据处理装置以特定方式工作的计算机可读介质中,这样,存储在计算机可读介质中的指令产生一个包括实现流程图和/或框图中的方框中规定的功能/操作的指令装置(instruction means)的制造品。
也可以把计算机程序指令加载到计算机或其它可编程数据处理装置上,使得在计算机或其它可编程数据处理装置上执行一系列操作步骤,以产生计算机实现的过程,从而在计算机或其它可编程装置上执行的指令就提供实现流程图和/或框图中的方框中规定的功能/操作的过程。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,所述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
本文中所用的术语,仅仅是为了描述特定的实施例,而不意图限定本发明。本文中所用的单数形式的“一”和“该”,旨在也包括复数形式,除非上下文中明确地另外指出。还要知道,“包含”一词在本说明书中使用时,说明存在所指出的特征、整体、步骤、操作、单元和/或组件,但是并不排除存在或增加一个或多个其它特征、整体、步骤、操作、单元和/或组件,以及/或者它们的组合。
权利要求中的对应结构、材料、操作以及所有功能性限定的装置(means)或步骤的等同替换,旨在包括任何用于与在权利要求中具体指出的其它单元相组合地执行该功能的结构、材料或操作。所给出的对本发明的描述其目的在于示意和描述,并非是穷尽性的,也并非是要把本发明限定到所表述的形式。对于所属技术领域的普通技术人员来说,在不偏离本发明范围和精神的情况下,显然可以作出许多修改和变型。对实施例的选择和说明,是为了最好地解释本发明的原理和实际应用,使所属技术领域的普通技术人员能够明了,本发明可以有适合所要的特定用途的具有各种改变的各种实施方式。

Claims (19)

1.一种网页自动调整方法,包括:
获得已浏览网页;
对所述已浏览网页进行分析以识别所述已浏览网页中的实际焦点区域;
记录所述已浏览网页的实际焦点区域的焦点特征;
获得目标网页;
按照所述焦点特征预测所述目标网页的潜在焦点区域;以及
调整所述目标网页的显示。
2.一种如权利要求1所述的方法,进一步包括:
将所述已浏览网页分割成多个区域;以及
将所述目标网页分割成多个区域。
3.一种如权利要求1所述的方法,其中对所述已浏览网页进行分析以识别所述已浏览网页中的实际焦点区域包括:
至少基于下列各项中的一项或多项对所述已浏览网页中的区域进行打分:区域位置分数、区域大小分数、鼠标状态分数、以及浏览记录分数。
4.一种如权利要求1-3中任意一项所述的方法,其中通过下述公式计算一个区域的总焦点分数:
TS ( B k ) = &Sigma; i = 1 N ( w i * S i )
其中,Bk指第k个区域,TS(Bk)指第k个区域的总焦点分数,Si指第k个区域的第i项焦点分数,Wi指第k个区域的第i项焦点分数的权重,N指计算所述总焦点分数所依赖的各项焦点分数的项数。
5.一种如权利要求1所述的方法,其中所述已浏览网页的实际焦点区域的焦点特征包括所述实际焦点区域在所述已浏览网页中的位置和所述实际焦点区域的大小,并且其中按照所述焦点特征预测所述目标网页的潜在焦点区域包括识别所述目标网页中与所述实际焦点区域在所述已浏览网页中的位置和大小的相似度大于预定阈值的区域作为潜在焦点区域。
6.一种如权利要求1或5所述的方法,其中所述已浏览网页的实际焦点区域的焦点特征包括所述实际焦点区域的主题,并且其中按照所述焦点特征预测所述目标网页的潜在焦点区域包括识别所述目标网页中与所述实际焦点区域的主题的相似度大于预定阈值的区域作为潜在焦点区域。
7.一种如权利要求1所述的方法,其中所述目标网页为被请求的网页中与所述已浏览网页近似度超过一定阈值的网页,并且所述方法进一步包括:
从下述各项中的至少一项判断所述被请求的网页是否与所述已浏览网页近似度超过一定阈值:网页布局、网页主题、网页类型、网页URL。
8.一种如权利要求1所述的方法,其中所述调整所述目标网页的显示包括放大所述潜在焦点区域的内容。
9.一种如权利要求1所述的方法,进一步包括:
预测所述目标网页的潜在非焦点区域,并且
所述调整所述目标网页的显示包括缩小所述目标网页的潜在非焦点区域的内容。
10.一种如权利要求1所述的方法,其中调整所述目标网页的显示包括对所述目标网页的布局进行重排。
11.一种如权利要求1所述的方法,其中所述已浏览网页与所述目标网页是由同一用户所请求的。
12.一种如权利要求1所述的方法,其中所述已浏览网页与所述目标网页是由不同用户所请求的。
13.一种网页自动调整系统,包括:
已浏览网页获得装置,用于获得已浏览网页;
分析装置,用于对所述已浏览网页进行分析以识别所述已浏览网页中的实际焦点区域;
记录装置,用于记录所述已浏览网页的实际焦点区域的焦点特征;
目标网页获得装置,用于获得目标网页;
预测装置,用于按照所述焦点特征预测所述目标网页的潜在焦点区域;以及
调整装置,用于调整所述目标网页的显示。
14.一种如权利要求13所述的系统,进一步包括:
已浏览网页分割装置,用于将所述已浏览网页分割成多个区域;以及
目标网页分割装置,用于将所述目标网页分割成多个区域。
15.一种如权利要求13所述的系统,其中所述分析装置进一步用于:
至少基于下列各项中的一项或多项对所述已浏览网页中的区域进行打分:区域位置分数、区域大小分数、鼠标状态分数、以及浏览记录分数。
16.一种如权利要求13所述的系统,其中所述已浏览网页的实际焦点区域的焦点特征包括所述实际焦点区域在所述已浏览网页中的位置和所述实际焦点区域的大小,并且其中所述预测装置进一步用于识别所述目标网页中与所述实际焦点区域在所述已浏览网页中的位置和大小的相似度大于预定阈值的区域作为潜在焦点区域。
17.一种如权利要求13或16所述的系统,其中所述已浏览网页的实际焦点区域的焦点特征包括所述实际焦点区域的主题,并且其中所述预测装置进一步用于识别所述目标网页中与所述实际焦点区域的主题的相似度大于预定阈值的区域作为潜在焦点区域。
18.一种如权利要求13所述的系统,其中所述目标网页为被请求的网页中与所述已浏览网页近似度超过一定阈值的网页,并且所述系统进一步包括:
判断装置,用于从下述各项中的至少一项判断所述被请求的网页是否与所述已浏览网页近似度超过一定阈值:网页布局、网页主题、网页类型、网页URL。
19.一种如权利要求13所述的系统,其中所述调整装置进一步用于放大所述目标网页的潜在焦点区域的内容。
CN201010216083XA 2010-06-30 2010-06-30 网页自动调整方法和系统 Pending CN102314436A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201010216083XA CN102314436A (zh) 2010-06-30 2010-06-30 网页自动调整方法和系统
US13/170,778 US8489985B2 (en) 2010-06-30 2011-06-28 Automatically adjusting a webpage

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201010216083XA CN102314436A (zh) 2010-06-30 2010-06-30 网页自动调整方法和系统

Publications (1)

Publication Number Publication Date
CN102314436A true CN102314436A (zh) 2012-01-11

Family

ID=45400697

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201010216083XA Pending CN102314436A (zh) 2010-06-30 2010-06-30 网页自动调整方法和系统

Country Status (2)

Country Link
US (1) US8489985B2 (zh)
CN (1) CN102314436A (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102929551A (zh) * 2012-10-25 2013-02-13 广东欧珀移动通信有限公司 一种移动终端内容摘抄的方法及装置
CN103324454A (zh) * 2013-05-23 2013-09-25 百度在线网络技术(北京)有限公司 用于检测目标区域中排列错位的显示元素的方法和设备
CN103544192A (zh) * 2012-07-17 2014-01-29 人人游戏网络科技发展(上海)有限公司 用于更改用户模板的方法和装置
CN103544155A (zh) * 2012-07-09 2014-01-29 百度在线网络技术(北京)有限公司 用于移动终端的网页显示方法及装置
CN103810214A (zh) * 2012-11-14 2014-05-21 腾讯科技(深圳)有限公司 搜索页面的频率信息显示方法及装置
CN104182471A (zh) * 2014-07-29 2014-12-03 小米科技有限责任公司 用户兴趣点的确定方法、装置及终端
CN104272306A (zh) * 2012-05-11 2015-01-07 微软公司 向前翻
WO2015185020A1 (en) * 2014-06-06 2015-12-10 Tencent Technology (Shenzhen) Company Limited Information category obtaining method and apparatus
CN107450808A (zh) * 2017-09-22 2017-12-08 北京知道创宇信息技术有限公司 一种浏览器的鼠标指针定位方法及计算设备
CN107526737A (zh) * 2016-06-21 2017-12-29 天脉聚源(北京)科技有限公司 一种微信网页视图展示的方法
US10498582B2 (en) 2013-06-14 2019-12-03 Microsoft Technology Licensing, Llc Related content display associated with browsing
CN111143731A (zh) * 2019-12-19 2020-05-12 浙江大华技术股份有限公司 一种网页界面缩放时的显示方法、装置及终端设备
WO2020114352A1 (zh) * 2018-12-05 2020-06-11 北京三快在线科技有限公司 计算设备的防误操作处理

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103377263B (zh) * 2012-04-28 2017-03-01 阿里巴巴集团控股有限公司 一种业务对象的筛选方法以及装置
US9361393B2 (en) * 2013-03-15 2016-06-07 Paypal, Inc. User interface overlay application
CN104102419B (zh) * 2013-04-09 2019-02-26 腾讯科技(深圳)有限公司 页面显示方法、装置和终端设备
US11144118B2 (en) * 2018-12-17 2021-10-12 Citrix Systems, Inc. Distraction factor used in A/B testing of a web application
CN113791967B (zh) * 2021-07-27 2023-11-28 浙江大学 一种用于手机app无障碍读屏软件的焦点陷入检测方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101331473A (zh) * 2005-12-07 2008-12-24 三维实验室公司 操纵网页的方法
CN101335762A (zh) * 2007-06-25 2008-12-31 株式会社日立制作所 反映网页的历史使用行为的方法,及服务器、终端和系统
CN101609457A (zh) * 2009-04-01 2009-12-23 北京搜狗科技发展有限公司 一种提供起始页推荐配置的方法及装置
US7693897B2 (en) * 2005-08-26 2010-04-06 Harris Corporation System, program product, and methods to enhance media content management

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5835905A (en) * 1997-04-09 1998-11-10 Xerox Corporation System for predicting documents relevant to focus documents by spreading activation through network representations of a linked collection of documents
US6769019B2 (en) * 1997-12-10 2004-07-27 Xavier Ferguson Method of background downloading of information from a computer network
WO2000016209A1 (en) * 1998-09-15 2000-03-23 Local2Me.Com, Inc. Dynamic matchingtm of users for group communication
US6489968B1 (en) * 1999-11-18 2002-12-03 Amazon.Com, Inc. System and method for exposing popular categories of browse tree
US7133862B2 (en) * 2001-08-13 2006-11-07 Xerox Corporation System with user directed enrichment and import/export control
US20050022114A1 (en) * 2001-08-13 2005-01-27 Xerox Corporation Meta-document management system with personality identifiers
US7290006B2 (en) * 2003-09-30 2007-10-30 Microsoft Corporation Document representation for scalable structure
US20080288889A1 (en) * 2004-02-20 2008-11-20 Herbert Dennis Hunt Data visualization application
US7631278B2 (en) * 2004-11-19 2009-12-08 Microsoft Corporation System and method for directional focus navigation
JP4591217B2 (ja) * 2005-06-07 2010-12-01 富士ゼロックス株式会社 推薦情報提供システム
US8271878B2 (en) * 2007-12-28 2012-09-18 Amazon Technologies, Inc. Behavior-based selection of items to present on affiliate sites
US8250454B2 (en) * 2008-04-03 2012-08-21 Microsoft Corporation Client-side composing/weighting of ads
US8244740B2 (en) * 2008-11-26 2012-08-14 Microsoft Corporation Providing suggested sites associated with target sites
US8826141B2 (en) * 2010-02-12 2014-09-02 Blackberry Limited Image-based and predictive browsing
US9015081B2 (en) * 2010-06-30 2015-04-21 Microsoft Technology Licensing, Llc Predicting escalation events during information searching and browsing

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7693897B2 (en) * 2005-08-26 2010-04-06 Harris Corporation System, program product, and methods to enhance media content management
CN101331473A (zh) * 2005-12-07 2008-12-24 三维实验室公司 操纵网页的方法
CN101335762A (zh) * 2007-06-25 2008-12-31 株式会社日立制作所 反映网页的历史使用行为的方法,及服务器、终端和系统
CN101609457A (zh) * 2009-04-01 2009-12-23 北京搜狗科技发展有限公司 一种提供起始页推荐配置的方法及装置

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104272306A (zh) * 2012-05-11 2015-01-07 微软公司 向前翻
CN103544155A (zh) * 2012-07-09 2014-01-29 百度在线网络技术(北京)有限公司 用于移动终端的网页显示方法及装置
US9767081B2 (en) 2012-07-09 2017-09-19 Baidu Online Network Technology (Beijing) Co., Ltd. Method and apparatus for displaying a webpage in a mobile terminal
CN103544155B (zh) * 2012-07-09 2018-01-09 百度在线网络技术(北京)有限公司 用于移动终端的网页显示方法及装置
CN103544192A (zh) * 2012-07-17 2014-01-29 人人游戏网络科技发展(上海)有限公司 用于更改用户模板的方法和装置
CN102929551A (zh) * 2012-10-25 2013-02-13 广东欧珀移动通信有限公司 一种移动终端内容摘抄的方法及装置
CN103810214B (zh) * 2012-11-14 2018-03-13 腾讯科技(深圳)有限公司 搜索页面的频率信息显示方法及装置
CN103810214A (zh) * 2012-11-14 2014-05-21 腾讯科技(深圳)有限公司 搜索页面的频率信息显示方法及装置
CN103324454A (zh) * 2013-05-23 2013-09-25 百度在线网络技术(北京)有限公司 用于检测目标区域中排列错位的显示元素的方法和设备
CN103324454B (zh) * 2013-05-23 2016-12-28 百度在线网络技术(北京)有限公司 用于检测目标区域中排列错位的显示元素的方法和设备
US10498582B2 (en) 2013-06-14 2019-12-03 Microsoft Technology Licensing, Llc Related content display associated with browsing
WO2015185020A1 (en) * 2014-06-06 2015-12-10 Tencent Technology (Shenzhen) Company Limited Information category obtaining method and apparatus
US10346496B2 (en) 2014-06-06 2019-07-09 Tencent Technology (Shenzhen) Company Limited Information category obtaining method and apparatus
CN104182471A (zh) * 2014-07-29 2014-12-03 小米科技有限责任公司 用户兴趣点的确定方法、装置及终端
CN104182471B (zh) * 2014-07-29 2018-04-06 小米科技有限责任公司 用户兴趣点的确定方法、装置及终端
CN107526737A (zh) * 2016-06-21 2017-12-29 天脉聚源(北京)科技有限公司 一种微信网页视图展示的方法
CN107450808A (zh) * 2017-09-22 2017-12-08 北京知道创宇信息技术有限公司 一种浏览器的鼠标指针定位方法及计算设备
CN107450808B (zh) * 2017-09-22 2020-09-01 北京知道创宇信息技术股份有限公司 一种浏览器的鼠标指针定位方法及计算设备
WO2020114352A1 (zh) * 2018-12-05 2020-06-11 北京三快在线科技有限公司 计算设备的防误操作处理
CN111143731A (zh) * 2019-12-19 2020-05-12 浙江大华技术股份有限公司 一种网页界面缩放时的显示方法、装置及终端设备
CN111143731B (zh) * 2019-12-19 2023-04-21 浙江大华技术股份有限公司 一种网页界面缩放时的显示方法、装置及终端设备

Also Published As

Publication number Publication date
US8489985B2 (en) 2013-07-16
US20120005573A1 (en) 2012-01-05

Similar Documents

Publication Publication Date Title
CN102314436A (zh) 网页自动调整方法和系统
US9330179B2 (en) Configuring web crawler to extract web page information
EP3262497B1 (en) Contextual zoom
CN102460432B (zh) 选择性内容提取
US7987417B2 (en) System and method for detecting a web page template
JP6224731B2 (ja) 個人的ユーザ経験を改善するためにソーシャル・メディアを豊富にする方法および装置
CN104331474A (zh) 页面处理方法及装置
EP3851981A1 (en) Page processing method and apparatus, electronic device and computer readable medium
US10540408B2 (en) System and method for constructing search results
US20110093811A1 (en) System and method for performing auto scroll
CN102411614A (zh) 图像搜索结果的显示
WO2011072434A1 (en) System and method for web content extraction
CN105320734B (zh) 一种网页核心内容提取方法
Ahmadi et al. User-centric adaptation of Web information for small screens
WO2014052082A1 (en) Automatically creating tables of content for web pages
US11061541B2 (en) Apparatus, method, and computer-readable recording medium for compactedly displaying popup content
CN105243058A (zh) 一种网页内容翻译方法及电子设备
US9880994B1 (en) Detecting compatible layouts for content-based native ads
US20100251102A1 (en) Displaying documents on mobile devices
JP5317638B2 (ja) Web文書主要コンテンツ抽出装置及びプログラム
US20190087086A1 (en) Method for providing cognitive semiotics based multimodal predictions and electronic device thereof
CN103246680A (zh) 一种在浏览器中将网页内容聚合展现的方法及装置
US9223762B2 (en) Encoding information into text for visual representation
CN105224552A (zh) 网络信息的处理方法、装置、和系统
CN117957526A (zh) 动态资源使用网络浏览器

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20120111