CN101192231A - 基于上下文的书签 - Google Patents

基于上下文的书签 Download PDF

Info

Publication number
CN101192231A
CN101192231A CNA2006101630225A CN200610163022A CN101192231A CN 101192231 A CN101192231 A CN 101192231A CN A2006101630225 A CNA2006101630225 A CN A2006101630225A CN 200610163022 A CN200610163022 A CN 200610163022A CN 101192231 A CN101192231 A CN 101192231A
Authority
CN
China
Prior art keywords
resource
bookmark
screen
specific part
contextual information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2006101630225A
Other languages
English (en)
Other versions
CN101192231B (zh
Inventor
聂伯敏
马嶽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Snap Inc
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to CN2006101630225A priority Critical patent/CN101192231B/zh
Priority to US11/945,620 priority patent/US8046323B2/en
Publication of CN101192231A publication Critical patent/CN101192231A/zh
Application granted granted Critical
Publication of CN101192231B publication Critical patent/CN101192231B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9562Bookmark management

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明涉及对用户访问的资源设置书签以及使用该书签的方法和装置。书签设置方法,包括响应对资源的当前屏幕设置书签的请求,对资源的当前屏幕的实际文本采集屏幕上下文信息;以及存储所述资源的地址信息和屏幕上下文信息作为用于返回所述资源特定部分的书签。根据设置的书签提供资源的特定部分的方法包括:响应用户重新打开资源的请求,将由所述地址信息识别的资源内容下载到存储器;对下载的资源内容采集屏幕上下文信息,和比较所下载资源内容的屏幕上下文信息和所述书签指示的屏幕上下文信息,根据模糊匹配的规则选定所下载的资源的特定部分并在显示窗口中显示所选定的资源特定部分。

Description

基于上下文的书签
技术领域
本发明涉及对用户访问的资源设置书签以及使用该书签的方法和装置。
背景技术
众所周知,万维网或因特网是支持超文本标注语言格式(HTML)的文档的服务器系统。HTML支持通向文档以及图形、音频和视频文件等的链接。从其它文档引用指向文档的链接,该链接允许用户仅仅通过鼠标点击容易地从一个文档或Web页转入另一个文档或Web页。因此链接是非常有用的因特网导航工具。文档或Web页可被互换使用。
另一个有用的因特网导航工具是书签。书签应用在大部分Web浏览器中,Web浏览器是用于定位Web站点并显示Web页的软件应用程序。在Web浏览器中,书签允许用户在文件夹例如书签文件夹中存储Web地址或Web页的URL(统一资源定位符)来指定协议如HTTP或FTP以及对象、文档、万维网网页或其他目标在Internet或Intranet上的位置,以便随后访问。
当用户在访问那些希望以后再访问的Web页时可以对该Web页设置书签。但是当随后访问该Web页时,该Web页经常从其开端开始显示。如果用户希望返回到Web页的中间或结尾时需要向下滚动滚动条来找寻相关段落,这个过程非常费力,尤其是当显示的文档很大时。
因此需要使书签具有显示访问对象的特定部分的功能。现有技术中针对Office文档等可编辑文档提供了利用光标的位置设置书签的功能。具体地在定位书签时,编辑者需要将光标移动到可编辑文档中希望设置书签的位置进行书签设置,从而在其它可编辑文档中以UNC路径(通用命名规则)引用该书签时可以显示已设置书签的文档的特定部分。
但是这种可以指向对象的特定部分的书签的设置取决于光标的位置,其书签系统要求指出书签所在的光标位置。对于可编辑文档,这是自然的,但是对于网页以及其它不可编辑文档例如只读PDF却无法做到这一点。现在随着网站提供的电子书籍以及软件材料的普及,希望提出一种对这些不可编辑文档设置书签的新书签技术。
业界也曾提出了对网页的各种解决方案。例如US2004/0205543A1公开了允许用户在设置书签时,在存储页面URL的同时还存储显示该页面的窗口的尺寸、该窗口内的水平和垂直滚动块的位置以及用于显示该页面的字体属性,这样在重新访问设置了书签的Web页时允许仅仅显示具体的页面部分。US6219679B1教导了使用显示区域左上角位置和右下角位置的坐标对作为书签定位符的一部分,由此限定了再访问时显示的页面部分。
发明内容
考虑到以上的现有技术,本发明致力于解决现有技术中利用光标、坐标等可定位信息设置书签的缺陷,提出一种既可为不可编辑文档设置书签、还可为可编辑文档设置书签的技术方案。
根据本发明的一个方面,一种在数据处理系统中对资源的特定部分设置书签的方法,包括如下步骤:
响应对资源的当前屏幕设置书签的请求,对资源的当前屏幕的实际文本采集屏幕上下文信息;以及
存储所述资源的地址信息和屏幕上下文信息作为用于返回所述资源特定部分的书签。
本发明提出通过采集屏幕上下文信息来反映显示屏幕的文档内容和结构,将此屏幕上下文信息作为书签的一部分内容,由此在再次访问设置了书签的资源内容时可以利用已记录的屏幕上下文信息与再次访问的资源内容相比较,从而选定所下载的资源的特定部分。
其中根据用户输入或从存储单元获取的一定的采集率对资源的当前屏幕采集屏幕上下文信息。
所述屏幕上下文信息可以包括文本定位器元件,例如当前屏幕中的第一个词、某个特定词或者第一段;还可包括用于辅助文本定位器元件定位文档的文本定位辅助信息,例如行号、段落号、屏幕分辨率和/或文本布置和显示方式中的至少之一。
优选地,本发明的对资源设置书签的方法还包括对资源的实际文本编写摘要信息的步骤,并且存储所述编写的摘要信息作为所述书签的一部分。对当前屏幕编写摘要的步骤可以包括根据预定的采集率对当前屏幕编写摘要的步骤。
根据本发明的另一方面,一种根据设置的书签提供资源的特定部分的方法,所述书签包括地址信息和通过采集所述资源特定部分获得的屏幕上下文信息,所述方法包括如下步骤:
响应用户重新打开资源的请求,将由所述地址信息识别的资源内容下载到存储器;
对下载的资源内容采集屏幕上下文信息,和
比较所下载资源内容的屏幕上下文信息和所述书签指示的屏幕上下文信息,根据模糊匹配的规则选定所下载的资源的特定部分并在显示窗口中显示所选定的资源特定部分。
类似地,所述对下载的资源内容采集屏幕上下文信息的步骤包括使用相同的预定采集率对下载的资源内容采集屏幕上下文信息。
另外,所述书签的屏幕上下文信息包括文本定位器元件,相应地所述使用预定采集率对下载的资源内容采集屏幕上下文信息的步骤包括:
在下载的资源内容中检索与所述文本定位器元件匹配的部分;
基于所述与文本定位器元件匹配的部分使用预定采集率对下载的资源内容采集实际文本,获得各个用于与所述书签的屏幕上下文信息进行比较的瞬态模拟屏幕。
同样优选地所述书签还包括对资源的实际文本编写的摘要信息,相应地所述根据设置的书签提供资源的特定部分的方法在下载资源内容的步骤之后还包括:
对下载的资源内容编制摘要信息,并且比较该摘要信息与所述书签指示的摘要信息,进而判断下载的资源内容是否有效的步骤。
本发明还提出了一种在数据处理系统中对资源的特定部分设置书签的书签设置装置,包括:
采集单元,用于响应对资源的当前屏幕设置书签的请求,对资源的当前屏幕的实际文本采集屏幕上下文信息;以及
存储单元,用于存储所述资源的地址信息和屏幕上下文信息作为用于返回所述资源特定部分的书签。
另外,本发明也提出了一种根据设置的书签提供资源的特定部分的装置,所述书签包括地址信息和通过采集所述资源特定部分获得的屏幕上下文信息,所述装置包括:
比较单元,响应用户重新打开资源的请求,将由所述地址信息识别的资源内容下载到存储器,对下载的资源内容采集屏幕上下文信息,并且比较所下载资源内容的屏幕上下文信息和所述书签指示的屏幕上下文信息;
定位器,用于根据模糊匹配的规则选定所下载的资源的特定部分并在显示窗口中显示所选定的资源特定部分。
本发明使用屏幕上下文信息来记录文档中的读取或编辑位置,可在无需光标、坐标等可定位信息的帮助下对文档设置书签;在再访问时利用模糊匹配方法比较已记录的屏幕上下文信息与再次访问的资源内容,从而精确地定位文档中的读取或编辑位置。
本发明采用了反映文档内容和结构的屏幕上下文信息,相比US6219679B1等使用显示区域左上角位置和右下角位置的坐标来定位具体的显示区域的技术方案,可以不受文档实际布置方式或部分内容变化导致的坐标等信息变化的影响,因而可以精确地定位文档中的具体位置。
另外本发明提出了对资源内容编制摘要信息,在再访问时通过比较已记录的摘要信息和再访问时编制的摘要信息,可检测文档的有效性。
利用本发明的书签设置方法,可以使用URL地址或UNC路径转向万维网中的各种文件、文件的位置或网页,或是Intranet上的网页等。同样由于在同一计算机内Office文档(Word、Excel、PowerPoint、Access等)相互之间以及PDF之间可以利用类似的UNC路径(通用命名规则)对文件进行定位,因此本发明的书签设置方法完全可以应用于同一计算机内Office文档之间、PDF文档之间以及Office文档和PDF文档的交互访问。
根据下面示意性实施例的说明(参照附图)本发明的其它特点将显而易见。
附图说明
图1示出了根据本发明的分布式数据处理系统的示意性框图。
图2示出了根据本发明的服务器设备的示意性框图。
图3示出了根据本发明的客户机设备的示意性框图。
图4示出了根据本发明的优选实施例用于对资源设置书签的元件的示意图。
图5示出了用于根据本发明的优选实施例生成书签的方法的流程图。
图6示出了用于根据本发明的优选实施例,响应对书签的选择呈现资源的方法的流程图
具体实施方式
下面,将参照附图等详细描述本发明的具体实施方式。但是,本发明可以通过多种不同的方式来实施,本领域人员可以很容易地理解其方式和详细内容可以被变换为各种各样的形式,而不脱离本发明的宗旨及其范围。因此,本发明不应该被解释为仅限定在实施方式所记载的内容中。
参考附图,其中图1示出了实施本发明的数据处理系统100的网络示意图。数据处理系统100包括作为在彼此相连的各种设备和计算机之间提供通信链接的媒介的网络102。该网络102可以包括有线、无线通信链接或光纤。
在所示实例中,服务器104以及存储单元106连接到网络102。另外,服务器104的客户机108、110和112可以是个人计算机和网络计算机。在所示实例中,服务器104提供例如引导文件、操作系统图像以及客户机108、110和112的应用程序。网络数据处理系统100中,网络102表示使用TCP/IP协议彼此通信的网络和网关集合的因特网。在因特网中心是在主节点或主计算机之间的高速数据通信线路的骨干,由若干商业、政府、教育和其它发布数据信息的计算机系统组成。当然数据处理系统100还可以在intranet、局域网(LAN)、广域网(WAN)中。
现在根据本发明的一个实施例参考图2描述可以作为例如图1的服务器104的服务器实施的数据处理系统的框图。数据处理系统200可以是包括连接到数据总线206的多个处理器202和204的对称多处理器(SMP)。或者可以应用单个处理器系统。同样链接至数据总线206的是存储器控制器/高速缓冲存储器208,用以提供与局部存储器209的接口。I/O总线桥210也连接到数据总线206,用以提供与I/O总线212的接口。存储器控制器/高速缓冲存储器208和I/O总线桥210可以集成在一起。
连接至与I/O总线212的周边元件互连(PCI)总线桥214提供了与PCI局部总线216的接口。可以有多个调制解调器连接到PCI局部总线216。典型的PCI总线实现可以支持4个PCI扩展槽或者插入式(add-in)连接器。与图1中网络计算机108、110以及112的通信链接可以由调制解调器218和通过插入式主板与PCI局部总线216相连的网络适配器220来提供。
附加的PCI总线桥222和224为附加的PCI局部总线226和228,由此可以支持附加的调制解调器和网络适配器。以这种方式,数据处理系统200允许连接到多个网络计算机。存储器映射图形适配器230和硬盘232也可以如图所示直接或间接连接到I/O总线212。
现在参考图3描述可以应用本发明的数据处理系统的框图。数据处理系统300是一个客户机计算机的例子。该数据处理系统300应用周边元件互连(PCI)局部总线构架。尽管所示的例子应用了PCI总线,其它诸如加速图形端口(AGP)以及工业标准构架(ISA)等也可以使用。处理器302和主存储器304通过PCI桥308连接到PCI局部总线306。PCI桥308也包括用于处理器302的集成的存储器控制器和高速缓冲存储器。可以通过直接元件互连或通过插入式主板形成与PCI局部总线306的附加连接。在所示的实例中,局域网适配器320,SCSI主机总线适配器312以及扩展总线接口314通过直接元件连接连接到PCI局部总线306。相反,音频适配器316、图形适配器318以及音视频适配器319通过插在扩展槽中的插入式主板连接到PCI局部总线306。扩展总线接口314提供用于键盘和鼠标适配器320、调制解调器332以及附加存储器324的连接。小计算机系统接口(SCSI)主机总线适配器312提供了用于硬盘驱动器326、磁带驱动器328以及CD-ROM驱动器330的连接。典型的PCI局部总线实现可支持三个或四个PCI扩展槽或插入式连接。
操作系统运行在处理器302中,用于协调和提供对图3中数据处理系统300的各种元件的控制。该操作系统可以是市场上可获得的Windows2000等。面向对象编程系统例如Java可与该操作系统一起运行,以便提供从Java程序或该数据操作系统300中其它应用程序对操作系统的调用。操作系统的指令、面向对象操作系统以及应用程序或程序可以在存储设备例如硬盘驱动器326中,可以在由处理器302执行时加载到主存储器304中。
作为另外一个实例,数据操作系统300可以被配置成无需依赖网络通信接口的类型而启动。另外,数据操作系统300也可以是个人数字助理(PDA)设备,与ROM和/或闪速ROM一起用于提供存储操作系统文件和/或用户生成文件的非易失性存储器。
图3所示的实例以及上述实例仅仅是例举,例如数据操作系统300也可以是笔记本或采用PDA形式的手持式计算机。数据操作系统300还可以是资讯站(kiosk)或环球网设备(web appliance)。
以下首先简介本说明书使用的术语:
屏幕上下文信息:屏幕上下文记录了当前屏幕的信息,包括屏幕中的第一个词,屏幕分辨率,第一段以及行号中的至少之一。对于不同文档屏幕上下文信息可能不同,例如对html(超文本链接标示语言)文档,屏幕上下文信息可以具有标题信息。
采集率:采集率涉及采集文档内容。例如如果采集率是100%,则整个文档将被记录。
重新显示模式:重新显示模式是告诉书签设置装置,对设置了书签的文档的位置进行重新定位的方式。例如“由第一个词定位”,则在显示屏幕中的第一个词被存储为在重新定位时屏幕中的第一个词。
有效文档:文档只有在书签设置装置自上一次对该文档设置书签后将其识别为仍然是同一个文档时才是有效文档。
系统体系结构
本发明提供了一种对资源设置书签的方法和装置,本发明可以应用在图1所示客户机设备108、110和112(即个人计算机或网络计算机)中或者在服务器104中。本发明可以存在于由计算机系统使用的各种数据存储介质(例如软盘、光盘、硬盘、ROM、RAM等)中。
本发明的对资源设置书签的装置可以由图2或图3所示的数据操作系统200或数据操作系统300实现,具体地,如图4所示,根据设置的书签提供资源的特定部分的装置以及根据设置的书签提供资源的特定部分的装置包括5个单元,分别为用户配置中心401,存储单元402,采集单元403,比较单元404和定位器405。
用户配置中心401用于设置采集整个文档的采集率、以及按照书签模式选择文档重新显示的方式,例如可以通过各种编辑工具(Office文档工具或Acrobat Reader工具)或者浏览器的图形用户接口由终端用户借助鼠标键盘来设置,由此通过设置整个文档的采集率可使终端用户定义比较文档的准确性。
终端用户设置的采集率可以存储在存储单元402中,该存储单元402如图3中所示的主存储器304。
采集单元403、比较单元404以及定位器405可以是例如图2和图3中处理器202、204或处理器302中的功能模块。
采集单元403与用户配置中心401以及存储单元402相连,用于按照用户配置中心401提供的设置采集文档各点,并从当前屏幕获得上下文,然后将上述各点和屏幕上下文信息发送至存储单元402。
比较单元404用于判断设置书签的文档显示仍然有效,具体地从存储单元402检索/取出设置了书签的该文档各点,通过使之与抽取实际文档的内容相比较来识别该书签是否有效。
定位器405根据比较单元的比较结果选定所下载的资源的特定部分并在显示窗口中显示所选定的资源特定部分。
图5示出了用于根据本发明的优选实施例生成书签的方法的流程图。该方法可以由图4所示的对资源设置书签的装置实现。
该方法首先接收用户对资源设置书签的请求(步骤501)。优选地,用户对资源请求设置书签的同时可以输入请求设置的采集率,以便于步骤502中的采集。用户通过用户配置中心401提供的采集率可以存储到存储单元402,也可以直接传送到采集单元403进行采集,实现针对不同文档定制不同的采集率。
响应该书签设置请求,采集单元403开始采集整个文档信息(步骤502)。在此以Internet或Intranet网页为资源对象,当然资源对象也可以是网络上或者同一计算机内诸如Word、Excel、PowerPoint、Access等Office文档或者PDF文档等。
在步骤502,采集单元403首先从网页抽取实际文本,即不抽取HTML标签以及一些图片和一些多媒体数据。
随后采集单元403从存储单元402或者采集单元403获得采集率,并根据该采集率开始采集各点,从而形成该文档的摘要。或者,由于摘要编写器是目前的成熟技术,在此本发明还可以使用文本编辑器中的摘要编写器工具来编写摘要。在此情况下,用作摘要编写器工具的采集单元对文档进行分析并为每个句子指定分数,以此确定文档中的要点。那些包含文档中常用词汇的文本内容(例如句子)得分较高。然后由用户按百分比选择部分得分最高的句子,将其显示在摘要中。在此编写摘要器时使用的“百分比”与采集率的含义一样,表示“相当于原长的百分比”。
编写摘要的目的是为了在对文档设置书签后再访问该文档时通过模糊匹配识别该文档是否仍然是同一个文档,即为了识别再访问的文档是否为有效文档。该步骤502是优选步骤,本发明的方法可以在不编写摘要的情况下直接使用文本定位器元件分析资源对象,获得屏幕上下文信息。
随后在步骤503,采集单元403利用文本定位器元件描述当前屏幕的上下文。屏幕上下文信息记录了当前屏幕的信息,包括屏幕中的第一个词、某个特定词或者第一段等中的至少一个文本定位器元件。在此实例中,使用屏幕中的第一个词作为文本定位器元件,步骤503的处理记录第一个词例如“<complexType”,另外从第一个词例如“<complexType”开始在当前屏幕上下文中任意拾取其它词,其中的拾取率是由终端用户在用户配置中心401定义的采集率。
对于不同的文档屏幕上下文信息可能不同,例如对于html(超文本链接标示语言)文档,屏幕上下文信息还可以具有标题信息。
附加地,行号、段落号以及屏幕分辨率也可以作为屏幕上下文信息的一部分,辅助上述与实际内容相关的可检索的文本定位器元件来描述当前屏幕的上下文。另外,在屏幕有图片、尤其是图片可能覆盖整个屏幕的情况下,除了纯文本信息之外,屏幕上下文信息还可以包括文本布置和显示的方式,在此采集单元获取的文本布置和显示方式包括图片信息例如图片信息源。
最后在步骤504,采集单元403将设置了书签的资源的地址信息、摘要信息和屏幕上下文信息传送到存储单元402进行记录。设置书签的流程结束。
图6示出了用于根据本发明的优选实施例,响应对书签的选择呈现资源的方法的流程图。
首先在步骤601用户请求重新打开设置了书签的文档。响应用户定位该书签的请求,在步骤602中比较单元404首先根据书签中指示的超链接地址抽取文档的实际文本。书签中包括的超链接地址例如是通用资源标识符(URI)的路径信息,在本实施例中,针对网页,URI可以是统一资源定位符(URL)地址,用于指定协议(如HTTP或FTP)以及对象、文档、万维网网页或其他目标在Internet或Intranet上的位置,也可以是UNC路径(通用命名规则路径),用于对文件的地址进行定位。如果针对同一客户机内的其它文档作为书签对象,则书签中包括的路径信息为UNC路径信息。
在步骤603,比较单元404从存储单元402检索/取出设置了书签的文档的摘要信息。随后在步骤604比较单元404根据从存储单元402检索/取出的采集率编制该文档的摘要,并且比较该实际文档的摘要与从存储单元402取出的已记录的摘要,以便识别这两个摘要是否一致,从而确定该文档是否是有效文档。与步骤502一样,在步骤603中比较单元404还可以使用文本编辑器中的摘要编写器工具直接编写摘要。并且在不需要判断再访问的文档是否有效的情况下或者设置书签时未编写摘要信息的情况下,在本发明响应对书签的选择呈现资源的方法中,步骤603和步骤604都是可选的步骤,本发明的方法可以在不判断再访问的文档是否有效的情况下即省略步骤603、604以及步骤605,直接执行步骤606的处理。
如果在步骤605判断为该文档并非有效文档即文档已过期,则流程结束。
如果文档仍然有效,则比较单元404在步骤606采用已获取的书签中包括的屏幕上下文信息针对实际文档生成瞬态(snapshot)模拟屏幕。例如如果所获取的书签中的屏幕上下文信息以第一个词“<complexType”作为与实际内容相关的可检索的文本定位器元件,则比较单元404在实际文档中查找“<complexType”,在发现词“<complexType”后从该词“<complexType”开始形成瞬态模拟屏幕。随后,比较单元404从按照与采集单元403拾取一样的方式从瞬态模拟屏幕拾取词,即使用相同的与实际内容相关的可检索文本定位器元件如第一个词、某个特定词或者第一段以及相同的采集率来拾取瞬态模拟屏幕中的词;并且比较拾取的这些词与采集单元403已采集的作为屏幕上下文信息存储在存储单元中的各词。如果他们匹配,则利用定位器在显示窗口中显示该屏幕,完成书签定位。这里的匹配取决于模糊匹配算法,无需100%匹配。如果它们不匹配,则返回步骤606重新生成瞬态模拟屏幕进行匹配,直到到达文档结尾。
在书签的屏幕上下文信息还包括行号、段落号、屏幕分辨率和/或文本布置和显示方式的情况下,比较单元403结合采用这些辅助信息来匹配瞬态模拟屏幕和已存储的屏幕上下文信息。
优选的,在屏幕有图片的情况下,比较单元可以通过根据屏幕上下文信息中的图片信息判断图片的大小和形状,不必在下载实际文档或形成瞬态模拟屏幕的过程中下载图片。若最终选定的瞬态模拟屏幕包括有图片,则可以继续下载的内容。在此,根据具体的要求可允许用户或不允许用户上下滚动查阅页面的其余部分,或者当用户上下滚动查阅页面的其余部分时,选定屏幕之外的图片可以在继续下载之后显示在屏幕上。
尽管已经结合实施例具体说明了由本发明的发明人所做出的发明,但是本发明不限于这样的实施例,在不脱离本发明主旨的情况下,可以进行各种修改。例如,在本发明的实施例中,以显示窗口即当前屏幕的第一个词描述屏幕上下文信息,即以当前屏幕的第一个词开始采集文本内容,获得屏幕上下文信息。当然还可以使用其它某个特定词如第二个词、最后一个词或者第一段等等作为文本定位器元件。在本发明公开的范围内,本领域的普通技术人员可以设想到其它获取反映显示屏幕文档内容和结构的技术方案。

Claims (22)

1.一种在数据处理系统中对资源的特定部分设置书签的方法,包括如下步骤:
响应对资源的当前屏幕设置书签的请求,对资源的当前屏幕的实际文本采集屏幕上下文信息;以及
存储所述资源的地址信息和屏幕上下文信息作为用于返回所述资源特定部分的书签。
2.根据权利要求1所述的对资源的特定部分设置书签的方法,其中根据预定的采集率对资源的当前屏幕采集屏幕上下文信息。
3.根据权利要求2所述的对资源的特定部分设置书签的方法,其中所述采集率是由用户输入的。
4.根据权利要求2所述的对资源的特定部分设置书签的方法,其中所述采集率是从存储单元获取的。
5.根据权利要求1所述的对资源的特定部分设置书签的方法,其中所述屏幕上下文信息包括文本定位器元件。
6.根据权利要求5所述的对资源的特定部分设置书签的方法,其中所述文本定位器元件包括当前屏幕中的第一个词、某个特定词或者第一段。
7.根据权利要求5所述的对资源的特定部分设置书签的方法,其中所述屏幕上下文信息还包括文本定位辅助信息,
8.根据权利要求7所述的对资源设置书签的方法,其中所述文本定位辅助信息包括行号、段落号、屏幕分辨率和/或文本布置和显示方式中的至少之一。
9.根据权利要求1所述的对资源设置书签的方法,还包括对资源的实际文本编写摘要信息的步骤,并且存储所述编写的摘要信息作为所述书签的一部分。
10.根据权利要求9所述的对资源的特定部分设置书签的方法,其中对当前屏幕编写摘要的步骤包括根据预定的采集率对当前屏幕编写摘要的步骤。
11.一种根据设置的书签提供资源的特定部分的方法,所述书签包括地址信息和通过采集所述资源特定部分获得的屏幕上下文信息,所述方法包括如下步骤:
响应用户重新打开资源的请求,将由所述地址信息识别的资源内容下载到存储器;
对下载的资源内容采集屏幕上下文信息,和
比较所下载资源内容的屏幕上下文信息和所述书签指示的屏幕上下文信息,根据模糊匹配的规则选定所下载的资源的特定部分并在显示窗口中显示所选定的资源特定部分。
12.根据权利要求11所述的根据设置的书签提供资源的特定部分的方法,其中所述书签的屏幕上下文信息是通过以预定的采集率采集所述资源特定部分获得的,
所述对下载的资源内容采集屏幕上下文信息的步骤包括使用相同的预定采集率对下载的资源内容采集屏幕上下文信息。
13.根据权利要求12所述的根据设置的书签提供资源的特定部分的方法,其中所述书签的屏幕上下文信息包括文本定位器元件,
所述使用预定采集率对下载的资源内容采集屏幕上下文信息的步骤包括:
在下载的资源内容中检索与所述文本定位器元件匹配的部分;
基于所述与文本定位器元件匹配的部分使用预定采集率对下载的资源内容采集实际文本,获得各个用于与所述书签的屏幕上下文信息进行比较的瞬态模拟屏幕。
14.根据权利要求13所述的根据设置的书签提供资源的特定部分的方法,其中所述文本定位器元件包括当前屏幕中的第一个词、某个特定词或者第一段。
15.根据权利要求13所述的根据设置的书签提供资源的特定部分的方法,其中所述屏幕上下文信息还包括文本定位辅助信息。
16.根据权利要求15所述的根据设置的书签提供资源的特定部分的方法,其中所述文本定位辅助信息包括行号、段落号、屏幕分辨率和/或文本布置和显示方式中的至少之一。
17.根据权利要求11所述的根据设置的书签提供资源的特定部分的方法,其中所述书签还包括对资源的实际文本编写的摘要信息,
在下载资源内容的步骤之后还包括:
对下载的资源内容编制摘要信息,并且比较该摘要信息与所述书签指示的摘要信息,进而判断下载的资源内容是否有效的步骤。
18.一种在数据处理系统中对资源的特定部分设置书签的书签设置装置,包括:
采集单元,用于响应对资源的当前屏幕设置书签的请求,对资源的当前屏幕的实际文本采集屏幕上下文信息;以及
存储单元,用于存储所述资源的地址信息和屏幕上下文信息作为用于返回所述资源特定部分的书签。
19.根据权利要求18所述的书签设置装置,其中还包括对资源的实际文本编写摘要信息的摘要编写器,所述存储单元存储所述编写的摘要信息作为所述书签的一部分。
20.根据权利要求19所述的书签设置装置,其中摘要编写器根据预定的采集率对当前屏幕编写摘要。
21.一种根据设置的书签提供资源的特定部分的装置,所述书签包括地址信息和通过采集所述资源特定部分获得的屏幕上下文信息,所述装置包括:
比较单元,用于响应用户重新打开资源的请求,将由所述地址信息识别的资源内容下载到存储器,并对下载的资源内容采集屏幕上下文信息,以及比较所下载资源内容的屏幕上下文信息和所述书签指示的屏幕上下文信息;
定位器,用于根据模糊匹配的规则选定所下载的资源的特定部分并在显示窗口中显示所选定的资源特定部分。
22.根据权利要求21所述的根据设置的书签提供资源的特定部分的装置,其中所述书签还包括对资源的实际文本编写的摘要信息,
所述比较单元还用于在下载资源内容之后对下载的资源内容编制摘要信息,并且比较该摘要信息与所述书签指示的摘要信息,进而判断下载的资源内容是否有效。
CN2006101630225A 2006-11-27 2006-11-27 基于上下文的书签 Expired - Fee Related CN101192231B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN2006101630225A CN101192231B (zh) 2006-11-27 2006-11-27 基于上下文的书签
US11/945,620 US8046323B2 (en) 2006-11-27 2007-11-27 Context based bookmark

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2006101630225A CN101192231B (zh) 2006-11-27 2006-11-27 基于上下文的书签

Publications (2)

Publication Number Publication Date
CN101192231A true CN101192231A (zh) 2008-06-04
CN101192231B CN101192231B (zh) 2012-07-04

Family

ID=39487227

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2006101630225A Expired - Fee Related CN101192231B (zh) 2006-11-27 2006-11-27 基于上下文的书签

Country Status (2)

Country Link
US (1) US8046323B2 (zh)
CN (1) CN101192231B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102708099A (zh) * 2010-12-02 2012-10-03 北大方正集团有限公司 用于图片标题的提取方法和装置
CN103119581A (zh) * 2010-07-22 2013-05-22 惠普发展公司,有限责任合伙企业 基于上下文的项目加书签
CN103635901A (zh) * 2011-06-03 2014-03-12 苹果公司 使用阅读列表面板呈现文档的方法
CN102033887B (zh) * 2009-09-29 2016-06-08 华为技术有限公司 一种实现电子书签的方法、用户终端和书签服务器
CN106095917A (zh) * 2016-06-08 2016-11-09 腾讯科技(深圳)有限公司 一种书签保存、展示方法、装置及浏览器
CN111177098A (zh) * 2019-12-27 2020-05-19 中信百信银行股份有限公司 查看系统日志上下文的方法及系统

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9235648B2 (en) * 2008-01-16 2016-01-12 International Business Machines Corporation Automated surfacing of tagged content in vertical applications
US10699242B2 (en) 2008-01-16 2020-06-30 International Business Machines Corporation Automated surfacing of tagged content adjunct to vertical applications
US20130124242A1 (en) 2009-01-28 2013-05-16 Adobe Systems Incorporated Video review workflow process
US9292481B2 (en) * 2009-02-27 2016-03-22 Adobe Systems Incorporated Creating and modifying a snapshot of an electronic document with a user comment
US8930843B2 (en) 2009-02-27 2015-01-06 Adobe Systems Incorporated Electronic content workflow review process
MX2012011749A (es) * 2010-04-09 2012-12-17 Citibank Na Sistema implementado por computadora y metodo para una ubicacion del ususario en un ambiente virtual.
US9326116B2 (en) 2010-08-24 2016-04-26 Rhonda Enterprises, Llc Systems and methods for suggesting a pause position within electronic text
US9582133B2 (en) * 2012-11-09 2017-02-28 Sap Se File position shortcut and window arrangement
CN102982148A (zh) * 2012-11-26 2013-03-20 华为技术有限公司 定位方法及定位装置
WO2017030306A1 (en) * 2015-08-18 2017-02-23 Samsung Electronics Co., Ltd. Method and system for bookmarking a webpage
US10353583B2 (en) 2016-06-14 2019-07-16 International Business Machines Corporation Efficient temporary dynamic anchor points within and between application document(s)
US10754910B2 (en) 2017-03-07 2020-08-25 Enemy Tree LLC Digital multimedia pinpoint bookmark device, method, and system
US11841917B2 (en) 2017-03-07 2023-12-12 Enemy Tree LLC Digital multimedia pinpoint bookmark device, method, and system
US10021190B1 (en) 2017-06-30 2018-07-10 Ringcentral, Inc. Communication management method and system for inserting a bookmark in a chat session
US11269969B1 (en) * 2021-02-08 2022-03-08 Capital One Services, Llc Systems and methods for automatic and adaptive browser bookmarks

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5619709A (en) * 1993-09-20 1997-04-08 Hnc, Inc. System and method of context vector generation and retrieval
US5659729A (en) * 1996-02-01 1997-08-19 Sun Microsystems, Inc. Method and system for implementing hypertext scroll attributes
US6219697B1 (en) * 1997-05-02 2001-04-17 3Com Corporation Method and apparatus for operating the internet protocol over a high-speed serial bus
US6219679B1 (en) * 1998-03-18 2001-04-17 Nortel Networks Limited Enhanced user-interactive information content bookmarking
US7149982B1 (en) * 1999-12-30 2006-12-12 Microsoft Corporation System and method for saving user-specified views of internet web page displays
US7603349B1 (en) * 2004-07-29 2009-10-13 Yahoo! Inc. User interfaces for search systems using in-line contextual queries
US7783979B1 (en) * 2004-09-14 2010-08-24 A9.Com, Inc. Methods and apparatus for generation and execution of configurable bookmarks
US7974964B2 (en) * 2007-01-17 2011-07-05 Microsoft Corporation Context based search and document retrieval
US8229909B2 (en) * 2009-03-31 2012-07-24 Oracle International Corporation Multi-dimensional algorithm for contextual search

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102033887B (zh) * 2009-09-29 2016-06-08 华为技术有限公司 一种实现电子书签的方法、用户终端和书签服务器
CN103119581A (zh) * 2010-07-22 2013-05-22 惠普发展公司,有限责任合伙企业 基于上下文的项目加书签
CN102708099A (zh) * 2010-12-02 2012-10-03 北大方正集团有限公司 用于图片标题的提取方法和装置
CN102708099B (zh) * 2010-12-02 2015-09-16 北大方正集团有限公司 用于图片标题的提取方法和装置
CN103635901A (zh) * 2011-06-03 2014-03-12 苹果公司 使用阅读列表面板呈现文档的方法
CN103635901B (zh) * 2011-06-03 2017-06-27 苹果公司 使用阅读列表面板呈现文档的方法
CN106095917A (zh) * 2016-06-08 2016-11-09 腾讯科技(深圳)有限公司 一种书签保存、展示方法、装置及浏览器
CN111177098A (zh) * 2019-12-27 2020-05-19 中信百信银行股份有限公司 查看系统日志上下文的方法及系统
CN111177098B (zh) * 2019-12-27 2023-09-22 中信百信银行股份有限公司 查看系统日志上下文的方法及系统

Also Published As

Publication number Publication date
CN101192231B (zh) 2012-07-04
US8046323B2 (en) 2011-10-25
US20090006304A1 (en) 2009-01-01

Similar Documents

Publication Publication Date Title
CN101192231B (zh) 基于上下文的书签
US8276061B2 (en) Marking and annotating electronic documents
US7912829B1 (en) Content reference page
Bila et al. Pagetailor: reusable end-user customization for the mobile web
JP2013508807A (ja) インターネットナビゲーションページを生成する方法および装置
US20040205543A1 (en) Apparatus and method of bookmarking a section of a web page
CN102073726A (zh) 搜索引擎系统及该搜索引擎系统的结构化数据引入方法
US7529771B2 (en) Method of and apparatus for gathering information, system for gathering information, and computer program
US9244891B2 (en) Adjusting search result rankings based on multiple user highlighting of documents
CN105095441A (zh) 一种信息获取方法及装置
JP2006065395A (ja) ハイパーリンク生成装置、ハイパーリンク生成方法及びハイパーリンク生成プログラム
Blekas et al. Use of RSS feeds for content adaptation in mobile web browsing
US7895337B2 (en) Systems and methods of generating a content aware interface
US10198408B1 (en) System and method for converting and importing web site content
US20120324326A1 (en) Method and apparatus for outputting a multimedia file of a web page
US20120150899A1 (en) System and method for selectively generating tabular data from semi-structured content
US20030052918A1 (en) Method and apparatus for allowing one bookmark to replace another
JP7206863B2 (ja) 表示制御方法、装置、及びプログラム
JP5187064B2 (ja) Web資源追跡管理プログラム、Web資源追跡管理装置及びWeb資源追跡管理方法
JP2016181069A (ja) 情報抽出装置、情報抽出方法、及び、表示制御システム
JP4715031B2 (ja) 構造化文書変換システム及び構造化文書変換プログラム
WO2024176364A1 (ja) テスト支援システム、テスト支援方法及びプログラム
JP5063568B2 (ja) 携帯端末向けのウェブページの検索に用いられるインデックスを作成する検索制御装置及びインデックス作成方法
JP5108707B2 (ja) 検索サーバ装置、検索方法及びプログラム
JP5727964B2 (ja) リンク領域強調表示装置およびその動作方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20160422

Address after: American California

Patentee after: Snapchat Inc.

Address before: American New York

Patentee before: International Business Machines Corp.

CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120704

Termination date: 20161127

CF01 Termination of patent right due to non-payment of annual fee