CN1758243A - 用于从网站提取标注日期的内容的方法和系统 - Google Patents

用于从网站提取标注日期的内容的方法和系统 Download PDF

Info

Publication number
CN1758243A
CN1758243A CNA200510083311XA CN200510083311A CN1758243A CN 1758243 A CN1758243 A CN 1758243A CN A200510083311X A CNA200510083311X A CN A200510083311XA CN 200510083311 A CN200510083311 A CN 200510083311A CN 1758243 A CN1758243 A CN 1758243A
Authority
CN
China
Prior art keywords
date
url
field
mark
content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA200510083311XA
Other languages
English (en)
Inventor
德怀普·N.·巴内吉
莉莲·西西里瓦·弗南德斯
维尼特·杰恩
瓦苏·瓦尔拉巴内尼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN1758243A publication Critical patent/CN1758243A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9562Bookmark management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9566URL specific, e.g. using aliases, detecting broken or misspelled links

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

从网站提取出标注日期的内容,包括:接收带有日期字段的用于标注日期的内容的URL;将当前日期插入在日期字段内;和使用在其日期字段内携带有当前日期的URL提取标注日期的内容。在一些实施例中,数据字段携带编码日期,并且在日期字段内插入当前日期包括使用当前的日期替代该编码日期。典型的实施例还包括给URL添加书签,包括使用日期标记替换日期字段内的编码日期。一些实施例包括向用户提示日期格式。在许多实施例中,日期标记包括缺省的日期格式。一些实施例包括使用缺省的日期格式配置浏览器。

Description

用于从网站提取标注日期的内容的方法和系统
技术领域
本发明的领域是数据处理,或者,更具体地说,涉及用于从网站提取标注日期内容的方法、系统和产品。
背景技术
网站通常具有到每日改变的网页的链接,所述网页例如是列出体育得分的网页、包括电影评论的网页、包括日常食谱的网页、包括新闻记者的每日新闻栏目的网页、等等。这些网页通常用URL来标识,所述URL在URL自身内具有日期值,例如,这个URL:
http://foodtv.com/receipe06122004.html
包括日期值2004年6月12日。用户每天经常访问这些网页。为了访问网页的每日版本,用户通常必需进入主网站的主页面,单击当天的链接。如果URL自身是日期特定的话,则这些用户不能有效地给每日的改变网页内容的URL添加书签。也就是,下一天,URL将不指向当天的每日页面,而是将指向昨天的每日页面。因为链接自身每天都更新,所以用户不能给URL添加书签,和随后提取当天的标注日期的内容。
发明内容
公开了用于从网站提取出标注日期的内容(dated content)的方法、系统和计算机程序产品,包括:接收带有日期字段的用于标注日期内容的URL;将当前日期插入在日期字段内;和使用在其日期字段内携带(bear)有当前日期的URL提取标注日期的内容。在一些实施例中,数据字段携带编码日期,并且在日期字段内插入当前日期包括使用当前日期替代编码日期。
典型的实施例还包括给URL添加书签,包括使用日期标记替换日期字段内的编码日期。一些实施例包括向用户提示日期格式。在许多实施例中,日期标记包括缺省的日期格式。一些实施例包括使用缺省的日期格式配置浏览器。在许多实施例中,在日期字段内插入当前日期包括使用当前日期替代日期标记。在许多实施例中,接收带有日期字段的用于标注日期的内容的URL包括以日期标记的格式提供日期字段,其中在日期字段内插入当前日期包括使用当前日期替换日期标记。许多实施例包括给含有日期字段的URL添加书签。
根据下文对如附图中所示的本发明示例性实施例的更详细的描述,本发明的上述和其它目的、特征和优点将是显而易见,在附图中,相同的附图标记通常表示本发明示例性实施例的相同部件。
附图说明
图1图示根据本发明实施例的能够从网站提起标注日期内容的示例性的数据处理系统。
图2图示根据本发明实施例的包括在从网站中提取标注日期内容时使用的计算机的自动计算机器的方框图。
图3图示用于从网站提取标注日期内容的示例性方法的流程图。
图4图示用于给用于标注日期内容的URL添加书签的示例性方法的流程图。
图5图示根据本发明的示例性浏览器的图形用户界面。
具体实施方式
介绍
以用于从网站提取标注日期内容的方法的形式,在本说明书中描述本发明。然而,本领域的技术人员将理解根据所公开的方法工作的包括合适的编程装置的任何计算机系统也落入在本发明的保护范围内。合适的编程装置包括用于指导计算机系统执行本发明的方法步骤的任何装置,例如包括,由耦合到计算机存储器的处理单元和运算逻辑电路组成的系统,该系统具有在计算机存储器内存储的能力,该计算机存储器包括配置以存储数据和程序指令的电路,本发明方法的编程步骤用于由处理单元执行。
本发明也可以在计算机程序产品内实施,所述计算机程序产品例如磁盘或其它记录介质,用于与任一合适的数据处理系统一起使用。计算机程序产品的实施例可以通过使用用于机器可读信息的任一记录介质来实现,所述介质包括磁介质、光介质或其它合适的介质。本领域的技术人员将立刻理解具有合适编程装置的任一计算机系统将能够执行如在程序产品内实施的本发明方法的步骤。本领域的技术人员将立刻理解,尽管在本说明书中描述的大多数示例性实施例面对在计算机硬件上安装和执行的软件,但是,实施为固件或硬件的替代实施例也在本发明的保护范围之内。
从网站提取标注日期的内容
现在,从图1开始,参考附图解释用于从网站提取标注日期的数据内容的示例性方法、系统和产品。图l图示根据本发明实施例的能够从网站提取标注日期的内容的示例性数据处理系统。图1的系统通常如下操作:接收带有日期字段的用于标注日期的内容的URL;将当前日期插入日期字段内;和使用在其日期字段内携带当前日期的URL提取标注日期的内容。在本说明书中,“标注日期的内容”(datedcontent)是指用携带日期字段的URL标识的任一资源。标注日期的内容通常包括网页,动态生成的网页内容以及包含诸如新闻、每日体育分数和每日菜谱等其它当前信息的其它资源,如本领域的技术人员能够想到的。动态生成的网页内容包括CGI(‘通用网关接口’)脚本的输出、JavaTM servlet和用于动态生成网页内容的其它服务器侧功能,如本领域的技术人员能够想到的。
图1的系统包括在网络内用于数据通信而连接的多台计算机。图1的系统的每个计算机可以在其上安装数据通信客户机,例如根据本发明修改的浏览器。在本说明书内使用的术语“浏览器”通常是指用于以静态或动态网页或服务器侧脚本输出的形式定位、请求、提取和显示计算机资源的Web浏览器和软件应用。浏览器通常包括置标语言解释器、网页显示例程和HTTP通信客户机。当今的典型浏览器包括显示文本、图形、音频和视频。浏览器可以在能够进行数据通信的任一计算机内操作,包括支持web的设备、无线的支持web的设备、微计算机、PDA和便携式计算机等。在无线的支持web的设备内的浏览器通常是缩小的浏览器,称作“微浏览器”。浏览器通常不仅支持HTML(‘超文本置标语言’),还支持其它的置标语言,例如包括XML(‘可扩展置标语言’),在无线的支持web的设备的情况下,WML(‘无线置标语言’)和HDML(‘便携式设备置标语言’)。
图1的数据处理系统包括广域网(“WAN”)(101)和局域网(“LAN”)(103)。图1的结构的网络连接方面仅仅用于解释,而不是用于限制。实际上,根据本发明实施例的用于从网站提取标注日期内容的系统可以连接作为LAN、WAN、内部网、因特网、因特网、web、万维网或其它连接,如本领域的技术人员可以想到的。这些网络是可用于在整个数据处理系统内互相连接的各种设备和计算机之间提供数据通信连接的媒体。
在图1的例子中,服务器(106)实现LAN(103)和WAN(101)之间的网关、路由器或桥接器。在本说明书中,“服务器”是指包括在网络上管理网络资源的自动计算机器的计算机或设备。“Web服务器”具体是利用HTTP与浏览器通信从而管理和使连网计算机置标语言文档和数字对象可用的服务器。在图1的例子中,服务器(106)可获得标注日期的内容可用(404)。标注日期的内容(404)可以是通过使用携带日期字段的URL(“通用资源定位器”)标识和可获得的任一计算机资源。标注日期的内容可以是本领域技术人员将想得到的任何资源。实际上,在‘URL’中的‘R’代表‘资源’。通常诸如HTTP和TCP/IP等的网络通信协议发送资源,而不仅是文件。最普通的资源是文件,但是资源包括动态生成的查询结果,例如CGI(‘通用网关接口’)脚本的输出、Java servlet、动态服务器页面、可以以若干语言获得的文件、等等。实际上,资源有些类似于文件,但是实际上更为普遍。作为文件实现的资源包括静态网页、图形图像文件、视频剪辑文件、音频剪辑文件、等等。作为实际的情况,大部分资源当前是文件或者服务器侧脚本输出。服务器侧脚本输出包括CGI程序的输出、Javaservlet、活动服务器页面和Java服务器页面等。
服务器(106)可以是能够接收标注日期内容的请求和通过提供标注日期内容给请求者来响应的任一计算机。这样一个服务器的例子是HTTP(‘超文本传输协议’)服务器或‘网页服务器’。在图1的例子中,能够支持根据本发明修改的数据通信应用以提取数据标注日期内容的包括PDA(112)、计算机工作站(104)、移动电话(110)和个人计算机(108)的若干示例设备连接到WAN(101)。支持网络的移动电话(110)通过无线链路(116)连接到WAN(101),PDA(112)通过无线链路(114)连接到网络(101)。在图1的例子中,个人计算机(108)通过有线连接(120)连接到WAN(101),计算机工作站(104)通过有线连接(122)连接到WAN(101)。笔记本计算机(126)通过无线链路(118)连接到LAN(103),个人计算机(102)通过有线连接(124)连接到LAN(103)。
组成图1所示的示例性系统的服务器和其它设备的配置是用于解释的,而不是用于限制目的。根据本发明的各种实施例使用的数据处理系统可以包括在图1中未图示的其它服务器、路由器、其它设备和对等结构,如本领域技术人员能够想到的。在这样的数据处理系统内的网络可以支持多种数据通信协议,例如包括TCP/IP、HTTP、WAP和HDTP等,如本领域的技术人员能够想到的。除了图1所示的情况之外,可以在多种硬件平台上实现本发明的各种实施例。
如上所述,通常使用计算机,也就是使用自动计算机器实现根据本发明的从网站提取标注日期的内容。为了进一步解释,图2图示了根据本发明实施例的用于从网站提取标注日期内容的包括计算机(134)的自动计算机器的方框图。图2的计算机(134)包括至少一个计算机处理器(156)或‘CPU’以及随机访问存储器(168)(“RAM”)。在RAM(168)内存储的是诸如浏览器的数据通信客户机(407)。在RAM(168)内还存储有操作系统(154)。根据本发明的实施例的在计算机内使用的操作系统包括Unix、Linux、微软NTTM和许多其它操作系统,如本领域的技术人员能够想到的。在图2的例子中的操作系统(154)图示在RAM(154)中,但是操作系统的许多组件也可以存储在非易失性存储器(166)内。
图2的计算机(134)包括通过系统总线(160)耦合到处理器(156)和计算机的其它组件的非易失性计算机存储器(166)。非易失性计算机存储器(166)可以实施为硬盘驱动器(170)、光盘驱动器(172)、电可擦除可编程只读存储空间(所谓的“EEPROM”或“Flash”存储器)(174)、RAM驱动器(未图示)或者任何一种其它类型的计算机存储器,如本领域的技术人员能够想到的。
图2的示例性计算机(134)包括通信适配器(167),用于实现用于数据通信的连接(184),包括通过网络到其它计算机(182)的连接,所述其它计算机包括服务器和客户机等,如本领域的技术人员能够想到的。通信适配器实现用于数据通信的连接的硬件层,本地设备和远程设备或服务器通过它相互直接和通过网络发送数据通信。根据本发明实施例的用于从网站提取标注日期内容的通信适配器的例子包括用于有线拨号连接的调制解调器、用于有线LAN连接的以太网(IEEE 802.3)适配器和用于无线LAN连接的802.11b适配器。
图2的示例性计算机包括一个或多个输入/输出接口适配器(178)。在计算机内的输入/输出接口适配器通过诸如软件驱动器和计算机硬件实现面向用户的输入/输出,用于控制到诸如计算机显示屏的显示设备(180)的输出,以及来自诸如键盘和鼠标等用户输入设备(181)的用户输入。
为了进一步解释,图3图示说明用于从网站提取标注日期内容(404)的示例性方法的流程图。图3的方法包括接收(402)带有日期字段(407)的用于标注日期内容(404)的URL(412)。图3的日期字段(407)可以实施为在URL内的编码日期值,例如在下述URL内表示日期2004年6月16日的编码日期06162004,
www.somesportspage.com/soccer/scores06162004
图3的日期字段(407)还可以实施为日期标记,例如在下述URL内标识日期格式的<data=mmddyyy>,
www.somesportspage.com/soccer/scores<date=mmddyyy>
图3的日期字段(407)还可以实施为在数据编码URL内的编码日期值。“URL编码数据”是在用于数据通信的URL内封装的数据。如在下文中更详细地描述的,通常以名称-数值对来编码URL编码数据。在HTTP通信的情况下,通常使用HTTP GET和POST功能来发送URL编码数据。在这种情况下,记住URL比仅仅请求文件传输更有用。URL识别服务器上的资源。这些资源可以是具有文件名称的文件,但是用URL标识的资源还包括例如对数据库的查询。这些查询的结果并不必需位于文件内,但是它们还是由标识标注日期内容的URL所标识的和由搜索引擎所标识的数据资源以及生成这些资源的查询数据。在URL编码数据内数据字段的例子是:
http://www.somesportspage.com/cgi-bin/MyScript.cgi?sport=soc cer&event=scores&data=06162004
这是URI编码数据的例子,这是通常如何使用HTTP GET请求消息在Web上提交HTML表格。当将要编码的数据量非常小时,这种使用GET消息的方法是有用的。对于更大量的数据而言,将HTTPPOST消息用于表格提交更为常见。
更具体地,上述的整个例子是携带编码数据的URI,该编码数据是字符串“sport=soccer&event=scores&date=06162004”。编码方法是形成用‘&’和‘=’间隔的字段名称和字段数值的字符串,其中用‘+’表示空格。数据编码URI使用名称-数值对“日期=06162004”标识日期字段。在这个例子中,在日期字段内的编码日期值是表示2004年6月16日的日期。在本说明书中用于标注日期内容的URL内的日期字段(407)的例子是说明性的,而并非可以在URL内实现日期字段的多种方式的穷举。实际上,存在在URL内实现日期字段的许多方式,本领域的技术人员将能够想到的在URL内实现日期字段的所有这些方式都在本发明的保护范围之内。
在图3的方法中,通过在浏览器内接收例如在网页的链路内具有日期字段的URL,可以执行接收(402)带有日期字段的标注日期内容的URL。例如,网页、HTML文件和XHL文件等可以包括到标注日期内容的多个超链接,每个超链接在其内部具有包含日期标记的URL。一个具有包含日期标记编码日期的URL的超链接的例子是:
<ahref=“http://www.somesportspage.com/soccer/scores<date=mmddyyy>”>Today’s Soccer Scores</a>
通过带有日期标记的URL提供到标注日期内容的超链接有利地允许支持具有标注日期内容的网页的系统管路员仅更新标注日期的内容,而不必改变到标注日期的内容的链接。当在浏览器内接收和分析具有到标注日期内容的链路的网页时,根据本发明修改的浏览器分析包含日期标记的每个URL,并使用当前日期替换日期字段。通过在浏览器地址字段内的用户数据输入(图5中的参考标记308)和通过用户从书签列表中选择项目(图5中的314),也可以执行接收(402)带有日期字段的用于标注日期内容的URL。
图3的方法包括在日期字段(407)内插入(406)当前日期(406),使用在其日期字段内携带当前日期的URL(412)提取(408)标注日期的内容(404)。在图3的方法的一个例子中,在日期字段(407)内插入(406)当前日期(406)包括分析URL以识别编码日期,并使用当前日期替换编码日期。考虑下面的例子。用户在2004年9月20日调用下述URL:http://www.somesportspage.com/soccer/scores06162004,它具有包括标识2004年6月16日的标注日期内容的编码日期值01162004的日期字段。根据本发明修改的浏览器分析该URL,识别编码日期值,并使用当前日期替代编码日期。可以修改浏览器以向用户提示使用当前日期替换编码日期值的指令,或者请求用户识别特定的日期格式。在这个例子中,所获得的在日期字段内携带当前日期的URL是
http://www.somesportspage.com/soccer/scores09202004
如上文讨论的,图3的URL(412)的日期字段(407)也可以包括日期标记,而非编码日期。包括日期标记而非编码日期的URL的例子是:
http:// www.somesportspage.com/soccer/scores<data=mmddyyy>
在这个例子中,日期标记<date=mmddyyy>包括将日期格式标识为用于月份的两个数字继之以用于日子的两个数字继之以用于年份的四个数字的日期格式。在图3的方法中,因此,在日期字段(407)内插入(406)当前日期(406)也可以通过使用当前日期(406)替换日期标记来执行。继续上面的例子,在2004年9月20日调用URLhttp:// www.somesportspage.com/soccer/scores<data=mmddyyy>指示根据本发明修改的浏览器使用当前日期替代日期标记<data=mmddyyy>,并由用户通过下述URL请求标注日期的内容:
http:// www.somesportspage.com/soccer/scores09202004
可修改根据本发明进行修改以从网站提取标注日期内容的浏览器,以在日期字段内插入当前日期之前向用户提示日期格式。可选择地,可以使用缺省日期格式配置根据本发明修改的以从网站提取标注日期内容的浏览器。在这些例子中,使用当前日期替换URL内的编码日期包括根据缺省日期格式使用当前日期替换编码日期数值。类似地,在这些例子中,通过根据日期格式使用当前日期替换日期标记,执行使用当前日期替代URL内的日期标记。类似地,在这些例子中,通过根据日期格式使用当前日期替代日期标记,执行使用当前日期替代URL内的日期标记。使用缺省日期格式配置浏览器有利地提供了一种用于替代编码日期和日期标记的机制,而不需要向用户提示日期格式或者要求系统管理员识别在用于标注日期内容的URL内的标记内的日期格式。根据在每个国家中的常规使用,浏览器配置可以随着国家的不同而不同。例如,可以使用‘mmddyyyy’(用于月份的两个数字继之以用于日子的两个数字继之以用于年份的四个数字)的日期格式配置在美国的浏览器,而可以使用‘ddmmyyyy’(用于日子的两个数字继之以用于月份的两个数字继之以用于年份的四个数字)的日期格式配置在欧洲的浏览器。
为了进一步解释,图4图示说明用于给标注日期内容的URL添加书签的示例性方法的流程图。术语“书签”广泛地用于指存储标注日期内容的URL。许多web浏览器支持添加书签,允许用户存储网页的地址(URL),从而用户随后能够轻易地再次访问该页面。在一些浏览器应用中,例如微软OutlookTM,通过“收藏列表”实现添加书签功能,使用‘收藏’而不是‘书签’来标识该功能。在本说明书中,广义地使用术语‘书签’和‘添加书签’,并可以通过使用以短语“书签”明确指出的添加书签特征以及如本领域技术人员能够想到的称作其它名称的添加书签特征的添加书签特征来实现。
在图4的例子中,URL(412)包括在日期字段(407)内携带编码日期值(407)的日期字段。下面是在用包括携带编码数据值的日期字段的URL的URL空间内表达的例子:
www.somesportspage.com/soccer/scores09202004
在这个例子中,子目录名称‘score09202004’包括作为其第七至第十四字符的日期字段,使用日期编码该日期字段,以便其内容‘09202004’代表日期2004年9月20日。
图4的方法包括接收(501)给URL添加书签的指令。例如,通过在浏览器中通过GUI下拉菜单可获得的软件功能,例如在图5中参考标记(316)所图示的,能够实现接收(501)给URL添加书签的指令。显示用上文刚刚阐述的URL标识的网页的浏览器,例如,当调用其‘添加书签’功能时,从而接收给URL添加书签的指令,并通过在用户通过诸如在图5中在参考标记(314)上图示的菜单等菜单可以访问的书签或收藏列表内存储该URL,可以执行该指令。
图4的方法还包括向用户提示(508)用于URL的日期格式。日期格式标识在URL内编码日期数值的格式。例如,mmddyyyy的日期格式标识用于月份的两个数字继之以用于日子的两个数字继之以用于年份的四个数字的日期格式。类似地,mmddyyyy标识用于月份的两个数字继之以用于日子的两个数字继之以用于年份的四个数字的日期格式。为了解释清楚提供了日期格式的两个例子,而不是为了限制目的。实际上,存在许多种日期格式,本领域的技术人员能够想到的任一种日期格式都在本发明的保护范围之内。使用便于用户输入日期格式的GUI文本框,使用用户可以从其选择日期格式的日期格式菜单或者通过如本领域的技术人员能够想到的向用户提示日期格式的任一种其它方法,可以向用户提示日期格式。
响应于用户的日期格式的选择,图4的方法包括使用日期标记(506)替换(502)数据字段(407)内的编码日期(504),所述日期标记(506)在日期字段内存储(510)包括日期标记(506)的URL(412)。通常,通过与用于标注日期内容的描述标识符相关地存储URL,执行在日期字段内存储(510)包括日期标记(506)的URL(412),从而便于用户调用添加有书签的URL。
为了进一步解释,考虑下面的用户添加书签的使用情况,在日期字段内携带编码日期值(407)的URL:
http:// www.somesportspage.com/soccer/scores06162004
标识2004年6月16日的足球得分。该示例性的URL在其日期字段内携带‘06162004’的编码日期值。用户使用GUI下拉菜单指示浏览器给示例性的URL添加书签,根据本发明修改的浏览器向用户提示日期格式。用户在GUI文本框内输入,从下拉菜单中选择,或者选择标识用于月份的两个数字继之以用于日子的两个数字继之以用于年份的两个数字的日期格式的日期格式mmddyyyy。响应于用户输入的日期格式,根据本发明修改的浏览器使用日期标记<日期=mmddyyyy>替代编码日期值‘06162004’,并与标识通过URL可访问的标注日期内容的描述短语相关地存储下述URL:
http:// www.somesportspage.com/soccer/scores<data=mmddyyy>
如上所述,通常,通过使用诸如浏览器等数据通信客户机实现根据本发明的从网站提取标注日期的内容。图5图示示例性软件应用程序的图形用户接口(‘GUI’),更具体地,在图5的例子中,浏览器。
图5的浏览器是软件产品的例子,它根据本发明实施例进行改进,即在源代码的层次上编程,或者使用插件程序修改,从而通过在用于标注日期内容的URL的日期字段内插入当前日期,并使用在其日期字段内携带当前日期的URL提取标注日期内容,从而从网站提取标注日期内容。根据本发明的实施例,还修改图5的浏览器以给用于标注日期内容的URL添加书签。图5的例子采用浏览器是为了方便解释,而不是限制目的。实际上,根据本发明的实施例,可以改进任一软件程序以从网站提取标注日期的内容,包括例如字处理器程序、电子表格处理软件程序、数据库管理工具,当然包括浏览器。
如图所示,已经操作图5的浏览器以指向名称为“SomeSportdPage.com”的网站,如在浏览器显示器(302)的标题条内图示的。图5的浏览器包括GUI工具条(306),带有返回按钮、前进按钮和用于刷新显示器、搜索、打印和停止网页提取的按钮。图5的浏览器还包括水平菜单(304),包括菜单项文件、编辑、选项和书签(在一些浏览器上称作“收藏夹”)。图5的示例性浏览器包括地址条(308),可以通过在浏览器地址条(308)内输入URL,并使用鼠标点击或回车键调用在地址条内的GUI进入按钮,可以执行调用用于标注日期内容的URL。在根据本发明实施例的浏览器的数据通信模块中,作为用于标注日期内容的带有日期字段的URL,接收如此调用的URL,分析以发现其日期字段,此后,在日期字段内插入当前日期,由浏览器从Web服务器提取用如此修改的URL标识的标注日期的内容。
也可以通过调用到标注日期内容的诸如示例性超链接(310和312)的超链接,执行调用用于标注日期内容的URL。‘超链接’是指这样一个URL,当被调用时请求访问由该URL标识的资源。在本说明书中的术语‘超链接’包括在软件应用程序的GUI内的工具条上的锚点(anchor)单元以及‘返回’和‘前进’按钮实现的到URL的链接。锚点单元是标识和实现超链接的置标语言单元。图5的实现示例性超链接(310)的锚点单元的示例性形式,在此用HTML表示,是:
<a   href=“http:// www.somesportspage.com/soccer/scores06162004”>Today’s Soccer Scores</a>
这个示例性的锚点单元包括开始标记<a>、结束标记</a>、标识位于http:// www.somesportspage.com/soccer/scores06162004上的作为标注日期内容的链接的目标的href属性以及锚点。在这个例子,链接目标是用于具有在URL内的编码标注日期数值的标注日期内容的URL。“锚点”是在开始标记和结束标记之间阐述的显示文本。也就是,在这个例子中,锚点是文本“Today’s Soccer Scores”。在典型的使用中,以高亮、下划线、反相、特殊颜色或设置其区别于其它屏幕文本的某种其它方式,显示该锚点,并将其识别为可用的超链接。此外,锚点的屏幕显示区域敏感于诸如鼠标点击等GUI指针操作的用户接口操作。在典型的操作中,用户使用鼠标指针或其它GUI指针指向锚点,并在该锚点上点击以调用该链接。‘锚点单元’是从开始标记到结束标记的整个置标。
图5的例子还包括也使用锚点单元实现的另一个超链接(312)。将该超链接(312)图示为锚点“Today’s Basketball scores”。在此用HTML表示的超链接(312)的示例性锚点单元是:
<ahref=“http:// www.somesportspage.com/soccer/scores<date=mmddyyyy>”>Today’s Soccer Scores</a>
这个示例性的锚点单元包括开始标记<a>、结束标记</a>、将链接目标标识为位于http:// www.somesportspage.com/soccer/scores<date=mmddyyyy>上的标注日期内容的href属性以及锚点。在这个例子中,超链接(312)的目标在日期字段内具有日期标记,而不是编码日期值。在这样一个例子中,当调用超链接时,图5的浏览器使用当前日期替换日期标记,并使用携带当前日期而非日期标记的URL请求标注日期的内容。在这个例子中,日期标记将用于日期插入的日期格式识别为用于月份的两个数字、用于日子的两个数字和用于年份的四个数字。图5的示例性浏览器也可以在分析该页面自身和在显示该页面之前使用当前日期替换日期标记时识别该日期标记。在这样一个替代的例子中,当调用URL时,URL已经具有在日期字段内的当前日期。
在图5的示例性浏览器中,根据本发明的实施例,编程称作书签的菜单项以显示用于给用于标注日期内容的URL添加书签的下拉菜单(314)。在图5的例子中,菜单(314)包括用于在不修改URL的情况下给用于标注日期内容的URL添加书签的‘添加书签’选项(316)。‘添加标签’功能(316)有利地提供一种用于给在其日期字段内已经具有诸如图5的示例性超链接(312)的日期标记的标注日期内容的URL添加标签的机制。当随后调用在日期字段内具有日期标记的添加有标签的URL时,图5的浏览器使用当前日期替代日期标记,并使用携带当前日期的URL提取标注日期的内容。
示例性的下拉菜单(314)还包括用于添加支持日期的书签功能的三个按钮,分别用于三种日期标记格式,一个用于‘mmddyyyy’(318),一个用于‘ddmmyyyy’(320),和一个用于‘mmddyy’(322),用于使用这三种不同的日期格式给在其URL内具有编码日期值的标注日期内容的URL添加标签。调用图5浏览器的菜单(314)的添加支持日期书签选项(318、320、322)之一指示浏览器分析标识当前在浏览器上显示的网页的URL以标识编码日期值,并根据选定的日期格式(318,320,322)使用日期标记替代编码日期值,和使用该日期标记而不是编码日期给该URL添加书签。
图5的示例性下拉菜单(314)还包括作为超链接(310,312)指向相同标注日期内容的两个书签(324,326)。用于今天的足球得分的书签(324)具有相关的URL,该URL在日期字段内具有编码日期值,例如:
www.somesportspage.com/soccer/scores06162004
调用书签(324)使浏览器接收URL作为带有日期字段的用于标注日期内容的URL,分析该URL,使用当前日期替代编码日期值06162004,和使用如此修改的带有当前日期的URL提取用于当前日期的标注日期的内容。
书签(326)具有相关的URL,在该URL的日期字段内具有日期标记,例如:
www.somesportspage.com/soccer/scores<date=mmddyyyy>
调用书签(324)指示浏览器根据日期标记的日期格式使用代表当前日期的日期值替换日期标记,并使用在日期字段内具有当前日期的URL提取标注日期的内容。
根据上述描述将理解在不脱离本发明的实际精神的情况下,可以在本发明的各种实施例中进行修改和改变。在本说明书中的描述仅用于说明目的,而不应当认为是限制意义。本发明的保护范围仅由权利要求书的语言来限制。

Claims (27)

1.一种用于从网站提取出标注日期的内容的方法,该方法包括:
接收带有日期字段的用于标注日期的内容的URL;
将当前日期插入在日期字段内;和
使用在其日期字段内携带有当前日期的URL提取标注日期的内容。
2.权利要求1的方法,其中日期字段携带编码日期,并且在日期字段内插入当前日期还包括使用当前日期替代编码日期。
3.权利要求1的方法,还包括给URL添加书签,包括使用日期标记替代日期字段内的编码日期。
4.权利要求3的方法,还包括向用户提示日期格式。
5.权利要求3的方法,其中日期标记还包括缺省日期格式。
6.权利要求3的方法,还包括使用缺省日期格式配置浏览器。
7.权利要求3的方法,其中在日期字段内插入当前日期还包括使用当前日期替代日期标记。
8.权利要求1的方法,其中接收带有日期字段的用于标注日期的内容的URL还包括以日期标记的形式提供日期字段,其中在日期字段内插入当前日期包括使用当前日期替代日期标记。
9.权利要求1的方法,还包括给含有日期字段的URL添加书签。
10.一种用于从网站提取出标注日期的内容的系统,该系统包括:
用于接收带有日期字段的用于标注日期的内容的URL的装置;
用于将当前日期插入在日期字段内的装置;和
用于使用在其日期字段内携带有当前日期的URL提取标注日期的内容的装置。
11.权利要求10的系统,其中日期字段携带编码日期,并且用于在日期字段内插入当前日期的装置还包括用于使用当前日期替代编码日期的装置。
12.权利要求10的系统,还包括用于给URL添加书签的装置,包括用于使用日期标记替代日期字段内的编码日期的装置。
13.权利要求12的系统,还包括用于向用户提示日期格式的装置。
14.权利要求12的系统,其中日期标记还包括缺省日期格式。
15.权利要求12的系统,还包括用于使用缺省日期格式配置浏览器的装置。
16.权利要求12的系统,其中用于在日期字段内插入当前日期的装置还包括用于使用当前日期替代日期标记的装置。
17.权利要求10的系统,其中用于接收带有日期字段的用于标注日期的内容的URL的装置还包括用于以日期标记的形式提供日期字段的装置,其中用于在日期字段内插入当前日期的装置包括用于使用当前日期替代日期标记的装置。
18.权利要求10的系统,还包括用于给含有日期字段的URL添加书签的装置。
19.一种用于从网站提取出标注日期的内容的计算机程序产品,该计算机程序产品包括:
记录介质;
记录在记录介质上,用于接收带有日期字段的用于标注日期的内容的URL的装置;
记录在记录介质上,用于将当前日期插入在日期字段内的装置;和
记录在记录介质上,用于使用在其日期字段内携带有当前日期的URL提取标注日期的内容的装置。
20.权利要求19的计算机程序产品,其中日期字段携带编码日期,并且记录在记录介质上的用于在日期字段内插入当前日期的装置还包括记录在记录介质上的用于使用当前日期替代编码日期的装置。
21.权利要求19的计算机程序产品,还包括记录在记录介质上的用于给URL添加书签的装置,包括记录在记录介质上的用于使用日期标记替代日期字段内的编码日期的装置。
22.权利要求21的计算机程序产品,还包括记录在记录介质上的用于向用户提示日期格式的装置。
23.权利要求21的计算机程序产品,其中日期标记还包括缺省日期格式。
24.权利要求21的计算机程序产品,还包括记录在记录介质上的用于使用缺省日期格式配置浏览器的装置。
25.权利要求21的计算机程序产品,其中记录在记录介质上的用于在日期字段内插入当前日期的装置还包括记录在记录介质上的用于使用当前日期替代日期标记的装置。
26.权利要求19的计算机程序产品,其中记录在记录介质上的用于接收带有日期字段的用于标注日期的内容的URL的装置还包括记录在记录介质上的用于以日期标记的形式提供日期字段的装置,其中记录在记录介质上的用于在日期字段内插入当前日期的装置包括记录在记录介质上的用于使用当前日期替代日期标记的装置。
27.权利要求19的计算机程序产品,还包括记录在记录介质上的用于给含有日期字段的URL添加书签的装置。
CNA200510083311XA 2004-07-13 2005-07-12 用于从网站提取标注日期的内容的方法和系统 Pending CN1758243A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/889,785 US20060015578A1 (en) 2004-07-13 2004-07-13 Retrieving dated content from a website
US10/889,785 2004-07-13

Publications (1)

Publication Number Publication Date
CN1758243A true CN1758243A (zh) 2006-04-12

Family

ID=35600732

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA200510083311XA Pending CN1758243A (zh) 2004-07-13 2005-07-12 用于从网站提取标注日期的内容的方法和系统

Country Status (2)

Country Link
US (2) US20060015578A1 (zh)
CN (1) CN1758243A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106776924A (zh) * 2016-11-30 2017-05-31 北京奇虎科技有限公司 网页页面预览方法及装置

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4014160B2 (ja) * 2003-05-30 2007-11-28 インターナショナル・ビジネス・マシーンズ・コーポレーション 情報処理装置、プログラム、及び記録媒体
US7783979B1 (en) 2004-09-14 2010-08-24 A9.Com, Inc. Methods and apparatus for generation and execution of configurable bookmarks
US7634572B2 (en) * 2004-12-22 2009-12-15 Slipstream Data Inc. Browser-plugin based method for advanced HTTPS data processing
US7860448B2 (en) * 2005-10-05 2010-12-28 Excelsior Radio Networks, Llc Methods and computer programs for localizing broadcast content
US8533199B2 (en) * 2005-12-14 2013-09-10 Unifi Scientific Advances, Inc Intelligent bookmarks and information management system based on the same
US20070271238A1 (en) * 2006-05-17 2007-11-22 Jeffrey Webster System and Method For Improving the Search Visibility of a Web Page
WO2013164859A2 (en) * 2012-05-03 2013-11-07 N Sringeri OMPRAKASH System for representing date
US11095958B2 (en) * 2019-04-12 2021-08-17 Clipkick, Inc. Systems and methods of universal video embedding

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6163778A (en) * 1998-02-06 2000-12-19 Sun Microsystems, Inc. Probabilistic web link viability marker and web page ratings
US7120862B1 (en) * 1998-12-01 2006-10-10 Lucent Technologies Inc. Method and apparatus for persistent access to Web resources using variable time-stamps
US20020116525A1 (en) * 2001-02-16 2002-08-22 Peters Marcia L. Method for automatically directing browser to bookmark a URL other than a URL requested for bookmarking

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106776924A (zh) * 2016-11-30 2017-05-31 北京奇虎科技有限公司 网页页面预览方法及装置
CN106776924B (zh) * 2016-11-30 2021-05-11 北京奇虎科技有限公司 网页页面预览方法及装置

Also Published As

Publication number Publication date
US20080172396A1 (en) 2008-07-17
US20060015578A1 (en) 2006-01-19

Similar Documents

Publication Publication Date Title
CN101427229B (zh) 用于修改向计算机系统的终端用户显示的信息表示的技术
US7702811B2 (en) Method and apparatus for marking of web page portions for revisiting the marked portions
CN1758243A (zh) 用于从网站提取标注日期的内容的方法和系统
US9703883B2 (en) Social bookmarking of resources exposed in web pages
US7325188B1 (en) Method and system for dynamically capturing HTML elements
US5848424A (en) Data navigator interface with navigation as a function of draggable elements and drop targets
US8959449B2 (en) Enabling hypertext elements to work with software applications
CN100474300C (zh) 用于管理搜索结果的方法和系统
US7225407B2 (en) Resource browser sessions search
US6735586B2 (en) System and method for dynamic content retrieval
US8095534B1 (en) Selection and sharing of verified search results
EP1100008A2 (en) Internet-based application program interface (api) documentation interface
WO2008092079A2 (en) System, method and apparatus for selecting content from web sources and posting content to web logs
CN1475908A (zh) 用于将动作与电子文档中的语义标签相关联的方法和系统
CN102129364A (zh) 应用程序中嵌入微件工具栏的方法和快速访问微件的方法
CN1552033A (zh) 对网页中的电话号码进行代码转换的系统和方法
US20110191381A1 (en) Interactive System for Extracting Data from a Website
US8090702B2 (en) Analyzing web site traffic
US20030080986A1 (en) System and method for accessing and utilizing remote bookmark lists
EP1325425A1 (en) Method and system of automating internet interactions
US7895337B2 (en) Systems and methods of generating a content aware interface
US7886227B2 (en) Cross-environment context-sensitive help files
US8719416B1 (en) Multiple subparts of a uniform resource locator
CN100553250C (zh) 标记网页的方法和设备
CN111680247A (zh) 网页字符串的本地调用方法、装置、设备及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication