CN1959679A - 网页微内容提取、聚合和自动更新系统的方法 - Google Patents

网页微内容提取、聚合和自动更新系统的方法 Download PDF

Info

Publication number
CN1959679A
CN1959679A CN 200610152708 CN200610152708A CN1959679A CN 1959679 A CN1959679 A CN 1959679A CN 200610152708 CN200610152708 CN 200610152708 CN 200610152708 A CN200610152708 A CN 200610152708A CN 1959679 A CN1959679 A CN 1959679A
Authority
CN
China
Prior art keywords
content
micro
webpage
subsystem
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 200610152708
Other languages
English (en)
Other versions
CN100444174C (zh
Inventor
徐凯
王亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zhongsou Cloud Business Network Technology Co ltd
Original Assignee
AIDIXING TECH Co Ltd BEIJING
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AIDIXING TECH Co Ltd BEIJING filed Critical AIDIXING TECH Co Ltd BEIJING
Priority to CNB2006101527084A priority Critical patent/CN100444174C/zh
Publication of CN1959679A publication Critical patent/CN1959679A/zh
Application granted granted Critical
Publication of CN100444174C publication Critical patent/CN100444174C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)

Abstract

本发明涉及一种网页微内容提取、聚合和自动更新系统的方法。本发明提供一种有效地根据网页内容的功能来分区网页微内容,并将网页微内容提取、聚合和自动更新,动态生成用户个性化的页面,其中的微内容将随原网页的更新而更新。本发明的方法是先在用户端输入网页的地址,将合法的内容传递到服务器端的网页微内容分析子系统,然后按超链接群标记不同的微内容板块或栏目,将标记的html文本内容传回到用户端,选中原始微内容或其父辈节点,添加到用户端微内容桌面子系统,完成页面的布置。本发明利用网络微信息提取和聚合方法,用户可以在桌面上进行搜索,方便的引进第三方的服务,整合用户需要的网上信息。

Description

网页微内容提取、聚合和自动更新系统的方法
技术领域
本发明涉及一种创建交互式网页应用的网页开发技术,尤其涉及一种基于网页微内容提取、聚合和自动更新系统的方法。
背景技术
现有的互联网技术,如AJAX(全称为“Asynchronous JavaScriptand XML”,译为“异步JavaScript和XML”),是指一种创建交互式网页应用的网页开发技术,它有机地组合了以下几种技术:
基于web标准(全称为“standards-based presentation”,译为:互联网)XHTML+CSS的表示,XHTML全称为“The ExtensibleHyperText Markup Language”(译为“可扩展标识语言”),CSS全称为“Cascading style Sheets”(译作“层叠样式表单”);
使用XML和XSLT进行数据交换及相关操作,XML全称为“Extensible Markup Language”(译为“可扩展标记语言”),XSLT全称为“eXtensible Stylesheet Language Transformation”,是一种用来转换XML文档结构的语言;
使用DOM进行动态显示及交互,DOM全称为“Document ObjectModel”,即文档对象模型,XML将数据组织为一颗树,所以DOM就是对这颗树的一个对象描叙;通俗的说,就是通过解析XML文档,为XML文档在逻辑上建立一个树模型,树的节点是一个个对象,我们通过存取这些对象就能够存取XML文档的内容;
RSS是站点用来和其他站点之间共享内容的一种简易方式(也叫聚合内容)的技术。最初源自浏览器“新闻频道”的技术,现在通常被用于新闻和其他按顺序排列的网站,例如博客;
RSS的几个缩写来源:
1、Really Simple Syndication(真正简易的聚合),
2、Rich Site Summary(丰富的站点摘要),
3、RDF Site Summary(RDF站点摘要);
API就是应用程序编程接口,它是能用来操作组件、应用程序或者操作系统的一组函数;典型的情况下,API由一个或多个提供某种特殊功能的程序模块组成;
使用XMLHttpRequest进行异步数据查询、检索,XMLHttpRequest是一套可以在Javascript、VbScript、Jscript等脚本语言中通过http协议传送或从接收XML及其他数据的一套API;
使用JavaScript将所有的东西绑定在一起,JavaScript是一种基于对象(Object)和事件驱动(Event Driven)并具有安全性能的脚本语言;
类似于DHTML或LAMP,AJAX不是指一种单一的技术,而是有机地利用了一系列相关的技术。AJAX的应用使用支持以上技术的web浏览器作为运行平台,这些最常用的浏览器目前包括:MozillaFirefox、Internet Explorer、Opera、Konqueror及Safari。DHTML全称“Dynamic HTML”,是指HTML、CSS和客户端脚本的一种集成;LAMP是LINUX+APACHE+MYSQL+PHP四个开源软件的英文第一个子母的缩写,HTML全称为“Hyper Text Mark-up Language”(是指“超文本标记语言”),XPATH是用来帮助XSLT在XML源文档中查找定位信息的语言。
传统的web应用允许用户填写表单,当提交表单时就向web服务器发送一个请求;服务器接收并处理传来的表单,然后返回一个新的网页。这个做法浪费了许多带宽,因为在前后两个页面中的大部分HTML代码往往是相同的;由于每次应用的交互都需要向服务器发送请求,应用的响应时间就依赖于服务器的响应时间,这导致了用户界面的响应比本地应用慢得多。
与此不同,AJAX应用可以仅向服务器发送并取回必需的数据,它使用SOAP或其它一些基于XML的web service接口,并在客户端采用JavaScript处理来自服务器的响应。因为在服务器和浏览器之间交换的数据大量减少,结果我们就能看到响应更快的应用。同时很多的处理工作可以在发出请求的客户端机器上完成,所以网速大大加快。
在互联网上,用户获取信息方式有两种,第一是不知道信息源,利用搜索引擎来查找信息;第二种是知道信息源,通过收藏夹或书签记录信息源的链接,来分别访问这些网站。大量实践表明,收藏链接多了,与用户相关信息比较分散,无法有效管理,时间长了容易忘记检查重要信息的更新。
为此,用户具有对于网页微内容的提取、聚合和自动更新功能的需求,用户需要对互联网信息进行跟踪、采集、处理和挖掘,给每一个网络客户自由的空间,提供用户之间交流平台,提供分享的功能,根据行业领域的需求来整合所有自己感兴趣的网络内容和网络服务,重新打造出一个个全新的纵深的网络平台,并帮助用户创造自己的商业价值,因此对于微内容和元数据的创建、发布、同步、浏览、听取等应用需要新的处理方法。
发明内容
针对现有技术存在的问题,本发明所要解决的技术问题是要提供一种有效地根据网页内容的功能来分区网页微内容,并将网页微内容提取、聚合和自动更新,通过AJAX技术让用户在浏览器端选择感兴趣的微内容,并通过DHTML将选择的微内容群通过鼠标拖拽进行排版,动态生成用户个性化的页面,其中的微内容将随原网页的更新而更新。
为达上述目的,本发明基于网页微内容提取、聚合和自动更新系统的方法,其特征是包括下述步骤:
①、用户端输入网页的地址,向后台服务器端发出访问请求,由服务器端的网页抓取子系统通过http协议下载网页的html内容,检查数据的完整性和语法的合法性,将合法的内容传递到服务器端的网页微内容分析子系统;
②、服务器端的网页微内容分析子系统解析html文本数据,然后按超链接群标记不同的微内容板块或栏目,以及原始微内容的父辈节点,然后将标记的html文本内容传回到用户端;
③、服务器端的微内容选择子系统,分析内容中的标记并联系对应的鼠标事件,用户通过鼠标左右键的操作,选中原始微内容或其父辈节点,并可以多选,添加到用户端微内容桌面子系统;此时当系统给出一个取消指令,系统返回步骤①;否则继续进行步骤④;
④、用户端微内容桌面子系统提供多页面、多栏目和自由排版等编辑功能,使用户使用简单的鼠标点击和拖拽到相关对应项目,完成页面的布置;
⑤、服务器端的微内容比较子系统应用抓取子系统定时更新用户定制的信息,比较两个时点的网页内容,并过滤出更新的内容以备用户端微内容桌面子系统的查询及提醒服务的需求。
进一步的,在步骤④完成后,所述用户端桌面子系统数据更新过程包括在微内容桌面子系统中应用非同步的xmlhttprequest协议,启动微内容自动更新子系统定时向服务器查询最新更新,并用最新的信息替换页面上的信息。
本发明利用网络微信息提取和聚合方法,用户可以把常去网页的栏目剪切下来,通过简简单单的拖动操作,就可以创建编辑不同主题的页面。利用AJAX动态服务聚合方法,将丰富多彩的网络服务管理起来,用户可以在桌面上进行搜索,关注股票、跟踪新闻,查阅来自不同邮箱的邮件,阅读博客等各项网络服务,还能很方便的引进第三方的服务。该方法突破了一般在线RSS聚合器的局限,不仅仅支持RSS聚合,而且可以跟踪、解析和聚合来自任意网页的内容(包括不支持RSS或其它API的网站),并且支持内容的发散。网站制作人,博客作家可以借此方法转播来自其它网站的动态内容加入自己的网页和博客中。
本发明的积极效果如下:
免费的网络监测工具,能帮用户随时监测所有感兴趣的网站(如拍卖物品的竟价状况、股票、交通、天气预报和在线交易等)历史记录,并随时给你更新内容的提醒;
免费让用户建立自己的个人桌面,而桌面内容可来自用户喜爱的其它任意网站,帮用户实现与朋友共享自己的个人桌面;
能够一边听音乐,一边在线聊天,一边看网络新闻而从不错过一次重要的在线活动;
能够做到,用户无论在哪儿,都能收到自己定制的网络及时信息;
能整合用户所有的Email帐户,像新浪、搜狐、网易、21CN、126、Yahoo信箱、Gmail信箱、Hotmail等都可以汇聚在个人桌面上。
附图说明
图1为本发明实施例的系统模块图;
图2为本发明实施例注释文件的逻辑流程图;
图3为本发明实施例的系统逻辑控制图。
具体实施方式
为能进一步了解本发明的特征、技术手段以及所达到的具体目的、功能,下面结合附图与具体实施方式对本发明作进一步详细描述:
本发明相关结构主要包括以下系统(或部件):网页抓取子系统1、网页微内容分析子系统2、微内容选择子系统3、微内容桌面子系统4、微内容自动更新子系统5、微内容比较子系统6构成的。
本发明基于实现网页微内容提取、聚合和自动更新系统方法的主要流程包括下述步骤:
①、用户端输入网页的地址,向后台服务器端发出访问请求,由服务器端的网页抓取子系统1通过http协议下载网页的html内容,检查数据的完整性和语法的合法性,将合法的内容传递到服务器端的网页微内容分析子系统2;
②、服务器端的网页微内容分析子系统2解析html文本数据,然后按超链接群标记不同的微内容板块或栏目,以及原始微内容的父辈节点,然后将标记的html文本内容传回到用户端;
③、服务器端的微内容选择子系统3,分析内容中的标记并联系对应的鼠标事件,用户通过鼠标左右键的操作,选中原始微内容或其父辈节点,并可以多选,添加到用户端微内容桌面子系统4;此时当系统给出一个取消指令,系统返回步骤①;否则继续进行步骤④;
④、用户端微内容桌面子系统4提供多页面、多栏目和自由排版等编辑功能,使用户使用简单的鼠标点击和拖拽到相关对应项目,完成页面的布置;
⑤、服务器端的微内容比较子系统6应用抓取子系统定时更新用户定制的信息,比较两个时点的网页内容,并过滤出更新的内容以备用户端微内容桌面子系统4的查询及提醒服务的需求。
在步骤④完成后,所述用户端桌面子系统数据更新过程包括在微内容桌面子系统4中应用非同步的xmlhttprequest协议,启动微内容自动更新子系统5定时向服务器查询最新更新,并用最新的信息替换页面上的信息。
步骤①所述的网页抓取子系统1,是一组服务器端软件模块,根据用户提供的网页地址,模仿互联网浏览器向目标网站发送HTTP请求,并附带HTTP请求相关的COOKIE等相关信息;接收目标网站返回的网页内容——HTML超文本链接代码,分析代码的完整性和合法性,并处理返回错误和超时。
步骤①所述的网页微内容分析子系统2,是一组服务器端软件模块,分析和标记由网页抓取子系统返回的网页内容——HTML超文本链接代码;首先解析HTML超文本链接代码为DOM数据结构,然后遍历DOM树结构,找到超文本链接群,并定义为微内容,标记微内容结点和其父结点。
步骤②所述的超链接群,是在网页中由超链接组成的内容板块。例如,新浪新闻网页中的“国内新闻”,“体育新闻”。一般是由网页编辑根据内容信息分类或优先次序,并通过HTML标记出的一组超链接。
步骤③所述的微内容选择子系统3,是一组在客户浏览器里运行的javascript脚本,分析由服务器端网页微内容分析子系统生成的带有标记的HTML代码,在微内容结点上设置相应鼠标事件;当用户在被操作页面上移动鼠标时,用不同颜色呈现微内容区域,用户点鼠标左键将选中该微内容,如果继续点鼠标左键将扩大选中的范围,用户可以多选,用户鼠标移动到任意选中的微内容区域,并点鼠标右键将取消选中的区域;用户确认完成后,本子系统将用户所有选中的微内容的编号通过XMLHTTPREQUEST发回服务器。
步骤③所述的微内容桌面子系统4:是一组在客户浏览器里运行的javascript脚本。让用户通过鼠标的拖拽调整所添加的微内容模块的大小,位置,颜色和版式等布局。其原理是通过动态改变浏览器中网页的DOM树结构,让用户自己可以调整自己网页的内容,布局和风格。并能够添加,删除微内容模块和多页面。将相关设置信息保持到服务器端的数据库。当用户再次打开自己的页面时,本系统将动态的将上述设置信息从服务器端下载,并根据设置信息,向服务器加载微内容信息和其他功能模块。
步骤⑤所述的微内容比较子系统6,是一组服务器端软件模块,对同一网页的不同版本的内容进行比较;除了需要不同版本的完整内容,还需要知道被定制的微内容板块的编号;本系统采用网页微内容分析子系统,对新旧内容进行分析和标记,在新内容中寻找和被定制微内容相同XPATH的微内容模块,如果找到就将该微内容列入成功更新的队列,否则列入需要修复的队列供微内容自动更新子系统进一步处理。
上述的微内容自动更新子系统5,是一组服务器端软件模块,定时通过网页抓取子系统获得用户目标网页的最新内容,并通过微内容比较子系统,将目标网页的最新内容和数据库里存储的内容进行比较;过滤出更新了的微内容,同时更新数据库里完整的网页内容和相关的微内容;如果在最新内容中找不到定制的微内容板块,将此板块放入需要修复的名单中,等待维护人员,人工修复;如果人工修复过程还是找不到相应内容,就删除该微内容板块,当微内容板块被用户加载时,本系统将返回提示信息,告知本微内容板块不存在,用户可以选择重新定制。
采用了本发明的‘i的’web2.0个人桌面与传统静态视窗桌面相比,其最大优势在于,它管理的是在线的信息和服务。是流动的,是随时更新的,也就是说永远是最新最快的!它为信息的共享与协作处理事务提供了天然良好的支持,为用户创造了与时俱进的有利保障!它打破了传统的应用程序发布,安装和升级的模式,方便安全,随时upgrade,永远on line!
通过以上方法,任何用户都可以创造和产生微内容,一则网志、一篇文章、一幅图片、一个收藏的书签……,但这不是最重要的,因为在Web 1.0时代也可以创造众多微内容,但Web 2.0最重要的是“可重用”,通过微内容的结构化(xml)、开放性(开放API)以及工具无关性(如用RSS可以使用多种工具来聚合和利用这些微内容,不必局限于生成内容的原始网站),网站变为了可读写的服务,用户可以在任何地方使用这些微内容,用户将直接参与网站内容层面的构建,最大程度的展示个人的作用,达成个性化的丰富应用。
目前而言,该技术是现在全球唯一能对任意网页(HTML)内容进行提取和聚合的新型操作系统,突破了一般在线RSS聚合器的局限。不仅仅支持RSS聚合,而且可以跟踪、解析和聚合来自任意网页的内容(包括不支持RSS或其它API的网站),并且支持内容的发散。网站制作人,博客作家可以借此方法转播来自其它网站的动态内容加入自己的网页和博客中。
                 与现有技术比较简表
  邮件   信息聚合   信息发散
  本发明   整合所有Email账户   任意网页内容及RSS   支持
  MSN   Hotmail   MSN内容及RSS   不支持
  Google   Gmail   RSS   不支持
  Yahoo   Yahoo Mail   Yahoo内容及RSS   不支持
以上所举实施例仅用为方便举例说明本发明,并非对本发明作任何形式上的限制,任何所属技术领域中具有通常知识者,若在不脱离本发明所提技术特征的范围内,利用本发明所揭示技术内容所作出局部更动或修饰的等效实施例,并未脱离本发明的技术特征内容,均仍属于本发明技术特征的范围内。

Claims (8)

1、本发明基于网页微内容提取、聚合和自动更新系统的方法,其特征是包括下述步骤:
①、用户端输入网页的地址,向后台服务器端发出访问请求,由服务器端的网页抓取子系统(1)通过http协议下载网页的html内容,检查数据的完整性和语法的合法性,将合法的内容传递到服务器端的网页微内容分析子系统(2);
②、服务器端的网页微内容分析子系统(2)解析html文本数据,然后按超链接群标记不同的微内容板块或栏目,以及原始微内容的父辈节点,然后将标记的html文本内容传回到用户端;
③、服务器端的微内容选择子系统(3),分析内容中的标记并联系对应的鼠标事件,用户通过鼠标左右键的操作,选中原始微内容或其父辈节点,并可以多选,添加到用户端微内容桌面子系统(4);此时当系统给出一个取消指令,系统返回步骤①;否则继续进行步骤④;
④、用户端微内容桌面子系统(4)提供多页面、多栏目和自由排版等编辑功能,使用户使用简单的鼠标点击和拖拽到相关对应项目,完成页面的布置;
⑤、服务器端的微内容比较子系统(6)应用抓取子系统定时更新用户定制的信息,比较两个时点的网页内容,并过滤出更新的内容以备用户端微内容桌面子系统(4)的查询及提醒服务的需求。
2、根据权利要求1所述的网页微内容提取、聚合和自动更新系统的方法中,其特征在于:步骤④完成后,所述用户端桌面子系统数据更新过程包括在微内容桌面子系统(4)中应用非同步的xmlhttprequest协议,启动微内容自动更新子系统(5)定时向服务器查询最新更新,并用最新的信息替换页面上的信息。
3、根据权利要求1所述的网页微内容提取、聚合和自动更新系统的方法中,其特征在于:步骤①所述的网页抓取子系统(1),是一组服务器端软件模块,根据用户提供的网页地址,模仿互联网浏览器向目标网站发送HTTP请求,并附带HTTP请求相关的COOKIE等相关信息;接收目标网站返回的网页内容——HTML超文本链接代码,分析代码的完整性和合法性,并处理返回错误和超时。
4、根据权利要求1所述的网页微内容提取、聚合和自动更新系统的方法中,其特征在于:步骤①所述的网页微内容分析子系统(2),是一组服务器端软件模块,分析和标记由网页抓取子系统返回的网页内容——HTML超文本链接代码;首先解析HTML超文本链接代码为DOM数据结构,然后遍历DOM树结构,找到超文本链接群,并定义为微内容,标记微内容结点和其父结点。
5、根据权利要求1所述的网页微内容提取、聚合和自动更新系统的方法中,其特征在于:步骤③所述的微内容选择子系统(3),是一组在客户浏览器里运行的javascript脚本,分析由服务器端网页微内容分析子系统生成的带有标记的HTML代码,在微内容结点上设置相应鼠标事件;当用户在被操作页面上移动鼠标时,用不同颜色呈现微内容区域,用户点鼠标左键将选中该微内容,如果继续点鼠标左键将扩大选中的范围,用户可以多选,用户鼠标移动到任意选中的微内容区域,并点鼠标右键将取消选中的区域;用户确认完成后,本子系统将用户所有选中的微内容的编号通过XMLHTTPREQUEST发回服务器。
6、根据权利要求1所述的网页微内容提取、聚合和自动更新系统的方法中,其特征在于:步骤③所述的微内容桌面子系统(4):是一组在客户浏览器里运行的javascript脚本。让用户通过鼠标的拖拽调整所添加的微内容模块的大小,位置,颜色和版式等布局。其原理是通过动态改变浏览器中网页的DOM树结构,让用户自己可以调整自己网页的内容,布局和风格。并能够添加,删除微内容模块和多页面。将相关设置信息保持到服务器端的数据库。当用户再次打开自己的页面时,本系统将动态的将上述设置信息从服务器端下载,并根据设置信息,向服务器加载微内容信息和其他功能模块。
7、根据权利要求1所述的网页微内容提取、聚合和自动更新系统的方法中,其特征在于:步骤⑤所述的微内容比较子系统(6),是一组服务器端软件模块,对同一网页的不同版本的内容进行比较;除了需要不同版本的完整内容,还需要知道被定制的微内容板块的编号;本系统采用网页微内容分析子系统,对新旧内容进行分析和标记,在新内容中寻找和被定制微内容相同XPATH的微内容模块,如果找到就将该微内容列入成功更新的队列,否则列入需要修复的队列供微内容自动更新子系统进一步处理。
8、根据权利要求2所述的网页微内容提取、聚合和自动更新系统的方法中,其特征在于:所述的微内容自动更新子系统(5),是一组服务器端软件模块,定时通过网页抓取子系统获得用户目标网页的最新内容,并通过微内容比较子系统,将目标网页的最新内容和数据库里存储的内容进行比较;过滤出更新了的微内容,同时更新数据库里完整的网页内容和相关的微内容;如果在最新内容中找不到定制的微内容板块,将此板块放入需要修复的名单中,等待维护人员,人工修复;如果人工修复过程还是找不到相应内容,就删除该微内容板块,当微内容板块被用户加载时,本系统将返回提示信息,告知本微内容板块不存在,用户可以选择重新定制。
CNB2006101527084A 2006-09-25 2006-09-25 网页微内容提取、聚合和自动更新系统的方法 Expired - Fee Related CN100444174C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB2006101527084A CN100444174C (zh) 2006-09-25 2006-09-25 网页微内容提取、聚合和自动更新系统的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2006101527084A CN100444174C (zh) 2006-09-25 2006-09-25 网页微内容提取、聚合和自动更新系统的方法

Publications (2)

Publication Number Publication Date
CN1959679A true CN1959679A (zh) 2007-05-09
CN100444174C CN100444174C (zh) 2008-12-17

Family

ID=38071376

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2006101527084A Expired - Fee Related CN100444174C (zh) 2006-09-25 2006-09-25 网页微内容提取、聚合和自动更新系统的方法

Country Status (1)

Country Link
CN (1) CN100444174C (zh)

Cited By (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009130606A2 (en) * 2008-04-21 2009-10-29 Vaka Corporation Methods and systems for shareable virtual devices
CN101753598A (zh) * 2008-12-16 2010-06-23 国际商业机器公司 用于整合多个web应用的方法和Web应用集成器
CN101819584A (zh) * 2010-03-18 2010-09-01 上海引跑信息科技有限公司 轻量级智能网页内容解析方法
WO2010149026A1 (zh) * 2009-06-23 2010-12-29 北京搜狗科技发展有限公司 一种更新提醒的方法及系统
CN101930453A (zh) * 2010-07-23 2010-12-29 百度在线网络技术(北京)有限公司 一种用于实现网页内嵌块更新的方法和设备
CN102207967A (zh) * 2011-06-03 2011-10-05 奇智软件(北京)有限公司 一种自动提供浏览器新插件的方法和系统
CN102255826A (zh) * 2011-01-17 2011-11-23 北京开心人信息技术有限公司 一种快速发布日志的方法及系统
CN102301678A (zh) * 2009-01-19 2011-12-28 瑞典爱立信有限公司 在电信网络中为越顶服务提供身份相关的系统和方法
CN102446199A (zh) * 2010-09-30 2012-05-09 易搜比控股公司 简易信息聚合文件的整合方法
WO2012065537A1 (zh) * 2010-11-19 2012-05-24 华为终端有限公司 一种数据交互的方法及装置
CN102667765A (zh) * 2009-09-08 2012-09-12 诺基亚公司 用于有选择地共享语义信息集合的方法和装置
CN101727482B (zh) * 2008-10-28 2012-10-03 索尼株式会社 信息处理装置和信息处理方法
CN103034731A (zh) * 2012-12-20 2013-04-10 北京思特奇信息技术股份有限公司 一种生成Web前端交互页面的方法
CN102257488B (zh) * 2008-12-17 2013-05-29 微软公司 用于经由网络自动聚合内容的技术
CN103345506A (zh) * 2013-07-03 2013-10-09 云南电网公司 基于桌面端的快捷企业级知识收集工具
CN103532995A (zh) * 2012-07-03 2014-01-22 百度在线网络技术(北京)有限公司 页面更新提醒方法、系统以及装置
CN103617223A (zh) * 2012-03-31 2014-03-05 北京奇虎科技有限公司 网页收藏方法和装置
CN103635897A (zh) * 2011-06-23 2014-03-12 微软公司 对运行页面进行动态更新
RU2522103C2 (ru) * 2009-06-23 2014-07-10 Бейджинг Согоу Текнолоджи Девелопмент Ко., Лтд. Способ и браузер для уведомления об обновлении
CN104065504A (zh) * 2013-03-22 2014-09-24 腾讯科技(深圳)有限公司 信息的处理方法及装置
CN104063379A (zh) * 2013-03-18 2014-09-24 联想(北京)有限公司 显示控制方法和电子设备
CN106126557A (zh) * 2016-06-16 2016-11-16 乐视控股(北京)有限公司 页面处理方法及装置
WO2016191997A1 (zh) * 2015-05-31 2016-12-08 阮元 可下载内容更新时的提醒方法以及信息提醒系统
CN106708930A (zh) * 2016-11-17 2017-05-24 北京小米移动软件有限公司 应用页面刷新的方法及装置
CN106874387A (zh) * 2017-01-11 2017-06-20 中科院微电子研究所昆山分所 一种自适应html滚屏展示实时信息的方法
CN108228806A (zh) * 2017-12-29 2018-06-29 广东欧珀移动通信有限公司 网页信息删除方法、装置、移动终端及服务器
US10540416B2 (en) 2011-06-23 2020-01-21 Microsoft Technology Licensing, Llc Linking source code to running element
CN110990738A (zh) * 2019-12-09 2020-04-10 名创优品(横琴)企业管理有限公司 一种网页正文及要素提取的方法和系统
CN111600920A (zh) * 2019-02-21 2020-08-28 北京京东尚科信息技术有限公司 基于js的数据请求代理方法、装置、设备及可读存储介质
CN115618086A (zh) * 2022-12-05 2023-01-17 北京永洪商智科技有限公司 一种基于网页进行划词分析的方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102521295A (zh) * 2011-11-30 2012-06-27 深圳市五巨科技有限公司 一种自动获取指定页面内容更新的方法和装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW486656B (en) * 1999-11-05 2002-05-11 Ibm Method and system for user-selectable shell from web server
CN1402156A (zh) * 2001-08-22 2003-03-12 威瑟科技股份有限公司 网站信息提取系统与方法
CN1204512C (zh) * 2002-04-18 2005-06-01 宇智(大连)电子信息技术有限公司 网站动态维护系统及其方法
CN1466078A (zh) * 2002-07-02 2004-01-07 英业达股份有限公司 一种更新网页内容及表格的网页服务器系统及方法
US20050203935A1 (en) * 2004-03-11 2005-09-15 International Business Machines Corporation Clipboard content and document metadata collection
CN100432996C (zh) * 2004-12-07 2008-11-12 国际商业机器公司 基于网页页面布局提取网页核心内容的系统、方法

Cited By (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009130606A3 (en) * 2008-04-21 2010-01-07 Vaka Corporation Methods and systems for shareable virtual devices
WO2009130606A2 (en) * 2008-04-21 2009-10-29 Vaka Corporation Methods and systems for shareable virtual devices
US8479108B2 (en) 2008-04-21 2013-07-02 Vaka Corporation Methods and systems for shareable virtual devices
CN101727482B (zh) * 2008-10-28 2012-10-03 索尼株式会社 信息处理装置和信息处理方法
CN101753598A (zh) * 2008-12-16 2010-06-23 国际商业机器公司 用于整合多个web应用的方法和Web应用集成器
CN102257488B (zh) * 2008-12-17 2013-05-29 微软公司 用于经由网络自动聚合内容的技术
CN102301678A (zh) * 2009-01-19 2011-12-28 瑞典爱立信有限公司 在电信网络中为越顶服务提供身份相关的系统和方法
CN102301678B (zh) * 2009-01-19 2014-11-05 瑞典爱立信有限公司 在电信网络中为越顶服务提供身份相关的系统和方法
WO2010149026A1 (zh) * 2009-06-23 2010-12-29 北京搜狗科技发展有限公司 一种更新提醒的方法及系统
RU2530340C2 (ru) * 2009-06-23 2014-10-10 Бейджинг Согоу Текнолоджи Девелопмент Ко., Лтд. Способ и система уведомления об обновлении
CN101788991B (zh) * 2009-06-23 2013-03-06 北京搜狗科技发展有限公司 一种更新提醒的方法及系统
RU2522103C2 (ru) * 2009-06-23 2014-07-10 Бейджинг Согоу Текнолоджи Девелопмент Ко., Лтд. Способ и браузер для уведомления об обновлении
CN102667765B (zh) * 2009-09-08 2017-04-12 诺基亚技术有限公司 用于有选择地共享语义信息集合的方法和装置
US9613065B2 (en) 2009-09-08 2017-04-04 Nokia Technologies Oy Method and apparatus for selective sharing of semantic information sets
CN102667765A (zh) * 2009-09-08 2012-09-12 诺基亚公司 用于有选择地共享语义信息集合的方法和装置
CN101819584B (zh) * 2010-03-18 2011-11-09 上海引跑信息科技有限公司 轻量级智能网页内容解析方法
CN101819584A (zh) * 2010-03-18 2010-09-01 上海引跑信息科技有限公司 轻量级智能网页内容解析方法
CN101930453A (zh) * 2010-07-23 2010-12-29 百度在线网络技术(北京)有限公司 一种用于实现网页内嵌块更新的方法和设备
CN102446199B (zh) * 2010-09-30 2015-04-22 易搜比控股公司 简易信息聚合文件的整合方法
CN102446199A (zh) * 2010-09-30 2012-05-09 易搜比控股公司 简易信息聚合文件的整合方法
WO2012065537A1 (zh) * 2010-11-19 2012-05-24 华为终端有限公司 一种数据交互的方法及装置
US9686376B2 (en) 2010-11-19 2017-06-20 Huawei Device Co., Ltd. Method and apparatus for data interaction
US9203896B2 (en) 2010-11-19 2015-12-01 Huawei Device Co., Ltd. Method and apparatus for data interaction
CN102255826A (zh) * 2011-01-17 2011-11-23 北京开心人信息技术有限公司 一种快速发布日志的方法及系统
CN102207967B (zh) * 2011-06-03 2013-05-08 奇智软件(北京)有限公司 一种自动提供浏览器新插件的方法和系统
CN102207967A (zh) * 2011-06-03 2011-10-05 奇智软件(北京)有限公司 一种自动提供浏览器新插件的方法和系统
US10534830B2 (en) 2011-06-23 2020-01-14 Microsoft Technology Licensing, Llc Dynamically updating a running page
US10540416B2 (en) 2011-06-23 2020-01-21 Microsoft Technology Licensing, Llc Linking source code to running element
CN103635897A (zh) * 2011-06-23 2014-03-12 微软公司 对运行页面进行动态更新
CN103635897B (zh) * 2011-06-23 2019-04-26 微软技术许可有限责任公司 对运行页面进行动态更新的方法
CN103617223A (zh) * 2012-03-31 2014-03-05 北京奇虎科技有限公司 网页收藏方法和装置
CN103617223B (zh) * 2012-03-31 2018-03-20 北京奇虎科技有限公司 网页收藏方法和装置
US9986055B2 (en) 2012-07-03 2018-05-29 Baidu Online Network Technology (Beijing) Co., Ltd. Page update reminding method, system, and device
CN103532995A (zh) * 2012-07-03 2014-01-22 百度在线网络技术(北京)有限公司 页面更新提醒方法、系统以及装置
CN103034731A (zh) * 2012-12-20 2013-04-10 北京思特奇信息技术股份有限公司 一种生成Web前端交互页面的方法
CN103034731B (zh) * 2012-12-20 2016-12-28 北京思特奇信息技术股份有限公司 一种生成Web前端交互页面的方法
CN104063379A (zh) * 2013-03-18 2014-09-24 联想(北京)有限公司 显示控制方法和电子设备
CN104065504A (zh) * 2013-03-22 2014-09-24 腾讯科技(深圳)有限公司 信息的处理方法及装置
CN103345506A (zh) * 2013-07-03 2013-10-09 云南电网公司 基于桌面端的快捷企业级知识收集工具
WO2016191997A1 (zh) * 2015-05-31 2016-12-08 阮元 可下载内容更新时的提醒方法以及信息提醒系统
CN106126557A (zh) * 2016-06-16 2016-11-16 乐视控股(北京)有限公司 页面处理方法及装置
CN106708930A (zh) * 2016-11-17 2017-05-24 北京小米移动软件有限公司 应用页面刷新的方法及装置
CN106874387B (zh) * 2017-01-11 2020-09-11 中科院微电子研究所昆山分所 一种自适应html滚屏展示实时信息的方法
CN106874387A (zh) * 2017-01-11 2017-06-20 中科院微电子研究所昆山分所 一种自适应html滚屏展示实时信息的方法
CN108228806A (zh) * 2017-12-29 2018-06-29 广东欧珀移动通信有限公司 网页信息删除方法、装置、移动终端及服务器
CN108228806B (zh) * 2017-12-29 2021-05-11 Oppo广东移动通信有限公司 网页信息删除方法、装置、移动终端及服务器
CN111600920A (zh) * 2019-02-21 2020-08-28 北京京东尚科信息技术有限公司 基于js的数据请求代理方法、装置、设备及可读存储介质
CN111600920B (zh) * 2019-02-21 2024-03-05 北京京东尚科信息技术有限公司 基于js的数据请求代理方法、装置、设备及可读存储介质
CN110990738A (zh) * 2019-12-09 2020-04-10 名创优品(横琴)企业管理有限公司 一种网页正文及要素提取的方法和系统
CN115618086A (zh) * 2022-12-05 2023-01-17 北京永洪商智科技有限公司 一种基于网页进行划词分析的方法

Also Published As

Publication number Publication date
CN100444174C (zh) 2008-12-17

Similar Documents

Publication Publication Date Title
CN100444174C (zh) 网页微内容提取、聚合和自动更新系统的方法
CN101124609B (zh) 使用内联上下文查询的搜索系统及方法
CN1988536B (zh) 用于管理网站内容的方法、系统和设备
CN101288067B (zh) 从电子文档组装、提取和配置内容的方法和装置
US9245033B2 (en) Channel sharing
CN101427229B (zh) 用于修改向计算机系统的终端用户显示的信息表示的技术
CN102073726B (zh) 搜索引擎系统的结构化数据的引入方法和装置
US20120030553A1 (en) Methods and systems for annotating web pages and managing annotations and annotated web pages
CN104881285B (zh) 基于本体的代码片段标注与重用系统
CN101452453A (zh) 一种输入法网址导航的方法和一种输入法系统
WO2008092079A2 (en) System, method and apparatus for selecting content from web sources and posting content to web logs
JP2008508575A (ja) エコシステムを使用した集約および検索の方法、並びに、それらの関連技術
CN102105875B (zh) 用于提供全面主页服务的系统和方法
CN109815382B (zh) 大规模网络数据的感知与获取方法和系统
CN102065114A (zh) 一种移动终端访问网页的方法及装置
KR102222287B1 (ko) 은닉 url에 포함된 정형 및 비정형 데이터의 수집을 위한 웹 크롤러 시스템
JP2006309515A (ja) 情報配信方法および情報配信サーバ
CN1708762A (zh) 用于创建、递送以及跟踪广告的方法和系统
US20110145717A1 (en) Web-browsing system
JP5026192B2 (ja) ドキュメント作成システム、ユーザ端末、サーバ装置、およびプログラム
CN107291940A (zh) 页面内容管理方法、装置及相关服务器
CN1404590A (zh) 元数据分类和信息入口的创建方法
CN102063454A (zh) 一种搜索与应用相结合的方法和设备
CN101751443A (zh) 数据检索与处理系统及方法
JP4469432B2 (ja) インターネット情報処理装置、インターネット情報処理方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C57 Notification of unclear or unknown address
DD01 Delivery of document by public notice

Addressee: Huang Xueling

Document name: Notice of application for publication of patent for invention and entry into the substantive examination procedure

C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: BEIJING ZHONGSUO NETWORK TECHNOLOGY CO., LTD.

Free format text: FORMER OWNER: BEIJING ZHONGSUO ONLINE SOFTWARE CO., LTD.

Effective date: 20100323

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: 100191 9/F, SHOUXIANG BUILDING, BUILDING 51, XUEYUAN ROAD, HAIDIAN DISTRICT, BEIJING CITY TO: 100191 7/F, BUILDING 51, XUEYUAN ROAD, HAIDIAN DISTRICT, BEIJING CITY

TR01 Transfer of patent right

Effective date of registration: 20100323

Address after: 100191 7 floor, building 51, Haidian District, Beijing, Xueyuan Road

Patentee after: Beijing search network technology Co.,Ltd.

Address before: 100191, Beijing, Xueyuan Road, Haidian District No. 51 building, first floor, building 9

Patentee before: Beijing Zhongsou On-line Software Co.,Ltd.

DD01 Delivery of document by public notice

Addressee: Chen Dewu

Document name: Notification of Passing Examination on Formalities

C56 Change in the name or address of the patentee

Owner name: BEIJING ZHONGSOU NETWORK TECHNOLOGY SHARES CO., LT

Free format text: FORMER NAME: BEIJING ZHONGSOU NETWORK TECHNOLOGY CO., LTD.

CP03 Change of name, title or address

Address after: 100191 Beijing, Xueyuan Road, No. 51, the first to enjoy science and technology building, room 0902, No.

Patentee after: BEIJING ZHONGSOU NETWORK TECHNOLOGY Co.,Ltd.

Address before: 100191 7 floor, building 51, Haidian District, Beijing, Xueyuan Road

Patentee before: Beijing search network technology Co.,Ltd.

DD01 Delivery of document by public notice
DD01 Delivery of document by public notice

Addressee: BEIJING ZHONGSOU NETWORK TECHNOLOGY Co.,Ltd.

Document name: Notification that Application Deemed not to be Proposed

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20180615

Address after: 100086 08-09 5, 2 building, 43 North Sanhuan Road, Haidian District, Beijing.

Patentee after: BEIJING ZHONGSOU CLOUD BUSINESS NETWORK TECHNOLOGY Co.,Ltd.

Address before: 100191 room 0902, science and technology building, 51 Xueyuan Road, Haidian District, Beijing.

Patentee before: BEIJING ZHONGSOU NETWORK TECHNOLOGY Co.,Ltd.

DD01 Delivery of document by public notice
DD01 Delivery of document by public notice

Addressee: BEIJING ZHONGSOU NETWORK TECHNOLOGY Co.,Ltd.

Document name: Notification of Passing Examination on Formalities

DD01 Delivery of document by public notice
DD01 Delivery of document by public notice

Addressee: Patent of Beijing zhongsoyunshang Network Technology Co.,Ltd. The person in charge

Document name: Notice of termination of patent right

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20081217

Termination date: 20210925