CN106412003A - 信息推送方法、装置及信息请求装置 - Google Patents
信息推送方法、装置及信息请求装置 Download PDFInfo
- Publication number
- CN106412003A CN106412003A CN201610616483.7A CN201610616483A CN106412003A CN 106412003 A CN106412003 A CN 106412003A CN 201610616483 A CN201610616483 A CN 201610616483A CN 106412003 A CN106412003 A CN 106412003A
- Authority
- CN
- China
- Prior art keywords
- data
- information
- source
- url
- configuration information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 73
- 238000012545 processing Methods 0.000 claims description 12
- 238000001914 filtration Methods 0.000 claims description 9
- 230000009193 crawling Effects 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 abstract description 7
- 238000010586 diagram Methods 0.000 description 15
- 230000000694 effects Effects 0.000 description 5
- 238000000605 extraction Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000013481 data capture Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- FGUUSXIOTUKUDN-IBGZPJMESA-N C1(=CC=CC=C1)N1C2=C(NC([C@H](C1)NC=1OC(=NN=1)C1=CC=CC=C1)=O)C=CC=C2 Chemical compound C1(=CC=CC=C1)N1C2=C(NC([C@H](C1)NC=1OC(=NN=1)C1=CC=CC=C1)=O)C=CC=C2 FGUUSXIOTUKUDN-IBGZPJMESA-N 0.000 description 1
- 244000089409 Erythrina poeppigiana Species 0.000 description 1
- 235000009776 Rathbunia alamosensis Nutrition 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/55—Push-based network services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/955—Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/21—Monitoring or handling of messages
- H04L51/214—Monitoring or handling of messages using selective forwarding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/60—Scheduling or organising the servicing of application requests, e.g. requests for application data transmissions using the analysis and optimisation of the required network resources
- H04L67/62—Establishing a time schedule for servicing the requests
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本申请公开了一种信息推送方法、装置及信息请求装置。其中,该方法包括:获取预先设置的数据源的配置信息,其中,所述配置信息至少包括统一资源定位符URL;根据所述URL,抓取所述URL所指向的数据,并生成包含有所述数据的所述订阅源;推送包含有所述数据的所述订阅源。本申请解决了由于现有的RSS订阅技术用户只能获取到RSS源提供者提供的信息,无法主动的去获取其想要得到的信息提供方造成的订阅源不灵活的技术问题。
Description
技术领域
本申请涉及互联网领域,具体而言,涉及一种信息推送方法、装置及信息请求装置。
背景技术
RSS(Really Simple Syndication,简易信息聚合)在互联网上被广泛采用的内容包装和投递协议。RSS目前广泛用于网上新闻频道,例如blog(博客)等,使用RSS订阅能更快地获取信息,有利于让用户获取网站内容的最新更新。用户可以借助于支持RSS的聚合工具软件,在不打开网站内容页面的情况下阅读支持RSS输出的网站内容。
然而,目前的RSS只能由提供方(例如网站)提供RSS源订阅支持,用户只能获取到RSS源提供者提供的信息,无法主动的去获取其想要得到的信息,比较被动,导致订阅源不灵活,而且一旦订阅源不提供信息或者出了问题,用户则无法获取信息。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种信息推送方法、装置及信息请求装置,以至少解决由于现有的RSS订阅技术用户只能获取到RSS源提供者提供的信息,无法主动的去获取其想要得到的信息提供方造成的订阅源不灵活的技术问题。
根据本申请实施例的一个方面,提供了一种信息推送方法,包括:获取预先设置的数据源的配置信息,其中,所述配置信息至少包括统一资源定位符URL;根据所述URL,抓取所述URL所指向的数据,并生成包含有所述数据的所述订阅源;推送包含有所述数据的所述订阅源。
根据本申请实施例的另一方面,还提供了一种信息推送方法,包括:将用户输入的数据源的配置信息发送至信息推送装置,其中,所述配置信息至少包括统一资源定位符URL,由所述信息推送装置根据所述URL,抓取所述URL所指向的数据,并生成包含有所述数据的所述订阅源;接收所述信息推送装置推送的所述订阅源。
根据本申请实施例的另一方面,还提供了一种信息推送装置,包括:获取单元,用于获取预先设置的数据源的配置信息,其中,所述配置信息至少包括统一资源定位符URL;数据抓取单元,用于根据所述URL,抓取所述URL所指向的数据;生成单元,用于生成包含有所述数据的所述订阅源;推送单元,用于推送包含有所述数据的所述订阅源。
可选地,所述配置信息还包括:数据格式,该数据格式用于指示需生成的订阅源的格式。
可选地,所述数据源包括网站源、数据库源和/或简易信息聚合RSS源;其中,在所述数据源包括所述网站源的情况下,所述配置信息还包括所述URL对应的正则表达式;在所述数据源包括所述数据库源的情况下,所述配置信息还包括数据库信息以及所述数据的表名,其中,所述数据库信息包括数据库IP、用户名及密码。
可选地,所述数据抓取单元包括:解析模块,用于从所述URL中解析出所述URL所包含的超文本标记语言html;第一提取模块,用于从所述html中提取出所述html的选择器;第一查找模块,用于使用所述选择器,查找包含所述html的字段;过滤模块,用于利用所述正则表达式,过滤查找到的所述包含所述html的字段,得到所述数据。
可选地,所述数据抓取单元包括:定位模块,用于依据所述数据库IP定位目标数据库;访问模块,用于使用所述用户名及所述密码访问所述目标数据库;第二查找模块,用于在所述目标数据库中查找到与所述表名对应的表项;第二提取模块,用于从所述表项中提取出所述URL所指向的所述数据。
可选地,信息推送装置还包括:第一接收单元,用于接收并保存用户输入的所述数据源的所述配置信息;处理单元,用于生成并向所述用户返回所述订阅源的订阅地址;其中,所述推送单元用于执行以下步骤推送包含有所述数据的所述订阅源:在所述用户访问所述订阅地址的情况下,向所述用户推送包含有所述数据的所述订阅源。
根据本申请实施例的另一方面,还提供了一种信息请求装置,包括:发送单元,用于将用户输入的数据源的配置信息发送至信息推送装置,其中,所述配置信息至少包括统一资源定位符URL,由所述信息推送装置根据所述URL,抓取所述URL所指向的数据,并生成包含有所述数据的所述订阅源;第二接收单元,用于接收所述信息推送装置推送的所述订阅源。
可选地,所述配置信息还包括:数据格式,该数据格式用于指示需生成的订阅源的格式。
可选地,信息请求装置还包括:第三接收单元,用于接收所述信息推送装置返回的所述订阅源的订阅地址;其中,所述第二接收单元用于执行以下步骤接收所述信息推送装置推送的所述订阅源:在访问所述订阅地址的情况下,接收所述信息推送装置推送的所述订阅源。
可选地,所述数据源包括网站源、数据库源和/或简易信息聚合RSS源;其中,在所述数据源包括所述网站源的情况下,所述配置信息还包括所述URL对应的正则表达式;在所述数据源包括所述数据库源的情况下,所述配置信息还包括数据库信息以及所述数据的表名,其中,所述数据库信息包括数据库IP、用户名及密码。
在本申请实施例中,采用获取预先设置的数据源的配置信息,其中,配置信息至少包括URL(Uniform Resource Locator,统一资源定位符);根据URL,抓取URL所指向的数据,并生成包含有数据的订阅源;推送包含有数据的订阅源的方式,通过根据用户输入的数据源的配置信息,抓取对应的数据,并生成订阅源,达到了可以向用户推送其想要的订阅源的目的,从而实现了增加订阅源的灵活性的技术效果,进而解决了由于现有的RSS订阅技术用户只能获取到RSS源提供者提供的信息,无法主动的去获取其想要得到的信息提供方造成的订阅源不灵活的技术问题。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例的一种运行信息推送方法的计算机终端的硬件结构框图;
图2是根据本申请实施例的一种可选的信息推送方法的流程示意图;
图3是根据本申请实施例的另一种可选的信息推送方法的流程示意图;
图4是根据本申请实施例的又一种可选的信息推送方法的流程示意图;
图5(a)是根据本申请实施例的又一种可选的信息推送方法的流程示意图;
图5(b)是根据本申请实施例的又一种可选的信息推送方法的流程示意图;
图6是根据本申请实施例的又一种可选的信息推送方法的流程示意图;
图7是根据本申请实施例的一种可选的信息推送装置的结构示意图;
图8是根据本申请实施例的一种可选的数据抓取单元的结构示意图;
图9是根据本申请实施例的另一种可选的数据抓取单元的结构示意图;
图10是根据本申请实施例的另一种可选的信息推送装置的结构示意图;
图11是根据本申请实施例的一种可选的信息请求装置的结构示意图;
图12是根据本申请实施例的另一种可选的信息请求装置的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
首先将本申请实施例涉及的术语解释如下:
RSS源:一种描述和同步网站内容的格式,RSS搭建了信息传播的技术平台,使得每个人都成为潜在信息提供者。发布一个RSS文件后,器包含的信息就能直接被其他站点调用。
URL:是对可以从互联网上得到的资源的位置和访问方法的一种简洁的表示,是互联网上标准资源的地址。
正则表达式:又称正则表示法、常规表示法,用来使用单个字符串来表述、匹配一系列符合某个句法规则的字符串。
html的选择器:是指html的某一特定属性,提取出该html的选择器之后,下次就可以使用该html的选择器定位到该段html。
实施例1
根据本申请实施例,还提供了一种信息推送方法的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本申请实施例1所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。以运行在计算机终端上为例,图1是本申请实施例的一种信息推送方法的计算机终端的硬件结构框图。如图1所示,计算机终端10可以包括一个或多个(图中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器104、以及用于通信功能的传输装置106。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算机终端10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
存储器104可用于存储应用软件的软件程序以及模块,如本申请实施例中的信息推送方法对应的程序指令/模块,处理器102通过运行存储在存储器104内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的应用程序的漏洞检测方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端10的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(Network Interface Controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
在上述运行环境下,本申请提供了如图2所示的信息推送方法。图2是根据本申请实施例的一种可选的信息推送方法的流程示意图。
如图2所示,该信息推送方法可以包括如下实现步骤:
步骤S202,获取预先设置的数据源的配置信息,其中,配置信息至少包括统一资源定位符URL。
本申请上述步骤S202中,执行本实施例的信息推送方法的执行主体可以为信息推送装置,信息推送装置可以周期性的抓取数据生成订阅源,具体地,信息推送装置可以按照用户的设定来定时抓取数据,也可以动态计算数据更新的频率设定相应的时间抓取数据,本实施例对此不作限制。
本实施例的数据源的配置信息可以为用户输入的配置信息;信息推送装置提供一个功能,保存用户输入的数据源的配置信息,并将该数据源的配置信息存入到数据库。具体地,用户可以通过用户侧的信息请求装置(例如客户端)输入上述数据源的配置信息。
其中,本实施例的信息推送装置可以支持用户同时配置多个数据源,例如网站源、数据库源以及RSS源等,信息推送装置会对这些数据源做适配,从而根据各个数据源的配置信息抓取对应的数据。
可选地,配置信息可以还包括:数据格式,该数据格式用于指示需生成的订阅源的格式。例如,若需要获取网站源的数据,用户需要预先设置URL、正则表达式等,然后用户还需要设置一个模板(模板用来定义订阅源的数据格式,用户可以通过定义数据格式,将信息推送装置抓取到的内容展现成自己需要的格式),用来生成最终的订阅源;保存后,信息推送装置将该网站源的配置信息存入数据库,进而定时根据配置信息去抓取对应的数据,如果发现有更新则及时生成和更新订阅源。
步骤S204,根据URL,抓取URL所指向的数据,并生成包含有所述数据的所述订阅源。
本申请上述步骤S204中,信息推送装置在获取到预先设置的数据源的配置信息之后,则进行数据的抓取,具体地,信息推送装置可以根据URL抓取URL所指向的数据。
需要说明的是,由于本实施例的信息推送装置可以支持用户同时配置多个数据源,例如网站源、数据库源以及RSS源等,因此信息推送装置如何根据URL抓取URL所指向的数据,后续实施例中会进行详细描述,此处不做赘述。
信息推送装置在抓取到数据之后,可以按照配置信息中的数据格式,生成具有该数据格式的、包含有上述数据的订阅源。
其中,上述的数据格式的定义可是通过设置模板来实现的,例如{for}、{endfor}代表循环,{whole}代表所有数据整合到一起。用户可以通过设置模板来定义其所需要的订阅源的数据格式,进而信息推送装置可以将抓取到的数据展现成该用户所需要的格式。本申请的信息推送方法可以通过模板生成多种格式的订阅源,其中,不但可以生成RSS源,而且可以生成html、json(JavaScript Object Notation,JavaScript对象表示法)等源信息,进而满足不同用户的需求,增加订阅源的灵活性。
步骤S206,推送包含有数据的订阅源。
本申请上述步骤S206中,信息推送装置在生成包含有数据的订阅源之后,可以将该包含有数据的订阅源推送给上述的信息请求装置。具体地,本实施例中,信息推送装置可以先将该包含有数据的订阅源进行缓存,并在信息请求装置需要的时候将该包含有数据的订阅源推送给信息请求装置;信息推送装置也可以根据设定,定时将该包含有数据的订阅源推送给信息请求装置;信息推送装置还可以在生成该包含有数据的订阅源之后直接进行推送,以上描述的信息推送装置如何将包含有数据的订阅源推送给信息请求装置的技术方案均应在本实施例的保护范围之内。
本申请实施例所提供的信息推送方法,生成的订阅源完全是根据用户自己的配置而生成的,不依赖站长,用户可以获取其想要的信息,而且还可以通过配置模板生成多种格式,具有较高的灵活性。
由上可知,本申请上述实施例1所提供的方案,通过根据用户输入的数据源的配置信息,抓取对应的数据,并根据用户设定的数据格式生成订阅源,达到了可以向用户推送其想要的订阅源的目的,从而实现了增加订阅源的灵活性的技术效果,进而解决了由于现有的RSS订阅技术用户只能获取到RSS源提供者提供的信息,无法主动的去获取其想要得到的信息提供方造成的订阅源不灵活的技术问题。
可选地,数据源包括网站源、数据库源和/或简易信息聚合RSS源;其中,在数据源包括网站源的情况下,配置信息还包括URL对应的正则表达式;在数据源包括数据库源的情况下,配置信息还包括数据库信息以及数据的表名,其中,数据库信息包括数据库IP、用户名及密码。
本申请上述实施例提供的一种可选方案中,如图3所示,在数据源包括网站源的情况下,上述步骤S204,根据URL,抓取URL所指向的数据的步骤可以包括:
步骤S302,从URL中解析出URL所包含的超文本标记语言html。
本申请上述步骤S302中,若用户输入的为网站源的配置信息,那么该配置信息中至少包含URL以及URL对应的正则表达式。那么信息推送装置在根据URL,抓取URL所指向的数据的过程中,首先需要从URL中解析出URL所包含的一段html(Hyper Text MarkupLanguage,超文本标记语言)。
步骤S304,从html中提取出html的选择器。
本申请上述步骤S304中,信息推送装置在从URL中解析出URL所包含的html之后,可以从这段html中提取出html的选择器,例如(.article div)、(#m-hp.product-container),其中,选择器是指html的某一特定属性。提取出html的选择器之后,下次就可以使用选择器定位到该段html。
步骤S306,使用选择器,查找包含html的字段。
本申请上述步骤S306中,信息推送装置在从html中提取出html的选择器之后,则可以在互联网上查找包含html的字段。
如果#m-hp.product-container能定位到几个地方(比如获得host products以及top10等)就循环一遍,用内容判断下到底选中的是哪个,然后选择器就变成#m-hp.product-container(0)。
步骤S308,利用正则表达式,过滤查找到的包含html的字段,得到数据。
本申请上述步骤S308中,利用正则表达式,过滤查找到的包含html的字段所得到的数据即为URL所指向的数据。信息推送装置在网站上查找到的包含html的字段可能有很多,因此需要利用正则表达式,例如<li><ahref=(.*?)>(.*?)</a></li>,对查找到的包含html的字段进行过滤。
需要补充的是,如果用户没有设置正则表达式,信息推送装置则自动调用默认的正则表达式进行过滤。
本申请的信息推送方法在抓取数据时,通过网页的URL、选择器以及正则表达式作为一个数据块的坐标,多个数据块可以组合成一个订阅源,设置一个定时任务更新该订阅源。(例如,用户需要一个足球订阅源,现在需要新浪和网易的足球频道的数据,则设置2个数据块,新浪的URL:http://sports.sina.com.cn/global/,选择器:.index-p1.ul-type1,正则表达式:<li><a href=(.*?)>(.*?)</a></li>),通过这个可以取到一个信息的列表,再获得网易足球的信息列表(方法与新浪的相同),组合之后就能够对外输出一个订阅源,以后用户可以不需要打开新浪和网易足球,就可以看到相应的信息。
本申请上述步骤S302至步骤S308提供了一种抓取网站源数据的可选方案,通过从URL中解析出html,再从html中提取出html的选择器,进而使用选择器从网站上查找包含html的字段,从而利用正则表达式,过滤查找到的包含html的字段,得到数据。
本申请上述实施例提供的一种可选方案中,如图4所示,在数据源包括数据库源的情况下,上述步骤S204,根据URL,抓取URL所指向的数据的步骤可以包括:
步骤S402,依据数据库IP定位目标数据库。
本申请上述步骤S402中,若用户输入的为数据库源的配置信息,那么该配置信息中至少包括数据库信息(数据库信息包括数据库IP、用户名及密码)、数据的表名以及URL。那么信息推送装置在根据URL,抓取URL所指向的数据的过程中,首先需要依据数据库IP定位目标数据库。
步骤S404,使用用户名及密码访问目标数据库。
本申请上述步骤S404中,想要调用数据库中的数据,需要拥有这个数据库的访问权限。以目标数据库为MySQL(关系型数据库管理系统)数据库为例,信息推送装置在以及数据库IP定位到该MySQL数据库支行,需要使用用户名及密码访问来访问该MySQL数据库。
步骤S406,在目标数据库中查找到与表名对应的表项。
本申请上述步骤S406中,数据库中的数据是以多个表项的形式进行存储的,要想查找对应的数据信息推送装置需要先找到与表名对应的表项。
步骤S408,从表项中提取出URL所指向的数据。
本申请上述步骤S406中,信息推送装置在目标数据库中查找到与表名对应的表项之后,可以从表项中提取出URL所指向的数据。
在抓取数据库源中的数据时,需要用户能拥有这个数据的访问权限,以MySQL举例,获得数据库的用户名及密码,并且用户需要输入其想要获得的数据的那张表的字段,例如article表的URL,信息推送装置首先查询出最新的记录(例如100条记录),生成订阅源,然后每次定时去抓取一遍,获取到最近更新的记录数更新进去。
需要补充的是,RSS源和网站源抓取法相似,RSS的格式已经比较规整。监控这个具体的RSS源的URL,不停的获取到最新的数据更新到订阅源中即可。
本申请上述步骤S402至步骤S408提供了一种抓取网站源数据的可选方案,通过依据数据库IP定位目标数据库,再使用用户名及密码访问目标数据库,进而在目标数据库中查找到与表名对应的表项,从而从表项中提取出URL所指向的数据。
本申请上述实施例提供的一种可选方案中,如图5(a)所示,在获取预先设置的数据源的配置信息之前,本申请实施例的信息推送方法还包括:
步骤S502,接收并保存用户输入的数据源的配置信息。
本申请上述步骤S502中,用户可以根据其所需要的数据进行配置,信息推送装置可以接收并保存用户输入的数据源的配置信息。
步骤S504,生成并向用户返回订阅源的订阅地址。
本申请上述步骤S504中,当用户保存设置的时候,会分配一个订阅源的订阅地址给用户,用户访问这个地址的订阅地址,信息推送装置会直接从缓存中读取订阅源进而推送给用户,用户也可以通过配置设置实时读取,本实施例不作限制。
其中,推送包含有数据的订阅源包括:在用户访问订阅地址的情况下,向用户推送包含有数据的订阅源。
本申请上述实施例提供的一种可选方案中,如图5(b)所示,本申请实施例的信息推送方法包括以下步骤:
步骤a:用户输入数据源的配置信息;
其中,配置信息至少包括统一资源定位符URL;配置信息还包括:数据格式,该数据格式用于指示需生成的订阅源的格式。
步骤b:信息推送装置从网站抓取URL所指向的数据;
步骤c:网站将该数据返回至信息推送装置;
步骤d:信息推送装置按照数据格式生成该数据的订阅源;
步骤e:信息推送装置缓存该订阅源;
步骤f:信息推送装置将该订阅源返回给用户。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例的方法。
实施例2
根据本申请实施例,还提供了一种信息推送方法的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本申请实施例2所提供的方法实施例仍旧可以在移动终端、计算机终端或者类似的运算装置中执行。此处需要说明的是,实施例2所提供的方法实施例仍旧可以运行在图1所示的计算机终端上。
在上述运行环境下,本申请提供了如图6所示的信息推送方法。图6是根据本申请实施例2的信息推送方法的流程图。
如图6所示,该信息推送方法可以包括如下实现步骤:
步骤S602,将用户输入的数据源的配置信息发送至信息推送装置,其中,配置信息至少包括统一资源定位符URL,由信息推送装置根据URL,抓取URL所指向的数据,并生成包含有数据的订阅源。
信息推送装置可以周期性的抓取数据生成订阅源,具体地,信息推送装置可以按照用户的设定定时抓取数据,也可以动态计算数据更新的频率设定相应的时间抓取数据,本实施例对此不作限制。
本申请上述步骤S602中,信息请求装置可以将用户输入的数据源的配置信息发送至信息推送装置。本实施例的信息推送装置提供一个功能,保存用户输入的数据源的配置信息,并将该数据源的配置信息存入到数据库。具体地,用户可以通过用户侧的信息请求装置(例如客户端)输入上述数据源的配置信息。配置信息还包括:数据格式,该数据格式用于指示需生成的订阅源的格式。
其中,本实施例的信息推送装置可以支持用户同时配置多个数据源,例如网站源、数据库源以及RSS源等,信息推送装置会对这些数据源做适配,从而根据各个数据源的配置信息抓取对应的数据。例如,若需要获取网站源的数据,用户需要预先设置URL(UniformResource Locator,统一资源定位符)、正则表达式等,然后用户还需要设置一个模板(模板用来定义订阅源的数据格式,用户可以通过定义数据格式,将信息推送装置抓取到的内容展现成自己需要的格式),用来生成最终的订阅源,保存后,信息推送装置则将该网站源的配置信息存入数据库,进而定时根据配置信息去抓取对应的数据,如果发现有更新则及时生成和更新订阅源。
信息推送装置在获取到预先设置的数据源的配置信息之后,则进行数据的抓取,具体地,信息推送装置可以根据URL抓取URL所指向的数据。信息推送装置在抓取到数据之后,可以按照配置信息中的数据格式,生成具有该数据格式的、包含有上述数据的订阅源。
其中,上述的数据格式的定义可是通过设置模板来实现的,例如{for}、{endfor}代表循环,{whole}代表所有数据整合到一起。用户可以通过设置模板来定义其所需要的订阅源的数据格式,进而信息推送装置可以将抓取到的数据展现成该用户所需要的格式。本申请的信息推送方法可以通过模板生成多种格式的订阅源,其中,不但可以生成RSS源,而且可以生成html、json等源信息,进而满足不同用户的需求,增加订阅源的灵活性。
可选地,数据源包括网站源、数据库源和/或简易信息聚合RSS源;其中,在数据源包括网站源的情况下,配置信息还包括URL对应的正则表达式;在数据源包括数据库源的情况下,配置信息还包括数据库信息以及数据的表名,其中,数据库信息包括数据库IP、用户名及密码。
步骤S604,接收信息推送装置推送的订阅源。
信息推送装置在生成包含有数据的订阅源之后,可以将该包含有数据的订阅源推送给上述的信息请求装置,具体地,信息推送装置可以先将该包含有数据的订阅源进行缓存,并在信息请求装置需要的时候将该包含有数据的订阅源推送给信息请求装置;信息推送装置也可以根据设定定时将该包含有数据的订阅源推送给信息请求装置;信息推送装置还可以在生成该包含有数据的订阅源之后直接进行推送,均应在本实施例的保护范围之内。
本申请实施例所提供的信息推送方法,信息推送装置生成的订阅源完全是根据用户自己的配置而生成的,不依赖站长,用户可以获取其想要的信息,而且还可以通过配置模板生成多种格式,具有较高的灵活性。
由上可知,本申请上述实施例2所提供的方案,通过根据用户输入的数据源的配置信息,抓取对应的数据,并根据用户设定的数据格式生成订阅源,达到了可以向用户推送其想要的订阅源的目的,从而实现了增加订阅源的灵活性的技术效果,进而解决了由于现有的RSS订阅技术用户只能获取到RSS源提供者提供的信息,无法主动的去获取其想要得到的信息提供方造成的订阅源不灵活的技术问题。
本申请上述实施例提供的一种可选方案中,在将用户输入的数据源的配置信息发送至信息推送装置之后,接收信息推送装置推送的订阅源之前,还包括:
步骤S10,接收信息推送装置返回的订阅源的订阅地址。
本申请上述步骤S10中,信息推送装置会分配一个订阅源的订阅地址给用户。具体地,用户可以根据其所需要的数据进行配置,信息推送装置可以接收并保存用户输入的数据源的配置信息。当用户保存设置的时候,会分配一个订阅源的订阅地址给用户,用户访问这个地址的订阅地,信息推送装置会直接从缓存中读取订阅源进而推送给用户,用户也可以通过配置设置实时读取,本实施例不作限制。
其中,接收信息推送装置推送的订阅源包括:在访问订阅地址的情况下,接收信息推送装置推送的订阅源。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例所述的方法。
实施例3
根据本申请实施例,还提供了一种用于实施上述方法实施例的装置实施例,本申请上述实施例所提供的装置可以在计算机终端上运行。
图7是根据本申请实施例的信息推送装置的结构示意图。
如图7所示,该信息推送装置可以包括获取单元702、数据抓取单元704、生成单元706以及推送单元708。
其中,获取单元702,用于获取预先设置的数据源的配置信息,其中,所述配置信息至少包括统一资源定位符URL;数据抓取单元704,用于根据所述URL,抓取所述URL所指向的数据;生成单元706,用于生成包含有所述数据的所述订阅源;推送单元708,用于推送包含有所述数据的所述订阅源。
由上可知,本申请上述实施例3所提供的方案,通过根据用户输入的数据源的配置信息,抓取对应的数据,并根据用户设定的数据格式生成订阅源,达到了可以向用户推送其想要的订阅源的目的,从而实现了增加订阅源的灵活性的技术效果,进而解决了由于现有的RSS订阅技术用户只能获取到RSS源提供者提供的信息,无法主动的去获取其想要得到的信息提供方造成的订阅源不灵活的技术问题。
此处需要说明的是,上述获取单元702、数据抓取单元704、生成单元706以及推送单元708对应于实施例1中的步骤S202至步骤S206,四个模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例1所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例1提供的计算机终端10中,可以通过软件实现,也可以通过硬件实现。
可选地,所述配置信息还包括:数据格式,该数据格式用于指示需生成的订阅源的格式。
可选地,所述数据源包括网站源、数据库源和/或简易信息聚合RSS源;其中,在所述数据源包括所述网站源的情况下,所述配置信息还包括所述URL对应的正则表达式;在所述数据源包括所述数据库源的情况下,所述配置信息还包括数据库信息以及所述数据的表名,其中,所述数据库信息包括数据库IP、用户名及密码。
可选地,如图8所示,所述数据抓取单元704包括:解析模块802、第一提取模块804、第一查找模块806以及过滤模块808。
其中,解析模块802,用于从所述URL中解析出所述URL所包含的超文本标记语言html;第一提取模块804,用于从所述html中提取出所述html的选择器;第一查找模块806,用于使用所述选择器,查找包含所述html的字段;过滤模块808,用于利用所述正则表达式,过滤查找到的所述包含所述html的字段,得到所述数据。
此处需要说明的是,上述解析模块802、第一提取模块804、第一查找模块806以及过滤模块808对应于实施例1中的步骤S302至步骤S308,四个模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例1所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例1提供的计算机终端10中,可以通过软件实现,也可以通过硬件实现。
可选地,如图9所示,所述数据抓取单元704包括:定位模块902、访问模块904、第二查找模块906以及第二提取模块908。
其中,定位模块902,用于依据所述数据库IP定位目标数据库;访问模块904,用于使用所述用户名及所述密码访问所述目标数据库;第二查找模块906,用于在所述目标数据库中查找到与所述表名对应的表项;第二提取模块908,用于从所述表项中提取出所述URL所指向的所述数据。
此处需要说明的是,上述定位模块902、访问模块904、第二查找模块906以及第二提取模块908对应于实施例1中的步骤S402至步骤S408,四个模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例1所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例1提供的计算机终端10中,可以通过软件实现,也可以通过硬件实现。
可选地,如图10所示,本申请实施例的信息推送装置还包括:第一接收单元1002和处理单元1004。
其中,第一接收单元1002,用于接收并保存用户输入的所述数据源的所述配置信息;处理单元1004,用于生成并向所述用户返回所述订阅源的订阅地址;其中,所述推送单元708用于执行以下步骤推送包含有所述数据的所述订阅源:在所述用户访问所述订阅地址的情况下,向所述用户推送包含有所述数据的所述订阅源。
由此可知,现有技术存在的RSS只能由提供方(例如网站)提供RSS源订阅支持,用户只能获取到RSS源提供者提供的信息,无法主动的去获取其想要得到的信息,比较被动的问题,本申请提出一种基于用户输入的数据源的配置信息生成订阅源的方法,从而向用户推送其想要的订阅源,实现了增加订阅源的灵活性的技术效果。
需要说明的是,上述各个单元是可以通过软件或硬件来实现的,对于后者,可以通过以下方式实现,但不限于此:上述单元均位于同一处理器中;或者,上述各个单元以任意组合的形式分别位于不同的处理器中。
实施例4
根据本申请实施例,还提供了一种用于实施上述方法实施例的装置实施例,本申请上述实施例所提供的装置可以在计算机终端上运行。
图11是根据本申请实施例的信息请求装置的结构示意图。
如图11所示,该信息请求装置可以包括发送单元1102和第二接收单元1104。
其中,发送单元1102,用于将用户输入的数据源的配置信息发送至信息推送装置,其中,所述配置信息至少包括统一资源定位符URL,由所述信息推送装置根据所述URL,抓取所述URL所指向的数据,并生成包含有所述数据的所述订阅源;第二接收单元1104,用于接收所述信息推送装置推送的所述订阅源。
由上可知,本申请上述实施例4所提供的方案,通过根据用户输入的数据源的配置信息,抓取对应的数据,并根据用户设定的数据格式生成订阅源,达到了可以向用户推送其想要的订阅源的目的,从而实现了增加订阅源的灵活性的技术效果,进而解决了由于现有的RSS订阅技术用户只能获取到RSS源提供者提供的信息,无法主动的去获取其想要得到的信息提供方造成的订阅源不灵活的技术问题。
此处需要说明的是,上述发送单元1102和第二接收单元1104对应于实施例2中的步骤S602至步骤S604,两个模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例2所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例2提供的计算机终端10中,可以通过软件实现,也可以通过硬件实现。
可选地,所述配置信息还包括:数据格式,该数据格式用于指示需生成的订阅源的格式。
可选地,如图12所示,本申请实施例的信息请求装置还包括:第三接收单元1202。
其中,第三接收单元1202,用于接收所述信息推送装置返回的所述订阅源的订阅地址;其中,所述第二接收单元1104用于执行以下步骤接收所述信息推送装置推送的所述订阅源:在访问所述订阅地址的情况下,接收所述信息推送装置推送的所述订阅源。
此处需要说明的是,上述第三接收单元1202对应于实施例2中的步骤S10,该模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例2所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例2提供的计算机终端10中,可以通过软件实现,也可以通过硬件实现。
可选地,所述数据源包括网站源、数据库源和/或简易信息聚合RSS源;其中,在所述数据源包括所述网站源的情况下,所述配置信息还包括所述URL对应的正则表达式;在所述数据源包括所述数据库源的情况下,所述配置信息还包括数据库信息以及所述数据的表名,其中,所述数据库信息包括数据库IP、用户名及密码。
由此可知,现有技术存在的RSS只能由提供方(例如网站)提供RSS源订阅支持,用户只能获取到RSS源提供者提供的信息,无法主动的去获取其想要得到的信息,比较被动的问题,本申请提出一种基于用户输入的数据源的配置信息生成订阅源的方法,从而向用户推送其想要的订阅源,实现了增加订阅源的灵活性的技术效果。
实施例5
本申请的实施例还提供了一种存储介质。可选地,在本实施例中,上述存储介质可以用于保存上述实施例1所提供的信息推送方法所执行的程序代码。
可选地,在本实施例中,上述存储介质可以位于计算机网络中计算机终端群中的任意一个计算机终端中,或者位于移动终端群中的任意一个移动终端中。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:获取预先设置的数据源的配置信息,其中,所述配置信息至少包括统一资源定位符URL;根据所述URL,抓取所述URL所指向的数据,并生成包含有所述数据的所述订阅源;推送包含有所述数据的所述订阅源。
可选地,在本实施例中,存储介质还被设置为存储用于执行以下步骤的程序代码:从所述URL中解析出所述URL所包含的超文本标记语言html;从所述html中提取出所述html的选择器;使用所述选择器,查找包含所述html的字段;利用所述正则表达式,过滤查找到的所述包含所述html的字段,得到所述数据。
可选地,在本实施例中,存储介质还被设置为存储用于执行以下步骤的程序代码:依据所述数据库IP定位目标数据库;使用所述用户名及所述密码访问所述目标数据库;在所述目标数据库中查找到与所述表名对应的表项;从所述表项中提取出所述URL所指向的所述数据。
可选地,在本实施例中,存储介质还被设置为存储用于执行以下步骤的程序代码:接收并保存用户输入的所述数据源的所述配置信息;生成并向所述用户返回所述订阅源的订阅地址;其中,所述推送包含有所述数据的所述订阅源包括:在所述用户访问所述订阅地址的情况下,向所述用户推送包含有所述数据的所述订阅源。
实施例6
本申请的实施例还提供了一种存储介质。可选地,在本实施例中,上述存储介质可以用于保存上述实施例2所提供的信息推送方法所执行的程序代码。
可选地,在本实施例中,上述存储介质可以位于计算机网络中计算机终端群中的任意一个计算机终端中,或者位于移动终端群中的任意一个移动终端中。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:将用户输入的数据源的配置信息发送至信息推送装置,其中,所述配置信息至少包括统一资源定位符URL,由所述信息推送装置根据所述URL,抓取所述URL所指向的数据,并生成包含有所述数据的所述订阅源;接收所述信息推送装置推送的所述订阅源。
可选地,在本实施例中,存储介质还被设置为存储用于执行以下步骤的程序代码:接收所述信息推送装置返回的所述订阅源的订阅地址;其中,所述接收所述信息推送装置推送的所述订阅源包括:在访问所述订阅地址的情况下,接收所述信息推送装置推送的所述订阅源。
可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
可选地,本实施例中的具体示例可以参考上述实施例2中所描述的示例,本实施例在此不再赘述。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
在本申请的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的订单信息的处理装置,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
Claims (12)
1.一种信息推送方法,其特征在于,包括:
获取预先设置的数据源的配置信息,其中,所述配置信息至少包括统一资源定位符URL;
根据所述URL,抓取所述URL所指向的数据,并生成包含有所述数据的订阅源;
推送包含有所述数据的所述订阅源。
2.根据权利要求1所述的方法,其特征在于,所述配置信息还包括:数据格式,该数据格式用于指示需生成的订阅源的格式。
3.根据权利要求1所述的方法,其特征在于,所述数据源包括网站源、数据库源和/或简易信息聚合RSS源;其中,
在所述数据源包括所述网站源的情况下,所述配置信息还包括所述URL对应的正则表达式;
在所述数据源包括所述数据库源的情况下,所述配置信息还包括数据库信息以及所述数据的表名,其中,所述数据库信息包括数据库IP、用户名及密码。
4.根据权利要求3所述的方法,其特征在于,在所述数据源包括所述网站源的情况下,所述根据所述URL抓取所述URL所指向的数据包括:
从所述URL中解析出所述URL所包含的超文本标记语言html;
从所述html中提取出所述html的选择器;
使用所述选择器,查找包含所述html的字段;
利用所述正则表达式,过滤查找到的所述包含所述html的字段,得到所述数据。
5.根据权利要求3所述的方法,其特征在于,在所述数据源包括所述数据库源的情况下,所述根据所述URL抓取所述URL所指向的数据包括:
依据所述数据库IP定位目标数据库;
使用所述用户名及所述密码访问所述目标数据库;
在所述目标数据库中查找到与所述表名对应的表项;
从所述表项中提取出所述URL所指向的所述数据。
6.根据权利要求1至5中任一项所述的方法,其特征在于,在所述获取预先设置的数据源的配置信息之前,所述方法还包括:
接收并保存用户输入的所述数据源的所述配置信息;
生成并向所述用户返回所述订阅源的订阅地址;
其中,所述推送包含有所述数据的所述订阅源包括:
在所述用户访问所述订阅地址的情况下,向所述用户推送包含有所述数据的所述订阅源。
7.一种信息推送方法,其特征在于,包括:
将用户输入的数据源的配置信息发送至信息推送装置,其中,所述配置信息至少包括统一资源定位符URL,由所述信息推送装置根据所述URL,抓取所述URL所指向的数据,并生成包含有所述数据的订阅源;
接收所述信息推送装置推送的所述订阅源。
8.根据权利要求7所述的方法,其特征在于,所述配置信息还包括:数据格式,该数据格式用于指示需生成的订阅源的格式。
9.根据权利要求8所述的方法,其特征在于,在所述将用户输入的数据源的配置信息发送至信息推送装置之后,所述接收所述信息推送装置推送的所述订阅源之前,还包括:
接收所述信息推送装置返回的所述订阅源的订阅地址;
其中,所述接收所述信息推送装置推送的所述订阅源包括:
在访问所述订阅地址的情况下,接收所述信息推送装置推送的所述订阅源。
10.根据权利要求7至9中任一项所述的方法,其特征在于,所述数据源包括网站源、数据库源和/或简易信息聚合RSS源;其中,
在所述数据源包括所述网站源的情况下,所述配置信息还包括所述URL对应的正则表达式;
在所述数据源包括所述数据库源的情况下,所述配置信息还包括数据库信息以及所述数据的表名,其中,所述数据库信息包括数据库IP、用户名及密码。
11.一种信息推送装置,其特征在于,包括:
获取单元,用于获取预先设置的数据源的配置信息,其中,所述配置信息至少包括统一资源定位符URL;
数据抓取单元,用于根据所述URL,抓取所述URL所指向的数据;
生成单元,用于生成包含有所述数据的订阅源;
推送单元,用于推送包含有所述数据的所述订阅源。
12.一种信息请求装置,其特征在于,包括:
发送单元,用于将用户输入的数据源的配置信息发送至信息推送装置,其中,所述配置信息至少包括统一资源定位符URL,由所述信息推送装置根据所述URL,抓取所述URL所指向的数据,并生成包含有所述数据的订阅源;
第二接收单元,用于接收所述信息推送装置推送的所述订阅源。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510461423 | 2015-07-30 | ||
CN2015104614238 | 2015-07-30 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106412003A true CN106412003A (zh) | 2017-02-15 |
Family
ID=58004325
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610616483.7A Pending CN106412003A (zh) | 2015-07-30 | 2016-07-29 | 信息推送方法、装置及信息请求装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106412003A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107920018A (zh) * | 2017-11-29 | 2018-04-17 | 链家网(北京)科技有限公司 | 一种实现延迟推送数据的方法、服务器及系统 |
CN108563958A (zh) * | 2018-04-17 | 2018-09-21 | 平安普惠企业管理有限公司 | 角色权限更新方法、装置、计算机设备和存储介质 |
CN109902220A (zh) * | 2019-02-27 | 2019-06-18 | 腾讯科技(深圳)有限公司 | 网页信息获取方法、装置和计算机可读存储介质 |
CN110535904A (zh) * | 2019-07-19 | 2019-12-03 | 浪潮电子信息产业股份有限公司 | 一种异步推送方法、系统及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101420458A (zh) * | 2008-12-09 | 2009-04-29 | 清华大学 | 基于内容分发网络的多媒体内容监控系统、方法及装置 |
CN102110124A (zh) * | 2009-12-24 | 2011-06-29 | 腾讯科技(深圳)有限公司 | 一种rss订阅的方法、装置和系统 |
US20130024921A1 (en) * | 2011-07-21 | 2013-01-24 | Vivek Gupta | Secure on-line sign-up and provisioning for wi-fi hotspots using a device-management protocol |
CN102932197A (zh) * | 2011-08-11 | 2013-02-13 | 阿里巴巴集团控股有限公司 | 一种测试方法及测试系统 |
CN103559304A (zh) * | 2013-11-18 | 2014-02-05 | 北京暴风科技股份有限公司 | 一种定制互联网数据的实现方法及装置 |
-
2016
- 2016-07-29 CN CN201610616483.7A patent/CN106412003A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101420458A (zh) * | 2008-12-09 | 2009-04-29 | 清华大学 | 基于内容分发网络的多媒体内容监控系统、方法及装置 |
CN102110124A (zh) * | 2009-12-24 | 2011-06-29 | 腾讯科技(深圳)有限公司 | 一种rss订阅的方法、装置和系统 |
US20130024921A1 (en) * | 2011-07-21 | 2013-01-24 | Vivek Gupta | Secure on-line sign-up and provisioning for wi-fi hotspots using a device-management protocol |
CN102932197A (zh) * | 2011-08-11 | 2013-02-13 | 阿里巴巴集团控股有限公司 | 一种测试方法及测试系统 |
CN103559304A (zh) * | 2013-11-18 | 2014-02-05 | 北京暴风科技股份有限公司 | 一种定制互联网数据的实现方法及装置 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107920018A (zh) * | 2017-11-29 | 2018-04-17 | 链家网(北京)科技有限公司 | 一种实现延迟推送数据的方法、服务器及系统 |
CN107920018B (zh) * | 2017-11-29 | 2020-10-09 | 贝壳找房(北京)科技有限公司 | 一种实现延迟推送数据的方法、服务器及系统 |
CN108563958A (zh) * | 2018-04-17 | 2018-09-21 | 平安普惠企业管理有限公司 | 角色权限更新方法、装置、计算机设备和存储介质 |
CN108563958B (zh) * | 2018-04-17 | 2022-06-14 | 平安普惠企业管理有限公司 | 角色权限更新方法、装置、计算机设备和存储介质 |
CN109902220A (zh) * | 2019-02-27 | 2019-06-18 | 腾讯科技(深圳)有限公司 | 网页信息获取方法、装置和计算机可读存储介质 |
CN109902220B (zh) * | 2019-02-27 | 2023-11-24 | 腾讯科技(深圳)有限公司 | 网页信息获取方法、装置和计算机可读存储介质 |
CN110535904A (zh) * | 2019-07-19 | 2019-12-03 | 浪潮电子信息产业股份有限公司 | 一种异步推送方法、系统及装置 |
CN110535904B (zh) * | 2019-07-19 | 2022-02-18 | 浪潮电子信息产业股份有限公司 | 一种异步推送方法、系统及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102097881B1 (ko) | 단축 링크를 처리하는 방법 및 장치, 및 단축 링크 서버 | |
CN107003877B (zh) | 应用的上下文深层链接 | |
CN107809383B (zh) | 一种基于mvc的路径映射方法及装置 | |
CN105930528B (zh) | 一种网页缓存的方法及服务器 | |
EP2985705A2 (en) | Webpage access method and apparatus, and router | |
US10262341B2 (en) | Resource downloading method and device | |
CN104283723B (zh) | 网络访问日志处理方法及装置 | |
CN106412003A (zh) | 信息推送方法、装置及信息请求装置 | |
CN107241372A (zh) | 配置信息生成、发送方法及资源加载方法和装置及系统 | |
CN109167840B (zh) | 一种任务推送方法、节点自治服务器及边缘缓存服务器 | |
CN106951557B (zh) | 日志关联方法、装置和应用其的计算机系统 | |
CN106534268B (zh) | 一种数据共享方法及装置 | |
CN103279507A (zh) | 网页爬虫操作方法和系统 | |
US10491606B2 (en) | Method and apparatus for providing website authentication data for search engine | |
CN109359250A (zh) | 统一资源定位符处理方法、装置、服务器及可读存储介质 | |
CN112887451B (zh) | 域名解析方法、装置及计算机设备 | |
CN105162822A (zh) | 一种网站日志数据处理方法及装置 | |
CN111859127A (zh) | 消费数据的订阅方法、装置及存储介质 | |
CN104283865A (zh) | 一种下载处理方法、装置、服务器及客户端设备 | |
JP6302098B2 (ja) | アドレスフィルタリング方法、装置、プログラム及び記録媒体 | |
CN103605770A (zh) | 网页模板生成方法和服务器 | |
CN105786858A (zh) | 信息搜索系统及方法 | |
CN112000866B (zh) | 互联网数据分析方法、装置、电子装置及介质 | |
CN108108381B (zh) | 页面的监测方法及装置 | |
CN115840863A (zh) | 网页内容溯源方法、知识图谱构建方法以及相关设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170215 |
|
RJ01 | Rejection of invention patent application after publication |