CN102063501A - 一种互联网网页转换的方法及装置 - Google Patents

一种互联网网页转换的方法及装置 Download PDF

Info

Publication number
CN102063501A
CN102063501A CN2011100010457A CN201110001045A CN102063501A CN 102063501 A CN102063501 A CN 102063501A CN 2011100010457 A CN2011100010457 A CN 2011100010457A CN 201110001045 A CN201110001045 A CN 201110001045A CN 102063501 A CN102063501 A CN 102063501A
Authority
CN
China
Prior art keywords
web page
internet web
content
data structure
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2011100010457A
Other languages
English (en)
Other versions
CN102063501B (zh
Inventor
罗敏
吕倩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201110001045.7A priority Critical patent/CN102063501B/zh
Publication of CN102063501A publication Critical patent/CN102063501A/zh
Application granted granted Critical
Publication of CN102063501B publication Critical patent/CN102063501B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)

Abstract

本发明揭示了一种互联网网页转换的方法,包括:获取互联网网页的内容及交互规则;整理所述内容及交互规则为相应的数据结构;根据所述数据结构和对应的模板生成新媒体页面。本发明还提出了相应的装置。本发明提出的一种互联网网页转换的方法及装置,通过对互联网网页交互规则进行分析处理,转换为适用于新媒体平台的互动机制,实现了互联网网站互动功能的转换。

Description

一种互联网网页转换的方法及装置
技术领域
本发明涉及到网络领域,特别涉及到一种互联网网页转换的方法及装置。
背景技术
随着各种手机、ipad和iptv等新媒体平台的出现和发展,特别是移动终端的智能化,通过多种渠道获取资讯已经成为趋势,建设新媒体平台目前有两种方式,一种是重新建立新媒体平台,建设成本高;一种是将现有的互联网网站转换成新媒体平台,目前的转换方法通常如下:通过数据抓取系统自动获取互联网网页,对互联网网页进行自动分析,然后将手机网站无法使用的代码及可使用的代码进行分离:可使用代码进行自动简化压缩和分析转换,无法使用代码进行分类保存。上述转换方法存在三个缺陷,第一、没有对互联网网站的交互规则进行转换,使用户无法在新媒体平台上实现互联网网站上的互动功能,只能查看一些静态数据;第二,无法对新媒体平台的新媒体页面进行自定义修改,平台创建者无法自由修改页面的展现形式和模板内容。第三,由于中间处理环节过多,造成新媒体平台访问速度比较缓慢。
发明内容
本发明的主要目的为提供一种互联网网页转换的方法及装置,实现将互联网的网页交互功能完整移植到新媒体平台上。
本发明提出一种互联网网页转换的方法,包括:
获取互联网网页的内容及交互规则;
整理所述内容及交互规则为相应的数据结构;
根据所述数据结构和对应的模板生成新媒体页面。
优选地,所述根据数据结构和对应的模板生成新媒体页面包括:
截取用户请求;
根据用户请求查找对应的模板、数据结构和数据内容;
结合所述模块、数据结构和数据内容,得到新媒体页面。
优选地,所述根据用户请求查找对应的模板、数据结构和数据内容包括:
提取所述模板中的标签树和对应的数据环境;
根据标签树和对应的数据环境通过递归方式从预设的W2W内容库和/或互联网网页中采集所述数据内容。
优选地,在执行所述整理内容及交互规则为相应的数据结构之后,包括:
存储所述数据结构至预设的W2W内容库。
优选地,在获取互联网网页的内容及交互规则之前,包括:
获取互联网网页的静态数据,并存储至预设的W2W内容库。
优选地,在执行所述根据数据结构和对应的模板生成新媒体页面之前,包括:
设置所述模板。
本发明还提出一种互联网网页转换的装置,包括:
获取模块,用于获取互联网网页的内容及交互规则;
整理模块,用于整理所述内容及交互规则为相应的数据结构;
生成模块,用于根据所述数据结构和对应的模板生成新媒体页面。
优选地,所述生成模块包括:
截取单元,用于截取用户请求;
查找单元,用于根据用户请求查找对应的模板、数据结构和数据内容;
结合单元,用于结合所述模块、数据结构和数据内容,得到新媒体页面
优选地,所述查找单元包括:
查找子单元,用于提取所述模板中的标签树和对应的数据环境;
采集子单元,用于根据标签树和对应的数据环境通过递归方式从预设的W2W内容库和/或互联网网页中采集所述数据内容。
优选地,互联网网页转换的装置还包括:
第一存储模块,用于存储所述数据结构至预设的W2W内容库。
优选地,互联网网页转换的装置还包括:
第二存储模块,用于获取互联网网页的静态数据,并存储至预设的W2W内容库。
优选地,互联网网页转换的装置还包括:
设置模块,用于设置所述模块。
本发明提出的一种互联网网页转换的方法及装置,通过对互联网网页交互规则进行分析处理,转换为适用于新媒体平台的互动机制,实现了互联网网站互动功能的转换。
附图说明
图1为本发明互联网网页转换的方法一实施例的流程示意图;
图2为本发明互联网网页转换的方法一实施例中转换交互规则的流程示意图;
图3为本发明互联网网页转换的方法一实施例中生成手机网页的流程示意图;
图4为本发明互联网网页转换的方法又一实施例的流程示意图;
图5为本发明互联网网页转换的装置一实施例的结构示意图;
图6为本发明互联网网页转换的装置一实施例中生成模块的结构示意图;
图7为本发明互联网网页转换的装置一实施例中查找单元的结构示意图;
图8为本发明互联网网页转换的装置又一实施例的结构示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
参照图1,提出本发明一种互联网网页转换的方法一实施例,包括:
步骤S101,获取互联网网页的内容及交互规则;
用户首先设置一互联网网页转换的装置,该装置可作为中间件与互联网网站连接,或内置于互联网网站。互联网网页转换的装置将初步处理后的互联网网页内容作进一步处理,初步处理包括:通过预设的W2W抓取系统自动获取互联网网页内容,并将互联网网页内容中无法使用的代码和可使用的代码进行分离,将可使用代码进行简化压缩和分析转换,无法使用代码进行分类保存。通过初步处理后互联网网页转换的装置进一步获取互联网网页的交互规则,该交互规则通常使用JS或AJAX技术编写,无法保证在新媒体平台中实现,需要进一步进行分析处理。上述新媒体平台包括但不仅限于手机平台、ipad平台或iptv平台,其它区别于报刊、户外、广播电视四大传统意义上的媒体均适用。
步骤S102,整理内容及交互规则为相应的数据结构;
互联网网页转换的装置将互联网网页内容及交互规则整理为相应的数据结构,该数据结构包括字段、表格或枚举等类型。
步骤S103,根据数据结构和对应的模板生成新媒体页面。
结合上述数据结构和对应的模板生成新媒体页面,新媒体页面可以是手机页面、ipad页面或iptv页面,终端可通过该新媒体页面实现原互联网各种应用功能。模板为预设设置,可针对不同终端或不同浏览器定制。
本发明提出的一种互联网网页转换的方法,通过对互联网网页内容及交互规则进行分析处理,转换为适用于新媒体平台的互动机制,实现了互联网网页互动功能的转换。
参照图2,在本发明一种互联网网页转换的方法一实施例中,步骤S103可包括:
步骤S1031,截取用户请求;
步骤S1032,根据用户请求查找对应的模板、数据结构和数据内容;
步骤S1033,结合模块、数据结构和数据内容,得到新媒体页面。
用户向手机网站等新媒体平台发出请求,互联网网页转换的装置接收用户请求后,内部寻址目标请求的模板、数据结构和数据内容。当存在现成的缓存数据内容,互联网网页转换的装置将数据与模板进行组合直接输出给用户,当不存在现成的缓存数据,互联网网页转换的装置通过预设的W2W抓取系统实时从互联网端采集数据并存储、展示给用户。
参照图3,在本发明一种互联网网页转换的方法一实施例中,步骤S1032可包括:
步骤S10321,提取模板中的标签树和对应的数据环境;
步骤S10322,根据标签树和对应的数据环境通过递归方式从预设的W2W内容库和/或互联网网页中采集数据内容。
互联网网页转换的装置根据标签树和数据环境,通过递归的方式让每个标签根据数据环境输出展示代码。
参照图4,提出本发明一种互联网网页转换的方法又一实施例,在一实施例中,在执行步骤S101之前,包括:
步骤S99,设置模板。
步骤S100,获取互联网网页的静态数据,并存储至预设的W2W内容库。
在执行步骤S102之后,包括:
步骤S1021,存储数据结构至预设的W2W内容库。
互联网网页转换的装置将初步处理后的静态数据及交互规则的数据结构存储至一预设的W2W内容库。
本实施例在一实施例的基础上,根据不同终端及浏览器定制模板,且将处理后的静态数据和用于互动的数据结构存储在预设的W2W内容库中,在用户请求时,可即时将模板与W2W内容库中对应的数据相结合,在一实施例的基础上,提高了新媒体平台的反应速度并优化的用户体验。
参照图5,提出本发明一种互联网网页转换的装置一实施例,包括:
获取模块10,用于获取互联网网页的内容及交互规则;
整理模块20,用于整理内容及交互规则为相应的数据结构;
生成模块30,用于根据数据结构和对应的模板生成新媒体页面。
互联网网页转换的装置可作为中间件与互联网网站连接,或内置于互联网网站。互联网网页转换的装置将初步处理后的互联网网页内容作进一步处理,初步处理包括:通过预设的W2W抓取系统自动获取互联网网页内容,并将互联网网页内容中无法使用的代码和可使用的代码进行分离,将可使用代码进行简化压缩和分析转换,无法使用代码进行分类保存。通过初步处理后获取模块10进一步获取互联网网页的交互规则,该交互规则通常使用JS或AJAX技术编写,无法保证在新媒体平台在手机网中实现,需要进一步进行分析处理。上述新媒体平台包括但不仅限于手机平台、ipad平台或iptv平台,其它区别于报刊、户外、广播电视四大传统意义上的媒体均适用。
整理模块20将互联网网页内容及交互规则整理为相应的数据结构,该数据结构包括字段、表格或枚举等类型。
生成模块30结合上述数据结构和对应的模板生成新媒体页面,新媒体页面可以是手机页面、ipad页面或iptv页面,终端可通过该新媒体页面实现原互联网各种应用功能。模板为预设设置,可针对不同终端或不同浏览器定制。
本发明提出的一种互联网网页转换的装置,通过对互联网网页内容及交互规则进行分析处理,转换为适用于新媒体平台的互动机制,实现了互联网网页互动功能的转换。
参照图6,在本发明一种互联网网页转换的装置一实施例中,生成模块30包括:
接收单元31,用于截取用户请求;
查找单元32,用于根据用户请求查找对应的模板、数据结构和数据内容;
结合单元33,用于结合模块、数据结构和数据内容,得到新媒体页面。
用户向手机网站等新媒体平台发出请求,接收单元31接收用户请求后,查找单元32内部寻址目标请求的模板、数据结构和数据内容。当存在现成的缓存数据内容,结合单元33将数据与模板进行组合直接输出给用户,当不存在现成的缓存数据,结合单元33通过预设的W2W抓取系统实时从互联网端采集数据并存储、展示给用户。
参照图7,查找单元32包括:
查找子单元321,用于提取模板中的标签树和对应的数据环境;
采集子单元322,用于根据标签树和对应的数据环境通过递归方式从预设的W2W内容库和/或互联网网页中采集数据内容。
参照图8,提出本发明一种互联网网页转换的装置又一实施例,在互联网网页转换的装置一实施例中,还包括:
设置模块40,用于设置模块。
第一存储模块50,用于存储数据结构至预设的W2W内容库。
第二存储模块60,用于获取互联网网页的静态数据,并存储至预设的W2W内容库。
第一存储模块50将初步处理后的静态数据存储至一预设的W2W内容库,第二存储模块60将处理后的数据结构存储至该预设的W2W内容库。
本实施例在一实施例的基础上,根据不同终端及浏览器定制模板,且将处理后的静态数据和用于互动的数据结构存储在预设的W2W内容库中,在用户请求时,可即时将模板与W2W内容库中对应的数据相结合,在一实施例的基础上,提高了新媒体平台的反应速度并优化的用户体验。
以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (12)

1.一种互联网网页转换的方法,其特征在于,包括:
获取互联网网页的内容及交互规则;
整理所述内容及交互规则为相应的数据结构;
根据所述数据结构和对应的模板生成新媒体页面。
2.如权利要求1所述的互联网网页转换的方法,其特征在于,所述根据数据结构和对应的模板生成新媒体页面包括:
截取用户请求;
根据用户请求查找对应的模板、数据结构和数据内容;
结合所述模块、数据结构和数据内容,得到新媒体页面。
3.如权利要求2所述的互联网网页转换的方法,其特征在于,所述根据用户请求查找对应的模板、数据结构和数据内容包括:
提取所述模板中的标签树和对应的数据环境;
根据标签树和对应的数据环境通过递归方式从预设的W2W内容库和/或互联网网页中采集所述数据内容。
4.如权利要求1至3中任一项所述的互联网网页转换的方法,其特征在于,在执行所述整理内容及交互规则为相应的数据结构之后,包括:
存储所述数据结构至预设的W2W内容库。
5.如权利要求1至3中任一项所述的互联网网页转换的方法,其特征在于,在获取互联网网页的内容及交互规则之前,包括:
获取互联网网页的静态数据,并存储至预设的W2W内容库。
6.如权利要求1至3中任一项所述的互联网网页转换的方法,其特征在于,在执行所述根据数据结构和对应的模板生成新媒体页面 之前,包括:
设置所述模板。
7.一种互联网网页转换的装置,其特征在于,包括:
获取模块,用于获取互联网网页的内容及交互规则;
整理模块,用于整理所述内容及交互规则为相应的数据结构;
生成模块,用于根据所述数据结构和对应的模板生成新媒体页面。
8.如权利要求7所述的互联网网页转换的装置,其特征在于,所述生成模块包括:
截取单元,用于截取用户请求;
查找单元,用于根据用户请求查找对应的模板、数据结构和数据内容;
结合单元,用于结合所述模块、数据结构和数据内容,得到新媒体页面。
9.如权利要求8所述的互联网网页转换的装置,其特征在于,所述查找单元包括:
查找子单元,用于提取所述模板中的标签树和对应的数据环境;
采集子单元,用于根据标签树和对应的数据环境通过递归方式从预设的W2W内容库和/或互联网网页中采集所述数据内容。
10.如权利要求6至8所述的联网转换手机网的装置,其特征在于,还包括:
第一存储模块,用于存储所述数据结构至预设的W2W内容库。
11.如权利要求6至8所述的联网转换手机网的装置,其特征在于,还包括:
第二存储模块,用于获取互联网网页的静态数据,并存储至预设的W2W内容库。 
12.如权利要求6至8所述的联网转换手机网的装置,其特征在于,还包括:
设置模块,用于设置所述模块。 
CN201110001045.7A 2011-01-05 2011-01-05 一种互联网网页转换的方法及装置 Expired - Fee Related CN102063501B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110001045.7A CN102063501B (zh) 2011-01-05 2011-01-05 一种互联网网页转换的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110001045.7A CN102063501B (zh) 2011-01-05 2011-01-05 一种互联网网页转换的方法及装置

Publications (2)

Publication Number Publication Date
CN102063501A true CN102063501A (zh) 2011-05-18
CN102063501B CN102063501B (zh) 2014-04-16

Family

ID=43998776

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110001045.7A Expired - Fee Related CN102063501B (zh) 2011-01-05 2011-01-05 一种互联网网页转换的方法及装置

Country Status (1)

Country Link
CN (1) CN102063501B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102915361A (zh) * 2012-10-18 2013-02-06 北京理工大学 一种基于文字分布特征的网页正文提取方法
CN105955946A (zh) * 2016-05-18 2016-09-21 平安科技(深圳)有限公司 电子文件的流转方法和系统
CN106686133A (zh) * 2017-02-09 2017-05-17 北京奇虎科技有限公司 一种跨平台交互方法和装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101039357A (zh) * 2006-03-17 2007-09-19 陈晓月 一种手机浏览现有网站的方法
CN101815093A (zh) * 2010-03-11 2010-08-25 深圳市嘉讯软件有限公司 一种网页到移动终端的适配方法及移动终端页面适配装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101039357A (zh) * 2006-03-17 2007-09-19 陈晓月 一种手机浏览现有网站的方法
CN101815093A (zh) * 2010-03-11 2010-08-25 深圳市嘉讯软件有限公司 一种网页到移动终端的适配方法及移动终端页面适配装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102915361A (zh) * 2012-10-18 2013-02-06 北京理工大学 一种基于文字分布特征的网页正文提取方法
CN102915361B (zh) * 2012-10-18 2015-03-11 北京理工大学 一种基于文字分布特征的网页正文提取方法
CN105955946A (zh) * 2016-05-18 2016-09-21 平安科技(深圳)有限公司 电子文件的流转方法和系统
CN105955946B (zh) * 2016-05-18 2018-06-01 平安科技(深圳)有限公司 电子文件的流转方法和系统
CN106686133A (zh) * 2017-02-09 2017-05-17 北京奇虎科技有限公司 一种跨平台交互方法和装置
WO2018145527A1 (zh) * 2017-02-09 2018-08-16 北京奇虎科技有限公司 跨平台交互方法、装置、程序及介质
CN106686133B (zh) * 2017-02-09 2020-07-14 北京奇虎科技有限公司 一种跨平台交互方法和装置

Also Published As

Publication number Publication date
CN102063501B (zh) 2014-04-16

Similar Documents

Publication Publication Date Title
CN103514299B (zh) 信息搜索方法和装置
CN103885987B (zh) 一种音乐推荐方法和系统
US10515142B2 (en) Method and apparatus for extracting webpage information
CN102708174B (zh) 一种浏览器中的富媒体信息的展示方法和装置
CN105631707A (zh) 基于决策树的广告点击率预估方法与应用推荐方法及装置
CN103699669B (zh) 一种浏览器中进行消息推送的方法和一种浏览器终端
KR101753762B1 (ko) 자동 기사 생성을 위한 로봇 저널리즘 시스템 및 방법
CN104423621A (zh) 拼音字符串处理方法和装置
CN107071554B (zh) 语义识别方法和装置
CN103440243A (zh) 一种教学资源推荐方法及其装置
CN102855248A (zh) 一种用户特征信息的确定方法、装置及系统
CN102930017A (zh) 一种用于在移动终端上提供搜索结果的方法和设备
US20130305131A1 (en) Method, system and computer storage medium for pre-reading network data
CN101114284B (zh) 一种显示网页内容相关信息的方法及系统
CN105868225A (zh) 数据查询的方法、客户端、服务器及系统
CN104503988A (zh) 搜索方法及装置
CN108140055A (zh) 触发应用信息
CN109948044A (zh) 基于向量最近邻搜索的文档查询
CN102117331A (zh) 视频搜索方法及系统
CN109814868A (zh) 网络传输模拟方法、装置、计算机设备及存储介质
CN104267974B (zh) 业务接口的调用方法及装置
CN102063501B (zh) 一种互联网网页转换的方法及装置
CN103020263A (zh) 一种网页信息的保存方法、装置及终端
CN101354706A (zh) 一种收集网页信息的方法及装置
CN114547514A (zh) 组件动态渲染方法、装置、设备及介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20140416

Termination date: 20220105

CF01 Termination of patent right due to non-payment of annual fee