CN106446055B - 网页的生成方法及系统 - Google Patents
网页的生成方法及系统 Download PDFInfo
- Publication number
- CN106446055B CN106446055B CN201610799791.8A CN201610799791A CN106446055B CN 106446055 B CN106446055 B CN 106446055B CN 201610799791 A CN201610799791 A CN 201610799791A CN 106446055 B CN106446055 B CN 106446055B
- Authority
- CN
- China
- Prior art keywords
- webpage
- url
- web page
- urls
- new
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/955—Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明适用于互联网技术领域,提供了网页的生成方法及系统,包括:接收用户端上传的统一资源定位符URL集合;对所述URL集合中的URL对应的网页内容进行解析,根据所述解析的结果,对所述网页内容进行分类存储;对分类存储的所述网页内容进行编辑排版,生成新网页,为所述新网页配置URL后返回给所述用户端。本发明使得任何用户可以简单高效地实现自主自动自定义的网页创建,网页生成过程简单、快捷,极大地提高了网络资源的可传播性。
Description
技术领域
本发明属于互联网技术领域,尤其涉及网页的生成方法及系统。
背景技术
随着网络信息时代的到来,越来越多非专业的网络爱好者也存在着自己开发或创建网站的需求,例如,网络用户需要将自己平时在网络上搜集的某一领域内的资源以网页的形式共享给其他用户。
然而,编辑和生成网页内容的工作大多是由计算机专业人士完成,且要求熟练掌握超文本标记语言(HyperText Markup Language,HTML),普通的网络用户若需要创建一个网页,其过程还是相对复杂的,这样便会影响到网络资源的可传播性。
发明内容
有鉴于此,本发明实施例提供了网页的生成方法及系统,以解决现有技术中网页的生成过程相对复杂,影响了网络资源的可传播性的问题。
第一方面,提供了一种网页的生成方法,包括:
接收用户端上传的统一资源定位符URL集合;
对所述URL集合中的URL对应的网页内容进行解析,根据所述解析的结果,对所述网页内容进行分类存储;
对分类存储的所述网页内容进行编辑排版,生成新网页,为所述新网页配置URL后返回给所述用户端。
第二方面,提供了一种网页的生成装置,包括:
接收单元,用于接收用户端上传的统一资源定位符URL集合;
解析单元,用于对所述URL集合中的URL对应的网页内容进行解析,根据所述解析的结果,对所述网页内容进行分类存储;
生成单元,用于对分类存储的所述网页内容进行编辑排版,生成新网页,为所述新网页配置URL后返回给所述用户端。
本发明实施例能够对用户端上传的若干URL的集合进行解析,将URL集合的解析内容进行特征分类,并根据用户需求对URL集合的解析内容进行重新组合,生成全新的URL及对应web网页,使得任何用户可以简单高效地实现自主自动自定义的网页创建,网页生成过程简单、快捷,极大地提高了网络资源的可传播性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的网页的生成方法的实现流程图;
图2是本发明实施例提供的对网页内容进行分类存储的具体实现示例图;
图3是本发明实施例提供的网页的生成方法S103的具体实现流程图;
图4是本发明实施例提供的通过编辑排版生成的新的web网页的示例图;
图5是本发明实施例提供的网页生成方法的实现原理示意图;
图6是本发明实施例提供的网页生成方法的获取来源示意图;
图7是本发明实施例提供的通过搜索引擎来获取URL集合的方法实现原理示意图;
图8是本发明实施例提供的通过浏览器来获取URL集合的方法实现原理示意图;
图9是本发明实施例提供的网页的生成装置的结构框图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。
本发明实施例能够对用户上传的若干URL的集合进行解析,将URL集合的解析内容进行特征分类,并根据用户需求对URL集合的解析内容进行重新组合,生成全新的统一资源定位符(Uniform Resoure Locator,URL)及对应web网页,使得任何用户通过简单的软件程序、搜索引擎及浏览器,就可实现自主自动自定义的网页创建,网页生成过程简单、快捷,极大地提高了网络资源的可传播性。
为了说明本发明所述的技术方案,下面通过具体实施例来进行说明。
图1示出了本发明实施例提供的网页的生成方法的实现流程,详述如下:
在S101中,接收用户端上传的URL集合。
在本发明实施例中,用户端获取URL集合的方式包括但不限于以下三种:
(一)通过浏览器获取URL集合。
该方式下,对URL集合的获取可以通过浏览器本身具备的功能实现,也可以通过浏览器插件来实现,具体地,所述URL集合的来源可以为用户端访问网页的历史记录或收藏夹。例如,当URL集合的来源为用户端访问网页的历史记录时,可以将历史记录中访问率最高的若干URL筛选出来,生成URL集合;又例如,当URL集合的来源为收藏夹时,可以通过遍历收藏夹目录,每个目录生成一个URL集合。
(二)通过搜索引擎获取URL集合。
该方式下,URL集合可以通过一次或多次关键字搜索得到。例如,用户在搜索引擎中通过输入关键字获取到20条搜索结果,那么可以将这20条搜索结果生成URL集合,或者,也可以将这20条搜索结果经过用户手工筛选后,筛选出其中的10条生成URL集合,又或者,也可以由系统后台自动取这20条搜索结果中的前10条生成URL集合;又例如,用户在搜索引擎中,通过输入两组关键字,前后分别获取到10条搜索结果和20条搜索结果,那么可以将这共30条搜索结果生成URL集合,或者,也可以将这30条搜索结果经过用户手工筛选后,筛选出其中的20条生成URL集合,又或者,也可以由系统后台自动取其中10条搜索结果中的前5条,以及其中20条搜索结果中的前10条,生成包含15条URL的URL集合。
(三)通过预设的应用程序获取URL集合
该方式下,URL集合可以由预设的应用程序整合相关URL资源得到,例如,可以为应用程序定期向用户推送的关于某特定领域的URL资源集合,用户通过自行筛选,从中筛选出若干条URL,生成URL集合。
在S102中,对所述URL集合中的URL对应的网页内容进行解析,根据所述解析的结果,对所述网页内容进行分类存储。
远程服务器在接收到用户端上传的URL集合之后,访问这些URL集合中的每条URL,以获取到每条URL对应的网页内容,并对网页内容进行解析,并将解析得到的每条URL对应的网页内容按文字、图片、视频、音频等不同的数据类型分类存储到数据库中。
图2示出了对网页内容进行分类存储的具体实现示例,其中列举了三条不同URL的存储示例,在数据库中,将每条URL对应的网页内容分别解析为图片格式文件、文字格式文件、音频格式文件和视频格式文件等,分别存储到对应文件类型的数据库中,并为不同的文件关联其对应的URL、URL标题、URL内文摘要、网站名称、上传的用户端ID等等。
在S103中,对分类存储的所述网页内容进行编辑排版,生成新网页,为所述新网页配置URL后返回给所述用户端。
在本发明实施例中,当用户存在生成关于URL集合的新网页的需求时,由远程服务器一端对该URL集合对应的分类存储的网页内容进行编辑排版,以生成新的、模板化且格式统一的新网页,并为该新网页配置URL,将该新网页连同配置的URL一同返回给用户端,这样一来,用户无需自行编写网页代码,就可以将自己希望发布或分享的网络资源整合在新网页中,进行发布或分享。
如图3所示,S103中所述对分类存储的所述网页内容进行编辑排版的一种实现方式如下:
S301,获取用户端在所述URL集合中指定的URL。
在用户端,用户可以直接指定整个URL集合,即指定该URL集合中的所有URL,或者,用户也可以在URL集合中进行指定,指定其中的一部分URL。在完成对URL的指定之后,用户端会将指定的URL通知给远程服务器,以使服务器获取到用户端在URL集合中指定的URL。
S302,提取分类存储的所述指定的URL对应的所述网页内容。
在获取到用户端指定的URL之后,远程服务器将之前进行分类存储的这些指定的URL对应的网页内容从数据库中一一提取出来。
S303,加载预设的网页模板。
S304,将提取出的所述网页内容导入所述网页模板中所述指定的URL对应的网页位置。
在本发明实施例中,预设的网页模板实际上为预先编写好的HTML代码,在该HTML代码编写时,在其网页结构中为不同的URL预留了相应的网页内容加载区域,且在同一URL的网页内容加载区域中,为不同类型的网页内容预留了相应的加载位置,因此,在加载预设的网页模板之后,将提取出的网页内容导入到网页模板中,再对HTML代码进行编译,便可以生成新的网页。
图4示出了通过编辑排版生成的新的web网页的示例图,从图4中可以看出,用户端向远程服务器上传包含了URL1~URLN的URL集合,远程服务器对该URL集合对应的网页内容进行解析及分类存储,将通过编辑排版引擎将该URL集合对应的网页内容整合成新网页。该网页对URL1~URLN对应的网页内容进行了分区域显示,且在不同的区域中,网页内容的显示格式都是统一的,显然,通过本发明实施例提供的网页生成方法,能够很好地将用户端收集到的凌乱的URL资源整合成模板化且格式统一的新网页,以帮助非计算机专业的网络用户简单高效地以网页形式发布及分享URL资源,提高了网络资源的可传播性。
进一步地,在远程服务器中,可以存储多套不同风格或表现显示的网页模板,以供用户端进行选择,用户端也可以自行上传网页模板。例如,如图5所示,其中的“用户定义组合”、“图片文字组合”、“音频文字组合”、“视频文字组合”、“图片音频组合”等即代表了用户对网页风格的不同需求,以“图片文字组合”为例,表明用户希望将URL对应的网页内容中的图片和文字部分展现在新网页之中,那么远程服务器在S303中就需要加载适于展示图片和文字的网页模板。网页模板的选择指令可以由用户端在向远程服务器上传URL集合的同时下达,也可以由用户在需要生成新网页时向远程服务器下达,由远程服务器一方负责导入网页内容、编译HTML代码,这样一来,用户可以根据自己的喜好,选择相应的网页模板来生成新网页,实现了网页生成的多样化和风格化。
为了更直观地对本发明实施例提供的网页生成方法进行说明,结合本发明图1对应的实施例,图5示出了该网页生成方法的实现原理示意图;以图5相比,图6中对URL集合的获取来源进行了细化;图7是通过搜索引擎来获取URL集合的方法实现原理示意图;图8是通过浏览器来获取URL集合的方法实现原理示意图。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
对应于上文实施例所述的网页的生成方法,图9示出了本发明实施例提供的网页的生成装置的结构框图,为了便于说明,仅示出了与本实施例相关的部分。
参照图9,该装置包括:
接收单元91,接收用户端上传的统一资源定位符URL集合;
解析单元92,对所述URL集合中的URL对应的网页内容进行解析,根据所述解析的结果,对所述网页内容进行分类存储;
生成单元93,对分类存储的所述网页内容进行编辑排版,生成新网页,为所述新网页配置URL后返回给所述用户端。
可选地,所述URL集合从所述用户端浏览器的历史记录或收藏夹中生成。
可选地,所述URL集合从所述用户端通过搜索引擎获取到的搜索结果中生成。
可选地,所述URL集合从预设的应用程序整合的URL资源中生成。
可选地,所述生成单元包括:
获取子单元,用于获取用户端在所述URL集合中指定的URL;
提取子单元,用于提取分类存储的所述指定的URL对应的所述网页内容;
加载子单元,用于加载预设的网页模板;
导入子单元,用于将提取出的所述网页内容导入所述网页模板中所述指定的URL对应的网页位置。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的系统实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明实施例各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。
Claims (8)
1.一种网页的生成方法,其特征在于,包括:
接收用户端上传的统一资源定位符URL集合;
对所述URL集合中的URL对应的网页内容进行解析,根据所述解析的结果,对所述网页内容进行分类存储;
对分类存储的所述网页内容进行编辑排版,生成新网页,为所述新网页配置URL后返回给所述用户端,其中,将所述新网页连同配置的URL一同返回给所述用户端;
所述对分类存储的所述网页内容进行编辑排版包括:
获取用户端在所述URL集合中指定的URL;
提取分类存储的所述指定的URL对应的所述网页内容;
加载预设的网页模板;
将提取出的所述网页内容导入所述网页模板中所述指定的URL对应的网页位置;
其中,所述预设的网页模板的网页结构中为不同的URL预留了相应的网页内容加载区域,且在同一URL的网页内容加载区域中,为不同类型的网页内容预留了相应的加载位置;
所述预设的网页模板对应于预先编写好的HTML代码;
其中,由远程服务器本方负责向所述网页模板中导入所述网页内容及编译所述HTML代码,生成所述新网页。
2.如权利要求1所述的方法,其特征在于,所述URL集合从所述用户端浏览器的历史记录或收藏夹中生成。
3.如权利要求1所述的方法,其特征在于,所述URL集合从所述用户端通过搜索引擎获取到的搜索结果中生成。
4.如权利要求1所述的方法,其特征在于,所述URL集合从预设的应用程序整合的URL资源中生成。
5.一种网页的生成装置,其特征在于,包括:
接收单元,用于接收用户端上传的统一资源定位符URL集合;
解析单元,用于对所述URL集合中的URL对应的网页内容进行解析,根据所述解析的结果,对所述网页内容进行分类存储;
生成单元,用于对分类存储的所述网页内容进行编辑排版,生成新网页,为所述新网页配置URL后返回给所述用户端,其中,将所述新网页连同配置的URL一同返回给所述用户端;
所述生成单元包括:
获取子单元,用于获取用户端在所述URL集合中指定的URL;
提取子单元,用于提取分类存储的所述指定的URL对应的所述网页内容;
加载子单元,用于加载预设的网页模板;
导入子单元,用于将提取出的所述网页内容导入所述网页模板中所述指定的URL对应的网页位置;
其中,所述预设的网页模板的网页结构中为不同的URL预留了相应的网页内容加载区域,且在同一URL的网页内容加载区域中,为不同类型的网页内容预留了相应的加载位置;
所述预设的网页模板对应于预先编写好的HTML代码;
其中,由远程服务器本方负责向网页模板中导入所述网页内容及编译所述HTML代码,生成所述新网页。
6.如权利要求5所述的装置,其特征在于,所述URL集合从所述用户端浏览器的历史记录或收藏夹中生成。
7.如权利要求5所述的装置,其特征在于,所述URL集合从所述用户端通过搜索引擎获取到的搜索结果中生成。
8.如权利要求5所述的装置,其特征在于,所述URL集合从预设的应用程序整合的URL资源中生成。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610799791.8A CN106446055B (zh) | 2016-08-31 | 2016-08-31 | 网页的生成方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610799791.8A CN106446055B (zh) | 2016-08-31 | 2016-08-31 | 网页的生成方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106446055A CN106446055A (zh) | 2017-02-22 |
CN106446055B true CN106446055B (zh) | 2020-10-30 |
Family
ID=58164587
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610799791.8A Active CN106446055B (zh) | 2016-08-31 | 2016-08-31 | 网页的生成方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106446055B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107918643A (zh) * | 2017-10-30 | 2018-04-17 | 福建天晴数码有限公司 | 一种网页显示方法及终端 |
CN109218395B (zh) * | 2018-08-01 | 2020-05-12 | 阿里巴巴集团控股有限公司 | 缓存页面的分类、获取方法及装置和电子设备 |
CN111104619B (zh) * | 2018-10-25 | 2023-09-26 | 青岛海信移动通信技术有限公司 | 一种收藏文章的方法及移动终端 |
CN112036147B (zh) * | 2020-08-28 | 2024-01-30 | 平安科技(深圳)有限公司 | 将图片转换为网页的方法、装置、计算机设备和存储介质 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101488151B (zh) * | 2009-01-20 | 2010-10-06 | 中国科学院计算技术研究所 | 一种聚合Web站点内容的系统和方法 |
CN103246680B (zh) * | 2012-02-13 | 2016-05-18 | 腾讯科技(深圳)有限公司 | 一种在浏览器中将网页内容聚合展现的方法及装置 |
CN104636400A (zh) * | 2013-11-15 | 2015-05-20 | 腾讯科技(深圳)有限公司 | 浏览器网页生成方法、浏览器及系统 |
CN105677824B (zh) * | 2016-01-04 | 2017-06-20 | 河北秀朗投资有限公司 | 内容流生成及发布系统及其抓取方法 |
-
2016
- 2016-08-31 CN CN201610799791.8A patent/CN106446055B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN106446055A (zh) | 2017-02-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7730409B2 (en) | Method and system for visualizing weblog social network communities | |
US20120197855A1 (en) | Method and Apparatus of Generating Internet Navigation Page | |
US20140089786A1 (en) | Automated Processor For Web Content To Mobile-Optimized Content Transformation | |
CN106446055B (zh) | 网页的生成方法及系统 | |
US10366154B2 (en) | Information processing device, information processing method, and computer program product | |
US20070239674A1 (en) | Method and System for Providing Weblog Author-Defined, Weblog-Specific Search Scopes in Weblogs | |
CN109376291B (zh) | 一种基于网络爬虫的网站指纹信息扫描的方法及装置 | |
US10521474B2 (en) | Apparatus and method for web page access | |
CA2817554A1 (en) | Mobile content management system | |
CN106503211B (zh) | 面向信息发布类网站的移动版自动生成的方法 | |
US20130110818A1 (en) | Profile driven extraction | |
CN111859076B (zh) | 数据爬取方法、装置、计算机设备及计算机可读存储介质 | |
CN104391978A (zh) | 用于浏览器的网页收藏处理方法及装置 | |
KR20170073693A (ko) | 유사 그룹 요소 추출 | |
CN103838862A (zh) | 一种视频搜索的方法、装置及终端 | |
TWI427490B (zh) | 網頁檢視方法及系統,及其電腦程式產品 | |
Zamith | Capturing and analyzing liquid content: A computational process for freezing and analyzing mutable documents | |
US20200073925A1 (en) | Method and system for generating a website from collected content | |
US20160364491A1 (en) | Search results modulator | |
CN106951405B (zh) | 基于排版引擎的数据处理方法及装置 | |
CN105893584A (zh) | 一种显示收藏夹网址标签的方法、客户端和系统 | |
CN108108381B (zh) | 页面的监测方法及装置 | |
KR101282975B1 (ko) | 문서 요소를 분리 구조화하여 표준화한 후 웹페이지를 재구성하는 웹화면 크롭 서버 장치 | |
CN110020054B (zh) | 网页内容爬取方法、装置、计算机设备和存储介质 | |
Geel et al. | Sift: an end-user tool for gathering web content on the go |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |