CN105740435A - 一种基于分布式的文档在线预览设计方法 - Google Patents
一种基于分布式的文档在线预览设计方法 Download PDFInfo
- Publication number
- CN105740435A CN105740435A CN201610069185.0A CN201610069185A CN105740435A CN 105740435 A CN105740435 A CN 105740435A CN 201610069185 A CN201610069185 A CN 201610069185A CN 105740435 A CN105740435 A CN 105740435A
- Authority
- CN
- China
- Prior art keywords
- document
- swf
- management node
- server
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/17—Details of further file system functions
- G06F16/178—Techniques for file synchronisation in file systems
- G06F16/1794—Details of file format conversion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/93—Document management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明属于文档在线预览技术领域,特别涉及一种基于分布式的文档在线预览设计方法。用户在页面点击选择按钮选择需要转换的文档,点击上传按钮将所述文档上传至web服务器,所述web服务器判断该文档的格式,若所述文档为office文档,office转换pdf服务管理节点、pdf转换swf服务管理节点根据算法选出集群中最合适的转换服务器,并分配任务至所述转换服务器,如果该转换服务器处理失败,则文档会进入管理节点再次等待进行处理,如果两次均处理失败,则会记录相应的信息,并将该文档信息保存等待定时任务的再次处理,用户可以在短时间内浏览到已经转换好的文档,增强了用户的体验,而且本发明还具备容错能力。
Description
技术领域
本发明属于文档在线预览技术领域,特别涉及一种基于分布式的文档在线预览设计方法。
背景技术
随着互联网行业的深度发展,每天都会上传、预览大量的文档至系统中,传统文档的浏览包括doc、xls、ppt、docx、pptx、pdf、swf等格式文档,为了实现信息化办公的目的,上传的文档需要转换成swf格式才能够在浏览器端预览。
现有技术通常采用计算机安装文档阅读软件,通过阅读软件打开文件的方式来进行存储和浏览,通常需要安装相应的文档阅读软件,给用户带来不便;还有一些文档通过在线预览方式进行查看,但并不具备快速存储和浏览文件的能力,无法在短时间内将文档转换成swf格式,不具备容错能力。
发明内容
本发明为了克服上述现有技术的不足,提供了一种基于分布式的文档在线预览设计方法,可以在短时间内浏览到已经转换好的文档,具备容错能力,而且能够快速的存储和浏览文件。
为实现上述目的,本发明采用了以下技术措施:
一种基于分布式的文档在线预览设计方法,包括转换文档格式并存储文档、以及浏览文档两个过程,
转换文档格式并存储文档
1)用户在页面点击选择按钮选择需要转换的文档,点击上传按钮将所述文档上传至web服务器;
2)所述web服务器判断该文档的格式,若所述文档为swf格式文档,将swf格式文档存放在ftp服务器,并将swf格式文档地址存入数据库;若所述文档为pdf格式文档,则将该文档地址传送至pdf转换swf服务管理节点;若文档不为swf格式或pdf格式,即所述文档为office文档,则将文档地址传送至office转换pdf服务管理节点;
3)所述文档为office文档,office转换pdf服务管理节点根据算法选择集群中的一台转换服务器,并将所述office文档地址发送至所述转换服务器;
4)所述转换服务器将office文档转换为pdf文档,并将转换成功后的pdf文档存放在ftp服务器,所述转换服务器将office文档地址发送至pdf转换swf服务管理节点;
5)pdf转换swf服务管理节点根据算法选择集群中的一台转换服务器,并将所述office文档地址或pdf格式文档地址传送至所述转换服务器;
6)所述转换服务器将转换的pdf文档或pdf格式文档转换为swf文档,所述pdf转换swf服务管理节点将转换的swf文档存放在ftp服务器,并将office文档地址或pdf格式文档地址更新到数据库中;
浏览文档
7)用户在浏览器上点击查看按钮,web服务器会根据数据库中存储的swf格式文档地址、office文档地址、pdf格式文档地址从ftp服务器中获得需要的文档,并将该文档输送到web浏览器;
8)用户通过安装flash插件可以在浏览器中预览该文档。
优选的,所述office转换pdf服务管理节点和pdf转换swf服务管理节点根据集群中的每一台转换服务器的CPU使用率、内存使用率、以及服务转换成功率选出集群中最合适的转换服务器,并分配任务至所述转换服务器。
优选的,当集群中的任意一台转换服务器在任意时间段内的转换失败率大于百分之八十时,office转换pdf服务管理节点、pdf转换swf服务管理节点将暂停向所述转换服务器分配任务,并且尝试重启所述转换服务器,如果无法重启所述转换服务器则报告管理员。
优选的,当集群中的任意一台转换服务器出现宕机时,office转换pdf服务管理节点、pdf转换swf服务管理节点能够检测出来发生宕机的转换服务器,停止向所述转换服务器发送任务,并报告管理员。
进一步的,当出现文档转换失败时,所述office转换pdf服务管理节点、pdf转换swf服务管理节点会再选择集群中的另外一台转换服务器进行传送,若选择两次后还不成功,则会记录相应的信息,并将该文档信息保存等待定时任务的再次处理。
进一步的,所述ftp服务器在凌晨发送三次定时任务至所述web服务器,所述web服务器再次判断该文档的格式,所述office转换pdf服务管理节点、pdf转换swf服务管理节点会再选择集群中的其余台转换服务器进行传送,发送三次定时任务还未成功则记录相关失败信息和文件并通知管理员。
进一步的,所述定时任务统计上一天文档转换成功和失败的数量,同时还会统计集群中的转换服务器转换成功和失败的数量,并且制作报表以供打印。
本发明的有益效果在于:
1)、本发明中的office转换pdf服务管理节点、pdf转换swf服务管理节点根据算法选出集群中最合适的转换服务器,并分配任务至所述转换服务器,如果该转换服务器处理失败,则文档会进入管理节点再次等待进行处理,如果两次均处理失败,则会记录相应的信息,并将该文档信息保存等待定时任务的再次处理,用户可以在短时间内浏览到已经转换好的文档,增强了用户的体验,而且本发明还具备容错能力。
2)、当集群中的任意一台转换服务器在某段时间内的转换的失败率大于百分之八十时,office转换pdf服务管理节点、pdf转换swf服务管理节点将暂停向所述转换服务器分配任务,并且尝试重启所述转换服务器;集群中的任意一台转换服务器出现宕机时,office转换pdf服务管理节点、pdf转换swf服务管理节点能够检测出来发生宕机的转换服务器,停止向所述转换服务器发送任务,并报告管理员,不仅提高了文档的转换效率,而且能够及时将转换服务器的故障信息报告给管理员,提高了本发明的可靠性。
附图说明
图1为本发明的流程图;
图2为本发明服务之间的数据交换图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,一种基于分布式的文档在线预览设计方法,包括转换文档格式并存储文档、以及浏览文档两个过程,
转换文档格式并存储文档
1)用户在页面点击选择按钮选择需要转换的文档,点击上传按钮将所述文档上传至web服务器;
2)所述web服务器判断该文档的格式,若所述文档为swf格式文档,将swf格式文档存放在ftp服务器,并将swf格式文档地址存入数据库;若所述文档为pdf格式文档,则将该文档地址传送至pdf转换swf服务管理节点;若文档不为swf格式或pdf格式,即所述文档为office文档,则将文档地址传送至office转换pdf服务管理节点;
3)所述文档为office文档,office转换pdf服务管理节点根据算法选择集群中的一台转换服务器,并将所述office文档地址发送至所述转换服务器;
4)office转换pdf服务管理节点将所述office文档转换为pdf文档,所述转换服务器将office文档地址发送至pdf转换swf服务管理节点;
5)pdf转换swf服务管理节点根据算法选择集群中的一台转换服务器,并将所述office文档地址或pdf格式文档地址传送至所述转换服务器;
6)pdf转换swf服务管理节点将转换的pdf文档或pdf格式文档转换为swf文档,所述pdf转换swf服务管理节点将转换的swf文档存放在ftp服务器,并将office文档地址或pdf格式文档地址更新到数据库中;
浏览文档
7)用户在浏览器上点击查看按钮,web服务器会根据数据库中存储的swf格式文档地址、office文档地址、pdf格式文档地址从ftp服务器中获得需要的文档,并将该文档输送到web浏览器;
8)用户通过安装flash插件可以在浏览器中预览该文档。
步骤(1)中会对上传文档的格式进行校验,如果文档不为swf格式、pdf格式,也不为office文档,会提示用户上传的文档不合法,并且禁止用户上传。
当出现文档转换失败时,所述office转换pdf服务管理节点、pdf转换swf服务管理节点会再选择集群中的另外一台转换服务器进行传送,若选择两次后还不成功,则会记录相应的信息,并将该文档信息保存等待定时任务的再次处理。
如图1所示,转换服务器会将转换失败后的文档信息存入数据库中,所述ftp服务器在凌晨发送三次定时任务至所述web服务器,所述web服务器再次判断该文档的格式,所述office转换pdf服务管理节点、pdf转换swf服务管理节点会再选择集群中的其余台转换服务器进行传送,发送三次定时任务转换还未成功,系统将是否扫描字段置为true、是否成功字段置为false,如果最终转换成功,将是否扫描、是否成功字段均置为true。
所述定时任务统计上一天文档转换成功和失败的数量,同时还会统计集群中的转换服务器转换成功和失败的数量,并且制作报表以供打印。
如图2所示,搭建服务的步骤包括:首先需要搭建web服务,由于整个转换的输入和输出都是基于web服务的,web服务是基础服务;其次搭建office转换pdf的集群管理节点和office转换pdf的集群环境,接着是pdf转换swf的集群管理节点和pdf转换swf的集群环境;最后是搭建ftp服务,存储所有上传和转换成功的文档。
如图2所示,所述office转换pdf服务管理节点、pdf转换swf服务管理节点均能够监控每一个转换服务器的CPU使用情况、内存使用率、以及服务转换成功率,并经过算法选出集群中最合适的转换服务器,分配任务至所述转换服务器,所述转换服务器从ftp服务器上下载文档,文档格式转换成功后再上传转换后的文档至ftp服务器。
综上所述,本发明由用户在页面点击选择按钮选择需要转换的文档,点击上传按钮将所述文档上传至web服务器,若所述文档为swf格式文档,将swf格式文档存放在ftp服务器,并将swf格式文档地址存入数据库;若所述文档为pdf格式文档,则将该文档地址传送至pdf转换swf服务管理节点;若文档不为swf格式或pdf格式,则将文档地址传送至office转换pdf服务管理节点;office转换pdf服务管理节点接收文档地址之后会放入队列中,然后根据算法找出最空闲的转换服务器,发送至所述转换服务器进行转换,若所述转换服务器处理失败,则文档再次进入office转换pdf服务管理节点再次等待任务的分配,如果两次都是失败,则会记录相应的信息,并将该文档信息保存等待定时任务的再次处理;如果处理成功,转换成功后的pdf文档会被推送到pdf转换swf服务管理节点的队列中,所述pdf转换swf服务管理节点根据算法找出最空闲的服务节点,发送给转换服务器进行处理,如果所述转换服务器处理失败,pdf文档会进入pdf转换swf服务管理节点再次等待任务的分配,如果两次都是失败,则会记录相应的信息,并将该文档信息保存等待定时任务的再次处理;如果成功,则会将转换成功的swf文档存放在ftp服务器,用户通过安装flash插件实现在线预览。通过分布式处理,文档可以在较短的时间内完成转换,在用户点击上传之后再点击查看,浏览器会迅速响应,用户将会在较短的时间内看到已经转换好的文档,增强了用户的体验效果。
Claims (7)
1.一种基于分布式的文档在线预览设计方法,包括转换文档格式并存储文档、以及浏览文档两个过程,其特征在于:
转换文档格式并存储文档
1)用户在页面点击选择按钮选择需要转换的文档,点击上传按钮将所述文档上传至web服务器;
2)所述web服务器判断该文档的格式,若所述文档为swf格式文档,将swf格式文档存放在ftp服务器,并将swf格式文档地址存入数据库;若所述文档为pdf格式文档,则将该文档地址传送至pdf转换swf服务管理节点;若文档不为swf格式或pdf格式,即所述文档为office文档,则将文档地址传送至office转换pdf服务管理节点;
3)所述文档为office文档,office转换pdf服务管理节点根据算法选择集群中的一台转换服务器,并将所述office文档地址发送至所述转换服务器;
4)所述转换服务器将office文档转换为pdf文档,并将转换成功后的pdf文档存放在ftp服务器,所述转换服务器将office文档地址发送至pdf转换swf服务管理节点;
5)pdf转换swf服务管理节点根据算法选择集群中的一台转换服务器,并将所述office文档地址或pdf格式文档地址传送至所述转换服务器;
6)所述转换服务器将转换的pdf文档或pdf格式文档转换为swf文档,所述pdf转换swf服务管理节点将转换的swf文档存放在ftp服务器,并将office文档地址或pdf格式文档地址更新到数据库中;
浏览文档
7)用户在浏览器上点击查看按钮,web服务器会根据数据库中存储的swf格式文档地址、office文档地址、pdf格式文档地址从ftp服务器中获得需要的文档,并将该文档输送到web浏览器;
8)用户通过安装flash插件可以在浏览器中预览该文档。
2.如权利要求1所述的一种基于分布式的文档在线预览设计方法,其特征在于:所述office转换pdf服务管理节点和pdf转换swf服务管理节点根据集群中的每一台转换服务器的CPU使用率、内存使用率、以及服务转换成功率选出集群中最合适的转换服务器,并分配任务至所述转换服务器。
3.如权利要求1所述的一种基于分布式的文档在线预览设计方法,其特征在于:当集群中的任意一台转换服务器在任意时间段内的转换失败率大于百分之八十时,office转换pdf服务管理节点、pdf转换swf服务管理节点将暂停向所述转换服务器分配任务,并且尝试重启所述转换服务器,如果无法重启所述转换服务器则报告管理员。
4.如权利要求1所述的一种基于分布式的文档在线预览设计方法,其特征在于:当集群中的任意一台转换服务器出现宕机时,office转换pdf服务管理节点、pdf转换swf服务管理节点能够检测出来发生宕机的转换服务器,停止向所述转换服务器发送任务,并报告管理员。
5.如权利要求1所述的一种基于分布式的文档在线预览设计方法,其特征在于:当出现文档转换失败时,所述office转换pdf服务管理节点、pdf转换swf服务管理节点会再选择集群中的另外一台转换服务器进行传送,若选择两次后还不成功,则会记录相应的信息,并将该文档信息保存等待定时任务的再次处理。
6.如权利要求1所述的一种基于分布式的文档在线预览设计方法,其特征在于:所述ftp服务器在凌晨发送三次定时任务至所述web服务器,所述web服务器再次判断该文档的格式,所述office转换pdf服务管理节点、pdf转换swf服务管理节点会再选择集群中的其余台转换服务器进行传送,发送三次定时任务还未成功则记录相关失败信息和文件并通知管理员。
7.如权利要求6所述的一种基于分布式的文档在线预览设计方法,其特征在于:所述定时任务统计上一天文档转换成功和失败的数量,同时还会统计集群中的转换服务器转换成功和失败的数量,并且制作报表以供打印。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610069185.0A CN105740435A (zh) | 2016-01-28 | 2016-01-28 | 一种基于分布式的文档在线预览设计方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610069185.0A CN105740435A (zh) | 2016-01-28 | 2016-01-28 | 一种基于分布式的文档在线预览设计方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105740435A true CN105740435A (zh) | 2016-07-06 |
Family
ID=56242045
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610069185.0A Pending CN105740435A (zh) | 2016-01-28 | 2016-01-28 | 一种基于分布式的文档在线预览设计方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105740435A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106844453A (zh) * | 2016-12-20 | 2017-06-13 | 江苏瀚远科技股份有限公司 | 一种电子文件格式转换方法 |
CN107515945A (zh) * | 2017-08-30 | 2017-12-26 | 四川长虹电器股份有限公司 | 一种在网页中预览文档的方法 |
CN109558554A (zh) * | 2018-12-11 | 2019-04-02 | 浪潮(北京)电子信息产业有限公司 | 一种基于分布式对象存储系统的文档在线预览方法 |
CN113111281A (zh) * | 2020-01-13 | 2021-07-13 | 长沙市海图科技有限公司 | 一种dwg图纸预览服务化方法、系统及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009105708A2 (en) * | 2008-02-22 | 2009-08-27 | Tigerlogic Corporation | Systems and methods of identifying chunks within multiple documents |
CN101833567A (zh) * | 2010-03-31 | 2010-09-15 | 北京志腾新诺科技有限公司 | 文档转换方法、装置及系统 |
CN102254005A (zh) * | 2011-07-15 | 2011-11-23 | 苏州阔地网络科技有限公司 | 一种在网页上实现的文档转换显示方法 |
US20120101623A1 (en) * | 2010-10-22 | 2012-04-26 | Best Wise International Computing Co., Ltd. | Encryption Method of Digital Data, Decryption Method of Encrypted Digital Data, Manufacturing System of Storage Apparatus and Manufacturing Method Thereof |
CN104090862A (zh) * | 2014-07-16 | 2014-10-08 | 山东大学 | 一种基于lnmp的网盘多类型文件在线预览方法 |
-
2016
- 2016-01-28 CN CN201610069185.0A patent/CN105740435A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009105708A2 (en) * | 2008-02-22 | 2009-08-27 | Tigerlogic Corporation | Systems and methods of identifying chunks within multiple documents |
CN101833567A (zh) * | 2010-03-31 | 2010-09-15 | 北京志腾新诺科技有限公司 | 文档转换方法、装置及系统 |
US20120101623A1 (en) * | 2010-10-22 | 2012-04-26 | Best Wise International Computing Co., Ltd. | Encryption Method of Digital Data, Decryption Method of Encrypted Digital Data, Manufacturing System of Storage Apparatus and Manufacturing Method Thereof |
CN102254005A (zh) * | 2011-07-15 | 2011-11-23 | 苏州阔地网络科技有限公司 | 一种在网页上实现的文档转换显示方法 |
CN104090862A (zh) * | 2014-07-16 | 2014-10-08 | 山东大学 | 一种基于lnmp的网盘多类型文件在线预览方法 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106844453A (zh) * | 2016-12-20 | 2017-06-13 | 江苏瀚远科技股份有限公司 | 一种电子文件格式转换方法 |
CN106844453B (zh) * | 2016-12-20 | 2020-09-08 | 江苏瀚远科技股份有限公司 | 一种电子文件格式转换方法 |
CN107515945A (zh) * | 2017-08-30 | 2017-12-26 | 四川长虹电器股份有限公司 | 一种在网页中预览文档的方法 |
CN109558554A (zh) * | 2018-12-11 | 2019-04-02 | 浪潮(北京)电子信息产业有限公司 | 一种基于分布式对象存储系统的文档在线预览方法 |
CN113111281A (zh) * | 2020-01-13 | 2021-07-13 | 长沙市海图科技有限公司 | 一种dwg图纸预览服务化方法、系统及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107729366B (zh) | 一种普适多源异构大规模数据同步系统 | |
US20160057201A1 (en) | File Uploading Method, Client, and Application Server in Cloud Storage, and Cloud Storage System | |
CN104462534B (zh) | 网络信息分享方法和装置 | |
CN108052675A (zh) | 日志管理方法、系统及计算机可读存储介质 | |
WO2021190087A1 (zh) | 任务执行方法、装置、系统和服务器 | |
CN105740435A (zh) | 一种基于分布式的文档在线预览设计方法 | |
US20130173540A1 (en) | Gathering transaction data associated with locally stored data files | |
CN104125163B (zh) | 一种数据处理方法、装置及终端 | |
US20100037225A1 (en) | Workload routing based on greenness conditions | |
CN102868765A (zh) | 文件上传方法和系统 | |
WO2017215646A1 (zh) | 数据传输方法和装置 | |
CN104348859B (zh) | 文件同步方法、装置、服务器、终端及系统 | |
CN102111301A (zh) | 一种通用文件传输系统及其实现方法 | |
WO2017174026A1 (zh) | 一种客户端连接方法及系统 | |
CN112615907A (zh) | 一种数据同步系统及方法 | |
CN103347092A (zh) | 一种识别缓存文件的方法及装置 | |
CN110147470B (zh) | 一种跨机房数据比对系统及方法 | |
WO2015035897A1 (en) | Search methods, servers, and systems | |
CN112422497B (zh) | 消息传递方法、装置及计算机设备 | |
CN111541555A (zh) | 群聊优化方法及相关产品 | |
CN113014608B (zh) | 一种流量分发控制方法、装置、电子设备及存储介质 | |
CN103401933A (zh) | 一种资源信息和对应资源文件批量上传的方法和系统 | |
CN104462562A (zh) | 一种基于数据仓库自动化的数据迁移系统及方法 | |
KR20140016249A (ko) | 간헐적으로 접속된 이동 이메일 클라이언트 상의 대화 캐시에 새로운 메시지들의 최소 세트를 전달하기 위한 경량-가중치 방법 | |
CN109905479B (zh) | 文件传输方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20160706 |
|
RJ01 | Rejection of invention patent application after publication |