CN103309627A - 基于打印驱动的文件双层转换方法 - Google Patents

基于打印驱动的文件双层转换方法 Download PDF

Info

Publication number
CN103309627A
CN103309627A CN2012100576712A CN201210057671A CN103309627A CN 103309627 A CN103309627 A CN 103309627A CN 2012100576712 A CN2012100576712 A CN 2012100576712A CN 201210057671 A CN201210057671 A CN 201210057671A CN 103309627 A CN103309627 A CN 103309627A
Authority
CN
China
Prior art keywords
file
printing
double
conversion method
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012100576712A
Other languages
English (en)
Inventor
吴长彬
吉波
唐俨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NANJING GUOTU INFORMATION INDUSTRY Co Ltd
Original Assignee
NANJING GUOTU INFORMATION INDUSTRY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NANJING GUOTU INFORMATION INDUSTRY Co Ltd filed Critical NANJING GUOTU INFORMATION INDUSTRY Co Ltd
Priority to CN2012100576712A priority Critical patent/CN103309627A/zh
Publication of CN103309627A publication Critical patent/CN103309627A/zh
Pending legal-status Critical Current

Links

Images

Abstract

本发明涉及一种基于打印虚拟驱动方式的文档格式转换方法,提供一种能够满足日常工作需要、解决大多数文档格式,并且不需要额外的支撑软件的方法,包括以下步骤:步骤1、虚拟打印含有目标数据的源;步骤2、截取虚拟打印发往后台打印程序的文件数据;步骤3、将步骤2截取的文件数据转换为JPEG格式。步骤4、提取步骤2截取的文件数据中的文字位置信心,与步骤3中JPEG格式文件中文字对应。采用本发明的技术方案可以转换任意格式的文档,打开文档占用内存小,打开速度快等优势。

Description

基于打印驱动的文件双层转换方法
技术领域
本发明涉及一种文档处理方法,尤其是一种基于打印虚拟驱动方式的文档格式转换方法。
背景技术
如何打开一个未知后缀的文档是一直以来困扰着许多非计算机专业人士的苦恼话题,人们不得不去网上搜索并下载各种各样的软件进行支持。
在现有的互联网技术中,Google首先发明了Google DOC Viewer来满足这样的需求,Google DOC Viewer满足了WORD系列,以及PDF文档的在线显示,继Google之后国内的Docin(豆丁网),百度文库等网站也先后以不同的方式支持了这样阅读模式;但是美中不足的是,目前的文档阅读仅仅局限于上述的WORD、PDF等一些比较简单、常用的格式,却依然无法支持大部分的专业文档格式,如AUTOCAD、3DMAX等专业性很强的文档,而且绝大部分的文档无法进行文字查询、复制、打印等操作。
而且,计算机技术日新月异的发展着,除了目前已知的文档格式,目前仍然有各种不同格式的文档被开发出来,满足着不同人群在各自的使用领域中的需要,但也带来了一些问题,在非结构化信息领域,Word、Excel、AutoCAD各有自己的文档格式和操作方法,另外还有PDF、HTML等数百种文档格式,每种文档格式都被一种或几种软件所垄断,甚至同一个产品的不同版本也不能完全兼容。因此,在信息流上就形成了大大小小的信息孤岛。如此纷繁复杂的文档格式,如何在各种类型的计算机上、不同的平台、不同的显示设备上正确的显示,已经成为各个软、硬件厂商十分头疼而且亟待解决的问题。
在实际应用中,我们所接触的客户中,大部分的人员并不需要编辑文档中的任何内容,但仅仅为了浏览一个专业性稍强的文件,就不得去为机器安装上价值昂贵的专业软件,并且占用了庞大的磁盘空间。比如即便是一个很小的WORD文档,在打开诸如OFFICE WORD这样庞大程序的时候对于一些计算能力不足、内存较小的机器也是一种非常大的负担。
发明内容
为解决上述技术问题,本发明旨在提供一种能够满足日常工作需要、解决大多数文档格式,并且不需要额外的支撑软件的方法。
本发明的技术方案为:基于打印驱动的文件双层转换方法,包括以下步骤:
步骤1、虚拟打印含有目标数据的源;
步骤2、截取虚拟打印发往后台打印程序的文件数据;
步骤3、将步骤2截取的文件数据转换为JPEG格式。
步骤4、提取步骤2截取的文件数据中的文字位置信心,与步骤3中JPEG格式文件中文字对应。
步骤1中生成的文件为.shd、.spl或.emf文件。
该方法可在网络环境中实现,所述的方法在服务器端或用户端完成,转换后的文件在网络内共享。
步骤1在能够打开目标数据的机器端打开,所述的机器端为网络服务器端或网络用户端。
采用本发明的技术方案具有如下有益效果:
1、  可以转换任意格式的文档,为消灭信息孤岛提供技术基础;
2、  打开文档占用内存小,打开速度快;
3、  不丢失任何文档信息,可以搜素和复制文档;
4、  兼容各种智能设备,使用支持HTML的浏览器即可查阅需要的文件;
5、  不再需要关心文档的打开方式、方便非专业人士查看专业文档;
6、  不再需要为每台机器安装各种软件,节约了实施成本;
7、  支持各种编程语言的调用,为产研结合留出充足的空间;
8、  可以比较容易地做到知识产权保护,对于部分权限要求严格的文档可以只提供单层转换的文档,只提供栅格图片的格式文件使得未经授权的用户无法直接盗用,达到了PDF在此方面的安全级别。
附图说明
图1为本发明基于WINDOWS系统打印机制流程图(WINDOW原版图片)。
图2为利用假脱机文件的打印流程图。
图3为通过网络实现本发明方法的基础流程图(WINDOW原版图片)。
图4为通过网络实现本发明方法的基础流程图。
具体实施方式
本发明旨在提供一种能够完美支持当前主流文档格式的浏览的方法。其必须满足在仅有支持HTML浏览器,并且不需要安装支撑软件的情况下,占用很小的内存,即可支持主流文档的完美浏览功能。支持如MS OFFICE文档系列、OPENOFFICE文档系列、PDF文档、TXT类型的文本文档;在工业设计和建模中有着重要地位的AUTOCAD、3DMAX等格式,以及各种图片如,JPEG、TIF、GIF、PNG等主流格式的文档,以及在图像设计领域的EMF、AI、CDW等类型的文件,科技论文中的CAJ格式以及流行的各种网络电子书的格式,以上列举的文档格式种类涵盖了日常生活的常用格式,以及科技研发、图像设计、教学、医疗中所接触到的专业文档格式。
以下结合具体实施例说明:
在WINDOWS操作系统下的打印的内容都是经由SPOOLER(服务统一送往打印机。由于程序在调用打印功能之前并不知道打印机的DPI设置,为了保证打印的质量,所有的专业软件在传输给打印机的文件中都尽可能保留了文档的矢量信息,如文本信息、文字位置信息,图片信息等,通过以上信息提供了一个简单的方法从而标准化的解决文档格式差异的途径,WINDOWS的打印机制的官方图解如图1所示。
图1中ISV是应用软件接口,IHV是硬件接口,左边是XP的打印模型,右边是Vista最新的XPS打印模型。这张图例说明了在打印过程中文件的矢量信息被完整地转入到了为打印准备的EMF文件中。
打印过程发生时,GDI(Graphics Device Interface,图形设备接口)模块和打印驱动(由打印机厂商提供)进行基本的数据交换,在假脱机设置环境下,生成打印机命令文件:.spl或.emf文件,作为一个打印池的作业,然后Windows后台打印线程处理打印作业,将数据文件送至打印机打印,打印完删除该打印文件。
如图2在文档被送入打印队列的时候并没有直接到达打印机,而是被Spooler程序送往:%SystemRoot%\System32\spool\PRINTERS 目录下建立了打印队列文件SHD或SPL文件,这些文件都是标准的EMF文件集合。
图3、4说明了无论是本地打印或者是网络打印,都是将文件送入Spooler(后台打印程序)中进行处理,基于以上流程,本发明提供了具体的实施方法:将所需要转换的文档,调用自主研发的虚拟打印机驱动程序以截获打印输出的文件,并且将其转换为大部分平台上都支持的JPEG格式(单层转换),同时将文章的正文文本和位置信息保存到全文索引文件中,以便于最终用户的查找、阅览程序以及其他系统的调用。至此我们的转换满足了任何支持HTML的浏览器浏览任意格式的文档工作。
而且在方案中获取到了文字的位置信息,将文字层和已经转换的图片层之间的无缝结合,实现双层转换:将文字的准确位置信息和图片中的文字一一对应,以便于用户查看图片的时候能够正确地点选和复制出文字信息,提供了和在编辑器中查看文档近乎相同的操作体验。
双层转换来的文件格式只能在支持FLASH格式的浏览器中才能被浏览。如在目前不能支持FLASH的iPhone平台上只能使用单层转换的浏览方式,但是这并不影响用户正确的获取文档的准确信息。
通过如下步骤实现本发明的技术方案:
步骤1、虚拟打印含有目标数据的源;
步骤2、截取虚拟打印发往后台打印程序的文件数据;
步骤3、将步骤2截取的文件数据转换为JPEG格式。
步骤4、提取步骤2截取的文件数据中的文字位置信心,与步骤3中JPEG格式文件中文字对应。
1、  安装本专利的驱动程序,将打印机共享到网络上。
2、  在服务器上、或者任意的需要转换文档的机器上选择性安装所需要使用到的软件,如WORD、PDF、ATUOCAD等软件。
3、  本发明同时提供了两种转换的方式:
a)      服务器监听模式:启动本专利的服务器端程序,在服务器上监听传入的转换请求,服务器端在接受到转换请求后会将文件自动下载,打开对应的软件,使用本专利的打印驱动输出双层转换的文件,并且按照转换请求将转换好的双层可供浏览的文件传回发起请求的程序。
b)      用户主动发起转换模式:使用网络打印机将双层文件输出到服务器的共享目录。这样服务器可以不安装任何软件,任何有权使用网络打印功能的人都可以输出双层浏览文件。
4、  发起请求方可以根据文件的密级进行权限控制、打印控制等细化处理。
5、 最终用户使用支持HTML的浏览器(单层浏览)和阅览程序(SWF格式的双层浏览),查看可供在任意平台上显示的,单、双层可浏览文件。

Claims (4)

1.基于打印驱动的文件双层转换方法,其特征在于包括以下步骤:
步骤1、虚拟打印含有目标数据的源;
步骤2、截取虚拟打印发往后台打印程序的文件数据;
步骤3、将步骤2截取的文件数据转换为JPEG格式;
步骤4、提取步骤2截取的文件数据中的文字位置信心,与步骤3中JPEG格式文件中文字对应。
2.根据权利要求1所述的基于打印驱动的文件双层转换方法,其特征在于:步骤1中生成的文件为.shd、.spl或.emf文件。
3.根据权利要求1所述的基于打印驱动的文件双层转换方法,其特征在于:所述方法在网络环境中实现,所述的方法在服务器端或用户端完成,转换后的文件在网络内共享。
4.根据权利要求1所述的基于打印驱动的文件双层转换方法,其特征在于:步骤1在能够打开目标数据的机器端打开,所述的机器端为网络服务器端或网络用户端。
CN2012100576712A 2012-03-07 2012-03-07 基于打印驱动的文件双层转换方法 Pending CN103309627A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2012100576712A CN103309627A (zh) 2012-03-07 2012-03-07 基于打印驱动的文件双层转换方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2012100576712A CN103309627A (zh) 2012-03-07 2012-03-07 基于打印驱动的文件双层转换方法

Publications (1)

Publication Number Publication Date
CN103309627A true CN103309627A (zh) 2013-09-18

Family

ID=49134899

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012100576712A Pending CN103309627A (zh) 2012-03-07 2012-03-07 基于打印驱动的文件双层转换方法

Country Status (1)

Country Link
CN (1) CN103309627A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105260148A (zh) * 2015-10-22 2016-01-20 苏州恒盛信息技术有限公司 基于电子标签的打印文档鉴真溯源方法及系统
CN106610803A (zh) * 2016-12-15 2017-05-03 国网江苏省电力公司淮安供电公司 电力保护装置情况数据打印输出的图形化及存储方法
CN107133000A (zh) * 2017-04-27 2017-09-05 上海电机学院 跨平台文档色彩分析与打印联动方法、存储设备及终端
CN108804400A (zh) * 2018-06-13 2018-11-13 深圳市轱辘汽车维修技术有限公司 一种电子文档处理方法、装置及相关设备
CN112817546A (zh) * 2021-02-01 2021-05-18 北京数衍科技有限公司 打印机数据重定向方法和装置、设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101067816A (zh) * 2006-05-04 2007-11-07 三星电子株式会社 嵌入式显示系统以及该系统使用的方法
US20080168355A1 (en) * 1998-12-02 2008-07-10 Polycom, Inc. Web-enabled presentation device and methods of use thereof
CN101593087A (zh) * 2008-05-29 2009-12-02 福建升腾资讯有限公司 基于wince系统的打印预览方法
CN102207837A (zh) * 2011-04-26 2011-10-05 北京猛犸科技有限公司 一种基于虚拟打印方式获取数据的方法及系统
CN102355634A (zh) * 2011-06-29 2012-02-15 惠州Tcl移动通信有限公司 文档传输方法及其手机

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080168355A1 (en) * 1998-12-02 2008-07-10 Polycom, Inc. Web-enabled presentation device and methods of use thereof
CN101067816A (zh) * 2006-05-04 2007-11-07 三星电子株式会社 嵌入式显示系统以及该系统使用的方法
CN101593087A (zh) * 2008-05-29 2009-12-02 福建升腾资讯有限公司 基于wince系统的打印预览方法
CN102207837A (zh) * 2011-04-26 2011-10-05 北京猛犸科技有限公司 一种基于虚拟打印方式获取数据的方法及系统
CN102355634A (zh) * 2011-06-29 2012-02-15 惠州Tcl移动通信有限公司 文档传输方法及其手机

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105260148A (zh) * 2015-10-22 2016-01-20 苏州恒盛信息技术有限公司 基于电子标签的打印文档鉴真溯源方法及系统
CN106610803A (zh) * 2016-12-15 2017-05-03 国网江苏省电力公司淮安供电公司 电力保护装置情况数据打印输出的图形化及存储方法
CN107133000A (zh) * 2017-04-27 2017-09-05 上海电机学院 跨平台文档色彩分析与打印联动方法、存储设备及终端
CN108804400A (zh) * 2018-06-13 2018-11-13 深圳市轱辘汽车维修技术有限公司 一种电子文档处理方法、装置及相关设备
CN112817546A (zh) * 2021-02-01 2021-05-18 北京数衍科技有限公司 打印机数据重定向方法和装置、设备及存储介质

Similar Documents

Publication Publication Date Title
US10686788B2 (en) Developer based document collaboration
CN103201997B (zh) 一种基于Web的文档服务方法和系统
US10614167B2 (en) Translation review workflow systems and methods
US9697562B2 (en) Resource provisioning for electronic books
US9026900B1 (en) Invisible overlay for dynamic annotation
CN103514246A (zh) 用于根据社交媒体内容制作相册的方法和系统
JP2003331047A5 (zh)
CN102693253A (zh) 图像管理和呈现
CN101819610B (zh) 一种基于web的手机外壳计算机辅助设计方法
CN103309627A (zh) 基于打印驱动的文件双层转换方法
CN102929867A (zh) 用于自动化的文档翻译的技术
US20080244397A1 (en) System and method for culture specific handling of imaging jobs
JP6578955B2 (ja) 印刷監査証跡を管理する計算処理システム、方法及びプログラム
US20140245130A1 (en) Devices, systems, and methods for communicating with an image-forming device
US9990477B2 (en) Dynamic network construction
TW201610713A (zh) 在文件中識別且呈現相關報告實物
US20120054072A1 (en) Automatic content book creation system and method based on a date range
CN116992081A (zh) 页面表单的数据处理方法、装置和用户终端
CN103744909A (zh) 漫画搜索装置和漫画搜索方法
CN107742055A (zh) 一种医学影像阅片的移动客户端
US20150095458A1 (en) Methods and systems for providing a seamless transition of documents between client types
US20120246559A1 (en) Method and system for estimating variable data document conversion time
KR101469882B1 (ko) 가상 프린터를 이용한 모바일 열람 서비스 시스템 및 방법
TWI694348B (zh) 透過多媒體檔案匯出與匯入憑證之系統及方法
EP4345646A1 (en) Document searching systems and methods

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C53 Correction of patent of invention or patent application
CB03 Change of inventor or designer information

Inventor after: Ji Bo

Inventor after: Tang Yan

Inventor before: Wu Changbin

Inventor before: Ji Bo

Inventor before: Tang Yan

RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20130918