CN111753500B - 版式化后的电子表单与ofd合并展现及目录生成的方法 - Google Patents

版式化后的电子表单与ofd合并展现及目录生成的方法 Download PDF

Info

Publication number
CN111753500B
CN111753500B CN202010643500.2A CN202010643500A CN111753500B CN 111753500 B CN111753500 B CN 111753500B CN 202010643500 A CN202010643500 A CN 202010643500A CN 111753500 B CN111753500 B CN 111753500B
Authority
CN
China
Prior art keywords
file
page
ofd
format
files
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010643500.2A
Other languages
English (en)
Other versions
CN111753500A (zh
Inventor
何冉冉
何中
蔡亚军
蒋烽
顾永新
张军
戴建峰
施东海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Zhongwei Technology Software System Co ltd
Original Assignee
Jiangsu Zhongwei Technology Software System Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Zhongwei Technology Software System Co ltd filed Critical Jiangsu Zhongwei Technology Software System Co ltd
Priority to CN202010643500.2A priority Critical patent/CN111753500B/zh
Publication of CN111753500A publication Critical patent/CN111753500A/zh
Application granted granted Critical
Publication of CN111753500B publication Critical patent/CN111753500B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/137Hierarchical processing, e.g. outlines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/169Annotation, e.g. comment data or footnotes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/189Automatic justification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种版式化后的电子表单与OFD合并展现及目录生成的方法,将绘制好的工作流电子表单转化为版式文件并保存工作流电子表单页面上的各类元素信息,其他格式文件根据不同方法转化为标准的版式文件,解压OFD版式文件获取OFD文件夹下的文件数据,读取工作流电子表单转化的版式文件、其他格式文件转化的版式文件以及OFD版式文件的目录后重组新目录,通过重组后的新目录选择展示页面,客户端将对应的文件数据进行格式解析加载后将页面进行渲染并完成展现。本发明在保证工作流电子表单、OFD版式文件以及其他格式文件独立性的基础上,实现了各类文件之间相同的阅读体验度。

Description

版式化后的电子表单与OFD合并展现及目录生成的方法
技术领域
本发明涉及一种合并展现及目录生成的方法,特别是一种版式化后的电子表单与OFD合并展现及目录生成的方法,属于计算机软件领域。
背景技术
工作流引擎实现了抽象流程的流转,而具体业务的实现需要在电子表单模块中完成,例如公文签批,审核签批意见都对应一个业务模块,具体业务在业务模块中实现并将数据保存到数据库表中,从而实现业务数据的持久化。工作流引擎负责将这些业务模块串起来,实现业务流的流转。基于工作流流转的电子表单显著不同于传统电子文档只能作为静态和割裂的信息、图片和图形等载体存在,可以是电子的、常见的和便于使用的几乎任何类型的文档,比如经常见诸于电子政务领域的网上申报、审批、内部办公、政务信息采集、报送等用到的电子文档,实质都可以应用XML文档技术,不仅保留了纸张文档的最佳特性,如熟悉的外观和感受,同时还增加了功能强大的商业逻辑功能,如数据验证和路由指令。这些功能在提供给人们必要的数据访问和交互功能的同时,还可以使政府与公众应用程序进行更有效的交互操作。工作流表单引擎系统实现了电子表单与各种实际业务逻辑的低耦合衔接,使得传统电子表单与应用系统真正意义上的融合。
2016年10月14日世界标准日,国家标准化管理委员会正式批准发布了基于自主技术的国家标准GB/T 33190-2016《电子文件存储与交换格式版式文档》(简称OFD)。OFD,OpenFixed-layout Document的简写,是我国自主可控的电子文件版式文档格式,对应的国际标准就是PDF。OFD版式文件,版面固定、不跑版、所见即所得,可以视为计算机时代的“数字纸张”;是电子文档发布、数字化信息传播和存档的理想文档格式。版式数据流文件是一种可以附着在底版(pdf,ofd,视频、网页)上的文件格式,支持单个文件,多个文件或多个多类文件同时附着,不修改破坏原有附着文件,即可查看预览原有文件和签批内容,版式数据流文件的内容矢量存储,放大不失真,该文件可由字符串表达,可直接存储到数据库并嵌入到工作流系统中签批流转,文件元素包含页、块、文字、手写、语音、图片、视频、超链接、以及其他常用表单元素 每个元素支持相关动作,页面打开触发或点击元素触发。
表单(网页)作为一种最常见的信息载体,在各个领域中广为使用,例如政府部门中的公文。表单是通过html、js、css等源码编写生成,是基于浏览器访问,因此存在多浏览器访问兼容的问题,格式易错乱且源码易被查看,因此表单与版式文件相比安全性较低而且难以在不同终端保持原版原样 。
工作流引擎实现了抽象流程的流转,而具体业务的实现需要在电子表单模块中完成,例如公文签批,审核签批意见都对应一个业务模块,具体业务在业务模块中实现并将数据保存到数据库表中,从而实现业务数据的持久化。工作流引擎负责将这些业务模块串起来,实现业务流的流转。
文件流转基于工作流电子表单系统,以电子表单实现业务数据交互与存储, 一般以OFD文件为正文,PDF以及其他不同格式文件作为附件存在并整体流转。 因电子表单、正文、附件存在文件格式的差距,需要逐个调用不同的控件完成阅读,容易导致更像文件间的孤立阅读,无法做到统一阅读体验度,目前电子表单广泛应用于电子政务等领域,例如,网上申报、审批、内部办公、政务信息采集、报送等;现有的电子表单在查看过程中电子表单的内容极易被用户另存篡改,文件存在较大的安全隐患;不同的类型的文件,例如:doc/docx、xls/xlsx、ppt/pptx、jpg、tif、pdf、gif、png、cad、视频、音频、.ture等均有自己的阅读器,阅读体验也不相同,同一文件在不同版本的阅读器中也会产生变化,无法实现文件的原版原样,若想阅读多种文件则需要安装各种阅读器,因此系统资源被造成较大的浪费。
现有专利号为“201410102521.8”的专利提供了一种文件合并方法及装置,步骤如下:在检测到用户已选择的待合并文件后,提取所述待合并文件的目录项信息,生成原始目录;获取用户对所述原始目录的操作/不操作信息,重新编辑目录项信息,生成目标目录;对所述目标目录的文件数据进行合并,生成目标文件。该技术方案仅仅能够实现同类型文件的合并,而且在新目录生成过程中多个文件合并成了一个文件,丧失了原有文件的独立性,原有文件被破坏导致了文件的安全难以得到保障。
发明内容
本发明所要解决的技术问题是提供一种版式化后的电子表单与OFD合并展现及目录生成的方法,实现了工作流电子表单、OFD版式文件及其他格式文件的合并阅读。
为解决上述技术问题,本发明所采用的技术方案是:
一种版式化后的电子表单与OFD合并展现及目录生成的方法,其特征在于包含以下步骤:
步骤一:将绘制好的工作流电子表单转化为版式文件并保存工作流电子表单页面上的各类元素信息;
步骤二:解压OFD版式文件获取OFD文件夹下的文件数据;
步骤三:其他格式文件根据不同方法转化为标准的版式文件;
步骤四:读取步骤一中工作流电子表单转化的版式文件、步骤二中OFD版式文件以及步骤三中其他格式文件转化的版式文件的目录后重组新目录;
步骤五:通过重组后的新目录选择展示页面,客户端将对应的文件数据进行格式解析加载后将页面进行渲染并完成展现和标识。
进一步地,所述步骤一具体为
步骤11:导入标准的电子表单,采用正则匹配,匹配出电子表单中的元素,将匹配出的元素替换为空白区域,获得html格式的文件基本内容底版,调用wkhtmltopdf将html格式的文件基本内容底版转化为PDF格式文件,或者继续将PDF格式文件转换为OFD格式版式文件,得到一个电子表单版式化后的文件底版;
步骤12:初始化元素坐标模块遍历电子表单中输入框对象,将元素类型、横坐标startX、纵坐标startY、输入框宽度width、输入框高度height、元素名称、类别、值value组织成JSON格式数据,将组织成的JSON格式数据保存到数据库中。
进一步地,所述步骤一中标准电子表单中的元素包含单行文本输入框input、多行文本输入框textarea、下拉框select、多选框checkbox和单选框radio,输入框对象包含单行文本输入框input、多行文本输入框textarea、下拉框select、多选框checkbox、单选框radio和表格单元td。
进一步地,所述步骤12中遍历电子表单中输入框对象的过程为
采用JavaScript中的offset函数获取输入框对象至其外层表格单元td的左距离left1与上距离top1;
根据offset方法获取表格单元td至表单左上角的横向距离left2、纵向距离top2;
将输入框对象至其外层表格单元td的左距离left1和表格单元td至表单左上角的横向距离left2相加得到输入框对象相对于表单最左测的距离StartX,将输入框对象至其外层表格单元td的上距离top1和表格单元td至表单左上角的纵向距离top2相加得到输入框对象相对于表单最顶部距离startY,即获取了该输入框对象的坐标信息。
进一步地,所述步骤二具体为
步骤21:客户端遍历若干个OFD文件,后台建立一个新的文件目录,并将遍历完成的若干个OFD文件复制到新建的文件目录中,将新建文件目录中的若干个OFD文件后缀名称.ofd分别修改为.zip,调用服务器程序将对若干个zip文件进行文件解压,得出对应的OFD文件解压后的文件夹;
步骤22:客户端读取OFD文件夹下的Pages文件夹下的Page_N文件,Page_N中的N是OFD文件的页码,Page_N下的content.xml文件是OFD文件夹中对应每一页OFD文件的内容,客户端依次读取每一个OFD文件夹下的Page_N文件的页码信息和content.xml文件的内容信息,并建立相应的页面路径;
步骤23:将若干个OFD文件的页面路径按照JSON的方式进行组织,拼接为JSON数组;JSON数组中个体均为一个文件,文件包含文件名NAME、文件唯一id、文件大纲,文件资源包RESOURCES和页面内容Pages;页面内容Pages包含每一页的文件内容指向路径URL、每页文件在原本所属文件中的页码Page;每页文件在多个文件中的文件页码directory、是否被签批sign、是否包含指定关键字keywords。
进一步地,所述步骤三中其他格式文件中wps、doc/docx、xls/xlsx采用jcob,ppt/pptx采用PowerPoint.Application,cad采用autocad,jpg、tif、gif、png图片采用PdfWriter转换为PDF版式文件,或转化为OFD版式文件。
进一步地,所述步骤四具体为
读取电子表单转化的版式文件、OFD文件和其他格式文件转化的版式文件,解析返回的JSON数组的文件数据,获取JSON数组的文件的类型、文件名称、页码属性Page、多文件页码属性directory和url地址,对页码进行重组绘制,并根据页面是否签批意见sign、或检索的关键字keywords,在目录中进行标注;标注形式为签批意见采用提示图标在文件目录中标注,检索后有关键字的采用提示图标在文件目录中标注。
进一步地,所述步骤五具体为
步骤51:对于版式化后的电子表单,在文件底版区域展示渲染对应的版式底版,获取初始化元素坐标模块中的JSON格式数据,解析JSON格式数据,根据横坐标startX、纵坐标startY在版式底版指定控制区域绘制输入框宽度width、输入框高度height的输入框,并标注该输入框的名称TagName;在电子表单中,根据实际内容,在各个输入框中输入对应的内容并保存,根据输入框的名称TagName与输入框对应的内容,将值一一匹配保存到数据库中,二次阅读时,把值直接拼接到value字段中,返回给客户端展示;
步骤52:文件目录中每个目录分别超链接一个文件地址路径,点击每个目录时,如果是OFD格式文件,根据对应的OFD文件页面的路径地址下载页面及文件页面的外引资源完成加载页面的显示,如果是PDF文件,根据对应的PDF文件的路径地址下载PDF文件并在底版区域加载;
步骤53:获取各个版式化后的电子表单与OFD文件的总高度Total和文件展示区域的高度H,计算两者之间的倍数N = Total/H,则滚动条的高度为H/N;
步骤54:跨页面、跨文件多版式化后的电子表单与OFD文件阅读,鼠标滚动下拉阅读时,当滚动到某一目录底部时,获取内存中该文件下一页的文件内容,判断下一页文件内容是否为另外一个文件,如果是,则在文件展示区域的相邻页面分隔部位的左右两侧标记“文件已经阅读完成,阅读下一文件”;如果不是,则不标记;
步骤55:客户端设置检索模块,检索模块通过服务器检索所有OFD文件夹下的文件数据,确定含有关键字的页面的页码,然后服务器过滤未含有关键字的页面后将含有关键字的页面返回客户端进行展示。
进一步地,所述步骤53中点击目录记载方式为
n为文件的数量,每个文件对应在目录中的页码数为N1,N2…Nn
则若干个文件的目录总数M= N1+N2+…+Nn;m是点击选择的目录对应的页码数;
若m<N1,直接跳转到N1的m页;
若m>N1 && m≤( N1+N2);链接跳转到N2文件的(M-N1)页
若m>(N1+N2), 跳转到N3文件的(M-N1-N2)页
若m>(N1+N2+…+Nn-1),跳转到Nn文件的(M-N1-N2-…- Nn-1)页。
进一步地,所述步骤53中点击目录时,如果是OFD格式文件,根据对应的OFD文件页面的路径地址下载页面及文件页面的外引资源完成加载页面的显示,如果是PDF文件,根据对应的PDF文件的路径地址下载PDF文件并在底版区域加载,加载页面的同时客户端加载所述加载页面的前后若干页,OFD或PDF文件的资源页面加载至内存后其他的页面内容自主释放,加载页面的前后若干页的页数由程序后台设定。
本发明与现有技术相比,具有以下优点和效果:
本发明在保证工作流电子表单、OFD版式文件以及其他格式文件独立性的基础上,实现了各类文件之间相同的阅读体验度;
本发明将工作流电子表单以及wps、doc/docx、xls/xlsx、ppt/pptx、jpg、tif、pdf、gif、png、cad等其他格式文件转化为版式文件,无需安装各类文件的阅读器,在提升了用户阅读体验度的同时避免了系统资源的浪费;
本发明对工作流电子表单、OFD版式文件以及其他格式文件的目录进行统一排版、签批和检索,用户点击重新排版的目录跳转阅读,实现了各种文件之间的快速查阅,提高了用户的体验效果;
本发明实现了工作流电子表单、OFD版式文件以及其他格式文件相融的体验度,任意相邻两个文件之间的相邻页面与文件内部相邻页面的阅读体验度一致;
5、本发明的工作流电子表单在转化为版式文件的基础上,仍然将电子表单的具体业务保存在数据库表中,电子表单与OFD等多种文件之间从原有的依附关系转化为统一的并行关系,在阅读过程中无需调用控件实现不同格式文件的展现阅读,因此当系统控件损坏时文件的展现阅读不收影响。
本发明的目录重组是建立在不破坏原有文件的基础上实现的, OFD文件保持原文件,其他附件以版式文件形式原版原样展示(保留原文并与版式文件创建关联关系),使得这样的跨文件合并展现阅读的方式的安全性得到了极大的保障,对版式数据流文件技术形成有效的补充。
附图说明
图1是本发明的版式化后的电子表单与OFD合并展现及目录生成的方法的流程图。
图2是本发明实施例的用户点击目录展现页面的流程示意图。
图3是本发明实施例的工作流电子表单、OFD版式文件与DOC文件相邻页面的阅读画面示意图。
图4是本发明实施例的工作流电子表单与OFD等其他格式文件合并后文件目录的生成概念图。
图5是本发明实施例的工作流电子表单与OFD等其他格式文件合并后的文件目录图。
图6是本发明实施例的工作流电子表单转化的版式文件示意图。
图7是本发明实施例的工作流电子表单与OFD等其他格式文件合并后通过关键字检索页面的展示图。
图8是本发明实施例的OFD文件被解压后的OFD文件夹的文件目录示意图。
具体实施方式
为了详细阐述本发明为达到预定技术目的而所采取的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清晰、完整地描述,显然,所描述的实施例仅仅是本发明的部分实施例,而不是全部的实施例,并且,在不付出创造性劳动的前提下,本发明的实施例中的技术手段或技术特征可以替换,下面将参考附图并结合实施例来详细说明本发明。
如图1所示,本发明的一种版式化后的电子表单与OFD合并展现及目录生成的方法,包含以下步骤:
步骤一:将绘制好的工作流电子表单转化为版式文件并保存工作流电子表单页面上的各类元素信息;
步骤一具体为
步骤11:导入标准的电子表单,采用正则匹配,匹配出电子表单中的元素,将匹配出的元素替换为空白区域,获得html格式的文件基本内容底版,调用wkhtmltopdf将html格式的文件基本内容底版转化为PDF格式文件,或者继续将PDF格式文件转换为OFD格式版式文件,如图6所示,得到一个电子表单版式化后的文件底版;
步骤12:初始化元素坐标模块遍历电子表单中输入框对象,输入框对象包含单行文本输入框input、多行文本输入框textarea、下拉框select、多选框checkbox、单选框radio和表格单元td。将元素类型、横坐标StartX、纵坐标startY、输入框宽度width、输入框高度height、元素名称、类别、值value组织成JSON格式数据,将组织成的JSON格式数据保存到数据库中;
遍历电子表单中输入框对象的过程为
采用JavaScript中的offset函数获取输入框对象至其外层表格单元td的左距离left1与上距离top1;
根据offset方法获取表格单元td至表单左上角的横向距离left2、纵向距离top2;
将输入框对象至其外层表格单元td的左距离left1和表格单元td至表单左上角的横向距离left2相加得到输入框对象相对于表单最左测的距离startX,将输入框对象至其外层表格单元td的上距离top1和表格单元td至表单左上角的纵向距离top2相加得到输入框对象相对于表单最顶部距离startY,即获取了该输入框对象的坐标信息。
系统将已经绘制好的工作流电子表单转化为版式文件,然后记录工作流电子表单页面上各种类型元素信息的起始XY坐标、元素类型、width、height宽高信息等,各类元素的坐标原点可以设置在所述工作流电子表单页面上的任意一点,其中各类元素的高度与宽度等信息都是通过所述各类元素的起始XY的坐标计算出来。
系统自动将工作流电子表单页面上各类元素的XY坐标、元素类型以及width、height宽高等信息转化为文本值后保存,例如系统将工作流电子表单页面的左下角为原点,工作流电子表单页面上的一个输入框的四个角的坐标分别为(10,10)、(10,20)、(20,10)、(20,20),经计算得出所述输入框为高度与宽度都是10的正方形输入框,系统将上述关于输入框的相关信息转化为文本值后保存起来。
步骤二:解压OFD版式文件获取OFD文件夹下的文件数据;
步骤二具体为
步骤21:客户端遍历若干个OFD文件,后台建立一个新的文件目录,并将遍历完成的若干个OFD文件复制到新建的文件目录中,将新建文件目录中的若干个OFD文件后缀名称.ofd分别修改为.zip,调用服务器程序将对若干个zip文件进行文件解压,得出对应的OFD文件解压后的文件夹,解压后的OFD文件的文件夹目录如图8所示;系统将所述OFD版式文件解压成OFD文件夹,OFD文件夹下包括OFD版式文件页面的路径地址以及OFD版式文件页面的外引资源,OFD版式文件页面的外引资源包括该页面的文字、样式、图片等信息。
步骤22:客户端读取OFD文件夹下的Pages文件夹下的Page_N文件,Page_N中的N是OFD文件的页码,Page_N下的content.xml文件是OFD文件夹中对应每一页OFD文件的内容,客户端依次读取每一个OFD文件夹下的Page_N文件的页码信息和content.xml文件的内容信息,并建立相应的页面路径;
步骤23:将若干个OFD文件的页面路径按照JSON的方式进行组织,拼接为JSON数组;JSON数组中个体均为一个文件,文件包含文件名NAME、文件唯一id、文件大纲,文件资源包RESOURCES和页面内容Pages;页面内容Pages包含每一页的文件内容指向路径URL、每页文件在原本所属文件中的页码Page;每页文件在多个文件中的文件页码directory、是否被签批sign、是否包含指定关键字keywords。
步骤三:其他格式文件根据不同方法转化为标准的版式文件;
其他格式文件中wps、doc/docx、xls/xlsx采用jcob,ppt/pptx采用PowerPoint.Application,cad采用autocad,jpg、tif、gif、png图片采用PdfWriter转换为PDF版式文件,或转化为OFD版式文件。
步骤四:读取步骤一中工作流电子表单转化的版式文件、步骤二中OFD版式文件以及步骤三中其他格式文件转化的版式文件的目录后重组新目录,图4是工作流电子表单与OFD等其他格式文件合并后文件目录的生成概念图;
步骤四具体为
读取电子表单转化的版式文件、OFD文件和其他格式文件转化的版式文件,解析返回的JSON数组的文件数据,获取JSON数组的文件的类型、文件名称、页码属性Page、多文件页码属性directory和url地址,对页码进行重组绘制,并根据页面是否签批意见sign、或检索的关键字keywords,在目录中进行标注;标注形式为签批意见采用提示图标在文件目录中标注,检索后有关键字的采用提示图标在文件目录中标注。
系统读取所述OFD文件夹下的文件、工作流电子表单转化的版式文件与wps、doc/docx、xls/xlsx、ppt/pptx、jpg、tif、pdf、gif、png、cad等其他不同格式的文件转化的版式文件的目录后重组排版新目录,重组的目录是在保存工作流电子表单、OFD版式文件以及其他格式文件原有目录的基础之上由多个文件目录重组而成,在不破坏原有各类文件的基础上将各个文件的目录重新统一排版,OFD版式文件、工作流电子表单以及其他格式文件的安全性的得到了保障。
步骤五:通过重组后的新目录选择展示页面,客户端将对应的文件数据进行格式解析加载后将页面进行渲染并完成展现和标识。
步骤五具体为
步骤51:对于版式化后的电子表单,在文件底版区域展示渲染对应的版式底版,获取初始化元素坐标模块中的JSON格式数据,解析JSON格式数据,根据横坐标startX、纵坐标startY在版式底版指定控制区域绘制输入框宽度width、输入框高度height的输入框,并标注该输入框的名称TagName;在电子表单中,根据实际内容,在各个输入框中输入对应的内容并保存,根据输入框的名称TagName与输入框对应的内容,将值一一匹配保存到数据库中,二次阅读时,把值直接拼接到value字段中,返回给客户端展示;
步骤52:文件目录中每个目录分别超链接一个文件地址路径,如图2所示,点击每个目录时,如果是OFD格式文件,根据对应的OFD文件页面的路径地址下载页面及文件页面的外引资源完成加载页面的显示,如果是PDF文件,根据对应的PDF文件的路径地址下载PDF文件并在底版区域加载;
点击目录记载方式为
n为文件的数量,每个文件对应在目录中的页码数为N1,N2…Nn;文件包含OFD文件、PDF文件和版式化后的电子表单文件等。
则若干个文件的目录总数M= N1+N2+…+Nn;m是点击选择的目录对应的页码数;
若m<N1,直接跳转到N1的m页;
若m>N1 && m≤( N1+N2);链接跳转到N2文件的(M-N1)页
若m>(N1+N2), 跳转到N3文件的(M-N1-N2)页
若m>(N1+N2+…+Nn-1),跳转到Nn文件的(M-N1-N2-…- Nn-1)页。
加载页面的同时客户端加载所述加载页面的前后若干页,OFD或PDF文件的资源页面加载至内存后其他的页面内容自主释放,加载页面的前后若干页的页数由程序后台设定。
步骤54:获取各个版式化后的电子表单、OFD文件和其他格式文件转化的版式文件的总高度Total和文件展示区域的高度H,计算两者之间的倍数N = Total/H,则滚动条的高度为H/N;
步骤55:跨页面、跨文件多版式化后的电子表单、OFD文件和其他格式文件阅读,鼠标滚动下拉阅读时,当滚动到某一目录底部时,获取内存中该文件下一页的文件内容,判断下一页文件内容是否为另外一个文件,如果是,则在文件展示区域的相邻页面分隔部位的左右两侧标记“文件已经阅读完成,阅读下一文件”;如果不是,则不标记;如图3所示,在判断下一页文件内容是否为另外一个文件时,同时判断文件类型,并对文件类型进行标记。
步骤56:客户端设置检索模块,如图7所示,检索模块通过服务器检索所有OFD文件夹下的文件数据或者电子表单版式化文件以及其他格式文件的版式文件,确定含有关键字的页面的页码,然后服务器过滤未含有关键字的页面后将含有关键字的页面返回客户端进行展示。
用户通过所述重组后的目录选择任意文件的任意页面,此时客户端判断加载的页面时属于OFD版式文件页面、工作流电子表单页面还是wps、doc/docx、xls/xlsx、ppt/pptx、jpg、tif、pdf、gif、png、cad等其他不同格式的文件的页面,然后客户端将对应的文件数据进行格式解析加载,客户端根据对应的资源地址进行远程文件下载,下载完成后客户端渲染加载页面,当渲染所述电子文化表单转化的版式文件时,客户端获取工作流电子表单上各类元素信息,然后在如图6所示的工作流电子表单转化的版式文件上的对应位置附着工作流电子表单原有的元素输入框,如图7所示的时间选择框、假期类型选择框等;当渲染OFD页面时,客户端获取OFD文件夹下的OFD页面外引资源进行渲染,页面渲染完成后客户端将页面呈现在用户面前。本发明对工作流电子表单、OFD版式文件以及其他格式文件的目录进行统一排版,用户能够通过点击重新排版的目录跳转阅读,不仅仅实现各种文件之间的快速查阅,还有效地提高了用户的体验效果。
当用户阅读工作流电子表单并在工作流电子表单转化的版式文件上的输入框内填写内容时,系统自动将用户填写的内容进行存储,如图5所示,请假的申请时间选择的是2020年3月31日,时间选择完成后该元素输入框隐藏,请假的申请时间记载在工作流电子表单转化的版式文件页面的对应位置,当用户再次阅读所述工作流电子表单页面时该内容自动加载出来;在用户打开任意类型文件的任意页面时,客户端自动加载页面的上下N页,例如用户打开的是只有一页的OFD版式文件,OFD的上个文件是工作流电子表单转化的版式文件,下个文件是doc转化的版式文件,此时客户端自动加载工作流电子表单转化的版式文件的后五页以及所述doc转化的版式文件的前五页,如图3所示,OFD 文件与工作流电子表单转化的版式文件的最后一页、doc转化的版式文件第一页之间的阅读体验与文件内部相邻页面的阅读体验度一致,当工作流电子表单页面转化的版式文件的后五页、单页OFD版式文件的页面以及doc转化的版式文件的前五页加载至内存后其他的页面内容自主释放,从而避免系统资源的浪费。本发明将工作流电子表单与其他不同格式的文件转化为版式文件,因此无需安装各类文件的阅读器,在提升了用户阅读体验度的同时避免了系统资源的浪费。
本发明还提供了一种在工作流电子表单、OFD和其他格式文件合并展现后的页面检索技术,首先服务器检索OFD文件夹、工作流电子表单转化的版式文件以及doc/docx、xls/xlsx、ppt/pptx、jpg、tif、pdf、gif、png、cad等其他不同格式的文件转化的版式文件,确定含有关键字的页面页码,例如关键字为“管理部”,服务端在OFD文件夹下的文件数据、工作流电子表单和其他不同格式的文件转化的版式文件内检索“管理部”,最终确定含有关键字“管理部”页面的地址路径;
如图2、图7所示,服务器过滤未含有关键字“管理部”的页面,然后将含有关键字“管理部”页面的地址路径返回客户端,客户端将所述地址路径对应页面的文件数据格式解析加载后直接渲染并展示含有关键字“管理部”的页面。用户能够通过关键字搜索引擎工具来实现含有关键字“管理部”页面的切换。本发明通过关键字的搜索来过滤非相关文件页面,从而获取用户的需求文件页面,极大的提升了用户获取信息的速度。
需要说明的是,在附图或说明书正文中,未绘示或描述的实现方式,均为所属技术领域中普通技术人员所知的实现方式,并未进行详细说明。此外,上述对各元件和方法的定义并不仅限于实施例中提到的各种具体结构、形状或方式。
还需要说明的是,本文可提供包含特定值的参数的示范,但这些参数无需确切等于相应的值,而是可在可接受的误差容限或设计约束内近似于相应值。此外,除非特别描述或必须依序发生的步骤,上述步骤的顺序并无限制于以上所列,且可根据所需设计而变化或重新排列。并且上述实施例可基于设计及可靠度的考虑,彼此混合搭配使用或与其他实施例混合搭配使用,即不同实施例中的技术特征可以自由组合形成更多的实施例。
以上所述,仅是本发明的较佳实施例,并非对本发明作任何形式上的限制,虽然本发明已以较佳实施例揭露如上,然而并非用以限定本发明,任何熟悉本专业的技术人员,在不脱离本发明技术方案范围内,当可利用上述揭示的技术内容做出些许更动或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案内容,依据本发明的技术实质,在本发明的精神和原则内,对以上实施例所作的任何简单的修改、等同替换与改进等,均在本发明技术方案的保护范围之内。

Claims (9)

1.一种版式化后的电子表单与OFD合并展现及目录生成的方法,其特征在于包含以下步骤:
步骤一:将绘制好的工作流电子表单转化为版式文件并保存工作流电子表单页面上的各类元素信息;
步骤二:解压OFD版式文件获取OFD文件夹下的文件数据;
步骤三:其他格式文件根据不同方法转化为标准的版式文件;
步骤四:读取步骤一中工作流电子表单转化的版式文件、步骤二中OFD版式文件以及步骤三中其他格式文件转化的版式文件的目录后重组新目录;
步骤五:通过重组后的新目录选择展示页面,客户端将对应的文件数据进行格式解析加载后将页面进行渲染并完成展现和标识;
所述步骤五具体为
步骤51:对于版式化后的电子表单,在文件底版区域展示渲染对应的版式底版,获取初始化元素坐标模块中的JSON格式数据,解析JSON格式数据,根据横坐标startX、纵坐标startY在版式底版指定控制区域绘制输入框宽度width、输入框高度height的输入框,并标注该输入框的名称TagName;在电子表单中,根据实际内容,在各个输入框中输入对应的内容并保存,根据输入框的名称TagName与输入框对应的内容,将值一一匹配保存到数据库中,二次阅读时,把值直接拼接到value字段中,返回给客户端展示;
步骤52:文件目录中每个目录分别超链接一个文件地址路径,点击每个目录时,如果是OFD格式文件,根据对应的OFD文件页面的路径地址下载页面及文件页面的外引资源完成加载页面的显示,如果是PDF文件,根据对应的PDF文件的路径地址下载PDF文件并在底版区域加载;
步骤53:获取各个版式化后的电子表单与OFD文件的总高度Total和文件展示区域的高度H,计算两者之间的倍数N = Total/H,则滚动条的高度为H/N;
步骤54:跨页面、跨文件多版式化后的电子表单与OFD文件阅读,鼠标滚动下拉阅读时,当滚动到某一目录底部时,获取内存中该文件下一页的文件内容,判断下一页文件内容是否为另外一个文件,如果是,则在文件展示区域的相邻页面分隔部位的左右两侧标记“文件已经阅读完成,阅读下一文件”;如果不是,则不标记;
步骤55:客户端设置检索模块,检索模块通过服务器检索所有OFD文件夹下的文件数据,确定含有关键字的页面的页码,然后服务器过滤未含有关键字的页面后将含有关键字的页面返回客户端进行展示。
2.按照权利要求1所述的版式化后的电子表单与OFD合并展现及目录生成的方法,其特征在于:所述步骤一具体为
步骤11:导入标准的电子表单,采用正则匹配,匹配出电子表单中的元素,将匹配出的元素替换为空白区域,获得html格式的文件基本内容底版,调用wkhtmltopdf将html格式的文件基本内容底版转化为PDF格式文件,或者继续将PDF格式文件转换为OFD格式版式文件,得到一个电子表单版式化后的文件底版;
步骤12:初始化元素坐标模块遍历电子表单中输入框对象,将元素类型、横坐标startX、纵坐标startY、输入框宽度width、输入框高度height、元素名称、类别、值value组织成JSON格式数据,将组织成的JSON格式数据保存到数据库中。
3.按照权利要求2所述的版式化后的电子表单与OFD合并展现及目录生成的方法,其特征在于:所述步骤一中标准电子表单中的元素包含单行文本输入框input、多行文本输入框textarea、下拉框select、多选框checkbox和单选框radio,输入框对象包含单行文本输入框input、多行文本输入框textarea、下拉框select、多选框checkbox、单选框radio和表格单元td。
4.按照权利要求2所述的版式化后的电子表单与OFD合并展现及目录生成的方法,其特征在于:所述步骤12中遍历电子表单中输入框对象的过程为
采用JavaScript中的offset函数获取输入框对象至其外层表格单元td的左距离left1与上距离top1;
根据offset方法获取表格单元td至表单左上角的横向距离left2、纵向距离top2;
将输入框对象至其外层表格单元td的左距离left1和表格单元td至表单左上角的横向距离left2相加得到输入框对象相对于表单最左测的距离StartX,将输入框对象至其外层表格单元td的上距离top1和表格单元td至表单左上角的纵向距离top2相加得到输入框对象相对于表单最顶部距离startY,即获取了该输入框对象的坐标信息。
5.按照权利要求1所述的版式化后的电子表单与OFD合并展现及目录生成的方法,其特征在于:所述步骤二具体为
步骤21:客户端遍历若干个OFD文件,后台建立一个新的文件目录,并将遍历完成的若干个OFD文件复制到新建的文件目录中,将新建文件目录中的若干个OFD文件后缀名称.ofd分别修改为.zip,调用服务器程序将对若干个zip文件进行文件解压,得出对应的OFD文件解压后的文件夹;
步骤22:客户端读取OFD文件夹下的Pages文件夹下的Page_N文件,Page_N中的N是OFD文件的页码,Page_N下的content.xml文件是OFD文件夹中对应每一页OFD文件的内容,客户端依次读取每一个OFD文件夹下的Page_N文件的页码信息和content.xml文件的内容信息,并建立相应的页面路径;
步骤23:将若干个OFD文件的页面路径按照JSON的方式进行组织,拼接为JSON数组;JSON数组中个体均为一个文件,文件包含文件名NAME、文件唯一id、文件大纲,文件资源包RESOURCES和页面内容Pages;页面内容Pages包含每一页的文件内容指向路径URL、每页文件在原本所属文件中的页码Page;每页文件在多个文件中的文件页码directory、是否被签批sign、是否包含指定关键字keywords。
6.按照权利要求1所述的版式化后的电子表单与OFD合并展现及目录生成的方法,其特征在于:所述步骤三中其他格式文件中wps、doc/docx、xls/xlsx采用jcob,ppt/pptx采用PowerPoint.Application,cad采用autocad,jpg、tif、gif、png图片采用PdfWriter转换为PDF版式文件,或转化为OFD版式文件。
7.按照权利要求1所述的版式化后的电子表单与OFD合并展现及目录生成的方法,其特征在于:所述步骤四具体为
读取电子表单转化的版式文件、OFD文件和其他格式文件转化的版式文件,解析返回的JSON数组的文件数据,获取JSON数组的文件的类型、文件名称、页码属性Page、多文件页码属性directory和url地址,对页码进行重组绘制,并根据页面是否签批意见sign、或检索的关键字keywords,在目录中进行标注;标注形式为签批意见采用提示图标在文件目录中标注,检索后有关键字的采用提示图标在文件目录中标注。
8.按照权利要求1所述的版式化后的电子表单与OFD合并展现及目录生成的方法,其特征在于:所述步骤53中点击目录记载方式为
n为文件的数量,每个文件对应在目录中的页码数为N1,N2…Nn
则若干个文件的目录总数M= N1+N2+…+Nn;m是点击选择的目录对应的页码数;
若m<N1,直接跳转到N1的m页;
若m>N1 && m≤( N1+N2);链接跳转到N2文件的(M-N1)页
若m>(N1+N2), 跳转到N3文件的(M-N1-N2)页
若m>(N1+N2+…+Nn-1),跳转到Nn文件的(M-N1-N2-…- Nn-1)页。
9.按照权利要求1所述的版式化后的电子表单与OFD合并展现及目录生成的方法,其特征在于:所述步骤53中点击目录时,如果是OFD格式文件,根据对应的OFD文件页面的路径地址下载页面及文件页面的外引资源完成加载页面的显示,如果是PDF文件,根据对应的PDF文件的路径地址下载PDF文件并在底版区域加载,加载页面的同时客户端加载所述加载页面的前后若干页,OFD或PDF文件的资源页面加载至内存后其他的页面内容自主释放,加载页面的前后若干页的页数由程序后台设定。
CN202010643500.2A 2020-07-07 2020-07-07 版式化后的电子表单与ofd合并展现及目录生成的方法 Active CN111753500B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010643500.2A CN111753500B (zh) 2020-07-07 2020-07-07 版式化后的电子表单与ofd合并展现及目录生成的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010643500.2A CN111753500B (zh) 2020-07-07 2020-07-07 版式化后的电子表单与ofd合并展现及目录生成的方法

Publications (2)

Publication Number Publication Date
CN111753500A CN111753500A (zh) 2020-10-09
CN111753500B true CN111753500B (zh) 2021-05-04

Family

ID=72679662

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010643500.2A Active CN111753500B (zh) 2020-07-07 2020-07-07 版式化后的电子表单与ofd合并展现及目录生成的方法

Country Status (1)

Country Link
CN (1) CN111753500B (zh)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112783833A (zh) * 2020-12-31 2021-05-11 航天信息股份有限公司 一种ofd版式发票文件的解析系统及装置
CN112732654B (zh) * 2021-01-12 2021-11-02 江苏中威科技软件系统有限公司 将文件的生命周期信息注册到ofd版式文件的方法
CN113157642A (zh) * 2021-03-19 2021-07-23 浪潮云信息技术股份公司 一种实现电子材料数字化流程自动化的方法
CN113128175B (zh) * 2021-04-19 2023-01-24 福建福昕软件开发股份有限公司 一种大批量pdf文件合并的方法及系统
CN113343254B (zh) * 2021-05-31 2023-09-19 国泰新点软件股份有限公司 基于ofd格式的保函加解密方法、装置、介质及电子设备
CN113408248A (zh) * 2021-06-08 2021-09-17 南京冰鉴信息科技有限公司 一种pdf目录生成方法、装置、计算机设备及可读存储介质
CN113591434A (zh) * 2021-08-05 2021-11-02 江西金格科技股份有限公司 一种ofd文档合并携带语义标引信息的方法
CN113961531B (zh) * 2021-11-05 2022-08-30 江苏中威科技软件系统有限公司 多格式文件合并为一个ofd文件的方法及装置
CN114118023B (zh) * 2021-12-02 2022-07-26 江苏中威科技软件系统有限公司 一种用于转换ofd文件的方法
CN114970487B (zh) * 2022-07-27 2023-01-06 中建电子商务有限责任公司 一种基于富文本生成ofd电子合同的方法
CN115422126B (zh) * 2022-11-04 2023-03-24 浪潮软件股份有限公司 一种证照ofd版式文件快速转图片的方法、系统及装置
CN115934653A (zh) * 2023-01-04 2023-04-07 百望股份有限公司 一种在ofd文件中添加外部ofd页面内容的方法和装置
CN116384356B (zh) * 2023-06-02 2023-08-22 福昕鲲鹏(北京)信息科技有限公司 Ofd文件的表格行创建方法、装置、设备及介质
CN116702721A (zh) * 2023-08-09 2023-09-05 江苏中威科技软件系统有限公司 Ofd文件添加阅读效果的方法及装置
CN116757165B (zh) * 2023-08-09 2023-10-31 江苏中威科技软件系统有限公司 基于版式数据流文件底板将效果工具投影到ofd文件的方法
CN116755593B (zh) * 2023-08-11 2023-10-24 江苏中威科技软件系统有限公司 将信息与文件汇聚白板进行组合或合并阅读及操作的方法
CN117236291B (zh) * 2023-11-16 2024-01-12 北京点聚信息技术有限公司 一种扫描文件快速转化矢量版式文件的方法及系统
CN117493712B (zh) * 2023-12-29 2024-06-21 浙江华东工程数字技术有限公司 Pdf文档可导航目录提取方法、装置、电子设备及存储介质
CN117725885B (zh) * 2024-01-26 2024-04-26 江苏中威科技软件系统有限公司 一种对ofd文件加层雕刻影响阅读操作效果的方法
CN117875263B (zh) * 2024-03-13 2024-05-24 江苏中威科技软件系统有限公司 一种dlf动态版式文件的阅读方法
CN117910438B (zh) * 2024-03-13 2024-06-21 江苏中威科技软件系统有限公司 一种动态版式文件dlf的生成装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105302550A (zh) * 2015-10-12 2016-02-03 江苏中威科技软件系统有限公司 将页面转为版式数据流文件的方法及系统
CN105843786A (zh) * 2016-03-23 2016-08-10 江苏中威科技软件系统有限公司 一种用于版式文件展示的方法及装置
CN110362793A (zh) * 2019-07-18 2019-10-22 江苏中威科技软件系统有限公司 一种用于版式文件转换并展示的方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104346322B (zh) * 2013-08-08 2018-07-10 北大方正集团有限公司 文档格式处理装置和文档格式处理方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105302550A (zh) * 2015-10-12 2016-02-03 江苏中威科技软件系统有限公司 将页面转为版式数据流文件的方法及系统
CN105843786A (zh) * 2016-03-23 2016-08-10 江苏中威科技软件系统有限公司 一种用于版式文件展示的方法及装置
CN110362793A (zh) * 2019-07-18 2019-10-22 江苏中威科技软件系统有限公司 一种用于版式文件转换并展示的方法

Also Published As

Publication number Publication date
CN111753500A (zh) 2020-10-09

Similar Documents

Publication Publication Date Title
CN111753500B (zh) 版式化后的电子表单与ofd合并展现及目录生成的方法
CN111753499B (zh) 电子表单与ofd版式文件合并展现及目录生成的方法
CN111767254B (zh) 基于版式数据流文件技术的多文件阅读装置及其方法
US10810365B2 (en) Workflow system and method for creating, distributing and publishing content
CN111753501B (zh) Ofd文件合并展现迅捷阅读的方法
US7614000B2 (en) File formats, methods, and computer program products for representing presentations
US9110877B2 (en) Method and apparatus for utilizing an extensible markup language schema for managing specific types of content in an electronic document
US20030210428A1 (en) Non-OCR method for capture of computer filled-in forms
US7546533B2 (en) Storage and utilization of slide presentation slides
CN111753502B (zh) Ofd文件合并展现及目录生成方法
CN114330233A (zh) 通过文件底版实现电子表单内容与文件相互关联的方法
US20060136433A1 (en) File formats, methods, and computer program products for representing workbooks
EP1830275A1 (en) Information distribution system
US11205207B2 (en) Automated digital catalog generation
US7720814B2 (en) Repopulating a database with document content
US11934774B2 (en) Systems and methods for generating social assets from electronic publications
US20100169333A1 (en) Document processor
US7231598B1 (en) User interface for editing documents containing markup language
US11113461B2 (en) Generating edit suggestions for transforming digital documents
US20110126091A1 (en) Information processing apparatus, control method, and program
JPWO2005098698A1 (ja) 文書処理装置
JP2014153879A (ja) 編集システム
US20030050790A1 (en) Business card processing system and method
JP2004145736A (ja) 文字認識装置および文字認識データ出力方法およびプログラムおよび記録媒体
JP2012141702A (ja) 電子文書変換装置及び電子文書変換方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant