CN113657080A - 一种基于xml的结构化系统及数据包创建方法 - Google Patents

一种基于xml的结构化系统及数据包创建方法 Download PDF

Info

Publication number
CN113657080A
CN113657080A CN202110917764.7A CN202110917764A CN113657080A CN 113657080 A CN113657080 A CN 113657080A CN 202110917764 A CN202110917764 A CN 202110917764A CN 113657080 A CN113657080 A CN 113657080A
Authority
CN
China
Prior art keywords
file
module
xml
document
structured system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110917764.7A
Other languages
English (en)
Inventor
范轩轩
张建东
陈文�
苟渊
张宏祥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Haiguang Nuclear Power Technology Service Co ltd
Original Assignee
Chengdu Haiguang Nuclear Power Technology Service Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Haiguang Nuclear Power Technology Service Co ltd filed Critical Chengdu Haiguang Nuclear Power Technology Service Co ltd
Priority to CN202110917764.7A priority Critical patent/CN113657080A/zh
Publication of CN113657080A publication Critical patent/CN113657080A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明公开了一种基于XML的结构化系统及数据包创建方法,主文档模块用于存储结构化系统的内容信息;每个子模块均包括用于存储该模块数据内容信息的XML文件以及用于存储该模块中多媒体文件数据信息的目录;驱动模块用于将数据包中的主文档模块与每个子模块的功能进行独立展示,以及用于存储数据信息的ID,并通过数据信息的ID将主文档模块与每个子模块进行关联。本发明的有益效果为将系统原始内容与用户操作内容记录分开,保证原文档的内容不被破坏,更好的提取用户所填数据记录;能够对文档中的子模块进行自定义,实现了结构化系统的不同功能化性质。

Description

一种基于XML的结构化系统及数据包创建方法
技术领域
本发明涉及文档创建领域,具体而言,涉及一种基于XML的结构化系统及数据包创建方法。
背景技术
随着计算机技术的发展与普及,计算机应用技术在各行各业中得到广泛运用,尤其是使用计算机处理各类办公自动化文档,格式最为常见的是微软公司的Microsoft word文档,这类文档是信息化时代的产物,即将纸质化信息存储于电子设备中,使用计算机替代人工书写,数据查阅方便快捷,保存更长久。word注重的是如何在电脑上进行文档的快速编辑与打印,以提供更美观和更有效率的文档书写,但文档中的描述部分与用户数据填写记录部分混在了一起,当用户需要填写数据记录时,会在原文档的基础上打开进行编辑,从而修改了原文档的内容,文档与数据记录是叠加在一起的,而且单独提取文档中的用户填写数据记录部分内容也极其不方便。而在现代社会中,人类的需求不仅限于此,人们更希望除了能长期保存信息外,也能快速获取更有用的数据信息(不仅是文档中的信息,也包含用户填写的记录信息),尤其像核电厂这样的企业,每天会产生大量的工单,而现场作业目前是先将word文档打印出来,现场手工进行填写,再回到电脑上比对word文档进行记录录入。这样一来一回,不仅人员带有情绪重复工作,造成工作效率低下,而且容易录错数据,也无法提取数据记录,更无法进行后续数据的统计与分析,且操作人员在现场通过word文档进行数据记录的时候,容易出现对原始word里面记载的内容在没有任何标记的情况下进行更改。
有鉴于此,特提出本申请。
发明内容
本发明所要解决的技术问题是现有技术中的word文档使用时,在触发其他指令的情况下,才能实现对批注、修改、记录等的内容进行保存,目的在于提供一种基于XML的结构化系统及数据包创建方法,实现了在结构化系统中,不对文档触发任何指令的情况下,在对结构化系统进行修改、批注、记录等操作的时候,进行自动保存,且能够将存储的内容作为原始系统内容的一部分,并将该存储的数据内容进行长久保存,可以在任意一个终端上进行展示出来。
本发明通过下述技术方案实现:
一种基于XML的结构化系统,其特征在于,包括驱动模块以及用于创建定义文档的数据包;所述数据包包括主文档模块与若干独立设置的子模块,所述主文档模块用于存储所述结构化系统的内容信息;每个子模块均包括用于存储该模块数据内容信息的XML文件以及用于存储该模块中多媒体文件数据信息的目录;所述驱动模块用于将所述数据包中的所述主文档模块与每个子模块的功能进行独立展示,以及用于存储数据信息的ID,并通过所述数据信息的ID将所述主文档模块与每个子模块进行关联。
传统的文档结构中,原始文档所撰写的内容,无论在哪一个终端平台上进行展示的时候,任何操作人员在没有任何标记的情况下均可以对文档进行修改,因此当这种文档中记录的是对核电厂数据采集的时候,容易造成操作人员对记载的数据在没有任何标记的情况下进行更改,造成数据不精确;本发明提供一种基于XML的结构化系统,采用驱动模块将里面的各个模块的功能进行独立展示,实现了不对结构化系统的原始内容实施任何指令的情况下,且能够将存储的内容作为原始系统内容的一部分,并将该存储的数据内容进行长久保存,可以在任意一个终端上进行展示出来。
优选地,所述主文档模块包括第一XML文件、第一目录以及第二目录;
所述第一XML文件用于记录结构化系统所有样式文件;
所述第一目录用于存储结构化系统中的多媒体文件数据信息;
所述第二目录包括第一XML文档文件以及第二XML文档文件,所述第一XML文档文件用于存储结构化系统主体数字化数据信息;所述第二XML文档文件用于存储文档元数据以及文档属性信息。
优选地,所述驱动模块包括获取单元、解压单元、分析单元、处理单元以及显示单元;
所述获取单元用于获取所述数据包,并将所述数据包传输到所述解压单元中;
所述解压单元用于对所述数据包进行解压,获得所述数据包中主文档模块的第一XML文件、第一XML文档文件、第二XML文档文件以及各个子模块中的文件信息;
所述分析处理单元用于将所述第一XML文件转换为CSS格式文件,将所述第一XML文档文件中转换为第一HTML文件,并将所述CSS文件与所述第一HTML文件传输到所述显示单元中;
所述处理单元用于对各个子模块中的文件信息进行解析与处理,并将处理后的文件信息叠加在所述第一HTML文件上,获得第二HTML文件;
所述显示单元将所述CSS文件与所述第二HTML文件进行结合,并对所述结构化系统进行展示。
优选地,所述若干独立设置的子模块包括笔记子模块、备注子模块、修改子模块以及工作记录子模块;
所述笔记子模块用于在阅读结构化系统时,对原始结构化系统内容进行注释;
所述修改子模块用于在不修改原结构化系统的情况下,对所述结构化系统进行更新;
所述备注子模块用于对结构化系统中的原始内容进行审核,并将审核结果同时进行反馈;
所述工作记录子模块用于记录现场工作时的数据信息。
优选地,所述笔记子模块包括第二XML文件与第三目录,所述第二XML文件用于对所述结构化系统进行笔记标记;所述第三目录用于存储记录笔记过程的多媒体文件数据信息。
优选地,所述修改子模块包括第三XML文件、第四目录、服务器端XML文件以及终端XML文件;
所述第三XML文件用于对修改内容进行特殊显示;
所述第四目录用于存储多媒体文件数据信息;
所述服务器端XML文件为服务器端创建的文档补丁,用于对结构化系统的内容进行增加或删除或替换或不适用或隐藏而不被删除操作;
所述终端XML文件为客户端创建的文档补丁,用于对结构化系统的内容进行增加或删除或替换或不适用。
优选地,所述备注子模块包括第四XML文件以及第五目录,所述第四XML文件用于对结构化系统在执行升版或校验或审核或批准时,对结构化系统进行备注记录;所述第五目录用于存储在对结构化系统进行备注时的多媒体文件数据信息。
优选地,所述工作记录模块包括第五XML文件以及第六目录,所述第五XML文件用于存储在结构化系统中的工作记录内容;所述第六目录用于存储在进行工作记录时获得的多媒体文件数据信息。
本发明还提供了一种数据包的创建方法,所述数据包用于如上所述的一种结构化系统中,创建方法步骤包括:
S1:创建数据包结构,并在所述数据包结构中创建若干模块;
S2:在每一个模块结构中,创建相对应的XML模块化文件以及存储该模块的多媒体文件数据信息;
S3:将在数据包创建好的模块通过标准ZIP方式进行压缩,获得结构化系统。
本发明还提供了一种数据包的创建方法,所述数据包用于如上所述的一种结构化系统中,创建方法步骤包括:
S1:通过标准ZIP压缩方式,创建第一压缩包;
S2:在所述第一压缩包中,添加数据包结构;
S3:在所述数据包结构中,增加若干模块结构,并在每个模块结构中增加对应的XML文件以及多媒体文件数据信息存储目录,添加完成,获得结构化系统。
本发明与现有技术相比,具有如下的优点和有益效果:
本发明实施例提供的一种基于XML的结构化系统及创建方法,在结构化系统的原始内容中,在不对结构化系统施加任何指令的情况下,对原始内容中的修改、批注、记录等操作进行自动保存,且能够将存储的内容作为原始内容的一部分,并将该存储的数据内容进行长久保存,可以在任意一个终端上进行展示出来,实现了将原始内容与各个子模块实现的功能性内容进行区分。
附图说明
为了更清楚地说明本发明示例性实施方式的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为数据包结构示意图
图2为子模块结构示意图
图3为主文档模块结构示意图
图4为修改子模块示意图
图5为驱动模块示意图
图6为处理单元结构示意图
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施例和附图,对本发明作进一步的详细说明,本发明的示意性实施方式及其说明仅用于解释本发明,并不作为对本发明的限定。
在以下描述中,为了提供对本发明的透彻理解阐述了大量特定细节。然而,对于本领域普通技术人员显而易见的是:不必采用这些特定细节来实行本发明。在其他实施例中,为了避免混淆本发明,未具体描述公知的结构、电路、材料或方法。
在整个说明书中,对“一个实施例”、“实施例”、“一个示例”或“示例”的提及意味着:结合该实施例或示例描述的特定特征、结构或特性被包含在本发明至少一个实施例中。因此,在整个说明书的各个地方出现的短语“一个实施例”、“实施例”、“一个示例”或“示例”不一定都指同一实施例或示例。此外,可以以任何适当的组合和、或子组合将特定的特征、结构或特性组合在一个或多个实施例或示例中。此外,本领域普通技术人员应当理解,在此提供的示图都是为了说明的目的,并且示图不一定是按比例绘制的。这里使用的术语“和/或”包括一个或多个相关列出的项目的任何和所有组合。
在本发明的描述中,术语“前”、“后”、“左”、“右”、“上”、“下”、“竖直”、“水平”、“高”、“低”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的单元或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明保护范围的限制。
实施例一
本实施例公开了一种基于XML的结构化系统,在现有技术中的word文档中,当需要对word文档的内容进行修订或批注操作的时候,需要给原始文档施加批注指令、记录指令或修改指令,才能将修改、批注或记录的新的数据与原始文档内容的数据进行区分,并保存,如果不对原始文档施加任何指令,不会将修改后的数据信息与原始文档内容进行区分,进而重新打开文档的时候,无法直观的展示出该文档中修改的数据信息内容;
在没有施加任何指令的情况下对原始文档进行修改,保存修改的内容,关闭文档,在同一个终端上再重新打开文档的时候,无法将修改的数据信息很清楚的展示出来,且在遇到突发退出文档的情况,在重新打开word文档的时候,也无法在文档的最左边显示修改的文档模板;当将修改的数据信息文档发送到另一个终端上,在另一个终端上进行打开的时候,无法直观的显现出其修改的内容,即修改的内容与原始文档内容混为一体。无法直观地提取修改的内容,也无法对修改的内容进行统计与分析。
本实施例提供了一种基于XML的结构化系统,采用这种结构化系统,在没有对原始文档施加任何指令的情况下,能够直接对原始文档进行修改,并且结构化系统能够将用户在原始文档基础上对原始文档进行修改、记录的数据进行自动区分,并且能够将新记录的数据信息在另一个终端上进行展示;
当对本实施例中提出的将结构化系统中的文档进行修改时,是没有施加任何指令进行的修改,且在没有施加任何指令修改的情况下,能够对原始文档进行批注、修改、记录等数据信息进行保存;
即当没有施加任何指令对结构化系统中的内容进行修改、批注、记录等操作的时候,当新增数据信息时,保存新增内容并在同一个终端关闭系统,再重新打开,会直接在文档中展示出新增的数据信息;当将更改的文档发送到另一个终端的时候,在另一个终端上进行展示的时候,也会将新增或减少的数据信息进行展示;即在结构化系统中,对里面内容在没有任何指令的情况下进行增加、减少或删除等操作,将会永久的保存在该系统中,并随着该文档进行传输。
在本实施例中,如图1所示,结构化系统包括用于创建定义文档的数据包;所述数据包包括主文档模块与若干独立设置的子模块,所述主文档模块用于存储所述结构化系统的内容信息,本实施例中的数据包是一个封装的几何体,通过多个模块独立组成,并列关系,无顺序与优先级之分,各个模块存储着各自独有的信息,模块之间一般以ID相互关联,多个模块相互结合最终形成完成的结构化文档;
在本实施例中,设置的主文档模块以及独立的子模块,均是通过XML来实现的,XML又被叫做可扩展标记语言,用于标记电子文件使其具有结构性的标记语言;采用这种语言来构成结构化系统中的主文档模块与各个子模块,能够通过此种标记,计算机之间可以处理包含各种的信息比如文章等;且能够使得设置的各个子模块之间的内容是可扩展与自定义的。
如图2所示,每个子模块均包括用于存储该模块数据内容信息的XML文件以及用于存储该模块中多媒体文件数据信息的目录,在子模块的内容设置中,设置的XML文件以及其它文件(格式不限),这些文件为模块提供相关数据和文档内容。一个模块即为一个目录结构。
所述数据包设有驱动模块,所述驱动模块用于将所述数据包中的所述主文档模块与每个子模块的功能进行独立展示,以及用于存储数据信息的ID,并通过所述数据信息的ID将所述主文档模块与每个子模块进行关联,设置独立结构的子模块,主要是用于将该子模块的功能进行独立展示,且能够在不对系统内容施加任何指令的情况下,在原文档中进行操作,会将操作的数据信息进行记录或保存,并随着系统永久存储在原系统的内容中,且能够清楚的将原系统中记载的内容与操作的数据内容区分开来。
在本实施例中,如图3所示,主文档模块包括第一XML文件、第一目录以及第二目录,这里的第一XML文件为style.xml文件,第一目录为media目录,第二目录为sd目录;
所述第一XML文件用于记录结构化系统所有样式文件,style.xml文件是记录该结构化文档所有样式的文件,针对该文档中某些元素特有的样式,可对标签进行统一样式设置(如name=“h1”)。其中,document.xml文件中只记录与内容相关的信息,与样式无关,具体的样式及如何展示不记录在该.xml文件中。文档所有样式保存于style.xml文件中,该文件中也包含对文档样式的特殊修改,从而使文档按内容与呈现样式相分离;
所述第一目录用于存储结构化系统中的多媒体文件数据信息,media目录用于存放文档中的多媒体文件(图片、音频、视频)等数据,支持多种格式的多媒体文件;
所述第二目录包括第一XML文档文件以及第二XML文档文件,所述第一XML文档文件用于存储结构化系统主体数字化数据信息;所述第二XML文档文件用于存储文档元数据以及文档属性信息,sd目录用于存放文档数字化数据,内部包含:document.xml与property.xml两个文件,本实施例中第一XML文档文件为document.xml文件,第二XML文档文件为property.xml文件;
document.xml用于存放文档主体数字化数据,即文档全部内容数据,如一般性描述、表格、图片、操作步骤、记录报告等。本发明将整个文档以特定元素(即标签)与相关属性的方法进行数字化描述。如将段落以<p>元素表示,将加粗以<strong>元素表示等等,可以扩展更多的元素与功能;property.xml用于存放文档元数据及文档属性信息,元数据包含版本号、页眉、页脚、关键字(如:文档编码、当前文档版次及子版本号、文档类型、所属公司……)等信息。
document.xml中<body>内部允许的节点:
1)块级元素,2)容器元素;
每一个节点都有一个独立的id属性,id格式为sd[0-9]+。文档中历史上使用过的id最大取值保存于property.xml中的maxid节点,以防止重复使用。驱动模块对元素的删除不影响id的最大取值。
块级元素可存在于文档<body>中,亦可存在于容器中。每个块级元素均为单独段落。
块级元素分为以下四大类:文本段落类,包括段落<p>,无序列表<ul>,有序列表<ol>和分级编号段落<h1>…<h6>;表格<table>;文档格式类,包括水平线<hr/>,特殊分节符<section>,word分节符<wordsection/>和强制分页符<pagebreak/>;特殊功能块,包括设备验证点<evalidate>和QC检查点<qc>。
文本段落类-段落<p>
功能与特点:
Figure BDA0003206259120000071
支持属性:
Figure BDA0003206259120000072
Figure BDA0003206259120000081
注:结构化文档不支持回车符,因此在需要插入空行的时候可使用<p></p>。
文本段落类-无序列表<ul>
功能与特点:
Figure BDA0003206259120000082
支持属性:
Figure BDA0003206259120000083
文本段落类-有序列表<ol>
功能与特点:
Figure BDA0003206259120000084
Figure BDA0003206259120000091
支持属性:
Figure BDA0003206259120000092
文本段落类-分级编号段落<h1>…<h6>
功能与特点
Figure BDA0003206259120000093
支持属性:
Figure BDA0003206259120000094
Figure BDA0003206259120000101
Figure BDA0003206259120000111
文档格式类-水平线<hr/>,功能与特点:
xml标签 <hr/>
描述 水平线
类别 文档格式类
可包含元素
文档呈现形式 独立的水平线,线宽未定义
文档编辑功能 支持插入、删除、移动
支持属性:
属性 描述 是否强制 缺省含义
id=“sd100” 元素ID 无ID
文档格式类-特殊分节符<section>,功能与特点:
Figure BDA0003206259120000112
支持属性:
Figure BDA0003206259120000113
文档格式类-word分节符<wordsection/>,功能与特点:
Figure BDA0003206259120000114
支持属性:
Figure BDA0003206259120000115
Figure BDA0003206259120000121
文档格式类-强制分页符<pagebreak/>,功能与特点:
xml标签 <pagebreak/>
描述 强制分页显示或打印
类别 文档格式类
可包含元素
文档呈现形式 换页显示
文档编辑功能 支持插入、删除、移动
支持属性:
属性 描述 是否强制 缺省含义
id=“sd100” 元素ID 无ID
特殊功能块-设备验证点<evalidate>,功能与特点:
Figure BDA0003206259120000122
支持属性:
Figure BDA0003206259120000123
特殊功能块-QC检查点<qc>,功能与特点:
Figure BDA0003206259120000124
支持属性:
Figure BDA0003206259120000125
Figure BDA0003206259120000131
表格<table>,功能与特点:
Figure BDA0003206259120000132
支持属性:
Figure BDA0003206259120000133
表格行节点<tr>:
Figure BDA0003206259120000134
容器元素,容器是多个块级元素的集合,容器只能包括块级元素,而不能包括孤立文本。可勾选指令<checklist>,功能与特点:
Figure BDA0003206259120000135
Figure BDA0003206259120000141
支持属性:
Figure BDA0003206259120000142
提示框<decl>,功能与特点:
Figure BDA0003206259120000143
支持属性:
Figure BDA0003206259120000144
Figure BDA0003206259120000151
表格单元<td>
表格单元<td>是容器元素,因此内部不能包含孤立文本;<td>为容器元素,允许包括以下块级元素和容器元素:
功能与特点:
Figure BDA0003206259120000152
支持属性:
Figure BDA0003206259120000153
Figure BDA0003206259120000161
文字段落内联元素:内联元素是可以包含于段落<p>,无序列表<ul>,有序列表<ol>和分级编号段落<h1>…<h6>等文本段落类块级元素中的一类特殊元素;内联元素不独立成段落,如果需要单独呈现,可将其包含于空段落<p>之中;内联元素均为自封闭标签,包括:<input/>、<img/>、<audio/>、<video/>、<space/>。
用户输入<input/>,功能与特点:
xml标签 <input/>
描述 在文本段落类块级元素中插入用户输入区
文档呈现形式 根据输入类型不同,而以不同形式呈现
文档编辑功能 支持插入、删除和拷贝粘贴
各类型的input均支持以下属性:
Figure BDA0003206259120000162
Figure BDA0003206259120000171
文本输入text:
Figure BDA0003206259120000172
图片插入<img/>,<img/>在文字段落内插入图片,功能与特点:
Figure BDA0003206259120000173
Figure BDA0003206259120000181
支持属性:
Figure BDA0003206259120000182
音频插入<audio/>,<audio/>在文字段落内插入音频:
功能与特点:
xml标签 <audio/>
描述 在文本段落类块级元素中插入音频文件
文档呈现形式 以音频控件区域的形式显示
文档编辑功能 支持插入、删除
属性:
Figure BDA0003206259120000183
Figure BDA0003206259120000191
视频插入<video/>,<video/>在文字段落内插入视频。
功能与特点:
xml标签 <video/>
描述 在文本段落类块级元素中插入视频文件
文档呈现形式 以视频控件区域的形式显示
文档编辑功能 支持插入、删除
属性:
Figure BDA0003206259120000192
文字空格<space/>,段落内不支持空格,因此所有空格均以<space/>元素展示;<space/>在文字段落内插入空格。
功能与特点:
xml标签 <space/>
描述 在文本段落类块级元素中插入空格
文档呈现形式 文字空格
文档编辑功能 同普通文字
属性:
Figure BDA0003206259120000193
文本格式修饰标签,修饰标签通常是对某几个文字进行格式修饰。
Figure BDA0003206259120000194
Figure BDA0003206259120000201
Figure BDA0003206259120000211
注:当存在样式文件style.xml时,以上修饰标签会覆盖style.xml对应的定义;val=“0”通常应用于取消style.xml中的加粗、斜体、下划线、删除线定义。
property.xml保存文件的版本号,历史版本记录,作者,修改日期,页眉页脚等信息。同时文件也可以key-value的格式保存用户指定的信息。property.xml的根节点为<property>…</property>,内部包含6个子节点,子节点之间无顺序之分。如下表所示:
Figure BDA0003206259120000212
在本实施例中,将若干独立设置的子模块设置为笔记子模块、备注子模块、修改子模块以及工作记录子模块,和主文档模块构成本结构化系统的模块内容;
笔记子模块用于在阅读结构化系统时,对原始结构化系统内容进行注释;笔记子模块包括第二XML文件与第三目录,本实施例中,第二XML文件为annotation.xml文件,第三目录为media目录,第二XML文件用于对所述结构化系统进行笔记标记,annotation.xml文件用于对结构化文档作笔记,如对文本添加高亮显示、添加标注、添加注释等;第三目录用于存储记录笔记过程的多媒体文件数据信息,media目录用于存放记笔记时的多媒体文件等数据,支持多种格式的多媒体文件,文件名以“annotation_”作为前缀。
阅读笔记文件annotation.xml,阅读笔记支持高亮显示和添加注释两类操作。文本由根节点<annotation>和一系列子节点构成;子节点包括高亮显示<highlight/>和注释<note></note>两类;高亮显示<highlight/>,高亮显示用于对文本段落类的块级元素文本内容做高亮显示。<highlight/>支持的属性:
Figure BDA0003206259120000221
<note>支持的属性:
Figure BDA0003206259120000222
<note>支持的子节点,<note>可包括以下子节点:文字注释<p>;图片注释<imgratio=“50%”src=“media/a.jpg”/>;音频注释<audio src=“media/b.wav”/>;视频注释<video src=“media/c.avi”/>;
本实施例中,如图4所示,修改子模块用于在不修改原结构化系统的情况下,对所述结构化系统进行更新,该子模块为补丁模块,用于在不修改原文档的情况下,临时对文档内容进行更新,补丁文件的创建可来自于服务器端,也可来自于客户端。在该目录下包含media目录与server_patch.xml文件、client_patch.xml文件、style.xml文件;
修改子模块包括第三XML文件、第四目录、服务器端XML文件以及终端XML文件,本实施例中,第三XML文件为style.xml文件,第四目录为media目录,服务器端XML文件为server_patch.xml文件,终端XML文件为client_patch.xml文件;第三XML文件用于对修改内容进行特殊显示;第四目录用于存储多媒体文件数据信息,media目录用于存放多媒体文件等数据,支持多种格式的多媒体文件。来自服务器端的文件名以“server_”作为前缀,来自客户端的文件名以“client_”作为前缀;
服务器端XML文件为服务器端创建的文档补丁,用于对结构化系统的内容进行增加或删除或替换或不适用或隐藏而不被删除操作,server_patch.xml文件为来自于服务器端创建的文档补丁,支持五类标签:add增加内容、delete删除内容、hide隐藏内容而不删除内容、replace替换内容、na不适用内容;终端XML文件为客户端创建的文档补丁,用于对结构化系统的内容进行增加或删除或替换或不适用,client_patch.xml文件为来自于客户端(浏览器端或移动端)创建的文档补丁,支持add增加内容、delete删除内容、replace替换内容、na不适用内容四类标签。
服务器端补丁文件server_patch.xml,server_patch.xml包括一个根节点<patch>,<patch>内部可定义一个<hide>节点和多个<add>、<delete>、<replace>和<na>节点;
添加元素<add>,<add>标签用于添加一个元素。支持添加包括容器元素和块级元素之内的所有合法元素;新添加的元素内部id采用“sp123”的格式,即sp[0-9]+,其中sp表示server patch。
<add>节点属性:
Figure BDA0003206259120000231
<delete/>节点属性:
Figure BDA0003206259120000232
Figure BDA0003206259120000241
替换元素<replace>,<replace>节点用于替换文档中的元素的内容或属性。replace不改变元素的sdid。
<replace>可用于以下类型的替换:段落类块级元素或内联元素的内容替换和属性变更;<table>、<tr>、<td>、<checklist>、<decl>的属性变更;段落类块级元素包括<p>、<ol>、<ul>、<h1>…<h6>的互换,如将<p>替换为<h5>。
<replace>节点属性:
Figure BDA0003206259120000242
隐藏元素<hide>,<hide>标签用于隐藏文档中的任意元素。隐藏后,填报软件将看不到这些元素。<hide>用于隐藏块级元素、表格中的行<tr>、<checklist>和<decl>,不用于隐藏内联元素和表格中的单元格<td>。
<hide>节点属性:
Figure BDA0003206259120000243
<hide>内容,server_patch.xml只支持一个<hide>节点,所有需隐藏的元素id都记录在其内容中;当需隐藏多个元素时,各元素id以空格区隔,支持sd100:sd200的形式隐藏sd100至sd200之间(包括)的所有元素。
元素设置为不适用<na/>,<na>标签用于将块级元素、容器元素设置为不适用(N/A)。对不适用的元素,用户无需阅读或填写。
<na/>节点属性:
Figure BDA0003206259120000251
客户端补丁文件client_patch.xml,内容与server_patch.xml相同。但在<add>中,新添加的元素内部id采用“cp123”的格式,即cp[0-9]+,其中cp表示client patch。
格式文件style.xml,格式补丁来自于服务器端,文件格式与main文件夹中的主style.xml相同,用于覆盖后者中具有相同item name的元素样式。
本实施例中,备注子模块用于对结构化系统中的原始内容进行审核,并将审核结果同时进行反馈,用于在文件升版、校验、审核、批准时对结构化文档的内容进行审核与反馈记录,即对文档内容进行批注操作,用于沟通交流过程记录及信息反馈。该目录会在上述任一流程执行完毕时删除,同时原文档内容将被更新。在该目录下包含media目录与comment.xml文件;
备注子模块包括第四XML文件以及第五目录,第四XML文件为comment.xml文件,第五目录为media目录,media目录用于存放备注时的多媒体文件等数据,支持多种格式的多媒体文件,文件名以“comment_”作为前缀,第四XML文件用于对结构化系统在执行升版或校验或审核或批准时,对结构化系统进行备注记录;所述第五目录用于存储在对结构化系统进行备注时的多媒体文件数据信息,comment.xml文件用于对结构化文档执行升版、校验、审核、批准时的备注记录;这里的备注其实质为笔记+补丁的方式,即在执行升版、校验、审核、批准的过程中,既可以对文档进行添加标注、添加注释的方式,也可以对文档进行新增、删除、替换内容的操作。
comment.xml文件:审阅批注支持添加批注、添加元素、删除元素、替换元素四类操作。文本由根节点<comment>和一系列子节点构成,子节点支持:批注<note>、添加<add>、删除<delete>、替换<replace>。
本实施例中,工作记录子模块用于记录现场工作时的数据信息,包含media目录与workrecord.xml文件。
工作记录模块包括第五XML文件以及第六目录,第五XML文件为workrecord.xml文件,第六目录为media目录,第五XML文件用于存储在结构化系统中的工作记录内容,workrecord.xml文件存放工作记录内容,记录包含:文本填写、参数填写、表格填写、备注填写及签名等;所述第六目录用于存储在进行工作记录时获得的多媒体文件数据信息,media目录用于存放工作记录时的多媒体文件等数据,支持多种格式的多媒体文件,文件名以“record_”作为前缀。
在本实施中,如图5所示,驱动模块包括获取单元、解压单元、分析单元、处理单元以及显示单元。
获取单元用于获取构成结构化系统的所述数据包,并将所述数据包传输到所述解压单元中,解压之后可以获得结构化系统中的主文档模块以及各个子模块中包含的所有的文件;
所述解压单元用于对所述数据包进行解压,获得所述数据包中主文档模块的第一XML文件、第一XML文档文件、第二XML文档文件以及各个子模块中的文件信息,对解压后的main/style.xml文件以及main/sd/document.xml文件进行解析;
所述分析处理单元用于将所述第一XML文件转换为CSS格式文件,将所述第一XML文档文件中转换为第一HTML文件,并将所述CSS文件与所述第一HTML文件传输到所述显示单元中,判断文件的合法性与标签、内容的正确性,如文件名是否正确,标签是否合法,内容是否有重复的ID出现等等情况;解析style.xml文件中的内容为标准CSS格式;解析document.xml文件中的标签与属性,将其转换成HTML认识的标签与属性;
针对普通文档效果展示:
因xml中的某些元素,无法直接应用在页面中进行展示,故须进行转换或特殊处理,才能被页面解析。如:对<audio>、<video>标签中加入属性controls="controls",可以在页面中展示播放控件;根据<wordsection>中的orientation属性,将页面渲染成横、纵向纸张效果;段落行末最后一个复选框右对齐……
处理单元用于对各个子模块中的文件信息进行解析与处理,并将处理后的文件信息叠加在第一HTML文件上,获得第二HTML文件;
工作记录子模块中的现场数据的展示。又将处理模块再细分为如下三个模块,如图6所示:查询模块,获取工作记录子模块中的现场数据,记录内容通常为一个ID对应一个数据;匹配模块,通过ID与主模块文档中的ID元素进行匹配,找到对应的唯一ID元素;设置模块,将该ID的工作记录数据设置到文档中相同ID元素的内容中去;
显示单元将所述CSS文件与所述第二HTML文件进行结合,并对所述结构化系统进行展示,将解析处理后的样式与内容相结合,形成最终的内容,在单元中进行呈现。
本实施例中所说的结构化系统,其本质就是一个以.nsd为扩展名的独立标准ZIP压缩格式文件,其内部仅由一系列的标准XML文件、多媒体(图片、音频、视频)文件与文件夹构成,它是数字化与互联网时代的产物。
结构化系统采用独特的文档与数据记录相分离保存的设计方式,对文档数据的展示与提取,以及后续数据的统计与分析都非常的方便,对整个文档以特定的元素(即标签)与相关属性的方法进行结构化描述,可以实现更多强大的功能以及定制化功能,标签与属性用户也可以实现自定义以满足相关业务需求。因此,.nsd结构化文档具有高度可扩展性,支持对文档数据包中的模块目录、模块内容文件、文档标签、标签属性进行自定义扩展。
采用本实施例提供的结构化系统,有益效果为结构化系统支持插入音频、视频与高清图片;智能多级标题(如:标题1.1,1.2.3等),杜绝人为错误与不规范录入;基于网络布局的图片插入排版;表格标题与图片脚注的绑定;支持类电子表格的表格单元格计算与统计;支持公式编辑,以实现自动计算;用户参数填写方式多样化(如:文本型、数字型、单选、复选、日期、时间、拍照、录音、录像、签名等);支持有序、无序列表;针对有逻辑步骤的列表操作,支持步骤的逻辑执行(如:顺序执行、跳转执行与循环执行等等);支持签名与备注;原始文档与其它数据分开独立保存,互不影响;开放接口与标准,对文档内元素与数据进行索引与查询。
实现了在不对结构化系统施加任何一个指令的情况下,将对原始文档操作的数据信息、修改记录、备注记录、笔记记录与原始系统记载的内容信息进行区分,且能够保存到结构化系统中,随结构化系统进行传输。
实施例二
本实施例公开了一种数据包创建方法,本实施例中创建的数据包应用于实施例一中的结构化系统中,分为两种不同的方法进行创建,其中一个方法为:
S1:创建数据包结构,并在所述数据包结构中创建若干模块,因数据包由模块组成,故先创建一个临时目录(名称随意),在这个临时目录中创建五个空目录,其目录名称分别为:main、annotation、comment、modify、record,分别表示:主文档模块、笔记子模块、备注子模块、修改子模块、工作记录子模块;
S2:在每一个模块结构中,创建相对应的XML模块化文件以及存储该模块的多媒体文件数据信息;
创建main模块结构:在main目录中创建media目录,文档中所需要的多媒体文件放在media目录中;在main目录中创建sd目录,在sd目录中分别创建document.xml与property.xml文件,分别用于存放文档主体数字化数据与存放文档元数据及文档属性信息。其为标准XML格式规范;在main目录中创建style.xml文件,用于记录文档样式。
创建annotation模块结构:在annotation目录中创建media目录,用于存放记笔记时的多媒体文件等数据;在annotation目录中创建annotation.xml文件,用于记录文档笔记时的内容。
创建comment模块结构:在comment目录中创建media目录,用于存放备注时的多媒体文件等数据;在comment目录中创建comment.xml文件,用于对文档执行升版、校验、审核、批准时的备注记录。
创建modify模块结构:在modify目录中创建media目录,用于存放多媒体文件等数据;在modify目录中创建style.xml文件,用于客户端特殊显示的临时修改;在modify目录中创建server_patch.xml文件,用于服务器端创建的文档补丁记录;在modify目录中创建client_patch.xml文件,用于客户端(浏览器端或移动端)创建的文档补丁记录。
创建record模块结构:在record目录中创建media目录,用于存放工作记录时的多媒体文件等数据;在record目录中创建workrecord.xml文件,用于存放现场工作记录内容;
S3:将在数据包创建好的模块通过标准ZIP方式进行压缩,获得结构化系统,需要注意的是压缩方式上只能选择标准ZIP方式压缩,不能选用RAR、7z等方式压缩,而且压缩包的第一层即为数据包结构,即为五大目录,不能是其它目录或格式。
另一个创建结构化系统的方法为:
S1:通过标准ZIP压缩方式,创建第一压缩包;
S2:在所述第一压缩包中,添加数据包结构,在空压缩包中,添加数据包结构;将五大目录添加到这个空压缩包中;
S3:在所述数据包结构中,增加若干模块结构,并在每个模块结构中增加对应的XML文件以及多媒体文件数据信息存储目录,添加完成,获得结构化系统;
添加main模块结构:在main目录中添加media目录;在main目录中添加sd目录,在sd目录中分别添加document.xml与property.xml文件;在main目录中添加style.xml文件。
添加annotation模块结构:在annotation目录中添加media目录;在annotation目录中添加annotation.xml文件。
添加comment模块结构:在comment目录中添加media目录;在comment目录中添加comment.xml文件。
添加modify模块结构:在modify目录中添加media目录;在modify目录中添加style.xml文件;在modify目录中添加server_patch.xml文件;在modify目录中添加client_patch.xml文件。
添加record模块结构:在record目录中添加media目录;在record目录中添加workrecord.xml文件
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于XML的结构化系统,其特征在于,包括驱动模块以及用于创建定义文档的数据包;所述数据包包括主文档模块与若干独立设置的子模块,所述主文档模块用于存储所述结构化系统的内容信息;每个子模块均包括用于存储该模块数据内容信息的XML文件以及用于存储该模块中多媒体文件数据信息的目录;所述驱动模块用于将所述数据包中的所述主文档模块与每个子模块的功能进行独立展示,以及用于存储数据信息的ID,并通过所述数据信息的ID将所述主文档模块与每个子模块进行关联。
2.根据权利要求1所述的一种基于XML的结构化系统,其特征在于,所述主文档模块包括第一XML文件、第一目录以及第二目录;
所述第一XML文件用于记录结构化系统所有样式文件;
所述第一目录用于存储结构化系统中的多媒体文件数据信息;
所述第二目录包括第一XML文档文件以及第二XML文档文件,所述第一XML文档文件用于存储结构化系统主体数字化数据信息;所述第二XML文档文件用于存储文档元数据以及文档属性信息。
3.根据权利要求2所述的一种基于XML的结构化系统,其特征在于,所述驱动模块包括获取单元、解压单元、分析单元、处理单元以及显示单元,
所述获取单元用于获取所述数据包,并将所述数据包传输到所述解压单元中;
所述解压单元用于对所述数据包进行解压,获得所述数据包中主文档模块的第一XML文件、第一XML文档文件、第二XML文档文件以及各个子模块中的文件信息;
所述分析处理单元用于将所述第一XML文件转换为CSS格式文件,将所述第一XML文档文件中转换为第一HTML文件,并将所述CSS文件与所述第一HTML文件传输到所述显示单元中;
所述处理单元用于对各个子模块中的文件信息进行解析与处理,并将处理后的文件信息叠加在所述第一HTML文件上,获得第二HTML文件;
所述显示单元将所述CSS文件与所述第二HTML文件进行结合,并对所述结构化系统进行展示。
4.根据权利要求1所述的一种基于XML的结构化系统,其特征在于,所述若干独立设置的子模块包括笔记子模块、备注子模块、修改子模块以及工作记录子模块;
所述笔记子模块用于在阅读结构化系统时,对原始结构化系统内容进行注释;
所述修改子模块用于在不修改原结构化系统的情况下,对所述结构化系统进行更新;
所述备注子模块用于对结构化系统中的原始内容进行审核,并将审核结果同时进行反馈;
所述工作记录子模块用于记录现场工作时的数据信息。
5.根据权利要求4所述的一种基于XML的结构化系统,其特征在于,所述笔记子模块包括第二XML文件与第三目录,所述第二XML文件用于对所述结构化系统进行笔记标记;所述第三目录用于存储记录笔记过程的多媒体文件数据信息。
6.根据权利要求4所述的一种基于XML的结构化系统,其特征在于,所述修改子模块包括第三XML文件、第四目录、服务器端XML文件以及终端XML文件;
所述第三XML文件用于对修改内容进行特殊显示;
所述第四目录用于存储多媒体文件数据信息;
所述服务器端XML文件为服务器端创建的文档补丁,用于对结构化系统的内容进行增加或删除或替换或不适用或隐藏而不被删除操作;
所述终端XML文件为客户端创建的文档补丁,用于对结构化系统的内容进行增加或删除或替换或不适用。
7.根据权利要求4所述的一种基于XML的结构化系统,其特征在于,所述备注子模块包括第四XML文件以及第五目录,所述第四XML文件用于对结构化系统在执行升版或校验或审核或批准时,对结构化系统进行备注记录;所述第五目录用于存储在对结构化系统进行备注时的多媒体文件数据信息。
8.根据权利要求4所述的一种基于XML的结构化系统,其特征在于,所述工作记录模块包括第五XML文件以及第六目录,所述第五XML文件用于存储在结构化系统中的工作记录内容;所述第六目录用于存储在进行工作记录时获得的多媒体文件数据信息。
9.一种数据包的创建方法,其特征在于,所述数据包用于如权利要求1~8任一一种结构化系统中,创建方法步骤包括:
S1:创建数据包结构,并在所述数据包结构中创建若干模块;
S2:在每一个模块结构中,创建相对应的XML模块化文件以及存储该模块的多媒体文件数据信息;
S3:将在数据包创建好的模块通过标准ZIP方式进行压缩,获得结构化系统。
10.一种数据包的创建方法,其特征在于,所述数据包用于如权利要求1~8任一一种结构化系统中,创建方法步骤包括:
S1:通过标准ZIP压缩方式,创建第一压缩包;
S2:在所述第一压缩包中,添加数据包结构;
S3:在所述数据包结构中,增加若干模块结构,并在每个模块结构中增加对应的XML文件以及多媒体文件数据信息存储目录,添加完成,获得结构化系统。
CN202110917764.7A 2021-08-11 2021-08-11 一种基于xml的结构化系统及数据包创建方法 Pending CN113657080A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110917764.7A CN113657080A (zh) 2021-08-11 2021-08-11 一种基于xml的结构化系统及数据包创建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110917764.7A CN113657080A (zh) 2021-08-11 2021-08-11 一种基于xml的结构化系统及数据包创建方法

Publications (1)

Publication Number Publication Date
CN113657080A true CN113657080A (zh) 2021-11-16

Family

ID=78479470

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110917764.7A Pending CN113657080A (zh) 2021-08-11 2021-08-11 一种基于xml的结构化系统及数据包创建方法

Country Status (1)

Country Link
CN (1) CN113657080A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117453199A (zh) * 2023-10-24 2024-01-26 成都愿景仿视科技有限公司 一种xml数据创建系统及应用

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR19980083539A (ko) * 1997-05-16 1998-12-05 윤종용 마크업언어로 작성된 문서를 출력하는 마크업언어 뷰어 및 방법
US20030177443A1 (en) * 2001-11-16 2003-09-18 Christoph Schnelle Maintenance of a markup language document in a database
US20070130176A1 (en) * 2005-12-07 2007-06-07 Shigehisa Kawabe Document processing method, recording medium, and document processing system
CN101895578A (zh) * 2010-07-06 2010-11-24 国都兴业信息审计系统技术(北京)有限公司 基于综合安全审计的文档监控管理系统
US20120060082A1 (en) * 2010-09-02 2012-03-08 Lexisnexis, A Division Of Reed Elsevier Inc. Methods and systems for annotating electronic documents
KR20150064822A (ko) * 2013-12-04 2015-06-12 주식회사 프라이머스코즈 전자문서 관리 시스템

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR19980083539A (ko) * 1997-05-16 1998-12-05 윤종용 마크업언어로 작성된 문서를 출력하는 마크업언어 뷰어 및 방법
US20030177443A1 (en) * 2001-11-16 2003-09-18 Christoph Schnelle Maintenance of a markup language document in a database
US20070130176A1 (en) * 2005-12-07 2007-06-07 Shigehisa Kawabe Document processing method, recording medium, and document processing system
CN101895578A (zh) * 2010-07-06 2010-11-24 国都兴业信息审计系统技术(北京)有限公司 基于综合安全审计的文档监控管理系统
US20120060082A1 (en) * 2010-09-02 2012-03-08 Lexisnexis, A Division Of Reed Elsevier Inc. Methods and systems for annotating electronic documents
KR20150064822A (ko) * 2013-12-04 2015-06-12 주식회사 프라이머스코즈 전자문서 관리 시스템

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117453199A (zh) * 2023-10-24 2024-01-26 成都愿景仿视科技有限公司 一种xml数据创建系统及应用
CN117453199B (zh) * 2023-10-24 2024-05-28 成都愿景仿视科技有限公司 一种xml数据创建系统及应用

Similar Documents

Publication Publication Date Title
CN111753500B (zh) 版式化后的电子表单与ofd合并展现及目录生成的方法
CN111753499B (zh) 电子表单与ofd版式文件合并展现及目录生成的方法
US7363581B2 (en) Presentation generator
US7673235B2 (en) Method and apparatus for utilizing an object model to manage document parts for use in an electronic document
US7546533B2 (en) Storage and utilization of slide presentation slides
Edhlund Nvivo 9 essentials
EP2041672B1 (en) Methods and apparatus for reusing data access and presentation elements
US20060236228A1 (en) Extensible markup language schemas for bibliographies and citations
US20060294468A1 (en) Storage and utilization of slide presentation slides
EP1672528A2 (en) File Formats, Methods, and Computer Program Products for Representing Workbooks
EP1672523A2 (en) Method and system for linking data ranges of a computer-generated document with associated extensible markup language elements
AU2005225130A1 (en) Management and use of data in a computer-generated document
CN111145855A (zh) 一种临床pdf报告自动化生成方法及系统
WO2007035815A2 (en) An electronic publishing system and method for managing publishing requirements in a neutral format
US5983231A (en) Instance updating method and apparatus therefor
US8423888B2 (en) Document conversion and use system
CN113657080A (zh) 一种基于xml的结构化系统及数据包创建方法
CN116090416B (zh) 基于标准知识图谱的标准编写方法、系统、设备及介质
US20090287994A1 (en) Document processing device and document processing method
KR101251686B1 (ko) 표시 가능 파일의 필드 및 참조 문헌 및 인용문에 대한확장형 마크업 언어 스키마의 결정
US20040267550A1 (en) Automated method for authoring and delivering product catalogs
KR100709379B1 (ko) 메타파일을 이용한 문서양식 제작방법
US20040164989A1 (en) Method and apparatus for disclosing information, and medium for recording information disclosure program
JP4737659B2 (ja) 表組データベースシステムおよび表組データ作成装置
CN117744615A (zh) 表单数据处理方法、装置、电子设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination