CN106933781A - 一种word文档数据写入系统和方法 - Google Patents

一种word文档数据写入系统和方法 Download PDF

Info

Publication number
CN106933781A
CN106933781A CN201511022478.5A CN201511022478A CN106933781A CN 106933781 A CN106933781 A CN 106933781A CN 201511022478 A CN201511022478 A CN 201511022478A CN 106933781 A CN106933781 A CN 106933781A
Authority
CN
China
Prior art keywords
data
source
description file
word document
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201511022478.5A
Other languages
English (en)
Inventor
徐多宏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Aisino Corp
Original Assignee
Aisino Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Aisino Corp filed Critical Aisino Corp
Priority to CN201511022478.5A priority Critical patent/CN106933781A/zh
Publication of CN106933781A publication Critical patent/CN106933781A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/109Font handling; Temporal or kinetic typography
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/117Tagging; Marking up; Designating a block; Setting of attributes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明涉及word文档数据写入技术领域,公开了一种word文档数据写入系统和方法,该系统包括:接收单元,接收数据源标签、源数据和样式数据;描述文件创建单元,根据通过数据源标签标识的样式数据和源数据创建描述文件;数据转换单元,对描述文件进行转换以得到目标数据;目标文档生成单元,根据目标数据生成word文档数据,从而将word文档数据写入word应用,在之后需要进行word文档数据写入时,接收单元仅需要接收源数据和样式数据,然后根据样式数据和源数据得到目标数据,从而生成word文档数据。本发明通过以上技术方案,使用户在需要改变word文档中的文字样式时,仅需要改变转换之前的样式数据和源数据,大大提高了大数据内容的word文档的写入效率。

Description

一种word文档数据写入系统和方法
技术领域
本发明涉及word文档数据写入技术,具体地,涉及一种word文档数据写入系统和方法。
背景技术
在企业信息管理系统中,涉及到很多Word操作相关的业务,如公文管理、合同管理等业务模块中Word文档操作相关的功能。由于该逻辑功能的应用广泛而重要,故探索一种高效、快捷的Word操作方式对开发工作尤为重要。由于微软对Word的源码尚未开源,直接对其进行操作的方法很少,特别是基于纯Java技术的跨平台操作的方法甚少。
目前行业里主要运用Jacob、POI以及某些企业独创的方法进行操作,通过实践比较,发现现有的方法均存在一些缺陷和改进之处。例如,Jacob方法因其对本地库的依赖性较高,无法实现跨平台性;POI方法通过操作二进制格式的Word,效率较低且公布的API较少,对高版本的Word支持较差等;还有一些企业公布的独创方法,因其需要借助于Office的转换工具来获取Word文档的XML描述文件,通过复杂的分析算法来获取数据内容的写入,实现起来较为繁琐,成本较高。
发明内容
本发明的目的是提供一种word文档数据写入系统和方法,用于解决简单快捷地进行word文档数据写入的问题。
为了实现上述目的,本发明提供了一种word文档数据写入系统,该系统包括:接收单元,用于接收样式数据和源数据;数据转换单元,用于对所述样式数据和所述源数据进行转换,以得到目标数据;以及目标文档生成单元,用于根据所述目标数据生成word文档数据,从而将word文档数据写入word应用。
相应地,本发明还提供了一种word文档数据写入方法,该方法包括:接收样式数据和源数据;对所述样式数据和所述源数据进行转换,以得到目标数据;以及根据所述目标数据生成word文档数据,从而将word文档数据写入word应用。
通过上述技术方案,本发明通过对所接收的样式数据和源数据进行转换后再生成word文档数据,从而用户在需要改变word文档中的文字样式时,仅需要改变转换之前的样式数据和源数据,大大提高了大数据内容的word文档的写入效率。
本发明的其它特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
附图是用来提供对本发明的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本发明,但并不构成对本发明的限制。在附图中:
图1是本发明提供的word文档数据写入系统的框图;
图2是本发明具体实施方式提供的word文档输入写入过程的流程图;
图3是本发明提供的数据结构建模图示;以及
图4是本发明提供的word文档数据写入方法的流程图。
具体实施方式
以下结合附图对本发明的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本发明,并不用于限制本发明。
图1是本发明提供的word文档数据写入系统的框图,如图1所示,该系统包括接收单元、数据转换单元和目标文档生成单元。接收单元用于接收样式数据和源数据;数据转换单元用于对样式数据和源数据进行转换,以得到目标数据;目标文档生成单元用于根据所述目标数据生成word文档数据,从而将word文档数据写入word应用。
word文档中的样式相关的数据构成样式数据,在用户需要改变word文档中的文字样式时,数据转换单元是将所接收到的样式数据和源数据转换为word文档的xml格式的描述文件,该xml格式的描述文件即为数据转换单元转换得到的目标数据,从而目标文档生成单元就可以根据转换后的目标数据来生成word文档数据,从而实现了word文档数据的写入,即改变了word文档中的样式数据。其中,源数据例如为所要改变样式的文字。
进一步地,本发明提供的word文档数据写入系统还包括描述文件创建单元,该描述文件创建单元用于根据所接收的样式数据和源数据来创建描述文件,以在该描述文件中包括样式数据和源数据;其中,数据转换单元对描述文件进行转换,以得到目标数据。也就是说,在接收单元接收到样式数据和源数据之后,描述文件创建单元首先根据所接收的样式数据和源数据来创建描述文件,本领域技术人员应当理解,word文档的描述文件是固定格式和固定语言的,因而需要将所接收的样式数据和源数据创建成相应的描述文件。
举例来说,word文档的描述文件如下:
如果操作人员采用面向对象方法将word文档数据写入word应用,那么所接收的样式数据就为面向对象的语言代码(这里为基于JAVA语言的代码),例如:
setSize(‘4’);
setColor(‘auto’);
setSpace(‘0’);
setHAnsi(‘宋体’);
setHint(‘eastAsia’);
因而,就需要数据转换单元将所接收的样式数据转换为xml格式的描述文件,即目标数据。
此外,为了容易识别样式数据的描述,图1中所示的接收单元还用于接收数据源标签、初始样式数据和初始源数据,该初始样式数据和初始源数据通过数据源标签来标识,描述文件创建单元根据通过数据源标签标识的初始样式数据和初始源数据来创建初始描述文件,以在该初始描述文件中包括初始样式数据;其中,数据转换单元对初始描述文件进行转换,以得到目标数据。
数据源标签即为数据内容的原始标识,标签的属性代表了目标数据内容的默认属性,本发明中所描述的数据源标签格式例如可以以$和双层括弧{{}}出现,如一个表示标题的标签可以定义为:${{title}}。类似地,可以定义副标题、内容、日期等。可以预先设定多种数据源标签,例如字体、大小、颜色,及表格的宽度、行列信息、图片的大小等。在首次采用本发明提供的技术来进行word文档数据写入时,就需要首先通过数据源标签标识的初始样式数据和初始源数据来创建初始描述文件,这里初始源数据例如为首次需要改变样式的文字。
本领域技术人员应当理解,通过这种方式可以产生一份word文件,可以将该word文件称为word模板文件,可以将该word模板文件的后缀修改为rar或者zip以将该word模板文件改为压缩包的形式,通过调用JAVA的解压方法即可获取该压缩包的描述文件,该压缩包中主要包括以下两类文件:一类为word文档基础描述文件,另一类即为含有数据源标签的目标数据的描述文件。这种巧妙便捷的xml提取方法提升了运行效率。
也就是说,在利用图1所示的方式将word文档数据写入word应用之前,可以通过数据源标签来标识初始样式数据和初始源数据,这里的初始样式数据就是在首次进行word文档数据写入时的目的样式,这里的初始源数据就是在首次进行word文档数据写入时所要改变样式的文字,在接收单元未接收到新的样式数据和新的源数据的情况下,数据转换单元对根据初始样式数据和初始源数据创建的初始描述文件进行转换,得到相应的目标数据,从而目标文档生成单元根据该目标数据生成word文档数据,并将其写入word应用。
此外,接收单元还用于接收更新样式数据和更新源数据;描述文件创建单元根据更新样式数据和更新源数据来创建更新描述文件,以在该更新描述文件中包括更新样式数据;其中,数据转换单元对更新描述文件进行转换,以得到目标数据。这里更新样式数据即为新的样式数据,更新源数据即为新的源数据,这里称为更新样式数据和更新源数据仅仅是为了与初始样式数据和初始源数据区别,更新样式数据是与之前的样式数据(包括初始样式数据)不同的样式数据,更新源数据是与之前的源数据(包括初始源数据)不同的源数据。
在初始样式数据和初始源数据被转换为初始描述文件并写入word应用之后,在改变word应用中的样式数据和源数据时,接收单元就会接收到更新样式数据和更新源数据,并以上文中所描述的方法得到相应的目标数据(即新的目标数据)并生成word文档数据,然后写入word应用。本领域技术人员应当理解,将word文档数据写入word应用包括目标数据的内容的写入和样式的写入。
下面举例说明采用本发明提供的技术进行word文档数据写入的过程,图2是本发明具体实施方式提供的word文档输入写入过程的流程图,如图2所示:
步骤201,创建初始描述文件,该初始描述文件以对象类(例如,基于JAVA语言)的方式进行描述。预先需要设计好各种数据源标签,将初始样式数据和初始源数据通过数据源标签来标识。初始描述文件中包括初始样式数据和初始源数据。在步骤201之前,接收单元接收数据源标签、初始样式数据和初始源数据,描述文件创建单元根据通过数据源标签标识的初始样式数据和初始源数据创建初始描述文件,数据转换单元对初始描述文件进行转换,然后生成word文档数据,再写入word应用。
步骤202,接收更新样式数据和更新源数据。这里所接收的更新样式数据例如为对象类格式的数据,所接收的更新源数据例如为文字。
步骤203,对所接收的更新样式数据和更新源数据进行转换,得到目标数据。在该步骤中,将对象类格式的数据转换为xml格式的数据。
步骤204,根据目标数据生成word文档数据。
步骤205,将word文档数据写入word应用。
图3是本发明提供的数据结构建模图示,如图3所示,数据转换单元(TransferEngine)将源数据、数据样式(DataStyle)和数据源标签(DataSourceLabel)构成的数据转换为目标数据(DataObject)。概括来说,word文档的描述文件为xml文件,而word的源码尚未开源,因而无法对word文档直接进行操作,所以本发明是通过定义初始描述文件,并从中解析出所定义的数据源标签标识的样式数据和源数据,并将其转换为基于JAVA的对象类,在需要对word文档的样式数据和源数据进行更改时,可以更改该对象类的描述,然后再将更改后的JAVA描述转换为xml描述文件。通过该技术方案,可以通过更改该对象类的描述语言来实现更改word文档中的样式。
图4是本发明提供的word文档数据写入方法的流程图,如图4所示,该方法包括:接收样式数据和源数据;对样式数据和源数据进行转换,以得到目标数据;以及根据目标数据生成word文档数据,从而将word文档数据写入word应用。
应当注意的是,本发明提供的word文档数据写入方法的具体细节及益处与本发明提供的word文档数据写入系统类似,于此不予赘述。
以上结合附图详细描述了本发明的优选实施方式,但是,本发明并不限于上述实施方式中的具体细节,在本发明的技术构思范围内,可以对本发明的技术方案进行多种简单变型,这些简单变型均属于本发明的保护范围。
本发明提供的word文档数据写入技术可以基于JAVA实现,不仅增强了系统的可维护性,而且大大提升了业务系统的开发效率。
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合。为了避免不必要的重复,本发明对各种可能的组合方式不再另行说明。
此外,本发明的各种不同的实施方式之间也可以进行任意组合,只要其不违背本发明的思想,其同样应当视为本发明所公开的内容。

Claims (8)

1.一种word文档数据写入系统,其特征在于,该系统包括:
接收单元,用于接收样式数据和源数据;
数据转换单元,用于对所述样式数据和所述源数据进行转换,以得到目标数据;以及
目标文档生成单元,用于根据所述目标数据生成word文档数据,从而将word文档数据写入word应用。
2.根据权利要求1所述的系统,其特征在于,该系统还包括:
描述文件创建单元,用于根据所接收的样式数据和源数据来创建描述文件,以在该描述文件中包括所述样式数据和所述源数据;
其中,所述数据转换单元对所述描述文件进行转换,以得到所述目标数据。
3.根据权利要求2所述的系统,其特征在于,
所述接收单元还用于接收数据源标签、初始样式数据和初始源数据;以及
所述描述文件创建单元根据通过所述数据源标签标识的初始样式数据和初始源数据来创建初始描述文件,以在该初始描述文件中包括所述初始样式数据;
其中,所述数据转换单元对所述初始描述文件进行转换,以得到所述目标数据。
4.根据权利要求3所述的系统,其特征在于,
所述接收单元还用于接收更新样式数据和更新源数据;以及
所述描述文件创建单元根据所述更新样式数据和所述更新源数据来创建更新描述文件,以在该更新描述文件中包括所述更新样式数据;
其中,所述数据转换单元对所述更新描述文件进行转换,以得到所述目标数据。
5.一种word文档数据写入方法,其特征在于,该方法包括:
接收样式数据和源数据;
对所述样式数据和所述源数据进行转换,以得到目标数据;以及
根据所述目标数据生成word文档数据,从而将word文档数据写入word应用。
6.根据权利要求5所述的方法,其特征在于,该方法还包括:
根据所接收的样式数据和源数据来创建描述文件,以在该描述文件中包括所述样式数据和所述源数据;以及
对所述描述文件进行转换,以得到所述目标数据。
7.根据权利要求6所述的方法,其特征在于,该方法还包括:
接收数据源标签、初始样式数据和初始源数据;
根据通过所述数据源标签标识的初始样式数据和初始源数据来创建初始描述文件,以在该初始描述文件中包括所述初始样式数据;以及
对所述初始描述文件进行转换,以得到所述目标数据。
8.根据权利要求7所述的方法,其特征在于,该方法还包括:
接收更新样式数据和更新源数据;
根据所述更新样式数据和所述更新源数据来创建更新描述文件,以在该更新描述文件中包括所述更新样式数据;以及
对所述更新描述文件进行转换,以得到所述目标数据。
CN201511022478.5A 2015-12-30 2015-12-30 一种word文档数据写入系统和方法 Pending CN106933781A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201511022478.5A CN106933781A (zh) 2015-12-30 2015-12-30 一种word文档数据写入系统和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201511022478.5A CN106933781A (zh) 2015-12-30 2015-12-30 一种word文档数据写入系统和方法

Publications (1)

Publication Number Publication Date
CN106933781A true CN106933781A (zh) 2017-07-07

Family

ID=59441534

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201511022478.5A Pending CN106933781A (zh) 2015-12-30 2015-12-30 一种word文档数据写入系统和方法

Country Status (1)

Country Link
CN (1) CN106933781A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1392986A (zh) * 2000-01-31 2003-01-22 Xml都市公司 用于产生各种呈现的结构化文档的方法和装置
CN101078989A (zh) * 2007-07-31 2007-11-28 阮俊杰 Visio文档跨平台网络浏览器的实现方法及软件
CN101706772A (zh) * 2009-12-14 2010-05-12 中国移动通信集团山西有限公司 Word文档的操作方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1392986A (zh) * 2000-01-31 2003-01-22 Xml都市公司 用于产生各种呈现的结构化文档的方法和装置
CN101078989A (zh) * 2007-07-31 2007-11-28 阮俊杰 Visio文档跨平台网络浏览器的实现方法及软件
CN101706772A (zh) * 2009-12-14 2010-05-12 中国移动通信集团山西有限公司 Word文档的操作方法及装置

Similar Documents

Publication Publication Date Title
CN106569801B (zh) 一种基于复杂参数的组态化显控系统
CN109254992A (zh) 项目生成方法及系统、计算机系统和计算机可读存储介质
CN103955345B (zh) 一种数据打印方法及系统
CN104035754A (zh) 一种基于xml的自定义代码生成方法及生成器
CN107783949A (zh) 一种ppt文档的处理方法和装置
JP2002318798A (ja) 構造化文書翻訳におけるユーザ制御可能なデータをグループ化する方法およびシステム
CN105786921B (zh) 一种非结构化文档的数据模块转化方法和装置
CN102103605A (zh) 一种智能提取文档结构的方法及系统
CN104461519A (zh) 一种流程表单动态生成和权限控制的方法
CN101553779B (zh) 将主机系统应用程序转换为开放系统应用程序的转换装置和方法
CN106294493A (zh) 实现文档格式转换的方法及装置
CN106339498A (zh) 数据同步方法、装置和系统
CN100585561C (zh) 在嵌入式系统剪裁可重定位的elf文件的方法
US20100100807A1 (en) Data processing device, and data processing method
CN102096660A (zh) 一种文档并行处理方法及系统
CN101377737A (zh) 应用系统资源管理装置
CN104537012A (zh) 数据处理方法和装置
CN101968804B (zh) 一种实现协同翻译的方法
US20080282143A1 (en) Document Processing Device and Document Processing Method
US20080256437A1 (en) Document Processing Apparatus and Document Processing Method
US8656371B2 (en) System and method of report representation
CN106933781A (zh) 一种word文档数据写入系统和方法
CN101587470A (zh) 文档的编辑方法及装置
CN113918140A (zh) 一种基于拖拽方式生成前后端代码的系统构建方法
CN105045774A (zh) 一种所见即所得的用户界面操作手册编写及生成方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170707