CN107203627A - 一种结构化数据与Word文档之间互相转换的方法 - Google Patents

一种结构化数据与Word文档之间互相转换的方法 Download PDF

Info

Publication number
CN107203627A
CN107203627A CN201710392197.1A CN201710392197A CN107203627A CN 107203627 A CN107203627 A CN 107203627A CN 201710392197 A CN201710392197 A CN 201710392197A CN 107203627 A CN107203627 A CN 107203627A
Authority
CN
China
Prior art keywords
data
document
content control
template
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710392197.1A
Other languages
English (en)
Inventor
张振宇
李玉成
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Inspur Genersoft Information Technology Co Ltd
Original Assignee
Shandong Inspur Genersoft Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Inspur Genersoft Information Technology Co Ltd filed Critical Shandong Inspur Genersoft Information Technology Co Ltd
Priority to CN201710392197.1A priority Critical patent/CN107203627A/zh
Publication of CN107203627A publication Critical patent/CN107203627A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/258Data format conversion from or to a database

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种结构化数据与Word文档之间互相转换的方法,属于计算机技术领域,本发明通过参数界面定义映射关系,操作简洁明了,绑定内容控件可以控制数字、日期、表格等多种输入类型,通过与文档的XML结构树节点进行数据交换,结构清晰,数据在文档控件中的呈现交由Word自动完成。相比以往方法改进了交换方式、输入方式可控制、对应关系简单明了、表格数据可按行自增,满足了业务系统的需求。

Description

一种结构化数据与Word文档之间互相转换的方法
技术领域
本发明涉及计算机技术领域,尤其涉及一种结构化数据与Word文档之间互相转换的方法。
背景技术
在ERP系统开发中经常遇到需要将数据导出到外部文件或从外部文件导入等需求,对于Word文档数据交换,以往实现多是基于直接HTML转换或者利用书签功能实现变量替换,书签功能单一不能控制输入方式,对于表格多行数据也不易处理,直接HTML转换容易出现格式变动等细节误差。
发明内容
为了解决以上技术问题,本发明提出了一种移动终端实时定位环境状况显示方法。本发明通过Word的内容控件技术实现了结构化数据与文档数据的交换,通过参数界面定义映射关系,操作简洁明了,绑定内容控件可以控制数字、日期、表格等多种输入类型,通过与文档的XML结构树节点进行数据交换,结构清晰,数据在文档控件中的呈现交由Word自动完成。
本发明的技术方案是:
一种结构化数据与Word文档之间互相转换的方法,
主要包括以下三个过程:
模板定义过程:构建用于存储结构化数据与WORD内容映射的参数表,直接存储参数设置装置的序列化数据;根据所需生成的文档样式定义相应模板,在需要填充表单数据的地方填充内容控件,获取文档全部内容控件并构建文档XML结构;在参数设置界面设置模型字段与XML节点数据映射关系并进行存储;
文档生成过程:根据模板标识读取参数表中的映射关系,调用表达式解析器解析表单数据生成XML节点数据,Word文档中的绑定控件数据会自动更新;
数据抽取以及表单生成过程:同样根据参数表中映射关系,将文档中XML节点数据抽取出来,填充表单。
利用内容控件建立模板文档数据,并对内容控件名称标识唯一性进行检查。
还包括抽取内容控件后要建立文档XML结构树并与控件进行绑定,绑定后XML节点数据与内容控件数据可以同步更新。
参数设置表结构如下:
抽取文档数据时直接获取文档XML结构树数据即可,不需要再获取内容控件进行读取数据操作。
本发明主要有以下操作步骤:
1、建立参数表用以存储Word模板和模型的关系以及具体映射关系的内容,其中映射关系内容直接进行序列化存储。
2、新建一个Word模板,按照需要将固定内容进行编写,将需要进行数据交换的部分预留对应输入内容控件,对于表格类型的要通过重复分区内容控件内包含单行表格的方式进行预留,为每个内容控件设置唯一名称标识,并在保存导入时检查。
3、在本发明的装置中导入步骤2中定义的模板,会自动获取全部内容控件信息,并根据内容控件信息生成文档的XML部件。
4、选择要绑定的表单数据模型,在标签表格中为每个内容控件选择要绑定的数据模型字段,或者绑定多个模型字段组成的计算表达式,对于表格类型的标签,选中后在下侧表格设置中为每一列绑定模型字段信息,设置完成后将映射关系保存入数据库参数表中。
5、本发明还为该数据交换装置提供了两个接口,即生成文档接口和生成结构化数据接口,分别用于选择表单按模板导出数据和选择模板将模板中的数据抽取填充结构化表单。
该方法使用后可在界面上设置列表方式进行操作,包括:模型选择帮助、标签列表、表格字段列表三部分。分别用于设置对应表单模型、获取Word模板标签和设置Word中表格控件信息。
导入Word模板后自动获取内容控件信息,并检查控件名称是否重复,并能将“重复分区内容控件”解析为表格,且重复分区内容控件中的控件不会重复获取,当鼠标点击标签列表中的“表格类型”控件时,在表格字段列表中设置每一列与数据模型的对应关系。
能够解析为标的的控件组合特征包括:在重复分区内容控件中嵌套单行表格,利用XML重复节点特征可以实现自动展示多行数据功能。
具体实施方式
下面以合同管理为例,对本发明的内容进行更加详细的阐述:
1、通过以下建表SQL将参数表完善进目标ERP系统中。
/*==============================================================*/
/* Table: SCMDocTemplate */
/*==============================================================*/
/**/
if not exists (select 1 from sysobjects where id = object_id('SCMDocTemplate')
and Type = 'U')
begin
create table SCMDocTemplate (
TemplateCardID varchar(36) not null,
TemplateID varchar(36) not null,
TemplateName nvarchar(60) not null,
TemplateVersion varchar(20) not null,
IsInvalid char(1) not null default '0',
StartDate datetime not null,
EndDate datetime null,
DocID varchar(36) null,
DataModel varchar(36) null,
TemplateContent varchar(1) null,
Note nvarchar(200) null,
constraint PK_SCMDOCTEMPLATE primary key (TemplateCardID)
)
end
go
2、按照用户需要定制合同条款模板,并将条款内容留白,条款明细作为表格方式,其他详细内容嵌入到文档中。
3、系统中打开本装置提供的功能,选择导入模板,本装置解析模板,在参数设置界面中展示出所有的标签项,选择合同管理中合同表单的数据模型,按照对应关系为每个文档中的XML结构节点绑定对应关系后保存。
4、导出Word文档:打开合同表单,点击导出Word文档功能(需二次开发,将本装置提供的接口实现在表单功能里),选择模板,导出即可。
5、提取Word文档内容生成表单:在实现了本装置接口的功能中,通过Word模板生成合同表单,选择模板后会将模板数据抽取到表单相应的输入区,完成表单制作。
本发明提供的结构化表单与Word文档数据交换方法和装置已经成功运用于浪潮GS产品中,例如合同管理、电子采购招投标工具等功能,相比以往方法改进了交换方式、输入方式可控制、对应关系简单明了、表格数据可按行自增,满足了业务系统的需求。

Claims (7)

1.一种结构化数据与Word文档之间互相转换的方法,其特征在于,
主要包括以下三个过程:
模板定义过程:构建用于存储结构化数据与WORD内容映射的参数表,直接存储参数设置装置的序列化数据;根据所需生成的文档样式定义相应模板,在需要填充表单数据的地方填充内容控件,获取文档全部内容控件并构建文档XML结构;在参数设置界面设置模型字段与XML节点数据映射关系并进行存储;
文档生成过程:根据模板标识读取参数表中的映射关系,调用表达式解析器解析表单数据生成XML节点数据,Word文档中的绑定控件数据会自动更新;
数据抽取以及表单生成过程:同样根据参数表中映射关系,将文档中XML节点数据抽取出来,填充表单。
2.根据权利要求1所述的方法,其特征在于,
利用内容控件建立模板文档数据,并对内容控件名称标识唯一性进行检查。
3.根据权利1要求所述的方法,其特征在于,
抽取内容控件后要建立文档XML结构树并与控件进行绑定,绑定后XML节点数据与内容控件数据可以同步更新。
4.根据权利1要求所述的方法,其特征在于,
参数设置表结构如下:
5.根据权利1要求的方法,其特征在于,
抽取文档数据时直接获取文档XML结构树数据即可,不需要再获取内容控件进行读取数据操作。
6.根据权利1所述的方法,其特征在于,
具体操作步骤为:
1)建立参数表用以存储Word模板和模型的关系以及具体映射关系的内容,其中映射关系内容直接进行序列化存储;
2)新建一个Word模板,按照需要将固定内容进行编写,将需要进行数据交换的部分预留对应输入内容控件,对于表格类型的要通过重复分区内容控件内包含单行表格的方式进行预留,为每个内容控件设置唯一名称标识,并在保存导入时检查;
3)导入步骤2)中定义的模板,会自动获取全部内容控件信息,并根据内容控件信息生成文档的XML部件;
4)选择要绑定的表单数据模型,在标签表格中为每个内容控件选择要绑定的数据模型字段,或者绑定数个模型字段组成的计算表达式,对于表格类型的标签,选中后在下侧表格设置中为每一列绑定模型字段信息,设置完成后将映射关系保存入数据库参数表中。
7.根据权利6所述的方法,其特征在于,
设置两个接口,即生成文档接口和生成结构化数据接口,分别用于选择表单按模板导出数据和选择模板将模板中的数据抽取填充结构化表单。
CN201710392197.1A 2017-05-27 2017-05-27 一种结构化数据与Word文档之间互相转换的方法 Pending CN107203627A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710392197.1A CN107203627A (zh) 2017-05-27 2017-05-27 一种结构化数据与Word文档之间互相转换的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710392197.1A CN107203627A (zh) 2017-05-27 2017-05-27 一种结构化数据与Word文档之间互相转换的方法

Publications (1)

Publication Number Publication Date
CN107203627A true CN107203627A (zh) 2017-09-26

Family

ID=59906694

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710392197.1A Pending CN107203627A (zh) 2017-05-27 2017-05-27 一种结构化数据与Word文档之间互相转换的方法

Country Status (1)

Country Link
CN (1) CN107203627A (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108021632A (zh) * 2017-11-23 2018-05-11 中国移动通信集团河南有限公司 非结构化数据与结构化数据相互转换处理方法
CN108334485A (zh) * 2018-01-16 2018-07-27 广东电网有限责任公司信息中心 一种运用自动化技术实现一键生成world报告的方法
CN108763171A (zh) * 2018-04-20 2018-11-06 中国船舶重工集团公司第七〇九研究所 一种基于格式模板的文档自动化生成方法
CN109726244A (zh) * 2019-01-29 2019-05-07 北京中电普华信息技术有限公司 数据导入方法及装置
CN109815450A (zh) * 2017-11-20 2019-05-28 北大方正集团有限公司 XML文件转换Word文件的方法及装置
CN110019478A (zh) * 2017-12-28 2019-07-16 贵州白山云科技股份有限公司 数据导入方法、介质、设备及装置
CN110032674A (zh) * 2019-01-31 2019-07-19 北京梆梆安全科技有限公司 数据提取方法、装置、服务器及存储介质
CN110413977A (zh) * 2019-08-02 2019-11-05 山东浪潮通软信息科技有限公司 一种基于书签技术动态生成合同文本的方法
CN111274768A (zh) * 2018-12-04 2020-06-12 北大方正集团有限公司 期刊论文转换为xml数据的方法、装置、设备及存储介质
CN112783957A (zh) * 2019-11-11 2021-05-11 上海遴睿教育科技有限公司 一种英语阅读word文档格式化导入方法及系统
CN113792042A (zh) * 2021-08-10 2021-12-14 浪潮金融信息技术有限公司 一种表格分析数据集的配置方法、系统及介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102207980A (zh) * 2011-07-11 2011-10-05 东莞市盈达信息科技股份有限公司 一种基于xml与db的数据交换方法及该数据适配器
CN104199975A (zh) * 2014-09-23 2014-12-10 中国南方电网有限责任公司 一种基于可配置的word文档结构化提取方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102207980A (zh) * 2011-07-11 2011-10-05 东莞市盈达信息科技股份有限公司 一种基于xml与db的数据交换方法及该数据适配器
CN104199975A (zh) * 2014-09-23 2014-12-10 中国南方电网有限责任公司 一种基于可配置的word文档结构化提取方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
万里鹏: ""非结构化到结构化数据转换的研究与实现"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
文龙: ""基于XML的非结构化数据管理研究及应用"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109815450A (zh) * 2017-11-20 2019-05-28 北大方正集团有限公司 XML文件转换Word文件的方法及装置
CN108021632B (zh) * 2017-11-23 2020-07-07 中国移动通信集团河南有限公司 非结构化数据与结构化数据相互转换处理方法
CN108021632A (zh) * 2017-11-23 2018-05-11 中国移动通信集团河南有限公司 非结构化数据与结构化数据相互转换处理方法
CN110019478B (zh) * 2017-12-28 2020-04-03 贵州白山云科技股份有限公司 数据导入方法、介质、设备及装置
CN110019478A (zh) * 2017-12-28 2019-07-16 贵州白山云科技股份有限公司 数据导入方法、介质、设备及装置
CN108334485A (zh) * 2018-01-16 2018-07-27 广东电网有限责任公司信息中心 一种运用自动化技术实现一键生成world报告的方法
CN108763171A (zh) * 2018-04-20 2018-11-06 中国船舶重工集团公司第七〇九研究所 一种基于格式模板的文档自动化生成方法
CN108763171B (zh) * 2018-04-20 2021-12-07 中国船舶重工集团公司第七一九研究所 一种基于格式模板的文档自动化生成方法
CN111274768A (zh) * 2018-12-04 2020-06-12 北大方正集团有限公司 期刊论文转换为xml数据的方法、装置、设备及存储介质
CN111274768B (zh) * 2018-12-04 2022-02-22 北大方正集团有限公司 期刊论文转换为xml数据的方法、装置、设备及存储介质
CN109726244A (zh) * 2019-01-29 2019-05-07 北京中电普华信息技术有限公司 数据导入方法及装置
CN110032674A (zh) * 2019-01-31 2019-07-19 北京梆梆安全科技有限公司 数据提取方法、装置、服务器及存储介质
CN110413977A (zh) * 2019-08-02 2019-11-05 山东浪潮通软信息科技有限公司 一种基于书签技术动态生成合同文本的方法
CN112783957A (zh) * 2019-11-11 2021-05-11 上海遴睿教育科技有限公司 一种英语阅读word文档格式化导入方法及系统
CN113792042A (zh) * 2021-08-10 2021-12-14 浪潮金融信息技术有限公司 一种表格分析数据集的配置方法、系统及介质
CN113792042B (zh) * 2021-08-10 2023-09-15 浪潮金融信息技术有限公司 一种表格分析数据集的配置方法、系统及介质

Similar Documents

Publication Publication Date Title
CN107203627A (zh) 一种结构化数据与Word文档之间互相转换的方法
US11042556B2 (en) Localized link formation to perform implicitly federated queries using extended computerized query language syntax
US11042560B2 (en) Extended computerized query language syntax for analyzing multiple tabular data arrangements in data-driven collaborative projects
US11620301B2 (en) Extended computerized query language syntax for analyzing multiple tabular data arrangements in data-driven collaborative projects
CN101452503A (zh) 一种异构临床医疗信息共享系统和方法
CN105224631B (zh) 搭建行业开放云的系统及编制xbrl财务报表的方法
CN106708480A (zh) 管理平台实现方法和装置
CN105849726A (zh) 用于高效地支持通过分层标记数据的即席查询的通用索引
US20090327343A1 (en) Schema-based data transfer between a data-based application and a document application
CN105426470B (zh) 一种动态生成表格的系统及方法
CN104317864B (zh) 一种基于iec61850逻辑节点的信息模型自动识别的方法
US8654125B2 (en) System and method of chart data layout
CN104573022A (zh) 一种HBase的数据查询方法及装置
CN101908056A (zh) 从任意二维数据集中识别和抽象可视化点的设备和方法
WO2007100702A2 (en) System and method for enabling persistent values when navigating in electronic documents
CN104598635A (zh) 一种基于xml描述的复杂文档自动生成方法
CN101110075A (zh) Gis矢量数据精确转换成kml的方法
CN102122280A (zh) 一种智能提取内容对象的方法及系统
CN104679453B (zh) 一种信息录入、储存及排版打印的通用系统及方法
CN110502667A (zh) 基于dom框架的odx文档解析和生成技术
CN104899340A (zh) 一种基于最紧致片段的ietm技术信息片段检索装置及其检索方法
CN106528896A (zh) 一种数据库优化方法和装置
CN105335482B (zh) 面向海量分布式数据库的批量插入方法
CN103927168B (zh) 一种面向对象的数据模型持久化的方法及装置
CN108763457A (zh) 基于格式化模板的通用型数据导出方法、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170926

RJ01 Rejection of invention patent application after publication