CN101216835A - 一种数据文档转换方法及装置 - Google Patents
一种数据文档转换方法及装置 Download PDFInfo
- Publication number
- CN101216835A CN101216835A CNA2007103084117A CN200710308411A CN101216835A CN 101216835 A CN101216835 A CN 101216835A CN A2007103084117 A CNA2007103084117 A CN A2007103084117A CN 200710308411 A CN200710308411 A CN 200710308411A CN 101216835 A CN101216835 A CN 101216835A
- Authority
- CN
- China
- Prior art keywords
- data
- document
- data item
- template
- destination document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000006243 chemical reaction Methods 0.000 title claims abstract description 57
- 238000000034 method Methods 0.000 title claims abstract description 49
- 238000013507 mapping Methods 0.000 claims abstract description 84
- 238000012545 processing Methods 0.000 claims description 42
- 230000003068 static effect Effects 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 239000012634 fragment Substances 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012856 packing Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
Images
Landscapes
- Document Processing Apparatus (AREA)
Abstract
本发明公开了一种数据文档转换方法及装置,用以提高数据文档转换的效率。该方法包括:根据第一目标文档数据模板所定义的各数据项,获取相应的源数据文档;确定第一目标文档数据模板所定义的各数据项、与源数据文档中各数据项之间的映射关系;根据所述映射关系,从所述源数据文档中获取第一目标文档数据模板所定义的各数据项对应数据;根据所述第一目标文档数据模板、和获取的所述第一目标文档数据模板所定义的各数据项对应数据,生成第一目标文档。
Description
技术领域
本发明涉及计算机技术领域,特别涉及一种数据文档转换技术。
背景技术
现有计算机数据查询技术中,通常使用SQL(Structured Query Language,结构化查询语言)语句作为数据文档转换的桥梁,通过SQL语句对数据库进行查询,将查询结果按配置文件规定的格式写入相应的数据区。
例如,在使用SQL语句查询涉及多张表情况的时候,现有技术通常是在一个SQL语句中关联多张表进行查询,这种方法当关联的表越多、查询的数据记录越多时,系统需频繁的处理IO,过多的占用内存,计算机查询处理速度便会明显下降,数据查询时间也会明显延长,数据文档转换的效率较低。另外,当数据查询涉及多个数据库甚至不同类型的数据库时,一个SQL语句很难实现,这时通常对每个查询编写一段较复杂的程序进行处理。
另外,公开号为CN1556482的中国专利文献公开了“一种用于实现数据库多表查询的数据处理方法”,该方法配置数据查询的相关信息,将数据查询按一定规则分解为多个子查询,先读取查询配置信息中的参数信息,从配置信息中读取查询相关信息,根据查询语句及参数信息拼装SQL语句,连接子查询涉及的数据库,然后执行SQL语句,将查询结果写入相应的内存数据区,根据查询元素的汇总属性,生成合计记录。这种方法同样需要通过SQL语句对数据库进行查询,需要大量读取数据库中的数据,系统需频繁的处理IO,过多的占用内存,数据文档转换的效率较低。
可见,现有技术在进行数据转换时,需要大量读取数据库中的数据,系统需频繁的处理IO,过多的占用内存,数据文档转换的效率较低。
发明内容
本发明实施例提供一种数据文档转换方法及装置,用以提高数据文档转换的效率。
本发明实施例提出一种数据文档转换方法,包括下列步骤:
根据第一目标文档数据模板所定义的各数据项,获取相应的源数据文档;
确定第一目标文档数据模板所定义的各数据项、与源数据文档中各数据项之间的第一映射关系;
根据所述第一映射关系,从所述源数据文档中获取第一目标文档数据模板所定义的各数据项对应数据;
根据所述第一目标文档数据模板、和获取的所述第一目标文档数据模板所定义的各数据项对应数据,生成第一目标文档。
本发明实施例提出一种数据文档转换装置,包括:
获取文档单元,用于根据第一目标文档数据模板所定义的各数据项,获取相应的源数据文档;
标记存储单元,用于存储第一目标文档数据模板所定义的各数据项标记、和所述获取的源数据文档各数据项标记;
第一映射关系确定单元,用于根据所述标记存储单元存储的标记信息,确定第一目标文档数据模板所定义的各数据项、与源数据文档中各数据项之间的第一映射关系;
获取数据单元,用于根据所述第一映射关系,从所述源数据文档中获取第一目标文档数据模板所定义的各数据项对应数据;
第一生成单元,用于根据所述第一目标文档数据模板、和获取的所述第一目标文档数据模板所定义的各数据项对应数据,生成第一目标文档。
本发明实施例提出一种数据文档转换方法及装置。本发明实施例的技术方案中,首先根据用户需求生成第一目标文档数据模板,数据模板中定义了用户需求的数据项、以及各数据项对应数据的排列顺序,之后,根据第一目标文档数据模板所定义的各数据项获取相应的源数据文档;确定第一目标文档数据模板所定义的各数据项、与源数据文档中各数据项之间的第一映射关系;根据该第一映射关系,从源数据文档中获取第一目标文档数据模板所定义的各数据项对应数据;根据第一目标文档数据模板、和获取的第一目标文档数据模板所定义的各数据项对应数据,生成第一目标文档,从而快速地完成了源数据文档到目标文档的转换,提高了数据文档转换的效率。
附图说明
图1为本发明实施例中数据文档转换方法流程图;
图2为本发明实施例中目标文档显示方法流程图;
图3为本发明实施例一中数据文档转换方法示意图;
图4为本发明实施例二中数据文档转换方法示意图;
图5为本发明实施例中数据文档转换装置示意图。
具体实施方式
为了解决现有技术中存在的问题,本发明实施例提出一种数据文档转换方法及装置。在本发明实施例的技术方案中,如果用户希望生成包含用户需求信息的第一目标文档,则可以首先根据用户需求生成第一目标文档数据模板,数据模板中定义了用户需求的数据项、以及各数据项对应数据的排列顺序,之后,根据第一目标文档数据模板所定义的各数据项获取相应的源数据文档;确定第一目标文档数据模板所定义的各数据项、与源数据文档中各数据项之间的第一映射关系;根据第一映射关系,从源数据文档中获取第一目标文档数据模板所定义的各数据项对应数据;根据第一目标文档数据模板、和获取的第一目标文档数据模板所定义的各数据项对应数据,生成第一目标文档,从而完成了源数据文档到第一目标文档的转换。根据用户需要,还可以根据本发明实施例方法将源数据文档转换成多个第一目标文档,并可以对第一目标文档中数据信息进行数据处理生成第二目标文档,或者对源数据文档进行数据处理生成第三目标文档;或者在生成的两个或者多个目标文档之间对数据信息进行相应数据处理生成第四目标文档,得到用户需求的数据信息,从而完成了源数据文档到多个目标文档的转换。应用本发明实施例技术方案可以快速地完成源数据文档到一个或多个目标文档的转换,提高了数据文档转换的效率。
其中,本发明的一种较优实施例是应用于XML(Extensible MarkupLanguage,可扩展标识语言)文档到另一个或多个XML文档的转换。XML是一种专门在WORLD WIDE WEB上传递信息的语言,它基于一种公共的开发标准,可以方便的在网络上通过TCP/IP协议传输,利于通过网络进行协作开发,XML文档以树形结构进行组织,可以定义任意的文档标签,可以以结构化的方式描述和存储各种信息,如学生成绩、企业报表等。
本发明实施例定义XML文档中包含单节点、静态表节点、动态表节点等数据节点,其中,单节点是指节点只包含一个数据项,如姓名、照片等;静态表节点指表格中行数目固定的表格节点,如班级学生从高一到高三,这个表只有三行信息,所以固定;动态表节点指表格中行数目不固定,如班级考试成绩的记录时间,不固定,则要设置成动态表节点,以便添加新的记录时间。XML文档中的每条数据项均由TAG或ID标记。
参阅图1所示,以XML文档为例,本发明实施例提出的数据文档转换方法包括下列步骤:
S101、根据第一目标文档数据模板所定义的各数据项,获取相应的源数据文档。
其中,源数据文档可以为任意形式的XML文档,比如可以是传统的DBMS(DataBase Management System,数据库管理系统),可以是由程序自动生成的XML文档,也可以是由用户制作的XML文档等。获取的相应源数据文档中数据项与第一目标文档数据模板所定义的各数据项相同。获取的源数据文档可以是一个源数据文档、或者多个源数据文档。
第一目标文档数据模版是根据用户需求设定的,其定义了第一目标文档包括的各数据项、以及各数据项对应数据的排列顺序。
S102、确定第一目标文档数据模板所定义的各数据项、与源数据文档中各数据项之间的第一映射关系。
比如,当第一目标文档数据模板所定义的一个数据项与源数据文档中的一个数据项映射,此时,第一目标文档数据模板所定义的该数据项对应数据与源数据文档中相应数据项对应数据也一一映射。
第一目标文档也为XML文档。XML文档中各数据项以TAG或ID标记。因此,映射关系包括TAG到ID之间的映射、或者ID到TAG之间的映射、或者TAG到TAG之间的映射、或者ID到ID之间的映射。
S103、根据第一映射关系,从源数据文档中获取第一目标文档数据模板所定义的各数据项对应数据。
S104、根据第一目标文档数据模板、和获取的第一目标文档数据模板所定义的各数据项对应数据,生成第一目标文档。
将获取的第一目标文档数据模板所定义的各数据项对应数据,映射到第一目标文档数据模板的对应数据项,生成第一目标文档。
S105、获取计算模板设定的数据信息的数据处理规则,并确定计算模板中各数据项、与第一目标文档中各数据项之间的第二映射关系;根据计算模板设定的数据信息的数据处理规则、和第二映射关系,对第一目标文档中数据信息进行相应数据处理,生成第二目标文档。
至此,完成了第一目标文档到第二目标文档的转换。
其中,数据处理规则包括计算规则和统计规则,计算规则为加、减、乘、除等,统计规则为排序、方差等。
例如,假设在S104生成的第一目标文档中包括学生A期末考试的“数学成绩”数据项以及对应数据“80”、“语文成绩”数据项以及对应数据“80”、和“英语成绩”数据项以及对应数据“80”。用户希望得知学生A的期末考试总成绩,因此用户可以设定计算模板,计算模板设定的数据处理规则为:将学生A各数据项对应数据加和。确定计算模板中各数据项、与第一目标文档中各数据项之间的第二映射关系之后,将计算模板设定的数据处理规则应用于第一目标文档,对学生A“数学成绩”数据项、“语文成绩”数据项和“英语成绩”数据项各自的对应数据进行加和以得到学生A的期末考试总成绩“240”,生成包括学生A的期末考试总成绩“240”信息的第二目标文档。
另外,根据用户需要,也可以确定计算模板中各数据项、与源数据文档中各数据项之间的第三映射关系,并根据计算模板设定的数据信息的数据处理规则、和第三映射关系,对源数据文档中数据信息进行相应数据处理,生成第三目标文档,从而完成了源数据文档到第三目标文档的转换。
例如,源数据文档中包括学生B期末考试的“数学成绩”数据项以及对应数据“90”、“语文成绩”数据项以及对应数据“90”、和“英语成绩”数据项以及对应数据“90”,源数据文档中不包括学生B的“期末考试总成绩”数据项,但用户希望最后能得到学生B的期末考试总成绩,此时,可以设定计算模板中设定数据处理规则为:将学生B各数据项对应数据加和。确定计算模板中各数据项、与源数据文档中各数据项之间的第二映射关系之后,将计算模板设定的数据处理规则应用于源数据文档,对学生B“数学成绩”数据项、“语文成绩”数据项和“英语成绩”数据项各自的对应数据进行加和以得到学生B的期末考试总成绩“270”;之后,生成第三目标文档,完成了源数据文档到第三目标文档的转换。
当应用本发明实施例方法生成多个目标文档时,可以对同一个目标文档的数据信息进行数据处理,也可以确定计算模板中各数据项、与生成的两个或多个目标文档各数据项之间的第四映射关系,并根据计算模板设定的数据信息的数据处理规则、和第四映射关系,在生成的两个或多个目标文档数据信息之间进行相应数据处理,生成第四目标文档,完成多个目标文档到另外一个目标文档的转换。
S106、将生成的所有目标文档中的数据信息按照预先设定的显示模式进行显示。
以生成第一目标文档和第二目标文档为例,参阅图2所示,S106进一步包括如下步骤:
S201、设定报表模板和皮肤模板,报表模板数据项与第一目标文档中数据项、第二目标文档中数据项具有一一映射关系,报表模板中数据项与皮肤模板中数据项具有一一映射关系;其中,报表模板规定了第一目标文档和第二目标文档中数据信息的显示模式(比如规定了显示界面是表格、图表等)、和数据项对应数据在显示界面上的位置等;皮肤模板规定了显示界面的颜色等信息。
S202、根据报表模板数据项与第一目标文档中数据项、第二目标文档中数据项的映射关系,生成第五目标文档。
S203、根据皮肤模板数据项与报表模板数据项的映射关系,将第五目标文档显示。
具体地,可以将第一目标文档和第二目标文档中的数据信息按照预先设定的显示模式显示在WEB、表格、图表中等。
在S104之后,如果不需要对第一目标文档进行数据处理,则不需执行S105-S106,而可以按照与S106相似的显示方法,将第一目标文档中的数据信息按照预先设定的显示模式进行显示。
在S101-S106中,即生成各个目标文档的过程中,如果某数据项对应数据发生了改变,则本发明实施例方法还支持数据回写,即本发明实施例可以在数据文档转换过程中跟踪该数据项对应数据的状态,当数据项对应数据发生改变时,根据相关映射关系,在整个转换过程中该数据项对应数据都会发生变化。例如,当某学生的语文成绩在数据文档转换的过程中发生改变,则在源数据文档、目标文档及对该数据项对应数据进行处理时都会做相应的修改。
具体地,比如:可以设定一个数据回写报表,该数据回写报表用标记记录了支持数据回写的数据项,假设其中包括某数据项Q。当用户改变了第一目标文档中数据项Q的对应数据时,先到数据回写报表中查找数据回写报表中是否包括数据项Q,如果有,则说明该数据项Q支持数据回写,可以根据第一目标文档数据模板所定义的各数据项、与源数据文档中各数据项之间的映射关系,对应地将源数据文档中数据项Q对应数据修改成:第一目标文档中数据项Q的对应数据。同样地,如果在对各数据文档中数据信息进行数据处理时,改变了某数据项对应数据,则可以先到数据回写报表中查找数据回写报表中是否包括数据项,如果是,则说明该数据项支持数据回写,可以根据相关映射关系,将各个数据文档中该数据项对应数据进行修改。
本发明实施例提供的数据文档转换方法,只需要在所有源数据文档中获取生成第一目标文档需要的源数据文档,进而将获取的源数据文档转换成第一目标文档,而不需要对数据库进行大量频繁查询,因此本发明实施例提供的数据文档转换方法能快速地完成源数据文档到目标文档的转换,提高了数据文档转换的效率;进一步地,还能对源数据文档、第一目标文档中数据信息进行数据处理(统计分析或计算),快速地生成另外多个目标文档,完成源数据文档到多个目标文档的转换,得到用户需求的数据信息。
实施例一
本发明实施例一利用本发明实施例提供的数据文档转换方法,将包含学生李明信息的源数据文档转换成第一目标文档,并将第一目标文档中的数据信息进行显示,本发明实施例一希望将学生李明的数据信息按照图3所示的显示模式显示,则本发明实施例一包括下列步骤:
A1、根据第一目标文档数据模板所定义的各数据项,获取相应的源数据文档。
其中,第一目标文档数据模板定义的数据项以ID标记,该数据模板的片段如下所示:
<td id=″grade″/>
<td id=″chinese″/>
<td id=″mathematic″/>
<td id=″english″/>
<td id=″chemistry″/>
<td id=″physics″/>
</tr>
根据第一目标文档数据模板所定义的各数据项,在所有学生源数据文档中查找包含学生李明对应信息的源数据文档,所查找到包含学生李明对应信息的源数据文档中包括姓名、性别等学生个人状况数据项,以及各学年各科目的学习成绩等数据项,上述数据项均为单节点数据项,以TAG标记,上述数据项片段如下所示:
<item id=″grade″name=″″>高一</item>
<item id=″P1″name=″语文″valuetype=″float″>88</item>
<item id=″P2″name=″数学″valuetype=″float″>80</item>
<item id=″P3″name=″英语″valuetype=″float″>90</item>
<item id=″P4″name=″化学″valuetype=″float″>83</item>
<item id=″P5″name=″物理″valuetype=″float″>88</item>
</items>
A2、确定第一目标文档数据模板所定义的各数据项、与源数据文档中各数据项之间的第一映射关系。
其中,将源数据文档中的“年级”、“语文”、“数学”、“英语”、“化学”、“物理”数据项,分别与数据模板中“grade”、“chinese”、“mathematic”、“english”、“chemistry”、“physics”数据项一一映射。
本发明实施例一的第一映射关系是TAG到ID之间的映射。
A3、根据第一映射关系,从源数据文档中获取第一目标文档数据模板所定义的各数据项对应数据。
A4、根据第一目标文档数据模板、和获取的第一目标文档数据模板所定义的各数据项对应数据,生成第一目标文档,从而完成源数据文档到第一目标文档的转换。
A5、将第一目标文档中的数据信息按照预先设定的显示模式进行显示。
本发明实施例一中,第一目标文档中的数据信息在WEB上或表格上的发布模式如图3所示。
本发明实施例一利用本发明实施例提供的数据文档转换方法,快速地完成了源数据文档到第一目标文档的转换,提高了数据文档转换的效率。
同样地,也可以按照本发明实施例一同样的方法,将包含其它学生信息的源数据文档转换成相应的第一目标文档;或者按照不同的数据模板,将包含学生李明信息的源数据文档转换成多个不同的第一目标文档。 进一步地,本发明实施例一还可以利用本发明实施例提供的方法,按照计算模板设定的数据信息的数据处理规则,对由包含学生李明信息的源数据文档转换成的一个第一目标文档的数据信息进行数据处理,生成第二目标文档;或者对包含学生李明信息的源数据文档中的数据信息进行数据处理,生成第三目标文档;或者在生成的多个目标文档数据信息之间进行相应数据处理,生成第四目标文档;从而完成将包含学生李明信息的源数据文档转换成一个或多个目标文档,并最终显示。
实施例二
本发明实施例二利用本发明实施例提供的数据文档转换方法,将包含张瑞信息的源数据文档、包含肖赛信息的源数据文档、包含王敏信息的源数据文档、包含李明信息的源数据文档等9个学生信息的源数据文档转换成一个包含着9个学生信息的第一目标文档,并根据计算模板设定的数据处理规则对第一目标文档中数据信息进行数据处理生成第二目标文档,将第二目标文档显示。本发明实施例二希望将学生李明的数据信息按照图4所示的显示模式显示,则本发明实施例二包括下列步骤:
B1、根据第一目标文档数据模板所定义的各数据项,获取相应的源数据文档。
其中,第一目标文档数据模板定义的数据项以ID标记,该数据模板的片段如下所示:
<td id=″chinese″/>
</tr>
根据第一目标文档数据模板所定义的各数据项,查找上述9个学生信息各自对应的源数据文档,所查找到的每个学生信息对应的源数据文档中包括姓名、性别等学生个人状况数据项,以及各学年各科目的学习成绩等数据项,上述数据项均为单节点数据项,以TAG标记,上述数据项片段如下所示:
<item id=″grade″name=″″>高一</item>
<item id=″P1″name=″语文″valuetype=″float″>88</item>
</items>
B2、确定第一目标文档数据模板所定义的各数据项、与源数据文档中各数据项之间的第一映射关系。
例如,将源数据文档中的“语文”数据项,与数据模板中“chinese”数据项映射。
本发明实施例二的第一映射关系是TAG到ID之间的映射。
B3、根据第一映射关系,从源数据文档中获取第一目标文档数据模板所定义的各数据项对应数据。
B4、根据第一目标文档数据模板、和获取的第一目标文档数据模板所定义的各数据项对应数据,生成第一目标文档,从而完成这九个源数据文档到一个第一目标文档的转换。
B5、获取计算模板设定的数据信息的数据处理规则,并确定计算模板中各数据项、与第一目标文档中各数据项之间的第二映射关系;根据计算模板设定的数据信息的数据处理规则、和第二映射关系,对第一目标文档中数据信息进行相应数据处理,生成第二目标文档。
假设计算模板设定的计算规则为计算每个学生三个学年内语文成绩的总和、以及三个学年内语文成绩的平均分,统计规则为按照语文成绩由高到低的顺序进行排列,设定的数据处理范围为在每名学生的数据文档中计算语文成绩的总和、和平均分,然后在多名学生的用户数据之间进行统计排序。
确定了计算模板中各数据项、与第一目标文档中各数据项之间的第二映射关系之后,将计算模板设定的数据处理规则应用于第一目标文档,生成第二目标文档。
B6、将第一目标文档和第二目标文档中的数据信息按照预先设定的显示模式进行显示。
本发明实施例二中,第一目标文档和第二目标文档中的数据信息在WEB上或表格上的发布模式如图4所示。
本发明实施例二利用本发明实施例提供的数据文档转换方法,快速地完成了多个源数据文档到一个第一目标文档的转换,并快速地将第一目标文档转换成了第二目标文档,提高了数据文档转换的效率。
参阅图5所示,本发明实施例提出一种数据文档转换装置,包括:
获取单元51,用于根据第一目标文档数据模板所定义的各数据项,获取相应的源数据文档;
标记存储单元52,用于存储第一目标文档数据模板所定义的各数据项标记、和所述获取的源数据文档各数据项标记;
第一映射关系确定单元53,用于根据标记存储单元52存储的标记信息,确定第一目标文档数据模板所定义的各数据项、与源数据文档中各数据项之间的第一映射关系;
获取数据单元54,用于根据所述第一映射关系,从所述源数据文档中获取第一目标文档数据模板所定义的各数据项对应数据;
第一生成单元55,用于根据所述第一目标文档数据模板、和获取的所述第一目标文档数据模板所定义的各数据项对应数据,生成第一目标文档。
参阅图5所示,本发明实施例提出的数据文档转换装置还包括:
规则获取单元56,用于获取计算模板设定的数据信息的数据处理规则;
标记存储单元52,还用于存储所述计算模板中各数据项标记、和所述第一目标文档中各数据项标记;
第二映射关系确定单元57,用于根据标记存储单元52存储的标记信息,确定所述计算模板中各数据项、与所述第一目标文档中各数据项之间的第二映射关系;
第二生成单元58,用于根据计算模板设定的数据信息的数据处理规则、和第二映射关系,对所述第一目标文档中数据信息进行相应数据处理,生成第二目标文档。
参阅图5所示,本发明实施例提出的数据文档转换装置还包括:
第三映射关系确定单元59,用于根据标记存储单元52存储的标记信息,确定所述计算模板中各数据项、与所述源数据文档中各数据项之间的第三映射关系;
第三生成单元60,用于根据所述计算模板设定的数据信息的数据处理规则、和所述第三映射关系,对所述源数据文档中数据信息进行相应数据处理,生成第三目标文档。
参阅图5所示,本发明实施例提出的数据文档转换装置还包括:
标记存储单元52,还用于存储所述第三目标文档中各数据项标记;
第四映射关系确定单元61,用于根据标记存储单元52存储的标记信息,确定所述计算模板中各数据项、与所述生成的两个或多个目标文档各数据项之间的第四映射关系;
第四生成单元62,用于根据所述计算模板设定的数据信息的数据处理规则、和所述第四映射关系,在所述生成的两个或多个目标文档数据信息之间进行相应数据处理,生成第四目标文档。
参阅图5所示,本发明实施例提出的数据文档转换装置还包括:
显示控制单元63,用于将生成的所有目标文档中的数据信息按照预先设定的显示模式进行显示。
参阅图5所示,本发明实施例提出的数据文档转换装置还包括:
设定单元64,用于设定数据回写报表,所述数据回写报表记录了支持数据回写的数据项标记;
数据回写控制单元65,用于当所述任何一个文档中数据项对应数据发生变化、且所述数据回写报表中记录了所述对应数据发生变化的数据项标记时,根据相关映射关系,将所述其它文档中所述数据项对应数据修改为:所述变化后的数据项对应数据。
本发明实施例提出一种数据文档转换方法及装置。在本发明实施例的技术方案中,如果用户希望生成包含用户需求信息的第一目标文档,则可以首先根据用户需求生成第一目标文档数据模板,数据模板中定义了用户需求的数据项、以及各数据项对应数据的排列顺序,之后,根据第一目标文档数据模板所定义的各数据项获取相应的源数据文档;确定第一目标文档数据模板所定义的各数据项、与源数据文档中各数据项之间的第一映射关系;根据第一映射关系,从源数据文档中获取第一目标文档数据模板所定义的各数据项对应数据;根据第一目标文档数据模板、和获取的第一目标文档数据模板所定义的各数据项对应数据,生成第一目标文档,从而完成了源数据文档到第一目标文档的转换。根据用户需要,还可以根据本发明实施例方法将源数据文档转换成多个第一目标文档,并可以对第一目标文档中数据信息进行数据处理生成第二目标文档,或者对源数据文档进行数据处理生成第三目标文档;或者在生成的两个或者多个目标文档之间对数据信息进行相应数据处理生成第四目标文档,得到用户需求的数据信息,从而完成了源数据文档到多个目标文档的转换。应用本发明实施例技术方案可以快速地完成源数据文档到一个或多个目标文档的转换,提高了数据文档转换的效率。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (15)
1.一种数据文档转换方法,其特征在于,包括下列步骤:
根据第一目标文档数据模板所定义的各数据项,获取相应的源数据文档;
确定第一目标文档数据模板所定义的各数据项、与源数据文档中各数据项之间的第一映射关系;
根据所述第一映射关系,从所述源数据文档中获取第一目标文档数据模板所定义的各数据项对应数据;
根据所述第一目标文档数据模板、和获取的所述第一目标文档数据模板所定义的各数据项对应数据,生成第一目标文档。
2.如权利要求1所述的方法,其特征在于,所述源数据文档和所述目标文档为可扩展标识语言XML文档。
3.如权利要求2所述的方法,其特征在于,所述XML文档中的数据节点包括单节点、静态表节点、动态表节点,其中,单节点为只包含一个数据项的数据节点;静态表节点为表格中行数目固定的表格节点;动态表节点为表格中行数目不固定的表格节点。
4.如权利要求2或3所述的方法,其特征在于:
所述第一目标文档数据模板所定义的各数据项以TAG或ID标记,所述源数据文档中各数据项以TAG或ID标记;
所述映射关系包括TAG到ID之间的映射、或者ID到TAG之间的映射、或者TAG到TAG之间的映射、或者ID到ID之间的映射。
5.如权利要求1所述的方法,其特征在于,生成所述第一目标文档之后,所述方法还包括:
获取计算模板设定的数据信息的数据处理规则,并确定所述计算模板中各数据项、与所述第一目标文档中各数据项之间的第二映射关系;
根据计算模板设定的数据信息的数据处理规则、和所述第二映射关系,对所述第一目标文档中数据信息进行相应数据处理,生成第二目标文档。
6.如权利要求1所述的方法,其特征在于,所述方法还包括:
确定所述计算模板中各数据项、与所述源数据文档中各数据项之间的第三映射关系;
根据所述计算模板设定的数据信息的数据处理规则、和所述第三映射关系,对所述源数据文档中数据信息进行相应数据处理,生成第三目标文档。
7.如权利要求5或6所述的方法,其特征在于,所述方法还包括:
确定所述计算模板中各数据项、与所述生成的两个或多个目标文档各数据项之间的第四映射关系;
根据所述计算模板设定的数据信息的数据处理规则、和所述第四映射关系,在所述生成的两个或多个目标文档数据信息之间进行相应数据处理,生成第四目标文档。
8.如权利要求7所述的方法,其特征在于,所述方法还包括:
将生成的所有目标文档中数据信息按照预先设定的显示模式进行显示。
9.如权利要求1或8所述的方法,其特征在于,所述方法还包括:
设定数据回写报表,所述数据回写报表用标记记录了支持数据回写的数据项;
当所述任何一个文档中数据项对应数据发生变化、且所述数据回写报表中记录了所述对应数据发生变化的数据项标记时,根据相关映射关系,将所述其它文档中所述数据项对应数据修改为:所述变化后的数据项对应数据。
10.一种数据文档转换装置,其特征在于,包括:
获取文档单元,用于根据第一目标文档数据模板所定义的各数据项,获取相应的源数据文档;
标记存储单元,用于存储第一目标文档数据模板所定义的各数据项标记、和所述获取的源数据文档各数据项标记;
第一映射关系确定单元,用于根据所述标记存储单元存储的标记信息,确定第一目标文档数据模板所定义的各数据项、与源数据文档中各数据项之间的第一映射关系;
获取数据单元,用于根据所述第一映射关系,从所述源数据文档中获取第一目标文档数据模板所定义的各数据项对应数据;
第一生成单元,用于根据所述第一目标文档数据模板、和获取的所述第一目标文档数据模板所定义的各数据项对应数据,生成第一目标文档。
11.如权利要求10所述的装置,其特征在于,所述装置还包括:
规则获取单元,用于获取计算模板设定的数据信息的数据处理规则;
所述标记存储单元,还用于存储所述计算模板中各数据项标记、和所述第一目标文档中各数据项标记;
第二映射关系确定单元,用于根据所述标记存储单元存储的标记信息,确定所述计算模板中各数据项、与所述第一目标文档中各数据项之间的第二映射关系;
第二生成单元,用于根据计算模板设定的数据信息的数据处理规则、和所述第二映射关系,对所述第一目标文档中数据信息进行相应数据处理,生成第二目标文档。
12.如权利要求10所述的装置,其特征在于,所述装置还包括:
第三映射关系确定单元,用于根据所述标记存储单元存储的标记信息,确定所述计算模板中各数据项、与所述源数据文档中各数据项之间的第三映射关系;
第三生成单元,用于根据所述计算模板设定的数据信息的数据处理规则、和所述第三映射关系,对所述源数据文档中数据信息进行相应数据处理,生成第三目标文档。
13.如权利要求11或12所述的装置,其特征在于,所述装置还包括:
所述标记存储单元,还用于存储所述第三目标文档中各数据项标记;
第四映射关系确定单元,用于根据所述标记存储单元存储的标记信息,确定所述计算模板中各数据项、与所述生成的两个或多个目标文档各数据项之间的第四映射关系;
第四生成单元,用于根据所述计算模板设定的数据信息的数据处理规则、和所述第四映射关系,在所述生成的两个或多个目标文档数据信息之间进行相应数据处理,生成第四目标文档。
14.如权利要求13所述的装置,其特征在于,所述装置还包括:
显示控制单元,用于将生成的所有目标文档中的数据信息按照预先设定的显示模式进行显示。
15.如权利要求10或14所述的装置,其特征在于,所述装置还包括:
设定单元,用于设定数据回写报表,所述数据回写报表记录了支持数据回写的数据项标记;
数据回写控制单元,用于当所述任何一个文档中数据项对应数据发生变化、且所述数据回写报表中记录了所述对应数据发生变化的数据项标记时,根据相关映射关系,将所述其它文档中所述数据项对应数据修改为:所述变化后的数据项对应数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2007103084117A CN101216835B (zh) | 2007-12-29 | 2007-12-29 | 一种数据文档转换方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2007103084117A CN101216835B (zh) | 2007-12-29 | 2007-12-29 | 一种数据文档转换方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101216835A true CN101216835A (zh) | 2008-07-09 |
CN101216835B CN101216835B (zh) | 2011-12-14 |
Family
ID=39623267
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2007103084117A Expired - Fee Related CN101216835B (zh) | 2007-12-29 | 2007-12-29 | 一种数据文档转换方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101216835B (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102270224A (zh) * | 2011-06-28 | 2011-12-07 | 用友软件股份有限公司 | 信息系统数据输出装置和信息系统数据输出方法 |
CN102393945A (zh) * | 2011-06-27 | 2012-03-28 | 中国建设银行股份有限公司 | 一种用于风险加权资产计算的数据处理方法和系统 |
CN102467405A (zh) * | 2010-11-12 | 2012-05-23 | 鸿富锦精密工业(深圳)有限公司 | 量测程序转换系统及方法 |
CN103020023A (zh) * | 2012-12-12 | 2013-04-03 | 中国南方电网有限责任公司超高压输电公司广州局 | 电力行业技术监督系统的电子文档数据自动存储读取方法 |
CN105912735A (zh) * | 2016-06-28 | 2016-08-31 | 浪潮软件股份有限公司 | 一种文本文件的并行解析过滤方法 |
CN106021380A (zh) * | 2016-05-12 | 2016-10-12 | 中国商用飞机有限责任公司 | 基于维修工程分析数据编制飞机技术出版物的方法及装置 |
CN106570022A (zh) * | 2015-10-10 | 2017-04-19 | 阿里巴巴集团控股有限公司 | 一种跨数据源查询方法、装置及系统 |
CN109582928A (zh) * | 2018-12-06 | 2019-04-05 | 万兴科技股份有限公司 | Pdf报表数据提取方法及装置 |
CN110705237A (zh) * | 2019-09-18 | 2020-01-17 | 深圳证券交易所 | 文档的自动生成方法、数据处理设备及存储介质 |
-
2007
- 2007-12-29 CN CN2007103084117A patent/CN101216835B/zh not_active Expired - Fee Related
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102467405A (zh) * | 2010-11-12 | 2012-05-23 | 鸿富锦精密工业(深圳)有限公司 | 量测程序转换系统及方法 |
CN102393945A (zh) * | 2011-06-27 | 2012-03-28 | 中国建设银行股份有限公司 | 一种用于风险加权资产计算的数据处理方法和系统 |
CN102393945B (zh) * | 2011-06-27 | 2015-05-20 | 中国建设银行股份有限公司 | 一种用于风险加权资产计算的数据处理方法和系统 |
CN102270224B (zh) * | 2011-06-28 | 2013-04-24 | 用友软件股份有限公司 | 信息系统数据输出装置和信息系统数据输出方法 |
CN102270224A (zh) * | 2011-06-28 | 2011-12-07 | 用友软件股份有限公司 | 信息系统数据输出装置和信息系统数据输出方法 |
CN103020023A (zh) * | 2012-12-12 | 2013-04-03 | 中国南方电网有限责任公司超高压输电公司广州局 | 电力行业技术监督系统的电子文档数据自动存储读取方法 |
CN106570022B (zh) * | 2015-10-10 | 2020-06-23 | 菜鸟智能物流控股有限公司 | 一种跨数据源查询方法、装置及系统 |
CN106570022A (zh) * | 2015-10-10 | 2017-04-19 | 阿里巴巴集团控股有限公司 | 一种跨数据源查询方法、装置及系统 |
CN106021380A (zh) * | 2016-05-12 | 2016-10-12 | 中国商用飞机有限责任公司 | 基于维修工程分析数据编制飞机技术出版物的方法及装置 |
CN105912735A (zh) * | 2016-06-28 | 2016-08-31 | 浪潮软件股份有限公司 | 一种文本文件的并行解析过滤方法 |
CN109582928A (zh) * | 2018-12-06 | 2019-04-05 | 万兴科技股份有限公司 | Pdf报表数据提取方法及装置 |
CN109582928B (zh) * | 2018-12-06 | 2023-07-21 | 万兴科技股份有限公司 | Pdf报表数据提取方法及装置 |
CN110705237A (zh) * | 2019-09-18 | 2020-01-17 | 深圳证券交易所 | 文档的自动生成方法、数据处理设备及存储介质 |
CN110705237B (zh) * | 2019-09-18 | 2023-03-14 | 深圳证券交易所 | 文档的自动生成方法、数据处理设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN101216835B (zh) | 2011-12-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101216835B (zh) | 一种数据文档转换方法及装置 | |
US8589425B2 (en) | Scalable rendering of large spatial databases | |
Li et al. | An optimisation model for linear feature matching in geographical data conflation | |
CN103699572B (zh) | 一种云环境下数字媒体内容资源的集成共享方法 | |
US9785725B2 (en) | Method and system for visualizing relational data as RDF graphs with interactive response time | |
BRPI0709715A2 (pt) | sistema e mÉtodo para fornecer um ambiente de base de dados virtual e para gerar informaÇço de mapa digital | |
CN101231657A (zh) | 用于访问数据的方法以及数据处理系统 | |
CN101976459A (zh) | 虚拟现实图书馆自动排架系统的实现方法 | |
CN102591960A (zh) | 农业经济电子地图数据服务接口方法 | |
Carrion et al. | From historical documents to GIS: A spatial database for medieval fiscal data in Southern Italy | |
Bishop et al. | Digital curation and the GeoWeb: An emerging role for geographic information librarians | |
Chaturvedi et al. | Integrated management and visualization of static and dynamic properties of semantic 3D city models | |
Zhang et al. | Semantic web and geospatial unique features based geospatial data integration | |
Gong et al. | Technologies and standards on spatial data sharing | |
Kaladzavi et al. | Geo-spatial domain ontology: the case of the socio-cultural infrastructures | |
Zhang et al. | Semantic-Based geospatial data integration with unique | |
Polleres et al. | Semantic web standards for publishing and integrating open data | |
Gonzalez | Problems that arise when providing geographic coordinate information for cataloged maps | |
de Boer et al. | Linked Data for Digital History | |
Martin et al. | Magebuilder: a schema translation tool for generating MAGE-ML from tabular microarray data | |
Zhang et al. | Semantic-Based Geospatial Data Integration With Unique Features | |
Liang et al. | Construction of semantic location model based on typonym ontology | |
Lucas et al. | Distributed knowledge representation using universal identity and replication | |
Soomro et al. | Mapping specifications for ranked hierarchical trees in data integration systems | |
Aravindharamanan et al. | GMusic Player Using Self-adjusting Graph Data Structures |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20111214 Termination date: 20141229 |
|
EXPY | Termination of patent right or utility model |