CN101944087A - 复合文档生成装置和方法 - Google Patents

复合文档生成装置和方法 Download PDF

Info

Publication number
CN101944087A
CN101944087A CN 200910088713 CN200910088713A CN101944087A CN 101944087 A CN101944087 A CN 101944087A CN 200910088713 CN200910088713 CN 200910088713 CN 200910088713 A CN200910088713 A CN 200910088713A CN 101944087 A CN101944087 A CN 101944087A
Authority
CN
China
Prior art keywords
data
document
template
compound
additional information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 200910088713
Other languages
English (en)
Other versions
CN101944087B (zh
Inventor
李永蕊
龚健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Founder International Beijing Co Ltd
Original Assignee
Founder International Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Founder International Beijing Co Ltd filed Critical Founder International Beijing Co Ltd
Priority to CN 200910088713 priority Critical patent/CN101944087B/zh
Publication of CN101944087A publication Critical patent/CN101944087A/zh
Application granted granted Critical
Publication of CN101944087B publication Critical patent/CN101944087B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

本发明提供了一种复合文档生成装置和方法,其中,装置包括:模板管理模块,用于存储描述文档的信息构成和数据格式的模板,并根据上述模板生成主文档的附加文档数据;文档组合模块,用于将主文档的数据与附加文档数据合成以生成复合文档数据,并从复合文档数据中提取附加文档数据;模板解析模块,用于解析附加文档数据的信息构成和数据格式的模板,并根据模板将附加文档数据转换为附加文档的格式;皮肤管理模块,用于将附加文档与用户指定的皮肤进行合成,生成用户交互视图。

Description

复合文档生成装置和方法
技术领域
本发明涉及数字出版领域,具体而言,涉及一种复合文档生成装置和方法。
背景技术
复合文档是指一种将多个文档编订在一起的技术,例如MHTML(Mime for HTML)文件类型,它主要通过建立内部文件索引表,将多个独立的文件绑定到一个文件中。
在实现本发明的过程中,发明人发现现有技术中复合文档都有自定义的格式,需要特定的解析软件进行解析,这就要求使用该特定格式复合文档的用户,必须安装相应的解析软件,导致在网络环境下限制了复合文档的分发使用。
发明内容
本发明旨在提供一种复合文档生成装置和方法,能够解决现有技术中复合文档都有自定义的格式,需要特定的解析软件进行解析,这就要求使用该特定格式复合文档的用户,必须安装相应的解析软件,导致在网络环境下限制了复合文档的分发使用的问题。
在本发明的实施例中,提供了一种复合文档生成装置,包括:
模板管理模块,用于存储描述文档的信息构成和数据格式的模板,并根据上述模板生成主文档的附加文档数据;
文档组合模块,用于将主文档的数据与附加文档数据合成以生成复合文档数据,并从复合文档数据中提取附加文档数据;
模板解析模块,用于解析附加文档数据的信息构成和数据格式的模板,并根据模板将附加文档数据转换为附加文档的格式;
皮肤管理模块,用于将附加文档与用户指定的皮肤进行合成,生成用户交互视图。
在本发明的实施例中,还提供了一种复合文档生成方法,包括以下步骤:
文档组合模块打开文件并定位文件的末尾位置,并提取文件的附加信息头,对附加信息头进行判断;
当附加信息头合法时,依据附加信息头的信息,分离出文件中的附加文档数据;
将附加文档数据与附加信息头中的模板标记段提交给模板解析模块,模板解析模块从模板管理模块提取模板标记段对应的模板,并将模板与附加文档数据进行合成;
将合成后的文档数据与皮肤管理模块中的皮肤进行合成,生成附加文档的用户交互视图。
在上述实施例中,通过采用格式化的模板生成主文档的附加文档,进而将附加文档附加到主文档之后合成复合文档,并在对复合文档进行解析时,调取上述模板提取附加文档数据,即使用户未安装复合文档生成装置,在解析上述复合文档时,不影响对主文档的使用,克服了现有技术中复合文档都有自定义的格式,需要特定的解析软件进行解析,这就要求使用该特定格式复合文档的用户,必须安装相应的解析软件,导致在网络环境下限制了复合文档的分发使用的问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1示出了根据本发明一个实施例的复合文档生成装置的示意图;
图2示出了根据本发明一个实施例的信息头示意图;
图3示出了根据本发明一个实施例的复合文档生成方法流程图。
具体实施方式
下面将参考附图并结合实施例,来详细说明本发明。
图1示出了根据本发明一个实施例的复合文档生成装置的示意图,包括:
模板管理模块10,用于存储描述文档的信息构成和数据格式的模板,并根据上述模板生成主文档的附加文档数据;
文档组合模块20,用于将主文档的数据与附加文档数据合成以生成复合文档数据,并从复合文档数据中提取附加文档数据;
模板解析模块30,用于解析附加文档数据的信息构成和数据格式的模板,并根据模板将附加文档数据转换为附加文档的格式;
皮肤管理模块40,用于将附加文档与用户指定的皮肤进行合成,生成用户交互视图。
在本实施例中,通过采用格式化的模板生成主文档的附加文档,进而将附加文档附加到主文档之后合成复合文档,并在对复合文档进行解析时,调取上述模板提取附加文档数据,即使用户未安装复合文档生成装置,在解析上述复合文档时,不影响对主文档的使用,克服了现有技术中复合文档都有自定义的格式,需要特定的解析软件进行解析,这就要求使用该特定格式复合文档的用户,必须安装相应的解析软件,导致在网络环境下限制了复合文档的分发使用的问题。
本实施例在不干扰主文档的基础之上,利用现有文件解析装置对文件数据流正向解析的现状,设计了对文件数据流反向解析的处理流程,对主文档任意附加文档数据生成复合文档。
同时,本实施例通过采用皮肤管理模块将附加文档与用户指定的皮肤进行合成,生成用户交互视图,提高了用户的使用体验。
优选地,在上述复合文档生成装置中,模板管理模块具体包括:
模板存储单元,用于存储描述文档的信息构成和数据格式的模板;
附加信息生成单元,用于根据上述模板生成主文档对应的附加文档数据。
优选地,在上述复合文档生成装置中,文档组合模块具体包括:
信息头生成单元,用于生成描述附加文档数据的信息构成和数据格式的附加信息头;
文件合成单元,用于将主文档的数据、附加文档数据以及附加信息头按照先后顺序连接为新的复合文档数据,并对复合文档数据进行存储;
数据提取单元,用于从复合文档中提取附加文档数据。
优选地,在上述复合文档生成装置中,附加信息头包括:标志段,用于附加信息头的特定标志,其位于附加信息头的末尾位置;起始位置段,用于记录附加文档数据相对于主文档的数据的起始位置的偏移字节数;数据长度段,用于记录附加信息数据的数据长度;模板标记段,用于记录附加文档数据的模板的相关信息。
图2示出了根据本发明一个实施例的信息头示意图,如图2所示,S11为附加信息头标志段,占有4个字节,作为附加信息头的特定标志;S12为起始位置段,占有4个字节,是指在文件中与文件起始位置的偏移字节数,即原始图片文件长度的后续位置;S13为数据长度段,占有4个字节,描述图像附加描述信息数据长度;S14为模板段,占有16个字节,指附加描述信息的构成及数据格式的模板,用于记录模板ID。
优选地,在上述复合文档生成装置中,相关信息具体包括:当附加信息需要进行转换时,相关信息包括记录附加文档数据转换为附加文档时所用的模板标识;当附加文档数据不需要转换时,相关信息为空。
优选地,在上述复合文档生成装置中,文档组合模块还包括:验证单元,用于验证所述附加信息头中记录的标志段;加密单元,用于对附加文档进行加密或者解密。
优选地,在上述复合文档生成装置中,模板将附加文档数据转换为附加文档的格式时,附加文档为多个文件。
优选地,在上述复合文档生成装置中,附加文档的多个文件的格式和编码格式不同,格式和编码格式分别由模板中定义数据区间及编码信息。在本实施例中,可以附加多个不同编码、不同文件形式的文件组成为复合文件。
例如,模板格式如下:
    <?xml version=″1.0″encoding=″utf-8″?>
    <root>
    <info>
      <id>085759AA-8455-4608-A29D-2FEBCF511346</id>
      <name>封面广告A302</name>
      <templ id=″E2B2E667-DD3B-4714-A953-50F59C5B5A7C″
name=″ImagesInfo1″type=″embed″>
        <info>
<id>E2B2E667-DD3B-4714-A953-50F59C5B5A7C</id>
           <name>ImagesInfo1</name>
           <namespace
targetNamespace=″http://tempuri.org/XMLSchema.xsd″
elementFormDefault=″qualified″
xmlns=″http://tempuri.org/XMLSchema.xsd″
xmlns:mstns=″http://tempuri.org/XMLSchema.xsd″
xmlns:xs=″http://www.w3.org/2001/XMLSchema″/>
            </info>
            <data>
              <xs:schema>
                <xs:element name=″thumb″>
                   <xs:complexType>
                     <xs:sequence>
                     </xs:sequence>
                     <xs:attribute name=″size″type=″xs:int″/>
                     <xs:attribute name=″format″type=″xs:string″/>
                     <xs:attribute name=″rel″type=″xs:string″/>
                     <xs:attribute name=″encode″type=″xs:string″/>
                    </xs:complexType>
           </xs:element>
           <xs:element name=″extinf″>
             <xs:complexType>
                <xs:sequence>
                  <xs:element name=″trim″type=″xs:string″/>
                  <xs:element name=″desc″type=″xs:string″/>
                  <xs:element name=″notes″type=″xs:string″/>
                  <xs:element name=″labels″type=″xs:string″/>
                </xs:sequence>
              </xs:complexType>
            </xs:element>
         </xs:schema>
      </data>
</templ>
............
将附加文档数据与选定的信息模板合成为规范化的附加信息时,过程如下:
.........
         <skin    id=″19CD57E0-F295-4872-9DF1-A85DF06677″
name=″NormalA2″type=″quote″></skin>
         <crypt arithmetic=″MD5″>AB2312123234AE93</crypt>
      </info>
      <data>
        <thumb    size=″238291″format=″JPG″rel=″Thumb″
encode=″Base64″>
    /9j/4AAQSkZJRgABAQEAYABgAAD/7Q/2UGhvdG9zaG9wID
MuMAA4QklNBCUAAAAAABAAAAAAAAAAAAAAAAAAAAA
AOEJJTQPtAAAAAAAQAGAAAAABAAIAYAAAAAEAAjhCSU0
EJgA
    ......
    XMbgktIgZie5rKNKlUndoh8t9j//Z
        </thumb>
        <extinf>
           <trim type=″svg″>
             <svg xmlns=″http://www.w3.org/2000/svg″>
    <rect x=″25″y=″10″width=″280″height=″50″/>
    </svg>
            </trim>
     <desc>
      人民的好公仆“焦裕禄”同志事迹对比学习访谈照片
     </desc>
     <notes>2009-6-14,记者:焦丽梅</notes>
     <label type=″xml″>
       <item id=″23″name=″人物报道″>
         <item id=″232″name=″领导专访″>
          <item id=″2321″name=″时代先锋″>
             <item id=″23212″name=″人物专栏″></item>
          </item>
        </item>
      </item>
    </label>
  </extinf>
</data>
图3示出了根据本发明一个实施例的复合文档生成方法流程图,包括以下步骤:
S102,文档组合模块打开文件并定位文件的末尾位置,并提取文件的附加信息头,对附加信息头进行判断;
S104,当附加信息头合法时,依据附加信息头的信息,分离出文件中的附加文档数据;
S106,将附加文档数据与附加信息头中的模板标记段提交给模板解析模块,模板解析模块从模板管理模块提取模板标记段对应的模板,并将模板与附加文档数据进行合成;
S108,将合成后的文档数据与皮肤管理模块中的皮肤进行合成,生成附加文档的用户交互视图。
在本实施例中,通过附加信息头进行验证,当附加信息头合法时,调取上述模板提取附加文档数据,即使用户未安装复合文档生成装置,在解析上述复合文档时,不影响对主文档的使用,克服了现有技术中复合文档都有自定义的格式,需要特定的解析软件进行解析,这就要求使用该特定格式复合文档的用户,必须安装相应的解析软件,导致在网络环境下限制了复合文档的分发使用的问题。
同时,本实施例通过采用皮肤管理模块将附加文档与用户指定的皮肤进行合成,生成用户交互视图,提高了用户的使用体验。
优选地,在上述复合文档生成方法中,还包括以下步骤:当附加信息头不合法时,终止对文件的处理,其中,附加信息头不合法的情况具体包括:附加信息头中的标准段检测不一致;或根据附加信息头中的起始位置段和数据长度段得到的附加文档数据不在文件的数据范围内。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种复合文档生成装置,其特征在于,包括:
模板管理模块,用于存储描述文档的信息构成和数据格式的模板,并根据所述模板生成主文档的附加文档数据;
文档组合模块,用于将所述主文档的数据与所述附加文档数据合成以生成复合文档数据,并从所述复合文档数据中提取所述附加文档数据;
模板解析模块,用于解析所述附加文档数据的信息构成和数据格式的模板,并根据所述模板将所述附加文档数据转换为附加文档的格式;
皮肤管理模块,用于将所述附加文档与用户指定的皮肤进行合成,生成用户交互视图。
2.根据权利要求1所述的复合文档生成装置,其特征在于,所述模板管理模块具体包括:
模板存储单元,用于存储描述文档的信息构成和数据格式的模板;
附加信息生成单元,用于根据所述模板生成主文档对应的附加文档数据。
3.根据权利要求2所述的复合文档生成装置,其特征在于,所述文档组合模块具体包括:
信息头生成单元,用于生成描述所述附加文档数据的信息构成和数据格式的附加信息头;
文件合成单元,用于将所述主文档的数据、所述附加文档数据以及所述附加信息头按照先后顺序连接为新的复合文档数据,并对所述复合文档数据进行存储;
数据提取单元,用于从所述复合文档中提取所述附加文档数据。
4.根据权利要求3所述的复合文档生成装置,其特征在于,所述附加信息头包括:
标志段,用于所述附加信息头的特定标志,其位于所述附加信息头的末尾位置;
起始位置段,用于记录所述附加文档数据相对于所述主文档的数据的起始位置的偏移字节数;
数据长度段,用于记录所述附加信息数据的数据长度;
模板标记段,用于记录所述附加文档数据的模板的相关信息。
5.根据权利要求4所述的文档组合模块,其特征在于,所述相关信息具体包括:
当所述附加信息需要进行转换时,所述相关信息包括记录所述附加文档数据转换为附加文档时所用的模板标识;
当所述附加文档数据不需要转换时,所述相关信息为空。
6.根据权利要求4所述的复合文档生成装置,其特征在于,文档组合模块还包括:
验证单元,用于验证所述附加信息头中记录的标志段;
加密单元,用于对所述附加文档进行加密或者解密。
7.根据权利要求1所述的复合文档生成装置,其特征在于,根据所述模板将所述附加文档数据转换为附加文档的格式时,所述附加文档为多个文件。
8.根据权利要求7所述的复合文档生成装置,其特征在于,所述附加文档的多个文件的格式和编码格式不同,所述格式和所述编码格式分别由所述模板定义。
9.一种复合文档生成方法,其特征在于,包括以下步骤:
文档组合模块打开文件并定位所述文件的末尾位置,并提取所述文件的附加信息头,对所述附加信息头进行判断;
当所述附加信息头合法时,依据所述附加信息头的信息,分离出所述文件中的附加文档数据;
将所述附加文档数据与所述附加信息头中的模板标记段提交给模板解析模块,所述模板解析模块从模板管理模块提取所述模板标记段对应的模板,并将所述模板与所述附加文档数据进行合成;
将合成后的所述文档数据与皮肤管理模块中的皮肤进行合成,生成所述附加文档的用户交互视图。
10.根据权利要求9所述的复合文档生成方法,其特征在于,还包括以下步骤:
当所述附加信息头不合法时,终止对所述文件的处理,其中,所述附加信息头不合法的情况具体包括:
所述附加信息头中的标准段检测不一致;或
根据所述附加信息头中的起始位置段和数据长度段得到的附加文档数据不在所述文件的数据范围内。
CN 200910088713 2009-07-08 2009-07-08 复合文档生成装置和方法 Expired - Fee Related CN101944087B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 200910088713 CN101944087B (zh) 2009-07-08 2009-07-08 复合文档生成装置和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 200910088713 CN101944087B (zh) 2009-07-08 2009-07-08 复合文档生成装置和方法

Publications (2)

Publication Number Publication Date
CN101944087A true CN101944087A (zh) 2011-01-12
CN101944087B CN101944087B (zh) 2013-03-27

Family

ID=43436081

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 200910088713 Expired - Fee Related CN101944087B (zh) 2009-07-08 2009-07-08 复合文档生成装置和方法

Country Status (1)

Country Link
CN (1) CN101944087B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104008124A (zh) * 2013-02-25 2014-08-27 三星电子株式会社 创建复合文件的方法和具有复合文件的数据存储设备
CN106227712A (zh) * 2016-07-28 2016-12-14 浪潮通用软件有限公司 一种基于可扩展标记语言实现数据快速换转文档的方法
CN106462671A (zh) * 2014-06-30 2017-02-22 惠普发展公司,有限责任合伙企业 复合文档引用资源
CN110335583A (zh) * 2019-04-15 2019-10-15 浙江工业大学 一种带隔断标识的复合文件生成及解析方法
CN113377717A (zh) * 2021-06-30 2021-09-10 中国平安财产保险股份有限公司 单证文件生成方法、装置、电子设备及存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5812862A (en) * 1993-05-10 1998-09-22 Apple Computer, Inc. Computer-human interface system for compound documents

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104008124A (zh) * 2013-02-25 2014-08-27 三星电子株式会社 创建复合文件的方法和具有复合文件的数据存储设备
CN104008124B (zh) * 2013-02-25 2019-05-31 三星电子株式会社 创建复合文件的方法和具有复合文件的数据存储设备
CN106462671A (zh) * 2014-06-30 2017-02-22 惠普发展公司,有限责任合伙企业 复合文档引用资源
US10205597B2 (en) 2014-06-30 2019-02-12 Hewlett-Packard Development Company, L.P. Composite document referenced resources
CN106462671B (zh) * 2014-06-30 2019-07-02 惠普发展公司,有限责任合伙企业 复合文档引用资源
CN106227712A (zh) * 2016-07-28 2016-12-14 浪潮通用软件有限公司 一种基于可扩展标记语言实现数据快速换转文档的方法
CN110335583A (zh) * 2019-04-15 2019-10-15 浙江工业大学 一种带隔断标识的复合文件生成及解析方法
CN113377717A (zh) * 2021-06-30 2021-09-10 中国平安财产保险股份有限公司 单证文件生成方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN101944087B (zh) 2013-03-27

Similar Documents

Publication Publication Date Title
CN100437508C (zh) 管理数字内容使用权利的方法和装置
CN101944087B (zh) 复合文档生成装置和方法
US7191392B1 (en) System and method for the creation of virtual information packages
US8688992B2 (en) System and method for generating agreements
US20130117665A1 (en) System and method for individualized media publishing
US20080091846A1 (en) Creation and transaction processes of intelligent documents
US20060253773A1 (en) Web-based client/server interaction method and system
CN101894228B (zh) 一种标识符分配解析方法和多媒体读物
WO2009074974A1 (en) System and process for producing a two-layer document, and a two-layer document produced accordingly
JP5579321B2 (ja) ネットワークプラットフォームシステム及びその管理方法
CN102096670A (zh) 一种数据字典生成方法以及装置
CN108268915A (zh) 电子证据固化系统及方法
CN107577776A (zh) 一种交互式数据信息管理系统
US20090043807A1 (en) Method, apparatus and software for processing data encoded as one or more data elements in a data format
CN101996161B (zh) 一种电子文档的历史版本数据处理方法及装置
JP2007041983A (ja) 申請書作成プログラムおよび申請書作成装置
CN109582928A (zh) Pdf报表数据提取方法及装置
CN105955680A (zh) 一种支持动态附加扩展信息的单据打印方法
JP2010225124A (ja) 文書管理システム、文書管理プログラム及び文書管理方法
GB2458692A (en) A process for generating database-backed, web-based documents
CN103593473A (zh) 一种表格显示方法及系统
EP1359522A1 (en) Book on-demand system for creating page data using content database
KR20140075853A (ko) 전자서적 서비스 제공 장치 및 방법
JP7034814B2 (ja) ファイル形式変換装置、ファイル形式変換システム、ファイル形式変換方法、及びファイル形式変換プログラム
Polkinghorne et al. Maximising our use of the UK Professional Standards Framework

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20130327