CN106815181B - 一种InDesign排版的indd文件到Office文件的转换方法及装置 - Google Patents

一种InDesign排版的indd文件到Office文件的转换方法及装置 Download PDF

Info

Publication number
CN106815181B
CN106815181B CN201611178964.0A CN201611178964A CN106815181B CN 106815181 B CN106815181 B CN 106815181B CN 201611178964 A CN201611178964 A CN 201611178964A CN 106815181 B CN106815181 B CN 106815181B
Authority
CN
China
Prior art keywords
file
format
labels
typesetting
indesign
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201611178964.0A
Other languages
English (en)
Other versions
CN106815181A (zh
Inventor
丁小响
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Genius Technology Co Ltd
Original Assignee
Guangdong Genius Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Genius Technology Co Ltd filed Critical Guangdong Genius Technology Co Ltd
Priority to CN201611178964.0A priority Critical patent/CN106815181B/zh
Publication of CN106815181A publication Critical patent/CN106815181A/zh
Application granted granted Critical
Publication of CN106815181B publication Critical patent/CN106815181B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/189Automatic justification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明适用计算机技术领域,提供了一种InDesign排版的indd文件到Office文件的转换方法及装置,该方法包括:接收用户输入的将InDesign排版的indd文件转换为Office文件的文件转换请求,获取InDesign排版的indd文件中不同文件内容部分对应的排版标签,对排版标签进行解析,得到对应的标签属性值,建立与排版标签一一对应的、用于Office文件格式设置的格式标签,使用标签属性值对格式标签进行设置,根据不同文件内容部分以及对应的格式标签,生成与InDesign排版的indd文件对应的Office文件,实现了InDesign排版的indd文件到Office文件的自动转换,提高了InDesign排版的indd文件转换为Office文件的效率。

Description

一种InDesign排版的indd文件到Office文件的转换方法及 装置
技术领域
本发明属于计算机技术领域,尤其涉及一种InDesign排版的indd文件到Office文件的转换方法及装置。
背景技术
InDesign软件是一个定位于专业排版领域的设计软件,是面向公司专业出版方案的新平台,能够通过内置的创意工具和精确的排版控制,为打印或数字出版物设计出极具吸引力的页面版式,并且还具有许多绘画、绘图软件的特性和自己独特的功能,大大方便了用户。Indesign软件的专业存储格式是indd格式,其扩展名为.indd。
现有办公应用系统大多使用Office文件,因此,常常需要将InDesign排版的indd文件转换为Office文件。现有技术在将InDesign排版的indd文件转换为Office文件时,通常先将indd格式文件先转换成pdf,然后借用转换工具将pdf转换成word文档,从而使得InDesign排版的indd文件中的公式、表格以及文字所具有的特殊属性(例如,字体颜色、大小、加粗和文本框等)都会丢失,用户需要重新进行编辑、排版,降低了工作效率,浪费了大量的人力和财力。
发明内容
本发明的目的在于提供一种InDesign排版的indd文件到Office文件的转换方法及装置,旨在解决由于现有技术无法提供一种有效的InDesign排版的indd文件到Office文件的转换方法,导致InDesign排版的indd文件到Office文件的转换效率低下的问题。
一方面,本发明提供了一种InDesign排版的indd文件到Office文件的转换方法,所述方法包括下述步骤:
接收用户输入的将InDesign排版的indd文件转换为Office文件的文件转换请求;
获取InDesign排版的indd文件中不同文件内容部分对应的排版标签,对排版标签进行解析,得到对应的标签属性值;
建立与排版标签一一对应的、用于Office文件格式设置的格式标签,使用标签属性值对格式标签进行设置;
根据不同文件内容部分以及对应的格式标签,生成与InDesign排版的indd文件对应的Office文件。
另一方面,本发明提供了一种InDesign排版的indd文件到Office文件的转换装置,所述装置包括:
请求接收模块,用于接收用户输入的将InDesign排版的indd文件转换为Office文件的文件转换请求;
标签解析模块,用于获取InDesign排版的indd文件中不同文件内容部分对应的排版标签,对排版标签进行解析,得到对应的标签属性值;
标签设置模块,用于建立与排版标签一一对应的、用于Office文件格式设置的格式标签,使用标签属性值对格式标签进行设置;以及
文件生成模块,用于根据不同文件内容部分以及对应的格式标签,生成与InDesign排版的indd文件对应的Office文件。
本发明,接收用户输入的将InDesign排版的indd文件转换为Office文件的文件转换请求,获取InDesign排版的indd文件中不同文件内容部分对应的排版标签,对排版标签进行解析,得到对应的标签属性值,建立与排版标签一一对应的、用于Office文件格式设置的格式标签,使用标签属性值对格式标签进行设置,根据不同文件内容部分以及对应的格式标签,生成与InDesign排版的indd文件对应的Office文件,实现了InDesign排版的indd文件到Office文件的自动转换,提高了InDesign排版的indd文件转换为Office文件的效率。
附图说明
图1是本发明实施例一提供的InDesign排版的indd文件到Office文件的转换方法的实现流程图;
图2是本发明实施例二提供的InDesign排版的indd文件到Office文件的转换装置的结构示意图;以及
图3是本发明实施例二提供的InDesign排版的indd文件到Office文件的转换装置的优选结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
以下结合具体实施例对本发明的具体实现进行详细描述:
实施例一:
图1示出了本发明实施例一提供的InDesign排版的indd文件到Office文件的转换方法的实现流程,为了便于说明,仅示出了与本发明实施例相关的部分,详述如下:
在步骤S101中,接收用户输入的将InDesign排版的indd文件转换为Office文件的文件转换请求。
本发明实施例适用于文件处理设备或系统,文件处理设备或系统接收的文件转换请求中包括有待转换的InDesign排版的indd文件。其中,InDesign排版的indd文件的内容为用户输入、编辑的文本文件,并插有排版注解或排版标签,其扩展名为.indd,排版标签描述了对应内容的排版格式,而Office文件可以为微软公司的Word、Excel或PowerPoint格式文件。
在步骤S102中,获取InDesign排版的indd文件中不同文件内容部分对应的排版标签,对排版标签进行解析,得到对应的标签属性值。
在本发明实施例中,对所排版标签进行解析,得到对应的标签属性值的步骤之后,将InDesign排版的indd文件转换成Html临时文件,根据排版标签将Html临时文件解析成具有对应的排版标签的txt临时文件,其中,该txt临时文件包含对应的排版标签,用于转换为对应的Office文件。
在步骤S103中,建立与排版标签一一对应的、用于Office文件格式设置的格式标签,使用标签属性值对格式标签进行设置。
在本发明实施例中,在对Office文件的格式标签进行设置之前,预先为Office文件建立格式标签的数据结构,该数据结构与InDesign排版的indd文件的排版标签的数据结构一一对应,以用于将InDesign排版的indd文件中出现的排版标签转换为Office文件的格式标签,例如,可分别为语音、视频、图片、标题、知识点、段落、句解、注释、题型、题干、答案、字体等建立对应的数据结构。在得到InDesign排版的indd文件中不同文件内容部分对应的排版标签的标签属性值后,建立与排版标签一一对应的、用于Office文件格式设置的格式标签,使用标签属性值对格式标签进行设置。
优选地,可建立一格式配置文件,在该格式配置文件中记录与排版标签一一对应的、用于Office文件格式设置的格式标签,使用标签属性值对格式标签进行设置,从而通过格式配置文件存储Office文件的格式设置参数,便于转换过程中参考的统一加载和读取。
在步骤S104中,根据不同文件内容部分以及对应的格式标签,生成与InDesign排版的indd文件对应的Office文件。
在本发明实施例中,在将InDesign排版的indd文件中不同文件内容部分复制到Office文件中后,根据与各个部分对应的格式标签对不同文件内容进行格式设置,最终生成与InDesign排版的indd文件对应的Office文件,实现了InDesign排版的indd文件到Office文件的自动转换,提高了InDesign排版的indd文件转换为Office文件的效率。进一步地,在转换得到Office文件后,可将转换过程中的格式配置文件删除,以减少存储资源浪费。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以存储于一计算机可读取存储介质中,所述的存储介质,如ROM/RAM、磁盘、光盘等。
实施例二:
图2示出了本发明实施例二提供的InDesign排版的indd文件到Office文件的转换装置的结构,为了便于说明,仅示出了与本发明实施例相关的部分,其中:
请求接收模块21,用于接收用户输入的将InDesign排版的indd文件转换为Office文件的文件转换请求;
在本发明实施例中,请求接收模块所接收的文件转换请求中包括有待转换的InDesign排版的indd文件。其中,InDesign排版的indd文件的内容为用户输入、编辑的文本文件,并插有排版注解或排版标签,其扩展名为.indd,排版标签描述了对应内容的排版格式,而Office文件可以为微软公司的Word、Excel或PowerPoint格式文件。
标签解析模块22,用于获取InDesign排版的indd文件中不同文件内容部分对应的排版标签,对排版标签进行解析,得到对应的标签属性值;
标签设置模块23,用于建立与排版标签一一对应的、用于Office文件格式设置的格式标签,使用标签属性值对格式标签进行设置;以及
文件生成模块24,用于根据不同文件内容部分以及对应的格式标签,生成与InDesign排版的indd文件对应的Office文件。
在本发明实施例中,在对Office文件的格式标签进行设置之前,预先为Office文件建立格式标签的数据结构,该数据结构与InDesign排版的indd文件的排版标签的数据结构一一对应,以用于将InDesign排版的indd文件中出现的排版标签转换为Office文件的格式标签,例如,可分别为语音、视频、图片、标题、知识点、段落、句解、注释、题型、题干、答案、字体等建立对应的数据结构。在得到InDesign排版的indd文件中不同文件内容部分对应的排版标签的标签属性值后,建立与排版标签一一对应的、用于Office文件格式设置的格式标签,使用标签属性值对格式标签进行设置。
优选地,可建立一格式配置文件,在该格式配置文件中记录与排版标签一一对应的、用于Office文件格式设置的格式标签,使用标签属性值对格式标签进行设置,从而通过格式配置文件存储Office文件的格式设置参数,便于转换过程中参考的统一加载和读取。
因此,优选地,如图3所示,该转换装置还包括:
结构建立模块30,用于预先为Office文件建立格式标签的数据结构,以与InDesign排版的indd文件的排版标签一一对应。
优选地,标签解析模块22包括:
中间转换模块221,用于将InDesign排版的indd文件转换成Html临时文件;以及
临时文件转换模块222,用于根据排版标签将Html临时文件解析成具有对应的排版标签的txt临时文件,该txt临时文件包含对应的排版标签。
在本发明实施例中,标签解析模块对所排版标签进行解析,得到对应的标签属性值的步骤之后,将InDesign排版的indd文件转换成Html临时文件,根据排版标签将Html临时文件解析成具有对应的排版标签的txt临时文件,其中,该txt临时文件包含对应的排版标签,用于转换为对应的Office文件。
优选地,标签设置模块23包括:
配置文件建立模块231,用于建立一格式配置文件,在格式配置文件中记录与排版标签一一对应的、用于Office文件格式设置的格式标签,使用标签属性值对格式标签进行设置。
优选地,该转换装置还包括:
配置文件删除模块31,用于删除配置文件建立模块231建立的格式配置文件,以减少存储资源浪费。
在本发明实施例中,在将InDesign排版的indd文件中不同文件内容部分复制到Office文件中后,根据与各个部分对应的格式标签对不同文件内容进行格式设置,最终生成与InDesign排版的indd文件对应的Office文件,实现了InDesign排版的indd文件到Office文件的自动转换,提高了InDesign排版的indd文件转换为Office文件的效率。进一步地,在转换得到Office文件后,可将转换过程中的格式配置文件删除,以减少存储资源浪费。
在本发明实施例中,InDesign排版的indd文件到Office文件的转换装置的各模块可由相应的硬件或软件模块实现,各模块可以为独立的软、硬件模块,也可以集成为文件处理设备或系统的一个软、硬件模块,在此不用以限制本发明。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种InDesign排版的indd文件到Office文件的转换方法,其特征在于,所述方法包括下述步骤:
接收用户输入的将InDesign排版的indd文件转换为Office文件的文件转换请求;
获取所述InDesign排版的indd文件中不同文件内容部分对应的排版标签,对所述排版标签进行解析,得到对应的标签属性值;
预先为所述Office文件建立格式标签的数据结构,以与InDesign排版的indd文件的排版标签一一对应;
建立与所述排版标签一一对应的、用于所述Office文件格式设置的格式标签,使用所述标签属性值对所述格式标签进行设置;
根据所述不同文件内容部分以及对应的所述格式标签,生成与所述InDesign排版的indd文件对应的Office文件;
获取所述InDesign排版的indd文件中不同文件内容部分对应的排版标签,对所述排版标签进行解析,得到对应的标签属性值的步骤包括:
将所述InDesign排版的indd文件转换成Html临时文件;
根据所述排版标签将Html临时文件解析成具有对应的排版标签的txt临时文件,所述txt临时文件包含对应的排版标签。
2.如权利要求1所述的方法,其特征在于,建立与所述排版标签一一对应的、用于所述Office文件格式设置的格式标签,使用所述标签属性值对所述格式标签进行设置的步骤,包括:
建立一格式配置文件,在所述格式配置文件中记录与所述排版标签一一对应的、用于所述Office文件格式设置的格式标签,使用所述标签属性值对所述格式标签进行设置。
3.如权利要求2所述的方法,其特征在于,生成与所述InDesign排版的indd文件对应的Office文件的步骤之后,所述方法还包括:
删除所述格式配置文件。
4.一种InDesign排版的indd文件到Office文件的转换装置,其特征在于,所述装置包括:
请求接收模块,用于接收用户输入的将InDesign排版的indd文件转换为Office文件的文件转换请求;
标签解析模块,用于获取所述InDesign排版的indd文件中不同文件内容部分对应的排版标签,对所述排版标签进行解析,得到对应的标签属性值;
结构建立模块,用于预先为所述Office文件建立格式标签的数据结构,以与InDesign排版的indd文件的排版标签一一对应;
标签设置模块,用于建立与所述排版标签一一对应的、用于所述Office文件格式设置的格式标签,使用所述标签属性值对所述格式标签进行设置;以及
文件生成模块,用于根据所述不同文件内容部分以及对应的所述格式标签,生成与所述InDesign排版的indd文件对应的Office文件;
所述标签解析模块包括:
中间转换模块,用于将所述InDesign排版的indd文件转换成Html临时文件;以及
临时文件转换模块,用于根据所述排版标签将Html临时文件解析成具有对应的排版标签的txt临时文件,所述txt临时文件包含对应的排版标签。
5.如权利要求4所述的装置,其特征在于,所述标签设置模块包括:
配置文件建立模块,用于建立一格式配置文件,在所述格式配置文件中记录与所述排版标签一一对应的、用于所述Office文件格式设置的格式标签,使用所述标签属性值对所述格式标签进行设置。
6.如权利要求5所述的装置,其特征在于,所述装置还包括:
配置文件删除模块,用于删除所述格式配置文件。
CN201611178964.0A 2016-12-19 2016-12-19 一种InDesign排版的indd文件到Office文件的转换方法及装置 Expired - Fee Related CN106815181B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611178964.0A CN106815181B (zh) 2016-12-19 2016-12-19 一种InDesign排版的indd文件到Office文件的转换方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611178964.0A CN106815181B (zh) 2016-12-19 2016-12-19 一种InDesign排版的indd文件到Office文件的转换方法及装置

Publications (2)

Publication Number Publication Date
CN106815181A CN106815181A (zh) 2017-06-09
CN106815181B true CN106815181B (zh) 2020-07-28

Family

ID=59109913

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611178964.0A Expired - Fee Related CN106815181B (zh) 2016-12-19 2016-12-19 一种InDesign排版的indd文件到Office文件的转换方法及装置

Country Status (1)

Country Link
CN (1) CN106815181B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108052496A (zh) * 2017-12-19 2018-05-18 国云科技股份有限公司 一种基于源文件的word图文格式编排系统及其实现方法
CN110321545A (zh) * 2018-03-29 2019-10-11 成都野望数码科技有限公司 一种办公文档排版的方法和装置
CN111046841A (zh) * 2019-12-26 2020-04-21 中孚安全技术有限公司 一种PowerPoint文件的文字提取方法、系统、终端及存储介质
CN113516737A (zh) * 2020-03-27 2021-10-19 北京小米松果电子有限公司 动画转换方法、装置及智能设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101989256A (zh) * 2009-07-31 2011-03-23 北京大学 一种文书文件的排版方法及装置
CN102147791A (zh) * 2011-04-02 2011-08-10 数字时代出版设计有限公司 一种图书自动排版方法及系统
CN102163233A (zh) * 2011-04-18 2011-08-24 北京神州数码思特奇信息技术股份有限公司 一种网页标记语言格式转换方法及系统
CN105117378A (zh) * 2015-08-05 2015-12-02 联动优势电子商务有限公司 一种json文件转换为excel文件的方法及装置
CN105279144A (zh) * 2015-10-10 2016-01-27 中国空气动力研究与发展中心高速空气动力研究所 一种风洞试验数据文本文件的排版方法和装置
CN105335338A (zh) * 2014-06-25 2016-02-17 阿里巴巴集团控股有限公司 一种电子文档转换方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101989256A (zh) * 2009-07-31 2011-03-23 北京大学 一种文书文件的排版方法及装置
CN102147791A (zh) * 2011-04-02 2011-08-10 数字时代出版设计有限公司 一种图书自动排版方法及系统
CN102163233A (zh) * 2011-04-18 2011-08-24 北京神州数码思特奇信息技术股份有限公司 一种网页标记语言格式转换方法及系统
CN105335338A (zh) * 2014-06-25 2016-02-17 阿里巴巴集团控股有限公司 一种电子文档转换方法及装置
CN105117378A (zh) * 2015-08-05 2015-12-02 联动优势电子商务有限公司 一种json文件转换为excel文件的方法及装置
CN105279144A (zh) * 2015-10-10 2016-01-27 中国空气动力研究与发展中心高速空气动力研究所 一种风洞试验数据文本文件的排版方法和装置

Also Published As

Publication number Publication date
CN106815181A (zh) 2017-06-09

Similar Documents

Publication Publication Date Title
CN106815181B (zh) 一种InDesign排版的indd文件到Office文件的转换方法及装置
WO2016206336A1 (zh) 一种利于翻译工作的文件抽取和还原方法
CN108595389B (zh) 一种将Word文档转换为txt纯文本文档的方法
CN109582647B (zh) 一种面向非结构化证据文件的分析方法及系统
CN101980183B (zh) 一种解析Word文件信息的方法及其系统
US20030210428A1 (en) Non-OCR method for capture of computer filled-in forms
CN110008195B (zh) 一种动态配置html转pdf的方法、装置及系统
CN111507073A (zh) 一种基于web富文本的论文编辑与智能排版方法及平台
CN110083580B (zh) 一种Word文档向PowerPoint文档转换的方法及系统
CN104123399A (zh) 一种跨平台的题库资源构建方法
CN101430684A (zh) 中文办公软件文档与其他格式文档相互转换的方法及装置
CN105975446A (zh) 手机端分模块显示word文档内容的方法及系统
CN105824788A (zh) 一种将演示文稿文件转换为word文件的方法和系统
CN112527291A (zh) 网页生成方法、装置、电子设备及存储介质
CN110889266A (zh) 一种会议记录整合方法和装置
CN113010473B (zh) 一种编辑yaml文件的方法和设备
KR102013620B1 (ko) 웹 기반 문서의 템플릿을 변경하는 웹 기반 문서 편집 서버 및 이의 동작 방법
CN101866331A (zh) 不同语种xml文档的转换方法及装置
CN113435178A (zh) 一种文档解析方法及装置
KR100762712B1 (ko) 규칙기반의 전자문서 변환방법 및 그 시스템
CN112433995A (zh) 文件格式转换方法、系统、计算机设备及存储介质
CN109582928B (zh) Pdf报表数据提取方法及装置
CN116257656A (zh) 一种基于Python的遥测页面格式转换系统
CN116303359A (zh) 一种数据库结构多类型文档导出的实现方法
CN105447027A (zh) 一种pdf文档目录的获取方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20200728

CF01 Termination of patent right due to non-payment of annual fee