CN106383840A - 一种小样文件到Office文件的转换方法及装置 - Google Patents
一种小样文件到Office文件的转换方法及装置 Download PDFInfo
- Publication number
- CN106383840A CN106383840A CN201610770734.7A CN201610770734A CN106383840A CN 106383840 A CN106383840 A CN 106383840A CN 201610770734 A CN201610770734 A CN 201610770734A CN 106383840 A CN106383840 A CN 106383840A
- Authority
- CN
- China
- Prior art keywords
- file
- format
- office
- sample
- typesetting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000006243 chemical reaction Methods 0.000 title claims abstract description 27
- 238000000034 method Methods 0.000 title claims abstract description 22
- 239000000203 mixture Substances 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 1
- 239000000686 essence Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/11—File system administration, e.g. details of archiving or snapshots
- G06F16/116—Details of conversion of file system types or formats
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Document Processing Apparatus (AREA)
Abstract
本发明适用计算机技术领域,提供了一种小样文件到Office文件的转换方法及装置,该方法包括:接收用户输入的将小样文件转换为Office文件的文件转换请求;获取小样文件中不同文件内容部分对应的排版标签,对排版标签进行解析,得到对应的标签属性值;建立与排版标签一一对应的、用于Office文件格式设置的格式标签,使用标签属性值对格式标签进行设置;根据不同文件内容部分以及对应的格式标签,生成与小样文件对应的Office文件,实现了小样文件到Office文件的自动转换,提高了小样文件转换为Office文件的效率。
Description
技术领域
本发明属于计算机技术领域,尤其涉及一种小样文件到Office文件的转换方法及装置。
背景技术
方正书版系统是一款用于书刊排版的批处理软件系统,功能强大,其批处理功能可用于对书刊排版中的内容和格式进行批次处理,减少工作量。方正书版系统中包括四种文件:小样文件、排版参数文件、大样文件以及发排文件,其中,小样文件是方正书版系统的主体,内容为用户输入、编辑的文本文件,并插有排版注解,其扩展名为.fbd。
现有办公应用系统大多使用Office文件,因此,常常需要将小样文件转换为Office文件。现有技术在将小样文件转换为Office文件时,通常先将方正书版小样文件转换成文本文件,然后从文本文件中将文字内容复制保存到Office文件中,从而使得小样文件中的公式、表格以及文字所具有的特殊属性(例如,字体颜色、大小、加粗和文本框等)都会丢失,用户需要重新进行编辑、排版,降低了工作效率,浪费了大量的人力和财力。
发明内容
本发明的目的在于提供一种小样文件到Office文件的转换方法及装置,旨在解决由于现有技术无法提供一种有效的小样文件到Office文件的转换方法,导致小样文件到Office文件的转换效率低下的问题。
一方面,本发明提供了一种小样文件到Office文件的转换方法,所述方法包括下述步骤:
接收用户输入的将小样文件转换为Office文件的文件转换请求;
获取所述小样文件中不同文件内容部分对应的排版标签,对所述排版标签进行解析,得到对应的标签属性值;
建立与所述排版标签一一对应的、用于所述Office文件格式设置的格式标签,使用所述标签属性值对所述格式标签进行设置;
根据所述不同文件内容部分以及对应的所述格式标签,生成与所述小样文件对应的Office文件。
另一方面,本发明提供了一种小样文件到Office文件的转换装置,所述装置包括:
请求接收单元,用于接收用户输入的将小样文件转换为Office文件的文件转换请求;
标签解析单元,用于获取所述小样文件中不同文件内容部分对应的排版标签,对所述排版标签进行解析,得到对应的标签属性值;
标签设置单元,用于建立与所述排版标签一一对应的、用于所述Office文件格式设置的格式标签,使用所述标签属性值对所述格式标签进行设置;以及
文件生成单元,用于根据所述不同文件内容部分以及对应的所述格式标签,生成与所述小样文件对应的Office文件。
在本发明实施例中,接收用户输入的将小样文件转换为Office文件的文件转换请求,获取小样文件中不同文件内容部分对应的排版标签,对排版标签进行解析,得到对应的标签属性值,建立与排版标签一一对应的、用于Office文件格式设置的格式标签,使用标签属性值对格式标签进行设置,根据不同文件内容部分以及对应的格式标签,生成与小样文件对应的Office文件,实现了小样文件到Office文件的自动转换,提高了小样文件转换为Office文件的效率。
附图说明
图1是本发明实施例一提供的小样文件到Office文件的转换方法的实现流程图;
图2是本发明实施例二提供的小样文件到Office文件的转换装置的结构示意图;以及
图3是本发明实施例二提供的小样文件到Office文件的转换装置的优选结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
以下结合具体实施例对本发明的具体实现进行详细描述:
实施例一:
图1示出了本发明实施例一提供的小样文件到Office文件的转换方法的实现流程,为了便于说明,仅示出了与本发明实施例相关的部分,详述如下:
在步骤S101中,接收用户输入的将小样文件转换为Office文件的文件转换请求。
本发明实施例适用于文件处理设备或系统,文件处理设备或系统接收的文件转换请求中包括有待转换的小样文件。其中,小样文件的内容为用户输入、编辑的文本文件,并插有排版注解或排版标签,其扩展名为.fbd,排版标签描述了对应内容的排版格式,而Office文件可以为微软公司的Word、Excel或PowerPoint格式文件。
在步骤S102中,获取小样文件中不同文件内容部分对应的排版标签,对排版标签进行解析,得到对应的标签属性值。
在步骤S103中,建立与排版标签一一对应的、用于Office文件格式设置的格式标签,使用标签属性值对格式标签进行设置。
在本发明实施例中,在对Office文件的格式标签进行设置之前,预先为Office文件建立格式标签的数据结构,该数据结构与小样文件的排版标签的数据结构一一对应,以用于将小样文件中出现的排版标签转换为Office文件的格式标签,例如,可分别为语音、视频、图片、标题、知识点、段落、句解、注释、题型、题干、答案、字体等建立对应的数据结构。在得到小样文件中不同文件内容部分对应的排版标签的标签属性值后,建立与排版标签一一对应的、用于Office文件格式设置的格式标签,使用标签属性值对格式标签进行设置。
优选地,可建立一格式配置文件,在该格式配置文件中记录与排版标签一一对应的、用于Office文件格式设置的格式标签,使用标签属性值对格式标签进行设置,从而通过格式配置文件存储Office文件的格式设置参数,便于转换过程中参考的统一加载和读取。
在步骤S104中,根据不同文件内容部分以及对应的格式标签,生成与小样文件对应的Office文件。
在本发明实施例中,在将小样文件中不同文件内容部分复制到Office文件中后,根据与各个部分对应的格式标签对不同文件内容进行格式设置,最终生成与小样文件对应的Office文件,实现了小样文件到Office文件的自动转换,提高了小样文件转换为Office文件的效率。进一步地,在转换得到Office文件后,可将转换过程中的格式配置文件删除,以减少存储资源浪费。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以存储于一计算机可读取存储介质中,所述的存储介质,如ROM/RAM、磁盘、光盘等。
实施例二:
图2示出了本发明实施例二提供的小样文件到Office文件的转换装置的结构,为了便于说明,仅示出了与本发明实施例相关的部分,其中:
请求接收单元21,用于接收用户输入的将小样文件转换为Office文件的文件转换请求;
标签解析单元22,用于获取小样文件中不同文件内容部分对应的排版标签,对排版标签进行解析,得到对应的标签属性值;
标签设置单元23,用于建立与排版标签一一对应的、用于Office文件格式设置的格式标签,使用标签属性值对格式标签进行设置;以及
文件生成单元24,用于根据不同文件内容部分以及对应的格式标签,生成与小样文件对应的Office文件。
在本发明实施例中,在对Office文件的格式标签进行设置之前,预先为Office文件建立格式标签的数据结构,该数据结构与小样文件的排版标签的数据结构一一对应,以用于将小样文件中出现的排版标签转换为Office文件的格式标签,例如,可分别为语音、视频、图片、标题、知识点、段落、句解、注释、题型、题干、答案、字体等建立对应的数据结构。在得到小样文件中不同文件内容部分对应的排版标签的标签属性值后,建立与排版标签一一对应的、用于Office文件格式设置的格式标签,使用标签属性值对格式标签进行设置。
优选地,可建立一格式配置文件,在该格式配置文件中记录与排版标签一一对应的、用于Office文件格式设置的格式标签,使用标签属性值对格式标签进行设置,从而通过格式配置文件存储Office文件的格式设置参数,便于转换过程中参考的统一加载和读取。
因此,优选地,如图3所示,该转换装置还包括:
结构建立单元30,用于预先为Office文件建立格式标签的数据结构,以与小样文件的排版标签一一对应。
优选地,标签设置单元23包括:
配置文件建立单元231,用于建立一格式配置文件,在格式配置文件中记录与排版标签一一对应的、用于Office文件格式设置的格式标签,使用标签属性值对格式标签进行设置。
优选地,该转换装置还包括:
配置文件删除单元31,用于删除配置文件建立单元231建立的格式配置文件,以减少存储资源浪费。
在本发明实施例中,在将小样文件中不同文件内容部分复制到Office文件中后,根据与各个部分对应的格式标签对不同文件内容进行格式设置,最终生成与小样文件对应的Office文件,实现了小样文件到Office文件的自动转换,提高了小样文件转换为Office文件的效率。
在本发明实施例中,小样文件到Office文件的转换装置的各单元可由相应的硬件或软件单元实现,各单元可以为独立的软、硬件单元,也可以集成为文件处理设备或系统的一个软、硬件单元,在此不用以限制本发明。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (8)
1.一种小样文件到Office文件的转换方法,其特征在于,所述方法包括下述步骤:
接收用户输入的将小样文件转换为Office文件的文件转换请求;
获取所述小样文件中不同文件内容部分对应的排版标签,对所述排版标签进行解析,得到对应的标签属性值;
建立与所述排版标签一一对应的、用于所述Office文件格式设置的格式标签,使用所述标签属性值对所述格式标签进行设置;
根据所述不同文件内容部分以及对应的所述格式标签,生成与所述小样文件对应的Office文件。
2.如权利要求1所述的方法,其特征在于,建立与所述排版标签一一对应的、用于所述Office文件格式设置的格式标签的步骤之前,所述方法还包括:
预先为所述Office文件建立所述格式标签的数据结构,以与小样文件的排版标签一一对应。
3.如权利要求1所述的方法,其特征在于,建立与所述排版标签一一对应的、用于所述Office文件格式设置的格式标签,使用所述标签属性值对所述格式标签进行设置的步骤,包括:
建立一格式配置文件,在所述格式配置文件中记录与所述排版标签一一对应的、用于所述Office文件格式设置的格式标签,使用所述标签属性值对所述格式标签进行设置。
4.如权利要求3所述的方法,其特征在于,生成与所述小样文件对应的Office文件的步骤之后,所述方法还包括:
删除所述格式配置文件。
5.一种小样文件到Office文件的转换装置,其特征在于,所述装置包括:
请求接收单元,用于接收用户输入的将小样文件转换为Office文件的文件转换请求;
标签解析单元,用于获取所述小样文件中不同文件内容部分对应的排版标签,对所述排版标签进行解析,得到对应的标签属性值;
标签设置单元,用于建立与所述排版标签一一对应的、用于所述Office文件格式设置的格式标签,使用所述标签属性值对所述格式标签进行设置;以及
文件生成单元,用于根据所述不同文件内容部分以及对应的所述格式标签,生成与所述小样文件对应的Office文件。
6.如权利要求5所述的装置,其特征在于,所述装置还包括:
结构建立单元,用于预先为所述Office文件建立所述格式标签的数据结构,以与小样文件的排版标签一一对应。
7.如权利要求5所述的装置,其特征在于,所述标签设置单元包括:
配置文件建立单元,用于建立一格式配置文件,在所述格式配置文件中记录与所述排版标签一一对应的、用于所述Office文件格式设置的格式标签,使用所述标签属性值对所述格式标签进行设置。
8.如权利要求7所述的装置,其特征在于,所述装置还包括:
配置文件删除单元,用于删除所述格式配置文件。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610770734.7A CN106383840A (zh) | 2016-08-30 | 2016-08-30 | 一种小样文件到Office文件的转换方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610770734.7A CN106383840A (zh) | 2016-08-30 | 2016-08-30 | 一种小样文件到Office文件的转换方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106383840A true CN106383840A (zh) | 2017-02-08 |
Family
ID=57939047
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610770734.7A Pending CN106383840A (zh) | 2016-08-30 | 2016-08-30 | 一种小样文件到Office文件的转换方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106383840A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109614592A (zh) * | 2018-12-29 | 2019-04-12 | 东软集团股份有限公司 | 文本的处理方法、装置、存储介质和电子设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2005331A1 (en) * | 2006-03-23 | 2008-12-24 | Index System AS | Management of document attributes in a document managing system |
CN104699714A (zh) * | 2013-12-09 | 2015-06-10 | 北大方正集团有限公司 | 将书版格式文件转换为epub格式文件的方法及装置 |
CN105335338A (zh) * | 2014-06-25 | 2016-02-17 | 阿里巴巴集团控股有限公司 | 一种电子文档转换方法及装置 |
-
2016
- 2016-08-30 CN CN201610770734.7A patent/CN106383840A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2005331A1 (en) * | 2006-03-23 | 2008-12-24 | Index System AS | Management of document attributes in a document managing system |
CN104699714A (zh) * | 2013-12-09 | 2015-06-10 | 北大方正集团有限公司 | 将书版格式文件转换为epub格式文件的方法及装置 |
CN105335338A (zh) * | 2014-06-25 | 2016-02-17 | 阿里巴巴集团控股有限公司 | 一种电子文档转换方法及装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109614592A (zh) * | 2018-12-29 | 2019-04-12 | 东软集团股份有限公司 | 文本的处理方法、装置、存储介质和电子设备 |
CN109614592B (zh) * | 2018-12-29 | 2023-10-10 | 东软集团股份有限公司 | 文本的处理方法、装置、存储介质和电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8914419B2 (en) | Extracting semantic relationships from table structures in electronic documents | |
US20150033116A1 (en) | Systems, Methods, and Media for Generating Structured Documents | |
US20030210428A1 (en) | Non-OCR method for capture of computer filled-in forms | |
CN101980183B (zh) | 一种解析Word文件信息的方法及其系统 | |
CN106815181B (zh) | 一种InDesign排版的indd文件到Office文件的转换方法及装置 | |
CN101430684A (zh) | 中文办公软件文档与其他格式文档相互转换的方法及装置 | |
CN117057318A (zh) | 领域模型生成方法、装置、设备以及存储介质 | |
CN106682050A (zh) | 一种实现智能问答的系统及方法 | |
CN107423271B (zh) | 文档生成方法和装置 | |
CN106383840A (zh) | 一种小样文件到Office文件的转换方法及装置 | |
KR102296939B1 (ko) | 다중 모드를 지원하는 pdf 등의 전자문서를 관리하는 장치 및 방법 | |
KR20220079026A (ko) | 일반 문서 기반의 멀티미디어 영상 콘텐츠 제작 서비스 제공 장치 | |
WO2015121715A1 (en) | Method of and system for generating metadata | |
JP7027757B2 (ja) | 情報処理装置及び情報処理プログラム | |
KR102522926B1 (ko) | 전자책 변환 저작 시스템 | |
US8170270B2 (en) | Universal reader | |
KR20220079029A (ko) | 문서 기반 멀티 미디어 콘텐츠 자동 제작 서비스 제공 방법 | |
Stahn et al. | Using TEI for textbook research | |
KR20070120965A (ko) | 표시 가능 파일의 필드 및 참조 문헌 및 인용문에 대한확장형 마크업 언어 스키마의 결정 | |
KR20190079609A (ko) | 전자책 파일 생성 방법 및 장치 | |
Rathnavibushana et al. | Cross-platform annotation development for real-time collaborative learning | |
CN108984676A (zh) | 一种基于xml的电子书跨终端自适应显示系统及方法 | |
US20160292130A1 (en) | Legacy document converter for a mobile device | |
US10831833B2 (en) | Information processing apparatus and non-transitory computer readable medium | |
CN116187271A (zh) | 试题信息的处理方法、读取方法、装置及终端设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170208 |
|
RJ01 | Rejection of invention patent application after publication |