CN112001150A - 一种文档格式转换的方法、装置、计算机存储介质及终端 - Google Patents

一种文档格式转换的方法、装置、计算机存储介质及终端 Download PDF

Info

Publication number
CN112001150A
CN112001150A CN201910444548.8A CN201910444548A CN112001150A CN 112001150 A CN112001150 A CN 112001150A CN 201910444548 A CN201910444548 A CN 201910444548A CN 112001150 A CN112001150 A CN 112001150A
Authority
CN
China
Prior art keywords
document
hierarchical structure
structure information
information
format conversion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910444548.8A
Other languages
English (en)
Inventor
蒙燕玲
聂道强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Kingsoft Office Software Inc
Zhuhai Kingsoft Office Software Co Ltd
Original Assignee
Beijing Kingsoft Office Software Inc
Zhuhai Kingsoft Office Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Kingsoft Office Software Inc, Zhuhai Kingsoft Office Software Co Ltd filed Critical Beijing Kingsoft Office Software Inc
Priority to CN201910444548.8A priority Critical patent/CN112001150A/zh
Publication of CN112001150A publication Critical patent/CN112001150A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

一种文档格式转换的方法、装置、计算机存储介质及终端,包括:对第一文档进行格式转换处理过程中,提取第一文档的层级结构信息;根据从第一文档中提取的层级结构信息,在第二文档中添加用于展示所述层级结构信息的展示信息。本发明实施例简化了在便携式文档格式(PDF)文件中添加层级结构的操作,提升了用户的文档编辑体验。

Description

一种文档格式转换的方法、装置、计算机存储介质及终端
技术领域
本文涉及但不限于办公应用技术,尤指一种文档格式转换的方法、装置、计算机存储介质及终端。
背景技术
正规的电子文字文档(如Word文档)往往带有层级结构,如文字文档第一层级按照大写汉字编号、第二层级采用小写数字编号、第三层级采用小写数字带括号编号;图1为相关技术中文档层级结构示意图,如图1所示,文档包括:第一层级一、第一层级二和第一层级三;第一层级二之下包含第二层级1、第二层级2和第二层级3,第一层级三之下包含第二层级1;第一层级三之下的第二层级1包含第三层级(1)和第三层级(2)。
当文件从文字文档(如Word文档)转变格式固定的便携式文档格式(PDF)后,理想情况时也有同样的层级结构,这样,用户可以在目录页或者导航窗格快速跳至指定的位置。但在相关技术中,将文字文档转换为PDF文档时,文字文档的层级结构不会被保留;如果要使PDF文档也具有层级结构,需要在完成PDF文档转换后,利用PDF编辑工具进行再处理。
综上,获得PDF文档后,通过利用PDF编辑工具进行再处理获得文档的层级结构的方法,操作繁琐、效率低,影响用户的文档编辑体验。
发明内容
以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。
本发明实施例提供一种文档格式转换的方法、装置、计算机存储介质及终端,能够提升用户的文档编辑体验。
本发明实施例提供了一种文档格式转换的方法,包括:
对第一文档进行格式转换处理过程中,提取第一文档的层级结构信息;
根据从第一文档中提取的层级结构信息,在第二文档中添加用于展示所述层级结构信息的展示信息;
其中,所述第二文档为所述第一文档进行格式转换处理后获得的文档。
在一种示例性实施例中,
所述第一文档包括以下一种或一种以上文档:Word文档、文字处理系统WPS文档;
所述第二文档包括:便携式文档格式PDF文档。
在一种示例性实施例中,所述在第二文档中添加用于展示所述层级结构信息的展示信息包括:
在所述第二文档中加载预设的显示窗口;
在加载的所述显示窗口中显示提取的所述层级结构信息。
在一种示例性实施例中,所述在第二文档中添加用于展示所述层级结构信息的展示信息包括:
将提取的层级结构信息转换为所述书签信息;
在转换获得的所述第二文档中,加载转换获得的所述书签信息。
另一方面,本发明实施例还提供一种文档格式转换的装置,包括:提取单元和添加单元;其中,
提取单元用于:对第一文档进行格式转换处理过程中,提取第一文档的层级结构信息;
添加单元用于:根据从第一文档中提取的层级结构信息,在第二文档中添加用于展示所述层级结构信息的展示信息。
在一种示例性实施例中,
所述第一文档包括以下一种或一种以上文档:Word文档、文字处理系统WPS文档;
所述第二文档包括:便携式文档格式PDF文档。
在一种示例性实施例中,所述添加单元包括第一添加模块,用于:
在所述第二文档中加载预设的显示窗口;
在加载的所述显示窗口中显示提取的所述层级结构信息。
在一种示例性实施例中,所述添加单元包括第二添加模块,用于:将提取的层级结构信息转换为所述书签信息;
在转换获得的所述第二文档中,加载转换获得的所述书签信息。
再一方面,本发明实施例还提供一种计算机存储介质,所述计算机存储介质中存储有计算机可执行指令,所述计算机可执行指令用于执行上述文档格式转换的方法。
还一方面,本发明实施例还提供一种终端,包括:存储器和处理器;其中,
处理器被配置为执行存储器中的程序指令;
程序指令在处理器读取执行以下操作:
对第一文档进行格式转换处理过程中,提取第一文档的层级结构信息;
根据从第一文档中提取的层级结构信息,在第二文档中添加用于展示所述层级结构信息的展示信息;
其中,所述第二文档为所述第一文档进行格式转换处理后获得的文档。
与相关技术相比,本申请技术方案包括:对第一文档进行格式转换处理过程中,提取第一文档的层级结构信息;根据从第一文档中提取的层级结构信息,在第二文档中添加用于展示所述层级结构信息的展示信息;其中,所述第二文档为所述第一文档进行格式转换处理后获得的文档。本发明实施例简化了在便携式文档格式(PDF)文件中添加层级结构的操作,提升了用户的文档编辑体验。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
附图说明
附图用来提供对本发明技术方案的进一步理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本发明的技术方案,并不构成对本发明技术方案的限制。
图1为相关技术中文档层级结构示意图;
图2为本发明实施例文档格式转换的方法的流程图;
图3为本发明实施例文档格式转换的装置的结构框图;
图4为本发明应用示例转换获得的PDF文档的示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下文中将结合附图对本发明的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。
在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行。并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图2为本发明实施例文档格式转换的方法的流程图,如图2所示,包括:
步骤201、对第一文档进行格式转换处理过程中,提取第一文档的层级结构信息;
在一种示例性实施例中,第一文档包括:文字文档。这里,文字文档包括但不限于,通过文字编辑应用生成的文档,文字编辑应用包括本领域技术人员公知的office、WPS等在内的办公应用;
在一种示例性实施例中,第一文档包括但不限于:Word文档、文字处理系统(WPS)文档;
本实施例所述层级结构信息是指表示层级关系的信息,例如可以是从第一文档第一格式中提取的标题项。
提取第一文档在第一格式中的层级结构信息可以采用以下方式:预先设置常用标题符号库,所述常用标题符号库中包括多种不同形式的标题符号,相同形式的标题符号被认为属于同一层级,例如a与b属于同一层级,1与2属于同一层级,(1)与(2)属于同一层级,一与二属于同一层级等等。当判断第一文档中连续出现两次以上属于同一层级的标题符号,且所述标题符号按照顺序排列,则认为出现层级结构信息,可将该标题符号作为层级结构信息,或者将该标题符号与后续标题一同作为层级结构信息。在一种示例性实施例中,还可以增加格式判断条件,当判断连续出现两次以上属于同一层级的标题符号,且所述标题符号按照顺序排列,且所述标题符号所在段落的段落格式和/或字体格式相同时,则认为出现层级结构信息。以上仅给出一种提取层级结构信息的示例,在其他实施例中还可采用相关技术中已有实现方式实现。
步骤202、根据从第一文档中提取的层级结构信息,在第二文档中添加用于展示所述层级结构信息的展示信息。
在一种示例性实施例中,第二文档包括:便携式文档格式PDF文档。
在一种示例性实施例中,所述在第二文档中添加用于展示所述层级结构信息的展示信息包括:
在所述第二文档中加载预设的显示窗口;
在加载的所述显示窗口中显示提取的所述层级结构信息。
需要说明的是,本发明实施例显示窗口可以是参照相关技术设置实现的窗口,提取的层级结构信息,可以根据层级结构整理为类似于目录的内容后显示;
在一种示例性实施例中,在第二文档中添加用于展示所述层级结构信息的展示信息包括:
将提取的层级结构信息转换为所述书签信息;
在转换获得的所述第二文档中,加载转换获得的所述书签信息。
需要说明的是,本发明实施例将提取的层级结构信息转换为书签信息可以包括:将提取层级结构信息的位置做上标记,在转成为第二文档时,根据标记的位置分别添加相应的书签;或者,提取层级结构信息时,记录提取各层级结构信息的位置信息;在转换为第二文档的过程中,将对应各位置信息的层级结构信息转换为书签后,根据记录的位置信息进行书签的添加。本发明实施例还可以采用相关技术已有的实现方式进行书签信息的获取和加载,在此不做赘述。
当第一文档为WORD文档,第二文档为PDF文档时,本发明实施例基于PDF中的书签信息,可以实现WORD中层次结构信息的功能,为用户基于书签进行文档的快速查阅提供技术基础,提高了用于查阅和编辑文档的效率。
与相关技术相比,本申请技术方案包括:对第一文档进行格式转换处理过程中,提取第一文档的层级结构信息;根据从第一文档中提取的层级结构信息,在第二文档中添加用于展示所述层级结构信息的展示信息;其中,所述第二文档为所述第一文档进行格式转换处理后获得的文档。本发明实施例简化了在便携式文档格式(PDF)文件中添加层级结构的操作,提升了用户的文档编辑体验。
图3为本发明实施例文档格式转换的装置的结构框图,如图3所示,包括:提取单元和添加单元;其中,
提取单元用于:对第一文档进行格式转换处理过程中,提取第一文档的层级结构信息;
添加单元用于:根据从第一文档中提取的层级结构信息,在第二文档中添加用于展示所述层级结构信息的展示信息;
其中,所述第二文档为所述第一文档进行格式转换处理后获得的文档。
在一种示例性实施例中,第一文档包括但不限于以下文档:Word文档、文字处理系统WPS文档;
在一种示例性实施例中,第二文档包括:
便携式文档格式(PDF)文档。
在一种示例性实施例中,添加单元包括第一添加模块,用于:
在所述第二文档中加载预设的显示窗口;
在加载的所述显示窗口中显示提取的所述层级结构信息。
在一种示例性实施例中,添加单元包括第二添加模块,用于:
将提取的层级结构信息转换为所述书签信息;
在转换获得的所述第二文档中,加载转换获得的所述书签信息。
与相关技术相比,本申请技术方案包括:对第一文档进行格式转换处理过程中提取第一文档的层级结构信息;根据从第一文档中提取的层级结构信息,在第二文档中添加用于展示所述层级结构信息的展示信息;其中,所述第二文档为所述第一文档进行格式转换处理后获得的文档。本发明实施例简化了在便携式文档格式(PDF)文件中添加层级结构的操作,提升了用户的文档编辑体验。
本发明实施例还提供一种计算机存储介质,所述计算机存储介质中存储有计算机可执行指令,所述计算机可执行指令用于执行上述文档格式转换的方法。
本发明实施例还提供一种终端,包括:存储器和处理器;其中,
处理器被配置为执行存储器中的程序指令;
程序指令在处理器读取执行以下操作:
对第一文档进行格式转换处理过程中,提取第一文档的层级结构信息;
根据从第一文档中提取的层级结构信息,在第二文档中添加用于展示所述层级结构信息的展示信息;其中,所述第二文档为所述第一文档进行格式转换处理后获得的文档。
以下通过应用示例对本发明实施例方法进行清楚详细的说明,应用示例仅用于陈述本发明,并不用于限定本发明的保护范围。
应用示例
本文以将WORD文档转换为PDF文档作为示例进行说明,在进行PDF转换时,非层次结构部分参照相关技术进行处理;针对层次结构部分,本发明应用示例在对WORD文档进行转换为PDF文档的处理时,提取WORD文档的层级结构信息;根据从WORD文档中提取的层级结构信息,在PDF文档中添加对应于层级结构信息的书签信息。
以包含图1所示的层次结构的WORD为例,本发明实施例可以在输入将WORD转换为PDF文档时,选择自动生成本发明应用示例的上述书签信息,即在用户选择执行该操作时,提取WORD文档的层次结构信息,并转换为书签信息后,在PDF文档中加载。
图4为本发明应用示例转换获得的PDF文档的示意图,如图4所示,对图1所示的包含层次结构信息的WORD文档,通过本发明应用示例的转换处理后,在PDF文档中实现了书签的自动添加,简化了在PDF文件中添加层次结构信息的操作,提升了用户的文档编辑效率和操作体验。
本领域普通技术人员可以理解上述方法中的全部或部分步骤可通过程序来指令相关硬件(例如处理器)完成,所述程序可以存储于计算机可读存储介质中,如只读存储器、磁盘或光盘等。可选地,上述实施例的全部或部分步骤也可以使用一个或多个集成电路来实现。相应地,上述实施例中的每个模块/单元可以采用硬件的形式实现,例如通过集成电路来实现其相应功能,也可以采用软件功能模块的形式实现,例如通过处理器执行存储于存储器中的程序/指令来实现其相应功能。本发明不限制于任何特定形式的硬件和软件的结合。
虽然本发明所揭露的实施方式如上,但所述的内容仅为便于理解本发明而采用的实施方式,并非用以限定本发明。任何本发明所属领域内的技术人员,在不脱离本发明所揭露的精神和范围的前提下,可以在实施的形式及细节上进行任何的修改与变化,但本发明的专利保护范围,仍须以所附的权利要求书所界定的范围为准。

Claims (10)

1.一种文档格式转换的方法,其特征在于,包括:
对第一文档进行格式转换处理过程中,提取第一文档的层级结构信息;
根据从第一文档中提取的层级结构信息,在第二文档中添加用于展示所述层级结构信息的展示信息;
其中,所述第二文档为所述第一文档进行格式转换处理后获得的文档。
2.根据权利要求1所述的方法,其特征在于,
所述第一文档包括以下一种或一种以上文档:Word文档、文字处理系统WPS文档;
所述第二文档包括:便携式文档格式PDF文档。
3.根据权利要求1或2所述的方法,其特征在于,所述在第二文档中添加用于展示所述层级结构信息的展示信息包括:
在所述第二文档中加载预设的显示窗口;
在加载的所述显示窗口中显示提取的所述层级结构信息。
4.根据权利要求1或2所述的方法,其特征在于,所述在第二文档中添加用于展示所述层级结构信息的展示信息包括:
将提取的层级结构信息转换为所述书签信息;
在转换获得的所述第二文档中,加载转换获得的所述书签信息。
5.一种文档格式转换的装置,其特征在于,包括:提取单元和添加单元;其中,
提取单元用于:对第一文档进行格式转换处理过程中,提取第一文档的层级结构信息;
添加单元用于:根据从第一文档中提取的层级结构信息,在第二文档中添加用于展示所述层级结构信息的展示信息;
其中,所述第二文档为所述第一文档进行格式转换处理后获得的文档。
6.根据权利要求5所述的装置,其特征在于,
所述第一文档包括以下一种或一种以上文档:Word文档、文字处理系统WPS文档;
所述第二文档包括:便携式文档格式PDF文档。
7.根据权利要求5或6所述的装置,其特征在于,所述添加单元包括第一添加模块,用于:
在所述第二文档中加载预设的显示窗口;
在加载的所述显示窗口中显示提取的所述层级结构信息。
8.根据权利要求5或6所述的装置,其特征在于,所述添加单元包括第二添加模块,用于:
将提取的层级结构信息转换为所述书签信息;
在转换获得的所述第二文档中,加载转换获得的所述书签信息。
9.一种计算机存储介质,所述计算机存储介质中存储有计算机可执行指令,所述计算机可执行指令用于执行权利要求1~4中任一项所述的文档格式转换的方法。
10.一种终端,包括:存储器和处理器;其中,
处理器被配置为执行存储器中的程序指令;
程序指令在处理器读取执行以下操作:
对第一文档进行格式转换处理过程中,提取第一文档的层级结构信息;
根据从第一文档中提取的层级结构信息,在第二文档中添加用于展示所述层级结构信息的展示信息;
其中,所述第二文档为所述第一文档进行格式转换处理后获得的文档。
CN201910444548.8A 2019-05-27 2019-05-27 一种文档格式转换的方法、装置、计算机存储介质及终端 Pending CN112001150A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910444548.8A CN112001150A (zh) 2019-05-27 2019-05-27 一种文档格式转换的方法、装置、计算机存储介质及终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910444548.8A CN112001150A (zh) 2019-05-27 2019-05-27 一种文档格式转换的方法、装置、计算机存储介质及终端

Publications (1)

Publication Number Publication Date
CN112001150A true CN112001150A (zh) 2020-11-27

Family

ID=73461312

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910444548.8A Pending CN112001150A (zh) 2019-05-27 2019-05-27 一种文档格式转换的方法、装置、计算机存储介质及终端

Country Status (1)

Country Link
CN (1) CN112001150A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090084161A (ko) * 2008-01-31 2009-08-05 주식회사 싱싱타오 문서 내 목차정보를 이용한 검색 시스템
KR101078477B1 (ko) * 2011-04-18 2011-10-31 (주)캡소프트 Pdf 문서 생성 시 hwp 문서의 책갈피 정보를 pdf 문서에 자동으로 삽입하는 방법 및 시스템
CN102855244A (zh) * 2011-06-28 2013-01-02 北大方正集团有限公司 文档目录处理方法和装置
CN102982010A (zh) * 2011-09-02 2013-03-20 北大方正集团有限公司 提取文档结构的方法和装置
CN104111922A (zh) * 2013-04-16 2014-10-22 北大方正集团有限公司 一种流式文档的处理方法及装置
CN108647305A (zh) * 2018-05-09 2018-10-12 天津字节跳动科技有限公司 文档格式转换方法和装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090084161A (ko) * 2008-01-31 2009-08-05 주식회사 싱싱타오 문서 내 목차정보를 이용한 검색 시스템
KR101078477B1 (ko) * 2011-04-18 2011-10-31 (주)캡소프트 Pdf 문서 생성 시 hwp 문서의 책갈피 정보를 pdf 문서에 자동으로 삽입하는 방법 및 시스템
CN102855244A (zh) * 2011-06-28 2013-01-02 北大方正集团有限公司 文档目录处理方法和装置
CN102982010A (zh) * 2011-09-02 2013-03-20 北大方正集团有限公司 提取文档结构的方法和装置
CN104111922A (zh) * 2013-04-16 2014-10-22 北大方正集团有限公司 一种流式文档的处理方法及装置
CN108647305A (zh) * 2018-05-09 2018-10-12 天津字节跳动科技有限公司 文档格式转换方法和装置

Similar Documents

Publication Publication Date Title
US8788962B2 (en) Method and system for displaying, locating, and browsing data files
US7982737B2 (en) System and method for independent font substitution of string characters
CN108108342B (zh) 结构化文本的生成方法、检索方法及装置
US20150234938A1 (en) Method and electronic terminal for searching for contact in directory
US8456688B2 (en) Data generating device, scanner and non-transitory computer readable medium
CN105631393A (zh) 信息识别方法及装置
CN113515928B (zh) 电子文本生成方法、装置、设备及介质
US10261987B1 (en) Pre-processing E-book in scanned format
EP1622040A2 (en) Apparatus and method for processing text data
CN114297143A (zh) 一种搜索文件的方法、显示文件的方法、装置及移动终端
CN111240962B (zh) 测试方法、装置、计算机设备及计算机存储介质
US20120109638A1 (en) Electronic device and method for extracting component names using the same
JP5715172B2 (ja) 文書表示装置、文書表示方法及び文書表示プログラム
CN112001150A (zh) 一种文档格式转换的方法、装置、计算机存储介质及终端
CN111104805A (zh) 一种翻译处理的方法、装置、计算机存储介质及终端
CN107168627B (zh) 用于触摸屏的文本编辑方法和装置
CN112686000B (zh) 电子书文档的格式转换方法、电子设备及存储介质
CN110134651B (zh) 信息文件的处理方法、装置、电子设备和存储介质
CN108287646B (zh) 多媒体对象查看方法及装置、存储介质及计算设备
CN111522939A (zh) 一种处理笔记的方法、装置、计算机存储介质及终端
US10872201B1 (en) Generation and presentation of electronic books for consumption in skim mode
CN111581921B (zh) 一种文本编辑的方法、装置、计算机存储介质及终端
CN111079375A (zh) 一种信息整理的方法、装置、计算机存储介质及终端
CN111831613A (zh) 一种命名处理的方法、装置、计算机存储介质及终端
JP6717152B2 (ja) インデックス生成プログラム、インデックス生成装置、インデックス生成方法、検索プログラム、検索装置および検索方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination