CN106326194A - 一种应用于文件格式转换场景下的目录生成方法和装置 - Google Patents

一种应用于文件格式转换场景下的目录生成方法和装置 Download PDF

Info

Publication number
CN106326194A
CN106326194A CN201510390513.2A CN201510390513A CN106326194A CN 106326194 A CN106326194 A CN 106326194A CN 201510390513 A CN201510390513 A CN 201510390513A CN 106326194 A CN106326194 A CN 106326194A
Authority
CN
China
Prior art keywords
document
title
pattern
content
corresponding relation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510390513.2A
Other languages
English (en)
Other versions
CN106326194B (zh
Inventor
代芳
杨勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
New Founder Holdings Development Co ltd
Beijing Founder Electronics Co Ltd
Original Assignee
Peking University Founder Group Co Ltd
Beijing Founder Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University Founder Group Co Ltd, Beijing Founder Electronics Co Ltd filed Critical Peking University Founder Group Co Ltd
Priority to CN201510390513.2A priority Critical patent/CN106326194B/zh
Publication of CN106326194A publication Critical patent/CN106326194A/zh
Application granted granted Critical
Publication of CN106326194B publication Critical patent/CN106326194B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及数字排版领域,公开了一种应用于文件格式转换场景下的目录生成方法和装置,包括:读取第一文档,利用匹配规则,设置所述第一文档中符合所述匹配规则的内容的样式为第二文档可识别的标题样式,所述匹配规则为预设内容与标题样式的对应关系;根据所述第二文档可识别的标题样式,生成目录索引文件;根据所述目录索引文件,从设置后的第一文档中提取出符合所述目录索引文件中标题样式对应的内容;将提取的内容作为标题,生成与所述目录索引文件相匹配的目录。本发明用以解决在文件格式转换下操作繁琐重复的问题,加快生成目录的速度,提高工作效率。

Description

一种应用于文件格式转换场景下的目录生成方法和装置
技术领域
本发明涉及数字排版领域,尤其涉及一种应用于文件格式转换场景下的目录生成方法和装置。
背景技术
EPub(电子出版,Electronic Publication)是一种开放式电子书格式,可以在EInk(Electronic Ink电子墨水)电纸书、手机、笔记本电脑等便携式的设备上阅读,其文字内容可以根据阅读设备的特性(如屏幕尺寸、不同平台),以最适于阅读的方式显示。
目前,经常需要将Microsoft Office Word文档转成EPub电子书格式以方便使用。在转换过程中,需生成EPub格式的目录,现有的一般做法是将Word文档中的标题一条一条添加到EPub格式的目录中。这种方法操作重复繁琐,生成目录的速度慢、效率低。
发明内容
本发明实施例提供一种应用于文件格式转换场景下的目录生成方法和装置,用以解决在文件格式转换下操作繁琐重复的问题,加快生成目录的速度,提高工作效率。
本发明实施例提供的应用于文件格式转换场景下的目录生成方法包括:
读取第一文档,利用匹配规则,设置所述第一文档中符合所述匹配规则的内容的样式为第二文档可识别的标题样式,所述匹配规则为预设内容与标题样式的对应关系;
根据所述第二文档可识别的标题样式,生成目录索引文件;
根据所述目录索引文件,从设置后的第一文档中提取出符合所述目录索引文件中标题样式对应的内容;
将提取的内容作为标题,生成与所述目录索引文件相匹配的目录。
所述匹配规则为预设内容与标题样式的对应关系,具体为:
预设的文字内容与标题样式的对应关系;或,
预设的大纲级别与标题样式的对应关系;或,
预设的文字格式与标题样式的对应关系;或,
预设的文字样式与标题样式的对应关系。
所述读取第一文档之前,还包括通过以下方式获取所述匹配规则:
根据所述第一文档的内容和所述第二文档的标题样式,创建符合所述第一文档转换为所述第二文档时利用的匹配规则。
所述根据所述第二文档可识别的标题样式,生成目录索引文件,具体包括:
获取所述第一文档的各样式,从所述各样式中提取所述第二文档可识别的标题样式,依据设定的目录级别及标题样式与目录级别的对应关系,生成所述目录索引文件。
所述目录索引文件为可扩展标记语言XML,所述第一文档的文件格式为Microsoft Office Word,所述第二文档的文件格式为电子出版EPub。
一种应用于文件格式转换场景下的目录生成装置,包括:样式匹配模块、目录索引模块、标题提取模块和目录生成模块;
所述样式匹配模块,用于读取第一文档,利用匹配规则,设置所述第一文档中符合所述匹配规则的内容的样式为第二文档可识别的标题样式,所述匹配规则为预设内容与标题样式的对应关系;
所述目录索引模块,用于根据所述第二文档可识别的标题样式,生成目录索引文件;
所述标题提取模块,用于根据所述目录索引文件,读取设置后的第一文档,提取出与所述第二文档可识别的标题样式对应的内容;
所述目录生成模块,用于将提取的内容作为标题,生成与所述目录索引文件相匹配的目录。
所述匹配规则为预设内容与标题样式的对应关系,具体为:
预设的文字内容与标题样式的对应关系;或,
预设的大纲级别与标题样式的对应关系;或,
预设的文字格式与标题样式的对应关系;或,
预设的文字样式与标题样式的对应关系。
所述样式匹配模块还用于通过以下方式获取所述匹配规则:
根据所述第一文档的内容和所述第二文档的标题样式,创建符合所述第一文档转换为所述第二文档时利用的匹配规则。
所述目录索引模块还用于:
获取所述第一文档的各样式,从所述各样式中提取所述第二文档可识别的标题样式,依据设定的目录级别及标题样式与目录级别的对应关系,生成所述目录索引文件。
所述目录索引文件为可扩展标记语言XML,所述第一文档的文件格式为Microsoft Office Word,所述第二文档的文件格式为电子出版EPub。
本发明实施例中,首先利用匹配规则,将第一文档中符合匹配规则的内容的样式自动设置成符合第二文档要求的标题样式;然后选择需要的标题样式,生成目录索引文件;根据目录索引文件,从第一文档中将符合标题样式的内容提取出来,作为第二文档目录的内容生成第二文档的目录。与现有技术相比,本发明实施例可以按用户的要求,自动将目录所需的内容提取出来,并同时转换格式,省去了一条一条添加目录的繁琐工序,在保证效率的同时极大地提高了生成目录的速度。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中一种应用于文件格式转换场景下的目录生成方法的流程图;
图2为本发明实施例中选择目录级别的示意图;
图3~图4为本发明实施例中设置目录样式的示意图;
图5为本发明实施例中Word文档转换为EPub文档过程中目录生成方法的流程图;
图6为本发明实施例中一种应用于文件格式转换场景下的目录生成装置的结构图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部份实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
EPub是一个完全开放和免费的电子书标准,内部用XHTML(可扩展超文本标记语言,Extensible Hyper Markup Language)来展现文件的内容,可以使用XML工具创建。
为了解决将Word文档转换为EPub文档过程中提取目录上的问题,本发明实施例提供了一种应用于文件格式转换场景下的目录生成方法,该方法的流程如图1所示,可以包括如下步骤:
S101、读取第一文档,利用匹配规则,设置第一文档中符合所述匹配规则的内容的样式为第二文档可识别的标题样式,该匹配规则为预设内容与标题样式的对应关系;
S102、根据所述第二文档可识别的标题样式,生成目录索引文件;
S103、根据目录索引文件,从设置后的第一文档中提取出符合目录索引文件中标题样式对应的内容;
S104、将提取的内容作为标题,生成与所述目录索引文件相匹配的目录。
上述实施例中,将第一文档按照匹配规则处理后,利用目录索引文件,将第一文档中的相应内容提取出来,生成与目录索引文件相匹配的目录,作为第二文档的目录,实现了文档格式转换情况下自动生成目录。
其中,目录索引文件为可扩展标记语言XML,第一文档的文件格式为Microsoft Office Word,第二文档的文件格式为电子出版EPub。
本发明实施例利用XML文件作为桥梁,使Word文档和EPub目录之间建立联系,方便Word文档在转为EPub文档的过程中直接提取与EPub相符的目录,操作简单灵活,工作速度快效率高。
在步骤S101中,通过匹配规则,自动将第一文档中的某些内容的样式转换为第二文档可识别的标题样式,为后续提取第一文档中相应的内容作为标题提供了基础。匹配规则的设定可以是根据第一文档的内容和第二文档的标题样式,创建符合第一文档转换为第二文档时利用的匹配规则。例如,大多数情况下,文档中的标题会描述为“第一章”“第1章”等,故可以设定的匹配规则可以是获取第一文档中表述为“第XX章”的样式设定为第二文档可识别的标题样式。
具体的,本发明实施例中罗列出几种匹配规则中预设内容与标题样式的对应关系:
预设的文字内容与标题样式的对应关系;或,
预设的大纲级别与标题样式的对应关系;或,
预设的文字格式与标题样式的对应关系;或,
预设的文字样式与标题样式的对应关系。
较佳地,该匹配规则可以是正则表达式,很容易通过计算机编程来实现,如,规定Word文档中的文字内容与标题样式相匹配,这里的文字内容主要是指Word文档中标题的文字内容,即将Word文档中存在特定文字或字符的标题与标题样式相匹配,如将“第[1~9]章”与一级标题相匹配,或者将“第[零一二三四五六七八九十百千万]节”与三级标题相匹配。此外,还提供另外三种匹配规则供用户选择:
a、大纲级别与标题样式匹配:若原Word文档中已将段落指定了大纲级别(1级至9级),即可将大纲级别和标题级别相匹配,如将原Word中的标题指定为2级大纲,则可将2级大纲与一级标题向对应,将2级大纲对应的内容设置成一级标题的样式。
b、文字格式与标题样式匹配:即根据文字字体和字号的组合规定标题级别,此规则较适合于原Word文档已统一设定了文字格式的情况,如Word文档中的篇标题通常采用一号黑体,章标题采用二号黑体,节标题采用三号宋体加粗,则可将一号黑体与一级标题相匹配,二号黑体和二级标题相匹配,三号宋体加粗和三级标题相匹配,即将篇标题设置为一级标题的样式,章标题设置为二级标题的样式,节标题设置为三级标题的样式。
c、文字样式与标题样式匹配:若原Word文档中已定义好样式,如已将样式应用于文中的标题上,如定义了标题1、标题2、副标题等样式,且将章标题设置为标题1,将节标题设置为副标题,则可将标题1与一级标题相匹配,副标题与二级标题相匹配,即将章标题设置为一级标题的样式,节标题设置为二级标题的样式。
此外,匹配规则还接收用户的自定义,可以通过用户自定义规则,定义出各种类型的组合与标题样式相匹配。
设置好匹配规则后,可以输出形成匹配规则文件,利用匹配规则文件中每条匹配规则,将Word文档中的内容按顺序一条条进行匹配,如果满足其中一条匹配规则,则将该段内容作为标题设置为相应的标题样式。
在步骤S102中还可通过如下方式生成目录索引文件,包括:获取第一文档的各样式,从各样式中提取第二文档可识别的标题样式,依据设定的目录级别及标题样式与目录级别的对应关系,生成所述目录索引文件。经过匹配规则设置的第一文档中包含了第二文档可识别的标题样式,从中选取出第二文档目录所需标题的样式,作为目录索引文件。
具体来说,根据EPub的目录选择需要生成的目录级别,如选“二级”,即代表EPub目录中需有两级目录,分别是一级目录和二级目录,如图2,特殊地,若EPub文档不需要生成目录也可选择“无目录”。Word文档中的标题已在步骤S101中设置了标题样式,如篇标题被设置为一级标题,章标题被设置为二级标题,节标题被设置为三级标题。用户可根据需要,选择与目录级别对应的标题级别,如选择篇标题和章标题作为目录,则需选出一级标题和二级标题,且将一级标题与一级目录对应,如图3,二级标题与二级目录对应,如图4,如此,EPub目录中的内容就会是篇标题和章标题的内容,在此基础上,可生成如下所示的XML文件:
而用户也可选择篇标题和节标题作为目录的内容,此时,则需选出一级标题与一级目录对应,三级标题与二级目录对应。相比于现有技术中生成目录时,将所有的标题都提取为目录内容,若有不需要的标题则需后期单独删除,本发明实施例中提供的方法可根据用户的实际需要提取目录,提取方式灵活,简单易操作。
为了更清楚地理解本发明,下面以具体实例对上述流程进行详细描述。该具体实例所描述场景为,将一篇Word文档转换为EPub文档,需将Word文档中的章标题和节标题提取出来作为EPub的目录,具体流程如图5所示,可以包括:
步骤S201、根据Word文档的文字内容和EPub文档的标题样式,创建符合Word文档转换为EPub文档时利用的匹配规则。
具体来说,Word文档中,第一章的标题为“导论”,第一节的标题为“1.DocBook是什么”,第一小节的标题为“1.1写一份学术著作”,第二小节的标题为“1.2一次输入多种输出”,可以看出,Word文档中章标题的结构为“两个中文字符”,节标题的结构为“阿拉伯数字+英文句号+空格+中英文”;小节标题的结构为“阿拉伯数字+英文句号+阿拉伯数字+空格+中文”。由此,可设置匹配规则为:将“小于20个字符的中文”的段落与一级标题相匹配,将“阿拉伯数字+英文句号+空格+小于30个字符的中英文”的段落与二级标题相匹配,将“阿拉伯数字+英文句号+阿拉伯数字+空格+小于40个字符的中英文”的段落与三级标题相匹配。
步骤S202、读取Word文档,利用匹配规则,将Word文档中符合匹配规则的内容的样式设置为EPub文档可识别的标题样式。
具体地,读取Word文档的全文,将文章中符合“小于20个字符的中文”这一标准的段落内容设置为一级标题,如一级标题的样式为“黑体二号居中段后一行”,则“导论”的样式则设置为“黑体二号居中段后一行”。二级标题的样式为“宋体三号加粗左对齐”,则将“1.DocBook是什么”设置为“宋体三号加粗左对齐”。同理,将Word文档中小节标题的样式也设置为相应的三级标题的样式。该步骤可由计算机自动执行,也可由用户手动操作。
步骤S203、根据EPub可识别的标题样式,生成XML文件。
具体来说,EPub可识别的标题样式即为一级标题、二级标题和三级标题的样式,根据需要,选择目录级别为“二级”,即代表EPub中有两级目录;而目录中只需节和小节的标题,则将一级目录对应选择“二级标题”,即Word文档中的二级标题作为EPub中一级目录的内容;二级目录对应选择“三级标题”,即Word文档中的三级标题作为EPub中二级目录的内容。
步骤S204、根据XML文件,从Word文档中提取符合XML中标题样式对应的内容。
具体来说,在Word文档转换为EPub文档的过程中,根据步骤S203中生成的XML文件,其中一级目录对应二级标题,二级标题样式为“宋体三号加粗左对齐”,将Word文档中符合该样式的内容提取出来,即将“1.DocBook是什么”提取出来,并记录下该段内容在EPub文档中的页号。同理的,对二级目录对应的内容做相同的处理。由于目录中不需要一级标题,则不提取“导论”。
步骤S205、将提取的内容作为标题,生成EPub文档的目录。即将上述提取的内容和页码记录下来,生成EPub文档的目录。
基于相同的技术构思,本发明实施例还提供一种应用于文件格式转换场景下的目录生成装置,如图6所示,包括:样式匹配模块1、目录索引模块2、标题提取模块3和目录生成模块4;
所述样式匹配模块1,用于读取第一文档,利用匹配规则,设置所述第一文档中符合所述匹配规则的内容的样式为第二文档可识别的标题样式,所述匹配规则为预设内容与标题样式的对应关系;
所述目录索引模块2,用于根据所述第二文档可识别的标题样式,生成目录索引文件;
所述标题提取模块3,用于根据所述目录索引文件,读取设置后的第一文档,提取出与所述第二文档可识别的标题样式对应的内容;
所述目录生成模块4,用于将提取的内容作为标题,生成与所述目录索引文件相匹配的目录。
较佳地,所述匹配规则为预设内容与标题样式的对应关系,具体为:
预设的文字内容与标题样式的对应关系;或,
预设的大纲级别与标题样式的对应关系;或,
预设的文字格式与标题样式的对应关系;或,
预设的文字样式与标题样式的对应关系。
较佳地,所述样式匹配模块1还用于通过以下方式获取所述匹配规则:
根据所述第一文档的内容和所述第二文档的标题样式,创建符合所述第一文档转换为所述第二文档时利用的匹配规则。
较佳地,所述目录索引模块2还用于:
获取所述第一文档的各样式,从所述各样式中提取所述第二文档可识别的标题样式,依据设定的目录级别及标题样式与目录级别的对应关系,生成所述目录索引文件。
较佳地,所述目录索引文件为可扩展标记语言XML,所述第一文档的文件格式为Microsoft Office Word,所述第二文档的文件格式为电子出版EPub。
总之,本发明实施例利用XML文件,在Word文档转换为EPub文档的过程中,自由灵活选择标题的级别,根据选择的标题样式自动提取目录内容,使生成目录的操作简便灵活高效,不易出错,解决了手动提取目录的繁琐和效率低等问题。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种应用于文件格式转换场景下的目录生成方法,其特征在于,包括:
读取第一文档,利用匹配规则,设置所述第一文档中符合所述匹配规则的内容的样式为第二文档可识别的标题样式,所述匹配规则为预设内容与标题样式的对应关系;
根据所述第二文档可识别的标题样式,生成目录索引文件;
根据所述目录索引文件,从设置后的第一文档中提取出符合所述目录索引文件中标题样式对应的内容;
将提取的内容作为标题,生成与所述目录索引文件相匹配的目录。
2.如权利要求1所述的方法,其特征在于,所述匹配规则为预设内容与标题样式的对应关系,具体为:
预设的文字内容与标题样式的对应关系;或,
预设的大纲级别与标题样式的对应关系;或,
预设的文字格式与标题样式的对应关系;或,
预设的文字样式与标题样式的对应关系。
3.如权利要求1或2所述的方法,其特征在于,所述读取第一文档之前,还包括通过以下方式获取所述匹配规则:
根据所述第一文档的内容和所述第二文档的标题样式,创建符合所述第一文档转换为所述第二文档时利用的匹配规则。
4.如权利要求1所述的方法,其特征在于,所述根据所述第二文档可识别的标题样式,生成目录索引文件,具体包括:
获取所述第一文档的各样式,从所述各样式中提取所述第二文档可识别的标题样式,依据设定的目录级别及标题样式与目录级别的对应关系,生成所述目录索引文件。
5.如权利要求1所述的方法,其特征在于,所述目录索引文件为可扩展标记语言XML,所述第一文档的文件格式为Microsoft Office Word,所述第二文档的文件格式为电子出版EPub。
6.一种应用于文件格式转换场景下的目录生成装置,其特征在于,包括:样式匹配模块、目录索引模块、标题提取模块和目录生成模块;
所述样式匹配模块,用于读取第一文档,利用匹配规则,设置所述第一文档中符合所述匹配规则的内容的样式为第二文档可识别的标题样式,所述匹配规则为预设内容与标题样式的对应关系;
所述目录索引模块,用于根据所述第二文档可识别的标题样式,生成目录索引文件;
所述标题提取模块,用于根据所述目录索引文件,读取设置后的第一文档,提取出与所述第二文档可识别的标题样式对应的内容;
所述目录生成模块,用于将提取的内容作为标题,生成与所述目录索引文件相匹配的目录。
7.如权利要求6所述的装置,其特征在于,所述匹配规则为预设内容与标题样式的对应关系,具体为:
预设的文字内容与标题样式的对应关系;或,
预设的大纲级别与标题样式的对应关系;或,
预设的文字格式与标题样式的对应关系;或,
预设的文字样式与标题样式的对应关系。
8.如权利要求6或7所述的装置,其特征在于,所述样式匹配模块还用于通过以下方式获取所述匹配规则:
根据所述第一文档的内容和所述第二文档的标题样式,创建符合所述第一文档转换为所述第二文档时利用的匹配规则。
9.如权利要求6所述的装置,其特征在于,所述目录索引模块还用于:
获取所述第一文档的各样式,从所述各样式中提取所述第二文档可识别的标题样式,依据设定的目录级别及标题样式与目录级别的对应关系,生成所述目录索引文件。
10.如权利要求6所述的装置,其特征在于,所述目录索引文件为可扩展标记语言XML,所述第一文档的文件格式为Microsoft Office Word,所述第二文档的文件格式为电子出版EPub。
CN201510390513.2A 2015-07-06 2015-07-06 一种应用于文件格式转换场景下的目录生成方法和装置 Expired - Fee Related CN106326194B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510390513.2A CN106326194B (zh) 2015-07-06 2015-07-06 一种应用于文件格式转换场景下的目录生成方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510390513.2A CN106326194B (zh) 2015-07-06 2015-07-06 一种应用于文件格式转换场景下的目录生成方法和装置

Publications (2)

Publication Number Publication Date
CN106326194A true CN106326194A (zh) 2017-01-11
CN106326194B CN106326194B (zh) 2019-03-29

Family

ID=57727515

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510390513.2A Expired - Fee Related CN106326194B (zh) 2015-07-06 2015-07-06 一种应用于文件格式转换场景下的目录生成方法和装置

Country Status (1)

Country Link
CN (1) CN106326194B (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106951540A (zh) * 2017-03-23 2017-07-14 掌阅科技股份有限公司 文件目录的生成方法、装置、服务器及计算机存储介质
CN110083805A (zh) * 2018-01-25 2019-08-02 北京大学 一种将Word文件转换为EPUB文件的方法及系统
WO2020000835A1 (zh) * 2018-06-29 2020-01-02 天津字节跳动科技有限公司 一种自动显示文档目录的方法及装置
CN110704573A (zh) * 2019-09-04 2020-01-17 平安科技(深圳)有限公司 目录存储方法、装置、计算机设备及存储介质
CN111144069A (zh) * 2019-12-30 2020-05-12 北大方正集团有限公司 一种基于表格的目录排版方法、装置及存储介质
CN111399900A (zh) * 2020-03-10 2020-07-10 山东汇贸电子口岸有限公司 一种基于python与正则表达式的API文档自动生成方法及系统
CN111444699A (zh) * 2018-12-27 2020-07-24 北大方正集团有限公司 目录更新方法、系统及计算机可读存储介质
CN111553130A (zh) * 2019-02-11 2020-08-18 珠海金山办公软件有限公司 一种章节标题样式转换方法、装置、电子设备及存储介质
CN111563364A (zh) * 2019-02-14 2020-08-21 珠海金山办公软件有限公司 一种章节标题样式转换方法、装置、电子设备及存储介质
CN113361256A (zh) * 2021-06-24 2021-09-07 上海真虹信息科技有限公司 一种基于Aspose技术的Word文档快速解析方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008097162A (ja) * 2006-10-10 2008-04-24 Hitachi Ltd 電子カタログシステム
CN102541948A (zh) * 2010-12-23 2012-07-04 北大方正集团有限公司 用于提取文档结构的方法和装置
CN102855244A (zh) * 2011-06-28 2013-01-02 北大方正集团有限公司 文档目录处理方法和装置
CN104699714A (zh) * 2013-12-09 2015-06-10 北大方正集团有限公司 将书版格式文件转换为epub格式文件的方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008097162A (ja) * 2006-10-10 2008-04-24 Hitachi Ltd 電子カタログシステム
CN102541948A (zh) * 2010-12-23 2012-07-04 北大方正集团有限公司 用于提取文档结构的方法和装置
CN102855244A (zh) * 2011-06-28 2013-01-02 北大方正集团有限公司 文档目录处理方法和装置
CN104699714A (zh) * 2013-12-09 2015-06-10 北大方正集团有限公司 将书版格式文件转换为epub格式文件的方法及装置

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106951540B (zh) * 2017-03-23 2018-01-12 掌阅科技股份有限公司 文件目录的生成方法、装置、服务器及计算机存储介质
CN106951540A (zh) * 2017-03-23 2017-07-14 掌阅科技股份有限公司 文件目录的生成方法、装置、服务器及计算机存储介质
CN110083805A (zh) * 2018-01-25 2019-08-02 北京大学 一种将Word文件转换为EPUB文件的方法及系统
WO2020000835A1 (zh) * 2018-06-29 2020-01-02 天津字节跳动科技有限公司 一种自动显示文档目录的方法及装置
US11347930B2 (en) 2018-06-29 2022-05-31 Tianjin Bytedance Technology Co., Ltd. Method and apparatus for automatically displaying directory of document
CN111444699A (zh) * 2018-12-27 2020-07-24 北大方正集团有限公司 目录更新方法、系统及计算机可读存储介质
CN111444699B (zh) * 2018-12-27 2022-03-01 北大方正集团有限公司 目录更新方法、系统及计算机可读存储介质
CN111553130A (zh) * 2019-02-11 2020-08-18 珠海金山办公软件有限公司 一种章节标题样式转换方法、装置、电子设备及存储介质
CN111563364A (zh) * 2019-02-14 2020-08-21 珠海金山办公软件有限公司 一种章节标题样式转换方法、装置、电子设备及存储介质
CN111563364B (zh) * 2019-02-14 2023-12-22 珠海金山办公软件有限公司 一种章节标题样式转换方法、装置、电子设备及存储介质
CN110704573A (zh) * 2019-09-04 2020-01-17 平安科技(深圳)有限公司 目录存储方法、装置、计算机设备及存储介质
CN110704573B (zh) * 2019-09-04 2023-12-22 平安科技(深圳)有限公司 目录存储方法、装置、计算机设备及存储介质
CN111144069B (zh) * 2019-12-30 2021-12-03 北大方正集团有限公司 一种基于表格的目录排版方法、装置及存储介质
CN111144069A (zh) * 2019-12-30 2020-05-12 北大方正集团有限公司 一种基于表格的目录排版方法、装置及存储介质
CN111399900A (zh) * 2020-03-10 2020-07-10 山东汇贸电子口岸有限公司 一种基于python与正则表达式的API文档自动生成方法及系统
CN111399900B (zh) * 2020-03-10 2023-04-07 山东汇贸电子口岸有限公司 一种基于python与正则表达式的API文档自动生成方法及系统
CN113361256A (zh) * 2021-06-24 2021-09-07 上海真虹信息科技有限公司 一种基于Aspose技术的Word文档快速解析方法

Also Published As

Publication number Publication date
CN106326194B (zh) 2019-03-29

Similar Documents

Publication Publication Date Title
CN106326194A (zh) 一种应用于文件格式转换场景下的目录生成方法和装置
CN109032999B (zh) 笔记显示方法、电子设备及计算机存储介质
EP2291010A1 (en) Structure processing method and apparatus for layout file
CN103500118B (zh) 一种级联样式表优化方法和装置
CN101271463B (zh) 版式文件的结构处理方法和系统
CN102779118B (zh) 一种论文的排版方法及系统
CN104239284A (zh) 一种图文自动排版的方法和装置
CN106021394A (zh) 一种网站的建站方法和装置
CN102855244B (zh) 文档目录处理方法和装置
GB2535616A (en) Reflow of handwriting content
CN105654022A (zh) 一种提取文档结构化信息的方法及装置
CN105630753A (zh) 一种核电站数字化规程的升级转换方法及系统
CN101520693A (zh) 一种批量信息快速输入的方法及系统
CN110765743A (zh) 用于数学公式在HTML中编辑显示和导出到Word文档中的系统
CN102959538A (zh) 给文档编索引
CN108073562A (zh) 基于云平台的出版物处理方法及装置
CN106970913A (zh) 一种时间的提取方法及装置
KR101229175B1 (ko) 자필 폰트 생성 방법 및 장치
CN104298705A (zh) 一种关系型数据和非结构化数据的转换方法
CN102110108B (zh) 一种对小样文件的处理方法及装置
CN106406560B (zh) 桌面操作系统中机械工程字符矢量字体输出方法和系统
CN105718434A (zh) 一种自然语言公式编辑方法和系统
CN104536947A (zh) 版式文档的处理方法及装置
CN105373562A (zh) 一种pdf文档注释的获取方法及装置
US11410575B2 (en) Interface and tools for accessible textbook generation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20220628

Address after: 3007, Hengqin international financial center building, No. 58, Huajin street, Hengqin new area, Zhuhai, Guangdong 519031

Patentee after: New founder holdings development Co.,Ltd.

Patentee after: BEIJING FOUNDER ELECTRONICS Co.,Ltd.

Address before: 100871, Beijing, Haidian District Cheng Fu Road 298, founder building, 5 floor

Patentee before: PEKING UNIVERSITY FOUNDER GROUP Co.,Ltd.

Patentee before: BEIJING FOUNDER ELECTRONICS Co.,Ltd.

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20190329