CN110874519B - 一种将Markdown文档转换为PDF文档的方法、装置 - Google Patents

一种将Markdown文档转换为PDF文档的方法、装置 Download PDF

Info

Publication number
CN110874519B
CN110874519B CN201811000434.6A CN201811000434A CN110874519B CN 110874519 B CN110874519 B CN 110874519B CN 201811000434 A CN201811000434 A CN 201811000434A CN 110874519 B CN110874519 B CN 110874519B
Authority
CN
China
Prior art keywords
document
content unit
grammar
description information
converted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811000434.6A
Other languages
English (en)
Other versions
CN110874519A (zh
Inventor
邓斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Kingsoft Office Software Inc
Zhuhai Kingsoft Office Software Co Ltd
Guangzhou Kingsoft Mobile Technology Co Ltd
Original Assignee
Beijing Kingsoft Office Software Inc
Zhuhai Kingsoft Office Software Co Ltd
Guangzhou Kingsoft Mobile Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Kingsoft Office Software Inc, Zhuhai Kingsoft Office Software Co Ltd, Guangzhou Kingsoft Mobile Technology Co Ltd filed Critical Beijing Kingsoft Office Software Inc
Priority to CN201811000434.6A priority Critical patent/CN110874519B/zh
Publication of CN110874519A publication Critical patent/CN110874519A/zh
Application granted granted Critical
Publication of CN110874519B publication Critical patent/CN110874519B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

本发明实施例提供了一种将Markdown文档转换为PDF文档的方法,当需要将Markdown文档转换成PDF文档时,可以获取待转换文档,待转换文档为Markdown文档,并从待转换文档中,提取各文档内容单元,以及每个文档内容单元的语法描述信息,其中,一个文档内容单元为语法描述信息相同的一组文档内容,一个文档内容单元的语法描述信息用于表示该文档内容单元的显示格式,以及针对每个文档内容单元,按照该文档内容单元的语法描述信息所表示的显示格式,将该文档内容单元转换为该显示格式的内容,得到该文档内容单元的转换内容,并将从待转换文档中提取的各文档内容单元的转换内容,写入空白PDF文档中,得到转换后的PDF文档,实现了简化Markdown文档转换成PDF文档的过程,提高了转换效率。

Description

一种将Markdown文档转换为PDF文档的方法、装置
技术领域
本发明涉及文档处理技术领域,特别是涉及一种将Markdown文档转换为PDF文档的方法、装置及电子设备。
背景技术
Markdown是目前互联网上最流行的写作语言,它使用一些简单的符号来标记文本格式,因其简洁的语法、格式以及强大的软件支持,而深受喜爱。
而PDF(可移植文档格式,Portable Document Format)文档则是一种电子文件格式,不管是在Windows操作系统、Unix操作系统还是Mac OS操作系统中都是通用的。这一特点使得PDF成为在因特网上进行电子文档发行和数字化信息传播的理想文档格式。越来越多的电子图书、产品说明、公司文告、网络资料、电子邮件在开始使用PDF格式文件。
为了使Markdown文档转换成PDF文档,现有技术通常先将Markdown文档转换成HTML(超文本标记语言,Hyper Text Markup Language)文档或Word文档,然后再将HTML文档或者Word文档转换成PDF文档。
发明人在实现本发明的过程中发现,现有技术至少存在如下问题:
为了使Markdown文档转换成PDF文档,需先将Markdown文档转换成HTML文档或Word文档,然后再由HTML文档或者Word文档转换成PDF文档,转换过程繁琐,转换效率较低。
发明内容
本发明实施例的目的在于提供一种将Markdown文档转换为PDF文档的方法,以实现简化Markdown文档转换成PDF文档的过程,提高转换效率。具体技术方案如下:
本发明实施例提供一种将Markdown文档转换为PDF文档的方法,所述方法包括:
获取待转换文档,所述待转换文档为Markdown文档;
从所述待转换文档中,提取各文档内容单元,以及每个文档内容单元的语法描述信息,其中,一个文档内容单元为对应同一个语法描述信息的一组文档内容,一个文档内容单元的语法描述信息用于表示该文档内容单元的显示格式;
针对每个文档内容单元,按照该文档内容单元的语法描述信息所表示的显示格式,将该文档内容单元转换为该显示格式的内容,得到该文档内容单元的转换内容;
将从所述待转换文档中提取的各文档内容单元的转换内容,写入空白PDF文档中,得到转换后的PDF文档。
进一步的,所述从所述待转换文档中,提取各文档内容单元,以及每个文档内容单元的语法描述信息,包括:
按照预设的Markdown语法规则,从所述待转换文档中提取表示语法描述信息的语法内容单元,一个语法内容单元表示一个语法描述信息;
针对每个语法描述信息,确定该语法描述信息所表示的文档内容范围;
提取该文档内容范围所包括的文档内容,作为该语法描述信息对应的文档内容单元。
进一步的,所述按照预设的Markdown语法规则,从所述待转换文档中提取表示语法描述信息的语法内容单元,包括:
按照预设的Markdown语法规则,确定所述待转换文档中的字符是否属于语法内容;
将属于语法内容且用于表示一个语法描述信息的一组字符,确定为一个语法内容单元,并提取该语法内容单元。
进一步的,所述确定该语法描述信息所表示的文档内容范围,包括:
确定该语法描述信息对应的语法内容单元所包含的字符之间的范围,为该语法描述信息所表示的文档内容范围;或者
确定该语法描述信息对应的语法内容单元至下一个语法内容单元之间之间的范围,为该语法描述信息所表示的文档内容范围。
进一步的,所述按照该文档内容单元的语法描述信息所表示的显示格式,将该文档内容单元转换为该显示格式的内容,得到该文档内容单元的转换内容,包括:
当该文档内容单元的语法描述信息表示该文档内容单元为文本类型时,按照该文档内容单元的语法描述信息所表示的显示格式,将该文档内容单元转换为该显示格式的文本内容,得到该文档内容单元的转换内容;或者
当该文档内容单元的语法描述信息表示该文档内容单元为图像类型时,从该文档内容单元所表示的地址获取图像,按照该文档内容单元的语法描述信息所表示的显示格式,将该图像转换为该显示格式的转换后图像,作为该文档内容单元的转化内容。
本发明实施例还提供一种将Markdown文档转换为PDF文档的装置,所述装置包括:
文档获取模块,用于获取待转换文档,所述待转换文档为Markdown文档;
文档内容提取模块,用于从所述待转换文档中,提取各文档内容单元;
语法信息提取模块,用于从所述待转换文档中,提取每个文档内容单元的语法描述信息,其中,一个文档内容单元为对应同一个语法描述信息的一组文档内容,一个文档内容单元的语法描述信息用于表示该文档内容单元的显示格式;
内容转换模块,用于针对每个文档内容单元,按照该文档内容单元的语法描述信息所表示的显示格式,将该文档内容单元转换为该显示格式的内容,得到该文档内容单元的转换内容;
内容写入模块,用于将从所述待转换文档中提取的各文档内容单元的转换内容,写入空白PDF文档中,得到转换后的PDF文档。
进一步的,所述语法信息提取模块,具体用于按照预设的Markdown语法规则,从所述待转换文档中提取表示语法描述信息的语法内容单元,一个语法内容单元表示一个语法描述信息;
所述文档内容提取模块,具体用于针对每个语法描述信息,确定该语法描述信息所表示的文档内容范围;并提取该文档内容范围所包括的文档内容,作为该语法描述信息对应的文档内容单元。
进一步的,所述语法信息提取模块,具体用于按照预设的Markdown语法规则,确定所述待转换文档中的字符是否属于语法内容,以及将属于语法内容且用于表示一个语法描述信息的一组字符,确定为一个语法内容单元,并提取该语法内容单元。
进一步的,所述文档内容提取模块,具体用于确定该语法描述信息对应的语法内容单元所包含的字符之间的范围,为该语法描述信息所表示的文档内容范围;或者,
确定该语法描述信息对应的语法内容单元至下一个语法内容单元之间之间的范围,为该语法描述信息所表示的文档内容范围。
进一步的,所述内容转换模块,具体用于当该文档内容单元的语法描述信息表示该文档内容单元为文本类型时,按照该文档内容单元的语法描述信息所表示的显示格式,将该文档内容单元转换为该显示格式的文本内容,得到该文档内容单元的转换内容;或者
当该文档内容单元的语法描述信息表示该文档内容单元为图像类型时,从该文档内容单元所表示的地址获取图像,按照该文档内容单元的语法描述信息所表示的显示格式,将该图像转换为该显示格式的转换后图像,作为该文档内容单元的转换内容。
本发明实施例还提供一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现实现上述任一将Markdown文档转换为PDF文档的方法的步骤。
本发明实施还提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一将Markdown文档转换为PDF文档的方法的步骤。
本发明实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一将Markdown文档转换为PDF文档的方法。
本发明实施例提供的一种将Markdown文档转换为PDF文档的方法,方案中,当需要将Markdown文档转换成PDF文档时,可以获取待转换文档,待转换文档为Markdown文档,并从待转换文档中,提取各文档内容单元,以及每个文档内容单元的语法描述信息,其中,一个文档内容单元为语法描述信息相同的一组文档内容,一个文档内容单元的语法描述信息用于表示该文档内容单元的显示格式,以及针对每个文档内容单元,按照该文档内容单元的语法描述信息所表示的显示格式,将该文档内容单元转换为该显示格式的内容,得到该文档内容单元的转换内容,并将从待转换文档中提取的各文档内容单元的转换内容,写入空白PDF文档中,得到转换后的PDF文档,由于直接通过Markdown文档生成PDF文档,取消了将Markdown文档转换成HTML文档或Word文档,再由HTML文档或者Word文档转换成PDF文档的中间过程,实现了简化Markdown文档转换成PDF文档的过程,提高了转换效率。
当然,实施本发明的任一产品或方法并不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1为本发明一个实施例提供的将Markdown文档转换为PDF文档的方法的流程图;
图2为本发明另一个实施例提供的将Markdown文档转换为PDF文档的方法的流程图;
图3为本发明一个实施例提供的将Markdown文档转换为PDF文档的装置的结构示意图;
图4为本发明实施例提供的电子设备的结构示意图。
具体实施方式
为了给出实现简化Markdown文档转换成PDF文档的过程,提高转换效率,本发明实施例提供了一种将Markdown文档转换为PDF文档的方法、装置及电子设备,以下结合说明书附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。并且在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
在本发明的一个实施例中,提供一种将Markdown文档转换为PDF文档的方法,如图1所示,该方法包括以下步骤:
S101:获取待转换文档,待转换文档为Markdown文档。
本步骤中,Markdown文档可以为文档后缀为.md的文档,其中,待转换文档的获取方法可以根据实际需求进行多样化的设置,例如,可以通过弹出选择框的方式,选择待转换的Markdown文档,也可以通过输入文档地址的方式加载待转换的Markdown文档。
S102:从待转换文档中,提取各文档内容单元,以及每个文档内容单元的语法描述信息,其中,一个文档内容单元为对应同一个语法描述信息的一组文档内容,一个文档内容单元的语法描述信息用于表示该文档内容单元的显示格式。
本步骤中,针对获取的待转换文档,提取待转换文档中的各文档内容单元,以及每个内容单元的语法描述信息,例如,针对Markdown文档中的“#Markdown”语句,提取的文档内容单元为“Markdown”,其语法描述信息为:将文档内容单元“Markdown”作为最高阶标题,其代表的默认的显示格式为“宋体、加粗、字体大小为31”。
S103:针对每个文档内容单元,按照该文档内容单元的语法描述信息所表示的显示格式,将该文档内容单元转换为该显示格式的内容,得到该文档内容单元的转换内容。
本步骤中,针对不同的文档内容单元的语法描述信息表示该文档内容单元为不同类型时,可以采用两种不同的方式,例如:
第一种方式,当该文档内容单元的语法描述信息表示该文档内容单元为文本类型时,按照该文档内容单元的语法描述信息所表示的显示格式,将该文档内容单元转换为该显示格式的文本内容,得到该文档内容单元的转换内容。
例如,针对Markdown文档中的“#Markdown”语句,其文本内容单元“Markdown”的语法描述信息为:将文档内容单元“Markdown”作为最高阶标题,其代表的默认显示格式为“宋体、加粗、字体大小为31”,即“Markdown”文本内容单元前“#”语法符号所代表的语法描述信息表示“Markdown”文档内容单元为文本类型。其中,当需要对文档内容单元“Markdown”进行转换时,将文档内容单元“Markdown”的字体调整为宋体、加粗,并将文本内容单元“Markdown”字体大小调节为31,得到的“宋体、加粗、字体大小为31”的“Markdown”即为待转换内容。
第二种方式,当该文档内容单元的语法描述信息表示该文档内容单元为图像类型时,从该文档内容单元所表示的地址获取图像,按照该文档内容单元的语法描述信息所表示的显示格式,将该图像转换为该显示格式的转换后图像,作为该文档内容单元的转换内容。
例如,针对Markdown文档中的“![](https://www.zybuluo.com/slogo.png)”语句,由Markdown语法可知,对于“![]()”语法语句,其“()”内为需要显示图片的地址,故该语句中文档内容单元为“https://www.zybuluo.com/logo.png”,其语法描述信息为依据“()”内图片地址,获取并展示图片,在本实施例中,依据文档内容单元“https://www.zybuluo.com/logo.png”所表示的地址获取图像,将将该图像转换为该显示格式的转换后图像,作为该文档内容单元的转换内容。
S104:将从待转换文档中提取的各文档内容单元的转换内容,写入空白PDF文档中,得到转换后的PDF文档。
本步骤中,将得到的待转换内容写入空白PDF文档中,写入转换内容过程中,当空白PDF文档中一行铺满后,自动换行继续写入转换内容,当空白PDF文档中一页铺满后,自动添加空白页,继续写入转换内容,当所有的转换内容全部写入空白PDF文档中后,即得到了转换后的PDF文档。
本发明实施例提供的上述将Markdown文档转换为PDF文档的方法中,当需要将Markdown文档转换成PDF文档时,可以获取待转换文档,待转换文档为Markdown文档,并从待转换文档中,提取各文档内容单元,以及每个文档内容单元的语法描述信息,其中,一个文档内容单元为语法描述信息相同的一组文档内容,一个文档内容单元的语法描述信息用于表示该文档内容单元的显示格式,以及针对每个文档内容单元,按照该文档内容单元的语法描述信息所表示的显示格式,将该文档内容单元转换为该显示格式的内容,得到该文档内容单元的转换内容,并将从待转换文档中提取的各文档内容单元的转换内容,写入空白PDF文档中,得到转换后的PDF文档,由于直接通过Markdown文档生成PDF文档,取消了将Markdown文档转换成HTML文档或Word文档,再由HTML文档或者Word文档转换成PDF文档的中间过程,实现了简化Markdown文档转换成PDF文档的过程,提高了转换效率。
在本发明的另一个实施例中,还提供一种将Markdown文档转换为PDF文档的方法,如图2所示,该方法包括以下步骤:
S201:获取待转换文档,待转换文档为Markdown文档。
本步骤,具体可以采用上述步骤S101描述的方式执行,在此不再进行详细描述。
S202:按照预设的Markdown语法规则,确定待转换文档中的字符是否属于语法内容;
本步骤中,读取待转换文档中的字符,将读取的字符与预设的Markdown语法规则进行对比,判断该字符是否属于语法内容,例如,针对Markdown文档中的“#Markdown”语句,读取第一个字符“#”,将读取的“#”与预设的Markdown语法规则进行对比,判断出“#”字符属于语法内容,再读取第二个字符“M”,对比预设的Markdown语法规则,判断“M”不属于语法内容。
S203:将属于语法内容且用于表示一个语法描述信息的一组字符,确定为一个语法内容单元,并提取该语法内容单元,一个语法内容单元表示一个语法描述信息。
本步骤中,将属于语法内容且用于表示一个语法描述信息的一组字符,确定为一个语法内容单元,并提取该语法内容单元,针对Markdown文档中的不同语句,例如,针对Markdown文档中的“#Markdown”语句,确定出“#”为一个语法内容单元,表示的语法描述信息为:将文档内容单元“Markdown”显示为最高阶标题,针对“##Markdown”语句,确定出“##”为一个语法内容单元,其表示的语法描述信息为:将文档内容单元“Markdown”显示为二阶标题,针对“![](https://www.zybuluo.com/logo.png)”语句中,属于语法内容的字符有“!”,“[”,“]”,“(”和“)”,上述5个字符“!”,“[”,“]”,“(”和“)”为一组字符,确定语法内容单元为“![]()”,其代表的语法信息为显示“()”内地址代表的图片。
S204:针对每个语法描述信息,确定该语法描述信息对应的语法内容单元所包含的字符之间的范围。
本步骤中,针对不同的语法描述信息可以如下两种方式确定该语法描述信息对应的语法内容单元所包含的字符之间的范围:
第一种方式,确定该语法描述信息对应的语法内容单元所包含的字符之间的范围,为该语法描述信息所表示的文档内容范围,例如,针对Markdown文档中“![](https://www.zybuluo.com/logo.png)”语句,字符“(”和字符“)”之间为对应语法信息所表示的文档内容范围。
第二种方式,确定该语法描述信息对应的语法内容单元至下一个语法内容单元之间之间的范围,为该语法描述信息所表示的文档内容范围,例如针对Markdown文档中“#Markdown”语句,当读取到“n”字符后的换行符后,确定“#”字符与换行符之间的“Markdown”为文档内容范围。
S205:提取该文档内容范围所包括的文档内容,作为该语法描述信息对应的文档内容单元。
本步骤中,提取该文档内容范围所包括的文档内容,作为该语法描述信息对应的文档内容单元,例如,针对Markdown文档中“#Markdown”语句,确定文档内容范围为“Markdown”,提取文档内容“Markdown”作为语法内容单元“#”表示的语法描述信息的文档内容单元。
S206:针对每个文档内容单元,按照该文档内容单元的语法描述信息所表示的显示格式,将该文档内容单元转换为该显示格式的内容,得到该文档内容单元的转换内容。
本步骤,具体可以采用上述步骤S103描述的方式执行,在此不再进行详细描述。
S207:将从待转换文档中提取的各文档内容单元的转换内容,写入空白PDF文档中,得到转换后的PDF文档。
本步骤,具体可以采用上述步骤S104描述的方式执行,在此不再进行详细描述。
本发明实施例提供的上述将Markdown文档转换为PDF文档的方法中,当需要将Markdown文档转换成PDF文档时,可以获取待转换文档,待转换文档为Markdown文档,并从待转换文档中,提取各文档内容单元,以及每个文档内容单元的语法描述信息,并按照预设的Markdown语法规则,确定待转换文档中的字符是否属于语法内容,并将属于语法内容且用于表示一个语法描述信息的一组字符,确定为一个语法内容单元,以及提取该语法内容单元,一个语法内容单元表示一个语法描述信息,并针对每个语法描述信息,确定该语法描述信息对应的语法内容单元所包含的字符之间的范围,以及提取该文档内容范围所包括的文档内容,作为该语法描述信息对应的文档内容单元,以及针对每个文档内容单元,按照该文档内容单元的语法描述信息所表示的显示格式,将该文档内容单元转换为该显示格式的内容,得到该文档内容单元的转换内容,以及将从待转换文档中提取的各文档内容单元的转换内容,写入空白PDF文档中,得到转换后的PDF文档,由于直接通过Markdown文档生成PDF文档,取消了将Markdown文档转换成HTML文档或Word文档,再由HTML文档或者Word文档转换成PDF文档的中间过程,实现了简化Markdown文档转换成PDF文档的过程,提高了转换效率。
基于同一发明构思,根据本发明实施例提供的将Markdown文档转换为PDF文档的方法,本发明实施例还提供了一种将Markdown文档转换为PDF文档的装置,如图3所示,装置包括:
文档获取模块301,用于获取待转换文档,待转换文档为Markdown文档;
文档内容提取模块302,用于从待转换文档中,提取各文档内容单元;
语法信息提取模块303,用于从待转换文档中,提取每个文档内容单元的语法描述信息,其中,一个文档内容单元为对应同一个语法描述信息的一组文档内容,一个文档内容单元的语法描述信息用于表示该文档内容单元的显示格式;
内容转换模块304,用于针对每个文档内容单元,按照该文档内容单元的语法描述信息所表示的显示格式,将该文档内容单元转换为该显示格式的内容,得到该文档内容单元的转换内容;
内容写入模块305,用于将从待转换文档中提取的各文档内容单元的转换内容,写入空白PDF文档中,得到转换后的PDF文档。
进一步的,语法信息提取模块303,具体用于,按照预设的Markdown语法规则,从待转换文档中提取表示语法描述信息的语法内容单元,一个语法内容单元表示一个语法描述信息;
文档内容提取模块302,具体用于针对每个语法描述信息,确定该语法描述信息所表示的文档内容范围;并提取该文档内容范围所包括的文档内容,作为该语法描述信息对应的文档内容单元。
进一步的,语法信息提取模块303,具体用于按照预设的Markdown语法规则,确定待转换文档中的字符是否属于语法内容,以及将属于语法内容且用于表示一个语法描述信息的一组字符,确定为一个语法内容单元,并提取该语法内容单元。
进一步的,文档内容提取模块302,具体用于确定该语法描述信息对应的语法内容单元所包含的字符之间的范围,为该语法描述信息所表示的文档内容范围;或者,
确定该语法描述信息对应的语法内容单元至下一个语法内容单元之间之间的范围,为该语法描述信息所表示的文档内容范围。
进一步的,内容转换模块304,具体用于当该文档内容单元的语法描述信息表示该文档内容单元为文本类型时,按照该文档内容单元的语法描述信息所表示的显示格式,将该文档内容单元转换为该显示格式的文本内容,得到该文档内容单元的转换内容;或者,
当该文档内容单元的语法描述信息表示该文档内容单元为图像类型时,从该文档内容单元所表示的地址获取图像,按照该文档内容单元的语法描述信息所表示的显示格式,将该图像转换为该显示格式的转换后图像,作为该文档内容单元的转换内容。
本发明实施例还提供了一种电子设备,如图4所示,包括处理器401、通信接口402、存储器403和通信总线404,其中,处理器401,通信接口402,存储器403通过通信总线404完成相互间的通信,
存储器403,用于存放计算机程序;
处理器401,用于执行存储器403上所存放的程序时,实现如下步骤:
获取待转换文档,待转换文档为Markdown文档;
从待转换文档中,提取各文档内容单元,以及每个文档内容单元的语法描述信息,其中,一个文档内容单元为对应同一个语法描述信息的一组文档内容,一个文档内容单元的语法描述信息用于表示该文档内容单元的显示格式;
针对每个文档内容单元,按照该文档内容单元的语法描述信息所表示的显示格式,将该文档内容单元转换为该显示格式的内容,得到该文档内容单元的转换内容;
将从待转换文档中提取的各文档内容单元的转换内容,写入空白PDF文档中,得到转换后的PDF文档。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一将Markdown文档转换为PDF文档的方法的步骤。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一将Markdown文档转换为PDF文档的方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、电子设备、计算机可读存储介质、计算机程序产品而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (5)

1.一种将Markdown文档转换为PDF文档的方法,其特征在于,所述方法包括:
获取待转换文档,所述待转换文档为Markdown文档;
按照预设的Markdown语法规则,确定所述待转换文档中的字符是否属于语法内容;
将属于语法内容且用于表示一个语法描述信息的一组字符,确定为一个语法内容单元,并提取该语法内容单元,一个语法内容单元表示一个语法描述信息;
针对每个语法描述信息,确定该语法描述信息对应的语法内容单元所包含的字符之间的范围,为该语法描述信息所表示的文档内容范围;或者,确定该语法描述信息对应的语法内容单元至下一个语法内容单元之间的范围,为该语法描述信息所表示的文档内容范围;
提取该文档内容范围所包括的文档内容,作为该语法描述信息对应的文档内容单元,其中,一个文档内容单元为对应同一个语法描述信息的一组文档内容,一个文档内容单元的语法描述信息用于表示该文档内容单元的显示格式;
针对每个文档内容单元,按照该文档内容单元的语法描述信息所表示的显示格式,将该文档内容单元转换为该显示格式的内容,得到该文档内容单元的转换内容;
将从所述待转换文档中提取的各文档内容单元的转换内容,写入空白PDF文档中,得到转换后的PDF文档。
2.根据权利要求1所述的方法,其特征在于,所述按照该文档内容单元的语法描述信息所表示的显示格式,将该文档内容单元转换为该显示格式的内容,得到该文档内容单元的转换内容,包括:
当该文档内容单元的语法描述信息表示该文档内容单元为文本类型时,按照该文档内容单元的语法描述信息所表示的显示格式,将该文档内容单元转换为该显示格式的文本内容,得到该文档内容单元的转换内容;或者
当该文档内容单元的语法描述信息表示该文档内容单元为图像类型时,从该文档内容单元所表示的地址获取图像,按照该文档内容单元的语法描述信息所表示的显示格式,将该图像转换为该显示格式的转换后图像,作为该文档内容单元的转换内容。
3.一种将Markdown文档转换为PDF文档的装置,其特征在于,所述装置包括:
文档获取模块,用于获取待转换文档,所述待转换文档为Markdown文档;
语法信息提取模块,用于按照预设的Markdown语法规则,确定所述待转换文档中的字符是否属于语法内容;将属于语法内容且用于表示一个语法描述信息的一组字符,确定为一个语法内容单元,并提取该语法内容单元,一个语法内容单元表示一个语法描述信息;
文档内容提取模块,用于针对每个语法描述信息,确定该语法描述信息对应的语法内容单元所包含的字符之间的范围,为该语法描述信息所表示的文档内容范围;或者,确定该语法描述信息对应的语法内容单元至下一个语法内容单元之间之间的范围,为该语法描述信息所表示的文档内容范围;提取该文档内容范围所包括的文档内容,作为该语法描述信息对应的文档内容单元,其中,一个文档内容单元为对应同一个语法描述信息的一组文档内容,一个文档内容单元的语法描述信息用于表示该文档内容单元的显示格式;
内容转换模块,用于针对每个文档内容单元,按照该文档内容单元的语法描述信息所表示的显示格式,将该文档内容单元转换为该显示格式的内容,得到该文档内容单元的转换内容;
内容写入模块,用于将从所述待转换文档中提取的各文档内容单元的转换内容,写入空白PDF文档中,得到转换后的PDF文档。
4.根据权利要求3所述的装置,所述内容转换模块,具体用于当该文档内容单元的语法描述信息表示该文档内容单元为文本类型时,按照该文档内容单元的语法描述信息所表示的显示格式,将该文档内容单元转换为该显示格式的文本内容,得到该文档内容单元的转换内容;或者
当该文档内容单元的语法描述信息表示该文档内容单元为图像类型时,从该文档内容单元所表示的地址获取图像,按照该文档内容单元的语法描述信息所表示的显示格式,将该图像转换为该显示格式的转换后图像,作为该文档内容单元的转换内容。
5.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-2任一所述的方法。
CN201811000434.6A 2018-08-30 2018-08-30 一种将Markdown文档转换为PDF文档的方法、装置 Active CN110874519B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811000434.6A CN110874519B (zh) 2018-08-30 2018-08-30 一种将Markdown文档转换为PDF文档的方法、装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811000434.6A CN110874519B (zh) 2018-08-30 2018-08-30 一种将Markdown文档转换为PDF文档的方法、装置

Publications (2)

Publication Number Publication Date
CN110874519A CN110874519A (zh) 2020-03-10
CN110874519B true CN110874519B (zh) 2023-12-26

Family

ID=69715695

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811000434.6A Active CN110874519B (zh) 2018-08-30 2018-08-30 一种将Markdown文档转换为PDF文档的方法、装置

Country Status (1)

Country Link
CN (1) CN110874519B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103186513A (zh) * 2011-12-31 2013-07-03 北大方正集团有限公司 一种文档格式转换的方法及装置
CN105095160A (zh) * 2015-07-31 2015-11-25 河南大学 一种文档转换阅读方法与系统
CN107678777A (zh) * 2017-09-01 2018-02-09 郑州云海信息技术有限公司 一种软件文档的管理方法、装置及终端

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103186513A (zh) * 2011-12-31 2013-07-03 北大方正集团有限公司 一种文档格式转换的方法及装置
CN105095160A (zh) * 2015-07-31 2015-11-25 河南大学 一种文档转换阅读方法与系统
CN107678777A (zh) * 2017-09-01 2018-02-09 郑州云海信息技术有限公司 一种软件文档的管理方法、装置及终端

Also Published As

Publication number Publication date
CN110874519A (zh) 2020-03-10

Similar Documents

Publication Publication Date Title
US9411790B2 (en) Systems, methods, and media for generating structured documents
CN110083805A (zh) 一种将Word文件转换为EPUB文件的方法及系统
US20220374617A1 (en) Document translation method and apparatus, storage medium, and electronic device
US10402474B2 (en) Keyboard input corresponding to multiple languages
CN113515928B (zh) 电子文本生成方法、装置、设备及介质
WO2012016505A1 (zh) 一种文件处理方法及文件处理装置
EP4170543A1 (en) Video translation method and apparatus, storage medium, and electronic device
CN111414727B (zh) 一种pdf文档页眉页脚的编辑方法、装置及电子设备
CN110008807B (zh) 一种合同内容识别模型的训练方法、装置及设备
KR20160100322A (ko) 시멘틱상으로 의미있는 텍스트 선택들의 식별
CN111695414B (zh) 文档处理方法及装置、电子设备、计算机可读存储介质
CN111046627A (zh) 一种中文文字显示方法及系统
CN104216868A (zh) 一种文档显示格式的适配方法及装置
CN110874519B (zh) 一种将Markdown文档转换为PDF文档的方法、装置
CN112487138A (zh) 带格式文本的信息抽取方法和装置
CN112464927A (zh) 一种信息提取方法、装置及系统
CN106991083A (zh) 一种电子文档处理的方法及装置
JP7027757B2 (ja) 情報処理装置及び情報処理プログラム
JP5715172B2 (ja) 文書表示装置、文書表示方法及び文書表示プログラム
CN115546815A (zh) 一种表格识别方法、装置、设备及存储介质
CN111401005B (zh) 文本转换方法、装置及可读存储介质
CN113625919A (zh) 书籍内容的翻译方法、计算设备及计算机存储介质
CN111783482A (zh) 一种文本翻译方法、装置、计算机设备及存储介质
CN111143719A (zh) 论文在线出版方法、装置、设备及计算机可读存储介质
KR101561673B1 (ko) 클라우드를 이용한 문서 내의 텍스트 변환 방법 및 그 방법이 기록된 기록매체

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant