CN107943760A

CN107943760A - Pdf文档编辑的字体优化方法、装置、终端设备和存储介质

Info

Publication number: CN107943760A
Application number: CN201711175935.3A
Authority: CN
Inventors: 许德峰
Original assignee: Wanxing Polytron Technologies Inc
Current assignee: Wanxing Polytron Technologies Inc
Priority date: 2017-11-22
Filing date: 2017-11-22
Publication date: 2018-04-20
Anticipated expiration: 2037-11-22
Also published as: CN107943760B

Abstract

本发明涉及文档编辑技术领域，提出一种PDF文档编辑的字体优化方法、装置、终端设备和计算机存储介质。采用本发明提出的字体优化方法，即使本地字体库中不存在与PDF文档内嵌字体数据中的family字体族名称和style字体样式名称均相同的字体，仍然能够通过名称匹配率的计算找出本地字体库中与PDF文档的内嵌字体最近似的目标本地字体，然后通过将当前的文本编辑字体调整为所述目标本地字体，以及根据所述内嵌字体信息中的style字体样式对当前编辑的文本进行文本修饰处理，使得所述当前编辑的文本具有与所述内嵌字体信息中的style字体样式对应的文本显示效果，进而解决了PDF文档编辑时新编辑文本与原有文本的显示效果不一致的问题，提高了用户体验。

Description

PDF文档编辑的字体优化方法、装置、终端设备和存储介质

技术领域

本发明涉及文档编辑技术领域，尤其涉及一种PDF文档编辑的字体优化方法、装置、终端设备和计算机存储介质。

背景技术

PDF的字体内嵌是指将字体数据嵌入到PDF文档中，使得字体跟随PDF文档传输，能够让用户在使用不同的终端设备对PDF文档进行阅读时具有相同的阅读体验。然而，字体内嵌并不能满足用户在PDF文档编辑过程中的一些体验需求，比如在编辑时能够复用PDF文档中的内嵌字体，将其运用于新添加的文本以达到文本显示效果的统一。

解决上述问题的关键在于如何根据PDF文档中携带的内嵌字体查找与之匹配的本地字体，现有技术主要采用将PDF文档内嵌字体数据中的family字体族名称和style字体样式名称与本地字体库中保存的字体的相应名称进行对比，找出本地字体库中与该family字体族名称和style字体样式名称均相同的字体的技术方案。然而，本地字体库中有可能不存在与该family字体族名称和style字体样式名称均相同的字体，此时若采用上述方案则无法找到与PDF文档内嵌字体匹配的本地字体，进而导致PDF文档编辑时只能采用默认的本地字体，造成新编辑文本与原有文本的显示效果不一致，影响用户体验。

发明内容

有鉴于此，本发明实施例提供了一种PDF文档编辑的字体优化方法、装置、终端设备和计算机存储介质，能够在本地字体库中不存在与内嵌字体数据中的family字体族名称和style字体样式名称均相同的字体的情况下，解决PDF文档编辑时新编辑文本与原有文本的显示效果不一致的问题，提高用户体验。

本发明实施例的第一方面提供了一种PDF文档编辑的字体优化方法，包括：

获取PDF文档的内嵌字体信息；

提取所述内嵌字体信息中的字体名称关键字；

分别将本地字体库中每个字体的字体名称关键字与所述内嵌字体信息中的字体名称关键字进行匹配，得到所述本地字体库中每个字体的名称匹配率；

将所述本地字体库中名称匹配率最高的字体确定为目标本地字体；

若所述目标本地字体的style字体样式名称和所述内嵌字体信息中的style字体样式名称不同，则将当前的文本编辑字体调整为所述目标本地字体，并根据所述内嵌字体信息中的style字体样式对当前编辑的文本进行文本修饰处理，使得所述当前编辑的文本具有与所述内嵌字体信息中的style字体样式对应的文本显示效果。

本发明实施例的第二方面提供了一种PDF文档编辑的字体优化装置，包括：

内嵌字体获取模块，用于获取PDF文档的内嵌字体信息；

关键字提取模块，用于提取所述内嵌字体信息中的字体名称关键字；

关键字匹配模块，用于分别将本地字体库中每个字体的字体名称关键字与所述内嵌字体信息中的字体名称关键字进行匹配，得到所述本地字体库中每个字体的名称匹配率；

目标本地字体确定模块，用于将所述本地字体库中名称匹配率最高的字体确定为目标本地字体；

文本修饰处理模块，用于若所述目标本地字体的style字体样式名称和所述内嵌字体信息中的style字体样式名称不同，则将当前的文本编辑字体调整为所述目标本地字体，并根据所述内嵌字体信息中的style字体样式对当前编辑的文本进行文本修饰处理，使得所述当前编辑的文本具有与所述内嵌字体信息中的style字体样式对应的文本显示效果。

本发明实施例的第三方面提供了一种终端设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如本发明实施例的第一方面提供的PDF文档编辑的字体优化方法的步骤。

本发明实施例的第四方面提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现如本发明实施例的第一方面提供的PDF文档编辑的字体优化方法的步骤。

本发明实施例提出一种PDF文档编辑的字体优化方法，主要包括：获取PDF文档的内嵌字体信息；提取所述内嵌字体信息中的字体名称关键字；分别将本地字体库中每个字体的字体名称关键字与所述内嵌字体信息中的字体名称关键字进行匹配，得到所述本地字体库中每个字体的名称匹配率；将所述本地字体库中名称匹配率最高的字体确定为目标本地字体；若所述目标本地字体的style字体样式名称和所述内嵌字体信息中的style字体样式名称不同，则将当前的文本编辑字体调整为所述目标本地字体，并根据所述内嵌字体信息中的style字体样式对当前编辑的文本进行文本修饰处理，使得所述当前编辑的文本具有与所述内嵌字体信息中的style字体样式对应的文本显示效果。在上述过程中，即使本地字体库中不存在与PDF文档内嵌字体数据中的family字体族名称和style字体样式名称均相同的字体，仍然能够通过名称匹配率的计算找出本地字体库中与PDF文档的内嵌字体最近似的目标本地字体，然后通过将当前的文本编辑字体调整为所述目标本地字体，以及根据所述内嵌字体信息中的style字体样式对当前编辑的文本进行文本修饰处理，使得所述当前编辑的文本具有与所述内嵌字体信息中的style字体样式对应的文本显示效果，进而解决了PDF文档编辑时新编辑文本与原有文本的显示效果不一致的问题，提高了用户体验。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的一种PDF文档编辑的字体优化方法的第一个实施例的流程图；

图2是本发明实施例提供的一种PDF文档编辑的字体优化方法的第二个实施例的流程图；

图3是本发明实施例提供的一种PDF文档编辑的字体优化方法的第三个实施例的流程图；

图4是本发明实施例提供的一种PDF文档编辑的字体优化装置的一个实施例的结构图；

图5是本发明实施例提供的一种终端设备的示意图。

具体实施方式

以下描述中，为了说明而不是为了限定，提出了诸如特定系统结构、技术之类的具体细节，以便透彻理解本发明实施例。然而，本领域的技术人员应当清楚，在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中，省略对众所周知的系统、装置、电路以及方法的详细说明，以免不必要的细节妨碍本发明的描述。

本发明实施例提供了一种PDF文档编辑的字体优化方法、装置、终端设备和计算机存储介质，能够在本地字体库中不存在与内嵌字体数据中的family字体族名称和style字体样式名称均相同的字体的情况下，解决PDF文档编辑时新编辑文本与原有文本的显示效果不一致的问题，提高用户体验。

请参阅图1，本发明实施例中一种PDF文档编辑的字体优化方法的第一个实施例包括：

101、获取PDF文档的内嵌字体信息；

PDF类型的文档具有许多其他电子文档格式无法比拟的优点，比如可以将文字、字型、格式、颜色及独立于设备和分辨率的图形图像等信息封装到文档中。为了使PDF文档在不同的设备终端中阅读都具有相同的阅读体验，通常会将字体信息内嵌到PDF文档中，所述字体信息可以包括字体的名称、字体是否为内嵌字体、字体的类型、字体的编码方式以及字体支持的编码类型，比如family字体族名称、postscript字体名称、basefont字体名称以及style字体样式名称等。在步骤101，从PDF文档解析出内嵌其中的字体信息。

102、提取所述内嵌字体信息中的字体名称关键字；

在获取到PDF文档的内嵌字体信息后，从所述内嵌字体信息中提取字体名称关键字。所述内嵌字体信息中包含嵌入字体的名称，在步骤102中提取出这些名称作为关键字。

103、分别将本地字体库中每个字体的字体名称关键字与所述内嵌字体信息中的字体名称关键字进行匹配，得到所述本地字体库中每个字体的名称匹配率；

在提取出所述内嵌字体信息中的字体名称关键字之后，分别将本地字体库中每个字体的字体名称关键字与所述内嵌字体信息中的字体名称关键字进行匹配，得到所述本地字体库中每个字体的名称匹配率。各个所述名称匹配率分别代表着本地字体库中各个字体相对于PDF文档的内嵌字体的相似程度，可以通过两者之间字体名称关键字的相似程度进行计算，比如可以通过比较字体名称的关键字是否完全相同或者比较包含相同字符的关键字的数量大小等方式确定所述名称匹配率。

104、将所述本地字体库中名称匹配率最高的字体确定为目标本地字体；

在得到本地字体库中每个字体的名称匹配率之后，将所述本地字体库中名称匹配率最高的字体确定为目标本地字体。所述目标本地字体即为本地字体库中与所述PDF文档的内嵌字体的相似程度最高的字体，故采用所述目标本地字体进行该PDF文档的编辑具有与原有文本最接近的显示效果，用户体验最佳。

105、判断所述目标本地字体的style字体样式名称和所述内嵌字体信息中的style字体样式名称是否相同；

style字体样式决定了字体的样式特征，比如加粗，斜体等。显然，字体样式特征对于文本显示效果的影响是极大的，因此需要考虑所述目标本地字体的样式特征和PDF文档内嵌字体的样式特征是否相符，即判断所述目标本地字体的style字体样式名称和所述内嵌字体信息中的style字体样式名称是否相同。若相同，则执行步骤106；若不同，则执行步骤107。

106、将当前的文本编辑字体调整为所述目标本地字体；

若所述目标本地字体的style字体样式名称和所述内嵌字体信息中的style字体样式名称相同，则说明所述目标本地字体无论是字体特征还是样式特征都与PDF文档的内嵌字体高度相似，此时只需将当前的文本编辑字体调整为所述目标本地字体即可实现PDF文档编辑时新编辑文本与原有文本具有基本相同的显示效果。

需要说明的是，即使将步骤106去除，本发明实施例依然可以解决所述技术问题，因此步骤106并非本发明实施例中的必要技术特征，其也可以为其它任意的预设步骤。

107、将当前的文本编辑字体调整为所述目标本地字体，并根据所述内嵌字体信息中的style字体样式对当前编辑的文本进行文本修饰处理。

若所述目标本地字体的style字体样式名称和所述内嵌字体信息中的style字体样式名称不同，则将当前的文本编辑字体调整为所述目标本地字体，并根据所述内嵌字体信息中的style字体样式对当前编辑的文本进行文本修饰处理，使得所述当前编辑的文本具有与所述内嵌字体信息中的style字体样式对应的文本显示效果。比如，若所述内嵌字体信息中的style字体样式对应于加粗的字体显示效果，则对当前编辑的文本进行加粗的文本修饰处理，以实现新编辑文本与原有文本的显示效果一致。

具体的，所述根据所述内嵌字体信息中的style字体样式对当前编辑的文本进行文本修饰处理可以包括：

(1)若所述内嵌字体信息中的style字体样式名称中包含对应于文本加粗的特定字符，则修改当前编辑的文本的Text Mode属性，使得所述当前编辑的文本加粗；

(2)若所述内嵌字体信息中的style字体样式名称中包含对应于文本倾斜的特定字符，则修改当前编辑的文本的文本矩阵，使得所述当前编辑的文本具有与所述内嵌字体信息中的style字体样式对应的倾斜度。

在步骤(1)中，修改文本的Text Mode属性可以让文本拥有加粗的效果，这种方法也称为文本伪粗体实现技术。在步骤(2)中，通过修改文本的文本矩阵可以让文本倾斜，呈现斜体的效果，这种方法也称为文本伪斜体实现技术。

在本发明实施例中，获取PDF文档的内嵌字体信息；提取所述内嵌字体信息中的字体名称关键字；分别将本地字体库中每个字体的字体名称关键字与所述内嵌字体信息中的字体名称关键字进行匹配，得到所述本地字体库中每个字体的名称匹配率；将所述本地字体库中名称匹配率最高的字体确定为目标本地字体；若所述目标本地字体的style字体样式名称和所述内嵌字体信息中的style字体样式名称不同，则将当前的文本编辑字体调整为所述目标本地字体，并根据所述内嵌字体信息中的style字体样式对当前编辑的文本进行文本修饰处理，使得所述当前编辑的文本具有与所述内嵌字体信息中的style字体样式对应的文本显示效果。在上述过程中，即使本地字体库中不存在与PDF文档内嵌字体数据中的family字体族名称和style字体样式名称均相同的字体，仍然能够通过名称匹配率的计算找出本地字体库中与PDF文档的内嵌字体最近似的目标本地字体，然后通过将当前的文本编辑字体调整为所述目标本地字体，以及根据所述内嵌字体信息中的style字体样式对当前编辑的文本进行文本修饰处理，使得所述当前编辑的文本具有与所述内嵌字体信息中的style字体样式对应的文本显示效果，进而解决了PDF文档编辑时新编辑文本与原有文本的显示效果不一致的问题，提高了用户体验。

请参阅图2，本发明实施例中一种PDF文档编辑的字体优化方法的第二个实施例包括：

201、获取PDF文档的内嵌字体信息；

步骤201与步骤101相同，具体可参照步骤101的相关说明。

202、分别提取所述内嵌字体信息中的family字体族名称的关键字和postscript字体名称的关键字；

在获取到PDF文档的内嵌字体信息之后，分别提取所述内嵌字体信息中的family字体族名称的关键字和postscript字体名称的关键字。

其中，所述family字体族名称的关键字可以通过以下步骤提取：

(1)获取family字体族名称；

(2)若所述family字体族名称中包含加号字符且所述加号字符之前具有6个大写字母，则将所述加号字符和所述6个大写字符从所述family字体族名称中剔除；

(3)若所述family字体族名称中包含加号字符且所述加号字符之后全为大写字母，则将所述加号字符和所述加号字符之后的大写字母从所述family字体族名称中剔除；

(4)根据预设的分隔符将所述family字体族名称划分为多个字符段，将各个所述字符段确定为所述family字体族名称的各个关键字。

在PDF文档规范中，若字体名称带有字符标志“+”，则表示该字体为字体的子集，而进行关键字匹配时首要考虑的是字体的最高层级，因此需要将涉及字体子集的字符标志剔除，以避免对字体关键字的获取产生不良影响。具体的，字体子集标志的添加存在两种方式：A.字体名称前添加6个大写字母和加号字符“+”；B.字体名称后面添加加号字符“+”和若干大写字符。上述步骤(2)和(3)分别将这两种方式所添加的字体子集标志剔除；而在步骤(4)中，所述分隔符可以是扩折号、逗号、下划线或者空格等字符。

所述postscript字体名称的关键字可以通过以下步骤提取：

(1)获取postscript字体名称；

(2)若所述postscript字体名称中包含加号字符且所述加号字符之前具有6个大写字母，则将所述加号字符和所述6个大写字符从所述postscript字体名称中剔除；

(3)若所述postscript字体名称中包含加号字符且所述加号字符之后全为大写字母，则将所述加号字符和所述加号字符之后的大写字母从所述postscript字体名称中剔除；

(4)根据预设的分隔符将所述postscript字体名称划分为多个字符段，将各个所述字符段确定为所述postscript字体名称的各个关键字。

postscript字体名称的关键字的提取方法与family字体族名称的关键字的提取方法相同，具体可参照family字体族名称的关键字的提取说明。

203、分别将本地字体库中每个字体的family字体族名称的关键字和postscript字体名称的关键字，与所述内嵌字体信息中的family字体族名称的关键字和postscript字体名称的关键字进行匹配，得到所述本地字体库中每个字体的名称匹配率；

在提取到所述内嵌字体信息中的family字体族名称的关键字和postscript字体名称的关键字之后，即可将本地字体库中每个字体的family字体族名称的关键字与所述内嵌字体信息中的family字体族名称的关键字进行匹配，将本地字体库中每个字体的postscript字体名称的关键字与所述内嵌字体信息中的postscript字体名称的关键字进行匹配，综合考虑两种字体名称的匹配结果，得到所述本地字体库中每个字体的名称匹配率。其中，本地字体库中每个字体的family字体族名称的关键字和postscript字体名称的关键字同样可以通过步骤202中记载的方法提取。

具体的，所述本地字体库中任意一个字体的名称匹配率可以通过以下步骤确定：

(1)分别提取所述任意一个字体的family字体族名称的关键字和postscript字体名称的关键字；

(2)计算所述任意一个字体的family字体族名称的关键字和所述内嵌字体信息中的family字体族名称的关键字之间的第一匹配率；

(3)计算所述任意一个字体的postscript字体名称的关键字和所述内嵌字体信息中的postscript字体名称的关键字之间的第二匹配率；

(4)根据所述第一匹配率和第二匹配率计算得到所述任意一个字体的名称匹配率，所述名称匹配率与所述第一匹配率、所述第二匹配率均正相关。

在上述步骤(1)至(4)中，综合考虑了family字体族名称的关键字之间的第一匹配率以及postscript字体名称的关键字之间的第二匹配率，最后再根据第一匹配率和第二匹配率计算得到所述任意一个字体的名称匹配率。在保证所述名称匹配率与所述第一匹配率正相关，以及所述名称匹配率与所述第二匹配率正相关的条件下，可以采用多种方式计算名称匹配率的数值，比如可以采用计算第一匹配率和第二匹配率的和、平均值、平方平均数、简单几何平均数或者加权几何平均数等数值作为所述名称匹配率。

更进一步的，上述步骤(2)可以包括：

(2.1)统计所述任意一个字体的family字体族名称的关键字中与所述内嵌字体信息中的family字体族名称的关键字完全相同的关键字的第一数量；

(2.2)计算所述第一数量与所述任意一个字体的family字体族名称的关键字的数量之间的第一比值；

(2.3)统计所述任意一个字体的family字体族名称的关键字中与所述内嵌字体信息中的family字体族名称的关键字包含部分相同字符的关键字的第二数量；

(2.4)计算所述第二数量与所述任意一个字体的family字体族名称的关键字的数量之间的第二比值；

(2.5)统计所述内嵌字体信息中的family字体族名称的关键字中与所述任意一个字体的family字体族名称的关键字完全相同的关键字的第三数量；

(2.6)计算所述第三数量与所述内嵌字体信息中的family字体族名称的关键字的数量之间的第三比值；

(2.7)统计所述内嵌字体信息中的family字体族名称的关键字中与所述任意一个字体的family字体族名称的关键字包含部分相同字符的关键字的第四数量；

(2.8)计算所述第四数量与所述内嵌字体信息中的family字体族名称的关键字的数量之间的第四比值；

对于上述步骤(2.1)至(2.8)，举例说明如下：假设所述任意一个字体的family字体族名称的关键字的数量是10个，所述内嵌字体信息中的family字体族名称的关键字的数量是15个，所述任意一个字体的family字体族名称的关键字中与所述内嵌字体信息中的family字体族名称的关键字完全相同的关键字的数量是2个，所述任意一个字体的family字体族名称的关键字中与所述内嵌字体信息中的family字体族名称的关键字包含部分相同字符的关键字的数量是3个，所述内嵌字体信息中的family字体族名称的关键字中与所述任意一个字体的family字体族名称的关键字完全相同的关键字的数量是5个，所述内嵌字体信息中的family字体族名称的关键字中与所述任意一个字体的family字体族名称的关键字包含部分相同字符的关键字的数量是8个；则所述第一数量为2，所述第一比值为2/10，所述第二数量为3，所述第二比值为3/10，所述第三数量为5，所述第三比值为5/15，所述第四数量为8，所述第四比值为8/15。

(2.9)根据所述第一比值、第二比值、第三比值和第四比值计算得到所述第一匹配率，所述第一匹配率与所述第一比值、所述第二比值、所述第三比值、所述第四比值均正相关。

在得到所述第一比值、第二比值、第三比值和第四比值后，通过这些比值计算得到所述第一匹配率，所述第一匹配率与所述所述第一比值、所述第二比值、所述第三比值、所述第四比值均正相关。比如可以采用计算第一比值、第二比值、第三比值和第四比值的平方平均数、简单几何平均数或者加权几何平均数等数值作为所述第一匹配率。

更进一步的，上述步骤(3)可以包括：

(3.1)统计所述任意一个字体的postscript字体名称的关键字中与所述内嵌字体信息中的postscript字体名称的关键字完全相同的关键字的第五数量；

(3.2)计算所述第五数量与所述任意一个字体的postscript字体名称的关键字的数量之间的第五比值；

(3.3)统计所述任意一个字体的postscript字体名称的关键字中与所述内嵌字体信息中的postscript字体名称的关键字包含部分相同字符的关键字的第六数量；

(3.4)计算所述第六数量与所述任意一个字体的postscript字体名称的关键字的数量之间的第六比值；

(3.5)统计所述内嵌字体信息中的postscript字体名称的关键字中与所述任意一个字体的postscript字体名称的关键字完全相同的关键字的第七数量；

(3.6)计算所述第七数量与所述内嵌字体信息中的postscript字体名称的关键字的数量之间的第七比值；

(3.7)统计所述内嵌字体信息中的postscript字体名称的关键字中与所述任意一个字体的postscript字体名称的关键字包含部分相同字符的关键字的第八数量；

(3.8)计算所述第八数量与所述内嵌字体信息中的postscript字体名称的关键字的数量之间的第八比值；

(3.9)根据所述第五比值、第六比值、第七比值和第八比值计算得到所述第二匹配率，所述第二匹配率与所述第五比值、所述第六比值、所述第七比值、所述第八比值均正相关。

步骤(3.1)至(3.9)所采用的计算方法与步骤(2.1)至(2.9)相同，具体可参照步骤(2.1)至(2.9)的相关说明。

204、将所述本地字体库中名称匹配率最高的字体确定为目标本地字体；

205、判断所述目标本地字体的style字体样式名称和所述内嵌字体信息中的style字体样式是否相同；若相同，则执行步骤206，若不同则执行步骤207。

206、将当前的文本编辑字体调整为所述目标本地字体；

207、将当前的文本编辑字体调整为所述目标本地字体，并根据所述内嵌字体信息中的style字体样式对当前编辑的文本进行文本修饰处理。

步骤204至207与步骤104至107相同，具体可参照步骤104至107的相关说明。

在本发明实施例中，获取PDF文档的内嵌字体信息；分别提取所述内嵌字体信息中的family字体族名称的关键字和postscript字体名称的关键字；分别将本地字体库中每个字体的family字体族名称的关键字和postscript字体名称的关键字，与所述内嵌字体信息中的family字体族名称的关键字和postscript字体名称的关键字进行匹配，得到所述本地字体库中每个字体的名称匹配率；将所述本地字体库中名称匹配率最高的字体确定为目标本地字体；若所述目标本地字体的style字体样式名称和所述内嵌字体信息中的style字体样式名称不同，则将当前的文本编辑字体调整为所述目标本地字体，并根据所述内嵌字体信息中的style字体样式对当前编辑的文本进行文本修饰处理，使得所述当前编辑的文本具有与所述内嵌字体信息中的style字体样式对应的文本显示效果。在上述过程中，即使本地字体库中不存在与PDF文档内嵌字体数据中的family字体族名称和style字体样式名称均相同的字体，仍然能够通过名称匹配率的计算找出本地字体库中与PDF文档的内嵌字体最近似的目标本地字体，然后通过将当前的文本编辑字体调整为所述目标本地字体，以及根据所述内嵌字体信息中的style字体样式对当前编辑的文本进行文本修饰处理，使得所述当前编辑的文本具有与所述内嵌字体信息中的style字体样式对应的文本显示效果，进而解决了PDF文档编辑时新编辑文本与原有文本的显示效果不一致的问题，提高了用户体验。

请参阅图3，本发明实施例中一种PDF文档编辑的字体优化方法的第三个实施例包括：

301、获取PDF文档的内嵌字体信息；

步骤301与步骤101相同，具体可参照步骤101的相关说明。

302、分别提取所述内嵌字体信息中的family字体族名称的关键字和postscript字体名称的关键字；

步骤302与步骤202相同，具体可参照步骤202的相关说明。

303、若所述内嵌字体信息中的family字体族名称为空，则提取所述内嵌字体信息中的basefont字体名称的关键字替代所述内嵌字体信息中的family字体族名称的关键字；

在某些情况下，所述内嵌字体信息中的family字体族名称可能为空，此时无法提取所述内嵌字体信息中的family字体族名称的关键字，针对这种情况，可以提取所述内嵌字体信息中的basefont字体名称的关键字作为替代。basefont是基准字体，通常用于定义默认字体颜色、字体大小和字体系列等。

304、若所述内嵌字体信息中的postscript字体名称为空，则提取所述内嵌字体信息中的basefont字体名称的关键字替代所述内嵌字体信息中的postscript字体名称的关键字；

同样地，在某些情况下，所述内嵌字体信息中的postscript字体名称也可能为空，此时无法提取所述内嵌字体信息中的postscript字体名称的关键字。针对这种情况，也可以提取所述内嵌字体信息中的basefont字体名称的关键字作为替代。

通过步骤303和步骤304，能够使得本发明提出的方法适用于PDF内嵌字体信息中family字体族名称和/或postscript字体名称为空的特殊情况，大大扩展了适用范围，提高了实用性。

305、分别将本地字体库中每个字体的family字体族名称的关键字和postscript字体名称的关键字，与所述内嵌字体信息中的family字体族名称的关键字和postscript字体名称的关键字进行匹配，得到所述本地字体库中每个字体的名称匹配率；

在步骤305中，若所述内嵌字体信息中的family字体族名称为空，则实际为将本地字体库中每个字体的family字体族名称的关键字与所述内嵌字体信息中的basefont字体名称的关键字进行匹配；若所述内嵌字体信息中的postscript字体名称为空，则实际为将本地字体库中每个字体的postscript字体名称的关键字与所述内嵌字体信息中的basefont字体名称的关键字进行匹配。其余情况则与步骤203相同，可参照步骤203的相关说明。

306、将所述本地字体库中名称匹配率最高的字体确定为目标本地字体；

307、判断所述目标本地字体的style字体样式名称和所述内嵌字体信息中的style字体样式是否相同；

若相同，则执行步骤308，若不同，则执行步骤309。

308、将当前的文本编辑字体调整为所述目标本地字体；

309、将当前的文本编辑字体调整为所述目标本地字体，并根据所述内嵌字体信息中的style字体样式对当前编辑的文本进行文本修饰处理。

步骤306至309与步骤104至107相同，具体可参照步骤104至107的相关说明。

在本发明实施例中，获取PDF文档的内嵌字体信息；分别提取所述内嵌字体信息中的family字体族名称的关键字和postscript字体名称的关键字；若所述内嵌字体信息中的family字体族名称为空，则提取所述内嵌字体信息中的basefont字体名称的关键字替代所述内嵌字体信息中的family字体族名称的关键字；若所述内嵌字体信息中的postscript字体名称为空，则提取所述内嵌字体信息中的basefont字体名称的关键字替代所述内嵌字体信息中的postscript字体名称的关键字；分别将本地字体库中每个字体的family字体族名称的关键字和postscript字体名称的关键字，与所述内嵌字体信息中的family字体族名称的关键字和postscript字体名称的关键字进行匹配，得到所述本地字体库中每个字体的名称匹配率；将所述本地字体库中名称匹配率最高的字体确定为目标本地字体；若所述目标本地字体的style字体样式名称和所述内嵌字体信息中的style字体样式名称不同，则将当前的文本编辑字体调整为所述目标本地字体，并根据所述内嵌字体信息中的style字体样式对当前编辑的文本进行文本修饰处理，使得所述当前编辑的文本具有与所述内嵌字体信息中的style字体样式对应的文本显示效果。在上述过程中，即使本地字体库中不存在与PDF文档内嵌字体数据中的family字体族名称和style字体样式名称均相同的字体，仍然能够通过名称匹配率的计算找出本地字体库中与PDF文档的内嵌字体最近似的目标本地字体，然后通过将当前的文本编辑字体调整为所述目标本地字体，以及根据所述内嵌字体信息中的style字体样式对当前编辑的文本进行文本修饰处理，使得所述当前编辑的文本具有与所述内嵌字体信息中的style字体样式对应的文本显示效果，进而解决了PDF文档编辑时新编辑文本与原有文本的显示效果不一致的问题，提高了用户体验。另外，本发明实施例还利用内嵌字体信息的basefont字体名称作为名称匹配关键词的备用提取源，大大提高了适用性。

应理解，上述各个实施例中各步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本发明实施例的实施过程构成任何限定。

上面主要描述了一种PDF文档编辑的字体优化方法，下面将对一种PDF文档编辑的字体优化装置进行描述。

请参阅图4，本发明实施例中一种PDF文档编辑的字体优化装置的一个实施例包括：

内嵌字体获取模块401，用于获取PDF文档的内嵌字体信息；

关键字提取模块402，用于提取所述内嵌字体信息中的字体名称关键字；

关键字匹配模块403，用于分别将本地字体库中每个字体的字体名称关键字与所述内嵌字体信息中的字体名称关键字进行匹配，得到所述本地字体库中每个字体的名称匹配率；

目标本地字体确定模块404，用于将所述本地字体库中名称匹配率最高的字体确定为目标本地字体；

文本修饰处理模块405，用于若所述目标本地字体的style字体样式名称和所述内嵌字体信息中的style字体样式名称不同，则将当前的文本编辑字体调整为所述目标本地字体，并根据所述内嵌字体信息中的style字体样式对当前编辑的文本进行文本修饰处理，使得所述当前编辑的文本具有与所述内嵌字体信息中的style字体样式对应的文本显示效果。

进一步的，所述所述关键字提取模块402可以包括：

字体名称关键字提取单元，用于分别提取所述内嵌字体信息中的family字体族名称的关键字和postscript字体名称的关键字；

所述关键字匹配模块403可以包括：

本地字体关键字提取单元，用于分别提取本地字体库中任意一个字体的family字体族名称的关键字和postscript字体名称的关键字；

第一匹配率计算单元，用于计算所述任意一个字体的family字体族名称的关键字和所述内嵌字体信息中的family字体族名称的关键字之间的第一匹配率；

第二匹配率计算单元，用于计算所述任意一个字体的postscript字体名称的关键字和所述内嵌字体信息中的postscript字体名称的关键字之间的第二匹配率；

名称匹配率计算单元，用于根据所述第一匹配率和第二匹配率计算得到所述任意一个字体的名称匹配率，所述名称匹配率与所述第一匹配率、所述第二匹配率均正相关。

本发明实施例还提供一种终端设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如图1至图3表示的任意一种PDF文档编辑的字体优化方法的步骤。

本发明实施例还提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现如图1至图3表示的任意一种PDF文档编辑的字体优化方法的步骤。

图5是本发明一实施例提供的终端设备的示意图。如图5所示，该实施例的终端设备5包括：处理器50、存储器51以及存储在所述存储器51中并可在所述处理器50上运行的计算机程序52。所述处理器50执行所述计算机程序52时实现上述各个PDF文档编辑的字体优化方法的实施例中的步骤，例如图1所示的步骤101至107。或者，所述处理器50执行所述计算机程序52时实现上述各装置实施例中各模块/单元的功能，例如图4所示模块401至405的功能。

所述计算机程序52可以被分割成一个或多个模块/单元，所述一个或者多个模块/单元被存储在所述存储器51中，并由所述处理器50执行，以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段，该指令段用于描述所述计算机程序52在所述终端设备5中的执行过程。

所述终端设备5可以是各种类型的手机、桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述终端设备可包括，但不仅限于，处理器50、存储器51。本领域技术人员可以理解，图5仅仅是终端设备5的示例，并不构成对终端设备5的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件，例如所述终端设备5还可以包括输入输出设备、网络接入设备、总线等。

所称处理器50可以是中央处理单元(Central Processing Unit，CPU)，还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

所述存储器51可以是所述终端设备5的内部存储单元，例如终端设备5的硬盘或内存。所述存储器51也可以是所述终端设备5的外部存储设备，例如所述终端设备5上配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)等。进一步地，所述存储器51还可以既包括所述终端设备5的内部存储单元也包括外部存储设备。所述存储器51用于存储所述计算机程序以及所述终端设备所需的其他程序和数据。所述存储器51还可以用于暂时地存储已经输出或者将要输出的数据。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将所述装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中，上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。另外，各功能单元、模块的具体名称也只是为了便于相互区分，并不用于限制本申请的保护范围。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述或记载的部分，可以参见其它实施例的相关描述。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

在本发明所提供的实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的系统实施例仅仅是示意性的，例如，所述模块或单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口，装置或单元的间接耦合或通讯连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明实现上述实施例方法中的全部或部分流程，也可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一计算机可读存储介质中，该计算机程序在被处理器执行时，可实现上述各个方法实施例的步骤。其中，所述计算机程序包括计算机程序代码，所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括：能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，RandomAccess Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是，所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减，例如在某些司法管辖区，根据立法和专利实践，计算机可读介质不包括是电载波信号和电信信号。

以上所述实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围，均应包含在本发明的保护范围之内。

Claims

1.一种PDF文档编辑的字体优化方法，其特征在于，包括：

获取PDF文档的内嵌字体信息；

提取所述内嵌字体信息中的字体名称关键字；

2.如权利要求1所述的PDF文档编辑的字体优化方法，其特征在于，所述提取所述内嵌字体信息中的字体名称关键字包括：

分别提取所述内嵌字体信息中的family字体族名称的关键字和postscript字体名称的关键字；

所述本地字体库中任意一个字体的名称匹配率通过以下步骤确定：

分别提取所述任意一个字体的family字体族名称的关键字和postscript字体名称的关键字；

计算所述任意一个字体的family字体族名称的关键字和所述内嵌字体信息中的family字体族名称的关键字之间的第一匹配率；

计算所述任意一个字体的postscript字体名称的关键字和所述内嵌字体信息中的postscript字体名称的关键字之间的第二匹配率；

根据所述第一匹配率和第二匹配率计算得到所述任意一个字体的名称匹配率，所述名称匹配率与所述第一匹配率、所述第二匹配率均正相关。

3.如权利要求2所述的PDF文档编辑的字体优化方法，其特征在于，所述family字体族名称的关键字通过以下步骤提取：

获取family字体族名称；

若所述family字体族名称中包含加号字符且所述加号字符之前具有6个大写字母，则将所述加号字符和所述6个大写字符从所述family字体族名称中剔除；

若所述family字体族名称中包含加号字符且所述加号字符之后全为大写字母，则将所述加号字符和所述加号字符之后的大写字母从所述family字体族名称中剔除；

根据预设的分隔符将所述family字体族名称划分为多个字符段，将各个所述字符段确定为所述family字体族名称的各个关键字；

所述postscript字体名称的关键字通过以下步骤提取：

获取postscript字体名称；

若所述postscript字体名称中包含加号字符且所述加号字符之前具有6个大写字母，则将所述加号字符和所述6个大写字符从所述postscript字体名称中剔除；

若所述postscript字体名称中包含加号字符且所述加号字符之后全为大写字母，则将所述加号字符和所述加号字符之后的大写字母从所述postscript字体名称中剔除；

根据预设的分隔符将所述postscript字体名称划分为多个字符段，将各个所述字符段确定为所述postscript字体名称的各个关键字。

4.如权利要求2所述的PDF文档编辑的字体优化方法，其特征在于，所述计算所述任意一个字体的family字体族名称的关键字和所述内嵌字体信息中的family字体族名称的关键字之间的第一匹配率包括：

统计所述任意一个字体的family字体族名称的关键字中与所述内嵌字体信息中的family字体族名称的关键字完全相同的关键字的第一数量；

计算所述第一数量与所述任意一个字体的family字体族名称的关键字的数量之间的第一比值；

统计所述任意一个字体的family字体族名称的关键字中与所述内嵌字体信息中的family字体族名称的关键字包含部分相同字符的关键字的第二数量；

计算所述第二数量与所述任意一个字体的family字体族名称的关键字的数量之间的第二比值；

统计所述内嵌字体信息中的family字体族名称的关键字中与所述任意一个字体的family字体族名称的关键字完全相同的关键字的第三数量；

计算所述第三数量与所述内嵌字体信息中的family字体族名称的关键字的数量之间的第三比值；

统计所述内嵌字体信息中的family字体族名称的关键字中与所述任意一个字体的family字体族名称的关键字包含部分相同字符的关键字的第四数量；

计算所述第四数量与所述内嵌字体信息中的family字体族名称的关键字的数量之间的第四比值；

根据所述第一比值、第二比值、第三比值和第四比值计算得到所述第一匹配率，所述第一匹配率与所述第一比值、所述第二比值、所述第三比值、所述第四比值均正相关；

所述计算所述任意一个字体的postscript字体名称的关键字和所述内嵌字体信息中的postscript字体名称的关键字之间的第二匹配率包括：

统计所述任意一个字体的postscript字体名称的关键字中与所述内嵌字体信息中的postscript字体名称的关键字完全相同的关键字的第五数量；

计算所述第五数量与所述任意一个字体的postscript字体名称的关键字的数量之间的第五比值；

统计所述任意一个字体的postscript字体名称的关键字中与所述内嵌字体信息中的postscript字体名称的关键字包含部分相同字符的关键字的第六数量；

计算所述第六数量与所述任意一个字体的postscript字体名称的关键字的数量之间的第六比值；

统计所述内嵌字体信息中的postscript字体名称的关键字中与所述任意一个字体的postscript字体名称的关键字完全相同的关键字的第七数量；

计算所述第七数量与所述内嵌字体信息中的postscript字体名称的关键字的数量之间的第七比值；

统计所述内嵌字体信息中的postscript字体名称的关键字中与所述任意一个字体的postscript字体名称的关键字包含部分相同字符的关键字的第八数量；

计算所述第八数量与所述内嵌字体信息中的postscript字体名称的关键字的数量之间的第八比值；

根据所述第五比值、第六比值、第七比值和第八比值计算得到所述第二匹配率，所述第二匹配率与所述第五比值、所述第六比值、所述第七比值、所述第八比值均正相关。

5.如权利要求2所述的PDF文档编辑的字体优化方法，其特征在于，还包括：

若所述内嵌字体信息中的family字体族名称为空，则提取所述内嵌字体信息中的basefont字体名称的关键字替代所述内嵌字体信息中的family字体族名称的关键字；

若所述内嵌字体信息中的postscript字体名称为空，则提取所述内嵌字体信息中的basefont字体名称的关键字替代所述内嵌字体信息中的postscript字体名称的关键字。

6.如权利要求1至5中任一项所述的PDF文档编辑的字体优化方法，其特征在于，所述根据所述内嵌字体信息中的style字体样式对当前编辑的文本进行文本修饰处理包括：

若所述内嵌字体信息中的style字体样式名称中包含对应于文本加粗的特定字符，则修改当前编辑的文本的Text Mode属性，使得所述当前编辑的文本加粗；

若所述内嵌字体信息中的style字体样式名称中包含对应于文本倾斜的特定字符，则修改当前编辑的文本的文本矩阵，使得所述当前编辑的文本具有与所述内嵌字体信息中的style字体样式对应的倾斜度。

7.一种PDF文档编辑的字体优化装置，其特征在于，包括：

内嵌字体获取模块，用于获取PDF文档的内嵌字体信息；

8.如权利要求7所述的PDF文档编辑的字体优化装置，其特征在于，所述关键字提取模块包括：

所述关键字匹配模块包括：

9.一种终端设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至6中任一项所述的PDF文档编辑的字体优化方法的步骤。

10.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述的PDF文档编辑的字体优化方法的步骤。