CN110929481B

CN110929481B - 一种文档编辑的方法、装置、计算机存储介质及终端

Info

Publication number: CN110929481B
Application number: CN201811095012.1A
Authority: CN
Inventors: 邓斌
Original assignee: Beijing Kingsoft Office Software Inc; Zhuhai Kingsoft Office Software Co Ltd; Guangzhou Kingsoft Mobile Technology Co Ltd
Current assignee: Beijing Kingsoft Office Software Inc; Zhuhai Kingsoft Office Software Co Ltd; Guangzhou Kingsoft Mobile Technology Co Ltd
Filing date: 2018-09-19
Publication date: 2024-06-11
Anticipated expiration: 2038-09-19

Abstract

一种文档编辑的方法、装置、计算机存储介质及终端，包括：对预设页数的便携式文档格式(PDF)文档，将每一页PDF文档分别转换为相应的样本图片；对转换获得的各样本图片，标注样本图片中包含的每一张图像的位置；以完成图像位置标注的样本图片作为训练数据，训练神经网络模型；将需要编辑的PDF文档转换为待处理图片后，通过训练完成的神经网络模型确定待处理图片中包含的图像的位置；通过确定的待处理图片中包含的图像的位置，进行PDF文档编辑。本发明实施例通过神经网络模型实现了扫描的PDF文件中的图像的自动获取，提升了文档编辑效率。

Description

一种文档编辑的方法、装置、计算机存储介质及终端

技术领域

本文涉及但不限于信息编辑技术，尤指一种文档编辑的方法、装置、计算机存储介质及终端。

背景技术

便携式文档格式(PDF，Portable Document Format)文件作为小说、试题、杂志、漫画、报告等信息记录的载体，被相关工作人员广泛应用；工作人员一般将WORD或通过其他办公软件编辑的文件打印为PDF文件，或者，将打印好的纸质文件扫描为PDF文件。

当PDF文件为扫描纸质文件获得的文件时，用户将无法对PDF中包含为信息进行编辑；当扫描件中包含图像时，用户需要借助绘图软件或截屏软件对PDF文件中的图像进行截取后，复制到可编辑的文本中，影响用户的文档编辑效率。

发明内容

以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。

本发明实施例提供一种文档编辑的方法、装置、计算机存储介质及终端，能够提升文档编辑效率。

本发明实施例提供了一种文档编辑的方法，包括：

对预设页数的便携式文档格式PDF文档，将每一页PDF文档分别转换为相应的样本图片；

对转换获得的各样本图片，标注样本图片中包含的每一张图像的位置；

以完成图像位置标注的样本图片作为训练数据，训练神经网络模型；

将需要编辑的PDF文档转换为待处理图片后，通过训练完成的神经网络模型确定待处理图片中包含的图像的位置；

通过确定的待处理图片中包含的图像的位置，进行PDF文档编辑。

可选的，所述标注样本图片中包含的每一张图像的位置包括：

以像素作为标注单位，对每一张图像的以下部分或全部信息进行标注：

横向起始位置、横向终止位置、纵向起始位置和纵向终止位置。

可选的，所述神经网络模型包括：

张量流Tensor Flow模型。

可选的，所述进行PDF文档编辑包括：

根据确定的待处理图片中包含的图像的位置，裁剪所述待处理图片中的图像；

将裁剪到的图像，根据待处理图片中包含的图像的位置迁移至预先创建的PDF文档中。

另一方面，本发明实施例还提供一种文档编辑的装置，包括：转换单元、标记单元、训练单元、确定单元和处理单元；其中，

转换单元用于：对预设页数的便携式文档格式PDF文档，将每一页PDF文档分别转换为相应的样本图片；

标记单元用于：对转换获得的各样本图片，标注样本图片中包含的每一张图像的位置；

训练单元用于：以完成图像位置标注的样本图片作为训练数据，训练神经网络模型；

确定单元用于：将需要编辑的PDF文档转换为待处理图片后，通过训练完成的神经网络模型确定待处理图片中包含的图像的位置；

处理单元用于：通过确定的待处理图片中包含的图像的位置，进行PDF文档编辑。

可选的，所述标注单元具体用于：

对转换获得的各样本图片，以像素作为标注单位，对每一张图像的以下部分或全部信息进行标注：

可选的，所述神经网络模型包括：

张量流Tensor Flow模型。

可选的，所述处理单元具体用于：

再一方面，本发明实施例还提供一种计算机存储介质，所述计算机存储介质中存储有计算机可执行指令，所述计算机可执行指令用于执行上述文档编辑的方法。

还一方面，本发明实施例还提供一种终端，包括：存储器和处理器；其中，

处理器被配置为执行存储器中的程序指令；

程序指令在处理器读取执行以下操作：

与相关技术相比，本申请技术方案包括：对预设页数的便携式文档格式PDF文档，将每一页PDF文档分别转换为相应的样本图片；对转换获得的各样本图片，标注样本图片中包含的每一张图像的位置；以完成图像位置标注的样本图片作为训练数据，训练神经网络模型；将需要编辑的PDF文档转换为待处理图片后，通过训练完成的神经网络模型确定待处理图片中包含的图像的位置；通过确定的待处理图片中包含的图像的位置，进行PDF文档编辑。本发明实施例通过神经网络模型实现了扫描的PDF文件中的图像的自动获取，提升了文档编辑效率。

本发明的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。

附图说明

附图用来提供对本发明技术方案的进一步理解，并且构成说明书的一部分，与本申请的实施例一起用于解释本发明的技术方案，并不构成对本发明技术方案的限制。

图1为本发明实施例文档编辑的方法的流程图；

图2为本发明实施例文档编辑的装置的结构框图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白，下文中将结合附图对本发明的实施例进行详细说明。需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互任意组合。

在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行。并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

图1为本发明实施例文档编辑的方法的流程图，如图1所示，包括：

步骤101、对预设页数的便携式文档格式PDF文档，将每一页PDF文档分别转换为相应的样本图片；

需要说明的是，本发明实施例样本图片可以是由本领域技术人员根据各种格式图片优缺点分析确定的适用于本发明实施例的任意格式的图片。

步骤102、对转换获得的各样本图片，标注样本图片中包含的每一张图像的位置；

需要说明的是，本发明实施例标注图像位置的方法可以包括相关技术中已有的标注方法，在此不做赘述。

可选的，本发明实施例标注样本图片中包含的每一张图像的位置包括：

需要说明的是，本发明实施例对图像位置进行标注包括：横向起始位置、横向终止位置、纵向起始位置和纵向终止位置确定图像所在的矩形区域，通过矩形区域确定图像位置；对于不规则图像，以图像最左端位置作为横向起始位置、最右端位置作为横向终止位置，图像最上端位置作为纵向起始位置、图像最小端位置作为纵向终止位置。

步骤103、以完成图像位置标注的样本图片作为训练数据，训练神经网络模型；

需要说明的是，本发明实施例根据训练数据进行神经网络模型训练的方法可以包括相关技术中已有的训练方法。

可选的，本发明实施例神经网络模型包括：

张量流Tensor Flow模型。

需要说明的是，Tensor Flow模型只是本发明实施例神经网络模型的一个可选实施例，其他可以适用于本发明实施例的神经网络模型均可以应用于本申请。

步骤104、将需要编辑的PDF文档转换为待处理图片后，通过训练完成的神经网络模型确定待处理图片中包含的图像的位置；

需要说明的是，本发明实施例通过训练完成的神经网络模型确定待处理图片中包含的图像的位置包括：对转换获得的待处理图片，通过训练完成的神经网络模型逐页确定每一页待处理图片中包含的图像的位置。

步骤105、通过确定的待处理图片中包含的图像的位置，进行PDF文档编辑；

需要说明的是，本发明实施例预设页数的PDF文档和所述需要编辑的PDF文档包括：以扫描方式获得的PDF文档。

可选的，本发明实施例进行PDF文档编辑包括：

需要说明的是，本发明实施例识别图像后，将裁剪获得的图像，根据确定的待处理图片中包含的图像的位置，借用相关技术中已有的编辑方式写入到新建的PDF文档中，即在保留扫描的PDF文件的排版的情况下，实现PDF文件的编辑。

与相关技术相比，本申请技术方案包括：对预设页数的便携式文档格式(PDF)文档，将每一页PDF文档分别转换为相应的样本图片；对转换获得的各样本图片，标注样本图片中包含的每一张图像的位置；以完成图像位置标注的样本图片作为训练数据，训练神经网络模型；将需要编辑的PDF文档转换为待处理图片后，通过训练完成的神经网络模型确定待处理图片中包含的图像的位置；通过确定的待处理图片中包含的图像的位置，进行PDF文档编辑。本发明实施例通过神经网络模型实现了扫描的PDF文件中的图像的自动获取，提升了文档编辑效率。

图2为本发明实施例文档编辑的装置的结构框图，如图2所示，包括：转换单元、标记单元、训练单元、确定单元和处理单元；其中，

处理单元用于：通过确定的待处理图片中包含的图像的位置，进行PDF文档编辑；

其中，所述预设页数的PDF文档和所述需要编辑的PDF文档包括：以扫描方式获得的PDF文档。

可选的，本发明实施例标注单元具体用于：

可选的，所述神经网络模型包括：

张量流Tensor Flow模型。

可选的，所述处理单元具体用于：

本发明实施例还提供一种计算机存储介质，所述计算机存储介质中存储有计算机可执行指令，所述计算机可执行指令用于执行上述文档编辑的方法。

本发明实施例还提供一种终端，包括：存储器和处理器；其中，

处理器被配置为执行存储器中的程序指令；

程序指令在处理器读取执行以下操作：

本领域普通技术人员可以理解上述方法中的全部或部分步骤可通过程序来指令相关硬件(例如处理器)完成，所述程序可以存储于计算机可读存储介质中，如只读存储器、磁盘或光盘等。可选地，上述实施例的全部或部分步骤也可以使用一个或多个集成电路来实现。相应地，上述实施例中的每个模块/单元可以采用硬件的形式实现，例如通过集成电路来实现其相应功能，也可以采用软件功能模块的形式实现，例如通过处理器执行存储于存储器中的程序/指令来实现其相应功能。本发明不限制于任何特定形式的硬件和软件的结合。

虽然本发明所揭露的实施方式如上，但所述的内容仅为便于理解本发明而采用的实施方式，并非用以限定本发明。任何本发明所属领域内的技术人员，在不脱离本发明所揭露的精神和范围的前提下，可以在实施的形式及细节上进行任何的修改与变化，但本发明的专利保护范围，仍须以所附的权利要求书所界定的范围为准。

Claims

1.一种以扫描方式获得的PDF文档编辑的方法，其特征在于，包括：

通过确定的待处理图片中包含的图像的位置，进行PDF文档编辑；

其中，所述通过确定的待处理图片中包含的图像的位置，进行PDF文档编辑包括：

将裁剪到的图像，根据待处理图片中包含的图像的位置迁移至预先创建的新PDF文档中，所述预先创建的新PDF文档保留文档编辑前的PDF文档的排版；

所述PDF文档为通过扫描获得且用户无法直接对所述PDF文档中包含的信息进行编辑的文件；

所述标注样本图片中包含的每一张图像的位置包括：

横向起始位置、横向终止位置、纵向起始位置和纵向终止位置；

当图像为不规则图像时，以图像最左端位置作为横向起始位置、最右端位置作为横向终止位置，图像最上端位置作为纵向起始位置、图像最下端位置作为纵向终止位置；

所述将需要编辑的PDF文档转换为待处理图片后，通过训练完成的神经网络模型确定待处理图片中包含的图像的位置包括：对转换获得的待处理图片，通过训练完成的神经网络模型逐页确定每一页待处理图片中包含的图像的位置。

2.根据权利要求1所述的方法，其特征在于，所述神经网络模型包括：

张量流Tensor Flow模型。

3.一种以扫描方式获得的PDF文档编辑的装置，其特征在于，包括：转换单元、标记单元、训练单元、确定单元和处理单元；其中，

所述处理单元具体用于：

所述标记单元具体用于：

4.根据权利要求3所述的装置，其特征在于，所述神经网络模型包括：

张量流Tensor Flow模型。

5.一种计算机存储介质，所述计算机存储介质中存储有计算机可执行指令，所述计算机可执行指令用于执行权利要求1~2中任一项所述的文档编辑的方法。

6.一种用于PDF文档编辑的终端，包括：存储器和处理器；其中，

处理器被配置为执行存储器中的程序指令；

程序指令在处理器读取执行以下操作：

对预设页数的便携式文档格式PDF文档，将每一页PDF文档分别转换为相应的样本图片，所述PDF文档以扫描方式获得；

所述通过确定的待处理图片中包含的图像的位置，进行PDF文档编辑包括：

所述标注样本图片中包含的每一张图像的位置包括：