CN112800727A

CN112800727A - 给pdf文件加批注的方法及应用系统

Info

Publication number: CN112800727A
Application number: CN202110397483.3A
Authority: CN
Inventors: 金震; 李明; 徐伟; 郭智坚
Original assignee: Beijing SunwayWorld Science and Technology Co Ltd
Current assignee: Beijing SunwayWorld Science and Technology Co Ltd
Priority date: 2021-04-14
Filing date: 2021-04-14
Publication date: 2021-05-14
Anticipated expiration: 2041-04-14
Also published as: CN112800727B

Abstract

提供了一种给PDF文件加批注的方法及应用系统，应用系统包括基于tabula二次开发的PDF文件识别模块、文件转换模块、光标跟踪定位模块、批注模块和保存模块；方法包括以PDF文件识别模块用于在线打开PDF文件进行预览；以文件转换模块用于将PDF文件的每页转化为一张图片；以光标跟踪定位模块用于在线预览图片时，通过鼠标在图片中框选目标区域，记录框选目标区域范围；以批注模块用于弹出批注输入框，在批注输入框内录入批注意见；以保存模块用于保存框选目标区域的坐标及对应批注意见。本发明基于tabula开源技术，将PDF文档每页转化为一个图片，然后实现在线预览这些图片，支持鼠标框选区域，录入批注意见，同时支持框选文档的多处加批注。

Description

给PDF文件加批注的方法及应用系统

技术领域

本发明涉及PDF文件处理和文档在线审核技术领域，特别涉及一种给PDF文件加批注的方法及应用系统。

背景技术

为了防止文档在流转过程中内容被篡改，通常会将文档转化为PDF格式的文档，使得他人无法对文档进行随意编辑，还可以避免对文档内容的误操作。但是，在查看审阅PDF文档过程中，如果对PDF文档中的内容有调整意见，往往只能采用另建文件或者通过邮件等方式提出。

目前，若要类似给Word加批注意见那样，针对某处文档内容加批注，并批注意见可以保存下来，在流转过程中让其他人都可以查看批注且可以调整批注内容，这是无法实现的。即对PDF文档在线审核不能对PDF文档加批注意见，更无法将批注意见保存下来并在文档审核环节时候供其他人查看批注意见。

发明内容

为了解决上述技术问题，本发明提供了一种给PDF文件加批注的方法，包括以下步骤：

S100基于tabula二次开发，在线打开PDF文件进行预览，将PDF文件的每页转化为一张图片；

S200在线预览图片，通过鼠标在图片中框选目标区域，记录框选目标区域范围并弹出批注输入框，在批注输入框内录入批注意见；

S300保存框选目标区域的坐标及对应批注意见。

可选的，在线打开已批注过的PDF文件，加载框选目标区域及对应批注意见；以鼠标点击存在批注意见的框选目标区域，显示出对应目标区域的批注意见，对批注意见进行编辑并保存。

可选的，在S100步骤中，将PDF文件的每页转化为一张图片的过程如下：

用机器视觉技术对PDF文件进行页面分析，设置页面标签，根据页面标签将每页转化为图片；

针对每一张图片，建立坐标系，将图片分割为多个图像碎片，标记各图像碎片的位置坐标；

将图像碎片组成一个样本序列，并进行以下处理：

首先，采用以下公式进行离散小波变换：

上式中，

表示样本序列的离散小波变换；

表示尺度；

表示变换函数；

表示尺度函数；

表示初始尺度因子；

表示小波基函数；

表示尺度因子；

表示平移因子；

然后，获取图像碎片的碎片特征，采用以下公式计算图像碎片的似然能量：

上式中，表示；

表示成像平面坐标集合，

；

表示样品序列的帧数；

表示高斯因子；

表示时间；

表示时刻；

表示尺度；

和

表示

时刻样品帧的特征点

在成像平面的投影；

表示

时刻样品帧的特征点

在成像平面的投影；

采用惩罚函数方法，通过以下公式得到的势能：

上式中，

表示第

帧样品的特征点

的势能；

表示特征点

的尺度函数；

和

表示第

帧样品的两个相邻特征点；

表示势能阈值，取值大于零；

将处理后的图像碎片按照标记的位置坐标进行拼接，恢复图片。

可选的，在S200步骤中，通过鼠标在图片中框选目标区域的方式如下：

识别图片中框选目标区域的文字与标点符号，确定并关联文字和标点符号与其所在框选目标区域的位置，使用深度卷积神经网络进行深度特征学习，对文字进行语义分析；

根据语义分析，结合标点符号的位置，确定文字分割点，采用预设算法分别计算第一个文字分割点之前文字和最后一个文字分割点之后文字的语义与整体语义的相似度，若第一个文字分割点之前文字的相似度小于预设阈值，则将第一个文字分割点之前文字对应位置从框选目标区域中剔除；若最后一个文字分割点之后文字的相似度小于预设阈值，则将最后一个文字分割点之后文字对应位置从框选目标区中剔除。

可选的，所述预设算法如下：

上式中，

表示语义的相似度；

表示整体语义元素的数量；

表示第一个文字分割点之前文字或者最后一个文字分割点之后文字的语义元素数量；

表示第

个语义在第一个文字分割点之前文字或者最后一个文字分割点之后文字出现的次数；

表示第

个语义的整体出现的次数。

本发明还提供了一种给PDF文件加批注的应用系统，包括基于tabula二次开发的PDF文件识别模块、文件转换模块、光标跟踪定位模块、批注模块和保存模块；

所述PDF文件识别模块用于在线打开PDF文件进行预览；

所述文件转换模块用于将PDF文件的每页转化为一张图片；

所述光标跟踪定位模块用于在线预览图片时，通过鼠标在图片中框选目标区域，记录框选目标区域范围；

所述批注模块用于弹出批注输入框，在批注输入框内录入批注意见；

所述保存模块用于保存框选目标区域的坐标及对应批注意见。

可选的，还包括批注修改模块，用于在线打开的已批注过的PDF文件，就加载框选目标区域及对应批注意见；以鼠标点击存在批注意见的框选目标区域，显示出对应目标区域的批注意见，对批注意见进行编辑；然后由保存模块保存编辑后的框选目标区域的坐标及对应批注意见。

可选的，所述文件转换模块内置机器视觉子模块、页面标签子模块、图片分割子模块、图片处理子模块和拼接子模块；

所述文件转换模块将PDF文件的每页转化为一张图片的过程如下：

采用机器视觉子模块对PDF文件进行页面分析；

采用页面标签子模块对机器视觉子模块进行页面分析后的PDF文件设置页面标签；

所述文件转换模块根据页面标签将每页转化为图片；

所述图片分割子模块用于对每一张图片，建立坐标系，将图片分割为多个图像碎片，标记各图像碎片的位置坐标；

所述图片处理子模块用于将图像碎片组成一个样本序列，并进行以下处理：

首先，采用以下公式进行离散小波变换：

上式中，

表示样本序列的离散小波变换；

表示尺度；

表示变换函数；

表示尺度函数；

表示初始尺度因子；

表示小波基函数；

表示尺度因子；

表示平移因子；

上式中，表示；

表示成像平面坐标集合，

；

表示样品序列的帧数；

表示高斯因子；

表示时间；

表示时刻；

表示尺度；

和

表示

时刻样品帧的特征点

在成像平面的投影；

表示

时刻样品帧的特征点

在成像平面的投影；

采用惩罚函数方法，通过以下公式得到的势能：

上式中，

表示第

帧样品的特征点

的势能；

表示特征点

的尺度函数；

和

表示第

帧样品的两个相邻特征点；

表示势能阈值，取值大于零；

所述拼接子模块用于将处理后的图像碎片按照标记的位置坐标进行拼接，恢复图片。

可选的，所述光标跟踪定位模块内设语义分析子模块和运算子模块；

所述语义分析子模块用于：识别图片中框选目标区域的文字与标点符号，确定并关联文字和标点符号与其所在框选目标区域的位置，使用深度卷积神经网络进行深度特征学习，对文字进行语义分析；根据语义分析，结合标点符号的位置，确定文字分割点；

所述运算子模块内置预设算法，用于分别计算第一个文字分割点之前文字和最后一个文字分割点之后文字的语义与整体语义的相似度，并与预设阈值进行对比；

所述光标跟踪定位模块根据运算子模块的计算结果，若第一个文字分割点之前文字的相似度小于预设阈值，则将第一个文字分割点之前文字对应位置从框选目标区域中剔除；若最后一个文字分割点之后文字的相似度小于预设阈值，则将最后一个文字分割点之后文字对应位置从框选目标区中剔除。

可选的，所述运算子模块内置的预设算法如下：

上式中，

表示语义的相似度；

表示整体语义元素的数量；

表示第

表示第

个语义的整体出现的次数。

本发明基于tabula开源技术，将PDF文档每页转化为一个图片，然后实现在线预览这些图片，支持鼠标框选区域，然后弹出批注输入框，支持录入批注意见，同时支持框选文档的多处加批注，鼠标点击框选区域时候，批注意见切换显示对应区域的批注，可以再次编辑批注，可以将框选区域坐标及对应批注保存下来。这样审核PDF文档的人，再次打开PDF文档的时候，系统加载框选区域及对应批注意见信息，在文档中框选之前框选的区域，当鼠标点击框选区域的时候，批注区域可以显示批注意见。

本发明的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

下面通过附图和实施例，对本发明的技术方案做进一步的详细描述。

附图说明

附图用来提供对本发明的进一步理解，并且构成说明书的一部分，与本发明的实施例一起用于解释本发明，并不构成对本发明的限制。在附图中：

图1为本发明实施例中一种给PDF文件加批注的方法流程图；

图2为本发明的给PDF文件加批注的应用系统实施例示意图；

图3为采用本发明对某PDF文件进行加批注的操作实施例流程图。

具体实施方式

以下结合附图对本发明的优选实施例进行说明，应当理解，此处所描述的优选实施例仅用于说明和解释本发明，并不用于限定本发明。

如图1所示，本发明实施例提供了一种给PDF文件加批注的方法，包括以下步骤：

S300保存框选目标区域的坐标及对应批注意见。

上述技术方案的工作原理和有益效果为：本方案基于tabula开源技术，对PDF格式的文档进行在线预览审核，可通过鼠标框选区域，弹出批注输入窗口，输入批注，可反复框选不同内容区域输入批注，点击任意框选的区域，批注窗口切换显示对应区域的批注，同时支持框选文档的多处加批注，可以将框选区域坐标及对应批注保存下来，实现在PDF文件中以类似WORD文件的编辑方式进行批注，且不会损害PDF文件的稳定性，方便的文件的审批及审批修改意见的快速阅读。

在一个实施例中，在线打开已批注过的PDF文件，加载框选目标区域及对应批注意见；以鼠标点击存在批注意见的框选目标区域，显示出对应目标区域的批注意见，对批注意见进行编辑并保存。

上述技术方案的工作原理和有益效果为：本方案可以让流程审核人能够查看对文档加的批注意见，可以点击不同的框选区域查看对应批注内容，可以再次编辑修改批注，也可以框选其他区域增加批注，可以将框选区域坐标及对应批注保存下来，提高的批注的灵活性和实用性。

在一个实施例中，在S100步骤中，将PDF文件的每页转化为一张图片的过程如下：

将图像碎片组成一个样本序列，并进行以下处理：

首先，采用以下公式进行离散小波变换：

上式中，

表示样本序列的离散小波变换；

表示尺度；

表示变换函数；

表示尺度函数；

表示初始尺度因子；

表示小波基函数；

表示尺度因子；

表示平移因子；

上式中，表示；

表示成像平面坐标集合，

；

表示样品序列的帧数；

表示高斯因子；

表示时间；

表示时刻；

表示尺度；

和

表示

时刻样品帧的特征点

在成像平面的投影；

表示

时刻样品帧的特征点

在成像平面的投影；

采用惩罚函数方法，通过以下公式得到的势能：

上式中，

表示第

帧样品的特征点

的势能；

表示特征点

的尺度函数；

和

表示第

帧样品的两个相邻特征点；

表示势能阈值，取值大于零；

上述技术方案的工作原理和有益效果为：本方案对图片进行分割，通过离散小波变换，过滤干扰因素，提高图片质量，消除可能存在的线条重影；依据像素基团能量的原理对图像进行增强处理，势能计算反映了相邻特征点的模糊变化参数的关联程度，以该关联度可增强图像碎片的清晰度，将经过上述处理的图像碎片拼接恢复，可以得到高质量的图片，提高使用与阅读的舒适性。

在一个实施例中，在S200步骤中，通过鼠标在图片中框选目标区域的方式如下：

根据语义分析，结合标点符号的位置，确定文字分割点，采用预设算法分别计算第一个文字分割点之前文字和最后一个文字分割点之后文字的语义与整体语义的相似度，若第一个文字分割点之前文字的相似度小于预设阈值，则将第一个文字分割点之前文字对应位置从框选目标区域中剔除；若最后一个文字分割点之后文字的相似度小于预设阈值，则将最后一个文字分割点之后文字对应位置从框选目标区中剔除；

所述预设算法如下：

上式中，

表示语义的相似度；

表示整体语义元素的数量；

表示第

表示第

个语义的整体出现的次数。

上述技术方案的工作原理和有益效果为：本方案通过对图片中框选目标区域进行图片识别和语义分析，找到可用的文字分割点，该文字分割点可能为1个，也可能存在多个，基于语义分析对文字分割点的首部和尾部进行语义判断，智能地精准确定操作人员的选定内容，排除干扰部分，初始鼠标框选目标区域为一个方形，经本方案处理后，选定区域可能在首部和尾部出现阶梯缺口，提高批注位置的准确度。

如图2所示，本发明实施例提供了一种给PDF文件加批注的应用系统，包括基于tabula二次开发的PDF文件识别模块10、文件转换模块20、光标跟踪定位模块30、批注模块40和保存模块50；

所述PDF文件识别模块10用于在线打开PDF文件进行预览；

所述文件转换模块20用于将PDF文件的每页转化为一张图片；

所述光标跟踪定位模块30用于在线预览图片时，通过鼠标在图片中框选目标区域，记录框选目标区域范围；

所述批注模块40用于弹出批注输入框，在批注输入框内录入批注意见；

所述保存模块50用于保存框选目标区域的坐标及对应批注意见。

上述技术方案的工作原理和有益效果为：本方案基于tabula开源技术，开发PDF文件识别模块、文件转换模块、光标跟踪定位模块、批注模块和保存模块，对PDF格式的文档进行在线预览审核，可通过鼠标框选区域，弹出批注输入窗口，输入批注，可反复框选不同内容区域输入批注，点击任意框选的区域，批注窗口切换显示对应区域的批注，同时支持框选文档的多处加批注，可以将框选区域坐标及对应批注保存下来，实现在PDF文件中以类似WORD文件的编辑方式进行批注，且不会损害PDF文件的稳定性，方便的文件的审批及审批修改意见的快速阅读。

在一个实施例中，还包括批注修改模块，用于在线打开的已批注过的PDF文件，就加载框选目标区域及对应批注意见；以鼠标点击存在批注意见的框选目标区域，显示出对应目标区域的批注意见，对批注意见进行编辑；然后由保存模块保存编辑后的框选目标区域的坐标及对应批注意见。

上述技术方案的工作原理和有益效果为：本方案通过设置批注修改模块，可以让流程审核人能够查看对文档加的批注意见，可以点击不同的框选区域查看对应批注内容，可以再次编辑修改批注，也可以框选其他区域增加批注，可以将框选区域坐标及对应批注保存下来，提高的批注的灵活性和实用性。

在一个实施例中，所述文件转换模块内置机器视觉子模块、页面标签子模块、图片分割子模块、图片处理子模块和拼接子模块；

采用机器视觉子模块对PDF文件进行页面分析；

所述文件转换模块根据页面标签将每页转化为图片；

首先，采用以下公式进行离散小波变换：

上式中，

表示样本序列的离散小波变换；

表示尺度；

表示变换函数；

表示尺度函数；

表示初始尺度因子；

表示小波基函数；

表示尺度因子；

表示平移因子；

上式中，表示；

表示成像平面坐标集合，

；

表示样品序列的帧数；

表示高斯因子；

表示时间；

表示时刻；

表示尺度；

和

表示

时刻样品帧的特征点

在成像平面的投影；

表示

时刻样品帧的特征点

在成像平面的投影；

采用惩罚函数方法，通过以下公式得到的势能：

上式中，

表示第

帧样品的特征点

的势能；

表示特征点

的尺度函数；

和

表示第

帧样品的两个相邻特征点；

表示势能阈值，取值大于零；

上述技术方案的工作原理和有益效果为：本方案通过在文件转换模块内设置机器视觉子模块、页面标签子模块、图片分割子模块、图片处理子模块和拼接子模块，对图片进行分割，通过离散小波变换，过滤干扰因素，提高图片质量，消除可能存在的线条重影；依据像素基团能量的原理对图像进行增强处理，势能计算反映了相邻特征点的模糊变化参数的关联程度，以该关联度可增强图像碎片的清晰度，将经过上述处理的图像碎片拼接恢复，可以得到高质量的图片，提高使用与阅读的舒适性。

在一个实施例中，所述光标跟踪定位模块内设语义分析子模块和运算子模块；

所述光标跟踪定位模块根据运算子模块的计算结果，若第一个文字分割点之前文字的相似度小于预设阈值，则将第一个文字分割点之前文字对应位置从框选目标区域中剔除；若最后一个文字分割点之后文字的相似度小于预设阈值，则将最后一个文字分割点之后文字对应位置从框选目标区中剔除；

所述运算子模块内置的预设算法如下：

上式中，

表示语义的相似度；

表示整体语义元素的数量；

表示第

表示第

个语义的整体出现的次数。

上述技术方案的工作原理和有益效果为：本方案通过在光标跟踪定位模块内设语义分析子模块和运算子模块，对图片中框选目标区域进行图片识别和语义分析，找到可用的文字分割点，该文字分割点可能为1个，也可能存在多个，基于语义分析对文字分割点的首部和尾部进行语义判断，智能地精准确定操作人员的选定内容，排除干扰部分，初始鼠标框选目标区域为一个方形，经本方案处理后，选定区域可能在首部和尾部出现阶梯缺口，提高批注位置的准确度。

下面以某PDF文件加批注的操作实施例对本发明做进一步的说明，如图3所示，具体操作流程如下：

首先，基于tabula二次开发，在线打开一个待审批的PDF格式文件，看看该文件是否曾转化过图片，若没有则将该PDF文件每一页转化为一个图片，然后通过鼠标框选目标区域，弹出批注输入框，输入批注意见，支持反复框选目标区域和填写批注意见；若曾转化过图片，则加载图片，看图片内是否存在批注意见，若没有批注意见，可以通过鼠标框选目标区域，弹出批注输入框，根据需要输入批注意见；若存在批注意见，加载框选目标区域及对应批注意见，当鼠标点击框选目标区域的时候，批注输入框切换显示对应目标区域的批注意见，可进行编辑修改；最后对框选目标区域的坐标及对应添加或者修改的批注意见进行保存。

本发明基于tabula开源技术，对PDF格式的文档进行在线预览审核，可通过鼠标框选区域，弹出批注输入窗口，输入批注，可反复框选不同内容区域输入批注，点击任意框选的区域，批注窗口切换显示对应区域的批注，可以再次编辑批注，可以将框选区域坐标及对应批注保存下来。流程审核人能够查看对文档加的批注意见，可以点击不同的框选区域查看对应批注内容，可以再次编辑批注，也可以框选其他区域增加批注，可以将框选区域坐标及对应批注保存下来。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种给PDF文件加批注的方法，其特征在于，包括以下步骤：

S300保存框选目标区域的坐标及对应批注意见。

2.根据权利要求1所述的给PDF文件加批注的方法，其特征在于，在线打开已批注过的PDF文件，加载框选目标区域及对应批注意见；以鼠标点击存在批注意见的框选目标区域，显示出对应目标区域的批注意见，对批注意见进行编辑并保存。

3.根据权利要求1所述的给PDF文件加批注的方法，其特征在于，在S100步骤中，将PDF文件的每页转化为一张图片的过程如下：

将图像碎片组成一个样本序列，并进行以下处理：

首先，采用以下公式进行离散小波变换：

上式中，

表示样本序列的离散小波变换；

表示尺度；

表示变换函数；

表示尺度函数；

表示初始尺度因子；

表示小波基函数；

表示尺度因子；

表示平移因子；

上式中，表示；

表示成像平面坐标集合，

；

表示样品序列的帧数；

表示高斯因子；

表示时间；

表示时刻；

和

表示

时刻样品帧的特征点

在成像平面的投影；

表示

时刻样品帧的特征点

在成像平面的投影；

采用惩罚函数方法，通过以下公式得到的势能：

上式中，

表示第

帧样品的特征点

的势能；

表示特征点

的尺度函数；

和

表示第

帧样品的两个相邻特征点；

表示势能阈值，取值大于零；

4.根据权利要求1所述的给PDF文件加批注的方法，其特征在于，在S200步骤中，通过鼠标在图片中框选目标区域的方式如下：

5.根据权利要求4所述的给PDF文件加批注的方法，其特征在于，所述预设算法如下：

上式中，

表示语义的相似度；

表示整体语义元素的数量；

表示第

表示第

个语义的整体出现的次数。

6.一种给PDF文件加批注的应用系统，其特征在于，包括基于tabula二次开发的PDF文件识别模块、文件转换模块、光标跟踪定位模块、批注模块和保存模块；

所述PDF文件识别模块用于在线打开PDF文件进行预览；

所述文件转换模块用于将PDF文件的每页转化为一张图片；

7.根据权利要求6所述的给PDF文件加批注的应用系统，其特征在于，还包括批注修改模块，用于在线打开的已批注过的PDF文件，就加载框选目标区域及对应批注意见；以鼠标点击存在批注意见的框选目标区域，显示出对应目标区域的批注意见，对批注意见进行编辑；然后由保存模块保存编辑后的框选目标区域的坐标及对应批注意见。

8.根据权利要求6所述的给PDF文件加批注的应用系统，其特征在于，所述文件转换模块内置机器视觉子模块、页面标签子模块、图片分割子模块、图片处理子模块和拼接子模块；

采用机器视觉子模块对PDF文件进行页面分析；

所述文件转换模块根据页面标签将每页转化为图片；

首先，采用以下公式进行离散小波变换：