CN112800727A - 给pdf文件加批注的方法及应用系统 - Google Patents
给pdf文件加批注的方法及应用系统 Download PDFInfo
- Publication number
- CN112800727A CN112800727A CN202110397483.3A CN202110397483A CN112800727A CN 112800727 A CN112800727 A CN 112800727A CN 202110397483 A CN202110397483 A CN 202110397483A CN 112800727 A CN112800727 A CN 112800727A
- Authority
- CN
- China
- Prior art keywords
- module
- representing
- picture
- target area
- annotation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 29
- 238000006243 chemical reaction Methods 0.000 claims abstract description 21
- 238000011161 development Methods 0.000 claims abstract description 8
- 238000005516 engineering process Methods 0.000 claims abstract description 8
- 230000011218 segmentation Effects 0.000 claims description 78
- 239000012634 fragment Substances 0.000 claims description 46
- 238000004458 analytical method Methods 0.000 claims description 32
- 230000006870 function Effects 0.000 claims description 30
- 238000009432 framing Methods 0.000 claims description 24
- 238000005381 potential energy Methods 0.000 claims description 20
- 125000004432 carbon atom Chemical group C* 0.000 claims description 18
- 238000003384 imaging method Methods 0.000 claims description 18
- 238000012545 processing Methods 0.000 claims description 13
- 238000004422 calculation algorithm Methods 0.000 claims description 12
- 230000002123 temporal effect Effects 0.000 claims description 12
- 230000008569 process Effects 0.000 claims description 11
- 230000009466 transformation Effects 0.000 claims description 8
- 230000018109 developmental process Effects 0.000 claims description 7
- 238000013527 convolutional neural network Methods 0.000 claims description 6
- 238000013519 translation Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 5
- 230000009286 beneficial effect Effects 0.000 description 8
- 230000004048 modification Effects 0.000 description 6
- 238000012986 modification Methods 0.000 description 6
- 238000003709 image segmentation Methods 0.000 description 3
- 238000012550 audit Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/169—Annotation, e.g. comment data or footnotes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/151—Transformation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
- G06T11/60—Editing figures and text; Combining figures or text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4038—Image mosaicing, e.g. composing plane images from plane sub-images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/10—Image enhancement or restoration using non-spatial domain filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/50—Image enhancement or restoration using two or more images, e.g. averaging or subtraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2200/00—Indexing scheme for image data processing or generation, in general
- G06T2200/32—Indexing scheme for image data processing or generation, in general involving image mosaicing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20048—Transform domain processing
- G06T2207/20064—Wavelet transform [DWT]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20212—Image combination
- G06T2207/20221—Image fusion; Image merging
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30176—Document
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
提供了一种给PDF文件加批注的方法及应用系统,应用系统包括基于tabula二次开发的PDF文件识别模块、文件转换模块、光标跟踪定位模块、批注模块和保存模块;方法包括以PDF文件识别模块用于在线打开PDF文件进行预览;以文件转换模块用于将PDF文件的每页转化为一张图片;以光标跟踪定位模块用于在线预览图片时,通过鼠标在图片中框选目标区域,记录框选目标区域范围;以批注模块用于弹出批注输入框,在批注输入框内录入批注意见;以保存模块用于保存框选目标区域的坐标及对应批注意见。本发明基于tabula开源技术,将PDF文档每页转化为一个图片,然后实现在线预览这些图片,支持鼠标框选区域,录入批注意见,同时支持框选文档的多处加批注。
Description
技术领域
本发明涉及PDF文件处理和文档在线审核技术领域,特别涉及一种给PDF文件加批注的方法及应用系统。
背景技术
为了防止文档在流转过程中内容被篡改,通常会将文档转化为PDF格式的文档,使得他人无法对文档进行随意编辑,还可以避免对文档内容的误操作。但是,在查看审阅PDF文档过程中,如果对PDF文档中的内容有调整意见,往往只能采用另建文件或者通过邮件等方式提出。
目前,若要类似给Word加批注意见那样,针对某处文档内容加批注,并批注意见可以保存下来,在流转过程中让其他人都可以查看批注且可以调整批注内容,这是无法实现的。即对PDF文档在线审核不能对PDF文档加批注意见,更无法将批注意见保存下来并在文档审核环节时候供其他人查看批注意见。
发明内容
为了解决上述技术问题,本发明提供了一种给PDF文件加批注的方法,包括以下步骤:
S100基于tabula二次开发,在线打开PDF文件进行预览,将PDF文件的每页转化为一张图片;
S200在线预览图片,通过鼠标在图片中框选目标区域,记录框选目标区域范围并弹出批注输入框,在批注输入框内录入批注意见;
S300保存框选目标区域的坐标及对应批注意见。
可选的,在线打开已批注过的PDF文件,加载框选目标区域及对应批注意见;以鼠标点击存在批注意见的框选目标区域,显示出对应目标区域的批注意见,对批注意见进行编辑并保存。
可选的,在S100步骤中,将PDF文件的每页转化为一张图片的过程如下:
用机器视觉技术对PDF文件进行页面分析,设置页面标签,根据页面标签将每页转化为图片;
针对每一张图片,建立坐标系,将图片分割为多个图像碎片,标记各图像碎片的位置坐标;
将图像碎片组成一个样本序列,并进行以下处理:
首先,采用以下公式进行离散小波变换:
然后,获取图像碎片的碎片特征,采用以下公式计算图像碎片的似然能量:
采用惩罚函数方法,通过以下公式得到的势能:
将处理后的图像碎片按照标记的位置坐标进行拼接,恢复图片。
可选的,在S200步骤中,通过鼠标在图片中框选目标区域的方式如下:
识别图片中框选目标区域的文字与标点符号,确定并关联文字和标点符号与其所在框选目标区域的位置,使用深度卷积神经网络进行深度特征学习,对文字进行语义分析;
根据语义分析,结合标点符号的位置,确定文字分割点,采用预设算法分别计算第一个文字分割点之前文字和最后一个文字分割点之后文字的语义与整体语义的相似度,若第一个文字分割点之前文字的相似度小于预设阈值,则将第一个文字分割点之前文字对应位置从框选目标区域中剔除;若最后一个文字分割点之后文字的相似度小于预设阈值,则将最后一个文字分割点之后文字对应位置从框选目标区中剔除。
可选的,所述预设算法如下:
上式中,表示语义的相似度;表示整体语义元素的数量;表示第一个文字分割点之前文字或者最后一个文字分割点之后文字的语义元素数量;表示第个语义在第一个文字分割点之前文字或者最后一个文字分割点之后文字出现的次数;表示第个语义的整体出现的次数。
本发明还提供了一种给PDF文件加批注的应用系统,包括基于tabula二次开发的PDF文件识别模块、文件转换模块、光标跟踪定位模块、批注模块和保存模块;
所述PDF文件识别模块用于在线打开PDF文件进行预览;
所述文件转换模块用于将PDF文件的每页转化为一张图片;
所述光标跟踪定位模块用于在线预览图片时,通过鼠标在图片中框选目标区域,记录框选目标区域范围;
所述批注模块用于弹出批注输入框,在批注输入框内录入批注意见;
所述保存模块用于保存框选目标区域的坐标及对应批注意见。
可选的,还包括批注修改模块,用于在线打开的已批注过的PDF文件,就加载框选目标区域及对应批注意见;以鼠标点击存在批注意见的框选目标区域,显示出对应目标区域的批注意见,对批注意见进行编辑;然后由保存模块保存编辑后的框选目标区域的坐标及对应批注意见。
可选的,所述文件转换模块内置机器视觉子模块、页面标签子模块、图片分割子模块、图片处理子模块和拼接子模块;
所述文件转换模块将PDF文件的每页转化为一张图片的过程如下:
采用机器视觉子模块对PDF文件进行页面分析;
采用页面标签子模块对机器视觉子模块进行页面分析后的PDF文件设置页面标签;
所述文件转换模块根据页面标签将每页转化为图片;
所述图片分割子模块用于对每一张图片,建立坐标系,将图片分割为多个图像碎片,标记各图像碎片的位置坐标;
所述图片处理子模块用于将图像碎片组成一个样本序列,并进行以下处理:
首先,采用以下公式进行离散小波变换:
然后,获取图像碎片的碎片特征,采用以下公式计算图像碎片的似然能量:
采用惩罚函数方法,通过以下公式得到的势能:
所述拼接子模块用于将处理后的图像碎片按照标记的位置坐标进行拼接,恢复图片。
可选的,所述光标跟踪定位模块内设语义分析子模块和运算子模块;
所述语义分析子模块用于:识别图片中框选目标区域的文字与标点符号,确定并关联文字和标点符号与其所在框选目标区域的位置,使用深度卷积神经网络进行深度特征学习,对文字进行语义分析;根据语义分析,结合标点符号的位置,确定文字分割点;
所述运算子模块内置预设算法,用于分别计算第一个文字分割点之前文字和最后一个文字分割点之后文字的语义与整体语义的相似度,并与预设阈值进行对比;
所述光标跟踪定位模块根据运算子模块的计算结果,若第一个文字分割点之前文字的相似度小于预设阈值,则将第一个文字分割点之前文字对应位置从框选目标区域中剔除;若最后一个文字分割点之后文字的相似度小于预设阈值,则将最后一个文字分割点之后文字对应位置从框选目标区中剔除。
可选的,所述运算子模块内置的预设算法如下:
上式中,表示语义的相似度;表示整体语义元素的数量;表示第一个文字分割点之前文字或者最后一个文字分割点之后文字的语义元素数量;表示第个语义在第一个文字分割点之前文字或者最后一个文字分割点之后文字出现的次数;表示第个语义的整体出现的次数。
本发明基于tabula开源技术,将PDF文档每页转化为一个图片,然后实现在线预览这些图片,支持鼠标框选区域,然后弹出批注输入框,支持录入批注意见,同时支持框选文档的多处加批注,鼠标点击框选区域时候,批注意见切换显示对应区域的批注,可以再次编辑批注,可以将框选区域坐标及对应批注保存下来。这样审核PDF文档的人,再次打开PDF文档的时候,系统加载框选区域及对应批注意见信息,在文档中框选之前框选的区域,当鼠标点击框选区域的时候,批注区域可以显示批注意见。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明实施例中一种给PDF文件加批注的方法流程图;
图2为本发明的给PDF文件加批注的应用系统实施例示意图;
图3为采用本发明对某PDF文件进行加批注的操作实施例流程图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
如图1所示,本发明实施例提供了一种给PDF文件加批注的方法,包括以下步骤:
S100基于tabula二次开发,在线打开PDF文件进行预览,将PDF文件的每页转化为一张图片;
S200在线预览图片,通过鼠标在图片中框选目标区域,记录框选目标区域范围并弹出批注输入框,在批注输入框内录入批注意见;
S300保存框选目标区域的坐标及对应批注意见。
上述技术方案的工作原理和有益效果为:本方案基于tabula开源技术,对PDF格式的文档进行在线预览审核,可通过鼠标框选区域,弹出批注输入窗口,输入批注,可反复框选不同内容区域输入批注,点击任意框选的区域,批注窗口切换显示对应区域的批注,同时支持框选文档的多处加批注,可以将框选区域坐标及对应批注保存下来,实现在PDF文件中以类似WORD文件的编辑方式进行批注,且不会损害PDF文件的稳定性,方便的文件的审批及审批修改意见的快速阅读。
在一个实施例中,在线打开已批注过的PDF文件,加载框选目标区域及对应批注意见;以鼠标点击存在批注意见的框选目标区域,显示出对应目标区域的批注意见,对批注意见进行编辑并保存。
上述技术方案的工作原理和有益效果为:本方案可以让流程审核人能够查看对文档加的批注意见,可以点击不同的框选区域查看对应批注内容,可以再次编辑修改批注,也可以框选其他区域增加批注,可以将框选区域坐标及对应批注保存下来,提高的批注的灵活性和实用性。
在一个实施例中,在S100步骤中,将PDF文件的每页转化为一张图片的过程如下:
用机器视觉技术对PDF文件进行页面分析,设置页面标签,根据页面标签将每页转化为图片;
针对每一张图片,建立坐标系,将图片分割为多个图像碎片,标记各图像碎片的位置坐标;
将图像碎片组成一个样本序列,并进行以下处理:
首先,采用以下公式进行离散小波变换:
然后,获取图像碎片的碎片特征,采用以下公式计算图像碎片的似然能量:
采用惩罚函数方法,通过以下公式得到的势能:
将处理后的图像碎片按照标记的位置坐标进行拼接,恢复图片。
上述技术方案的工作原理和有益效果为:本方案对图片进行分割,通过离散小波变换,过滤干扰因素,提高图片质量,消除可能存在的线条重影;依据像素基团能量的原理对图像进行增强处理,势能计算反映了相邻特征点的模糊变化参数的关联程度,以该关联度可增强图像碎片的清晰度,将经过上述处理的图像碎片拼接恢复,可以得到高质量的图片,提高使用与阅读的舒适性。
在一个实施例中,在S200步骤中,通过鼠标在图片中框选目标区域的方式如下:
识别图片中框选目标区域的文字与标点符号,确定并关联文字和标点符号与其所在框选目标区域的位置,使用深度卷积神经网络进行深度特征学习,对文字进行语义分析;
根据语义分析,结合标点符号的位置,确定文字分割点,采用预设算法分别计算第一个文字分割点之前文字和最后一个文字分割点之后文字的语义与整体语义的相似度,若第一个文字分割点之前文字的相似度小于预设阈值,则将第一个文字分割点之前文字对应位置从框选目标区域中剔除;若最后一个文字分割点之后文字的相似度小于预设阈值,则将最后一个文字分割点之后文字对应位置从框选目标区中剔除;
所述预设算法如下:
上式中,表示语义的相似度;表示整体语义元素的数量;表示第一个文字分割点之前文字或者最后一个文字分割点之后文字的语义元素数量;表示第个语义在第一个文字分割点之前文字或者最后一个文字分割点之后文字出现的次数;表示第个语义的整体出现的次数。
上述技术方案的工作原理和有益效果为:本方案通过对图片中框选目标区域进行图片识别和语义分析,找到可用的文字分割点,该文字分割点可能为1个,也可能存在多个,基于语义分析对文字分割点的首部和尾部进行语义判断,智能地精准确定操作人员的选定内容,排除干扰部分,初始鼠标框选目标区域为一个方形,经本方案处理后,选定区域可能在首部和尾部出现阶梯缺口,提高批注位置的准确度。
如图2所示,本发明实施例提供了一种给PDF文件加批注的应用系统,包括基于tabula二次开发的PDF文件识别模块10、文件转换模块20、光标跟踪定位模块30、批注模块40和保存模块50;
所述PDF文件识别模块10用于在线打开PDF文件进行预览;
所述文件转换模块20用于将PDF文件的每页转化为一张图片;
所述光标跟踪定位模块30用于在线预览图片时,通过鼠标在图片中框选目标区域,记录框选目标区域范围;
所述批注模块40用于弹出批注输入框,在批注输入框内录入批注意见;
所述保存模块50用于保存框选目标区域的坐标及对应批注意见。
上述技术方案的工作原理和有益效果为:本方案基于tabula开源技术,开发PDF文件识别模块、文件转换模块、光标跟踪定位模块、批注模块和保存模块,对PDF格式的文档进行在线预览审核,可通过鼠标框选区域,弹出批注输入窗口,输入批注,可反复框选不同内容区域输入批注,点击任意框选的区域,批注窗口切换显示对应区域的批注,同时支持框选文档的多处加批注,可以将框选区域坐标及对应批注保存下来,实现在PDF文件中以类似WORD文件的编辑方式进行批注,且不会损害PDF文件的稳定性,方便的文件的审批及审批修改意见的快速阅读。
在一个实施例中,还包括批注修改模块,用于在线打开的已批注过的PDF文件,就加载框选目标区域及对应批注意见;以鼠标点击存在批注意见的框选目标区域,显示出对应目标区域的批注意见,对批注意见进行编辑;然后由保存模块保存编辑后的框选目标区域的坐标及对应批注意见。
上述技术方案的工作原理和有益效果为:本方案通过设置批注修改模块,可以让流程审核人能够查看对文档加的批注意见,可以点击不同的框选区域查看对应批注内容,可以再次编辑修改批注,也可以框选其他区域增加批注,可以将框选区域坐标及对应批注保存下来,提高的批注的灵活性和实用性。
在一个实施例中,所述文件转换模块内置机器视觉子模块、页面标签子模块、图片分割子模块、图片处理子模块和拼接子模块;
所述文件转换模块将PDF文件的每页转化为一张图片的过程如下:
采用机器视觉子模块对PDF文件进行页面分析;
采用页面标签子模块对机器视觉子模块进行页面分析后的PDF文件设置页面标签;
所述文件转换模块根据页面标签将每页转化为图片;
所述图片分割子模块用于对每一张图片,建立坐标系,将图片分割为多个图像碎片,标记各图像碎片的位置坐标;
所述图片处理子模块用于将图像碎片组成一个样本序列,并进行以下处理:
首先,采用以下公式进行离散小波变换:
然后,获取图像碎片的碎片特征,采用以下公式计算图像碎片的似然能量:
采用惩罚函数方法,通过以下公式得到的势能:
所述拼接子模块用于将处理后的图像碎片按照标记的位置坐标进行拼接,恢复图片。
上述技术方案的工作原理和有益效果为:本方案通过在文件转换模块内设置机器视觉子模块、页面标签子模块、图片分割子模块、图片处理子模块和拼接子模块,对图片进行分割,通过离散小波变换,过滤干扰因素,提高图片质量,消除可能存在的线条重影;依据像素基团能量的原理对图像进行增强处理,势能计算反映了相邻特征点的模糊变化参数的关联程度,以该关联度可增强图像碎片的清晰度,将经过上述处理的图像碎片拼接恢复,可以得到高质量的图片,提高使用与阅读的舒适性。
在一个实施例中,所述光标跟踪定位模块内设语义分析子模块和运算子模块;
所述语义分析子模块用于:识别图片中框选目标区域的文字与标点符号,确定并关联文字和标点符号与其所在框选目标区域的位置,使用深度卷积神经网络进行深度特征学习,对文字进行语义分析;根据语义分析,结合标点符号的位置,确定文字分割点;
所述运算子模块内置预设算法,用于分别计算第一个文字分割点之前文字和最后一个文字分割点之后文字的语义与整体语义的相似度,并与预设阈值进行对比;
所述光标跟踪定位模块根据运算子模块的计算结果,若第一个文字分割点之前文字的相似度小于预设阈值,则将第一个文字分割点之前文字对应位置从框选目标区域中剔除;若最后一个文字分割点之后文字的相似度小于预设阈值,则将最后一个文字分割点之后文字对应位置从框选目标区中剔除;
所述运算子模块内置的预设算法如下:
上式中,表示语义的相似度;表示整体语义元素的数量;表示第一个文字分割点之前文字或者最后一个文字分割点之后文字的语义元素数量;表示第个语义在第一个文字分割点之前文字或者最后一个文字分割点之后文字出现的次数;表示第个语义的整体出现的次数。
上述技术方案的工作原理和有益效果为:本方案通过在光标跟踪定位模块内设语义分析子模块和运算子模块,对图片中框选目标区域进行图片识别和语义分析,找到可用的文字分割点,该文字分割点可能为1个,也可能存在多个,基于语义分析对文字分割点的首部和尾部进行语义判断,智能地精准确定操作人员的选定内容,排除干扰部分,初始鼠标框选目标区域为一个方形,经本方案处理后,选定区域可能在首部和尾部出现阶梯缺口,提高批注位置的准确度。
下面以某PDF文件加批注的操作实施例对本发明做进一步的说明,如图3所示,具体操作流程如下:
首先,基于tabula二次开发,在线打开一个待审批的PDF格式文件,看看该文件是否曾转化过图片,若没有则将该PDF文件每一页转化为一个图片,然后通过鼠标框选目标区域,弹出批注输入框,输入批注意见,支持反复框选目标区域和填写批注意见;若曾转化过图片,则加载图片,看图片内是否存在批注意见,若没有批注意见,可以通过鼠标框选目标区域,弹出批注输入框,根据需要输入批注意见;若存在批注意见,加载框选目标区域及对应批注意见,当鼠标点击框选目标区域的时候,批注输入框切换显示对应目标区域的批注意见,可进行编辑修改;最后对框选目标区域的坐标及对应添加或者修改的批注意见进行保存。
本发明基于tabula开源技术,对PDF格式的文档进行在线预览审核,可通过鼠标框选区域,弹出批注输入窗口,输入批注,可反复框选不同内容区域输入批注,点击任意框选的区域,批注窗口切换显示对应区域的批注,可以再次编辑批注,可以将框选区域坐标及对应批注保存下来。流程审核人能够查看对文档加的批注意见,可以点击不同的框选区域查看对应批注内容,可以再次编辑批注,也可以框选其他区域增加批注,可以将框选区域坐标及对应批注保存下来。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (10)
1.一种给PDF文件加批注的方法,其特征在于,包括以下步骤:
S100基于tabula二次开发,在线打开PDF文件进行预览,将PDF文件的每页转化为一张图片;
S200在线预览图片,通过鼠标在图片中框选目标区域,记录框选目标区域范围并弹出批注输入框,在批注输入框内录入批注意见;
S300保存框选目标区域的坐标及对应批注意见。
2.根据权利要求1所述的给PDF文件加批注的方法,其特征在于,在线打开已批注过的PDF文件,加载框选目标区域及对应批注意见;以鼠标点击存在批注意见的框选目标区域,显示出对应目标区域的批注意见,对批注意见进行编辑并保存。
3.根据权利要求1所述的给PDF文件加批注的方法,其特征在于,在S100步骤中,将PDF文件的每页转化为一张图片的过程如下:
用机器视觉技术对PDF文件进行页面分析,设置页面标签,根据页面标签将每页转化为图片;
针对每一张图片,建立坐标系,将图片分割为多个图像碎片,标记各图像碎片的位置坐标;
将图像碎片组成一个样本序列,并进行以下处理:
首先,采用以下公式进行离散小波变换:
然后,获取图像碎片的碎片特征,采用以下公式计算图像碎片的似然能量:
采用惩罚函数方法,通过以下公式得到的势能:
将处理后的图像碎片按照标记的位置坐标进行拼接,恢复图片。
4.根据权利要求1所述的给PDF文件加批注的方法,其特征在于,在S200步骤中,通过鼠标在图片中框选目标区域的方式如下:
识别图片中框选目标区域的文字与标点符号,确定并关联文字和标点符号与其所在框选目标区域的位置,使用深度卷积神经网络进行深度特征学习,对文字进行语义分析;
根据语义分析,结合标点符号的位置,确定文字分割点,采用预设算法分别计算第一个文字分割点之前文字和最后一个文字分割点之后文字的语义与整体语义的相似度,若第一个文字分割点之前文字的相似度小于预设阈值,则将第一个文字分割点之前文字对应位置从框选目标区域中剔除;若最后一个文字分割点之后文字的相似度小于预设阈值,则将最后一个文字分割点之后文字对应位置从框选目标区中剔除。
6.一种给PDF文件加批注的应用系统,其特征在于,包括基于tabula二次开发的PDF文件识别模块、文件转换模块、光标跟踪定位模块、批注模块和保存模块;
所述PDF文件识别模块用于在线打开PDF文件进行预览;
所述文件转换模块用于将PDF文件的每页转化为一张图片;
所述光标跟踪定位模块用于在线预览图片时,通过鼠标在图片中框选目标区域,记录框选目标区域范围;
所述批注模块用于弹出批注输入框,在批注输入框内录入批注意见;
所述保存模块用于保存框选目标区域的坐标及对应批注意见。
7.根据权利要求6所述的给PDF文件加批注的应用系统,其特征在于,还包括批注修改模块,用于在线打开的已批注过的PDF文件,就加载框选目标区域及对应批注意见;以鼠标点击存在批注意见的框选目标区域,显示出对应目标区域的批注意见,对批注意见进行编辑;然后由保存模块保存编辑后的框选目标区域的坐标及对应批注意见。
8.根据权利要求6所述的给PDF文件加批注的应用系统,其特征在于,所述文件转换模块内置机器视觉子模块、页面标签子模块、图片分割子模块、图片处理子模块和拼接子模块;
所述文件转换模块将PDF文件的每页转化为一张图片的过程如下:
采用机器视觉子模块对PDF文件进行页面分析;
采用页面标签子模块对机器视觉子模块进行页面分析后的PDF文件设置页面标签;
所述文件转换模块根据页面标签将每页转化为图片;
所述图片分割子模块用于对每一张图片,建立坐标系,将图片分割为多个图像碎片,标记各图像碎片的位置坐标;
所述图片处理子模块用于将图像碎片组成一个样本序列,并进行以下处理:
首先,采用以下公式进行离散小波变换:
然后,获取图像碎片的碎片特征,采用以下公式计算图像碎片的似然能量:
采用惩罚函数方法,通过以下公式得到的势能:
所述拼接子模块用于将处理后的图像碎片按照标记的位置坐标进行拼接,恢复图片。
9.根据权利要求6所述的给PDF文件加批注的应用系统,其特征在于,所述光标跟踪定位模块内设语义分析子模块和运算子模块;
所述语义分析子模块用于:识别图片中框选目标区域的文字与标点符号,确定并关联文字和标点符号与其所在框选目标区域的位置,使用深度卷积神经网络进行深度特征学习,对文字进行语义分析;根据语义分析,结合标点符号的位置,确定文字分割点;
所述运算子模块内置预设算法,用于分别计算第一个文字分割点之前文字和最后一个文字分割点之后文字的语义与整体语义的相似度,并与预设阈值进行对比;
所述光标跟踪定位模块根据运算子模块的计算结果,若第一个文字分割点之前文字的相似度小于预设阈值,则将第一个文字分割点之前文字对应位置从框选目标区域中剔除;若最后一个文字分割点之后文字的相似度小于预设阈值,则将最后一个文字分割点之后文字对应位置从框选目标区中剔除。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110397483.3A CN112800727B (zh) | 2021-04-14 | 2021-04-14 | 给pdf文件加批注的方法及应用系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110397483.3A CN112800727B (zh) | 2021-04-14 | 2021-04-14 | 给pdf文件加批注的方法及应用系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112800727A true CN112800727A (zh) | 2021-05-14 |
CN112800727B CN112800727B (zh) | 2021-07-20 |
Family
ID=75816980
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110397483.3A Active CN112800727B (zh) | 2021-04-14 | 2021-04-14 | 给pdf文件加批注的方法及应用系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112800727B (zh) |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101916245A (zh) * | 2010-08-30 | 2010-12-15 | 中国电信股份有限公司 | 一种电子阅读器上电子书批注实现方法和装置 |
CN102881006A (zh) * | 2012-08-03 | 2013-01-16 | 吉林禹硕动漫游戏科技股份有限公司 | 多投影显示系统中的图像拼接与融合方法 |
CN102982330A (zh) * | 2012-11-21 | 2013-03-20 | 新浪网技术(中国)有限公司 | 文字图像中字符识别方法和识别装置 |
US20140153842A1 (en) * | 2011-07-22 | 2014-06-05 | Thales | Method for reducing noise in a sequence of fluoroscopic images by temporal and spatial filtering |
CN106846303A (zh) * | 2016-12-30 | 2017-06-13 | 平安科技(深圳)有限公司 | 图像篡改检测方法及装置 |
CN108776651A (zh) * | 2018-06-08 | 2018-11-09 | 北京厚德思成科技有限公司 | Pdf文件的批注处理方法及系统 |
CN109272515A (zh) * | 2018-08-17 | 2019-01-25 | 西安电子科技大学 | 基于高阶多尺度crf无监督的sar图像分割方法 |
CN110363102A (zh) * | 2019-06-24 | 2019-10-22 | 北京融汇金信信息技术有限公司 | 一种pdf文件的对象识别处理方法及装置 |
CN111259830A (zh) * | 2020-01-19 | 2020-06-09 | 中国农业科学院农业信息研究所 | 一种海外农业pdf文档内容碎片化方法及系统 |
CN111476006A (zh) * | 2020-04-13 | 2020-07-31 | 上海鸿翼软件技术股份有限公司 | Pdf文件在线批注方法、装置、设备及可读存储介质 |
CN111932557A (zh) * | 2020-08-13 | 2020-11-13 | 中国科学院重庆绿色智能技术研究院 | 基于集成学习和概率图模型的图像语义分割方法及装置 |
CN112487766A (zh) * | 2020-12-10 | 2021-03-12 | 北京明略软件系统有限公司 | 一种文档标注方法、系统及计算机设备 |
-
2021
- 2021-04-14 CN CN202110397483.3A patent/CN112800727B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101916245A (zh) * | 2010-08-30 | 2010-12-15 | 中国电信股份有限公司 | 一种电子阅读器上电子书批注实现方法和装置 |
US20140153842A1 (en) * | 2011-07-22 | 2014-06-05 | Thales | Method for reducing noise in a sequence of fluoroscopic images by temporal and spatial filtering |
CN102881006A (zh) * | 2012-08-03 | 2013-01-16 | 吉林禹硕动漫游戏科技股份有限公司 | 多投影显示系统中的图像拼接与融合方法 |
CN102982330A (zh) * | 2012-11-21 | 2013-03-20 | 新浪网技术(中国)有限公司 | 文字图像中字符识别方法和识别装置 |
CN106846303A (zh) * | 2016-12-30 | 2017-06-13 | 平安科技(深圳)有限公司 | 图像篡改检测方法及装置 |
CN108776651A (zh) * | 2018-06-08 | 2018-11-09 | 北京厚德思成科技有限公司 | Pdf文件的批注处理方法及系统 |
CN109272515A (zh) * | 2018-08-17 | 2019-01-25 | 西安电子科技大学 | 基于高阶多尺度crf无监督的sar图像分割方法 |
CN110363102A (zh) * | 2019-06-24 | 2019-10-22 | 北京融汇金信信息技术有限公司 | 一种pdf文件的对象识别处理方法及装置 |
CN111259830A (zh) * | 2020-01-19 | 2020-06-09 | 中国农业科学院农业信息研究所 | 一种海外农业pdf文档内容碎片化方法及系统 |
CN111476006A (zh) * | 2020-04-13 | 2020-07-31 | 上海鸿翼软件技术股份有限公司 | Pdf文件在线批注方法、装置、设备及可读存储介质 |
CN111932557A (zh) * | 2020-08-13 | 2020-11-13 | 中国科学院重庆绿色智能技术研究院 | 基于集成学习和概率图模型的图像语义分割方法及装置 |
CN112487766A (zh) * | 2020-12-10 | 2021-03-12 | 北京明略软件系统有限公司 | 一种文档标注方法、系统及计算机设备 |
Non-Patent Citations (4)
Title |
---|
VIVINE NURCAHYAWATI ET AL.: "Online Media as a Price Monitor:Text Analysis using Text Extraction Technique and Jaro-Winkler Similarity Algorithm", 《IEEE XPLORE》 * |
李翌昕等: "文本检测算法的发展与挑战", 《信号处理》 * |
栾悉道 等: "《多媒体情报处理技术》", 31 May 2016, 北京国防工业出版社 * |
郝凯锋: "基于文字边缘信息的碎纸片拼接", 《企业技术开发》 * |
Also Published As
Publication number | Publication date |
---|---|
CN112800727B (zh) | 2021-07-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109670429B (zh) | 一种基于实例分割的监控视频多目标人脸检测方法及系统 | |
JP5431754B2 (ja) | フォトガイドの自動生成 | |
US6768816B2 (en) | Method and system for interactive ground-truthing of document images | |
JP5050075B2 (ja) | 画像判別方法 | |
US8196030B1 (en) | System and method for comparing and reviewing documents | |
JP4882486B2 (ja) | スライド画像判定デバイスおよびスライド画像判定プログラム | |
US11024341B2 (en) | Conformance of media content to original camera source using optical character recognition | |
CN111553923B (zh) | 一种图像处理方法、电子设备及计算机可读存储介质 | |
CN108154191B (zh) | 文档图像的识别方法和系统 | |
CN112149722A (zh) | 一种基于无监督域适应的图像自动标注方法 | |
Lu et al. | Listwise view ranking for image cropping | |
JP2002369216A (ja) | 色補正方法 | |
JP4859054B2 (ja) | 画像処理装置、画像処理方法、プログラムおよび記録媒体 | |
CN113936764A (zh) | 一种医疗报告单照片中敏感信息脱敏方法及系统 | |
CN112800727B (zh) | 给pdf文件加批注的方法及应用系统 | |
US10366284B1 (en) | Image recognition and parsing | |
RU2571379C2 (ru) | Интеллектуальная обработка электронного документа | |
US11455753B1 (en) | Systems and methods to process electronic images to adjust attributes of the electronic images | |
US20220398399A1 (en) | Optical character recognition systems and methods for personal data extraction | |
CN115272649A (zh) | 分子结构图的图像识别、检索、录入方法及系统、介质 | |
CN113592807A (zh) | 一种训练方法、图像质量确定方法及装置、电子设备 | |
Tang et al. | A Scene-Text Synthesis Engine Achieved Through Learning From Decomposed Real-World Data | |
Tamrin et al. | Simultaneous detection of regular patterns in ancient manuscripts using GAN-Based deep unsupervised segmentation | |
Tsai et al. | EESRGAN: Efficient & Effective Super-Resolution Generative Adversarial Network | |
Shelke | A Tabulation method for Character Recognition using Haar wavelet in 2D images |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |