CN112800727A - 给pdf文件加批注的方法及应用系统 - Google Patents

给pdf文件加批注的方法及应用系统 Download PDF

Info

Publication number
CN112800727A
CN112800727A CN202110397483.3A CN202110397483A CN112800727A CN 112800727 A CN112800727 A CN 112800727A CN 202110397483 A CN202110397483 A CN 202110397483A CN 112800727 A CN112800727 A CN 112800727A
Authority
CN
China
Prior art keywords
module
representing
picture
target area
annotation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110397483.3A
Other languages
English (en)
Other versions
CN112800727B (zh
Inventor
金震
李明
徐伟
郭智坚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing SunwayWorld Science and Technology Co Ltd
Original Assignee
Beijing SunwayWorld Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing SunwayWorld Science and Technology Co Ltd filed Critical Beijing SunwayWorld Science and Technology Co Ltd
Priority to CN202110397483.3A priority Critical patent/CN112800727B/zh
Publication of CN112800727A publication Critical patent/CN112800727A/zh
Application granted granted Critical
Publication of CN112800727B publication Critical patent/CN112800727B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/169Annotation, e.g. comment data or footnotes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/60Editing figures and text; Combining figures or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4038Image mosaicing, e.g. composing plane images from plane sub-images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/10Image enhancement or restoration using non-spatial domain filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/50Image enhancement or restoration using two or more images, e.g. averaging or subtraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2200/00Indexing scheme for image data processing or generation, in general
    • G06T2200/32Indexing scheme for image data processing or generation, in general involving image mosaicing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20048Transform domain processing
    • G06T2207/20064Wavelet transform [DWT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20212Image combination
    • G06T2207/20221Image fusion; Image merging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30176Document

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

提供了一种给PDF文件加批注的方法及应用系统,应用系统包括基于tabula二次开发的PDF文件识别模块、文件转换模块、光标跟踪定位模块、批注模块和保存模块;方法包括以PDF文件识别模块用于在线打开PDF文件进行预览;以文件转换模块用于将PDF文件的每页转化为一张图片;以光标跟踪定位模块用于在线预览图片时,通过鼠标在图片中框选目标区域,记录框选目标区域范围;以批注模块用于弹出批注输入框,在批注输入框内录入批注意见;以保存模块用于保存框选目标区域的坐标及对应批注意见。本发明基于tabula开源技术,将PDF文档每页转化为一个图片,然后实现在线预览这些图片,支持鼠标框选区域,录入批注意见,同时支持框选文档的多处加批注。

Description

给PDF文件加批注的方法及应用系统
技术领域
本发明涉及PDF文件处理和文档在线审核技术领域,特别涉及一种给PDF文件加批注的方法及应用系统。
背景技术
为了防止文档在流转过程中内容被篡改,通常会将文档转化为PDF格式的文档,使得他人无法对文档进行随意编辑,还可以避免对文档内容的误操作。但是,在查看审阅PDF文档过程中,如果对PDF文档中的内容有调整意见,往往只能采用另建文件或者通过邮件等方式提出。
目前,若要类似给Word加批注意见那样,针对某处文档内容加批注,并批注意见可以保存下来,在流转过程中让其他人都可以查看批注且可以调整批注内容,这是无法实现的。即对PDF文档在线审核不能对PDF文档加批注意见,更无法将批注意见保存下来并在文档审核环节时候供其他人查看批注意见。
发明内容
为了解决上述技术问题,本发明提供了一种给PDF文件加批注的方法,包括以下步骤:
S100基于tabula二次开发,在线打开PDF文件进行预览,将PDF文件的每页转化为一张图片;
S200在线预览图片,通过鼠标在图片中框选目标区域,记录框选目标区域范围并弹出批注输入框,在批注输入框内录入批注意见;
S300保存框选目标区域的坐标及对应批注意见。
可选的,在线打开已批注过的PDF文件,加载框选目标区域及对应批注意见;以鼠标点击存在批注意见的框选目标区域,显示出对应目标区域的批注意见,对批注意见进行编辑并保存。
可选的,在S100步骤中,将PDF文件的每页转化为一张图片的过程如下:
用机器视觉技术对PDF文件进行页面分析,设置页面标签,根据页面标签将每页转化为图片;
针对每一张图片,建立坐标系,将图片分割为多个图像碎片,标记各图像碎片的位置坐标;
将图像碎片组成一个样本序列,并进行以下处理:
首先,采用以下公式进行离散小波变换:
Figure 438961DEST_PATH_IMAGE001
上式中,
Figure 887260DEST_PATH_IMAGE002
表示样本序列的离散小波变换;
Figure 73522DEST_PATH_IMAGE003
表示尺度;
Figure 390103DEST_PATH_IMAGE004
表示变换函数;
Figure 735633DEST_PATH_IMAGE005
表示尺度函数;
Figure 964620DEST_PATH_IMAGE006
表示初始尺度因子;
Figure 762812DEST_PATH_IMAGE007
表示小波基函数;
Figure 617505DEST_PATH_IMAGE008
表示尺度因子;
Figure 817542DEST_PATH_IMAGE009
表示平移因子;
然后,获取图像碎片的碎片特征,采用以下公式计算图像碎片的似然能量:
Figure 217430DEST_PATH_IMAGE010
上式中,表示;
Figure 502918DEST_PATH_IMAGE011
表示成像平面坐标集合,
Figure 895722DEST_PATH_IMAGE012
Figure 950266DEST_PATH_IMAGE013
表示样品序列的帧数;
Figure 786635DEST_PATH_IMAGE014
表示高斯因子;
Figure 559419DEST_PATH_IMAGE015
表示时间;
Figure 490335DEST_PATH_IMAGE016
表示时刻;
Figure 664964DEST_PATH_IMAGE003
表示尺度;
Figure 406655DEST_PATH_IMAGE017
Figure 666735DEST_PATH_IMAGE018
表示
Figure 401342DEST_PATH_IMAGE016
时刻样品帧的特征点
Figure 164898DEST_PATH_IMAGE019
在成像平面的投影;
Figure 467704DEST_PATH_IMAGE020
表示
Figure 824867DEST_PATH_IMAGE021
时刻样品帧的特征点
Figure 238531DEST_PATH_IMAGE019
在成像平面的投影;
采用惩罚函数方法,通过以下公式得到的势能:
Figure 246807DEST_PATH_IMAGE022
上式中,
Figure 720513DEST_PATH_IMAGE023
表示第
Figure 564973DEST_PATH_IMAGE013
帧样品的特征点
Figure 251169DEST_PATH_IMAGE019
的势能;
Figure 379531DEST_PATH_IMAGE024
表示特征点
Figure 24139DEST_PATH_IMAGE019
的尺度函数;
Figure 355894DEST_PATH_IMAGE019
Figure 111361DEST_PATH_IMAGE025
表示第
Figure 828650DEST_PATH_IMAGE013
帧样品的两个相邻特征点;
Figure 644159DEST_PATH_IMAGE026
表示势能阈值,取值大于零;
将处理后的图像碎片按照标记的位置坐标进行拼接,恢复图片。
可选的,在S200步骤中,通过鼠标在图片中框选目标区域的方式如下:
识别图片中框选目标区域的文字与标点符号,确定并关联文字和标点符号与其所在框选目标区域的位置,使用深度卷积神经网络进行深度特征学习,对文字进行语义分析;
根据语义分析,结合标点符号的位置,确定文字分割点,采用预设算法分别计算第一个文字分割点之前文字和最后一个文字分割点之后文字的语义与整体语义的相似度,若第一个文字分割点之前文字的相似度小于预设阈值,则将第一个文字分割点之前文字对应位置从框选目标区域中剔除;若最后一个文字分割点之后文字的相似度小于预设阈值,则将最后一个文字分割点之后文字对应位置从框选目标区中剔除。
可选的,所述预设算法如下:
Figure 463210DEST_PATH_IMAGE027
上式中,
Figure 22368DEST_PATH_IMAGE028
表示语义的相似度;
Figure 859743DEST_PATH_IMAGE029
表示整体语义元素的数量;
Figure 580574DEST_PATH_IMAGE030
表示第一个文字分割点之前文字或者最后一个文字分割点之后文字的语义元素数量;
Figure 886921DEST_PATH_IMAGE031
表示第
Figure 718611DEST_PATH_IMAGE032
个语义在第一个文字分割点之前文字或者最后一个文字分割点之后文字出现的次数;
Figure 551438DEST_PATH_IMAGE033
表示第
Figure 567804DEST_PATH_IMAGE032
个语义的整体出现的次数。
本发明还提供了一种给PDF文件加批注的应用系统,包括基于tabula二次开发的PDF文件识别模块、文件转换模块、光标跟踪定位模块、批注模块和保存模块;
所述PDF文件识别模块用于在线打开PDF文件进行预览;
所述文件转换模块用于将PDF文件的每页转化为一张图片;
所述光标跟踪定位模块用于在线预览图片时,通过鼠标在图片中框选目标区域,记录框选目标区域范围;
所述批注模块用于弹出批注输入框,在批注输入框内录入批注意见;
所述保存模块用于保存框选目标区域的坐标及对应批注意见。
可选的,还包括批注修改模块,用于在线打开的已批注过的PDF文件,就加载框选目标区域及对应批注意见;以鼠标点击存在批注意见的框选目标区域,显示出对应目标区域的批注意见,对批注意见进行编辑;然后由保存模块保存编辑后的框选目标区域的坐标及对应批注意见。
可选的,所述文件转换模块内置机器视觉子模块、页面标签子模块、图片分割子模块、图片处理子模块和拼接子模块;
所述文件转换模块将PDF文件的每页转化为一张图片的过程如下:
采用机器视觉子模块对PDF文件进行页面分析;
采用页面标签子模块对机器视觉子模块进行页面分析后的PDF文件设置页面标签;
所述文件转换模块根据页面标签将每页转化为图片;
所述图片分割子模块用于对每一张图片,建立坐标系,将图片分割为多个图像碎片,标记各图像碎片的位置坐标;
所述图片处理子模块用于将图像碎片组成一个样本序列,并进行以下处理:
首先,采用以下公式进行离散小波变换:
Figure 486082DEST_PATH_IMAGE034
上式中,
Figure 262408DEST_PATH_IMAGE002
表示样本序列的离散小波变换;
Figure 684162DEST_PATH_IMAGE003
表示尺度;
Figure 137009DEST_PATH_IMAGE004
表示变换函数;
Figure 11424DEST_PATH_IMAGE005
表示尺度函数;
Figure 591441DEST_PATH_IMAGE006
表示初始尺度因子;
Figure 133281DEST_PATH_IMAGE007
表示小波基函数;
Figure 757029DEST_PATH_IMAGE008
表示尺度因子;
Figure 384320DEST_PATH_IMAGE009
表示平移因子;
然后,获取图像碎片的碎片特征,采用以下公式计算图像碎片的似然能量:
Figure 502448DEST_PATH_IMAGE010
上式中,表示;
Figure 898795DEST_PATH_IMAGE011
表示成像平面坐标集合,
Figure 693444DEST_PATH_IMAGE012
Figure 542451DEST_PATH_IMAGE013
表示样品序列的帧数;
Figure 323326DEST_PATH_IMAGE014
表示高斯因子;
Figure 715124DEST_PATH_IMAGE015
表示时间;
Figure 556041DEST_PATH_IMAGE016
表示时刻;
Figure 282557DEST_PATH_IMAGE003
表示尺度;
Figure 867122DEST_PATH_IMAGE017
Figure 113427DEST_PATH_IMAGE018
表示
Figure 125245DEST_PATH_IMAGE016
时刻样品帧的特征点
Figure 807900DEST_PATH_IMAGE019
在成像平面的投影;
Figure 196156DEST_PATH_IMAGE020
表示
Figure 248032DEST_PATH_IMAGE021
时刻样品帧的特征点
Figure 102855DEST_PATH_IMAGE019
在成像平面的投影;
采用惩罚函数方法,通过以下公式得到的势能:
Figure 69543DEST_PATH_IMAGE035
上式中,
Figure 995911DEST_PATH_IMAGE023
表示第
Figure 216808DEST_PATH_IMAGE013
帧样品的特征点
Figure 960642DEST_PATH_IMAGE019
的势能;
Figure 758833DEST_PATH_IMAGE024
表示特征点
Figure 364258DEST_PATH_IMAGE019
的尺度函数;
Figure 298716DEST_PATH_IMAGE019
Figure 213452DEST_PATH_IMAGE025
表示第
Figure 498939DEST_PATH_IMAGE013
帧样品的两个相邻特征点;
Figure 642476DEST_PATH_IMAGE026
表示势能阈值,取值大于零;
所述拼接子模块用于将处理后的图像碎片按照标记的位置坐标进行拼接,恢复图片。
可选的,所述光标跟踪定位模块内设语义分析子模块和运算子模块;
所述语义分析子模块用于:识别图片中框选目标区域的文字与标点符号,确定并关联文字和标点符号与其所在框选目标区域的位置,使用深度卷积神经网络进行深度特征学习,对文字进行语义分析;根据语义分析,结合标点符号的位置,确定文字分割点;
所述运算子模块内置预设算法,用于分别计算第一个文字分割点之前文字和最后一个文字分割点之后文字的语义与整体语义的相似度,并与预设阈值进行对比;
所述光标跟踪定位模块根据运算子模块的计算结果,若第一个文字分割点之前文字的相似度小于预设阈值,则将第一个文字分割点之前文字对应位置从框选目标区域中剔除;若最后一个文字分割点之后文字的相似度小于预设阈值,则将最后一个文字分割点之后文字对应位置从框选目标区中剔除。
可选的,所述运算子模块内置的预设算法如下:
Figure 697020DEST_PATH_IMAGE036
上式中,
Figure 782656DEST_PATH_IMAGE028
表示语义的相似度;
Figure 289861DEST_PATH_IMAGE029
表示整体语义元素的数量;
Figure 237088DEST_PATH_IMAGE030
表示第一个文字分割点之前文字或者最后一个文字分割点之后文字的语义元素数量;
Figure 411718DEST_PATH_IMAGE031
表示第
Figure 402676DEST_PATH_IMAGE032
个语义在第一个文字分割点之前文字或者最后一个文字分割点之后文字出现的次数;
Figure 662756DEST_PATH_IMAGE033
表示第
Figure 148095DEST_PATH_IMAGE032
个语义的整体出现的次数。
本发明基于tabula开源技术,将PDF文档每页转化为一个图片,然后实现在线预览这些图片,支持鼠标框选区域,然后弹出批注输入框,支持录入批注意见,同时支持框选文档的多处加批注,鼠标点击框选区域时候,批注意见切换显示对应区域的批注,可以再次编辑批注,可以将框选区域坐标及对应批注保存下来。这样审核PDF文档的人,再次打开PDF文档的时候,系统加载框选区域及对应批注意见信息,在文档中框选之前框选的区域,当鼠标点击框选区域的时候,批注区域可以显示批注意见。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明实施例中一种给PDF文件加批注的方法流程图;
图2为本发明的给PDF文件加批注的应用系统实施例示意图;
图3为采用本发明对某PDF文件进行加批注的操作实施例流程图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
如图1所示,本发明实施例提供了一种给PDF文件加批注的方法,包括以下步骤:
S100基于tabula二次开发,在线打开PDF文件进行预览,将PDF文件的每页转化为一张图片;
S200在线预览图片,通过鼠标在图片中框选目标区域,记录框选目标区域范围并弹出批注输入框,在批注输入框内录入批注意见;
S300保存框选目标区域的坐标及对应批注意见。
上述技术方案的工作原理和有益效果为:本方案基于tabula开源技术,对PDF格式的文档进行在线预览审核,可通过鼠标框选区域,弹出批注输入窗口,输入批注,可反复框选不同内容区域输入批注,点击任意框选的区域,批注窗口切换显示对应区域的批注,同时支持框选文档的多处加批注,可以将框选区域坐标及对应批注保存下来,实现在PDF文件中以类似WORD文件的编辑方式进行批注,且不会损害PDF文件的稳定性,方便的文件的审批及审批修改意见的快速阅读。
在一个实施例中,在线打开已批注过的PDF文件,加载框选目标区域及对应批注意见;以鼠标点击存在批注意见的框选目标区域,显示出对应目标区域的批注意见,对批注意见进行编辑并保存。
上述技术方案的工作原理和有益效果为:本方案可以让流程审核人能够查看对文档加的批注意见,可以点击不同的框选区域查看对应批注内容,可以再次编辑修改批注,也可以框选其他区域增加批注,可以将框选区域坐标及对应批注保存下来,提高的批注的灵活性和实用性。
在一个实施例中,在S100步骤中,将PDF文件的每页转化为一张图片的过程如下:
用机器视觉技术对PDF文件进行页面分析,设置页面标签,根据页面标签将每页转化为图片;
针对每一张图片,建立坐标系,将图片分割为多个图像碎片,标记各图像碎片的位置坐标;
将图像碎片组成一个样本序列,并进行以下处理:
首先,采用以下公式进行离散小波变换:
Figure 177231DEST_PATH_IMAGE001
上式中,
Figure 948878DEST_PATH_IMAGE002
表示样本序列的离散小波变换;
Figure 820888DEST_PATH_IMAGE003
表示尺度;
Figure 234552DEST_PATH_IMAGE004
表示变换函数;
Figure 993560DEST_PATH_IMAGE005
表示尺度函数;
Figure 467267DEST_PATH_IMAGE006
表示初始尺度因子;
Figure 560994DEST_PATH_IMAGE007
表示小波基函数;
Figure 512769DEST_PATH_IMAGE008
表示尺度因子;
Figure 391864DEST_PATH_IMAGE009
表示平移因子;
然后,获取图像碎片的碎片特征,采用以下公式计算图像碎片的似然能量:
Figure 770893DEST_PATH_IMAGE010
上式中,表示;
Figure 351915DEST_PATH_IMAGE011
表示成像平面坐标集合,
Figure 841803DEST_PATH_IMAGE012
Figure 575403DEST_PATH_IMAGE013
表示样品序列的帧数;
Figure 390913DEST_PATH_IMAGE014
表示高斯因子;
Figure 459232DEST_PATH_IMAGE015
表示时间;
Figure 752810DEST_PATH_IMAGE016
表示时刻;
Figure 340917DEST_PATH_IMAGE003
表示尺度;
Figure 592907DEST_PATH_IMAGE017
Figure 171959DEST_PATH_IMAGE018
表示
Figure 269228DEST_PATH_IMAGE016
时刻样品帧的特征点
Figure 711842DEST_PATH_IMAGE019
在成像平面的投影;
Figure 603575DEST_PATH_IMAGE020
表示
Figure 990694DEST_PATH_IMAGE021
时刻样品帧的特征点
Figure 281867DEST_PATH_IMAGE019
在成像平面的投影;
采用惩罚函数方法,通过以下公式得到的势能:
Figure 438042DEST_PATH_IMAGE022
上式中,
Figure 172779DEST_PATH_IMAGE023
表示第
Figure 781615DEST_PATH_IMAGE013
帧样品的特征点
Figure 142058DEST_PATH_IMAGE019
的势能;
Figure 152740DEST_PATH_IMAGE024
表示特征点
Figure 323958DEST_PATH_IMAGE019
的尺度函数;
Figure 420090DEST_PATH_IMAGE019
Figure 787486DEST_PATH_IMAGE025
表示第
Figure 918253DEST_PATH_IMAGE013
帧样品的两个相邻特征点;
Figure 994794DEST_PATH_IMAGE026
表示势能阈值,取值大于零;
将处理后的图像碎片按照标记的位置坐标进行拼接,恢复图片。
上述技术方案的工作原理和有益效果为:本方案对图片进行分割,通过离散小波变换,过滤干扰因素,提高图片质量,消除可能存在的线条重影;依据像素基团能量的原理对图像进行增强处理,势能计算反映了相邻特征点的模糊变化参数的关联程度,以该关联度可增强图像碎片的清晰度,将经过上述处理的图像碎片拼接恢复,可以得到高质量的图片,提高使用与阅读的舒适性。
在一个实施例中,在S200步骤中,通过鼠标在图片中框选目标区域的方式如下:
识别图片中框选目标区域的文字与标点符号,确定并关联文字和标点符号与其所在框选目标区域的位置,使用深度卷积神经网络进行深度特征学习,对文字进行语义分析;
根据语义分析,结合标点符号的位置,确定文字分割点,采用预设算法分别计算第一个文字分割点之前文字和最后一个文字分割点之后文字的语义与整体语义的相似度,若第一个文字分割点之前文字的相似度小于预设阈值,则将第一个文字分割点之前文字对应位置从框选目标区域中剔除;若最后一个文字分割点之后文字的相似度小于预设阈值,则将最后一个文字分割点之后文字对应位置从框选目标区中剔除;
所述预设算法如下:
Figure 578222DEST_PATH_IMAGE027
上式中,
Figure 280468DEST_PATH_IMAGE028
表示语义的相似度;
Figure 265741DEST_PATH_IMAGE029
表示整体语义元素的数量;
Figure 247604DEST_PATH_IMAGE030
表示第一个文字分割点之前文字或者最后一个文字分割点之后文字的语义元素数量;
Figure 505278DEST_PATH_IMAGE031
表示第
Figure 965210DEST_PATH_IMAGE032
个语义在第一个文字分割点之前文字或者最后一个文字分割点之后文字出现的次数;
Figure 336148DEST_PATH_IMAGE033
表示第
Figure 472600DEST_PATH_IMAGE032
个语义的整体出现的次数。
上述技术方案的工作原理和有益效果为:本方案通过对图片中框选目标区域进行图片识别和语义分析,找到可用的文字分割点,该文字分割点可能为1个,也可能存在多个,基于语义分析对文字分割点的首部和尾部进行语义判断,智能地精准确定操作人员的选定内容,排除干扰部分,初始鼠标框选目标区域为一个方形,经本方案处理后,选定区域可能在首部和尾部出现阶梯缺口,提高批注位置的准确度。
如图2所示,本发明实施例提供了一种给PDF文件加批注的应用系统,包括基于tabula二次开发的PDF文件识别模块10、文件转换模块20、光标跟踪定位模块30、批注模块40和保存模块50;
所述PDF文件识别模块10用于在线打开PDF文件进行预览;
所述文件转换模块20用于将PDF文件的每页转化为一张图片;
所述光标跟踪定位模块30用于在线预览图片时,通过鼠标在图片中框选目标区域,记录框选目标区域范围;
所述批注模块40用于弹出批注输入框,在批注输入框内录入批注意见;
所述保存模块50用于保存框选目标区域的坐标及对应批注意见。
上述技术方案的工作原理和有益效果为:本方案基于tabula开源技术,开发PDF文件识别模块、文件转换模块、光标跟踪定位模块、批注模块和保存模块,对PDF格式的文档进行在线预览审核,可通过鼠标框选区域,弹出批注输入窗口,输入批注,可反复框选不同内容区域输入批注,点击任意框选的区域,批注窗口切换显示对应区域的批注,同时支持框选文档的多处加批注,可以将框选区域坐标及对应批注保存下来,实现在PDF文件中以类似WORD文件的编辑方式进行批注,且不会损害PDF文件的稳定性,方便的文件的审批及审批修改意见的快速阅读。
在一个实施例中,还包括批注修改模块,用于在线打开的已批注过的PDF文件,就加载框选目标区域及对应批注意见;以鼠标点击存在批注意见的框选目标区域,显示出对应目标区域的批注意见,对批注意见进行编辑;然后由保存模块保存编辑后的框选目标区域的坐标及对应批注意见。
上述技术方案的工作原理和有益效果为:本方案通过设置批注修改模块,可以让流程审核人能够查看对文档加的批注意见,可以点击不同的框选区域查看对应批注内容,可以再次编辑修改批注,也可以框选其他区域增加批注,可以将框选区域坐标及对应批注保存下来,提高的批注的灵活性和实用性。
在一个实施例中,所述文件转换模块内置机器视觉子模块、页面标签子模块、图片分割子模块、图片处理子模块和拼接子模块;
所述文件转换模块将PDF文件的每页转化为一张图片的过程如下:
采用机器视觉子模块对PDF文件进行页面分析;
采用页面标签子模块对机器视觉子模块进行页面分析后的PDF文件设置页面标签;
所述文件转换模块根据页面标签将每页转化为图片;
所述图片分割子模块用于对每一张图片,建立坐标系,将图片分割为多个图像碎片,标记各图像碎片的位置坐标;
所述图片处理子模块用于将图像碎片组成一个样本序列,并进行以下处理:
首先,采用以下公式进行离散小波变换:
Figure 296200DEST_PATH_IMAGE037
上式中,
Figure 825401DEST_PATH_IMAGE002
表示样本序列的离散小波变换;
Figure 50846DEST_PATH_IMAGE003
表示尺度;
Figure 358200DEST_PATH_IMAGE004
表示变换函数;
Figure 934675DEST_PATH_IMAGE005
表示尺度函数;
Figure 736408DEST_PATH_IMAGE006
表示初始尺度因子;
Figure 816360DEST_PATH_IMAGE007
表示小波基函数;
Figure 560194DEST_PATH_IMAGE008
表示尺度因子;
Figure 358386DEST_PATH_IMAGE009
表示平移因子;
然后,获取图像碎片的碎片特征,采用以下公式计算图像碎片的似然能量:
Figure 698231DEST_PATH_IMAGE010
上式中,表示;
Figure 898268DEST_PATH_IMAGE011
表示成像平面坐标集合,
Figure 813004DEST_PATH_IMAGE012
Figure 832912DEST_PATH_IMAGE013
表示样品序列的帧数;
Figure 242028DEST_PATH_IMAGE014
表示高斯因子;
Figure 296572DEST_PATH_IMAGE015
表示时间;
Figure 116629DEST_PATH_IMAGE016
表示时刻;
Figure 889413DEST_PATH_IMAGE003
表示尺度;
Figure 836640DEST_PATH_IMAGE017
Figure 745691DEST_PATH_IMAGE018
表示
Figure 2228DEST_PATH_IMAGE016
时刻样品帧的特征点
Figure 996729DEST_PATH_IMAGE019
在成像平面的投影;
Figure 747648DEST_PATH_IMAGE020
表示
Figure 166996DEST_PATH_IMAGE021
时刻样品帧的特征点
Figure 204223DEST_PATH_IMAGE019
在成像平面的投影;
采用惩罚函数方法,通过以下公式得到的势能:
Figure 826965DEST_PATH_IMAGE038
上式中,
Figure 240629DEST_PATH_IMAGE023
表示第
Figure 248905DEST_PATH_IMAGE013
帧样品的特征点
Figure 457032DEST_PATH_IMAGE019
的势能;
Figure 301492DEST_PATH_IMAGE024
表示特征点
Figure 518846DEST_PATH_IMAGE019
的尺度函数;
Figure 381629DEST_PATH_IMAGE019
Figure 26237DEST_PATH_IMAGE025
表示第
Figure 357992DEST_PATH_IMAGE013
帧样品的两个相邻特征点;
Figure 113459DEST_PATH_IMAGE026
表示势能阈值,取值大于零;
所述拼接子模块用于将处理后的图像碎片按照标记的位置坐标进行拼接,恢复图片。
上述技术方案的工作原理和有益效果为:本方案通过在文件转换模块内设置机器视觉子模块、页面标签子模块、图片分割子模块、图片处理子模块和拼接子模块,对图片进行分割,通过离散小波变换,过滤干扰因素,提高图片质量,消除可能存在的线条重影;依据像素基团能量的原理对图像进行增强处理,势能计算反映了相邻特征点的模糊变化参数的关联程度,以该关联度可增强图像碎片的清晰度,将经过上述处理的图像碎片拼接恢复,可以得到高质量的图片,提高使用与阅读的舒适性。
在一个实施例中,所述光标跟踪定位模块内设语义分析子模块和运算子模块;
所述语义分析子模块用于:识别图片中框选目标区域的文字与标点符号,确定并关联文字和标点符号与其所在框选目标区域的位置,使用深度卷积神经网络进行深度特征学习,对文字进行语义分析;根据语义分析,结合标点符号的位置,确定文字分割点;
所述运算子模块内置预设算法,用于分别计算第一个文字分割点之前文字和最后一个文字分割点之后文字的语义与整体语义的相似度,并与预设阈值进行对比;
所述光标跟踪定位模块根据运算子模块的计算结果,若第一个文字分割点之前文字的相似度小于预设阈值,则将第一个文字分割点之前文字对应位置从框选目标区域中剔除;若最后一个文字分割点之后文字的相似度小于预设阈值,则将最后一个文字分割点之后文字对应位置从框选目标区中剔除;
所述运算子模块内置的预设算法如下:
Figure 361906DEST_PATH_IMAGE036
上式中,
Figure 177415DEST_PATH_IMAGE028
表示语义的相似度;
Figure 730888DEST_PATH_IMAGE029
表示整体语义元素的数量;
Figure 290045DEST_PATH_IMAGE030
表示第一个文字分割点之前文字或者最后一个文字分割点之后文字的语义元素数量;
Figure 127420DEST_PATH_IMAGE031
表示第
Figure 113830DEST_PATH_IMAGE032
个语义在第一个文字分割点之前文字或者最后一个文字分割点之后文字出现的次数;
Figure 420178DEST_PATH_IMAGE033
表示第
Figure 517447DEST_PATH_IMAGE032
个语义的整体出现的次数。
上述技术方案的工作原理和有益效果为:本方案通过在光标跟踪定位模块内设语义分析子模块和运算子模块,对图片中框选目标区域进行图片识别和语义分析,找到可用的文字分割点,该文字分割点可能为1个,也可能存在多个,基于语义分析对文字分割点的首部和尾部进行语义判断,智能地精准确定操作人员的选定内容,排除干扰部分,初始鼠标框选目标区域为一个方形,经本方案处理后,选定区域可能在首部和尾部出现阶梯缺口,提高批注位置的准确度。
下面以某PDF文件加批注的操作实施例对本发明做进一步的说明,如图3所示,具体操作流程如下:
首先,基于tabula二次开发,在线打开一个待审批的PDF格式文件,看看该文件是否曾转化过图片,若没有则将该PDF文件每一页转化为一个图片,然后通过鼠标框选目标区域,弹出批注输入框,输入批注意见,支持反复框选目标区域和填写批注意见;若曾转化过图片,则加载图片,看图片内是否存在批注意见,若没有批注意见,可以通过鼠标框选目标区域,弹出批注输入框,根据需要输入批注意见;若存在批注意见,加载框选目标区域及对应批注意见,当鼠标点击框选目标区域的时候,批注输入框切换显示对应目标区域的批注意见,可进行编辑修改;最后对框选目标区域的坐标及对应添加或者修改的批注意见进行保存。
本发明基于tabula开源技术,对PDF格式的文档进行在线预览审核,可通过鼠标框选区域,弹出批注输入窗口,输入批注,可反复框选不同内容区域输入批注,点击任意框选的区域,批注窗口切换显示对应区域的批注,可以再次编辑批注,可以将框选区域坐标及对应批注保存下来。流程审核人能够查看对文档加的批注意见,可以点击不同的框选区域查看对应批注内容,可以再次编辑批注,也可以框选其他区域增加批注,可以将框选区域坐标及对应批注保存下来。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种给PDF文件加批注的方法,其特征在于,包括以下步骤:
S100基于tabula二次开发,在线打开PDF文件进行预览,将PDF文件的每页转化为一张图片;
S200在线预览图片,通过鼠标在图片中框选目标区域,记录框选目标区域范围并弹出批注输入框,在批注输入框内录入批注意见;
S300保存框选目标区域的坐标及对应批注意见。
2.根据权利要求1所述的给PDF文件加批注的方法,其特征在于,在线打开已批注过的PDF文件,加载框选目标区域及对应批注意见;以鼠标点击存在批注意见的框选目标区域,显示出对应目标区域的批注意见,对批注意见进行编辑并保存。
3.根据权利要求1所述的给PDF文件加批注的方法,其特征在于,在S100步骤中,将PDF文件的每页转化为一张图片的过程如下:
用机器视觉技术对PDF文件进行页面分析,设置页面标签,根据页面标签将每页转化为图片;
针对每一张图片,建立坐标系,将图片分割为多个图像碎片,标记各图像碎片的位置坐标;
将图像碎片组成一个样本序列,并进行以下处理:
首先,采用以下公式进行离散小波变换:
Figure 679577DEST_PATH_IMAGE001
上式中,
Figure 596717DEST_PATH_IMAGE002
表示样本序列的离散小波变换;
Figure 563405DEST_PATH_IMAGE003
表示尺度;
Figure 958615DEST_PATH_IMAGE004
表示变换函数;
Figure 772987DEST_PATH_IMAGE005
表示尺度函数;
Figure 533132DEST_PATH_IMAGE006
表示初始尺度因子;
Figure 800166DEST_PATH_IMAGE007
表示小波基函数;
Figure 186017DEST_PATH_IMAGE008
表示尺度因子;
Figure 854895DEST_PATH_IMAGE009
表示平移因子;
然后,获取图像碎片的碎片特征,采用以下公式计算图像碎片的似然能量:
Figure 785942DEST_PATH_IMAGE010
上式中,表示;
Figure 540272DEST_PATH_IMAGE011
表示成像平面坐标集合,
Figure 464234DEST_PATH_IMAGE012
Figure 987619DEST_PATH_IMAGE013
表示样品序列的帧数;
Figure 355147DEST_PATH_IMAGE014
表示高斯因子;
Figure 596772DEST_PATH_IMAGE015
表示时间;
Figure 82284DEST_PATH_IMAGE016
表示时刻;
Figure 725755DEST_PATH_IMAGE017
Figure 998604DEST_PATH_IMAGE018
表示
Figure 727526DEST_PATH_IMAGE016
时刻样品帧的特征点
Figure 993291DEST_PATH_IMAGE019
在成像平面的投影;
Figure 491269DEST_PATH_IMAGE020
表示
Figure 200599DEST_PATH_IMAGE021
时刻样品帧的特征点
Figure 151237DEST_PATH_IMAGE019
在成像平面的投影;
采用惩罚函数方法,通过以下公式得到的势能:
Figure 220693DEST_PATH_IMAGE022
上式中,
Figure 573177DEST_PATH_IMAGE023
表示第
Figure 453408DEST_PATH_IMAGE013
帧样品的特征点
Figure 891343DEST_PATH_IMAGE019
的势能;
Figure 311960DEST_PATH_IMAGE024
表示特征点
Figure 971480DEST_PATH_IMAGE019
的尺度函数;
Figure 84930DEST_PATH_IMAGE019
Figure 947844DEST_PATH_IMAGE025
表示第
Figure 172152DEST_PATH_IMAGE013
帧样品的两个相邻特征点;
Figure 420599DEST_PATH_IMAGE026
表示势能阈值,取值大于零;
将处理后的图像碎片按照标记的位置坐标进行拼接,恢复图片。
4.根据权利要求1所述的给PDF文件加批注的方法,其特征在于,在S200步骤中,通过鼠标在图片中框选目标区域的方式如下:
识别图片中框选目标区域的文字与标点符号,确定并关联文字和标点符号与其所在框选目标区域的位置,使用深度卷积神经网络进行深度特征学习,对文字进行语义分析;
根据语义分析,结合标点符号的位置,确定文字分割点,采用预设算法分别计算第一个文字分割点之前文字和最后一个文字分割点之后文字的语义与整体语义的相似度,若第一个文字分割点之前文字的相似度小于预设阈值,则将第一个文字分割点之前文字对应位置从框选目标区域中剔除;若最后一个文字分割点之后文字的相似度小于预设阈值,则将最后一个文字分割点之后文字对应位置从框选目标区中剔除。
5.根据权利要求4所述的给PDF文件加批注的方法,其特征在于,所述预设算法如下:
Figure 704950DEST_PATH_IMAGE027
上式中,
Figure 55160DEST_PATH_IMAGE028
表示语义的相似度;
Figure 4530DEST_PATH_IMAGE029
表示整体语义元素的数量;
Figure 717271DEST_PATH_IMAGE030
表示第一个文字分割点之前文字或者最后一个文字分割点之后文字的语义元素数量;
Figure 313469DEST_PATH_IMAGE031
表示第
Figure 744450DEST_PATH_IMAGE032
个语义在第一个文字分割点之前文字或者最后一个文字分割点之后文字出现的次数;
Figure 966353DEST_PATH_IMAGE033
表示第
Figure 799180DEST_PATH_IMAGE032
个语义的整体出现的次数。
6.一种给PDF文件加批注的应用系统,其特征在于,包括基于tabula二次开发的PDF文件识别模块、文件转换模块、光标跟踪定位模块、批注模块和保存模块;
所述PDF文件识别模块用于在线打开PDF文件进行预览;
所述文件转换模块用于将PDF文件的每页转化为一张图片;
所述光标跟踪定位模块用于在线预览图片时,通过鼠标在图片中框选目标区域,记录框选目标区域范围;
所述批注模块用于弹出批注输入框,在批注输入框内录入批注意见;
所述保存模块用于保存框选目标区域的坐标及对应批注意见。
7.根据权利要求6所述的给PDF文件加批注的应用系统,其特征在于,还包括批注修改模块,用于在线打开的已批注过的PDF文件,就加载框选目标区域及对应批注意见;以鼠标点击存在批注意见的框选目标区域,显示出对应目标区域的批注意见,对批注意见进行编辑;然后由保存模块保存编辑后的框选目标区域的坐标及对应批注意见。
8.根据权利要求6所述的给PDF文件加批注的应用系统,其特征在于,所述文件转换模块内置机器视觉子模块、页面标签子模块、图片分割子模块、图片处理子模块和拼接子模块;
所述文件转换模块将PDF文件的每页转化为一张图片的过程如下:
采用机器视觉子模块对PDF文件进行页面分析;
采用页面标签子模块对机器视觉子模块进行页面分析后的PDF文件设置页面标签;
所述文件转换模块根据页面标签将每页转化为图片;
所述图片分割子模块用于对每一张图片,建立坐标系,将图片分割为多个图像碎片,标记各图像碎片的位置坐标;
所述图片处理子模块用于将图像碎片组成一个样本序列,并进行以下处理:
首先,采用以下公式进行离散小波变换:
Figure 566279DEST_PATH_IMAGE034
上式中,
Figure 484556DEST_PATH_IMAGE002
表示样本序列的离散小波变换;
Figure 244570DEST_PATH_IMAGE003
表示尺度;
Figure 666325DEST_PATH_IMAGE004
表示变换函数;
Figure 869904DEST_PATH_IMAGE005
表示尺度函数;
Figure 9898DEST_PATH_IMAGE006
表示初始尺度因子;
Figure 839183DEST_PATH_IMAGE007
表示小波基函数;
Figure 381023DEST_PATH_IMAGE008
表示尺度因子;
Figure 755503DEST_PATH_IMAGE009
表示平移因子;
然后,获取图像碎片的碎片特征,采用以下公式计算图像碎片的似然能量:
Figure 117215DEST_PATH_IMAGE010
上式中,表示;
Figure 359977DEST_PATH_IMAGE011
表示成像平面坐标集合,
Figure 880957DEST_PATH_IMAGE012
Figure 550973DEST_PATH_IMAGE013
表示样品序列的帧数;
Figure 540926DEST_PATH_IMAGE014
表示高斯因子;
Figure 321800DEST_PATH_IMAGE015
表示时间;
Figure 962866DEST_PATH_IMAGE016
表示时刻;
Figure 803783DEST_PATH_IMAGE017
Figure 281031DEST_PATH_IMAGE018
表示
Figure 865597DEST_PATH_IMAGE016
时刻样品帧的特征点
Figure 95590DEST_PATH_IMAGE019
在成像平面的投影;
Figure 107408DEST_PATH_IMAGE020
表示
Figure 806374DEST_PATH_IMAGE021
时刻样品帧的特征点
Figure 194630DEST_PATH_IMAGE019
在成像平面的投影;
采用惩罚函数方法,通过以下公式得到的势能:
Figure 544708DEST_PATH_IMAGE035
上式中,
Figure 727428DEST_PATH_IMAGE023
表示第
Figure 38324DEST_PATH_IMAGE013
帧样品的特征点
Figure 840058DEST_PATH_IMAGE019
的势能;
Figure 920009DEST_PATH_IMAGE024
表示特征点
Figure 663843DEST_PATH_IMAGE019
的尺度函数;
Figure 462035DEST_PATH_IMAGE019
Figure 67460DEST_PATH_IMAGE025
表示第
Figure 736338DEST_PATH_IMAGE013
帧样品的两个相邻特征点;
Figure 651074DEST_PATH_IMAGE026
表示势能阈值,取值大于零;
所述拼接子模块用于将处理后的图像碎片按照标记的位置坐标进行拼接,恢复图片。
9.根据权利要求6所述的给PDF文件加批注的应用系统,其特征在于,所述光标跟踪定位模块内设语义分析子模块和运算子模块;
所述语义分析子模块用于:识别图片中框选目标区域的文字与标点符号,确定并关联文字和标点符号与其所在框选目标区域的位置,使用深度卷积神经网络进行深度特征学习,对文字进行语义分析;根据语义分析,结合标点符号的位置,确定文字分割点;
所述运算子模块内置预设算法,用于分别计算第一个文字分割点之前文字和最后一个文字分割点之后文字的语义与整体语义的相似度,并与预设阈值进行对比;
所述光标跟踪定位模块根据运算子模块的计算结果,若第一个文字分割点之前文字的相似度小于预设阈值,则将第一个文字分割点之前文字对应位置从框选目标区域中剔除;若最后一个文字分割点之后文字的相似度小于预设阈值,则将最后一个文字分割点之后文字对应位置从框选目标区中剔除。
10.根据权利要求9所述的给PDF文件加批注的应用系统,其特征在于,所述运算子模块内置的预设算法如下:
Figure 936561DEST_PATH_IMAGE036
上式中,
Figure 80098DEST_PATH_IMAGE028
表示语义的相似度;
Figure 134642DEST_PATH_IMAGE029
表示整体语义元素的数量;
Figure 220278DEST_PATH_IMAGE030
表示第一个文字分割点之前文字或者最后一个文字分割点之后文字的语义元素数量;
Figure 461904DEST_PATH_IMAGE031
表示第
Figure 533765DEST_PATH_IMAGE032
个语义在第一个文字分割点之前文字或者最后一个文字分割点之后文字出现的次数;
Figure 583760DEST_PATH_IMAGE033
表示第
Figure 450085DEST_PATH_IMAGE032
个语义的整体出现的次数。
CN202110397483.3A 2021-04-14 2021-04-14 给pdf文件加批注的方法及应用系统 Active CN112800727B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110397483.3A CN112800727B (zh) 2021-04-14 2021-04-14 给pdf文件加批注的方法及应用系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110397483.3A CN112800727B (zh) 2021-04-14 2021-04-14 给pdf文件加批注的方法及应用系统

Publications (2)

Publication Number Publication Date
CN112800727A true CN112800727A (zh) 2021-05-14
CN112800727B CN112800727B (zh) 2021-07-20

Family

ID=75816980

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110397483.3A Active CN112800727B (zh) 2021-04-14 2021-04-14 给pdf文件加批注的方法及应用系统

Country Status (1)

Country Link
CN (1) CN112800727B (zh)

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101916245A (zh) * 2010-08-30 2010-12-15 中国电信股份有限公司 一种电子阅读器上电子书批注实现方法和装置
CN102881006A (zh) * 2012-08-03 2013-01-16 吉林禹硕动漫游戏科技股份有限公司 多投影显示系统中的图像拼接与融合方法
CN102982330A (zh) * 2012-11-21 2013-03-20 新浪网技术(中国)有限公司 文字图像中字符识别方法和识别装置
US20140153842A1 (en) * 2011-07-22 2014-06-05 Thales Method for reducing noise in a sequence of fluoroscopic images by temporal and spatial filtering
CN106846303A (zh) * 2016-12-30 2017-06-13 平安科技(深圳)有限公司 图像篡改检测方法及装置
CN108776651A (zh) * 2018-06-08 2018-11-09 北京厚德思成科技有限公司 Pdf文件的批注处理方法及系统
CN109272515A (zh) * 2018-08-17 2019-01-25 西安电子科技大学 基于高阶多尺度crf无监督的sar图像分割方法
CN110363102A (zh) * 2019-06-24 2019-10-22 北京融汇金信信息技术有限公司 一种pdf文件的对象识别处理方法及装置
CN111259830A (zh) * 2020-01-19 2020-06-09 中国农业科学院农业信息研究所 一种海外农业pdf文档内容碎片化方法及系统
CN111476006A (zh) * 2020-04-13 2020-07-31 上海鸿翼软件技术股份有限公司 Pdf文件在线批注方法、装置、设备及可读存储介质
CN111932557A (zh) * 2020-08-13 2020-11-13 中国科学院重庆绿色智能技术研究院 基于集成学习和概率图模型的图像语义分割方法及装置
CN112487766A (zh) * 2020-12-10 2021-03-12 北京明略软件系统有限公司 一种文档标注方法、系统及计算机设备

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101916245A (zh) * 2010-08-30 2010-12-15 中国电信股份有限公司 一种电子阅读器上电子书批注实现方法和装置
US20140153842A1 (en) * 2011-07-22 2014-06-05 Thales Method for reducing noise in a sequence of fluoroscopic images by temporal and spatial filtering
CN102881006A (zh) * 2012-08-03 2013-01-16 吉林禹硕动漫游戏科技股份有限公司 多投影显示系统中的图像拼接与融合方法
CN102982330A (zh) * 2012-11-21 2013-03-20 新浪网技术(中国)有限公司 文字图像中字符识别方法和识别装置
CN106846303A (zh) * 2016-12-30 2017-06-13 平安科技(深圳)有限公司 图像篡改检测方法及装置
CN108776651A (zh) * 2018-06-08 2018-11-09 北京厚德思成科技有限公司 Pdf文件的批注处理方法及系统
CN109272515A (zh) * 2018-08-17 2019-01-25 西安电子科技大学 基于高阶多尺度crf无监督的sar图像分割方法
CN110363102A (zh) * 2019-06-24 2019-10-22 北京融汇金信信息技术有限公司 一种pdf文件的对象识别处理方法及装置
CN111259830A (zh) * 2020-01-19 2020-06-09 中国农业科学院农业信息研究所 一种海外农业pdf文档内容碎片化方法及系统
CN111476006A (zh) * 2020-04-13 2020-07-31 上海鸿翼软件技术股份有限公司 Pdf文件在线批注方法、装置、设备及可读存储介质
CN111932557A (zh) * 2020-08-13 2020-11-13 中国科学院重庆绿色智能技术研究院 基于集成学习和概率图模型的图像语义分割方法及装置
CN112487766A (zh) * 2020-12-10 2021-03-12 北京明略软件系统有限公司 一种文档标注方法、系统及计算机设备

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
VIVINE NURCAHYAWATI ET AL.: "Online Media as a Price Monitor:Text Analysis using Text Extraction Technique and Jaro-Winkler Similarity Algorithm", 《IEEE XPLORE》 *
李翌昕等: "文本检测算法的发展与挑战", 《信号处理》 *
栾悉道 等: "《多媒体情报处理技术》", 31 May 2016, 北京国防工业出版社 *
郝凯锋: "基于文字边缘信息的碎纸片拼接", 《企业技术开发》 *

Also Published As

Publication number Publication date
CN112800727B (zh) 2021-07-20

Similar Documents

Publication Publication Date Title
CN109670429B (zh) 一种基于实例分割的监控视频多目标人脸检测方法及系统
JP5431754B2 (ja) フォトガイドの自動生成
US6768816B2 (en) Method and system for interactive ground-truthing of document images
JP5050075B2 (ja) 画像判別方法
US8196030B1 (en) System and method for comparing and reviewing documents
JP4882486B2 (ja) スライド画像判定デバイスおよびスライド画像判定プログラム
US11024341B2 (en) Conformance of media content to original camera source using optical character recognition
CN111553923B (zh) 一种图像处理方法、电子设备及计算机可读存储介质
CN108154191B (zh) 文档图像的识别方法和系统
CN112149722A (zh) 一种基于无监督域适应的图像自动标注方法
Lu et al. Listwise view ranking for image cropping
JP2002369216A (ja) 色補正方法
JP4859054B2 (ja) 画像処理装置、画像処理方法、プログラムおよび記録媒体
CN113936764A (zh) 一种医疗报告单照片中敏感信息脱敏方法及系统
CN112800727B (zh) 给pdf文件加批注的方法及应用系统
US10366284B1 (en) Image recognition and parsing
RU2571379C2 (ru) Интеллектуальная обработка электронного документа
US11455753B1 (en) Systems and methods to process electronic images to adjust attributes of the electronic images
US20220398399A1 (en) Optical character recognition systems and methods for personal data extraction
CN115272649A (zh) 分子结构图的图像识别、检索、录入方法及系统、介质
CN113592807A (zh) 一种训练方法、图像质量确定方法及装置、电子设备
Tang et al. A Scene-Text Synthesis Engine Achieved Through Learning From Decomposed Real-World Data
Tamrin et al. Simultaneous detection of regular patterns in ancient manuscripts using GAN-Based deep unsupervised segmentation
Tsai et al. EESRGAN: Efficient & Effective Super-Resolution Generative Adversarial Network
Shelke A Tabulation method for Character Recognition using Haar wavelet in 2D images

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant