CN110929481A - 一种文档编辑的方法、装置、计算机存储介质及终端 - Google Patents
一种文档编辑的方法、装置、计算机存储介质及终端 Download PDFInfo
- Publication number
- CN110929481A CN110929481A CN201811095012.1A CN201811095012A CN110929481A CN 110929481 A CN110929481 A CN 110929481A CN 201811095012 A CN201811095012 A CN 201811095012A CN 110929481 A CN110929481 A CN 110929481A
- Authority
- CN
- China
- Prior art keywords
- picture
- image
- processed
- neural network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 24
- 238000003062 neural network model Methods 0.000 claims abstract description 46
- 238000006243 chemical reaction Methods 0.000 claims abstract description 24
- 238000002372 labelling Methods 0.000 claims abstract description 24
- 238000010586 diagram Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 2
- 230000001788 irregular Effects 0.000 description 2
- 239000000969 carrier Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Images
Landscapes
- Processing Or Creating Images (AREA)
- Document Processing Apparatus (AREA)
Abstract
一种文档编辑的方法、装置、计算机存储介质及终端,包括:对预设页数的便携式文档格式(PDF)文档,将每一页PDF文档分别转换为相应的样本图片;对转换获得的各样本图片,标注样本图片中包含的每一张图像的位置;以完成图像位置标注的样本图片作为训练数据,训练神经网络模型;将需要编辑的PDF文档转换为待处理图片后,通过训练完成的神经网络模型确定待处理图片中包含的图像的位置;通过确定的待处理图片中包含的图像的位置,进行PDF文档编辑。本发明实施例通过神经网络模型实现了扫描的PDF文件中的图像的自动获取,提升了文档编辑效率。
Description
技术领域
本文涉及但不限于信息编辑技术,尤指一种文档编辑的方法、装置、计算机存储介质及终端。
背景技术
便携式文档格式(PDF,Portable Document Format)文件作为小说、试题、杂志、漫画、报告等信息记录的载体,被相关工作人员广泛应用;工作人员一般将WORD或通过其他办公软件编辑的文件打印为PDF文件,或者,将打印好的纸质文件扫描为PDF文件。
当PDF文件为扫描纸质文件获得的文件时,用户将无法对PDF中包含为信息进行编辑;当扫描件中包含图像时,用户需要借助绘图软件或截屏软件对PDF文件中的图像进行截取后,复制到可编辑的文本中,影响用户的文档编辑效率。
发明内容
以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。
本发明实施例提供一种文档编辑的方法、装置、计算机存储介质及终端,能够提升文档编辑效率。
本发明实施例提供了一种文档编辑的方法,包括:
对预设页数的便携式文档格式PDF文档,将每一页PDF文档分别转换为相应的样本图片;
对转换获得的各样本图片,标注样本图片中包含的每一张图像的位置;
以完成图像位置标注的样本图片作为训练数据,训练神经网络模型;
将需要编辑的PDF文档转换为待处理图片后,通过训练完成的神经网络模型确定待处理图片中包含的图像的位置;
通过确定的待处理图片中包含的图像的位置,进行PDF文档编辑。
可选的,所述标注样本图片中包含的每一张图像的位置包括:
以像素作为标注单位,对每一张图像的以下部分或全部信息进行标注:
横向起始位置、横向终止位置、纵向起始位置和纵向终止位置。
可选的,所述神经网络模型包括:
张量流Tensor Flow模型。
可选的,所述进行PDF文档编辑包括:
根据确定的待处理图片中包含的图像的位置,裁剪所述待处理图片中的图像;
将裁剪到的图像,根据待处理图片中包含的图像的位置迁移至预先创建的PDF文档中。
另一方面,本发明实施例还提供一种文档编辑的装置,包括:转换单元、标记单元、训练单元、确定单元和处理单元;其中,
转换单元用于:对预设页数的便携式文档格式PDF文档,将每一页PDF文档分别转换为相应的样本图片;
标记单元用于:对转换获得的各样本图片,标注样本图片中包含的每一张图像的位置;
训练单元用于:以完成图像位置标注的样本图片作为训练数据,训练神经网络模型;
确定单元用于:将需要编辑的PDF文档转换为待处理图片后,通过训练完成的神经网络模型确定待处理图片中包含的图像的位置;
处理单元用于:通过确定的待处理图片中包含的图像的位置,进行PDF文档编辑。
可选的,所述标注单元具体用于:
对转换获得的各样本图片,以像素作为标注单位,对每一张图像的以下部分或全部信息进行标注:
横向起始位置、横向终止位置、纵向起始位置和纵向终止位置。
可选的,所述神经网络模型包括:
张量流Tensor Flow模型。
可选的,所述处理单元具体用于:
根据确定的待处理图片中包含的图像的位置,裁剪所述待处理图片中的图像;
将裁剪到的图像,根据待处理图片中包含的图像的位置迁移至预先创建的PDF文档中。
再一方面,本发明实施例还提供一种计算机存储介质,所述计算机存储介质中存储有计算机可执行指令,所述计算机可执行指令用于执行上述文档编辑的方法。
还一方面,本发明实施例还提供一种终端,包括:存储器和处理器;其中,
处理器被配置为执行存储器中的程序指令;
程序指令在处理器读取执行以下操作:
对预设页数的便携式文档格式PDF文档,将每一页PDF文档分别转换为相应的样本图片;
对转换获得的各样本图片,标注样本图片中包含的每一张图像的位置;
以完成图像位置标注的样本图片作为训练数据,训练神经网络模型;
将需要编辑的PDF文档转换为待处理图片后,通过训练完成的神经网络模型确定待处理图片中包含的图像的位置;
通过确定的待处理图片中包含的图像的位置,进行PDF文档编辑。
与相关技术相比,本申请技术方案包括:对预设页数的便携式文档格式PDF文档,将每一页PDF文档分别转换为相应的样本图片;对转换获得的各样本图片,标注样本图片中包含的每一张图像的位置;以完成图像位置标注的样本图片作为训练数据,训练神经网络模型;将需要编辑的PDF文档转换为待处理图片后,通过训练完成的神经网络模型确定待处理图片中包含的图像的位置;通过确定的待处理图片中包含的图像的位置,进行PDF文档编辑。本发明实施例通过神经网络模型实现了扫描的PDF文件中的图像的自动获取,提升了文档编辑效率。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
附图说明
附图用来提供对本发明技术方案的进一步理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本发明的技术方案,并不构成对本发明技术方案的限制。
图1为本发明实施例文档编辑的方法的流程图;
图2为本发明实施例文档编辑的装置的结构框图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下文中将结合附图对本发明的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。
在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行。并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1为本发明实施例文档编辑的方法的流程图,如图1所示,包括:
步骤101、对预设页数的便携式文档格式PDF文档,将每一页PDF文档分别转换为相应的样本图片;
需要说明的是,本发明实施例样本图片可以是由本领域技术人员根据各种格式图片优缺点分析确定的适用于本发明实施例的任意格式的图片。
步骤102、对转换获得的各样本图片,标注样本图片中包含的每一张图像的位置;
需要说明的是,本发明实施例标注图像位置的方法可以包括相关技术中已有的标注方法,在此不做赘述。
可选的,本发明实施例标注样本图片中包含的每一张图像的位置包括:
以像素作为标注单位,对每一张图像的以下部分或全部信息进行标注:
横向起始位置、横向终止位置、纵向起始位置和纵向终止位置。
需要说明的是,本发明实施例对图像位置进行标注包括:横向起始位置、横向终止位置、纵向起始位置和纵向终止位置确定图像所在的矩形区域,通过矩形区域确定图像位置;对于不规则图像,以图像最左端位置作为横向起始位置、最右端位置作为横向终止位置,图像最上端位置作为纵向起始位置、图像最小端位置作为纵向终止位置。
步骤103、以完成图像位置标注的样本图片作为训练数据,训练神经网络模型;
需要说明的是,本发明实施例根据训练数据进行神经网络模型训练的方法可以包括相关技术中已有的训练方法。
可选的,本发明实施例神经网络模型包括:
张量流Tensor Flow模型。
需要说明的是,Tensor Flow模型只是本发明实施例神经网络模型的一个可选实施例,其他可以适用于本发明实施例的神经网络模型均可以应用于本申请。
步骤104、将需要编辑的PDF文档转换为待处理图片后,通过训练完成的神经网络模型确定待处理图片中包含的图像的位置;
需要说明的是,本发明实施例通过训练完成的神经网络模型确定待处理图片中包含的图像的位置包括:对转换获得的待处理图片,通过训练完成的神经网络模型逐页确定每一页待处理图片中包含的图像的位置。
步骤105、通过确定的待处理图片中包含的图像的位置,进行PDF文档编辑;
需要说明的是,本发明实施例预设页数的PDF文档和所述需要编辑的PDF文档包括:以扫描方式获得的PDF文档。
可选的,本发明实施例进行PDF文档编辑包括:
根据确定的待处理图片中包含的图像的位置,裁剪所述待处理图片中的图像;
将裁剪到的图像,根据待处理图片中包含的图像的位置迁移至预先创建的PDF文档中。
需要说明的是,本发明实施例识别图像后,将裁剪获得的图像,根据确定的待处理图片中包含的图像的位置,借用相关技术中已有的编辑方式写入到新建的PDF文档中,即在保留扫描的PDF文件的排版的情况下,实现PDF文件的编辑。
与相关技术相比,本申请技术方案包括:对预设页数的便携式文档格式(PDF)文档,将每一页PDF文档分别转换为相应的样本图片;对转换获得的各样本图片,标注样本图片中包含的每一张图像的位置;以完成图像位置标注的样本图片作为训练数据,训练神经网络模型;将需要编辑的PDF文档转换为待处理图片后,通过训练完成的神经网络模型确定待处理图片中包含的图像的位置;通过确定的待处理图片中包含的图像的位置,进行PDF文档编辑。本发明实施例通过神经网络模型实现了扫描的PDF文件中的图像的自动获取,提升了文档编辑效率。
图2为本发明实施例文档编辑的装置的结构框图,如图2所示,包括:转换单元、标记单元、训练单元、确定单元和处理单元;其中,
转换单元用于:对预设页数的便携式文档格式PDF文档,将每一页PDF文档分别转换为相应的样本图片;
需要说明的是,本发明实施例样本图片可以是由本领域技术人员根据各种格式图片优缺点分析确定的适用于本发明实施例的任意格式的图片。
标记单元用于:对转换获得的各样本图片,标注样本图片中包含的每一张图像的位置;
需要说明的是,本发明实施例标注图像位置的方法可以包括相关技术中已有的标注方法,在此不做赘述。
训练单元用于:以完成图像位置标注的样本图片作为训练数据,训练神经网络模型;
需要说明的是,本发明实施例根据训练数据进行神经网络模型训练的方法可以包括相关技术中已有的训练方法。
确定单元用于:将需要编辑的PDF文档转换为待处理图片后,通过训练完成的神经网络模型确定待处理图片中包含的图像的位置;
需要说明的是,本发明实施例通过训练完成的神经网络模型确定待处理图片中包含的图像的位置包括:对转换获得的待处理图片,通过训练完成的神经网络模型逐页确定每一页待处理图片中包含的图像的位置。
处理单元用于:通过确定的待处理图片中包含的图像的位置,进行PDF文档编辑;
其中,所述预设页数的PDF文档和所述需要编辑的PDF文档包括:以扫描方式获得的PDF文档。
可选的,本发明实施例标注单元具体用于:
对转换获得的各样本图片,以像素作为标注单位,对每一张图像的以下部分或全部信息进行标注:
横向起始位置、横向终止位置、纵向起始位置和纵向终止位置。
需要说明的是,本发明实施例对图像位置进行标注包括:横向起始位置、横向终止位置、纵向起始位置和纵向终止位置确定图像所在的矩形区域,通过矩形区域确定图像位置;对于不规则图像,以图像最左端位置作为横向起始位置、最右端位置作为横向终止位置,图像最上端位置作为纵向起始位置、图像最小端位置作为纵向终止位置。
可选的,所述神经网络模型包括:
张量流Tensor Flow模型。
需要说明的是,Tensor Flow模型只是本发明实施例神经网络模型的一个可选实施例,其他可以适用于本发明实施例的神经网络模型均可以应用于本申请。
可选的,所述处理单元具体用于:
根据确定的待处理图片中包含的图像的位置,裁剪所述待处理图片中的图像;
将裁剪到的图像,根据待处理图片中包含的图像的位置迁移至预先创建的PDF文档中。
需要说明的是,本发明实施例识别图像后,将裁剪获得的图像,根据确定的待处理图片中包含的图像的位置,借用相关技术中已有的编辑方式写入到新建的PDF文档中,即在保留扫描的PDF文件的排版的情况下,实现PDF文件的编辑。
与相关技术相比,本申请技术方案包括:对预设页数的便携式文档格式(PDF)文档,将每一页PDF文档分别转换为相应的样本图片;对转换获得的各样本图片,标注样本图片中包含的每一张图像的位置;以完成图像位置标注的样本图片作为训练数据,训练神经网络模型;将需要编辑的PDF文档转换为待处理图片后,通过训练完成的神经网络模型确定待处理图片中包含的图像的位置;通过确定的待处理图片中包含的图像的位置,进行PDF文档编辑。本发明实施例通过神经网络模型实现了扫描的PDF文件中的图像的自动获取,提升了文档编辑效率。
本发明实施例还提供一种计算机存储介质,所述计算机存储介质中存储有计算机可执行指令,所述计算机可执行指令用于执行上述文档编辑的方法。
本发明实施例还提供一种终端,包括:存储器和处理器;其中,
处理器被配置为执行存储器中的程序指令;
程序指令在处理器读取执行以下操作:
对预设页数的便携式文档格式PDF文档,将每一页PDF文档分别转换为相应的样本图片;
对转换获得的各样本图片,标注样本图片中包含的每一张图像的位置;
以完成图像位置标注的样本图片作为训练数据,训练神经网络模型;
将需要编辑的PDF文档转换为待处理图片后,通过训练完成的神经网络模型确定待处理图片中包含的图像的位置;
通过确定的待处理图片中包含的图像的位置,进行PDF文档编辑。
本领域普通技术人员可以理解上述方法中的全部或部分步骤可通过程序来指令相关硬件(例如处理器)完成,所述程序可以存储于计算机可读存储介质中,如只读存储器、磁盘或光盘等。可选地,上述实施例的全部或部分步骤也可以使用一个或多个集成电路来实现。相应地,上述实施例中的每个模块/单元可以采用硬件的形式实现,例如通过集成电路来实现其相应功能,也可以采用软件功能模块的形式实现,例如通过处理器执行存储于存储器中的程序/指令来实现其相应功能。本发明不限制于任何特定形式的硬件和软件的结合。
虽然本发明所揭露的实施方式如上,但所述的内容仅为便于理解本发明而采用的实施方式,并非用以限定本发明。任何本发明所属领域内的技术人员,在不脱离本发明所揭露的精神和范围的前提下,可以在实施的形式及细节上进行任何的修改与变化,但本发明的专利保护范围,仍须以所附的权利要求书所界定的范围为准。
Claims (10)
1.一种文档编辑的方法,其特征在于,包括:
对预设页数的便携式文档格式PDF文档,将每一页PDF文档分别转换为相应的样本图片;
对转换获得的各样本图片,标注样本图片中包含的每一张图像的位置;
以完成图像位置标注的样本图片作为训练数据,训练神经网络模型;
将需要编辑的PDF文档转换为待处理图片后,通过训练完成的神经网络模型确定待处理图片中包含的图像的位置;
通过确定的待处理图片中包含的图像的位置,进行PDF文档编辑。
2.根据权利要求1所述的方法,其特征在于,所述标注样本图片中包含的每一张图像的位置包括:
以像素作为标注单位,对每一张图像的以下部分或全部信息进行标注:
横向起始位置、横向终止位置、纵向起始位置和纵向终止位置。
3.根据权利要求1所述的方法,其特征在于,所述神经网络模型包括:
张量流Tensor Flow模型。
4.根据权利要求1~3任一项所述的方法,其特征在于,所述进行PDF文档编辑包括:
根据确定的待处理图片中包含的图像的位置,裁剪所述待处理图片中的图像;
将裁剪到的图像,根据待处理图片中包含的图像的位置迁移至预先创建的PDF文档中。
5.一种文档编辑的装置,其特征在于,包括:转换单元、标记单元、训练单元、确定单元和处理单元;其中,
转换单元用于:对预设页数的便携式文档格式PDF文档,将每一页PDF文档分别转换为相应的样本图片;
标记单元用于:对转换获得的各样本图片,标注样本图片中包含的每一张图像的位置;
训练单元用于:以完成图像位置标注的样本图片作为训练数据,训练神经网络模型;
确定单元用于:将需要编辑的PDF文档转换为待处理图片后,通过训练完成的神经网络模型确定待处理图片中包含的图像的位置;
处理单元用于:通过确定的待处理图片中包含的图像的位置,进行PDF文档编辑。
6.根据权利要求5所述的装置,其特征在于,所述标注单元具体用于:
对转换获得的各样本图片,以像素作为标注单位,对每一张图像的以下部分或全部信息进行标注:
横向起始位置、横向终止位置、纵向起始位置和纵向终止位置。
7.根据权利要求5所述的装置,其特征在于,所述神经网络模型包括:
张量流Tensor Flow模型。
8.根据权利要求5~7任一项所述的装置,其特征在于,所述处理单元具体用于:
根据确定的待处理图片中包含的图像的位置,裁剪所述待处理图片中的图像;
将裁剪到的图像,根据待处理图片中包含的图像的位置迁移至预先创建的PDF文档中。
9.一种计算机存储介质,所述计算机存储介质中存储有计算机可执行指令,所述计算机可执行指令用于执行权利要求1~4中任一项所述的文档编辑的方法。
10.一种终端,包括:存储器和处理器;其中,
处理器被配置为执行存储器中的程序指令;
程序指令在处理器读取执行以下操作:
对预设页数的便携式文档格式PDF文档,将每一页PDF文档分别转换为相应的样本图片;
对转换获得的各样本图片,标注样本图片中包含的每一张图像的位置;
以完成图像位置标注的样本图片作为训练数据,训练神经网络模型;
将需要编辑的PDF文档转换为待处理图片后,通过训练完成的神经网络模型确定待处理图片中包含的图像的位置;
通过确定的待处理图片中包含的图像的位置,进行PDF文档编辑。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811095012.1A CN110929481B (zh) | 2018-09-19 | 2018-09-19 | 一种文档编辑的方法、装置、计算机存储介质及终端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811095012.1A CN110929481B (zh) | 2018-09-19 | 2018-09-19 | 一种文档编辑的方法、装置、计算机存储介质及终端 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110929481A true CN110929481A (zh) | 2020-03-27 |
CN110929481B CN110929481B (zh) | 2024-06-11 |
Family
ID=69855944
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811095012.1A Active CN110929481B (zh) | 2018-09-19 | 2018-09-19 | 一种文档编辑的方法、装置、计算机存储介质及终端 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110929481B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101751461A (zh) * | 2009-12-30 | 2010-06-23 | 中兴通讯股份有限公司 | 一种文档转换方法和装置 |
CN103679640A (zh) * | 2012-09-24 | 2014-03-26 | 福州福昕软件开发有限公司北京分公司 | 一种提高纸质文件转化成的pdf文件的清晰度的方法 |
CN107622230A (zh) * | 2017-08-30 | 2018-01-23 | 中国科学院软件研究所 | 一种基于区域识别与分割的pdf表格数据解析方法 |
CN108229397A (zh) * | 2018-01-04 | 2018-06-29 | 华南理工大学 | 基于Faster R-CNN的图像中文本检测方法 |
-
2018
- 2018-09-19 CN CN201811095012.1A patent/CN110929481B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101751461A (zh) * | 2009-12-30 | 2010-06-23 | 中兴通讯股份有限公司 | 一种文档转换方法和装置 |
CN103679640A (zh) * | 2012-09-24 | 2014-03-26 | 福州福昕软件开发有限公司北京分公司 | 一种提高纸质文件转化成的pdf文件的清晰度的方法 |
CN107622230A (zh) * | 2017-08-30 | 2018-01-23 | 中国科学院软件研究所 | 一种基于区域识别与分割的pdf表格数据解析方法 |
CN108229397A (zh) * | 2018-01-04 | 2018-06-29 | 华南理工大学 | 基于Faster R-CNN的图像中文本检测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110929481B (zh) | 2024-06-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4533273B2 (ja) | 画像処理装置及び画像処理方法、プログラム | |
US9824604B2 (en) | Creating assessment model for educational assessment system | |
US20080170785A1 (en) | Converting Text | |
JP5661663B2 (ja) | 情報抽出装置 | |
US8953228B1 (en) | Automatic assignment of note attributes using partial image recognition results | |
US20070116363A1 (en) | Image processing device, image processing method, and storage medium storing image processing program | |
CN111881904A (zh) | 板书记录方法和系统 | |
CN110941947A (zh) | 一种文档编辑的方法、装置、计算机存储介质及终端 | |
US9864750B2 (en) | Objectification with deep searchability | |
US11146705B2 (en) | Character recognition device, method of generating document file, and storage medium | |
CN111198664B (zh) | 一种文档打印的方法、装置、计算机存储介质及终端 | |
US20140211229A1 (en) | Image processing apparatus, an image processing method, and an image processing program | |
CN110929481B (zh) | 一种文档编辑的方法、装置、计算机存储介质及终端 | |
RU2571379C2 (ru) | Интеллектуальная обработка электронного документа | |
JP2019117500A (ja) | 情報処理装置 | |
JP2008158777A (ja) | 画像処理装置及び方法、コンピュータプログラム及び記憶媒体 | |
JP4143245B2 (ja) | 画像処理方法および装置並びに記憶媒体 | |
CN110795046B (zh) | 一种文档打印的方法、装置、计算机存储介质及终端 | |
JP2020053891A (ja) | 情報処理装置、情報処理方法及びプログラム | |
CN110929480A (zh) | 一种文档编辑的方法、装置、计算机存储介质及终端 | |
JP7447614B2 (ja) | 情報処理装置 | |
KR20110092414A (ko) | 개인화된 대량의 포토앨범 제작 시스템 및 방법 | |
JP2006293970A (ja) | 画像処理装置、画像処理方法、画像処理プログラム | |
JP2017195499A (ja) | 画像蓄積装置及び画像蓄積プログラム | |
CN106959940A (zh) | 一种便于文档自动化录入的文档格式及转换和识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |