CN110399598B - 一种文档内容调整方法、装置、电子设备及可读存储介质 - Google Patents

一种文档内容调整方法、装置、电子设备及可读存储介质 Download PDF

Info

Publication number
CN110399598B
CN110399598B CN201810373390.5A CN201810373390A CN110399598B CN 110399598 B CN110399598 B CN 110399598B CN 201810373390 A CN201810373390 A CN 201810373390A CN 110399598 B CN110399598 B CN 110399598B
Authority
CN
China
Prior art keywords
picture
adjustment
content
adjusted
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810373390.5A
Other languages
English (en)
Other versions
CN110399598A (zh
Inventor
冷志峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Kingsoft Office Software Inc
Zhuhai Kingsoft Office Software Co Ltd
Guangzhou Kingsoft Mobile Technology Co Ltd
Original Assignee
Beijing Kingsoft Office Software Inc
Zhuhai Kingsoft Office Software Co Ltd
Guangzhou Kingsoft Mobile Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Kingsoft Office Software Inc, Zhuhai Kingsoft Office Software Co Ltd, Guangzhou Kingsoft Mobile Technology Co Ltd filed Critical Beijing Kingsoft Office Software Inc
Priority to CN201810373390.5A priority Critical patent/CN110399598B/zh
Publication of CN110399598A publication Critical patent/CN110399598A/zh
Application granted granted Critical
Publication of CN110399598B publication Critical patent/CN110399598B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/73Deblurring; Sharpening
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30176Document
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/43Editing text-bitmaps, e.g. alignment, spacing; Semantic analysis of bitmaps of text without OCR

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Quality & Reliability (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Processing Or Creating Images (AREA)
  • Image Analysis (AREA)

Abstract

本发明实施例提供了一种文档内容调整方法、装置、电子设备及可读存储介质。该方法包括:确定所打开的目标文档中的待调整图片;将待调整图片输入至预先构建的图片调整模型;其中,图片调整模型用于:将待调整图片调整为内容清晰的图片,得到调整图片;获得图片调整模型输出的调整图片;利用调整图片对目标文档中的待调整图片进行替换,得到修复文档。应用本发明实施例对文档内容进行调整,可以使文档中的图片内容变清晰,提高了用户的阅读体验。

Description

一种文档内容调整方法、装置、电子设备及可读存储介质
技术领域
本发明涉及文档处理技术领域,特别是涉及一种文档内容调整方法、装置、电子设备及可读存储介质。
背景技术
目前,为了工作和学习,用户常常需要阅读各种各样的文档。例如,常常需要阅读word文档、PDF(Portable Document Format,便携式文档格式)文档和PPT(PowerPoint,演示文稿)文档等文档。
这些文档中常常会存储有一些图片,而这些图片中的内容常常是扭曲的、模糊的,这就导致这些图片中的内容并不清晰。例如,图片中的房屋或文字内容是模糊的,这样,会使得用户在阅读文档中的这些图片时,无法快速了解这些图片中的内容,影响了用户的阅读体验。
发明内容
本发明实施例的目的在于提供一种文档内容调整方法、装置、电子设备及可读存储介质,以将文档中的图片内容变清晰,从而提高用户的阅读体验。具体技术方案如下:
第一方面,本发明实施例提供了一种文档内容调整方法,该方法可以包括:
确定所打开的目标文档中的待调整图片;
将待调整图片输入至预先构建的图片调整模型;其中,图片调整模型用于:将待调整图片调整为内容清晰的图片,得到调整图片;
获得图片调整模型输出的调整图片;
利用调整图片对目标文档中的待调整图片进行替换,得到修复文档。
可选地,在本发明的一种实施例中,图片调整模型可以用于:将待调整图片调整为内容清晰且内容不倾斜的图片,得到调整图片;
可选地,在将待调整图片输入至预先构建的图片调整模型的步骤之前,该方法还可以包括:
构建图片调整模型;
相应地,构建图片调整模型的步骤可以包括:
获得预设数量的训练图片;预设数量的训练图片中包括:内容不清晰的第一类图片和内容倾斜的第二类图片;
获得每一张训练图片对应的调整图片;每一张训练图片对应的调整图片为内容清晰且内容不倾斜的图片;
利用预设深度学习算法对训练样本进行训练,得到图片调整模型;其中,一个训练样本中包括:一张训练图片和该训练图片对应的调整图片。
可选地,在本发明实施例中,预设数量的训练图片中还可以包括:内容不清晰且内容倾斜的第三类图片。
可选地,在本发明实施例中,预设深度学习算法可以包括:循环神经网络算法RNN、深度神经网络算法DNN和卷积神经网络算法CNN中的任意一项。
可选地,确定所打开的目标文档中的待调整图片的步骤可以包括:
将所打开的目标文档中被用户选中并指示进行调整的图片,确定为待调整图片。
可选地,当待调整图片为包含文字内容的图片时,图片调整模型输出的调整图片中除文字内容外的背景部分为预设颜色。
第二方面,本发明实施例还提供了一种文档内容调整装置,该装置可以包括:
确定单元,用于确定所打开的目标文档中的待调整图片;
输入单元,用于将待调整图片输入至预先构建的图片调整模型;其中,图片调整模型用于:将待调整图片调整为内容清晰的图片,得到调整图片;
获得单元,用于获得图片调整模型输出的调整图片;
替换单元,用于利用调整图片对目标文档中的待调整图片进行替换,得到修复文档。
可选地,在本发明的一种实施例中,图片调整模型可以用于:将待调整图片调整为内容清晰且内容不倾斜的图片,得到调整图片;
可选地,在本发明实施例中,该装置还可以包括:构建单元;
该构建单元,用于在输入单元将待调整图片输入至预先构建的图片调整模型之前,构建图片调整模型;
相应地,该构建单元具体可以用于:
获得预设数量的训练图片;预设数量的训练图片中包括:内容不清晰的第一类图片和内容倾斜的第二类图片;
获得每一张训练图片对应的调整图片;每一张训练图片对应的调整图片为内容清晰且内容不倾斜的图片;
利用预设深度学习算法对训练样本进行训练,得到图片调整模型;其中,一个训练样本中包括:一张训练图片和该训练图片对应的调整图片。
可选地,在本发明实施例中,预设数量的训练图片中还可以包括:内容不清晰且内容倾斜的第三类图片。
可选地,在本发明实施例中,预设深度学习算法可以包括:循环神经网络算法RNN、深度神经网络算法DNN和卷积神经网络算法CNN中的任意一项。
可选地,在本发明实施例中,确定单元具体可以用于:
将所打开的目标文档中被用户选中并指示进行调整的图片,确定为待调整图片。
可选地,在本发明实施例中,当待调整图片为包含文字内容的图片时,图片调整模型输出的调整图片中除文字内容外的背景部分为预设颜色。
第三方面,本发明实施例还提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现上述任一项文档内容调整方法的方法步骤。
第四方面,本发明实施例还提供了一种可读存储介质,该可读存储介质内存储有计算机程序,计算机程序被处理器执行时实现上述任一项文档内容调整方法的方法步骤。
第五方面,本发明实施例还提供了一种包含指令的计算机程序产品,当其在电子设备上运行时,使得电子设备执行:上述任一项文档内容调整方法的方法步骤。
在本发明实施例中,可以确定所打开的目标文档中的待调整图片,然后,可以将确定得到的待调整图片输入至预先构建的图片调整模型中。由于该图片调整模型用于:将所述待调整图片调整为内容清晰的图片,得到调整图片。因而,该图片调整模型可以输出该待调整图片对应的调整图片。进而,可以获得该图片调整模型输出的调整图片,并利用该调整图片对该目标文档中该待调整图片进行替换,得到修复文档。这样,可以将目标文档中内容不清晰的图片替换为内容清晰的图片,提高了用户的阅读体验。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种文档内容调整方法的流程图;
图2为本发明实施例提供的一种文档内容调整装置的结构示意图;
图3为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了解决现有技术中存在的问题,本发明实施例提供了一种文档内容调整方法、装置、电子设备及可读存储介质
下面首先对本发明实施例提供的文档内容调整方法进行说明。
本发明实施例提供的文档内容调整方法可以应用于安装有办公软件的电子设备。该电子设备包括但并不局限于电脑和手机。
其中,办公软件包括但并不局限于:WPS(WPS software,WPS软件)办公软件、PPT(PowerPoint,演示文稿)办公软件和PDF(Portable Document Format,便携式文档格式)办公软件。
相应地,本发明实施例中的目标文档包括但并不局限于:WPS文档、PPT文档和PDF文档,当然并不局限于此。
参见图1,该方法可以包括如下步骤:
S101:确定所打开的目标文档中的待调整图片;
S102:将待调整图片输入至预先构建的图片调整模型;其中,图片调整模型用于:将待调整图片调整为内容清晰的图片,得到调整图片;
S103:获得图片调整模型输出的调整图片;
S104:利用调整图片对目标文档中的待调整图片进行替换,得到修复文档。
在本发明实施例中,可以确定所打开的目标文档中的待调整图片,然后,可以将确定得到的待调整图片输入至预先构建的图片调整模型中。由于该图片调整模型用于:将所述待调整图片调整为内容清晰的图片,得到调整图片。因而该图片调整模型可以输出该待调整图片对应的调整图片。进而,可以获得该图片调整模型输出的调整图片,并利用该调整图片对该目标文档中该待调整图片进行替换,得到修复文档。这样,可以将目标文档中内容不清晰的图片替换为内容清晰的图片,提高了用户的阅读体验。
下面以PDF文档为示例,对本发明实施例提供的文档内容调整方法进行说明。
假设电子设备中安装有PDF办公软件。那么,当通过该PDF办公软件打开有目标PDF文档时,该电子设备可以通过该目标PDF文档的文档结构,来确定该目标PDF文档的文档内容中是否存在图片对象(即图片标识)。若存在图片对象,则可以确定该目标PDF文档中存储有图片。
当确定该目标PDF文档中存储有图片时,在一种实现方式中,该电子设备可以将该目标PDF文档中的所有图片确定为待调整图片。这样,后续可以对该目标PDF文档中的所有图片进行调整,以将所有图片调整为清晰的图片。
在另一种实现方式中,该电子设备可以将该目标PDF文档中内容不清晰的图片确定为待调整图片。这样,后续可以仅对该目标PDF文档中的内容不清晰的图片进行调整,以将内容不清晰的图片调整为清晰的图片,提高图片调整速度。
在该种实现方式中,可以通过阅读该目标PDF文档的用户来确定该目标PDF文档中内容不清晰的图片。其中,在一种实现方式中,用户在看到内容不清晰的图片后,可以双击该图片。当电子设备接收到针对该图片的双击指令后,可以确定该图片为内容不清晰的图片,并将该图片确定为待调整图片。
在另一种实现方式中,用户在看到内容不清晰的图片后,可以在该图片上右键以选中该图片。并且,在右键后弹出的对话框选项中选择图片调整,以指示对该图片进行调整。那么,当电子设备接收到针对该图片的调整指令后,可以确定该图片为内容不清晰的图片,并将该图片确定为待调整图片。
当然,通过用户来确定该目标PDF文档中内容不清晰的图片的方式并不局限于以上两种方式,在此不做一一详述。
其中,图片中的任一内容存在模糊和扭曲情形之一的,则认为该图片为内容不清晰的图片。其中,图片中的内容扭曲是指:图片中的内容由于扭转而产生的变形。
在获得待调整图片后,电子设备可以将所获得的待调整图片输入至预先构建的图片调整模型中。从而,图片调整模型可以输出待调整图片对应的调整图片。其中,该调整图片是对待调整图片进行清晰化调整后所得到的图片。
其中,为了使图片调整模型能够将待调整图片调整为内容清晰的图片,得到并输出调整图片。在一种实现方式中,可以通过如下步骤构建图片调整模型:
S1:获得预设数量的训练图片;预设数量的训练图片中包括:内容不清晰的第一类图片;
S2:获得每一张训练图片对应的调整图片;每一张训练图片对应的调整图片为内容清晰的图片;
S3:利用预设深度学习算法对训练样本进行训练,得到图片调整模型;其中,一个训练样本中包括:一张训练图片和该训练图片对应的调整图片。
在该种实现方式中,可以利用内容不清晰的第一类图片作为训练图片,并且,利用一张训练图片和该训练图片对应的、内容清晰的调整图片构建一个训练样本。然后,利用预设深度学习算法对训练样本进行训练,从而可以获得图片调整模型。其中,通过该种方式训练得到的图片调整模型能够将输入该模型的待调整图片调整为内容清晰的图片。
其中,预设深度学习算法包括:循环神经网络算法RNN、深度神经网络算法DNN和卷积神经网络算法CNN中的任意一项。
举例而言,一个训练样本包括:训练图片A和训练图片A对应的调整图片a。其中,训练图片A中所记录内容为:猫在草地上玩耍,但是由于拍摄抖动等原因,训练图片A中的猫是模糊的,除猫以外的内容是清晰。调整图片a中所记录的内容也为:猫在草地上玩耍,调整图片a与训练图片A的区别在于,调整图片a中的猫是清晰的。
又例如,一个训练样本包括:训练图片B和训练图片B对应的调整图片b。其中,训练图片B中所记录内容为:一段文字,但是训练图片B中的文字发生了扭曲。调整图片b中所记录的内容也为该段文字,调整图片b与训练图片B的区别在于,调整图片b中的该段文字是清晰的,即非扭曲的。
另外,图片中的内容还常常是倾斜的,例如由于扫描原因,导致图片中的文字内容是倾斜45度角的。当文档中图片的内容存在倾斜时,会使用户难以阅读图片中的内容。为了进一步提高用户的阅读体验,即,为了使图片中倾斜的内容不影响用户阅读,在另一种实现方式中,上述步骤S1中所获得的训练样本中具体可以包括:内容不清晰的第一类图片和内容倾斜的第二类图片。并且,上述步骤S2中获得的每一张训练图片对应的调整图片具体可以为内容清晰且内容不倾斜的图片。
这样,利用预设深度学习算法对训练样本进行训练所得到的图片调整模型,能够将输入该模型的内容不清晰的图片待调整图片调整为内容清晰的图片,还能将内容倾斜的图片调整为内容不倾斜的图片,还能将内容不清晰且内容倾斜的图片调整为内容清晰且内容不倾斜的图片。
可以理解的是,由于用于训练图片调整模型的训练样本越多,则训练得到的图片调整模型的输出结果就越准确,因而可以采用尽量多的训练样本来训练图片调整模型。其中,为了提高训练得到的图片调整模型的输出结果的准确性,在又一种实现方式中,步骤S1中所获得的训练样本中还可以包括:内容不清晰且内容倾斜的第三类图片,这也是合理的。
另外,有些图片中既包含文字内容又包含背景画面,而背景画面常常会影响用户阅读图片中的文字内容。因而,为了进一步提高用户的阅读体验,当获得的训练图片既包含文字内容又包含背景画面时,获得的该训练图片对应的调整图片可以仅包含:该训练图片包含的、清晰版本的文字内容,并将该调整图片中除文字内容外的背景部分渲染为白色,这样,实现了对训练图片的去背景操作。当然,也可以将该调整图片中除文字内容外的背景部分渲染为苹果绿,当然并不局限于此。
这样,当将既包含文字内容又包含背景画面的待调整图片,输入至基于上述训练样本训练得到的图片调整模型时,该图片调整模型可以将该待调整图片中的文字内容清晰化,并将该待调整图片中除该文字内容外的背景渲染为白色,得到包含正面清晰的内容的调整图片。
进而,电子设备可以获得该图片调整模型输出的调整图片。并且,在获得调整图片后,可以利用该调整图片替换目标PDF文档中的待调整图片。这样,可以将目标PDF文档中的图片内容变正变清晰,使用户能够快速了解目标PDF文档中的内容,提高了用户的阅读体验。
其中,本发明实施例中的图片调整模型属于AI(Artificial Intelligence,人工智能)中的模型。为了减少电子设备的计算量,可以将图片调整模型可以设置在服务器中,电子设备可以通过图片调整模型接口,将待调整图片输入至该图片调整模型中进行调整,并可以通过图片调整模型接口获得图片调整模型输出的调整图片。
需要说明的是,对word文档、WPS文档和PPT文档等文档的内容调整方式可以参考上述目标PDF文档的容调整方式,在此不做详述。
以上,可以对文档中的图片内容进行调整,从而得到修复文档。由于修复文档是将原始文档中不清晰的图片内容清晰化,并对倾斜的图片内容进行矫正后所得到的文档。因而,在对修复文档进行显示时,使得用户可以阅读正面的、清晰的图片内容,提高了用户的阅读体验。
相应于上述方法实施例,参见图2,本发明实施例还提供了一种文档内容调整装置,该装置可以包括:
确定单元201,用于确定所打开的目标文档中的待调整图片;
输入单元202,用于将待调整图片输入至预先构建的图片调整模型;其中,图片调整模型用于:将待调整图片调整为内容清晰的图片,得到调整图片;
获得单元203,用于获得图片调整模型输出的调整图片;
替换单元204,用于利用调整图片对目标文档中的待调整图片进行替换,得到修复文档。
应用本发明实施例提供的装置,可以确定所打开的目标文档中的待调整图片,然后,可以将确定得到的待调整图片输入至预先构建的图片调整模型中。由于该图片调整模型用于:将所述待调整图片调整为内容清晰的图片,得到调整图片。因而该图片调整模型可以输出该待调整图片对应的调整图片。进而,可以获得该图片调整模型输出的调整图片,并利用该调整图片对该目标文档中该待调整图片进行替换,得到修复文档。这样,可以将目标文档中内容不清晰的图片替换为内容清晰的图片,提高了用户的阅读体验。
可选地,在本发明的一种实施例中,图片调整模型可以用于:将待调整图片调整为内容清晰且内容不倾斜的图片,得到调整图片;
可选地,在本发明实施例中,该装置还可以包括:构建单元;
该构建单元,用于在输入单元202将待调整图片输入至预先构建的图片调整模型之前,构建图片调整模型;
相应地,该构建单元具体可以用于:
获得预设数量的训练图片;预设数量的训练图片中包括:内容不清晰的第一类图片和内容倾斜的第二类图片;
获得每一张训练图片对应的调整图片;每一张训练图片对应的调整图片为内容清晰且内容不倾斜的图片;
利用预设深度学习算法对训练样本进行训练,得到图片调整模型;其中,一个训练样本中包括:一张训练图片和该训练图片对应的调整图片。
可选地,在本发明实施例中,预设数量的训练图片中还可以包括:内容不清晰且内容倾斜的第三类图片。
可选地,在本发明实施例中,预设深度学习算法可以包括:循环神经网络算法RNN、深度神经网络算法DNN和卷积神经网络算法CNN中的任意一项。
可选地,在本发明实施例中,确定单元201具体可以用于:
将所打开的目标文档中被用户选中并指示进行调整的图片,确定为待调整图片。
可选地,在本发明实施例中,当待调整图片为包含文字内容的图片时,图片调整模型输出的调整图片中除文字内容外的背景部分为预设颜色。
相应于上述方法实施例,本发明实施例还提供了一种电子设备,参见图3,该电子设备包括处理器301、通信接口302、存储器303和通信总线304,其中,处理器301,通信接口302,存储器303通过通信总线304完成相互间的通信,
存储器303,用于存放计算机程序;
处理器301,用于执行存储器303上所存放的程序时,实现上述任一项文档内容调整方法的方法步骤。
在本发明实施例中,电子设备可以确定所打开的目标文档中的待调整图片,然后,可以将确定得到的待调整图片输入至预先构建的图片调整模型中。由于该图片调整模型用于:将所述待调整图片调整为内容清晰的图片,得到调整图片。因而该图片调整模型可以输出该待调整图片对应的调整图片。进而,可以获得该图片调整模型输出的调整图片,并利用该调整图片对该目标文档中该待调整图片进行替换,得到修复文档。这样,可以将目标文档中内容不清晰的图片替换为内容清晰的图片,提高了用户的阅读体验。
相应于上述方法实施例,本发明实施例还提供了一种可读存储介质,该可读存储介质内存储有计算机程序,计算机程序被处理器执行时实现本发明实施例提供的任一项文档内容调整方法的方法步骤。
本发明实施例提供的可读存储介质中存储的计算机程序被电子设备的处理器执行后,电子设备可以确定所打开的目标文档中的待调整图片,然后,可以将确定得到的待调整图片输入至预先构建的图片调整模型中。由于该图片调整模型用于:将所述待调整图片调整为内容清晰的图片,得到调整图片。因而该图片调整模型可以输出该待调整图片对应的调整图片。进而,可以获得该图片调整模型输出的调整图片,并利用该调整图片对该目标文档中该待调整图片进行替换,得到修复文档。这样,可以将目标文档中内容不清晰的图片替换为内容清晰的图片,提高了用户的阅读体验。
相应于上述方法实施例,本发明实施例还提供了一种包含指令的计算机程序产品,当其在电子设备上运行时,使得电子设备执行:本发明实施例提供的任一项文档内容调整方法的方法步骤。
本发明实施例提供的包含指令的计算机程序产品,当其在电子设备上运行时,使得电子设备可以确定所打开的目标文档中的待调整图片,然后,可以将确定得到的待调整图片输入至预先构建的图片调整模型中。由于该图片调整模型用于:将所述待调整图片调整为内容清晰的图片,得到调整图片。因而该图片调整模型可以输出该待调整图片对应的调整图片。进而,可以获得该图片调整模型输出的调整图片,并利用该调整图片对该目标文档中该待调整图片进行替换,得到修复文档。这样,可以将目标文档中内容不清晰的图片替换为内容清晰的图片,提高了用户的阅读体验。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、电子设备、可读存储介质和计算机程序产品实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (4)

1.一种文档内容调整方法,其特征在于,所述方法包括:
在打开目标文档时,通过所述目标文档的文档结构确定所述目标文档的文档内容中是否存在图片对象,并在存在所述图片对象时,将所打开的目标文档中、被用户选中并指示的文字内容不清晰和/或文字内容倾斜的图片,确定为所述目标文档中的待调整图片;
将所述待调整图片输入至预先构建的图片调整模型;其中,所述图片调整模型用于:将所述待调整图片调整为文字内容清晰且文字内容不倾斜的图片,得到调整图片;
获得所述图片调整模型输出的所述调整图片,当所述待调整图片为包含文字内容的图片时,所述图片调整模型输出的所述调整图片中除所述文字内容外的背景部分为预设颜色或者所述调整图片为去除背景画面的图片;
利用所述调整图片对所述目标文档中的所述待调整图片进行替换,得到修复文档;
在所述将所述待调整图片输入至预先构建的图片调整模型的步骤之前,所述方法还包括:
构建所述图片调整模型;
所述构建所述图片调整模型的步骤,包括:
获得预设数量的训练图片;所述预设数量的训练图片中包括:文字内容不清晰的第一类图片、文字内容倾斜的第二类图片和文字内容不清晰且文字内容倾斜的第三类图片,所述训练图片包含文字内容和背景画面;
获得每一张训练图片对应的调整图片;所述每一张训练图片对应的调整图片为内容清晰且内容不倾斜的图片,所述调整图片仅包含所述训练图片中内容清晰的文字内容;
利用预设深度学习算法对训练样本进行训练,得到所述图片调整模型;其中,一个训练样本中包括:一张训练图片和该训练图片对应的调整图片;
所述预设深度学习算法包括:循环神经网络算法RNN、深度神经网络算法DNN和卷积神经网络算法CNN中的任意一项。
2.一种文档内容调整装置,其特征在于,所述装置包括:
确定单元,用于在打开目标文档时,通过所述目标文档的文档结构确定所述目标文档的文档内容中是否存在图片对象,并在存在所述图片对象时,将所打开的目标文档中、被用户选中并指示的文字内容不清晰和/或文字内容倾斜的图片,确定为所述目标文档中的待调整图片;
输入单元,用于将所述待调整图片输入至预先构建的图片调整模型;其中,所述图片调整模型用于:将所述待调整图片调整为文字内容清晰且文字内容不倾斜的图片,得到调整图片;
获得单元,用于获得所述图片调整模型输出的所述调整图片,当所述待调整图片为包含文字内容的图片时,所述图片调整模型输出的所述调整图片中除所述文字内容外的背景部分为预设颜色或者所述调整图片为去除背景画面的图片;
替换单元,用于利用所述调整图片对所述目标文档中的所述待调整图片进行替换,得到修复文档;
构建单元,用于在所述输入单元将所述待调整图片输入至预先构建的图片调整模型之前,构建所述图片调整模型;
所述构建单元具体用于:
获得预设数量的训练图片;所述预设数量的训练图片中包括:文字内容不清晰的第一类图片、文字内容倾斜的第二类图片和文字内容不清晰且文字内容倾斜的第三类图片,所述训练图片包含文字内容和背景画面;
获得每一张训练图片对应的调整图片;所述每一张训练图片对应的调整图片为内容清晰且内容不倾斜的图片,所述调整图片仅包含所述训练图片中内容清晰的文字内容;
利用预设深度学习算法对训练样本进行训练,得到所述图片调整模型;其中,一个训练样本中包括:一张训练图片和该训练图片对应的调整图片;
所述预设深度学习算法包括:循环神经网络算法RNN、深度神经网络算法DNN和卷积神经网络算法CNN中的任意一项。
3.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-2中任一所述的方法。
4.一种可读存储介质,其特征在于,所述可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-2中任一所述的方法。
CN201810373390.5A 2018-04-24 2018-04-24 一种文档内容调整方法、装置、电子设备及可读存储介质 Active CN110399598B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810373390.5A CN110399598B (zh) 2018-04-24 2018-04-24 一种文档内容调整方法、装置、电子设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810373390.5A CN110399598B (zh) 2018-04-24 2018-04-24 一种文档内容调整方法、装置、电子设备及可读存储介质

Publications (2)

Publication Number Publication Date
CN110399598A CN110399598A (zh) 2019-11-01
CN110399598B true CN110399598B (zh) 2023-12-26

Family

ID=68321933

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810373390.5A Active CN110399598B (zh) 2018-04-24 2018-04-24 一种文档内容调整方法、装置、电子设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN110399598B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110930302B (zh) * 2018-08-30 2024-03-26 珠海金山办公软件有限公司 一种图片处理方法、装置、电子设备及可读存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007194793A (ja) * 2006-01-18 2007-08-02 Fuji Xerox Co Ltd 画像形成装置
CN106952239A (zh) * 2017-03-28 2017-07-14 厦门幻世网络科技有限公司 图像生成方法和装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6863214B2 (en) * 2000-02-01 2005-03-08 Wachovia Corporation Image enabled reject repair for check processing capture

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007194793A (ja) * 2006-01-18 2007-08-02 Fuji Xerox Co Ltd 画像形成装置
CN106952239A (zh) * 2017-03-28 2017-07-14 厦门幻世网络科技有限公司 图像生成方法和装置

Also Published As

Publication number Publication date
CN110399598A (zh) 2019-11-01

Similar Documents

Publication Publication Date Title
CN110276446B (zh) 模型训练和选择推荐信息的方法和装置
CN111080528A (zh) 图像超分辨率和模型训练方法、装置、电子设备及介质
WO2021121108A1 (zh) 图像超分辨率和模型训练方法、装置、电子设备及介质
CN107451184A (zh) 页面显示方法及装置、用户设备、存储介质
CN111222368B (zh) 一种识别文档段落的方法、装置及电子设备
CN108717547A (zh) 样本数据生成方法及装置、训练模型的方法及装置
CN104575143A (zh) 信息录入方法及装置
CN110399598B (zh) 一种文档内容调整方法、装置、电子设备及可读存储介质
CN110058992B (zh) 一种文案模板效果反馈方法、装置及电子设备
CN110363189B (zh) 一种文档内容修复方法、装置、电子设备及可读存储介质
CN110633457B (zh) 一种内容替换方法、装置、电子设备及可读存储介质
US20230359827A1 (en) Representing Confidence in Natural Language Processing
CN113095067A (zh) 一种ocr错误纠正的方法、装置、电子设备及存储介质
CN116977783A (zh) 一种目标检测模型的训练方法、装置、设备及介质
CN109815445B (zh) 一种文档显示方法、装置、电子设备及可读存储介质
CN111199144B (zh) 一种文档内容涂改方法、装置、电子设备及可读存储介质
CN110674505A (zh) 一种漏洞扫描剩余时间估算方法和装置
CN114328916A (zh) 事件抽取、及其模型的训练方法,及其装置、设备和介质
CN107688948A (zh) 理赔数据处理方法、装置、计算机设备和存储介质
CN110930302B (zh) 一种图片处理方法、装置、电子设备及可读存储介质
CN114662008A (zh) 基于点击位置因素改进的ctr热门内容计算方法及装置
US20210312223A1 (en) Automated determination of textual overlap between classes for machine learning
CN110895924B (zh) 一种文档内容朗读方法、装置、电子设备及可读存储介质
CN113869344A (zh) 用于对象匹配的基于第一对象模型的第二对象模型的生成
CN114692888A (zh) 系统参数处理方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant