CN111753850A - 文档处理方法、装置、计算机设备及计算机可读存储介质 - Google Patents
文档处理方法、装置、计算机设备及计算机可读存储介质 Download PDFInfo
- Publication number
- CN111753850A CN111753850A CN202010611500.4A CN202010611500A CN111753850A CN 111753850 A CN111753850 A CN 111753850A CN 202010611500 A CN202010611500 A CN 202010611500A CN 111753850 A CN111753850 A CN 111753850A
- Authority
- CN
- China
- Prior art keywords
- picture
- blank
- character
- standard
- area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/56—Extraction of image or video features relating to colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/51—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformation in the plane of the image
- G06T3/60—Rotation of a whole image or part thereof
- G06T3/608—Skewing or deskewing, e.g. by two-pass or three-pass rotation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/60—Analysis of geometric attributes
- G06T7/62—Analysis of geometric attributes of area, perimeter, diameter or volume
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10004—Still image; Photographic image
- G06T2207/10008—Still image; Photographic image from scanner, fax or copier
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Abstract
本发明实施例提供一种文档处理方法、装置、计算机设备及存储介质,文档处理方法包括:在至少一个图片中识别出空白图片和/或字符方向为非标准方向的待校正图片,根据用户的第一指示,将至少一个图片中的空白图片删除,和/或根据用户的第二指示,将至少一个图片中字符方向为非标准方向的图片的字符方向调整为标准方向。可以理解,本发明实施例通过在文档处理的过程中,添加删除空白图片和图片方向自动删除的功能,使得用户无需手动去对图片逐个进行处理,提升了文档处理的效率,进而提升了用户使用体验。
Description
技术领域
本申请涉及图像处理技术领域,具体涉及文档处理方法、计算机设备及计算机可读存储介质。
背景技术
图像形成设备(例如扫描仪)在生成文档的时候,由于处理过程的不确定性,导致生成的文档的页面大小、页面方向或者页面内容等杂乱无章,需要用户自己整理。尤其是双面扫描生成的页面,有些有内容,而有些是无内容或者内容较少的空白页。
现有的文档阅读器仅提供文档的打开、编辑等功能,不能直接对图片中空白页、方向进行自动识别和校正,难以提供较为便捷的用户体验。
发明内容
本申请实施例提供一种文档处理方法、计算机设备及存储介质,能够在文档处理的过程中,增加删除空白图片和图片方向自动旋转的功能,使得用户无需手动去对图片逐个进行处理,提升了文档处理的效率,进而提升了用户使用体验。
第一方面,本申请实施例提供一种文档处理方法,包括:
识别所述至少一个图片中是否有空白区域的面积所占总面积的比值大于第一预设值的图片,以及识别所述至少一个图片中是否有字符方向为非标准方向的图片;
如果所述至少一个图片中有空白区域的面积所占总面积的比值大于所述第一预设值的图片,则将空白区域的面积所占总面积的比值大于所述第一预设值的图片确定为空白图片,如果所述至少一个图片中有字符方向为非标准方向的图片,则将字符方向为非标准方向的图片确定为待校正图片;
根据用户的第一指示,将所述空白图片删除,和/或根据用户的第二指示,将所述待校正图片的字符方向调整为标准方向
可以理解,本发明实施例通过在文档处理的过程中,添加删除空白图片和图片方向自动删除的功能,使得用户无需手动去对图片逐个进行处理,提升了文档处理的效率,进而提升了用户使用体验。同时,本发明实施例通过预先对待处理文档进行预处理,即预先识别出空白图片和方向不对的待校正图片,当用户有需求的时候再执行方向校正和去除空白页,能够更加快速完成方向校正和去除空白页的操作,提高用户体验。
结合第一方面,在一种可行的实现方式中,在所述将字符方向为非标准方向的图片确定为待校正图片之后,所述方法还包括:
确定用于将每个所述待校正图片的字符方向调整为标准方向的调整参数;
所述根据用户的第二指示,将所述至少一个图片中字符方向为非标准方向的图片的字符方向调整为标准方向,包括:
基于用户的所述第二指示,根据每个待校正图片对应的调整参数将每个待校正图片的字符方向调整为标准方向。
结合第一方面,在一种可行的实现方式中,在所述识别所述至少一个图片中是否有空白区域的面积所占总面积的比值大于第一预设值的图片,以及识别所述至少一个图片中是否有字符方向为非标准方向的图片之前,所述方法还包括:
获取待处理文档,将所述待处理文档的各个页面分别转化为图片,获得所述至少一个图片。
结合第一方面,在一种可行的实现方式中,所述识别所述图片的空白区域的面积所占总面积的比值是否大于第一预设值,包括:
确定所述图片中像素值对应预定颜色的第一像素点的数量,当所述第一像素点的数量与所述图片像素点的总数量之间的比值大于第二预设值时,确定所述图片的空白区域的面积所占总面积的比值大于所述第一预设值,其中,所述预定颜色为空白内容对应的颜色。
可以理解,通过确定图片中有空白区域的面积所占总面积的比值确定该图片是否为空白图片,实际使用中,图片常常会出现污渍等情况,通过上述对空白页的检测方式,能够增加对空白页检测的灵活性和准确性。
结合第一方面,在一种可行的实现方式中,所述识别所述图片中的字符方向是否为非标准方向,包括:
采用光学字符识别技术,提取所述图片中字符方向特征,如果图片中字符方向特征对应的方向为正向时,确定所述图片中的字符方向为标准方向,如果图片中字符方向特征对应的方向为非正向时,确定所述图片中的字符方向为非标准方向。
可以理解,通过采用光学字符识别技术实现对字符方向的识别,简单有效,无需额外设计识别图片方向的方案,可靠性高。
第二方面,本申请实施例提供了一种文档处理装置,包括:
第一识别模块,被配置为识别所述至少一个图片中是否有空白区域的面积所占总面积的比值大于第一预设值的图片,以及识别所述至少一个图片中是否有字符方向为非标准方向的图片;
第一确定模块,被配置为如果所述至少一个图片中有空白区域的面积所占总面积的比值大于所述第一预设值的图片,则将空白区域的面积所占总面积的比值大于所述第一预设值的图片确定为空白图片,如果所述至少一个图片中有字符方向为非标准方向的图片,则将字符方向为非标准方向的图片确定为待校正图片;及
第一处理模块,被配置为根据用户的第一指示,将所述空白图片删除,和/或根据用户的第二指示,将所述待校正图片的字符方向调整为标准方向。
结合第二方面,在一种可行的实现方式中,所述装置还包括:
第二确定模块,被配置为确定用于将每个所述待校正图片的字符方向调整为标准方向的调整参数;
所述第一处理模块,包括:
第一调整单元,被配置为基于用户的所述第二指示,根据每个待校正图片对应的调整参数将每个待校正图片的字符方向调整为标准方向。
结合第一方面,在一种可行的实现方式中,所述装置还包括:
第二处理模块,被配置为获取待处理文档,将所述待处理文档的各个页面分别转化为图片,获得所述至少一个图片。
结合第一方面,在一种可行的实现方式中,所述第一识别模块包括:
第一确定单元,被配置为确定所述图片中像素值对应预定颜色的第一像素点的数量,当所述第一像素点的数量与所述图片像素点的总数量之间的比值大于第二预设值时,确定所述图片的空白区域的面积所占总面积的比值大于所述第一预设值,其中,所述预定颜色为空白内容对应的颜色。
结合第一方面,在一种可行的实现方式中,所述第一识别模块包括:
第二确定单元,被配置为采用光学字符识别技术,提取所述图片中字符方向特征,如果图片中字符方向特征对应的方向为正向时,确定所述图片中的字符方向为标准方向,如果图片中字符方向特征对应的方向为非正向时,确定所述图片中的字符方向为非标准方向。
第三方面,本申请实施例提供了一种计算机设备,所述计算机设备包括存储器、处理器、触摸传感器及显示屏,所述存储器中存储有计算机程序,所述处理器与所述存储器连接,所述处理器执行计算机程序以实现第一方面或者第一方面任一可行的实现方式中的方法的指令。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质包括计算机指令,当所述计算机指令在计算机设备上运行时,使得所述计算机设备执行第一方面或者第一方面任一可行的实现方式中的方法的指令。
第五方面,本申请实施例提供了一种计算机程序产品,当所述计算机程序产品在计算机上运行时,使得所述计算机执行如第一方面或者第一方面任一可行的实现方式中的方法的指令。
可以理解,本发明实施例通过在文档处理的过程中,添加删除空白图片和图片方向自动删除的功能,使得用户无需手动去对图片逐个进行处理,提升了文档处理的效率,进而提升了用户使用体验。同时,本发明实施例通过预先对待处理文档进行预处理,即预先识别出空白图片和方向不对的待校正图片,当用户有需求的时候再执行方向校正和去除空白页,能够更加快速完成方向校正和去除空白页的操作,提高用户体验。
附图说明
图1为本发明一个实施例的提供的一种文档处理方法的流程图;
图2为本发明一个实施例提供的文档处理方法相关的四种字符方向的示意图;
图3为本发明一个实施例提供的文档处理方法相关的文档阅读软件的界面示意图;
图4为本发明一个实施例提供的文档处理方法相关的文档阅读软件的又一界面示意图;
图5为本发明又一个实施例的文档处理方法的中间过程流程图;
图6为本发明又一个实施例的文档处理方法的又一中间过程流程图;
图7为本发明一个实施例提供的文档处理方法相关的文档阅读软件的又一界面示意图;
图8为本发明一个实施例提供的文档处理方法相关的文档阅读软件的又一界面示意图;
图9为本发明一个实施例提供的文档处理方法相关的文档阅读软件的又一界面示意图;
图10为本发明一个实施例的提供的一种文档处理方法的又一流程图;
图11为本发明一个实施例的一种文档处理装置的结构示意图;
图12为本发明一个实施例的一种计算机设备的结构示意图。
具体实施方式
为了更好的理解本发明的技术方案,下面结合附图对本申请实施例进行详细描述。
应当明确,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
本申请中,“至少一个”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B的情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指的这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b,或c中的至少一项(个),可以表示:a,b,c,a-b,a-c,b-c,或a-b-c,其中a,b,c可以是单个,也可以是多个。
本发明实施例可以应用于用户设备对文档进行处理的场景,与现有技术相比,本发明实施例提供的文档处理方法,能够为用户提供自动校正图片方向和自动去除空白页的功能,能够快速完成对文档的处理操作,提升用户使用体验。
其中,用户设备(User Equipment,UE),又称终端设备或者客户端,是一种向用户提供语音和/或数据连通性的设备。例如,具有无线连接功能的手持式设备、车载设备等。常见的用户设备包括例如:手机、台式电脑、平板电脑、笔记本电脑、掌上电脑、移动互联网设备(mobile internet device,MID)等。
图1为本发明一个实施例提供的文档处理方法的流程图。
请参阅附图1,本发明实施例提供的一种文档处理方法,包括:
步骤S102:识别至少一个图片中是否有空白区域的面积所占总面积的比值大于第一预设值的图片,以及识别至少一个图片中是否有字符方向为非标准方向的图片;
步骤S103:如果至少一个图片中有空白区域的面积所占总面积的比值大于第一预设值的图片,则将空白区域的面积所占总面积的比值大于第一预设值的图片确定为空白图片,如果至少一个图片中有字符方向为非标准方向的图片,则将字符方向为非标准方向的图片确定为待校正图片,以及确定将每个待校正图片的字符方向调整为标准方向的调整参数;
步骤S104:根据用户的第一指示,将空白图片删除,和/或根据用户的第二指示,基于每个待校正图片对应的调整参数将待校正图片的字符方向调整为标准方向。
可以理解,本发明实施例通过在文档处理的过程中,添加删除空白图片和图片方向自动删除的功能,使得用户无需手动去对图片逐个进行处理,提升了文档处理的效率,进而提升了用户使用体验。同时,本发明实施例通过预先对待处理文档进行预处理,即预先识别出空白图片和方向不对的待校正图片,当用户有需求的时候再执行方向校正和去除空白页,能够更加快速完成方向校正和去除空白页的操作,提高用户体验。
下面对本发明实施例提供的文档处理方法实现过程进行进一步说明。
请继续参阅图1,在一种可选的实施方式中,在步骤S104之前,文档处理方法还可以包括:
步骤S101:获取待处理文档,将待处理文档的各个页面分别转化为图片,获得至少一个图片。
应当知道,步骤S101~步骤S103为对图片进行预处理的过程,其中,待处理文档可以来源于图像形成装置,也可以来源于其它计算机设备(例如通过其它终端设备发送过来的待处理文档),也可以来源于应用软件(例如通过通讯类的应用程序接收的待处理文档),当然,本发明不限于此。
其中,图像形成装置表示在例如打印纸的记录介质上打印例如由计算机产生的打印数据的装置。图像形成装置的例子包括但不限于复印机、打印机、传真机、扫描仪以及在单个设备中执行以上功能的多功能外设。图像形成装置如打印机可以支持网线连接、WI-FI连接及/或USB连接等。
待处理文档可以是但不限于PDF(Portable Document Format,便携式文档格式)文档、OFD(Orofaciodigital Document Format,便携式文档格式)文档等等,在本发明实施例中,当用户设备使用文档阅读软件打开待处理文档时,文档阅读软件会将待处理文档每一页转换为图片格式,例如,如果待处理文档的页面数量为10页,则将处理文档的页面转化为10张图片。
还应当知道,步骤S101可以是非必要的,在本发明一些实施例中,如果待处理文档中页面的格式本就为图片格式,则不需要进行将待处理文档的各个页面分别转化为图片的操作。
针对步骤S102,识别至少一个图片中是否有空白区域的面积所占总面积的比值大于第一预设值的图片,以及识别至少一个图片中是否有字符方向为非标准方向的图片;
需要理解,本发明实施例中提到的空白图片并非必须为完全没有任何内容的空白图片,在本发明实施例中,如果图片中空白区域的面积所占总面积的比值大于第一预设值时,用户设备认为该图片为空白图片,并对该图片进行标记处理。
其中,进行空白图片的识别和进行字符方向为非标准方向的图片的识别可以同时实现,可以先识别空白图片,再识别字符方向为非标准方向的图片,或者先识别字符方向为非标准方向的图片,再识别空白图片,本发明对此不做限定。
在本发明一个或者多个实施例中,识别图片的空白区域的面积所占总面积的比值是否大于第一预设值,可以包括:确定图片中像素值对应预定颜色的第一像素点的数量,当第一像素点的数量与图片像素点的总数量之间的比值大于第二预设值时,确定图片的空白区域的面积所占总面积的比值大于第一预设值,其中,预定颜色为空白内容对应的颜色,预定颜色的例子可以为白色以及与白色相近的颜色。
如果确定图片为空白图片,则对该图片进行标记,并存储标记结果。本发明实施例可以根据图片对应的页面的页码依次对空白图片进行检测,当检测到第一张空白图片时,可以标记为空白图片1,当检测到第二张空白图片时,可以标记为空白图片2,以此类推,本发明不一一赘述。
在本发明一个或者多个实施例中,识别图片中的字符方向是否为非标准方向,可以包括:采用光学字符识别技术(OCR,Optical Character Recognition),提取图片中字符方向特征,如果图片中字符方向特征对应的方向为正向时,确定图片中的字符方向为标准方向,如果图片中字符方向特征对应的方向为非正向时,确定图片中的字符方向为非标准方向。
具体地,在本发明实施例中,字符方向为0度时为标准方向(即正向),除0度以外的其它三种取向均为非标准方向,其中,字符方向大于或者等于0度,且小于360度。
图2示出了本发明一个实施例提供的文档处理方法相关的四种字符方向的示意图;
本发明实施例中,字符方向包括但不限于0度、90度、180度和270度四种,以字符“A”为例,从左到右分别示出了字符“A”对应方向为90度、270度、180度和0度的方向示意图。
当用户设备通过文档阅读软件采用光学字符识别技术识别带有字符的图片的字符方向后,如果字符方向为非标准方向,则将字符方向为非标准方向的图片标记为待校正图片,并且根据字符方向与标准方向的度数的差值确定调整参数,调整参数用于将图片调整为标准方向,调整参数的例子可以是待校正图片需要旋转的角度。
其中,用户设备可以根据图片对应的页面的页码的顺序,对待校正图片进行识别和标记,并保存标记结果,例如,当检测到第一张待校正图片时,可以标记为待校正图片1,当检测到第二张待校正图片时,可以标记为待校正图片2,以此类推,本发明不一一赘述。
在本发明实施例中,步骤S101~步骤S103(预处理过程)可以在用户设备通过文档阅读软件打开文档时开始处理。需要知道的是,本发明提供的文档处理方法尤其适用于国产操作系统(例如,中标麒麟、中科方德等);这些操作系统运行速度较慢,而且提供的OCR算法本身也比较慢。如果不提前预处理,待用户选择“删除空白页”或者“自动旋转”的选项时,会让用户等待交久的时间,比如,一份50页的文档需要处理完成可能需要10分钟,应用用户体验,甚至可能让用户误以为死机,而经过预处理之后可能就只需要3分钟。基于上述,可以理解,通过对待处理文档进行预处理,待用户需要时执行方向校正和去除空白页,能够更加快速完成方向校正和去除空白页的操作,提高用户体验。
进行预处理之后,用户设备可以根据用户的指示,生成对应的指示信息,具体地,在本发明实施例中,用户的第一指示具体可以为:用户选定“去除空白”的选项,用户的第二指示具体可以为:用户选定“自动旋转”的选项;当对待处理文档进行预处理之后,如果用户选定“自动旋转”的选项,则将至少一个图片中字符方向为非标准方向的图片的字符方向调整为标准方向;如果用户选定“去除空白”的选项,则将至少一个图片中的空白图片删除。
需要说明的是,用户选定“去除空白”的选项可以是用户通过文档阅读软件打开待处理文档后选定,也可以是预先选定,其中,用户通过文档阅读软件打开待处理文档后选定的例子可以是:用户通过文档阅读软件打开待处理文档以及对待处理文档进行预处理之后,用户对文档阅读软件的界面所展示的“去除空白”的选项进行选定操作,用户设备根据用户的选定操作,将至少一个图片中的空白图片删除。预先选定的例子可以是:用户预先将“去除空白”设定为默认,用户通过文档阅读软件打开待处理文档以及对待处理文档进行预处理之后,根据用户的默认设置自动将至少一个图片中的空白图片删除。
同样地,用户选定“自动旋转”的选项可以是用户通过文档阅读软件打开待处理文档后选定,也可以是预先选定,其中,用户通过文档阅读软件打开待处理文档后选定的例子可以是:用户通过文档阅读软件打开待处理文档以及对待处理文档进行预处理之后,用户对文档阅读软件的界面所展示的“自动旋转”的选项进行选定操作,用户设备根据用户的选定操作,将至少一个图片中字符方向为非标准方向的图片的字符方向调整为标准方向。预先选定的例子可以是:用户预先将“自动旋转”设定为默认,用户通过文档阅读软件打开待处理文档以及对待处理文档进行预处理之后,根据用户的默认设置自动将至少一个图片中字符方向为非标准方向的图片的字符方向调整为标准方向。
在本发明实施例中,对至少一个图片进行处理还可以包括:根据用户的指示对用户选定的图片进行删除,和/或根据用户的指示对在至少一个图片中插入指定图片。
下面对本发明实施例提供的文档处理方法具体实现过程进行示例性说明。
本发明实施例提供的文档处理方法具体实现过程,可以包括:
步骤一:如图3所示,在用户设备(例如电脑)上安装文档阅读软件,打开该文档阅读软件:
在其它实施方式中,也可以不直接打开该文档阅读软件,通过打开待处理文档启动文档阅读软件。
步骤二:如图4所示,通过该文档阅读软件打开待处理文档,待处理文档例如PDF文档、OFD文档等。
其中,示例性地,图4中的“2.pdf页1”中对应的文字方向为非标准方向,具体为90度。
步骤三:对待处理文档进行预处理;
应当知道,对待处理文档进行预处理可以与步骤二同步开始进行,也可以在步骤而之后进行,在本实施例中,为了进一步节约时间,对待处理文档进行预处理可以与步骤二同步开始进行,即,当通过文档阅读软件打开待处理文档的同时,开始对待处理文档进行预处理。
在本发明实施例中,对待处理文档进行预处理,包括:
步骤S201:将待处理文档的各个页面转化为图片,以得到待处理文档对应的至少一个图片;
步骤S202:检测得到的至少一个图片中每个图片是否为空白图片,如果是,则将空白图片进行标记;
步骤S203:检测得到的至少一个图片中具有字符的图片是否为非标准图片,如果是,则将非标准图片标记为待校正图片,并标记需要旋转的角度。
其中,步骤S202和步骤S203可以同步进行,也可以分先后进行,本发明对此不做限定。
如图5所示,步骤S202:检测得到的至少一个图片中每个图片是否为空白图片的过程可以包括:
步骤S2021:解析(下)一张图片,进入步骤S2022;
步骤S2022:判断该图片是否为空白,如果是,进入步骤S2023,如果否,进入步骤S2024;
步骤S2023:标记该图片为空白图片,进入步骤S2024;
步骤S2024:判断待处理文档对应的所有图片是否已解析完毕,如果是,则处理过程结束,如果否,则返回至步骤S2021:解析下一张图片。
其中,检测图片是否为空白图片的具体过程可以参见上文,此处不再重复说明。
如图6所示,步骤S203:检测得到的至少一个图片中具有字符的图片是否为非标准图片,如果是,则将非标准图片标记为待校正图片,并标记需要旋转的角度的过程可以包括:
步骤S2031:解析(下)一张图片,进入步骤S2032;
步骤S2032:判断该图片中是否包含有字符,如果是,进入步骤S2033,如果否,进入步骤S2035;
步骤S2033:判断该图片中的字符是否为非标准方向,如果是,进入步骤S2034,如果否,进入步骤S2035;
步骤S2034:标记该图片为待校正图片,以及标记该图片需要旋转的角度;
步骤S2035:判断待处理文档对应的所有图片是否已解析完毕,如果是,则处理过程结束,如果否,则返回至步骤S2031:解析下一张图片。
其中,检测图片是否为包含有字符以及字符是否为非标准方向采用OCR处理技术,具体过程可以参见上文,此处不再重复说明。
步骤四:生成所有图片的缩略图预览;其中,步骤四可以是非必要的。
步骤五:如果用户勾选了“去除空白”,则将标记的所有空白图片删除,如果用户勾选了“自动旋转”,则将标记的所有待校正图片旋转至标准方向。
如图7所示,该待处理文件共有8页,8页对应8张图片,其中,第2,3,5,6张为空白图片,如图8所示,用户勾选了“去除空白”,将标记的第2,3,5,6张空白图片删除,只剩下第1,4,7,8四张。
如图9所示,本发明实施例中提供的文档阅读软件还包括“插入”选项和“删除”选项。
其中,“插入”选项用于根据用户指示插入新的图片,一个文档通常具有多页,在图像形成装置的扫描过程中,很有可能会漏扫描其中某一页,或者需要更换一个文档中的其中一页,因此这样可以通过“插入”功能,插入指定图片到文档的指定位置。
在一种具体实现过程中,经过预处理后,用户设备会记录每张图片的属性(包括但不限于对应的页面的页码、所属文件标识、是否空白、需要旋转的角度等),示例性地,用户将鼠标放在指定图片位置,点击插入,就可以给新的图片在当前图片的页码基础上,重新编号。
其中,“删除”选项用于根据用户指示删除用户选中的一个或者多个图片,例如,图像形成装置在双面扫描的时候,有些文档背面会有手动笔记的无用图片(或者脏污页面),这样就可以通过“删除”选项直接删除掉。
具体实现中,用户可以先选定需要删除的N个第一图片,然后点击或者勾选“删除”选项,从而实现将N个第一图片删除。
基于上述,如图10所示,作为一种示例,通过本发明实施例提供的文档阅读软件对待处理文档进行文档处理,可以包括:
步骤S301:基于用户操作打开待处理文档,将待处理文档的各个页面分别转化为图片,获得至少一个图片,以及对至少一个图片进行预处理,确定并标记空白图片和待校正图片;进入步骤S302或者步骤S303或者步骤S304或者步骤S305;
步骤S302:判断是否接收到删除指令,如果是,进入步骤S306;
步骤S303:判断是否接收到插入指令,如果是,进入步骤S307;
步骤S304:判断是否接收到移除空白页的指令,如果是,进入步骤S308;
步骤S305:判断是否接收到旋转指令,如果是,进入步骤S309;
步骤S306:根据删除指令确定需要删除的图片,将需要删除的图片删除,结束本次流程;
步骤S307:根据插入指令确定需要插入的图片和指定的插入位置,在指定的插入位置插入需要插入的图片,结束本次流程;
步骤S308:根据移除空白页的指令去除标记的空白图片;
步骤S309:根据旋转指令将每个待校正图片的字符方向调整为标准方向。
步骤六:保存处理后的文档,将处理后的文档中的图片再分别转化为PDF格式或者OFD格式或者其它格式。
进一步地,本发明实施例提供的文档阅读软件还可以实现将多个文档(例如PDF文档)中的任一一个页面进行“复制”和“粘贴”,组合成新的文档。
请参阅图11,本发明实施例还提供一种文档处理装置400,包括:
第一识别模块410,被配置为识别至少一个图片中是否有空白区域的面积所占总面积的比值大于第一预设值的图片,以及识别至少一个图片中是否有字符方向为非标准方向的图片;
第一确定模块420,被配置为如果至少一个图片中有空白区域的面积所占总面积的比值大于第一预设值的图片,则将空白区域的面积所占总面积的比值大于第一预设值的图片确定为空白图片,如果至少一个图片中有字符方向为非标准方向的图片,则将字符方向为非标准方向的图片确定为待校正图片;及
第一处理模块430,被配置为根据用户的第一指示,将空白图片删除,和/或根据用户的第二指示,将待校正图片的字符方向调整为标准方向。
在一种可选的实施方式中,文档处理装置400还包括:
第二确定模块,被配置为确定用于将每个待校正图片的字符方向调整为标准方向的调整参数;
第一处理模块,包括:
第一调整单元,被配置为基于用户的第二指示,根据每个待校正图片对应的调整参数将每个待校正图片的字符方向调整为标准方向。
在一种可选的实施方式中,文档处理装置400还包括:
第二处理模块,被配置为获取待处理文档,将待处理文档的各个页面分别转化为图片,获得至少一个图片。
在一种可选的实施方式中,第一识别模块410块包括:
第一确定单元,被配置为确定图片中像素值对应预定颜色的第一像素点的数量,当第一像素点的数量与图片像素点的总数量之间的比值大于第二预设值时,确定图片的空白区域的面积所占总面积的比值大于第一预设值,其中,预定颜色为空白内容对应的颜色。
在一种可选的实施方式中,第一识别模块410包括:
第二确定单元,采用光学字符识别技术,提取图片中字符方向特征,如果图片中字符方向特征对应的方向为正向时,确定图片中的字符方向为标准方向,如果图片中字符方向特征对应的方向为非正向时,确定图片中的字符方向为非标准方向。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行本发明任一个或多个实施例中的文档处理方法,为避免重复,此处不一一赘述。
本发明实施例还提供了一种计算机程序产品,当计算机程序产品在计算机上运行时,使得计算机执行如本发明任一个或多个实施例中的文档处理方法的步骤,为避免重复,此处不一一赘述。
请参阅图12,本发明实施例还提供了一种计算机设备50,该实施例的计算机设备50包括:处理器51、存储器52以及存储在存储器52中并可在处理器51上运行的计算机程序53,该计算机程序53被处理器51执行时实现实施例中的文档处理方法,为避免重复,此处不一一赘述。或者,该计算机程序被处理器51执行时实现实施例中文档处理装置400中各模型/单元的功能,为避免重复,此处不一一赘述。
计算机设备50可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。计算机设备50可包括但不仅限于处理器51、存储器52。本领域技术人员可以理解,图12仅仅是计算机设备50的示例,并不构成对计算机设备50的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如计算机设备还可以包括输入输出设备、网络接入设备、总线等。
所称处理器51可以是中央处理单元(Central Processing Unit,CPU),还可以是其它通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器52可以是计算机设备50的内部存储单元,例如计算机设备50的硬盘或内存。存储器52也可以是计算机设备50的外部存储设备,例如计算机设备50上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,存储器52还可以既包括计算机设备50的内部存储单元也包括外部存储设备。存储器52用于存储计算机程序以及计算机设备所需的其它程序和数据。存储器52还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机装置(可以是个人计算机,服务器,或者网络装置等)或处理器(Processor)执行本发明各个实施例方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的计算机设备、计算机可读存储介质和计算机程序产品的具体工作过程及原理,可以参考前述联动开关机电路实施例中的对应内容,在此不再赘述。
以上,仅为本申请的具体实施方式,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。本申请的保护范围应以权利要求的保护范围为准。
Claims (13)
1.一种文档处理方法,其特征在于,所述方法包括:
识别所述至少一个图片中是否有空白区域的面积所占总面积的比值大于第一预设值的图片,以及识别所述至少一个图片中是否有字符方向为非标准方向的图片;
如果所述至少一个图片中有空白区域的面积所占总面积的比值大于所述第一预设值的图片,则将空白区域的面积所占总面积的比值大于所述第一预设值的图片确定为空白图片,如果所述至少一个图片中有字符方向为非标准方向的图片,则将字符方向为非标准方向的图片确定为待校正图片;
根据用户的第一指示,将所述空白图片删除,和/或根据用户的第二指示,将所述待校正图片的字符方向调整为标准方向。
2.根据权利要求1所述的文档处理方法,其特征在于,在所述将字符方向为非标准方向的图片确定为待校正图片之后,所述方法还包括:
确定用于将每个所述待校正图片的字符方向调整为标准方向的调整参数;
所述根据用户的第二指示,将所述至少一个图片中字符方向为非标准方向的图片的字符方向调整为标准方向,包括:
根据用户的所述第二指示,基于每个待校正图片对应的调整参数将每个待校正图片的字符方向调整为标准方向。
3.根据权利要求1所述的文档处理方法,其特征在于,在所述识别所述至少一个图片中是否有空白区域的面积所占总面积的比值大于第一预设值的图片,以及识别所述至少一个图片中是否有字符方向为非标准方向的图片之前,所述方法还包括:
获取待处理文档,将所述待处理文档的各个页面分别转化为图片,获得所述至少一个图片。
4.根据权利要求1所述的文档处理方法,其特征在于,所述识别所述图片的空白区域的面积所占总面积的比值是否大于第一预设值,包括:
确定所述图片中像素值对应预定颜色的第一像素点的数量,当所述第一像素点的数量与所述图片像素点的总数量之间的比值大于第二预设值时,确定所述图片的空白区域的面积所占总面积的比值大于所述第一预设值,其中,所述预定颜色为空白内容对应的颜色。
5.根据权利要求1所述的文档处理方法,其特征在于,所述识别所述图片中的字符方向是否为非标准方向,包括:
采用光学字符识别技术,提取所述图片中字符方向特征,如果图片中字符方向特征对应的方向为正向时,确定所述图片中的字符方向为标准方向,如果图片中字符方向特征对应的方向为非正向时,确定所述图片中的字符方向为非标准方向。
6.一种文档处理装置,其特征在于,包括:
第一识别模块,被配置为识别所述至少一个图片中是否有空白区域的面积所占总面积的比值大于第一预设值的图片,以及识别所述至少一个图片中是否有字符方向为非标准方向的图片;
第一确定模块,被配置为如果所述至少一个图片中有空白区域的面积所占总面积的比值大于所述第一预设值的图片,则将空白区域的面积所占总面积的比值大于所述第一预设值的图片确定为空白图片,如果所述至少一个图片中有字符方向为非标准方向的图片,则将字符方向为非标准方向的图片确定为待校正图片;及
第一处理模块,被配置为根据用户的第一指示,将所述空白图片删除,和/或根据用户的第二指示,将所述待校正图片的字符方向调整为标准方向。
7.根据权利要求6所述的文档处理装置,其特征在于,所述装置还包括:
第二确定模块,被配置为确定用于将每个所述待校正图片的字符方向调整为标准方向的调整参数;
所述第一处理模块,包括:
第一调整单元,被配置为基于用户的所述第二指示,根据每个待校正图片对应的调整参数将每个待校正图片的字符方向调整为标准方向。
8.根据权利要求6所述的文档处理装置,其特征在于,所述装置还包括:
第二处理模块,被配置为获取待处理文档,将所述待处理文档的各个页面分别转化为图片,获得所述至少一个图片。
9.根据权利要求6所述的文档处理装置,其特征在于,所述第一识别模块包括:
第一确定单元,被配置为确定所述图片中像素值对应预定颜色的第一像素点的数量,当所述第一像素点的数量与所述图片像素点的总数量之间的比值大于第二预设值时,确定所述图片的空白区域的面积所占总面积的比值大于所述第一预设值,其中,所述预定颜色为空白内容对应的颜色。
10.根据权利要求6所述的文档处理装置,其特征在于,所述第一识别模块包括:
第二确定单元,被配置为采用光学字符识别技术,提取所述图片中字符方向特征,如果图片中字符方向特征对应的方向为正向时,确定所述图片中的字符方向为标准方向,如果图片中字符方向特征对应的方向为非正向时,确定所述图片中的字符方向为非标准方向。
11.一种计算机设备,其特征在于,所述计算机设备包括存储器、处理器、触摸传感器及显示屏,所述存储器中存储有计算机程序,所述处理器与所述存储器连接,所述处理器执行计算机程序以实现如权利要求1~5中任一项所述的文档处理方法。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括计算机指令,当所述计算机指令在计算机设备上运行时,使得所述计算机设备执行第一方面或者第一方面的任一可选的实现方式中的方法的指令以实现如权利要求1~5中任一项所述的文档处理方法。
13.一种计算机程序产品,其特征在于,当所述计算机程序产品在计算机上运行时,使得所述计算机执行如权利要求1~5中任一项所述的文档处理方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010611500.4A CN111753850A (zh) | 2020-06-29 | 2020-06-29 | 文档处理方法、装置、计算机设备及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010611500.4A CN111753850A (zh) | 2020-06-29 | 2020-06-29 | 文档处理方法、装置、计算机设备及计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111753850A true CN111753850A (zh) | 2020-10-09 |
Family
ID=72676609
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010611500.4A Pending CN111753850A (zh) | 2020-06-29 | 2020-06-29 | 文档处理方法、装置、计算机设备及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111753850A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112101317A (zh) * | 2020-11-17 | 2020-12-18 | 深圳壹账通智能科技有限公司 | 页面方向识别方法、装置、设备及计算机可读存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108885699A (zh) * | 2018-07-11 | 2018-11-23 | 深圳前海达闼云端智能科技有限公司 | 字符识别方法、装置、存储介质及电子设备 |
CN110069767A (zh) * | 2019-04-23 | 2019-07-30 | 掌阅科技股份有限公司 | 基于电子书的排版方法、电子设备及计算机存储介质 |
CN110378287A (zh) * | 2019-07-19 | 2019-10-25 | 腾讯科技(深圳)有限公司 | 文档方向识别方法、装置及存储介质 |
US20200074169A1 (en) * | 2018-08-31 | 2020-03-05 | Accenture Global Solutions Limited | System And Method For Extracting Structured Information From Image Documents |
-
2020
- 2020-06-29 CN CN202010611500.4A patent/CN111753850A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108885699A (zh) * | 2018-07-11 | 2018-11-23 | 深圳前海达闼云端智能科技有限公司 | 字符识别方法、装置、存储介质及电子设备 |
US20200074169A1 (en) * | 2018-08-31 | 2020-03-05 | Accenture Global Solutions Limited | System And Method For Extracting Structured Information From Image Documents |
CN110069767A (zh) * | 2019-04-23 | 2019-07-30 | 掌阅科技股份有限公司 | 基于电子书的排版方法、电子设备及计算机存储介质 |
CN110378287A (zh) * | 2019-07-19 | 2019-10-25 | 腾讯科技(深圳)有限公司 | 文档方向识别方法、装置及存储介质 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112101317A (zh) * | 2020-11-17 | 2020-12-18 | 深圳壹账通智能科技有限公司 | 页面方向识别方法、装置、设备及计算机可读存储介质 |
CN112101317B (zh) * | 2020-11-17 | 2021-02-19 | 深圳壹账通智能科技有限公司 | 页面方向识别方法、装置、设备及计算机可读存储介质 |
WO2022105569A1 (zh) * | 2020-11-17 | 2022-05-27 | 深圳壹账通智能科技有限公司 | 页面方向识别方法、装置、设备及计算机可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8131081B2 (en) | Image processing apparatus, and computer program product | |
US8619278B2 (en) | Printed matter examination apparatus, printed matter examination method, and printed matter examination system | |
US9454696B2 (en) | Dynamically generating table of contents for printable or scanned content | |
US11216695B2 (en) | Image processing system and image processing method | |
US20060285748A1 (en) | Document processing device | |
CN111950557A (zh) | 错题处理方法、图像形成装置及电子设备 | |
JP2006243943A (ja) | 画像処理装置およびその方法 | |
JP4943354B2 (ja) | 情報識別装置、情報識別方法、プログラム及び記録媒体 | |
CN211375614U (zh) | 影像整合打印系统及装置 | |
US8125689B2 (en) | Image processing apparatus and method for associating a plurality of pieces of content data | |
CN111753850A (zh) | 文档处理方法、装置、计算机设备及计算机可读存储介质 | |
JP2017212575A (ja) | 画像読込み装置及びプログラム | |
US20190028603A1 (en) | Image processing apparatus and method | |
TWM574294U (zh) | 一種基於行動載具之智能理賠系統 | |
US10917538B2 (en) | Information processing apparatus and non-transitory computer readable storage medium storing information processing program | |
US20150312441A1 (en) | Image forming apparatus, image processing apparatus, image forming method, image processing method, and non-transitory computer readable medium | |
US8804204B2 (en) | Password generating system and method, and non-transitory computer readable medium | |
JP6540597B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP2010010787A (ja) | 画像処理装置、その制御方法、プログラムおよび記憶媒体 | |
EP3940628A1 (en) | Image processing device, image reading device, image processing method, and program | |
JP7452060B2 (ja) | 情報処理装置及びプログラム | |
US10397417B1 (en) | Methods and systems for printing selective portions of documents | |
US20230102476A1 (en) | Information processing apparatus, non-transitory computer readable medium storing program, and information processing method | |
JP2010109653A (ja) | 画像読取装置、画像形成装置、画像読取方法および画像読取プログラム | |
CN115878055A (zh) | 一种溯源文件生成方法、装置、存储介质和计算机设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |