CN113808147A

CN113808147A - 一种图像处理方法、装置、系统及计算机设备

Info

Publication number: CN113808147A
Application number: CN202111077245.0A
Authority: CN
Inventors: 郝志军; 郭彦军; 李玲; 王彬燕
Original assignee: Beijing Hangxing Yongzhi Technology Co ltd
Current assignee: Beijing Hangxing Yongzhi Technology Co ltd
Priority date: 2021-09-14
Filing date: 2021-09-14
Publication date: 2021-12-17

Abstract

本发明公开了一种图像处理方法、装置、系统及计算机设备，该图像处理方法包括：获取原始图像的图像信息，对图像信息进行尺寸变换得到输入图像向量，将输入图像向量输入到预先训练好的图像处理模型，得到输出图像向量，输出图像向量包含类别信息和坐标信息，基于图像信息和输入图像向量得到尺寸变换的变换比例，基于变换比例将输出图像向量的坐标信息还原到原始图像所处的坐标系中，基于还原后的坐标信息对图像信息进行裁剪，得到原始图像的主体图像。通过实施本发明，实现了对原始图像中多余部分的裁剪，将图像进行优化，提升了图像数字化的效率，减少了人力、物力资源的投入。

Description

一种图像处理方法、装置、系统及计算机设备

技术领域

本发明涉及图像识别处理技术领域，具体涉及一种图像处理方法、装置、系统及计算机设备。

背景技术

随着社会的发展，档案的种类越来越多，纸质档案逐渐被电子档案所替代，在将纸质档案转化为电子档案的过程中，由于纸质档案大小不一，会造成扫描时生成颜色不一的背景图，而这些与档案无关的背景需要进行裁剪。传统的边缘裁剪方法采用人工手动裁剪或者固定规则算法，其中人工进行裁剪速度较慢，且对于数以万计、百万计的图像裁剪任务，需要耗费大量的人力资源、物力资源；基于传统固定规则算法的裁剪方式适用场景又非常的单一，例如文档主体与背景对比不明显的图像、背景场景繁多的图像、模糊的图像等，很容易造成裁剪不精确或者裁剪掉有用的文档信息。

发明内容

因此，本发明要解决的技术问题在于克服现有边缘裁剪方法容易造成裁剪不精确或者裁剪掉有用的文档信息的缺陷，从而提供一种图像处理方法、装置、系统及计算机设备。

根据第一方面，本发明实施例公开了一种图像处理方法，包括：获取原始图像的图像信息，对所述图像信息进行尺寸变换得到输入图像向量；将所述输入图像向量输入到预先训练好的图像处理模型，得到输出图像向量，所述输出图像向量包含类别信息和坐标信息；基于所述图像信息和输入图像向量得到所述尺寸变换的变换比例；基于所述变换比例将所述输出图像向量的坐标信息还原到所述原始图像所处的坐标系中；基于还原后的坐标信息对所述图像信息进行裁剪，得到所述原始图像的主体图像。

可选地，所述获取原始图像的图像信息，包括：获取所述原始图像的图像信息，检测所述图像信息的倾斜角度；基于所述倾斜角度对所述图像信息进行纠偏，得到纠偏后的图像信息。

可选地，检测所述图像信息的倾斜角度，包括：基于Canny边缘检测算法得到所述图像信息的倾斜角度。

可选地，对所述图像信息进行尺寸变换得到输入图像向量，包括：将所述图像信息的分辨率转换为512×512的三通道彩色输入图像向量。

可选地，所述方法还包括：将所述图像信息的主体图像还原成RGB的彩色通道。

可选地，在获取原始图像的图像信息，对所述图像信息进行尺寸变换得到输入图像向量之前，所述方法还包括：对目标文件进行扫描，得到所述原始图像。

根据第二方面，本发明实施例还公开了一种图像处理装置，包括：获取模块，用于获取原始图像的图像信息，对所述图像信息进行尺寸变换得到输入图像向量；处理模块，用于将所述输入图像向量输入到预先训练好的图像处理模型，得到输出图像向量，所述输出图像向量包含类别信息和坐标信息；计算模块，用于基于所述图像信息和输入图像向量得到所述尺寸变换的变换比例；还原模块，用于基于所述变换比例将所述输出图像向量的坐标信息还原到所述原始图像所处的坐标系中；裁剪模块，用于基于还原后的坐标信息对所述图像信息进行裁剪，得到所述原始图像的主体图像。

根据第三方面，本发明实施例还公开了一种图像处理系统，包括：图像处理装置和图像获取设备，所述图像获取设备包括：扫描设备，用于扫描目标文件，得到原始图像；管理平台，用于接收并解码所述原始图像的图像信息；所述图像处理装置包括：获取模块，用于获取原始图像的图像信息，对所述图像信息进行尺寸变换得到输入图像向量；处理模块，用于将所述输入图像向量输入到预先训练好的图像处理模型，得到输出图像向量，所述输出图像向量包含类别信息和坐标信息；计算模块，用于基于所述图像信息和输入图像向量得到所述尺寸变换的变换比例；还原模块，用于基于所述变换比例将所述输出图像向量的坐标信息还原到所述原始图像所处的坐标系中；裁剪模块，用于基于还原后的坐标信息对所述图像信息进行裁剪，得到所述原始图像的主体图像。

可选地，所述管理平台包括：编码模块，用于以base64的方式将所述图像信息编码得到图像信息的数据流；传输模块，用于基于HTTP通讯协议将所述图像信息的数据流进行传输。

根据第四方面，本发明实施例还公开了一种计算机设备，包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器执行如第一方面或第一方面任一可选实施方式所述的图像处理方法的步骤。

根据第五方面，本发明实施方式还公开了一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现如第一方面或第一方面任一可选实施方式所述的图像处理方法的步骤。

本发明技术方案，具有如下优点：

本发明提供的图像处理方法、装置、系统及电子设备，通过对获取到的原始图像信息进行尺寸变换得到输入图像的向量，将输入图像向量进行训练识别得到包含类别信息和坐标信息，基于图像信息和输入图像向量得到尺寸变换的变换比例，精确的得到图像的坐标信息，根据坐标信息可以准确的将图像信息中的主体图像进行裁剪，得到准确的主体图像，大大提升了图像数字化的效率，减少了人力、物力资源的投入。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案，下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施方式，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例中图像处理方法的一个具体示例的流程图；

图2为本发明实施例中图像处理装置的一个具体示例的原理框图；

图3为本发明实施例中图像处理系统的一个具体示例的原理框图；

图4为本发明实施例中计算机设备的一个具体示例图。

具体实施方式

下面将结合附图对本发明的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

在本发明的描述中，需要说明的是，术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。此外，术语“第一”、“第二”、“第三”仅用于描述目的，而不能理解为指示或暗示相对重要性。

在本发明的描述中，需要说明的是，除非另有明确的规定和限定，术语“安装”、“相连”、“连接”应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体地连接；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，还可以是两个元件内部的连通，可以是无线连接，也可以是有线连接。对于本领域的普通技术人员而言，可以具体情况理解上述术语在本发明中的具体含义。

此外，下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。

本发明实施例公开了一种图像处理方法，如图1所示，该方法包括如下步骤：

步骤101，获取原始图像的图像信息，对所述图像信息进行尺寸变换得到输入图像向量。

示例性地，原始图像可以为需要进行数字化处理的纸质文件的电子图像，将纸质文件使用扫描仪、照相机等设备获得纸质文件的电子图像，本发明实施例对纸质文件的类型和原始图像的获取方法不作限定，本领域技术人员可以根据实际需要确定，本发明实施例以纸质化档案文件为例进行介绍。图像信息为原始图像转换为矩阵形式所对应到的矩阵信息，进行尺寸变换得到的输入图像向量为符合图像识别模型输入的图像信息，例如输入图像向量可以是原始图像转化为分辨率为512x512通道为3的图像向量，本发明实施例对输入图像向量的形式不作限定，本领域技术人员可以根据实际需要确定。

步骤102，将所述输入图像向量输入到预先训练好的图像处理模型，得到输出图像向量，所述输出图像向量包含类别信息和坐标信息。

示例性地，图像处理模型可以根据输入的图像信息识别得到图像信息中的信息类别和对应的坐标值，例如，图像处理模型输入分辨率为512x512通道为3的图像向量，输出图像向量为类别的索引坐标，输出的坐标为输入的512x512图像向量的主体内容坐标值，图像处理模型可以采用YOLOv4模型进行识别，本发明实施例对图像处理模型的类型不作限定，本领域技术人员可以根据实际需要确定。

步骤103，基于所述图像信息和输入图像向量得到所述尺寸变换的变换比例。

示例性地，由于在输入图像处理模型之前进行了尺寸的调整，所以图像处理模型输出的坐标值无法直接在原始图像中使用，需要根据原始图像与尺寸变换后的图像尺寸计算出变换比例，根据变换比例计算图像处理模型输出坐标值对应的原始图像中的坐标值，例如，图像处理模型输出的坐标值是以分辨率为512x512的图像为基准的，所以需要使用原始图像与分辨率为512x512的图像计算缩放比例，再根据该缩放比例将AI模型输出的坐标值还原到原始图像的坐标系中。

步骤104，基于所述变换比例将所述输出图像向量的坐标信息还原到所述原始图像所处的坐标系中。示例性地，可以将图像处理模型输出的坐标值对计算得到的变换比例相乘得到对应原始图像中的坐标信息。

步骤105，基于还原后的坐标信息对所述图像信息进行裁剪，得到所述原始图像的主体图像。示例性地，使用还原后的坐标值对纸质档案文件经过数字化后的档案图像进行裁剪，将档案文件对应的图像中的主体信息裁剪出来，去掉无用的背景边缘信息。

本发明提供的图像处理方法，通过对获取到的原始图像信息进行尺寸变换得到输入图像的向量，将输入图像向量进行训练识别得到包含类别信息和坐标信息，基于图像信息和输入图像向量得到尺寸变换的变换比例，精确的得到图像的坐标信息，根据坐标信息可以准确的将图像信息中的主体图像进行裁剪，得到准确的主体图像，提升了图像数字化的效率，减少了人力、物力资源的投入。

作为本发明一个可选实施方式，上述步骤101中，获取原始图像的图像信息的过程，主要包括：获取所述原始图像的图像信息，检测所述图像信息的倾斜角度；基于所述倾斜角度对所述图像信息进行纠偏，得到纠偏后的图像信息。

示例性地，由于扫描仪的位置或者操作问题等，会造成获取到的原始图像有一定的倾斜角度以及多余的边缘背景，在进行图像处理模型进行识别之前需要检测图像的倾斜角度，并根据检测到的倾斜角度对图像进行旋转纠偏，同时为提高图像处理的准确度，需要进行图像的降噪处理。

作为本发明一个可选实施方式，检测所述图像信息的倾斜角度的过程，主要包括：基于Canny边缘检测算法得到所述图像信息的倾斜角度。示例性地，图像倾斜角度的判断可以采用Canny边缘检测算法进行倾斜角度的检测，首先使用Canny边缘检测算法计算出图像中文字的整体边缘，根据其边缘(文字或者表格的边)等计算出倾斜角度，并根据其倾斜角度，进行纠偏，并对图像进行填充(补充，纠偏后的边缘)。

作为本发明一个可选实施方式，上述步骤101中，对所述图像信息进行尺寸变换得到输入图像向量的过程主要包括：将所述图像信息的分辨率转换为512×512的三通道彩色输入图像向量。示例性地，输入的图像向量需要与图像处理模型的输入类型匹配，因此需要将将图像信息的分辨率转换为512×512、彩色通道为3后再输入图像处理模型。

作为本发明一个可选实施方式，该图像处理方法还包括：将所述图像信息的主体图像还原成RGB的彩色通道。示例性地，由于在输入图像处理模型前将原始图像转换成彩色通道为3，因此在图像处理模型识别完成后需要将彩色通道转换为RGB形式的。

作为本发明一个可选实施方式，在上述步骤101之前，该图像处理方法还包括：对目标文件进行扫描，得到所述原始图像。

示例性地，获取原始图像可以通过扫描仪对纸质档案进行扫描，扫描仪通过光电技术及数字技术的原理，将生成的数字化档案图像输入到计算机设备中。

本发明实施例还公开了一种图像处理装置，如图2所示，该装置包括：

获取模块201，用于获取原始图像的图像信息，对所述图像信息进行尺寸变换得到输入图像向量。示例性地，详细内容见上述步骤101所述，此处不再赘述。

处理模块202，用于将所述输入图像向量输入到预先训练好的图像处理模型，得到输出图像向量，所述输出图像向量包含类别信息和坐标信息。示例性地，详细内容见上述步骤102所述，此处不再赘述。

计算模块203，用于基于所述图像信息和输入图像向量得到所述尺寸变换的变换比例。示例性地，详细内容见上述步骤103所述，此处不再赘述。

还原模块204，用于基于所述变换比例将所述输出图像向量的坐标信息还原到所述原始图像所处的坐标系中。示例性地，详细内容见上述步骤104所述，此处不再赘述。

裁剪模块205，用于基于还原后的坐标信息对所述图像信息进行裁剪，得到所述原始图像的主体图像。示例性地，详细内容见上述步骤105所述，此处不再赘述。

本发明提供的图像处理装置，通过对获取到的原始图像信息进行尺寸变换得到输入图像的向量，将输入图像向量进行训练识别得到包含类别信息和坐标信息，基于图像信息和输入图像向量得到尺寸变换的变换比例，精确的得到图像的坐标信息，根据坐标信息可以准确的将图像信息中的主体图像进行裁剪，得到准确的主体图像，大大提升了图像数字化的效率，减少了人力、物力资源的投入。

本发明实施例还公开了一种图像处理系统，如图3所示，该系统包括图像处理装置302和图像获取设备301，所述图像获取设备包括：

扫描设备3011，用于扫描目标文件，得到原始图像。示例性地，详细内容见上述实施例所述，此处不再赘述。

管理平台3012，用于接收并解码所述原始图像的图像信息。示例性地，管理平台3012对扫描设备获取到的原始图像进行编码并将编码后的图像信息发送至图像处理模块进行图像处理，同时对处理后的图像进行归档。

所述图像处理装置包括：

本发明提供的图像处理系统，包括图像处理装置和图像获取设备，所述图像获取设备包括：扫描仪，用于扫描目标文件，得到原始图像；管理平台，用于接收并解码所述原始图像的图像信息；所述图像处理装置包括：获取模块，用于获取原始图像的图像信息，对所述图像信息进行尺寸变换得到输入图像向量；处理模块，用于将所述输入图像向量输入到预先训练好的图像处理模型，得到输出图像向量，所述输出图像向量包含类别信息和坐标信息；计算模块，用于基于所述图像信息和输入图像向量得到所述尺寸变换的变换比例；还原模块，用于基于所述变换比例将所述输出图像向量的坐标信息还原到所述原始图像所处的坐标系中；裁剪模块，用于基于还原后的坐标信息对所述图像信息进行裁剪，得到所述原始图像的主体图像，提升了图像数字化的效率，减少了人力、物力资源的投入。

作为本发明一个可选实施方式，所述管理平台包括：编码模块，用于以base64的方式将所述图像信息编码得到图像信息的数据流；传输模块，用于基于HTTP通讯协议将所述图像信息的数据流进行传输。

示例性地，管理平台将扫描设备得到的原始档案图像，以base64的方式将原始图像编码成数据流，再采用HTTP通讯协议将编码后的数据流传输至图像处理装置，图像处理装置根据获取到的数据流以同样的base64的方式进行解码得到原始图像，根据原始图像进行如上述实施例描述的图像处理。

本发明实施例还提供了一种电子设备，如图4所示，该电子设备可以包括处理器401和存储器402，其中处理器401和存储器402可以通过总线或者其他方式连接，图3中以通过总线连接为例。

处理器401可以为中央处理器(Central Processing Unit，CPU)。处理器401还可以为其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片，或者上述各类芯片的组合。

存储器402作为一种非暂态计算机可读存储介质，可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块，如本发明实施例中的图像处理方法对应的程序指令/模块。处理器401通过运行存储在存储器402中的非暂态软件程序、指令以及模块，从而执行处理器的各种功能应用以及数据处理，即实现上述方法实施例中的图像处理方法。

存储器402可以包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需要的应用程序；存储数据区可存储处理器401所创建的数据等。此外，存储器402可以包括高速随机存取存储器，还可以包括非暂态存储器，例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中，存储器402可选包括相对于处理器401远程设置的存储器，这些远程存储器可以通过网络连接至处理器401。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

所述一个或者多个模块存储在所述存储器402中，当被所述处理器401执行时，执行如图1所示实施例中的图像处理方法。

上述电子设备具体细节可以对应参阅图1所示的实施例中对应的相关描述和效果进行理解，此处不再赘述。

本领域技术人员可以理解，实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)、随机存储记忆体(RandomAccessMemory，RAM)、快闪存储器(Flash Memory)、硬盘(Hard Disk Drive，缩写：HDD)或固态硬盘(Solid-State Drive，SSD)等；所述存储介质还可以包括上述种类的存储器的组合。

虽然结合附图描述了本发明的实施例，但是本领域技术人员可以在不脱离本发明的精神和范围的情况下作出各种修改和变型，这样的修改和变型均落入由所附权利要求所限定的范围之内。

Claims

1.一种图像处理方法，其特征在于，包括：

获取原始图像的图像信息，对所述图像信息进行尺寸变换得到输入图像向量；

将所述输入图像向量输入到预先训练好的图像处理模型，得到输出图像向量，所述输出图像向量包含类别信息和坐标信息；

基于所述图像信息和输入图像向量得到所述尺寸变换的变换比例；

基于所述变换比例将所述输出图像向量的坐标信息还原到所述原始图像所处的坐标系中；

基于还原后的坐标信息对所述图像信息进行裁剪，得到所述原始图像的主体图像。

2.根据权利要求1所述的方法，其特征在于，所述获取原始图像的图像信息，包括：

获取所述原始图像的图像信息，检测所述图像信息的倾斜角度；

基于所述倾斜角度对所述图像信息进行纠偏，得到纠偏后的图像信息。

3.根据权利要求2所述的方法，其特征在于，检测所述图像信息的倾斜角度，包括：

基于Canny边缘检测算法得到所述图像信息的倾斜角度。

4.根据权利要求1所述的方法，其特征在于，对所述图像信息进行尺寸变换得到输入图像向量，包括：

将所述图像信息的分辨率转换为512×512的三通道彩色输入图像向量。

5.根据权利要求1所述的方法，其特征在于，还包括：

将所述图像信息的主体图像还原成RGB的彩色通道。

6.根据权利要求1所述的方法，其特征在于，在获取原始图像的图像信息，对所述图像信息进行尺寸变换得到输入图像向量之前，所述方法还包括：

对目标文件进行扫描，得到所述原始图像。

7.一种图像处理装置，其特征在于，

获取模块，用于获取原始图像的图像信息，对所述图像信息进行尺寸变换得到输入图像向量；

处理模块，用于将所述输入图像向量输入到预先训练好的图像处理模型，得到输出图像向量，所述输出图像向量包含类别信息和坐标信息；

计算模块，用于基于所述图像信息和输入图像向量得到所述尺寸变换的变换比例；

还原模块，用于基于所述变换比例将所述输出图像向量的坐标信息还原到所述原始图像所处的坐标系中；

裁剪模块，用于基于还原后的坐标信息对所述图像信息进行裁剪，得到所述原始图像的主体图像。

8.一种图像处理系统，其特征在于，包括图像处理装置和图像获取设备，所述图像获取设备包括：

扫描设备，用于扫描目标文件，得到原始图像；

管理平台，用于接收并解码所述原始图像的图像信息；

所述图像处理装置包括：

9.根据权利要求8所述的系统，其特征在于，所述管理平台包括：

编码模块，用于以base64的方式将所述图像信息编码得到图像信息的数据流；

传输模块，用于基于HTTP通讯协议将所述图像信息的数据流进行传输。

10.一种计算机设备，其特征在于，包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器执行如权利要求1-6任一所述的图像处理方法的步骤。

11.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1-6任一项所述的图像处理方法的步骤。