WO2024088167A1

WO2024088167A1 - 图像处理方法、设备、终端和介质

Info

Publication number: WO2024088167A1
Application number: PCT/CN2023/125630
Authority: WO
Inventors: 廖声洋
Original assignee: 蔚来移动科技有限公司
Priority date: 2022-10-24
Filing date: 2023-10-20
Publication date: 2024-05-02
Also published as: CN117974429A

Abstract

本发明提供了一种图像处理方法、设备、终端和介质，包括获取目标文档的当前帧图像的多个初始角点；在预设多边形形成的范围内对多个初始角点进行滤波，得到当前帧图像的多个可用角点；确定任意两个可用角点之间的第一距离，并根据所有第一距离，得到预设多边形对应的各方向上最大距离；根据各方向上最大距离，确定各方向的缩放系数；若每个缩放系数均大于对应的系数阈值，根据每个缩放系数均及其对应的系数阈值，确定当前帧图像的缩放系数，并对当前帧图像进行缩放，得到目标图像，实现了动态的调整目标文档的图像显示比例，给用户的使用带来方便，且调整图像显示比例相对于手动调节更加准确，提高了图像显示效果，并提升了用户体验。

Description

图像处理方法、设备、终端和介质

本申请要求2022年10月24日提交的、发明名称为“图像处理方法、设备、终端和介质”的中国专利申请202211301775.3的优先权，上述中国专利申请的全部内容通过引用并入本申请中。

技术领域

本发明涉及图像处理技术领域，具体提供一种图像处理方法、设备、终端和介质。

背景技术

随着互联网的普及和发展，人们对于终端设备的功能需求也越发多样化。例如，为了满足用户在终端设备中随时查看文档的使用需求，较多终端设备可以支持文档拍摄功能。例如，用户可以利用文档拍摄功能拍摄文档图片，实现如网上搜题或者提取图片中的文字等功能。

终端设备在文档拍摄模式下，其拍摄的图像可能过大或过小，与用户的实际需求不一致。目前，普遍基于手动调节的方式调节图像的大小。然而，手动调节图像时，给用户的使用带来不变，且难以找到合适的缩放比例，图像显示效果仍然较差。

发明内容

为了克服上述缺陷，提出了本发明，以提供解决或至少部分地解决手动调节图像时，给用户的使用带来不变，且难以找到合适的缩放比例，图像显示效果仍然较差的技术问题的图像处理方法、设备、终端和介质。

在第一方面，本发明提供一种图像处理方法，所述图像处理方法包括：

获取目标文档的当前帧图像的多个初始角点；

在预设多边形形成的范围内对多个所述初始角点进行滤波，得到所述当前帧图像的多个可用角点；其中，可用角点的数目与所述预设多边形的角数目相同；

确定任意两个可用角点之间的第一距离，并根据所有第一距离，得到所述预设多边形对应的各方向上最大距离；其中，所述预设多边形对应的各方向根据所述预设多边形的边的延伸方向确定；

根据各方向上最大距离，确定各方向的缩放系数；

若每个缩放系数均大于对应的系数阈值，根据每个缩放系数均及其对应的系数阈值，确定所述当前帧图像的缩放系数，并对所述当前帧图像进行缩放，得到目标图像。

进一步地，上述所述的图像处理方法中，在预设多边形形成的范围内对多个所述初始角点进行滤波，得到所述当前帧图像的多个可用角点，包括：

在预设多边形形成的范围内对多个所述初始角点进行空间域的中值滤波，得到所述当前帧图像的多个备选角点；

若所述当前帧图像对应的帧数大于或等于预设帧数，且所述当前帧图像的备选角点的数目为所述预设多边形的角数目，确定所述当前帧图像的每个备选角点与对应的上一帧图像的备选角点之间的第二距离；

若最大的第二距离小于预设距离，在预设多边形形成的范围内对多帧图像的备选角点进行时间域的中值滤波，得到所述当前帧图像的多个可用角点；其中，多帧图像包括当前帧图像以及当前帧图像之前至少两帧图像。

进一步地，上述所述的图像处理方法，还包括：

若每个缩放系数均大于对应的系数阈值，将所述当前帧图像的备选角点对应的数值更新为所述当前帧图像的多个可用角点对应的数值。

进一步地，上述所述的图像处理方法中，根据每个缩放系数均及其对应的系数阈值，确定所述当前帧图像的缩放系数，并对所述当前帧图像进行缩放，得到目标图像，包括：

确定每个系数阈值与对应缩放系数的比值，并选取最小比值作为当前帧图像的缩放系数，对所述当前帧图像进行缩放，得到目标图像。

进一步地，上述所述的图像处理方法，还包括：

存储所述当前帧图像的缩放系数。

进一步地，上述所述的图像处理方法中，获取当前帧图像的多个初始角点，包括：

基于上一帧图像对应的缩放系数或者预设缩放系数，对所述当前帧图像进行缩放，得到缩放后的当前帧图像；

基于预设的角点检测算法，获取缩放后的当前帧图像多个初始角点。

进一步地，上述所述的图像处理方法中，根据各方向上最大距离，确定各方向的缩放系数，包括：

将最大距离与对应方向上的边长的比值作为所述对应方向上的缩放系数。

在第二方面，本发明提供一种图像处理设备，包括处理器和存储装置，所述存储装置适于存储多条程序代码，所述程序代码适于由所述处理器加载并运行以执行权利要求1至7中任一项所述的图像处理方法。

在第三方面，提供一种终端，所述终端包括如上所述的图像处理设备。

在第四方面，提供一种计算机可读存储介质，该计算机可读存储介质其中存储有多条程序代码，所述程序代码适于由处理器加载并运行以执行上述任一项技术方案所述的图像处理方法。

本发明上述一个或多个技术方案，至少具有如下一种或多种有益效果：

在实施本发明的技术方案中，通过获取目标文档的当前帧图像的多个初始角点，并在预设多边形形成的范围内对多个所述初始角点进行滤波，得到所述当前帧图像的多个可用角点后，确定任意两个可用角点之间的第一距离，并根据所有第一距离，得到所述预设多边形对应的各方向上最大距离；然后，根据各方向上最大距离，确定各方向的缩放系数，并在每个缩放系数均大于对应的系数阈值时，选取一个缩放系数，对所述当前帧图像进行缩放，得到目标图像，实现了动态的调整目标文档的图像显示比例，给用户的使用带来方便，且调整图像显示比例相对于手动调节更加准确，提高了图像显示效果，并提升了用户体验。

附图说明

参照附图，本发明的公开内容将变得更易理解。本领域技术人员容易理解的是：这些附图仅仅用于说明的目的，而并非意在对本发明的保护范围组成限制。此外，图中类似的数字用以表示类似的部件，其中：

图1是根据本发明的一个实施例的图像处理方法的主要步骤流程示意图；

图2是确定目标文档的当前帧图像的备用角点的示意图；

图3是确定目标文档的当前帧图像的可用角点的示意图；

图4是根据本发明的另一个实施例的图像处理方法的主要步骤流程示意图；

图5是图2中(1)部分对应的自适应调整后的图像；

图6是根据本发明的一个实施例的图像处理设备的主要结构框图。

具体实施方式

下面参照附图来描述本发明的一些实施方式。本领域技术人员应当理解的是，这些实施方式仅仅用于解释本发明的技术原理，并非旨在限制本发明的保护范围。

在本发明的描述中，“模块”、“处理器”可以包括硬件、软件或者两者的组合。一个模块可以包括硬件电路，各种合适的感应器，通信端口，存储器，也可以包括软件部分，比如程序代码，也可以是软件和硬件的组合。处理器可以是中央处理器、微处理器、图像处理器、数字信号处理器或者其他任何合适的处理器。处理器具有数据和/或信号处理功能。处理器可以以软件方式实现、硬件方式实现或者二者结合方式实现。非暂时性的计算机可读存储介质包括任何合适的可存储程序代码的介质，比如磁碟、硬盘、光碟、闪存、只读存储器、随机存取存储器等等。术语“A和/或B”表示所有可能的A与B的组合，比如只是A、只是B或者A和B。术语“至少一个A或B”或者“A和B中的至少一个”含义与“A和/或B”类似，可以包括只是A、只是B或者A和B。单数形式的术语“一个”、“这个”也可以包含复数形式。

因此，为了解决上述技术问题，本发明提供了以下技术方案：

参阅附图1，图1是根据本发明的一个实施例的图像处理方法的主要步骤流程示意图。如图1所示，本发明实施例中的智能家居设备的控制方法主要包括下列步骤101-步骤105。

步骤101、获取目标文档的当前帧图像的多个初始角点；

在一个具体实现过程中，终端设备的相机进入文档模式后，可以获取目标文档一帧一帧的序列帧图像(第0、1、2......N-1、N、N+1......帧图像)。在得到当前帧图像后，可以获取当前帧图像的多个初始角点。

具体地，可以基于上一帧图像对应的缩放系数或者预设缩放系数，对所述当前帧图像进行缩放，得到缩放后的当前帧图像，并基于预设的角点检测算法，获取缩放后的当前帧图像多个初始角点。其中，上一帧图像对应的缩放系数为对上一帧图像进行缩放使用的系数。预设缩放系数可以人为设定，通常情况下，可以为1，即对图像不进行缩放。预设的角点检测算法可以参照现有相关技术选取所需的方法，本实施例不做具体限制。

步骤102、在预设多边形形成的范围内对多个所述初始角点进行滤波，得到所述当前帧图像的多个可用角点；

在一个具体实现过程中，可以在当前帧图像中选取一个由预设多边形形成的范围，并对该范围中的多个初始角点进行滤波，得到所述当前帧图像的多个可用角点。其中，可用角点的数目与所述预设多边形的角数目相同。例如，预设多边形可以为正方形，可用角点的数目则为4个。

具体地，该实现步骤可以按照如下步骤实现：

a、在预设多边形形成的范围内对多个所述初始角点进行空间域的中值滤波，得到所述当前帧图像的多个备选角点；

图2是确定目标文档的当前帧图像的备用角点的示意图。图2以预设多边形为正方形为例进行说明，当前帧图像具有4个备用角点，分别记为An、Bn、Cn、Dn，参见图2中(2)部分。图2中(1)部分为当前帧图像的第一个备用角点An对应的4个初始角点An0、An1、An2和An3，对4个初始角点An0、An1、An2和An3进行空间域的中值滤波后，可以得到第一个备用角点An。同理，可以得到其他备用角点Bn、Cn、Dn，在此不再一一举例。其中，图2的(1)和(2)部分中间方框表示图像，外面的方框表示预设正方形。

b、若所述当前帧图像对应的帧数大于或等于预设帧数，且所述当前帧图像的备选角点的数目为所述预设多边形的角数目，确定所述当前帧图像的每个备选角点与对应的上一帧图像的备选角点之间的第二距离；

在一个具体实现过程中，得到所述当前帧图像的多个备选角点的数目可能实际与预设多边形的角数目并不一致，因此，需要检测当前帧图像的多个备选角点的数目是否等于预设多边形的角数目。另外，在进行时间域的中值滤波时，通常需要至少3帧图像，因此，还需检测当前帧图像对应的帧数大于或等于预设帧数，其中，预设帧数可以大于或等于3。只有所述当前帧图像对应的帧数大于或等于预设帧数，且所述当前帧图像的备选角点的数目为所述预设多边形的角数目时，可以进一步得到当前帧图像的多个可用角点。

具体地，若所述当前帧图像对应的帧数大于或等于预设帧数，且所述当前帧图像的备选角点的数目为所述预设多边形的角数目，可以确定所述当前帧图像的每个备选角点与对应的上一帧图像的备选角点之间的第二距离；

例如，上一帧图像的备选角点可以为An-1、Bn-1、Cn-1、Dn-1，则所述当前帧图像的每个备选角点与对应的上一帧图像的备选角点之间的第二距离可以记为|An An-1|、|Bn Bn-1|、|Cn Cn-1|、|Dn Dn-1|。

需要说明的是，若所述当前帧图像对应的帧数小于预设帧数，或所述当前帧图像的备选角点的数目为所述预设多边形的角数目，可以返回步骤101。

c、若最大的第二距离小于预设距离，在预设多边形形成的范围内对多帧图像的备选角点进行时间域的中值滤波，得到所述当前帧图像的多个可用角点。

图3是确定目标文档的当前帧图像的可用角点的示意图。如图3所示，图3中(1)部分第N-2帧至第N帧的三个备用角点An-2、An-1、An，对三个备用角点An-2、An-1、An进行时间域的中值滤波后，可以得到图3中(2)部分的第一个可用角点Ao。同理，可以得到图3中(2)部分的其他可用角点Bo、Co、Do。

需要说明的是，若最大的第二距离大于或等于预设距离，可以返回步骤101。

步骤103、确定任意两个可用角点之间的第一距离，并根据所有第一距离，得到所述预设多边形对应的各方向上最大距离；

在一个具体实现过程中，可以确定任意两个可用角点之间的第一距离，并根据所有第一距离，得到所述预设多边形对应的各方向上最大距离。其中，所述预设多边形对应的各方向根据所述预设多边形的边的延伸方向确定。

步骤104、根据各方向上最大距离，确定各方向的缩放系数；

具体地，可以将最大距离与对应方向上的边长的比值作为所述对应方向上的缩放系数。参见图3，可以计算宽度方向缩放系数rw＝maxW/IW，高度方向缩放系数rh＝maxH/IH。其中，IW为当前图像帧的宽度，IH为当前图像帧的长度。

步骤105、若每个缩放系数均大于对应的系数阈值，根据每个缩放系数均及其对应的系数阈值，确定所述当前帧图像的缩放系数，并对所述当前帧图像进行缩放，得到目标图像。

在一个具体实现过程中，可以依次判断每个缩放系数是否大于对应的系数阈值，若每个缩放系数均大于对应的系数阈值，可以根据每个缩放系数均及其对应的系数阈值，确定所述当前帧图像的缩放系数，并对所述当前帧图像进行缩放，得到目标图像。若至少一个个缩放系数小于或等于对应的系数阈值，则可以返回步骤101。

在一个具体实现过程中，可以确定每个系数阈值与对应缩放系数的比值，并选取最小比值作为当前帧图像的缩放系数，对所述当前帧图像进行缩放，得到目标图像。，这样，避免过于放大图像，或，缩小图像后图像仍较大的现象，从而能够与用户实际需求更加相符。

本实施例的图像处理方法，通过获取目标文档的当前帧图像的多个初始角点，并在预设多边形形成的范围内对多个所述初始角点进行滤波，得到所述当前帧图像的多个可用角点后，确定任意两个可用角点之间的第一距离，并根据所有第一距离，得到所述预设多边形对应的各方向上最大距离；然后，根据各方向上最大距离，确定各方向的缩放系数，并在每个缩放系数均大于对应的系数阈值时，选取一个缩放系数，对所述当前帧图像进行缩放，得到目标图像，实现了动态的调整目标文档的图像显示比例，给用户的使用带来方便，且调整图像显示比例相对于手动调节更加准确，提高了图像显示效果，并提升了用户体验。

在一个具体实现过程中，还可以存储所述当前帧图像的缩放系数，以便在获取到下一帧图像时，可以按照当前帧图像的缩放系数对下一帧图像进行所放过后，再获取下一整图像的多个初始角点。

在一个具体实现过程中，若每个缩放系数均大于对应的系数阈值，所述当前帧图像的备选角点对应的数值更新为所述当前帧图像的多个可用角点对应的数值，以便在对下一帧图像进行缩放时，可以利用当前帧图像的备选角点对下一帧图像进行中值滤波。

下面结合图2和图3对本发明的处理方法具体应用进行说明。

图4是根据本发明的另一个实施例的图像处理方法的主要步骤流程示意图，如图4所示，本发明实施例中的智能家居设备的控制方法主要包括下列步骤401-步骤411。

步骤401、相机进入文档模式，获取目标文档的当前帧图像；

步骤402、按照预设缩放系数对当前帧图像进行缩放后，获取当前帧图像的多个初始角点；

步骤403、在预设多边形形成的范围内对多个所述初始角点进行空间域的中值滤波，得到所述当前帧图像的多个备选角点；

步骤404、判断当前帧图像的帧数是否小于3，或者，备选角点的数目是否不等于4；若是，返回步骤402，若否，执行步骤405；

步骤405、确定所述当前帧图像的每个备选角点与对应的上一帧图像的备选角点之间的第二距离，并确定出最大的第二距离；

步骤406、判断最大的第二距离是否小于预设距离；若是，执行步骤407，若否，返回步骤402；

步骤407、在预设多边形形成的范围内对多帧图像的备选角点进行时间域的中值滤波，得到所述当前帧图像的多个可用角点；

步骤408、确定任意两个可用角点之间的第一距离，并根据所有第一距离，得到宽度方向上最大距离和高度方向上的最大距离，并计算宽度方向的缩放系数和高度方向的缩放系数；

步骤409、判断宽度方向上最大距离是否大于宽度方向的系数阈值和高度方向上的最大距离；若是，执行步骤410，若否，返回步骤402；

步骤410、确定每个系数阈值与对应缩放系数的比值，选取最小比值作为当前帧图像的缩放系数，并存储当前帧图像的缩放系数，以及将所述当前帧图像的备选角点对应的数值更新为所述当前帧图像的多个可用角点对应的数值；

步骤411、根据所述当前帧图像的缩放系数，对所述当前帧图像进行缩放，得到目标图像。

图5是图2中(1)部分对应的自适应调整后的图像。图5中(1)部分为当前帧图像的原始图像，图5中(2)部分为当前帧图像的放大图像。

需要指出的是，尽管上述实施例中将各个步骤按照特定的先后顺序进行了描述，但是本领域技术人员可以理解，为了实现本发明的效果，不同的步骤之间并非必须按照这样的顺序执行，其可以同时(并行)执行或以其他顺序执行，这些变化都在本发明的保护范围之内。

本领域技术人员能够理解的是，本发明实现上述一实施例的方法中的全部或部分流程，也可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一计算机可读存储介质中，该计算机程序在被处理器执行时，可实现上述各个方法实施例的步骤。其中，所述计算机程序包括计算机程序代码，所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读存储介质可以包括：能够携带所述计算机程序代码的任何实体或装置、介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器、随机存取存储器、电载波信号、电信信号以及软件分发介质等。需要说明的是，所述计算机可读存储介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减，例如在某些司法管辖区，根据立法和专利实践，计算机可读存储介质不包括电载波信号和电信信号。

进一步，本发明还提供了一种图像处理设备。

参阅附图6，图6是根据本发明的一个实施例的图像处理设备的主要结构框图。如图6所示，本发明实施例中的图像处理设备可以包括处理器60和存储装置61。

存储装置61可以被配置成存储执行上述方法实施例的图像处理方法的程序，处理器60可以被配置成用于执行存储装置61中的程序，该程序包括但不限于执行上述方法实施例的图像处理方法的程序。为了便于说明，仅示出了与本发明实施例相关的部分，具体技术细节未揭示的，请参照本发明实施例方法部分。该图像处理设备可以是包括各种电子设备形成的控制设备。

进一步，本发明还提供了一种终端，包括上述实施例所述的图像处理设备。

进一步，本发明还提供了一种计算机可读存储介质。在根据本发明的一个计算机可读存储介质实施例中，计算机可读存储介质可以被配置成存储执行上述方法实施例的图像处理方法的程序，该程序可以由处理器加载并运行以实现上述图像处理方法。为了便于说明，仅示出了与本发明实施例相关的部分，具体技术细节未揭示的，请参照本发明实施例方法部分。该计算机可读存储介质可以是包括各种电子设备形成的存储装置设备，可选的，本发明实施例中计算机可读存储介质是非暂时性的计算机可读存储介质。

进一步，应该理解的是，由于各个模块的设定仅仅是为了说明本发明的装置的功能单元，这些模块对应的物理器件可以是处理器本身，或者处理器中软件的一部分，硬件的一部分，或者软件和硬件结合的一部分。因此，图中的各个模块的数量仅仅是示意性的。

本领域技术人员能够理解的是，可以对装置中的各个模块进行适应性地拆分或合并。对具体模块的这种拆分或合并并不会导致技术方案偏离本发明的原理，因此，拆分或合并之后的技术方案都将落入本发明的保护范围内。

至此，已经结合附图所示的优选实施方式描述了本发明的技术方案，但是，本领域技术人员容易理解的是，本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下，本领域技术人员可以对相关技术特征作出等同的更改或替换，这些更改或替换之后的技术方案都将落入本发明的保护范围之内。

Claims

一种图像处理方法，其特征在于，包括：

获取目标文档的当前帧图像的多个初始角点；

在预设多边形形成的范围内对多个所述初始角点进行滤波，得到所述当前帧图像的多个可用角点；其中，可用角点的数目与所述预设多边形的角数目相同；

确定任意两个可用角点之间的第一距离，并根据所有第一距离，得到所述预设多边形对应的各方向上最大距离；其中，所述预设多边形对应的各方向根据所述预设多边形的边的延伸方向确定；

根据各方向上最大距离，确定各方向的缩放系数；

若每个缩放系数均大于对应的系数阈值，根据每个缩放系数均及其对应的系数阈值，确定所述当前帧图像的缩放系数，并对所述当前帧图像进行缩放，得到目标图像。
根据权利要求1所述的图像处理方法，其特征在于，所述在预设多边形形成的范围内对多个所述初始角点进行滤波，得到所述当前帧图像的多个可用角点，包括：

在预设多边形形成的范围内对多个所述初始角点进行空间域的中值滤波，得到所述当前帧图像的多个备选角点；

若所述当前帧图像对应的帧数大于或等于预设帧数，且所述当前帧图像的备选角点的数目为所述预设多边形的角数目，确定所述当前帧图像的每个备选角点与对应的上一帧图像的备选角点之间的第二距离；

若最大的第二距离小于预设距离，在预设多边形形成的范围内对多帧图像的备选角点进行时间域的中值滤波，得到所述当前帧图像的多个可用角点；其中，多帧图像包括当前帧图像以及当前帧图像之前至少两帧图像。
根据权利要求1或2所述的图像处理方法，其特征在于，还包括：

若每个缩放系数均大于对应的系数阈值，将所述当前帧图像的备选角点对应的数值更新为所述当前帧图像的多个可用角点对应的数值。
根据权利要求1至3任一项所述的图像处理方法，其特征在于，所述根据每个缩放系数均及其对应的系数阈值，确定所述当前帧图像的缩放系数，并对所述当前帧图像进行缩放，得到目标图像，包括：

确定每个系数阈值与对应缩放系数的比值，并选取最小比值作为当前帧图像的缩放系数，对所述当前帧图像进行缩放，得到目标图像。
根据权利要求4所述的图像处理方法，其特征在于，还包括：

存储所述当前帧图像的缩放系数。
根据权利要求1至5任一项所述的图像处理方法，其特征在于，所述获取目标文档的当前帧图像的多个初始角点，包括：

基于上一帧图像对应的缩放系数或者预设缩放系数，对所述当前帧图像进行缩放，得到缩放后的当前帧图像；

基于预设的角点检测算法，获取缩放后的当前帧图像多个初始角点。
根据权利要求1至6任一项所述的图像处理方法，其特征在于，所述根据各方向上最大距离，确定各方向的缩放系数，包括：

将最大距离与对应方向上的边长的比值作为所述对应方向上的缩放系数。
一种图像处理设备，包括处理器和存储装置，所述存储装置适于存储多条程序代码，其特征在于，所述程序代码适于由所述处理器加载并运行以执行权利要求1至7中任一项所述的图像处理方法。
一种终端，其特征在于，包括如权利要求8所述的图像处理设备。
一种计算机可读存储介质，其中存储有多条程序代码，其特征在于，所述程序代码适于由处理器加载并运行以执行权利要求1至7中任一项所述的图像处理方法。