CN113469885A - 目标图像的确定方法、装置、存储介质和电子装置 - Google Patents

目标图像的确定方法、装置、存储介质和电子装置 Download PDF

Info

Publication number
CN113469885A
CN113469885A CN202110802402.3A CN202110802402A CN113469885A CN 113469885 A CN113469885 A CN 113469885A CN 202110802402 A CN202110802402 A CN 202110802402A CN 113469885 A CN113469885 A CN 113469885A
Authority
CN
China
Prior art keywords
image
target
frequency domain
initial
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110802402.3A
Other languages
English (en)
Inventor
安达
唐大闰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Minglue Artificial Intelligence Group Co Ltd
Original Assignee
Shanghai Minglue Artificial Intelligence Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Minglue Artificial Intelligence Group Co Ltd filed Critical Shanghai Minglue Artificial Intelligence Group Co Ltd
Priority to CN202110802402.3A priority Critical patent/CN113469885A/zh
Publication of CN113469885A publication Critical patent/CN113469885A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/80Geometric correction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20024Filtering details
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20048Transform domain processing
    • G06T2207/20056Discrete and fast Fourier transform, [DFT, FFT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20048Transform domain processing
    • G06T2207/20061Hough transform

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Image Processing (AREA)

Abstract

本申请涉及一种目标图像的确定方法、装置、存储介质和电子装置,其中,该方法包括:对待旋转的初始图像进行图像处理,得到与初始图像对应的目标频域图,其中,初始图像是目标文本的图像,初始图像的显示方向与用于显示图像的目标屏幕的显示方向不一致;根据目标频域图确定初始图像的倾斜角度;根据倾斜角度确定与初始图像对应的目标图像,其中,目标图像的显示方向与用于显示图像的目标屏幕的显示方向一致。本申请解决了对待旋转的图像的图像矫正效率较低的技术问题。

Description

目标图像的确定方法、装置、存储介质和电子装置
技术领域
本申请涉及图像处理领域,尤其涉及一种目标图像的确定方法、装置、存储介质和电子装置。
背景技术
在图像处理领域,常常需要对图像做旋转处理,相关技术中在对图像进行旋转是常采用直方图投影法,对于一段多行文字,进行文字切分,并将文字投影到Y轴,并将所有的值累加,这样就能得到一个在Y轴上的直方图。直方图的谷底就是背景,峰值则是前景(文字)所在的区域,于是我们将每行文字的位置给识别出来了,对用户倾斜的图片,我们可以变换投影角度,投影分值最高的角度即为图像的倾斜角度。该方法仅适用于包含文本的图像,对于不包含文本的图像则无法进行图像旋转,当屠屏出现过曝光或者前曝光的时候,进行二值化处理则会出现文字粘连,会对直方图投影结果造成影响,并且直方图投影法只适用于背景为单一颜色的情况,如果存在背景图案,则无法有效的进行图像旋转。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本申请提供了一种目标图像的确定方法、装置、存储介质和电子装置,以至少解决相关技术中对待旋转的图像的图像矫正效率较低的技术问题。
根据本申请实施例的一个方面,提供了一种目标图像的确定方法,包括:对待旋转的初始图像进行图像处理,得到与初始图像对应的目标频域图,其中,初始图像是目标文本的图像,初始图像的显示方向与用于显示图像的目标屏幕的显示方向不一致;根据目标频域图确定初始图像的倾斜角度;根据倾斜角度确定与初始图像对应的目标图像,其中,目标图像的显示方向与用于显示图像的目标屏幕的显示方向一致。
可选地,对待旋转的初始图像进行图像处理,得到与初始图像对应的目标频域图包括:获取初始图像;对初始图像进行频域变换处理,得到初始频域图;使用滤波器对初始频域图进行滤波处理,以滤除初始图像对应的噪声部分,得到目标频域图。
可选地,使用滤波器对初始频域图进行滤波处理,得到目标频域图包括:根据预设频率范围确定初始频域图中的待滤波区域;确定与待滤波区域对应的初始图像中的目标像素区域,以及初始图像中与像素区域相邻的参考像素区域;比较初始图像中目标像素区域与参考像素区域的像素值;在比较结果为目标像素区域的像素值与参考像素区域的像素差值大于设定阈值的情况下,使用滤波器对待滤波区域进行滤波处理,得到目标频域图。
可选地,根据目标频域图确定初始图像的倾斜角度包括:对目标频域图进行二值化处理,得到目标频域图对应的目标图像;获取目标图像的边缘图像;对边缘图像进行霍夫变换矩阵计算,以将边缘图像中的点映射到霍夫空间中;根据映射结果确定边缘图像中目标线段的角度信息和位置信息;根据目标线段的角度信息和位置信息确定目标频域图的倾斜角度。
可选地,根据映射结果确定边缘图像中目标线段的角度信息和位置信息包括:将霍夫变换矩阵中所有大于预设阈值的元素确定为霍夫空间中的目标峰值点;将边缘图像映射到霍夫空间中的同一个目标峰值点上的像素点,确定为目标线段对应的线段像素集合;根据目标线段对应的线段像素集合中的像素点坐标确定边缘图像中目标线段的角度信息和位置信息。
可选地,根据倾斜角度确定与初始图像对应的目标图像包括:对目标频域图进行傅里叶反变换处理,得到初始图像对应的参考图像,其中,参考图像的显示方向与初始图像的显示方向一致;根据倾斜角度旋转参考图像,得到目标图像。
根据本申请实施例的另一方面,还提供了一种目标图像的确定装置,包括:处理模块,用于对待旋转的初始图像进行图像处理,得到与初始图像对应的目标频域图,其中,初始图像是目标文本的图像,初始图像的显示方向与用于显示图像的目标屏幕的显示方向不一致;第一确定模块,用于根据目标频域图确定初始图像的倾斜角度;第二确定模块,用于根据倾斜角度确定与初始图像对应的目标图像,其中,目标图像的显示方向与用于显示图像的目标屏幕的显示方向一致。
可选地,处理模块包括:第一获取单元,用于获取初始图像;第一处理单元,用于对初始图像进行频域变换处理,得到初始频域图;第二处理单元,用于使用滤波器对初始频域图进行滤波处理,以滤除初始图像对应的噪声部分,得到目标频域图。
根据本申请实施例的另一方面,还提供了一种存储介质,该存储介质包括存储的程序,程序运行时执行上述的方法。
根据本申请实施例的另一方面,还提供了一种电子装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器通过计算机程序执行上述的方法。
本方案可以应用于深度学习技术领域进行计算机视觉处理,在本申请实施例中,采用对待旋转的初始图像进行图像处理,得到与初始图像对应的目标频域图,其中,初始图像是目标文本的图像,初始图像的显示方向与用于显示图像的目标屏幕的显示方向不一致;根据目标频域图确定初始图像的倾斜角度;根据倾斜角度确定与初始图像对应的目标图像,其中,目标图像的显示方向与用于显示图像的目标屏幕的显示方向一致的方式,通过对原始的包含目标文本的图像进行处理,从而可得到初始图像的目标频域图,通过频域图的频域信息能够清楚的反映出初始图像中的像素分布的倾斜角度,从而得到初始图像的倾斜角度,并根据该倾斜角度对初始图像进行旋转处理,从而使得初始图像的显示方向与显示初始图像的目标屏幕的方向一致,避免了以图像背景复杂、图像过曝光以及图像弱曝光对图像旋转造成的影像,达到了根据初始图像的频域图确定待旋转的图像的倾斜角度的目的,从而实现了提高了对待旋转的图像的图像矫正效率的技术效果,进而解决了对待旋转的图像的图像矫正效率较低的技术问题。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是根据本申请实施例的目标图像的确定方法的硬件环境的示意图;
图2是根据本申请实施例的一种可选的目标图像的确定方法的流程图;
图3是根据本申请实施例的一种可选的目标图像的确定装置的示意图;
图4是根据本申请实施例的一种终端的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本申请实施例的一方面,提供了一种目标图像的确定的方法实施例。
可选地,在本实施例中,上述目标图像的确定方法可以应用于如图1所示的由终端101和服务器103所构成的硬件环境中。如图1所示,服务器103通过网络与终端101进行连接,可用于为终端或终端上安装的客户端提供服务(如数据计算服务、图像处理服务等),可在服务器上或独立于服务器设置数据库,用于为服务器103提供数据存储服务,上述网络包括但不限于:广域网、城域网或局域网,终端101并不限定于PC、手机、平板电脑等。本申请实施例的目标图像的确定方法可以由服务器103来执行,也可以由终端101来执行,还可以是由服务器103和终端101共同执行。其中,终端101执行本申请实施例的目标图像的确定方法也可以是由安装在其上的客户端来执行。
图2是根据本申请实施例的一种可选的目标图像的确定方法的流程图,如图2所示,该方法可以包括以下步骤:
步骤S202,对待旋转的初始图像进行图像处理,得到与初始图像对应的目标频域图,其中,初始图像是目标文本的图像,初始图像的显示方向与用于显示图像的目标屏幕的显示方向不一致;
步骤S204,根据目标频域图确定初始图像的倾斜角度;
步骤S206,根据倾斜角度确定与初始图像对应的目标图像,其中,目标图像的显示方向与用于显示图像的目标屏幕的显示方向一致。
通过上述步骤S202至步骤S206,通过对原始的包含目标文本的图像进行处理,从而可得到初始图像的目标频域图,通过频域图的频域信息能够清楚的反映出初始图像中的像素分布的倾斜角度,从而得到初始图像的倾斜角度,并根据该倾斜角度对初始图像进行旋转处理,从而使得初始图像的显示方向与显示初始图像的目标屏幕的方向一致,避免了以图像背景复杂、图像过曝光以及图像弱曝光对图像旋转造成的影像,达到了根据初始图像的频域图确定待旋转的图像的倾斜角度的目的,从而实现了提高了对待旋转的图像的图像矫正效率的技术效果,进而解决了对待旋转的图像的图像矫正效率较低的技术问题。
在步骤S202提供的技术方案中,图像处理可以但不限于对图像进行傅里叶变换处理、对图像的尺寸进行处不调整处理(比如调整图像的长款比例)、图像的二值化处理等等。
可选地,在本实施例中,初始图像可以是通过拍摄设备拍摄的图像,也可以是使用截图工具截取到的图像,本方案对此不作限定。
可选地,在本申请实施例中,目标文本可以是文字、图像、字符等等,本方案对此不作限定。
在步骤S204提供的技术方案中,目标频域图中能够直观的反映出图像像素分布的主要倾斜方向,该倾斜方向可确定为图像的倾斜方向,进而得到初始图像的倾斜方向。
可选地,在本申请实施例中,在进行完图像处理得到初始图像的频域图后,为了更好快速有效的却额定出初始图像的倾斜角度,可以对目标频域图进行平移处理,使得目标频域图中的指定点位于一个预设的辅助线上,指定点可以但不限于是频域图的中心点、图像的端点或者图中任意一点,辅助线可以是预先设置的线与显示初始图像的目标屏幕的边界垂直或平行的线,辅助线可以是单根也可以是相互垂直的两根,本方案对此不作限定。
作为一种可选的实施例,对待旋转的初始图像进行图像处理,得到与初始图像对应的目标频域图包括:
S11,获取初始图像;
S12,对初始图像进行频域变换处理,得到初始频域图;
S13,使用滤波器对初始频域图进行滤波处理,以滤除初始图像对应的噪声部分,得到目标频域图。
可选地,在本申请实施例中,对初始图像进行频域变换处理可以是对图像进行傅里叶变换处理,可以使用如下公式进行傅里叶变换处理,
Figure BDA0003165177690000071
式中f(x,y)代表一幅大小为M*N的矩阵,其中x=0,1,2,…,M-1和y=0,1,2,…,N-1,F(u,v)表示f(x,y)的傅里叶变换。可以转换为三角函数表示方法,其中u和v可用于确定正余弦的频率。F(u,v)所在坐标系被称为频域,由u=0,1,2,…,M-1和v=0,1,2,…,N-1定义的M*N矩阵常称为频域矩阵。f(x,y)所在坐标系被称为空间域,由x=0,1,2,…,M-1和y=0,1,2,…,N-1所定义的M*N矩阵常被称为空间域矩阵。显然频域矩阵的大小与原空间域矩阵大小相同。频域矩阵中每个点的都代表了一个频率为u,v的函数,这些函数在空间域的组合即为原函数f(x,y)。
可选地,在本申请实施例中,傅里叶变换之后的结果可以使用实数图像加虚数图像显示,或者使用幅度图像加相位图像显示,在实际的图像处理过程中,可以仅仅使用幅度图像显示,因为幅度图像包含了原图像几乎所有需要的几何信息。
可选地,在本申请实施例中,滤波器的滤波范围可以是根据需求预先设置的,还可以是根据历史滤波结果确定的,还可以是对初始图像中的曝光区域进行识别计算处理得到的,本方案对此不作限定。
作为一种可选的实施例,使用滤波器对初始频域图进行滤波处理,得到目标频域图包括:
S21,根据预设频率范围确定初始频域图中的待滤波区域;
S22,确定与待滤波区域对应的初始图像中的目标像素区域,以及初始图像中与像素区域相邻的参考像素区域;
S23,比较初始图像中目标像素区域与参考像素区域的像素值;
S24,在比较结果为目标像素区域的像素值与参考像素区域的像素差值大于设定阈值的情况下,使用滤波器对待滤波区域进行滤波处理,得到目标频域图。
可选地,在本申请实施例中,预设频率范围可以是根据历史经验预先确定的。
可选地,在本申请实施例中,设定阈值可以是根据需求灵活设置的,或者是根据图像的像素进行计算得到的,比如计算图像任意两个像素点之间的差值,得到多个像素差值,并计算像素差值的平均值,并将该平均值确定为设定阈值。
通过以上步骤,在进行滤波处理之前先检测滤波区域和与滤波区域相近区域处的像素是否相近,若像素值相差不大,则证明待滤波区域不是曝光区域,从而大大的降低了将图像中正常的区域确定为曝光区域的概率。
作为一种可选地实施例,检测目标频域图的倾斜角度包括:
S31,对目标频域图进行二值化处理,得到目标频域图对应的目标图像;
S32,获取目标图像的边缘图像;
S33,对边缘图像进行霍夫变换矩阵计算,以将边缘图像中的点映射到霍夫空间中;
S34,根据映射结果确定边缘图像中目标线段的角度信息和位置信息;
S35,根据目标线段的角度信息和位置信息确定目标频域图的倾斜角度。
可选地,在本申请实施例中,通过获取变化矩阵将图像空间中的直线变换到参数空间中的点。当图像空间中的多个点都映射到参数空间的一个点上,从而能确定出图像空间中的多个点组成了一条线,也就是本申请中的目标线段,并根据图像空间中各点的坐标从而确定出目标线段的位置信息,从而可确定出目标线段的角度和位置信息。
作为一种可选地实施例,根据映射结果确定边缘图像中目标线段的角度信息和位置信息包括:
S41,将霍夫变换矩阵中所有大于预设阈值的元素确定为霍夫空间中的目标峰值点;
S42,将边缘图像映射到霍夫空间中的同一个目标峰值点上的像素点,确定为目标线段对应的线段像素集合;
S43,根据目标线段对应的线段像素集合中的像素点坐标确定边缘图像中目标线段的角度信息和位置信息。
可选地,在本申请实施例中,目标峰值点为参数空间上的点,待点对应的图像空间上得点的数量满足目标条件,该目标条件可以是目标峰值点对应的图像空间的点的数量大于设定阈值、点的数量最多等等,本方案对此不作限定。
作为一种可选地实施例,根据倾斜角度确定与初始图像对应的目标图像包括:
S51,对目标频域图进行傅里叶反变换处理,得到初始图像对应的参考图像,其中,参考图像的显示方向与初始图像的显示方向一致;
S52,根据倾斜角度旋转参考图像,得到目标图像。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例的方法。
根据本申请实施例的另一个方面,还提供了一种用于实施上述目标图像的确定方法的目标图像的确定装置。图3是根据本申请实施例的一种可选的目标图像的确定装置的示意图,如图3所示,该装置可以包括:
处理模块32,用于对待旋转的初始图像进行图像处理,得到与初始图像对应的目标频域图,其中,初始图像是目标文本的图像,初始图像的显示方向与用于显示图像的目标屏幕的显示方向不一致;
第一确定模块34,用于根据目标频域图确定初始图像的倾斜角度;
第二确定模块36,用于根据倾斜角度确定与初始图像对应的目标图像,其中,目标图像的显示方向与用于显示图像的目标屏幕的显示方向一致。
需要说明的是,该实施例中的处理模块32可以用于执行本申请实施例中的步骤S202,该实施例中的第一确定模块34可以用于执行本申请实施例中的步骤S204,该实施例中的第二确定模块36可以用于执行本申请实施例中的步骤S206。
此处需要说明的是,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在如图1所示的硬件环境中,可以通过软件实现,也可以通过硬件实现。
通过上述模块,可以解决了对待旋转的图像的图像矫正效率较低的技术问题,进而达到提高了对待旋转的图像的图像矫正效率的技术效果。
可选地,处理模块包括:第一获取单元,用于获取初始图像;第一处理单元,用于对初始图像进行频域变换处理,得到初始频域图;第二处理单元,用于使用滤波器对初始频域图进行滤波处理,以滤除初始图像对应的噪声部分,得到目标频域图。
可选地,第二处理单元用于:根据预设频率范围确定初始频域图中的待滤波区域;确定与待滤波区域对应的初始图像中的目标像素区域,以及初始图像中与像素区域相邻的参考像素区域;比较初始图像中目标像素区域与参考像素区域的像素值;在比较结果为目标像素区域的像素值与参考像素区域的像素差值大于设定阈值的情况下,使用滤波器对待滤波区域进行滤波处理,得到目标频域图。
可选地,第一确定模块包括:第三处理单元,用于对目标频域图进行二值化处理,得到目标频域图对应的目标图像;第二获取单元,用于获取目标图像的边缘图像;计算单元,用于对边缘图像进行霍夫变换矩阵计算,以将边缘图像中的点映射到霍夫空间中;第一确定单元,用于根据映射结果确定边缘图像中目标线段的角度信息和位置信息;第二确定单元,用于根据目标线段的角度信息和位置信息确定目标频域图的倾斜角度。
可选地,第一确定单元用于:将霍夫变换矩阵中所有大于预设阈值的元素确定为霍夫空间中的目标峰值点;将边缘图像映射到霍夫空间中的同一个目标峰值点上的像素点,确定为目标线段对应的线段像素集合;根据目标线段对应的线段像素集合中的像素点坐标确定边缘图像中目标线段的角度信息和位置信息。
可选地,第二确定模块包括:第四处理单元,用于对目标频域图进行傅里叶反变换处理,得到初始图像对应的参考图像,其中,参考图像的显示方向与初始图像的显示方向一致;旋转单元,用于根据倾斜角度旋转参考图像,得到目标图像。
此处需要说明的是,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在如图1所示的硬件环境中,可以通过软件实现,也可以通过硬件实现,其中,硬件环境包括网络环境。
根据本申请实施例的另一个方面,还提供了一种用于实施上述目标图像的确定方法的服务器或终端。
图4是根据本申请实施例的一种终端的结构框图,如图4所示,该终端可以包括:一个或多个(图中仅示出一个)处理器401、存储器403、以及传输装置405,如图4所示,该终端还可以包括输入输出设备407。
其中,存储器403可用于存储软件程序以及模块,如本申请实施例中的目标图像的确定方法和装置对应的程序指令/模块,处理器401通过运行存储在存储器403内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的目标图像的确定方法。存储器403可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器403可进一步包括相对于处理器401远程设置的存储器,这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
上述的传输装置405用于经由一个网络接收或者发送数据,还可以用于处理器与存储器之间的数据传输。上述的网络具体实例可包括有线网络及无线网络。在一个实例中,传输装置405包括一个网络适配器(Network Interface Controller,NIC),其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中,传输装置405为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
其中,具体地,存储器403用于存储应用程序。
处理器401可以通过传输装置405调用存储器403存储的应用程序,以执行下述步骤:
对待旋转的初始图像进行图像处理,得到与初始图像对应的目标频域图,其中,初始图像是目标文本的图像,初始图像的显示方向与用于显示图像的目标屏幕的显示方向不一致;
根据目标频域图确定初始图像的倾斜角度;
根据倾斜角度确定与初始图像对应的目标图像,其中,目标图像的显示方向与用于显示图像的目标屏幕的显示方向一致。
采用本申请实施例,提供了一种目标图像的确定方法、装置、存储介质和电子装置的方案。通过对原始的包含目标文本的图像进行处理,从而可得到初始图像的目标频域图,通过频域图的频域信息能够清楚的反映出初始图像中的像素分布的倾斜角度,从而得到初始图像的倾斜角度,并根据该倾斜角度对初始图像进行旋转处理,从而使得初始图像的显示方向与显示初始图像的目标屏幕的方向一致,避免了以图像背景复杂、图像过曝光以及图像弱曝光对图像旋转造成的影像,达到了根据初始图像的频域图确定待旋转的图像的倾斜角度的目的,从而实现了提高了对待旋转的图像的图像矫正效率的技术效果,进而解决了对待旋转的图像的图像矫正效率较低的技术问题。
可选地,本实施例中的具体示例可以参考上述实施例中所描述的示例,本实施例在此不再赘述。
本领域普通技术人员可以理解,图4所示的结构仅为示意,终端可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(Mobile InternetDevices,MID)、PAD等终端设备。图4其并不对上述电子装置的结构造成限定。例如,终端还可包括比图4中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图4所示不同的配置。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(RandomAccess Memory,RAM)、磁盘或光盘等。
本申请的实施例还提供了一种存储介质。可选地,在本实施例中,上述存储介质可以用于执行目标图像的确定方法的程序代码。
可选地,在本实施例中,上述存储介质可以位于上述实施例所示的网络中的多个网络设备中的至少一个网络设备上。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:
对待旋转的初始图像进行图像处理,得到与初始图像对应的目标频域图,其中,初始图像是目标文本的图像,初始图像的显示方向与用于显示图像的目标屏幕的显示方向不一致;
根据目标频域图确定初始图像的倾斜角度;
根据倾斜角度确定与初始图像对应的目标图像,其中,目标图像的显示方向与用于显示图像的目标屏幕的显示方向一致。
可选地,本实施例中的具体示例可以参考上述实施例中所描述的示例,本实施例在此不再赘述。
可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。
在本申请的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

Claims (10)

1.一种目标图像的确定方法,其特征在于,包括:
对待旋转的初始图像进行图像处理,得到与所述初始图像对应的目标频域图,其中,所述初始图像是目标文本的图像,所述初始图像的显示方向与用于显示图像的目标屏幕的显示方向不一致;
根据所述目标频域图确定所述初始图像的倾斜角度;
根据所述倾斜角度确定与所述初始图像对应的目标图像,其中,所述目标图像的显示方向与用于显示图像的所述目标屏幕的显示方向一致。
2.根据权利要求1所述的方法,其特征在于,对待旋转的所述初始图像进行图像处理,得到与所述初始图像对应的所述目标频域图包括:
获取初始图像;
对所述初始图像进行频域变换处理,得到初始频域图;
使用滤波器对所述初始频域图进行滤波处理,以滤除所述初始图像对应的噪声部分,得到目标频域图。
3.根据权利要求2所述的方法,其特征在于,使用滤波器对所述初始频域图进行滤波处理,得到所述目标频域图包括:
根据预设频率范围确定所述初始频域图中的待滤波区域;
确定与所述待滤波区域对应的所述初始图像中的目标像素区域,以及所述初始图像中与所述像素区域相邻的参考像素区域;
比较所述初始图像中所述目标像素区域与所述参考像素区域的像素值;
在比较结果为所述目标像素区域的像素值与所述参考像素区域的像素差值大于设定阈值的情况下,使用滤波器对所述待滤波区域进行滤波处理,得到所述目标频域图。
4.根据权利要求1所述的方法,其特征在于,根据所述目标频域图确定所述初始图像的倾斜角度包括:
对所述目标频域图进行二值化处理,得到所述目标频域图对应的目标图像;
获取所述目标图像的边缘图像;
对所述边缘图像进行霍夫变换矩阵计算,以将所述边缘图像中的点映射到霍夫空间中;
根据映射结果确定所述边缘图像中目标线段的角度信息和位置信息;
根据所述目标线段的所述角度信息和所述位置信息确定所述目标频域图的倾斜角度。
5.根据权利要求4所述的方法,其特征在于,根据所述映射结果确定所述边缘图像中目标线段的所述角度信息和所述位置信息包括:
将所述霍夫变换矩阵中所有大于预设阈值的元素确定为霍夫空间中的目标峰值点;
将所述边缘图像映射到所述霍夫空间中的同一个所述目标峰值点上的像素点,确定为所述目标线段对应的线段像素集合;
根据所述目标线段对应的所述线段像素集合中的像素点坐标确定所述边缘图像中所述目标线段的所述角度信息和所述位置信息。
6.根据权利要求1所述的方法,其特征在于,根据所述倾斜角度确定与所述初始图像对应的所述目标图像包括:
对所述目标频域图进行傅里叶反变换处理,得到所述初始图像对应的参考图像,其中,所述参考图像的显示方向与所述初始图像的显示方向一致;
根据所述倾斜角度旋转所述参考图像,得到所述目标图像。
7.一种目标图像的确定装置,其特征在于,包括:
处理模块,用于对待旋转的初始图像进行图像处理,得到与所述初始图像对应的目标频域图,其中,所述初始图像是目标文本的图像,所述初始图像的显示方向与用于显示图像的目标屏幕的显示方向不一致;
第一确定模块,用于根据所述目标频域图确定所述初始图像的倾斜角度;
第二确定模块,用于根据所述倾斜角度确定与所述初始图像对应的目标图像,其中,所述目标图像的显示方向与用于显示图像的所述目标屏幕的显示方向一致。
8.根据权利要求7所述的方法,其特征在于,所述处理模块包括:
第一获取单元,用于获取初始图像;
第一处理单元,用于对所述初始图像进行频域变换处理,得到初始频域图;
第二处理单元,用于使用滤波器对所述初始频域图进行滤波处理,以滤除所述初始图像对应的噪声部分,得到目标频域图。
9.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,所述程序运行时执行上述权利要求1至6任一项中所述的方法。
10.一种电子装置,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器通过所述计算机程序执行上述权利要求1至6任一项中所述的方法。
CN202110802402.3A 2021-07-15 2021-07-15 目标图像的确定方法、装置、存储介质和电子装置 Pending CN113469885A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110802402.3A CN113469885A (zh) 2021-07-15 2021-07-15 目标图像的确定方法、装置、存储介质和电子装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110802402.3A CN113469885A (zh) 2021-07-15 2021-07-15 目标图像的确定方法、装置、存储介质和电子装置

Publications (1)

Publication Number Publication Date
CN113469885A true CN113469885A (zh) 2021-10-01

Family

ID=77880757

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110802402.3A Pending CN113469885A (zh) 2021-07-15 2021-07-15 目标图像的确定方法、装置、存储介质和电子装置

Country Status (1)

Country Link
CN (1) CN113469885A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109614972A (zh) * 2018-12-06 2019-04-12 泰康保险集团股份有限公司 图像处理方法、装置、电子设备及计算机可读介质
CN110458858A (zh) * 2019-08-14 2019-11-15 中国科学院长春光学精密机械与物理研究所 一种十字靶标的检测方法、系统及存储介质
CN112070810A (zh) * 2020-08-31 2020-12-11 上海爱观视觉科技有限公司 定位方法、可移动设备及计算机可读存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109614972A (zh) * 2018-12-06 2019-04-12 泰康保险集团股份有限公司 图像处理方法、装置、电子设备及计算机可读介质
CN110458858A (zh) * 2019-08-14 2019-11-15 中国科学院长春光学精密机械与物理研究所 一种十字靶标的检测方法、系统及存储介质
CN112070810A (zh) * 2020-08-31 2020-12-11 上海爱观视觉科技有限公司 定位方法、可移动设备及计算机可读存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张临临: ""基于图像分层和动态压缩的图像细节增强算法研究"", 《中国优秀硕士学位论文全文数据库(信息科技辑)》, pages 34 - 35 *

Similar Documents

Publication Publication Date Title
WO2020098250A1 (zh) 字符识别方法、服务器及计算机可读存储介质
EP3882822A1 (en) Encoded pattern processing method and device , storage medium and electronic device
WO2020252920A1 (zh) 图片校正方法、装置、计算机设备及计算机可读存储介质
CN109919971B (zh) 图像处理方法、装置、电子设备及计算机可读存储介质
CN111008935B (zh) 一种人脸图像增强方法、装置、系统及存储介质
CN110147708B (zh) 一种图像数据处理方法和相关装置
CN109598270B (zh) 扭曲文字的识别方法及装置、存储介质及处理器
CN110751146A (zh) 文本区域检测方法、装置、电子终端和计算机可读存储介质
CN111882565B (zh) 一种图像二值化方法、装置、设备及存储介质
CN111667504A (zh) 一种人脸追踪方法、装置及设备
CN111031359B (zh) 视频播放方法、装置、电子设备和计算机可读存储介质
CN115063861A (zh) 模型训练方法、图像背景相似判断方法及装置
CN110766068B (zh) 一种验证码识别方法及计算设备
CN115761826A (zh) 掌静脉有效区域提取方法、系统、介质及电子设备
CN115100660A (zh) 文档图像的倾斜校正方法及装置
CN110827301A (zh) 用于处理图像的方法和装置
CN113516697A (zh) 图像配准的方法、装置、电子设备及计算机可读存储介质
CN108268778B (zh) 数据处理方法、装置及存储介质
CN111353325A (zh) 关键点检测模型训练方法及装置
CN114493988A (zh) 一种图像虚化方法、图像虚化装置及终端设备
CN108304840B (zh) 一种图像数据处理方法以及装置
US20170140538A1 (en) Image preprocessing method and electronic device for image registration
CN113469885A (zh) 目标图像的确定方法、装置、存储介质和电子装置
CN111222446A (zh) 人脸识别方法、人脸识别装置及移动终端
CN108629219B (zh) 一种识别一维码的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination