CN109543669A - 文字的处理方法及装置、存储介质、电子装置 - Google Patents
文字的处理方法及装置、存储介质、电子装置 Download PDFInfo
- Publication number
- CN109543669A CN109543669A CN201811474244.8A CN201811474244A CN109543669A CN 109543669 A CN109543669 A CN 109543669A CN 201811474244 A CN201811474244 A CN 201811474244A CN 109543669 A CN109543669 A CN 109543669A
- Authority
- CN
- China
- Prior art keywords
- pixel
- coordinate
- region
- area
- target area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/24—Aligning, centring, orientation detection or correction of the image
- G06V10/245—Aligning, centring, orientation detection or correction of the image by locating a pattern; Special marks for positioning
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种文字的处理方法及装置、存储介质、电子装置。其中,该文字的处理方法包括:根据第二目标区域中的像素点坐标确定第一目标区域中的像素点坐标,其中,第二目标区域是放大第一目标区域得到的;基于第二目标区域中的像素点坐标与第一目标区域中的像素点坐标确定坐标对应关系;根据坐标对应关系与第一目标区域中的像素点的像素值确定第二目标区域中的像素点的像素值,其中,第二目标区域中的像素值构成目标图像,其中,目标图像中包括目标文字,达到了对图像中存在微小文字的精确识别的目的。本发明解决了现有技术中无法精确识别图片中模糊文字和微小文字的技术问题。
Description
技术领域
本发明涉及文字处理领域,具体而言,涉及一种文字的处理方法及装置、存储介质、电子装置。
背景技术
目前,文字识别是智能识别技术中的一个重要技术。文字识别是指利用计算机对图像中文字进行识别、验证和记录等处理的技术。人们在生产和生活中,要处理大量的文字、报表和文本,文字识别技术能够大大减轻人们的工作。
现有技术中,对图像中含有模糊或者微小文字进行超采样比较困难,无法提高图片中模糊文字和微小文字的辨识度。
针对现有技术中无法精确识别图片中模糊文字和微小文字的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种文字的处理方法及装置、存储介质、电子装置,以至少解决现有技术中无法精确识别图片中模糊文字和微小文字的技术问题。
根据本发明实施例的一个方面,提供了一种文字的处理方法,包括:根据第二目标区域中的像素点坐标确定第一目标区域中的像素点坐标,其中,所述第二目标区域是放大所述第一目标区域得到的;基于所述第二目标区域中的像素点坐标与所述第一目标区域中的像素点坐标确定所述坐标对应关系;根据所述坐标对应关系与第一目标区域中的像素点的像素值确定第二目标区域中的像素点的像素值,其中,所述第二目标区域中的像素值构成目标图像,其中,所述目标图像中包括目标文字;当所述第二目标区域中的像素点坐标与所述第一目标区域中的像素点坐标之间是整数的对应关系时,将所述第一目标区域中的像素点的像素值作为所述第二目标区域中的像素点像素值。
进一步地,根据所述坐标对应关系与第一目标区域中的像素点的像素值确定第二目标区域中的像素点的像素值包括:当所述第二目标区域中的像素点坐标与所述第一目标区域中的像素点坐标之间不是整数的对应关系时,确定所述第一目标区域中的像素点的包围矩形的像素点;将所述包围矩形的像素点的像素值,通过回归预测模型来确定所述第二目标区域中的像素点的像素值。
进一步地,根据第二目标区域中的像素点坐标确定第一目标区域中的像素点坐标之前,获取所述第一目标区域包括:步骤1:利用文字检测法确定包含目标文字的目标图像的多个区域;步骤2:确定区域的边框在文字类别上的概率值最小的区域和概率值最大的区域;步骤3:如果最大概率值的区域面积与剩余区域面积相比重叠度大于预设阈值,将与所述最大概率值的区域面积重叠度大于预设阈值的其它区域面积去除,与最大概率值的区域面积重叠度不大于预设阈值的其它区域面积保留,并将最大概率值的区域设为第一区域;步骤4:当在所述保留的其它区域中所对应的最大概率值的区域面积与相对剩余区域中剩余区域的面积相比重叠度大于预设阈值,根据上述步骤3去除相对剩余区域,并将在剩余区域中所对应的最大概率值的区域设为第二区域;步骤5:依次确定在剩余区域中所对应的最大概率值的区域,即全部的第一目标区域。
进一步地,根据第二目标区域中的像素点坐标确定第一目标区域中的像素点坐标包括:通过如下公式计算在所述第一目标区域所对应的像素点的坐标(xk,yk):
其中,(Xk,Yk)表示所述第二目标区域所对应的像素点的坐标,M表示放大所述第一目标区域获得第二目标区域的放大倍数。
进一步地,当所述第二目标区域中的像素点坐标与所述第一目标区域中的像素点坐标之间不是整数的对应关系时,确定所述第一目标区域中的像素点的包围矩形的像素点包括:当所述第一目标区域中的像素点被2*2个包围矩形的像素点包裹,则所述第一目标区域中的像素点组成的矩形的坐标分别为其中,符号分别为向下取整,向上取整。
进一步地,所述方法包括:通过所述第一目标区域中像素点的矩形的坐标的像素点的像素值建立所述第二目标区域中像素值的所述回归预测模型。
根据本发明实施例的另一方面,还提供了一种文字的处理装置,包括:第一确定单元,用于根据第二目标区域中的像素点坐标确定第一目标区域中的像素点坐标,其中,所述第二目标区域是放大所述第一目标区域得到的;第二确定单元,用于基于所述第二目标区域中的像素点坐标与所述第一目标区域中的像素点坐标确定所述坐标的对应关系;第三确定单元,用于根据所述坐标的对应关系与第一目标区域中的像素点的像素值确定第二目标区域中的像素点的像素值,其中,所述第二目标区域中的像素值构成目标图像,其中,所述目标图像中包括目标文字。
进一步地,所述第三确定单元包括:第一处理模块,用于当所述第二目标区域中的像素点坐标与所述第一目标区域中的像素点坐标之间是整数的对应关系时,将所述第一目标区域中的像素点的像素值作为所述第二目标区域中的像素点像素值;第一确定模块,用于当所述第二目标区域中的像素点坐标与所述第一目标区域中的像素点坐标之间不是整数的对应关系时,确定所述第一目标区域中的像素点的包围矩形的像素点;第二确定模块,用于将所述包围矩形的像素点的像素值,通过预测模型来确定所述第二目标区域中的像素点的像素值。
根据本发明实施例的另一方面,还提供了一种存储介质,所述存储介质包括存储的程序,其中,所述程序运行时执行上述任一项所述的方法实施例中的步骤。
根据本发明的又一个实施例,还提供了一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。
在本发明实施例中,根据第二目标区域中的像素点坐标确定第一目标区域中的像素点坐标,其中,第二目标区域是放大第一目标区域得到的;基于第二目标区域中的像素点坐标与第一目标区域中的像素点坐标确定坐标对应关系;根据坐标对应关系与第一目标区域中的像素点的像素值确定第二目标区域中的像素点的像素值,其中,第二目标区域中的像素值构成目标图像,其中,目标图像中包括目标文字,达到了对图像中存在微小文字的精确识别的目的,进而解决了现有技术中无法精确识别图片中模糊文字和微小文字的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的文字的处理方法的流程图;
图2是根据本发明实施例的文字的处理装置的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本发明实施例,提供了一种文字的处理方法的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
下面将对本发明实施例的文字的处理方法进行详细说明。
图1是根据本发明实施例的文字的处理方法的流程图,如图1所示,该文字的处理方法包括如下步骤:
步骤S102,根据第二目标区域中的像素点坐标确定第一目标区域(目标区域为图像中含有文字的区域)中的像素点坐标,其中,第二目标区域是放大第一目标区域得到的。
需要说明的是,根据第二目标区域中的像素点坐标确定第一目标区域中的像素点坐标之前,获取第一目标区域可以包括:步骤1:利用文字检测法确定包含目标文字的目标图像的多个区域;步骤2:确定区域的边框在文字类别上的概率值最小的区域和概率值最大的区域;步骤3:如果最大概率值的区域面积与剩余区域面积相比重叠度大于预设阈值,将与最大概率值的区域面积重叠度大于预设阈值的其它区域面积去除,与最大概率值的区域面积重叠度不大于预设阈值的其它区域面积保留,并将最大概率值的区域设为第一区域;步骤4:如果在保留的其它区域中所对应的最大概率值的区域面积与相对剩余区域中剩余区域的面积相比重叠度大于预设阈值,根据上述步骤3去除相对剩余区域,并将在剩余区域中所对应的最大概率值的区域设为第二区域;步骤5:依次确定在剩余区域中所对应的最大概率值的区域,即全部的第一目标区域。
例如,在一个图像中利用文字检测法预测n个边框(文字可能存在的区域),包括每个边框是文字区域的置信度以及每个边框区域(有边框组成的可能有目标文字区域)在文字类别上的概率;根据n个边框可以预测出n个目标窗口,将n个目标窗口根据每个边框区域在文字类别上的概率从小到大排列A1,A2,...,An,其中A1,An分别为概率最小和最大的区域;设定重叠率(重叠区域面积比例)阈值为α(优选的,0.3≤α≤0.5);从最大概率的区域An开始,分别判断A1,A2,...,An-1与An的重叠度是否大于阈值α,扔掉A1,A2,...,An-1中重叠度大于阈值的区域,并将An标记为第一个区域;再从剩下的区域中,判断剩下的区域中最大概率区域与其他区域的重叠度。依次对比,找到所有标记(目标区域,即含有文字的区域)的区域B1,B2,...,Bm。
步骤S104,基于第二目标区域中的像素点坐标与第一目标区域中的像素点坐标确定坐标对应关系。
其中,为了得到放大后区域的各点的像素值,根据第二目标区域中的像素点坐标确定第一目标区域中的像素点坐标可以包括:通过如下公式计算在第一目标区域所对应的像素点的坐标(xk,yk):
其中,(Xk,Yk)表示第二目标区域所对应的像素点的坐标,m表示放大第一目标区域获得第二目标区域的放大倍数(此步骤的目的是为了获取到第二目标区域的像素点所对应在第一目标区域的像素点)。
例如,选取第一目标区域B1,B2,...,Bm中的一个,记此图像为So,放大后的文字区域图像为Sl,超采样图像为Sh;设So为x*y大小,即共有xy个像素点,将So放大m2倍,则放大后的图像Sl的大小为mx*my,共有m2xy个像素点。取Sl中m2xy个像素点中的一个点k,设其坐标为(Xk,Yk),则对应的放大前图中的像素点k0的坐标为(xk,yk),且
其做法:现在只知道原目标区域的像素值以及对原目标区域放大的倍数,故首先根据公式,得到放大后目标区域的像素点所对应的原目标区域的像素点,若计算出原目标区域像素点的坐标为整数,即可将此坐标对应的像素点的像素值赋予放大后目标区域的所求的像素点的像素值。
然后,若计算出原目标区域像素点的坐标为小数,即不知道此坐标对应的像素点的像素值是多少,故没法将此坐标所对应的像素点的像素值赋予放大后目标区域的所求的像素点的像素值。故建立SVR模型,通过原目标区域像素点的矩形坐标所对应的像素值来预测原目标区域计算为小数的像素点坐标的像素值,计算出的像素值即可赋予放大后目标区域的所求的像素点的像素值。
步骤S106,根据坐标对应关系与第一目标区域中的像素点的像素值确定第二目标区域中的像素点的像素值,其中,第二目标区域中的像素值构成目标图像,其中,目标图像中包括目标文字。
需要说明的是,根据坐标对应关系与第一目标区域中的像素点的像素值确定第二目标区域中的像素点的像素值可以包括:当第二目标区域中的像素点坐标与第一目标区域中的像素点坐标之间是整数的对应关系时,将第一目标区域中的像素点的像素值作为第二目标区域中的像素点像素值。
还需要说明的是,根据坐标对应关系与第一目标区域中的像素点的像素值确定第二目标区域中的像素点的像素值可以包括:当第二目标区域中的像素点坐标与第一目标区域中的像素点坐标之间不是整数的对应关系时,确定第一目标区域中的像素点的包围矩形的像素点;将包围矩形的像素点的像素值,通过回归预测模型来确定第二目标区域中的像素点的像素值。
其中,可以通过所述第一目标区域中像素点的矩形的坐标的像素点的像素值建立所述第二目标区域中像素值的回归预测模型。
同时还需要说明的是,当第二目标区域中的像素点坐标与第一目标区域中的像素点坐标之间不是整数的对应关系时,确定第一目标区域中的像素点的包围矩形的像素点包括:当第一目标区域中的像素点被2*2个包围矩形的像素点包裹,则第一目标区域中的像素点组成的矩形的坐标分别为其中,符号分别为向下取整,向上取整。
例如,假设k0的坐标为(3.7,4.8),则其2*2个像素点矩形的坐标分别是(3,4),(3,5),(4,4),(4,5)。
需要说明的是,包围像素点矩形,指包围像素点所处的矩形的坐标。
通过上述步骤,根据第二目标区域中的像素点坐标确定第一目标区域中的像素点坐标,其中,第二目标区域是放大第一目标区域得到的;基于第二目标区域中的像素点坐标与第一目标区域中的像素点坐标确定坐标对应关系;根据坐标对应关系与第一目标区域中的像素点的像素值确定第二目标区域中的像素点的像素值,其中,第二目标区域中的像素值构成目标图像,其中,目标图像中包括目标文字,达到了对图像中存在微小文字的精确识别的目的,进而解决了现有技术中无法精确识别图片中模糊文字和微小文字的技术问题。
本发明还提供了一种优选实施例,该优选实施例提供了一种图像文字的超采样方法。具体步骤如下。
步骤1:获取一个含有文字的图像,定位图像中的目标文字区域。
步骤2:利用放大后目标区域的像素点计算原目标区域所对应的像素点。
步骤3:利用原目标区域所对应的像素点计算其包围像素点矩形的坐标。
步骤4:利用原目标区域的包围像素点矩形的坐标建立放大后目标区域像素值回归预测模型。
步骤5:根据原目标区域所对应的像素点和像素值回归预测模型计算放大后目标区域每一点的像素值,进而得到超采样图片。
其中,对上述步骤的详细内容描述如下:
步骤1:获取一个含有文字的图像,定位图像中的目标文字区域,其具体如下:
1)对步骤1中的图像利用文字检测法预测n个边框(文字可能存在的区域),包括每个边框是文字区域的置信度以及每个边框区域在文字类别上的概率;
2)根据上一步可以预测出n个目标窗口,将n个目标窗口根据每个边框区域在文字类别上的概率从小到大排列A1,A2,...,An,其中A1,An分别为概率最小和最大的区域;
3)设定重叠率(重叠区域面积比例)阈值为α(优选的,0.3≤α≤0.5);
从最大概率的区域An开始,分别判断A1,A2,...,An-1与An的重叠度是否大于阈值α,扔掉A1,A2,...,An-1中重叠度大于阈值的区域,并将An标记为第一个区域;再从剩下的区域中,判断剩下的区域中最大概率区域与其他区域的重叠度。依次对比,找到所有标记(目标区域,即含有文字的区域)的区域B1,B2,...,Bm。
步骤2:利用放大后目标区域的像素点计算原目标区域所对应的像素点:
1)取原目标区域B1,B2,...,Bm中的一个,记此图像为So,放大后的文字区域图像为Sl,超采样图像为Sh;设So为x*y大小,即共有xy个像素点,将So放大m2倍,则放大后的图像Sl的大小为mx*my,共有m2xy个像素点。
2)取Sl中m2xy个像素点中的一个点k,设其坐标为(Xk,Yk),则对应的放大前图中的像素点k0的坐标为(xk,yk),且
步骤3:利用原目标区域所对应的像素点计算其包围像素点矩形的坐标:
将k0用2*2的像素点组成的矩形将k0包裹其中(其中像素点矩形可以为3*3、4*4......),其中2*2的像素点组成的矩形的坐标分别为用向量M表示,且符号分别为向下取整(比自己小的最大整数),向上取整(比自己大的最小整数)。
假设k0的坐标为(3.7,4.8),则其2*2的像素点矩形的坐标分别是(3,4),(3,5),(4,4),(4,5)。
步骤4:利用原目标区域的包围像素点矩形的坐标建立放大后目标区域像素值回归预测模型:利用SVR(支持向量回归)建立像素点的像素值回归模型,设Sl中像素点k的像素值为z,则SVR的输入为(M,k0,z),将数据库中的n个样本都用(M,k0,z)表示,用SVR训练放大后目标区域像素点的像素值回归模型,进而得到像素值回归预测模型;
步骤5:根据原目标区域所对应的像素点和像素值回归预测模型计算放大后目标区域每一点的像素值,进而得到超采样图片。
1)若Step2中k0的坐标(xk,yk)计算为整数,则将对应的k0点的像素值赋予放大后对应的目标区域的像素点k;
2)若Step2中k0的坐标(xk,yk)计算为不为整数,则利用Step4中得到的像素值回归预测模型对k点的像素值进行预测,得到Sl中像素点k的像素值;
3)预测放大后的图片Sl中每一点的像素值,进而得到超采样后的图片Sh。
与现有技术中比,上述优选实施例,利用原目标区域图片上像素点的值建立放大后目标区域的像素点的像素值预测模型对图片上的像素值进行预测,进而得到超采样图片,此方法使得文字的识别率更高,解决了现有技术中由于图片识别中,有可能因为文字的模糊、微小从而导致文字识别过程中的文字识别率低等问题。
根据本发明实施例,还提供了一种文字的处理的装置实施例,需要说明的是,该文字的处理装置可以用于执行本发明实施例中的文字的处理方法,也即本发明实施例中的文字的处理方法可以在该文字的处理装置中执行。
图2是根据本发明实施例的文字的处理装置的示意图,如图2所示,该文字的处理装置可以包括:第一确定单元21、第二确定单元23以及第三确定单元25。下面进行详细说明。
第一确定单元21,用于根据第二目标区域中的像素点坐标确定第一目标区域中的像素点坐标,其中,所述第二目标区域是放大所述第一目标区域得到的。
其中,上述第一确定单元可以包括:第一计算单元,用于通过如下公式计算在第一目标区域所对应的像素点的坐标(xk,yk):
其中,(Xk,Yk)表示第二目标区域所对应的像素点的坐标,M表示放大第一目标区域获得第二目标区域的放大倍数。
第二确定单元23,用于基于所述第二目标区域中的像素点坐标与所述第一目标区域中的像素点坐标确定所述坐标的对应关系。
第三确定单元25,用于根据第一目标区域所对应的像素点和预测模型得到第二目标区域中每一点的像素值,每个像素点构成目标图像,其中,目标图像中包括目标文字。
其中,上述第三确定单元25可以包括:第一处理模块,用于当第二目标区域中的像素点坐标与第一目标区域中的像素点坐标之间是整数的对应关系时,将第一目标区域中的像素点的像素值作为第二目标区域中的像素点像素值。
需要说明的是,上述第三确定单元还可以包括:第一确定模块,用于当第二目标区域中的像素点坐标与第一目标区域中的像素点坐标之间不是整数的对应关系时,确定第一目标区域中的像素点的包围矩形的像素点;第二确定模块,用于将包围矩形的像素点的像素值,通过回归预测模型来确定第二目标区域中的像素点的像素值。
其中,上述第一确定模块还用于执行第一目标区域所对应的像素点被组成第一目标区域所对应的像素点的矩形2*2包裹,其中,2*2的像素点组成的矩形的坐标分别为用向量M表示,且符号分别为向下取整,向上取整。
上述第二确定模块,还用于执行通过所述第一目标区域中像素点的矩形的坐标的像素点的像素值建立所述第二目标区域中像素值的回归预测模型。
通过上述实施例,第一确定单元21根据第二目标区域中的像素点坐标确定第一目标区域中的像素点坐标,其中,第二目标区域是放大第一目标区域得到的;第二确定单元23基于第二目标区域中的像素点坐标与第一目标区域中的像素点坐标确定坐标的对应关系;第三确定单元25根据坐标的对应关系与第一目标区域中的像素点的像素值确定第二目标区域中的像素点的像素值,其中,第二目标区域中的像素值构成目标图像,其中,目标图像中包括目标文字。达到了对图像中存在微小文字的精确识别的目的,进而解决了现有技术中无法精确识别图片中模糊文字和微小文字的技术问题。
需要说明的是,该实施例中的第一确定单元21可以用于执行本发明实施例中的步骤S102,该实施例中的第二确定单元23可以用于执行本发明实施例中的步骤S104,该实施例中的第三确定单元25可以用于执行本发明实施例中的步骤S106。上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例所公开的内容。
作为一个可选实施例,上述装置可以包括:获取单元,用于根据第二目标区域中的像素点坐标确定第一目标区域中的像素点坐标之前,获取第一目标区域包括,其中,上述获取单元还可以包括:第一确定模块,用于利用文字检测法确定包含目标文字的目标图像的多个区域;第二确定模块,用于确定区域的边框在文字类别上的概率值最小的区域和概率值最大的区域;第一处理模块,用于如果最大概率值的区域面积与剩余区域面积相比重叠度大于预设阈值,将与最大概率值的区域面积重叠度大于预设阈值的其它区域面积去除,与最大概率值的区域面积重叠度不大于预设阈值的其它区域面积保留,并将最大概率值的区域设为第一区域;第二处理模块,用于如果在保留的其它区域中所对应的最大概率值的区域面积与相对剩余区域中剩余区域的面积相比重叠度大于预设阈值,根据上述步骤3去除相对剩余区域,并将在剩余区域中所对应的最大概率值的区域设为第二区域;第三确定模块,用于依次确定在剩余区域中所对应的最大概率值的区域,即全部的第一目标区域。
根据本发明实施例的另外一个方面,还提供了一种存储介质,存储介质包括存储的程序,其中,程序运行时控制存储介质所在设备执行以下操作:根据第二目标区域中的像素点坐标确定第一目标区域中的像素点坐标,其中,第二目标区域是放大第一目标区域得到的;基于第二目标区域中的像素点坐标与第一目标区域中的像素点坐标确定坐标对应关系;根据坐标对应关系与第一目标区域中的像素点的像素值确定第二目标区域中的像素点的像素值,其中,第二目标区域中的像素值构成目标图像,其中,目标图像中包括目标文字。
根据坐标对应关系与第一目标区域中的像素点的像素值确定第二目标区域中的像素点的像素值包括:当第二目标区域中的像素点坐标与第一目标区域中的像素点坐标之间是整数的对应关系时,将第一目标区域中的像素点的像素值作为第二目标区域中的像素点像素值。
根据坐标对应关系与第一目标区域中的像素点的像素值确定第二目标区域中的像素点的像素值包括:当第二目标区域中的像素点坐标与第一目标区域中的像素点坐标之间不是整数的对应关系时,确定第一目标区域中的像素点的包围矩形的像素点;将包围矩形的像素点的像素值,通过回归预测模型来确定第二目标区域中的像素点的像素值。
根据第二目标区域中的像素点坐标确定第一目标区域中的像素点坐标之前,获取第一目标区域包括:步骤1:利用文字检测法确定包含目标文字的目标图像的多个区域;步骤2:确定区域的边框在文字类别上的概率值最小的区域和概率值最大的区域;步骤3:如果最大概率值的区域面积与剩余区域面积相比重叠度大于预设阈值,将与最大概率值的区域面积重叠度大于预设阈值的其它区域面积去除,与最大概率值的区域面积重叠度不大于预设阈值的其它区域面积保留,并将最大概率值的区域设为第一区域;步骤4:如果在保留的其它区域中所对应的最大概率值的区域面积与相对剩余区域中剩余区域的面积相比重叠度大于预设阈值,根据上述步骤3去除相对剩余区域,并将在剩余区域中所对应的最大概率值的区域设为第二区域;步骤5:依次确定在剩余区域中所对应的最大概率值的区域,即全部的第一目标区域。
根据第二目标区域中的像素点坐标确定第一目标区域中的像素点坐标包括:通过如下公式计算在第一目标区域所对应的像素点的坐标(xk,yk):
其中,(Xk,Yk)表示第二目标区域所对应的像素点的坐标,M表示放大第一目标区域获得第二目标区域的放大倍数。
当第二目标区域中的像素点坐标与第一目标区域中的像素点坐标之间不是整数的对应关系时,确定第一目标区域中的像素点的包围矩形的像素点包括:当第一目标区域中的像素点被2*2个包围矩形的像素点包裹,则第一目标区域中的像素点组成的矩形的坐标分别为其中,符号分别为向下取整,向上取整。
上述方法包括:通过第一目标区域中像素点的矩形的坐标的像素点的像素值建立第二目标区域中像素值的回归预测模型。根据第二目标区域中的像素点坐标确定第一目标区域中的像素点坐标,其中,第二目标区域是放大第一目标区域得到的;基于第二目标区域中的像素点坐标与第一目标区域中的像素点坐标确定坐标对应关系;根据坐标对应关系与第一目标区域中的像素点的像素值确定第二目标区域中的像素点的像素值,其中,第二目标区域中的像素值构成目标图像,其中,目标图像中包括目标文字。
根据坐标对应关系与第一目标区域中的像素点的像素值确定第二目标区域中的像素点的像素值包括:当第二目标区域中的像素点坐标与第一目标区域中的像素点坐标之间是整数的对应关系时,将第一目标区域中的像素点的像素值作为第二目标区域中的像素点像素值。
根据坐标对应关系与第一目标区域中的像素点的像素值确定第二目标区域中的像素点的像素值包括:当第二目标区域中的像素点坐标与第一目标区域中的像素点坐标之间不是整数的对应关系时,确定第一目标区域中的像素点的包围矩形的像素点;将包围矩形的像素点的像素值,通过回归预测模型来确定第二目标区域中的像素点的像素值。
根据第二目标区域中的像素点坐标确定第一目标区域中的像素点坐标之前,获取第一目标区域包括:步骤1:利用文字检测法确定包含目标文字的目标图像的多个区域;步骤2:确定区域的边框在文字类别上的概率值最小的区域和概率值最大的区域;步骤3:如果最大概率值的区域面积与剩余区域面积相比重叠度大于预设阈值,将与最大概率值的区域面积重叠度大于预设阈值的其它区域面积去除,与最大概率值的区域面积重叠度不大于预设阈值的其它区域面积保留,并将最大概率值的区域设为第一区域;步骤4:如果在保留的其它区域中所对应的最大概率值的区域面积与相对剩余区域中剩余区域的面积相比重叠度大于预设阈值,根据上述步骤3去除相对剩余区域,并将在剩余区域中所对应的最大概率值的区域设为第二区域;步骤5:依次确定在剩余区域中所对应的最大概率值的区域,即全部的第一目标区域。
根据第二目标区域中的像素点坐标确定第一目标区域中的像素点坐标包括:通过如下公式计算在第一目标区域所对应的像素点的坐标(xk,yk):
其中,(Xk,Yk)表示第二目标区域所对应的像素点的坐标,m表示放大第一目标区域获得第二目标区域的放大倍数。
当第二目标区域中的像素点坐标与第一目标区域中的像素点坐标之间不是整数的对应关系时,确定第一目标区域中的像素点的包围矩形的像素点包括:当第一目标区域中的像素点被2*2个包围矩形的像素点包裹,则第一目标区域中的像素点组成的矩形的坐标分别为其中,符号分别为向下取整,向上取整。
上述方法包括:通过第一目标区域中像素点的矩形的坐标的像素点的像素值建立第二目标区域中像素值的回归预测模型。
根据本发明实施例的另外一个方面,还提供了一种电子装置,包括存储器和处理器,处理器,处理器用于运行程序,其中,程序运行时执行以下操作:根据第二目标区域中的像素点坐标确定第一目标区域中的像素点坐标,其中,第二目标区域是放大第一目标区域得到的;基于第二目标区域中的像素点坐标与第一目标区域中的像素点坐标确定坐标对应关系;根据坐标对应关系与第一目标区域中的像素点的像素值确定第二目标区域中的像素点的像素值,其中,第二目标区域中的像素值构成目标图像,其中,目标图像中包括目标文字。
根据坐标对应关系与第一目标区域中的像素点的像素值确定第二目标区域中的像素点的像素值包括:当第二目标区域中的像素点坐标与第一目标区域中的像素点坐标之间是整数的对应关系时,将第一目标区域中的像素点的像素值作为第二目标区域中的像素点像素值。
根据坐标对应关系与第一目标区域中的像素点的像素值确定第二目标区域中的像素点的像素值可以包括:当第二目标区域中的像素点坐标与第一目标区域中的像素点坐标之间不是整数的对应关系时,确定第一目标区域中的像素点的包围矩形的像素点;将包围矩形的像素点的像素值,通过回归预测模型来确定第二目标区域中的像素点的像素值。
根据第二目标区域中的像素点坐标确定第一目标区域中的像素点坐标之前,获取第一目标区域包括:步骤1:利用文字检测法确定包含目标文字的目标图像的多个区域;步骤2:确定区域的边框在文字类别上的概率值最小的区域和概率值最大的区域;步骤3:如果最大概率值的区域面积与剩余区域面积相比重叠度大于预设阈值,将与最大概率值的区域面积重叠度大于预设阈值的其它区域面积去除,与最大概率值的区域面积重叠度不大于预设阈值的其它区域面积保留,并将最大概率值的区域设为第一区域;步骤4:如果在保留的其它区域中所对应的最大概率值的区域面积与相对剩余区域中剩余区域的面积相比重叠度大于预设阈值,根据上述步骤3去除相对剩余区域,并将在剩余区域中所对应的最大概率值的区域设为第二区域;步骤5:依次确定在剩余区域中所对应的最大概率值的区域,即全部的第一目标区域。
根据第二目标区域中的像素点坐标确定第一目标区域中的像素点坐标包括:通过如下公式计算在第一目标区域所对应的像素点的坐标(xk,yk):
其中,(Xk,Yk)表示第二目标区域所对应的像素点的坐标,M表示放大第一目标区域获得第二目标区域的放大倍数。
当第二目标区域中的像素点坐标与第一目标区域中的像素点坐标之间不是整数的对应关系时,确定第一目标区域中的像素点的包围矩形的像素点包括:当第一目标区域中的像素点被2*2个包围矩形的像素点包裹,则第一目标区域中的像素点组成的矩形的坐标分别为其中,符号分别为向下取整,向上取整。
上述方法包括:通过第一目标区域中像素点的矩形的坐标的像素点的像素值建立第二目标区域中像素值的回归预测模型。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (10)
1.一种文字的处理方法,其特征在于,包括:
根据第二目标区域中的像素点坐标确定第一目标区域中的像素点坐标,其中,所述第二目标区域是放大所述第一目标区域得到的;
基于所述第二目标区域中的像素点坐标与所述第一目标区域中的像素点坐标确定所述坐标对应关系;
根据所述坐标对应关系与第一目标区域中的像素点的像素值确定第二目标区域中的像素点的像素值,其中,所述第二目标区域中的像素值构成目标图像,其中,所述目标图像中包括目标文字。
2.根据权利要求1所述的方法,其特征在于,根据所述坐标对应关系与第一目标区域中的像素点的像素值确定第二目标区域中的像素点的像素值包括:
当所述第二目标区域中的像素点坐标与所述第一目标区域中的像素点坐标之间是整数的对应关系时,将所述第一目标区域中的像素点的像素值作为所述第二目标区域中的像素点像素值;
当所述第二目标区域中的像素点坐标与所述第一目标区域中的像素点坐标之间不是整数的对应关系时,确定所述第一目标区域中的像素点的包围矩形的像素点;
将所述包围矩形的像素点的像素值,通过回归预测模型来确定所述第二目标区域中的像素点的像素值。
3.根据权利要求1所述的方法,其特征在于,根据第二目标区域中的像素点坐标确定第一目标区域中的像素点坐标之前,获取所述第一目标区域包括:
步骤1:利用文字检测法确定包含目标文字的目标图像的多个区域;
步骤2:确定区域的边框在文字类别上的概率值最小的区域和概率值最大的区域;
步骤3:如果最大概率值的区域面积与剩余区域面积相比重叠度大于预设阈值,将与所述最大概率值的区域面积重叠度大于预设阈值的其它区域面积去除,与最大概率值的区域面积重叠度不大于预设阈值的其它区域面积保留,并将最大概率值的区域设为第一区域;
步骤4:当在所述保留的区域中所对应的最大概率值的区域面积与相对剩余区域中剩余区域的面积相比重叠度大于预设阈值时,根据上述步骤3去除相对剩余区域,并将在剩余区域中所对应的最大概率值的区域设为第二区域;
步骤5:依次确定在剩余区域中所对应的最大概率值的区域,即全部的第一目标区域。
4.根据权利要求1所述的方法,其特征在于,根据第二目标区域中的像素点坐标确定第一目标区域中的像素点坐标包括:
通过如下公式计算在所述第一目标区域所对应的像素点的坐标(xk,yk):
其中,(Xk,Yk)表示所述第二目标区域所对应的像素点的坐标,m表示放大所述第一目标区域获得第二目标区域的放大倍数。
5.根据权利要求2所述的方法,其特征在于,当所述第二目标区域中的像素点坐标与所述第一目标区域中的像素点坐标之间不是整数的对应关系时,确定所述第一目标区域中的像素点的包围矩形的像素点包括:
当所述第一目标区域中的像素点被2*2个包围矩形的像素点包裹,则所述第一目标区域中的像素点组成的矩形的坐标分别为其中,符号分别为向下取整,向上取整。
6.根据权利要求2所述的方法,其特征在于,所述方法包括:
通过所述第一目标区域中像素点的矩形的坐标的像素点的像素值建立所述第二目标区域中像素值的所述回归预测模型。
7.一种文字的处理装置,其特征在于,包括:
第一确定单元,用于根据第二目标区域中的像素点坐标确定第一目标区域中的像素点坐标,其中,所述第二目标区域是放大所述第一目标区域得到的;
第二确定单元,用于基于所述第二目标区域中的像素点坐标与所述第一目标区域中的像素点坐标确定所述坐标的对应关系;
第三确定单元,用于根据所述坐标的对应关系与第一目标区域中的像素点的像素值确定第二目标区域中的像素点的像素值,其中,所述第二目标区域中的像素值构成目标图像,其中,所述目标图像中包括目标文字。
8.根据权利要求7所述的装置,其特征在于,所述第三确定单元包括:
第一处理模块,用于当所述第二目标区域中的像素点坐标与所述第一目标区域中的像素点坐标之间是整数的对应关系时,将所述第一目标区域中的像素点的像素值作为所述第二目标区域中的像素点像素值;
第一确定模块,用于当所述第二目标区域中的像素点坐标与所述第一目标区域中的像素点坐标之间不是整数的对应关系时,确定所述第一目标区域中的像素点的包围矩形的像素点;
第二确定模块,用于将所述包围矩形的像素点的像素值,通过预测模型来确定所述第二目标区域中的像素点的像素值。
9.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1至6中任一项所述的文字的处理方法。
10.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行所述权利要求1至6任一项中所述的文字的处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811474244.8A CN109543669A (zh) | 2018-12-04 | 2018-12-04 | 文字的处理方法及装置、存储介质、电子装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811474244.8A CN109543669A (zh) | 2018-12-04 | 2018-12-04 | 文字的处理方法及装置、存储介质、电子装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109543669A true CN109543669A (zh) | 2019-03-29 |
Family
ID=65853653
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811474244.8A Pending CN109543669A (zh) | 2018-12-04 | 2018-12-04 | 文字的处理方法及装置、存储介质、电子装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109543669A (zh) |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101226634A (zh) * | 2008-01-30 | 2008-07-23 | 哈尔滨工业大学 | 基于核回归的单帧图像快速超分辨率重建方法 |
JP4547752B2 (ja) * | 2000-01-14 | 2010-09-22 | ソニー株式会社 | 画像処理装置および方法、並びに記録媒体 |
US8064734B2 (en) * | 2006-12-22 | 2011-11-22 | Sony Corporation | Image processing device image processing method, and computer program |
CN102572359A (zh) * | 2010-12-17 | 2012-07-11 | 微软公司 | 具有反向投影限制的自回归边缘定向插值 |
CN104200209A (zh) * | 2014-08-29 | 2014-12-10 | 南京烽火星空通信发展有限公司 | 一种图像文字检测方法 |
CN104700357A (zh) * | 2015-04-14 | 2015-06-10 | 华东理工大学 | 一种基于双线性算子的汉字图像缩放方法 |
CN104766272A (zh) * | 2015-04-17 | 2015-07-08 | 河海大学 | 一种基于亚像素偏移模型的图像超分辨率重建方法 |
CN107122732A (zh) * | 2017-04-25 | 2017-09-01 | 福州大学 | 一种监控场景下高鲁棒性的快速车牌定位方法 |
CN107516293A (zh) * | 2016-06-17 | 2017-12-26 | 北京大学 | 图像插值方法和图像插值系统 |
CN108171654A (zh) * | 2017-11-20 | 2018-06-15 | 西北大学 | 带干扰抑制的汉字图像超分辨率重建方法 |
CN108416734A (zh) * | 2018-02-08 | 2018-08-17 | 西北大学 | 基于边缘驱动的文本图像超分辨率重建方法和装置 |
CN108629733A (zh) * | 2017-03-17 | 2018-10-09 | 北京大学 | 获取高分辨率图像的方法与装置 |
-
2018
- 2018-12-04 CN CN201811474244.8A patent/CN109543669A/zh active Pending
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4547752B2 (ja) * | 2000-01-14 | 2010-09-22 | ソニー株式会社 | 画像処理装置および方法、並びに記録媒体 |
US8064734B2 (en) * | 2006-12-22 | 2011-11-22 | Sony Corporation | Image processing device image processing method, and computer program |
CN101226634A (zh) * | 2008-01-30 | 2008-07-23 | 哈尔滨工业大学 | 基于核回归的单帧图像快速超分辨率重建方法 |
CN102572359A (zh) * | 2010-12-17 | 2012-07-11 | 微软公司 | 具有反向投影限制的自回归边缘定向插值 |
CN104200209A (zh) * | 2014-08-29 | 2014-12-10 | 南京烽火星空通信发展有限公司 | 一种图像文字检测方法 |
CN104700357A (zh) * | 2015-04-14 | 2015-06-10 | 华东理工大学 | 一种基于双线性算子的汉字图像缩放方法 |
CN104766272A (zh) * | 2015-04-17 | 2015-07-08 | 河海大学 | 一种基于亚像素偏移模型的图像超分辨率重建方法 |
CN107516293A (zh) * | 2016-06-17 | 2017-12-26 | 北京大学 | 图像插值方法和图像插值系统 |
CN108629733A (zh) * | 2017-03-17 | 2018-10-09 | 北京大学 | 获取高分辨率图像的方法与装置 |
CN107122732A (zh) * | 2017-04-25 | 2017-09-01 | 福州大学 | 一种监控场景下高鲁棒性的快速车牌定位方法 |
CN108171654A (zh) * | 2017-11-20 | 2018-06-15 | 西北大学 | 带干扰抑制的汉字图像超分辨率重建方法 |
CN108416734A (zh) * | 2018-02-08 | 2018-08-17 | 西北大学 | 基于边缘驱动的文本图像超分辨率重建方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108229355B (zh) | 行为识别方法和装置、电子设备、计算机存储介质 | |
CN106295502B (zh) | 一种人脸检测方法及装置 | |
CN110738101B (zh) | 行为识别方法、装置及计算机可读存储介质 | |
CN107358149B (zh) | 一种人体姿态检测方法和装置 | |
CN107944450B (zh) | 一种车牌识别方法及装置 | |
CN109509021B (zh) | 基于行为轨迹的异常识别方法、装置、服务器及存储介质 | |
WO2018166116A1 (zh) | 车损识别方法、电子装置及计算机可读存储介质 | |
CN107633204A (zh) | 人脸遮挡检测方法、装置及存储介质 | |
CN111615702B (zh) | 一种从图像中提取结构化数据的方法、装置和设备 | |
CN107274543B (zh) | 一种纸币的识别方法、装置、终端设备和计算机存储介质 | |
CN107944382B (zh) | 目标跟踪方法、装置及电子设备 | |
CN106846362A (zh) | 一种目标检测跟踪方法和装置 | |
CN109961472B (zh) | 3d热力图生成的方法、系统、存储介质及电子设备 | |
CN110543838A (zh) | 车辆信息检测的方法及装置 | |
CN105303163B (zh) | 一种目标检测的方法及检测装置 | |
CN112132216B (zh) | 车型识别方法、装置、电子设备及存储介质 | |
CN109034086A (zh) | 车辆重识别方法、装置及系统 | |
US20110007971A1 (en) | Method for recognizing pattern, pattern recognizer and computer program | |
CN111667001A (zh) | 目标重识别方法、装置、计算机设备和存储介质 | |
CN112016545A (zh) | 一种包含文本的图像生成方法及装置 | |
CN108536749A (zh) | 基于碰撞检测法构建人员轨迹视图的方法 | |
CN110660078A (zh) | 对象追踪方法、装置、计算机设备和存储介质 | |
CN115240203A (zh) | 业务数据处理方法、装置、设备及存储介质 | |
CN105302715B (zh) | 应用程序用户界面的获取方法和装置 | |
CN109543669A (zh) | 文字的处理方法及装置、存储介质、电子装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190329 |
|
RJ01 | Rejection of invention patent application after publication |