CN115346217A - 文字行检测的方法、装置、电子设备及存储介质 - Google Patents
文字行检测的方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN115346217A CN115346217A CN202211056864.6A CN202211056864A CN115346217A CN 115346217 A CN115346217 A CN 115346217A CN 202211056864 A CN202211056864 A CN 202211056864A CN 115346217 A CN115346217 A CN 115346217A
- Authority
- CN
- China
- Prior art keywords
- text
- rotation angle
- rotation
- detection box
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
- G06V30/1463—Orientation detection or correction, e.g. rotation of multiples of 90 degrees
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
- G06V30/1475—Inclination or skew detection or correction of characters or of image to be recognised
- G06V30/1478—Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
Abstract
本申请属于文本检测技术领域,公开了文字行检测的方法、装置、电子设备及存储介质,该方法包括,对待处理的原始图像进行文字行检测,获得第一文本检测框;确定第一文本检测框的文本旋转角度;根据文本旋转角度,对原始图像中的文本内容进行旋转矫正,获得文本旋转图像;对文本旋转图像进行文字行检测,获得第二文本检测框;根据文本旋转角度,对第二文本检测框及其包含的文本内容进行逆旋转,获得检测框图像。这样,解决了存在旋转文本的原始图像的文本行检测效果不佳的问题,提高了文本检测框的质量。
Description
技术领域
本申请涉及文本检测技术领域,具体而言,涉及文字行检测的方法、装置、电子设备及存储介质。
背景技术
在对图像进行文本检测并识别时,通常需要先对图像进行文字行检测,获得文本检测框,然后对文本检测框内的文本内容进行识别,获得文本识别结果。其中,文本检测框为图像中文本区域的外接框,外接框通常为外接矩形框。
在文字行检测过程中,若图像中的文本内容处于横平竖直的状态(即文本内容与水平线平行),则可以获得仅包含某一行文本内容的文本检测框。
但是,实际应用中,图像中的文本内容可能存在一定角度的旋转,即文本内容处于非横平竖直的状态。在对存在旋转文本的图像进行文字行检测时,获得的文本检测框通常存在各种问题,文本检测框的质量较差。例如,本检测框中可能包含多行文本内容,文本检测框与文本内容之间可能存在较大的空隙,以及,可能存在未被文本检测框包含的文字,显然,这会使得后续基于文本检测框的文本识别的准确度较低。
发明内容
本申请实施例的目的在于提供文字行检测的方法、装置、电子设备及存储介质,用以在对存在旋转文本的图像进行文字行检测时,提高文本检测框的质量,进而提高基于文本检测框的文本识别准确率。
一方面,提供一种文字行检测的方法,包括:
对待处理的原始图像进行文字行检测,获得第一文本检测框;
确定第一文本检测框的文本旋转角度;
根据文本旋转角度,对原始图像中的文本内容进行旋转矫正,获得文本旋转图像;
对文本旋转图像进行文字行检测,获得第二文本检测框;
根据文本旋转角度,对第二文本检测框及其包含的文本内容进行逆旋转,获得检测框图像。
在上述实现过程中,先对原始图像中的文本内容进行旋转矫正之后,再进行文本行检测以及逆旋转,解决了存在旋转文本(即存在一定角度的旋转文本)的原始图像的文本行检测效果不佳的问题,提高了文本检测框的质量,使得文本检测框紧贴文字行,且避免了同一文本检测框包含多行文本内容以及漏字的问题。
一种实施方式中,确定第一文本检测框的文本旋转角度,包括:
确定第一文本检测框的上下边界线与水平线之间的角度,获得文本旋转角度;上下边界线为第一文本检测框上侧的边界线或下侧的边界线;
或者,确定第一文本检测框的左右边界线与垂直线之间的角度,获得文本旋转角度;左右边界线为第一文本检测框左侧的边界线或右侧的边界线。
在上述实现过程中,可以确定第一文本检测框的文本旋转角度,从而确定了文本内容的文本旋转角度。
一种实施方式中,根据文本旋转角度,对原始图像中的文本内容进行旋转矫正,包括:
若确定文本旋转角度不高于文本旋转角度阈值,则将原始图像确定为文本旋转图像;
若确定文本旋转角度高于文本旋转角度阈值,则将原始图像中的文本内容,按照指定旋转方向旋转文本旋转角度,获得文本旋转图像。
在上述实现过程中,文本旋转角度较小的原始图像可以不进行旋转矫正,从而在保证文本检测框的效果的同时,减少了数据处理量。
一种实施方式中,将原始图像中的文本内容,按照指定旋转方向旋转文本旋转角度,获得文本旋转图像,包括:
根据文本旋转角度以及指定旋转方向,生成仿射变换矩阵;
基于仿射变换矩阵,对原始图像进行仿真变换,获得文本旋转图像。
在上述实现过程中,采用了仿射变换的方式进行文本内容的旋转。
一种实施方式中,根据文本旋转角度,对原始图像中的文本内容进行旋转矫正,包括:
若文本旋转角度为多个且各文本旋转角度符合设定平均条件,则确定各文本旋转角度的平均值;按照平均值,旋转矫正原始图像中的文本内容;
若文本旋转角度为多个且各文本旋转角度符合设定差值条件,则根据各第一文本检测框的文本旋转角度对各自包含的文本内容进行旋转矫正。
在上述实现过程中,在存在多个第一文本检测框时,可以对各文本旋转角度进行平均处理后旋转矫正或者针对各文本旋转角度分别进行旋转矫正。
一方面,提供一种文字行检测的装置,包括:
第一检测单元,用于对待处理的原始图像进行文字行检测,获得第一文本检测框;
确定单元,用于确定第一文本检测框的文本旋转角度;
旋转单元,用于根据文本旋转角度,对原始图像中的文本内容进行旋转矫正,获得文本旋转图像;
第二检测单元,用于对文本旋转图像进行文字行检测,获得第二文本检测框;
获得单元,用于根据文本旋转角度,对第二文本检测框及其包含的文本内容进行逆旋转,获得检测框图像。
一种实施方式中,确定单元用于:
确定第一文本检测框的上下边界线与水平线之间的角度,获得文本旋转角度;上下边界线为第一文本检测框上侧的边界线或下侧的边界线;
或者,确定第一文本检测框的左右边界线与垂直线之间的角度,获得文本旋转角度;左右边界线为第一文本检测框左侧的边界线或右侧的边界线。
一种实施方式中,旋转单元用于:
若确定文本旋转角度不高于文本旋转角度阈值,则将原始图像确定为文本旋转图像;
若确定文本旋转角度高于文本旋转角度阈值,则将原始图像中的文本内容,按照指定旋转方向旋转文本旋转角度,获得文本旋转图像。
一种实施方式中,旋转单元用于:
根据文本旋转角度以及指定旋转方向,生成仿射变换矩阵;
基于仿射变换矩阵,对原始图像进行仿真变换,获得文本旋转图像。
一种实施方式中,旋转单元用于:
若文本旋转角度为多个且各文本旋转角度符合设定平均条件,则确定各文本旋转角度的平均值;按照平均值,旋转矫正原始图像中的文本内容;
若文本旋转角度为多个且各文本旋转角度符合设定差值条件,则根据各第一文本检测框的文本旋转角度对各自包含的文本内容进行旋转矫正。
一方面,提供了一种电子设备,包括处理器以及存储器,存储器存储有计算机可读取指令,当计算机可读取指令由处理器执行时,运行如上述任一种文字行检测的各种可选实现方式中提供的方法的步骤。
一方面,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时运行如上述任一种文字行检测的各种可选实现方式中提供的方法的步骤。
一方面,提供了一种计算机程序产品,计算机程序产品在计算机上运行时,使得计算机执行如上述任一种文字行检测的各种可选实现方式中提供的方法的步骤。
本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的一种文字行检测的方法的流程图;
图2为本申请实施例提供的一种原始图像的示例图;
图3为本申请实施例提供的一种文本旋转角度的示例图;
图4为本申请实施例提供的另一种原始图像的示例图;
图5为本申请实施例提供的一种文本检测框的示例;
图6为本申请实施例提供的为一种检测框图像的示例图;
图7为本申请实施例提供的一种文字行检测的装置的结构框图;
图8为本申请实施方式中一种电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
首先对本申请实施例中涉及的部分用语进行说明,以便于本领域技术人员理解。
终端设备:可以是移动终端、固定终端或便携式终端,例如移动手机、站点、单元、设备、多媒体计算机、多媒体平板、互联网节点、通信器、台式计算机、膝上型计算机、笔记本计算机、上网本计算机、平板计算机、个人通信系统设备、个人导航设备、个人数字助理、音频/视频播放器、数码相机/摄像机、定位设备、电视接收器、无线电广播接收器、电子书设备、游戏设备或者其任意组合,包括这些设备的配件和外设或者其任意组合。还可预见到的是,终端设备能够支持任意类型的针对用户的接口(例如可穿戴设备)等。
服务器:可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务以及大数据和人工智能平台等基础云计算服务的云服务器。
为了在对存在旋转文本的图像进行文字行检测时,提高文本检测框的质量,本申请实施例提供了文字行检测的方法、装置、电子设备及存储介质。
参阅图1所示,为本申请实施例提供的一种文字行检测的方法的流程图,应用于电子设备,电子设备可以为服务器,也可以为终端设备,该方法的具体实施流程如下:
步骤100:对待处理的原始图像进行文字行检测,获得第一文本检测框。
具体的,采用文本检测识别技术,对待处理的原始图像进行文字行检测,获得第一文本检测框。
作为一个示例,文本检测识别技术可以为光学字符识别(Optical CharacterRecognition,OCR)技术。
其中,第一文本检测框可以为一个也可以为多个。需要说明的是,本申请实施例中,第一文本检测框以及后续的第二文本检测框,均是一种文本检测框,文本检测框为图像中文本区域的外接框。传统技术下,文本检测框通常为外接矩形框,本申请实施例中,文本检测框可以为具有平行的边界线的外接多边形框,即文本检测框的上边界线和下边界线平行,或者左边界线和右边界线平行。其中,上边界线为文本检测框上侧的边界线,下边界线为文本检测框下侧的边界线,左边界线为文本检测框左侧的边界线,右边界线为文本检测框右侧的边界线。如,文本检测框可以为外接矩形框或者外接梯形框。
实际应用中,文本检测识别技术以及文本检测框的形状均可以根据实际应用场景进行设置,在此不作限制。
这样,就可以对原始图像进行初次文本行检测。
步骤101:确定第一文本检测框的文本旋转角度。
一种实施方式中,执行步骤101时,可以采用以下任一方式:
方式1:确定第一文本检测框的上下边界线与水平线之间的角度,获得文本旋转角度。
其中,上下边界线为第一文本检测框上侧的边界线或下侧的边界线。
一种实施方式中,采用数学向量的方式,确定第一文本检测框的上下边界线与水平线之间的角度,获得文本旋转角度。
方式2:确定第一文本检测框的左右边界线与垂直线之间的角度,获得文本旋转角度。
其中,左右边界线为第一文本检测框左侧的边界线或右侧的边界线。
一种实施方式中,采用数学向量的方式,确定第一文本检测框的左右边界线与垂直线之间的角度,获得文本旋转角度。
需要说明的是,文本旋转角度用于使得第一文本检测框按照指定旋转方向旋转文本旋转角度时,第一文本检测框的上下边界线与水平线平行。可选的,指定旋转方向为逆时针旋转方向或者顺时针旋转方向。
实际应用中,也可以采用其它方式检测第一文本检测框的文本旋转角度,如,还可以将文本检测框的对角线与水平线或垂直线之间的角度,作为文本旋转角度,在此不作限制。
这样,就可以获得第一文本检测框的文本旋转角度,从而可以确定文本内容的文本旋转角度。
步骤102:根据文本旋转角度,对原始图像中的文本内容进行旋转矫正,获得文本旋转图像。
一种实施方式中,由于文本旋转角度较小的话,可以不用旋转矫正,因此,可以基于文本旋转角度与文本旋转角度阈值之间的比对结果,对原始图像中的文本内容进行旋转矫正,具体可以采用以下任一方式:
方式1:若确定文本旋转角度不高于文本旋转角度阈值,则将原始图像确定为文本旋转图像。
参阅图2所示,为一种原始图像的示例图。图2中,原始图像中的文本内容处于横平竖直的状态,则不需要对图2中的文本内容进行旋转调整,直接将其确定为文本旋转图像。
实际应用中,文本旋转角度阈值可以根据实际应用场景进行设置,在此不作限制。
这样,若原始图像中的文本倾斜的角度(即旋转角度)较小,对后续的文本内容识别的准确率影响较小,则可以不对原始图像中的文本内容进行调整。
方式2:若确定文本旋转角度高于文本旋转角度阈值,则将原始图像中的文本内容,按照指定旋转方向旋转文本旋转角度,获得文本旋转图像。
例如,若确定文本旋转角度高于10度(即文本旋转角度阈值),则将原始图像中的文本内容,按照(即,指定旋转方向)旋转文本旋转角度,获得文本旋转图像。
参阅图3所示,为一种文本旋转角度的示例图。确定文本检测框的上下边界线(即上边界线或下边界线)与水平线之间的角度,获得文本旋转角度a。并将原始图像按照逆时针旋转方向旋转上述文本旋转角度a,使得原始图像中的文本内容与水平线处于平行状态,实现原始图像中文本内容的旋转矫正,获得文本旋转图像。
作为一个示例,将原始图像中的文本内容旋转矫正的实现过程可以包括:
根据所述文本旋转角度以及所述指定旋转方向,生成仿射变换矩阵;基于仿射变换矩阵,对原始图像进行仿真变换,获得文本旋转图像。
需要说明的是,对原始图像中的文本内容进行旋转矫正,可以是仅旋转文本内容,也可以是通过旋转原始图像实现文本内容的旋转矫正,在此不作限制。
这样,若原始图像中的文本倾斜的角度较大,对后续的文本内容识别的准确率影响就会较大,则可以对原始图像中的文本内容进行旋转矫正,使得旋转后的文本内容处于横平竖直的状态。
进一步的,由于第一文本检测框可能有多个,因此,执行步骤102时,还可以采用以下任一方式或组合:
方式1:根据各文本旋转角度的平均值,旋转矫正原始图像中的文本内容。
一种实施方式中,若文本旋转角度为多个且各文本旋转角度符合设定平均条件,则确定各文本旋转角度的平均值;按照平均值,旋转矫正原始图像中的文本内容。
作为一个示例,设定平均条件可以为:任意两个文本检测框的文本旋转角度之间的差值均低于设定平均阈值(如,20度)。
作为一个另示例,设定平均条件可以为:存在两个文本检测框的文本旋转角度不同。
实际应用中,设定平均条件以及设定平均阈值均可以根据实际应用场景进行设置,在此不作限制。
这样,在多个文本检测框的文本旋转角度存在不同时,可以按照各文本旋转角度的平均值进行后续的文本旋转矫正。
方式2:根据各第一文本检测框的文本旋转角度对各自包含的文本内容进行旋转矫正。
一种实施方式中,若文本旋转角度为多个且各文本旋转角度符合设定差值条件,则根据各第一文本检测框的文本旋转角度对各自包含的文本内容进行旋转矫正。
需要说明的是,在旋转矫正后,若出现多个文本内容重叠,则将各文本内容的位置进行调整,使得各文本内容不重叠,以及在后续获得第二文本检测框之后,再将各文本内容的位置进行恢复。
作为一个示例,设定差值条件为:存在两个文本检测框的文本旋转角度之间的差值,高于设定差值阈值(如,30)。
作为一个另示例,设定平均条件可以为:存在两个文本检测框的文本旋转角度不同。
实际应用中,设定平均条件以及设定差值阈值可以根据实际应用场景进行设置,在此不作限制。
这样,存在不同文本旋转角度时,可以按照各文本内容的文本旋转角度,对各文本内容进行分别旋转矫正。
步骤103:对文本旋转图像进行文字行检测,获得第二文本检测框。
具体的,执行步骤103时,具体步骤参见上述步骤100,在此不做赘述。
步骤104:根据文本旋转角度,对第二文本检测框及其包含的文本内容进行逆旋转,获得检测框图像。
一种实施方式中,将第二文本检测框及其包含的文本内容,按照指定旋转方向的反方向,旋转文本旋转角度,使得检测框图像中的文本内容的旋转角度和位置与原始图像是一致的,即检测框图像与原始图像的区别为多了多个第二文本检测框。
作为一个示例,根据所述文本旋转角度以及所述指定旋转方向的反方向,生成新的仿射变换矩阵;基于新的仿射变换矩阵,对包含第二文本检测框的文本旋转图像进行仿真变换,获得检测框图像。
其中,检测框图像中包含第二文本检测框,第二文本检测框中包含某一行文本内容。
参阅图4所示,为另一种原始图像的示例图。图4所示原始图像中的文本内容存在一定文本旋转角度的旋转。参阅图5所示,为一种文本检测框的示例图,图5中显示有包含多行文本内容的第一文本检测框。参阅图6所示,为一种检测框图像的示例图,检测框图像显示的第二文本检测框均仅包含一行文本内容。
对图4所示的原始图像进行文字行检测,获得图5所示的第一文本检测框;确定图5中的第一文本检测框的文本旋转角度,以及按照该文本旋转角度,将原始图像中的文本内容进行旋转矫正,获得文本旋转图像;对文本旋转图像进行文字行检测,获得第二文本检测框,并根据文本旋转角度,对第二文本检测框及其包含的文本内容进行逆旋转,获得图6所示的检测框图像。
这样,就可以在后续步骤中,对检测框图像中的文本内容进行文本识别,获得文本识别结果。
本申请实施例中,通过对原始图像的文字行检测以及文本旋转角度检测,确定原始图像中的文本内容的文本旋转角度,从而可以采用仿射变换等方式基于文本旋转角度,将原始图像中的文本内容进行旋转矫正,使得文本内容处于横平竖直的状态,然后,再对其进行二次文字行检测以及逆旋转,从而解决了存在旋转文本的原始图像的文本行检测效果不佳的问题,提高了文本检测框的质量,使得文本检测框紧贴文字行,且避免了同一文本检测框包含多行文本内容以及漏字的问题。
基于同一发明构思,本申请实施例中还提供了一种文字行检测的装置,由于上述装置及设备解决问题的原理与一种文字行检测的方法相似,因此,上述装置的实施可以参见方法的实施,重复之处不再赘述。
如图7所示,其为本申请实施例提供的一种文字行检测的装置的结构示意图,包括:
第一检测单元701,用于对待处理的原始图像进行文字行检测,获得第一文本检测框;
确定单元702,用于确定第一文本检测框的文本旋转角度;
旋转单元703,用于根据文本旋转角度,对原始图像中的文本内容进行旋转矫正,获得文本旋转图像;
第二检测单元704,用于对文本旋转图像进行文字行检测,获得第二文本检测框;
获得单元705,用于根据文本旋转角度,对第二文本检测框及其包含的文本内容进行逆旋转,获得检测框图像。
一种实施方式中,确定单元702用于:
确定第一文本检测框的上下边界线与水平线之间的角度,获得文本旋转角度;上下边界线为第一文本检测框上侧的边界线或下侧的边界线;
或者,确定第一文本检测框的左右边界线与垂直线之间的角度,获得文本旋转角度;左右边界线为第一文本检测框左侧的边界线或右侧的边界线。
一种实施方式中,旋转单元703用于:
若确定文本旋转角度不高于文本旋转角度阈值,则将原始图像确定为文本旋转图像;
若确定文本旋转角度高于文本旋转角度阈值,则将原始图像中的文本内容,按照指定旋转方向旋转文本旋转角度,获得文本旋转图像。
一种实施方式中,旋转单元703用于:
根据文本旋转角度以及指定旋转方向,生成仿射变换矩阵;
基于仿射变换矩阵,对原始图像进行仿真变换,获得文本旋转图像。
一种实施方式中,旋转单元703用于:
若文本旋转角度为多个且各文本旋转角度符合设定平均条件,则确定各文本旋转角度的平均值;按照平均值,旋转矫正原始图像中的文本内容;
若文本旋转角度为多个且各文本旋转角度符合设定差值条件,则根据各第一文本检测框的文本旋转角度对各自包含的文本内容进行旋转矫正。
本申请实施例提供的文字行检测的方法、装置、电子设备及存储介质中,对待处理的原始图像进行文字行检测,获得第一文本检测框;确定第一文本检测框的文本旋转角度;根据文本旋转角度,对原始图像中的文本内容进行旋转矫正,获得文本旋转图像;对文本旋转图像进行文字行检测,获得第二文本检测框;根据文本旋转角度,对第二文本检测框及其包含的文本内容进行逆旋转,获得检测框图像。这样,先对原始图像中的文本内容进行旋转矫正之后,再进行文本行检测以及逆旋转,解决了存在旋转文本的原始图像的文本行检测效果不佳的问题,提高了文本检测框的质量,使得文本检测框紧贴文字行,且避免了同一文本检测框包含多行文本内容以及漏字的问题。
图8示出了一种电子设备8000的结构示意图。参阅图8所示,电子设备8000包括:处理器8010以及存储器8020,可选的,还可以包括电源8030、显示单元8040、输入单元8050。
处理器8010是电子设备8000的控制中心,利用各种接口和线路连接各个部件,通过运行或执行存储在存储器8020内的软件程序和/或数据,执行电子设备8000的各种功能,从而对电子设备8000进行整体监控。
本申请实施例中,处理器8010调用存储器8020中存储的计算机程序时执行上述实施例中的各个步骤。
可选的,处理器8010可包括一个或多个处理单元;优选的,处理器8010可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器8010中。在一些实施例中,处理器、存储器、可以在单一芯片上实现,在一些实施例中,它们也可以在独立的芯片上分别实现。
存储器8020可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、各种应用等;存储数据区可存储根据电子设备8000的使用所创建的数据等。此外,存储器8020可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件等。
电子设备8000还包括给各个部件供电的电源8030(比如电池),电源可以通过电源管理系统与处理器8010逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗等功能。
显示单元8040可用于显示由用户输入的信息或提供给用户的信息以及电子设备8000的各种菜单等,本发明实施例中主要用于显示电子设备8000中各应用的显示界面以及显示界面中显示的文本、图片等对象。显示单元8040可以包括显示面板8041。显示面板8041可以采用液晶显示屏(Liquid Crystal Display,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置。
输入单元8050可用于接收用户输入的数字或字符等信息。输入单元8050可包括触控面板8051以及其他输入设备8052。其中,触控面板8051,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触摸笔等任何适合的物体或附件在触控面板8051上或在触控面板8051附近的操作)。
具体的,触控面板8051可以检测用户的触摸操作,并检测触摸操作带来的信号,将这些信号转换成触点坐标,发送给处理器8010,并接收处理器8010发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板8051。其他输入设备8052可以包括但不限于物理键盘、功能键(比如音量控制按键、开关机按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
当然,触控面板8051可覆盖显示面板8041,当触控面板8051检测到在其上或附近的触摸操作后,传送给处理器8010以确定触摸事件的类型,随后处理器8010根据触摸事件的类型在显示面板8041上提供相应的视觉输出。虽然在图8中,触控面板8051与显示面板8041是作为两个独立的部件来实现电子设备8000的输入和输出功能,但是在某些实施例中,可以将触控面板8051与显示面板8041集成而实现电子设备8000的输入和输出功能。
电子设备8000还可包括一个或多个传感器,例如压力传感器、重力加速度传感器、接近光传感器等。当然,根据具体应用中的需要,上述电子设备8000还可以包括摄像头等其它部件,由于这些部件不是本申请实施例中重点使用的部件,因此,在图8中没有示出,且不再详述。
本领域技术人员可以理解,图8仅仅是电子设备的举例,并不构成对电子设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件。
本申请实施例中,一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时,使得通信设备可以执行上述实施例中的各个步骤。
为了描述的方便,以上各部分按照功能划分为各模块(或单元)分别描述。当然,在实施本申请时可以把各模块(或单元)的功能在同一个或多个软件或硬件中实现。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
Claims (10)
1.一种文字行检测的方法,其特征在于,包括:
对待处理的原始图像进行文字行检测,获得第一文本检测框;
确定所述第一文本检测框的文本旋转角度;
根据所述文本旋转角度,对所述原始图像中的文本内容进行旋转矫正,获得文本旋转图像;
对所述文本旋转图像进行文字行检测,获得第二文本检测框;
根据所述文本旋转角度,对所述第二文本检测框及其包含的文本内容进行逆旋转,获得检测框图像。
2.如权利要求1所述的方法,其特征在于,所述确定所述第一文本检测框的文本旋转角度,包括:
确定所述第一文本检测框的上下边界线与水平线之间的角度,获得所述文本旋转角度;所述上下边界线为所述第一文本检测框上侧的边界线或下侧的边界线;
或者,确定所述第一文本检测框的左右边界线与垂直线之间的角度,获得所述文本旋转角度;所述左右边界线为所述第一文本检测框左侧的边界线或右侧的边界线。
3.如权利要求1所述的方法,其特征在于,所述根据所述文本旋转角度,对所述原始图像中的文本内容进行旋转矫正,包括:
若确定所述文本旋转角度不高于文本旋转角度阈值,则将所述原始图像确定为所述文本旋转图像;
若确定所述文本旋转角度高于所述文本旋转角度阈值,则将所述原始图像中的文本内容,按照指定旋转方向旋转所述文本旋转角度,获得所述文本旋转图像。
4.如权利要求3所述的方法,其特征在于,所述将所述原始图像中的文本内容,按照指定旋转方向旋转所述文本旋转角度,获得所述文本旋转图像,包括:
根据所述文本旋转角度以及所述指定旋转方向,生成仿射变换矩阵;
基于所述仿射变换矩阵,对所述原始图像进行仿真变换,获得所述文本旋转图像。
5.如权利要求1-4任一项所述的方法,其特征在于,所述根据所述文本旋转角度,对所述原始图像中的文本内容进行旋转矫正,包括:
若所述文本旋转角度为多个且各文本旋转角度符合设定平均条件,则确定各文本旋转角度的平均值;按照所述平均值,旋转矫正所述原始图像中的文本内容;
若所述文本旋转角度为多个且各文本旋转角度符合设定差值条件,则根据各第一文本检测框的文本旋转角度对各自包含的文本内容进行旋转矫正。
6.一种文字行检测的装置,其特征在于,包括:
第一检测单元,用于对待处理的原始图像进行文字行检测,获得第一文本检测框;
确定单元,用于确定所述第一文本检测框的文本旋转角度;
旋转单元,用于根据所述文本旋转角度,对所述原始图像中的文本内容进行旋转矫正,获得文本旋转图像;
第二检测单元,用于对所述文本旋转图像进行文字行检测,获得第二文本检测框;
获得单元,用于根据所述文本旋转角度,对所述第二文本检测框及其包含的文本内容进行逆旋转,获得检测框图像。
7.如权利要求6所述的装置,其特征在于,所述确定单元用于:
确定所述第一文本检测框的上下边界线与水平线之间的角度,获得所述文本旋转角度;所述上下边界线为所述第一文本检测框上侧的边界线或下侧的边界线;
或者,确定所述第一文本检测框的左右边界线与垂直线之间的角度,获得所述文本旋转角度;所述左右边界线为所述第一文本检测框左侧的边界线或右侧的边界线。
8.如权利要求6所述的装置,其特征在于,所述旋转单元用于:
若确定所述文本旋转角度不高于文本旋转角度阈值,则将所述原始图像确定为所述文本旋转图像;
若确定所述文本旋转角度高于所述文本旋转角度阈值,则将所述原始图像中的文本内容,按照指定旋转方向旋转所述文本旋转角度,获得所述文本旋转图像。
9.一种电子设备,其特征在于,包括处理器以及存储器,所述存储器存储有计算机可读取指令,当所述计算机可读取指令由所述处理器执行时,运行如权利要求1-5任一所述方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时运行如权利要求1-5任一所述方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211056864.6A CN115346217A (zh) | 2022-08-31 | 2022-08-31 | 文字行检测的方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211056864.6A CN115346217A (zh) | 2022-08-31 | 2022-08-31 | 文字行检测的方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115346217A true CN115346217A (zh) | 2022-11-15 |
Family
ID=83955467
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211056864.6A Pending CN115346217A (zh) | 2022-08-31 | 2022-08-31 | 文字行检测的方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115346217A (zh) |
-
2022
- 2022-08-31 CN CN202211056864.6A patent/CN115346217A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109144370B (zh) | 一种截屏方法、装置、终端及计算机可读介质 | |
CN111767554B (zh) | 屏幕分享方法、装置、存储介质及电子设备 | |
CN116168038B (zh) | 一种图像翻拍检测的方法、装置、电子设备及存储介质 | |
EP4258165A1 (en) | Two-dimensional code displaying method and apparatus, device, and medium | |
CN107765853A (zh) | 应用关闭方法、装置、存储介质及电子设备 | |
CN113126937A (zh) | 一种显示终端调整方法及显示终端 | |
CN112486444A (zh) | 投屏方法、装置、设备和可读存储介质 | |
CN112231144A (zh) | 一种数据处理方法、装置及电子设备 | |
CN108537149A (zh) | 图像处理方法、装置、存储介质及电子设备 | |
WO2023216745A1 (zh) | 一种表格重建的方法及电子设备 | |
CN116596748A (zh) | 图像风格化处理方法、装置、设备、存储介质和程序产品 | |
WO2020124454A1 (zh) | 字体切换方法及相关产品 | |
CN115346217A (zh) | 文字行检测的方法、装置、电子设备及存储介质 | |
CN113922998A (zh) | 一种漏洞风险评估方法、装置、电子设备及可读存储介质 | |
CN113706506A (zh) | 一种装配状态检测的方法、装置、电子设备及存储介质 | |
CN114443164A (zh) | 一种任务处理方法、装置、电子设备及存储介质 | |
CN111079771B (zh) | 点读图像的特征提取方法、系统、终端设备及存储介质 | |
CN114518859A (zh) | 显示控制方法、装置、电子设备及存储介质 | |
CN114253449A (zh) | 截屏方法、装置、设备及介质 | |
CN109242763B (zh) | 图片处理方法、图片处理装置、终端设备 | |
CN113705722B (zh) | 一种操作系统版本识别的方法、装置、设备和介质 | |
CN111784607A (zh) | 图像色调映射方法、装置、终端设备及存储介质 | |
CN115147856B (zh) | 一种表格信息提取的方法及电子设备 | |
CN205158392U (zh) | 动态影像的物件辨识系统 | |
CN111405003B (zh) | 一种资源加载方法及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |