CN105184328B - 一种识别图像的方法及装置 - Google Patents
一种识别图像的方法及装置 Download PDFInfo
- Publication number
- CN105184328B CN105184328B CN201510505814.5A CN201510505814A CN105184328B CN 105184328 B CN105184328 B CN 105184328B CN 201510505814 A CN201510505814 A CN 201510505814A CN 105184328 B CN105184328 B CN 105184328B
- Authority
- CN
- China
- Prior art keywords
- angle
- geometry
- standard
- endpoint
- current
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 42
- 230000006870 function Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000012015 optical character recognition Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000012937 correction Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000945 filler Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/24—Character recognition characterised by the processing or recognition method
- G06V30/242—Division of the character sequences into groups prior to recognition; Selection of dictionaries
- G06V30/244—Division of the character sequences into groups prior to recognition; Selection of dictionaries using graphical properties, e.g. alphabet type or font
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
Abstract
本发明提供了一种识别图像的方法及装置,包括:S1:获取待识别图像中的几何结构;S2:获取所述待识别图像的每个几何结构的连接轨迹;S3:获取所述待识别图像中每个几何结构的端点;S4:根据当前几何结构的连接轨迹,将当前几何结构的所有端点对应连接,获取当前几何结构的标准几何结构;S5:根据每个几何结构对应的标准结合结构,对所述待识别图像进行识别。本发明提供的一种识别图像的方法及装置,能够提高图像的识别准确率。
Description
技术领域
本发明涉及图像处理技术领域,特别涉及一种识别图像的方法及装置。
背景技术
图像识别,是指利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对像的技术。OCR(Optical Character Recognition,光学字符识别)技术,是图像识别技术中的一种,在图像识别中应用比较广泛。
现有技术中,主要通过OCR技术对图像进行识别。获取待识别图像,通过光学手段将图像中的字符轮廓描画出来,然后与标准字库中字库模板进行对比,找到像匹配的字库模板。
在现有技术中,由于待识别图像中的内容复杂,可以有汉字、英文、数字等字符,在识别时将这些字符与字库模板比对时,由于字符的种类复杂,容易出现错误。另外,由于待识别图像中的内容可能存在手写字符、艺术字等各种不规范字体,在与字库模板比对时,也容易出现差错。总之,现有技术中的识别方法的识别准确率较低。
发明内容
有鉴于此,本发明提供了一种识别图像的方法及装置,能够提高图像的识别准确率。
一方面,本发明提供了一种识别图像的方法,包括:
S1:获取待识别图像中的几何结构;
S2:获取所述待识别图像的每个几何结构的连接轨迹;
S3:获取所述待识别图像中每个几何结构的端点;
S4:根据当前几何结构的连接轨迹,将当前几何结构的所有端点对应连接,获取当前几何结构的标准几何结构;
S5:根据每个几何结构对应的标准结合结构,对所述待识别图像进行识别。
进一步地,在S1之前,还包括:建立数据空间,将所述待识别图像加载到所述数据空间中。
进一步地,所述S3,包括:在所述数据空间中,获取当前几何结构中每个端点的坐标;
所述S4,包括:
S41:根据当前几何结构中每个端点的坐标,确定当前几何结构中的每个夹角的角度;
S42:判断每个夹角的角度是否为预设的标准角度,如果是,则执行S44,否则,依次执行步骤S43、S44;
S43:调整不是标准角度的夹角对应的端点的坐标,使得当前几何结构中的每个夹角的角度为标准角度;
S44:根据当前几何结构的连接轨迹和每个端点的坐标,将当前几何结构的所有端点对应连接,获取当前几何结构的标准几何结构。
进一步地,所述预设的标准角度包括:45°、90°、135°、180°;
所述S43,包括:
当前夹角的角度在[20°,45°)或(45°,70°)范围内时,将当前夹角的角度调整到45°;
当前夹角的角度在[70°,90°)或(90°,110°)范围内时,将当前夹角的角度调整到90°;
当前夹角的角度在[110°,135°)或(135°,160°)范围内时,将当前夹角的角度调整到135°;
当前夹角的角度在[160°,180°)或(0°,20°)范围内时,将当前 夹角的角度调整到180°。
进一步地,所述S5,包括:
获取几何结构之间的位置关系,根据所述位置关系将几何结构对应的标准几何结构进行组合,得到组合后的标准结构,对每个标准结构进行识别。
另一方面,本发明提供了一种识别图像的装置,包括:
几何结构获取单元,用于获取待识别图像中的几何结构;
连接轨迹获取单元,用于获取所述待识别图像的每个几何结构的连接轨迹;
端点获取单元,用于获取所述待识别图像中每个几何结构的端点;
标准几何结构获取单元,用于根据当前几何结构的连接轨迹,将当前几何结构的所有端点对应连接,获取当前几何结构的标准几何结构;
识别单元,用于根据每个几何结构对应的标准结合结构,对所述待识别图像进行识别。
进一步地,还包括:数据空间单元,用于建立数据空间,将所述待识别图像加载到所述数据空间中。
进一步地,所述端点获取单元,用于在所述数据空间中,获取当前几何结构中每个端点的坐标;
所述标准几何结构获取单元,包括:
角度确定单元,用于根据当前几何结构中每个端点的坐标,确定当前几何结构中的每个夹角的角度;
判断单元,用于判断每个夹角的角度是否为预设的标准角度,当判断结果为是时,根据当前几何结构的连接轨迹和每个端点的坐标,将当前几何结构的所有端点对应连接,获取当前几何结构的标准几何结构,当判断结果为否时,调整不是标准角度的夹角对应的端点的坐标,使得当前几何结构中的每个夹角的角度为标准角度,根据当前几何结构的连接轨迹和每个端点的坐标,将当前几何结构的所有端点对应连接,获取当前几何结构的标准几何结构。
进一步地,所述预设的标准角度包括:45°、90°、135°、180°;
所述判断单元,在执行调整不是标准角度的夹角对应的端点的坐标,使得当前几何结构中的每个夹角的角度为标准角度时,具体执行:
当前夹角的角度在[20°,45°)或(45°,70°)范围内时,将当前夹角的角度调整到45°;
当前夹角的角度在[70°,90°)或(90°,110°)范围内时,将当前夹角的角度调整到90°;
当前夹角的角度在[110°,135°)或(135°,160°)范围内时,将当前夹角的角度调整到135°;
当前夹角的角度在[160°,180°)或(0°,20°)范围内时,将当前夹角的角度调整到180°。
进一步地,所述识别单元,用于获取几何结构之间的位置关系,根据所述位置关系将几何结构对应的标准几何结构进行组合,得到组合后的标准结构,对每个标准结构进行识别。
本发明提供的一种识别图像的方法及装置,将待识别图像分割成至少一个几何结构,获取每个几何结构的连接轨迹和端点,针对当前几何结构,根据当前几何结构的连接轨迹,当前几何结构的端点重新对应连接,获取对应的标准几何结构,该标准几何结构能够使得手写字符、艺术字等不规范字符更加规范,便于进行识别,然后,根据标准几何结构对待识别图像进行识别,能够提高图像的识别准确率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例提供的一种识别图像的方法的流程图;
图2是本发明一实施例提供的另一种识别图像的方法的流程图;
图3是本发明一实施例提供的一种几何结构及标准几何结构的示意图;
图4是本发明一实施例提供的一种识别图像的装置的示意图;
图5是本发明一实施例提供的另一种识别图像的装置的示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明实施例提供了一种识别图像的方法,该方法可以包括以下步骤:
S1:获取待识别图像中的几何结构;
S2:获取所述待识别图像的每个几何结构的连接轨迹;
S3:获取所述待识别图像中每个几何结构的端点;
S4:根据当前几何结构的连接轨迹,将当前几何结构的所有端点对应连接,获取当前几何结构的标准几何结构;
S5:根据每个几何结构对应的标准结合结构,对所述待识别图像进行识别。
通过本发明实施例提供的一种识别图像的方法,将待识别图像分割成至少一个几何结构,获取每个几何结构的连接轨迹和端点,针对当前几何结构,根据当前几何结构的连接轨迹,当前几何结构的端点重新对应连接,获取对应的标准几何结构,该标准几何结构能够使得手写字符、艺术字等不规范字符更加规范,便于进行识别,然后,根据标准几何结构对待识别图像进行识别,能够提高图像的识别准确率。
为了方便对待识别图像进行处理,在S1之前,还包括:建立数据空间, 将所述待识别图像加载到所述数据空间中。通过将待识别图像加载到数据空间中,可以获取待识别图像的每个像素点的坐标,进而方便对待识别图像的各个几何结构进行准确的定位。后续步骤的具体实现均可以基于数据空间来实现,对加载在数据空间中的待识别图像进行处理。
针对步骤S1,可以通过以下方式实现:获取所述待识别图像的每个像素点在所述数据空间中的坐标,根据每个像素点的坐标,获取所述待识别图像中的几何结构。可以将相连的像素点的集合作为一个几何结构,在数据空间中体现为相连的像素点的坐标的集合。举例来说,在待识别图像中有多个字符,每个字符可以作为一个几何结构,或,每个字符的一部分可以作为一个几何结构。针对字符“好”,由于“女”和“子”不相连,可以分别作为独立的几何结构。
针对步骤S2,可以通过以下方式实现:获取所述待识别图像的每个像素点在所述数据空间中的坐标,根据每个像素点的坐标,获取所述待识别图像的每个几何结构的连接轨迹。当前几何结构的连接轨迹在数据空间中就体现为当前几何结构中每个像素点的坐标。
为了获取每个几何结构的标准几何结构,需要确定每个几何结构的端点的坐标。所述S3,包括:在所述数据空间中,获取当前几何结构中每个端点的坐标。
为了使得待识别图像更加容易被识别,需要待识别图像中的几何结构进行标准化,通过端点对几何结构进行重新构建,并对几何结构中夹角进行标准化。所述S4,包括:
S41:根据当前几何结构中每个端点的坐标,确定当前几何结构中的每个夹角的角度;
S42:判断每个夹角的角度是否为预设的标准角度,如果是,则执行S44,否则,依次执行步骤S43、S44;
S43:调整不是标准角度的夹角对应的端点的坐标,使得当前几何结构中的每个夹角的角度为标准角度;
S44:根据当前几何结构的连接轨迹和每个端点的坐标,将当前几何结构的所有端点对应连接,获取当前几何结构的标准几何结构。
在该实现方式中,通过端点的坐标可以确定几何结构中夹角的角度。以字母“N”为例,“N”有两个夹角,在一些手写的“N”中,夹角的大小可能很不规范,在进行识别时可能会识别错误,为了提高准确度,通过该实现方式进行夹角的标准化。
其中,所述预设的标准角度包括:45°、90°、135°、180°;
所述S43,包括:
当前夹角的角度在[20°,45°)或(45°,70°)范围内时,将当前夹角的角度调整到45°;
当前夹角的角度在[70°,90°)或(90°,110°)范围内时,将当前夹角的角度调整到90°;
当前夹角的角度在[110°,135°)或(135°,160°)范围内时,将当前夹角的角度调整到135°;
当前夹角的角度在[160°,180°)或(0°,20°)范围内时,将当前夹角的角度调整到180°。
针对待识别图像中的一些内容模块,可能被拆分成多个几何结构,为了能识别出这类内容模块,可以根据几何结构之间的位置关系将对应的标准几何结构进行组合。所述S5,包括:获取几何结构之间的位置关系,根据所述位置关系将几何结构对应的标准几何结构进行组合,得到组合后的标准结构,对每个标准结构进行识别。以“好”为例,“女”和“子”被分割为两个独立的几何结构,分别得到对应的标准几何结构,由“女”和“子”的位置关系可知,女”和“子”属于同一个字符,因此将对应的标准几何结构组成一个标准结构,然后对组合后的标准结构进行识别。几何结构之间的位置关系可以通过几何结构中的像素点的坐标来体现,也可以通过几何结构的大小、高度、宽度来表征。
另外,也可以对标准几何结构进行识别,识别完后,根据几何结构的位 置关系将识别出的内容进行组合。在将端点相连时,通过线段进行连接。
为使本发明的目的、技术方案和优点更加清楚,下面结合附图及具体实施例对本发明作进一步地详细描述。
如图2所示,本发明实施例提供了一种识别图像的方法,该方法可以包括以下步骤:
步骤201:建立数据空间,将所述待识别图像加载到所述数据空间中。
具体地,将待识别图像的每个像素点加载到数据空间中,通过像素点在数据空间中的坐标,可以表征待识别图像中像素点的位置关系。
如图3所示,图3中的(a)为加载到数据空间中的待识别图像的一部分。
步骤202:获取待识别图像的每个像素点在所述数据空间中的坐标。
步骤203:根据待识别图像的每个像素点的坐标,获取待识别图像的几何结构。
如图3中(a),(a)为一个几何结构。
步骤204:根据每个几何结构中每个像素点的坐标,获取所述待识别图像的每个几何结构的连接轨迹。
步骤205:在所述数据空间中,获取当前几何结构中每个端点的坐标。
如图3所示,从(a)中可以获得3个端点坐标,分别是端点A、B、C。
步骤206:根据当前几何结构中每个端点的坐标,确定当前几何结构中的每个夹角的角度。
如图3所示,根据端点A、B、C的坐标,可以得到角ABC的角度为80°。
步骤207:判断每个夹角的角度是否为预设的标准角度,如果是,则执行步骤209,否则,依次执行步骤208、步骤209。
具体地,所述预设的标准角度包括:45°、90°、135°、180°;
如图3所示,确定角ABC的角度不是标准角度。
步骤208:调整不是标准角度的夹角对应的端点的坐标,使得当前几何结构中的每个夹角的角度为标准角度。
该步骤208可以包括:
当前夹角的角度在[20°,45°)或(45°,70°)范围内时,将当前夹角的角度调整到45°;
当前夹角的角度在[70°,90°)或(90°,110°)范围内时,将当前夹角的角度调整到90°;
当前夹角的角度在[110°,135°)或(135°,160°)范围内时,将当前夹角的角度调整到135°;
当前夹角的角度在[160°,180°)或(0°,20°)范围内时,将当前夹角的角度调整到180°。
由于角ABC是80°,需要将角ABC矫正为标准角度90°。具体地,可以调整端点A的坐标,使得角ABC矫正为标准角度90°。
步骤209:根据当前几何结构的连接轨迹和每个端点的坐标,将当前几何结构的所有端点对应连接,获取当前几何结构的标准几何结构。
如图3所示,(c)为进行角度矫正后,连接端点得到的标准几何结构。(b)为不进行角度矫正的情况下,连接端点得到的标准几何结构。
另外,由于在几何结构(a)的连接轨迹中,端点A与端点B相连,端点B与端点C相连,因此,在(c)、(b)中,根据(a)的连接轨迹,端点A与端点B相连,端点B与端点C相连。
还有,在数据空间中,将端点A与端点B相连可以通过在端点A与端点B所在的线段上填充像素点来实现。
步骤210:根据每个几何结构中像素点的坐标,获取几何结构之间的位置关系。
步骤211:根据所述位置关系将几何结构对应的标准几何结构进行组合,得到组合后的标准结构,对每个标准结构进行识别。
待识别图像中的一些字符,可能被拆成多个几何结构,因此需要将这些几何结构重新组合。在组合时,需要获取这些几何结构的位置关系。根据位置关系将对应的标准几何结构进行组合。
另外,在对几何结构进行标准化的过程中,还可以对几何结构中的冗余 部分进行裁剪,裁剪后得到标准几何结构。在对几何结构进行标准化的过程中,还可以根据不同语言文字的书写习惯对端点坐标进行动态调整,以消除斜体字、连笔字的负面影响,例如:中文的规范以横平竖直为主,英文的规范则以几何结构的大小、方正为主。
还有,在确定出几何结构的端点后,可以移除该几何结构中除了端点外的其他像素点,以便后续对端点进行处理。对于每个标准结构或标准结合结构可以通过OCR进行识别。
本发明实施例提供的一种识别图像的方法,可以通过以下步骤实现:
步骤1:调用函数MDS_InitBillSplit(),启动多维化图形分割标准化进程。
步骤2:调用函数MDS_AnalyzeGeometricConstruction(),根据数据空间中的像素点坐标信息分析各独立几何结构的端点坐标。
步骤3:调用函数MDS_RemoveOriginalPixel(),移除几何端点间的原始像素数据。
步骤4:调用函数MDS_ReconnectPoint(),使用标准像素数据重新连接端点。其中,标准像素数据一般是黑色像素。
步骤5:调用函数MDS_NormativeDetecting(),分析几何结构的标准化程度,如夹角角度、冗余长度等,根据不同语言文字的书写习惯进行动态调整。符合规范进入步骤8,否则进入步骤6。
步骤6:调用函数MDS_AdjustCoordinate(),根据步骤5的分析结果,重置端点坐标。例如:根据夹角大小进行调整。
步骤7:调用步骤4,重新连接端点。
步骤8:输出处理结果。
如图4、图5所示,本发明实施例提供了一种识别图像的装置。装置实施例可以通过软件实现,也可以通过硬件或者软硬件结合的方式实现。从硬件层面而言,如图4所示,为本发明实施例提供的一种识别图像的装置所在设备的一种硬件结构图,除了图4所示的处理器、内存、网络接口、以及非易失性存储器之外,实施例中装置所在的设备通常还可以包括其他硬件,如 负责处理报文的转发芯片等等。以软件实现为例,如图5所示,作为一个逻辑意义上的装置,是通过其所在设备的CPU将非易失性存储器中对应的计算机程序指令读取到内存中运行形成的。本实施例提供的一种识别图像的装置,包括:
几何结构获取单元501,用于获取待识别图像中的几何结构;
连接轨迹获取单元502,用于获取所述待识别图像的每个几何结构的连接轨迹;
端点获取单元503,用于获取所述待识别图像中每个几何结构的端点;
标准几何结构获取单元504,用于根据当前几何结构的连接轨迹,将当前几何结构的所有端点对应连接,获取当前几何结构的标准几何结构;
识别单元505,用于根据每个几何结构对应的标准结合结构,对所述待识别图像进行识别。
在一种可能的实现方式中,该装置还包括:数据空间单元,用于建立数据空间,将所述待识别图像加载到所述数据空间中。
在一种可能的实现方式中,所述端点获取单元503,用于在所述数据空间中,获取当前几何结构中每个端点的坐标;
所述标准几何结构获取单元504,包括:
角度确定单元,用于根据当前几何结构中每个端点的坐标,确定当前几何结构中的每个夹角的角度;
判断单元,用于判断每个夹角的角度是否为预设的标准角度,当判断结果为是时,根据当前几何结构的连接轨迹和每个端点的坐标,将当前几何结构的所有端点对应连接,获取当前几何结构的标准几何结构,当判断结果为否时,调整不是标准角度的夹角对应的端点的坐标,使得当前几何结构中的每个夹角的角度为标准角度,根据当前几何结构的连接轨迹和每个端点的坐标,将当前几何结构的所有端点对应连接,获取当前几何结构的标准几何结构。
在一种可能的实现方式中,所述预设的标准角度包括:45°、90°、135°、 180°;
所述判断单元,在执行调整不是标准角度的夹角对应的端点的坐标,使得当前几何结构中的每个夹角的角度为标准角度时,具体执行:
当前夹角的角度在[20°,45°)或(45°,70°)范围内时,将当前夹角的角度调整到45°;
当前夹角的角度在[70°,90°)或(90°,110°)范围内时,将当前夹角的角度调整到90°;
当前夹角的角度在[110°,135°)或(135°,160°)范围内时,将当前夹角的角度调整到135°;
当前夹角的角度在[160°,180°)或(0°,20°)范围内时,将当前夹角的角度调整到180°。
在一种可能的实现方式中,所述识别单元505,用于获取几何结构之间的位置关系,根据所述位置关系将几何结构对应的标准几何结构进行组合,得到组合后的标准结构,对每个标准结构进行识别。
上述装置内的各单元之间的信息交互、执行过程等内容,由于与本发明方法实施例基于同一构思,具体内容可参见本发明方法实施例中的叙述,此处不再赘述。
本发明实施例提供的一种识别图像的方法及装置,具有如下有益效果:
1、通过本发明实施例提供的一种识别图像的方法及装置,将待识别图像分割成至少一个几何结构,获取每个几何结构的连接轨迹和端点,针对当前几何结构,根据当前几何结构的连接轨迹,当前几何结构的端点重新对应连接,获取对应的标准几何结构,该标准几何结构能够使得手写字符、艺术字等不规范字符更加规范,便于进行识别,然后,根据标准几何结构对待识别图像进行识别,能够提高图像的识别准确率。
2、本发明实施例提供的一种识别图像的方法及装置,将待识别图像加载到数据空间中,通过数据空间中的坐标来描述待识别图像中每个像素点,便于对待识别图像的特征进行准确的描述,便于对待识别图像的几何结构进行 处理。
3、本发明实施例提供的一种识别图像的方法及装置,通过对几何结构中的夹角进行标准化,并对几何结构中的端点进行重新连接,可以使得待识别图像中的内容更加规范,便于识别,可以提供识别的准确率。
4、现有技术中为了能够更加准确的识别待识别图像,一般将待识别图像分区域进行识别,对不同的区域采用不同的识别方式,例如对不同的区域采用不同的字库,识别过程复杂。本发明实施例提供的一种识别图像的方法及装置,无需对待识别图像进行分区域识别,整个待识别图像采用相同的识别方式,操作简便。
需要说明的是,在本文中,诸如第一和第二之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个······”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同因素。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储在计算机可读取的存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质中。
最后需要说明的是:以上所述仅为本发明的较佳实施例,仅用于说明本发明的技术方案,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所做的任何修改、等同替换、改进等,均包含在本发明的保护范围内。
Claims (6)
1.一种识别图像的方法,其特征在于,包括:
S1:获取待识别图像中的几何结构;
S2:获取所述待识别图像的每个几何结构的连接轨迹;
S3:获取所述待识别图像中每个几何结构的端点;
S4:根据当前几何结构的连接轨迹,将当前几何结构的所有端点对应连接,获取当前几何结构的标准几何结构;
S5:根据每个几何结构对应的标准结合结构,对所述待识别图像进行识别;
在S1之前,还包括:建立数据空间,将所述待识别图像加载到所述数据空间中;
所述S3,包括:在所述数据空间中,获取当前几何结构中每个端点的坐标;
所述S4,包括:
S41:根据当前几何结构中每个端点的坐标,确定当前几何结构中的每个夹角的角度;
S42:判断每个夹角的角度是否为预设的标准角度,如果是,则执行S44,否则,依次执行步骤S43、S44;
S43:调整不是标准角度的夹角对应的端点的坐标,使得当前几何结构中的每个夹角的角度为标准角度;
S44:根据当前几何结构的连接轨迹和每个端点的坐标,将当前几何结构的所有端点对应连接,获取当前几何结构的标准几何结构。
2.根据权利要求1所述的方法,其特征在于,所述预设的标准角度包括:45°、90°、135°、180°;
所述S43,包括:
当前夹角的角度在[20°,45°)或(45°,70°)范围内时,将当前夹角的角度调整到45°;
当前夹角的角度在[70°,90°)或(90°,110°)范围内时,将当前夹角的角度调整到90°;
当前夹角的角度在[110°,135°)或(135°,160°)范围内时,将当前夹角的角度调整到135°;
当前夹角的角度在[160°,180°)或(0°,20°)范围内时,将当前夹角的角度调整到180°。
3.根据权利要求2所述的方法,其特征在于,所述S5,包括:
获取几何结构之间的位置关系,根据所述位置关系将几何结构对应的标准几何结构进行组合,得到组合后的标准结构,对每个标准结构进行识别。
4.一种识别图像的装置,其特征在于,包括:
几何结构获取单元,用于获取待识别图像中的几何结构;
连接轨迹获取单元,用于获取所述待识别图像的每个几何结构的连接轨迹;
端点获取单元,用于获取所述待识别图像中每个几何结构的端点;
标准几何结构获取单元,用于根据当前几何结构的连接轨迹,将当前几何结构的所有端点对应连接,获取当前几何结构的标准几何结构;
识别单元,用于根据每个几何结构对应的标准结合结构,对所述待识别图像进行识别;
还包括:数据空间单元,用于建立数据空间,将所述待识别图像加载到所述数据空间中;
所述端点获取单元,用于在所述数据空间中,获取当前几何结构中每个端点的坐标;
所述标准几何结构获取单元,包括:
角度确定单元,用于根据当前几何结构中每个端点的坐标,确定当前几何结构中的每个夹角的角度;
判断单元,用于判断每个夹角的角度是否为预设的标准角度,当判断结果为是时,根据当前几何结构的连接轨迹和每个端点的坐标,将当前几何结构的所有端点对应连接,获取当前几何结构的标准几何结构,当判断结果为否时,调整不是标准角度的夹角对应的端点的坐标,使得当前几何结构中的每个夹角的角度为标准角度,根据当前几何结构的连接轨迹和每个端点的坐标,将当前几何结构的所有端点对应连接,获取当前几何结构的标准几何结构。
5.根据权利要求4所述的装置,其特征在于,所述预设的标准角度包括:45°、90°、135°、180°;
所述判断单元,在执行调整不是标准角度的夹角对应的端点的坐标,使得当前几何结构中的每个夹角的角度为标准角度时,具体执行:
当前夹角的角度在[20°,45°)或(45°,70°)范围内时,将当前夹角的角度调整到45°;
当前夹角的角度在[70°,90°)或(90°,110°)范围内时,将当前夹角的角度调整到90°;
当前夹角的角度在[110°,135°)或(135°,160°)范围内时,将当前夹角的角度调整到135°;
当前夹角的角度在[160°,180°)或(0°,20°)范围内时,将当前夹角的角度调整到180°。
6.根据权利要求5所述的装置,其特征在于,所述识别单元,用于获取几何结构之间的位置关系,根据所述位置关系将几何结构对应的标准几何结构进行组合,得到组合后的标准结构,对每个标准结构进行识别。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510505814.5A CN105184328B (zh) | 2015-08-17 | 2015-08-17 | 一种识别图像的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510505814.5A CN105184328B (zh) | 2015-08-17 | 2015-08-17 | 一种识别图像的方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105184328A CN105184328A (zh) | 2015-12-23 |
CN105184328B true CN105184328B (zh) | 2018-11-27 |
Family
ID=54906392
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510505814.5A Active CN105184328B (zh) | 2015-08-17 | 2015-08-17 | 一种识别图像的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105184328B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102385707A (zh) * | 2010-08-30 | 2012-03-21 | 阿里巴巴集团控股有限公司 | 一种数字图像识别的方法、装置及爬虫服务器 |
CN102855498A (zh) * | 2011-07-01 | 2013-01-02 | 富士通株式会社 | 字符识别方法和装置 |
CN104008405A (zh) * | 2013-02-26 | 2014-08-27 | 佳能株式会社 | 手写字符识别方法和装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7242806B2 (en) * | 2002-01-23 | 2007-07-10 | Honeywell International Inc. | Methods, functional Data, and Systems for image feature translation |
-
2015
- 2015-08-17 CN CN201510505814.5A patent/CN105184328B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102385707A (zh) * | 2010-08-30 | 2012-03-21 | 阿里巴巴集团控股有限公司 | 一种数字图像识别的方法、装置及爬虫服务器 |
CN102855498A (zh) * | 2011-07-01 | 2013-01-02 | 富士通株式会社 | 字符识别方法和装置 |
CN104008405A (zh) * | 2013-02-26 | 2014-08-27 | 佳能株式会社 | 手写字符识别方法和装置 |
Non-Patent Citations (3)
Title |
---|
基于几何特征点的身份证号码识别以及在二代身份证检证系统中的应用;王小芳;《中国优秀硕士学位论文全文数据库 信息科技辑》;20041215(第4期);I138-856 正文第37页 * |
基于统计和结构特征的手写数字识别研究;双小川 等;《计算机工程与设计》;20120430;第33卷(第4期);第1533-1537页 * |
形状匹配方法研究与展望;周瑜 等;《自动化学报》;20120630;第38卷(第6期);第889-910页 * |
Also Published As
Publication number | Publication date |
---|---|
CN105184328A (zh) | 2015-12-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210256253A1 (en) | Method and apparatus of image-to-document conversion based on ocr, device, and readable storage medium | |
CN110069767B (zh) | 基于电子书的排版方法、电子设备及计算机存储介质 | |
WO2020140698A1 (zh) | 表格数据的获取方法、装置和服务器 | |
CN101908136B (zh) | 一种表格识别处理方法及系统 | |
US6959121B2 (en) | Document image processing device, document image processing method, and memory medium | |
CN112183038A (zh) | 一种表格识别套打方法、计算机设备及计算机可读存储介质 | |
CN109598185B (zh) | 图像识别翻译方法、装置、设备及可读存储介质 | |
JPH1139428A (ja) | 文書映像の方向修正方法 | |
JP2011043969A (ja) | 画像特徴点抽出方法 | |
US20220415008A1 (en) | Image box filtering for optical character recognition | |
US8559718B1 (en) | Defining a layout of text lines of CJK and non-CJK characters | |
JP2011188465A (ja) | 原稿レイアウトの方向検出方法及び装置 | |
CN105279506A (zh) | 满文单词中轴线的定位方法 | |
CN110717492A (zh) | 基于联合特征的图纸中字符串方向校正方法 | |
RU2597163C2 (ru) | Сравнение документов с использованием достоверного источника | |
US20160044196A1 (en) | Image processing apparatus | |
US9684844B1 (en) | Method and apparatus for normalizing character included in an image | |
US9110926B1 (en) | Skew detection for vertical text | |
CN105184328B (zh) | 一种识别图像的方法及装置 | |
JP2006133941A (ja) | 画像処理装置、画像処理方法、画像処理プログラム及び携帯型端末 | |
CN111008635A (zh) | 一种基于ocr的多票据自动识别方法及识别系统 | |
US9152876B1 (en) | Methods and systems for efficient handwritten character segmentation | |
CN112084103A (zh) | 界面测试方法、装置、设备和介质 | |
WO2022019018A1 (en) | Segmentation of continuous dynamic scans | |
US11367296B2 (en) | Layout analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20181012 Address after: 215100 818 Wusong Road, Wusong River Industrial Park, Wuzhong development area, Suzhou, Jiangsu Applicant after: Tide Financial Information Technology Co Ltd Address before: 250100 Ji'nan hi tech Zone No. 2877, Shandong Province Applicant before: Inspur Group Co., Ltd. |
|
TA01 | Transfer of patent application right | ||
GR01 | Patent grant | ||
GR01 | Patent grant |