CN104408427A - 图像四边形识别的方法和装置 - Google Patents

图像四边形识别的方法和装置 Download PDF

Info

Publication number
CN104408427A
CN104408427A CN201410709428.3A CN201410709428A CN104408427A CN 104408427 A CN104408427 A CN 104408427A CN 201410709428 A CN201410709428 A CN 201410709428A CN 104408427 A CN104408427 A CN 104408427A
Authority
CN
China
Prior art keywords
image
quadrilateral
identification
border
conformed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410709428.3A
Other languages
English (en)
Inventor
陈鹏渊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Hehe Information Technology Development Co Ltd
Original Assignee
Shanghai Hehe Information Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Hehe Information Technology Development Co Ltd filed Critical Shanghai Hehe Information Technology Development Co Ltd
Priority to CN201410709428.3A priority Critical patent/CN104408427A/zh
Publication of CN104408427A publication Critical patent/CN104408427A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种图像四边形识别的方法,对第一图像进行四边形识别,该四边形识别中识别边界的确定是通过自动方式或手动方式两种中的至少一种来完成;记录对所述第一图像进行四边形识别时四边形的识别边界处的图像特征,并将该图像特征作为第一图像特征;在第二图像中搜索与所述第一图像特征相符的第二图像的识别边界,并根据该相符的第二图像的识别边界对所述第二图像中相应的四边形进行识别处理或者优先进行识别处理。本发明还公开了一种实现上述方法的图像四边形识别的装置。本发明使得用户进行批量操作时,对图像四边形识别的方法能够适应特定的操作环境,提高了图像四边形识别的准确性,减少了用户的手动操作,方便了用户的使用。

Description

图像四边形识别的方法和装置
技术领域
本发明涉及一种图像处理的方法,尤其是一种图像四边形识别的方法。本发明还涉及一种图像处理的装置,尤其是一种图像四边形识别的装置。
背景技术
随着技术的发展,图像已经成为人们传递信息的重要媒介,而图像处理技术已成为一项必不可少的工具,帮助人们进行图像的采集和使用。图像四边形识别是指对图像中的四边形轮廓进行识别,然后可以根据识别得到的四边形,将四边形的部分内容与其它部分进行分离,以决定保留其中一部分图像的图像处理技术。这种技术目前已经被广泛的使用。例如,用户可以用手机拍摄名片,然后手机对名片内容进行识别,将名片中的联系信息存入手机的通讯录。为了使得名片的识别更加准确,人们已经采用了图像四边形识别技术将拍摄得到的名片从图片中识别后进行切边处理,只保留名片区域的图像,而将其它背景图像去除,然后对名片区域的图像进行四边形拉伸处理,得到矩形的名片图像,然后对矩形的名片图像进行文字识别。被经过上述处理之后的名片图像,大大的克服了由于拍摄角度和摄像头的镜头造成的失真,从而提高了识别的准确率。再例如,现在人们可以通过用智能手机拍摄文件的方式对文件进行扫描,而不需要去使用扫描仪。手机拍摄到文件后,使用四边形识别技术将拍摄的文件从图像的背景中提取出来,然后拉伸成文件原来的尺寸,例如A4纸张大小。
然而,在上述的应用中,图像的处理一般是先通过计算机自动识别图像中名片或文件的边界,如图1中,在图像中识别出四边形边界ABCD,然后由用户检查是否需要对这些边界进行调整,再对边界内的部分图像进行提取和拉伸,如图2中,将图1中的四边形边界ABCD拉伸成矩形,并将矩形边界ABCD提取进行其它的处理。然而,名片、文件以及背景中的图案很可能会影响计算机自动识别边界的结果。例如,名片中如果有一条直线,如图1和图2中的线条EF,这条直线可能就会被识别成边界中的一条边,从而将四边形边界识别为ABFE。再例如,文件中如果有表格,该表格的外框可能就会被直接识别为文件的边界。再例如,如果背景中有一些线条,这些线条也可能会被识别为边界的一部分。这些图案对自动识别的干扰越多,就会造成边界识别的准确率越低,而随后用户进行调整的操作量就会越多。尤其在用户需要使用智能手机批量进行名片识别或者文件扫描的情况下,就会为用户带来大量的人工操作,非常的不方便。
发明内容
本发明所要解决的技术问题是提供一种图像四边形识别的方法,以及实现这种图像四边形识别的方法所采用的图像四边形识别的装置,能够在进行批量处理时提高图像四边形识别的准确性,减少用户的手动操作,方便用户的使用。
为解决上述技术问题,本发明图像四边形识别的方法的技术方案是,包括以下步骤:
步骤一,对第一图像进行四边形识别,该四边形识别中识别边界的确定是通过自动方式或手动方式两种中的至少一种来完成;
步骤二,记录对所述第一图像进行四边形识别时四边形的识别边界处的图像特征,并将该图像特征作为第一图像特征;
步骤三,在第二图像中搜索与所述第一图像特征相符的第二图像的识别边界,并根据该相符的第二图像的识别边界对所述第二图像中相应的四边形进行识别处理或者优先进行识别处理。
本发明还提供了一种实现上述图像四边形识别的方法所采用的图像四边形识别的装置,其技术方案是,基于计算机系统,包括
第一识别部件,对第一图像进行四边形识别,该四边形识别中识别边界的确定是通过自动方式或手动方式两种中的至少一种来完成;
图像特征采集部件,记录对所述第一图像进行四边形识别时四边形的识别边界处的图像特征,并将该图像特征作为第一图像特征;
第二识别部件,在第二图像中搜索与所述第一图像特征相符的第二图像的识别边界,并根据该相符的第二图像的识别边界对所述第二图像中相应的四边形进行识别处理或者优先进行识别处理。
本发明通过上述技术方案,使得用户进行批量操作时,对图像四边形识别的方法能够适应特定的操作环境,从而高效的完成图像的四边形识别,提高了图像四边形识别的准确性,减少了用户的手动操作,方便了用户的使用。
附图说明
下面结合附图和实施例对本发明作进一步详细的说明:
图1和图2为现有的图像四边形识别的方法的示意图。
图3、图4和图5为本发明图像四边形识别的方法的实施例示意图。
图6为图像四边形识别的装置的示意图。
具体实施方式
本发明公开了一种图像四边形识别的方法,包括以下步骤:
步骤一,对第一图像进行四边形识别,该四边形识别中识别边界的确定是通过自动方式或手动方式两种中的至少一种来完成;
步骤二,记录对所述第一图像进行四边形识别时四边形的识别边界处的图像特征,并将该图像特征作为第一图像特征;
步骤三,在第二图像中搜索与所述第一图像特征相符的第二图像的识别边界,并根据该相符的第二图像的识别边界对所述第二图像中相应的四边形进行识别处理或者优先进行识别处理。
用户在以拍摄方式获取文件或名片的电子格式时,通常会在一些比较固定的环境中,例如自己的办公室的桌子上,或者家里的桌子上,在这些环境中拍摄文件或名片时,拍摄得到的图像一般都会有类似的背景。再有时,用户拍摄的一套文件有很多张,或者一次性处理多个人的名片,因此可能会一次性拍摄多张文件或名片,而在进行这样的多张拍摄时,拍摄得到的图像也会有高度相似的背景。另外,对于一些格式文件,其文件上也会有一些特征,从而使得这些文件的图像也会有高度相似性。
用户使用本发明所提供的图像切边处理的方法,首先对第一张图像作为第一图像进行四边形识别处理,如图1所示,将图1中的四边形ABCD进行四边形识别,该四边形识别可以通过计算机系统自动进行,有时图像上会有一些干扰导致计算机系统自动进行的四边形识别发生错误,例如图1所示的图像中有线条EF,会造成计算机系统将四边形识别为ABFE或者CDEF,因此该四边形识别也可以由用户手动进行操作以选择要进行切边的四边形,还可以由计算机系统自动识别与用户手动操作相结合的方式,由用户对计算机系统自动识别的结果进行调整,进行对四边形ABCD的四边形识别。用户对第一张图像进行四边形识别,得到相应的处理结果,如图2所示的矩形ABCD。此外,计算机系统记录了上述四边形识别中,四边形ABCD边界处的图像特征,作为第一图像特征。
此后,用户对其它图像作为第二图像进行处理,此时计算机系统在第二图像中搜索与所述第一图像特征相符的第二图像的识别边界,并根据该相符的第二图像的识别边界对所述第二图像进行或者优先进行四边形识别。如图3所示,计算机系统在第二图像中搜索到四边形A’B’C’D’边界处的图像特征与所述第一图像特征相符,因此将四边形A’B’C’D’进行识别,或者优先选择四边形A’B’C’D’作为待识别的四边形,等待用户的确认后作为识别结果,然后如图4所示,可以将四边形A’B’C’D’提取出来并进行拉伸等其它操作。由于只有四边形A’B’C’D’边界处的图像特征与所述第一图像特征相符,而一些干扰图像特征例如线条E’F’处的图像特征与第一图像特征不相符,因此不会将线条E’F’错误的认为是待提取四边形的边界,从而提高了四边形识别处理的准确性。
本发明中,所述第一图像和第二图像可以一次性获取,也可以分多次获取。获取的方式可以是直接接收所述第一图像和第二图像的文件,也可以是通过拍摄等方式生成第一图像和第二图像的文件等。例如,用户可以一次性接收或者拍摄多个图像,然后对其中一个图像作为第一图像进行四边形识别,并记录相应的第一图像特征,之后根据该第一图像特征对其它的图像进行四边形识别处理。或者,用户还可以在以后另行接收或者拍摄其它的图像,根据先前已经记录的第一图像特征,对后来节后或者拍摄的图像进行四边形识别处理。
本发明中,所述第一图像可以是一个图像,也可以是多个图像。如果所述第一图像包括多个图像,则在步骤二中记录对每个第一图像进行四边形识别时第一图像的识别边界处的第一图像特征,步骤三中在第二图像中搜索与其中一个第一图像特征相符的第二图像的识别边界。所述步骤三中,在第二图像中搜索与指定的第一图像特征相符的第二图像的识别边界,或者在第二图像中搜索与任意第一图像特征相符的第二图像的识别边界。例如,用户在办公室的桌子和家中的桌子分别拍摄了不同的第一图像并进行了四边形识别,计算机系统中记录了上述不同的第一图像各自所对应的第一图像特征。以后,用户再拍摄新的第二图像,如果新的第二图像有符合办公室或家中所获取的第一图像对应的任意第一图像特征的识别边界,则根据该第一图像特征对新的第二图像进行四边形识别。或者,用户知道新的第二图像的拍摄地点,例如是在办公室的桌子上,用户可以指定办公室桌子拍摄的第一图像所对应的第一图像特征,然后根据该第一图像特征对第二图像进行四边形识别。
所述第二图像可以包括一个或多个图像;如果所述第二图像包括多个图像,则重复步骤三对每个第二图像进行处理。
所述第一图像特征包括以下五种中的至少一种:
识别边界在图像上的位置,可以在第二图像的相应位置上寻找是否有识别边界,进行四边形识别。
识别边界至少一侧的图案,例如,所拍摄的文件背景上有特定的图案,通过这些图案可以识别图像上哪部分是背景,哪部分是文件;或者所拍摄的文件是格式文件,上面有特定的底纹图案,这样也可以通过特定的底纹图案区别背景部分和文件部分。
识别边界至少一侧的颜色,例如,所拍摄的文件背景有特定的颜色,例如在桌子上拍摄文件,桌面的颜色可以作为区分图像中背景部分和文件部分的依据;或则所拍摄的文件也有特定的颜色,也可以作为区别图像中背景部分和文件部分的依据。
识别边界两侧色彩的对比度,在某一个环境下拍摄文件,文件部分的图像色彩与背景部分的色彩会有特定的对比度,将此作为第一图像特征也可以将文件部分与背景部分区分开。
识别边界的线条形状参数,例如对一本书的内容进行拍摄,如图5所示,翻开的书的轮廓形状相对比较固定,对这些轮廓线条的形状参数,例如线条的曲率、线条曲线的极值以及增减趋势,作为第一图像特征,从而确定第二图像中相似的轮廓线条,作为四边形识别边界。
本发明还公开了一种实现上述图像四边形识别的方法所采用的图像四边形识别装置,如图6所示,基于计算机系统,该计算机系统包括个人电脑、智能手机和平板电脑等,包括:
第一识别部件,对第一图像进行四边形识别,该四边形识别中识别边界的确定是通过自动方式或手动方式两种中的至少一种来完成;
图像特征采集部件,记录对所述第一图像进行四边形识别时四边形的识别边界处的图像特征,并将该图像特征作为第一图像特征;
第二识别部件,在第二图像中搜索与所述第一图像特征相符的第二图像的识别边界,并根据该相符的第二图像的识别边界对所述第二图像中相应的四边形进行识别处理或者优先进行识别处理。
本发明通过上述技术方案,使得用户进行批量操作时,对图像四边形识别的方法能够适应特定的操作环境,从而高效的完成图像的四边形识别,提高了图像四边形识别的准确性,减少了用户的手动操作,方便了用户的使用。
以上所述仅为本发明的较佳实施例而已,并非用以限定本发明的实质技术内容范围,本发明的实质技术内容是广义的定义于申请的权利要求范围中,任何他人完成的技术实体或方法,若是与申请的权利要求范围所定义的完全相同,也或是一种等效的变更,均将被视为涵盖于该权利要求范围之中。

Claims (7)

1.一种图像四边形识别的方法,其特征在于,包括以下步骤:
步骤一,对第一图像进行四边形识别,该四边形识别中识别边界的确定是通过自动方式或手动方式两种中的至少一种来完成;
步骤二,记录对所述第一图像进行四边形识别时四边形的识别边界处的图像特征,并将该图像特征作为第一图像特征;
步骤三,在第二图像中搜索与所述第一图像特征相符的第二图像的识别边界,并根据该相符的第二图像的识别边界对所述第二图像中相应的四边形进行识别处理或者优先进行识别处理。
2.根据权利要求1所述的图像四边形识别的方法,其特征在于,还包括一次性或者分多次获取第一图像和第二图像的步骤。
3.根据权利要求1所述的图像四边形识别的方法,其特征在于,所述第一图像包括一个或多个图像;如果所述第一图像包括多个图像,则在步骤二中记录对每个第一图像进行四边形识别时第一图像的识别边界处的第一图像特征,步骤三中在第二图像中搜索与其中一个第一图像特征相符的第二图像的识别边界。
4.根据权利要求3所述的图像四边形识别的方法,其特征在于,所述步骤三中,在第二图像中搜索与指定的第一图像特征相符的第二图像的识别边界,或者在第二图像中搜索与任意第一图像特征相符的第二图像的识别边界。
5.根据权利要求1所述的图像四边形识别的方法,其特征在于,所述第二图像包括一个或多个图像;如果所述第二图像包括多个图像,则重复步骤三对每个第二图像进行处理。
6.根据权利要求1所述的图像四边形识别的方法,其特征在于,所述第一图像特征包括以下几种中的至少一种:识别边界在图像上的位置,识别边界至少一侧的图案,识别边界至少一侧的颜色,识别边界两侧色彩的对比度,识别边界的线条形状参数。
7.一种实现权利要求1-6中任意一项所述的图像四边形识别的方法所采用的图像四边形识别装置,其特征在于,基于计算机系统,包括
第一识别部件,对第一图像进行四边形识别,该四边形识别中识别边界的确定是通过自动方式或手动方式两种中的至少一种来完成;
图像特征采集部件,记录对所述第一图像进行四边形识别时四边形的识别边界处的图像特征,并将该图像特征作为第一图像特征;
第二识别部件,在第二图像中搜索与所述第一图像特征相符的第二图像的识别边界,并根据该相符的第二图像的识别边界对所述第二图像中相应的四边形进行识别处理或者优先进行识别处理。
CN201410709428.3A 2014-12-01 2014-12-01 图像四边形识别的方法和装置 Pending CN104408427A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410709428.3A CN104408427A (zh) 2014-12-01 2014-12-01 图像四边形识别的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410709428.3A CN104408427A (zh) 2014-12-01 2014-12-01 图像四边形识别的方法和装置

Publications (1)

Publication Number Publication Date
CN104408427A true CN104408427A (zh) 2015-03-11

Family

ID=52646058

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410709428.3A Pending CN104408427A (zh) 2014-12-01 2014-12-01 图像四边形识别的方法和装置

Country Status (1)

Country Link
CN (1) CN104408427A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105069454A (zh) * 2015-08-24 2015-11-18 广州视睿电子科技有限公司 图像识别的方法及装置
CN105139359A (zh) * 2015-09-02 2015-12-09 小米科技有限责任公司 图像转换方法和装置
CN105631396A (zh) * 2015-11-13 2016-06-01 东莞酷派软件技术有限公司 一种获取文件电子档的方法及装置
CN106650719A (zh) * 2016-12-21 2017-05-10 浙江宇视科技有限公司 识别图片文字的方法及装置
CN107358150A (zh) * 2017-06-01 2017-11-17 深圳赛飞百步印社科技有限公司 物体边框识别方法、装置和高拍仪

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102201053A (zh) * 2010-12-10 2011-09-28 上海合合信息科技发展有限公司 一种文本图像的切边方法
CN103399695A (zh) * 2013-08-01 2013-11-20 上海合合信息科技发展有限公司 用于智能无线通信终端的四边形边框识别方法及装置
CN103500337A (zh) * 2013-09-30 2014-01-08 上海合合信息科技发展有限公司 用于智能无线通信终端的识别四边形边框的方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102201053A (zh) * 2010-12-10 2011-09-28 上海合合信息科技发展有限公司 一种文本图像的切边方法
CN103399695A (zh) * 2013-08-01 2013-11-20 上海合合信息科技发展有限公司 用于智能无线通信终端的四边形边框识别方法及装置
CN103500337A (zh) * 2013-09-30 2014-01-08 上海合合信息科技发展有限公司 用于智能无线通信终端的识别四边形边框的方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
福昕: "福昕风腾PDF套件6.0版本", 《福昕风腾PDF套件6.0版本 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105069454A (zh) * 2015-08-24 2015-11-18 广州视睿电子科技有限公司 图像识别的方法及装置
CN105139359A (zh) * 2015-09-02 2015-12-09 小米科技有限责任公司 图像转换方法和装置
CN105631396A (zh) * 2015-11-13 2016-06-01 东莞酷派软件技术有限公司 一种获取文件电子档的方法及装置
CN106650719A (zh) * 2016-12-21 2017-05-10 浙江宇视科技有限公司 识别图片文字的方法及装置
CN106650719B (zh) * 2016-12-21 2020-04-10 浙江宇视科技有限公司 识别图片文字的方法及装置
CN107358150A (zh) * 2017-06-01 2017-11-17 深圳赛飞百步印社科技有限公司 物体边框识别方法、装置和高拍仪

Similar Documents

Publication Publication Date Title
JP6208383B2 (ja) プレビューモードにおける画像キャプチャリングパラメータ調整
RU2651144C2 (ru) Ввод данных с изображений документов с фиксированной структурой
JP5896245B2 (ja) テキスト画像のトリミング方法
JP6011470B2 (ja) 予備画像を分析する装置、方法及びプログラム
US20190188465A1 (en) Recognizing text in image data
CN108234814B (zh) 控制方法和存储介质
CN104408427A (zh) 图像四边形识别的方法和装置
WO2014086287A1 (zh) 文本图像自动切分方法及装置,自动切分手写条目的方法
US10136011B2 (en) Automatic scanning of document stack with a camera
CN102982160A (zh) 方便电子化的专业笔记本及其电子化文档的自动分类方法
CN103500337A (zh) 用于智能无线通信终端的识别四边形边框的方法及装置
US9779323B2 (en) Paper sheet or presentation board such as white board with markers for assisting processing by digital cameras
JP2017037435A (ja) 表示制御装置、表示制御方法、及びプログラム
JP6739937B2 (ja) 情報処理装置、情報処理装置の制御方法、及びプログラム
CN111310634B (zh) 证件类型识别模板的生成方法、证件识别方法及装置
CN104462044A (zh) 表格图像识别编辑方法及装置
JP2008204184A (ja) 画像処理装置、画像処理方法、プログラムおよび記録媒体
CN110084269A (zh) 基于云计算的图像特征优化方法
CN116758550A (zh) 表单图像的文本识别方法及其装置、电子设备、存储介质
WO2014086266A1 (zh) 一种方便电子化的专业笔记本及其电子缩略图显示方法
JPH10254901A (ja) 画像検索方法および装置
JP2017199288A (ja) 画像処理装置、画像処理方法及びプログラム
CN109492629A (zh) 简易高拍仪系统及其使用方法
US11380032B2 (en) Image information processing apparatus, method and non-transitory computer readable medium storing program
US11979523B2 (en) Storage medium, image processing method, and image processing apparatus

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 200436 building A, No. 1268, Wanrong Road, Jingan District, Shanghai

Applicant after: Shanghai Hehe Information Technology Development Co., Ltd.

Address before: 7, No. 200433, building 335, building 3, National Road, Yangpu District, Shanghai, B

Applicant before: Shanghai Hehe Information Technology Development Co., Ltd.

RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20150311