WO2012075817A1 - 一种文本图像的切边方法 - Google Patents

一种文本图像的切边方法 Download PDF

Info

Publication number
WO2012075817A1
WO2012075817A1 PCT/CN2011/077914 CN2011077914W WO2012075817A1 WO 2012075817 A1 WO2012075817 A1 WO 2012075817A1 CN 2011077914 W CN2011077914 W CN 2011077914W WO 2012075817 A1 WO2012075817 A1 WO 2012075817A1
Authority
WO
WIPO (PCT)
Prior art keywords
text
quadrilateral
trimming
image data
image
Prior art date
Application number
PCT/CN2011/077914
Other languages
English (en)
French (fr)
Inventor
龙腾
张彬
罗希平
Original Assignee
上海合合信息科技发展有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 上海合合信息科技发展有限公司 filed Critical 上海合合信息科技发展有限公司
Priority to ES11846097.1T priority Critical patent/ES2609953T3/es
Priority to KR1020137014846A priority patent/KR101784919B1/ko
Priority to EP11846097.1A priority patent/EP2650821B1/en
Priority to US13/992,383 priority patent/US9082192B2/en
Priority to JP2013542346A priority patent/JP5896245B2/ja
Publication of WO2012075817A1 publication Critical patent/WO2012075817A1/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality

Definitions

  • the invention belongs to the technical field of image processing, and relates to an image processing method, and in particular to a method for trimming a text image. Background technique
  • digital imaging devices such as digital cameras have become more and more widely used.
  • digital cameras have become standard devices for mobile devices such as mobile phones.
  • These digital imaging devices are often used to capture various text images, which are images containing one or more lines of printed text, such as business cards, menus, tickets, and the like.
  • Camera shooting is different from the image scanned by the scanner. The difference is that the image captured by the camera is not as clear as the image scanned by the scanner.
  • the image captured by the camera contains the projection deformation of the captured object such as the business card, so that the business card in the image is viewed. It is not as good as the one that was scanned, and the image taken by the camera contains the background of the outside of the object being photographed. Due to differences in shooting habits, framing needs, etc., the text image captured by the user generally contains the background, and the image desired by the user usually removes the image of the background area, just like the image scanned by the scanner.
  • the business card processing software mobiReader of Apple's app s tore when shooting a business card, requires the user to shoot the business card just in the preview frame by specifying a preview box. Therefore, the image obtained by the shooting has only the area of the business card, and the effect of cutting the business card is achieved. This is a method of manual trimming. Because the shape of the image of the text, such as business cards, menus, and tickets, is generally a quadrilateral with obvious edges, many software will detect the text area by the line detection method in image processing, such as Apple's app s tore software genius Scar.
  • this detection method often treats the line inside the text as the edge of the text. For such a picture containing text, it is still possible to assist in finding the area of the text image according to some specific clues, improve the accuracy of detecting the text area, and ensure the effect of trimming.
  • the technical problem to be solved by the present invention is: providing a trimming method for a text image, which can automatically detect the edge of the text region, and use the detected text region to verify and correct the text edge by using the detected text region, The accuracy of detecting the text area is improved, thereby removing irrelevant redundant information, so that the image that the user sees when viewing the image data is a part that has a text area and is valuable to the user.
  • the present invention uses the following technical solutions:
  • Step 110 Acquire text image data
  • Step 120 detecting a straight line of the text image by using a line detection method to obtain an edge of the trimmed quadrilateral;
  • Step 130 Perform text detection on the image data to obtain coordinates of a boundary point of the text area.
  • Step 140 Obtain a final trimming result according to the results of step 120 and step 130; Step 150, end.
  • the step 140 specifically includes the following steps:
  • Step 210 Form all the trimmed quads obtained in step 120 into a candidate quadrilateral set; Step 220, if the candidate quadrilateral set is empty, proceed to step 260, otherwise proceed to step 230; Step 230, remove the next candidate from the quadrilateral candidate set Quadrilateral
  • Step 240 determining whether all boundary points of the text area are in the candidate quadrilateral, if yes, the text area is a valid trimming quadrilateral to step 250, if no, go to step 220;
  • Step 250 returning a valid trimming quadrilateral
  • Step 260 returning the entire image to the user for manually determining the trimming quadrilateral.
  • the method for acquiring image data in the step 110 includes one of the following three types:
  • One method is to take a picture with a digital camera
  • the second method is image data obtained by a scanner;
  • the third method is to open a pre-existing file containing image data, read the data in the file and decompress the image data according to a standard algorithm.
  • the device requires general arithmetic and storage devices, including a CPU of a certain frequency (central processing unit), a memory for computing, and a system software for storage, application software. And storage space for various data, etc. If you need to take image data through digital camera shooting or scanner scanning, you also need a digital camera or scanner.
  • the invention automatically detects the edge of the text area for the text image data that the user needs to save or browse, and uses the detected method to verify and correct the edge of the text by using the detected text area, thereby greatly improving the detected text area.
  • the accuracy The beneficial effects of the present invention are as follows:
  • the method for trimming a text image proposed by the present invention uses a technique in the field of image processing, pattern recognition, etc., to determine whether a trimmed quadrilateral contains a text region when trimming a text image. Thereby obtaining an accurate text area.
  • the method can obtain an accurate trimming area from the candidate quadrilateral of the trimming edge, and reduce the trouble of the user manually cutting the area and losing the data due to the trimming.
  • FIG. 1 is a flow chart of a text image trimming method according to the present invention.
  • FIG. 2 is a flow chart showing the steps of determining whether a trimmed quadrilateral is effective
  • Figure 3 is a schematic diagram of the effect of the original text image
  • FIG. 4 is a schematic diagram showing the effect of a text image processed by the text image trimming method of the present invention. detailed description
  • the present invention discloses a method for trimming a text image, and the method includes the following steps: [Step 110] Acquire text image data.
  • the method of obtaining image data includes one of the following three types:
  • One method is to take a picture with a digital camera
  • the second method is image data obtained by a scanner
  • the third method is to open a pre-existing file containing image data, read the data in the file and decompress the image data according to a standard algorithm.
  • Step 120 A straight line of the text image is detected by a line detection method to obtain an edge of the trimmed quadrilateral.
  • Step 130 Perform text detection on the image data to obtain the coordinates of the boundary point of the text area;
  • Step 140 obtain the final trimming result according to the results of Step 120 and Step 130; Referring to FIG. 2, Step 140 specifically includes The following steps:
  • Step 210 Form all the trimmed quads obtained in step 120 into a candidate quadrilateral set; Step 220, if the candidate quadrilateral set is empty, proceed to step 260, otherwise proceed to step 230; Step 230, remove the next candidate from the quadrilateral candidate set Quadrilateral
  • Step 240 determining whether all boundary points of the text area are in the candidate quadrilateral, if yes, the text area is a valid trimming quadrilateral to step 250, if no, go to step 220;
  • Step 250 returning a valid trimming quadrilateral
  • Step 260 returning the entire image to the user for manually determining the trimming quadrilateral.
  • the method for trimming a text image proposed by the present invention uses a technique in the field of image processing, pattern recognition, etc., when trimming a text image, by determining whether the trimmed quadrilateral contains a text region, thereby obtaining The exact text area.
  • the method can obtain an accurate trimming area from the candidate quadrilateral of the trimming edge, and reduce the trouble of the user manually cutting the area and losing the data due to the trimming.
  • the recorded ticket list is as shown in FIG. 3, and the image data therein is read by the method of the present invention, and the correction algorithm of automatic trimming and text detection is obtained.
  • the image shown is shown in Figure 4.
  • the mobile phone comes with a 3 megapixel camera, and uses the method described in the present invention to obtain a rectangular image of the captured business card image through automatic trimming and text detection correction algorithms.
  • the description and application of the present invention are intended to be illustrative, and not intended to limit the scope of the invention. Variations and modifications of the embodiments disclosed herein are possible, and various alternative and equivalent components of the embodiments are well known to those of ordinary skill in the art. It will be apparent to those skilled in the art that the present invention may be embodied in other forms, structures, arrangements, ratios, and other components, materials and components without departing from the spirit or essential characteristics of the invention. Other variations and modifications of the embodiments disclosed herein may be made without departing from the scope and spirit of the invention.

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Character Input (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Studio Devices (AREA)
  • Image Analysis (AREA)
  • Processing Or Creating Images (AREA)
  • Facsimile Image Signal Circuits (AREA)

Description

一种文本图像的切边方法 技术领域
本发明属于图像处理技术领域, 涉及一种图像处理方法, 尤其涉及一种文 本图像的切边方法。 背景技术
近年来, 数码相机等数字成像设备的应用越来越广泛, 目前自带的数码相 机已经成为了手机等移动设备的标准配置了。 这些数字成像设备经常被用来拍 摄各种文本图像, 文本图像是指包含有一行或者多行印刷体文字的图像, 比如 名片, 菜单, 票据等等。 相机拍摄跟扫描仪扫描所得到的图像是有区别的, 区 别包括相机拍摄得到的图像不如扫描仪扫描的图像清晰, 相机拍摄的图像包含 了所拍摄物体如名片的投影形变使得图像中的名片看上去不如扫描的到的那么 方正, 相机拍摄的图像包含了所拍摄物体外部的背景等等。 由于拍摄习惯, 取 景需求等的不同, 用户拍摄到的文本图像, 一般是包含有背景的, 而用户需要 的图像, 通常是去掉了背景区域的图像, 就像扫描仪扫描得到的图像。
将文本图像中从其背景中分离出来的技术, 目前已有应用, 比如苹果公司 app s tore 的 名片处理软件 mobiReader 在拍摄名片时, 通过指定一个预览 框, 要求用户拍摄时时名片刚好在预览框内, 从而使拍摄得到的图像只有名片 的区域, 达到将名片切边的效果。 这是一种手动切边的方法。 因为文本的图像 的形状比如名片, 菜单, 票据一般是具有明显边缘的四边形, 很多软件会通过 图像处理中的直线检测的方法检测出文本区域, 比如苹果公司 app s tore 的软 件 genius Scar
但是到文本中有其它的明显的边缘时, 这种检测方法常常会将文本内部的 直线当成文本的边缘。 对这种包含有文字的图片仍然可以根据一些特定的线索 来辅助寻找文本图像的区域, 提高检测文本区域的准确性, 保证切边的效果。
无论是扫描得到的文本图像还是相机拍摄得到的文本图像, 现有的软件如 名片识别软件以及一般扫描仪带有的 OCR软件都可以自动的检测出图像中的文 字并进行识别。 发明内容
本发明所要解决的技术问题是: 提供一种文本图像的切边方法, 可自动检 测文本区域的边缘, 并通过文字检测的方法, 利用检测到的文字区域对文本边 缘进行验证和纠正, 大幅度提高了检测到文本区域的准确性, 从而去掉了不相 关的冗余信息, 使用户浏览图像数据时看到的图像是有只含有文本区域的对用 户有价值的部分。
为解决上述技术问题, 本发明釆用如下技术方案:
一种文本图像的切边方法, 其特征在于, 所述方法包括如下步骤: 步骤 110, 获取文本图像数据;
步骤 120 , 通过直线检测的方法检测出文本图像的直线, 得到切边四边形 的边缘;
步骤 130, 对图像数据进行文本检测, 得到文本区域的边界点的坐标; 步骤 140, 根据步骤 120和步骤 130的结果得到最后的切边结果; 步骤 150, 结束。
作为本发明的一种优选方案, 所述步骤 140具体包括如下步骤:
步骤 210, 将步骤 120得到的所有切边四边形组成一个候选四边形集合; 步骤 220, 如果候选四边形集合为空, 转入步骤 260 , 否则进入步骤 230; 步骤 230, 从四边形候选集合移取下一个候选四边形;
步骤 240 , 判断文本区域的所有边界点是否在候选四边形中, 如果是则该 文本区域为有效的切边四边形转步骤 250, 如果否, 转步骤 220;
步骤 250, 返回有效的切边四边形;
步骤 260, 将整张图像返回给用户供其手工确定切边四边形。
作为本发明的一种优选方案, 所述步骤 110获取图像数据的方法包括以下 三种之一:
方法之一是用数码相机拍摄得到的图像;
方法之二是用扫描仪得到的图像数据; 方法之三是打开一个预先存在的包含有图像数据的文件, 读取该文件中的 数据并按照标准算法解压缩后得到的图像数据。 为了实现本发明, 需具备如下硬件条件: 该设备中需要有一般的运算和存 储装置, 包括一定频率的 CPU (中央处理器), 有一定用来运算的内存和用来存 储系统软件, 应用软件和各种数据的存储空间等。 如果需要通过数码相机拍摄 或者扫描仪扫描来得到图像数据, 还需要有数码相机或扫描仪。 本发明针对用 户需要保存或进行浏览的文本图像数据, 自动检测文本区域的边缘, 并通过文 字检测的方法, 利用检测到的文字区域对文本边缘进行验证和纠正, 大幅度提 高了检测到文本区域的准确性。 本发明的有益效果在于: 本发明提出的文本图像的切边方法, 利用图像处 理、 模式识别等的领域的技术, 在对文本图像进行切边的时候, 通过判断切边 四边形是否包含文本区域, 从而得到准确的文本区域。 该方法能从切边的候选 四边形中得到准确的切边区域, 减少用户手工裁减区域和由于切边不准丟失数 据的麻烦。 附图说明
图 1为本发明文本图像切边方法的流程图;
图 2为判断切边四边形是否有效步骤的流程图;
图 3为原始文本图像效果示意图;
图 4为经本发明文本图像切边方法处理后的文本图像效果示意图。 具体实施方式
下面结合附图详细说明本发明的优选实施例。
实施例一
请参阅图 1 , 本发明揭示了一种文本图像的切边方法, 所述方法包括如下 步骤: 【步骤 110】获取文本图像数据。
获取图像数据的方法包括以下三种之一:
方法之一是用数码相机拍摄得到的图像;
方法之二是用扫描仪得到的图像数据;
方法之三是打开一个预先存在的包含有图像数据的文件, 读取该文件中的 数据并按照标准算法解压缩后得到的图像数据。
【步骤 120】通过直线检测的方法检测出文本图像的直线, 得到切边四边 形的边缘。
【步骤 130】对图像数据进行文本检测, 得到文本区域的边界点的坐标; 【步骤 140】才艮据步骤 120和步骤 130的结果得到最后的切边结果; 请参阅图 2 , 步骤 140具体包括如下步骤:
步骤 210, 将步骤 120得到的所有切边四边形组成一个候选四边形集合; 步骤 220, 如果候选四边形集合为空, 转入步骤 260 , 否则进入步骤 230; 步骤 230, 从四边形候选集合移取下一个候选四边形;
步骤 240 , 判断文本区域的所有边界点是否在候选四边形中, 如果是则该 文本区域为有效的切边四边形转步骤 250, 如果否, 转步骤 220;
步骤 250, 返回有效的切边四边形;
步骤 260, 将整张图像返回给用户供其手工确定切边四边形。
【步骤 150】 结束。 综上所述, 本发明提出的文本图像的切边方法, 利用图像处理、 模式识别 等的领域的技术, 在对文本图像进行切边的时候, 通过判断切边四边形是否包 含文本区域, 从而得到准确的文本区域。 该方法能从切边的候选四边形中得到 准确的切边区域, 减少用户手工裁减区域和由于切边不准丟失数据的麻烦。 实施例二
在一般的计算机上, 对拍摄到的票据单如图 3 所示, 使用本发明所述的方 法, 读取其中的图像数据, 经过自动切边和文本检测的纠正算法, 得到如图所 示的图像如图 4所示。 实施例三
在 iPhone 上, 该手机自带 300 万像素的摄像头, 使用本发明所述的方 法, 对拍摄得到的名片图像, 经过自动切边和文本检测的纠正算法, 得到矩形 图像。 这里本发明的描述和应用是说明性的, 并非想将本发明的范围限制在上述 实施例中。 这里所披露的实施例的变形和改变是可能的, 对于那些本领域的普 通技术人员来说实施例的替换和等效的各种部件是公知的。 本领域技术人员应 该清楚的是, 在不脱离本发明的精神或本质特征的情况下, 本发明可以以其它 形式、 结构、 布置、 比例, 以及用其它组件、 材料和部件来实现。 在不脱离本 发明范围和精神的情况下, 可以对这里所披露的实施例进行其它变形和改变。

Claims

权利要求书
1、 一种文本图像的切边方法, 其特征在于, 所述方法包括如下步骤:
步骤 110, 获取文本图像数据; 获取图像数据的方法包括以下三种之一: 方 法之一是用数码相机拍摄得到的图像; 方法之二是用扫描仪得到的图像数据; 方法之三是打开一个预先存在的包含有图像数据的文件, 读取该文件中的数据 并按照标准算法解压缩后得到的图像数据;
步骤 120, 通过直线检测的方法检测出文本图像的直线, 得到切边四边形的 边缘; 通过检测到的直线得到多个候选的四边形区域;
步骤 130, 对图像数据进行文本检测, 得到文本区域的边界点的坐标; 步骤 140, 才艮据步骤 120和 130的结果得到最后的切边结果; 步骤 140的具 体步骤如下:
-步骤 210, 将步骤 120得到的所有切边四边形组成一个候选四边形集合; -步骤 220, 如果候选四边形集合为空, 转入步骤 260, 否则进入步骤 230; -步骤 230, 从四边形候选集合移取下一个候选四边形;
-步骤 240, 判断文本区域的所有边界点是否在候选四边形中, 如果是则该 文本区域为有效的切边四边形转步骤 250, 如果否, 转步骤 220;
-步骤 250, 返回有效的切边四边形;
-步骤 260, 将整张图像返回给用户供其手工确定切边四边形;
步骤 150, 结束。
2、 一种文本图像的切边方法, 其特征在于, 所述方法包括如下步骤:
步骤 110, 获取文本图像数据;
步骤 120, 通过直线检测的方法检测出文本图像的直线, 得到切边四边形的 边缘;
步骤 130, 对图像数据进行文本检测, 得到文本区域的边界点的坐标; 步骤 140, 根据步骤 120和步骤 130的结果得到最后的切边结果;
步骤 150, 结束。
3、 根据权利要求 2所述的文本图像的切边方法, 其特征在于:
所述步骤 140具体包括如下步骤:
步骤 210, 将步骤 120得到的所有切边四边形组成一个候选四边形集合; 步骤 220, 如果候选四边形集合为空, 转入步骤 260 , 否则进入步骤 230; 步骤 230, 从四边形候选集合移取下一个候选四边形;
步骤 240 , 判断文本区域的所有边界点是否在候选四边形中, 如果是则该文 本区域为有效的切边四边形转步骤 250 , 如果否, 转步骤 220;
步骤 250, 返回有效的切边四边形;
步骤 260, 将整张图像返回给用户供其手工确定切边四边形。
4、 根据权利要求 2所述的文本图像的切边方法, 其特征在于:
所述步骤 110获取图像数据的方法包括以下三种之一:
方法之一是用数码相机拍摄得到的图像;
方法之二是用扫描仪得到的图像数据;
方法之三是打开一个预先存在的包含有图像数据的文件, 读取该文件中的数 据并按照标准算法解压缩后得到的图像数据。
PCT/CN2011/077914 2010-12-10 2011-08-02 一种文本图像的切边方法 WO2012075817A1 (zh)

Priority Applications (5)

Application Number Priority Date Filing Date Title
ES11846097.1T ES2609953T3 (es) 2010-12-10 2011-08-02 Procedimiento de recorte de imágenes de texto
KR1020137014846A KR101784919B1 (ko) 2010-12-10 2011-08-02 텍스트 이미지의 트리밍 방법
EP11846097.1A EP2650821B1 (en) 2010-12-10 2011-08-02 Text image trimming method
US13/992,383 US9082192B2 (en) 2010-12-10 2011-08-02 Text image trimming method
JP2013542346A JP5896245B2 (ja) 2010-12-10 2011-08-02 テキスト画像のトリミング方法

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201010583973.4 2010-12-10
CN2010105839734A CN102201053B (zh) 2010-12-10 2010-12-10 一种文本图像的切边方法

Publications (1)

Publication Number Publication Date
WO2012075817A1 true WO2012075817A1 (zh) 2012-06-14

Family

ID=44661718

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2011/077914 WO2012075817A1 (zh) 2010-12-10 2011-08-02 一种文本图像的切边方法

Country Status (8)

Country Link
US (1) US9082192B2 (zh)
EP (1) EP2650821B1 (zh)
JP (1) JP5896245B2 (zh)
KR (1) KR101784919B1 (zh)
CN (1) CN102201053B (zh)
ES (1) ES2609953T3 (zh)
PT (1) PT2650821T (zh)
WO (1) WO2012075817A1 (zh)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102201053B (zh) * 2010-12-10 2013-07-24 上海合合信息科技发展有限公司 一种文本图像的切边方法
CN103678300B (zh) * 2012-08-30 2020-02-07 深圳市世纪光速信息技术有限公司 一种图片转换方法及装置
CN103020619B (zh) * 2012-12-05 2016-04-20 上海合合信息科技发展有限公司 一种自动切分电子化笔记本中手写条目的方法
CN102938063B (zh) * 2012-12-05 2016-02-10 上海合合信息科技发展有限公司 一种方便电子化的专业笔记本及其电子化方法
CN103500337B (zh) * 2013-09-30 2018-10-09 上海合合信息科技发展有限公司 用于智能无线通信终端的识别四边形边框的方法及装置
WO2016033710A1 (en) * 2014-09-05 2016-03-10 Xiaoou Tang Scene text detection system and method
CN104408427A (zh) * 2014-12-01 2015-03-11 上海合合信息科技发展有限公司 图像四边形识别的方法和装置
CN104636742B (zh) * 2015-02-16 2017-12-15 珠海市追梦网络科技有限公司 一种通过摄像自动锁定目标题目并传输的方法
CN105046200B (zh) * 2015-06-19 2020-06-09 成都理想境界科技有限公司 基于直线检测的电子阅卷方法
CN105092608B (zh) * 2015-09-24 2017-11-03 哈尔滨工业大学 终端光学元件损伤在线检测中孪生像的剔除方法
CN105631396A (zh) * 2015-11-13 2016-06-01 东莞酷派软件技术有限公司 一种获取文件电子档的方法及装置
CN106491040B (zh) * 2016-11-14 2019-04-09 浙江工业大学 一种摆动式擦窗机器人玻璃边缘触碰检测处理方法
CN106491042B (zh) * 2016-11-14 2019-01-08 浙江工业大学 一种摆动式擦窗机器人玻璃边缘处向下移动处理方法
CN106491039B (zh) * 2016-11-14 2019-01-08 浙江工业大学 一种摆动式擦窗机器人玻璃边缘检测方法
CN106981070B (zh) * 2017-02-13 2018-05-11 北京仁光科技有限公司 一种大屏系统交互行为状态的判断方法
CN110363196B (zh) * 2019-06-20 2022-02-08 吴晓东 一种倾斜文本的文字精准识别的方法
CN111027560B (zh) * 2019-11-07 2023-09-29 浙江大华技术股份有限公司 文本检测方法以及相关装置
CN112016551B (zh) * 2020-10-23 2021-04-09 北京易真学思教育科技有限公司 文本检测方法、装置、电子设备及计算机存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1937698A (zh) * 2006-10-19 2007-03-28 上海交通大学 图像畸变自动校正的图像处理方法

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56140473A (en) * 1980-04-03 1981-11-02 Nec Corp Character element cutting device
US4764789A (en) * 1986-07-28 1988-08-16 Sanyo Electric Co., Ltd. Apparatus for inputting image forming condition
JPH09297814A (ja) * 1996-04-30 1997-11-18 Nippon Telegr & Teleph Corp <Ntt> フィールド抽出方法
US7171056B2 (en) 2003-02-22 2007-01-30 Microsoft Corp. System and method for converting whiteboard content into an electronic document
JP4363151B2 (ja) * 2003-10-14 2009-11-11 カシオ計算機株式会社 撮影装置、その画像処理方法及びプログラム
JP4143566B2 (ja) * 2004-04-16 2008-09-03 キヤノン株式会社 文書処理装置及びその制御方法、並びにコンピュータプログラム
DE602005007571D1 (de) * 2005-02-25 2008-07-31 Psion Teklogix Systems Inc Automatische Detektion und Korrektur von Perspektivenverzerrung für Dokumentabbildungen
JP4344888B2 (ja) 2005-12-09 2009-10-14 株式会社カシオ日立モバイルコミュニケーションズ 撮像装置、撮像画像処理方法及びプログラム
JP4424314B2 (ja) * 2006-02-03 2010-03-03 カシオ計算機株式会社 書画撮影装置、書画静止検出方法及びプログラム
JP4902568B2 (ja) * 2008-02-19 2012-03-21 キヤノン株式会社 電子文書生成装置、電子文書生成方法、コンピュータプログラム、および記憶媒体
CN101593277A (zh) * 2008-05-30 2009-12-02 电子科技大学 一种复杂彩色图像中文本区域自动定位方法及装置
CN101425142B (zh) * 2008-09-17 2011-05-11 北大方正集团有限公司 页面倾斜角度的确定方法和装置
US9165388B2 (en) * 2008-09-22 2015-10-20 International Business Machines Corporation Method of automatic cropping
CN102201053B (zh) * 2010-12-10 2013-07-24 上海合合信息科技发展有限公司 一种文本图像的切边方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1937698A (zh) * 2006-10-19 2007-03-28 上海交通大学 图像畸变自动校正的图像处理方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
BU, FEIYU ET AL.: "Edge detection based image segmentation method for multi sheet of papers in one image", COMPUTER ENGINEERING AND DESIGN, vol. 28, no. 8, 30 April 2007 (2007-04-30), pages 1861 - 1863 *
HE, ZHIMING: "Rectification of Perspective Document Image Captured by Digital Camera", JOURNAL OF SHANGHAI UNIVERSITY OF ENGINEERING SCIENCE, vol. 21, no. 3, 30 September 2007 (2007-09-30), pages 260 - 264 *
See also references of EP2650821A4 *

Also Published As

Publication number Publication date
KR101784919B1 (ko) 2017-10-12
EP2650821A1 (en) 2013-10-16
US20130251262A1 (en) 2013-09-26
CN102201053B (zh) 2013-07-24
US9082192B2 (en) 2015-07-14
ES2609953T3 (es) 2017-04-25
KR20130126929A (ko) 2013-11-21
EP2650821A4 (en) 2014-03-12
CN102201053A (zh) 2011-09-28
PT2650821T (pt) 2017-01-13
JP5896245B2 (ja) 2016-03-30
JP2014504400A (ja) 2014-02-20
EP2650821B1 (en) 2016-10-05

Similar Documents

Publication Publication Date Title
WO2012075817A1 (zh) 一种文本图像的切边方法
JP4772839B2 (ja) 画像識別方法および撮像装置
RU2631765C1 (ru) Способ и система исправления перспективных искажений в изображениях, занимающих двухстраничный разворот
WO2012068902A1 (zh) 提高文本图像清晰度的方法及系统
CN109241345B (zh) 基于人脸识别的视频定位方法和装置
TW201230789A (en) Image processing system and object of image capturing used therewith
US20170070664A1 (en) Method for processing image and electronic apparatus therefor
JP2019087945A (ja) 情報処理装置、プログラム及び情報処理方法
US8520950B2 (en) Image processing device, image processing method, program, and integrated circuit
WO2022111461A1 (zh) 识别方法、装置及电子设备
JP6564136B2 (ja) 画像処理装置、画像処理方法、および、プログラム
WO2018107574A1 (zh) 一种对印防伪特征的检测方法及装置
CN113158773B (zh) 一种活体检测模型的训练方法及训练装置
KR20230017774A (ko) 정보 처리 장치, 정보 처리 방법, 및 프로그램
US20120133610A1 (en) Method for adjusting region of interest and related optical touch module
JP6669390B2 (ja) 情報処理装置、情報処理方法、及びプログラム
CN111885371A (zh) 图像遮挡检测方法、装置、电子设备和计算机可读介质
CN105100616B (zh) 一种图像处理方法及电子设备
JP4145014B2 (ja) 画像処理装置
CN110610178A (zh) 图像识别方法、装置、终端及计算机可读存储介质
JP2009159525A (ja) 撮像装置及び画像合成プログラム
EP2800349B1 (en) Method and electronic device for generating thumbnail image
JP6217225B2 (ja) 画像照合装置、画像照合方法及びプログラム
US10298806B2 (en) Image processing apparatus and processing method for combining multiple images with accuracy verification thereof
WO2022042669A1 (zh) 一种图片处理方法、装置、设备及存储介质

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 11846097

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 13992383

Country of ref document: US

ENP Entry into the national phase

Ref document number: 2013542346

Country of ref document: JP

Kind code of ref document: A

ENP Entry into the national phase

Ref document number: 20137014846

Country of ref document: KR

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

REEP Request for entry into the european phase

Ref document number: 2011846097

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 2011846097

Country of ref document: EP