JP2017107552A - 画像内の回転したテーブルの補正方法 - Google Patents
画像内の回転したテーブルの補正方法 Download PDFInfo
- Publication number
- JP2017107552A JP2017107552A JP2016220032A JP2016220032A JP2017107552A JP 2017107552 A JP2017107552 A JP 2017107552A JP 2016220032 A JP2016220032 A JP 2016220032A JP 2016220032 A JP2016220032 A JP 2016220032A JP 2017107552 A JP2017107552 A JP 2017107552A
- Authority
- JP
- Japan
- Prior art keywords
- angle
- bin
- line
- image
- bins
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 31
- 238000012015 optical character recognition Methods 0.000 claims description 18
- 238000004590 computer program Methods 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 3
- 238000003672 processing method Methods 0.000 claims description 2
- 230000000977 initiatory effect Effects 0.000 abstract 1
- 230000009466 transformation Effects 0.000 description 6
- 230000008901 benefit Effects 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 230000007423 decrease Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 239000002131 composite material Substances 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000003334 potential effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/60—Rotation of whole images or parts thereof
- G06T3/608—Rotation of whole images or parts thereof by skew deformation, e.g. two-pass or three-pass rotation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/177—Editing, e.g. inserting or deleting of tables; using ruled lines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/24—Aligning, centring, orientation detection or correction of the image
- G06V10/243—Aligning, centring, orientation detection or correction of the image by compensating for image skew or non-uniform image deformations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/273—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion removing elements interfering with the pattern to be recognised
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/414—Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computer Graphics (AREA)
- Geometry (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Image Analysis (AREA)
- Character Input (AREA)
- Image Processing (AREA)
Abstract
【解決手段】画像処理方法であって、テーブルを含む画像を取得するステップと、前記画像内の前記テーブルに対応する第1のライン、前記第1のラインの第1の信頼値、および前記第1のラインの第1の角度を識別するステップと、複数の角度に対応する複数のアングルビンを生成するステップと、前記第1の信頼値に基づいて、前記第1の角度を囲むウィンドウ内の前記複数のアングルビンの第1のサブセットに対する第1の複数のビン値を計算するステップと、前記第1の複数のビン値を前記複数のアングルビンの前記第1のサブセットに加算するステップと、前記複数のアングルビンのうち最大のビン値を有するアングルビンを特定するステップと、前記最大のビン値を有する前記アングルビンに基づいて、前記画像を回転するステップと、を含む方法。
【選択図】図2
Description
BCVb=W−|θ−b|+1により計算される。
アングルビンbのビン値=BCVb×(識別されたラインの信頼値)2
本明細書の恩恵を受ける当業者は、ラインの信頼値を二乗することで、より有力なラインがより重み付けられるとともに、相対的に信頼値が低い多数のラインの潜在的な影響が打ち消されることが、理解できるであろう。ビン値は、それぞれの各アングルビンに加算され、この処理は、廃棄されていない全ての識別されたラインに対して繰り返される。
BCVb=W−|θ−b|+1により計算される。
アングルビンbのビン値=BCVb×(識別されたラインの信頼値)2
ステップ235では、ビン値はそれぞれのアングルビンに加算される。本明細書を所持する当業者であれば、図2に表される処理内の一つ以上のステップを繰り返すので、アングルビンは既に値を蓄積していることが、理解できるだろう。そのようなシナリオでは、ステップ230で計算されたビン値は、アングルビン中に蓄積されている既存の値に加算される(すなわち、既存の値は上書きされない)。
Claims (20)
- 画像処理方法であって、
テーブルを含む画像を取得するステップと、
前記画像内の前記テーブルに対応する第1のライン、前記第1のラインの第1の信頼値、および前記第1のラインの第1の角度を識別するステップと、
複数の角度に対応する複数のアングルビンを生成するステップと、
前記第1の信頼値に基づいて、前記第1の角度を囲むウィンドウ内の前記複数のアングルビンの第1のサブセットに対する第1の複数のビン値を計算するステップと、
前記第1の複数のビン値を前記複数のアングルビンの前記第1のサブセットに加算するステップと、
前記複数のアングルビンのうち、最大のビン値を有するアングルビンを特定するステップと、
前記最大のビン値を有する前記アングルビンに基づいて、前記画像を回転するステップと、
を含む方法。 - 前記画像内の前記テーブルに対応する第2のライン、前記第2のラインの第2の信頼値、および前記第2のラインの第2の角度を識別するステップと、
前記第2の信頼値に基づいて、前記第2の角度を囲む前記ウィンドウ内の前記複数のアングルビンの第2のサブセットに対する第2の複数のビン値を計算するステップと、
前記最大のビン値を有するアングルビンを特定するステップの前に、前記第2の複数のビン値を前記複数のアングルビンの前記第2のサブセットに加算するステップと、
をさらに含む請求項1に記載の方法。 - 前記画像内の前記テーブルに対応する第3のライン、前記第3のラインの第3の信頼値、および前記第3のラインの第3の角度を識別するステップと、
前記第3の信頼値を閾値と比較するステップと、
前記第3の信頼値が前記閾値を下回ることに応じて、前記第3のラインを廃棄するステップと、
をさらに含む、請求項2に記載の方法。 - 前記第1のラインを識別する前に、前記画像をマスクに変換するステップをさらに含み、
前記テーブルは手書きである、請求項1から請求項3のいずれか一つに記載の方法。 - 前記第1のライン、前記第1の信頼値、および前記第1の角度を識別するステップは、前記画像へのハフ(Hough)変換の適用を含む、請求項1から請求項4のいずれか一つに記載の方法。
- 前記第1の複数のビン値を計算するステップは、
前記複数のアングルビンの前記第1のサブセットに対する複数のビン信頼値であって、前記ウィンドウのサイズと、前記複数のアングルビンの前記第1のサブセットおよび前記第1の角度間の複数の差分と、に基づく複数のビン信頼値を計算するステップと、
前記複数のビン信頼値のそれぞれを、前記第1の信頼値の2乗と乗算するステップと、
を含む請求項1から請求項5のいずれか一つに記載の方法。 - 前記ウィンドウは、各方向で前記第1の角度から5度広がっている、請求項6に記載の方法。
- 前記画像を回転させた後、テーブル内のテキストに光学式文字認識(OCR)を実行するステップをさらに含む、請求項1から7のいずれか一つに記載の方法。
- コンピューター装置を制御するコンピュータープログラムであって、
テーブルを含む画像を取得するステップと、
前記画像内の前記テーブルに対応する第1のライン、前記第1のラインの第1の信頼値、および前記第1のラインの第1の角度を識別するステップと、
複数の角度に対応する複数のアングルビンを生成するステップと、
前記第1の信頼値に基づいて、前記第1の角度を囲むウィンドウ内の前記複数のアングルビンの第1のサブセットに対する第1の複数のビン値を計算するステップと、
前記第1の複数のビン値を前記複数のアングルビンの前記第1のサブセットに加算するステップと、
前記複数のアングルビンのうち、最大のビン値を有するアングルビンを特定するステップと、
前記最大のビン値を有する前記アングルビンに基づいて、前記画像を回転するステップと、
を含む処理を、前記コンピューター装置に実行させるためのコンピュータープログラム。 - 前記画像内の前記テーブルに対応する第2のライン、前記第2のラインの第2の信頼値、および前記第2のラインの第2の角度を識別するステップと、
前記第2の信頼値に基づいて、前記第2の角度を囲む前記ウィンドウ内の前記複数のアングルビンの第2のサブセットに対する第2の複数のビン値を計算するステップと、
前記最大のビン値を有するアングルビンを特定するステップの前に、前記第2の複数のビン値を前記複数のアングルビンの前記第2のサブセットに加算するステップと、
をさらに含む請求項9に記載のコンピュータープログラム。 - 前記画像内の前記テーブルに対応する第3のライン、前記第3のラインの第3の信頼値、および前記第3のラインの第3の角度を識別するステップと、
前記第3の信頼値を閾値と比較するステップと、
前記第3の信頼値が前記閾値を下回ることに応じて、前記第3のラインを廃棄するステップと、
をさらに含む、請求項10に記載のコンピュータープログラム。 - 前記第1のラインを識別する前に、前記画像をマスクに変換するステップをさらに含み、
前記テーブルは手書きである、請求項9から請求項11のいずれか一つに記載のコンピュータープログラム。 - 前記第1のライン、前記第1の信頼値、および前記第1の角度を識別するステップは、前記画像へのハフ(Hough)変換の適用を含む、請求項9から請求項12のいずれか一つに記載のコンピュータープログラム。
- 前記第1の複数のビン値を計算するステップは、
前記複数のアングルビンの前記第1のサブセットに対する複数のビン信頼値であって、前記ウィンドウのサイズと、前記複数のアングルビンの前記第1のサブセットおよび前記第1の角度間の複数の差分と、に基づく複数のビン信頼値を計算するステップと、
前記複数のビン信頼値のそれぞれを、前記第1の信頼値の2乗と乗算するステップと、
を含む請求項9から請求項13のいずれか一つに記載のコンピュータープログラム。 - 前記ウィンドウは、各方向で前記第1の角度から5度広がっている、請求項14に記載のコンピュータープログラム。
- 画像処理用のシステムであって
テーブルを含む画像を記憶するバッファーと、
前記画像内の前記テーブルに対応する第1のライン、前記第1のラインの第1の信頼値、および前記第1のラインの第1の角度を識別し、
前記画像内の前記テーブルに対応する第2のライン、前記第2のラインの第2の信頼値、および前記第2のラインの第2の角度を識別する、ライン抽出部と、
複数のビンを有するアングルビンエンジンであって、
前記第1の信頼値に基づいて、前記第1の角度を囲むウィンドウ内の前記複数のアングルビンの第1のサブセットに対する第1の複数のビン値を計算し、
前記第2の信頼値に基づいて、前記第2の角度を囲む前記ウィンドウ内の前記複数のアングルビンの第2のサブセットに対する第2の複数のビン値を計算し、
前記第1の複数のビン値を前記複数のアングルビンの前記第1のサブセットに加算し、前記第2の複数のビン値を前記複数のアングルビンの前記第2のサブセットに加算する、アングルビンエンジンと、
最大のビン値を有する前記アングルビンに基づいて、前記画像を回転するテーブルエンジンと、
を備えるシステム。 - 前記ライン抽出部は、さらに、前記第1のラインを識別する前に、前記画像をマスクに変換し、
前記テーブルは手書きである、請求項16に記載のシステム。 - 前記第1の複数のビン値の計算は、
前記複数のアングルビンの前記第1のサブセットに対する第1の複数のビン信頼値であって、前記ウィンドウのサイズと、前記複数のアングルビンの前記第1のサブセットおよび前記第1の角度間の複数の差分に基づく第1の複数のビン信頼値の計算と、
前記第1の複数のビン信頼値のそれぞれを、前記第1の信頼値の2乗との乗算すること、
を含む、請求項16または請求項17に記載のシステム。 - 前記ウィンドウは、各方向で前記第1の角度から5度広がっている、請求項18に記載のシステム。
- 前記テーブルエンジンは、さらに、前記画像を回転させた後、テーブル内のテキストに光学式文字認識(OCR)を実行する、請求項16から19のいずれか一つに記載のシステム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US14/952,691 US9865038B2 (en) | 2015-11-25 | 2015-11-25 | Offsetting rotated tables in images |
US14/952691 | 2015-11-25 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017107552A true JP2017107552A (ja) | 2017-06-15 |
JP6778586B2 JP6778586B2 (ja) | 2020-11-04 |
Family
ID=58720903
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016220032A Active JP6778586B2 (ja) | 2015-11-25 | 2016-11-10 | 画像内の回転したテーブルの補正方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US9865038B2 (ja) |
JP (1) | JP6778586B2 (ja) |
CN (1) | CN107066433B (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019040585A (ja) * | 2017-06-30 | 2019-03-14 | コニカ ミノルタ ラボラトリー ユー.エス.エー.,インコーポレイテッド | 表に関するタイプセットネススコア |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9865038B2 (en) * | 2015-11-25 | 2018-01-09 | Konica Minolta Laboratory U.S.A., Inc. | Offsetting rotated tables in images |
US10395378B2 (en) * | 2016-07-15 | 2019-08-27 | Samsung Electronics Co., Ltd. | Detecting periodic patterns and aperture problems for motion estimation |
US10331949B2 (en) * | 2017-07-25 | 2019-06-25 | Konica Minolta Laboratory U.S.A., Inc. | Splitting merged table cells |
US10679049B2 (en) * | 2017-09-29 | 2020-06-09 | Konica Minolta Laboratory U.S.A., Inc. | Identifying hand drawn tables |
CN110135217B (zh) * | 2018-02-02 | 2021-07-23 | 兴业数字金融服务(上海)股份有限公司 | 用于识别图像中的表格内的字符的方法和装置 |
CN110163205B (zh) * | 2019-05-06 | 2021-05-28 | 网易有道信息技术(北京)有限公司 | 图像处理方法、装置、介质和计算设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06195462A (ja) * | 1992-12-22 | 1994-07-15 | Fujitsu Ltd | 画像の傾き角度計測方式 |
JPH0844822A (ja) * | 1994-08-03 | 1996-02-16 | Matsushita Electric Ind Co Ltd | 文字認識装置 |
JP2003223643A (ja) * | 2002-01-31 | 2003-08-08 | Ricoh Co Ltd | 画像認識装置、画像認識方法、およびその方法をコンピュータに実行させるプログラム |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5680479A (en) * | 1992-04-24 | 1997-10-21 | Canon Kabushiki Kaisha | Method and apparatus for character recognition |
JP2007279828A (ja) * | 2006-04-03 | 2007-10-25 | Toshiba Corp | 帳票処理装置、帳票様式作成装置、帳票、帳票処理用のプログラム、帳票様式作成用のプログラム |
US8526036B2 (en) * | 2008-01-17 | 2013-09-03 | Konica Minolta Laboratory U.S.A., Inc. | Systems and methods for print resource management |
US8634645B2 (en) * | 2008-03-28 | 2014-01-21 | Smart Technologies Ulc | Method and tool for recognizing a hand-drawn table |
US8189961B2 (en) * | 2010-06-09 | 2012-05-29 | Microsoft Corporation | Techniques in optical character recognition |
JP5558973B2 (ja) * | 2010-08-31 | 2014-07-23 | 株式会社日立情報通信エンジニアリング | 画像補正装置、補正画像生成方法、補正テーブル生成装置、補正テーブル生成方法、補正テーブル生成プログラムおよび補正画像生成プログラム |
CN103577817B (zh) * | 2012-07-24 | 2017-03-01 | 阿里巴巴集团控股有限公司 | 表单识别方法与装置 |
JP5604496B2 (ja) * | 2012-10-24 | 2014-10-08 | 本田技研工業株式会社 | 板状ワーク用センターリング装置 |
CN103258198B (zh) * | 2013-04-26 | 2015-12-23 | 四川大学 | 一种表格文档图像中字符提取方法 |
US9466092B2 (en) * | 2013-11-27 | 2016-10-11 | Microsoft Technology Licensing, Llc | Content-aware image rotation |
US9621765B2 (en) * | 2015-07-06 | 2017-04-11 | Konica Minolta Laboratory U.S.A., Inc. | Method for supporting color conversion on premultiplied data |
US9865038B2 (en) * | 2015-11-25 | 2018-01-09 | Konica Minolta Laboratory U.S.A., Inc. | Offsetting rotated tables in images |
US9697423B1 (en) * | 2015-12-31 | 2017-07-04 | Konica Minolta Laboratory U.S.A., Inc. | Identifying the lines of a table |
-
2015
- 2015-11-25 US US14/952,691 patent/US9865038B2/en active Active
-
2016
- 2016-11-10 JP JP2016220032A patent/JP6778586B2/ja active Active
- 2016-11-25 CN CN201611060614.4A patent/CN107066433B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06195462A (ja) * | 1992-12-22 | 1994-07-15 | Fujitsu Ltd | 画像の傾き角度計測方式 |
JPH0844822A (ja) * | 1994-08-03 | 1996-02-16 | Matsushita Electric Ind Co Ltd | 文字認識装置 |
JP2003223643A (ja) * | 2002-01-31 | 2003-08-08 | Ricoh Co Ltd | 画像認識装置、画像認識方法、およびその方法をコンピュータに実行させるプログラム |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019040585A (ja) * | 2017-06-30 | 2019-03-14 | コニカ ミノルタ ラボラトリー ユー.エス.エー.,インコーポレイテッド | 表に関するタイプセットネススコア |
JP7219011B2 (ja) | 2017-06-30 | 2023-02-07 | コニカ ミノルタ ラボラトリー ユー.エス.エー.,インコーポレイテッド | 表に関するタイプセットネススコア |
Also Published As
Publication number | Publication date |
---|---|
US9865038B2 (en) | 2018-01-09 |
CN107066433B (zh) | 2020-05-08 |
US20170148140A1 (en) | 2017-05-25 |
CN107066433A (zh) | 2017-08-18 |
JP6778586B2 (ja) | 2020-11-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6778586B2 (ja) | 画像内の回転したテーブルの補正方法 | |
US9697423B1 (en) | Identifying the lines of a table | |
US10650495B2 (en) | High resolution style transfer | |
WO2019119966A1 (zh) | 文字图像处理方法、装置、设备及存储介质 | |
CN111523468B (zh) | 人体关键点识别方法和装置 | |
US9076205B2 (en) | Edge direction and curve based image de-blurring | |
US9842251B2 (en) | Bulleted lists | |
CN107038441B (zh) | 书写板检测和校正 | |
CN111260569A (zh) | 图像倾斜校正的方法、装置、电子设备和存储介质 | |
CN110399712B (zh) | 基于验证码的交互验证方法、装置、介质和计算设备 | |
US10083218B1 (en) | Repairing tables | |
US10163004B2 (en) | Inferring stroke information from an image | |
CN113762455A (zh) | 检测模型训练方法、单字检测方法、装置、设备及介质 | |
WO2023134143A1 (zh) | 图像样本生成方法、文本识别方法、装置、设备和介质 | |
JP7219011B2 (ja) | 表に関するタイプセットネススコア | |
US20230005171A1 (en) | Visual positioning method, related apparatus and computer program product | |
US9785856B2 (en) | Repairing holes in images | |
US10157311B2 (en) | Detecting arrows within images | |
CN111401366A (zh) | 字符识别方法、装置、计算机设备和存储介质 | |
CN113673522B (zh) | 文本图像的倾斜角度检测方法、装置、设备及存储介质 | |
US10579893B2 (en) | Inferring stroke information from an image | |
CN106922192B (zh) | 利用查找表的面部检测方法和装置 | |
CN113850351A (zh) | 图像特征点的匹配方法及装置 | |
CN117542070A (zh) | 一种识别用印位置的方法、装置、电子设备及存储介质 | |
CN117094870A (zh) | 数据处理方法、装置、设备、计算机可读存储介质及产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190724 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200804 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200902 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200915 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201012 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6778586 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |