JP7195092B2 - 手描きの表の識別 - Google Patents
手描きの表の識別 Download PDFInfo
- Publication number
- JP7195092B2 JP7195092B2 JP2018173776A JP2018173776A JP7195092B2 JP 7195092 B2 JP7195092 B2 JP 7195092B2 JP 2018173776 A JP2018173776 A JP 2018173776A JP 2018173776 A JP2018173776 A JP 2018173776A JP 7195092 B2 JP7195092 B2 JP 7195092B2
- Authority
- JP
- Japan
- Prior art keywords
- vertex
- cells
- edges
- vertices
- cell
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/412—Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/414—Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/387—Composing, repositioning or otherwise geometrically modifying originals
- H04N1/3872—Repositioning or masking
- H04N1/3873—Repositioning or masking defined only by a limited number of coordinate points or parameters, e.g. corners, centre; for trimming
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/14—Systems for two-way working
- H04N7/141—Systems for two-way working between two video terminals, e.g. videophone
- H04N7/142—Constructional details of the terminal equipment, e.g. arrangements of the camera and the display
- H04N7/144—Constructional details of the terminal equipment, e.g. arrangements of the camera and the display camera and display on the same optical axis, e.g. optically multiplexing the camera and display for eye to eye contact
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Signal Processing (AREA)
- Computer Graphics (AREA)
- Geometry (AREA)
- Image Analysis (AREA)
- Character Discrimination (AREA)
Description
前記表について、前記複数の連結構成要素に基づいて複数の縁辺を含む骨格グラフを生成する工程と、
前記複数の縁辺に基づいて前記表を雛型表と比較する植字得点を計算する工程と、
前記表の回転角度を決定し、前記回転角度に基づいて前記表の専用座標系を生成する工程と、
前記骨格グラフ、前記植字得点、及び前記専用座標系に基づいて、前記表内の複数のセルを識別する工程と、
前記複数の縁辺に基づいて前記複数のセルのそれぞれをリンクさせ、前記複数のセル間のリンクを検証する工程と、
前記複数のセル間の前記リンクに基づく複数のセルの格子を生成する工程と、
前記格子を、前記表の、垂直に交差する直線によって形成された行及び列を有する表に類似する表としてエクスポートする工程と、を含み、
前記植字得点を計算する工程は、
前記複数の縁辺について複数の角度及び複数の長さを識別する工程と、
前記複数の角度に基づいて、前記複数の縁辺を複数の集団にグループ分けする工程と、
前記複数の長さに基づいて、前記複数の集団について複数の集団長さを計算する工程と、
前記複数の集団長さの部分集合を選択する工程と、
前記複数の長さの合計に対する前記部分集合の合計の比率を計算する工程と、を含む。
また、一の態様では、本発明は、表を含む画像を処理する方法に関し、 前記表を形成する前記画像内の複数の連結構成要素を識別する工程と、
前記表について、前記複数の連結構成要素に基づいて複数の縁辺を含む骨格グラフを生成する工程と、
前記複数の縁辺に基づいて前記表を雛型表と比較する植字得点を計算する工程と、
前記表の回転角度を決定し、前記回転角度に基づいて前記表の専用座標系を生成する工程と、
前記骨格グラフ、前記植字得点、及び前記専用座標系に基づいて、前記表内の複数のセルを識別する工程と、
前記複数の縁辺に基づいて前記複数のセルのそれぞれをリンクさせ、前記複数のセル間のリンクを検証する工程と、
前記複数のセル間の前記リンクに基づく複数のセルの格子を生成する工程と、
前記格子を、前記表の、垂直に交差する直線によって形成された行及び列を有する表に類似する表としてエクスポートする工程と、を含み、
前記表内の前記複数のセルを決定する工程は、
前記骨格グラフ内で、隅角頂点、前記隅角頂点に隣接する開始頂点、及び前記隅角頂点に隣接する終了頂点を識別する工程と、
前記隅角頂点から前記開始頂点への進行方向を計算する工程と、
前記開始頂点に対する一組のルート選択肢であって、
前記骨格グラフ内の前記開始頂点に隣接する第1の組の頂点、
前記開始頂点から前記第1の組の頂点への一組の進行方向、並びに
前記一組の進行方向、及び前記隅角頂点から前記開始頂点への前記進行方向の垂線に基づく、前記第1の組の頂点に対する一組の回転コスト、を含む一組のルート選択肢を決定する工程と、
前記一組の回転コストに基づいて、第1の頂点として前記第1の組の頂点から候補頂点を選択する工程と、
前記骨格グラフ内の第2の頂点に隣接する第2の組の頂点を含む、前記第2の頂点に対する一組のルート選択肢を決定する工程と、
前記第2の組の頂点が前記終了頂点を含んでいると決定する工程と、
前記隅角頂点、前記開始頂点、前記第1の頂点、前記第2の頂点、及び前記終了頂点を含む、セル候補のルートを生成する工程と、を含む。
また、一の態様では、本発明は、表を含む画像を処理する方法に関し、 前記表を形成する前記画像内の複数の連結構成要素を識別する工程と、
前記表について、前記複数の連結構成要素に基づいて複数の縁辺を含む骨格グラフを生成する工程と、
前記複数の縁辺に基づいて前記表を雛型表と比較する植字得点を計算する工程と、
前記表の回転角度を決定し、前記回転角度に基づいて前記表の専用座標系を生成する工程と、
前記骨格グラフ、前記植字得点、及び前記専用座標系に基づいて、前記表内の複数のセルを識別する工程と、
前記複数の縁辺に基づいて前記複数のセルのそれぞれをリンクさせ、前記複数のセル間のリンクを検証する工程と、
前記複数のセル間の前記リンクに基づく複数のセルの格子を生成する工程と、
前記複数の縁辺の長さに基づいて、前記複数のセルのそれぞれのサイズを決定する工程と、
前記複数のセルのそれぞれの前記サイズ、所定の方向で前記複数のセルによって共有される縁辺、及び前記複数のセル間の領域の重複に基づいて、前記表内の内部セルを識別する工程と、
前記複数のセルから前記内部セルを除去する工程と、
前記格子を、前記表の、垂直に交差する直線によって形成された行及び列を有する表に類似する表としてエクスポートする工程と、を含み、
内部セルは、少なくとも1つの縁辺を別のセルと共有し、別のセルと領域が重なり、他のセルよりも小さなサイズを持つセルである。
また、一の態様では、本発明は、表を含む画像を処理する方法に関し、 前記表を形成する前記画像内の複数の連結構成要素を識別する工程と、
前記表について、前記複数の連結構成要素に基づいて複数の縁辺を含む骨格グラフを生成する工程と、
前記複数の縁辺に基づいて前記表を雛型表と比較する植字得点を計算する工程と、
前記表の回転角度を決定し、前記回転角度に基づいて前記表の専用座標系を生成する工程と、
前記骨格グラフ、前記植字得点、及び前記専用座標系に基づいて、前記表内の複数のセルを識別する工程と、
前記複数の縁辺に基づいて前記複数のセルのそれぞれをリンクさせ、前記複数のセル間のリンクを検証する工程と、
前記複数のセル間の前記リンクに基づく複数のセルの格子を生成する工程と、
前記格子を、前記表の、垂直に交差する直線によって形成された行及び列を有する表に類似する表としてエクスポートする工程と、を含み、
前記複数のセル内の各セルは、第1の境界線、前記第1の境界線に対向する第2の境界線、第3の境界線、及び前記第3の境界線に対向する第4の境界線を含み、
前記方法は、
前記表に対して生成された複数の頂点を有する前記骨格グラフ上で、前記複数のセルのうちのあるセルの前記第1の境界線上の非隅角頂点を識別する工程と、
前記非隅角頂点から延びており、前記セルの前記第3又は前記第4の境界線と交差することなく、前記セルの前記第2の境界線と交差する、複数の分割線を決定する工程と、
前記複数の分割線について、複数の信頼値を計算する工程と、
前記複数の信頼値及び前記複数の分割線のうちのある分割線に基づいて、人為的縁辺を生成することによって、前記セルを分割する工程と、を更に含む。
前記メモリに接続されたコンピュータプロセッサであって、
前記表を形成する、前記画像内の複数の連結構成要素を識別し、
前記表について、前記複数の連結構成要素に基づいて複数の縁辺を含む骨格グラフを生成し、
前記複数の縁辺に基づいて前記表を雛型表と比較する植字得点を計算し、
前記表の回転角度を決定し、前記回転角度に基づいて前記表の専用座標系を生成し、
前記骨格グラフ、前記植字得点、及び前記専用座標系に基づいて、前記表内の複数のセルを識別し、
前記複数の縁辺に基づいて前記複数のセルのそれぞれをリンクさせ、前記複数のセル間のリンクを検証し、
前記複数のセル間の前記リンクに基づく複数のセルの格子を生成し、
前記格子を前記表の、垂直に交差する直線によって形成された行及び列を有する表に類似する表としてエクスポートし、
前記植字得点を計算することは、
前記複数の縁辺について複数の角度及び複数の長さを識別することと、
前記複数の角度に基づいて、前記複数の縁辺を複数の集団にグループ分けすることと、
前記複数の長さに基づいて、前記複数の集団について複数の集団長さを計算することと、
前記複数の集団長さの部分集合を選択することと、
前記複数の長さの合計に対する前記部分集合の合計の比率を計算することと、を含む、コンピュータプロセッサと、を含む。
また、一の態様では、本発明は、画像を処理するシステムに関する。当該システムは、 メモリと、
前記メモリに接続されたコンピュータプロセッサであって、
前記表を形成する、前記画像内の複数の連結構成要素を識別し、
前記表について、前記複数の連結構成要素に基づいて複数の縁辺を含む骨格グラフを生成し、
前記複数の縁辺に基づいて前記表を雛型表と比較する植字得点を計算し、
前記表の回転角度を決定し、前記回転角度に基づいて前記表の専用座標系を生成し、
前記骨格グラフ、前記植字得点、及び前記専用座標系に基づいて、前記表内の複数のセルを識別し、
前記複数の縁辺に基づいて前記複数のセルのそれぞれをリンクさせ、前記複数のセル間のリンクを検証し、
前記複数のセル間の前記リンクに基づく複数のセルの格子を生成し、
前記格子を前記表の、垂直に交差する直線によって形成された行及び列を有する表に類似する表としてエクスポートし、
前記表内の前記複数のセルを決定することは、
前記骨格グラフ内で、隅角頂点、前記隅角頂点に隣接する開始頂点、及び前記隅角頂点に隣接する終了頂点を識別することと、
前記隅角頂点から前記開始頂点への進行方向を計算することと、
前記開始頂点に対する一組のルート選択肢であって、
前記骨格グラフ内の前記開始頂点に隣接する第1の組の頂点、
前記開始頂点から前記第1の組の頂点への一組の進行方向、並びに、
前記一組の進行方向、及び前記隅角頂点から前記開始頂点への前記進行方向の垂線に基づく、前記第1の組の頂点に対する一組の回転コスト、を含む一組のルート選択肢を決定することと、
前記一組の回転コストに基づいて、第1の頂点として前記第1の組の頂点から候補頂点を選択することと、
前記骨格グラフ内の第2の頂点に隣接する第2の組の頂点を含む、前記第2の頂点に対する一組のルート選択肢を決定することと、
前記第2の組の頂点が前記終了頂点を含んでいると決定することと、
前記隅角頂点、前記開始頂点、前記第1の頂点、前記第2の頂点、及び前記終了頂点を含む、セル候補のルートを生成することと、を含む、コンピュータプロセッサと、を含む。
前記表について、前記複数の連結構成要素に基づいて複数の縁辺を含む骨格グラフを生成し、
前記複数の縁辺に基づいて前記表を雛型表と比較する植字得点を計算し、
前記表の回転角度を決定し、前記回転角度に基づいて前記表の専用座標系を生成し、
前記骨格グラフ、前記植字得点、及び前記専用座標系に基づいて、前記表内の複数のセルを識別し、
前記複数の縁辺に基づいて前記複数のセルのそれぞれをリンクさせ、前記複数のセル間のリンクを検証し、
前記複数のセル間の前記リンクに基づく複数のセルの格子を生成し、
前記格子を前記表の、垂直に交差する直線によって形成された行及び列を有する表に類似する表としてエクスポートし、
前記植字得点を計算することは、
前記複数の縁辺について複数の角度及び複数の長さを識別することと、
前記複数の角度に基づいて、前記複数の縁辺を複数の集団にグループ分けすることと、
前記複数の長さに基づいて、前記複数の集団について複数の集団長さを計算することと、
前記複数の集団長さの部分集合を選択することと、
前記複数の長さの合計に対する前記部分集合の合計の比率を計算することと、を含むコンピュータ可読プログラムコードを保存する。
また、一の態様では、本発明は、内部に取り込まれた表を含む画像を処理するコンピュータ可読プログラムコードを保存する、非一時的なコンピュータ可読媒体(CRM)に関する。当該プログラムコードは、実行されるときには、前記表を形成する、前記画像内の複数の連結構成要素を識別し、
前記表について、前記複数の連結構成要素に基づいて複数の縁辺を含む骨格グラフを生成し、
前記複数の縁辺に基づいて前記表を雛型表と比較する植字得点を計算し、
前記表の回転角度を決定し、前記回転角度に基づいて前記表の専用座標系を生成し、
前記骨格グラフ、前記植字得点、及び前記専用座標系に基づいて、前記表内の複数のセルを識別し、
前記複数の縁辺に基づいて前記複数のセルのそれぞれをリンクさせ、前記複数のセル間のリンクを検証し、
前記複数のセル間の前記リンクに基づく複数のセルの格子を生成し、
前記格子を前記表の、垂直に交差する直線によって形成された行及び列を有する表に類似する表としてエクスポートし、
前記表内の前記複数のセルを決定することは、
前記骨格グラフ内で、隅角頂点、前記隅角頂点に隣接する開始頂点、及び前記隅角頂点に隣接する終了頂点を識別することと、
前記隅角頂点から前記開始頂点への進行方向を計算することと、
前記開始頂点に対する一組のルート選択肢であって、
前記骨格グラフ内の前記開始頂点に隣接する第1の組の頂点、
前記開始頂点から前記第1の組の頂点への一組の進行方向、並びに、
前記一組の進行方向、及び前記隅角頂点から前記開始頂点への前記進行方向の垂線に基づく、前記第1の組の頂点に対する一組の回転コスト、を含む一組のルート選択肢を決定することと、
前記一組の回転コストに基づいて、第1の頂点として前記第1の組の頂点から候補頂点を選択することと、
前記骨格グラフ内の第2の頂点に隣接する第2の組の頂点を含む、前記第2の頂点に対する一組のルート選択肢を決定することと、
前記第2の組の頂点が前記終了頂点を含んでいると決定することと、
前記隅角頂点、前記開始頂点、前記第1の頂点、前記第2の頂点、及び前記終了頂点を含む、セル候補のルートを生成することと、を含むコンピュータ可読プログラムコードを保存する。
Claims (18)
- 表を含む画像を処理する方法であって、
前記表を形成する前記画像内の複数の連結構成要素を識別する工程と、
前記表について、前記複数の連結構成要素に基づいて複数の縁辺を含む骨格グラフを生成する工程と、
前記複数の縁辺に基づいて前記表を雛型表と比較する植字得点を計算する工程と、
前記表の回転角度を決定し、前記回転角度に基づいて前記表の専用座標系を生成する工程と、
前記骨格グラフ、前記植字得点、及び前記専用座標系に基づいて、前記表内の複数のセルを識別する工程と、
前記複数の縁辺に基づいて前記複数のセルのそれぞれをリンクさせ、前記複数のセル間のリンクを検証する工程と、
前記複数のセル間の前記リンクに基づく複数のセルの格子を生成する工程と、
前記格子を、前記表の、垂直に交差する直線によって形成された行及び列を有する表に類似する表としてエクスポートする工程と、を含み、
前記植字得点を計算する工程は、
前記複数の縁辺について複数の角度及び複数の長さを識別する工程と、
前記複数の角度に基づいて、前記複数の縁辺を複数の集団にグループ分けする工程と、
前記複数の長さに基づいて、前記複数の集団について複数の集団長さを計算する工程と、
前記複数の集団長さの部分集合を選択する工程と、
前記複数の長さの合計に対する前記部分集合の合計の比率を計算する工程と、を含む方法。 - 表を含む画像を処理する方法であって、
前記表を形成する前記画像内の複数の連結構成要素を識別する工程と、
前記表について、前記複数の連結構成要素に基づいて複数の縁辺を含む骨格グラフを生成する工程と、
前記複数の縁辺に基づいて前記表を雛型表と比較する植字得点を計算する工程と、
前記表の回転角度を決定し、前記回転角度に基づいて前記表の専用座標系を生成する工程と、
前記骨格グラフ、前記植字得点、及び前記専用座標系に基づいて、前記表内の複数のセルを識別する工程と、
前記複数の縁辺に基づいて前記複数のセルのそれぞれをリンクさせ、前記複数のセル間のリンクを検証する工程と、
前記複数のセル間の前記リンクに基づく複数のセルの格子を生成する工程と、
前記格子を、前記表の、垂直に交差する直線によって形成された行及び列を有する表に類似する表としてエクスポートする工程と、を含み、
前記表内の前記複数のセルを決定する工程は、
前記骨格グラフ内で、隅角頂点、前記隅角頂点に隣接する開始頂点、及び前記隅角頂点に隣接する終了頂点を識別する工程と、
前記隅角頂点から前記開始頂点への進行方向を計算する工程と、
前記開始頂点に対する一組のルート選択肢であって、
前記骨格グラフ内の前記開始頂点に隣接する第1の組の頂点、
前記開始頂点から前記第1の組の頂点への一組の進行方向、並びに
前記一組の進行方向、及び前記隅角頂点から前記開始頂点への前記進行方向の垂線に基づく、前記第1の組の頂点に対する一組の回転コスト、を含む一組のルート選択肢を決定する工程と、
前記一組の回転コストに基づいて、第1の頂点として前記第1の組の頂点から候補頂点を選択する工程と、
前記骨格グラフ内の第2の頂点に隣接する第2の組の頂点を含む、前記第2の頂点に対する一組のルート選択肢を決定する工程と、
前記第2の組の頂点が前記終了頂点を含んでいると決定する工程と、
前記隅角頂点、前記開始頂点、前記第1の頂点、前記第2の頂点、及び前記終了頂点を含む、セル候補のルートを生成する工程と、を含む方法。 - 前記セル候補に関連した前記複数の縁辺の中から一組の縁辺を取得する工程と、
前記一組の縁辺内の最長縁辺、及び前記最長縁辺の第1の向きを決定する工程と、
前記第1の向き及び前記最長縁辺を含む第1のセル境界線に対する、前記一組の縁辺内の初期縁辺を決定する工程と、
前記初期縁辺、前記第1の向き、及び前記一組の縁辺に基づいて、前記第1のセル境界線を構築する工程と、
前記第1の向きを回転させることによって、第2のセル境界線に対する第2の向きを計算する工程と、
前記第2のセル境界線の初期縁辺及び前記第2の向きに基づいて、前記第2のセル境界線を構築する工程と、
前記第1のセル境界線の構築及び前記第2のセル境界線の構築に応答して、前記表のセルとして前記セル候補を検証する工程と、を更に含む、請求項2に記載の方法。 - 表を含む画像を処理する方法であって、
前記表を形成する前記画像内の複数の連結構成要素を識別する工程と、
前記表について、前記複数の連結構成要素に基づいて複数の縁辺を含む骨格グラフを生成する工程と、
前記複数の縁辺に基づいて前記表を雛型表と比較する植字得点を計算する工程と、
前記表の回転角度を決定し、前記回転角度に基づいて前記表の専用座標系を生成する工程と、
前記骨格グラフ、前記植字得点、及び前記専用座標系に基づいて、前記表内の複数のセルを識別する工程と、
前記複数の縁辺に基づいて前記複数のセルのそれぞれをリンクさせ、前記複数のセル間のリンクを検証する工程と、
前記複数のセル間の前記リンクに基づく複数のセルの格子を生成する工程と、
前記複数の縁辺の長さに基づいて、前記複数のセルのそれぞれのサイズを決定する工程と、
前記複数のセルのそれぞれの前記サイズ、所定の方向で前記複数のセルによって共有される縁辺、及び前記複数のセル間の領域の重複に基づいて、前記表内の内部セルを識別する工程と、
前記複数のセルから前記内部セルを除去する工程と、
前記格子を、前記表の、垂直に交差する直線によって形成された行及び列を有する表に類似する表としてエクスポートする工程と、を含み、
前記内部セルは、少なくとも1つの縁辺を別のセルと共有し、別のセルと領域が重なり、別のセルよりも小さなサイズを持つセルである方法。 - 表を含む画像を処理する方法であって、
前記表を形成する前記画像内の複数の連結構成要素を識別する工程と、
前記表について、前記複数の連結構成要素に基づいて複数の縁辺を含む骨格グラフを生成する工程と、
前記複数の縁辺に基づいて前記表を雛型表と比較する植字得点を計算する工程と、
前記表の回転角度を決定し、前記回転角度に基づいて前記表の専用座標系を生成する工程と、
前記骨格グラフ、前記植字得点、及び前記専用座標系に基づいて、前記表内の複数のセルを識別する工程と、
前記複数の縁辺に基づいて前記複数のセルのそれぞれをリンクさせ、前記複数のセル間のリンクを検証する工程と、
前記複数のセル間の前記リンクに基づく複数のセルの格子を生成する工程と、
前記格子を、前記表の、垂直に交差する直線によって形成された行及び列を有する表に類似する表としてエクスポートする工程と、を含み、
前記複数のセル内の各セルは、第1の境界線、前記第1の境界線に対向する第2の境界線、第3の境界線、及び前記第3の境界線に対向する第4の境界線を含み、
前記方法は、
前記表に対して生成された複数の頂点を有する前記骨格グラフ上で、前記複数のセルのうちのあるセルの前記第1の境界線上の非隅角頂点を識別する工程と、
前記非隅角頂点から延びており、前記セルの前記第3又は前記第4の境界線と交差することなく、前記セルの前記第2の境界線と交差する、複数の分割線を決定する工程と、
前記複数の分割線について、複数の信頼値を計算する工程と、
前記複数の信頼値及び前記複数の分割線のうちのある分割線に基づいて、人為的縁辺を生成することによって、前記セルを分割する工程と、を更に含む方法。 - 前記複数の縁辺上の終端頂点を識別する工程と、
前記終端頂点に対して関心領域を生成する工程と、
前記関心領域内部のターゲットを決定する工程と、
前記複数のセルを識別する工程の前に、前記終端頂点と前記ターゲットとの間の人為的縁辺を前記骨格グラフに追加することによって、前記表を修復する工程と、を更に含む、
請求項1から請求項5のいずれか一項に記載の方法。 - 前記複数の縁辺の長さに基づいて、前記複数のセルのそれぞれのサイズを決定する工程と、
前記複数のセルのそれぞれの前記サイズ、所定の方向で前記複数のセルによって共有される縁辺、及び前記複数のセル間の領域の重複に基づいて、前記表内の内部セルを識別する工程と、
前記複数のセルから前記内部セルを除去する工程と、を更に含む、請求項1から請求項5のいずれか一項に記載の方法。 - 前記複数のセルを前記リンクさせる工程は、
前記専用座標系の第1の方向にある前記複数のセルのうちの2つのセル間で共有される共通縁辺を識別する工程と、
前記2つのセルを一組の隣接セルとして記録する工程と、を含み、
前記複数のセル間の前記リンクを前記検証する工程は、
前記一組の隣接セルからのセルを現在のセルとして設定し、前記一組の隣接セルからの残りのセルを隣接セルとして設定する工程と、
前記隣接セルは、前記表内で識別された前記複数のセルの中のセル候補であることを確認する工程と、
前記現在のセル及び前記隣接セルは、同じ組の隣接セルの一部であることを確認する工程と、を含む、請求項1から請求項5のいずれか一項に記載の方法。 - 前記格子は、リンクされた複数のセル候補によって形成され、かつリンクされた前記複数のセル候補を含む、最大の四辺形形状である、請求項1から請求項5のいずれか一項に記載の方法。
- 前記画像は書込みボードを含み、前記表は前記書込みボード上にマーカーで手描きされている、請求項1から請求項5のいずれか一項に記載の方法。
- 内部に取り込まれた表を含む画像を処理するコンピュータ可読プログラムコードであって、
前記表を形成する、前記画像内の複数の連結構成要素を識別し、
前記表について、前記複数の連結構成要素に基づいて複数の縁辺を含む骨格グラフを生成し、
前記複数の縁辺に基づいて前記表を雛型表と比較する植字得点を計算し、
前記表の回転角度を決定し、前記回転角度に基づいて前記表の専用座標系を生成し、
前記骨格グラフ、前記植字得点、及び前記専用座標系に基づいて、前記表内の複数のセルを識別し、
前記複数の縁辺に基づいて前記複数のセルのそれぞれをリンクさせ、前記複数のセル間のリンクを検証し、
前記複数のセル間の前記リンクに基づく複数のセルの格子を生成し、
前記格子を前記表の、垂直に交差する直線によって形成された行及び列を有する表に類似する表としてエクスポートし、
前記植字得点を計算することは、
前記複数の縁辺について複数の角度及び複数の長さを識別することと、
前記複数の角度に基づいて、前記複数の縁辺を複数の集団にグループ分けすることと、
前記複数の長さに基づいて、前記複数の集団について複数の集団長さを計算することと、
前記複数の集団長さの部分集合を選択することと、
前記複数の長さの合計に対する前記部分集合の合計の比率を計算することと、を含むコンピュータ可読プログラムコードを保存する、非一時的なコンピュータ可読媒体(CRM)。 - 内部に取り込まれた表を含む画像を処理するコンピュータ可読プログラムコードであって、
前記表を形成する、前記画像内の複数の連結構成要素を識別し、
前記表について、前記複数の連結構成要素に基づいて複数の縁辺を含む骨格グラフを生成し、
前記複数の縁辺に基づいて前記表を雛型表と比較する植字得点を計算し、
前記表の回転角度を決定し、前記回転角度に基づいて前記表の専用座標系を生成し、
前記骨格グラフ、前記植字得点、及び前記専用座標系に基づいて、前記表内の複数のセルを識別し、
前記複数の縁辺に基づいて前記複数のセルのそれぞれをリンクさせ、前記複数のセル間のリンクを検証し、
前記複数のセル間の前記リンクに基づく複数のセルの格子を生成し、
前記格子を前記表の、垂直に交差する直線によって形成された行及び列を有する表に類似する表としてエクスポートし、
前記表内の前記複数のセルを決定することは、
前記骨格グラフ内で、隅角頂点、前記隅角頂点に隣接する開始頂点、及び前記隅角頂点に隣接する終了頂点を識別することと、
前記隅角頂点から前記開始頂点への進行方向を計算することと、
前記開始頂点に対する一組のルート選択肢であって、
前記骨格グラフ内の前記開始頂点に隣接する第1の組の頂点、
前記開始頂点から前記第1の組の頂点への一組の進行方向、並びに、
前記一組の進行方向、及び前記隅角頂点から前記開始頂点への前記進行方向の垂線に基づく、前記第1の組の頂点に対する一組の回転コスト、を含む一組のルート選択肢を決定することと、
前記一組の回転コストに基づいて、第1の頂点として前記第1の組の頂点から候補頂点を選択することと、
前記骨格グラフ内の第2の頂点に隣接する第2の組の頂点を含む、前記第2の頂点に対する一組のルート選択肢を決定することと、
前記第2の組の頂点が前記終了頂点を含んでいると決定することと、
前記隅角頂点、前記開始頂点、前記第1の頂点、前記第2の頂点、及び前記終了頂点を含む、セル候補のルートを生成することと、を含むコンピュータ可読プログラムコードを保存する、非一時的なコンピュータ可読媒体(CRM)。 - 内部に取り込まれた表を含む画像を処理するコンピュータ可読プログラムコードであって、
前記複数の縁辺上の終端頂点を識別し、
前記終端頂点に対して関心領域を生成し、
前記関心領域内部のターゲットを決定し、
前記複数のセルを識別する前に、前記終端頂点と前記ターゲットとの間の人為的縁辺を前記骨格グラフに追加することによって、前記表を修復する、コンピュータ可読プログラムコードを更に保存する、請求項11又は請求項12に記載の非一時的なCRM。 - 前記格子は、リンクされた複数のセル候補によって形成され、かつリンクされた前記複数のセル候補を含む、最大の四辺形形状であり、
前記画像は書込みボードを含み、前記表は前記書込みボード上にマーカーで手描きされている、請求項11又は請求項12に記載の非一時的なCRM。 - 表を含む画像を処理するシステムであって、
メモリと、
前記メモリに接続されたコンピュータプロセッサであって、
前記表を形成する、前記画像内の複数の連結構成要素を識別し、
前記表について、前記複数の連結構成要素に基づいて複数の縁辺を含む骨格グラフを生成し、
前記複数の縁辺に基づいて前記表を雛型表と比較する植字得点を計算し、
前記表の回転角度を決定し、前記回転角度に基づいて前記表の専用座標系を生成し、
前記骨格グラフ、前記植字得点、及び前記専用座標系に基づいて、前記表内の複数のセルを識別し、
前記複数の縁辺に基づいて前記複数のセルのそれぞれをリンクさせ、前記複数のセル間のリンクを検証し、
前記複数のセル間の前記リンクに基づく複数のセルの格子を生成し、
前記格子を前記表の、垂直に交差する直線によって形成された行及び列を有する表に類似する表としてエクスポートし、
前記植字得点を計算することは、
前記複数の縁辺について複数の角度及び複数の長さを識別することと、
前記複数の角度に基づいて、前記複数の縁辺を複数の集団にグループ分けすることと、
前記複数の長さに基づいて、前記複数の集団について複数の集団長さを計算することと、
前記複数の集団長さの部分集合を選択することと、
前記複数の長さの合計に対する前記部分集合の合計の比率を計算することと、を含む、コンピュータプロセッサと、を含むシステム。 - 表を含む画像を処理するシステムであって、
メモリと、
前記メモリに接続されたコンピュータプロセッサであって、
前記表を形成する、前記画像内の複数の連結構成要素を識別し、
前記表について、前記複数の連結構成要素に基づいて複数の縁辺を含む骨格グラフを生成し、
前記複数の縁辺に基づいて前記表を雛型表と比較する植字得点を計算し、
前記表の回転角度を決定し、前記回転角度に基づいて前記表の専用座標系を生成し、
前記骨格グラフ、前記植字得点、及び前記専用座標系に基づいて、前記表内の複数のセルを識別し、
前記複数の縁辺に基づいて前記複数のセルのそれぞれをリンクさせ、前記複数のセル間のリンクを検証し、
前記複数のセル間の前記リンクに基づく複数のセルの格子を生成し、
前記格子を前記表の、垂直に交差する直線によって形成された行及び列を有する表に類似する表としてエクスポートし、
前記表内の前記複数のセルを決定することは、
前記骨格グラフ内で、隅角頂点、前記隅角頂点に隣接する開始頂点、及び前記隅角頂点に隣接する終了頂点を識別することと、
前記隅角頂点から前記開始頂点への進行方向を計算することと、
前記開始頂点に対する一組のルート選択肢であって、
前記骨格グラフ内の前記開始頂点に隣接する第1の組の頂点、
前記開始頂点から前記第1の組の頂点への一組の進行方向、並びに、
前記一組の進行方向、及び前記隅角頂点から前記開始頂点への前記進行方向の垂線に基づく、前記第1の組の頂点に対する一組の回転コスト、を含む一組のルート選択肢を決定することと、
前記一組の回転コストに基づいて、第1の頂点として前記第1の組の頂点から候補頂点を選択することと、
前記骨格グラフ内の第2の頂点に隣接する第2の組の頂点を含む、前記第2の頂点に対する一組のルート選択肢を決定することと、
前記第2の組の頂点が前記終了頂点を含んでいると決定することと、
前記隅角頂点、前記開始頂点、前記第1の頂点、前記第2の頂点、及び前記終了頂点を含む、セル候補のルートを生成することと、を含む、コンピュータプロセッサと、を含むシステム。 - 前記プロセッサは、更に、
前記複数の縁辺上の終端頂点を識別し、
前記終端頂点に対して関心領域を生成し、
前記関心領域内部のターゲットを決定し、
前記複数のセルを識別する前に、前記終端頂点と前記ターゲットとの間の人為的縁辺を前記骨格グラフに追加することによって、前記表を修復する、請求項15又は請求項16に記載のシステム。 - 前記格子は、リンクされた複数のセル候補によって形成され、かつリンクされた前記複数のセル候補を含む、最大の四辺形形状であり、
前記画像は書込みボードを含み、前記表は前記書込みボード上にマーカーで手描きされている、請求項15又は請求項16に記載のシステム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US15/719,981 | 2017-09-29 | ||
US15/719,981 US10679049B2 (en) | 2017-09-29 | 2017-09-29 | Identifying hand drawn tables |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019067378A JP2019067378A (ja) | 2019-04-25 |
JP7195092B2 true JP7195092B2 (ja) | 2022-12-23 |
Family
ID=65896139
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018173776A Active JP7195092B2 (ja) | 2017-09-29 | 2018-09-18 | 手描きの表の識別 |
Country Status (2)
Country | Link |
---|---|
US (1) | US10679049B2 (ja) |
JP (1) | JP7195092B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11182604B1 (en) * | 2019-11-26 | 2021-11-23 | Automation Anywhere, Inc. | Computerized recognition and extraction of tables in digitized documents |
CN112489166A (zh) * | 2020-11-17 | 2021-03-12 | 娄底景明新材料有限公司 | 汽车板激光切割自动排版制图方法及系统 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070140565A1 (en) | 2005-12-21 | 2007-06-21 | Microsoft Corporation | Table detection in ink notes |
JP2007521531A (ja) | 2003-08-21 | 2007-08-02 | マイクロソフト コーポレーション | 電子インク処理 |
JP2009169844A (ja) | 2008-01-18 | 2009-07-30 | Hitachi Software Eng Co Ltd | 表認識方法及び表認識装置 |
JP2014038518A (ja) | 2012-08-17 | 2014-02-27 | Toshiba Corp | 手書き文書処理装置、方法およびプログラム |
JP2014149614A (ja) | 2013-01-31 | 2014-08-21 | Toshiba Corp | 電子機器および手書き文書処理方法 |
JP2016071621A (ja) | 2014-09-30 | 2016-05-09 | 株式会社東芝 | 電子機器および方法 |
JP2018163441A (ja) | 2017-03-24 | 2018-10-18 | 富士ゼロックス株式会社 | 画像処理装置、及びプログラム |
JP2018536926A (ja) | 2015-10-19 | 2018-12-13 | マイスクリプト | 手書き図入力を導くシステム及び方法 |
JP2019040585A (ja) | 2017-06-30 | 2019-03-14 | コニカ ミノルタ ラボラトリー ユー.エス.エー.,インコーポレイテッド | 表に関するタイプセットネススコア |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5101448A (en) * | 1988-08-24 | 1992-03-31 | Hitachi, Ltd. | Method and apparatus for processing a document by utilizing an image |
JPH0863610A (ja) * | 1994-08-18 | 1996-03-08 | Mitsubishi Electric Corp | 文書処理装置 |
US5784487A (en) * | 1996-05-23 | 1998-07-21 | Xerox Corporation | System for document layout analysis |
US7400771B2 (en) * | 2004-09-21 | 2008-07-15 | Microsoft Corporation | System and method for connected container recognition of a hand-drawn chart in ink input |
US7394935B2 (en) * | 2004-09-21 | 2008-07-01 | Microsoft Corporation | System and method for editing a hand-drawn chart in ink input |
US9075855B2 (en) * | 2006-12-14 | 2015-07-07 | Sybase, Inc. | Table synthesis from raw data |
US8358320B2 (en) * | 2007-11-02 | 2013-01-22 | National University Of Singapore | Interactive transcription system and method |
US8634645B2 (en) * | 2008-03-28 | 2014-01-21 | Smart Technologies Ulc | Method and tool for recognizing a hand-drawn table |
US8600164B2 (en) * | 2008-03-28 | 2013-12-03 | Smart Technologies Ulc | Method and tool for recognizing a hand-drawn table |
US8625895B2 (en) * | 2009-03-30 | 2014-01-07 | The Neat Company, Inc. | Table grid detection and separation |
US10025452B2 (en) * | 2015-09-14 | 2018-07-17 | Adobe Systems Incorporated | Physics-based cell layout redesign |
US9865038B2 (en) * | 2015-11-25 | 2018-01-09 | Konica Minolta Laboratory U.S.A., Inc. | Offsetting rotated tables in images |
US9697423B1 (en) * | 2015-12-31 | 2017-07-04 | Konica Minolta Laboratory U.S.A., Inc. | Identifying the lines of a table |
US9898683B2 (en) * | 2016-05-31 | 2018-02-20 | Konica Minolta Laboratory U.S.A., Inc. | Robust method for tracing lines of table |
US10467464B2 (en) * | 2016-06-07 | 2019-11-05 | The Neat Company, Inc. | Document field detection and parsing |
US10083218B1 (en) * | 2017-06-30 | 2018-09-25 | Konica Minolta Laboratory U.S.A., Inc. | Repairing tables |
US10268920B2 (en) * | 2017-08-31 | 2019-04-23 | Konica Minolta Laboratory U.S.A., Inc. | Detection of near rectangular cells |
-
2017
- 2017-09-29 US US15/719,981 patent/US10679049B2/en active Active
-
2018
- 2018-09-18 JP JP2018173776A patent/JP7195092B2/ja active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007521531A (ja) | 2003-08-21 | 2007-08-02 | マイクロソフト コーポレーション | 電子インク処理 |
US20070140565A1 (en) | 2005-12-21 | 2007-06-21 | Microsoft Corporation | Table detection in ink notes |
JP2009169844A (ja) | 2008-01-18 | 2009-07-30 | Hitachi Software Eng Co Ltd | 表認識方法及び表認識装置 |
JP2014038518A (ja) | 2012-08-17 | 2014-02-27 | Toshiba Corp | 手書き文書処理装置、方法およびプログラム |
JP2014149614A (ja) | 2013-01-31 | 2014-08-21 | Toshiba Corp | 電子機器および手書き文書処理方法 |
JP2016071621A (ja) | 2014-09-30 | 2016-05-09 | 株式会社東芝 | 電子機器および方法 |
JP2018536926A (ja) | 2015-10-19 | 2018-12-13 | マイスクリプト | 手書き図入力を導くシステム及び方法 |
JP2018163441A (ja) | 2017-03-24 | 2018-10-18 | 富士ゼロックス株式会社 | 画像処理装置、及びプログラム |
JP2019040585A (ja) | 2017-06-30 | 2019-03-14 | コニカ ミノルタ ラボラトリー ユー.エス.エー.,インコーポレイテッド | 表に関するタイプセットネススコア |
Also Published As
Publication number | Publication date |
---|---|
US20190102619A1 (en) | 2019-04-04 |
JP2019067378A (ja) | 2019-04-25 |
US10679049B2 (en) | 2020-06-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9697423B1 (en) | Identifying the lines of a table | |
CN110472208A (zh) | Pdf文档中表格解析的方法、系统、存储介质及电子设备 | |
US10083218B1 (en) | Repairing tables | |
US20060210172A1 (en) | Systems, methods, and computer-readable media for fast neighborhood determinations in dynamic environments | |
RU2430421C2 (ru) | Применение эффектов к объединенной текстовой дорожке | |
US10691936B2 (en) | Column inferencer based on generated border pieces and column borders | |
US9898683B2 (en) | Robust method for tracing lines of table | |
US20100135535A1 (en) | Method for Comparing First Computer-Aided 3D Model with a Second Computer-Aided 3D Model | |
US9934431B2 (en) | Producing a flowchart object from an image | |
US9824267B2 (en) | Writing board detection and correction | |
JP7195092B2 (ja) | 手描きの表の識別 | |
US20190034719A1 (en) | Splitting merged table cells | |
CN115546809A (zh) | 基于单元格约束的表格结构识别方法及其应用 | |
CN111985459A (zh) | 表格图像校正方法、装置、电子设备和存储介质 | |
JP3471578B2 (ja) | 行方向判定装置、画像傾き検出装置及び画像傾き補正装置 | |
JP5343617B2 (ja) | 文字認識プログラム、文字認識方法および文字認識装置 | |
Ozdemir et al. | A novel algorithm for regularization of building footprints using raw LiDAR point clouds | |
US10410386B2 (en) | Table cell validation | |
Wu et al. | Extracting POP: Pairwise orthogonal planes from point cloud using RANSAC | |
CN113538623A (zh) | 确定目标图像的方法、装置、电子设备及存储介质 | |
CN110688995B (zh) | 地图查询的处理方法,计算机可读存储介质和移动终端 | |
JP2018067298A (ja) | 手書き内容編集装置および手書き内容編集方法 | |
JP7219011B2 (ja) | 表に関するタイプセットネススコア | |
CN115797955A (zh) | 基于单元格约束的表格结构识别方法及其应用 | |
US9977956B2 (en) | Selecting primary groups during production of a flowchart object from an image |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210824 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220830 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221124 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221206 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221213 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7195092 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |