JP2021193549A - テーブル認識方法及び装置、電子機器、記憶媒体並びにコンピュータプログラム - Google Patents
テーブル認識方法及び装置、電子機器、記憶媒体並びにコンピュータプログラム Download PDFInfo
- Publication number
- JP2021193549A JP2021193549A JP2021053487A JP2021053487A JP2021193549A JP 2021193549 A JP2021193549 A JP 2021193549A JP 2021053487 A JP2021053487 A JP 2021053487A JP 2021053487 A JP2021053487 A JP 2021053487A JP 2021193549 A JP2021193549 A JP 2021193549A
- Authority
- JP
- Japan
- Prior art keywords
- target
- row
- merger
- candidate
- recognition result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 82
- 238000004590 computer program Methods 0.000 title claims abstract description 11
- 238000001514 detection method Methods 0.000 claims description 41
- 230000015654 memory Effects 0.000 claims description 22
- 230000008569 process Effects 0.000 claims description 17
- 238000003062 neural network model Methods 0.000 claims description 14
- 238000013145 classification model Methods 0.000 claims description 13
- 238000000605 extraction Methods 0.000 claims description 11
- 238000005516 engineering process Methods 0.000 abstract description 13
- 238000012545 processing Methods 0.000 abstract description 11
- 238000012549 training Methods 0.000 description 23
- 230000006870 function Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 12
- 238000004891 communication Methods 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 3
- 241000699666 Mus <mouse, genus> Species 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000012015 optical character recognition Methods 0.000 description 2
- 238000000611 regression analysis Methods 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 241000699670 Mus sp. Species 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007500 overflow downdraw method Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/412—Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/191—Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
- G06V30/19173—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/414—Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Computer Graphics (AREA)
- Geometry (AREA)
- Character Input (AREA)
- Image Analysis (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Image Processing (AREA)
Abstract
Description
対象行の行の長さと対象画像におけるテーブルの行方向の文字領域とに基づいて、対象画像におけるテーブルの各列の候補領域範囲を確定することと、
各列の候補領域範囲に基づいて、文字領域を含まない空白列を検出することと、
空白列の候補領域範囲を2列の対象領域に結合し、対象画像におけるテーブルの各列の対象領域範囲を取得することとを含み、
ここで、2列の対象領域とは、空白列に隣接するとともに、空白列の両側にそれぞれ位置する列領域を指す。
候補テーブル認識結果の合併特徴を抽出するように構成される合併特徴抽出ユニットと、
予め訓練されたセル合併分類モデル及び合併特徴を用いて、候補テーブル認識結果のうちの合併対象行を確定するように構成される合併対象行確定ユニットとを備える。
合併対象行の方向特徴を抽出するように構成される方向特徴抽出ユニットと、
予め訓練されたセル合併方向確定モデル及び方向特徴を用いて、合併対象行の合併方向を確定するように構成される合併方向確定ユニットとを備え、ここで、合併方向は、下の行との結合と、上の行との結合を含む。
所定数のサンプルテーブルを取得し、サンプルテーブルにおける合併対象行及び該合併対象行の合併方向を表記するように構成されるサンプル表記モジュールと、
サンプルテーブルにおける、合併対象行を確定するためのサンプル合併特徴を抽出し、サンプルテーブルにおける、合併対象行の合併方向を確定するためのサンプル方向特徴を抽出するように構成されるサンプル特徴抽出モジュールと、
表記された合併対象行とサンプル合併特徴とに基づいて訓練を行ってセル合併分類モデルを取得するように構成される第1の訓練モジュールと、
表記された合併対象行の合併方向とサンプル方向特徴とに基づいて訓練を行ってセル合併方向確定モデルを取得するように構成される第2の訓練モジュールと、を備える。
対象画像におけるテーブルの外枠及び対象画像における文字領域を検出するように構成される外枠・文字検出ユニットと、
テーブルの外枠と文字領域とに基づいて、対象画像におけるテーブルをグリッド分割し、候補テーブル認識結果を得るように構成される候補結果確定ユニットと、を備える。
テーブルの外枠と文字領域の位置情報とに基づいて、対象画像におけるテーブルの各行の領域範囲を確定するように構成される行領域確定サブユニットと、
対象画像における各行に対応する文字領域の数に基づいて対象行を確定するように構成される対象行確定サブユニットと、
対象行の行の長さと対象画像におけるテーブルの行方向の文字領域とに基づいて、対象画像におけるテーブルの各列の領域範囲を確定するように構成される列領域確定サブユニットと、
各行の領域範囲と各列の領域範囲とに基づいて、対象画像におけるテーブルをグリッド分割し、候補テーブル認識結果を得るように構成されるグリッド分割サブユニットとを備える。
対象行の行の長さと対象画像におけるテーブルの行方向の文字領域とに基づいて、対象画像におけるテーブルの各列の候補領域範囲を確定するように構成される候補領域確定サブユニットと、
各列の候補領域範囲に基づいて、文字領域を含まない空白列を検出するように構成される空白列検出サブユニットと、
空白列の候補領域範囲を2列の対象領域に結合し、対象画像におけるテーブルの各列の対象領域範囲を取得するように構成される対象領域確定サブユニットとを備える。
ここで、2列の対象領域とは、空白列に隣接するとともに、空白列の両側にそれぞれ位置する列領域を指す。
対象画像におけるテーブルの外枠を検出するように構成されるテーブル外枠検出サブユニットと、
対象画像における文字領域を検出するように構成される文字領域検出サブユニットとを備え、
ここで、テーブル外枠検出サブユニットは、具体的には、
事前設定されたニューラルネットワークモデルを用いて対象画像におけるテーブルの外枠を検出するように構成される。ここで、事前設定されたニューラルネットワークモデルは、Yolov3ネットワーク構造に所定数の畳み込み層を追加することによって実現される。
対象画像におけるテーブルのテーブル名を検出するように構成されるテーブル名検出ユニットと、
外枠・文字検出ユニットが対象画像におけるテーブルの外枠を検出した後、テーブル名の位置情報に基づいて、テーブルの外枠を調整するように構成される外枠調整ユニットとを備える。
Claims (21)
- 対象画像におけるテーブルを検出し、候補テーブル認識結果を得ることと、
前記候補テーブル認識結果の合併特徴を抽出し、前記合併特徴に基づいて前記候補テーブル認識結果における合併対象行を確定することと、
前記合併対象行の方向特徴を抽出し、前記方向特徴に基づいて前記合併対象行の合併方向を確定することと、
前記合併対象行と前記合併対象行の合併方向とに基づいて、前記候補テーブル認識結果を調整し、対象テーブル認識結果を得ることと、を含むテーブル認識方法。 - 前記合併特徴に基づいて前記候補テーブル認識結果における合併対象行を確定することは、
予め訓練されたセル合併分類モデル及び前記合併特徴を用いて、前記候補テーブル認識結果における合併対象行を確定することを含む請求項1に記載のテーブル認識方法。 - 前記方向特徴に基づいて前記合併対象行の合併方向を確定することは、
予め訓練されたセル合併方向確定モデル及び前記方向特徴を用いて、前記合併対象行の合併方向を確定することを含み、
前記合併方向は、下の行への合併方向及び上の行への合併方向を含む請求項1に記載のテーブル認識方法。 - 前記合併特徴は、
前記候補テーブル認識結果における各行の有効列数と前記候補テーブル認識結果における最大有効列数との差、前記候補テーブル認識結果における各行と前記候補テーブル認識結果におけるヘッダとの相対的な位置関係、前記候補テーブル認識結果における各行の文字領域に所定の区切り文字が含まれるか否か、及び前記候補テーブル認識結果における各行の文字領域に数値タイプのデータが含まれるか否か、のうちの少なくとも1つを含み、
前記方向特徴は、
前記合併対象行がサイドヘッダを含むか否か、前記合併対象行がサイドヘッダのみを含むか否か、前記合併対象行の文字領域に数値タイプのデータが含まれるか否か、前記合併対象行からそれに隣接する上の行の下罫線までの距離と、それに隣接する下の行の上罫線までの距離との比、前記合併対象行の文字領域と前記上の行の文字領域との幅の差、及び前記合併対象行の文字領域と前記下の行の文字領域との幅の差、のうちの少なくとも1つを含み、
前記ヘッダとは、前記候補テーブル認識結果のうち、位置情報に基づいて確定された、有効列数が最大の行の最初のセルを指す、請求項1〜3のいずれか1項に記載のテーブル認識方法。 - 前記の、対象画像におけるテーブルを検出し、候補テーブル認識結果を得ることは、
前記対象画像におけるテーブルの外枠及び前記対象画像における文字領域を検出することと、
前記テーブルの外枠と前記文字領域とに基づいて、前記対象画像におけるテーブルをグリッド分割し、候補テーブル認識結果を得ることと、を含む請求項1に記載のテーブル認識方法。 - 前記テーブルの外枠と前記文字領域とに基づいて、前記対象画像におけるテーブルをグリッド分割し、候補テーブル認識結果を得ることは、
前記テーブルの外枠と前記文字領域の位置情報とに基づいて、前記対象画像におけるテーブルの各行の領域範囲を確定することと、
前記対象画像における行ごとに対応する文字領域の数に基づいて対象行を確定することと、
前記対象行の行の長さと前記対象画像におけるテーブルの行方向の文字領域とに基づいて、前記対象画像におけるテーブルの各列の領域範囲を確定することと、
前記各行の領域範囲と前記各列の領域範囲とに基づいて、前記対象画像におけるテーブルをグリッド分割し、候補テーブル認識結果を得ることと、を含む請求項5に記載のテーブル認識方法。 - 前記対象行の行の長さと前記対象画像におけるテーブルの行方向の文字領域とに基づいて、前記対象画像におけるテーブルの各列の領域範囲を確定することは、
前記対象行の行の長さと前記対象画像におけるテーブルの行方向の文字領域とに基づいて、前記対象画像におけるテーブルの各列の候補領域範囲を確定することと、
前記各列の候補領域範囲に基づいて、文字領域を含まない空白列を検出することと、
前記空白列の候補領域範囲を2列の対象領域に結合し、前記対象画像におけるテーブルの各列の対象領域範囲を取得することとを含み、前記2列の対象領域とは、前記空白列の異なる側にそれぞれ隣接して位置する列領域を指す請求項6に記載のテーブル認識方法。 - 前記の、対象画像におけるテーブルの外枠を検出することは、
事前設定されたニューラルネットワークモデルを用いて前記対象画像におけるテーブルの外枠を検出することを含み、
前記事前設定されたニューラルネットワークモデルは、Yolov3ネットワーク構造に所定数の畳み込み層を追加することによって実現される請求項5に記載のテーブル認識方法。 - 前記の、対象画像におけるテーブルの外枠を検出するプロセスにおいて、前記対象画像におけるテーブルのテーブル名を検出することをさらに含み、
前記対象画像におけるテーブルの外枠が検出された後、前記テーブル名の位置情報に応じて前記テーブルの外枠を調整することをさらに含む請求項5に記載のテーブル認識方法。 - 対象画像におけるテーブルを検出し、候補テーブル認識結果を取得するための候補結果確定モジュールと、
前記候補テーブル認識結果の合併特徴を抽出し、前記合併特徴に基づいて前記候補テーブル認識結果内の合併対象行を確定するように構成される合併対象行確定モジュールと、
前記合併対象行の方向特徴を抽出し、前記方向特徴に基づいて前記合併対象行の合併方向を確定するように構成される合併方向確定モジュールと、
前記合併対象行と前記合併対象行の合併方向とに基づいて、前記候補テーブル認識結果を調整し、対象テーブル認識結果を取得するように構成される対象結果確定モジュールと、を含むテーブル認識装置。 - 前記合併対象行確定モジュールは、
前記候補テーブル認識結果の合併特徴を抽出するように構成される合併特徴抽出ユニットと、
予め訓練されたセル合併分類モデル及び前記合併特徴を用いて、前記候補テーブル認識結果における合併対象行を確定するように構成される合併対象行確定ユニットと、を含む請求項10に記載のテーブル認識装置。 - 前記合併方向確定モジュールは、
前記合併対象行の方向特徴を抽出するように構成される方向特徴抽出ユニットと、
予め訓練されたセル合併方向確定モデル及び前記方向特徴を用いて、前記合併対象行の合併方向を確定するように構成される合併方向確定ユニットと、を含み、
前記合併方向は、下の行への合併方向及び上の行への合併方向を含む請求項10に記載のテーブル認識装置。 - 前記合併特徴は、
前記候補テーブル認識結果における各行の有効列数と前記候補テーブル認識結果における最大有効列数との差、前記候補テーブル認識結果における各行と前記候補テーブル認識結果におけるヘッダとの相対的な位置関係、前記候補テーブル認識結果における各行の文字領域に所定の区切り文字が含まれるか否か、及び前記候補テーブル認識結果における各行の文字領域に数値タイプのデータが含まれるか否か、のうちの少なくとも1つを含み、
前記方向特徴は、
前記合併対象行がサイドヘッダを含むか否か、前記合併対象行がサイドヘッダのみを含むか否か、前記合併対象行の文字領域に数値タイプのデータが含まれるか否か、前記合併対象行からそれに隣接する上の行の下罫線までの距離と、それに隣接する下の行の上罫線までの距離との比、前記合併対象行の文字領域と前記上の行の文字領域との幅の差、及び前記合併対象行の文字領域と前記下の行の文字領域との幅の差、のうちの少なくとも1つを含み、
前記ヘッダとは、前記候補テーブル認識結果のうち、位置情報に基づいて確定された、有効列数が最大の行の最初のセルを指す、請求項10〜12のいずれか1項に記載のテーブル認識装置。 - 前記候補結果確定モジュールは、
前記対象画像におけるテーブルの外枠及び前記対象画像における文字領域を検出するように構成される外枠・文字検出ユニットと、
前記テーブルの外枠と前記文字領域とに基づいて、前記対象画像におけるテーブルをグリッド分割し、候補テーブル認識結果を得るように構成される候補結果確定ユニットと、を含む請求項10に記載のテーブル認識装置。 - 前記候補結果確定ユニットは、
前記テーブルの外枠と前記文字領域の位置情報とに基づいて、前記対象画像におけるテーブルの各行の領域範囲を確定するように構成される行領域確定サブユニットと、
前記対象画像における行ごとに対応する文字領域の数に基づいて対象行を確定するように構成される対象行確定サブユニットと、
前記対象行の行の長さと前記対象画像におけるテーブルの行方向の文字領域とに基づいて、前記対象画像におけるテーブルの各列の領域範囲を確定するように構成される列領域確定サブユニットと、
前記各行の領域範囲と前記各列の領域範囲とに基づいて、前記対象画像におけるテーブルをグリッド分割し、候補テーブル認識結果を得るように構成されるグリッド分割サブユニットと、を含む請求項14に記載のテーブル認識装置。 - 前記列領域確定サブユニットは、
前記対象行の行の長さと前記対象画像におけるテーブルの行方向の文字領域とに基づいて、前記対象画像におけるテーブルの各列の候補領域範囲を確定するように構成される候補領域確定サブユニットと、
前記各列の候補領域範囲に基づいて、文字領域を含まない空白列を検出するように構成される空白列検出サブユニットと、
前記空白列の候補領域範囲を2列の対象領域に結合し、前記対象画像におけるテーブルの各列の対象領域範囲を取得するように構成される対象領域確定サブユニットであって、前記2列の対象領域とは、前記空白列の異なる側にそれぞれ隣接して位置する列領域を指す、対象領域確定サブユニットと、を含む請求項15に記載のテーブル認識装置。 - 前記外枠・文字検出ユニットは、
前記対象画像におけるテーブルの外枠を検出するように構成されるテーブル外枠検出サブユニットと、
前記対象画像における文字領域を検出するように構成される文字領域検出サブユニットと、を含み、
前記テーブル外枠検出サブユニットは、
事前設定されたニューラルネットワークモデルを用いて前記対象画像におけるテーブルの外枠を検出するように構成され、
前記事前設定されたニューラルネットワークモデルは、Yolov3ネットワーク構造に所定数の畳み込み層を追加することによって実現される請求項14に記載のテーブル認識装置。 - 前記候補結果確定モジュールは、
前記対象画像におけるテーブルのテーブル名を検出するように構成されるテーブル名検出ユニットと、
前記外枠・文字検出ユニットが前記対象画像におけるテーブルの外枠を検出した後、前記テーブル名の位置情報に応じて前記テーブルの外枠を調整するように構成される外枠調整ユニットと、をさらに含む請求項14に記載のテーブル認識装置。 - 少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサと通信可能に接続されたメモリとを備える電子機器であって、
前記メモリには、前記少なくとも1つのプロセッサにより実行可能な指令が格納されており、前記指令が前記少なくとも1つのプロセッサにより実行されると、前記少なくとも1つのプロセッサに請求項1〜9のいずれか1項に記載のテーブル認識方法を実現させる、電子機器。 - コンピュータ指令が格納されている非一時的コンピュータ可読記憶媒体であって、
前記コンピュータ指令は、請求項1〜9のいずれか1項に記載のテーブル認識方法を前記コンピュータに実行させる非一時的コンピュータ可読記憶媒体。 - プロセッサにより実行されると、請求項1〜9のいずれか1項に記載のテーブル認識方法を実現する、コンピュータプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010508011.6A CN111695553B (zh) | 2020-06-05 | 2020-06-05 | 表格识别方法、装置、设备和介质 |
CN202010508011.6 | 2020-06-05 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021193549A true JP2021193549A (ja) | 2021-12-23 |
JP7299939B2 JP7299939B2 (ja) | 2023-06-28 |
Family
ID=72479619
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021053487A Active JP7299939B2 (ja) | 2020-06-05 | 2021-03-26 | テーブル認識方法及び装置、電子機器、記憶媒体並びにコンピュータプログラム |
Country Status (5)
Country | Link |
---|---|
US (1) | US11636699B2 (ja) |
EP (1) | EP3822851A3 (ja) |
JP (1) | JP7299939B2 (ja) |
KR (1) | KR102609341B1 (ja) |
CN (1) | CN111695553B (ja) |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112417831A (zh) * | 2020-11-23 | 2021-02-26 | 中国建设银行股份有限公司 | 表格合并方法和装置 |
CN112183511A (zh) * | 2020-12-01 | 2021-01-05 | 江西博微新技术有限公司 | 一种图像导出表格的方法、系统、存储介质及设备 |
CN112632934B (zh) * | 2020-12-22 | 2023-01-17 | 上海精密计量测试研究所 | 基于比例计算还原表格图片为可编辑的word文件表格的方法 |
CN112861865B (zh) * | 2021-01-29 | 2024-03-29 | 国网内蒙古东部电力有限公司 | 一种基于ocr技术的辅助审计方法 |
CN113177397B (zh) * | 2021-04-21 | 2023-03-28 | 平安消费金融有限公司 | 表格的调整方法、装置、设备以及存储介质 |
KR102508654B1 (ko) * | 2021-04-23 | 2023-03-10 | 주식회사 티맥스에이아이 | 이미지 기반 테이블 경계선 생성 방법 |
CN113033170B (zh) * | 2021-04-23 | 2023-08-04 | 中国平安人寿保险股份有限公司 | 表格标准化处理方法、装置、设备及存储介质 |
KR102490486B1 (ko) * | 2021-04-30 | 2023-01-19 | 주식회사 티맥스에이아이 | 이미지 기반 테이블 정보 생성 방법 |
CN113221519B (zh) * | 2021-05-18 | 2024-03-29 | 北京百度网讯科技有限公司 | 用于处理表格数据的方法、装置、设备、介质和产品 |
CN113158987B (zh) * | 2021-05-19 | 2022-07-05 | 中国科学技术信息研究所 | 表格处理方法、装置、设备及计算机可读存储介质 |
KR102342580B1 (ko) * | 2021-07-16 | 2021-12-24 | 주식회사 애자일소다 | 딥러닝 알고리즘을 이용한 정형 데이터 처리 장치 및 방법 |
CN113821691A (zh) * | 2021-08-13 | 2021-12-21 | 安徽希施玛数据科技有限公司 | 文档处理方法及装置、电子设备及可读存储介质 |
US20230094787A1 (en) * | 2021-09-30 | 2023-03-30 | Adobe Inc. | Utilizing machine-learning based object detection to improve optical character recognition |
CN113936286B (zh) * | 2021-11-29 | 2024-06-14 | 中国平安人寿保险股份有限公司 | 图像文本识别方法、装置、计算机设备及存储介质 |
CN115273111B (zh) * | 2022-06-27 | 2023-04-18 | 北京互时科技股份有限公司 | 一种无模板识别图纸材料表的装置 |
CN116311301B (zh) * | 2023-02-17 | 2024-06-07 | 北京感易智能科技有限公司 | 无线表格识别方法及系统 |
CN116071771A (zh) * | 2023-03-24 | 2023-05-05 | 南京燧坤智能科技有限公司 | 表格重构方法、装置、非易失性存储介质及电子设备 |
CN116127928B (zh) * | 2023-04-17 | 2023-07-07 | 广东粤港澳大湾区国家纳米科技创新研究院 | 表格数据识别方法、装置、存储介质及计算机设备 |
CN117195846B (zh) * | 2023-11-07 | 2024-03-01 | 江西五十铃汽车有限公司 | 一种专家表管理方法、系统、存储介质及设备 |
CN117217172B (zh) * | 2023-11-09 | 2024-04-23 | 金蝶征信有限公司 | 表格信息获取方法、装置、计算机设备、存储介质 |
CN118332065B (zh) * | 2024-06-13 | 2024-09-06 | 金现代信息产业股份有限公司 | 智能问答场景下的表格知识存储方法、装置、介质及设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10307888A (ja) * | 1997-05-09 | 1998-11-17 | Ricoh Co Ltd | 表処理方法、装置および記録媒体 |
US20090304282A1 (en) * | 2008-06-06 | 2009-12-10 | Microsoft Corporation | Recognition of tabular structures |
JP2011123825A (ja) * | 2009-12-14 | 2011-06-23 | Fujitsu Frontech Ltd | 文字認識方法、文字認識装置および文字認識プログラム |
US20190340240A1 (en) * | 2018-05-03 | 2019-11-07 | Microsoft Technology Licensing, Llc | Automated extraction of unstructured tables and semantic information from arbitrary documents |
JP2020042754A (ja) * | 2018-09-07 | 2020-03-19 | 株式会社フジクラ | 分類装置、分類方法、分類プログラム、及び検査装置 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0602955B1 (en) * | 1992-12-17 | 2000-12-27 | Xerox Corporation | Text recognition |
JP3607753B2 (ja) * | 1995-07-31 | 2005-01-05 | 株式会社リコー | 文書画像の領域分割方法および装置、並びに段組種類判別方法および装置 |
JP3435375B2 (ja) * | 1999-10-12 | 2003-08-11 | 沖電気工業株式会社 | 文字認識方法および装置 |
JP4973063B2 (ja) * | 2006-08-14 | 2012-07-11 | 富士通株式会社 | 表データ処理方法及び装置 |
CN103577817B (zh) * | 2012-07-24 | 2017-03-01 | 阿里巴巴集团控股有限公司 | 表单识别方法与装置 |
US9858476B1 (en) * | 2016-06-30 | 2018-01-02 | Konica Minolta Laboratory U.S.A., Inc. | Method for recognizing table, flowchart and text in document images |
CN108446264B (zh) * | 2018-03-26 | 2022-02-15 | 阿博茨德(北京)科技有限公司 | Pdf文档中的表格矢量解析方法及装置 |
US11200413B2 (en) * | 2018-07-31 | 2021-12-14 | International Business Machines Corporation | Table recognition in portable document format documents |
CN110163198B (zh) * | 2018-09-27 | 2022-03-08 | 腾讯科技(深圳)有限公司 | 一种表格识别重建方法、装置和存储介质 |
CN109934181A (zh) * | 2019-03-18 | 2019-06-25 | 北京海益同展信息科技有限公司 | 文本识别方法、装置、设备和计算机可读介质 |
CN110334585B (zh) * | 2019-05-22 | 2023-10-24 | 平安科技(深圳)有限公司 | 表格识别方法、装置、计算机设备和存储介质 |
CN110390269B (zh) * | 2019-06-26 | 2023-08-01 | 平安科技(深圳)有限公司 | Pdf文档表格提取方法、装置、设备及计算机可读存储介质 |
CN110502985B (zh) * | 2019-07-11 | 2022-06-07 | 新华三大数据技术有限公司 | 表格识别方法、装置及表格识别设备 |
CN110532968B (zh) * | 2019-09-02 | 2023-05-23 | 苏州美能华智能科技有限公司 | 表格识别方法、装置和存储介质 |
CN111062259B (zh) * | 2019-11-25 | 2023-08-25 | 泰康保险集团股份有限公司 | 表格识别方法和装置 |
-
2020
- 2020-06-05 CN CN202010508011.6A patent/CN111695553B/zh active Active
- 2020-12-10 US US17/118,403 patent/US11636699B2/en active Active
-
2021
- 2021-03-26 JP JP2021053487A patent/JP7299939B2/ja active Active
- 2021-03-29 EP EP21165648.3A patent/EP3822851A3/en not_active Withdrawn
- 2021-03-31 KR KR1020210042119A patent/KR102609341B1/ko active IP Right Grant
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10307888A (ja) * | 1997-05-09 | 1998-11-17 | Ricoh Co Ltd | 表処理方法、装置および記録媒体 |
US20090304282A1 (en) * | 2008-06-06 | 2009-12-10 | Microsoft Corporation | Recognition of tabular structures |
JP2011123825A (ja) * | 2009-12-14 | 2011-06-23 | Fujitsu Frontech Ltd | 文字認識方法、文字認識装置および文字認識プログラム |
US20190340240A1 (en) * | 2018-05-03 | 2019-11-07 | Microsoft Technology Licensing, Llc | Automated extraction of unstructured tables and semantic information from arbitrary documents |
JP2020042754A (ja) * | 2018-09-07 | 2020-03-19 | 株式会社フジクラ | 分類装置、分類方法、分類プログラム、及び検査装置 |
Non-Patent Citations (1)
Title |
---|
YILUN HUANG ET AL.: "A YOLO-Based Table Detection Method", 2019 INTERNATIONAL CONFERENCE ON DOCUMENT ANALYSIS AND RECOGNITION (ICDAR), JPN6022051752, 25 September 2019 (2019-09-25), US, pages 813 - 818, XP033701364, ISSN: 0004937958, DOI: 10.1109/ICDAR.2019.00135 * |
Also Published As
Publication number | Publication date |
---|---|
US20210383105A1 (en) | 2021-12-09 |
EP3822851A3 (en) | 2021-10-20 |
EP3822851A2 (en) | 2021-05-19 |
CN111695553B (zh) | 2023-09-08 |
KR20210042864A (ko) | 2021-04-20 |
JP7299939B2 (ja) | 2023-06-28 |
CN111695553A (zh) | 2020-09-22 |
KR102609341B1 (ko) | 2023-12-01 |
US11636699B2 (en) | 2023-04-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2021193549A (ja) | テーブル認識方法及び装置、電子機器、記憶媒体並びにコンピュータプログラム | |
EP3825916A2 (en) | Method and apparatus for retrieving image and computer-readable storage medium | |
JP7230081B2 (ja) | 帳票画像認識方法および装置、電子機器、記憶媒体並びにコンピュータプログラム | |
US11645316B2 (en) | Question answering method and language model training method, apparatus, device, and storage medium | |
KR20210037619A (ko) | 멀티 모달 콘텐츠 처리 방법, 장치, 기기 및 저장 매체 | |
US9400775B2 (en) | Document data entry suggestions | |
US11573992B2 (en) | Method, electronic device, and storage medium for generating relationship of events | |
US11775845B2 (en) | Character recognition method and apparatus, electronic device and computer readable storage medium | |
CN111488740A (zh) | 一种因果关系的判别方法、装置、电子设备及存储介质 | |
US20210224480A1 (en) | Method, device and storage medium for predicting punctuation in text | |
US11462039B2 (en) | Method, device, and storage medium for obtaining document layout | |
CN111507355A (zh) | 一种字符识别方法、装置、设备和存储介质 | |
JP7300034B2 (ja) | テーブル生成方法、装置、電子機器、記憶媒体及びプログラム | |
JP2022077969A (ja) | データ処理方法、装置、電子デバイスおよび記憶媒体 | |
CN112541332B (zh) | 表单信息抽取方法、装置、电子设备及存储介质 | |
CN112507735A (zh) | 机器翻译模型的训练方法、装置和电子设备 | |
JP7241122B2 (ja) | スマート応答方法及び装置、電子機器、記憶媒体並びにコンピュータプログラム | |
US20220004812A1 (en) | Image processing method, method for training pre-training model, and electronic device | |
CN112182292A (zh) | 视频检索模型的训练方法、装置、电子设备及存储介质 | |
CN113361523A (zh) | 文本确定方法、装置、电子设备和计算机可读存储介质 | |
US11893977B2 (en) | Method for recognizing Chinese-English mixed speech, electronic device, and storage medium | |
WO2024030232A1 (en) | Table structure recognition | |
KR20240108328A (ko) | 이미지 기반 인간 - 컴퓨터 상호작용 방법, 장치, 기기 및 저장매체 | |
CN115952790A (zh) | 信息抽取方法及其装置 | |
CN115130989A (zh) | 一种业务文档的审核方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211004 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20221101 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221206 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230302 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230606 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230616 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7299939 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |