JP2021131900A - 文書レイアウト解析方法、装置、電子機器及び記憶媒体 - Google Patents
文書レイアウト解析方法、装置、電子機器及び記憶媒体 Download PDFInfo
- Publication number
- JP2021131900A JP2021131900A JP2021089265A JP2021089265A JP2021131900A JP 2021131900 A JP2021131900 A JP 2021131900A JP 2021089265 A JP2021089265 A JP 2021089265A JP 2021089265 A JP2021089265 A JP 2021089265A JP 2021131900 A JP2021131900 A JP 2021131900A
- Authority
- JP
- Japan
- Prior art keywords
- character
- sample
- characters
- document
- spatial
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
- G06F18/2148—Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/26—Techniques for post-processing, e.g. correcting the recognition result
- G06V30/262—Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
- G06V30/274—Syntactic or semantic context, e.g. balancing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/414—Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Computer Graphics (AREA)
- Geometry (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Medical Informatics (AREA)
- Mathematical Physics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Character Input (AREA)
- Document Processing Apparatus (AREA)
Abstract
Description
以上からわかるように、文書のレイアウトをどのように正確に解析するのは決定的に重要である。
対象文書内の複数の文字及び前記複数の文字の文字情報を取得するステップと、
前記複数の文字及び前記複数の文字の文字情報に基づいて、複数の文字頂点及び前記複数の文字頂点間の複数の文字接続辺を含む文字全接続図を生成するステップと、
各前記文字の空間語義特徴を取得するステップと、
前記複数の文字の文字情報に基づいて前記複数の文字頂点の頂点タイプを生成するステップと、
前記空間語義特徴及び前記文字情報に基づいて、前記複数の文字接続辺の辺タイプを生成するステップと、
前記頂点タイプ及び前記辺タイプに基づいて、対象文書の文書レイアウトを生成するステップと、を含む文書レイアウト解析方法を提供する。
対象文書内の複数の文字及び前記複数の文字の文字情報を取得するための第1の取得モジュールと、
前記複数の文字及び前記複数の文字の文字情報に基づいて、複数の文字頂点及び前記複数の文字頂点間の複数の文字接続辺を含む文字全接続図を生成するための第1の生成モジュールと、
各前記文字の空間語義特徴を取得するための第2の取得モジュールと、
前記複数の文字の文字情報に基づいて前記複数の文字頂点の頂点タイプを生成するための第2の生成モジュールと、
前記空間語義特徴及び前記文字情報に基づいて、前記複数の文字接続辺の辺タイプを生成するための第3の生成モジュールと、
前記頂点タイプ及び前記辺タイプに基づいて、対象文書の文書レイアウトを生成するための第4の生成モジュールと、を含む文書レイアウト解析装置を提供する。
少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサと通信可能に接続されたメモリと、を含み、
前記メモリには、前記少なくとも1つのプロセッサによって実行可能な命令が記憶されており、前記命令は、前記少なくとも1つのプロセッサが、上記実施例に記載の文書レイアウト解析方法を実行できるように、前記少なくとも1つのプロセッサによって実行される。
前記コンピュータ命令は、前記コンピュータに上記実施例に記載の文書レイアウト解析方法を実行させることに用いられる。
前記コンピュータプログラムは、コンピュータ上で動作するときに、前記コンピュータに上記実施例に記載の文書レイアウト解析方法を実行させることに用いられる。
文字情報、語義情報、及び空間位置情報に基づいて文書レイアウトを解析し、文書レイアウトを生成することで、情報を有効に利用して大域的最適解を検索し、文書レイアウト解析の正確さを向上させる。
上記選択可能の態様の別の利点については、以下、具体的な実施例を参照して詳細に説明する。
本出願の実施例に係る文書レイアウト解析方法、装置、電子機器及び記憶媒体について、図面を参照して以下に説明する。
本出願の実施例に係る文書レイアウト解析方法は、本出願の実施例に係る文書レイアウト解析装置によって実行可能であり、当該文書レイアウト解析装置は、文字情報、語義情報、空間位置情報を有効に利用して文書レイアウトを解析するように電子機器に配置されている。
ステップ101において、対象文書内の複数の文字及び複数の文字の文字情報を取得する。
図2では、文書を読み取り、文書から複数の文字C1、C2、…、Ca、C3、C4、…、Cb、…、Cx、Cy、…、Czを取得し、複数の文字を接続して接続辺を取得する。図2において文字C1を例としてC1と他の文字との間の文字接続辺を示し、すなわち、図2の中の双方向矢印点線である。
ここでのステップ301〜ステップ302の処理は、上述したステップ201〜ステップ202の処理と同様であるため、説明を省略する。
本実施例では、各サンプル文字のサンプル空間語義特徴を取得するために、サンプル文字を空間言語モデルに入力することができる。
平均損失値が予め設定された第3の損失閾値より大きい場合、文字検出モデルのパラメータを調整する。その後、次のサンプル文書のランダム外乱が追加された後のサンプル文字全接続図を調整された文字検出モデルに入力する。その後、予測文字及びサンプル文書内のサンプル文字に基づいて平均損失値を算出し、平均損失値が第3の損失閾値より大きいかどうかを判断し、第3の損失閾値よりも大きければ、損失値が第3の損失閾値より小さくなるまで、モデルのパラメータを調整してトレーニングを続ける。
図11に示すように、当該文書レイアウト解析方法は、以下ステップ501〜ステップ506を含む。
ここでのステップ502の処理は、上述したステップ102の処理と同様であるため、説明を省略する。
本実施例では、複数の文字を空間言語モデルに入力し、空間言語モデルを用いて各文字の空間語義特徴を取得することができる。
ここでのステップ504の処理は、上述したステップ104の処理と同様であるため、説明を省略する。
図12に示すように、当該文書レイアウト解析装置600は、第1の取得モジュール610と、第1の生成モジュール620と、第2の取得モジュール630と、第2の生成モジュール640と、第3の生成モジュール650と、第4の生成モジュール660とを含む。
第1の生成モジュール620は、複数の文字及び複数の文字の文字情報に基づいて、複数の文字頂点及び複数の文字頂点間の複数の文字接続辺を含む文字全接続図を生成することに用いられる。
第2の取得モジュール630は、各文字の空間語義特徴を取得することに用いられる。
第2の生成モジュール640は、複数の文字の文字情報に基づいて複数の文字頂点の頂点タイプを生成することに用いられる。
第3の生成モジュール650は、空間語義特徴及び文字情報に基づいて、複数の文字接続辺の辺タイプを生成することに用いられる。
第4の生成モジュール660は、頂点タイプ及び辺タイプに基づいて、対象文書の文書レイアウトを生成することに用いられる。
第5の取得モジュールは、複数のサンプル文字及びサンプル文字情報に基づいて、サンプル文字全接続図を生成することに用いられる。
第6の取得モジュールは、隠された位置の予測文字を生成するために、サンプル文字全接続図内のサンプル文字の一部を隠し、隠されたサンプル文字全接続図を空間言語モデルに入力して予測を行うことに用いられる。
第1のトレーニングモジュールは、隠された位置のサンプル文字及び予測文字に基づいて空間言語モデルをトレーニングすることに用いられる。
第5の生成モジュールは、複数のサンプル文字及びサンプル文字情報に基づいてサンプル文字全接続図を生成することに用いられる。
第4の取得モジュールは、各サンプル文字のサンプル空間語義特徴を取得することに用いられる。
第7の生成モジュールは、隠された位置の予測辺タイプを生成するために、サンプル文字全接続図内のサンプル文字接続辺の一部を隠し、隠されたサンプル文字全接続図及びサンプル空間語義特徴を辺タイプ認識モデルに入力して予測を行うことに用いられる。
第2のトレーニングモジュールは、隠された位置のサンプル文字接続辺タイプ及び予測辺タイプに基づいて辺タイプ認識モデルをトレーニングすることに用いられる。
第5の生成モジュールは、複数のサンプル文字及びサンプル文字情報に基づいてサンプル文字全接続図を生成することに用いられる。
追加モジュールは、サンプル文字全接続図内の複数の文字頂点のうちの一部の文字頂点にランダム外乱を追加することに用いられる。
第8の生成モジュールは、予測文字を生成するために、ランダム外乱が追加された後のサンプル文字全接続図を文字検出モデルに入力して文字予測を行うことに用いられる。
第3のトレーニングモジュールは、予測文字及びサンプル文書内のサンプル文字に基づいて文字検出モデルをトレーニングすることに用いられる。
図13に示すように、本出願の実施例に係る文書レイアウト解析方法の電子機器のブロック図である。電子機器は、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、メインフレームコンピュータ、及び他の適切なコンピュータなどの様々な形式のデジタルコンピュータを表すことを目的とする。電子機器は、携帯情報端末、携帯電話、スマートフォン、ウェアラブルデバイス、他の同様のコンピューティングデバイスなどの様々な形式のモバイルデバイスを表すこともできる。本明細書で示されるコンポーネント、それらの接続と関係、及びそれらの機能は単なる例であり、本明細書の説明及び/又は要求される本出願の実現を制限することを意図したものではない。
Claims (17)
- 文書レイアウト解析方法であって、
対象文書内の複数の文字及び前記複数の文字の文字情報を取得するステップと、
前記複数の文字及び前記複数の文字の文字情報に基づいて、複数の文字頂点及び前記複数の文字頂点間の複数の文字接続辺を含む文字全接続図を生成するステップと、
各前記文字の空間語義特徴を取得するステップと、
前記複数の文字の文字情報に基づいて前記複数の文字頂点の頂点タイプを生成するステップと、
前記空間語義特徴及び前記文字情報に基づいて、前記複数の文字接続辺の辺タイプを生成するステップと、
前記頂点タイプ及び前記辺タイプに基づいて、対象文書の文書レイアウトを生成するステップと、を含む、
ことを特徴とする文書レイアウト解析方法。 - 各文字の空間語義特徴を取得するステップは、
前記各文字の空間語義特徴を生成するために、前記複数の文字を空間言語モデルに入力するステップを含む、
ことを特徴とする請求項1に記載の文書レイアウト解析方法。 - 前記空間言語モデルは、
サンプル文書内の複数のサンプル文字及び複数のサンプル文字のサンプル文字情報を取得するステップと、
前記複数のサンプル文字及び前記サンプル文字情報に基づいて、サンプル文字全接続図を生成するステップと、
隠された位置の予測文字を生成するために、前記サンプル文字全接続図内のサンプル文字の一部を隠し、隠されたサンプル文字全接続図を前記空間言語モデルに入力して予測を行うステップと、
前記隠された位置のサンプル文字及び前記予測文字に基づいて、前記空間言語モデルをトレーニングするステップと、を介してトレーニングすることによって得られる、
ことを特徴とする請求項2に記載の文書レイアウト解析方法。 - 前記空間語義特徴及び前記文字情報に基づいて、前記複数の文字接続辺の辺タイプを生成するステップは、
前記複数の文字接続辺の辺タイプを生成するために、前記複数の文字の空間語義特徴及び文字情報を辺タイプ認識モデルに入力するステップを含む、
ことを特徴とする請求項1に記載の文書レイアウト解析方法。 - 前記辺タイプ認識モデルは、
サンプル文書内の複数のサンプル文字及び前記複数のサンプル文字のサンプル文字情報を取得するステップと、
前記複数のサンプル文字及び前記サンプル文字情報に基づいてサンプル文字全接続図を生成するステップと、
各前記サンプル文字のサンプル空間語義特徴を取得するステップと、
隠された位置の予測辺タイプを生成するために、前記サンプル文字全接続図内のサンプル文字接続辺の一部を隠し、隠されたサンプル文字全接続図及び前記サンプル空間語義特徴を前記辺タイプ認識モデルに入力して予測を行うステップと、
前記隠された位置のサンプル文字接続辺タイプ及び前記予測辺タイプに基づいて、前記辺タイプ認識モデルをトレーニングするステップと、を介してトレーニングすることによって得られる
ことを特徴とする請求項4に記載の文書レイアウト解析方法。 - 対象文書内の複数の文字を取得するステップは、
前記対象文書内の前記複数の文字を取得するために、前記対象文書を文字検出モデルに入力するステップを含む、
ことを特徴とする請求項1に記載の文書レイアウト解析方法。 - 前記文字検出モデルは、
サンプル文書内の複数のサンプル文字及び前記複数のサンプル文字のサンプル文字情報を取得するステップと、
前記複数のサンプル文字及び前記サンプル文字情報に基づいてサンプル文字全接続図を生成するステップと、
前記サンプル文字全接続図内の複数の文字頂点のうちの一部の文字頂点にランダム外乱を追加するステップと、
予測文字を生成するために、ランダム外乱が追加された後の前記サンプル文字全接続図を前記文字検出モデルに入力して文字予測を行うステップと、
前記予測文字及び前記サンプル文書内のサンプル文字に基づいて前記文字検出モデルをトレーニングするステップと、を介してトレーニングすることによって得られる、
ことを特徴とする請求項6に記載の文書レイアウト解析方法。 - 文書レイアウト解析装置であって、
対象文書内の複数の文字及び前記複数の文字の文字情報を取得するための第1の取得モジュールと、
前記複数の文字及び前記複数の文字の文字情報に基づいて、複数の文字頂点及び前記複数の文字頂点間の複数の文字接続辺を含む文字全接続図を生成するための第1の生成モジュールと、
各前記文字の空間語義特徴を取得するための第2の取得モジュールと、
前記複数の文字の文字情報に基づいて前記複数の文字頂点の頂点タイプを生成するための第2の生成モジュールと、
前記空間語義特徴及び前記文字情報に基づいて、前記複数の文字接続辺の辺タイプを生成するための第3の生成モジュールと、
前記頂点タイプ及び前記辺タイプに基づいて、対象文書の文書レイアウトを生成するための第4の生成モジュールと、を含む
ことを特徴とする文書レイアウト解析装置。 - 前記第2の取得モジュールは、前記各文字の空間語義特徴を生成するために、前記複数の文字を空間言語モデルに入力することに用いられる、
ことを特徴とする請求項8に記載の文書レイアウト解析装置。 - 前記空間言語モデルは、
サンプル文書内の複数のサンプル文字及び前記複数のサンプル文字のサンプル文字情報を取得するための第3の取得モジュールと、
前記複数のサンプル文字及び前記サンプル文字情報に基づいて、サンプル文字全接続図を生成するための第5の取得モジュールと、
隠された位置の予測文字を生成するために、前記サンプル文字全接続図内のサンプル文字の一部を隠し、隠されたサンプル文字全接続図を前記空間言語モデルに入力して予測を行うための第6の取得モジュールと、
前記隠された位置のサンプル文字及び前記予測文字に基づいて、前記空間言語モデルをトレーニングするための第1のトレーニングモジュールと、を介してトレーニングすることによって得られる、
ことを特徴とする請求項9に記載の文書レイアウト解析装置。 - 前記第3の生成モジュールは、前記複数の文字接続辺の辺タイプを生成するために、前記複数の文字の空間語義特徴及び文字情報を辺タイプ認識モデルに入力することに用いられる、
ことを特徴とする請求項8に記載の文書レイアウト解析装置。 - 前記辺タイプ認識モデルは、
サンプル文書内の複数のサンプル文字及び前記複数のサンプル文字のサンプル文字情報を取得するための第3の取得モジュールと、
前記複数のサンプル文字及び前記サンプル文字情報に基づいてサンプル文字全接続図を生成するための第5の生成モジュールと、
各前記サンプル文字のサンプル空間語義特徴を取得するための第4の取得モジュールはと、
隠された位置の予測辺タイプを生成するために、前記サンプル文字全接続図内のサンプル文字接続辺の一部を隠し、隠されたサンプル文字全接続図及び前記サンプル空間語義特徴を前記辺タイプ認識モデルに入力して予測を行うための第7の生成モジュールと、
前記隠された位置のサンプル文字接続辺タイプ及び前記予測辺タイプに基づいて、前記辺タイプ認識モデルをトレーニングするための第2のトレーニングモジュールと、を介してトレーニングすることによって得られる、
ことを特徴とする請求項11に記載の文書レイアウト解析装置。 - 前記第1の取得モジュールは、前記対象文書内の前記複数の文字を取得するために、前記対象文書を文字検出モデルに入力することに用いられる、
ことを特徴とする請求項8に記載の文書レイアウト解析装置。 - 前記文字検出モデルは、
サンプル文書内の複数のサンプル文字及び前記複数のサンプル文字のサンプル文字情報を取得するための第3の取得モジュールと、
前記複数のサンプル文字及び前記サンプル文字情報に基づいてサンプル文字全接続図を生成するための第5の生成モジュールと、
前記サンプル文字全接続図内の複数の文字頂点のうちの一部の文字頂点にランダム外乱を追加するための追加モジュールと、
予測文字を生成するために、ランダム外乱が追加された後の前記サンプル文字全接続図を前記文字検出モデルに入力して文字予測を行うための第8の生成モジュールと、
前記予測文字及び前記サンプル文書内のサンプル文字に基づいて、前記文字検出モデルをトレーニングするための第3のトレーニングモジュールと、を介してトレーニングすることによって得られる、
ことを特徴とする請求項13に記載の文書レイアウト解析装置。 - 電子機器であって、
少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサに通信可能に接続されるメモリと、を含み、
前記メモリには、前記少なくとも1つのプロセッサによって実行可能な命令が記憶されており、前記命令は、前記少なくとも1つのプロセッサが、前記少なくとも1つのプロセッサによって実行される場合、請求項1〜7のいずれかに記載の文書レイアウト解析方法を実行させる、
ことを特徴とする電子機器。 - コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体であって、
前記コンピュータ命令は、前記コンピュータに請求項1〜7のいずれかに記載の文書レイアウト解析方法を実行させる、
ことを特徴とする非一時的なコンピュータ読み取り可能な記憶媒体。 - コンピュータ上で動作しているときに、請求項1〜7のいずれかに記載の文書レイアウト解析方法を前記コンピュータに実行させる、
ことを特徴とするコンピュータプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010484261.0A CN111832396B (zh) | 2020-06-01 | 2020-06-01 | 文档布局的解析方法、装置、电子设备和存储介质 |
CN202010484261.0 | 2020-06-01 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021131900A true JP2021131900A (ja) | 2021-09-09 |
JP7203897B2 JP7203897B2 (ja) | 2023-01-13 |
Family
ID=72897498
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021089265A Active JP7203897B2 (ja) | 2020-06-01 | 2021-05-27 | 文書レイアウト解析方法、装置、電子機器及び記憶媒体 |
Country Status (5)
Country | Link |
---|---|
US (1) | US11462039B2 (ja) |
EP (1) | EP3920076A1 (ja) |
JP (1) | JP7203897B2 (ja) |
KR (1) | KR20210065076A (ja) |
CN (1) | CN111832396B (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114611499A (zh) * | 2020-12-09 | 2022-06-10 | 阿里巴巴集团控股有限公司 | 信息抽取模型训练方法、信息抽取方法、装置和电子设备 |
CN112579727B (zh) * | 2020-12-16 | 2022-03-22 | 北京百度网讯科技有限公司 | 文档内容的提取方法、装置、电子设备及存储介质 |
US20230008868A1 (en) * | 2021-07-08 | 2023-01-12 | Nippon Telegraph And Telephone Corporation | User authentication device, user authentication method, and user authentication computer program |
CN113657088A (zh) * | 2021-08-16 | 2021-11-16 | 北京百度网讯科技有限公司 | 接口文档解析方法、装置、电子设备以及存储介质 |
CN113836268A (zh) * | 2021-09-24 | 2021-12-24 | 北京百度网讯科技有限公司 | 文档理解方法及装置、电子设备和介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060136491A1 (en) * | 2004-12-22 | 2006-06-22 | Kathrin Berkner | Semantic document smartnails |
WO2007080642A1 (ja) * | 2006-01-13 | 2007-07-19 | Fujitsu Limited | 帳票処理プログラムおよび帳票処理装置 |
US20080317337A1 (en) * | 2007-06-25 | 2008-12-25 | Yizhou Wang | System and method for decomposing a digital image |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4940973B2 (ja) * | 2007-02-02 | 2012-05-30 | 富士通株式会社 | 論理構造認識処理プログラム、論理構造認識処理方法および論理構造認識処理装置 |
CN109800761B (zh) * | 2019-01-25 | 2022-11-11 | 厦门商集网络科技有限责任公司 | 基于深度学习模型创建纸质文档结构化数据的方法和终端 |
US11113518B2 (en) * | 2019-06-28 | 2021-09-07 | Eygs Llp | Apparatus and methods for extracting data from lineless tables using Delaunay triangulation and excess edge removal |
-
2020
- 2020-06-01 CN CN202010484261.0A patent/CN111832396B/zh active Active
- 2020-12-21 US US17/129,531 patent/US11462039B2/en active Active
-
2021
- 2021-01-05 EP EP21150293.5A patent/EP3920076A1/en not_active Withdrawn
- 2021-05-14 KR KR1020210062980A patent/KR20210065076A/ko active IP Right Grant
- 2021-05-27 JP JP2021089265A patent/JP7203897B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060136491A1 (en) * | 2004-12-22 | 2006-06-22 | Kathrin Berkner | Semantic document smartnails |
WO2007080642A1 (ja) * | 2006-01-13 | 2007-07-19 | Fujitsu Limited | 帳票処理プログラムおよび帳票処理装置 |
US20080317337A1 (en) * | 2007-06-25 | 2008-12-25 | Yizhou Wang | System and method for decomposing a digital image |
Also Published As
Publication number | Publication date |
---|---|
CN111832396B (zh) | 2023-07-25 |
EP3920076A1 (en) | 2021-12-08 |
JP7203897B2 (ja) | 2023-01-13 |
US20210374397A1 (en) | 2021-12-02 |
US11462039B2 (en) | 2022-10-04 |
KR20210065076A (ko) | 2021-06-03 |
CN111832396A (zh) | 2020-10-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2021131900A (ja) | 文書レイアウト解析方法、装置、電子機器及び記憶媒体 | |
JP7073241B2 (ja) | 複数のディープ・ラーニング・ニューラル・ネットワークを動的に重み付けすることによるフォント認識の改善 | |
US10664660B2 (en) | Method and device for extracting entity relation based on deep learning, and server | |
JP7299939B2 (ja) | テーブル認識方法及び装置、電子機器、記憶媒体並びにコンピュータプログラム | |
JP2021190087A (ja) | テキスト認識処理方法、装置、電子機器及び記憶媒体 | |
EP3570208A1 (en) | Two-dimensional document processing | |
US8850310B2 (en) | Data entry suggestion lists for designated document data entry areas based on data from other document data entry areas | |
JP7179123B2 (ja) | 言語モデルの訓練方法、装置、電子デバイス及び可読記憶媒体 | |
JP2018190188A (ja) | 要約生成装置、要約生成方法及びコンピュータプログラム | |
JP7164651B2 (ja) | 翻訳方法、装置、電子機器及びコンピュータプログラム製品 | |
JP2021099890A (ja) | 因果関係の判別方法、装置、電子機器及び記憶媒体 | |
US11763583B2 (en) | Identifying matching fonts utilizing deep learning | |
JP2021192289A (ja) | 機械学習モデルの敵対的訓練方法、装置、電子機器及び媒体 | |
EP3855341A1 (en) | Language generation method and apparatus, electronic device and storage medium | |
KR102052606B1 (ko) | 주의 기반 인공 신경망 기계 번역의 상호작용 시각화와 조작을 위한 방법 및 시스템 | |
JP6529698B2 (ja) | データ分析装置およびデータ分析方法 | |
WO2023183096A1 (en) | Self-supervised system for learning a user interface language | |
JP6623885B2 (ja) | オントロジー処理装置及びプログラム | |
KR20160003155A (ko) | 내결함성 입력 방법 편집기 | |
KR102424342B1 (ko) | 섬네일 이미지 생성 방법 및 장치 | |
US20230282013A1 (en) | Automated key-value pair extraction | |
KR101784280B1 (ko) | Gui 테스트 자동화 시스템 및 방법 | |
JP5998779B2 (ja) | 検索装置、検索方法、及びプログラム | |
US20240330592A1 (en) | Information processing apparatus, information processing method, and information processing program | |
US20240249186A1 (en) | Systems and methods for using contrastive pre-training to generate text and code embeddings |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210527 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220609 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220614 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220914 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221213 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221227 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7203897 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |