JP2007172132A - レイアウト解析プログラム、レイアウト解析装置、レイアウト解析方法 - Google Patents
レイアウト解析プログラム、レイアウト解析装置、レイアウト解析方法 Download PDFInfo
- Publication number
- JP2007172132A JP2007172132A JP2005366466A JP2005366466A JP2007172132A JP 2007172132 A JP2007172132 A JP 2007172132A JP 2005366466 A JP2005366466 A JP 2005366466A JP 2005366466 A JP2005366466 A JP 2005366466A JP 2007172132 A JP2007172132 A JP 2007172132A
- Authority
- JP
- Japan
- Prior art keywords
- layout analysis
- extracted
- binary image
- character
- extraction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/414—Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
Abstract
【解決手段】2値画像に基づいて、パターンで区切られた領域の抽出を行い、該抽出の結果を分割領域とする分割領域抽出ステップと、分割領域毎に、第1の2値画像レイアウト解析処理により抽出された文字要素の集合の抽出を行い、文字要素集合とする文字要素集合抽出ステップと、第2の2値画像レイアウト解析処理により抽出された非文字要素に重ならないように、分割領域内で文字要素集合を含む領域の抽出を行い、テキストブロックとするテキストブロック抽出ステップと、テキストブロックと第2の2値画像レイアウト解析処理により抽出された非文字要素とに基づいて、レイアウト情報を生成するレイアウト情報生成ステップとをコンピュータに実行させる。
【選択図】図1
Description
2.2値化処理
3.文字領域の文字認識処理
=矩形分割領域0から矩形分割領域1,3を除いた領域
独立分割領域1
=矩形分割領域1から矩形分割領域2を除いた領域
独立分割領域2
=矩形分割領域2
独立分割領域3
=矩形分割領域3から矩形分割領域4,5を除いた領域
独立分割領域4
=矩形分割領域4
独立分割領域5
=矩形分割領域5
コミック=1800
JEITAのプリンタ用評価画像=10796
雑誌=7475
新聞=4530
オフィス文書(社内レポート)=14634
パンフレット=3514
プレゼンテーション用ページ=2463
論文=16318
2値画像に基づいて、パターンで区切られた領域の抽出を行い、該抽出の結果を分割領域とする分割領域抽出ステップと、
前記分割領域抽出ステップにより抽出された分割領域毎に、第1の2値画像レイアウト解析処理により抽出された文字要素の集合の抽出を行い、該抽出の結果を文字要素集合とする文字要素集合抽出ステップと、
第2の2値画像レイアウト解析処理により抽出された非文字要素に重ならないように、前記文字要素集合抽出ステップにより抽出された前記分割領域内で文字要素集合を含む領域の抽出を行い、該抽出の結果をテキストブロックとするテキストブロック抽出ステップと、
前記テキストブロック抽出ステップにより抽出されたテキストブロックと前記第2の2値画像レイアウト解析処理により抽出された非文字要素とに基づいて、レイアウト情報を生成するレイアウト情報生成ステップと
をコンピュータに実行させるレイアウト解析プログラム。
(付記2) 付記1に記載のレイアウト解析プログラムにおいて、
前記文字要素集合抽出ステップは、更に、前記第2の2値画像レイアウト解析処理により抽出された文字要素のうち前記第1の2値画像レイアウト解析処理により抽出された非文字要素に包含される文字要素を、前記文字要素集合に含めることを特徴とするレイアウト解析プログラム。
(付記3) 付記1または付記2に記載のレイアウト解析プログラムにおいて、
前記テキストブロック抽出ステップは、更に、前記分割領域抽出ステップにより抽出された分割領域内でセパレータを抽出し、該セパレータと前記第2の2値画像レイアウト解析処理により抽出された非文字要素とに重ならないように、前記文字要素集合抽出ステップにより抽出された前記分割領域内で文字要素集合を含む領域の抽出を行い、該抽出の結果をテキストブロックとすることを特徴とするレイアウト解析プログラム。
(付記4) 付記1乃至付記3のいずれかに記載のレイアウト解析プログラムにおいて、
前記テキストブロック抽出ステップは、更に、前記第1の2値画像レイアウト解析処理により抽出された非文字要素がテキストブロックであると判断した場合、該非文字要素をテキストブロックとすることを特徴とするレイアウト解析プログラム。
(付記5) 付記4に記載のレイアウト解析プログラムにおいて、
前記テキストブロック抽出ステップは、更に、前記第1の2値画像レイアウト解析処理により抽出された非文字要素における縦方向の黒画素の分布の周期性と横方向の黒画素の分布の周期性に基づいて、該非文字要素がテキストブロックであるか否かを判断することを特徴とするレイアウト解析プログラム。
(付記6) 付記1乃至付記5のいずれかに記載のレイアウト解析プログラムにおいて、
前記第1の2値画像レイアウト解析処理は、前記第2の2値画像レイアウト解析処理よりも文字要素の抽出の精度が高いことを特徴とするレイアウト解析プログラム。
(付記7) 付記1乃至付記6のいずれかに記載のレイアウト解析プログラムにおいて、
前記第1の2値画像レイアウト解析処理は、カラー画像である原画像に対して第1の2値化処理を行い、該2値化処理により得られる第1の2値画像に対してレイアウト解析を行うものであり、
前記第2の2値画像レイアウト解析処理は、前記原画像に対して前記第1の2値化処理と異なる第2の2値化処理を行い、該2値化処理により得られる第2の2値画像に対してレイアウト解析を行うものであり、
前記分割領域抽出ステップは、前記第2の2値画像に基づいて、前記分割領域の抽出を行うことを特徴とするレイアウト解析プログラム。
(付記8) 付記7に記載のレイアウト解析プログラムにおいて、
前記分割領域抽出ステップは、前記第2の2値画像に対して輝度の反転を行い、該反転により得られる反転2値画像から黒画素の連結した領域を抽出し、該領域に外接する矩形を抽出し、該矩形の中で所定の条件を満たすものを抽出して矩形分割領域とし、矩形分割領域から当該矩形分割領域に包含される矩形分割領域を除いた領域を前記分割領域とすることを特徴とするレイアウト解析プログラム。
(付記9) 付記1乃至付記6のいずれかに記載のレイアウト解析プログラムにおいて、
前記第1の2値画像レイアウト解析処理は、2値画像である原画像に対してレイアウト解析を行うものであり、
前記第2の2値画像レイアウト解析処理は、前記原画像に対して輝度の反転を行い、該反転により得られる反転2値画像に対してレイアウト解析を行うものであり、
前記分割領域抽出ステップは、前記反転2値画像に基づいて、前記分割領域の抽出を行うことを特徴とするレイアウト解析プログラム。
(付記10) 付記9に記載のレイアウト解析プログラムにおいて、
前記分割領域抽出ステップは、前記反転2値画像から黒画素の連結した領域を抽出し、該領域に外接する矩形を抽出し、該矩形の中で所定の条件を満たすものを抽出して矩形分割領域とし、矩形分割領域から当該矩形分割領域に包含される矩形分割領域を除いた領域を前記分割領域とすることを特徴とするレイアウト解析プログラム。
(付記11) 付記1乃至付記10のいずれかに記載のレイアウト解析プログラムにおいて、
前記文字要素は文字矩形であることを特徴とするレイアウト解析プログラム。
(付記12) 画像のレイアウトの解析を行うレイアウト解析装置であって、
2値画像に基づいて、パターンで区切られた領域の抽出を行い、該抽出の結果を分割領域とする分割領域抽出部と、
前記分割領域抽出部により抽出された分割領域毎に、第1の2値画像レイアウト解析処理により抽出された文字要素の集合の抽出を行い、該抽出の結果を文字要素集合とする文字要素集合抽出部と、
第2の2値画像レイアウト解析処理により抽出された非文字要素に重ならないように、前記文字要素集合抽出部により抽出された前記分割領域内で文字要素集合を含む領域の抽出を行い、該抽出の結果をテキストブロックとするテキストブロック抽出部と、
前記テキストブロック抽出部により抽出されたテキストブロックと前記第2の2値画像レイアウト解析処理により抽出された非文字要素とに基づいて、レイアウト情報を生成するレイアウト情報生成部と
を備えるレイアウト解析装置。
(付記13) 付記12に記載のレイアウト解析装置において、
前記文字要素集合抽出部は、更に、前記第2の2値画像レイアウト解析処理により抽出された文字要素のうち前記第1の2値画像レイアウト解析処理により抽出された非文字要素に包含される文字要素を、前記文字要素集合に含めることを特徴とするレイアウト解析装置。
(付記14) 付記12または付記13に記載のレイアウト解析装置において、
前記テキストブロック抽出部は、更に、前記分割領域抽出部により抽出された分割領域内でセパレータを抽出し、該セパレータと前記第2の2値画像レイアウト解析処理により抽出された非文字要素とに重ならないように、前記文字要素集合抽出部により抽出された前記分割領域内で文字要素集合を含む領域の抽出を行い、該抽出の結果をテキストブロックとすることを特徴とするレイアウト解析装置。
(付記15) 付記12乃至付記14のいずれかに記載のレイアウト解析装置において、
前記テキストブロック抽出部は、更に、前記第1の2値画像レイアウト解析処理により抽出された非文字要素がテキストブロックであると判断した場合、該非文字要素をテキストブロックとすることを特徴とするレイアウト解析装置。
(付記16) 付記15に記載のレイアウト解析装置において、
前記テキストブロック抽出部は、更に、前記第1の2値画像レイアウト解析処理により抽出された非文字要素における縦方向の黒画素の分布の周期性と横方向の黒画素の分布の周期性に基づいて、該非文字要素がテキストブロックであるか否かを判断することを特徴とするレイアウト解析装置。
(付記17) 付記12乃至付記16のいずれかに記載のレイアウト解析装置において、
前記第1の2値画像レイアウト解析処理は、前記第2の2値画像レイアウト解析処理よりも文字要素の抽出の精度が高いことを特徴とするレイアウト解析装置。
(付記18) 付記12乃至付記17のいずれかに記載のレイアウト解析装置において、
前記第1の2値画像レイアウト解析処理は、カラー画像である原画像に対して第1の2値化処理を行い、該2値化処理により得られる第1の2値画像に対してレイアウト解析を行うものであり、
前記第2の2値画像レイアウト解析処理は、前記原画像に対して前記第1の2値化処理と異なる第2の2値化処理を行い、該2値化処理により得られる第2の2値画像に対してレイアウト解析を行うものであり、
前記分割領域抽出部は、前記第2の2値画像に基づいて、前記分割領域の抽出を行うことを特徴とするレイアウト解析装置。
(付記19) 付記18に記載のレイアウト解析装置において、
前記分割領域抽出部は、前記第2の2値画像に対して輝度の反転を行い、該反転により得られる反転2値画像から黒画素の連結した領域を抽出し、該領域に外接する矩形を抽出し、該矩形の中で所定の条件を満たすものを抽出して矩形分割領域とし、矩形分割領域から当該矩形分割領域に包含される矩形分割領域を除いた領域を前記分割領域とすることを特徴とするレイアウト解析装置。
(付記20) 画像のレイアウトの解析を行うレイアウト解析方法であって、
2値画像に基づいて、パターンで区切られた領域の抽出を行い、該抽出の結果を分割領域とする分割領域抽出ステップと、
前記分割領域抽出ステップにより抽出された分割領域毎に、第1の2値画像レイアウト解析処理により抽出された文字要素の集合の抽出を行い、該抽出の結果を文字要素集合とする文字要素集合抽出ステップと、
第2の2値画像レイアウト解析処理により抽出された非文字要素に重ならないように、前記文字要素集合抽出ステップにより抽出された前記分割領域内で文字要素集合を含む領域の抽出を行い、該抽出の結果をテキストブロックとするテキストブロック抽出ステップと、
前記テキストブロック抽出ステップにより抽出されたテキストブロックと前記第2の2値画像レイアウト解析処理により抽出された非文字要素とに基づいて、レイアウト情報を生成するレイアウト情報生成ステップと
を実行するレイアウト解析方法。
Claims (10)
- 画像のレイアウトの解析をコンピュータに実行させるレイアウト解析プログラムであって、
2値画像に基づいて、パターンで区切られた領域の抽出を行い、該抽出の結果を分割領域とする分割領域抽出ステップと、
前記分割領域抽出ステップにより抽出された分割領域毎に、第1の2値画像レイアウト解析処理により抽出された文字要素の集合の抽出を行い、該抽出の結果を文字要素集合とする文字要素集合抽出ステップと、
第2の2値画像レイアウト解析処理により抽出された非文字要素に重ならないように、前記文字要素集合抽出ステップにより抽出された前記分割領域内で文字要素集合を含む領域の抽出を行い、該抽出の結果をテキストブロックとするテキストブロック抽出ステップと、
前記テキストブロック抽出ステップにより抽出されたテキストブロックと前記第2の2値画像レイアウト解析処理により抽出された非文字要素とに基づいて、レイアウト情報を生成するレイアウト情報生成ステップと
をコンピュータに実行させるレイアウト解析プログラム。 - 請求項1に記載のレイアウト解析プログラムにおいて、
前記文字要素集合抽出ステップは、更に、前記第2の2値画像レイアウト解析処理により抽出された文字要素のうち前記第1の2値画像レイアウト解析処理により抽出された非文字要素に包含される文字要素を、前記文字要素集合に含めることを特徴とするレイアウト解析プログラム。 - 請求項1または請求項2に記載のレイアウト解析プログラムにおいて、
前記テキストブロック抽出ステップは、更に、前記分割領域抽出ステップにより抽出された分割領域内でセパレータを抽出し、該セパレータと前記第2の2値画像レイアウト解析処理により抽出された非文字要素とに重ならないように、前記文字要素集合抽出ステップにより抽出された前記分割領域内で文字要素集合を含む領域の抽出を行い、該抽出の結果をテキストブロックとすることを特徴とするレイアウト解析プログラム。 - 請求項1乃至請求項3のいずれかに記載のレイアウト解析プログラムにおいて、
前記テキストブロック抽出ステップは、更に、前記第1の2値画像レイアウト解析処理により抽出された非文字要素がテキストブロックであると判断した場合、該非文字要素をテキストブロックとすることを特徴とするレイアウト解析プログラム。 - 請求項1乃至請求項4に記載のレイアウト解析プログラムにおいて、
前記テキストブロック抽出ステップは、更に、前記第1の2値画像レイアウト解析処理により抽出された非文字要素における縦方向の黒画素の分布の周期性と横方向の黒画素の分布の周期性に基づいて、該非文字要素がテキストブロックであるか否かを判断することを特徴とするレイアウト解析プログラム。 - 請求項1乃至請求項5のいずれかに記載のレイアウト解析プログラムにおいて、
前記第1の2値画像レイアウト解析処理は、前記第2の2値画像レイアウト解析処理よりも文字要素の抽出の精度が高いことを特徴とするレイアウト解析プログラム。 - 請求項1乃至請求項6のいずれかに記載のレイアウト解析プログラムにおいて、
前記第1の2値画像レイアウト解析処理は、カラー画像である原画像に対して第1の2値化処理を行い、該2値化処理により得られる第1の2値画像に対してレイアウト解析を行うものであり、
前記第2の2値画像レイアウト解析処理は、前記原画像に対して前記第1の2値化処理と異なる第2の2値化処理を行い、該2値化処理により得られる第2の2値画像に対してレイアウト解析を行うものであり、
前記分割領域抽出ステップは、前記第2の2値画像に基づいて、前記分割領域の抽出を行うことを特徴とするレイアウト解析プログラム。 - 請求項7に記載のレイアウト解析プログラムにおいて、
前記分割領域抽出ステップは、前記第2の2値画像に対して輝度の反転を行い、該反転により得られる反転2値画像から黒画素の連結した領域を抽出し、該領域に外接する矩形を抽出し、該矩形の中で所定の条件を満たすものを抽出して矩形分割領域とし、矩形分割領域から当該矩形分割領域に包含される矩形分割領域を除いた領域を前記分割領域とすることを特徴とするレイアウト解析プログラム。 - 画像のレイアウトの解析を行うレイアウト解析装置であって、
2値画像に基づいて、パターンで区切られた領域の抽出を行い、該抽出の結果を分割領域とする分割領域抽出部と、
前記分割領域抽出部により抽出された分割領域毎に、第1の2値画像レイアウト解析処理により抽出された文字要素の集合の抽出を行い、該抽出の結果を文字要素集合とする文字要素集合抽出部と、
第2の2値画像レイアウト解析処理により抽出された非文字要素に重ならないように、前記文字要素集合抽出部により抽出された前記分割領域内で文字要素集合を含む領域の抽出を行い、該抽出の結果をテキストブロックとするテキストブロック抽出部と、
前記テキストブロック抽出部により抽出されたテキストブロックと前記第2の2値画像レイアウト解析処理により抽出された非文字要素とに基づいて、レイアウト情報を生成するレイアウト情報生成部と
を備えるレイアウト解析装置。 - 画像のレイアウトの解析を行うレイアウト解析方法であって、
2値画像に基づいて、パターンで区切られた領域の抽出を行い、該抽出の結果を分割領域とする分割領域抽出ステップと、
前記分割領域抽出ステップにより抽出された分割領域毎に、第1の2値画像レイアウト解析処理により抽出された文字要素の集合の抽出を行い、該抽出の結果を文字要素集合とする文字要素集合抽出ステップと、
第2の2値画像レイアウト解析処理により抽出された非文字要素に重ならないように、前記文字要素集合抽出ステップにより抽出された前記分割領域内で文字要素集合を含む領域の抽出を行い、該抽出の結果をテキストブロックとするテキストブロック抽出ステップと、
前記テキストブロック抽出ステップにより抽出されたテキストブロックと前記第2の2値画像レイアウト解析処理により抽出された非文字要素とに基づいて、レイアウト情報を生成するレイアウト情報生成ステップと
を実行するレイアウト解析方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005366466A JP4771804B2 (ja) | 2005-12-20 | 2005-12-20 | レイアウト解析プログラム、レイアウト解析装置、レイアウト解析方法 |
US11/384,327 US7711189B2 (en) | 2005-12-20 | 2006-03-21 | Layout analysis program, layout analysis apparatus and layout analysis method |
CNB2006100747956A CN100568263C (zh) | 2005-12-20 | 2006-04-14 | 布局分析设备和布局分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005366466A JP4771804B2 (ja) | 2005-12-20 | 2005-12-20 | レイアウト解析プログラム、レイアウト解析装置、レイアウト解析方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007172132A true JP2007172132A (ja) | 2007-07-05 |
JP4771804B2 JP4771804B2 (ja) | 2011-09-14 |
Family
ID=38173551
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005366466A Expired - Fee Related JP4771804B2 (ja) | 2005-12-20 | 2005-12-20 | レイアウト解析プログラム、レイアウト解析装置、レイアウト解析方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US7711189B2 (ja) |
JP (1) | JP4771804B2 (ja) |
CN (1) | CN100568263C (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010092265A (ja) * | 2008-10-08 | 2010-04-22 | Calsonic Kansei Corp | 表面形状データ作成方法およびこれに用いる表面形状データ作成装置 |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005073015A (ja) * | 2003-08-26 | 2005-03-17 | Canon Inc | 画像処理装置及び画像処理方法及びコンピュータプログラム |
JP4717562B2 (ja) * | 2005-09-02 | 2011-07-06 | キヤノン株式会社 | 画像処理装置及び方法 |
JP4771804B2 (ja) * | 2005-12-20 | 2011-09-14 | 富士通株式会社 | レイアウト解析プログラム、レイアウト解析装置、レイアウト解析方法 |
JP2009031876A (ja) * | 2007-07-24 | 2009-02-12 | Sharp Corp | 画像処理装置およびそれを備えた画像形成装置、画像読取装置、画像処理方法、画像処理プログラム、画像処理プログラムを記録した記録媒体 |
CN101551859B (zh) * | 2008-03-31 | 2012-01-04 | 夏普株式会社 | 图像辨别装置及图像检索装置 |
JP5222126B2 (ja) * | 2008-12-25 | 2013-06-26 | キヤノン株式会社 | 画像処理方法、画像処理装置及びプログラム |
JP4977232B2 (ja) * | 2010-05-12 | 2012-07-18 | 株式会社東芝 | 文字読取結果確認装置および文字読取結果確認方法 |
WO2012127578A1 (ja) * | 2011-03-18 | 2012-09-27 | 富士通株式会社 | 画像処理装置、画像処理方法及び画像処理用コンピュータプログラム |
CN103377379A (zh) * | 2012-04-27 | 2013-10-30 | 佳能株式会社 | 文本检测设备、文本信息提取系统及其方法 |
CN102681986A (zh) * | 2012-05-23 | 2012-09-19 | 董名垂 | 页面即时翻译系统及页面即时翻译方法 |
US8867838B2 (en) * | 2012-09-13 | 2014-10-21 | Xerox Corporation | Method and system for a text data entry from an electronic document |
US9355313B2 (en) * | 2014-03-11 | 2016-05-31 | Microsoft Technology Licensing, Llc | Detecting and extracting image document components to create flow document |
CN104461545B (zh) * | 2014-12-12 | 2018-09-07 | 百度在线网络技术(北京)有限公司 | 将移动终端中内容提供至用户的方法及装置 |
CN104751148B (zh) * | 2015-04-16 | 2018-09-07 | 同方知网数字出版技术股份有限公司 | 一种版式文件中识别科学公式的方法 |
CN107886015B (zh) * | 2016-09-29 | 2021-06-11 | 株式会社理光 | 条形码打印方法以及条形码打印装置 |
CN114595903B (zh) * | 2022-05-10 | 2022-07-29 | 安徽智享云科技有限公司 | 一种基于bim的施工现场布局优化系统及方法 |
CN114722442B (zh) * | 2022-06-08 | 2022-09-09 | 广东三维家信息科技有限公司 | 柜体的布局方法、装置、计算机设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09114923A (ja) * | 1995-10-23 | 1997-05-02 | Ricoh Co Ltd | 領域分割装置 |
JP2001297303A (ja) * | 2000-02-09 | 2001-10-26 | Ricoh Co Ltd | 文書画像認識方法、装置及びコンピュータ読み取り可能な記録媒体 |
JP2002108847A (ja) * | 2000-09-28 | 2002-04-12 | Toshiba Corp | 文書認識装置及び文書認識方法 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59101969A (ja) * | 1982-12-01 | 1984-06-12 | Dainippon Screen Mfg Co Ltd | 2値画像パタ−ンのデ−タ処理方法及び装置 |
US5181255A (en) * | 1990-12-13 | 1993-01-19 | Xerox Corporation | Segmentation of handwriting and machine printed text |
JPH03290774A (ja) * | 1990-04-06 | 1991-12-20 | Fuji Facom Corp | 文書画像の文章領域抽出装置 |
CA2077969C (en) * | 1991-11-19 | 1997-03-04 | Daniel P. Huttenlocher | Method of deriving wordshapes for subsequent comparison |
US5680479A (en) * | 1992-04-24 | 1997-10-21 | Canon Kabushiki Kaisha | Method and apparatus for character recognition |
US5872864A (en) * | 1992-09-25 | 1999-02-16 | Olympus Optical Co., Ltd. | Image processing apparatus for performing adaptive data processing in accordance with kind of image |
US5848184A (en) * | 1993-03-15 | 1998-12-08 | Unisys Corporation | Document page analyzer and method |
DE69519323T2 (de) * | 1994-04-15 | 2001-04-12 | Canon Kk | System zur Seitensegmentierung und Zeichenerkennung |
JP4077919B2 (ja) * | 1998-01-30 | 2008-04-23 | キヤノン株式会社 | 画像処理方法及び装置及びその記憶媒体 |
US6160913A (en) * | 1998-03-25 | 2000-12-12 | Eastman Kodak Company | Method and apparatus for digital halftone dots detection and removal in business documents |
US6360009B2 (en) * | 1998-09-23 | 2002-03-19 | Xerox Corporation | Image segmentation apparatus and method |
US6373981B1 (en) * | 1998-12-21 | 2002-04-16 | Xerox Corporation | Method and apparatus for segmenting data to create mixed raster content planes |
JP2001043312A (ja) | 1999-05-26 | 2001-02-16 | Ricoh Co Ltd | 文書画像処理装置 |
US6941014B2 (en) * | 2000-12-15 | 2005-09-06 | Xerox Corporation | Method and apparatus for segmenting an image using a combination of image segmentation techniques |
JP4771804B2 (ja) * | 2005-12-20 | 2011-09-14 | 富士通株式会社 | レイアウト解析プログラム、レイアウト解析装置、レイアウト解析方法 |
-
2005
- 2005-12-20 JP JP2005366466A patent/JP4771804B2/ja not_active Expired - Fee Related
-
2006
- 2006-03-21 US US11/384,327 patent/US7711189B2/en active Active
- 2006-04-14 CN CNB2006100747956A patent/CN100568263C/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09114923A (ja) * | 1995-10-23 | 1997-05-02 | Ricoh Co Ltd | 領域分割装置 |
JP2001297303A (ja) * | 2000-02-09 | 2001-10-26 | Ricoh Co Ltd | 文書画像認識方法、装置及びコンピュータ読み取り可能な記録媒体 |
JP2002108847A (ja) * | 2000-09-28 | 2002-04-12 | Toshiba Corp | 文書認識装置及び文書認識方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010092265A (ja) * | 2008-10-08 | 2010-04-22 | Calsonic Kansei Corp | 表面形状データ作成方法およびこれに用いる表面形状データ作成装置 |
Also Published As
Publication number | Publication date |
---|---|
JP4771804B2 (ja) | 2011-09-14 |
CN1987895A (zh) | 2007-06-27 |
US20070140560A1 (en) | 2007-06-21 |
CN100568263C (zh) | 2009-12-09 |
US7711189B2 (en) | 2010-05-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4771804B2 (ja) | レイアウト解析プログラム、レイアウト解析装置、レイアウト解析方法 | |
CN111814722B (zh) | 一种图像中的表格识别方法、装置、电子设备及存储介质 | |
US7054485B2 (en) | Image processing method, apparatus and system | |
CA2789813C (en) | Document page segmentation in optical character recognition | |
JP5624004B2 (ja) | ハーフトーンパターンで印刷されたグレーまたは淡色テキストを含む、スキャンされた文書画像を2値化するための方法 | |
US10817559B2 (en) | Image processing apparatus with document similarity processing, and image processing method and storage medium therefor | |
JP3278471B2 (ja) | 領域分割方法 | |
US8693790B2 (en) | Form template definition method and form template definition apparatus | |
US20100033765A1 (en) | Document type classification for scanned bitmaps | |
US6532302B2 (en) | Multiple size reductions for image segmentation | |
KR20120132314A (ko) | 화상 처리 장치, 화상 처리 방법, 및 컴퓨터 판독 가능한 매체 | |
US8538154B2 (en) | Image processing method and image processing apparatus for extracting heading region from image of document | |
CN110598566A (zh) | 图像处理方法、装置、终端和计算机可读存储介质 | |
CN112861865B (zh) | 一种基于ocr技术的辅助审计方法 | |
JP5412903B2 (ja) | 文書画像処理装置、文書画像処理方法および文書画像処理プログラム | |
US20120250105A1 (en) | Method Of Analyzing Digital Document Images | |
JP5049922B2 (ja) | 画像処理装置及び画像処理方法 | |
Kumar et al. | Quad: Quality assessment of documents | |
US8805076B2 (en) | Image processing apparatus, image processing method and computer readable medium | |
Dey et al. | A comparative study of margin noise removal algorithms on marnr: A margin noise dataset of document images | |
JP5517028B2 (ja) | 画像処理装置 | |
JP4731748B2 (ja) | 画像処理装置、方法、プログラム及び記憶媒体 | |
US20220406083A1 (en) | Image processing apparatus, control method thereof, and storage medium | |
JP4587167B2 (ja) | 画像処理装置及び画像処理方法 | |
KR20230062275A (ko) | 문서 분류를 위한 데이터 증강 방법 및 그 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080911 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110315 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110516 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110621 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110621 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140701 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4771804 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |