JP2004038321A - 文書レイアウト解析プログラム、文書レイアウト解析装置および文書レイアウト解析方法 - Google Patents

文書レイアウト解析プログラム、文書レイアウト解析装置および文書レイアウト解析方法 Download PDF

Info

Publication number
JP2004038321A
JP2004038321A JP2002191275A JP2002191275A JP2004038321A JP 2004038321 A JP2004038321 A JP 2004038321A JP 2002191275 A JP2002191275 A JP 2002191275A JP 2002191275 A JP2002191275 A JP 2002191275A JP 2004038321 A JP2004038321 A JP 2004038321A
Authority
JP
Japan
Prior art keywords
line
row
character
rectangle
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002191275A
Other languages
English (en)
Inventor
Noriaki Ozawa
小澤 憲秋
Hiroaki Takebe
武部 浩明
Katsuto Fujimoto
藤本 克仁
Satoshi Naoi
直井 聡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2002191275A priority Critical patent/JP2004038321A/ja
Priority to US10/350,180 priority patent/US7257253B2/en
Priority to CA002417478A priority patent/CA2417478C/en
Priority to CNB031021026A priority patent/CN1264113C/zh
Priority to KR1020030006204A priority patent/KR20040002427A/ko
Publication of JP2004038321A publication Critical patent/JP2004038321A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Artificial Intelligence (AREA)
  • Character Input (AREA)

Abstract

【課題】文書画像で行の途中で複数行に分岐している場合や、括弧内に複数行がある場合であっても、精度良く行や段のレイアウトを解析すること。
【解決手段】文書画像の黒画素連結成分から文字候補要素を生成する文字候補要素生成部104と、行方向に並ぶ複数の文字候補要素について、行方向に対して垂直方向のズレ量が閾値以下の複数の文字候補要素を行候補要素とする横方向行矩形生成部105と、上記垂直方向について、略同長の複数の行候補要素を段候補要素とする横段生成部106とを備えている。
【選択図】   図1

Description

【0001】
【発明の属する技術分野】
本発明は、例えば、帳票に対応する文書画像のレイアウトを解析する文書レイアウト解析プログラム、文書レイアウト解析装置および文書レイアウト解析方法に関するものであり、特に、文書画像で行の途中で複数行に分岐している場合や、括弧内に複数行がある場合であっても、精度良く行や段のレイアウトを解析することができる文書レイアウト解析プログラム、文書レイアウト解析装置および文書レイアウト解析方法に関するものである。
【0002】
【従来の技術】
従来より、文書画像における文字、行等のレイアウトを解析する方法は、例えば、特開平7−192083号公報(文書画像レイアウト解析装置)に開示されており、異なる文字サイズが混在する文書画像について、各文字に対応する外接矩形の面積に基づいて、複数の外接矩形(文字)を文字サイズ別にクラス分けを行い、クラス毎のレイアウト解析結果を、優先度を用いて合成するというものである。
【0003】
また、当該方法では、外接矩形の投影パターンを求め、行の配置の周期性を考慮して行を切り出すことにより、行レイアウトの解析を行っている。
【0004】
【発明が解決しようとする課題】
ところで、前述したように、従来のレイアウト解析方法では、文字サイズの大小に対応可能であるが、外接矩形の投影パターンを用いて行レイアウトの解析を行っているため、図41(a)に示した文書画像10の部分10aのように行の途中で複数行に分岐する場合に精度良く行のレイアウトを解析することができないという問題がある。
【0005】
さらに、従来では、外接矩形の投影パターンを用いて行レイアウトの解析を行っているため、図41(b)に示した文書画像20の部分20aや、図41(c)に示した文書画像30の部分30aのように、括弧内に複数の行が存在する場合にも、精度良く行のレイアウトを解析することができない。
【0006】
これは、括弧の外接矩形が同図縦長であるため、投影パータンに括弧内の複数行が隠れてしまい、括弧に関しては、1行として解析されるためである。
【0007】
本発明は、上記に鑑みてなされたもので、文書画像で行の途中で複数行に分岐している場合や、括弧内に複数行がある場合であっても、精度良く行や段のレイアウトを解析することができる文書レイアウト解析プログラム、文書レイアウト解析装置および文書レイアウト解析方法を提供することを目的とする。
【0008】
【課題を解決するための手段】
上記目的を達成するために、本発明は、コンピュータを、文書画像の黒画素連結成分から文字要素を抽出する文字要素抽出手段、行方向に並ぶ複数の文字要素について、行方向に対して垂直方向のズレ量が閾値以下の複数の文字要素を行要素とする行要素抽出手段、として機能させるための文書レイアウト解析プログラムである。
【0009】
また、本発明は、文書画像の黒画素連結成分から文字要素を抽出する文字要素抽出手段と、行方向に並ぶ複数の文字要素について、行方向に対して垂直方向のズレ量が閾値以下の複数の文字要素を行要素とする行要素抽出手段と、を備えたことを特徴とする。
【0010】
また、本発明は、文書画像の黒画素連結成分から文字要素を抽出する文字要素抽出工程と、行方向に並ぶ複数の文字要素について、行方向に対して垂直方向のズレ量が閾値以下の複数の文字要素を行要素とする行要素抽出工程と、を含むことを特徴とする。
【0011】
かかる発明によれば、文書画像の黒画素連結成分から文字要素を抽出し、行方向に並ぶ複数の文字要素について、行方向に対して垂直方向のズレ量が閾値以下の複数の文字要素を行要素とすることとしたので、文書画像で行の途中で複数行に分岐している場合や、括弧内に複数行がある場合であっても、精度良く行レイアウトを解析することができる。
【0012】
【発明の実施の形態】
以下、図面を参照して本発明にかかる文書レイアウト解析プログラム、文書レイアウト解析装置および文書レイアウト解析方法の一実施の形態について詳細に説明する。
【0013】
図1は、本発明にかかる一実施の形態の構成を示すブロック図である。この図には、例えば、図2(a)〜図2(c)に示した文書画像200、220、240等を解析対象として、文書における行、段等のレイアウトを解析する文書レイアウト解析装置100が図示されている。
【0014】
これらの文書画像200、220および240は、例えば、各種帳票に対応する画像である。文書画像200には、括弧内に複数の行(「取消し」および「取りやめ」)が存在している。
【0015】
文書画像220の場合には、行の途中で複数行(「定めた」および「変更することとした」)に分岐している。文書画像240には、括弧内に複数の行(「中間申告の場合はその税額とし、マイナスの場合は(15)へ記入」)が存在している。
【0016】
この文書レイアウト解析装置100において、入力部101は、解析対象の文書画像(例えば、文書画像200、220およ240等)を入力する機能を備えている。制御部102は、各部を制御するとともに、文書画像における段を確定させるための処理を実行する。
【0017】
黒画素連結成分抽出部103は、文書画像200、220および240(図2(a)、図2(b)および図2(c))のデータに基づいて、連続する黒画素を黒画素連結成分として抽出し、各黒画素連結成分に外接する矩形(以下、外接矩形という)を設定するという黒画素連結成分抽出処理を実行する。
【0018】
文字候補要素生成部104は、黒画素連結成分抽出処理の結果を用いて、文字候補要素を生成するための文字候補要素生成処理を実行する。横方向行矩形生成部105は、文字候補要素生成処理の結果に対して、横方向について行候補としての行矩形を生成するという横方向行矩形生成処理を実行する。
【0019】
横段生成部106は、横方向の行矩形からひとまとまりの横段を生成するという横段生成処理を実行する。縦方向行矩形生成部107は、文字候補要素生成処理の結果に対して、縦方向について行候補としての行矩形を生成するという縦方向行矩形生成処理を実行する。
【0020】
縦段生成部108は、縦方向の行矩形からひとまとまりの縦段を生成するという縦段生成処理を実行する。記憶部109は、各処理の実行結果等を記憶する。出力部110は、各処理の実行結果等を出力する。
【0021】
つぎに、一実施の形態の動作について、図3〜図19に示したフローチャートを参照しつつ説明する。
【0022】
図3に示したステップSA1では、入力部101は、解析対象である文書画像のデータとして、例えば、文書画像200(図2(a)参照)、文書画像220(図2(b)参照)および文書画像240(図2(c)参照)のデータを入力する。
【0023】
ステップSA2では、黒画素連結成分抽出部103は、ステップSA1で入力された文書画像200、220および240のデータに基づいて、連続する黒画素を黒画素連結成分として抽出し、黒画素連結成分に外接する外接矩形を設定するという黒画素連結成分抽出処理を実行する。
【0024】
図28(a)〜図28(c)には、黒画素連結成分抽出処理の結果が図示されている。図28(a)は、文書画像200(図2(a)参照)に対応する黒画素連結成分抽出結果201を示す図である。この黒画素連結成分抽出結果201においては、連続する黒画素成分(文字の全体または一部、括弧や記号の全体または一部等)のそれぞれに外接矩形201a、201b、・・・、201f、201g、201h、・・・が設定されている。
【0025】
図28(b)は、文書画像220(図2(b)参照)に対応する黒画素連結成分抽出結果221を示す図である。この黒画素連結成分抽出結果221においては、連続する黒画素成分のそれぞれに外接矩形221a、221b、・・・が設定されている。
【0026】
図28(c)は、文書画像240(図2(c)参照)に対応する黒画素連結成分抽出結果241を示す図である。この黒画素連結成分抽出結果241においては、連続する黒画素成分のそれぞれに外接矩形241a、241b、241c・・・が設定されている。
【0027】
図3に戻り、ステップSA3では、文字候補要素生成部104は、上述した黒画素連結成分抽出処理の結果(黒画素連結成分抽出結果201、221および241:図28(a)、(b)および(c))を用いて、文字候補要素を生成するための文字候補要素生成処理を実行する。
【0028】
具体的には、図4に示したステップSB1では、文字候補要素生成部104は、重なり矩形統合処理を実行する。この重なり矩形統合処理は、黒画素連結成分抽出処理で抽出された黒画素連結成分の外接矩形を文字候補として、文字サイズが「標準」と「小」(または「小」と「大」)に属する二つの外接矩形が重なり、かつ所定の条件を満たす場合に二つの外接矩形を統合する処理である。
【0029】
図5に示した重なり矩形統合処理において、ステップSC1では、文字候補要素生成部104は、黒画素連結成分抽出結果201、221および241:図28(a)、(b)および(c)における外接矩形201a、201b、・・・、外接矩形221a、221b、・・・、外接矩形241a、241b、・・・(以下、外接矩形群と称する)のそれぞれについて、文字サイズ(「標準」、「小」および「大」)を分類する。
【0030】
ここで、文字サイズは、外接矩形の長辺値を基準に「標準」、「小」および「大」という三種類に分類される。「標準」は、全外接矩形の長辺値の平均を採り、平均値Mに対して0.8M以上〜1.2M以下の範囲内の長辺値を有する外接矩形の文字サイズである。
【0031】
「小」は、平均値Mに対して0.8M未満の長辺値を有する外接矩形の文字サイズである。「大」は、平均値Mに対して1.2Mを超える長辺値を有する外接矩形の文字サイズである。なお、一実施の形態では、外接矩形の長辺値に代えて対角線の長さを用いて文字サイズを分類してもよい。
【0032】
ステップSC2では、文字候補要素生成部104は、黒画素連結成分抽出結果201、221および241:図28(a)、(b)および(c)における外接矩形群から二つの外接矩形を選択する。
【0033】
ステップSC3では、文字候補要素生成部104は、上記二つの外接矩形について重なり(接してる状態も含む)があるか否かを判断する。この判断結果が「No」である場合、ステップSC8では、文字候補要素生成部104は、外接矩形群について全ての外接矩形と比較したか否かを判断し、この場合、判断結果を「No」として、ステップSC2の処理を実行する。
【0034】
一方、ステップSC3の判断結果が「Yes」である場合、ステップSC4では、文字候補要素生成部104は、重なっている二つの外接矩形の文字サイズが「標準」と「小」との組み合わせであるか否かを判断する。
【0035】
ステップSC4の判断結果が「Yes」である場合、ステップSC6では、文字候補要素生成部104は、重なる二つの外接矩形を統合した場合、すなわち、二つの外接矩形に対してさらに外接矩形をとった場合の当該外接矩形が正方形であるか否かを判断する。但し、以後、一実施の形態では、当該外接矩形の縦横比が0.8以上であれば正方形として扱う。
【0036】
ステップSC6の判断結果が「Yes」である場合、ステップSC7では、文字候補要素生成部104は、重なる二つの外接矩形に対してさらに外接矩形をとることにより、二つの外接矩形を一つの外接矩形に統合する。
【0037】
一方、ステップSC4の判断結果が「No」である場合、ステップSC5では、文字候補要素生成部104は、重なっている二つの外接矩形の文字サイズが「小」と「大」との組み合わせであるか否かを判断する。
【0038】
ステップSC5の判断結果が「Yes」である場合、ステップSC6では、文字候補要素生成部104は、上述したように、二つの外接矩形を一つの外接矩形に統合した後の当該外接矩形が正方形であるか否かを判断する。
【0039】
ステップSC6の判断結果が「Yes」である場合、ステップSC7の処理が実行される。また、ステップSC5またはステップSC6の判断結果が「No」である場合、ステップSC8の判断が行われる。
【0040】
重なり矩形統合処理においては、例えば、図28(a)に示した外接矩形201f、201gおよび201hが、図29(a)に示した外接矩形202fに統合される。
【0041】
そして、ステップSC8の判断結果が「Yes」になると、図4に示したステップSB2では、文字候補要素生成部104は、隣接矩形統合処理を実行する。この隣接矩形統合処理は、外接矩形群において重心間のユークリッド距離が互いに最も短い二つの外接矩形を選択し、二つの外接矩形を一つの外接矩形に統合した場合の該外接矩形が正方形である場合、統合後の外接矩形を文字候補とする処理である。
【0042】
具体的には、図6に示したステップSD1では、文字候補要素生成部104は、黒画素連結成分抽出結果201、221および241:図28(a)、(b)および(c)における外接矩形群(重なり矩形統合処理により統合された外接矩形も含む)のそれぞれについて、文字サイズ(「標準」、「小」および「大」)を分類する。
【0043】
ステップSD2では、文字候補要素生成部104は、外接矩形群から二つの外接矩形を選択する。ステップSD3では、文字候補要素生成部104は、上記二つの外接矩形について重心間のユークリッド距離が、他の外接矩形とのユークリッド距離と比較して最も短いか否かを判断する。
【0044】
ステップSD3の判断結果が「No」である場合、ステップSD8では、文字候補要素生成部104は、外接矩形群について全ての外接矩形と比較したか否かを判断し、この場合、判断結果を「No」として、ステップSD2の処理を実行する。
【0045】
一方、ステップSD3の判断結果が「Yes」である場合、ステップSD4では、文字候補要素生成部104は、二つの外接矩形のさらに外接矩形をとった場合の該外接矩形が、他の外接矩形と重なるか否かを判断する。
【0046】
ステップSD4の判断結果が「No」である場合、ステップSD7では、文字候補要素生成部104は、統合後の外接矩形が正方形であるか否かを判断する。
【0047】
ステップSD7の判断結果が「Yes」である場合、ステップSD6では、文字候補要素生成部104は、ステップSD2で選択した二つの外接矩形に対してさらに外接矩形をとることにより、二つの外接矩形を一つの外接矩形に統合する。
【0048】
一方、ステップSD4の判断結果が「Yes」である場合、ステップSD5では、文字候補要素生成部104は、統合後の外接矩形と、該外接矩形と重なるすべての外接矩形とを統合した場合の外接矩形が正方形であるか否かを判断する。
【0049】
ステップSD5の判断結果が「Yes」である場合、ステップSD6では、文字候補要素生成部104は、ステップSD2で選択した二つの外接矩形を一つに統合した外接矩形と、該外接矩形と重なるすべての外接矩形とをさらに一つの外接矩形に統合する。また、ステップSD5またはステップSD7の判断結果が「No」である場合、ステップSD8の判断が行われる。
【0050】
隣接矩形統合処理においては、例えば、図28(c)に示した外接矩形241bおよび241cが、図29(c)に示した外接矩形242bに統合される。
【0051】
そして、ステップSD8の判断結果が「Yes」になると、隣接矩形統合処理が終了し、文字候補要素生成処理が終了する。
【0052】
図29(a)〜図29(c)には、文字候補要素生成処理の結果が図示されている。図29(a)は、黒画素連結成分抽出結果201(図28(a)参照)に対応する文字候補要素生成結果202を示す図である。この文字候補要素生成結果202においては、文字候補要素としての外接矩形202a、202b、・・・、202f、・・・が設定されている。
【0053】
図29(b)は、黒画素連結成分抽出結果221(図28(b)参照)に対応する文字候補要素生成結果222を示す図である。この文字候補要素生成結果222においては、文字候補要素としての外接矩形222a、222b、・・・が設定されている。
【0054】
図29(c)は、黒画素連結成分抽出結果241(図28(c)参照)に対応する文字候補要素生成結果242を示す図である。この文字候補要素生成結果242においては、文字候補要素としての外接矩形242a、242b、・・・が設定されている。
【0055】
上述した文字候補要素生成処理が終了すると、図3に示したステップSA4およびステップSA5の処理と、ステップSA7およびステップSA8の処理とが並列的に実行される。
【0056】
すなわち、ステップSA4では、横方向行矩形生成部105は、横方向行矩形生成処理を実行する。この横方向行矩形生成処理は、文字候補要素生成結果202(図29(a)参照)、文字候補要素生成結果222(図29(b)参照)および文字候補要素生成結果242(図29(c)参照)に対して横方向(図29(a)参照)について行候補としての行矩形(行のまとまりを表す外接矩形)を生成するための処理である。
【0057】
具体的には、図7に示したステップSE1では、横方向行矩形生成部105は、文字サイズ別行候補生成処理を実行する。この文字サイズ別行候補生成処理は、文字サイズ(「標準」、「小」および「大」)別に分類し、文字サイズ別に横方向の行候補を生成するための処理である。
【0058】
すなわち、図8に示したステップSF1では、横方向行矩形生成部105は、文字候補要素生成結果202(図29(a)参照)、文字候補要素生成結果222(図29(b)参照)および文字候補要素生成結果242(図29(c)参照)における外接矩形202a、202b、・・・、202f、・・・、外接矩形222a、222b、・・・、外接矩形242a、242b、・・・のそれぞれについて、文字サイズ(「標準」、「小」および「大」)を分類する。
【0059】
ステップSF2では、横方向行矩形生成部105は、図20に示したように、文字サイズ別に隣の文字を設定する。
【0060】
同図においては、隣の文字は、外接矩形300の重心300aから行方向(横方向)に直線300bを延ばした場合に、直線300bと最初に交わり、かつ外接矩形300と同一の文字サイズである外接矩形302(文字候補)を指す。なお、外接矩形301は、外接矩形302よりも外接矩形300に距離的に近いが、上記条件を満たさないため隣りの文字ではない。
【0061】
ステップSF3では、横方向行矩形生成部105は、各文字(外接矩形)の行方向不安定度Vをつぎの(1)式から計算する。
【数1】
Figure 2004038321
【0062】
例えば、図21に示した外接矩形310の行方向不安定度Vを求める場合、(1)式において、a は、外接矩形310と同一の文字サイズであって行方向でk番目に近い文字に対応する外接矩形311の重心311aと、外接矩形310の重心310aとの距離である。b は外接矩形310のベースライン314(または重心からの行方向延長線でも可)からの距離(ズレ量)である。
【0063】
nは、対象となる外接矩形の数であり、例えば、5である。なお、外接矩形312および313は、外接矩形310と文字サイズが異なる。このように、行方向不安定度Vは、外接矩形310と同一の文字サイズの外接矩形の5個(n=5)について、行方向に対する変動具合を表す。
【0064】
ステップSF4では、横方向行矩形生成部105は、行方向不安定度Vが閾値以下であるか否かを判断し、この判断結果が「No」である場合、ステップSF7の判断を行う。
【0065】
一方、ステップSF4の判断結果が「Yes」である場合、ステップSF5では、横方向行矩形生成部105は、当該文字(外接矩形310:図21参照)と隣の文字(5個分の外接矩形311、・・・・:図21参照)とを関連付ける。
【0066】
ステップSF6では、横方向行矩形生成部105は、関連付けされた文字列の各外接矩形(6個の外接矩形)に対してさらに外接矩形をとり、これを行候補矩形として生成する。
【0067】
ステップSF7では、横方向行矩形生成部105は、文字候補要素生成結果202(図29(a)参照)、文字候補要素生成結果222(図29(b)参照)および文字候補要素生成結果242(図29(c)参照)について、横方向に関する行候補矩形の生成が終了したか否かを判断し、この場合、判断結果を「No」として、ステップSF4の判断を行う。そして、ステップSF7の判断結果が「Yes」になると、文字サイズ別行候補生成処理が終了する。
【0068】
図30(a)〜図30(c)には、横方向の文字サイズ別行候補生成処理の結果が図示されている。図30(a)は、文字候補要素生成結果202(図29(a)参照)に対応する文字サイズ別行候補生成結果203を示す図である。この文字サイズ別行候補生成結果203においては、行候補矩形203a、203b、・・・、203l、・・・が設定されている。
【0069】
図30(b)は、文字候補要素生成結果222(図29(b)参照)に対応する文字サイズ別行候補生成結果223を示す図である。この文字サイズ別行候補生成結果223においては、行候補矩形223a、223b、・・・、223f、・・・が設定されている。
【0070】
図30(c)は、文字候補要素生成結果242(図29(c)参照)に対応する文字サイズ別行候補生成結果243を示す図である。この文字サイズ別行候補生成結果243においては、行候補矩形243a、243b、・・・、243mが設定されている。
【0071】
図7に戻り、ステップSE2では、横方向行矩形生成部105は、行候補統合処理を実行する。この行候補統合処理は、図22(a)および(b)に示したように、文字サイズおよび行候補矩形の重なり具合により、複数の行候補矩形を統合するための処理である。
【0072】
図22(a)に示した行候補矩形320と行候補矩形321とについて、ベースライン320aとベースライン321aとの差d が、閾値(例えば、0.3h)以下である場合には、行候補矩形320と行候補矩形321との外接矩形がとられることにより、両者が統合される。ここで、行候補矩形320と行候補矩形321とは、文字サイズが同じとされている。また、hは、行候補矩形320の高さである。
【0073】
一方、図22(b)に示したように、文字サイズが異なる行候補矩形322と行候補矩形323の場合には、中心線322aと中心線323aとの差d が、閾値(例えば、0.3h)以下である場合には、行候補矩形322と行候補矩形323との外接矩形がとられることにより、両者が統合される。
【0074】
具体的には、図9に示したステップSG1では、横方向行矩形生成部105は、文字サイズ別行候補生成結果203(図30(a)参照)、文字サイズ別行候補生成結果223(図30(b)参照)および文字サイズ別行候補生成結果243(図30(c)参照)における行候補矩形203a、203b、・・・、202l、・・・、行候補矩形223a、223b、・・・、行候補矩形243a、243b、・・・(以下、行候補矩形群と称する)のそれぞれについて、文字サイズ(「標準」、「小」および「大」)を分類する。
【0075】
ステップSG2では、横方向行矩形生成部105は、文字サイズ別行候補生成結果203、223および243:図30(a)、(b)および(c)における行候補矩形群から二つの行候補矩形を選択する。
【0076】
ステップSG3では、横方向行矩形生成部105は、上記二つの行候補矩形について重なりがあるか否かを判断する。この判断結果が「No」である場合、ステップSG9では、横方向行矩形生成部105は、二つの行候補矩形が隣接しているか否かを判断する。ここで、隣接とは、二つの行候補矩形について、重心間のユークリッド距離が閾値以下である状態をいう。
【0077】
ステップSG9の判断結果が「No」である場合、ステップSG7の判断が行われる。ステップSG7では、横方向行矩形生成部105は、行候補矩形群についてすべての行候補矩形と比較したか否かを判断し、この場合、判断結果を「No」として、ステップSG2の処理を実行する。
【0078】
一方、ステップSG9の判断結果が「Yes」である場合、ステップSG10では、横方向行矩形生成部105は、二つの行候補矩形の文字サイズが等しいか否かを判断する。
【0079】
ステップSG10の判断結果が「No」である場合、ステップSG12では、横方向行矩形生成部105は、図22(b)を参照して説明したように、二つの行候補矩形(但し、重なっていない)の各中心線の差(d2 )が閾値(例えば、0.3h)以下であるか否かを判断し、この判断結果が「No」である場合、二つの行候補矩形の統合を行わず、ステップSG7の判断を行う。
【0080】
一方、ステップSG12の判断結果が「Yes」である場合、ステップSG6では、横方向行矩形生成部105は、二つの行候補矩形について外接矩形をとり、該外接矩形を統合後の行候補矩形とする。
【0081】
また、ステップSG10の判断結果が「Yes」である場合、ステップSG11では、横方向行矩形生成部105は、図22(a)を参照して説明したように、二つの行候補矩形(但し、重なっていない)のベースラインの差(d1 )が閾値(例えば、0.3h)以下であるか否かを判断し、この判断結果が「No」である場合、二つの行候補矩形の統合を行わず、ステップSG7の判断を行う。
【0082】
一方、ステップSG11の判断結果が「Yes」である場合、ステップSG6では、横方向行矩形生成部105は、二つの行候補矩形について外接矩形をとり、該外接矩形を統合後の行候補矩形とする。
【0083】
また、ステップSG3の判断結果が「Yes」である場合、ステップSG4では、横方向行矩形生成部105は、二つの行候補矩形の文字サイズが等しいか否かを判断する。
【0084】
ステップSG4の判断結果が「Yes」である場合、ステップSG5では、横方向行矩形生成部105は、図22(a)を参照して説明したように、二つの行候補矩形のベースラインの差(d1 )が閾値(例えば、0.3h)以下であるか否かを判断し、この判断結果が「No」である場合、二つの行候補矩形の統合を行わず、ステップSG7の判断を行う。
【0085】
一方、ステップSG5の判断結果が「Yes」である場合、ステップSG6では、横方向行矩形生成部105は、二つの行候補矩形について外接矩形をとり、該外接矩形を統合後の行候補矩形とする。
【0086】
また、ステップSG4の判断結果が「No」である場合、ステップSG8では、横方向行矩形生成部105は、図22(b)を参照して説明したように、二つの行候補矩形の各中心線の差(d2 )が閾値(例えば、0.3h)以下であるか否かを判断し、この判断結果が「No」である場合、二つの行候補矩形の統合を行わず、ステップSG7の判断を行う。
【0087】
一方、ステップSG8の判断結果が「Yes」である場合、ステップSG6では、横方向行矩形生成部105は、二つの行候補矩形について外接矩形をとり、該外接矩形を統合後の行候補矩形とする。
【0088】
図32(a)〜図32(c)には、横方向の行候補統合処理の結果が図示されている。図32(a)は、文字サイズ別行候補生成結果203(図30(a)参照)に対応する行候補統合結果205を示す図である。この行候補統合結果205においては、行候補矩形205a、205b、・・・、205fが設定されている。
【0089】
図32(b)は、文字サイズ別行候補生成結果223(図30(b)参照)に対応する行候補統合結果225を示す図である。この行候補統合結果225においては、行候補矩形225a、225b、・・・、225dが設定されている。
【0090】
図32(c)は、文字サイズ別行候補生成結果243(図30(c)参照)に対応する行候補統合結果245を示す図である。この行候補統合結果245においては、行候補矩形245a、245b、・・・、245iが設定されている。
【0091】
そして、ステップSG7の判断結果が「Yes」になると、図7に示したステップSE3では、横方向行矩形生成部105は、長行切断処理を実行する。この長行切断処理は、行候補統合処理で長い行候補矩形が生成される場合があるため、長い行候補矩形を適切な位置で切断するための処理である。
【0092】
はじめに、図10および図23を参照して、行候補矩形における文字間隔が大きく変化している位置で行を切断するための長行切断処理について説明する。
【0093】
図23に示した行候補矩形336は、文字(文字候補要素)330、331、332、333、334および335を含んでいる。文字332は、k−1番目の文字である。文字333は、k番目の文字である。
【0094】
長行切断処理においては、例えば、文字332と文字333との文字間隔gk が、つぎの(2)式から得られる平均文字間隔Gの1.75倍を超えた場合に、行候補矩形336を文字332と文字333との間で切断される。
【数2】
Figure 2004038321
【0095】
(2)式において、平均文字間隔Gは、例えば、行候補矩形336における文字間隔g (n=1〜k−1)の平均値である。
【0096】
具体的には、図10に示したステップSH1では、横方向行矩形生成部105は、行(行候補矩形)に含まれる文字をソートする。ステップSH2では、横方向行矩形生成部105は、文字が1文字目であるか否かを判断し、この場合、判断結果を「Yes」とする。
【0097】
ステップSH9では、横方向行矩形生成部105は、当該行(行候補矩形)の次の文字を選択する。ステップSH2では、横方向行矩形生成部105は、判断結果を「No」とする。ステップSH3では、横方向行矩形生成部105は、前の文字と当該文字との文字間隔gを求める。ステップSH4では、横方向行矩形生成部105は、当該文字が2文字目であるか否かを判断する。
【0098】
ステップSH4の判断結果が「Yes」である場合、ステップSH8では、横方向行矩形生成部105は、1文字目と2文字目との間の文字間隔gが、1文字目の幅の10倍以上であるか否かを判断する。ステップSH8の判断結果が「No」である場合、ステップSH9の処理が実行される。
【0099】
一方、ステップSH8の判断結果が「Yes」である場合、ステップSH6では、横方向行矩形生成部105は、現在の文字と前の文字との間で行候補矩形を切断し、現在の文字を1文字目とする。ステップSH7では、行候補矩形につぎの文字があるか否かを判断し、この場合、判断結果を「Yes」とする。以後、ステップSH2以降が繰り返される。
【0100】
ここで、ステップSH4の判断結果が「No」である場合、ステップSH5では、横方向行矩形生成部105は、二つの文字についての文字間隔gが、上述した(2)式から求められる平均文字間隔Gの1.75倍を超えているか否かを判断する。ステップSH5の判断結果が「No」である場合、ステップSH9の処理が実行される。
【0101】
一方、ステップSH5の判断結果が「Yes」である場合、ステップSH6では、横方向行矩形生成部105は、現在の文字と前の文字との間で行候補矩形を切断し、現在の文字を1文字目とする。そして、ステップSH7の判断結果が「No」になると、長行切断処理が終了する。
【0102】
つぎに、図11および図24を参照して、着目している行(行候補矩形)が他の行(行候補矩形)と重なっている場合に着目している行(行候補矩形)を切断するための長行切断処理について説明する。なお、図11に示した長行切断処理と図10に示した長行切断処理とは、並列的に実行される。
【0103】
図24(a)に示した行候補矩形340は、文字(文字候補要素)341、342、343、344および345を含んでおり、行候補矩形346と重なっている。行候補矩形346は、文字(文字候補要素)347および348を含んでいる。
【0104】
また、行候補矩形340に含まれる文字が、他の行候補矩形346と重なっていないという条件では、行候補矩形340は、図24(b)に示したように、行候補矩形346の位置で行候補矩形350と行候補矩形370とに切断される。行候補矩形350は、文字341、342および343を含んでいる。一方、行候補矩形370は、文字344および345を含んでいる。
【0105】
具体的には、図11に示したステップSI1では、横方向行矩形生成部105は、行候補矩形群から二つの行候補矩形を選択する。ステップSI2では、横方向行矩形生成部105は、二つの行候補矩形のうち一方を行候補矩形a、他方を行候補矩形bとする。
【0106】
ステップSI3では、横方向行矩形生成部105は、行候補矩形aと行候補矩形bとが重なるか否かを判断する。ステップSI3の判断結果が「No」である場合、ステップSI6では、横方向行矩形生成部105は、行候補矩形群についてすべての行候補矩形と比較したか否かを判断し、この場合、判断結果を「No」とする。
【0107】
一方、ステップSI3の判断結果が「Yes」である場合(図24(a)参照)、ステップSI4では、横方向行矩形生成部105は、行候補矩形aに含まれる文字が、行候補矩形bに含まれる文字と重なるか否かを判断する。ステップSI4の判断結果が「Yes」である場合、ステップSI6の判断が行われる。
【0108】
一方、ステップSI4の判断結果が「No」である場合、ステップSI5では、横方向行矩形生成部105は、行候補矩形bに含まれる最初の文字よりも行候補矩形aに含まれる文字の座標が大きい場合、一つ前の文字(図24(a)の場合、文字343)との間で、行候補矩形を切断し、二つの行候補矩形を生成し、ステップSI6の判断を行う。
【0109】
そして、ステップSI6の判断結果が「Yes」になると、長行切断処理が終了する。
【0110】
図34(a)〜図34(c)には、横方向の長行切断処理の結果が図示されている。図34(a)は、行候補統合結果205(図32(a)参照)に対応する長行切断結果207を示す図である。この長行切断結果207においては、行候補矩形207a、207b、・・・、207hが設定されている。
【0111】
図34(b)は、行候補統合結果225(図32(b)参照)に対応する長行切断結果227を示す図である。この長行切断結果227においては、行候補矩形227a、227b、・・・、227eが設定されている。
【0112】
図34(c)は、行候補統合結果245(図32(c)参照)に対応する長行切断結果247を示す図である。この長行切断結果247においては、行候補矩形247a、247b、・・・、247jが設定されている。
【0113】
図7に示したステップSE4では、横方向行矩形生成部105は、上述した長行切断処理の結果(長行切断結果207、227および247:図34(a)、図34(b)および図34(c))における行候補矩形群を用いて、短行統合処理を実行する。この短行統合処理は、図25(a)および図25(b)に示したように、隣接する二つの短い行候補矩形を一つの行候補矩形に統合するための処理である。
【0114】
具体的には、図12に示したステップSJ1では、横方向行矩形生成部105は、図25(a)に示したように、行候補矩形380、381、382および383からなる段について、各行候補矩形の行方向長さを求めた後、行方向長さの最頻値wmaxを求める。この最頻値wmaxは、上記段の行方向長さにほぼ近い値である。
【0115】
ステップSJ2では、横方向行矩形生成部105は、段において行方向に隣り合う二つの行候補矩形を選択する。図25(a)の場合には、行候補矩形381および行候補矩形382が選択される。
【0116】
ステップSJ3では、横方向行矩形生成部105は、ステップSJ2で選択した二つの行候補矩形を一つの行候補矩形に統合した場合の行方向長さwを求める。ステップSJ4では、横方向行矩形生成部105は、行方向長さwが、最頻値wmaxの1.2倍未満であるか否かを判断する。
【0117】
ステップSJ4の判断結果が「Yes」である場合、ステップSJ5では、横方向行矩形生成部105は、図25(a)に示した行候補矩形381および行候補矩形382を、図25(b)に示した行候補矩形384に統合する。
【0118】
ステップSJ6では、横方向行矩形生成部105は、すべての行候補矩形と比較したか否かを判断し、この判断結果が「No」である場合、ステップSJ2の処理を実行する。なお、ステップSJ4の判断結果が「No」である場合には、ステップSJ6の判断が行われる。
【0119】
図36(a)〜図36(c)には、横方向の短行統合処理の結果が図示されている。図36(a)は、長行切断結果207(図34(a)参照)に対応する短行統合結果209を示す図である。この短行統合結果209においては、行候補矩形209a、209b、・・・、209gが設定されている。例えば、行候補矩形209gは、図34(a)に示した行候補矩形207gおよび207hが統合されたものである。
【0120】
図36(b)は、長行切断結果227(図34(b)参照)に対応する短行統合結果229を示す図である。この短行統合結果229においては、行候補矩形229a、229b、・・・、229eが設定されている。
【0121】
図36(c)は、長行切断結果247(図34(c)参照)に対応する短行統合結果249を示す図である。この短行統合結果249においては、行候補矩形249a、249b、・・・、249jが設定されている。
【0122】
そして、ステップSJ6の判断結果が「Yes」になると、横方向の短行統合処理が終了し、図7に示した横方向行矩形生成処理も終了する。図3に示したステップSA5では、横段生成部106は、上述した横方向の短行統合処理の結果(短行統合結果209、229および249:図36(a)、図36(b)および図36(c))における行候補矩形群を用いて、垂直方向の複数の行候補矩形をひとまとまりの横段とする横段生成処理を実行する。
【0123】
具体的には、図13に示したステップSK1では、横段生成部106は、行候補矩形群について、ある程度同じ長さの複数の行候補矩形を同じ横段に属する行候補矩形として統合するための同長行統合処理を実行する。
【0124】
すなわち、図14に示したステップSL1では、横段生成部106は、行候補矩形群について、行候補矩形の行垂直方向に隣り合う二つの行候補矩形を選択する。ステップSL2では、横段生成部106は、二つの行候補矩形について横方向行の長さの比が1.1倍以下(ほぼ同長)であるか否かを判断する。
【0125】
ステップSL2の判断結果が「No」である場合、ステップSL5では、横段生成部106は、行候補矩形群についてすべての行候補矩形と比較したか否かを判断し、この場合、判断結果を「No」として、ステップSL1の処理を実行する。
【0126】
一方、ステップSL2の判断結果が「Yes」である場合、ステップSL3では、横段生成部106は、二つの行候補矩形について行間が行高さの3倍以下であるか否かを判断し、この判断結果が「No」である場合、ステップSL5の判断を行う。
【0127】
一方、ステップSL3の判断結果が「Yes」である場合、ステップSL4では、横段生成部106は、二つの行候補矩形を同じ横段に属する行候補矩形として統合する。以後、ステップSL5の判断結果が「Yes」になるまで、上述した動作が繰り返される。
【0128】
そして、ステップSL5の判断結果が「Yes」になると、同長行統合処理が終了する。図13に示したステップSK2では、横段生成部106は、上述した同長行統合処理の結果を用いて、段隣接行統合処理を実行する。
【0129】
この段隣接行統合処理は、図26(a)に示したように、段矩形391と、段矩形391に隣接する行矩形392とを段矩形390として統合するための処理である。段矩形391は、同長行統合処理で統合された複数の行から構成されている。
【0130】
すなわち、図15に示したステップSM1では、横段生成部106は、図26(a)に示したように、行垂直方向に隣り合う段矩形391と行矩形392とを選択する。
【0131】
ステップSM2では、横段生成部106は、行矩形392を段矩形391に統合した後の段矩形390が、他の行矩形と重なるか否かを判断し、この場合、判断結果を「No」とする。
【0132】
ステップSM3では、横段生成部106は、行矩形392を段矩形391に統合し、行矩形392と段矩形391との外接矩形をとり、これを段矩形390とする。ステップSM4では、横段生成部106は、全ての行候補矩形と比較したか否かを判断し、この場合、判断結果を「No」として、ステップSM1の処理を実行する。
【0133】
ステップSM1では、横段生成部106は、図26(b)に示したように、行垂直方向に隣り合う段矩形393と行矩形394とを選択する。
【0134】
ステップSM2では、横段生成部106は、行矩形394を段矩形393に統合した後の段矩形396が、他の行矩形と重なるか否かを判断し、この場合には、段矩形396が行矩形395と重なるため、判断結果を「Yes」とし、ステップSM4の判断を行う。この場合には、行矩形394と段矩形393とが統合されない。
【0135】
そして、ステップSM4の判断結果が「Yes」になると、段隣接行統合処理が終了する。図13に示したステップSK3では、横段生成部106は、上述した段隣接行統合処理の結果を用いて、中央揃え行統合処理を実行する。
【0136】
この中央揃え行統合処理は、図27に示したように行候補矩形400と、行候補矩形400に隣接する行候補矩形401とが中央揃えの位置関係にある場合、行候補矩形400と行候補矩形401とを同じ段に属するものとして統合するための処理である。
【0137】
すなわち、図16に示したステップSO1では、横段生成部106は、図27に示したように、行垂直方向に隣り合いかつ同じ文字サイズの行候補矩形400と行候補矩形401とを選択する。
【0138】
ステップSO2では、横段生成部106は、行候補矩形400の重心400aと、行候補矩形401の重心401aとの行方向の差d(垂線400bと垂線401bとの間の距離)が、行候補矩形400の高さhよりも小さいか否かを判断する。
【0139】
ステップSO2の判断結果が「Yes」である場合、ステップSO3では、横段生成部106は、行候補矩形400と行候補矩形401とが同じ段に属するとして、両者を統合し、行候補矩形400と行候補矩形401との外接矩形をとり、これを段矩形とする。
【0140】
一方、ステップSO2の判断結果が「No」である場合、ステップSO4では、横段生成部106は、全ての行候補矩形と比較したか否かを判断し、この場合、判断結果を「No」として、ステップSO1の処理を実行する。
【0141】
そして、ステップSO4の判断結果が「Yes」になると、中央揃え行統合処理が終了し、図13に示した横段生成処理が終了する。
【0142】
図38(a)〜図38(c)には、横段生成処理の結果が図示されている。図38(a)は、短行統合結果209(図36(a)参照)に対応する横段生成結果211を示す図である。
【0143】
この横段生成結果211においては、横方向の段矩形211a、・・・が設定されている。段矩形211aは、図36(a)に示した行候補矩形209cおよび209dが統合されたものである。
【0144】
図38(b)は、短行統合結果229(図36(b)参照)に対応する横段生成結果231を示す図である。この横段生成結果231においては、横方向の段矩形231a、・・・が設定されている。段矩形231aは、図36(b)に示した行候補矩形229cおよび229dが統合されたものである。
【0145】
図38(c)は、短行統合結果249(図36(c)参照)に対応する横段生成結果251を示す図である。この横段生成結果251においては、横方向の段矩形251a、251b、・・・が設定されている。
【0146】
段矩形251aは、図36(c)に示した行候補矩形249a、249b、249cおよび249dが統合されたものである。また、段矩形251bは、図36(c)に示した行候補矩形249e、249f、249gおよび249hが統合されたものである。
【0147】
また、上述した横方向行矩形生成処理(ステップSA4)および横段生成処理(ステップSA5)の実行中においては、並列的に、縦方向行矩形生成処理(ステップSA7)および縦段生成処理(ステップSA8)が実行される。
【0148】
すなわち、ステップSA7では、縦方向行矩形生成部107は、縦方向行矩形生成処理を実行する。この縦方向行矩形生成処理は、文字候補要素生成結果202(図29(a)参照)、文字候補要素生成結果222(図29(b)参照)および文字候補要素生成結果242(図29(c)参照)に対して縦方向(図29(a)参照)について行候補としての行矩形を生成するための処理である。
【0149】
具体的には、図17に示したステップSP1では、縦方向行矩形生成部107は、ステップSE1(図7参照)と同様(但し、縦方向についての処理)に、文字サイズ別行候補生成処理を実行する。
【0150】
図31(a)〜図31(c)には、縦方向の文字サイズ別行候補生成処理の結果が図示されている。図31(a)は、文字候補要素生成結果202(図29(a)参照)に対応する文字サイズ別行候補生成結果204を示す図である。この文字サイズ別行候補生成結果204においては、行候補矩形204a、204b、・・・が設定されている。
【0151】
図31(b)は、文字候補要素生成結果222(図29(b)参照)に対応する文字サイズ別行候補生成結果224を示す図である。この文字サイズ別行候補生成結果224においては、行候補矩形224a、224b、・・・が設定されている。
【0152】
図31(c)は、文字候補要素生成結果242(図29(c)参照)に対応する文字サイズ別行候補生成結果244を示す図である。この文字サイズ別行候補生成結果244においては、行候補矩形244a、244b、・・・が設定されている。
【0153】
図17に戻り、ステップSP2では、縦方向行矩形生成部107は、ステップSE2(図7参照)と同様(但し、縦方向についての処理)にして、行候補統合処理を実行する。
【0154】
図33(a)〜図33(c)には、縦方向の行候補統合処理の結果が図示されている。図33(a)は、文字サイズ別行候補生成結果204(図31(a)参照)に対応する行候補統合結果206を示す図である。この行候補統合結果206においては、行候補矩形206a、206b、・・・が設定されている。
【0155】
図33(b)は、文字サイズ別行候補生成結果224(図31(b)参照)に対応する行候補統合結果226を示す図である。この行候補統合結果226においては、行候補矩形226a、226b、・・・が設定されている。
【0156】
図33(c)は、文字サイズ別行候補生成結果244(図31(c)参照)に対応する行候補統合結果246を示す図である。この行候補統合結果246においては、行候補矩形246a、246b、・・・が設定されている。
【0157】
図17に戻り、ステップSP3では、縦方向行矩形生成部107は、ステップSE3(図7参照)と同様(但し、縦方向についての処理)にして、長行切断処理を実行する。
【0158】
図35(a)〜図35(c)には、縦方向の長行切断処理の結果が図示されている。図35(a)は、行候補統合結果206(図33(a)参照)に対応する長行切断結果208を示す図である。この長行切断結果208においては、行候補矩形208a、208b、・・・が設定されている。
【0159】
図35(b)は、行候補統合結果226(図33(b)参照)に対応する長行切断結果228を示す図である。この長行切断結果228においては、行候補矩形228a、228b、・・・が設定されている。
【0160】
図35(c)は、行候補統合結果246(図33(c)参照)に対応する長行切断結果248を示す図である。この長行切断結果248においては、行候補矩形248a、248b、・・・が設定されている。
【0161】
図17に戻り、ステップSP4では、縦方向行矩形生成部107は、ステップSE4(図7参照)と同様(但し、縦方向についての処理)にして、短行統合処理を実行する。
【0162】
図37(a)〜図37(c)には、縦方向の短行統合処理の結果が図示されている。図37(a)は、長行切断結果208(図35(a)参照)に対応する短行統合結果210を示す図である。この短行統合結果210においては、行候補矩形210a、210b、・・・が設定されている。
【0163】
図37(b)は、長行切断結果228(図35(b)参照)に対応する短行統合結果230を示す図である。この短行統合結果230においては、行候補矩形230a、230b、・・・が設定されている。
【0164】
図37(c)は、長行切断結果248(図35(c)参照)に対応する短行統合結果250を示す図である。この短行統合結果250においては、行候補矩形250a、250b、・・・が設定されている。
【0165】
そして、縦方向の短行統合処理が終了すると、図17に示した縦方向行矩形生成処理も終了する。図3に示したステップSA8では、縦段生成部108は、上述した縦方向の短行統合処理の結果(短行統合結果210、230および250:図37(a)、図37(b)および図37(c))における行候補矩形群を用いて、水平方向の複数の行候補矩形をひとまとまりの縦段とする縦段生成処理を実行する。
【0166】
具体的には、図18に示したステップSQ1では、縦段生成部108は、ステップSK1(図13参照)と同様(但し、縦方向についての処理)にして、同長行統合処理を実行する。
【0167】
ステップSQ2では、縦段生成部108は、ステップSK2(図13参照)と同様(但し、縦方向についての処理)にして、上記同長行統合処理の結果を用いて、段隣接行統合処理を実行する。
【0168】
ステップSQ3では、縦段生成部108は、ステップSK3(図13参照)と同様(但し、縦方向についての処理)にして、上記段隣接行統合処理の結果を用いて、中央揃え行統合処理を実行する。
【0169】
図39(a)〜図39(c)には、縦段生成処理の結果が図示されている。図39(a)は、短行統合結果210(図37(a)参照)に対応する縦段生成結果212を示す図である。この縦段生成結果212においては、縦方向の段矩形212a、・・・が設定されている。
【0170】
図39(b)は、短行統合結果230(図37(b)参照)に対応する縦段生成結果232を示す図である。この縦段生成結果232においては、縦方向の段矩形232a、・・・が設定されている。
【0171】
図39(c)は、短行統合結果250(図37(c)参照)に対応する縦段生成結果252を示す図である。この縦段生成結果252においては、縦方向の段矩形252a、・・・が設定されている。
【0172】
図3に戻り、ステップSA6では、制御部102は、段確定処理を実行する。この段確定処理は、横段生成結果211、231および251(図38(a)、(b)および(c))と、縦段生成結果212、232および252(図39(a)、(b)および(c))とに基づいて、縦段と横段とが重なる部分について、段の範囲と行方向とを確定させるための処理である。
【0173】
具体的には、図19に示したステップSR1では、制御部102は、縦段生成結果から縦段(縦方向の段矩形)と、横段生成結果から横段(横方向の段矩形)とを一つずつ選択する。ステップSR2では、制御部102は、縦段と横段とで領域の重なりがあるか否かを判断する。
【0174】
ステップSR2の判断結果が「No」である場合、ステップSR10では、制御部102は、すべての段を比較したか否かを判断し、この場合、判断結果を「No」として、ステップSR1の処理を実行する。
【0175】
一方、ステップSR2の判断結果が「Yes」である場合、ステップSR3では、制御部102は、縦段と横段との領域が完全に一致するか否かを判断する。この判断結果が「Yes」である場合、ステップSR11では、制御部102は、縦段、横段のうち行数が少ない方を段として採用(行方向推定処理)し、採用されなかった方を破棄する。例えば、横段が採用された場合、段の行方向は、横方向である。
【0176】
ステップSR9では、制御部102は、段に関して切断・破棄・統合が発生したか否かを判断し、この場合、判断結果を「Yes」として、ステップSR1の処理を実行する。
【0177】
一方、ステップSR3の判断結果が「No」である場合、ステップSR4では、制御部102は、縦段、横段において縦段(または横段)が完全に一方に含まれるか否かを判断する。
【0178】
ステップSR4の判断結果が「Yes」である場合、ステップSR12では、制御部102は、縦段、横段のうち含まれるほうの段を破棄し、含むほうの段を採用する。例えば、横段が採用された場合、段の行方向は、横方向である。
【0179】
一方、ステップSR4の判断結果が「No」である場合、ステップSR5では、制御部102は、縦段と横段とが重なる部分を行単位で切断可能であるか否かを判断する。
【0180】
ステップSR5の判断結果が「Yes」である場合、ステップSR6では、制御部102は、切断可能な段を切断する。また、ステップSR5の判断結果が「No」である場合、ステップSR7では、制御部102は、縦段と横段とが重なる部分が縦段、横段の50%以上を占めるか否か、すなわち、重なりが大きいか否かを判断し、この判断結果が「No」である場合、ステップSR9の判断を行う。
【0181】
一方、ステップSR7の判断結果が「Yes」である場合、ステップSR8では、制御部102は、縦段と横段とを統合する。そして、ステップSR10の判断結果が「Yes」またはステップSR9の判断結果が「No」になると、制御部102は、段確定結果や上述した各結果を記憶部109に記憶させた後、段確定処理を終了する。
【0182】
以上説明したように、一実施の形態によれば、文書画像の黒画素連結成分から文字候補要素を文字候補要素生成部104で生成し、図21に示したように、行方向に並ぶ複数の外接矩形310、・・・(文字候補要素)について、行方向に対して垂直方向のズレ量が閾値以下の複数の外接矩形(文字候補要素)を行候補矩形340(行要素)とすることとしたので、文書画像(文書画像200、220および240等)で行の途中で複数行に分岐している場合や、括弧内に複数行がある場合であっても、精度良く行レイアウトを解析することができる。
【0183】
また、一実施の形態によれば、図8を参照して説明したように、文字サイズ別に、行方向に並ぶ複数の外接矩形(文字候補要素)を分類し、行方向に対して垂直方向のズレ量が閾値以下の複数の外接矩形(文字候補要素)を行候補矩形(行要素)とすることとしたので、文書画像に複数種類の文字サイズが存在する場合であっても、精度良く行レイアウトを解析することができる。
【0184】
また、一実施の形態によれば、図22(a)および図22(b)を参照して説明したように、隣接する二つの行候補矩形(行要素)について、行方向に対して垂直方向のズレ量が閾値以下である場合、二つの行候補矩形を一つの行候補矩形として統合することとしたので、隣接する行候補矩形について精度良く行レイアウトを解析することができる。
【0185】
また、一実施の形態によれば、図23を参照して説明したように、行候補矩形(行要素)に含まれる複数の文字(文字候補要素)について、間隔が所定以上である場合、当該文字の位置より行候補矩形を二つに切断することとしたので、長すぎる行候補矩形を適切な長さに分けることができる。
【0186】
また、一実施の形態によれば、図24(a)および図24(b)を参照して説明したように、垂直方向において、行候補矩形340が他の行候補矩形346と重なっており、行候補矩形340に含まれる文字が他の行候補矩形346と重ならない場合、行候補矩形340を二つ(行候補矩形350および行候補矩形370)に切断することとしたので、行候補矩形を適切な位置で分けることができる。
【0187】
また、一実施の形態によれば、図25(a)および図25(b)を参照して説明したように、行方向に隣接する二つの行候補矩形381および行候補矩形382の長さが、垂直方向に隣接する他の行候補矩形380の長さと略同じである場合、二つの行候補矩形381および行候補矩形382を一つの行候補矩形384に統合することとしたので、短すぎる行候補矩形を適切な長さにすることができる。
【0188】
また、一実施の形態によれば、図14を参照して説明したように、垂直方向について、略同長の複数の行候補矩形を段矩形(段要素)とすることとしたので、文書画像で行の途中で複数行に分岐している場合や、括弧内に複数行がある場合であっても、精度良く段レイアウトを解析することができる。
【0189】
また、一実施の形態によれば、図26(a)および図26(b)を参照して説明したように、段矩形391に隣接する行候補矩形392を統合した段矩形390と他の行候補要素とが重ならない場合、段矩形391と行候補矩形392とを統合し新たな段矩形390とすることとしたので、さらに精度良く段レイアウトを解析することができる。
【0190】
また、一実施の形態によれば、図27を参照して説明したように、垂直方向に隣接する複数の行候補矩形400、401が中央揃えとされている場合、これらを段矩形(段要素)とすることとしたので、中央揃えについて精度良く段レイアウトを解析することができる。
【0191】
また、一実施の形態によれば、図3を参照して説明したように、横方向および縦方向のそれぞれについて行矩形(行要素)を生成することとしたので、文書画像で行の途中で複数行に分岐している場合や、括弧内に複数行がある場合であっても、精度良く横方向および縦方向の行レイアウトを解析することができる。
【0192】
また、一実施の形態によれば、図3を参照して説明したように、横方向および縦方向のそれぞれについて段矩形(段要素)を生成することとしたので、文書画像で行の途中で複数行に分岐している場合や、括弧内に複数行がある場合であっても、精度良く横方向および縦方向の段レイアウトを解析することができる。
【0193】
以上本発明にかかる一実施の形態について図面を参照して詳述してきたが、具体的な構成例はこの一実施の形態に限られるものではなく、本発明の要旨を逸脱しない範囲の設計変更等があっても本発明に含まれる。
【0194】
例えば、前述した一実施の形態においては、文書レイアウト解析装置100の機能を実現するためのプログラムを図40に示したコンピュータ読み取り可能な記録媒体600に記録して、この記録媒体600に記録されたプログラムを同図に示したコンピュータ500に読み込ませ、実行することにより各機能を実現してもよい。
【0195】
同図に示したコンピュータ500は、上記プログラムを実行するCPU(Central Processing Unit)510と、キーボード、マウス等の入力装置520と、各種データを記憶するROM(Read Only Memory)530と、演算パラメータ等を記憶するRAM(Random Access Memory)540と、記録媒体600からプログラムを読み取る読取装置550と、ディスプレイ、プリンタ等の出力装置560と、装置各部を接続するバス570とから構成されている。
【0196】
CPU510は、読取装置550を経由して記録媒体600に記録されているプログラムを読み込んだ後、プログラムを実行することにより、前述した機能を実現する。なお、記録媒体600としては、光ディスク、フレキシブルディスク、ハードディスク等が挙げられる。
【0197】
(付記1)コンピュータを、
文書画像の黒画素連結成分から文字要素を抽出する文字要素抽出手段、
行方向に並ぶ複数の文字要素について、行方向に対して垂直方向のズレ量が閾値以下の複数の文字要素を行要素とする行要素抽出手段、
として機能させるための文書レイアウト解析プログラム。
【0198】
(付記2)前記行要素抽出手段は、文字サイズ別に、前記行方向に並ぶ複数の文字要素を分類し、行方向に対して垂直方向のズレ量が閾値以下の複数の文字要素を行要素とすることを特徴とする付記1に記載の文書レイアウト解析プログラム。
【0199】
(付記3)前記コンピュータを、前記行要素抽出手段により抽出され隣接する二つの行要素について、行方向に対して垂直方向のズレ量が閾値以下である場合、前記二つの行要素を一つの行要素として統合する行要素統合手段、として機能させるための付記1または2に記載の文書レイアウト解析プログラム。
【0200】
(付記4)前記コンピュータを、前記行要素統合手段により統合された行要素に含まれる複数の文字要素について、間隔が所定以上である場合、当該文字要素の位置より前記行要素を二つに切断する行要素切断手段、として機能させるための付記3に記載の文書レイアウト解析プログラム。
【0201】
(付記5)前記行要素切断手段は、垂直方向において、ある行要素が他の行要素と重なっており、前記ある行要素に含まれる文字要素が前記他の行要素と重ならない場合、前記ある行要素を二つに切断することを特徴とする付記4に記載の文書レイアウト解析プログラム。
【0202】
(付記6)前記行要素統合手段は、行方向に隣接する二つの行要素の長さが、垂直方向に隣接する他の行要素の長さと略同じである場合、前記二つの行要素を一つの行要素に統合することを特徴とする付記3〜5のいずれか一つに記載の文書レイアウト解析プログラム。
【0203】
(付記7)前記コンピュータを、前記垂直方向について、略同長の複数の行要素を段要素とする段要素抽出手段、として機能させることを特徴とする付記1〜6のいずれか一つに記載の文書レイアウト解析プログラム。
【0204】
(付記8)前記段要素抽出手段は、前記段要素に隣接する行要素を統合した段要素と他の行要素とが重ならない場合、前記段要素と前記行要素とを統合し新たな段要素とすることを特徴とする付記7に記載の文書レイアウト解析プログラム。
【0205】
(付記9)前記段要素抽出手段は、前記垂直方向に隣接する複数の行要素が中央揃えとされている場合、複数の行要素を段要素とすることを特徴とする付記7に記載の文書レイアウト解析プログラム。
【0206】
(付記10)前記行要素抽出手段は、横方向および縦方向のそれぞれについて行要素を抽出することを特徴とする付記1〜9のいずれか一つに記載の文書レイアウト解析プログラム。
【0207】
(付記11)前記段要素抽出手段は、横方向および縦方向のそれぞれについて段要素を抽出することを特徴とする付記7〜9のいずれか一つに記載の文書レイアウト解析プログラム。
【0208】
(付記12)文書画像の黒画素連結成分から文字要素を抽出する文字要素抽出手段と、
行方向に並ぶ複数の文字要素について、行方向に対して垂直方向のズレ量が閾値以下の複数の文字要素を行要素とする行要素抽出手段と、
を備えたことを特徴とする文書レイアウト解析装置。
【0209】
(付記13)前記行要素抽出手段は、文字サイズ別に、前記行方向に並ぶ複数の文字要素を分類し、行方向に対して垂直方向のズレ量が閾値以下の複数の文字要素を行要素とすることを特徴とする付記12に記載の文書レイアウト解析装置。
【0210】
(付記14)前記行要素抽出手段により抽出され隣接する二つの行要素について、行方向に対して垂直方向のズレ量が閾値以下である場合、前記二つの行要素を一つの行要素として統合する行要素統合手段を備えたことを特徴とする付記12または13に記載の文書レイアウト解析装置。
【0211】
(付記15)前記行要素統合手段により統合された行要素に含まれる複数の文字要素について、間隔が所定以上である場合、当該文字要素の位置より前記行要素を二つに切断する行要素切断手段を備えたことを特徴とする付記14に記載の文書レイアウト解析装置。
【0212】
(付記16)前記行要素切断手段は、垂直方向において、ある行要素が他の行要素と重なっており、前記ある行要素に含まれる文字要素が前記他の行要素と重ならない場合、前記ある行要素を二つに切断することを特徴とする付記15に記載の文書レイアウト解析装置。
【0213】
(付記17)前記行要素統合手段は、行方向に隣接する二つの行要素の長さが、垂直方向に隣接する他の行要素の長さと略同じである場合、前記二つの行要素を一つの行要素に統合することを特徴とする付記14〜16のいずれか一つに記載の文書レイアウト解析装置。
【0214】
(付記18)前記垂直方向について、略同長の複数の行要素を段要素とする段要素抽出手段を備えたことを特徴とする付記12〜17のいずれか一つに記載の文書レイアウト解析装置。
【0215】
(付記19)前記段要素抽出手段は、前記段要素に隣接する行要素を統合した段要素と他の行要素とが重ならない場合、前記段要素と前記行要素とを統合し新たな段要素とすることを特徴とする付記18に記載の文書レイアウト解析装置。
【0216】
(付記20)前記段要素抽出手段は、前記垂直方向に隣接する複数の行要素が中央揃えとされている場合、複数の行要素を段要素とすることを特徴とする付記18に記載の文書レイアウト解析装置。
【0217】
(付記21)前記行要素抽出手段は、横方向および縦方向のそれぞれについて行要素を抽出することを特徴とする付記12〜20のいずれか一つに記載の文書レイアウト解析装置。
【0218】
(付記22)前記段要素抽出手段は、横方向および縦方向のそれぞれについて段要素を抽出することを特徴とする付記18〜20のいずれか一つに記載の文書レイアウト解析装置。
【0219】
(付記23)文書画像の黒画素連結成分から文字要素を抽出する文字要素抽出工程と、
行方向に並ぶ複数の文字要素について、行方向に対して垂直方向のズレ量が閾値以下の複数の文字要素を行要素とする行要素抽出工程と、
を含むことを特徴とする文書レイアウト解析方法。
【0220】
(付記24)前記行要素抽出工程では、文字サイズ別に、前記行方向に並ぶ複数の文字要素を分類し、行方向に対して垂直方向のズレ量が閾値以下の複数の文字要素を行要素とすることを特徴とする付記23に記載の文書レイアウト解析方法。
【0221】
(付記25)前記行要素抽出工程で抽出され隣接する二つの行要素について、行方向に対して垂直方向のズレ量が閾値以下である場合、前記二つの行要素を一つの行要素として統合する行要素統合工程を含むことを特徴とする付記23または24に記載の文書レイアウト解析方法。
【0222】
(付記26)前記行要素統合工程で統合された行要素に含まれる複数の文字要素について、間隔が所定以上である場合、当該文字要素の位置より前記行要素を二つに切断する行要素切断工程を含むことを特徴とする付記25に記載の文書レイアウト解析方法。
【0223】
(付記27)前記行要素切断工程では、垂直方向において、ある行要素が他の行要素と重なっており、前記ある行要素に含まれる文字要素が前記他の行要素と重ならない場合、前記ある行要素を二つに切断することを特徴とする付記26に記載の文書レイアウト解析方法。
【0224】
(付記28)前記行要素統合工程では、行方向に隣接する二つの行要素の長さが、垂直方向に隣接する他の行要素の長さと略同じである場合、前記二つの行要素を一つの行要素に統合することを特徴とする付記25〜27のいずれか一つに記載の文書レイアウト解析方法。
【0225】
(付記29)前記垂直方向について、略同長の複数の行要素を段要素とする段要素抽出工程を含むことを特徴とする付記23〜28のいずれか一つに記載の文書レイアウト解析方法。
【0226】
(付記30)前記段要素抽出工程では、前記段要素に隣接する行要素を統合した段要素と他の行要素とが重ならない場合、前記段要素と前記行要素とを統合し新たな段要素とすることを特徴とする付記29に記載の文書レイアウト解析方法。
【0227】
(付記31)前記段要素抽出工程では、前記垂直方向に隣接する複数の行要素が中央揃えとされている場合、複数の行要素を段要素とすることを特徴とする付記29に記載の文書レイアウト解析方法。
【0228】
(付記32)前記行要素抽出工程では、横方向および縦方向のそれぞれについて行要素を抽出することを特徴とする付記23〜31のいずれか一つに記載の文書レイアウト解析方法。
【0229】
(付記33)前記段要素抽出工程では、横方向および縦方向のそれぞれについて段要素を抽出することを特徴とする付記29〜31のいずれか一つに記載の文書レイアウト解析方法。
【0230】
【発明の効果】
以上説明したように、本発明によれば、文書画像の黒画素連結成分から文字要素を抽出し、行方向に並ぶ複数の文字要素について、行方向に対して垂直方向のズレ量が閾値以下の複数の文字要素を行要素とすることとしたので、文書画像で行の途中で複数行に分岐している場合や、括弧内に複数行がある場合であっても、精度良く行レイアウトを解析することができるという効果を奏する。
【0231】
また、本発明によれば、文字サイズ別に、行方向に並ぶ複数の文字要素を分類し、行方向に対して垂直方向のズレ量が閾値以下の複数の文字要素を行要素とすることとしたので、文書画像に複数種類の文字サイズが存在する場合であっても、精度良く行レイアウトを解析することができるという効果を奏する。
【0232】
また、本発明によれば、隣接する二つの行要素について、行方向に対して垂直方向のズレ量が閾値以下である場合、二つの行要素を一つの行要素として統合することとしたので、隣接する行要素について精度良く行レイアウトを解析することができるという効果を奏する。
【0233】
また、本発明によれば、行要素に含まれる複数の文字要素について、間隔が所定以上である場合、当該文字要素の位置より行要素を二つに切断することとしたので、長すぎる行要素を適切な長さに分けることができるという効果を奏する。
【0234】
また、本発明によれば、垂直方向において、ある行要素が他の行要素と重なっており、ある行要素に含まれる文字要素が他の行要素と重ならない場合、ある行要素を二つに切断することとしたので、行要素を適切な位置で分けることができるという効果を奏する。
【0235】
また、本発明によれば、行方向に隣接する二つの行要素の長さが、垂直方向に隣接する他の行要素の長さと略同じである場合、二つの行要素を一つの行要素に統合することとしたので、短すぎる行要素を適切な長さにすることができるという効果を奏する。
【0236】
また、本発明によれば、垂直方向について、略同長の複数の行要素を段要素とすることとしたので、文書画像で行の途中で複数行に分岐している場合や、括弧内に複数行がある場合であっても、精度良く段レイアウトを解析することができるという効果を奏する。
【0237】
また、本発明によれば、段要素に隣接する行要素を統合した段と他の行要素とが重ならない場合、段要素と行要素とを統合し新たな段要素とすることとしたので、さらに精度良く段レイアウトを解析することができるという効果を奏する。
【図面の簡単な説明】
【図1】本発明にかかる一実施の形態の構成を示すブロック図である。
【図2】同一実施の形態で用いられる各種文書画像を示す図である。
【図3】同一実施の形態の動作を説明するフローチャートである。
【図4】図3に示した文字候補要素生成処理を説明するフローチャートである。
【図5】図4に示した重なり矩形統合処理を説明するフローチャートである。
【図6】図4に示した隣接矩形統合処理を説明するフローチャートである。
【図7】図3に示した横方向行矩形生成処理を説明するフローチャートである。
【図8】図7に示した文字サイズ別行候補生成処理を説明するフローチャートである。
【図9】図7に示した行候補統合処理を説明するフローチャートである。
【図10】図7に示した長行切断処理を説明するフローチャートである。
【図11】図7に示した長行切断処理を説明するフローチャートである。
【図12】図7に示した短行統合処理を説明するフローチャートである。
【図13】図3に示した横段生成処理を説明するフローチャートである。
【図14】図13に示した同長行統合処理を説明するフローチャートである。
【図15】図13に示した段隣接行統合処理を説明するフローチャートである。
【図16】図13に示した中央揃え行統合処理を説明するフローチャートである。
【図17】図3に示した縦方向行矩形生成処理を説明するフローチャートである。
【図18】図3に示した縦段生成処理を説明するフローチャートである。
【図19】図3に示した段確定処理を説明するフローチャートである。
【図20】図8に示した文字サイズ別行候補生成処理を説明する図である。
【図21】図8に示した文字サイズ別行候補生成処理を説明する図である。
【図22】図9に示した行候補統合処理を説明する図である。
【図23】図10に示した長行切断処理を説明する図である。
【図24】図11に示した長行切断処理を説明する図である。
【図25】図12に示した短行統合処理を説明する図である。
【図26】図15に示した段隣接行統合処理を説明する図である。
【図27】図16に示した中央揃え行統合処理を説明する図である。
【図28】図3に示した黒画素連結成分抽出処理の結果を示す図である。
【図29】図4に示した文字候補要素生成処理の結果を示す図である。
【図30】図8に示した横方向の文字サイズ別行候補生成処理の結果を示す図である。
【図31】図17に示した縦方向の文字サイズ別行候補生成処理の結果を示す図である。
【図32】図9に示した横方向の行候補統合処理の結果を示す図である。
【図33】図17に示した縦方向の行候補統合処理の結果を示す図である。
【図34】図10および図11に示した横方向の長行切断処理の結果を示す図である。
【図35】図17に示した縦方向の長行切断処理の結果を示す図である。
【図36】図12に示した横方向の短行統合処理の結果を示す図である。
【図37】図17に示した縦方向の短行統合処理の結果を示す図である。
【図38】図13に示した横段生成処理の結果を示す図である。
【図39】図18に示した縦段生成処理の結果を示す図である。
【図40】同一実施の形態の変形例の構成を示すブロック図である。
【図41】従来の問題点を説明する図である。
【符号の説明】
100 文書レイアウト解析装置
101 入力部
102 制御部
103 黒画素連結成分抽出部
104 文字候補要素生成部
105 横方向行矩形生成部
106 横段生成部
107 縦方向行矩形生成部
108 縦段生成部
109 記憶部
110 出力部

Claims (10)

  1. コンピュータを、
    文書画像の黒画素連結成分から文字要素を抽出する文字要素抽出手段、
    行方向に並ぶ複数の文字要素について、行方向に対して垂直方向のズレ量が閾値以下の複数の文字要素を行要素とする行要素抽出手段、
    として機能させるための文書レイアウト解析プログラム。
  2. 前記行要素抽出手段は、文字サイズ別に、前記行方向に並ぶ複数の文字要素を分類し、行方向に対して垂直方向のズレ量が閾値以下の複数の文字要素を行要素とすることを特徴とする請求項1に記載の文書レイアウト解析プログラム。
  3. 前記コンピュータを、前記行要素抽出手段により抽出され隣接する二つの行要素について、行方向に対して垂直方向のズレ量が閾値以下である場合、前記二つの行要素を一つの行要素として統合する行要素統合手段、として機能させるための請求項1または2に記載の文書レイアウト解析プログラム。
  4. 前記コンピュータを、前記行要素統合手段により統合された行要素に含まれる複数の文字要素について、間隔が所定以上である場合、当該文字要素の位置より前記行要素を二つに切断する行要素切断手段、として機能させるための請求項3に記載の文書レイアウト解析プログラム。
  5. 前記行要素切断手段は、垂直方向において、ある行要素が他の行要素と重なっており、前記ある行要素に含まれる文字要素が前記他の行要素と重ならない場合、前記ある行要素を二つに切断することを特徴とする請求項4に記載の文書レイアウト解析プログラム。
  6. 前記行要素統合手段は、行方向に隣接する二つの行要素の長さが、垂直方向に隣接する他の行要素の長さと略同じである場合、前記二つの行要素を一つの行要素に統合することを特徴とする請求項3〜5のいずれか一つに記載の文書レイアウト解析プログラム。
  7. 前記コンピュータを、前記垂直方向について、略同長の複数の行要素を段要素とする段要素抽出手段、として機能させることを特徴とする請求項1〜6のいずれか一つに記載の文書レイアウト解析プログラム。
  8. 前記段要素抽出手段は、前記段要素に隣接する行要素を統合した段要素と他の行要素とが重ならない場合、前記段要素と前記行要素とを統合し新たな段要素とすることを特徴とする請求項7に記載の文書レイアウト解析プログラム。
  9. 文書画像の黒画素連結成分から文字要素を抽出する文字要素抽出手段と、
    行方向に並ぶ複数の文字要素について、行方向に対して垂直方向のズレ量が閾値以下の複数の文字要素を行要素とする行要素抽出手段と、
    を備えたことを特徴とする文書レイアウト解析装置。
  10. 文書画像の黒画素連結成分から文字要素を抽出する文字要素抽出工程と、
    行方向に並ぶ複数の文字要素について、行方向に対して垂直方向のズレ量が閾値以下の複数の文字要素を行要素とする行要素抽出工程と、
    を含むことを特徴とする文書レイアウト解析方法。
JP2002191275A 2002-06-28 2002-06-28 文書レイアウト解析プログラム、文書レイアウト解析装置および文書レイアウト解析方法 Pending JP2004038321A (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2002191275A JP2004038321A (ja) 2002-06-28 2002-06-28 文書レイアウト解析プログラム、文書レイアウト解析装置および文書レイアウト解析方法
US10/350,180 US7257253B2 (en) 2002-06-28 2003-01-24 Apparatus and method of analyzing layout of document, and computer product
CA002417478A CA2417478C (en) 2002-06-28 2003-01-27 Apparatus and method of analyzing layout of document, and computer product
CNB031021026A CN1264113C (zh) 2002-06-28 2003-01-30 分析文件版面布局的设备和方法
KR1020030006204A KR20040002427A (ko) 2002-06-28 2003-01-30 문서 레이아웃 해석 프로그램, 문서 레이아웃 해석 장치및 문서 레이아웃 해석 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002191275A JP2004038321A (ja) 2002-06-28 2002-06-28 文書レイアウト解析プログラム、文書レイアウト解析装置および文書レイアウト解析方法

Publications (1)

Publication Number Publication Date
JP2004038321A true JP2004038321A (ja) 2004-02-05

Family

ID=29774393

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002191275A Pending JP2004038321A (ja) 2002-06-28 2002-06-28 文書レイアウト解析プログラム、文書レイアウト解析装置および文書レイアウト解析方法

Country Status (5)

Country Link
US (1) US7257253B2 (ja)
JP (1) JP2004038321A (ja)
KR (1) KR20040002427A (ja)
CN (1) CN1264113C (ja)
CA (1) CA2417478C (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008269502A (ja) * 2007-04-25 2008-11-06 Fuji Xerox Co Ltd 画像処理システム及び画像処理プログラム
JP2013101616A (ja) * 2011-11-09 2013-05-23 Canon Inc 様々な文字幅を有するテキスト行の文字を分割するための方法及びシステム

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4852417B2 (ja) * 2004-07-14 2012-01-11 株式会社パスコ 文字列最適配置プログラム
JP4095592B2 (ja) * 2004-08-06 2008-06-04 キヤノン株式会社 情報処理装置、情報処理方法ならびにプログラム
JP2007088782A (ja) * 2005-09-21 2007-04-05 Ricoh Co Ltd 画像処理装置、画像処理方法および画像処理プログラム
US8261186B2 (en) 2009-01-02 2012-09-04 Apple Inc. Methods for efficient cluster analysis
CN102081736B (zh) * 2009-11-27 2014-11-26 株式会社理光 从可移植电子文档中提取字符外接矩形的设备和方法
CN102375988B (zh) * 2010-08-17 2013-12-25 富士通株式会社 文件图像处理方法和设备
WO2014174665A1 (ja) * 2013-04-26 2014-10-30 株式会社 東芝 システムおよび筆跡検索方法
CN110377885B (zh) * 2019-06-14 2023-09-26 北京百度网讯科技有限公司 转换pdf文件的方法、装置、设备和计算机存储介质

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0816918B2 (ja) * 1989-04-18 1996-02-21 シャープ株式会社 行抽出方法
JP2868134B2 (ja) * 1990-09-03 1999-03-10 キヤノン株式会社 画像処理方法及び装置
JP3576570B2 (ja) * 1991-11-19 2004-10-13 ゼロックス コーポレイション 比較方法
US5390259A (en) * 1991-11-19 1995-02-14 Xerox Corporation Methods and apparatus for selecting semantically significant images in a document image without decoding image content
US5384864A (en) * 1993-04-19 1995-01-24 Xerox Corporation Method and apparatus for automatic determination of text line, word and character cell spatial features
US5517578A (en) * 1993-05-20 1996-05-14 Aha! Software Corporation Method and apparatus for grouping and manipulating electronic representations of handwriting, printing and drawings
JP3445394B2 (ja) * 1993-12-17 2003-09-08 ゼロックス・コーポレーション 少なくとも二つのイメージセクションの比較方法
JP2768249B2 (ja) 1993-12-27 1998-06-25 日本電気株式会社 文書画像レイアウト解析装置
US5999647A (en) * 1995-04-21 1999-12-07 Matsushita Electric Industrial Co., Ltd. Character extraction apparatus for extracting character data from a text image

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008269502A (ja) * 2007-04-25 2008-11-06 Fuji Xerox Co Ltd 画像処理システム及び画像処理プログラム
JP2013101616A (ja) * 2011-11-09 2013-05-23 Canon Inc 様々な文字幅を有するテキスト行の文字を分割するための方法及びシステム

Also Published As

Publication number Publication date
CA2417478A1 (en) 2003-12-28
CA2417478C (en) 2007-06-19
CN1264113C (zh) 2006-07-12
CN1467682A (zh) 2004-01-14
US20040001628A1 (en) 2004-01-01
KR20040002427A (ko) 2004-01-07
US7257253B2 (en) 2007-08-14

Similar Documents

Publication Publication Date Title
JP2004038321A (ja) 文書レイアウト解析プログラム、文書レイアウト解析装置および文書レイアウト解析方法
US8532810B2 (en) Automatically generating embroidery designs
US6948119B1 (en) Automated paragraph layout
US20040064810A1 (en) Optimized translation of scalar type SIMD instructions into non-scalar SIMD instructions
JPH0869543A (ja) 画像編集方法及び編集システム
JP4704601B2 (ja) 文字認識方法,プログラム及び記録媒体
JP4077904B2 (ja) 情報処理装置およびその方法
Farivar et al. An algorithm for fast edit distance computation on GPUs
Ebendt et al. An improved branch and bound algorithm for exact BDD minimization
JPH10260983A (ja) 画像検索装置及び方法
US7627815B2 (en) Object editing system
JPH1049688A (ja) 画像データの部分消去および部分検出方法
JP2019139497A (ja) 画像処理システム及び画像処理方法
JP2004282701A (ja) 最小領域による合成画像の分割
Bhore et al. Extending Orthogonal Planar Graph Drawings Is Fixed-Parameter Tractable
JPH09128421A (ja) データ処理方法およびマスクパターンのデータ処理方法
JP3644621B2 (ja) 線図形の芯線化における接続処理方法
JPS62286177A (ja) 図面デ−タの変換処理方法
JP2948151B2 (ja) 用例機械翻訳装置
Khalid et al. Improved Global Routing By Using A-Star Algorithm
JPH0716368A (ja) ミシン装置
JP4187612B2 (ja) ダイナミックプログラミング法計算を高速に実行する計算装置
Kumar CMSC 373 Artificial Intelligence Fall 2023 05-Game Playing
JP3880091B2 (ja) 情報処理装置及び方法
JPS62286176A (ja) 図面デ−タの変換処理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050112

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20071108

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071120

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080121

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080311