JP2943682B2 - 印刷行検出装置及び印刷行検出方法 - Google Patents

印刷行検出装置及び印刷行検出方法

Info

Publication number
JP2943682B2
JP2943682B2 JP8005491A JP549196A JP2943682B2 JP 2943682 B2 JP2943682 B2 JP 2943682B2 JP 8005491 A JP8005491 A JP 8005491A JP 549196 A JP549196 A JP 549196A JP 2943682 B2 JP2943682 B2 JP 2943682B2
Authority
JP
Japan
Prior art keywords
print line
line
detected
rectangle
print
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP8005491A
Other languages
English (en)
Other versions
JPH09198465A (ja
Inventor
徹雄 土屋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP8005491A priority Critical patent/JP2943682B2/ja
Publication of JPH09198465A publication Critical patent/JPH09198465A/ja
Application granted granted Critical
Publication of JP2943682B2 publication Critical patent/JP2943682B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は文書画像より印刷さ
れた文字行を検出する装置に関する。
【0002】
【従来の技術】本発明の従来技術について説明する。
【0003】文書画像のどこに何が記載されているかを
解析するレイアウト解析技術は、文書画像を認識し理解
するために不可欠な技術である。特に印刷された文字行
(以下、印刷行と呼ぶ)は、一般文書中に頻繁に現れる
ため、印刷行がどこに書かれているかを検出することは
重要である。
【0004】かかる印刷行検出技術としては、例えば、
特開昭59−103117号公報の方法がある。この方
法は文字を構成する画素を文書水平及び垂直方向に投影
し、その投影の画素積算値が一定値以上の場合に行とし
て検出する(以下、従来技術1と呼ぶ)。
【0005】また、例えば特開平1−320171号公
報の方法がある。この方法は、文書画像中の黒画素が水
平又は垂直方向に連続している領域(ラン)を検出し、
各ランを中心として周囲一定範囲にある他のランに同じ
ラベルを付加していくことによりランの密集領域を検出
し、前記密集領域を分析して印刷行を検出する(以下、
従来技術2と呼ぶ)。
【0006】
【発明が解決しようとする課題】本発明が解決しようと
する課題について説明する。
【0007】従来技術1では、文字は線で構成されてい
ることから、文字を構成する線が少ない簡単な文字が一
つの行に多く存在する場合、投影軸上に十分に当該行に
対応する画素が積算されず、印刷行でない要素による投
影との区別が困難となり、結果として安定して印刷行を
検出することが困難となる。
【0008】一方、文字を構成する線の数に影響を受け
ずに安定して投影軸上に行に対応する投影を構成する方
法として、各文字の外接矩形を検出して、その矩形に含
まれる画素の投影をとる方法がある。かかる方法によれ
ば、文字を構成する線の少ない文字でも十分に投影軸上
に画素が積算される。
【0009】しかし、文字の画素を投影する方法でも、
外接矩形内の画素を投影する場合でも、投影軸上におい
て、一つの行に対応する投影が他の行又は他の非文字要
素の投影から分離できることを前提としている。しか
し、名刺等の特定の書式の文書の場合はかかる前提がほ
ぼ成り立つが、郵便物等の多様なレイアウトが存在する
文書では、縦文字行、横文字行、非文字要素が同時に存
在しうるため、投影軸上で一つの行に対応する投影が他
から分離するとは限らない。従って、かかる多様なレイ
アウトの文書では印刷行を安定して検出できないという
問題があった。
【0010】従来技術2では、縦文字行や横文字行が混
在していても、それらが十分に離れていれば、別のラベ
ルが付加されるため、各行を検出することができる。し
かし、各ランの周囲一定範囲にあるものは常に同じラベ
ルが付加されるため、印刷行に属さない他の要素が印刷
行に近接している場合、それらに同一ラベルが付加され
てしまう可能性がある。従って、郵便物のように印刷行
と手書きの行が混在し、かならずしもそれらが十分に離
れているとは限らないような文書に対しては印刷行のみ
を検出できないという問題があった。
【0011】本発明は以上の問題を解決するものであ
り、多様なレイアウトの文書に対しても安定して印刷行
を検出することを目的とする。
【0012】
【課題を解決するための手段】本願発明は、文書画像か
ら印刷された文字行を検出する装置において、文書画像
から黒画素連結成分の外接矩形を抽出する外接矩形抽出
手段と、前記外接矩形を大きさにより、分類範囲につい
て重複を許して、分類する手段と、前記分類された外接
矩形内に含まれる画素の投影を行う外接矩形投影手段
と、上記外接矩形と前記投影値より印刷行を判定する印
刷行判定手段と、分類されたカテゴリ間で、画像上の領
域において重複して検出されている印刷行を排除する重
複行排除手段とからなることを特徴とする。
【0013】本発明の作用について説明する。
【0014】文書画像から連結成分の外接矩形を検出
し、かかる外接矩形をあらかじめ大きさにより重複を許
して分類し(分類先をカテゴリと呼ぶ)、カテゴリごと
に矩形内に含まれる画素の投影を行い、画素の積算値が
あらかじめカテゴリごとに定めた一定値を越えた場合に
印刷行候補とし、他のカテゴリに当該印刷行候補とほぼ
同位置の印刷行候補が検出されておらず、又は検出され
ていても当該印刷行候補よりも低い積算値である場合
に、当該印刷行候補を印刷行として検出する。
【0015】最初に、あらかじめ外接矩形の大きさで分
類することにより、縦行、横行等が混在する文書におい
ても安定して印刷行を検出できる原理を説明する。
【0016】一般に印刷行は、同じ印刷行に属する文字
の大きさはほぼ一定であるという特徴を有する。即ち、
同一印刷行に属する文字の外接矩形はほぼ同じ大きさを
有する。従って、外接矩形の大きさにより分類すること
により、縦行や横行が混在する文書においても、それら
の行幅が異なる限り、それぞれ行に含まれる文字の外接
矩形は別のカテゴリに分類される。このことから、分類
せずに投影をとると投影軸上で一つの行に対応する投影
が他の行の投影から分離しないために、印刷行が検出で
きないような場合でも、分類してから各カテゴリごとに
投影をとることにより、他の行の投影の影響を受けずに
画素が積算される可能性が高くなり、印刷行の検出率の
安定性が高まる。
【0017】又、印刷行に他の要素が近接している場合
でも、かかる他の要素の外接矩形の大きさが印刷行に含
まれる文字の外接矩形の大きさと異なる限り、それぞれ
別のカテゴリに分類されるため、従来技術(2)の方法
だとかかる他の要素も印刷行として検出してしまうよう
な場合でも、印刷行のみを正しく検出することが可能と
なる。
【0018】次に、単に分類して投影をとるだけでは、
印刷行の行幅が分類境界値付近の値をとる場合に安定し
て検出できないことを示し、重複を許して分類すること
により、かかる場合にも安定して検出することができる
原理を説明する。
【0019】重複を許さずに2つのカテゴリ(P1、P
2)に分類した場合(Aの場合)と重複を許して3つの
カテゴリ(Q1、Q2、Q3)に分類した場合(Bの場
合)を例として考える。ここで、Aの場合の分類境界値
をT1、Bの場合の重複分類境界値をS1、S2、S
3、印刷行と判断するために用いる、外接矩形内の画素
を投影して得られる画素積算値の最低値をθ、対象とす
る印刷行を構成する文字の外接矩形数をN個、それぞれ
投影軸と平行方向の大きさをXi(i=0、…、N)、
投影軸と直角方向の大きさをYi(i=0、…、N)と
する。なお、iは外接矩形の番号を表す。
【0020】説明を簡単にするために、対象とする印刷
行は1行のみとし、前記行を構成する文字の外接矩形内
の画素を投影して得られる画素積算値はθ以上、すなわ
ち活字行としての条件ΣYi>θを満たすとする。
【0021】重複を許さないで分類する場合、各外接矩
形はXiがT1より小さいか、大きいかによってP1又
はP2に分類される。Xi(i=0、…、N)が全てT
1より小さい場合、又はXi(i=0、…、N)が全て
T1より大きい場合は、N個の外接矩形はすべてP1又
はP2のいずれかに分類され、ΣYi>θより、対象と
する行は印刷行として検出される。しかし、各Xiが分
類境界値T1付近の値をとる場合、N個のうちのいくつ
かの外接矩形はP1に分類され、残りがP2に分類され
る事態が生じうる。即ち、一つの印刷行に含まれる文字
の外接矩形が2つのカテゴリに分かれて分類されたこと
により、各カテゴリでの画素積算値がθより小さくなる
可能性があり、かかる場合には、対象行は印刷行として
検出されないことになる。このような事態は、対象とす
る印刷行の行幅が未定である以上、T1をどのように設
定しても起こり得る問題である。従って、印刷行の行幅
があらかじめ設定した分類境界値付近の値をとる場合
は、安定して印刷行を検出することができない。
【0022】一方、重複を許して分類する場合、各外接
矩形はXiがS2より小さい場合Q1に分類され、Xi
がS1より大きくS3より小さい場合Q2に分類され、
XiがS2より大きい場合はS3に分類される。この場
合、各Xiが重複分類境界値S1、S2、S3のいずれ
かの付近の値をとっても、Q1、Q2、Q3のカテゴリ
のうちいずれか一つのカテゴリには常にN個の外接矩形
が分類されている。例えば、XiがS2付近の値をとる
場合、カテゴリQ1、Q3には対象行の外接矩形のうち
の一部分のみが分類されることになるが、カテゴリQ2
には、対象行の外接矩形の全てが分類されることにな
る。従って、カテゴリQ2に分類された外接矩形につい
て、ΣYi>θが成り立つため、対象行を印刷行として
検出することができる。このように、重複を許して分類
することにより、分類境界値設定にかかわらず安定し
て検出することができる。
【0023】
【発明の実施の形態】図1は本発明にかかる印刷行検出
装置の1実施例の構成を示すブロック図である。この実
施例は、外接矩形抽出手段1と、外接矩形分類手段2
と、外接矩形投影手段3と、印刷行判定手段4と、重複
行排除手段5とを有する。
【0024】入力画像として、図2に例示するような画
像があり、これを入力画像21とする。入力画像21は
2値画像を想定して説明を行うが、2値画像に限定され
るものではなく、例えば、多値画像の場合は、通常の2
値化方法により2値化処理を行ってから入力すればよ
い。ここで、図2に示す(x,y)座標系を画像座標と
呼ぶことにする。
【0025】又、x軸に投影を行い、y軸に平行な印刷
行を検出する場合についてのみ説明するが、y軸にも投
影を行うことにより、x軸に平行な印刷行も同様の処理
により検出することができる。
【0026】外接矩形抽出手段1は、前記入力画像21
を入力とし、画像中の黒画素が連結している成分に同一
ラベルを付加するラベリングを行い、同一ラベルが付加
された連結成分に外接する矩形を抽出し、外接矩形情報
22を出力する。図3に検出された外接矩形を例示す
る。ラベリングの手法としては、例えば現代数理科学事
典(大阪書籍株式会社発行)の951頁に記載されてい
る方法を用いる。外接矩形情報22としては、例えば
{(1番目の外接矩形の左上頂点の画像座標(x,
y)、1番目の外接矩形の右下頂点の画像座標(x,
y))、・・・・}とする。
【0027】外接矩形分類手段2は、外接矩形情報22
を入力とし、各矩形をあらかじめ設定した複数のカテゴ
リに重複を許して分類し、分類情報23を出力する。
【0028】重複を許して分類する方法としては、例え
ばx軸と平行方向の辺の大きさにより以下のように分類
する。ここで説明のために、カテゴリ数を3とし、分類
しようとしている矩形のx軸と平行方向の辺の大きさを
x、分類先であるカテゴリをQi(i=1,2,3)と
する。又、分類するための境界値をSi(i=1,2,
3)、許容する印刷行の最大幅をSmaxとする。 1.X=<S2ならば矩形をQ1に分類する。 2.X>S1かつX=<S3ならば矩形をQ2に分類す
る。 3.X>S3かつX=<Smaxならば矩形をQ3に分
類する。
【0029】図4は分類された外接矩形の例を示すもの
であり、(ア)はカテゴリQ1に分類された外接矩形
を、(イ)はカテゴリQ2に分類された外接矩形を、
(ウ)はカテゴリQ3に分類された外接矩形を示す。分
類情報23としては、例えば{i、Qiに属する外接矩
形の外接矩形情報群}(i=1,2,3)とする。
【0030】外接矩形投影手段3は、分類情報23を入
力とし、x軸に対しカテゴリごとに矩形内に含まれる画
素の投影を行い、投影情報24としてx軸上に積算され
た値を出力する。図5はx軸上の投影の例を示すもので
あり、図4の(ア)(イ)(ウ)に対応する。投影情報
24としては、例えば2次元配列H(i,j)で表す。
ここで、iはカテゴリを表す番号、jはx座標値とし、
H(i,j)にはi番目のカテゴリについてのx軸上の
座標値jの位置における画素積算値が格納される。
【0031】印刷行判定手段4は、分類情報23と投影
情報24を入力とし、印刷行の判定をし、重複のある印
刷行情報25を出力する。重複のある印刷行情報25と
しては、例えば{i、Qiに属する印刷行の外接矩形座
標群}(i=1,2,3)を出力する。印刷行の判定
は、例えば、以下の手順で行う。
【0032】各カテゴリに対して (1)P(j)を次のようにして求める。
【0033】H(i,j)>L(i)ならばP(j)=
1H(i,j)<=L(i)ならばP(j)=0 ここで、L(i)は、カテゴリごとにあらかじめ定め
、印刷行と判断するための、外接矩形内の画素を投影
して得られる画素積算値の最低値である。(2)以下の
条件を満たす(ja、jb)を検出する。
【0034】 jaの条件:P(ja−1)=0かつP(ja)=1 jbの条件:P(jb)=1かつP(jb+1)=0 但しjbはjb>=jaを満たす最小値 (3)以下の条件を満たす外接矩形の数nを計算する。
【0035】条件:ja<外接矩形の中心のx座標値<
jb (4)以下の条件1及び条件2を満たす場合に、印刷行
と判定する。なお、条件2はiの値によって条件の内容
が異なる。
【0036】条件1:n>N(i) 条件2:i=1の場合 0<jb−ja<S2 i=2の場合 S1<jb−ja<S3 i=3の場合 S2<jb−ja<Smax ここで、N(i)は、カテゴリごとにあらかじめ定めた
印刷行を構成する最低矩形数である。
【0037】重複行排除手段5は、重複のある印刷行情
報25を入力とし、各カテゴリにおいて判定された印刷
行の重複関係を評価し、重複のない印刷行情報26を出
力する。重複のない印刷行情報26としては、例えば
{i、Qiに属する印刷行の外接矩形座標群}(i=
1,2,3)とする。重複関係の評価方法としては、例
えば2つの印刷行の外接矩形の重複部分の面積が、いず
れかの印刷行の外接矩形の面積の一定の割合以上となる
場合に、重複すると評価する。重複していると評価され
た場合には、例えば画素積算値を比較し、画素積算値が
小さい方を排除して重複のない印刷行情報を作成する。
【0038】以上実施例をもって本発明を詳細に説明し
たが、本発明はこの実施例に限定されるものではない。
【0039】
【発明の効果】本発明によれば、投影軸上において、一
つの行に対応する投影が他の行又は他の非文字要素の投
影から分離できない場合、即ち縦文字行、横文字行、非
文字要素が同時に存在するような多様なレイアウトの文
書についても、印刷行を安定して検出することができ
る。
【図面の簡単な説明】
【図1】第1の発明の印刷行検出装置の一実施例の構成
を示すブロック図である。
【図2】入力に用いる画像の一例を表す図である。
【図3】入力画像から外接矩形を抽出した例を表す図で
ある。
【図4】抽出した外接矩形を重複を許して分類した例を
表す図である。
【図5】分類した外接矩形の矩形内に含まれる画素を投
影した例を表す図である。
【符号の説明】
1 外接矩形抽出手段 2 外接矩形分類手段 3 外接矩形投影手段 4 印刷行判定手段 5 重複行排除手段 21 入力画像 22 外接矩形情報 23 分類情報 24 投影情報 25 重複のある印刷行情報 26 重複のない印刷行情報

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】文書画像から印刷された文字行を検出する
    装置において、 文書画像から黒画素連結成分の外接矩形を抽出する外接
    矩形抽出手段と、 前記外接矩形を大きさにより、分類範囲について重複を
    許して、分類する手段と、 前記分類された外接矩形内に含まれる画素の投影を行う
    外接矩形投影手段と、 前記外接矩形と前記投影値より印刷行を判定する印刷行
    判定手段と、 分類されたカテゴリ間で、画像上の領域において重複し
    て検出されている印刷行を排除する重複行排除手段とか
    らなることを特徴とする印刷行検出装置。
  2. 【請求項2】文書画像から連結成分の外接矩形を検出
    し、前記外接矩形をあらかじめ大きさにより、分類範囲
    について重複を許してカテゴリに分類し、前記カテゴリ
    ごとに矩形内に含まれる画素の投影を行い、画素の積算
    値があらかじめカテゴリごとに定めた一定値を越えた場
    合に印刷行候補とし、他のカテゴリに前記印刷行候補と
    ほぼ同位置の印刷行候補が検出されておらず、又は検出
    されていても前記印刷行候補よりも低い積算値である場
    合に、前記印刷行候補を印刷行として検出することを特
    徴とする印刷行検出方法。
JP8005491A 1996-01-17 1996-01-17 印刷行検出装置及び印刷行検出方法 Expired - Fee Related JP2943682B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8005491A JP2943682B2 (ja) 1996-01-17 1996-01-17 印刷行検出装置及び印刷行検出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8005491A JP2943682B2 (ja) 1996-01-17 1996-01-17 印刷行検出装置及び印刷行検出方法

Publications (2)

Publication Number Publication Date
JPH09198465A JPH09198465A (ja) 1997-07-31
JP2943682B2 true JP2943682B2 (ja) 1999-08-30

Family

ID=11612723

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8005491A Expired - Fee Related JP2943682B2 (ja) 1996-01-17 1996-01-17 印刷行検出装置及び印刷行検出方法

Country Status (1)

Country Link
JP (1) JP2943682B2 (ja)

Also Published As

Publication number Publication date
JPH09198465A (ja) 1997-07-31

Similar Documents

Publication Publication Date Title
JP5379085B2 (ja) スキャンされた文書画像内の前景画素群の連結グループをマーキング種類に基づき分類する方法及びシステム
Shi et al. Line separation for complex document images using fuzzy runlength
US6014450A (en) Method and apparatus for address block location
US6937762B2 (en) Image processing device and program product
US20020021840A1 (en) Apparatus for extracting ruled line from multiple-valued image
JP2002352191A (ja) 手書き判別能力を持つプリンティング制御インターフェースシステムとその方法
US7146047B2 (en) Image processing apparatus and method generating binary image from a multilevel image
Shi et al. Skew detection for complex document images using fuzzy runlength
Mitchell et al. Newspaper document analysis featuring connected line segmentation
Mullick et al. An efficient line segmentation approach for handwritten Bangla document image
EP0809205A2 (en) Character line detecting apparatus using simplified projection information and method thereof and character recognition apparatus thereof and method thereof
JP2002015280A (ja) 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
JP5041775B2 (ja) 文字切出方法及び文字認識装置
JP2943682B2 (ja) 印刷行検出装置及び印刷行検出方法
JP2006107534A (ja) 文字認識方法および文字認識装置
JP3476595B2 (ja) 画像領域分割方法、および画像2値化方法
JP2021005315A (ja) 情報処理装置、プログラム及び制御方法
JPH06180771A (ja) 英文字認識装置
JP3914119B2 (ja) 文字認識方法および文字認識装置
JPH09190493A (ja) 郵便宛名領域検出装置
JPH05151388A (ja) 処理領域及び処理条件の指定方式
Attia et al. Histogram-based lines and words decomposition for arabic omni font-written OCR systems; enhancements and evaluation
JPS6227887A (ja) 文字種分離方式
JP4974794B2 (ja) 文書認識装置、文書認識方法、コンピュータプログラム
JP3428504B2 (ja) 文字認識装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 19990112

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19990525

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080625

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090625

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100625

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100625

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110625

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110625

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120625

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120625

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130625

Year of fee payment: 14

LAPS Cancellation because of no payment of annual fees