JPH083831B2 - 文字行検出装置 - Google Patents

文字行検出装置

Info

Publication number
JPH083831B2
JPH083831B2 JP62328611A JP32861187A JPH083831B2 JP H083831 B2 JPH083831 B2 JP H083831B2 JP 62328611 A JP62328611 A JP 62328611A JP 32861187 A JP32861187 A JP 32861187A JP H083831 B2 JPH083831 B2 JP H083831B2
Authority
JP
Japan
Prior art keywords
partial
line
character line
character
width
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP62328611A
Other languages
English (en)
Other versions
JPH01169686A (ja
Inventor
信幸 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP62328611A priority Critical patent/JPH083831B2/ja
Publication of JPH01169686A publication Critical patent/JPH01169686A/ja
Publication of JPH083831B2 publication Critical patent/JPH083831B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】 〔概要〕 文書をスキャナで読み取って得られる2値画像データ
から、該文書中の各文字を認識する文字認識装置に用い
られる文字行検出装置に関し、 一つの文字行が複数に分かれてしまったり、複数の文
字行が一つに合体してしまったりする場合も、正しく文
字行を検出可能にすることを目的とし、 文書画像データ記憶手段(1)、文字行傾き検出手段
(2)、文字行幅および行間隔近似手段(3)、帯状領
域幅決定手段(4)、部分行検出手段(5)、部分行デ
ータ記憶手段(6)、および部分行統合手段(9)を設
ける文字行検出装置に、部分行統合手段(7)および部
分行分離手段(8)を追加した構成とする。
〔産業上の利用分野〕
本発明は、文書をスキャナで読み取って得られる2値
画像データから、該文書中の各文字を認識する文字認識
装置に用いられる文字行検出装置に関する。
各種の印刷物から所要事項を抽出してデータベースを
作成する等の作業の迅速化には、印刷物中の所要部分の
文字群をスキャナで読取り、得られた画像データから文
字を認識する技術の開発が不可欠である。
文書をスキャナで読み取って得られる2値の文書画像
データ(単に文書画像という)から、該文書中の各文字
を認識するには、まず、文書画像から文字行を検出し、
その後、文字行から個々の文字を切り出して認識すると
いう処理を行う。文書中の文字の大きさや行間の広さ
は、文書によって様々である。また、文書画像中の文字
行は、文書をスキャナで読み取る際に文書対スキャナの
関係が傾いた状態で読み取りが行なわれてしまう等の理
由により、走査方向に対して傾いていることが多い。
文字行が走査方向に対して傾いていると、文字行検
出、文字切り出しに支障が出る恐れがある。即ち文字行
は文書画像を走査方向12に投影して黒の多い部分として
検出できるが、第4図(a)のように文書画像中の文字
行11が走査方向に整列している場合は前記投影は第4図
(b)の如くなり、黒の文字行部分13とそれらの間の白
の行間部分14に判然と分れて容易に文字行を検出するこ
とができるが、第4図(c)の如く文字行11が走査方向
12に対して傾いていると、前記投影は第4図(e)の如
くなり、黒の文字行部分13が互いにつながって白の行間
部分がなくなり、文字行検出が困難になる。従って文字
サイズや行間隔の異なる多様な文書に対して、傾いた文
字行についても、文書画像から文字行を正確に、効率良
く検出する技術が必要とされる。
〔従来の技術〕
傾いた文字行に対する文字行検出には、文字行の分割
が有効である。即ち第4図に示すように文字行、詳しく
は走査方向に直交する鎖線15で分割(本例では4分割)
し、各区分で投影すると第4図(c)に対する結果は同
図(d)の如くなり(これは左から2番目の鎖線15と3
番目それとの間の帯状領域の走査方向投影をとったも
の)、黒の文字行部分13と白の行間部分14に判然と分
れ、容易に文字行を検出することができる。
投影は各帯状領域(16)でとるので検出される文字行
は各帯状領域で異なり、全体としては第4図(f)の如
く段差の有るものになる。こゝで、帯状領域16の幅をど
の程度にするかは工夫を要する所である。幅を小にする
(細分する)と、投影処理回数が増え、処理時間が大に
なる。幅を大にするとこの逆であるが、傾きがきつい場
合は黒部分が重なってしまう。
また傾きがきつい場合は、各帯状領域の文字行(部分
行という)の段差が大きく、行間部分14が狭く、隣接帯
状領域の各部分行の端部が2つの部分行に接触する。こ
の場合は、2つの部分行のどちらと一体化させるべきか
という問題が生じる。これらの問題に対して本発明者は
「文字行検出装置」特願昭62−129023、(特開昭63−
292381号公報)「文字列傾き検出装置」特願昭62−12
9022、(特開昭63−292382号公報)「文字行検出装
置」特願昭62−183696(特開平01−28791号公報)など
を提案している。
前記では、文書画像の中央部領域や、文字最大サイ
ズ相当領域が既知の場合にはその領域などの特定領域に
ついてサンプリング的に選択して投影し、文字サイズ及
び行間隔を推定し、この推定値に従って帯状領域の幅W
をW=Mim(c,d)/tanθなどと定める。こゝでcは文字
サイズ、dは行間隔、θは文字行傾斜の許容角である。
また各帯状領域の部分行は、端部での重なりが多い方と
連結する。例えば第5図の場合、部分行17aは部分行17c
より部分行17bの方が重なり幅が大であるので、部分行1
7bと連結する。
前記では文字行の傾きを次のようにして検出する。
即ち第6図に示すように幅w1の帯状領域における文字行
11の投影幅をb1、幅W2の帯状領域における文字行11の投
影幅をb2とすると、文字行11の傾き角θとこれらにはta
nθ=(b2−b1)/(W2−W1)の関係があるから、これ
より傾き角θを求める。
前記は、所定の走査方向に所定の幅を有しかつ走査
方向に直交する方向に延びる帯状領域に分割し、帯状領
域それぞれの中で文書画像データを走査方向に走査し
て、走査方向に直交する軸上への射影を求めることによ
り、文字行が存在する射影の黒区間と、行間部分に対応
する射影の白区間とに分離し、黒区間に対応する帯状領
域上の矩形領域を文字行の一部分を構成する部分行と
し、さらに、隣り合う帯状領域に属する部分行の間で、
互いに重なりの大きい部分行同士を一つの文字行に属す
るものと見做して統合することにより文字行を検出する
文字行検出方式において、文書画像データにおける文字
行の実際の傾きを求め、さらに、文書画像データ中の文
字行の幅および行間隔の近似値を求め、これらの値に基
づいて文書画像を分割する帯状領域の幅を決定すること
により、任意の文字サイズ、行間隔の文書に対して、傾
いた文字行についても正確に、効率良く検出できるよう
にしたものである。
〔発明が解決しようとする問題点〕
これらの従来技術では、一つの帯状領域に属する一つ
の文字行を構成する部分行は一つである、として処理し
ているが、実際はそうではなく、文書画像のかすれや、
ノイズの影響や、帯状領域に存在する文字行中に含まれ
る文字種の影響等によって、一つの文字行を構成する部
分行が複数の部分行に分離してしまったり、逆に、複数
の文字行を構成する部分行、すなわち、本来複数になる
べき部分行が、一つの部分行に複合してしまったりす
る。従来技術では、このような場合に、正しく文字行を
検出することができないという問題点がある。
本発明はかゝる点を改善し、一つの文字行が複数に分
かれてしまったり、複数の文字行が一つに合体してしま
ったりする場合も、正しく文字行を検出可能にすること
を目的とするものである。
〔問題点を解決するための手段〕
第1図は本発明の原理ブロック図である。この図にお
いて、1は文書画像データ記憶手段、2は文字行傾き検
出手段、3は文字行幅および行間隔近似手段、4は帯状
領域幅決定手段、5は部分行検出手段、6は部分行デー
タ記憶手段、7は部分行結合手段、8は部分行分離手
段、そして9は部分行統合手段である。ここで、1〜6
および9は従来技術の構成手段と同等であり、7,8が本
発明により追加された手段である。
〔作用〕
文書画像データ記憶手段1は、文書から読み取った文
書画像データを記憶する。文字行傾き検出手段2は、所
定の走査方向に対する、文書画像中の文字行の実際の傾
きを検出する。これには前記の「文字列傾き検出装
置」を利用することができる。すなわち、文書画像デー
タに対して、所定の走査方向に直交する方向に延びる帯
状領域を、所定の異なる2つの幅W1、W2(W1<W2)で設
定し、幅W1、W2のそれぞれの帯状領域内で文書画像デー
タを走査方向に走査して走査方向に直交する軸上への1
つの文字行の射影幅b1、b2を求め、これにより走査方向
に対する文書画像データ中の文字行の実際の傾きθを、
式tanθ=(b2−b1)/(W2−W1)から算出する。
文字行幅および行間隔近似手段3は、文書画像データ
中の中央部領域や、文字サイズが最大の文字が存在する
ことが知られている場合その領域などの、適当な領域を
サンプリング的に選択して射影を求め、その射影像から
文書画像データ中の文字行の幅および行間隔の近似値を
求める。また、帯状領域幅決定手段4は、前記の実際の
文字行の傾きと、前記の文字行の幅および行間隔の近似
値に基づいて帯状領域の幅を決定する。これらには前記
の「文字行検出装置」を利用することができる。
部分行検出手段5は、文書画像を、前記帯状領域幅決
定手段で決定した幅を走査方向に有し、走査方向と直交
する方向に延びる帯状領域に分割し、帯状領域の各々に
おいて文書画像データを走査方向に走査して走査方向に
直交する軸上への射影を求め、射影が黒である区間に対
応する帯状領域上の矩形領域を、文字行の一部分を構成
する部分行と見なし、そのデータを部分行データ記憶手
段6に格納する。
部分行結合手段7は、手段3からの文字行幅を用い
て、同じ帯状領域に属する部分行で、同一の文字行を構
成する部分行であると判定した複数の部分行を一つに結
合する。また、部分行分離手段8は、手段3からの文字
行幅および行間隔を用いて、複数の文字行を構成する部
分行であると判定した部分行を、それぞれの文字行を構
成する複数の部分行に分離する。
部分行統合手段9は、帯状領域の各々に属する部分行
(これは検出手段5が検出した部分行に、結合、分離手
段7,8による修正を施したもの)と、それぞれの隣りの
帯状領域に属する部分行との、帯状領域の境界上におけ
る重なりを求め、隣接する帯状領域の部分行のうちで重
なりの大きい部分行同士を一つの文字行に属するものと
見なして統合する。統合手段9の出力は第4図(f)の
斜線部分で示す如き文字行(座標データ群)である。
このようにすれば分離した部分行、合体してしまった
部分行が発生しても正しく文字行を検出することができ
る。
〔実施例〕
部分行結合手段7および部分行検出手段8の実施例を
第2図、第3図を参照して説明する。
第2図を参照して部分行結合を説明するに、部分行結
合手段7では、まず、文字行幅および行間隔近似手段3
で求めた文字行幅の近似値に基づき、結合の候補とする
部分行の幅Wc、および、結合後の部分行の幅Wmを設定す
る。ここで、Wcは文字行幅の近似値の0.5倍程度、ま
た、Wmは文字行幅の近似値の1.2倍程度とする。Wc以下
即ち文字行幅の近似値の0.5倍程度以下なら、その部分
行は、一つの文字行の構成要素ではなく、該幅(文字行
に直角な方向の幅)方向で分離してしまった部分行の一
つであろうと推定してよく、またWm以上ならその部分行
は一つの文字行の構成要素ではあるまいとしてよく、こ
れがWc,Wmの根拠である。
次に、各帯状領域毎にその帯状領域に属する部分行に
ついて以下の処理を行う。帯状領域に属する部分行を順
次調べ、幅がWc以下かどうかを検査する。幅がWc以下な
らば、その部分行17Bと、その部分行の直前の部分行17A
を結合した場合の幅Wu、および、その部分行17Bと、そ
の部分行の直後の部分行17Cを結合した場合の幅Wdをそ
れぞれ求め、それらの値に従って結合を行う。即ち、Wu
がWm以下でかつWdがWmより大きい場合は、その部分行17
Bと、その部分行の直前の部分行17Aを結合する。WdがWm
以下でかつWuがWmより大きい場合は、その部分行17B
と、その部分行の直後の部分行17Cを結合する。本例は
このケースであり、部分行17Bと17Cを結合させて部分行
17Dとし、部分行17Aはそのまゝとする。
WuとWdがともにWm以下の場合は、WuがWd以下ならば、
その部分行17Bと、その部分行の直前の部分行17Aを結合
し、WuがWdより大きければ、その部分行17Bと、その部
分行の直後の部分行17Cを結合する。WuとWdがともにWm
より大きい場合は結合は行わない。以上の処理をすべて
の部分行について行う。
部分行17A,17B,17Cは上下関係にあるが、これは横書
き文書であるからであり、縦書き文書であればこれらは
左右に並ぶ。従ってWu,Wdは左右の部分行に対してとっ
て前記比較を行なうことになる。どの部分行同士でWu,W
dをとるかは処理順(走査順)とするのが適当である。
第3図は部分行分離手段8の説明図である。部分行分
離手段8では、各帯状領域毎にその帯状領域に属する部
分行について以下の処理を行う。即ち、帯状領域に属す
る部分行を順次調べ、幅が、文字行幅および行間隔近似
手段3で求めた文字行幅の近似値の2倍以上かどうかを
検査する。2倍以上であれば、分離の候補として、次の
処理を行う。即ち、その部分行が属する帯状領域の両隣
の帯状領域に属する部分行を調べ、少なくともどちらか
一方の帯状領域で、その帯状領域に属する部分行が以下
の条件、即ち、分離の候補となった部分行17Eとの重な
り部分の幅が前記手段3で求めた文字行幅の近似値の0.
8倍から1.2倍の範囲にはいる部分行が少なくとも二つ存
在し、二つの部分行17F,17Gの間隔が前記手段3で求め
た行間隔の近似値の1.2倍以下である、という条件を満
たすかどうかを検査し、この条件を満たす部分行が存在
すれば、その二つの部分行の間隔の中央の位置で分離候
補の部分行17Eを分離する。
本例では部分行17Eの隣りの部分行17F,17Gが上記条件
を満たし、そこで部分行17Fと17Gの行間隔18の中央線L
で部分行17Eを17E1と17E2に2分する。分離線は中央線
Lとは限らず、例えば文字の一部欠落に対処すべく重な
りを持つように、17E1の下端は17Gの上端線、17E2の上
端は17Fの下端線などとしてもよい。また本例では部分
行17Eの隣りの帯状領域で該当部分行17F,17Gが見付かっ
ているが、隣りの部分行もそのまた隣りの部分行も広幅
部分行であることが有り得る。このような場合は該当部
分行17F,17Gが見付かるまで、更に隣りの帯状領域へ探
索を進めて行く。
以上の処理を条件を満たす部分行がなくなるまで繰り
返して行う。
〔発明の効果〕
本発明によれば、一つの文字行を構成する部分行が複
数の部分行に分離したり、逆に、複数の文字行を構成す
る部分行、すなわち、本来複数になるべき部分行が一つ
の部分行に複合した場合にも、正しく文字行を検出する
ことができる。
【図面の簡単な説明】
第1図は本発明の原理ブロック図、 第2図は部分行結合手段の実施例を示す説明図、 第3図は部分行分離手段の実施例を示す説明図、 第4図は文字行および部分行などの説明図、 第5図は部分行の結合要領の説明図、 第6図は文字行の傾き検出要領の説明図である。

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】文書から読み取った文書画像データを記憶
    する文書画像データ記憶手段(1)と、文書画像データ
    に対して、所定の走査方向に直交する方向に延びる帯状
    領域を所定の異なる2つの幅W1、W2(W1<W2)で設定
    し、幅W1、W2のそれぞれの帯状領域内で文書画像データ
    を走査方向に走査して走査方向に直交する軸上への1つ
    の文字行の射影幅b1、b2を求め、これにより走査方向に
    対する文書画像データ中の文字行の実際の傾きθを、式
    tanθ=(b2−b1)/(W2−W1)から算出する文字行傾
    き検出手段(2)と、文書画像データ中の特定領域を選
    択して射影し、その射影像から文書画像データ中の文字
    行の幅および行間隔の近似値を求める文字行幅および行
    間隔近似手段(3)と、実際の文字行の傾きと文字行幅
    および行間隔の近似値に基づいて文書画像データを分割
    する帯状領域の幅を決定する帯状領域幅決定手段(4)
    と、文書画像データを、走査方向に帯状領域幅決定手段
    で決定した幅を有し、走査方向と直交する方向に延びる
    帯状領域に分割し、帯状領域の各々において文書画像デ
    ータを走査方向に走査して走査方向に直交する軸上への
    射影を求め、射影が黒である区間に対応する帯状領域上
    の矩形領域を、文字行の一部分を構成する部分行と見な
    す部分行検出手段(5)と、部分行検出手段で検出した
    部分行のデータを記憶する部分行データ記憶手段(6)
    と、帯状領域の各々に属する部分行と、それぞれの隣り
    の帯状領域に属する部分行との、帯状領域の境界上にお
    ける重なりを求め、隣接する帯状領域の部分行のうちで
    重なりの大きい部分行同士を一つの文字行に属するもの
    と見なして統合する部分行統合手段(9)とを備えた文
    字行検出装置において、 同じ帯状領域に属する部分行で、同一の文字行を構成す
    る部分行であると判定した複数の部分行を一つに結合す
    る部分行結合手段(7)と、 複数の文字行を構成する部分行であると判定した部分行
    を、それぞれの文字行を構成する複数の部分行に分離す
    る部分行分離手段(8)を備えたことを特徴とする文字
    行検出装置。
  2. 【請求項2】前記同一の文字行を構成する部分行である
    かどうかの判定に、文字行幅および行間隔近似手段
    (3)で求めた文字行幅の近似値を用いることを特徴と
    する特許請求の範囲第1項記載の文字行検出装置。
  3. 【請求項3】前記複数の文字行を構成する部分行である
    かどうかの判定に、文字行幅および行間隔近似手段
    (3)で求めた文字行幅および行間隔の近似値を用いる
    ことを特徴とする特許請求の範囲第1項記載の文字行検
    出装置。
JP62328611A 1987-12-25 1987-12-25 文字行検出装置 Expired - Lifetime JPH083831B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62328611A JPH083831B2 (ja) 1987-12-25 1987-12-25 文字行検出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62328611A JPH083831B2 (ja) 1987-12-25 1987-12-25 文字行検出装置

Publications (2)

Publication Number Publication Date
JPH01169686A JPH01169686A (ja) 1989-07-04
JPH083831B2 true JPH083831B2 (ja) 1996-01-17

Family

ID=18212207

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62328611A Expired - Lifetime JPH083831B2 (ja) 1987-12-25 1987-12-25 文字行検出装置

Country Status (1)

Country Link
JP (1) JPH083831B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5959145U (ja) * 1982-10-14 1984-04-18 共栄工業株式会社 抽斗用ペントレ−

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0344788A (ja) * 1989-07-13 1991-02-26 Fuji Facom Corp 文書画像の領域抽出方法
JP2796561B2 (ja) * 1989-10-30 1998-09-10 株式会社エフ・エフ・シー 表形式文書認識方式
JP4919492B2 (ja) * 2007-02-22 2012-04-18 大阪瓦斯株式会社 システムキッチンのガス栓取付け工法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5959145U (ja) * 1982-10-14 1984-04-18 共栄工業株式会社 抽斗用ペントレ−

Also Published As

Publication number Publication date
JPH01169686A (ja) 1989-07-04

Similar Documents

Publication Publication Date Title
US4504969A (en) Rectangular pattern recognition apparatus
EP0952442A2 (en) Visual inspection apparatus and method
JP4392907B2 (ja) 文字切出し方法
JPH083831B2 (ja) 文字行検出装置
EP0375352A1 (en) Method of searching a matrix of binary data
JP3607753B2 (ja) 文書画像の領域分割方法および装置、並びに段組種類判別方法および装置
JP4244692B2 (ja) 文字認識装置及び文字認識プログラム
JP3187895B2 (ja) 文字領域抽出方法
US20220383471A1 (en) Image processing apparatus, image processing method, and medium
JPH05128308A (ja) 文字認識装置
JPH07120392B2 (ja) 文字パターン切り出し装置
JPS596419B2 (ja) 文字切出し方式
JP2683290B2 (ja) 罫線判定方法および文字認識装置
JPS62200486A (ja) 文字読取装置
JPH04288690A (ja) 文書画像の縦書き・横書き判定方法
JP3417621B2 (ja) 特定画像検出方法及び特定画像検出装置
JP2825359B2 (ja) パターン認識方法
JPH0668777B2 (ja) 文字行検出装置
JPH0573717A (ja) 光学的文字読取装置
JPH07141467A (ja) 画像処理装置
JPH07104137B2 (ja) 対象パタ−ンの回転角検出方法
JPH04267494A (ja) 文字切り出し方法および文字認識装置
JPS63292382A (ja) 文字列傾き検出装置
JPS6348219B2 (ja)
JPS62200472A (ja) 線検出装置