JPH01169686A - 文字行検出装置 - Google Patents

文字行検出装置

Info

Publication number
JPH01169686A
JPH01169686A JP62328611A JP32861187A JPH01169686A JP H01169686 A JPH01169686 A JP H01169686A JP 62328611 A JP62328611 A JP 62328611A JP 32861187 A JP32861187 A JP 32861187A JP H01169686 A JPH01169686 A JP H01169686A
Authority
JP
Japan
Prior art keywords
line
character
partial
lines
character line
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP62328611A
Other languages
English (en)
Other versions
JPH083831B2 (ja
Inventor
Nobuyuki Sato
信幸 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP62328611A priority Critical patent/JPH083831B2/ja
Publication of JPH01169686A publication Critical patent/JPH01169686A/ja
Publication of JPH083831B2 publication Critical patent/JPH083831B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔概 要〕 文書をスキャナで読み取って得られる2値画像データか
ら、該文書中の各文字を認識する文字認識装置に用いら
れる文字行検出方式に関し、一つの文字行が複数に分か
れてしまったり、複数の文字行が一つに合体してしまっ
たりする場合も、正しく文字行を検出可能にすることを
目的とし、 文書画像データ記憶手段(1)、文字行傾き検出手段(
2)、文字行幅および行間隔近似手段(3)、帯状領域
幅決定手段(4)、部分行検出手段(5)、部分行デー
タ記憶手段(6)、および部分行統合手段(9)を設け
る文字行検出方式に、部分行統合手段(7)および部分
行分離手段(8)を追加した構成とする。
〔産業上の利用分野〕
本発明は、文書をスキャナで読み取って得られる2値画
像データから、該文書中の各文字を認識する文字認識装
置に用いられる文字行検出方式に関する。
各種の印刷物から所要事項を抽出してデータヘースを作
成する等の作業の迅速化には、印刷物中の所要部分の文
字群をスキャナで読取り、得られた画像データから文字
を認識する技術の開発が不可欠である。
文書をスキャナで読み取って得られる2値の文書画像デ
ータ(単に文書画像という)から、該文書中の各文字を
認識するには、まず、文書画像から文字行を検出し、そ
の後、文字行から個々の文字を切り出して認識するとい
う処理を行う。文書中の文字の大きさや行間の広さは、
文書によって様々である。また、文書画像中の文字行は
、文書をスキャナで読み取る際に文書対スキャナの関係
が傾いた状態で読み取りが行なわれてしまう等の理由に
より、走査方向に対してイ頃いていることが多い。
文字行が走査方向に対して傾いていると、文字行検出、
文字切り出しに支障が出る恐れがある。
即ち文字行は文書画像を走査方向12に投影して黒の多
い部分として検出できるが、第4図(a)のように文書
画像中の文字行11が走査方向に整列している場合は前
記投影は第4図(blの如くなり、黒の文字行部分13
とそれらの間の白の行間部分14に判然と分れて容易に
文字行を検出することができるが、第4図(e)の如く
文字行11が走査方向12に対して傾いていると、前記
投影は第4図(e)の如くなり、黒の文字行部分13が
互いにつながって白の行間部分がなくなり、文字行検出
が困難になる。従って文字サイズや行間隔の異なる多様
な文書に対して、傾いた文字行についても、文書画像か
ら文字行を正確に、効率良く検出する技術が必要とされ
る。
〔従来の技術〕
傾いた文字行に対する文字行検出には、文字行の分割が
有効である。即ち第4図に示すように文字行、詳しくは
走査方向に直交する鎖線15で分割(本例では4分割)
し、各区分で投影すると第4図(C1に対する結果は同
図(dlの如くなり (これは左から2番目の鎖線15
と3番目それとの間の帯状領域の走査方向投影をとった
もの)、黒の文字行部分13と白の行間部分14に判然
と分れ、容易に文字行を検出することができる。
投影は各帯状領域(16)でとるので検出される文字行
は各帯状領域で異なり、全体としては第4図(flの如
く段差の有るものになる。こ−で、帯状領域16の幅を
どの程度にするかは工夫を要する所である。幅を小にす
聰(細分する)と、投影処理回数が増え、処理時間が大
になる。幅を大にするとこの逆であるが、傾きがきつい
場合は点部分が重なってしまう。
また傾きがきつい場合は、各帯状領域の文字行く部分行
という)の段差が大きく、行間部分14が狭く、隣接帯
状領域の各部分行の端部が2つの部分行に接触する。こ
の場合は、2つの部分行のどちらと一体化させるべきか
という問題が生じる。
これらの問題に対して本発明者は■「文字行検出装置」
特願昭62−129023、■「文字列1頃き検出装置
」特願昭62−129022、■「文字行検出装置」特
願昭62−183696などを提案している。
前記■では、文書画像の中央、文字最大サイズ相当領域
などの特定領域について投影して(サンプリングを行な
って)文字サイズ及び行間隔を推定し、この推定値に従
って帯状領域の幅WをW−Mim  (c、  d) 
/janθなどと定める。こ\テcは文字サイズ、dは
行間隔、θは文字行傾斜の許容角である。また各帯状領
域の部分行は、端部での重なりが多い方と連結する。例
えば第5図の場合、部分行17aは部分行17cより部
分行17bの方が重なり幅が大であるので、部分行17
bと連結する。
前記■では文字行の傾きを次のようにして検出する。即
ち第6図に示すように幅W+の帯状領域における文字行
11の投影幅をbl、幅W2の帯状領域における文字行
11の投影幅をb2とすると、文字行11の傾き角θと
これらにはtanθ−(b2−b+)/(W2 ’W’
+)の関係があるから、これより傾き角θを求める。
前記■は、所定の走査方向に所定の幅を有しかつ走査方
向に直交する方向に延びる帯状領域に分割し、帯状領域
それぞれの中で文書画像データを走査方向に走査して、
走査方向に直交する軸上への射影を求めることにより、
文字行が存在する射影の点図間と、行間部分に対応する
射影の自区間とに分離し、点図間に対応する帯状領域上
の矩形領域を文字行の一部分を構成する部分行とし、さ
らに、隣り合う帯状領域に属する部分行の間で、互いに
重なりの大きい部分行同士を一つの文字行に属するもの
と見做して統合することにより文字行を検出する文字行
検出方式において、文書画像データにおける文字行の実
際の傾きを求め、さらに、文書画像データ中の文字行の
幅および行間隔の近似値を求め、これらの値に基づいて
文書画像を分割する帯状領域の幅を決定することにより
、任意の文字サイズ、行間隔の文書に対して、傾いた文
字行についても正確に、効率良く検出できるようにした
ものである。
〔発明が解決しようとする問題点〕
これらの従来技術では、一つの帯状領域に属する一つの
文字行を構成する部分行は一つである、として処理して
いるが、実際はそうではなく、文書画像のかすれや、ノ
イズの影響や、帯状領域に存在する文字行中に含まれる
文字種の影響等によって、一つの文字行を構成する部分
行が複数の部分行に分離してしまったり、逆に、複数の
文字行を構成する部分行、すなわち、本来複数になるべ
き部分行が、一つの部分行に複合してしまったりする。
従来技術では、このような場合に、正しく文字行を検出
することができないという問題点がある。
本発明はか\る点を改善し、一つの文字行が複数に分か
れてしまったり、複数の文字行が一つに合体してしまっ
たりする場合も、正しく文字行を検出可能にすることを
目的とするものである。
〔問題点を解決するための手段〕
第1図は本発明の原理ブロック図である。この図におい
て、1ば文書画像データ記憶手段、2は文字行傾き検出
手段、3は文字行幅および行間隔近似手段、4は帯状領
域幅決定手段、5は部分行検出手段、6は部分行データ
記憶手段、7は部分行結合手段、8は部分行分離手段、
そして9は部分行統合手段である。ここで、1〜6およ
び9は従来技術の構成手段と同等であり、7,8が本発
明により追加された手段である。
〔作用〕
文書画像データ記憶手段1は、文書から読み取った文書
画像データを記憶する。文字行傾き検出手段2は、所定
の走査方向に対する、文書画像中の文字行の実際の傾き
を検出する。これには前記■の「文字列傾き検出装置」
を利用することかできる。
文字行幅および行間隔近似手段3は、文書画像データ中
の文字行の幅および行間隔の近似値を求める。また、帯
状領域幅決定手段4は、前記の実際の文字行の1頂きと
、前記の文字行の幅および行間隔の近似値に基づいて帯
状領域の幅を決定する。
これらには前記■■の「文字行検出装置」を利用するこ
とができる。
部分行検出手段5は、文書画像を、前記帯状領域幅決定
手段で決定した幅を走査方向に有し、走査方向と直交す
る方向に延びる帯状領域に分割し、帯状領域の各々にお
いて文書画像データを走査方向に走査して走査方向に直
交する軸上への射影を求め、射影が黒である区間に対応
する帯状領域上の矩形領域を、文字行の一部分を構成す
る部分行と見なし、そのデータを部分行データ記憶手段
6に格納する。
部分行結合手段7は、手段3からの文字行幅を用いて、
同じ帯状領域に属する部分行で、同一の文字行を構成す
る部分行であると判定した複数の部分行を一つに結合す
る。また、部分行分離手段8は、手段3からの文字行幅
および行間隔を用いて、複数の文字行を構成する部分行
であると判定した部分行を、それぞれの文字行を構成す
る複数の部分行に分離する。
部分行統合手段9は、帯状領域の各々に属する部分行(
これは検出手段5が検出した部分行に、結合、分離手段
7,8による修正を施したもの)と、それぞれの隣りの
帯状領域に属する部分行との、帯状領域の境界上におけ
る重なりを求め、隣接する帯状領域の部分行のうちで重
なりの大きい部分行同士を一つの文字行に属するものと
見なして統合する。統合手段9の出力は第4図if)の
斜線部分で示す如き文字行く座標データ群)である。
このようにすれば分離した部分行、合体してしまった部
分行が発生しても正しく文字行を検出することができる
〔実施例〕
部分行結合手段7および部分行検出手段8の実層側を第
2図、第3図を参照して説明する。
第2図を参照して部分行結合を説明するに、部分行結合
手段7では、まず、文字行幅および行間隔近似手段3で
求めた文字行幅の近似値に基づき、結合の候補とする部
分行の幅Wc、および、結合後の部分行の幅Wmを設定
する。ここで、Wcは文字行幅の近似値の0.5倍程度
、また、Wmは文字行幅の近似値の1.2倍程度とする
。Wc以下即ち文字行幅の近似値の0.5倍程度以下な
ら、その部分行は、一つの文字行の構成要素ではなく、
該幅(文字行に直角な方向の幅)方向で分離してしまっ
た部分行の一つであろうと推定してよく、またWm以上
ならその部分行は一つの文字行の構成要素ではあるまい
としてよく、これがWc、Wmの根拠である。
次に、各帯状領域毎にその帯状領域に属する部分行につ
いて以下の処理を行う。帯状領域に属する部分行を順次
調べ、幅がWc以下かどうかを検査する。幅がWc以下
ならば、その部分行17Bと、その部分行の直前の部分
行17Aを結合した場合の幅Wu、および、その部分行
17Bと、その部分行の直後の部分行17Cを結合した
場合の幅Wdをそれぞれ求め、それらの値に従って結合
を行う。即ち、WuがWm以下でかつWdがWmより大
きい場合は、その部分行17Bと、その部\ 分行の直前の部分行17Aを結合する。WdがWm以下
でかつWuがWmより大きい場合は・、その部分行17
Bと、その部分行の直後の部分行17Cを結合する。本
例はこのケースであり、部分行17Bと17Cを結合さ
せて部分行17Dとし、部分行17Aはそのま\とする
WuとWdがともにWm以下の場合は、WuがWd以下
ならば、その部分行17Bと、その部分行の直前の部分
行17Aを結合し、WuがWdより大きければ、その部
分行17Bと、その部分行の直後の部分行17Cを結合
する。WuとWdがともにWmより大きい場合は結合は
行わない。以上の処理をすべての部分行について行う。
部分行17A、17B、17Cは上下関係にあるが、こ
れは横書き文書であるからであり、縦書き文書であれば
これらは左右に並ぶ。従ってW u 。
Wdは左右の部分行に対してとって前記比較を行なうこ
とになる。どの部分行同士でWu、Wdをとるかは処理
順(走査順′)とするのが適当である。
第3図は部分行分離手段8の説明図である。部分行分離
手段8では、各帯状領域毎にその帯状領域に属する部分
行について以下の処理を行う。即ち、帯状領域に属する
部分行を順次調べ、幅が、文字行幅および行間隔近似手
段3で求めた文字行幅の近似値の2倍以上かどうかを検
査する。2倍以上であれば、分離の候補として、次の処
理を行う。即ち、その部分行が属する帯状領域の両隣の
帯状領域に属する部分行を調べ、少なくともどちらか一
方の帯状領域で、その帯状領域に属する部分行が以下の
条件、即ち、分離の候補となった部分行17Eとの重な
り部分の幅が前記手段3で求めた文字行幅の近似値の0
.8倍から1.2倍の範囲にはいる部分行が少なくとも
二つ存在し、二つの部分行17F、17Gの間隔が前記
手段3で求めた行間隔の近似値の1.2倍以下である、
という条件を満たすかどうかを検査し、この条件を満た
す部分行が存在すれば、その二つの部分行の間隔の中央
の位置で分離候補の部分行17Eを分離する。
本例では部分行1,7Eの隣りの部分行17F。
17Gが上記条件を満たし、そこで部分行17Fと17
Gの行間隔18の中央線りで部分行17Eを17E+と
17E2に2分する。分離線は中央線りとは限らず、例
えば文字の一部欠落に対処すべく重なりを持つように、
17E1の下端は17Gの上端線、17E2の上端は1
7Fの下端線などとしてもよい。また本例では部分行1
7Eの隣りの帯状領域で該当部分行17F、17Gが見
付かっているが、隣りの部分行もそのまた隣りの部分行
も広幅部分行であることが有り得る。このような場合は
該当部分行17F、17Gが見付かるまで、更に隣りの
帯状領域へ探索を進めて行く。
以上の処理を条件を満たす部分行がなくなるまで繰り返
して行う。
〔発明の効果〕
本発明によれば、一つの文字行を構成する部分行が複数
の部分行に分離したり、逆に、複数の文字行を構成する
部分行、すなわち、本来複数になるべき部分行が一つの
部分行に複合した場合にも、正しく文字行を検出するこ
とができる。
【図面の簡単な説明】
第1図は本発明の原理ブロック図、 第2図は部分行結合手段の実施例を示す説明図、第3図
は部分行分離手段の実施例を示す説明図、第4図は文字
行および部分行などの説明図、第5図は部分行の結合要
領の説明図、 第6図は文字行の傾き検出要領の説明図である。

Claims (3)

    【特許請求の範囲】
  1. (1)文書から読み取った文書画像データを記憶する文
    書画像データ記憶手段(1)と、所定の走査方向に対す
    る、文書画像データ中の文字行の実際の傾きを検出する
    文字行傾き検出手段(2)と、文書画像データ中の文字
    行の幅および行間隔の近似値を求める文字行幅および行
    間隔近似手段(3)と、実際の文字行の傾きと文字行幅
    および行間隔の近似値に基づいて文書画像データを分割
    する帯状領域の幅を決定する帯状領域幅決定手段(4)
    と、文書画像データを、走査方向に帯状領域幅決定手段
    で決定した幅を有し、走査方向と直交する方向に延びる
    帯状領域に分割し、帯状領域の各々において文書画像デ
    ータを走査方向に走査して走査方向に直交する軸上への
    射影を求め、射影が黒である区間に対応する帯状領域上
    の矩形領域を、文字行の一部分を構成する部分行と見な
    す部分行検出手段(5)と、部分行検出手段で検出した
    部分行のデータを記憶する部分行データ記憶手段(6)
    と、帯状領域の各々に属する部分行と、それぞれの隣り
    の帯状領域に属する部分行との、帯状領域の境界上にお
    ける重なりを求め、隣接する帯状領域の部分行のうちで
    重なりの大きい部分行同士を一つの文字行に属するもの
    と見なして統合する部分行統合手段(9)とを備えた文
    字行検出方式において、 同じ帯状領域に属する部分行で、同一の文字行を構成す
    る部分行であると判定した複数の部分行を一つに結合す
    る部分行結合手段(7)と、複数の文字行を構成する部
    分行であると判定した部分行を、それぞれの文字行を構
    成する複数の部分行に分離する部分行分離手段(8)を
    備えたことを特徴とする文字行検出方式。
  2. (2)前記同一の文字行を構成する部分行であるかどう
    かの判定に、文字行幅および行間隔近似手段(3)で求
    めた文字行幅の近似値を用いることを特徴とする特許請
    求の範囲第1項記載の文字行検出方式。
  3. (3)前記複数の文字行を構成する部分行であるかどう
    かの判定に、文字行幅および行間隔近似手段(3)で求
    めた文字行幅および行間隔の近似値を用いることを特徴
    とする特許請求の範囲第1項記載の文字行検出方式。
JP62328611A 1987-12-25 1987-12-25 文字行検出装置 Expired - Lifetime JPH083831B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62328611A JPH083831B2 (ja) 1987-12-25 1987-12-25 文字行検出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62328611A JPH083831B2 (ja) 1987-12-25 1987-12-25 文字行検出装置

Publications (2)

Publication Number Publication Date
JPH01169686A true JPH01169686A (ja) 1989-07-04
JPH083831B2 JPH083831B2 (ja) 1996-01-17

Family

ID=18212207

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62328611A Expired - Lifetime JPH083831B2 (ja) 1987-12-25 1987-12-25 文字行検出装置

Country Status (1)

Country Link
JP (1) JPH083831B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0344788A (ja) * 1989-07-13 1991-02-26 Fuji Facom Corp 文書画像の領域抽出方法
JPH03142691A (ja) * 1989-10-30 1991-06-18 Fuji Facom Corp 表形式文書認識方式
JP2008202914A (ja) * 2007-02-22 2008-09-04 Osaka Gas Co Ltd システムキッチンのガス栓取付け工法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5959145U (ja) * 1982-10-14 1984-04-18 共栄工業株式会社 抽斗用ペントレ−

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0344788A (ja) * 1989-07-13 1991-02-26 Fuji Facom Corp 文書画像の領域抽出方法
JPH03142691A (ja) * 1989-10-30 1991-06-18 Fuji Facom Corp 表形式文書認識方式
JP2008202914A (ja) * 2007-02-22 2008-09-04 Osaka Gas Co Ltd システムキッチンのガス栓取付け工法

Also Published As

Publication number Publication date
JPH083831B2 (ja) 1996-01-17

Similar Documents

Publication Publication Date Title
JP3253356B2 (ja) 文書画像の領域識別方法
JPH06162190A (ja) 書類辺縁検出装置
KR100383858B1 (ko) 문자인식장치의 문자추출방법 및 장치
JPH01169686A (ja) 文字行検出装置
JP3607753B2 (ja) 文書画像の領域分割方法および装置、並びに段組種類判別方法および装置
JP3640488B2 (ja) 画像処理方法
JP3187895B2 (ja) 文字領域抽出方法
US7103220B2 (en) Image processing apparatus, method and program, and storage medium
JP3019897B2 (ja) 行切出し方法
JP2897439B2 (ja) コーナ位置検出方法
JPS62120585A (ja) イメ−ジスキヤナによるバ−コ−ド認識装置
US20220383471A1 (en) Image processing apparatus, image processing method, and medium
JPH05128308A (ja) 文字認識装置
JPH0713994A (ja) 文字認識装置
KR930012142B1 (ko) 문서인식장치의 개별문자 절출방법
JP2813601B2 (ja) 表形式文書認識装置
JP2964980B2 (ja) 光学的文字認識における直線成分検出方法及び装置
JP2683290B2 (ja) 罫線判定方法および文字認識装置
JPH027183A (ja) 文字切出装置
JPH10240863A (ja) タイミングマーク検出方法および記憶媒体
JPH0668777B2 (ja) 文字行検出装置
JPS63292382A (ja) 文字列傾き検出装置
JPH1097588A (ja) 罫線認識方法、表処理方法および記録媒体
JP2004246929A (ja) 文書画像の領域分割方法および装置
JPS62281084A (ja) 文字行傾き検出方式