JPH0390971A - 文字背景処理装置 - Google Patents

文字背景処理装置

Info

Publication number
JPH0390971A
JPH0390971A JP22712089A JP22712089A JPH0390971A JP H0390971 A JPH0390971 A JP H0390971A JP 22712089 A JP22712089 A JP 22712089A JP 22712089 A JP22712089 A JP 22712089A JP H0390971 A JPH0390971 A JP H0390971A
Authority
JP
Japan
Prior art keywords
background
black
run
image data
length
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP22712089A
Other languages
English (en)
Inventor
Koshi Sakurada
桜田 孔司
Koji Ito
伊東 晃治
Yoshiyuki Yamashita
山下 義征
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP22712089A priority Critical patent/JPH0390971A/ja
Publication of JPH0390971A publication Critical patent/JPH0390971A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Image Processing (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) この発明は文字背景処理装置、特に文字背景部の網点、
格子模様等の画像処理の妨げとなるデ夕を除去するため
の装置に関する。
(従来の技術) 画像処理では通常、CCDセンサ等を用いて文書を光学
的1こ走査し白黒2値に量子化された原画像データを得
、この原画像データを画像処理装置に入力する。原画像
データは文字部のデータと文字背景部のデータとから成
る。一般に、背景部のデータは画像処理の妨げとなる不
要な雑音を含むことが多く、従って画像処理のために背
景部のデータから雑音を除去する処理を行なうことが多
い。
また文書の中には新開の見出し等に見られるように文字
背景部に網点、斜線等の模様が入っていることかある。
この場合、背景部のデータは模様のデータを含む。模様
データを含む原画像データの画像処理を行なうと、初期
の画像処理を行なえなかったり画像処理の効率か悪くな
ったり等の不都合を生しる。例えば光学式文字読取装置
の文字認識において、模様のデータを除去しないまま文
字を切出して認識を行なうと認識結果を得られないこと
がある。そこで、一般には模様のデータを除去してから
文字の切出しを行なう。
このような背景部の処理を行なう従来手法としてマスク
を用いた背景処理(例えば文献工:ディジタル画像処理
 Azriel Rosenfeld、 Avinas
hC,Kak著 近代科学社 昭和53年12月10日
発行p200〜201」参照)がある。
このマスクを用いた従来の背景処理では、注目画素と、
注目画素の近傍画素とを参照し、注目画素が黒画素のと
き所定個数以上の近傍画素が白画素であれば当該注目画
素を白画素に変更し、また注目画素が白画素のとき所定
個数以上の近傍画素か黒画素であれば当該注目画素を黒
画素に変更する。このようにして注目画素の修正を行な
うことによって、背景部に存在する孤立点(いわゆるご
ま塩雑音)を除去する。従来のマスクを用いた背景処理
は、主として孤立点を除去するために用いる処理である
以下、第7図〜第9図を参照し従来のマスクを用いた背
景処理につき説明する。第7図(A)〜(C)は文字背
景部に模様を有する原画像データの例を示す図、第8図
は原画像データの背景処理を行なって得られる背景処理
後の画像データを示す図、及び第9図(A)〜(B)は
背景処理に用いるマスクを示す図である。尚、第7図に
おいては、図面の簡単化のため1こ文字−文字部を含む
原画像データのみを示したか、当然のことながら原画像
データは複数個の文字を含んでいてもよい。
第7図(A)、CB)及び(C)は文書の所定の読取り
範囲10内を光学的に読取って得た2値の原画像データ
12.14及び16ヲ示し、原画像データ12.14及
び16はそれぞれ文字背景部に網点模様、右上り456
の斜線、及び、右上り45°及び右下り45°の斜線か
ら成る格子模様を有する原画像データの例である。また
第9図(A)において示すマスク18は3×3の局所領
域を示し、このマスク18は注目画素すと当該画素すの
8近傍画素al  (iは1≦i≦8の自然数)とから
成る。同様に第9図(B)において示すマスク20は5
×5の局所領域ヲ示し、このマスク20は注目画素dと
当該画素dの24近傍画素C>  (jは1≦j≦24
の自然数)とから戒る。
ここで、マスク18ヲ用いて原画像データ12の背景処
理を行なうものとする。この場合、走査画素を注目画素
すとして原画像データ12を画素単位に走査してゆき、
注目画ib及び近傍画素asl調べる。注目画素すが黒
画素であれば近傍画素a。
のなかの白画素の個数Wを所定の閾値T)lLwと比較
し、W≧THLwであるときに限り5生白画素すを白画
素に変更する。また注目画素すが白画素であれば近傍画
素alのなかの黒画素の個数Bを所定の閾値THLaと
比較し、B≧THL[Iであるときに限り注目画素すを
黒画素に変更する。
注目画素すが網点であるとき網点の大きざを例えば1画
素の大きさとすると、近傍画素aIは全て白画素となり
、背景部から網点の除去が行なえる。しかも原画像デー
タ12では網点を格子点状に配置しでいるので網点は孤
立点と同等とみなせ、従って第9図にも示すように孤立
点の除去の場合と同様に、文字部の欠けを生しないよう
に網点を除去した画像データ22を得ることができる。
網点の大きさが1画素を越える場合にはマスク18より
も大きいマスク例えばマスク20ヲ用いることによって
、文字部の欠けを生しないように網点の除去を行なえる
(発明が解決しようとする課題) しかしながら上述の従来の背景処理では、第7図(B)
や(C)に示すような背景部に斜線を有する画像データ
14ヤ16の背景処理を行なう場合、文字部の大きな欠
けを生したり背景処理に要する時間が増大したつすると
いう問題点があった。
例えば原画像データ14において斜線の幅が1画素であ
るとし原画像データ14をマスク18ヲ用いて走査する
ものとする。この場合に、注目画素すが斜線を構成する
黒画素となるときマスク18において少なくとも画素す
、a3、asかともに黒画素となることがあり、従って
このとき注目画素bt白画素に変更するためには閾値T
HLw%少なくとも6以下に設定する必要がある。しか
しなからTHLヮを6以下とすることによって文字部特
に文字部のエツジ部分のデータをも黒画素から白画素に
変更しでしまい、これがため文字部の欠けを生ずること
かある。しかも一般には、斜線の幅は1画素とは限らな
いのでこのことを考慮すると閾値THLwE:6よりも
小さくする必要がある。THLwIより小さくしなけれ
ばならない結果、文字部の欠けがより太きくなるという
問題点がある。文字部の欠けの問題はマスクの大きさの
大小にかかわらず生ずる問題である。
このように従来の背景処理では、例えば斜線が背景部に
存在するような場合に、文字部の画質を充分に維持しつ
つ背景処理を行なうことが困難である。また文字部の画
質を充分に維持するため、オペレータは除去すべき背景
部のバタンの線幅に応した適切な大きざのマスクを選択
し、選択したマスクの大きさを画像処理装置に入力しな
ければならなかった。
ざらに一般には斜線の幅が3画素を越える場合が多いが
、3×3のマスク18を用いて背景処理を行なうと幅か
3画素を越える斜線を背景部から除去できない。そこで
斜線の幅が3画素を越える場合にマスク18よりも大き
な例えば5X5のマスク20ヲ用いると斜線の除去を行
なえるようになるが、マスク20ヲ用いた背景処理では
、注目画素を白画素及び黒画素のいずれとするかを決定
するために参照すべき近傍画素C1の個数が、マスク1
8を用いる場合よりも増加する。これがため背景処理に
要する処理時閉が増加するという問題点がある。処理時
間は参照する近傍画素の個数に比例して増加するもので
ある。
この発明の目的は上述した従来の問題点を解決し、従来
よりも文字部の欠けを低減できかつ高速度に背景処理を
行なえる文字背景処理袋Mを提供することにある。
(課題を解決するための手段) この目的の達成を図るため、この発明の文字背景処理装
置は、画像データ記憶部に格納された2値の画像データ
を一つ又は複数の方向に走査し、走査線上の黒ランの長
′2!ヲ検出する黒ラン検出部と、黒ランの長さに関す
るヒストグラムを作成しこのヒストグラムを用いて、白
画素に変更される黒ランの長さの範囲を設定する判定基
準決定部と、判定基準決定部が設定した長さの範囲の長
さを有する黒ランを検出する背景ラン検出部と、背景ラ
ン検出部が検出した黒ランを白画素に変更するための書
換え信号を出力する背景除去部とを備えて成ることを特
徴とする。
(作用) このような構成の文字背景処理装置によれば、画像デー
タを一つ又は複数の方向に走査して走査線上の黒ランの
長さを検出し、黒ランの長さに関して作成したヒストグ
ラムを用いて、白画素に変更される黒ランの長ざの範囲
Tを設定する。そして長さの範囲T内の長さを有する黒
ランを検出し、この検出した黒ランを白画素に変更する
ためのtr換え信号を出力する。
長さの範囲Tは、黒ランを、文字部を構成する黒ラン(
文字ラン)及び文字部を構成しない黒ラン例えば背景部
の斜線、網点等を構成する黒ラン(背景ラン)のいずれ
かに分類するためのものであり、この範囲Tの設定は、
黒ランの長さに関するヒストグラムに基づいて行なえる
ここで−例を挙げて説明する。例えば、斜線模様、格子
模様、網点等の周期的バタンか背景部に存在する画像デ
ータを走査する場合を考えると、走査線は文字部よりも
頻繁に周期的バタンを横切り、従って黒ランの長さに関
するヒストグラムにおいで度数の高い長ざの黒ランは背
景ラン及び度数の低い長ざの黒ランは文字ランとみなす
ことができる。これに加え新開の見出し等では、一般に
周期的バタンの線幅か文字部の線幅よりも狭くなるとい
うことを考え合せると、ヒストグラムの度数が最大とな
る黒ランの長さよりも大きくかつ度数が零となる黒ラン
の長さの最小値を判定基′f$値STとして検出し、こ
の基準値STに基づき範囲Tを設定すればよい。この場
合、例えば基準値ST以下の長ぎの黒ランを背景ランと
みなして検出すればよい。
このように、背景処理の対象となる文書に関して、走査
線が文字部及び背景部の黒画素部分を横切る頻度と文字
部及び背景部の黒画素部分の走査線上での長ぎの大小関
係とを予め調べ或は予想しておき、これら頻度及び大小
関係1こ基づき長さの範囲Tを定義できる。
背景ランとみなされた黒ランを白画素に変更することに
よって、画像処理の妨げとなる黒ランを原画像データか
ら除去できる。
(実施例) 以下、図面を参照しこの発明の実施例につき説明する。
尚、図面はこの発明が理解できる程度に概略的に示され
ているにすぎず、従って各構成成分の寸法、形状、配設
位置、信号線の接続関係、入出力信号、動作の流れ、数
値的条件を図示例に固定するものではない。
表E目4處 第1図はこの発明の一実施例の構成の説明に供する機能
ブロック図である。
同図に示すように、この実施例の文字背景処理袋M24
は、画像データ記憶部34に格納された2値の画像デー
タを一つ又は複数の方向に走査し、走査線上の黒ランの
長さを検出する黒ラン検出部26と、黒ランの長さに関
するヒストグラムを作成しこのヒストグラムを用いて、
白画素に変更される黒ランの長さの範囲を設定する判定
基準決定部32と、判定基準決定部32が設定した長さ
の範囲の長さを有する黒ランを検出する背景ラン検出部
28と、背景ラン検出部28が検出した黒ランを白画素
に変更するための書換え信号を出力する背景除去部30
とを備えて成る。
この実施例では、例えば画像読取部36からの原画像デ
ータを画像データ記憶部34の画像メモリに格納する。
画像読取部36は、図示せずも、原稿等の記録媒体から
の反射光を白黒2値の量子化された電気信号(原画像デ
ータ)に変換しこの原画像データを画素単位に出力する
光電変換部と、記録媒体の走査のために光電変換部及び
記録媒体を相対的に移動させる走査機構とを備えて戊る
。白画素の画素値を例えばrQ」及び黒画素の画素値を
例えば「1」とする。白画素は記録媒体の地を表す画素
及び黒画素は文字部や文字背景部の模様、雑音等を表す
画素である。
以下、より詳細にこの実施例につき説明する。
(黒ラン検出部) この実施例の黒ラン検出部26は、任意好適なひとつの
方向を主走査方向として画像データ記憶部34の画像メ
モリを走査し、画像メモリに保存されている画像デ〜り
中の、黒ランの始端及び終端位置と画像データの主走査
方向における黒ラフの長さとを検出する。または任意好
適な複数の方向を主走査方向として各主走査方向毎に、
画像メモリを走査して画像メモリに保存されている画像
データ中の、黒ラフの始端及び終端位置と黒ランの長さ
とを検出する。
主走査方向の設定個数は、例えば網点や1本の斜線が背
景部に存在する場合にはひとつとし、例えば相交差する
二本の斜線が背景部に存在する場合にはふたつとすれば
よい。尚、ここでは走査線上で連続する複数個の黒画素
の塊及び走査線上の孤立する黒画素を黒ランと称する。
ひとつの方向を主走査方向とした場合、黒ラン検出部2
6は原画像データのみを走査する。また複数の方向を主
走査方向とした場合、複数の走査方向のすべでの方向に
おいで原画像データのみを走査するか或は複数の走査方
向の最初のひとつの走査方向においてのみ原画像データ
を走査し最初のひとつを除く残りの方向についでは書換
え信号に基づいて書換えられた画像データを走査する。
さらに黒ラン検出部26は画像データ記憶部34の画像
メモリ上にX−Y座標系を仮想的1こ設定し、このX−
Y座標系で表現される画素位置(X、Y)をアドレスに
変換する。そして例えば、走査線に沿う方向をX軸方向
としでX−Y座標系を設定し、X軸方向を画像メモリの
主走査方向及びY軸方向を画像メモリの副走査方向とし
て画素位置(X、Y)のアドレスの画像データを読出し
て画像メモリを走査する。
黒ラン検出部26は画素単位に、読出した画像データの
画素値を調べて当該画像データは黒画素及び白画素のい
ずれであるかを判定する。そして画素値の変化に基づい
て黒ランの始端位置及び終端位置を検出する。白画素の
次に黒画素を検出したときは当該黒画素のX座標を始端
位置×1としで及び黒画素の次に白画素を検出したとき
は当該黒画素のX座標を終端位M X Lとしで、検出
し保存する。
そして黒ラン検出部26は終端位置X、を検出すると、
当該終端位置×、を検出した黒ランの始端位置×工及び
終端位置XLから、当該黒ランの、画像データ主走査方
向における長ざRLt検出しこの長さRLを出力する。
(判定基準決定部) この実施例の判定基準決定部32は、画像データの主走
査方向別に長2RLのヒストグラムを作成し、このヒス
トグラムに基づき白画素に変更される黒ランすなわち背
景ランとみなされる黒ランの長さの範囲Tを設定する。
長さの範囲下は画像データの主走査方向別に設定される
この実施例ではヒストグラムの度数が最大となる黒ラン
の長さRLよりも大きくかつヒストグラムの度数が零と
なる黒ランの長ざRしの最小(11を判定基準値STと
して検出し、基準値STより短い長さRしの範囲を範囲
Tとする。
(背景ラン検出部) 背景ラン検出部28は、黒ラン検出部26から長さRL
を入力し、この長さRLが、当該長ざRLの黒ラン検出
部 T内の長さであるかどうかを判定する。
背景ラン検出部28は、Rし≧STとなる長ざRLの黒
ランは文字ランであるとみなして文字ランを検出したこ
とを表す第一判定結果を、及びRL< STとなる長さ
RLの黒ランは背景ランであるとみなして背景ランを検
出したことを表す第二判定結果を出力する。
(背景除去部) 背景除去部30は、背景ラン検出部28の判定結果が第
一判定結果である場合には書換え信号を出力せず、背景
ラン検出部2日の判定結果が第二判定結果である場合に
は、当該第二判定結果を得た黒ランは背景ランであると
みなして当該背景ランの始端位Mx丁及び終端位置XL
と副走査位fiVとを黒ラン検出部26から入力()、
これら位置XL、×1及びYに基づいて当該背景ランを
構成する黒画素の位置を、画像データ記憶部34の画像
メモリにおけるアドレスに変換する。
この実施例では、このアドレスを書換え信号とする。N
換え信号をアドレスとする場合には、画像データ記憶部
34がこの書換え信号のアドレスに格納される黒画素を
白画素に変更する。尚、背景除去部30が、検出した背
景ラフのアドレスに格納される画像データ記憶部34の
黒画素を白画素に書換えるようにしてもよい。この場合
には検出した背景ランのアドレスとこのアドレスに保存
される白画素信号とを書換え信号としで出力する。
背景除去部30は、黒ラン検出部26が所定の一つの方
向にのみ画像メモ1)の画像データを走査する場合には
、背景ラン検出部28から第二判定結果を得る毎に書換
え信号を出力するか或は当該ひとつの方向の走査を終了
するまで書換え信号を保存しでおき当該ひとつの方向の
走査が終了したら書換え信号を出力する。この場合には
、黒ラン検出部26は書換え信号の出力タイミングによ
らず常に原画像データを走査することとなる。
黒ラン検出部26が所定の複数の方向に画像メモリの画
像データを走査する場合には、書換え信号の出力タイミ
ングによって、黒ラン検出部26が走査する画像メモリ
の画像データは原画像データとなったり′iiI換え信
号によって書換えられた画像データとなったりする。例
えば背景ラン検出部28から第二判定結果を得る毎に書
換え信号を出力するか或はひとつの方向に走査を終了す
るまで書換え信号を保存しておき当該ひとつの方向の走
査が終了したら書換え信号を出力するようにした場合に
は、黒ラン検出部26は所定の複数の方向の最初のひと
つの方向に走査するときは原画像データを走査し最初の
ひとつの方向を除く残りの方向に走査するときは書換え
信号によってii換えられた画像データを走査すること
となる。また例えば黒うン検出部26が所定の複数の方
向のすべでの方向に画像メモリの画像データを走査し終
えてから書換え信号を出力するようにした場合には、黒
ラン検出部26は所定の複数の方向のすべでの方向にお
いて原画像データのみを走査することとなる。
尚、画像データ記憶部34は背景処理(背景ランの黒画
素を白画素に変更する処理)が終わると、次段の装置3
7例えばファクシミ1ノや文字認識装置に対して背景処
理を終えた画像データを出力する。
5     の   4 日 以下、第2図〜第5図を参照し、この実施例における背
景処理につき一例を挙げて概略的に説明する。尚、第2
図(A)、第3図(A)及び第4図(A)においては、
図面の簡単化のため、画像データ記憶部に保存される画
像データとして文字−文字のみを含む画像データを示し
たが、当然のことながら画像データ記憶部に保存される
画像データは複数個の文字を含んでいてもよい。
ます第7図及び第5図を参照し、判定基準決定部32が
作成するヒストグラム及び設定する判定基準値STにつ
き説明する。
第5図は黒ランの長さに関するヒストグラムの例を示す
ものであり、第5図において縦軸は度数り及び横軸は画
像データの主走査方向に沿)た黒ランの長さ(走査線上
での黒ラフの長さ)RLを示す。同図(A)は第7図(
A)の画像データ12に関して主走査方向を水平走査(
文字列に沿う方向)とした場合に得られるヒストグラム
及び同図(8)は第7図(8)の画像データ14に関し
て主走査方向を左斜め45度方向(文字列に沿う方向か
ら時計方向にほぼ45度ずれた方向)とした場合に得ら
れるヒストグラムを示す。尚、これらヒストグラムは黒
ラフの長さの分布状態を概略的に示したものであって厳
密に描かれたものではない。
例えば第7図(A)に示す画像データ12の主走査方向
を水平方向とした場合のヒストグラムでは、第5図(A
)にも示すように網点の黒ランに対応する山(度数が正
の値となる部分)4o1と文字「申」の黒ランに対応す
る山402.403とができる。
第7図CB)に示す画像データ14の主走査方向を左斜
め45度方向とした場合のヒストグラムでは、第5図(
B)にも示すように斜線の黒ランに対応する山405と
文字「申」の黒ランに対応する山406とができる。
また第7図(C)に示す画像データ16の主走査方向を
左斜め45度方向及び右斜め45度方向(文字列に沿う
方向から反時計方向にほぼ45度ずれた方向)とした場
合のヒストグラムでは、いずれの主走査方向の場合も、
第7図(B)の画像データ14と同様の双峰的な(厳密
には双方ではない)山ができる。
第7図からも理解できるように、画像データ14.16
或は18では背景部の網点、斜線或は格子模様の幅が文
字「申」の線幅よりも充分に小さくしかも走査線は文字
「申」よつも背景部の模様のほうをより頻繁に横切るこ
ととなり、これがため背景部の模様の黒ラン1こ対応す
る山(例えば山401.405)の高さが最も高くなる
従って背景部の黒画素部分の幅が文字部の黒画素部分の
線幅よりも充分に小さくしかも走査線が背景部の黒画素
部分をより頻繁に横切るような場合には、例えば、度数
か最大となる黒ラフの長さRLよりも大きくかつ度数が
零となる長ざ8しの最小値を基準値STとし、基準値S
Tより短い長ざR[の黒ランを背景ランとみなして白画
素に変更すればよいことが理解できる。この実施例にお
いて第5図(A)及び(B)のヒストグラムから検出さ
れる基準値STをそれぞれ符号421及び422を付し
て示した。
次に第2図〜第4図を参照し背景ランを白画素に変更す
る処理につき説明する。
第2図は文字背景部に網点がある場合の背景処理の説明
に供する図である。同図(A)は文字背景部に網点か存
在する画像データ12を示し、同図(A)において38
1は副走査位IYIにおける走査線、×51及び×51
は走査線381上における読取範囲10の一方及び他方
の側の端縁位置を示す。同図(8)及び(C)は走査線
381上において背景処理前及び背景処理後に存在する
黒ランの分布状態を示し、これら図(B)及び(C)の
横軸は走査線381に沿う方向のX軸及び縦軸は画素値
を示す。
ここで画像読取部36からの画像データ12ヲ画像デー
タ記憶部34の画像メモリに保存したものとし、背景ラ
ンの除去のために黒ラン検出部26は主走査方向を水平
方向として画像メモリを走査するものとし、背景除去部
30は第二判定結果を得る毎に書換え信号を出力するも
のとする。
黒ラン検出部26は第2図(B)に示すような分布状態
の黒ランを走査線381上で順次に検出し黒ランを検出
する毎に黒ランの長さを検出し出力する。そして背景う
)検出部28は黒ランの長さ8しを入力する毎に、黒ラ
ンの長さを判定基準値ST+と比較して検出した黒ラン
が文字ラン及び背景ランのいずれであるかの判定を行な
い判定結果を出力する。判定基準値STIは画像データ
12を水平走査して得た長ざRLに基づき得た判定基準
@STである。
背景除去部30は背景ラン検出部28から第二判定結果
を入力する毎に書換え信号を出力する。背景除去部30
は第二判定結果を入力した場合には、当該第二判定結果
を得た黒ランは背景ランであるとみなしで当該背景ラン
の始端位置XT及び終端位置XLと副走査位MY1とを
黒ラン検出部26から読込み、当該背景ランを構成する
各黒画素の×、Y座標を得る。そして背景除去部30は
当該背景ランを構成する各黒画素のX、Y座標を、画像
データ記憶部34の画像メモリにおけるアドレス1−な
わち書換え信号に変換する。
この書換え信号に基づいて、画像データ記憶部34に保
存されている画像データ中の背景ランの各黒画素を白画
素に書換える。このような背景処理によって、第2図(
B)に示す原画像データから第2図(C)に示すように
文字ランとみなされる黒ランのみが黒画素として残存す
る背景処理後の画像データが得られる。
文字背i部に網点が存在する場合の背景処理を行なう場
合、黒ラン検出部26は判定基準値ST+の検出のため
及び背景ラフの除去のために画像データを二度走査する
たけて背景処理を行なうことができる。
次に第3図ヲ参照する。第3図は文字背景部に交差しな
い一方向の斜線例えば右斜め45°の斜線のみがある場
合の背景処理の説明に供する図である。同図(A)は文
字背景部に右斜め45°の斜線が存在する画像データ1
4ヲ示し、同図(A)において382は副走査位置Y2
における走査線、Xs2及びXl:2は走査線382上
における読取範囲10の一方及び他方の側の端縁位置を
示す。同図(B)及び(C)は走査線382上において
背景処理前及び背景処理後に存在する黒ラフの分布状態
を示し、これら図CB)及び(C)の横軸は走査線38
2に沿う方向のX軸及び縦軸は画素@を示す。
ここで画像読取部36からの画像データ12を画像デー
タ記憶部34の画像メモリに保存したものとし、背景ラ
シの除去のために黒ラン検出部26は主走査方向を左斜
め45′″方向として画像メモリを走査するものとし、
背景除去部3oは第二判定結果を得る毎に書換え信号を
出力するものとする。
黒ラン検出部26は第3図(8)に示すような分布状態
の黒ランを走査線382上で順次に検出し黒ランを検出
する毎に黒ラフの長さを検出し出力する。そして背景ラ
ン検出部28は黒ランの長さを入力する毎に、黒ランの
長さを判定基準値ST2と比較しで検出した黒ラン力く
文字ラン及び背景ランのいずれであるかの判定を行ない
判定結果を出力する。基準値ST2は画像データ14を
左斜め走査して得た長さRLに関するヒストグラムから
求めた判定基準値STである。
背景除去部30は背景ラン検出部28から第二判定結果
を入力する毎に書換え信号を出力する。背景除去部30
は第二判定結果を入力した場合には、当該第二判定結果
を得た黒ランは背景ラシであるとみなしで当該背景ラン
の始端位置XT及び終端位置×、と副走査位置Y2とを
黒ラン検出部26から読込み、当該背景ランを構成する
各黒画素のX、Y座標を得る。そして背景除去部3oは
当該背景ランを構成する各黒画素のx、Y座標を、画像
データ記憶部34の画像メモリにおけるアドレスすなわ
ち書換え信号に変換する。
この書換え信号に基づいて、画像データ記憶部34に保
存されでいる画像データ中の背景ラシの各黒画素を白画
素に書換える。このような背景処理によって、第3図(
B)に示す原画像データから第3図(C)に示すように
文字ラシとみなされる黒ランのみが黒画素としで残存す
る背景処理後の画像データが得られる。
文字背景部に交差しない一方向の斜線のわが存在する場
合の背景処理を行なう場合、黒ラン検出部26は判定基
準値ST2の検出のため及び背景ランの除去のために画
像データを二度走査するだけで背景処理を行なうことが
できる。
次に第4図を参照する。第4図は文字背景部に交差する
二方向の斜線例えば右斜め45゛及び左斜め45°の斜
線がある場合の背景処理の説明に供する図である。同図
(A)は文字背景部に右斜め45°及び左斜め45°の
斜線が存在する画像データ16を示し、同図(A)にお
いて383は副走査位fiY3における走査線、Xs3
及びXE3は走査線383上における読取範囲10の一
方及び他方の側の端縁位置を示す。同図(B)及び(C
)は走査線383上においで背景処理前及び背景処理後
に存在する黒ランの分布状態を示し、これら図(B)及
び(C)の横軸は走査線383に沿う方向の×軸及び縦
軸は画素値を示す。
ここで画像読取部36からの画像データ12を画像デー
タ記憶部34の画像メモリに保存したものとし、背景ラ
ンの除去のために黒ラン検出部26は主走査方向を左斜
め45°方向及び右斜め45°方向として画像メモリを
走査するものとし、背景除去部30は第二判定結果を得
る毎に書換え信号を出力するものとする。
黒ラン検出部26は第4図(B)に示すような分布状態
の黒ランを走査線383上で順次に検出し黒ランを検出
する@に黒ランの長さを検出し出力する。そして背景ラ
ン検出部28は黒ランの長さを入力する毎に、黒ランの
長さを判定基準値ST3と比較しで検出した黒ランが文
字ラン及び背景ランのいずれであるかの判定を行ない判
定結果を出力する。基準値ST3は画像データ16を右
斜め45度方向に走査しで得た長さRLに関するヒスト
グラムから求めた判定基準値STである。
背景除去部30は文字背景部28がら第二判定結果を入
力する毎に1ii″換え信号を出力する。背景除去部3
0は第二判定結果を入力した場合には、当該第二判定結
果を得た黒ランは背景ランであるとみなしで当該背景ラ
ンの始端値MXT及び終端位置XLと副走査位置Y3と
を黒ラン検出部26がら読込み、当該背景ランを構成す
る各黒画素のX、Y座標を得る。そして背景除去部30
は当該背景ランを構成する各黒画素のX、Y座標を、画
像データ記憶部34の画像メモリにおけるアドレスすな
わち書換え信号に変換する。
このM換え信号に基づいて、画像データ記憶部34に保
存されている画像データ中の背景ラフの各黒画素を白画
素fこN換える。このような背景処理によって、第4図
(B)に示す原画像データから第4図(C)に示すよう
に文字ランとみなされる黒ランのみが黒画素として残存
する背景処理後の画像データが得られる。
右斜め45°方向を主走査方向とする原画像データの走
査によって、画像データ16がら第3図(A)に示すよ
うに書換えられた画像データ14か得られ書換えられた
画像データ14が画像データ記憶部34に格納されるこ
ととなる。
次いで画像データ記憶部34の書換えられた画像データ
14ヲ左斜め45°方向を主走査方向として走査するこ
とによって、例えば第8図に示す場合と同様な、文字ラ
シとみなせる黒ラフのみから成る画像データを得ること
かできる。
文字背景部に交差する二方向の斜線が存在する場合の背
景処理を行なう場合には、黒ラン検出部26は、各主走
査方向別に判定基準値を検出するために右斜め及び左斜
め45°方向の走査と、各主走査方向別に背景ランを除
去するために右斜め及び左斜め45°方向の走査とを行
なうだけで、背景処理を行なうことかできる。
上述した第2図、第3図及び第4図を参照した説明では
、黒ラン検出部26が画像データ記憶部34の画像デー
タを走査する際の主走査方向をそれぞれ水平方向のみ、
右斜め45°方向のみ、及び、左斜め45゛方向及び右
斜め45°方向の2方向としたが、一般には、黒ラン検
出部26の主走査方向における背景ランの長さが最も短
くなるように黒ラン検出部26の主走査方向を設定する
のが最も好ましく、このように最も短くなるように主走
査方向を設定することによって背景ラン及び文字ランの
検出精度を向上することができる0例えば周期的に配置
された直線バタ〜ンの背景ランが文字背景部に存在する
ことが予めわかっている場合には、当該M線パターンに
直交する方向に黒ラン検出部26の主走査方向を設定す
るとよい。
目   ・な    の− 次に、この発明の理解を深めるためにこの実施例のより
具体的な動作の一例につき説明する。
尚、以下の説明では、黒ラン検出部26の画像メモリの
主走査方向をひとつの方向のみとした場合の動作の流れ
につき説明するが、黒ラン検出部26の画像メモリの主
走査方向を複数設定する場合には、複数の主走査方向の
それぞれについで、例えば以下に説明する動作と同様の
動作を行なうようにすればよい。
第6図はこの実施例の具体的動作の流れの一例を示す図
であり、同図(A)は判定基準値STの検出に着目した
動作の流れ及び同図(B)は背景ランの検出及び除去に
着目した動作の流れを示す。
以下の説明では、走査線に沿う方向をX軸方向として画
像デーク記憶部34の画像メモリ上に×−Y座標系を仮
想的に設定し、このX−Y座標系で画像メモリ上の各画
素位Nを表現するものとする。
まず第6図(A)を参照し判定基準値STの検出に着目
した動作の流れにつき説明する。
画像読取部36が記録媒体の所定の読取範囲の画像デー
タを画像データ記憶部34に格納し終えると、文字背景
処理装置24は判定基準値STを検出するための処理を
開始する(開始)。
基準値ST検出のための処理が始まると、まず黒ラン検
出部26は走査線に沿う方向と垂直な方向にお1fる読
取範囲10の一方の側の端縁位置Ys及び他方の側の端
縁位置Ye  (但しYe>Ys)を設定する(Sl)
。例えば黒ラン検出部26の画像メモlノの主走査方向
を水平方向、左斜め45゛方向及び右斜め45°方向と
した場合に設定される位置Ys及びYεをそれぞれ、第
2図(A)、第3図(A)及び第4図(A)に示した。
Slの次に黒ラン検出部26は副走査位置YとしてY、
を設定しくS2)、次いで副走査位置Yの走査線上にお
ける読取り範囲10の一方の端縁位置×5及び他方の端
縁値iXe  (但し×6≧Xs)を設定する(S3)
。例えば第2図(A)、第3図(A)及び第4図(A)
にそれぞれ示すXsl、×、2及びX、3が一方の端縁
値NX、となりまたX、l、×52及びXE3が他方の
端縁位置×5となる。
次に黒ラン検出部26は走査線上における主走査位置X
としてX、を設定すると共に情報Pを仮想的に白画素に
設定する(S4)。情報Pは主走査位置Xのひとつ前の
位11X−1における走査線上の画像データが白画素及
び黒画素のいずれてあったかを表す情報であり、この例
では例えば情報P=Oのとき位!X−1における走査線
上の画像データが白画素であったことを表し及び例えば
情報P=1のとき位置X−1における走査線上の画像デ
ータが黒画素であったことを表すものとする。
S4の次tこ黒ラン検出部26は画素位置(X、Y)8
アドレスに変換し、変換したアドレスに保存される画像
データを画像データ記憶部34の画像メモリから読み込
み画素位置(X、Y)の画像データは黒画素か否かを判
定する(S5)。
S5の判定結果が黒画素であった場合には次に黒ラン検
出部26は情報P=○であるが否かを調べる(S6)。
S6で情報P=○であれば走査線上で白画素の次に黒画
素を検出したことを表し、従って黒ラン検出部26は黒
ランの始端位@Xt?検出しものとみなして主走査位置
×を始端位置xTとして保存しざらにこれと共に情報P
をP=1に書換え(S7)、次いでS8を行なう。
またS6で情報P=1であれば走査線上で黒画素の次に
黒画素が連続していることを表すので、黒ラン検出部2
6はS7を行なわずにS8を行なう。
S5の判定結果が白画素であった場合には、黒ラン検出
部26は情報P=1であるか否かを調べる(S9)。
S9で情報P;1であれば走査線上で黒画素の次に白画
素を検出したことを表し、従って黒ラン検出部26は黒
ランの終端位置X、を検出したものとみなして主走査位
置×のひとつ前の位jilX−1を終端位置X、としで
保存すると共に情報PをP=○に書換え(S 10) 
、次いで当該終端位置XLを検出した黒ランの長ざRL
を例えば次式(1)に従って検出し検出した長さRLW
出力する(Sll)。
RL=  (X−1)  −XT +  1  =X−
X、−・・−<  1  )次いて判定基準決定部32
は黒ラン検出部26からの長さRLを入力し、入力した
長さRLの度数を計数しくS 12) 、次いで黒ラン
検出部26がS8の処理を行なう。
またS9て情報PがP=0である場合には走査線上で白
画素の次に白画素を連続して検出したことを表すのr、
S9の次に黒ラン検出部26がS8を行なう。
S8の処理では、黒ラン検出部26は読取り範囲10内
の走査線上の画像データを全て読み込んたか否かを判定
する。S8でX=XEでなければ読取り範囲10内の走
査線上の画像データを全て読み込んでないので黒ラン検
出部26は走査線上の次の画素位置の画像データを読み
込むべく主走査位WXに1加算しく513)、次いでS
5の処理を行なう。またS8でX =X eであれば読
取り範囲10内の走査線上の画像データを全て読み込ん
だので黒ラン検出部26は読取り範囲10内の全ての副
走査位置Yの走査線上の画像データを読み込んだが否か
を判定する(S 14)。S14で”/=Y、でなけれ
ば読取り範囲10内の全ての副走査位NYの走査線上の
画像データを読み込んでいないので、黒ラン検出部26
は次の副走査位1tYの走査線上の画像データを読み込
むべく副走査位置Yに1加算しくS 15) 、次いで
S3の処理を行なう。S14でY=YEであれば読取り
範囲10内の全ての副走査位置の走査線上の画像データ
を読み込んだので、判定基準決定部32は作成した長さ
Rしに関するヒストグラムに基づき判定基準値STを検
出し、検出した基準値STを出力するC516)。S1
6の後、文字背景処理装置24は基準値STを検出する
ための処理を終了する(1了)。
次に第6図(8)を参照し背景ランの検出及び除去に着
目した動作の流れにつき説明する。尚、判定基準値ST
の検出のときと同様の処理を行なうステップについては
同一の符号を付して示した。
以下、判定基準値STの検出のときと相違する点につき
説明し、判定基準値STの検出のときと同様の点につい
ては詳細な説明を省略する。
文字背景処理装置24は判定基準値STの検出処理が終
了すると、背景ランを検出し除去するための処理を開始
する(開始)。
S1〜S11及び513〜15は基準値STを検出する
ための処理の場合と同様に行なわれる。
S11て長さRLの検出が終了すると、背景ラン検出部
28は長さRLと判定基準値STと閾値下HLとを比較
しく517)、RL≧STであれば当該長さの黒ランは
文字ランであることを表す第一判定結果を及びRL< 
THLであれば当該長さの黒ランは背景ランであること
を表す第二判定結果を背景除去部30に対して出力する
背景除去部30は、背景ラン検出部28から第二判定結
果を入力した場合にはRL< THLの長さの黒ランは
背景ランとみなせるので当該背景ランの始端位置X1及
び終端位置XLと当該背景ランか検出された副走査位置
Yとを黒ラン検出部26から読み込み読み込んだ位MX
T 、XL及びYに基づいて当該背景ランの各黒画素の
アドレスを検出し検出したアドレスを書換え信号として
画像データ記憶部32に出力する(S 18)。書換え
信号を入力した画像データ記憶部34はN換え信号のア
ドレス1こ格納される背景ランの黒画素を白画素に書換
える。S18で背景除去部30が書換え信号を出力する
と黒ラン検出部26がS8を行なう。
また背景除去部30は背景ラン検出部28から第一判定
結果を入力した場合にはRL≧THLの長さの黒ランは
文字ランとみなせるので書換え信号を出力しない(81
8を行なわない)。背景除去部30が第一判定結果を入
力すると次いで黒ラン検出部26がS8を行なう。
S14で黒ラン検出部26が所定の範囲の画像データの
走査を終了したならば、文字背景処理装置24は背景ラ
ンを検出し除去するための処理を終了する(終了)。
この発明は上述した特定の実施例にのみ限定されるもの
ではなく、従って各構成成分の動作の流れ、動作、入出
力信号、信号線の接続関係、数値的条件、形状、寸法及
び配設位置を任意好適に変更することができる。
例えば黒ラフの長さに関するヒストグラムの作成に当っ
ては、画像データの所定の読取範囲全面又は所定の読取
範囲の任意好適な一部分(例えば走査線数本分の領域)
を走査してヒストグラムを作成するようにしてよい。ヒ
ストグラム作成のための画像データの走査範囲を所定の
読取範囲の任意好適な一部分とした場合、画像データの
走査領域か限定され、白画素に変更される黒ランの長さ
の範囲下の設定に関わる黒ラン検出部及び判定基準決定
部での処理に要する時間を短縮できる。
また画像読取部が文−a’*v走査した際に紙送りスキ
ューが発生したつ、画像読取部でのシエディング特性に
よる画質劣化が発生したりする場合には、画像データに
おける文字部の線幅及び文字背景部の黒画素部分の長さ
、幅が局所的に変化しやすくなる可能性がある。このよ
うな可能性か予測される場合には、例えば黒ラン検出部
においで走査を行なう場合の走査線1本分又は走査線数
本分の処理を1サイクルとしこの1サイクル毎に判定基
準決定部、背景ラン検出部及び背景除去部での処理を繰
り返すようにしてもよい。この場合には1サイクルの処
理毎に長さの範囲Tの検出を繰り返しで背景ランを検出
することになる。
また長さの範囲Tの設定のための判定基準値として上述
の実施例に挙げたもののほか、例えば、ヒストグラムの
度数が極大となる黒ランの長さの最小値よりも太きくか
つ度数が零となる黒ランの長さの最小値を判定基準値と
して用いてもよく、この判定基準値は背景部の黒画素部
分の幅が文字部の黒画素部分の線幅よりも充分に小さい
場合に用いて好適である。例えば第5図(A)のヒスト
グラムでは度数が極大となる黒ランの長ざ441〜44
3のなかの最小値441が検出され、この最小値441
よりも大きくかつ度数が零となる黒ランの長さの最小値
42)か検出される。この判定基準値によれば、網点の
バタン、周期的バタン等に加えごま塩雑音等の不規則な
バタン、曲線のバタン等が文字背景部にある場合でも範
囲丁P8設定できまたヒストグラムか双峰的か否かにか
かわらず範囲Tを設定できる。またこの判定基準値及び
上述の実施例の判定基準@を用いた場合、文字の線幅が
背景部の黒画素部分の幅より大きいという条件が満足さ
れている限りにおいでは大小の背景ランを安定して除去
できる。
この発明の文字背景処理装置は光学式文字読取り装置、
ファクシミリ等の画像符号化装置及びその他の種々の画
像処理装置における前処理に用いて好適である。
(発明の効果) 上述した説明からも明らかなように、この発明の文字背
景処理@置によれば、画像データ中の黒ランの長さを検
出し、黒ランの長さに間するヒストグラムを作成する。
そして作成したヒストグラムに基づき白画素に変更され
る黒ランの長ざの範囲下を設定し、この範囲T内の長さ
を有する黒ランを背景ランとみなして桟出し、背景ラン
を白画素に変更する。
従って、文字の線幅よりも狭い幅を有する任意の方向に
治った黒ランを背景ランとして除去でき、この結果文字
背景部に存在し画像処理の妨げとなる不要な黒ラン(背
景ラン)を除去できる。
範囲Ttヒストグラムを用いて装置自体が決定するので
オペレータの作業量ヲ従来よりも軽減できる。
またヒストグラムの作成及びヒストグラムを用いた範囲
Tの設定の処理は簡単であり、ざらに範囲Tの設定が終
了したのちは各走査方向毎に画像データを1度走査する
だけで背景ランを除去する処理を終了でき、従ってマス
クを用いた従来の背景処理で各注目画素毎に近傍画素を
参照して背景処理を行なっていたのと比較して、背景処
理に要する時間を短縮でき、また装置構成も簡単化でき
る。
従ってこの発明の文字背景処理袋@を、例えば光学式文
字読取り装置における文字認識処理の前処理装置に用い
れば文字の欠けの少ない画像データを得ることができる
ので文字認識の精度を向上できるし、また例えばファク
シミリ等の画像符号化装置における符号化処理の前処理
装置(ご用いれば背景ラフの少ない画像データを得るこ
とかできるので符号化効率を向上できる。
【図面の簡単な説明】
第1図はこの発明の詳細な説明に供する機能ブロック図
、 第2図(A)〜(C)は文字背景部に網点が存在する場
合の背景処理の説明に供する図、第3図(A)〜(C)
は文字背景部に交差しない一方向の斜線のみが存在する
場合の背景処理の説明に供する図、 第4図(A)〜(C)は文字背景部に交差する二方向の
斜線が存在する場合の背景処理の説明に供する図、 第5図(A)〜(B)は黒ラフの長さに関するヒストグ
ラムの例を示す図、 第6図(A)〜(B)は実施例の具体的な動作流れの一
例を示す図、 第7図(A)〜(C)は文字背景部に模様を有する原画
像データの例を示す図、 第8図は背景処理後の画像データの例を示す図、 第9図(A)〜(B)は従来の背景処理に用いるマスク
の例を示す図である。 24・・・文字背景処理装置、26・・・黒ラン検出部
28・・・背景ラン検出部、 30・・・背景除去部3
2・・・判定基準決定部、 34・・・画像データ記憶
部。

Claims (1)

    【特許請求の範囲】
  1. (1)画像データ記憶部に格納された2値の画像データ
    を一つ又は複数の方向に走査し、走査線上の黒ランの長
    さを検出する黒ラン検出部と、前記黒ランの長さに関す
    るヒストグラムを作成し、該ヒストグラムを用いて、白
    画素に変更される黒ランの長さの範囲を設定する判定基
    準決定部と、 該判定基準決定部が設定した長さの範囲の長さを有する
    黒ランを検出する背景ラン検出部と、該背景ラン検出部
    が検出した黒ランを白画素に変更するための書換え信号
    を出力する背景除去部とを備えて成ることを特徴とする
    文字背景処理装置。
JP22712089A 1989-09-01 1989-09-01 文字背景処理装置 Pending JPH0390971A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP22712089A JPH0390971A (ja) 1989-09-01 1989-09-01 文字背景処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP22712089A JPH0390971A (ja) 1989-09-01 1989-09-01 文字背景処理装置

Publications (1)

Publication Number Publication Date
JPH0390971A true JPH0390971A (ja) 1991-04-16

Family

ID=16855793

Family Applications (1)

Application Number Title Priority Date Filing Date
JP22712089A Pending JPH0390971A (ja) 1989-09-01 1989-09-01 文字背景処理装置

Country Status (1)

Country Link
JP (1) JPH0390971A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010244472A (ja) * 2009-04-09 2010-10-28 Hitachi Omron Terminal Solutions Corp 画像処理装置及び方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010244472A (ja) * 2009-04-09 2010-10-28 Hitachi Omron Terminal Solutions Corp 画像処理装置及び方法

Similar Documents

Publication Publication Date Title
JPH0581424A (ja) ノイズ除去方法
JPH06203153A (ja) 画像処理方法及び装置
JPH0390971A (ja) 文字背景処理装置
EP0870276B1 (en) A method for transforming a gray-level image into a black-and-white image
JP2501646B2 (ja) 文字背景処理装置
JP3478861B2 (ja) 2値画像データのスムージング拡大処理方法
JP3046652B2 (ja) 文字原稿の傾き補正方法
JP2020087320A (ja) 画像処理装置、画像処理方法、及びプログラム
JPS60136478A (ja) 画調識別方法
JP2845376B2 (ja) 画素密度変換装置
JP2003189090A (ja) 画像処理装置及び画像処理方法、画像処理プログラム、記憶媒体
JPH0546749B2 (ja)
JPH02252082A (ja) 文字背景処理装置
JPH09167228A (ja) 画像変換方法及び装置、並びに、それらを利用した画像整形方法及び装置、並びに、それらを利用したシステム
JPH05211607A (ja) 画像処理装置及び方法
JP2721415B2 (ja) 文字画像抽出方法
JP3566738B2 (ja) 網掛け領域処理方法および網掛け領域処理装置
JPH05233798A (ja) 画像処理方法
JPS62145968A (ja) 文字領域識別方法
JP2001331766A (ja) パタン認識辞書の作成方法、コンピュータ読取可能な記録媒体、パタン認識辞書作成装置および文字認識装置
JPH0844873A (ja) 画像処理装置
JPH10302062A (ja) 画像形成装置および画像形成方法
JPH05211608A (ja) 画像処理装置及び方法
JP2003244437A (ja) 画像処理装置
JPH05211604A (ja) 画像処理装置及び方法