JPS62145968A - 文字領域識別方法 - Google Patents

文字領域識別方法

Info

Publication number
JPS62145968A
JPS62145968A JP60285415A JP28541585A JPS62145968A JP S62145968 A JPS62145968 A JP S62145968A JP 60285415 A JP60285415 A JP 60285415A JP 28541585 A JP28541585 A JP 28541585A JP S62145968 A JPS62145968 A JP S62145968A
Authority
JP
Japan
Prior art keywords
area
pixel
character area
character
window
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP60285415A
Other languages
English (en)
Other versions
JPH0683368B2 (ja
Inventor
Yuzuru Suzuki
譲 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP60285415A priority Critical patent/JPH0683368B2/ja
Publication of JPS62145968A publication Critical patent/JPS62145968A/ja
Publication of JPH0683368B2 publication Critical patent/JPH0683368B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、文字領域識別方法に関するものであり、特に
、文字等の2値化画像領域(以下、文字領域と呼ぶ)と
写真等の中間調画像領域(以下、中間調領域と呼ぶ)が
混在する原稿を読取った後に、文字領域と中間調領域を
識別し、それぞれの領域に適切な処理を施し、高画質の
出力画像を得るデジタル複写機、ファクシミリ等の文字
領域識別方法に関するものである。
(従来の技術) 一般の文書原稿中には、文字と写真とが混在しているも
のが多数おる。このような原稿を2値化して記録すると
文字は良好に記録されるが写真の画質が劣化する。また
逆にディザ等の中間調生成法により記録すると写真は良
好な記録となるが、文字が劣化する。
このため、文字は単純に2値化し、写真はディザ等の中
間調生成法等の処理を施すことにより、文字と写真とが
混在する原稿の記録画像を良好なものにしている。しか
しながら、このような処理を行なうには、異なった2種
の領域(文字と中間調)を識別することが必要になる。
このような領域識別に関する従来技術としては、文字パ
ターンに対応したテンプレートを多数用意し、画像との
照合(マツチング)により実現するものや、ブロック内
の濃度差等により識別するものがある。
(発明が解決しようとする問題点) しかし、上記の領域識別方法を実現しようとすると、ハ
ードウェア規模が大きくなると共に、処理が複雑になる
という問題がおった。また、中間調領域が網点(印刷)
か写真かのいずれかでないと適用できないという問題が
あった。
本発明の目的は、このような従来技術の問題点を除去し
、簡易なハードウェア構成で効率的に領域識別を行ない
、文字と中間調領域が混在した原稿でも品質を損うこと
なく記録できるようにすることにある。
(問題点を解決するための手段および作用)前記の問題
点を解決するために、本発明は、2値化された文書画原
稿画素信号に窓を適用し、該窓内に黒画素が存在する場
合には該黒画素の位置に依存する重み係数を重ね合せる
ことによって、窓内の黒画素の分布状態を求め、文字領
域と、中間調領域とを識別しようとするものである。
(実施例) まず、本発明の原理を簡単に説明する。
第2図に示されているように、同図(a)の文字領域1
1aと中間調領域11bが混在する文書画原稿11をあ
る閾値で単純に2値化すると、同図(b)に示すように
殆どの場合、中間調領域’11bはいくつかの大きなか
たまり11b′となり、文字領域は原稿と殆ど変化がな
い線画11a′となる。
第3図は、mxm=5 (画素)×5(画素)の窓で2
値化された画像信号を観測した例である。
同図(a)は2値化された中間調領域Aを5(画素)×
5(画素)の窓13a、13b、13cで観測した場合
、同図(b)は英大文字「C」の一部を示す文字領域B
を上記と同様の5(画素)×5(画素)の窓15a、1
5b、15Gで観測した場合を示す。
中間調領域のときは、同図(a)から明らかなように、
窓内に存在する黒画素の分布はある領域に片寄っている
か、窓内全滅にわたっており、一方、文字領域のときは
、同図(b)に示されているように、窓内に存在する黒
画素の分布はある方向性をもった線パターンとなること
が判る。
本発明は上記の点に着目したもので、濃淡信号として与
えられる文字・中間調混在画像を正方形のm(画素)x
m(画素)の窓内のみで2値化して観測し、それが線パ
ターンでおれば文字領域、そうでなければ中間調領域と
識別するものでおる。
線パターンの検出に関しては、閾値thを超える鋭いピ
ークが点対称方向(180’反対方向)にあるかどうか
を見ることによって確実に判定できる。
次に、本発明の一実施例を説明する。第4図は本実施例
に使用されるハード構成のブロック図を示す。このブロ
ック図を基にして、本実施例を具体的に説明する。
なお、この実施例ではm=7(画素〉の7X7の窓を用
いた場合について説明するが、読取り系の走査密度や対
象とする文字の大きさ等によってはmを変えても良い。
しかし、本発明者の実験によれば、5ポイントから10
ポイントの文字に対してはm=7程度で十分な識別が可
能であった。
第4図において、文書画原稿は入力装置1で例えば16
ドツト/mmのピッチで8ビツトの濃淡信号として読み
取られる。入力装置1で読取られた文書画原稿信号は主
走査方向の1ラインずつ人力バッファメモリ2に転送さ
れ、7ライン分の文書画原稿信号が一旦格納される。入
力バッファメモリ2に格納された該文書画原稿信号は、
演算処理回路3、プログラムROM9、RAM10.お
よびCPU8により後述するアルゴリズムで文字領域お
よび非文字領域すなわち中間調領域の識別がなされる。
この識別によって、文字領域であると識別されると、そ
の結果は選択回路6に返され、選択回路6によって2値
化回路4bが選択される。一方、非文字領域であると判
定されると、選択回路6によってディザ処理回路4aが
選択される。ディザ処理回路4aおよび2値化回路4b
は、それぞれ人力バッファメモリ2中の文書画原稿信号
にディザ処理および2値化処理を施して、出力バッフ7
メモリ7にオン、オフ(または、0,1)の2値信号を
出力する。出力バッファメモリ7に一時蓄積された該2
値信号は出力装置5が要求する速さで読出され、出力装
@5によって記録が行なわれる。この出力装置5は、レ
ーザビームプリンタ、インクジェットプリンタまたはサ
ーマルプリンタのどれであってもよい。
なお、プログラムROM9には演算処理回路3内の処理
プログラムと信号制御プログラムが格納されており、C
PU8はシステム全体の制御を行なう。
次に、上記のアルゴリズムについて説明する。
まず、入力バッファメモリ2に格納されている文書画原
稿信号に、7(画素)×7(画素)の窓を適用し、該窓
に含まれる文書画原稿信号に着目する。
一方、この窓には、該窓を構成する各画素に、第5図(
a)に示す画素番号を付しておく。この画素番号の付は
方は、同図(b)を参照すれば明らかなように、中央に
存在する注目画素Xの右方向をOoとし、反時計回りに
角度を取った時、小さな角度から大きな角度になるにし
たがい大きな番号を付け、かつ、該注目画素からの方向
が同じ画素には同じ番号を付ける方法を採っている。
また、この窓を構成する各画素に、同図(C)に示され
ているように、注目画素Xからの距離コード’I、2.
3を割り付けておく。この距離コードは、注目画素に最
も近いグループに1を割り付け、次に近いグループに2
を割り付け、最も遠い位置にある画素のグループに3が
割り付けられている。
また、該窓内に黒の文書画原稿信号が存在した時、この
黒信号に該信号が存在する位置の距離コードに応じて第
6図のような重み係数を設定する。
この重み係数の形状は画像の方向性を出し易くするため
に、中心は高く、周辺になるにつれてゆるやかに低くな
るような形状、例えばガウス分布等が良好であるが、こ
こでは処理の簡易化のために三角波を用いた。また、注
目画素からの距離が遠くなるにつれて、線の存在可能な
範囲が狭くなり、該距離が大ぎな所に黒ドツトがあると
線の存在確率が高くなる。このため、該重み係数の高さ
を距離によって変えたが、全体の存在確率は変化しない
ように正規化した。
第6図(a)、 (b)、 (C)は、それぞれ距離コ
ード1゜2.3に対応する重み係数の形状の一例を示し
、(a)、 (b)、 (C)の全てにおいて重み係数
の面積は変らないように正規化されている。すなわち、
高ざhと幅Wは反比例するように形成されている。
次に、入力バッファメモリ2に格納されている文書画原
稿信号に7×7の窓を適用したところ、この窓の中に含
まれる文書画原稿信号の2値化信号(以下、ドツトと呼
ぶ)パターンが第7図(a)に示されるものであったと
して説明する。
先に、第5図(a)で説明したように、7×7の窓を構
成する画素にはO〜31までの番号が付されているので
、RAM10(第4図参照)中に、この画素番号に対応
する32個のアドレス、すなわち、32個の記憶エリア
を設けておく。本実施例では、便宜上、画素番号O〜3
1に対応するアドレスにO〜31の番号を付すことにす
る。
次に、演障処理回路3は第7図(a)中の画素番号Oに
対応する3つのドツトの一つ一つが黒か白かを調ぺ、黒
があった場合には黒を表わす値、例えば1にその距離コ
ードに応じた重み係数を掛けた後加算し、画素番号Oに
対応する前記RAM10中のアドレスOの記憶エリアに
格納する。一方、白があった場合には、白を表わす値を
例えばOに定めておく。
図示の例では、画素番号Oに対応する3つのドツトがす
べて黒であるので、それぞれのドツトに重み係数h1.
t12.h3が掛け合され、これを加算した値、例えば
(hl +h2+h3 )の重みデータが前記画素番号
Oに対応するRAM10中のアドレスOの記憶エリアに
格納される。また、RAM10中のアドレスOに隣接す
るアドレス1と31に、重み係数h1とhlの広がりの
裾部分によって作られる重みデータが記憶される。例え
ば、アドレス1と31に(h1/ 2+hz / 3)
の重みデータが記憶される。
次に、画素番号1に対応するドツトが黒が白かを第7図
(a)で見ると黒であり、かつ該ドツトが存在する位置
の距離コードは3であるので、黒を表わす値に重み係数
h3が掛けられ、RAM10中のアドレス1にh3の重
みデータが加算される。
なお、重み係数h3の裾部分の広がりは一番小ざく、前
記アドレス1に隣接するアドレスOと2には何の影響も
与えられないので、これらのアドレスには重みデータを
加算しない。
以下、同様に、第7図(a)の画素番号2〜31までの
各ドツトにつき、演算が行なわれ、その演算結果が前記
RAMl0中の対応するアドレスの記憶エリアに格納さ
れる。また、隣接するアドレスの記憶エリアにも、影響
を受けた重みデータが記憶される。
上記の演算によって、得られた重みのデータを前記RA
M10中の各アドレスO〜31の記憶エリアに格納した
状態を図式化したものが第7図(b)である。この図か
ら、おるアドレスの記憶エリアには、それ自身の重み係
数と両隣りのアドレスに適用された重み係数の裾部分と
の和で、そのアドレスの重みデータが形成されているこ
とが理解されよう。
次いで、前記RAM10の各記憶エリアのデータを調べ
て、閾値th以上の重みデータを有するアドレスを抽出
する。本例では、第7図(b)から明らかなように、ア
ドレス0,1,3,4゜23.24,25,27,28
,29.31の11個が前記閾値th以上の重みデータ
を有するアドレスであることがわかる。
次に、これらのアドレスに対応する画素番号が前記7×
7の窓中で点対称又はこれに近い対を有しているか否か
の判断が行なわれる。そして、点対称又はこれに近い対
であると判断されると、文字領域と判定され、そうでな
いと判断されると文字領域ではないと判定される。第7
図の例では閾値th以上の重みデータを有する抽出画素
番号が点対称又はこれに近い対を有していないので、文
字領域ではないと判定される。
第8図は前記7X7の窓に含まれる2値化されたドツト
の他のパターン例を示す。この場合について、前記と同
様の演算処理を行ない、閾値th以上の重みデータを有
するアドレスを求めると、第8図(b)から明らかなよ
うに、アドレス3,4と20.21である。このアドレ
スに対応する画素番号3,4と20.2’lとは該重の
中心に対してほぼ180°反対の位置に存在するため、
この方向に線パターンが存在することが判る。この場合
は文字領域として識別される。
第9図(a)は網点部の分布状態を示し、同図(b)か
ら明らかなように、前記閾値th以上の重みデータを有
するアドレスに対応する画素番号は窓の全方向にわたっ
てほぼ一様な分布となり明らかに文字部ではないと判定
できる。
窓内全域が黒画素である場合は、閾値thを超えるピー
ク方向が多数存在するし、分布も一様となるため文字部
ではないと判定される。
以上の手順をまとめると、第1図のように表わすことが
できる。第1図は本実施例の処理手順を示すフローチャ
ートでおる。
ステップS1・・・CPU8は入力装置1から送られて
くる信号により、文書画原稿の副走査方向の読取りが終
了したかどうかを判断する。そして、終了したと判断す
ると一連の処理を終了しくエンド)、まだ終了していな
いと判断すると、次のステップに進む。
ステップS2・・・n列、例えば7列の入力バッファメ
モリ2に中間調で表現された画像データを1列ずつ入力
する。
ステップS3・・・例えば、7(画素)×7(画素)の
窓を前記入力バッファメモリ2に適用し、該重に含まれ
る画像データを2値化し該2値化した画像データに、黒
画素が含まれているかどうか判断する。そして、黒画素
がおると判定されるとステップS4に進み、黒画素が含
まれていないと判定されるとステップS9に進む。
ステップS4・・・1つの黒画素が、第5図(C)で示
した距離コード1〜3のいずれに存在するかを求める。
ステップS5・・・次に、前記黒画素に適用する重み係
数(第6図参照)を前記距離コードから決定する。この
とき、選ばれた該重み係数の幅W1゜Wz 、W3に応
じて、隣接画素に対する重み係数も決定する。
ステップS6・・・該黒画素の画素番号を第5図(a)
で示した窓内の画素番号と照合して決定し、この画素番
号をRAM10のアドレスとする。
ステップS7・・・RAM10上の該アドレスの記憶エ
リアに、前記重み係数と黒の2値化された値とを掛ける
ことによって得られた重みデータを加える。また、該ア
ドレスに隣接するアドレスの記憶エリアに前記隣接画素
に対する重みデータを加算する。
ステップS8・・・次に、重み付は処理が終了した黒画
素を消去する。ステップS8までの処理が終了すると再
びステップS3に戻って処理を繰返す。
以上のようにして、前記窓内におる黒画素の全てについ
て重み付は処理を行なう。そして、この処理が終ると、
ステップS3はノウとなり、ステップS9へ進む。
ステップS9・・・RAM10中の前記アドレスに格納
された重みデータと閾値thとを比較し、該重みデータ
の中に該閾値thを超えるデータがあるか否か判断され
る。そして、ノウと判断されると、ステップS10に進
み、イエスと判断されると、ステップ312へ進む。
ステップ310・・・注目画素は網点または写真領域(
すなわち中間調領1dy、)に属すると判定し、選択回
路6にディザ処理回路4aを選択する信号を出力する。
ステップS11・・・ディザ処理を施す。
ステップS12・・・閾値thを超えた重みデータに対
応する画素番号が点対称又はこれに近い対であるか否か
の判断が行なわれ、ノウと判断されると網点または写真
領域と判定され前記ステップS10へ進む。一方、イエ
スと判断されると文字領域と判定される。
ステップS’13・・・注目画素は文字領域に属すると
判定し、選択回路6に2値化回路4bを選択する信号を
出力する。
ステップ314・・・2値化処理を施す。
ステップS15・・・主走査方向に窓を一画素分移動し
、注目画素を一画素主走査方向へずらす。
ステップS’16・・・該主走査方向の移動によって、
窓が入力バッファメモリ2に格納されている文書画原稿
信号の主走査方向の最後の信号からはみ出したかどうか
判断される。そして、ノウであればステップS3に戻り
、イエスであればステップS1に戻る。
以上のようにして、文書画原稿が中間調領域(網点また
は写真領域)か文字領域かの識別が行なわれ、それぞれ
に適した画像処理を行なうことができる。
(発明の効果) 以上の説明から明らかなように、本発明によれば、つぎ
のような効果が達成される。
(1)中間調領域と文字領域の識別を簡単なハード構成
で実現することができる。
(2)従来は中間調領域に網点と写真が混在されている
場合には、これらに対して異なる処理をしないと、中間
調領域であることの判断ができなかったが、本発明では
網点と写真が混在していても、一つの逐次処理で中間調
領域と判断することができる。
(3)読取り系によって生じた雑音の影響を受けずに領
域識別を行なうことができる。
【図面の簡単な説明】
第1図は本発明の一実施例を示すフローチャート、第2
図は中間調領域と文字領域を含む文書画原稿を2値化処
理した時に得られる2値化画像の説明図、第3図は中間
調領域と文字領域の2値化画像に5(画素)×5(画素
)の窓を適用した時に得られる画素パターンの説明図、
第4図は本実施例に適用されるハード構成を示すブロッ
ク図、第5図は本実施例の窓の説明図、第6図は距離に
依存する正規化された重み係数の説明図、第7図、第8
図、および第9図は、それぞれ写真部、文字部および網
点部の処理結果の説明図である。 2・・・入力バッファメモリ、3・・・演算処理回路、
4a・・・ディザ処理回路、4b・・・2値化回路、6
・・・選択回路、8・・・CPU、9・・・プログラム
ROM、10・・・RAM 代理人 弁理士 平木通人 外1名 第2図 (a)    (b)

Claims (3)

    【特許請求の範囲】
  1. (1)文字領域と中間調領域とが混在する文書画原稿を
    読取って記録する文字領域識別方法であって、注目画素
    からの距離によって正規化された重み係数を有する正方
    窓で2値化された文書画原稿画素信号を観察し、該窓内
    に存在する黒画素の前記2値化によって得られた値と、
    該黒画素の位置によって決定される前記重み係数との掛
    け合せによって、該窓内に含まれる画素に付された画素
    番号に対応する重みデータを求め、予め定められた閾値
    を超える重みデータを有する画素の分布状態より、文字
    領域か中間調領域かを識別するようにしたことを特徴と
    する文字領域識別方法。
  2. (2)前記正方窓内の重み係数の形状は注目画素から離
    れるにしたがって、幅が狭く、高さが高くなるように正
    規化されていることを特徴とする前記特許請求の範囲第
    1項記載の文字領域識別方法。
  3. (3)窓を構成する画素の番号は注目画素からの方向が
    同じものには同じ番号が付けられていることを特徴とす
    る前記特許請求の範囲第1項記載の文字領域識別方法。
JP60285415A 1985-12-20 1985-12-20 文字領域識別方法 Expired - Lifetime JPH0683368B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60285415A JPH0683368B2 (ja) 1985-12-20 1985-12-20 文字領域識別方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60285415A JPH0683368B2 (ja) 1985-12-20 1985-12-20 文字領域識別方法

Publications (2)

Publication Number Publication Date
JPS62145968A true JPS62145968A (ja) 1987-06-30
JPH0683368B2 JPH0683368B2 (ja) 1994-10-19

Family

ID=17691221

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60285415A Expired - Lifetime JPH0683368B2 (ja) 1985-12-20 1985-12-20 文字領域識別方法

Country Status (1)

Country Link
JP (1) JPH0683368B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02153487A (ja) * 1988-12-05 1990-06-13 Hitachi Ltd 文字・写真領域判定装置およびそれを用いた画像入力装置ならびに光学文字認識装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02153487A (ja) * 1988-12-05 1990-06-13 Hitachi Ltd 文字・写真領域判定装置およびそれを用いた画像入力装置ならびに光学文字認識装置

Also Published As

Publication number Publication date
JPH0683368B2 (ja) 1994-10-19

Similar Documents

Publication Publication Date Title
US5016118A (en) Image determining method and apparatus
JPH0725064A (ja) 電子写真プリンタの画像形成装置
JP3083673B2 (ja) 像域識別装置
JPH0879517A (ja) 画像の型を識別する方法
JPS62145968A (ja) 文字領域識別方法
JP3336046B2 (ja) 像域分離装置
JPH0775395B2 (ja) 画像処理装置
JP2874592B2 (ja) 文字・写真・網点領域を判別する画像処理装置
JPS6359272A (ja) 画像処理装置
JPH0550187B2 (ja)
JPS60136476A (ja) 画像処理装置
JP2003032480A (ja) 画像処理装置及び画像処理方法
JP2581049B2 (ja) 画像領域判定装置
JPH06152947A (ja) 画像処理装置
JP3358133B2 (ja) 画像処理装置
JP2853140B2 (ja) 画像領域識別装置
JP3136650B2 (ja) 画像処理装置
JPS6197788A (ja) ノイズ除去方法
JPS60136477A (ja) 画調識別方法
JP3146516B2 (ja) 画像処理装置
JP3183788B2 (ja) 網点領域判定装置
JP3014257B2 (ja) 文書読み取り装置
JPH0548870A (ja) 枠消し方法
JPS6032475A (ja) 画像処理装置
JPH0685557B2 (ja) 画像処理方式