JPH0830723A - 網掛け領域処理方法 - Google Patents

網掛け領域処理方法

Info

Publication number
JPH0830723A
JPH0830723A JP6165583A JP16558394A JPH0830723A JP H0830723 A JPH0830723 A JP H0830723A JP 6165583 A JP6165583 A JP 6165583A JP 16558394 A JP16558394 A JP 16558394A JP H0830723 A JPH0830723 A JP H0830723A
Authority
JP
Japan
Prior art keywords
area
shaded
tone dot
shaded area
dot meshing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6165583A
Other languages
English (en)
Inventor
Keiji Kojima
啓嗣 小島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP6165583A priority Critical patent/JPH0830723A/ja
Publication of JPH0830723A publication Critical patent/JPH0830723A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Controls And Circuits For Display Device (AREA)

Abstract

(57)【要約】 【目的】 入力された文書原稿に含まれる網掛けによる
文字修飾された領域を自動的にかつ高速に検出して、網
掛け領域の位置情報、濃度情報を保持して網掛けによる
修飾情報を除去し、特に文字認識の前処理に好適な網掛
け領域処理方法を提供する。 【構成】 入力される文書画像データより網掛け領域を
構成する小ドットを抽出し、抽出された小ドットの存在
状況に基づいて文書画像データより網掛け領域を検出し
て網掛けによる文字修飾を除去する。網掛け領域の位置
情報、濃度情報を保持するために網掛け領域を容易に再
生可能となる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、入力される文書画像中
に網掛け領域を含む場合の網掛け領域処理方法に関し、
特に文書原稿を画像データとして入力して、入力画像デ
ータに対して文字認識処理を行なう文字認識装置(OC
R)に利用して好適な網掛け領域処理方法に関する。
【0002】
【従来の技術】近年のワープロやDTP等の普及に伴っ
て、文書中における重要な語句や強調したい表現を、小
ドットによる網掛けによって文字修飾を施す場合が増加
している。このような網かけを伴う文書原稿に文字認識
処理を行なう場合には、網掛けにより修飾された文字と
網掛け領域を構成する小ドットとが重なっているために
文字パターンの正確な切り出しが困難となっていた。
【0003】そのために網掛け領域を含む原稿を文字認
識処理する場合には、文字の認識処理の前に、入力画像
を表示装置上に表示して、操作者が網掛け領域を避ける
ように処理対象の領域を指定したり、網掛けによって発
生する誤認識を修正したりする必要があった。
【0004】これに対して本出願人は特願平5−233
371号において、文書画像データから網掛け領域を高
速に検出して除去することにより、特に文字認識処理の
前処理として好適な網掛け領域処理方法を提案した。
【0005】しかしながら、上記の方法によれば、入力
される文書中の語句や表現の重要度に応じて施された網
掛け情報が除去されてしまうために、文字認識結果を出
力する際に操作者が網掛け情報を再設定する必要が生じ
る。特に同一の原稿に複数種類の濃度の網掛け領域が存
在する場合には、入力文書と比較して網掛け領域の再設
定や網掛けの濃度の再設定等を行なう必要があるため
に、操作者の負担が増加し、作業効率が低下するといっ
た問題があった。
【0006】
【発明が解決すべき課題】本発明はかかる事情に鑑み、
入力された文書原稿に含まれる網掛け領域を自動的にか
つ高速に検出して、入力された文書原稿に含まれる網掛
け領域の位置と濃度を容易に再設定することが可能な網
掛け領域処理方法を提供することを目的としている。
【0007】
【課題を解決するための手段】上述した課題を解決する
ために、請求項1記載の発明では、入力される文書画像
データより網掛け領域を構成する小ドットを抽出し、該
ドットを統合して文書画像中の網掛け領域の位置と濃度
を検出することを特徴とする。
【0008】また、請求項2記載の発明では、請求項1
記載の発明に加えて、文書画像データより検出した網掛
け領域を構成するドットを文書画像データから除去する
ことを特徴とする。また、請求項3記載の発明では、請
求項1記載の発明に加えて、文書画像データより検出し
た網掛け領域を構成するドットの密度から網掛け領域の
濃度を検出することを特徴とする。さらに、請求項4記
載の発明では、請求項1記載の発明に加えて、文書画像
データより検出した網掛け領域の位置と濃度を保持し、
前記網掛け領域を文書画像データの所定の領域に再設定
することを特徴とする。
【0009】
【実施例】
(実施例1 基本処理)以下、図面に基づいて本発明を
詳細に説明する。図1は網掛け領域検出の基本処理フロ
ーチャートである。網掛け領域の検出処理は、矩形抽出
ステップと矩形の統合ステップの2つのステップによっ
て構成される。
【0010】矩形抽出ステップは、入力された文書画像
中の黒画素の連続性から黒ランを抽出して、黒ランの外
接矩形を抽出するステップである。一般に、網掛け領域
を構成するドットは、文字の外接矩形よりもはるかに微
小な外接矩形として抽出される。本発明では、処理対象
の文書で使用している文字サイズと比較して、充分に小
さいサイズを閾値(例えば3×3画素以内のサイズ)と
して設定することによって、文書画像中の網掛けドット
の情報のみが、小ドットの外接矩形として抽出される。
設定する閾値としては、処理対象の文書中のカンマや読
点等を、網掛けドットと誤検出しない程度の値を設定さ
れることが好ましい。
【0011】次に、矩形の統合ステップにおいて、抽出
された小ドット(矩形)間の距離に対して、水平方向、
垂直方向の閾値処理により、所定の閾値以内の距離(例
えば10画素以内の距離)にある小ドット(矩形)を統
合する処理を進めて、網掛け候補領域の矩形として抽出
する。
【0012】この矩形の統合ステップによって生成され
た網掛け候補領域の座標情報から、網掛け候補領域の大
きさを調べることにより、網掛け領域かどうかの判定を
行なう。一般に、網掛けによる文字修飾は1文字のみを
対象とする場合よりも、複数の文字を対象として施され
る場合が多いため、本発明における網掛け領域の判定
は、例えば文書の行の高さを基準にして、行の高さの2
倍の長さ以上、すなわち2文字以上の大きさを有する網
掛け候補領域を網掛け領域として判定する。
【0013】判定された網掛け領域に対して位置情報と
濃度情報を検出して保持する。網掛け領域の位置情報
は、網掛け領域として判定した矩形の始点、終点の座標
値、または始点の座標値と幅・高さとして保持される。
この位置情報を保持することにより網掛けを除去して文
字認識処理等を施した後に、保持された位置情報に基づ
いて網掛けによる文字修飾を再設定して、認識結果に網
掛けを施してディスプレイに表示したり、印字装置に出
力することが可能になる。
【0014】また、網掛け領域の濃度情報は網掛け領域
に属する小ドット矩形の面積(黒画素数)を測定するこ
とにより算出する。算出方法としては、小ドット矩形の
面積が網掛け領域の面積に占める割合や、文書の行の高
さを基準にして、行の高さの1倍の長さ、すなわち1文
字領域あたりの網掛け領域の小ドットの密度を算出する
ことにより面積比(%)で算出する。図6に算出された
網掛け領域の濃度の例を示す。各網掛け領域ごとに算出
された濃度情報を保持することにより、網掛けによる文
字修飾を再設定する際に入力画像と同様の濃度の網掛け
領域を再現することが可能となる。
【0015】網掛け領域の除去処理としては、検出され
た網掛け領域に属する小ドットの黒画素情報をメモリ上
でビット反転して白画素情報に変換することにより、網
掛け情報の除去処理を施す。どの網掛け領域にどの小ド
ットが所属しているのかという情報は、小ドットを統合
して網掛け候補領域を抽出する過程で、統合される側の
小ドットと統合する側の矩形領域の従属関係を管理する
ことによって容易に把握することが可能である。
【0016】図2は、本発明を文字認識装置に応用した
ブロック図である。文書画像はスキャナ1から入力され
て、画像メモリ2に二値の文書画像データとして蓄積さ
れる。中央演算処理装置3は、網掛け処理プログラム格
納ROM4より網掛け領域処理プログラムを読み出し
て、ワークエリアRAM5において文書画像データに対
する網掛け領域の抽出処理が実行される。文書画像から
抽出された網掛け領域は、RAM5に位置情報、濃度情
報を保持されて、小ドットの黒画素が中央演算処理装置
3等による論理処理により白画素に反転されて網掛け領
域が除去される。
【0017】網掛けを除去された文書画像データは、中
央演算処理装置3によって図示しない文字認識辞書との
パターンマッチング等による文字認識処理が施されて、
画像データから文字コードデータに変換される。文字認
識結果の出力時にはにはRAM5に保持された網掛け領
域の位置情報、濃度情報に基づいて、文書画像中の各網
掛け領域が再設定されてディスプレイ6に出力される。
【0018】(実施例2 分割処理)ここで、原稿画像
全体を処理対象にして実施例1の処理を施すと、そのた
めに矩形データなどのワークエリアRAMをかなり必要
とする。ワークエリアRAMが十分にあるシステムで
は、実施例1の方法で処理が可能であるが、パーソナル
コンピュータのような実装メモリが限られているような
システム上で稼働させるためには、省メモリ化をはから
なければならない。
【0019】実施例2では、網掛け領域の抽出処理する
範囲を分割して、分割領域単位で網掛け領域の抽出処理
を繰り返して行なうことにより、原稿画像全体に処理を
行なう。図3に分割処理の網掛け領域検出の基本処理フ
ローチャートを示す。
【0020】処理単位を分割する実施例2では、網掛け
領域が分割領域の境界に跨って存在する場合があるため
に、単位領域の境界部での処理が特徴となる。実施例2
の分割処理では、網掛け候補領域とオーバーラップ領
域、すなわち現在処理している単位領域の境界部に存在
する適当な高さをもつ領域との位置関係により、網掛け
領域の判定処理が行なわれる。
【0021】図4に示される網掛け候補領域(1)、
(2)、(3)を例に説明をする。領域(1)は、網掛
け領域がオーバーラップ領域、すなわち現在処理してい
る単位領域の境界部に存在する適当な高さをもつ領域に
かかっていないので、この網掛け領域(1)について
は、基本処理と同様に網掛け領域の判定を行ない、適当
な大きさであれば網掛け領域として網掛け情報を除去す
る。
【0022】領域(2)は、網掛け候補領域の一部がオ
ーバーラップ領域にかかっている状態の例で、領域
(3)は、網掛け候補領域がオーバーラップ領域に含ま
れている状態の例である。網掛け候補領域が(2)、
(3)状態の場合は、網掛け領域が次の単位領域にも跨
って存在する可能性が高いために、図5にフローチャー
トを示す境界処理が実行される。
【0023】まず、網掛け候補領域に対して基本処理と
同様の網掛け領域の判定を行ない、所定の大きさの領域
であれば網掛け領域として除去処理を行なう。ここで、
網掛け候補領域が網掛け領域と判定された場合、オーバ
ーラップ領域の始点のY座標(Yos)と、網掛け領域
の終点のY座標(Yae)の比較を行ない、YaeがY
os以上の場合には、網掛け領域が次の処理領域に跨っ
て存在する可能性が高いために、この網掛け領域を次の
処理領域に持ち越して、次の処理領域でも使うようにす
る。
【0024】この処理によって、図4の(2)のよう
に、網掛け領域が次の単位領域にも跨って存在する場合
においても、この網掛け領域が次の単位領域に持ち越さ
れ、統合されて成長するために、境界にある網掛け領域
も問題なく抽出することができる。
【0025】また、網掛け候補領域が適当な大きさを持
たないことにより、網掛け領域と判定されなかった場合
には、オーバーラップ領域の始点のY座標(Yos)
と、網掛け候補領域の始点のY座標(Yae)の比較を
行ない、YaeがYos以下の場合には、網掛け領域の
一部が現在処理している単位領域にあると考えられるの
で、この網掛け候補領域のY座標の始点Yasを,次の
処理領域の始点の候補にする。
【0026】この処理によって、次の処理の単位領域
は、網掛け領域と判定されなかった網掛け候補領域の始
点座標Yasまで戻らせて、処理領域を一部重複させて
いる。このオーバーラップ処理させることにより、図4
の(3)のように、網掛け領域がオーバーラップ領域に
含まれて存在する場合においても、次の単位領域で網掛
け領域判定に対応することができる。
【0027】また、本実施例では矩形抽出ステップ後の
小ドットのサイズに注目して、網掛け領域の判定処理を
進めたが、ドットのサイズ情報に加えて、矩形抽出ステ
ップを実行する前の段階である入力画像データ中の網掛
けドットの形状情報(黒画素の連結形状)を網掛け領域
の判定に利用することも有効である。
【0028】
【発明の効果】以上説明したように、本発明による網掛
け領域処理方法によれば、画像上に存在する網掛け領域
を自動的に検出して網掛け領域のみを除去することがで
き、除去後の網掛け領域の再設定の際に位置情報、濃度
情報を個々の網掛け領域ごとに操作者が設定する必要が
なく、システムとしての操作性が向上して全体の処理時
間が短縮される。また、文字認識処理の対象原稿が広が
り入力効率の向上が期待できる。
【図面の簡単な説明】
【図1】本発明の網掛け領域検出の基本処理フローチャ
ートである。
【図2】本発明を文字認識装置に応用したブロック図で
ある。
【図3】分割処理の網掛け領域検出の基本処理フローチ
ャートである。
【図4】境界部に存在する網掛け候補領域を説明する図
である。
【図5】本発明の境界処理を示すフローチャートであ
る。
【図6】網掛け領域の濃度の例を示す図である。
【符号の説明】
1 スキャナ 2 画像メモリ 3 中央演算処理装置 4 網掛け領域処理プログラムROM 5 ワークエリアRAM 6 ディスプレイ

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 入力される文書画像データより網掛け領
    域を構成する小ドットを抽出し、該ドットを統合して文
    書画像中の網掛け領域の位置と濃度を検出することを特
    徴とする網掛け領域処理方法。
  2. 【請求項2】 文書画像データより抽出した網掛け領域
    を構成するドットを文書画像データから除去することを
    特徴とする請求項1記載の網掛け領域処理方法。
  3. 【請求項3】 文書画像データより抽出した網掛け領域
    を構成するドットの密度から網掛け領域の濃度を検出す
    ることを特徴とする請求項1記載の網掛け領域処理方
    法。
  4. 【請求項4】 文書画像データより抽出した網掛け領域
    の位置と濃度を保持し、前記網掛け領域を文書画像デー
    タの所定の領域に再設定することを特徴とする請求項1
    記載の網掛け領域処理方法。
JP6165583A 1994-07-18 1994-07-18 網掛け領域処理方法 Pending JPH0830723A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6165583A JPH0830723A (ja) 1994-07-18 1994-07-18 網掛け領域処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6165583A JPH0830723A (ja) 1994-07-18 1994-07-18 網掛け領域処理方法

Publications (1)

Publication Number Publication Date
JPH0830723A true JPH0830723A (ja) 1996-02-02

Family

ID=15815118

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6165583A Pending JPH0830723A (ja) 1994-07-18 1994-07-18 網掛け領域処理方法

Country Status (1)

Country Link
JP (1) JPH0830723A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002373341A (ja) * 2001-06-15 2002-12-26 Ricoh Co Ltd 網掛け領域検出装置、網掛け領域検出方法、プログラムおよび記憶媒体

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002373341A (ja) * 2001-06-15 2002-12-26 Ricoh Co Ltd 網掛け領域検出装置、網掛け領域検出方法、プログラムおよび記憶媒体

Similar Documents

Publication Publication Date Title
JP2001358925A (ja) 画像処理のための装置、方法及び記録媒体
JPS6159568A (ja) 文書処理装置
US20080018951A1 (en) Image processing apparatus and control method thereof
KR0167616B1 (ko) 화상 처리 장치 및 방법
CN113793264B (zh) 一种基于卷积模型的档案图像处理方法、系统和电子设备
JPH0830723A (ja) 網掛け領域処理方法
JP3566738B2 (ja) 網掛け領域処理方法および網掛け領域処理装置
JPH1153539A (ja) 円形パターン判定方法および記録媒体
JP2977259B2 (ja) スキュー検出方法
JP2803736B2 (ja) 文字認識方式
JP2909132B2 (ja) 光学的文字読取装置
JP4040231B2 (ja) 文字抽出方法及び装置並びに記憶媒体
JP2003016385A (ja) 画像処理装置、方法、プログラム、及び記憶媒体
JP2832019B2 (ja) 画像処理装置
JP2803735B2 (ja) 罫線を含んだ文字認識装置
JP3335032B2 (ja) 画像連結成分抽出装置
JPH07120392B2 (ja) 文字パターン切り出し装置
JPH03275371A (ja) 画像処理装置
JP2004240500A (ja) 画像処理装置、画像処理プログラムおよび記憶媒体
JPH05174178A (ja) 文字認識方法
JPS63129397A (ja) ドツトパタ−ン補正方法
JPH04311283A (ja) 行方向判定装置
JP2784059B2 (ja) 2値画像のノイズ除去方法および装置
JP2957774B2 (ja) 行方向判定装置
JP2888885B2 (ja) 文字切出し装置