JPS6361382A - 線画像からの文字成分除去方法 - Google Patents

線画像からの文字成分除去方法

Info

Publication number
JPS6361382A
JPS6361382A JP61205652A JP20565286A JPS6361382A JP S6361382 A JPS6361382 A JP S6361382A JP 61205652 A JP61205652 A JP 61205652A JP 20565286 A JP20565286 A JP 20565286A JP S6361382 A JPS6361382 A JP S6361382A
Authority
JP
Japan
Prior art keywords
line
image
point
character
processing unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61205652A
Other languages
English (en)
Inventor
Tomoyuki Kiyosue
悌之 清末
Takashi Nishimura
孝 西村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP61205652A priority Critical patent/JPS6361382A/ja
Publication of JPS6361382A publication Critical patent/JPS6361382A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、ディノタル画像処理方法を用いて、文字・線
図形両成分を含む線画像を文字成分と線図形成分に分離
し、文字成分のみを除去する処理方法に関するものであ
る。
(従来の技術) 従来、このような分野の技術としては、電;通信学会総
合全国大会〔昭和60年度〕影山尊之他、13411W
Pにおける罫線認識ソフトウェア、5−169、に示す
ようなものがあった。
第2図a + b r C* d r eは従来の線図
形成分抽出に関する一手法の説明図である。この場合、
線画像中の線図形は、主として縦線成分5.横線成分4
から構成されている線画像を対象にするものである。
まず原画の線画像を二値化して、第2図aに示すように
、横線成分4と縦線成分5と文字成分6の白黒(Ilo
)のみの画像とする。次にこの二値化された線画像を端
から順次スキャンしていって、水平・垂直方向に、予め
設定したしきい値Lth以上の連なりを持つ成分を抽出
し、第2図すに示すように、その画素に水平(H)ラベ
ル1又は垂直(V)ラベル2を付加する。どちらでもな
い場合には未定義のラベル(U)3を付加する。なお画
素とは、画像伝送の小さく区切られた部分をいう。
画像全体にこのラベル付けが終了した時点で、水平(H
)ラベル1もしくは垂直(V)ラベル2が連続している
端から端までを、第2図Cに示すように、一つの水平線
・垂直線とする。図では一つの水平線7が示されている
。未定義ラベル3ば、これを文字の成分6として除外す
る。従って第2図dに示す如く、水平、垂直方向の画素
の連なりが、予め設定しておいたしきい値Lth 8以
下の長さとなってしまうほどの傾きを原画が有している
場合や又は第2図eのように手書きの原画で、手書きに
よることの変形のために、水平線・垂直線の途中で水平
(H)ラベルIもしくは垂直(V)ラベル2が付されて
いない画素が存在する場合などは文字成分6として除外
し水平(H)ラベル1および垂直(V)ラベル2によっ
て線図形成分を形成する。
また従来の線図形成分抽出の他の手法としては、画像中
の縦書き・横書きされた文字列を抽出する方法があり、
文字が一定数以上集まった場合有効である。
(発明が解決しようとする問題点) 従来の技術においては、前記の通り、水平・垂直方向の
画素の連なりが、予め設定しておいたしきい値Lth以
下の長さとなってしまうほどの傾きを原画が有している
場合、または手書きの原画で、手書きによることの変形
のために、水平線・垂直線の途中で水平(H)もしくは
垂直(lのラベルが付されていない画素が存在する賜金
なとで、本来線図形成分として残されていなければなら
ない箇所が文字成分のそれとして判断され除去されてし
まうという欠点があった。
また他の方法には、画像中の縦書き・横書きされた文字
列を抽出する方法があるが、文字が一定数以上集まった
場合にのみ有効であり、また縦・横方向の傾きについて
は、予め前処理で傾き補正をしなければならないなどの
欠点があった。
本発明は、線画像からの文字成分の除去に関する従来の
方法において、原画の傾きや、手書きの原画の場合の変
形などが存在する場合に、うまく文字成分の除去が行わ
れないという問題点を解決した、線画像からの文字成分
の除去方法である。
(問題点を解決するための手段) 前記問題点を解決するため本発明においては、文字を含
む線画像から文字成分のみを除去して線図形成分を残す
、線画像からの文字成分除去方法において、画像を形成
する画素を画像入力部12に入力し、つぎに二値化処理
部13において、前記画素に110の値のみを与えて原
画の線画像に白黒二値化の処理を行い、つぎに細線化処
理部14において、線幅1画素の線画に対する細線化の
処理を行い、つぎに線追跡処理部15において、前記細
線化された線画を順次たどっていって線追跡をなし座標
値点列を作り出していく処理を行い、つぎに近似線分抽
出処理部16において、前記点列上の各座標点とこの点
の点列上の両側の近傍の点との間で折れ曲がり角度を算
出し、予め定めておいたしきい値より大きな折れ曲がり
角度を有する点を選び、これらの点間を直線で補間する
つぎに文字成分除去処理部17において、前記補間され
た直線による原画を近似する直線群について、長さの分
布をとり、この分布から長短判定のためのしきい値を定
め、このしきい値より短い成分を削除して長さの分布を
変化させ、削除後に残った直線で線画をディスプレイ1
8上に描き。
前記各部をメモリ19とCPU 20により制御するよ
うに構成した。
(作用) 本発明を前記の通り構成したので、線図形を構成する直
線よりも比較的短い直線で構成される文字の部分が削除
され、結果は、原画の線画像から文字成分が除去され、
線図形の箇所のみが残されている線画が得られる。
このように、本発明ではご文字成分と線図形成分の分離
において、原画中の成分の傾きの情報を用いていないた
め、原画の傾きによらず文字・線図形成分の分離が可能
である。また、画゛像上の黒画素を線追跡しているので
、原画上で手書きによる変形や歪みが生じていても、連
結していれば成分の分離は可能である。さらに、線図形
成分については、一定方向(縦もしくは横など)のみを
許すなどの制限はないのである。
(実施例) 本発明の一実施例を図面と共に説明するっ第1図aは本
発明の一実施例の方法による装置のブロック構成図、第
1図b−1乃至b−6は本発明の詳細な説明図で本発明
の夫々の段階を説明する。第1図aにおいて、11は原
画、12は画像入力部であって、原画11″Jtカメラ
、ドラムスキャナ等を用いて画像入力部12に入力し電
子化する。13は二値化処理部で、二値化処理部13で
画像の二値化を行う。14は細線化処理部であって、細
線化処理部14で前記の画像は公知の技術により細線化
される。15は線追跡処理部であって、線追跡処理部1
5は後から述べる手法により、線追跡処理を行う。16
は近似線分抽出処理部であって、近似線分抽出処理部1
6は後から説明するように曲率計算を行いしきい値を用
いて原画11を線分で近似する。17は文字成分除去処
理部であって、文字成分除去処理部17は後から説明す
るように線分の長さ分布をとり、しきい値を用いて短い
線分を除去し長さ分布を変形させることによって文字成
分を除去する。18はディスプレイ、19は計算機のメ
モリ、20は中央処理部(CPU ) 、 21は共通
パスであって図示の通り接続されている。
前記各部の動作を説明すると、例えば人間の手書きした
線画の原画11はまず画像入力部12にカメラ入力もし
くはファクスのようなイメージリーグ等の装置から入力
され、一画素あたり数階調の濃度を持つ画像が出力され
る。次に、二値化処理部13で、一画素あたり二階調の
濃度、すなわち背景は白色で線は黒色しか持たない画像
となる。
次に細線化処理部14で、画像中の線の線幅を細めて幅
−画素の線図形とする。
次に、線追跡処理部15において、線が追跡され、線上
の黒画素がそれぞれX、Y座標値の連なりとして出力さ
れる。次に、近似線分抽出処理部16において、線上黒
画素近傍の黒画素間でX。
Y座標値をもとに、折、九曲がり角度の計算を行って、
この値の大きい画素を線上の折れ曲がり点と判断する処
理を基本として、線を直線で分割、近似する。
前記の線追跡処理部15における線追跡処理と近似線分
抽出処理部16における近似線分抽出処理を第3図a、
bで示す。第3図aは線追跡処理の説明図であるが、図
に示す如く、まず任意の黒画素(線上の点)iに着目し
、次にその近傍の黒画素jを探す。次に同様のことをj
について行いi以外の黒画素kを探す。以下これを同様
に行い、各画素のX、Y座標を登録してゆくのである。
第3図b(イ)、(ロ)は近似線分抽出処理の説明図で
あるが、図に示す如く点iの近傍でΔだけ離れた点(図
(イ)ではΔ=5である)との間で折れ曲がり角度θi
を計算する。この角度θiがあるしきい値より大きな値
をもつとき、この点】を折れ曲がり点と判断し、以下こ
のような点を探し、この点間を直線分で結び図(ロ)が
得られる。この時得られる直線分を近似線分と呼んでい
る。
前記の通り第1図b−1乃至b−6は本発明の一実施例
の実際の処理例の前記の夫々の段階を図示したものであ
るが、第1[ff1b−1は二値化された原画を示し、
この例は図の通り価格表の例である。第1図b−2は前
記原画の二値化、細分化された原画である。第1図b−
3は直線近似化した原画で第1図b−4はb−3図をも
とに線分の長さのヒストグラムをとったもの、第1図b
−5はb−4図をしきい値を定め短い成分を除去したヒ
ストグラム、第1図b−6は残った線分で構成された線
画であって、図示の通シ文字の部分の削除された線画が
得られるのである。
本発明の主要部分である、文字成分除去処理部17で行
われる処理は、第4図(イ)(ロ)に示すように、まず
、線分の長さについて分布(ヒストグラム)をとって線
画像中の線図形成分を構成する比較的長い線分群と、文
字成分を構成する比較的短い線分群との二つの線分群を
何らかの方法で分離する。
前記分離方法として、例えば、N、0tsu、rAth
reshold 5election method 
from gray−1evelhistgrams 
J 、 IEEE Trans、 Jan、 1979
 Vol、 SMC−9、PP62−66、もしくは大
津展之、「判別および最小2乗基準に基づく自動しきい
値選定法」、信学論(D) 、 April、 198
0.Vol J 63−D、PP349−356に示さ
れているが、第5図aに示すようにヒストグラムを強制
的に双峰性の分布と見なし、二つの正規分布の交叉部を
しきい値とする方法を用い、このしきい値以下の線分を
除去するのである。
別の分離方法としては、第5図すに示すように、ヒスト
グラム中に現れる二つの極大値間の中間値の線分の長さ
るしきい値としてこれ以下の長さの線分を除去するので
ある。
さらに別の分離方法としては第5図Cに示すように、線
分ヒストグラム中に現れる二つの極大値間の最小値(複
数候補の場合はこの平均)の線分の長さをしきい値とし
てこれ以下の長さの線分を除去するのである。
(発明の効果) 以上説明したように、本発明を用いれば、入力する際の
原稿の傾きに関して留意されていない線画像や、ラフに
描かれた手書きの線画像から、文字成分のみを自動的に
除去することができる。
従って、残った線図形部分を用いて、線画の清書を自動
的に行う装置などの前段の処理として有効であるという
効果がある。
【図面の簡単な説明】
第1図aは本発明の一実施例の方法による装置のブロッ
ク構成図、第1図b−1乃至b−6は本発明の一実施例
の説明図1乃至6、第2図aは従来の二値化した線画像
の一例の説明図、第2図すは従来の画素にラベルを付加
した説明図、第2図Cは従来のラベル付は終了時の説明
図、第2図dは従来の画素の連なりがしきい値以下の傾
きの時の説明図、第2図eは従来の手書きの変形の時の
説明図、第3図aは線追跡処理の説明図、第3図すは近
似線分抽出処理の説明図、第4図は文字成分除去処理部
17の説明図1、第5図a乃至Cは文字成分除去処理部
17の説明図2乃至4、である。 1・・・水平ラベル、2・・・垂直ラベル、3・・・未
定義のラベル、4・・・横線成分、5・・・縦線成分、
6・・・文字成分、7・・・一つの水平線、8・・・し
きい値、11・・・原画、12・・・画像入力部、13
・・・二値化処理部、14・・・細線化処理部、15・
・・線追跡処理部、16・・・近似線分除去処理部、1
7・・・文字成分除去処理部、18・・・ディスプレイ
、19・・・メモリ、20・・・CPU、21・・・共
通パス。 本発明の一実施例の方法による装置のブロック構成図第
1図0 線追跡処理の説明図 第3図q 近似線分抽出処理の説明図

Claims (1)

  1. 【特許請求の範囲】 文字を含む線画像から文字成分のみを除去して線図形成
    分を残す、線画像からの文字成分除去方法において、 画像を形成する画素を画像入力部(12)に入力し、 つぎに二値化処理部(13)において、前記画素に1/
    0の値のみを与えて原画の線画像に白黒二値化の処理を
    行い、 つぎに細線化処理部(14)において、線幅1画素の線
    画に対する細線化の処理を行い、 つぎに線追跡処理部(15)において、前記細線化され
    た線画を順次たどっていって線追跡をなし座標値点列を
    作り出していく処理を行い、 つぎに近似線分抽出処理部(16)において、前記点列
    上の各座標点とこの点の点列上の両側の近傍の点との間
    で折れ曲がり角度を算出し、予め定めておいたしきい値
    より大きな折れ曲がり角度を有する点を選び、これらの
    点間を直線で補間する。 つぎに文字成分除去処理部(17)において、前記補間
    された直線による原画を近似する直線群について、長さ
    の分布をとり、この分布から長短判定のためのしきい値
    を定め、このしきい値より短い成分を削除して長さの分
    布を変化させ、削除後に残った直線で線画をディスプレ
    イ(18)上に描き、 前記各部をメモリ(19)とCPU(20)により制御
    することを特徴とする 線画像からの文字成分除去方法。
JP61205652A 1986-09-01 1986-09-01 線画像からの文字成分除去方法 Pending JPS6361382A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61205652A JPS6361382A (ja) 1986-09-01 1986-09-01 線画像からの文字成分除去方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61205652A JPS6361382A (ja) 1986-09-01 1986-09-01 線画像からの文字成分除去方法

Publications (1)

Publication Number Publication Date
JPS6361382A true JPS6361382A (ja) 1988-03-17

Family

ID=16510436

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61205652A Pending JPS6361382A (ja) 1986-09-01 1986-09-01 線画像からの文字成分除去方法

Country Status (1)

Country Link
JP (1) JPS6361382A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5897159A (en) * 1995-12-01 1999-04-27 Hino Jidosha Kogya Kabushiki Kaisha Roof structure of vehicle
US6042177A (en) * 1997-09-18 2000-03-28 Hino Jidosha Kogyo Kabushiki Kaisha Roof structure for vehicle

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5897159A (en) * 1995-12-01 1999-04-27 Hino Jidosha Kogya Kabushiki Kaisha Roof structure of vehicle
US5951099A (en) * 1995-12-01 1999-09-14 Hino Jidosha Kogyo Kabushiki Kaisha Roof structure of vehicle
US6042177A (en) * 1997-09-18 2000-03-28 Hino Jidosha Kogyo Kabushiki Kaisha Roof structure for vehicle

Similar Documents

Publication Publication Date Title
JP2940936B2 (ja) 表領域識別方法
US5335290A (en) Segmentation of text, picture and lines of a document image
US4757551A (en) Character recognition method and system capable of recognizing slant characters
KR20090004904A (ko) 모델-기반 디워핑 방법 및 장치
JP3411472B2 (ja) パターン抽出装置
JP2000207489A (ja) 文字抽出方法、装置および記録媒体
CN115578741A (zh) 一种基于Mask R-cnn算法和类型分割的扫描文件版面分析方法
JPH0418351B2 (ja)
JPH0950527A (ja) 枠抽出装置及び矩形抽出装置
JPS6361382A (ja) 線画像からの文字成分除去方法
JPH1125222A (ja) 文字切り出し方法及び文字切り出し装置
JP2871590B2 (ja) 画像抽出方式
JP2796561B2 (ja) 表形式文書認識方式
JP4194309B2 (ja) 文書方向推定方法および文書方向推定プログラム
JP3462727B2 (ja) 文字列2値化装置
JP4409678B2 (ja) 罫線抽出方式
JP2968284B2 (ja) 文字認識装置およびその文字領域分離方法
JPH02166583A (ja) 文字認識装置
JP2803735B2 (ja) 罫線を含んだ文字認識装置
JPH0452783A (ja) 図面読取装置
JP4439054B2 (ja) 文字認識装置及び文字枠線の検出方法
JP2005056346A (ja) 傾き検出方法、傾き検出装置およびプログラム
JP2797523B2 (ja) 図面続取装置
JP3030814B2 (ja) ノイズ成分除去方法及びノイズ成分除去プログラムを記録した記録媒体
CN112529017A (zh) 一种基于sobel算子的图像边缘提取的方法与系统