JPS60153567A - 印刷文書画像の領域抽出方法 - Google Patents

印刷文書画像の領域抽出方法

Info

Publication number
JPS60153567A
JPS60153567A JP59009525A JP952584A JPS60153567A JP S60153567 A JPS60153567 A JP S60153567A JP 59009525 A JP59009525 A JP 59009525A JP 952584 A JP952584 A JP 952584A JP S60153567 A JPS60153567 A JP S60153567A
Authority
JP
Japan
Prior art keywords
dimensional fourier
area
character
fourier transformation
fourier transform
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59009525A
Other languages
English (en)
Inventor
Masahiko Hase
雅彦 長谷
Hiroyuki Hoshino
星野 坦之
Akihiro Shimizu
明宏 清水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP59009525A priority Critical patent/JPS60153567A/ja
Publication of JPS60153567A publication Critical patent/JPS60153567A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の技術分野〕 この発明は、既存の本や印刷文書中の情報を自動的に入
力する方法において、印刷文書画像中の文字領域と図形
領域の領域抽出を行う方法に関するものである。
〔従来技術〕
従来の文字1図形領域を抽出する方法としては、第1図
に示すように黒/白両画素のランレングスvllべ、そ
の長さの違いにより各領域を抽出する方法、あるいは第
2図に示すようK、一定領域内の文書の濃度分布め違い
により文字1図形領域を抽出する方法、または゛第3図
に示すよ5K、画素間の近接線密度を用い各領域を抽出
する方法等があった。
すなわち、第1図〜第3図において、1は印刷文書画像
である原画像、Xは副走査方向、yは主走査方向を示し
、(イ)は文字領域、(ロ)は図形領域である。
IIL1図では、例えば図形領域(ロ)を抽出するのに
白のランレングスに着目丁れば、図形領域←)の方が、
文字領域沿より長いことから真領域(イ)、←)の区別
を行うことかできる。
第2図では、ある大きさの枠4−→をとって、その内部
の濃度分布tみると、図形領域(ロ)の方が文字領域ピ
)より薄いことから両領域(イ)、(ロ)の区別を行う
ことかできる。
第3図では、ある画素について、矢印に)K示すように
上下、左右の4方向の近接画素の有無から近接線密度を
め、この差から文字領域(イ)と図形驚舅←)l抽出す
るものである。
しかし、以上3つの方法はいずれも画素間の情報に着目
したものであり、実際に計算機で演算を行った場合は処
理時間はミニコンピユータを用いて数時間におよぶとい
う欠点があった。
〔発明の概要〕
この発明は、これらの欠点を解決するため、文書画像l
ラインごとの濃度情報を一次元フーリエ変換を行い、そ
のフーリエ変換された情報より文字ピッチに対応し工ビ
ーク点l抽出し、そのピーク点の変換強度の相対値の違
いにより文子領域と図形領域を切り分けて領域抽出を行
うものである。
以下、図面についてこの発明を詳l!5VC説明する。
〔発明の実施例〕
はじめに、この発明の原理について説明し、次いで実施
例について述べる。
第4図に示されるような印刷文書画像の濃度分布−g 
f (1,7)とすると、X方向に対するlラインに対
する7−リエ変換は、次のような式で表てことかできる
F (u) = f:二。f (x、y)exp(−j
2πux)dxここでUは、空間周波数である。
ディスクリートな形で表現すると、次のような形で表て
ことができる。
ここでNは、対象とする所定の大きさ内の副走査方向の
画素数である。
一般に、既存の本や原稿の中の文字列は周期性なもつた
めKF(u)は、その周期性に対応した空間周波数Uの
所にピーク点が生じる(第4図、第5図参照)。ピーク
点の空間周波数Uの位置は、文字の周期に対応したもの
である。
第5図、第6図に1ラインの画像情報tプーリ5−変換
した結果を示す。第5図のようK、文字がある一定ピッ
チで1ライン全部に存在する第4図のAfgAVc沿っ
て走査した場合は、ピーク点の相対値は大きいが、文字
が1ラインの半分程度までしか存在しない第4図のB@
に沿って走査した場合での一次元フーリエ変換のピーク
点の値は、lライン全部に文字が存在する場合に比較し
て減少することになる(第6図参照)。しかし、ピーク
点が存在する空間周波数Uの位置は、文字σ)周期が同
じであることから変化しない。
つまり、ピーク点が存在する空間周波数Uの位置での変
換強度の値を比較することにより、X方向での文字領域
と図形領域ン判別できる結果となる。すなわち、第7図
の■、■の領域を判別することは可能となる。
次に11問題となるのか■の領域内での文字5図形領域
(イ)、(ロ)の抽出方法であり、以下にその方法につ
いて述べる。
■の領域内のX方向の一次元フーリエ変換を行い、その
結果の文字周期に対応したピーク点の位置での変換強度
の大きさによって両領域(イ)、(ロ)の切り出しを行
うこととする。その概念図を第8図に示す。
第8図において、■の部分なX方向に一次元フーy工変
換した結果ビ第9図(a) VCボす。
第9図(a)の−次元フーリエ変換結果には、X方向の
文字周期に対応したピーク点が存在する。
また、第8図の■の部分を一次元フーリエ変換した結果
を第9図(b) K示す。
第9図(b)K示す一次元フーリエ変換結果には、原画
像にX方向の周期性が存在しないためピーク点が存在し
ない。つまり、ピーク点の有無外よって文字領域と図形
領域の領域抽出が可能となる。
以下に具体的な対象例について説明する。
第1O図に処理対象画像(512X512画素)の−例
を示す。次に、原画像を2値化しX方向の第10図に示
す線の位置でX方向に一次元フーリ工変換した結果をm
l1図に示す。第11図に示すようK、文字の周期に対
応するピーク点が検出できる。つまり、1行の文字数に
対応した空間周波数Uの所にピーク点が存在する。
次k、第12図にy方向の位置に対する各X方向の一次
元フーリエ変換の文字周期に対応するピーク点(この場
合242の変換強度の大きさt示す。なお、Thは変換
強度のしきい値を示す。
第12図より明白なようK、文字かX方向に1行丁べて
存在する文字領域ピ)の場合にはビ り点の値か高く、
文字数が手分しか存在しない図形領域(ロ)の場合には
変換強度の値は小さくなり、明白に文字領域(イ)と図
形領域(ロ)の判別が可能である。
次に、前述したように、同じよ5Ky方向に対する一次
元フーリエ変換を行うことにより、X方向の位置座標を
検出てることが可能である。
次に、この発明の一実施例について第13図のブロック
図と、第14図の処理ツー−により説明する。なお、第
14図中の■〜■は各ステップを示す。
第13図において、1は原画像であり、2は画像情報検
出S(テイテクタ、s)、3は2値化処理部、4は一次
元フーリエ変換処理部、5は情報蓄積部、6は抽出され
た結果を表示する画像情報表示部、Tは情報制御部、8
はプログラム等を格納するメモリ部、9は共通バスであ
る。
原画像1のデータは画像情報検出′m2により検出さt
t、2値化処理部3より2値化されるの。次K、−次元
フーリエ変換処理部4でX方向の一次元フーリエ変換処
理が行われ■、領域抽出が行われ文字列のピッチに対応
したピーク点の値の変化より図形領域の抽出を行う■。
次に、再び一次元フーリエ変換処理部4でy方向の一次
元フーリ工変換が行わj■、ピーク点の値の変化より図
形領域の抽出が行われ■、領域抽出された各デ、−夕は
情報蓄積部SK蓄積される。
なお、上記実施例における原画像1は手書による印刷文
書画像でも折目があるか、あるいはきらんと揃えて書い
てあればこの発明を適用することができる。
〔発明の効果〕
以上説明したようk、この発明は、印刷文書の文字の周
期性に着目し、−次元フーリエ変換を利用して文字ピッ
チに対応したピーク点を抽出し、ピークの大きさt比較
することにより文字領域と図形領域の位置を抽出するよ
うKしたので、−次元フーリエ変換のみで処理できるk
め従来の方法よりも地理時間が短くてすむ。
また、地理か1ライン単位で行うことができるので、フ
ァクス等のライン単位で情報入力する機器においても適
用できる利点かある。
【図面の簡単な説明】
第1図はランレングスを用いた領域抽出法の説明図、第
2図は画像の一定領域内の濃度を用いた領域抽出法の説
明図、第3図は任意の点で次の黒点まで距離の加算によ
る領域抽出法の説萌図:第4図は原画像例およびフーリ
エ変換を行うエリアの説明図、第5図は第4図のA@に
沿つに走f、を7−リエ変換した場合のフーリエ変換結
果を示す図、第6図は第4図のB IIAK’沿った走
査tフーリエ変換した場合のフーリエ変換結果を示す図
、第れる領域の説明図、第9図(a)、(b)は第8図
の■の部分の一次元フーリエ変換結果と、第8図の■の
部分の一次元フーリエ変換結果をそれぞれ示す図、第1
0図は処理画像の一例を示す図、第11図は一次元フー
リエ変換処理結果を示す図、第12図は一次元フーリエ
変換結果のピーク点の大きさt示す図、第13図はこの
発明の一実施例を示す □ゾ冒ツク図、第14図は処理
フローを示す図である。 図中、1は原画像、2は画像情報検出部、3は2値化処
理部、4は一次元フーリエ変換処理部、5は情報蓄積部
、6は画像情報表示部、Tμ情報制御部、8はメモリ部
、9は共通パスである。 第1図 第3図 第4図 第5図 第6図 第7図 第8図 第9図 (b) 第10図

Claims (2)

    【特許請求の範囲】
  1. (1) 印刷文書画像の文字領域と図形−域を切り分け
    る方法において、地理すべき文書画像の1ラインごとの
    一次元フーリエ変換結果の文字ピッチに対応するピーク
    を検出し、そのピークの相対値の違いKより文字領域と
    図形領域との抽出を行うことt特徴とする印刷文書画像
    の領域抽出方法。
  2. (2) 文書画像の1ラインごとの一次元フニリエ変換
    を行う場合に、文書画像をあるしきい値で2値化を行い
    、その後に画素ごとの論理和演算を行い、そjから一次
    元フーリエ変換を行うことを特徴とする特許請求の範囲
    第(llJA記載の印刷文書画画像の領域抽出方法。
JP59009525A 1984-01-24 1984-01-24 印刷文書画像の領域抽出方法 Pending JPS60153567A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59009525A JPS60153567A (ja) 1984-01-24 1984-01-24 印刷文書画像の領域抽出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59009525A JPS60153567A (ja) 1984-01-24 1984-01-24 印刷文書画像の領域抽出方法

Publications (1)

Publication Number Publication Date
JPS60153567A true JPS60153567A (ja) 1985-08-13

Family

ID=11722682

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59009525A Pending JPS60153567A (ja) 1984-01-24 1984-01-24 印刷文書画像の領域抽出方法

Country Status (1)

Country Link
JP (1) JPS60153567A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01293485A (ja) * 1988-05-23 1989-11-27 Toshiba Corp 画像認識装置
JP2000339460A (ja) * 1999-05-26 2000-12-08 Sharp Corp 注目領域設定装置、および注目領域設定方法
JP2003075708A (ja) * 2001-09-07 2003-03-12 Sony Corp 撮像装置用のレンズ装置および該レンズ装置に使用されるフレキシブルプリント配線板

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01293485A (ja) * 1988-05-23 1989-11-27 Toshiba Corp 画像認識装置
JP2000339460A (ja) * 1999-05-26 2000-12-08 Sharp Corp 注目領域設定装置、および注目領域設定方法
JP2003075708A (ja) * 2001-09-07 2003-03-12 Sony Corp 撮像装置用のレンズ装置および該レンズ装置に使用されるフレキシブルプリント配線板

Similar Documents

Publication Publication Date Title
JP3308032B2 (ja) スキュー補正方法およびスキュー角検出方法およびスキュー補正装置およびスキュー角検出装置
Gebhardt et al. Document authentication using printing technique features and unsupervised anomaly detection
US5915039A (en) Method and means for extracting fixed-pitch characters on noisy images with complex background prior to character recognition
US5075895A (en) Method and apparatus for recognizing table area formed in binary image of document
JPS61267177A (ja) 文書画像追加情報の蓄積方法
JP2002133426A (ja) 多値画像から罫線を抽出する罫線抽出装置
Carter et al. Automatic recognition of printed music
JP2014131278A (ja) 印刷された文書の認証方法
JP2019016350A (ja) 電子文書における強調テキストの識別
US9818028B2 (en) Information processing apparatus for obtaining a degree of similarity between elements
JPS60153567A (ja) 印刷文書画像の領域抽出方法
JP2008028716A (ja) 画像処理方法及び装置
Widiarti et al. Preprocessing model of manuscripts in Javanese characters
JP3171626B2 (ja) 文字認識の処理領域・処理条件指定方法
JPH0333990A (ja) マスク処理を用いる光学式文字認識装置及び方法
JP3476595B2 (ja) 画像領域分割方法、および画像2値化方法
JP2019003534A (ja) 画像処理プログラム、画像処理装置、及び画像処理方法
Salagar et al. Analysis of PCA usage to detect and correct skew in document images
JP4548062B2 (ja) 画像処理装置
JP2001126027A (ja) ナンバープレート認識装置
JP3162451B2 (ja) 文字認識の前処理方法
JPH02252078A (ja) 文書の領域識別方法
JP2020149426A (ja) 文字認識装置、文字認識方法、および文字認識プログラム
Banerjee et al. Hand-drawn line removal from Bangla printed document images
Mishra Optical character recognition of printed Odia documents