JPS58201182A - 文字・図形切り分け方法 - Google Patents

文字・図形切り分け方法

Info

Publication number
JPS58201182A
JPS58201182A JP57083993A JP8399382A JPS58201182A JP S58201182 A JPS58201182 A JP S58201182A JP 57083993 A JP57083993 A JP 57083993A JP 8399382 A JP8399382 A JP 8399382A JP S58201182 A JPS58201182 A JP S58201182A
Authority
JP
Japan
Prior art keywords
character
fourier transform
input screen
area
dimensional fourier
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP57083993A
Other languages
English (en)
Other versions
JPH0373915B2 (ja
Inventor
Masahiko Hase
雅彦 長谷
Hiroyuki Hoshino
星野 坦之
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP57083993A priority Critical patent/JPS58201182A/ja
Publication of JPS58201182A publication Critical patent/JPS58201182A/ja
Publication of JPH0373915B2 publication Critical patent/JPH0373915B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 この発明は、書籍や印刷文書中の情報を自動的に入力す
る装置において、記述されている文字列の領域と図形領
域とを切り分けする方法に関するものである。
従来の文字・図形領域を切り分ける方法では、入力画面
を縦横方向に投影し、濃度のヒストグラムを作成し、ヒ
ストグラムの極端に変化する場所を判別することにより
文字領域と図形領域の切り分けを行っている。すなわち
、第1図で、1け入力画面で、文字領域2と図形領域3
とに文字と図形が印刷されている。4け縦方向の濃度の
ヒストグラム、5は同じ(横方向の濃度のヒストグラム
である。そして濃度の極端に変化する部分4A。
5Aを文字領域2と図形領域3の切り分は部分とする。
しかしこの方法では入力画面1が傾いている場合には縦
横の濃度のヒストグラム4,5け第2図のようになり周
辺分布を正確に取ることが不可能である。
また文字2図形の黒ラン、白ランのラン・レングスの統
計的性質または黒画素の密度を加算することにより第3
図の曲線6をつくり文字および図形領域の切り分けを行
う方式もある。この方式では、処理時間が大きくなり、
かつ文字・図形を切り分けるしきい値の設定がむずかし
いという問題がある。
この発明は、上記した従来方式の欠点を解決するため、
文書画像全体の濃淡情報を空間的2次元フーリエ変換を
行い、そのフーリエ変換された情報をもとにして、ある
いけあらかじめ行間隔がわかっているときにはその値を
もとにして局所領域(SMALL  MATRIX)の
スモール・マトリックス・サイズを決定し、そのスモー
ル・マトリックス・サイズをもとにして文書全体を走査
し、2次元フーリエ変換のピーク値の絶対値の変化によ
り文字列領域と文書領域を切り分ける方法である。
以下、図面についてこの発明の詳細な説明する。
f(x+y)を入力された画像の濃度分布とすると空間
周波数成分g(ω8.ωア)は次のようにあられすこと
ができる。
g(ω8.ωy)”fff(x、y)e−t(a+x′
計″′y”)dxdy−膜圧既存の書籍や原稿の中の文
字列は、周期性をもつために、その周期性に対応したω
8.ωアの所にピークが生じる。第4図(a)、 (b
) ic入力画面1が傾いていない場合の文字列と2次
元フーリエ変換された平面の図形を示す。1け入力画面
Tはフーリエ変換され元平面、8け原点に近い第1ピー
ク点である。なお!、y、z軸方向にそれぞれ、ω0.
ωア、1g(ω8.ωy)1  をとっである。
第4図(b)に示す第1ピーク点8に対応するωアの逆
数が入力画像における文字列の行間隔となる。
印刷文書全体の行間隔が求められた後に局所的に見るた
めのウィンドウの画素数を決定する。そのウィンドウの
マスクの大きさを決定する場合の条件は、文字列をフー
リエ変換した場合に、ピークが十分に検出できる行数を
有することである。スモール・マトリックス・サイズ(
SMALL  MATRIX  5IZE)が決定さし
tt、ば、第5図に示すように入力画面1全体をそのウ
ィンドウサイズに従って走査し、タイミングをはかつて
2次元フーリエ変換を行う。なお、9けスモール・マト
リックスを示し、10け前記スモール・マトリックス9
の移動方向を示す。その時スモール・マトリックス9の
2次元フーリエ変換値のピークを監視していることによ
って、変換面にピークが出現すれば文字領域2であり、
ピークが検出できなければ図形領域3モある。その2次
元フーリエ変換のピーク値が消滅する領域を掌握するこ
とにより【文字領域2と図形領域3の切り分けを行うこ
とができる。
次に文字列が傾いている場合では、まず入力画面1全体
のフーリエ変換のピーク点の位置より文字列の傾いてい
る角度を求めることができる。これを第6図(a)、(
b)K示す。具体的には第7図に示すように文字列が傾
いている場合でも、第6図(b)VC示す原点に近い第
1ピーク点8′に対応するω工、ωアで決定される値の
逆数が入力画面1における文字列の行間隔になる。ピー
ク点の位置関係より文字列の傾いている角度を求めるこ
とができ、その角度に従って走査してスモール・マトリ
ックス・サイズで頴次2次元フーリエ変換を行い、文字
列が傾いていない場合と同様に、ピーク値を観察するこ
とによつ【文字領域2と図形領域3の切り分けを行うこ
とができる。
第8図にこの発明の一実施例のブロックダイアダラムを
示す。第8図において、11け入力カメラ、12け前処
理部、13け2次元フーリエ変換部、14け行間隔・位
置・角度の検出部、15けスモール・マトリックス・サ
イズ決定部、16けスモール・マトリックス・走査部、
17け2次元フーリエ変換部、18は文字・図形領域切
り分は部である。
まず入力画面1をTVカメラ等の入力カメラ11でその
信号を取込み、前処理部12で濃度補正。
ディジタルフィルタ等の処理を行う。その後、2次元フ
ーリエ変換部13で2次元フーリエ変換処理を文書画像
全体に行いフーリエ変換された空間で原点付近の第1ピ
ーク点8.8’(第4図、第6図)を見い出し、行間隔
・位置・角度の検出部14で全体の行間隔を求める。行
間隔が求まった後にスモール・マトリックス・サイズを
スモール−マトリックス・サイズ決定部15で求めてそ
のサイズで文書全体をスモール・マトリックス・走査部
16によりサーチし、これを2次元フーリエ変換部17
でフーリエ変換し、その2次元フーリエ変換のピーク点
を検出することによって文字・図形領域切り分は部18
で文字゛領域2と図形領域3の切り分1すを行う方法で
ある。2次元ツー1)工変換なお、レンズによるリアル
タイムの2次元フーリエ変換装置の製品例としては、D
eft LaboratrtesInc 、 rThe
 5er1es 200 J  がある。
以上説明したように、この発明は文字列の周期性に着目
し、文字列の行間隔な−もとに、あるいけ行間隔がわか
っていないときけ2次元フーリエ変換を適用し、行間隔
を求めそれをもとにスモール・マトリックス・サイズを
決定し、そのマトリックス・サイズのウインドワによっ
て文書画像全体を走査して2次元フーリエ変換のピーク
点を調べすることによってピークが検出できれば、文字
領域であり、ピークがなければ図形領域と決定するよう
にしたので、文字列が傾いている場合でも、文字領域と
図形領域を切り分けることが可能である。
特に行間隔を2次元フーリエ変換により求める場合には
全自動的に文字領域と図形領域の切り分けを行いうる利
点を有する。
【図面の簡単な説明】
第1図は従来の文字φ図形切り分は方法を説明するため
の入力画面とそのヒストグラムを示す図、第2図は従来
の文字・図形切り分は方法で文字列が傾いた場合の入力
画面とヒストグラムを示す図、第3図は従来の文字・図
形切り分は方法の説明図、第4図’(’a)、(b)は
人力画面と2次元フーリエ変換像を示す図、第5図はス
モール・マトリックス・サイズと移動方向の説明図、第
6図(a)、(b)は文字列が傾いている場合の入力画
面と2次元フーリエ変換像を示す図、第7図は文字列が
傾いている場合のスモール・マトリックスと移動方向の
説明図、第8図はこの発明の一実施例を示すブロック図
である。 図中、1け入力画面、2け文字領域、3け図形領域、7
けフーリエ変換され1こ平面、8,8′は原点に近い第
1ピーク点、9げスモール・マトリックス、11け入力
カメラ、12け前処理部、13け2次元フーリエ変換部
、14け行間隔・位置・角度の検出部、15けスモール
・マトリックス・サイズ決定部、16はスモール・マト
リックス・走査部、17は2次元フーリエ変換部、18
は文字・・図形領域切り分−す部である。 第1図 特開口R5B−201182(4) 第3図 第2図 し〃六 2〜−−1へ 第5図 q 第7図 第6図 (a)

Claims (6)

    【特許請求の範囲】
  1. (1)  印刷文書中の文字領域と図形領域を切り分け
    る方法において、処理すべき入力画面の文字列の行間隔
    の値をもとにして局所領域を走査するためのスモール・
    マトリックス・サイズを決定し、その人モール・マトリ
    ックス・サイズで前記入力画面全体を走査しながら2次
    元7−リエ変換を行い、そのフーリエ変換面での原点に
    近いピーク点の値を観察し、そのピーク点の値をもとに
    して文字領域と図形領域を切り分けることを特徴とする
    文字・図形切り分は方法。
  2. (2)2次元フーリエ変換を行う場合に、入力画面の濃
    度情報をディジタル的に入力し、フーリエ変換面でのピ
    ークを検出することを特徴とする特許請求の範囲第(1
    )項記載の文字・図形切り分は方法。
  3. (3)2次元フーリエ変換を行う場合に、入力画面の濃
    度情報を光学的に入力し、瞬時にフーリエ変換を行い、
    そのフーリエ変換面での情報な撮像素子を用いて入力し
    、ピーク点を検出することを特徴とする特許請求の範囲
    第(1)項記載の文字・図形切り分は方法。
  4. (4)  印刷文書中の文字領域と図形領域を切り分け
    る方法において、処理すべき入力画面全体の濃淡情報を
    空間的2次元フーリエ変換を行い、その変換された平面
    において、原点に近いピーク点を見い出すことにより、
    文字列の行間隔を求め、その行間隔の値をもとにして局
    所領域を走査するためのスモール・マトリックス・サイ
    ズを決定し、そのスモール・マ)リツクス・サイズで前
    記入力画面全体を走査しながら2次元フーリエ変換を行
    い、そのフーリエ変換面での原点に近いピーク点の値を
    観察し、そのピーク点の値をもとにして文字領域と図形
    領域を切り分けることを特徴とする文字・図形切り分は
    方法。
  5. (5)2次元フーリエ変換を行う場合に、入力画面の濃
    度情報をディジタル的に入力し、ブーリエ変換面でのピ
    ークを検出することを特徴とする特許請求の範囲第(4
    )項記載の文字・図形切り分は方法。
  6. (6)2次元フーリエ変換を行う場合に、入力画面の濃
    度情報を光学的に入力し、瞬時にフーリエ変換を行い、
    そのフーリエ変換面での情報な撮像素子を用いて入力し
    、ピーク点を検出することを特徴とする特許請求の範囲
    第(4)項記載の文字・図形切り分は方法。
JP57083993A 1982-05-20 1982-05-20 文字・図形切り分け方法 Granted JPS58201182A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57083993A JPS58201182A (ja) 1982-05-20 1982-05-20 文字・図形切り分け方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57083993A JPS58201182A (ja) 1982-05-20 1982-05-20 文字・図形切り分け方法

Publications (2)

Publication Number Publication Date
JPS58201182A true JPS58201182A (ja) 1983-11-22
JPH0373915B2 JPH0373915B2 (ja) 1991-11-25

Family

ID=13818052

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57083993A Granted JPS58201182A (ja) 1982-05-20 1982-05-20 文字・図形切り分け方法

Country Status (1)

Country Link
JP (1) JPS58201182A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61237181A (ja) * 1985-04-12 1986-10-22 Sumitomo Electric Ind Ltd 光学読取装置
JPH0535868A (ja) * 1991-07-31 1993-02-12 Toppan Printing Co Ltd 画像切り抜き装置
JPH0946519A (ja) * 1995-08-01 1997-02-14 Canon Inc 画像処理装置および方法
JP2000339460A (ja) * 1999-05-26 2000-12-08 Sharp Corp 注目領域設定装置、および注目領域設定方法
JP2003030584A (ja) * 2001-07-12 2003-01-31 Ricoh Co Ltd 文書認識装置、文書画像の領域識別方法、プログラム及び記憶媒体
WO2012132090A1 (ja) * 2011-03-25 2012-10-04 株式会社日立ハイテクノロジーズ 画像の正置からの回転角度検知装置および方法

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61237181A (ja) * 1985-04-12 1986-10-22 Sumitomo Electric Ind Ltd 光学読取装置
JPH0679349B2 (ja) * 1985-04-12 1994-10-05 住友電気工業株式会社 光学読取装置
JPH0535868A (ja) * 1991-07-31 1993-02-12 Toppan Printing Co Ltd 画像切り抜き装置
JPH0946519A (ja) * 1995-08-01 1997-02-14 Canon Inc 画像処理装置および方法
JP2000339460A (ja) * 1999-05-26 2000-12-08 Sharp Corp 注目領域設定装置、および注目領域設定方法
JP2003030584A (ja) * 2001-07-12 2003-01-31 Ricoh Co Ltd 文書認識装置、文書画像の領域識別方法、プログラム及び記憶媒体
JP4616522B2 (ja) * 2001-07-12 2011-01-19 株式会社リコー 文書認識装置、文書画像の領域識別方法、プログラム及び記憶媒体
WO2012132090A1 (ja) * 2011-03-25 2012-10-04 株式会社日立ハイテクノロジーズ 画像の正置からの回転角度検知装置および方法
JP2012203731A (ja) * 2011-03-25 2012-10-22 Hitachi High-Technologies Corp 画像の正置からの回転角度検知装置および方法
US9514526B2 (en) 2011-03-25 2016-12-06 Hitachi High-Technologies Corporation Device and method for detecting angle of rotation from normal position of image

Also Published As

Publication number Publication date
JPH0373915B2 (ja) 1991-11-25

Similar Documents

Publication Publication Date Title
EP0543593B1 (en) Method for determining boundaries of words in text
EP0543590B1 (en) Method for comparing word shapes
JP2002024836A (ja) ディジタルイメージから表題を抽出する方法
JPH0997342A (ja) 樹木離隔距離計測システム
JPS58201182A (ja) 文字・図形切り分け方法
JPH02224187A (ja) 直線に対するサーチ領域を発見するよう2値像をサーチする方法
JPH0656619B2 (ja) 白線検出装置
US5764788A (en) Strand orientation sensing
JPH0548510B2 (ja)
JP2675303B2 (ja) 文字認識方法
JP2800192B2 (ja) 高速文字図形分離装置
KR100194210B1 (ko) 영상분할장치 및 방법
JP3278983B2 (ja) 画像変換装置
EP0446630A2 (en) Method and apparatus for segmenting characters in an amount field on a financial document
JPH0344788A (ja) 文書画像の領域抽出方法
JPH02166583A (ja) 文字認識装置
JP4439054B2 (ja) 文字認識装置及び文字枠線の検出方法
JP3030814B2 (ja) ノイズ成分除去方法及びノイズ成分除去プログラムを記録した記録媒体
JPS59140589A (ja) 輪郭抽出装置
JPH0676110A (ja) 文字・文字行切出方法
JPH0397085A (ja) 定型フォーマット文字の切り出し方式
JPS5955581A (ja) 印刷文書画像の領域切り分け方法
JPH03160582A (ja) 文書画像データに於ける罫線と文字の分離方法
JPH0718810B2 (ja) パターン検査方法
JPH05174179A (ja) 文書画像処理装置