JPS62133584A - 文書画像処理方式 - Google Patents

文書画像処理方式

Info

Publication number
JPS62133584A
JPS62133584A JP60273226A JP27322685A JPS62133584A JP S62133584 A JPS62133584 A JP S62133584A JP 60273226 A JP60273226 A JP 60273226A JP 27322685 A JP27322685 A JP 27322685A JP S62133584 A JPS62133584 A JP S62133584A
Authority
JP
Japan
Prior art keywords
image
parallel lines
processing
memory
inclination
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP60273226A
Other languages
English (en)
Inventor
Haruo Takeda
晴夫 武田
Kuniaki Tabata
邦晃 田畑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP60273226A priority Critical patent/JPS62133584A/ja
Publication of JPS62133584A publication Critical patent/JPS62133584A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Image Processing (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は文書画像処理装置に関し、更にBp L <は
、文書画像データの傾き補正および文字H,H識の前処
理である行・文字切出に好適な文書画像処理方式に関す
る。
〔従来の技術〕
新聞、学術論文、特許明細書等の文R画像をI:・式に
関する知識なしに認識するためには、その1)1f処理
として文章の部分の画像を文字単位に切出す処理が必要
である。従来の文字切出しの代表的な方法としては、例
えば5 r複雑な摺造をもつ文書1iij像の自動解析
(情報処理学会第23口金国大会予稿集、6C−2)J
と題する文献などで使われている射影による方法がある
。この方法は、先ず画像を行方向に射影して射影上で黒
が連続する単位を行として抽出し、次に各行についてこ
れとは直角方向に射影して同様にして文字を切出すもの
である。
〔発明が解決しようとする問題点〕
上記従来技術は、画像全体が傾いて入力されたときや、
文章に枠9図表、写真2校正記号等の文字以外のノイズ
情報が混在しているときには行情報が抽出できないとい
う問題がある6また、この方法は、隣接する文字同志が
接触している場合、あるいは接触はしていないが互いに
入り組んでいるためにその射影が接触してしまう場合に
は文字の切出しができず、逆に、単一文字であっても、
例えば、横書きにおける平板名の「い」、縦丑きにおけ
る平板名の「こ」などのような分層文字の場合には、1
つの文字が2以上に分層して切出されてしまうと言う問
題があった。
本発明の目的は、画像の傾きや図表、接触・分離文字9
校正記号等のノイズの有無によらず、文書画像中の行・
文字を切出す手段、およびこれを利用して入力画像の傾
きを補正する手段を提供することにある。
c問題点を解決するための手段〕 上記目的を達成するため1本発明の文書画像処理方式で
は、ディジタル化した文書画像データの中で黒画素が連
結する領域を求め1次いで同一・直線上に含まれる代表
点の頻度に基づいて互いに平行な1組の複数の直線を抽
出し、これらの平行線を利用して上記画像データを処理
するようにしたことを特徴とする。
〔作用〕
画像入力装置から入力される文書データは、文章領域に
おける文字についてみると、各文字は規則的な格子また
は平行線上に配列されているが、これらの文字領域以外
に記された文字2図形、ノイズ等については上記のよう
な規則性がない。従って、例えば黒画素領域に外接する
所定の位置の画素を各領域の代表点として選び1文書画
像上に想定した多数の直線の中から、上記代表点が最も
高い頻度で含まれる互いに平行な直線の組を抽出すると
、これらの平行線は上記文字配列の基IIP!線、例え
ば文字枡目の縦線あるいは横線を示すものと見做せる。
本発明においては、このような平行線を抽出することに
より、文書上で本来なら水平あるいは垂直であるべき平
行線が傾いていた場合に。
傾き角度に応じて画像データを回転し、正しい姿勢の画
像データに変換する。また、これらの平行線を文字の切
り出しの基準線とし、入力画像中の文字を自動的に認識
する。
〔実施例〕
以下、本発明の−・実施例を図面を参照して説明する。
第1図は本発明を適用する文書画像処理装置の溝成を示
すブロック図であり、この装置は1画像入力装置fil
lと、ディジタル化された入力画像が一時的に格納され
る画像メモリ12と、傾き補正等の処理を受けた後の画
像データが格納さ九る画像メモリ!3と、画像処理およ
びこの装置全体の制御を行なうためのデータ処理袋[1
4と、上記データ処理装置を動作させるためのプログラ
ムおよびデータ類が格納されるメモリ15と、画像上の
黒画素連結領域の各代表点座標が記憶されるメモリ16
、平行線上の座標頻度が記憶さ汎るメモIJ 17 、
画像上の文字認識結果が記憶さ汎るメモリ18と、上記
画像メモリ13内の画像データが保存用として登録され
るファイル装置I8と、ディスプレイ装置19およびコ
マンド等の入力装置20とを備えている。
本装置において、処理装置14からのコマンドに従がい
1画像入力装[11から対象とする文言を入力すると、
文書上の画像情報がディジタル化された後、画像メモリ
12に格納される。処理装置14は1画像メモリ12内
のデータをJf次に処理し、画像上で黒画素が連結する
領域を判定し。
それぞれの領域の代表点を示す座標の一覧表をテーブル
メモリ16上に作成する。次に処理sii4は」二記各
代表点座標を順次テーブルメモリ16から読出し、傾き
角度を変えて設定した複数の平行線の組に対して各線上
を通る上記代表点の頻度を求め、それを一覧表にしてテ
ーブルメモリI7に格納する。そして、上記頻度が最も
高くなる平行線の組を求め、各直線の原点からの距離と
これらの共通の傾きOoを求める。文書データの傾き補
正を目的とする場合には、最後に上記傾きOoをもとに
、画像メモリ12のデータに回転処理を施し、画像メモ
リ13に格納する。画像メモリ13のデータは、その後
、例えば光ディスクを利用したファイル装置18に登録
したり、別の画像処理に用いられる。尚、回転角が既知
のディジタル画像回転アルゴリズムについては、たとえ
ばロ刊工業新聞社発行のコンピュータグラフィクス(1
つavid   F  、  Rogars、   J
  、Alen   Adams著 tIII r−’
I富士夫訳)第229頁から第230頁に詳ししXo 文書データの認識を目的とする場合には、上記代表点と
して各黒画素連結領域の上、下、左、右端点分布が最大
となる平行線の組を求める。このようにして求めた縦横
の各平行線で仕切られる折目は、文書データの文章領域
の各文字位置の候補となるため、この折目に従って画1
象メモリ12から1文字単位に領域を切出し、処理装置
14で文字認識を行い、結果をテーブルメモリ19やフ
ァイル装置18に格納する。文字を認識する場合、上述
した処理によって文字単位に画像を切出すことができる
ため、従来の0CR(光学文字読取装置)のアルゴリズ
ムをそのまま利用することができる。尚、画像入力の際
に文書の傾きが大きい場合には、上述した画像の回転処
理をしてから、文字認識動作に移ればよい6 第2図は、上記処理における文書画像データの流れを模
式的り描いた図である。図中(a)は対象とする文書画
像データの1例を示しており、この例では文章2図表の
他に文身上に下線、引出し線つきの追記メモ等のノイズ
が含まれ、かつ文書が傾いたものを想定している。尚、
これらのデータは、以下説明の簡単化のために、白黒2
値のディジタル画像とする。(b)は画像(a)に対す
る黒画素連結判定の結果得られた各連結領域に外接する
矩形を描いたものであり、(c)は(b)の各矩形の代
表点として選ばれた各矩形の最下端を与える黒画素の分
布を示したものである。(d)は(c)の各代表点を最
も多く通る横方向の平行線の組を求めたもので、(e)
は上記平行線の傾きOoをもとに原画像を回転した傾き
補正結果である。(f)は上記(C)、(d、)と同様
にして(1))の各矩形の最上端、最左端、最右端を与
える4つの黒画素を各矩形の代表点として選び、それぞ
れ最も多く通る横方向および縦方向の平行線の組を求め
たものである。図中斜線を付した部分が切出すべき文字
位置の候補領域となる。
次に、以上の処理を実現するためにプログラムメモリ1
5に用意されるプログラムについて説明する。
まず最初に、第2図の(a)から(b)を得る連結領域
抽出のための処理について説明する。連−タ上で図示し
たものである。
次に、テーブル3】から1画像データ上に設定された複
数の直線に対して、これらの直線が通る代表点の個数を
頻度分布として求める処理について説明する。ここでは
、1例として1画像処理の分野で+(o u gh変換
と呼ばれる手法を応用する。
Hough変換は一般的に画像中に実在する直線を検出
する手段として使われているが、本発明では画像中で、
同一直線上に沿って存在する点の列の検出手段としてこ
れを(り用する。
第4図は、上記検出処理を実現するアルゴリズムのフロ
ーチャートの一例であり、ステップ41〜47は各点を
直線のパラメータに変換する処理を示す。すなわち、ラ
ベルQの代表点(X y +yQ)に対して、この点を
通るすべての直線を、直線の方程式 %式% の、γとOの関数f (γ、0)として求めている。
結領域を抽出するアルゴリズムについては従来から種々
のものが知られており、このうち、例えば長尾真氏著に
よるパターン情報処理と題する文献((財)電子通信学
会編、コロナ社 1983年発行)の8/〜85ページ
に記載されたラベル付はアルゴリズムを利用することが
できる。本アルゴリズムを利用すると、画像メモリ12
に格納された第1図(a)のような2値画像に対して連
結領域!15−位に異なるラベル(数値)を割当て、各
黒画素がそのラベルに変換された多値画像を画像メモリ
I3に得ることができる。ここでは各連結領域の代表点
を求めるために、このラベル付けされた多値画像の全面
をさらに走査することによって。
第3図に示すテーブル30を求める。本テーブル30は
、テーブルメモリ16に格納される。第3図において、
欄32〜35は、それぞれ上記連結鎖J或の上端点、下
端点、左端点、右端点、すなわち連結領域に外接する矩
形と連結領域の上下左右接点の各1つの座標を表す。第
1図(c)はこれらの代表点のうち欄33の下端点の位
置を画像デここでγは、四捨五入等により整数化する。
各点について求めたf (γ、0)を重畳するため、最
終的に得られたf (γ、0)は、γと0の2次元の配
列となり、その値が大きいものほど多数の点を通る直線
であることを表わしている。
第5図はf (γ、0)のテーブルの一例を示し、この
テーブル51はテーブルメモリ17に格納される。図中
、γの値は画素単位にとってあり、八〇は傾きの精度を
表す角度ピッチを示す。一応用によって異なるが、Δθ
の値を例えば1°とすると、1°単位で文書の傾きを求
めることができる6次にテーブル51から、平行線の組
として、最も多くの代表点を通るものを求める処理につ
いて第6図のフローチャー1・により説明する。図にお
いて、ステップ601〜609は、上記f (γ。
0)をγ方向に縮退し、同一の傾きをもつ直線(平行線
)の組で最も多数の代表点を通るものを求める処理であ
る。この例では、ステップ603で成る閾値f。以上の
f (γ、0)のみを選択的に加算するようにしており
、得られたg(0)は0の1次元配列となり、その値が
大きいものほど多くの点を通る平行線の組となる。テー
ブル51から算出したg(0)は1例えば第7図の如く
テーブル化され、このテーブル71はテーブルメモリI
9に格納される。ステップ609では、上記テーブル7
1を求めるが、このOoの値が最も多数の代表点を通る
平行線の傾き、すなわち入力文書画像全体の傾きを表す
。ステップ610〜616は、傾き0゜の平行線の位置
を求める処理である。すなわちf (γ、Oo)につい
てその極大点で−・定の閾値より大きいγの組を1次元
配列R(i)として求める。第8図に実際の文WFデー
タとf (γ、Oo)の対応を示す。図中(g)は支店
・データ、(h)はf (γ、Oo)である。極大点は
「 (γ、Oo)がγに対して増加から減少に移行する
点で値が閾値f1より大きい点と定義し、具体的には増
加状態を示すフラグflagとf(γ、Oo)の差分l
により求める。以上で求めた直線の組 R(0)”xsinθO+ ”/CO5θOR(1)=
xsjn00+YCO5θ0R(i)=xsinθ0+
ycosθ。
が求める平行線の組を表す。第2図の(d)はこれらの
平行線の組を画像データ上で図示したものである。
以上連結領域の下端点を用いて平行線の組を求めたが、
上端点を用いても別の平行線の組を求めることができる
。111者の各直線について、上方で最も近い後者の直
線を1組とすると、各組が横gき文書における行および
縦書き文書における列に相当する。これと同様に、連結
領域の左端点と右端点から求めた各平行線の組から直線
の組を求めると、各相が横耳き文書における列および縦
′i!Fき文書における行に相当する。さらに、上記行
および列で囲まれる部分が文字位置の候補に相当する。
第2図(f)はこれらの文字位置を画像データ上で斜線
を付して示したものである。これらの位置をもとに画像
を切出し、公知の文字認識処理を施すことによって、文
字を含む画像についてはその文字コード、文字を含まな
い画像については認識不可を示すコートを求め、結果を
テーブルメモリ■9にイ各納することができる。
〔発明の効果〕
本発明によれば、文書全体の黒画素連結領域の配置状態
から行あるいは文字位置の平行線を決定するようにして
いるため、文書画像上の部分的なノイズに左右されるこ
となく行あるいは文字を切出すことができる。従って、
本発明によれば文書の傾き、図および表等の混在、接触
文字あるいは分離文字の有無等に関係なく行あるいは文
字を確実に切出せるという効果がある。また、文書の内
容により傾きを検出できるので、文書に特別な記号を(
=Jすことなく1文書全体の傾きを補正できるというく
効果がある。
図面のflff単な説nJJ 第1図は本発明の一実施例のブロック構成図、第2図は
本発明による文書画像データの変換過程を表す図、第3
図は第1図テーブルメモリ16に格納さ汎るテーブルの
例、第4図は第3図のテーブルを頻度分布に変換するプ
ログラムのフローチャート、第5図は第1図テーブルメ
モリ17に格納さhる頻度分布の例、第6図は頻度分布
から第2図(d)の平行線の組を求めるプログラムのフ
ローチャート、第7図は第6図におけるg(0)を表わ
すテーブルの例、第8図はf (γ100)のグラフの
例である。
11 画像入力装置、1.2.13・画像メモリ、14
・・・処理装置、15・プログラムメモリ、16.17
.19・・・テーブルメモリ、18・・・ファイル装置
第2凶 第、3図 第4囚 詐り凶 第乙凹 手  続  補  正  書(方式) 事件の表示 昭和60年 特 許願 第273226号発明の名称 
 文書画像処理方式 補正をする者 事件との関係   特 許 出 願 人名称(510)
     株式会社 1」  立  製  作  所代
  理  人

Claims (1)

  1. 【特許請求の範囲】 1、文書画像を入力するための手段と、入力画像データ
    を記憶するための記憶手段と、上記記憶手段に記憶され
    た画像データを処理する処理手段とからなる画像処理装
    置において、上記処理手段が上記記憶手段に記憶された
    画像データ中で黒画素が連結する領域の各表代点を求め
    、次いで同一直線上に含まれる代表代点の頻度に基づい
    て互いに平行な1組の複数の直線を抽出し、これらの平
    行線を利用して上記画像データを処理することを特徴と
    する文書画像処理方式。 2、前記黒画素連結領域を矩形とし、前記代表点を各矩
    形領域から少なくとも2以上ずつ求め、各矩形領域上の
    少なくとも2辺に対して前記平行線の組を抽出すること
    を特徴とする第1項記載の文書画像処理方式。 3、前記平行線として互いに直交する2組の直線を抽出
    することを特徴とする第2項記載の文書画像処理方式。 4、前記処理手段が、前記平行線の傾き角度に応じて前
    記画像データを回転処理し、傾きを補正することを特徴
    とする第1項記載の文書画像処理方式。 5、前記処理手段が、前記平行線に基づいて画像データ
    の一部を切り出し、文書画像中の文字認識処理を行なう
    ことを特徴とする第1項〜第4項記載の文書画像処理装
    置。
JP60273226A 1985-12-06 1985-12-06 文書画像処理方式 Pending JPS62133584A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60273226A JPS62133584A (ja) 1985-12-06 1985-12-06 文書画像処理方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60273226A JPS62133584A (ja) 1985-12-06 1985-12-06 文書画像処理方式

Publications (1)

Publication Number Publication Date
JPS62133584A true JPS62133584A (ja) 1987-06-16

Family

ID=17524870

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60273226A Pending JPS62133584A (ja) 1985-12-06 1985-12-06 文書画像処理方式

Country Status (1)

Country Link
JP (1) JPS62133584A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6464076A (en) * 1987-09-04 1989-03-09 Hitachi Ltd Image file device
JPH01237879A (ja) * 1988-03-18 1989-09-22 Fujitsu Ltd 名刺情報ファイリング方式
JP2007226546A (ja) * 2006-02-23 2007-09-06 Oki Electric Ind Co Ltd 画像処理装置,画像処理方法,およびコンピュータプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6464076A (en) * 1987-09-04 1989-03-09 Hitachi Ltd Image file device
JPH01237879A (ja) * 1988-03-18 1989-09-22 Fujitsu Ltd 名刺情報ファイリング方式
JP2007226546A (ja) * 2006-02-23 2007-09-06 Oki Electric Ind Co Ltd 画像処理装置,画像処理方法,およびコンピュータプログラム

Similar Documents

Publication Publication Date Title
US7684646B2 (en) System and method of determining image skew using connected components
EP0063454B1 (en) Method for recognizing machine encoded characters
US5748809A (en) Active area identification on a machine readable form using form landmarks
KR100247970B1 (ko) 문서 영상의 방향 교정방법
JP3962891B2 (ja) 文書画像処理装置、文書画像処理方法、及び記憶媒体
JPH11219407A (ja) 文書画像認識装置および文書画像認識プログラムの記憶媒体
JPS61267177A (ja) 文書画像追加情報の蓄積方法
JP2008217833A (ja) 文書画像認識装置および文書画像認識プログラムの記憶媒体
CN1423794A (zh) 借助hough变换分割邮政物品的数字图像
US5982952A (en) Optical character reader with tangent detection for detecting tilt of image data
JPS62133584A (ja) 文書画像処理方式
JP3303246B2 (ja) 画像処理装置
JP2000187705A (ja) 文書読取装置および方法および記憶媒体
JP2890306B2 (ja) 表領域分離装置および表領域分離方法
JP2000113106A (ja) 文書画像処理装置
JPH03263282A (ja) 文字読取装置の文字切出し方法
JPH0697470B2 (ja) 文字列抽出装置
JP2001014427A (ja) 基準マーク検出方法、基準マーク検出装置及び光学式文字読取装置
JPH11250179A (ja) 文字認識装置および文字認識方法
JPH04260980A (ja) 図形認識装置
JPH08194773A (ja) 画像処理方法および画像処理装置
JPH0573718A (ja) 領域属性識別方式
KR20220168787A (ko) 만주어의 글자 추출 방법 및 이를 수행하는 시스템
JPH03269689A (ja) 文書読み取り装置
JP2890307B2 (ja) 表領域分離装置