JPH0217586A - 傾き抽出装置 - Google Patents

傾き抽出装置

Info

Publication number
JPH0217586A
JPH0217586A JP63168086A JP16808688A JPH0217586A JP H0217586 A JPH0217586 A JP H0217586A JP 63168086 A JP63168086 A JP 63168086A JP 16808688 A JP16808688 A JP 16808688A JP H0217586 A JPH0217586 A JP H0217586A
Authority
JP
Japan
Prior art keywords
pixel
character pattern
detected
pixels
scanning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP63168086A
Other languages
English (en)
Other versions
JP2616967B2 (ja
Inventor
Kazuhiro Ishikawa
和弘 石川
Hiroshi Ueno
博 上野
Sadamasa Hirogaki
広垣 節正
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP63168086A priority Critical patent/JP2616967B2/ja
Publication of JPH0217586A publication Critical patent/JPH0217586A/ja
Application granted granted Critical
Publication of JP2616967B2 publication Critical patent/JP2616967B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) この発明は例えば原稿、帳票等の情報媒体の文字列の傾
きを抽出するための装置に関する。
(従来の技術) 従来より、種々の光学式読取装置の開発が進められてい
る。光学式読取装置においては、情報媒体の文字の認識
処理のために、例えば情報媒体の文章を構成する文字列
の傾きの抽出が行なわれる。
文字列の傾きを抽出するための従来方法として以下に述
べる第一〜第三の方法を挙げることが出来、例えば文献
■「電子通信学会論文誌、Vol、J66−D  No
、II  (1983−1)  pHl−118Jや、
文献II r電子通信学会論文誌、Vol、J67−D
  No、Il  (1984II)  p1277〜
1284Jに従来方法につき詳しい説明がなされている
。以下、従来方法につき簡単に説明する。
まず第一の従来方法では、画像を△θ度ずつ回転させ画
像の回転毎に画像を特定方向に投影し、この投影によっ
て得られるヒストグラム(例えば周辺分布或は線密度分
布)の山、谷の変化を調べる。画像の投影方向が文字列
の方向と一致するとき、ヒストグラムの山、谷は最も急
峻となる性質があり、従ってこの性質を利用することに
よって文字列の傾きを検出する(文献I pH3参照)
また第二の従来方法では、画像を任意好適な複数の領域
(例えば互いに平行な複数の帯状領域)に分割し、これ
ら分割領域を水平及び又は垂直方向に投影することによ
って分割領域毎に周辺分布を作成し、例えば周辺分布が
閾値以上となる領域を文字列領域及び周辺分布が閾値未
満となる領域を文字列間の余白領域として、文字列領域
を検出する。そして分割領域の文字列領域とこれと異な
る他の分割領域の文字列領域との相対的な位置すれ(位
相差)を検出し、この位置ずれに基づいて文字列の傾き
を検出する(文献I plj3−114−9照)。
ざらに第三の従来技術では、画像の拡大及び縮退を複数
回行なうことによって文字列を構成する文字を連結させ
、これら連結文字から成る連結領域を得る。次いで連結
領域に対し細線化処理を施し細線化された連結領域から
成る線画像を得る。
そして線画像の両端部を数画素だけ削除して新たな線画
像を得、この新たな線画像の両端点を結zく直線の傾き
に基づき文字列の傾きを検出する(文献II p127
8−12799照)。
(発明が解決しようとする課題) しかしながら上述した第一の従来方法にあっては、画像
を回転させるたびに、ヒストグラムの変化を数値化する
処理を繰返し行なわなければならず、この処理のために
膨大なデータ処理が必要となるという問題点があった。
また第二の従来方法にあっては、例えば文字部の膜構成
(レイアウト)が複雑であったり、文章と図表とが混在
していたつ、或は文字列の傾きが例えば10度を越えた
りすると、画像を投影した時に異なる文字列の周辺分布
が重なり合ったり文字列の周辺分布と図表の周辺分布と
が重なり合ったりするため、各文字列領域を個別に精度
良く検出することか困難となる。これがため傾きの検出
精度が悪化するという問題点があった。
さらに第三の従来方法にあっては、非常に多くのパラメ
ータを用いて傾き抽出を行なう必要があり、これに加え
傾き抽出のために複雑な処理手順(例えば画像の拡大及
び縮退による連結領域の作成や、連結領域の細線化によ
る線画像の作成や、線画像から短線分及び分枝(所謂ヒ
ゲ)を削除する処理等)を必要とし、これがため傾き抽
出のために膨大なデータ処理を行なわければならないと
いう問題点があった。
この発明の主たる目的は、上述した従来の問題点を解決
するため、傾き抽出のために用いるブタの削減を図れ、
そのために処理の高速化か可能な傾き抽出装Mを提供す
ることにある。
(課題を解決するための手段) この目的の達成を図るため、この発明の傾き抽出装置は
、少なくとも文字パタンを含む情報媒体の画像データを
一方向に走査し、この走査によって走査線上で最初に検
出される文字パタン構成画素の位置を各走査線毎に検出
する画素値M検出手段と、検出されp文字パタン構成画
素の位置に基づいて情報媒体の傾きを抽出する傾き抽出
手段とを備えて成ることを特徴とする。
この発明の実施に当っては、画素位置検出手段を、文字
パタン構成画素を検出したら次の走査線の走査を行なう
手段とするのが好適である。
またこの発明の実施に当っては、傾き抽出手段を、検出
された文字パタン構成画素を同一直線上にあると判定さ
れる画素の集団1こ統合分類し、この集団のなかから最
も多くの文字パタン構成画素を含む最多画素集団を抽出
する分類抽出手段と、最多画素集団を形成する文字パタ
ン構成画素に関する近似直線の傾きに基づき情報媒体の
傾きを算出する算出手段とを以って構成するのか好適で
ある。この場合、分類抽出手段を、ハフ(Hough)
変換を行なう手段とするのが好適である。また算出手段
を、最小二乗近似直線の傾きを算出する手段とするのが
好適である。
(作用) このような構成の傾き抽出装置によれば、文字パタンを
含む情報媒体の画像データを一方向に走査し、この走査
によって走査線上で最初に検出される文字パタン構成画
素の位Mを各走査線毎に検出し、文字パタン構成画素の
位置に基づいて情報媒体の傾きを抽出する。
このような傾き抽出(こおいで、走査線上で最初に検出
される文字パタン構成画素(以下、先頭画素と称す)の
位置を検出する処理は単純な処理である。しかも情報媒
体の傾きを抽出するために先頭画素の位m%用いるので
、傾き抽出のために必要なデータの削減を図れる。
(実施例) 以下、この発明の実施例につき説明する。尚、図面はこ
の発明が理解出来る程度に概略的に示されているにすぎ
ず、従って各構成成分の構成、動作の流れ、入出力信号
の流れは図示例に限定されるものではない。
第1図は実施例の構成を概略的に示す機能ブロック図で
ある。同図にも示すように、この実施例の傾き抽出装置
10は、少なくとも文字パタンを含む情報媒体の画像デ
ータを一方向に走査し、この走査によって走査線上で最
初に検出される文字パタン構成画素の位買ヲ各走査線毎
に検出する画素位薗検出手段12と、検出された文字パ
タン構成画素の位置に基づいて情報媒体の傾きを抽出す
る傾き抽出手段14とを備えて成る。ここに言う文字パ
タン構成画素とは文字パタンを構成する画素とみなされ
る画素を意味する。また以下の説明では走査線上で最初
に検出される文字パタン構成画素を先頭画素と称する。
この実施例では画素値M扶出手段12ヲ、先頭画素を検
出したら次の走査線の走査を行なう手段とする。従って
この実施例では、先頭画素を検出したら当該先頭画素を
検出した走査線上の残りの画素については走査を行なわ
すに、次の走査線につき走査を行なうので、画像データ
の走査の迅速化を図れる。
ざらにこの実施例では傾き抽出手段14を、検出された
先頭画素を同一直線上にあると判定される画素の集団に
統合分類(クラスタリング)し、この集団のなかから最
も多くの先頭画素を含む最多画素集団を抽出する分類抽
出手段16と、最多画素集団を形成する先頭画素に関す
る近似直線の傾きに基づき情報媒体の傾きを算出する算
出手段18とを以って構成する。
最多画素集団を形成する先頭画素に関する近似直線の傾
きに基づいて情報媒体の傾き(例えば情報媒体の文章を
形成する文字列の傾き)を抽出することによって、情報
媒体の傾きを精度良く抽出することか出来る。また画像
データか、文字パタンのみならず傾き検出精度の低下の
要因となる表、罫線その他のパタンを含んでいる場合の
、傾き検出精度を従来よりも向上することが出来る。
ざらに先頭画素の統合分類、最多画素集団の抽出及び近
似直線の傾き算出という処理によって、情報媒体の傾き
を抽出することによって、傾き抽出処理を従来よりも単
純化ししかもデータ処理量の低減を効果的に図れる。
分類抽出手段16は先頭画素を同一直線上にあると判定
される画素の集団に統合分類する任意好適な構成の手段
とすることが出来る。統合分類の方法を限定するもので
はないが、例えば分類抽出手段16ヲ八フ(Houqh
)変換によって統合分類を行なう手段とするのが好適で
ある。また算出手段18は最多画素集団を形成する先頭
画素に闇する近似直線の傾きを算出する任意好適な構成
の手段とすることか出来る。近似直線の傾きの算出方法
を限定するものではないが、例えば算出手段18を最多
画素集団を形成する先頭画素に関する最小二乗近似直線
の傾きを算出する手段とするのが好適である。
ざらにこの実施例の傾き抽出装置10は、情報媒体の傾
きを検出する距めのメモリとして例えば、検出された先
頭画素の位置を保存する画素位置メモリ24と、先頭画
素を統合分類するために用いるテーブル(統合テーブル
)を保存するテーブルメモリ26と、最多画素集合を形
成する先頭画素の位1111を保存する最多画素集合メ
モリ28とを備える。
また第1図において20は読取部及び22は画像メモリ
を示す。この実施例の傾き抽出装置11110は、画像
メモリ22に格納された二値画像データを走査すること
によって傾き抽出を行なう。このため第1図にも示すよ
うに、原稿等の情報媒体の二値画像データを読取部20
によって得、この画像データ20を画像メモリ22に格
納する。読取部20は、図示せずもCOD (Char
ge Coupled Device ) rfのイメ
ージセンサを備え、情報媒体をイメージセンサによって
走査して得た多値画像データを二値化し、この二値化画
像データを画像メモリ22に格納するものである。
以下、より詳細にこの実施例につき説明する。
(画像データ) 第2図は画像データの説明に供する図であり、情報媒体
の文章を構成する文字列かX軸に対して5度たけ傾くよ
うに情報媒体を読取部(こセツティングし、解像度4画
素/mmのイメージセンサを用いて情報媒体を読取り、
画像メモリに格納した値画像データを出力した例を示す
この実施例で傾き抽出に用いる画像データDは情報媒体
の所定の読取領域を走査して得られる二値データであり
、図示の画像データDは説明の簡単化のため例えば文字
パタンD1と情報媒体の地を表わす背景パタンD2とか
ら成る。文字パタンD1は例えば黒ビットで及び背景パ
タンD2は例えば白ビットで表現される。
傾き抽出のために用いる画像データDは文字列の傾き抽
出に必要な文字パタンを少なくとも含むデータであれば
、文字パタンの他、図形、表、罫線その他の種々の情報
を表現するパタンを含む画像データDとすることが出来
る。
また画像データDの各画素位置は画像メモリ22上に任
意好適に設定されるX−Y座標系によって表現され、画
像メモリ22はこのX−Y座標系で表現される位置の画
素の画像データDを読出すことが出来るメモリとなって
いる。従って画像データDの画像メモリ22からの読出
し!X、Y座標を用いて自在に行なえる。
尚、第2図においでX軸及びY軸の一部を含む矩形枠a
内の領域は画像データの走査領域の一部を示す。
(画素位置検出手段) この実施例の画素位置検出手段12は、例えばY軸方向
を画像データDの主走査方向及びX軸方向を画像データ
Dの副走査方向として、画像データDを線順次に走査す
る。以下、第3図を参照し画素位置検出手段の動作につ
き説明する。
第3図は画素位置検出手段の動作の一例を示す動作フロ
ーである。
読取部20か情報媒体の所定領域の走査を終え画像デー
タDの画像メモリ22への格納か終了すると、画素位置
検出手段12は画像メモリ22の画像データDの走査を
開始する(SIOQ)。
走査を開始した画素位置検出手段12は走査線Sよ(第
2図参照)の画像データDを画素単位に読出しく5IO
I)、読出した画素が文字パタン構成画素であるか否か
を判定する(Si20)。
この実施例では文字パタンD1を黒ビット及び背景パタ
ンD2を白ビットで表現しているので、5102では読
出した画素が黒ピッ1−であれば文字パタン構成画素を
検出したとみなし、及び白ビットてあれば文字パタン構
成画素を検出しなかったとみなす。尚、画像データを二
値データとした場合、文字パタンの他、図形、表、罫線
、写真等を構成するパタンも黒ピットで表現されること
となり、従って文字パタン構成画素としてこれら文字パ
タン以外のパタンを構成する画素も文字パタン構成画素
として検出されることとなる。
5102において文字パタン構成画素を検出したと判定
したときは、当該画素の位=を走査線上て最初に検出さ
れた文字パタン構成画素すなわち先頭画素の位置として
画素位置メモリ24に保存しく5I04)、次に走査範
囲の全走査線につき画像ブタの走査を終えたか否かを判
定する(S+06)。
全走査線につき走査を終えでいれば、画素位置検出手段
14は走査を終了し動作を停止する(S108)。また
全走査線につき走査を終えていなければ、画素位置検出
手段12は次の走査線上の画素の画像データを画像メモ
リ22から読出しく5HO)、次いて5102の判定に
応した動作を行なう。
ざらに8102において文字パタン構成画素を検出しな
かったと判定したときは、走査線上の画素の全ての画像
データにつき走査を終えたか否かを判定する(S+ 1
2)。
走査線上の画素の全でにつき走査を終えでいれば、画素
位置検出手段12は5106の判定に応した動作を行な
う。また走査線上の画素の全てにつき走査を終えていな
ければ、次の画素の画像データを画像メモリ22から読
出しくSI+4) 、次に8102の判定に応した動作
を行なう。
第4図に先頭画素位置の検出結果の一例を示す。同図は
、第2図(こ示す画像データを走査して検出された先頭
画素の位置をプロットして示した図である。
(分類抽出手段) 第5図はハフ変換の説明図である。第5図を参照しハフ
変換につき簡単に説明する。ハフ変換は、検出したい線
(曲線或は直線)を方程式で表現しこの方程式のパラメ
ータで構成される空間で統合分類(クラスタリング)を
行なうための方法である。従って例えば直線を方程式I
:xCosθ十ySinθ=ρで表現しこの方程式■を
用いてハフ変換を行なうことによって、先頭画素の統合
分類か行なえる。ここで第5図にも示すようにX−Y座
標系を考えた場合、方程式Iにおいてρは原点Oから直
線しにおろした垂線Vの長さ及びθは垂線VとX軸との
成す角である。
方程式Iのパラメータp及びθで構成される二次元平面
(ρ−θ平面)上に先頭画素点(先頭画素の座標(X+
、”/、)で表現される点)を写像すると、X−Y平面
上で同一直線り上にある先頭画素点P、、P2.P3、
・・・P、はρ−θ平面上で一点に写像される。従って
p−θ平面上の同点に写像される先頭画素点の集団が、
X−Y平面上で同一直線上にあると判定される先頭画素
点の集団となる。
ハフ変換を用いた統合分類によってρ−θ平面上の同一
点に写像される先頭画素のヒストグラムか作成される。
従ってこのヒストグラムにおいてヒストグラムの度数が
最も大きいρ−θ平面上の点に写像された先頭画素点を
検出すれば、検出した先頭画素点が最多画素集団を形成
する先頭画素点である。
ここでSe 及びS。をそれぞれ、検出したい直線を表
現する際のρに関する許容変動値及びeに関する許容変
動値とすれば、ハフ変換を次式Hに基づいて行なうこと
が出来る。
p= [(xCosθ+ySinθ)/Se]×SP 
           ・・・(式II )但し記号[
1は整数化を表す記号であり、従って[(xCosθ+
ysinθ)/se]はパラメータθ、X及びyにそれ
ぞれ特定の数値を代入しで算出された(xCosθ+y
Sinθ)/SPの数値を正数化することを意味する。
この正数化は算出された数値の小数点以下を四捨五入、
切り上げ或は切り下げすることによって行なわれる。ま
71seはo、S   2S  、3So、−・・とい
θ       θ うよう1こE3=rnS6  (mは正の整数、0Sm
 s。<18o)で表されるS。の倍数となるものとす
る。
方程式■に基づいて行なわれるハフ変換では、X−Y平
面上で同一直線上にのる先頭画素点のみが同一直線上に
あると判定される先頭画素点となるが、式IIに基づい
て行なわれるハフ変換ではX−y平面上で同一直線上に
のる先頭画素点に加えこの直線近傍にある先頭画素点を
も含む先頭画素点が同一直線上にあると判定される先頭
画素点となる。
第6図(A)〜(8)は分類抽出手段によってテーブル
メモリ上に作成される統合テーブルの説明図であり、例
えば5P=5及びS。=2として式Hに基づいて統合分
類を行なう場合の統合テーブルを示すものである。図の
(A)は初期化された状態の統合テーブル及び(B)は
統合分類を終了した状態の統合テーブルを表す。尚、第
6図(8)は第2図に示す画像データについで検出され
た先頭画素を統合分類した実験結果を示したものである
統合テーブルはρ−θ平面上のどの点に何個の先頭画素
点が写像されたかを表現するヒストグラムであり、例え
ば第6図(8)においてρ−θ平面上の点(ρ、θ)=
(0,0)にはひとつも先頭画素点か写像されなかった
ことを示しまた点(ρ、θ)= (190,4)には4
個の先頭画素点が写像されたことを示す。
第7図(A)〜(B)は分類抽出手段の動作の一例を示
す動作フローである。以下、−例として式IIに基づい
て八ツ変換を行なう場合の分類抽出手段の動作につき説
明する。
分類抽出手段1Bは画素位置検出手段12が先頭画素点
の検出を終了すると、分類抽出を開始する(S200)
分類抽出を開始した分類抽出手段16は、第6図(A)
にも示すようにρ−θ平面上の全ての点に関するヒスト
グラムの度数が零となるよう1こテーブルメモリ26上
の統合テーブルを初期化し、パラメータθの設定値を初
期値Oとし、さらにS 及びS。の設定値をそれぞれS
  =5及びP                  
          PSo=2と設定する(S202
)。尚、SP 及びSoは上述の特定の数値に限定され
るものではなく、任意好適な値に変更することが出来る
次いて分類抽出手段16は検出された先頭画素の位買座
標(X+、’/1)I先頭画素位置メモリ24カラ読出
L/ (S204)、E II ニe (7) Ma定
偵、X−Xl及びV = ”l’ +を代入し式11か
らρを算出する(S206)。
次いで分類抽出手段16は統合テーブルにおいてθか8
206で用いたθの設定値となりρか3206で算出さ
れたρの値(ρの算出値)となる欄の度数をまたけカウ
ントア・ンブする(S20B)。例えば5206におい
てθの設定値がO及びpの算出値が190であったなら
ば第6図(A)及び(B)に示すように統合テーブルの
θ=O及びp=190の欄の度数か1だけカウントアツ
プされる。
次に分類抽出手段16は設定されたθに関して(例えば
θ−〇に閉じて)、全ての先頭画素のρを算出したか否
かを判定する(S210)。
全ての先頭画素につきρを算出していなければ、521
0から5204に戻って残りの先頭画素につきρを算出
する。
また全ての先頭画素につきρを算出していれば、θの設
定値にS。を加算した値を新たなθの設定値とする(S
2+2)。
5212の後、分類抽出手段16はeの新な設定値が1
80以上となったか否か(θ≧180か否か)を判定す
る(S214)。
θ≧180でなければ5204の処理に戻る。
またe≧180であれば、統合分類処理か終了したこと
を表すので統合テーブルから度数が°最大となる欄のp
*及びe*を検出する(S216)。例えば第6図CB
)において度数か43となる欄(図中、丸印で囲んで示
す欄)か度数か最大となる欄でありこの場合ρ*二20
5及びθ*−84となる。ρ−θ平面上の点(ρ*、θ
*)に写像される先頭画素点か最多画素集団を形成する
先頭画素である。
5216の後、分類抽出手段16はθの設定値をθ*と
しく5218) 、先頭画素の座標(xi、yl)を先
頭画素位置メモリ24から読出しく5220)、そして
式IIにθ−θ*、x=x、及びV = ”l’ +を
代入しρの再算出を行なう(5222)。
次いて再算出されたρが検出されたρ*と等しいか否か
を判定する(S224)。
再算出されたρかρ*と等しければこのときρの再算出
に用いられた先頭画素の座標(x l。
y+)を最多画素集団を形成する先頭画素の座標として
最多画素集団メモリ28に保存しく5226)、次いて
全ての先頭画素につきp%再算出したか否かを判定する
(322B)。
全ての先頭画素につき再算出を終えたならば最多画素集
団を形成する先頭画素の抽出を終えたことを表すので分
類抽出手段16は分類抽出処理を終える(S230)。
また全ての先頭画素につき再算出を終えていなければ、
5228から5220の処理に戻り残りの先頭画素につ
き再算出を行なう。
5224において再算出されたρがρ*と等しくなけれ
ば、分類抽出手段16は5224から5228の処理に
進み5228の判定に応しで動作する。
第8図に、上述のようにして行なわれた分類抽出処理の
実験結果の一例を示す。第8図は第2図に示す画像デー
タにつき最多画素集団を形成する先頭画素を抽出し、抽
出した先頭画素をプロットしで示す図である。
(算出手段) 算出手段18は分類抽出手段16か分類抽出処理を終え
ると最多画素位置メモリ28から最多画素集団を形成す
る先頭画素の座標を読出し、これら先頭画素に関する最
小二乗近似直線の傾きαを次式mに基づいて算出する。
・・・(弐■) 但し、最多画素集団を形成する先頭画素の検出個数をm
+1個とし、XJ及びy、は検出された最多画素集合を
形成する先頭画素p、の×座標及びY座標を表すものと
する(j=o、1.2、・・・m)。
そして情報媒体の傾きを例えばTan−’αで表現する
とすれば、算出手段18は弐mによってαを算出した後
、Tan−’αを計算し、情報媒体の傾きとしてTan
−’αを出力する。情報媒体の傾きは従来周知の如く情
報媒体の傾き補正或は画像データの傾き補正のために用
いられるものである。
第2図に示す画像データにつき検出された最多画素集合
を形成する先頭画素に関しで、実験的に、最小二乗近似
直線の傾きαを求めTa、n−’αを求めたところTa
n=a=4.9633度という値か得られた。従ってこ
の実験では情報媒体の傾きかX軸に対して5度となるよ
うにしで得た第2図に示す画像データから、はぼ0.0
4度未満の誤差で情報媒体の傾きを検出することが出来
た。
第9図に、第2図に示す画像データにつき検出された最
多画素集合を形成する先頭画素とこれら先頭画素に関す
る最小二乗近似直線とを示す。
〈分類抽出手段の他の動作例〉 第10図(A)〜(B)は分類抽出手段の他の動作例の
説明に供する動作フローである。以下、上述した実施例
と相違する点につき説明し、上述した実施例と同様の動
作についてはその説明を省略する。
第10図に示すようにこの例では、5206の次に82
32の処理に進み、5232の次に3210の処理に進
む。
8232では、統合テーブルにおいでθが設定値及びρ
か算出値となる欄の度数をまたけカウントアツプすると
共に、このときのρの算出に用いた座標(x+、yI)
を最多画素集合メモリ28の、カウントアツプされた欄
に対応する記憶領域に保存する。
最多画素メモリ28には座標(xl、yI)の保存のた
めの記憶領1或が統合テーブルの各欄毎に対応付けて設
定されている。すなわちこれを別の観点から説明すれば
、例えば、最多画素メモリ28の第一の記憶領域にはρ
−θ平面上のθ−〇及びρ−0なる点に写像された先頭
画素の座標が保存され、第二の記憶領域にはθ=O及び
p=5となる点に写像された先頭画素の座標(Xl、y
I)か保存される。
またこの例では、5216の次に3234の処理に進み
、5234の次に8230の処理に進み分類抽出処理を
終える。
5234ではθがθ*及びpかρ*となる統合テーブル
の欄に対応する記憶領域に保存されている座標を最多画
素集団メモリ28から読出すための読出し信号を、算出
手段18に対しで出力する。θかθ*及びρかρ*とな
る欄に対応する記憶領域に保存されている座標か最多画
素集団を形成する先頭画素の座標である。
読出し信号を入力した算出手段18はこの読出し信号に
基づいて、最多画素集団を形成する先頭画素の座標をメ
モリ28から入力することが出来る。
上述した実施例における各構成成分の構成、動作、動作
の流れ、動作条件及び数埴的粂件は一例にすぎず、従っ
てこの発明は上述した実施例にのみ限定されず、各構成
成分の構成、動作、動作の流れ、動作条件及び数値的条
件を任意好適に変更することか出来る。また、画像デー
タとして二値データのみならす多値データを用いても良
い。また上述した実施例では画像メモリに保存された画
像データを走査することによって先頭画素の座標を検出
したが、読取部からの二(0或は多値画像データを画像
メモリに保存せずに直接に画素位置検出手段に入力する
と共に、読取部の画像データの出力に同期させて画素毎
に発生させたX、Y座標を画素位置検出手段に入力し、
画素位置検出手段に最初に入力された文字パタン構成画
素のX、Y座標を先頭画素付言メモリに保存するように
しても良い。
(発明の効果) 上述した説明からも明らかなように、この発明の傾き抽
出装置によれば、文字パタンを含む情報媒体の画像デー
タを一方向に走査し、この走査によって走査線上で最初
に検出される文字パクン構成画素の位置を各走査線毎に
検出し、文字パタン構成画素の位置に基づいて情報媒体
の傾きを抽出する。
このような情報媒体の傾き抽出処理において、走査線上
で最初に検出される文字バタシ構成画素(先頭画素)の
付言を検出する処理は単純な処理である。しかも情報媒
体の傾きを抽出するために先頭画素の位置を用いるので
、傾き抽出のために必要なデータの削減を図れる。これ
がため、傾き抽出処理を従来よりも効率良く従って迅速
に行なえる。
【図面の簡単な説明】
第1図はこの発明の実施例の構成の説明に供する機能プ
ロ・ンク図、 第2図は画像データの説明に供する図であり、第3図は
画素位置検出手段の動作の一例18説明するための動作
フロー 第4図は先頭画素位置の検出結果の一例を示す図、 第5図はハフ変換の説明に供する図、 菓6図(A)〜(B)は統合テーブルの説明に供する図
、 M7図(A)〜(8)は分類抽出手段の動作の一例を説
明するための動作フロ 第8図は分類抽出結果の一例を示す図、第9図は傾き算
出結果の一例を示す図、第10図(A)〜(B)分類抽
出手段の動作の他の例を説明するための動作フローであ
る。 10・・・傾き抽出装置、 14・・・傾き抽出手段、 1日・・・算出手段、 26・・・テーブルメモリ、 特許出曽人 12・・・画素位置検出手段 16・−・分類抽出手段 24・・・先頭画素位置メモリ 28・・・最多画素位置メモリ 沖電気工業株式会社 画素付方検出手段の動作の一例 第3図 八ツ変換の説明に供する図 第5図 (Ss =2. S、 =5) (S、 =2.3. =5) 統合テーブルの説明図 第6図(B) 第10図(A) 分類抽出手段の他の動作例 第10図(B )

Claims (5)

    【特許請求の範囲】
  1. (1)少なくとも文字パタンを含む情報媒体の画像デー
    タを一方向に走査し、前記走査によって走査線上で最初
    に検出される文字パタン構成画素の位置を各走査線毎に
    検出する画素位置検出手段と、検出された文字パタン構
    成画素の位置に基づいて前記情報媒体の傾きを抽出する
    傾き抽出手段とを備えて成ることを特徴とする傾き抽出
    装置。
  2. (2)前記画素位置検出手段を、前記文字パタン構成画
    素を検出したら次の走査線の走査を行なう手段としたこ
    とを特徴とする請求項1に記載の傾き抽出装置。
  3. (3)前記傾き抽出手段を、 検出された文字パタン構成画素を同一直線上にあると判
    定される画素の集団に統合分類し、該集団のなかから最
    も多くの文字パタン構成画素を含む最多画素集団を抽出
    する分類抽出手段と、前記最多画素集団を形成する文字
    パタン構成画素に関する近似直線の傾きに基づき前記情
    報媒体の傾きを算出する算出手段とを以って構成するこ
    とを特徴とする請求項1又は2に記載の傾き抽出装置。
  4. (4)前記分類抽出手段を、ハフ(Hough)変換を
    行なう手段としたことを特徴する請求項3に記載の傾き
    抽出装置。
  5. (5)前記算出手段を、最小二乗近似直線の傾きを算出
    する手段としたことを特徴とする請求項3又は4に記載
    の傾き抽出装置。
JP63168086A 1988-07-06 1988-07-06 傾き抽出装置 Expired - Fee Related JP2616967B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63168086A JP2616967B2 (ja) 1988-07-06 1988-07-06 傾き抽出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63168086A JP2616967B2 (ja) 1988-07-06 1988-07-06 傾き抽出装置

Publications (2)

Publication Number Publication Date
JPH0217586A true JPH0217586A (ja) 1990-01-22
JP2616967B2 JP2616967B2 (ja) 1997-06-04

Family

ID=15861587

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63168086A Expired - Fee Related JP2616967B2 (ja) 1988-07-06 1988-07-06 傾き抽出装置

Country Status (1)

Country Link
JP (1) JP2616967B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003041469A (ja) * 2001-07-30 2003-02-13 San Oike:Kk 水引テープおよびその製造方法
JP2016009996A (ja) * 2014-06-24 2016-01-18 京セラドキュメントソリューションズ株式会社 画像処理装置、プログラム及び画像形成装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60251481A (ja) * 1984-05-28 1985-12-12 Toshiba Corp 文字読取装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60251481A (ja) * 1984-05-28 1985-12-12 Toshiba Corp 文字読取装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003041469A (ja) * 2001-07-30 2003-02-13 San Oike:Kk 水引テープおよびその製造方法
JP2016009996A (ja) * 2014-06-24 2016-01-18 京セラドキュメントソリューションズ株式会社 画像処理装置、プログラム及び画像形成装置

Also Published As

Publication number Publication date
JP2616967B2 (ja) 1997-06-04

Similar Documents

Publication Publication Date Title
CN111814722B (zh) 一种图像中的表格识别方法、装置、电子设备及存储介质
JP3086702B2 (ja) テキスト又は線図形を識別する方法及びデジタル処理システム
O'Gorman The document spectrum for page layout analysis
Hasan et al. Morphological text extraction from images
JP3308032B2 (ja) スキュー補正方法およびスキュー角検出方法およびスキュー補正装置およびスキュー角検出装置
US7039235B1 (en) Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof
EP1457917B1 (en) Apparatus and methods for converting network drawings from raster format to vector format
US6327384B1 (en) Character recognition apparatus and method for recognizing characters
JPH03122773A (ja) 画像形成装置
JPS61267177A (ja) 文書画像追加情報の蓄積方法
JPH05500874A (ja) ディジタル化書類における選択本文の自動抽出のための多角形準拠式方法
JP2002133426A (ja) 多値画像から罫線を抽出する罫線抽出装置
CN110180186A (zh) 一种地形图转换方法及系统
JP4098845B2 (ja) テキストのバイナリー画像から抽出されたシンボルを比較する方法
Fan et al. A run-length-coding-based approach to stroke extraction of Chinese characters
Maddouri et al. Text lines and PAWs segmentation of handwritten Arabic document by two hybrid methods
CN116543391A (zh) 一种结合图像校正的文本数据采集系统及方法
Chen et al. Analysis, Understanding and Representation of Chinese newspaper with complex layout
JPH0217586A (ja) 傾き抽出装置
Ye et al. Document image matching and annotation lifting
JPH03126181A (ja) 文書画像の領域分割方法
JP2000076378A (ja) 文字認識方法
JP3083609B2 (ja) 情報処理装置及びそれを用いた文字認識装置
JP2715930B2 (ja) 線分検出方法
JP3517077B2 (ja) パターン抽出装置及びパターン領域の切り出し方法

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees