JP2616967B2 - 傾き抽出装置 - Google Patents

傾き抽出装置

Info

Publication number
JP2616967B2
JP2616967B2 JP63168086A JP16808688A JP2616967B2 JP 2616967 B2 JP2616967 B2 JP 2616967B2 JP 63168086 A JP63168086 A JP 63168086A JP 16808688 A JP16808688 A JP 16808688A JP 2616967 B2 JP2616967 B2 JP 2616967B2
Authority
JP
Japan
Prior art keywords
pixel
inclination
detected
scanning
image data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP63168086A
Other languages
English (en)
Other versions
JPH0217586A (ja
Inventor
和弘 石川
博 上野
節正 広垣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP63168086A priority Critical patent/JP2616967B2/ja
Publication of JPH0217586A publication Critical patent/JPH0217586A/ja
Application granted granted Critical
Publication of JP2616967B2 publication Critical patent/JP2616967B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】 (産業上の利用分野) この発明は例えば原稿、帳票等の情報媒体の文字列の
傾きを抽出するための装置に関する。
(従来の技術) 従来より、種々の光学式読取装置の開発が進められて
いる。光学式読取装置においては、情報媒体の文字の認
識処理のために、例えば情報媒体の文章を構成する文字
列の傾きの抽出が行なわれる。
文字列の傾きを抽出するための従来方法として以下に
述べる第一〜第三の方法を挙げることが出来、例えば文
献I「電子通信学会論文誌、Vol.J66−D No.11(1983−
1)p111−118」や、文献II「電子通信学会論文誌、Vo
l.J67−D No.11(1984−11)p1277〜1284」に従来方法
につき詳しい説明がなされている。以下、従来方法につ
き簡単に説明する。
まず第一の従来方法では、画像をΔθ度ずつ回転させ
画像の回転毎に画像を特定方向に投影し、この投影によ
って得られるヒストグラム(例えば周辺分布或は線密度
分布)の山、谷の変化を調べる。画像の投影方向が文字
列の方向と一致するとき、ヒストグラムの山、谷は最も
急峻となる性質があり、従ってこの性質を利用すること
によって文字列の傾きを検出する(文献I p113参照)。
また第二の従来方法では、画像を任意好適な複数の領
域(例えば互いに平行な複数の帯状領域)に分割し、こ
れら分割領域を水平及び又は垂直方向に投影することに
よって分割領域毎に周辺分布を作成し、例えば周辺分布
が閾値以上となる領域を文字列領域及び周辺分布が閾値
未満となる領域を文字列間の余白領域として、文字列領
域を検出する。そして分割領域の文字列領域とこれと異
なる他の分割領域の文字列領域との相対的な位置ずれ
(位相差)を検出し、この位置ずれに基づいて文字列の
傾きを検出する(文献I p113−114参照)。
さらに第三の従来技術では、画像の拡大及び縮退を複
数回行なうことによって文字列を構成する文字を連結さ
せ、これら連結文字から成る連結領域を得る。次いで連
結領域に対し細線化処理を施し細線化された連結領域か
ら成る線画像を得る。そして線画像の両端部を数画素だ
け削除して新たな線画像を得、この新たな線画像の両端
点を結ぶ直線の傾きに基づき文字列の傾きを検出する
(文献II p1278−1279参照)。
(発明が解決しようとする課題) しかしながら上述した第一の従来方法にあっては、画
像を回転させるたびに、ヒストグラムの変化を数値化す
る処理を繰返し行なわなければならず、この処理のため
に膨大なデータ処理が必要となるという問題点があっ
た。
また第二の従来方法にあっては、例えば文字部の段構
成(レイアウト)が複雑であったり、文章と図表とが混
在していたり、或は文字列の傾きが例えば10度を越えた
りすると、画像を投影した時に異なる文字列の周辺分布
が重なり合ったり文字列の周辺分布と図表の周辺分布と
が重なり合ったりするため、各文字列領域を個別に精度
良く検出することが困難となる。これがため傾きの検出
精度が悪化するという問題点があった。
さらに第三の従来方法にあっては、非常に多くのパラ
メータを用いて傾き抽出を行なう必要があり、これに加
え傾き抽出のために複雑な処理手順(例えば画像の拡大
及び縮退による連結領域の作成や、連結領域の細線化に
よる線画像の作成や、線画像から短線分及び分枝(所謂
ヒゲ)を削除する処理等)を必要とし、これがため傾き
抽出のために膨大なデータ処理を行なわければならない
という問題点があった。
この発明に主たる目的は、上述した従来の問題点を解
決するため、傾き抽出のために用いるデータの削減を図
れ、そのために処理の高速化が可能な傾き抽出装置を提
供することにある。
(課題を解決するための手段) この目的の達成を図るため、この発明の傾き抽出装置
は、文字パタンを含む情報媒体の画像データを一方向に
走査し、この走査によって走査線上で最初に検出される
文字パタン構成画素を先頭画素として先頭画素の位置を
各走査線毎に検出する画素位置検出手段と、検出された
先頭画素を、ハフ変換により、同一直線上にあると判定
される画素の集団に統合分類し、この集団のなかから最
も多くの先頭画素を含む最多画素集団を抽出する分類抽
出手段と、最多画素集団を形成する先頭画素に関する近
似直線の傾きに基づき情報媒体の傾きを算出する算出手
段とを備えて成ることを特徴とする。
検出された先頭画素を、ハフ変換により、同一直線上
にあると判定される画素の集団に統合分類するに当って
は、x−y座標系が設定された画像データを走査して先
頭画素の位置を検出し、検出された先頭画素を、直線の
方程式:xCosθ+ySinθ=ρに基づいてρ−θ平面上に
写像し、ρ−θ平面上の同一点に写像された先頭画素の
集団を、画像データ上のx−y座標系において同一直線
上にある画素の集団と判定し、この画素の集団をρ−θ
平面上の各点毎に検出する。ρ−θ平面上の各点毎に、
同一直線上にあると判定される画素の集団を検出するこ
とが、先頭画素の統合分類を行なうことである。
この発明の実施に当っては、画素位置検出手段を、文
字パタン構成画素を検出したら次の走査線の走査を行な
う手段とするのが好適である。
またこの発明の実施に当っては、算出手段を、最小二
乗近似直線の傾きを算出する手段とするのが好適であ
る。
(作用) このような構成の傾き抽出装置によれば、文字パタン
を含む情報媒体の画像データを一方向に走査し、この走
査によって走査線上で最初に検出される文字パタン構成
画素を先頭画素として先頭画素の位置を各走査線毎に検
出し、先頭画素の位置に基づいて情報媒体の傾きを抽出
する。
このような傾き抽出において、先頭画素の位置を検出
する処理は単純な処理である。しかも情報媒体の傾きを
抽出するために先頭画素の位置を用いるので、傾き抽出
のために必要なデータの削減を図れる。
(実施例) 以下、この発明の実施例につき説明する。尚、図面は
この発明が理解出来る程度に概略的に示されているにす
ぎず、従って各構成成分の構成、動作の流れ、入出力信
号の流れは図示例に限定されるものではない。
第1図は実施例の構成を概略的に示す機能ブロック図
である。同図にも示すように、この実施例の傾き抽出装
置10は、文字パタンを含む情報媒体の画像データを一方
向に走査し、この走査によって走査線上で最初に検出さ
れる文字パタン構成画素を先頭画素として先頭画素の位
置を各走査線毎に検出する画素位置検出手段12と、検出
された先頭画素の位置に基づいて情報媒体の傾きを抽出
する傾き抽出手段14とを備えて成る。ここに言う文字パ
タンとは、文字線を表すパタンであり、文字パタン構成
画素とは文字パタンを構成する画素とみなされる画素を
意味する。
この実施例では画素位置検出手段12を、先頭画素を検
出したら次の走査線の走査を行なう手段とする。従って
この実施例では、先頭画素を検出したら当該先頭画素を
検出した走査線上の残りの画素については走査を行なわ
ずに、次の走査線につき走査を行なうので、画像データ
の走査の迅速化を図れる。
さらにこの実施例では傾き抽出手段14を、検出された
先頭画素を、ハフ変換により、同一直線上にあると判定
される画素の集団に統合分類(スラスタリング)し、こ
の集団のなかから最も多くの先頭画素を含む最多画素集
団を抽出する分類抽出手段16と、最多画素集団を形成す
る先頭画素に関する近似直線の傾きに基づき情報媒体の
傾きを算出する算出手段18とを以って構成する。
検出された先頭画素を、ハフ変換により、同一直線上
にあると判定される画素の集団に統合分類し、最多画素
集団を形成する先頭画素に関する近似直線の傾きに基づ
いて情報媒体の傾き(例えば情報媒体の文章を形成する
文字列の傾き)を抽出することによって、情報媒体の傾
きを精度良く抽出することが出来る。また画像データ
が、文字パタンのみならず表、罫線その他のパタンを含
んでいる場合でも、傾きを精度良く抽出出来る。
さらに先頭画素の検出、検出された先頭画素の統合分
類、最多画素集団の抽出及び近似直線の傾き算出という
処理によって、情報媒体の傾きを抽出することによっ
て、傾き抽出処理を従来よりも単純化ししかもデータ処
理量の低減を効果的に図れる。
また算出手段18は最多画素集団を形成する先頭画素に
関する近似直線の傾きを算出する任意好適な構成の手段
とすることが出来る。近似直線の傾きの算出方法を限定
するものではないが、例えば算出手段18を最多画素集団
を形成する先頭画素に関する最小二乗近似直線の傾きを
算出する手段とするのが好適である。
さらにこの実施例の傾き抽出装置10は、情報媒体の傾
きを検出するためのメモリとして例えば、検出された先
頭画素の位置を保存する画素位置メモリ24と、先頭画素
を統合分類するために用いるテーブル(統合ケーブル)
を保存するテーブルメモリ26と、最多画素集合を形成す
る先頭画素の位置を保存する最多画素位置メモリ28とを
備える。
また第1図において20は読取部及び22は画像メモリを
示す。この実施例の傾き抽出装置10は、画像メモリ22に
格納された二値画像データを走査することによって傾き
抽出を行なう。このため第1図にも示すように、原稿等
の情報媒体の二値画像データを読取部20によって得、こ
の画像データ20を画像メモリ22に格納する。読取部20
は、図示せずもCCD(Charge Coupled Device)等のイメ
ージセンサを備え、情報媒体をイメージセンサによって
走査して得た多値画像データを二値化し、この二値化画
像データを画像メモリ22に格納するものである。
以下、より詳細にこの実施例につき説明する。
(画像データ) 第2図は画像データの説明に供する図であり、情報媒
体の文章を構成する文字列がX軸に対して5度だけ傾く
ように情報媒体を読取部にセッティングし、解像度4画
素/mmのイメージセンサを用いて情報媒体を読取り、画
像メモリに格納した二値画像データを出力した例を示
す。
この実施例で傾き抽出に用いる画像データDは情報媒
体の所定の読取領域を走査して得られる二値データであ
り、図示の画像データDは説明の簡単化のため例えば文
字パタンD1と情報媒体の地を表わす背景パタンD2とから
成る。文字パタンD1は例えば黒ビットで及び背景パタン
D2は例えば白ビットで表現される。
傾き抽出のために用いる画像データDは文字列の傾き
抽出に必要な文字パタンを少なくとも含むデータであれ
ば、文字パタンの他、図形、表、罫線その他の種々の情
報を表現するパタンを含む画像データDとすることが出
来る。
また画像データDの各画素位置は画像メモリ22上に任
意好適に設定されるX−Y座標系によって表現され、画
像メモリ22はこのX−Y座標系で表現される位置の画素
の画像データDを読出すことが出来るメモリとなってい
る。従って画像データDの画像メモリ22からの読出しを
X、Y座標を用いて自在に行なえる。
尚、第2図においてX軸及びY軸の一部を含む矩形枠
a内の領域は画像データの走査領域の一部を示す。
(画素位置検出手段) この実施例の画素位置検出手段12は、例えばY軸方向
を画像データDの主走査方向及びX軸方向を画像データ
Dの副走査方向として、画像データDを線順次に走査す
る。以下、第3図を参照し画素位置検出手段の動作につ
き説明する。
第3図は画素位置検出手段の動作の一例を示す動作フ
ローである。
読取部20が情報媒体の所定領域の走査を終え画像デー
タDの画像メモリ22への格納が終了すると、画素位置検
出手段12は画像メモリ22の画像データDの走査を開始す
る(S100)。
走査を開始した画素位置検出手段12は走査線S上(第
2図参照)の画像データDを画素単位に読出し(S10
1)、読出した画素が文字パタン構成画素であるか否か
を判定する(S102)。
この実施例では文字パタンD1を黒ビット及び背景パタ
ンD2を白ビットで表現しているので、S102では読出した
画素が黒ビットであれば文字パタン構成画素を検出した
とみなし、及び白ビットであれば文字パタン構成画素を
検出しなかったとみなす。尚、画像データを二値データ
とした場合、文字パタンの他、図形、表、罫線、写真等
を構成するパタンも黒ビットで表現されることとなり、
従って文字パタン構成画素としてこれら文字パタン以外
のパタンを構成する画素も文字パタン構成画素として検
出されることとなる。
S102において文字パタン構成画素を検出したと判定し
たときは、当該画素の位置を走査線上で最初に検出され
た文字パタン構成画素すなわち先頭画素の位置として画
素位置メモリ24に保存し(S104)、次に走査範囲の全走
査線につき画像データの走査を終えたか否かを判定する
(S106)。
全走査線につき走査を終えていれば、画素位置検出手
段14は走査を終了し動作を停止する(S108)。また全走
査線につき走査を終えていなければ、画素位置検出手段
12は次の走査線上の画素の画像データを画像メモリ22か
ら読出し(S110)、次いでS102の判定に応じた動作を行
なう。
さらにS102において文字パタン構成画素を検出しなか
ったと判定したときは、走査線上の画素の全ての画像デ
ータにつき走査を終えたか否かを判定する(S112)。
走査線上の画素の全てにつき走査を終えていれば、画
素位置検出手段12はS106の判定に応じた動作を行なう。
また走査線上の画素の全てにつき走査を終えていなけれ
ば、次の画素の画像データを画像メモリ22から読出し
(S114)、次にS102の判定に応じた動作を行なう。
第4図に先頭画素位置の検出結果の一例を示す。同図
は、第2図に示す画像データを走査して検出された先頭
画素の位置をブロットして示した図である。
(分類抽出手段) 第5図はハフ変換の説明図である。第5図を参照しハ
フ変換につき簡単に説明する。ハフ変換は、検出したい
線(曲線或は直線)を方程式で表現しこの方程式のパラ
メータで構成される空間で統合分類(クラスタリング)
を行なうための方法である。従って例えば直線を方程式
I:xCosθ+ySinθ=ρで表現しこの方程式Iを用いてハ
フ変換を行なうことによって、先頭画素の統合分類が行
なえる。ここで第5図にも示すようにX−Y座標系を考
えた場合、方程式Iにおいてρは原点Oから直線Lにお
ろした垂線Vの長さ及びθは垂線VとX軸との成す角で
ある。
方程式Iのパラメータρ及びθで構成される二次元平
面(ρ−θ平面)上に先頭画素点(先頭画素の座標
(xi,yi)で表現される点)を写像すると、X−Y平面
上で同一直線L上にある先頭画素点P1、P2、P3、…Pk
ρ−θ平面上で一点に写像される。従ってρ−θ平面上
の同一点に写像される先頭画素点の集団が、X−Y平面
上で同一直線上にあると判定される先頭画素点の集団と
なる。
ハフ変換を用いた統合分類によってρ−θ平面上の同
一点に写像される先頭画素のヒストグラムが作成され
る。従ってこのヒストグラムにおいてヒストグラムの度
数が最も大きいρ−θ平面上の点に写像された先頭画素
点を検出すれば、検出した先頭画素点が最多画素集団を
形成する先頭画素点である。
ここでSρ及びSθをそれぞれ、検出したい直線を表
現する際のρに関する許容変動値及びθに関する許容変
動値とすれば、ハフ変換を次式IIに基づいて行なうこと
が出来る。
ρ=[(xCosθ+ySinθ)/Sρ]×Sρ …(式II) 但し記号[ ]は整数化を表す記号であり、従って
[(xCosθ+ySinθ)/Sρ]はパラメータθ、x及びy
にそれぞれ特定の数値を代入して算出された(xCosθ+
ySinθ)/Sρの数値を整数化することを意味する。この
整数化は算出された数値の小数点以下を四捨五入、切り
上げ或は切り下げすることによって行なわれる。またθ
は0、Sθ、2Sθ、3Sθ、…というようにθ=mSθ(m
は正の整数、0≦mSθ<180)で表されるSθの倍数と
なるものとする。
方程式Iに基づいて行なわれるハフ変換では、X−Y
平面上で同一直線上にのる先頭画素点のみが同一直線上
にあると判定される先頭画素点となるが、式IIに基づい
て行なわれるハフ変換ではX−Y平面上で同一直線上に
のる先頭画素点に加えこの直線近傍にある先頭画素点を
も含む先頭画素点が同一直線上にあると判定される先頭
画素点となる。
第6図(A)〜(B)は分類抽出手段によってテーブ
ルメモリ上に作成される統合テーブルの説明図であり、
例えばSρ=5及びSθ=2として式IIに基づいて統合
分類を行なう場合の統合テーブルを示すものである。図
の(A)は初期化された状態の統合テーブル及び(B)
は統合分類を終了した状態の統合テーブルを表す。尚、
第6図(B)は第2図に示す画像データについて検出さ
れた先頭画素を統合分類した実験結果を示したものであ
る。
統合テーブルはρ−θ平面上のどの点に何個の先頭画
素点が写像されたかを表現するヒストグラムであり、例
えば第6図(B)においてρ−θ平面上の点(ρ,θ)
=(0,0)にはひとつも先頭画素点が写像されなかった
ことを示しまた点(ρ,θ)=(190,4)には4個の先
頭画素点が写像されたことを示す。
第7図(A)〜(B)は分類抽出手段の動作の一例を
示す動作フローである。以下、一例として式IIに基づい
てハフ変換を行なう場合の分類抽出手段の動作につき説
明する。
分類抽出手段16は画素位置検出手段12が先頭画素点の
検出を終了すると、分類抽出を開始する(S200)。
分類抽出を開始した分類抽出手段16は、第6図(A)
にも示すようにρ−θ平面上の全ての点に関するヒスト
グラムの度数が零となるようにテーブルメモリ26上の統
合テーブルを初期化し、パラメータθの設定値を初期値
0とし、さらにSρ及びSθの設定値をそれぞれSρ
5及びSθ=2と設定する(S202)。尚、Sρ及びSθ
は上述の特定の数値に限定されるものではなく、任意好
適な値に変更することが出来る。
次いで分類抽出手段16は検出された先頭画素の位置座
標(xi,yi)を先頭画素位置メモリ24から読出し(S20
4)、式IIにθの設定値、x=xi及びy=yiを代入し式I
Iからρを算出する(S206)。
次いで分類抽出手段16は統合テーブルにおいてθがS2
06で用いたθの設定値となりρがS206で算出されたρの
値(ρの算出値)となる欄の度数を1だけカウントアッ
プする(S208)。例えばS206においてθの設定値が0及
びρの算出値が190であったならば第6図(A)及び
(B)に示すように統合テーブルのθ=0及びρ=190
の欄の度数が1だけカウントアップされる。
次に分類抽出手段16は設定されたθに関して(例えば
θ=0に関して)、全ての先頭画素のρを算出したか否
かを判定する(S210)。
全ての先頭画素につきρを算出していなければ、S210
からS204に戻って残りの先頭画素につきρを算出する。
また全ての先頭画素につきρを算出していれば、θの
設定値にSθを加算した値を新たなθの設定値とする
(S212)。
S212の後、分類抽出手段16はθの新な設定値が180以
上となったか否か(θ≧180か否か)を判定する(S21
4)。
θ≧180でなければS204の処理に戻る。
またθ≧180であれば、統合分類処理が終了したこと
を表すので統合テーブルから度数が最大となる欄のρ*
及びθ*を検出する(S216)。例えば第6図(B)にお
いて度数が43となる欄(図中、丸印で囲んで示す欄)が
度数が最大となる欄でありこの場合ρ*=205及びθ*
=84となる。ρ−θ平面上の点(ρ*、θ*)な写像さ
れる先頭画素点から最多画素集団を形成する先頭画素で
ある。
S216の後、分類抽出手段16はθの設定値をθ*とし
(S218)、先頭画素の座標(xi,yi)を先頭画素位置メ
モリ24から読出し(S220)、そして式IIにθ=θ*、x
=xi及びy=yiを代入しρの再算出を行なう(S222)。
次いで再算出されたρが検出されたρ*と等しいか否
かを判定する(S224)。
再算出されたρがρ*と等しければこのときρの再算
出に用いられた先頭画素の座標(xi,yi)を最多画素集
団を形成する先頭画素の座標として最多画素位置メモリ
28に保存し(S226)、次いで全ての先頭画素につきρを
再算出したか否かを判定する(S228)。
全ての先頭画素につき再算出を終えたならば最多画素
集団を形成する先頭画素の抽出を終えたことを表すので
分類抽出手段16は分類抽出処理を終える(S230)。また
全ての先頭画素について再算出を終えていなければ、S2
28からS220の処理に戻り残りの先頭画素につき再算出を
行なう。
S224において再算出されたρがρ*と等しくなけれ
ば、分類抽出手段16はS224からS228の処理に進みS228の
判定に応じて動作する。
第8図に、上述のようにして行なわれた分類抽出処理
の実験結果の一例を示す。第8図は第2図に示す画像デ
ータにつき最多画素集団を形成する先頭画素を抽出し、
抽出した先頭画素をプロットして示す図である。
(算出手段) 算出手段18は分類抽出手段16が分類抽出処理を終える
と最多画素位置メモリ28から最多画素集団を形成する先
頭画素の座標を読出し、これら先頭画素に関する最小二
乗近似直線の傾きαを次式IIIに基づいて算出する。
但し、最多画素集団を形成する先頭画素の検出個数を
m+1個とし、xj及びyjは検出された最多画素集合を形
成する先頭画素pjのX座標及びY座標を表すものとする
(j=0、1、2、…、m)。
そして情報媒体の傾きを例えばTan-1αで表現すると
すれば、算出手段18は式IIIによってαを算出した後、T
an-1αを計算し、情報媒体の傾きとしてTan-1αを出力
する。情報媒体の傾きは従来周知の如く情報媒体の傾き
補正或は画像データの傾き補正のために用いられるもの
である。
第2図に示す画像データにつき検出された最多画素集
合を形成する先頭画素に関して、実験的に、最小二乗近
似直線の傾きαを求めTan-1αを求めたところTan-1α≒
4.9633度という値が得られた。従ってこの実験では情報
媒体の傾きがX軸に対して5度となるようにして得た第
2図に示す画像データから、ほぼ0.04度未満の誤差で情
報媒体の傾きを検出することが出来た。
第9図に、第2図に示す画像データにつき検出された
最多画素集合を形成する先頭画素とこれら先頭画素に関
する最小二乗近似直線とを示す。
<分類抽出手段の他の動作例> 第10図(A)〜(B)は分類抽出手段の他の動作例の
説明に供する動作フローである。以下、上述した実施例
と相違する点につき説明し、上述した実施例と同様の動
作についてはその説明を省略する。
第10図に示すようにこの例では、S206の次にS232の処
理に進み、S232の次にS210の処理に進む。
S232では、統合テーブルにおいてθが設定値及びρが
算出値となる欄の度数を1だけカウントアップすると共
に、このときのρの算出に用いた座標(xi,yi)を最多
画素位置メモリ28の、カウントアップされた欄に対応す
る記憶領域に保存する。
最多画素メモリ28には座標(xi,yi)の保存のための
記憶領域が統合テーブルの各欄毎に対応付けて設定され
ている。すなわちこれを別の観点から説明すれば、例え
ば、最多画素メモリ28の第一の記憶領域にはρ−θ平面
上のθ=0及びρ=0なる点に写像された先頭画素の座
標が保存され、第二の記憶領域にはθ=0及びρ=5と
なる点に写像された先頭画素の座標(xi,yi)が保存さ
れる。
またこの例では、S216の次にS234の処理に進み、S234
のS230の処理に進み分類抽出処理を終える。
S234ではθがθ*及びρがρ*となる統合テーブルの
欄に対応する記憶領域に保存されている座標を最多画素
位置メモリ28から読出すための読出し信号を、算出手段
18に対して出力する。θがθ*及びρがρ*となる欄に
対応する記憶領域に保存されている座標が最多画素集団
を形成する先頭画素の座標である。
読出し信号を入力した算出手段18はこの読出し信号に
基づいて、最多画素集団を形成する先頭画素の座標をメ
モリ28から入力することが出来る。
上述した実施例における各構成成分の構成、動作、動
作の流れ、動作条件及び数値的条件は一例にすぎず、従
ってこの発明は上述した実施例にのみ限定されず、各構
成成分の構成、動作、動作の流れ、動作条件及び数値的
条件を任意好適に変更することが出来る。また、画像デ
ータとして二値データのみならず多値データを用いても
良い。また上述した実施例では画像メモリに保存された
画像データを走査することによって先頭画素の座標を検
出したが、読取部からの二値或は多値画像データを画像
メモリに保存せずに直接に画素位置検出手段に入力する
と共に、読取部の画像データの出力に同期させて画素毎
に発生させたX、Y座標を画素位置検出手段に入力し、
画素位置検出手段に最初に入力された文字パタン構成画
素のX、Y座標を先頭画素位置メモリに保存するように
しても良い。
(発明の効果) 上述した説明からも明らかなように、この発明の傾き
抽出装置によれば、先頭画素の検出、検出された先頭画
素の統合分類、最多画素集団の抽出及び近似直線の傾き
算出という処理によって、情報媒体の傾きを抽出するの
で、傾き抽出処理を従来よりも単純化ししかもデータ処
理量の低減を効果的に図れる。これがため、傾き抽出処
理を従来よりも効率良く従って迅速に行なえる。
さらに検出された先頭画素を、ハフ変換により、同一
直線上にあると判定される画素の集団に統合分類し、最
多画素集団を形成する先頭画素に関する近似直線の傾き
に基づいて情報媒体の傾き(例えば情報媒体の文章を形
成する文字列の傾き)を抽出するので、情報媒体の傾き
を精度良く抽出することが出来る。しかも画像データ
が、文字パタンのみならず表、罫線その他のパタンを含
んでいる場合でも、傾きを精度良く抽出出来る。
【図面の簡単な説明】
第1図はこの発明の実施例の構成の説明に供する機能ブ
ロック図、 第2図は画像データの説明に供する図であり、 第3図は画素位置検出手段の動作の一例を説明するため
の動作フロー、 第4図は先頭画素位置の検出結果の一例を示す図、 第5図はハフ変換の説明に供する図、 第6図(A)〜(B)は統合テーブルの説明に供する
図、 第7図(A)〜(B)は分類抽出手段の動作の一例を説
明するための動作フロー、 第8図は分類抽出結果の一例を示す図、 第9図は傾き算出結果の一例を示す図、 第10図(A)〜(B)分類抽出手段の動作の他の例を説
明するための動作フローである。 10……傾き抽出装置、12……画素位置検出手段 14……傾き抽出手段、16……分類抽出手段 18……算出手段、24……先頭画素位置メモリ 26……テーブルメモリ、28……最多画素位置メモリ

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】文字パタンを含む情報媒体の画像データを
    一方向に走査し、前記走査によって走査線上で最初に検
    出される文字パタン構成画素を先頭画素として該先頭画
    素の位置を各走査線毎に検出する画素位置検出手段と、 検出された先頭画素を、ハフ変換により、同一直線上に
    あると判定される画素の集団に統合分類し、該集団のな
    かから最も多くの先頭画素を含む最多画素集団を抽出す
    る分類抽出手段と、 前記最多画素集団を形成する先頭画素に関する近似直線
    の傾きに基づき前記情報媒体の傾きを算出する算出手段
    とを備えて成ることを特徴とする傾き抽出装置。
  2. 【請求項2】前記画素位置検出手段を、前記文字パタン
    構成画素を検出したら次の走査線の走査を行なう手段と
    したことを特徴とする請求項1に記載の傾き抽出装置。
  3. 【請求項3】前記算出手段を、最小二乗近似直線の傾き
    を算出する手段としたことを特徴とする請求項1に記載
    の傾き抽出装置。
JP63168086A 1988-07-06 1988-07-06 傾き抽出装置 Expired - Fee Related JP2616967B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63168086A JP2616967B2 (ja) 1988-07-06 1988-07-06 傾き抽出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63168086A JP2616967B2 (ja) 1988-07-06 1988-07-06 傾き抽出装置

Publications (2)

Publication Number Publication Date
JPH0217586A JPH0217586A (ja) 1990-01-22
JP2616967B2 true JP2616967B2 (ja) 1997-06-04

Family

ID=15861587

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63168086A Expired - Fee Related JP2616967B2 (ja) 1988-07-06 1988-07-06 傾き抽出装置

Country Status (1)

Country Link
JP (1) JP2616967B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003041469A (ja) * 2001-07-30 2003-02-13 San Oike:Kk 水引テープおよびその製造方法
JP6105521B2 (ja) * 2014-06-24 2017-03-29 京セラドキュメントソリューションズ株式会社 画像処理装置、プログラム及び画像形成装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60251481A (ja) * 1984-05-28 1985-12-12 Toshiba Corp 文字読取装置

Also Published As

Publication number Publication date
JPH0217586A (ja) 1990-01-22

Similar Documents

Publication Publication Date Title
CN111814722B (zh) 一种图像中的表格识别方法、装置、电子设备及存储介质
JP4170441B2 (ja) 文書画像傾き検出装置および文書画像傾き検出プログラムの記憶媒体
JP3308032B2 (ja) スキュー補正方法およびスキュー角検出方法およびスキュー補正装置およびスキュー角検出装置
US9805281B2 (en) Model-based dewarping method and apparatus
EP0764308B1 (en) System and method for automatic page registration and automatic zone detection during forms processing
US6839466B2 (en) Detecting overlapping images in an automatic image segmentation device with the presence of severe bleeding
US6043823A (en) Document processing system which can selectively extract and process regions of a document
JPH03122773A (ja) 画像形成装置
US5033104A (en) Method for detecting character strings
JP4395188B2 (ja) 文書画像認識装置および文書画像認識プログラムの記憶媒体
US20040213458A1 (en) Image processing method and system
JPS61267177A (ja) 文書画像追加情報の蓄積方法
JP4227432B2 (ja) 画像処理方法
US6175664B1 (en) Optical character reader with tangent detection for detecting tilt of image data
JP2616967B2 (ja) 傾き抽出装置
JP3303246B2 (ja) 画像処理装置
JP2000076378A (ja) 文字認識方法
JP3187895B2 (ja) 文字領域抽出方法
JP3083609B2 (ja) 情報処理装置及びそれを用いた文字認識装置
JP2581809B2 (ja) 文字切出し装置
Balasubramanian et al. Information extraction from tabular drawings
CN113780293A (zh) 界面文字识别方法
JP2918363B2 (ja) 文字分類方法及び文字認識装置
JP2993533B2 (ja) 情報処理装置及び文字認識装置
CN117710985A (zh) 光学字符识别方法、装置及智能终端

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees