JP2986383B2 - ライン走査画像のためのスキューを補正する方法及びその装置 - Google Patents

ライン走査画像のためのスキューを補正する方法及びその装置

Info

Publication number
JP2986383B2
JP2986383B2 JP7214333A JP21433395A JP2986383B2 JP 2986383 B2 JP2986383 B2 JP 2986383B2 JP 7214333 A JP7214333 A JP 7214333A JP 21433395 A JP21433395 A JP 21433395A JP 2986383 B2 JP2986383 B2 JP 2986383B2
Authority
JP
Japan
Prior art keywords
image
pixel
line
leftmost
map
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP7214333A
Other languages
English (en)
Other versions
JPH08123900A (ja
Inventor
ロバート・グローバー・ベイカー
ポール・リチャード・スウィングル
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPH08123900A publication Critical patent/JPH08123900A/ja
Application granted granted Critical
Publication of JP2986383B2 publication Critical patent/JP2986383B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/60Rotation of whole images or parts thereof
    • G06T3/608Rotation of whole images or parts thereof by skew deformation, e.g. two-pass or three-pass rotation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/1475Inclination or skew detection or correction of characters or of image to be recognised
    • G06V30/1478Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • H04N1/3877Image rotation
    • H04N1/3878Skew detection or correction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Signal Processing (AREA)
  • Character Input (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Image Processing (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、光学ライン・スキ
ャナの走査によりシステムに入力された画像のスキュー
(回転ずれ)及びシフト(水平移動ずれ)に対する検知
及び補正に関する。
【0002】
【従来の技術】ファクシミリ装置やコピー機、及び文字
認識装置等のシステム内へ画像を入力するための光学ラ
イン・スキャナは、広く使用されている。ある種のシス
テムでは、入力される文書を平坦面上に置いて、そのま
ま光学的手段及び機械的手段により走査されるか、ある
いはローラによりその装置に供給される。これらの全て
のシステムにおいて、当該文書が、装置に対して偏った
位置や傾いた角度で置かれたり供給されたりする可能性
がある。そのような場合、システムから出てくる複写や
ファクシミリされた紙面が傾いてしまうために、人間に
とって読みづらくなったりコンピュータや他の解析器に
とっても解読困難となったりする。
【0003】米国特許第3831146号は、手書き文
字の予備走査を開示している。手書き文字は、垂直方向
から右へ傾けて書かれていることが多い。予備走査は、
水平方向から60度、70度、及び90度にて走査ライ
ンを使用する。一文字が走査される毎に、特殊な結合ロ
ジックがその記憶された文字に対して適用され、その角
度において検出される主要ライン・セグメントの数の計
数を行う。最も多い主ライン・セグメント数をもつ角度
が、認識走査角として選択される。このシステムは、文
字セットにおけるような顕著な垂直ライン成分の数をも
たない画像や、他の非文字文書の画像に対しては動作し
ない。
【0004】米国特許第4338588号は、複数の長
手方向を揃えて並列した光トランスジューサをもつ光学
変換器を、文書に対して回転させるための機械的方法を
開示している。これらのトランスジューサから集められ
た信号は、トランスジューサの長手方向が当該文書の印
刷されるラインと直線上に並ぶように回転したときに顕
かな最大値に到達する。この技術には、機械的システム
の磨耗、信頼性の欠如、及び低速という欠点がある。
【0005】米国特許第4558461号は、画像デー
タを垂直に通る論理帯の形成を開示しており、その論理
帯とデータとのデータ交差リストを作成する。これらの
交差点を用いて、文字のブロックが検出される。1つの
ブロック内の全てのポイントが黒にセットされてライン
を判別するために用いられ、それに基づいて線形回帰法
によりスキュー角が導出される。この方法は複雑であ
り、またデータがメモリに記憶された後に処理をするの
で、システムのコストと処理時間を増すことになる。
【0006】米国特許第4723297号は、フーリエ
解析を用いてシミュレート又は計算される一連のシステ
ム的に選択された探査角を用いることを開示している。
この方法が有効に行われるための重要な前提は、文書上
の文字ソース内の水平要素又は垂直要素が極めて豊富に
あることであり、このことは、文字のない画像には適用
できないことを意味する。
【0007】米国特許第5001766号は、文字の右
下ポイントを検出し、そして各角度についてのドットを
加算することにより一連のスキュー角における「両カウ
ント」を計数することによって文字を配置する方法を開
示している。これらのスキュー角は、想像上のラインで
あってその上に機械的に投影装置を回転することにより
画像が投影される。さらに、文字の右下ポイントの使用
は、予め規定されていなければならない底辺又は下端を
参照することに依存する。その後当該文書は、スキュー
を補正するべく再配向される。機械的な投影の使用は信
頼性に悪影響を与え、また参照下端の作成は、時間のか
かる手作業となる。
【0008】米国特許第5027227号は、スキュー
角を決定するために、並列になった画像のブロックすな
わちサブ区画を回転した後、手動操作入力に依存する。
その後画像のブロックは、回転により生じた非結合ライ
ンとなるように移動させられる。
【0009】米国特許第5054098号は、水平方向
走査により検出された個々のオブジェクトの等高線を辿
ることによるポリゴンの作成を開示している。ライン角
を決定するべく大きなポリゴンが作成され選択される。
修正Hough変換を用いることにより直線が検出され、こ
れからスキュー角が検出される。その後スキューは、マ
トリクス走査により補正される。これらの方法は、時間
がかかり、また大きな演算オーバヘッドを必要とする。
【0010】米国特許第5093653号は、オペレー
タがポイントを選択した後、視覚的に参照ラインを作成
し、これによりシステムがスキュー角を計算して当該画
像を回転する手動による方法を開示している。
【0011】米国特許第5050225号は、シア(she
ar:せん断)回転を用いて様々な角度を通して既存のビッ
ト・マップを回転するための方法を開示する。スキュー
角は検出されず、既に既知であると見なされる。
【0012】
【発明が解決しようとする課題】本発明により、画像の
スキュー及びシフトの検出及び補正において、従来技術
における複雑さ、コスト、低速、画像歪み、及び適用の
限界は、格段に低減される。
【0013】
【課題を解決するための手段】本発明は、文書又は他の
画像フィールド走査と共に共同プロセスに組み込まれた
スキュー角の検出とスキュー角の補正という2つの段階
を用いる。スキュー角は、外部参照ラインなしで自動的
に検出される一方、画像フィールドの第1の部分が走査
される。これによって、走査しながら、画像の残り部分
を回転させることができる。この結果、記憶空間とメモ
リ動作を省き処理スピード全体を改善する。
【0014】本発明の方法は、ただ1つの画像特性を想
定する。すなわち、ほとんどの英文字及び境界のある画
像の特徴である、比較的直線となっている左手側の存在
である。この手法は、右から左へと書かれる言語(ヘブ
ライ語等)の右手側に対しても同じように有効に作用す
る。本発明の方法及び装置は、水平走査の周期的サンプ
ルにおける最も左側のポイントを見出すことによって、
字体又は画像の左側端を構築する。この方法及び装置で
は、識別されたポイントを拡張し、そのポイント周りの
円等の仮想的領域を取り去り、取り去った中に最も左側
のポイントを再選択することによって文字のライン間の
空きを補う。そして、画像のスキュー角を検出するため
にこれらの最も左側のポイントを通して最適フィット(b
est fit)・ラインが構築される。画像全体のサブ領域を
用いてスキュー角が検出された後、シア回転計算を用い
て当該画像が回転させられる一方、当該画像の残り部分
が走査される。しかる後に、画像を中央配置するか又は
所定の上余白もしくは左余白を設けるかによって画像の
位置を補正することができる。
【0015】本発明の有用性は、画像の中又は近傍に予
め設定された又は手動により設けられた参照ラインを必
要とすることなく、ほとんど全ての画像に対して自動的
に適用可能であることである。
【0016】本発明の更なる有用性は、画像が多数の水
平要素又は垂直要素を持っていなくても当該画像のスキ
ュー角を決定できることである。
【0017】本発明の更なる有用性は、最少限の数の比
較的簡単な計算を当該画像ポイント又はピクチャ・エレ
メントの一部のみに対して実行するだけでよいので、記
憶装置やコンピュータの資源が確保されかつシステムの
オペレーションの速度が向上することである。
【0018】
【発明の実施の形態】図1は、本発明による文書スキャ
ナ12に接続されたコンピュータ10を示す図である。
コンピュータ10は、そのメモリ内に、本発明による方
法の各ステップを実行するためのプログラミングされた
命令を備えている。このプログラミングされた命令は、
入力される画像データ及び中間結果並びに最終的に回転
されシフトされた画像データを記憶するためのデータ・
バッファとしてそのメモリの多数の記憶場所を識別す
る。
【0019】図1に示されたスキャナ12は、ローラ1
4として示される汎用的な文書送り機構を有する。この
ような文書送り機構の例は周知であり、よって説明を簡
単とするために詳細な説明を省く。ローラ14は、ライ
ン走査ヘッド13の下に文書11を通す。光学フィール
ド・センサやレンズ等の他の画像補足機構形態を、文書
送り機構及びラインスキャナに替えて用いることができ
る。走査ヘッド13は、好適には、文書11から反射さ
れた光に応答する電荷結合素子(CCD)のアレイを含
む。CCDは、検出された光上方を走査ヘッド13から
アナログ増幅器及びコントラスト回路15へと送り出
し、ここで光情報が、バイナリの明と暗のピクチャ・エ
レメント(画素)へと数値化される。より精細なシステ
ムにおいては、グレー・スケール(階調)画素を表現す
るデジタル・ワードへと変換される。アレイ中のCCD
の間隔及び文書送り速度に関連するアレイからの送り出
し回数によって、走査解像度が決定される。汎用的なア
ルゴリズムを用いる文字認識については、走査ライン1
インチあたり500画素及び文書垂直移動方向1インチ
あたり500走査ラインであれば、信頼性のある解像度
が得られる。画像処理アプリケーションにおいては、そ
の画像処理の目的に応じてさらに低い解像度あるいはさ
らに高い解像度が望ましい場合がある。
【0020】回路15は、スキャナ12に実装してもよ
く、あるいはコンピュータ10に装着されるアダプタ・
カードであってもよい。回路15は、図1に示された画
像バッファ17へ数値化された画像の画素を記憶するた
めにコンピュータのメモリへ接続される。これらの画素
は、画像内の画素の位置に対応する記憶場所にて行列と
して記憶されるか、又は、画像の各走査における各画素
の位置の記録が保存されるような任意のコード化された
方法を用いて記憶される。
【0021】文書11上の画像は、文字や絵画像を含ん
でおり、この画像は、後続の文字認識又は他の画像処理
のために十分な情報を得るべく上記のような比較的高解
像度にて走査される。スキュー角決定の目的のために
は、このような高解像度は必要なく、従って走査選択及
びアドレス制御ロジック19が、コンピュータ・メモリ
内にプログラミングされたコンピュータ命令として備え
られる。ロジック19は、例えば、一インチあたり10
0本の水平走査ラインにて走査された画素をバッファ1
7から選択するべくコンピュータ・メモリを制御する。
これは、スキュー検出のために5回目毎の走査のみを処
理することにより実現される。このように低減された数
の走査ラインであっても、複雑すぎる表現的な図を形成
することになるので、本発明によるスキュー角決定方法
を示すにあたって、図示については一インチあたり10
本の走査ラインを用いることにする。しかしながら、好
適例に関する説明は、一インチあたり100本の走査ラ
インを用いた場合のものである。
【0022】非文字画像の頂点部分又は文字の最初のラ
インにある誤解を招きかねない画像情報に対する操作を
避けるために、スキュー決定方法は、その画像の頂点部
分から約1/2インチ程下にあたるバッファ17内のア
ドレスにて処理を開始する。従って、1インチあたり5
00ラインで走査する場合、ロジック19は、スキャナ
12による最初の250回の画像走査の後に得られた画
素から選択を開始する。
【0023】文書11が、白い背景に黒い文字又は絵画
像を有すると想定する。画素選択制御ロジック21は、
ロジック19及びバッファ17に論理的接続されてい
る。5本目毎の走査ラインの近傍にある最も左側の非白
色画素を選択することにより、1インチあたり100本
の走査ラインを用いるスキュー検出プロセスとなる。画
素選択ロジック21により、x座標がバッファ23内の
リストに記録される。このx座標は、選択された左から
右への走査ラインの近傍において最初に非白色画素が存
在する画像の最も左側の画素(以降、「最左画素」と称
する)の位置を表す。ロジック21は、選択された各走
査ラインに対して前述の最左画素選択を実行する。選択
方法は多数ありその中の1つを用いる。いくつかの選択
方法については後述する。選択された画素の座標はバッ
ファ23に記憶される。
【0024】最適フィット・ロジック25は、画素選択
ロジック21及び最左画素バッファ23へ論理的に接続
されている。ロジック25は、選択された最左画素によ
り数学的に1つのラインを構築するためのコンピュータ
命令を含む。別の例として、この機能は、標準又はカス
タムの集積回路により実行することもできる。スキュー
補正ラインが1インチあたり約100本選ばれる場合、
最適フィット・ラインは、200〜300のポイントを
含むことになる。最適フィット・ラインは、最左画素の
集まりを表し、ほとんどのものは、実際の左側余白に非
常に近いものとなる。最適フィット・ロジック25の出
力は、垂直からの角度であり、最適フィットラインの傾
きに直接関係する。
【0025】シア回転/画像シフトロジック29は、最
適フィット・ロジック25並びにバッファ17及び31
へ論理的に接続されている。シア回転ロジック29は、
垂直からの角度をロジック25より受け取る。シア回転
ロジック29は、受け取った角度を用いてバッファ17
に記憶された画素を回転させ、そして回転して得られた
画像を主画像バッファ31へ入れる。バッファ31か
ら、認識や更なる画像処理が可能となる。上記角度が負
である場合は画像は時計回りに回転され、正である場合
は反時計回りに回転される。さらに画像は、ロジック2
9によりシフトさせることもできる。これにより、画像
の右側からデータを失うことなく規定の左側余白を確保
することができる。
【0026】時分割プロセスにより、走査情報がバッフ
ァ17に記憶されスキューを計算する間にスキューの量
を決定することによって、当該文書の約半分が走査され
た後に回転を開始することができる。本発明のこの特徴
を用いることにより、通常、文書の走査が完了した時点
で、回転もまた実質的に完了することになる。
【0027】好適例におけるオペレーション 図2は、好適例のオペレーションの方法を説明するため
の流れ図である。本発明による方法は、ブロック101
にて、スキャナ12による文書11のライン走査により
開始する。上余白を測るために、完了した走査回数は走
査される毎に計数される。ブロック102において最初
の画像画素が検出されると、新たに計数が開始され、こ
の方法のプロセスにおいて画像データ内のその位置の軌
跡を保持することができる。画像情報の最初のn回の走
査は、後に必要な回転角度が決定されたときに回転を行
うためにバッファ17に記憶される。1インチあたり約
500ラインの走査の場合、画像が走査されている間に
スキュー検出が遅れることと歪みを誘導する可能性とを
考慮すると、nの値は250であることが合理的であ
る。これらのn回の走査は、後の回転のためにバッファ
17に記憶されるが、スキュー検出のためには用いられ
ない。これは、画像の頂点部分が反時計回りに傾いてい
たり、左余白が時計回りに傾いていると誤って認識した
りすることにより生じる歪みを避けるためである。
【0028】ステップ103においてn本のラインが走
査された後、ブロック105に進む。ブロック105で
は、後の最適フィット計算を簡単にするべく、続いて行
われるスキュー検出のための走査において選択する走査
情報の量が減らされる。この減数は、1インチあたり全
500本のラインの中からk本目毎の最左画素の位置を
集めて保存することにより行われる。好適例では、kの
値は5である。5本目毎の画像走査からバッファ17内
の画像データを選択することにより、その画像データ
を、元の走査ラインの5倍の間隔で並んだ水平ラインに
効果的に重ねる。このようにして、元の画像走査ライン
と交わる各々の最左画素についての最適フィット計算を
処理することなく画像の左側境界を配置することができ
る。
【0029】約200〜300の最左位置がバッファ2
3に記憶される一方、スキャナ12は、バッファ17に
記憶するためにn〜m本目までの画像走査ラインの情報
を与える。ブロック107において、m本の走査が完了
したか否かが判断される。mの値は、走査される画像に
応じて経験的に選択される。10ポイント文字に対して
は、mの値が1250〜1750が適切である。これら
の走査ラインは、画像の約2〜3インチを包含すること
になる。
【0030】m回の走査の後、ブロック109におい
て、プログラム・ルーチンとしてコンピュータ・メモリ
内にある最適フィット・ロジック25により、最左位置
を用いて最適フィット・ラインが計算される。最左ポイ
ントを集めるために用いられる方法によっては、ブロッ
ク111における最適フィット・ラインをさらに正確に
求めることができる。これは、その最適フィット・ライ
ンからの各最左画素位置までの画素数の標準偏差を計算
することにより実行される。これら最左画素位置のう
ち、例えば2σよりも大きな偏差をもつものは破棄さ
れ、残りの最左画素位置を用いて新たな最適フィット・
ラインが計算される。新たな最適フィット・ラインの角
度は、実質的に、画像の左余白の角度に等しいことにな
り、最適フィット・ラインの傾きはスキュー角に直接関
係する。
【0031】最適フィット・ラインが見出された後、ブ
ロック113において、最適フィット・ラインの傾きか
ら、最適フィット・ラインと走査方向に対して垂直な線
との間の角度が計算される。この角度が、画像のスキュ
ー角である。
【0032】ブロック115において、プログラムによ
る回転プロセスが実行される。このプロセスは乗算を必
要とせず、よって計算が容易であるので、スリー・シア
(three-shear)回転法を用いて実行することが好適で
ある。
【0033】米国特許第5050225号に開示された
スリー・シア回転の方法は、ブロック115の回転プロ
セスのステップに好適である。回転の中心ポイントが、
画像の頂点部分近傍でかつ最適フィット・ライン上の点
であることが好適である。
【0034】ブロック117では、走査中の画像のシフ
トを補正するために、回転後に画像をシフトする。その
シフト量は、ブロック119において検出する。この検
出方法は多様であり、例えば、左余白の検出のために行
われたステップを右余白のデータ・エレメントに対して
繰り返す方法がある。別の方法としては、走査ラインの
最左エレメントとその走査ラインの最右エレメントとの
間にあるエレメント位置の最大数の計数を保持する方法
がある。このような計数は、最も長い走査ラインを決定
することになる。当然このような最長走査ラインは、画
像上を斜めに横切るラインである。従って、最長走査ラ
インの計数に回転角の余弦を乗算することによって、文
書上の画像の真の幅を決定することができる。この後者
の方法は、円画像に対しては正確ではなく、それ故、好
適例では前者の方法を採っている。左余白は、その左余
白上に位置するべく通常通りに選択された回転のポイン
トから決定することができる。好適例では、回転のポイ
ントは、最適フィット・ラインとの交点である画像の左
上ポイントとなるように選択されている。
【0035】決定された左余白及び右余白を用いて画像
がシフトされることによって、文書の端からの所定の左
余白の大きさが保持されるが、画像の右端の一部が失わ
れることはない。シフトは、既知の方法のいずれかを用
いて実行される。最も簡単な方法では、シフト方向にお
ける画像端の画像データを、メモリ内においてその方向
へ必要なシフト量だけ移動させる。そしてその近隣のデ
ータもまた同様に、先に移動させたデータの近隣に移動
させられることにより、全てのデータが移動させられ
る。
【0036】図3は、水平ラインに論理的に重ねて置か
れた文字の画像が示されており、これらの水平ライン
は、実際に、スキャナ12により与えられバッファ17
に記憶されるデータの選択された走査ラインである。ラ
イン211は、最初の250本の走査が受信されバッフ
ァ17に記憶された後に、スキャナ12から受信されバ
ッファ17に記憶されたデータの走査ラインである。非
バックグラウンドの最左画素は、位置213にあり、そ
のメモリ・マップ座標はバッファ23に記憶される。K
回の走査の後、ライン215が受信され画素選択ロジッ
ク212より処理され、最左画素217のx座標が選択
される。この場合、行間スペースのためにかなり右へ寄
っている。さらにK回の走査の後、ライン219が選択
され画素221の座標が記憶される。同様にライン22
3及び画素位置225も記憶され、さらにm本の走査ラ
インについて繰り返される。こうして、適宜データが集
められることにより実質的に左余白に沿ったラインが生
成される。
【0037】ライン219と交差する最左画素221を
選択した後、画素221の座標の周囲に、領域円227
が選択される。この領域内にさらに左に位置する画素が
ないかを探す。この場合、画素229が探査領域227
内にありかつ最も左に位置する。従って、画素229の
座標が、画素221の座標と置き換えられる。ここで、
時々起きることであるが、最左画素229は、ライン2
23と交差する画素225についての探査領域231内
の最左画素でもあることを注記する。従って、画素22
1の座標及び画素225の座標は、双方とも本発明の方
法により、実質的に左余白上にある画素229の座標に
修正される。2回記録されると、後の最適フィット・ラ
イン計算において2倍の重みを付される。
【0038】画素217は、かなり右へ寄っており、そ
の探査領域円235もまた周囲に生成されてはいるが、
その探査領域円内の更なる最左画素も、尚、かなり右へ
寄ったままである。画素217の座標及びその修正画素
の座標は、後の標準偏差計算により取り除かれることに
なる。
【0039】上記の探査領域は、円に限定する必要はな
く、左半円又は左長方形を用いても同様に余白ポイント
の探査すなわち最左画素の修正が行える。
【0040】図4は、余白ポイント探査の拡張方法を示
す流れ図である。このプロセスは、図2のブロック10
5において開始される。ここで、K番目の走査ラインと
交差する最左画素の位置が検出されバッファ23に記憶
される。図2のブロック107に進む替わりに、図4の
ライン303の流れに沿ってブロック305へ進み、こ
こで、ブロック105で検出された位置が通知される。
それからブロック307においてその位置の周囲に探査
領域が生成される。ブロック309において、新たな最
左画素が検出されなければ、図2のブロック107へ戻
る。新たな最左画素が検出された場合は、その位置が、
ブロック105で検出された元の位置に替わってバッフ
ァ23に記憶される。その後、図2のブロック107へ
戻る。
【0041】図5は、極端に右に偏った余白ポイントが
検出された場合にこれを補償する方法を示した流れ図で
ある。補償プロセスは、図2のブロック111において
開始され、図5のライン403流れに沿ってブロック4
05へ進み、各余白ポイントと形成された最適フィット
・ラインとの間の標準偏差が計算される。ブロック40
7において、図3のポイント217のように2σ以上の
標準偏差をもつ余白ポイントが、左余白を表す位置の集
まりのリストから破棄される。それからブロック409
において、残りの左余白ポイント位置を用いて新たな最
適フィット・ラインが形成される。これによって、画像
の不規則性や文字行間スペースに起因する極端に右に偏
った左余白ポイントを補償することができる。その後、
ライン411の流れに沿って図2のブロック113へ戻
る。
【0042】
【0043】
【0044】
【発明の効果】以上説明したように、本発明によれば、
画像のスキュー及びシフトの検出及び補正において、従
来技術に対し、複雑さ、コスト、低速、画像歪み、及び
適用の限界を格段に低減することができる。
【図面の簡単な説明】
【図1】本発明によるライン走査システムを示すブロッ
ク図である。
【図2】本発明によるライン走査システムにおける方法
を示す流れ図である。
【図3】本発明の実施例における補償のための探査領域
を示した、文字画像上の周期的走査の図である。
【図4】本発明による余白ポイント位置確定の拡張され
た方法を示す流れ図である。
【図5】本発明による余白ポイント位置補償のための方
法を示す流れ図である。
【符号の説明】
10 コンピュータ・システム 11 文書 12 ライン走査システム 13 スキャナ 15 増幅器/コントラスト回路 17 入力画像バッファ 19 アドレス制御ロジック 21 画素選択ロジック 23 最左画素バッファ 25 最適フィット・ロジック 29 シア回転/シフト・ロジック 31 主画像バッファ
───────────────────────────────────────────────────── フロントページの続き (72)発明者 ポール・リチャード・スウィングル アメリカ合衆国33445、フロリダ州、デ ルレイ・ビーチ、ノースウェスト・ナイ ンス・ストリート 3727 (56)参考文献 特開 平2−278104(JP,A) 特開 平2−158882(JP,A) 特開 昭62−256187(JP,A) 特開 平4−286085(JP,A) 特開 平4−331568(JP,A) 特開 平2−287684(JP,A) (58)調査した分野(Int.Cl.6,DB名) G06K 9/00 - 9/82 H04N 1/387 G06T 1/00

Claims (5)

    (57)【特許請求の範囲】
  1. 【請求項1】ライン走査システムにおけるスキューを補
    正する方法であって、 フィールドを走査するスキャナから画像情報を受信し、
    その画像を表現するバックグラウンド画素と画像画素と
    をもつ該画像情報を生成するステップと、 前記スキャナから受信された前記画素を、前記画像を表
    現するマップとして構造化して記憶するステップと、 各々の水平ラインと画素との最左交点の前記マップ上に
    おける位置を検出するステップと、 各々の前記最左交点の周囲に探査領域を設定するステッ
    プと、 各々の前記探査領域内の最左画素の前記マップ上におけ
    る位置を検出しかつその検出された位置を前記最左画素
    として置き換えるステップと, 前記最左画素の前記マップ上の位置を用いて最適フィッ
    ト・ラインを生成するステップと、 前記最適フィット・ラインからの各前記最左画素の位置
    までの画素数の標準偏差を計算するステップと、 所定値よりも小さい標準偏差をもつ最左画素の位置のみ
    を用いて新たな最適フィット・ラインを計算するステッ
    プと、 前記新たな最適フィット・ラインと前記水平ラインに対
    して垂直なラインとの間の角度を計算するステップと、 前記角度を用いて前記マップを回転させるステップとを
    含むスキューの補正方法。
  2. 【請求項2】各々の前記水平ラインと画素との最右交点
    の前記回転されたマップ上における位置を検出するステ
    ップと、 前記最左交点及び前記最右交点の各々から、左余白及び
    右余白を決定するステップと、 前記画像を喪失することなく所定の左余白を設けるべく
    前記マップをシフトさせるステップとを含む請求項1に
    記載の方法。
  3. 【請求項3】前記回転させるステップが、シア回転アル
    ゴリズムを実行する請求項2に記載の方法。
  4. 【請求項4】画像を走査してその画像を表現するバック
    グラウンド画素と画像画素とをもつ画像情報を生成する
    ためのスキャナと、 前記スキャナへ接続され、該スキャナから前記画像情報
    を受信し、該画像情報の各画素の該画像における位置の
    記録を保存するべく該画像情報をメモリに記憶する記憶
    装置と、 前記スキャナ及び前記記憶装置へ接続され、コンピュー
    タ・プログラムにより制御されるコンピュータとを有す
    るライン走査画像のためのスキューを補正する装置であ
    って、 前記コンピュータ・プログラムが、 前記スキャナから受信された前記画素を、前記画像を表
    現するマップとして構造化して記憶するための第1のプ
    ログラミングされた命令と、 各々の水平ラインと画素との最左交点の前記マップ上に
    おける位置を検出するための第2のプログラミングされ
    た命令と、 前記最左交点の各々の周囲に探査領域を設定するための
    第3のプログラミングされた命令と、 各々の前記探査領域内の最左画素の前記マップ上におけ
    る位置を検出しかつその検出された位置を前記最左画素
    として置き換える第4のプログラミングされた命令と、 前記最左画素の前記マップ上の位置を用いて最適フィッ
    ト・ラインを生成するための第5のプログラミングされ
    た命令と、 前記最適フィット・ラインからの各前記最左画素の位置
    までの画素数の標準偏差を計算するための第6のプログ
    ラミングされた命令と、 所定値よりも小さい標準偏差をもつ最左画素の位置のみ
    を用いて新たな最適フィット・ラインを計算するための
    第7のプログラミングされた命令と、 前記新たな最適フィット・ラインと前記水平ラインに対
    して垂直なラインとの間の角度を計算するための第8の
    プログラミングされた命令と、 前記角度を用いて前記マップを回転させるための第9の
    プログラミングされた命令とを有する、 ライン走査画像のためのスキューを補正する装置。
  5. 【請求項5】各々の前記水平ラインと画素との最右交点
    の前記回転されたマップ上における位置を検出するため
    の第10のプログラミングされた命令と、 前記最左交点及び前記最右交点の各々から、左余白及び
    右余白を決定するための第11のプログラミングされた
    命令と、 前記マップをシフトさせるための第12のプログラミン
    グされた命令とを有する、 請求項4に記載の装置。
JP7214333A 1994-09-23 1995-08-23 ライン走査画像のためのスキューを補正する方法及びその装置 Expired - Fee Related JP2986383B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US311472 1994-09-23
US08/311,472 US5517587A (en) 1994-09-23 1994-09-23 Positioning method and apparatus for line scanned images

Publications (2)

Publication Number Publication Date
JPH08123900A JPH08123900A (ja) 1996-05-17
JP2986383B2 true JP2986383B2 (ja) 1999-12-06

Family

ID=23207023

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7214333A Expired - Fee Related JP2986383B2 (ja) 1994-09-23 1995-08-23 ライン走査画像のためのスキューを補正する方法及びその装置

Country Status (4)

Country Link
US (1) US5517587A (ja)
EP (1) EP0703696A2 (ja)
JP (1) JP2986383B2 (ja)
CA (1) CA2157969A1 (ja)

Families Citing this family (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5821523A (en) * 1992-03-12 1998-10-13 Bunte; Alan G. Combined code reader and digital camera using a common photodetector
US5712714A (en) * 1994-07-18 1998-01-27 Mita Industrial Co., Ltd. Image processing apparatus
JP3727971B2 (ja) * 1995-02-01 2005-12-21 キヤノン株式会社 文書処理装置、及び文書処理方法
US6473519B1 (en) * 1996-02-21 2002-10-29 Hand Held Products, Inc. Check reader
US5901253A (en) * 1996-04-04 1999-05-04 Hewlett-Packard Company Image processing system with image cropping and skew correction
US5912448A (en) * 1997-05-16 1999-06-15 Hewlett-Packard Company Method and apparatus for detecting paper skew in image and document scanning devices
KR100288692B1 (ko) * 1997-12-08 2001-05-02 윤종용 셔틀방식 스캐너의 스캐닝오차 보정방법
US6298157B1 (en) 1998-02-27 2001-10-02 Adobe Systems Incorporated Locating and aligning embedded images
US6310984B2 (en) 1998-04-09 2001-10-30 Hewlett-Packard Company Image processing system with image cropping and skew correction
KR100264331B1 (ko) * 1998-05-26 2000-08-16 윤종용 원고 비틀림 보정 장치 및 방법
US6201901B1 (en) * 1998-06-01 2001-03-13 Matsushita Electronic Industrial Co., Ltd. Border-less clock free two-dimensional barcode and method for printing and reading the same
US6188801B1 (en) * 1998-08-31 2001-02-13 Jenn-Tsair Tsai Method and apparatus for automatic image calibration for an optical scanner
US6504946B1 (en) * 1998-10-26 2003-01-07 Ncr Corporation Method of processing misoriented items in an image-based item processing system and an apparatus therefor
US6565003B1 (en) 1998-12-16 2003-05-20 Matsushita Electric Industrial Co., Ltd. Method for locating and reading a two-dimensional barcode
US6400851B1 (en) * 1999-01-28 2002-06-04 Microsoft Corporation Rotating image data
US6381371B1 (en) 1999-03-17 2002-04-30 Hewlett-Packard Company Method and apparatus for processing image files
US6449397B1 (en) * 1999-04-05 2002-09-10 Mustek Systems Inc. Image processing system for scanning a rectangular document
JP4310023B2 (ja) * 1999-06-17 2009-08-05 キヤノン株式会社 縮小画像作成方法及び装置、記憶媒体
US6674919B1 (en) * 1999-09-21 2004-01-06 Matsushita Electric Industrial Co., Ltd. Method for determining the skew angle of a two-dimensional barcode
JP4610687B2 (ja) * 1999-11-15 2011-01-12 コニカミノルタホールディングス株式会社 原稿読み取り装置
JP4603658B2 (ja) * 2000-07-07 2010-12-22 キヤノン株式会社 画像処理装置及び画像処理方法並びに記憶媒体
DE10043318B4 (de) * 2000-08-18 2005-07-21 Mustek System, Inc. Verfahren zum automatischen Beschneiden eines abgetasteten Bildes im Echtzeitbetrieb
US7116840B2 (en) * 2002-10-31 2006-10-03 Microsoft Corporation Decoding and error correction in 2-D arrays
US7305612B2 (en) * 2003-03-31 2007-12-04 Siemens Corporate Research, Inc. Systems and methods for automatic form segmentation for raster-based passive electronic documents
US20050068583A1 (en) * 2003-09-30 2005-03-31 Gutkowski Lawrence J. Organizing a digital image
US7356200B2 (en) * 2003-11-03 2008-04-08 Hewlett-Packard Development Company, L.P. Method and device for determining skew angle of an image
US7349123B2 (en) * 2004-03-24 2008-03-25 Lexmark International, Inc. Algorithms and methods for determining laser beam process direction position errors from data stored on a printhead
US7375738B2 (en) * 2004-03-24 2008-05-20 Lexmark International, Inc. Electronic systems and methods for reducing laser beam process direction position errors
JP4574235B2 (ja) * 2004-06-04 2010-11-04 キヤノン株式会社 画像処理装置、及びその制御方法、プログラム
US7298377B2 (en) * 2004-06-24 2007-11-20 International Business Machines Corporation System and method for cache optimized data formatting
US7564593B2 (en) * 2004-11-19 2009-07-21 Xerox Corporation Method and apparatus for identifying document size
EP1689192A3 (en) * 2005-02-04 2011-10-26 Thomson Licensing Method and device for scanning in a data frame
US7876977B2 (en) * 2006-02-15 2011-01-25 Conexant Systems, Inc. Image processor and method of image rotation
JP5141014B2 (ja) * 2006-12-28 2013-02-13 富士ゼロックス株式会社 画像形成装置、画像処理装置及びプログラム
US8064729B2 (en) * 2008-04-03 2011-11-22 Seiko Epson Corporation Image skew detection apparatus and methods
KR101035739B1 (ko) * 2009-02-13 2011-05-20 전남대학교산학협력단 문자 인식의 왜곡을 보정하는 방법
WO2011001439A2 (en) 2009-07-02 2011-01-06 Hewlett-Packard Development Company, L.P. Skew detection
JP4952756B2 (ja) * 2009-08-31 2012-06-13 ブラザー工業株式会社 印刷装置
CN106951855B (zh) * 2017-03-16 2020-04-10 深圳市六六六国际旅行社有限公司 一种图片中文档定位和裁切方法
JP7211166B2 (ja) * 2019-03-04 2023-01-24 京セラドキュメントソリューションズ株式会社 画像傾き角度検出装置、画像形成装置及び画像傾き角度検出プログラム
TWI702547B (zh) * 2019-07-03 2020-08-21 利凌企業股份有限公司 車牌辨識方法及其系統

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3831146A (en) * 1973-03-19 1974-08-20 Ibm Optimum scan angle determining means
EP0020897B1 (de) * 1979-06-26 1983-11-16 International Business Machines Corporation Vorrichtung zur Bestimmung des optimalen Abtastwinkels von Druckschriften
US4558461A (en) * 1983-06-17 1985-12-10 Litton Systems, Inc. Text line bounding system
US4723297A (en) * 1984-09-27 1988-02-02 Siemens Aktiengesellschaft Method for automatic correction of character skew in the acquisition of a text original in the form of digital scan results
JPS6429166A (en) * 1987-07-24 1989-01-31 Sharp Kk Picture rotating device
US5001766A (en) * 1988-05-16 1991-03-19 At&T Bell Laboratories Apparatus and method for skew control of document images
JP2829006B2 (ja) * 1988-11-10 1998-11-25 株式会社リコー 画像処理装置
JPH02287684A (ja) * 1989-04-28 1990-11-27 Ibm Japan Ltd イメージ処理装置および方法
US5111192A (en) * 1989-12-20 1992-05-05 Xerox Corporation Method to rotate a bitmap image 90 degrees
US5054098A (en) * 1990-05-21 1991-10-01 Eastman Kodak Company Method of detecting the skew angle of a printed business form
US5233168A (en) * 1991-09-30 1993-08-03 Pitney Bowes Inc. Method of deskewing an image
US5410417A (en) * 1994-02-10 1995-04-25 Motorola, Inc. Method and apparatus for correcting an angle of an optical image for improving the efficiency of facsimile encoding of the image

Also Published As

Publication number Publication date
JPH08123900A (ja) 1996-05-17
US5517587A (en) 1996-05-14
CA2157969A1 (en) 1996-03-24
EP0703696A2 (en) 1996-03-27

Similar Documents

Publication Publication Date Title
JP2986383B2 (ja) ライン走査画像のためのスキューを補正する方法及びその装置
US6738154B1 (en) Locating the position and orientation of multiple objects with a smart platen
US5181260A (en) Method for determining the amount of skew of image, method for correcting the same, and image data processing system
JP2835274B2 (ja) 画像認識装置
EP0431962B1 (en) Method and apparatus for identification of document skew
US6956587B1 (en) Method of automatically cropping and adjusting scanned images
US5563403A (en) Method and apparatus for detection of a skew angle of a document image using a regression coefficient
US5568571A (en) Image enhancement system
US6839466B2 (en) Detecting overlapping images in an automatic image segmentation device with the presence of severe bleeding
JP3249605B2 (ja) 書類辺縁検出装置
US5892854A (en) Automatic image registration using binary moments
JPH03201866A (ja) 圧縮形態のデータを含むデータから画像スキュー角度を決定する方法
EP1081648B1 (en) Method for processing a digital image
US5581635A (en) Method and system for fast rotation of run-length encoded images
CA1316605C (en) Method of searching binary images to find search regions in which straight lines may be found
JP3006466B2 (ja) 文字入力装置
US5113267A (en) Apparatus for and method of reconstructing a document
JPH08317193A (ja) ディジタル化画像の縦横ラインを検知し修正する方法および装置
JP3698867B2 (ja) 円形パターン判定方法、装置および記録媒体
JP3058791B2 (ja) 画像認識装置の図形の切出し方法
EP0975146A1 (en) Locating the position and orientation of multiple objects with a smart platen
EP0702320A1 (en) Skew detection
JP2000187705A (ja) 文書読取装置および方法および記憶媒体
JPH10336428A (ja) 画像処理装置
JPH11288453A (ja) 再生用のスキャン環境における原稿画像のスキュ―角度および黒い境界線を検出する方法およびシステム

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees