JP3390000B2 - 画像の分析方法 - Google Patents
画像の分析方法Info
- Publication number
- JP3390000B2 JP3390000B2 JP34121190A JP34121190A JP3390000B2 JP 3390000 B2 JP3390000 B2 JP 3390000B2 JP 34121190 A JP34121190 A JP 34121190A JP 34121190 A JP34121190 A JP 34121190A JP 3390000 B2 JP3390000 B2 JP 3390000B2
- Authority
- JP
- Japan
- Prior art keywords
- alignment
- image
- skew
- line
- passcode
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
- G06T7/73—Determining position or orientation of objects or cameras using feature-based methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
- G06V30/1475—Inclination or skew detection or correction of characters or of image to be recognised
- G06V30/1478—Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Character Input (AREA)
- Image Input (AREA)
- Facsimile Scanning Arrangements (AREA)
- Facsimile Image Signal Circuits (AREA)
- Image Processing (AREA)
Description
【発明の詳細な説明】
本発明は、走査画像に存在するスキューを検出するた
めの画像の分析方法に関し、より詳しくは、画像中のマ
ークのスキュー角を示すデータを得るために、マークを
含む画像を画定する画像データを操作してコンピュータ
に取り入れられた画像を分析する方法に関するものであ
る。 人間の目は、直角からごく僅かな偏位を検出すること
ができ、エリアシング(aliasing)エラーに起因する不
連続性がこれらの偏位に注意を引きつける簡単な構造の
ディジタル画像においては特にそうである。テキストや
複雑なグラフィック画像のスキューに対する人間の感覚
に関する有効な情報はほとんどない。明確な特徴のある
座標フレーム中に情報が現れる場合、スキュー角度は一
貫してかつ相当に過大評価される。スキューがあるとい
うことは、審美学上喜ばしいことではなく、かつ実用的
効果もない。スキューの存在は、一つ或いはそれ以上の
コーナーが、スキューのためにスキャナの視野から外方
に外れることにより、画像の全てのソース域の捕獲が失
敗することになる。スキューした画像は、ページ座標系
に正確に記録されているのと同じくらいには、迅速に或
いはコンパクトに圧縮されない。スキューされたフィー
ルドは、例えば刈り込み(cropping)や挿入のような標
準のページレイアウトや合成操作に用いるのはより困難
である。 スキューは、ディジタル化の時か或いはとりわけフォ
トコピー時におけるディジタル化の前のいずれかにおい
て、紙を供給するに際しての困難さを含むいくつかの場
合に生じてくる。再生が、ディジタル走査と、これによ
り得られるビットマップのプリントによってもたらされ
る電子写真複写環境においては、スキュー角度の早くて
正確な検出が、スキュー画像の修正と記録するための資
源の必要性を充分に縮小することが可能である。 スキュー角度検出は、伝統的に2工程で行われる。ま
ず第1に、アライメントの質が基本となっている特徴が
決定され、次いで企てられたアライメントが前のサンプ
ルアライメント或いは他の基準に関して優れているかど
うかを決定するために種々のテストが課せられる。ここ
でいう「アライメント」とは画像の要素の方向付けのこ
とである。 現在に至るまで、スキュー角度の決定は、圧縮状態で
の画像データで達成されてきた。ここで「画像」とはパ
ターン或いは識別可能域の集合を意味し、画像、表示か
或いはこのどちらでもないか、典型的であるが、排他的
ではなしに、プリントされたページに見いだされるもの
である。「画像データ」とは、適当なシステムによって
画像の再生に用いられる、典型的であるが、排他的では
ないフォーマット中のディジタルな画像のことをいう。
「圧縮された」フォーマット中のデータとは、ここでは
「圧縮されていない」フォーマット中のデータから、デ
ータを記憶する必要のある例えばビットによるメモリス
ペースの大きさに縮小されることを意味する。この場
合、データを圧縮するのに用いられる方法は問わない。
圧縮された画像データからのスキュー角度の決定は、現
在まで考察されてきていない。或いはもし考察されてき
ているとしても、圧縮された画像データ上からスキュー
を決定する操作には必要以上のことであり、かつ、決定
的に画像を圧縮されたデータフォーマットに変換するの
は不必要な工程であるという一般的な考えの下にかたず
けられてきている。 圧縮されていない画像のスキュー角度を決定する技術
としては、ヘンリー・エス・ベアード(Henry S.Bair
d)による「印刷物のスキュー角度」と題するハイブリ
ッド画像システムに関するSPSEシンポジウム議事録,pp2
1〜24,1987(以後、ベアードという)に開示されている
ものを参照する。まず最初に、ベアードは、マーク或い
はテキストである関連要素とテキストでない要素と識別
をしなければならない。この点に関し、この明細書の目
的としての「テキスト」マークすなわち関連要素は、文
字、数字、句読点及び関連する符号からなる。この「テ
キスト」マークは「非テキスト」マーク或いはテキスト
ではない典型的にはグラフィックス、シンボル或いは画
像の描写のような部分である関連要素と識別されてい
る。基準点を位置決めに用いる方法として、ベアード技
術はテキスト画像にとって意味のある結果を生じるのみ
である。テキストとしてのこの分類は、テキストマーク
の最大寸法が予め定められた最大フォントサイズ、例え
ば24ポイント中の「em」以下、ないしこれと同等である
ことに基づいてベアードによって作られたものである。 ベアード技術のアライメントアルゴリズムは、各マー
ク或いは関連する要素に関係した選ばれた特徴のアライ
メントに基づいて作用する。「マーク」は、関連する要
素として用いるものとする。「関連する要素」は、本願
明細書の目的として、一連のカラー付きユニット、典型
的には互いに関連する同様の色の画素(「ピクセル」)
に定義される。この目的で普通用いられる特徴は「基準
点」である。ここで用いる「基準点」は予め定められた
一連のルール(各マークにつき同じルール)によって位
置決めされ、かつマークの特徴を表現する選ばれた目的
のために用いられるマークのポイント或いは関連するマ
ークのポイントである。例えば、ベアードは基準点とし
て各マークのまわりに境界となるボックス(枠)の下方
中心に用いている。ベアードの基準点10は第1A図のマー
ク14のまわりの境界線12上の十字線として示される。 英語のテキストの完全に一直線上にある水平線におい
て、例えば各基準点は文字のベース(ベースラインと呼
ぶ)で同じ水平線16上に位置する。ただし、例えば第1A
図の文字「i」、ある種の句読点及びたれ下り文字、つ
まりマークの一部がベースラインより下に下がってい
る、例えば文字「g」「p」等は別である。基準点が各
関連要素に指定されているので、ドット付き文字「i」
と「j」及び多くの句読点マーク(;?:")は一文字当た
り一つ以上の基準点が生じることになり、これら基準点
のうちの少なくとも一つがベースラインに対して大きく
ずれてしまう。たれ下がりを有する文字は基準点から離
れて形成されるが、ベースラインの近くにはある。たれ
下がり文字は統計的にはそう普通ではなく、ベアードの
方法(及び本発明は発明においても)は真のベースライ
ンを決定する効果を認識し、補正するための手段を提供
する。注目したいのは、画像中の一つの関連要素当たり
の基準点は正確には一つであるということである。 本質的には、ベアードは、交換するアライメントに変
化のために一つの「ライン」当たりの基準点の数を決定
することによってスキューを計算した。ここで用いるラ
インは例えばドキュメント(書類)を横切る走査線及び
例えばマージン或いはページエッジのような選択された
特徴に垂直に方向付けられた想像上の複数の走査線の一
つを意味する。回転アライメントは、基準点の三角法に
よって計算される。 第1B図、第1C図を参照して、1本のライン当たりの基
準点の数の数え方は、矢印pで示される投影方向と鉛直
なアキュムレータライン18上に基準点10の位置を投影す
ることによって達成される。アキュムレータライン18
は、例えば6点文字の高さの1/3に等しい均一の予め定
められたhの「ビン」20に区分される。高さhは適当に
変えることができる。高さhは2ピクセルと同じくらい
に小さくすることもできる。しかし、hが小さくなるに
つれて、計算時間が長くなる。重要なのはhが文字の高
さに近づくとスキュー角度決定性能が劣化することであ
る。ビンについて説明すると、1本のライン当たり正確
に一つのビンである。選択されたラインのための基準点
の数は、そのラインに対応するビンに投影される基準点
の数と等しくなる。 この方法は、比較的少ない基準点(画像の性質によっ
て決まる)となるので、アライメントは1よりも大きい
正の累乗の和、例えば回転してアラインされたビン中に
現れる基準点のカウントの2(二乗の和)に基づいたア
ライメントの計算によって効果的になされる。分布の変
動は、スキュー角度が決定されるアライメントの「累
乗」指数となるカウントの二乗の和を最大にすることに
よって最大にされる。第1B図は、基準点10の位置及びビ
ンがスキューされたテキストと一致していないスキュー
されたテキストサンプル上の各ビン20の相対的な大きさ
を示す。第1C図は第1B図の同じスキューされた画像の基
準点の一致したビンへの分布を示す。 アライメントの各変動の累乗の計算には、各基準点の
位置がわかっていることが必要である。すなわち基準点
の座標は、原点からの角度と偏位によって基準点を新し
い一連の座標に数学的に変換するのに用いられる。この
工程は基準点を完全に収集するために行われ、この変換
の前後におけるアライメントの累乗が比較される。各々
の比較から最大の累乗を有するアライメントに対応する
角度が保持される。選ばれた範囲内の全ての角度上にア
ライメントがこの方法によって比較された後、スキュー
角度が最大の累乗を有するアライメントに対応する角度
とみなされる。しかし、アライメントが弱いか或いは多
重アライメントの場合、この仮定は別の方法で証明する
必要がある。 本発明は、従来技術の種々の問題点や欠点を解消する
新規なスキュー角度決定方法を提供する。 本発明の一つの観点は、スキュー角度が大きくなるに
従って、マークの底部と境界枠の底部との間の距離が大
きくなるという、ベアードのスキュー角度決定方法にお
ける問題を見つけることにある。この距離の差は、スキ
ューの角度の正弦の関数として大きくなる。この点が基
準点のカウント中の誤差となり、この誤差の二乗として
スキュー角度の決定に影響を与える。 この観点は、さらにベアード法の問題は、マーク自身
の上に位置される基準点に基づいたスキュー角度を決定
することによって解決できることを見つけることに基づ
いている。 本発明のこの観点に関連した点としては、ラインの端
がスキュー決定の基準となる有効な一連の特徴を形成す
ることを発見することである。特に有効な一連の特徴
は、水平方向に向けられた画像のためのベースライン
に、或いはこれの近くに配置されたラインの端々或いは
垂直な或いは円柱方向に付けられた画像のための垂直ラ
インである。包括的な画像中のライン端の検出は困難は
仕事であることが立証されている。しかし、一つの方法
が発見され、かつ一連のライン端を含む一連の特徴を検
出する本発明の他の観点が形成された。一連の特徴は、
使用するライン端の有効性が少なくなるような大きさに
限定される。一つの走査線を続く走査線と比較すること
によって、ピクセルカラー変位が位置決めされる。ピク
セルカラー変化の適切な選択が、スキュー角度を決定す
る非常に有効に使用できるライン端を含む一連の特徴を
作り出すことができる。 本発明の他の観点は、スキュー角度を決定する従来法
の他の問題が、特徴(基準点)位置のコンピュータによ
る決定法を含んでいることを認識することである。ベア
ード法によれば、マークをそれと認めなければならない
だけでなく、境界枠がマークのまわりに作られ、かつ、
境界枠の下方中心が位置決めされなければならない。 この観点は、さらに上述の問題が第1ラインの走査と
次に続くラインの走査との比較から基準点を決定するこ
とによって解決できることの発見に基づいていることで
ある。基準点の位置は、次の走査線上の対応する地形的
な特徴なしに、或いはそうでなければ前の走査線上に位
置する対応する地形的な特徴なしに、第1走査線上に位
置決めされた選ばれた地形的特徴の位置に対応する。こ
の点に関し、この明細書の説明の目的として、「地形
的」とは、マークの特徴を意味し、その画像或いはその
部分が例えば形状、大きさ、湾曲度、オーバーラップ等
のようなその幾何学的形状特徴に基づいている。この点
は、マークの特徴、その画像或いは部分がその幾何学的
形状に基づいてはおらず、例えばカラー陰影等のような
ある他の属性に基づいている「非地形的」特徴から識別
される。 本発明のさらに他の観点は、スキュー角度決定の従来
法が、テキスト画像のためのみ意味のある結果をもたら
すという認識にある。この点は基準点の位置を決定する
のに用いられる方法となる。境界枠がマークのまわりに
作られ、境界枠の下方中心が基準点として用いられる。
ベアードは、境界枠をテキストマークのまわりのみに作
るのに選んだ。この選択はテキストマークの位置が一致
されていること、及び非テキストマークが一致していな
いことを推測することに基づいてなされる。境界枠が非
テキストマークのまわりに作られた場合、マークから生
じた基準点はノイズとして現れ、スキュー角度を決定す
るのに必要とする重要なデータからそれてしまう。この
点から、本発明の観点が、スキュー角度決定がテキスト
或いは非テキスト画像に、或いは、テキストと非テキス
トの組み合わせたものに実行できることにあることにな
る。マーク自身の上に位置された基準点にスキューの決
定の基準を置くことによって、境界枠を作る必要がなく
なる。この観点から非テキストマークから生じる基準点
にはその結果に正確性が大きく加えられる。このように
して、従来技術のテキストの制限が克服される。 本発明のさらなる観点は、いかなる方法も圧縮された
フォーマット中の画像データをスキュー角度を決定する
のに用いていないという問題を認識することにある。こ
の観点は、本発明の他の観点に関係する。すなわち、マ
ーク、画像或いは圧縮されたフォーマット中のデータに
よって代表されるその画像或いはその一部におけるスキ
ュー角度決定を実行することが、多くの状況と多くの目
的に関して大変有利である。もし、それが排他的でなけ
れば、多くの最近のシステムが圧縮されたフォーマット
中で大きな比率でデータを処理すると仮定すると、現時
点では画像データを圧縮されたフォーマットに用いるス
キュー決定法のための技術が必要である。 したがって、本発明のさらに他の観点は、圧縮された
フォーマット中の画像データに基づいたスキュー角度決
定方法を提供することである。この点は、圧縮されたデ
ータフォーマット中に検出可能な特徴を用いることを含
意している。すなわち、実質上全てのバイナリ画像圧縮
システムが圧縮(例えばピクセルカラー変化)のために
走査された画像の物理的な特徴に用いる。データを用い
ることによって、これらの特徴を有することになり、画
像データを完全に圧縮することなしにスキュー角度を決
定することができる。 CCITTグループ4圧縮フォーマット(以後グループ4
という)は、ファクシミリの画像の伝送、ワークステー
ションとサーバ間の画像の中間伝送、光学媒体及び磁気
媒体上の記憶フォーマット及び他の適用のための規格と
なっている。圧縮アルゴリズムのソフトウェア実行は、
ある特定目的のVLSIハードウェア実行としても利用でき
る。例えば、アドバンスドマイクロデバイシズ(Advanc
ed Micro Devices)7971Aプロセッサは、CCITTフォーマ
ットに関するデータ圧縮/伸長のための専用回路であ
る。したがって、本発明の他の観点は、グループ4規格
によって圧縮された画像を使用するスキュー決定方法を
提供することである。 本発明のこの観点に関連して、非常に有効な結果が、
基準点の位置がスキュー決定に基づいたグループ4圧縮
によってもたらされる、いわゆる「パスコード」の位置
を用いることによって達成される。二つのタイプのパ
ス、すなわち白ピクセルのパスと黒ピクセルのパスが認
識されている。CCITTグループ4の圧縮規格では、これ
らの二つの間に差異はないが、本発明はさらに二つの観
点がある。第1に白ピクセルを表示するパスコードを選
択することによって、スキュー角度決定の正確度が大き
く改善されることを発見し、第2にスキュー角度決定に
よって二つのタイプのパスコード間を区別するための方
法を実行することである。 本発明の範囲及び従来のスキュー決定方法に関連する
問題に接近する方法は、付随する図面及び特許請求の範
囲と同時に見られるとき、以下の詳細な説明からより容
易に明らかになる。 第1A図は、従来技術の一つの方法によるスキューして
いない画像上の基準点の位置を示す。 第1B図は、前記従来技術の方法によるスキューした画
像上の基準点の位置を、整列していないビンへの基準点
の分布のプロットとともに示す。 第1C図は、第1B図に示される同じスキューした画像上
の基準点の位置を、整列したビンへの基準点の分布のプ
ロットとともに示す。 第2図は、本発明のスキュー角度決定方法による動作
が可能なコンピュータシステムの一部を示す。 第3A図から第3C図は、CCITTグループ4圧縮規格の三
つのエンコードモードを示す。 第4A図及び第4B図は、それぞれスキューしていない及
びスキューしたテキストでのCCITTグループ4圧縮規格
のパスコードに基づいた基準点の位置を示す。 第5A図及び第5B図は、それぞれスキューしていない及
びスキューしたテキストでのCCITTグループ4圧縮規格
のパスコードからの白パスコードに基づいた基準点の位
置を示す。 第6図は、本発明の一つの観点の流れ図を示す。 第7図は、本発明の他の観点の流れ図を示す。 第8図は、本発明の一つの観点の例として使用された
スキューしたテキストの一部を示す。 第9図は、本発明によるアライメント決定に使用され
た第8図のサンプルテキストに対応した白パスコードの
位置を示す。 第10図は、第8図のサンプルのスキューしたテキスト
に対応したアライメントの累乗のプロットを示す。 第11図は、多重スキュー角度を有するテキストに対応
したアライメントの累乗のプロットを示す。 以下、図示実施例を詳細に説明する。 これまでに述べた観点及び他の諸観点を用いた新規な
スキュー決定方法を説明する。本発明の方法は、特に走
査された画像中のスキューの決定に適用可能である。本
明細書において、画像データは、はっきりしたユニット
に、好ましくは画像のラインに分割されると仮定してい
る。この分割は、例えば画像を走査し、かつ、各走査ラ
インの始めと終わりに或いはライン全長に指示を挿入す
ることによって達成される。この方法は、当該技術とし
ては公知である。便宜上、このユニットは以後走査線と
呼ぶ。 普及の度合いが増してくると、走査された画像は圧縮
されたフォーマットで処理される。例えば、ファクシミ
リ装置は、実質上完全に圧縮されたフォーマットで走査
された画像で動作する。このため、本発明は画像データ
は、圧縮された形態(ここでは圧縮されたデータドキュ
メントとも呼ぶ)を仮定して説明する。 しかし、一つの技術として明白なのは、本発明が圧縮
されていない画像中の画像データにも同様に適用可能で
あることである。 第2図は、本発明が適用される環境のブロックフォー
マットを示す。特に第2図は、本発明の種々の観点に基
づいて動作するように組まれたコンピュータシステム50
の一部を示す。このコンピュータシステム50にはスキャ
ナ52が含まれるか、或いはシステムがスキャナからの出
力信号を受けるようにこれに接続されている。このスキ
ャナは画像を走査し、かつ、その画像を表すディジタル
データはプロセッサ54に連絡されている。このプロセッ
サは入力及び出力動作を制御するとともに、バス60を介
してプログラムメモリ56とデータメモリ58に連結されて
いる。 プログラムメモリ56は、特にスキャナ62によって画像
の走査を制御するためのルーチン62と、画像を表すディ
ジタルデータを圧縮されたデータフォーマットに変換す
るためのルーチン64と、この圧縮されたデータからスキ
ュー角度を決定するためのルーチン66を含んでいる。し
たがって、このプログラムメモリ56は、データメモリ58
と関連しており、特に記憶場所68において走査制御ルー
チン62の制御下でディジタルデータ構造がスキャナ52に
よって作られ、記憶場所70において走査画像の圧縮され
た描写のデータ構造が圧縮ルーチン64によって作られ、
記憶場所72において例えば基準点の位置のような選択さ
れたポイントデータを含むデータ構造がスキュー角度決
定ルーチン66によって作られる。プログラムメモリ56と
データメモリ58間の連結を容易にするために、入力と出
力動作がなされるようにして両者が互いにバス60によっ
て接続されている。メモリ56及び58に関して一つ付け加
ええる点は、これら両者を明確にする目的で別々に描か
れているが、実際には、本発明に影響を与えることなし
に、コンピュータシステムの単一のメモリブロックの一
部としてもよい。 プロセッサの制御下でスキュー検出ルーチン66がデー
タメモリ58の種々の部分にアクセスしてスキュー角度の
計算に必要なデータを得る。一度この計算がなされる
と、スキュー角度が出力部74に出力される。この出力部
は、CRT表示器のような結果を表示する手段と、ハード
コピープリンタ等からなるか、或いは結果をさらに別の
操作をするのに、例えば画像データの補正をスキュー等
の補正に用いるための手段からなる。 画像データは、グループ4基準に基づいて圧縮されて
きたと仮定されるが、適当な修正のなされた本発明は、
他の圧縮体系、例えばCCITT2次元グループ3フォーマッ
ト等を用いて同様の結果を作る。グループ4のコード体
系は、対をなす続いている走査線に見られるピクセルカ
ラーの変わり目の存在とその相対的間隔に依存してい
る。グループ4において、次いで各ラインがコード化さ
れると「コーディングライン」となり、かつその前の
「基準線」に関してコード化される。最初のラインが人
工的に規定された全白基準線に関してコード化される。
グループ4圧縮規格についてのより詳しい説明について
は、ハンター(Hunter)他による「国際ディジタルファ
クシミリコーディング規格」IEEE議事録,Vol.68,No.7,1
980年7月,pp854−867及び国際電気通信連合、CCITT
(国際電信電話諮問委員会)レッドブック,ジュネーブ
1985(ISBN92−61−02291−X)を参照するものとす
る。 グループ4フォーマット中のエンコーディングは、三
つのモード、すなわち垂直,水平,及びパスがある。こ
れら三つのモードは第3A図,第3B図及び第3C図に基づい
て次に説明する。近接する走査線が、例えば黒から白へ
の基準線上で第1ピクセルカラー変化があるかどうか、
コーディングライン上に対応するピクセルカラー変化
(すなわちこちらも黒から白)が存在するどうかを決定
するのに比較される。基準線上の変化からコーディング
ライン上の変化の存在と相対的間隔がモードの決定に用
いられる。 第3A図を参照して、垂直モードは近接する走査線上で
黒から白或いは白から黒への移り変わり何時が水平方向
に近接(≦3ピクセル)しているとき、従って少ないビ
ット数でエンコードされる場合に用いられる。水平モー
ドは、移り変わり位置が第3B図に示すように3ピクセル
よりも離れている場合に用いられる。パスモードは、基
準線上の移り変わりが第3C図に示すように、コーディン
グライン上に対応するものがない場合に用いられる。圧
縮されたデータは、特にコーディングラインとは反対に
基準線上で測定された偏位を意味する偏位と一緒にモー
ドコードを含んでいる。 第4A図、第4B図を参照して、ベアードが用いたマーク
のまわりの境界線上に配置された基準点の代わりに、本
発明はマークの地形的特徴の位置に基づいて基準点を位
置決めする。これら地形的特徴は、単にマーク自身の上
に位置される。特に、スキューは、画像のグループ4圧
縮表現中のパスコードの位置から決定される。スキュー
されていないテキスト及びスキューされたテキスト上の
パスコード基準点7bの位置は、それぞれ第4A図,第4B図
において「x」印で示される。 全てのパスコードは、マーク上のポイント(1点)に
図して規定されるので、スキューの範囲に拘わらず、全
ての基準点はマーク上のある点で位置決めされる。さら
に、一つ以上のパスコードがマークを表す圧縮されたデ
ータ中にあるので、1つのマークより一つ以上の基準点
があることになる。例えば、典型的なフォントスタイル
にとってはパスは大文字と小文字の関係にある「A」,
「H」,「K」等を含む多くの文字のベースラインに沿
って二つの位置に生じる。また上下のケース「M」のベ
ースラインに沿って三つの位置に生じる。 パスはエリアシングエラーとしても発生し、例えば第
4図に示すようにスキューされていない「G」のクロス
バーの下側及びスキューされていない「K」の右脚に見
られる。このようなエリアシングエラーを区別すること
は本発明の範囲外である。しかし、ある状況のエリアシ
ングエラーは有効で意味のある結果に結びつく。例え
ば、長い水平方向の構造がディジタル化されると、エリ
アシングエラーがしばしば発生する。このエリアシング
エラーの存在によって、黒から白への移り変わりを表す
パスコードを生ぜしめる結果となるので、長い水平線
は、そのコードが表出するアライメント中に全くあいま
いさを含まずに多数のパスコードを提供する。従って、
水平方向に整列された図形的構造が、それがエリアシン
グエラーを生じる傾向にあるために、スキュー角度の決
定を大きく改善する。ここで、つけ加えておかなければ
ならないのは、大きい非水平方向構造は、本発明の特性
を大きく低下させることはないということである。なぜ
なら、この構造は一般的にパスコードを生じるエリアシ
ングエラーに従属していないからであり、エリアシング
エラーがグループ4垂直モードを用いてエンコードされ
るためである。 二つのタイプのパス即ち白ピクセルのパスによる白パ
スと、黒ピクセルによる黒パスがある。白パスは黒構造
の底部を表すものであるから、たとえばライン端のよう
な処理されていないビットマップ中の関連要素の底部に
見られるものと幾分類似している。実際に、各関連要素
の底部において少なくとも一つのパスが保証される。従
って、白パスは基準点として用いるのは有利であるが、
当該技術においては、本発明に基づいて適当な状況にお
いて黒パスもスキュー角度を決定するのに用いることが
できることは明白である。スキューされていないテキス
ト及びスキューされたテキスト上の白パスコード基準点
78の位置をそれぞれ第5A図,第5B図に矢印で示す。 パスのグループ4エンコードは、白パスと黒パスを区
別していない。パスのどのカラーがエンコードされたか
を知るために、状態を維持しなければならない。本発明
によれば、状態は架空の完全な白の最初のラインに対応
して設定されたバイナリ状態ビットによって維持され
る。パスコードが生じるために、状態ビットが反転さ
れ、これによってパスコードの状態(すなわちカラー)
のランニングトラックが維持される。 第4A図,第4B図と第5A図,第5B図を比較すると、第5
図のテキストのベースラインに生じた基準点の数は、第
4図の基準点よりも少なくなっているのがわかる。たと
えば、第4A図,第4B図において文字「O」80では二つの
基準点すなわち上方ポイント82と下方ポイント84がある
ことが分かる。下方ポイント84はベースライン86上にあ
るが、上方ポイント82はベースライン上にない。第5A
図,第5B図において、同じ文字「O」80ではベースライ
ン90上に位置する単一の基準点88があるだけである。こ
れは図形的な表示で、白パスはアライメントによるスキ
ュー測定を基準とする基準点を提供するために有利であ
る。しかし、ある種の「ノイズ」が白パスを用いること
で発生する。すなわち発生したいくつかの基準点は、ベ
ースライン上には直接位置せず、ベースライン情報に加
えられる。例えば文字「C」は二つの白パスを生じるこ
とがあり、その一つはマークの底部にもう一つは文字
「C」の右側の開口部の上方限界を形成するストローク
の底部に生じる。同様にして、パスコードのもとになる
文字「M」の中心の底部がある種のフォントでベースラ
イン上にてないことがある。この種のノイズ信号を区別
することは本発明の範囲外である。しかし、このノイズ
信号の発生は統計上そうしばしば生じるものではなく、
スキュー角度決定の精度を大きく落とすものでもなく、
また計算時間が相当長くなるわけでもない。 第6図は第2図のプログラムメモリ56の実施例のブロ
ックダイヤグラムを示す。ルーチン66の出発点につき、
画像が走査されると仮定すると、ディジタルデータが走
査された画像に対応して発生され、このディジタルデー
タがグループ4圧縮データを生じるような選択されたデ
ータ圧縮方法に基づいて圧縮の処理が課せされる。 まず、例えばデータメモリ58の記憶場所72に記憶され
た圧縮された画像データのデータ構造中の白パスコード
が位置決めされる。これを第6図のボックス92で示す。
一度白パスコードが位置決めされると、適当な座標系の
位置が決定される。これをボックス94で示す。横軸x、
縦軸yを有する直角座標の座標対が一般的にこの目的と
して便利であるが、本発明の範囲内で、例えば極座標の
ような他の座標系もそれが適当な場合に用いることもで
きる。座標対アレイ96をコンピューティングアライメン
トで使用するために形成できる。これについては次に詳
しく説明する。白パスコードの位置の座標対を記憶した
後、走査されたページの終端が達したかどうかを決定す
るためにテストが98で行われる。もし到達しておれば、
次に詳しく説明するようにスキュー角度の決定が行われ
る。もし到達していなければ、ページ上にもし白パスコ
ードがあれば次操作のためにサーチが行われる。 前述の四つの工程92〜98は、座標決定ルーチン100と
して集合的に表される。走査決定ルーチン66はサブルー
チンとなり、次に走査決定ルーチン66はサブルーチンと
なり、次に第7図に基づいてさらに説明する。ブロック
101はグループ4圧縮フォーマット中のデータの入力を
表す。x−y座標対を用いて、xとyをまずページとス
タートを表す0におく。この様子を工程102で示し、各
々の新しい走査されたページのスタートにおいて行う。 ブロック103は、グループ4コードの検出を表す。こ
れまでに説明したように、三つのタイプのグループ4コ
ード、すなわち水平、垂直及びパスのコードがある。前
述したCCITTレッドブックを参照する。検出グループ4
コードがキャラクタ列認識によって実行できる。当該技
術範囲内のこれ以外の種々の方法でもコード検出でき
る。一度グループ4コードが検出されると、そのタイプ
を決定する必要がある。すなわち、三つのグループ4タ
イプのうちのどれであるか、つまりパスコードか白パス
コードか或いは黒パスコードであるか決定しなければな
らない。この工程は一連のテストによって行われ、その
結果でx座標がどのように決定されたかが決定される。
x座標がxの前回値に相当すると、座標決定ルーチン10
0を通る直前のパス中の工程103によって位置決めされた
コードと関連し、新しいx値に相当すると、座標決定ル
ーチン100を通る今回のパス中の工程103によって位置決
めされたコードと関連する。 コードが位置決めされると、このコードが水平コード
であるかどうかを決定するためにテストが課される。も
しそうであれば、xの新しい値はxの古い値に、水平コ
ードに関する偏位値を加えたものとなる。すなわち、グ
ループ4の水平モードはモードを示すコードと、基準ピ
クセルカラーの移り目と今回ピクセルカラーの移り目と
の間のピクセル数を示す偏位を含んでいる。水平コード
の場合、この偏位は特定ライン上ピクセルカラーの移り
目と同じライン上の次のピクセルカラーの移り目との間
のピクセル数になる。この状態を106で示す。 注目したい重要な点は、xのこの新しい値はアライメ
ントを決定するのに用いる横座標値にはならないことで
ある。というよりはむしろこの値は走査線上の第1ピク
セル位置から偏位したランニング値である。白パスコー
ドに関係するx値のみがアライメント決定に用いられ
る。 水平コードが検出されたと仮定された時期を求めるた
めに2進ピクセルカラー状態ビットが122でインクリメ
ントされる。この操作を行う方法と目的を次に詳しく説
明する。一度xの新しい値が計算されると、xは108で
チェックされ、ライン端が到達されたかどうかが決定さ
れる。この操作はピクセル中でxを走査線の公知の長さ
と比較することによって好適に行うことができ、xがこ
の値に達するとライン端が検出されたことになる。ライ
ン端が到達していなければ、このラインにつきコード検
出が103にて続行される。ライン端が到達すると、xは
次のラインの始まりに対応して110にて0に設定され、
ライン数のランニングカウントを保持しているyが1だ
けインクリメントされ、111でチェックされてページ端
が到達したかどうかが決定される。この決定は、xにつ
いてはyをページ当たりの公知のライン数との比較によ
り行い、yがこの値に達すれば、ページ端が検出された
ことになる。ページ端に到達すると、多数のアライメン
ト角度を通過した種々のアライメントのための累乗が12
6で決定される。これについては、次に詳しく説明す
る。ページ端に到達していなければ、コード検出が103
で再開される。 コードが水平でないと決定されると、垂直コードであ
るかどうかを112でテストする必要がある。垂直モード
中の基準線上の値として用いるために種々のラインから
なる移り変わり位置を記憶する必要がある。この操作は
{x1r,x2r,・・・xnr}形式の配列で行われる。ここに
rは基準線(前の走査線)上の値を示し、nは基準線上
の全コード数である。前のラインにつきx値を保持すれ
ばよいだけであるから、新しいx値は一度決定された古
い値に上書きできる。この操作は114で示される。 垂直コードが検出されたと仮定すると、xに対する値
は次のようにして116で計算される。垂直モードは基準
線とのピクセルbiにおけるピクセル移り目との間の偏位
からコード化される。この偏位の計算にはx値のみ関係
するので、この屁には単に|xbi−xai|で簡単に計算でき
る。ここにxbi及びxaiは各々ピクセルbiとaiにおけるx
値である。新しいx値は古いx値にこの偏位を加えたも
のである。再度、2進のピクセルカラー状態ビットが12
2でインクリメントされ、新しいx値が108でテストされ
ラインの終端が達したかどうかが決定され、ページの終
端が到達していれば112で決定されるようにして次々実
行される。 検出されたコードが104,112でのテストに失敗する
と、コードは消去工程によってパスコードになる。すで
に説明したように、白パスコードと黒パスコードを区別
するのは重要である。白パスコードはアライメントの決
定に用いれられるが、黒パスコードはこれに用いられな
い。グループ4は白パスコードと黒パスコードを区別し
ないので、2進ピクセルのトラックを保持して、118に
おけるカラー状態ビットの状態を決定する。まず最初
に、状態ビットが112において0に設定される。任意
に、0が白パスコードに対応して運ばれる。コードが検
出される毎に状態ビットがチェックされる。状態ビット
が0でない、すなわち、パスコードが白パスコードでな
い場合、xの新しい値が120においてxの古い値と等し
く設定される。次に現れるコードがパスコードでないと
仮定すると、次のコードは、次のxを正しく計算するの
に必要な必要情報を連想できる。次に現れるコードがパ
スコードであれば、コードがパスコードでないものが現
れるまで処理が繰り返される。この工程はグループ4パ
スコードの最も重要な部分である。引き続いて、xの新
しい値が120で設定され、状態ビットが次に現れるパス
コードのために122で増幅される。 状態がビットが0に等しいと決定されると、白パスコ
ードが現れたことになる。この白パスコードの位置は、
アライメントの累乗を計算する目的と、いくつかのアラ
イメント角度の両端を掃引する次に説明する転換工程の
ために保持しなければならない。この工程は、第2図の
データメモリ58の選択されたポイントデータ記憶場所で
72で行われる。白パスコードの記憶場所の保持は124で
行われる。次いで、xが設定され、前述したように状態
ビットがインクリメントされ、ライン端とページ端がチ
ェックされる。 第6図に戻り、この説明はライン端が達したと仮定し
て続けられる。もしそのような場合、累乗は参照番号12
6で示した部所で異なるアライメント角度を有する複数
のアライメントにつき決定しなければならない。まず最
初にアライメント角度が128にて0に設定される。この
アライメントはその画像が走査されたアライメントに対
応している。このアライメント角度につきアライメント
の累乗が概して上述したようにして計算される。この場
合、一つのコールがデータメモリ58の記憶場所72でなさ
れ、そこに記憶されたx値の数値が各ラインにつき決定
される。この様子が各ラインごとのビンのサイズを表し
ている。各ラインにおけるx値の数の2乗が、130で配
列に累計され、現在のアライメント角度でのアライメン
トの累乗が表される。2乗の配列が、132で、現在のア
ライメント角度と共に、データメモリ58の一部に記憶さ
れる。 次いで、アライメント角度が134にて例えば1度のよ
うな選択された大きさだけインクリメントされる。アラ
イメントの累乗は、アライメント角度の範囲内のアライ
メントにつき決定される。アライメント角度の範囲の選
択は、たとえばアライメント角度の予想される範囲、ア
ライメントの予想される強さ、アライメントの予想され
る数等の多数の要素に依存している。アライメント角度
の値が大きくなればなるほど、任意の角度の増大のため
の計算時間が長くなる。いずれにしても、スキュー角度
の範囲の一例は−40から+40度となる。したがって、一
度インクリメントされると現在のアライメント角度が、
選択された範囲外にあるかどうかを決定するテストをす
る必要がある。これが136で行われる。現在のアライメ
ント角度が選択された範囲外になければ、白パスコード
の位置が138で翻訳される。翻訳のいくつかの方法とし
て、パスコードの記憶場所の有無、その適用可能性が使
用された座標系に依存しているか、メモリの大きさが利
用可能か、要求されている計算速度が等々がある。一例
を挙げると、 xj=x cos α−y sin α yj=x sin α−y cos α 現在のアライメント角度が選択範囲外にある場合に
は、次いで、前もって格納された種々のアライメントの
累乗と比較されることにより最大出力が決定される。こ
の最大累乗は、次いで、種々の形式で、たとえば、絶対
角度、それらの累乗を伴った角度のスペクトルで142に
出力される。出力の形式は、前述したように結果の使用
意図に依存する。以下、本発明の特定の例について説明
する。 例 第8図に示されているのは、本発明の方法をテストす
るために使用されたサンプルテキストである。ビンサイ
ズは、ディジタル画像(すなわち、画像の幅を横切って
垂直位置に1ピクセル分だけ相違して)における最小検
知可能スキューを反映して、二つのピクセルに設定され
る。同じ理由により、角度増分サイズは、このスレショ
ルド以下にスキュー角度を分解するための試みがなされ
ないように、制限される。アライメントは、+/−80度
の範囲にわたって測定される。 第8図のサンプルのスキューしたテキストのための白
パスコード位置が第9図に示されている。これらを白パ
スコードは、種々の回転アライメントを計算するために
使用される。第10図は、第8図のこれらの白パス基準用
のアライメント関係の関数としての累乗を示す。スキュ
ー角度は、角度が水平の0度指示から相違する累乗ピー
クに比例しているので、第10図のプロットから図式的に
決定される。 第10図の三つの破線で示された円弧に注目する。最も
内側の円弧は、基準点が整列されなかった場合に予測さ
れる累乗レベルを示す。次の円弧は、80度にわたって走
査した場合の平均累乗レベルを示す。最も外側の円弧
は、ピーク累乗レベルを示す。これらの円弧は、累乗計
算アルゴリズムにより決定されるように、ピーク累乗の
統計的な特徴を表している。 ベアードのようなアライメント方法が、画像の圧縮さ
れた表現であるグループ4の白パスの位置に対応してい
る基準点に適用された場合、基礎になる画像においてス
キュー角度を決定する効率的で正確な手段が得られる。 テスト CCITTテストデータによる本システムのテストによれ
ば、本発明は、殆どの場合にスキュー角度検出特性にお
いて顕著な改善を示している。幾つかのCCITTテストフ
ァイル(cc1からcc8)は、付録1に示されており、ベア
ードの方法と本方法との間のスキュー角度検出特性の比
較が、第1表に示されている。各例においては、両方の
スキュー角度検出アルゴリズムは生のビットマップに適
用され、仮想のスキューしていない画像におけるアルゴ
リズムにより検出されたスキューの量を決定する。次い
で、ビットマップは、ディジタル的に、−3.0度から+
5.0度まで回転され、スキュー角度決定が再度実行され
る。 上記テストの注目すべき結果は、テキストであれ非テ
キストであれ、マークを分類するステップが取り除かれ
ることである。実際、本発明によれば、主に非テキスト
的であるcc2のような画像に対して非常に適切で正確な
結果が得られる。この結果は、スキュー角度が決定され
ている構造に明白に結びついている基準点から出る高い
スキュー角度において特に重要である。 ハーフトーン領域はグループ4勧告の非圧縮モードを
使用してエンコードされるべきであり、また、パスコー
ドの使用に関わりがないので、非直交スクリーン角度で
のハーフトーンの存在は、本発明のアルゴリズムの特性
を劣化させることがない。それにも拘わらず、本技術に
おけるハーフトーン材料の存在の効果は未だテストされ
たことがない。 累乗分布の形状の特徴記述は、ページ画像における単
純なスキュー角度の支配に関して有効な一般化を導くこ
とができる。第11図を参照すれば、多重井戸で規定され
たピークは、ソース画像における多重井戸で表されたア
ライメントの指示である。このような多重アライメント
を決定する方法は、単一のアライメントを有する画像の
スキューを決定する方法から実質的に相違がない。 本発明は、全ページ画像にわたる主要なスキュー角度
に関して一般化するように設計されている。しかし、多
重スキュー角度は、広告コピーや不適正に糊つけされた
加工品において生じ得る。このような場合、依然この技
術は全画像について一般化することができ、この一般化
は、画像の特徴記述において有用であったりそうでなか
ったりする。相対的なスキュー角度が、広告コピーにお
けるように大きなところでは、ページ画像に対する単一
スキュー角度特性の指定は意味がないけれども、糊つけ
エラーの場合には、単一スキュー角度決定は、単なる単
純な利用可能な手段と同様に、画像を表すのには十分で
ある。 このように、本発明は、スキュー角度を決定する目的
のために、画像の特徴、特に地形的な特徴を、位置決め
し、選択して利用するための方法を開示している。本発
明は、従来技術で詳細に述べられた方法よりもずっと計
算が簡単になる。本発明はまた、安価なデータ圧縮パッ
ケージの広い範囲の利用及びこれらのパッケージを一つ
のシステムに統合する簡単さの点で有利である。 一般に、本発明に関連する当業者にとって、本発明の
構造上の種々の変更、種々に異なった実施態様及び応用
が、本発明の精神及び範囲から離れることなくなしう
る。このように、ここでの開示及び記述は、例を挙げて
説明されたが、これに限定する意図はないものである。
めの画像の分析方法に関し、より詳しくは、画像中のマ
ークのスキュー角を示すデータを得るために、マークを
含む画像を画定する画像データを操作してコンピュータ
に取り入れられた画像を分析する方法に関するものであ
る。 人間の目は、直角からごく僅かな偏位を検出すること
ができ、エリアシング(aliasing)エラーに起因する不
連続性がこれらの偏位に注意を引きつける簡単な構造の
ディジタル画像においては特にそうである。テキストや
複雑なグラフィック画像のスキューに対する人間の感覚
に関する有効な情報はほとんどない。明確な特徴のある
座標フレーム中に情報が現れる場合、スキュー角度は一
貫してかつ相当に過大評価される。スキューがあるとい
うことは、審美学上喜ばしいことではなく、かつ実用的
効果もない。スキューの存在は、一つ或いはそれ以上の
コーナーが、スキューのためにスキャナの視野から外方
に外れることにより、画像の全てのソース域の捕獲が失
敗することになる。スキューした画像は、ページ座標系
に正確に記録されているのと同じくらいには、迅速に或
いはコンパクトに圧縮されない。スキューされたフィー
ルドは、例えば刈り込み(cropping)や挿入のような標
準のページレイアウトや合成操作に用いるのはより困難
である。 スキューは、ディジタル化の時か或いはとりわけフォ
トコピー時におけるディジタル化の前のいずれかにおい
て、紙を供給するに際しての困難さを含むいくつかの場
合に生じてくる。再生が、ディジタル走査と、これによ
り得られるビットマップのプリントによってもたらされ
る電子写真複写環境においては、スキュー角度の早くて
正確な検出が、スキュー画像の修正と記録するための資
源の必要性を充分に縮小することが可能である。 スキュー角度検出は、伝統的に2工程で行われる。ま
ず第1に、アライメントの質が基本となっている特徴が
決定され、次いで企てられたアライメントが前のサンプ
ルアライメント或いは他の基準に関して優れているかど
うかを決定するために種々のテストが課せられる。ここ
でいう「アライメント」とは画像の要素の方向付けのこ
とである。 現在に至るまで、スキュー角度の決定は、圧縮状態で
の画像データで達成されてきた。ここで「画像」とはパ
ターン或いは識別可能域の集合を意味し、画像、表示か
或いはこのどちらでもないか、典型的であるが、排他的
ではなしに、プリントされたページに見いだされるもの
である。「画像データ」とは、適当なシステムによって
画像の再生に用いられる、典型的であるが、排他的では
ないフォーマット中のディジタルな画像のことをいう。
「圧縮された」フォーマット中のデータとは、ここでは
「圧縮されていない」フォーマット中のデータから、デ
ータを記憶する必要のある例えばビットによるメモリス
ペースの大きさに縮小されることを意味する。この場
合、データを圧縮するのに用いられる方法は問わない。
圧縮された画像データからのスキュー角度の決定は、現
在まで考察されてきていない。或いはもし考察されてき
ているとしても、圧縮された画像データ上からスキュー
を決定する操作には必要以上のことであり、かつ、決定
的に画像を圧縮されたデータフォーマットに変換するの
は不必要な工程であるという一般的な考えの下にかたず
けられてきている。 圧縮されていない画像のスキュー角度を決定する技術
としては、ヘンリー・エス・ベアード(Henry S.Bair
d)による「印刷物のスキュー角度」と題するハイブリ
ッド画像システムに関するSPSEシンポジウム議事録,pp2
1〜24,1987(以後、ベアードという)に開示されている
ものを参照する。まず最初に、ベアードは、マーク或い
はテキストである関連要素とテキストでない要素と識別
をしなければならない。この点に関し、この明細書の目
的としての「テキスト」マークすなわち関連要素は、文
字、数字、句読点及び関連する符号からなる。この「テ
キスト」マークは「非テキスト」マーク或いはテキスト
ではない典型的にはグラフィックス、シンボル或いは画
像の描写のような部分である関連要素と識別されてい
る。基準点を位置決めに用いる方法として、ベアード技
術はテキスト画像にとって意味のある結果を生じるのみ
である。テキストとしてのこの分類は、テキストマーク
の最大寸法が予め定められた最大フォントサイズ、例え
ば24ポイント中の「em」以下、ないしこれと同等である
ことに基づいてベアードによって作られたものである。 ベアード技術のアライメントアルゴリズムは、各マー
ク或いは関連する要素に関係した選ばれた特徴のアライ
メントに基づいて作用する。「マーク」は、関連する要
素として用いるものとする。「関連する要素」は、本願
明細書の目的として、一連のカラー付きユニット、典型
的には互いに関連する同様の色の画素(「ピクセル」)
に定義される。この目的で普通用いられる特徴は「基準
点」である。ここで用いる「基準点」は予め定められた
一連のルール(各マークにつき同じルール)によって位
置決めされ、かつマークの特徴を表現する選ばれた目的
のために用いられるマークのポイント或いは関連するマ
ークのポイントである。例えば、ベアードは基準点とし
て各マークのまわりに境界となるボックス(枠)の下方
中心に用いている。ベアードの基準点10は第1A図のマー
ク14のまわりの境界線12上の十字線として示される。 英語のテキストの完全に一直線上にある水平線におい
て、例えば各基準点は文字のベース(ベースラインと呼
ぶ)で同じ水平線16上に位置する。ただし、例えば第1A
図の文字「i」、ある種の句読点及びたれ下り文字、つ
まりマークの一部がベースラインより下に下がってい
る、例えば文字「g」「p」等は別である。基準点が各
関連要素に指定されているので、ドット付き文字「i」
と「j」及び多くの句読点マーク(;?:")は一文字当た
り一つ以上の基準点が生じることになり、これら基準点
のうちの少なくとも一つがベースラインに対して大きく
ずれてしまう。たれ下がりを有する文字は基準点から離
れて形成されるが、ベースラインの近くにはある。たれ
下がり文字は統計的にはそう普通ではなく、ベアードの
方法(及び本発明は発明においても)は真のベースライ
ンを決定する効果を認識し、補正するための手段を提供
する。注目したいのは、画像中の一つの関連要素当たり
の基準点は正確には一つであるということである。 本質的には、ベアードは、交換するアライメントに変
化のために一つの「ライン」当たりの基準点の数を決定
することによってスキューを計算した。ここで用いるラ
インは例えばドキュメント(書類)を横切る走査線及び
例えばマージン或いはページエッジのような選択された
特徴に垂直に方向付けられた想像上の複数の走査線の一
つを意味する。回転アライメントは、基準点の三角法に
よって計算される。 第1B図、第1C図を参照して、1本のライン当たりの基
準点の数の数え方は、矢印pで示される投影方向と鉛直
なアキュムレータライン18上に基準点10の位置を投影す
ることによって達成される。アキュムレータライン18
は、例えば6点文字の高さの1/3に等しい均一の予め定
められたhの「ビン」20に区分される。高さhは適当に
変えることができる。高さhは2ピクセルと同じくらい
に小さくすることもできる。しかし、hが小さくなるに
つれて、計算時間が長くなる。重要なのはhが文字の高
さに近づくとスキュー角度決定性能が劣化することであ
る。ビンについて説明すると、1本のライン当たり正確
に一つのビンである。選択されたラインのための基準点
の数は、そのラインに対応するビンに投影される基準点
の数と等しくなる。 この方法は、比較的少ない基準点(画像の性質によっ
て決まる)となるので、アライメントは1よりも大きい
正の累乗の和、例えば回転してアラインされたビン中に
現れる基準点のカウントの2(二乗の和)に基づいたア
ライメントの計算によって効果的になされる。分布の変
動は、スキュー角度が決定されるアライメントの「累
乗」指数となるカウントの二乗の和を最大にすることに
よって最大にされる。第1B図は、基準点10の位置及びビ
ンがスキューされたテキストと一致していないスキュー
されたテキストサンプル上の各ビン20の相対的な大きさ
を示す。第1C図は第1B図の同じスキューされた画像の基
準点の一致したビンへの分布を示す。 アライメントの各変動の累乗の計算には、各基準点の
位置がわかっていることが必要である。すなわち基準点
の座標は、原点からの角度と偏位によって基準点を新し
い一連の座標に数学的に変換するのに用いられる。この
工程は基準点を完全に収集するために行われ、この変換
の前後におけるアライメントの累乗が比較される。各々
の比較から最大の累乗を有するアライメントに対応する
角度が保持される。選ばれた範囲内の全ての角度上にア
ライメントがこの方法によって比較された後、スキュー
角度が最大の累乗を有するアライメントに対応する角度
とみなされる。しかし、アライメントが弱いか或いは多
重アライメントの場合、この仮定は別の方法で証明する
必要がある。 本発明は、従来技術の種々の問題点や欠点を解消する
新規なスキュー角度決定方法を提供する。 本発明の一つの観点は、スキュー角度が大きくなるに
従って、マークの底部と境界枠の底部との間の距離が大
きくなるという、ベアードのスキュー角度決定方法にお
ける問題を見つけることにある。この距離の差は、スキ
ューの角度の正弦の関数として大きくなる。この点が基
準点のカウント中の誤差となり、この誤差の二乗として
スキュー角度の決定に影響を与える。 この観点は、さらにベアード法の問題は、マーク自身
の上に位置される基準点に基づいたスキュー角度を決定
することによって解決できることを見つけることに基づ
いている。 本発明のこの観点に関連した点としては、ラインの端
がスキュー決定の基準となる有効な一連の特徴を形成す
ることを発見することである。特に有効な一連の特徴
は、水平方向に向けられた画像のためのベースライン
に、或いはこれの近くに配置されたラインの端々或いは
垂直な或いは円柱方向に付けられた画像のための垂直ラ
インである。包括的な画像中のライン端の検出は困難は
仕事であることが立証されている。しかし、一つの方法
が発見され、かつ一連のライン端を含む一連の特徴を検
出する本発明の他の観点が形成された。一連の特徴は、
使用するライン端の有効性が少なくなるような大きさに
限定される。一つの走査線を続く走査線と比較すること
によって、ピクセルカラー変位が位置決めされる。ピク
セルカラー変化の適切な選択が、スキュー角度を決定す
る非常に有効に使用できるライン端を含む一連の特徴を
作り出すことができる。 本発明の他の観点は、スキュー角度を決定する従来法
の他の問題が、特徴(基準点)位置のコンピュータによ
る決定法を含んでいることを認識することである。ベア
ード法によれば、マークをそれと認めなければならない
だけでなく、境界枠がマークのまわりに作られ、かつ、
境界枠の下方中心が位置決めされなければならない。 この観点は、さらに上述の問題が第1ラインの走査と
次に続くラインの走査との比較から基準点を決定するこ
とによって解決できることの発見に基づいていることで
ある。基準点の位置は、次の走査線上の対応する地形的
な特徴なしに、或いはそうでなければ前の走査線上に位
置する対応する地形的な特徴なしに、第1走査線上に位
置決めされた選ばれた地形的特徴の位置に対応する。こ
の点に関し、この明細書の説明の目的として、「地形
的」とは、マークの特徴を意味し、その画像或いはその
部分が例えば形状、大きさ、湾曲度、オーバーラップ等
のようなその幾何学的形状特徴に基づいている。この点
は、マークの特徴、その画像或いは部分がその幾何学的
形状に基づいてはおらず、例えばカラー陰影等のような
ある他の属性に基づいている「非地形的」特徴から識別
される。 本発明のさらに他の観点は、スキュー角度決定の従来
法が、テキスト画像のためのみ意味のある結果をもたら
すという認識にある。この点は基準点の位置を決定する
のに用いられる方法となる。境界枠がマークのまわりに
作られ、境界枠の下方中心が基準点として用いられる。
ベアードは、境界枠をテキストマークのまわりのみに作
るのに選んだ。この選択はテキストマークの位置が一致
されていること、及び非テキストマークが一致していな
いことを推測することに基づいてなされる。境界枠が非
テキストマークのまわりに作られた場合、マークから生
じた基準点はノイズとして現れ、スキュー角度を決定す
るのに必要とする重要なデータからそれてしまう。この
点から、本発明の観点が、スキュー角度決定がテキスト
或いは非テキスト画像に、或いは、テキストと非テキス
トの組み合わせたものに実行できることにあることにな
る。マーク自身の上に位置された基準点にスキューの決
定の基準を置くことによって、境界枠を作る必要がなく
なる。この観点から非テキストマークから生じる基準点
にはその結果に正確性が大きく加えられる。このように
して、従来技術のテキストの制限が克服される。 本発明のさらなる観点は、いかなる方法も圧縮された
フォーマット中の画像データをスキュー角度を決定する
のに用いていないという問題を認識することにある。こ
の観点は、本発明の他の観点に関係する。すなわち、マ
ーク、画像或いは圧縮されたフォーマット中のデータに
よって代表されるその画像或いはその一部におけるスキ
ュー角度決定を実行することが、多くの状況と多くの目
的に関して大変有利である。もし、それが排他的でなけ
れば、多くの最近のシステムが圧縮されたフォーマット
中で大きな比率でデータを処理すると仮定すると、現時
点では画像データを圧縮されたフォーマットに用いるス
キュー決定法のための技術が必要である。 したがって、本発明のさらに他の観点は、圧縮された
フォーマット中の画像データに基づいたスキュー角度決
定方法を提供することである。この点は、圧縮されたデ
ータフォーマット中に検出可能な特徴を用いることを含
意している。すなわち、実質上全てのバイナリ画像圧縮
システムが圧縮(例えばピクセルカラー変化)のために
走査された画像の物理的な特徴に用いる。データを用い
ることによって、これらの特徴を有することになり、画
像データを完全に圧縮することなしにスキュー角度を決
定することができる。 CCITTグループ4圧縮フォーマット(以後グループ4
という)は、ファクシミリの画像の伝送、ワークステー
ションとサーバ間の画像の中間伝送、光学媒体及び磁気
媒体上の記憶フォーマット及び他の適用のための規格と
なっている。圧縮アルゴリズムのソフトウェア実行は、
ある特定目的のVLSIハードウェア実行としても利用でき
る。例えば、アドバンスドマイクロデバイシズ(Advanc
ed Micro Devices)7971Aプロセッサは、CCITTフォーマ
ットに関するデータ圧縮/伸長のための専用回路であ
る。したがって、本発明の他の観点は、グループ4規格
によって圧縮された画像を使用するスキュー決定方法を
提供することである。 本発明のこの観点に関連して、非常に有効な結果が、
基準点の位置がスキュー決定に基づいたグループ4圧縮
によってもたらされる、いわゆる「パスコード」の位置
を用いることによって達成される。二つのタイプのパ
ス、すなわち白ピクセルのパスと黒ピクセルのパスが認
識されている。CCITTグループ4の圧縮規格では、これ
らの二つの間に差異はないが、本発明はさらに二つの観
点がある。第1に白ピクセルを表示するパスコードを選
択することによって、スキュー角度決定の正確度が大き
く改善されることを発見し、第2にスキュー角度決定に
よって二つのタイプのパスコード間を区別するための方
法を実行することである。 本発明の範囲及び従来のスキュー決定方法に関連する
問題に接近する方法は、付随する図面及び特許請求の範
囲と同時に見られるとき、以下の詳細な説明からより容
易に明らかになる。 第1A図は、従来技術の一つの方法によるスキューして
いない画像上の基準点の位置を示す。 第1B図は、前記従来技術の方法によるスキューした画
像上の基準点の位置を、整列していないビンへの基準点
の分布のプロットとともに示す。 第1C図は、第1B図に示される同じスキューした画像上
の基準点の位置を、整列したビンへの基準点の分布のプ
ロットとともに示す。 第2図は、本発明のスキュー角度決定方法による動作
が可能なコンピュータシステムの一部を示す。 第3A図から第3C図は、CCITTグループ4圧縮規格の三
つのエンコードモードを示す。 第4A図及び第4B図は、それぞれスキューしていない及
びスキューしたテキストでのCCITTグループ4圧縮規格
のパスコードに基づいた基準点の位置を示す。 第5A図及び第5B図は、それぞれスキューしていない及
びスキューしたテキストでのCCITTグループ4圧縮規格
のパスコードからの白パスコードに基づいた基準点の位
置を示す。 第6図は、本発明の一つの観点の流れ図を示す。 第7図は、本発明の他の観点の流れ図を示す。 第8図は、本発明の一つの観点の例として使用された
スキューしたテキストの一部を示す。 第9図は、本発明によるアライメント決定に使用され
た第8図のサンプルテキストに対応した白パスコードの
位置を示す。 第10図は、第8図のサンプルのスキューしたテキスト
に対応したアライメントの累乗のプロットを示す。 第11図は、多重スキュー角度を有するテキストに対応
したアライメントの累乗のプロットを示す。 以下、図示実施例を詳細に説明する。 これまでに述べた観点及び他の諸観点を用いた新規な
スキュー決定方法を説明する。本発明の方法は、特に走
査された画像中のスキューの決定に適用可能である。本
明細書において、画像データは、はっきりしたユニット
に、好ましくは画像のラインに分割されると仮定してい
る。この分割は、例えば画像を走査し、かつ、各走査ラ
インの始めと終わりに或いはライン全長に指示を挿入す
ることによって達成される。この方法は、当該技術とし
ては公知である。便宜上、このユニットは以後走査線と
呼ぶ。 普及の度合いが増してくると、走査された画像は圧縮
されたフォーマットで処理される。例えば、ファクシミ
リ装置は、実質上完全に圧縮されたフォーマットで走査
された画像で動作する。このため、本発明は画像データ
は、圧縮された形態(ここでは圧縮されたデータドキュ
メントとも呼ぶ)を仮定して説明する。 しかし、一つの技術として明白なのは、本発明が圧縮
されていない画像中の画像データにも同様に適用可能で
あることである。 第2図は、本発明が適用される環境のブロックフォー
マットを示す。特に第2図は、本発明の種々の観点に基
づいて動作するように組まれたコンピュータシステム50
の一部を示す。このコンピュータシステム50にはスキャ
ナ52が含まれるか、或いはシステムがスキャナからの出
力信号を受けるようにこれに接続されている。このスキ
ャナは画像を走査し、かつ、その画像を表すディジタル
データはプロセッサ54に連絡されている。このプロセッ
サは入力及び出力動作を制御するとともに、バス60を介
してプログラムメモリ56とデータメモリ58に連結されて
いる。 プログラムメモリ56は、特にスキャナ62によって画像
の走査を制御するためのルーチン62と、画像を表すディ
ジタルデータを圧縮されたデータフォーマットに変換す
るためのルーチン64と、この圧縮されたデータからスキ
ュー角度を決定するためのルーチン66を含んでいる。し
たがって、このプログラムメモリ56は、データメモリ58
と関連しており、特に記憶場所68において走査制御ルー
チン62の制御下でディジタルデータ構造がスキャナ52に
よって作られ、記憶場所70において走査画像の圧縮され
た描写のデータ構造が圧縮ルーチン64によって作られ、
記憶場所72において例えば基準点の位置のような選択さ
れたポイントデータを含むデータ構造がスキュー角度決
定ルーチン66によって作られる。プログラムメモリ56と
データメモリ58間の連結を容易にするために、入力と出
力動作がなされるようにして両者が互いにバス60によっ
て接続されている。メモリ56及び58に関して一つ付け加
ええる点は、これら両者を明確にする目的で別々に描か
れているが、実際には、本発明に影響を与えることなし
に、コンピュータシステムの単一のメモリブロックの一
部としてもよい。 プロセッサの制御下でスキュー検出ルーチン66がデー
タメモリ58の種々の部分にアクセスしてスキュー角度の
計算に必要なデータを得る。一度この計算がなされる
と、スキュー角度が出力部74に出力される。この出力部
は、CRT表示器のような結果を表示する手段と、ハード
コピープリンタ等からなるか、或いは結果をさらに別の
操作をするのに、例えば画像データの補正をスキュー等
の補正に用いるための手段からなる。 画像データは、グループ4基準に基づいて圧縮されて
きたと仮定されるが、適当な修正のなされた本発明は、
他の圧縮体系、例えばCCITT2次元グループ3フォーマッ
ト等を用いて同様の結果を作る。グループ4のコード体
系は、対をなす続いている走査線に見られるピクセルカ
ラーの変わり目の存在とその相対的間隔に依存してい
る。グループ4において、次いで各ラインがコード化さ
れると「コーディングライン」となり、かつその前の
「基準線」に関してコード化される。最初のラインが人
工的に規定された全白基準線に関してコード化される。
グループ4圧縮規格についてのより詳しい説明について
は、ハンター(Hunter)他による「国際ディジタルファ
クシミリコーディング規格」IEEE議事録,Vol.68,No.7,1
980年7月,pp854−867及び国際電気通信連合、CCITT
(国際電信電話諮問委員会)レッドブック,ジュネーブ
1985(ISBN92−61−02291−X)を参照するものとす
る。 グループ4フォーマット中のエンコーディングは、三
つのモード、すなわち垂直,水平,及びパスがある。こ
れら三つのモードは第3A図,第3B図及び第3C図に基づい
て次に説明する。近接する走査線が、例えば黒から白へ
の基準線上で第1ピクセルカラー変化があるかどうか、
コーディングライン上に対応するピクセルカラー変化
(すなわちこちらも黒から白)が存在するどうかを決定
するのに比較される。基準線上の変化からコーディング
ライン上の変化の存在と相対的間隔がモードの決定に用
いられる。 第3A図を参照して、垂直モードは近接する走査線上で
黒から白或いは白から黒への移り変わり何時が水平方向
に近接(≦3ピクセル)しているとき、従って少ないビ
ット数でエンコードされる場合に用いられる。水平モー
ドは、移り変わり位置が第3B図に示すように3ピクセル
よりも離れている場合に用いられる。パスモードは、基
準線上の移り変わりが第3C図に示すように、コーディン
グライン上に対応するものがない場合に用いられる。圧
縮されたデータは、特にコーディングラインとは反対に
基準線上で測定された偏位を意味する偏位と一緒にモー
ドコードを含んでいる。 第4A図、第4B図を参照して、ベアードが用いたマーク
のまわりの境界線上に配置された基準点の代わりに、本
発明はマークの地形的特徴の位置に基づいて基準点を位
置決めする。これら地形的特徴は、単にマーク自身の上
に位置される。特に、スキューは、画像のグループ4圧
縮表現中のパスコードの位置から決定される。スキュー
されていないテキスト及びスキューされたテキスト上の
パスコード基準点7bの位置は、それぞれ第4A図,第4B図
において「x」印で示される。 全てのパスコードは、マーク上のポイント(1点)に
図して規定されるので、スキューの範囲に拘わらず、全
ての基準点はマーク上のある点で位置決めされる。さら
に、一つ以上のパスコードがマークを表す圧縮されたデ
ータ中にあるので、1つのマークより一つ以上の基準点
があることになる。例えば、典型的なフォントスタイル
にとってはパスは大文字と小文字の関係にある「A」,
「H」,「K」等を含む多くの文字のベースラインに沿
って二つの位置に生じる。また上下のケース「M」のベ
ースラインに沿って三つの位置に生じる。 パスはエリアシングエラーとしても発生し、例えば第
4図に示すようにスキューされていない「G」のクロス
バーの下側及びスキューされていない「K」の右脚に見
られる。このようなエリアシングエラーを区別すること
は本発明の範囲外である。しかし、ある状況のエリアシ
ングエラーは有効で意味のある結果に結びつく。例え
ば、長い水平方向の構造がディジタル化されると、エリ
アシングエラーがしばしば発生する。このエリアシング
エラーの存在によって、黒から白への移り変わりを表す
パスコードを生ぜしめる結果となるので、長い水平線
は、そのコードが表出するアライメント中に全くあいま
いさを含まずに多数のパスコードを提供する。従って、
水平方向に整列された図形的構造が、それがエリアシン
グエラーを生じる傾向にあるために、スキュー角度の決
定を大きく改善する。ここで、つけ加えておかなければ
ならないのは、大きい非水平方向構造は、本発明の特性
を大きく低下させることはないということである。なぜ
なら、この構造は一般的にパスコードを生じるエリアシ
ングエラーに従属していないからであり、エリアシング
エラーがグループ4垂直モードを用いてエンコードされ
るためである。 二つのタイプのパス即ち白ピクセルのパスによる白パ
スと、黒ピクセルによる黒パスがある。白パスは黒構造
の底部を表すものであるから、たとえばライン端のよう
な処理されていないビットマップ中の関連要素の底部に
見られるものと幾分類似している。実際に、各関連要素
の底部において少なくとも一つのパスが保証される。従
って、白パスは基準点として用いるのは有利であるが、
当該技術においては、本発明に基づいて適当な状況にお
いて黒パスもスキュー角度を決定するのに用いることが
できることは明白である。スキューされていないテキス
ト及びスキューされたテキスト上の白パスコード基準点
78の位置をそれぞれ第5A図,第5B図に矢印で示す。 パスのグループ4エンコードは、白パスと黒パスを区
別していない。パスのどのカラーがエンコードされたか
を知るために、状態を維持しなければならない。本発明
によれば、状態は架空の完全な白の最初のラインに対応
して設定されたバイナリ状態ビットによって維持され
る。パスコードが生じるために、状態ビットが反転さ
れ、これによってパスコードの状態(すなわちカラー)
のランニングトラックが維持される。 第4A図,第4B図と第5A図,第5B図を比較すると、第5
図のテキストのベースラインに生じた基準点の数は、第
4図の基準点よりも少なくなっているのがわかる。たと
えば、第4A図,第4B図において文字「O」80では二つの
基準点すなわち上方ポイント82と下方ポイント84がある
ことが分かる。下方ポイント84はベースライン86上にあ
るが、上方ポイント82はベースライン上にない。第5A
図,第5B図において、同じ文字「O」80ではベースライ
ン90上に位置する単一の基準点88があるだけである。こ
れは図形的な表示で、白パスはアライメントによるスキ
ュー測定を基準とする基準点を提供するために有利であ
る。しかし、ある種の「ノイズ」が白パスを用いること
で発生する。すなわち発生したいくつかの基準点は、ベ
ースライン上には直接位置せず、ベースライン情報に加
えられる。例えば文字「C」は二つの白パスを生じるこ
とがあり、その一つはマークの底部にもう一つは文字
「C」の右側の開口部の上方限界を形成するストローク
の底部に生じる。同様にして、パスコードのもとになる
文字「M」の中心の底部がある種のフォントでベースラ
イン上にてないことがある。この種のノイズ信号を区別
することは本発明の範囲外である。しかし、このノイズ
信号の発生は統計上そうしばしば生じるものではなく、
スキュー角度決定の精度を大きく落とすものでもなく、
また計算時間が相当長くなるわけでもない。 第6図は第2図のプログラムメモリ56の実施例のブロ
ックダイヤグラムを示す。ルーチン66の出発点につき、
画像が走査されると仮定すると、ディジタルデータが走
査された画像に対応して発生され、このディジタルデー
タがグループ4圧縮データを生じるような選択されたデ
ータ圧縮方法に基づいて圧縮の処理が課せされる。 まず、例えばデータメモリ58の記憶場所72に記憶され
た圧縮された画像データのデータ構造中の白パスコード
が位置決めされる。これを第6図のボックス92で示す。
一度白パスコードが位置決めされると、適当な座標系の
位置が決定される。これをボックス94で示す。横軸x、
縦軸yを有する直角座標の座標対が一般的にこの目的と
して便利であるが、本発明の範囲内で、例えば極座標の
ような他の座標系もそれが適当な場合に用いることもで
きる。座標対アレイ96をコンピューティングアライメン
トで使用するために形成できる。これについては次に詳
しく説明する。白パスコードの位置の座標対を記憶した
後、走査されたページの終端が達したかどうかを決定す
るためにテストが98で行われる。もし到達しておれば、
次に詳しく説明するようにスキュー角度の決定が行われ
る。もし到達していなければ、ページ上にもし白パスコ
ードがあれば次操作のためにサーチが行われる。 前述の四つの工程92〜98は、座標決定ルーチン100と
して集合的に表される。走査決定ルーチン66はサブルー
チンとなり、次に走査決定ルーチン66はサブルーチンと
なり、次に第7図に基づいてさらに説明する。ブロック
101はグループ4圧縮フォーマット中のデータの入力を
表す。x−y座標対を用いて、xとyをまずページとス
タートを表す0におく。この様子を工程102で示し、各
々の新しい走査されたページのスタートにおいて行う。 ブロック103は、グループ4コードの検出を表す。こ
れまでに説明したように、三つのタイプのグループ4コ
ード、すなわち水平、垂直及びパスのコードがある。前
述したCCITTレッドブックを参照する。検出グループ4
コードがキャラクタ列認識によって実行できる。当該技
術範囲内のこれ以外の種々の方法でもコード検出でき
る。一度グループ4コードが検出されると、そのタイプ
を決定する必要がある。すなわち、三つのグループ4タ
イプのうちのどれであるか、つまりパスコードか白パス
コードか或いは黒パスコードであるか決定しなければな
らない。この工程は一連のテストによって行われ、その
結果でx座標がどのように決定されたかが決定される。
x座標がxの前回値に相当すると、座標決定ルーチン10
0を通る直前のパス中の工程103によって位置決めされた
コードと関連し、新しいx値に相当すると、座標決定ル
ーチン100を通る今回のパス中の工程103によって位置決
めされたコードと関連する。 コードが位置決めされると、このコードが水平コード
であるかどうかを決定するためにテストが課される。も
しそうであれば、xの新しい値はxの古い値に、水平コ
ードに関する偏位値を加えたものとなる。すなわち、グ
ループ4の水平モードはモードを示すコードと、基準ピ
クセルカラーの移り目と今回ピクセルカラーの移り目と
の間のピクセル数を示す偏位を含んでいる。水平コード
の場合、この偏位は特定ライン上ピクセルカラーの移り
目と同じライン上の次のピクセルカラーの移り目との間
のピクセル数になる。この状態を106で示す。 注目したい重要な点は、xのこの新しい値はアライメ
ントを決定するのに用いる横座標値にはならないことで
ある。というよりはむしろこの値は走査線上の第1ピク
セル位置から偏位したランニング値である。白パスコー
ドに関係するx値のみがアライメント決定に用いられ
る。 水平コードが検出されたと仮定された時期を求めるた
めに2進ピクセルカラー状態ビットが122でインクリメ
ントされる。この操作を行う方法と目的を次に詳しく説
明する。一度xの新しい値が計算されると、xは108で
チェックされ、ライン端が到達されたかどうかが決定さ
れる。この操作はピクセル中でxを走査線の公知の長さ
と比較することによって好適に行うことができ、xがこ
の値に達するとライン端が検出されたことになる。ライ
ン端が到達していなければ、このラインにつきコード検
出が103にて続行される。ライン端が到達すると、xは
次のラインの始まりに対応して110にて0に設定され、
ライン数のランニングカウントを保持しているyが1だ
けインクリメントされ、111でチェックされてページ端
が到達したかどうかが決定される。この決定は、xにつ
いてはyをページ当たりの公知のライン数との比較によ
り行い、yがこの値に達すれば、ページ端が検出された
ことになる。ページ端に到達すると、多数のアライメン
ト角度を通過した種々のアライメントのための累乗が12
6で決定される。これについては、次に詳しく説明す
る。ページ端に到達していなければ、コード検出が103
で再開される。 コードが水平でないと決定されると、垂直コードであ
るかどうかを112でテストする必要がある。垂直モード
中の基準線上の値として用いるために種々のラインから
なる移り変わり位置を記憶する必要がある。この操作は
{x1r,x2r,・・・xnr}形式の配列で行われる。ここに
rは基準線(前の走査線)上の値を示し、nは基準線上
の全コード数である。前のラインにつきx値を保持すれ
ばよいだけであるから、新しいx値は一度決定された古
い値に上書きできる。この操作は114で示される。 垂直コードが検出されたと仮定すると、xに対する値
は次のようにして116で計算される。垂直モードは基準
線とのピクセルbiにおけるピクセル移り目との間の偏位
からコード化される。この偏位の計算にはx値のみ関係
するので、この屁には単に|xbi−xai|で簡単に計算でき
る。ここにxbi及びxaiは各々ピクセルbiとaiにおけるx
値である。新しいx値は古いx値にこの偏位を加えたも
のである。再度、2進のピクセルカラー状態ビットが12
2でインクリメントされ、新しいx値が108でテストされ
ラインの終端が達したかどうかが決定され、ページの終
端が到達していれば112で決定されるようにして次々実
行される。 検出されたコードが104,112でのテストに失敗する
と、コードは消去工程によってパスコードになる。すで
に説明したように、白パスコードと黒パスコードを区別
するのは重要である。白パスコードはアライメントの決
定に用いれられるが、黒パスコードはこれに用いられな
い。グループ4は白パスコードと黒パスコードを区別し
ないので、2進ピクセルのトラックを保持して、118に
おけるカラー状態ビットの状態を決定する。まず最初
に、状態ビットが112において0に設定される。任意
に、0が白パスコードに対応して運ばれる。コードが検
出される毎に状態ビットがチェックされる。状態ビット
が0でない、すなわち、パスコードが白パスコードでな
い場合、xの新しい値が120においてxの古い値と等し
く設定される。次に現れるコードがパスコードでないと
仮定すると、次のコードは、次のxを正しく計算するの
に必要な必要情報を連想できる。次に現れるコードがパ
スコードであれば、コードがパスコードでないものが現
れるまで処理が繰り返される。この工程はグループ4パ
スコードの最も重要な部分である。引き続いて、xの新
しい値が120で設定され、状態ビットが次に現れるパス
コードのために122で増幅される。 状態がビットが0に等しいと決定されると、白パスコ
ードが現れたことになる。この白パスコードの位置は、
アライメントの累乗を計算する目的と、いくつかのアラ
イメント角度の両端を掃引する次に説明する転換工程の
ために保持しなければならない。この工程は、第2図の
データメモリ58の選択されたポイントデータ記憶場所で
72で行われる。白パスコードの記憶場所の保持は124で
行われる。次いで、xが設定され、前述したように状態
ビットがインクリメントされ、ライン端とページ端がチ
ェックされる。 第6図に戻り、この説明はライン端が達したと仮定し
て続けられる。もしそのような場合、累乗は参照番号12
6で示した部所で異なるアライメント角度を有する複数
のアライメントにつき決定しなければならない。まず最
初にアライメント角度が128にて0に設定される。この
アライメントはその画像が走査されたアライメントに対
応している。このアライメント角度につきアライメント
の累乗が概して上述したようにして計算される。この場
合、一つのコールがデータメモリ58の記憶場所72でなさ
れ、そこに記憶されたx値の数値が各ラインにつき決定
される。この様子が各ラインごとのビンのサイズを表し
ている。各ラインにおけるx値の数の2乗が、130で配
列に累計され、現在のアライメント角度でのアライメン
トの累乗が表される。2乗の配列が、132で、現在のア
ライメント角度と共に、データメモリ58の一部に記憶さ
れる。 次いで、アライメント角度が134にて例えば1度のよ
うな選択された大きさだけインクリメントされる。アラ
イメントの累乗は、アライメント角度の範囲内のアライ
メントにつき決定される。アライメント角度の範囲の選
択は、たとえばアライメント角度の予想される範囲、ア
ライメントの予想される強さ、アライメントの予想され
る数等の多数の要素に依存している。アライメント角度
の値が大きくなればなるほど、任意の角度の増大のため
の計算時間が長くなる。いずれにしても、スキュー角度
の範囲の一例は−40から+40度となる。したがって、一
度インクリメントされると現在のアライメント角度が、
選択された範囲外にあるかどうかを決定するテストをす
る必要がある。これが136で行われる。現在のアライメ
ント角度が選択された範囲外になければ、白パスコード
の位置が138で翻訳される。翻訳のいくつかの方法とし
て、パスコードの記憶場所の有無、その適用可能性が使
用された座標系に依存しているか、メモリの大きさが利
用可能か、要求されている計算速度が等々がある。一例
を挙げると、 xj=x cos α−y sin α yj=x sin α−y cos α 現在のアライメント角度が選択範囲外にある場合に
は、次いで、前もって格納された種々のアライメントの
累乗と比較されることにより最大出力が決定される。こ
の最大累乗は、次いで、種々の形式で、たとえば、絶対
角度、それらの累乗を伴った角度のスペクトルで142に
出力される。出力の形式は、前述したように結果の使用
意図に依存する。以下、本発明の特定の例について説明
する。 例 第8図に示されているのは、本発明の方法をテストす
るために使用されたサンプルテキストである。ビンサイ
ズは、ディジタル画像(すなわち、画像の幅を横切って
垂直位置に1ピクセル分だけ相違して)における最小検
知可能スキューを反映して、二つのピクセルに設定され
る。同じ理由により、角度増分サイズは、このスレショ
ルド以下にスキュー角度を分解するための試みがなされ
ないように、制限される。アライメントは、+/−80度
の範囲にわたって測定される。 第8図のサンプルのスキューしたテキストのための白
パスコード位置が第9図に示されている。これらを白パ
スコードは、種々の回転アライメントを計算するために
使用される。第10図は、第8図のこれらの白パス基準用
のアライメント関係の関数としての累乗を示す。スキュ
ー角度は、角度が水平の0度指示から相違する累乗ピー
クに比例しているので、第10図のプロットから図式的に
決定される。 第10図の三つの破線で示された円弧に注目する。最も
内側の円弧は、基準点が整列されなかった場合に予測さ
れる累乗レベルを示す。次の円弧は、80度にわたって走
査した場合の平均累乗レベルを示す。最も外側の円弧
は、ピーク累乗レベルを示す。これらの円弧は、累乗計
算アルゴリズムにより決定されるように、ピーク累乗の
統計的な特徴を表している。 ベアードのようなアライメント方法が、画像の圧縮さ
れた表現であるグループ4の白パスの位置に対応してい
る基準点に適用された場合、基礎になる画像においてス
キュー角度を決定する効率的で正確な手段が得られる。 テスト CCITTテストデータによる本システムのテストによれ
ば、本発明は、殆どの場合にスキュー角度検出特性にお
いて顕著な改善を示している。幾つかのCCITTテストフ
ァイル(cc1からcc8)は、付録1に示されており、ベア
ードの方法と本方法との間のスキュー角度検出特性の比
較が、第1表に示されている。各例においては、両方の
スキュー角度検出アルゴリズムは生のビットマップに適
用され、仮想のスキューしていない画像におけるアルゴ
リズムにより検出されたスキューの量を決定する。次い
で、ビットマップは、ディジタル的に、−3.0度から+
5.0度まで回転され、スキュー角度決定が再度実行され
る。 上記テストの注目すべき結果は、テキストであれ非テ
キストであれ、マークを分類するステップが取り除かれ
ることである。実際、本発明によれば、主に非テキスト
的であるcc2のような画像に対して非常に適切で正確な
結果が得られる。この結果は、スキュー角度が決定され
ている構造に明白に結びついている基準点から出る高い
スキュー角度において特に重要である。 ハーフトーン領域はグループ4勧告の非圧縮モードを
使用してエンコードされるべきであり、また、パスコー
ドの使用に関わりがないので、非直交スクリーン角度で
のハーフトーンの存在は、本発明のアルゴリズムの特性
を劣化させることがない。それにも拘わらず、本技術に
おけるハーフトーン材料の存在の効果は未だテストされ
たことがない。 累乗分布の形状の特徴記述は、ページ画像における単
純なスキュー角度の支配に関して有効な一般化を導くこ
とができる。第11図を参照すれば、多重井戸で規定され
たピークは、ソース画像における多重井戸で表されたア
ライメントの指示である。このような多重アライメント
を決定する方法は、単一のアライメントを有する画像の
スキューを決定する方法から実質的に相違がない。 本発明は、全ページ画像にわたる主要なスキュー角度
に関して一般化するように設計されている。しかし、多
重スキュー角度は、広告コピーや不適正に糊つけされた
加工品において生じ得る。このような場合、依然この技
術は全画像について一般化することができ、この一般化
は、画像の特徴記述において有用であったりそうでなか
ったりする。相対的なスキュー角度が、広告コピーにお
けるように大きなところでは、ページ画像に対する単一
スキュー角度特性の指定は意味がないけれども、糊つけ
エラーの場合には、単一スキュー角度決定は、単なる単
純な利用可能な手段と同様に、画像を表すのには十分で
ある。 このように、本発明は、スキュー角度を決定する目的
のために、画像の特徴、特に地形的な特徴を、位置決め
し、選択して利用するための方法を開示している。本発
明は、従来技術で詳細に述べられた方法よりもずっと計
算が簡単になる。本発明はまた、安価なデータ圧縮パッ
ケージの広い範囲の利用及びこれらのパッケージを一つ
のシステムに統合する簡単さの点で有利である。 一般に、本発明に関連する当業者にとって、本発明の
構造上の種々の変更、種々に異なった実施態様及び応用
が、本発明の精神及び範囲から離れることなくなしう
る。このように、ここでの開示及び記述は、例を挙げて
説明されたが、これに限定する意図はないものである。
【図面の簡単な説明】
第1A図は、従来技術の一つの方法によるスキューしてい
ない画像上の基準点の位置を示す。 第1B図は、前記従来技術の方法によるスキューした画像
上の基準点の位置を、整列していないビンへの基準点の
分布のプロットとともに示す。 第1C図は、第1B図に示される同じスキューした画像上の
基準点の位置を、整列したビンへの基準点の分布のプロ
ットとともに示す。 第2図は、本発明のスキュー角度決定方法による動作が
可能なコンピュータシステムの一部を示す。 第3A図から第3C図は、CCITTグループ4圧縮規格の三つ
のエンコードモードを示す。 第4A図及び第4B図は、それぞれスキューしていない及び
スキューしたテキストでのCCITTグループ4圧縮規格の
パスコードに基づいた基準点の位置を示す。 第5A図及び第5B図は、それぞれスキューしていない及び
スキューしたテキストでのCCITTグループ4圧縮規格の
パスコードからの白パスコードに基づいた基準点の位置
を示す。 第6図は、本発明の一つの観点の流れ図を示す。 第7図は、本発明の他の観点の流れ図を示す。 第8図は、本発明の一つの観点の例として使用されたス
キューしたテキストの一部を示す。 第9図は、本発明によるアライメント決定に使用された
第8図のサンプルテキストに対応した白パスコードの位
置を示す。 第10図は、第8図のサンプルのスキューしたテキストに
対応したアライメントの累乗のプロットを示す。 第11図は、多重スキュー角度を有するテキストに対応し
たアライメントの累乗のプロットを示す。 50:コンピュータシステム 52:スキャナ、54:プロセッサ 56:プログラムメモリ、58:データメモリ 60:バス、74:出力部
ない画像上の基準点の位置を示す。 第1B図は、前記従来技術の方法によるスキューした画像
上の基準点の位置を、整列していないビンへの基準点の
分布のプロットとともに示す。 第1C図は、第1B図に示される同じスキューした画像上の
基準点の位置を、整列したビンへの基準点の分布のプロ
ットとともに示す。 第2図は、本発明のスキュー角度決定方法による動作が
可能なコンピュータシステムの一部を示す。 第3A図から第3C図は、CCITTグループ4圧縮規格の三つ
のエンコードモードを示す。 第4A図及び第4B図は、それぞれスキューしていない及び
スキューしたテキストでのCCITTグループ4圧縮規格の
パスコードに基づいた基準点の位置を示す。 第5A図及び第5B図は、それぞれスキューしていない及び
スキューしたテキストでのCCITTグループ4圧縮規格の
パスコードからの白パスコードに基づいた基準点の位置
を示す。 第6図は、本発明の一つの観点の流れ図を示す。 第7図は、本発明の他の観点の流れ図を示す。 第8図は、本発明の一つの観点の例として使用されたス
キューしたテキストの一部を示す。 第9図は、本発明によるアライメント決定に使用された
第8図のサンプルテキストに対応した白パスコードの位
置を示す。 第10図は、第8図のサンプルのスキューしたテキストに
対応したアライメントの累乗のプロットを示す。 第11図は、多重スキュー角度を有するテキストに対応し
たアライメントの累乗のプロットを示す。 50:コンピュータシステム 52:スキャナ、54:プロセッサ 56:プログラムメモリ、58:データメモリ 60:バス、74:出力部
Claims (1)
- (57)【特許請求の範囲】 【請求項1】画像中のマークのスキュー角を示すデータ
を得るために、マークを含む画像を規定する画像データ
を走査してコンピュータに取り入れられた画像を分析す
る方法であって、 前記スキュー角度は一連のアライメントの中から選択さ
れた一つのアライメントに対応する角度として決定され
るもので、 前記の一連のアライメントのそれぞれは、前記選択の基
とするための累乗値を有し、 それぞれのアライメントの累乗値は、アライメントのた
めの選択された特性のライン毎のカウント数から算出さ
れ、 前記の画像データは、パスコードを含む圧縮されたフォ
ーマット中のものであり、ピクセルカラーの移り目のポ
イントを示すパスコードを含む形式のものである画像の
分析方法において、 画像データ中の白ピクセルのパスを示すパスコードを決
定し、 白ピクセルのパスを示すパスコードの位置をX−Y座標
を用いて決定し、 前記選択された特性として、白ピクセルのパスを示すパ
スコードのX座標値を選び、 一つのアライメントを選択し、 前記アライメントにおいて、白ピクセルのパスを示すパ
スコードのX座標値の数を2乗することによってアライ
メントの累乗値を算出し、前記アライメントのグループ
の中からの一つのアライメントの選択がこの算出された
アライメントの累乗値に基づいて選択されるようにした
作業手順を有する画像の分析方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US07/454,339 US5245676A (en) | 1989-12-21 | 1989-12-21 | Determination of image skew angle from data including data in compressed form |
US454339 | 1989-12-21 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH03201866A JPH03201866A (ja) | 1991-09-03 |
JP3390000B2 true JP3390000B2 (ja) | 2003-03-24 |
Family
ID=23804223
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP34121190A Expired - Fee Related JP3390000B2 (ja) | 1989-12-21 | 1990-11-30 | 画像の分析方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US5245676A (ja) |
EP (1) | EP0434415B1 (ja) |
JP (1) | JP3390000B2 (ja) |
DE (1) | DE69032344T2 (ja) |
Families Citing this family (42)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5979768A (en) * | 1988-01-14 | 1999-11-09 | Intermec I.P. Corp. | Enhanced bar code resolution through relative movement of sensor and object |
US6681994B1 (en) | 1988-08-31 | 2004-01-27 | Intermec Ip Corp. | Method and apparatus for optically reading information |
US6889903B1 (en) | 1988-08-31 | 2005-05-10 | Intermec Ip Corp. | Method and apparatus for optically reading information |
US6688523B1 (en) | 1988-08-31 | 2004-02-10 | Intermec Ip Corp. | System for reading optical indicia |
US5245676A (en) * | 1989-12-21 | 1993-09-14 | Xerox Corporation | Determination of image skew angle from data including data in compressed form |
US6373997B1 (en) | 1991-07-30 | 2002-04-16 | Xerox Corporation | Coarse and fine skew measurement |
JP3238504B2 (ja) * | 1991-12-05 | 2001-12-17 | ゼロックス・コーポレーション | 書類分類方法 |
JP3233981B2 (ja) * | 1992-05-26 | 2001-12-04 | オリンパス光学工業株式会社 | シンボル情報読取装置 |
JP3253356B2 (ja) * | 1992-07-06 | 2002-02-04 | 株式会社リコー | 文書画像の領域識別方法 |
GB2273383A (en) * | 1992-12-10 | 1994-06-15 | Ibm | Character recognition |
JP3050007B2 (ja) * | 1993-08-26 | 2000-06-05 | ミノルタ株式会社 | 画像読取装置およびこれを備えた画像形成装置 |
US5410417A (en) * | 1994-02-10 | 1995-04-25 | Motorola, Inc. | Method and apparatus for correcting an angle of an optical image for improving the efficiency of facsimile encoding of the image |
EP0811946A3 (en) * | 1994-04-15 | 1998-01-14 | Canon Kabushiki Kaisha | Image pre-processor for character recognition system |
US5638466A (en) * | 1995-08-30 | 1997-06-10 | Horizon Marketing Corporation Aka Wordwand | Method and apparatus for deskewing images of symbols having a non-linear baseline |
JP3006466B2 (ja) | 1995-09-28 | 2000-02-07 | 日本電気株式会社 | 文字入力装置 |
US5867612A (en) * | 1996-03-27 | 1999-02-02 | Xerox Corporation | Method and apparatus for the fast scaling of an image |
US5901253A (en) * | 1996-04-04 | 1999-05-04 | Hewlett-Packard Company | Image processing system with image cropping and skew correction |
US6104834A (en) * | 1996-08-01 | 2000-08-15 | Ricoh Company Limited | Matching CCITT compressed document images |
GB9711022D0 (en) | 1997-05-28 | 1997-07-23 | Rank Xerox Ltd | Text/image selection from document images |
JP3471578B2 (ja) * | 1997-08-29 | 2003-12-02 | シャープ株式会社 | 行方向判定装置、画像傾き検出装置及び画像傾き補正装置 |
KR100264331B1 (ko) * | 1998-05-26 | 2000-08-16 | 윤종용 | 원고 비틀림 보정 장치 및 방법 |
US6549680B1 (en) * | 1998-06-23 | 2003-04-15 | Xerox Corporation | Method and apparatus for deskewing and despeckling of images |
US7305617B2 (en) * | 2000-02-12 | 2007-12-04 | Adobe Systems Incorporated | Method for aligning text to baseline grids and to CJK character grids |
JP2002358514A (ja) | 2000-12-14 | 2002-12-13 | Ricoh Co Ltd | 画像歪み補正装置、プログラム、記憶媒体、画像歪み補正方法、画像読取装置および画像形成装置 |
JP2003115039A (ja) | 2001-07-11 | 2003-04-18 | Ricoh Co Ltd | 文書ファイリング装置、文書ファイリング方法、プログラムおよび記憶媒体 |
US7206104B2 (en) * | 2002-02-12 | 2007-04-17 | Chun-Hung Lee | Method for automatically determining document position in a scanner window |
US7499806B2 (en) * | 2002-02-14 | 2009-03-03 | Illumina, Inc. | Image processing in microsphere arrays |
US7305612B2 (en) * | 2003-03-31 | 2007-12-04 | Siemens Corporate Research, Inc. | Systems and methods for automatic form segmentation for raster-based passive electronic documents |
US6914700B2 (en) | 2003-04-17 | 2005-07-05 | Lexmark International, Inc. | Method for reducing migrating residual error in error diffusion halftoning |
TWI236838B (en) * | 2004-04-22 | 2005-07-21 | Avision Inc | Image acquisition device and method capable of rotating document images |
US20060039627A1 (en) * | 2004-08-21 | 2006-02-23 | Xerox Corporation | Real-time processing of grayscale image data |
US7515772B2 (en) * | 2004-08-21 | 2009-04-07 | Xerox Corp | Document registration and skew detection system |
US7391930B2 (en) * | 2004-12-17 | 2008-06-24 | Primax Electronics Ltd. | Angle de-skew device and method thereof |
US8023155B2 (en) * | 2005-03-31 | 2011-09-20 | Hubin Jiang | Imaging system with quality audit capability |
NO20052656D0 (no) | 2005-06-02 | 2005-06-02 | Lumex As | Geometrisk bildetransformasjon basert pa tekstlinjesoking |
WO2008079748A1 (en) * | 2006-12-20 | 2008-07-03 | Cytyc Corporation | Method and system for locating and focusing on fiducial marks on specimen slides |
US8160393B2 (en) * | 2008-09-18 | 2012-04-17 | Certifi Media Inc. | Method for image skew detection |
WO2011001439A2 (en) | 2009-07-02 | 2011-01-06 | Hewlett-Packard Development Company, L.P. | Skew detection |
KR101621848B1 (ko) * | 2009-12-14 | 2016-06-01 | 삼성전자주식회사 | 화상처리장치 및 방법 |
JP6642833B2 (ja) * | 2016-10-28 | 2020-02-12 | 京セラドキュメントソリューションズ株式会社 | 画像処理装置 |
CN110198842B (zh) * | 2017-01-31 | 2021-01-12 | 惠普发展公司,有限责任合伙企业 | 基于直接存储器访问的硬件偏斜校正 |
US11455762B2 (en) * | 2017-12-14 | 2022-09-27 | Adobe Inc. | Text border tool and enhanced corner options for background shading |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3831146A (en) * | 1973-03-19 | 1974-08-20 | Ibm | Optimum scan angle determining means |
US4251799A (en) * | 1979-03-30 | 1981-02-17 | International Business Machines Corporation | Optical character recognition using baseline information |
DE3065583D1 (en) * | 1979-06-26 | 1983-12-22 | Ibm | Device for determining the optimum scanning angle of printed matter |
JPS5887652A (ja) * | 1981-11-19 | 1983-05-25 | Ricoh Co Ltd | 画像処理装置 |
JPS58134368A (ja) * | 1982-02-05 | 1983-08-10 | Ricoh Co Ltd | 文書画像処理装置 |
US4558461A (en) * | 1983-06-17 | 1985-12-10 | Litton Systems, Inc. | Text line bounding system |
US4723297A (en) * | 1984-09-27 | 1988-02-02 | Siemens Aktiengesellschaft | Method for automatic correction of character skew in the acquisition of a text original in the form of digital scan results |
JPS62267610A (ja) * | 1986-05-16 | 1987-11-20 | Fuji Electric Co Ltd | 対象パタ−ンの回転角検出方式 |
US4876730A (en) * | 1987-02-25 | 1989-10-24 | Lundy Electronics & Systems, Inc. | Optical character reader with skew recognition |
JPS63268081A (ja) * | 1987-04-17 | 1988-11-04 | インタ−ナショナル・ビジネス・マシ−ンズ・コ−ポレ−ション | 文書の文字を認識する方法及び装置 |
JPS6478381A (en) * | 1987-09-21 | 1989-03-23 | Toshiba Corp | Picture processing method |
JPS6482286A (en) * | 1987-09-25 | 1989-03-28 | Toshiba Corp | Image inclination detector |
WO1989005495A1 (en) * | 1987-12-02 | 1989-06-15 | Eastman Kodak Company | Skew detector for digital image processing system |
US4866784A (en) * | 1987-12-02 | 1989-09-12 | Eastman Kodak Company | Skew detector for digital image processing system |
US5001766A (en) * | 1988-05-16 | 1991-03-19 | At&T Bell Laboratories | Apparatus and method for skew control of document images |
US5187753A (en) * | 1989-12-08 | 1993-02-16 | Xerox Corporation | Method and apparatus for identification and correction of document skew |
US5245676A (en) * | 1989-12-21 | 1993-09-14 | Xerox Corporation | Determination of image skew angle from data including data in compressed form |
-
1989
- 1989-12-21 US US07/454,339 patent/US5245676A/en not_active Expired - Fee Related
-
1990
- 1990-11-30 JP JP34121190A patent/JP3390000B2/ja not_active Expired - Fee Related
- 1990-12-20 DE DE69032344T patent/DE69032344T2/de not_active Expired - Fee Related
- 1990-12-20 EP EP90313970A patent/EP0434415B1/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
EP0434415A2 (en) | 1991-06-26 |
JPH03201866A (ja) | 1991-09-03 |
US5245676A (en) | 1993-09-14 |
EP0434415B1 (en) | 1998-05-27 |
DE69032344D1 (de) | 1998-07-02 |
DE69032344T2 (de) | 1998-12-03 |
EP0434415A3 (en) | 1991-11-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3390000B2 (ja) | 画像の分析方法 | |
US6016361A (en) | Method and apparatus for compressing binary data using pattern matching encoding | |
US5506918A (en) | Document skew detection/control system for printed document images containing a mixture of pure text lines and non-text portions | |
US7460710B2 (en) | Converting digital images containing text to token-based files for rendering | |
US7813572B2 (en) | Compressing and restoring method of image data including a free microdot image element, a print dot image element, and a line picture image element | |
US6813381B2 (en) | Method and apparatus for identification of documents, and computer product | |
JP4732250B2 (ja) | 情報処理装置、制御方法、およびコンピュータプログラム | |
US6327384B1 (en) | Character recognition apparatus and method for recognizing characters | |
CN103177249B (zh) | 图像处理装置和图像处理方法 | |
JPH07192086A (ja) | 画像傾き検出方法 | |
JPH09185715A (ja) | 統合同値類の作成方法 | |
JP4098845B2 (ja) | テキストのバイナリー画像から抽出されたシンボルを比較する方法 | |
JP3238504B2 (ja) | 書類分類方法 | |
JP4125273B2 (ja) | 画像処理装置及びその方法、プログラム | |
US6748115B1 (en) | Perceptually lossless image compression | |
US8081188B2 (en) | Image delivering apparatus and image delivery method | |
JP3303246B2 (ja) | 画像処理装置 | |
JP2004242075A (ja) | 画像処理装置および方法 | |
JPH0512438A (ja) | ハフ変換による線分抽出方法 | |
JPH08212292A (ja) | 枠線認識装置 | |
JPH10507014A (ja) | 2進イメージにおけるランドスケープ・スキャンの自動決定 | |
JPH0728934A (ja) | 文書画像処理装置 | |
Okun et al. | Experimental tool for generating ground truths for skewed page images | |
JP2011193294A (ja) | 文書画像処理装置、文書画像処理方法および文書画像処理プログラム | |
JPH0480889A (ja) | 文字切り出し方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Cancellation because of no payment of annual fees |