JP3091478B2 - 文書のスキュー識別法及び装置 - Google Patents

文書のスキュー識別法及び装置

Info

Publication number
JP3091478B2
JP3091478B2 JP02328812A JP32881290A JP3091478B2 JP 3091478 B2 JP3091478 B2 JP 3091478B2 JP 02328812 A JP02328812 A JP 02328812A JP 32881290 A JP32881290 A JP 32881290A JP 3091478 B2 JP3091478 B2 JP 3091478B2
Authority
JP
Japan
Prior art keywords
image
document
pixels
skew
pixel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP02328812A
Other languages
English (en)
Other versions
JPH03268189A (ja
Inventor
エス ブルームバーグ ダン
イー コペック ゲアリー
Original Assignee
ゼロックス コーポレーション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ゼロックス コーポレーション filed Critical ゼロックス コーポレーション
Publication of JPH03268189A publication Critical patent/JPH03268189A/ja
Application granted granted Critical
Publication of JP3091478B2 publication Critical patent/JP3091478B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • H04N1/3877Image rotation
    • H04N1/3878Skew detection or correction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/1475Inclination or skew detection or correction of characters or of image to be recognised
    • G06V30/1478Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Image Processing (AREA)
  • Character Input (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、画像処理の分野に関する。具体的には、一
実施例において、本発明は、本文及びまたは図形より成
る文書のスキューを測定し、また選択的に、文書のスキ
ューを所望の角度へ調節するための方法及び装置を提供
する。
〔従来技術及び解決しようとする課題〕
多くの画像処理アプリケーションにおいて、文書画像
のスキューを測定することは、望ましい。例えば、本文
の画像に関しては、スキューは、本文画像の行が水平な
行などの事前選択された基準行と異なる場合の角度であ
る。光学的文字認識装置は、この種の装置が、文書の画
像を走査する時、一般に、文書の一部を水平に走査する
ので、本文のスキューの角度を知ることが望ましい画像
処理装置の典型的例である。本文の画像の方向が適切で
ない場合、光学的文字認識装置は、個々の文字を認識す
ることが困難であり、スキューが大きい場合には、本文
の多くの行を一度に走査することになる。
文書のスキュー測定に関する多くの方法と装置が提供
されている。成功はするが、従来の方法は、種々の制約
を受ける。例えば、方法と装置のなかには、一般的でな
いか、または、特殊目的のハードウェアを必要とするも
のがあり、この種の装置の複雑さとコストを高めてい
る。いくつかの装置では、許容出来ない程度のコンピュ
ータ処理時間あるいはコンピュータ処理能力が必要とさ
れる。そのほかの方法は、本文に限って作動するか、あ
るいは、特殊化されたデータ表示が使用されることを必
要としている。
以上の点から、文書のスキューを測定しまた調節する
ための方法と装置が望まれていることは、明らかであ
る。
〔課題を解決するための手段〕
本発明は、ビットマップ画像から文書のスキューを識
別するための改良した方法と装置とを提供する。画像の
縮小は、性能を向上するために選択的に使用される。そ
の画像は、回転のシミュレートのために、回転するか又
は垂直に切断されて、走査線上の画素の数の分散に基づ
く統計的特徴量が最大にされて、スキュー角度を測定す
る。
方法と装置には、文書認識装置内の使用を含む各種の
アプリケーションがある。例えば、本文が5%以上傾く
と、大抵の光学的文字認識装置の精度は低下する。本発
明を使用すると、光学的文字認識装置は、スキューを迅
速に検査し、これによって、文書のスキューを調整する
ことが出来る。
あるいは、本発明は、電子複写機内に使用される。人
間の目は、僅かな文書のスキューでも検出する。従っ
て、この形式の電子複写機は、本発明を使用すると、機
械的複雑さがなく、文書のスキューを検査して、補正す
る。本発明は、複写されている原稿が傾いている場合、
特に有用である。当然、これらのアプリケーションは、
本方法と装置の多様なアプリケーションを単に説明して
いるだけである。ほかに可能なアプリケーションには、
画像の符号化及びこれに類似するもののスキュー修正が
あるが、これに限定されるものでない。
以上の点から、一実施例では、本発明は光学的文字認
識装置を提供する。光学的文字認識装置は、文書の画像
を入力する入力手段と、次の手段より成るスキュー除去
手段より構成されている。すなわち、(i)少なくとも
第1スキュー角から第2スキュー角へ画像を回転する手
段、(ii)各スキュー角における画像の走査線内のオン
画素の数の統計的特徴量を計算する手段、(iii)スキ
ュー除去画像を形成するために、実質的に統計的特徴量
を最大にする角度で画像を回転する手段である。光学的
文字認識装置は、そのほかに、スキュー除去された画像
内の文字を識別する手段と、画像内の文字を出力する手
段とを有する。
もう1つの実施例では、本発明は文書を複写する装置
を提供している。この装置は、文書の画像を入力する入
力手段とスキュー除去手段より成っている。スキュー除
去手段は、(i)少なくとも第1スキュー角から第2ス
キュー角へ画像を回転する手段と、(ii)各スキュー角
における画像の走査線内のオン画素の数の統計的特徴量
を計算する手段と、(iii)文書のスキュー除去された
画像を形成するために、実質的に統計的特徴量を最大に
する角度で画像を回転する手段とより成っている、さら
に、本装置は、文書のスキュー除去された画像を出力す
る手段を有する。明細書の残りの部分と付属図面を参照
することにより、本発明の特徴と利点は、一層理解され
る。
〔実施例〕
(A)用語の定義 本考察は、2値画像を扱っている。この文脈におい
て、用語“画像”は、画素より成る2次元データ構造の
表示を指す。2値画像は、与えられた画素“オン”また
は“オフ”である場合の画像である。2値画像は、1つ
又はそれ以上の原始画像を宛先画像に対応づける多くの
操作により処理される。この操作の結果は、一般に画像
と呼ばれる。処理の開始点である画像は、原始画像と呼
ばれる。
画素は、それらが黒色である場合、オンであると定義
され、白色である場合、オフと定義される、オンとして
黒色の指示及びオフとして白色の指示は、関係の多くの
文書が、黒色の前景と白色の背景とを有することを反映
している。本発明の技術は、ネガ画像にも適用される
が、考察は、白色地の上の黒色について行われる。
画像の“べた領域”は、多数の画素が2次元で広がっ
ていて、実質的に全ての画素がオンである領域を指す。
画像の“テクスチャ領域”は、比較的きめ細かいパタ
ーンを有する領域を指す。テクスチャ領域の例には、ハ
ーフトーン領域または点描領域がある。
AND、OR、XORは、連続画素を主体とした2個の画素
の間で行われる論理演算である。
NOTは、連続画素を主体とした単一画素について行わ
れる論理演算である。
“拡大”は、倍率Nにより特性づけられた拡大動作で
あり、この場合、原始画像内の角画素は、N×Nの正方
形の画素となり、すべての画素は、最初の画素と同じ値
を有する。
“縮小”は、係数Nとしきい値レベルMとにより特性
づけられた縮小動作である。係数=Nの縮小は、原始画
像をN×N正方形の画素に分割し、原始画像の各正方形
を1つの宛先画像マッピングする必要がある。宛先画像
の画素に対する値は、しきい値レベルMにより決定さ
れ、これは1とN2との間の数である。画素の正方形内の
オン画素の数が、Mと同じかそれより大きい場合、宛先
画素はオンであり、さもなければ、オフである。
“サブサンプリング”は、原始画像が、より小さい要
素(一般には正方形)に細分化される動作であり、それ
らの各要素は、宛先画像内の小要素にマッピングされ
る。各宛先画像要素に対する画素値は、原始画像要素内
の選択された画素の小部分によって定義される。一般
に、サブサンプリングは、単一画素のマッピングを必要
としており、宛先画素値は原始画像要素から選択された
画素と同じである。この選択は予め決定されてもよい
(例えば、左上の画素)し、また無作為であってもよ
い。
“4連結領域”は、集合内の各画素が少なくとも1個
の集合内のほかの画素と左右または上下に隣接している
オン画素の集合である。
“8連結領域”は、集合内の各画素が、少なくとも1
個の集合内のほかの画素と左右、上下、または斜めに隣
接しているオン画素の集合である。
多くの形態学的動作は、SE(構成要素)と呼ばれる画
素パターンにより定義される規則に従って、同じ大きさ
の宛先画像に原始画像をマッピングする。SEは、中心位
置と多くの画素の位置により定義され、各画素は、定義
づけられた値(オンまたはオフ)を有する。SEを定義し
ている画素は、互いに隣接しなくてよい。中心位置は、
パターンの幾何学的中心にある必要はなく、実際に、そ
れはパターン内にあることさえも必要ない。
“べたのSE"は、そのなかのすべての画素がオンであ
る周辺を有するSEを指す。例えば、べたの2×2SEは2
×2の正方形のオン画素である。べたSEは、必ずしも矩
形である必要はない。
“ヒット・ミス"SEは、少なくとも1個のオン画素と
少なくとも1個のオフ画素を規定するSEを指す。
“エロージョン(erosion)”は、SEの中心を原始画
像内の対応する画素の位置に重ね合せたとき、SE内のす
べてのオン画素及びオフ画素と、原始画像内の下にある
画素とが一致した場合にのみ、宛先画像内の決められた
画素をオンにする形態学的動作である。
“ダイレーション(dilation)”は、原始画像内の決
められた画素がオンであるとき、宛先画像内に対応する
位置にSEの中心を置いて、SEを宛先画像へ書き込む形態
学的動作である。ダイレーションに使用されるSEは、一
般にオフ画素を持っていない。
“オープニング(opening)”は、エロージョンと次
に続くダイレーションとより成る形態学的動作である。
この結果は、原始画像内の各整合のためにSEを宛先画像
に複製することである。
“クロージング(closing)”は、ダイレーション
と、次に続くエロージョンとより成る形態学的動作であ
る。
“マスク(mask)”は、原始画像に関係する領域にオ
ン画素のほぼべたの領域を有している、原始画像から正
常に誘導された画像を指す。
上記のように定義された各種の動作は、名詞形式、形
容詞形式、あるいは動詞形式で表現されることがある。
例えば、ダイレーション(名詞形式)は、画像をダイレ
ートする、または画像がダイレートされていること(動
詞形式)等に表現される。
(B)実施例の動作の詳細 本発明は、ビットマップから直接にスキューを測定す
る方法と装置を提供する。好適実施例において、ビット
マップ内のすべての、あるいは、ほぼすべての画素が使
用される。走査線のオン画素の数の分散に基づく統計的
特徴量は、ビットマップの回転角の関数として測定され
る。この統計的特徴量は、画像がゼロ・スキュー(すな
わちスキューのない状態)に非常に近づいた場合に、実
質的に最大になる。この方法は、画像内の画素をすべて
使用するので、本文だけの画像、線図形だけの画像(何
本かの水平線がある場合)及び本文のほかに、ハーフト
ーンや点描が混在したいくつかの画像について動作す
る。
第1A図は、本発明が具体化されている画像分析装置10
0の構成図である、装置100の基本動作は、文書102の特
定の特徴的部分を抽出し、あるいは、削除することにあ
る。このために、本装置は、画素にもとずいて文書をデ
ジタル化する走査器103を有し、その結果として生じた
データ構造を提供する。アプリケーションによっては、
走査器は、2値画像(1画素につき1ビット)、あるい
は、グレースケール画像(1画素につき複数ビット)を
提供する。このデータ構造は、走査器の分解精度までの
文書の生の内容を有する。このデータ構造は、一般に画
像と呼ばれ、メモリ104へ送られるか、または、ディス
クまたは他の大容量記憶装置である、ファイル記憶装置
105に格納される。
プロセッサ106はデータフローを制御し、画像処理を
行う。プロセッサ106は汎用コンピュータ、特殊目的コ
ンピュータ、あるいは、汎用コンピュータと補助の特殊
目的コンピュータとの組合せである。ファイル記憶装置
が使用される場合、画像は、処理前に、メモリ104へ送
られる。メモリ104は、中間データ構造、あるいは、最
終処理済データ構造を記憶するためにも使用される。
本発明がその一部を形成している画像処理の結果は、
誘導された画像(画像の顕著な特徴の座標など)、数値
データ等である。この情報は、アプリケーション固有の
ハードウェア108へ伝達される。これは、プリンタまた
はディスプレイであるか、あるいは、ファイル記憶装置
105へ書き込まれる。
第1B図は、本発明の動作を示す流れ図である。第2段
階において、入力2値画像は、本発明の動作を高速にす
るように、選択的に縮小される。好適な実施例におい
て、画像は、300画素/インチで走査され、約4の係数
(4x)の縮小率すなわち1/4の縮小〜8の係数(8x)の
縮小率すなわち1/8の縮小が使用され(第1B図の例では8
xすなわち1/8の縮小)、満足される結果が得られ、他方
で本発明の動作速度が著しく増大する。一般的な“縮
小”段階が、ここで説明のために使用されているが、ほ
かの形式の縮小、簡単なサブサンプリングやしきい値を
用いた縮小なども、十分に満足出来る。
第4段階から第6段階において、オン画素の数の統計
的特徴量が、画像の特定の回転角のために計算される。
ここで使用されている、オン画素の数の“統計的特徴
量”は次式で表される。
ここで、Nは、使用された行の数; nは、行内のオン画素の個数; iは、行についての序数; C1とC2は、定数。
画像のほぼすべての行が、統計的特徴量の計算に使用
されるが、このことは、本発明の動作にとって重要なこ
とではない。同じ文書が順次走査される場合、複数の走
査線の選択的サンプリングだけを用いることが可能であ
り、または1つの走査線の選択的サンプリングさえも可
能である。上式において、1つの行において画素の数の
2乗の和を除いたすべての項は、実質的に一定であり、
無視できる。従って、一つの実施例では、各走査線のオ
ン画素の数の2乗の和だけが、回転角の関数として計算
される。これは、スキューと無関係な定数の分だけ、統
計的特徴量から違っているからである。
本発明が、1本の走査線の画素数の2乗の計算により
説明されているが、ほかの冪数(すなわち累乗数)も使
用できる。1本の走査線のオン画素数についての1より
大きいすべての冪数(すなわち累乗数)が、有効に使用
できる。2乗を採用するのは、一般にすべてのほかの冪
数(すなわち累乗数)よりも高速に計算できるので、好
適である。簡潔には、上記式が、本書では“統計的特徴
量”と呼ばれる。
第8段階において、分散の計算は、広範囲に変化する
回転角を比較的に少しづつ変えて、行われる。いくつか
の実施例において、画像は、統計的特徴量を計算するた
めに、実際には回転しないが、その代りに、垂直に切断
される。垂直切断において、画像の垂直なブロックは、
個数の画素だけ上方に(または、下方に)移動し、移動
する画素の数は、各ブロック毎に右へ1個だけ増加す
る。各ブロックの水平方向の幅は、切断角によって逆に
変化する。例えば、1度(1ラジアンの約1/57)の回転
をシミュレートすると、幅が28画素の最初の垂直ブロッ
クは変らずにそのままであるが、幅57画素の次の垂直ブ
ロックは、画素1個だけ移動し、幅57画素の次の垂直ブ
ロックは、画素2個だけ移動し、以下同様である。
好適な実施例において、大抵のアプリケーションで
は、文書のスキューは約±5度(θmax)の範囲を超え
ないので、画像は正負のいずれの方向にこの範囲で回転
する。多くの回転角における統計的特徴量の計算の後、
統計的特徴量がほぼ最大である角度が、当業者に周知の
方法で、第10段階において求められる。統計的特徴量の
最大値は、正確に求める必要はないが、統計的特徴量の
最大値の範囲は、少なくとも約±20%以内にあり、もっ
と好ましくは、±10%以内にあるようにして、その範囲
内の統計的特徴量が実質的に最大であるとすることがで
きる。いくつかの実施例においては、±θmaxの範囲内
での種々の増分で統計的特徴量を評価して、補間される
ことによって、最大値が求められものもある。あるい
は、区間2等分法などのほかの精密な方法が使用され
る。統計的特徴量が最大である角度は、文書のスキュー
角に非常に近い。
縮小した大きさで動作を行う利点は、各動作(垂直切
断または計数など)を行う時間が、縮小係数により変化
することである。すなわち、係数4による縮小は、係数
16によって計算時間が減少する。
当然のことであるが、縮小画像が使用される場合、正
確さが低下する。正確さと解答値との間の関係は、次の
通りである。スキュー除去計算による角度の解答値(ラ
ジアン)は、約1/(画像内の画素数)である。従って、
最初の画像が、2500画素の幅であり、係数8により縮小
されるならば、角度の解答値は、約1/300、あるいは通
常のアプリケーションで許容可能である約0.2度であ
る。実際には、誤差は、これよりも小さいことが一般に
知られている。
第12段階において選択されて、最初の画像は、画像を
除スキューするように、第10段階で測定された角度の負
の値だけ回転される。スキュー修正は、画像を回転する
ことにより行われる。ビット・ブロック転送(ラスター
操作)エクシストを使用して画像を回転する効率的な方
法は、知られており、例えば、Paeth,“A Fast Algorit
hm for Fast Raster Rotation" Proc.Vision Interface
‘86,Vancouver B.C.,May1986,77−81pagesで考察され
ている。小さい角度(すなわち、5度以下)の回転に関
して、回転は、2つ直角な切断によって近似化される。
大きい角度に関しては、回転は3つの切断によって近似
化され、この場合、水平方向に同じ大きさの第1と第3
の切断と、垂直方向に第2の大きい切断とによって行わ
れる。
効率的動作の1つの条件は、しきい値を用いる縮小は
迅速に行われなければならないことである。画像を係数
2により垂直方向に縮小することが望まれていると想定
する。これを行う1つの方法は、奇数と偶数との行を論
理的に組合せるために、ラスター動作(ビット・ブロッ
ク転送)を使用することであり、これは、原始画像の各
対の行について、縮小された画像の行を1つ形成する。
次に、同じ手順が、上下につぶれた画像の列について行
われ、両方向において係数2の分だけ縮小された画像を
形成する。
しかし、この結果は、水平及び垂直方向のラスター動
作に依存する。レベル=1または4の結果を得ること
は、簡単である。ORが、いずれのラスター動作の方位に
使用される場合、最初の画像の対応する2×2正方形内
の4個の画素のいずれかがオンであるとすると、その結
果は、オン画素である。これは単に、レベル=1の縮小
である。同様に、ANDがいずれのラスター動作の方位に
使用される場合、4個の画素がすべてオンであるなら
ば、結果はレベル4の縮小である。
少し異なる方法が、レベル=2または3の縮小を得る
ために使用される。水平ORに続いて垂直ANDを行った結
果を縮小画像R1とし、水平ANDに続いて垂直ORを行った
結果をR2とする。レベル2の縮小はR1とR2とを論理和演
算することにより求められ、レベル3の縮小は、R1とR2
との論理積演算を行うことにより得られる。
この手段は、上記のように行れるならば、計算上に効
率的でない。サン・ワークステーションなどのいくつか
のコンピュータでは、ラスター動作は、ソフトウェアで
行われる。画像は、連続データのブロックとして記憶さ
れ、再像の第1行より始まり、左から右へ移動し、次
に、第2行より始まり、以下同様に行われる。従って、
2つのワード内の16または32ビットは、1つの動作で組
合せられるので、行間のラスター動作は速い。しかし、
2つの列の間でラスター動作を行うためには、論理動作
が行われ前に、対応するビットが、一度に2個のビット
(各列から1個)が見つけられなければならない。垂直
ラスター動作を行うための画素当りの時間は、水平ラス
ター動作の25倍以上であるということになる。実際に、
この方法がラスター動作により完全に行われる時には、
その時間の90%以上が、垂直動作に当てられる。
幸いなことに、列間の論理動作を行う簡単で非常に速
い方法がある。列のラスター動作を使用するよりむし
ろ、1つの行内の16個の列に対応する16個の連続ビット
を使用することである、これらの16ビットは、短い整数
としてアクセスされる。16ビットは、8ビットのオブジ
ェクトの216エントリ配列(すなわち、参照用テーブ
ル)へ索引として使用される。この配列の8ビットの内
容は、索引の最初のビットと第2のビットとの論理和を
与え、第3ビットと第4ビットとの論理和を与え、・・
・・第15ビットと第16ビットとの論理和を与える。実際
上、2つの配列が必要であり、1つは、隣接する列の8
組を論理和演算を行うためのもの、もう1つは、列を論
理積演算を行うためのものである、数値の事例は、サン
プルにすぎないことが理解されなければならない。これ
を、4ビットのオブジェクトの28エントリ配列と行う
か、あるいは、多くのほかの方法のいずれか1つの方法
として行うことも可能である。
列の論理的動作を行うための参照用テーブルの使用
が、画素に対し速く、“サン”の行ラスター動作として
行われている。1000×1000画素の画像が、“サン"3/260
型により、レベル=1又は4のいずれかで、500×500画
素の画像へ約0.06秒で縮小される。
上述のように、2×2の縮小には、最初の行間の論理
動作とこれに続く次の、あるいは異なる、列間の論理動
作が必要である。そのほかに、いくつかのしきい値レベ
ルにより、次に組合せられる2つの中間の縮小画像が必
要とされる。列動作用のテーブル参照法は、非常に幅広
い画素語を有することが望まれる場合には、扱いにくく
なる。テーブルが非常に大きくなるか、あるいは、多数
の並列テーブル内の幅広い画素語の部分を参照する特殊
な方法が必要となる。後者は確かに優れているが、メモ
リアドレスとしてデータ語の部分を使用するある方法が
必要である。
第4図は、垂直に隣接した2Qビットの画素語の間の論
理動作と、その結果としての2Qビット画素語(ビット0
〜ビット(2Q−1)の対にしたビット縮小とを行う特殊
なハードウェアの論理図である。図面は16画素語を示し
ているが、このハードウェアの利点は、参照テーブル技
術では厄介な非常に長い画素語についても明確になるこ
とである。1行の画像は数個の画素語だけを表すので、
512ビットの画素語が想定されている。
2つの画素語の縮小が、200と202で表示された2つの
ステージにおいて行われる。第1ステージにおいて、垂
直に隣接した一組の画素語が、第1メモリ203から読み
取られ、所望の第1論理動作が、それらの間で行われ
る。次に、所望の第2論理動作が、前記の結果の画素語
と、1ビットだけ移動した画素語前記の結果の画素語と
の間で行われる。これによって、すべてのビット位置に
関係のビット(有効ビット)を有するように処理された
画素語が提供される。第2ステージ202において、処理
された画素語の有効ビットが取り出されて圧縮され、次
に、第2メモリ204に格納される。メモリ203は、好適
に、画素語サイズに相当するワードサイズにより構成さ
れている。メモリ204も、同様に構成されている。
ステージ200は、集積素子技術から使用可能なIDT49C4
02などのビットスライス型プロセッサの配列として、好
適に具体化されている。この特定のプロセッサは、16ビ
ット幅素子であって、それぞれが64ビットのシフトレジ
スタを有している。32個のこの素子は、512ビットの画
素語に適している。簡略化するため、1個の16ビット素
子210の4個のレジスタ205、206、207、208だけが示さ
れている。プロセッサの動作の間には、第1と第2レジ
スタの内容を論理的に組み合せて、その結果を記憶する
動作がある。プロセッサはデータポート215を有してお
り、データバス217へ接続している。
第2ステージ202は、第1のラッチトランシーバ220と
第2のラッチトランシーバ222とより成っており、それ
ぞれは、半分が画素語程度の幅である。各トランシーバ
は、2つのポートを有し、ポートは、トランシーバ220
については220aと220bで示され、トランシーバ222につ
いては222aと222bで示されている。各トランシーバは、
その半分が画素語程度の幅である。ポート220aと222a
は、それぞれがデータバス217の奇数ビットへ接続し、
これらは、関係のビットに相当する。ポート220bは、デ
ータバスのビット0〜ビット(Q−1)へ接続し、一方
で、ポート222bは、ビットQ〜ビット(2Q−1)へ接続
している。バス回線は、駆動しない線路が高く引き上げ
られるように、レジスタ125により引き上げられてい
る。
レベル=2を有する2×2縮小のケースを考察する。
一運の動作には、(a)1組の垂直に隣接した画素語が
論理積演算されて、単一の2Qビットの画素語を形成し、
数組の隣接したビットが論理和演算されて、Qビットの
画素語を形成し、その結果が記憶され、(b)垂直に隣
接した組の画素語が論理和演算され、その結果生成した
2Qビット画素語の隣接したビットが論理積演算され、そ
の結果のQビット画素語が記憶され、(c)この2つの
Qビットの画素語が論理和演算される。
これを実行するために、1組の垂直に隣接した画素語
が、第1メモリ203からデータバス217へ、さらにレジス
タ205と206へ読み取られる。レジスタ205と206が、論理
積演算され、その結果は、レジスタ207と208に記憶され
る。レジスタ208の内容は、1ビット右へ移動され、レ
ジスタ207と208が、論理和演算され、その結果は、レジ
スタ208に記憶される。レジスタ205と206は、論理和演
算され、その結果は、レジスタ206と207に記憶される。
レジスタ207の内容は、1ビットだけ右へ移動され、レ
ジスタ206と207は、論理積演算され、その結果は、レジ
スタ207に記憶される。
この時点で、レジスタ207は、2つの画素語の論理和
演算と教組の隣接したビットの論理積演算との結果を格
納しており、一方で、レジスタ208は、画素語の論理積
演算と教組の隣接したビットの論理和演算との結果を格
納している。
しかし、レジスタ207と208は、有効なビットを、奇数
ビットの位置1、3、…(2Q−1)に格納している。レ
ベル=2の縮小に関して、レジスタ207と208は論理和演
算され、その結果は、データバス15へ接続しているプロ
セッサ・データ・ポート215において使用可能になる。
データバスの奇数のビットは、ポート220aを経てトラ
ンシーバ220へ保持されて、有効ビットを有するQビッ
ト画素語を隣接した位置に生成する。このQビットエン
ティティは、バスへ読み戻されて、メモリ204へ転送さ
れるが、いずれのラッチも使用することが好適である。
このように、2つの新しい画素語(最初の2つの水平に
隣接している)は、上述のようにステージ200において
処理されて、その結果は、プロセッサ・データ・ポート
215において使用可能になり、ポート222aを経てトラン
シーバ222へ保持される。次に、この2つのトランシー
バの内容は、4個の2Qビット画素語の縮小を示している
1個の2Qビット画素語を形成するために、ポート220bと
222bを経てデータバス217へ読み取られる。その結果
は、第2メモリ204へ転送される。この全体的一連の流
れは、行の組合せ内の画素語がすべて処理されるまで、
継続する。行の組合せが処理されると、後続の組が同様
に処理される。
上記のように、各ビット・スライス型プロセッサは、
64個のレジスタを有している。従って、メモリアクセス
は、ブロックモードで一層効率が良いので、8組の画素
語がメモリ203からブロックで読み取られ、上述のよう
に処理され、プロセッサのレジスタに記憶され、メモリ
204へブロックで書き込まれるならば、一層速い動作が
発生するであろう。
画像の拡大は上記の縮小に類似しているが、段階は、
逆の順序で行われる。最初は、プロセッサは、画素語を
読み取り、左の半分をトランシーバ220のポート220bを
経て送る。これは、ポート220aを経てバスへ読み取られ
る。バス内のそのワードのすべての他の画素だけが、最
初に有効になり、従ってプロセッサは、一連の移動と論
理動作とを使用して、画素をすべて確認する必要があ
る。レジスタ225は、駆動されていないバス回線のすべ
てと、各不駆動回線をプルアップするので、この場合の
偶数ビットはすべて、1である。この拡張された画素語
は、1と有効データと交互になっており、2つのレジス
タへ読み込まれ、1つのレジスタの内容は、1個所に移
動し、レジスタは、論理的に論理積演算される。どこか
で奇数ビット内の0があったとしても、偶数と奇数との
組のなかに00がある。そのほかのビットは、少しも影響
を受けない。次に、この画素語は、拡張された画像内の
垂直に隣接した2つのワードへ書き込まれる。このプロ
セスは、トランシーバ222を使用して、右半の画素語に
対し反復される。プロセッサは、行全体を個々の画素語
について同時に拡張し、画像全体を個々の行について同
時に拡張する。
(C)図を用いた説明 第2図と第3図は、図形で本発明の動作を示す。2の
係数の縮小が、第2A図の本文画像のスキュー角を計算す
るように、使用される。第2A図の画像の統計的特徴量
は、第2B図に示されている。計算されたスキューは、−
0.60度であることがわかった。第3図において、4の係
数の縮小が、画像(第3A図に示す)のスキュー角を計算
するように、使用される。第3A図の画像の統計的特徴量
の曲線は、第3B図に示されている。この計算された統計
的特徴量は、−0.66度が最大であった。実際のスキュー
角は、約−0.60度であり、本方法の標準的精度を示して
いる。
(D)結論 本発明は、文書のスキュー測定の迅速にして正確な方
法を提供する。上記の内容は、示されているが、これに
制約されるものではないことは、理解されるべきであろ
う。本発明の多くの変形は、この開示の概説によって、
技術の専門家には明らかになるであろう。例えば、本発
明は、走査線のオン画素の数の統計的特徴量を最大にす
ることに関して、主に説明されているが、本発明は、回
転の関数として、走査線のオフ画素の数の統計的特徴量
を最大にすることによって、容易に適用される。従っ
て、本発明の適用範囲は、上記の説明に関して決定され
るべきでないが、その代りに、同等のその全範囲に準拠
した付属の特許請求の範囲に関して決定されなければな
らない。
【図面の簡単な説明】
第1A図は、本発明の一実施例により、ここで使用されて
いるハードウェアを示す全構成図であり、第1B図は、本
発明の好適な実施例の動作を示す流れ図である。 第2A図と第2B図は、それぞれ、本文の画像と、スキュー
角の関数としての統計的特徴量のプロット図である。 第3A図と第3B図は、それぞれ、本文の画像と、縮小した
画像に関するスキュー角の関数としての統計的特徴量の
プロット図である。 第4図は、改良された縮小動作を示すハードウェアの論
理図である。 符号の説明 100……画像分析装置、102……文書 103……走査器、104……メモリ 105……ファイル記憶装置、106……プロセッサ
フロントページの続き (56)参考文献 特開 昭59−226978(JP,A) 特開 平1−74682(JP,A) 特開 平1−149185(JP,A) 特開 平1−108854(JP,A) 特開 昭58−134368(JP,A) 特開 昭61−166685(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06K 9/32

Claims (20)

    (57)【特許請求の範囲】
  1. 【請求項1】光学文字認識装置(OCR)における画像の
    スキューを決定する方法において、文書を光学的に走査
    して該文書の画像をデジタルデータ構造の形態で生成す
    る走査ステップと;N×N平方の画素中のオン画素の数が
    スレッシュホールド値以上であるときに1つのオン画素
    を有する1つの宛て先画像として前記N×N平方の画素
    をマッピングする、スレッシュホールド縮小を用いて、
    前記画像を縮小するステップと;前記画像の少なくとも
    1つの走査線中のオン画素の数の統計的特徴量を、次
    式、 ここで、Nは、行の数; pは、1より大きい実数: nは、行内のオン画素の数; iは、行についての序数; によって計算することによって、文書の回転角度の関数
    として決定し、前記スキューを前記統計的特徴量が実質
    的に最大である文書回転角度であるとして突き止めるス
    テップと;前記画像をほぼ前記スキューの角度で回転さ
    せて前記文書の画像のスキューを除去する回転ステップ
    と;該文書のスキューを除去した画像中の文字を認識す
    るステップと;から成ることを特徴とする方法。
  2. 【請求項2】光学文字認識装置(OCR)における画像の
    スキューを決定する方法において、文書を光学的に走査
    して該文書の画像をデジタルデータ構造の形態で生成す
    る走査ステップと;N×N平方の画素中のオフ画素の数が
    スレッシュホールド値以上であるときに1つのオフ画素
    を有する1つの宛て先画像として前記N×N平方の画素
    をマッピングする、スレッシュホールド縮小を用いて、
    前記画像を縮小するステップと;前記画像の少なくとも
    1つの走査線中のオフ画素の数の統計的特徴量を、次
    式、 ここで、Nは、行の数; pは、1より大きい実数: nは、行内のオフ画素の数; iは、行についての序数; によって計算することによって、文書の回転角度の関数
    として決定し、前記スキューを前記統計的特徴量が実質
    的に最大である文書回転角度であるとして突き止めるス
    テップと;前記画像をほぼ前記スキューの角度で回転さ
    せて前記文書の画像のスキューを除去する回転ステップ
    と;該文書のスキューを除去した画像中の文字を認識す
    るステップと;から成ることを特徴とする方法。
  3. 【請求項3】請求項1又は2に記載の方法において、文
    書の実質的に全ての走査線が、前記統計的特徴量の計算
    に包含されることを特徴とする方法。
  4. 【請求項4】請求項1又は2に記載の方法において、文
    書の回転角度は前記画像の垂直の切断によってシミュレ
    ートされていることを特徴とする方法。
  5. 【請求項5】請求項1又は2に記載の方法において、統
    計的特徴量が、+5゜〜−5゜の回転角度の範囲に渡っ
    て計算されることを特徴とする方法。
  6. 【請求項6】請求項1又は2に記載の方法において、統
    計的特徴量が、約0.2゜ずつ回転角度を増して計算され
    ることを特徴とする方法。
  7. 【請求項7】請求項1又は2に記載の方法において、前
    記回転ステップは、少なくともほぼ2つの直交する切断
    を使用することを特徴とする方法。
  8. 【請求項8】請求項1又は2に記載の方法において、更
    に、前記スキューを除去した文書画像の文字を、光学文
    字認識システムを用いて認識するステップを包含するこ
    とを特徴とする方法。
  9. 【請求項9】請求項1又は2に記載の方法において、更
    に、前記スキューを除去した文書画像を、複製するステ
    ップを包含することを特徴とする方法。
  10. 【請求項10】文書の画像のスキューを決定するように
    プログラムされた光学文字認識装置において、 前記文書の画像をデジタルデータ構造の形態で生成する
    光学走査装置と、 デジタルプロセッサとを備え、該デジタルプロセッサ
    は、 前記文書の画像を入力し;N×N平方の画素中のオン画素
    の数がスレッシュホールド値以上であるときに1つのオ
    ン画素を有する1つの宛て先画像として前記N×N平方
    の画素をマッピングする、スレッシュホールド縮小を用
    いて前記画像を縮小し;前記画像の少なくとも1つの走
    査線中のオフ画素の数の統計的特徴量を、文書の回転角
    度の関数として決定し、前記統計的特徴量は、次式、 ここで、Nは、行の数; pは、1より大きい実数: nは、行内のオン画素の数; iは、行についての序数; によって計算され、;前記スキューは前記統計的特徴量
    が実質的に最大である文書回転角度であると突き止めら
    れ;前記画像をほぼ前記スキューの角度で回転させて前
    記文書の画像のスキューを除去する;ようにプログラム
    されており、 更に、前記文書のスキューを除去した画像中の文字を認
    識する手段と から成ることを特徴とする装置。
  11. 【請求項11】文書の画像のスキューを決定するように
    プログラムされた光学文字認識装置において、 前記文書の画像をデジタルデータ構造の形態で生成する
    光学走査装置と、 デジタルプロセッサとを備え、該デジタルプロセッサ
    は、 前記文書の画像を入力し;N×N平方の画素中のオフ画素
    の数がスレッシュホールド値以上であるときに1つのオ
    フ画素を有する1つの宛て先画像として前記N×N平方
    の画素をマッピングする、スレッシュホールド縮小を用
    いて前記画像を縮小し;前記画像の少なくとも1つの走
    査線中のオフ画素の数の統計的特徴量を、文書の回転角
    度の関数として決定し、前記統計的特徴量は、次式、 ここで、Nは、行の数; pは、1より大きい実数: nは、行内のオフ画素の数; iは、行についての序数; によって計算され、;前記スキューは前記統計的特徴量
    が実質的に最大である文書回転角度であると突き止めら
    れ;前記画像をほぼ前記スキューの角度で回転させて前
    記文書の画像のスキューを除去する;ようにプログラム
    されており、 更に、前記文書のスキューを除去した画像中の文字を認
    識する手段と から成ることを特徴とする装置。
  12. 【請求項12】請求項10又は11に記載の装置において、
    前記統計的特徴量を計算するために、文書の実質的に全
    ての走査線が入力されるようにプログラムされているこ
    とを特徴とする装置。
  13. 【請求項13】請求項10又は11に記載の装置において、
    前記画像の垂直の切断によって前記回転角度をシミュレ
    ートするようにプログラムされていることを特徴とする
    装置。
  14. 【請求項14】請求項10又は11に記載の装置において、
    統計的特徴量を、約5゜の回転角度の範囲に渡って計算
    するようにプログラムされていることを特徴とする装
    置。
  15. 【請求項15】請求項10又は11に記載の装置において、
    統計的特徴量を、約0.2゜ずつ回転角度を増して計算す
    るようにプログラムされていことを特徴とする装置。
  16. 【請求項16】請求項10又は11に記載の装置において、
    前記画像を、少なくともほぼ2つの直交する切断を用い
    て回転するようにプログラムされていることを特徴とす
    る装置。
  17. 【請求項17】請求項10又は11に記載の装置において、
    更に、前記画像の文字を認識するための光学文字認識シ
    ステムを包含することを特徴とする装置。
  18. 【請求項18】請求項10又は11に記載の装置において、
    更に、前記スキューを除去した文書画像を複製するたの
    複製手段を包含することを特徴とする装置。
  19. 【請求項19】文書の画像のスキューを決定するように
    プログラムされた電子複写機において、 前記文書の画像をデジタルデータ構造の形態で生成する
    光学走査装置と、 デジタルプロセッサとを備え、 前記デジタルプロセッサは;前記文書の画像を入力し;N
    ×N平方の画素中のオン画素の数がスレッシュホールド
    値以上であるときに1つのオン画素を有する1つの宛て
    先画像として前記N×N平方の画素をマッピングする、
    スレッシュホールド縮小を用いて前記画像を縮小し;前
    記画像の少なくとも1つの走査線中のオン画素の数の統
    計的特徴量を、文書の回転角度の関数として決定し、前
    記統計的特徴量は、次の式、 ここで、Nは、行の数; pは、1より大きい実数: nは、行内のオン画素の数; iは、行についての序数; によって計算され;前記スキューは前記統計的特徴量が
    実質的に最大である文書回転角度であると突き止められ
    るようにプログラムされ、 更に、前記文書の画像のスキューを除去するように、前
    記画像をほぼ前記スキューの角度で回転させる手段と、 前記文書のスキューを除去した画像を出力する手段と から成ることを特徴とする電子複写機。
  20. 【請求項20】文書の画像のスキューを決定するように
    プログラムされた電子複写機において、 前記文書の画像をデジタルデータ構造の形態で生成する
    光学走査装置と、 デジタルプロセッサとを備え、 前記デジタルプロセッサは;前記文書の画像を入力し;N
    ×N平方の画素中のオフ画素の数がスレッシュホールド
    値以上であるときに1つのオフ画素を有する1つの宛て
    先画像として前記N×N平方の画素をマッピングする、
    スレッシュホールド縮小を用いて前記画像を縮小し;前
    記画像の少なくとも1つの走査線中のオフ画素の数の統
    計的特徴量を、文書の回転角度の関数として決定し、前
    記統計的特徴量は、次の式、 ここで、Nは、行の数; pは、1より大きい実数: nは、行内のオフ画素の数; iは、行についての序数; によって計算され;前記スキューは前記統計的特徴量が
    実質的に最大である文書回転角度であると突き止められ
    るようにプログラムされ、 更に、前記文書の画像のスキューを除去するように、前
    記画像をほぼ前記スキューの角度で回転させる手段と、 前記文書のスキューを除去した画像を出力する手段と から成ることを特徴とする電子複写機。
JP02328812A 1989-12-08 1990-11-28 文書のスキュー識別法及び装置 Expired - Fee Related JP3091478B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US07/448,774 US5187753A (en) 1989-12-08 1989-12-08 Method and apparatus for identification and correction of document skew
US448774 1999-11-24

Publications (2)

Publication Number Publication Date
JPH03268189A JPH03268189A (ja) 1991-11-28
JP3091478B2 true JP3091478B2 (ja) 2000-09-25

Family

ID=23781626

Family Applications (1)

Application Number Title Priority Date Filing Date
JP02328812A Expired - Fee Related JP3091478B2 (ja) 1989-12-08 1990-11-28 文書のスキュー識別法及び装置

Country Status (4)

Country Link
US (2) US5187753A (ja)
EP (1) EP0431962B1 (ja)
JP (1) JP3091478B2 (ja)
DE (1) DE69032421T2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101824561B1 (ko) 2012-01-05 2018-02-01 주식회사 포틱스 이송장치
CN108686783A (zh) * 2018-04-28 2018-10-23 安徽新兴翼凌机电发展有限公司 一种具备智能切割功能的蔬菜分拣设备

Families Citing this family (74)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5187753A (en) * 1989-12-08 1993-02-16 Xerox Corporation Method and apparatus for identification and correction of document skew
US5245676A (en) * 1989-12-21 1993-09-14 Xerox Corporation Determination of image skew angle from data including data in compressed form
US5418896A (en) * 1990-03-20 1995-05-23 Mita Industrial Co., Ltd. Skew processing circuit and method of calculating a preset value for the same
US5359677A (en) * 1990-12-11 1994-10-25 Sharp Kabushiki Kaisha Image reader and facsimile machine using such image reader
EP0525513B1 (en) * 1991-07-16 2002-01-16 Yozan Inc. Method for detecting inclination of an image of characters
US6373997B1 (en) 1991-07-30 2002-04-16 Xerox Corporation Coarse and fine skew measurement
JP2625600B2 (ja) * 1991-10-31 1997-07-02 インターナショナル・ビジネス・マシーンズ・コーポレイション 図形移動変形方法及び装置
CA2077969C (en) * 1991-11-19 1997-03-04 Daniel P. Huttenlocher Method of deriving wordshapes for subsequent comparison
CA2077970C (en) * 1991-11-19 1999-02-23 Daniel P. Huttenlocher Optical word recognition by examination of word shape
JP3576570B2 (ja) * 1991-11-19 2004-10-13 ゼロックス コーポレイション 比較方法
US5201011A (en) * 1991-11-19 1993-04-06 Xerox Corporation Method and apparatus for image hand markup detection using morphological techniques
US5276742A (en) * 1991-11-19 1994-01-04 Xerox Corporation Rapid detection of page orientation
US5321770A (en) * 1991-11-19 1994-06-14 Xerox Corporation Method for determining boundaries of words in text
US5418865A (en) * 1992-03-20 1995-05-23 Xerox Corporation Mark sensing on a form
JP3093869B2 (ja) * 1992-04-28 2000-10-03 オリンパス光学工業株式会社 画像取り込み装置
US5586479A (en) * 1993-03-10 1996-12-24 Eastman Kodak Company Cutting apparatus for cutting an image from a receiving sheet
JPH06274680A (ja) * 1993-03-17 1994-09-30 Hitachi Ltd 文書認識方法およびシステム
CA2129092C (en) * 1993-10-04 1999-10-19 Leon C. Williams Image interpolation apparatus
US5485566A (en) * 1993-10-29 1996-01-16 Xerox Corporation Method of finding columns in tabular documents
US6515769B1 (en) * 1993-10-29 2003-02-04 Canon Kabushiki Kaisha Image forming apparatus and method
JPH09506730A (ja) 1993-12-17 1997-06-30 クインテット、インコーポレイテッド 自動署名検証の方法
US5410417A (en) * 1994-02-10 1995-04-25 Motorola, Inc. Method and apparatus for correcting an angle of an optical image for improving the efficiency of facsimile encoding of the image
GB2288512B (en) * 1994-04-14 1998-08-26 Matsushita Electric Ind Co Ltd Image processing apparatus
EP0811946A3 (en) * 1994-04-15 1998-01-14 Canon Kabushiki Kaisha Image pre-processor for character recognition system
KR0158123B1 (ko) * 1995-09-26 1998-12-15 김광호 팩시밀리장치의 화상테이타 자동정렬방법
US5666208A (en) * 1996-01-11 1997-09-09 Xerox Corporation Printing system with electronic light table functionality
US5901253A (en) * 1996-04-04 1999-05-04 Hewlett-Packard Company Image processing system with image cropping and skew correction
US5956409A (en) 1996-04-29 1999-09-21 Quintet, Inc. Secure application of seals
US5937084A (en) * 1996-05-22 1999-08-10 Ncr Corporation Knowledge-based document analysis system
US5764383A (en) * 1996-05-30 1998-06-09 Xerox Corporation Platenless book scanner with line buffering to compensate for image skew
US6738154B1 (en) 1997-01-21 2004-05-18 Xerox Corporation Locating the position and orientation of multiple objects with a smart platen
GB9711022D0 (en) 1997-05-28 1997-07-23 Rank Xerox Ltd Text/image selection from document images
EP0883287A1 (en) * 1997-06-02 1998-12-09 Primax Electronics Ltd Image processing system with automatic image separation and alignment functions
US6310984B2 (en) 1998-04-09 2001-10-30 Hewlett-Packard Company Image processing system with image cropping and skew correction
DE69835739T2 (de) * 1998-07-24 2007-08-23 Xerox Corp. Bestimmung der Lage und Orientierung einer Vielzahl von Objekten mittels einer intelligenten Bildeingangsplatte
US6636649B1 (en) * 1998-10-16 2003-10-21 Matsushita Electric Industrial Co., Ltd. Image processing apparatus and the method of correcting the inclination
US6381371B1 (en) 1999-03-17 2002-04-30 Hewlett-Packard Company Method and apparatus for processing image files
US6285802B1 (en) 1999-04-08 2001-09-04 Litton Systems, Inc. Rotational correction and duplicate image identification by fourier transform correlation
US6839466B2 (en) * 1999-10-04 2005-01-04 Xerox Corporation Detecting overlapping images in an automatic image segmentation device with the presence of severe bleeding
US6741738B2 (en) 2000-03-13 2004-05-25 Tms, Inc. Method of optical mark recognition
US7898695B1 (en) 2000-10-06 2011-03-01 Lexmark International, Inc. Method of compensating for electronic printhead skew and bow correction in an imaging machine to reduce print artifacts
US7145699B2 (en) * 2001-03-30 2006-12-05 Sharp Laboratories Of America, Inc. System and method for digital document alignment
US6873732B2 (en) 2001-07-09 2005-03-29 Xerox Corporation Method and apparatus for resolving perspective distortion in a document image and for calculating line sums in images
US20030095722A1 (en) * 2001-11-19 2003-05-22 Regimbal Laurent A. Method and apparatus to detect and compensate for skew in a printing device
US6985640B2 (en) * 2002-01-07 2006-01-10 Xerox Corporation Parallel non-iterative method of determining and correcting image skew
US7142727B2 (en) * 2002-12-17 2006-11-28 Xerox Corporation Non-iterative method of calculating image skew
JP4508553B2 (ja) * 2003-06-02 2010-07-21 カシオ計算機株式会社 撮影画像投影装置、及び撮影画像の補正方法
TWI267800B (en) * 2003-06-13 2006-12-01 Lite On Technology Corp Automatic correction method of tilted image
US20050068583A1 (en) * 2003-09-30 2005-03-31 Gutkowski Lawrence J. Organizing a digital image
US20060039627A1 (en) * 2004-08-21 2006-02-23 Xerox Corporation Real-time processing of grayscale image data
US7515772B2 (en) * 2004-08-21 2009-04-07 Xerox Corp Document registration and skew detection system
US7583852B2 (en) * 2004-10-26 2009-09-01 Mitutoyo Corporation Method of filtering an image for high precision machine vision metrology
US20070177228A1 (en) * 2006-01-27 2007-08-02 International Business Machines Corporation Method and apparatus for automatic image sensor alignment adjustment
US7627191B2 (en) * 2006-08-14 2009-12-01 Xerox Corporation Image manipulation
US8077951B2 (en) * 2006-10-12 2011-12-13 Agilent Technologies, Inc. Method and system for dynamic, automated detection of outlying feature and feature background regions during processing of data scanned from a chemical array
US20080095560A1 (en) * 2006-10-20 2008-04-24 Hewlett-Packard Development Company Lp Adjusting a line
US8249391B2 (en) * 2007-08-24 2012-08-21 Ancestry.com Operations, Inc. User interface method for skew correction
US7991153B1 (en) 2008-08-26 2011-08-02 Nanoglyph, LLC Glyph encryption system and related methods
US8160393B2 (en) * 2008-09-18 2012-04-17 Certifi Media Inc. Method for image skew detection
US8370759B2 (en) 2008-09-29 2013-02-05 Ancestry.com Operations Inc Visualizing, creating and editing blending modes methods and systems
US8089494B2 (en) * 2008-10-13 2012-01-03 Hewlett-Packard Development Company, L.P. Image rotation
US9626603B2 (en) * 2008-12-18 2017-04-18 Xerox Corporation Method and system for utilizing transformation matrices to process rasterized image data
US9626602B2 (en) * 2008-12-18 2017-04-18 Xerox Corporation Method and system for utilizing transformation matrices to process rasterized image data
US9508168B2 (en) * 2008-12-18 2016-11-29 Xerox Corporation Method and system for utilizing transformation matrices to process rasterized image data
WO2011001439A2 (en) 2009-07-02 2011-01-06 Hewlett-Packard Development Company, L.P. Skew detection
US8718365B1 (en) 2009-10-29 2014-05-06 Google Inc. Text recognition for textually sparse images
US8571313B2 (en) * 2010-03-22 2013-10-29 Sharp Laboratories Of America, Inc. Methods and systems for estimation of document skew in an image
US8649566B2 (en) 2010-07-19 2014-02-11 Xerox Corporation Motion quality error detection in printing systems using documents having text or line content
US8792682B2 (en) 2011-04-21 2014-07-29 Xerox Corporation Method and system for identifying a license plate
US8731336B2 (en) * 2011-12-14 2014-05-20 Ancestry.Com Operations Inc. Multi-perpendicular line-based deskew with affine and perspective distortion correction
KR101969965B1 (ko) 2012-12-24 2019-08-13 휴렛-팩커드 디벨롭먼트 컴퍼니, 엘.피. 화상독취장치, 이미지 보정 방법 및 컴퓨터 판독가능 기록매체
CN110198842B (zh) * 2017-01-31 2021-01-12 惠普发展公司,有限责任合伙企业 基于直接存储器访问的硬件偏斜校正
TWI702547B (zh) * 2019-07-03 2020-08-21 利凌企業股份有限公司 車牌辨識方法及其系統
US11188745B2 (en) * 2019-09-13 2021-11-30 At&T Intellectual Property I, L.P. Enhancing electronic documents for character recognition

Family Cites Families (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US454339A (en) * 1891-06-16 Truss
US3831146A (en) * 1973-03-19 1974-08-20 Ibm Optimum scan angle determining means
US4052699A (en) * 1976-06-30 1977-10-04 International Business Machines Corporation High speed real time image transformation
DE3065583D1 (en) * 1979-06-26 1983-12-22 Ibm Device for determining the optimum scanning angle of printed matter
US4414685A (en) * 1979-09-10 1983-11-08 Sternberg Stanley R Method and apparatus for pattern recognition and detection
JPS5887652A (ja) * 1981-11-19 1983-05-25 Ricoh Co Ltd 画像処理装置
JPS58134368A (ja) * 1982-02-05 1983-08-10 Ricoh Co Ltd 文書画像処理装置
JPS5955574A (ja) * 1982-09-17 1984-03-30 インタ−ナショナル ビジネス マシ−ンズ コ−ポレ−ション マ−ク・シ−ト読取装置
US4499499A (en) * 1982-12-29 1985-02-12 International Business Machines Corporation Method for identification and compression of facsimile symbols in text processing systems
US4817186A (en) * 1983-01-07 1989-03-28 International Business Machines Corporation Locating individual images in a field for recognition or the like
JPS59156070A (ja) * 1983-02-25 1984-09-05 Canon Inc 画像処理装置
US4759075A (en) * 1983-03-14 1988-07-19 Ana Tech Corporation Method and apparatus for vectorizing documents and symbol recognition
US4558461A (en) * 1983-06-17 1985-12-10 Litton Systems, Inc. Text line bounding system
US4742558A (en) * 1984-02-14 1988-05-03 Nippon Telegraph & Telephone Public Corporation Image information retrieval/display apparatus
US4723297A (en) * 1984-09-27 1988-02-02 Siemens Aktiengesellschaft Method for automatic correction of character skew in the acquisition of a text original in the form of digital scan results
JPS61199175A (ja) * 1985-02-28 1986-09-03 Mitsubishi Electric Corp イメ−ジの任意角度回転方式
JPS61225974A (ja) * 1985-03-30 1986-10-07 Ricoh Co Ltd 画像処理方式
SE448124B (sv) * 1985-05-23 1987-01-19 Context Vision Ab Anordning for detektering av variationsgraden av en egenskap i ett omrade av en i diskreta bildelement uppdelad bild
SE448126B (sv) * 1985-05-23 1987-01-19 Context Vision Ab Anordning for detektering av sprangartade forendringar av en egenskap inom ett omrade av en i diskreta bildelement uppdelad bild
SE448125B (sv) * 1985-05-23 1987-01-19 Context Vision Ab Anordning for bestemning av graden av konstans hos en egenskap for ett omrade i en i diskreta bildelement uppdelad bild
US4700400A (en) * 1985-10-10 1987-10-13 The Palantir Corporation Feature extraction technique for use in a pattern recognition system
JPS62267610A (ja) * 1986-05-16 1987-11-20 Fuji Electric Co Ltd 対象パタ−ンの回転角検出方式
US4783828A (en) * 1986-06-02 1988-11-08 Honeywell Inc. Two-dimensional object recognition using chain codes, histogram normalization and trellis algorithm
GB8614214D0 (en) * 1986-06-11 1986-07-16 Kodak Ltd Image processing method
US4783826A (en) * 1986-08-18 1988-11-08 The Gerber Scientific Company, Inc. Pattern inspection system
US4821333A (en) * 1986-08-22 1989-04-11 Environmental Research Inst. Of Michigan Machine learning procedures for generating image domain feature detector structuring elements
US4941189A (en) * 1987-02-25 1990-07-10 Lundy Electronics & Systems, Inc. Optical character reader with skew recognition
US4876730A (en) * 1987-02-25 1989-10-24 Lundy Electronics & Systems, Inc. Optical character reader with skew recognition
JPS63268081A (ja) * 1987-04-17 1988-11-04 インタ−ナショナル・ビジネス・マシ−ンズ・コ−ポレ−ション 文書の文字を認識する方法及び装置
JPS63261486A (ja) * 1987-04-20 1988-10-28 Nec Corp 書体識別装置
JP2696211B2 (ja) * 1987-04-20 1998-01-14 株式会社日立製作所 濃淡画像からのパターン認識方法及び装置
US4809344A (en) * 1987-05-11 1989-02-28 Nippon Sheet Glass Co., Ltd. Apparatus for preprocessing of character recognition
JP2615625B2 (ja) * 1987-06-24 1997-06-04 富士ゼロックス株式会社 画像処理装置
US4827330A (en) * 1987-07-20 1989-05-02 Litton Industrial Automation Systems, Inc. Automatic document image revision
JPS6478381A (en) * 1987-09-21 1989-03-23 Toshiba Corp Picture processing method
JPS6482286A (en) * 1987-09-25 1989-03-28 Toshiba Corp Image inclination detector
US4791679A (en) * 1987-12-26 1988-12-13 Eastman Kodak Company Image character enhancement using a stroke strengthening kernal
US5001766A (en) * 1988-05-16 1991-03-19 At&T Bell Laboratories Apparatus and method for skew control of document images
US5187753A (en) * 1989-12-08 1993-02-16 Xerox Corporation Method and apparatus for identification and correction of document skew

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101824561B1 (ko) 2012-01-05 2018-02-01 주식회사 포틱스 이송장치
CN108686783A (zh) * 2018-04-28 2018-10-23 安徽新兴翼凌机电发展有限公司 一种具备智能切割功能的蔬菜分拣设备

Also Published As

Publication number Publication date
DE69032421D1 (de) 1998-07-23
JPH03268189A (ja) 1991-11-28
US5355420A (en) 1994-10-11
DE69032421T2 (de) 1998-12-03
EP0431962B1 (en) 1998-06-17
EP0431962A2 (en) 1991-06-12
EP0431962A3 (en) 1993-01-20
US5187753A (en) 1993-02-16

Similar Documents

Publication Publication Date Title
JP3091478B2 (ja) 文書のスキュー識別法及び装置
JP2940960B2 (ja) 画像の傾き検出方法および補正方法ならびに画像情報処理装置
JP3086702B2 (ja) テキスト又は線図形を識別する方法及びデジタル処理システム
JP3051182B2 (ja) ハイライト領域検出方法
US5452374A (en) Skew detection and correction of a document image representation
JP2986383B2 (ja) ライン走査画像のためのスキューを補正する方法及びその装置
JP2840133B2 (ja) 像の整列方法
EP0431961B1 (en) Image reduction/enlargement technique
JP3878401B2 (ja) 画像処理装置、画像処理方法およびそれを記録した記録媒体
US5276742A (en) Rapid detection of page orientation
JPH03201866A (ja) 圧縮形態のデータを含むデータから画像スキュー角度を決定する方法
JPH05242292A (ja) 分離方法
JPH03233686A (ja) 中間調領域用分離マスクの構成方法
JP4098845B2 (ja) テキストのバイナリー画像から抽出されたシンボルを比較する方法
WO2024169397A1 (zh) 印章识别方法、装置、电子设备及存储介质
JPH0528317A (ja) 画像処理方法及び装置
JPH0424781A (ja) 文書処理装置
Mennens et al. Optical recognition of Braille writing
JP3089396B2 (ja) マーク読み取り装置および方法
EP0433359A1 (en) Image recognition
JPH09147109A (ja) 特定マーク検出方法及び特定マーク検出装置
JP2000113106A (ja) 文書画像処理装置
JP3072126B2 (ja) 書体を識別する方法及び装置
JP3337592B2 (ja) マーク位置検出装置およびマーク位置検出方法
JPH03217993A (ja) 文字サイズ認識装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 19990914

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20000627

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070721

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080721

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees