JPH04333183A - ディジタル化画像のゆがみ検出 - Google Patents
ディジタル化画像のゆがみ検出Info
- Publication number
- JPH04333183A JPH04333183A JP3261856A JP26185691A JPH04333183A JP H04333183 A JPH04333183 A JP H04333183A JP 3261856 A JP3261856 A JP 3261856A JP 26185691 A JP26185691 A JP 26185691A JP H04333183 A JPH04333183 A JP H04333183A
- Authority
- JP
- Japan
- Prior art keywords
- angle
- value
- array
- document
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000001514 detection method Methods 0.000 title 1
- 238000000034 method Methods 0.000 claims abstract description 20
- 238000006243 chemical reaction Methods 0.000 claims 1
- 230000009466 transformation Effects 0.000 claims 1
- 230000006870 function Effects 0.000 abstract description 5
- 238000006073 displacement reaction Methods 0.000 abstract description 4
- 230000010354 integration Effects 0.000 abstract description 2
- 230000002411 adverse Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 241001442234 Cosa Species 0.000 description 1
- 244000089409 Erythrina poeppigiana Species 0.000 description 1
- 101000706563 Homo sapiens SUN domain-containing protein 3 Proteins 0.000 description 1
- 235000009776 Rathbunia alamosensis Nutrition 0.000 description 1
- 102100031129 SUN domain-containing protein 3 Human genes 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00681—Detecting the presence, position or size of a sheet or correcting its position before scanning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
- G06V30/1475—Inclination or skew detection or correction of characters or of image to be recognised
- G06V30/1478—Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00681—Detecting the presence, position or size of a sheet or correcting its position before scanning
- H04N1/00684—Object of the detection
- H04N1/00718—Skew
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00681—Detecting the presence, position or size of a sheet or correcting its position before scanning
- H04N1/00763—Action taken as a result of detection
- H04N1/00766—Storing data
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00681—Detecting the presence, position or size of a sheet or correcting its position before scanning
- H04N1/00785—Correcting the position of a sheet before scanning
- H04N1/00787—Correcting the position of a sheet before scanning using mechanical means
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Image Processing (AREA)
- Character Input (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、ディジタル化された画
像のゆがみ(skew)の検出及び訂正を行う方法及び
装置に関する。
像のゆがみ(skew)の検出及び訂正を行う方法及び
装置に関する。
【0002】
【従来の技術】書類等のペーパードキュメントを走査し
てディジタル化し、ビットマップバイナリ画像(bit
−mapped binary image)を生成す
ることはよく知られている。この画像は、次に電子的に
処理される。例えば、セグメントプロセスによって画像
をテキスト領域とグラフィックス領域とに分割し、そし
て文字認識プロセスとグラフィックス認識プロセスを行
なっている。
てディジタル化し、ビットマップバイナリ画像(bit
−mapped binary image)を生成す
ることはよく知られている。この画像は、次に電子的に
処理される。例えば、セグメントプロセスによって画像
をテキスト領域とグラフィックス領域とに分割し、そし
て文字認識プロセスとグラフィックス認識プロセスを行
なっている。
【0003】入力段階でのドキュメントのゆがみ又は不
整合はプロセスの性能に悪影響を与えることが見出され
ている。例えば、セグメントプロセスは1度程度の比較
的小さなゆがみで失敗する。さらに文字認識アルゴリズ
ムはひどくゆがんだ文字の場合は悪化する。
整合はプロセスの性能に悪影響を与えることが見出され
ている。例えば、セグメントプロセスは1度程度の比較
的小さなゆがみで失敗する。さらに文字認識アルゴリズ
ムはひどくゆがんだ文字の場合は悪化する。
【0004】
【発明が解決しようとする課題】従って本発明の目的は
、ドキュメント画像におけるゆがみ等の不整合を検出し
そして訂正する方法及び装置を提供することにある。
、ドキュメント画像におけるゆがみ等の不整合を検出し
そして訂正する方法及び装置を提供することにある。
【0005】
【課題を解決するための手段】本発明によれば、ディジ
タル化されたドキュメント画像を変換してアレイH(D
、A)を生成するステップであって、各エレメントH(
D、A)が所定方向に対して角度Aで所定原点から垂線
距離Dにある直線上に横たわる所定特性(例えば、黒画
素)の画素数を表わしているもの、及びアレイの角度A
の支配値を見い出すステップを具備するディジタル化さ
れたドキュメント画像のゆがみを検出する方法が提供さ
れる。
タル化されたドキュメント画像を変換してアレイH(D
、A)を生成するステップであって、各エレメントH(
D、A)が所定方向に対して角度Aで所定原点から垂線
距離Dにある直線上に横たわる所定特性(例えば、黒画
素)の画素数を表わしているもの、及びアレイの角度A
の支配値を見い出すステップを具備するディジタル化さ
れたドキュメント画像のゆがみを検出する方法が提供さ
れる。
【0006】
【実施例】本発明によるひとつの方法を添付図面を参照
して例示として説明する。
して例示として説明する。
【0007】X軸とY軸及び原点Oによって規定された
画像面を示す図1を参照する。この図は水平軸に対して
角度Aで原点Oから垂線距離Dの直線上に横たわる点(
x、y)をも示している。
画像面を示す図1を参照する。この図は水平軸に対して
角度Aで原点Oから垂線距離Dの直線上に横たわる点(
x、y)をも示している。
【0008】いかなる所与の点(x、y)も異なった角
度Aの一連の線上に横たわることがわかる。実際には、
Aの値は多くのディスクリート(discrete)な
ステップで量子化されるので、所与の点が横たわる線の
数は有限である。所与の角度Aに対しての垂線距離Dは
以下の式で与えられる。 D=x sinA +y cosA −−−−(1)こ
こで、Dの値もディスクリートなステップで量子化され
る。
度Aの一連の線上に横たわることがわかる。実際には、
Aの値は多くのディスクリート(discrete)な
ステップで量子化されるので、所与の点が横たわる線の
数は有限である。所与の角度Aに対しての垂線距離Dは
以下の式で与えられる。 D=x sinA +y cosA −−−−(1)こ
こで、Dの値もディスクリートなステップで量子化され
る。
【0009】アレイH(D、A)はこれによって定義で
きる。各エレメントH(D、A)は量子化角度Aと量子
化変位Dを有した多数の線上に横たわる黒画像の点の数
を表わす。一本の直線上の全ての画素は同じDとAの値
を分け合うので、画像中の直線はこのアレイ中に局部的
な最大値を生成する。このことは、連続した線だけでな
く、タイプされたテキスト等のばらばらの線に対しても
正しい。従って、角度Aの支配値はドキュメントの整合
の角度を示している。例えば、タイプされたドキュメン
トの場合、Aの支配値は水平に対するテキストの線の角
度を示す。換言すれば、Aの支配値はドキュメントのゆ
がみ又は不整合の量を示している。
きる。各エレメントH(D、A)は量子化角度Aと量子
化変位Dを有した多数の線上に横たわる黒画像の点の数
を表わす。一本の直線上の全ての画素は同じDとAの値
を分け合うので、画像中の直線はこのアレイ中に局部的
な最大値を生成する。このことは、連続した線だけでな
く、タイプされたテキスト等のばらばらの線に対しても
正しい。従って、角度Aの支配値はドキュメントの整合
の角度を示している。例えば、タイプされたドキュメン
トの場合、Aの支配値は水平に対するテキストの線の角
度を示す。換言すれば、Aの支配値はドキュメントのゆ
がみ又は不整合の量を示している。
【0010】Aの支配値を選らぶひとつの方法としては
、単純に最大値をもったエレメントH(D、A)を見出
すことが挙げられる。しかし、この方法では疑似ピーク
のためにエラーを生ずる可能性がある。この問題を解決
するため、局部的な最大値の数とその大きさを考慮した
“エネルギ”関数e(A)を用いる。この関数は以下の
式で定義される。 e(A)=Σ(H(D、A))2 −−−−− (
2)ここで、積算はDの全ての可能な値に対してなされ
る。 また、ゆがみの支配値角度はe(A)が最大となる角度
Aとなる。
、単純に最大値をもったエレメントH(D、A)を見出
すことが挙げられる。しかし、この方法では疑似ピーク
のためにエラーを生ずる可能性がある。この問題を解決
するため、局部的な最大値の数とその大きさを考慮した
“エネルギ”関数e(A)を用いる。この関数は以下の
式で定義される。 e(A)=Σ(H(D、A))2 −−−−− (
2)ここで、積算はDの全ての可能な値に対してなされ
る。 また、ゆがみの支配値角度はe(A)が最大となる角度
Aとなる。
【0011】次に、本発明を実施する装置を示す図2を
参照して説明する。
参照して説明する。
【0012】この装置はドキュメントスキャナ20と、
画像メモリ21と、プロセッサ22から構成されている
。これらの素子はすべて従来品でよい。スキャナ20は
、例えば、解像度300ドット/インチ(118ドット
/cm)を有したAFGA S200スキャナであっ
てもよい。また、プロセッサ22はSUN3/160ワ
ークステーションであってもよい。
画像メモリ21と、プロセッサ22から構成されている
。これらの素子はすべて従来品でよい。スキャナ20は
、例えば、解像度300ドット/インチ(118ドット
/cm)を有したAFGA S200スキャナであっ
てもよい。また、プロセッサ22はSUN3/160ワ
ークステーションであってもよい。
【0013】次に、ゆがみを測定し訂正する方法を示す
図3のフローチャートを参照して説明する。
図3のフローチャートを参照して説明する。
【0014】ステップ31において、スキャナ20によ
ってドキュメントを走査しディジタル化画像を生成して
これをメモリ21に記憶する。
ってドキュメントを走査しディジタル化画像を生成して
これをメモリ21に記憶する。
【0015】ステップ32において、プロセッサ22は
20番目の線毎に20番目毎の画素をサンプルすること
によって記憶された画像を処理し粗画像(coarse
ned image)を生成する。300ドット/イン
チで走査したドキュメントでは、画像を粗とするこの動
作はゆがみ測定精度に対してなんら問題となる影響を与
えず、処理をより早くできることが実際上見出された。 尚、画像を粗とできる程度は原画像の分解能に依存して
いる。
20番目の線毎に20番目毎の画素をサンプルすること
によって記憶された画像を処理し粗画像(coarse
ned image)を生成する。300ドット/イン
チで走査したドキュメントでは、画像を粗とするこの動
作はゆがみ測定精度に対してなんら問題となる影響を与
えず、処理をより早くできることが実際上見出された。 尚、画像を粗とできる程度は原画像の分解能に依存して
いる。
【0016】ステップ33において、プロセッサは画像
を以下のように変換する。最初に、アレイH(D、A)
を0(ゼロ)に初期化する。次に、(粗とした)画像を
走査し、画像の各黒画素(x、y)に対して以下の動作
を行う。
を以下のように変換する。最初に、アレイH(D、A)
を0(ゼロ)に初期化する。次に、(粗とした)画像を
走査し、画像の各黒画素(x、y)に対して以下の動作
を行う。
【0017】即ち、−Aの最大値(−Amax) から
+Aの最大値(+Amax) までの角度Aの全ての量
子化値に対して、a)上式(1)に従って対応する量子
化変位値Dを計算する。 b)アレイエレメントH(D、A)を1だけインクリメ
ントする。 ここで、本実施例ではAの最大値を20度に選び、この
範囲で角度Aを200レベルに量子化して±1/10度
の分解能を与えている。変位値Dは、A4ページのテキ
ストの最大列数と思われる数に対応する50レベルに量
子化している。従って、アレイH(D、A)は50×2
00エレメントのアレイである。
+Aの最大値(+Amax) までの角度Aの全ての量
子化値に対して、a)上式(1)に従って対応する量子
化変位値Dを計算する。 b)アレイエレメントH(D、A)を1だけインクリメ
ントする。 ここで、本実施例ではAの最大値を20度に選び、この
範囲で角度Aを200レベルに量子化して±1/10度
の分解能を与えている。変位値Dは、A4ページのテキ
ストの最大列数と思われる数に対応する50レベルに量
子化している。従って、アレイH(D、A)は50×2
00エレメントのアレイである。
【0018】ステップ34において、アレイH(D、A
)を以下のように処理する。まず、Aの各値に対して上
式(2)に従って関数e(A)を計算する。次に、e(
A)の最大値を見出してAの対応する値をドキュメント
のゆがみ角度とする。
)を以下のように処理する。まず、Aの各値に対して上
式(2)に従って関数e(A)を計算する。次に、e(
A)の最大値を見出してAの対応する値をドキュメント
のゆがみ角度とする。
【0019】最後にステップ35において、ドキュメン
トのゆがみを訂正する。この訂正は機械的手段を用いて
スキャナ内のドキュメントを物理的に整合させるか、あ
るいはメモリ内の画像を電気的に回転させることによっ
て行ない得る。
トのゆがみを訂正する。この訂正は機械的手段を用いて
スキャナ内のドキュメントを物理的に整合させるか、あ
るいはメモリ内の画像を電気的に回転させることによっ
て行ない得る。
【0020】
【発明の効果】以上説明したように、本発明によれば電
子画像処理に悪影響を及ぼすドキュメント画像のゆがみ
又は不整合が容易に検出され訂正されるので、電子画像
処理の性能が格段に向上することになる。
子画像処理に悪影響を及ぼすドキュメント画像のゆがみ
又は不整合が容易に検出され訂正されるので、電子画像
処理の性能が格段に向上することになる。
【図1】本発明の原理を示すグラフである。
【図2】本発明を実施する装置を示すブロック図である
。
。
【図3】本発明の有するステップを示すフローチャート
である。
である。
20 スキャナ
21 画像メモリ
22 プロセッサ
31 画像ディジタル化
32 画像サンプル
33 アレイH(D、A)の形成
34 支配角度の見出し
35 整合の訂正
Claims (8)
- 【請求項1】 ディジタル化されたドキュメント画像
のゆがみを検出する方法であって、前記方法がディジタ
ル化されたドキュメント画像を変換してアレイH(D、
A)を生成するステップであって、アレイの各エレメン
トH(D、A)が所定方向に対して角度Aで所定原点か
ら垂線距離Dにある直線上に横たわる所定特性(例えば
、黒画素)の画素数を表わしているもの、及びアレイの
角度Aの支配値を見出すステップを具備することを特徴
とするディジタル化されたドキュメント画像のゆがみ検
出方法。 - 【請求項2】 前記角度の支配値を見出すステップは
、Aの各値に対して、Aの値に対応する全てのエレメン
トH(D、A)の2乗の積算に等しい関数e(A)を生
成するステップ、及び関数e(A)の最大値を見出すス
テップを具備することを特徴とする請求項1記載の方法
。 - 【請求項3】 前記変換を行う前にディジタル化ドキ
ュメント画像を粗とするステップを更に具備することを
特徴とする請求項1又は2記載の方法。 - 【請求項4】 前記支配値に等しい訂正角度だけ前記
ディジタル化ドキュメント画像を再整合するステップを
更に具備することを特徴とする請求項1乃至3のいずれ
かに記載の方法。 - 【請求項5】 ドキュメント処理装置であって、前記
装置がドキュメントを走査しディジタル化してディジタ
ル化ドキュメント画像を生成する手段(31)、前記デ
ィジタル化ドキュメント画像を変換してアレイH(D、
A)を生成する手段(33)であって、アレイの各エレ
メントH(D、A)が所定方向に対して角度Aで所定原
点から垂線距離Dにある直線上に横たわる所定特性(例
えば、黒画素)の画素数を表わしているもの、及び前記
アレイH(D、A)を処理してアレイ内の角度Aの支配
値を見い出す手段(34)を具備することを特徴とする
ドキュメント処理装置。 - 【請求項6】 前記アレイを処理する手段(34)は
、Aの各値に対して、Aの値に対応する全てのエレメン
トH(D、A)の2乗の積算に等しい関数e(A)を生
成する手段、及び関数e(A)の最大値を見出す手段を
具備することを特徴とする請求項5記載のドキュメント
処理装置。 - 【請求項7】 前記変換を行う前にディジタル化ドキ
ュメント画像を粗とする手段(32)を更に具備するこ
とを特徴とする請求項5又は6記載のドキュメント処理
装置。 - 【請求項8】 前記角度Aの支配値に等しい訂正角度
だけ前記ドキュメントを再整合する手段(35)を更に
具備することを特徴とする請求項5乃至7のいずれかに
記載のドキュメント処理装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB909022483A GB9022483D0 (en) | 1990-10-17 | 1990-10-17 | Detecting skew in digitised images |
GB9022483.3 | 1990-10-17 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH04333183A true JPH04333183A (ja) | 1992-11-20 |
Family
ID=10683828
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP3261856A Withdrawn JPH04333183A (ja) | 1990-10-17 | 1991-10-09 | ディジタル化画像のゆがみ検出 |
Country Status (5)
Country | Link |
---|---|
EP (1) | EP0485051A3 (ja) |
JP (1) | JPH04333183A (ja) |
AU (1) | AU8581791A (ja) |
GB (1) | GB9022483D0 (ja) |
ZA (1) | ZA915604B (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2100324C (en) * | 1992-08-06 | 2004-09-28 | Christoph Eisenbarth | Method and apparatus for determining mis-registration |
CA2116600C (en) * | 1993-04-10 | 1996-11-05 | David Jack Ittner | Methods and apparatus for inferring orientation of lines of text |
US5818976A (en) * | 1993-10-25 | 1998-10-06 | Visioneer, Inc. | Method and apparatus for document skew and size/shape detection |
EP0702320A1 (en) * | 1994-09-15 | 1996-03-20 | Hewlett-Packard Company | Skew detection |
CN107195070B (zh) * | 2017-05-18 | 2019-09-20 | 深圳怡化电脑股份有限公司 | 一种黑条鉴定方法与装置 |
CN111031188B (zh) * | 2019-11-28 | 2021-07-06 | 宁波华高信息科技有限公司 | 基于cis传感器的扫描仪的纸张歪斜检测方法 |
-
1990
- 1990-10-17 GB GB909022483A patent/GB9022483D0/en active Pending
-
1991
- 1991-07-11 EP EP19910306301 patent/EP0485051A3/en not_active Withdrawn
- 1991-07-17 ZA ZA915604A patent/ZA915604B/xx unknown
- 1991-10-09 JP JP3261856A patent/JPH04333183A/ja not_active Withdrawn
- 1991-10-15 AU AU85817/91A patent/AU8581791A/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
EP0485051A3 (en) | 1993-05-26 |
ZA915604B (en) | 1992-04-29 |
AU8581791A (en) | 1992-04-30 |
EP0485051A2 (en) | 1992-05-13 |
GB9022483D0 (en) | 1990-11-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5054098A (en) | Method of detecting the skew angle of a printed business form | |
US5563403A (en) | Method and apparatus for detection of a skew angle of a document image using a regression coefficient | |
JP3376077B2 (ja) | 歪修正装置、歪修正方法及び画像処理装置 | |
US7715045B2 (en) | System and methods for comparing documents | |
Gatos et al. | Segmentation based recovery of arbitrarily warped document images | |
US20040022451A1 (en) | Image distortion correcting method and apparatus, and storage medium | |
Kapoor et al. | A new algorithm for skew detection and correction | |
JP4527885B2 (ja) | フーリエ変換の相関による回転の修正および重複イメージの識別 | |
US7079265B2 (en) | Distortion correction device for correcting imaged object to produce plane image without distortion | |
JPH04333183A (ja) | ディジタル化画像のゆがみ検出 | |
JP3301030B2 (ja) | 円形状に配列された文字を直線状に配列された文字に変換する方法および装置、並びに、文字認識方法および装置 | |
US5113267A (en) | Apparatus for and method of reconstructing a document | |
JP3697828B2 (ja) | 原稿角度補正方法及び原稿角度補正装置 | |
JP3303246B2 (ja) | 画像処理装置 | |
Abuhaiba | Skew correction of textural documents | |
WO2004032482A1 (ja) | 画像読取装置 | |
Omar et al. | Skew detection and correction of jawi images using gradient direction | |
KR100350854B1 (ko) | 이진 영상 회전 시스템 및 그 방법 | |
US6763143B1 (en) | System and method for variably filtering to compensate for a linearly interpolated signal | |
JPH0628476A (ja) | 画像信号の処理装置 | |
JP3163703B2 (ja) | 原稿読み取り装置 | |
JPH09120430A (ja) | 画像処理装置 | |
Shamgholi et al. | Document Image Dewarping Based on Text Line Detection and Surface Modeling | |
JP3036559B2 (ja) | 文字認識装置 | |
CN116993613A (zh) | 一种激光打印机图像密度校正方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 19990107 |