JP2000113106A - 文書画像処理装置 - Google Patents

文書画像処理装置

Info

Publication number
JP2000113106A
JP2000113106A JP10287500A JP28750098A JP2000113106A JP 2000113106 A JP2000113106 A JP 2000113106A JP 10287500 A JP10287500 A JP 10287500A JP 28750098 A JP28750098 A JP 28750098A JP 2000113106 A JP2000113106 A JP 2000113106A
Authority
JP
Japan
Prior art keywords
document
document image
image processing
inclination
processing apparatus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10287500A
Other languages
English (en)
Inventor
Yutaka Nakamura
豊 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP10287500A priority Critical patent/JP2000113106A/ja
Publication of JP2000113106A publication Critical patent/JP2000113106A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Image Processing (AREA)
  • Facsimile Scanning Arrangements (AREA)

Abstract

(57)【要約】 【課題】 いかなる傾きで取り込まれた文書画像でも、
本来あるべき状態または一定の状態で出力できるように
する。 【解決手段】 スキャナなどによって取り込まれた文書
画像から、文字を一文字単位で囲う外接矩形を抽出す
る。句読点の外接矩形1aは、通常の文字の外接矩形1
に比べて、十分に小さいものとして抽出され、しかも、
その通常の文字の外接矩形1に対する位置は、文書の横
書き・縦書きの別と、取り込まれた文書画像の傾き角度
とによって変化する。文書が行の途中で改行されている
ときの空白の位置も、同様に変化する。傾き検出部で、
外接矩形1から、取り込まれた文書画像の傾き角度を検
出し、その検出角度から、横書き・縦書きの別を仮に判
定する。文書方向判定部で、その仮判定の結果と、句読
点を示す小さい外接矩形の位置および空白の位置とか
ら、文書方向を判定し、修正角度を決定する。傾き検出
部で検出された傾き角度と、文書方向判定部で決定され
た修正角度とに基いて、取り込まれた文書画像の傾き角
度を補正し、文書方向を修正する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、スキャナなどに
よって取り込まれた、文字を含む画像である文書画像を
処理する装置に関する。
【0002】
【従来の技術】例えば、複写機で文書画像を複写する場
合に、原稿をスキャナに傾けて置いたときでも、文字が
傾いていない出力画像が得られるように、スキャナで読
み取られた文書画像の傾きを検出し、補正して出力する
ことが考えられている。
【0003】例えば、特開平3−213053号には、
取り込まれた文書画像から、文書要素として、黒画素の
ひとかたまりを基準とした、文字を一文字単位で囲う外
接矩形を抽出し、その外接矩形の特徴点に対してハフ変
換を実施して、複数の直線を抽出し、その複数の直線か
ら、最小2乗法によって、文書画像の傾きを検出するこ
とが示されている。
【0004】また、特開平5−143774号には、文
書画像に対して最適な画像膨張を行って、文書の行また
は列を統合し、さらに膨張後の画像に対して細線化を行
って、その細線化後の画像の成分に対して統計計算を行
うことによって、文書画像の傾き角度を検知することが
示されている。
【0005】
【発明が解決しようとする課題】しかしながら、上述し
た従来の方法は、いずれも、取り込まれた文書画像が、
ある角度で傾いているときに、それを検出し、補正する
だけである。
【0006】しかし、例えば、複写機で文書画像を複写
する場合に、原稿を上下反転させて(180度傾け
て)、または90度傾けて置くことがある。このような
場合、出力画像を上下反転させて、または90度傾けて
読めばよいが、しかし、例えば、視力が弱い人のため
に、文字を何倍かに拡大して、したがって1ページ分の
原稿を数ページ分の出力画像にして、出力しようとする
と、原稿を上下反転させて、または90度傾けて置いた
場合には、文字の読み取り順序が正しい順序にならない
ために、出力画像において文字の配列が正しい配列にな
らなくなり、文書を読み取ることが困難となる。
【0007】特開平5−274374号には、文書画像
の一部分につき所定数だけ文字認識を行い、認識率が低
い場合には、文書画像を180度回転させて再度、文字
認識を行って、その認識率が前の認識率より高いときに
は、文書画像を180度回転させて光ディスクに格納す
ることが示されている。
【0008】しかし、この方法は、取り込まれた文書画
像が上下反転しているか否かは判定できるものの、右方
向または左方向に90度傾いているときには判定不能と
なる。しかも、文字認識を利用するため、処理速度が遅
くなるとともに、装置のコストが高くなる欠点がある。
【0009】そこで、この発明は、文書画像が90度ま
たは180度、傾いて取り込まれた場合を含めて、いか
なる傾きで取り込まれた場合でも、文書画像を本来ある
べき状態または一定の状態で出力することができるよう
にしたものである。
【0010】
【課題を解決するための手段】この発明では、文書画像
処理装置として、文書画像を取り込む画像入力手段と、
その取り込まれた文書画像から文書要素を抽出する文書
要素抽出手段と、その抽出された文書要素から、前記取
り込まれた文書画像の傾き角度を検出する傾き検出手段
と、前記抽出された文書要素と前記検出された傾き角度
とから、前記取り込まれた文書画像の文書方向を判定す
る文書方向判定手段と、前記検出された傾き角度と前記
判定された文書方向とに基いて、前記取り込まれた文書
画像の傾き角度を補正し、文書方向を修正する文書画像
処理手段と、を設ける。
【0011】
【作用】上記のように構成した、この発明の文書画像処
理装置においては、傾き検出手段によって、画像入力手
段により取り込まれた文書画像の傾き角度が検出される
だけでなく、文書方向判定手段によって、画像入力手段
により取り込まれた文書画像の文書方向が判定され、傾
き検出手段による検出結果と文書方向判定手段による判
定結果とから、文書画像処理手段によって、取り込まれ
た文書画像の傾き角度が補正され、かつ文書方向が修正
されるので、文書画像が90度または180度、傾いて
取り込まれた場合を含めて、いかなる傾きで取り込まれ
た場合でも、文書画像を本来あるべき状態または一定の
状態で出力することができる。
【0012】
【発明の実施の形態】図1は、この発明の文書画像処理
装置の一実施形態を示す。この実施形態の文書画像処理
装置は、画像入力部11、データ蓄積部12、文書要素
抽出部13、傾き検出部14、文書方向判定部15、文
書画像処理部16、および画像出力部17によって構成
される。
【0013】画像入力部11は、スキャナなどで、文書
画像をデジタルデータとして取り込み、以後の処理に適
した形態で出力するものである。
【0014】データ蓄積部12は、画像入力部11から
得られた文書画像データや、文書要素抽出部13での処
理によって得られたデータ、文書画像処理部16での処
理によって得られた文書画像データなどを格納するもの
である。
【0015】文書要素抽出部13は、画像入力部11か
ら得られた文書画像データを解析処理して、文書要素と
して、黒画素のひとかたまりを基準とした、文字を一文
字単位で囲う外接矩形を抽出するものである。
【0016】傾き検出部14は、この文書要素抽出部1
3から得られた外接矩形情報をもとに、画像入力部11
によって取り込まれた文書画像の傾き角度を検出するも
のである。
【0017】文書方向判定部15は、文書要素抽出部1
3から得られた外接矩形情報と、傾き検出部14によっ
て検出された傾き角度とから、取り込まれた文書画像の
文書方向を判定するものである。
【0018】文書画像処理部16は、傾き検出部14に
よって検出された傾き角度と、文書方向判定部15によ
って判定された文書方向とに基いて、画像入力部11か
ら得られた文書画像データを処理して、文書画像の傾き
角度を補正し、文書方向を修正するものである。文書画
像処理部16では、必要に応じて、その他の画像処理が
なされる。
【0019】画像出力部17は、この文書画像処理部1
6での処理後の文書画像データを、出力画像として用紙
上などに出力するものである。
【0020】図2(A)は、取り込まれた文書画像が右
下がりの方向に、ある角度で傾いている状態を示してい
る。文書要素抽出部13では、このような文書画像か
ら、黒画素のひとかたまりごとを、文字の構成要素とし
て抽出する。このような処理としては、例えば、基本的
な画像処理手法であるラベリングを利用することができ
る。
【0021】さらに、文書要素抽出部13では、この黒
画素のひとかたまりを基準として、文字を一文字単位で
囲う外接矩形1を抽出する。この場合には、文書画像の
傾きが大きいときでも、黒画素のひとかたまりは接触す
ることがないため、外接矩形1同士が包含関係になった
としても、データとしては互いに分離されている。そし
て、以降の処理では、外接矩形1を、必要に応じて単独
で、または統合して用いることができる。
【0022】文書要素抽出部13では、さらに、その抽
出した個々の外接矩形1から、傾き角度の検出に必要な
情報を抽出する。後述するように、傾き角度の検出にハ
フ変換を利用する場合には、点列から推測される直線を
抽出し、その直線の傾きから文書画像の傾き角度を推定
するので、抽出する情報としては、図2(B)に示すよ
うな特徴点A,B,Cが望ましい。特徴点Aは、外接矩
形1の一辺の中央の点であり、特徴点Cは、対向する辺
の中央の点であり、特徴点Bは、点Aと点Cの中間の点
である。ただし、ハフ変換による傾き検出には、これら
特徴点A,B,Cのうちの1点のみでなく、複数の点を
用いることができる。
【0023】傾き検出部14では、このように文書要素
抽出部13で抽出された特徴点に対してハフ変換を実施
することによって、文書画像の傾き角度を検出する。
【0024】ハフ変換は、図3(A)に示すようなXY
平面上の点を、図3(B)に示すようなρ−θパラメー
タ空間上に写像するものであり、XY平面上の1つの点
が、ρ−θパラメータ空間上では1つのサイン波形とし
て表される。図3(A)の点P1,P2,P3は、上述
したように文書要素抽出部13で抽出された特徴点、例
えば図2(B)に示した点Aで、このXY平面上の点P
1,P2,P3が、それぞれρ−θパラメータ空間上で
1つのサイン波形として表される。
【0025】そして、ρ−θパラメータ空間上で複数の
サイン波形が、交点(ρ1,θ1)を形成して交差する
ときには、それぞれのサイン波形に対応するXY平面上
の点P1,P2,P3が、XY平面上で1つの直線L1
として表されることを示し、その直線L1にXY平面の
原点Oから垂線Vを引いたときの、垂線VのXY平面の
X軸に対する傾き角度がθ1であり、垂線Vの長さがρ
1であることを示す。したがって、文書画像の傾き角度
をθ1として検出することができる。
【0026】ただし、このようにハフ変換によってρ−
θパラメータ空間から傾き角度を求める場合、従来の方
法では、交差するサイン波形の数が一番多い交点のθ座
標を傾き角度としている。しかし、この方法では、図4
(A)に示すように、例えば破線2が存在する場合、そ
の特徴がρ−θパラメータ空間上に顕著に表れてしま
い、傾き角度を間違えてしまうことがある。
【0027】そこで、この例では、ρ−θパラメータ空
間上の交点のθ座標の頻度を考慮することによって、傾
き検出の精度を向上させる。これは、文書画像には複数
の行(縦書き文書でも「行」と称する)が存在している
という前提に基づいている。
【0028】図4(A)に示すように、文書画像には複
数の行3a,3b,3cが存在している。したがって、
それぞれの行3a,3b,3cにつき、外接矩形1の特
徴点に対してハフ変換が実施されることによって、それ
ぞれの行3a,3b,3cにつき、ρ−θパラメータ空
間上で複数のサイン波形が交差するような、XY平面上
の線分が抽出されるはずであり、しかも、それらはθ座
標が同一ないしほぼ同一となるはずである。
【0029】ただし、抽出された線分に対応するρ−θ
パラメータ空間上の交点で交差するサイン波形の数は、
抽出された線分ごとに、まちまちである。また、場合に
よっては、文書の本来の行によってサイン波形が交差す
る数よりも、破線2などの外乱によってサイン波形が交
差する数の方が多いことがある。
【0030】そこで、交差するサイン波形の数が最大と
なる交点のθ座標を傾き角度とするのではなく、一つの
方法としては、一つの交点で交差するサイン波形の数が
所定数N以上となる交点につき、それぞれθ座標が同一
の交点で交差するサイン波形の数を全て加算し、その合
計が最大となるθ座標を傾き角度とする。
【0031】例えば、図4(B)は、ρ−θパラメータ
空間上で、図4(A)の行3a,3b,3cに対応し
て、それぞれ、3つのサイン波形がθ=θ1の交点で交
差して、波形群4a,4b,4cを形成し、図4(A)
の破線2に対応して、6つのサイン波形がθ=θ2の交
点で交差して、1つの波形群5を形成している状態を示
す。
【0032】このとき、N=3とすると、全ての交点
が、交差するサイン波形の数の加算対象となり、θ=θ
1の交点で交差するサイン波形の合計は、3+3+3=
9となるのに対して、θ=θ2の交点で交差するサイン
波形の合計は、6となる。したがって、θ=θ1の交点
が正しい交点であり、傾き角度はθ1である、と検出さ
れる。これに対して、交差するサイン波形の数が最大と
なる交点のθ座標を傾き角度とする場合には、傾き角度
はθ2という間違った値として検出されてしまう。
【0033】ρ−θパラメータ空間上の交点のθ座標の
頻度を考慮する別の方法として、所定数N以上の数のサ
イン波形が交差する交点のθ座標の頻度の和が最大にな
るθ座標を傾き角度とすることもできる。
【0034】例えば、図4(B)において、N=3とす
ると、全ての交点がθ座標の頻度の加算対象となり、θ
1の頻度の和は3となるのに対して、θ2の頻度の和は
1となる。したがって、θ=θ1の交点が正しい交点で
あり、傾き角度はθ1である、と検出される。
【0035】なお、図4(A)で上述したように、文書
画像の複数の行につき抽出されるXY平面上の複数の線
分は、傾き角度が若干異なるものとして検出されること
があるので、上述したρ−θパラメータ空間上の交点の
θ座標の頻度を考慮する方法では、θ座標は若干の幅の
範囲内では同一の値として処理することが望ましい。
【0036】ハフ変換によって求まる傾き角度θ1は、
図3(A)に示したように、行方向の直線L1にXY平
面の原点Oから垂線Vを引いたときの、垂線VのXY平
面のX軸に対する傾き角度である。
【0037】そのため、図5(A)に示すように、文書
方向が縦書きの場合には、求められた傾き角度θ1その
ものが文書画像の傾き角度であるのに対して、同図
(B)に示すように、文書方向が横書きの場合には、θ
1−90度が文書画像の傾き角度である。
【0038】そこで、傾き検出部14では、さらに、θ
1が45度以下の場合には、文書方向を仮に縦書きと判
定して、θ1をそのまま検出角度とし、θ1が45度を
超える場合には、文書方向を仮に横書きと判定して、θ
1−90度を検出角度とする。これによって、後述する
ように文書画像の傾き角度を補正することができる。
【0039】文書方向判定部15では、この傾き検出部
14での文書方向の仮判定を修正するように、文書方向
を判定する。
【0040】図6(A)〜(D)は、いずれも、横書き
の文書画像が取り込まれた場合である。しかし、(A)
は傾きなく取り込まれた場合であるのに対して、(B)
は右方向に90度傾いて、(C)は上下反転して、
(D)は左方向に90度傾いて、取り込まれた場合であ
る。傾き検出部14での上記の仮判定では、(A)
(C)の場合には、横書きと判定されるのに対して、
(B)(D)の場合には、縦書きと判定されてしまう。
しかも、(C)の場合には、横書きと判定されるもの
の、上下反転していることは検知されない。
【0041】図7(A)〜(D)は、いずれも、縦書き
の文書画像が取り込まれた場合である。しかし、(A)
は傾きなく取り込まれた場合であるのに対して、(B)
は右方向に90度傾いて、(C)は上下反転して、
(D)は左方向に90度傾いて、取り込まれた場合であ
る。傾き検出部14での上記の仮判定では、(A)
(C)の場合には、縦書きと判定されるのに対して、
(B)(D)の場合には、横書きと判定されてしまう。
しかも、(C)の場合には、縦書きと判定されるもの
の、上下反転していることは検知されない。
【0042】そのため、文書方向判定部15では、傾き
検出部14での仮判定の結果と、文書要素抽出部13で
抽出された外接矩形1の大きさや位置などとから、最終
的に文書方向を判定し、修正角度を決定する。この処理
は、文字認識を利用しないので、処理が軽くなり、処理
速度が速くなる利点がある。
【0043】文書画像には句読点が存在し、その句読点
の外接矩形は、通常の文字の外接矩形に比べて、1/2
以下の小さいものとして抽出される。しかも、図6
(A)〜(D)および図7(A)〜(D)から明らかな
ように、その句読点の外接矩形の、通常の文字の外接矩
形に対する位置は、文書の横書き・縦書きの別と、取り
込まれた文書画像の傾き角度とによって変化する。さら
に、文書が行の途中で改行されているとき、文書画像が
傾きなく取り込まれた場合には、横書き文書では、その
行の右側に空白を生じ、縦書き文書では、その行の下側
に空白を生じる。
【0044】そこで、この例では、文書方向判定部15
では、傾き検出部14での仮判定の結果と、句読点を示
す小さい外接矩形の位置および空白の位置とから、最終
的に文書方向を判定し、修正角度を決定する。
【0045】例えば、図8(A)は、図6(A)のよう
に、横書きの文書画像が傾きなく取り込まれた場合であ
り、図8(B)は、図7(A)のように、縦書きの文書
画像が傾きなく取り込まれた場合である。
【0046】図8(A)の場合、傾き検出部14での仮
判定は「横書き」であるとともに、句読点を示す小さい
外接矩形1aが下側に位置し、その小さい外接矩形1a
の右側に空白が存在するので、文書方向判定部15で
は、最終的に、文書方向を修正する必要がないと判定す
る。
【0047】図8(B)の場合、傾き検出部14での仮
判定は「縦書き」であるとともに、句読点を示す小さい
外接矩形1aが右側に位置し、その小さい外接矩形1a
の下側に空白が存在するので、文書方向判定部15で
は、最終的に、文書方向を修正する必要がないと判定す
る。
【0048】図9は、図6(A)〜(D)および図7
(A)〜(D)の各場合についての、傾き検出部14で
の仮判定の結果、句読点を示す小さい外接矩形の位置、
空白の位置、および文書方向判定部15で決定される修
正角度を示す。8つの場合につき、仮判定の結果、句読
点を示す小さい外接矩形の位置、および空白の位置の関
係は、別個独立であり、これから、文書方向を一意に判
定し、修正角度を一意に決定することができる。
【0049】なお、さらに精度を高めるため、例えば、
改行後の行の先頭の空白の位置(文書画像が傾きなく取
り込まれた場合には、横書き文書では左端に生じ、縦書
き文書では上端に生じる)なども、判定材料とするよう
にしてもよい。
【0050】また、英語の文書では「.」「,」が用い
られ、日本語の文書でも句読点の代わりに「.」「,」
が用いられたものがあるが、これを句読点と同様に判断
することによって、上述したように文書方向を判定する
ことができる。
【0051】文書画像処理部16では、傾き検出部14
によって検出された傾き角度と、文書方向判定部15に
よって決定された修正角度とを用いて、文書画像の傾き
角度を補正し、文書方向を修正する。
【0052】この場合、(1)まず、文書要素抽出部1
3で元の画像から外接矩形情報を抽出し、次に、傾き検
出部14で元の画像の傾き角度を検出し、次に、その検
出結果によって文書画像処理部16で元の画像の傾き角
度を補正し、次に、その補正後の画像から文書要素抽出
部13で外接矩形情報を抽出し、次に、その外接矩形情
報から文書方向判定部15で文書方向を判定し、次に、
その判定結果によって文書画像処理部16で傾き角度の
補正後の画像の文書方向を修正する方法、(2)まず、
文書要素抽出部13で元の画像から外接矩形情報を抽出
し、次に、傾き検出部14で元の画像の傾き角度を検出
し、次に、その検出結果によって元の外接矩形情報に対
してデータ的に傾き角度の補正を行い、次に、その補正
後の外接矩形情報から文書方向判定部15で文書方向を
判定し、次に、その判定結果と傾き検出部14の検出結
果とによって、文書画像処理部16で元の画像の傾き角
度を補正し、文書方向を修正する方法、(3)まず、文
書要素抽出部13で元の画像から外接矩形情報を抽出
し、次に、傾き検出部14で元の画像の傾き角度を検出
し、次に、その検出結果と外接矩形情報とから文書方向
判定部15で文書方向を判定し、次に、その判定結果と
傾き検出部14の検出結果とによって、文書画像処理部
16で元の画像の傾き角度を補正し、文書方向を修正す
る方法、など、いずれの方法によってもよい。
【0053】そして、画像出力部17では、その補正修
正後の文書画像を用紙上などに出力する。したがって、
図10の取り込み画像7b,7c,7d,7eのように
傾いて取り込まれた文書画像は、出力画像7aで示すよ
うに、その傾きが補正されて出力される。
【0054】なお、取り込まれた文書画像中に句読点や
空白などが全く存在せず、文書方向を判定することがで
きない場合には、文書方向判定部15では判定不能と判
断する。この場合には、文書方向は修正されず、傾き角
度のみが補正されて、画像出力される。
【0055】上述した例は文書画像全体に対して処理を
行う場合であるが、文書画像の分割された領域ごとに上
述した処理を行うこともできる。
【0056】また、傾き検出や文書方向判定などの処理
は、原画像そのものに対してではなく、原画像を縮小ま
たは拡大した画像に対して行ってもよい。
【0057】
【発明の効果】上述したように、この発明によれば、文
書画像が90度または180度、傾いて取り込まれた場
合を含めて、いかなる傾きで取り込まれた場合でも、文
書画像を本来あるべき状態または一定の状態で出力する
ことができる。しかも、文字認識のような複雑な処理を
必要としないので、高速の処理が可能になるとともに、
装置のコストを低減することができる。
【図面の簡単な説明】
【図1】この発明の文書画像処理装置の一実施形態を示
す図である。
【図2】文書要素抽出部で抽出される外接矩形および特
徴点を示す図である。
【図3】傾き検出部で行うハフ変換の説明に供する図で
ある。
【図4】外乱の影響を除去した傾き検出の説明に供する
図である。
【図5】文書方向に応じて傾き検出角度が異なることを
示す図である。
【図6】横書きの文書画像の取り込み例を示す図であ
る。
【図7】縦書きの文書画像の取り込み例を示す図であ
る。
【図8】文書方向判定部での文書方向判定の判定の説明
に供する図である。
【図9】図6および図7の各場合における判定材料と判
定結果を示す図である。
【図10】いかなる傾きで取り込まれた文書画像でも一
定の状態で出力されることを示す図である。
【符号の説明】
1…外接矩形 11…画像入力部 12…データ蓄積部 13…文書要素抽出部 14…傾き検出部 15…文書方向判定部 16…文書画像処理部 17…画像出力部

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】文書画像を取り込む画像入力手段と、 その取り込まれた文書画像から文書要素を抽出する文書
    要素抽出手段と、 その抽出された文書要素から、前記取り込まれた文書画
    像の傾き角度を検出する傾き検出手段と、 前記抽出された文書要素と前記検出された傾き角度とか
    ら、前記取り込まれた文書画像の文書方向を判定する文
    書方向判定手段と、 前記検出された傾き角度と前記判定された文書方向とに
    基いて、前記取り込まれた文書画像の傾き角度を補正
    し、文書方向を修正する文書画像処理手段と、 を備えることを特徴とする文書画像処理装置。
  2. 【請求項2】請求項1の文書画像処理装置において、 前記文書要素抽出手段は、前記文書要素として、黒画素
    のひとかたまりを基準とした外接矩形を抽出することを
    特徴とする文書画像処理装置。
  3. 【請求項3】請求項2の文書画像処理装置において、 前記傾き検出手段は、前記抽出された外接矩形の1つ以
    上の特徴点を用いて傾き角度を検出することを特徴とす
    る文書画像処理装置。
  4. 【請求項4】請求項3の文書画像処理装置において、 前記傾き検出手段は、前記特徴点に対してハフ変換を実
    施して、パラメータ空間上の交差数が所定数以上となる
    交点につき、パラメータ値ごとに交差数の総和を求め、
    その総和が最大となるパラメータ値によって、傾き角度
    を決定することを特徴とする文書画像処理装置。
  5. 【請求項5】請求項3の文書画像処理装置において、 前記傾き検出手段は、前記特徴点に対してハフ変換を実
    施して、パラメータ空間上の交差数が所定数以上となる
    交点につき、パラメータ値ごとに交点の総和を求め、そ
    の総和が最大となるパラメータ値によって、傾き角度を
    決定することを特徴とする文書画像処理装置。
  6. 【請求項6】請求項2の文書画像処理装置において、 前記文書方向判定手段は、前記検出された傾き角度と、
    前記外接矩形の大きさ、位置または配置関係とから、文
    書方向を判定することを特徴とする文書画像処理装置。
  7. 【請求項7】請求項1の文書画像処理装置において、 前記傾き検出手段、文書方向判定手段および文書画像処
    理手段は、前記取り込まれた文書画像の分割された領域
    ごとに、それぞれの処理を行うことを特徴とする文書画
    像処理装置。
  8. 【請求項8】請求項1の文書画像処理装置において、 前記傾き検出手段、文書方向判定手段および文書画像処
    理手段は、前記取り込まれた文書画像を縮小または拡大
    した画像につき、それぞれの処理を行うことを特徴とす
    る文書画像処理装置。
JP10287500A 1998-10-09 1998-10-09 文書画像処理装置 Pending JP2000113106A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10287500A JP2000113106A (ja) 1998-10-09 1998-10-09 文書画像処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10287500A JP2000113106A (ja) 1998-10-09 1998-10-09 文書画像処理装置

Publications (1)

Publication Number Publication Date
JP2000113106A true JP2000113106A (ja) 2000-04-21

Family

ID=17718157

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10287500A Pending JP2000113106A (ja) 1998-10-09 1998-10-09 文書画像処理装置

Country Status (1)

Country Link
JP (1) JP2000113106A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005346607A (ja) * 2004-06-07 2005-12-15 Fuji Xerox Co Ltd 原稿画像判定装置、原稿画像判定方法及びそのプログラム
CN100535930C (zh) * 2007-10-23 2009-09-02 北京大学 一种复杂结构文档图像倾斜快速检测方法
CN108304840A (zh) * 2017-08-31 2018-07-20 腾讯科技(深圳)有限公司 一种图像数据处理方法以及装置
CN111091505A (zh) * 2019-11-26 2020-05-01 浙江大学 基于古典概型的影印图像倾斜纠正方法
CN111768345A (zh) * 2020-05-12 2020-10-13 北京奇艺世纪科技有限公司 身份证背面图像的校正方法、装置、设备及存储介质
CN115359493A (zh) * 2022-10-08 2022-11-18 深圳比特微电子科技有限公司 旋转文字检测方法和装置

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005346607A (ja) * 2004-06-07 2005-12-15 Fuji Xerox Co Ltd 原稿画像判定装置、原稿画像判定方法及びそのプログラム
JP4697387B2 (ja) * 2004-06-07 2011-06-08 富士ゼロックス株式会社 原稿画像判定装置、原稿画像判定方法及びそのプログラム
CN100535930C (zh) * 2007-10-23 2009-09-02 北京大学 一种复杂结构文档图像倾斜快速检测方法
CN108304840A (zh) * 2017-08-31 2018-07-20 腾讯科技(深圳)有限公司 一种图像数据处理方法以及装置
CN108304840B (zh) * 2017-08-31 2022-11-11 腾讯科技(深圳)有限公司 一种图像数据处理方法以及装置
CN111091505A (zh) * 2019-11-26 2020-05-01 浙江大学 基于古典概型的影印图像倾斜纠正方法
CN111091505B (zh) * 2019-11-26 2022-06-24 浙江大学 基于古典概型的影印图像倾斜纠正方法
CN111768345A (zh) * 2020-05-12 2020-10-13 北京奇艺世纪科技有限公司 身份证背面图像的校正方法、装置、设备及存储介质
CN115359493A (zh) * 2022-10-08 2022-11-18 深圳比特微电子科技有限公司 旋转文字检测方法和装置
CN115359493B (zh) * 2022-10-08 2023-09-08 深圳比特微电子科技有限公司 旋转文字检测方法和装置

Similar Documents

Publication Publication Date Title
KR100247970B1 (ko) 문서 영상의 방향 교정방법
JPH0721310A (ja) 文書認識装置
JP2000113106A (ja) 文書画像処理装置
JPH1173475A (ja) 行方向判定装置、画像傾き検出装置及び画像傾き補正装置
JP3006466B2 (ja) 文字入力装置
JP2890306B2 (ja) 表領域分離装置および表領域分離方法
JP3171626B2 (ja) 文字認識の処理領域・処理条件指定方法
JPH06203202A (ja) 画像処理装置
JPH07220081A (ja) 画像認識装置の図形の切出し方法
EP0601730A1 (en) Image processing method for correcting character slant
JPS63308689A (ja) 文字の傾き角度検出修正方式
JPH07152857A (ja) 運転免許証認識装置
JP3604909B2 (ja) 画像間位置合わせ方法
JPH117493A (ja) 文字認識処理装置
JPH0728935A (ja) 文書画像処理装置
JPH01156887A (ja) 文字認識装置
JPH0916713A (ja) 画像領域分割方法
JP3406942B2 (ja) 画像処理装置及び方法
JPH11250179A (ja) 文字認識装置および文字認識方法
JP2004241827A (ja) 画像処理装置、画像処理方法、画像処理プログラムおよび記憶媒体
JPH0573718A (ja) 領域属性識別方式
JP2917394B2 (ja) 文字認識装置及び文字切り出し方法
JPH04276888A (ja) 文字読取装置
JP2962525B2 (ja) テキストブロック認識方法
JPH09288714A (ja) 表認識方法および装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061206

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070201

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070228