JP3320759B2 - 文書画像傾き検出装置およびその方法 - Google Patents

文書画像傾き検出装置およびその方法

Info

Publication number
JP3320759B2
JP3320759B2 JP34541991A JP34541991A JP3320759B2 JP 3320759 B2 JP3320759 B2 JP 3320759B2 JP 34541991 A JP34541991 A JP 34541991A JP 34541991 A JP34541991 A JP 34541991A JP 3320759 B2 JP3320759 B2 JP 3320759B2
Authority
JP
Japan
Prior art keywords
black
pixel
complexity
pixels
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP34541991A
Other languages
English (en)
Other versions
JPH05174183A (ja
Inventor
康人 石谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP34541991A priority Critical patent/JP3320759B2/ja
Priority to US07/996,106 priority patent/US5506918A/en
Publication of JPH05174183A publication Critical patent/JPH05174183A/ja
Application granted granted Critical
Publication of JP3320759B2 publication Critical patent/JP3320759B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformation in the plane of the image
    • G06T3/60Rotation of a whole image or part thereof
    • G06T3/608Skewing or deskewing, e.g. by two-pass or three-pass rotation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/1475Inclination or skew detection or correction of characters or of image to be recognised
    • G06V30/1478Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • H04N1/3877Image rotation
    • H04N1/3878Skew detection or correction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文書読み取り装置また
は文書ファイリング装置等に文書を入力する際に入力文
書の傾きを検出し、補正する文書画像傾き検出装置およ
びその方法に関する。
【0002】
【従来の技術】一般に、文書読み取り装置では、入力文
書の傾きが検出・補正されていると入力文書のレイアウ
ト等の構造理解や入力文書に記載されている文字の読み
取りが、傾きを補正しない場合に較べて容易となる。
【0003】入力文書の傾きを検出する際、入力文書に
罫線などの基準が常に存在するとは限らないので一般に
は文字列の傾きを検出して補正する必要がある。従来、
文字列の傾きを検出する方法として、例えば「書式指定
情報によらない紙面構成要素抽出法」(電子情報通信学
会、論文誌D、vol、J66−D、No.1、PP1
11〜118、1983)に示されているように、文書
全体に対して黒画素部の周辺分布を複数の角度方向に対
して求め、分布が最も先鋭となる方向の角度を探索する
方法が提案されている。しかしこの方法には図・写真お
よびノイズ等による悪影響を受け易く、処理時間にコス
トがかかるいう問題点があった。この他に、例えば、
「文書画像の傾き補正のための一方式」(電子情報通信
学会、論文誌D、vol、J69−D、No.11、P
P1833〜1834、1986)に示されているよう
に、入力文書全体に輪郭抽出処理を施すことにより求め
た黒結成分矩形に対して外接長方形の底辺に関する周辺
分布が鋭くなる方向を抽出して文書画像の傾きを検出す
る方式が提案されている。しかし、この方式では、全体
の処理における輪郭抽出処理の比重が大きく、実用的な
処理時間で黒連結成分の外接長方形を抽出できないとい
う問題点があった。
【0004】
【発明が解決しようとする課題】このように、従来の文
書画像傾き検出方式および装置では、図・写真およびノ
イズ等により悪影響を受け易いという欠点があり、さら
に処理時間に関してコストがかかるという問題点があっ
た。
【0005】この発明はこのような従来の課題を解決す
るためになされたもので、その目的とするところは、入
力文書画像中に図・写真・ノイズ等が含まれていても文
書画像の傾きを効率良く正確に検出することのできる文
書画像傾き検出方式を提供することにある。
【0006】
【課題を解決するための手段】上記目的を解決するた
め、本発明は文書を白画素と黒画素で構成される2値の
文書画像に変換する手段と、2値の文書画像において、
水平または垂直のどちらか一方向若しくは両方向におい
て、黒画素に挟まれる長さδ画素以下の白画素を黒画素
に変換することにより、近接する黒画素が融合された画
像に変換する手段と、前記近接する黒画素が融合された
画像を、n個×m個のメッシュに分割し、各メッシュを
水平方向もしくは垂直方向のどちらかに走査して、各走
査線毎に白画素から黒画素若しくは黒画素から白画素に
変化する回数の総和が最大となる連続したi個×j個の
メッシュ領域を局所領域として抽出する手段と、前記局
所領域を複数の角度方向で走査する手段と、前記局所領
域について、各走査線毎に白画素から黒画素若しくは黒
画素から白画素に変化する回数の2乗値の総和を局所領
域全体で計算する手段と、各走査線で白画素から黒画素
若しくは黒画素から白画素に変化する回数の2乗値の総
和が最大となる走査角度方向を文書画像の傾き角度とし
て検出する手段とを具備することを特徴とする。
【0007】また、文書を白画素と黒画素で構成される
2値の文書画像に変換するステップと、2値の文書画像
において、水平または垂直のどちらか一方向若しくは両
方向において、黒画素に挟まれる長さδ画素以下の白画
素を黒画素に変換することにより、近接する黒画素が融
合された画像に変換するステップと、前記近接する黒画
素が融合された画像を、n個×m個のメッシュに分割
し、各メッシュを水平方向もしくは垂直方向のどちらか
に走査して、各走査線毎に白画素から黒画素若しくは黒
画素から白画素に変化する回数の総和が最大となる連続
したi個×j個のメッシュ領域を局所領域として抽出す
るステップと、前記局所領域を複数の角度方向で走査す
るステップと、前記局所領域について、各走査線毎に白
画素から黒画素若しくは黒画素から白画素に変化する回
数の2乗値の総和を局所領域全体で計算するステップ
と、各走査線で白画素から黒画素若しくは黒画素から白
画素に変化する回数の2乗値の総和が最大となる走査角
度方向を文書画像の傾き角度として検出するステップと
を有することを特徴とする。
【0008】
【作用】本発明による文書画像傾き検出方式では、入力
文書を複数の角度方向に走査して、それぞれの方向の複
雑度を抽出し、複雑度が最も大きい方向の角度を探索す
ることにより文書画像の傾きを検出するので、文字列部
に較べて複雑度の小さい図・写真およびノイズ部分によ
る影響の受けずに文書画像の傾きを検出することができ
る。
【0009】また、入力文書の一部分である文字列が大
半を占めている局所領域を抽出し、その部分に対して傾
き検出を行うので、実用的な処理時間で入力文書の傾き
を検出することができる。
【0010】
【実施例】以下、図面に基づいて本発明の実施例につい
て説明する。図1は本発明の文書傾き検出方式を説明す
るためのブロック図である。まず本発明の文書傾き検出
方式の手続きを概説する。
【0011】イメージスキャナ等の画像入力装置で構成
されている画像入力部1より入力された文書画像に対し
て2値化処理部2で入力文書画像を2値化した後黒画素
融合処理部3で水平または垂直方向のどちらか一方ある
いは両方向において、黒画素に挟まれる長さδ画素以下
の白画素を黒画素に変換することにより近接する黒画素
を融合し、文書画像全体に含まれる黒連結画素の数を減
らした画像Isを生成する。次いで局所領域抽出部4で
前記黒画素融合処理部3において生成された画像のうち
最も複雑度の大きい部分領域を局所領域Laとして抽出
する。この局所領域Laは、大半が文字列で占められて
いると見なすことができる。データ管理部5は、その後
の処理が効率的に行われることを目的として局所領域抽
出部4で抽出した局所領域Laに含まれる画像を圧縮し
て管理する。傾き検出部6では、データ管理部5で管理
されているデータを用いて入力文書画像の傾きを検出す
る。そして、傾き検出部6で検出された傾き角度に対し
て判定部7で入力文書の傾きを補正するか否かを判定す
る。これらのうち2値化処理部2で実施される2値化処
理は現在公知である種々の手法により実現されても良
い。また、2値化処理機能を有するスキャナー等を画像
入力部として用いた場合には2値化処理部2は省略され
る。以下、各構成部分での動作を詳述する。
【0012】黒画素融合処理部3では、水平方向または
垂直方向あるいはその両方向に近接する複数の黒連結画
素(一定方向に連続する黒画素)を1つの黒連結画素と
して入力文書中に含まれる黒連結画素の個数を減らす。
この処理の目的は、傾き検出部6において複雑度を抽出
するときに処理量が削減されることと、局所領域抽出部
4において部分領域を抽出するときにノイズ部分や写真
部分を誤って抽出しないことである。具体的には、ある
長さδ画素以下より短く、かつ黒画素に挟まれている白
画素をすべて黒画素に変えることにより実現する。この
とき問題になるのはδという値の選び方である。傾き検
出部6では画像の複雑度を抽出することにより入力文書
の傾きを検出するものであるから、ここでδを大きく取
ると入力文書に含まれる文字のストロークや文字同士が
融合してしまうため抽出される複雑度が意味の無いもの
となってしまう。したがってδは、文字のストロークや
文字同士が融合せず、胡麻塩状の細かいノイズ部分やか
すれている写真部分などに含まれる黒連結画素の数が少
なく成る程度に小さい値とする。この処理が実施される
と、ノイズ、図、写真等の複雑度が小さくなるので文字
列領域部分の複雑度が入力文書中最も高くなる。なお、
黒画素融合処理で得られる画像をIsとする。
【0013】局所領域抽出部4では、黒画素融合処理部
3で得られた画像Isから傾き検出部6の処理対象とな
る局所領域Laを抽出する。傾き検出部6では、処理対
象の画像中に含まれる文字列の傾きを検出することによ
り入力文書の傾きを推定するので、この局所領域抽出部
4で抽出される局所領域は大半が文字列で占められてい
る必要がある。局所領域Laの検出は、画像Isの中で
最も複雑度の大きい局所領域を抽出することによって実
現される。具体的な局所領域の抽出方法は例えば次のよ
うになる。
【0014】まず図2に示すように画像Isをm個×n
個のメッシュに分割する。次いで各メッシュごとに水平
または垂直方向のどちらかの各走査線中の白画素から黒
画素または黒画素から白画素に変化する回数を数え、そ
の数をそれぞれのメッシュの複雑度とする。そして複雑
度の和が最も高くなるようなi個×j個の連続する局所
領域La(図3参照)を抽出する。
【0015】この抽出方法は、例えば次のような近似的
な方法で実現されてもよい。すなわち、図4のような水
平方向に長いn個の帯領域ごとにそこに含まれるメッシ
ュの複雑度を加算し、n個の帯領域から最も複雑度が大
きくなるような連続するj個の帯領域(図4中の領域s
1に相当)を抽出する。領域s1をさらに図5のように
垂直方向にm個に当分割して垂直方向に長い帯領域をつ
くり、各帯領域に含まれるメッシュの複雑度を加算し、
m個の帯領域から最も複雑度が大きくなるような連続す
るi個の帯領域(図5中の領域s2に相当)を抽出す
る。領域s2は、必ずしも入力文書中で最も複雑な領域
であるとは限らないが、この領域で傾き検出処理を行な
うことについて支障はない。
【0016】データ管理部5では、局所領域Laに含ま
れる画像データを水平または垂直方向のどちらか一方あ
るいは両方向の1本の走査線ごとに圧縮して管理する。
これは、傾き検出部6において複雑度を抽出する際に処
理効率を上げることを目的としている。例えば、局所領
域Laに含まれる画像データの管理方式として次に示す
方法を採用しても良い。
【0017】<データ管理方法1>:局所領域中の画像
データを水平または垂直方向のどちらかあるいは両方向
において図6に示すランレングス符号の並びとして表現
する。<データ管理方法2>:水平方向または垂直方向
において各走査線ごとに連続する黒画素の先頭座標(中
心座標でも良い)を管理する。この時注意しなければな
らないことは、各黒画素の先頭座標を局所領域の左辺の
座標値で正規化(すなわち各黒画素の座標値から局所領
域の左辺の座標値を引く)する必要がある。そして、上
記のようなデータを管理して、以後の処理に適用する。
【0018】傾き検出部6では、データ管理部5で管理
されている圧縮されたデータから入力文書の傾きを検出
する。処理効率を考慮しなければ、傾き検出処理の対象
画像として画像Isから抽出した局所領域Laの他に前
記入力画像の2値画像Ibあるいは2値画像Ib中のL
aと同じ位置および同じ大きさの部分画像を用いても良
い。傾き検出部6で実行される傾き検出処理は対象領域
中の文字列の方向すなわち傾きを検出することにより実
現される。この場合、文字列方向(水平あるいは垂直方
向)は予め既知であることを前提としている。文字列の
傾きは水平軸あるいは垂直軸のどちらかから±λ度の範
囲内において、ある角度分解能σで複数の方向ごとに複
雑度を求め、最も複雑度の大きい角度を入力文書の傾き
角であるとすることにより検出される。この方式は、文
字列の傾きと走査方向が一致する場合、各走査線におけ
る複雑度が最大となるという性質を利用するものであ
る。
【0019】複雑度の定義にはいろいろあるが、ここで
は例えば、ある領域の複雑度を「走査線ごとに、そこに
含まれる白画素から黒画素あるいは黒画素から白画素に
変化する回数の2乗した値を求め、それを領域全体で加
算した値」と定義する。また、この複雑度の定義におけ
る前記「白画素から黒画素あるいは黒画素から白画素に
変化する回数」は、例えば前記データ管理方法1および
データ管理方法2に適用する場合には黒連結画素の個数
と解釈することができる。
【0020】また、複雑度が最大となる走査方向の角度
の探索方法にもいろいろな方法が考えられるが、ここで
は先ずその一例として一定の角度分解能σごとに複雑度
を抽出し、最大複雑度を持つ角度を検出する傾き検出方
式について説明する。ただし、λはσで割り切れる値で
あることが望ましい。
【0021】<傾き検出方法1>:図3のように入力文
書が横書きに限る場合、水平軸(0度)から±λ度以内
の範囲で傾きを検出すれば良い。図3の局所領域Laか
ら入力文書の傾き角度Θを求める具体的な処理は、例え
ば、次の4つのステップからなる。ここで、初期値とし
てθ = −λ°とする。
【0022】ステップ1:局所領域Laを角度θの方向
に走査し、各走査線ごとに「白画素から黒画素あるいは
黒画素から白画素に変化する回数」を2乗した値:LINE
COMPLEXITY (各走査線の複雑度とする)を求める。
【0023】ステップ2:局所領域全体における上記
「走査線ごとの複雑度:LINE COMPLEXITY 」の総和:AL
L LINE COMPLEXITY を求めてこれを角度θのときの局所
領域Laの複雑度とする。
【0024】ステップ3:θをσ度分増やして、ステッ
プ1およびステップ2を行う。ただしθは、−λ°≦θ
≦+λ°を満たしている必要がある。ここでは、例えば
σ=1,λ=32としても良い。
【0025】ステップ4:ステップ3で求めた2λ/σ
+1個の複雑度(σ=1,λ=32としたとき65個の
複雑度が求まる):ALL LINE COMPLEXITY のなかで最も
大きい複雑度:MAX COMPLEXITYを持つ角度Θを検出し
て、その角度Θを入力文書の傾き角度とする。
【0026】以上の処理の中で、例えば、ステップ1の
処理において任意の角度の任意の走査線に含まれる連続
する黒画素は次のように近似的に求めても良い。すなわ
ち、局所領域Laに含まれる画像が前記データ管理方法
2(水平方向の各走査線ごとにおいて連続する黒画素の
先頭座標と個数を管理する方法)で管理されている場
合、局所領域Laにおいて上からj番目の走査線で管理
されている先頭座標がxである黒連結画素は、角度θの
とき次の(1) 式で求まるy番目の走査線に含まれること
になる。
【0027】 y = j + tanθ × x …(1) 次に複雑度が最大となる角度の探索を効率的に行う方法
を以下に示す。この方法は上記傾き検出方法1において
最も処理時間を要する「ステップ1およびステップ2」
の処理回数を減らしたものである。すなわち、ある程度
粗い角度分解能α°で最大複雑度を探索した後、その最
大複雑度を持つ角度付近においてα゜より小さい角度分
解能σ゜でさらに最大複雑度を探索し、この場合の最大
複雑度を持つ角度を入力文書の傾きとする方式である。
このとき、λはαとσの両方で割り切れる値であること
が望ましい。
【0028】<傾き検出方法2>:この方法は前記<傾
き検出方法1>において次のようにステップ3とステッ
プ4を変更し(それぞれステップ3’とステップ4’と
する)、さらにステップ5および6を追加することによ
って実現される。ここで、ステップ1とステップ2は、
傾き検出方法1と同様なので説明を省略する。
【0029】ステップ3’:θをα度分増やして、ステ
ップ1およびステップ2を行う。ただし−λ°≦θ≦+
λ°を満たしている必要がある。ここで例えばα=4、
λ=32としても良い。
【0030】ステップ4’:ステップ3で求めた2λ/
α+1個の複雑度:ALL LINE COMPLEXITY1のなかで最
大きい複雑度:MAX COMPLEXITY1 を持つ角度Θ1 を検出
する。
【0031】ステップ5:ステップ4’で検出した角度
Θ1 の付近(例えば Θ1 −α/2 ≦ θ ≦Θ1 +
α/2の範囲)で角度分解能をσとして、ステップ1〜
2を行う。ここで、例えばσ=1としても良い。
【0032】ステップ6:ステップ5で求めたα+1個
の複雑度:ALL LINE COMPLEXITY2のなかで最も大きい複
雑度:MAX COMPLEXITY2 を持つ角度Θ2 を検出して、そ
の角度Θ2 を入力文書の傾き角度とする。
【0033】例えばα=4、σ=1として上記傾き検出
方法2を適用した場合、ステップ1および2の処理回数
は22回となり、前記傾き検出方法1(この方法では6
5回)に較べ処理量が少なくなり、高速化が可能とな
る。
【0034】判定部7では、前記傾き検出部6で検出さ
れた入力文書の傾き角度の値Θに基づいて前記入力文書
画像の傾きを補正するか否かを判定する。ここでは、例
えば後段に設定されている文書読み取り装置の文書構造
解析および理解能力や文字読み取り能力を考慮して、以
下の方法により入力部文書の傾きの実施に関する判定を
行う。すなわち、文書読み取り装置は、入力文書の傾き
が±ν°以内であれば文字の読み取り等に支障をきたさ
ないことが予め分かっている場合には、次の(2) 式によ
り以下のような判定を行う。
【0035】 −ν ≦ Θ ≦ ν の場合 : 傾き補正処理を実施しない それ以外の場合 : 傾き補正処理を実施する …(2) 以上により本発明の文書画像傾き検出方式の手続きを終
了する。
【0036】上記文書画像傾き検出方式を文書読み取り
装置に適用する場合には、さらに、上記文書画像傾き検
出方式で検出した入力文書の傾き角度Θを文書画像傾き
補正部8に供給する。文書画像傾き補正部8では、文書
画像傾き検出部で検出された角度Θで入力文書画像を回
転して入力文書画像の傾きを補正し、補正後の画像を文
書読み取り部10に供給する。この結果、文書読み取り
部10では常に傾きの無い入力文書画像が入力されるこ
とになり、安定した読み取り処理が実現される。
【0037】<第2実施例>前述した第1実施例では、
局所領域に含まれる文字列の方向を検出することによ
り、入力文書の傾きを検出することとした。この時、文
字列の角度方向を検出する方法として、水平軸または垂
直軸のどちらか一方から±λ度の範囲で複数の角度方向
に走査して、最も複雑度の大きい角度を検出する方法に
ついて説明した。この方法は、入力文書の文字列方向が
既知でなければならないとしている。つまり、入力文書
の文字列方向が水平(横書き)であるならば傾き角度の
検出範囲を水平軸(0度)から±λ度とし、文字列方向
が垂直(縦書き)であるならば傾き角度の検出範囲を垂
直軸(90度)から±λ度として入力文書の傾きを検出
している。この方法では、入力文書の文字列方向が未知
である場合には、複雑度の検出範囲をどちらにすれば良
いか分からない。そこで文字列方向が未知である場合に
おいても入力文書の傾きを検出できる方式である<傾き
検出方式3>について図7を参照しながら説明する。こ
こでは、第1実施例で述べた傾き検出方式と異なる部分
について述べる。
【0038】<傾き検出方式3>:図7における2値化
処理部2における処理から局所領域抽出部4までの処理
は、実施例1と同様であるので説明を省略する。
【0039】傾き検出方式3では、データ管理部5を次
のように変更する。すなわち、第1実施例では、水平方
向または垂直方向のどちらか一方の方向でデータを管理
するが、ここでは両方向でデータを管理する。前記<デ
ータ管理方式1>または前記<データ管理方式2>のい
ずれか一方により水平方向データ管理部11において水
平方向の走査線ごとにデータを管理した後(このとき得
られるデータをhorizontal local data とする)、さら
に垂直方向データ管理部12において垂直方向にも走査
線ごとにデータを管理する(このとき得られるデータを
vertical localdata とする)。
【0040】水平方向傾き検出部13では、まず、水平
軸(0度)から±λ度の範囲で前記傾き検出方式1のス
テップ1からステップ3まであるいは前記傾き検出方式
2のステップ1からステップ5までを前記局所領域La
から抽出したhorizontal local data に対して適用し、
複数の角度方向の複雑度:horizontal complexity を抽
出する。次いで、垂直方向傾き検出部14において垂直
軸(90度)から±λ度の範囲で前記<傾き検出方式1>
のステップ1からステップ3まであるいは前記<傾き検
出方式2>のステップ1からステップ5までを前記局所
領域Laから抽出したvertical local data に対して適
用し、複数の角度方向の複雑度:vertical complexity
を抽出する。
【0041】そして、傾き方向判別部15においてhori
zontal complexity とvertical complexity を比較して
どちらの複雑度の分布から入力文書の傾きを検出するか
を決定する。この方法は、例えば以下に示す判別方法に
より実現されても良い。ここで、horizontal complexit
y 中の最大値をmax horizontalcomplexity 、最小値をm
in horizontal complexity 、(max horizontal comple
xity を持つ角度)±σ度の2つのhorizontal complexi
ty とmax horizontal complexity の和をsumhorizontal
complexity とし、vertical complexity 中の最大値を
max verticalcomplexity 、最小値をmin vertical comp
lexity 、(max vertical complexity を持つ角度)±
σ度の2つのvertical complexity とmax vertical com
plexity の和をsum vertical complexity とする。
【0042】<判別方法1>:max horizontal complex
ity < max vertical complexity +th1 のとき、max
vertical complexity を持つ角度を入力文書の傾きの角
度とする。
【0043】max horizontal complexity +th1 > ma
x vertical complexity のとき、max horizontal compl
exity を持つ角度を入力文書の傾きの角度とする。
【0044】それ以外のとき、入力文書の傾き角を検出
不能(判別不能)とする。ここで、th1 :しきい値とす
る。
【0045】<判別方法2>:(max horizontal compl
exity − min horizontal complexity)<(max vertic
al complexity − min vertical complexity)+th2 の
とき、max vertical complexity を持つ角度を入力文書
の傾きの角度とする。
【0046】(max horizontal complexity − min hor
izontal complexity)+th2 >(max vertical complex
ity − min vertical complexity)のとき、max horizo
ntalcomplexity を持つ角度を入力文書の傾きの角度と
する。
【0047】それ以外のとき、入力文書の傾き角を検出
不能(判別不能)とする。ここで、th2 :しきい値とす
る。
【0048】<判別方法3>:sum horizontal complex
ity < sum vertical complexity +th3 のとき、max
vertical complexity を持つ角度を入力文書の傾きの角
度とする。
【0049】sum horizontal complexity +th3 > su
m vertical complexity のとき、max horizontal compl
exity を持つ角度を入力文書の傾きの角度とする。
【0050】それ以外のとき、入力文書の傾き角を検出
不能(判別不能)とする。
【0051】<判別方法4>: if(判別方法1が判別不能でない) 判別方法1の結果
を採用する。
【0052】else if (判別方法1が判別不能) if(判別方法2が判別不能でない) 判別方法2の結果
を採用する。
【0053】else if (判別方法2が判別不能) if(判別方法3が判別不能でない) 判別方法3の結果
を採用する。 else if (判別方法3が判別不能) 入力文書の傾き角を検出不能(判別不能)とする。
【0054】判定部7で行われる判定処理は第1実施例
と同様であるので説明を省略する。以上の処理手続きを
用いると入力文書の傾きを検出する前に予め文字列方向
が未知であっても入力文書の傾きを正確に検出できる。
【0055】また、以上の処理を適用した結果、max ho
rizontal complexity を持つ角度を入力文書の傾きの角
度とする場合には、入力文書の文字列方向を水平方向と
し、max vertical complexity を持つ角度を入力文書の
傾きの角度とする場合には、入力文書の文字列方向を垂
直方向とすることにより入力文書の文字列方向を判別し
て、その判別結果を後段の文書読み取り装置に供給する
ようにしても良い。ただし、この場合、入力文書に記載
されている文字列の方向は水平方向あるいは垂直方向の
どちらか一方に限る。
【0056】<第3実施例>第1実施例で説明した方式
で、例えば角度分解能を0.1 度として入力文書の傾き角
度を検出する場合には、例えば、角度分解能が1度のと
きの入力文書の傾き角Θ1 の付近(例えば Θ1 −0.5
≦ θ ≦ Θ1 +0.5 の範囲)で、さらに角度分解能
を0.1 度として入力文書の詳細な傾き角度を検出しなけ
ればならない。したがって、第1実施例で説明した方式
は所望の角度分解能を0.1 度以下とした場合には処理時
間がかかることになる(例えば、<傾き検出方式2>で
は、さらにステップ1およびステップ2を11回余計に
適用しなければならない)。そこで、ここでは0.1 度の
角度分解能で傾き検出処理を高速に行う方法である<傾
き検出方式4>について説明する。<傾き検出方式4>
は、第1実施例で説明した方式により1度の角度分解能
で入力文書の傾き角度Θ1 を検出した後、Θ1 の複雑
度:max complexityとΘ1 −1°の複雑度:before com
plexity とΘ1 +1°の複雑度after complexityの3つ
の複雑度から近似推論あるいはファジィ推論を用いて角
度分解能が0.1 度以下のときの傾き角度Θ2 がΘ1 −0.
5 以上Θ1 +0.5 以下の範囲のどの角度であるかを推定
する。
【0057】第1傾き検出部で得られたmax complexit
y、before complexity 、after complexity等の値は、
それぞれ信頼性の高い正確な値であると保証されている
わけではない。したがって本方式ではこのような不正確
な値にふさわしく、情報を曖昧な形のまま効率的に処理
して、妥当な結果を得ることを目的する。本方式で示す
上記のような曖昧さを含む角度検出アルゴリズムは「i
f 前件部 then後件部」の形式の複数個のルール
による推論と推論結果を解釈して傾き角度を推定する手
続きからなる。以下、図8のブロック図にしたがって、
<傾き検出方式4>について説明する。
【0058】<傾き検出方式4>:図8に示すブロック
図の2値化処理部2から第1傾き検出部16までにおい
て実施される処理は第1実施例で説明した方式によるも
のである。ただし第1傾き検出部16は、角度分解能を
σ=1度として入力文書の傾き角度を検出するものであ
る。
【0059】第2傾き検出部17では、第1傾き検出部
16からmax complexity、before complexity 、after
complexityおよびΘ1 、Θ1 −1、Θ1 +1を受け取
る。そして、この6つの値に対して、例えば、以下に示
す曖昧な変数を含む3つのルールを用いることにより角
度分解能を0.1 度としたときの入力文書の傾き角度を検
出する。ここで、before complexity とafter complexi
tyのうち大きい方をsecond complexity とする。
【0060】ルール1:before complexity とafter co
mplexityの差が小さいならば、Θ2は、Θ1 の付近にあ
る。
【0061】ルール2:second complexity とmax comp
lexityの差が小さいならば、Θ2 は、 Θ1
とsecond complexity を持つ角度の真ん中にある。
【0062】ルール3:second complexity とmax comp
lexityの差が大きいならば、Θ2 は、 Θ1
付近にある。
【0063】上記3つのルールにおけるアンダーライン
部の曖昧な変数は、ルール中に含まれる前件部および後
件部の命題の真偽に関する度合いを区間[0,1]のあ
る値で表現する。
【0064】上記ルールは実際の処理においては次のよ
うに表現される。
【0065】 ルール1:If diff1 is A1 then Θ2 is B1 . ルール2:If diff2 is A2 then Θ2 is B2 . ルール3:If diff2 is A3 then Θ2 is B1 . diff1 =|before complexity − after complexity | …(3) diff2 = max complecity − second complecity …(4) A1 = 1 − diff1 × 10 / max complecity (ただし、A1 <0のとき、A1 =0とする)。 …(5) A2 = 1 − diff1 × 10 / max complecity (ただし、A2 <0のとき、A2 =0とする。) …(6) A3 = 1 − A2 …(7) B1 = 2×θ − 2×Θ1 + 1 (Θ1 −0.5 ≦θ≦Θ1 のとき) −2×θ + 2×Θ1 + 1 (Θ1 <θ≦Θ1 +0.5 のとき) …(8) B2 = if second complexity を持つ角度 is Θ1 −1 then 2×θ − 2×Θ1 + 2 (Θ1 −1≦θ≦Θ1 −0.5 のとき) −2×θ + 2×Θ1 (Θ1 −0.5 <θ≦Θ1 のとき) …(9) else if second complexity を持つ角度 is Θ1 +1 else if second complexity を持つ角度 is Θ1 +1 then 2×θ − 2×Θ1 (Θ1 ≦θ≦Θ1 +0.5 のとき) −2×θ + 2×Θ1 + 2 (Θ1 +0.5 <θ≦Θ1 +1のとき) …(10) ここで、|k|はkの絶対値とする。また、A1 は「be
fore complexity とafter complexityの差が小さい」と
いうことを表現しているメンバーシップ関数で、A1 <
0となるときA1 =0とし、A2 は「second complexit
y とmax complexityの差が小さい」ということを表現し
ているメンバーシップ関数で、A2 <0となるときA2
=0とし、A3 は「second complexity とmax complexi
tyの差が大きい」ということを表現しているメンバーシ
ップ関数である。B1 は「Θ1 の付近」ということを表
現するメンバーシップ関数(図9中B1 に相当)であ
り、B2 は「Θ1 とsecond complexity を持つ角度の真
ん中」ということを表現しているメンバーシップ関数
(図9中B2 に相当)である。
【0066】<傾き検出方式4>は、まず各ルールごと
に推論を実行し、推論結果を得る。各ルールにおける推
論結果は各ルールの後件部の真偽の度合い(すなわちメ
ンバーシップ関数)を表しており、次にこれを統合する
(統合により得られたメンバーシップ関数をB’とす
る)。そして統合された推論結果をメンバーシップ関数
B’の重心yを求めるという手段により解釈し、解釈結
果を0.1 度の角度分解能で検出された入力文書の傾き角
度とする。以下に、具体的な計算方法について説明す
る。
【0067】ステップ1:各ルールの前件部の適合度の
計算および適用ルールの選択。
【0068】ルール1においてA1 の値(ルール1の前
件部の適合度とする)を求め、ルール2においてA2 の
値(ルール2の前件部の適合度とする)を求め、ルール
3においてA3 の値(ルール3の前件部の適合度とす
る)を求める。ここで、A1 ≧A3 のとき、ルール3は
適用しないこととし、A1 < A3 のとき、ルール3を
ルール1として適用することとする(以下の計算では、
ルール1とルール2のみが用いられることとなる)。
【0069】ステップ2:各ルールの推論結果の算出と
統合。
【0070】まず、ルール1の適合度A1 を次の(11)式
に適用してルール1の推論結果B1’を求める。
【0071】 B1 ’= A1 Λ B1 …(11) これは、具体的には、メンバーシップ関数B1 を図10
のようにA1 でカットすることである。その結果B1 ’
は、図10のようなメンバーシップ関数になる。
【0072】次に、ルール2の適合度A2 を次の(12)式
に適用してルール2の推論結果B2’を求める。
【0073】 B2 ’= A2 Λ B2 …(12) これは、具体的には、メンバーシップ関数B2 を図11
のようにA2 でカットすることである。その結果B2 ’
は、図11のようなメンバーシップ関数になる。
【0074】そして、B1 ’とB2 ’を統合し図12の
ようなメンバーシップ関数B’をつくる。
【0075】ステップ3:推論結果の解釈による傾き角
度の推定。
【0076】各ルールにおける推論結果の適合度による
重み付け平均すなわち「メンバーシップ関数B’の重心
y」を次の(13)式によって求めることにより推論結果の
解釈を行う。そして、重心yを入力文書の傾き角度とす
る。
【0077】 y = (∫B’(θ)θdθ)/(∫B’(θ)dθ) …(13) 上記<傾き検出方式4>で用いているルールは、その内
容および個数の変更が可能である。また、各ルールで用
いているメンバーシップ関数の変形も可能であり、必要
に応じて変形を施しても良い。さらに前記メンバーシッ
プ関数の代わりに学習済みのニューラルネットワークを
用いることも可能である。その他、各ルールにおいて推
論結果を導出する演算も既知の様々な方法を用いること
ができる。
【0078】<第4実施例>第1実施例では、本発明を
文書読み取り装置に応用する場合、本発明による傾き検
出方式により検出された入力文書の傾き角度を用いて入
力文書を回転し、傾きを補正した入力文書画像を文書読
み取り装置等に供給することとしている。この場合、傾
き検出処理が所望の精度で検出され、さらに傾き補正処
理により変換された画像が所望の精度(例えば0度±0.
5 度)以内に補正されているか否かを確認する機能を以
下のように付加しても良い。上記確認機能を実現する処
理手続きを図13を用いて説明する。
【0079】図13中の入力文書画像傾き検出部8にお
いて実施される黒画素融合処理と局所領域抽出処理とデ
ータ管理処理と判定処理は実施例1で述べたものと同様
であり、傾き検出処理は前記<傾き検出処理方式1〜4
>のうちいずれかの方式による処理と同様であるので説
明を省略する。次の文書画像回転処理部18では、上記
傾き検出処理で検出された入力文書の傾き角を用いて、
例えば「座標の平行移動による画像の高速回転法」(電
学論C,105 ,3 ,pp.61-68,1985)などの方法により
入力文書画像の回転処理が実施される。そして、その後
に再度上記傾き検出処理を前記回転された画像に対して
施し、その傾きを検出する。確認処理部19では、前記
回転された画像の傾き角度が所望の誤差範囲内の所望の
角度(例えば0度±0.5 度以内)であるならば、前記回
転された入力文書画像を後段の文書読み取り装置に供給
し、前記回転された画像の傾き角度が所望の誤差範囲内
の所望の角度でなければ入力文書の再入力をユーザーに
促すようにする。
【0080】また、以上の処理手続きを図14のような
手続きにしても良い。すなわち、図14の処理手続き
は、上記傾き回転処理と上記傾き検出処理と上記確認処
理を回転された画像の傾き角度が所望の誤差範囲内の所
望の角度となるまで繰り返し行うものである。このとき
h回繰り返しても回転された画像の傾き角度が所望の誤
差範囲内の所望の角度にならなければ入力文書の再入力
をユーザーに促すようにしている。
【0081】なお、本発明はその要旨を逸脱しない範囲
において種々変形して実現し、各種用途にしようする事
ができる。
【0082】
【発明の効果】以上説明したように、本発明の文書画像
傾き検出方式では、入力文書の複雑さを調べることによ
り入力文書の傾きを検出するので、複雑さが文字列部に
対して比較的小さい図・写真・ノイズなどによる影響を
受けずに安定した傾き検出処理を実現できる。
【0083】また、本発明の文書画像傾き検出方式で
は、自動的に抽出された文字列が大半を占める局所領域
に対して階層的に効率良く傾き検出処理を行うのでコス
トパフォーマンスが著しく改善されるという効果が得ら
れる。
【図面の簡単な説明】
【図1】本発明が適用された文書傾き検出方式の一実施
例の構成を示すブロック図である。
【図2】入力文書画像をn個×m個のメッシュに分割し
た例を示す説明図である。
【図3】入力文書画像における局所領域の抽出例を示す
説明図である。
【図4】入力文書画像をn個の水平方向に長い帯領域に
等分割した例を示す説明図である。
【図5】入力文書画像の領域S1 を垂直方向に長い帯領
域に等分割した例を示す図説明図である。
【図6】ランレングス符号の構造を示す説明図である。
【図7】水平および垂直の両方向に入力文書の傾きを検
出する文書傾き検出方式の構成を示すブロック図であ
る。
【図8】文書傾き検出方式の別の構成を示すブロック図
である。
【図9】文書傾き検出処理に用いるメンバーシップ関数
の一例を示す説明図である。
【図10】一つのルールの推論結果により得られるメン
バーシップ関数の一例を示す説明図である。
【図11】一つのルールの推論結果により得られるメン
バーシップ関数の一例を示す説明図である。
【図12】推論結果を統合して得られるメンバーシップ
関数の一例を示す説明図である。
【図13】確認機能を組み込んだ文書傾き検出方式の構
成を示す図である。
【図14】確認機能を組み込んだ文書傾き検出方式の別
の構成を示す図である。
【符号の説明】
1 文書画像入力部 2 2値化処理部 3 黒画素融合処理部 4 局所領域抽出部 5 データ管理部 6 傾き検出部 7 判定部 8 文書画像傾き検出部 9 文書画像傾き補正部 10 文書読み取り部 11 水平方向データ管理部 12 垂直方向データ管理部 13 水平方向傾き検出部 14 垂直方向傾き検出部 15 傾き方向判定部 16 第1傾き検出部 17 第2傾き検出部 18 文書画像回転処理部 19 確認処理部

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】文書を白画素と黒画素で構成される2値の
    文書画像に変換する手段と、2値の文書画像において、水平または垂直のどちらか一
    方向若しくは両方向において、黒画素に挟まれる長さδ
    画素以下の白画素を黒画素に変換することにより、近接
    する黒画素が融合された画像に変換する手段と、 前記近接する黒画素が融合された画像を、n個×m個の
    メッシュに分割し、各メッシュを水平方向もしくは垂直
    方向のどちらかに走査して、各走査線毎に白画素から黒
    画素若しくは黒画素から白画素に変化する回数の総和が
    最大となる連続したi個×j個のメッシュ領域 を局所領
    域として抽出する手段と、 前記局所領域を複数の角度方向で走査する手段と、 前記局所領域について、各走査線毎に白画素から黒画素
    若しくは黒画素から白画素に変化する回数の2乗値の総
    和を局所領域全体で計算する手段と、 各走査線で白画素から黒画素若しくは黒画素から白画素
    に変化する回数の2乗値の総和が最大となる走査角度方
    向を文書画像の傾き角度として検出する手段とを具備す
    ることを特徴とする文書画像傾き検出装置。
  2. 【請求項2】文書を白画素と黒画素で構成される2値の
    文書画像に変換するステップと、2値の文書画像において、水平または垂直のどちらか一
    方向若しくは両方向において、黒画素に挟まれる長さδ
    画素以下の白画素を黒画素に変換することにより、近接
    する黒画素が融合された画像に変換するステップと、 前記近接する黒画素が融合された画像を、n個×m個の
    メッシュに分割し、各メッシュを水平方向もしくは垂直
    方向のどちらかに走査して、各走査線毎に白画素から黒
    画素若しくは黒画素から白画素に変化する回数の総和が
    最大となる連続したi個×j個のメッシュ領域 を局所領
    域として抽出するステップと、 前記局所領域を複数の角度方向で走査するステップと、 前記局所領域について、各走査線毎に白画素から黒画素
    若しくは黒画素から白画素に変化する回数の2乗値の総
    和を局所領域全体で計算するステップと、 各走査線で白画素から黒画素若しくは黒画素から白画素
    に変化する回数の2乗値の総和が最大となる走査角度方
    向を文書画像の傾き角度として検出するステップと、 を有することを特徴とする文書画像傾き検出方法。
JP34541991A 1991-12-26 1991-12-26 文書画像傾き検出装置およびその方法 Expired - Fee Related JP3320759B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP34541991A JP3320759B2 (ja) 1991-12-26 1991-12-26 文書画像傾き検出装置およびその方法
US07/996,106 US5506918A (en) 1991-12-26 1992-12-23 Document skew detection/control system for printed document images containing a mixture of pure text lines and non-text portions

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP34541991A JP3320759B2 (ja) 1991-12-26 1991-12-26 文書画像傾き検出装置およびその方法

Publications (2)

Publication Number Publication Date
JPH05174183A JPH05174183A (ja) 1993-07-13
JP3320759B2 true JP3320759B2 (ja) 2002-09-03

Family

ID=18376476

Family Applications (1)

Application Number Title Priority Date Filing Date
JP34541991A Expired - Fee Related JP3320759B2 (ja) 1991-12-26 1991-12-26 文書画像傾き検出装置およびその方法

Country Status (2)

Country Link
US (1) US5506918A (ja)
JP (1) JP3320759B2 (ja)

Families Citing this family (72)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0737103A (ja) * 1993-07-23 1995-02-07 Olympus Optical Co Ltd 傾き角度検出装置
US5592572A (en) * 1993-11-05 1997-01-07 The United States Of America As Represented By The Department Of Health And Human Services Automated portrait/landscape mode detection on a binary image
JP3108979B2 (ja) * 1994-07-28 2000-11-13 セイコーエプソン株式会社 画像処理方法および画像処理装置
US6181825B1 (en) * 1994-12-02 2001-01-30 Comsat Corporation Methods for performing 2-dimensional maximum differences coding and decoding during real-time facsimile image compression and apparatus therefor
US6208744B1 (en) * 1994-12-14 2001-03-27 Casio Computer Co., Ltd. Document image processor and method for setting a document format conforming to a document image
US6240218B1 (en) * 1995-03-14 2001-05-29 Cognex Corporation Apparatus and method for determining the location and orientation of a reference feature in an image
US5889884A (en) * 1995-05-23 1999-03-30 Minolta Co., Ltd. Image forming apparatus capable of recognizing top and bottom of document image
JP4114959B2 (ja) * 1995-06-20 2008-07-09 キヤノン株式会社 画像処理方法及び装置
US5568281A (en) * 1995-07-31 1996-10-22 Hewlett-Packard Co. Automatic document presence, skew and width detection method and apparatus for a document scanner
KR0158123B1 (ko) * 1995-09-26 1998-12-15 김광호 팩시밀리장치의 화상테이타 자동정렬방법
JP3006466B2 (ja) * 1995-09-28 2000-02-07 日本電気株式会社 文字入力装置
US5862249A (en) * 1995-12-01 1999-01-19 Eastman Kodak Company Automated method and system for determination of positional orientation of digital radiographic images
US5956468A (en) * 1996-07-12 1999-09-21 Seiko Epson Corporation Document segmentation system
US6173088B1 (en) 1996-10-01 2001-01-09 Canon Kabushiki Kaisha Image forming method and apparatus
US5912448A (en) * 1997-05-16 1999-06-15 Hewlett-Packard Company Method and apparatus for detecting paper skew in image and document scanning devices
GB9711022D0 (en) 1997-05-28 1997-07-23 Rank Xerox Ltd Text/image selection from document images
JP3558493B2 (ja) * 1997-06-10 2004-08-25 富士通株式会社 用紙位置合わせ装置、用紙位置合わせ方法及び用紙位置合わせプログラムを記録したコンピュータ読み取り可能な記録媒体
JP4170441B2 (ja) * 1997-11-28 2008-10-22 富士通株式会社 文書画像傾き検出装置および文書画像傾き検出プログラムの記憶媒体
US6366699B1 (en) * 1997-12-04 2002-04-02 Nippon Telegraph And Telephone Corporation Scheme for extractions and recognitions of telop characters from video data
US6360026B1 (en) * 1998-03-10 2002-03-19 Canon Kabushiki Kaisha Method for determining a skew angle of a bitmap image and de-skewing and auto-cropping the bitmap image
US6310984B2 (en) * 1998-04-09 2001-10-30 Hewlett-Packard Company Image processing system with image cropping and skew correction
KR100264331B1 (ko) * 1998-05-26 2000-08-16 윤종용 원고 비틀림 보정 장치 및 방법
JP3876531B2 (ja) * 1998-05-28 2007-01-31 富士通株式会社 文書画像の傾き補正方法
US6549680B1 (en) * 1998-06-23 2003-04-15 Xerox Corporation Method and apparatus for deskewing and despeckling of images
US6798905B1 (en) * 1998-07-10 2004-09-28 Minolta Co., Ltd. Document orientation recognizing device which recognizes orientation of document image
US6188801B1 (en) * 1998-08-31 2001-02-13 Jenn-Tsair Tsai Method and apparatus for automatic image calibration for an optical scanner
US6490376B1 (en) * 1998-09-17 2002-12-03 Metrologic Instruments, Inc. Skew processing of raster scan images
US20010022675A1 (en) * 1998-09-23 2001-09-20 Xerox Corporation Electronic image registration for a scanner
IL132719A (en) * 1999-01-07 2010-04-29 Topscan Ltd Optical scanner and software therefor
JP4323606B2 (ja) * 1999-03-01 2009-09-02 理想科学工業株式会社 文書画像傾き検出装置
JP2001043310A (ja) * 1999-07-30 2001-02-16 Fujitsu Ltd 文書画像補正装置および補正方法
US6687421B1 (en) * 2000-03-17 2004-02-03 International Business Machines Corporation Skew detection of text in a noisy digitized image
JP4603658B2 (ja) * 2000-07-07 2010-12-22 キヤノン株式会社 画像処理装置及び画像処理方法並びに記憶媒体
IT1314910B1 (it) * 2000-07-26 2003-01-16 Eta Consulting S R L Metodo e strumento per la determinazione di angoli di distorsione intessuti o simili fermi o in movimento
US6823084B2 (en) * 2000-09-22 2004-11-23 Sri International Method and apparatus for portably recognizing text in an image sequence of scene imagery
US7031553B2 (en) * 2000-09-22 2006-04-18 Sri International Method and apparatus for recognizing text in an image sequence of scene imagery
US7898695B1 (en) 2000-10-06 2011-03-01 Lexmark International, Inc. Method of compensating for electronic printhead skew and bow correction in an imaging machine to reduce print artifacts
US6490421B2 (en) 2001-02-12 2002-12-03 Hewlett-Packard Company Methods and apparatus for correcting rotational skew in duplex images
US7411593B2 (en) 2001-03-28 2008-08-12 International Business Machines Corporation Image rotation with substantially no aliasing error
US7079707B2 (en) * 2001-07-20 2006-07-18 Hewlett-Packard Development Company, L.P. System and method for horizon correction within images
US20040083229A1 (en) * 2001-09-04 2004-04-29 Porter Robert Austin Apparatus and method for automatically grading and inputting grades to electronic gradebooks
JP2003259110A (ja) * 2002-02-28 2003-09-12 Fujitsu Ltd 画像結合装置、その方法、プログラム
EP1413444B1 (en) * 2002-10-23 2007-05-30 Hewlett Packard Company, a Delaware Corporation Media skew compensation in printer device
US7142727B2 (en) * 2002-12-17 2006-11-28 Xerox Corporation Non-iterative method of calculating image skew
US7162084B2 (en) * 2003-01-29 2007-01-09 Microsoft Corporation System and method for automatically detecting and extracting objects in digital image data
US7805003B1 (en) 2003-11-18 2010-09-28 Adobe Systems Incorporated Identifying one or more objects within an image
US8320708B2 (en) * 2004-04-02 2012-11-27 K-Nfb Reading Technology, Inc. Tilt adjustment for optical character recognition in portable reading machine
US7668404B2 (en) * 2004-06-30 2010-02-23 Lexmark International, Inc. Method and system of deskewing an image using monochrome conversion to separate foreground from background
US7824732B2 (en) * 2005-12-28 2010-11-02 3M Innovative Properties Company Encapsulated chromonic particles
US9314214B2 (en) 2006-09-13 2016-04-19 Brainlab Ltd. Calibration of radiographic images
US7957569B2 (en) * 2006-09-13 2011-06-07 Orthocrat Ltd. Orientation of radiographic images
JP5111242B2 (ja) * 2008-06-04 2013-01-09 キヤノン株式会社 画像処理装置及び方法
US8437576B2 (en) * 2008-06-23 2013-05-07 Samsung Electronics Co., Ltd. Method of correcting orientation of an image in automatic printing, and an image forming method and image forming apparatus thereof
JP2010134700A (ja) * 2008-12-04 2010-06-17 Toshiba Corp 画像評価装置および画像評価方法
US8913285B1 (en) * 2009-06-07 2014-12-16 Apple Inc. Automated method of decomposing scanned documents
EP2449531B1 (en) * 2009-07-02 2017-12-20 Hewlett-Packard Development Company, L.P. Skew detection
KR101657162B1 (ko) * 2009-10-14 2016-09-19 삼성전자주식회사 화상형성장치 및 그 스큐 보정 방법
JP5427577B2 (ja) * 2009-12-04 2014-02-26 パナソニック株式会社 表示制御装置及び表示画像形成方法
US8798404B2 (en) * 2010-05-26 2014-08-05 Hin Leong Tan Making available to a user machine editable text extracted from an image
DE102011051934A1 (de) * 2011-07-19 2013-01-24 Wincor Nixdorf International Gmbh Verfahren und Vorrichtung zur OCR-Erfassung von Wertdokumenten mittels einer Matrixkamera
US9413912B2 (en) 2012-10-26 2016-08-09 Abbyy Development Llc Scanning device having a bed cover including a pattern of repeated design elements
US9122921B2 (en) * 2013-06-12 2015-09-01 Kodak Alaris Inc. Method for detecting a document boundary
CN103400130B (zh) * 2013-07-22 2016-07-20 哈尔滨工业大学 基于能量最小化框架的文档图像倾斜度检测与纠正方法
US9171203B2 (en) 2013-09-10 2015-10-27 Dropbox, Inc. Scanbox
JP2015056806A (ja) * 2013-09-12 2015-03-23 株式会社東芝 固体撮像装置
JP2016181057A (ja) * 2015-03-23 2016-10-13 株式会社東芝 画像処理装置、画像処理方法及び画像処理プログラム
WO2016203282A1 (en) * 2015-06-18 2016-12-22 The Nielsen Company (Us), Llc Methods and apparatus to capture photographs using mobile devices
US10362187B2 (en) * 2015-07-17 2019-07-23 Kyocera Document Solutions Inc. Image forming apparatus
JP6805552B2 (ja) * 2016-05-26 2020-12-23 コニカミノルタ株式会社 情報処理装置及びプログラム
JP6642833B2 (ja) * 2016-10-28 2020-02-12 京セラドキュメントソリューションズ株式会社 画像処理装置
TWI702547B (zh) * 2019-07-03 2020-08-21 利凌企業股份有限公司 車牌辨識方法及其系統
EP3905108A1 (en) * 2020-04-29 2021-11-03 Onfido Ltd Scalable, flexible and robust template-based data extraction pipeline

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4251799A (en) * 1979-03-30 1981-02-17 International Business Machines Corporation Optical character recognition using baseline information
JPS57141779A (en) * 1981-02-26 1982-09-02 Nec Corp Character cutout system
DE3113555A1 (de) * 1981-04-03 1982-10-21 Siemens AG, 1000 Berlin und 8000 München Verfahren zum automatischen erkennen von weissbloecken sowie text-, graphik- und/oder graubildbereichen auf druckvorlagen
US5001766A (en) * 1988-05-16 1991-03-19 At&T Bell Laboratories Apparatus and method for skew control of document images
US5359677A (en) * 1990-12-11 1994-10-25 Sharp Kabushiki Kaisha Image reader and facsimile machine using such image reader
US5285504A (en) * 1991-09-27 1994-02-08 Research Foundation Of The State University Of New York Page segmentation with tilt compensation
US5335290A (en) * 1992-04-06 1994-08-02 Ricoh Corporation Segmentation of text, picture and lines of a document image
JPH06252337A (ja) * 1993-03-02 1994-09-09 Fuji Electric Co Ltd 洗浄作業用治具

Also Published As

Publication number Publication date
US5506918A (en) 1996-04-09
JPH05174183A (ja) 1993-07-13

Similar Documents

Publication Publication Date Title
JP3320759B2 (ja) 文書画像傾き検出装置およびその方法
EP0543590B1 (en) Method for comparing word shapes
US5493621A (en) Fingerprint ID system and method
EP0543592B1 (en) Optical word recognition by examination of word shape
JP3053388B2 (ja) 指紋画像特色相関器
JP3259993B2 (ja) 語形測定方法及び画像信号処理方法
EP0543593B1 (en) Method for determining boundaries of words in text
US6151423A (en) Character recognition with document orientation determination
JP3345350B2 (ja) 文書画像認識装置、その方法、及び記録媒体
JP4494563B2 (ja) トークン化によるイメージ分割を用いたイメージ処理方法および装置
Nakano et al. An algorithm for the skew normalization of document image
JPH05217019A (ja) ビジネスフォーム識別システム及び画像処理システム
US5835638A (en) Method and apparatus for comparing symbols extracted from binary images of text using topology preserved dilated representations of the symbols
US20060120578A1 (en) Minutiae matching
WO2017161636A1 (zh) 一种基于指纹的终端支付方法及装置
US6944340B1 (en) Method and apparatus for efficient determination of recognition parameters
US20040218790A1 (en) Print segmentation system and method
US20120020535A1 (en) Unique, repeatable, and compact biometric identifier
US6266445B1 (en) Classification-driven thresholding of a normalized grayscale image
JP3013618B2 (ja) サイン認識装置
JPH10307889A (ja) 文字認識方法、装置及び文字認識プログラムを記録した記録媒体
JP4140221B2 (ja) 画像照合装置および画像照合プログラム
US6351560B1 (en) Apparatus, method, and program for locating an objective on a form and a recording medium for recording the program for locating the objective on the form
JP3248965B2 (ja) 2値化しきい値決定装置
JP2868909B2 (ja) 指紋照合装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees