JP3006466B2 - 文字入力装置 - Google Patents
文字入力装置Info
- Publication number
- JP3006466B2 JP3006466B2 JP7251549A JP25154995A JP3006466B2 JP 3006466 B2 JP3006466 B2 JP 3006466B2 JP 7251549 A JP7251549 A JP 7251549A JP 25154995 A JP25154995 A JP 25154995A JP 3006466 B2 JP3006466 B2 JP 3006466B2
- Authority
- JP
- Japan
- Prior art keywords
- pixel
- black
- tangent
- base
- image data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
- G06V30/1475—Inclination or skew detection or correction of characters or of image to be recognised
- G06V30/1478—Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
Description
【0001】
【発明の属する技術分野】本発明は文字入力装置に関
し、特に紙等に書かれた文字を光学的に読取る光学的文
字認識装置などの文字入力装置に関する。
し、特に紙等に書かれた文字を光学的に読取る光学的文
字認識装置などの文字入力装置に関する。
【0002】
【従来の技術】各種文書の印刷文字等を自動的に読取る
場合、文書をスキャナーから取込み画像データに変換
し、レイアウトを解析して文字の部分を切出した後に、
文字を認識する光学的文字認識装置が一般的に用いられ
ている。しかし、スキャナーに文書を置いて読取らせる
時に、置いた文書が傾くことにより読取画像に傾きを生
じることがあり、この傾きのためレイアウト解析におい
て文字が正しく切出されないという問題や、文字が傾い
たまま認識されることにより、認識性能が劣化するとい
う等の問題点があった。
場合、文書をスキャナーから取込み画像データに変換
し、レイアウトを解析して文字の部分を切出した後に、
文字を認識する光学的文字認識装置が一般的に用いられ
ている。しかし、スキャナーに文書を置いて読取らせる
時に、置いた文書が傾くことにより読取画像に傾きを生
じることがあり、この傾きのためレイアウト解析におい
て文字が正しく切出されないという問題や、文字が傾い
たまま認識されることにより、認識性能が劣化するとい
う等の問題点があった。
【0003】従来、この対策として文書の傾きを検出
し、それを用いて傾きを補正し、認識性能を向上する方
法が多数試みられている。
し、それを用いて傾きを補正し、認識性能を向上する方
法が多数試みられている。
【0004】上記傾き検出機能を有する特開昭61−1
60180号公報(文献1)記載の従来の第1の文字入
力装置は、文字列等を複数の方向から投影して黒画素の
ヒストグラムを求め、最も先鋭となる方向を求めて上記
文字列の傾きとして認識する。
60180号公報(文献1)記載の従来の第1の文字入
力装置は、文字列等を複数の方向から投影して黒画素の
ヒストグラムを求め、最も先鋭となる方向を求めて上記
文字列の傾きとして認識する。
【0005】また、特開平2−116987号公報(文
献2)記載の従来の第2の文字入力装置は、画像データ
全体を1回走査し、大まかに文字を切出した後、切出さ
れた文字の外接矩形の下端部などの特定の位置を通る任
意の直線を想定し、この直線を規定する複数のパラメー
タの組についてパラメータ空間上のヒストグラムを求
め、ヒストグラムの最頻度を与えるパラメータの組が規
定する直線の傾きを文字行の傾きと認識する。
献2)記載の従来の第2の文字入力装置は、画像データ
全体を1回走査し、大まかに文字を切出した後、切出さ
れた文字の外接矩形の下端部などの特定の位置を通る任
意の直線を想定し、この直線を規定する複数のパラメー
タの組についてパラメータ空間上のヒストグラムを求
め、ヒストグラムの最頻度を与えるパラメータの組が規
定する直線の傾きを文字行の傾きと認識する。
【0006】
【発明が解決しようとする課題】上述した従来の第1の
文字入力装置は、精度向上のために全ての黒画素を対象
として複数方向投影による黒画素のヒストグラムを求め
る必要があるので、処理量が膨大となるという欠点があ
った。また、従来の第2の文字入力装置は、最初に画像
全体を走査して大まかに文字を切出す必要があるため処
理量が多く、また、切出された文字の外接矩形の特定の
位置を通る任意の直線を規定するパラメータの組を求め
るための処理量が文字数に比例するので、文字数が多い
場合処理量が多くなるという欠点があった。
文字入力装置は、精度向上のために全ての黒画素を対象
として複数方向投影による黒画素のヒストグラムを求め
る必要があるので、処理量が膨大となるという欠点があ
った。また、従来の第2の文字入力装置は、最初に画像
全体を走査して大まかに文字を切出す必要があるため処
理量が多く、また、切出された文字の外接矩形の特定の
位置を通る任意の直線を規定するパラメータの組を求め
るための処理量が文字数に比例するので、文字数が多い
場合処理量が多くなるという欠点があった。
【0007】本発明の目的は、予め文字を切出す必要が
なく少ない処理量で文書の傾きを検出することにより、
高速で正確な文字認識が可能な文字入力装置を提供する
にある。
なく少ない処理量で文書の傾きを検出することにより、
高速で正確な文字認識が可能な文字入力装置を提供する
にある。
【0008】
【課題を解決するための手段】本発明の文字入力装置
は、文書を走査型の光電変換手段により読取って白画素
と黒画素との2値の画素から成る画像データを生成入力
する入力部と、前記画像データ中の黒画素領域の上端の
左端の画素である左基点画素とこの左基点画素の左下方
側の黒画素領域の端点画素である左準基点画素とを結ぶ
線分である左接線と、前記左基点画素から連続する同一
y座標の黒画素領域の右端の画素である右基点画素とこ
の右基点画素の右下方側の黒画素領域の端点画素である
右準基点画素とを結ぶ線分である右接線とのうち、線分
の長さが長い方の接線を代表接線として検出する代表接
線検出部と、前記代表接線の傾きから前記文書の走査方
向に対する傾きを決定する傾き決定部とを備えて構成さ
れている。
は、文書を走査型の光電変換手段により読取って白画素
と黒画素との2値の画素から成る画像データを生成入力
する入力部と、前記画像データ中の黒画素領域の上端の
左端の画素である左基点画素とこの左基点画素の左下方
側の黒画素領域の端点画素である左準基点画素とを結ぶ
線分である左接線と、前記左基点画素から連続する同一
y座標の黒画素領域の右端の画素である右基点画素とこ
の右基点画素の右下方側の黒画素領域の端点画素である
右準基点画素とを結ぶ線分である右接線とのうち、線分
の長さが長い方の接線を代表接線として検出する代表接
線検出部と、前記代表接線の傾きから前記文書の走査方
向に対する傾きを決定する傾き決定部とを備えて構成さ
れている。
【0009】
【発明の実施の形態】次に、本発明の実施の形態をブロ
ックで示す図1を参照すると、この図に示す本実施の形
態の文字入力装置は、イメージスキャナ等の入力部1
と、画像データを記憶する画像記憶部2と、画像データ
中の特定の黒画素に接する複数の接線の中から特定の接
線を代表接線TRとして検出する代表接線検出部3と、
代表接線検出部3により求めた代表接線TRの傾きから
文書の傾きを決定する傾き決定部4と、画像データの傾
きを補正する傾き補正部5と、文字認識を行う認識部6
とを備える。
ックで示す図1を参照すると、この図に示す本実施の形
態の文字入力装置は、イメージスキャナ等の入力部1
と、画像データを記憶する画像記憶部2と、画像データ
中の特定の黒画素に接する複数の接線の中から特定の接
線を代表接線TRとして検出する代表接線検出部3と、
代表接線検出部3により求めた代表接線TRの傾きから
文書の傾きを決定する傾き決定部4と、画像データの傾
きを補正する傾き補正部5と、文字認識を行う認識部6
とを備える。
【0010】代表接線検出部3は、基点を検出する基点
検出手段31と、左の準基点検出手段32と、右の準基
点検出手段33とを備える。
検出手段31と、左の準基点検出手段32と、右の準基
点検出手段33とを備える。
【0011】次に、図1および代表接線検出部3の動作
を説明する説明図を示す図2〜図4および傾き決定部4
の動作を説明する図5を参照して本実施の形態の動作に
ついて説明すると、入力部1は、文書をスキャナ等によ
り走査して印刷文字等を入力し、xy平面に並んだ画素
の集合である画像データに変換し画像記憶部2に供給す
る。ここで、画像データの各画素は黒画素と白画素の2
値の状態のいずれかであるとする。画像記憶部2は、供
給を受けた画像データ保持し保持画像データDCを出力
する。
を説明する説明図を示す図2〜図4および傾き決定部4
の動作を説明する図5を参照して本実施の形態の動作に
ついて説明すると、入力部1は、文書をスキャナ等によ
り走査して印刷文字等を入力し、xy平面に並んだ画素
の集合である画像データに変換し画像記憶部2に供給す
る。ここで、画像データの各画素は黒画素と白画素の2
値の状態のいずれかであるとする。画像記憶部2は、供
給を受けた画像データ保持し保持画像データDCを出力
する。
【0012】画像記憶部2に記憶された保持画像データ
DCを示す図2を併せて参照すると、この図において、
x,yの各線で囲まれた部分が1つの画素を示す。基点
検出手段31は、保持画像データDCに対して、y=0
より上から1ラインずつ、x軸方向に左から右に黒画素
を検出するまで走査し、この検出した黒画素を左基点画
素Clとする。次に、左基点画素Clから同一y座標値
の黒画素が連続している場合、右端の黒画素を右基点画
素Crとする。連続していない場合、左基点画素Clと
右基点画素Crは同一とする。
DCを示す図2を併せて参照すると、この図において、
x,yの各線で囲まれた部分が1つの画素を示す。基点
検出手段31は、保持画像データDCに対して、y=0
より上から1ラインずつ、x軸方向に左から右に黒画素
を検出するまで走査し、この検出した黒画素を左基点画
素Clとする。次に、左基点画素Clから同一y座標値
の黒画素が連続している場合、右端の黒画素を右基点画
素Crとする。連続していない場合、左基点画素Clと
右基点画素Crは同一とする。
【0013】左,右の各々の準基点検出手段32,33
は、保持画像データDCに対して左基点画素Clと右基
点画素Crをもとにそれぞれ左準基点画素Sl,右準基
点画素Srを検出する。
は、保持画像データDCに対して左基点画素Clと右基
点画素Crをもとにそれぞれ左準基点画素Sl,右準基
点画素Srを検出する。
【0014】左の準基点検出手段32の処理の流れを示
すフローチャートである図3(A)および画像データD
Cのxy平面を示す図4(A),(B)を参照して左準
基点画素Slの検出の詳細を説明すると、左基点画素C
lの座標値(Xcl,Ycl)から求まる図4(A)の
斜線部分の下式で示す領域LS、 LS={(x,y)|x<Xcl,Ycl<y} において、上から1ラインずつ左から右に黒画素を検出
するまで走査し(ステップA1)、検出した黒画素を左
準基点画素Slとする(ステップA2)。黒画素を検出
しなかった場合ステップA3に進み、左基点画素Clと
左準基点画素Slは同一とし検出を終了する。
すフローチャートである図3(A)および画像データD
Cのxy平面を示す図4(A),(B)を参照して左準
基点画素Slの検出の詳細を説明すると、左基点画素C
lの座標値(Xcl,Ycl)から求まる図4(A)の
斜線部分の下式で示す領域LS、 LS={(x,y)|x<Xcl,Ycl<y} において、上から1ラインずつ左から右に黒画素を検出
するまで走査し(ステップA1)、検出した黒画素を左
準基点画素Slとする(ステップA2)。黒画素を検出
しなかった場合ステップA3に進み、左基点画素Clと
左準基点画素Slは同一とし検出を終了する。
【0015】黒画素を検出した場合ステップA4に進
み、検出した左準基点画素Slの座標値(Xsl,Ys
l)と(Xcl,Ycl)とから得られる図4(B)の
斜線部分の次式で示す領域LT、 LT={(x,y)|(Xcl−Xsl)(y−Yc
l)<(Ycl−Ysl)(x−Xcl),0<=x,
Ysl<y} において、上から1ラインずつ左から右に黒画素を検出
するまで走査し、検出した黒画素を新たに左準基点画素
Slとする(ステップA2)。その後、領域LTを取り
直し再び検出を行う。黒画素を検出しなかった場合は検
出を終了する。以上より、左準基点画素Slを決定す
る。なお、処理量の低減のために、 LS={(x,y)|Xside1<=x<Xcl,Y
cl<y<=YMAX1}や LT={(x,y)|(Xcl−Xsl)(y−Yc
l)<(Ycl−Ysl)(x−Xcl),Xside
1<=x,Ysl<y<=YMAX1} などのように、基点と準基点からの一定範囲に走査範囲
を限定することも可能である。ただしXside1,Y
MAX1は定数とする。
み、検出した左準基点画素Slの座標値(Xsl,Ys
l)と(Xcl,Ycl)とから得られる図4(B)の
斜線部分の次式で示す領域LT、 LT={(x,y)|(Xcl−Xsl)(y−Yc
l)<(Ycl−Ysl)(x−Xcl),0<=x,
Ysl<y} において、上から1ラインずつ左から右に黒画素を検出
するまで走査し、検出した黒画素を新たに左準基点画素
Slとする(ステップA2)。その後、領域LTを取り
直し再び検出を行う。黒画素を検出しなかった場合は検
出を終了する。以上より、左準基点画素Slを決定す
る。なお、処理量の低減のために、 LS={(x,y)|Xside1<=x<Xcl,Y
cl<y<=YMAX1}や LT={(x,y)|(Xcl−Xsl)(y−Yc
l)<(Ycl−Ysl)(x−Xcl),Xside
1<=x,Ysl<y<=YMAX1} などのように、基点と準基点からの一定範囲に走査範囲
を限定することも可能である。ただしXside1,Y
MAX1は定数とする。
【0016】右の準基点検出手段33の処理の流れを示
すフローチャートである図3(B)および画像データD
Cのxy平面を示す図4(C),(D)を参照して右準
基点画素Srの検出の詳細を説明すると、右基点画素C
rの座標値(Xcr,Ycr)から求まる図4(C)の
斜線部分の下式で示す領域RS、 RS={(x,y)|Xcr<x,Ycr<y} において、上から1ラインずつ、右から左に黒画素を検
出するまで走査し(ステップB1)、検出した黒画素を
右準基点画素Srとする(ステップB2)。黒画素を検
出しなかった場合、ステップB3に進み右基点画素Cr
と右準基点画素Srとを同一とし検出を終了する。
すフローチャートである図3(B)および画像データD
Cのxy平面を示す図4(C),(D)を参照して右準
基点画素Srの検出の詳細を説明すると、右基点画素C
rの座標値(Xcr,Ycr)から求まる図4(C)の
斜線部分の下式で示す領域RS、 RS={(x,y)|Xcr<x,Ycr<y} において、上から1ラインずつ、右から左に黒画素を検
出するまで走査し(ステップB1)、検出した黒画素を
右準基点画素Srとする(ステップB2)。黒画素を検
出しなかった場合、ステップB3に進み右基点画素Cr
と右準基点画素Srとを同一とし検出を終了する。
【0017】黒画素を検出した場合ステップB4に進
み、検出した右準基点画素Srの座標値(Xsr,Ys
r)と(Xcr,Ycr)とから得られる図4(D)の
斜線部分の次式で示す領域RT、 RT={(x,y)|(Xcr−Xsr)(y−Yc
r)>(Ycr−Ysr)(x−Xcr),Ysr<
y} において、上から1ラインずつ、右から左に黒画素を検
出するまで走査し、検出した黒画素を新たに右準基点画
素Srとする(ステップB2)。次に、領域RTを取り
直し再び検出を行う。黒画素を検出しなかった場合、検
出を終了する。以上より、右準基点画素Srを決定す
る。左準基点画素の場合と同様に、処理量の低減のた
め、 RS={(x,y)|Xcr<x<=Xside2,Y
cl<y<=YMAX2}や RT={(x,y)|(Xcr=Xsr)(y−Yc
r)>(Ycr−Ysr)(x−Xcr),x<=Xs
ide2,Ysr<y<=YMAX2} などのように、基点と準基点からの一定範囲に走査範囲
を限定することも可能である。ただしXside2,Y
MAX2は定数とする。
み、検出した右準基点画素Srの座標値(Xsr,Ys
r)と(Xcr,Ycr)とから得られる図4(D)の
斜線部分の次式で示す領域RT、 RT={(x,y)|(Xcr−Xsr)(y−Yc
r)>(Ycr−Ysr)(x−Xcr),Ysr<
y} において、上から1ラインずつ、右から左に黒画素を検
出するまで走査し、検出した黒画素を新たに右準基点画
素Srとする(ステップB2)。次に、領域RTを取り
直し再び検出を行う。黒画素を検出しなかった場合、検
出を終了する。以上より、右準基点画素Srを決定す
る。左準基点画素の場合と同様に、処理量の低減のた
め、 RS={(x,y)|Xcr<x<=Xside2,Y
cl<y<=YMAX2}や RT={(x,y)|(Xcr=Xsr)(y−Yc
r)>(Ycr−Ysr)(x−Xcr),x<=Xs
ide2,Ysr<y<=YMAX2} などのように、基点と準基点からの一定範囲に走査範囲
を限定することも可能である。ただしXside2,Y
MAX2は定数とする。
【0018】このようにして代表接線検出部3は、左基
点,左準基点各画素Cl,Sl間を結ぶ線分に関する情
報と、右基点,右準基点各画素Cr,Sr間を結ぶ線分
に関する情報とを代表接線TRに関する情報として出力
する。
点,左準基点各画素Cl,Sl間を結ぶ線分に関する情
報と、右基点,右準基点各画素Cr,Sr間を結ぶ線分
に関する情報とを代表接線TRに関する情報として出力
する。
【0019】傾き決定部4は、左基点,左準基点各画素
Cl,Sl間を結ぶ線分の長さである接点間距離Lと、
右基点,右準基点各画素Cr,Sr間を結ぶ線分の長さ
である接点間距離Rとを比較し、長い方の接点間距離を
有する線分の基点画素を画素Cc、準基点画素を画素S
cとおく。xy平面上の上記接点間距離L,Rの一例を
それぞれ示す図5を参照すると、左基点,左準基点各画
素Cl,Slが同一の場合、画素Ccを右基点画素Cr
と同一とし、画素Scを右準基点画素Srと同一とす
る。また、右基点,右準基点各画素Cr,Srが同一の
場合、画素Ccを左基点画素Clと同一とし、画素Sc
を左準基点画素Slと同一とする。左基点,左準基点各
画素Cl,Slが同一かつ右基点,右準基点各画素C
r,Srが同一の場合は、画素Ccを左基点画素Clと
同一とし、画素Scを右基点画素Crと同一とする。画
素Ccの座標値(Xcc,Ycc)と画素Scの座標値
(Xsc,Ysc)から次式により文書の傾き角θを求
める。 θ=Arctan((Ysc−Ycc)/(Xsc−X
cc)) 接点間距離L,Rが等しい時は、対応の線分の傾き角の
絶対値が0に近い方をθとする。
Cl,Sl間を結ぶ線分の長さである接点間距離Lと、
右基点,右準基点各画素Cr,Sr間を結ぶ線分の長さ
である接点間距離Rとを比較し、長い方の接点間距離を
有する線分の基点画素を画素Cc、準基点画素を画素S
cとおく。xy平面上の上記接点間距離L,Rの一例を
それぞれ示す図5を参照すると、左基点,左準基点各画
素Cl,Slが同一の場合、画素Ccを右基点画素Cr
と同一とし、画素Scを右準基点画素Srと同一とす
る。また、右基点,右準基点各画素Cr,Srが同一の
場合、画素Ccを左基点画素Clと同一とし、画素Sc
を左準基点画素Slと同一とする。左基点,左準基点各
画素Cl,Slが同一かつ右基点,右準基点各画素C
r,Srが同一の場合は、画素Ccを左基点画素Clと
同一とし、画素Scを右基点画素Crと同一とする。画
素Ccの座標値(Xcc,Ycc)と画素Scの座標値
(Xsc,Ysc)から次式により文書の傾き角θを求
める。 θ=Arctan((Ysc−Ycc)/(Xsc−X
cc)) 接点間距離L,Rが等しい時は、対応の線分の傾き角の
絶対値が0に近い方をθとする。
【0020】接点間距離L,Rが等しく、傾き角の絶対
値が共に等しい場合は、θ=0とする。
値が共に等しい場合は、θ=0とする。
【0021】傾き補正部5では、画像記憶部2に保持し
た画像データDCに対して、傾き決定部4で求めた傾き
角θの分だけ回転変換を行って傾きを補正し、補正画像
データDDを出力する。
た画像データDCに対して、傾き決定部4で求めた傾き
角θの分だけ回転変換を行って傾きを補正し、補正画像
データDDを出力する。
【0022】認識部6は、補正画像データDDに対し
て、公知の射影分布を用いた分割によりレイアウト解析
を行い、方向特徴抽出を用いたパタンマッチングによる
文字認識を行う。前者については、例えば、電子情報通
信学会論文誌,D−II,第74−D−II巻,199
1年,第4号,第491〜498頁“スプリット検出法
による文書画像構造解析”に記載され、文書画像の構造
解析手法として、領域分割過程で、新たに複数のブロッ
クを再度構成し直す再帰的なスプリット検出手法であ
り、さらに射影分布を用いたブロック分割に、それらを
分離する汎用的尺度として分散比を導入するものであ
る。また、後者については例えば、プレプロシーディン
グ・オブ・ザ・サード・インターナショナル・ワークシ
ョップ・オン・フロンティアズ・イン・ハンドライティ
ング・レコグニション(Pre−Proceeding
s of the third Internatio
nal Workshop on Frontiers
in Handwriting Recogniti
on),1993年,第343〜348頁所載の論文
“Normalization−cooperated
Feature Extraction Metho
d forHandprinted Kanji Ch
aracter Recognition”に記載され
ている。
て、公知の射影分布を用いた分割によりレイアウト解析
を行い、方向特徴抽出を用いたパタンマッチングによる
文字認識を行う。前者については、例えば、電子情報通
信学会論文誌,D−II,第74−D−II巻,199
1年,第4号,第491〜498頁“スプリット検出法
による文書画像構造解析”に記載され、文書画像の構造
解析手法として、領域分割過程で、新たに複数のブロッ
クを再度構成し直す再帰的なスプリット検出手法であ
り、さらに射影分布を用いたブロック分割に、それらを
分離する汎用的尺度として分散比を導入するものであ
る。また、後者については例えば、プレプロシーディン
グ・オブ・ザ・サード・インターナショナル・ワークシ
ョップ・オン・フロンティアズ・イン・ハンドライティ
ング・レコグニション(Pre−Proceeding
s of the third Internatio
nal Workshop on Frontiers
in Handwriting Recogniti
on),1993年,第343〜348頁所載の論文
“Normalization−cooperated
Feature Extraction Metho
d forHandprinted Kanji Ch
aracter Recognition”に記載され
ている。
【0023】この第1の実施の形態では、基点検出手段
31により、左,右各基点画素Cl,Crの2点を検出
したが、右基点画素Crを左基点画素Clと同一として
1点のみを検出することにより処理量を低減することも
できる。
31により、左,右各基点画素Cl,Crの2点を検出
したが、右基点画素Crを左基点画素Clと同一として
1点のみを検出することにより処理量を低減することも
できる。
【0024】本発明の第2の実施の形態を図1と共通の
構成要素は共通の文字を付して同様にブロックで示す図
6を参照すると、この図に示す本実施の形態の前述の第
1の実施の形態との相違点は、代表接線検出部3の代り
に画像データ中の黒画素に接する接線を検出する代表接
線検出部103を、傾き決定部4の代りに代表接線検出
部103により求めた接線の傾き角から文書の傾き角を
決定する傾き決定部104とを備えることである。
構成要素は共通の文字を付して同様にブロックで示す図
6を参照すると、この図に示す本実施の形態の前述の第
1の実施の形態との相違点は、代表接線検出部3の代り
に画像データ中の黒画素に接する接線を検出する代表接
線検出部103を、傾き決定部4の代りに代表接線検出
部103により求めた接線の傾き角から文書の傾き角を
決定する傾き決定部104とを備えることである。
【0025】第1の実施の形態との動作の異なる代表接
線抽出部103および傾き決定部104について説明す
る。
線抽出部103および傾き決定部104について説明す
る。
【0026】代表接線検出部103は、画像データ内の
各々次式で示す2つの領域、領域DL,DRを求める。 DL={(x,y)|XLmin<x<XLmin+
W} DR={(x,y)|XRmax−W<x<XRma
x} ただし、Wは正定数、XLmin,XRmaxは、それ
ぞれ黒画素領域のx軸方向の最小値,最大値である。た
だし、 XLmin+W≧XRmax−W の時は、 XLmin=XRmax−W とする。
各々次式で示す2つの領域、領域DL,DRを求める。 DL={(x,y)|XLmin<x<XLmin+
W} DR={(x,y)|XRmax−W<x<XRma
x} ただし、Wは正定数、XLmin,XRmaxは、それ
ぞれ黒画素領域のx軸方向の最小値,最大値である。た
だし、 XLmin+W≧XRmax−W の時は、 XLmin=XRmax−W とする。
【0027】各領域DL,DRにおいて、y=0より、
上から1ラインずつ、x軸方向に左から右に黒画素を検
出するまで走査し、領域DLから検出した黒画素を左基
点画素GL、領域DRから検出した黒画素を右基点画素
GRとする。図7に領域DL,DRと左,右各基点画素
GL,GRの一例を示す。求めた左,右各基点画素G
L,GR間を結ぶ直線を代表接線とする。
上から1ラインずつ、x軸方向に左から右に黒画素を検
出するまで走査し、領域DLから検出した黒画素を左基
点画素GL、領域DRから検出した黒画素を右基点画素
GRとする。図7に領域DL,DRと左,右各基点画素
GL,GRの一例を示す。求めた左,右各基点画素G
L,GR間を結ぶ直線を代表接線とする。
【0028】傾き決定低部104は、左基点画素GLの
座標値(Xl,Yl)と右基点画素GRの座標値(X
r,Yr)を通る代表接線の傾き角θ=Arctan
(Yl−Yr)/(Xl−Xr))を文書の傾き角とす
る。
座標値(Xl,Yl)と右基点画素GRの座標値(X
r,Yr)を通る代表接線の傾き角θ=Arctan
(Yl−Yr)/(Xl−Xr))を文書の傾き角とす
る。
【0029】以上本発明の実施の形態を説明したが、こ
れに限ることなく種々の変形が考えられる。例えば、接
点間距離が長い方の代表接線の求め方としては、黒画素
領域に接するすべての接線を求め、その中から最長のも
のを選ぶ方法など、さまざまな方法が考えられる。
れに限ることなく種々の変形が考えられる。例えば、接
点間距離が長い方の代表接線の求め方としては、黒画素
領域に接するすべての接線を求め、その中から最長のも
のを選ぶ方法など、さまざまな方法が考えられる。
【0030】また、各行の文字の書き出し位置が縦方向
に一定である文書の場合、第1,第2の実施の形態のx
座標をy座標に、y座標をx座標に置換えることによ
り、画像の左端部の黒画素に接する接線を求め、その接
線の傾きを用いて文書の傾きを補正することも可能であ
る。
に一定である文書の場合、第1,第2の実施の形態のx
座標をy座標に、y座標をx座標に置換えることによ
り、画像の左端部の黒画素に接する接線を求め、その接
線の傾きを用いて文書の傾きを補正することも可能であ
る。
【0031】また本発明の文字入力装置では、第1の実
施の形態の認識部は構成要素として不可欠でなく、ファ
イリングシステムやコピー基点画素において、傾きを検
出し補正する場合のみにおいても本発明を適用できる。
施の形態の認識部は構成要素として不可欠でなく、ファ
イリングシステムやコピー基点画素において、傾きを検
出し補正する場合のみにおいても本発明を適用できる。
【0032】
【発明の効果】以上説明したように、本発明の文字入力
装置は、画像データ中の黒画素に接する点である接点を
通過する接線の中から複数の接点間の距離が長い方の接
線を代表接線として検出する代表接線検出部と、代表接
線の傾きから文書の傾きを決定する傾き決定部とを備え
ることにより、画像データ中の黒画素に接する接線のみ
を用いて文書の傾きを求めるので文字を切出す必要がな
く、かつ傾きを求めるため画像データ全体を走査範囲と
する必要がないため、従来よりはるかに少ない処理量で
画像の傾きを検出することができるという効果がある。
装置は、画像データ中の黒画素に接する点である接点を
通過する接線の中から複数の接点間の距離が長い方の接
線を代表接線として検出する代表接線検出部と、代表接
線の傾きから文書の傾きを決定する傾き決定部とを備え
ることにより、画像データ中の黒画素に接する接線のみ
を用いて文書の傾きを求めるので文字を切出す必要がな
く、かつ傾きを求めるため画像データ全体を走査範囲と
する必要がないため、従来よりはるかに少ない処理量で
画像の傾きを検出することができるという効果がある。
【図1】本発明の文字入力装置の第1の実施の形態を示
すブロック図である。
すブロック図である。
【図2】図1の画像記憶部に記憶された保持画像データ
の一例を示す説明図である。
の一例を示す説明図である。
【図3】図1の基準点検出手段の動作の一例を示すフロ
ーチャートである。
ーチャートである。
【図4】本実施の形態の画像データの領域を示した説明
図である。
図である。
【図5】本実施の形態における接点間距離の一例を示す
説明図である。
説明図である。
【図6】本発明の文字入力装置の第2の実施の形態を示
すブロック図である。
すブロック図である。
【図7】本実施の形態における領域と左基点画素と右基
点画素をそれぞれ示す説明図である。
点画素をそれぞれ示す説明図である。
1 入力部 2 画像記憶部 3,103 代表接線検出部 31 基点検出手段 32,33 準基点検出手段 4,104 傾き決定部 5 傾き補正部 6 認識部
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G06K 9/32
Claims (3)
- 【請求項1】 文書を走査型の光電変換手段により読取
って白画素と黒画素との2値の画素から成る画像データ
を生成入力する入力部と、 前記画像データ中の黒画素
領域の上端の左端の画素である左基点画素とこの左基点
画素の左下方側の黒画素領域の端点画素である左準基点
画素とを結ぶ線分である左接線と、前記左基点画素から
連続する同一y座標の黒画素領域の右端の画素である右
基点画素とこの右基点画素の右下方側の黒画素領域の端
点画素である右準基点画素とを結ぶ線分である右接線と
のうち、線分の長さが長い方の接線を代表接線として検
出する代表接線検出部と、 前記代表接線の傾きから前記文書の走査方向に対する傾
きを決定する傾き決定部とを備えることを特徴とする文
字入力装置。 - 【請求項2】 前記代表接線検出部が、前記画像データ
の最上部であるy=0から1ラインずつx軸方向に左か
ら右に走査したときの最初に検出される黒画素である前
記左基点画素とこの左基点画素から連続する同一y座標
の黒画素領域の右端の画素である前記右基点画素とを検
出する基点検出手段と、 前記左基点画素の座標値から予め定めた関係で求まる第
1の領域の最上部から1ラインずつx軸方向に左から右
に走査したときの最初に検出される黒画素である前記左
準基点画素を検出する左準基点検出手段と、 前記右基点画素の座標値から予め定めた関係で求まる第
2の領域の最上部から1ラインずつx軸方向に右から左
に走査したときの最初に検出される黒画素である前記右
準基点画素を検出する右準基点検出手段とを備えること
を特徴とする請求項1記載の文字入力装置。 - 【請求項3】 文書を走査型の光電変換手段により読取
って白画素と黒画素との2値の画素から成る画像データ
を生成入力する入力部と、 前記画像データの前記黒画素を含む黒画素領域のx座標
の最小値の第1の座標とこの最小値に予め定めた固定値
とを加算した第2の座標との間の第3の領域と黒画素領
域のx座標の最大値の第3の座標とこの最大値から前記
固定値を減算した第4の座標との間の第4の領域とを求
め、前記第3,第4の領域の各々の最上部から1ライン
ずつx軸方向に左から右に走査したときの最初に検出さ
れる各々の黒画素をそれぞれ左基点画素,右基点画素と
して検出し、これら左基点画素,右基点画素の各々の座
標を通過する線分を代表接線として出力する代表接線検
出部と、 前記代表接線の傾きを前記文書の傾きとして決定する傾
き決定部とを備えることを特徴とする文字入力装置。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP7251549A JP3006466B2 (ja) | 1995-09-28 | 1995-09-28 | 文字入力装置 |
EP96115564A EP0766193B1 (en) | 1995-09-28 | 1996-09-27 | Optical character reader with skew correction |
DE69619451T DE69619451T2 (de) | 1995-09-28 | 1996-09-27 | Optische Zeichenleser mit Schiefekorrektur |
US08/720,324 US5982952A (en) | 1995-09-28 | 1996-09-27 | Optical character reader with tangent detection for detecting tilt of image data |
US09/210,278 US6175664B1 (en) | 1995-09-28 | 1998-12-11 | Optical character reader with tangent detection for detecting tilt of image data |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP7251549A JP3006466B2 (ja) | 1995-09-28 | 1995-09-28 | 文字入力装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH0997310A JPH0997310A (ja) | 1997-04-08 |
JP3006466B2 true JP3006466B2 (ja) | 2000-02-07 |
Family
ID=17224490
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP7251549A Expired - Fee Related JP3006466B2 (ja) | 1995-09-28 | 1995-09-28 | 文字入力装置 |
Country Status (4)
Country | Link |
---|---|
US (2) | US5982952A (ja) |
EP (1) | EP0766193B1 (ja) |
JP (1) | JP3006466B2 (ja) |
DE (1) | DE69619451T2 (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6256412B1 (en) * | 1996-03-04 | 2001-07-03 | Ricoh Company, Ltd. | Image recognition method and apparatus using image rotation information |
JP4067957B2 (ja) * | 2002-12-20 | 2008-03-26 | 富士通株式会社 | 境界検出方法、プログラム、及び画像処理装置 |
US20110188759A1 (en) * | 2003-06-26 | 2011-08-04 | Irina Filimonova | Method and System of Pre-Analysis and Automated Classification of Documents |
RU2003108433A (ru) * | 2003-03-28 | 2004-09-27 | Аби Софтвер Лтд. (Cy) | Способ предварительной обработки изображения машиночитаемой формы |
RU2635259C1 (ru) | 2016-06-22 | 2017-11-09 | Общество с ограниченной ответственностью "Аби Девелопмент" | Способ и устройство для определения типа цифрового документа |
US7286718B2 (en) | 2004-01-26 | 2007-10-23 | Sri International | Method and apparatus for determination of text orientation |
EP1768387B1 (en) * | 2005-09-22 | 2014-11-05 | Samsung Electronics Co., Ltd. | Image capturing apparatus with image compensation and method therefor |
DE102008061995A1 (de) | 2008-12-12 | 2010-06-17 | Siemens Aktiengesellschaft | Anordnung und Verfahren zur Anzeige einer Meldung an einen Straßenverkehrsteilnehmer |
US20130106894A1 (en) | 2011-10-31 | 2013-05-02 | Elwha LLC, a limited liability company of the State of Delaware | Context-sensitive query enrichment |
CN106586135B (zh) * | 2016-12-28 | 2018-09-18 | 天津普达软件技术有限公司 | 一种产品包装盒生产日期喷印不良品剔除方法 |
Family Cites Families (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4558461A (en) * | 1983-06-17 | 1985-12-10 | Litton Systems, Inc. | Text line bounding system |
JPS61160180A (ja) * | 1985-01-08 | 1986-07-19 | Nippon Telegr & Teleph Corp <Ntt> | 文字列方向判別装置 |
US4918740A (en) * | 1985-10-01 | 1990-04-17 | Palantir Corporation | Processing means for use in an optical character recognition system |
JPS62281084A (ja) * | 1986-05-30 | 1987-12-05 | Fujitsu Ltd | 文字行傾き検出方式 |
EP0258577B1 (en) * | 1986-07-11 | 1993-02-03 | Sumitomo Electric Industries Limited | Optical character reader |
JPS63268081A (ja) * | 1987-04-17 | 1988-11-04 | インタ−ナショナル・ビジネス・マシ−ンズ・コ−ポレ−ション | 文書の文字を認識する方法及び装置 |
US4809344A (en) * | 1987-05-11 | 1989-02-28 | Nippon Sheet Glass Co., Ltd. | Apparatus for preprocessing of character recognition |
US4985930A (en) * | 1987-09-24 | 1991-01-15 | Hitachi, Ltd. | Image data filing system and image data correcting method |
JPS6482286A (en) * | 1987-09-25 | 1989-03-28 | Toshiba Corp | Image inclination detector |
US5031225A (en) * | 1987-12-09 | 1991-07-09 | Ricoh Company, Ltd. | Character recognition method for recognizing character in an arbitrary rotation position |
EP0325233B1 (en) * | 1988-01-18 | 1994-07-27 | Kabushiki Kaisha Toshiba | Character string recognition system |
JPH02116987A (ja) * | 1988-10-27 | 1990-05-01 | Toshiba Corp | 文字認識装置 |
US5058182A (en) * | 1988-05-02 | 1991-10-15 | The Research Foundation Of State Univ. Of New York | Method and apparatus for handwritten character recognition |
US5131053A (en) * | 1988-08-10 | 1992-07-14 | Caere Corporation | Optical character recognition method and apparatus |
US5245676A (en) * | 1989-12-21 | 1993-09-14 | Xerox Corporation | Determination of image skew angle from data including data in compressed form |
JPH04584A (ja) * | 1990-01-31 | 1992-01-06 | Aisin Seiki Co Ltd | 回転文字認識方法 |
JPH0535841A (ja) * | 1991-07-31 | 1993-02-12 | Toshiba Corp | 画像記憶装置 |
CA2077970C (en) * | 1991-11-19 | 1999-02-23 | Daniel P. Huttenlocher | Optical word recognition by examination of word shape |
JP3320759B2 (ja) * | 1991-12-26 | 2002-09-03 | 株式会社東芝 | 文書画像傾き検出装置およびその方法 |
US5335290A (en) * | 1992-04-06 | 1994-08-02 | Ricoh Corporation | Segmentation of text, picture and lines of a document image |
WO1994027251A1 (en) * | 1993-05-18 | 1994-11-24 | Massachusetts Institute Of Technology | Automated reading system and method |
US5638462A (en) * | 1993-12-24 | 1997-06-10 | Nec Corporation | Method and apparatus for recognizing graphic forms on the basis of elevation angle data associated with sequence of points constituting the graphic form |
JP3924796B2 (ja) * | 1995-04-25 | 2007-06-06 | 株式会社デンソー | パターン位置の計測方法および計測装置 |
-
1995
- 1995-09-28 JP JP7251549A patent/JP3006466B2/ja not_active Expired - Fee Related
-
1996
- 1996-09-27 US US08/720,324 patent/US5982952A/en not_active Expired - Fee Related
- 1996-09-27 DE DE69619451T patent/DE69619451T2/de not_active Expired - Fee Related
- 1996-09-27 EP EP96115564A patent/EP0766193B1/en not_active Expired - Lifetime
-
1998
- 1998-12-11 US US09/210,278 patent/US6175664B1/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
EP0766193A2 (en) | 1997-04-02 |
EP0766193B1 (en) | 2002-02-27 |
DE69619451D1 (de) | 2002-04-04 |
US5982952A (en) | 1999-11-09 |
US6175664B1 (en) | 2001-01-16 |
DE69619451T2 (de) | 2002-11-21 |
EP0766193A3 (en) | 1997-10-29 |
JPH0997310A (ja) | 1997-04-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4170441B2 (ja) | 文書画像傾き検出装置および文書画像傾き検出プログラムの記憶媒体 | |
US7684646B2 (en) | System and method of determining image skew using connected components | |
JP3338537B2 (ja) | 画像傾き検出装置 | |
JP2986383B2 (ja) | ライン走査画像のためのスキューを補正する方法及びその装置 | |
JP4395188B2 (ja) | 文書画像認識装置および文書画像認識プログラムの記憶媒体 | |
US9959475B2 (en) | Table data recovering in case of image distortion | |
US4891750A (en) | Optical character recognition by forming and detecting matrices of geo features | |
JP2002133426A (ja) | 多値画像から罫線を抽出する罫線抽出装置 | |
JPH01253077A (ja) | 文字列検出方法 | |
JP3006466B2 (ja) | 文字入力装置 | |
US6771842B1 (en) | Document image skew detection method | |
US5923782A (en) | System for detecting and identifying substantially linear horizontal and vertical lines of engineering drawings | |
JP4011646B2 (ja) | 行検出方法および文字認識装置 | |
JP3303246B2 (ja) | 画像処理装置 | |
JP2868134B2 (ja) | 画像処理方法及び装置 | |
JPH06231253A (ja) | 画像修正装置及び図面入力装置 | |
JP4070486B2 (ja) | 画像処理装置、画像処理方法及び同方法の実行に用いるプログラム | |
US7103220B2 (en) | Image processing apparatus, method and program, and storage medium | |
JP7532124B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
JPH10162102A (ja) | 文字認識装置 | |
JP3095470B2 (ja) | 文字認識装置 | |
JPH11250179A (ja) | 文字認識装置および文字認識方法 | |
JP2581809B2 (ja) | 文字切出し装置 | |
JP2000011192A (ja) | 画像間位置合わせ方法 | |
JP3517077B2 (ja) | パターン抽出装置及びパターン領域の切り出し方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Cancellation because of no payment of annual fees |