JPS62200486A - 文字読取装置 - Google Patents
文字読取装置Info
- Publication number
- JPS62200486A JPS62200486A JP61043165A JP4316586A JPS62200486A JP S62200486 A JPS62200486 A JP S62200486A JP 61043165 A JP61043165 A JP 61043165A JP 4316586 A JP4316586 A JP 4316586A JP S62200486 A JPS62200486 A JP S62200486A
- Authority
- JP
- Japan
- Prior art keywords
- character
- scanning
- histogram
- image
- line
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 claims description 7
- 238000000605 extraction Methods 0.000 claims 1
- 230000005484 gravity Effects 0.000 abstract description 5
- 238000000034 method Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 4
- 238000005259 measurement Methods 0.000 description 2
- 206010027146 Melanoderma Diseases 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
Landscapes
- Character Input (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
[発明の目的1
(産業上の利用分野)
本発明は、文字が記録された帳票を搬送および走査して
、前記文字を読取る文字読取装置に関する。
、前記文字を読取る文字読取装置に関する。
(従来の技術)
従来から、各種事務処理分野において文字読取装置が広
く用いられているが、この文字読取装置では、読取るべ
き帳票が傾いた状態(以下、スキューした状態と称する
)で搬送されると、そのままの状態で読取走査を行って
も文字を読取ることができないため、信号処理上でスキ
ューを補正することが行われている。
く用いられているが、この文字読取装置では、読取るべ
き帳票が傾いた状態(以下、スキューした状態と称する
)で搬送されると、そのままの状態で読取走査を行って
も文字を読取ることができないため、信号処理上でスキ
ューを補正することが行われている。
このスキュー補正の一例を第7図にしたがって説明する
。
。
同図において1はイメージメモリ、2aはイメージメモ
リ1に書込まれた帳票の全体イメージ、3は帳票の全体
イメージ2a上の文字行である。
リ1に書込まれた帳票の全体イメージ、3は帳票の全体
イメージ2a上の文字行である。
まず帳票の全体イメージ2aがあらかじめイメージメモ
リ1に書込んであるとする。
リ1に書込んであるとする。
文字行3の読取りを行う場合には、帳票2の全体イメー
ジ2aの上辺部に点A、B、Cを設定し、これらの点に
よって帳票の傾き度を検出する。そして帳票の全体イメ
ージ2aの左辺部に点り、E、F、・・・を設定し、こ
れらの点により帳票の位置を検出する。
ジ2aの上辺部に点A、B、Cを設定し、これらの点に
よって帳票の傾き度を検出する。そして帳票の全体イメ
ージ2aの左辺部に点り、E、F、・・・を設定し、こ
れらの点により帳票の位置を検出する。
こうして得られた帳票の傾きおよび位置を基に、文字行
3が存在していると思われる位置を走査して実際に文字
行3を読取る。
3が存在していると思われる位置を走査して実際に文字
行3を読取る。
なお帳票上における文字行3の位置、すなわち帳票のフ
ォーマットは、あらかじめ判明している。
ォーマットは、あらかじめ判明している。
この方式は帳票の全体イメージ2aが一度にイメージメ
モリ1に書込まれる場合に好適するが、一度に帳票の数
行力のイメージしか書込むことができないメモリを用い
ている場合でも、ある程度適用することができる。
モリ1に書込まれる場合に好適するが、一度に帳票の数
行力のイメージしか書込むことができないメモリを用い
ている場合でも、ある程度適用することができる。
ざらにこの方式は、帳票の搬送途中にそのスキューが徐
々に増していくような場合でも、ある程度適用すること
ができる。この場合、イメージメモリ1に書込まれた帳
票の全体イメージ2aは、第7図に示したような直線的
なものにはならず若干歪んだイメージとなるが、帳票の
左辺部に設定する点り、E、F、・・・の変位により、
帳票のスキューの進行状況を検出する。
々に増していくような場合でも、ある程度適用すること
ができる。この場合、イメージメモリ1に書込まれた帳
票の全体イメージ2aは、第7図に示したような直線的
なものにはならず若干歪んだイメージとなるが、帳票の
左辺部に設定する点り、E、F、・・・の変位により、
帳票のスキューの進行状況を検出する。
ところで前述した方式により、スキューした帳票からの
文字行の読取りが可能となるには、(a)各帳票の形状
が一定である。
文字行の読取りが可能となるには、(a)各帳票の形状
が一定である。
(b)各帳票上の文字行の相対的な位置(フォーマット
)が一定である。
)が一定である。
(C)帳票上の文字自体には傾ぎがない。
という条件が満たされている必要があり、これら3つの
条件が満たされていない場合には読取りを実行すること
ができないという問題があった。
条件が満たされていない場合には読取りを実行すること
ができないという問題があった。
(発明が解決しようとする問題点)
本発明は上述した問題点を解決すべくなされたもので、
帳票の形状が不均一であったり、文字行の相対的な位置
にずれが生じていたり、文字自体に傾きが生じていた場
合でも、読取りを実行することができる文字読取装置の
提供を目的としている。
帳票の形状が不均一であったり、文字行の相対的な位置
にずれが生じていたり、文字自体に傾きが生じていた場
合でも、読取りを実行することができる文字読取装置の
提供を目的としている。
[発明の構成]
本発明の文字読取装置は、帳票の全体イメージを格納す
るイメージ格納手段と、全体イメージを任意の傾きで走
査可能なイメージ走査手段と、全体イメージから帳票の
所定行中の1文字のイメージを抽出するイメージ抽出手
段と、抽出された文字のイメージにおける中心点を求め
る文字中心点検出手段と、前記文字のイメージをその中
心点を通る任意の方向に走査して各方向の黒点のヒスト
グラムを求めるヒストグラム検出手段と、前記ヒストグ
ラムに基づいて前記所定行の傾き度を求める文字行傾き
度検出手段と、前記所定行の傾き度からその次の行の傾
き度を予測する傾き度予測手段とを具備としている。
るイメージ格納手段と、全体イメージを任意の傾きで走
査可能なイメージ走査手段と、全体イメージから帳票の
所定行中の1文字のイメージを抽出するイメージ抽出手
段と、抽出された文字のイメージにおける中心点を求め
る文字中心点検出手段と、前記文字のイメージをその中
心点を通る任意の方向に走査して各方向の黒点のヒスト
グラムを求めるヒストグラム検出手段と、前記ヒストグ
ラムに基づいて前記所定行の傾き度を求める文字行傾き
度検出手段と、前記所定行の傾き度からその次の行の傾
き度を予測する傾き度予測手段とを具備としている。
(作 用)
帳票がスキューして搬送されてぎても、帳票中の成る行
の成る1文字の中心を通って読取走査を行い、黒点のヒ
ストグラムの値が最も大きくなる走査方向を求め、この
方向を文字行の傾きとして文字行の読取りを行ない、さ
らにこの方向を考慮して次の行の読取走査を行なうこと
を繰返すので、帳票の形状が不均一であっても、また各
文字行の相対的な位置がずれていても、ざらには各文字
の傾きが不均一であっても、相当の精度で読取りを実行
することができる。
の成る1文字の中心を通って読取走査を行い、黒点のヒ
ストグラムの値が最も大きくなる走査方向を求め、この
方向を文字行の傾きとして文字行の読取りを行ない、さ
らにこの方向を考慮して次の行の読取走査を行なうこと
を繰返すので、帳票の形状が不均一であっても、また各
文字行の相対的な位置がずれていても、ざらには各文字
の傾きが不均一であっても、相当の精度で読取りを実行
することができる。
(実施例)
以下、本発明の実施例の詳細を図面に基づいて説明する
。
。
第1図は本発明の一実施例装置の構成を示すブロック図
である。
である。
同図において4は読取られるべき文字が記録された帳票
、5は前記帳票4の全体イメージを取込むためのイメー
ジセンサ、6はイメージセンサ5の出力信号のノイズ除
去等を実行する前処理部、7は取込んだ帳票全体のイメ
ージを一時的に蓄えるイメージメモリ、8はイメージメ
モリ7上の文字行の位置および傾きを検出するための文
字行位置・傾き検出部、9は文字行位置・傾き検出部8
からの位置情報、傾き情報を受けて、イメージメモリ7
を走査する走査制御部、10はイメージメモリ1から取
出された1文字行の各文字を認識する1文字行認識部で
ある。
、5は前記帳票4の全体イメージを取込むためのイメー
ジセンサ、6はイメージセンサ5の出力信号のノイズ除
去等を実行する前処理部、7は取込んだ帳票全体のイメ
ージを一時的に蓄えるイメージメモリ、8はイメージメ
モリ7上の文字行の位置および傾きを検出するための文
字行位置・傾き検出部、9は文字行位置・傾き検出部8
からの位置情報、傾き情報を受けて、イメージメモリ7
を走査する走査制御部、10はイメージメモリ1から取
出された1文字行の各文字を認識する1文字行認識部で
ある。
なお本実施例ではイメージメモリ7に、あらかじめ帳票
4の全体イメージが書込まれており、また帳票のおおよ
その形状と帳票中の文字行のおおよその位置とがめらか
しめ判明していると仮定する。
4の全体イメージが書込まれており、また帳票のおおよ
その形状と帳票中の文字行のおおよその位置とがめらか
しめ判明していると仮定する。
次に第2図に従って本実施例装置の動作について説明す
る。
る。
まず第1行の第1文字目の中心を検出する(ステップA
)。この方法は公知であるが、たとえば次のように行う
。
)。この方法は公知であるが、たとえば次のように行う
。
第3図に示したように、イメージメモリ7に書込まれて
いる帳票の全体イメージ4aの上辺部に点A、B、Cを
、その左辺部に点り、E、F、・・・を設定し、これら
の点の座標により帳票4のおおよその位置および傾き度
を知る。
いる帳票の全体イメージ4aの上辺部に点A、B、Cを
、その左辺部に点り、E、F、・・・を設定し、これら
の点の座標により帳票4のおおよその位置および傾き度
を知る。
次のこの情報を用いて、帳票4上の第1行第1文字目の
文字が存在すると思われる位置に第4図においてFで示
したような矩形領域を想定する。
文字が存在すると思われる位置に第4図においてFで示
したような矩形領域を想定する。
この矩形領域Fの大ぎさは、帳票4の位置検出の精度お
よび帳票上の文字の精度を考慮して目的の文字が確実に
含まれるように設定する。
よび帳票上の文字の精度を考慮して目的の文字が確実に
含まれるように設定する。
そして矩形領域Fの内部を縦方向に左側から走査し、文
字の左端を検出したら、そこから右方向へ、文字の幅よ
りも少しだけ大きな値Wだけ走査を続け、横方向の黒点
のヒストグラムaを求める。
字の左端を検出したら、そこから右方向へ、文字の幅よ
りも少しだけ大きな値Wだけ走査を続け、横方向の黒点
のヒストグラムaを求める。
なおここで1回の走査は黒点を検出した段階で終了させ
、次回の走査に移るものとする。
、次回の走査に移るものとする。
そして矩形領域Fの内部を横方向の上側から走査し、同
様に縦方向の黒点のヒストグラムbを得る。なお第3図
においてト(は文字の高さよりも少しだけ大ぎな値であ
る。
様に縦方向の黒点のヒストグラムbを得る。なお第3図
においてト(は文字の高さよりも少しだけ大ぎな値であ
る。
こうして得られた2つの黒点のヒストグラムa1b、そ
れぞれの中央値を求め、第5図においてXで示したよう
な、目的の文字の中心と思われる点を求める(以下、こ
の点を重心と称する)。なおヒストグラムの中央値を求
める際、ヒストグラム中に複数の黒点のブロックが存在
する場合には、最も中央の大きなブロックに注目するよ
うにする。
れぞれの中央値を求め、第5図においてXで示したよう
な、目的の文字の中心と思われる点を求める(以下、こ
の点を重心と称する)。なおヒストグラムの中央値を求
める際、ヒストグラム中に複数の黒点のブロックが存在
する場合には、最も中央の大きなブロックに注目するよ
うにする。
こうして第1行第1文字目の文字の重心が求められたな
らば、次に第1行の傾きを求める(ステップB)。これ
はたとえば第6図に示すような方法で行う。
らば、次に第1行の傾きを求める(ステップB)。これ
はたとえば第6図に示すような方法で行う。
すなわち第1行第1文字目の重心を共通の通過点として
、図中β1、f!、2、・・・β□で示したような方向
に読取走査を行い、各走査回における黒点の数をカウン
トし、各走査方向の黒点のヒストグラムCを求める。
、図中β1、f!、2、・・・β□で示したような方向
に読取走査を行い、各走査回における黒点の数をカウン
トし、各走査方向の黒点のヒストグラムCを求める。
なお図中りは注目している行の幅よりも少しだけ大きな
値である。またβ1、f12、・・・β、の傾きは、最
初に求めた帳票4のおおよその傾き度を中心として、そ
の前後に定めればよい。
値である。またβ1、f12、・・・β、の傾きは、最
初に求めた帳票4のおおよその傾き度を中心として、そ
の前後に定めればよい。
こうして得られた黒点のヒストグラムCが最大値yにな
るような走査方向の傾きfl+を求めて、このβ1の傾
きを第1行目の傾きとする。
るような走査方向の傾きfl+を求めて、このβ1の傾
きを第1行目の傾きとする。
このようにして第1行第1文字目の文字の中心と第1行
目の傾きとが得られたならば、これを用いて第1行目の
イメージがイメージメモリから切り出され(ステップC
)、第1図における1行認識部10へ送られて認識され
る(ステップD)。
目の傾きとが得られたならば、これを用いて第1行目の
イメージがイメージメモリから切り出され(ステップC
)、第1図における1行認識部10へ送られて認識され
る(ステップD)。
この各行の切出しは、前記λ1を走査中心とじて実行さ
れる。
れる。
さらに第1行目を1行認識部10へ送出した後は(ステ
ップE)、第2行目以降の文字行の位置検出(ステップ
F)、傾き検出(ステップG)、各行の切出しおよび認
識を行う(ステップI)。
ップE)、第2行目以降の文字行の位置検出(ステップ
F)、傾き検出(ステップG)、各行の切出しおよび認
識を行う(ステップI)。
そして第2行目以降でも、基本的に第1行目と同じ処理
が行われるが、第2行目以降では1つ前の行の位置およ
び傾きが既に判明していることから、これを利用する。
が行われるが、第2行目以降では1つ前の行の位置およ
び傾きが既に判明していることから、これを利用する。
すなわち、帳票4内の行の構成はあらかじめ判明してい
ることから、おる行の最初の文字の位置を基に次の行の
最初の文字の位置を予測するのでおる。
ることから、おる行の最初の文字の位置を基に次の行の
最初の文字の位置を予測するのでおる。
本実施例では各帳票の形状が不均一であると仮定してい
るため、第2行目以降も第1行目と同様に文字の傾き等
を検出しなければならないが、第2行目以降の最初の文
字の位置の予測は、第1行目の場合よりも容易でおるた
め、第2行目以降では、第1文字目の文字を検出するた
めの矩形領域Fの大ぎざを第1行目の場合のそれよりも
小さくすることができるので、読取走査に要する時間が
短縮される。
るため、第2行目以降も第1行目と同様に文字の傾き等
を検出しなければならないが、第2行目以降の最初の文
字の位置の予測は、第1行目の場合よりも容易でおるた
め、第2行目以降では、第1文字目の文字を検出するた
めの矩形領域Fの大ぎざを第1行目の場合のそれよりも
小さくすることができるので、読取走査に要する時間が
短縮される。
なお本実施例を、長さが極端に短い行に対して適用する
と、行の傾きの測定において不適当な結果が生じること
があるため、実際には読取るべき行の長さに応じて傾き
の測定を変更するか、あるいは別個にデフォルトの値(
傾きが検出できなかった場合に一義的に適用すべき値)
を用意しておく等の対策をとることが望ましい。
と、行の傾きの測定において不適当な結果が生じること
があるため、実際には読取るべき行の長さに応じて傾き
の測定を変更するか、あるいは別個にデフォルトの値(
傾きが検出できなかった場合に一義的に適用すべき値)
を用意しておく等の対策をとることが望ましい。
[発明の効果]
以上説明したように本発明によれば、帳票中の成る行の
成る文字の中心を通って読取走査を行い、黒点のヒスト
グラムの値が最も大ぎくなる走査方向を求め、この方向
を文字行の傾きとして文字行の読取りを行ない、さらに
この方向を考慮して次の行の読取走査を行なうことを繰
返ずので、帳票の形状が不均一でおっても、各文字行の
位置がずれていても、さらには各文字の傾きが不均一で
あっても、スキューした帳票を確実に読取ることができ
る。
成る文字の中心を通って読取走査を行い、黒点のヒスト
グラムの値が最も大ぎくなる走査方向を求め、この方向
を文字行の傾きとして文字行の読取りを行ない、さらに
この方向を考慮して次の行の読取走査を行なうことを繰
返ずので、帳票の形状が不均一でおっても、各文字行の
位置がずれていても、さらには各文字の傾きが不均一で
あっても、スキューした帳票を確実に読取ることができ
る。
【図面の簡単な説明】
第1図は本発明の一実施例装置の構成を示すブロック図
、第2図は同実施例装置の動作を示す流れ図、第3図は
同実施例装置のイメージメモリ内の状態を示す図、第4
図は同実施例装置における読取走査を示す図、第5図は
同実施例装置において文字の中心を求める方法を示す図
、第6図は同実施例装置において文字行の傾ぎを求める
方法を示す図、第7図は従来装置におけるイメージメモ
リの状態を示す図である。 1.7・・・イメージメモリ 2.4・・・帳票 3・・・・・・・・・文字行 5・・・・・・・・・イメージセンサ 6・・・・・・・・・前処理部 8・・・・・・・・・位置・傾き測定部9・・・・・・
・・・走査制御部 10・・・・・・・・・1行認識部 F・・・・・・・・・矩形領域 第1図 第6図 第7図
、第2図は同実施例装置の動作を示す流れ図、第3図は
同実施例装置のイメージメモリ内の状態を示す図、第4
図は同実施例装置における読取走査を示す図、第5図は
同実施例装置において文字の中心を求める方法を示す図
、第6図は同実施例装置において文字行の傾ぎを求める
方法を示す図、第7図は従来装置におけるイメージメモ
リの状態を示す図である。 1.7・・・イメージメモリ 2.4・・・帳票 3・・・・・・・・・文字行 5・・・・・・・・・イメージセンサ 6・・・・・・・・・前処理部 8・・・・・・・・・位置・傾き測定部9・・・・・・
・・・走査制御部 10・・・・・・・・・1行認識部 F・・・・・・・・・矩形領域 第1図 第6図 第7図
Claims (1)
- (1)読取られるべき文字が記録された帳票の全体イメ
ージを格納するイメージ格納手段と、前記全体イメージ
を任意の傾きで走査可能なイメージ走査手段と、前記全
体イメージから前記帳票の所定行中の1文字のイメージ
を抽出するイメージ抽出手段と、前記抽出された文字の
イメージにおける中心点を求める文字中心点検出手段と
、前記文字のイメージを前記中心点を通る任意の方向に
走査して各方向の黒点のヒストグラムを求めるヒストグ
ラム検出手段と、前記黒点のヒストグラムに基づいて前
記所定行の傾き度を求める文字行傾き度検出手段と、前
記所定行の傾き度からその次の行の傾き度を予測する傾
き度予測手段とを具備してなることを特徴とする文字読
取装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61043165A JPS62200486A (ja) | 1986-02-28 | 1986-02-28 | 文字読取装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61043165A JPS62200486A (ja) | 1986-02-28 | 1986-02-28 | 文字読取装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS62200486A true JPS62200486A (ja) | 1987-09-04 |
Family
ID=12656261
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP61043165A Pending JPS62200486A (ja) | 1986-02-28 | 1986-02-28 | 文字読取装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS62200486A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4984280A (en) * | 1988-06-08 | 1991-01-08 | Laurel Bank Machines Co., Ltd. | Bill discriminating apparatus |
WO1996030870A1 (fr) * | 1995-03-29 | 1996-10-03 | Hitachi, Ltd. | Systeme et procede de traitement de l'image |
US5696841A (en) * | 1990-08-03 | 1997-12-09 | Canon Kabushiki Kaisha | Image processing method and apparatus for extracting vertically and horizontally written text |
-
1986
- 1986-02-28 JP JP61043165A patent/JPS62200486A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4984280A (en) * | 1988-06-08 | 1991-01-08 | Laurel Bank Machines Co., Ltd. | Bill discriminating apparatus |
US5696841A (en) * | 1990-08-03 | 1997-12-09 | Canon Kabushiki Kaisha | Image processing method and apparatus for extracting vertically and horizontally written text |
WO1996030870A1 (fr) * | 1995-03-29 | 1996-10-03 | Hitachi, Ltd. | Systeme et procede de traitement de l'image |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US4656665A (en) | Thresholding technique for graphics images using histogram analysis | |
JP2986383B2 (ja) | ライン走査画像のためのスキューを補正する方法及びその装置 | |
US4847912A (en) | Method of detecting a space between words with optical character reader | |
JPS60262284A (ja) | イメ−ジ処理方法 | |
EP0750415B1 (en) | Image processing method and apparatus | |
JP2000251082A (ja) | 文書画像傾き検出装置 | |
EP0375352B1 (en) | Method of searching a matrix of binary data | |
EP0766193B1 (en) | Optical character reader with skew correction | |
JPS62200486A (ja) | 文字読取装置 | |
JP3303246B2 (ja) | 画像処理装置 | |
JP3058791B2 (ja) | 画像認識装置の図形の切出し方法 | |
JP2778437B2 (ja) | 文書画像傾き検出装置 | |
JP3281469B2 (ja) | 文書画像の傾き検出方法および装置 | |
JPH11288453A (ja) | 再生用のスキャン環境における原稿画像のスキュ―角度および黒い境界線を検出する方法およびシステム | |
JPH10336428A (ja) | 画像処理装置 | |
KR100313991B1 (ko) | 문서영상의기울기검출방법 | |
JPH0373916B2 (ja) | ||
JP3712825B2 (ja) | 画像処理方法、装置および記録媒体 | |
JPS6343788B2 (ja) | ||
JPH0250513B2 (ja) | ||
JPH0799532B2 (ja) | 文字切出し装置 | |
JP3381803B2 (ja) | 傾き角検出装置 | |
JP2843638B2 (ja) | 文字画像整列方法 | |
JPH04276888A (ja) | 文字読取装置 | |
JPH07120392B2 (ja) | 文字パターン切り出し装置 |