JPH0245891A - 文字認識方法 - Google Patents
文字認識方法Info
- Publication number
- JPH0245891A JPH0245891A JP63197740A JP19774088A JPH0245891A JP H0245891 A JPH0245891 A JP H0245891A JP 63197740 A JP63197740 A JP 63197740A JP 19774088 A JP19774088 A JP 19774088A JP H0245891 A JPH0245891 A JP H0245891A
- Authority
- JP
- Japan
- Prior art keywords
- character
- mask
- characters
- central position
- center position
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 12
- 230000000007 visual effect Effects 0.000 description 11
- 238000012545 processing Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/34—Addressing or accessing the instruction operand or the result ; Formation of operand address; Addressing modes
- G06F9/345—Addressing or accessing the instruction operand or the result ; Formation of operand address; Addressing modes of multiple operands or results
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Character Input (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
[産業上の利用分野]
この発明は、文字列を撮像した画像中から任意の文字を
切り出して認識する文字認識方法に関するものである。
切り出して認識する文字認識方法に関するものである。
[従来の技術]
従来、文字列の文字を機械で読み取る方法に、撮像管に
よって文字を撮像し、その像を計算機に取り込んで認識
を行うものが提案されている。
よって文字を撮像し、その像を計算機に取り込んで認識
を行うものが提案されている。
この種の装置において文字を認識するには、計算機に取
り込んだ視覚フィールド内の文字行毎に当該文字行に平
行な軸への射影から各文字の左右端を検出することによ
って個々の文字を切り出しそれに対してパターンマツチ
ング法等を用いて認識している。
り込んだ視覚フィールド内の文字行毎に当該文字行に平
行な軸への射影から各文字の左右端を検出することによ
って個々の文字を切り出しそれに対してパターンマツチ
ング法等を用いて認識している。
また、視覚フィールド内の文字行が認識のための走査方
向に平行になっていない場合には、画面全体を回転させ
ることによって平行にするか、文字切り出し後に修正し
ている。
向に平行になっていない場合には、画面全体を回転させ
ることによって平行にするか、文字切り出し後に修正し
ている。
[発明が解決しようとする課題]
しかしながらこのような従来のものは、文字を切り出す
ための画像処理を各文字行を構成する全画素について行
わねばならないため、画像処理速度に限界がある。また
、各文字間の余白部分についても画像処理を行うので、
ノイズが入り込み易く、文字の誤認識をおこすおそれが
あった。さらに、文字が記載された対象物が正しく位置
決めされていない場合、視覚フィールド内のどの位置に
文字が入るか不明のため、全視覚フィールドについて文
字を検索しなければならず、読み取るまでに時間がかか
っていた。
ための画像処理を各文字行を構成する全画素について行
わねばならないため、画像処理速度に限界がある。また
、各文字間の余白部分についても画像処理を行うので、
ノイズが入り込み易く、文字の誤認識をおこすおそれが
あった。さらに、文字が記載された対象物が正しく位置
決めされていない場合、視覚フィールド内のどの位置に
文字が入るか不明のため、全視覚フィールドについて文
字を検索しなければならず、読み取るまでに時間がかか
っていた。
[課題を解決するための手段]
このような問題を解決するためにこの発明は、比較的大
きな第1のマスクで文字列の文字先頭領域を覆って、文
字列の先頭文字中心位置を求め、そのマスクより小さく
且つ少なくとも文字列の個々の文字を十分に覆うことが
できる第2のマスクを先頭文字の中心位置から所定の距
離だけ文字列方向または行方向に移動させて、第2番目
以降の文字中心位置を求めるものである。
きな第1のマスクで文字列の文字先頭領域を覆って、文
字列の先頭文字中心位置を求め、そのマスクより小さく
且つ少なくとも文字列の個々の文字を十分に覆うことが
できる第2のマスクを先頭文字の中心位置から所定の距
離だけ文字列方向または行方向に移動させて、第2番目
以降の文字中心位置を求めるものである。
[作用]
比較的大きなマスクで文字列の先頭部分中心位置が求め
られ、その位置が判明することによってそれより小さな
マスクが使用され、それぞれの文字が認識される。
られ、その位置が判明することによってそれより小さな
マスクが使用され、それぞれの文字が認識される。
[実施例]
第1図、第2図はこの発明の一実施例を示す視覚フィー
ルドの模式図である。第1図において、1は撮像装置の
視覚フィールドを示し、視覚フィールド1中のアルファ
ベットは撮像された文字である。このように撮像された
視覚フィールド1中の文字の中心位置を認識するにあた
り、まず文字列の先頭部分領域に、その領域を覆う比較
的大きな第1のマスク2をかけて、文字列中の先頭文字
Aの中心位置(座標)を求め、パターンマツチング法等
の文字認識手法を用いて当該文字Aを認識する。先頭文
字をAの位置を検出するには文字列に平行にX軸を、そ
れと直角にY軸を設定し、マスク2内の2値画像の内、
原点Oに最も近い文字もしくは、X軸およびY軸に最も
近い文字を先頭文字として判定することによってなされ
る。そして検出された先頭文字AのX、Y軸の投影の中
心を求めることによって、当該文字Aの中心位置座標を
求めることができる。換言すれば、先頭文字Aの外接長
方形の中心位置座標が決まる。先頭文字の中心位置座標
が定まれば、前述したようにパターンマツチング法など
で文字の認識を行えば良い。
ルドの模式図である。第1図において、1は撮像装置の
視覚フィールドを示し、視覚フィールド1中のアルファ
ベットは撮像された文字である。このように撮像された
視覚フィールド1中の文字の中心位置を認識するにあた
り、まず文字列の先頭部分領域に、その領域を覆う比較
的大きな第1のマスク2をかけて、文字列中の先頭文字
Aの中心位置(座標)を求め、パターンマツチング法等
の文字認識手法を用いて当該文字Aを認識する。先頭文
字をAの位置を検出するには文字列に平行にX軸を、そ
れと直角にY軸を設定し、マスク2内の2値画像の内、
原点Oに最も近い文字もしくは、X軸およびY軸に最も
近い文字を先頭文字として判定することによってなされ
る。そして検出された先頭文字AのX、Y軸の投影の中
心を求めることによって、当該文字Aの中心位置座標を
求めることができる。換言すれば、先頭文字Aの外接長
方形の中心位置座標が決まる。先頭文字の中心位置座標
が定まれば、前述したようにパターンマツチング法など
で文字の認識を行えば良い。
先頭文字Aの認識が終わると、第2図に示すように、マ
スク2よりも小さく、個々の文字を独立に且つ十分覆う
ことができる第2のマスク3を先頭文字Aの中心位置を
始点として予め決められている文字ピッチに従って定ま
る距離だけ離れた箇所に発生させる。そしてこのマスク
3によって文字Bを切り出し、前述と同様な方法で外接
長方形を中心位置を求めて文字Bの中心とするとともに
当該文字Bを認識する。このマスク3は文字を1字分だ
け含み隣接する文字に掛からない大きさに設定される。
スク2よりも小さく、個々の文字を独立に且つ十分覆う
ことができる第2のマスク3を先頭文字Aの中心位置を
始点として予め決められている文字ピッチに従って定ま
る距離だけ離れた箇所に発生させる。そしてこのマスク
3によって文字Bを切り出し、前述と同様な方法で外接
長方形を中心位置を求めて文字Bの中心とするとともに
当該文字Bを認識する。このマスク3は文字を1字分だ
け含み隣接する文字に掛からない大きさに設定される。
以下、同様にして文字C以降を認識していく。
そして、1行目の文字を全て認識し終えると文字Aを始
点として予め定められた次の行の先頭文字Fの位置にマ
スク3を移動させて、この文字列の処理を前述と同様の
方法によって行う。この場合文字Fの位置指定を省略す
るため、マスク3を用いずマスク2を用いても良い。そ
のときこの例ではY軸に最も近く、X軸に2番目に近い
文字がFであるというアルゴリズムによって文字Fを捜
すことになる。
点として予め定められた次の行の先頭文字Fの位置にマ
スク3を移動させて、この文字列の処理を前述と同様の
方法によって行う。この場合文字Fの位置指定を省略す
るため、マスク3を用いずマスク2を用いても良い。そ
のときこの例ではY軸に最も近く、X軸に2番目に近い
文字がFであるというアルゴリズムによって文字Fを捜
すことになる。
第3図は撮像した文字列がX軸に対して傾いている場合
の例で、このときでも各文字の中心位置の求め方は第1
図および第2図に示した方法と同様に行うことができる
。すなわち、ママク2を用いて先頭文字Aをの中心位置
を求めた後、先頭文字Aの中心位置を始点とし、文字ピ
ッチに応じて予め定めた距離を文字列方向に離れた位置
にマスク3を発生させる。このマスク3内に存在する文
字(この例ではアルファベットのB)を切り出して文字
Bの外接長方形の中心位置を求める。この文字Bの中心
位置を基準として、文字列方向に所定圧M離れた位置に
マスク3を移動させると文字AとBの傾斜分だけマスク
が上方に移動する。したがって文字列の傾斜に応じてマ
スク3の大きさを定めれば、各文字を確実に切り出すこ
とができる。
の例で、このときでも各文字の中心位置の求め方は第1
図および第2図に示した方法と同様に行うことができる
。すなわち、ママク2を用いて先頭文字Aをの中心位置
を求めた後、先頭文字Aの中心位置を始点とし、文字ピ
ッチに応じて予め定めた距離を文字列方向に離れた位置
にマスク3を発生させる。このマスク3内に存在する文
字(この例ではアルファベットのB)を切り出して文字
Bの外接長方形の中心位置を求める。この文字Bの中心
位置を基準として、文字列方向に所定圧M離れた位置に
マスク3を移動させると文字AとBの傾斜分だけマスク
が上方に移動する。したがって文字列の傾斜に応じてマ
スク3の大きさを定めれば、各文字を確実に切り出すこ
とができる。
[発明の効果]
以上説明したようにこの発明は、比較的大きなマスクに
よって先頭文字の中心位置を求め、その後そのマスクよ
りも小さくかつ個々の文字を覆うことができるマスクを
先頭文字中心位置から所定文字列方向または行方向に移
動させて2番目以降の文字の中心位置を求めるようにし
たので、視覚フィールドにおける最小限の領域の画像処
理で文字を認識することができ、文字認識の速度を大幅
に向上させることができると共に、余分な箇所の走査を
行わないことからノイズの混入を防止でき認識率を向上
させることができる。また、視覚フィールド内の文字列
が傾斜しているときでも、何らの事前処理、あるいは事
後処理を施すことなく確実に文字を認識することができ
るという効果を有する。
よって先頭文字の中心位置を求め、その後そのマスクよ
りも小さくかつ個々の文字を覆うことができるマスクを
先頭文字中心位置から所定文字列方向または行方向に移
動させて2番目以降の文字の中心位置を求めるようにし
たので、視覚フィールドにおける最小限の領域の画像処
理で文字を認識することができ、文字認識の速度を大幅
に向上させることができると共に、余分な箇所の走査を
行わないことからノイズの混入を防止でき認識率を向上
させることができる。また、視覚フィールド内の文字列
が傾斜しているときでも、何らの事前処理、あるいは事
後処理を施すことなく確実に文字を認識することができ
るという効果を有する。
第1図および第2図はこの発明の一実施例を示す模式図
、第3図は他の実施例を示す模式図である。 1・・・・視覚フィールド、2・−・・第1のマスク、
3−・・−第2のタスク。
、第3図は他の実施例を示す模式図である。 1・・・・視覚フィールド、2・−・・第1のマスク、
3−・・−第2のタスク。
Claims (1)
- 【特許請求の範囲】 文字列を撮像した画像中から個々に文字を切り出して
認識する文字認識方法において、 予め定めた比較的大きな第1のマスクで文字列の先頭部
分領域を覆いそのマスク中に存在する先頭文字の中心位
置を求める手段と、 第1のマスクより小さくかつ文字列中の個々の文字を覆
うことができる第2のマスクを先頭文字中心位置から所
定の距離だけ文字列の方向または行方向に移動させて第
2番目以降の文字の中心位置を求める手段とを含むこと
を特徴とする文字認識方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP63197740A JPH0245891A (ja) | 1988-08-08 | 1988-08-08 | 文字認識方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP63197740A JPH0245891A (ja) | 1988-08-08 | 1988-08-08 | 文字認識方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH0245891A true JPH0245891A (ja) | 1990-02-15 |
Family
ID=16379552
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP63197740A Pending JPH0245891A (ja) | 1988-08-08 | 1988-08-08 | 文字認識方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0245891A (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6057476A (ja) * | 1983-09-07 | 1985-04-03 | Toshiba Corp | キ−ワ−ド検出方式 |
JPS6324382A (ja) * | 1986-07-16 | 1988-02-01 | Sumitomo Electric Ind Ltd | 光学文字読取装置 |
JPS63136179A (ja) * | 1986-11-28 | 1988-06-08 | Fuji Electric Co Ltd | 文字切出し装置 |
-
1988
- 1988-08-08 JP JP63197740A patent/JPH0245891A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6057476A (ja) * | 1983-09-07 | 1985-04-03 | Toshiba Corp | キ−ワ−ド検出方式 |
JPS6324382A (ja) * | 1986-07-16 | 1988-02-01 | Sumitomo Electric Ind Ltd | 光学文字読取装置 |
JPS63136179A (ja) * | 1986-11-28 | 1988-06-08 | Fuji Electric Co Ltd | 文字切出し装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5410611A (en) | Method for identifying word bounding boxes in text | |
JPH05242292A (ja) | 分離方法 | |
JPH08123900A (ja) | ライン走査画像のための位置決定方法及びその装置 | |
JP3193240B2 (ja) | 画像処理装置 | |
JP3058791B2 (ja) | 画像認識装置の図形の切出し方法 | |
JP2890306B2 (ja) | 表領域分離装置および表領域分離方法 | |
JPH0245891A (ja) | 文字認識方法 | |
JP2000187705A (ja) | 文書読取装置および方法および記憶媒体 | |
JP3153439B2 (ja) | 文書画像傾き検出方法 | |
JP3541093B2 (ja) | 文書画像の傾き検出方法および装置 | |
JP2954218B2 (ja) | 画像処理方法及び装置 | |
JPH05266250A (ja) | 文字列検出装置 | |
JPH0143351B2 (ja) | ||
JPH0573718A (ja) | 領域属性識別方式 | |
JPH0757047A (ja) | 文字切出し方式 | |
JPH04306785A (ja) | パターン認識方式 | |
JPH01201786A (ja) | 文字読取装置 | |
JPH0324681A (ja) | 画像処理方法及び装置 | |
JPH0554187A (ja) | 文字パターン傾き検出方法 | |
JPS6360432B2 (ja) | ||
JPH05128299A (ja) | 文字認識方法及びその装置 | |
JPH05242297A (ja) | 文字切り出し方法 | |
JPH0566636B2 (ja) | ||
JPS60140488A (ja) | 文字特徴抽出方式 | |
JPH0632079B2 (ja) | 文字認識装置 |