JPS6337487A - 文字認識装置 - Google Patents
文字認識装置Info
- Publication number
- JPS6337487A JPS6337487A JP61182162A JP18216286A JPS6337487A JP S6337487 A JPS6337487 A JP S6337487A JP 61182162 A JP61182162 A JP 61182162A JP 18216286 A JP18216286 A JP 18216286A JP S6337487 A JPS6337487 A JP S6337487A
- Authority
- JP
- Japan
- Prior art keywords
- recognition target
- area
- target area
- character
- point
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000000284 extract Substances 0.000 claims 1
- 238000000034 method Methods 0.000 abstract description 7
- 238000010586 diagram Methods 0.000 description 7
- 238000000605 extraction Methods 0.000 description 3
Landscapes
- Character Input (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
産業上の利用分野
本発明は、新聞・雑誌等の活字および手書き文字を認識
し、たとえばJISコード等の清報量に変換する文字認
識装置に関するものである。
し、たとえばJISコード等の清報量に変換する文字認
識装置に関するものである。
従来の技術
従来の文字認識装置では、入力された画像を表示シ、オ
ペレータがマウス等を用いて認識対象領域全域あるいは
周囲を指示することにより、認識を行っていた。また、
他の文字認識装置では、入力する原画像自体にカラーペ
ン等を用いて認識対象領域全域あるいは周囲を示すマー
クを付し、マークを認識して認識対象領域全決定するこ
とにより、認識を行っていた。(例えば、長谷他゛マー
クを用いた印刷文書画像の領域抽出法”信学技報vo1
.83 &30B PRL83−78 )発明が解決
しようとする問題点 しかしながら、オペレータやマークにより認識対象領域
全域あるいは周囲を指示する従来の技術では、例えば帳
票のような既に枠等で認識対象領域の候補領域が示され
ている文書に関しても、認識対象領域全域あるいは周囲
を指定するという煩雑な作業を必要とした。
ペレータがマウス等を用いて認識対象領域全域あるいは
周囲を指示することにより、認識を行っていた。また、
他の文字認識装置では、入力する原画像自体にカラーペ
ン等を用いて認識対象領域全域あるいは周囲を示すマー
クを付し、マークを認識して認識対象領域全決定するこ
とにより、認識を行っていた。(例えば、長谷他゛マー
クを用いた印刷文書画像の領域抽出法”信学技報vo1
.83 &30B PRL83−78 )発明が解決
しようとする問題点 しかしながら、オペレータやマークにより認識対象領域
全域あるいは周囲を指示する従来の技術では、例えば帳
票のような既に枠等で認識対象領域の候補領域が示され
ている文書に関しても、認識対象領域全域あるいは周囲
を指定するという煩雑な作業を必要とした。
本発明はかかる点に鑑みてなされたものであり、既に枠
等で認識対象領域の候補領域が示されている文書に関し
て、簡易な方法で認識対象領域を指定し、自動的に認識
対象領域全決定する文字認識装置を提供することを目的
としている。
等で認識対象領域の候補領域が示されている文書に関し
て、簡易な方法で認識対象領域を指定し、自動的に認識
対象領域全決定する文字認識装置を提供することを目的
としている。
問題点を解決するための手段
本発明は前記問題点を解決するため、入力画像の認識対
象領域全認識対象領域内の1点で指定する認識対象領域
指定部と、指定された1点を含む認識対象領域を決定す
る認識対象領域指定部全備えている。
象領域全認識対象領域内の1点で指定する認識対象領域
指定部と、指定された1点を含む認識対象領域を決定す
る認識対象領域指定部全備えている。
作 用
本発明は前記した技術的手段により、簡易な方法で認識
対象領域を指定し、自動的に認識対象領域を決定するこ
とが可能となる。
対象領域を指定し、自動的に認識対象領域を決定するこ
とが可能となる。
実施例
以下、本発明の実施例について図面を参照しながら説明
する。
する。
第1図は、本発明による文字認識装置の一実施例の構成
図である。1は画像入力部であり、認識対象文字を含む
画像を走査し2値信号で画像メモリ2に格納し、表示部
3に表示する。4は認識対象領域指定部であり、オペレ
ータが表示部3に表示された入力画像内の認識対象領域
内の1点を指定する。5は認識対象領域決定部であり、
認識対象領域指定部4で指定された1点を含む認識対象
領域を決定する。6は文字切り出し部であり、認識対象
領域決定部5で決定された認識対象領域から認識対象文
字を1字ずつ切り出す。7は認識部であシ、文字切り出
し部6で切り出された認識対象文字の特徴量を求め、あ
らかじめ辞書8に登録されている文字の特徴量と照合し
、最も似た文字を認識候補文字とし表示部3に表示する
。
図である。1は画像入力部であり、認識対象文字を含む
画像を走査し2値信号で画像メモリ2に格納し、表示部
3に表示する。4は認識対象領域指定部であり、オペレ
ータが表示部3に表示された入力画像内の認識対象領域
内の1点を指定する。5は認識対象領域決定部であり、
認識対象領域指定部4で指定された1点を含む認識対象
領域を決定する。6は文字切り出し部であり、認識対象
領域決定部5で決定された認識対象領域から認識対象文
字を1字ずつ切り出す。7は認識部であシ、文字切り出
し部6で切り出された認識対象文字の特徴量を求め、あ
らかじめ辞書8に登録されている文字の特徴量と照合し
、最も似た文字を認識候補文字とし表示部3に表示する
。
以上のように構成された文字認識装置について、第2図
に示す入力画像Pを例に説明する。第2図中のQは、罫
線で囲まれた認識対象領域を示す。
に示す入力画像Pを例に説明する。第2図中のQは、罫
線で囲まれた認識対象領域を示す。
画像入力部1から入力された画像Pは文字部(線分も含
む)の黒画素を1、背景部の白画素全0の2値デーメで
画像メモリ2に蓄えられ、表示部3に表示される。認識
対象領域指定部4では、オペレータが表示部3に表示さ
れた入力画像Pの認識対象領域Q内の1点qをマウス゛
\”で指定し、x−y座標系における点qの座標(x、
y)を得る。
む)の黒画素を1、背景部の白画素全0の2値デーメで
画像メモリ2に蓄えられ、表示部3に表示される。認識
対象領域指定部4では、オペレータが表示部3に表示さ
れた入力画像Pの認識対象領域Q内の1点qをマウス゛
\”で指定し、x−y座標系における点qの座標(x、
y)を得る。
次に認識対象領域決定部5では、認識対象領域指定部4
で得た認識対象領域Q内の1点qの座標(X、Y)k用
いて、認識対象領域Qの座標を決定する。第3図(、)
に示す様に、点qの座標値Xを中心に左右n画素つまり
(X −n )から(X+n)までの2n画素幅を横方
向に点qから上へ走査して、画像メモリの値が初めて(
X−n)d−ら(X+n)まで全て1になるy座標ys
を認識対象領域Qの縦方向の開始位置とし、さらに(X
−n)から(X + n )までの2n画素@を横方向
に点qから下へ走査して、画像メモリの値が初めて(X
−n)から(X + n )まで全て1になるy座標y
。を認識対象領域Qの縦方向の終了位置として決定する
。
で得た認識対象領域Q内の1点qの座標(X、Y)k用
いて、認識対象領域Qの座標を決定する。第3図(、)
に示す様に、点qの座標値Xを中心に左右n画素つまり
(X −n )から(X+n)までの2n画素幅を横方
向に点qから上へ走査して、画像メモリの値が初めて(
X−n)d−ら(X+n)まで全て1になるy座標ys
を認識対象領域Qの縦方向の開始位置とし、さらに(X
−n)から(X + n )までの2n画素@を横方向
に点qから下へ走査して、画像メモリの値が初めて(X
−n)から(X + n )まで全て1になるy座標y
。を認識対象領域Qの縦方向の終了位置として決定する
。
同様に、第3図(ロ)に示す様に、点qの座標値Yを中
心に上下n画素つま!+(Y−n)から(Y+n)まで
の2n画素幅を縦方向に点qから左右へ走査して、if
象メモリの1直が初めて(Y−n)から(Y十n)まで
全て1になるX座標Xsとxeを認識対象領域Qの横方
向の開始位置と終了位置として決定する。
心に上下n画素つま!+(Y−n)から(Y+n)まで
の2n画素幅を縦方向に点qから左右へ走査して、if
象メモリの1直が初めて(Y−n)から(Y十n)まで
全て1になるX座標Xsとxeを認識対象領域Qの横方
向の開始位置と終了位置として決定する。
第4図(a)に決定された認識対象領域Qk示す。
文字切り出し部6では、オペレータが設定した文字列方
向(認識対象領域Qの場合は横)を用いて認識対象領域
Qの文字部を形成する画素の縦方向のヒストグラムH,
2求め、ヒストグラムH,11の値が1画素以上である
文字部の開始座標131・’s2と終了座標l。1・’
e2 から文字列座標(lsl。
向(認識対象領域Qの場合は横)を用いて認識対象領域
Qの文字部を形成する画素の縦方向のヒストグラムH,
2求め、ヒストグラムH,11の値が1画素以上である
文字部の開始座標131・’s2と終了座標l。1・’
e2 から文字列座標(lsl。
181)・(182,1o2)を求め、文字列画像Li
切り出す。第4図(b)に文字列画像りを示す。次に、
文字列画像Li射影して文字部を形成する画素のヒスト
グラムH8を求め、ヒストグラムHCの値カ1画素以上
である文字部の開始・終了座標から1字1字の横方向の
座i (C,1,C,1) ・(Csi、C,、)−・
を求め、文字列座標と組合せて認識対象文字画像全1字
ずつ切り出す。
切り出す。第4図(b)に文字列画像りを示す。次に、
文字列画像Li射影して文字部を形成する画素のヒスト
グラムH8を求め、ヒストグラムHCの値カ1画素以上
である文字部の開始・終了座標から1字1字の横方向の
座i (C,1,C,1) ・(Csi、C,、)−・
を求め、文字列座標と組合せて認識対象文字画像全1字
ずつ切り出す。
認識部7には切り出された認識対象文字の矩形Rが頑次
入力される。第5図(a) K切り出された認識対象文
字「文」全示す。切り出したr文」の各画素について、
第5図中)の矢印が示す方向に着目画素を含んでM個以
上(Mはあらかじめ設定)連っているか否かを調べ方向
コードを設定する。方向コード毎に各画素の連結性を調
べてストロークを抽出し、ストロークの数・位置・長さ
等の特徴量を抽出する。第6図(a)に認識対象文字「
文」のストローク抽出結果を示す。抽出した特徴量全辞
書8に登録されている文字の特徴量と照合し、最も似た
文字「文」を認識候補文字として表示部3に表示する。
入力される。第5図(a) K切り出された認識対象文
字「文」全示す。切り出したr文」の各画素について、
第5図中)の矢印が示す方向に着目画素を含んでM個以
上(Mはあらかじめ設定)連っているか否かを調べ方向
コードを設定する。方向コード毎に各画素の連結性を調
べてストロークを抽出し、ストロークの数・位置・長さ
等の特徴量を抽出する。第6図(a)に認識対象文字「
文」のストローク抽出結果を示す。抽出した特徴量全辞
書8に登録されている文字の特徴量と照合し、最も似た
文字「文」を認識候補文字として表示部3に表示する。
発明の効果
本発明によれば、入力画像の認識対象領域を認識対象領
域内の1点で指定し、指定された1点を含む認識対象領
域を決定することにより、帳票のように既に枠等で認識
対象領域の候補領域が示されている文書に関して、簡易
な方法で認識対象領域を指定し、自動的に認識対象領域
全決定することが可能となる。
域内の1点で指定し、指定された1点を含む認識対象領
域を決定することにより、帳票のように既に枠等で認識
対象領域の候補領域が示されている文書に関して、簡易
な方法で認識対象領域を指定し、自動的に認識対象領域
全決定することが可能となる。
第1図は本発明における一実施例による文字認識装置の
構成図、第2図は入力画像及び認識対象領域指定方法の
説明図、第3図は認識対象領域決定方法の説明図、第4
図は文字切り出し方法の説明図、第5図は文字認識方法
の説明図である。 1・・・・・・画像入力部、2・・・・・画像メモリ、
3・・・・表示部、4・・・・・認識対象領域指定部、
5・・・・・認識対象領域決定部、6・・・・文字切り
出し部、7・・・・・認識部、8・・・・・・辞書。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名第1
図 第2図 第 4 図 見S エe (σ)(b) 第5図 Cs+ Cer tb)
構成図、第2図は入力画像及び認識対象領域指定方法の
説明図、第3図は認識対象領域決定方法の説明図、第4
図は文字切り出し方法の説明図、第5図は文字認識方法
の説明図である。 1・・・・・・画像入力部、2・・・・・画像メモリ、
3・・・・表示部、4・・・・・認識対象領域指定部、
5・・・・・認識対象領域決定部、6・・・・文字切り
出し部、7・・・・・認識部、8・・・・・・辞書。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名第1
図 第2図 第 4 図 見S エe (σ)(b) 第5図 Cs+ Cer tb)
Claims (1)
- 認識対象文字を含む画像を入力する画像入力部と、前記
画像入力部で入力された画像の認識対象領域を認識対象
領域内の1点で指定する認識対象領域指定部と、前記認
識対象領域指定部で指定された1点を含む認識対象領域
を決定する認識対象領域決定部と、前記認識対象領域決
定部で決定された認識対象領域から認識対象文字を切り
出す文字切り出し部と、前記文字切り出し部で切り出さ
れた認識対象文字を辞書と照合することにより認識候補
文字を抽出する認識部を有することを特徴とする文字認
識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61182162A JP2661898B2 (ja) | 1986-08-01 | 1986-08-01 | 文字認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61182162A JP2661898B2 (ja) | 1986-08-01 | 1986-08-01 | 文字認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS6337487A true JPS6337487A (ja) | 1988-02-18 |
JP2661898B2 JP2661898B2 (ja) | 1997-10-08 |
Family
ID=16113436
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP61182162A Expired - Fee Related JP2661898B2 (ja) | 1986-08-01 | 1986-08-01 | 文字認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2661898B2 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0259880A (ja) * | 1988-08-25 | 1990-02-28 | Nec Corp | 文書読取装置 |
JPH02187883A (ja) * | 1989-01-13 | 1990-07-24 | Mitsubishi Electric Corp | 文書読取装置 |
JPH03280410A (ja) * | 1990-03-28 | 1991-12-11 | Nichicon Corp | 電力用高圧コンデンサ |
JP2001092838A (ja) * | 1999-09-22 | 2001-04-06 | Toshiba Corp | マルチメディア情報収集管理装置およびプログラムを格納した記憶媒体 |
JP2002288178A (ja) * | 2001-03-23 | 2002-10-04 | Toshiba Corp | マルチメディア情報収集管理装置およびプログラム |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS57137970A (en) * | 1981-02-18 | 1982-08-25 | Ricoh Co Ltd | Picture area designating method |
-
1986
- 1986-08-01 JP JP61182162A patent/JP2661898B2/ja not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS57137970A (en) * | 1981-02-18 | 1982-08-25 | Ricoh Co Ltd | Picture area designating method |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0259880A (ja) * | 1988-08-25 | 1990-02-28 | Nec Corp | 文書読取装置 |
JPH02187883A (ja) * | 1989-01-13 | 1990-07-24 | Mitsubishi Electric Corp | 文書読取装置 |
JPH03280410A (ja) * | 1990-03-28 | 1991-12-11 | Nichicon Corp | 電力用高圧コンデンサ |
JP2001092838A (ja) * | 1999-09-22 | 2001-04-06 | Toshiba Corp | マルチメディア情報収集管理装置およびプログラムを格納した記憶媒体 |
JP2002288178A (ja) * | 2001-03-23 | 2002-10-04 | Toshiba Corp | マルチメディア情報収集管理装置およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2661898B2 (ja) | 1997-10-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5123062A (en) | OCR for sequentially displaying document layout according to recognition process | |
KR900007009B1 (ko) | 문자인식장치 | |
JPH08293001A (ja) | 画像処理装置及び光学的文字認識装置及びそれらの方法 | |
JPH02264386A (ja) | 表認識方法 | |
JPS6337487A (ja) | 文字認識装置 | |
US5563964A (en) | Method and apparatus for processing a plurality of designated areas of an image | |
JP3276555B2 (ja) | フォーマット認識装置及び文字読取り装置 | |
JP4164976B2 (ja) | 文字認識装置 | |
JP2537973B2 (ja) | 文字認識装置 | |
JPH06162106A (ja) | 電子ファイリングシステム | |
JPH0363882A (ja) | 画像処理装置 | |
JP2004213215A (ja) | 画像入力方法及び画像入力装置 | |
JPH083829B2 (ja) | 文字認識方法 | |
JPS63229586A (ja) | 文字認識装置 | |
JP2954218B2 (ja) | 画像処理方法及び装置 | |
JPH07160814A (ja) | 光学式文字認識方法 | |
JPH05128302A (ja) | 文字認識方法及びその装置 | |
KR940009749B1 (ko) | 글자 분할 방법 | |
JPH08137987A (ja) | 光学式文字読取装置 | |
JPS6269383A (ja) | 文字認識装置 | |
JPH03160582A (ja) | 文書画像データに於ける罫線と文字の分離方法 | |
JPH02187883A (ja) | 文書読取装置 | |
JPH0927008A (ja) | 文字認識装置及び方法 | |
JPH0927007A (ja) | 文字認識装置及び方法 | |
JPS63221495A (ja) | 文字認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Cancellation because of no payment of annual fees |