JPH028976A - 文字認識装置 - Google Patents
文字認識装置Info
- Publication number
- JPH028976A JPH028976A JP63160065A JP16006588A JPH028976A JP H028976 A JPH028976 A JP H028976A JP 63160065 A JP63160065 A JP 63160065A JP 16006588 A JP16006588 A JP 16006588A JP H028976 A JPH028976 A JP H028976A
- Authority
- JP
- Japan
- Prior art keywords
- character
- area
- image
- background pixel
- recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000605 extraction Methods 0.000 claims abstract description 24
- 239000000284 extract Substances 0.000 claims abstract description 13
- 238000000926 separation method Methods 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 9
- 238000000034 method Methods 0.000 description 4
- 235000016027 Persea schiedeana Nutrition 0.000 description 1
- 244000261838 Persea schiedeana Species 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
Landscapes
- Character Input (AREA)
- Image Analysis (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
産業上の利用分野
本発明は、新聞、雑誌等の活字及び手書き文字を認識し
、例えばJISコード等の情報量に変換する文字認識装
置に関するものである。
、例えばJISコード等の情報量に変換する文字認識装
置に関するものである。
従来の技術
従来の文字認識装置では、入力された画像を表示し、オ
ペレータがマウス等を用いて設定した認識対象領域につ
いて認識を行っていた。壕だ、他の文字認識装置では、
画像入力部から入力する原画像自体にカラーペン等を用
いてマークを付し、マークを認識することにより、自動
的に認識対象領域を抽出していた(例えば、長谷他・マ
ークを用いた印刷文書画像の領域抽出法”信学技報Vo
t。
ペレータがマウス等を用いて設定した認識対象領域につ
いて認識を行っていた。壕だ、他の文字認識装置では、
画像入力部から入力する原画像自体にカラーペン等を用
いてマークを付し、マークを認識することにより、自動
的に認識対象領域を抽出していた(例えば、長谷他・マ
ークを用いた印刷文書画像の領域抽出法”信学技報Vo
t。
83 i’Fa 302 P RL 83−78 )。
発明が解決しようとする課題
シカシながら、オペレータやマークによシ認識対象領域
を指示する従来の技術では、例えば名刺のように空白部
分で文字領域を分割し予め認識対象領域の候補領域が示
されている文書に関しても、認識対象領域全域あるいは
周囲を指定するという煩雑な作業を必要とした。
を指示する従来の技術では、例えば名刺のように空白部
分で文字領域を分割し予め認識対象領域の候補領域が示
されている文書に関しても、認識対象領域全域あるいは
周囲を指定するという煩雑な作業を必要とした。
本発明はかかる点に鑑みてなされたものであシ、既に空
白部分で認識対象領域の候補領域が示されている文書に
関して、簡易な方法で自動的に認識対象領域を決定する
文字認識装置を提供することを目的としている。
白部分で認識対象領域の候補領域が示されている文書に
関して、簡易な方法で自動的に認識対象領域を決定する
文字認識装置を提供することを目的としている。
課題を解決するだめの手段
本発明は前記課題を解決するため、画像入力部で入力し
た画像から一定幅以上かつ一定高さ以上の背景画素領域
を抽出する背景画素領域抽出部と、背景画素領域抽出部
で抽出した背景画素領域相互の関係を調べて文字領域を
抽出する文字領域抽出部を備えている。
た画像から一定幅以上かつ一定高さ以上の背景画素領域
を抽出する背景画素領域抽出部と、背景画素領域抽出部
で抽出した背景画素領域相互の関係を調べて文字領域を
抽出する文字領域抽出部を備えている。
作 用
本発明は前記した技術手段により、背景画素領域抽出部
で認識対象領域である文字領域の区切シ候補位置である
背景画素領域が抽出され、文字領域抽出部で背景画素領
域相互の関係を調べることにより自動的に認識対象領域
である文字領域を抽出することが可能となる。
で認識対象領域である文字領域の区切シ候補位置である
背景画素領域が抽出され、文字領域抽出部で背景画素領
域相互の関係を調べることにより自動的に認識対象領域
である文字領域を抽出することが可能となる。
実施例
以下、本発明の実施例について図面を参照しながら説明
する。
する。
第1図は、本発明による文字認識装置の一実施例の(1
4成図である。1は画像入力部であり、認識対象文字を
含む画像を走査して2値信号で画像メモリ2に格納する
。3は背景画素領域抽出部であシ、文字領域の区切シ候
補位置である背景画素領域を抽出する。4は文字領域抽
出部であシ、背景画素領域抽出部3で抽出した背景画素
領域相互の関係を調べて文字領域を抽出する。5は文字
切り出し部であシ、文字領域抽出部4で抽出した各々の
文字領域毎に認識対象文字を1字ずつ切り出す。
4成図である。1は画像入力部であり、認識対象文字を
含む画像を走査して2値信号で画像メモリ2に格納する
。3は背景画素領域抽出部であシ、文字領域の区切シ候
補位置である背景画素領域を抽出する。4は文字領域抽
出部であシ、背景画素領域抽出部3で抽出した背景画素
領域相互の関係を調べて文字領域を抽出する。5は文字
切り出し部であシ、文字領域抽出部4で抽出した各々の
文字領域毎に認識対象文字を1字ずつ切り出す。
6は認識部であり、文字切り出し部5で切り出した認識
対象文字の特徴量を求め、あらかじめ辞書7に登録され
ている文字の特徴量と照合し、最も似た文字を認識候補
文字として表示部8に表示する。
対象文字の特徴量を求め、あらかじめ辞書7に登録され
ている文字の特徴量と照合し、最も似た文字を認識候補
文字として表示部8に表示する。
以上のように構成された文字認識装置について、第2図
に示す入力画像Pを例に説明する。
に示す入力画像Pを例に説明する。
画像入力部1から入力された画像Pは文字部の黒画素を
1.背景部の白画素を○の2値データで画像メモリ2に
蓄えられる。
1.背景部の白画素を○の2値データで画像メモリ2に
蓄えられる。
背景画素領域抽出部3では、認識対象領域である文字領
域の区切シ候補位置である背景画素領域を抽出する。ま
ず、画像メモリ2に蓄えられている入力画像Pを横方向
に走査して、N画素以上(Nはあらかじめ設定)白画素
が連続する横方向背景部ランを抽出する。第3図aに入
力画像Pの横方向背景部ラン抽出結果を“−”で示す。
域の区切シ候補位置である背景画素領域を抽出する。ま
ず、画像メモリ2に蓄えられている入力画像Pを横方向
に走査して、N画素以上(Nはあらかじめ設定)白画素
が連続する横方向背景部ランを抽出する。第3図aに入
力画像Pの横方向背景部ラン抽出結果を“−”で示す。
同様に、画像メモリ2に蓄えられている入力画像Pを縦
方向に走査して、N画素以上白画素が連続する縦方向背
景部ランを抽出する。第3図すに入力画像Pの縦方向背
景部ラン抽出結果を“l”で示す。次に、横方向背景部
シンと縦方向背景部ランの両方に含まれる画素を背景画
素とし、背景画素からなる背景画素領域を抽出する。第
3図Cに入力画像Pの背景画素領域抽出結果を示す。
方向に走査して、N画素以上白画素が連続する縦方向背
景部ランを抽出する。第3図すに入力画像Pの縦方向背
景部ラン抽出結果を“l”で示す。次に、横方向背景部
シンと縦方向背景部ランの両方に含まれる画素を背景画
素とし、背景画素からなる背景画素領域を抽出する。第
3図Cに入力画像Pの背景画素領域抽出結果を示す。
文字領域抽出部4では、背景画素領域抽出部3で抽出し
た背景画素領域相互の関係を調べて認識対象領域である
文字領域を抽出する。背景画素領域抽出部3で抽出した
背景画素領域に含まれない画素の上下左右の連結性を調
べて、連結している画素の集シを文字領域とする。第4
図に入力画像Pの文字領域抽出結果A□(1==1.2
、叩−6)を示す。
た背景画素領域相互の関係を調べて認識対象領域である
文字領域を抽出する。背景画素領域抽出部3で抽出した
背景画素領域に含まれない画素の上下左右の連結性を調
べて、連結している画素の集シを文字領域とする。第4
図に入力画像Pの文字領域抽出結果A□(1==1.2
、叩−6)を示す。
文字切り出し部5では、文字領域抽出部4で抽出した文
字領域毎に認識対象文字を切シ出す。第5図に入力画像
Pの抽出された文字領域A3を示す。まず、文字領域内
の文学部全体の縦方向長さDvと横方向長さDhを比較
1文字列方向が縦書きか横書きかを判定する。文字領域
への場合、Dv>Dhよシ縦書きである。次に、文字列
方向判定結果を用いて、文字領域を文字列方向と垂直に
射影して文字部を形成する画素のヒストグラムHCを求
める。ヒストグラムH3の値が1画素以上である文字部
の開始・終了座標(C81,Co1)・・・・・・(C
,□、Coよ)・・・・・・を用いて認識対象文字画像
を切り出す。
字領域毎に認識対象文字を切シ出す。第5図に入力画像
Pの抽出された文字領域A3を示す。まず、文字領域内
の文学部全体の縦方向長さDvと横方向長さDhを比較
1文字列方向が縦書きか横書きかを判定する。文字領域
への場合、Dv>Dhよシ縦書きである。次に、文字列
方向判定結果を用いて、文字領域を文字列方向と垂直に
射影して文字部を形成する画素のヒストグラムHCを求
める。ヒストグラムH3の値が1画素以上である文字部
の開始・終了座標(C81,Co1)・・・・・・(C
,□、Coよ)・・・・・・を用いて認識対象文字画像
を切り出す。
認識部6には切り出した認識対象文字画像Rが順次入力
される。第6図aに文字領域んの切シ出した認識対象文
字「文」の画像を示す。認識部6では、切シ出した1文
」の各画素について、第6図すの矢印か示す方向に着目
画素を含んでM個以上CMはあらかじめ設定)連ってい
るか否かを調べ方向コードを設定する。方向コード毎に
各画素の連結性を調べてストロークを抽出し、ストロー
クの数・位置・長さの特徴量を抽出する。第6図aに認
識対象文字「文」のストローク抽出結果を示す。抽出し
た特徴量を辞書7に登録されている文字の特徴量と照合
し、最も似た文字「文」を認識候補文字とし、表示部8
に表示する。
される。第6図aに文字領域んの切シ出した認識対象文
字「文」の画像を示す。認識部6では、切シ出した1文
」の各画素について、第6図すの矢印か示す方向に着目
画素を含んでM個以上CMはあらかじめ設定)連ってい
るか否かを調べ方向コードを設定する。方向コード毎に
各画素の連結性を調べてストロークを抽出し、ストロー
クの数・位置・長さの特徴量を抽出する。第6図aに認
識対象文字「文」のストローク抽出結果を示す。抽出し
た特徴量を辞書7に登録されている文字の特徴量と照合
し、最も似た文字「文」を認識候補文字とし、表示部8
に表示する。
発明の効果
本発明によれば、入力画像から一定幅以上かつ一定高さ
以上の背景画素領域を抽出し、背景画素領域相互の関係
を調べて文字領域を抽出することによシ、既に空白部分
で認識対象領域の候補領域が示されている文書に関して
、簡易な方法で自動的に認識対象領域を決定することが
可能となる。
以上の背景画素領域を抽出し、背景画素領域相互の関係
を調べて文字領域を抽出することによシ、既に空白部分
で認識対象領域の候補領域が示されている文書に関して
、簡易な方法で自動的に認識対象領域を決定することが
可能となる。
第1図は本発明における一実施例による文字認識装置の
構成図、第2図は入力画像の説明図、第3図は背景画素
領域抽出方法の説明図、第4図は文字領域抽出方法の説
明図、第6図は文字切シ出し方法の説明図、第6図は文
字認識方法の説明図である。 3・・・・・・背景画素領域抽出部、4 ・・・・文字
領域抽出部、6・・・・・文字切り出し部、6・・・・
・・認識部。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名第3
図 (α) −横7筒背景郊ラソ 第 図 e 第 図
構成図、第2図は入力画像の説明図、第3図は背景画素
領域抽出方法の説明図、第4図は文字領域抽出方法の説
明図、第6図は文字切シ出し方法の説明図、第6図は文
字認識方法の説明図である。 3・・・・・・背景画素領域抽出部、4 ・・・・文字
領域抽出部、6・・・・・文字切り出し部、6・・・・
・・認識部。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名第3
図 (α) −横7筒背景郊ラソ 第 図 e 第 図
Claims (1)
- 認識対象文字を含む画像を入力する画像入力部と、前記
画像入力部で入力した画像から一定幅以上かつ一定高さ
以上の背景画素領域を抽出する背景画素領域抽出部と、
前記背景画素領域抽出部で抽出した背景画素領域相互の
関係を調べて文字領域を抽出する文字領域抽出部と、前
記文字領域抽出部で抽出した文字領域画像から認識対象
文字を切り出す文字切り出し部と、前記文字切り出し部
で切り出した認識対象文字を辞書と照合することにより
認識候補文字を抽出する認識部を有することを特徴とす
る文字認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP63160065A JP2537973B2 (ja) | 1988-06-28 | 1988-06-28 | 文字認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP63160065A JP2537973B2 (ja) | 1988-06-28 | 1988-06-28 | 文字認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH028976A true JPH028976A (ja) | 1990-01-12 |
JP2537973B2 JP2537973B2 (ja) | 1996-09-25 |
Family
ID=15707139
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP63160065A Expired - Fee Related JP2537973B2 (ja) | 1988-06-28 | 1988-06-28 | 文字認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2537973B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002032770A (ja) * | 2000-06-23 | 2002-01-31 | Internatl Business Mach Corp <Ibm> | 文書処理方法、文書処理システムおよび媒体 |
US7099508B2 (en) | 2001-11-29 | 2006-08-29 | Kabushiki Kaisha Toshiba | Document identification device, document definition method and document identification method |
-
1988
- 1988-06-28 JP JP63160065A patent/JP2537973B2/ja not_active Expired - Fee Related
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002032770A (ja) * | 2000-06-23 | 2002-01-31 | Internatl Business Mach Corp <Ibm> | 文書処理方法、文書処理システムおよび媒体 |
US7046847B2 (en) | 2000-06-23 | 2006-05-16 | International Business Machines Corporation | Document processing method, system and medium |
US7099508B2 (en) | 2001-11-29 | 2006-08-29 | Kabushiki Kaisha Toshiba | Document identification device, document definition method and document identification method |
Also Published As
Publication number | Publication date |
---|---|
JP2537973B2 (ja) | 1996-09-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5867277A (en) | Reduced resolution document storage and retrieval system | |
JP2713622B2 (ja) | 表形式文書読取装置 | |
US7035463B1 (en) | Document image processor, method for extracting document title, and method for imparting document tag information | |
US6351559B1 (en) | User-enclosed region extraction from scanned document images | |
EP1343095A2 (en) | Method and system for document image layout deconstruction and redisplay | |
JPH05282488A (ja) | 文書画像の復号なしに文書の意味的に重要な部分の自動変更のための方法 | |
US5699453A (en) | Method and apparatus for logically tagging of document elements in the column by major white region pattern matching | |
JP2002015280A (ja) | 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体 | |
JPH028976A (ja) | 文字認識装置 | |
US5854860A (en) | Image filing apparatus having a character recognition function | |
JP2661898B2 (ja) | 文字認識装置 | |
JP3171626B2 (ja) | 文字認識の処理領域・処理条件指定方法 | |
JP3276555B2 (ja) | フォーマット認識装置及び文字読取り装置 | |
JPH0554072A (ja) | デジタル翻訳装置 | |
JPH01137385A (ja) | 文字認識装置 | |
JPH0452783A (ja) | 図面読取装置 | |
JPS6180477A (ja) | 文書清書装置 | |
JPH0388085A (ja) | 光学的文字読取装置 | |
JPH0350689A (ja) | 文字認識装置 | |
JPS62184580A (ja) | 文書清書装置 | |
JPS6337490A (ja) | 文字認識装置 | |
JPH05298484A (ja) | 光学的文字読取装置 | |
JPH0652156A (ja) | 文書処理方法及び装置 | |
JPH06162106A (ja) | 電子ファイリングシステム | |
JPS63225883A (ja) | 文字認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Cancellation because of no payment of annual fees |