JPH0728930A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH0728930A
JPH0728930A JP5175239A JP17523993A JPH0728930A JP H0728930 A JPH0728930 A JP H0728930A JP 5175239 A JP5175239 A JP 5175239A JP 17523993 A JP17523993 A JP 17523993A JP H0728930 A JPH0728930 A JP H0728930A
Authority
JP
Japan
Prior art keywords
character
line
rectangle
recognition
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5175239A
Other languages
English (en)
Inventor
Ryoichi Yushimo
良一 湯下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP5175239A priority Critical patent/JPH0728930A/ja
Publication of JPH0728930A publication Critical patent/JPH0728930A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【目的】 認識対象文書の一部を認識する場合に、利用
者が文字認識領域を行単位で容易に指定することを目的
とする。 【構成】 2値画像データを記憶している画像記憶部2
から各々の文字に外接する文字矩形を検出して文字矩形
記憶部5に記憶する文字矩形検出部4と、文字矩形の位
置座標から行矩形等を切り出し行矩形記憶部7に記憶す
る行切り出し部6と、文字認識を行う座標を指定するた
めの座標入力部3と、行矩形記憶部7を参照して入力さ
れた座標を含む行を検出する認識領域検出部12と、検
出された行に含まれる文字矩形を基にして2値画像デー
タから文字画像を抽出しその図形特徴を抽出する図形特
徴抽出部8と、全ての文字の図形特徴を記憶している認
識辞書9と、図形特徴抽出部8で抽出された図形特徴と
認識辞書9とを比較して文字認識を行う文字認識部13
とを備えた構成からなる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は新聞,雑誌等の活字,ド
ット文字,手書き文字等を認識し、asciiコード等
のコード情報に変換する文字認識装置に関するものであ
る。
【0002】
【従来の技術】近年、文書等の検索等の作業性の向上,
保存スペースの節約等のために、文書の電子化が行われ
るようになった。この際の入力装置として、キーボード
に代わり文字認識装置が用いられるようになっている。
【0003】以下に従来の文字認識装置について説明す
る。図5は従来の文字認識装置の機能ブロック図であ
る。1は認識対象文書を走査して2値画像データを出力
する画像入力部、2は画像入力部1より出力される2値
画像データを記憶する画像記憶部、3は画像記憶部2に
記憶されている2値画像データの内文字認識を行う領域
を指定するための座標入力部、4は座標入力装置3で指
定された領域内の画像記憶部2に記憶されている2値画
像データから黒画素の連なりを基にして各々の文字に外
接する文字矩形を検出する文字矩形検出部、5は文字矩
形検出部4で検出された個々の文字矩形の2値画像デー
タ上での位置座標を記憶する文字矩形記憶部、6は文字
矩形記憶部5に記憶されている文字矩形の位置座標の水
平方向の分布が高い部分を行として切り出し個々の行を
構成する文字矩形及び行に外接する行矩形を検出する行
切り出し部、7は行切り出し部6で検出された各々の行
を構成する文字矩形及び行矩形の2値画像データ上にお
ける位置座標を記憶する行矩形記憶部、8は文字矩形記
憶部5中に記憶されている文字矩形の位置座標を基にし
て2値画像データから1文字毎の文字画像を抽出しその
図形特徴を抽出する図形特徴抽出部、9は全ての認識対
象文字の図形特徴を記憶している認識辞書、10は図形
特徴抽出部8で抽出された文字画像の図形特徴と認識辞
書9に記憶されている認識対象文字の図形特徴とを比較
して類似度が最も高い図形特徴を有する認識辞書9中の
認識対象文字に対応する文字コードを出力する文字認識
部、11は文字認識部10から出力される文字コードを
認識結果として記憶する認識結果記憶部である。
【0004】以上のように構成された従来の文字認識装
置について、以下その動作を説明する。図6(a)は従
来の文字認識装置の文字認識領域指定方法を示す図であ
り、図6(b)は一般的な文字矩形及びその文字矩形情
報を示す図であり、図6(c)は一般的な行矩形及びそ
の行矩形情報を示す図であり、図6(d)は一般的な文
字認識結果情報を示す図である。aは利用者が指定した
文字認識を行う領域を示す文字認識領域、P1 は座標入
力部3によって入力された文字認識領域aの左上の2値
画像データ上の位置を示す左上入力座標、P2 は座標入
力部3によって入力された文字認識領域aの右下の位置
を示す右下入力座標、Xは文字認識領域aの左上のX座
標を示す文字認識領域X座標、ΔYは同様な文字認識領
域Y座標、ΔXは文字認識領域aの幅を示す文字認識領
域幅、Yは同様な文字認識領域高さである。図6(b)
において、bは2値画像データ内の1文字に外接する文
字外接矩形、b′は文字外接矩形bに対する文字矩形情
報、Xmは文字外接矩形bの位置のX座標を示す文字矩
形X座標、Ymは同様な文字矩形Y座標、ΔXmは文字
外接矩形bの幅を示す文字矩形幅、ΔYmは同様な文字
矩形高さである。図6(c)において、cは2値画像デ
ータ内の1つの行に外接する行矩形、c′は行矩形cに
対する行矩形情報、Xnは行矩形cの位置のX座標を示
す行矩形X座標、Ynは同様な行矩形Y座標、ΔXnは
行矩形cの幅を示す行矩形幅、ΔYnは同様な行矩形高
さである。図6(d)において、dは1つの文字矩形に
対して文字認識を行った結果を示す文字認識結果であ
る。
【0005】初めに、画像入力部1によって、認識対象
文書を2値画像データに変換して読み込み、画像記憶部
2に記憶する。次に、座標入力部3によって、利用者が
文字認識を行う領域を指定する。ここで、図6(a)に
示すように、2値画像データ内の文字列“abc”,
“def”の部分を認識するために、利用者が座標入力
部3によってこの部分を、正確に囲むように、左上入力
座標P1 ,右下入力座標P2 を入力し、文字認識領域a
として指定したものとする。次に、文字矩形検出部4に
よって、2値画像データ中の座標入力部3で指定された
文字認識領域内の黒画素の連なりを基にして、2値画像
データ中の1文字に外接する文字矩形を検出し、各文字
矩形の2値画像データ上の位置座標,通し番号よりなる
文字矩形番号とを文字矩形情報b′として文字矩形記憶
部5に記憶する。ここで、例として、画像記憶部2内の
2値画像データから図6(b)に示すような文字外接矩
形bが検出され、文字矩形記憶部5に文字矩形情報b′
が記憶されたものとする。次に、行切り出し部6によっ
て、文字矩形記憶部5中の各文字矩形の水平方向の2値
画像データ上の位置座標の分布から分布の高い部分を
行、低い部分を行間として切り出し、各行を構成する文
字矩形及び各行に外接する行矩形cを検出し、その行情
報を行矩形記憶部7へ記憶する。次に、文字認識部10
によって、行矩形記憶部7の行情報に基づいて各行を構
成している文字矩形番号を図形特徴抽出部8へ出力す
る。次に、図形特徴抽出部8によって、入力された文字
矩形番号と文字矩形記憶部5とに基づいて、画像記憶部
2から1文字の文字画像を抽出し、その黒画素の分布か
ら図形特徴を抽出する。次に、文字認識部10によっ
て、文字画像の図形特徴と認識辞書9中の認識特徴対象
文字の図形特徴とを比較し、類似度の最も高い認識対象
文字に対するasciiコード等の文字コードを認識結
果として認識結果記憶部11へ記憶する。ここで、図6
(d)に示すように、文字認識結果dは文字矩形番号と
文字コードとからなっている。従来の文字認識装置は、
上記の処理によって、認識対象文書の内の利用者が指定
した部分を認識している。
【0006】
【発明が解決しようとする課題】しかしながら上記従来
の構成では、利用者が認識対象文書中の一部だけを認識
するために文字認識領域を指定する際に、文字認識領域
を正確に囲む座標を座標入力部より入力しなければなら
ず、認識対象文書の文字が小さい場合や、行と行との間
が狭い場合等に、文字認識領域の指定が難しく煩雑で手
数が掛かり作業性に欠けるという問題点を有していた。
【0007】本発明は上記従来の問題点を解決するもの
で、認識対象文書の一部を認識する場合に、利用者が文
字認識領域を行単位で容易に指定することができる作業
性に優れた文字認識装置を提供することを目的とする。
【0008】
【課題を解決するための手段】この目的を達成するため
に本発明の文字認識装置は、認識対象文書を走査して得
られる2値画像データを記憶する画像記憶部と、前記画
像記憶部に記憶されている2値画像データ中の黒画素の
連なりを基にして各々の文字に外接する文字矩形を検出
する文字矩形検出部と、前記文字矩形検出部で検出され
た個々の文字矩形の2値画像データ上における位置座標
を記憶する文字矩形記憶部と、前記文字矩形記憶部に記
憶されている文字矩形の位置座標の水平方向の分布が高
い部分を行として切り出し個々の行を構成する文字矩形
及び行に外接する行矩形を検出する行切り出し部と、前
記行切り出し部で検出された各々の行を構成する文字矩
形及び行矩形の2値画像データ上における位置座標を記
憶する行矩形記憶部と、文字認識を行う座標を指定する
ための座標入力部と、前記行矩形記憶部を参照して前記
座標入力部で入力された座標を含む行を検出する認識領
域検出部と、前記認識領域検出部で検出された行に含ま
れる文字矩形の前記文字矩形記憶部中の位置座標を基に
して2値画像データから1文字毎の文字画像を抽出して
その図形特徴を抽出する図形特徴抽出部と、全ての文字
の図形特徴を記憶している認識辞書と、前記図形特徴抽
出部で抽出された図形特徴と前記認識辞書とを比較して
類似度の最も高い文字に対応する文字コードを出力する
文字認識部と、前記文字認識部から出力される文字コー
ドを認識結果として記憶する認識結果記憶部とを備えた
構成を有している。
【0009】
【作用】この構成によって、行切り出し部が予め行情報
を行矩形記憶部に記憶させ、認識領域検出部が座標入力
部で利用者が入力した座標を含む行を行矩形記憶部を参
照することで検出し、文字認識部でこの行内の文字を認
識することで、利用者が認識しようとする行の行矩形の
内部の任意の位置を座標入力部から入力することだけ
で、文字認識領域を行単位で極めて容易に指定すること
ができる。
【0010】
【実施例】以下本発明の一実施例における文字認識装置
について、図面を参照しながら説明する。図1は本発明
の一実施例における文字認識装置の機能ブロック図であ
り、図2は本発明の一実施例における文字認識装置の装
置ブロック図である。1は画像入力部、2は画像記憶
部、3は座標入力部、4は文字矩形検出部、5は文字矩
形記憶部、6は行切り出し部、7は行矩形記憶部、8は
図形特徴抽出部、9は認識辞書、11は認識結果記憶部
であり、これらは従来例と同様なものなので同一の符号
を付し説明を省略する。12は利用者が座標入力部3か
ら入力した位置座標を含む行を行矩形記憶部7を参照し
て検出する認識領域検出部、13は認識領域検出部12
で検出された行内の文字を認識する文字認識部である。
図2において、14は文字認識装置全体を制御する中央
演算処理装置(以下CPUと略す)、15はCPU14
への指示が記載されたプログラムが記憶された制御プロ
グラム領域16と認識辞書9が記憶される認識辞書領域
17とを有するリードオンリメモリ(以下ROMと略
す)、18は画像記憶部2を構成する2値画像データ領
域19と文字矩形記憶部5を構成する文字矩形データ領
域20と行矩形記憶部7を構成する行矩形データ領域2
1と認識結果記憶部11を構成する認識結果データ領域
22とを有するランダムアクセスメモリ(以下RAMと
略す)、23は画像入力部1を構成し認識対象文書を走
査して2値画像データ領域19を得るスキャナ、24は
文字認識装置に文字認識開始の指示等を与えるためのキ
ーボード、25はマウス等からなり座標入力部3を構成
して利用者が文字認識領域等の所望の位置座標を入力す
るための座標入力装置、26は認識結果等を表示するた
めの表示するための表示装置、27は上記のデバイスを
接続するバスである。
【0011】以上のように構成された本発明の一実施例
における文字認識装置について、以下その動作を説明す
る。図3は本発明の一実施例における文字認識装置のフ
ローチャートであり、図4は本発明の一実施例における
文字認識装置の文字認識領域指定方法を示す図である。
図4において、e,fは行切り出し部6で切り出された
行矩形、P3 ,P4 は利用者が座標入力部3から入力し
た文字認識を行う行を指定するための認識対象行指定位
置である。
【0012】初めに、画像入力部1によって、認識対象
文書を2値画像に変換して入力し、これを画像記憶部2
に記憶する(S1)。次に、文字矩形検出部4によっ
て、画像記憶部2に記憶されている2値画像データ中の
黒画素の連なりに外接する矩形を求め、これに“i”等
の分離している文字に対する補正を行って、2値画像デ
ータ中の1文字に外接する文字矩形を検出し、各文字矩
形の2値画像データ上での位置座標を文字矩形記憶部5
に記憶する(S2)。次に、行切り出し部6によって、
S2で検出された文字矩形の水平方向の位置の分布を求
め、分布が高い部分を行、低い部分を行間として行の切
り出しを行い、各行を構成する文字矩形番号と行に外接
する行矩形の2値画像データ上での位置座標を行矩形記
憶部7へ記憶する(S3)。ここで、例として、図4に
示すように、行矩形e,fが切り出されたものとする。
次に、座標入力部3によって、利用者がS3で切り出さ
れた行の内、文字認識したい行を指定する(S4)。こ
こで、図4に示すように、行矩形e,fの内部を文字認
識するために、利用者が認識対象行指定位置P3 ,P 4
を指定したものとする。また、認識対象行指定位置
3 ,P4 の位置は、行矩形e,f内であれば、文字
上,文字間のいずれであってもよい。次に、認識領域検
出部12によって、S4で指定された位置座標を含む行
矩形e,fを、行矩形記憶部7に記憶されている全ての
行矩形の座標を参照して検出する(S5)。ここで、図
4に示すように、この処理によって行矩形e,fが検出
される。次に、文字認識部13によって、S5で検出さ
れた行矩形を構成している文字矩形を、従来例と同様に
して認識し、その認識結果を認識結果記憶部11に記憶
する(S6)。次に、表示装置26によって、S6で求
められた認識結果を表示し、全ての処理を終了する(S
7)。
【0013】尚、本実施例においては、認識対象行を指
定する際に、座標入力部3によって個々の行を各々指定
しているが、認識開始行と認識終了行だけを指定するよ
うにすれば、連続した複数の行を指定する際の作業性を
向上させることができ好ましい。
【0014】
【発明の効果】以上のように本発明は、行切り出し部に
よって予め行情報が行矩形記憶部に記憶され、認識領域
検出部によって座標入力部で利用者が入力した座標を含
む行を行矩形記憶部を参照することで検出し、文字認識
部でこの行内の文字を認識することで、利用者が認識し
ようとする行の行矩形の内部の任意の位置を座標入力部
から入力するだけで、文字認識領域を行単位で極めて容
易に指定することができる作業性に優れた文字認識装置
を実現できるものである。
【図面の簡単な説明】
【図1】本発明の一実施例における文字認識装置の機能
ブロック図
【図2】本発明の一実施例における文字認識装置の装置
ブロック図
【図3】本発明の一実施例における文字認識装置のフロ
ーチャート
【図4】本発明の一実施例における文字認識装置の文字
認識領域指定方法を示す図
【図5】従来の文字認識装置の機能ブロック図
【図6】(a)従来の文字認識装置の文字認識領域指定
方法を示す図 (b)一般的な文字矩形及びその文字矩形情報を示す図 (c)一般的な行矩形及びその行矩形情報を示す図 (d)一般的な文字認識結果情報を示す図
【符号の説明】
1 画像入力部 2 画像記憶部 3 座標入力部 4 文字矩形検出部 5 文字矩形記憶部 6 行切り出し部 7 行矩形記憶部 8 図形特徴抽出部 9 認識辞書 10 文字認識部 11 認識結果記憶部 12 認識領域検出部 13 文字認識部 14 中央演算処理装置(CPU) 15 リードオンリメモリ(ROM) 16 制御プログラム領域 17 認識辞書領域 18 ランダムアクセスメモリ(RAM) 19 2値画像データ領域 20 文字矩形データ領域 21 行矩形データ領域 22 認識結果データ領域 23 スキャナ 24 キーボード 25 座標入力装置 26 表示装置 27 バス

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】認識対象文書を走査して得られる2値画像
    データを記憶する画像記憶部と、前記画像記憶部に記憶
    されている2値画像データ中の黒画素の連なりを基にし
    て各々の文字に外接する文字矩形を検出する文字矩形検
    出部と、前記文字矩形検出部で検出された個々の文字矩
    形の2値画像データ上における位置座標を記憶する文字
    矩形記憶部と、前記文字矩形記憶部に記憶されている文
    字矩形の位置座標の水平方向の分布が高い部分を行とし
    て切り出し個々の行を構成する文字矩形及び行に外接す
    る行矩形を検出する行切り出し部と、前記行切り出し部
    で検出された各々の行を構成する文字矩形及び行矩形の
    2値画像データ上における位置座標を記憶する行矩形記
    憶部と、文字認識を行う座標を指定するための座標入力
    部と、前記行矩形記憶部を参照して前記座標入力部で入
    力された座標を含む行を検出する認識領域検出部と、前
    記認識領域検出部で検出された行に含まれる文字矩形の
    前記文字矩形記憶部中の位置座標を基にして2値画像デ
    ータから1文字毎の文字画像を抽出しその図形特徴を抽
    出する図形特徴抽出部と、全ての文字の図形特徴を記憶
    している認識辞書と、前記図形特徴抽出部で抽出された
    図形特徴と前記認識辞書とを比較して類似度の最も高い
    文字に対応する文字コードを出力する文字認識部と、前
    記文字認識部から出力される文字コードを認識結果とし
    て記憶する認識結果記憶部とを備えたことを特徴とする
    文字認識装置。
JP5175239A 1993-07-15 1993-07-15 文字認識装置 Pending JPH0728930A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5175239A JPH0728930A (ja) 1993-07-15 1993-07-15 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5175239A JPH0728930A (ja) 1993-07-15 1993-07-15 文字認識装置

Publications (1)

Publication Number Publication Date
JPH0728930A true JPH0728930A (ja) 1995-01-31

Family

ID=15992699

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5175239A Pending JPH0728930A (ja) 1993-07-15 1993-07-15 文字認識装置

Country Status (1)

Country Link
JP (1) JPH0728930A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011126755A3 (en) * 2010-03-30 2012-01-05 Microsoft Corporation Detecting position of word breaks in a textual line image

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011126755A3 (en) * 2010-03-30 2012-01-05 Microsoft Corporation Detecting position of word breaks in a textual line image
US8345978B2 (en) 2010-03-30 2013-01-01 Microsoft Corporation Detecting position of word breaks in a textual line image

Similar Documents

Publication Publication Date Title
JP3232143B2 (ja) 復号していない文書画像の修正版を自動的に作成するための装置
JP2713622B2 (ja) 表形式文書読取装置
US20010016069A1 (en) Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof
JPH0713995A (ja) 自動テキスト特徴決定装置
JP2001175807A (ja) テキスト領域選択方法
JPH11120293A (ja) 文字認識/修正方式
JP2002015280A (ja) 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
JP4810853B2 (ja) 文字画像切出装置、文字画像切出方法およびプログラム
KR0186025B1 (ko) 후보 문자 분류 방법
JPH0728930A (ja) 文字認識装置
JP3171626B2 (ja) 文字認識の処理領域・処理条件指定方法
JP2917427B2 (ja) 図面読取装置
JPH06187489A (ja) 文字認識装置
JP2703559B2 (ja) 文字認識支援装置
JP3304512B2 (ja) 表認識装置
JPH0728935A (ja) 文書画像処理装置
JPH07160810A (ja) 文字認識装置
JP3052438B2 (ja) 表認識装置
JPH05346974A (ja) 文字認識装置
JPH08297718A (ja) 文字切り出し装置及び文字認識装置
JP2755299B2 (ja) 画像処理方法
JPH01292587A (ja) 画像処理方法
JPH07168911A (ja) 文書認識装置
JP3100825B2 (ja) 線認識方法
JPH06139277A (ja) 電子辞書装置