JPH01137385A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH01137385A
JPH01137385A JP62296503A JP29650387A JPH01137385A JP H01137385 A JPH01137385 A JP H01137385A JP 62296503 A JP62296503 A JP 62296503A JP 29650387 A JP29650387 A JP 29650387A JP H01137385 A JPH01137385 A JP H01137385A
Authority
JP
Japan
Prior art keywords
character
character string
image
characters
background
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62296503A
Other languages
English (en)
Inventor
Mariko Takenouchi
磨理子 竹之内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP62296503A priority Critical patent/JPH01137385A/ja
Publication of JPH01137385A publication Critical patent/JPH01137385A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、新聞、雑誌等の活字及び手書き文字を認識し
、例えばJISコード等の情報量に変換する文字認識装
置に関するものである。
従来の技術 従来の文字認識装置では、切り出した文字列画像に対し
て文字列方向と垂直に走査し文字部を形成する画素のヒ
ストグラム(周辺分布)を求め、ヒストグラムを用いて
文字列から文字の切り出しを行っている。(例えば、秋
山他6゛印刷物の記事領域における文字の切り出しPR
180−70)発明が解決しようとする問題点 しかしながら、文字列画像の文字列方向と垂直に走査し
て得た文字を形成する画素のヒストグラムを用いて文字
列から文字の切り出しを行っている従来の文字認識装置
では、第2図に示す画像のように隣りあう文字が文字列
方向と垂直方向に重なりを生じている場合、ヒストグラ
ムが重なり部分である値を持つため文字の区切りが不明
確となり、文字部り出し誤りを生じやすいという欠点を
有していた。
本発明はかかる点に鑑みてなさ扛たものであり、隣υあ
う文字が文字列方向と垂直方向に重なりを生じている文
書に関しても、簡易な方法で文字列から文字を切り出す
ことができる文字認識装置を提供することを目的として
いる。
問題点を解決するだめの手段 本発明は前記問題点を解決するため、文字列切り出し部
で切り出した文字列画像の全部または一部を文字列方向
と垂直に走査して抽出した文字を形成する画素のヒスト
グラムを用いて文字の区切りを検出する第1の文字区切
り検出部と、文字列切り出し部で切り出した文字列画像
の全部または一部を文字列方向に走査して文字を除く背
景の画素からなる背景ランを抽出し、隣りあう走査線の
背景ランの連結性を調べて文字の区切りを検出する第2
の文字区切り検出部と、第1及び第2の文字区切り検出
部で検出した文字の区切りを用いて文字列切り出し部で
切り出した文字列画像から認識対象文字を切り出す文字
部り出し部を備えている。
作用 本発明は前記した技術的手段により、第2の文字区切り
検出部で文字列方向と垂直方向に重なり   □を生じ
ている文字に関しても、隣りあう文字の区切りを検出す
ることができる。
実施例 以下、本発明の実施例について図面を参照しながら説明
する。
第1図は、本発明による文字認識装置の一実施例の構成
図である。1は画像入力部であり、認識対象文字を含む
画像を走査し2値信号で画像メモリ2に格納する。3は
文字列切り出し部であり、オペレータが設定した文字列
方向を用いて画像メモリ2から認識対象文字を含む文字
列を切り出す。
4は第1の文字区切り検出部であり、オペレータ   
′が設定した文字列方向を用いて文字列切り出し部4で
切り出した文字列画像から重なりのない文字の区切りを
検出する。5は第2の文字区切り検出部であり、オペレ
ータが設定した文字列方向を用いて文字列切り出し部4
で切り出した文字列画像から重なりのある文字の区切り
を検出する。6は文字部り出し部であり、第1の文字区
切り検出部4と第2の文字区切り検出部5で検出した文
字の区切りを用いて文字列切り出し部3で切り出した文
字列画像から認識対象文字を切り出す。7は認識部であ
り、文字部シ出し部6で切り出した認識対象文字のスト
ローク等の特微量を求め、あらかじめ辞書8に登録され
ている文字の特微量と照会し最も似た文字を認識結果と
して表示部9に表示する。
以上のように構成さnた文字認識装置について、第2図
に示す入力画像Pを例に説明する。
画像入力部1から入力した画像Pは文字を形成する画素
1、文字を除く背景の画素0の2値データで画像メモリ
2に蓄える。文字列切り出し部3では、オペレータが設
定した文字列方向(入力画像Pの場合は横)を用いて入
力画像Pを横方向に走査して文字を形成する画素のヒス
トグラムHlヲ求め、ヒストグラムHgO値が1画素以
上である文字部分の開始座標l!s1・ls2と終了座
標1e+1!e2から文字列座標Rs+、1e1)Cl
s2.l!62)を求め、文字列画像を切り出す。
第1の文字区切り検出部4には切り出した文字列画像り
が順次入力される。第3図に切り出した第1文字列の文
字列画像L1を示す。第1の文字区切り検出部では、文
字列画像L1を文字列方向と垂直の縦方向に走査して文
字を形成する画素のヒストグラムHaを求め、ヒストグ
ラムHaの値が1画素以上である文字部分の開始座標C
81・・・Csi・・・と終了座標Ca1・・・Cai
・・・を求め文字の区切りとする。さらに、全ての文字
部分の文字列方向の長さ(Cei  Cs1)をあらか
じめ設定された基準文字幅Wと比較し、文字部分の文字
列方向の長さが基準文字幅より長ければ隣りあう文字が
重なりを生じているとする。文字列画像L1では、C8
1とCal及びls+とlθ1に囲まれた文字部分にお
いて、隣りあう文字に重なりを生じている。
第2の文字区切り検出部5には隣りあう文字が重なりを
生じている文字部分の画像が順次入力される。第4図a
に隣りあう文字が重なりを生じていると判断された第1
文字列の第1番目の文字部分の画像を示す。第2の文字
区切り検出部5では、隣りあう文字が重なりを生じてい
る文字部分の画像を文字列方向の横方向に走査して背景
の画素からなる背景ランを抽出する。第4図に背景ラン
抽出結果を示す。図中の5cani (i=1+ 2.
 ・−)は走査線を示し、R1(i=1 t 2 + 
・・・)は背景ランで、Rigは背景ラン開始位置、R
i6は背景ラン終了位置を示す。次に、式(1)に従っ
て隣りあう走査線の背景ランの連結性を調べ、第1走査
線から最終走査線まで連結する背景ランの連なりを文字
の区切りとする。
Ri、B≦RjeかっRi6≦Rjs      −−
(1)ただし、iとjは隣りあう走査線の背景ランを示
す。つまり、第1文字列の第1番目の文字部分について
は、R1−R3−R5−R8−R11の背景ランの連な
りが文字の区切りとなる。
文字部り出し部6では、第1の文字区切り検出部4と第
2の文字区切、り検出部5で検出した文字の区切りを用
いて文字列画像から認識対象文字画像を切り出す。第1
の文字区切り検出部4で隣りあう文字に重なりが生じて
いないと判断された文字部分については、文字部分の開
始、終了位置をそのまま用いて認識対象文字として切り
出す。第1の文字区切り検出部4で隣りあう文字に重な
りが生じていると判断さnた文字部分については、第2
の文字区切り検出部5で背景ランの連なりを文字の区切
りとして検出しているので、各走査線毎に背景ランの開
始、終了位置を用いて認識対象文字を切り出す。第1文
字列の第1番目の文字部分に含まれる認識対象文字rT
Jと「0」の区切りは、第4図すに示す背景ランの連な
りR1−R3−Rs−Rs −R11の各背景う/の終
了位置であるR16 + R36+ Rs6. R86
+ R116となる。
認識部7には切り出した認識対象文字画像が順次入力さ
れる。第5図aに切り出した認識対象文字ITJの画像
を示す。認識部7では、切り出した「T」の各画素につ
いて、第5図すの矢印が示す方向に着目画素を含んでM
個以上(Mはあらかじめ設定)連っているか否かを調べ
方向コードを設定する。方向コード毎に各画素の連結性
を調べてストロークを抽出し、ストロークの数・位置・
長さの特微量を抽出する。第6図へに認識対象文字IT
Jのストローク抽出結果を示す。抽出した特微量を辞書
8に登録さnている文字の特微量と照合し、最も似た文
字rTJを認識候補文字とし、表示部9に表示する。
発明の効果 本発明によれば、隣りあう文字が文字列方向と垂直方向
に重なりを生じている文書に関しても、簡易な方法で文
字列から文字を切り出すことができ、その実用的効果は
大きい。
【図面の簡単な説明】
第1図は本発明における一実施例による文字認識装置の
構成図、第2図は文字列切り出し方法の説明図、第3図
は重なりのない文字の区切り検出方法説明図、第4図は
重なりのある文字の区切り検出方法説明図、第6図は文
字認識方法の説明図である。 3・・・・・・文字列切り出し部、4・・・・・・第1
の文字区切り検出部、6・・・・・・第2の文字区切り
検出部、6・・・・・・文字部り出し部。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名第1
図 第 2 口 第3図 ceI  (Ctce3 仁e4 第4図 (α〕 1                  :■ 乙、              CerCυ 箔 5 図 1e

Claims (1)

    【特許請求の範囲】
  1. 認識対象文字を含む画像を入力する画像入力部と、前記
    画像入力部で入力した画像から認識対象文字を含む文字
    列を切り出す文字列切り出し部と、前記文字列切り出し
    部で切り出した文字列画像の全部または一部を文字列方
    向と垂直に走査して抽出した文字を形成する画素のヒス
    トグラムを用いて文字の区切りを検出する第1の文字区
    切り検出部と、前記文字列切り出し部で切り出した文字
    列画像の全部または一部を文字列方向に走査して文字を
    除く背景の画素からなる背景ランを抽出し、隣りあう走
    査線の背景ランの連結性を調べて文字の区切りを検出す
    る第2の文字区切り検出部と、前記第1及び第2の文字
    区切り検出部で検出した文字の区切りを用いて前記文字
    列切り出し部で切り出した文字列画像から認識対象文字
    を切り出す文字部り出し部と、前記文字部り出し部で切
    り出した認識対象文字を辞書と照合することにより認識
    候補文字を抽出する認識部を有することを特徴とする文
    字認識装置。
JP62296503A 1987-11-25 1987-11-25 文字認識装置 Pending JPH01137385A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62296503A JPH01137385A (ja) 1987-11-25 1987-11-25 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62296503A JPH01137385A (ja) 1987-11-25 1987-11-25 文字認識装置

Publications (1)

Publication Number Publication Date
JPH01137385A true JPH01137385A (ja) 1989-05-30

Family

ID=17834389

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62296503A Pending JPH01137385A (ja) 1987-11-25 1987-11-25 文字認識装置

Country Status (1)

Country Link
JP (1) JPH01137385A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5889885A (en) * 1995-01-31 1999-03-30 United Parcel Service Of America, Inc. Method and apparatus for separating foreground from background in images containing text
US6094509A (en) * 1994-06-07 2000-07-25 United Parcel Service Of America, Inc. Method and apparatus for decoding two-dimensional symbols in the spatial domain
US6728391B1 (en) 1999-12-03 2004-04-27 United Parcel Service Of America, Inc. Multi-resolution label locator

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5676878A (en) * 1979-11-28 1981-06-24 Toshiba Corp Character detection/cut-out method
JPS56166587A (en) * 1980-05-28 1981-12-21 Toshiba Corp Character segmenting system

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5676878A (en) * 1979-11-28 1981-06-24 Toshiba Corp Character detection/cut-out method
JPS56166587A (en) * 1980-05-28 1981-12-21 Toshiba Corp Character segmenting system

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6094509A (en) * 1994-06-07 2000-07-25 United Parcel Service Of America, Inc. Method and apparatus for decoding two-dimensional symbols in the spatial domain
US5889885A (en) * 1995-01-31 1999-03-30 United Parcel Service Of America, Inc. Method and apparatus for separating foreground from background in images containing text
US6728391B1 (en) 1999-12-03 2004-04-27 United Parcel Service Of America, Inc. Multi-resolution label locator

Similar Documents

Publication Publication Date Title
JPH05242298A (ja) 記号列の認識方法
JPH07141463A (ja) 2値画像内の機械印刷された金額の検出方法
JPH01137385A (ja) 文字認識装置
JP2661898B2 (ja) 文字認識装置
JP3276555B2 (ja) フォーマット認識装置及び文字読取り装置
JPH02210586A (ja) 表領域分離装置および表領域分離方法
JPH0728935A (ja) 文書画像処理装置
JP2537973B2 (ja) 文字認識装置
JPH07160810A (ja) 文字認識装置
JPS6254380A (ja) 文字認識装置
JPS615383A (ja) 文字パタ−ン分離装置
JPH0564396B2 (ja)
JP2803735B2 (ja) 罫線を含んだ文字認識装置
JPH083829B2 (ja) 文字認識方法
JPH01181176A (ja) 文字認識装置
JPH07141462A (ja) 文書システム
JP2643092B2 (ja) 文書書式上の事前定義されたフィールドの外側に位置する標準外データを処理する方法およびシステム
JPH07168911A (ja) 文書認識装置
JPH0353392A (ja) 文字認識装置
JPH02187883A (ja) 文書読取装置
JPH05282487A (ja) 文字認識装置
JPH06150060A (ja) 画像傾き検出方法及び表処理方法
JPH05274472A (ja) 画像認識装置
JPH03160582A (ja) 文書画像データに於ける罫線と文字の分離方法
JPS63229586A (ja) 文字認識装置