JPH05298487A - 英文字認識装置 - Google Patents

英文字認識装置

Info

Publication number
JPH05298487A
JPH05298487A JP4100823A JP10082392A JPH05298487A JP H05298487 A JPH05298487 A JP H05298487A JP 4100823 A JP4100823 A JP 4100823A JP 10082392 A JP10082392 A JP 10082392A JP H05298487 A JPH05298487 A JP H05298487A
Authority
JP
Japan
Prior art keywords
character
rectangle
recognition
contact
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4100823A
Other languages
English (en)
Inventor
Ryoichi Yushimo
良一 湯下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP4100823A priority Critical patent/JPH05298487A/ja
Publication of JPH05298487A publication Critical patent/JPH05298487A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 (修正有) 【目的】 認識処理量の軽減と処理時間の短縮化を図
り、小型で作業性と量産性に適した英文字認識装置の提
供。 【構成】 画像入力の入力文字に外接する矩形を黒画素
の連続度を基に外接矩形検出処理しS〜S、矩形内
の黒画素の分布を図形特徴として抽出しS、認識辞書
の認識対象文字の図形特徴と比較し類似する特徴の文字
を認識処理するS。類似する特徴が認識辞書中に無い
場合、矩形内の画像を文字と文字が接触した接触文字の
候補として判定するS。矩形の図形特徴と類似する特
徴を持つ矩形が接触文字辞書に登録されていれば、その
矩形の認識結果とするS〜S。黒画素の縦方向のヒ
ストグラムと輪郭形状より1文字ずつ各矩形内の画像を
分割処理しS、分割後の矩形の認識結果が得られた場
合には、分割前の矩形が文字と文字の接触したものであ
ったとして、分割前の矩形の図形特徴と分割後の各矩形
の認識結果を接触文字辞書に登録するS

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は英文字認識装置に関する
ものである。
【0002】
【従来の技術】近年、文字認識装置をコンピュータ等の
入力装置として利用する要求が高まっており、安定な認
識結果を短時間で得ることの出来る文字認識装置がコン
ピュータ等のシステムの向上に不可欠となっている。
【0003】一般に英文書は読み易くするために文字と
文字との間隔が字種により異なる、いわゆるプロポーシ
ョナルピッチにて印刷されており文字と文字が接触する
場合が多い。また、英文書においては接触し易い文字の
組み合わせが書体及び印刷状態により存在し、同一文書
内において同じ組み合わせの接触が複数生じているのが
一般的である。
【0004】以下に従来の英文字認識装置について説明
する。従来の文字認識装置では文字を認識する際には1
文字ずつ処理する必要があり、接触している文字は分割
した後、認識することとなる。すなわち、英文書の特性
を活かすことなく接触した文字を認識するため画像中の
図形特徴をもとに分割処理を行い、分割されたそれぞれ
の画像を認識するといった一連の処理を接触文字が出現
するたび行っていた。
【0005】
【発明が解決しようとする課題】しかしながら上記従来
の構成では、接触し易い文字の組み合わせが書体及び印
刷状態により存在し、同一文書内において同じ組み合わ
せの接触が複数生じているという英文書の特性を生かす
ことなく、分割、認識といった一連の処理を全ての接触
した文字に対して行っているので、認識処理量が著しく
増大するという問題点を有していた。また、その結果認
識スピードが遅く、作業性が悪く使用し難いという問題
があった。また、認識スピードを上げようとすると装置
が大型になり原価が高く量産性に欠けるという問題点を
有していた。
【0006】本発明は上記従来の問題点を解決するもの
で、認識処理量を著しく軽減し、処理時間の短縮化を図
り、小型で作業性に優れ量産性に適した英文字認識装置
を提供することを目的とする。
【0007】
【課題を解決するための手段】この目的を達成するため
に本発明の英文字認識装置は、接触した文字を分割する
過程において、分割前の矩形の図形特徴と分割後の各矩
形の認識結果を接触文字辞書として蓄え、辞書として登
録された接触文字に対しては以降、辞書の検索処理にて
認識結果を得ることにより、同一文書内において同じ組
み合わせの接触が複数生じているという英文書の特性を
生かし、認識処理量の軽減、処理時間の短縮化を図るも
のである。具体的には本発明の英文字認識装置は、認識
対象文書を入力する画像入力部と、入力された文書画像
中の文字に外接する矩形を黒画素の連続度を基に求める
外接矩形検出部と、認識対象文字の図形特徴を格納する
認識辞書と、矩形内の黒画素の分布を図形特徴として抽
出し、前記認識辞書の認識対象文字の図形特徴と比較し
類似する特徴を有する文字を認識結果として出力し、ま
た類似する特徴が前記認識辞書中に無い場合には矩形内
の画像を文字と文字が接触している接触文字候補として
判定する文字認識部と、接触文字候補として判定された
矩形内の黒画素の縦方向のヒストグラム及び輪郭形状よ
り1文字ずつ分割し、分割された各矩形内の画像を前記
文字認識部により認識する接触文字分割処理部と、前記
接触文字分割処理部にて分割される以前の矩形の図形特
徴と分割後の各矩形の認識結果を随時蓄え、文書中の同
様の接触文字の分割処理を辞書検索により行うための接
触文字辞書と、を備えた構成からなる。
【0008】
【作用】この構成によって、接触した文字の分割処理回
数を著しく軽減することができ、その分処理時間の短縮
化を図ることができる。
【0009】
【実施例】以下本発明の一実施例について、図面を参照
しながら説明する。
【0010】図1は本発明の一実施例における英文字認
識装置のブロック図である。1は認識対象文書を文書画
像として入力する画像入力部、2は入力された文書画像
中の文字に外接する矩形を黒画素の連続度を基に求める
外接矩形検出部、3は矩形内の黒画素の分布を図形特徴
として抽出した後、認識辞書の認識対象文字の図形特徴
と比較し類似する特徴を有する文字を認識結果として出
力し、また類似する特徴が前記認識辞書中に無い場合に
は、矩形内の画像を文字と文字が接触している接触文字
候補として判定する文字認識部、4は接触文字候補とし
て判定された矩形内の黒画素の縦方向のヒストグラム及
び輪郭形状より1文字ずつ分割し分割された各矩形内の
画像を前記文字認識部4により認識する接触文字分割処
理部、5は認識対象文字の図形特徴を格納する認識辞
書、6は前記接触文字分割処理部4にて分割される以前
の矩形の図形特徴と分割後の各矩形の認識結果を随時蓄
え、文書中の同様の接触文字の認識処理を辞書検索によ
り行うための接触文字辞書、7,8,9はそれぞれ1か
ら4、4と6、3と5の各部をつなぐ内部バスである。
【0011】以上のように構成された本実施例の英文字
認識装置について、以下図を用いてその動作を説明す
る。
【0012】図2は本実施例の英文字認識装置の文字認
識処理のフロー図であり、図3(a)は接触文字の例で
あり、(b)は本実施例の接触文字辞書の構成図であ
る。認識したい文書画像を画像入力部1にて入力する
(S1)。
【0013】入力された文書画像において8連結で隣接
している黒画素の一連なりを文字として、その外接する
矩形を外接矩形検出部2にて求める(S2)。
【0014】求められた矩形内の画像に対して文字認識
処理を文字認識部3にて行う。文字認識部3では、まず
矩形内の黒画素の分布を図形特徴として抽出し(S
3)、予め用意する認識辞書5に格納される認識対象文
字の図形特徴と比較し、類似する特徴を有する文字を認
識結果とする(S4)。
【0015】類似する特徴を有する文字が認識辞書5に
無く、認識結果が得られなかった場合には、矩形内の画
像を文字と文字が接触している接触文字の候補として判
定する(S5)。
【0016】接触文字分割処理部4では、分割及び認識
処理に先立ち、認識処理部3にて接触文字候補と判定さ
れた矩形の図形特徴と接触文字辞書6に登録されている
図形特徴を比較し、類似する特徴を持つ矩形が接触文字
辞書に登録されている場合、その矩形の分割後の認識結
果を入力矩形の認識結果とする(S6,S7)。
【0017】接触文字辞書に類似する特徴を持つ矩形が
登録されていなかった場合には接触文字の候補と判定さ
れたものとして、接触文字分割処理部4にて文字の分割
及び認識処理を行い、認識結果を得る(S8)。
【0018】接触文字分割処理部4では、矩形内の黒画
素の縦方向のヒストグラム及び輪郭の形状より文字と文
字の接触点を求め、1つの矩形内の画像が1文字ずつと
なるように矩形を分割し、分割後の各矩形に対する認識
を文字認識部3にて行う(S8)。
【0019】分割後の矩形の認識結果が得られた場合に
は、分割前の矩形が文字と文字の接触したものであった
として、分割前の矩形の図形特徴と分割後の各矩形の認
識結果を接触文字辞書6に登録する(S9)。
【0020】接触文字辞書6は図3(b)のように構成
され、図3(a)中の矩形21,22の登録データはそ
れぞれ23,24のようになる。
【0021】分割後の矩形の認識結果が得られなかった
場合には、分割前の矩形が文字と文字の接触ではなかっ
たものとし、この矩形に対する認識結果は棄却となる。
【0022】以上の処理を文書画像内の全ての矩形に対
して行い、文書の認識結果を得る(S20)。
【0023】
【発明の効果】以上のように本発明は、接触した文字を
分割する過程において、分割前の矩形の図形特徴と分割
後の各矩形の認識結果を接触文字辞書として蓄え、辞書
として登録された接触文字に対しては以降、辞書の検索
処理にて認識結果を得ることができるので、認識精度を
高め、かつ認識処理量を著しく軽減化することができそ
の結果、処理時間の短縮化を著しく進めることができる
低原価で量産性に優れた英文字認識装置を実現できるも
のである。
【図面の簡単な説明】
【図1】本発明の一実施例における英文字認識装置のブ
ロック図
【図2】本実施例における英文字認識装置の文字認識処
理のフロー図
【図3】(a)接触文字の例を示す図 (b)本実施例の接触文字辞書の構成図
【符号の説明】
1 画像入力部 2 外接矩形検出部 3 文字認識部 4 接触文字分割処理部 5 認識辞書 6 接触文字辞書 7,8,9 内部バス

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】認識対象文書を入力する画像入力部と、入
    力された文書画像中の文字に外接する矩形を黒画素の連
    続度を基に求める外接矩形検出部と、認識対象文字の図
    形特徴を格納する認識辞書と、矩形内の黒画素の分布を
    図形特徴として抽出し、前記認識辞書の認識対象文字の
    図形特徴と比較し類似する特徴を有する文字を認識結果
    として出力し、また類似する特徴が前記認識辞書中に無
    い場合には矩形内の画像を文字と文字が接触している接
    触文字候補として判定する文字認識部と、接触文字候補
    として判定された矩形内の黒画素の縦方向のヒストグラ
    ム及び輪郭形状より1文字ずつ分割し、分割された各矩
    形内の画像を前記文字認識部により認識する接触文字分
    割処理部と、前記接触文字分割処理部にて分割される以
    前の矩形の図形特徴と分割後の各矩形の認識結果を随時
    蓄え、文書中の同様の接触文字の分割処理を辞書検索に
    より行うための接触文字辞書と、を備えたことを特徴と
    する英文字認識装置。
JP4100823A 1992-04-21 1992-04-21 英文字認識装置 Pending JPH05298487A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4100823A JPH05298487A (ja) 1992-04-21 1992-04-21 英文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4100823A JPH05298487A (ja) 1992-04-21 1992-04-21 英文字認識装置

Publications (1)

Publication Number Publication Date
JPH05298487A true JPH05298487A (ja) 1993-11-12

Family

ID=14284057

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4100823A Pending JPH05298487A (ja) 1992-04-21 1992-04-21 英文字認識装置

Country Status (1)

Country Link
JP (1) JPH05298487A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3732822A1 (de) * 1987-09-29 1989-04-06 Siemens Ag Laserdiode mit indexfuehrung, insbesondere laserdioden-array mit wellenleiterstruktur
US6738519B1 (en) 1999-06-11 2004-05-18 Nec Corporation Character recognition apparatus
JP2008084105A (ja) * 2006-09-28 2008-04-10 Oki Electric Ind Co Ltd 文字切出方法及び文字認識装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3732822A1 (de) * 1987-09-29 1989-04-06 Siemens Ag Laserdiode mit indexfuehrung, insbesondere laserdioden-array mit wellenleiterstruktur
US6738519B1 (en) 1999-06-11 2004-05-18 Nec Corporation Character recognition apparatus
JP2008084105A (ja) * 2006-09-28 2008-04-10 Oki Electric Ind Co Ltd 文字切出方法及び文字認識装置

Similar Documents

Publication Publication Date Title
JPH039489A (ja) 表領域識別方法
US5502777A (en) Method and apparatus for recognizing table and figure having many lateral and longitudinal lines
JP2000315247A (ja) 文字認識装置
JP3062382B2 (ja) 画像処理装置及び方法
JPH0528317A (ja) 画像処理方法及び装置
JPH05298487A (ja) 英文字認識装置
JPS5991582A (ja) 文字読取装置
JP3171626B2 (ja) 文字認識の処理領域・処理条件指定方法
JP2000076378A (ja) 文字認識方法
JP3163698B2 (ja) 文字認識方法
JPH0528319A (ja) 画像処理方法及び装置
JP3060248B2 (ja) 表認識装置
JP2697790B2 (ja) 文字タイプ決定方法
JPH07160810A (ja) 文字認識装置
JPH10162104A (ja) 文字認識装置
JP2746345B2 (ja) 文字認識の後処理方法
JPH0658689B2 (ja) 線図形分離装置
JP3100825B2 (ja) 線認識方法
JPH08123904A (ja) 書体種類処理装置
JPH03126188A (ja) 文字認識装置
JPH05114047A (ja) 文字切り出し装置
CN117710985A (zh) 光学字符识别方法、装置及智能终端
JP2917396B2 (ja) 文字認識方式
CN116912835A (zh) 一种面向社交媒体领域的藏文图文多字体识别方法
JPH0512489A (ja) 表認識装置