JPH04360295A - 英文字認識装置 - Google Patents

英文字認識装置

Info

Publication number
JPH04360295A
JPH04360295A JP3136198A JP13619891A JPH04360295A JP H04360295 A JPH04360295 A JP H04360295A JP 3136198 A JP3136198 A JP 3136198A JP 13619891 A JP13619891 A JP 13619891A JP H04360295 A JPH04360295 A JP H04360295A
Authority
JP
Japan
Prior art keywords
character
characters
unit
feature
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3136198A
Other languages
English (en)
Inventor
Noboru Nakamura
昇 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP3136198A priority Critical patent/JPH04360295A/ja
Publication of JPH04360295A publication Critical patent/JPH04360295A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、印刷文字の認識装置、
特に英文字認識装置に関する。
【0002】
【従来の技術】文字認識はパターン認識の研究分野では
最も歴史が古く、かつ実用化も進んだ分野である。この
文字を読む技術は、コンピュータへのデータ入力をキー
ボードを経ずに文字で直接行う省力装置の開発に直結す
るから、強い社会的なニーズがある。
【0003】このような文字認識の処理の一つに不定ピ
ッチ文字列からの個々の文字の抽出があり、従来の英文
字認識装置は、接触文字を1文字ごとに切り出し、認識
を行っていた。
【0004】
【発明が解決しようとする課題】このような従来の英文
字認識装置では、接触文字の切り出しをいつも行う必要
があり、その切り出しミスによる認識処理の再試行の必
要があり、認識速度を速くすることができなかった。
【0005】本発明は上記課題を解決するもので、切り
出しロスを少なくし、認識速度の向上を図った英文字認
識装置を提供することを目的とする。
【0006】
【課題を解決するための手段】本発明は上記目的を達成
するために、入力された文書を光電変換し電気信号に変
換する光電変換部と、前記光電変換信号を2値画像デー
タとする2値化部と、前記2値画像から外接矩形を求め
大きさ位置の分布によって文字領域を抽出する文字領域
抽出部と、前記文字領域の黒画素の8連結図形を文字候
補図形として切り出す文字切り出し部と、前記文字候補
から特徴を抽出する文字特徴抽出部と、通常の文字特徴
に加えて接触しやすい文字をあらかじめ1つのカテゴリ
として登録してある文字特徴辞書と、前記文字候補図形
から抽出した文字特徴を前記文字特徴辞書と照合して文
字を認識する文字認識部を備えたものである。
【0007】
【作用】本発明は上記構成により、接触文字を文字辞書
に持ち、さらに学習によって新しい接触文字格納数を増
すようにしてあるので、接触文字を切り出す手間を少な
くして英文字を認識する。
【0008】
【実施例】以下、本発明の一実施例の英文字認識装置に
ついて図面を参照しながら説明する。図1は、本発明の
一実施例の英文字認識装置の機能構成図である。1は文
字の記入されている文書を光学的に走査し、電気信号に
変換する光電変換部、2は光電変換部1から送られてく
る光電変換信号を、所定基準によって、白黒に対応して
2値化する2値化部、3は2値化部2から送られてくる
2値化パターンから外接矩形を求め、大きさ,位置の分
布により文字領域を抽出する文字領域抽出部、4は文字
領域抽出部3によって抽出された文字領域から8連結の
図形パターンを文字候補とする文字切り出し部、5は切
り出した文字候補から特徴を抽出する文字特徴抽出部、
6はあらかじめ通常の文字特徴に加えて、接触しやすい
文字を1つのカテゴリとして、登録している文字特徴辞
書、7は文字特徴と文字特徴辞書を照らし合わせて、文
字認識を行う文字認識部である。図2は、文字認識装置
の構成ブロック図である。8はRAMで、文字特徴辞書
,画像データ等を格納する。9はROMで、プログラム
等を格納する。10はインタフェースRS232ーCで
、認識指令および、文字出力を行う。11はCPUで、
プログラムに従い装置動作をコントロールする。12は
スキャナで画像をイメージ・メモリの中に取り込む。
【0009】処理全体の流れを、図3のフローチャート
に従って説明する。初めに、2値画像データより文字領
域を抽出する。文字領域を黒画素8連結の領域に分割し
、接触文字も含めて文字候補図形とする。候補図形から
文字特徴を抽出する。文字特徴と文字特徴辞書を比較し
、類似度等により、認識結果を出力する。類似度等によ
り、再切り出しを行い、文字特徴および、認識結果を文
字特徴辞書に格納する。以後、同じ文字が連結した文字
については、文字切り出しを1文字毎に切り出すことな
しに認識を行う。
【0010】具体例により、説明を補足する。図4は文
字外接矩形の例,図5は認識対象とする英文字の入力パ
ターンである。通常文字および接触文字th,ag,r
yは文字特徴辞書に登録されており、1文字毎に切り出
すことなく認識を行う。caは文字特徴辞書に登録され
ていないために、再切り出しにより、それぞれc,aと
認識し、文字特徴辞書に登録する。その後、2回目以降
の接触文字caは、1文字ごとに切り出すことなしに、
認識を行うことが可能となる。
【0011】このように本発明の実施例の英文字認識装
置によれば、接触文字を文字辞書に持ち、さらに学習に
よって新しい接触文字の格納数を増すように配してある
ので、接触文字を切り出す回数が減少し、認識速度を速
くできる。
【0012】
【発明の効果】以上の実施例から明らかなように、本発
明によれば、英文字認識の接触文字を正確に高速に認識
することが可能な英文字認識装置を提供できる。
【図面の簡単な説明】
【図1】本発明の一実施例における英文字認識装置の機
能構成図
【図2】同英文字認識装置の構成ブロック図
【図3】同
英文字認識装置の処理を説明するためのフローチャート
【図4】8隣接領域の外接矩形図
【図5】本発明の認識対象とする英文字の入力パターン
【符号の説明】
1  光電変換部 2  2値化部 3  文字領域抽出部 4  文字切り出し部 5  文字特徴抽出部 6  文字特徴辞書 7  文字認識部

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】入力された文書を光電変換し、電気信号に
    変換する光電変換部と、前記光電変換信号を2値画像デ
    ータとする2値化部と、前記2値画像から外接矩形を求
    め大きさ位置の分布によって文字領域を抽出する文字領
    域抽出部と、前記文字領域の黒画素の8連結図形を文字
    候補図形として切り出す文字切り出し部と、前記切り出
    した文字候補から特徴を抽出する文字特徴抽出部と、通
    常の文字特徴に加えて、接触しやすい文字をあらかじめ
    1つのカテゴリとして登録してある文字特徴辞書と、前
    記切り出した文字候補図形から抽出した文字特徴を前記
    文字特徴辞書と照合することにより文字を認識する文字
    認識部とを備えた英文字認識装置。
JP3136198A 1991-06-07 1991-06-07 英文字認識装置 Pending JPH04360295A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3136198A JPH04360295A (ja) 1991-06-07 1991-06-07 英文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3136198A JPH04360295A (ja) 1991-06-07 1991-06-07 英文字認識装置

Publications (1)

Publication Number Publication Date
JPH04360295A true JPH04360295A (ja) 1992-12-14

Family

ID=15169637

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3136198A Pending JPH04360295A (ja) 1991-06-07 1991-06-07 英文字認識装置

Country Status (1)

Country Link
JP (1) JPH04360295A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005301664A (ja) * 2004-04-12 2005-10-27 Fuji Xerox Co Ltd 画像辞書作成装置、符号化装置、データファイル、画像辞書作成方法及びそのプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005301664A (ja) * 2004-04-12 2005-10-27 Fuji Xerox Co Ltd 画像辞書作成装置、符号化装置、データファイル、画像辞書作成方法及びそのプログラム

Similar Documents

Publication Publication Date Title
JP2713622B2 (ja) 表形式文書読取装置
Shijian et al. Script and language identification in noisy and degraded document images
Lam et al. Reading newspaper text
JPH04360295A (ja) 英文字認識装置
KR20090111202A (ko) 한글의 기본 구성요소인 수평선, 수직선, 사선, 원의개수와 특성치를 이용한 한글인식 방법 및 장치
James et al. Handwritten Malayalam Character Recognition using Regional Zoning and Structural Features
Gupta et al. A novel approach to automatic identification of kannada, english and hindi words from a trilingual document
Devi et al. Braille Document Recognition in Southern Indian Languages–A Review
Deshmukh et al. Handwritten Devanagari character recognition
Ting et al. A syntactic business form classifier
Zaw et al. Character Extraction and Recognition For Myanmar Script Signboard Images using Block based Pixel Count and Chain Codes
JP3163698B2 (ja) 文字認識方法
Airphaiboon et al. Recognition of handprinted Thai characters using loop structures
JP4136257B2 (ja) 文字認識装置、文字認識方法および記憶媒体
Choudhury et al. An approach towards recognition of size and shape independent Bangla handwritten numerals
Murthy et al. Nearest neighbor clustering based approach for line and character segmentation in epigraphical scripts
Amin Recognition of printed Arabic text using machine learning
JPH0586585B2 (ja)
JPH0452783A (ja) 図面読取装置
KR100317653B1 (ko) 대용량인쇄체문자인식을위한특징추출방법
Ito Automatic input of flow chart in document image
JPS60217487A (ja) 文字認識装置
JP2578768B2 (ja) 画像処理方法
JPS62194590A (ja) 文字認識方式
JPH08297718A (ja) 文字切り出し装置及び文字認識装置