JPH0281189A - 文字認識方法 - Google Patents

文字認識方法

Info

Publication number
JPH0281189A
JPH0281189A JP63231968A JP23196888A JPH0281189A JP H0281189 A JPH0281189 A JP H0281189A JP 63231968 A JP63231968 A JP 63231968A JP 23196888 A JP23196888 A JP 23196888A JP H0281189 A JPH0281189 A JP H0281189A
Authority
JP
Japan
Prior art keywords
character
characters
information
recognition
intersection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63231968A
Other languages
English (en)
Inventor
Mikio Aoki
三喜男 青木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP63231968A priority Critical patent/JPH0281189A/ja
Publication of JPH0281189A publication Critical patent/JPH0281189A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、紙面上に書かれた文書を画像として入力する
ことにより、文書画像から文字領域を捜し出しコード番
号に交換する文字認識装置を文字認識方法に関する。
〔従来の技術〕
、近年、文字認識装置の急激なる進歩により、さまざま
文書画像から文字領域を自動的に抽出し、さらに一つ一
つの文字を切り出し、認識し、自動的に文書ファイルが
作成できるようになってきており、文字の認識の方法は
、さまざまな方法が考え出されてきている。
例えば、文字認識方法の一つとしてメツシュ特徴(研究
実用化報告、第34巻、第1号、P、P47〜57)が
ある。該方法は、文字全体の大まかな形状分布を表現し
たものである。特徴の抽出方法は、文字の外接矩形を分
割してnXnの小領域を求める。
該各々の小領域に含まれる文字部の面積を計数してメツ
シュ特徴とする。該メツシュ特徴は、つの文字につきn
Xnコのデータを持っており、nXnコのうちのある領
域における文字部の面積の割合を辞書として所有してい
るデータと比較することによって文字の推定が可能とな
る。
また、他の方法として、ペリフェラル特徴(研究実用化
報告、第34巻、第1号、P、P47〜57)がある。
該方法は、文字の周辺情報に着目したものである。特徴
の抽出方法は、まず文字パターンの外接矩形を求め、外
接矩形の各辺をそれぞれn分割する。次に分割された分
割辺から文字に向って走査していき、最初に文字に出合
うまでの面積、次に文字に出合うまでの面積を計数する
各分割辺に対して同様の処理を行うことにより、nX4
X2のデータを持つペリフェラル特徴を得ることができ
、該nX4X2のデータと辞書として所有しているデー
タとを比較することによって文字の推定か可能となる。
〔発明が解決しようとする課題〕
しかしながら、前記文字認識方法のメツシュ特徴やペリ
フェラル特徴のみでは、候補文字を一つに絞るには非常
に長い時間がかかり、また、候補文字を一つに絞ること
は困難である。
ペリフェラル特徴やメツシュ特徴による文字認識方法は
、既に述べた様に各文字ごとのデータを所有しており、
該データをすべての文字について比較を行い、候補文字
を絞っている。従って英文字の場合、常に最低52文字
のデータと比較して候補文字を絞っているわけであり、
また、日本語文字の認識を行う場合には候補文字の数が
膨大なものとなり、候補文字を絞るのにかなりの時間を
要する。また、たとえ時間が短くなったとしても、認識
の対象が日本語文字であった場合、例えば、1石」と「
右」、「白」と1日」の様にほんの少しの違いによって
全く違う文字になってしまうことが多く、今までの認識
方法では、候補文字を完全に絞ることは不可能であった
そこで本発明は、以上の様な課題を解決するもので、そ
の目的とするところは、高速にかつ正確に認識結果を出
す文字認識方法を提供することにある。
〔課題を解決するための手段〕
本発明の光学的画像入力手段により、紙面等に書かれた
文字画像を読み取り、入力された画像データ中の文字を
認識しコード番号に置き換える文字認識方法は、切り出
し文字画像の線分の数及び交点の特徴の情報を用いて候
補文字を分類した後文字を推定することを特徴とする。
〔実 施 例〕
以下、本発明を実施例に基づいて詳細に説明する。
本発明の文字認識方法は、一般に第5図のブロック図に
示す様なハードウェアにおいて用いられる。該ハードウ
ェアは、認識対象文字画像を入力するための画像入力装
置24、画像入力装置24によって入力された画像情報
及び演算結果を蓄えるRAM22、演算を実行するCP
U21、文字認識のための辞書データ及び演算のプログ
ラムが納まっているROM23、及び認識結果を表示す
るデイスプレィ25により構成されている。
以下、本発明の文字認識方法を第6図に示すフローチャ
ートに従って詳細に説明する。
ブロックAにおいて、認識対象となる文字画像が入力さ
れる。この時、画像入力装置34の読み取り幅によって
入力された文字画像はさまざまであるが、通常複数行の
文字画像が入力される。
ブロックBにおいて、文字画像の行方向の周辺分布を計
数する。該周辺分布をみることにより、文字行の位置及
び行幅を知ることができる。また該行幅より、文字のだ
いたいの大きさを推定することができる。
ブロックCにおいては、ブロックBにおいて抽出された
文字行の垂直方向の周辺分布をjI数する。
該周辺分布より、文字間隔、文字位置等の情報が得られ
、−文字一文字の切り出しが可能となる。
ブロックDにおいては、ブロックCにおいて抽出された
文字の認識を行う。本実施例の文字認識装置はROM2
3中に日本語文字のペリフェラル特徴をすべて納めてい
る。ここで、一つ一つ辞書と抽出文字とを比べていけば
、ある程度まで候補文字を絞ることは可能であるが、数
が非常に多いためかなりの時間を要する。また、似た字
が多いため最終的に一つの文字に絞ることは不可能であ
る。そこで本発明は、ROM中に、文字の線分の数と、
交点の特徴の情報を有している。従って、ペリフェラル
特徴による文字の認識の前に、線分の数と交点の特徴の
情報を基に一度候補文字を絞る。具体的には、第1図、
第2図、第3図、第4図を用いて説明する。第1図に、
「右」と第2図に「石」、第3図に「白」と第4図に「
日」の4つの文字を示す。これらの2組の文字は、ペリ
フェラル特徴においては非常に似たデータを有しており
、区別は非常にむずかいし。そこで、第1図(b)、第
2図(b)、第3図(b) 、ff14図(b)に示す
様に、文字をいくつかの線分に分解する。すると、第3
図(b)をみてもわかる様に、「白」という文字の線分
は6本となり、第4図の「日」という文字は、線分は5
本となる。この様に、線分の数のみにおいて第3図(a
)の「白」と第4図(a)の「日」は別のグループに分
けることが可能であり、ペリフェラル特徴での認識の妨
げを減少させている。また、第1図(a)に示す「右」
と第2図(a)に示す「石」という文字は、線分に分解
すると、ともに6本となり区別はつかない。そこで、交
点の特徴に着目する。すると文字「右」は、線が交わる
部分■が2ケ所、線分の端点■が4ケ所、2本の線が接
する部分■が3ケ所あり、文字「石」は、「右」という
文字の線が交わる部分■のかわりに、2本の線が接する
部分■が1ケ所増える。これらの情報を基に分類するこ
とにより、「右」と「石」は完全に別のグループに分け
ることが可能となる。以上の様に、線分の数と交点の特
徴の情報を基にいくつかのグループに分類して候補文字
を絞った後に、ペリフェラル特徴によって文字認識を行
うと、同一のグループには似た文字は存在しないうえ、
候補文字の数も少ないので、高速でかつ正確な文字の認
識が可能となる。
以上の様にして文字の認識が終了すると、入力文書画像
のすべての文字の認識が終了するまで、ブロックC1ブ
ロックDの行程、さらにブロックB1ブロックC1ブロ
ックDの行程を繰り返す。
すべての文字の認識が終了すると、ブロックEにおいて
、デイスプレィ25等の表示装置に結果を表示して終了
する。
本実施例は線分の数と交点の特徴の情報による分類の後
にペリフェラル特徴によって文字の認識を行ったが、ペ
リフェラル特徴に限ったものではなく、いかなる認識方
法を用いても本発明の線分の数と交点の特徴の情報によ
る分類は効果的である。
〔発明の効果〕
以上述べた様に本発明によれば、抽出された文字の線分
の数と交点の特徴の情報により、文字の分類を行った後
、分類されたグループ内において、文字の認識を行うの
で、例えば「右」と1石」、「白」と「日」の様な通常
の認識方法では区別しにくい文字でも正確な分類が可能
である。また、文字のグループ分けを行うので、認識に
おける候補文字の数が少なくなり、高速な文字の認識が
可能となる。よって、本発明は、文字認識装置の速度と
信頼性を多いに向上させるものである。
【図面の簡単な説明】
第1図(a)  (b)、第2図(a)  (b)、第
3図(a)(b)、第4図(a)(b)は、本発明の文
字認識方法を示した図。 第5図は、本発明の文字認識方法が用いられる文字認識
装置のブロック図。 第6図は本発明の文字認識方法のフローチャートを示す
。 ■・ ■・ ■・ 21 ・ 22・ 24 ・ 25・ A・ 8番 C・ D ・ E ・ 線分の端点 線が交わる部分 2本の線が接する部分 PU AM OM 画像入力装置 デイスプレィ ブロックA ブロックB ブロックC ブロックD ブロックE 以上 第3図(a) 第3図(b) 第2図(a) 第2図(b) し−−―――−−−−−−−−―−―+−一一一一一一
一一第6図

Claims (1)

    【特許請求の範囲】
  1. 光学的画像入力手段により紙面等に書かれた文字画像を
    読み取り、入力された画像データ中の文字を認識しコー
    ド番号に置き換える文字認識方法は、切り出し文字画像
    の線分の数及び交点の特徴の情報を用いて候補文字を分
    類した後文字を推定することを特徴とする文字認識方法
JP63231968A 1988-09-16 1988-09-16 文字認識方法 Pending JPH0281189A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63231968A JPH0281189A (ja) 1988-09-16 1988-09-16 文字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63231968A JPH0281189A (ja) 1988-09-16 1988-09-16 文字認識方法

Publications (1)

Publication Number Publication Date
JPH0281189A true JPH0281189A (ja) 1990-03-22

Family

ID=16931873

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63231968A Pending JPH0281189A (ja) 1988-09-16 1988-09-16 文字認識方法

Country Status (1)

Country Link
JP (1) JPH0281189A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008174242A (ja) * 2007-01-16 2008-07-31 Akiko Hasegawa 組立式容器

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6275477A (ja) * 1985-09-28 1987-04-07 Toshiba Corp 画像形成装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6275477A (ja) * 1985-09-28 1987-04-07 Toshiba Corp 画像形成装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008174242A (ja) * 2007-01-16 2008-07-31 Akiko Hasegawa 組立式容器

Similar Documents

Publication Publication Date Title
CN110738207B (zh) 一种融合文字图像中文字区域边缘信息的文字检测方法
US4903312A (en) Character recognition with variable subdivisions of a character region
JP4308785B2 (ja) デジタルインク質疑検索装置及びその方法
US5579408A (en) Character recognition method and apparatus
JPH05242292A (ja) 分離方法
JPH0713995A (ja) 自動テキスト特徴決定装置
JPH08180139A (ja) 拘束のない手書き英数字のオンライン認識の方法及び装置
JPH06348896A (ja) 文字の切り出し方法及びその装置
CN113158808A (zh) 中文古籍字符识别、组段与版面重建方法、介质和设备
JPH11120293A (ja) 文字認識/修正方式
Biswas et al. Writer identification of Bangla handwritings by radon transform projection profile
JP2730665B2 (ja) 文字認識装置および方法
JPH08320914A (ja) 表認識方法および装置
JPH0281189A (ja) 文字認識方法
JPH0350692A (ja) 文字認識装置
Rao et al. Script identification of telugu, english and hindi document image
JPH0262682A (ja) 文字認識方法
JPH0452783A (ja) 図面読取装置
JPH0281283A (ja) 文字認識方法
JPH0368093A (ja) 文字認識装置
JPH0273484A (ja) 文字認識方法
KR940007934B1 (ko) 온라인 문자인식을 위한 획분할 및 문자분류방법
JP3100825B2 (ja) 線認識方法
Javadzadeh et al. Comparing Feature Matching Methods to Identify Persian Writers
KR100204618B1 (ko) 문자 또는 도형의 인식 방법 및 시스템