JPS62257583A - 文字認識方式 - Google Patents
文字認識方式Info
- Publication number
- JPS62257583A JPS62257583A JP61101538A JP10153886A JPS62257583A JP S62257583 A JPS62257583 A JP S62257583A JP 61101538 A JP61101538 A JP 61101538A JP 10153886 A JP10153886 A JP 10153886A JP S62257583 A JPS62257583 A JP S62257583A
- Authority
- JP
- Japan
- Prior art keywords
- pattern
- character
- dictionary
- matching
- input pattern
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Discrimination (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔技術分野〕
本発明は、文字認識方式に関し、さらに詳細には、添字
1合成文字などの特殊パターンを認識するための文字認
識方式に関する。
1合成文字などの特殊パターンを認識するための文字認
識方式に関する。
一般に文字′4識装置においては、射影法などによって
入力画像からパターンを切り出し、切り出した入力パタ
ーンについて辞書とのマツチングを行い、入力パターン
の文字認識を行っている。
入力画像からパターンを切り出し、切り出した入力パタ
ーンについて辞書とのマツチングを行い、入力パターン
の文字認識を行っている。
しかし、第4図の(a)および(b)にそれぞれ示すO
および口で囲まれた合成文字1,2、第4図の(c)に
示す添字3などの特殊パターンは1文字として切り出さ
れ、全体として辞書とのマツチングが行われるのでリジ
ェクトされてしまい、認識できないという問題があった
。
および口で囲まれた合成文字1,2、第4図の(c)に
示す添字3などの特殊パターンは1文字として切り出さ
れ、全体として辞書とのマツチングが行われるのでリジ
ェクトされてしまい、認識できないという問題があった
。
したがって1本発明の目的は、そのような特殊パターン
を認識するための文字認識方式を提供することにある。
を認識するための文字認識方式を提供することにある。
この[1的を達成するために、この発明にあっては1通
常の文字と同様に扱っては認識不可能な前述のような特
殊パターンを類型化し、その類型化した特殊パターンの
ルールベースを用意する。そして、辞書とのマツチング
でリジェクトされた入力パターンに関してルールベース
を検索することにより対応する特殊パターンの種類を判
別し、この特殊パターンの種類に応じた処理を入力パタ
ーンに施した後、辞書とのマツチングを再度実行する。
常の文字と同様に扱っては認識不可能な前述のような特
殊パターンを類型化し、その類型化した特殊パターンの
ルールベースを用意する。そして、辞書とのマツチング
でリジェクトされた入力パターンに関してルールベース
を検索することにより対応する特殊パターンの種類を判
別し、この特殊パターンの種類に応じた処理を入力パタ
ーンに施した後、辞書とのマツチングを再度実行する。
以下1図面を参照して、本発明の一実施例について詳細
に説明する。
に説明する。
第1図は、本発明の文字認識方式の一実施例を示す簡略
化された機能的ブロック図である。
化された機能的ブロック図である。
この図において、10は図示しないスキャナなどから入
力される画像情報から射影法などによって文字行を切り
出すための行切出し部である。12は切り出された文字
行の画像情報を蓄積する行バッファである。
力される画像情報から射影法などによって文字行を切り
出すための行切出し部である。12は切り出された文字
行の画像情報を蓄積する行バッファである。
14は文字行の画像情報から射影法などによって文字を
切り出すための文字切出し部である。16は、その切り
出された文字の画像情報を蓄積する文字バッファである
。
切り出すための文字切出し部である。16は、その切り
出された文字の画像情報を蓄積する文字バッファである
。
18は切り出された文字の画像情報(以下、入力パター
ンと称する)から特徴を抽出する特徴抽出部である。2
0は文字、数字、記号の特徴を記憶している辞書である
。22は入力パターンから抽出された特徴と辞#20に
記憶されている特徴とのマツチング演算を行い、所定値
より小さい最小距離の候補文字が見つかった場合に、そ
の文字コードを出力し、見つからない場合はりジェクト
コードを出力するマツチング部である。
ンと称する)から特徴を抽出する特徴抽出部である。2
0は文字、数字、記号の特徴を記憶している辞書である
。22は入力パターンから抽出された特徴と辞#20に
記憶されている特徴とのマツチング演算を行い、所定値
より小さい最小距離の候補文字が見つかった場合に、そ
の文字コードを出力し、見つからない場合はりジェクト
コードを出力するマツチング部である。
24は認識結果を格納するための出力ファイル装置であ
る。
る。
26は前記各部の動作の制御、情報の転送制御などの他
、後述の特殊パターンの判別処理、拡大縮小処理1画像
分離処理などを行うプロセッサである。
、後述の特殊パターンの判別処理、拡大縮小処理1画像
分離処理などを行うプロセッサである。
28はプロセッサ26によってアクセスされるメモリで
ある。このメモリ28には、プロセッサ26によって実
行される文字認識プログラム28a、類型化された特殊
パターンのルールベース28bなどが格納される。また
、メモリ28には、nカウンタ28c、画像バッファ2
8d、出力バッファ28eなどが確保される。
ある。このメモリ28には、プロセッサ26によって実
行される文字認識プログラム28a、類型化された特殊
パターンのルールベース28bなどが格納される。また
、メモリ28には、nカウンタ28c、画像バッファ2
8d、出力バッファ28eなどが確保される。
30は前記各部を相互接続するためのバスである。
第2図は、一つの入力パターンについての文字認識処理
動作を示す概略フローチャートである。
動作を示す概略フローチャートである。
以下、このフローチャートを参照しながら、本実施例に
才?ける文字認識処理動作について説明する。
才?ける文字認識処理動作について説明する。
一つの入力パターンに対する処理を終わると。
次の入力パターンの処理が文字認識処理プログラム28
aに従って実行される。
aに従って実行される。
まず、プロセッサ26によってnカウンタ28Cがクリ
アされる(ステップ100)。
アされる(ステップ100)。
次に、文字切出し部14によって次の入力パターンが切
り出され、文字バッファ16に入れられる(ステップ1
05)。
り出され、文字バッファ16に入れられる(ステップ1
05)。
その入力パターンが特徴抽出部18へ送られ、特徴抽出
部18によちて特徴が抽出される(ステップ110)。
部18によちて特徴が抽出される(ステップ110)。
この特徴がマツチング部22に送られ、マツチング部2
2によって入力パターンと辞書20とのマツチング演算
が実行され、その結果、文字コードまたはりジェクトコ
ードが出力される(ステップ115)、この文字コード
またはりジェクトコードは、メモリ28上の出力バッフ
ァ28eに順次蓄積される。
2によって入力パターンと辞書20とのマツチング演算
が実行され、その結果、文字コードまたはりジェクトコ
ードが出力される(ステップ115)、この文字コード
またはりジェクトコードは、メモリ28上の出力バッフ
ァ28eに順次蓄積される。
プロセッサ26により、nカウンタ28cの値と最大値
Nとの比較判定が行われる(ステップ120)。最大値
Nは例えば2である。
Nとの比較判定が行われる(ステップ120)。最大値
Nは例えば2である。
nカウンタ値が最大値を越えていれば、出力バッファ2
8eに蓄積されている文字コードまたはリジェク1−コ
ートは、最終的な認識結果として出力ファイル装置24
へ出力される(ステップ125)。
8eに蓄積されている文字コードまたはリジェク1−コ
ートは、最終的な認識結果として出力ファイル装置24
へ出力される(ステップ125)。
nカウンタ値が最大値N以下ならば、出力バッファ28
e=に蓄積されているコードがリジェクトコードである
か゛凹室される(ステップ130)。
e=に蓄積されているコードがリジェクトコードである
か゛凹室される(ステップ130)。
リジェクトコードでなければ、そのコード(文字コード
)は最終的な認識結果として出力ファイル’!k ii
代24へ出力される(ステップ125)。
)は最終的な認識結果として出力ファイル’!k ii
代24へ出力される(ステップ125)。
ステップ130においてリジェクトコードと判定された
場合、 rlカウンタ28cが1だけインクリメントさ
れ(ステップ135)、ステップ140以降の処理に進
む。
場合、 rlカウンタ28cが1だけインクリメントさ
れ(ステップ135)、ステップ140以降の処理に進
む。
まず、プロセッサ26によって、入力パターンの外接枠
が抽出され、また、その外接枠のX方向のサイズ(高さ
)SXとY方向(文字行と平行方向)のサイズ(幅)S
yが求められる(ステップ140)。このような外接枠
の設定は、入力パターンをX、Y方向にスキャンし、各
方向について最初と最後の黒画素が検出されるラインを
見つけろことによって行われる。
が抽出され、また、その外接枠のX方向のサイズ(高さ
)SXとY方向(文字行と平行方向)のサイズ(幅)S
yが求められる(ステップ140)。このような外接枠
の設定は、入力パターンをX、Y方向にスキャンし、各
方向について最初と最後の黒画素が検出されるラインを
見つけろことによって行われる。
次に、プロセッサ26により、その外接枠のサイズSN
、Syを用いて特殊パターンのルールベース28bが検
索される(ステップ145,150)。
、Syを用いて特殊パターンのルールベース28bが検
索される(ステップ145,150)。
まず、ステップ145において、第1のルールについて
の判定が行われる。すなわち、SxまたはSyが文字行
の幅SO(行切出し部10より与えられる)に定数α
(たゾし、O〈αく1)を乗じた1直より小さいか判定
される。
の判定が行われる。すなわち、SxまたはSyが文字行
の幅SO(行切出し部10より与えられる)に定数α
(たゾし、O〈αく1)を乗じた1直より小さいか判定
される。
この判定がYESならば、例えば第4図の(c)に示す
添字3のような、小さ過ぎる特殊パターンと判別される
。この場合、プロセッサ26によって入力パターンは画
像バッファ28dに一口、転送され、その外接枠内につ
いて拡大処理が行われ。
添字3のような、小さ過ぎる特殊パターンと判別される
。この場合、プロセッサ26によって入力パターンは画
像バッファ28dに一口、転送され、その外接枠内につ
いて拡大処理が行われ。
入力パターンは標準の大きさに近づけられる(ステップ
155)、そして、その拡大された入力パターンは文字
切出し部14へ再度入力され、改めて文字切出しステッ
プ105以降の処理が実行される。
155)、そして、その拡大された入力パターンは文字
切出し部14へ再度入力され、改めて文字切出しステッ
プ105以降の処理が実行される。
ステップ145の判定結果がNoとなった入力パターン
については、ステップ150において。
については、ステップ150において。
第2のルールについての判定が行われる。すなわち、そ
のSxまたはS、が、文字行の幅S0に1より大きい定
数βを乗じた値より大きいか判定される。
のSxまたはS、が、文字行の幅S0に1より大きい定
数βを乗じた値より大きいか判定される。
この判定の結果がYESならば、その入力パターンは大
き過ぎるパターンと判別される。この場合、プロセッサ
26によって入力パターンは一旦画像バッファ28dに
転送され、その外接枠内について縮小処理が施され(ス
テップ160)、その縮小パターンは再び文字切出し部
14へ送られ、改めて文字切出しステップ105以1党
の処理が実行されろ。
き過ぎるパターンと判別される。この場合、プロセッサ
26によって入力パターンは一旦画像バッファ28dに
転送され、その外接枠内について縮小処理が施され(ス
テップ160)、その縮小パターンは再び文字切出し部
14へ送られ、改めて文字切出しステップ105以1党
の処理が実行されろ。
ステップ150の判定結果もNoとなった入力パターン
は、第4図の(a)または(b)に示す合成文字1,2
のような特殊パターンと判別される。この場合、プロセ
ッサ26により、まず入力パターンは外部画像部分と内
部画像部分とに分離される(ステップ165)。
は、第4図の(a)または(b)に示す合成文字1,2
のような特殊パターンと判別される。この場合、プロセ
ッサ26により、まず入力パターンは外部画像部分と内
部画像部分とに分離される(ステップ165)。
この分離は1例えば次のようにして行われる。
入力パターンは画像バッファ28dに転送される。
そして、第31!lに模式的に示すように、その外接枠
40の各辺からX方向およびY方向に触手(し1中、矢
線に示されている)を伸ばし、各触手が最初にぶつかる
黒画素複数個分または黒ランを外部画像部分とし、それ
以外の部分を内部画像部分とする。このようにして、例
えば第4図の(a)に示す合成パターンの場合、0のパ
ターンが外部画像部分として、内部の文字Aのパターン
が内部画像部分として、それぞれ分離される。
40の各辺からX方向およびY方向に触手(し1中、矢
線に示されている)を伸ばし、各触手が最初にぶつかる
黒画素複数個分または黒ランを外部画像部分とし、それ
以外の部分を内部画像部分とする。このようにして、例
えば第4図の(a)に示す合成パターンの場合、0のパ
ターンが外部画像部分として、内部の文字Aのパターン
が内部画像部分として、それぞれ分離される。
つぎに、プロセッサ26によって1分離された外部画像
部分の情報だけが特徴抽出部18へ入力されて、その特
徴が抽出される(ステップ170)。
部分の情報だけが特徴抽出部18へ入力されて、その特
徴が抽出される(ステップ170)。
そして、その特徴と辞書とのマツチング演算がマツチン
グ部22で実行される(ステップ175)。
グ部22で実行される(ステップ175)。
その認識結果は出力バッファ28eに一時保存される。
次に、内部画像部分の情報が特徴抽出部Y8へ送られて
特徴が抽出される(ステップ18o)。
特徴が抽出される(ステップ18o)。
なお、この時、「バックスペース」のコードも特徴抽出
部18へ送られる。そして、内部画像部分に関するマツ
チングが再度実行される(ステップ185)、その候補
文字のコードは、その前に「バックスペース」のコード
が付加されて出力バッファ28eに蓄積される。
部18へ送られる。そして、内部画像部分に関するマツ
チングが再度実行される(ステップ185)、その候補
文字のコードは、その前に「バックスペース」のコード
が付加されて出力バッファ28eに蓄積される。
このように「バックスペース」のコードを前に付加する
のは1合成パターンを印字または表示する時に、文字と
0図形などを重ねるためである。
のは1合成パターンを印字または表示する時に、文字と
0図形などを重ねるためである。
なお、外部画像部分のコードが不要の場合、ステップ1
70および175を省き、またステップ180において
「バックスペース」コードを付加しないようにすればよ
い。
70および175を省き、またステップ180において
「バックスペース」コードを付加しないようにすればよ
い。
ステップ185を終わると、ステップ120以降の処理
に戻る。
に戻る。
こ\で、nカウンタとそれに関連した判定は、前述のよ
うな特殊パターンのための処理を必要以−1−に繰り返
すことを防雨することな目的としている。もし、そのよ
うな特殊パターンの処理が不要な場合には、予めnカウ
ンタの最大値Nをゼロに設定すればよい。
うな特殊パターンのための処理を必要以−1−に繰り返
すことを防雨することな目的としている。もし、そのよ
うな特殊パターンの処理が不要な場合には、予めnカウ
ンタの最大値Nをゼロに設定すればよい。
以上、本発明の一実施例について説明した。しかし、本
発明はその要旨を逸脱しない範囲内で種々の変形が許さ
れるものであり、前記実施例だけに限定されるものでは
ない。
発明はその要旨を逸脱しない範囲内で種々の変形が許さ
れるものであり、前記実施例だけに限定されるものでは
ない。
以上の説明から明らかように、この発明は、類型化され
た特殊パターンのルールベースを有し、辞書とのマツチ
ングでリジェクトされた入力パターンに関して前記ルー
ルベースを検索することにより対応する特殊パターンの
種類を判別し、この特殊パターンの種類に応じた処理を
当該入力パターンにjMシた後、当該入力パターンにつ
いて辞書とのマツチングを再度実行するから、従来の文
字L2 識方式では認識できないような添字1合成パタ
ーンなども認識することが可能となる。
た特殊パターンのルールベースを有し、辞書とのマツチ
ングでリジェクトされた入力パターンに関して前記ルー
ルベースを検索することにより対応する特殊パターンの
種類を判別し、この特殊パターンの種類に応じた処理を
当該入力パターンにjMシた後、当該入力パターンにつ
いて辞書とのマツチングを再度実行するから、従来の文
字L2 識方式では認識できないような添字1合成パタ
ーンなども認識することが可能となる。
第1図は本発明の文字認識方式の一実施例を示す簡略化
された機能的ブロック図、第21121はこの実施例に
おける一つの入力パターンに対する文字認識処理動作を
示す概略フローチャート、第3図は外部画像部分と内部
画像部分の分離処理の一例を示すための模式図、第4図
は従来方式で認識し得ない入力パターンの例を示す図で
ある。 14・・・文字切出し部、 16・・・文字バッファ
。 18・・・特徴抽出部、 22・・・マツチング部、2
0・・・辞書、 26・・・プロセッサ、28・・・メ
モリ、 28b・・・ルールベース。
された機能的ブロック図、第21121はこの実施例に
おける一つの入力パターンに対する文字認識処理動作を
示す概略フローチャート、第3図は外部画像部分と内部
画像部分の分離処理の一例を示すための模式図、第4図
は従来方式で認識し得ない入力パターンの例を示す図で
ある。 14・・・文字切出し部、 16・・・文字バッファ
。 18・・・特徴抽出部、 22・・・マツチング部、2
0・・・辞書、 26・・・プロセッサ、28・・・メ
モリ、 28b・・・ルールベース。
Claims (4)
- (1)類型化された特殊パターンのルールベースを有し
、辞書とのマッチングでリジェクトされた入力パターン
に関して前記ルールベースを検索することにより対応す
る特殊パターンの種類を判別し、この特殊パターンの種
類に応じた処理を当該入力パターンに施した後、当該入
力パターンについて辞書とのマッチングを再起実行する
ことを特徴とする文字認識方式。 - (2)ある特定の特殊パターンの種類と判別された入力
パターンに関しては、拡大処理を施して再度文字切出し
処理を行った後、辞書とのマッチングを再度実行するこ
とを特徴とする特許請求の範囲第1項記載の文字認識方
式。 - (3)ある特定の特殊パターンの種類と判別された入力
パターンに関しては、縮小処理を施して再度文字切出し
処理を行った後、辞書とのマッチングを再度実行するこ
とを特徴とする特許請求の範囲第1項記載の文字認識方
式。 - (4)ある特定の特殊パターンの種類と判別された入力
パターンに関しては、外部画像部分と内部画像部分とに
分離する処理を施した後、それらの各画像部分について
個別に辞書とのマッチングを実行することを特徴とする
特許請求の範囲第1項記載の文字認識方式。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP61101538A JPS62257583A (ja) | 1986-05-01 | 1986-05-01 | 文字認識方式 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP61101538A JPS62257583A (ja) | 1986-05-01 | 1986-05-01 | 文字認識方式 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPS62257583A true JPS62257583A (ja) | 1987-11-10 |
Family
ID=14303213
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP61101538A Pending JPS62257583A (ja) | 1986-05-01 | 1986-05-01 | 文字認識方式 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS62257583A (ja) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH08194779A (ja) * | 1995-01-18 | 1996-07-30 | Nec Corp | 文字および単語の認識方式、並びに文字認識方式 |
| JP2009169911A (ja) * | 2008-01-21 | 2009-07-30 | Sharp Corp | 文字認識装置、文字認識方法、文字認識プログラムおよびコンピュータ読取り可能な記録媒体 |
| JP2010122749A (ja) * | 2008-11-17 | 2010-06-03 | Sharp Corp | 情報処理装置、文字認識方法、文字認識プログラム、および、文字認識プログラムを記録した、コンピュータ読取り可能な記録媒体 |
-
1986
- 1986-05-01 JP JP61101538A patent/JPS62257583A/ja active Pending
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH08194779A (ja) * | 1995-01-18 | 1996-07-30 | Nec Corp | 文字および単語の認識方式、並びに文字認識方式 |
| JP2009169911A (ja) * | 2008-01-21 | 2009-07-30 | Sharp Corp | 文字認識装置、文字認識方法、文字認識プログラムおよびコンピュータ読取り可能な記録媒体 |
| JP2010122749A (ja) * | 2008-11-17 | 2010-06-03 | Sharp Corp | 情報処理装置、文字認識方法、文字認識プログラム、および、文字認識プログラムを記録した、コンピュータ読取り可能な記録媒体 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP3105967B2 (ja) | 文字認識方法及び装置 | |
| JPS62257583A (ja) | 文字認識方式 | |
| JP2675303B2 (ja) | 文字認識方法 | |
| JPH11328315A (ja) | 文字認識装置 | |
| JP2703559B2 (ja) | 文字認識支援装置 | |
| JP2746345B2 (ja) | 文字認識の後処理方法 | |
| JPH08287188A (ja) | 文字列認識装置 | |
| JP3115139B2 (ja) | 文字切り出し方法 | |
| JP3116453B2 (ja) | 英文字認識装置 | |
| JP3245241B2 (ja) | 文字認識装置および方法 | |
| JP2972443B2 (ja) | 文字認識装置 | |
| JP3213151B2 (ja) | ニューラルネットワークを用いたパターン認識装置の学習方法および学習装置 | |
| JPH09128484A (ja) | パターンマッチングの照合方法 | |
| JP2924040B2 (ja) | 手書き文字の認識装置 | |
| JPH10187884A (ja) | 文字認識装置および記録媒体 | |
| JP2851865B2 (ja) | 文字認識装置 | |
| JPH10334190A (ja) | 文字認識方法、装置および記録媒体 | |
| JPH01125683A (ja) | 文字認識装置 | |
| CN112395981A (zh) | 一种基于指静脉图像的认证方法、装置、设备及介质 | |
| JPH041383B2 (ja) | ||
| JPS6383888A (ja) | 文字認識装置 | |
| JPH07160820A (ja) | 文字認識方法 | |
| JPH05189615A (ja) | 英文字認識装置 | |
| JPH07262313A (ja) | 光学式文字読取方法及び装置 | |
| JPH05108880A (ja) | 英文字認識装置 |