JP2576984B2 - 文字認識処理装置 - Google Patents
文字認識処理装置Info
- Publication number
- JP2576984B2 JP2576984B2 JP62066552A JP6655287A JP2576984B2 JP 2576984 B2 JP2576984 B2 JP 2576984B2 JP 62066552 A JP62066552 A JP 62066552A JP 6655287 A JP6655287 A JP 6655287A JP 2576984 B2 JP2576984 B2 JP 2576984B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- unit
- partial
- feature
- pattern
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Character Discrimination (AREA)
Description
【発明の詳細な説明】 〔概要〕 漢字などの文字を認識する文字認識処理装置におい
て,認識しようとする文字を縦または横方向に2分割
し,該2分した部分のみを文字の縦または横方向の長さ
の1/2に正規化した上で,2分したそれぞれの部分からの
特徴を抽出した後,それらの特徴を合成して一文字分全
体のパターンを辞書と比較して認識するようにしたこと
が開示されている。
て,認識しようとする文字を縦または横方向に2分割
し,該2分した部分のみを文字の縦または横方向の長さ
の1/2に正規化した上で,2分したそれぞれの部分からの
特徴を抽出した後,それらの特徴を合成して一文字分全
体のパターンを辞書と比較して認識するようにしたこと
が開示されている。
本発明は文字認識処理装置,特に漢字などを認識する
のに有効な文字認識処理装置に関するものである。
のに有効な文字認識処理装置に関するものである。
文字パターンを認識するパターン認識処理装置におい
て,特に漢字などの文字を認識する際に,従来の認識装
置においては1つの文字(漢字)パターンについて偏
(へん),旁(つくり)などの部分パターンに分け,そ
れらの部分を例えば全体の文字の大きさに正規化してか
ら,それらの特徴を抽出して文字を認識することが行な
われている。しかしながら,文字の特徴を抽出する前に
前記正規化が行なわれるために,認識されるべき文字が
特定方向に拡大あるいは縮小されてしまって文字が歪ん
でしまう結果,後の認識処理において抽出した特徴が原
文字パターンと似つかないものになってしまうことがあ
る。
て,特に漢字などの文字を認識する際に,従来の認識装
置においては1つの文字(漢字)パターンについて偏
(へん),旁(つくり)などの部分パターンに分け,そ
れらの部分を例えば全体の文字の大きさに正規化してか
ら,それらの特徴を抽出して文字を認識することが行な
われている。しかしながら,文字の特徴を抽出する前に
前記正規化が行なわれるために,認識されるべき文字が
特定方向に拡大あるいは縮小されてしまって文字が歪ん
でしまう結果,後の認識処理において抽出した特徴が原
文字パターンと似つかないものになってしまうことがあ
る。
すなわち,第4図(A)(B)(C)に示すように,
例えば漢字「致」を認識処理するに当って,縦方向に偏
20と旁21とに分けた上で夫々が正規化されることになる
が,この場合,分けられた部分パターンは横方向に原文
字の幅と同じ幅で拡大されてしまうため,文字全体でみ
れば歪んでしまい,その結果,抽出された特徴が原文字
と著しく相違してしまうようなことが生じる。一方,上
記歪を回避しようとして,原文字のままで文字全体を正
規化した場合には,当該文字の偏や旁についての固有の
特徴がうまく抽出できなくなり,当該文字の認識が困難
になったり不可能になったりする。また,第4図におい
て,(C)の文字は上下に分けられるべきものである
が,第4図(A)または(B)の如く分割したものと比
較するようなことが行われても無意味なことになる。
例えば漢字「致」を認識処理するに当って,縦方向に偏
20と旁21とに分けた上で夫々が正規化されることになる
が,この場合,分けられた部分パターンは横方向に原文
字の幅と同じ幅で拡大されてしまうため,文字全体でみ
れば歪んでしまい,その結果,抽出された特徴が原文字
と著しく相違してしまうようなことが生じる。一方,上
記歪を回避しようとして,原文字のままで文字全体を正
規化した場合には,当該文字の偏や旁についての固有の
特徴がうまく抽出できなくなり,当該文字の認識が困難
になったり不可能になったりする。また,第4図におい
て,(C)の文字は上下に分けられるべきものである
が,第4図(A)または(B)の如く分割したものと比
較するようなことが行われても無意味なことになる。
本発明においては,上記の問題を解決し,特定方向の
正規化による文字パターンの歪を最小限に抑制し,認識
しようとする文字の特徴を良好に抽出して効果的な文字
認識が行なえるようにした文字認識処理装置を提供する
ものである。
正規化による文字パターンの歪を最小限に抑制し,認識
しようとする文字の特徴を良好に抽出して効果的な文字
認識が行なえるようにした文字認識処理装置を提供する
ものである。
第1図は本発明による縦方向分割による文字認識処理
装置の原理説明図を示す。
装置の原理説明図を示す。
本発明の場合には,例えば縦と横とのドット数が同じ
である1つの文字について,偏と旁に分けるのであれば
縦方向にて分割した偏と旁の部分に対応する文字幅を1/
2Wづつに正規化し,縦の寸法(高さ)Hはそのままにし
て特徴を抽出し,文字の認識を行なうようにしている。
すなわち,第1図の入力文字「致」について,正規化さ
れた偏の「至」および旁の「攵」の幅は原入力文字の幅
Wの1/2Wづつにし,高さHはそのままにして,縦方向に
n/2回ずつそれぞれを走査して特徴を抽出し, n/2+n/2=2n/2=n個 からなる1文字分の特徴にまとめて辞書(図示せず)の
文字と比較し,そのパターンを良好に認識する装置とし
ている。
である1つの文字について,偏と旁に分けるのであれば
縦方向にて分割した偏と旁の部分に対応する文字幅を1/
2Wづつに正規化し,縦の寸法(高さ)Hはそのままにし
て特徴を抽出し,文字の認識を行なうようにしている。
すなわち,第1図の入力文字「致」について,正規化さ
れた偏の「至」および旁の「攵」の幅は原入力文字の幅
Wの1/2Wづつにし,高さHはそのままにして,縦方向に
n/2回ずつそれぞれを走査して特徴を抽出し, n/2+n/2=2n/2=n個 からなる1文字分の特徴にまとめて辞書(図示せず)の
文字と比較し,そのパターンを良好に認識する装置とし
ている。
本発明の文字認識処理装置においては,上記のように
文字を偏と旁に分割する場合であれば,分割された偏お
よび旁については,その幅は原入力文字の幅Wの略1/2W
でありかつ高さHは変らないので,当該文字の有する固
有の特徴が,歪なしに無理なく自然に近い状態で抽出で
きる。また上記の如く、幅が原入力文字の幅Wの略1/2W
であってかつ高さHが変わらないことから、夫々分割し
たものの特徴を抽出するに当たって、原入力文字に対応
する認識対象文字についての辞書をそのまま共通に利用
できる。即ち、偏のための辞書や旁のための辞書を特別
に用意する必要がない。
文字を偏と旁に分割する場合であれば,分割された偏お
よび旁については,その幅は原入力文字の幅Wの略1/2W
でありかつ高さHは変らないので,当該文字の有する固
有の特徴が,歪なしに無理なく自然に近い状態で抽出で
きる。また上記の如く、幅が原入力文字の幅Wの略1/2W
であってかつ高さHが変わらないことから、夫々分割し
たものの特徴を抽出するに当たって、原入力文字に対応
する認識対象文字についての辞書をそのまま共通に利用
できる。即ち、偏のための辞書や旁のための辞書を特別
に用意する必要がない。
第2図は本発明による文字認識処理装置の実施例構成
を示す。
を示す。
同図において,1は第1の正規化部,2は第1の特徴抽出
部,3は第1の照合部,4は辞書部を表わす。また5は部分
パターン判定部であって,第1の照合部で照合された文
字パターンが例えばズバリ辞書にある特定の文字である
と判定された場合には,部分パターン認識処理は必要な
いので行なわれないが,いくつかの候補が生じた場合に
は部分パターン処理要求信号Rを出すようにされている
ものである。6は文字の部分パターン分割部,7は第2の
正規化部であって分割された部分パターンをそれぞれ正
規化するもの,8は正規化された各部分パターンの第2の
特徴抽出部,9は第2の照合部であって各部分パターンに
ついて抽出された特徴と前記辞書4に蓄積された文字と
照合する第2の照合部を示す。
部,3は第1の照合部,4は辞書部を表わす。また5は部分
パターン判定部であって,第1の照合部で照合された文
字パターンが例えばズバリ辞書にある特定の文字である
と判定された場合には,部分パターン認識処理は必要な
いので行なわれないが,いくつかの候補が生じた場合に
は部分パターン処理要求信号Rを出すようにされている
ものである。6は文字の部分パターン分割部,7は第2の
正規化部であって分割された部分パターンをそれぞれ正
規化するもの,8は正規化された各部分パターンの第2の
特徴抽出部,9は第2の照合部であって各部分パターンに
ついて抽出された特徴と前記辞書4に蓄積された文字と
照合する第2の照合部を示す。
次に,上記のように構成された本発明による文字認識
処理装置を,第2図を参照して詳細に説明する。
処理装置を,第2図を参照して詳細に説明する。
入力された文字が,例えば漢字の「致」であったとす
る。この入力文字は第1の正規化部1において辞書4に
蓄積された文字の大きさと比較しうるようにW×Hの大
きさに正規化された後,第1の特徴抽出部2へ与えられ
る。そこにおいて,縦の寸法(高さ)Hおよび横の寸法
(幅)Wの特定ドット数からなる漢字の「致」の特徴
を,通常の特徴抽出装置により抽出し,その出力を第1
の照合部3へ与える。該第1の照合部3では抽出された
文字の特徴にもとづいて辞書4中の各漢字とそれぞれ照
合する。
る。この入力文字は第1の正規化部1において辞書4に
蓄積された文字の大きさと比較しうるようにW×Hの大
きさに正規化された後,第1の特徴抽出部2へ与えられ
る。そこにおいて,縦の寸法(高さ)Hおよび横の寸法
(幅)Wの特定ドット数からなる漢字の「致」の特徴
を,通常の特徴抽出装置により抽出し,その出力を第1
の照合部3へ与える。該第1の照合部3では抽出された
文字の特徴にもとづいて辞書4中の各漢字とそれぞれ照
合する。
そして,ここまでの認識プロセスにおいて,上記照合
部3での照合結果,認識すべき文字「致」と辞書4中の
特定文字とがズバリ照合すればパターン認識の目的は達
成されたのであるから部分パターン判定部5は,それ以
上の処理は必要なしの判断を下す。
部3での照合結果,認識すべき文字「致」と辞書4中の
特定文字とがズバリ照合すればパターン認識の目的は達
成されたのであるから部分パターン判定部5は,それ以
上の処理は必要なしの判断を下す。
しかしながら,上記照合結果,ズバリの認識はできな
いがいくつかの文字候補,例えば「致」「到」「烈」が
挙げられた場合には,部分パターン判定部5は部分パタ
ーン処理の必要性ありの判定を下す。この結果,部分パ
ターン分割部6において入力文字について偏と旁部分を
分割した後,第2の正規化部7へ与える。該正規化部7
において偏の「至」および旁の「攵」について,本発明
による装置の特徴にしたがって縦の寸法(高さ)Hをそ
のままにして横の寸法(幅)を原入力文字の1/2Wに正規
化する。すなわち従来の装置における入力文字の縦横の
寸法即ちW×Hの大きさに偏,旁を夫々正規化するので
はなく,原入力文字「致」の全体の寸法に対する偏部分
と旁部分の自然な寸法の比率に近い形で正規化してい
る。
いがいくつかの文字候補,例えば「致」「到」「烈」が
挙げられた場合には,部分パターン判定部5は部分パタ
ーン処理の必要性ありの判定を下す。この結果,部分パ
ターン分割部6において入力文字について偏と旁部分を
分割した後,第2の正規化部7へ与える。該正規化部7
において偏の「至」および旁の「攵」について,本発明
による装置の特徴にしたがって縦の寸法(高さ)Hをそ
のままにして横の寸法(幅)を原入力文字の1/2Wに正規
化する。すなわち従来の装置における入力文字の縦横の
寸法即ちW×Hの大きさに偏,旁を夫々正規化するので
はなく,原入力文字「致」の全体の寸法に対する偏部分
と旁部分の自然な寸法の比率に近い形で正規化してい
る。
しかる後,第2の特徴抽出部8において高さHはその
ままに幅のみを1/2Wにした偏と旁との夫々の部分につい
て,通常のパターン認識装置によって特徴を抽出する。
したがって,抽出されたこれらの偏と旁との特徴情報を
第2の照合部9において,辞書中の情報を用いて認識
し,最終的に入力文字が「致」であることを認識するよ
うにしている。
ままに幅のみを1/2Wにした偏と旁との夫々の部分につい
て,通常のパターン認識装置によって特徴を抽出する。
したがって,抽出されたこれらの偏と旁との特徴情報を
第2の照合部9において,辞書中の情報を用いて認識
し,最終的に入力文字が「致」であることを認識するよ
うにしている。
以上述べた本発明の実施例においては,認識すべき入
力文字に対して,特徴抽出のために偏と旁の部分に対し
て1/2Wづつに分割した(すなわち縦割りにした)が,例
えば「宙」「宇」「空」のように宀(うかんむり)のあ
る漢字をパターン認識する場合には横割りが適してい
る。
力文字に対して,特徴抽出のために偏と旁の部分に対し
て1/2Wづつに分割した(すなわち縦割りにした)が,例
えば「宙」「宇」「空」のように宀(うかんむり)のあ
る漢字をパターン認識する場合には横割りが適してい
る。
第3図の実施例は上記横割りの場合の例を示す。
すなわち,入力文字「宙」についての特徴を抽出する
際に,横寸法(幅)Wをそのままにして,縦寸法(高
さ)を1/2Hづつに分割して,正規化するのである。こう
することによって原入力文字を自然に近い形で認識しう
る。
際に,横寸法(幅)Wをそのままにして,縦寸法(高
さ)を1/2Hづつに分割して,正規化するのである。こう
することによって原入力文字を自然に近い形で認識しう
る。
なお,本発明による上記の各実施例においては,特定
文字の偏および旁等について1/2の幅に圧縮分割する場
合について述べたが,文字(漢字)によっては画数が多
い場合など,3分割も可能であるほか,拡大分割をした方
がよい場合もあるので,本発明の装置はここに記載した
例に制限されるものではないことは言うまでもない。
文字の偏および旁等について1/2の幅に圧縮分割する場
合について述べたが,文字(漢字)によっては画数が多
い場合など,3分割も可能であるほか,拡大分割をした方
がよい場合もあるので,本発明の装置はここに記載した
例に制限されるものではないことは言うまでもない。
以上,本発明の実施例について述べてきたが,本発明
による文字認識処理装置においては,特定文字につい
て,偏と旁となどに分割しうるものは縦割りで,縦寸法
をそのままにして横寸法のみそれぞれ1/2Wに圧縮分割
し,宀(うかんむり)などの部分と残りの部分とに分割
しうるものは横割りで,横寸法をそのままにして縦寸法
のみそれぞれ1/2Hに圧縮分割して正規化することによっ
て,原入力文字に対して,歪を最小限にして自然な文字
形に近い態様でパターンの認識を行うことができる。
による文字認識処理装置においては,特定文字につい
て,偏と旁となどに分割しうるものは縦割りで,縦寸法
をそのままにして横寸法のみそれぞれ1/2Wに圧縮分割
し,宀(うかんむり)などの部分と残りの部分とに分割
しうるものは横割りで,横寸法をそのままにして縦寸法
のみそれぞれ1/2Hに圧縮分割して正規化することによっ
て,原入力文字に対して,歪を最小限にして自然な文字
形に近い態様でパターンの認識を行うことができる。
なお、偏についての特徴と、旁についての特徴とをま
とめて辞書の文字の特徴と比較を行っていることから、
例えば偏や旁の一方が大きく変形していたとしても、当
該偏や旁の一方の変形によって生じる特徴は高々50%の
歪みを生じるだけであり、入力文字の変形を吸収して正
しい認識を行う方向に処理が行われることとなる。
とめて辞書の文字の特徴と比較を行っていることから、
例えば偏や旁の一方が大きく変形していたとしても、当
該偏や旁の一方の変形によって生じる特徴は高々50%の
歪みを生じるだけであり、入力文字の変形を吸収して正
しい認識を行う方向に処理が行われることとなる。
第1図は本発明による文字認識処理装置の原理説明図,
第2図は本発明による文字認識処理装置の一実施例構
成,第3図は本発明による文字認識処理装置の別の実施
例,第4図は従来の文字パターン認識処理装置の場合の
問題点を説明する説明図を示す。 図中,1は第1の正規化部,2は第1の特徴抽出部,3は第1
の照合部,4は辞書部,5は部分パターン判定部,6は部分パ
ターン分割部,7は第2の正規化部,8は第2の特徴抽出
部,9は第2の照合部,をそれぞれ示す。
第2図は本発明による文字認識処理装置の一実施例構
成,第3図は本発明による文字認識処理装置の別の実施
例,第4図は従来の文字パターン認識処理装置の場合の
問題点を説明する説明図を示す。 図中,1は第1の正規化部,2は第1の特徴抽出部,3は第1
の照合部,4は辞書部,5は部分パターン判定部,6は部分パ
ターン分割部,7は第2の正規化部,8は第2の特徴抽出
部,9は第2の照合部,をそれぞれ示す。
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭59−33579(JP,A) 特開 昭61−32187(JP,A) 特開 昭59−35282(JP,A) 特開 昭59−5390(JP,A) 電子通信学会研究報告PRL83−81
Claims (1)
- 【請求項1】文字の特定部分を分割した部分パターンに
ついて認識処理を行なう文字認識処理装置において、 認識対象文字の夫々について当該文字全体についての特
徴を記述した辞書と、 所定の縦および横寸法(H,W)からなる原入力文字に対
して所定の方向に2分割する部分パターン分割部と、 前記分割された各部分の文字幅を、前記原入力文字の1/
2文字幅にそれぞれ正規化する正規化部と、 正規化された該文字の各部分から、その特徴をそれぞれ
抽出する特徴抽出部と、 抽出した前記各部分の特徴を合成した後、上記辞書中の
文字の特徴と照合して当該入力文字全体をパターン認識
する照合部とを有する ことを特徴とする文字認識処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62066552A JP2576984B2 (ja) | 1987-03-20 | 1987-03-20 | 文字認識処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62066552A JP2576984B2 (ja) | 1987-03-20 | 1987-03-20 | 文字認識処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS63233488A JPS63233488A (ja) | 1988-09-29 |
JP2576984B2 true JP2576984B2 (ja) | 1997-01-29 |
Family
ID=13319188
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP62066552A Expired - Lifetime JP2576984B2 (ja) | 1987-03-20 | 1987-03-20 | 文字認識処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2576984B2 (ja) |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5933579A (ja) * | 1982-08-18 | 1984-02-23 | Fujitsu Ltd | 文字認識方式 |
JPS6132187A (ja) * | 1984-07-19 | 1986-02-14 | インタ−ナショナル ビジネス マシ−ンズ コ−ポレ−ション | 文字認識方式 |
-
1987
- 1987-03-20 JP JP62066552A patent/JP2576984B2/ja not_active Expired - Lifetime
Non-Patent Citations (1)
Title |
---|
電子通信学会研究報告PRL83−81 |
Also Published As
Publication number | Publication date |
---|---|
JPS63233488A (ja) | 1988-09-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5212739A (en) | Noise tolerant optical character recognition system | |
US7437001B2 (en) | Method and device for recognition of a handwritten pattern | |
JP3452774B2 (ja) | 文字認識方法 | |
JP4280355B2 (ja) | 文字認識装置 | |
JP3155616B2 (ja) | 文字認識方法及び装置 | |
EP0652532A2 (en) | Character recognition apparatus | |
JP2576984B2 (ja) | 文字認識処理装置 | |
Bushofa et al. | Segmentation of Arabic characters using their contour information | |
Airphaiboon et al. | Recognition of handprinted Thai characters using loop structures | |
JP3113769B2 (ja) | 文字認識装置 | |
JP3304512B2 (ja) | 表認識装置 | |
JP3071048B2 (ja) | 文字認識装置及び方法 | |
JP3197441B2 (ja) | 文字認識装置 | |
JP3911942B2 (ja) | 文字認識装置 | |
JP2794042B2 (ja) | 表形式文書の認識装置 | |
KR100248384B1 (ko) | 다국어 문서 인식에서 개별 문자 추출 방법 및 그 인식 시스템 | |
JPH0664629B2 (ja) | 文字認識方式 | |
JP2963474B2 (ja) | 類似文字識別方法 | |
JP2918363B2 (ja) | 文字分類方法及び文字認識装置 | |
JP2931485B2 (ja) | 文字切出し装置及び方法 | |
JP4092847B2 (ja) | 文字認識装置および文字認識方法 | |
JP2973892B2 (ja) | 文字認識方式 | |
JP2972443B2 (ja) | 文字認識装置 | |
JPH0436432B2 (ja) | ||
JPH08297718A (ja) | 文字切り出し装置及び文字認識装置 |