JPS6330991A - 文字認識装置 - Google Patents
文字認識装置Info
- Publication number
- JPS6330991A JPS6330991A JP61175915A JP17591586A JPS6330991A JP S6330991 A JPS6330991 A JP S6330991A JP 61175915 A JP61175915 A JP 61175915A JP 17591586 A JP17591586 A JP 17591586A JP S6330991 A JPS6330991 A JP S6330991A
- Authority
- JP
- Japan
- Prior art keywords
- character
- candidate
- type
- characters
- distance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004364 calculation method Methods 0.000 claims description 7
- 240000000220 Panda oleosa Species 0.000 description 8
- 235000016496 Panda oleosa Nutrition 0.000 description 8
- 238000010586 diagram Methods 0.000 description 5
- 238000000605 extraction Methods 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000034 method Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
Landscapes
- Character Discrimination (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
産業上の利用分野
本発明は、新聞・雑誌等の活字及び手書き文字を認識し
、例えばJISコード等の情報量に変換する文字認識装
置に関するものである。
、例えばJISコード等の情報量に変換する文字認識装
置に関するものである。
従来の技術
従来の文字認識装置では認識対象文字パターンから得ら
れた特徴量と予め辞書に貯えられている各文字の特徴量
との距離を計算し、前記距離の小さい文字を第一候補文
字としていた。(例えば、電子通信学会技術研究報告〈
パターン認識と学習〉PRL82−46”マルチフォン
ト印刷漢字認識実験装置”目黒他) 発明が解決しようとする問題点 しかしながら、実際には認識対象文字パターンの特徴量
と辞書との距離を求めて小さい距離の文字を認識候補文
字とする手法では、「え」や「之」、「り」や「夕」な
どの形状が非常に似ている文字は区別出来ない。本発明
は上記問題点を解決することを目的としたもので、形状
が非常例よく似た文字に対してもより正確に文字認識を
行なうことができる文字認識装置を提供することを目的
としている。
れた特徴量と予め辞書に貯えられている各文字の特徴量
との距離を計算し、前記距離の小さい文字を第一候補文
字としていた。(例えば、電子通信学会技術研究報告〈
パターン認識と学習〉PRL82−46”マルチフォン
ト印刷漢字認識実験装置”目黒他) 発明が解決しようとする問題点 しかしながら、実際には認識対象文字パターンの特徴量
と辞書との距離を求めて小さい距離の文字を認識候補文
字とする手法では、「え」や「之」、「り」や「夕」な
どの形状が非常に似ている文字は区別出来ない。本発明
は上記問題点を解決することを目的としたもので、形状
が非常例よく似た文字に対してもより正確に文字認識を
行なうことができる文字認識装置を提供することを目的
としている。
問題点を解決するための手段
本発明による文字認識装置は前記問題点を解決するため
、認識対象文字列を含む画像を入力する画像入力部と、
前記画像入力部で得られた画像から認識対象となる文字
パターンを矩形で切り出す文字切り出し部と、前記文字
切り出し部で得られえられている各文字の特徴量との距
離を求める距離計算部と、各認識対象文字パターンにつ
いて前記距離計算部で得られた距離の最も小さいものを
第一候補文字としそれも含めて距離の小さいものからN
文字を認識候補文字群とし各認識候補文字に対して各文
字の属性を表わしている文字種を付与する分類部と、前
記分類部で得られた第−候補文字より構成される文字列
に於いて予め与えられている規則を各第一候補文字の文
字種の並びに適用することにより各第一候補文字の文字
種を変更する文字種変更部と、前記文字種変更部で文字
種を変更された文字に於いて第二から第N候補文字の中
で前記文字種を変更された文字の変更後の文字種と同一
の文字種を持つ候補文字の中から最も上位の候補文字を
第一候補文字とする訂正部で構成されている。
、認識対象文字列を含む画像を入力する画像入力部と、
前記画像入力部で得られた画像から認識対象となる文字
パターンを矩形で切り出す文字切り出し部と、前記文字
切り出し部で得られえられている各文字の特徴量との距
離を求める距離計算部と、各認識対象文字パターンにつ
いて前記距離計算部で得られた距離の最も小さいものを
第一候補文字としそれも含めて距離の小さいものからN
文字を認識候補文字群とし各認識候補文字に対して各文
字の属性を表わしている文字種を付与する分類部と、前
記分類部で得られた第−候補文字より構成される文字列
に於いて予め与えられている規則を各第一候補文字の文
字種の並びに適用することにより各第一候補文字の文字
種を変更する文字種変更部と、前記文字種変更部で文字
種を変更された文字に於いて第二から第N候補文字の中
で前記文字種を変更された文字の変更後の文字種と同一
の文字種を持つ候補文字の中から最も上位の候補文字を
第一候補文字とする訂正部で構成されている。
作 用
本発明は前記の技術的手段により、「え」や「之」よう
に非常に形状の似た文字でも正確に文字を認識すること
を可能とする。
に非常に形状の似た文字でも正確に文字を認識すること
を可能とする。
実施例
以下、本発明の実施例について図面を参照しながら説明
する。
する。
第1図は、本発明による文字認識装置の一実施例の構成
図である。1は画像入力部であり、認識対象文字列を含
む画像を走査して二値信号で画像を入力し画像メモリ2
に格納する。3は文字切り出し部であり、画像メモリ2
に格納されている二値画像から認識対象文字パターンを
矩形で切り出す。4は特徴抽出部であり、文字切り出し
部3で切り出した認識対象文字パターンのストローク等
の特徴量を求める。5は距離計算部であり、特徴抽出部
4で求めた認識対象文字パターンの特徴量と、予め第一
の辞書6に登録されている各文字の特徴量との距離を求
める。7は分類部であり、距離計算部5で得られた距離
のなかでも最も小さいものを第一候補文字とし、その文
字も含めて距離の小さいものからN文字を認識候補文字
群とし、各認識候補文字に対して各文字の属性を表わし
ている文字種を付加する。8は文字種変更部であり分類
部7で得られた第一候補文字より構成さnる文字列に於
いて、各第一候補文字の文字種の並びより各第一候補文
字の文字種を変更する。9は訂正部であり前記文字種変
更部で文字種を変更された文字に於いて、第二から第N
候補文字の中で前記文字種を変更された文字の変更後の
文字種と同一の文字種を持つ候補文字の中から最も上位
の候補文字を第一候補文字とする。
図である。1は画像入力部であり、認識対象文字列を含
む画像を走査して二値信号で画像を入力し画像メモリ2
に格納する。3は文字切り出し部であり、画像メモリ2
に格納されている二値画像から認識対象文字パターンを
矩形で切り出す。4は特徴抽出部であり、文字切り出し
部3で切り出した認識対象文字パターンのストローク等
の特徴量を求める。5は距離計算部であり、特徴抽出部
4で求めた認識対象文字パターンの特徴量と、予め第一
の辞書6に登録されている各文字の特徴量との距離を求
める。7は分類部であり、距離計算部5で得られた距離
のなかでも最も小さいものを第一候補文字とし、その文
字も含めて距離の小さいものからN文字を認識候補文字
群とし、各認識候補文字に対して各文字の属性を表わし
ている文字種を付加する。8は文字種変更部であり分類
部7で得られた第一候補文字より構成さnる文字列に於
いて、各第一候補文字の文字種の並びより各第一候補文
字の文字種を変更する。9は訂正部であり前記文字種変
更部で文字種を変更された文字に於いて、第二から第N
候補文字の中で前記文字種を変更された文字の変更後の
文字種と同一の文字種を持つ候補文字の中から最も上位
の候補文字を第一候補文字とする。
以上のように構成された文字認識装置について、第2図
(a)に示す入力画像を例に説明する。
(a)に示す入力画像を例に説明する。
画像入力部1から入力された第2図(、)に示すような
画像は2値化されて画像メモリ2に格納される。文字切
り出し部3は画像メモリ2に蓄えられている入力画像か
ら認識対象文字パターンを第2図(ト))に示すような
矩形Ri(i−1,・・・・・・、 m )で切り出す
。
画像は2値化されて画像メモリ2に格納される。文字切
り出し部3は画像メモリ2に蓄えられている入力画像か
ら認識対象文字パターンを第2図(ト))に示すような
矩形Ri(i−1,・・・・・・、 m )で切り出す
。
特徴抽出部4では、文字切り出し部3で得られた第2図
(b)の認識対象文字パターンPiについて、ストロー
ク数・位置・長さ等の特徴量を抽出する。
(b)の認識対象文字パターンPiについて、ストロー
ク数・位置・長さ等の特徴量を抽出する。
距離計算部6では、特徴抽出部で得られた認識対象文字
パターンP、の特徴量f1j(]”” +・・・・・・
、n)と予め貯えられている第一の辞書6の各文字Ck
の特徴量Ckjとの距離”ikを Dlに=Σl f ijc kjl により求める。
パターンP、の特徴量f1j(]”” +・・・・・・
、n)と予め貯えられている第一の辞書6の各文字Ck
の特徴量Ckjとの距離”ikを Dlに=Σl f ijc kjl により求める。
分類部7では、距離計算部5で求めた認識対象文字Pi
と辞書中の文字Ckとの距離Dikが最も小さいもの
を第一候補文字とし、第3図(a)で示すように、その
文字も含めてDikが小さいものから順にN文字を認識
候補文字群A1u(u=1.・・・・・・、N)とし、
各認識候補文字に対して各文字の属性を表わしている文
字種を付与する。
と辞書中の文字Ckとの距離Dikが最も小さいもの
を第一候補文字とし、第3図(a)で示すように、その
文字も含めてDikが小さいものから順にN文字を認識
候補文字群A1u(u=1.・・・・・・、N)とし、
各認識候補文字に対して各文字の属性を表わしている文
字種を付与する。
文字種変更部8では、分類部7で得られた第一候補文字
より構成される第3図(b)に示す文字列の例えば第3
図(C)に示すような連続した3文字に於いて、例えば
これら3文字の文字種が〔カナ〕〔漢字〕〔カナ〕は〔
カナ〕〔カナ〕〔カナ〕に変更するという規則を適用し
て、文字種を変更する。第3図(C)に示す例では「ル
ーチ」の3文字の文字種はそれぞれ〔カナ〕〔漢字〕〔
カナ〕であるので、これらの文字に前記規則を適用し中
央の文字の文字種を〔漢字〕から〔カナ〕に変更する。
より構成される第3図(b)に示す文字列の例えば第3
図(C)に示すような連続した3文字に於いて、例えば
これら3文字の文字種が〔カナ〕〔漢字〕〔カナ〕は〔
カナ〕〔カナ〕〔カナ〕に変更するという規則を適用し
て、文字種を変更する。第3図(C)に示す例では「ル
ーチ」の3文字の文字種はそれぞれ〔カナ〕〔漢字〕〔
カナ〕であるので、これらの文字に前記規則を適用し中
央の文字の文字種を〔漢字〕から〔カナ〕に変更する。
訂正部9では文字種変更部8で文字種を変更された「−
」の第4図(、)に示すような該当する候補文字群の中
で、「−」の変更後の文字種と同一の文字種を持つ候補
文字を第一候補文字とする。第4図(a)に示す候補文
字群の例では、文字種が「−」の変更後の文字種〔カナ
〕である候補文字は第二候補文字の長音記号「−」であ
るのでこの長音記号「−」が第一候補文字となり第4図
(b)に示すような正しい認識結果が得られる。
」の第4図(、)に示すような該当する候補文字群の中
で、「−」の変更後の文字種と同一の文字種を持つ候補
文字を第一候補文字とする。第4図(a)に示す候補文
字群の例では、文字種が「−」の変更後の文字種〔カナ
〕である候補文字は第二候補文字の長音記号「−」であ
るのでこの長音記号「−」が第一候補文字となり第4図
(b)に示すような正しい認識結果が得られる。
発明の効果
本発明によれば、非常に形状のよく似た文字に於いても
、各第一候補文字の文字種の並びから訂訂正後の文字種
と同一の文字種を持つ認識候補文字を第一候補文字とす
るととにより正確に認識を行なうことができ、その実用
的価値は非常に大きい。
、各第一候補文字の文字種の並びから訂訂正後の文字種
と同一の文字種を持つ認識候補文字を第一候補文字とす
るととにより正確に認識を行なうことができ、その実用
的価値は非常に大きい。
第1図は本発明の一実施例による文字認識装置の構成図
、第2図は入力画像の一例と認識対象文字パターンの切
り出しを示す説明図、第3図は認識対象文字パターンに
対する認識候補文字の一例とその第一候補文字より成る
文字列を示す説明図、第4図は孤立位置の認識候補文字
群と最終的な認識結果文字列を示す説明図である。 1・・・・・・画像入力部、2・・・・・・画像メモリ
部、3・・・・・・文字切り出し部、4・・・・・・特
徴抽出部、5・・・・・・距離計算部、6・・・・第一
の辞書、7・・・・・・分類部、8・・・・・・文字種
変更部、9・・・・・・訂正部。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名元=
l(イ)鹸
、第2図は入力画像の一例と認識対象文字パターンの切
り出しを示す説明図、第3図は認識対象文字パターンに
対する認識候補文字の一例とその第一候補文字より成る
文字列を示す説明図、第4図は孤立位置の認識候補文字
群と最終的な認識結果文字列を示す説明図である。 1・・・・・・画像入力部、2・・・・・・画像メモリ
部、3・・・・・・文字切り出し部、4・・・・・・特
徴抽出部、5・・・・・・距離計算部、6・・・・第一
の辞書、7・・・・・・分類部、8・・・・・・文字種
変更部、9・・・・・・訂正部。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名元=
l(イ)鹸
Claims (1)
- 認識対象文字列を含む画像を入力する画像入力部と、前
記画像入力部で得られた画像から認識対象となる文字パ
ターンを矩形で切り出す文字切り出し部と、前記文字切
り出し部で得られた認識対象文字パターンの文字特徴を
求める特徴抽出部と、前記特徴抽出部で得られた文字特
徴と予め第一の辞書に貯えられている各文字の特徴量と
の距離を求める距離計算部と、各認識対象文字パターン
について前記距離計算部で得られた距離の最も小さいも
のを第一候補文字としそれも含めて距離の小さいものか
らN文字を認識候補文字群とし各認識候補文字に対して
各文字の属性を表わしている文字種を付与する分類部と
、前記分類部で得られた第一候補文字より構成される文
字列に於いて予め与えられている規則を各第一候補文字
の文字種の並びに適用することにより各第一候補文字の
文字種を変更する文字種変更部と、前記文字種変更部で
文字種を変更された文字に於いて第二から第N候補文字
の中で前記文字種を変更された文字の変更後の文字種と
同一の文字種を持つ候補文字の中から最も上位の候補文
字を第一候補文字とする訂正部を有することを特徴とす
る文字認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61175915A JPS6330991A (ja) | 1986-07-25 | 1986-07-25 | 文字認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61175915A JPS6330991A (ja) | 1986-07-25 | 1986-07-25 | 文字認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS6330991A true JPS6330991A (ja) | 1988-02-09 |
Family
ID=16004472
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP61175915A Pending JPS6330991A (ja) | 1986-07-25 | 1986-07-25 | 文字認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS6330991A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01259477A (ja) * | 1988-04-11 | 1989-10-17 | Canon Inc | 文字認識装置 |
JPH0290384A (ja) * | 1988-09-28 | 1990-03-29 | Ricoh Co Ltd | 文字認識装置の後処理方式 |
US5048113A (en) * | 1989-02-23 | 1991-09-10 | Ricoh Company, Ltd. | Character recognition post-processing method |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6139175A (ja) * | 1984-07-31 | 1986-02-25 | Toshiba Corp | 光学的文字読取装置 |
-
1986
- 1986-07-25 JP JP61175915A patent/JPS6330991A/ja active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6139175A (ja) * | 1984-07-31 | 1986-02-25 | Toshiba Corp | 光学的文字読取装置 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01259477A (ja) * | 1988-04-11 | 1989-10-17 | Canon Inc | 文字認識装置 |
JPH0290384A (ja) * | 1988-09-28 | 1990-03-29 | Ricoh Co Ltd | 文字認識装置の後処理方式 |
US5048113A (en) * | 1989-02-23 | 1991-09-10 | Ricoh Company, Ltd. | Character recognition post-processing method |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3452774B2 (ja) | 文字認識方法 | |
JPH0830732A (ja) | 文字認識方法 | |
JPH05242292A (ja) | 分離方法 | |
JPH0684006A (ja) | オンライン手書き文字認識方法 | |
JP2000315247A (ja) | 文字認識装置 | |
JPS6330991A (ja) | 文字認識装置 | |
Mashiyat et al. | Bangla off-line handwritten character recognition using superimposed matrices | |
JPH0520794B2 (ja) | ||
Suwa | Segmentation of touching handwritten Japanese characters using the graph theory method | |
JP2746345B2 (ja) | 文字認識の後処理方法 | |
JPS63221495A (ja) | 文字認識装置 | |
JP3151866B2 (ja) | 英文字認識方法 | |
JP2930996B2 (ja) | 画像認識方法および画像認識装置 | |
JPS62251888A (ja) | 文字認識装置 | |
JPS6337490A (ja) | 文字認識装置 | |
JP3595081B2 (ja) | 文字認識方法 | |
JPH096920A (ja) | 手書き文字認識方法及びその装置 | |
JPH0944604A (ja) | 文字認識処理方法 | |
JPH05217017A (ja) | 光学式文字読取装置 | |
JPS6255783A (ja) | 文字認識装置 | |
JP2639314B2 (ja) | 文字認識方式 | |
JP2962911B2 (ja) | 文字認識装置 | |
JPH0584553B2 (ja) | ||
JPH11134439A (ja) | 単語認識方法 | |
JPH0527157B2 (ja) |