JPH03175591A - 文字認識装置 - Google Patents
文字認識装置Info
- Publication number
- JPH03175591A JPH03175591A JP1314301A JP31430189A JPH03175591A JP H03175591 A JPH03175591 A JP H03175591A JP 1314301 A JP1314301 A JP 1314301A JP 31430189 A JP31430189 A JP 31430189A JP H03175591 A JPH03175591 A JP H03175591A
- Authority
- JP
- Japan
- Prior art keywords
- pattern
- stroke
- character
- correlation
- dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 claims abstract description 21
- 238000000605 extraction Methods 0.000 claims abstract description 15
- 230000008569 process Effects 0.000 claims description 5
- 230000007261 regionalization Effects 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 11
- 230000009467 reduction Effects 0.000 description 5
- 239000000284 extract Substances 0.000 description 4
- 238000009825 accumulation Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Landscapes
- Character Discrimination (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(産業上の利用分野)
本発明は、文書中の文字パターンを認識する画像処理装
置に係り、特に文字を構成する画素の接続方向性に着目
して、文字パターンを認識する文字認識装置に関する。
置に係り、特に文字を構成する画素の接続方向性に着目
して、文字パターンを認識する文字認識装置に関する。
(従来の技術)
従来から、文字認識、特に漢字認識を行うために、多く
の手法や文字の特徴量抽出の方法が提案されている。漢
字の場合、文字数や似た文字が多く存在する。このため
に、単純なパターンの相関値のみでは、漢字を十分に識
別できない。
の手法や文字の特徴量抽出の方法が提案されている。漢
字の場合、文字数や似た文字が多く存在する。このため
に、単純なパターンの相関値のみでは、漢字を十分に識
別できない。
これを解決する方法として次のものがある。
すなわち、1.複合類似度を求める方法、2、方向パタ
ーンマツチング法、3.セル特m法、4、ストローク構
造集積法、5.弛緩整合法等が提案されている(電子情
報通信学会発行、森健−監修「パターン認識」の第2章
にこれらの手法が概要的に解説されている)。
ーンマツチング法、3.セル特m法、4、ストローク構
造集積法、5.弛緩整合法等が提案されている(電子情
報通信学会発行、森健−監修「パターン認識」の第2章
にこれらの手法が概要的に解説されている)。
(発明が解決しようとする課B)
しかし、1.の複合類似度を求める方法は、想定する変
形に応じた複数の辞書パターンをに−L変換により求め
る必要があり、辞書データ量、辞書作製時間等問題があ
る。
形に応じた複数の辞書パターンをに−L変換により求め
る必要があり、辞書データ量、辞書作製時間等問題があ
る。
2.0方向パターンマツチング法は、文字パターンの方
向性だけに着目すれば良いので、比較的容易に文字の特
徴量を抽出できるが、文字の識別力が弱いと言う問題が
ある。
向性だけに着目すれば良いので、比較的容易に文字の特
徴量を抽出できるが、文字の識別力が弱いと言う問題が
ある。
3、.4.0セル特徴およびストローク構造集積法は、
文字の特徴量を伝搬させて作っているので、処理が複雑
になる。
文字の特徴量を伝搬させて作っているので、処理が複雑
になる。
5、の弛緩整合法は、輪郭線の整合を取るために周辺の
輪郭線との関係を繰り返し探索し、最も確からしいもの
を探す処理を行うため、処理時間が非常にかかる。
輪郭線との関係を繰り返し探索し、最も確からしいもの
を探す処理を行うため、処理時間が非常にかかる。
本発明は、以上のような問題に鑑みてなされたもので、
文字の細部の特徴を比較的容易に抽出できるだけでなく
、多少の文字変形も吸収できる特徴量を抽出し、高速で
識別精度の高い文字認識装置を提供することを目的とす
る。
文字の細部の特徴を比較的容易に抽出できるだけでなく
、多少の文字変形も吸収できる特徴量を抽出し、高速で
識別精度の高い文字認識装置を提供することを目的とす
る。
(課題を解決するための手段)
前記目的を達成するために、本発明の文字認識装置は、
入力文字を構成する画素における接続の方向性を検知す
るストローク方向抽出部1と、ストローク方向抽出部1
により抽出されたストロークの内、同一方向ごとのパタ
ーンに分解する方向ストロークパターン形成部2と、同
一方向ストロークパターン形成部2により得られた各方
向のストロークパターンを縮小してぼかすパターンぼか
し部3と、パターンぼかし部3により形成されたパター
ンと予め上記各処理により形成しておいた辞書パターン
との相関を求める相関処理部4と、相関処理部4で得ら
れた相関値の大きさによりパターンの識別を行うパター
ンR別部7とから構成される。
入力文字を構成する画素における接続の方向性を検知す
るストローク方向抽出部1と、ストローク方向抽出部1
により抽出されたストロークの内、同一方向ごとのパタ
ーンに分解する方向ストロークパターン形成部2と、同
一方向ストロークパターン形成部2により得られた各方
向のストロークパターンを縮小してぼかすパターンぼか
し部3と、パターンぼかし部3により形成されたパター
ンと予め上記各処理により形成しておいた辞書パターン
との相関を求める相関処理部4と、相関処理部4で得ら
れた相関値の大きさによりパターンの識別を行うパター
ンR別部7とから構成される。
(作 用)
ストローク方向抽出部lでは、白黒の2値として入力さ
れた画像から一文字ずつ切り出された文字パターンを構
成する各画素がどの方向のストロークに属するかを判定
する。次に、方向ストロークパターン形成部2では、ス
トローク方向抽出部!で抽出された各ストロークの内、
同一方向のストロークに属する画素のみを抽出して、一
つのパターンを形成する。同一方向のストロークの画素
だけが集められた方向パターンは、パターンぼかし部3
により、ぼかされたイメージとして縮小される。パター
ン辞書格納部6には、以上と同様の手続きで予め作成さ
れて格納されたパターン辞書が認識可能な文字数分格納
されている。
れた画像から一文字ずつ切り出された文字パターンを構
成する各画素がどの方向のストロークに属するかを判定
する。次に、方向ストロークパターン形成部2では、ス
トローク方向抽出部!で抽出された各ストロークの内、
同一方向のストロークに属する画素のみを抽出して、一
つのパターンを形成する。同一方向のストロークの画素
だけが集められた方向パターンは、パターンぼかし部3
により、ぼかされたイメージとして縮小される。パター
ン辞書格納部6には、以上と同様の手続きで予め作成さ
れて格納されたパターン辞書が認識可能な文字数分格納
されている。
入力文字パターンから作成されたパターンと各辞書パタ
ーンとは、相関処理部4によって相関値が求められる。
ーンとは、相関処理部4によって相関値が求められる。
この相関値は、各方向パターンごとに求められる。そし
て、各方向の相関値の大きさを基に、入力文字が#書の
どの文字に最も似ているかを判定し、これを認識結果と
する。
て、各方向の相関値の大きさを基に、入力文字が#書の
どの文字に最も似ているかを判定し、これを認識結果と
する。
(実 施 例)
第1図は本究明による文字認識gAr11の基本的構成
を示すブロック図である。この文字認識装置は、ストロ
ーク方向抽出部トと、方向ストロークパターン形成部2
と、パターンぼかし部3と、相関処理部4と、方向パタ
ーン格納部5−1.5−2、・・・5−nと、パターン
辞書格納部6とから構成される。
を示すブロック図である。この文字認識装置は、ストロ
ーク方向抽出部トと、方向ストロークパターン形成部2
と、パターンぼかし部3と、相関処理部4と、方向パタ
ーン格納部5−1.5−2、・・・5−nと、パターン
辞書格納部6とから構成される。
if図において、ストローク方向抽出部1では、入力文
字から切り出されたパターンから文字ストロークを抽出
する。方向ストロークパターン形成部2では、前記スト
ローク方向抽出部1で抽出された各方向のストロークの
内、方向ストロークごとに分ける。パターンぼかし部3
では、各同一方向ストロークを集めて形成されたパ ターンを縮小する。相関処理部4では、パターンばかし
部3で形成されたぼかしパターンと予めパターン辞書格
納部6に格納されているパターンとの相関を求める処理
を行う。方向パターン格納部5−1ないし5−nは、そ
れぞれ同一方向のストロークパターンが格納されている
。
字から切り出されたパターンから文字ストロークを抽出
する。方向ストロークパターン形成部2では、前記スト
ローク方向抽出部1で抽出された各方向のストロークの
内、方向ストロークごとに分ける。パターンぼかし部3
では、各同一方向ストロークを集めて形成されたパ ターンを縮小する。相関処理部4では、パターンばかし
部3で形成されたぼかしパターンと予めパターン辞書格
納部6に格納されているパターンとの相関を求める処理
を行う。方向パターン格納部5−1ないし5−nは、そ
れぞれ同一方向のストロークパターンが格納されている
。
第2図はストローク方向説明図、第3図はストローク方
向判定側説明図である。
向判定側説明図である。
第2図において、ストローク方向が8方向の例が示され
ている。たとえば、第3図図示のごときパターンについ
て、各画素がどの方向のパターンに属しているかの判定
方法を説明する。i3図図示の各正方形が一つの画素を
形成し、図中の黒画素がどの方向ストロークに属するか
を判定する。
ている。たとえば、第3図図示のごときパターンについ
て、各画素がどの方向のパターンに属しているかの判定
方法を説明する。i3図図示の各正方形が一つの画素を
形成し、図中の黒画素がどの方向ストロークに属するか
を判定する。
すなわち、注目している画素を基にして、第3図に示す
ように、前後左右および斜め方向の各方向にそれぞれ画
素を順次走査し、黒画素をカウントして行き、走査した
画素がしろ画素になったら、その方向の走査を止める。
ように、前後左右および斜め方向の各方向にそれぞれ画
素を順次走査し、黒画素をカウントして行き、走査した
画素がしろ画素になったら、その方向の走査を止める。
このような走査を各方向について行い、終了したら、黒
画素のカウント数が最も大きい方向を、その着目画素の
ストローク方向であると判定する。第3図に示す例では
、第2図のストローク方向7と一致する方向のストロー
クが最も長い。したがって、注目画素は、方向7のスト
ロークに属する。同様に他の画素全てに対してストロー
ク方向の判定を行う。
画素のカウント数が最も大きい方向を、その着目画素の
ストローク方向であると判定する。第3図に示す例では
、第2図のストローク方向7と一致する方向のストロー
クが最も長い。したがって、注目画素は、方向7のスト
ロークに属する。同様に他の画素全てに対してストロー
ク方向の判定を行う。
第4図は方向パターンの抽出側説明図である。
第4図において、たとえば、「漢」の文字の8方向のス
トロークパターンを抽出した例で、便宜上縮小しである
。また、第4図図示の番号■ないし■は、第2図図示の
方向性を示す番号工ないし8と対応・している。
トロークパターンを抽出した例で、便宜上縮小しである
。また、第4図図示の番号■ないし■は、第2図図示の
方向性を示す番号工ないし8と対応・している。
ぼかし処理は、2値画像である各方向ストロークパター
ンを縮小し濃淡のある画像に変換する。
ンを縮小し濃淡のある画像に変換する。
ここでは以下のような処理を用いることにする。
方向ストロークパターンの大きさがNXN画素として、
ぼかし後のパターンの大きさをMXMとする。NはMの
画素の整数a倍とする。すなわち、aXa画素の原画を
1画素に投影することになる。
ぼかし後のパターンの大きさをMXMとする。NはMの
画素の整数a倍とする。すなわち、aXa画素の原画を
1画素に投影することになる。
この際、方向ストロークパターンの各画素の内、背景で
ある白画素を−1、パターンを形成する黒画素を+1と
し、88個の画素を加算する。したがって、ぼかし変換
後の1画素は−amから十atの間の値を持つことにな
る。
ある白画素を−1、パターンを形成する黒画素を+1と
し、88個の画素を加算する。したがって、ぼかし変換
後の1画素は−amから十atの間の値を持つことにな
る。
ここで得られた各方向のぼかしパターンと辞書として持
っている各文字方向のぼかしパターンとの間で各方向ご
とに相関をとる。相関はぼかした方向パターンの各画素
を要素とするM1次元のベクトル同志の内積をそれぞれ
のベクトルのノルムで除したものになる。式で書くと、 Sl = (II 、 DI ) /II II I
I・IIDIIIとなる。
っている各文字方向のぼかしパターンとの間で各方向ご
とに相関をとる。相関はぼかした方向パターンの各画素
を要素とするM1次元のベクトル同志の内積をそれぞれ
のベクトルのノルムで除したものになる。式で書くと、 Sl = (II 、 DI ) /II II I
I・IIDIIIとなる。
Sが相関値、■が入カバターン、Dが辞書パターンを、
添字iはストロークの方向を示す。8方向の場合、各文
字に対して8個の相関値が得られるので、8個の相関値
の2乗和を各文字に対する類似の度合いとする。辞書と
して持っている全文字中で、最も類似の度合いの高いも
のを認識結果とする。
添字iはストロークの方向を示す。8方向の場合、各文
字に対して8個の相関値が得られるので、8個の相関値
の2乗和を各文字に対する類似の度合いとする。辞書と
して持っている全文字中で、最も類似の度合いの高いも
のを認識結果とする。
以上、本発明の実施例を詳述したが、本発明は、前記実
施例に限定されるものではない。
施例に限定されるものではない。
たとえば、ストロークの方向は実施例では8方向とした
が、これに限るものではない。
が、これに限るものではない。
また、原画像、ぼかし画像とも実施例では他と横の画素
数を同じにしたが、これは異ならせてもよい。ぼかしの
際の縮率を実施例では同一にしたが、縦横具なる゛縮率
としてもよい。
数を同じにしたが、これは異ならせてもよい。ぼかしの
際の縮率を実施例では同一にしたが、縦横具なる゛縮率
としてもよい。
また、実施例ではばかしの際の白画素黒画素の重みをそ
れぞれ−1,+ 1に設定し、原画を粗く分割し、その
中の自画素数および黒画素数の集計によりぼかし後の画
素値を計算するようにしたが、画素の重み付けを換えも
っと広い範囲の画素の状況を集計するようにしてもよい
。
れぞれ−1,+ 1に設定し、原画を粗く分割し、その
中の自画素数および黒画素数の集計によりぼかし後の画
素値を計算するようにしたが、画素の重み付けを換えも
っと広い範囲の画素の状況を集計するようにしてもよい
。
また、実施例では入力の各方向のばかしと辞書の各方向
のぼかしパターンの各相関を求めたが、相関としてパタ
ーン間の距@(ユークリッド等)を用いてもよい。
のぼかしパターンの各相関を求めたが、相関としてパタ
ーン間の距@(ユークリッド等)を用いてもよい。
似ている度合として、実施例では各相関の2乗和を用い
たが、他の評価関数、例えば相関値の重み付き加算等を
用いてもよい。
たが、他の評価関数、例えば相関値の重み付き加算等を
用いてもよい。
さらに、実施例では似ている度合″の最も大きいものを
認識結果としたが、識別を行う場合に、似ている度合が
大きくても、その度合いがある基準値より小さい場合、
あるいは2番目に大きいものとの差が小さい場合には、
認識結果とせずに認識不能としても良い。
認識結果としたが、識別を行う場合に、似ている度合が
大きくても、その度合いがある基準値より小さい場合、
あるいは2番目に大きいものとの差が小さい場合には、
認識結果とせずに認識不能としても良い。
(発明の効果)
本発明によれば、画素のストローク方向を判定し、方向
ストロークパターンに分解することにより、簡単に文字
の細部の特徴を捕捉した特徴抽出ができる。
ストロークパターンに分解することにより、簡単に文字
の細部の特徴を捕捉した特徴抽出ができる。
また、方向ストロークパターンを縮小してぼかすパター
ンぼかし部を設けたので、文字の細かな変形を吸収でき
ると共に、データ日の削減により処理時間を短縮できる
。また、パターンぼかし処理の結果正負の濃淡データが
得られるので、相関値の変化範囲が大きくなり、識別精
度が向上する。
ンぼかし部を設けたので、文字の細かな変形を吸収でき
ると共に、データ日の削減により処理時間を短縮できる
。また、パターンぼかし処理の結果正負の濃淡データが
得られるので、相関値の変化範囲が大きくなり、識別精
度が向上する。
さらに、ばかしの際の縮率を変えることにより1文字の
分類と識別の両方を行うことができる。
分類と識別の両方を行うことができる。
すなわち、縮率を大きくして文字の分類を行い、分類で
得られた少数の文字に対しては縮率を小さくして特徴量
を抽出するようにすることにより、処理の速度と識別の
精度を共に向上させることができる。
得られた少数の文字に対しては縮率を小さくして特徴量
を抽出するようにすることにより、処理の速度と識別の
精度を共に向上させることができる。
第1図は本発明の基本的構成を示すブロック図、第2図
はストローク方向説明図、第3図はストローク方向判定
側説明図、第4図は方向パターンの抽出側説明図である
。 1・・・ストローク方向抽出部 2・・・方向ストロークパターン形成部3・・・パター
ンぼかし部 4・・・相開処理部 5−1、〜5−n・・・方向パターン格納部6・・・パ
ターン辞書格納部 7・・・パターン識別部
はストローク方向説明図、第3図はストローク方向判定
側説明図、第4図は方向パターンの抽出側説明図である
。 1・・・ストローク方向抽出部 2・・・方向ストロークパターン形成部3・・・パター
ンぼかし部 4・・・相開処理部 5−1、〜5−n・・・方向パターン格納部6・・・パ
ターン辞書格納部 7・・・パターン識別部
Claims (1)
- 【特許請求の範囲】 入力文字を構成する画素における接続の方向性を検知す
るストローク方向抽出部と、 当該ストローク方向抽出部により抽出されたストローク
の内、同一方向ごとのパターンに分解する方向ストロー
クパターン形成部と、 当該方向ストロークパターン形成部により得られた各方
向のストロークパターンを縮小してぼかすパターンぼか
し部と、 当該パターンぼかし部により形成されたパターンと予め
上記各処理により形成しておいた辞書パターンとの相関
を求める相関処理部と、 当該相関処理部で得られた相関値の大きさによりパター
ンの識別を行うパターン識別部と、を備えたことを特徴
とする文字認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1314301A JPH03175591A (ja) | 1989-12-05 | 1989-12-05 | 文字認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1314301A JPH03175591A (ja) | 1989-12-05 | 1989-12-05 | 文字認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH03175591A true JPH03175591A (ja) | 1991-07-30 |
Family
ID=18051712
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP1314301A Pending JPH03175591A (ja) | 1989-12-05 | 1989-12-05 | 文字認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH03175591A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1993007580A1 (fr) * | 1991-10-02 | 1993-04-15 | Fujitsu Limited | Procede pour determiner la direction dans une region locale d'un segment de profil et procede pour determiner les lignes et les angles |
EP0538038A2 (en) * | 1991-10-16 | 1993-04-21 | Canon Kabushiki Kaisha | Character recognition method & apparatus |
EP0542566A2 (en) * | 1991-11-14 | 1993-05-19 | Canon Kabushiki Kaisha | Character recognition method and apparatus thereof |
-
1989
- 1989-12-05 JP JP1314301A patent/JPH03175591A/ja active Pending
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1993007580A1 (fr) * | 1991-10-02 | 1993-04-15 | Fujitsu Limited | Procede pour determiner la direction dans une region locale d'un segment de profil et procede pour determiner les lignes et les angles |
US5586199A (en) * | 1991-10-02 | 1996-12-17 | Fujitsu Limited | Method for determining orientation of contour line segment in local area and for determining straight line and corner |
US5870494A (en) * | 1991-10-02 | 1999-02-09 | Fujitsu Limited | Method for determining orientation of contour line segment in local area and for determining straight line and corner |
EP0538038A2 (en) * | 1991-10-16 | 1993-04-21 | Canon Kabushiki Kaisha | Character recognition method & apparatus |
US5734750A (en) * | 1991-10-16 | 1998-03-31 | Canon Kabushiki Kaisha | Character recognition method and apparatus |
EP0542566A2 (en) * | 1991-11-14 | 1993-05-19 | Canon Kabushiki Kaisha | Character recognition method and apparatus thereof |
US5579408A (en) * | 1991-11-14 | 1996-11-26 | Canon Kabushiki Kaisha | Character recognition method and apparatus |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8463044B2 (en) | Method and device of detecting object in image and system including the device | |
CN106127196B (zh) | 基于动态纹理特征的人脸表情的分类与识别方法 | |
CN111767882A (zh) | 一种基于改进yolo模型的多模态行人检测方法 | |
Chen et al. | A new off-line signature verification method based on graph | |
US8861853B2 (en) | Feature-amount calculation apparatus, feature-amount calculation method, and program | |
US20030161504A1 (en) | Image recognition system and recognition method thereof, and program | |
CN103679187B (zh) | 图像识别方法和系统 | |
Mohamed et al. | An improved LBP algorithm for avatar face recognition | |
CN112329656B (zh) | 一种视频流中人体动作关键帧的特征提取方法 | |
CN109190456B (zh) | 基于聚合通道特征和灰度共生矩阵的多特征融合俯视行人检测方法 | |
CN111259756A (zh) | 基于局部高频次特征和混合度量学习的行人重识别方法 | |
CN106022223A (zh) | 一种高维局部二值模式人脸识别方法及系统 | |
CN112884033A (zh) | 一种基于卷积神经网络的生活垃圾分类检测方法 | |
CN111444817B (zh) | 一种人物图像识别方法、装置、电子设备和存储介质 | |
CN114863464B (zh) | 一种pid图纸图件信息的二阶识别方法 | |
Mei et al. | A novel framework for container code-character recognition based on deep learning and template matching | |
Mali et al. | Indian sign language recognition using SVM classifier | |
CN110825916A (zh) | 一种基于形体识别技术的寻人方法 | |
KR20080079443A (ko) | 영상으로부터의 객체 검출 방법 및 장치 | |
CN115797970B (zh) | 基于YOLOv5模型的密集行人目标检测方法及系统 | |
Chen et al. | Head-shoulder detection using joint HOG features for people counting and video surveillance in library | |
JPH03175591A (ja) | 文字認識装置 | |
Nguyen et al. | Triple detector based on feature pyramid network for license plate detection and recognition system in unusual conditions | |
CN114913607A (zh) | 一种基于多特征融合的指静脉仿冒检测方法 | |
CN114663803A (zh) | 基于视频流的物流中心挂装类服装分类方法及装置 |