JP2000113112A

JP2000113112A - 文字認識回路および英単語認識方法

Info

Publication number: JP2000113112A
Application number: JP10278088A
Authority: JP
Inventors: Takayoshi Yoshida; 隆義吉田; Koichi Higuchi; 浩一樋口
Original assignee: Oki Electric Industry Co Ltd
Current assignee: Oki Electric Industry Co Ltd
Priority date: 1998-09-30
Filing date: 1998-09-30
Publication date: 2000-04-21

Abstract

(57)【要約】【課題】文字認識の輪郭追跡処理において、処理対象
の複数画素を同時に読み出せるような文字パタンメモリ
の構成方法を提供し、読み出した複数画素を処理する輪
郭追跡回路を用いて文字認識回路を構成し、またこれを
利用した高性能な英単語認識方法を提供する【解決手段】文字パタンの輪郭追跡に必要なカレント
ポイントに隣接する４画素が１６個の分割メモリから常
に読み出されて利用できるので、カレントポイントのｘ
座標、ｙ座標および進行方向ｃｖ２０１から組み合わせ
回路により相対進行方向ｓｖを決定できる。またこれら
のｘ座標、ｙ座標および進行方向ｃｖの次の値を相対進
行方向ｓｖを用いた組み合わせ回路により求めることが
できる。従って、１クロックで１画素の速度で輪郭線を
追跡することができ、輪郭追跡処理が高速化できる。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】この発明は、文字認識回路及
び英単語認識方法に関し、特に印刷英文の認識に関す
る。

【０００２】

【従来の技術】図２２に従来の文字認識回路の構成を示
す。入力端子 1 から文字パタンメモリ 2 に１文字分の
文字パタンが２値画像として入力される。画素値は１が
黒画素、０が白画素を表わしている。図２３に文字パタ
ン及び処理結果の例を示す。

【０００３】フィルタ処理部３は、文字パタン画像に対
して、文字のかすれや背景ノイズを除去することによ
り、認識し易いパタン画像に変換する。

【０００４】文字枠検出部４は、フィルタ処理の施され
た入力文字パタンの矩形の外接枠を検出し、その結果を
輪郭抽出部５と文字照合識別部６に送る。

【０００５】文字パタンの外接枠は、水平方向および垂
直方向の周辺分布を使って求められる。周辺分布は文字
パタンをＰ（ｘ，ｙ）として、水平周辺分布：ＳＨ（ｘ）＝ Σ_yＰ（ｘ，ｙ）垂直周辺分布：ＳＶ（ｙ）＝ Σ_xＰ（ｘ，ｙ）で表わされる。ＳＨとＳＶの関数値は各々ｙ方向及びｘ
方向への黒画素の個数（集計）を表わしている。図２３
に「ａ」の文字の水平周辺分布を示す。

【０００６】これら周辺分布の値がある閾値を越えるｘ
とｙの範囲の上限と下限から外接枠の座標ＸＬ，Ｘ
Ｒ，ＹＢ，ＹＴを求める。

【０００７】輪郭追跡部５は、入力文字パタンの黒画素
領域と白画素領域の境界に沿って輪郭線を追跡する処理
を行い、例えば輪郭線上の黒画素を反時計回りに追跡す
る。図２３に「ａ」の文字の輪郭線上の画素列を示す。

【０００８】文字照合識別部６は、予め定めた文字集合
の各文字の輪郭線の特徴点の座標値や凹凸に関する情報
を予め辞書メモリ７に記憶し、前記輪郭線追跡結果から
得られた値と照合して文字を認識する。その結果、１個
の文字あるいは複数の候補文字の識別コードが出力端子
８より出力される。

【０００９】以上の文字認識を複数の文字について連続
して行い、単語辞書を利用して単語認識を行うこともあ
る。文献：特願平０９−２９８４４５「単語認識方法」
には、英単語認識方法が述べられている。

【００１０】

【発明が解決しようとする課題】しかしながら、上記の
文字認識回路では、認識対象の文字集合が数字・アルフ
ァベットの印刷字体等の照合識別処理が比較的容易な場
合において、輪郭追跡部5の処理に多くの処理時間を要
していた。

【００１１】その理由は、輪郭追跡処理は文字パタンメ
モリ２のアクセス回数が多く、２次元的なアドレス
（ｘ，ｙ）を指定して１画素づつ読み出すために多くの
処理ステップを費やすからである。このため、従来の方
法ににおいては高性能化が困難であった。

【００１２】本発明の目的は、文字認識の輪郭追跡処理
において、処理対象の複数画素を同時に読み出せるよう
な文字パタンメモリの構成方法を提供し、読み出した複
数画素を処理する輪郭追跡回路を用いて文字認識回路を
構成し、またこれを利用した高性能な英単語認識方法を
提供することである。

【００１３】

【課題を解決するための手段】前記課題を解決するため
に、本発明の文字認識回路においては、各々が文字パタ
ン画像の座標ｘおよび座標ｙの２方向に４画素毎に離散
する画素を記憶し、４×４のマトリクス状に配置された
分割メモリと、当該１６個の分割メモリのアドレスを指
定するＸレジスタおよびＹレジスタと、前記４×４マト
リクスの最左列、最右列、最下行、最上行に位置する各
４個の分割メモリ内部に備えられ、前記Ｘレジスタまた
はＹレジスタに０，１，−１のいずれかを加算した値を
供給し得るアドレス修飾器と、前記文字パタンの輪郭線
に沿って１画素単位に進行する現在点のｘ座標、ｙ座標
および進行方向ｃｖを保持するレジスタと、前記１６個
の分割メモリから当該進行方向ｃｖを基準として右、
前、左、後の４方向に隣る４画素値を参照し、当該４画
素値を用いて前記進行方向ｃｖ、前記現在点のｘ座標、
ｙ座標を更新する輪郭線追跡回路とを有することを特徴
とする。

【００１４】また、前記課題を解決するための本発明英
単語認識方法においては、活字体の英小文字「ａ」より
「ｚ」までの２６文字を構成要素とする英単語パタンを
２本の水平分割線によって上部パタン、中部パタン、下
部パタンに分割し、当該上部パタンの水平周辺分布及び
局所的垂直分布より、「ｉ，ｊ」の上部「ｂ，ｄ，ｈ，
ｋ，ｌ」の上部、「ｔ」の上部、「ｆ」の上部の少なく
とも４種類に分類した文字上部パタンを全て検出し、当
該上部パタンの検出個数及び当該種類を示す符号を当該
検出順序で並べた英単語文字上部パタン符号を求め、前
記下部パタンの水平周辺分布及び局所的垂直分布より、
「ｊ，ｙ」の下部、「ｐ，ｑ」の下部、「ｇ」の下部の
少なくとも３種類に分類した文字下部パタンを全て検出
し、当該下部パタンの検出個数及び当該種類を示す符号
を当該検出順序で並べた英単語文字下部パタン符号を求
め、前記英単語の中部パタンのみを持つ文字「ａ，ｃ，
ｅ，ｍ，ｎ，ｏ，ｒ，ｓ，ｕ，ｖ，ｗ，ｘ，ｚ」は、当
該文字の外側輪郭線の追跡処理を行い、進行方向のｙ成
分が反転する頂点の個数、座標値及び凹凸の推移に関す
る特徴を用いて１３文字に識別し、当該文字の検出個数
及び識別符号を当該検出順序で並べた英単語中部パタン
符号を求め、認識対象の全ての英単語を、前記英単語上
部パタン符号、英単語下部パタン符号、英単語中部パタ
ン符号を用いて分類した英単語認識用辞書を予め作成
し、入力された英単語パタンより前記英単語の上部およ
び下部パタン符号を求め、当該両パタン符号により前記
英単語認識用辞書を索引して１個以上の英単語候補を選
定し、当該英単語候補が複数個ある場合は、当該入力さ
れた英単語パタンの中部パタン符号を英単語識別に必要
な文字まで求めて1個の英単語を選定することを特徴と
する。

【００１５】

【発明の実施の形態】［第１の実施形態の説明］（１）全体構成と分割パタンメモリの構成図１は、本発明の第１の実施形態の文字認識回路の全体
構成を示す。文字認識回路は、輪郭追跡回路３００と文
字識別回路３０１からなり、輪郭追跡回路３００は分割
パタンメモリ１１０、ｘ座標追跡回路２５１、ｙ座標追
跡回路２５２、方向追跡回路２５３からなる。

【００１６】最初に分割パタンメモリ１１０の構成から
説明する。本発明の文字認識回路は、従来の文字パタン
メモリ２（図２参照）を４×４＝１６個の文字パタンメ
モリ（以後、分割メモリ１０１と称する）に分割し、そ
の１６個の分割メモリ１０１を分割パタンメモリ１１０
と総称し、その周りに文字認識用の回路を構成する。

【００１７】この分割パタンメモリ１１０を用いること
により、最大４×４の近傍画素の集合が同時に読み出さ
れるので、従来技術で述べた輪郭追跡処理における文字
パタンメモリ２のアクセス回数が軽減される。

【００１８】図２は分割パタンメモリ１１０の構成例で
あって、個別の分割メモリ１０１が４×４の２次元的に
配置され、＃０から＃１５までの番号が付されている。
１６個の分割メモリ１０１は、図３に示すように、従来
の文字パタンメモリ２全体を４×４画素から成る画素ブ
ロックの集合と考えた場合に、１個の画素ブロック内の
１６個の画素に１対１に対応している。

【００１９】すなわち、従来の文字パタンメモリ２の座
標を（ｘ，ｙ）とすると、例えば１２８×１２８画素の
文字パタン画像は、３２×３２個の４×４画素ブロック
に分割され、ｘ，ｙ各７ビットの内、上位各５ビット
Ｘ，Ｙ（計１０ビット）は画素ブロックアドレスを、下
位各２ビットｘ１ｘ０、ｙ１ｙ０を組み合わせたｙ１ｙ
０ｘ１ｘ０（４ビット数）は画素ブロック内アドレス、
すなわち分割メモリの＃０から＃１５までの番号を表し
ている。

【００２０】従来の文字パタンメモリ２のアドレス
（ｘ、ｙ）と上記分割メモリ１０１のアドレスとの関係
は、以下のように表わされる。ｘ＝４Ｘ＋（2x1+x0）＝［Ｘ，2x1+x0］ｙ＝４Ｙ＋（2y1+y0）＝［Ｙ，2y1+y0］ここで［Ｘ，x］は４Ｘ＋ｘを意味する。

【００２１】各分割メモリ１０１はＸ、Ｙ各５ビットの
アドレス端子を持ち、各々Ｘレジスタ１０２、Ｙレジス
タ１０３に共通に接続されているが、図２の構成例で
は、最左列の４個の分割メモリ＃０，＃４，＃８，＃１
２のＸアドレスＸ０はインクリメンタ１０４を通じてＸ
レジスタ１０２に接続されており、ＸまたはＸ＋１のい
ずれかの値がＸアドレス端子Ｘ０に与えられるように動
作する。

【００２２】また、最右列の４個の分割メモリ＃３，＃
７，＃１１，＃１５のＸアドレスＸ３はデクリメンタ１
０５を通じてＸレジスタ１０２に接続されており、Ｘま
たはＸ−１のいずれかの値がＸアドレス端子Ｘ３に与え
られるように動作する。

【００２３】ｙ方向についても同様に、最下行の＃０，
＃１，＃２，＃３の４個のＹ０がインクリメンタ１０６
を通じて、最上行の＃１２，＃１３，＃１４，＃１５の
４個のＹ３がデクリメンタ１０７を通じてＹレジスタ１
０３に接続されている。

【００２４】例えば、図３の（ａ）に示すように、Ｘ＝
１０，Ｙ＝７であれば、（ｘ，ｙ）＝（４０，２８）を
左下端点とする画素ブロックを指している。これは、Ｉ
ＮＣ、ＤＥＣを作動させない。すなわちＩＮＣ，ＤＥＣ
があってもＸ，Ｙをそのまま通過させる場合である。

【００２５】また、同図（ｂ）に示すように、Ｘ＝５，
Ｙ＝１１の画素ブロックの窓を右及び下に１画素分移動
して指すこともできる。これは最左列にＩＮＣ１０４を
作動させて右隣りの画素ブロックＸ＋１の最左列に移動
し、最上行にＤＥＣ１０７を作動させて下隣りの画素ブ
ロックＹ−１の最上行に移動しているからである。これ
は、分割メモリ＃３の画素の隣接画素の同時アクセスを
可能とする。

【００２６】各分割メモリ１０１は、各１ビットのデー
タ出力端子（Ｄ０からＤ１５）を持っており、この１６
ビットは同時に読み出され処理回路にかけられる。また
各分割メモリは各１ビットのデータ入力端子（Ｉ１から
Ｉ１５）を持っているが、図２では簡単のため図示して
いない。

【００２７】（２）輪郭追跡回路の構成図４は第１の実施形態の文字認識回路における、輪郭追
跡回路３００の構成を示す。分割メモリ１０１は図２と
同じ構成で、最左列と最下行にＩＮＣ（１０４と１０
６）が、最右列と最上行にＤＥＣ（１０５と１０７）が
あるが、ＩＮＣ／ＤＥＣが作動する時には点線で示すよ
うに（Ｘ，Ｙ）の隣接ブロックの画素がアクセスされる
ので、図４では、その隣接ブロックの位置に示してい
る。

【００２８】輪郭追跡回路は、輪郭線上の黒画素を反時
計回りに、以下の各レジスタを用いて追跡する。カレントポイントｘ座標：［Ｘ，cpx］カレントポイントｙ座標：［Ｙ，cpy］カレントベクトルレジスタ： cv

【００２９】文字パタンが１６個の分割メモリ１０１に
分散して記憶され、カレントポイントはその輪郭線上の
黒画素であって、その座標値は（ｃｐｙ，ｃｐｘ）の示
す分割メモリのアドレス（Ｘ，Ｙ）にある。カレントベ
クトルｃｖはカレントポイントが輪郭線上を１画素移動
する時その移動方向を示す２ビット符号であって、ｘ正
方向をｃｖ＝０、ｙ正方向をｃｖ＝１、ｘ負方向をｃｖ
＝２、ｙ負方向をｃｖ＝３とする。

【００３０】図４に示す例では、カレントポイントが
（ｃｐｙ，ｃｐｘ）＝（１，１）すなわち分割メモリ＃
５のアドレス（Ｘ，Ｙ）にある黒画素であり、カレント
ベクトルはｃｖ＝０であって、ｘ正方向（右）に進行し
ている。すなわち前ステップでカレントポイントは分割
メモリ＃４のアドレス（Ｘ，Ｙ）にあって、そのステッ
プでの輪郭線追跡の結果＃５に移動したものであり、次
にいずれの４方向に１画素移動すべきかを決めようとし
ている。

【００３１】それには、輪郭線上のカレントポイントを
四方に囲む４画素について、これらをカレントベクトル
ｃｖを基準にして右、前、左、後（これらを相対方向ｓ
ｖと呼ぶ）の順に並べた時、最初に黒画素が出現する方
向に１画素進むという規則に従う。この図では、進行方
向に対し右と前に白画素○があるので、左すなわち＃９
の黒画素●に進む。

【００３２】図５、図６、図７はこの処理を分割パタン
メモリ１１０に対して実行する輪郭追跡回路であり、図
５はｘ座標追跡回路２５１、図６はｙ座標追跡回路２５
２、図７はカレントベクトルｃｖの方向追跡回路２５３
である。これらは図４の輪郭追跡回路３００として一体
となって動作する。

【００３３】輪郭追跡回路全体を処理手順に従って分類
すると以下のようになる。まず、カレント値から相対方
向ｓｖを決定するまでの処理回路は以下の３系統の回路
（ａ），（ｂ），（ｃ）から構成される。（ａ）ｃｐｘから読み出しアドレスＸのＩＮＣ／ＤＥＣ
を制御する回路（図５）ｃｐｙから読み出しアドレスＹのＩＮＣ／ＤＥＣを制御
する回路（図６）（ｂ）ｃｐｘ及びｃｖから右、前、左、後のｃｐｘを求
める回路（図５、図７）ｃｐｙ及びｃｖから右、前、左、後のｃｐｙを求める回
路（図６、図７）（ｃ）右、前、左、後のｃｐｘとｃｐｙから４画素を選
択する回路（図７）その４画素値から、相対方向ｓｖを決定する回路（図
７）得られた相対方向ｓｖは２ビット符号で、右をｓｖ＝
０、前をｓｖ＝１、左をｓｖ＝２、後をｓｖ＝３とす
る。

【００３４】次に、相対方向ｓｖが決定してから、Ｘ，
Ｙ，ｃｐｘ、ｃｐｙ、ｃｖのネクスト値、すなわち各パ
ラメータの次に更新すべき値は以下の各回路によって求
められる。（ｄ）ｓｖとｃｖから次のｃｖの値ｎｃｖを求める回路
（図７）ｓｖと右、前、左、後のｃｐｘから次のｃｐｘの値ｎｃ
ｐｘを求める回路（図５）ｓｖと右、前、左、後のｃｐｙから次のｃｐｙの値ｎｃ
ｐｙを求める回路（図６）（ｅ）ｃｐｘとｎｃｖから次のＸの値ＮＸを求める回
路。（図５）ｃｐｙとｎｃｖから次のＹの値ＮＹを求める回路。（図
６）

【００３５】（３）輪郭追跡回路の動作次に、次に輪郭追跡回路の各部の論理構成および動作を
説明する。最初にカレントポイントの右、前、左、後の
各画素のブロックアドレスＸ，Ｙを次の回路で正しく指
す必要がある。（ａ）ｃｐｘから読み出しアドレスＸのＩＮＣ／ＤＥＣ
を制御する回路ｃｐｙから読み出しアドレスＹのＩＮＣ／ＤＥＣを制御
する回路図５で、ＸＩＮＣ１０４はｃｐｘ＝０，１，２の時Ｘ
を、ｃｐｘ＝３の時Ｘ＋１を出力し、ＸＤＥＣ１０５は
ｃｐｘ＝０の時Ｘ−１を、ｃｐｘ＝１，２，３の時Ｘを
出力するようにする。図６で、ＹＩＮＣ１０６はｃｐｙ
＝０，１，２の時Ｙを、ｃｐｙ＝３の時Ｙ＋１を出力
し、ＸＤＥＣ１０７はｃｐｙ＝０の時Ｙ−１を、ｃｐｙ
＝１，２，３の時Ｙを出力するようにする。以上でカレ
ントポイントを囲む４画素のブロックアドレスが正しく
選択される。

【００３６】次にブロック内アドレス、すなわち分割メ
モリの列番号および行番号については（ｂ）ｃｐｘおよびｃｖから右、前、左、後のｃｐｘを
求める回路ｃｐｙおよびｃｖから右、前、左、後のｃｐｙを求める
回路で以下の８個の式に従って生成する。これらは、各々の
方向に１画素だけ進んだ時、次のステップでｃｐｘおよ
びｃｐｙになるべき値である。

【００３７】右画素のcpx は npx0 = （cpx ＋ dx0）mod4 前画素のcpx は npx1 = （cpx ＋ dx1）mod4 左画素のcpx は npx2 = （cpx ＋ dx2）mod4 後画素のcpx は npx3 = （cpx ＋ dx3）mod4

【００３８】右画素のcpy は npy0 = （cpy ＋ dy0）mod4 前画素のcpy は npy1 = （cpy ＋ dy1）mod4 左画素のcpy は npy2 = （cpy ＋ dy2）mod4 後画素のcpy は npy3 = （cpy ＋ dy3）mod4

【００３９】ここで、カレントベクトルｃｖ＝０，１，
２，３を（ｘ，ｙ）成分表示すると各々（１，０），
（０，１），（−１，０），（０，−１）となるので、
これらを４通りに回転したベクトルが (dx0,dy0)=(0,-1),(1,0),(0,1),(-1,0) ９０度右回転 (dx1,dy1)=(1,0),(0,1),(-1,0),(0,-1) ０度回転 (dx2,dy2)=(0,1),(-1,0),(0,-1),(1,0) ９０度左回転 (dx3,dy3)=(-1,0),(0,-1),(1,0),(0,1) １８０度回転である。これらの回転ベクトルは、図７の４個の回転ベ
クトル発生器２２１で作られ、図５の４個の加算器２０
３および図６の４個の加算器２１３でｃｐｘまたはｃｐ
ｙに４を法として加算される。ｍｏｄ４は４で割った余
り（０，１，２，３）を示す。

【００４０】次に分割メモリを読み出し、以下の回路に
通す。（ｃ）右、前、左、後のｃｐｘとｃｐｙから４画素を選
択する回路その４画素値から、相対方向ｓｖを決定する回路

【００４１】図７の１６入力４出力マルチプレクサ２２
２で次の４画素を選ぶ。右画素 PIX0 = Ｄ［npy0*4 + npx0] 前画素 PIX1 = Ｄ [npy1*4 + npx1] 左画素 PIX2 = Ｄ［npy2*4 + npx2] 後画素 PIX3 = Ｄ [npy3*4 + npx3]

【００４２】これらを次の論理をもつ４入力２ビット出
力の優先符号化回路２２３に通す。 PIX0=1なら sv=0（右折） PIX0=0,PIX1=1なら sv=1（直進） PIX0=0,PIX1=0,PIX2=1なら sv=2（左折） PIX0=0,PIX1=0,PIX2=0,PIX3=1なら sv=3（後退） PIX0=0,PIX1=0,PIX2=0,PIX3=0なら sv=1（白領域直
進）以上で相対進行方向ｓｖが決定する。最初に輪郭線に到
達するまでは白領域を直進するものとする。

【００４３】（ｄ）ｓｖとｃｖから次のｃｖの値ｎｃｖ
を求める回路ｓｖと右、前、左、後のｃｐｘから次のｃｐｘの値ｎｃ
ｐｘを求める回路ｓｖと右、前、左、後のｃｐｙから次のｃｐｙの値ｎｃ
ｐｙを求める回路は、次のように働く。

【００４４】ｎｃｖは図７で、１の減算器２２４と加算
器２２５を用いて次式で求める。 ncv = （cv ＋ sv - 1）mod4

【００４５】ｎｃｐｘは図５の２ビット数の４入力１出
力マルチプレクサ２０４で、ｎｃｐｙは図６の２ビット
数の４入力１出力マルチプレクサ２０５を用いて、例え
ばｓｖ＝０ならば、ｎｃｐｘ＝ｎｐｘ０、ｎｃｐｙ＝ｎ
ｐｙ０となるように選ぶ。ｎｃｖは図５、図６でＮＸ、
ＮＹの決定にも使用される。

【００４６】最後に（ｅ）ｃｐｘとｎｃｖから次のＸの値ＮＸを求める回
路。ｃｐｙとｎｃｖから次のＹの値ＮＹを求める回路。ＮＸはｃｐｘ＝３，ｎｃｖ＝０の時Ｘ＋１、ｃｐｘ＝
０，ｎｃｖ＝２の時Ｘ−１、それ以外の時Ｘとなる。Ｎ
Ｙはｃｐｙ＝３，ｎｃｖ＝１の時Ｙ＋１、ｃｐｙ＝０，
ｎｃｖ＝３の時Ｙ−１、それ以外の時Ｙとなる。

【００４７】以上のように、輪郭追跡回路は、文字パタ
ンの輪郭追跡に必要なカレントポイントの４方向に隣接
する４画素を１６個の分割メモリから同時に読み出し、
カレントポイントのｘ座標、ｙ座標および進行方向ｃｖ
から組み合わせ回路により相対進行方向ｓｖを決定す
る。またこれらのｘ座標、ｙ座標および進行方向ｃｖの
ネクスト値を相対進行方向ｓｖを用いた組み合わせ回路
により求める。

【００４８】（４）文字識別回路の構成図８は、文字識別回路３０１の構成を示す。文字識別回
路３０１は、輪郭追跡回路３００からステップ毎に生成
される現在点（カレントポイント）の座標値ｘ、ｙを入
力し、現在点の１ステップ前の点の座標値ｐｘ，ｐ
ｙ、を記憶するレジスタ３０２，３０３、現在点のＴ＝
４ステップ前の点の座標値ｐ４ｘ，ｐ４ｙを記憶するレ
ジスタ３０４，３０５、仮極点（仮極小または仮極大）
の座標値ｍｘ、ｍｙを記憶するレジスタ３０６，３０
７、仮極点のＴ＝４ステップ前の点の座標値ｌｘ、ｌｙ
を記憶するレジスタ３０８，３０９、極大点における凹
凸を判別する回路３１０、検出された全ての極小点およ
び極大点の座標値ｑｘ，ｑｙ、極大点における凹凸、お
よび極大点から次の極小点までの下降スイング及びその
タイプを記憶する極点メモリ３１１、ｐｙとｙの大小比
較器３１２、その比較結果を監視するｙ座標増減監視器
３１３、ｍｙに０、ｈ、−ｈのいずれかを加算する加算
器３１４加算器３１４出力とｙの大小比較を行う比較器
３１５、その比較結果を監視する区間監視器３１６から
なる。

【００４９】以上の回路で文字識別情報を収集し、識別
部317で文字を識別する。なお、Ｔとｈは可変の定数で
あり、例えばＴ＝４，ｈ＝３とする。

【００５０】この文字識別回路３０１は、本実施形態で
は、活字体の英小文字「ａ，ｃ，ｅ，ｍ，ｎ，ｏ，ｒ，
ｓ，ｕ，ｖ，ｗ，ｘ，ｚ」の１３文字のみを識別対象と
する。本実施形態で特に文字を限定する理由は、第２の
実施形態の英単語認識処理でこの１３文字の識別機能を
利用するからである。従って、分割パタンメモリ１１０
にはこの１３文字のいずれか１個の活字体の文字パタン
が入力されるものとする。

【００５１】（５）文字識別回路の動作ここでは、ｘ軸正方向は右とし、ｙ軸正方向は上とす
る。認識対象の文字パタンは外側輪郭線を１個だけもっ
ており、その外接枠がすでに求められているものとす
る。外接枠の左下頂点よりやや上方の点からｘの正方向
に初めて黒画素に出会う点を輪郭線追跡処理の開始点と
する。

【００５２】現在点が輪郭線に沿って反時計回りに一周
した時、そのｙ座標の変化すなわち輪郭線の上下方向の
変化に着目し、その特徴を捉えて文字を識別する。それ
には、ｙ方向に関する極大、極小点を検出し、それらに
よって輪郭線を下降稜線（または下降スイング）と上昇
稜線（上昇スイング）に分割する。

【００５３】輪郭追跡回路を作動させると、現在点
（ｘ、ｙ）は反時計回りに進行し、一周して開始点に戻
る。１画素進行することをステップと呼び、ｔステップ
進行したときの現在点座標をｔの関数として、ｘ
（ｔ）、ｙ（ｔ）で表わす。一周する間に上下の移動変
化が例えば６回あったとすれば次のようになる。

【００５４】ｔの増加に従ってＣＰは最初は下方に進み
ｙ座標が減少し、頂点（第１極小点）で減少または水平状態から増加に
変わり、頂点（第１極大点）で増加または水平状態から減少に
変わり、頂点（第２極小点）で減少または水平状態から増加に
変わり、頂点（第２極大点）で増加または水平状態から減少に
変わり、頂点（第３極小点）で減少または水平状態から増加に
変わり、頂点（第３極大点）で増加または水平状態から減少に
変わり、最後に開始点に戻る。

【００５５】基本的には、ステップ毎のｙ座標の変化ｄ
ｙ＝ｙ（ｔ）−ｙ（ｔ−１）を監視すればこの６個の極
点の座標が求められる。すなわち dy＝ｙ(t)−ｙ(t-1)＝ｙ−py ＝ −１ならｙ減少 dy＝ｙ(t)−ｙ(t-1)＝ｙ−py ＝１ならｙ増加 dy＝ｙ(t)−ｙ(t-1)＝ｙ−py ＝０なら水平状態であるから、比較器３１２でｙ−ｐｙの符号を見て極
小、極大の条件が発生する度に増減監視器３１３が現在
点（ｘ、ｙ）の値を極点メモリ３１１に格納して行けば
よい。しかし、文字パタンがノイズを持っている場合、
輪郭線の細かい凹凸を大局的な極小極大と誤認するおそ
れがある。

【００５６】これを避けるために、ノイズの凹凸を包み
込むだけの幅の行数ｈ（ヒステリシス）を用いる。極小
極大の条件が成立した場合でも極点メモリ３１１に直ち
に格納せず、（ｘ，ｙ）を一旦仮極点レジスタｍｘ（３
０６），ｍｙ（３０７）に保持する。この時、ｘ（ｔ−
Ｔ）及びｙ（ｔ−Ｔ）をｌｘ（３０８）及びｌｙ（３０
９）レジスタに保持しておく。

【００５７】（ｌｘ、ｌｙ）は仮極点よりＴステップ以
前の点の座標であり、後述の凹凸判定用いる。以上のレ
ジスタ保持動作は、増減監視器３１３から出力される仮
極点検出パルス３１８によって同時に実行される。

【００５８】図９は輪郭線追跡のフローチャートを示
す。入り口３２１から開始し、最初に現在点は下降（ｙ
減少）状態にあるものと仮定し第１極小点を検出する
ために、仮極小検出３２２を実行する。ｙ増加が発生す
ると仮極小点保持処理３２３が実行され、仮極小状態で
（真の）極小検出処理３２４を実行する。

【００５９】極小検出処理３２４では、仮極小点のｙ座
標ｍｙとこれよりｈだけ上がった座標ｍｙ＋ｈの間の区
間 my ＜ｙ＜ my +ｈを現在点のｙ座標が超えるかどうかを監視する。極小検
出３２４では、現在点（ｘ、ｙ）が更新される度にｙ−
ｍｙの比較演算とｙ−ｍｙ−ｈの比較演算を比較器３１
５で引き続いて行い、（比較器３１５を２個使えば同時
に可能である）ｙ＝ｍｙならば処理３２６で仮極小を取
り消し、再び仮極小探索３２２に戻る。ｙ＝ｍｙ＋ｈな
らば処理３２７で仮極小を（真の）極小と確定し、極
点メモリに格納し、仮極大検出３３２に移る。ｍｙ＜ｙ
＜ｍｙ＋ｈならば極小検出３２４を続ける。

【００６０】第１極小点が確定すると、上昇モードに
移り、第１極大点の探索を行う。増減監視器３１３
は、仮極大検出処理３３２を実行し、ｙ減少が発生する
と仮極大点として仮極点検出パルス３１８によって現在
点をｍｘ、ｍｙにロードする。

【００６１】極大検出処理３３４では現在点（ｘ、ｙ）
が更新される度にｙ−ｍｙの比較演算とｙ−ｍｙ＋ｈの
比較演算を比較器３１５で行い、ｙ＝ｍｙならば処理３
３６で仮極大を取り消し、再び仮極大探索３３２に戻
る。ｙ＝ｍｙ―ｈならば処理３３７で仮極大を（真の）
極大と確定し、極点メモリに格納し、仮極小探索３２２
に移る。ｍｙ−ｈ＜ｙ＜ｍｙならば極大検出３３４を続
ける。

【００６２】極大を確定した場合は、凹凸判別回路３１
０が処理３３８で lx＜mx＜ｘ（ｘ増加）ならば凹 lx＞mx＞ｘ（ｘ減少）ならば凸それ以外の場合はＤ＝（my−ly）（ｘ−mx）＋（my−ｙ）（mx−lx）の符号を判定し、正ならば凹、負ならば凸とし、凹凸の
結果（１ビット）を極点メモリ３１１に格納する。Ｄ＝
０ならさらに詳細に調べる必要がある。Ｔの値を大き目
にとって（ｍｘ，ｍｙ）と（ｌｘ，ｌｙ）の距離を離せ
ばＤ＝０になり難い。

【００６３】こうして第１極大点が求められ、以上の
処理を繰り返して、及び、が求められ、一周し
て第１極小点に戻ったら、処理３３９で、各々の極大点
から次の極小点までのｙ座標の変化量（下降スイング）
を求めるとともに、その下降スイングが文字枠の下部で
起きたか、上部で起きたか、フルスイングに近いかとい
ったスイングタイプを求め、極点メモリの極小点位置に
書込む。図１０に極点メモリに求められたデータ構造を
示す。

【００６４】次に、極大点列Ｖ２、Ｖ４、Ｖ６、
・・・における凹凸の系列と下降スイングＶ２Ｖ３，Ｖ
４Ｖ５，Ｖ６Ｖ１，…におけるスイングタイプの系列を
調べ、文字を判別する。図１１、図１２、図１３にアル
ファベット１３文字の２０通りの変化パタンについて、
外輪郭線の極大極小点と下降スイングを示す。特に図１
３には、極大点の凹凸の系列と、スイングタイプの系列
を記す。スイングタイプは例えば次のように定める。

【００６５】上部：文字枠内の上部3分の１の範囲内にある中部：文字枠内の中部３分の1の範囲内にある下部：文字枠内の下部３分の１の範囲内にある上半：文字枠内の上半分の範囲内にある下半：文字枠内の下半分の範囲内にあるフル：上記のいずれにも当てはまらない

【００６６】図１４は、これらの文字を識別するために
有効な特徴情報を１６ビット１語で表わした特徴ベクト
ルを示す。アルファベット１３種類の文字の２３通りの
変化パタンについて、１６個の条件の当てはまる特徴を
１、当てはまらない特徴は０としている。「×」はドン
トケアである。

【００６７】第１極大点が「左部か」という特徴は、極
大点個数が１の時のみ、「ｏ」と「ｚ」を判別するため
に使われる。また、第１下降スイングが「下部」の範囲
を超える可能性があるものは「×」とし、代わりに「下
半」を使用する。「ｓ」の飾りのように振れ幅の小さい
下降スイングがヒシスリシスｈの中で消滅したり、
「ｅ，ｚ」のように、水平線が傾いてｈを超え、新たな
下降スイングが発生することもあるので、可能性のある
変化パタンを揃えて正しく判別できるようにする。

【００６８】図１５は、この中から幾つかの特徴を順序
づけて使って文字を識別するフローチャートである。こ
こでは第１極大点の凹凸判別３４１と、第１下降スイ
ングＶ２Ｖ３の２個の判別処理３４２および３４９で、
１９種類の文字パタンを４：７：５：３に均等に近い分
類をしており、その下段の判定処理３４３、３４５、３
５１、３５０等でもそれぞれ均等に近い分類をしてい
る。入力パタンの条件によって最小限の特徴を調べれば
よいので、効率的に識別できる。文字が判定できた後
は、特徴ベクトルあるいは極点メモリを参照して検証す
る。

【００６９】以上説明したように、本実施形態の分割パ
タンメモリ及び輪郭追跡回路を用いれば、文字パタンの
輪郭追跡に必要なカレントポイントに隣接する４画素が
１６個の分割メモリから常に読み出されて利用できるの
で、カレントポイントのｘ座標、ｙ座標および進行方向
ｃｖから組み合わせ回路により相対進行方向ｓｖを決定
できる。

【００７０】またこれらのｘ座標、ｙ座標および進行方
向ｃｖの次の値を相対進行方向ｓｖを用いた組み合わせ
回路により求めることができる。従って、１クロックで
１画素の速度で輪郭線を追跡することができ、輪郭追跡
処理が高速化できる。

【００７１】また、本実施形態の文字識別回路を用いれ
ば、辞書を用いずに、簡単な論理で一定個の文字が識別
できるので、容易かつ迅速に文字が識別できる。これ
は、本実施形態では印刷体の特定の２０個程度の文字パ
タンに限定し、これらの文字を識別する有効な特徴を用
いたためである。

【００７２】文字識別回路の内部には、輪郭線の点列を
全て格納する必要がなく、極大極小のみを一時的に記憶
すればよいので、メモリ量とそれを操作する処理量が少
なくて済む。

【００７３】本実施形態では、認識対象を第２実施形態
で述べる「中部パタン文字」に限定したが、それ以外の
英文字として、たとえば「中部パタン以外の英小文
字」、「数字」、や「英大文字」にそれぞれ対象を特化
した文字識別回路を構成することもできる。

【００７４】これらの文字識別回路を併用すれば、高性
能な英文認識装置が構成できる。また、分割パタンメモ
リでは、認識対象を１文字に限定したが、１つの英単語
全体あるいは英文の一部を１６分割されたパタンメモリ
に格納することもできる。これは、Ｘアドレスのビット
数を増加させればよく、同じ文字認識回路で連続する複
数の文字が認識できる。

【００７５】［第２の実施形態の説明］（１）構成の説明図１６は本発明の第２の実施形態の英単語認識方法のフ
ローチャートである。第２の実施形態の英単語認識方法
は、英文中の活字英単語を認識対象とし、文字単位の認
識をするのではなく、単語全体のパタンに含まれ、容易
に解析できる特徴を用いて単語集合を分類し、その分類
された単語集合の中で、文字単位の認識によってさらに
細かく分類しようとするものである。

【００７６】図１６の処理開始時には、英単語パタンが
切り出され、入力されたものとする。構成文字が大文字
であれば先に認識しておく必要がある。またピリオド、
カンマ等の記号も分離して、小文字だけからなる単語パ
タンが得られたところから開始する。

【００７７】処理４０１で、英単語パタンを囲む矩形枠
を２本の水平基準線によって、上部パタン、中部パタ
ン、下部パタンの３個のパタンに分割する。この内、中
部パタンは、単語の全構成文字のパタンで満たされてい
るが、上部パタンおよび下部パタンは疎らなパタンとな
るか空の場合もある。

【００７８】図１７（ａ）はアルファベット小文字２６
文字の内、上部パタンをもつ９文字を上部パタンの形状
により４種類に分類し、その種類を表す符号として０か
ら３までの数値を割り当てたものである。すなわち、文
字「ｉ」「ｊ」には０、文字「ｂ」「ｄ」「ｈ」「ｋ」
「ｌ」には１、文字「ｔ」には２、文字「ｆ」には３の
上部パタン符号を割り当てる。

【００７９】処理４０２は、英単語の上部パタン全体の
水平周辺分布及び局所的垂直分布から各文字の上部パタ
ンを識別する処理である。処理４０３は、その結果を用
いて英単語の上部パタン符号を求める処理である。

【００８０】それには、英単語中に現れるこれらの文字
のパタン符号の可変長の列によって英単語の上部パタン
符号を定義する。図１９（ａ）に例示する英単語「ｉｎ
ｆｏｒｍａｔｉｏｎ」の場合、「ｉ」「ｆ」「ｔ」
「ｉ」の文字上部パタン符号を用いて０３２０と表さ
れる。これに文字上部パタン検出個数の４を前置して、
４０３２０を英単語上部パタン符号とする。

【００８１】また、図１７（ｂ）は下部パタンをもつ５
文字を下部パタンの形状により３種類に分類し、文字下
部パタン符号として０、１、２を割り当てたものであ
る。すなわち、文字「ｊ」「ｙ」には０、文字「ｐ」
「ｑ」には１、文字「ｇ」には２の下部パタン符号を割
り当てる。

【００８２】処理４０４は、英単語の下部パタン全体の
水平周辺分布及び局所的垂直分布から各文字の下部パタ
ンを識別する処理である。処理４０５は、その結果を用
いて英単語の下部パタン符号を求める処理である。

【００８３】図１９（ｂ）に例示する英単語「ｊｕｍｐ
ｉｎｇ」の場合、検出個数と「ｊ」「ｐ」「ｇ」の下部
パタン符号とから「３０１２」が英単語下部パタン符号
である。

【００８４】処理４０６は、英単語認識用辞書を英単語
の上部パタン符号及び下部パタン符号によって索引し、
上下パタン符号の同じ英単語候補の集合を求める。

【００８５】処理４０７で、英単語候補が１個ならば、
それが求める英単語であるとして処理４１０で検証の上
決定する。

【００８６】英単語候補が複数の場合には、処理４０８
でさらに中部パタン符号によって英単語候補集合の内部
を索引できる。

【００８７】中部パタン符号は図１８に示すように、上
下部パタンを持たない１３個の文字にアルファベット順
に０から１２までの数字を割り当てたものである。英単
語中に現れるこれらの文字の出現個数と中部パタン符号
の可変長の列によって英単語の中部パタン符号を定義す
る。

【００８８】英単語識別用辞書を作成するには、認識対
象の全単語の上部、下部、及び中部パタン符号を用いて
この順に検索できるようにしておく。中部パタンについ
ては、アルファベット順に分類してもよい。また、中部
パタンの１文字のみあるいは文字数を用いて候補単語集
合ができるだけ均等に分類されるようにしておけば、効
率的に索引できる。

【００８９】処理４０８では、英単語辞書を索引するだ
けであるから、辞書中で指定された中部パタンの１文字
のみあるいは文字数を認識し、その認識結果を用いて候
補単語を絞り込む。

【００９０】この分類キーとなる文字による絞り込みを
繰り返して英単語を決定し、最終的に英単語の構成文字
列を得る。上部、下部、中部パタン全てが同じ複数の単
語があれば、全文字を識別して単語を決定する。

【００９１】中部パタン符号は、文字単位の認識を伴う
ものであるから、いかなる方法で認識してもよいが、こ
の文字認識の性能は、上下パタンの認識処理および辞書
検索の性能に見合った高性能なものである必要がある。
そこで、前述した第１の実施形態の輪郭線による文字識
別回路を用いる。

【００９２】（２）動作の説明ここでは、上部パタンと中部パタンの識別方法と辞書の
構成方法を述べる。英単語の上部パタンは、まず全体の
水平周辺分布を求める。図１９（ａ）に「ｉｎｆｏｒｍ
ａｔｉｏｎ」の上部パタンの水平周辺分布を示す。これ
は英単語上部パタンの各水平位置で垂直方向に何個の黒
画素があるかを示す。この例では上部パタンをもつ文字
「ｉ」「ｆ」「ｔ」「ｉ」の水平位置に黒画素があるの
で、４個所に文字上部パタンの水平周辺分布が現れる。

【００９３】水平周辺分布を左から右に向かって連続す
る非零区間として文字上部パタンを検出する。各々の文
字上部パタンに対して、その局所的な垂直周辺分布を求
める。これは１個の文字上部パタンの各垂直位置で水平
方向に何個の黒画素があるかを計数することによって求
められる。図１９（ａ）にこうして求めた４個の局所的
垂直周辺分布を示す。右側の「ｂ」は参考である。

【００９４】水平周辺分布と局所的垂直周辺分布の形状
から文字上部パタンの種類（符号）を求める。文字上部
パタンは４種類しかないので、これらは容易に判別でき
る。

【００９５】上部パタンの判別方法は、水平周辺分布が
最大値Ｈ１付近に達するかどうかで、達しなければパタ
ン符号が「０」または「２」、達すれば「１」または
「３」であり、垂直周辺分布が下部付近に零区間（黒点
がない区間）をもてばパタン符号を「０」とする。ま
た、パタン符号が「１」と「３」では、水平周辺分布が
最大値をとる水平位置が非零区間の左端付近にあれば
「３」とする。

【００９６】英小文字「ｆ」はその右側の文字と重なっ
て印刷されることもあるが、その場合の判別方法は、左
側の「ｆ」の文字パタンが既知としてそれを除去して黒
点を白点に変え、残りの文字上部パタンの両周辺分布を
再度求めて判別する。

【００９７】中部パタン符号は中部パタンのみを持つ文
字の個数とその識別符号を左から右に向かって並べたも
のである。図２０の「ｉｎｆｏｒｍａｔｉｏｎ」では、
「ｎｏｒｍａｏｎ」を識別符号で「４５６３０５４」と
表わし、中部パタン文字数「７」を前置して、「７４５
６３０５４」が中部パタン符号となる。

【００９８】中部パタンの具体的な求めかたは、まず英
単語の中部パタンから、上部パタンを持つ文字と下部パ
タンを持つ文字の中部パタンを除去あるいは無視する。
その残りの英単語中部パタンに対して、左から順に各文
字パタンを切り出して、認識して行けばよい。

【００９９】この中部パタンの認識に、第１の実施形態
で述べた文字認識回路を用いる。すなわち、図１の文字
認識回路の分割パタンメモリ１１０に、中部パタンの最
初の文字「ｎ」の文字パタンを入力する。文字の切り出
しによって外接枠はすでに分かっているので、外側輪郭
線の追跡を実行し、その処理結果である極点メモリの内
容から１３文字の識別ができるから、文字「ｎ」と認識
でき、文字識別コード「４」を出力する。

【０１００】この文字認識回路による処理を７回実行す
れば、「ｉｎｆｏｒｍａｔｉｏｎ」の中部パタン符号
「７４５６３０５４」が求められる。図２０には、同じ
上部パタン符号をもつ他の２単語のパタンと中部パタン
符号を示す。

【０１０１】図２１に辞書の索引方法を示す。ここでは
簡単のため下部パタンは無いものとする。英単語辞書は
文字上部パタン数を第１キーとして分類され、以降はそ
のパタン数の段数まで上部パタンをキーとして分類され
ている。

【０１０２】それ以降は中部パタンで分類される。上部
パタン数が０または１では候補数が膨大であるので、中
部パタン数または第1中部パタンをキーとして大分類さ
れる。構成文字数の少ない単語は結局、中部パタンの全
文字を使って分類されるが、その中部パタンは第1の実
施形態の文字認識回路で高速に認識される。

【０１０３】構成文字数の多い英単語は上部パタンで少
数の英単語にしぼられるので、それ以降は、候補文字の
決定に最も有効なキー文字を選ぶ。上部パタン符号「４
０３２０」の英単語候補は３個に絞られており。中部パ
タン符号でこれらを識別するには、中部パタン文字数あ
るいは第２番目の文字をキーとして識別すれば英単語が
決定できる。

【０１０４】以上説明したように、本実施形態の英単語
認識方法を用いれば、上部パタン、下部パタンという、
英単語の本体から上下にはみ出した部分を検出して、英
単語全体を認識するので、従来方法における、文字を個
別に切り出して認識するという手順が省略でき、特に構
成文字数の長い英単語の認識処理時間が短縮する。

【０１０５】上部・下部パタンは、水平周辺分布と局所
的垂直周辺分布の解析で容易かつ一意的に求められ、英
単語認識用辞書全体が、これらパタン符号によって重複
なく分類されるので、パタン照合でなく索引によって英
単語候補が絞り込める。

【０１０６】中部パタンに関しては、文字を個別に切り
出して認識することに成るが、それは本発明の文字認識
回路を用いて中部パタン文字を認識することによって従
来より高速に認識でき、高性能な英単語認識装置が実現
できる。

【０１０７】尚、本発明は前述の実施形態に限定される
ものではなく、本発明の趣旨に基づいて種々の応用が可
能である。例えば、本発明の文字認識回路は、論理回路
で文字を識別できるので、モジュール化して、マイクロ
プロセッサやイメージセンサに組み込むのに適してい
る。また、本発明の英単語認識方法は、英文認識を高速
に実行できるので、書物のデータベース化に利用した
り、音声対話システムや通信システムへ接続できる。

【０１０８】

【発明の効果】以上、詳細に説明したように、本発明の
文字認識回路によれば、各々が文字パタン画像の座標ｘ
および座標ｙの２方向に４画素毎に離散する画素を記憶
し、４×４のマトリクス状に配置された分割メモリと、
当該１６個の分割メモリのアドレスを指定するＸレジス
タおよびＹレジスタと、前記４×４マトリクスの最左
列、最右列、最下行、最上行に位置する各４個の分割メ
モリ内部に備えられ、前記ＸレジスタまたはＹレジスタ
に０，１，−１のいずれかを加算した値を供給し得るア
ドレス修飾器と、前記文字パタンの輪郭線に沿って１画
素単位に進行する現在点のｘ座標、ｙ座標および進行方
向ｃｖを保持するレジスタと、前記１６個の分割メモリ
から当該進行方向ｃｖを基準として右、前、左、後の４
方向に隣る４画素値を参照し、当該４画素値を用いて前
記進行方向ｃｖ、前記現在点のｘ座標、ｙ座標を更新す
る輪郭線追跡回路とを有する構成としたので、文字パタ
ンの輪郭追跡に必要なカレントポイントに隣接する４画
素が１６個の分割メモリから常に読み出されて利用でき
るので、カレントポイントのｘ座標、ｙ座標および進行
方向ｃｖから組み合わせ回路により相対進行方向ｓｖを
決定できる。またこれらのｘ座標、ｙ座標および進行方
向ｃｖの次の値を相対進行方向ｓｖを用いた組み合わせ
回路により求めることができる。従って、１クロックで
１画素の速度で輪郭線を追跡することができ、輪郭追跡
処理が高速化できる。

【０１０９】また、本発明の英単語認識方法によれば、
活字体の英小文字「ａ」より「ｚ」までの２６文字を構
成要素とする英単語パタンを２本の水平分割線によって
上部パタン、中部パタン、下部パタンに分割し、当該上
部パタンの水平周辺分布及び局所的垂直分布より、
「ｉ，ｊ」の上部「ｂ，ｄ，ｈ，ｋ，ｌ」の上部、
「ｔ」の上部、「ｆ」の上部の少なくとも４種類に分類
した文字上部パタンを全て検出し、当該上部パタンの検
出個数及び当該種類を示す符号を当該検出順序で並べた
英単語文字上部パタン符号を求め、前記下部パタンの水
平周辺分布及び局所的垂直分布より、「ｊ，ｙ」の下
部、「ｐ，ｑ」の下部、「ｇ」の下部の少なくとも３種
類に分類した文字下部パタンを全て検出し、当該下部パ
タンの検出個数及び当該種類を示す符号を当該検出順序
で並べた英単語文字下部パタン符号を求め、前記英単語
の中部パタンのみを持つ文字「ａ，ｃ，ｅ，ｍ，ｎ，
ｏ，ｒ，ｓ，ｕ，ｖ，ｗ，ｘ，ｚ」は、当該文字の外側
輪郭線の追跡処理を行い、進行方向のｙ成分が反転する
頂点の個数、座標値及び凹凸の推移に関する特徴を用い
て１３文字に識別し、当該文字の検出個数及び識別符号
を当該検出順序で並べた英単語中部パタン符号を求め、
認識対象の全ての英単語を、前記英単語上部パタン符
号、英単語下部パタン符号、英単語中部パタン符号を用
いて分類した英単語認識用辞書を予め作成し、入力され
た英単語パタンより前記英単語の上部および下部パタン
符号を求め、当該両パタン符号により前記英単語認識用
辞書を索引して１個以上の英単語候補を選定し、当該英
単語候補が複数個ある場合は、当該入力された英単語パ
タンの中部パタン符号を英単語識別に必要な文字まで求
めて1個の英単語を選定する構成とし、上部パタン、下
部パタンという、英単語の本体から上下にはみ出した部
分を検出して、英単語全体を認識するので、従来方法に
おける、文字を個別に切り出して認識するという手順が
省略でき、特に構成文字数の長い英単語の認識処理時間
が短縮する。この上部・下部パタンは、水平周辺分布と
局所的垂直周辺分布の解析で容易かつ一意的に求めら
れ、英単語認識用辞書全体が、これらパタン符号によっ
て重複なく分類されるので、パタン照合でなく索引によ
って英単語候補が絞り込める。中部パタンに関しては、
文字を個別に切り出して認識することに成るが、それは
本発明の文字認識回路を用いて中部パタン文字を認識す
ることによって従来より高速に認識でき、高性能な英単
語認識装置が実現できる。

【図面の簡単な説明】

【図１】第１の実施形態の構成を示す文字認識回路であ
る。

【図２】分割パタンメモリの構成図である。

【図３】画素ブロックとアクセスパタンの説明図であ
る。

【図４】輪郭追跡回路の構成図である。

【図５】ｘ座標追跡回路の構成図である。

【図６】ｙ座標追跡回路の構成図である。

【図７】方向追跡回路の構成図である。

【図８】文字識別回路の構成図である。

【図９】輪郭追跡のフローチャートである。

【図１０】極点メモリのデータ構造を示す図である。

【図１１】各文字の極大極小点と下降スイングの例を示
す図である。

【図１２】各文字の極大極小点と下降スイングの例を示
す図である。

【図１３】各文字の極大極小点と下降スイングの例を示
す図である。

【図１４】特徴ベクトルの一例を示す図である。

【図１５】文字識別フローチャートである。

【図１６】第２の実施形態における英単語認識方法を示
すフローチャートである。

【図１７】文字の上部・下部パタンの符号化の説明図で
ある。

【図１８】文字の中部パタンの符号化の説明図である。

【図１９】上部・下部パタンの周辺分布の説明図であ
る。

【図２０】同じ上部パタン符号を持つ英単語の一例を示
す図である。

【図２１】辞書の索引方法の説明図である。

【図２２】従来の文字認識回路の構成を示す図である。

【図２３】文字パタンと水平周辺分布の例を示す図であ
る。

【符号の説明】

１０２Ｘレジスタ１０３Ｙレジスタ１１０分割パタンメモリ２５１ｘ座標追跡回路２５２ｙ座標追跡回路２５３方向追跡回路３００輪郭追跡回路３０１文字識別回路

Claims

【特許請求の範囲】

【請求項１】各々が文字パタン画像の座標ｘおよび座
標ｙの２方向に４画素毎に離散する画素を記憶し、４×
４のマトリクス状に配置された分割メモリと、当該１６個の分割メモリのアドレスを指定するＸレジス
タおよびＹレジスタと、前記４×４マトリクスの最左列、最右列、最下行、最上
行に位置する各４個の分割メモリ内部に備えられ、前記
ＸレジスタまたはＹレジスタに０，１，−１のいずれか
を加算した値を供給し得るアドレス修飾器と、前記文字パタンの輪郭線に沿って１画素単位に進行する
現在点のｘ座標、ｙ座標および進行方向ｃｖを保持する
レジスタと、前記１６個の分割メモリから当該進行方向ｃｖを基準と
して右、前、左、後の４方向に隣る４画素値を参照し、
当該４画素値を用いて前記進行方向ｃｖ、前記現在点の
ｘ座標、ｙ座標を更新する輪郭線追跡回路とを有するこ
とを特徴とする文字認識回路。
【請求項２】予め定めた文字集合の各文字パタンの輪
郭線の進行方向の垂直（ｙ）成分が反転する頂点の座標
値と凹凸に関する特徴を記憶し、前記輪郭線追跡回路の
処理結果から求めた当該特徴と照合して文字を識別する
文字識別回路を有することを特徴とする請求項１に記載
の文字認識回路。
【請求項３】前記文字集合が活字体の英小文字集合
「ａ，ｃ，ｅ，ｍ，ｎ，ｏ，ｒ，ｓ，ｕ，ｖ，ｗ，ｘ，
ｚ」であって、文字の外側輪郭線の追跡処理において、
進行方向のｙ成分が反転する頂点の個数、当該頂点間の
ｙ座標の変化、当該頂点の凹凸に関する特徴を用いて文
字を識別する文字識別回路を有することを特徴とする請
求項２に記載の文字認識回路。
【請求項４】活字体の英小文字「ａ」より「ｚ」まで
の２６文字を構成要素とする英単語パタンを２本の水平
分割線によって上部パタン、中部パタン、下部パタンに
分割し、当該上部パタンの水平周辺分布及び局所的垂直分布よ
り、「ｉ，ｊ」の上部「ｂ，ｄ，ｈ，ｋ，ｌ」の上部、
「ｔ」の上部、「ｆ」の上部の少なくとも４種類に分類
した文字上部パタンを全て検出し、当該上部パタンの検
出個数及び当該種類を示す符号を当該検出順序で並べた
英単語文字上部パタン符号を求め、前記下部パタンの水平周辺分布及び局所的垂直分布よ
り、「ｊ，ｙ」の下部、「ｐ，ｑ」の下部、「ｇ」の下
部の少なくとも３種類に分類した文字下部パタンを全て
検出し、当該下部パタンの検出個数及び当該種類を示す
符号を当該検出順序で並べた英単語文字下部パタン符号
を求め、前記英単語の中部パタンのみを持つ文字「ａ，ｃ，ｅ，
ｍ，ｎ，ｏ，ｒ，ｓ，ｕ，ｖ，ｗ，ｘ，ｚ」は、当該文
字の外側輪郭線の追跡処理を行い、進行方向のｙ成分が
反転する頂点の個数、座標値及び凹凸の推移に関する特
徴を用いて１３文字に識別し、当該文字の検出個数及び
識別符号を当該検出順序で並べた英単語中部パタン符号
を求め、認識対象の全ての英単語を、前記英単語上部パタン符
号、英単語下部パタン符号、英単語中部パタン符号を用
いて分類した英単語認識用辞書を予め作成し、入力された英単語パタンより前記英単語の上部および下
部パタン符号を求め、当該両パタン符号により前記英単
語認識用辞書を索引して１個以上の英単語候補を選定
し、当該英単語候補が複数個ある場合は、当該入力された英
単語パタンの中部パタン符号を英単語識別に必要な文字
まで求めて１個の英単語を選定することを特徴とする英
単語認識方法。