JP2000113112A - 文字認識回路および英単語認識方法 - Google Patents
文字認識回路および英単語認識方法Info
- Publication number
- JP2000113112A JP2000113112A JP10278088A JP27808898A JP2000113112A JP 2000113112 A JP2000113112 A JP 2000113112A JP 10278088 A JP10278088 A JP 10278088A JP 27808898 A JP27808898 A JP 27808898A JP 2000113112 A JP2000113112 A JP 2000113112A
- Authority
- JP
- Japan
- Prior art keywords
- character
- pattern
- english word
- circuit
- coordinate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Landscapes
- Character Discrimination (AREA)
Abstract
(57)【要約】
【課題】 文字認識の輪郭追跡処理において、処理対象
の複数画素を同時に読み出せるような文字パタンメモリ
の構成方法を提供し、読み出した複数画素を処理する輪
郭追跡回路を用いて文字認識回路を構成し、またこれを
利用した高性能な英単語認識方法を提供する 【解決手段】 文字パタンの輪郭追跡に必要なカレント
ポイントに隣接する4画素が16個の分割メモリから常
に読み出されて利用できるので、カレントポイントのx
座標、y座標および進行方向cv201から組み合わせ
回路により相対進行方向svを決定できる。またこれら
のx座標、y座標および進行方向cvの次の値を相対進
行方向svを用いた組み合わせ回路により求めることが
できる。従って、1クロックで1画素の速度で輪郭線を
追跡することができ、輪郭追跡処理が高速化できる。
の複数画素を同時に読み出せるような文字パタンメモリ
の構成方法を提供し、読み出した複数画素を処理する輪
郭追跡回路を用いて文字認識回路を構成し、またこれを
利用した高性能な英単語認識方法を提供する 【解決手段】 文字パタンの輪郭追跡に必要なカレント
ポイントに隣接する4画素が16個の分割メモリから常
に読み出されて利用できるので、カレントポイントのx
座標、y座標および進行方向cv201から組み合わせ
回路により相対進行方向svを決定できる。またこれら
のx座標、y座標および進行方向cvの次の値を相対進
行方向svを用いた組み合わせ回路により求めることが
できる。従って、1クロックで1画素の速度で輪郭線を
追跡することができ、輪郭追跡処理が高速化できる。
Description
【0001】
【発明の属する技術分野】この発明は、文字認識回路及
び英単語認識方法に関し、特に印刷英文の認識に関す
る。
び英単語認識方法に関し、特に印刷英文の認識に関す
る。
【0002】
【従来の技術】図22に従来の文字認識回路の構成を示
す。入力端子 1 から文字パタンメモリ 2 に1文字分の
文字パタンが2値画像として入力される。画素値は1が
黒画素、0が白画素を表わしている。図23に文字パタ
ン及び処理結果の例を示す。
す。入力端子 1 から文字パタンメモリ 2 に1文字分の
文字パタンが2値画像として入力される。画素値は1が
黒画素、0が白画素を表わしている。図23に文字パタ
ン及び処理結果の例を示す。
【0003】フィルタ処理部3は、文字パタン画像に対
して、文字のかすれや背景ノイズを除去することによ
り、認識し易いパタン画像に変換する。
して、文字のかすれや背景ノイズを除去することによ
り、認識し易いパタン画像に変換する。
【0004】文字枠検出部4は、フィルタ処理の施され
た入力文字パタンの矩形の外接枠を検出し、その結果を
輪郭抽出部5と文字照合識別部6に送る。
た入力文字パタンの矩形の外接枠を検出し、その結果を
輪郭抽出部5と文字照合識別部6に送る。
【0005】文字パタンの外接枠は、水平方向および垂
直方向の周辺分布を使って求められる。周辺分布は文字
パタンをP(x,y)として、 水平周辺分布: SH(x)= ΣyP(x,y) 垂直周辺分布: SV(y)= ΣxP(x,y) で表わされる。SHとSVの関数値は各々y方向及びx
方向への黒画素の個数(集計)を表わしている。図23
に「a」の文字の水平周辺分布を示す。
直方向の周辺分布を使って求められる。周辺分布は文字
パタンをP(x,y)として、 水平周辺分布: SH(x)= ΣyP(x,y) 垂直周辺分布: SV(y)= ΣxP(x,y) で表わされる。SHとSVの関数値は各々y方向及びx
方向への黒画素の個数(集計)を表わしている。図23
に「a」の文字の水平周辺分布を示す。
【0006】これら周辺分布の値がある閾値を越えるx
とyの範囲の上限と下限から外接枠の座標 XL,X
R,YB,YTを求める。
とyの範囲の上限と下限から外接枠の座標 XL,X
R,YB,YTを求める。
【0007】輪郭追跡部5は、入力文字パタンの黒画素
領域と白画素領域の境界に沿って輪郭線を追跡する処理
を行い、例えば輪郭線上の黒画素を反時計回りに追跡す
る。図23に「a」の文字の輪郭線上の画素列を示す。
領域と白画素領域の境界に沿って輪郭線を追跡する処理
を行い、例えば輪郭線上の黒画素を反時計回りに追跡す
る。図23に「a」の文字の輪郭線上の画素列を示す。
【0008】文字照合識別部6は、予め定めた文字集合
の各文字の輪郭線の特徴点の座標値や凹凸に関する情報
を予め辞書メモリ7に記憶し、前記輪郭線追跡結果から
得られた値と照合して文字を認識する。その結果、1個
の文字あるいは複数の候補文字の識別コードが出力端子
8より出力される。
の各文字の輪郭線の特徴点の座標値や凹凸に関する情報
を予め辞書メモリ7に記憶し、前記輪郭線追跡結果から
得られた値と照合して文字を認識する。その結果、1個
の文字あるいは複数の候補文字の識別コードが出力端子
8より出力される。
【0009】以上の文字認識を複数の文字について連続
して行い、単語辞書を利用して単語認識を行うこともあ
る。文献:特願平09−298445「単語認識方法」
には、英単語認識方法が述べられている。
して行い、単語辞書を利用して単語認識を行うこともあ
る。文献:特願平09−298445「単語認識方法」
には、英単語認識方法が述べられている。
【0010】
【発明が解決しようとする課題】しかしながら、上記の
文字認識回路では、認識対象の文字集合が数字・アルフ
ァベットの印刷字体等の照合識別処理が比較的容易な場
合において、輪郭追跡部5の処理に多くの処理時間を要
していた。
文字認識回路では、認識対象の文字集合が数字・アルフ
ァベットの印刷字体等の照合識別処理が比較的容易な場
合において、輪郭追跡部5の処理に多くの処理時間を要
していた。
【0011】その理由は、輪郭追跡処理は文字パタンメ
モリ2のアクセス回数が多く、2次元的なアドレス
(x,y)を指定して1画素づつ読み出すために多くの
処理ステップを費やすからである。このため、従来の方
法ににおいては高性能化が困難であった。
モリ2のアクセス回数が多く、2次元的なアドレス
(x,y)を指定して1画素づつ読み出すために多くの
処理ステップを費やすからである。このため、従来の方
法ににおいては高性能化が困難であった。
【0012】本発明の目的は、文字認識の輪郭追跡処理
において、処理対象の複数画素を同時に読み出せるよう
な文字パタンメモリの構成方法を提供し、読み出した複
数画素を処理する輪郭追跡回路を用いて文字認識回路を
構成し、またこれを利用した高性能な英単語認識方法を
提供することである。
において、処理対象の複数画素を同時に読み出せるよう
な文字パタンメモリの構成方法を提供し、読み出した複
数画素を処理する輪郭追跡回路を用いて文字認識回路を
構成し、またこれを利用した高性能な英単語認識方法を
提供することである。
【0013】
【課題を解決するための手段】前記課題を解決するため
に、本発明の文字認識回路においては、各々が文字パタ
ン画像の座標xおよび座標yの2方向に4画素毎に離散
する画素を記憶し、4×4のマトリクス状に配置された
分割メモリと、当該16個の分割メモリのアドレスを指
定するXレジスタおよびYレジスタと、前記4×4マト
リクスの最左列、最右列、最下行、最上行に位置する各
4個の分割メモリ内部に備えられ、前記Xレジスタまた
はYレジスタに0,1,−1のいずれかを加算した値を
供給し得るアドレス修飾器と、前記文字パタンの輪郭線
に沿って1画素単位に進行する現在点のx座標、y座標
および進行方向cvを保持するレジスタと、前記16個
の分割メモリから当該進行方向cvを基準として右、
前、左、後の4方向に隣る4画素値を参照し、当該4画
素値を用いて前記進行方向cv、前記現在点のx座標、
y座標を更新する輪郭線追跡回路とを有することを特徴
とする。
に、本発明の文字認識回路においては、各々が文字パタ
ン画像の座標xおよび座標yの2方向に4画素毎に離散
する画素を記憶し、4×4のマトリクス状に配置された
分割メモリと、当該16個の分割メモリのアドレスを指
定するXレジスタおよびYレジスタと、前記4×4マト
リクスの最左列、最右列、最下行、最上行に位置する各
4個の分割メモリ内部に備えられ、前記Xレジスタまた
はYレジスタに0,1,−1のいずれかを加算した値を
供給し得るアドレス修飾器と、前記文字パタンの輪郭線
に沿って1画素単位に進行する現在点のx座標、y座標
および進行方向cvを保持するレジスタと、前記16個
の分割メモリから当該進行方向cvを基準として右、
前、左、後の4方向に隣る4画素値を参照し、当該4画
素値を用いて前記進行方向cv、前記現在点のx座標、
y座標を更新する輪郭線追跡回路とを有することを特徴
とする。
【0014】また、前記課題を解決するための本発明英
単語認識方法においては、活字体の英小文字「a」より
「z」までの26文字を構成要素とする英単語パタンを
2本の水平分割線によって上部パタン、中部パタン、下
部パタンに分割し、当該上部パタンの水平周辺分布及び
局所的垂直分布より、「i,j」の上部「b,d,h,
k,l」の上部、「t」の上部、「f」の上部の少なく
とも4種類に分類した文字上部パタンを全て検出し、当
該上部パタンの検出個数及び当該種類を示す符号を当該
検出順序で並べた英単語文字上部パタン符号を求め、前
記下部パタンの水平周辺分布及び局所的垂直分布より、
「j,y」の下部、「p,q」の下部、「g」の下部の
少なくとも3種類に分類した文字下部パタンを全て検出
し、当該下部パタンの検出個数及び当該種類を示す符号
を当該検出順序で並べた英単語文字下部パタン符号を求
め、前記英単語の中部パタンのみを持つ文字「a,c,
e,m,n,o,r,s,u,v,w,x,z」は、当
該文字の外側輪郭線の追跡処理を行い、進行方向のy成
分が反転する頂点の個数、座標値及び凹凸の推移に関す
る特徴を用いて13文字に識別し、当該文字の検出個数
及び識別符号を当該検出順序で並べた英単語中部パタン
符号を求め、認識対象の全ての英単語を、前記英単語上
部パタン符号、英単語下部パタン符号、英単語中部パタ
ン符号を用いて分類した英単語認識用辞書を予め作成
し、入力された英単語パタンより前記英単語の上部およ
び下部パタン符号を求め、当該両パタン符号により前記
英単語認識用辞書を索引して1個以上の英単語候補を選
定し、当該英単語候補が複数個ある場合は、当該入力さ
れた英単語パタンの中部パタン符号を英単語識別に必要
な文字まで求めて1個の英単語を選定することを特徴と
する。
単語認識方法においては、活字体の英小文字「a」より
「z」までの26文字を構成要素とする英単語パタンを
2本の水平分割線によって上部パタン、中部パタン、下
部パタンに分割し、当該上部パタンの水平周辺分布及び
局所的垂直分布より、「i,j」の上部「b,d,h,
k,l」の上部、「t」の上部、「f」の上部の少なく
とも4種類に分類した文字上部パタンを全て検出し、当
該上部パタンの検出個数及び当該種類を示す符号を当該
検出順序で並べた英単語文字上部パタン符号を求め、前
記下部パタンの水平周辺分布及び局所的垂直分布より、
「j,y」の下部、「p,q」の下部、「g」の下部の
少なくとも3種類に分類した文字下部パタンを全て検出
し、当該下部パタンの検出個数及び当該種類を示す符号
を当該検出順序で並べた英単語文字下部パタン符号を求
め、前記英単語の中部パタンのみを持つ文字「a,c,
e,m,n,o,r,s,u,v,w,x,z」は、当
該文字の外側輪郭線の追跡処理を行い、進行方向のy成
分が反転する頂点の個数、座標値及び凹凸の推移に関す
る特徴を用いて13文字に識別し、当該文字の検出個数
及び識別符号を当該検出順序で並べた英単語中部パタン
符号を求め、認識対象の全ての英単語を、前記英単語上
部パタン符号、英単語下部パタン符号、英単語中部パタ
ン符号を用いて分類した英単語認識用辞書を予め作成
し、入力された英単語パタンより前記英単語の上部およ
び下部パタン符号を求め、当該両パタン符号により前記
英単語認識用辞書を索引して1個以上の英単語候補を選
定し、当該英単語候補が複数個ある場合は、当該入力さ
れた英単語パタンの中部パタン符号を英単語識別に必要
な文字まで求めて1個の英単語を選定することを特徴と
する。
【0015】
【発明の実施の形態】[第1の実施形態の説明] (1)全体構成と分割パタンメモリの構成 図1は、本発明の第1の実施形態の文字認識回路の全体
構成を示す。文字認識回路は、輪郭追跡回路300と文
字識別回路301からなり、輪郭追跡回路300は分割
パタンメモリ110、x座標追跡回路251、y座標追
跡回路252、方向追跡回路253からなる。
構成を示す。文字認識回路は、輪郭追跡回路300と文
字識別回路301からなり、輪郭追跡回路300は分割
パタンメモリ110、x座標追跡回路251、y座標追
跡回路252、方向追跡回路253からなる。
【0016】最初に分割パタンメモリ110の構成から
説明する。本発明の文字認識回路は、従来の文字パタン
メモリ2(図2参照)を4×4=16個の文字パタンメ
モリ(以後、分割メモリ101と称する)に分割し、そ
の16個の分割メモリ101を分割パタンメモリ110
と総称し、その周りに文字認識用の回路を構成する。
説明する。本発明の文字認識回路は、従来の文字パタン
メモリ2(図2参照)を4×4=16個の文字パタンメ
モリ(以後、分割メモリ101と称する)に分割し、そ
の16個の分割メモリ101を分割パタンメモリ110
と総称し、その周りに文字認識用の回路を構成する。
【0017】この分割パタンメモリ110を用いること
により、最大4×4の近傍画素の集合が同時に読み出さ
れるので、従来技術で述べた輪郭追跡処理における文字
パタンメモリ2のアクセス回数が軽減される。
により、最大4×4の近傍画素の集合が同時に読み出さ
れるので、従来技術で述べた輪郭追跡処理における文字
パタンメモリ2のアクセス回数が軽減される。
【0018】図2は分割パタンメモリ110の構成例で
あって、個別の分割メモリ101が4×4の2次元的に
配置され、#0から#15までの番号が付されている。
16個の分割メモリ101は、図3に示すように、従来
の文字パタンメモリ2全体を4×4画素から成る画素ブ
ロックの集合と考えた場合に、1個の画素ブロック内の
16個の画素に1対1に対応している。
あって、個別の分割メモリ101が4×4の2次元的に
配置され、#0から#15までの番号が付されている。
16個の分割メモリ101は、図3に示すように、従来
の文字パタンメモリ2全体を4×4画素から成る画素ブ
ロックの集合と考えた場合に、1個の画素ブロック内の
16個の画素に1対1に対応している。
【0019】すなわち、従来の文字パタンメモリ2の座
標を(x,y)とすると、例えば128×128画素の
文字パタン画像は、32×32個の4×4画素ブロック
に分割され、x,y各7ビットの内、上位各5ビット
X,Y(計10ビット)は画素ブロックアドレスを、下
位各2ビットx1x0、y1y0を組み合わせたy1y
0x1x0(4ビット数)は画素ブロック内アドレス、
すなわち分割メモリの#0から#15までの番号を表し
ている。
標を(x,y)とすると、例えば128×128画素の
文字パタン画像は、32×32個の4×4画素ブロック
に分割され、x,y各7ビットの内、上位各5ビット
X,Y(計10ビット)は画素ブロックアドレスを、下
位各2ビットx1x0、y1y0を組み合わせたy1y
0x1x0(4ビット数)は画素ブロック内アドレス、
すなわち分割メモリの#0から#15までの番号を表し
ている。
【0020】従来の文字パタンメモリ2のアドレス
(x、y)と上記分割メモリ101のアドレスとの関係
は、以下のように表わされる。 x=4X+(2x1+x0)=[X,2x1+x0] y=4Y+(2y1+y0)=[Y,2y1+y0] ここで[X,x]は 4X+x を意味する。
(x、y)と上記分割メモリ101のアドレスとの関係
は、以下のように表わされる。 x=4X+(2x1+x0)=[X,2x1+x0] y=4Y+(2y1+y0)=[Y,2y1+y0] ここで[X,x]は 4X+x を意味する。
【0021】各分割メモリ101はX、Y各5ビットの
アドレス端子を持ち、各々Xレジスタ102、Yレジス
タ103に共通に接続されているが、図2の構成例で
は、最左列の4個の分割メモリ#0,#4,#8,#1
2のXアドレスX0はインクリメンタ104を通じてX
レジスタ102に接続されており、XまたはX+1のい
ずれかの値がXアドレス端子X0に与えられるように動
作する。
アドレス端子を持ち、各々Xレジスタ102、Yレジス
タ103に共通に接続されているが、図2の構成例で
は、最左列の4個の分割メモリ#0,#4,#8,#1
2のXアドレスX0はインクリメンタ104を通じてX
レジスタ102に接続されており、XまたはX+1のい
ずれかの値がXアドレス端子X0に与えられるように動
作する。
【0022】また、最右列の4個の分割メモリ#3,#
7,#11,#15のXアドレスX3はデクリメンタ1
05を通じてXレジスタ102に接続されており、Xま
たはX−1のいずれかの値がXアドレス端子X3に与え
られるように動作する。
7,#11,#15のXアドレスX3はデクリメンタ1
05を通じてXレジスタ102に接続されており、Xま
たはX−1のいずれかの値がXアドレス端子X3に与え
られるように動作する。
【0023】y方向についても同様に、最下行の#0,
#1,#2,#3の4個のY0がインクリメンタ106
を通じて、最上行の#12,#13,#14,#15の
4個のY3がデクリメンタ107を通じてYレジスタ1
03に接続されている。
#1,#2,#3の4個のY0がインクリメンタ106
を通じて、最上行の#12,#13,#14,#15の
4個のY3がデクリメンタ107を通じてYレジスタ1
03に接続されている。
【0024】例えば、図3の(a)に示すように、X=
10,Y=7であれば、(x,y)=(40,28)を
左下端点とする画素ブロックを指している。これは、I
NC、DECを作動させない。すなわちINC,DEC
があってもX,Yをそのまま通過させる場合である。
10,Y=7であれば、(x,y)=(40,28)を
左下端点とする画素ブロックを指している。これは、I
NC、DECを作動させない。すなわちINC,DEC
があってもX,Yをそのまま通過させる場合である。
【0025】また、同図(b)に示すように、X=5,
Y=11の画素ブロックの窓を右及び下に1画素分移動
して指すこともできる。これは最左列にINC104を
作動させて右隣りの画素ブロックX+1の最左列に移動
し、最上行にDEC107を作動させて下隣りの画素ブ
ロックY−1の最上行に移動しているからである。これ
は、分割メモリ#3の画素の隣接画素の同時アクセスを
可能とする。
Y=11の画素ブロックの窓を右及び下に1画素分移動
して指すこともできる。これは最左列にINC104を
作動させて右隣りの画素ブロックX+1の最左列に移動
し、最上行にDEC107を作動させて下隣りの画素ブ
ロックY−1の最上行に移動しているからである。これ
は、分割メモリ#3の画素の隣接画素の同時アクセスを
可能とする。
【0026】各分割メモリ101は、各1ビットのデー
タ出力端子(D0からD15)を持っており、この16
ビットは同時に読み出され処理回路にかけられる。また
各分割メモリは各1ビットのデータ入力端子(I1から
I15)を持っているが、図2では簡単のため図示して
いない。
タ出力端子(D0からD15)を持っており、この16
ビットは同時に読み出され処理回路にかけられる。また
各分割メモリは各1ビットのデータ入力端子(I1から
I15)を持っているが、図2では簡単のため図示して
いない。
【0027】(2)輪郭追跡回路の構成 図4は第1の実施形態の文字認識回路における、輪郭追
跡回路300の構成を示す。分割メモリ101は図2と
同じ構成で、最左列と最下行にINC(104と10
6)が、最右列と最上行にDEC(105と107)が
あるが、INC/DECが作動する時には点線で示すよ
うに(X,Y)の隣接ブロックの画素がアクセスされる
ので、図4では、その隣接ブロックの位置に示してい
る。
跡回路300の構成を示す。分割メモリ101は図2と
同じ構成で、最左列と最下行にINC(104と10
6)が、最右列と最上行にDEC(105と107)が
あるが、INC/DECが作動する時には点線で示すよ
うに(X,Y)の隣接ブロックの画素がアクセスされる
ので、図4では、その隣接ブロックの位置に示してい
る。
【0028】輪郭追跡回路は、輪郭線上の黒画素を反時
計回りに、以下の各レジスタを用いて追跡する。 カレントポイントx座標:[X,cpx] カレントポイントy座標:[Y,cpy] カレントベクトルレジスタ: cv
計回りに、以下の各レジスタを用いて追跡する。 カレントポイントx座標:[X,cpx] カレントポイントy座標:[Y,cpy] カレントベクトルレジスタ: cv
【0029】文字パタンが16個の分割メモリ101に
分散して記憶され、カレントポイントはその輪郭線上の
黒画素であって、その座標値は(cpy,cpx)の示
す分割メモリのアドレス(X,Y)にある。カレントベ
クトルcvはカレントポイントが輪郭線上を1画素移動
する時その移動方向を示す2ビット符号であって、x正
方向をcv=0、y正方向をcv=1、x負方向をcv
=2、y負方向をcv=3とする。
分散して記憶され、カレントポイントはその輪郭線上の
黒画素であって、その座標値は(cpy,cpx)の示
す分割メモリのアドレス(X,Y)にある。カレントベ
クトルcvはカレントポイントが輪郭線上を1画素移動
する時その移動方向を示す2ビット符号であって、x正
方向をcv=0、y正方向をcv=1、x負方向をcv
=2、y負方向をcv=3とする。
【0030】図4に示す例では、カレントポイントが
(cpy,cpx)=(1,1)すなわち分割メモリ#
5のアドレス(X,Y)にある黒画素であり、カレント
ベクトルはcv=0であって、x正方向(右)に進行し
ている。すなわち前ステップでカレントポイントは分割
メモリ#4のアドレス(X,Y)にあって、そのステッ
プでの輪郭線追跡の結果#5に移動したものであり、次
にいずれの4方向に1画素移動すべきかを決めようとし
ている。
(cpy,cpx)=(1,1)すなわち分割メモリ#
5のアドレス(X,Y)にある黒画素であり、カレント
ベクトルはcv=0であって、x正方向(右)に進行し
ている。すなわち前ステップでカレントポイントは分割
メモリ#4のアドレス(X,Y)にあって、そのステッ
プでの輪郭線追跡の結果#5に移動したものであり、次
にいずれの4方向に1画素移動すべきかを決めようとし
ている。
【0031】それには、輪郭線上のカレントポイントを
四方に囲む4画素について、これらをカレントベクトル
cvを基準にして右、前、左、後(これらを相対方向s
vと呼ぶ)の順に並べた時、最初に黒画素が出現する方
向に1画素進むという規則に従う。この図では、進行方
向に対し右と前に白画素○があるので、左すなわち#9
の黒画素●に進む。
四方に囲む4画素について、これらをカレントベクトル
cvを基準にして右、前、左、後(これらを相対方向s
vと呼ぶ)の順に並べた時、最初に黒画素が出現する方
向に1画素進むという規則に従う。この図では、進行方
向に対し右と前に白画素○があるので、左すなわち#9
の黒画素●に進む。
【0032】図5、図6、図7はこの処理を分割パタン
メモリ110に対して実行する輪郭追跡回路であり、図
5はx座標追跡回路251、図6はy座標追跡回路25
2、図7はカレントベクトルcvの方向追跡回路253
である。これらは図4の輪郭追跡回路300として一体
となって動作する。
メモリ110に対して実行する輪郭追跡回路であり、図
5はx座標追跡回路251、図6はy座標追跡回路25
2、図7はカレントベクトルcvの方向追跡回路253
である。これらは図4の輪郭追跡回路300として一体
となって動作する。
【0033】輪郭追跡回路全体を処理手順に従って分類
すると以下のようになる。まず、カレント値から相対方
向svを決定するまでの処理回路は以下の3系統の回路
(a),(b),(c)から構成される。 (a)cpxから読み出しアドレスXのINC/DEC
を制御する回路(図5) cpyから読み出しアドレスYのINC/DECを制御
する回路(図6) (b)cpx及びcvから右、前、左、後のcpxを求
める回路(図5、図7) cpy及びcvから右、前、左、後のcpyを求める回
路(図6、図7) (c)右、前、左、後のcpxとcpyから4画素を選
択する回路(図7) その4画素値から、相対方向svを決定する回路(図
7) 得られた相対方向svは2ビット符号で、右をsv=
0、前をsv=1、左をsv=2、後をsv=3とす
る。
すると以下のようになる。まず、カレント値から相対方
向svを決定するまでの処理回路は以下の3系統の回路
(a),(b),(c)から構成される。 (a)cpxから読み出しアドレスXのINC/DEC
を制御する回路(図5) cpyから読み出しアドレスYのINC/DECを制御
する回路(図6) (b)cpx及びcvから右、前、左、後のcpxを求
める回路(図5、図7) cpy及びcvから右、前、左、後のcpyを求める回
路(図6、図7) (c)右、前、左、後のcpxとcpyから4画素を選
択する回路(図7) その4画素値から、相対方向svを決定する回路(図
7) 得られた相対方向svは2ビット符号で、右をsv=
0、前をsv=1、左をsv=2、後をsv=3とす
る。
【0034】次に、相対方向svが決定してから、X,
Y,cpx、cpy、cvのネクスト値、すなわち各パ
ラメータの次に更新すべき値は以下の各回路によって求
められる。 (d)svとcvから次のcvの値ncvを求める回路
(図7) svと右、前、左、後のcpxから次のcpxの値nc
pxを求める回路(図5) svと右、前、左、後のcpyから次のcpyの値nc
pyを求める回路(図6) (e)cpxとncvから次のXの値NXを求める回
路。(図5) cpyとncvから次のYの値NYを求める回路。(図
6)
Y,cpx、cpy、cvのネクスト値、すなわち各パ
ラメータの次に更新すべき値は以下の各回路によって求
められる。 (d)svとcvから次のcvの値ncvを求める回路
(図7) svと右、前、左、後のcpxから次のcpxの値nc
pxを求める回路(図5) svと右、前、左、後のcpyから次のcpyの値nc
pyを求める回路(図6) (e)cpxとncvから次のXの値NXを求める回
路。(図5) cpyとncvから次のYの値NYを求める回路。(図
6)
【0035】(3)輪郭追跡回路の動作 次に、次に輪郭追跡回路の各部の論理構成および動作を
説明する。最初にカレントポイントの右、前、左、後の
各画素のブロックアドレスX,Yを次の回路で正しく指
す必要がある。 (a)cpxから読み出しアドレスXのINC/DEC
を制御する回路 cpyから読み出しアドレスYのINC/DECを制御
する回路 図5で、XINC104はcpx=0,1,2の時X
を、cpx=3の時X+1を出力し、XDEC105は
cpx=0の時X−1を、cpx=1,2,3の時Xを
出力するようにする。図6で、YINC106はcpy
=0,1,2の時Yを、cpy=3の時Y+1を出力
し、XDEC107はcpy=0の時Y−1を、cpy
=1,2,3の時Yを出力するようにする。以上でカレ
ントポイントを囲む4画素のブロックアドレスが正しく
選択される。
説明する。最初にカレントポイントの右、前、左、後の
各画素のブロックアドレスX,Yを次の回路で正しく指
す必要がある。 (a)cpxから読み出しアドレスXのINC/DEC
を制御する回路 cpyから読み出しアドレスYのINC/DECを制御
する回路 図5で、XINC104はcpx=0,1,2の時X
を、cpx=3の時X+1を出力し、XDEC105は
cpx=0の時X−1を、cpx=1,2,3の時Xを
出力するようにする。図6で、YINC106はcpy
=0,1,2の時Yを、cpy=3の時Y+1を出力
し、XDEC107はcpy=0の時Y−1を、cpy
=1,2,3の時Yを出力するようにする。以上でカレ
ントポイントを囲む4画素のブロックアドレスが正しく
選択される。
【0036】次にブロック内アドレス、すなわち分割メ
モリの列番号および行番号については (b)cpxおよびcvから右、前、左、後のcpxを
求める回路 cpyおよびcvから右、前、左、後のcpyを求める
回路 で以下の8個の式に従って生成する。これらは、各々の
方向に1画素だけ進んだ時、次のステップでcpxおよ
びcpyになるべき値である。
モリの列番号および行番号については (b)cpxおよびcvから右、前、左、後のcpxを
求める回路 cpyおよびcvから右、前、左、後のcpyを求める
回路 で以下の8個の式に従って生成する。これらは、各々の
方向に1画素だけ進んだ時、次のステップでcpxおよ
びcpyになるべき値である。
【0037】 右画素のcpx は npx0 = (cpx + dx0)mod4 前画素のcpx は npx1 = (cpx + dx1)mod4 左画素のcpx は npx2 = (cpx + dx2)mod4 後画素のcpx は npx3 = (cpx + dx3)mod4
【0038】 右画素のcpy は npy0 = (cpy + dy0)mod4 前画素のcpy は npy1 = (cpy + dy1)mod4 左画素のcpy は npy2 = (cpy + dy2)mod4 後画素のcpy は npy3 = (cpy + dy3)mod4
【0039】ここで、カレントベクトルcv=0,1,
2,3を(x,y)成分表示すると各々(1,0),
(0,1),(−1,0),(0,−1)となるので、
これらを4通りに回転したベクトルが (dx0,dy0)=(0,-1),(1,0),(0,1),(-1,0) 90度右回転 (dx1,dy1)=(1,0),(0,1),(-1,0),(0,-1) 0度回転 (dx2,dy2)=(0,1),(-1,0),(0,-1),(1,0) 90度左回転 (dx3,dy3)=(-1,0),(0,-1),(1,0),(0,1) 180度回転 である。これらの回転ベクトルは、図7の4個の回転ベ
クトル発生器221で作られ、図5の4個の加算器20
3および図6の4個の加算器213でcpxまたはcp
yに4を法として加算される。mod4は4で割った余
り(0,1,2,3)を示す。
2,3を(x,y)成分表示すると各々(1,0),
(0,1),(−1,0),(0,−1)となるので、
これらを4通りに回転したベクトルが (dx0,dy0)=(0,-1),(1,0),(0,1),(-1,0) 90度右回転 (dx1,dy1)=(1,0),(0,1),(-1,0),(0,-1) 0度回転 (dx2,dy2)=(0,1),(-1,0),(0,-1),(1,0) 90度左回転 (dx3,dy3)=(-1,0),(0,-1),(1,0),(0,1) 180度回転 である。これらの回転ベクトルは、図7の4個の回転ベ
クトル発生器221で作られ、図5の4個の加算器20
3および図6の4個の加算器213でcpxまたはcp
yに4を法として加算される。mod4は4で割った余
り(0,1,2,3)を示す。
【0040】次に分割メモリを読み出し、以下の回路に
通す。 (c)右、前、左、後のcpxとcpyから4画素を選
択する回路 その4画素値から、相対方向svを決定する回路
通す。 (c)右、前、左、後のcpxとcpyから4画素を選
択する回路 その4画素値から、相対方向svを決定する回路
【0041】図7の16入力4出力マルチプレクサ22
2で次の4画素を選ぶ。 右画素 PIX0 = D[npy0*4 + npx0] 前画素 PIX1 = D [npy1*4 + npx1] 左画素 PIX2 = D[npy2*4 + npx2] 後画素 PIX3 = D [npy3*4 + npx3]
2で次の4画素を選ぶ。 右画素 PIX0 = D[npy0*4 + npx0] 前画素 PIX1 = D [npy1*4 + npx1] 左画素 PIX2 = D[npy2*4 + npx2] 後画素 PIX3 = D [npy3*4 + npx3]
【0042】これらを次の論理をもつ4入力2ビット出
力の優先符号化回路223に通す。 PIX0=1なら sv=0(右折) PIX0=0,PIX1=1なら sv=1(直進) PIX0=0,PIX1=0,PIX2=1なら sv=2(左折) PIX0=0,PIX1=0,PIX2=0,PIX3=1なら sv=3(後退) PIX0=0,PIX1=0,PIX2=0,PIX3=0なら sv=1(白領域直
進) 以上で相対進行方向svが決定する。最初に輪郭線に到
達するまでは白領域を直進するものとする。
力の優先符号化回路223に通す。 PIX0=1なら sv=0(右折) PIX0=0,PIX1=1なら sv=1(直進) PIX0=0,PIX1=0,PIX2=1なら sv=2(左折) PIX0=0,PIX1=0,PIX2=0,PIX3=1なら sv=3(後退) PIX0=0,PIX1=0,PIX2=0,PIX3=0なら sv=1(白領域直
進) 以上で相対進行方向svが決定する。最初に輪郭線に到
達するまでは白領域を直進するものとする。
【0043】(d)svとcvから次のcvの値ncv
を求める回路 svと右、前、左、後のcpxから次のcpxの値nc
pxを求める回路 svと右、前、左、後のcpyから次のcpyの値nc
pyを求める回路 は、次のように働く。
を求める回路 svと右、前、左、後のcpxから次のcpxの値nc
pxを求める回路 svと右、前、左、後のcpyから次のcpyの値nc
pyを求める回路 は、次のように働く。
【0044】ncvは図7で、1の減算器224と加算
器225を用いて次式で求める。 ncv = (cv + sv - 1)mod4
器225を用いて次式で求める。 ncv = (cv + sv - 1)mod4
【0045】ncpxは図5の2ビット数の4入力1出
力マルチプレクサ204で、ncpyは図6の2ビット
数の4入力1出力マルチプレクサ205を用いて、例え
ばsv=0ならば、ncpx=npx0、ncpy=n
py0となるように選ぶ。ncvは図5、図6でNX、
NYの決定にも使用される。
力マルチプレクサ204で、ncpyは図6の2ビット
数の4入力1出力マルチプレクサ205を用いて、例え
ばsv=0ならば、ncpx=npx0、ncpy=n
py0となるように選ぶ。ncvは図5、図6でNX、
NYの決定にも使用される。
【0046】最後に (e)cpxとncvから次のXの値NXを求める回
路。 cpyとncvから次のYの値NYを求める回路。 NXはcpx=3,ncv=0の時X+1、cpx=
0,ncv=2の時X−1、それ以外の時Xとなる。N
Yはcpy=3,ncv=1の時Y+1、cpy=0,
ncv=3の時Y−1、それ以外の時Yとなる。
路。 cpyとncvから次のYの値NYを求める回路。 NXはcpx=3,ncv=0の時X+1、cpx=
0,ncv=2の時X−1、それ以外の時Xとなる。N
Yはcpy=3,ncv=1の時Y+1、cpy=0,
ncv=3の時Y−1、それ以外の時Yとなる。
【0047】以上のように、輪郭追跡回路は、文字パタ
ンの輪郭追跡に必要なカレントポイントの4方向に隣接
する4画素を16個の分割メモリから同時に読み出し、
カレントポイントのx座標、y座標および進行方向cv
から組み合わせ回路により相対進行方向svを決定す
る。またこれらのx座標、y座標および進行方向cvの
ネクスト値を相対進行方向svを用いた組み合わせ回路
により求める。
ンの輪郭追跡に必要なカレントポイントの4方向に隣接
する4画素を16個の分割メモリから同時に読み出し、
カレントポイントのx座標、y座標および進行方向cv
から組み合わせ回路により相対進行方向svを決定す
る。またこれらのx座標、y座標および進行方向cvの
ネクスト値を相対進行方向svを用いた組み合わせ回路
により求める。
【0048】(4)文字識別回路の構成 図8は、文字識別回路301の構成を示す。文字識別回
路301は、輪郭追跡回路300からステップ毎に生成
される現在点(カレントポイント)の座標値x、yを入
力し、現在点の1ステップ前の点の座標値 px,p
y、を記憶するレジスタ302,303、現在点のT=
4ステップ前の点の座標値p4x,p4yを記憶するレ
ジスタ304,305、仮極点(仮極小または仮極大)
の座標値mx、myを記憶するレジスタ306,30
7、仮極点のT=4ステップ前の点の座標値lx、ly
を記憶するレジスタ308,309、極大点における凹
凸を判別する回路310、検出された全ての極小点およ
び極大点の座標値qx,qy、極大点における凹凸、お
よび極大点から次の極小点までの下降スイング及びその
タイプを記憶する極点メモリ311、pyとyの大小比
較器312、その比較結果を監視するy座標増減監視器
313、myに0、h、−hのいずれかを加算する加算
器314加算器314出力とyの大小比較を行う比較器
315、その比較結果を監視する区間監視器316から
なる。
路301は、輪郭追跡回路300からステップ毎に生成
される現在点(カレントポイント)の座標値x、yを入
力し、現在点の1ステップ前の点の座標値 px,p
y、を記憶するレジスタ302,303、現在点のT=
4ステップ前の点の座標値p4x,p4yを記憶するレ
ジスタ304,305、仮極点(仮極小または仮極大)
の座標値mx、myを記憶するレジスタ306,30
7、仮極点のT=4ステップ前の点の座標値lx、ly
を記憶するレジスタ308,309、極大点における凹
凸を判別する回路310、検出された全ての極小点およ
び極大点の座標値qx,qy、極大点における凹凸、お
よび極大点から次の極小点までの下降スイング及びその
タイプを記憶する極点メモリ311、pyとyの大小比
較器312、その比較結果を監視するy座標増減監視器
313、myに0、h、−hのいずれかを加算する加算
器314加算器314出力とyの大小比較を行う比較器
315、その比較結果を監視する区間監視器316から
なる。
【0049】以上の回路で文字識別情報を収集し、識別
部317で文字を識別する。なお、Tとhは可変の定数で
あり、例えば T=4,h=3 とする。
部317で文字を識別する。なお、Tとhは可変の定数で
あり、例えば T=4,h=3 とする。
【0050】この文字識別回路301は、本実施形態で
は、活字体の英小文字「a,c,e,m,n,o,r,
s,u,v,w,x,z」の13文字のみを識別対象と
する。本実施形態で特に文字を限定する理由は、第2の
実施形態の英単語認識処理でこの13文字の識別機能を
利用するからである。従って、分割パタンメモリ110
にはこの13文字のいずれか1個の活字体の文字パタン
が入力されるものとする。
は、活字体の英小文字「a,c,e,m,n,o,r,
s,u,v,w,x,z」の13文字のみを識別対象と
する。本実施形態で特に文字を限定する理由は、第2の
実施形態の英単語認識処理でこの13文字の識別機能を
利用するからである。従って、分割パタンメモリ110
にはこの13文字のいずれか1個の活字体の文字パタン
が入力されるものとする。
【0051】(5)文字識別回路の動作 ここでは、x軸正方向は右とし、y軸正方向は上とす
る。認識対象の文字パタンは外側輪郭線を1個だけもっ
ており、その外接枠がすでに求められているものとす
る。外接枠の左下頂点よりやや上方の点からxの正方向
に初めて黒画素に出会う点を輪郭線追跡処理の開始点と
する。
る。認識対象の文字パタンは外側輪郭線を1個だけもっ
ており、その外接枠がすでに求められているものとす
る。外接枠の左下頂点よりやや上方の点からxの正方向
に初めて黒画素に出会う点を輪郭線追跡処理の開始点と
する。
【0052】現在点が輪郭線に沿って反時計回りに一周
した時、そのy座標の変化すなわち輪郭線の上下方向の
変化に着目し、その特徴を捉えて文字を識別する。それ
には、y方向に関する極大、極小点を検出し、それらに
よって輪郭線を下降稜線(または下降スイング)と上昇
稜線(上昇スイング)に分割する。
した時、そのy座標の変化すなわち輪郭線の上下方向の
変化に着目し、その特徴を捉えて文字を識別する。それ
には、y方向に関する極大、極小点を検出し、それらに
よって輪郭線を下降稜線(または下降スイング)と上昇
稜線(上昇スイング)に分割する。
【0053】輪郭追跡回路を作動させると、現在点
(x、y)は反時計回りに進行し、一周して開始点に戻
る。1画素進行することをステップと呼び、tステップ
進行したときの現在点座標をtの関数として、x
(t)、y(t)で表わす。一周する間に上下の移動変
化が例えば6回あったとすれば次のようになる。
(x、y)は反時計回りに進行し、一周して開始点に戻
る。1画素進行することをステップと呼び、tステップ
進行したときの現在点座標をtの関数として、x
(t)、y(t)で表わす。一周する間に上下の移動変
化が例えば6回あったとすれば次のようになる。
【0054】tの増加に従ってCPは最初は下方に進み
y座標が減少し、 頂点(第1極小点)で減少または水平状態から増加に
変わり、 頂点(第1極大点)で増加または水平状態から減少に
変わり、 頂点(第2極小点)で減少または水平状態から増加に
変わり、 頂点(第2極大点)で増加または水平状態から減少に
変わり、 頂点(第3極小点)で減少または水平状態から増加に
変わり、 頂点(第3極大点)で増加または水平状態から減少に
変わり、 最後に開始点に戻る。
y座標が減少し、 頂点(第1極小点)で減少または水平状態から増加に
変わり、 頂点(第1極大点)で増加または水平状態から減少に
変わり、 頂点(第2極小点)で減少または水平状態から増加に
変わり、 頂点(第2極大点)で増加または水平状態から減少に
変わり、 頂点(第3極小点)で減少または水平状態から増加に
変わり、 頂点(第3極大点)で増加または水平状態から減少に
変わり、 最後に開始点に戻る。
【0055】基本的には、ステップ毎のy座標の変化d
y=y(t)−y(t−1)を監視すればこの6個の極
点の座標が求められる。すなわち dy=y(t)−y(t-1)=y−py = −1 ならy減少 dy=y(t)−y(t-1)=y−py = 1 ならy増加 dy=y(t)−y(t-1)=y−py = 0 なら水平状態 であるから、比較器312でy−pyの符号を見て極
小、極大の条件が発生する度に増減監視器313が現在
点(x、y)の値を極点メモリ311に格納して行けば
よい。しかし、文字パタンがノイズを持っている場合、
輪郭線の細かい凹凸を大局的な極小極大と誤認するおそ
れがある。
y=y(t)−y(t−1)を監視すればこの6個の極
点の座標が求められる。すなわち dy=y(t)−y(t-1)=y−py = −1 ならy減少 dy=y(t)−y(t-1)=y−py = 1 ならy増加 dy=y(t)−y(t-1)=y−py = 0 なら水平状態 であるから、比較器312でy−pyの符号を見て極
小、極大の条件が発生する度に増減監視器313が現在
点(x、y)の値を極点メモリ311に格納して行けば
よい。しかし、文字パタンがノイズを持っている場合、
輪郭線の細かい凹凸を大局的な極小極大と誤認するおそ
れがある。
【0056】これを避けるために、ノイズの凹凸を包み
込むだけの幅の行数h(ヒステリシス)を用いる。極小
極大の条件が成立した場合でも極点メモリ311に直ち
に格納せず、(x,y)を一旦仮極点レジスタmx(3
06),my(307)に保持する。この時、x(t−
T)及びy(t−T)をlx(308)及びly(30
9)レジスタに保持しておく。
込むだけの幅の行数h(ヒステリシス)を用いる。極小
極大の条件が成立した場合でも極点メモリ311に直ち
に格納せず、(x,y)を一旦仮極点レジスタmx(3
06),my(307)に保持する。この時、x(t−
T)及びy(t−T)をlx(308)及びly(30
9)レジスタに保持しておく。
【0057】(lx、ly)は仮極点よりTステップ以
前の点の座標であり、後述の凹凸判定用いる。以上のレ
ジスタ保持動作は、増減監視器313から出力される仮
極点検出パルス318によって同時に実行される。
前の点の座標であり、後述の凹凸判定用いる。以上のレ
ジスタ保持動作は、増減監視器313から出力される仮
極点検出パルス318によって同時に実行される。
【0058】図9は輪郭線追跡のフローチャートを示
す。入り口321から開始し、最初に現在点は下降(y
減少)状態にあるものと仮定し第1極小点を検出する
ために、仮極小検出322を実行する。y増加が発生す
ると仮極小点保持処理323が実行され、仮極小状態で
(真の)極小検出処理324を実行する。
す。入り口321から開始し、最初に現在点は下降(y
減少)状態にあるものと仮定し第1極小点を検出する
ために、仮極小検出322を実行する。y増加が発生す
ると仮極小点保持処理323が実行され、仮極小状態で
(真の)極小検出処理324を実行する。
【0059】極小検出処理324では、仮極小点のy座
標myとこれよりhだけ上がった座標my+hの間の区
間 my < y < my +h を現在点のy座標が超えるかどうかを監視する。極小検
出324では、現在点(x、y)が更新される度にy−
myの比較演算とy−my−hの比較演算を比較器31
5で引き続いて行い、(比較器315を2個使えば同時
に可能である)y=myならば処理326で仮極小を取
り消し、再び仮極小探索322に戻る。y=my+hな
らば 処理327で仮極小を(真の)極小と確定し、極
点メモリに格納し、仮極大検出332に移る。my<y
<my+hならば 極小検出324を続ける。
標myとこれよりhだけ上がった座標my+hの間の区
間 my < y < my +h を現在点のy座標が超えるかどうかを監視する。極小検
出324では、現在点(x、y)が更新される度にy−
myの比較演算とy−my−hの比較演算を比較器31
5で引き続いて行い、(比較器315を2個使えば同時
に可能である)y=myならば処理326で仮極小を取
り消し、再び仮極小探索322に戻る。y=my+hな
らば 処理327で仮極小を(真の)極小と確定し、極
点メモリに格納し、仮極大検出332に移る。my<y
<my+hならば 極小検出324を続ける。
【0060】第1極小点が確定すると、上昇モードに
移り、第1極大点の探索を行う。増減監視器313
は、仮極大検出処理332を実行し、y減少が発生する
と仮極大点として仮極点検出パルス318によって現在
点をmx、myにロードする。
移り、第1極大点の探索を行う。増減監視器313
は、仮極大検出処理332を実行し、y減少が発生する
と仮極大点として仮極点検出パルス318によって現在
点をmx、myにロードする。
【0061】極大検出処理334では現在点(x、y)
が更新される度にy−myの比較演算とy−my+hの
比較演算を比較器315で行い、y=myならば処理3
36で仮極大を取り消し、再び仮極大探索332に戻
る。y=my―hならば処理337で仮極大を(真の)
極大と確定し、極点メモリに格納し、仮極小探索322
に移る。my−h<y<myならば極大検出334を続
ける。
が更新される度にy−myの比較演算とy−my+hの
比較演算を比較器315で行い、y=myならば処理3
36で仮極大を取り消し、再び仮極大探索332に戻
る。y=my―hならば処理337で仮極大を(真の)
極大と確定し、極点メモリに格納し、仮極小探索322
に移る。my−h<y<myならば極大検出334を続
ける。
【0062】極大を確定した場合は、凹凸判別回路31
0が処理338で lx<mx<x (x増加)ならば 凹 lx>mx>x (x減少)ならば 凸 それ以外の場合は D=(my−ly)(x−mx)+(my−y)(mx−lx) の符号を判定し、正ならば凹、負ならば凸とし、凹凸の
結果(1ビット)を極点メモリ311に格納する。D=
0ならさらに詳細に調べる必要がある。Tの値を大き目
にとって(mx,my)と(lx,ly)の距離を離せ
ばD=0になり難い。
0が処理338で lx<mx<x (x増加)ならば 凹 lx>mx>x (x減少)ならば 凸 それ以外の場合は D=(my−ly)(x−mx)+(my−y)(mx−lx) の符号を判定し、正ならば凹、負ならば凸とし、凹凸の
結果(1ビット)を極点メモリ311に格納する。D=
0ならさらに詳細に調べる必要がある。Tの値を大き目
にとって(mx,my)と(lx,ly)の距離を離せ
ばD=0になり難い。
【0063】こうして第1極大点が求められ、以上の
処理を繰り返して、及び、が求められ、一周し
て第1極小点に戻ったら、処理339で、各々の極大点
から次の極小点までのy座標の変化量(下降スイング)
を求めるとともに、その下降スイングが文字枠の下部で
起きたか、上部で起きたか、フルスイングに近いかとい
ったスイングタイプを求め、極点メモリの極小点位置に
書込む。図10に極点メモリに求められたデータ構造を
示す。
処理を繰り返して、及び、が求められ、一周し
て第1極小点に戻ったら、処理339で、各々の極大点
から次の極小点までのy座標の変化量(下降スイング)
を求めるとともに、その下降スイングが文字枠の下部で
起きたか、上部で起きたか、フルスイングに近いかとい
ったスイングタイプを求め、極点メモリの極小点位置に
書込む。図10に極点メモリに求められたデータ構造を
示す。
【0064】次に、極大点列V2、V4、V6、
・・・における凹凸の系列と下降スイングV2V3,V
4V5,V6V1,…におけるスイングタイプの系列を
調べ、文字を判別する。図11、図12、図13にアル
ファベット13文字の20通りの変化パタンについて、
外輪郭線の極大極小点と下降スイングを示す。特に図1
3には、極大点の凹凸の系列と、スイングタイプの系列
を記す。スイングタイプは例えば次のように定める。
・・・における凹凸の系列と下降スイングV2V3,V
4V5,V6V1,…におけるスイングタイプの系列を
調べ、文字を判別する。図11、図12、図13にアル
ファベット13文字の20通りの変化パタンについて、
外輪郭線の極大極小点と下降スイングを示す。特に図1
3には、極大点の凹凸の系列と、スイングタイプの系列
を記す。スイングタイプは例えば次のように定める。
【0065】 上部:文字枠内の上部3分の1の範囲内にある 中部:文字枠内の中部3分の1の範囲内にある 下部:文字枠内の下部3分の1の範囲内にある 上半:文字枠内の上半分の範囲内にある 下半:文字枠内の下半分の範囲内にある フル:上記のいずれにも当てはまらない
【0066】図14は、これらの文字を識別するために
有効な特徴情報を16ビット1語で表わした特徴ベクト
ルを示す。アルファベット13種類の文字の23通りの
変化パタンについて、16個の条件の当てはまる特徴を
1、当てはまらない特徴は0としている。「×」はドン
トケアである。
有効な特徴情報を16ビット1語で表わした特徴ベクト
ルを示す。アルファベット13種類の文字の23通りの
変化パタンについて、16個の条件の当てはまる特徴を
1、当てはまらない特徴は0としている。「×」はドン
トケアである。
【0067】第1極大点が「左部か」という特徴は、極
大点個数が1の時のみ、「o」と「z」を判別するため
に使われる。また、第1下降スイングが「下部」の範囲
を超える可能性があるものは「×」とし、代わりに「下
半」を使用する。「s」の飾りのように振れ幅の小さい
下降スイングがヒシスリシスhの中で消滅したり、
「e,z」のように、水平線が傾いてhを超え、新たな
下降スイングが発生することもあるので、可能性のある
変化パタンを揃えて正しく判別できるようにする。
大点個数が1の時のみ、「o」と「z」を判別するため
に使われる。また、第1下降スイングが「下部」の範囲
を超える可能性があるものは「×」とし、代わりに「下
半」を使用する。「s」の飾りのように振れ幅の小さい
下降スイングがヒシスリシスhの中で消滅したり、
「e,z」のように、水平線が傾いてhを超え、新たな
下降スイングが発生することもあるので、可能性のある
変化パタンを揃えて正しく判別できるようにする。
【0068】図15は、この中から幾つかの特徴を順序
づけて使って文字を識別するフローチャートである。こ
こでは第1極大点の凹凸判別341と、第1下降スイ
ングV2V3の2個の判別処理342および349で、
19種類の文字パタンを4:7:5:3に均等に近い分
類をしており、その下段の判定処理343、345、3
51、350等でもそれぞれ均等に近い分類をしてい
る。入力パタンの条件によって最小限の特徴を調べれば
よいので、効率的に識別できる。文字が判定できた後
は、特徴ベクトルあるいは極点メモリを参照して検証す
る。
づけて使って文字を識別するフローチャートである。こ
こでは第1極大点の凹凸判別341と、第1下降スイ
ングV2V3の2個の判別処理342および349で、
19種類の文字パタンを4:7:5:3に均等に近い分
類をしており、その下段の判定処理343、345、3
51、350等でもそれぞれ均等に近い分類をしてい
る。入力パタンの条件によって最小限の特徴を調べれば
よいので、効率的に識別できる。文字が判定できた後
は、特徴ベクトルあるいは極点メモリを参照して検証す
る。
【0069】以上説明したように、本実施形態の分割パ
タンメモリ及び輪郭追跡回路を用いれば、文字パタンの
輪郭追跡に必要なカレントポイントに隣接する4画素が
16個の分割メモリから常に読み出されて利用できるの
で、カレントポイントのx座標、y座標および進行方向
cvから組み合わせ回路により相対進行方向svを決定
できる。
タンメモリ及び輪郭追跡回路を用いれば、文字パタンの
輪郭追跡に必要なカレントポイントに隣接する4画素が
16個の分割メモリから常に読み出されて利用できるの
で、カレントポイントのx座標、y座標および進行方向
cvから組み合わせ回路により相対進行方向svを決定
できる。
【0070】またこれらのx座標、y座標および進行方
向cvの次の値を相対進行方向svを用いた組み合わせ
回路により求めることができる。従って、1クロックで
1画素の速度で輪郭線を追跡することができ、輪郭追跡
処理が高速化できる。
向cvの次の値を相対進行方向svを用いた組み合わせ
回路により求めることができる。従って、1クロックで
1画素の速度で輪郭線を追跡することができ、輪郭追跡
処理が高速化できる。
【0071】また、本実施形態の文字識別回路を用いれ
ば、辞書を用いずに、簡単な論理で一定個の文字が識別
できるので、容易かつ迅速に文字が識別できる。これ
は、本実施形態では印刷体の特定の20個程度の文字パ
タンに限定し、これらの文字を識別する有効な特徴を用
いたためである。
ば、辞書を用いずに、簡単な論理で一定個の文字が識別
できるので、容易かつ迅速に文字が識別できる。これ
は、本実施形態では印刷体の特定の20個程度の文字パ
タンに限定し、これらの文字を識別する有効な特徴を用
いたためである。
【0072】文字識別回路の内部には、輪郭線の点列を
全て格納する必要がなく、極大極小のみを一時的に記憶
すればよいので、メモリ量とそれを操作する処理量が少
なくて済む。
全て格納する必要がなく、極大極小のみを一時的に記憶
すればよいので、メモリ量とそれを操作する処理量が少
なくて済む。
【0073】本実施形態では、認識対象を第2実施形態
で述べる「中部パタン文字」に限定したが、それ以外の
英文字として、たとえば「中部パタン以外の英小文
字」、「数字」、や「英大文字」にそれぞれ対象を特化
した文字識別回路を構成することもできる。
で述べる「中部パタン文字」に限定したが、それ以外の
英文字として、たとえば「中部パタン以外の英小文
字」、「数字」、や「英大文字」にそれぞれ対象を特化
した文字識別回路を構成することもできる。
【0074】これらの文字識別回路を併用すれば、高性
能な英文認識装置が構成できる。また、分割パタンメモ
リでは、認識対象を1文字に限定したが、1つの英単語
全体あるいは英文の一部を16分割されたパタンメモリ
に格納することもできる。これは、Xアドレスのビット
数を増加させればよく、同じ文字認識回路で連続する複
数の文字が認識できる。
能な英文認識装置が構成できる。また、分割パタンメモ
リでは、認識対象を1文字に限定したが、1つの英単語
全体あるいは英文の一部を16分割されたパタンメモリ
に格納することもできる。これは、Xアドレスのビット
数を増加させればよく、同じ文字認識回路で連続する複
数の文字が認識できる。
【0075】[第2の実施形態の説明] (1)構成の説明 図16は本発明の第2の実施形態の英単語認識方法のフ
ローチャートである。第2の実施形態の英単語認識方法
は、英文中の活字英単語を認識対象とし、文字単位の認
識をするのではなく、単語全体のパタンに含まれ、容易
に解析できる特徴を用いて単語集合を分類し、その分類
された単語集合の中で、文字単位の認識によってさらに
細かく分類しようとするものである。
ローチャートである。第2の実施形態の英単語認識方法
は、英文中の活字英単語を認識対象とし、文字単位の認
識をするのではなく、単語全体のパタンに含まれ、容易
に解析できる特徴を用いて単語集合を分類し、その分類
された単語集合の中で、文字単位の認識によってさらに
細かく分類しようとするものである。
【0076】図16の処理開始時には、英単語パタンが
切り出され、入力されたものとする。構成文字が大文字
であれば先に認識しておく必要がある。またピリオド、
カンマ等の記号も分離して、小文字だけからなる単語パ
タンが得られたところから開始する。
切り出され、入力されたものとする。構成文字が大文字
であれば先に認識しておく必要がある。またピリオド、
カンマ等の記号も分離して、小文字だけからなる単語パ
タンが得られたところから開始する。
【0077】処理401で、英単語パタンを囲む矩形枠
を2本の水平基準線によって、上部パタン、中部パタ
ン、下部パタンの3個のパタンに分割する。この内、中
部パタンは、単語の全構成文字のパタンで満たされてい
るが、上部パタンおよび下部パタンは疎らなパタンとな
るか空の場合もある。
を2本の水平基準線によって、上部パタン、中部パタ
ン、下部パタンの3個のパタンに分割する。この内、中
部パタンは、単語の全構成文字のパタンで満たされてい
るが、上部パタンおよび下部パタンは疎らなパタンとな
るか空の場合もある。
【0078】図17(a)はアルファベット小文字26
文字の内、上部パタンをもつ9文字を上部パタンの形状
により4種類に分類し、その種類を表す符号として0か
ら3までの数値を割り当てたものである。すなわち、文
字「i」「j」には0、文字「b」「d」「h」「k」
「l」には1、文字「t」には2、文字「f」には3の
上部パタン符号を割り当てる。
文字の内、上部パタンをもつ9文字を上部パタンの形状
により4種類に分類し、その種類を表す符号として0か
ら3までの数値を割り当てたものである。すなわち、文
字「i」「j」には0、文字「b」「d」「h」「k」
「l」には1、文字「t」には2、文字「f」には3の
上部パタン符号を割り当てる。
【0079】処理402は、英単語の上部パタン全体の
水平周辺分布及び局所的垂直分布から各文字の上部パタ
ンを識別する処理である。処理403は、その結果を用
いて英単語の上部パタン符号を求める処理である。
水平周辺分布及び局所的垂直分布から各文字の上部パタ
ンを識別する処理である。処理403は、その結果を用
いて英単語の上部パタン符号を求める処理である。
【0080】それには、英単語中に現れるこれらの文字
のパタン符号の可変長の列によって英単語の上部パタン
符号を定義する。図19(a)に例示する英単語「in
formation」の場合、「i」「f」「t」
「i」の文字上部パタン符号を用いて 0320と表さ
れる。これに文字上部パタン検出個数の4を前置して、
40320を英単語上部パタン符号とする。
のパタン符号の可変長の列によって英単語の上部パタン
符号を定義する。図19(a)に例示する英単語「in
formation」の場合、「i」「f」「t」
「i」の文字上部パタン符号を用いて 0320と表さ
れる。これに文字上部パタン検出個数の4を前置して、
40320を英単語上部パタン符号とする。
【0081】また、図17(b)は下部パタンをもつ5
文字を下部パタンの形状により3種類に分類し、文字下
部パタン符号として0、1、2を割り当てたものであ
る。すなわち、文字「j」「y」には0、文字「p」
「q」には1、文字「g」には2の下部パタン符号を割
り当てる。
文字を下部パタンの形状により3種類に分類し、文字下
部パタン符号として0、1、2を割り当てたものであ
る。すなわち、文字「j」「y」には0、文字「p」
「q」には1、文字「g」には2の下部パタン符号を割
り当てる。
【0082】処理404は、英単語の下部パタン全体の
水平周辺分布及び局所的垂直分布から各文字の下部パタ
ンを識別する処理である。処理405は、その結果を用
いて英単語の下部パタン符号を求める処理である。
水平周辺分布及び局所的垂直分布から各文字の下部パタ
ンを識別する処理である。処理405は、その結果を用
いて英単語の下部パタン符号を求める処理である。
【0083】図19(b)に例示する英単語「jump
ing」の場合、検出個数と「j」「p」「g」の下部
パタン符号とから「3012」が英単語下部パタン符号
である。
ing」の場合、検出個数と「j」「p」「g」の下部
パタン符号とから「3012」が英単語下部パタン符号
である。
【0084】処理406は、英単語認識用辞書を英単語
の上部パタン符号及び下部パタン符号によって索引し、
上下パタン符号の同じ英単語候補の集合を求める。
の上部パタン符号及び下部パタン符号によって索引し、
上下パタン符号の同じ英単語候補の集合を求める。
【0085】処理407で、英単語候補が1個ならば、
それが求める英単語であるとして処理410で検証の上
決定する。
それが求める英単語であるとして処理410で検証の上
決定する。
【0086】英単語候補が複数の場合には、処理408
でさらに中部パタン符号によって英単語候補集合の内部
を索引できる。
でさらに中部パタン符号によって英単語候補集合の内部
を索引できる。
【0087】中部パタン符号は図18に示すように、上
下部パタンを持たない13個の文字にアルファベット順
に0から12までの数字を割り当てたものである。英単
語中に現れるこれらの文字の出現個数と中部パタン符号
の可変長の列によって英単語の中部パタン符号を定義す
る。
下部パタンを持たない13個の文字にアルファベット順
に0から12までの数字を割り当てたものである。英単
語中に現れるこれらの文字の出現個数と中部パタン符号
の可変長の列によって英単語の中部パタン符号を定義す
る。
【0088】英単語識別用辞書を作成するには、認識対
象の全単語の上部、下部、及び中部パタン符号を用いて
この順に検索できるようにしておく。中部パタンについ
ては、アルファベット順に分類してもよい。また、中部
パタンの1文字のみあるいは文字数を用いて候補単語集
合ができるだけ均等に分類されるようにしておけば、効
率的に索引できる。
象の全単語の上部、下部、及び中部パタン符号を用いて
この順に検索できるようにしておく。中部パタンについ
ては、アルファベット順に分類してもよい。また、中部
パタンの1文字のみあるいは文字数を用いて候補単語集
合ができるだけ均等に分類されるようにしておけば、効
率的に索引できる。
【0089】処理408では、英単語辞書を索引するだ
けであるから、辞書中で指定された中部パタンの1文字
のみあるいは文字数を認識し、その認識結果を用いて候
補単語を絞り込む。
けであるから、辞書中で指定された中部パタンの1文字
のみあるいは文字数を認識し、その認識結果を用いて候
補単語を絞り込む。
【0090】この分類キーとなる文字による絞り込みを
繰り返して英単語を決定し、最終的に英単語の構成文字
列を得る。上部、下部、中部パタン全てが同じ複数の単
語があれば、全文字を識別して単語を決定する。
繰り返して英単語を決定し、最終的に英単語の構成文字
列を得る。上部、下部、中部パタン全てが同じ複数の単
語があれば、全文字を識別して単語を決定する。
【0091】中部パタン符号は、文字単位の認識を伴う
ものであるから、いかなる方法で認識してもよいが、こ
の文字認識の性能は、上下パタンの認識処理および辞書
検索の性能に見合った高性能なものである必要がある。
そこで、前述した第1の実施形態の輪郭線による文字識
別回路を用いる。
ものであるから、いかなる方法で認識してもよいが、こ
の文字認識の性能は、上下パタンの認識処理および辞書
検索の性能に見合った高性能なものである必要がある。
そこで、前述した第1の実施形態の輪郭線による文字識
別回路を用いる。
【0092】(2)動作の説明 ここでは、上部パタンと中部パタンの識別方法と辞書の
構成方法を述べる。英単語の上部パタンは、まず全体の
水平周辺分布を求める。図19(a)に「inform
ation」の上部パタンの水平周辺分布を示す。これ
は英単語上部パタンの各水平位置で垂直方向に何個の黒
画素があるかを示す。この例では上部パタンをもつ文字
「i」「f」「t」「i」の水平位置に黒画素があるの
で、4個所に文字上部パタンの水平周辺分布が現れる。
構成方法を述べる。英単語の上部パタンは、まず全体の
水平周辺分布を求める。図19(a)に「inform
ation」の上部パタンの水平周辺分布を示す。これ
は英単語上部パタンの各水平位置で垂直方向に何個の黒
画素があるかを示す。この例では上部パタンをもつ文字
「i」「f」「t」「i」の水平位置に黒画素があるの
で、4個所に文字上部パタンの水平周辺分布が現れる。
【0093】水平周辺分布を左から右に向かって連続す
る非零区間として文字上部パタンを検出する。各々の文
字上部パタンに対して、その局所的な垂直周辺分布を求
める。これは1個の文字上部パタンの各垂直位置で水平
方向に何個の黒画素があるかを計数することによって求
められる。図19(a)にこうして求めた4個の局所的
垂直周辺分布を示す。右側の「b」は参考である。
る非零区間として文字上部パタンを検出する。各々の文
字上部パタンに対して、その局所的な垂直周辺分布を求
める。これは1個の文字上部パタンの各垂直位置で水平
方向に何個の黒画素があるかを計数することによって求
められる。図19(a)にこうして求めた4個の局所的
垂直周辺分布を示す。右側の「b」は参考である。
【0094】水平周辺分布と局所的垂直周辺分布の形状
から文字上部パタンの種類(符号)を求める。文字上部
パタンは4種類しかないので、これらは容易に判別でき
る。
から文字上部パタンの種類(符号)を求める。文字上部
パタンは4種類しかないので、これらは容易に判別でき
る。
【0095】上部パタンの判別方法は、水平周辺分布が
最大値H1付近に達するかどうかで、達しなければパタ
ン符号が「0」または「2」、達すれば「1」または
「3」であり、垂直周辺分布が下部付近に零区間(黒点
がない区間)をもてばパタン符号を「0」とする。ま
た、パタン符号が「1」と「3」では、水平周辺分布が
最大値をとる水平位置が非零区間の左端付近にあれば
「3」とする。
最大値H1付近に達するかどうかで、達しなければパタ
ン符号が「0」または「2」、達すれば「1」または
「3」であり、垂直周辺分布が下部付近に零区間(黒点
がない区間)をもてばパタン符号を「0」とする。ま
た、パタン符号が「1」と「3」では、水平周辺分布が
最大値をとる水平位置が非零区間の左端付近にあれば
「3」とする。
【0096】英小文字「f」はその右側の文字と重なっ
て印刷されることもあるが、その場合の判別方法は、左
側の「f」の文字パタンが既知としてそれを除去して黒
点を白点に変え、残りの文字上部パタンの両周辺分布を
再度求めて判別する。
て印刷されることもあるが、その場合の判別方法は、左
側の「f」の文字パタンが既知としてそれを除去して黒
点を白点に変え、残りの文字上部パタンの両周辺分布を
再度求めて判別する。
【0097】中部パタン符号は中部パタンのみを持つ文
字の個数とその識別符号を左から右に向かって並べたも
のである。図20の「information」では、
「normaon」を識別符号で「4563054」と
表わし、中部パタン文字数「7」を前置して、「745
63054」が中部パタン符号となる。
字の個数とその識別符号を左から右に向かって並べたも
のである。図20の「information」では、
「normaon」を識別符号で「4563054」と
表わし、中部パタン文字数「7」を前置して、「745
63054」が中部パタン符号となる。
【0098】中部パタンの具体的な求めかたは、まず英
単語の中部パタンから、上部パタンを持つ文字と下部パ
タンを持つ文字の中部パタンを除去あるいは無視する。
その残りの英単語中部パタンに対して、左から順に各文
字パタンを切り出して、認識して行けばよい。
単語の中部パタンから、上部パタンを持つ文字と下部パ
タンを持つ文字の中部パタンを除去あるいは無視する。
その残りの英単語中部パタンに対して、左から順に各文
字パタンを切り出して、認識して行けばよい。
【0099】この中部パタンの認識に、第1の実施形態
で述べた文字認識回路を用いる。すなわち、図1の文字
認識回路の分割パタンメモリ110に、中部パタンの最
初の文字「n」の文字パタンを入力する。文字の切り出
しによって外接枠はすでに分かっているので、外側輪郭
線の追跡を実行し、その処理結果である極点メモリの内
容から13文字の識別ができるから、文字「n」と認識
でき、文字識別コード「4」を出力する。
で述べた文字認識回路を用いる。すなわち、図1の文字
認識回路の分割パタンメモリ110に、中部パタンの最
初の文字「n」の文字パタンを入力する。文字の切り出
しによって外接枠はすでに分かっているので、外側輪郭
線の追跡を実行し、その処理結果である極点メモリの内
容から13文字の識別ができるから、文字「n」と認識
でき、文字識別コード「4」を出力する。
【0100】この文字認識回路による処理を7回実行す
れば、「information」の中部パタン符号
「74563054」が求められる。図20には、同じ
上部パタン符号をもつ他の2単語のパタンと中部パタン
符号を示す。
れば、「information」の中部パタン符号
「74563054」が求められる。図20には、同じ
上部パタン符号をもつ他の2単語のパタンと中部パタン
符号を示す。
【0101】図21に辞書の索引方法を示す。ここでは
簡単のため下部パタンは無いものとする。英単語辞書は
文字上部パタン数を第1キーとして分類され、以降はそ
のパタン数の段数まで上部パタンをキーとして分類され
ている。
簡単のため下部パタンは無いものとする。英単語辞書は
文字上部パタン数を第1キーとして分類され、以降はそ
のパタン数の段数まで上部パタンをキーとして分類され
ている。
【0102】それ以降は中部パタンで分類される。上部
パタン数が0または1では候補数が膨大であるので、中
部パタン数または第1中部パタンをキーとして大分類さ
れる。構成文字数の少ない単語は結局、中部パタンの全
文字を使って分類されるが、その中部パタンは第1の実
施形態の文字認識回路で高速に認識される。
パタン数が0または1では候補数が膨大であるので、中
部パタン数または第1中部パタンをキーとして大分類さ
れる。構成文字数の少ない単語は結局、中部パタンの全
文字を使って分類されるが、その中部パタンは第1の実
施形態の文字認識回路で高速に認識される。
【0103】構成文字数の多い英単語は上部パタンで少
数の英単語にしぼられるので、それ以降は、候補文字の
決定に最も有効なキー文字を選ぶ。上部パタン符号「4
0320」の英単語候補は3個に絞られており。中部パ
タン符号でこれらを識別するには、中部パタン文字数あ
るいは第2番目の文字をキーとして識別すれば英単語が
決定できる。
数の英単語にしぼられるので、それ以降は、候補文字の
決定に最も有効なキー文字を選ぶ。上部パタン符号「4
0320」の英単語候補は3個に絞られており。中部パ
タン符号でこれらを識別するには、中部パタン文字数あ
るいは第2番目の文字をキーとして識別すれば英単語が
決定できる。
【0104】以上説明したように、本実施形態の英単語
認識方法を用いれば、上部パタン、下部パタンという、
英単語の本体から上下にはみ出した部分を検出して、英
単語全体を認識するので、従来方法における、文字を個
別に切り出して認識するという手順が省略でき、特に構
成文字数の長い英単語の認識処理時間が短縮する。
認識方法を用いれば、上部パタン、下部パタンという、
英単語の本体から上下にはみ出した部分を検出して、英
単語全体を認識するので、従来方法における、文字を個
別に切り出して認識するという手順が省略でき、特に構
成文字数の長い英単語の認識処理時間が短縮する。
【0105】上部・下部パタンは、水平周辺分布と局所
的垂直周辺分布の解析で容易かつ一意的に求められ、英
単語認識用辞書全体が、これらパタン符号によって重複
なく分類されるので、パタン照合でなく索引によって英
単語候補が絞り込める。
的垂直周辺分布の解析で容易かつ一意的に求められ、英
単語認識用辞書全体が、これらパタン符号によって重複
なく分類されるので、パタン照合でなく索引によって英
単語候補が絞り込める。
【0106】中部パタンに関しては、文字を個別に切り
出して認識することに成るが、それは本発明の文字認識
回路を用いて中部パタン文字を認識することによって従
来より高速に認識でき、高性能な英単語認識装置が実現
できる。
出して認識することに成るが、それは本発明の文字認識
回路を用いて中部パタン文字を認識することによって従
来より高速に認識でき、高性能な英単語認識装置が実現
できる。
【0107】尚、本発明は前述の実施形態に限定される
ものではなく、本発明の趣旨に基づいて種々の応用が可
能である。例えば、本発明の文字認識回路は、論理回路
で文字を識別できるので、モジュール化して、マイクロ
プロセッサやイメージセンサに組み込むのに適してい
る。また、本発明の英単語認識方法は、英文認識を高速
に実行できるので、書物のデータベース化に利用した
り、音声対話システムや通信システムへ接続できる。
ものではなく、本発明の趣旨に基づいて種々の応用が可
能である。例えば、本発明の文字認識回路は、論理回路
で文字を識別できるので、モジュール化して、マイクロ
プロセッサやイメージセンサに組み込むのに適してい
る。また、本発明の英単語認識方法は、英文認識を高速
に実行できるので、書物のデータベース化に利用した
り、音声対話システムや通信システムへ接続できる。
【0108】
【発明の効果】以上、詳細に説明したように、本発明の
文字認識回路によれば、各々が文字パタン画像の座標x
および座標yの2方向に4画素毎に離散する画素を記憶
し、4×4のマトリクス状に配置された分割メモリと、
当該16個の分割メモリのアドレスを指定するXレジス
タおよびYレジスタと、前記4×4マトリクスの最左
列、最右列、最下行、最上行に位置する各4個の分割メ
モリ内部に備えられ、前記XレジスタまたはYレジスタ
に0,1,−1のいずれかを加算した値を供給し得るア
ドレス修飾器と、前記文字パタンの輪郭線に沿って1画
素単位に進行する現在点のx座標、y座標および進行方
向cvを保持するレジスタと、前記16個の分割メモリ
から当該進行方向cvを基準として右、前、左、後の4
方向に隣る4画素値を参照し、当該4画素値を用いて前
記進行方向cv、前記現在点のx座標、y座標を更新す
る輪郭線追跡回路とを有する構成としたので、文字パタ
ンの輪郭追跡に必要なカレントポイントに隣接する4画
素が16個の分割メモリから常に読み出されて利用でき
るので、カレントポイントのx座標、y座標および進行
方向cvから組み合わせ回路により相対進行方向svを
決定できる。またこれらのx座標、y座標および進行方
向cvの次の値を相対進行方向svを用いた組み合わせ
回路により求めることができる。従って、1クロックで
1画素の速度で輪郭線を追跡することができ、輪郭追跡
処理が高速化できる。
文字認識回路によれば、各々が文字パタン画像の座標x
および座標yの2方向に4画素毎に離散する画素を記憶
し、4×4のマトリクス状に配置された分割メモリと、
当該16個の分割メモリのアドレスを指定するXレジス
タおよびYレジスタと、前記4×4マトリクスの最左
列、最右列、最下行、最上行に位置する各4個の分割メ
モリ内部に備えられ、前記XレジスタまたはYレジスタ
に0,1,−1のいずれかを加算した値を供給し得るア
ドレス修飾器と、前記文字パタンの輪郭線に沿って1画
素単位に進行する現在点のx座標、y座標および進行方
向cvを保持するレジスタと、前記16個の分割メモリ
から当該進行方向cvを基準として右、前、左、後の4
方向に隣る4画素値を参照し、当該4画素値を用いて前
記進行方向cv、前記現在点のx座標、y座標を更新す
る輪郭線追跡回路とを有する構成としたので、文字パタ
ンの輪郭追跡に必要なカレントポイントに隣接する4画
素が16個の分割メモリから常に読み出されて利用でき
るので、カレントポイントのx座標、y座標および進行
方向cvから組み合わせ回路により相対進行方向svを
決定できる。またこれらのx座標、y座標および進行方
向cvの次の値を相対進行方向svを用いた組み合わせ
回路により求めることができる。従って、1クロックで
1画素の速度で輪郭線を追跡することができ、輪郭追跡
処理が高速化できる。
【0109】また、本発明の英単語認識方法によれば、
活字体の英小文字「a」より「z」までの26文字を構
成要素とする英単語パタンを2本の水平分割線によって
上部パタン、中部パタン、下部パタンに分割し、当該上
部パタンの水平周辺分布及び局所的垂直分布より、
「i,j」の上部「b,d,h,k,l」の上部、
「t」の上部、「f」の上部の少なくとも4種類に分類
した文字上部パタンを全て検出し、当該上部パタンの検
出個数及び当該種類を示す符号を当該検出順序で並べた
英単語文字上部パタン符号を求め、前記下部パタンの水
平周辺分布及び局所的垂直分布より、「j,y」の下
部、「p,q」の下部、「g」の下部の少なくとも3種
類に分類した文字下部パタンを全て検出し、当該下部パ
タンの検出個数及び当該種類を示す符号を当該検出順序
で並べた英単語文字下部パタン符号を求め、前記英単語
の中部パタンのみを持つ文字「a,c,e,m,n,
o,r,s,u,v,w,x,z」は、当該文字の外側
輪郭線の追跡処理を行い、進行方向のy成分が反転する
頂点の個数、座標値及び凹凸の推移に関する特徴を用い
て13文字に識別し、当該文字の検出個数及び識別符号
を当該検出順序で並べた英単語中部パタン符号を求め、
認識対象の全ての英単語を、前記英単語上部パタン符
号、英単語下部パタン符号、英単語中部パタン符号を用
いて分類した英単語認識用辞書を予め作成し、入力され
た英単語パタンより前記英単語の上部および下部パタン
符号を求め、当該両パタン符号により前記英単語認識用
辞書を索引して1個以上の英単語候補を選定し、当該英
単語候補が複数個ある場合は、当該入力された英単語パ
タンの中部パタン符号を英単語識別に必要な文字まで求
めて1個の英単語を選定する構成とし、上部パタン、下
部パタンという、英単語の本体から上下にはみ出した部
分を検出して、英単語全体を認識するので、従来方法に
おける、文字を個別に切り出して認識するという手順が
省略でき、特に構成文字数の長い英単語の認識処理時間
が短縮する。この上部・下部パタンは、水平周辺分布と
局所的垂直周辺分布の解析で容易かつ一意的に求めら
れ、英単語認識用辞書全体が、これらパタン符号によっ
て重複なく分類されるので、パタン照合でなく索引によ
って英単語候補が絞り込める。中部パタンに関しては、
文字を個別に切り出して認識することに成るが、それは
本発明の文字認識回路を用いて中部パタン文字を認識す
ることによって従来より高速に認識でき、高性能な英単
語認識装置が実現できる。
活字体の英小文字「a」より「z」までの26文字を構
成要素とする英単語パタンを2本の水平分割線によって
上部パタン、中部パタン、下部パタンに分割し、当該上
部パタンの水平周辺分布及び局所的垂直分布より、
「i,j」の上部「b,d,h,k,l」の上部、
「t」の上部、「f」の上部の少なくとも4種類に分類
した文字上部パタンを全て検出し、当該上部パタンの検
出個数及び当該種類を示す符号を当該検出順序で並べた
英単語文字上部パタン符号を求め、前記下部パタンの水
平周辺分布及び局所的垂直分布より、「j,y」の下
部、「p,q」の下部、「g」の下部の少なくとも3種
類に分類した文字下部パタンを全て検出し、当該下部パ
タンの検出個数及び当該種類を示す符号を当該検出順序
で並べた英単語文字下部パタン符号を求め、前記英単語
の中部パタンのみを持つ文字「a,c,e,m,n,
o,r,s,u,v,w,x,z」は、当該文字の外側
輪郭線の追跡処理を行い、進行方向のy成分が反転する
頂点の個数、座標値及び凹凸の推移に関する特徴を用い
て13文字に識別し、当該文字の検出個数及び識別符号
を当該検出順序で並べた英単語中部パタン符号を求め、
認識対象の全ての英単語を、前記英単語上部パタン符
号、英単語下部パタン符号、英単語中部パタン符号を用
いて分類した英単語認識用辞書を予め作成し、入力され
た英単語パタンより前記英単語の上部および下部パタン
符号を求め、当該両パタン符号により前記英単語認識用
辞書を索引して1個以上の英単語候補を選定し、当該英
単語候補が複数個ある場合は、当該入力された英単語パ
タンの中部パタン符号を英単語識別に必要な文字まで求
めて1個の英単語を選定する構成とし、上部パタン、下
部パタンという、英単語の本体から上下にはみ出した部
分を検出して、英単語全体を認識するので、従来方法に
おける、文字を個別に切り出して認識するという手順が
省略でき、特に構成文字数の長い英単語の認識処理時間
が短縮する。この上部・下部パタンは、水平周辺分布と
局所的垂直周辺分布の解析で容易かつ一意的に求めら
れ、英単語認識用辞書全体が、これらパタン符号によっ
て重複なく分類されるので、パタン照合でなく索引によ
って英単語候補が絞り込める。中部パタンに関しては、
文字を個別に切り出して認識することに成るが、それは
本発明の文字認識回路を用いて中部パタン文字を認識す
ることによって従来より高速に認識でき、高性能な英単
語認識装置が実現できる。
【図1】第1の実施形態の構成を示す文字認識回路であ
る。
る。
【図2】分割パタンメモリの構成図である。
【図3】画素ブロックとアクセスパタンの説明図であ
る。
る。
【図4】輪郭追跡回路の構成図である。
【図5】x座標追跡回路の構成図である。
【図6】y座標追跡回路の構成図である。
【図7】方向追跡回路の構成図である。
【図8】文字識別回路の構成図である。
【図9】輪郭追跡のフローチャートである。
【図10】極点メモリのデータ構造を示す図である。
【図11】各文字の極大極小点と下降スイングの例を示
す図である。
す図である。
【図12】各文字の極大極小点と下降スイングの例を示
す図である。
す図である。
【図13】各文字の極大極小点と下降スイングの例を示
す図である。
す図である。
【図14】特徴ベクトルの一例を示す図である。
【図15】文字識別フローチャートである。
【図16】第2の実施形態における英単語認識方法を示
すフローチャートである。
すフローチャートである。
【図17】文字の上部・下部パタンの符号化の説明図で
ある。
ある。
【図18】文字の中部パタンの符号化の説明図である。
【図19】上部・下部パタンの周辺分布の説明図であ
る。
る。
【図20】同じ上部パタン符号を持つ英単語の一例を示
す図である。
す図である。
【図21】辞書の索引方法の説明図である。
【図22】従来の文字認識回路の構成を示す図である。
【図23】文字パタンと水平周辺分布の例を示す図であ
る。
る。
102 Xレジスタ 103 Yレジスタ 110 分割パタンメモリ 251 x座標追跡回路 252 y座標追跡回路 253 方向追跡回路 300 輪郭追跡回路 301 文字識別回路
Claims (4)
- 【請求項1】 各々が文字パタン画像の座標xおよび座
標yの2方向に4画素毎に離散する画素を記憶し、4×
4のマトリクス状に配置された分割メモリと、 当該16個の分割メモリのアドレスを指定するXレジス
タおよびYレジスタと、 前記4×4マトリクスの最左列、最右列、最下行、最上
行に位置する各4個の分割メモリ内部に備えられ、前記
XレジスタまたはYレジスタに0,1,−1のいずれか
を加算した値を供給し得るアドレス修飾器と、 前記文字パタンの輪郭線に沿って1画素単位に進行する
現在点のx座標、y座標および進行方向cvを保持する
レジスタと、 前記16個の分割メモリから当該進行方向cvを基準と
して右、前、左、後の4方向に隣る4画素値を参照し、
当該4画素値を用いて前記進行方向cv、前記現在点の
x座標、y座標を更新する輪郭線追跡回路とを有するこ
とを特徴とする文字認識回路。 - 【請求項2】 予め定めた文字集合の各文字パタンの輪
郭線の進行方向の垂直(y)成分が反転する頂点の座標
値と凹凸に関する特徴を記憶し、前記輪郭線追跡回路の
処理結果から求めた当該特徴と照合して文字を識別する
文字識別回路を有することを特徴とする請求項1に記載
の文字認識回路。 - 【請求項3】 前記文字集合が活字体の英小文字集合
「a,c,e,m,n,o,r,s,u,v,w,x,
z」であって、文字の外側輪郭線の追跡処理において、
進行方向のy成分が反転する頂点の個数、当該頂点間の
y座標の変化、当該頂点の凹凸に関する特徴を用いて文
字を識別する文字識別回路を有することを特徴とする請
求項2に記載の文字認識回路。 - 【請求項4】 活字体の英小文字「a」より「z」まで
の26文字を構成要素とする英単語パタンを2本の水平
分割線によって上部パタン、中部パタン、下部パタンに
分割し、 当該上部パタンの水平周辺分布及び局所的垂直分布よ
り、「i,j」の上部「b,d,h,k,l」の上部、
「t」の上部、「f」の上部の少なくとも4種類に分類
した文字上部パタンを全て検出し、当該上部パタンの検
出個数及び当該種類を示す符号を当該検出順序で並べた
英単語文字上部パタン符号を求め、 前記下部パタンの水平周辺分布及び局所的垂直分布よ
り、「j,y」の下部、「p,q」の下部、「g」の下
部の少なくとも3種類に分類した文字下部パタンを全て
検出し、当該下部パタンの検出個数及び当該種類を示す
符号を当該検出順序で並べた英単語文字下部パタン符号
を求め、 前記英単語の中部パタンのみを持つ文字「a,c,e,
m,n,o,r,s,u,v,w,x,z」は、当該文
字の外側輪郭線の追跡処理を行い、進行方向のy成分が
反転する頂点の個数、座標値及び凹凸の推移に関する特
徴を用いて13文字に識別し、当該文字の検出個数及び
識別符号を当該検出順序で並べた英単語中部パタン符号
を求め、 認識対象の全ての英単語を、前記英単語上部パタン符
号、英単語下部パタン符号、英単語中部パタン符号を用
いて分類した英単語認識用辞書を予め作成し、 入力された英単語パタンより前記英単語の上部および下
部パタン符号を求め、当該両パタン符号により前記英単
語認識用辞書を索引して1個以上の英単語候補を選定
し、 当該英単語候補が複数個ある場合は、当該入力された英
単語パタンの中部パタン符号を英単語識別に必要な文字
まで求めて1個の英単語を選定することを特徴とする英
単語認識方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP10278088A JP2000113112A (ja) | 1998-09-30 | 1998-09-30 | 文字認識回路および英単語認識方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP10278088A JP2000113112A (ja) | 1998-09-30 | 1998-09-30 | 文字認識回路および英単語認識方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2000113112A true JP2000113112A (ja) | 2000-04-21 |
Family
ID=17592479
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP10278088A Withdrawn JP2000113112A (ja) | 1998-09-30 | 1998-09-30 | 文字認識回路および英単語認識方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2000113112A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009531788A (ja) * | 2006-03-29 | 2009-09-03 | アマゾン・テクノロジーズ・インコーポレイテツド | レンダリングのためにトークンベースファイルへの文字列を含むディジタル画像の変換 |
-
1998
- 1998-09-30 JP JP10278088A patent/JP2000113112A/ja not_active Withdrawn
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009531788A (ja) * | 2006-03-29 | 2009-09-03 | アマゾン・テクノロジーズ・インコーポレイテツド | レンダリングのためにトークンベースファイルへの文字列を含むディジタル画像の変換 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5071914B2 (ja) | 認識グラフ | |
CN106156766B (zh) | 文本行分类器的生成方法及装置 | |
JP2726568B2 (ja) | 文字認識方法及び装置 | |
EP0538038B1 (en) | Character recognition method & apparatus | |
JPH06348904A (ja) | 手書き字号の認識システム及び認識方法 | |
EP0564827A2 (en) | A post-processing error correction scheme using a dictionary for on-line handwriting recognition | |
US5588074A (en) | Data recognition equipment and method using partial pattern recognition | |
JP3172762B2 (ja) | オブジェクト認識装置 | |
CN112364709B (zh) | 基于编码识别的机柜智能资产盘点方法 | |
Melhi et al. | A novel triangulation procedure for thinning hand-written text | |
Yamamoto | Present state of recognition method on consideration of neighbor points and its ability in common database | |
JP4958236B2 (ja) | 手書きパターンを認識するための方法及び装置 | |
CN110490157B (zh) | 文字评估方法、文字学习方法、装置、设备及存储介质 | |
JP2000113112A (ja) | 文字認識回路および英単語認識方法 | |
Raj et al. | Offline Tamil handwritten character recognition using chain code and zone based features | |
Batuwita et al. | New segmentation algorithm for individual offline handwritten character segmentation | |
Xu et al. | An HMM-based over-segmentation method for touching Chinese handwriting recognition | |
CN111027304B (zh) | 文字块排序方法、装置、存储介质及电子设备 | |
JP2000339470A (ja) | パターン辞書作成方法及び装置、パターン認識方法及び装置、並びに、記録媒体 | |
KR940007934B1 (ko) | 온라인 문자인식을 위한 획분할 및 문자분류방법 | |
JPH0736433A (ja) | 文字データベース作成装置 | |
KR100204618B1 (ko) | 문자 또는 도형의 인식 방법 및 시스템 | |
KR100361176B1 (ko) | 필기체 다중 문자 인식방법 | |
KR940001048B1 (ko) | 온라인 필기체문자인식방법 | |
JPH11126216A (ja) | 図面自動入力装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20060110 |