JPS5949670A - 光学的文字読取装置 - Google Patents
光学的文字読取装置Info
- Publication number
- JPS5949670A JPS5949670A JP57159958A JP15995882A JPS5949670A JP S5949670 A JPS5949670 A JP S5949670A JP 57159958 A JP57159958 A JP 57159958A JP 15995882 A JP15995882 A JP 15995882A JP S5949670 A JPS5949670 A JP S5949670A
- Authority
- JP
- Japan
- Prior art keywords
- character
- character pattern
- pattern
- string
- horizontal projection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
〔発明の1専11&分!l!l・〕
この発明は、111ねイ↑わせ方式等の光学的文字f1
7.i JIY%置に関すZ)。 〔発明の技術的背杖とその問題点〕 一般に、光学的文字読取装置(以下00 Itと、称す
る)の文字認識方式には、大別1.てT1(ねp、。 わぜ方式と特徴抽出方式がある。このiliね合わせ力
式の中では、類似度方式が多用さねている。 このような方式の0OTLでは、1ii1’7i1.第
1図に示すように、用紙(以下帳塾と称する)ノー1−
の文字は、光1F?変換回路2で光学的に走査さノ12
値化のイメージデータに変換さtする。この2植化のイ
メージデータである1行分の文字パターンは、1度ライ
ンバッファメモリ、1に)j3 &M 8れる。 このラインバッファメモリ3から1文字分の文字パター
ンが、文字切出し回路4切出される。 この切出された1文字分の文字パターンは、通當文字位
置の正規化停の前処理が行なわれて標本化回路5に入力
する。標本化回路5け、文字パターンに対する情報圧縮
処理を行なって、この文字パターンと辞書メモリ6に予
め記(、(& i ftだ標準パターンとで類似度計算
を行なう。この類似度肝t11の結果、が文字811
jiik回路2に入力して、文字認識処、3!I!がh
されることにな、/り。 ところで、上記のようfr、 ljね合わl一方式AH
,’iの00Rでは、文字位1tffの正規化等のよう
々文字パターンに対する前処理が文字読取率に多大々影
村を与える。例えば、帳票1上に印字不完全の活字文字
があるり1合、この文字パターンに対する文字イ1装置
の正規化等の前処理を行斤ったとする。この前処理は、
通常文字の大きさの中心を2(準にして位Vlの正規化
を行りうので、第2図に示すようか文字パターンP11
−J本来の中心位置Oよシずれた位置(例えば下方向に
lだけずれる)に設定されることになる(例えばメモリ
内の位置)。したがって、帳票1上の文字の大きさを弯
えるような場合、印字不完全の文字等に対する文字認識
処理が田離となり、文字読取率が低下するなどの欠点が
あった。 〔発明の目的〕 この発明は、」二配の事情な舷みてなされたもので、帳
票上の′5c才を読l1l(る場合、その文字が印字不
完全で本来の文字の大きさを変えるような場合でも、文
学誌81λ処理を確実に行斤うことかでき1文字読11
X率を大幅にit’bめることができる光学的文字h・
a: 1tv装置を1.−供することを1′1的とする
。 〔発明の11’!f要〕 すなわち、この発明においてt:t 、ラインバッファ
メモリに1行分の文字パターン号ノ格納17、この文字
パターンの中で複数個のl!ilr打する文字パターン
列の境界列アドレスを境界アドレス1/ジスタで指定す
る。この境界列アドレスを指定された」1配文字パター
ン列の水平射影の情報によル、その文字パターン列の中
で1文字分の各文字パターンの位置の正規化を行斤うも
のである。 〔発明の実施例〕 以下図面を参jK11.、てこの発明の一実Mli例に
ついて説明する。第3図はこの発明に係る0 0 It
の部分的第14成を示すブロック1図である。帳%’J
−にの文字が光学的に走査されて得ら11ろ文字パタ
ーンは、ラインバッファメモリ3に格納される。 この39. 、F¥−、ラインバッファメモリ3の行ア
ドレスを行アドレスレジスタlOに格納(−1列アドレ
スを夕11アドレスレジスタ11に格納する。さらに、
この発明では、ラインバッファメモリ3内で↑(数個の
文字パターンが隣接[7て々る所定の文字パターン列に
おいてその左右の境界列アドレスを予め格納する右側境
界レジスタ12および左側境界レジスタJ3を設ける。 この右1111および左側境界レジスタJ 2 、1.
9によシ、列アドレスを指定さハた文字パターン列(例
えば7 )’ L/ :X a −bまでの文字パター
ン)の水平射影情報り、は、水平射影レジスタ14に格
納される。また、づインバッファメモリ3内の各文字パ
ターンの114直射影情報1)!は、垂直射影レジスタ
J5に格納される。文字切出し回路4は、水平射影情報
l)1よ?よび垂直射影情報l)、吟にノNづいて、う
・fンパツファメモリ3から1文字分の文字パターンの
切出し処理(文字位置の正規化等のi’lil )JL
、(j! 苓:含む)を行なう。この1文字分の文字パ
ターンは、標本化回路5で情報圧縮IA+、 31μ等
が斤さJll、標本化メモリ16に格納される。そして
、(ン14本化メモ’)J6V3の文字パターンと辞j
゛ツメそり(第1図の6)に予め(・3納された標準パ
ターンとの間で類似度肝↑;
7.i JIY%置に関すZ)。 〔発明の技術的背杖とその問題点〕 一般に、光学的文字読取装置(以下00 Itと、称す
る)の文字認識方式には、大別1.てT1(ねp、。 わぜ方式と特徴抽出方式がある。このiliね合わせ力
式の中では、類似度方式が多用さねている。 このような方式の0OTLでは、1ii1’7i1.第
1図に示すように、用紙(以下帳塾と称する)ノー1−
の文字は、光1F?変換回路2で光学的に走査さノ12
値化のイメージデータに変換さtする。この2植化のイ
メージデータである1行分の文字パターンは、1度ライ
ンバッファメモリ、1に)j3 &M 8れる。 このラインバッファメモリ3から1文字分の文字パター
ンが、文字切出し回路4切出される。 この切出された1文字分の文字パターンは、通當文字位
置の正規化停の前処理が行なわれて標本化回路5に入力
する。標本化回路5け、文字パターンに対する情報圧縮
処理を行なって、この文字パターンと辞書メモリ6に予
め記(、(& i ftだ標準パターンとで類似度計算
を行なう。この類似度肝t11の結果、が文字811
jiik回路2に入力して、文字認識処、3!I!がh
されることにな、/り。 ところで、上記のようfr、 ljね合わl一方式AH
,’iの00Rでは、文字位1tffの正規化等のよう
々文字パターンに対する前処理が文字読取率に多大々影
村を与える。例えば、帳票1上に印字不完全の活字文字
があるり1合、この文字パターンに対する文字イ1装置
の正規化等の前処理を行斤ったとする。この前処理は、
通常文字の大きさの中心を2(準にして位Vlの正規化
を行りうので、第2図に示すようか文字パターンP11
−J本来の中心位置Oよシずれた位置(例えば下方向に
lだけずれる)に設定されることになる(例えばメモリ
内の位置)。したがって、帳票1上の文字の大きさを弯
えるような場合、印字不完全の文字等に対する文字認識
処理が田離となり、文字読取率が低下するなどの欠点が
あった。 〔発明の目的〕 この発明は、」二配の事情な舷みてなされたもので、帳
票上の′5c才を読l1l(る場合、その文字が印字不
完全で本来の文字の大きさを変えるような場合でも、文
学誌81λ処理を確実に行斤うことかでき1文字読11
X率を大幅にit’bめることができる光学的文字h・
a: 1tv装置を1.−供することを1′1的とする
。 〔発明の11’!f要〕 すなわち、この発明においてt:t 、ラインバッファ
メモリに1行分の文字パターン号ノ格納17、この文字
パターンの中で複数個のl!ilr打する文字パターン
列の境界列アドレスを境界アドレス1/ジスタで指定す
る。この境界列アドレスを指定された」1配文字パター
ン列の水平射影の情報によル、その文字パターン列の中
で1文字分の各文字パターンの位置の正規化を行斤うも
のである。 〔発明の実施例〕 以下図面を参jK11.、てこの発明の一実Mli例に
ついて説明する。第3図はこの発明に係る0 0 It
の部分的第14成を示すブロック1図である。帳%’J
−にの文字が光学的に走査されて得ら11ろ文字パタ
ーンは、ラインバッファメモリ3に格納される。 この39. 、F¥−、ラインバッファメモリ3の行ア
ドレスを行アドレスレジスタlOに格納(−1列アドレ
スを夕11アドレスレジスタ11に格納する。さらに、
この発明では、ラインバッファメモリ3内で↑(数個の
文字パターンが隣接[7て々る所定の文字パターン列に
おいてその左右の境界列アドレスを予め格納する右側境
界レジスタ12および左側境界レジスタJ3を設ける。 この右1111および左側境界レジスタJ 2 、1.
9によシ、列アドレスを指定さハた文字パターン列(例
えば7 )’ L/ :X a −bまでの文字パター
ン)の水平射影情報り、は、水平射影レジスタ14に格
納される。また、づインバッファメモリ3内の各文字パ
ターンの114直射影情報1)!は、垂直射影レジスタ
J5に格納される。文字切出し回路4は、水平射影情報
l)1よ?よび垂直射影情報l)、吟にノNづいて、う
・fンパツファメモリ3から1文字分の文字パターンの
切出し処理(文字位置の正規化等のi’lil )JL
、(j! 苓:含む)を行なう。この1文字分の文字パ
ターンは、標本化回路5で情報圧縮IA+、 31μ等
が斤さJll、標本化メモリ16に格納される。そして
、(ン14本化メモ’)J6V3の文字パターンと辞j
゛ツメそり(第1図の6)に予め(・3納された標準パ
ターンとの間で類似度肝↑;
【が行表われ。
その計算結!にに基づいて文字認識回路(gin 11
”(1の7)で文字認識処理がなされる。 このよりな414成において、その)IitJ作を説明
すると、上記のように帳票上の文字F:II)シ学的に
走1デされ、その1行分の文字パターンがラインバッフ
ァメモリ3に格納される。そ1〜て、このラインバッフ
ァメモリ3から1文字分の文字パターンが、文字切出し
回路4により予め設定されるツメ“−マッドコントロー
ル精力IJ咎1ニノ、曳二づし)て切出しされる。具体
的には、文字Illll出目路4は、行アドレスレジス
タ10および列アI鞘/スレジスタ11で各アドレス1
7定さJ’した文字パターンを切出すことになる。この
場合、文字切出し回路4は、水平射影レジスタ14、垂
直f(、l影しジスタ15の各射影情報]’) H、1
12」?よびフこのような通常の文字切出1−処理に対
し゛C1この発明では、ラインバッファメモリ3から読
出すべき文字パターン(例えば「1」)の隣接する例え
ば3文字分の文字パターン列(す斤わち、列アドレスa
、hの範囲の3文牢)に対する水平射影情報1)1を水
平射影レジスタ141−格納する。このi17.合、3
文字分の文字パターン列の左側、右側ルリ境界アドレス
a、hけ、子・れぞれ左側境界1/ジスタ13と右側境
界レジヌタノ2により指定される。そして、文学上N+
11..回W7.4 it 、上n己3文字分の文字パ
ターン列から各文字パターンを(′J1出す際、各文字
パターンについて水平射影レジスタJ4の水平射影情報
■)。 を用いて、縦方向の位置の正規化等を行かりことにhる
。iた、この烏合、横方向の位置の正規化等は、従来と
同様に垂直射影レジスタ15の継筒射影情報■)、にノ
Nづいてなされることにhる。 とのJ:うにして、文字切出し回路4で切出さノまた】
文字分の文字パターンkl、れ°1木本化路5で情1圧
縮等の処理がなされ、ね本化メモリ16に格納される。 このu7.合、」1記のような文字パターンに対する縦
方向の位置の正規化等が行にわれるため、第4図に示す
ように印字不完全で本来の文字の大きさが費ゎるような
文字パターンのJJA合でも、正1.いも′r置す斤ゎ
ち文字の中心が標本化メモリ16の中心0に位置するよ
うにhる。したがって、標本化メモリ16内の文字パタ
ーンと辞411′メモリに予め餡納さJまた1、ili
準パターンとの間で類佃1度計pが行なゎノ1.その計
℃I結果に基づいて文字認識回路でその文字パターンの
文字gl、(1ilB処理を確実に行なうことができる
。すなわち、(η来のように1文才分の文字の大きさの
中心を基準にした位置の正規化等を行々つだ場合に比較
して、この発明の場合には’fl!2合わせ方式の文字
RX !6に率を大幅に向上できることになる。 なお、土114実bili例において、例えば3文牢分
の文字パターン列について水平射影情報11をIIY
IIIず場合を述べたが、3文牢の全てが印字不完全の
場合には当然ながら4文字分以」二の文字パターン列の
水平射影情報を取出す必萼がある。しかしながら、その
よう:&ilA合は極めて希であるから、特に間PrC
1にけならない。 〔発明の効果〕 以」二訂述したようにこの発明によれば、1ね合わせツ
ブ式等のOOItにおいて、帳系上の文字をL′、:1
1yる際、その文字が印字不完全で本来の文字の大きさ
を変えるような場合でも、前処理としての文字位置の正
規化静を正確に行なうことができ、確実な文字切出し処
理を行りうことができる。したがって、文字認識回路を
確実に行なうことができ、文字読11y率を大幅に高め
ることができるものである。
”(1の7)で文字認識処理がなされる。 このよりな414成において、その)IitJ作を説明
すると、上記のように帳票上の文字F:II)シ学的に
走1デされ、その1行分の文字パターンがラインバッフ
ァメモリ3に格納される。そ1〜て、このラインバッフ
ァメモリ3から1文字分の文字パターンが、文字切出し
回路4により予め設定されるツメ“−マッドコントロー
ル精力IJ咎1ニノ、曳二づし)て切出しされる。具体
的には、文字Illll出目路4は、行アドレスレジス
タ10および列アI鞘/スレジスタ11で各アドレス1
7定さJ’した文字パターンを切出すことになる。この
場合、文字切出し回路4は、水平射影レジスタ14、垂
直f(、l影しジスタ15の各射影情報]’) H、1
12」?よびフこのような通常の文字切出1−処理に対
し゛C1この発明では、ラインバッファメモリ3から読
出すべき文字パターン(例えば「1」)の隣接する例え
ば3文字分の文字パターン列(す斤わち、列アドレスa
、hの範囲の3文牢)に対する水平射影情報1)1を水
平射影レジスタ141−格納する。このi17.合、3
文字分の文字パターン列の左側、右側ルリ境界アドレス
a、hけ、子・れぞれ左側境界1/ジスタ13と右側境
界レジヌタノ2により指定される。そして、文学上N+
11..回W7.4 it 、上n己3文字分の文字パ
ターン列から各文字パターンを(′J1出す際、各文字
パターンについて水平射影レジスタJ4の水平射影情報
■)。 を用いて、縦方向の位置の正規化等を行かりことにhる
。iた、この烏合、横方向の位置の正規化等は、従来と
同様に垂直射影レジスタ15の継筒射影情報■)、にノ
Nづいてなされることにhる。 とのJ:うにして、文字切出し回路4で切出さノまた】
文字分の文字パターンkl、れ°1木本化路5で情1圧
縮等の処理がなされ、ね本化メモリ16に格納される。 このu7.合、」1記のような文字パターンに対する縦
方向の位置の正規化等が行にわれるため、第4図に示す
ように印字不完全で本来の文字の大きさが費ゎるような
文字パターンのJJA合でも、正1.いも′r置す斤ゎ
ち文字の中心が標本化メモリ16の中心0に位置するよ
うにhる。したがって、標本化メモリ16内の文字パタ
ーンと辞411′メモリに予め餡納さJまた1、ili
準パターンとの間で類佃1度計pが行なゎノ1.その計
℃I結果に基づいて文字認識回路でその文字パターンの
文字gl、(1ilB処理を確実に行なうことができる
。すなわち、(η来のように1文才分の文字の大きさの
中心を基準にした位置の正規化等を行々つだ場合に比較
して、この発明の場合には’fl!2合わせ方式の文字
RX !6に率を大幅に向上できることになる。 なお、土114実bili例において、例えば3文牢分
の文字パターン列について水平射影情報11をIIY
IIIず場合を述べたが、3文牢の全てが印字不完全の
場合には当然ながら4文字分以」二の文字パターン列の
水平射影情報を取出す必萼がある。しかしながら、その
よう:&ilA合は極めて希であるから、特に間PrC
1にけならない。 〔発明の効果〕 以」二訂述したようにこの発明によれば、1ね合わせツ
ブ式等のOOItにおいて、帳系上の文字をL′、:1
1yる際、その文字が印字不完全で本来の文字の大きさ
を変えるような場合でも、前処理としての文字位置の正
規化静を正確に行なうことができ、確実な文字切出し処
理を行りうことができる。したがって、文字認識回路を
確実に行なうことができ、文字読11y率を大幅に高め
ることができるものである。
第1図は従来の光学的文字読取装置の基本的41「f成
を示すブロック図、ur 21!41d文字パターンの
位置の正規化の状態を説明するための図、編3図はこの
発明の一実施例に係る光学的文字読11V装置の部分的
411成を示すブロック図、第4図は文字パターンの位
11・tの正規化の状態を説明する″ための図である。 、9・・・ラインバッファメモリ、10・・・行アl’
l/スレジスタ、1ノ・・・列アドレス1/ジスタ、
12・・・右側境界レジスタ、J3・・・左1111
jIii界レジスタ、14・・・水平射影レジスタ、1
5・・・′N1シ的射iIi;、+、 、ンスタ。 出願人代理人 弁理士 鈴 江 武 彦第1図 す 第2図 第3図 第4図
を示すブロック図、ur 21!41d文字パターンの
位置の正規化の状態を説明するための図、編3図はこの
発明の一実施例に係る光学的文字読11V装置の部分的
411成を示すブロック図、第4図は文字パターンの位
11・tの正規化の状態を説明する″ための図である。 、9・・・ラインバッファメモリ、10・・・行アl’
l/スレジスタ、1ノ・・・列アドレス1/ジスタ、
12・・・右側境界レジスタ、J3・・・左1111
jIii界レジスタ、14・・・水平射影レジスタ、1
5・・・′N1シ的射iIi;、+、 、ンスタ。 出願人代理人 弁理士 鈴 江 武 彦第1図 す 第2図 第3図 第4図
Claims (1)
- 用紙」二手・光学的に走査して得られる1行分の文字パ
ターンを格納するラインバッファと、このラインバッフ
ァ内で社数個の文字パターンが隣接しC斥る所定の文字
パターン列のJJl界列アドレスを格納する境界アドレ
ス指定手段と、この境界アドレス、lj75ν手段でア
ドレス指定される」−111文牢文字パターン水平射影
の情報にょシセの文字パターン列の各文字パターンの位
歯゛の正規化を行なう前処理手段とを具備してなること
を特徴とする光学的文字読取装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP57159958A JPS5949670A (ja) | 1982-09-14 | 1982-09-14 | 光学的文字読取装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP57159958A JPS5949670A (ja) | 1982-09-14 | 1982-09-14 | 光学的文字読取装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS5949670A true JPS5949670A (ja) | 1984-03-22 |
Family
ID=15704882
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP57159958A Pending JPS5949670A (ja) | 1982-09-14 | 1982-09-14 | 光学的文字読取装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS5949670A (ja) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5734281A (en) * | 1980-07-02 | 1982-02-24 | Ibm | Segmentation device |
-
1982
- 1982-09-14 JP JP57159958A patent/JPS5949670A/ja active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5734281A (en) * | 1980-07-02 | 1982-02-24 | Ibm | Segmentation device |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2575539B2 (ja) | 書類上の金額フィールドの位置特定方法および識別方法 | |
Kleber et al. | Cvl-database: An off-line database for writer retrieval, writer identification and word spotting | |
US5844991A (en) | Script identification from images using cluster-based templates | |
US20190019055A1 (en) | Word segmentation system, method and device | |
JPH01253077A (ja) | 文字列検出方法 | |
Caldeira et al. | Industrial optical character recognition system in printing quality control of hot-rolled coils identification | |
RU2597163C2 (ru) | Сравнение документов с использованием достоверного источника | |
US6179484B1 (en) | Two-pass document image processing method and system | |
JPH0430070B2 (ja) | ||
Magotra et al. | A Comparative analysis for identification and classification of text segmentation challenges in Takri Script | |
JPS5949670A (ja) | 光学的文字読取装置 | |
Kumar et al. | Line based robust script identification for indianlanguages | |
Desai et al. | An approach for text recognition from document images | |
Lakshmi et al. | A high accuracy OCR system for printed Telugu text | |
JPS6316795B2 (ja) | ||
JPH02202689A (ja) | 文字認識装置 | |
Premaratne et al. | Recognition of printed sinhala characters using linear symmetry | |
JP2675303B2 (ja) | 文字認識方法 | |
JP2917396B2 (ja) | 文字認識方式 | |
JPH02230484A (ja) | 文字認識装置 | |
JPS5949671A (ja) | 光学的文字読取装置 | |
Ravikumar et al. | Segmentation of Words From Unconstrained Multilingual Hand written Documents | |
JP4132234B2 (ja) | 文字認識方法および装置および文字認識プログラムを記録した記録媒体 | |
JP2784004B2 (ja) | 文字認識装置 | |
KR20220168787A (ko) | 만주어의 글자 추출 방법 및 이를 수행하는 시스템 |