JP3216983B2 - 文字認識装置および文字認識方法 - Google Patents

文字認識装置および文字認識方法

Info

Publication number
JP3216983B2
JP3216983B2 JP03974096A JP3974096A JP3216983B2 JP 3216983 B2 JP3216983 B2 JP 3216983B2 JP 03974096 A JP03974096 A JP 03974096A JP 3974096 A JP3974096 A JP 3974096A JP 3216983 B2 JP3216983 B2 JP 3216983B2
Authority
JP
Japan
Prior art keywords
character
height
normalized
width
buffer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP03974096A
Other languages
English (en)
Other versions
JPH09237319A (ja
Inventor
直行 根本
弘晏 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to JP03974096A priority Critical patent/JP3216983B2/ja
Priority to US08/805,196 priority patent/US6011879A/en
Publication of JPH09237319A publication Critical patent/JPH09237319A/ja
Application granted granted Critical
Publication of JP3216983B2 publication Critical patent/JP3216983B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/166Normalisation of pattern dimensions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、光学式文字認識
(OCR:Optical Character Recognition)の処理中
に行われる文字の大きさの正規化に関するものである。
文字の大きさの正規化は、様々な大きさで書かれた文字
を決められたサイズに変換することにより、文字認識率
を高めるために文字認識過程の前処理段階において行わ
れる。
【0002】
【従来の技術】文字認識において(特にパターンマッチ
ング法では)文字の正規化は何等かの方法で行われる。
ただし、単純に全ての文字を正規化文字バッファーいっ
ぱいに正規化してしまうと、『・』や『1』や『−』等
は全て真っ黒な塊になってしまう。これらの特に細くま
たは小さく書かれる文字は、正規化後も普通の文字と比
べて細い、あるいは小さくなければならない。また、縦
横比(文字高を文字幅で割った値)を常に保ったので
は、同じ文字種のものが太く書かれるか、細く書かれる
かでマッチングしにくくなる。また中心に正規化したの
では、『_』と『−』の区別がつかなくなってしまう等
難しい問題がある。なお、正規化文字バッファーとは、
文字認識過程の前処理段階で、入力文字パターンの大き
さを正規化した結果を格納するための記憶域のことであ
る。従来のある正規化方法は、文字の高さか幅がある閾
値を越えると単純にその長い方を正規化文字バッファー
の最大値に張り付け、もう一方の軸を縦横比を保つよう
にして正規化文字バッファーの中心に正規化していた。
これでは同じ文字同士でも縦横比の違いがパターンマッ
チングの不一致を生じ、別の文字として誤認されやすい
とか、同じ形で位置の違うものが同一文字種として誤認
識されやすかった。
【0003】そこで、普通サイズの文字から小さな文字
まで認識できるようにするために発明されたのが、日本
国特許番号1817562号のインターナショナル・ビ
ジネス・マシーンズ・コーポレーションの『文字認識方
式』である。この文字の正規化方法について以下に説明
する。この方法は、オリジナルの文字イメージをスケー
リングすることによって行う。スケーリングとは、図1
に示したように、文字幅wのイメージをn分割し、幅u
のイメージに変換する処理をいう。y方向のスケーリン
グの時は、文字高hを高さgに変換する処理になる。こ
のスケーリングをx方向、y方向に行うことによって正
規化が行われるが、文字を正規化文字バッファーいっぱ
いに正規化したのでは、『・』、『1』、『−』などの
小さい特殊文字は全て真っ黒な塊になってしまう。そこ
で、この正規化では、文字の位置、大きさによって正規
化方法を分けることによって小さい文字の正規化後のサ
イズが大きくなりすぎるのを避けている。この正規化で
は、文字のイメージとパラメータから『重心』と『縦横
比』を求め、それによって『通常正規化』と『特殊正規
化』に分けて処理を行う。図2に示したとおり、『特殊
正規化』では、文字が文字枠に対して一定以下の大きさ
の時に、正規化文字パターンを中央縦長、上半分、中央
横長、下半分などとし、図2の斜線部分の固定化された
決められた小エリアに張り付けて正規化する。これによ
り、小さい文字は、小さく正規化される。
【0004】ところが、この方法だと、微妙な文字の大
きさの違いでも決められた閾値で処理が分かれるため
に、正規化に不連続性(継ぎ目:シーム,seam)が
あることが問題となる。例えば、『=』のように、書き
手や前後に書かれる文字などによって大きく書かれる場
合も小さく書かれる場合もある文字の場合、閾値をまた
がるので、微妙な文字の大きさの違いにより正規化が
『通常正規化』のケースと『特殊正規化』のケースに分
かれてしまう。また、正規化後の位置も閾値を境に分か
れてしまう。このような不連続性は、文字認識の観点か
ら望ましくない。
【0005】そこで、大部分の普通の文字は固定の縦横
比で正規化文字バッファーいっぱいに張り付け、縦か横
に特別細い文字はその縦横比を保存し、小さい文字、あ
るいは特に高さの低い文字はその位置情報を反映させ、
なおかつこのように小さい特殊文字から通常の大きさの
文字に至るまで徐々に文字の大きさが変化していくシー
ムレスな正規化方式が必要である。そして、特に小さく
書かれた特殊文字の文字認識率を高める必要がある。つ
まり、シームレスな正規化方式とは、ここで述べた正規
化文字バッファーに張り付けるかどうかといった場合分
けの境界近辺で結果に大きな段差がなく滑らかに変化す
る正規化方式のことである。
【0006】
【発明が解決しようとする課題】本発明の目的は、特に
小さく書かれた特殊文字から、普通サイズの文字まで、
文字の大きさ又は位置のわずかな違いにより正規化の結
果が大きく異なることのないシームレスな正規化を実現
することである。
【0007】本発明の他の目的は、特殊文字から普通の
文字までシームレスな正規化を実現することにより、文
字の認識率を高めることである。
【0008】
【課題を解決するための手段】本発明は、シームレス正
規化を実現するために、文字のイメージと文字のパラメ
ータを実際に拡大縮小を行うスケーリング・プログラム
に与え、パラメータの調整により処理の流れを特別に変
えずに正規化を行う。スケーリング・プログラムへの入
力は、文字のイメージと文字のパラメータ(文字枠の高
さ、文字高、文字幅、文字の位置)及び、スケーリング
のために計算されたパラメータ(出力する正規化文字パ
ターンの大きさと、そのパターンと正規化文字バッファ
ーの上下、左右のスペース)等である。
【0009】また、入力文字の大きさと位置により閾値
を設けて、スケーリング・プログラムに渡すパラメータ
の計算方法を変えているが、その境での値は連続するよ
うにしてあるので、小さく書かれた文字から大きく書か
れた文字まで不連続性のないシームレスな正規化された
結果が正規化文字バッファーに得られる。
【0010】
【発明の実施の形態】図3の左側に示したとおり、従来
の正規化は、文字の位置、大きさによって『通常正規
化』と『特殊正規化』に正規化の方法を分けることによ
り、小さい文字の正規化の結果が大きくなりすぎてしま
うことを避けている。ところが、これでは、少しの文字
の大きさ、あるいは位置の違いにより正規化の結果が異
なってしまうので、小さい文字から大きな文字に至るま
でシームレスに正規化されるというものではなかった。
【0011】一方、本発明は、図3の右側に示したとお
り、文字のイメージと文字のパラメータを実際に拡大縮
小を行うスケーリング・プログラムに与え、このパラメ
ータの調整により処理の流れを特別に変えずにシームレ
スな正規化を行う。このシームレス正規化のためのパラ
メータとは、図4に示したとおり、文字枠の高さ、文字
高、文字幅、および、文字枠上端から入力文字パターン
の上端までの距離等である。以下の説明で、文字枠の高
さを f_height、 正規化前の入力文字パター
ンの高さを i_height、 正規化前の入力文字
パターンの幅をi_width、 文字枠上端から正規
化前の入力文字パターンの上端までの距離を i_up
perとする。
【0012】では、次にこれらのパラメータの値の違い
によりどのように処理が分かれるのかを図5により説明
する。入力文字パターンの大きさを正規化した結果を格
納するための記憶域である正規化文字バッファーの大き
さが24×16(縦×横)の場合を例に取り本実施例を
説明する。ここで、文字の縦横比(aspect)と
は、i_height/i_widthの値のことであ
り、o_heightは正規化後の文字パターンの高さ
を示し、o_widthは正規化後の文字パターンの
幅、t_padは正規化文字バッファーの上端から正規
化後の文字パターンの上端までの距離、l_padは正
規化文字バッファーの左端から正規化後の文字パターン
の左端までの距離を示す。
【0013】まず、ステップ100で入力文字パターン
の文字イメージの入力を得て、次にステップ110で文
字イメージのパラメータのうち、文字枠の高さにおける
正規化前の入力文字パターンの高さの割合(V=i_h
eight/f_height)を計算し、この値がV
h(本実施例における閾値は0.5)以上の場合十分な
高さがあると判定し、次にステップ120で文字の縦横
比(aspect)を計算する。なお、本実施例では、
文字を縦横共に正規化文字バッファーに張り付ける下限
値を1.0とし、上限値を1.5と設定した場合を例に
取り以下に説明すると、文字の縦横比が1.5以上の場
合には、ステップ150(縦長)に進み、縦長の文字で
あると判断されるので、o_height=24と正規
化後の文字の高さは正規化文字バッファーの高さと同じ
(最大値)になり、o_widthは24/aspec
tの値(16かそれ以下)となる。
【0014】また、ステップ110で i_heigh
t/f_heightが0.5以上であり、なおかつ文
字の縦横比が1.5より小さく1.0以上の範囲である
場合には、ステップ160(中)に進み、普通の文字の
大きさであると判断されるので、o_height=2
4、o_width=16と正規化文字バッファーいっ
ぱいに正規化される。
【0015】さらに、ステップ110で i_heig
ht/f_heightが0.5以上であり、なおかつ
文字の縦横比(aspet)が1.0より小さい時に
は、ステップ170(太)に進み、文字の幅は十分あり
横太りの文字であると判断されるので、正規化後の文字
幅はo_width=16と正規化文字バッファーの幅
の値(最大値)となり、o_heightは24×as
pectの値(24かそれ以下)となる。
【0016】また、ステップ110で、文字枠の高さに
おける正規化前の入力文字パターンの高さの割合(V=
i_height/f_height)がVh(本実施
例では0.5)より小さい場合、ステップ140でi_
width/f_heightを計算し、この値がVw
(本実施例では0.5)以上の場合十分な幅があると判
定し、次にステップ170(太)に進み、文字の幅は十
分あり横太りの文字であると判断されるので、正規化後
の文字幅はo_width=16と正規化文字バッファ
ーの値(最大値)となり、o_heightは24×a
spectの値(24かそれ以下)となる。
【0017】また、ステップ110で i_heigh
t/f_heightが0.5より小さく、なおかつス
テップ140で文字枠の高さにおける正規化前の入力文
字パターンの幅の割合(V’=i_width/f_h
eight)が0.5より小さい場合には、ステップ1
80(小)に進み、小さい特殊文字であると判断され
る。この場合、o_height=24×(1/Vh)
×(i_height/f_height)となり、o
_width=16×(1/Vw)×(i_width
/f_height)となる。どちらも3項の掛け算の
2項目はこの例では2、3項目は0.5以下になるの
で、高さは24以下で幅は16以下となる。
【0018】上述のように、o_heightとo_w
idthの値を算出した後に、ステップ190で正規化
文字バッファーの上端から正規化後の文字パターンの上
端までのブランク部分の距離t_padと、正規化文字
バッファーの左端から正規化後の文字パターンの左端ま
でのブランク部分の距離l_padとを求める。この場
合、『・』と『.』のように上下方向に関しては、どれ
だけブランク部分があるかによって異なる文字となって
しまうが、左右方向に関しては、ブランク部分の違いに
より異なる文字となるものはなく、左右のブランク部分
は同じ幅にして中心に文字をそろえた方がマッチングを
とりやすいので、本発明では、正規化後の文字パターン
の上部のブランク部分の距離t_padは元の文字の位
置情報を反映するように算出するが、正規化後の文字パ
ターンの左側のブランク部分の距離l_padは、出力
文字パターンが左右の中央になるように算出している。
【0019】そこで、l_pad=(16−o_wid
th)/2、t_pad=(24−o_height)
×i_upper/(f_height−i_heig
ht)として正規化後の文字パターン(高さ=o_he
ihgt,幅=o_width)を正規化文字バッファ
ーの中に置く準備をする。
【0020】次に、ステップ200に進み、i_hei
ght、i_width、および、上述の方法によって
算出されたo_height、o_width、l_p
ad、t_pad等をスケーリングプログラムに渡し
て、正規化文字バッファーに正規化する。そして、ステ
ップ210で正規化イメージを出力する。
【0021】図5のステップ170及びステップ180
から明らかなように、元の入力文字の高さが低いか幅に
対して相対的に低い範囲では、o_heightは、そ
の入力文字の高さに比例して調整される。また、ステッ
プ150及びステップ180から明らかなように、元の
入力文字の幅が小さいか高さに対して相対的に小さい範
囲では、o_widthは、その入力文字の幅に比例し
て調整される。従って、入力文字の微妙な大きさの違い
から正規化後の文字イメージが大きく異なってしまうこ
とはない。そして、入力文字の高さ及び幅ともにある所
定以上の大きさになるとo_height及びo_wi
dthは正規化文字バッファーの最大値を取る。このよ
うに、本発明では、閾値を設けて次に使うパラメータの
計算方法を変えているが、その閾値の境で値(o_he
ight,o_width)は連続するようにしてある
ので、小さく書かれた文字から大きく書かれた文字まで
結果の正規化後の文字パターンに不連続性はないシーム
レスな正規化となる。
【0022】例えば、f_heightが40で、i_
heightが20の時、つまりちょうどVhが0.5
になる場合に、図5において、小さい特殊文字の処理で
あるステップ180で処理が行われたとしても、o_h
eight=24×(1/0.5)×(20/40)=
24となるので、微妙な文字の大きさの違いにより他の
ステップに処理が飛んだとしても、各ステップの境界に
おいて値は連続するシームレスな正規化が実現されるこ
とがわかる。
【0023】また、本発明の長所の1つとして、この正
規化方法では特に小さくなく、縦横比が1.0以上で
1.5より小さい大半の普通の文字は正規化文字バッフ
ァーいっぱいに正規化され全く同じ大きさで扱えるた
め、パターン・マッチングに適した文字イメージを得る
ことができる。
【0024】なお、図6に正規化を行う前の元のイメー
ジを示し、従来技術により正規化を行った結果を図7に
示した。図7を見てわかるとおり、従来の正規化では、
『・』や『°』のような小さな特殊文字でも閾値を越え
ると、正規化後の文字パターンが正規化文字バッファー
いっぱいに正規化されてしまう場合があり、元のイメー
ジとは全く異なってしまっていることがわかる。それに
比べて、本発明のシームレス正規化により正規化を行う
と、図8に示したとおり、常に小さい特殊文字も適当な
大きさで適当な位置に正規化されていることがわかる。
従って、文字の認識率を高めることができるのである。
【0025】なお、本実施例では、正規化後の正規化文
字バッファーの大きさが24×16(縦×横)で、Vh
=0.5,Vw=0.5の場合を例にとって説明した
が、これらは単なる一例に過ぎず、これらの数値に限定
されるものではないことは当業者には自明なことであ
る。
【0026】また、本実施例では、文字の大きさにより
処理ステップが150乃至180と4通りに分かれる場
合を例にとって説明したが、本発明はこの場合分けに限
定されるものではなく、文字の大きさおよび縦横比によ
って複数の場合分けが可能であることは明らかである。
【図面の簡単な説明】
【図1】X方向のスケーリングを示す図である。
【図2】従来技術の正規化処理パターンを示す図であ
る。
【図3】従来の正規化と本発明のシームレス正規化との
正規化処理の流れの違いを示す図である。
【図4】正規化処理のための文字のパラメータを示す図
である。
【図5】本発明の処理の流れを示す図である。
【図6】OCRによる文字認識前の元イメージを示す図
である。
【図7】従来技術により正規化を行った結果を示す図で
ある。
【図8】本発明のシームレス正規化により正規化を行っ
た結果を示す図である。
【符号の説明】
i_height:正規化前の入力文字パターンの高さ i_width :正規化前の入力文字パターンの幅 aspect :文字の縦横比(aspect =
i_height/i_width) f_height:文字枠の高さ i_upper :文字枠上端から正規化前の入力文字
パターンの上端までの距離 V :文字枠の高さにおける正規化前の入
力文字パターンの高さの割合(V=i_height/
f_height) V’ :文字枠の高さにおける正規化前の入
力文字パターンの幅の割合(V’=i_width/f
_height) Vh :正規化後の文字パターンを正規化文
字バッファーの上下に張りつけるかを決定する定数 Vw :正規化後の文字パターンを正規化文
字バッファーの左右に張りつけるかを決定する定数 t_pad :正規化文字バッファーの上端から正
規化後の文字パターンの上端への距離 l_pad :正規化文字バッファーの左端から正
規化後の文字パターンの左端への距離 o_height:正規化後の文字パターンの高さ o_width :正規化後の文字パターンの幅
フロントページの続き (72)発明者 高橋 弘晏 神奈川県大和市下鶴間1623番地14 日本 アイ・ビー・エム株式会社 大和事業所 内 (56)参考文献 特開 平5−81479(JP,A) 特開 平3−84691(JP,A) 特開 昭63−150786(JP,A) 特開 平3−65781(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06K 9/42 JICSTファイル(JOIS)

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】大部分の普通サイズの文字は、正規化文字
    バッファーいっぱいに張り付けるが、特に小さいあるい
    は細い等の特殊文字の正規化においても場合分けの境界
    近辺で結果に大きな段差がなく滑らかに変化することを
    目的としており、入力文字パターンを1文字単位に切り
    出し、切り出した入力文字パターンを所定の大きさに正
    規化した後、入力文字パターンの認識を行う文字認識装
    置であって、 文字枠の高さにおける正規化前の入力文字パターンの高
    さの割合(V)が、正規化後の文字パターンを正規化文
    字バッファーの上下に張りつけるかを決定する定数(V
    h)以上であり、かつ、文字の縦横比(aspect)
    が文字全体を正規化文字バッファーに張り付ける上限値
    以上であるならば、正規化後の文字パターンの高さ(o
    _height)を正規化文字バッファーの高さにし、
    正規化後の文字パターンの幅(o_width)は、正
    規化文字バッファーの高さ/aspectとする手段
    と、 VがVh以上であり、かつ、aspectが文字全体を
    正規化文字バッファーに張り付ける下限値以上で上限値
    より小さいならば、o_heightを正規化文字バッ
    ファーの高さにし、o_widthは、正規化文字バッ
    ファーの幅にする手段と、 VがVhより小さく、かつ、文字枠の高さにおける正規
    化前の入力文字パターンの幅の割合(V’)が、正規化
    後の文字パターンを正規化文字バッファーの左右に張り
    つけるかを決定する定数(Vw)以上であるならば、o
    _heightは、正規化文字バッファーの高さにas
    pectをかけた値とし、o_widthは、正規化文
    字バッファーの幅とする手段と、 VがVhより小さく、かつ、V’がVwより小さい場合
    には、o_heightは、Vに正規化文字バッファー
    の高さをかけて、Vhで割った値とし、o_width
    は、V’に正規化文字バッファーの幅をかけて、Vwで
    割った値とする手段と、 を具備する文字認識装置。
  2. 【請求項2】正規化文字バッファーの上端から正規化後
    の文字パターンの上端への距離(t_pad)は、正規
    化前の入力文字パターンの文字枠における位置情報を反
    映するように設定する手段をさらに含む請求項1に記載
    の文字認識装置。
  3. 【請求項3】大部分の普通サイズの文字は、正規化文字
    バッファーいっぱいに張り付けるが、特に小さいあるい
    は細い等の特殊文字の正規化においても場合分けの境界
    近辺で結果に大きな段差がなく滑らかに変化することを
    目的としており、入力文字パターンを1文字単位に切り
    出し、切り出した入力文字パターンを所定の大きさに正
    規化した後、入力文字パターンの認識を行う文字認識方
    法であって、 文字枠の高さにおける正規化前の入力文字パターンの高
    さの割合(V)が、正規化後の文字パターンを正規化文
    字バッファーの上下に張りつけるかを決定する定数(V
    h)以上であり、かつ、文字の縦横比(aspect)
    が文字全体を正規化文字バッファーに張り付ける上限値
    以上であるならば、正規化後の文字パターンの高さ(o
    _height)を正規化文字バッファーの高さにし、
    正規化後の文字パターンの幅(o_width)は、正
    規化文字バッファーの高さ/aspectとするステッ
    プと、 VがVh以上であり、かつ、aspectが文字全体を
    正規化文字バッファーに張り付ける下限値以上で上限値
    より小さいならば、o_heightを正規化文字バッ
    ファーの高さにし、o_widthは、正規化文字バッ
    ファーの幅にするステップと、 VがVhより小さく、かつ、文字枠の高さにおける正規
    化前の入力文字パターンの幅の割合(V’)が、正規化
    後の文字パターンを正規化文字バッファーの左右に張り
    つけるかを決定する定数(Vw)以上であるならば、o
    _heightは、正規化文字バッファーの高さにas
    pectをかけた値とし、o_widthは、正規化文
    字バッファーの幅とするステップと、 VがVhより小さく、かつ、V’がVwより小さい場合
    には、o_heightは、Vに正規化文字バッファー
    の高さをかけて、Vhで割った値とし、o_width
    は、V’に正規化文字バッファーの幅をかけて、Vwで
    割った値とするステップと、 を具備する文字認識方法。
  4. 【請求項4】正規化文字バッファーの上端から正規化後
    の文字パターンの上端への距離(t_pad)は、正規
    化前の入力文字パターンの文字枠における位置情報を反
    映するように設定するステップをさらに含む請求項3に
    記載の文字認識方法。
JP03974096A 1996-02-27 1996-02-27 文字認識装置および文字認識方法 Expired - Fee Related JP3216983B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP03974096A JP3216983B2 (ja) 1996-02-27 1996-02-27 文字認識装置および文字認識方法
US08/805,196 US6011879A (en) 1996-02-27 1997-02-27 Optical character recognition system and method using special normalization for special characters

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03974096A JP3216983B2 (ja) 1996-02-27 1996-02-27 文字認識装置および文字認識方法

Publications (2)

Publication Number Publication Date
JPH09237319A JPH09237319A (ja) 1997-09-09
JP3216983B2 true JP3216983B2 (ja) 2001-10-09

Family

ID=12561371

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03974096A Expired - Fee Related JP3216983B2 (ja) 1996-02-27 1996-02-27 文字認識装置および文字認識方法

Country Status (2)

Country Link
US (1) US6011879A (ja)
JP (1) JP3216983B2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100315428B1 (ko) * 1999-12-24 2001-11-26 오길록 다국어 인쇄체 문서인식을 위한 문자 특징 추출 장치 및그 방법
US7336378B2 (en) * 2000-08-07 2008-02-26 Minolta Co., Ltd. Image processing with recognized character codes
US8873890B2 (en) * 2004-04-02 2014-10-28 K-Nfb Reading Technology, Inc. Image resizing for optical character recognition in portable reading machine
US7970812B2 (en) * 2005-03-17 2011-06-28 Microsoft Corporation Redistribution of space between text segments
US8380009B2 (en) 2010-03-11 2013-02-19 Microsoft Corporation Resolution adjustment of an image that includes text undergoing an OCR process
JP2012194705A (ja) * 2011-03-15 2012-10-11 Omron Corp 画像処理装置、画像処理方法および画像処理プログラム
JP2019159633A (ja) * 2018-03-12 2019-09-19 セイコーエプソン株式会社 画像処理装置、画像処理方法および画像処理プログラム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3784981A (en) * 1971-07-28 1974-01-08 Recognition Equipment Inc Normalizer for optical character recognition system
JPH01112388A (ja) * 1987-10-26 1989-05-01 Ricoh Co Ltd 文字認識処理方法
US4977602A (en) * 1989-11-20 1990-12-11 Eastman Kodak Company Character normalization using an elliptical sampling window for optical character recognition
DE69129284T2 (de) * 1990-08-03 1998-08-27 Canon Kk Gerät und Verfahren zur Bildverarbeitung
CA2097095A1 (en) * 1992-07-29 1994-01-30 Frank William Sinden Method of normalizing handwritten symbols
DE69435282D1 (de) * 1993-07-16 2010-04-29 Sharp Kk Bilddatenprozessor

Also Published As

Publication number Publication date
US6011879A (en) 2000-01-04
JPH09237319A (ja) 1997-09-09

Similar Documents

Publication Publication Date Title
US5212739A (en) Noise tolerant optical character recognition system
US7770129B2 (en) Viewable document section
US5054091A (en) Method for determining coordinates of circumscribed rectangular frame of each character for use in optical character reader
JP3995185B2 (ja) 枠認識装置及び記録媒体
JP3216983B2 (ja) 文字認識装置および文字認識方法
JP3852218B2 (ja) 画像処理方法および画像処理装置
JP3774494B2 (ja) データ記憶装置
EP0767941B1 (en) Automatic determination of landscape scan in binary images
CN116543004B (zh) 图像裁切方法、装置、终端设备及计算机可读存储介质
JP3122476B2 (ja) 自動文書清書装置
JP2755299B2 (ja) 画像処理方法
JPH05174182A (ja) 文書傾き角検出方法および文書傾き角検出装置
JP3095470B2 (ja) 文字認識装置
JPH05159062A (ja) 文書認識装置
JP2003317107A (ja) 罫線抽出方法及び装置
JP3246152B2 (ja) 画像拡大縮小装置
JP2612383B2 (ja) 文字認識処理方式
JP2954778B2 (ja) 画像入力装置の線図形分岐点接続方法
CN117877038A (zh) 基于文字检测的文档图像纠偏方法、系统、设备及介质
JP2516361B2 (ja) 拡大文字のスム−ジング方式
JP3138546B2 (ja) 利用者文字の作成方法
JPH10232939A (ja) 一般の文書画像から罫線を抽出する罫線抽出装置および方法
JPH1021332A (ja) 非線形正規化方法
JP2002074265A (ja) テロップパターン認識装置
JPH09167228A (ja) 画像変換方法及び装置、並びに、それらを利用した画像整形方法及び装置、並びに、それらを利用したシステム

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080803

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080803

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090803

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees