JPH0519753B2 - - Google Patents

Info

Publication number
JPH0519753B2
JPH0519753B2 JP59171018A JP17101884A JPH0519753B2 JP H0519753 B2 JPH0519753 B2 JP H0519753B2 JP 59171018 A JP59171018 A JP 59171018A JP 17101884 A JP17101884 A JP 17101884A JP H0519753 B2 JPH0519753 B2 JP H0519753B2
Authority
JP
Japan
Prior art keywords
character
characters
profile
pitch
character image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP59171018A
Other languages
English (en)
Other versions
JPS6077279A (ja
Inventor
Maachin Betsudonaa Guregorii
Baanaado Furaiyaa Jooji
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPS6077279A publication Critical patent/JPS6077279A/ja
Publication of JPH0519753B2 publication Critical patent/JPH0519753B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/158Segmentation of character regions using character size, text spacings or pitch estimation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は光学式文字認識、とりわけ1行の文字
の文字イメージの切出し方法に関する。
[従来技術] 光学式文字認識(OCR)装置の重要な機能の
1つとして、1行の文字を個々の文字イメージに
切出すという機能がある。これによつて個々の文
字を認識または識別することができる。
個々の文字は、一般に、水平線に沿つて連続的
に書かれている。各々の水平線もまた必要なもの
として書かれている。文字を水平方向に読むとす
ると、一般的には、OCR処理で垂直位置合せパ
ラメータを用いて文書の行を検出する。一方、水
平方向の位置合せは、一般に、切出しと呼ばれて
いる。切出しは、水平方向の文字ストリングを
個々の文字に分離する(即ち単語から個々の文字
に分離する)という処理である。切出し処理によ
つて、走査された文字の視覚的イメージを2値化
して、2値映像データパターンとして記憶するこ
とができる。2値映像データパターンは、理想的
には、認識される文字に係るデータしか有しな
い。データは、通常、黒または白の絵素として符
号化される。こうした絵素はその場所に文字部分
が存在する(黒)かまたは文字部分が存在しない
(白)かということを表わしている。文字が一旦
認識されると、その文字のコード表示(通常は16
進の1バイト)がデータ処理装置に送られる。
従来の文字イメージ切出し技術は、最も困難な
場合でも対応できるように設計されているので、
高価かつ複雑でしかも処理速度が遅く、多くのハ
ードウエアが必要であつた。従つて、従来の技術
は、今日のマイクロプロセツサとは互換性がな
い。例えば、米国特許第3256876号に示されるよ
うな初期の切出し技術は、隣接する2つの文字か
ら、文字ピツチを決定し、このピツチデータを用
いて各々の文字空間を幾つかの領域に分離するも
のである。各々の連続する領域を垂直的に走査し
て、各領域内でいつ文字が完全に走査されたかを
調べるための論理的検査が行われる。文字の高さ
及び幅を論理的に分析してその文字の切出しを行
う。ピツチデータを用いて、他に切出し点が全く
存在しない場合にのみ、その文字の切出しを行
う。
米国特許第4045773号にも初期の切出し手法が
示されている。ここでは、走査された文字が文字
枠内に入つているかどうかに基づいて、切出し点
の調整を行う。水平方向に書かれた文字列は、文
字枠を分離する行間隔が与えられた後に、垂直方
向に走査される。走査されたパターン部分を投影
して論理値“1”の存在を検査する。論理値
“1”は黒点を表わす。この検査によつて走査さ
れたパターン部分がブランクであるか、または、
ブランクでないのかを確定する。1つの文字の開
始点と終了点が確定されると、それらを用いてそ
の文字の中心が計算される。その文字が極端に小
さい場合は、第1の開始点及び終了点を超えて走
査を続行し、その文字が2以上の副パターンを有
するのか、または、それをノイズとして除去すべ
きか、を判定する。副パターンまたは文字の中心
が計算されると、計算された中心の位置と文字枠
の中心の位置とを比較する。文字枠内に中心を有
する文字または副パターンは全て、1つの文字パ
ターンとして切出される。
[発明が解決しようとする問題点] 従来の文字イメージ切出し方法は機能的な観的
からは満足のいくものであるが、それらは一般に
は特別な仕様のハードウエアを必要とするので複
雑かつ高価であつた。
本発明はこの問題を解決することを目的として
いる。本発明は、切出しに係る諸計算を論理的か
つ算術的手法を用して実行するので、汎用のマイ
クロプロセツサを用いてこれを装備するのに適し
ている。以下これを説明する。
[問題点を解決するための手段] 本発明では、文字ストリングの水平方向のプロ
フアイルを用いて、線形回帰手法に基づき、その
文字ストリング内で最適の切出し点を算定する。
重なり合つた文字、くつついた文字、アンダーラ
インを伴う文字、複数部分からなる文字、及び空
白領域等の全ての文字を確実に切出すことができ
る。さらに、特定の文字認識のフイードバツクを
利用するという切出し認識再試行手法のような検
証ステツプを用いて、切出しの正確さを高めるこ
ともできる。
水平方向の文字行が走査されると、空白領域、
重なり合つた文字等を含む文字を表わす走査線デ
ータが連続的に生成される。各走査線データは、
2値の絵素で構成される。連続的に文字領域(ま
たは文字フイールド)を走査して得られたデータ
は論理的にORされて、文字線分の水平方向のプ
ロフアイル(2進データ)を生成する。水平方向
のプロフアイルの一連の連続した2進値“1”が
一連の連続した絵素(黒)を表わし、水平方向の
プロフアイルの一連の連続した2進値“0”が一
連の続した絵素(白)を表わす。一連の2進値
“1”は水平方向の文字の幅に対応し、一連の2
進値“0”は文字と文字との間の分離領域、また
は、複数部分から成る文字の各部分の間の分離領
域、に対応する。1つの文字行のプロフアイル
は、一連の黒及び白の絵素から成る。そのうち、
黒の絵素が連続的に並んだ部分をプロフアイル・
セグメントという。各セグメントは1以上の文
字、または複数部分から成る文字に独立部分に対
応している。
文字行の水平方向のプロフアイル内で、1以上
の連続する2進値“1”の中心が位置決めされ
て、線形回帰が行われる。
水平方向の切出し軸を例えばX軸(X方向の絵
素の数をこの軸にとる)としてこれに対する文字
位置の相対的な番号(即ち文字番号1、文字番号
2、……)の関係について線形回帰を行う。例え
ば、文字番号2がx2個目の絵素の所でその中心を
有し、文字番号3がx3個目の絵素の所でその中心
を有する(ただしx3はx2より大である)という具
合である。
線形関数のアルゴリズムは、汎用のマイクロプ
ロセツサによつて利用できるソフトウエアで装備
してもよい。線形関数のアルゴリズムは、1つの
文字領域の中心が適切なプロフアイル・セグメン
トの中心から算定できるという条件を利用する。
文字ピツチが既知であれば、文字ピツチは線形関
数の傾きに等しいという理由から、計算を要する
のは線形関数とX軸との交点(切片)だけであ
る。全ての文字の中心が、各々の文字領域の中心
に一致しているか、ほぼ一致していなければ、た
つた1つの適切なプロフアイル・セグメントの中
心によつて1行の文字全体の切出し点を生成でき
る。何故なら、他の文字の切出し点はピツチの整
数倍となるからである。
文字ピツチが未知であれば、プロフアイル・セ
グメントの中心を用い、最小2乗線形回帰アルゴ
リズムによる最小2乗の原理のような或る原理に
基づいて測定データと最もよく一致する直線を定
義するための回帰を実行して、文字ピツチを決定
してもよい。このよく知られた統計的アルゴリズ
ムによつて、或る直線を一組の測定点(プロフア
イル・セグメントの中心をグラフにプロツトした
もの)に合わせる(各測定点とその直線との距離
の2乗和が最小になるように合わせる)。こうし
て最小2乗法によつて測定点と最もよく一致する
直線が決まれば、この直線の傾き即ち文字ピツチ
が決まる。この直線と座標系との交点から、前述
のような水平方向の軸(X軸)の切出し点を生成
する。
以上に説明したように、本発明は、文字イメー
ジが所定のピツチを有するような場合の光学式イ
メージシステムの文字切出し方法に関する。光学
式イメージシステムは、一連の走査線データ形式
で文字情報を生成する。走査された文字イメージ
のプロフアイルを生成し、一定の基準を満たすプ
ロフアイル・セグメントを1つ選択する。選択さ
れたプロフアイル・セグメントの中心を位置決め
して、文字イメージ間の切出し点を文字イメージ
ピツチ及び位置決めされたプロフアイル・セグメ
ントの中心に1次関数として確立する。切出し点
はピツチの整数倍である。
[実施例] 第2図について説明する。第2図は、通常の構
成により動作する光学式の走査器10が、水平方
向に文字が書かれた文書11を走査する様子を表
わしている。一般に、文字は書かれている方向
(水平方向)に平行に走査される。走査器10は、
通常、文書11または走査機構のいずれかを移動
することによつて文書11の全体の高さを検査
し、適切な幅が視界に入るように選択して文書1
1の全体の幅を検査する。文書11は、水平方向
に隣接した文字枠13を備えていてもよい。文字
枠13は、手書き文字が適切な間隔を有するよう
に文字イメージの位置を決めるものである。文字
枠13は所定のピツチを有しており、文字が位置
する領域の外枠を定めて一対一の対応をつける。
走査器10は文書11の文字イメージを表わす
情報を生成する。この情報は、文書11の暗部分
及び明部分(即ち文字)を表わす連続する2値走
査線データである。この情報は、一連の2値化電
気信号であり、各々の電気信号即ちビツトは1絵
素に対応し、走査線の構成単位になつている。
各々の走査線は、数百以上の絵素を有する場合も
ある。
第3図の例を用いて詳述すれば、走査線アドレ
ス位置120においては、走査器10はその走査
線上の空白20を表わす論理値“0”と、その走
査線上に在る文字イメージを表わす(図中黒丸で
示す)論理値“1”のような2値走査線データを
生成する。文字枠13は走査器10には認識され
ないようになつているので、22に示すように数
字5の端が文字枠13に入り込んで文字枠上に文
字イメージが存在する場合を除き、文字枠13は
論理値“0”によつて表わされる。走査器10は
文字行に沿つて連続的に水平走査を行う。白地部
分の走査を除くと、各々の走査線は一般にそれぞ
れ異なつたデータを有している。この様子を、走
査線アドレス位置120と走査線アドレス位置1
80において比較して示す。
水平方向の走査線データを論理的にOR機能で
組合せて、走査された文字行に対して水平方向の
文字行のプロフアイルを生成する。水平方向のプ
ロフアイルは、文字の幅と、文字間の空白と、を
表わしている。
次に動作を説明する。走査器10は文書11の
文字イメージを表わす情報を生成する。この情報
は、通常、連続する2値走査線データであり、こ
のデータは文書11の暗部分及び明部分従つてそ
の上の文字を表わしている。走査器10は連続的
に水平走査を行い、各走査の間、走査器10は空
白を表わす論理値“0”及び文字イメージの存在
を表わす論理値“1”を生成する。水平方向のプ
ロフアイルを生成する方法の1つとして、1つの
文字行に対して所定数の水平方向の走査線データ
を用意しこれを、走査される文書の絵素位置に対
応する位置を有するレジスタに順次に記憶すると
いう方法がある。初めに、レジスタをクリアして
(全て論理値“0”)、水平方向の走査線データを
順次にレジスタに与えることにより、各データの
論理和が得られる。走査線データの論理値“1”
に対して各々、対応するレジスタのビツトが論理
値“1”にセツトされ、文字イメージの外形全体
が走査された後にレジスタがクリアされるまで
は、論理値“1”が維持される。空白しか存在し
ないような絵素位置に対しては、レジスタは論理
値“0”のままである。全ての走査線データがレ
ジスタが供給されると、それは、文字データがど
の水平位置を占めるかということを表わす。この
データが水平方向のプロフアイルを表わしてい
る。
こうして生成された水平方向のプロフアイル
は、空白(論理値“0”)によつて分離される一
連の黒セグメント(論理値“1”)として現われ
る。黒セグメントの一例は第3図のPで示した。
黒セグメント23は、走査された文字イメージの
幅及び水平方向の位置に対応し、空白24は、隣
り合う文字と文字との間の分離領域に対応する。
これまでの説明ではプロフアイルは水平方向であ
つたが、文字を読む方向と平行であればよく、従
つて読む方向が垂直な場合は垂直方向のプロフア
イルが生成されることになる。
文字イメージの各々の水平行に対して、対応す
る水平方向のプロフアイルの1つの黒セグメント
23が所定の最大基準及び最小基準を満たしてい
るかどうかを検査する。黒セグメント23が、第
3図の数字“1”に示すように、極端に狭い場合
は、所与の文字位置(即ち文字枠13)内におけ
る文字イメージの存在場所が極端にずれているか
または、そのセグメントがノイズを表わしている
可能性があるという理由から、そのセグメントは
検査の対象から外される。プロフアイル・セグメ
ントが、第3図の数字“5”に示すように、右方
向に不注意に延長されていて極端に広い場合は、
その文字イメージが所与の文字枠の境界を超えて
延長されている可能性があるという理由から、こ
のプロフアイル・セグメントも検査の対象から外
される。第3図の数字“3”に示すような、プロ
フアイル・セグメントが所定の範囲内に入つてい
れば、その文字が所与の文字枠13の中央に所在
する確率は非常に大きい。具体的に言うと、25.4
mmあたり200個の絵素が存在しかつ25.4mmあたり
10個の文字が入るようなピツチであれば、黒セグ
メントの所定の幅は絵素12個から20個の範囲であ
る。この幅の範囲はピツチによつて異なる。例え
ば、25.4mmあたり12個の文字が入るようなピツチ
であれば、所定の幅は絵素10個から17個の範囲で
ある。妥当なプロフアイル・セグメントを有する
文字は、通常、文字行の最初の2〜3文字内にあ
り、たいていは最初の文字であることが実験的に
わたつている。
必要条件を満たした水平方向のプロフアイル・
セグメントが1つ選択されると、その中心が位置
決めされる。この中心は、その文字の中心及び所
与の文字枠の中心にほぼ一致するという確率は大
きい。これを“算定中心”と呼び、所与の文字枠
の真の中心を“実中心”と呼ぶことにする。
第1図について説明する。ここでは、所与の文
字枠の中心が、対応するプロフアイル・セグメン
トより得られた文字自身の中心から算定し得ると
いう条件を用いている。文字イメージの中心即ち
その文字のプロフアイル・セグメントの中心と文
字ピツチを既知量として線形回帰の手法を適用す
ることにより、1行の文字の各切出し点を決定す
ることができる。文字ピツチはこの1次関数の傾
きに等しく、選択されたプロフアイル・セグメン
トの中心は、切出し点を定義する関数に対応した
直線上の1点を定める。従つて、所与の文字位置
の中心のための算定された直線の方程式は、 C=an+b たたしa=既知のピツチ b=最初の妥当文字位置の算定中心 n=文字番号(0、1、2、……) となる。
同様にして、切出し点算定のための方程式は、 X=an+(b−a/2) となる。
a/2は最初の文字枠の左端からその文字枠の
中心までの距離を表わす。生成される切出し点は
既知ピツチの整数倍であるので正確な切出しが可
能である。
第4図について説明する。文字ピツチが未知量
ならば、文字の相対位置及び各々のプロフアイ
ル・セグメントの中心を用いて最小2乗回帰によ
り文字ピツチを確定する。この回帰のための方程
式は、 oi=1 [xi−(b+iα)]2 ただしbはX軸との切片 αは1/傾き、即ち1/ピツチ xは原点からプロフアイル・セグメントの中心
までの距離 となる。
この方程式は1つの直線を定義し、その傾きお
よびX軸との切片を確定することができる。直線
の傾き(即ち文字ピツチ)がわかつている場合
は、最小2乗基準の解決は、唯一の変数、即ち、
X軸(水平方向の切出しの軸)との切片bに関す
る2乗和の最小化の問題に帰着する。この情報が
得られたならば、第1図と共に記述した方法を用
いることができる。文字ピツチの決定は1972年3
月付のIBM Technical Disclosure Bulletin 第
14巻第10号に示されるような別の方法もある。
確定された切出し点を、他の技術または実験的
に得られた規則によつて、検証または調整しても
よい。例えば、文字と文字との間の空白領域と確
定された切出し点とが一致すればこれは、確定さ
れた切出し点が実際の切出し点であるということ
を示唆する。確定された切出し点が実際の切出し
点に一致していなければ、確定された切出し点を
所定量の範囲内で左右に移動させて実際の切出し
点がその範囲内にあれば、そこを新たな切出し点
として確定する。このようにして切出し点を調整
することによつて、重なり合つた文字、くつつい
た文字、または、くずし字を容易に認識すること
ができる。調整された切出し点によつて誤つた認
識が生じたときは、元の切出し点を用いて認識を
再試行してもよい。
文字ブランクの検知、アンダーラインを付した
文字の切出し、及びノイズの除去のような、異質
ではあるが比較的頻度の高い認識事項にとつても
また、本実施例の切出し方法はこれを解決する。
文字ブランクは全ての論理値が“0”のプロフア
イル・・セグメントを有するので、余分な処理を
迂回して、水平方向のプロフアイルから、直接、
認識される。重なり合つた文字は、例えば文字イ
メージの或る特定の部分(即ち、下方部分、中央
部分、または上方部分)のみに基づいてプロフア
イル・セグメントを生成することによつて切出す
ことができる。理想的には、文字イメージの省略
した部分は重なり部分を含む部分となるであろ
う。例えば、アンダーラインを付した文字は、ア
ンダーラインを含まない文字イメージ部分即ち文
字イメージの上方部分のみに基づいてプロフアイ
ル・セグメントを生成することによつて切出しを
行うことができる。ノイズは、プロフアイル・セ
グメントの必要最小限を確立すること、及び切出
し点の調整することによつて除去できる。
[発明の効果] 以上に説明したように、本発明により、従来技
術と比べてより簡単な文字イメージ切出し方法が
提供される。
【図面の簡単な説明】
第1図は本発明に基づいて行われる文字イメー
ジの切出しを説明する図、第2図は光学式文字認
識システムが文書を走査する様子を表わす図、第
3図は文字イメージに対する走査線とその水平方
向のプロフアイルを表わす図、第4図は文字ピツ
チ決定のために最小2乗回帰を用いた場合の切出
しを説明する図である。

Claims (1)

  1. 【特許請求の範囲】 1 文字イメージが所定のピツチを有し、光学式
    イメージシステムが一連の走査線データを有する
    文字情報を生成する光学式イメージシステムの文
    字イメージ切出し方法であつて、 (a) 走査線のデータから、めいめいが、読み取り
    方向に平行であつて読み取り方向における走査
    された単一の文字イメージのサイズをあらわ
    す、プロフアイル・セグメントを生成する段階
    と、 (b) 生成されたプロフアイル・セグメントのう
    ち、読み取り方向に沿う拡がりが所定のサイズ
    基準を満たすものを複数個選択する段階と、 (c) 該選択されたプロフアイル・セグメントの中
    心位置を決定する段階と、 (d) 上記所定の文字イメージ・ピツチによつてそ
    の勾配が決定され、上記選択された複数のプロ
    フアイル・セグメントの決定された中心位置に
    よつてそのX軸の切片が決定される一次関数を
    生成し、上記文字イメージの切出し点が、該X
    軸の切片から該ピツチの整数倍になるようにす
    ることによつて、文字イメージ間の切出し点を
    確立する段階を有する、 文字イメージ切出し方法。
JP59171018A 1983-09-29 1984-08-18 文字イメ−ジ切出し方法 Granted JPS6077279A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US537280 1983-09-29
US06/537,280 US4562594A (en) 1983-09-29 1983-09-29 Method and apparatus for segmenting character images

Publications (2)

Publication Number Publication Date
JPS6077279A JPS6077279A (ja) 1985-05-01
JPH0519753B2 true JPH0519753B2 (ja) 1993-03-17

Family

ID=24141990

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59171018A Granted JPS6077279A (ja) 1983-09-29 1984-08-18 文字イメ−ジ切出し方法

Country Status (5)

Country Link
US (1) US4562594A (ja)
EP (1) EP0138445B1 (ja)
JP (1) JPS6077279A (ja)
CA (1) CA1208785A (ja)
DE (1) DE3485825D1 (ja)

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4887301A (en) * 1985-06-05 1989-12-12 Dest Corporation Proportional spaced text recognition apparatus and method
JPH07120389B2 (ja) * 1986-02-28 1995-12-20 住友電気工業株式会社 光学的文字読取装置
US5050218A (en) * 1986-08-26 1991-09-17 Nec Corporation Apparatus for recognizing address appearing on mail article
EP0301384B1 (de) * 1987-07-30 1994-09-21 Computer Gesellschaft Konstanz Mbh Schaltungsanordnung zur Aufbereitung von schrägstehenden, insbesondere handgeschriebenen Zeichen
US4998285A (en) * 1988-03-11 1991-03-05 Kabushiki Kaisha Toshiba Character recognition apparatus
JP2822189B2 (ja) * 1988-05-19 1998-11-11 ソニー株式会社 文字認識装置及び方法
US4932065A (en) * 1988-11-16 1990-06-05 Ncr Corporation Universal character segmentation scheme for multifont OCR images
JP2644041B2 (ja) * 1989-05-08 1997-08-25 キヤノン株式会社 文字認識装置
US5040229A (en) * 1990-02-02 1991-08-13 Eastman Kodak Company Contour feature-based method for identification and segmentation of touching characters
US5172422A (en) * 1991-05-13 1992-12-15 Eastman Kodak Company Fast character segmentation of skewed text lines for optical character recognition
US5253304A (en) * 1991-11-27 1993-10-12 At&T Bell Laboratories Method and apparatus for image segmentation
US5506942A (en) * 1992-09-01 1996-04-09 Casio Computer Co., Ltd. Apparatus of outputting a train of characters
US5321768A (en) * 1992-09-22 1994-06-14 The Research Foundation, State University Of New York At Buffalo System for recognizing handwritten character strings containing overlapping and/or broken characters
US5745596A (en) * 1995-05-01 1998-04-28 Xerox Corporation Method and apparatus for performing text/image segmentation
CA2176188C (en) * 1995-05-10 2001-07-31 Shigetoshi Matsubara Facsimile apparatus capable of recognizing hand-written addressing information
CA2176691C (en) * 1995-05-15 2004-04-13 Junji Tanaka Hand-written character recognition apparatus and facsimile apparatus
US5768414A (en) * 1995-12-22 1998-06-16 Canon Kabushiki Kaisha Separation of touching characters in optical character recognition
US7721948B1 (en) * 1999-05-25 2010-05-25 Silverbrook Research Pty Ltd Method and system for online payments
US7095894B2 (en) * 2002-09-04 2006-08-22 Lockheed Martin Corporation Method and computer program product for recognizing italicized text
US7593574B2 (en) * 2005-07-01 2009-09-22 Microsoft Corporation Ink warping for normalization and beautification / ink beautification
JP4945739B2 (ja) * 2007-03-30 2012-06-06 日本電産サンキョー株式会社 文字列認識方法及び文字列認識装置
CN102681745A (zh) * 2010-12-28 2012-09-19 广东开心信息技术有限公司 手写输入系统及用户终端
US8712188B2 (en) * 2011-04-28 2014-04-29 Hewlett-Packard Development Company, L.P. System and method for document orientation detection
US20120281919A1 (en) * 2011-05-06 2012-11-08 King Abdul Aziz City For Science And Technology Method and system for text segmentation
US9734132B1 (en) * 2011-12-20 2017-08-15 Amazon Technologies, Inc. Alignment and reflow of displayed character images
CN103488281A (zh) * 2013-01-05 2014-01-01 罗朝劲 增强型手写输入方案
US9183636B1 (en) 2014-04-16 2015-11-10 I.R.I.S. Line segmentation method
CN109002821B (zh) * 2018-07-19 2021-11-02 武汉科技大学 一种基于连通域和切线斜率的网银盾数字识别方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5462731A (en) * 1977-10-28 1979-05-21 Nec Corp Character segmentation system

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3164806A (en) * 1961-11-30 1965-01-05 Control Data Corp Continuous register reading machine
US3526876A (en) * 1965-10-24 1970-09-01 Ibm Character separation apparatus for character recognition machines
US4013999A (en) * 1974-08-15 1977-03-22 Recognition Equipment Incorporated Single read station acquisition for character recognition
JPS5156139A (en) * 1974-11-13 1976-05-17 Hitachi Ltd Mojomitorisochi niokeru kiridashihoshiki
US3992697A (en) * 1974-12-27 1976-11-16 Scan-Data Corporation Character recognition system utilizing feature extraction
US4377803A (en) * 1980-07-02 1983-03-22 International Business Machines Corporation Algorithm for the segmentation of printed fixed pitch documents
NL183790C (nl) * 1980-11-21 1989-01-16 Nederlanden Staat Werkwijze voor karaktersegmentatie.
JPS5814281A (ja) * 1981-07-17 1983-01-27 Toshiba Corp 光学的文字読取装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5462731A (en) * 1977-10-28 1979-05-21 Nec Corp Character segmentation system

Also Published As

Publication number Publication date
JPS6077279A (ja) 1985-05-01
EP0138445B1 (en) 1992-07-22
US4562594A (en) 1985-12-31
DE3485825D1 (de) 1992-08-27
CA1208785A (en) 1986-07-29
EP0138445A3 (en) 1988-07-27
EP0138445A2 (en) 1985-04-24

Similar Documents

Publication Publication Date Title
JPH0519753B2 (ja)
EP0543593B1 (en) Method for determining boundaries of words in text
US5410611A (en) Method for identifying word bounding boxes in text
JP3576570B2 (ja) 比較方法
US6778703B1 (en) Form recognition using reference areas
US4408342A (en) Method for recognizing a machine encoded character
US5915039A (en) Method and means for extracting fixed-pitch characters on noisy images with complex background prior to character recognition
US5276742A (en) Rapid detection of page orientation
JPH09179937A (ja) 文書画像のセンテンスの境界の自動識別方法
JP2002133426A (ja) 多値画像から罫線を抽出する罫線抽出装置
US4962432A (en) Selective retrieval of data from microfilm images of different forms by reading a memory index form cord (bar code) recorded on each image frame
JPH0512487A (ja) バーコード文字の光学的認識システム及び認識方法
JPH07105312A (ja) 光学式文字読取装置における文字イメージのごみ除去方法及び装置
EP0601730A1 (en) Image processing method for correcting character slant
JPS6162983A (ja) 楽譜読取装置
JP2917427B2 (ja) 図面読取装置
JPH07182459A (ja) 表構造抽出装置
JPS63308689A (ja) 文字の傾き角度検出修正方式
JP3157530B2 (ja) 文字切り出し方法
Okun et al. Robust text detection from binarized document images
JP3710164B2 (ja) 画像処理装置及び方法
JPH09251508A (ja) 太バー認識によるバーコード読み取り方法
JPH0433082A (ja) 文書認識装置
JPH0535921A (ja) 文字照合装置及びそのための方法
JPH04267494A (ja) 文字切り出し方法および文字認識装置