JPS62187987A - パタ−ン及び文字認識方式に使用する結合されたパタ−ンを分離する方法及び構成体 - Google Patents

パタ−ン及び文字認識方式に使用する結合されたパタ−ンを分離する方法及び構成体

Info

Publication number
JPS62187987A
JPS62187987A JP61231348A JP23134886A JPS62187987A JP S62187987 A JPS62187987 A JP S62187987A JP 61231348 A JP61231348 A JP 61231348A JP 23134886 A JP23134886 A JP 23134886A JP S62187987 A JPS62187987 A JP S62187987A
Authority
JP
Japan
Prior art keywords
segment
histogram
pixel array
columns
pixels
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61231348A
Other languages
English (en)
Inventor
デイビッド エイチ.ゾーベル
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Caere Corp
Original Assignee
Palantir Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Palantir Corp filed Critical Palantir Corp
Publication of JPS62187987A publication Critical patent/JPS62187987A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/15Cutting or merging image elements, e.g. region growing, watershed or clustering-based techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は文字認識技術に関するものである。
多種のパターン認識方式が従来公知である。この様な各
方式は、認識されるべきパターンを描写するデータを光
学的に受は取り、且つその六方パターンを「認識」する
為にそれを既知のパターンと比較する為にこのパターン
に関して成る操作を行う、パターン認識方式を示した基
本的なフローチャートを第1図に示しである。六方パタ
ーンは認識されることを所望するパターンである。デジ
タイザ12は、入カバターン11をシステムメモリ13
内に格納する為の一連のバイトに変換する。
入カバターン11が基本的に黒白の図である場合、これ
らのバイトは典型的に二進的な性質である。
デジタイザは公知であり、典型的に、ファクシミリ装置
、電子的複写装置(光学的複写装置に対して)及び従来
技術の光学的文字認識装置において使用されている。メ
モリ13は、任意の適宜のメモリ装置を有することが可
能であり、公知の構成゛のランダムアクセスメモリを包
含する。セグメンテーション14は、メモリ13内に格
納された画像データを個々の文字に分割すべく機能する
。この様なセグメンテーション即ち文字切り出しは従来
公知であり1例えば、Azriel Rosenfel
d及びAvinash C,Kak共著の「デジタル画
像処理(Digital Picture Proce
ssing)J、第2版、第2巻、アカデミツクプレス
出版、1982年、特に「セグメンテーション」と題し
た第10章に記載されている。
特徴抽出手段15は、セグメンテーション手段14から
受けとられたデータ(即ち、理想的には各文字)の各一
部を変換すべく機能し、そのデータを識別手段16によ
って使用する標準の予め定めた形態へ変換し、該識別手
段は各文字を既知の文字の組の1つに対応するものとし
て識別する。
出力手段17は、所望により、外部回路(不図示)へデ
ータ出力(典型的には、ASCII等)を供給すべく機
能する。
識別手段16は、パターン認識方式において典型的に使
用されている。更に詳細には、光学的文字認識方式を包
含する多数の従来の識別手段の何れか1つとすることが
可能である0本発明に基づいて使用するのに適したその
様な識別手段の1つは、Toddに対して1981年3
月31日に発行された米国特許第4,259,661号
「パターン、を認識する装置及び方法(Apparat
us and Methodfor Recogniz
ing a Pattern)Jに記載されている。
識別手段16は又、に、 S、 Fu著の「統語法的パ
ターン認識及び適用(Syntactic Patte
rn Recognition and Applic
ations)J、プレンティスホールインコーホレイ
テッド、1982年、の特にセクション1.6.アペン
ディクスA及びBに記載されている。
本発明は、光学的文字認識方式において使用するセグメ
ンテーション手段14内において使用する為の方法に関
するものであるから、ここに記載せる従来技術の説明を
包含する本願は、セグメンテーション手段14に焦点を
当てる。然し乍ら、理解すべきことであるが、本発明は
文字以外のその他のパターンを認識する為のパターン認
識方式に適用することも同様に可能であり、又数学的に
表現されることの可能な任意の情報を認識する為に使用
することが可能である。
セグメンテーション手段14は、各々が個別的に認識さ
れる様に、互いに個別的なパターン又は文字を分割する
作用をする。読み取られるテキストが固定したピッチを
持っていることが知られている(即ち、隣接する文字の
中心間の横方向距離が一定)場合の従来の光学的文字認
識装置においては、隣接する文字が何等かの理由で結合
すると、結合した文字を、各文字の一定幅に基づく寧ろ
融通性のない技術を使用して、成る程度の精度で分離さ
せることは出来る。この様な従来技術方式は、2つ又は
それ以上の結合した文字は屡々正確な結合点で分離され
ずに、1つの文字の一部を残して隣接する文字に付着さ
せたりする欠点を持っている。このことは、これら2つ
の文字の何れかを認識することを、不可能では無いにし
ても、非常に困難とさせる。
本発明は、以上の点に鑑みなされたものであって、上述
した如き従来技術の欠点を解消し、2つ以上の結合され
たパターン、特に文字を分裂させ個別的なパターン特に
文字を高精度で認識することを可能とする技術を提供す
ることを目的とする。
本発明に拠れば、結合された複数個のパターン乃至は文
字を更に処理する為に分離することを可能とする方法及
び装置が提供される。このことは。
多くの従来技術の光学的文字認識方式と対比され、その
場合には、複数個の結合された文字は、検知不可能であ
るか、又は、固定ピッチテキストの場合には、非常に厄
介な測定技術を使用して初めて分離することが可能であ
るかのどちらかである。
固定ピッチを持っていないと決定される文字の場合、第
1近似分裂点を、セグメントの幅を基礎にして決定する
0次に、カリパヒストグラムを形成して、該セグメント
の各列における最上部及び最下部のrオン」画素の間の
距離をプロットする。
該カリパヒストグラム内に満足する最小値が発見される
と、このセグメントをこの点において左セグメントと右
セグメントとに分裂させる0発見されない場合には、該
セグメントの各列におけるrオン」画素の総数を表す生
のヒストグラムを形成する。a生のヒストグラムの適宜
の最小値が発見されると、該セグメントはこの点におい
て右セグメントと左セグメントとに分裂される。
該セグメントの生のヒストグラム中に適宜の最小値が発
見されると固定ピッチであると判断される文字は分離さ
れ、そうでない場合には、そのセグメントに対してのカ
リパヒストグラム内に満足する最小値が発見されると、
分離される。
本発明の1実施例においては、技術を使用して、2つの
隣接するセグメントを比較し、且つ、必要な場合には、
結合させて単一セグメントを形成することが可能である
。このことは、実際に単一のパターン乃至は文字を形成
する別々のセグメントを、一層正確な解析の為にそのパ
ターン又は文字を表す単一のセグメントに結合させるこ
とを可能とする。
以下、添付の図面を参考に、本発明の具体的実施の態様
に付いて詳細に説明する。
本明細書においは、「セグメント」とはパターン認識方
式におけるデジタイザ(第1図)へ入力される画像の任
意の一部のデジタル表示のことを意味する。1実施例に
おいては、セグメントは画素(ピクセル)の直線的アレ
イであり、各画素は単一のドツトで、屡々正方形の形状
をしており、デジタイザか得られるビデオデータの最小
のピース即ち部分を表している。二進デジタル化方式に
おいては、各画素は2つの状態、即ちオン又はオフ、の
何れか一方でのみ存在することが可能である。これらの
状態の一方は論理1の値を持った画素によって表すこと
が可能であり、他方の状態は論理0の値によって表すこ
とが可能である。システム全体に渡って選択した関連性
が一貫していれば、どちらの状態が特定の値で表される
かということは重要ではない。本明細書においては、r
オン」画素は入カバターンの黒領域に関連しており且つ
論理1の値を持っており、「オフ」画素は入カバターン
における白領域と関連しており且つ論理Oの値を持って
いる。
セグメントの「幅」は水平方向寸法に沿って測定したセ
グメント内に包含される画像表示の画素における寸法で
あり、且つ未使用の右及び左画素を何等包含するもので
はない。
セグメントの「全体幅」は、セグメントの未使用の左部
分の幅と、該セグメントの未使用の右部分の幅と、該セ
グメントの幅の和である。
!久ムヱ五復戊 第3図及び表1は1本発明の1実施例において使用され
るセグメントを表す典型的なデータ構成の組織を示して
いる。第3図に示したセグメントは、32ビツトワード
の整数を有している。フィールド3aは、16ビツトを
有しており且つ、読み取られる頁の左上角部と相対的に
このセグメントのX位置を画定する。同様に、フィール
ド3bは、読み取られる頁の左上角部と相対的にこのセ
グメントのY位置を画定する16ビツトを有している。
買上のセグメントのX及びY位置を第4b図に示しであ
る。フィールド3Cは1文字の幅を画定する16ビツト
フイールドである(第4a図の文字raJの場合、50
画素数)。該セグメントのフィールド3dは16ビツト
フイールドであり、該セグメントの高さを画定している
(第4a図の場合、70画素数)、フィールド3eは、
該セグメントの左の未使用画素の量を画定する8ビツト
フイールドであり、且つフィールド3fは該セグメント
の右の未使用画素の数を画定する8ビツトフイールドで
ある(第4a図)。第4a図から理解される如く、未使
用の左区域及び未使用の右区域の和は64−50画素数
である。重要なことであるが、第4a図内の各行の幅は
32ビツトワードの整数であり、少なくとも1ビツトの
未使用左区域及び1ビツトの未使用右区域と共に、問題
のセグメントの各水平行における画素を包含するのに十
分である。少なくとも1ビツトの未使用左区域と1ビツ
トの未使用右区域を与える理由は、所望により、この様
な各文字は完全に白の区域で取り囲まれているという事
実に基づき、単一のセグメントにおける2つ又はそれ以
上の文字を分割させるべく機能する付加的な処理を使用
することを可能とする為である。従って、第4a図にお
いて示した例においては、セグメントの幅は50画素で
あり、且つ1個の未使用元画素と1個の未使用右画素と
を包含して、52個となっており、行長さの幅は64に
丸められている。
フィールド3gは、該セグメント上方の未使用の行数を
画定する8ビツトフイールドであり、フィールド3hは
該セグメント下方の未使用の行数を画定する8ビツトフ
イールドである。第4a図に示した例の場合、文字「a
」は70画素の高さたり、単一の未使用の頂部行及び未
使用の下部行が必要であり、従って行数は72となって
いる。
単一の未使用の下部行及び未使用の下部行は、所望によ
り、使用されて、各文字は白区域によって完全に取り囲
まれているという事実に基づいて単一セグメント内の複
数個の文字の分離を可能とさせる。フィールド31は2
4ビット幅であり、且つこのセグメントを識別するのに
使用するこの特定のセグメントと関係する直列数字を格
納する。
フィールド3jは問題の文字の前の文字数の平均ピッチ
を決める8ビツトフイールドである。フィールド3には
、問題の文字の前の文字数の平均幅を決める8ビツトフ
イールドである。フィールド31は、複数個の(1実施
例においては16)ビットを有しており、その各々は、
例えば該セグメントが固定したピッチを持っているが否
かを示すウララグの如きフラッグを表す、フィールド3
mは、第4a図に示した例においては、64ビツトフイ
ールドで、未使用の上部行を有している。フィールド3
Pも第4a図に関連して示した実施例においては、未使
用の下部行に対応して64ビツトフイールドである。フ
ィールド3mと3pとの間に1例えばフィールド3n−
1の如き複数個のフィールドがあり、その各々は3つの
サブフィールド、即ち未使用左画素サブフィールド3n
−1(a)、画素データ3n−1(b)、未使用布ii
!ii素フィールド3 n −1(c)、を有している
。第4a図に示した実施例においては、文字「a」を画
定する70画素行が存在するので(即ち、文字「a」は
70画素の高さ)であるので、画素データフィールh3
n  1(b)乃至画素データフィールド3n−70(
b)を有する7oのこの様なフィールド3n−1乃至3
 n −70が存在する。
3a        X位置       163b 
       y位置       163c    
      @            163d  
       高さ        163e    
  未使用左       83f      未使用
布       83g      未使用上部   
   83h      未使用下部      83
1      直列数字       243j   
   平均ピッチ      83k      平均
幅        831      フラッグ   
    163m      未使用上部行     
643n−1(a)   未使用左画素 入力データで
変化3n−1(b)   未使用画素  入力データで
変化3n−1(c)   未使用布画素 入力データで
変化3P      未使用下部行     64第2
図は、本発明に従って、水平方向に結合された文字を分
離させる為に使用される方法の1実施例を示したフロー
チャート図である。第1に。
分離されるべき次のデータセグメントを得る。
該セグメントを受は取ると、本発明の1実施例において
は、ラテン文字が読み取られると、次のステップは、上
部及び下部の結合されたセリフ(Serif)を探す。
本方法の残部は画素ヒストグラムの計算に部分的に依存
するので、これらの上部及び下部の結合したセリフは独
得の態様で処理せねばならない。第5図は結合したセリ
フを持ったこの様な1組の文字を示している。1実施例
においては、セグメントが上部及び下部結合セリフを持
っていることを決定する為に、該セグメントが5/8W
以上の幅を持った一連の列(Wはフィールド3cにおい
て定義した如く該セグメント内に包含される文字の幅で
ある)で、各この様な列が、Hを該セグメント内に包含
される文字の高さくフィールド3d)として、(5/3
2)H最上部行の何れか1つ及び最下部(5/32)H
行の何れか1つにおいて「オン」画素を持っているがど
うかを決定する。
持っているばあいには、結合されているセリフが発見さ
れたと仮定され、該セグメントの幅に対する垂直方向に
rオン」画素の数の生のヒストグラムを形成する。一方
、この様な生のヒストグラムは、上部及び下部の両方の
セリフが存在する列に対してのみ形成される。次いで、
この生のヒストグラムが満足する最小値を有しているが
否がを決定する0本発明の1実施例においては、生のヒ
ストグラムの最小値は、それが満足する生の最小値とし
て考えられる為には、該セグメント内に包含される文字
の高さの半分未満でなければならない。満足する生の最
小値が発見されると、該セグメントはその満足する最小
値に対応する分裂点で2つの別々の信号へ分裂される。
この分裂操作のより詳細な説明は後にするが、簡単に説
明すると。
分裂される信号セグメントを使用して2つの新たなセグ
メントを形成し、元のセグメントを除去する。然し乍ら
、上部及び下部の結合されたセリフが該セグメント内に
包含されていないか、又は満足する生の最小値が発見さ
れないと判断されると。
該セグメントを個別的な文字に適切に分割する為に、操
作は第1近似ステツプへ進行する。
気よ近似 結合されたセリフを持っていると判断されたセグメント
に分裂操作を行わない場合、又は結合されたセリフが存
在しない場合、該セグメントを分裂させるべき個所の第
1近似がなされる。この第1近似は、単に該セグメント
の水平中心を位置決めするだけで達成される。本発明の
その他の実施例においては、第1近似分裂点を位置決め
する為の別の技術が使用され、例えば最近受けとった文
字の平均幅に等しいセグメントの水平軸に沿ってセグメ
ントの左端部から点の位置決めを行う。前の別の実施例
で説明した如く、最近受けとった文字の平均幅ではなく
、最近受けとった文字の平均ピッチを使用することが可
能である。一方、所望により、この第1近似を行うその
他の技術を使用することも可能である0重要なことであ
るが、文字の幅、平均ピッチ、及び平均幅は、第3図及
び表1に関連して前に説明した如く、該セグメント内に
おいて全て容易に入手可能である。
カリパヒストグラム 次に、該セグメント内に包含されている画素データのカ
リパ(caliper)ヒストグラムを形成する。
本明細書において、カリパヒストグラムとは、該セグメ
ントの各列内の最上部と最下部の「オン」画素間の距離
をプロットしたヒストグラムとじて定義される。従って
、第4a図において、セグメントは50列を有しており
、従って50点のヒストグラムが形成される。このこと
は、例えば、該セグメント内に包含されている画素デー
タの各行をアクセスし且つこの様な「オン」画素を包含
する最上部行とこの様なrオン」画素を包含する最下部
行を決定し、これらの行値を減算し、且つ1を加算する
ことによって極めて容易に達成される。
このことは、該セグメント内の画素データの各列に対し
て行われる0本発明の1実施例においては。
このプロセスの速度を向上させる為に、且つ更に重要な
ことには、該セグメントの端部近傍の無意味なデータ(
セグメントの分裂に関する限り)を考慮することを回避
する為に、この様なカリパヒストグラムが「第1近似」
分裂点近傍の列に対してのみ発生される0本発明の1実
施例においては。
この様なカリパヒストグラムは、第1近似分裂点の両側
で該セグメントの幅の1/4の距離内にある列に対して
発生される。
カリパヒストグラムの満足する最小値が位置されると、
該セグメントは「分裂セグメント」ステップへ送られ、
そこでカリパヒストグラム最小値においてそれは2つの
別々のセグメントへ分裂される。
本発明の1実施例においては、カリパヒストグラムの最
小値は、満足するカリパヒストグラム最小値と考えられ
る為には、(13/16)H未満でなければならない。
生のヒストグラム 一方、満足するカリバヒストグラムが発見されなかった
場合、生のヒストグラムが形成され、即ち各垂直列にお
けるrオン」画素の総数をプロットする9本発明の1実
施例においては、このプロセスの速度を向上させ且つ更
に重要なことには。
該セグメントの端部近傍での無意味な(セグメントを分
裂させることに関して)データを考慮することを回避す
る為に、この様な生のヒストグラムは「第1近似」分裂
点近傍のものの列に対してのみ発生させる。本発明の1
実施例において、この様な生のヒストグラムは、第1近
似分裂点の両側において該セグメントの幅の174の距
離内にある列に対してのみ発生させる。
生のヒストグラムが満足する最小値を有していると、該
セグメントはその点で分裂される。本発明の1実施例に
おいては、生のヒストグラムの最小値は満足する最小値
と考えられる為にはセグメント高さの1710未満でな
ければならない。
本発明の1実施例に拠れば、何れかの生のヒス1−グラ
ム最小値又はカリパヒストグラム最小値が該セグメント
の端部から成る距離範囲内に位置されると、この様な最
小値は使用されず1分裂操作が幅において画素が少な過
ぎるセグメントを与えることを防止する。本発明の1実
施例においては、該セグメントの端部の3つの画素以内
に位置されるこの様な最小値は考慮されない。本発明の
別の実施例においては、Hを該セグメントの画素高さと
して、該セグメントの端部のH/4画素以内に位置され
ているこの様な最小値は考慮されない。
同様に、最小値が、特徴抽出(第1図)を実施すること
の可能なセグメントの幅よりも左セグメントをより幅広
とさせる様に位置される場合には、この様な最小値は該
セグメントを分裂させるのには使用されない。最小値が
2分裂操作によって発生される右セグメントを特徴抽出
によって処理されることの可能なものよりも広いものと
させる様に位置される場合には、該右セグメントは新た
な現在のセグメントとなり且つ再循環される(即ち。
単一セグメント内に包含されている結合された文字を分
離させる為に全プロセスに露呈させる)。
使用される特徴抽出技術によって適切に取り扱われるの
に広過ぎることのない左セグメントを与える様な満足す
る生の最小値が発見されない場合。
該セグメントは認識不可能の要素としてフラッグが立て
られるか、又は削除される。逆に、満足する最小値が発
見されず且つ該セグメントが使用される特徴抽出技術に
よって処理されるのに広過ぎるものではない場合には、
該セグメントは不変のまま特徴抽出ステップへ通過され
、該セグメントが、実際に、単一の認識可能な文字を有
しているか否かを決定する。
全3υ1也 前述した如く、分裂操作を開始する幾つかの方法が存在
する0分裂操作の目的は、解析中のオリジナルのセグメ
ントから2つの新たなセグメントを形成し且つオリジナ
ルのセグメントを消去することである。説明の都合上、
形成される2つの新たなセグメントを以後左セグメント
及び右セグメントと呼ぶ6分裂操作ヘパスされるオリジ
ナルのセグメント以外の唯一の上方は、左セグメントの
幅である(即ち、オリジナルのセグメントが分裂される
べき個所)。
従って、左セグメントは分裂され、オリジナルのセグメ
ントの同一のX位置の値を持っている。
rオン」画素を包含する左セグメントの最上部行の真上
の位置を正確に反映させる為に、Y位置データは再度計
算される。左セグメントは左セグメントと異なった高さ
を持つことがあり、従って異、なったY位置を持つこと
があるので、このことは必要である。左セグメントの幅
は分裂点によって決定されるので、この幅は既知である
。左セグメントの高さは、左セグメントのY位置を計算
することに関連して前に説明した如く、左セグメントの
高さは再度解散される。未使用の元帳は同一のままであ
る。未使用の布幅は、左セグメントの全体的な幅は32
ビツトの整数であり、且つ未使用の布幅は最小値の1を
持つ様に計算される。未使用の上部高さ及び未使用の下
部高さは同じままであり且つ、前述した如く、1に等し
い。左セグメントの連続番号はおなしままであり、添字
は付加的なセグメントがオリジナルなセグメントから形
成されたことを表している。平均ピッチ及び平均幅上方
は同一のままである。1実施例においては、フラッグが
セットされ、左セグメントがオリジナルのセグメントか
ら分裂されたものであることを表す。未使用の上部情報
及び未使用の下部情報はおなしままであるが、分裂操作
の結果として、左セグメントがオリジナルのセグメント
の全体的な幅から減少された場合には、それらの長さは
減少する場合がある。未使用左、未使用右、及び画素デ
ータを包含する残りのデータは、未使用左情報がオリジ
ナルのセグメントにおける場合と同一であり、画素デー
タは左セグメントの画素を包含しており、且つ未使用布
データサブフィールドは左セグメントの全体的な幅が3
2ビツトの整数に等しい様に十分な数のビットを有して
いる様に、構成されている。重要なことであるが、左セ
グメントの高さがオリジナルのセグメントの高さから減
少されると1画素データフィールドの総数は減少する。
同様な態様で、右セグメントが形成される。然し乍ら、
右セグメントを形成する場合に、X位置データはオリジ
ナルのセグメントのX位置データ+主セグメントの幅と
等しくなる様に変化される。
Y位置及び右セグメントの高さは、左セグメントに関し
て前に説明したのと同一の態様で且つ同一の理由から再
度計算される。右セグメントの幅は、オリジナルのセグ
メントの幅−左セグメントの幅と等しい、未使用布幅は
オリジナルのセグメントに対して未使用布幅と同一であ
る。未使用上部高さ及び未使用下部高さは、オリジナル
のセグメントに対するものと同じであり且つ前述した如
く1に等しい。未使用元帳は、右セグメントの全体的な
幅は32ビツトの整数と等しい態様で再度計算され、且
つ右セグメントの未使用元帳は少なくとも1でなければ
ならない。右セグメントの連−続番号は、オリジナルの
セグメントの連続番号士別のセグメントがこのセグメン
トから分裂されたことを表す添字に等しい、1実施例に
おいては、フラッグがセットされて、右セグメントがオ
リジナルのセグメントから分裂されていることを表す。
右セグメン1への全体的な幅がオリジナルのセグメント
の全体的な幅よりも小さい場合に発生する可能性のある
幅が狭まることの条件下におい、平均ピッチ及び平均幅
は同じままであり、未使用上部及び未使用下部データは
同じままである。未使用列データサブフィールドは、右
セグメントの全体的な幅は32ビツトの整数と等しい様
に十分な数のビットを有している。未使用布データは同
じであり、且つ画素データはオリジナルのセグメントの
右部分に対する画素データと同じである。
これらの左及び右セグメントの各々は、次いで。
前述した如く、更に処理する為に順次に特徴抽出部(第
1図)へ送られる。
本発明に拠れば、1実施例においては、アルゴリズムは
、例えばMC68000等のマイクロプロセサ、及び命
令を格納する為の適宜のメモリ装置、及び処理すべきセ
グメント、中間結果、及びこの処理によって発生される
左及び右セグメントを格納するのに適した公知の構成の
メモリを使用して実現することが可能である。
員 この方法の操作の結果と共に、多数のセグメントの例を
表2乃至6及び第5図乃至第9図に夫々示しである。
人スニリし口」L 1、 スタート 2、 次のセグメントを採取 3、上部及び下部セリフ発見?:庁定 4、 生のヒストグラム形成 5、満足する最小値発見?:肯定 6、 セグメント分裂 7、オリジナルのセグメント除去 8、 左セグメント出力 9、右セグメント広過ぎるか?:否定 10、右セグメント出力 11、次のセグメント採取(項目#2)茎」ユニ度」」
υ− 1、スタート 2、 次のセグメント採取 3、上部及び下部セリフ発見?:否定 4、第1近似 5、 カリパヒストグラム形成 6、満足する最小値発見?:背定 7、セグメント分裂 8、 オリジナルのセグメントを消去 9、左セグメントを出力 10、右セグメント広過ぎるか?否定 11、右セグメン1−出力 12、次のセグメント採取(項目#2)i±」簸ユ1ル 1、 スタート 2. 次のセグメント採取 3、上部及び下部セリフ発見?:否定 4、第1近似 5、 カリパヒストグラム作成 6、満足する最小値発見?:否定 7、 生のヒストグラム作成 8、満足する最小値発見?:肯定 9、セグメント分裂 10、オリジナルのセグメント消去 11、左セグメント出力 12、右セグメント出力るか?:否定 13、右セグメント出力 14、次のセグメント採取(項目#2)1旦A1旦凰L 1、 スタート 2、次のセグメント採取 3、上部及び下部セリフ発見?:肯定 4、生のヒストグラム作成 5、満足する最小値発見?:否定 6、第1近似 7、 カリパヒストグラム作成 8、満足する最小値発見?:否定 9、生のヒストグラム作成 10、満足する最小値発見?:否定 11、セグメント広過ぎるか?:否定 12、セグメント不変でパス 13、次のセグメント採取(項目#2)入車1星且皿と 1、 スタート 2、次のセグメント採取 3、上部及び下部セリフ発見?:否定 4、第1近似 5、カリパヒストグラム作成 6、満足する最小値発見?:否定 7、生のヒストグラム作成 8、満足する最小値発見?:否定 9、セグメント広過ぎるか?:否定 10、セグメント消去 11、次のセグメント詐取(項目#2)ピ・チを った
 Aした文 の 本発明の1実施例に拠れば、固定したピッチを持った結
合されている文字が分離される。固定ピッチの結合され
ている文字を分離する本発明による1技術を第10図に
示しである。この実施例においては、データファイル内
において隣接する2つのセグメントは同時的に処理され
、その際にこれらの特徴がそれらが結合されるべき(即
ち、単一文字が分割されて、2つのセグメントの各々に
おける一部を持っている)であることを表すことが判断
されると、これらの2つのセグメントを結合することを
可能とする。当然に2本発明に鑑みて当業者等によって
理解される如く、この技術は、その様に所望される場合
には、隣接するセグメントを結合させる能力無しで使用
することが可能である。本明細書の説明の為には、第1
0図に示される如く、処理中の2つのセグメントの最初
のものは「S」セグメントと呼ばれ、且つ処理中の2番
目のセグメントはrJJセグメントと呼ばれる。
最初に、処理されるべき次のSセグメントをフェッチす
る即ち取り寄せる。フェッチされたSセグメントが固定
ピッチを持っているか及び成る統計的資格を持っている
か否かが判別される。Sセグメントが固定ピッチを持っ
ているかどうかは、問題の文字の前の複数個の文字の平
均ピッチに基づいてセットされたフラッグフィールド3
1(第3図)中に包含されるビットによって容易に決定
される。例えば、Sセグメントが買上の文脈領域(即ち
、別の欄又はライン)の開始にある時に、Sセグメント
がその平均ピッチ(フィールド3j)及び平均幅(フィ
ールド3k)を画定しないと。
Sセグメントは固定文字ピッチに基づく分裂を可能とす
るのに必要なデータを持っていない。この場合に、Sセ
グメントは付加的な処理手段(不図示)へ出力される。
逆に、Sセグメントが固定ピッチを持っており且つ平均
ピッチ及び平均幅情報を有していると。
Sセグメントは単一の文字と考えられるのには広過ぎる
か否かが判別され、従ってそのセグメントを2つ以上の
識別可能な文字へ分割することを必要とする。Sセグメ
ントが単一の文字となるのに広過ぎるものでない場合、
次のSセグメントがフェッチされる。前述した如く、こ
のSセグメントは単にSセグメントに続くデータ列内の
セグメントである。
次に、Sセグメントが固定ピッチ(フラッグフィールド
31)であるか又Sセグメントと結合されて単一の新た
なSセグメントを形成することが可能か否かを判別する
。SセグメントをSセグメントと結合させることが可能
であるか否かを判別する為に、SセグメントとSセグメ
ントの中心間の水平距離がSセグメントの平均ピッチの
成る割合(1実施例においては0.75)よりも小さく
且つS及びSセグメントの水平及び垂直極限間の距離が
1例えば特徴抽出手段15(第1図)において処理され
るべきセグメントに対して許容可能な最大寸法等の単一
セグメントに対して許容される最大寸法よりも大きくな
い場合には、それらが読み取られた文書の別々の文脈領
域(即ち、別の欄又はライン)内に存在しないか否かを
判別する。
そうである場合には、S及びSセグメントあ結合されて
新たなSセグメントを形成し、Sセグメントを削除し、
且つ新たなSセグメントを再度処理させる。
セグメントS及びJは、新たなSセグメントのX位置を
SセグメントとSセグメントのX位置の小さい方と等し
くさせ、新たなSセグメントのY位置をSセグメントと
SセグメントのY位置の小さい方と等しくさせ、新たな
Sセグメントの幅をSセグメントとSセグメントの右端
部の最大値からSセグメントとSセグメントの左端部の
小さい方の値を差し引いたものと等しくさせることによ
って、結合される。新たなSセグメントの高さは、Sと
Sセグメントの下部端部のおきい方からSとSセグメン
トの上部端部の小さい方を差し引いたものとして計算さ
れる。未使用列幅、未使用布幅。
未使用上部高さ、未使用下部高さは1分裂操作に関して
前述したのと同一の態様で計算される。新たなSセグメ
ントの連続番号は、後の処理シーケンスにおいて必要と
されることもされないこともある任意の便宜的な連続番
号と等しい、平均ピッチ及び平均幅はSセグメントにお
けるのに同じ値を維持する。未使用上部画素データ(第
3図のフィールド3m)は白画素の単一の未使用ライン
であり、且つ未使用下部画素データ、即ちフィールド3
pは未使用白画素の単一ラインである1画素データフィ
ールド3nは、Sセグメント及びJセグメント画素デー
タの簡単な結合であり、それはオリジナルS又はSセグ
メントのいずれかよりも幅尋の新たな結合されたSセグ
メントとなることがある。
逆に、Sセグメントが単一の結合されていない文字とし
ては広過ぎる場合、付加的な処理を行ってSセグメント
を2つの識別可能なセグメントへ分割する。この場合、
例えば、その値がSセグメントの平均ピッチと等しSセ
グメントの左端部から列を選択することによって、分裂
点の第1近似が計算される。次に、Sセグメントの生の
ヒストグラムを形成し、1実施例においては、該セグメ
ントの各列に対して生のヒストグラムを形成する代りに
、生のヒストグラムは第1近似分裂点近傍(例えば、第
1近似分裂点の両側において該セグメントの幅の1/4
)にある列のみに対して生のヒストグラムを形成する。
満足する生のヒストグラム最小値が発見されると、Sセ
グメントは分裂される。本発明の1実施例において、生
のヒストグラムの最小値は、満足する最小値であると考
えられる為には、Sセグメントの高”さの1/8よりも
高いものであってはならない。
満足する最小の生のヒストグラムが発見されなかった場
合、Sセグメントのカリパヒストグラムを形成する。満
足するカリパヒストグラム最小値が発見されると、Sセ
グメントは分裂される。本発明の1実施例において、カ
リパヒストグラムの満足する最小値は、Sセグメントの
高さの15716よりも小さい。°満足するカリパヒス
トグラム最小値が発見されないと、Sセグメントが2つ
の別々のセグメントへ分裂すべきでないと判断され、S
セグメント全体がその他の処理手段(不図示)によって
使用する為に出力される。
一方、生のヒストグラム又はカリパヒストグラムの満足
する最小値が発見されると、Sセグメントは前に分裂操
作に関して説明した態様で分裂される。分裂操作によっ
て与えられる左セグメントは、他の処理手段(不図示)
へ出力され、左セグメントと右セグメントとに分裂され
たSセグメントは除去され、且つ分裂操作によって与え
られた右セグメントは新たなSセグメントとなる。新た
なSセグメントの処理は、この新たなSセグメントが単
一の文字といて考えられるのには広過ぎるか否かを判別
するステップで継続する。
1実施例においては、任意の生のヒストグラム最小値又
はカリパヒストグラム最小値が実際には多数の列に渡っ
て水平方向に延在する最小値である場合、その最小値(
分裂操作によって形成される左セグメント内に包含され
るべき最後の列)と関連する分裂点は最も右側の最小値
として取られる。
又、1実施例においては、結合されているセリフを包含
することのないセグメントに対して1っを越える満足す
る最小値が発見されると、第1近似点に最も近い満足す
る最小値が分裂点として選択される。
1実施例においては、結合されているセリフを包含する
セグメントに対して1つを越える満足する最小値が発見
されるか又は結合されているセリフを持っていないセグ
メントに対して選択される満足する最小値が大き過ぎる
左セグメントを与える場合、分裂点は分裂された左セグ
メントが可及的に大きいが、特徴抽出部15(第1図)
の如きその他の処理モジュールにって処理されるのに大
き過ぎることがない様に選択される。
以上、本発明の具体的実施の態様に付いて詳細に説明し
たが1本発明はこれら具体例にのみ限定されるべきもの
では無く1本発明の技術的範囲を逸脱すること無しに種
々の変形が可能であることは勿論である。
【図面の簡単な説明】
第1図は従来のパターン認識方式の概略図、第2図は本
発明に基づいて結合されているパターンを分離させる方
法の1実施例を示したフローチャート図、第3図は本発
明の1実施例に基づいて使用されるデータ構成を示した
概略図、第4a図は本発明に基づいて構成された光学的
文字認識方式の1実施例によって文字raJが読み取ら
れる状態を示した説明図、第4b図は光学的文字認識方
式によって読み取られる買上の文字のX位置及びX位置
を表す説明図、第5図乃至第9図は本発明に基づいて分
離される種々の結合された文字を示した各説明図、第1
0図は本発明の別の実施例のフローチャート図、である
。 (符号の説明) 11:入カバターン 12:デジタイザ 13ニジステムメモリ 14:セグメンテーション 15:特徴抽出部 16:認識手段 17:出力手段 F工G  1 FIG、9 手続補正書(麓) 昭和62年3月4日 特許庁長官  黒 1)明 雄 殿 1、事件の表示  昭和61年特許願第231348号
3、補正をする者 事件との関係   特許出願人 名称    ザ パランチール コーポレーション4、
代理人 J 5、補正命令の日付

Claims (1)

  1. 【特許請求の範囲】 1、複数個の行及び列を持った画素のアレイを表すデー
    タセグメントを複数個のセグメントへ分離する方法にお
    いて、データセグメントをフェッチし、前記画素のアレ
    イの複数個の列に対して最上部及び最下部の「オン」画
    素の間の距離を表すカリパヒストグラムと前記画素アレ
    イの複数個の列における「オン」画素の数を表す生のヒ
    ストグラムとを包含するヒストグラムのグループから選
    択した第1ヒストグラムを形成し、前記第1ヒストグラ
    ムの満足する最小値が存在するか否かを決定し、前記第
    1ヒストグラムの満足のいく最小値が存在しない場合に
    は前記第1ヒストグラム以外のタイプの第2ヒストグラ
    ムを形成し、前記第1ヒストグラムの前記満足する最小
    値又は前記第2ヒストグラムの前記満足する最小値に関
    して前記データセグメントを分裂させ、その際に左セグ
    メントと右セグメントとを形成させる、上記各ステップ
    を有することを特徴とする方法。 2、特許請求の範囲第1項において、前記カリパヒスト
    グラムは前記画素アレイの全ての前記列に対して形成さ
    れることを特徴とする方法。 3、特許請求の範囲第1項において、前記カリバヒスト
    グラムが形成され、それは前記画素アレイの端部近傍に
    位置した列と関係するデータを有していないことを特徴
    とする方法。 4、特許請求の範囲第1項において、前記カリバヒスト
    グラムが形成され、それは第1近似分裂点からの選択さ
    れた列数内に位置されている列と関連するデータを有し
    ていることを特徴とする方法。 5、特許請求の範囲第4項において、前記第1近似分裂
    点は前記画素アレイの水平方向中心点であることを特徴
    とする方法。 6、特許請求の範囲第4項において、前記第1近似分裂
    点は、前記単一パターンの1つ又はそれ以上の平均幅に
    等しい前記画素アレイの選択した水平方向端部から選択
    した距離に位置していることを特徴とする方法。 7、特許請求の範囲第4項において、前記単一パターン
    は文字であり、且つ前記第1近似点は、平均文字ピッチ
    及び平均文字幅からなる1組の値から選択された値に等
    しい前記画素アレイの選択した水平端部から選択した距
    離に位置していることを特徴とする方法。 8、特許請求の範囲第6項において、前記選択した数の
    列は、前記画素アレイにおける列数の1/4に等しいこ
    とを特徴とする方法。 9、特許請求の範囲第7項において、前記選択した列数
    は前記画素アレイにおける列数の1/4と等しいことを
    特徴とする方法。 10、特許請求の範囲第1項において、前記カリパヒス
    トグラムの前記満足する最小値は、前記画素アレイの高
    さの選択した一部よりも大きいものであってはならない
    ことを特徴とする方法。 11、特許請求の範囲第10項において、前記選択した
    一部は13/16及び15/16からなる一部のグルー
    プから選択されることを特徴とする方法。 12、特許請求の範囲第1項において、前記カリパヒス
    トグラムの前記満足する最小値は、前記画素アレイにお
    ける最上部及び最下部の「オン」画素間の最大垂直距離
    の選択した一部よりも大きいものであってはならないこ
    とを特徴とする方法。 13、特許請求の範囲第12項において、前記選択した
    一部は、13/16、1/8、15/16から構成され
    る一部のグループから選択されるものであることを特徴
    とする方法。 14、特許請求の範囲第1項において、前記生のヒスト
    グラムは前記画素アレイの全ての前記列に対して形成さ
    れることを特徴とする方法。 15、特許請求の範囲第1項において、前記生のヒスト
    グラムはが形成され、それは前記画素アレイの端部近傍
    に位置された列と関連するデータを有することが無いこ
    とを特徴とする方法。 16、特許請求の範囲第1項において、前記生のヒスト
    グラムが形成され、それは第1近似分裂点から選択した
    数の列内に位置された列に関連するデータを有すること
    を特徴とする方法。 17、特許請求の範囲第16項において、前記第1近似
    点は前記画素アレイの水平方向中央点であることを特徴
    とする方法。 18、特許請求の範囲第16項において、前記第1近似
    点は、前記単一パターンの1つ又はそれ以上の平均幅と
    等しい前記画素アレイの選択した水平端部から選択した
    距離に位置されていることを特徴とする方法。 19、特許請求の範囲第16項において、前記単一パタ
    ーンは文字であり、且つ前記第1近似点は、平均文字ピ
    ッチ及び平均文字幅から構成される1組の値から選択さ
    れる値と等しい前記画素アレイの選択した水平端部から
    選択した距離に位置されていることを特徴とする方法。 20、特許請求の範囲第18項において、前記選択した
    列数が前記画素アレイにおける列数の1/4に等しいこ
    とを特徴とする方法。 21、特許請求の範囲第19項において、前記選択した
    列数は前記画素アレイにおける列数の1/4に等しいこ
    とを特徴とする方法。 22、特許請求の範囲第1項において、前記生のヒスト
    グラムの前記満足する最小値は、前記画素アレイの高さ
    の選択した一部よりも大きいものであってはならないこ
    とを特徴とする方法。 23、特許請求の範囲第22項において、前記選択した
    一部は1/8及び1/10から構成される一部のグルー
    プから選択されることを特徴とする方法。 24、特許請求の範囲第1項において、前記生のヒスト
    グラムの前記満足する最小値は、前記画素アレイにおい
    て最上部と最下部の「オン」画素間の垂直距離の選択し
    た一部よりも大きいものであってはならないことを特徴
    とする方法。 25、特許請求の範囲第13項において、前記選択した
    一部は1/8及び1/10から構成される一部のグルー
    プから選択されることを特徴とする方法。 26、特許請求の範囲第1項において、前記単一パター
    ンは文字であり、且つ前記カリパヒストグラムは前記セ
    グメントがセリフを有する場合には形成されないことを
    特徴とする方法。 27、特許請求の範囲第26項において、前記カリパヒ
    ストグラムは、前記画素アレイが前記画素アレイの最上
    部行の選択した数の1つ又はそれ以上において「オン」
    画素を持っている選択した幅の一連の列を有しており且
    つ前記選択した幅の一連の列が前記画素アレイの最下部
    行の前記選択した数の1つ又はそれ以上において「オン
    」画素を持っている場合には、形成されないことを特徴
    とする方法。 28、特許請求の範囲第27項において、前記選択した
    幅は前記画素アレイ内の列数の選択した部分と等しいこ
    とを特徴とする方法。 29、特許請求の範囲第28項において、前記選択した
    一部は5/8であることを特徴とする方法。 30、特許請求の範囲第27項において、前記選択した
    幅は、前記画素アレイの行における最左側と最右側の「
    オン」画素の間の最大水平距離の選択した一部に等しい
    ことを特徴とする方法。 31、特許請求の範囲第30項において、前記選択した
    一部は5/8であることを特徴とする方法。 32、特許請求の範囲第27項において、前記最小部行
    及び最下部行の選択した数は、前記画素アレイの行数の
    選択した一部と等しいことを特徴とする方法。 33、特許請求の範囲第32項において、前記選択した
    一部は5/32であることを特徴とする方法。 34、特許請求の範囲第27項において、前記最上部行
    及び最下部行の選択した数は、前記画素アレイの最上部
    及び最下部「オン」画素の間の最大距離の選択した一部
    に等しいことを特徴とする方法。 35、特許請求の範囲第34項において、前記選択した
    一部は5/32であることを特徴とする方法。 36、特許請求の範囲第1項において、フェッチの後で
    且つ前記第1ヒストグラムを形成する前に2つのセグメ
    ントが結合されることを特徴とする方法。
JP61231348A 1985-10-01 1986-10-01 パタ−ン及び文字認識方式に使用する結合されたパタ−ンを分離する方法及び構成体 Pending JPS62187987A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US782744 1985-10-01
US06/782,744 US5046114A (en) 1985-10-01 1985-10-01 Method and structure for separating joined patterns for use in pattern and character recognition system

Publications (1)

Publication Number Publication Date
JPS62187987A true JPS62187987A (ja) 1987-08-17

Family

ID=25127040

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61231348A Pending JPS62187987A (ja) 1985-10-01 1986-10-01 パタ−ン及び文字認識方式に使用する結合されたパタ−ンを分離する方法及び構成体

Country Status (2)

Country Link
US (1) US5046114A (ja)
JP (1) JPS62187987A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02255995A (ja) * 1988-04-28 1990-10-16 Seiko Epson Corp 文字切り出し方法
JPH07319998A (ja) * 1988-04-28 1995-12-08 Seiko Epson Corp 文字切り出し方法

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2868134B2 (ja) * 1990-09-03 1999-03-10 キヤノン株式会社 画像処理方法及び装置
JP3361124B2 (ja) * 1991-07-30 2003-01-07 ゼロックス・コーポレーション テキストを含む2次元画像上での画像処理方法と画像処理装置
JP2933801B2 (ja) * 1993-06-11 1999-08-16 富士通株式会社 文字の切り出し方法及びその装置
ES2150926T3 (es) * 1993-06-30 2000-12-16 Ibm Metodo para segmentacion de imagenes y clasificacion de elementos de imagen para tratamiento de documentos.
JP3338537B2 (ja) * 1993-12-27 2002-10-28 株式会社リコー 画像傾き検出装置
US5574802A (en) * 1994-09-30 1996-11-12 Xerox Corporation Method and apparatus for document element classification by analysis of major white region geometry
US5757963A (en) * 1994-09-30 1998-05-26 Xerox Corporation Method and apparatus for complex column segmentation by major white region pattern matching
US5555556A (en) * 1994-09-30 1996-09-10 Xerox Corporation Method and apparatus for document segmentation by background analysis
US5699453A (en) * 1994-09-30 1997-12-16 Xerox Corporation Method and apparatus for logically tagging of document elements in the column by major white region pattern matching
JP3805005B2 (ja) * 1994-11-09 2006-08-02 キヤノン株式会社 画像処理装置及び光学的文字認識装置及びそれらの方法
JP2939147B2 (ja) * 1994-12-29 1999-08-25 シャープ株式会社 手書き文字入力表示装置および方法
ATE185211T1 (de) * 1995-01-31 1999-10-15 United Parcel Service Inc Verfahren und gerät zum trennen des vordergrunds und hintergrunds in textenthaltenden bildern
JPH08235310A (ja) * 1995-02-24 1996-09-13 Nec Corp 接触文字切り出し装置
US5692069A (en) * 1995-03-17 1997-11-25 Eastman Kodak Company Apparatus for performing character segmentation using slant histograms
CA2176691C (en) * 1995-05-15 2004-04-13 Junji Tanaka Hand-written character recognition apparatus and facsimile apparatus
MY121607A (en) * 1995-07-10 2006-02-28 Hyundai Curitel Inc Grid moving method of object image and apparatus using the same and compaction/motion estimation method using the same and apparatus thereof
US6295384B1 (en) * 1998-11-04 2001-09-25 Schlumberger Technologies, Inc. Removing noise caused by artifacts from a digital image signal
US7283669B2 (en) * 2003-01-29 2007-10-16 Lockheed Martin Corporation Fine segmentation refinement for an optical character recognition system
JP4909216B2 (ja) * 2006-09-13 2012-04-04 株式会社キーエンス 文字切り出し装置、方法およびプログラム
US7471826B1 (en) 2008-03-31 2008-12-30 International Business Machines Corporation Character segmentation by slices
CN104894510B (zh) * 2015-05-25 2017-06-16 京东方科技集团股份有限公司 用于制作掩模集成框架的对位方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57206987A (en) * 1981-06-15 1982-12-18 Hitachi Ltd Optical character reader
JPS59160274A (ja) * 1983-03-02 1984-09-10 Hitachi Ltd 文字切出し方式
JPS6015781A (ja) * 1983-07-08 1985-01-26 Nippon Telegr & Teleph Corp <Ntt> 文字切出し装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4379282A (en) * 1979-06-01 1983-04-05 Dest Corporation Apparatus and method for separation of optical character recognition data
US4377803A (en) * 1980-07-02 1983-03-22 International Business Machines Corporation Algorithm for the segmentation of printed fixed pitch documents
US4365234A (en) * 1980-10-20 1982-12-21 Hendrix Electronics, Inc. Segmentation system and method for optical character scanning
EP0120334B1 (en) * 1983-03-01 1989-12-06 Nec Corporation Letter pitch detection system
US4635290A (en) * 1983-12-20 1987-01-06 Nec Corporation Sectioning apparatus and method for optical character reader systems

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57206987A (en) * 1981-06-15 1982-12-18 Hitachi Ltd Optical character reader
JPS59160274A (ja) * 1983-03-02 1984-09-10 Hitachi Ltd 文字切出し方式
JPS6015781A (ja) * 1983-07-08 1985-01-26 Nippon Telegr & Teleph Corp <Ntt> 文字切出し装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02255995A (ja) * 1988-04-28 1990-10-16 Seiko Epson Corp 文字切り出し方法
JPH07319998A (ja) * 1988-04-28 1995-12-08 Seiko Epson Corp 文字切り出し方法
JP2570415B2 (ja) * 1988-04-28 1997-01-08 セイコーエプソン株式会社 文字切り出し方法

Also Published As

Publication number Publication date
US5046114A (en) 1991-09-03

Similar Documents

Publication Publication Date Title
JPS62187987A (ja) パタ−ン及び文字認識方式に使用する結合されたパタ−ンを分離する方法及び構成体
JP3139521B2 (ja) 自動言語決定装置
JPS6159568A (ja) 文書処理装置
JPS63158678A (ja) 単語間スペ−ス検出方法
US4776024A (en) System for segmenting character components
KR0167616B1 (ko) 화상 처리 장치 및 방법
JPH0430070B2 (ja)
JP3904397B2 (ja) 表認識方法
JP2000105836A (ja) 論理構造抽出装置
JP2644477B2 (ja) 画像処理方法
JPS615383A (ja) 文字パタ−ン分離装置
JP3253201B2 (ja) 画像処理装置と画像種類判定方法
Balasubramanian et al. Information extraction from tabular drawings
JP2697790B2 (ja) 文字タイプ決定方法
JPH10154191A (ja) 帳票識別方法及び装置並びに帳票識別プログラムを記録した媒体
JPH0514952B2 (ja)
EP0201909A2 (en) Procedure for automatic reading of images and device for carrying out this same procedure
JPH10105647A (ja) コンテナ番号読取り装置及びコンテナ番号読取り方法
JPH0554178A (ja) 文字認識装置及び修正用帳票
JPS6343788B2 (ja)
JP2878772B2 (ja) 光学的文字読取装置
JP2962525B2 (ja) テキストブロック認識方法
JPS60153567A (ja) 印刷文書画像の領域抽出方法
JP2917396B2 (ja) 文字認識方式
JPH03269689A (ja) 文書読み取り装置