JPH08293001A - 画像処理装置及び光学的文字認識装置及びそれらの方法 - Google Patents

画像処理装置及び光学的文字認識装置及びそれらの方法

Info

Publication number
JPH08293001A
JPH08293001A JP7281532A JP28153295A JPH08293001A JP H08293001 A JPH08293001 A JP H08293001A JP 7281532 A JP7281532 A JP 7281532A JP 28153295 A JP28153295 A JP 28153295A JP H08293001 A JPH08293001 A JP H08293001A
Authority
JP
Japan
Prior art keywords
vertical
pair
image data
vertical bars
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP7281532A
Other languages
English (en)
Other versions
JP3805005B2 (ja
Inventor
Kei Fuangu Hangu
ケイ ファング ハング
Toshiaki Yagasaki
敏明 矢ヶ崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Publication of JPH08293001A publication Critical patent/JPH08293001A/ja
Application granted granted Critical
Publication of JP3805005B2 publication Critical patent/JP3805005B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/15Cutting or merging image elements, e.g. region growing, watershed or clustering-based techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】光学文字認識装置において、接触した大文字を
切断する。 【解決手段】先ず、接触した文字”LI”(a)の垂直
ヒストグラム(d)を生成し、対の垂直バー107及び
108を検出する。そして、この対の垂直バーの間にお
ける3つの水平バンド104〜106の夫々における画
像データの存在を確認する。この場合、水平バンド10
6に画像データが存在する(c)。次いで、水平バンド
104〜106のいずれに画像データが存在するかによ
って、4つのクラスのいずれかにクラス別けし、このク
ラス別けに基づいて垂直バーの対を切断するか否か、及
び切断するとしたら何処を切断するかを決定する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、接触した文字を含
む画像における独立した文字を切り出す画像処理装置及
び光学的文字認識装置及びそれらの方法に関するもので
ある。
【0002】
【従来の技術】文字認識システムにおいては、文書の画
像を生成するために、複数の文字で構成された文書をス
キャンし、文書の画像は、独立した文字の画像を切り出
すために区分して分析される。ここで、各々の文字画像
は、一致するものを見つけるために予め設定された標準
的なパターンと比較され、一致するものを見つけたとき
に文字の識別子が出力される。
【発明が解決しようとする課題】独立した文字の画像を
切り出すべく文書を区分して解析するための多くの技術
が提案されている。これらの技術の殆どは、隣接する文
字の画像の間の空間の存在に依存し、それ故に、これら
の技術は、互いに接触した文字の画像の間を切断しな
い。その結果として、単一の文字の画像を比較する代わ
りに、接触した文字に関しては、2またはそれ以上の接
触した文字が比較される。接触した文字と一致する予め
設定された文字パターンが存在しない場合は、それらの
接触した文字に関する認識は失敗する。
【0003】例えば、タイプ印刷された文書のように、
固定したピッチで構成された文字を有する文書において
は、接触した文字は希であり、認識の精度も比較的高
い。しかしながら、例えば、発行された特許、新聞、雑
誌の如き植字した文書(type-set document)のように
均整のとれた区間を有する文書に関しては、接触した文
字は、より頻繁となり、それらの頻度は大文字の付近で
高くなる。例えば、均整のとれた空間を有する文字列”
LIFT”においては、通常”L”と”I”が接触
し、”F”と”T”が接触する。従来の文字の切り出し
技術は、このような接触した文字の間を切断することに
失敗するため、均整のとれた空間を有する文字、特に大
文字に関しての認識の精度は比較的低い。
【0004】したがって、認識の精度を高めるために
は、接触した文字の間を切断する切断技術が必要とな
る。
【0005】接触した文字の間を切断する1つの切断技
術は、入力文字データの投影した輪郭(projection con
tour)を生成し、その投影した輪郭におけるピーク数、
ピークの高さ、ピークの広がり、ピークの幅、そのプロ
ジェクションの輪郭における谷の深さ、その投影した輪
郭から生成された平滑化した垂直方向の投影の曲線の対
称性等のファクタに基づいて、入力文字データに存在す
る接触した文字の領域を決定する。そして、谷の関数
(valley function)が、検知された接触した文字領域
を切断する場所を決定するために使用される。この技術
に関する1つの問題は、特定の文字の組合わせは、特定
の文字から区別できないことである。例えば、文字の組
合わせ”LI”についての投影した輪郭は、文字”U”
についての投影した輪郭から区別することができない。
その結果、文字の切断はなされず、それ故に、正しい文
字認識を行うことができない。
【0006】したがって、接触した文字を切断する技
術、特に接触した大文字を切断する技術が必要となる。
【0007】
【課題を解決するための手段】本発明は、上記の課題に
鑑みてなされたものであり、接触した文字における垂直
な線の一画の対の間の空間をクラス別けすることによ
り、接触した文字の間を切断する方法及び装置を含む文
字認識システムを提供するものである。
【0008】本発明の1つの形態は、少なくとも2つの
接触した文字を含む文字画像データから独立した文字を
切り出すための方法及び装置である。第1の垂直バーの
対が文字画像データ中で検出され、前記垂直バーの対の
間に位置する複数の独立した水平バンドの夫々について
画像データの存在が確認される。前記第1の垂直バーの
対は、その水平バンドが画像データを含む前記垂直バー
の対に基づいてクラス別けされ、前記垂直バーの間で切
断するか否か、及びその切断の場所が決定される。
【0009】前述の文字切断方法は、文字の幅には従わ
ず、文字領域における垂直バーの対の間の空間のクラス
別けに従って切断されるため、接触した文字の正確な切
断が可能になり、過度の演算を実行することなく、尚且
つ例えば”U”のような文字の中で間違って切断するこ
となく、例えば”LI”のような接触した文字が切断さ
れる。さらに、前述の発明は、クラス別けの体系に従っ
て文字領域を切断するため、文字の切断の誤りの頻度が
減少する。
【0010】本発明の好適な実施の態様に拠れば、本発
明は、文字認識システムに係り、上記の文字切断技術の
適用の前に、先ず、接触していない文字の間を切断す
る。その後、未認識の文字画像が接触した文字の画像で
あるとの過程の下に、上記の切断技術がその未認識の文
字画像に適用される。もし必要であれば、接触した文字
に関する他の切断技術を適用しても良い。そして、未認
識の文字に切断技術を適用する処理を、全文字が正しく
認識されるまで何回か繰り返しても良い。
【0011】ここで説明した課題を解決するための手段
は、発明の本質を即座に理解するためのものである。本
発明は、以下の発明の実施の形態の説明と添付図面を参
照することにより、さらに完全に理解される。
【0012】
【発明の実施の形態】図1は、本発明の実施の形態に係
る装置の外観を示す図である。図1に示されているの
は、例えば米マイクロソフト社のウインドウズ等のウイ
ンドウ環境を有する米アップル社のMacIntoshまたはI
BM社のPC互換のコンピュータ等のコンピュータ装置
10である。コンピュータ装置10は、カラーモニタ等
の表示画面12、次のデータやユーザの命令を入力する
ためのキーボード13、表示画面12上に表示されたオ
ブジェクトをポインティングしたり、操作したりするた
めのマウス等のポインティングデバイス14を備えてい
る。
【0013】コンピュータ装置10は、コンピュータデ
ィスク11のような大容量記憶装置を備えており、この
大容量記憶装置は、文書の画像データ、テキストデータ
ファイル、その他の圧縮或いは伸張された形態のデータ
ファイル、文字認識プログラム、文書処理或いはスプレ
ッドシート(spreadsheet)処理プログラム、その他の
情報処理プログラム(コンピュータ10によって操作し
たり、ディスク11上に格納したり、オペレータに表示
画面12を介してこれらのファイルのデータを提供した
りするプログラム命令を含む)を格納することができ
る。
【0014】画像データは、文書若しくはその他の画像
をスキャンするスキャナ16によって入力され、これら
の文書等のビットマップ画像をコンピュータ装置10に
提供する。また、データは、ネットワークインターフェ
ース24等の他の様々な資源や、ファクシミリ/モデム
インターフェース26を介して他の外部装置からコンピ
ュータ装置10に入力されることもある。
【0015】図1には、プログラム可能な汎用のコンピ
ュータ構成が示されているが、他の機器と接続して用い
る、或いは単独で用いるコンピュータや、他のタイプの
データ処理装置にも本発明を提供可能なことは容易に認
識される。
【0016】図2は、コンピュータ装置10の内部構成
を示す詳細なブロック図である。図2に示すように、コ
ンピュータ装置10は、コンピュータバス21と接続さ
れた中央処理装置(CPU)20を有している。また、
コンピュータバス21には、スキャナインターフェース
22、ネットワークインターフェース24、ファクシミ
リ/モデムインターフェース26、ディスプレイインタ
ーフェース27、キーボードインターフェース28、マ
ウスインターフェース29、メインメモリ30、ディス
ク11が接続されている。
【0017】メインメモリ30は、文字切断プログラ
ム、文字認識プログラム、文書及び情報処理プログラ
ム、その他のアプリケーションプログラム等の格納され
たプログラム命令を実行する際に、CPU20が使用す
るランダムアクセスメモリ領域を提供する。さらに具体
的には、CPU20は、これらのプログラムをディスク
11からメインメモリ30に読み込んで、メインメモリ
30を用いて、これらの格納されたプログラムを実行す
る。
【0018】図3は、本実施の形態の光学的文字認識シ
ステムの動作を示すフローチャートである。図3におけ
る処理の工程は、上記の如くディスク11上に格納され
ており、メインメモリ30を用いてCPU20によって
実行される。
【0019】ステップS301において、ユーザは、本
実施の形態の光学的文字認識システムに画像データを入
力する。画像データは、スキャナ16を用いて文書をス
キャンすることを含む上記の手段によって入力される。
また画像データとしては、テキストや写真等を含む様々
な画像を適用することができる。
【0020】ステップS302では、例えば、米国特許
出願第08/171,720号に開示されたブロック選
択技術を用いて入力画像データにおいてテキストブロッ
クを識別する。上記米国出願の内容は、本出願の一部と
して取り込んでいる。ステップS303では、テキスト
ブロックにおいて、テキストの独立した行を識別する。
ステップS304では、テキストの1つの行内の文字を
公知の空白切断方法に基づいて切り出す。すなわち、テ
キストの行における空白が識別され、その空白の位置に
基づいてテキストの1つの行内の夫々の文字をその行か
ら切り出す。ステップS305では、空白切断方法によ
って全文字が切断されたか否かを判断する。そして、全
文字が切断された場合には、処理の流れはステップS3
19に進み、ここで入力画像データの光学的文字認識が
終了する。一方、全文字が空白切断方法によって切り出
されていない場合には、処理の流れはステップS306
に進む。ステップS306では、ステップS311〜S
317を10回繰り返す際に使用するフラグ(FLA
G)を初期化する。次いで処理の流れはステップS30
7に進む。
【0021】ステップS307では、切断された文字を
識別すべく認識処理され、ステップS308では、認識
が適切になされたことを補償するために認識の結果を確
かめる。認識が適切になされたと判断された場合は、処
理の流れはステップS309からステップS320に進
み、ここで他の情報処理プログラムによる使用のために
テキストファイルに文字の識別子を格納し、処理の流れ
はステップS305に進む。文書中の全文字が処理され
たことがステップS305において判断されると、処理
の流れはステップS309からステップS310に進
む。
【0022】ステップS310では、ステップS31
1、S313、S315及びS317の文字切断ルーチ
ンが文字領域を10回切断したか否かを判断する。そし
て、文字切断ルーチンが文字領域を10回切断したら、
処理はステップS321に進み、更なる処理が更なる情
報を発生しないことが決定される。そして、ステップS
321では、エラーフラグをファイルに格納する。その
後、処理の流れはステップS305に戻り、全ての文字
画像に関して処理するまで動作を繰り返す。
【0023】ステップS311、S313、S315及
びS317の文字切断ルーチンが文字領域を10回切断
した場合、処理はステップS311〜S317に進み、
文字切断ルーチンの1つが文字領域を切断する。
【0024】ステップS311では、本実施の形態の文
字切断方法(クラス別け方法)が文字領域に適用され
る。この方法は、図4に詳細を示されている。ステップ
S312では、ステップS311において切断がなされ
たか否かを判断する。そして、ステップS311におい
て切断がなされたと判断した場合には、処理はステップ
S318に進み、切断がなされたことを示すためにフラ
グをインクリメントする。一方、ステップS311にお
いて切断がなされなかった場合にはステップS313に
進む。
【0025】ステップS313では、公知の最も弱い接
触点を持つ文字の切断方法(weakest touching point c
haracter cutting method;最弱接触点方法)が文字領
域に適用される。この最も弱い接触点を持つ文字の切断
方法は、文字領域において、文字領域の垂直のヒストグ
ラムの垂直成分が最小の点で、2つの接触した文字の間
を切断する。そして、切断がなされたと判断した場合
は、処理の流れはステップS318に進み、切断がなさ
れたことをしめすためにフラグをインクリメントする。
一方、ステップS313において、切断がなされない場
合には、処理はステップS315に進む。
【0026】ステップS315では、公知の1個の接触
点を持つ文字の切断方法(single touching point char
acter cutting method;シングル接触点方法)が文字領
域に適用される。この1個の接触点を持つ文字の切断方
法は、文字領域において、垂直な線を横切る接触した文
字における唯1つの点を含む垂直な線で、2つの接触し
た文字の間を切断する。例えば、”OO”のような接触
した文字の組合わせにおいて、文字上の垂直な線を文字
が接触する点で唯一つの点が横切る。したがって、切断
は、その垂直な線に沿ってなされる。ステップS316
では、ステップS315において切断がなされたと判断
した場合は、処理の流れをステップS318に進め、切
断がなされたことを示すためにフラグをインクリメント
する。一方、ステップS315において切断がなされな
かった場合には、処理の流れはステップS317に進
む。
【0027】ステップS317では、公知の文字分布の
谷(valley-on-the-character-upper-profile)文字切
断方法(若しくは谷文字切断方法)が文字領域に適用さ
れる。この谷文字切断方法は、接触した対の文字を谷関
数によって決定した点で切断する処理であり、この処理
の後、処理の流れはステップS318に進み、ここでフ
ラグがインクリメントされる。
【0028】本実施の形態は、本実施の形態において説
明した文字切断ルーチンに限定されるものではない。す
なわち、他の文字切断ルーチンを上記のルーチンに追加
しても良いし、置換しても良いし、1または2以上の上
記の公知の文字切断ルーチンを削除しても良い。
【0029】ステップS318のおいてフラグがインク
リメントされた後、処理の流れはステップS307に進
み、ここで切断が認識される。上記の処理は、文字が1
0回切断され、それが認識されるまで、或いは文字が正
しく認識されるまで繰り返され、その後、処理の流れは
ステップS321に進んでテキストファイルにエラーフ
ラグが格納されるか、若しくはステップS320に進ん
で認識された文字が格納される。その後、処理の流れは
ステップS305に戻り、全ての文字の領域が認識され
るまで一連の処理が繰り返される。
【0030】図4(a)及び(b)は、ステップS31
1に係る本実施の形態の文字切断方法のフローチャート
を示している。図4に示すフローチャートに拠れば、第
1の垂直バーの対が文字の画像データから検出され、第
1の垂直バーの対の間に位置する複数の独立した水平バ
ンドの夫々における画像データの存在が確認される。第
1の垂直バーの対は、画像データを含む水平バンドに基
づいてクラス別けされ、そのクラス別けに基づいて、垂
直バーの間で切断するか否か、及び切断する場所が決定
される。図4のフローチャートに示される方法の各工程
を以下に説明する。
【0031】ステップS401では、ステップS310
から入力された文字領域のラインに関する情報を検出す
る。さらに具体的には、図6に示す4つの水平ライン、
すなわち、ライン1、2、3及び4が、文字領域に関し
て定義される。ライン1は、文字の最大の高さである。
ライン2は、例えば”a”のような、高さが低い場合の
文字に関する最大の高さである。ライン3は、文字の基
準線である。ライン4は、例えば”j”のような、高さ
が低い文字に関する基準線3よりも下に伸びた文字の最
大である。ステップS401では、ステップS310か
ら入力された文字領域に関するこれらのラインの位置を
決定する。ステップS402では、更なる処理のため
に、ライン1及び3の間に広がっている文字領域を選択
する。例えば、ステップS402においては、ライン1
及び3の間にのみに広がった、図6に示す”W”が更な
る処理のために選択される。一方、図6に示す”a”
は、ライン2及び3の間にのみ広がっており、また図6
に示す”g”は、ライン2及び4の間にのみ広がってお
り、これらは選択されない。選択されなかった部分は、
ステップS311の切断方法によっては処理されない
が、勿論、切断方法の1つであるステップS313、S
315、及びS317によって処理される。
【0032】ステップS403〜S406では、ステッ
プS402で選択された文字領域において第1の垂直バ
ーの存在が検知される。特に、ステップS403では、
選択された文字領域を描く垂直のヒストグラムを算出す
る。図7は、接触した文字の組合わせ”LR”71から
演算した垂直のヒストグラム75の一例を示す。また、
図10(d)は、他の例の垂直ヒストグラム103を示
しており、これは図10(a)に示す”LI”の接触し
た文字の組み合せ101から算出した例である。
【0033】ステップS404では、ヒストグラムにお
いて、垂直バーの検出のための所定の垂直成分をセット
し、ステップS405では、ヒストグラムにおいて、垂
直成分が所定の垂直成分を超える垂直バーを検出する。
図10(d)は、所定の垂直成分102(符号”h”を
付している)を示しており、所定の垂直成分を超える垂
直バー107及び108を有する垂直ヒストグラムを重
ねて示している。図10(d)に示す例では、垂直バー
107は、ステップS405で見つかる。ステップS4
06では、ヒストグラムにおいて、所定の垂直成分を超
える次の垂直バーを検出する。図10(d)に示す例で
は、垂直バー108は、ステップS406において見つ
かる。
【0034】次の垂直バーがステップS406において
見つからない場合、文字領域は終了しており、処理の流
れはステップS430からステップS431に進み、こ
こで、文字領域において、この切断方法が切断をなすこ
とができなかったことを示すエラーコードが格納される
(処理の流れは、図3のステップS312に進む)。ス
テップS406において、次の垂直バーが検出された
ら、処理の流れはステップS430からステップS40
8に進み、ここで垂直バーの対の間の3つの独立した水
平バンドの夫々における画像データの存在を確かめる。
図10(b)においては、第1の水平バンドには106
が付され、第2の水平バンドには105が付され、第3
の水平バンドには104が付されている。これらの水平
バンドの夫々は、互いに重なり合わず、互いに排他的で
あり、各々の水平バンドが同一の高さを有しており、互
いに独立している。水平方向の横断は、図10(b)に
おいて”x”を付した点109で、ヒストグラムの水平
軸と交差する垂直バー間の中間に位置する垂直線110
を参照して決定される。
【0035】ステップS409では、垂直バーの対をス
テップS408で検出した水平方向の横断の位置に従っ
て、4つのクラスの1つにクラス別けされる。クラス別
けは図8に示されている。図8に示すように、クラス1
は、第1及び第2の水平バンドのみにおいて水平方向の
横断を有する垂直バー(81)、水平方向の横断がない
垂直バー(82)、第1の水平バンドのみにおいて水平
方向の横断を有する垂直バー(83)を含む。クラス2
は、第2及び第3の水平バンドのみにおいて水平方向の
横断を有する垂直バー(84)、3つの水平バンドの全
てにおいて水平方向の横断を有する垂直バー(85)を
含む。クラス3は、第2の水平バンドのみにおいて水平
方向の横断を有する垂直バー(86)、第1及び第2の
水平バンドのみにおいて水平方向の横断を有する垂直バ
ー(87)を含む。クラス4は、第3の水平バンドのみ
において水平方向の横断を有する垂直バー(88)を含
む。
【0036】処理の流れは、ステップS410〜S41
3に進み、ここでクラス別けに基づいて、垂直バーの対
の間を切断するか、しないか、また切断する場合にはど
こを切断するかが決定される。
【0037】ステップS409において垂直バーが”ク
ラス1”としてクラス別けされた場合には、処理はステ
ップS410を経てステップS414に進む。ステップ
S414では、第1の垂直バーの終点と第2の垂直バー
の開始点の間の図9に示す距離”d”(符号91を付し
ている)を算出し、最大文字距離dmax(図9におい
ては不図示)と比較する。最大文字距離dmaxは、2
つの接触した文字の2つの垂直バー間の最大距離であ
る。ステップS414において、”d”がdmaxより
も大きくないことが判断されると、処理の流れはステッ
プS415に進み、ここで垂直バーは図9に示す”CU
T0”93で切断され、次いでステップS407に進
み、ここで切断した文字が格納される。図9に示す”C
UT0”93は、第1の垂直バーと第2の垂直バーとの
中間に位置する切断点である。
【0038】”d”がdmaxよりも大きいと判断され
ると、処理の流れはステップS416に進む。ステップ
S416では、第1の垂直バーが文字”L”の構成要素
であるか否かを判断する。ステップS416において、
第1の垂直バーが文字”L”の構成要素であると判断し
た場合は、処理の流れはステップS417に進み、ここ
で垂直バーは、図9に示す”CUT1”94で切断され
る。”CUT1”94は、第2の垂直バーから所定の距
離であって、第2の垂直バーと、第1及び第2の垂直バ
ーの中間点との間に位置する。”CUT1”がなされた
後、処理の流れはステップS407に進み、ここで切断
された文字が格納される。一方、ステップS416で垂
直バーの1つが文字”L”の構成要素でないと判断した
場合は、切断は行われなず、処理の流れはステップS4
06に進み、次の垂直バーが検出される。
【0039】ステップS409において、垂直バーがク
ラス2としてクラス別けされた場合は、処理の流れはス
テップS410からステップS411を経てステップS
418に進む。ステップS418では、図9に示す距
離”d”を算出し、その距離”d”を最小距離dmin
(図9においては不図示)と比較する。最小距離dmi
nは、2つの接触した文字の2つの垂直バー間の最小距
離である。ステップS418において、”d”がdmi
nより小さいと判断した場合は、”d”がdminより
も小さいことは2つの垂直バーが同一の文字の部分であ
ることを示しているため切断を行わない。したがって、
処理の流れはステップS406に進み、ここで次の垂直
バーが検出される。一方、ステップS418におい
て、”d”がdminより小さくないことが判断された
場合は、処理の流れはステップS419に進み、垂直バ
ーが文字”R”または文字”A”のいずれかであるか否
かを判断する。ステップS419において、垂直バーが
文字”R”または文字”A”のいずれかの構成要素であ
ると判断した場合、処理の流れはステップS406に進
み、次の垂直バーが検出される。一方、ステップS41
9において、垂直バーが文字”R”または”A”のいず
れの構成要素でもないと判断した場合は、ステップS4
20に進み、ここで”CUT1”が行われる。”CUT
1”の後、処理の流れはステップS407に進み、切断
した文字が格納される。
【0040】ステップS409において、垂直バーがク
ラス3としてクラス別けされた場合は、処理の流れはス
テップS410及びS411を経てステップS412に
進む。この場合は、切断はなされず、処理の流れはステ
ップS412からステップS406に直接進み、ここで
次の垂直バーが検出される。
【0041】ステップS409において、垂直バーがク
ラス4としてクラス別けされた場合は、処理の流れはス
テップS410、S411及びステップS412を経て
ステップS413に進み、それからステップS421に
進む。ステップS421では、図9に示す距離”d”を
算出し、その距離を最大距離dmaxとオフセット定数
との和と比較する(図9においては不図示)。このオフ
セット定数は、入力画像データにおける文字の高さの平
均に基づいて予め定められた定数であり、文字の書体の
変化による文字の長さの変化を補償する値を含んでい
る。典型的には、このオフセット定数は、文字の高さの
平均の9分の1に設定される。ステップS421におい
て、”d”がdmaxとオフセット定数との和よりも大
きくないと判断した場合、”CUT0”がなされ、その
後処理の流れはステップS407に進み、切断された文
字が格納される。一方、ステップS421において、”
d”がdmaxとオフセット定数との和よりも大きいと
判断した場合は、切断はなされず、処理の流れはステッ
プS406に進み、次の垂直バーが検出される。
【0042】上述したように、切断がなされず、次の垂
直バーが検出される場合は、切断がなされるか、或いは
次の垂直バーが検出されなくなるまで、垂直バーの次の
対に関して一連の処理が繰り返えし実行される。
【0043】上述の4つのクラス別けの各々について、
接触した文字を上記の方法に適用した例を以下に説明す
る。
【0044】<クラス1>図10(a)は、接触(若し
くは併合)した文字の組合わせ”LI”を示しており、
画像データのテキスト領域に存在する文字”L”115
と文字”I”126とを含んでいる。本実施の形態に拠
れば、図3及び図4に示すフローチャートを用いて説明
したように、文字”LI”の組合わせを含む画像データ
は、ステップS301において光学的文字認識システム
に入力される。ステップS302では、入力画像データ
中のテキストブロックを識別し、ステップS303で
は、そのテキストブロック内のテキストの行を識別す
る。ステップS301、S302、及びS303につい
ては、既に詳細を説明した。
【0045】ステップS304では、上記の空白切断方
法に基づいてテキストの行内の文字領域を切断する。文
字の組合わせ”LI”において文字”L”115及び文
字”I”126の間には空白がないため、”L”115
及び”I”126はステップS304においては切断さ
れない。ステップS305では、切断された文字が未処
理のまま残っているか否かを判断する。この場合、文字
の組み合せ”LI”は、未だ処理されていない。したが
って、処理の流れはステップS306に進み、フラグを
初期化する。その後、処理の流れはステップS307に
進む。ステップS307では、切断された文字領域を認
識する(ただし、文字の組合わせ”LI”が標準的な文
字でない場合には、その文字の組合わせは認識されな
い)。次いで、処理の流れは、ステップS308に進
み、ここで文字の組合わせ”LI”の認識の失敗が確か
められる。文字の組合わせ”LI”は認識されなかった
ので、処理の流れはステップS309からステップS3
10に進む。ステップS310では、文字の組合わせ”
LI”が10回切断して認識されたか否かを判断する。
そして、10回切断して認識された場合は、処理の流れ
はステップS321に進み、ここでエラーフラグが格納
される。一方、文字の組合わせ”LI”が10回切断し
て認識されていない場合は、処理の流れはステップS3
11に進み、ここで文字の組合わせ”LI”は、図4に
示すように、本実施の形態の文字切断方法によって切断
される。
【0046】ステップS401では、図1に示すよう
に、ライン1、2、3及び4の位置を決定する。ステッ
プS402では、ライン1及び3の間にのみ広がる文字
領域を取り出して選択する。これには、文字の組み合わ
せ”LI”が含まれ、この組み合せは、更なる処理のた
めに選択される。ステップS403では、図10(d)
に示す文字の組合わせ”LI”の垂直ヒストグラムを算
出する。ステップS404では、垂直ヒストグラム中の
垂直バーを検出するために所定の垂直成分(図10
(d)の”h”102)を設定する。その後、処理の流
れはステップS405に進み、垂直ヒストグラム103
において所定の垂直成分”h”102を越える垂直バー
107を検出する。ステップS406では、垂直のヒス
トグラム103において所定の垂直成分”h”102を
越える次の垂直バー108を検出する。ステップS43
0では、次の垂直バー108がステップS406で検出
されたか否かを判断する。この例の場合、次の垂直バー
108が検出されるため、処理の流れはステップS40
8に進む。ステップS408では、図10(b)に示す
ように、垂直バー107及び108の間に位置する3つ
の分離した水平バンド104、105、及び106の夫
々において、点”x”109を含む垂直線110を横切
る水平方向の交差を検出する。この例の場合(すなわ
ち、文字の組合わせ”LI”)、図10(b)に示す水
平方向の横断18が第1の水平バンド106において検
出される。しかしながら、第2の水平バンド105、第
3の水平バンド104においては水平方向の横断は検出
されない。この処理の後、処理の流れはステップS40
9に進み、ここで図8に示すクラス別けの体系に基づい
て垂直バー107及び108がクラス別けされる。
【0047】この例の場合、垂直バーは、第1の水平バ
ンド106内に位置する水平方向の横断18を有する。
したがって、この例は、図10(c)に示すようなクラ
ス別けボックスを有し、これは図8に示すクラス別けボ
ックス83と一致する。従って、垂直バー107及び1
08は、クラス1の垂直バーとしてクラス別けされる。
【0048】ステップS409で垂直バー107及び1
08がクラス別けされると、処理の流れはステップS4
10に進み、ここで垂直バーがクラス1の垂直バーとし
てクラス別けされたか否かを判断する。この例の場合、
ステップS409で決定されたように、垂直バー107
及び108は、クラス1の垂直バーとしてクラス別けさ
れている。したがって、処理の流れはステップS414
に進む。
【0049】先ず、図10(d)に示すように、ステッ
プS414では、垂直バー107の終点”e”111と
垂直バー108の開始点”b”112の距離”d”11
3を算出し、その算出した距離を最大文字距離dmax
114と比較する。この例の場合、図10(d)に示す
ように、”d”113はdmax114より大きい。し
たがって、処理の流れは、ステップS414からステッ
プS416に進み、ここで垂直バー107が文字”L”
の構成要素であるか否かを判断する。この例の場合、垂
直バー107は、文字”L”115の構成要素である。
したがって、処理の流れはステップS416からステッ
プS417に進み、ここで文字”L”115及び文字”
I”126を夫々表す垂直バー107及び108が、図
10(e)に示すように”CUT1”で切断される。垂
直バーの切断の後、処理の流れはステップS407に進
み、切断した文字が格納される。
【0050】本実施の形態の文字切断方法を使用してス
テップS311において文字の組合わせ”LI”を切断
した後、処理の流れはステップS312に進み、切断が
されたか否かが判断される。この例の場合、切断がなさ
れているため、処理の流れはステップS318に進み、
文字の組合わせ”LI”がステップS311、S31
3、S315、若しくはS317の切断方法の1つで切
断されたことを示すためフラグを1インクリメントす
る。次いで、ステップS307では、切断された文字”
L”及び”I”を認識し、ステップS308では、ステ
ップS307における認識の結果を確認する。文字”
L”及び”I”が適切に切断されて認識された場合は、
処理の流れはステップS309からステップS320に
進み、認識された文字が格納される。一方、文字”L”
及び”I”が適切に切断されず、適切に認識されなかっ
た場合は、切断、認識に係る全処理、すなわち、ステッ
プS307〜S318が繰り返される。本実施の形態の
処理は、1つの接触した文字の組合わせに関して10回
実行され、その後処理の流れはステップS310からス
テップS321に進み、エラーフラグが格納される。
【0051】<クラス2>図12(a)は、本実施の形
態の光学的文字認識システムに入力される画像データに
おいて見つかる接触した文字の組み合せ”FN”を示し
ている。この例の場合、ステップS301〜ステップS
310は、前述の接触した文字の組み合せ”LI”の場
合と同様であるので、その詳細に関しては説明を省略す
る。ステップS301〜S310に続くステップS31
1において、接触した文字の組合わせ”FN”は、本実
施の形態の文字切断方法に基づいて切断される。
【0052】図4は、本実施の形態の文字切断方法を示
している。先ず、ステップS401及びS402では、
接触した文字の組合わせ”FN”を選択する。この選択
の詳細は、接触した文字の組合わせ”LI”に関する上
記の説明と同様であるので、その詳細に関しては説明を
省略する。次のステップS403では、図12(c)に
示す接触した文字の組み合せ”FN”の垂直ヒストグラ
ム172を算出し、ステップS404では、所定の垂直
成分”h”102を設定する。ステップS405では、
垂直ヒストグラム172における垂直バー139を検出
し、ステップS406では、垂直ヒストグラム172に
おける次の垂直バー140を検出する。接触した文字の
組合わせ”LI”に関する例のように、垂直バー139
及び140の双方が所定の垂直成分”h”102を超え
ている。次いで、処理の流れはステップS430からス
テップS408に進み、ここで垂直バー139及び14
0の間に位置する3つの水平バンド155、156、及
び157の夫々について、線173における水平方向の
横断を検出する。水平方向の横断159は、第2の水平
バンド156において検出され、水平方向の横断160
は、第3の水平バンド157において検出される。第1
の水平バンド155においては水平方向の横断は検出さ
れない。したがって、垂直バー139及び140は、図
8及び図12(b)に示すように、クラス別けボックス
84と一致する水平方向の横断を有する。
【0053】ステップS409において垂直バー139
及び140のクラス別けがされると、処理の流れはステ
ップS410を経てステップS411に進み、垂直バー
がクラス2の垂直バーとしてクラス別けされたか否かが
判断される。この例の場合、ステップS409において
判断したように、垂直バー139及び140は、クラス
2の垂直バーとしてクラス別けされる。したがって、処
理の流れはステップS418に進む。
【0054】図12(c)に示すように、ステップS4
18では、垂直バー139の終点”e”170と垂直バ
ー140の開始点”b”171との距離”d”160を
算出し、その算出した距離と最小文字距離dmin16
1とを比較する。この例の場合は、”d”160は、d
min161よりも小さくない。したがって、処理の流
れは、ステップS419に進み、ここで垂直バー139
及び垂直バー140が文字”R”または文字”A”のい
ずれかであるか否かを判断する。この例の場合、垂直バ
ー139及び140は、文字の組合わせ”FN”の構成
要素であり、文字”R”または文字”A”の構成要素で
はない。したがって、処理の流れはステップS420に
進み、図12(a)に示すように、”CUT1”202
がなされる。その後、処理の流れはステップS407に
進み、切断された文字が格納される。
【0055】上述の本実施の形態の文字切断方法が終了
した後、処理の流れはステップS311からステップS
312に進む。文字の組合わせ”FN”に関する以降の
認識処理は、文字の組合わせ”LI”に関する認識処理
と同様であるので、それに関する説明は省略する。
【0056】<クラス3>図11(a)は、本実施の形
態の光学的文字認識システムに入力される画像データに
おいて見つかる接触した文字の組み合せ”HE”を示し
ている。この例の場合、本実施の形態のステップS30
1〜ステップS310は、前述の接触した文字の組合わ
せ”LI”の例と同様であるため、詳細の説明は省略す
る。ステップS301〜S310に次いで、ステップS
311において、接触した文字の組合わせ”HE”は、
図4に示すように、本実施の形態の文字切断方法に基づ
いて切断される。
【0057】ステップS401及びS402は、接触し
た文字の組合わせ”HE”を選択する。この選択の詳細
は、接触した文字の組合わせ”LI”に関する上記の説
明と同様であるため、ここではその詳細の説明を省略す
る。ステップS403では、接触した文字の組合わせ”
HE”の垂直ヒストグラム(不図示)を算出し、ステッ
プS404では、所定の垂直成分を設定する。ステップ
S405では、垂直ヒストグラムにおける垂直バー11
9を検出し、ステップS406では、垂直ヒストグラム
における次の垂直バー120を選択する。その後、処理
の流れはステップS430からステップS408に進
み、ここで図11(b)に示すように、垂直バー119
及び120の間に位置する3つの分離した水平バンド1
16、117、及び118の夫々における線122での
水平方向の横断が検出される。垂直バー119及び12
0は、図11(c)に示す文字”H”163の構成要素
を表わしているため、本実施の形態の文字切断方法は、
先ず、文字”H”163を切断すべきか否かに関して処
理する。ステップS408では、水平方向の横断142
だけが線122で検出される。水平方向の横断142
は、図11(b)及び11(c)に示すように、第2の
水平バンド117において検出される。第1の水平バン
ド118、第3の水平バンド116においては、水平方
向の横断は検出されない。したがって、文字”H”16
3に関しては、垂直バー119及び120は、図8及び
図11(d)に示すように、クラス別けボックス86と
一致する水平方向の横断を有する。したがって、垂直バ
ー119及び120は、クラス3の垂直バーとてクラス
別けされる。
【0058】この例の場合は、ステップS409におい
て決定されたように、垂直バー119及び120は、ク
ラス3の垂直バーとしてクラス別けされている。したが
って、切断はなされず、処理の流れはステップS410
及びS411を経て、直接ステップS406に進み、こ
こで次の垂直バーが検出される。
【0059】この例の場合は、ステップS406では、
図11(b)及び(e)に示す次の垂直バー121を検
出する。したがって、処理の流れはステップS430か
らステップS408に進み、ここで垂直バー120及び
121の間に位置する3つの水平バンド116、11
7、及び118の夫々における線146での水平方向の
横断が検出される。この例の場合(すなわち、図11
(e)に示す文字”H”163及び文字”E”164の
間の接触した領域)、水平方向の横断144が、第3の
水平バンド116において検出され、水平方向の交差1
45が第1の水平バンド118において検出される。第
2の水平バンド117においては、水平方向の横断は検
出されない。したがって、図11(e)に示す接触した
文字の組合わせ”HE”は、図8及び図11(f)に示
すクラス別けボックス81と一致する水平方向の横断を
有する。そこで、ステップS409では、垂直バー12
0及び121は、クラス1の垂直バーとしてクラス別け
される。
【0060】この例の場合、ステップS409において
決定したように、垂直バー120及び121は、クラス
1の垂直バーとしてクラス別けされている。したがっ
て、処理の流れはステップS409からステップS41
0を経てステップS414に進む。
【0061】先ず、図11(e)に示すように、ステッ
プS414では、垂直バー120の終点”e”143と
垂直バー121の開始点”b”123の距離”d”12
4を算出し(不図示のヒストグラムに基づいて算出)
し、その算出した距離を最大文字距離dmax114と
比較する。この例の場合、図11(e)に示すよう
に、”d”124は、dmax114より大きくない。
したがって、処理の流れはステップS414からステッ
プS415に進み、ここで図11(g)に示すよう
に、”CUT0”203がなされる(線146に沿って
なされる)。この切断の後、処理の流れはステップS4
07に進み、切断された文字が格納される。
【0062】本実施の形態の文字切断方法が終了した
後、処理の流れはステップS311からステップS31
2に進む。接触した文字の組合わせ”HE”に関する以
降の処理は、文字の組合わせ”LI”に関する認識処理
と同様であるため、その詳細に関する説明は省略する。
【0063】<クラス4>図5(a)は、本実施の形態
の光学的文字認識システムに入力する画像データにおい
て見つかる接触した文字の組合わせ”UM”165を示
している。この例の場合、本実施の形態のステップS3
01〜ステップS310は、上記の接触した文字の組合
わせ”LI”の例と同様であるため、その詳細な説明は
省略する。ステップS301〜S310に次いでステッ
プS311では、図4に示すように、本実施の形態の文
字切断方法に基づいて接触した文字の組合わせ”UM”
を切断する。
【0064】ステップS401及びS402では、接触
した文字の組合わせ”UM”を選択する。選択の詳細
は、接触した文字”LI”に関する上記の説明と同様で
あるため、その説明を省略する。次のステップS403
では、所定の垂直成分をセットする。ステップS405
では、垂直ヒストグラムにおける垂直バーを検出し、ス
テップS406では、垂直ヒストグラムにおける次の垂
直バーを検出する。次いで、処理の流れはステップS4
30からステップS408に進み、ここで垂直バー12
5及び130の間に位置する3つの水平バンド147、
148、及び149の夫々における線150での水平方
向の横断が検出される。垂直バー125及び130は、
図5(b)に示す文字”U”166の構成要素を表して
いるため、本実施の形態の文字切断方法は、先ず文字”
U”166を切断すべきか否かに関して処理する。ステ
ップS408では、最初の水平バンド147の中に位置
する線150を含む水平方向の横断151だけが検出さ
れ、第2の水平バンド148、第3の水平バンド149
においては水平方向の横断が検出されない。したがっ
て、文字”U”166に関しては、垂直バー125及び
130は、図8及び図5(c)に示すクラス別けボック
ス83と一致する水平方向の横断を有する。したがっ
て、垂直バー125及び130は、クラス1の垂直バー
としてクラス別けされる。
【0065】この例の場合は、ステップS409におい
て決定されたように、垂直バー125及び130は、ク
ラス1の垂直バーとしてクラス別けされる。したがっ
て、処理の流れはステップS410からステップS41
4に進む。
【0066】先ず、図5(b)に示すように、ステップ
S414では、垂直バー125の終了点”e”132と
垂直バー130の開始点”b”133の距離”d”13
4が算出され(不図示のヒストグラムに基づいて算
出)、その算出した距離を最大文字距離dmax114
と比較する。この例の場合は、図5(b)に示すよう
に、”d”134は、dmax114より大きい。した
がって、処理の流れはステップSステップS414から
ステップS416に進み、ここで垂直バー125が文
字”L”の構成要素であるか否かが判断される。この例
の場合は、垂直バー125は、文字”L”の構成要素で
はない。したがって、切断はなされず、処理の流れはス
テップS406に進み、ここで次の垂直バーが検出され
る。
【0067】この例の場合は、ステップS406で次の
垂直バー311を検出する。したがって、処理の流れは
ステップS430からステップS408に進み、ここで
図5(a)及び5(d)に示すように、垂直バー130
及び131の間に位置する3つの水平バンド147、1
48、及び149の夫々における線153での水平方向
の横断が検出される。この例の場合(すなわち、図5
(d)に示す文字”U”166及び文字”M”167の
間の接触領域)は、水平方向の横断154は、第3の水
平バンド149において検出され、第1の水平バンド1
47、第2の水平バンド148においては検出されな
い。したがって、図5(d)に示す接触した文字の組合
わせ”UM”は、図8及び図5(e)に示すクラス別け
ボックス88と一致する水平方向の横断を有する。した
がって、ステップS409では、垂直バー130及び1
31をクラス4の垂直バーとしてクラス別けする。
【0068】この例の場合は、ステップS409におい
て決定したように、垂直バー130及び131は、クラ
ス4の垂直バーとしてクラス別けされる。したがって、
処理の流れはステップS410、S411、及びS41
2を経て、ステップS413に進み、それからステップ
S421に進む。
【0069】先ず、図5(d)に示すように、ステップ
S421では、垂直バー130の終了点”e”135と
垂直バー131の開始点”b”136の距離”d”13
7を算出(不図示のヒストグラムに基づいて算出)し、
その算出した距離を、最大文字距離dmax114とオ
フセット定数との和と比較する。この例の場合は、図5
(d)に示すように、”d”137はdmax114と
オフセット定数との和より大きくない。したがって、処
理の流れはステップS421からステップS422に進
み、ここで図5(f)に示すように、”CUT0”20
4がなされる。切断がなされた後、処理の流れはステッ
プS407に進み、切断された文字が格納される。
【0070】ステップS311において上記の本実施の
形態の文字切断方法が終了した後、認識処理はステップ
S311からS312に進む。接触した文字の組合わ
せ”UM”に関する以降の認識処理は、接触した文字の
組合わせ”LI”に関する認識処理と同様であるため、
それに関する説明は省略する。
【0071】上記の例は、本発明によって切断し、認識
される、接触した文字の組合わせの一例に過ぎない。本
発明は、文字または書体の種類に拘わらず、接触した文
字の組合せについて広く適用することができる。
【0072】また、本発明は、複数の機器から構成され
るシステムに適用しても、1つの機器からなる装置に適
用しても良い。また、本発明はシステム或いは装置にプ
ログラムを供給することによって達成される場合にも適
用できることはいうまでもない。この場合、本発明を達
成するためのソフトウェアによって表されるプログラム
を格納した記憶媒体から、該プログラムを該システム或
は装置に読み出すことによって、そのシステム或は装置
が、本発明の効果を享受することが可能となる。
【0073】
【発明の効果】以上説明したように本発明に拠れば、接
触した文字を認識する精度を高めることができるという
効果がある。
【0074】
【図面の簡単な説明】
【図1】本発明の光学的文字認識システムの動作におい
て使用されるコンピュータ装置の斜視図である。
【図2】図1に示す光学的文字認識システムのブロック
図である。
【図3】本発明の光学的文字認識システムの動作を示す
フローチャートである。
【図4(a)】本発明の文字切断技術のフローチャート
である。
【図4(b)】本発明の文字切断技術のフローチャート
である。
【図5】(a)は接触した文字の組合わせの一例を示す
図である。(b)は(a)に示す文字の組合わせのうち
切断しない部分を示す図である。(c)は(b)に対応
するクラス別けボックス(クラス1)を示す図である。
(d)は(a)に示す文字の組合わせのうち切断する部
分を示す図である。(e)は(d)に対応するクラス別
けボックス(クラス4)を示す図である。(f)は
(a)に示す文字の組合わせの切断位置を示す図であ
る。
【図6】代表的なテキストラインを示す図である。
【図7】接触した文字とそのヒストグラムの例を示す図
である。
【図8】本発明の文字切断技術において使用するクラス
別けの体系を示す図である。
【図9】本発明の文字切断技術で使用する、垂直バーの
間で切断するための2つの選択を(CUT0、CUT
1)を示す図である。
【図10】(a)は接触した文字の組合わせの一例を示
す図である。(b)は(a)に示す文字の組み合せに関
する処理を説明する図である。(c)は(b)に対応す
るクラス別けボックス(クラス1)を示す図である。
(d)は(a)に示す文字の組合わせのヒストグラムを
示す図である。(e)は(a)に示す接触した文字の切
断位置を示す図である。
【図11】(a)は接触した文字の組合わせの一例を示
す図である。(b)は(a)に示す文字の組み合せに関
する処理を説明する図である。(c)は(a)に示す文
字の組合わせのうち切断しない部分を示す図である。
(d)は(c)に対応するクラス別けボックス(クラス
3)を示す図である。(e)は(a)に示す文字の組合
わせのうち切断する部分を示す図である。(f)は
(e)に対応するクラス別けボックス(クラス1)を示
す図である。
【図12】(a)は接触した文字の組合わせの一例を示
す図である。(b)は(a)に対応するクラス別けボッ
クス(クラス2)を示す図である。(c)は(a)に示
す文字の組合わせのヒストグラムを示す図である。
─────────────────────────────────────────────────────
【手続補正書】
【提出日】平成8年1月19日
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】図面の簡単な説明
【補正方法】変更
【補正内容】
【図面の簡単な説明】
【図1】本発明の光学的文字認識システムの動作におい
て使用されるコンピュータ装置の斜視図である。
【図2】図1に示す光学的文字認識システムのブロック
図である。
【図3】本発明の光学的文字認識システムの動作を示す
フローチャートである。
【図4(a)】本発明の文字切断技術のフローチャート
である。
【図4(b)】本発明の文字切断技術のフローチャート
である。
【図5】(a)は接触した文字の組合わせの一例を示す
図である。(b)は(a)に示す文字の組合わせのうち
切断しない部分を示す図である。(c)は(b)に対応
するクラス別けボックス(クラス1)を示す図である。
(d)は(a)に示す文字の組合わせのうち切断する部
分を示す図である。(e)は(d)に対応するクラス別
けボックス(クラス4)を示す図である。(f)は
(a)に示す文字の組合わせの切断位置を示す図であ
る。
【図6】代表的なテキストラインを示す図である。
【図7】接触した文字とそのヒストグラムの例を示す図
である。
【図8】本発明の文字切断技術において使用するクラス
別けの体系を示す図である。
【図9】本発明の文字切断技術で使用する、垂直バーの
間で切断するための2つの選択を(CUT0、CUT
1)を示す図である。
【図10】(a)は接触した文字の組合わせの一例を示
す図である。(b)は(a)に示す文字の組み合せに関
する処理を説明する図である。(c)は(b)に対応す
るクラス別けボックス(クラス1)を示す図である。
(d)は(a)に示す文字の組合わせのヒストグラムを
示す図である。(e)は(a)に示す接触した文字の切
断位置を示す図である。
【図11】(a)は接触した文字の組合わせの一例を示
す図である。(b)は(a)に示す文字の組み合せに関
する処理を説明する図である。(c)は(a)に示す文
字の組合わせのうち切断しない部分を示す図である。
(d)は(c)に対応するクラス別けボックス(クラス
3)を示す図である。(e)は(a)に示す文字の組合
わせのうち切断する部分を示す図である。(f)は
(e)に対応するクラス別けボックス(クラス1)を示
す図である。(g)は(a)に示す接触した文字の切断
位置を示す図である。
【図12】(a)は接触した文字の組合わせの一例を示
す図である。(b)は(a)に対応するクラス別けボッ
クス(クラス2)を示す図である。(c)は(a)に示
す文字の組合わせのヒストグラムを示す図である。
【手続補正2】
【補正対象書類名】図面
【補正対象項目名】全図
【補正方法】変更
【補正内容】
【図1】
【図2】
【図6】
【図7】
【図3】
【図4(a)】
【図4(b)】
【図5】
【図8】
【図9】
【図10】
【図11】
【図12】

Claims (65)

    【特許請求の範囲】
  1. 【請求項1】 少なくとも2つの接触した文字を含む文
    字画像データから独立した文字を切り出す画像処理方法
    であって、 文字画像データにおける第1の垂直バーの対を検出する
    検出工程と、 前記第1の垂直バーの対の間に位置する複数の独立した
    水平バンドの夫々における画像データの存在を確認する
    確認工程と、 その水平バンドが画像データを含む前記第1の垂直バー
    の対に基づいて前記第1の垂直バーの対をクラス別けす
    るクラス別け工程と、 前記クラス別けに基づいて前記第1の垂直バーの対の間
    を切断するか否かと、その切断の場所を決定する決定工
    程と、 を備えることを特徴とする画像処理方法。
  2. 【請求項2】 文字画像データの垂直ヒストグラムを生
    成する工程をさらに備え、前記検出工程は、前記垂直ヒ
    ストグラムにおける前記第1の垂直バーの対を検出する
    工程を含むことを特徴とする請求項1に記載の画像処理
    方法。
  3. 【請求項3】 所定の垂直方向の閾値を格納する工程を
    さらに備え、前記検出工程は、前記所定の垂直方向の閾
    値を越える垂直成分を夫々有する2つの垂直バーを含む
    第1の垂直バーの対を検出する工程を含むことを特徴と
    する請求項2に記載の画像処理方法。
  4. 【請求項4】 前記確認工程は、前記第1の垂直バーの
    対の間に位置し、夫々の水平バンドを突き抜ける垂直線
    上の水平方向の横断を確認するすることによって画像デ
    ータの存在を確認する工程を含むことを特徴とする請求
    項2に記載の画像処理方法。
  5. 【請求項5】 前記垂直線は、前記第1の垂直バーの対
    の間の中央に位置することを特徴とする請求項4に記載
    の画像処理方法。
  6. 【請求項6】 前記確認工程は、3つの独立した水平バ
    ンドの夫々における画像データの存在を確認する工程を
    含むことを特徴とする請求項1に記載の画像処理方法。
  7. 【請求項7】 所定の文字の基準線と所定の文字の最大
    高さの線との間に広がる文字を切断するために文字画像
    データを選択する選択工程をさらに備えることを特徴と
    する請求項1に記載の画像処理方法。
  8. 【請求項8】 複数の独立した水平バンドの夫々が同一
    の高さを有することを特徴とする請求項1に記載の画像
    処理方法。
  9. 【請求項9】 前記クラス別け工程は、第1の垂直バー
    の対を4つのクラスの垂直バーの1つにクラス別けする
    工程を含み、前記確認工程は、3つの独立した水平バン
    ドの夫々における画像データの存在を確認する工程を含
    むことを特徴とする請求項1に記載の画像処理方法。
  10. 【請求項10】 前記4つのクラスの垂直バーは、 (i)(a)画像データが第1の水平バンド及び第3の
    水平バンドの両者のみに存在する場合、(b)画像デー
    タが前記第1の水平バンドにのみ存在する場合、及び
    (c)画像データが3つの水平バンドのいずれにも存在
    しない場合の第1のクラスの垂直バーと、 (ii)(a)画像データが第2の水平バンド及び前記第
    3の水平バンドの両者にのみ存在する場合、及び(b)
    画像データが3つの水平バンドの全てに存在する場合の
    第2のクラスの垂直バーと、 (iii)(a)画像データが前記第2の水平バンドにの
    み存在する場合、及び(b)画像データが前記第1の水
    平バンド及び前記第2の水平バンドにのみ存在する場合
    の第3のクラスの垂直バーと、 (iv)画像データが前記第3の水平バンドにのみ存在す
    る場合の第4のクラスの垂直バーと、 を含むことを特徴とする請求項9に記載の画像処理方
    法。
  11. 【請求項11】 設定された切断条件が満たされ、且つ
    前記第1の垂直バーの対が第1のクラス、第2のクラ
    ス、及び第4のクラスの1つとしてクラス別けされた時
    に、第1の垂直バーの対の間を切断する工程と、 第1の垂直バーの対が第3のクラスとしてクラス別けさ
    れた時、及び設定された切断条件が満たされず、且つ第
    1の垂直バーの対が第1のクラス、第2のクラス、及び
    第4のクラスの1つとしてクラス別けされた時に、次の
    垂直バーを検出する工程と、 を備えることを特徴とする請求項10に記載の画像処理
    方法。
  12. 【請求項12】 切断する際に、前記第1の垂直バー対
    の間の複数の点の1つの点で前記第1の垂直バー対の間
    を切断する工程をさらに備えることを特徴とする請求項
    1に記載の画像処理方法。
  13. 【請求項13】 前記切断工程は、前記第1の垂直バー
    の間に位置する2つの点の1つの点で前記第1の垂直バ
    ー対の間を切断する工程を含むことを特徴とする請求項
    12に記載の画像処理方法。
  14. 【請求項14】 前記2つの点は、前記第1の垂直バー
    の対の各垂直バーから夫々等しい距離に位置する中央点
    と、前記中央点と前記第1の垂直バーの対における第2
    の垂直バーとの間に位置するオフセット点とを含むこと
    を特徴とする請求項13に記載の画像処理方法。
  15. 【請求項15】 複数の所定の距離条件を格納する工程
    と、 前記第1の垂直バーの対の間の距離を算出する工程と、 算出した距離を前記複数の所定の距離条件の1つと比較
    する工程と、 複数の予め定めた文字を格納する工程と、 前記第1の垂直バーの一部が前記複数の予め定めた文字
    の1つと一致する否かを判断する工程と、 を備え、前記決定工程は、さらに前記算出した距離と前
    記複数の所定の距離条件の1つとの比較結果と、前記第
    1の垂直バーの部分が前記予めた文字の1つと一致する
    否かの判断結果とに基づいて、前記第1の垂直バーの対
    の間を切断するか否かと、その切断の場所を決定するこ
    とを特徴とする請求項1に記載の画像処理方法。
  16. 【請求項16】 前記第1の垂直バーの対の間で切断し
    ないと決定した時に次の垂直バーを検出する工程と、 次の垂直バーの対に関して前記画像処理方法を繰り返し
    て実行せしめる工程と、 を備えることを特徴とする請求項1に記載の画像処理方
    法。
  17. 【請求項17】 少なくとも2つの接触した文字を含む
    文字画像データから独立した文字を切り出す画像処理装
    置であって、 文字画像データにおける第1の垂直バーの対を検出する
    検出手段と、 前記第1の垂直バーの対の間に位置する複数の独立した
    水平バンドの夫々における画像データの存在を確認する
    確認手段と、 その水平バンドが画像データを含む前記第1の垂直バー
    の対に基づいて前記第1の垂直バーの対をクラス別けす
    るクラス別け手段と、 前記クラス別けに基づいて前記第1の垂直バーの対の間
    を切断するか否かと、その切断の場所を決定する決定手
    段と、 を備えることを特徴とする画像処理装置。
  18. 【請求項18】 文字画像データの垂直ヒストグラムを
    生成する生成手段をさらに備え、前記検出手段は、前記
    垂直ヒストグラムにおける前記第1の垂直バーの対を検
    出することを特徴とする請求項17に記載の画像処理装
    置。
  19. 【請求項19】 所定の垂直方向の閾値を格納する格納
    手段をさらに備え、前記検出手段は、前記所定の垂直方
    向の閾値を越える垂直成分を夫々有する2つの垂直バー
    を含む第1の垂直バーの対を検出することを特徴とする
    請求項18に記載の画像処理装置。
  20. 【請求項20】 前記確認手段は、前記第1の垂直バー
    の対の間に位置し、夫々の水平バンドを突き抜ける垂直
    線上の水平方向の横断を確認するすることによって画像
    データの存在を確認することを特徴とする請求項17に
    記載の画像処理装置。
  21. 【請求項21】 前記垂直線は、前記第1の垂直バーの
    対の間の中央に位置することを特徴とする請求項20に
    記載の画像処理装置。
  22. 【請求項22】 前記確認手段は、3つの独立した水平
    バンドの夫々における画像データの存在を確認すること
    を特徴とする請求項17に記載の画像処理装置。
  23. 【請求項23】 所定の文字の基準線と所定の文字の最
    大高さの線との間に広がる文字を切断するために文字画
    像データを選択する選択手段をさらに備えることを特徴
    とする請求項17に記載の画像処理装置。
  24. 【請求項24】 複数の独立した水平バンドの夫々が同
    一の高さを有することを特徴とする請求項17に記載の
    画像処理装置。
  25. 【請求項25】 前記クラス別け手段は、第1の垂直バ
    ーの対を4つのクラスの垂直バーの1つにクラス別け
    し、前記確認手段は、3つの独立した水平バンドの夫々
    における画像データの存在を確認することを特徴とする
    請求項17に記載の画像処理装置。
  26. 【請求項26】 前記4つのクラスの垂直バーは、 (i)(a)画像データが第1の水平バンド及び第3の
    水平バンドの両者のみに存在する場合、(b)画像デー
    タが前記第1の水平バンドにのみ存在する場合、及び
    (c)画像データが3つの水平バンドのいずれにも存在
    しない場合の第1のクラスの垂直バーと、 (ii)(a)画像データが第2の水平バンド及び前記第
    3の水平バンドの両者にのみ存在する場合、及び(b)
    画像データが3つの水平バンドの全てに存在する場合の
    第2のクラスの垂直バーと、 (iii)(a)画像データが前記第2の水平バンドにの
    み存在する場合、及び(b)画像データが前記第1の水
    平バンド及び前記第2の水平バンドにのみ存在する場合
    の第3のクラスの垂直バーと、 (iv)画像データが前記第3の水平バンドにのみ存在す
    る場合の第4のクラスの垂直バーと、 を含むことを特徴とする請求項25に記載の画像処理装
    置。
  27. 【請求項27】 設定された切断条件が満たされ、且つ
    前記第1の垂直バーの対が第1のクラス、第2のクラ
    ス、及び第4のクラスの1つとしてクラス別けされた時
    に、第1の垂直バーの対の間を切断する切断手段と、 第1の垂直バーの対が第3のクラスとしてクラス別けさ
    れた時、及び設定された切断条件が満たされず、且つ第
    1の垂直バーの対が第1のクラス、第2のクラス、及び
    第4のクラスの1つとしてクラス別けされた時に、次の
    垂直バーを検出する次垂直バー検出手段と、 を備えることを特徴とする請求項26に記載の画像処理
    装置。
  28. 【請求項28】 前記第1の垂直バー対の間の複数の点
    の1つの点で前記第1の垂直バー対の間を切断する切断
    手段をさらに備えることを特徴とする請求項17に記載
    の画像処理装置。
  29. 【請求項29】 前記切断手段は、前記第1の垂直バー
    の間に位置する2つの点の1つの点で前記第1の垂直バ
    ー対の間を切断することを特徴とする請求項28に記載
    の画像処理装置。
  30. 【請求項30】 前記2つの点は、前記第1の垂直バー
    の対の各垂直バーから夫々等しい距離に位置する中央点
    と、前記中央点と前記第1の垂直バーの対における第2
    の垂直バーとの間に位置するオフセット点とを含むこと
    を特徴とする請求項29に記載の画像処理装置。
  31. 【請求項31】 複数の所定の距離条件を格納する格納
    手段と、 前記第1の垂直バーの対の間の距離を算出する算出手段
    と、 算出した距離を前記複数の所定の距離条件の1つと比較
    する比較手段と、 複数の予め定めた文字を格納する文字格納手段と、 前記第1の垂直バーの一部が前記複数の予め定めた文字
    の1つと一致する否かを決定する文字決定手段と、 を備え、前記決定手段は、さらに前記比較手段の出力
    と、前記文字決定手段の出力とに基づいて、前記第1の
    垂直バーの対の間を切断するか否かと、その切断の場所
    を決定することを特徴とする請求項17に記載の画像処
    理装置。
  32. 【請求項32】 前記第1の垂直バーの対の間で切断し
    ないと決定した時に次の垂直バーを検出する次垂直バー
    検出手段をさらに備えることを特徴とする請求項17に
    記載の画像処理装置。
  33. 【請求項33】 入力画像データに含まれる文字を認識
    する光学的文字認識方法であって、 文字の画像を表す文字画像データを含む画像データを入
    力する工程と、 画像データから文字画像データを切断する工程と、 切断した文字画像データについて光学的文字認識処理を
    実行する工程と、 未認識の切断した文字画像を選択する選択工程と、 未認識の切断した文字画像データにおける第1の垂直バ
    ーの対を検出する検出工程と、 前記第1の垂直バーの対の間に位置する複数の独立した
    水平バンドの夫々における文字画像データの存在を確認
    する確認工程と、 その水平バンドが文字画像データを含む前記第1の垂直
    バーの対に基づいて前記第1の垂直バーの対をクラス別
    けするクラス別け工程と、 前記クラス別けに基づいて前記未認識の切断した文字画
    像データにおける前記第1の垂直バーの対の間を切断す
    るか否かと、その切断の場所を決定する決定工程と、 前記垂直バーの対の間を切断することを決定した際に、
    前記未認識の文字画像データにおける前記第1の垂直バ
    ーの対の間を切断する切断手段と、 新しく切断した文字画像データについて光学的文字認識
    を実行する工程と、 認識した文字を出力する工程と、 を備えることを特徴とする光学的文字認識方法。
  34. 【請求項34】 未認識の切断した文字画像データの垂
    直ヒストグラムを生成する工程をさらに備え、前記検出
    工程は、前記垂直ヒストグラムにおける前記第1の垂直
    バーの対を検出する工程を含むことを特徴とする請求項
    33に記載の光学的文字認識方法。
  35. 【請求項35】 所定の垂直方向の閾値を格納する工程
    をさらに備え、前記検出工程は、前記所定の垂直方向の
    閾値を越える垂直成分を夫々有する2つの垂直バーを含
    む第1の垂直バーの対を検出する工程を含むことを特徴
    とする請求項34に記載の光学的文字認識方法。
  36. 【請求項36】 前記確認工程は、前記第1の垂直バー
    の対の間に位置し、夫々の水平バンドを突き抜ける垂直
    線上の水平方向の横断を確認するすることによって画像
    データの存在を確認する工程を含むことを特徴とする請
    求項33に記載の光学的文字認識方法。
  37. 【請求項37】 前記垂直線は、前記第1の垂直バーの
    対の間の中央に位置することを特徴とする請求項36に
    記載の光学的文字認識方法。
  38. 【請求項38】 前記確認工程は、3つの独立した水平
    バンドの夫々における画像データの存在を確認する工程
    を含むことを特徴とする請求項33に記載の光学的文字
    認識方法。
  39. 【請求項39】 前記選択工程は、所定の文字の基準線
    と所定の文字の最大高さの線との間に広がる文字を切断
    するために未処理の切断された文字画像データを選択す
    る工程を含むことを特徴とする請求項33に記載の光学
    的文字認識方法。
  40. 【請求項40】 複数の独立した水平バンドの夫々が同
    一の高さを有することを特徴とする請求項33に記載の
    文字認識方法。
  41. 【請求項41】 前記クラス別け工程は、第1の垂直バ
    ーの対を4つのクラスの垂直バーの1つにクラス別けす
    る工程を含み、前記確認工程は、3つの独立した水平バ
    ンドの夫々における画像データの存在を確認する工程を
    含むことを特徴とする請求項33に記載の光学的文字認
    識方法。
  42. 【請求項42】 前記4つのクラスの垂直バーは、 (i)(a)画像データが第1の水平バンド及び第3の
    水平バンドの両者のみに存在する場合、(b)画像デー
    タが前記第1の水平バンドにのみ存在する場合、及び
    (c)画像データが3つの水平バンドのいずれにも存在
    しない場合の第1のクラスの垂直バーと、 (ii)(a)画像データが第2の水平バンド及び前記第
    3の水平バンドの両者にのみ存在する場合、及び(b)
    画像データが3つの水平バンドの全てに存在する場合の
    第2のクラスの垂直バーと、 (iii)(a)画像データが前記第2の水平バンドにの
    み存在する場合、及び(b)画像データが前記第1の水
    平バンド及び前記第2の水平バンドにのみ存在する場合
    の第3のクラスの垂直バーと、 (iv)画像データが前記第3の水平バンドにのみ存在す
    る場合の第4のクラスの垂直バーと、 を含むことを特徴とする請求項41に記載の光学的文字
    認識方法。
  43. 【請求項43】第1の垂直バーの対が第3のクラスとし
    てクラス別けされた時、及び設定された切断条件が満た
    されず、且つ第1の垂直バーの対が第1のクラス、第2
    のクラス、及び第4のクラスの1つとしてクラス別けさ
    れた時に、次の垂直バーを検出する工程をさらに備え、 前記切断工程は、設定された切断条件が満たされ、且つ
    前記第1の垂直バーの対が第1のクラス、第2のクラ
    ス、及び第4のクラスの1つとしてクラス別けされた時
    に、第1の垂直バーの対の間を切断する工程を含むこと
    を特徴とする請求項42に記載の光学的文字認識方法。
  44. 【請求項44】 前記切断工程は、前記第1の垂直バー
    対の間の複数の点の1つの点で前記第1の垂直バー対の
    間を切断する工程を含むことを特徴とする請求項33に
    記載の光学的文字認識方法。
  45. 【請求項45】 前記切断工程は、前記第1の垂直バー
    の間に位置する2つの点の1つの点で前記第1の垂直バ
    ー対の間を切断する工程を含むことを特徴とする請求項
    44に記載の光学的文字認識方法。
  46. 【請求項46】 前記2つの点は、前記第1の垂直バー
    の対の各垂直バーから夫々等しい距離に位置する中央点
    と、前記中央点と前記第1の垂直バーの対における第2
    の垂直バーとの間に位置するオフセット点とを含むこと
    を特徴とする請求項45に記載の光学的文字認識方法。
  47. 【請求項47】 複数の所定の距離条件を格納する工程
    と、 前記第1の垂直バーの対の間の距離を算出する工程と、 算出した距離を前記複数の所定の距離条件の1つと比較
    する工程と、 複数の予め定めた文字を格納する工程と、 前記第1の垂直バーの一部が前記複数の予め定めた文字
    の1つと一致する否かを判断する工程と、 を備え、前記決定工程は、さらに前記算出した距離と前
    記複数の所定の距離条件の1つとの比較結果と、前記第
    1の垂直バーの部分が前記予めた文字の1つと一致する
    否かの判断結果とに基づいて、前記第1の垂直バーの対
    の間を切断するか否かと、その切断の場所を決定するこ
    とを特徴とする請求項33に記載の光学的文字認識方
    法。
  48. 【請求項48】 前記第1の垂直バーの対の間で切断し
    ないと決定した時に次の垂直バーを検出する工程と、 次の垂直バーの対に関して前記画像処理方法を繰り返し
    て実行せしめる工程と、 をさらに備えることを特徴とする請求項33に記載の光
    学的文字認識方法。
  49. 【請求項49】 入力画像データに含まれる文字を認識
    する光学的文字認識装置であって、 文字の画像を表す文字画像データを含む画像データを入
    力する手段と、 画像データから文字画像データを切断する手段と、 切断した文字画像データについて光学的文字認識処理を
    実行する手段と、 未認識の切断した文字画像を選択する選択手段と、 未認識の切断した文字画像データにおける第1の垂直バ
    ーの対を検出する検出手段と、 前記第1の垂直バーの対の間に位置する複数の独立した
    水平バンドの夫々における文字画像データの存在を確認
    する確認手段と、 その水平バンドが文字画像データを含む前記第1の垂直
    バーの対に基づいて前記第1の垂直バーの対をクラス別
    けするクラス別け手段と、 前記クラス別けに基づいて前記未認識の切断した文字画
    像データにおける前記第1の垂直バーの対の間を切断す
    るか否かと、その切断の場所を決定する決定手段と、 前記垂直バーの対の間を切断することを決定した際に、
    前記未認識の文字画像データにおける前記第1の垂直バ
    ーの対の間を切断する切断手段と、 新しく切断した文字画像データについて光学的文字認識
    を実行する手段と、 認識した文字を出力する手段と、 を備えることを特徴とする光学的文字認識装置。
  50. 【請求項50】 未認識の切断した文字画像データの垂
    直ヒストグラムを生成する生成手段をさらに備え、前記
    検出手段は、前記垂直ヒストグラムにおける前記第1の
    垂直バーの対を検出することを特徴とする請求項49に
    記載の光学的文字認識装置。
  51. 【請求項51】 所定の垂直方向の閾値を格納する格納
    手段をさらに備え、前記検出手段は、前記所定の垂直方
    向の閾値を越える垂直成分を夫々有する2つの垂直バー
    を含む第1の垂直バーの対を検出することを特徴とする
    請求項50に記載の光学的文字認識装置。
  52. 【請求項52】 前記確認手段は、前記第1の垂直バー
    の対の間に位置し、夫々の水平バンドを突き抜ける垂直
    線上の水平方向の横断を確認するすることによって画像
    データの存在を確認することを特徴とする請求項49に
    記載の光学的文字認識装置。
  53. 【請求項53】 前記垂直線は、前記第1の垂直バーの
    対の間の中央に位置することを特徴とする請求項52に
    記載の光学的文字認識装置。
  54. 【請求項54】 前記確認手段は、3つの独立した水平
    バンドの夫々における画像データの存在を確認すること
    を特徴とする請求項49に記載の光学的文字認識装置。
  55. 【請求項55】 前記選択手段は、所定の文字の基準線
    と所定の文字の最大高さの線との間を越える文字を切断
    するために未認識の切断した文字画像データを選択する
    選択手段をさらに備えることを特徴とする請求項49に
    記載の光学的文字認識装置。
  56. 【請求項56】 複数の独立した水平バンドの夫々が同
    一の高さを有することを特徴とする請求項49に記載の
    光学的文字認識装置。
  57. 【請求項57】 前記クラス別け手段は、第1の垂直バ
    ーの対を4つのクラスの垂直バーの1つにクラス別け
    し、前記確認手段は、3つの独立した水平バンドの夫々
    における画像データの存在を確認することを特徴とする
    請求項25に記載の光学的文字認識装置。
  58. 【請求項58】 前記4つのクラスの垂直バーは、 (i)(a)画像データが第1の水平バンド及び第3の
    水平バンドの両者のみに存在する場合、(b)画像デー
    タが前記第1の水平バンドにのみ存在する場合、及び
    (c)画像データが3つの水平バンドのいずれにも存在
    しない場合の第1のクラスの垂直バーと、 (ii)(a)画像データが第2の水平バンド及び前記第
    3の水平バンドの両者にのみ存在する場合、及び(b)
    画像データが3つの水平バンドの全てに存在する場合の
    第2のクラスの垂直バーと、 (iii)(a)画像データが前記第2の水平バンドにの
    み存在する場合、及び(b)画像データが前記第1の水
    平バンド及び前記第2の水平バンドにのみ存在する場合
    の第3のクラスの垂直バーと、 (iv)画像データが前記第3の水平バンドにのみ存在す
    る場合の第4のクラスの垂直バーと、 を含むことを特徴とする請求項57に記載の光学的文字
    認識装置。
  59. 【請求項59】 第1の垂直バーの対が第3のクラスと
    してクラス別けされた時、及び設定された切断条件が満
    たされず、且つ第1の垂直バーの対が第1のクラス、第
    2のクラス、及び第4のクラスの1つとしてクラス別け
    された時に、次の垂直バーを検出する次垂直バー検出手
    段を備え、 前記切断手段は、設定された切断条件が満たされ、且つ
    前記第1の垂直バーの対が第1のクラス、第2のクラ
    ス、及び第4のクラスの1つとしてクラス別けされた時
    に、第1の垂直バーの対の間を切断することを特徴とす
    る請求項58に記載の光学的文字認識装置。
  60. 【請求項60】 前記切断手段は、前記第1の垂直バー
    対の間の複数の点の1つの点で前記第1の垂直バー対の
    間を切断することを特徴とする請求項49に記載の光学
    的文字認識装置。
  61. 【請求項61】 前記切断手段は、前記第1の垂直バー
    の間に位置する2つの点の1つの点で前記第1の垂直バ
    ー対の間を切断することを特徴とする請求項60に記載
    の光学的文字認識装置。
  62. 【請求項62】 前記2つの点は、前記第1の垂直バー
    の対の各垂直バーから夫々等しい距離に位置する中央点
    と、前記中央点と前記第1の垂直バーの対における第2
    の垂直バーとの間に位置するオフセット点とを含むこと
    を特徴とする請求項61に記載の光学的文字認識装置。
  63. 【請求項63】 複数の所定の距離条件を格納する格納
    手段と、 前記第1の垂直バーの対の間の距離を算出する算出手段
    と、 算出した距離を前記複数の所定の距離条件の1つと比較
    する比較手段と、 複数の予め定めた文字を格納する文字格納手段と、 前記第1の垂直バーの一部が前記複数の予め定めた文字
    の1つと一致する否かを決定する文字決定手段と、 を備え、前記決定手段は、さらに前記比較手段の出力
    と、前記文字決定手段の出力とに基づいて、前記第1の
    垂直バーの対の間を切断するか否かと、その切断の場所
    を決定することを特徴とする請求項49に記載の光学的
    文字認識装置。
  64. 【請求項64】 前記第1の垂直バーの対の間で切断し
    ないと決定した時に次の垂直バーを検出する次垂直バー
    検出手段をさらに備えることを特徴とする請求項49に
    記載の光学的文字認識装置。
  65. 【請求項65】 メモリ媒体上のプログラムに基づいて
    動作し、少なくとも2つの接触した文字を含む文字画像
    データから独立した文字を切り出す画像処理装置であっ
    て、前記メモリ媒体は、 文字画像データにおける第1の垂直バーの対を検出する
    検出工程の手順コードと、 前記第1の垂直バーの対の間に位置する複数の独立した
    水平バンドの夫々における画像データの存在を確認する
    確認工程の手順コードと、 その水平バンドが画像データを含む前記第1の垂直バー
    の対に基づいて前記第1の垂直バーの対をクラス別けす
    るクラス別け工程の手順コードと、 前記クラス別けに基づいて前記第1の垂直バーの対の間
    を切断するか否かと、その切断の場所を決定する決定工
    程の手順コードと、 を備えることを特徴とする画像処理装置。
JP28153295A 1994-11-09 1995-10-30 画像処理装置及び光学的文字認識装置及びそれらの方法 Expired - Fee Related JP3805005B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US33753894A 1994-11-09 1994-11-09
US08/337538 1994-11-09

Publications (2)

Publication Number Publication Date
JPH08293001A true JPH08293001A (ja) 1996-11-05
JP3805005B2 JP3805005B2 (ja) 2006-08-02

Family

ID=23320931

Family Applications (1)

Application Number Title Priority Date Filing Date
JP28153295A Expired - Fee Related JP3805005B2 (ja) 1994-11-09 1995-10-30 画像処理装置及び光学的文字認識装置及びそれらの方法

Country Status (2)

Country Link
US (1) US5809166A (ja)
JP (1) JP3805005B2 (ja)

Families Citing this family (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9722766D0 (en) 1997-10-28 1997-12-24 British Telecomm Portable computers
WO1999038149A1 (en) 1998-01-26 1999-07-29 Wayne Westerman Method and apparatus for integrating manual input
US7663607B2 (en) 2004-05-06 2010-02-16 Apple Inc. Multipoint touchscreen
JP4392907B2 (ja) * 1999-07-30 2010-01-06 株式会社東芝 文字切出し方法
US6473517B1 (en) * 1999-09-15 2002-10-29 Siemens Corporate Research, Inc. Character segmentation method for vehicle license plate recognition
WO2001059576A1 (en) 2000-02-12 2001-08-16 Adobe Systems Incorporated Text grid creation tools
US7305617B2 (en) * 2000-02-12 2007-12-04 Adobe Systems Incorporated Method for aligning text to baseline grids and to CJK character grids
US7071941B2 (en) * 2000-02-12 2006-07-04 Adobe Systems Incorporated Method for calculating CJK emboxes in fonts
JP4112200B2 (ja) 2000-09-25 2008-07-02 アドビ システムズ, インコーポレイテッド 文字組空き量設定装置、文字組空き量設定プログラム及びそれを記録した記録媒体
JP3795784B2 (ja) * 2000-09-25 2006-07-12 アドビ システムズ, インコーポレイテッド アイコン表示付き文字組空き量設定装置、文字組空き量設定プログラム及びそれを記録した記録媒体
JP3554271B2 (ja) * 2000-12-13 2004-08-18 パナソニック コミュニケーションズ株式会社 情報通信装置
US7296227B2 (en) 2001-02-12 2007-11-13 Adobe Systems Incorporated Determining line leading in accordance with traditional Japanese practices
US7167274B2 (en) * 2001-09-28 2007-01-23 Adobe Systems Incorporated Line leading from an arbitrary point
US7039862B2 (en) * 2002-05-10 2006-05-02 Adobe Systems Incorporated Text spacing adjustment
US20040125107A1 (en) * 2002-12-26 2004-07-01 Mccully Nathaniel M. Coordinating grid tracking and mojikumi spacing of Japanese text
US7123261B2 (en) * 2002-12-26 2006-10-17 Adobe Systems Incorporated Coordinating grid tracking and mojikumi spacing of Japanese text
US7283669B2 (en) * 2003-01-29 2007-10-16 Lockheed Martin Corporation Fine segmentation refinement for an optical character recognition system
US7594171B2 (en) 2004-10-01 2009-09-22 Adobe Systems Incorporated Rule-based text layout
US8243027B2 (en) 2006-06-09 2012-08-14 Apple Inc. Touch screen liquid crystal display
EP3264240A1 (en) 2006-06-09 2018-01-03 Apple Inc. Touch screen liquid crystal display
CN104965621B (zh) 2006-06-09 2018-06-12 苹果公司 触摸屏液晶显示器及其操作方法
US7876310B2 (en) 2007-01-03 2011-01-25 Apple Inc. Far-field input identification
US8269727B2 (en) 2007-01-03 2012-09-18 Apple Inc. Irregular input identification
US8493330B2 (en) 2007-01-03 2013-07-23 Apple Inc. Individual channel phase delay scheme
US7855718B2 (en) 2007-01-03 2010-12-21 Apple Inc. Multi-touch input discrimination
US8130203B2 (en) 2007-01-03 2012-03-06 Apple Inc. Multi-touch input discrimination
US9710095B2 (en) 2007-01-05 2017-07-18 Apple Inc. Touch screen stack-ups
US7844915B2 (en) 2007-01-07 2010-11-30 Apple Inc. Application programming interfaces for scrolling operations
US8633930B2 (en) * 2007-03-26 2014-01-21 Apple Inc. Non-linear text flow
WO2009070033A1 (en) * 2007-11-30 2009-06-04 Lumex A/S A method for processing optical character recognition (ocr) output data, wherein the output data comprises double printed character images
WO2010080340A1 (en) * 2009-01-06 2010-07-15 Siemens Healthcare Diagnostics Inc. Methods and apparatus for determining a liquid level in a container using imaging
US8571270B2 (en) * 2010-05-10 2013-10-29 Microsoft Corporation Segmentation of a word bitmap into individual characters or glyphs during an OCR process
US8804056B2 (en) 2010-12-22 2014-08-12 Apple Inc. Integrated touch screens
EP2836962A4 (en) * 2012-04-12 2016-07-27 Tata Consultancy Services Ltd SYSTEM AND METHOD FOR DETECTION AND SEGMENTATION OF CHARACTERISTIC MATTERS FOR OPTICAL CHARACTER RECOGNITION (OCR)
CN106446896B (zh) * 2015-08-04 2020-02-18 阿里巴巴集团控股有限公司 一种字符分割方法、装置及电子设备
US10068146B2 (en) * 2016-02-25 2018-09-04 Conduent Business Services, Llc Method and system for detection-based segmentation-free license plate recognition
JP7090894B2 (ja) * 2018-07-26 2022-06-27 武蔵エンジニアリング株式会社 文字列表示装置および文字列表示方法
JP7406884B2 (ja) * 2019-06-27 2023-12-28 キヤノン株式会社 情報処理装置、プログラム及び制御方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3346845A (en) * 1964-12-11 1967-10-10 Bunker Ramo Character recognition method and apparatus
US3868636A (en) * 1973-06-18 1975-02-25 Isotec Inc Optical character reader having feature recognition capability
US5046114A (en) * 1985-10-01 1991-09-03 The Palantir Corporation Method and structure for separating joined patterns for use in pattern and character recognition system
US4918740A (en) * 1985-10-01 1990-04-17 Palantir Corporation Processing means for use in an optical character recognition system
JPH0634256B2 (ja) * 1987-03-04 1994-05-02 シャープ株式会社 接触文字切出し方法
JPH01112388A (ja) * 1987-10-26 1989-05-01 Ricoh Co Ltd 文字認識処理方法
US4998285A (en) * 1988-03-11 1991-03-05 Kabushiki Kaisha Toshiba Character recognition apparatus
US5048097A (en) * 1990-02-02 1991-09-10 Eastman Kodak Company Optical character recognition neural network system for machine-printed characters
US5321770A (en) * 1991-11-19 1994-06-14 Xerox Corporation Method for determining boundaries of words in text
US5384864A (en) * 1993-04-19 1995-01-24 Xerox Corporation Method and apparatus for automatic determination of text line, word and character cell spatial features

Also Published As

Publication number Publication date
US5809166A (en) 1998-09-15
JP3805005B2 (ja) 2006-08-02

Similar Documents

Publication Publication Date Title
JPH08293001A (ja) 画像処理装置及び光学的文字認識装置及びそれらの方法
US6385338B1 (en) Image processing method and apparatus
US5416849A (en) Data processing system and method for field extraction of scanned images of document forms
US5335290A (en) Segmentation of text, picture and lines of a document image
JPH10162150A (ja) ページ解析システム
EP1017011A2 (en) Block selection of table features
US6947596B2 (en) Character recognition method, program and recording medium
JPH04195692A (ja) 文書読取装置
CN113378839A (zh) 信息处理装置、信息处理方法及计算机可读介质
JP2013171309A (ja) 文字切り出し方法、およびこの方法を用いた文字認識装置およびプログラム
JP2002015280A (ja) 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
JP2010061471A (ja) 文字認識装置およびプログラム
JP3571128B2 (ja) 図面の寸法数値認識方法及びその装置
JP3573945B2 (ja) フォーマット認識装置及び文字読み取り装置
JP4810853B2 (ja) 文字画像切出装置、文字画像切出方法およびプログラム
JPH07220023A (ja) 表認識方法及びその装置
JP2005352735A (ja) 文書ファイル作成支援装置、文書ファイル作成支援方法及びそのプログラム
JPH0388085A (ja) 光学的文字読取装置
JPH02138674A (ja) 文書処理方法及び装置
JPH0689330A (ja) 画像ファイリングシステム
JPH0388086A (ja) 文書読取装置
JP4544691B2 (ja) 文字読取装置
JPH08137987A (ja) 光学式文字読取装置
JPH06251187A (ja) 文字認識誤り修正方法及び装置
JPH08202859A (ja) 電子ファイリング装置及びその方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060123

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060323

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060418

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060509

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100519

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100519

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110519

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120519

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120519

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130519

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140519

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees